help@sochisirius.ru

Участники международной программы Образовательного центра «Сириус» и индийской организации Atal Innovation Mission (AIM) создали краудсорсинговую платформу, пользователи которой переводят различные тексты на национальные языки России и Индии: татарский, башкирский, якутский, хинди, гуджарати и маратхи. Это поможет собрать данные, чтобы улучшить качество машинного перевода.

Сегодня с помощью мобильного телефона мы можем мгновенно переводить текстовые и голосовые сообщения. В основе большинства таких сервисов – нейронные сети. И хотя системы постоянно обучаются, ошибок избежать не удается, особенно это касается редких языков.

«Многие системы машинного перевода, в частности Google Translate и Яндекс.Переводчик, поддерживают десятки языков, но мы не очень хорошо понимаем, насколько высоко качество перевода для каждого из них, – поясняет руководитель проекта, научный сотрудник НИУ ВШЭ, доцент РГГУ, кандидат филологических наук Александр Пиперски. – Школьники работали над оценкой систем машинного перевода на несколько языков: татарский, башкирский, якутский, хинди, гуджарати и маратхи. В результате они создали сайт, на котором можно оценивать переводы».

На основе анализа полученных больших данных можно понять, в каких случаях системы перевода неэффективны и что именно нужно улучшить. 

«Любой пользователь может зайти на наш сайт, зарегистрироваться и выбрать язык, который он хочет оценивать. У нас есть база фраз, которые мы собрали из интернета и перевели онлайн-переводчиками с английского и русского языков. Пользователям предлагается оценить машинный перевод и самим перевести выражение, – объясняет один из разработчиков, десятиклассник из Горно-Алтайска Данил Миронов. – Мы сравниваем варианты носителей языка и онлайн-переводчика, создавая эталон для обучения нейросетей. В перспективе наш сайт станет самостоятельной площадкой машинного перевода, на которой будут учитываться собранные нами ошибки».

Руководители проекта планируют развивать сайт, добавляя новые языки и задания для перевода. Участникам предстоит решить еще множество интересных проблем. Например, каким пользователям можно доверять, а каким нельзя. Так система будет понимать, когда перевод совпадает с версией Google Translate, и не станет учитывать этот вариант. Сейчас для развития важно привлечь людей, заинтересованных в сохранении национальных языков. Ведь чем больше у платформы будет посетителей, тем больше данных соберут разработчики.

Сотрудничество России и Индии в воспитании талантливых детей было инициировано в мае 2018 года во время встречи Президента России Владимира Путина и премьер-министра Индии Нарендры Моди в Образовательном центре «Сириус». Всего в третьей Международной российско-индийской программе участвуют 48 учеников 9–11-х классов, по 24 от каждой страны. Программа направлена на разработку восьми технологических и инновационных инженерных проектов – веб- и мобильных приложений для решения глобальных проблем современности, актуальных для обеих стран. Школьники изучили опыт ведущих IT-компаний Индии и России, научились работать в составе международной команды и применять на практике знания по информатике, программированию и большим данным. По итогам программы школьники получили приглашение представить свои проекты на Саммите молодых ученых и инженеров «Большие вызовы». Учащиеся 9-х и 10-х классов получили бонусы для отбора на июльскую технологическую программу «Большие вызовы», а 11-классники станут первыми кандидатами на открывающуюся в «Сириусе» стипендию.

Поделиться
Подать заявку
© 2015–2021 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!