help@sochisirius.ru

Выпускники февральской студенческой образовательной программы по решениею прикладных IT-кейсов Сириуса и Яндекса, представили на научной конференции в Минске проект «Экспертная оценка тестовой информации ML и NLP методами» (Meta Language и Natural Language Processing – прим. ред.).

В феврале в рамках проектного практикума по решению прикладных IT-кейсов Сириус принимал студентов российских вузов. Здесь они работали над с анализом данных, машинного обучения, технологиям full stack. Один из этих проектов авторы представили на Data Fest – научной конференции, которая недавно завершилась в Минске.  

На Data Fest нет скучных докладов и заседаний экспертных комиссий. Формат конференции – сугубо неформальный. Ее суть в том, чтобы объединить на одной площадке исследователей, разработчиков и всех, кому интересна наука о данных во всех его проявлениях. Молодые практики, которые видят и понимают взаимосвязи в данных, работающие с математическим аппаратом и владеющие статистическим инструментарием, собираются, чтобы рассказать другу о своих наработках и новом опыте.

Команду Сириуса в составе студентов МФТИ (Савелий Кожевников, Эдгар Шмавонян, Кирилл Мамонов) и МГУ (Илья Пчелинцев) на конференции представляли менторы проекта «Экспертная оценка тестовой информации ML и NLP методами»: Data Scientist'ы в Сбербанке Мария Тихонова и Никита Алексейчук.

«Проект не только о том, как извлекать информацию из текстовых документов современными методами Natural Language Processing и Meta Language, но и применять их на реальных кейсах», – объяснили спикеры.

На Data Fest они рассказывали коллегам о построении интерактивной карты «оптимизма» новостей на основе анализа тональности и об извлечении информации из государственных документов с помощью семантического и тематического моделирования.

«Возможности использования этих инструментов необычайно широкое, – отметила Мария Тихонова. – Например, если вы хотите отследить динамику новостей, характерных для вашего региона, получать новости по вашим запросам интересам, то понадобиться наша карта».

Карта оптимизации новостей – это мобильное приложение. Чтобы запустить его, в лабораториях Сириуса студенты работали над созданием наборов положительных и отрицательных слов по теме новостей, лемматизацией (анализом контента поисковыми роботами, заключающийся в приведении каждого слова в нормальную морфологическую форму для подсчета вхождений), созданием наборов положительных и отрицательных слов по темам. Всего на разработку корпуса команды ушло две недели.

Поделиться
Подать заявку
© 2015–2019 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!