Одно из 12-ти направлений научно-технологической
проектной образовательной программы «Большие вызовы»
Информационная поддержка программы — konkurs@sochisirius.ru
Мы вступили в эпоху больших данных (BigData). Камеры видеонаблюдения, информация о перелетах и переездах людей, истории болезней, транзакции, сотовая связь, покупки в магазинах – все это и многое другое формирует базы данных, которые постоянно пополняются и стремительно разрастаются.
Все эти данные – большая ценность, ресурс для анализа и прогнозов, пища для алгоритмов машинного обучения. Сегодня без них уже невозможно построить систему с по-настоящему высокой точностью.
BigData-исследования находятся на стыке наиболее востребованных направлений, это, можно сказать, сердце междисциплинарных исследований. Здесь и искусственный интеллект, и машинное обучение, и нейронные сети на службе медицины, биологии, экономики, социологии, логистики, физики, генетики, финансов; а также сложные семантические алгоритмы для поиска информации в интернете и нестандартные подходы к обеспечению безопасности программно-аппаратной инфраструктуры.
Технологии обработки больших данных и машинного обучения успешно трудятся в области поиска информации, прогноза погоды и игры в Го, они предсказывают спрос на товары, помогают распознавать изображения и звуки. Использование современных методов машинного обучения на действительно больших объемах данных позволяет конструировать системы с обширными возможностями.
Один из примеров системы, которую можно сделать в рамках конкурса, – создать алгоритм, рекомендующий фильмы, музыку и литературу конкретному пользователю, на основе оценок, которые поставили другие пользователи этого сервиса. Алгоритм сравнивает их и делает предсказание, какую оценку фильму поставил бы этот пользователь, если бы его посмотрел. Алгоритм может использовать информацию с популярных сайтов, таких как Кинопоиск, IMDB, litres или Википедия.
1. Разработка системы идентификации маневров аэродинамических целей по их траекторным сигналам
2. Чат-бот для экосистемы Тинькофф
3. Покупать или продавать? Выявление взаимосвязей между финансовыми рынками и новостным потоком
4. Определение моделей поведения учеников Сириус.Курсов
5. Автоматизированная система выявления и отслеживания доменов и сайтов мошеннических ресурсов в сети Интернет
6. Методы онлайн-обучения в задаче восстановления модели цифрового предыскажателя базовой станции
7. Управление библиотекой голосовым помощником Алисой
8. Распределение ресурсов сотовой станции в мобильных сетях 5-го поколения
9. Разработка интеллектуальной системы контроля комплектности специальной и защитной одежды на сотруднике при исполнении опасных работ
10. Распознавание списка блюд в кафетерии банка
11. Цифровая модель месторождения
Описание проектов
1. Разработка системы идентификации маневров аэродинамических целей по их траекторным сигналам
Руководитель проекта: Гришин Н.А.
Аннотация: Перспективные разработки в области воздушных беспилотных средств передвижения с точки зрения применения в первую очередь поднимают вопросы безопасности. Анализ окружающей обстановки и характера движения объектов вокруг БПЛА является одной из сложнейших задач: обработка данных с датчиков различного диапазона длин волн, комплексирование информации, решение задач сигнализации помех, распознавания препятствий и сопровождения объектов. Все это открывает множество вопросов и тем для исследований.
В данном проекте участникам предстоит рассмотреть вопросы анализа траекторных сигналов, полученных со средств радиолокационного наблюдения. В ходе работы будут выявлены подходы к решению задачи прогнозирования и предсказания траекторий движения воздушных средств передвижения. Также направление исследований будет касаться вопросов применимости алгоритмов машинного обучения для решения таких задач.
Партнер проекта: АО «Концерн ВКО «Алмаз-Антей»
2. Чат-бот для экосистемы Тинькофф
Руководитель проекта: Палий А.И.
Аннотация: Традиционные интерфейсы коммуникации клиентов с банками не покрывают все возможные кейсы. Тинькофф является лидером рынка и в числе первых внедряет новые продуктовые фичи (сториз, суперап, лайфстайл). На сегодняшний день подрастает новое поколение школьников и студентов, которые уже завтра придут в систему потребления финансовых продуктов. При этом у них другие модели коммуникации, они отдают предпочтение общению в чатах и соцсетях. Соответственно, перед банками встает острая проблема потери интерфейса коммуникации с клиентом. Тинькофф не может этого допустить.
В рамках проекта участникам предлагается придумать и разработать новые механики и функции коммуникации с указанной аудиторией. Предполагается проработать следующие идеи:
1. Разработать интерфейс для коммуникации с Тинькофф в чатах\соцсетях:
– Управление онлайн-банком через чатбот;
– Не только онлайн-банком, но и лайфстайл функциями (брони, билеты и пр)
2. Устроить мозговой штурм новых функций:
– финансовые\ около финансовые функции (стикеры за деньги, бот, который собирает деньги на подарок и пр);
– реальные, пока еще не ставшие классическими методы коммуникации с интерфейсом банка (авторизация по биометрии, голос/видео сообщения);
– геймификация с финансами.
Партнер проекта: Тинькофф
3. Покупать или продавать? Выявление взаимосвязей между финансовыми рынками и новостным потоком
Руководители проекта: Рябых А.Г., Меркушов Л.Ю.
Аннотация: В рамках данного проекта участники проработают вопросы разбиения новостного потока на тематики и кластеры, а также проблемы выявления именнованных сущностей и построения графовой аналитики с помощью инструментов машинного обучения. Так же будут рассмотрены подходы выявления статистической взаимосвязи с экономическими индикаторами (например, котировками финансовых инструментов).
По результатам выполнения проекта будет разработан аналитический сервис на открытых экономических данных.
Партнеры проекта: Банк ВТБ (ПАО), ВШМ СПбГУ
4. Определение моделей поведения учеников Сириус.Курсов
Руководители проекта: Большакова О.А., Садовников А.В.
Аннотация: На Сириус.Курсах учится более 150 000 ребят со всей страны. И все они делают это по-своему: кто-то сдает задания в последний день перед дедлайном, кто-то планирует свою учебу так, чтобы спокойно сдать все заранее, кто-то пытается решить все доступные задания в курсе, кто-то решает ровно столько задач, чтобы хватило на зачет и т.д. Таких моделей поведения учеников можно придумать очень много. Но мало их просто придумать — нужно найти подтверждение того, что эти модели действительно существуют, а также выработать алгоритмы взаимодействия с учениками в зависимости от модели поведения!
Участники проекта изучат пользователей Сириус.Курсов и сделают вывод о том, каких моделей поведения придерживаются ученики. В процессе работы ребята освоят современные подходы к анализу данных и популярные методы машинного обучения: кластеризацию, линейную регрессию, сравнение выборок с помощью моделирования, отбор признаков и другие. Информация о моделях поведения учеников Сириус.Курсов впоследствии будет использоваться при планировании улучшений сервиса.
Партнер проекта: Сириус.ИС
5. Автоматизированная система выявления и отслеживания доменов и сайтов мошеннических ресурсов в сети Интернет
Руководитель проекта: Гашников Г.Э.
Аннотация: В настоящее время Банком России отмечается увеличение масштабов использования сайтов информационно-телекоммуникационной сети «Интернет» для совершения мошеннических действий на финансовом рынке. Одной из целей Банка России является защита прав и законных интересов граждан Российской Федерации – потребителей финансовых услуг, предотвращение прямых финансовых потерь в результате использования сайтов информационно-телекоммуникационной сети «Интернет», содержащих противоправную информацию, а также повышение доверия к деятельности финансовых организаций и финансовому рынку Российской Федерации в целом.
В рамках проекта предполагается разработать логику функционирования децентрализованной информационной системы для контроля за возникающими мошенническими ресурсами, схемами реализации обмана и вредоносным ПО в сети Интернет.
Партнер проекта: Банк России
6. Методы онлайн-обучения в задаче восстановления модели цифрового предыскажателя базовой станции
Руководитель проекта: Гасников А.В.
Аннотация: Базовые станции, или в более узком смысле – вышки радиосвязи, сегодня очень распространены и важны для организации беспроводных коммуникаций. От скорости и качества их работы зависят все виды связи: от привычной нам сотовой, до передовых протоколов типа 5G. Чтобы передавать сигнал на большие расстояния, необходимо применять усилители сигнала. Однако одно из препятствий к их непосредственному применению состоит в том, что помимо усиления сигнала, они вносят в него так называемые паразитные гармоники, иными словами, преобразуют входной сигнал не линейным, а несколько неправильным образом. Чтобы решить эту проблему, применяются цифровые предыскажатели – схемы, преобразующие сигнал перед усилением так, чтобы усиленный вариант предыскаженного сигнала был ближе всего к желаемому результату.
В рамках данного проекта участникам будет предоставлена возможность исследовать закономерности поведения современных методов оптимизации и их модификаций для одного их вариантов постановки задачи предыскажения сигнала. Будет рассматриваться широкий класс методов типа стохастического градиентного спуска, и его моментные, ускоренные и альтернированные аналоги. В ходе работы над задачей, участники будут ознакомлены с рядом основных, но весьма современных результатов теории оптимизации и смогут применить полученные знания для нахождения существенных закономерностей их поведения на данной задаче – будет вестись экспериментальная и исследовательская работа по модификации методов и анализу их реальной эффективности с учетом специфики рассматриваемой постановки.
Проект позволит участникам поработать в условиях реального исследовательского процесса в точке соприкосновения теоретической науки и инженерных приложений, познакомит их с рядом широко используемых современных подходов и методов, а результат проекта будет достаточно полезен для развития методов решения реальных, более сложных задач, активно востребованных сегодня крупными компаниями, разрабатывающими системы беспроводной связи.
Партнер проекта: МФТИ
7. Управление библиотекой голосовым помощником Алисой
Руководитель проекта: Дале Д.С.
Аннотация: Еще совсем недавно описание искусственного интеллекта, способного решать задачи синтеза и распознавания речи, можно было встретить только в фантастических книгах или фильмах. Благодаря стремительному развитию технологий, созданию мощных устройства и больших баз данных, обучение алгоритмов искусственного интеллекта стало возможным, и будущее настало намного раньше, чем мы ожидали! Мы живем в мире, в котором нейросеть может распознать человеческую речь лучше, чем человек, где многие привыкли разговаривать с голосовыми помощниками (“Алиса, привет!”), пользоваться голосовым вводом и даже синхронным голосовым переводом с одного языка на другой. Но помимо решения повседневных рутинных задач, эту технологию уже активно внедряют и бизнесе (гостиницы, интеграторы, умный дом и т.д.), и в образовании. Например, помощник может потренировать вас решать математические задачи, может быть вашим репетитором по английскому или вашим учителем пения.
В рамках данного проекта предполагается сделать шаг вперед и впервые доверить голосовому помощнику управление настоящей библиотекой, которая находится в кампусе Сириуса. В рамках реализации проекта участники познакомятся с основами Natural Language Processing, машинным обучением, библиотеками программирования и пройдут полный процесс создания работающей технологии, от брейн-шторма основных идей до вывода в продакшн.
Партнер проекта: Яндекс
8. Распределение ресурсов сотовой станции в мобильных сетях 5-го поколения
Руководитель проекта: Чернов А.В.
Аннотация: В настоящее время мобильная связь стала неотъемлемой частью жизни для очень многих. Ее ключевой особенностью является доступность: т.е. возможность использования практически в любом месте пребывания людей. Такая доступность мобильной связи обеспечивается не просто количеством оборудования для сотовой связи (телефон, станция сотовой связи) но и его качеством, способностью эффективно передавать информацию. Под эффективностью подразумевается надежная и быстрая передача информации.
Настоящий проект посвящен разработке алгоритмов, которые и позволяют эффективно передать данные от сотовой станции. В рамках проекта участники рассмотрят некоторые особенности передачи информации в сотовых сетях, изучат соответствующую математическую модель постановки задачи, исследуют некоторые существующие алгоритмы и предложат новые, а также построят качественные оценки эффективности таких алгоритмов.
Партнер проекта: МФТИ
9. Разработка интеллектуальной системы контроля комплектности специальной и защитной одежды на сотруднике при исполнении опасных работ
Руководитель проекта: Штехин С.Е.
Аннотация: В подразделениях ОАО РЖД, занятых техническим обслуживанием, регулярно проводятся работы в условиях повышенной опасности, например, с высоким напряжением. Контроль ношения спецодежды, проводимый непосредственными руководителями, не позволяет в полной мере обеспечить безусловное соблюдение требований безопасности труда.
Данный проект предполагает реализацию современных моделей компьютерного зрения, представляющих собой глубокие нейронные сети, способные распознавать различные элементы комплекта специальной одежды «Дуга» на фотоизображении сотрудника. К элементам специальной одежды относятся: каска, куртка, брюки, перчатки, щиток на каске. В рамках проекта участникам предлагается выполнить следующие задачи:
1. Подготовка и разметка тестового датасета фотографий.
2. Разработка и обучение моделей компьютерного зрения.
3. Создание прототипа интеллектуальной системы контроля комплектности специальной и защитной одежды.
Партнер проекта: ООО «Отраслевой центр разработки и внедрения информационных систем» ОАО «РЖД»
10. Распознавание списка блюд в кафетерии банка
Руководитель проекта: Смирнов Е.А.
Аннотация: Во время обеда в кафетерии Альфа-банка образуются большие очереди, по причине ручного учета кассиром списка блюд с подноса. В рамках проекта участникам предстоит разработать алгоритм, автоматизирующий труд кассира за счет использования современных методов детектирования и матчинга изображений. Участники проекта научатся решать большой спектр задач компьютерного зрения: классификация, сегментация, детектирование объектов и матчинг. По итогам проекта будет разработано вэб-приложения, распознающее список блюд по фотографии подноса.
Партнер проекта: Альфа-Банк
11. Цифровая модель месторождения
Руководитель проекта: Дучков А.А.
Аннотация: В рамках данного проекта школьники научатся строить цифровую модель и попробуют извлечь нефть из сконструированной своими руками физической модели месторождения. Проект направлен на оптимизацию методов разработки нефтяных месторождений, т.е. обеспечения максимальной добычи нефти.
В рамках работы над проектом участники изучат основы геологии и построения 3D моделей месторождения, попробуют изготовить искусственные образцы проницаемых сред с использованием технологии 3D печати. Чтобы понять, как устроены внутри образцы горных пород, они изучат основы компьютерной томографии и применят методы машинного обучения. Участники познакомятся с основами петрофизики и проведут лабораторные исследования физических свойств образцов.
Партнер проекта: Газпромнефть НТЦ, Новосибирский государственный университет
Младший научный сотрудник лаборатории информационных технологий и прикладной математики Московского физико-технического института
Старший разработчик отдела развития надежности сервисов компании Тинькофф
Управляющий директор управления перспективных алгоритмов машинного обучения Банка ВТБ
Директор управления перспективных алгоритмов машинного обучения Банка ВТБ
Руководитель отдела разработки образовательной платформы «Сириус.ИС»
Руководитель отдела аналитики АНО «Сириус.Курсы», методист направления «Большие данные, искусственный интеллект, финансовые технологии и машинное обучение» проектной программы конкурса «Большие вызовы», методист программы «Сириус.ИИ»
Руководитель Финтех Хаба Банка России
Заведующий лабораторией математических методов оптимизации, заведующий кафедрой математических основ управления Московского физико-технического института, доктор физико-математических наук
Старший инженер-исследователь в NLP-группе Сколковского института науки и технологий
Старший научный сотрудник лаборатории численных методов прикладной структурной оптимизации, доцент кафедры математических основ управления Московского физико-технического института
Разработчик-исследователь, руководитель группы компьютерного зрения лаборатории искусственного интеллекта и нейронных сетей Отраслевого центра разработки и внедрения информационных систем (ООО «ОЦРВ» ОАО «РЖД»)
Руководитель лаборатории машинного обучения Альфа-Банка
Доцент кафедры геофизики геолого-геофизического факультета Новосибирского национального исследовательского государственного университета, кандидат физико-математических наук
Директор физтех-школы прикладной математики и информатики МФТИ, научный руководитель РНОМЦ «Кавказский математический центр Адыгейского государственного университета», доктор физико-математических наук
Заместитель руководителя Образовательного Фонда «Талант и успех» – директор департамента науки. Обладатель почетной грамоты Министерства просвещения (2020), лауреат гранта Москвы в сфере образования (2016–2020), призер Всероссийской олимпиады школьников по математике (2007–2009)