help@sirius.online ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
1-24 июля 2023

Большие данные, искусственный интеллект, финансовые технологии и машинное обучение

Одно из 13-ти направлений научно-технологической
проектной образовательной программы «Большие вызовы»

Информационная поддержка программы — konkurs@sochisirius.ru

Все направления программы «Большие вызовы-2023»

О направлении

Мы вступили в эпоху больших данных (BigData). Камеры видеонаблюдения, информация о перелетах и переездах людей, истории болезней, транзакции, сотовая связь, покупки в магазинах — все это и многое другое формирует базы данных, которые постоянно пополняются и стремительно разрастаются. Все эти данные — большая ценность, ресурс для анализа и прогнозов, пища для алгоритмов машинного обучения. Сегодня без них уже невозможно построить систему с по-настоящему высокой точностью.

BigData-исследования находятся на стыке наиболее востребованных направлений. Это, можно сказать, сердце междисциплинарных исследований. Здесь и искусственный интеллект, и машинное обучение, и нейронные сети на службе медицины, биологии, экономики, социологии, логистики, физики, генетики, финансов; а также сложные семантические алгоритмы для поиска информации в интернете и нестандартные подходы к обеспечению безопасности программно-аппаратной инфраструктуры.

Технологии обработки больших данных и машинного обучения успешно трудятся в области поиска информации, прогноза погоды и игры в Го, они предсказывают спрос на товары, помогают распознавать изображения и звуки. Использование современных методов машинного обучения на действительно больших объемах данных позволяет конструировать системы с обширными возможностями.

Один из примеров системы, которую можно сделать в рамках конкурса, — создать алгоритм, рекомендующий фильмы, музыку и литературу конкретному пользователю, на основе оценок, которые поставили другие пользователи этого сервиса. Алгоритм сравнивает их и делает предсказание, какую оценку фильму поставил бы этот пользователь, если бы его посмотрел. Алгоритм может использовать информацию с популярных сайтов, таких как Кинопоиск, IMDB, litres или Википедия.

Описание проектов

1. Разработка сервиса мониторинга и персонализированной маршрутизации пациента с помощью чат-бота
2. Голосовые помощники и другие возможности искусственного интеллекта в области голосовых технологий
3. Гео-аналитика: моделирование и управление сетью розничных продаж
4. Задача восстановления расписания самолетов при возникновении сбойных ситуаций (disruption management)
5. Усовершенствование модели транспортной сети
6. Создание сервиса для спикеров на платформе VK Mini Apps
7. ИИ-платформа генерации образовательного контента
8. Система мониторинга стерильности и безопасности в чистых зонах фармацевтического производства
9. Автоматический анализ сейсмической активности геологических сред
10. Семантико-синтаксический парсер паттернов в текстах XVIII века
11. Построение вопросно-ответной системы с настраиваемым выводом и поддержанием максимального человекоподобия ответных реакций

Описание проектов
(проекты могут быть изменены и дополнены)
 

1. Разработка сервиса мониторинга и персонализированной маршрутизации пациента с помощью чат-бота

Руководитель проекта: Андресюк Е.А.

Аннотация: Цифровой персонализированный сервис, работающий в режиме 24/7, порекомендует нужного специалиста, предложит осуществлять мониторинг индивидуальных показателей здоровья и напомнит о необходимости соблюдения рекомендаций по лечению. 

Задачи, которые будут стоят перед командой:

– создать концепцию чат-бота, выявить ключевые потребности потребителей,
– составить правила для парсера,
– подготовить датасет для обучения модели,
– изучить возможности реализации проекта с использованием алгоритмов машинного обучения и обучить модель,
– разработать чат-бот на языке программирования Python,
– настроить взаимодействие чат-бота с базами данных,
– встроить бот на тестовый стенд мобильного приложения Smartmed.

Партнер проекта: АО «Группа компаний «Медси»

 


2. Голосовые помощники и другие возможности искусственного интеллекта в области голосовых технологий

Руководитель проекта: Чуйкова Е.Е.

Аннотация: Проект позволит познакомиться с возможностями искусственного интеллекта в области голосовых технологий: поисследовать применение SOTA моделей синтеза, распознавания речи, текстовых и генеративных моделей. 

Какие компетенции получат участники: 

– навыки по разработке и тестированию моделей машинного обучения, использование соответствующих инструментов и методов;
навыки использования результатов исследований в области машинного обучения для разработки решений в бизнесе: воспроизведение State-of-the-art результатов;
методы командной разработки;
создание прототипа продукта (MVP) и дальнейшего плана его развития;
Soft skills: постановка технических заданий по бизнес-задаче, презентация технического продукта перед бизнесом.

Партнер проекта: АО «Тинькофф Банк»

 


3. Гео-аналитика: моделирование и управление сетью розничных продаж

Руководитель проекта: Шамаев Ю.А.

Аннотация: Банк собирает огромный объем данных так или иначе имеющими пространственную привязку или гео-метку, это могут быть транзакции клиентов в POS терминалах или объекты залога в ипотечном портфеле. Эти и другие гео-данные требуют эффективной обработки и анализа для извлечения полезных паттернов, и построения моделей машинного обучения.

На проекте участники попробуют управлять розничной сетью (банка, кофеен, продуктовых магазинов, аптек или другого бизнеса, для которого будет достаточно статистики). С помощью геоаналитики и моделей машинного обучения участники будут управлять анализом и прогнозированием доходности существующих точек, а также планированием открытия новых точек на карте города.

Участникам предстоит пройти полный путь создания сервиса гео-аналитики: от предобработки гео-данных и их визуализации до обучения моделей. В рамках проекта команда построит не только классические модели машинного обучения, но и попробует современные архитектуры для работы как с табличными данными, так и пространственными геоданными.

Партнер проекта: Банк ВТБ (ПАО)

 


4. Задача восстановления расписания самолетов при возникновении сбойных ситуаций (disruption management)

Руководитель проекта: Чернов А.В.

Аннотация: В авиакомпаниях особое место всегда уделяется планированию расписания самолетов с целью эффективного использования имеющихся ресурсов с учетом всех требований технических регламентов, регуляторных требований и других. Решение задачи обычно разбивается на несколько стадий, в рамках которых составляются различные версии расписания. Однако планы и реальность могут существенно отличаться друг от друга, что связано с наличием различных факторов, вызывающих задержки, которые невозможно заранее учесть. Таким образом при возникновении подобных факторов оператору необходимо их учесть при этом минимизировав издержки как для авиакомпании так и для её пассажиров. В рамках проекта мы будем исследовать проблему, изучать математическую постановку задачи (математическое моделирование), проектировать алгоритмы решения задачи и исследовать их эффективность.

Партнер проекта: Московский физико-технический институт (национальный исследовательский университет)

 


5. Усовершенствование модели транспортной сети

Руководитель проекта: Гасников А.В.

Аннотация: В литературе, зачастую, рассматривают идеальный сценарий работы той или иной системы. Однако, как показывает практика, в жизни встречаются системы, процесс которых трудно объяснить (с помощью математики) или вовсе невозможно. Ярким примером такой системы является некий «черный ящик». В данном проекте мы будем изучать решение негладкой задачи оптимизации с аффинными ограничениями, где негладкость предполагает, что вычисление градиента функции недоступно. Для решения данной задачи мы разработаем безградиентный алгоритм, использующий только значение функции (т.е. оракул, принимающий на вход некоторую точку и выдающий только значение целевой функции в этой точке, представляется в виде «черного ящика»). Для разработки данного алгоритма предлагается проделать следующие шаги: свести задачу оптимизации с аффинными ограничениями к децентрализованной задачи с седловой точкой; взять за базу стохастический ускоренный полноградиентный алгоритм решения распределенной седловой задачи и применить к нему технику батчирования; обощить с помощью схемы сглаживания (через l2 рандомизацию) полученный стохастический батчированный ускоренный алгоритм первого порядка на безградиентную настройку; решить разработанным алгоритмом прикладную задачу.

Партнер проекта: Московский физико-технический институт (национальный исследовательский университет)

 


6. Создание сервиса для спикеров на платформе VK Mini Apps

Руководитель проекта: Черкасова Е.

Аннотация: Мы видим эффективность открытых питчингов и презентаций, живых и красочных выступлений — того, что двигает бизнес и компании, позволяет развивать личный бренд, помогает проводить обучающие мероприятия и лучше усваивать знания. Но очень часто не хватает приложений и сервисов, которые закрывали бы эти потребности и делали бы выступления ярче, качественнее, с добавлением интерактива. В рамках данного проекта необходимо разработать сервис, который позволит проводить интерактивы – викторины, опросы, облако слов, формирование таблице лидеров, наличие таймера, общее пространство для генерации идей и др.

Партнер проекта: ООО «ВК»

 


7. ИИ-платформа генерации образовательного контента

Руководитель проекта: Кадомцев М.И.

Аннотация: Под руководством экспертов сделаем и обучим модель ИИ, которая на основе материалов о финансах и финансовых технологиях сможет общаться с человеком, отвечать на вопросы по финансовой грамонтности и генерировать лонгриды для повышения информированности людей о том как работают разные технологии и как избежать ситуаций с обманом (мошенничеством) и кражей денег с карт. Это поможет привлечь внимание людей к проблеме с финансовым мошенничеством, защитить их путём информирования от потери денежных средств. Также для того, чтобы подлинность сгенерированного с помощью ИИ контента можно было верифицировать, мы совместно сделаем из него NFT и опубликуем в блокчейн сети, чтобы любой мог проверить неподменность информации. 

Участники освоят направление создания ИИ-ботов по генерации контента, расширят свои познания в финансовых технологиях и финансовой грамотности, научаться создавать NFT и размещать в блокчейн сети с целью подтверждения подлинности данных.

Партнер проекта: Центральный банк Российской Федерации

 


8. Система мониторинга стерильности и безопасности в чистых зонах фармацевтического производства

Руководитель проекта: Вологдин В.А.

Аннотация: В рамках работы над проектом участники разработают систему компьютерного зрения за сотрудниками компании BIOCAD c целью контроля соблюдения норм использования средств индивидуальной безопасности (СИЗ) и норм стерильности.  На первом этапе участники проанализируют бизнес-задачу, сценарии и виды нарушений, а также сформулируют цель, ценность и архитектуру системы. Затем участники подготавливают стендовую площадку и всё необходимое оборудование, на которой можно будет имитировать различные сценарии использования СИЗ и сформировать, таким образом, релевантный набор фото/видео данных. Также участники разработают программный код, реализующий методы компьютерного зрения для детектирования случаев нарушения использования СИЗ и норм стерильности, и веб-интерфейс для предоставления функционала мониторинга за нарушениями в режиме онлайн. На завершающем этапе участники проведут апробацию системы, подготовят документацию для потенциального внедрения на производственные площадки компании BIOCAD.

Партнер проекта: ЗАО «Биокад»

 


9. Автоматический анализ сейсмической активности геологических сред

Руководитель проекта: Бекренёв Р.К.

Аннотация: Проект направлен на разработку приложения для автоматического анализа данных сейсмического мониторинга для изучения подготовки землетрясений и разработки месторождений. 

Основные задачи: 

1. Изучить основные процедуры обработки данных сейсмического мониторинга. 
2. Реализация автоматических процедур обработки данных сейсмического мониторинга с использованием методов машинного обучения.
3. Реализация локального сервера по сбору данных мониторинга и их обработки в реальном времени.
4. Реализация веб-приложения для отображения данных, результатов обработки и выводы о процессах в геологической среде. 
5. Реализация функционала по контролю статуса и работоспособности пунктов сейсмического мониторинга. 
6. Разработка мобильного приложения для визуализации слабой сейсмичности в реальном времени.

Партнеры проекта: ООО «Газпромнефть научно-технический центр», Новосибирский национальный исследовательский государственный университет

 


10. Семантико-синтаксический парсер паттернов в текстах XVIII века

Руководитель проекта: Соколов Е.Г.

Аннотация: Семантико-синтаксический анализ повторяющихся паттернов в естественном языке нейросетевыми средствами. Цель — познакомить участников с наиболее актуальными задачами в сфере машинной обработки естественного языка (Natural Language Processing, NLP) на примере задач из области синтаксиса и лексической семантики.

Партнер проекта: Яндекс

 


11. Построение вопросно-ответной системы с настраиваемым выводом и поддержанием максимального человекоподобия ответных реакций

Руководитель проекта: Носов А.В.

Аннотация: В программе планируется сбор и разметка данных, построение деревьев логического вывода с использованием соответствующих библиотек на Python. Также планируется настройка генеративной нейросетевой модели, ее оптимизация и дообучение на собранных датасетах.

Партнер проекта: Промобот

Эксперты и руководители проектов

Андресюк
Елена Андреевна

Руководитель проектов группы компаний «Медси»

Чуйкова
Екатерина Евгеньевна

Старший исследователь-разработчик STT Sigma Тинькофф Банка

Шамаев
Юлий Анатольевич

Управляющий директор, team lead Банка ВТБ

Чернов
Алексей Владимирович

Старший научный сотрудник лаборатории численных методов прикладной структурной оптимизации, доцент кафедры математических основ управления Московского физико-технического института

Гасников
Александр Владимирович

Заведующий лабораторией математических методов оптимизации, заведующий кафедрой математических основ управления Московского физико-технического института, доктор физико-математических наук

Черкасова
Екатерина Андреевна

Руководитель образовательного направления VK Образования

Кадомцев
Максим Игоревич

Доцент кафедры математике и информатике Донского государственного технического университета, кандидат физико-математических наук

Вологдин
Василий Александрович

Руководитель направления компании «Техлаб»

Бекренёв
Руслан Камильевич

Младший научный сотрудник компании «Газпромнефть научно-технический центр»

Соколов
Евгений Геннадьевич

Младший научный сотрудник группы «Словаря русского языка XVIII века», соискатель степени кандидата филологических наук в Институте лингвистических исследований РАН

Носов
Андрей Валерьевич

Руководитель группы обработки естественного языка Отраслевого центра разработки и внедрения информационных систем, доцент Пермского Национально-исследовательского Политехнического Университета, старший преподаватель Сибирского Федерального Университета, преподаватель программы «Большие вызовы»

Руководители направления

Райгородский
Андрей Михайлович

Директор физтех-школы прикладной математики и информатики МФТИ, научный руководитель РНОМЦ «Кавказский математический центр Адыгейского государственного университета», доктор физико-математических наук

Абакумов
Евгений Михайлович

Научный руководитель Центра информационных технологий и искусственного интеллекта Университета «Сириус»

Гусев
Антон Сергеевич

Заместитель руководителя Образовательного Фонда «Талант и успех» – директор департамента науки. Обладатель почетной грамоты Министерства просвещения (2020), лауреат гранта Москвы в сфере образования (2016–2020), призер Всероссийской олимпиады школьников по математике (2007–2009)

Садовников
Александр Владимирович

Руководитель отдела аналитики АНО «Сириус.Курсы», методист направления «Большие данные, искусственный интеллект, финансовые технологии и машинное обучение» проектной программы конкурса «Большие вызовы», методист программы «Сириус.ИИ»

Подать заявку
© 2015–2024 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!