help@sochisirius.ru
1-24 июля 2024

Большие данные, искусственный интеллект, финансовые технологии и машинное обучение

Одно из 14-ти направлений научно-технологической
проектной образовательной программы «Большие вызовы»

Информационная поддержка программы — konkurs@sochisirius.ru

 

О направлении

Мы вступили в эпоху больших данных (BigData). Камеры видеонаблюдения, информация о перелетах и переездах людей, истории болезней, транзакции, сотовая связь, покупки в магазинах — все это и многое другое формирует базы данных, которые постоянно пополняются и стремительно разрастаются. Все эти данные — большая ценность, ресурс для анализа и прогнозов, пища для алгоритмов машинного обучения. Сегодня без них уже невозможно построить систему с по-настоящему высокой точностью.

BigData-исследования находятся на стыке наиболее востребованных направлений. Это, можно сказать, сердце междисциплинарных исследований. Здесь и искусственный интеллект, и машинное обучение, и нейронные сети на службе медицины, биологии, экономики, социологии, логистики, физики, генетики, финансов; а также сложные семантические алгоритмы для поиска информации в интернете и нестандартные подходы к обеспечению безопасности программно-аппаратной инфраструктуры.

Технологии обработки больших данных и машинного обучения успешно трудятся в области поиска информации, прогноза погоды и игры в Го, они предсказывают спрос на товары, помогают распознавать изображения и звуки. Использование современных методов машинного обучения на действительно больших объемах данных позволяет конструировать системы с обширными возможностями.

Один из примеров системы, которую можно сделать в рамках конкурса, — создать алгоритм, рекомендующий фильмы, музыку и литературу конкретному пользователю, на основе оценок, которые поставили другие пользователи этого сервиса. Алгоритм сравнивает их и делает предсказание, какую оценку фильму поставил бы этот пользователь, если бы его посмотрел. Алгоритм может использовать информацию с популярных сайтов, таких как Кинопоиск, IMDB, litres или Википедия.

Описание проектов

1. Разработка аналитического сервиса по противодействию финансовому мошенничеству

Руководитель проекта: Ицкович Наталия Павловна, начальник Финтех Хаба Центрального Банка Российской Федерации

Аннотация:
В последнее время неосведомлённых граждан всё чаще вовлекают в преступные схемы в роли дропперов — лиц, помогающих вывести и обналичить деньги, похищенные или полученные в результате незаконных действий. Мошенники предлагают в объявлениях / вакансиях оформить на себя банковскую карту, а затем передать её и доступ к дистанционному банковскому обслуживанию третьим лицам.
Цель проекта — разработать сервис, который позволяет предотвращать дроппинговую деятельность. Пользователями сервиса станут банковские сотрудники, которые занимаются проверкой ресурсов и клиентов на предмет потенциального участия в незаконной деятельности.
В основу сервиса лягут несколько моделей машинного обучения:
1. Модель выявления ресурсов, вовлекающих в дроппинговую деятельность: фишинговые письма, веб-сайты, объявления в социальных сетях.
2. Модель машинного обучения, которая выявляет клиентов-дропперов на основе истории их банковских транзакций.
В процессе работы над проектом участники познакомятся с современными подходами к анализу данных, реализуют ряд классических моделей машинного обучения для решения поставленной задачи, а также освоят подходы к разработке пользовательских сервисов.

Партнер: Финтех Хаб Банка России

2. Дизайн байндеров с помощью нейросетевых моделей

Руководитель проекта: Вяткин Никита Сергеевич, ML-инженер отдела алгоритмической структурной биоинформатики АО «БИОКАД»

Аннотация:
Современные лекарственные средства зачастую создаются с помощью компьютерного моделирования процессов, которые должны происходить в организме человека.
При подобном моделировании могут использоваться и нейронные сети — они позволяют предсказывать то, как конкретная молекула (которую называют байндером) будет взаимодействовать с целевым объектом в организме. Более того, с помощью подобных моделей можно генерировать абсолютно новые терапевтические молекулы, оптимизируя в процессе генерации нужные свойства создаваемой молекулы.
Целью проекта является получение с помощью передовых методов машинного обучения набора инновационных байндеров на основе антител — молекул иммунной системы.
За время работы над проектом участники познакомятся с различными подходами к созданию биологических объектов с помощью нейронных сетей, изучат математику, которая стоит за подобным моделированием, а также естественным образом освоят биологию моделируемых процессов.

Партнер: АО «Биокад»

3. Гео-эмбеддинги: построение универсального представления локации

Руководитель проекта: Пустынников Алексей Павлович, Data Science Team Lead ПАО Банк ВТБ

Аннотация:
В последнее время наблюдается активный рост популярности сервисов, основанных на анализе местоположения (например, сайты недвижимости, сервисы рекомендаций POI — интересных мест). Создание подобных сервисов требует работы с данными нескольких модальностей, которые сложно объединить классическими методами.
Несмотря на значительные успехи, большинство задач гео-аналитики сформулированы классически и сведены к задачам обучения с учителем (supervised learning), что приводит к двум основным недостаткам. Во-первых, модели и представления данных (эмбеддинги), созданные для одной задачи, не всегда полезны для других задач. Во-вторых, для многих прикладных задач данных не так много, что делает supervised learning непрактичным. Применение unsupervised-подходов для предобучения гео-эмбеддингов может решить данную проблему.
При создании гео-эбеддингов с помощью моделей машинного обучения необходимо решить ряд проблем: (1) создать представление всей богатой и разнородной информации о социально-экономических факторах локации; (2) объединить данные соседних локаций в эмбеддинги районов и городов, (3) соединить полученные представления с данными конкретного объекта (дома, POI).
Участникам проекта будет предложено в unsupervised-режиме обучить несколько моделей эмбеддингов локаций на различных архитектурах и протестировать их в решении прикладной задачи (downstream task) на банковских данных.

Партнер: ПАО Банк ВТБ

4. Сервис для автоматизации обработки аудиоматериалов на платформе VK Mini Apps

Руководитель проекта: Зайцев Дмитрий Владимирович, ведущий программист, руководитель направления разработки, ООО «ВК»

Аннотация:
В наше время распространён формат прослушивания подкастов на различные темы: от научных, до развлекательных. Данный проект ставит перед собой цель упрощения создания материалов в подобном формате за счёт автоматизации обработки аудио, которая позволит записывать высококачественные подкасты буквально со смартфона.
Участникам предлагается создать сервис для записи подкастов и редактирования аудиозаписей на основе платформы VK Mini Apps. В основу доступных пользователям инструментов редактирования аудио лягут модели машинного обучения, которые часто применяются для обработки аудио — например, для удаления фонового шума.

Партнер: ООО «ВК»

5. Биометрическая система контроля и управления доступом

Руководитель проекта: Перевозчиков Андрей Владимирович, главный аналитик-исследователь центра технологий искусственного интеллекта АО «Газпромбанк»

Аннотация:
Биометрическая СКУД (система контроля и управления доступом) — это программно-аппаратный комплекс, основными задачами которого являются ограничение доступа на охраняемый объект и идентификация лиц на заданной территории. Такие системы обеспечивают безопасный и удобный доступ в зоны повышенного контроля, предотвращают несанкционированное проникновение в них, а также производят учёт лиц, находящихся на объектах. 
 Проект направлен на разработку СКУД на базе аппаратной платформы NVIDIA Jetson Orin Nano. Система будет использовать RGB-IR камеру для идентификации пользователей, а также для предотвращения фальсификации биометрических данных (например, использования фотографии человека для получения доступа вместо лица живого человека). 
 Проект позволит участникам получить практические навыки в области компьютерного зрения, разработке аппаратных решений, работе с базами данных и проектировании пользовательских интерфейсов.

Партнер: АО «Газпромбанк»

6. Разработка рекомендательной системы на основе больших языковых моделей

Руководитель проекта: Гасников Александр Владимирович, ректор АНОО ВО «Университет Иннополис»

Аннотация:
В современном мире рекомендательные системы тесно вошли в нашу жизнь. Они используются во многих B2C-продуктах, часто являясь основным компонентом подобных систем.
Развитие технологий в области языковых моделей также не стоит на месте — модели по типу ChatGPT уже помогают человечеству автоматизированно решать ряд рутинных задач. В том числе выходят научные статьи о том, как использовать большие языковые модели в задаче рекомендаций.
В данном проекте участникам предлагается реализовать подходы из этих статей, а также разработать новые, более эффективные и качественные, для создания универсальной рекомендательной системы, которая может быть интегрирована в любую доменную область.

Партнер: АНОО ВО «Университет Иннополис», МФТИ

7. Система распознавания присутствия пациента для анализа и контроля врачебной активности

Руководитель проекта: Андресюк Елена Андреевна, директор по инновациям ООО «Медси Диджитал»

Аннотация:
Сегодняшний медицинский ландшафт сталкивается с вызовом неэффективного взаимодействия между медицинскими информационными системами (МИС) и реальной клинической практикой. Одной из ключевых проблем является возможность проведения врачами приемов вне МИС, что создает риск ошибок в учете и управлении расписанием, а также убытки для медицинских учреждений.
Проект направлен на создание системы, способной на основе видеозаписей автоматически отслеживать время прихода и ухода пациентов на прием к врачу, а также сопоставлять эти данные с расписанием врача в медицинской информационной системе (МИС).
В рамках проекта участники познакомятся с передовыми технологиями в области компьютерного зрения, а также освоят технологии создания полноценных информационных систем.

Партнер: ООО «Медси Диджитал»

8. Математические модели для решения задач управления производством

Руководитель проекта: Чернов Алексей Владимирович, заместитель заведующего кафедры «Информационные технологии в авиации», заместитель заведующего лаборатории «Численные методы прикладной структурной оптимизации», старший научный сотрудник МФТИ

Аннотация:
В проекте будут изучаться и строиться математические модели для решения задач планирования производства. Будут рассматриваться задачи управления заказами, задачи построения производственного расписания, задача управления складскими запасами. Итогом проекта должно стать построение концепта системы управления производством на основе разработанных в рамках проекта моделей.

Партнер: МФТИ

9. Умный сервис для планирования путешествий

Руководитель проекта: Кудинов Иван Михайлович, ведущий разработчик Т-Банка

Аннотация:
В рамках проекта участникам будет предложено разработать приложение, которое позволяет планировать путешествия в незнакомые места. 
Персонализированное приложение позволит пользователям, не знакомым с новым городом, собрать подходящий им по бюджету и интересам список мест для посещения и разместить эту информацию на виртуальной доске. Каждый пользователь получит доступ к доскам других пользователей, которые уже бывали в этом городе и собрали свои впечатления и рекомендации в персональную подборку, что позволит учитывать опыт других туристов.
Для решения задачи также предлагается обучить собственную модель машинного обучения для обработки отзывов пользователей и генерации рекомендаций на их основе. Для обучения модели участникам проекта будут предоставлены реальные данные.

Партнер: Т-Банк

10. Рекомендательная инвестиционная платформа для рынка российских ценных бумаг на основе мультимодальных алгоритмов искусственного интеллекта

Руководитель проекта: Семёнов Михаил Евгеньевич, научный руководитель направления «Финансовая математика и финансовые технологии» Научного центра информационных технологий и искусственного интеллекта АНОО ВО «Университет «Сириус

Аннотация:
Алгоритмы искусственного интеллекта и способы их применения активно развиваются. Появление технологии генеративного искусственного интеллекта меняет расстановку сил во всех сферах деятельности современного общества. Финансовый сектор, движимый мультимодальными данными, сегодня требует еще большего объема данных, чем когда-либо. Различные комбинации данных открывают новые возможности для совершенствования и создания моделей.
Мультимодальные генеративные модели показали свою эффективность в решении различных задач компьютерного зрения и обработки естественного языка. Вполне естественно появление идеи применить зарекомендовавшую себя силу мультимодальных моделей для обработки финансовых временных рядов и построения прогнозов, в том числе персонализированных рекомендаций.
Целью научно-исследовательского проекта является построение модели искусственного интеллекта для формирования и управления портфелем ценных бумаг на Российском рынке с применением анализа новостей на русском языке.
Выполнение проекта будет осуществляться в два этапа: 1) реализация  мультимодального подхода, в котором языковые модели сформируют векторное представление входных данных (результат получение бенчмарка — базовой модели), 2) реализация мультимодальной модели, для которой необходимо спроектировать уникальную функцию ошибки, учитывающую обе модальности для задачи оптимизации.

Партнер: АНОО ВО «Университет «Сириус»

11. Спортивный комментатор на основе искусственного интеллекта

Руководитель проекта: Полунина Полина Алексеевна, советник Института искусственного интеллекта, приглашенный преподаватель Департамента Больших Данных и Информационного Поиска НИУ ВШЭ

Аннотация:
Проект заключается в создании текстового комментатора спортивных событий на базе генеративного искусственного интеллекта. Комментатор преобразует информацию о запрашиваемом спортивном событии из видеоформата в краткий содержательный текст с сопутствующей аналитикой, а также производит перевод на русский язык.
В рамках проекта участники познакомятся с наиболее актуальными задачами в сфере обработки естественного языка (NLP), научатся работать с моделями из области NLP и компьютерного зрения (CV), анализировать большие объемы данных и создавать прототипы сервисов на основе ИИ.
Проект будет интересен участникам, желающим углубить свои знания в анализе данных, областях обработки естественного языка, а также работы с видео.

Партнер: ООО «Яндекс»

Руководители направления

Райгородский
Андрей Михайлович

Заведующий лабораторией продвинутой комбинаторики и сетевых приложений, заведующий лабораторией прикладных исследований МФТИ - Сбербанк, заведующий кафедрой дискретной математики ФИВТ, руководитель исследовательской группы в Яндексе, директор школы ПМИ МФТИ, лауреат Премии Президента Российской Федерации в области науки и инноваций для молодых ученых (2011), активный популяризатор науки, автор ряда научно-популярных книг и брошюр, федеральный профессор, профессор МГУ, профессор математики МФТИ, доктор физико-математических наук

Абакумов
Евгений Михайлович

Научный руководитель Центра информационных технологий и искусственного интеллекта Университета «Сириус»

Садовников
Александр Владимирович

Руководитель отдела аналитики АНО «Сириус.Курсы», методист направления «Большие данные, искусственный интеллект, финансовые технологии и машинное обучение» проектной программы конкурса «Большие вызовы», методист программы «Сириус.ИИ»

Подать заявку
© 2015–2024 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!