help@sochisirius.ru
1-24 июля 2020

Большие данные, искусственный интеллект, финансовые технологии и машинное обучение

Цифровые технологии присутствуют во всех областях жизни человека. Объем записываемых в мировые хранилища данных ежесекундно растет. Расширение Big Data и ускорение темпа роста стало объективной реальностью. Ежесекундно гигантские объемы контента генерируют социальные сети, информационные сайты, файлообменники, а также приборы для мониторинга, сенсоры, системы наблюдения, операционные системы, смартфоны, интеллектуальные и финансовые системы, датчики и прочее. Все они задают бешеный темп роста объема данных, что приводит к появлению потребности наращивать количество рабочих серверов (и реальных, и виртуальных) и, как следствие, расширять и внедрять новые data-центры.

Работе с большими объемами данных (включая вопросы кибербезопасности) в разных проявлениях посвящено данное направление.

Все направления программы «Большие вызовы»

Проекты направления

1. Новая редакция
2. Чатбот для экосистемы Тинькофф
3. Распределение ресурсов сотовой станции в мобильных сетях 5-го поколения
4. Стохастические градиентные методы на службе машинного обучения и анализа данных
5. Сервис, представляющий информацию об актуальных мошеннических схемах в финансовой сфере
6. Цифровая модель месторождения
7. Построение профиля абитуриента бизнес школы на базе данных социальной сети
8. Разработка интеллектуальной системы контроля комплектности специальной и защитной одежды на сотруднике при исполнении опасных работ

Описание проектов
список и описание проектов предварительные и могут быть изменены и уточнены

1. Новая редакция

Руководитель проекта: Бибилов Иван

Аннотация: Предстоит два больших этапа.

1 этап. Исследовательский этап. Будет найдено большое количество мест, в которых можно заменить редактора, копирайтера, журналиста компьютерными программами. Например, можно отслеживать новости на сайтах информационных агентств, следить публикациями популярных блогеров, спортивными и погодными сервисами. Из предложенных текстов можно извлекать смысловые куски и публиковать новости на основе извлеченных данных. Например, "российская лыжница Наталья Непряева завоевала серебро в гонке на 10 километров свободным стилем на этапе Кубка мира в чешском Нове Место. Об этом сообщает корреспондент «Ленты.ру». Первой финишировала норвежка Тереза Йохауг, преодолевшая дистанцию за 23 минуты 51,6 секунды. Непряева отстала на 32,7 секунды. Замкнула тройку лидеров другая представительница Норвегии Хейди Венг (+40,3 секунды)". В тексте этой новости нет ничего такого, чего не могла бы написать программа, которая имеет доступ к результатам соревнований и списку итоговых результатов. Таким образом, огромное количество вторичной информации со ссылкой на первоисточники может быть сгенерировано в очень короткое время на новостном портале. Быстрота публикаций очень важна, ибо от нее зависит посещаемость страницы с новостью, а также количество ссылок на нее, а значит и рекламная привлекательность портала в целом. Вместе с участниками будут разобраны примерные алгоритмы такой генерации, включая шаблонные подстановки, алгоритмы морфологического и синтаксического разбора, некоторые алгоритмы машинного обучения.

2 этап. В конце первого этапа останется подвешенным вопрос: «А что будет теперь с журналистами, копирайтерами и редакциями?». Участники реализуют некоторые алгоритмы, изученные на 1 этапе. Окажется, что эти программы будут очень полезны для редакций, уберут кучу рутины по переписыванию новостей (рерайтинг), а также помогут в поиске интересных событий. А за живыми работниками редакций останется аналитика и интерпретация, что может привести к увеличению оригинального контента.

Партнер проекта: Общество с ограниченной ответственностью «Яндекс»


2. Чатбот для экосистемы Тинькофф

Руководитель проекта: Шум П.В.

Аннотация: Традиционные интерфейсы коммуникации клиентов с банками не покрывают все возможные кейсы. Тинькофф является лидером рынка и в числе первых внедряет новые продуктовые фичи (сториз, суперап, лайфстайл). На сегодняшний день подрастает новое поколение школьников и студентов, которые уже завтра придут в систему потребления финансовых продуктов. При этом у них другие модели коммуникации, они отдают предпочтение общению в чатах и соцсетях. Соответственно, перед банками встает острая проблема потери интерфейса коммуникации с клиентом. Мы не можем этого допустить, поэтому предлагаем вам придумать и разработать новые механики и  функции коммуникации с указанной аудиторией. Проработать следующие идеи – разработать интерфейс для коммуникации с Тинькофф в чатах\соцсетях. А именно:
– Управление онлайн-банком через чатбот;
– Не только онлайн-банком, но и лайфстайл функциями (брони, билеты и пр). Брейншторм новых функций. Финансовые\ около финансовые функции (стикеры за деньги, бот который собирает деньги на подарок и пр);
– Реальные, пока еще не ставшие классическими методы коммуникации с интерфейсом банка (авторизация по биометрии, голос/видео сообщения);
– Геймификация с финансами.
Платформа: Мессенджеры\ соц. сети
Инструментарий: Платформа для чатботов. ML модели, Биометрия. Computer vision. Text to speech\ Speech to text.

Партнер проекта: Акционерное общество «Тинькофф Банк»


3. Распределение ресурсов сотовой станции в мобильных сетях 5го поколения

Руководители проекта: Чернова Ю.Г., Мишин В.Д., Чернов А.В.

Аннотация: В нашей повседневной жизни широко используются мобильные телефоны, работающие в LTE сетях (4G). Однако прогресс не стоит на месте и уже сейчас есть спрос на более качественную и быструю связь, которая необходима для работы беспилотных устройств, распознавания фотографий / видео / аудио. С этой целью уже разработан стандарт для мобильных сетей пятого поколения (5G, New Radio), который позволил бы удовлетворить такой запрос. Уже сейчас ведущие компании разрабатывают и готовят к выпуску как пользовательские устройства (телефоны), так и необходимое сетевое оборудование.

Одним из ключевых отличий сетей 5G является многоантенность: сотовые станции планируется оснащать по крайней мере 64 антеннами, которые будут передавать сигнал в одном диапазоне частот в одном направлении, при этом телефон, осуществляющий прием, также оснащается несколькими (2, 4 и более) антеннами. Это позволяет формировать узконаправленные лучи (beam forming) для передачи данных и указывать более чем одного пользователя в каждый момент времени на одной и той же частоте. Однако здесь появляется вопрос: как назначить пользователей в текущий момент времени так, чтобы данные до них не только дошли, но и при этом объем этих данных был достаточен, а в среднем, необходимо так или иначе обслужить всех пользователей (RRM - radio resource management).

Данная задача может быть сформулирована как задача дискретной оптимизации: выбор набора пользователей, на котором значение некоторой функции будет максимально. Число пользователей в наиболее востребованном сценарии использования сети достигает 30 человек / устройств и количество возможных вариантов более 1 млрд. При этом время на принятие решение составляет примерно 0.5 мс. Построение эффективного алгоритма для решения такой задачи позволит эффективно использовать новую технологию, откроет возможность применения новых подходов и методов для решения более высокоуровневых задач.

Партнер проекта: Московский физико-технический институт (национальный исследовательский университет)


4. Стохастические градиентные методы на службе машинного обучения и анализа данных

Руководители проекта: Рогозин А.В., Данилова М.Ю., Горбунов Э.А.

Аннотация: В настоящее время в области машинного обучения и анализа данных всё большую популярность набирают такие направления как федеративное обучение, которое применяется для улучшения приложений с использованием данных с разных мобильных телефонов, распределённая оптимизация, которая позволяет ускорять процесс обучения при помощи использования нескольких компьютеров, соединённых в сеть, и стохастические методы оптимизации для задач с шумом, имеющим тяжёлые хвосты распределения, что в свою очередь используется для обучения таких нейросетевых моделей, как Attention model. Несмотря на кажущуюся на первый взгляд разнородность описанных задач, основным и наиболее популярным инструментом для их решения является стохастический градиентный спуск (SGD) и различные его модификации. В данном проекте мы будем разрабатывать новые методы на базе SGD и применять их к популярным задачам машинного обучения.

Партнер проекта: Московский физико-технический институт (национальный исследовательский университет)


5. Сервис, представляющий информацию об актуальных мошеннических схемах в финансовой сфере

Руководиель проекта: Думанский А.И.

Аннотация: Необходимо разработать сервис, программный продукт или приложение, позволяющее получать информацию об актуальных мошеннических схемах в финансовой сфере. Продукт должен представлять собой сервис, позволяющий гражданам получить актуальную информацих о мошеннических схемах, жертвами которых они могут стать. Первая часть проекта представляет собой изучение основных мошеннических схем, используемых в настоящее время (мошеннические телефонные звонки (социальная инженерия), несанкционированные доступ к персональным данным (фишинг)). Вторая часть: на основе проанализированной информации необходимо разработать сервис, позволяющий получить актуальную информацию о мошеннических схемах, а также узнать о способах, которые позволят не стать жертвой преступников.

Партнер проекта: Центр мониторинга и реагирования на компьютерные атаки в кредитно-финансовой сфере Департамента информационной безопасности Центрального Банка Российской Федерации


6. Цифровая модель месторождения

Руководитель проекта: Дучков А.А.

Аннотация: Проект направлен на обоснование новых подходов к изучению течения жидкостей в породах со сложной микроструктурой пор. Основные задачи:

1. проводить анализ топографических изображений пород для построения цифровых моделей пористых пород;
2. изготовление искусственных образцов пористых сред с использованием технологии 3D печати (2D и 3D модели);
3. лабораторные испытания искусственных образцов – измерение проницаемости;
4. численное моделирование свойств образцов – расчет проницаемости для цифровой модели; 
5. сравнение результатов численного моделирования и лабораторных испытаний (2D и 3D модели); обоснование точности численного моделирования и возможности использования 2D моделей для описания трехмерных процессов. 

Партнер проекта: Публичное акционерное общество «Газпром нефть»


7. Построение профиля абитуриента бизнес школы на базе данных социальной сети

Руководитель проекта: Гладкова М.А.

Аннотация: Университеты постоянно находятся в конкурентной борьбе за талантливых абитуриентов. Для того, чтобы придумать как продвигать свои образовательные программы, университеты, как и любые другие компании, должны лучше узнавать тех, кто потенциально может быть заинтересован в их продукте. При этом университеты знают из каких школ и городов поступают к ним студенты, но хотят знать то, что не лежит на поверхности – чем интересуется абитуриент, какую музыку слушает, что читает, с кем дружит.  
На основании данных социальных сетей предлагается проанализировать данные о поступающих и учащихся студентах, классифицировать всех поступающих по интересам и построить профиль абитуриента одного из факультетов университета.

Партнер проекта: Публичное акционерное общество «БАНК ВТБ»
 

8. Разработка интеллектуальной системы контроля комплектности специальной и защитной одежды на сотруднике при исполнении опасных работ

Руководитель проекта: Штехин С.Е.

Аннотация: В подразделениях ОАО РЖД, занятых техническим обслуживанием, регулярно проводятся работы в условиях повышенной опасности, например, с высоким напряжением. Пренебрежение требованиями техники безопасности, и в частности, отсутствие или неполная комплектность специальной одежды приводят к большому числу несчастных случаев, в том числе и со смертельным исходом. Контроль ношения спецодежды, проводимый непосредственными руководителями, не позволяет в полной мере обеспечить безусловное соблюдение требований безопасности труда.

Данный проект предполагает реализацию современных моделей компьютерного зрения, представляющих собой глубокие нейронные сети, способные распознавать различные элементы специальной одежды на фотоизображении сотрудника. К элементам специальной одежды относятся: каска с ремешком, куртка, брюки, перчатки, щиток лицевой на каске.

В рамках проекта участникам предлагается выполнить следующие задачи:

1. Подготовка и разметка тестового датасета фотографий
2. Разработка и обучение модели
3. Создание прототипа интеллектуальной системы контроля комплектности специальной и защитной одежды

Комплект спецодежды для проекта и  размеченный датасет фотографий, для обучения модели, будет предоставлен от РЖД.

Партнеры проекта: Отраслевой центр разработки и внедрения информационных систем (ОЦРВ), Открытое акционерное общество «Российские железные дороги»

Эксперты и руководители проектов

Бибилов
Иван

Старший преподаватель ООО «Яндекс»

Шум
Павел Вячеславович

Руководитель регионального центра разработки Тинькофф Банка в городе Сочи

Мишин
Виктор Дмитриевич

Младший научный сотрудник Московского физико-технического института (национального исследовательского университета)

Чернов
Алексей Владимирович

Старший научный сотрудник лаборатории численных методов прикладной структурной оптимизации Московского физико-технического института (национального исследовательского университета)

Чернова
Юлия Геннадьевна

Научный сотрудник кафедры математической теории интеллектуальных систем Московского физико-технического института (национального исследовательского университета)

Данилова
Марина Юрьевна

Младший научный сотрудник Московского физико-технического института (национального исследовательского университета)

Горбунов
Эдуард Александрович

Младший научный сотрудник Московского физико-технического института (национального исследовательского университета)

Рогозин
Александр Викторович

Ассистент кафедры Московского физико-технического института (национального исследовательского университета)

Думанский
Андрей Иванович

Начальник отдела Центра мониторинга и реагирования на компьютерные атаки в кредитно-финансовой сфере департамента информационной безопасности Центрального Банка Российской Федерации (ФинЦЕРТ ЦБ РФ)

Дучков
Антон Альбертович

Доцент кафедры геофизики геолого-геофизического факультета Новосибирского национального исследовательского государственного университета

Гладкова
Маргарита Анатольевна

Старший преподаватель, академический директор программы магистратуры «Бизнес аналитика и большие данные» ПАО «Банк ВТБ»

Штехин
Сергей Евгеньевич

Разработчик-исследователь, руководитель группы компьютерного зрения лаборатории искусственного интеллекта и нейронных сетей Отраслевого центра разработки и внедрения информационных систем (ОЦРВ ОАО «РЖД»)

Руководители направления

Райгородский
Андрей Михайлович

Заведующий лабораторией продвинутой комбинаторики и сетевых приложений, заведующий лабораторией прикладных исследований МФТИ - Сбербанк, заведующий кафедрой дискретной математики ФИВТ, руководитель исследовательской группы в Яндексе, директор школы ПМИ МФТИ, лауреат Премии Президента Российской Федерации в области науки и инноваций для молодых ученых (2011), активный популяризатор науки, автор ряда научно-популярных книг и брошюр, федеральный профессор, профессор МГУ, профессор математики МФТИ, доктор физико-математических наук

Гусев
Антон Сергеевич

Методист Центра педагогического мастерства (Москва), заместитель начальника отдела развития дистанционных программ Учебно-методического центра Образовательного Фонда «Талант и успех», тренер сборной Москвы на Всероссийской олимпиаде школьников по математике, призер ВОШ по математике (2007–2009), член методических комиссий и жюри этапов ВОШ по математике в городе Москве, Московской математической олимпиады, международной олимпиады Мегаполисов и других, лауреат гранта Москвы в сфере образования (2016–2018), методист программы «Большие вызовы» (2019, 2020)

Подать заявку
© 2015–2020 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!