Прием заявок для участия в конкурсном отборе был открыт до 14 сентября 2022 года.
К участию в программе допускались только зарегистрировавшиеся школьники.
По вопросам участия в программе просим обращаться по адресу: nauka@sochisirius.ru.
Образовательная программа была ориентирована на старших школьников, увлекающихся олимпиадным программированием, в том числе имеющих уверенные знания языка программирования Python, С++, а также алгоритмов и структур данных.
Программа состояла из трех блоков. Первый блок был посвящен подготовке к олимпиадам по информатике. В рамках интенсива по олимпиадному программированию школьникам ежедневно предлагались на выбор три темы различной сложности. Благодаря возможности самостоятельного формирования набора тем, обеспечивалась повышенная эффективность подготовки.
Задачи на темы
Второй блок программы был посвящен решению оптимизационных задач и знакомству с методами машинного обучения. Данный блок был направлен на получение навыков применения математических методов для решения реальных задач, связанных в том числе с анализом данных.
В рамках переходной части читались лекции и проводились контесты, которые были нацелены на повышение понимания того, как материал алгоритмической части наилучшим образом применить в проектной части.
Задачи на темы
– Неточные алгоритмы
– Методы обработки изображений
– Градиентные методы оптимизации
– Работа с телеграм-ботами
Третий блок программы — проектная работа с преподавателями-практиками.
В рамках проектной части участники программы распределялись на команды для работы над проектами. У каждой команды был куратор — аналитик или разработчик-исследователь с опытом. Обучение практическим навыкам происходило непосредственно в работе команды над проектом. Куратор ставил задачу команде, помогал распределять роли и декомпозировать на подзадачи. В процессе работы отвечал на вопросы, поддерживал в сложные моменты и делал ревью кода. В конце программы на защите проектов команды презентовали полученные итоговые результаты друг другу и всем желающим.
Список проектов
1. Authonomous driving
2. Создание персональных моделей для генерации изображений по тексту
3. Нейро Гоголь
4. Чат-бот с переносом стиля на основе генеративных моделей
5. Imagen Imaginarium
6. Personal recommendations
7. Фотошоп словами
8. Speech-to-Text
9. Noise Reduction
10. Коллаборативные инструменты
11. Бот — персональный помощник
12. AI music clip director
13. Поисковик песен и их переводов
14. Создание с нуля модели CLIP и последующее применение ее для генерации изображений по промпту
Описание проектов
1. Authonomous driving
Руководитель проекта: Афанасьев Глеб Ильич
Описание проекта: Идея проекта — написать алгоритм, в реальном времени детектирующий препятствия на основании данных с rgbd камеры и прокладывающий оптимальный маршрут до цели. Участники изучили различные архитектуры сетей, математику, стоящую за ними, и на основании этого создали, обучили и протестировали свою собственную нейронную сеть.
2. Создание персональных моделей для генерации изображений по тексту
Руководитель проекта: Биршерт Алексей Дмитриевич
Описание проекта: Идея проекта — создать изображения с конкретными объектами (ваш питомец, красная телефонная будка, Мэтью Макконахи или даже вы сами) в новых контекстах и окружениях. Участники обучили разные «персональные» нейросети и с их помощью нарисовали различные карточки, дав волю фантазии и творчеству.
3. Нейро Гоголь
Руководитель проекта: Бредихин Александр Иванович
Описание проекта: Идея проекта — сгенерировать текст в стиле автора. Но что можно сделать, когда из ресурсов для обучения только colab, а модель должна быть как можно меньше для быстрого ответа?
Школьники сделали дистиляцию берта и сгенерировали текст в стиле какого-то автора. В проекте была как ML часть: ребята провели исследование, как лучше всего сжимать модель, чтобы она занимала как можно меньше памяти и как можно быстрее выдавала ответ, так и инфраструктурная часть, где был написал телеграм-бот и простой инференс сервис модели, чтобы это работало вместе.
4. Чат-бот с переносом стиля на основе генеративных моделей
Руководитель проекта: Думбай Алексей Дмитриевич
Описание проекта: Идея проекта — создать бота, который с помощью больших генеративных моделей может переносить стили написания текста и отвечать на сообщения в заданном стиле. В этом проекте участникам предстояло научиться дообучать модели для генерации текста, работать с данными для обучения и освоить инфраструктуру для применения этих моделей в телеграм-боте. Так как большие генеративные модели вроде GPT-3 требуют соответственных вычислительных ресурсов, обучение и инференс происходило через API-запросы к сервису, предоставляющему такие модели.
5. Imagen Imaginarium
Руководитель проекта: Еленик Константин Ильич
Описание проекта: Идея проекта — с помощью современной нейросети генерирующие картинки создать телеграм-бота для игры в imaginarium (он же dixit). Конкретный сценарий игры предстояло разработать самим участникам. Это могла быть игра для одного, где надо угадать какое из генерированных изображений соответствует данному описанию. А мог быть мультиплеер, где игроки вместо того чтобы получать случайные карточки получают изображения, сгенерированные по их запросу. В ходе проекта участникам предстояло разобраться с применением модели Stable Diffusion и ее возможностями, с современными моделями NLP для модификации текстовых запросов, а также с методами манипуляции изображениями. В конце все эти наработки были объединены в цельного телеграм-бота, готового для использования.
6. Personal recommendations
Руководитель проекта: Конюшенко Юлия Николаевна
Описание проекта: Идея проекта — сделать систему персональных рекомендаций на домене фильмов. Школьники использовали данные о пользователе и фильме в отдельности, а также информацию о просмотрах. Разбались, почему рекомендательные системы чаще всего двухуровневые, обучили 2-4 модельки на первом уровне, попробовали бустинг/нейросетку — на втором. В итоге был создан телеграм-бот, который подбирает самый подходящий фильм/сериал на вечер.
7. Фотошоп словами
Руководитель проекта: Котельников Аким Константинович
Описание проекта: Современные нейросети классно показывают себя в задачах генерации картинок по заданному текстовому описанию (StableDiffusion). Однако контролировать процесс генерации картинок не так просто. В этом проекте участники попробовали разобраться в методе, который позволяет менять какие-то конкретные элементы картинки с помощью слов (например, «кот на велосипеде» -> «кот на машине»). Или добавлять что-то новое (например, «замок на берегу озера» -> «детский рисунок замка на берегу озера»). Вместо телеграм-бота был использован метод «упаковки» с помощью gardio.app — популярный способ запускать «демки» ML моделей. P.S. Кроме того, школьники разобрались, как работает StableDiffusion.
8. Speech-to-Text
Руководитель проекта: Находнов Максим Сергеевич
Описание проекта: Школьники попробовали обучить что-то близкое к SOTA для задачи распознавания русской речи. Для демонстрации был сделан телеграм-бот для распознавания голосовых сообщений и «прикручена» модель для автоматического создания субтитров к видео.
9. Noise Reduction
Руководитель проекта: Николаев Александр Викторович
Описание проекта: Участники разработали систему шумоподавления используя современные нейросети и попробовали получить результаты, близкие к SOTA. Для демонстрации работы был создан телеграм-бот. Кроме того, ребята обучили нейросеть решать другие задачи: разделение дикторов, персонализированное шумоподавление.
10. Коллаборативные инструменты
Руководитель проекта: Пузыревский Иван Витальевич
Описание проекта: В свое время системы типа Google Docs, в которых можно вести работу над одним документом одновременно нескольким лицам, существенно повысили эффективность совместной работы, ведь взамен постоянной пересылки файлов друг-другу можно вносить правки в общий документ без риска конфликта правок. Последние годы, особенно во время и после пандемии, тенденция на использование коллаборативных инструментов лишь закрепилась: во многих компаний в обиход вошли Miro, Figma, G-Suite и другие. В рамках работы ребята изучили, по каким принципам строятся коллаборативные инструменты, и попробовали сделать несколько своими руками: текстовый редактор, список дел, графический редактор.
11. Бот — персональный помощник
Руководитель проекта: Сабиров Руслан Ринатович
Описание проекта: Школьники создавали бота, который будет решать повседневные задачи с помощью обработки текста и ML. В боте было реализовано несколько навыков. Первый из них — напоминания: бот получает сообщения с просьбами «напомни мне через 3 часа позвонить маме», выделяет сущности <что напомнить> и <когда напомнить> и в нужное время отправляет напоминание. Второй навык — это болталка. Была применена языковая модель YaLM (Зелибоба) для общения на свободную тему в смешном стиле. Также были сделаны несколько навыков на выбор: погода, анекдот дня, поиск ответов на информационные вопросы («Сколько весит слон?»). Кроме того, участники попробовали применить распознавание и синтез речи, чтобы бот общался не только текстом, но и голосом.
12. AI music clip director
Руководитель проекта: Садртдинов Ильдус Рустемович
Описание проекта: Идея проекта ― создавать видеоклипы для музыкальных треков автоматически. За последний год появились нейронные сети, которые умеют генерировать фотореалистичные картинки по текстовому запросу. Соответственно, можно «скормить» текст песни такой нейросети, сгенерировать кадры, которые будут отображать смысл текста и смонтировать их в единый видеоклип. Если автоматизировать этот процесс, то получится создавать красивые (а иногда немного психоделичные) видеоклипы для любой песни с текстом.
13. Поисковик песен и их переводов
Руководитель проекта: Смирнов Тимофей Алексеевич
Описание проекта: Идея проекта — написать телеграм-бот, которому можно скинуть либо кусок текста, либо напеть песню. Он распознает песню, найдет ее текст и перевод в базе и покажет в удобном интерфейсе. Такой бот будет полезно меломанам, которые хотят выучить английский.
14. Создание с нуля модели CLIP и последующее применение ее для генерации изображений по промпту
Руководитель проекта: Шабалин Александр Михайлович
Описание проекта: Учащиеся разобрались, как работает модель для сопоставления текстов и изображений, CLIP, и обучили ее с нуля. Затем взяли обученную генеративную модель и направляли процесс генерации изображений с помощью CLIP. Получилась очень простая модель генерации (или модификации) произвольных картинок по произвольному текстовому запросу, на основе которой можно будет сделать что-то более сложное.
Результаты заключительного отборочного тура
поиск ведётся по ID личного кабинета (начинается на 1001)
Список участников заключительного тура
Результаты онлайн-курса
Рейтинг участников конкурсного отбора (п.3.4. Положения)
К участию в конкурсном отборе приглашаются школьники 10-11 классов, являющиеся гражданами России, стран СНГ, Республики Абхазия.
В рамках конкурсного отбора без дополнительных испытаний на программу приглашаются победители и призеры заключительных этапов олимпиад 2021/22 учебного года. Участники отбора ранжируются в зависимости от конкретной олимпиады и полученных на ней баллов.
Порядок ранжирования следующий:
Порядок приоритета | Название олимпиады | Рейтинг |
1 | Всероссийская олимпиада школьников по информатике | Победители |
2 | Всероссийская олимпиада школьников по информатике | Призеры |
3 | Открытая олимпиада школьников по программированию | Победители |
4 | Открытая олимпиада школьников по программированию | Призеры |
5 | Межрегиональная олимпиада школьников «Высшая проба» по информатике | Победители |
Прикреплять подтверждающие документы к заявке не требуется.
Список кандидатов на участие в образовательной программе без дополнительных вступительных испытаний будет опубликован не позднее 21 сентября.
Отбор участников с дополнительными испытаниями осуществляется в два этапа. Первый этап — дистанционный учебно-отборочный курс на платформе Сириус.Курсы и заочное тестирование. Второй этап — заключительный очный отборочный тур, который проводится на площадках в регионах.
Школьники Москвы и Санкт-Петербурга приглашаются на программу только по результатам оценки академических достижений.
Для участия в конкурсном отборе по результатам вступительных испытаний необходимо:
– Пройти онлайн-курс с 25 августа по 13 октября, получив «Зачет». После этого, участник допускается к заочному тестированию;
– Пройти заочное тестирование в период с 16 по 17 октября. Участники, успешно прошедшие данный этап конкурсного отбора, приглашаются к заключительному отборочному этапу;
– Пройти заключительный отборочный этап отбора в своем регионе 29 октября.
На заключительный этап, без прохождения дистанционного учебно-отборочного курса и тестирования, приглашаются призеры Межрегиональной олимпиады школьников «Высшая проба» по информатике за 2021/2022 год.
Список кандидатов на участие в образовательной программе, включающий результаты первого и второго этапов отбора, будет опубликован не позднее 2 ноября.
Куратор академических программ Яндекса, директор центра студенческих олимпиад факультета компьютерных наук Высшей школы экономики, председатель методической комиссии Московской олимпиады школьников по информатике
Доцент, руководитель департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ, куратор академических программ Яндекса
Руководитель службы ML-проектов Яндекс Браузера, преподаватель Высшей школы экономики
Старший инженер-разработчик компании ПАО "Сбербанк"
ML Engineer, Advanced Analytics в Райффайзенбанке, преподаватель факультета компьютерных наук НИУ ВШЭ
ML-исследователь-разработчик Тинькофф, приглашенный преподаватель факультета компьютерных наук Высшей школы экономики
Преподаватель курса «Дискретная математика» НИУ ИТМО и Летней школы по компьютерным наукам, золотой медалист NEF 2020 Offline, серебряный медалист NEF 2021
Преподаватель факультета компьютерных наук НИУ ВШЭ, член тренерского штаба сборной России по информатике, преподаватель Яндекса по олимпиадному программированию для школьников, призер всероссийских олимпиад по информатике и математике, абсолютный победитель Открытой олимпиады по программированию, бронзовый медалист студенческого чемпионата мира по программированию
Руководитель группы ML и аналитики нейропроектов Яндекса
Разработчик службы качества контент системы товарного поиска компании Яндекс
ML-engineer Тинькофф, приглашенный преподаватель факультета компьютерных наук Высшей школы экономики, студентка Физтех-школы прикладной математики и информатики Московского физико-технического института (МФТИ)
Исследователь Yandex.Reseach, студент магистратуры факультета компьютерных наук Высшей школы экономики
Студент факультета компьютерных наук НИУ ВШЭ, преподаватель в кружке Яндекса по олимпиадному программированию для школьников
Инженер-исследователь Института искусственного интеллекта AIRI, аспирант факультета вычислительной математики и кибернетики Московского государственного университета имени М.В.Ломоносова
R&D Engineer в компании Huawei Audio team
Координатор интернет-олимпиад, преподаватель курса «Алгоритмы и структуры данных» в Университете ИТМО, студент магистратуры ИТМО, призер всероссийских олимпиад по математике и по информатике
Преподаватель курса «Алгоритмы и структуры данных» в университете НИУ ИТМО, студент магистратуры НИУ ИТМО по программе «Программирование и искусственный интеллект», выпускник факультета информационных технологий и программирования НИУ ИТМО, председатель жюри регионального этапа ВсОШ по информатике в Липецкой области, тренер призеров и победителей ВсОШ по информатике из Липецкой области, преподаватель Летней Школы по Компьютерным Наукам и Яндекс Кружка, призер ВсОШ по информатике (2018), трехкратный золотой медалист Northern Eurasia Finals.
Руководитель инфраструктурных сервисов (IaaS) в Яндекс.Облаке
Разработчик базы Объектного ответа компании Яндекс
Исследователь Центра глубинного обучения и байесовских методов, приглашенный преподаватель факультета компьютерных наук Высшей школы экономики, студент магистратуры ВШЭ и Сколтеха
Старший разработчик группы SearchGPTв компании Яндекс
Исследователь Центра глубинного обучения и байесовских методов, приглашенный преподаватель факультета компьютерных наук Высшей школы экономики
Положение образовательной программы
«Алгоритмы и анализ данных»
1. Общие положения
1.1. Настоящее Положение определяет порядок организации и проведения образовательной программы «Алгоритмы и анализ данных» Образовательного центра «Сириус» (далее – образовательная программа), ее методическое и финансовое обеспечение.
1.2. Образовательная программа «Алгоритмы и анализ данных» проводится в Образовательном центре «Сириус» (Образовательный Фонд «Талант и успех») с 1 по 24 декабря 2022 года.
1.3. В образовательной программе могут принять участие школьники 10-11 классов из образовательных организаций, реализующих программы общего и дополнительного образования, всех регионов Российской Федерации, стран Содружества независимых государств, Республики Абхазия, успешно прошедшие конкурсный отбор.
1.4. К участию в образовательной программе допускаются школьники, являющиеся гражданами Российской Федерации, стран Содружества независимых государств, Республики Абхазия.
1.5. Персональный состав участников образовательной программы утверждается Экспертным советом Образовательного Фонда «Талант и успех».
1.6. Общее количество участников – не более 50 человек.
К участию в образовательной программе могут быть приглашены не более 10% участников из одного субъекта Российской Федерации.
1.7. Научно-методическое и кадровое сопровождение образовательной программы осуществляется сотрудниками компании “Яндекс”, преподавателями и научными сотрудниками ведущих учебных заведений страны.
1.8. В связи с целостностью и содержательной логикой образовательной программы, интенсивным режимом занятий и объемом академической нагрузки, рассчитанной на весь период пребывания обучающихся в Образовательном центре «Сириус», не допускается участие школьников в отдельных мероприятиях или части образовательной программы: исключены заезды и выезды школьников вне сроков, установленных Экспертным советом Образовательного Фонда «Талант и успех».
1.9. В случае обнаружения недостоверных сведений в заявке на образовательную программу (в т.ч. класса обучения) участник может быть исключен из конкурсного отбора.
1.10. В случае нарушений правил пребывания в Образовательном центре «Сириус» или требований настоящего Положения решением Координационного совета участник образовательной программы может быть отчислен с образовательной программы.
1.10.1. В независимости от результатов отбора школьник может быть отчислен с образовательной программы в случае, если им не усваиваются материалы образовательной программы.
2. Цели и задачи образовательной программы
2.1. Образовательная программа нацелена на получение опыта решения практических задач анализа данных и моделирования, близких к реальным, развитие логического и творческого мышления в процессе работы, обретение участниками устойчивых навыков решения олимпиадных задач по информатике, а также навыков работы в команде.
2.2. Задачи образовательной программы:
– Обретение участниками навыков промышленного программирования;
– Знакомство участников с основами анализа данных и машинного обучения;
– Получение участниками проектного опыта в сфере машинного обучения, разработка прототипа для решения реальной задачи;
– Подготовка к уровневым олимпиадам по информатике, в том числе ко Всероссийской олимпиаде по информатике;
– Освоение участниками социальных навыков, необходимых для работы в проекте (Soft Skills, менеджмент продукта и др.);
– Развитие практико-ориентированного мышления и умения работать в коллективе в процессе выполнения реальных задач;
– Развитие умения самостоятельно ставить перед собой задачи и решать их;
– Развитие алгоритмического и аналитического мышления, а также творческих способностей.
3. Порядок отбора участников образовательной программы
3.1. Отбор участников образовательной программы осуществляется Координационным советом, формируемым руководителем Образовательного Фонда «Талант и успех» на основании требований, изложенных в настоящем Положении, а также общих критериев отбора в Образовательный центр «Сириус» (направление «Наука»).
3.2. К участию в конкурсном отборе приглашаются школьники 10-11 классов, являющиеся гражданами России, стран Содружества независимых государств, Республики Абхазия.
3.3. Для участия в конкурсном отборе школьнику необходимо подать заявку на официальном сайте Образовательного центра «Сириус» в срок до 14 сентября 2022 года.
3.4. В рамках конкурсного отбора без дополнительных испытаний на программу приглашаются победители и призеры заключительных этапов олимпиад 2021/22 учебного года. Количество мест для таких кандидатов не более 15.
3.4.1. Участники отбора ранжируются в зависимости от конкретной олимпиады (чем выше олимпиада в списке, тем более высокий приоритет она имеет) и полученных на ней баллов.
Порядок ранжирования следующий:
Порядок приоритета | Название олимпиады | Рейтинг |
1 | Всероссийская олимпиада школьников по информатике | Победители |
2 | Всероссийская олимпиада школьников по информатике | Призеры |
3 | Открытая олимпиада школьников по программированию | Победители |
4 | Открытая олимпиада школьников по программированию | Призеры |
5 | Межрегиональная олимпиада школьников «Высшая проба» по информатике | Победители |
При отборе на образовательную программу оцениваются академические достижения школьников, загруженные в Государственный информационный ресурс о детях, проявивших выдающиеся способности. Прикреплять подтверждающие документы к заявке не требуется.
В случае наличия нескольких достижений из перечисленного списка участник проходит по достижению, которое имеет наиболее высокий приоритет согласно таблице выше.
3.4.2. Если несколько учащихся, показавших одинаково высокие результаты, претендуют на участие в образовательной программе, то они ранжируются по баллам на олимпиаде.
3.4.3. В случае отказа приглашенных школьников, имеющих более высокий рейтинг, их место передается участникам конкурсного отбора, набравшим наиболее высокий проходной балл в рамках отбора, предусматривающего вступительные испытания.
В случае отказа приглашенных школьников из Москвы и Санкт-Петербурга их место передается участникам конкурсного отбора, не предусматривающего вступительные испытания из аналогичных субъектов, имеющих наиболее высокий приоритет.
3.4.4. Участники отбора из рейтингового списка 3.4., не попавшие по квоте на образовательную программу, приглашаются на заключительный отборочный тур вне зависимости от результатов дистанционного учебно-отборочного курса и тестирования.
3.4.5. Список кандидатов на участие в образовательной программе без дополнительных вступительных испытаний будет опубликован на официальном сайте Центра «Сириус» не позднее 21 сентября 2022 года.
3.5. Отбор участников с дополнительными испытаниями осуществляется в два этапа. Первый этап — дистанционный учебно-отборочный курс на платформе Сириус.Курсы и заочное тестирование. Второй этап — заключительный очный отборочный тур, который проводится на площадках в регионах.
Школьники Москвы и Санкт-Петербурга приглашаются на программу только по результатам оценки академических достижений.
3.5.1. Для участия в конкурсном отборе по результатам вступительных испытаний необходимо:
– Пройти онлайн-курс с 25 августа по 13 октября 2022 года, получив «Зачет». После этого участник допускается к заочному тестированию;
– Пройти заочное тестирование в период с 16 по 17 октября 2022 года. Участники, успешно прошедшие данный этап конкурсного отбора, приглашаются к заключительному отборочному этапу;
– Пройти заключительный отборочный этап отбора в своем регионе 29 октября 2022 года.
На заключительный этап, без прохождения дистанционного учебно-отборочного курса и тестирования, приглашаются призеры Межрегиональной олимпиады школьников «Высшая проба» по информатике за 2021/2022 год.
3.5.2. Регламент, места и время проведения заключительного очного отборочного тура будут опубликованы на сайте Центра «Сириус» не позднее 20 октября 2022 года.
3.6. Учащиеся, отказавшиеся от участия в образовательной программе, будут заменены на следующих за ними по рейтингу школьников. Внесение изменений в список участников программы происходит до 19 ноября 2022 года.
3.7. Полный список кандидатов на участие в образовательной программе, включающий результаты первого и второго этапов отбора, будет опубликован на официальном сайте Центра «Сириус» не позднее 2 ноября 2022 года.
4. Аннотация образовательной программы
Программа ориентирована на старших школьников, увлекающихся олимпиадным программированием, в том числе имеющих уверенные знания языка программирования Python, а также алгоритмов и структур данных.
В рамках интенсива по олимпиадному программированию участники программы распределяются на две группы по уровню знаний, для которых предусмотрена разная образовательная программа.
В рамках проектной части участники программы распределяются на команды для работы над проектами. У каждой команды будет куратор-аналитик или разработчик-исследователь с опытом. Куратор ставит задачу команде, помогает распределять роли и декомпозировать на подзадачи. В процессе работы отвечает на вопросы, поддерживает в сложные моменты и делает ревью кода. В конце программы на защите проектов команды презентуют полученные итоговые результаты друг другу и всем желающим. Выполненные проекты можно будет использовать для участия в конкурсе научно-технологических проектов «Большие вызовы».
Обучение практическим навыкам будет происходить непосредственно в работе команды над проектом. В течение программы будет проведено несколько обзорных технологических лекций от экспертов в конкретной области с целью дать школьникам представление о профессиях и трендах в индустрии.
5. Финансирование образовательной программы
5.1. Оплата проезда, пребывания и питания школьников, участников Образовательной программы, осуществляется за счет средств Образовательного фонда «Талант и успех».