help@sochisirius.ru
1-24 декабря 2019

Образовательная программа «Алгоритмы и анализ данных»

Прием заявок для участия в конкурсном отборе был открыт до 10 октября 2019 года.
К участию в образовательной программе допускались только зарегистрировавшиеся школьники.

По вопросам участия в программе просим обращаться по адресу nauka@sochisirius.ru.

О программе

Программа была ориентирована на старших школьников, увлекающихся олимпиадным программированием, в том числе имеющих уверенные знания языка программирования Python, С++, а также алгоритмов и структур данных.

В рамках интенсива по олимпиадному программированию участники программы были распределены на две учебные группы по уровню знаний, для которых была предусмотрена разная содержательная часть программы. При разбиении учитывался уровень, показанный при отборе на программу, и результаты проведенного в первый учебный день распределительного контеста (1 часть, 2 часть).

В течение смены прошли обзорные технологические лекции от специалистов компании «Яндекс» — экспертов в конкретной области, с целью дать школьникам представление о профессиях и трендах в индустрии: лекции директора по маркетингу сервисов Андрея Себранта и директора по распространению технологий Григория Бакунова (лекция «Как компьютерные игры стимулировали развитие компьютеров»).

Материалы программы

1 учебная группа

Основу программы составили продвинутые алгоритмы и структуры данных, которые используются как в реальных задачах, так и на соревнованиях всероссийского уровня, а также развитие культуры написания кода, поиска и отлаживания ошибок.

STL
Контест на составление тестов
Дерево отрезков
LCA
Декартово дерево
Динамика по подстрокам и подмножествам
Оптимизации динамики
DFS++
Геометрия
Хеши
Морской бой

2 учебная группа

Основу программы составили базовые алгоритмы и структуры данных, особенное внимание уделялось глубокому усвоению материала, а также выработке способности применять эти алгоритмы и структуры данных на практике. Для закрепления материала использовались олимпиадные задачи, в которых требовались алгоритмы и приемы, рассказанные на теоретических занятиях.

STL
Линейные алгоритмы
Линейные алгоритмы 2
Сканирующая прямая, бинарный поиск, тернарный поиск
Перебор и комбинаторика
Динамическое программирование
DFS
Кратчайшие пути
Дерево отрезков
Геометрия
Хеши
Морской бой

Спецкурс

Помимо профильной программы слушатели могли записаться на спецкурсы: Ильи Кацева «Введение в теорию вероятностей и принятие решений» и Ильи Шишкова «Мастер жонглирования итераторами» (использование итераторов в стандартной библиотеке C++). 

Линейные алгоритмы
Бинарный поиск

В рамках второй проектной части программы участники распределялись на команды для работы над проектами. У каждой команды был куратор: преподаватель-аналитик или разработчик-исследователь с опытом. Обучение практическим навыкам проходило непосредственно в работе команды над проектом.

Идеи проектов, цели и инструменты работы

Описание проектов

Отзывы
Кураторы: Адель Валиуллин, Владимир Цветков 

Пользователи самых разных сервисов пишут огромное количество отзывов каждый день — это могут быть отзывы на рестораны, отели, банковские услуги и т.д. Из-за большого объёма потока эти отзывы невозможно обрабатывать вручную, но при этом важно не упустить самые важные или самые негативные, поскольку их несвоевременная обработка может привести к репутационным потерям. Проект направлен на работу с большой базой отзывов на рестораны. Участники научились применять машинное обучение для построения классификаторов текстов, автоматически находить самые важные слова и словосочетания, интерпретировать эти модели и оборачивать в удобный веб-интерфейс.

Генерация постеров с помощью моделей
Куратор: Максим Артемьев 

Генерация объектов из того же распределения, что и обучающая выборка, сейчас находится среди наиболее интересных исследовательских задач. Сейчас разрабатываются новые подходы для генерации реалистичных текстов, изображений и звуковых сигналов, имитирующих заданные реальные данные. Одним из подходов к этой задачи являются авторегрессионные нейросетевые модели (например, PixelCNN), которые в явном виде порождают, к примеру, новое изображение последовательно по пикселям. В данном проекте участники работали с набором из 40 тысяч постеров к фильмами, и пробовали генерировать новые постеры с помощью современных подходов.

Распознавание рукописного текста
Куратор: Юля Карамнова

Задача проекта состоит в изучении современных подходов к классификации изображений и применении этих подходов к задаче распознавания рукописных цифр с фотографий. Участники разбирались со свёрточными нейронными сетями, методами расширения выборки, а также учились оборачивать готовую модель машинного обучения в веб-интерфейс.

Поиск в миниатюре
Куратор: Анатолий Бардуков

Поисковые сервисы — это сложные системы, которые сочетают в себе эффективные алгоритмы, промышленную разработку и методы машинного обучения. В данном проекте слушатели разрабатывали свою поисковую систему на небольшом корпусе текстов и обучали градиентный бустинг, который позволилет повысить релевантность выдачи.

Компьютерное зрение
Куратор: Сергей Силаев 

Современные нейросетевые методы позволяют не только распознавать объекты с высоким качеством, но и генерировать реалистичные новые изображения из заданного распределения. В данном проекте слушатели познакомились со StyleGAN — одной из самых успешных на сегодняшний день архитектурой для стилизации изображений, разбирались с практическими особенностями их использования.

Трехмерная упаковка
Куратор: Глеб Евстропов

На практике часто возникают задачи, для которых неизвестен полиномиальный алгоритм решения, но при этом требуется уметь строить приемлемое решение за адекватное время. В этом случае применяются эвристические методы для сокращения перебора. Данная задача является ровно таким примером. Слушатели искали оптимальную раскладку объектов по контейнерам. В ходе проекта они научились как методам дискретной оптимизации, так и способам визуализации результатов.

Introduction to Reinforcement Learning
Кураторы: Даниил Бурлаков, Марат Ахматнуров

Обучение с подкреплением — современное направление, которое позволяет строить модели, взаимодействующие со средой и обучающиеся по итогам обратной связи. С его помощью удаётся научить компьютер играть в сложные игры или, например, быстро подстраиваться под действия пользователей в рекомендательных сервисах. В данном проекте участники познакомились с математикой, которая лежит в основе обучения с подкреплением, и попробовали применить его к Pac-Man и другим играм.

Классификация фотографий
Куратор: Полина Полунина

При загрузке фотографий во внутренние системы важно следить, чтобы сотрудники не загружали что-то постороннее — например, фото своих домашних животных. Для автоматизации контроля можно построить модель с помощью машинного обучения, которая будет отличать фотографии людей от всего остального. В данном проекте участники изучили современные архитектуры для классификации изображений и научились ускорять их для подготовки к внедрению.

Neural Machine Translation
Куратор: Алексей Иванов

Современные нейронные сети позволяют переводить тексты между языками с достаточно высоким качеством. В данном проекте участники изучили подходы к переводу на основе нейросетей с механизмом внимания, разбирались с доступными обучающими данными для таких моделей, обучали их, и исследовали существующие недостатки подхода.

Классификация котиков и песиков
Кураторы: Максим Новиков, Иван Дёгтев

Одной из нетривиальных задач компьютерного зрения является сегментация изображения. Для её решения в конкретном случае требуются большие объёмы размеченных данных, а также применение сложных нейросетевых архитектур. В данном проекте участники научились собирать разметку с помощью краудсорсинговой платформы Яндекс.Толока и изучали современные модели для сегментации.

Задачи синхронизации в распределенных системах
Куратор: Иван Пузыревский

В данном проекте участники занимались имплементацией простой версии текстового редактора с возможностью совместного редактирования. В процессе они освоили основы отказоустойчивых распределённых систем и алгоритмов синхронизации, научились совместной разработке программных продуктов и основам веб-разработки.

Распознавание поз в буквы
Кураторы: Лейла Хатбуллина, Владимир Серов

Задача проекта состоит в создании системы, которая может по видео определять последовательость поз, которые занимает человек, и переводить их в текст по заранее заданному коду. Участники освоили нейросетевые методы распознавания, научились создавать веб-приложения, а также изучили основы обработки видеопотоков

Участники и порядок отбора

Результаты оценивания академических достижений
Результаты дистанционного тура
Результаты очного отборочного тура

К участию в конкурсном отборе приглашаются школьники 9-10 классов, являющиеся гражданами России.

1. В рамках конкурсного отбора без дополнительных испытаний на программу приглашаются победители и призеры заключительных этапов олимпиад 2018-2019 учебного года за 8-10 классы, но не более 60% участников:
• Всероссийская олимпиада школьников,
 Открытая олимпиада школьников по программированию,
 Московская олимпиада школьников,
 Межрегиональная олимпиада школьников «Высшая проба»,
 Олимпиада школьников «Ломоносов».

Внутри данной группы участники отбора ранжируются в зависимости от конкретной олимпиады (чем выше олимпиада в списке, тем более высокий приоритет она имеет) и полученных на ней баллов. 

Порядок ранжирования следующий: 
 

Порядок
приоритета
Название олимпиады  Рейтинг
1 Всероссийская олимпиада школьников Победители
2 Открытая олимпиада школьников по программированию Победители
3 Всероссийская олимпиада школьников Призеры
4 Открытая олимпиада школьников по программированию Призеры
5 Московская олимпиада школьников Победители
6 Межрегиональная олимпиада школьников «Высшая проба» Победители
7 Олимпиада школьников «Ломоносов» Победители
8 Московская олимпиада школьников Призеры
9 Межрегиональная олимпиада школьников «Высшая проба» Призеры
10 Олимпиада школьников «Ломоносов» Призеры

В случае наличия нескольких достижений из перечисленного списка, участник проходит по достижению, которое имеет наиболее высокий приоритет согласно таблице выше. В случае нехватки мест участники одной категории ранжируются по баллам на олимпиаде.

В случае отказа приглашенных школьников из Москвы и Санкт-Петербурга их место передается участникам конкурсного отбора не предусматривающего вступительные испытания из аналогичных субъектов, имеющих наиболее высокий приоритет. Дополнительные испытания в Москве и Санкт-Петербурге не проводятся.

Список кандидатов на участие в образовательной программе без дополнительных вступительных испытаний будет опубликован на официальном сайте Центра «Сириус» не позднее 13 октября 2019.

2. Конкурсный отбор с дополнительными испытаниями (24 участника) осуществляется на основании результатов двух этапов:
• 1 этап — прохождение по результатам решения задач в соревновании на платформе Яндекс.Контест.
• 2 этап — прохождение очного тура в регионах (регламент очного тура).

Участник не может участвовать во втором этапе, если не прошёл первый.  

Для участия в конкурсном отборе по результатам вступительных испытаний необходимо:
пройти первый (заочный) этап конкурсного отбора в период с 14 по 15 октября 2019 года.
пройти второй (очный) этап отбора в своем регионе 26 октября 2019.

Список кандидатов на участие в образовательной программе по результатам первого этапа отбора будет опубликован на официальном сайте Центра «Сириус» не позднее 20 октября 2019 года.

Полный список кандидатов на участие в образовательной программе, включающий результаты первого и второго отбора, будет опубликован на официальном сайте Центра «Сириус» не позднее 31 октября 2019 года.

Руководители

Соколов
Евгений Андреевич

Доцент, руководитель департамента больших данных и информационного поиска факультета компьютерных наук НИУ ВШЭ, куратор академических программ Яндекса

Густокашин
Михаил Сергеевич

Куратор академических программ Яндекса, директор центра студенческих олимпиад факультета компьютерных наук Высшей школы экономики, председатель методической комиссии Московской олимпиады школьников по информатике

Евстропов
Глеб Олегович

Руководитель службы объектного ответа и подсказок компании Яндекс, член жюри Всероссийской олимпиады школьников по информатике, руководитель научного комитета Открытой олимпиады школьников по программированию, председатель жюри московского четвертьфинала ICPC

Преподаватели

Анопренко
Михаил Валентинович

Студент факультета компьютерных наук Высшей школы экономики, преподаватель Летней компьютерной школы, победитель Всероссийской олимпиады школьников по информатике

Артемьев
Максим Радикович

Исследователь в лаборатории методов анализа больших данных LAMBDA, преподаватель НИУ ВШЭ

Ахматнуров
Марат Фаатович

Разработчик рекомендательных систем медиасервисов Яндекса

Бабушкин
Валерий Валерьевич

Директор по моделированию и анализу данных в Х5 Retail Group, руководитель группы аналитики в Яндексе, преподаватель факультета компьютерных наук Высшей школы экономики

Бардуков
Анатолий Андреевич

Выпускник факультета компьютерных наук НИУ ВШЭ по специальности «Распределенные системы», сотрудник отдела поиска по картинкам в Яндексе (занимается связанными картинками)

Бурлаков
Даниил Сергеевич

Руководитель группы разработки рекомендаций медиасервисов Яндекса, кандидат физико-математических наук

Валиуллин
Адель Марсович

Руководитель Центра технологий искусственного интеллекта Газпромбанка, приглашенный преподаватель факультета компьютерных наук Высшей школы экономики, старший преподаватель Московского государственного технического университета имени Н.Э.Баумана, победитель и призер различных российских и международных хакатонов и соревнований по машинному обучению, входит в топ-100 специалистов по машинному обучению международного рейтинга Kaggle

Дёгтев
Иван Сергеевич

Руководитель группы аналитики точек роста Яндекс Поиска

Кацев
Илья Владимирович

Ph.D. (доктор философии) в VU University Amsterdam, научный сотрудник Санкт-Петербургского экономико-математического института РАН, руководитель группы анализа данных в Яндексе

Кучеренко
Демид Сергеевич

Заместитель директора Физтех-школы прикладной математики и информатики МФТИ по олимпиадному программированию, главный тренер сборной Челябинской области по подготовке к Всероссийской олимпиаде школьников по информатике, призер ВсОШ по информатике и студенческих соревнований по программированию

Новиков
Максим Евгеньевич

Аналитик сервиса Яндекс.Картинки

Полунина
Полина Алексеевна

Преподаватель факультета компьютерных наук НИУ ВШЭ, лид Data Science направлений HR, финансы и видео-аналитика в М.Видео и Эльдорадо, победитель и призер международных соревнований по машинному обучению, исследователь в Институте физики Земли РАН

Пузыревский
Иван Витальевич

Руководитель инфраструктурных сервисов (IaaS) в Яндекс.Облаке

Романов
Владимир Олегович

Студент НИУ ВШЭ, золотой медалист Международной олимпиады школьников по информатике (2017, 2018, 2019)

Серов
Владимир Алексеевич

Исследователь в лаборатории методов анализа больших данных LAMBDA, ВШЭ

Хатбуллина
Лейла Равилевна

Исследователь в лаборатории методов анализа больших данных LAMBDA, преподаватель НИУ ВШЭ, CS центра

Чунаев
Егор Юрьевич

Разработчик Яндекса, призер заключительного этапа ВсОШ по информатике в 2015 году, победитель — в 2016

Шаграев
Алексей Галимович

Руководитель службы свеже-социального поиска в Яндексе (занимается поисковыми подсказками, поиском по свежим документам и разнообразием поисковой выдачи), кандидат технических наук

Шишков
Илья Иванович

Соавтор онлайн-специализации «Пояса по С++» на Coursera, старший разработчик команды мобильного Яндекс.Браузера, участник финалов ACM ICPC (2007, 2008)

Положение о программе

Положение образовательной программы «Алгоритмы и анализ данных»
Образовательного центра «Сириус»

1. Общие положения

1.1. Настоящее Положение определяет порядок организации и проведения образовательной программы «Алгоритмы и анализ данных» Образовательного центра «Сириус» (далее – образовательная программа), ее методическое и финансовое обеспечение.

1.2. Образовательная программа «Алгоритмы и анализ данных» проводится в Образовательном центре «Сириус» (Образовательный Фонд «Талант и успех») с 1 по 24 декабря 2019 года.

1.3. В образовательной программе могут принять участие школьники 9-10 классов из образовательных организаций, реализующих программы общего и дополнительного образования, всех регионов Российской Федерации, успешно прошедшие конкурсный отбор (см. раздел 3).

1.4. К участию в образовательной программе допускаются школьники, являющиеся гражданами Российской Федерации.

1.5. Персональный состав участников образовательной программы утверждается Экспертным советом Образовательного Фонда «Талант и успех».

1.6. Общее количество участников – не более 50 человек.

1.7. Научно-методическое и кадровое сопровождение образовательной программы осуществляется сотрудниками компании Яндекс и преподавателями и научными сотрудниками университетов в РФ и Беларуси. 

1.8. В связи с целостностью и содержательной логикой образовательной программы, интенсивным режимом занятий и объемом академической нагрузки, рассчитанной на весь период пребывания обучающихся в Образовательном центре «Сириус», не допускается участие школьников в отдельных мероприятиях или части образовательной программы: исключены заезды и выезды школьников вне сроков, установленных Экспертным советом Образовательного Фонда «Талант и успех».

1.9. В случае нарушений правил пребывания в Образовательном центре «Сириус» или требований настоящего Положения решением Координационного совета участник образовательной программы может быть отчислен с образовательной программы.

2. Цели и задачи образовате­­льной программы

2.1. Образовательная программа ориентирована на старшеклассников, за исключением учащихся 11-х классов, и нацелена на получение опыта решения практических задач анализа данных и моделирования, близких к реальным, развитие логического и творческого мышления в процессе работы, обретение участниками устойчивых навыков решения олимпиадных задач по информатике, а также навыков работы в команде.

2.2. Задачи образовательной программы:
- Обретение участниками навыков промышленного программирования;
- Знакомство участников с основами анализа данных и машинного обучения;
- Получение участниками проектного опыта в сфере машинного обучения, разработка прототипа для решения реальной задачи;
- Подготовка к уровневым олимпиадам по информатике, в том числе ко Всероссийской олимпиаде по информатике;
- Освоение участниками социальных навыков, необходимых для работы в проекте (Soft Skills, менеджмент продукта и др.);
- Развитие практико-ориентированного мышления и умения работать в коллективе в процессе выполнения реальных задач;
- Развитие умения самостоятельно ставить перед собой задачи и решать их;
- Развитие алгоритмического и аналитического мышления, а также творческих способностей.

3. Порядок отбора участников образовательной программы

3.1. Отбор участников образовательной программы осуществляется Координационным советом, формируемым руководителем Образовательного Фонда «Талант и успех», на основании требований, изложенных в настоящем Положении, а также общих критериев отбора в Образовательный центр «Сириус» (направление «Наука»).

3.2. К участию в конкурсном отборе приглашаются школьники 9-10 классов, являющиеся гражданами России.

3.3. Для участия в конкурсном отборе школьнику необходимо подать заявку на официальном сайте Образовательного центра «Сириус».

3.4. В рамках конкурсного отбора без дополнительных испытаний на программу приглашаются победители и призеры заключительных этапов олимпиад по информатике 2018-2019 учебного года за 8-10 классы, но не более 60% участников:

- Всероссийская олимпиада школьников;
- Открытая олимпиада школьников по программированию;
- Московская олимпиада школьников;
- Межрегиональная олимпиада школьников «Высшая проба»;
- Олимпиада школьников «Ломоносов».

3.5 Внутри данной группы (п. 3.4)  участники отбора ранжируются в зависимости от  конкретной олимпиады (чем выше олимпиада в списке, тем более высокий приоритет она имеет) и полученных на ней баллов. 

Порядок ранжирования следующий:

Порядок
приоритета
Название олимпиады  Рейтинг
1 Всероссийская олимпиада школьников Победители
2 Открытая олимпиада школьников по программированию Победители
3 Всероссийская олимпиада школьников Призеры
4 Открытая олимпиада школьников по программированию Призеры
5 Московская олимпиада школьников Победители
6 Межрегиональная олимпиада школьников «Высшая проба» Победители
7 Олимпиада школьников «Ломоносов» Победители
8 Московская олимпиада школьников Призеры
9 Межрегиональная олимпиада школьников «Высшая проба» Призеры
10 Олимпиада школьников «Ломоносов» Призеры

Сведения для оценки академических достижений формируются автоматически на основании данных из Государственного информационного ресурса о детях, проявивших выдающиеся способности.
Прикладывать к заявке подтверждающие документы не требуется.

3.5.1 В случае наличия нескольких достижений из перечисленного списка, участник проходит по достижению, которое имеет наиболее высокий приоритет согласно таблице выше.

3.5.2 В случае нехватки мест участники одной категории ранжируются по баллам на олимпиаде.

3.5.3 В случае отказа приглашенных школьников, имеющих более высокий рейтинг, их место передается участникам конкурсного отбора, набравших наиболее высокий проходной балл в рамках отбора, предусматривающего вступительные испытания. 

3.5.4 В случае отказа приглашенных школьников из Москвы и Санкт-Петербурга их место передается участникам конкурсного отбора, не предусматривающего вступительные испытания из аналогичных субъектов, имеющих наиболее высокий приоритет. Дополнительные испытания в Москве не проводятся.

3.5.5 Для участия в конкурсном отборе без дополнительных испытаний по результатам олимпиад, необходимо в срок до 10 октября 2019 года подать заявку на официальном сайте Центра «Сириус»;

3.5.6 Список кандидатов на участие в образовательной программе без дополнительных вступительных испытаний будет опубликован на официальном сайте Центра «Сириус» не позднее 13 октября 2019.

3.6 Конкурсный отбор с дополнительными испытаниями (24 участника) осуществляется на основании результатов двух этапов:

1 этап - прохождение по результатам решения задач в соревновании на платформе Яндекс.Контест.

2 этап - прохождение очного тура в регионах.

Участник не может участвовать во втором этапе, если не прошёл в первом.  

3.7. Сроки проведения этапов дополнительных испытаний и публикации списков:

3.7.1 Для участия в конкурсном отборе по результатам вступительных испытаний необходимо:
- в срок до 10 октября 2019 года подать заявку на официальном сайте Центра «Сириус»;
- пройти первый (заочный) этап конкурсного отбора в период с 14 по 15 октября 2019 года.
- пройти второй (очный) этап отбора в своем регионе 26 октября 2019.

3.7.2 Список кандидатов на участие в образовательной программе по результатам первого этапа отбора будет опубликован на официальном сайте Центра «Сириус» не позднее 20 октября 2019 года.

3.7.3 Полный список кандидатов на участие в образовательной программе, включающий результаты первого и второго отбора, будет опубликован на официальном сайте Центра «Сириус» не позднее 31 октября 2019 года.

3.8 К участию в образовательной программе могут быть приглашены не более 10% участников из одного субъекта Российской Федерации. 

4. Аннотация образовательной программы

Программа ориентирована на старших школьников, увлекающихся олимпиадным программированием, в том числе имеющих уверенные знания языка программирования Python, а также алгоритмов и структур данных.

В рамках интенсива по олимпиадному программированию участники программы распределяются на две группы по уровню знаний, для которых предусмотрена разная образовательная программа.

В рамках проектной части участники программы распределяются на команды для работы над проектами. У каждой команды будет куратор – аналитик или разработчик-исследователь с опытом. Куратор ставит задачу команде, помогает распределять роли и декомпозировать на подзадачи. В процессе работы отвечает на вопросы, поддерживает в сложные моменты и делает ревью кода. В конце смены на защите проектов команды презентуют полученные итоговые результаты друг другу и всем желающим. Выполненные проекты можно будет использовать для участия в конкурсном отборе на образовательную программу “Большие вызовы” или проектную смену в июле 2020 г.

Обучение практическим навыкам будет происходить непосредственно в работе команды над проектом. В течение смены будет проведено несколько обзорных технологических лекций от экспертов в конкретной области, с целью дать школьникам представление о профессиях и трендах в индустрии.

5. Финансирование образовательной программы

5.1. Оплата проезда, пребывания и питания школьников - участников образовательной программы - осуществляется за счет средств Образовательного Фонда «Талант и успех».

 

Подать заявку
© 2015–2024 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!