Пятый цикл состоит из двух частей. Первая часть подготовительная и включает три дополнительных задания. Вторая часть содержит лекцию, посвященную применению машинного обучения, и основную задачу на распознавание символов на разных изображениях.
Все циклы программы «Уроки настоящего» 2019/20 учебного года
Модуль «Уроки настоящего машинного обучения» посвящен применению машинного обучения в разных сферах, таких как беспилотный транспорт, медицина, банковское дело. Часто машинное обучение требуется для распознавания символов на картинках.
Один из важных процессов оптимизации и развития бизнес-структур, да и любых организаций в целом — замена монотонной бумажной работы. Там, где нужно обрабатывать анкеты, личные карточки пациентов, отчеты, заполненные вручную, данные документов на паспортном контроле и так далее, на помощь приходит mashing learning. Именно машинное обучение позволяет автоматизировать все эти действия. Чтобы автоматизировать данные процессы, можно воспользоваться одной из самых популярных систем для распознавания текста Tesseract. Она действует с 1985 года. Систему разработала компания HP, в 2005 году выложила ее в open sourсe, а с 2006 года систему начал поддерживать Google.
Лекцию «Машинное обучение: практическое применение» прочитал Виктор Игоревич Отлига, разработчик беспилотных автомобилей в компании «Яндекс», преподаватель факультета прикладной математики и информатики Белорусского государственного университета и Школы анализа данных в Минске.
Задача от лектора — старшего преподавателя факультета прикладной математики и информатики Белорусского государственного университета, куратора Школы анализа данных в Минске, тренера студентов и школьников на олимпиадах по программированию, Толстикова Алексея Александровича:
Составить программу по распознаванию символов на различных изображениях с помощью технологии машинного обучения при заданных условиях:
1. Определить, сколько раз встречается каждая из букв на изображении. Предложены три картинки:
1) буквы расположены в сетке и не повернуты
2) буквы расположены в сетке, но могут быть повернуты на произвольный угол
3) буквы расположены в случайных местах и даже могут перекрываться
2. Найти на изображении различные английские слова, если:
1) слова расположены только горизонтально и не пересекаются
2) слова расположены горизонтально и вертикально и не пересекаются
3) слова расположены под произвольным углом и могут пересекаться
3. Посчитать буквы и определить написанные на изображении слова при двух условиях:
1) одиночные буквы разного размера и разных шрифтов расположены на картинке и могут перекрываться
2) слова различного размера и разных шрифтов расположены на картинке и могут перекрываться
Машинное обучение. Вводная часть
Статья «Тезаурус: Машинное обучение» (источник: интернет-журнал «ПостНаука»)
Видеоролик «Что такое машинное обучение и примеры его использования в Яндексе» (источник: youtube-канал факультета компьютерных наук ВШЭ)
Видеоролик «Машинное обучение - Дмитрий Ветров» (источник: youtube-канал «ПостНауки»)
Применение машинного обучения
Видеоролик «Малый ШАД. Машинное обучение: задачи и модели - Виктор Кантор» (источник: youtube-канал «Для школьников» «Академии Яндекса»)
Видеосюжет «CatBoost — новый метод машинного обучения от Яндекса» (источник: youtube-канал «Яндекса»)
Видеоролик «Машинное обучение в задачах - Евгений Соколов» (источник: youtube-канал «Для школьников» «Академии Яндекса»)
Будущее машинного обучения
Статья «И еще раз учиться. Почему машинное обучение так популярно сейчас и что с ним будет дальше» (источник: информационное агентство ТАСС)
Видеоролик «Прекрасные и ужасные последствия самообучения компьютеров — Джереми Говард» (источник: youtube-канал Neutral Zone)
Видеосюжет «Как мы учим компьютеры понимать изображения - Фей-Фей Ли» (источник: youtube-канал Neutral Zone)
Разработчик беспилотных автомобилей в компании «Яндекс», преподаватель факультета прикладной математики и информатики Белорусского государственного университета и Школы анализа данных в Минске
Старший преподаватель факультета прикладной математики и информатики Белорусского государственного университета, тренер студентов и школьников на олимпиадах по программированию, куратор Школы анализа данных компании Яндекс (г. Минск)