В субботу, 22 февраля, завершилась школа-конференция Высшей школы экономики, Университета «Сириус» и Яндекса «Math of Machine Learning 2020». Ее участники – более 50 студентов, магистрантов и аспирантов – разбирались в математических аспектах машинного обучения. Мини-курсы по трем темам для участников провели ученые с мировым именем. Как такие мероприятия помогают расширять международное сотрудничество, почему ученые соглашаются выступать на площадках коллег и как математика делает искусственный интеллект безопаснее, рассказал организатор школы-конференции, заведующий лабораторией стохастических алгоритмов и анализа многомерных данных факультета компьютерных наук НИУ ВШЭ Алексей Наумов.
– Алексей Александрович, спасибо огромное, что согласились встретиться. Программа у конференции очень насыщенная, и на нашей площадке она проходит впервые. Это мероприятие ежегодное или школа-конференция дебютировала в «Сириусе»?
– Это не первая наша школа. Наша международная лаборатория создана в 2018 году, и мы ежегодно проводим два основных мероприятия –– конференция и школа для молодых ученых, которую уже два раза проводили в Москве. В этом году провели небольшой ребрендинг школы, изменили ее название – сделали его более точным относительно содержания, и организовали ее в «Сириусе». Удивительно, но в результате таких перемен количество заявок утроилось.
– Как устроено расписание на школе в этом году?
– Мы приглашаем реальных звезд из науки, которые читают мини-курсы по 4 часа – это введение в активно развивающуюся сейчас область исследований. Такой формат полезен не только студентам или аспирантам, но и ученым, потому что это отличный вариант погрузиться в новую научную область. Можно для этого штудировать научные статьи, но это сложнее. На нашем курсе ты слушаешь 4 часа эксперта, который реально сейчас этим занимается и дает тебе краткую выжимку всего самого актуального.
– На школе в этом году 3 мини-курса – по глубинному обучению, обучению с подкреплением и оптимальному транспорту. Это то, что нельзя узнать из интернет-поисковика?
– В интернете, пожалуй, можно взять все. Трендовые темы обычно держатся 3-4 года, ученые чувствуют, что именно в этой области возможен вскоре прорыв. Сейчас таким трендом является глубинное обучение – это многослойные нейронные сети. Алгоритмы глубинного обучения используются практически во всех умных устройствах, например, в смартфонах. Один из примеров – технология идентификации лица, позволяющая разблокировать ваш смартфон, когда вы смотрите на экран. Еще одна тема – обучение с подкреплением. Алгоритмы, основанные на обучении с подкреплением с легкостью обыгрывают человека в шахматы и другие игры.
– Как такие алгоритмы работают?
– Вот вы учитесь кататься на велосипеде, сделали что-то не так и упали, в голове возникла мысль «больше не надо так делать», попробовали еще раз, что-то стало получаться, вы запомнили и стали это повторять. Алгоритмы обучения с подкреплением работают так же, компьютер сам пытается обучаться. Третье направление – оптимальный транспорт массы.
– Это направление, наверное, менее на слуху, где его используют?
– Представьте, что вы ищете Ferrari красного цвета в желтом поле. Google выдает вам картинку – машина нужной марки посреди пшеничного поля и еще другие приближенные варианты. Как google понимает, что эти картинки похожи под ваш запрос? Он смотрит пиксели одного изображения и сравнивает с пикселями другой картинки. Когда мы отражаем одну картинку в другой – как понять, какое расстояние между ними, насколько они далеки? Методы оптимального транспорта и позволяют понять близость между объектами. Это так же работает и со словами, фразами.
– Математика машинного обучения в целом – тоже тренд?
– Некоторые специалисты занимаются чистой математикой. Много людей занимаются просто машинным обучением – разработать алгоритм, посмотреть, как он работает на каких-то примерах. В большинстве случаев за этими алгоритмами нет никакой математики, есть предположение, что это должно работать и это правильная идея, но математического обоснования нет. Как с физикой – есть ощущение, что это так, но почему это так – надо еще доказать. Мы пытаемся математически описать, какие у алгоритма статистические гарантии работы. Например, разрабатывают беспилотник и для его многочисленных алгоритмов должны быть статистические гарантии, что, например, с вероятностью 99,99...% он не собьет человека, а остановится в той или иной ситуации.
– То есть можно сказать, что математика машинного обучения делает искусственный интеллект надежнее?
– Вполне. Мы живем в случайном мире, но хотим понимать, насколько надежны в работе создаваемые нами механизмы, в том числе и искусственного интеллекта.
– Основная часть экспертов школы-конференции – иностранные ученые. Говорит ли это о том, что данная область в России еще не распространена?
– Для нас и правда это не особо активная область. Так получилось, что сейчас люди либо занимаются чистой математикой, либо сильно ушли в практическое приложение – именно машинное обучение. И мало кто занимается математической стороной этой области. При этом по миру это очень популярная тема. В Германии, Франции, Америке много известных профессоров, которые занимаются подобными вещами.
– Получается, школа популяризирует это направление в России?
– Именно так, одна из наших целей в том, чтобы эта наука была и у нас представлена. Кто-то из наших участников продолжит как ученый, кто-то пойдет в R&D центры ведущих высокотехнологичных компаний. Такие задачи требуют совершенно разной экспертизы – знания разных разделов и абстрактной математики, математической статистики, машинного обучения. Получается, наше направление находится на стыке разных дисциплин. И нужно чувствовать этот тренд, чтобы быть подкованным в разных темах. И это круто еще и потому, что требуются ребята из совершенно разных областей знаний.
– Сложно ли уговорить спикеров выступить на школе?
– Отказы случаются, но скорее из-за накладок, когда эксперта уже куда-то пригласили. У нас, к счастью, сложился крепкий костяк известных ученых. Например, научный руководитель нашей лаборатории, французский исследователь в области вычислительной статистики и машинного обучения Эрик Мулине. Когда известные коллеги из сообщества приглашают прочесть мини-курс – это акт доверия, возможность прорекламировать себя, и, может, привлечь учеников. Если кто-то после нашей школы захочет поехать учиться в аспирантуре у одного из приглашенных иностранных коллег – это хорошо. Главное, чтобы получив новый взгляд на вещи, люди возвращались и находили здесь себе последователей.
– Получается, что ваша лаборатория благодаря конференции расширяет вокруг себя сообщество потенциально заинтересованных молодых специалистов. На ваш взгляд, что помогает привлечь больше участников на такие мероприятия?
– Почти невозможно научить в университете тому, что происходит прямо сейчас, поэтому у студентов жажда делать и знать что-то новое и актуальное, за гранью базовых вещей. Действительно один из наших интересов в том, чтобы найти будущих студентов, аспирантов, вовлечь в нашу тему. Развитие науки – это история про развитие поколений. У нас в лаборатории работают уже известные ученые, но нам интересно, чтобы молодые поколения подрастали.