help@sochisirius.ru
4-16 ноября 2019

Анализ данных в социальных науках с помощью языка R

Программа "Анализ данных в социальных науках с помощью языка R" ориентирована на студентов магистратуры, обладающих базовой статистической подготовкой и представлением об использовании математических методов в социальных науках (психологии, лингвистике и др.), но не имеющих опыта работы в статистическом языке программирования R.

Участники программы научатся обрабатывать данные исследований в соответствии с критериями открытой науки: воспроизводимости, доступности, открытости; писать гибкий и воспроизводимый код в R, включающий все этапы работы с данными, от импорта или автоматизированного сбора до оформления графиков, таблиц и отрывков статей.

Сроки проведения программы:  с 4 по 16 ноября 2019 года (г. Сочи).

Список обучающихся, приглашенных на обучение по итогам конкурсного отбора 

Участники и порядок отбора

На обучение по программе образовательного модуля приглашаются студенты российских вузов, преимущественно, обучающиеся магистратуры.

Для освоения содержания модуля студенты должны владеть следующими знаниями и компетенциями:

  • базовые навыки работы с персональным компьютером;
  • навыки статистического анализа данных;
  • знание английского языка, достаточное для чтения учебной литературы и документации.

Группа формируется на конкурсной основе. Конкурсный отбор проводится по результатам решения тестовых заданий. Необходимо решить верно не менее 80% заданий теста.

Общее число обучающихся программы – до 30 чел.

Для участия в конкурсном отборе необходимо до  14 октября 2019 года (включительно) пройти регистрацию на нашем сайте, к заявке прикрепить мотивационное письмо и выполнить задания теста (ссылка на прохождение тестирования и вопросы к мотивационному письму будут направлены на адрес электронной почты, указанный в заявке).

Результаты отбора будут опубликованы до 20 октября 2019 года на данном сайте.

Критерии оценки заявок на программу:

1. Выполнение общих (технических) требований к заявке - прохождение регистрации на сайте Образовательного центра «Сириус» и предоставление мотивационного письма.

2. Результат прохождения отборочных испытаний. Выстраивается рейтинг участников отбора по итогам выполнения теста, 30 участников, продемонстрировавшие наилучшие результаты и выполнившие общие (технические) требования к заявке, приглашаются на обучение по программе.

Спорные вопросы решаются на уровне руководителя программы.

Руководитель, авторы (разработчики) программы

Руководитель программы:

Юлия Владимировна Ковас, Профессор генетики и психологии Голдсмитс, Университет Лондона (Великобритания): http://www.goldsmiths.ac.uk/psychology/staff/kovas

Директор Международной лаборатории междисциплинарных исследований индивидуальных различий в обучении (InLab): www.inlab.co.uk

Научный руководитель лаборатории «Когнитивные и междисциплинарные исследования» Университета «Сириус»

Профессор Томского государственного университета: http://www.tsu.ru/

Заведующая лабораторией когнитивных исследований и психогенетики ТГУ: http://cogbglab.tsu.ru/

Содиректор Международного центра междисциплинарных исследований развития человека ТГУ: http://en.science.tsu.ru/centers/research-in-human-development/  

The Accessible Genetics Consortium: http://www.tagc.world/

Авторы программы:

Александр Фенин, менеджер продукта в Яндексе, основатель мастерской "Анализ данных в социальных и гуманитарных науках" Летней школы, имеет опыт научной работы в лаборатории возрастной психогенетики ПИ РАО

Иван Поздняков, стажёр-исследователь Института когнитивных нейронаук, Центра нейроэкономики и когнитивных исследований, автор и преподаватель курсов по анализу данных в R

Владимир Волохонский, аналитик в JetBrains, преподаватель мастерской “Анализ данных в социальных и гуманитарных науках” Летней школы

Лиханов Максим Владимирович, кандидат филологических наук, старший научный сотрудник, Лаборатория "Когнитивные и междисциплинарные исследования" Образовательный Фонд "Талант и успех"

 

Программа модуля

Аннотация

Программа «Анализ данных в социальных науках с помощью языка R» ориентирована на студентов магистратуры, обладающих базовой статистической подготовкой и представлением об использовании математических методов в социальных науках (психологии, лингвистике и др.), но не имеющих опыта программирования на статистическом языке R.

Обучающиеся программы научатся обрабатывать данные исследований в соответствии с принципами анализа данных, критериями открытой науки: воспроизводимости, доступности, открытости; писать гибкий и воспроизводимый код в R, включающий все этапы работы с данными, от импорта или автоматизированного сбора до оформления графиков, таблиц и отрывков статей.

Навыки, сформированные в ходе овладения программным материалом, позволят студентам более осознанно и внимательно подходить к подготовке и обработке данных исследований, вооружат их мощным и современным инструментом, широко используемым и принятым в международной академической науке.

Цель модуля

Целью модуля является знакомство студентов с гибким, современным и общепринятым в международной академической психологической среде языком программирования R; формирование у обучающихся практических навыков, необходимых для применения методов обработки, визуализации и анализа качественных и количественных данных в R при решении задач с использованием статистических методов в психологическом исследовании.

Планируемые результаты обучения

Студенты, освоившие модуль, будут готовы к решению следующих задач:

  • контролировать и гибко настраивать процесс обработки данных исследования;
  • импортировать, описывать, обрабатывать, визуализировать и подготавливать к публикации данные с использованием языка R;
  • декомпозировать процесс обработки данных, дробить на задачи, выполнять их лично или распределять между членами команды, согласовывая необходимые для командной работы форматы.

Форма аттестации. Структура и критерии оценки. Оценочные средства

Аттестация по модулю проводится в форме решения задач по пройденным темам, которые выполняются на компьютере в R (RStudio).

Студентам предстоит выполнить 5 аналитических и визуализационных задач по реальным необработанным датасетам, предоставленным лабораторией InLab Goldsmith’s College, лабораторией когнитивных и междисциплинарных исследований образовательного центра "Сириус", ПИ РАО и других партнеров.

Работа студентов будет оцениваться по следующим критериям:

  • соответствие решения поставленной задаче, работоспособность и корректность кода программы (код должен запускаться без ошибок и выдавать ожидаемый результат), использование рассмотренных в курсе средств и методов;
  • качество выполнения задачи (наличие требуемых заголовков, подписей и легенд к графикам, комментариев к коду);

Каждый критерий оценивается в один балл. Правильно решенная задача – в два балла.

Задачи, для решения которых предоставлен неработающий код (код, который невозможно запустить из-за наличия грубых ошибок/опечаток), не засчитываются, даже если при этом зафиксирован верный результат.

Для получения зачета студенту необходимо набрать десять баллов.

Исследовательские / научно-технологические задачи, решаемые в рамках модуля

В рамках модуля планируется обрабатывать данные, собранные в текущих научных проектах, таким образом включая студентов в актуальные научные исследования и предлагая им реальные задачи. Студенты, заинтересованные в совместной работе, могут стать членами исследовательской команды проекта и выступить в том числе соавторами будущих публикаций. 

Предполагаемый объем – 3 з.е. (108 часов)

Тематическое содержание модуля

  1. Введение в R и интерфейс R Studio.
  2. Виды векторов и работа с векторами в R.
  3. Фреймворк data.table, индексация, аггрегация и подготовка данных с его помощью. Подсчёт и визуализация корреляций.
  4. Пакет ggplot2 для визуализаций графиков различного уровня.
  5. Создание и применение циклов и функций.
  6. Применение, визуализация и интерпретация GLM-методов в R: линейная регрессия, ANOVA.
  7. Оформление грамотных отчётов и интерактивных графиков с помощью RMarkdown.
  8. Применение, визуализация и интерпретация факторного анализа.
  9. Подсчёт статистической мощности, планирование и проведение воспроизводимого анализа данных с помощью R. Реальные кейсы и вызовы в обработке данных.
  10. Работа со строками и текстом. Дистанция строк, fuzzy matching, регулярные выражения.

Партнеры

Университеты-партнеры

 

Картинки по запросу логотип тгу

Баланев Дмитрий Юрьевич, и.о. декана факультета психологии ТГУ, кандидат психологических наук, доцент (balanevd@gmail.com)

Богданова Ольга Евгеньевна, доцент, кандидат педагогических наук ТГУ (coglabtsu@mail.ru)

Аббакумов Дмитрий Федорович, PhD in Education, руководитель Центра психометрических исследований в онлайн-образовании НИУ ВШЭ (abbakumovdf@gmail.com)

Научные партнеры

Картинки по запросу психологический институт

Малых Сергей Борисович, доктор психологических наук, профессор (malykhsb@mail.ru)

 

Условия участия

Для обучающихся, прошедших конкурсный отбор и приглашенных на программу, Фонд «Талант и успех» обеспечивает проезд / перелет по территории РФ, проживание на базе объектов Фонда. Проездные документы приобретаются сотрудниками Фонда и направляются участнику не позднее чем за 2 дня до отправления.

Питание обучающиеся оплачивают самостоятельно.

При этом плата за обучение на программе не взимается.

Материалы для самостоятельного изучения

Основная учебная литература к содержанию модуля:

  • А. Б. Шипунов и др. Наглядная статистика. Используем R! М.: ДМК Пресс. 2017
  • N.J.Horton, K.Kleinman. Using R for Data Management, Statistical Analysis, and Graphics.CRC Press. 2010
  • A.Gohil. R Data Visualization Cookbook. Packt Publishing. 2015

Для подготовки к тесту  рекомендуется пройти курс “Основы статистики” Анатолия Карпова на Stepik - https://stepik.org/course/76/promo

 

Контакты

По вопросам участия в программе можно обращаться по адресам:

lihanov.mv@talantiuspeh.ru – вопросы по содержанию программы, включая выполнение отборочных заданий;

student@talantiuspeh.ru – организационные вопросы (приезд, размещение, отбор и участие в программе, предоставление документов и сведений для организации приезда и зачисления на программу).

Подать заявку
© 2015–2019 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!