help@sirius.online ВЕРСИЯ ДЛЯ СЛАБОВИДЯЩИХ
4-16 ноября 2019

Анализ данных в социальных науках с помощью языка R

Программа ориентирована на студентов магистратуры, обладающих базовой статистической подготовкой и представлением об использовании математических методов в социальных науках (психологии, лингвистике и др.), но не имеющих опыта работы в статистическом языке программирования R.

Участники программы научатся обрабатывать данные исследований в соответствии с критериями открытой науки (воспроизводимости, доступности, открытости), писать гибкий и воспроизводимый код в R, включающий все этапы работы с данными: от импорта или автоматизированного сбора до оформления графиков, таблиц и отрывков статей.

Список обучающихся, приглашенных на обучение по итогам конкурсного отбора 

 

 

По вопросам участия в программе можно обращаться по адресам:

student@talantiuspeh.ru – организационные вопросы
• lihanov.mv@talantiuspeh.ru – вопросы по содержанию программы, включая выполнение отборочных заданий

О программе

Программа «Анализ данных в социальных науках с помощью языка R» ориентирована на студентов магистратуры, обладающих базовой статистической подготовкой и представлением об использовании математических методов в социальных науках (психологии, лингвистике и др.), но не имеющих опыта программирования на статистическом языке R.

Обучающиеся программы научатся обрабатывать данные исследований в соответствии с принципами анализа данных, критериями открытой науки: воспроизводимости, доступности, открытости; писать гибкий и воспроизводимый код в R, включающий все этапы работы с данными, от импорта или автоматизированного сбора до оформления графиков, таблиц и отрывков статей.

Навыки, сформированные в ходе овладения программным материалом, позволят студентам более осознанно и внимательно подходить к подготовке и обработке данных исследований, вооружат их мощным и современным инструментом, широко используемым и принятым в международной академической науке.

Цель

Целью модуля является знакомство студентов с гибким, современным и общепринятым в международной академической психологической среде языком программирования R; формирование у обучающихся практических навыков, необходимых для применения методов обработки, визуализации и анализа качественных и количественных данных в R при решении задач с использованием статистических методов в психологическом исследовании.

Планируемые результаты обучения

Студенты, освоившие модуль, будут готовы к решению следующих задач:
 

  • контролировать и гибко настраивать процесс обработки данных исследования;
  • импортировать, описывать, обрабатывать, визуализировать и подготавливать к публикации данные с использованием языка R;
  • декомпозировать процесс обработки данных, дробить на задачи, выполнять их лично или распределять между членами команды, согласовывая необходимые для командной работы форматы.

Форма аттестации. Структура и критерии оценки. Оценочные средства

Аттестация по модулю проводится в форме решения задач по пройденным темам, которые выполняются на компьютере в R (RStudio).

Студентам предстоит выполнить 5 аналитических и визуализационных задач по реальным необработанным датасетам, предоставленным лабораторией InLab Goldsmith’s College, лабораторией когнитивных и междисциплинарных исследований образовательного центра "Сириус", ПИ РАО и других партнеров.

Работа студентов будет оцениваться по следующим критериям:
 

  • соответствие решения поставленной задаче, работоспособность и корректность кода программы (код должен запускаться без ошибок и выдавать ожидаемый результат), использование рассмотренных в курсе средств и методов;
  • качество выполнения задачи (наличие требуемых заголовков, подписей и легенд к графикам, комментариев к коду);

Каждый критерий оценивается в один балл. Правильно решенная задача – в два балла.

Задачи, для решения которых предоставлен неработающий код (код, который невозможно запустить из-за наличия грубых ошибок/опечаток), не засчитываются, даже если при этом зафиксирован верный результат.

Для получения зачета студенту необходимо набрать десять баллов.

Исследовательские / научно-технологические задачи, решаемые в рамках модуля

В рамках модуля планируется обрабатывать данные, собранные в текущих научных проектах, таким образом включая студентов в актуальные научные исследования и предлагая им реальные задачи. Студенты, заинтересованные в совместной работе, могут стать членами исследовательской команды проекта и выступить в том числе соавторами будущих публикаций. 

Предполагаемый объем – 3 з.е. (108 часов)

Тематическое содержание модуля
 

  1. Введение в R и интерфейс R Studio.
  2. Виды векторов и работа с векторами в R.
  3. Фреймворк data.table, индексация, аггрегация и подготовка данных с его помощью. Подсчёт и визуализация корреляций.
  4. Пакет ggplot2 для визуализаций графиков различного уровня.
  5. Создание и применение циклов и функций.
  6. Применение, визуализация и интерпретация GLM-методов в R: линейная регрессия, ANOVA.
  7. Оформление грамотных отчётов и интерактивных графиков с помощью RMarkdown.
  8. Применение, визуализация и интерпретация факторного анализа.
  9. Подсчёт статистической мощности, планирование и проведение воспроизводимого анализа данных с помощью R. Реальные кейсы и вызовы в обработке данных.
  10. Работа со строками и текстом. Дистанция строк, fuzzy matching, регулярные выражения.

Участники и порядок отбора

На обучение по программе образовательного модуля приглашаются студенты российских вузов, преимущественно, обучающиеся магистратуры.

Для освоения содержания модуля студенты должны владеть следующими знаниями и компетенциями:
 

  • базовые навыки работы с персональным компьютером;
  • навыки статистического анализа данных;
  • знание английского языка, достаточное для чтения учебной литературы и документации.

Группа формируется на конкурсной основе. Конкурсный отбор проводится по результатам решения тестовых заданий. Необходимо решить верно не менее 80% заданий теста.

Общее число обучающихся программы – до 30 чел.

Для участия в конкурсном отборе необходимо до  14 октября 2019 года (включительно) пройти регистрацию на нашем сайте, к заявке прикрепить мотивационное письмо и выполнить задания теста (ссылка на прохождение тестирования и вопросы к мотивационному письму будут направлены на адрес электронной почты, указанный в заявке).

Результаты отбора будут опубликованы до 20 октября 2019 года на данном сайте.

Критерии оценки заявок на программу

1. Выполнение общих (технических) требований к заявке - прохождение регистрации на сайте Образовательного центра «Сириус» и предоставление мотивационного письма.

2. Результат прохождения отборочных испытаний. Выстраивается рейтинг участников отбора по итогам выполнения теста, 30 участников, продемонстрировавшие наилучшие результаты и выполнившие общие (технические) требования к заявке, приглашаются на обучение по программе.

Спорные вопросы решаются на уровне руководителя программы.

Условия участия

Для обучающихся, прошедших конкурсный отбор и приглашенных на программу, Фонд «Талант и успех» обеспечивает проезд / перелет по территории РФ, проживание на базе объектов Фонда. Проездные документы приобретаются сотрудниками Фонда и направляются участнику не позднее чем за 2 дня до отправления.

Питание обучающиеся оплачивают самостоятельно.

При этом плата за обучение на программе не взимается.

Материалы для самостоятельного изучения

Основная учебная литература к содержанию модуля
 

  • А. Б. Шипунов и др. Наглядная статистика. Используем R! М.: ДМК Пресс. 2017
  • N.J.Horton, K.Kleinman. Using R for Data Management, Statistical Analysis, and Graphics.CRC Press. 2010
  • A.Gohil. R Data Visualization Cookbook. Packt Publishing. 2015

Для подготовки к тесту рекомендуется пройти курс «Основы статистики» Анатолия Карпова

 

Руководитель программы

Ковас
Юлия Владимировна

Директор Международной лаборатории междисциплинарных исследований индивидуальных различий в обучении (InLab), PhD, профессор генетики и психологии Университета Голдсмитс (Лондон, Великобритания), директор международного центра исследований развития человека, заведующая лабораторией когнитивных исследований и психогенетики, профессор Томского государственного университета, научный руководитель направления "Прикладная когнитивная психология и нейронаука", научный центр когнитивных исследований, НТУ "Сириус".

Авторы программы

Лиханов
Максим Владимирович

Старший научный сотрудник направления "Прикладная когнитивная психология и нейронаука", научный центр когнитивных исследований, НТУ "Сириус".

Волохонский
Владимир Львович

Аналитик JetBrains, преподаватель мастерской «Анализ данных в социальных и гуманитарных науках» Летней школы

Поздняков
Иван Сергеевич

Стажер-исследователь Института когнитивных нейронаук, Центра нейроэкономики и когнитивных исследований ВШЭ, автор и преподаватель курсов по анализу данных в R

Фенин
Александр

Менеджер продукта в Яндексе, основатель мастерской «Анализ данных в социальных и гуманитарных науках» Летней школы, имеет опыт научной работы в лаборатории возрастной психогенетики Психологического института Российской академии образования

Партнеры

Университеты-партнеры

 

Картинки по запросу логотип тгу

Баланев Дмитрий Юрьевич, и.о. декана факультета психологии ТГУ, кандидат психологических наук, доцент (balanevd@gmail.com)

Богданова Ольга Евгеньевна, доцент, кандидат педагогических наук ТГУ (coglabtsu@mail.ru)

Аббакумов Дмитрий Федорович, PhD in Education, руководитель Центра психометрических исследований в онлайн-образовании НИУ ВШЭ (abbakumovdf@gmail.com)

Научные партнеры

Картинки по запросу психологический институт

Малых Сергей Борисович, доктор психологических наук, профессор (malykhsb@mail.ru)

 

Подать заявку
© 2015–2025 Фонд «Талант и успех»
Нашли ошибку на сайте? Нажмите Ctrl(Cmd) + Enter. Спасибо!