В июле в рамках научно-исследовательского проекта «Предсказание структуры белка» школьники «Сириуса» создают алгоритм, который позволит предсказывать строение антител – специфичных белков организма, которые борются с инфекциями и патогенами. Препараты на основе искусственно созданных антител используются в терапии рака и аутоиммунных заболеваний, однако эти белки нельзя синтезировать наобум. Нужно сперва смоделировать их структуру, что до сих пор остается сложной задачей.
Антитела, или иммуноглобулины, — это белки плазмы крови, способные обезвреживать бактерии, вирусы и токсины, попадающие в организм. По своей форме антитела напоминают трилистник, на двух концах которого есть активные участки – специальные петли. Этими своеобразными лассо белки ловят агрессоров и нейтрализуют их.
В медицине используют способность антител связывать не только инородные компоненты, но и собственные клетки организма, которые по какой-то причине перестали выполнять свои функции. Например, некоторые антитела могут обнаруживать раковые клетки и сигнализировать иммунитету, что надо их уничтожить. На таком свойстве иммуноглобулинов основана таргетная, то есть прицельная, терапия рака. Но чтобы антитело распознало в опухоли врага, нужно специальным образом настроить молекулу белка: создать в ней активный участок, заточенный атаковать определенную мишень.
Обратные процессы происходят, когда у человека появляется аутоиммунное заболевание. Тогда клетки иммунной системы становятся слишком враждебными по отношению к здоровым тканям. Терапия антителами применяется и в этих случаях.
Алгоритм, создаваемый школьниками, позволит предсказывать у антител структуру активных участков, или петель. «Сами антитела очень похожи друг на друга, главное различие – как раз в петлях. Поэтому основную структуру мы можем моделировать достаточно хорошо, а вот с активными участками возникают проблемы. При изменении петель сильно меняется структура белка, готовых решений нет, новый кусочек приходится фолдировать с нуля», – говорит преподаватель направления «Большие данные» Ольга Большакова, сотрудница департамента вычислительной биологии BIOCAD.
Как и аналоги, новая программа будет оценивать потенциальную энергию предсказанной молекулы белка. Чем меньше эта энергия, тем более вероятно, что реальное соединение будет иметь такое пространственное строение. Но на этом сходство с существующими алгоритмами заканчивается. Исследователи планируют подбирать структуру белка другим, более точным методом.
Идея в том, чтобы случайным образом или по шаблонам генерировать много цепочек из аминокислот, а затем сгибать их, сворачивать при помощи алгоритма циклического координатного спуска. Цепочки пошагово сворачиваются таким образом, чтобы на последнем шаге сомкнуться в петлю. Потом каждую из этих петель примеряют к основной структуре антитела и выбирают ту петлю, с которой у него общая энергия молекулы минимальна. Такой белок уже можно синтезировать.
«Наш проект делится на несколько больших частей, – рассказывает его участница Людмила Скаковская из Омска. – Сперва мы собираем данные из Protein Data Bank (PDB). Это международная база, в которой собраны все известные структуры белков. Но эти данные сырые, поэтому мои коллеги обрабатывают их. После обработки мы получаем информацию о том, как именно расположены фрагменты белковой молекулы друг относительно друга, какие углы между ними, какие расстояния. Затем мы выделяем информацию о петлях и усредняем ее. Так находится базовая структура петли, определением которой я и занимаюсь».
Чтобы протестировать алгоритм, ребята также используют данные из дата-банка, сравнивая белки с родной петлей с теми, которым ее достроили.
После того, как программу протестируют на существующих структурах и убедятся в ее эффективности, алгоритм включат в веб-сервис для фолдинга (сворачивания) белков, который разрабатывает BIOCAD.
В компании уже создан веб-интерфейс, куда можно ввести последовательность аминокислот и на выходе получить трехмерную структуру белка. «То, что напишут ребята, мы обязательно встроим к себе, чтобы уточнить предсказание петель, – отмечает Ольга Большакова. – Мы знаем, как работает алгоритм координатного спуска, поэтому уверены, что он гарантированно поможет нам стать лучше. Сейчас наш сервис подбирает в базе наиболее похожий шаблон, но такого часто нет. Паттерн может отличаться от выбранной последовательности петли более, чем на 80%, это дает совсем не ту структуру, которая нужна. Проект ребят – это живой проект, очень нужный и значимый».