Исследователи из группы «Биоинформатика» Института искусственного интеллекта AIRI представили SEMA (Spatial Epitope Modelling with Artificial Intelligence) – открытый инструмент для предсказания участков связывания антител с белками вирусов и бактерий. Инструмент поможет биологам и иммунологам в разработке вакцин и терапевтических препаратов на основе антител. SEMA выложен в открытый доступ по ссылке, разработчики могут найти исходный код на GitHub. Результаты работы опубликованы в научном журнале Frontiers in Immunology.
SEMA позволяет предсказывать наиболее вероятные места посадки антител на исследуемый белок, например, S-белок вируса SARS-CoV-2, а также оценивать их эффективность для различных штаммов вируса. Совместно с учёными из НИЦЭМ им. Н. Ф. Гамалеи были проведены расчёты эффективности применения SEMA для коронавируса, а сейчас учёными проверяется возможность использования инструмента для вируса гриппа.
Основа инструмента – это нейросетевая языковая модель для предсказания эпитопов. Эпитопами называются привлекательные для антител участки на поверхности вируса, так называемые «посадочные площадки» для антител. Белки для анализа загружаются в программу в виде аминокислотной последовательности или 3D-структуры. SEMA способен предсказать, какие аминокислотные остатки этого белка формируют эпитопы, и оценить, насколько вероятно взаимодействие данного эпитопа с антителами. В дальнейшем эта информация может использоваться при выборе наиболее перспективных фрагментов белка для включения в состав вакцины, а также для поиска новых терапевтических антител против заданного участка белка. На независимом наборе тестов SEMA продемонстрировал более высокую точность по сравнению с другими известными инструментами.
Исследователи из AIRI продолжают работу над расширением функционала инструмента. На ресурсе уже появилась возможность предсказывать участки гликозилирования белков, то есть, определять места на поверхности белка, где расположены гликаны. Сами по себе гликаны – это покрывающие белки полимеры, и в норме они призваны защищать от вредных воздействий, однако, в ситуации, когда необходимо эффективное взаимодействие вирусного белка и антитела, они могут мешать реализации этого контакта.
В последнее время много исследований проводится с использованием методов обработки естественного языка применительно к последовательностям аминокислот в белках и нуклеотидов в геноме. Определение эпитопов на поверхности белков – задача не новая, однако, в SEMA исследователи впервые использовали для ее решения белковую языковую модель, а для удобства биологов создали веб-интерфейс. Вкупе с удобной визуализацией он призван упростить доступ учёных к сложным биоинформатическим инструментам на основе технологий искусственного интеллекта.
Руководитель научной группы «Биоинформатика» Института AIRI Ольга Кардымон отмечает, что разработка инструмента велась в тесном контакте с учеными из Центра имени Гамалеи, поэтому коллектив надеется, что SEMA будет полезен и другим биотехнологическим институтам и компаниям, работающим над созданием вакцин и препаратов для терапии вирусных и бактериальных заболеваний.