26.04.2024
Подписывайтесь на Telegram-канал по ссылке

Нейросеть смогла точно предсказать форму более 600 млн белков

Evolutionary-scale prediction of atomic level

Компания Meta представила свой искусственный интеллект ESMFold, который изучил тёмную материю белковой вселенной и предсказал форму более 600 млн белков бактерий, вирусов и других микробов, которые до сих пор не были охарактеризованы. Причём справился с этой задачей искусственный интеллект всего за две недели. То есть примерная средняя скорость расчёта белковых структур — 1,8 млн отдельных белков в час. Исследование опубликовано на biorxiv.

Понимание структуры белков очень важно для оценки и изучения их функций, которые, в свою очередь, помогают исследовать молекулярные причины различных заболеваний, а также разрабатывать и тестировать новые варианты лечения. Нейросеть ESMFold разрабатывалась с целью масштабирования результатов по предсказаниям структуры для гораздо больших баз данных.

ESMFold не так точна, как AlphaFold, но она примерно в 60 раз быстрее прогнозирует структуры белков, объясняют авторы. Благодаря такому алгоритму предсказания структуры 617 млн белков заняли всего две недели. Все полученные данные находятся в открытом доступе. Важно отметить, что миллионы этих структуры оказались совершенно новыми и не были похожи ни на что в существующих сегодня базах данных.

Таким образом, ESMFold даёт беспрецедентное представление об огромной широте и разнообразии структур некоторых из наименее изученных белков на Земле. Полученные данные позволяют говорить, что в скором времени в биологии может произойти взрыв в анализе метагеномных структур, раскрывая для учёных новые направления для исследований.