29.03.2024
Подписывайтесь на Telegram-канал по ссылке

Новые гены рака идентифицировали с помощью машинного обучения

Новые гены рака идентифицированы с помощью МО

Увидеть рак «насквозь» с помощью искусственного интеллекта и анализа данных стало возможно благодаря работе исследователей Общества Макса Планка. Результаты работы публикует Nature Machine Intelligence.

Новый алгоритм может предсказать, какие гены вызовут рак, даже если последовательность ДНК не изменилась. Команда исследователей в Берлине объединила различные данные и проанализировала их с помощью искусственного интеллекта, чтобы выявить большое количество онкогенов. Это открывает новые перспективы в разработке целевых методов лечения рака и биомаркеров в персонализированной медицине.

При раке клетки размножаются и проникают в ткани, разрушая органы и тем самым нарушая их жизненно важные функции. Неограниченный рост обычно вызван накоплением изменений ДНК в онкогенах, мутациях в этих генах, которые и управляют развитием клеток. Однако у некоторых видов рака очень мало мутировавших генов. Это значит, что другие причины приводят к опасному заболеванию.

Группа исследователей из Института молекулярной генетики Макса Планка (MPIMG) в Берлине и Института вычислительной биологии в Гельмгольце, использовали методы машинного обучения для идентификации 165 ранее неизвестных генов рака. Для анализа данных исследователи создали специальный алгоритм.

Последовательности этих генов не обязательно изменяются. Очевидно, что нарушение их регуляции уже может привести к раку. Все недавно идентифицированные гены тесно взаимодействуют с хорошо известными онкогенами. Они необходимы для выживания опухолевых клеток, как показали эксперименты на клеточных культурах.

Алгоритм под названием EMOGI в Explainable Multi-Omics Graph Integration может также объяснить взаимосвязь между клеточными механизмами, которые превращают ген в онкоген. Как объясняет группа исследователей во главе с Анналисой Марсико, программное обеспечение объединяет десятки тысяч наборов данных, созданных из образцов пациентов. Сюда входит информация о метилировании ДНК, активности отдельных генов и взаимодействиях белков внутри клеточного пути, а также данные о последовательностях с мутациями. В этих данных алгоритмы глубокого обучения обнаруживают закономерности и молекулярные принципы, которые и приводят к развитию рака.

В отличие от традиционных методов лечения рака, таких как химиотерапия, индивидуальные методы лечения адаптированы к конкретному типу опухоли.

«Наша цель — выбрать лучшее лечение для каждого пациента, наиболее эффективное лечение с наименьшими побочными эффектами. Кроме того, молекулярные свойства можно использовать для выявления рака, который уже находится на ранних стадиях», — объясняет Марсико, глава исследовательской группы MPIMG.

«На сегодняшний день большинство исследований сосредоточено на патогенных изменениях последовательности или клеточных схемах, — сказал Роман Шульте-Сассе, докторант в команде Марсико и первый автор публикации. — В то же время недавно стало ясно, что эпигенетические нарушения или дисрегуляция активности генов также могут привести к раку».

Вот почему исследователи объединили данные последовательности, отражающие сбои схемы, с информацией, которая представляет события в ячейках. Первоначально учёные подтвердили, что мутации или разрастание геномных сегментов на самом деле являются основной причиной рака. Затем, на втором этапе, они определили гены-кандидаты, которые не очень напрямую связаны с генами, на самом деле вызывающими рак.

«Например, мы обнаружили ген при раке, у которого мало изменена последовательность, но он регулирует подачу энергии и необходим для опухолей, — говорит Шульте-Засс. — Эти гены нельзя контролировать другими способами. Например, это вызвано химическими изменениями в ДНК, такими как метилирование. Эти изменения не затрагивают информацию о последовательности, но доминируют над активностью гена. Такие гены — многообещающие цели для открытия новых лекарств, но, поскольку они работают в фоновом режиме, их можно найти только с помощью сложных алгоритмов».

Новая программа исследователей добавляет немало новых записей в список подозрительных онкогенов. Только за последние годы он вырос с 700 до 1 000. Исследователи отслеживали скрытые гены только с помощью комбинации биоинформатического анализа и современных методов искусственного интеллекта.

В данных скрыто еще много интересных деталей. «Мы видим много закономерностей, характерные для рака, — говорит Марсико. — Я думаю, это доказательство того, что опухоли вызываются разными молекулярными механизмами в разных органах».

Исследователи подчёркивают, что программа EMOGI не ограничивается раком. Теоретически его можно использовать для интеграции различных наборов биологических данных и поиска закономерностей. Алгоритмы применимы к аналогичным сложным заболеваниям.