Международная команда исследователей научила нейросеть определять расу по рентгеновским снимкам. Для этого авторы использовали методы машинного обучения и сотни тысяч медицинских снимков грудной клетки, шейного отдела позвоночника, груди и кисти. Обученный алгоритм угадывал расу пациента в 80—99 % случаев. Материалы исследования опубликованы в статье на сайте arXiv.org.
Даже самые опытные медицинские специалисты периодически совершают ошибки по разным причинам, например, от усталости или высоких нагрузок. Чтобы снизить нагрузку на врачей и повысить точность диагностики и назначаемого лечения, исследователи интегрируют искусственный интеллект в медицинские процессы. Кроме того, благодаря нейросети врачи способны обнаружить заболевания на очень ранних этапах развития, что сложно при использовании обычных методов диагностики.
В Москве алгоритмы искусственного интеллекта помогают распознавать остеопороз и признаки ишемической болезни сердца на компьютерной томографии. А исследователи из Университета Миннесоты и M Health Fairview создали программу с искусственным интеллектом, которая использует рентген грудной клетки, чтобы определить, есть ли у пациента COVID-19. Международная команда исследователей под руководством специалистов факультета биоинформатики Эморийского университета в США решила продолжить исследования в данном направлении и проверить, насколько точно работает ИИ и сможет ли он полноценно заменить человека.
По словам авторов, предыдущие исследования в области применения нейросетей в диагностике медицинских снимков показывали неодинаковую производительность искусственного интеллекта, связанную с различиями между расами. Поэтому они поставили целью выяснить, способна ли нейросеть определить расу человека по медицинским снимкам.
Для обучения алгоритмов авторы собрали несколько наборов данных, охватывающие разные типы медицинских снимков: рентгенографию грудной клетки (chest x-ray, CXR), компьютерную томографию грудной клетки (chest computed tomography, CT), цифровую рентгенографию кистей рук (digital radiography XR), маммографию и рентгенографию шейного отдела позвоночника (Lateral C-Spine XR). Каждый медицинский снимок включал отметки с классом заболевания и расовой принадлежностью.
Исследователи не уточняют географию пациентов. Они брали снимки из нескольких баз данных:
- материалы исследования рака лёгких в США National Lung Screening Trial;
- медицинские снимки Эморийского госпиталя (маммография, рентген и компьютерная томография);
- открытая база данных Стэнфордского университета, полученная в ходе исследования в 2019 году.
Результаты проверки алгоритмов показали точность определения 80—99 %. Это очень удивило исследователей. Они дополнительно испытали обученную нейросеть на снимках с разным разрешением и обнаружили ожидаемый рост точности по мере роста качества снимков.
По итогам экспериментов авторы выделили несколько гипотез, объясняющих феноменальную точность алгоритма:
- алгоритм опирается на разницу в физических характеристиках между пациентами разных расовых групп, например, габитусе тела или плотности грудной клетки;
- алгоритм ориентируется по специфике заболеваний, например, у чернокожих пациентов чаще встречается диабет и заболевания почек и сердца;
- алгоритм учитывает специфические характеристики тканей или фенотипические особенности, например, чернокожие имеют более высокую скорректированную минеральную плотность костной ткани, чем белые, и замедленные ежегодные темпы снижения минеральной плотности костной ткани с поправкой на возраст;
- алгоритм прослеживает совокупные последствия социальных факторов и экологического стресса, например, состояние здоровья, как правило, хуже у чернокожих пациентов.
Авторы изучили несколько гипотез, но так и не смогли определить, какая из них определяет работу нейросети. Они предположили, что в разных ситуациях алгоритмы ориентируются на разные показатели, но для точного заключения необходимы дальнейшие исследования. В будущем учёные планируют экспериментировать с качеством изображений и поочерёдно убирать базовую информацию при обучении алгоритмов. Таким образом они хотят определить ключевые моменты, на которые опирается нейросеть при анализе.