08.10.2024
Подписывайтесь на Telegram-канал по ссылке

База данных из России позволит обучить искусственный интеллект решать геологические задачи

Mineral image recognition

Российские учёные создали специализированную базу данных «MineralImage5k» из тысяч изображений образцов горных пород. Она поможет обучать искусственный интеллект классифицировать минералы и определять их размер, а также оценивать качество работы алгоритмов компьютерного зрения для задач геологии. Научная статья опубликована в журнале Computers & Geosciences. Датасет и исходный код доступны по ссылке.

Определить, какой минерал находится перед геологом – достаточно сложная и трудоёмкая задача. Анализ пробы может занять от 30 минут до нескольких дней. Ситуация осложняется тем, что не все минералы изучены одинаково хорошо. В природе существует около 6000 минералов, а подробно описаны только несколько сотен породообразующих и представляющих интерес для промышленности типов.

Визуальная диагностика – первый и наиболее распространённый метод анализа горных пород и минералов. Она позволяет отделить образцы, которые можно обрабатывать автоматически, от образцов, требующих ручного контроля. В то же время, именно этот подход больше всего подвержен человеческому фактору. Научные группы по всему миру работают над изучением методик визуальной диагностики с помощью искусственного интеллекта, чтобы понизить процент ошибок при внешней оценке образцов. Это значительно экономит время на рутинных задачах, позволяя исключить из процесса дорогостоящие спектроскопию или химический анализ в случаях, когда они выполняются для подстраховки.

В то же время, в литературе отсутствуют чёткие ориентиры для анализа изображений минералов и общепринятая система сравнительного анализа. Чтобы решить эту проблему, российские учёные собрали базу данных из 44 тысяч изображений более чем 5 тысяч видов минералов. Внутри этой базы содержатся подмножества данных для классификации, сегментации и оценки размера образцов. Работа была проведена при поддержке Минералогического музея им. А.Е. Ферсмана, в фондах которого хранится более 170 тысяч образцов горных пород и минералов.

Созданная база, хоть и уступает по размеру самому большому в мире датасету Mindat из миллиона изображений, является более однородной по условиям съёмки, состоит из необработанных образцов, близких к минералам в дикой природе, и формирует более широкий взгляд на минеральное разнообразие. Совокупность этих факторов обеспечивает лучшее качество обучения моделей искусственного интеллекта. Кроме того, «MineralImage5k» привязан к коллекции музея и позволяет провести дополнительное изучение любого образца. В будущем коллектив планирует расширять набор данных.