Российские учёные создали специализированную базу данных «MineralImage5k» из тысяч изображений образцов горных пород. Она поможет обучать искусственный интеллект классифицировать минералы и определять их размер, а также оценивать качество работы алгоритмов компьютерного зрения для задач геологии. Научная статья опубликована в журнале Computers & Geosciences. Датасет и исходный код доступны по ссылке.
Определить, какой минерал находится перед геологом – достаточно сложная и трудоёмкая задача. Анализ пробы может занять от 30 минут до нескольких дней. Ситуация осложняется тем, что не все минералы изучены одинаково хорошо. В природе существует около 6000 минералов, а подробно описаны только несколько сотен породообразующих и представляющих интерес для промышленности типов.
Визуальная диагностика – первый и наиболее распространённый метод анализа горных пород и минералов. Она позволяет отделить образцы, которые можно обрабатывать автоматически, от образцов, требующих ручного контроля. В то же время, именно этот подход больше всего подвержен человеческому фактору. Научные группы по всему миру работают над изучением методик визуальной диагностики с помощью искусственного интеллекта, чтобы понизить процент ошибок при внешней оценке образцов. Это значительно экономит время на рутинных задачах, позволяя исключить из процесса дорогостоящие спектроскопию или химический анализ в случаях, когда они выполняются для подстраховки.
В то же время, в литературе отсутствуют чёткие ориентиры для анализа изображений минералов и общепринятая система сравнительного анализа. Чтобы решить эту проблему, российские учёные собрали базу данных из 44 тысяч изображений более чем 5 тысяч видов минералов. Внутри этой базы содержатся подмножества данных для классификации, сегментации и оценки размера образцов. Работа была проведена при поддержке Минералогического музея им. А.Е. Ферсмана, в фондах которого хранится более 170 тысяч образцов горных пород и минералов.
Созданная база, хоть и уступает по размеру самому большому в мире датасету Mindat из миллиона изображений, является более однородной по условиям съёмки, состоит из необработанных образцов, близких к минералам в дикой природе, и формирует более широкий взгляд на минеральное разнообразие. Совокупность этих факторов обеспечивает лучшее качество обучения моделей искусственного интеллекта. Кроме того, «MineralImage5k» привязан к коллекции музея и позволяет провести дополнительное изучение любого образца. В будущем коллектив планирует расширять набор данных.