На сегодняшний день известно более тысячи гибридных материалов на основе галогенидов — соединений, содержащих органический фрагмент, галоген (элемент 17-й группы таблицы Менделеева — например, хлор, бром и йод), а также металл. Материалы этого класса интересны благодаря сравнительной простоте синтеза и своим оптоэлектронным свойствам, которые позволяют использовать их при создании солнечных элементов, детекторов радиационного излучения и светодиодов.
При получении любого нового соединения важно определить его кристаллическую структуру, поскольку от неё зависят свойства материала. Довольно точно сделать это позволяет рентгеновская дифракция — метод, при котором учёные анализируют, как порошок интересующего соединения рассеивает рентгеновские лучи. Однако обработка таких данных обычно занимает много времени и требует участия специалистов с высокой квалификацией и обширными знаниями, поэтому химики ищут более простой подход.
Российские учёные разработали алгоритм машинного обучения, способный автоматически устанавливать кристаллические структуры гибридных материалов на основе галогенидов. Результаты исследования опубликованы в журнале Nanoscale. Сначала авторы проанализировали 485 известных на сегодняшний день кристаллических структур галогенидов, полученных с помощью рентгеновской дифракции. Учитывая сходства и различия структур, исследователи разработали метод их классификации.
Классификация представляла собой граф — математическое воплощение системы из объектов (так называемых вершин), связанных между собой. В вершинах этого графа находились различные структуры гибридных материалов, а на рёбрах — линиях, связывающих вершины,— варианты возможных переходов между структурами. На основе такой классификации учёные разработали алгоритм машинного обучения, позволяющий с высокой точностью предсказывать, как организованы группы атомов в интересующем материале.
Затем для 485 экспериментально известных кристаллических структур учёные смоделировали их теоретические рентгенограммы и дополнили этот набор одиннадцатью экспериментально полученными. Эксперимент показал, что точность определения структуры по рентгенограмме составляет от 71% до 83% в зависимости от того, насколько детализировано взаимное расположение атомов в структуре материала. Разработанный алгоритм, в отличие от ранее предложенных в литературе бинарных классификаций, отличающих только структуры типа перовскита (названных по структуре минерала перовскита — титаната кальция) от не перовскитных структур, является мультиклассификацией и способен распознавать большое количество структурных типов гибридных материалов.