Химики ИОХ РАН впервые научили искусственный интеллект распознавать молекулярные структуры

Исследователи ИОХ РАН впервые научили искусственный интеллект распознавать молекулярные структуры. Фото: Дарья Архипова / ИОХ РАН

Исследователи ИОХ РАН впервые научили искусственный интеллект распознавать молекулярные структуры. Фото: Дарья Архипова / ИОХ РАН

В Институте органической химии им. Н.Д. Зелинского (ИОХ) РАН впервые продемонстрировали возможность различения молекулярных структур с помощью искусственного интеллекта. Нейронную сеть научили определять сложные органические соединения, широко применяющиеся в химии и медицине ― четвертичные фосфониевые соли. В эксперименте использовали изображения, полученные благодаря сканирующей электронной микроскопии (SEM) и оптической микроскопии, причем в некоторых случаях нейросеть справилась даже со сложнейшим распознаванием минимальных отличий в структуре, незаметных для традиционных оптических методов. Исследование проводилось при поддержке Министерства науки и высшего образования РФ, а его результаты опубликованы в международном научном журнале Small.

В своей работе авторы напомнили, что определение молекулярных структур имеет основополагающее значение для химии и биологии. При этом до появления машинного обучения возможность различения молекулярных структур исключительно по изображению оставалась практически нереальной. Новаторский подход исследователей ИОХ РАН позволил объединить визуальный облик материалов (как на микро-, так и наноструктурном уровне) с традиционными методами анализа их химической структуры. Используя глубокие нейронные сети, ученые института впервые продемонстрировали, что применение машинного обучения для анализа изображений химических соединений не просто экспериментальная идея, а реальный инструмент, способный изменить многие отрасли. В ИОХ РАН рассказали, что в эксперименте нейросеть была настроена на анализ данных, таких как количество атомов углерода в цепи молекулы, с использованием методов классификации и регрессии. Кроме того, использовалась архитектура CycleGAN для преобразования изображений из одного типа микроскопии в другой.

Подробнее об эксперименте корреспонденту «Научной России» рассказал ведущий автор исследования, заведующий лабораторией металлокомплексных и наноразмерных катализаторов ИОХ РАН академик Валентин Анаников. 

«Чтобы обучить нейросеть, мы собрали датасет из более 500 изображений. Работа велась поэтапно и заняла (от начала проекта до полного обучения нейросети) около года. Достаточно сложным этапом, потребовавшим много времени,  оказалось выделение тех морфологических признаков, по которым нейронная сеть может уточнять отдельные, очень небольшие нюансы химических структур. <…> Главная фундаментальная проблема ― это информационный разрыв между молекулярными структурами и нано- и микроразмерной морфологией материалов. Мы можем уверенно исследовать и устанавливать молекулярные структуры. Для этого есть соответствующие методы исследования. Мы также можем изучать с помощью различных методов микро-  и наноразмерные морфологии материалов. Однако ключевой вопрос заключается в том, как молекулярные структуры и их включение в состав материала транслируются в соответствующие нано- и микроразмерные морфологические признаки. В данной работе ответ на этот вопрос мы получали с помощью нейронной сети».

Метод, разработанный в ИОХ РАН, позволит использовать более доступные микроскопы и сократить затраты и время на проведение анализов, а также значительно упростить и удешевить анализ химических соединений, что особенно важно для фармацевтики, биохимии и материаловедения.

В дальнейших планах ученых ― расширить применение этого подхода на другие классы химических соединений и улучшить точность моделей, создав более обширные базы данных изображений и структур.

Новость подготовлена при поддержке Министерства науки и высшего образования РФ


Источник