От предсказания структуры кристаллов к научному прорыву: история создания российского алгоритма USPEX 25

Российский алгоритм USPEX 25 уже называют революцией в науке. Благодаря ему исследования, для которых раньше требовался суперкомпьютер, теперь могут проводиться на обычном ноутбуке. Ожидается, что это даст возможность заниматься наукой даже школьникам из бедных стран, да и вообще всем, кто раньше не имел доступа к высоким технологиям. Но к такому результату пришли далеко не сразу — разработки алгоритма велись более 20 лет. Через какие тернии пришлось пройти ученым, как весь научный мир выучил русское слово «успех» и как искусственный интеллект меняет науку?

Невыполнимая задача

Для ученых молекулярное моделирование представляет собой значительную и непростую задачу. Ключевым начальным этапом является определение расположения атомов по отношению друг к другу в конкретном соединении. Сложность заключается в том, что количество потенциальных структур является неограниченным, и даже при использовании самых современных вычислительных мощностей их невозможно проанализировать все.

До недавнего времени, всего четверть века назад, предсказание кристаллической структуры представлялось невыполнимой задачей, несмотря на то, что она играет важнейшую роль в теоретической кристаллографии. Предпринятые в 1990-х годах попытки решить эту проблему оказались безуспешными. Тем не менее, в начале 2000-х годов в научной сфере произошли изменения, которые значительно подтолкнули дальнейшие исследования. В 2002 году итальянский физик Микеле Парринелло описал метод, который позволял «путешествовать» по энергетической поверхности молекулярных систем. В первую очередь это было необходимо для изучения химических реакций, изменения структур молекул, например, в процессе фолдинга белков, то есть когда линейная цепочка аминокислот сворачивается в трехмерную структуру.

«Уже к 2003 году Микеле Парринелло представил модификацию этого подхода, предназначенную для прогнозирования кристаллических структур. Это вызвало заметный интерес, поскольку впервые появилась возможность предсказывать структуру кристалла, хотя бы эпизодически. Метод отличался высокой требовательностью к ресурсам, нуждаясь в использовании суперкомпьютеров и значительного времени. Вскоре стало ясно, что он не всегда дает точные предсказания. Однако, в ряде случаев прогноз оказывается верным, и это уже можно считать существенным достижением», — сообщил «Научной России» главный разработчик программы USPEX, профессор РАН, доктор физико-математических наук Артем Ромаевич Оганов.

Ключ в недрах Земли

В тот же период произошло еще одно открытие. Шигеаки Оно, японский геофизик, специалист в области минералогии высоких давлений, установил, что оксид железа ( Fe₂O₃) при высоком давлении переходит из структуры, характерной для корунда, в структуру перовскита. Это означает, что два атома железа начинают выполнять различные структурные функции. В дальнейшем, под воздействием еще более высокого давления, вещество переходит в новую структуру, которую удалось установить Оно. Поскольку японский ученый изучал минералы, формирующиеся на значительных глубинах, он задался вопросом: что произойдет, если силикат магния ( MgSiO3), из которого формируется примерно 40% объема нашей планеты, также имеет структуру, подобную перовскиту. Возникает вопрос, способен ли он, под воздействием высокого давления, изменять свою структуру и переходить в новое, постперовскитное состояние?

«Я осуществил квантово-механические расчеты и был удивлен, что подобный переход, согласно моим данным, должен иметь место при давлениях, характерных для нижней мантии Земли. Геофизики на протяжении десятилетий фиксировали многочисленные аномалии в этой области мантии. Долгое время эти аномалии оставались необъясненными, однако нам удалось найти для них объяснение, благодаря исследованию свойств новой фазы. Возник вопрос: если обнаружение всего одной новой структуры силиката магния привело к столь значительному эффекту, то какие результаты мы сможем получить, если разработаем метод, позволяющий автоматически прогнозировать новые кристаллические структуры? Окажется ли, что мы будем совершать одно важное открытие еженедельно?», — продолжил рассказ А.Р. Оганов.

Вскоре после этого началось сотрудничество с Микеле Парринелло, в ходе исследования, выполненного с применением метода метадинамики, были получены значимые результаты для силиката магния. Данный подход основан на моделировании переходов между различными состояниями. По словам А.Р. Оганова, «расчеты занимали много времени — приходилось ожидать до месяца, чтобы получить всего несколько структур». Метадинамический подход, хорошо зарекомендовавший себя при работе с постперовскитами, оказался излишне затратным и не дал ожидаемых результатов для других систем, что подтолкнуло исследователя к разработке собственного метода. Наиболее перспективным направлением стало создание эволюционного алгоритма.

Читайте также:  Северная Сибирь: спутниковые снимки зафиксировали изменения в мерзлотных ландшафтах

Начало успеха

Эволюционные алгоритмы имитируют процессы, заложенные в теории Дарвина, используя вычислительную технику. Как и популяция живых существ, совокупность кристаллических структур проходит естественный отбор, передает характеристики потомству и подвергается изменениям. Задача состоит в том, чтобы найти структуру с минимальным энергетическим уровнем. Понятно, что на практике реализация этого процесса значительно сложнее, чем кажется. Это стало результатом совместной работы А.Р. Оганова и студента-программиста Колина Гласса из Швейцарской Высшей технической школы Цюриха ( ETH), изначально не приносящая результатов в течение примерно года.

«Многочисленные попытки разработки эволюционного подхода не принесли результатов. Задача, которую мы тогда рассматривали в качестве экспериментальной, заключалась в предсказании структуры алмаза. По сути, это довольно простая структура, однако изначально программа не могла ее спрогнозировать. Мы работали над этой проблемой в течение примерно года и уже подумывали о завершении проекта, когда решили все же попробовать еще один вариант — объединить глобальную оптимизацию с локальной. На следующий день мы запустили компьютер, подключились к суперкомпьютеру, получили результаты, визуализировали их и… увидели структуру алмаза. Это вызвало настоящий восторг: мы смогли предсказать сложную структуру, опираясь лишь на простую химическую формулу! У меня руки непроизвольно поднялись к потолку, и я на русском языке воскликнул: «Успех!». И тогда я осознал, что это должно стать названием программы. Оно стало аббревиатурой, для которой я вскоре придумал английскую расшифровку: Universal Structure Predictor Evolutionary Xtallography. Таким образом, в мае 2005 года была создана первая редакция нашей методики, — рассказал А.Р. Оганов.

Глобальная и локальная оптимизация объединяются следующим образом: каждая новая структура, оцениваемая по принципу естественного отбора, подвергается предварительной «релаксации» – атомы в ней продолжают перемещаться до тех пор, пока действующие на них силы не уравновесятся. Это позволяет структуре занять положение в локальном энергетическом минимуме. Локальная оптимизация требует значительных вычислительных ресурсов, поэтому ранее к ее применению не решались. Однако именно этот подход в конечном итоге обеспечил создание первой работоспособной версии алгоритма USPEX.

Годы совершенствований

В 2005 году алгоритм значительно отличался от его современной реализации. Однако он содержал инновационные для того времени концепции, которые определили дальнейшее развитие. Использование нулей и единиц было упразднено – их заменили физическими параметрами, отражающими координаты кристаллической структуры. Функционирование программы обеспечивалось эволюционными вариационными операторами, имитирующими эволюционные процессы, такими как наследование и мутация. В итоге, разработчикам удалось разработать уникальный механизм отбора.

Со временем эти механизмы совершенствовались и дополнялись, внедрялись инновационные подходы, такие как фингерпринтинг, позволяющий немедленно выявлять и исключать повторяющиеся структуры. Спустя несколько лет после релиза первой версии, методологию удалось адаптировать для систем с изменчивым составом: теперь, имея лишь перечень элементов, программа определяла все их устойчивые комбинации, даже при отсутствии точной химической формулы.

Если исследователю не были известны даже компоненты, формирующие требуемое соединение, он мог применить метод, известный как «менделеевский поиск». В этом случае программа последовательно анализировала различные сочетания элементов, взятых из периодической таблицы, чтобы найти материалы с оптимальными характеристиками. Позднее были разработаны специализированные инструменты для изучения поверхностей кристаллов, полимеров, наночастиц и белков.

Читайте также:  В Метеообсерватории МГУ зафиксировали рекордный уровень снежного покрова

Новая эра машинного обучения

Несмотря на значимость этих разработок для научного прогресса, исследования в рамках программы USPEX были дорогими и доступными только крупным лабораториям, оснащенным суперкомпьютерами. Следующая революция ждала своего часа. И этот час наступил чуть больше года назад, когда позволили нейросети. Раньше моделирование нельзя было представить без квантово-механических расчетов — для этого нужен был суперкомпьютер, оснащенный системой Linux. Дело в том, что операционная система Windows, обычные программы, применяемые на персональных компьютерах, не справляются с подобными вычислениями, а вычислительная мощность этих компьютеров недостаточна. Однако, благодаря прогрессу в области нейросетей, появилась возможность использовать машинное обучение вместо квантово-механических расчетов, что кардинально меняет ситуацию. Новая программа была разработана Сергей Владимирович Лепешкин, ведущий научный сотрудник лаборатории А.Р. Оганова.

«Мы объединили наш эволюционный алгоритм глобальной оптимизации с моделью машинного обучения, которая заменяет квантовомеханические расчеты локальной оптимизацией структуры и оценкой ее энергии. Именно этот аспект был наиболее затратным в наших вычислениях. Отказавшись от квантовой механики, мы добились увеличения скорости расчетов приблизительно в 200 раз. Теперь задачу, которую ранее требовалось решать неделю на высокопроизводительном вычислительном кластере, мы можем выполнить всего за один день на обычном персональном компьютере», — отметил А.Р. Оганов.

Сначала существовало мнение, что результаты, полученные с использованием моделей машинного обучения, будут недостаточно точными для практического применения. Однако, как утверждают А.Р. Оганова, значительно превзошли все ожидания, поскольку программа не только продемонстрировала высокую эффективность, но и отличается удобством в работе. Это стало возможным благодаря ее адаптации под Windows и научили автоматически определять ресурсы компьютера, чтобы максимально грамотно их использовать.

В конечном счете, миру была представлена программа с минимальными требованиями для начала работы. Сейчас USPEX 25 используют даже те, кто раньше никогда не занимался теоретическими расчетами, программу успешно осваивают и школьники, и студенты.

Переход на новую архитектуру

Безусловно, текущая итерация программы не является финальной. В настоящее время ведется работа над новой версией, релиз которой запланирован на 2026 год. Подробности пока не разглашаются, однако, по словам А.Р. Оганов, ожидается значительное количество новостей: завершение перехода на новую архитектуру, которое было USPEX 25, это значительно облегчает последующую работу над проектом.

«USPEX 25 представляет собой переписанную в Python версию программы USPEX, и в ней применяется более современная и адаптивная архитектура. Предыдущая версия программы USPEX 10.5 со временем превратилась в большого и неповоротливого монстра, которого сложно развивать. Поэтому мы переориентировали наши усилия на маленькие девелоперские версии, которые пока не выпускаем в мир. Сейчас мы активно работаем над разработкой USPEX 26.1 — в 2026 году ожидается несколько выпусков. В них будет включен как существующий функционал, так и возможности, ранее доступные в экспериментальных версиях. Продолжение работы над программой USPEX будет полностью ориентировано на эту новую архитектуру», — подчеркнул А.Р. Оганов.

Не USPEXом единым

Помимо USPEX, возможности искусственного интеллекта в химии и моделировании проявляются и в других разработках. Параллельно с совершенствованием алгоритма, искусственный интеллект интегрируют в процесс моделирования в Группе теоретической химии Института органической химии им. Н.Д. Зелинского РАН. В этой группе работают как опытные специалисты, так и студенты, а также школьники. Их работа также принесла свои плоды: летом 2025 года молодые ученые представили механизм, позволяющий находить упущенные конформации – уникальные геометрические расположения атомов в молекуле. В этом механизме искусственный интеллект выступает в качестве инструмента, помогающего ученому и указывающего на конформации, которые могли быть не учтены при обычном поиске.

Читайте также:  Новая технология «печень на чипе» ускорит тестирование лекарственных препаратов

«Философия USPEXа тесно перекликается с тем, что мы делаем. Он нужен для глобального поиска структуры кристаллов, а мы занимаемся глобальным поиском структур молекул в растворе — это необходимо для тонкой химии и катализа. Как USPEX, так и наш алгоритм решает две задачи. Он позволяет предсказать характеристики определенной структуры (прямая задача) и найти структуру с заданными свойствами, например, с минимальной энергией (обратная задача). В этом смысле USPEX 25 комбинирует в себе два искусственных интеллекта: потенциал машинного обучения для решения прямой задачи и генетический алгоритм для решения обратной», — рассказал корреспонденту «Научной России» руководитель группы, старший научный сотрудник ИОХ РАН, лауреат премии Сбера в номинации « AI в науке. Физический мир» за 2025 г. Михаил Геннадьевич Медведев.

Таким образом, эти два подхода не противоречат, а взаимно усиливают друг друга: если USPEX более актуален для материаловедения и геологии, то метод химиков-теоретиков ИОХ РАН — для тонкого синтеза, катализа и разработки лекарств. Молодые ученые решили пойти по другому пути: использовать не эволюционный алгоритм, а байесовскую оптимизацию на основе гауссовских процессов. Основываясь на теории вероятности, программа анализирует собранные данные и проведенные эксперименты, чтобы найти наиболее перспективную точку с неисследованными параметрами.

«Ранее эволюционные алгоритмы уже применялись для поиска молекул в растворе. Однако, воспроизводя процесс эволюции, мы не всегда можем понять, какие принципы лежат в основе принимаемых ими решений и как они определяют вероятность в различных точках пространства. В связи с этим, для решения обратной задачи в нашей работе мы использовали гауссовы процессы, позволяющие явно рассчитывать функцию вероятности энергии в многомерном пространстве. Это дает возможность включить физические знания и более строго математически сформулировать обратную задачу — поиск глобального минимума», — отметил М.Г. Медведев.

Искусственный интеллект и человек

В настоящее время разговоры об искусственном интеллекте сопровождаются определенной обеспокоенностью. Специалисты-химики также относятся к этой тематике с осторожностью. Однако на данном этапе можно с уверенностью утверждать, что искусственный интеллект не сможет заменить ученого, по меньшей мере, в ближайшие годы. Вместе с тем, весьма вероятно, что он трансформирует организацию научной деятельности: время, затрачиваемое на практическую работу, сократится, а время, посвященное аналитической работе, возрастет.

«В настоящее время ведется разработка проекта химика-расчетчика, основанного на искусственном интеллекте. В рамках этого проекта мы стремимся создать мультиагентную систему, которая сможет полностью автоматизировать процесс моделирования. Каждый агент предназначен для решения конкретной задачи: оптимизации переходных состояний, выбора необходимого уровня теории и проведения конформационного поиска. Таким образом, мы приближаемся к этапу, когда большую часть рутинных технических операций можно будет передать компьютеру. В результате ученый, приступающий к работе, сможет сразу же сосредоточиться на более сложных научных вопросах: принятии стратегических решений, изучении процессов и постановке задач перед компьютером. При этом стоит отметить, что молодые специалисты готовы к таким изменениям: в нашей группе есть десятиклассники, уже способные выполнять сложные научные задания», — отметил М.Г. Медведев.

Источники:

CNews. Разработан инновационный способ моделирования кристаллических структур, позволяющий значительно ускорить процесс

Фото: kjpargeter / Freepik; rawpixel.com / Freepik; Николай Мохначев, Ольга Мерзлякова / «Научная Россия» архив; Freepik