В России разработана обширная база данных о растворимости веществ в бинарных смесях – MixtureSolDB

Сотрудники Института общей и неорганической химии им. Н.С. Курнакова РАН, Московского государственного университета имени М.В. Ломоносова и Национального исследовательского университета «Высшая школа экономики» сформировали базу данных растворимости органических соединений в бинарных смесях растворителей под названием «MixtureSolDB» и создали онлайн-приложение для удобной визуализации содержащихся в ней данных. Эта база данных позволяет прогнозировать показатели растворимости веществ в бинарных смесях с применением алгоритмов искусственного интеллекта. Информация об этом полезном инструменте, представляющем интерес для разработки лекарственных средств и создания материалов нового поколения, была опубликована в журнале Scientific Data.

Растворимость – важное свойство соединений, которое определяет их использование в химическом синтезе, при создании новых материалов и в фармацевтической промышленности. Использование смесей растворителей в технологических процессах значительно усложняет оценку растворимости. Прогнозирование значений растворимости в таких смесях остаётся непростой задачей для современной хемоинформатики, главным образом из-за недостатка обширных и разнообразных экспериментальных данных. Применение методов машинного обучения представляется перспективным решением, поскольку они позволяют предсказывать характеристики химических соединений без проведения экспериментов, что ускоряет научные исследования и снижает их стоимость.

Читайте также:  Новое исследование предлагает способ замедлить эволюцию бактерий

Московские ученые разработали крупнейшую в мире базу данных, содержащую сведения о растворимости органических соединений в бинарных смесях растворителей, включающую свыше 175 тысяч экспериментальных результатов. Один из авторов работы, младший научный сотрудник Лаборатории кристаллохимии и Центра цвета ИОНХ РАН Лев Краснов, отметил: «В процессе исследования мы проанализировали 1115 научных публикаций, прошедших рецензирование, и упорядочили 175 166 экспериментальных данных о растворимости — для 810 органических соединений в 750 различных бинарных смесях растворителей при температурах от 252 до 383 K. Мы уделили значительное внимание обеспечению достоверности данных: каждая запись подвергалась проверке, стандартизации и удалению дубликатов. Молекулярные структуры всех растворяемых веществ и растворителей представлены в формате SMILES, доступном для машинного чтения — это позволяет использовать базу данных непосредственно в задачах машинного обучения, без необходимости дополнительной обработки. Помимо самой базы данных, мы создали онлайн-приложение для ее визуализации и удобной навигации: в нем можно искать данные о растворимости по химической структуре соединения, а также по его наименованию».

Читайте также:  Российские ученые расскажут о своих исследованиях студентам в Кыргызстане

Авторы отмечают, что разработанная ими база данных решает важную проблему отсутствия полных наборов данных, необходимых для определения растворимости органических соединений в смесях растворителей, что ранее серьезно препятствовало прогрессу машинного обучения в данной сфере. Предыдущие исследования в основном затрагивали растворимость в чистых растворителях, в то время как MixtureSolDB впервые представляет собой крупный, структурированный набор данных для бинарных смесей.

В сформированной базе данных содержатся как широко используемые бинарные смеси, например, вода с этанолом, вода с ацетонитрилом, этанол с ацетоном, так и другие комбинации, имеющие важное практическое значение. Это имеет большое значение для разработки новых химико-технологических процессов, поскольку точное понимание растворимости в смесях растворителей необходимо для определения условий проведения синтеза, при создании лекарственных препаратов и для разработки действенных способов кристаллизации и экстракции.

Читайте также:  Академик Геннадий Месяц: к дате рождения пионера отечественной электрофизики

Авторы также подчеркивают значительный вклад студентов первого курса химического факультета МГУ имени М.В. Ломоносова: Фёдора Кузнецова, Владимира Елистратова и Матвея Васиярова. Для них данная работа стала дебютной научной публикацией. Фёдор Кузнецов и Владимир Елистратов были удостоены победы на Международной химической олимпиаде 2025 года (IChO-2025), а Матвей Васияров стал победителем IChO-2024.

Работа была проведена при финансовой поддержке Министерства науки и инноваций Российской Федерации в рамках государственного задания, предоставленного Институтом химии органических соединений им. Н.Д. Зелинского РАН.