Ученые из Сколтеха (CDISE, группа Максима Федорова) и Мюнхенского центра имени Гельмгольца по исследованию окружающей среды и здоровья (HMGU, группа Игоря Тетко) создали технологию улучшенного прогноза токсичности потенциальных лекарственных препаратов на основе использования алгоритмов многозадачного машинного обучения и анализа различных видов данных по токсичности. Этот подход позволяет получить точные прогнозы нежелательных эффектов лекарственных соединений. Результаты…
Ученые из Сколтеха (CDISE, группа Максима Федорова) и Мюнхенского центра имени Гельмгольца по исследованию окружающей среды и здоровья (HMGU, группа Игоря Тетко) создали технологию улучшенного прогноза токсичности потенциальных лекарственных препаратов на основе использования алгоритмов многозадачного машинного обучения и анализа различных видов данных по токсичности.
Этот подход позволяет получить точные прогнозы нежелательных эффектов лекарственных соединений. Результаты исследования опубликованы в журнале Journal of Chemical Information and Modeling.
Новое лекарство, выводимое на рынок, должно быть не только эффективным, но и безопасным. Тестам на безопасность посвящена первая фаза клинических испытаний любого нового лекарственного препарата.
По данным организации FDA (Food and Drug Administration), осуществляющей надзор за безопасностью продуктов питания и лекарств в США, около 30% потенциальных лекарств отсеиваются именно на этой стадии, когда фармацевтические компании и ученые уже вложили в них десятки миллионов долларов и тысячи рабочих часов.
Чтобы этого избежать, необходимо разрабатывать эффективные алгоритмы, которые помогут распознать токсичные соединения на самой ранней стадии разработки нового препарата.
Универсального понятия токсичности не существует. Этот параметр может быть измерен на различных организмах (например, на мышах, крысах, обезьянах); оценка токсичности также зависит от способа введения препарата (с пищей, инъекционно, накожно).
Авторы работы создали нейронную сеть, которая прогнозирует несколько различных видов токсичности одновременно.
Для обучения модели использовались данные о токсичности более 70 тысяч органических соединений различной природы; эти данные были распределены по 29 типам, учитывающим как вид испытуемого животного, так и тип введения исследуемого вещества.
Ученые сравнили свою модель с моделями, прогнозирующими только один тип токсичности и продемонстрировали, что одновременное использование многих видов токсичности при обучении значительно улучшает итоговое качество прогнозирования.
Для наблюдаемого явления можно найти простые аналогии. Одновременное изучение смежных дисциплин, например математики и физики, поможет ученику лучше понимать каждое из них и упростит процесс обучения.
Авторы полагают, что различные виды токсичности также связаны между собой — и это помогает нейронной сети выстраивать более точные закономерности.
«Далеко не всегда многозадачное обучение дает хороший результат, однако в нашем случае оно значительно улучшает качество прогнозирования. Наша работа не только демонстрирует эффективность нового подхода, но и способствует пересмотру устаревших методов вычислительного прогнозирования токсичности», — рассказывает первый автор опубликованной работы, аспирант Сколтеха Сергей Соснин.
Авторы работы сделали созданные модели доступными онлайн. Теперь любой химик-исследователь может заранее оценить токсичность потенциальных кандидатов в лекарственные средства по отношению к нескольким видам животных.
Машинное обучение и анализ больших данных уже совершили революцию во многих областях науки и теперь очередь за токсикологией.
В будущем ученые хотят научиться делать точные прогнозы токсичности для человека, что сделает процесс разработки новых лекарств дешевле и продуктивнее.