Искусственный интеллект способен предсказывать структуру и функции белков

Ученые из Google, работая совместно с Европейским институтом биоинформатики, создали нейронную сеть глубокого обучения, способную с высокой степенью точности прогнозировать структуру, функции и характеристики белков, основываясь на информации об их первичной структуре. Данный инструмент позволит существенно упростить и ускорить процесс создания новых лекарственных препаратов, а также проектирования ферментов для промышленного производства продуктов питания, биотоплива и химических веществ.

Установление связи между аминокислотной последовательностью (первичной структурой) белка и его функцией, а также понимание механизма его действия, представляет собой давнюю задачу для молекулярной биологии и является заветной целью специалистов, работающих в различных отраслях промышленности, включая фармацевтическую, пищевую и химическую.

В процессе изготовления разнообразных химических соединений, таких как фармацевтические препараты, пищевые ингредиенты или промышленные химикаты, целесообразно применять наиболее эффективные катализаторы – ферменты, представляющие собой белковые молекулы. Для каждой конкретной задачи требуется свой белок, обладающий определенной функциональностью, например, переносом электронов или химических групп, формированием или разрывом химических связей. Поскольку человек пока не способен создавать подобные ферменты самостоятельно, он черпает вдохновение в природных процессах, часто находя их в микроорганизмах.

Читайте также:  В Великобритании начал работу самый большой в мире оффшорный ветряной парк

При всех достижениях за прошедшие шесть десятилетий современные методы и алгоритмы не позволяют установить функции для значительной части уже известных микробных белков, что сдерживает возможности их использования для блага людей. Ежедневно в общедоступные базы данных добавляется свыше ста тысяч новых белковых последовательностей.

Тем не менее, эти данные малопригодны для практического использования, если они не дополнены функциональными аннотациями, то есть описанием функций белка и его биологической роли в клетке).

Для определения функции белка можно применить ряд современных методов, включая анализ микрочипов, РНК-интерференцию, двугибридный анализ и другие. Но темпы экспериментального доказательства функций открытых белков сильно отстают от темпов открытия новых последовательностей, и навряд ли когда-либо их догонят.

В связи с этим, аннотирование новых белковых последовательностей преимущественно будет осуществляться с помощью вычислительных методов, которые сравнивают их с аминокислотными последовательностями белков, функции которых уже установлены экспериментально. Когда потребуется разработка новой технологии производства, например, фармацевтического препарата, ученые смогут опираться на предсказания нейросетей, чтобы вручную определить наиболее перспективные белки-кандидаты и проверить их функциональность.

Читайте также:  Новый метод значительно повышает производительность квантовых компьютеров

Команда ученых из Google Research (Кембридж, Массачусетс, США) и Европейской молекулярно-биологической лаборатории Европейского института биоинформатики (EMBL-EBI) представила новый вычислительный метод, предназначенный для определения функций и свойств белков. Разработанная ими нейронная сеть глубокого обучения способна предсказывать не только функцию белка и его биологическую роль в клетке, но и его структуру, а также функциональные последствия мутаций (точечных изменений в аминокислотной последовательности).

Благодаря алгоритму, разработанному на основе глобальной базы данных семейств белковых доменов Pfam, исследователи расширили ее, добавив новые аннотации, описывающие функции белков, аминокислотная последовательность которых была определена ранее. В результате объем данных в базе увеличился почти на 10%, включая 360 новых записей, касающихся функций белков человека. Авторы отмечают, что это самое масштабное обновление Pfam за последнее десятилетие.

Читайте также:  Создано устройство для реалистичной имитации ощущения твердых поверхностей в виртуальной реальности.

Новая разработка американских биоинформатиков направлена на существенное упрощение и ускорение процесса создания лекарственных препаратов, известного как драг-дизайн. Он предполагает разработку новых лекарств с учетом строения и трехмерной структуры молекул-мишеней, которые часто являются белками. Кроме того, знание структуры белков и понимание принципов их функционирования облегчат создание новых биотехнологических ферментов для пищевой, химической и энергетической отраслей.

Статья с результатами исследования представлена в журнале Nature Biotechnology.

Помимо этого, авторы опубликовали интерактивную научную статью с подробным описанием работы их нейронной сети, оценками ее производительности и сравнением с аналогичными методами других проектов.