Биологи МГУ выяснили, какие белки регулируют работу генома человека

Искусственный интеллект и анализ данных о трех тысячах белков помогли биологическим ученым МГУ имени М.В. Ломоносова определить, какие молекулы контролируют функционирование генома человека. Специалисты объединили информацию, полученную в ходе множества исследований, чтобы разработать первую всеобъемлющую классификацию хроматома – комплекса белков, составляющих хроматин.

Более чем двадцать пять лет назад была расшифрована последовательность нуклеотидов в геноме человека, но до сих пор понимание принципов его функционирования остаётся неполным. Геном представляет собой не просто упорядоченную последовательность нуклеотидов, а совокупность реально существующих молекул ДНК, образующих сложные и изменчивые структуры благодаря взаимодействию с белками. Именно эти взаимодействия позволяют информации, заложенной в геноме, трансформироваться в указания по созданию новых молекул, что и является основой жизни. Благодаря комплексному анализу данных, собранных мировым научным сообществом, касающихся роли белков в работе генома человека, и с использованием технологий искусственного интеллекта, ученые биологического факультета МГУ предоставили наиболее достоверный на текущий момент ответ на вопрос о том, какие белки задействованы в функционировании генома человека. В ходе анализа более трех тысяч белков исследователи определили их характеристики и выяснили, как они контролируют работу генов.

Результаты работы опубликованы в престижном международном научном журнале Nucleic Acids Research.

В каждой клетке человеческого организма содержится геном – исчерпывающий комплект генетической информации, зафиксированной в молекулах ДНК. Функционирование клетки, развитие организма и появление многих болезней определяются тем, какие гены активируются и деактивируются в данный момент времени. В связи с этим, ключевой задачей современной биологии является выяснение механизмов, контролирующих активность генов.

ДНК – это молекулы, общая длина которых достигает примерно двух метров, и они содержат информацию, необходимую для создания других молекул, таких как РНК и белки. При этом в клетке ДНК умещается в относительно небольшом ядре, диаметр которого составляет всего около десяти микрометров. Ядро можно сравнить с «компьютером» клетки: именно в нем хранится генетический код и определяются гены, которые будут активны.

Читайте также:  Исследование МГУ: древние деревянные руки из Новгорода могли быть ритуальными предметами

Для того чтобы вместиться в ядро, длинные молекулы ДНК скручиваются вместе со специализированными белками. Эти белки, являющиеся биологическими молекулами, состоящими из аминокислотных цепочек, выполняют большинство функций в клетке: катализируют химические процессы, передают сигналы, распознают молекулы и формируют клеточные структуры. Взаимодействуя с ДНК, эти белки формируют хроматин. Они обеспечивают не только плотную упаковку генетического материала, но и контролируют доступ к генам, определяя, какие из них будут активны.

В ядре клетки содержится огромное количество разнообразных белков, ассоциированных с хроматином. Некоторые из них непосредственно взаимодействуют с ДНК, в то время как другие — посредством сложных белковых структур. Эти белки способны мигрировать между ядром и цитоплазмой, функционировать в различных областях генома и на разных этапах клеточного цикла. Такое многообразие затрудняет создание полной картины их состава и функций. При этом имеющиеся экспериментальные подходы предоставляют лишь частичные сведения. Геномика и 3D-геномика позволяют исследовать трехмерную структуру генома, однако зачастую не принимают во внимание роль белков. В свою очередь, методы структурной биологии эффективны для изучения отдельных белковых молекул, но оказываются малопригодными для анализа сложной и изменчивой среды клеточного ядра.

Современная биология располагает обширными наборами данных, полученных с помощью микроскопии, масс-спектрометрии, геномных исследований и множества других научных работ. Тем не менее, эти данные зачастую фрагментарны и трудно поддаются сравнению. Для формирования целостного представления о белках хроматина человека ученые осуществили масштабный биоинформатический мета-анализ, объединив информацию из различных источников, таких как экспериментальные работы, биологические базы данных и научные публикации. Благодаря сопоставлению этих данных, исследователям удалось упорядочить знания о белках, вовлеченных в функционирование генома. В конечном итоге была разработана классификация белков хроматина, включающая 40 функциональных групп, и составлен справочный перечень, содержащий приблизительно три тысячи белков, связанных с хроматином человека.

На основе данной классификации исследователи сопоставили белки, принадлежащие к различным группам, оценивая такие параметры, как размеры, аминокислотный состав, электростатический заряд и прочие физико-химические свойства. Благодаря этому удалось глубже разобраться в характеристиках белков, вовлеченных в организацию и регуляцию генома.

Читайте также:  Впервые зафиксировано образование мимолетной молекулы в процессе окисления

В ходе исследования особое внимание было уделено структуре белков. Как правило, белки формируются из структурных доменов – компактных областей, ответственных за выполнение конкретных функций. С применением методов машинного обучения ученым удалось выявить в белках хроматина ранее неизвестные домены, представляющие интерес для последующих исследований.

Замеченный эффект обусловлен и так называемыми неупорядоченными областями белков. В биологии долгое время полагали, что раскрыть функции белка можно, определив его строгую трехмерную организацию. Тем не менее, выяснилось, что многие белки, в особенности те, что участвуют в регуляции генов, содержат участки, лишенные постоянной формы. Эти податливые фрагменты способны взаимодействовать с разнообразными молекулами и создавать мимолетные молекулярные комплексы. В ряде случаев они формируют внутриклеточные структуры – биомолекулярные конденсаты, похожие на микроскопические «капли», которые содействуют организации сложных процессов, таких как регуляция транскрипции. Проведенное исследование выявило, что белки хроматина характеризуются повышенным содержанием таких неупорядоченных областей, что может служить объяснением их способности к множественным взаимодействиям и тонкой настройке работы генов.

Интерактивный веб-ресурс содержит результаты исследований и структурированную информацию о белках хроматина человека SimChrom. Платформа предоставляет возможность исследовать расположение белков в ядре клетки, их доменную структуру и функциональные характеристики. Разработанная база данных и система анализа позволяют получить комплексное представление о хроматоме — структуре, объединяющей все белки, взаимодействующие с хроматином.

Изучение того, как эти белки структурируют геном и контролируют экспрессию генов, имеет большое значение не только для основ биологии. Дисфункция белков хроматина способна вызывать различные патологии, в том числе онкологические заболевания. В связи с этим, подобные исследования могут способствовать выявлению молекулярных основ болезней и созданию инновационных методов их выявления и предотвращения.

«В ходе исследования мы собрали и проанализировали различные данные о белках, составляющих хроматин и клеточное ядро человека. Это позволило нам определить общие закономерности организации и ключевые характеристики хроматома человека, а также его отдельных функциональных групп. При этом особое внимание было уделено изучению структуры хроматома и описанию механизмов многостороннего взаимодействия в хроматине, осуществляемых с помощью белковых доменов» , — подчеркивает первый автор статьи, младший научный сотрудник биологического факультета МГУ Анна Грибкова.

Читайте также:  Разработан метод контроля движения заряженных частиц без использования магнитных полей

«В теле человека содержится приблизительно 30 триллионов клеток, и в каждой из них присутствует геном. В целом, набор генов, находящихся в активном состоянии, отличается в зависимости от типа клеток, определяя их особенности и дальнейшее развитие. При этом экспрессия этих генов контролируется белками хроматина. Множество исследований было проведено для изучения работы отдельных белков хроматина, но они не позволили понять работу хроматина в целом» , — по словам декана биологического факультета МГУ, академика РАН Михаил Кирпичников.

«Данная работа представляется нам основой для создания системных моделей, описывающих функционирование генома. Помимо методов геномики и 3D-геномики, результаты хроматомики окажут значительное влияние на наше представление о том, как физические характеристики и доменная структура белков влияют на организацию и принципы работы хроматина. Полученные данные закладывают основу для разработки более совершенных количественных моделей, объясняющих работу хроматина и генома человека, и открывают перспективы для анализа эпигенетических данных, а также для выявления молекулярных мишеней в терапии заболеваний человека» , — по словам руководителя исследования, профессора биологического факультета МГУ и члена-корреспондента РАН Алексей Шайтан.

Работа была осуществлена при финансовой поддержке Российского научного фонда и Министерства науки и высшего образования, а вычислительные процессы проводились на Суперкомпьютере «МГУ-270».

Информация предоставлена пресс-службой МГУ