Любовь к жизни — главный плюс человека по сравнению с искусственным интеллектом.

Как возникла Вселенная? Что предшествовало Большому взрыву? Какие законы управляют галактиками? Цифровые технологии могут ли помочь в поиске ответов на эти вопросы? Каковы их преимущества и риски? Обсуждаем это с профессором РАН Григорием Игоревичем Рубцовым, заместителем директора Института ядерных исследований РАН, заведующим молодежной лабораторией обработки больших данных.

Григорий Игоревич Рубцов. Фотография работы Ольги Мерзляковой, «Научная Россия».

Рубцов Григорий Игоревич Доктор физико-математических наук, профессор РАН, заместитель директора Института ядерных исследований РАН, заведующий молодежной лабораторией обработки больших данных. Среди научных интересов — изучение Вселенной с помощью цифровых технологий, в том числе карт температуры реликтового излучения, измеренной спутниками WMAP и Planck. Лауреат Премии Правительства Москвы молодым ученым 2015 года, Медали Российской академии наук для молодых ученых 2013 года. Член Совета директоров международной коллаборации Telescope Array, член Японского физического общества.

— Вы возглавляете в Институте языковой информатики Российской академии наук молодежную лабораторию по обработке больших данных. Какие именно данные обрабатываются?

В конце 2018 года при поддержке Министерства науки и высшего образования России в ИЯИ РАН создана лаборатория обработки больших данных физики частиц и астрофизики. Руководителем стал автор этого текста. Сначала было принято на работу десять молодых ученых. С тех пор лаборатория значительно развилась, получено много научных результатов. Приходят новые сотрудники.

В физике произошла смена парадигмы: если прежде ученый записывал наблюдения, проводил простые вычисления и получал результат, то сейчас объем и сложность данных таковы, что их обработка стала отдельным направлением знания. Качество обработки влияет на качество результата: более совершенные алгоритмы дают большую точность экспериментов. Возникает выбор: либо строить дорогой эксперимент, либо чуть менее масштабный, но совершенствуя методы обработки данных, добиваться большей точности восстановления информации о частицах в эксперименте.

— Что вы регистрируете?

Мы проводим множество экспериментов. В качестве примера можно привести исследования по астрофизике частиц в Баксанской нейтринной обсерватории Института ядерной физики Российской академии наук, а также работу установки «Ковер-3» и телескопа. Array в США. Мы также работаем с установкой TAIGA В Республике Бурятия ИЯИ РАН совместно с ОИЯИ и другими научными организациями проводит эксперимент «Байкальский нейтринный телескоп», регистрирующий нейтрино высоких энергий. По методике он близок к экспериментам по регистрации космических лучей, но сложнее: трехмерная система оптических модулей находится под водой, в то время как установки для регистрации космических лучей обычно покрывают Землю двумерной системой модулей на поверхности. Установлена задача: разработка алгоритмов для всех экспериментов института и, возможно, других (в частности, с ОИЯИ), которые повысят существующую точность.

— Почему это стало возможным?

Мечта людей о машинном обучении и замене рабочих мест роботами сбылась.

Трудно ли людям выполнить эту задачу, или это просто необходимо?

Человек имеет слабую прямую вычислительную способность, но обладает сильными ассоциативными способностями и может находить закономерности. При триллионах чисел человеку сложно увидеть закономерность из-за невозможности запомнить такой объём данных.

Разработка алгоритмов, способных выполнить всё это, наверняка была непростой задачей.

Люди долго трудились над созданием моделей мозга. Еще в XIX веке была предложена модель мозга как системы нейронов. Затем разработали радиотехническую модель нейронной сети, но она не обучалась. В 1986 году произошел резкий скачок благодаря алгоритму обратного распространения ошибок, разработанному с участием Джеффри Хинтона, получившего Нобелевскую премию по физике в этом году. Этот алгоритм позволил обучить нейронную сеть достаточно быстро. В 1986 году компьютер смог различать написанные рукой цифры, а к началу 1990-х годов были созданы первые алгоритмы.

К промышленным масштабам развитие достигло в 2000-х годах. В это время грант РНФ на машинное обучение был получен, я возглавлял научную группу. С коллегами — ведущим научным сотрудником отдела теоретической физики ИЯИ РАН профессором РАН Олегом Евгеньевичем Калашевым, заведующим отделом радиоастрономии ГАИШ МГУ профессором РАН Максимом Сергеевичем Пширковым и научным сотрудником лаборатории обработки больших данных ИЯИ РАН Иваном Вячеславовичем Харуком — ведётся спецкурс по методам машинного обучения для старших курсантов физического факультета МГУ.
Курс начали вести в 2017 году и постоянно развивают. Каждый год он немного меняется, потому что технологии, представления и знания развиваются быстро, хотя база одна и та же.

Эта база послужила основой для создания лаборатории. Понимание устройства и функционирования алгоритмов даёт возможность использовать данные из экспериментов для повышения точности. Например, наш алгоритм для Байкальского нейтринного телескопа позволяет отделять сигнальные события от шума.

— Что такое сигнальное событие?

Байкальский нейтринный телескоп — сооружение внушительного размера. Для его работы применяется огромный объём воды на глубине примерно в километр, которая служит главным элементом для регистрации частиц. В воду помещены оптические модули.

В соседней комнате совершенствуются системы, предназначенные для затопления.

Там ведут производство и разработку новых технологий более совершенных и качественных оптических модулей, потому что технология очень сложная. На глубине 1 км давление в 100 атмосфер, модули должны не только находиться там, но и передавать информацию, а значит, нужны разъемы, которые не будут протекать при таком давлении. Установка рассчитана на десятилетия работы, поэтому технологии отрабатываются в ИЯИ с большим вниманием. Над ней работали около 40 лет, пока добились того, что есть сейчас. При получении данных каждое событие стоит очень дорого. Про некоторые события можно сказать, что каждое из них обошлось в несколько миллионов рублей.

— А что это за события?

Установка предназначена для регистрации нейтрино с высокой энергией, прибывших из удалённых космических объектов.

— Иначе говоря, это галактические нейтрино?

Это могут быть нейтрино галактического или экстрагалактического происхождения. Нейтрино могут originate из нашей Галактики или из других галактик — в том числе далеких, мощных, где в центре находится сверхтяжелая черная дыра и которые обладают большой способностью излучать частицы больших энергий. Такие нейтрино встречаются крайне редко. На Байкальском нейтринном телескопе это буквально порядка десятка событий в год.

Григорий Игоревич Рубцов. Ольга Мерзлякова, фото.

В чем же значимость получения информации о нейтрино, исходящих из далеких галактик?

Нейтрино — единственная частица, способная пройти сквозь некоторые области, например окрестности черной дыры или взрыв сверхновой, не поглощаясь.
Информация о самом взрыве, а не о произошедшем потом, может быть несена нейтрино из областей с такой высокой плотностью материи и излучения, что другие частицы туда не проходят. По-другому узнать о многих явлениях природы невозможно, кроме как зарегистрировав нейтрино. Это уникальный носитель информации.
На Земле нас ограничивают размеры ускорителей. А в космосе есть объекты гораздо масштабнее, фактически являющиеся такими ускорителями. Если их использовать в экспериментах, то мы выходим на новый уровень познания.

— А что за объекты в космосе?

Это различные катастрофические события: взрыв сверхновой, слияние двойной системы или активности сверхмассивных черных дыр. Также джеты блазаров — потоки заряженных частиц, образующиеся около сверхмассивных черных дыр. Явления обладают огромной энергией и масштабами. Некоторые действуют лишь короткое время. Если считать все это своими экспериментами, лабораторией, то возможности простираются весьма широко.

— Какие вы самонадеянные!

Физика представляет собой совокупность законов, полученных из экспериментов, в отличие от математики, где используются аксиомы и постулаты. Открытие закона Ньютона стало значительным прорывом, позволившим понять инерциальную систему отсчета и закон сложения скоростей. Однако выяснилось, что теория Ньютона имеет пределы применимости. Были открыты преобразования Лоренца и специальная теория относительности Эйнштейна, противоречащая теории Ньютона и показывающая, что при больших скоростях движения тел изменяется и закон сложения скоростей.

Сейчас мы размышляем о том, что фундаментальный закон симметрии Лоренца на больших энергиях может перестать выполняться. Поскольку у нас нет квантовой гравитации, теории при высоких энергиях, можем предположить, что эта теория имеет иную структуру. Возможно, гравитационная теория и теория относительности нарушаются при больших скоростях. Физик не должен принимать утверждения за истину. Если в учебнике написано, что преобразование действует при любой скорости, то физик обязан уточнить: при каких именно скоростях это проверено? Ранее проверка проводилась только на ускорителях — десятки тераэлектронвольт. Позже стало ясно, что проверка с помощью космических излучений и частиц с более высокими энергиями может дать больше информации о фундаментальных законах. Благодаря космическим лучам самых высоких энергий мы значительно продвинулись в понимании действия симметрии Лоренца и её справедливости.

Давайте поговорим о машинном обучении. Без него, по моему мнению, наука сейчас не может развиваться?

— Машинное обучение — инструмент. Его не стоит идеализировать. При написании гранта РНФ получили отзыв от одного из рецензентов, который являлся специалистом в области машинного обучения и высказал критику. Machine learning is not a magic — «Машинное обучение — не магия».

— Чем же ваше письмо побудило его оставить такой отзыв?

Мы написали, что применим доступные методы машинного обучения к существующим экспериментам по космическим лучам, включая гамма-астрономию. Это не волшебная палочка, но мощный инструмент, который нельзя игнорировать. До телескопов были открытия, но основная часть достижений связана с его использованием. Телескоп — это инструмент, расширяющий возможности исследования. Машинное обучение также усиливает возможность обработки больших данных, которые сейчас необходимы для экспериментов. Эксперименты многоканальные, тысячи, десятки и сотни тысяч каналов информации. Для обработки таких объемов данных нужны методы машинного обучения, мощные компьютеры и сложные алгоритмы. Машинное обучение — это необходимый инструмент, применяемый во всех крупных экспериментах в России и мире.

Будут ли достигнуты границы развития технологий на основе машинного обучения? Разве существует предел человеческому знанию?

Постоянно создаются более мощные телескопы. Поэтому считаю, что предел познаний человека очень динамичен. Когда людям кажется, что всё уже понятно, появляется кто-то, смотрящий по-новому и предлагающий новый подход. Эта область только сейчас переживает период бурного развития. Уверен, что у неё долгий путь. Будут и другие подходы, новые прорывы, но этот инструмент останется. Он совершенствоваться будет, и мы будем узнавать о нём всё новые вещи. Думаю, что через несколько десятилетий будут продолжаться открытия, связанные именно с машинным обучением.

— По вашему мнению, какие-либо человеческие способности останутся недоступны искусственному интеллекту?

— Самое сильное преимущество перед ИИ, где его никогда не догонит, — любовь к жизни, стремление жить, обязательно выжить, продолжить свой род. Миллиарды лет эволюции сделали нас оптимальными, начиная от простейших и заканчивая человеком. Человек — не такая уж давняя история, но ступень на длинном пути эволюции организмов, которые также тренировались в выживании. Многие сильные организмы, будто бы хорошо выживающие, например трилобиты, вымерли, а человек остался. В этом сила, которую не можем передать ИИ. У него не будет такого стремления. Нет мотивации. Даже если это написать в алгоритме.

— Нельзя ли алгоритму придать мотивированность, любознательность, нечто похожее на интуицию?

В алгоритмы это не закладывается напрямую. Можно обучить побеждать на конкурсе стихов, например, чтобы он старался читать стихи, которые побеждают на конкурсах. Машины учатся тому, что поставлена перед ними задача. Конечно, можно сделать из них агентов, действующих как люди: двигающихся, распоряжающихся деньгами, занимающихся деятельностью. Но всё равно они будут привязаны к тому, чему их обучили. У них нет природной силы, страсти, которые движут людьми и позволяют добиться всего, чего люди добились. Мне кажется, что в этом наше преимущество, которое мы не можем передать машинам.

Григорий Игоревич Рубцов. Фотография Ольги Мерзляковой / Научная Россия.

Какие риски связаны с машинным обучением?

Физики всегда работают с риском. Взгляните на эти предупреждения: «Осторожно, высокое напряжение!», «Опасно, радиация!». Всё, чем занимаемся мы, потенциально опасно.

— Процесс познания как таковой опасен.

Любая деятельность потенциально опасна. В лаборатории самой большой угрозы представляет собой стремянка, так как с ней случается больше всего производственных аварий. Даже обычный инструмент может быть опасен в определённых обстоятельствах. ИИ — это мощный инструмент. Если он станет универсальным и способен на многое, то окажется опасным.
Важно помнить, что ИИ — это инструмент в руках человека.
Он может оказаться опасным при использовании для совершения преступлений. В этом смысле ИИ подобен тому же топору из произведений Ф.М. Достоевского.

Вы полагаете, что человечеству удастся остановить подобные угрозы?

С топором не получилось. С стремянкой — тоже. Думаю, этому будет уделено большое внимание. Когда есть ИИ, это же автоматы, роботы, машины, которые могут двигаться сами по заложенной программе. Это топор, который самостоятельно передвигается. Люди будут регулировать эту область. Юридически это сложнее: преступление раньше начиналось там, где кто-то взял в руку топор и задумал недоброе, а сейчас преступления будут другими — когда этот топор двигается по определенной программе. Это дает юристам возможность приобрести опыт в этой теме. Это новая быстро развивающаяся тема, которая будет востребована. Во всех странах обсуждается законодательство по этому поводу.

Это не то машинное обучение, которое используют физики. Мы применяем его к данным: оно обрабатывает числа и выдаёт число. Оно не может навредить так же, как логарифмическая линейка, если её не ударить по голове. Поэтому в физике это самое безопасное применение алгоритмов, хотя мы понимаем, что это мощные инструменты.

— Какие основные законы физики хотели бы осмыслить с использованием этих алгоритмов? Что является вашей научной мечтой?

— Хочу раскрыть тайну происхождения космических лучей с наивысшей энергией. Мне интересно понять, как формируются и появляются частицы с энергией около 10… 20 эВ.

— А это неизвестно?

По сей день это осталось неясным. Учёные добились значительных успехов в этой сфере. В 2023 году в рамках международного сотрудничества Telescope Array опубликовали статью в ScienceВ ходе эксперимента обнаружили одну из самых высокоэнергичных за всю историю зарегистрированных частиц — частицу с энергией 2,4 * 10. 20 Событие назвали «частица Аматерасу» в честь японской богини Солнца. Ученые называют ее так, хотя это популистский подход. С помощью нейронных сетей установлено, что это не гамма-квант. Это частица адронной природы — либо протон, либо ядро какого-то химического элемента. Вероятно, это тяжелое ядро, как ядро железа. Этот результат требует дополнительного подтверждения. Проблема в том, что в области неба, откуда пришла частица, не видно известных нам достаточно близких и ярких источников. Понимание природы происхождения таких частиц даст возможность узнать физику на энергиях, превышающих энергии БАКа. Возможно, обнаружим новые фундаментальные законы, которые могут изменить технологии в будущем.

— Если не удаётся найти источник, откуда исходят эти бурные энергии, то что это может быть? Может быть, это параллельная вселенная или темная материя?

Существуют различные гипотезы. Одна из них — распад сверхтяжелой темной материи. Её почти исключают, так как это не гамма-квант, а адронная частица. Адронная сеть помогла сделать эту гипотезу менее предпочтительной. Вероятно, причина кроется в катастрофических событиях: взрывах сверхновых или аномальных магнитных объектах с огромными магнитными и электрическими полями. Такие объекты могут появляться в галактиках на короткое время и являться источниками.

Другая загадка, моя вторая мечта — понять состав магнитных полей между галактиками. Между галактиками почти пустое пространство. Но там есть магнитные поля огромного масштаба. Это турбулентные поля с колмогоровским спектром случайного характера. Никто не может их измерить. Считается, что согласно современным данным, эти поля существуют, но диапазон их амплитуды от 10… -15 гауссов до 10-9 Гауссов — шесть порядков по величине! Никто не знает их масштаба, как они образовались. Предполагают, что возникли либо в ранней Вселенной при появлении галактик, либо позже. Но масштаб и пустота внегалактического пространства настолько громадны, что сейчас наполнить его магнитными полями — задача непреодолимая, даже несмотря на множество катастрофических процессов во Вселенной. Решение вопроса может пролить свет на происхождение Вселенной и наших галактик.

— Вы сказали, что в вашей лаборатории для молодежи трудится десять человек. Какие у них профессии?

Мы провели конкурс в институте, отобрали аспирантов достаточно сильных, чтобы за три года защититься. Конкурс был с большим перевесом участников на место. Специалисты такого уровня — «штучный товар», сейчас серьезная нехватка кадров, идет борьба между организациями за талантливых молодых людей. Когда мы нашли и приняли их, были очень рады. Мы продолжаем принимать новых людей, у нас большая часть сотрудников защитила диссертации, теперь кандидаты наук с высокой квалификацией, которые ведут самостоятельную научную работу. Например, научный сотрудник лаборатории Иван Вячеславович Харук руководит проектом Российского научного фонда по внедрению нейронных сетей в анализ данных Байкальского нейтринного телескопа. Старший научный сотрудник лаборатории Михаил Юрьевич Кузнецов занимается обработкой данных экспериментов. KASCADE и Telescope ArrayЛаборатория добилась значительных результатов в изучении происхождения и состава космических лучей. Выводы лаборатории по обработке больших данных ИЯИ РАН презентуют на ведущих российских и международных конференциях. Наиболее важные открытия ещё предстоит сделать.

— В какой области вы ожидаете результатов?

— Думаю, это будет данные по космическим лучам ультравысоких энергий. Должны наконец выяснить их полный состав и источники. В рамках сотрудничества Baikal-GVDКоалиция научных организаций, включающая ИЯИ РАН, ОИЯИ, ИГУ, МГУ и другие, стремится определить источники нейтрино сверхвысоких энергий. Цель — выяснить, какая часть этих нейтрино имеет галактическое происхождение, а какая — внегалактическое. Для этого необходим более сильный и точный анализ, который может быть обеспечен применением машинного обучения.

В научном центре ведут исследования магнитных полей ранней Вселенной, космологии и моделей гравитации. Цель — изучить возможность модификации гравитации для объяснения рождения и существования нашей Вселенной.

— Как же объяснить существование нашей Вселенной?

Мы наблюдаем Вселенную с помощью множества телескопов и имеем общее представление о её устройстве. Её возраст составляет около 13–14 миллиардов лет. С момента возникновения Вселенной 300 тысяч лет она относительно прозрачна, и мы видим её. Карта реликтового излучения – это практически фотография Вселенной в таком возрасте.
В более ранние времена, с помощью свойств наблюдаемого реликтового излучения, мы постигаем динамику плазмы и то, как было устроено всё в первые три минуты, когда происходил нуклеосинтез – синтез первичных элементов из нейтронов и протонов, образовывался гелий.

Что происходило до этой горячей стадии? Большой взрыв — это название более поздней эволюции, начиная с нескольких секунд или долей секунды. Что случилось в первые аттосекунды, когда Вселенная должна была иметь планковские плотности, неизвестно. Как это возможно? Существуют разные механизмы: механизм инфляции, альтернативные механизмы, например, механизм конформного скатывания, предложенный академиком Валерием Анатольевичем Рубаковым. Каждый из них имеет различные предсказания. Мы сейчас обрабатываем данные спутника по реликтовому излучению и можем различить разные процессы, происходившие в первые аттосекунды жизни Вселенной. Возвращаясь к фундаментальным проблемам, нужно задаться вопросом: как она возникла?

Вопрос возникает у любого, кто хоть немного думает о вещах: что было десять миллиардов лет назад? Не было ничего? Но что такое «ничего»?

Вопросы о вечном существовании вещей поднимали ещё Аврелий Августин и Луций Сенека. В ответ на них утверждалось, что Бог вечен, а материальные предметы возникли и исчезнут. Такой вывод не удовлетворяет всех. Поэтому рассматриваются модели, где Вселенная не возникла из точки, а существовала ранее, потом сжалась и снова начала расширяться.

— И так все время?

Так она сможет существовать вечно. Но для этого нужно построить решение типа отскока, а это подразумевает модификацию теории гравитации. Такой работой занимается научный сотрудник лаборатории Виктория Евгеньевна Волкова. В ближайшее время ожидаются новые интересные результаты.