Иногда для изучения космических загадок требуется сочетание различных областей исследований. Когда мы говорим о теории, данных и технологии, мы находимся на одном игровом поле. Все они одинаково важны для получения конечного результата.
Традиционно научные исследования основываются на трех фундаментальных парадигмах. Первые две — самые старые, восходящие к временам Галилея: теория и эксперимент. На них основан научно-экспериментальный метод. Однако совсем недавно появилась третья парадигма — моделирование. Благодаря современным вычислительным машинам стало ясно, что в некоторых случаях можно построить искусственные модели физических систем, установить их законы и параметры, а затем наблюдать за их развитием и собирать данные для использования в дальнейших экспериментах. Примером этого являются крупные космологические симуляции, такие как Millennium, Aquarius и Illustris.
В последние годы такое положение дел вновь изменилось благодаря науке о данных, которая быстро стала новой, четвертой парадигмой научных исследований, согласно концепции покойного Джима Грея.
Естественно, астрономия сама подверглась революционным изменениям, и в последние годы работа с использованием подхода, основанного на данных, с применением машинного обучения и добычи данных, т.е. извлечения знаний из больших каталогов и баз данных, растет экспоненциально.
Недавняя статья, опубликованная группой исследователей под руководством профессора Тильмана Хартвига из Токийского университета, является прекрасным примером того, как эти различные исследовательские парадигмы могут быть объединены для изучения тайн космоса. В статье, опубликованной в журнале The Astrophysical Journal и доступной
Тайна первых звезд: население III
Мы знаем, что звезды — это печи, в которых было выковано большинство тяжелых элементов. Они присутствуют в больших количествах в самых молодых звездах, называемых населением I, и в меньших количествах в самых старых звездах, называемых населением II.
Однако первозданная Вселенная в первые десятки или сотни миллионов лет после Большого взрыва состояла исключительно из водорода, гелия и нескольких следов лития. Это означает, что должно было существовать первое поколение звезд, популяция III, в которой более тяжелые элементы (то, что астрономы называют металлами) полностью отсутствовали, и именно там они и образовались.
Эти звезды должны были быть очень массивными и поэтому очень быстро взорвались бы в сверхновых, разбросав свои семена по Вселенной, которые затем помогли сформировать следующее поколение. Проблема заключается в том, что до сих пор не было найдено никаких следов этих звезд, кроме некоторых косвенных доказательств, несмотря на многочисленные попытки.
Звездная археология с помощью искусственного интеллекта
Хартвиг и его коллеги пытаются распутать этот клубок с помощью машинного обучения, применяемого как к реальным, так и к смоделированным данным, посредством того, что обычно называют звездной археологией. Идея заключается в следующем:
- Отбираются данные об очень старых звездах популяции II, характеризующихся особенно низким содержанием металлов.
- Эти данные используются для моделирования других, в двух различных конфигурациях. Фактически, при рассмотрении возможной звездной эволюции необходимо учитывать сценарий, в котором материя, составляющая определенную звезду, была обогащена одной сверхновой, или противоположный сценарий, в котором мы имеем обогащение в результате нескольких взрывов. Модель основана на теоретических данных о процессах нуклеосинтеза внутри сверхновых, которые должны были обогатить следующее поколение новорожденных звезд.
- Используя эти данные, команда выбрала довольно известный алгоритм машинного обучения, а именно Support Vector Machines (SVM). Это модели ИИ, которые, подобно более известным нейронным сетям, могут выполнять операции классификации или регрессии в пространстве параметров.
Разница заключается в основном в алгоритме, используемом для разделения данных. В целом, SVM предпочтительнее, когда в распоряжении нет слишком большого количества данных, в отличие от нейронных сетей, которым для хорошей работы требуется гораздо больше информации.
Но почему интересно или важно знать, была ли звезда обогащена одним или несколькими взрывами сверхновых? Просто потому, что, если предположить, что эти сверхновые были звездами популяции III, это позволит нам лучше понять среду, в которой они сформировались, и их эволюционные процессы. Другими словами, это даст нам подсказку, где искать.
Метод с неопределенными результатами
К сожалению, результаты классификации довольно неопределенны. Используемый метод, хотя и разумный, приводит к тому, что процент ложноположительных и ложноотрицательных результатов составляет около 30%. Это слишком много, чтобы считать результаты убедительными.
В любом случае, кажется, что баланс склоняется в сторону многократного обогащения. Это означает, что звезды популяции III формировались в основном в небольших скоплениях, а затем взрывались почти одновременно, чтобы обогатить следующее поколение. Ситуация несколько отличается для звезд с чрезвычайно низкой металличностью, которые, по-видимому, были обогащены одиночными сверхновыми.
Для такой работы, вероятно, потребуются более надежные данные в больших количествах, чтобы функционировать должным образом и гарантировать убедительные результаты. Не только в плане фактических данных, но и в плане данных, генерируемых моделями нуклеосинтеза, которые, возможно, придется уточнить. Возможно, это лишь вопрос времени, но охота за неуловимой популяцией III продолжается…