Система машинного обучения научилась предсказывать землетрясения с точностью до часов

Японские сейсмологи обучили нейросеть на большом каталоге сгенерированной сейсмической активности, чтобы выяснить, как искусственный интеллект анализирует эти данные. Предсказания лабораторных землетрясений оказались точными вплоть до часов перед главным ударом.

Эпицентры землетрясений 1963-1998 годы

Эпицентры землетрясений 1963-1998 годы / © Wikimedia Commons, NASA.

Важное направление в геологической науке — изучение и предсказание землетрясений. Но поскольку у человечества не столь много данных о прошлых землетрясениях, а закономерности их возникновения достаточно неуловимы, помочь в таких исследованиях может искусственный интеллект. Этот метод уже показал свою эффективность. Например, система машинного обучения, прослушивая акустический сигнал лабораторных землетрясений, научилась предсказывать толчки по данным, которые люди раньше принимали за шум. Примечательно, что она не знала о прошлых землетрясениях и основывалась на мгновенных физических характеристиках.

Тем не менее использовать нейросети для предсказания реальных разломов пока рано. Во-первых, типичные временные интервалы землетрясений исчисляются сотнями и тысячами лет, а для прогнозов нужно учитывать подробности, короткие временные промежутки — месяцы и дни.

Во-вторых, сейсмологи пока не понимают, каким образом система машинного обучения предсказывает лабораторные землетрясения. И возможное решение проблем состоит в том, чтобы посмотреть, как искусственный интеллект будет работать с каталогом «искусственных разломов», которые возникают по понятным причинам.

Именно этим занялась группа японских исследователей из Киото. Они взяли каталог 18 тысяч землетрясений, созданный при моделировании сейсмической активности за 900 лет. С этим каталогом ранее работали другие сейсмологи из Японии, которые установили, что крупные форшоки (предшествующие толчки) как раз перед мейншоками (главные удары) показывают характерное увеличение частоты. В новом исследовании, опубликованном в журнале Geophysical Research Letters, специалисты решили посмотреть, как нейросеть оценит время до главных толчков на основе ранее смоделированных землетрясений.

(a) Оценка R2 (точность прогноза) в зависимости от объема обучающих данных в сценарии по умолчанию. После ∼300 лет (т.е. ∼20 главных толчков) обучающих данных предсказание становится очень точным. (b, c) Долгосрочное и краткосрочное предсказание по минимальному обучающему набору (т.е. только с двумя циклами главных толчков). (d) Интервал повторяемости мейншоков в сценарии модели последовательности землетрясений с рандомизированным уровнем нагрузки. (e, f) Долгосрочные и краткосрочные прогнозы по модели случайного леса с множественным сетевым представлением в сценарии рандомизированной нагрузки / ©Geophysical Research Letters, Reiju Norisugi et al.
(a) Оценка R2 (точность прогноза) в зависимости от объема обучающих данных в сценарии по умолчанию. После ∼300 лет (т.е. ∼20 главных толчков) обучающих данных предсказание становится очень точным. (b, c) Долгосрочное и краткосрочное предсказание по минимальному обучающему набору (т.е. только с двумя циклами главных толчков). (d) Интервал повторяемости мейншоков в сценарии модели последовательности землетрясений с рандомизированным уровнем нагрузки. (e, f) Долгосрочные и краткосрочные прогнозы по модели случайного леса с множественным сетевым представлением в сценарии рандомизированной нагрузки / ©Geophysical Research Letters, Reiju Norisugi et al.

Авторы научной работы классифицировали все землетрясения, кроме главных, как форшоки, объясняя это тем, что афтершоков (повторных толчков) в списке мало. Но нейросеть этой классификации не видела и анализировала данные классическим и эффективным в прогнозировании методом случайного леса. Затем исследователи изучили, как размер обучающих данных (интервал и количество толчков) влияет на точность прогнозов, и сгенерировали каталог «искусственных землетрясений» за две тысячи лет.

Выяснилось, что нейросеть на основе нескольких землетрясений может рассчитать признаки приближающегося мейншока в условиях, когда до главного удара осталось меньше часа. Но такой подход слишком чувствителен к поведению, похожему на мейншок, когда много толчков случаются за короткий промежуток времени. Иными словами, точность теряется при увеличении временного масштаба.

Напротив, ИИ с крупной сетью данных с трудом распознает признаки скорого главного толчка, но отражает общий тренд. Наиболее эффективной показала себя модель со средним уровнем сетей, то есть она учитывала как длительные процессы, так и короткие последовательности. Точность такого прогноза составила 0,89, где максимальное значение — 1,00.

Распределение признаков на обучающем наборе в зависимости от времени до главного толчка. Контур показывает плотность вероятности признака, аппроксимированную оценкой плотности ядра. (a) Плотность вероятности среднего сейсмического момента для сети со средним числом форшоков 5% (b-f) Плотность вероятности среднего времени повторения для сети со средним числом форшоков 5%, 20%, 40%, 60%, 80%, соответственно. Увеличение сейсмического момента и уменьшение интервала повторяемости при разных размерах сети позволяет точно предсказать время до главного толчка. Различные признаки, полученные при разных размерах сети, демонстрируют предсказательную силу на разных временных масштабах / ©Geophysical Research Letters, Reiju Norisugi et al.
Распределение признаков на обучающем наборе в зависимости от времени до главного толчка. Контур показывает плотность вероятности признака, аппроксимированную оценкой плотности ядра. (a) Плотность вероятности среднего сейсмического момента для сети со средним числом форшоков 5% (b-f) Плотность вероятности среднего времени повторения для сети со средним числом форшоков 5%, 20%, 40%, 60%, 80%, соответственно. Увеличение сейсмического момента и уменьшение интервала повторяемости при разных размерах сети позволяет точно предсказать время до главного толчка. Различные признаки, полученные при разных размерах сети, демонстрируют предсказательную силу на разных временных масштабах / ©Geophysical Research Letters, Reiju Norisugi et al.

Причины, по которым модель искусственного интеллекта способна предсказывать лабораторные землетрясения, как предполагают сейсмологи, состоят в том, что нейросеть анализирует эволюцию сейсмического импульса и интервал повторяемости толчков. Увеличив размер обучающих данных, исследователи получили ожидаемый результат. Чем меньше набор данных, тем меньше точность, но интересно, что качество не сильно выросло при анализе 115 циклов мейншоков (большой каталог) по сравнению с 41 циклом (маленький каталог). Авторы посчитали, что нейросеть достигла своего предела.

Совокупно такой подход к обучению ИИ позволяет прогнозировать время до главного удара с высокой точностью. Предсказания работают как в масштабе десятилетий, то есть задолго до предстоящего землетрясения, так и в интервале часов и минут непосредственно перед мейншоком.

В будущем необходимо проверить, как модель будет вести себя в реальных условиях, где сейсмические каталоги содержат гораздо меньше данных (несколько десятилетий). Вдобавок эти эксперименты проходили на одном разломе глубиной 2,4 километра, и неясно, сможет ли новая система работать в более сложной ситуации. Наконец, пока не вполне ясно, будет ли такая система вообще работать на реальных землетрясения.

Отметим, что в попытках создать автомобили без водителя Waymo и ряд других компаний уже использовали обучение нейросетей на программно симулированном «вождении», чем-то похожем на лабораторные землетрясения из новой научной работы. Разработчики беспилотных машин думали, что, поскольку объем симулирования может быть намного больше, чем у реального вождения, он лучше научит их ПО управлять машиной.

Однако оказалось, что симулированное вождение лишено специфики, характерной для вождения реального, поэтому на практике все так называемые беспилотные машины до сих пор требуют удаленного управления инженерами в критически сложных ситуациях.


Источник