Высокий экономический университет создал алгоритм для мониторинга природных катастроф.

В 2024 году на географическом факультете Высшей школы экономики стартовало исследование «Лучшие практики адаптации к природно-климатическим рискам в России». Ключевым этапом работы стала разработка базы данных опасных природных явлений, охватывающей всю территорию России. Данные для её формирования собираются из открытых источников новостных публикаций из федеральных и региональных СМИ, региональных сайтов МЧС, каналов органов власти разных уровней в социальных сетях. Это огромный объем информации, который крайне сложно обработать вручную. Поэтому научные сотрудники географического факультета создали алгоритм на основе генеративной языковой модели ( GPT), способная выполнять эту задачу оперативно и с высокой степенью точности.

Выбор новостных публикаций для создания базы данных был обусловлен рядом причин. Как пояснил один из авторов проекта, научный сотрудник Риск-офиса Центра геоданных Факультета географии и геоинформационных технологий ВШЭ Анны Деркачевой, существующие базы данных нередко игнорируют события незначительного масштаба, которые в перспективе могут представлять собой существенные риски.

«Управление большим количеством схожих баз данных, а также включение в статистику МЧС, предполагает превышение определенного порога ущерба. Если дорогу ежегодно заносит лавинами, но при этом, условно, не происходит разрушения автомобилей, эта проблема может не учитываться в статистических данных и отчетах, что препятствует финансированию и включению в нормативные документы мероприятий по защите от лавин KPI. В настоящее время регионы России пересматривают свои планы по адаптации к климатическим изменениям, и сейчас самое подходящее время для сбора данных о ситуации на местах, чтобы определить приоритетные направления», — сказала Анна Деркачева.

Алгоритм способен обрабатывать до 1000 текстов в час. В ходе пилотного проекта он проанализировал свыше 8 млн публикаций и извлек из них более 50 тыс. новостных сообщений о природных катаклизмах. После извлечения алгоритм автоматически объединяет сообщения, относящиеся к одному и тому же событию, и отображает их на карте. Таким образом, из этих 50 тыс. новостных сообщений было определено около 30 тыс. различных событий.

Информация, полученная из общедоступных источников, послужит основой для проведения исследования. Впоследствии планируется разработать базу данных риск-профилей и карту вероятностей возникновения опасных ситуаций для муниципальных образований. На следующем этапе будет создана база данных, содержащая нормативные документы с конкретными рекомендациями по действиям при возникновении опасной ситуации. В конечном итоге предполагается создание единой справочной системы, в которой будут перечислены природные риски и рекомендации по мерам реагирования для каждого региона.

Источники: https://www.hse.ru/news/priority/1062688963.html

https://daily.hse.ru/post/opasnye-yavleniya-zanesut-v-bazu-v-vse-razrabotana-baza-ocenki-prirodno-klimaticeskix-riskov

Изображение: believeinme33 / ru.123rf.com