Анализ того, как люди ищут способы проведения досуга дома или на улице, может помочь спрогнозировать вероятность новых волн коронавирусной инфекции и определить районы их возможного распространения. К такому заключению пришли исследователи, проанализировав данные онлайн-запросов в течение четырех месяцев.
Американские исследователи изучили историю поисковых запросов в США в период с марта по июнь 2020 года. На основе данных Google Trends они проанализировали тенденции, касающиеся передвижений, посещения общественных мест и самоизоляции, чтобы создать два показателя: мобильности и изоляции. Для оценки общего изменения был разработан «индекс чистого перемещения», который отражал разницу между этими двумя показателями.
После этого исследователи классифицировали поисковые запросы в две группы, или «трека»: трек индекса мобильности, включавший поиск, относящийся к взаимодействию с другими людьми за пределами жилища (например, «театры поблизости», «авиабилеты»), и трек индекса изоляции, в который вошли запросы, связанные с деятельностью дома («доставка еды», «йога дома»).
Затем ученые изучили динамику распространения болезни Covid-19 через 10-14 дней — ожидаемая разница между заражением и первыми симптомами, — изучив данные государственных и местных органов здравоохранения. Они обнаружили, что индекс чистого перемещения коррелировал с новыми случаями заражения за исследуемый период. Кроме того, резкие падения индекса мобильности сопровождались таким же резким снижением данных о росте заболеваемости. Подробности опубликованы в журнале Social Network Analysis and Mining.
«Чтобы понять, как пандемия повлияла на общество, мы использовали новые для эпидемиологии инфекционных заболеваний источники информации, – пояснил Энесс Бари, автор исследования. – Поисковые запросы, связанные с временем закрытия местных заведений, таких как бары и тренажерные залы, могут предоставить ценные сведения о потенциальных рисках».
«По словам Меган Коффи, соавтора исследования, представленные методики могут быть применены для противодействия пандемии, позволяя заблаговременно выявлять очаги потенциальных вспышек.
В перспективе команда намеревается разработать базу данных, в которой будет собрана информация о трансформации поведения людей. Создание этой базы данных будет осуществлено с использованием альтернативных данных, полученных в ходе жизненного цикла пандемии. Это позволит алгоритмам машинного обучения прогнозировать поведение в случае возникновения новых эпидемий.
Исследователей вызывает озабоченность, что подобные способы предсказания вспышек могут поставить под угрозу приватность пользователей. Вместе с тем, они отмечают, что инструмент обрабатывает огромные массивы поисковых запросов и опирается на анонимизированные данные. Это должно решить проблему защиты личной информации.