Анализ постов в соцсетях для выявления психических расстройств с помощью ИИ

Учёные Дартмутского колледжа разрабатывают искусственный интеллект, способный выявлять некоторые психические расстройства при анализе сообщений из социальных сетей. Для обучения и проверки системы исследователи использовали социальную сеть Reddit.

Работа, изложенная в предварительной научной публикации, размещенной на сервере… Исследователи на 20-й Международной конференции по веб-интеллекту и технологии интеллектуальных агентов представили работу о том, как искусственный интеллект выявляет три типа психических расстройств по сообщениям пользователей социальных сетей. В частности, речь идёт о глубокой депрессии, биполярном расстройстве и тревожном расстройстве.

Эксперименты провели в социальной сети Reddit по нескольким причинам: возможность обмена информацией текстом, большое количество активных пользователей (более 430 миллионов, по данным исследования) и обсуждение разных тем. Анонимность пользователей и доступ к разговорам с 2011 года предоставили исследователям много данных. В социальных сетях просто получать информацию о людях. — заявляет Сяобо Го, соавтор исследования, в сообщении Дартмутского колледжа. Информация предоставлена добровольно и доступна всем для просмотра. «, — добавляет он.

Исследователи обучали алгоритм распознаванию эмоций, предоставляя ему массив данных для анализа маркеров эмоционального состояния.

Обучение проходило в несколько этапов. Ученые не первые, кто обратил внимание на анализ эмоций в социальных сетях. Поэтому исследователи начали с использования имеющихся наборов данных, прежде чем «кормить» свой ИИ публикациями из Reddit. Для каждой категории расстройств они искали 1997 пользователей, которые заявляли о диагнозе. Также к контрольной группе были добавлены ещё 1997 пользователей, которые ничего не сообщали и никогда не обсуждали эти темы для сравнения.

Семьдесят процентов публикаций этих пользователей применялись для обучения ИИ, пятнадцать процентов – для валидации, а пятнадцать процентов – для реальных испытаний модели. Представленная модель обучена распознавать эмоции в текстах пользователей и строить карту эмоциональных изменений между сообщениями. Каждое сообщение может быть отнесено к категориям: «счастливое», «сердитое», «грустное», «испуганное» или «без эмоций», а также к их комбинациям. «, — поясняется в заявлении.

Эмоциональные расстройства (глубокая депрессия, биполярное расстройство и тревога) проявляются различными эмоциональными паттернами. Характеристики настроения играют важную роль в описании этих расстройств. Например, тревога связана с избыточным страхом и беспокойством, а депрессия — с потерей интереса или удовольствия от большинства видов деятельности.

Исследователи хотели создать карту эмоциональных состояний пользователей, показывающую, как они переходят, например, от гнева к нейтралитету во время общения.
Они считают, что существуют разные модели этих переходов, соответствующие определённым расстройствам. Например, люди с биполярным расстройством часто быстро меняют настроение. Люди же с депрессией склонны постоянно выражать грусть.

Разработанная модель фокусируется на переходах, создавая «эмоциональный отпечаток», связанный с пользователем, который можно сравнить с «типичными» подписями, соответствующими эмоциональным расстройствам. Протестировав эту модель на публикациях, не использовавшихся для обучения ИИ, исследователи обнаружили, что ИИ смог точно определить, какие пользователи могут иметь или не иметь эти расстройства.

Ученые, изучающие социальные сети с помощью «сканирующих» систем, отмечают, что данное исследование – одно из многих подобных работ. Отличительной особенностью их модели является акцент на эмоциональной окраске сообщений, а не на их содержании.

По его словам, абстрактный аспект эмоций способствует сохранению актуальности искусственного интеллекта во времени, так как не зависит от рассматриваемых тем. Такой метод помогает предотвратить серьёзную проблему, известную как «утечка информации», характерную для обычных инструментов отбора. — Объясняет Соруш Восуги, доцент кафедры информатики и соавтор исследования. Инструменты, о которых идёт речь, больше всего зависят от содержания сообщений.

Этот подход демонстрирует определённую надёжность, однако имеет и недостатки. Например, Соруш Восуги приводит пример пандемии COVID-19. В многих ситуациях её можно было бы связать с грустью или беспокойством. Это будет верным во многих случаях, но может также привести к неправильному толкованию.

Психолингвистический анализ — ещё один метод, который изучают учёные, например, как человек формулирует предложения при использовании разных способов письма. В этом случае проблема может заключаться в том, что эти манеры могут сохраняться даже после «лечения» расстройства.