Исследователи Дартмутского колледжа (США) разрабатывают искусственный интеллект (ИИ), который сможет выявлять определенные психические расстройства, анализируя сообщения, размещенные в социальных сетях. Для обучения и тестирования своей системы они сосредоточились на социальной сети Reddit.
Их работа, представленная в предварительной научной статье на сервере
Эти эксперименты были проведены в социальной сети Reddit по нескольким причинам. Во-первых, потому что это сеть, где люди могут обмениваться информацией в письменном виде, и у нее много активных пользователей (более 430 миллионов, согласно исследованию), которые обсуждают самые разные темы. Пользователи также анонимны, и исследователи смогли отследить разговоры до 2011 года, предоставив им множество данных. «Социальные сети предлагают простой способ получить доступ к поведению людей«, — говорит Сяобо Го, соавтор исследования, в заявлении Дартмутского колледжа. «Данные являются добровольными и публичными, публикуются для ознакомления другими«, — добавляет он.
В случае с этими исследователями целью было обучить алгоритм, «скормив» ему большое количество данных, чтобы он мог обнаруживать маркеры эмоций.
Это «обучение» проходило в несколько этапов. Исследователи не первые, кто заинтересовался анализом эмоций в социальных сетях. Поэтому они начали с использования существующих наборов данных, прежде чем «кормить» свой ИИ публикациями из Reddit. Для каждой категории расстройств они искали 1997 пользователей, которые утверждали, что им был поставлен диагноз. Они также отнесли еще 1997 пользователей, которые ничего не сообщали и никогда не обсуждали эти темы, к тестовой группе, чтобы они могли сравнить.
70% публикаций этих пользователей были использованы для обучения ИИ, 15% — для процедуры валидации, и 15% — для реального тестирования модели. «Рассматриваемая модель была обучена «маркировать» эмоции, выраженные в сообщениях пользователей, и составлять карту эмоциональных переходов между различными сообщениями, так что сообщение могло быть маркировано как «счастливое», «сердитое», «грустное», «испуганное», «без эмоций» или их комбинация«, — поясняется в заявлении.
Действительно, эмоциональные расстройства, о которых идет речь (глубокая депрессия, биполярное расстройство и тревога), демонстрируют различные «эмоциональные паттерны». Характеристики, связанные с настроением, уже являются ключевыми характеристиками, учитываемыми при описании этих расстройств. Например, тревога связана с чрезмерными страхами и беспокойством, депрессия — с потерей интереса или удовольствия от большинства видов деятельности…
На основе этих эмоциональных «меток» исследователи хотели создать своего рода «карту», которая показывает, как пользователи переходят от одного эмоционального состояния к другому, например, от гнева к нейтралитету, в процессе обмена сообщениями. Действительно, они считают, что существуют различные паттерны перехода между этими эмоциями, которые соответствуют интересующим их расстройствам. Грубо говоря, в качестве примера можно привести тот факт, что люди с биполярным расстройством склонны быстро переходить от одного настроения к другому. В отличие от них, люди с депрессией склонны выражать постоянную грусть.
Поэтому разработанная ими модель фокусируется на переходах, создавая «эмоциональный отпечаток», связанный с пользователем, который можно сравнить с «типичными» подписями, соответствующими эмоциональным расстройствам. Протестировав эту модель на публикациях, которые ранее не использовались для обучения ИИ, исследователи обнаружили, что ИИ смог точно определить, какие пользователи могут иметь или не иметь эти расстройства.
Это исследование — одно из многих, объясняют ученые, которые заинтересовались анализом сообщений в социальных сетях с помощью таких «сканирующих» систем. Однако их модель отличается от других тем, что в ней основное внимание уделяется эмоциям, а не содержанию.
По их словам, абстрактный аспект эмоций позволяет лучше поддерживать актуальность искусственного интеллекта во времени, поскольку они не зависят от обсуждаемых тем. «Этот подход позволяет избежать серьезной проблемы под названием «утечка информации», с которой сталкиваются типичные инструменты скрининга«, — объясняет Соруш Восуги, доцент кафедры информатики и соавтор исследования. Инструменты, о которых он говорит, в большей степени зависят от содержания сообщений.
Этот подход может показать некоторую надежность, но также имеет недостатки. Например, Соруш Восуги приводит в пример тему COVID-19. Во многих случаях его можно было бы связать с грустью или беспокойством. Это будет работать во многих случаях, но также может привести к неправильному толкованию.
Психолингвистический анализ — еще один подход, упоминаемый учеными: например, то, как человек должен формулировать свои предложения, используя определенные способы письма. В этом случае проблема может заключаться в том, что эти манеры могут сохраняться даже в случае «устранения» расстройства.
По словам ученых, исследования по этой теме только начинаются. Последние намерены протестировать свою модель в других социальных сетях, чтобы определить, достаточно ли она «надежна» для применения на всех платформах. Они также хотят усовершенствовать модель классификации эмоций или попробовать свои силы в анализе других типов контента, например изображений или видео. Они также намерены изучить вопрос о влиянии часов публикации или количества постов, написанных одним и тем же пользователем.