Нейросети перенимают у людей навыки живописи и создания музыки, и на текущем этапе это выглядит как любопытный прием машинного обучения. Однако, это лишь начало. Эта фаза завершится, когда нейросети начнут осваивать принципы принятия рискованных решений, выбор и применение моральных ценностей. Подобные исследования уже ведутся, и обучающие данные мы формируем сами, нередко даже не подозревая об этом. Naked Science стремится объяснить, для чего нужны нейросети, имитирующие наши способы мышления и поведения, кто получит выгоду от этого и какие риски стоит учитывать.
Разработанная специалистами из Университета Торонто, Корнеллского университета и Microsoft Research, программа анализирует шахматные партии угадывает, она определяет, кто был автором этих ходов, и способна распознать его среди тысяч других шахматистов, постоянно играющих на известном онлайн-сервере Lichess. По сути, она формирует индивидуальный подход игрока к принятию решений.
Шахматные энтузиасты уже давно обратили внимание на то, что у гроссмейстеров есть свой индивидуальный стиль игры. Одни предпочитают агрессивную тактику и готовы идти на риск, в то время как другие действуют осторожно, выжидая неточности оппонента. У кого-то сильная сторона – дебют, а другие проявляют себя особенно хорошо в эндшпилях, когда на доске остается немного фигур. В конечном счете, каждый шахматист обладает уникальными особенностями, и в его выборе ходов есть нечто, что выделяет его среди остальных. Этот стиль столь же неповторим, как уникальный отпечаток пальцев.
Программа фиксирует его действия, и ей безразлично, кто играет – опытный мастер или начинающий любитель. Она одинаково хорошо распознает всех участников.
Ключевую роль в данной работе сыграло машинное обучение: авторы использовали записи партий игроков Lichess, сыгравших не менее тысячи игр, и выделили из них последовательности до 32 ходов. Каждый ход, представляющий собой изменение позиции, был преобразован в числовое значение и передан в нейронную сеть, которая затем отображала любую партию как точку в многомерном пространстве. Для нейросети все партии шахматиста формируют скопление точек, или кластер. Обучение нейросети заключалось в максимизации плотности кластера для каждого игрока и увеличении расстояния между кластерами, принадлежащими разным игрокам.
Нейросеть теперь способна определять людей, анализируя сходство их партий и объединяя их в кластеры. Этот кластер отражает индивидуальный стиль игрока, который не всегда очевиден, но обнаруживается машиной. При этом она способна различать игроков с высоким рейтингом, даже если обучена на партиях любителей, и наоборот. Программа действительно улавливает индивидуальные особенности.
По мнению авторов исследования, аналогичный подход применим и к покеру. Они утверждают, что при наличии необходимых данных программа могла бы распознавать личность по стилю вождения или по времени и месту использования мобильного телефона.
В сущности, цифровые следы, оставляемые нами в сети, могут служить заменой шахматным ходам. Практически любая достаточно продолжительная история поведения, преобразованная в цифровой формат, содержит информацию, пригодную для обучения подобных программ. Индивидуальность человека проявляется в уникальных последовательностях его действий, поскольку каждый из нас, даже в незначительных деталях, отличается от других. Если ранее для сокрытия своей деятельности можно было изменить почерк или голос, то изменить стиль принятия решений гораздо сложнее – это сопряжено с необходимостью изменить свою психику. При этом заранее невозможно предугадать, какие признаки будут выделены сетью и что конкретно необходимо скрывать.
От определения индивидуального стиля к прогнозированию: игры и моделирование человеческого поведения
Разработчики программы выражают обеспокоенность тем, что их методика применима не только в шахматах, но и может быть применена в других сферах. Нейросеть можно обучить на любых доступных данных, однако это вызывает этические вопросы. Ведь стремление к анонимности, которое свойственно не только злоумышленникам, но и обычным людям, не всегда обусловлено негативными намерениями. Машинное обучение может раскрыть эту анонимность.
В теории это предполагает, что использование чужого IP-адреса больше не позволит скрыть личность — каждого пользователя можно будет идентифицировать по его индивидуальным особенностям, проявляющимся в любой форме активности.
Хотя это звучит правдоподобно в теории, на практике все сложнее. Для обучения искусственного интеллекта сначала необходимо собрать размеченные данные, то есть зафиксировать цифровые следы каждого из миллионов пользователей, присутствующих в интернете, причем желательно в течение нескольких месяцев. После этого необходимо постоянно отслеживать их активность в сети. Это сопряжено с необходимостью использования значительных вычислительных ресурсов, а они, в свою очередь, требуют дополнительных затрат энергии. Кроме того, пользователи посещают различные веб-сайты, и связать их поведенческие цепочки возможно только в случае активного обмена данными между этими сайтами, что маловероятно (за исключением некоторых случаев, когда сайты принадлежат крупным корпорациям, например, «Инстаграм» и «Фейсбук).
Крупные платформы, обладающие значительной аудиторией, способны получать подобные сведения. В основном именно они и будут собирать цифровые отпечатки пользователей, однако не для идентификации их личностей: гораздо более ценно использовать эти данные для анализа и прогнозирования поведения, например, в целях маркетинга. Социальные сети предоставляют хорошие возможности для этого, но наиболее эффективной средой являются массовые онлайн-игры.
Игра позволяет наглядно продемонстрировать особенности психики. В процессе игры люди постоянно принимают решения и взаимодействуют друг с другом в динамичной и сложной обстановке. Это требует тактического и стратегического мышления, а также обучения и приобретения опыта. Некоторые игроки посвящают играм годы, что позволяет им формировать обширную историю своих действий. Кроме того, миллионы пользователей играют в подобные игры, генерируя значительные объемы данных, которых достаточно для машинного обучения.
Люди, начавшие играть в подростковом возрасте, часто продолжают это делать на протяжении многих лет, вместе с развитием игровой вселенной. За это время формируется и углубляется их индивидуальный подход к принятию решений, что может оказаться весьма полезной информацией в будущем. Впоследствии, бывшие подростки нередко становятся руководителями бизнеса, высокопоставленными чиновниками, политиками или военачальниками. Обученная на обширном наборе данных, система сможет не только определить особенности их мышления и поведения, но и позволит строить прогнозы относительно их действий.
Точность прогноза также определяется тем, будут ли люди придерживаться своих привычных моделей принятия решений в течение десятилетий. Ответить на этот вопрос однозначно сложно, однако долгосрочные исследования показывают, согласно исследованиям, ключевые характеристики личности демонстрируют относительную устойчивость на протяжении всего жизненного пути, от юности до зрелости. Так, если молодая женщина отличается склонностью к самоанализу, то и в пожилом возрасте она продолжит уделять внимание внутреннему миру. Аналогично, если молодой человек характеризуется повышенной восприимчивостью, то с возрастом он не утратит эту особенность.
Незначительные детали можно смягчить или углубить, однако изменить фундаментальные основы психики сложно. Весьма вероятно, что индивидуальные черты мышления и восприятия, подобно темпераменту, останутся с человеком на протяжении всей его жизни. Если же программы научатся распознавать эти особенности, это может привести к существенным последствиям.
Нейронные сети обладают не только способностью выявлять неочевидные закономерности в данных, но и возможностью воспроизводить их. Шахматная программа, разработанная в Университете Торонто, эта система способна играть в шахматы, подобно людям, прогнозировать действия конкретного игрока и даже предвидеть его вероятные ошибки в процессе партии. Она обладает информацией о том, какие ошибки свойственны игрокам разного уровня мастерства, и может определить, на каком уровне эти ошибки перестают допускаться.
Иными словами, программа не ищет лучший ход для данной позиции — она предлагает ходы, которые сделал бы человек. Она моделирует процесс принятия решений шахматистами. Это и есть прогнозирование.
От предсказаний к влиянию: машины как психологи
Вероятность того, что влияние распространится и за пределы виртуальных шахматных миров, представляется высокой. В прошлом году психологи из Принстона представили в журнале Science статью «Для выявления закономерностей, определяющих принятие решений человеком, применялись масштабные эксперименты и методы машинного обучения. Нейронная сеть была обучена на обширной базе данных, сформированной группой исследователей на протяжении многих лет. В ней аккумулированы результаты психологических исследований, посвященных рискованному выбору, в частности, азартным играм. База данных включает более 10 000 различных сценариев, в которых участники принимали решения.
По результатам исследований, нейронные сети, прошедшие обучение, демонстрируют способность с высокой точностью воспроизводить принятие решений человеком, превосходя при этом более ранние психологические модели, описывающие рискованное поведение.
Благодаря машинному обучению психологам удалось разработать новую, более действенную теорию поведения, создание которой ранее было невозможным. Это вполне объяснимо: при попытке понять выбор людей, эксперты формулируют предположения и опираются на интуицию, однако возможности человеческого разума ограничены объемом экспериментов, которые он способен осмыслить. Психологу не под силу проанализировать обширный массив данных, содержащий решения сотен тысяч людей, принятых в различных ситуациях выбора.
Для искусственного интеллекта это не составит труда.
Как насчет моральных проблем? Проект «Машина морали» платформа собрала уже около 40 миллионов решений, предоставленных людьми из более чем 200 стран. Это самый масштабный онлайн-эксперимент, когда-либо проводившийся для изучения моральных дилемм. В рамках эксперимента участников просят принять решение в смоделированной ситуации дорожного движения, где беспилотный автомобиль должен выбрать направление движения. Испытуемым предлагается определить, кого спасти, а кем пожертвовать. На изображении могут быть представлены различные персонажи, такие как мужчина, ребенок, женщина-врач или собака, а также разные варианты окружающей среды. Создано миллионы уникальных задач, требующих морального выбора.
Объем такого многогранного пространства решений слишком велик для человеческого восприятия. Однако, нейронная сеть, прошедшая обучение на этих данных, предоставила психологам построить «информативную психологическую теорию, способную к интерпретации и определяющую комплекс моральных принципов, на которых основаны суждения людей». Авторы утверждают, что данная теория превосходит предшествующие разработки, и благодаря ей удалось выявить три новых эффекта.
Используя машинное обучение, можно не только выявлять особенности стиля принятия решений, но и прогнозировать, какое решение будет принято. Однако, сможет ли технология выйти на новый уровень и повлиять на выбор человека? Вероятность этого существует. В прошлом году IBM Research AI продемонстрировала автономную компьютерную систему Project Debater, система способна вести дискуссии с людьми в реальном времени. Разработчики Project Debater намеренно придали голосу системы механический оттенок, чтобы избежать путаницы со стороны зрителей.
Большие языковые модели демонстрируют все более глубокое понимание текстов и сюжетов, а также способность выявлять причинно-следственные связи и логически рассуждать. Недавно компания Google AI достигла нового этапа развития, обучив модель PaLM не просто выдавать верные ответы в задачах на логику, но и объяснять, почему они верны. Она даже может разжевать смысл шутки, для человека, который видит это впервые, это может показаться невероятным. Однако, учитывая скорость развития, мы стоим на пороге создания систем, которые смогут генерировать убедительные аргументы по любому вопросу.
Люди играют — нейросети учатся
Объединив упомянутые выше технологии, можно создать устройство, которое будет определять манеру принятия решений конкретного человека, прогнозировать возможные сценарии его будущих действий и, исходя из его индивидуального стиля, подбирать систему аргументов для того, чтобы склонить его к определенной линии поведения или мышления.
Какие люди могли бы проявить интерес к этому устройству?
Персональные данные из крупных социальных сетей были использованы для создания психологических профилей и таргетированной политической агитации в различных избирательных кампаниях по всему миру. Скандал с Cambridge Analytica достиг своего пика после выборов президента США в 2016 году, когда все внимание было направлено на неприемлемость таких методов, включая Facebook, чьи данные были заимствованы. Однако важно признать тот факт: схемы, основанные на машинном обучении, действительно эффективны.
Онлайн-игры предоставляют отличную возможность для сбора информации о процессе принятия решений людьми. Эти данные, конечно же, активно собирают. Действия пользователей фиксируются, после чего в наборах телеметрии программы анализируются закономерности, и на их основе создаются модели поведения. Например, исследователи из Ааленского университета в Германии, используя машинное обучение изучили поведенческие данные 700 000 пользователей в 3300 играх на платформе Steam. Первым делом программа распределила игроков на категории по манере игры, затем углубилась в поиск индивидуальных стилей в найденных категориях.
Анализ поведения игроков на основе игровой телеметрии становится все более востребованной областью исследований. В контексте разработки игр это позволит создавать более захватывающие проекты и одновременно увеличивать их доходность, стимулируя игроков к более активным тратам. Для достижения этой цели важно уметь предсказывать их действия и типичные решения в различных игровых сценариях.
Впечатляет, что такой анализ уже делают в режиме реального времени. Например, можно вычислить аномалии в поведении игрока прямо во время сражений в MOBA. Аномалии указывают на вероятное мошенничество — для индустрии киберспорта, которую уже оценивают более чем в 2 миллиарда долларов, это серьезная тема.
В настоящее время приблизительно столько же людей играют в онлайн-игры на различных платформах 3 миллиардов человек, и это не предел. Со временем игры будут становиться все более реалистичными, насыщенными, интерактивными и погружающими. И если сегодня игровая среда программируется от и до, в будущем ее смогут конструировать нейросети прямо по ходу игры, в зависимости от поведения игроков.
Вероятно, игровая вселенная станет частью масштабной метавселенной, которую разрабатывают крупные IT-компании. Ожидается, что регулярно в ней будут присутствовать не менее половины жителей Земли. Каждый раз, взаимодействуя в виртуальном мире, принимая решения и делая выбор, пользователи будут формировать свои уникальные цифровые профили. Эти профили могут создаваться в течение многих лет – посредством игр, развлечений, работы и онлайн-сотрудничества. В связи с этим, цифровые вселенные будут все активнее собирать персональные данные пользователей. Использование машинного обучения делает это целесообразным.
От создания картинок к масштабированию таланта
Наступает время, когда у многих пользователей, особенно у тех, кто часто играет онлайн, накопится обширный архив данных об их действиях, принятых решениях и взаимодействиях с другими людьми и ИИ-агентами. Благодаря развитым алгоритмам, появится возможность проводить глубокий анализ этой информации. Программы смогут не только определять индивидуальные особенности человека, но и формировать его поведенческую и психологическую модель.
Модель предназначена для прогнозирования. Она способна генерировать различные сценарии и определять их приоритетность по вероятности. Цель состоит в том, чтобы предсказать, какой выбор сделает конкретный человек в той или иной ситуации. Или какую ошибку он, скорее всего, совершит в определенный момент. Затем в работу включится искусственный интеллект, являющийся потомком Project Debater и больших языковых моделей, который будет вести индивидуальное общение с человеком, принимая во внимание его психику и особенности мышления.
Влияние подобных методов на широкие слои населения наблюдается давно, еще до развития машинного обучения. Реклама, политика и пропаганда традиционно опирались на них, однако результаты всегда были усредненными. Отличительной чертой современной эпохи является персональное отслеживание данных. Теперь в определенных областях машина сможет обладать более глубоким пониманием человека, чем он сам.
Цель этих рассуждений – не вызвать у вас, читатель, опасения, связанные с антиутопическими сценариями, а скорее выявить потенциальные слабые места и риски, сопряженные с развивающимися технологиями. Разработчики шахматной программы из Университета Торонто сразу же поняли, какую угрозу представляет их разработка, вокруг чего у них разгорелась дискуссия с коллегами. Парадокс, но они создавали программу вовсе не затем, чтобы деанонимизировать игроков.
Изначально они стремились создать интеллектуальные системы, обеспечивающие удобное взаимодействие с людьми. Для этого искусственный интеллект должен имитировать человеческое поведение и прогнозировать действия. Умение определять шахматиста по манере игры стало лишь следствием этой амбициозной цели.
Технология распознавания «стиля принятия решений» также может быть полезна в науке, предоставляя возможности для решения сложных задач. Важную роль здесь будет играть способность генеративных нейронных сетей создавать новые данные, основываясь на полученных знаниях.
Наглядным подтверждением этого является система искусственного интеллекта DALL·E 2 от OpenAI, умеющая создавать изображения из текстовых описаний. Например, она легко справляется с задачей нарисовать «лису, сидящую в поле на восходе солнца, в стиле Клода Моне», и картина выглядит весьма убедительно. DALL·E 2 точно схватывает стилистические черты в созданных людьми изображениях и затем воспроизводит эти черты в изображениях, которые создает сама. Это позволяет не только быстро получить множество новых картин а-ля Моне или Уорхол, но еще комбинировать и совмещать стили.
Благодаря этому свойству открывается возможность для исследования новых горизонтов.
Аналогично DALL·E, нейронные сети будущего смогут находить новые подходы к мышлению, объединяя стратегии принятия решений, характерные для разных людей. Возможна также адаптация стиля мышления конкретного человека к решению задач, с которыми он ранее не сталкивался. Такие комбинации могут показаться нелогичными, например, попытка решения проблем квантовой гравитации в манере Каспарова, однако именно в этом кроется потенциал.
Теории относительности несовместима была бы параллельная работа Эйнштейна над органической химией, разработкой материалов, реформированием банков, проектированием городов и другими важными задачами. Через столетие подобный трюк может стать возможным: нейросеть, обучаясь по следам великих умов, будет перенимать часть их интеллектуальных способностей. Она будет использовать лучшие стратегии, словно беря их напрокат, и применять их в областях, которые остались недорассмотренными гениями.
Возможно, в ближайшем будущем научное открытие, экономическое достижение или даже военная операция, выполненная в стиле многопользовательской игры, не вызовут удивления. Любой мощный инструмент имеет две стороны, и ответственность за его применение по-прежнему лежит на людях.