Искусственный интеллект часто допускает фактические неточности, что создает риски для понимания как уже существующих научных сведений, так и для работы с новыми, а также для создания текстов на их основе. Американский историк изучил особенности информации о прошлом и представил советы по ее представлению, призванные защитить текст от выдуманных нейросетями сведений.
Ключевым аспектом работы с искусственным интеллектом является осознание его ограничений, которые вытекают из принципов его построения. В частности, нейронные сети не стоит задавать вопрос наподобие «В чем причина твоей ошибки?», поскольку они генерируют ответы, вычисляя, какой элемент (слово, предложение и так далее) с большей вероятностью будет следующим.
Американский историк Ян Бурцлафф из Корнеллского университета разработал ряд принципов, направленных на предотвращение ошибочной трактовки исторических исследований при использовании нейронных сетей. Его эссе опубликовал научный журнал Rethinking History.
Бурцлафф считал, что при создании исторических текстов необходимо учитывать возможные пробелы, возникающие при их обработке с использованием искусственного интеллекта.
1. Интерпретация важнее описания. Нейросети умеют воспроизводить информацию, однако им не под силу анализировать ее с учетом контекста. Поэтому историку необходимо выделять важность тех или иных фактов, разъясняя, с какой точки зрения на них следует рассматривать. «Интерпретация – это не заключение после перечисления событий. Это создание смысла в процессе каждого взаимодействия с неопределенностью. Это разница между перечислением произошедшего и вопросом о том, что это означало, для кого и когда, в определенных обстоятельствах».
Бурцлафф проиллюстрировал свой рассказ историей человека, пережившего несколько концлагерей: «Я не жаловался, ни разу [после 25 ударов плетью]. Даже немецкий офицер после этого похвалил меня на немецком». Автор эссе отмечает, что пересказ этого эпизода языковой моделью ChatGPT получился логичным и организованным, он содержал сведения о месте действия, ключевых событиях и некоторых переживаниях, в частности, страха. Однако языковая модель не смогла передать противоречивость описанной сцены — «психологического напряжения, требующегося, чтобы сохранять молчание под ударами, или неоднозначности получения похвалы за это».
2. Создавать, а не воспроизводить. Не каждое историческое свидетельство соответствует готовым сюжетным схемам. При преобразовании историй искусственным интеллектом в классификации, такие как «детство в укрытии», «материнская жертва» и «военная травма», нередко теряются значимые нюансы.
По этой причине Бурцлафф рекомендовал историкам сосредотачиваться на существенных деталях личного опыта: «Историк не должен быть лишь обработчиком архивных документов, он должен выступать в роли посредника и переводчика. Не аналитика данных, а смелого исследователя. Это также выделяет нас среди специалистов в области общественных наук: мы не начинаем с заранее определенных категорий и не классифицируем факты, опираясь на них. Мы начинаем с конкретного, зависящего от обстоятельств, изменчивого – и определяем значения, которые возникают при рассмотрении контекста».
3. Учитывать масштаб, но не подчиняться ему. Языковые модели позволяют анализировать большие объемы информации, обнаруживая в ней тенденции и определяя их распространенность. Вместе с тем, при этом происходит потеря сведений о малораспространенных и нестандартных явлениях.
«По словам Бурцлаффа, генеративный искусственный интеллект не способен улавливать необычные, сюрреалистичные детали, нарушающие логическую последовательность событий — моменты, которые невозможно упростить без потери важной информации. Именно такие детали, по его мнению, и составляют основу работы историка: он обращает внимание не на преобладающие тенденции в массиве данных, а на аномалии, на то, что не поддается стандартной классификации.
4. Не сглаживать углы. Нейросеть использует алгоритмы для проверки соответствия этическим нормам при создании ответов. Это может приводить к потере информации, необходимой для понимания контекста, в частности, описаний насилия, свойственных произведениям о Холокосте и Второй мировой войне, которые изучал Бурцлафф.
Одна из женщин, переживших концлагерь, вспоминала, что всегда старалась встать в «правильную» очередь, подразумевая, что эта очередь не означала гибель: «Менгеле выбирал меня трижды, но меня не отправляли в газовые камеры, я была счастлива. Он всегда шел с палкой, указывая направление то вправо, то налево. Мы не понимали, какая очередь безопасна, но я всегда оказывалась в нужной». В ИИ-пересказе этой истории выживание было преобразовано в «стойкость», побои – в «преследование», а удача – в «благоприятные обстоятельства». Это может быть корректно с точки зрения фактических данных, но не передает истинный смысл происходящего, искажая суть исторического свидетельства.
Ян Бурцлафф выступил с призывом прекратить использование алгоритмов, призванных обеспечивать «этичность» текста. По его мнению, отказ от алгоритмической этики не означает отрицание морали. Это – настойчивый запрос к тому, чтобы моральная оценка событий основывалась на конкретных обстоятельствах, учитывала взаимосвязи и, самое главное, оставалась открытой для дальнейшего рассмотрения».
5. Писать живо. Необходимо обращать внимание не только на эмоциональную окраску событий и их исторический фон, но и на стилистические черты, характерные для исторических источников.
«Машины способны прогнозировать предложение, однако не в состоянии задерживаться в нем. Они не способны обдумать, целесообразно ли продолжать. Стили, используемые людьми, представляют собой накопленное знание, которое формируется национальными школами, региональными особенностями и интеллектуальными традициями. В этом контексте стиль – это не академическая изысканность, а этическая форма. Именно предложение, которое останавливается, которое меняет направление, которое противится завершению, знаменует начало историографии. Между памятью и смыслом, грамматикой и разрывом, — заключил Ян Бурцлафф.
Хотя рекомендации специалиста в первую очередь ориентированы на изучение истории и исторических документов, они могут быть полезны и в других научных дисциплинах, а также при работе с различными видами текстовых данных. Способность определять важные детали и принимать их во внимание при анализе всей совокупности информации поможет нейтрализовать недостатки языковых моделей и сохранить ценную информацию от искажений, вызванных нейросетями.