Новая версия GPT-4 с поддержкой изображений и видео станет доступна на следующей неделе.

Языковая модель GPT-3, предшественница GPT-4, ранее вызвала значительный интерес. Искусственный интеллект был способен создавать тексты, которые после незначительной корректировки можно было использовать для публикации, представляя их как авторские работы. В дальнейшем был разработан виртуальный помощник ChatGPT, который продолжает вызывать удивление даже у экспертов. Наряду с этим был объявлен выход новой языковой модели GPT-4, которая, как ожидается, станет настоящим прорывом в этой сфере.

Как будто между прочим, Андреас Браун озвучил громкое заявление ( Andreas Braun), технического директора Microsoft Germany. Как пишет издание Heise Online, он выступал на мероприятии AI in Focus — Digital Kickoff в четверг, 9 марта. Во время презентации представители компании рассказывали о больших языковых моделях ( LLM) вроде серии GPT как о прорывных технологиях, которые радикально меняют рынок. В числе прочего зашла речь и о партнерстве Microsoft с OpenAI.

В этой ситуации Браун объявил о скором выходе GPT-4 на следующей неделе». Правда, каких-либо деталей и подробностей о революционной нейросети он не сообщил. Лишь в общих чертах обрисовал наиболее заметные эволюционные изменения алгоритма.

Читайте также:  Российские ученые в НЦФМ разрабатывают технологии искусственного интеллекта на стыке больших данных, нейронных сетей и психологии.

Прежде всего, модель будет поддерживать все языки. Разумеется, речь не идет о поддержке всех более семи тысяч существующих языков мира, но первые несколько десятков наиболее распространенных наверняка будут реализованы. По словам Брауна, нейросети смогут выполнять задачи, сформулированные на немецком языке, и выдавать ответы на итальянском. Это не предполагает перевода в реальном времени, а скорее предполагает создание текста сразу на нужном языке.

Во-вторых, GPT-4 стал мультимодальным, то есть способен обрабатывать не только «чистый» текст, но и распознавать его в аудио, изображениях и видео. Из сообщений прессы не до конца ясно, но складывается впечатление, что модель сможет выдавать ответ в той же форме.

Читайте также:  Вulnerabilities in Signal, Facebook and Google messengers allowed seeing the caller, even if they had not accepted the call.

Пожалуй, самый интересный аспект мероприятия, касающийся GPT-4, — это небольшие намеки на возможность практического использования модели. Браун, в свою очередь, не предоставил детальной информации, но упомянул, что искусственный интеллект уже находится в стадии тестирования в ряде приложений для пользователей Microsoft Azure.

Для одной из компаний разработано решение, которое обобщает содержание телефонных переговоров. Это позволит сэкономить крупному call-необходимо около 500 часов работы операторов в день. Разработка прототипа на основе GPT-4 заняло менее двух часов и потребовало усилий всего одного разработчика.

Бизнес-клиенты используют языковые модели преимущественно в трех сферах: для обработки голосовых запросов, поступающих по телефону, для содействия в работе с документами и для предоставления ответов на вопросы клиентов, основанных на конфиденциальной информации. По сути, это автоматизация широкого спектра задач, которые на данный момент выполняют многочисленные операторы служб поддержки.

Читайте также:  Новые сети 5G помогут смартфонам работать дольше

Напомним, GPT (Generative Pre-trained Transformer) — это группа нейросетевых алгоритмов, предназначенных для работы с естественным языком и созданных компанией OpenAI. С конца 2015 года компанией было представлено несколько продуктов, наиболее популярными из которых являются DALL-E, GPT-3, ChatGPT (на базе GPT-3.5) и Codex. В 2019 году Microsoft предоставила компании финансирование в размере миллиарда долларов, а к январю 2023-го эта сумма, по разным оценкам, выросла еще на 10 миллиардов.