Мечты о весеннем расцвете искусственного интеллекта

К осени 2022 года редакция Naked Science решила запустить цикл статей об искусственном интеллекте. Начало дается большой статьей, подзаголовок которой: «краткое введение в историю ИИ — от средневековых монахов до глубокого обучения».

Два слова «искусственный интеллект» известны почти всем, но мало кто может чётко определить их значение и объяснить суть заложенных в них технологий. Наше представление об ИИ скорее сформировано голливудскими фильмами, чем реальным пониманием лежащих в основе технологий понятий. Кино, как и любое искусство, работает с зрителем через эмоции. Самая продаваемая из них — страх.

Компьютер с ИИ HAL 9000В «Космической одиссее 2001 года» за управление межпланетным кораблем берется искусственный интеллект. Киборг Т-800 в «Терминаторе» отправляется в прошлое убить Сару Коннор. Нейроимплантат подчиняет сознание своего носителя в фильме «Апгрейд». Гиноид Ава легко манипулирует программистом, приглашенным для проведения обратного теста Тьюринга, убивает своего создателя и сбегает на волю в фильме «Из машины». Примеров множество. Однако реальность сильно отличается от кинематографических представлений.

Экранные сцены из кинофильма «Космическая одиссея 2001 года»

Человечество преодолело 80 лет поисков, ошибок и тупиков, каждый из которых заканчивался «зимой искусственного интеллекта» — разочарованием в возможностях этой технологии. С начала 2010-х мир вновь переживает «потепление» в области ИИ. Поэтому пока в кинотеатрах пытаются напугать обывателя — крупные корпорации и правительства ведущих стран инвестируют миллиарды в развитие ИИ, так как прямо сейчас он меняет всё — от научных исследований до повседневной жизни.

Современные разработки, несмотря на прогресс, не могут сравниться с фантазией режиссеров и сценаристов. Представления о будущем могут совпадать в мелочах, но никогда в главном. Рассмотрим понятие искусственного интеллекта и основные этапы его развития.

Изобретая понятия

Американский математик Джон Маккарти (1927-2011) увлекся компьютерами в 1948 году, посещая семинар «Церебральные механизмы поведения», где обсуждали возможность компьютерного мышления. Потом летом 1956 года он организовал десятинедельный семинар в Дартмутском колледже на средства фонда Рокфеллера.

Маккарти обозначил задачи семинара в грантовой заявке.

Исследование основано на предположении, что каждый аспект обучения или любая особенность интеллекта потенциально может быть настолько точно описана математически, чтобы создать вычислительное устройство для его моделирования. Попытка заставить компьютеры использовать естественный язык, формировать абстракции и понятия, решать проблемы, которые сейчас могут решить только люди, а также самосовершенствоваться. Считаем, что в одной или нескольких из этих проблем можно добиться значительного прогресса, если тщательно отобранная группа ученых будет работать над ней вместе в течение лета.

Команда Маккарти производила впечатление. В её состав входили Клод Шеннон, создатель теории информации, будущая звезда математических основ искусственного интеллекта и создатель теории фреймов Марвин Минский, когнитивный психолог Аллен Ньюэлл, разработавший программу «Логик-теоретик», модификации которой научились играть в шахматы и решать головоломки, а также многие другие талантливые люди.

Пробки не страшны за рулём Tesla с автопилотом, который управляет дистанцией до других машин и держит автомобиль в центре полосы. Это Model X 75D 2017 года с тёмным интерьером.

Как принято истинным учёным, Джон Маккарти и соратники приступили с формулирования понятий. Первое из них прозвучало как… Искусственный интеллект — это наука и инженерия, создающие интеллектуальные системы. intelligent) машин»Термин «искусственный интеллект» считается первым в истории. Название научной дисциплины перешло к объекту ее изучения и конструирования — «умным машинам», реализуемым как физически, так и в виде алгоритмов.

Более актуальное определение возможно сформулировать по-другому. Искусственный интеллект – это часть компьютерных наук, которая стремится создать системы, способные мыслить и действовать как человек. Знания, полученные в рамках этой отрасли, используются для создания информационных технологий.

Ну а если говорить совсем просто, то Искусственный интеллект – наука и технологии, направленные на автоматическое выполнение задач, требующих интеллекта. Существует ли задача, решаемая человеческим разумом? Ученые и инженеры могут создать искусственную систему, замещающую человека в её решении. Такая система и будет называться системой искусственного интеллекта.

Любой человек способен решать множество интеллектуальных задач: управлять автомобилем, играть в шахматы, обсуждать планы на день по телефону и так далее. Иногда удаётся всё это делать одновременно. Компьютеры пока не могут этого сделать. системы слабого (weak) или узкого (narrow), либо прикладного (applied) искусственного интеллекта.

Все могут выполнять только одну интеллектуальную задачу — управлять беспилотным автомобилем на улицах города или играть в шахматы. Даже если программа обыгрывает чемпиона мира в шахматы, не сможет управлять автомобилем. Люди же легко переключаются с одной задачи на другую и могут овладевать новыми навыками всю жизнь.

Существуют бесчисленные системы слабого искусственного интеллекта. Практически все инженеры и учёные трудятся над их разработкой. Тем не менее главная цель отрасли — создание… сильного (strong) или общего (general) искусственного интеллектаЗдесь всё сложнее, чем кажется, и создать единое определение, которое устроит всех, затруднительно.

Фразу о сильном искусственном интеллекте впервые высказал философ Джон Сёрль вместе с понятием… китайской комнатыПредположим, человек, знающий китайский, находится в закрытой комнате. Через люк ему передаются вопросы на китайском языке. Человек отвечает на них тоже по-китайски. Теперь представьте: в комнату посадили другого человека, который не знает китайского, но владеет подробной системой правил, позволяющей ему по заданным иероглифам строить новые.

Если правила достаточно обширны, человек, не знающий китайского, сможет отвечать на вопросы осмысленно, не понимая их значения. Это значит, что он будет имитировать понимание китайского языка, хотя им не владеет. По этой причине понятие «сильный искусственный интеллект» обозначает систему, которая ведет себя так, будто разумна, чтобы отличить ее от системы, которая является действительно разумной.

Теперь подлинное толкование термина «мощный искусственный интеллект» доступно лишь в философских трудах. К примеру, фирма… IBM дает иное определение:

Сильный искусственный интеллект, или общий искусственный интеллект (AGI), — это теоретическое описание ИИ с интеллектом, сравнимым с человеческим, самосознанием и способностью решать разнообразные интеллектуальные задачи, учиться и планировать действия. .

Самый простой способ разъяснить это определение – привести пример «Кофейного теста», разработанного соучредителем. Apple IncИ создателем первых персональных компьютеров этой фирмы – Стивеном Возняком. Прост по своей конструкции, но и по сей день не преодолимый ни одной системой.

По задумке редакции Naked Science, искусственный интеллект создал иллюстрацию «кофе, приготовленный ИИ».

«Кофейное тесто» оценивает способность ИИ полноценно взаимодействовать с человеком и физическим миром, а также адаптироваться к новой обстановке без предварительной подготовки. Робот под управлением ИИ должен найти кофе, кофеварку или кофемашину в любой неизвестной ему кухне и приготовить напиток.

Здесь множество кухонь — широкий разброс не знакомых ИИ средств. Задача — приготовить напиток. Ограничение — наличие или отсутствие инструментов для достижения цели. Ведь иногда признание того, что задачу решить невозможно, свидетельствует об интеллекте больше, чем бесплодные повторы.

Российские специалисты считают, что создание общего искусственного интеллекта невозможно без взаимодействия роботов и алгоритмов с физической средой, подобно человеческому развитию.

Многие ученые, например Марвин Минский, и предприниматели, как Илон Маск, уверены, что общий искусственный интеллект появится в ближайшие десятилетия. Другие же полагают, что создать его невозможно, а максимальным достижением станет разработка элементов сильного или узкого общего ИИ. narrow AGIСистемы, показывающие выдающиеся результаты в одной задаче, могут выполнять другие, но хуже, чем люди в среднем.

В круге третьем

Официальная история ИИ начинается с 1940-х годов, за полтора десятка лет до появления самого понятия. Предыстория же уходит в античность — автоматы Герона Александрийского и антикитерский механизм для расчета движения небесных тел. Все эти достижения скорее относятся к ранним этапам автоматики и вычислительной техники, а не к созданию машин, способных заменить человека в решении интеллектуальных задач.

Антикитерский механизм / ©Wikimedia

Возможно, начало отсчета следует вести от логической машины Раймонда Луллия (1235-1315). Луллий долго занимал должность придворного поэта арагонского короля, но затем оставил придворную жизнь и стал монахом. В 1272 году во время религиозного экстаза божественное видение показало ему особое устройство, позволяющее из конечного числа общих понятий вывести все истины мира.

Луллий подробно изложил описание своей машины в труде «Великое искусство». Ars MagnaВ сущности это было устройство с концентрическими кругами, вращение которых давало разные комбинации символов и первоначальных понятий, преимущественно теологических.

Простейшая модель машины состояла из трех кругов: первый с латинскими буквами, второй с понятиями («сила», «доброта», «мудрость»), третий — со свойствами («сильный», «добрый», «мудрый»). В центре размещался звездообразный граф, связывающий все секторы. Самая сложная версия включала четырнадцать кругов и позволяла получить огромное число комбинаций.

Ars Magna / ©Wikimedia

Идеи Луллия стали серьёзным влиянием на философа и математика Готфрида Вильгельма Лейбница.

В философии я нашел способ получить то же, что Декарт и другие сделали для арифметики и геометрии с помощью алгебры и анализа, посредством комбинаторики. Указан путь, по которому все составные понятия могут быть разложены на небольшое число простых понятий, являющихся их алфавитом. И правильным методом из комбинаций букв такого алфавита можно со временем получить все вещи вместе с их теоретическими доказательствами.

Не удалось создать «алфавит человеческой мысли» и привести философские умозаключения к строгой форме Лейбница. Однако при попытках его изобретения придумали двоичную систему из 0 и 1, которая сейчас лежит в основе вычислительных устройств и кодирует числовые данные и логические операции.

Работы Луллия привлекли внимание и русских учёных. Ars Magna Поэтом и философом Андреем Белобоцким переведено на русский язык. В допетровской Руси были популярны две его переводы: «Великая наука Раймунда Луллия» и «Краткая наука Раймунда Луллия».

Отец перфокарт

По всей видимости, Семен Корсаков (1787-1853), создатель первых российских интеллектуальных машин, хорошо знал эти книги. Корсаков придумал и детально описал пять подобных друг другу устройств для поиска и классификации информации. Самое простое из них — «прямолинейный гомеоскоп с неподвижными частями». В нем использовалась перфорированная таблица, по столбцам которой перемещалась деревянная планка с булавками-шипами разной высоты. По совпадению отверстий в таблице с выступающими шипами определялся нужный столбец. Аналогично работали и другие предложенные им машины — несколько более сложные: прямолинейный гомеоскоп с подвижными частями, плоский гомеоскоп, идеоскоп и компаратор.

Перфокарта для умных механизмов Семёна Николаевича Корсакова.

Корсаков, иллюстрируя принцип гомеоскопа, приводил пример из медицинской практики: столбцы таблицы содержат симптомы заболеваний, а врач по положению шипов на планке фиксирует симптомы пациента. Планка перемещается вдоль столбцов, пока не совпадает с нужным, и врачу остается лишь выбрать соответствующее лекарство. «Количество деталей, которые учитывает устройство, может достигать сотен», — отмечает Корсаков. Это первая в мире экспертная система для поддержки принятия решений доктором!

В 1980-х советский математик и кибернетик Гелий Поваров обратил внимание на публикации Корсакова. Поваров популяризировал его идеи, сделав Корсакова одним из основоположников отечественной кибернетики и закрепив за ним мировое достижение — первое в истории информатики использование перфокарт.

Ранние идеи

С кибернетики начинается официальная история искусственного интеллекта. В первоначальном виде кибернетика — не столько наука, сколько метатеория об информации и её обработке в управлении сложными системами: от живых организмов до корпораций международного уровня.

В итоге кибернетика распалась, создав благоприятные условия для развития компьютерных наук и таких областей, как биология, математика, менеджмент, инжиниринг и др. В рамках кибернетики возникла самая продолжительная и успешная программа исследований искусственных нейронных сетей, испытавшая несколько кризисов.

С точки зрения специалиста из Центр прикладных систем искусственного интеллекта МФТИ. PhysTech AIСуществует три подхода к созданию умных машин, способных решать интеллектуальные задачи, по мнению Михаила Бурцева.

Тренировка искусственных нейронных сетей и глубокое обучение основаны на симуляции функционирования отдельных нейронов, нервных связей и мозга животных и людей с помощью физических и программных средств.

Символьный искусственный интеллект имитирует процессы мышления и логического анализа, присущие человеку.

Эволюционное программирование и генетические алгоритмы имитируют эволюционные процессы. В них алгоритмы модифицируются и конкурируют за наилучшие решения в условиях жесткой борьбы за существование.

Два первых подхода активно развивались начиная с 1940-1950-х годов. Эволюционное направление и некоторые другие появились с 1960-х по 1990-е годы и сейчас менее востребованы.

Взлет и падение нейросетей

В начале 1940-х годов в Университете Чикаго два человека с совершенно разными жизнями встретились случайно: Уоррен Мак-Каллок, 42-летний профессор, заинтересованный поиском «психона», и Уолтер Питтс, едва достигший 18 лет, самоучка без формального образования, родом из бедной семьи в Детройте.

Несмотря на это, совместная работа оказалась весьма продуктивной. В 1943 году предложили модель «формального нейрона», функционирующего по правилам математической логики.

Большинство нервных клеток имеют множество мелких отростков – дендритов (по ним сигналы поступают в клетку), тело и один большой отросток – аксон (через него сигнал выходит). Работает эта система по принципу «все или ничего» — если поступающие импульсы не превышают порог, то нейрон не отвечает, а если превосходят, то генерируется максимально возможный ответ.

Нейрон ИИ представляется так.

Формальный нейрон — это пороговый элемент, действующий по принципу «всё или ничего» в строго определенные моменты времени. У него конечное число входов и один выход. Входы подразделяются на возбуждающие (+1), тормозящие (–1) и запрещающие. Последние могут блокировать сигналы с других входов. Если алгебраическая сумма воздействий, поступающих по входам, достигает или превышает порог (0), то на выходе нейрона появляется сигнал.

Их вышедшая в 1943 году статья в журнале Bulletin of Mathematical Biophysics Работа под названием «Логическое исчисление идей, относящихся к нервной активности» вызвала большой резонанс и спустя 13 лет была переведена и опубликована в СССР. Там моделирование нейронов привлекло много внимания. Российский кибернетик Виктор Варшавский предложил свою обобщенную модель порогового нейрона. Группа под руководством Никиты Позина создала в Институте проблем управления АН электронную модель нейрона. Коллектив, возглавляемый Николаем Амосовым, последовательно разрабатывал идею сетей из «формальных нейронов» для создания внутри вычислительных машин своеобразных «информационных внутренних моделей» внешнего мира. К сожалению, из-за отсутствия переводов на иностранные языки и слабых внешних связей почти все эти работы остались неизвестны мировой науке и инженерии.

Идея Мак-Каллока и Питтса о том, что «формальные нейроны» с бинарными входами выполняют логические вычисления, а значит, мозг можно сравнить с машиной логического вывода, оказала большое влияние на психолога Фрэнка Розенблатта из Корнеллского университета. Он работал в лаборатории аэронавтики, но всегда мечтал заниматься поиском экзопланет и для этого ему нужен был автоматический инструмент распознавания и классификации изображений. Такой инструмент он изобрел.

Розенблатт в истории науки и технологий запомнился как создатель перцептрона, предшественника современных систем глубокого обучения. Перцептрон — это нейронная сеть, состоящая из модифицированного нейрона Мак-Каллока и Питтса. Изменение заключается в добавлении весов связи входного сигнала с блоком выхода, то есть мерах влияния каждого входа на выходное значение.

Веса позволяют перцептронам обучаться самостоятельно. Для обучения, например, перцептрона для распознавания буквы А, указывают ожидаемые выходы: +1 для А и -1 для остальных букв алфавита. На вход перцептрона подаются изображения букв. При ошибках веса автоматически корректируются: если выдаётся +1 вместо -1 или наоборот. Если ответ верный, то в весах не производятся изменения. В процессе обучения перцептрон находит необходимые веса и перестаёт ошибаться, четко опознавая букву А.

В 1957 году Розенблатт доказал теорему сходимости перцептронаВладимир Вапник, российский математик, внес существенный вклад в понимание принципов работы перцептронов, разработав «метод опорных векторов», востребованный в машинном обучении. С помощью этого метода можно автоматически определить плоскость, наилучшим образом разделяющую две группы точек в декартовом пространстве (например, фото собак и кошек), решая тем самым задачу классификации (в данном случае бинарной).

Решение задачи XOR простым перцептроном. Граница всех элементов = 0.

Несмотря на успехи, перцептроны не получили широкого применения из-за ограничений электроники и вычислительной техники того времени. Математики Марвин Минский и Сеймур Пейперт в книге «Перцептроны» показали невозможность создания многослойных классификаторов такого типа. Тогда их, как оказалось ошибочные, выводы приняли за истину. До середины 1980-х годов нейросети остались забытыми.

Логика, эвристики и знания

Желание создать программу для игры в шахматы стало началом истории. В 1954 году Аллен Ньюэлл, Герберт Саймон и Джон Клиффорд Шоу приступили к работе. Для неё использовали ряд предпосылок. Во-первых, программа должна была применять эмпирические методы и правила, выведенные на основе анализа способов решения задач человеком. Люди в процессе размышлений осуществляют когнитивную деятельность, состоящую в операциях над символьными репрезентациями предметов окружающего мира. Таким образом, физическую вычислительную систему необходимо было снабдить знаниями о мире и способами обращения с ними. Здесь началась история символьного ИИ и эвристического программирования.

Психологов сразу же подключили к исследованиям. Выясняли стили игры чемпионов по шахматам и методы разрешения задач разными людьми. В итоге команда разработала собственный язык программирования. Information Processing Language (IPL)Возможно, первый, где данные отображались в виде целых списков символов. На нем сперва написали программу «Логик-теоретик» в 1956 году, затем «Универсальный решатель проблем» в 1957-м и, наконец, саму шахматную программу. NSS в 1958-м.

«Логик-теоретик» мог доказывать математические теоремы. Машина принимала списки переменных, которые соединялись в выражения с помощью логических связок: «И», «ИЛИ», «ЕСЛИ… ТО…». Потом задавались аксиомы и три правила вывода: подстановка, замена, разделение.

Доказательство трактовалось как цепочка предложений, каждое из которых выводится из предыдущих, начиная с аксиом и известных теорем, и приводящее к целевому выражению. Такой метод назвали эвристическим программированием: он воспроизводит реальные человеческие действия со символами и одновременно исключает многочисленные последовательности и выражения на основе установленных правил.

В результате «Универсальный решатель проблем» освоил решение ряда задач, поиск неопределенных интегралов и решение уравнений. NSSХорошо умела играть в шахматы. Для этого добавили в управляющий алгоритм описания целей, оценки текущей и желаемой ситуаций, а также разницы между ними.

В СССР эвристическое программирование заинтересовало ученых. Сначала психологов, изучающих мышление, например Вениамина Пушкина, который сделал эвристики операционализированным и экспериментально исследуемым понятием в опытах с людьми. Чуть позже внимание к нему обратили кибернетики и логики. Вместе с Пушкиным российский специалист по ИИ Дмитрий Поспелов провел ряд исследований ситуационного управления — принятия решений в конкретных ситуациях с учетом множества вариантов действий. Сергей Маслов, логик, впервые предложил метод автоматического поиска доказательств теорем в исчислении предикатов.

Программа для игры в шахматы «Каисса» / ©Александр Шевцов, chess.com

Гроссмейстер Михаил Ботвинник, VI чемпион мира по шахматам, разрабатывал шахматные программы совместно с командой программистов с конца 1950-х до 1990 года, создав программу «Пионер». Однако больших успехов программа не добилась. Другое дело — программа «Каисса», разработанная в Институте проблем управления АН СССР. В 1974 году она победила на чемпионате мира среди других шахматных программ.

ЛИСП, ПРОЛОГ и российский РЕФАЛ

IPL Послужил основой для другого известного языка, применяемого в системах ИИ. В 1958 году создатель термина «искусственный интеллект» Джон Маккарти познакомил интересующуюся аудиторию с языком ЛИСП. LISP — LISt ProcessingКак и все языки, ориентированные на решение интеллектуальных задач, ЛИСП предназначался для обработки символьных данных, организованных в списки, так же как и сам исполняемый код программ. Самое главное — в нем на уровне синтаксиса были реализованы эвристики, например редукции, то есть разбиения любой сложной задачи на простые. Для определения функций могли использоваться выражения, а система записи предусматривала большое количество скобок, из-за чего код часто оказывался трудным для чтения.

Ещё одним специальным языком для искусственного интеллекта стал Пролог. PROLOG — PROgramming LOGicСозданный в 1972 году как кульминация направления логического программирования. Традиционный силлогизм «Все люди смертны. Сократ — человек. Следовательно, Сократ смертен» в ПРОЛОГе трансформировался в «Для того чтобы доказать смертность Сократа, сделай подцелью доказательство факта, что Сократ — человек» — и синтаксически это выглядело так:

смертен (Сократ) :— человек (Сократ)

В нашей стране разрабатывались специализированные языки программирования для систем символического ИИ. Валентин Турчин в 1966 году представил язык РЕФАЛ (РЕкурсивных Функций АЛгоритмический), старейший функциональный язык. Турчин считал, что он будет метаязыком для описания семантики других языков, но на практике оказался удобен для обработки символьной информации и решения интеллектуальных задач.

Эвристичное программирование на базе логики и операций с символами процветали около двадцати лет. К середине семидесятых все специалисты осознали, что достигнут предел усложнения алгоритмов и совершенствования эвристик. Ожидать принципиального прорыва не приходилось. Дооснащение алгоритмов огромными базами знаний требовалось, но технологические возможности этого не обеспечивали. Вместе с падением перцептронов и других нейросетей это привело к первой «зиме искусственного интеллекта» в 1970-х годах.

Несмотря на все, эвристики не исчезли и успешно развивались до середины двухтысячных годов. Их применяют и сейчас, хотя и ограниченно. Например, язык ЛИСП используется в некоторых программах. Autodesk для инженеров.

Новый ренессанс нейросетей

К началу 1960-х годов перцептроны Розенблатта показали свои пределы. Для решения задач посложнее распознавания отдельных букв требовалось больше слоёв в нейросети. Возник вопрос: как обучать такие системы, и возможно ли это вообще? В то время общепринятое мнение учёных, высказанное Марвином Минским, гласило, что нет.
В отрасли стало понятно, что «зима близко» — исследования ИИ считались малоперспективными, финансирование резко сократилось, тема вышла из моды и стала маргинальной.

Изображение, созданное искусственным интеллектом по запросу редакции «ренессанс нейросетей» / ©Naked Science.

Вновь психологи пришли на помощь искусственному интеллекту. В среде инженеров и естественников психология всегда считалась псевдонаукой, так почему бы им не принять отвергнутую тему, если в среде технической интеллигенции она утратила прежний статус? Первая «весна искусственного интеллекта» в середине 1980-х годов связана с именем Дэвида Румельхарта, когнитивного и математического психолога из Калифорнийского университета Сан-Диего, и изобретением метода обратного распространения ошибки или градиентного спуска.

Если бы наука в СССР было больше интегрирована в международную, а публикации велись на английском языке или осуществлялись систематические переводы советских работ за рубежом, возможно, революция нейросетей началась бы лет на десять раньше.
В настоящее время даже историкам вычислительной техники практически не известны имена Автандила Квиташвили, Генриха Отхмезури, Сергея Даяна и других, экспериментировавших в 1950-1970-е годы над многорядными перцептронами.

Дэвид Румельхарт / Рольф Кикгут (Википедия).

В начале 1970-х кибернетик Алексей Ивахненко, применяя метод группового учета аргументов — фактически один из первых алгоритмов машинного обучения — обучал восьмислойные нейронные сети, созданные на основе «формальных нейронов». В 1974 году Александр Галушкин, будущий профессор МФТИ, опубликовал монографию «Синтез многослойных систем распознавания образов», где описал системы распознавания, состоящие из линейно-пороговых элементов, организованных в виде сетей с разомкнутым контуром. Галушкин переформулировал задачу обучения многослойных сетей и сетей с рекуррентными связями как задачу градиентного спуска.

Несмотря ни на что, прогресс стал ощутимым лишь после появления публикации в журнале. Nature статьи Learning representations by back-propagating errorsАвторство книги принадлежит Дэвиду Румельхарту, Джеффри Хинтону и Рону Уильямсу. В книге излагаются многослойные нейросети и новый метод их обучения.

Нейросеть имеет три слоя нейронов: пять входных, три в скрытом и один выходной. Между нейронами существуют связи с определёнными весами. При наличии нескольких слоев веса образуют вектор значений или градиент.

Как и с перцептронами, инструктор задает значение выхода. Если полученное после одной эпохи обучения значение не совпадает с заданным, то разница применяется для обновления весов связей выходного нейрона. Затем веса связей в скрытых и входных нейронах меняются по принципу обратного распространения ошибки, основываясь на влиянии каждого веса на эту ошибку.

Румельхарт с соратниками разработал способ вычисления градиента каждого веса в сети, начиная с выходного слоя, где известна ошибка, и доходя до входного по слоям. В результате нейронные сети стали обучаемыми для решения сложных задач и тренируемыми на больших объемах данных, что привело к появлению глубокого обучения.

1980-е годы ознаменовались новой волной оптимизма. Однако прорывные открытия тех лет, послужившие основой большинства современных моделей ИИ, не принесли ожидаемых результатов. Две причины такого исхода: недостаток данных для эффективного обучения и слабые вычислительные мощности. Модели обучались слишком медленно и долго, в итоге все равно не решали поставленные задачи.

К двухтысячным страсти угасли. Вторая «зима искусственного интеллекта» завершилась только в 2010-х с развитием производительных графических процессоров. GPU…приспособленных для высокопроизводительных параллельных вычислений, и доступ к обширным данным, например базе… ImageNet c 15 млн изображений, разбитых на 22 тыс. категорий.

В период «тихих лет» сформировалось множество новых подходов к построению нейросетей: свёрточные нейронные сети (Ян Лекун), сети с долгой краткосрочной памятью (Зеп Хохрайтер, Юрген Шмидхубер), порождающие состязательные сети, автоэнкодеры и другие. Произошёл значительный прорыв, вследствие чего сейчас сложно найти область применения, где не используется ИИ — от рекомендательных сетей в онлайн-кинотеатре и распознавания лиц в фотоаппарате смартфона до птицефабрик и операционных в больницах.

Великие державы искусственного интеллекта

Два лидера в области искусственного интеллекта — США и Китай. Эти государства удерживают первенство по научным публикациям о ИИ, количеству патентов, стартапов, созданных моделях и технологиям. В условиях, когда «ИИ в мире стал вторым электричеством», России не следует отпускать конкурирующие страны в новой технологической гонке. Сейчас ситуация напоминает 1940-1950-е и 1950-1960-е годы, когда СССР и США соревновались сначала в атомной, а потом в космической гонке. Особенно остро встал вопрос с наличием собственных технологий ИИ после того, как Россия попала под беспрецедентный в мировой истории гнёт санкций.

В соответствии с потребностями сегодняшней эпохи российское правительство создало Национальную стратегию развития искусственного интеллекта. При правительстве Российской Федерации начал работу Национальный центр развития искусственного интеллекта. Искусственный интеллектВ рамках мероприятия созданы шесть исследовательских центров при ведущих российских вузах и институтах (МФТИ, НИУ ВШЭ, Сколтех, Университет ИТМО, Иннополис, Институт системного программирования им. В.П. Иванникова РАН).

Изображение, созданное искусственным интеллектом OPENAI DALL-E по запросу «бесконечный сервер» / ©Encik Tekateki, OPENAI DALLE2

Среди ведущих российских компаний также представлены технологические гиганты — Яндекс, Сбер и МТС. VKВ Сбербанке обучили большие генеративные модели. ruGPT-3 и ruDALL-EРазработанные на базе архитектуры трансформеров модели, например, способны генерировать изображения по русскоязычным описаниям. «Сбер» создал собственные бенчмарки для оценки качества работы мультимодальных алгоритмов в различных задачах. «Яндекс», помимо прикладных технологий ИИ, интегрированных в поиск, открыл самую большую языковую модель. YaLM 100B (Yet another Language Model)Несколько лет ведет испытания автономных автомобилей.

Взаимодействие компаний с вузами, например, Исследовательского центраРазработки МФТИ в сфере прикладных систем искусственного интеллекта совместно с промышленными партнерами и стартапами направлены на создание беспилотных транспортных средств (автомобильных и воздушных), автономных роботов с управлением голосом, обладающих элементами сильного искусственного интеллекта, а также передовыми системами компьютерного зрения. Совмещение этих технологий позволяет роботам выполнять сложные задачи в разнообразных средах, в том числе и не знакомых.

Россия обладает значительным потенциалом стать третьей мировой державой в области искусственного интеллекта. Единственным ограничением является нехватка квалифицированных кадров в отрасли. Государство и компании готовы обучать молодежь, в том числе девушек, желающих работать в этой сфере. STEMи всех, кто готов изменить сферу деятельности и вступить не просто в… ITи к самым передовым технологиям – системам искусственного интеллекта.