Новая архитектура ИИ может обойти ограничения скорости электроники

Финские ученые достигли значительного прогресса в сфере оптических вычислений, представив архитектуру, позволяющую осуществлять тензорные вычисления – ключевой компонент современных больших языковых моделей. Благодаря этой разработке, вычисления выполняются за один цикл и со скоростью света. Данный метод способен кардинально преобразовать подходы к обучению и работе с искусственным интеллектом, заменяя привычные электронные вычисления на оптические. Эксперты видят в новой технологии потенциальную основу для создания универсальных систем искусственного интеллекта.

Тензорные вычисления являются фундаментом для большинства компьютерных операций, в том числе и для искусственного интеллекта. Однако скорость обработки тензорных данных создает ограничение, которое препятствует увеличению размеров моделей ИИ. Современные электронные системы, такие как графические процессоры (GPU), исчерпали свои возможности в плане скорости, масштабируемости и энергоэффективности, что обусловлено экспоненциальным ростом объемов обрабатываемой информации. В то же время оптические вычислительные системы обладают потенциалом для более высокой скорости и сниженного энергопотребления, но до настоящего времени не способны к параллельной работе, характерной для массивов GPU.

Читайте также:  Японский лазерный комплекс испытуют в морских условиях для борьбы с беспилотниками

Разработчики из Университета Аалто представили инновационную архитектуру, которая решает эту проблему. Их разработка, отличная от существующих оптических систем, позволяет одновременно выполнять множество тензорных операций в пределах одного светового импульса. Метод, названный «параллельное оптическое перемножение матриц (POMMM)», использует амплитуду и фазу световых волн для кодирования числовых данных, преобразуя информацию в физические характеристики светового поля. При взаимодействии и объединении этих полей автоматически выполняются математические действия, например, перемножение тензоров. Применение нескольких длин волн позволило усовершенствовать этот подход для обработки тензорных операций более высокого порядка.

Учёные утверждают, что их разработка функционирует аналогично таможенному инспектору, который, вместо последовательной проверки каждого груза с помощью различных приборов, формирует множество «оптических связей», объединяющих каждый вход с соответствующим выходом. Благодаря этому, все проверки и сортировка выполняются за один цикл, за одно прохождение света, и осуществляются мгновенно и параллельно. Оптические процессы в данной системе происходят без участия активных элементов, пассивно, во время распространения света, что позволяет адаптировать её к любой оптической платформе и исключает необходимость в дополнительном энергопотреблении или активном управлении.

Читайте также:  В США разработали автоматизированную систему заправки и мониторинга с использованием дронов.

В перспективе исследователи намерены включить этот вычислительный подход непосредственно в фотонные чипы. Это позволит оптическим процессорам решать сложные задачи искусственного интеллекта, потребляя при этом минимальное количество энергии. Несмотря на то, что данная работа не посвящена искусственному интеллекту общего назначения, она демонстрирует возможность преодоления структурных ограничений, характерных для современных вычислительных систем. Команда стремится интегрировать архитектуру POMMM в аппаратное обеспечение или на платформы крупных технологических компаний в течение трёх-пяти лет. Это станет важным шагом на пути к созданию нового поколения оптических компьютеров, которые смогут значительно ускорить обработку сложных задач ИИ в различных сферах деятельности.

Читайте также:  Запуск гиперзвуковой ракеты в Китае сопровождался странным атмосферным явлением.

Результаты работы в научном журнале Nature Photonics.