Обучение поощрениям с применением глубокого обучения приводит квантовую систему в состояние Шредингера.

Японские и австралийские физики моделированием доказали эффективность обучения с подкреплением для точного управления квантовыми состояниями систем.

Художник представил кота Шредингера, пребывающего одновременно в двух квантовых состояниях.

Для эффективного использования квантовых систем для записи, хранения и обработки информации необходимы методы точного измерения состояния системы и управления ею. Проблема заключается в том, что любое взаимодействие системы с окружающей средой, включая измерения, немного изменяет ее состояние. Это приводит к ошибкам, затрудняющим управление квантовыми системами, особенно в реальном времени.

Чтобы сохранить систему в заданном состоянии, применяют системы управления с обратной связью. Такие системы реагируют на малые отклонения от нормы и возвращают систему в нужное состояние. Для простых систем можно рассчитать необходимую силу аналитически. Но для более сложных, близких к реальным системам, готового решения нет.

В эксперименте по использованию моделирования физики выяснилось, что глубокое обучение с подкреплением успешно решает поставленную задачу для системы с нелинейными свойствами. гамильтонианом— функцией, определяющей её полную энергию. Обучением с подкреплениемНазывают один метод машинного обучения, где алгоритм учится, взаимодействуя с окружением и получая от него информацию о результатах действий. В каждом цикле обучения алгоритм каким-то образом влияет на состояние квантовой системы, а затем узнает о последствиях своих воздействий.

До обучения взаимодействие было случайным, и изначально алгоритму не удавалось поддерживать систему в рабочем состоянии.

На холме шар моделирует систему в нужном квантовом состоянии, задача алгоритма – поддерживать шар в синей зоне.

Уже к 300 циклам обучения алгоритм выполнял эту задачу сравнительно просто.

Шарик сохраняется в голубой зоне, однако изменения его местоположения (красная линия) остаются значительными.

Через пять тысяч циклов амплитуда воздействий сократилась до минимума.

Мячик в покое, колебания силе (синяя линия), а также шарику (красная линия) незначительны.

Ученые продемонстрировали эффективность глубокого обучения с подкреплением для возвращения системы к исходному состоянию. «состояние кота Шредингера»состояния, подобно коту из известного эксперимента. мысленном экспериментеОбучение Э Retrieval модели выполняется автономно. Авторы полагают, что в будущем иные методы ИИ также смогут применяться для управления квантовыми системами.

Статья с результатами исследования опубликована в журнале Physical Review Letters.