В МГУ разработали новый метод машинного обучения для прогнозирования временных рядов.

Ученые из ВМК МГУ и ФИЦ ИУ РАН создали новый способ повысить точность предсказаний по временным рядам. Метод сочетает вероятностные модели с алгоритмами машинного обучения. Его эффективность подтверждена – показатели точности прогнозов увеличились на 45,7%. Результаты исследования опубликованы в журнале. AI.

Прогнозирование временных рядов важно во многих областях, таких как управление энергоресурсами и телекоммуникационным трафиком, анализ климата, медицина и финансы. Такие ряды зачастую шумны и обучающие наборы ограничены. Это создает проблемы для традиционных моделей, которые могут переобучиться или давать низкую точность прогнозов в практических задачах. Новая методика, разработанная учеными ФИЦ ИУ РАН и факультета ВМК МГУ, основана на совместном использовании вероятностных моделей и алгоритмов машинного обучения для повышения обобщающих способностей моделей искусственного интеллекта и выявления нетривиальных закономерностей в данных. Подход направлен на повышение качества прогнозирования даже при небольшом объеме датасетов.

Предлагаемый метод строится на принципах вероятностно-информированного машинного обучения: смешанные компоненты связности генерируют новую информацию для моделей. Дополнительные признаки получаются с помощью алгоритма объединения параметров при обработке временных рядов в режиме скользящего окна, учитывая нелинейные взаимосвязи и стохастические факторы. В исследовании показана эффективность использования смешанных компонент связности как для методов машинного обучения, так и для глубоких нейронных сетей, например, ансамблей из рекуррентных сетей LSTM и трансформеров.

Экспериментальное тестирование методики проходило с использованием двух датасетов, отличающихся физической природой. Первый – данные о теплообмене между океаном и атмосферой в районах Гольфстрима и Лабрадорского моря с сложной пространственно-временной динамикой. Разработанные учеными вероятностно-информированные модели существенно уменьшили значения метрик: среднеквадратичная ошибка снизилась на 27,7%, а средняя абсолютная процентная ошибка – на 45,7%. Второй набор – открытые данные о показателях температуры масла в электрических трансформаторах. В этом случае также достигнуты существенные улучшения: среднеквадратичная ошибка уменьшилась на 10% по сравнению с традиционными методами прогнозирования, включая результаты трансформерной модели Reformer.

Применение вероятностного информирования в машинном обучении расширяет возможности анализа временных рядов. Даже при ограниченных или шумных данных возможно достижение значительного повышения точности прогнозов.
Это важно для задач, где ошибка прогноза может иметь серьезные последствия: энергетика, климат, медицинские исследования.
Андрей Горшенин.

В будущем исследователи будут уделять больше внимания развитию применяемых архитектур и методам их вероятностного обучения с помощью разных математических моделей для повышения точности прогнозов в науке и промышленности.

Информация предоставлена пресс-службой МГУ

Источник фото: ru.123rf.com