Ученые улучшили точность рекомендательных систем на 50 процентов.

В лаборатории T-Bank AI Research специалисты значительно повысили эффективность автоматической системы предложений. В этом достижении главную роль сыграла оптимизация известного алгоритма для подбора рекомендаций.

Алгоритм оптимизирован по методам английского математика и священнослужителя Томаса Байеса.

Группа исследователей T-Bank AI Research существенно улучшила алгоритм байесовского персонализированного ранжирования, составляющий основу рекомендательных систем современных социальных сетей и интернет-магазинов. При помощи него создаются практически все новостные ленты в соцсетях, а также рекомендации пользователям при покупках онлайн.

Алгоритм изучает множество переменных и их вероятностные связи, чтобы определить, какие действия пользователя в социальных сетях (или потенциального покупателя в магазине) чаще всего предшествуют выбору конкретной новости, поста или товара для клика. БПР пользуется популярностью из-за умеренных потребностей в ресурсах при достаточной эффективности.

Разработчики нового исследования презентовали его на ведущей международной конференции по рекоммендационным системам. ACM RecSysКонференция, состоявшаяся с четырнадцатого по восемнадцатое октября в Бари (Италия), будет опубликована в сборнике работ. Reproducibility track of the ACM RecSys и доступенУченые из Корнеллского университета провели исследование для определения ситуаций, когда большие языковые модели (БПР) демонстрируют лучшие и худшие результаты по сравнению с традиционными методами.

Ученые продемонстрировали, что практическая реализация БПР часто оказывается не всегда оптимальной. Исходная научная работа о БПР, появившаяся 15 лет назад и имеющая почти семь тысяч цитирований в других научных статьях, возможно, не всегда подвергалась тщательному изучению теми, кто приступал к ее реализации. По оценкам исследователей, итоговое снижение эффективности алгоритма в практике может составлять до 50% от максимальной теоретической эффективности.

Результаты воспроизведения оригинального алгоритма лучше, чем модели из многих открытых фреймворков.

Авторы не ограничились этим выводом. Создали собственную модель БПР и тщательно настроили гиперпараметры (так называют параметры, настраиваемые до запуска модели и неизменяемые в процессе ее работы). Затем протестировали ее эффективность на задачах из реального мира. Результаты оказались выше, чем у других реализаций модели.

Производительность в точных рекомендациях составила 50% больше, чем у модели из популярного открытого фреймворка RecBole. Также она была на 10% выше, чем у модели Mult-VAE. Mult-VAE — модель для рекомендательных систем, основанная на нейронных сетях (разработка лаборатории Netflix), и считается лидером в отрасли.

Для оценки эффективности всех моделей использовался единый сценарий и набор данных, известный как… Наборе из миллиона песенТочность работы модели определялась тем, насколько хорошо первые 100 предложенных ею рекомендаций соответствовали интересам пользователя, проходившего через модель.

Исследования сотрудников лаборатории T-Bank AI Research стали доступны общественности (и уже) . на GitHubРазработчики по всему миру могут применять ее для оптимизации рекомендательных систем. Это поможет покупателям быстрее находить нужные товары в интернет-магазинах, а пользователям соцсетей — получать более осмысленную выдачу новостей и подписках. Как неоднократно отмечал Naked Science, проблемы с такими лентами давно стали буквально бичом для многих современных людей.