Разработчики «Яндекса» разработали технологию, улучшающую работу рекомендательных систем

Специалисты, разрабатывающие рекомендательные технологии в «Яндексе», выявили метод улучшения качества работы рекомендательных систем. Это позволит им точнее определять интересы пользователей, будь то товары или контент, и предлагать более релевантные рекомендации. Для достижения этой цели в процесс обучения моделей была внесена дополнительная настройка.

Внутренние испытания, проведенные в «Яндексе», продемонстрировали, что новая методика позволяет увеличить точность рекомендаций моделей, в среднем на семь процентов, согласно показателям качества ранжирования. «Яндекс» намерен применять этот метод при обучении рекомендательных моделей для собственных сервисов, включая «Маркет». Данный подход может быть полезен и другим компаниям, а также независимым разработчикам, занимающимся рекомендательными системами в различных областях — от социальных сетей до онлайн-магазинов и сервисов потокового видео.

В научной публикации специалисты «Яндекса» представили информацию о новом методе исследования статье, которая была принята на ACM RecSys 2025. Это ключевое ежегодное международное мероприятие, посвященное рекомендательным системам, которое в нынешнем году состоится в Чехии в девятнадцатый раз. Среди докладов — работы ведущих мировых технологических компаний, таких как Amazon, Google и другие.

Читайте также:  В Европе прошли испытания пассажирского самолета с V-образным расположением крыльев

Неточности при обучении рекомендательных систем

Рекомендательные системы часто оперируют огромным количеством данных — текстами, аудиозаписями, видео, товарами. Обработка таких объемов информации требует значительных вычислительных мощностей. Кроме того, для обучения модели также требуются миллионы примеров, что также влечет за собой потребность в большом количестве ресурсов. Для снижения затрат на этот процесс специалисты по всему миру применяют различные подходы, заменяющие трудоемкие вычисления на более эффективные. Одним из таких методов является sampled softmax, или алгоритм выборочного сэмплирования.

Принцип заключается в обучении системы распознаванию пользовательских предпочтений. Это достигается путем сопоставления действий, фактически выполненных пользователями в отношении определенного объекта (положительные примеры), с действиями, которые не были совершены ими в отношении того же объекта (отрицательные примеры). В качестве примера объекта может служить товар: положительный пример – добавление в корзину, отрицательный – просмотр на сайте без добавления.

Обучение системы предполагает демонстрацию как положительных, так и отрицательных примеров, что позволяет модели научиться их различать. При этом, для достижения результата можно использовать как миллионы отрицательных примеров из обучающего набора, так и лишь небольшое их количество, подобранное случайным образом. Это и является преимуществом метода sampled softmax, поскольку он позволяет сократить потребление вычислительных ресурсов. Тем не менее, применение данного метода может привести к недостаточно качественному обучению из-за некорректной оценки вероятностей – то есть, к неправильному определению актуальности рекомендации для пользователя. В конечном итоге, это может привести к выдаче неверных рекомендаций.

Читайте также:  Jaguar перейдет на электромобили в течение четырех лет, и пандемия стала катализатором этого процесса.

Решение с помощью новой формулы

Для обеспечения корректной работы метода необходимо использовать новую формулу для расчета вероятности заинтересованности пользователя в конкретном товаре или контенте – LogQ. Основная математическая проблема заключалась в том, что существующие подходы исходили из предположения об использовании единых критериев отбора для всех случаев, в то время как на практике положительные и отрицательные примеры представлены в данных неравномерно. В результате, стандартные формулы начинают давать систематически неверные оценки, поэтому для повышения объективности модели требовалось внести специальные корректировки в расчет вероятностей.

Читайте также:  Роботизированная рука справилась с ножницами, яйцами и стаканом воды

В процессе обучения модель начинает осознавать, что действия пользователей, которые считаются положительными, не формируются случайно и предоставляются ей в качестве образцов. Все остальные действия определяются как отрицательные и выбраны случайным образом. Такой подход помогает снизить предвзятость в оценках модели, то есть устранить искажения, которые могут повлиять на точность ее итоговых рекомендаций. В конечном итоге, модель точнее определяет потребности пользователей и, соответственно, предоставляет им более релевантные предложения.

Новую формулу можно применять при обучении любых рекомендательных систем как компаниями, так и разработчиками. Для этого не требуется модификация архитектуры существующих моделей.