Ученые из России улучшили работу рекомендательных систем в соцсетях и интернет-магазинах, повысив их точность на 50%.

Специалисты лаборатории исследований искусственного интеллекта T-Bank AI Research добились значительного прогресса в совершенствовании автоматизированной системы рекомендаций. В основе их подхода лежит оптимизация одного из наиболее востребованных алгоритмов, предназначенных для формирования рекомендаций.

Специалисты из T-Bank AI Research провели существенную доработку алгоритма байесовского персонализированного ранжирования (БПР), который является важной частью рекомендательных систем, используемых в современных социальных сетях и онлайн-магазинах. Почти все новостные ленты в социальных сетях, а также рекомендации товаров при онлайн-покупках построены на его основе.

Алгоритм позволяет проанализировать большое количество факторов и их вероятностных связей, чтобы определить, какие действия пользователя в социальной сети (или потенциального покупателя в магазине) наиболее часто связаны с выбором конкретной новости, поста или товара, на который он захочет перейти. БПР широко используется благодаря умеренным требованиям к ресурсам и при этом демонстрирует высокую эффективность.

Новая разработка была представлена авторами на ведущей международной конференции, посвященной рекомендательным системам ACM RecSys, которая состоялась в Бари, Италия, с 14 по 18 октября. Материалы доклада будут опубликованы в сборнике научных трудов конференции Reproducibility track of the ACM RecSys и доступен на сервере препринтов Корнеллского университета. Исследователи взялись проанализировать, в каких именно случаях БПР справляется со своими задачами хуже или лучше обычного.

Ученым удалось продемонстрировать, что практическая реализация блокчейн-протоколов резервирования (БПР) часто существенно различается и в ряде случаев оказывается не самым эффективным решением. Фундаментальное научное исследование, посвященное БПР и увидевшее свет 15 лет назад, несмотря на то, что получило около семи тысяч цитирований в других научных публикациях, вероятно, не всегда подвергалось детальному изучению при попытках ее внедрения. По мнению исследователей, в процессе реализации алгоритм может потерять до 50% от максимально возможной, теоретической эффективности.

Авторы не остановились на этом заключении. Кроме того, они разработали собственную модель БПР и провели детальную настройку ее гиперпараметров (так называют параметры, которые настраиваются перед началом работы модели и не изменяются в процессе ее функционирования). После этого они проверили ее производительность на практических задачах. Полученные результаты превзошли показатели других версий модели.

По результатам тестирования, производительность разработанной системы в точных рекомендациях превысила показатели модели из известного опенсорс-фреймворка RecBole на 50%. Также она оказалась на 10% выше, чем у модели Mult-VAE. Следует отметить, что Mult-VAE – это модель для рекомендательных систем, использующая нейронные сети (разработана лабораторией Netflix) и являющаяся одним из ведущих, если не безусловным лидером, в данной области.

Оценка результативности проводилась для всех моделей по единой методике, используя один и тот же набор данных, который был обозначен как Наборе из миллиона песен. Оценке соответствия работы модели точности подвергались первые 100 сформированных ею рекомендаций, которые сравнивались с интересами пользователя, взаимодействующего с моделью.

Поскольку результаты работы исследователей из научно-исследовательской лаборатории T-Bank AI Research стали общедоступными (и есть на GitHub), благодаря этому, разработчики по всему миру смогут использовать ее для совершенствования разнообразных рекомендательных систем. Это поможет покупателям быстрее находить необходимые товары в онлайн-магазинах, а пользователям социальных сетей – видеть более релевантный контент в новостных лентах и подписках. Как неоднократно подчеркивал Naked Science, трудности с подобными лентами давно стали серьезной проблемой для многих современных людей.