Сотрудники Вычислительного центра МГУ провели исследование, посвященное применению методов машинного обучения для классификации мобильного трафика, зашифрованного по умолчанию. В рамках работы была оценена возможность адаптации моделей с использованием переноса обучения. Исследование направлено на анализ техник, которые позволяют обнаруживать паттерны в сетевых данных и адаптировать модели к меняющимся условиям, избегая полного переобучения.
Определение типов мобильного трафика необходимо для отслеживания работы сетей связи, обеспечения требуемого уровня качества обслуживания и обнаружения отклонений от нормы. В современных мобильных сетях большая доля информации передается в зашифрованном формате, что серьезно затрудняет применение методов анализа на основе сигнатур и технологии глубокого анализа пакетов (DPI). В связи с этим актуальны методы машинного обучения, которые позволяют автоматически определять ключевые признаки и обнаруживать сложные взаимосвязи в сетевых данных.
В ходе работы был осуществлён анализ научных публикаций, касающихся темы исследования. Также была создана цепочка обработки данных (pipeline) для подготовки и анализа сетевых данных, и построены модели машинного обучения. Разработаны модели глубокого обучения и проведена их экспериментальная оценка.
Особое внимание уделили переносу обучения (transfer learning). Эта методика включает предварительное обучение модели на изначальном наборе данных, после чего происходит её адаптация к новому домену посредством дополнительного обучения. Благодаря этому возможно использовать уже обученные модели и модифицировать их для работы в новых условиях, избегая полного переобучения и необходимости сбора обширных объёмов новых размеченных данных.
«В настоящее время большая доля мобильного трафика передается в зашифрованном виде, что значительно затрудняет использование привычных подходов к анализу сетевых данных. В ходе исследования мы оценили возможности применения методов глубокого обучения для классификации такого трафика и изучили, как перенос обучения позволяет адаптировать модели к новым условиям, избегая полного переобучения», — заявил ассистент кафедры системного программирования Высшего математического колледжа МГУ Александр Гетьман.
Анализ полученных данных позволяет определить, насколько эффективны методы глубокого обучения для классификации зашифрованного мобильного трафика, и демонстрирует, что трансферное обучение может быть использовано для адаптации моделей к меняющимся условиям сетевой инфраструктуры и обновлениям программного обеспечения.
Работа была доложена на научной конференции « Ломоносовские чтения» на факультете вычислительной математики и кибернетики МГУ.