В Центре ИИ МГУ представили новую методику оптимизации запросов.

Центр искусственного интеллекта, созданный при Московском государственном университете имени М.В. Ломоносова представил метод оптимизации языка структурированных запросов (SQL) без дополнительного обучения моделей. Работа посвящена ускорению выполнения запросов к базам данных за счет анализа сходства их планов выполнения. Статья принята к публикации в Вестник Иркутского государственного университета, серия «Математика.

Эффективность работы современных баз данных во многом определяется оптимизацией запросов. Скорость обработки информации напрямую связана с тем, какой план выполнения выберет система. Тем не менее, встроенные инструменты оптимизации не всегда способны найти наилучший вариант, особенно когда речь идет о сложных SQL-запросах.

Читайте также:  ГУУ переориентирует обучение руководителей на инженерные технологии

Предложенная авторами методика процессной ИИ-аналитики (LLM-PM) основана на использовании предварительно обученных векторных представлений планов выполнения запросов. Система сопоставляет поступивший запрос с ранее обработанными и выбирает оптимальный набор подсказок для оптимизатора, учитывая схожесть планов. Это позволяет повысить эффективность работы без необходимости дополнительного обучения модели.

Для реализации работы был применен метод поиска наиболее близких планов выполнения запросов, дополненный проверкой выбранного набора подсказок перед их использованием. По мнению авторов, это способствует уменьшению вероятности выбора неоптимальных параметров оптимизации.

Исследования были выполнены с использованием стандартных наборов данных для проверки порядка соединения (Join Order Benchmark, JOB) и оценки кардинальности (Cardinality Estimation Benchmark) – числа строк, возвращаемых различными подзапросами при обработке, в системе openGauss. Тестирование показало, что разработанный метод в среднем снижает время выполнения запросов на 21%. Важно отметить, что данный подход не предполагает длительной предварительной подготовки и способен применять информацию о запросах, выполненных ранее, для повышения эффективности работы системы.

Читайте также:  Нарушения энергетического обмена в клетках мозга крыс оказались связаны с симптомами, схожими с синдромом дефицита внимания и гиперактивности.

«В ходе исследования было установлено, что предварительно обученные векторные представления планов выполнения запросов способны повысить производительность баз данных. Этот метод позволяет оптимизировать работу системы, исключая необходимость дополнительного обучения специализированных моделей», – подчеркнул младший научный сотрудник Центра ИИ МГУ Владимир Бурлаков.

Авторы утверждают, что разработанный метод целесообразно использовать в системах управления базами данных для повышения скорости выполнения сложных запросов, не оказывая существенного влияния на производительность системы.

Читайте также:  Ученые опровергли распространенное мнение о распространенности бактерии легионеллы

Информация предоставлена пресс-службой МГУ