← Вернуться к списку

GEMMA-SQL: Новая модель преобразования текста в SQL-запросы на основе больших языковых моделей

Краткое содержание

arXiv:2511.04710v1 Тип объявления: новый Аннотация: Системы преобразования текста в SQL позволяют пользователям взаимодействовать со структурированными базами данных посредством естественного языка, устраняя необходимость специальных знаний программирования. В данной работе мы представляем GEMMA-SQL — легковесную и эффективную модель преобразования текста в SQL, построенную на основе открытой архитектуры Gemma 2B. В отличие от многих крупных языковых моделей (LLM), GEMMA-SQL тонко настраивается ресурсоэффективным итерационным способом и может развертываться на недорогом оборудовании. Используя бенчмарк SPIDER для обучения и оценки, GEMMA-SQL объединяет несколько стратегий подсказок, включая обучение на небольшом количестве примеров, чтобы повысить точность генерации запросов SQL. Инструкция-тюнинговая версия модели GEMMA-SQL Instruct достигает точности набора тестов 66,8% и точности точного совпадения множества 63,3%, превосходя ряд современных базовых решений, таких как IRNet, RYANSQL и CodeXDavinci. Предложенный подход демонстрирует, что продуманное проектирование подсказок и целевое инструкционное дообучение способны значительно улучшить результаты.

Полный текст статьи пока не загружен.