ReCode: Обновление знаний API-кода с помощью методов подкрепляющего обучения
Краткое содержание
arXiv:2506.20495v3 Тип объявления: замена-перекрёстная Аннотация: Большие языковые модели (LLM) демонстрируют выдающиеся возможности генерации программного кода, однако испытывают трудности при адаптации к частым изменениям внешних библиотек API. Это критическое ограничение обусловлено зависимостью от устаревших знаний API, полученных во время обучения моделей, даже несмотря на доступ к актуальной документации, что препятствует надёжному созданию кода в динамических средах. Для решения данной проблемы мы предлагаем ReCode — новую методику, основанную на правилах подкрепления для обновления кода (Reinforcement Learning for Code Update), имитирующую адаптацию программиста-человека к изменениям API. В частности, нами был сформирован набор данных примерно из 2000 записей для тренировки LLM-моделей выполнению миграции версий на основе обновлённой информации. Затем мы вводим модифицированную метрику сходства строк специально для оценки качества генерируемого кода, используемую в качестве вознаграждения при обучении методом подкрепления. Экспериментальные результаты показывают, что подход ReCode значительно улучшает производительность больших языковых моделей по генерации кода в условиях динамически меняющихся API, особенно на тестовом наборе CodeUpdateA.
Полный текст статьи пока не загружен.