К верифицированному рассуждению о коде средствами больших языковых моделей

2025-11-17 05:00:00

Краткое содержание

arXiv:2509.26546v2 Тип объявления: замена-перекрёстная Аннотация: Хотя основанные на больших языковых моделях (LLM) агенты способны решать широкий спектр вопросов, связанных с анализом исходного кода, их ответы не всегда верны. Это ограничивает полезность агента в ситуациях, когда необходима высокая точность: (1) помощь разработчику ПО в изучении нового программного проекта, (2) поддержка инженера во время сессий код-ревью и (3) обеспечение соответствия автоматически генерируемого кода определённым требованиям (например, исправление ошибки, повышение читаемости, реализация новой функциональности). В результате недостаточной надёжности агенту нельзя доверять без предварительной ручной проверки его выводов. Ручное подтверждение ответов от агентов анализа кода требует человеческого труда и замедляет продуктивность разработчиков, ослабляя преимущества помощи такого инструмента. В данной статье мы предлагаем метод автоматического подтверждения ответов, предоставляемых агентом анализа кода, путём верификации его рассуждений.

Полный текст статьи пока не загружен.

Читать оригинал статьи