Live-SWE-agent: Могут ли программные инженерные агенты саморазвиваться в реальном времени?

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.13646v1 Тип объявления: cross Аннотация: Большие языковые модели (LLM) трансформируют практически все отрасли, включая разработку программного обеспечения. В последние годы было предложено множество LLM-агентов для решения реальных программных задач. Такие программные агенты обычно оснащены набором инструментов для программирования и могут автономно решать, какие действия предпринять далее, чтобы выстроить полные траектории для решения сквозных программных задач. Несмотря на перспективность, они, как правило, требуют специальной разработки и могут оставаться неоптимальными, поскольку исчерпывающий поиск во всём пространстве проектирования каркаса агента может быть чрезвычайно сложным и затратным. Принимая во внимание, что программные агенты по своей сути сами являются программами, которые можно дорабатывать и модифицировать, исследователи недавно предложили ряд самосовершенствующихся программных агентов, включая Машину Дарвина-Гёделя (DGM). В то же время такие самосовершенствующиеся агенты требуют затратного офлайн-обучения на конкретных бенчмарках и могут плохо обобщать результаты при работе с различными LLM или бенчмарками.

Полный текст статьи пока не загружен.

Читать оригинал статьи