ProST: Прогрессивное обучение субзадачам для Парето-оптимальных многоагентных систем с использованием небольших языковых моделей

2025-11-12 05:00:00

Краткое содержание

arXiv:2509.04508v2 Тип объявления: замена Аннотация: Многоагентные системы с небольшими языковыми моделями (SLM) представляют собой жизнеспособную альтернативу одноагентным системам, использующим большие языковые модели (LLM), для решения сложных проблем. В данной работе мы исследуем, как эти альтернативы соотносятся между собой по эффективности и производительности. Для изучения данного компромисса мы реализуем одно- и многоагентные системы для решения комплексных задач в среде AppWorld с использованием языковых моделей разного размера. Мы обнаружили, что трудности с долгосрочным обучением в небольших языковых моделях (SLM) ограничивают их производительность. Даже при обучении специализированным ролям SLM не способны эффективно освоить все подзадачи. Чтобы решить эту проблему, мы предлагаем простую стратегию прогрессивного обучения подзадач, при которой новые подзадачи вводятся постепенно в каждом тренировочном цикле. Мы выяснили, что эта новая стратегия, аналогичная обучению на уровне экземпляров, последовательно повышает эффективность работы многоагентных систем во всех случаях.

Полный текст статьи пока не загружен.

Читать оригинал статьи