← Вернуться к списку

SkillGen: Обучение предметно-ориентированным навыкам для принятия последовательных решений в контексте

Краткое содержание

arXiv:2511.14670v1 Тип объявления: новое Аннотация: Большие языковые модели (LLM) все чаще применяются для последовательного принятия решений с помощью контекстно-зависимого обучения (ICL), однако их эффективность сильно зависит от качества подсказок. Эффективные подсказки должны соответствовать трем принципам: сосредоточенность на критически важной информации для принятия решения, предоставление детализации на уровне шагов и минимизация зависимости от экспертных аннотаций за счет эффективности меток. Однако существующие методы ICL часто не удовлетворяют всем этим критериям одновременно. В ответ на эти вызовы мы представляем SkillGen — основанный на навыках фреймворк ICL для структурированного последовательного рассуждения. Он строит ориентированный на действия граф уровня предметной области из выборочных траекторий, идентифицирует высокоэффективные действия посредством временного разностного распределения заслуг и извлекает пошаговые навыки для генерации подробных, учитывающих контекст подсказок. Мы также приводим теоретический анализ, показывающий, что фокусировка на сегментах высокой полезности поддерживает идентификацию задач и обеспечивает более эфф

Полный текст статьи пока не загружен.