Отдельная Голова Действий: Ограничение Знаний о Задаче Условными Слоями

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.12101v1 Тип объявления: cross Аннотация: Поведенческое клонирование (Behavior Cloning, BC) — это подход к обучению с учителем на основе данных, который привлекает всё больше внимания в связи с успехом законов масштабирования в областях обработки языка и компьютерного зрения. Среди его реализаций в роботизированном манипулировании Diffusion Policy (DP) с двумя вариантами, DP-CNN (DP-C) и DP-Transformer (DP-T), является одной из наиболее эффективных и широко применяемых моделей, демонстрирующей преимущества прогнозирования непрерывных последовательностей действий. Однако как DP, так и другие методы BC по-прежнему ограничены дефицитом парных обучающих данных, а внутренние механизмы, лежащие в основе эффективности DP, остаются недостаточно изученными, что приводит к ограниченной обобщающей способности и отсутствию принципиального подхода к разработке моделей. В данной работе мы предлагаем рецепт раздельного обучения, который использует практически бесплатные траектории, сгенерированные методами кинематики, в качестве данных без наблюдений для предварительного обучения общей головы действий (генератора действий). Предварительно обученная голова действий затем заморажи

Полный текст статьи пока не загружен.

Читать оригинал статьи