Изучение навыков и атрибутов для переносимого оценивания в видео
Краткое содержание
arXiv:2511.13993v1 Тип объявления: новый Аннотация: Оценка навыков по видео включает в себя оценку качества физической активности человека и объяснение того, что можно сделать лучше. Современные модели специализируются на отдельных видах спорта и страдают от высокой стоимости и нехватки экспертного уровня надзора за длинным хвостом видов спорта. Для преодоления этого разрыва мы исследуем переносимые видеопредставления для оценки навыков. Наш подход CrossTrainer выявляет атрибуты навыков, такие как баланс, контроль и положение рук — значения которых выходят за рамки любого конкретного вида спорта, а затем обучает мультимодальную языковую модель генерировать действенные рекомендации для нового видео, например, «поднимите руки выше, чтобы создать больше мощности», а также уровень мастерства, например, ранний эксперт. Мы проверили новую модель на нескольких наборах данных как для межвидовых (перенос), так и внутривидовых (внутридоменных) настроек, где она достигает прироста до 60% относительно современного уровня техники. Путем абстрагирования общих...
Полный текст статьи пока не загружен.