EmoVid: Многомодальный видеонабор данных эмоций для понимания и генерации эмоционально-ориентированных видеороликов
Краткое содержание
arXiv:2511.11002v1 Тип объявления: новый Аннотация: Эмоции играют ключевую роль в видеовыражении, однако существующие системы генерации видео преимущественно сосредоточены на низком уровне визуальных метрик, игнорируя эмоциональную составляющую. Хотя прогресс в области анализа эмоций достигнут в визуальной сфере, сообщество специалистов по видео испытывает недостаток специализированных ресурсов, позволяющих связать понимание эмоций с генерационными задачами, особенно в стилизованных и нереалистичных контекстах. Для устранения данного пробела мы представляем EmoVid — первый мультимодальный набор видеоданных с аннотированными эмоциями, специально разработанный для творческих медиа и включающий анимационные мультфильмы, фрагменты фильмов и анимированные стикеры. Каждое видео снабжено метками эмоций, визуальными атрибутами (яркость, насыщенность цвета, тон) и текстовыми описаниями. В результате систематического анализа нами выявлены пространственно-временные закономерности, связывающие визуальные характеристики с восприятием эмоций в различных типах видеоконтента. Основываясь на полученных выводах, мы разработали систему генерации видео, управляемую эмоциональной информацией.
Полный текст статьи пока не загружен.