← Вернуться к списку

К метрически точной реконструкции многопользовательских сеток путем совместной оптимизации человеческого скопления в пространстве камеры

Краткое содержание

arXiv:2511.13282v1 Тип объявления: новый Аннотация: Восстановление многопользовательской человеческой сетки по одиночному изображению является сложной задачей, осложняемой нехваткой реальных тренировочных данных. Современные конвейеры генерации псевдореальных человеческих сеток ориентированы на одного человека, где каждый человек обрабатывается индивидуально без совместного оптимизационного процесса. Это упущение приводит к отсутствию согласованности сцены, порождая людей с конфликтующими глубинами и масштабами внутри одного и того же изображения. Для решения этой проблемы мы предлагаем метод оптимизации перевода с учетом глубины (Depth-conditioned Translation Optimization — DTO), который совместно уточняет пространственно-камерные переводы всех индивидов в толпе. Используя антропометрические априорные данные о высоте человека и сигналы глубины от монокулярного оценщика глубины, DTO находит сценически-согласованное размещение всех субъектов в рамках строгого байесовского подхода MAP (Maximum a posteriori). Применяя DTO к набору данных 4D-Humans, мы создаем DTO-Humans — новый крупномасштабный набор псевдорезультатов...

Полный текст статьи пока не загружен.