← Вернуться к списку

Оценка латентных порождающих парадигм для высококачественной реконструкции трехмерной формы по одному изображению глубины

Краткое содержание

arXiv:2511.11074v1 Тип объявления: новое Аннотация: Хотя порождающие модели получили значительное распространение во множестве типов данных, включая трехмерные данные, консенсус относительно того, какая модель лучше всего подходит для той или иной задачи, пока еще не достигнут. Более того, условная информация, такая как текст и изображения, часто используется для управления процессом генерации, тогда как другие типы, такие как частичные 3D-данные, недостаточно изучены. В данной работе мы сравниваем две наиболее перспективные порождающие модели — модели стохастического диффузионного денойзинга и автокодирующие каузальные трансформеры, адаптированные нами для задач моделирования и завершения форм. Мы проводим тщательную количественную оценку и сравнение обеих моделей, включающее базовую дискриминантную модель и обширное исследование влияния различных факторов. Наши результаты показывают, что (1) модель диффузии с непрерывными латентными переменными превосходит как дискриминантную модель, так и автокодирующий подход и демонстрирует уровень производительности, соответствующий современному состоянию исследований, на задаче многомерной...

Полный текст статьи пока не загружен.