AnchorDS: Привязка динамических источников для семантически согласованного поколения 3D-объектов из текста
Краткое содержание
arXiv:2511.11692v1 Тип: новая работа Аннотация: Методы создания 3D-объектов на основе текста и оптимизации дистиллируют руководство из 2D-генеративных моделей с помощью сэмплирования по оценке дистилляции (SDS), но неявно рассматривают это руководство как статическое. Данная работа показывает, что игнорирование динамики источника порождает несогласованные траектории, которые подавляют или объединяют семантические сигналы, что приводит к артефактам «семантического избыточного сглаживания». Таким образом, мы переформулируем задачу текстового 3D-моделирования как отображение динамически развивающегося исходного распределения на фиксированное целевое распределение. Мы помещаем задачу в дважды обусловленное латентное пространство, обусловленное как текстовым запросом, так и промежуточно рендеренным изображением. В рамках этой совместной настройки мы наблюдаем, что условие в виде изображения естественным образом якорит текущее исходное распределение. Основываясь на этом наблюдении, мы представляем AnchorDS — усовершенствованный механизм дистилляции оценок, который обеспечивает стабилизированное руководство с якорением по состоянию через условия-изображения и стабилизирует генерацию. Мы также штрафуем ошибочные оценки источника и разрабатываем легков
Полный текст статьи пока не загружен.