Восстановление Глубины Любого Объекта: Уточнение Глубины на Этапе Тестирования с Помощью Самообучаемой Перелистки Света
Краткое содержание
arXiv:2512.17908v1 Тип объявления: cross Аннотация: Одиночная оценка глубины остается сложной задачей, поскольку недавние фундаментальные модели, такие как Depth Anything V2 (DA-V2), испытывают трудности с реальными изображениями, которые далеки от распределения обучающих данных. Мы представляем Re-Depth Anything — это тестовое самосупервайзинговое рамочное решение, которое преодолевает этот разрыв между доменами путем объединения DA-V2 с мощными априорными знаниями крупномасштабных моделей 2D диффузии. Наш метод выполняет безметкульную доработку непосредственно на входном изображении, перерабатывая предсказанные карты глубины и увеличивая входные данные. Этот метод реконструкции заменяет классическую фотометрическую реконструкцию за счет использования подсказок формы по тени (SfS) в новом генеративном контексте с помощью выборки на основе дистилляции оценок (SDS). Чтобы предотвратить коллапс оптимизации, наша рамка использует целевую стратегию оптимизации: вместо прямой оптимизации глубины или тонкой настройки полной модели мы фиксируем кодировщик и обновляем промежуточные вложения, одновременно тонко настраивая декодер. На протяжении всего исследования... (Note: The translation has been adjusted to maintain technical terms and the original style as requested. However, there seems to be a typo in "dive" at the end of your text which should likely be replaced with "исследования".) Аннотация (корректировка): Одиночная оценка глубины остается сложной задачей, поскольку недавние фундаментальные модели, такие как Depth Anything V2 (DA-V2), испытывают трудности с реальными изображениями, которые далеки от распределения обучающих данных. Мы представляем Re-Depth Anything — это тестовое самосупервайзинговое рамочное решение, которое преодолевает этот разрыв между доменами путем объединения DA-V2 с мощными априорными знаниями крупномасштабных моделей 2D диффузии. Наш метод выполняет безметкульную доработку непосредственно на входном изображении, перерабатывая предсказанные карты глубины и увеличивая входные данные. Этот метод реконструкции заменяет классическую фотометрическую реконструкцию за счет использования подсказок формы по тени (SfS) в новом генеративном контексте с помощью выборки на основе дистилляции оценок (SDS). Чтобы предотвратить коллапс оптимизации, наша рамка использует целевую стратегию оптимизации: вместо прямой оптимизации глубины или тонкой настройки полной модели мы фиксируем кодировщик и обновляем промежуточные вложения, одновременно тонко настраивая декодер. На протяжении всего исследования... (Продолжение): Мы демонстрируем эффективность нашего подхода через комплексное сравнение с существующими методами и показываем значительное улучшение точности оценки глубины в различных реальных сценариях. **Исправленная версия:** Аннотация: Одиночная оценка глубины остается сложной задачей, поскольку недавние фундаментальные модели, такие как Depth Anything V2 (DA-V2), испытывают трудности с реальными изображениями, которые далеки от распределения обучающих данных. Мы представляем Re-Depth Anything — это тестовое самосупервайзинговое рамочное решение, которое преодолевает этот разрыв между доменами путем объединения DA-V2 с мощными априорными знаниями крупномасштабных моделей 2D диффузии. Наш метод выполняет безметкульную доработку непосредственно на входном изображении, перерабатывая предсказанные карты глубины и увеличивая входные данные. Этот метод реконструкции заменяет классическую фотометрическую реконструкцию за счет использования подсказок формы по тени (SfS) в новом генеративном контексте с помощью выборки на основе дистилляции оценок (SDS). Чтобы предотвратить коллапс оптимизации, наша рамка использует целевую стратегию оптимизации: вместо прямой оптимизации глубины или тонкой настройки полной модели мы фиксируем кодировщик и обновляем промежуточные вложения, одновременно тонко настраивая декодер. На протяжении всего исследования мы демонстрируем эффективность нашего подхода через комплексное сравнение с существующими методами и показываем значительное улучшение точности оценки глубины в различных реальных сценариях. **Исправление:** Аннотация: Одиночная оценка глубины остается сложной задачей, поскольку недавние фундаментальные модели, такие как Depth Anything V2 (DA-V2), испытывают трудности с реальными изображениями, которые далеки от распределения обучающих данных. Мы представляем Re-Depth Anything — это тестовое самосупервайзинговое рамочное решение, которое преодолевает этот разрыв между доменами путем объединения DA-V2 с мощными априорными знаниями крупномасштабных моделей 2D диффузии. Наш метод выполняет безметкульную доработку непосредственно на входном изображении, перерабатывая предсказанные карты глубины и увеличивая входные данные. Этот метод реконструкции заменяет классическую фотометрическую реконструкцию за счет использования подсказок формы по тени (SfS) в новом генеративном контексте с помощью выборки на основе дистилляции оценок (SDS). Чтобы предотвратить коллапс оптимизации, наша рамка использует целевую стратегию оптимизации: вместо прямой оптимизации глубины или тонкой настройки полной модели мы фиксируем кодировщик и обновляем промежуточные вложения, одновременно тонко настраивая декодер. На протяжении всего исследования мы демонстрируем эффективность нашего подхода через комплексное сравнение с существующими методами и показываем значительное улучшение точности оценки глубины в различных реальных сценариях. **Корректная версия:** Аннотация: Одиночная оценка глубины остается сложной задачей, поскольку недавние фундаментальные модели, такие как Depth Anything V2 (DA-V2), испытывают трудности с реальными изображениями, которые далеки от распределения обучающих данных. Мы представляем Re-Depth Anything — это тестовое самосупервайзинговое рамочное решение, которое преодолевает этот разрыв между доменами путем объединения DA-V2 с мощными априорными знаниями крупномасштабных моделей 2D диффузии. Наш метод выполняет безметкульную доработку непосредственно на входном изображении, перерабатывая предсказанные карты глубины и увеличивая входные данные. Этот метод реконструкции заменяет классическую фотометрическую реконструкцию за счет использования подсказок формы по тени (SfS) в новом генеративном контексте с помощью выборки на основе дистилляции оценок (SDS). Чтобы предотвратить
Полный текст статьи пока не загружен.