← Вернуться к списку

К лучшему пониманию оценки глубины по монокулярному изображению

Краткое содержание

arXiv:2510.19814v3 Тип объявления: замена Аннотация: Оценка глубины по монокулярному изображению — важная задача, демонстрирующая быстрый прогресс, однако вопрос её оценки до конца не решён, что проявляется отсутствием стандартизации в существующей литературе и наличием большого количества метрик оценки, компромиссы и поведение которых недостаточно изучены. В данной работе представлен новый количественный анализ существующих метрик с точки зрения их чувствительности к различным типам возмущений эталонной истины (ground truth), акцентируя внимание на сравнении с человеческим восприятием. Наш анализ показывает, что существующие метрики крайне слабо чувствительны к таким видам искажений кривизны поверхности, как превращение гладких поверхностей в неровные. Для устранения данного недостатка мы предлагаем новую метрику, основанную на относительных нормалях поверхности, новые инструменты визуализации глубины и обоснованный метод построения составных метрик с улучшенным соответствием человеческому восприятию. Код и данные доступны по адресу: https://github.com/princeton-vl/evalmde.

Полный текст статьи пока не загружен.