К пониманию трехмерного зрения: роль гауссовой кривизны
Краткое содержание
arXiv:2508.11825v2 Тип объявления: замена Аннотация: Последние достижения в области компьютерного зрения преимущественно опирались на данные-ориентированные подходы, использующие глубокое обучение и крупномасштабные наборы данных. Глубокие нейронные сети добились выдающихся успехов в таких задачах, как стереосопоставление и восстановление глубины по монокулярным изображениям. Однако эти методы не содержат явных моделей трехмерной геометрии, которые можно было бы непосредственно анализировать, переносить между модальностями или систематически изменять для контролируемого эксперимента. Мы исследуем роль гауссовой кривизны при моделировании трехмерных поверхностей. Помимо того, что гауссова кривизна является инвариантной величиной относительно изменения наблюдателей или систем координат, мы демонстрируем с использованием набора данных Middlebury Stereo Dataset, что она обеспечивает разреженное и компактное описание трехмерных поверхностей. Кроме того, мы показываем сильную корреляцию между рейтингом производительности лучших современных методов стерео- и монокулярного анализа и низким суммарным абсолютным значением гауссовой кривизны. Мы предлагаем использовать это свойство в качестве
Полный текст статьи пока не загружен.