← Вернуться к списку

Двумерное представление для негидируемого одноракурсного трехмерного суперсэмплинга высокого разрешения в реальном времени

Краткое содержание

arXiv:2511.08224v1 Тип объявления: кросс Аннотация: Мы представляем 2Dto3D-SR — универсальную архитектуру для реального времени повышения разрешения трёхмерных объектов по одному виду, исключающую необходимость высокодетализированной RGB-подсказки. Наша архитектура кодирует трехмерные данные с одной точки наблюдения в структурированное двумерное представление, позволяя непосредственно применять существующие архитектуры сверхразрешения двухмерных изображений. Для представления видимой поверхности мы используем проектированный нормализованный координатный код (PNCC), который позволяет представить геометрию 3D-объекта в виде обычного изображения, обходя сложности методов, основанных на точках или направляемых RGB-данными. Такая конструкция поддерживает лёгкие и быстрые модели, адаптированные к различным условиям развертывания. Эффективность 2Dto3D-SR проверена двумя реализациями: одна основана на трансформерах Swin для достижения высокой точности, другая — на Vision Mamba для обеспечения высокой эффективности. Эксперименты показывают, что модель на основе Swin Transformer демонстрирует наилучшую точность на стандартных тестовых наборах, тогда как модель Vision Mamba обеспечивает конкурентоспособные результаты в режиме реального времени.

Полный текст статьи пока не загружен.