GeoMVD: Модель генерации мультивью на основе геометрической информации с улучшенной геометрией
Краткое содержание
arXiv:2511.12204v1 Тип: новая статья Аннотация: Генерация многовидовых изображений имеет значительную прикладную ценность в компьютерном зрении, особенно в таких областях, как 3D-реконструкция, виртуальная и дополненная реальность. Большинство существующих методов, основанных на расширении одиночных изображений, сталкиваются со значительными вычислительными трудностями в поддержании межвидовой согласованности и генерации высококачественных результатов. Для решения этих проблем мы предлагаем Геометрически-управляемую Многовидовую Диффузионную Модель, которая включает механизмы извлечения многовидовой геометрической информации и регулирования интенсивности геометрических признаков для генерации изображений, одновременно согласованных между видами и насыщенных деталями. В частности, мы разработали модуль извлечения многовидовой геометрической информации, который использует карты глубины, карты нормалей и маски сегментации переднего плана для построения общей геометрической структуры, обеспечивая согласованность формы и структуры между различными видами. Для улучшения согласованности и восстановления деталей в процессе
Полный текст статьи пока не загружен.