← Вернуться к списку

Гиперболическая иерархическая сеть выравнивания и рассуждений для поиска 3D-моделей по текстовому запросу

Краткое содержание

arXiv:2511.11045v1 Тип объявления: новое Аннотация: С ежедневным притоком трехмерных данных в интернете задача поиска 3D-данных по текстовому запросу привлекает всё больше внимания. Однако современные методы сталкиваются с двумя основными проблемами: коллапс иерархического представления (Hierarchy Representation Collapse — HRC) и размывание значимости вследствие избыточности (Redundancy-Induced Saliency Dilution — RISD). Проблема HRC заключается в сжатии абстрактной-конкретной и целостной-компонентной иерархий в евклидовых вложениях, тогда как RISD усредняет шумные фрагменты, затеняя критически важные семантические признаки и снижая способность модели различать трудные отрицательные случаи. Для решения указанных проблем мы предлагаем гиперболическую сеть иерархической согласованной аргументации (Hyperbolic Hierarchical Alignment Reasoning Network — H²ARN), предназначенную для поиска 3D-данных по тексту. H²ARN размещает как текстовые данные, так и 3D-информацию в гиперболическом пространстве Лоренца, где экспоненциальный рост объема пространства естественным образом сохраняет расстояния между элементами иерархии. Потеря упорядоченности по иерархиям формирует сужающийся конус импликаций вокруг каждого вектора текста, гарантируя попадание соответствующего экземпляра 3D-модели внутрь данного конуса, в то время как контрастная потеря на уровне экземпляров...

Полный текст статьи пока не загружен.