arXiv:2511.13211v1 Тип объявления: новый Аннотация: Несмотря на недавние достижения в области выравнивания между текстом и трехмерной геометрией, существующие передовые методы всё ещё испытывают трудности с согласованием тонких семантических аспектов текста с детализированными геометрическими стру...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 78281
arXiv:2511.13249v1 Тип объявления: новый Аннотация: Задача обнаружения замаскированных объектов с использованием референсной информации (Ref-COD) заключается в выявлении скрытых объектов путем интеграции справочной информации, такой как изображения и текстовые описания. Предыдущие исследования пре...
arXiv:2511.13269v1 Тип объявления: новый Аннотация: Модели видения и языка (VLM), используя свои мощные возможности визуального восприятия и рассуждений, получили широкое распространение в задачах беспилотных летательных аппаратов (БПЛА). Однако пространственный интеллект существующих VLM-моделей ...
arXiv:2511.13242v1 Тип объявления: новый Аннотация: Мультимодальная дезинформация наводняет различные социальные сети и продолжает развиваться в эпоху контента, генерируемого искусственным интеллектом (AIGC). Появившаяся дезинформация с низкими затратами на создание и высокой степенью обманчивости...
arXiv:2511.13282v1 Тип объявления: новый Аннотация: Восстановление многопользовательской человеческой сетки по одиночному изображению является сложной задачей, осложняемой нехваткой реальных тренировочных данных. Современные конвейеры генерации псевдореальных человеческих сеток ориентированы на од...
arXiv:2511.13283v1 Тип объявления: новый Аннотация: Изображения таблиц представляют уникальные трудности для эффективного и действенного понимания вследствие необходимости фокусировки на конкретных вопросах и наличия избыточных фоновых областей. Современные подходы на основе мультимодальных больши...
arXiv:2511.13297v1 Тип объявления: новый Аннотация: Методы планирования от начала до конца являются фактическим стандартом современных автономных транспортных систем, однако надежность подходов, основанных на данных, страдает из-за широко известной проблемы длинных хвостов (например, редких, но кр...
arXiv:2511.13417v1 Тип объявления: новый Аннотация: Точное выделение границ сельскохозяйственных полей на спутниковых изображениях имеет решающее значение для управления земельными ресурсами и мониторинга посевов, однако существующие методы часто приводят к неполному выделению границ, слиянию сосе...
arXiv:2511.13420v1 Тип объявления: новый Аннотация: Большинство исследований галлюцинаций в больших мультимодальных моделях видения и языка (LVLM) сосредоточено на фактологических задачах описания изображений, где запрещены любые выходящие за пределы исходной картинки результаты вывода. Однако пра...
arXiv:2511.13494v1 Тип объявления: новый Аннотация: Современные модели видения и языка (VLM), такие как CLIP, OpenCLIP, EVA02-CLIP и SigLIP демонстрируют сильную производительность в режиме нулевого выстрела, однако неясна степень надежности их реакции на контролируемые лингвистические возмущения....