arXiv:2511.11702v1 Тип: новая работа Аннотация: Понимание аффордансов на уровне 3D-сцен из инструкций на естественном языке крайне важно для того, чтобы воплощённые агенты могли осмысленно взаимодействовать в сложных средах. Однако эта задача остаётся сложной из-за необходимости семантического анали...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 78109
arXiv:2511.12040v1 Тип: новая публикация Аннотация: Прямая (feed-forward) 3D-реконструкция по разреженным изображениям низкого разрешения (НР) является ключевой возможностью для практических приложений, таких как автономное вождение и воплощенный ИИ. Однако существующие методы часто не способны восс...
arXiv:2511.12054v1 Тип объявления: новый Аннотация: Кросс-вью геолокация (CVGL) сопоставляет запросные изображения ($\textit{напр.}$, с дрона) с географически соответствующими изображениями противоположного ракурса ($\textit{напр.}$, со спутника). Хотя supervised-методы демонстрируют высокую произво...
arXiv:2511.12100v1 Тип: новая работа Аннотация: При текущем обучении визуальных моделей они часто опираются лишь на ограниченный набор достаточных причин для своих прогнозов, что делает их уязвимыми к смещениям распределения или отсутствию ключевых признаков. Методы атрибуции позволяют точно определ...
arXiv:2511.12151v1 Тип: новая статья Аннотация: Текстовое редактирование изображений быстро развивается с появлением диффузионных моделей. Хотя безинверсионные методы на основе потоков обеспечивают высокую эффективность за счет отсутствия инверсии латентного пространства, они часто не могут эффектив...
arXiv:2511.12170v1 Тип: новая статья Аннотация: Задача восстановления облаков точек заключается в реконструкции полных 3D-форм по частичным наблюдениям, что является сложной проблемой из-за сильных окклюзий и отсутствующей геометрии. Несмотря на недавние успехи в мультимодальных методах, использующи...
arXiv:2511.12331v1 Тип объявления: новый Аннотация: Модели видения и языка (VLM) испытывают трудности с обработкой отрицания. Получив подсказку вроде «найти (или создать) уличную сцену без пешеходов», такие модели часто игнорируют слово «не». Современные методы решают эту проблему путем дообучения...
arXiv:2511.12386v1 Тип объявления: новый Аннотация: Целью данного исследования является диагностика и дифференцирование камней почек, кист и опухолей с использованием изображений компьютерной томографии (КТ) почки. В данном исследовании используется гибридный квантово-классический подход. Мы объед...
arXiv:2511.12559v1 Тип объявления: новое Аннотация: Распознавание стандартных ультразвуковых плоскостей имеет ключевое значение для клинических задач, таких как скрининг заболеваний, оценка состояния органов и биометрические измерения. Однако существующие методы неспособны эффективно использовать ...
arXiv:2511.13020v1 Тип объявления: новый Аннотация: Гиперспектральная визуализация (HSI) обладает большим потенциалом для здравоохранения благодаря богатству спектральной информации. Однако получение гиперспектральных изображений остается дорогостоящим и технически сложным процессом. Восстановлени...