arXiv:2511.12368v1 Тип объявления: новый Аннотация: Сегментация рассуждений позволяет осуществлять сегментацию объектов открытого множества через неявные текстовые запросы, таким образом служа основой для автономных агентов, действующих в реальных условиях окружающей среды. Однако существующие мет...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 78657
arXiv:2511.12370v1 Тип объявления: новый Аннотация: Обнаружение изменений сцены онлайн (Online Scene Change Detection — OSCD) представляет собой крайне сложную задачу, требующую от агента выявления значимых изменений в режиме реального времени при наблюдении сцены с произвольных ракурсов. Существу...
arXiv:2511.12405v1 Тип объявления: новый Аннотация: Исследование открытых ситуаций в режиме от входных данных до конечного результата представляет собой перспективную, но сложную задачу ввиду необходимости сильных способностей к обобщению. В частности, автономное вождение автомобилей в неструктури...
arXiv:2511.12422v1 Тип объявления: новый Аннотация: ResNet добился огромного успеха в компьютерном зрении благодаря механизму остаточных соединений. ResNet можно рассматривать как дискретизированную форму обыкновенных дифференциальных уравнений (ОДУ). С этой точки зрения, несколько блоков остатков...
arXiv:2511.12428v1 Тип объявления: новый Аннотация: Модели видения-языка (VLM) добились значительных успехов в мультимодальном рассуждении и генерации, однако их высокие вычислительные требования остаются серьёзной проблемой. Диффузионные модели видения-языка (DVLM) особенно привлекательны благода...
arXiv:2511.12446v1 Тип объявления: новый Аннотация: Медицинское визуальное вопросно-ответное моделирование могло бы поддерживать клинические решения, однако современные системы часто терпят неудачу при изменении домена (сдвиге области применимости) и выдают ответы, слабо обоснованные изображениями...
arXiv:2511.12627v1 Тип объявления: новый Аннотация: Обнаружение замаскированных объектов (COD) — задача идентификации предметов, сливающихся с окружающей средой благодаря схожим цветам, текстурам и узорам. Эта задача представляет серьёзный вызов как традиционным методам сегментации, так и современ...
arXiv:2511.12658v1 Тип объявления: новый Аннотация: Современные методы локализации подделок текста на изображениях (T-IFL) часто страдают от плохой обобщаемости вследствие ограниченного объема реальных наборов данных и разрыва распределения, вызванного синтетическими данными, неспособными отразить...
arXiv:2511.12371v1 Тип объявления: новый Аннотация: Целью поиска видео по текстовому запросу является выборка релевантных видеофайлов из больших баз данных на основе текстовых запросов. Современные методы достигли прогресса в обработке явных запросов, когда интересующий визуальный контент описан я...
arXiv:2511.12400v1 Тип объявления: новый Аннотация: Мы представляем MSLoRA — адаптер, независимый от архитектуры базовой сети, эффективно использующий параметры и переопределяющий отклик признаков вместо повторного дообучения самой базовой модели. Современные методы адаптации низкого ранга преимущ...