arXiv:2511.13204v1 Тип объявления: новый Аннотация: Задача слабо управляемого обнаружения аномалий в видеоматериалах заключается в выявлении аномальных событий исключительно на основе меток уровня видеофайлов, обеспечивая баланс между эффективностью аннотирования и практической применимостью. Одна...
Лента материалов из области искусственного интеллекта (AI)
Материалов: 78087
arXiv:2405.00620v2 Тип анонса: замена Аннотация: Лейн-граф критически важен для приложений, таких как автономное вождение и планирование маршрутов на уровне полос движения. В предыдущих исследованиях основное внимание уделялось извлечению графов уровня полосы движения из аэрофотоснимков с использо...
arXiv:2502.10810v2 Тип объявления: замена Аннотация: Несмотря на значительные достижения крупных моделей видения и языка (LVLM) на устоявшихся эталонных тестах, сохраняется заметный пробел в подходящих оценках применимости этих моделей в новой области понимания потокового видео с длительным контек...
arXiv:2511.13309v1 Тип объявления: новый Аннотация: Генерация реалистичных облаков точек лидара играет ключевую роль в разработке и оценке автономных систем вождения. Хотя современные методы генерации трехмерных облаков точек лидара продемонстрировали значительные улучшения, они всё ещё сталкивают...
arXiv:2511.13586v1 Тип объявления: новый Аннотация: Идентификация типов клеток и субтипов по обычным гистопатологическим изображениям имеет решающее значение для улучшения вычислительного понимания человеческих заболеваний. Существующие модели на основе тайлов способны фиксировать детальную ядерну...
arXiv:2508.12638v2 Тип объявления: замена Аннотация: Модели видения-языка (VLM) всё чаще применяются в режиме реального времени в приложениях, таких как автономное вождение и взаимодействие человека с компьютером, где требуются быстрые и надёжные реакции на основе точной интерпретации визуальной и...
arXiv:2508.12409v2 Тип объявления: замена Аннотация: Полу-контролируемая семантическая сегментация (Semi-Supervised Semantic Segmentation — S4) продвинула вперед анализ дистанционных измерений (remote sensing — RS), используя непомеченные данные через псевдо-метки и обучение согласованности. Однак...
arXiv:2511.00956v2 Тип анонса: замена Аннотация: Мы представляем RefTON — фреймворк виртуальной примерки одежды от человека к человеку на основе потока, который улучшает реалистичность одежды через непарные визуальные референсы. В отличие от традиционных подходов, зависящих от сложных вспомогатель...
arXiv:2511.04128v2 Тип объявления: замена Аннотация: Точное восприятие морской среды посредством надежного отслеживания множества объектов (MOT) имеет решающее значение для обеспечения безопасной навигации судов и эффективной морской разведки. Однако сложная морская среда часто вызывает движение к...
arXiv:2505.15249v2 Тип объявления: замена-перекрёстная Аннотация: В последнее время большие мультимодальные модели зрения-языка (LVLM) стали предпочтительными инструментами для оценки соответствия текста изображению, однако их устойчивость относительно визуальной модальности остаётся недостаточно ...