← Вернуться к списку

RefineVAD: Семантически управляемая переориентация признаков для слабо контролируемого обнаружения аномалий в видео

Краткое содержание

arXiv:2511.13204v1 Тип объявления: новый Аннотация: Задача слабо управляемого обнаружения аномалий в видеоматериалах заключается в выявлении аномальных событий исключительно на основе меток уровня видеофайлов, обеспечивая баланс между эффективностью аннотирования и практической применимостью. Однако существующие методы часто чрезмерно упрощают пространство аномалий, рассматривая все ненормальные события как единую категорию, игнорируя разнообразные семантические и временные характеристики реальных аномалий. Вдохновившись тем, как человек воспринимает аномалии — путем совместного анализа временных паттернов движения и лежащих в основе различных типов аномалий семантических структур, мы предлагаем RefineVAD — новую архитектуру, имитирующую этот двухэтапный процесс рассуждений. Наша архитектура объединяет два основных модуля. Первый модуль, Motion-aware Temporal Attention and Recalibration (MoTAR), оценивает значимость движений и динамически корректирует временную фокусировку посредством сдвигового внимания и глобальной модели на основе трансформеров. Второй модуль, Category-Oriented Refinement (CORE), вводит мягкие априорные категории аномалий в...

Полный текст статьи пока не загружен.