Улучшенный трансформер зрения LoRA для обнаружения атак морфинга на основе единичных изображений посредством дистилляции знаний от EfficientNet

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.12602v1 Тип объявления: новый Аннотация: Системы распознавания лиц (FRS) критически важны для обеспечения безопасности, однако остаются уязвимыми к атакам морфинга, когда синтетические изображения объединяют биометрические признаки от нескольких человек. Мы предлагаем новый подход к обнаружению одиночных изображений атаки морфинга (S-MAD), основанный на архитектуре учитель-студент, где основанная на CNN модель учителя улучшает работу модели студента, построенной на основе Vision Transformer (ViT). Для повышения эффективности мы интегрируем метод адаптации низкого ранга (Low-Rank Adaptation — LoRA) для тонкой настройки, снижая вычислительные затраты при сохранении высокой точности обнаружения. Проведены обширные эксперименты на наборе данных морфинга, собранном из трех общедоступных баз данных лиц, включающем десять различных алгоритмов генерации морфинга для оценки устойчивости метода. Предложенный подход сравнивается с шестью современными методами S-MAD, демонстрируя превосходную производительность обнаружения и вычислительную эффективность.

Полный текст статьи пока не загружен.

Читать оригинал статьи