← Вернуться к списку

Ближайшее Соседнее Проецирование Удаления Адверсального Обучения

Краткое содержание

arXiv:2509.07673v3 Тип объявления: replace-cross Аннотация: Глубокие нейронные сети демонстрируют впечатляющие результаты в задачах классификации изображений, но остаются уязвимыми к состязательным примерам. Стандартное состязательное обучение повышает устойчивость, но обычно не решает явно проблему перекрытия признаков между классами — ключевого фактора уязвимости. В данной работе мы представляем новую структуру состязательного обучения, которая активно снижает межклассовую близость, устраняя межклассовые зависимости в пространстве признаков для состязательных и чистых примеров. Конкретно, наш подход сначала определяет ближайших межклассовых соседей для каждого состязательного примера, а затем удаляет проекции на этих соседей, чтобы усилить разделимость признаков. Теоретически мы показываем, что предлагаемая нами коррекция логитов уменьшает константу Липшица нейронных сетей, тем самым снижая сложность Радемахера, что непосредственно способствует улучшению обобщающей способности.

Полный текст статьи пока не загружен.