DeepForgeSeal: Полуустойчивое водяные знаки, управляемые латентным пространством, для обнаружения дипфейков с использованием многоагентного антагонистического обучения с подкреплением

2025-11-10 05:00:00

Краткое содержание

arXiv:2511.04949v1 Тип объявления: кросс Аннотация: Быстрые достижения в области генеративного ИИ привели к созданию всё более реалистичных дипфейков, создавая растущие проблемы для правоохранительных органов и общественного доверия. Существующие пассивные детекторы дипфейков испытывают трудности с поддержанием темпов развития, главным образом из-за своей зависимости от конкретных признаков подделки, что ограничивает их способность обобщаться на новые типы дипфейков. Превентивное обнаружение дипфейков с использованием водяных знаков стало новым подходом для решения задачи выявления высококачественных синтетических медиа. Однако эти методы часто сталкиваются с трудностью балансирования между устойчивостью к безвредным искажениям и чувствительностью к злонамеренным манипуляциям. В данной статье предлагается новый фреймворк глубокого обучения, использующий многомерные представления пространства скрытых признаков и парадигму многоагентного антагонистического обучения с подкреплением (Multi-Agent Adversarial Reinforcement Learning — MAARL), чтобы разработать надёжный и адаптивный метод встраивания водяных знаков. Конкретно мы разрабатываем обучаемый встроенный механизм внедрения водяного знака, работающий в пространстве латентных признаков, который захватывает высокоуровневые семантические характеристики изображений...

Полный текст статьи пока не загружен.

Читать оригинал статьи