SWAP: К аудиту авторских прав на мягкие подсказки посредством последовательного водяного знака

2025-11-10 05:00:00

Краткое содержание

arXiv:2511.04711v1 Тип объявления: кросс Аннотация: Крупномасштабные модели видения-языка, особенно CLIP, продемонстрировали выдающиеся результаты в различных прикладных задачах. Мягкие подсказки (soft prompts), представляющие собой тщательно разработанные модули, эффективно адаптирующие модели видения-языка к конкретным задачам, требуют эффективной защиты авторских прав. В данной работе мы исследуем защиту авторского права моделей путем аудита подозрительных сторонних моделей на предмет включения защищённых мягких подсказок. Хотя это можно рассматривать как особый случай проверки владения моделью, наш анализ показывает, что существующие методы неэффективны из-за уникальных особенностей обучения мягким подсказкам. Неинвазивный аудит изначально склонен давать ложноположительные срабатывания, когда независимые модели имеют схожие распределения данных с моделями-жертвами. Инвазивные подходы также терпят неудачу: методы закладок, предназначенные для CLIP, неспособны внедрять функциональные триггеры, тогда как расширение традиционных методов закладок для глубоких нейронных сетей до обучения мягким подсказкам сталкивается с проблемами вредоносности и двусмысленности.

Полный текст статьи пока не загружен.

Читать оригинал статьи