Объясняемый бенчмарк для детектирования изображений, созданных искусственным интеллектом (RewardBench)

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.12363v1 Тип объявления: новый Аннотация: Традиционные методы обнаружения изображений, созданных искусственным интеллектом, основанные на классификации, не способны объяснить, почему изображение считается настоящим или сгенерированным ИИ таким образом, чтобы это было понятно человеческому эксперту, что снижает доверие и убедительность таких инструментов детектирования для реальных приложений. Использование мультимодальных больших языковых моделей (MLLM) недавно стало популярным решением этой проблемы. Более того, для оценки качества генерируемых объяснений распространённым подходом является методология «MLLM в роли судьи», когда одна MLLM оценивает объяснения, созданные другой MLLM. Однако насколько хорошо эти модели справляются с оценкой объяснений, создаваемых ими самими или другими MLLM, пока недостаточно изучено. Поэтому мы предлагаем **XAIGID-RewardBench** — первый бенчмарк, предназначенный для оценки способности современных MLLM оценивать качество объяснений относительно подлинности изображения или факта его генерации искусственным интеллектом. Бенчмарк включает в себя...

Полный текст статьи пока не загружен.

Читать оригинал статьи