MMD-Thinker: Адаптивное многомерное мышление для обнаружения мультимодальной дезинформации
Краткое содержание
arXiv:2511.13242v1 Тип объявления: новый Аннотация: Мультимодальная дезинформация наводняет различные социальные сети и продолжает развиваться в эпоху контента, генерируемого искусственным интеллектом (AIGC). Появившаяся дезинформация с низкими затратами на создание и высокой степенью обманчивости представляет значительные угрозы обществу. Хотя недавние исследования используют универсальные мультимодальные большие языковые модели (MLLM), чтобы добиться выдающихся результатов в области обнаружения, они сталкиваются с двумя критическими ограничениями: (1) Недостаточная аргументация, где универсальные MLLM часто следуют единой парадигме рассуждений, но создают неточные объяснения и выводы вследствие отсутствия специфичных знаний, необходимых для детектирования мультимодальной дезинформации. (2) Предвзятость рассуждений, когда один режим мышления делает детекторы неоптимальным путем для вынесения решений, затрудняяся поспевать за быстро растущим и усложняющимся потоком мультимодальной дезинформации. В данной статье мы предлагаем MMD-Thinker — двухэтапную архитектуру для выявления мультимодальной дезинформации посредством адаптивного многоступенчатого рассуждения.
Полный текст статьи пока не загружен.