← Вернуться к списку

SCALEX: Масштабируемое исследование концепций и латентных пространств для диффузионных моделей

Краткое содержание

arXiv:2511.13750v1 Тип объявления: кросс Аннотация: Модели генерации изображений часто кодируют социальные предрассудки, включая стереотипы, связанные с полом, расой и профессией. Существующие методы анализа этих предубеждений в диффузионных моделях либо сосредоточены узко на заранее определенных категориях, либо зависят от ручного толкования латентных направлений. Эти ограничения препятствуют масштабируемости и затрудняют обнаружение тонких или неожиданных закономерностей. Мы представляем SCALEX — фреймворк для масштабного и автоматизированного исследования пространства латентных переменных моделей диффузии. SCALEX извлекает семантически значимые направления из H-пространства исключительно по естественным языковым подсказкам, что позволяет интерпретировать их без дополнительного обучения или маркировки (zero-shot). Это дает возможность систематического сравнения произвольных понятий и крупномасштабного выявления внутренних ассоциаций модели. Мы показываем, что SCALEX выявляет гендерную предвзятость при профессиональных запросах, ранжирует семантическую согласованность среди дескрипторов идентичности и раскрывает кластеризованную концептуальную структуру без супервайзинга.

Полный текст статьи пока не загружен.