Сжатые модели диффузии
Краткое содержание
arXiv:2508.14871v2 Тип объявления: замена Аннотация: Модели диффузии обычно вводят изотропный гауссовский шум, игнорируя структуру данных. Вдохновленные тем, как квантовые сжатые состояния перераспределяют неопределенность в соответствии с принципом неопределенности Гейзенберга, мы вводим модели сжатой диффузии (Squeezed Diffusion Models — SDM), которые масштабируют шум анизотропно вдоль главного компонента обучающего распределения. Поскольку сжатие улучшает отношение сигнал-шум в физике, мы предполагаем, что масштабирование шума зависимым от данных образом может лучше помочь моделям диффузии в изучении важных особенностей данных. Мы исследуем две конфигурации: (i) модель гейзенберговской диффузии, которая компенсирует масштабирование на главной оси обратным масштабированием по ортогональным направлениям; и (ii) стандартный вариант SDM, который масштабирует только главную ось. Парадоксально, но на наборах данных CIFAR-10/100 и CelebA-64 умеренное антисжатие — то есть увеличение дисперсии на главной оси — последовательно улучшает показатель FID до 15% и сдвиг
Полный текст статьи пока не загружен.