CDFlow: Построение инвертируемых слоев с циркулянтными и диагональными матрицами
Краткое содержание
arXiv:2510.25323v3 Тип объявления: replace Аннотация: Нормализующие потоки — это глубинные генеративные модели, которые обеспечивают эффективное оценивание правдоподобия и сэмплирование за счёт обратимых преобразований. Ключевая задача заключается в разработке линейных слоёв, которые повышают выразительность модели, сохраняя при этом эффективное вычисление определителя Якоби и обратного преобразования. Мы представляем новый обратимый линейный слой, основанный на произведении циркулянтных и диагональных матриц. Данное разложение снижает параметрическую сложность с $\mathcal{O}(n^2)$ до $\mathcal{O}(mn)$ за счёт использования $m$ диагональных матриц и $m-1$ циркулянтных матриц, при этом всё ещё аппроксимируя общие линейные преобразования. Благодаря использованию быстрого преобразования Фурье, наш подход снижает временную сложность обращения матрицы с $\mathcal{O}(n^3)$ до $\mathcal{O}(mn\log n)$, а сложность вычисления логарифма определителя — с $\mathcal{O}(n^3)$ до $\mathcal{O}(mn)$, где $n$ — размерность входного пространства. На основе этого слоя мы разрабатываем Circulant-Diagonal Flow (CDFlow),
Полный текст статьи пока не загружен.