← Вернуться к списку

HierarchicalPrune: Позиционно-ориентированная компрессия для крупномасштабных диффузионных моделей

Краткое содержание

arXiv:2508.04663v2 Тип объявления: замена Аннотация: Современные модели диффузии текста в изображение (DM) демонстрируют выдающееся качество, однако их огромный масштаб параметров (от 8 до 11 миллиардов) создает значительные трудности при выполнении вычислений на устройствах с ограниченными ресурсами. В данной работе мы представляем HierarchicalPrune — новую методику сжатия, основанную на ключевом наблюдении: блоки моделей DM обладают различными функциональными иерархиями, где ранние блоки формируют семантические структуры, тогда как поздние блоки отвечают за уточнение текстур. HierarchicalPrune синергически объединяет три техники: (1) Иерархическое позиционное прореживание, которое выявляет и удаляет менее значимые поздние блоки согласно иерархии позиций; (2) Сохранение весов позиции, обеспечивающее систематическую защиту начальных частей модели, критичных для целостности семантической структуры; и (3) Чувствительность-направленная дистилляция знаний, регулирующая интенсивность переноса знаний исходя из обнаруженных нами вариаций чувствительности блоков. В результате предложенный подход...

Полный текст статьи пока не загружен.