FAPE-IR: Частотно-зависимая архитектура планирования и выполнения для универсальной реставрации изображений
Краткое содержание
arXiv:2511.14099v1 Тип объявления: кросс Аннотация: Все-в-одном восстановление изображений (AIO-IR) направлено на разработку единой модели, способной обрабатывать несколько видов деградаций в сложных условиях. Однако существующие методы часто полагаются на специализированные конструкции для конкретных задач или стратегии скрытого маршрутизирования, что затрудняет их адаптацию к реальным сценариям с различными видами деградации. Мы предлагаем FAPE-IR — структуру планирования и выполнения, учитывающую частоту для восстановления изображений. Она использует замороженную мультимодальную большую языковую модель (MLLM) в качестве планировщика для анализа поврежденных изображений и генерации кратких планов восстановления, ориентированных на частоты. Эти планы направляют модуль смеси экспертов на основе LoRA (LoRA-MoE), встроенный в исполнитель на базе диффузии, который динамически выбирает экспертов по высоким или низким частотам, дополненные частотными характеристиками входного изображения. Для дальнейшего повышения качества восстановления и снижения артефактов мы вводим антагонистическое обучение и регуляризационную потерю, основанную на частоте. Путем объединения семантического планирования с восстановлением, зависящим от частоты, ...
Полный текст статьи пока не загружен.