DINOv3-управляемая кросс-фьюжн архитектура для семантически осознанной генерации КТ из МРТ и КЛКТ

2025-11-18 05:00:00

Краткое содержание

arXiv:2511.12098v1 Тип: новая работа Аннотация: Генерация синтетических КТ-изображений на основе КЛКТ или МРТ имеет потенциал для эффективного планирования дозы облучения и адаптивной радиотерапии. Однако существующие модели на основе CNN не обладают глобальным семантическим пониманием, в то время как Трансформеры часто переобучаются на небольших медицинских наборах данных из-за высокой ёмкости модели и слабых индуктивных предпосылок. Для решения этих проблем мы предлагаем фреймворк DINOv3-Guided Cross Fusion (DGCF), который интегрирует замороженный самообучаемый Трансформер DINOv3 с обучаемым CNN-энкодером-декодером. Он иерархически объединяет глобальное представление Трансформера и локальные признаки CNN с помощью обучаемого модуля перекрёстного слияния, достигая сбалансированного локального внешнего вида и контекстного представления. Кроме того, мы представляем Multi-Level DINOv3 Perceptual (MLDP) функцию потерь, которая обеспечивает семантическое сходство между синтетическим КТ и эталонным изображением в пространстве признаков DINOv3. Эксперименты на тазовом наборе данных SynthRAD2023 демонстрируют, что DGCF достигла передовых

Полный текст статьи пока не загружен.

Читать оригинал статьи