← Вернуться к списку

MergeSlide: Непрерывное объединение моделей и согласованная задача-классу подсказка вывода для непрерывного обучения на полнослайдовых изображениях

Краткое содержание

arXiv:2511.13099v1 Тип объявления: новый Аннотация: Пожизненное обучение на полнослайдовых изображениях (Whole Slide Images — WSI) направлено на последовательное обучение или дообучение единой модели на онкологических задачах, снижая затраты ресурсов и усилий, необходимых для передачи и обработки данных, особенно учитывая гигабайтный объем WSI-изображений. В данной статье мы представляем MergeSlide — простую, но эффективную архитектуру, рассматривающую пожизненное обучение как проблему объединения моделей путем использования визуальной языковой патологической базовой модели. Когда появляется новая задача, она: 1) определяется классочувствительными подсказками, 2) дообучается несколько эпох с использованием бэкэнда без многослойного перцептрона (MLP), и 3) объединяется в единую модель с помощью ортогональной стратегии непрерывного слияния, сохраняющей производительность и предотвращающей катастрофическое забывание. Для вывода в условиях инкрементального обучения классов (CLASS-IL), когда идентичность задачи неизвестна, мы предлагаем метод вывода Task-to-Class Prompt-aligned (TCP). Конкретно, TCP сначала определяет наиболее релевантную задачу, используя доступные классы заданий...

Полный текст статьи пока не загружен.