Повышение диагностической эффективности на небольших и несбалансированных наборах данных путем композиции входных изображений на основе классов

2025-11-10 05:00:00

Краткое содержание

arXiv:2511.03891v2 Тип объявления: замена-перекрёстная публикация Аннотация: Маленькие несбалансированные наборы данных и низкое качество входных изображений могут приводить к высокому уровню ложных прогнозов при применении моделей глубокого обучения. В данной статье предлагается подход, основанный на класс-ориентированной композиции изображений (Class-Based Image Composition), который позволяет переформулировать тренировочные данные путём объединения нескольких изображений одного класса в комбинированные визуальные композитные изображения, названные составными входными изображениями (Composite Input Images — CoImg). Это повышает внутриклассовое разнообразие и улучшает плотность ценной информации на одно обучающее изображение, увеличивая способность модели различать тонкие паттерны заболеваний. Наш метод был протестирован на наборе данных оптической когерентной томографии (Optical Coherence Tomography Dataset for Image-Based Deep Learning Methods — OCTDL) (Кулябин и др., 2024 г.), содержащем 2064 высококачественных снимка оптической когерентной томографии сетчатки человека, представляющих семь различных заболеваний с существенным дисбалансом классов. Мы создали идеально сбалансированную версию данного набора данных, названную Co-O...

Полный текст статьи пока не загружен.

Читать оригинал статьи