Проверка эффективности трансформеров зрения для отоскопии: производительность и влияние утечки данных

2025-11-10 05:00:00

Краткое содержание

arXiv:2511.04872v1 Тип объявления: новый Аннотация: В данном исследовании оценивается эффективность моделей трансформеров зрения, в частности Swin-трансформеров, в повышении точности диагностики заболеваний уха по сравнению с традиционными свёрточными нейронными сетями. Учитывая заявленную частоту ошибочных диагнозов среди специалистов-отоларингологов — около 27%, повышение диагностической точности является крайне важным вопросом. Исследование проводилось на реальных клинических данных от Департамента оториноларингологии Клинической больницы Университета Чили, включающих видеоматериалы отоскопии ушных обследований, демонстрирующие различные патологии среднего и наружного уха. Кадры были отобраны согласно пороговым значениям лапласиана и энтропии Шеннона, при этом пустые кадры исключались. Первоначально модели трансформеров Swin v1 и Swin v2 достигли точности распознавания 100% и 99,1% соответственно, незначительно превосходя показатели модели ResNet (99,5%). Эти результаты превзошли метрики, представленные в аналогичных исследованиях. Однако последующая оценка выявила критический вопрос утечки данных в подготовленном наборе данных.

Полный текст статьи пока не загружен.

Читать оригинал статьи