← Вернуться к списку

MedGEN-Bench: Контекстуально запутанная тестовая среда для открытой мультимодальной медицинской генерации

Краткое содержание

arXiv:2511.13135v1 Тип объявления: новый Аннотация: По мере роста популярности моделей видения и языка (VLM) в медицинских приложениях врачи всё чаще ожидают от систем ИИ не только формирования текстовых диагнозов, но и создания соответствующих медицинских изображений, гармонично интегрируемых в реальные клинические рабочие процессы. Несмотря на растущий интерес, существующие медицинские визуальные эталонные тесты имеют заметные ограничения. Они часто основываются на двусмысленных запросах, недостаточно релевантных содержанию изображений, упрощают сложный диагностический процесс до коротких закрытых решений и придерживаются парадигмы оценки, ориентированной исключительно на текст, игнорируя важность возможностей генерации изображений. Для решения этих проблем мы представляем **MedGEN-Bench** — комплексный мультимодальный бенчмарк, предназначенный для продвижения исследований медицинского ИИ. MedGEN-Bench включает 6422 экспертно проверенных пары изображение-текст, охватывающих шесть методов медицинской визуализации, 16 клинических задач и 28 подтасок. Он структурирован в три дист...

Полный текст статьи пока не загружен.