REACT-LLM: Бенчмарк для оценки интеграции больших языковых моделей (LLM) с причинно-следственными признаками в клинических прогностических задачах
Краткое содержание
arXiv:2511.07127v1 Тип объявления: новый Аннотация: Большие языковые модели (LLM) и причинное обучение обладают значительным потенциалом для принятия клинических решений (CDM). Однако синергия между ними изучена недостаточно хорошо, главным образом из-за отсутствия систематических эталонных тестов, оценивающих их интеграцию в прогнозировании клинического риска. В реальной клинической практике выявление признаков, оказывающих причинное влияние на исход заболевания, имеет решающее значение для получения действенных и заслуживающих доверия прогнозов. Хотя недавние исследования подчеркивают развивающиеся способности больших языковых моделей к причинному рассуждению, отсутствуют комплексные тесты, позволяющие оценить их способность к причинному обучению и эффективность прогнозирования клинического риска с учетом причинных факторов. Для решения этой проблемы мы представляем REACT-LLM — тестовый набор, предназначенный для оценки того, может ли объединение больших языковых моделей с причинными признаками улучшить прогностические характеристики в клинике и потенциально превзойти традиционные методы машинного обучения (ML). В отличие от существующих бенчмарков, связанных с применением LLM в медицине, которые часто сосредоточены лишь на ограниченном наборе исходов, REACT-LLM оценивает...
Полный текст статьи пока не загружен.