КлинСтруктор: автоматическое структурирование неструктурированных клинических текстов с использованием искусственного интеллекта
Краткое содержание
arXiv:2511.11883v1 Тип публикации: кросс-доменная Аннотация: Клинические заметки содержат ценную, насыщенную контекстом информацию, однако их неструктурированный формат создаёт ряд проблем, включая непреднамеренные смещения (например, гендерные или расовые), слабую обобщающую способность в различных клинических условиях (например, модели, обученные на одной системе ЭМК, могут плохо работать на другой из-за различий в форматах) и низкую интерпретируемость. Для решения этих проблем мы представляем ClinStructor — конвейер, использующий большие языковые модели (LLM) для преобразования клинического свободного текста в структурированные вопросно-ответные пары, специфичные для задачи, до этапа прогнозного моделирования. Наш метод существенно повышает прозрачность и управляемость и приводит лишь к незначительному снижению прогнозной эффективности (снижение AUC на 2-3%) по сравнению с прямым тонким настраиванием при решении задачи прогнозирования смертности в ОРИТ. ClinStructor закладывает прочную основу для создания надёжных, интерпретируемых и обобщаемых моделей машинного обучения в клинической среде.
Полный текст статьи пока не загружен.