← Вернуться к списку

Генеративная модель виртуального человека: подход маскированной модели для изучения характеристик человека

Краткое содержание

arXiv:2306.10656v5 Тип объявления: замена-перекрёстная публикация Аннотация: Модель генерации виртуального человека (Virtual Human Generative Model, VHGM) представляет собой генеративную модель, аппроксимирующую совместную вероятность более чем по 2000 атрибутам, связанным со здравоохранением человека. В данной статье представлен основной алгоритм — VHGM-MAE, маскированный автоэнкодер (Masked AutoEncoder), специально разработанный для обработки многомерных разреженных данных в области здравоохранения. VHGM-MAE решает четыре ключевые технические задачи: (1) гетерогенность типов медицинских данных; (2) моделирование вероятностного распределения; (3) систематическое отсутствие данных в обучающем наборе из-за множества источников данных и (4) проблему высокой размерности с небольшим числом наблюдений $ n $ и большим количеством признаков $ p $. Для решения этих задач VHGM-MAE использует подход на основе правдоподобия для моделирования распределений разнородных типов, трансформерный MAE для выявления сложных зависимостей между наблюдаемыми и отсутствующими признаками, а также новую схему обучения, эффективно использующую доступные выборки с различными паттернами пропусков для смягчения проблемы малого числа наблюдений при большом количестве признаков.

Полный текст статьи пока не загружен.