MissHDD: Гибридная детерминированная диффузия для восполнения гетерогенных неполных данных
Краткое содержание
arXiv:2511.14543v1 Тип объявления: кросс Аннотация: Неполные данные часто встречаются в реальных табличных приложениях, где числовые, категориальные и дискретные атрибуты сосуществуют внутри одного набора данных. Такая гетерогенная структура представляет значительные трудности для существующих моделей заполнения пропусков на основе диффузии, которые обычно предполагают однородное пространство признаков и полагаются на стохастические траектории денойзинга. Такие предположения затрудняют поддержание условной согласованности и часто приводят к коллапсу информации для категориальных переменных или нестабильности при необходимости детерминированного обновления числовых переменных. Эти ограничения указывают на то, что один процесс диффузии недостаточен для смешанного типа табличного заполнения пропусков. Мы предлагаем гибридную детерминистскую диффузионную структуру, которая разделяет разнородные признаки на два взаимодополняющих генерационных канала. Канал с непрерывным базисом DDIM обеспечивает эффективное и стабильное детерминированное удаление шума для числовых переменных, тогда как канал с дискретными латентными признаками...
Полный текст статьи пока не загружен.