← Вернуться к списку

Графовое условное сопоставление потоков для генерации реляционных данных

Краткое содержание

arXiv:2505.15668v2 Тип объявления: замена Аннотация: Синтез данных приобретает всё большую популярность как технология повышения конфиденциальности. В то время как методы генерации одиночных табличных данных достигли значительных успехов, современные подходы к многотабличным данным часто лишены гибкости и выразительности, необходимых для моделирования сложных реляционных структур. В частности, такие методы испытывают трудности с дальнодействующими зависимостями и сложными отношениями внешних ключей, такими как таблицы с несколькими родительскими таблицами или различными типами связей между одной парой таблиц. Мы предлагаем порождающую модель для реляционных данных, генерирующую содержимое реляционной базы данных исходя из графа, образованного внешними ключами. Это достигается путём обучения глубокой порождающей модели всего содержимого реляционной базы методом сопоставления потоков (flow matching), где нейронная сеть, тренируемая для очистки записей, использует графовую нейронную сеть для получения информации от связанных записей. Наш подход обладает высокой гибкостью, поскольку поддерживает реляционные наборы данных с...

Полный текст статьи пока не загружен.