AIF: Асинхронный фреймворк логического вывода для рентабельного преранжирования
Краткое содержание
arXiv:2511.12934v1 Тип объявления: новый Аннотация: В промышленных рекомендательных системах модели предварительного ранжирования на основе глубоких нейронных сетей (ГНС) обычно используют последовательную схему выполнения: выборка признаков и прямое распространение модели запускаются только после получения кандидатов от предыдущего этапа retrieval. Такая конструкция создаёт inherent limitations, включая избыточные вычисления для идентичных пользователей/элементов и повышенную задержку из-за строго последовательных операций, что в совокупности ограничивает ёмкость модели и эффективность системы. Для решения этих проблем мы предлагаем Асинхронный Фреймворк Вывода (AIF), экономичную вычислительную архитектуру, которая отделяет interaction-independent components, работающие в пределах одного пользователя или элемента, от прогнозирования в реальном времени. AIF реорганизует процесс вывода модели, выполняя пользовательские вычисления параллельно с этапом retrieval и проводя вычисления на стороне элементов в nearline-режиме. Это означает, что
Полный текст статьи пока не загружен.