Жёсткость против шума: устранение путаницы между жёсткими и зашумлёнными примерами в рекомендательных системах посредством больших языковых моделей

2025-11-12 05:00:00

Краткое содержание

arXiv:2511.07295v2 Тип объявления: замена-перекрёстная публикация Аннотация: Неявная обратная связь, используемая при обучении рекомендательных систем, неизбежно сталкивается с шумом, вызванным такими факторами, как случайные клики и смещение позиций. Предыдущие исследования пытались выявлять зашумлённые выборки через отличительные паттерны данных, такие как высокие значения потерь, и ослабляли их влияние путём отбрасывания образцов или изменения весовых коэффициентов. Однако мы заметили, что зашумленные образцы и трудные образцы демонстрируют схожие закономерности, что приводит к проблеме путаницы между сложными и зашумлёнными образцами. Такая путаница проблематична, поскольку трудные образцы важны для моделирования предпочтений пользователей. Для решения этой проблемы мы предлагаем фреймворк LLMHNI, использующий два вспомогательных сигнала релевантности пользовательских элементов, генерируемых большими языковыми моделями (LLM), чтобы различать трудные и зашумлённые образцы. LLMHNI извлекает семантическую релевантность пользовательского элемента из кодированных эмбеддингов больших языковых моделей, что используется при отрицательной выборке для отбора сложных негативных примеров, одновременно отфильтровывая ложные негативные шумы. Стратегия согласования целей заключается...

Полный текст статьи пока не загружен.

Читать оригинал статьи