Токенизация географических объектов с выравниванием по LLM для рекомендаций в локальной жизни
Краткое содержание
arXiv:2511.14221v1 Тип объявления: кросс Аннотация: Последние достижения в области больших языковых моделей (LLM) улучшили текстовые рекомендации путем обогащения традиционных методов на основе идентификаторов возможностями семантической генерализации. Методы на основе текста обычно кодируют текстовую информацию об элементах через проектирование подсказок и генерируют дискретные семантические идентификаторы с помощью токенизации элементов. Однако при выполнении предметно-ориентированных задач, таких как локальные услуги для повседневной жизни, простое включение информации о местоположении в подсказки не позволяет уловить тонко детализированные пространственные характеристики и осознание реальных расстояний между элементами. Для решения этой проблемы мы предлагаем LGSID — ориентированную на LLM географическую фреймворк-токенизацию элементов для рекомендаций по местным услугам. Этот фреймворк состоит из двух ключевых компонентов: 1) выравнивание LLM на основе обучения с подкреплением (RL), основанное на географии; 2) иерархическая географическая токенизация элементов. В модуле выравнивания на основе RL мы сначала обучаем модель вознаграждения со списком, чтобы зафиксировать реальные пространственные отношения между элементами. Затем мы вводим новый подход G-
Полный текст статьи пока не загружен.