FB-RAG: Повышение эффективности RAG посредством прямого и обратного поиска
Краткое содержание
arXiv:2505.17206v3 Тип анонса: замена-перекрёстная публикация Аннотация: Традиционная система расширенной генерации на основе поиска (RAG) испытывает трудности с обработкой сложных запросов, которым недостаёт чётких сигналов для извлечения наиболее релевантного контекста, вынуждая выбирать между узким контекстом, упускающим ключевые сведения, и широким контекстом, который запутывает большую языковую модель (LLM). Для решения этой проблемы мы предлагаем метод Forward-Backward RAG (FB-RAG) — новый подход без дополнительного обучения, основанный на простой, но мощной стратегии заглядывания вперёд. В FB-RAG используется облегчённая языковая модель для предварительного просмотра возможных будущих результатов генерации, позволяющая использовать доказательства из нескольких выборочных выходов для точного определения наиболее подходящего контекста для финальной, более мощной модели генерации. Это позволяет улучшить производительность без сложной тонкой настройки или методов обучения с подкреплением, используемых ранее. По результатам тестирования на девяти наборах данных из LongBench и ∞Bench, FB-RAG стабильно демонстрирует высокие результаты. Более того, повышение производительности достигается с уменьшением задержки благодаря сокращённому и целенаправленному запросу для основной модели.
Полный текст статьи пока не загружен.