TeaRAG: Эффективная агентная архитектура генерации с расширенным извлечением токенов

2025-11-10 05:00:00

Краткое содержание

arXiv:2511.05385v1 Тип объявления: кросс Аннотация: Генерация с использованием поиска (Retrieval-Augmented Generation — RAG) повышает надежность больших языковых моделей (Large Language Models — LLMs), привлекая внешние знания. Для повышения гибкости агентная RAG применяет автономный многоэтапный поиск и рассуждения для обработки запросов. Хотя недавние разработки в области агентной RAG улучшили результаты благодаря обучению с подкреплением, такие подходы часто требуют значительных затрат токенов на процессы поиска и рассуждений. Это компромисс между точностью и эффективностью. В данной работе предлагается подход TeaRAG — эффективный по числу токенов агентный фреймворк RAG, способный сжимать как извлекаемое содержание, так и шаги рассуждений. 1) Во-первых, извлечённое содержимое сжимается путём дополнения семантического поиска по блокам графовым поиском, использующим лаконичные триплеты. Затем строится ассоциативный граф знаний на основе семантической схожести и совместного появления элементов. Наконец, метод персонализированного ранжирования PageRank применяется для выделения ключевых фрагментов знаний внутри графа, уменьшая количество токенов на каждый этап извлечения. 2) Б

Полный текст статьи пока не загружен.

Читать оригинал статьи