За пределами цепочек: объединение больших языковых моделей и баз знаний при сложном поиске ответов
Краткое содержание
arXiv:2505.14099v2 Тип объявления: замена Аннотация: Задача извлечения ответов из базы знаний (Knowledge Base Question Answering — KBQA) заключается в предоставлении ответов на вопросы естественного языка с использованием структурированных знаний из баз данных. Хотя подходы, основанные исключительно на больших языковых моделях (LLM), обеспечивают обобщение, они страдают от устаревших знаний, склонности к фантазированию и отсутствия прозрачности. Методы цепочечного извлечения и синтеза знаний (KG-RAG) решают эти проблемы путем включения внешних баз знаний, однако ограничены простыми вопросами с цепочечной структурой из-за отсутствия планирования и логической организации. Вдохновившись методами семантического анализа, мы предлагаем метод PDRR: четырехэтапную архитектуру, включающую этапы предсказания, декомпозиции, поиска и рассуждения. Наш подход сначала прогнозирует тип вопроса и разлагает вопрос на структурированные триплеты. Затем извлекаются релевантные данные из баз знаний, после чего языковая модель используется в качестве агента для рассуждений над разложенными триплетами и завершения недостающей информации. Экспериментальные результаты показывают, что предложенный метод PDRR стабильно превосходит существующие методы на различных архитектурах LLMs и демонстрирует превосходную производительность на задаче bo
Полный текст статьи пока не загружен.