Пиплайн генерации запросов с улучшенной оценкой отвечаемости для поиска финансовой информации
Краткое содержание
arXiv:2511.05000v1 Тип объявления: кросс Аннотация: По мере роста интереса к финансовым приложениям больших языковых моделей (LLM), точное извлечение информации (Information Retrieval — IR) сохраняет ключевое значение для обеспечения надёжности сервисов ИИ. Однако существующие бенчмарки не способны охватывать комплексные и специфичные информационные потребности реальных банковских сценариев. Создание предметно-ориентированных эталонных тестов IR является дорогостоящим процессом, ограниченным юридическими запретами на использование реальных клиентских данных. Для решения этой проблемы мы предлагаем систематический подход к созданию предметно-специфичных эталонов IR через генерацию запросов на основе LLM. В качестве конкретного воплощения данного подхода наша методика объединяет одно-документную и много-документную генерацию запросов с улучшенным методом оценки релевантности ответов, дополнённым рассуждениями, обеспечивая лучшее соответствие человеческим оценкам по сравнению с предыдущими методами. Используя этот метод, мы создали набор данных KoBankIR, включающий 815 запросов, полученных из 204 официальных банковских документов. Наши эксперименты показывают, что...
Полный текст статьи пока не загружен.