← Вернуться к списку

GroupRank: Парадигма группового переранжирования на основе обучения с подкреплением

Краткое содержание

arXiv:2511.11653v1 Тип объявления: cross Аннотация: Большие языковые модели продемонстрировали значительный потенциал в качестве реранкеров для повышения общей производительности RAG-систем. Однако существующие парадигмы реранкинга ограничены фундаментальной теоретической и практической дилеммой: Поэлементные методы, будучи простыми и высоко гибкими, оценивают документы независимо, что делает их склонными к «Ловушке ранкинговой близорукости», поскольку они упускают из виду относительную важность документов. В отличие от них, списочные методы способны воспринимать глобальный контекст ранжирования, но страдают от присущей им «Жёсткости списка», что приводит к серьёзным проблемам масштабируемости и гибкости при обработке больших наборов кандидатов. Для решения этих проблем мы предлагаем Groupwise — новую парадигму реранкинга. В этом подходе запрос и группа кандидатных документов совместно подаются в модель, которая выполняет сравнения внутри группы для присвоения индивидуальных оценок релевантности каждому документу. Такая конструкция сохраняет гибкость поэлементных методов, одновременно позволяя

Полный текст статьи пока не загружен.