Не упусти лес за деревьями: Глубокая оценка уверенности для больших языковых моделей через рассуждение в пространстве ответов
Краткое содержание
arXiv:2511.14275v1 Тип объявления: новое Аннотация: Знание надежности ответа модели имеет решающее значение для практического применения. Благодаря мощным возможностям генерации больших языковых моделей (LLM), исследования сосредоточены на создании вербализованных оценок уверенности. Этот подход дополнительно усиливается за счет объединения рассуждений по цепочке мыслей, что обеспечивает логичную и прозрачную оценку. Однако влияние стратегий рассуждения на расчетную уверенность остается недостаточно изученным. В данной работе мы показываем, что прогнозирование вербализованного распределения вероятностей может эффективно стимулировать глубокое рассуждение при оценке уверенности. Интуитивно понятно, что это требует от языковой модели учитывать всех кандидатов в пространстве ответов вместо того, чтобы полагаться только на одну догадку, а также тщательно присваивать оценки уверенности, соответствующие требованиям распределения. Данный метод демонстрирует преимущества на различных моделях и задачах независимо от того, известно ли пространство ответов или нет. Его преимущество сохраняется даже после обучения с подкреплением, и далее...
Полный текст статьи пока не загружен.