Изучение метрик для извлечения утверждений на уровне документов в чешском и словацком языках
Краткое содержание
arXiv:2511.14566v1 Тип объявления: кросс Аннотация: Извлечение утверждений на уровне документа остается открытой задачей в области проверки фактов, и, как следствие, методы оценки извлеченных утверждений получили ограниченное внимание. В данной работе мы исследуем подходы к выравниванию двух наборов утверждений, относящихся к одному исходному документу, и вычислению их сходства через оценку выравнивания. Мы изучаем техники для определения наилучшего возможного выравнивания и метода оценки между наборами утверждений с целью создания надежного оценочного фреймворка. Наш подход позволяет сравнивать наборы утверждений, извлеченные моделью, и аннотированные человеком, что служит метрикой для оценки производительности моделей по извлечению данных, а также возможным показателем согласия между аннотаторами. Мы проводим эксперименты на недавно собранном датасете — утверждениях, извлеченных из комментариев под чешскими и словацкими новостными статьями, — областях, которые представляют дополнительные трудности из-за неформального языка, сильного локального контекста и суб...
Полный текст статьи пока не загружен.