PromptGuard на задаче BLP-2025 №1: Фреймворк классификации с использованием метода голосования большинства и сходства ключевых слов для обнаружения ненавистнических высказываний на бенгальском языке

2025-11-19 05:00:00

Краткое содержание

arXiv:2510.09771v2 Тип объявления: замена-перекрёстная публикация Аннотация: Задача BLP-2025 1А требует классификации бенгальской ненавистнической речи по шести категориям. Традиционные контролируемые подходы требуют обширных размеченных наборов данных, что является дорогостоящим для языков с ограниченными ресурсами. Мы разработали PromptGuard — фреймворк с небольшим числом примеров, объединяющий анализ хи-квадрат для извлечения ключевых слов и адаптивное голосование большинством голосов для принятия решений. Мы исследуем выбор статистических ключевых слов в сравнении со случайными подходами и механизмы адаптивного голосования, которые расширяют классификацию на основе качества консенсуса. Ключевые слова, выбранные методом хи-квадрат, обеспечивают последовательное улучшение во всех категориях, тогда как адаптивное голосование приносит пользу неоднозначным случаям, требующим дополнительных раундов классификации. PromptGuard достигает микро-F1 равного 67.61, превосходя базовые методы на основе N-грамм (60.75) и случайные подходы (14.65). Исследования влияния отдельных компонентов подтверждают, что ключевые слова, основанные на методе хи-квадрат, оказывают наиболее устойчивое влияние во всех категориях.

Полный текст статьи пока не загружен.

Читать оригинал статьи