ToxSyn: Снижение предвзятости при выявлении ненавистнических высказываний посредством синтетических данных меньшинства на бразильском португальском языке
Краткое содержание
arXiv:2506.10245v2 Тип объявления: замена Аннотация: Разработка надежных систем обнаружения ненавистнических высказываний остается ограниченной отсутствием крупномасштабных подробных наборов тренировочных данных, особенно для языков, отличных от английского. Существующие корпуса обычно полагаются на грубые метки токсичных/нетоксичных сообщений, а немногочисленные наборы данных, фиксирующие ненависть, направленную против конкретных групп меньшинств, критически страдают от отсутствия нетоксичных контрпримеров (например, доброкачественных текстов о меньшинствах), необходимых для различения подлинной ненависти и простого обсуждения. Мы представляем ToxSyn — первый португальский крупноразмерный корпус, специально разработанный для многоаспектного распознавания ненавистнической речи среди девяти защищенных групп меньшинств. Созданный посредством контролируемого четырехэтапного конвейера, ToxSyn включает аннотации типов дискурса для фиксации риторических приемов токсичной лексики, таких как сарказм или дегуманизация. Критически важно, что он систематически содержит нетоксичные контрпримеры, отсутствующие во всех остальных общедоступных наборах данных. Наши эксперименты показывают катастрофическое взаимное обобщение...
Полный текст статьи пока не загружен.