CultureGuard: К созданию культурно-ориентированного датасета и модели защиты для мультиязычных приложений безопасности

2025-11-11 05:00:00

Краткое содержание

arXiv:2508.01710v4 Тип объявления: замена-перекрёстная Аннотация: Расширение применения больших языковых моделей (LLM) в агентских приложениях подчёркивает необходимость надёжных моделей обеспечения безопасности. В то время как безопасность контента на английском языке хорошо изучена, другие языки отстают от аналогичных достижений вследствие высокой стоимости сбора культурно ориентированных размеченных наборов данных. Мы представляем CultureGuard — инновационное решение для формирования высококачественных наборов данных по безопасности, согласованных с культурными особенностями различных языков. Наш подход включает четырёхэтапную синтетическую конвейерную систему генерации и фильтрации данных: сегментация культурных данных, адаптация культурных данных, машинный перевод и контроль качества. Эта система позволяет преобразовать и расширить английский набор данных по контентной безопасности Nemotron-Content-Safety-Dataset-V2 до восьми отдельных языков: арабского, немецкого, испанского, французского, хинди, японского, тайского и китайского. Полученный набор данных Nemotron-Safety-Guard-Dataset-v3 содержит 386 661 образец на девяти языках и способствует

Полный текст статьи пока не загружен.

Читать оригинал статьи