Мета: Ллама Гард 4 12B (meta-llama/llama-guard-4-12b)

2025-04-30 01:06:33

Краткое содержание

Llama Guard 4 — это мультимодальная предварительно обученная модель, основанная на архитектуре Llama 4 Scout и дообученная для классификации безопасности контента. Подобно предыдущим версиям, она способна классифицировать контент как во входных данных языковой модели (классификация запросов), так и в её выходных результатах (классификация ответов). Модель действует как языковая модель, генерируя текстовый вывод, который показывает, является ли заданный запрос или ответ безопасным либо небезопасным, а также перечисляет нарушенные категории содержания в случае выявления рисков. Llama Guard 4 была настроена таким образом, чтобы обеспечивать защиту от стандартизированной таксономии угроз MLCommons, и разработана для поддержки мультимодальных возможностей Llama 4. В частности, она объединяет функции предыдущих моделей Llama Guard, обеспечивая модерацию контента на английском и нескольких поддерживаемых языках, а также улучшенную обработку смешанных текстово-изобразительных запросов, включая несколько изображений одновременно. Дополнительно Llama Guard 4 интегрирована в API Llama Moderations, расширяя надёжную классификацию безопасности для текста и изображений.

Полный текст статьи пока не загружен.

Читать оригинал статьи