PurpCode: Обоснование для более безопасной генерации кода

2025-11-18 05:00:00

Краткое содержание

arXiv:2507.19060v4 Тип объявления: replace-cross Аннотация: Мы представляем PurpCode — первый метод пост-обучения для подготовки моделей, генерирующих код с целью создания безопасного кода и защиты от вредоносной киберактивности. PurpCode обучает модель в два этапа: (i) Изучение правил, на котором модель явно обучается ссылаться на правила кибербезопасности для генерации кода без уязвимостей и избегания содействия вредоносной киберактивности; и (ii) Обучение с подкреплением, которое оптимизирует безопасность модели и сохраняет её полезность с помощью разнообразных механизмов вознаграждения с несколькими целями. Для оснащения конвейеров обучения всеобъемлющими данными по кибербезопасности мы проводим внутреннее тестирование на проникновение, чтобы синтезировать комплексные и широкоохватные промпты на основе реальных задач, направленные на провоцирование небезопасной киберактивности в модели. На основе PurpCode мы разработали модель для генерации кода, а именно PurpCode-32B, которая демонстрирует передовой уровень кибербезопасности, превосходя различные передовые модели.

Полный текст статьи пока не загружен.

Читать оригинал статьи