Майкрософт: МАИ ДС Р1 (бесплатная версия) (microsoft/mai-ds-r1)
Краткое содержание
MAI-DS-R1 — это вариант модели DeepSeek-R1, прошедший дополнительную подготовку командой Microsoft AI для повышения отзывчивости модели на ранее заблокированные темы при одновременном улучшении её безопасности. Построенная на основе рассуждений DeepSeek-R1, она интегрирует 110 тысяч примеров из набора данных Tulu-3 SFT и 350 тысяч внутренних многоязычных образцов, ориентированных на безопасность. Модель сохраняет сильные способности к рассуждениям, кодированию и решению проблем, одновременно разблокируя широкий спектр запросов, ранее ограниченных в версии R1. MAI-DS-R1 демонстрирует повышенную эффективность в тестах на смягчение вреда и поддерживает конкурентоспособные результаты по общим задачам рассуждений. Она превосходит версию R1-1776 по показателям удовлетворённости пользователей для заблокированных запросов и снижает утечку вредных категорий контента. Модель основана на архитектуре трансформера MoE (Mixture-of-Experts) и подходит для общего использования, исключая высокорисковые области вроде юридической, медицинской сферы или автономных систем.
Полный текст статьи пока не загружен.