Arcee AI: Виртуозная Средняя Модель версии 2 (arcee-ai/virtuoso-medium-v2)

2025-05-05 20:53:54

Краткое содержание

Virtuoso-Medium-v2 — это модель объёмом 32 млрд параметров, дистиллированная из логитов DeepSeek-v3 и объединённая обратно на ядро Qwen 2.5, что позволило создать более чёткую и фактологичную версию оригинальной модели Virtuoso Medium. Команда собрала около 1,1 миллиарда токенов логита и применила методику «слияния-фьюжн», дополненную выравниванием методом DPO, благодаря чему показатели модели превзошли результаты Arcee-Nova-2024 и многих моделей размером от 40 миллиардов параметров и больше на тестах MMLU-Pro, MATH и HumanEval. С контекстом длиной до 128 тысяч токенов и агрессивными вариантами квантования (от формата BF16 вплоть до 4-битной схемы GGUF) она обеспечивает баланс между производительностью и удобством развёртывания даже на одиночных GPU-нодах. Типичные сценарии использования включают корпоративных чат-ассистентов, помощников технического письма и создание проектов средней сложности программного кода там, где применение более тяжёлой версии Virtuoso-Large было бы избыточным.

Полный текст статьи пока не загружен.

Читать оригинал статьи