Искусственный интеллект Arcee: Arcee Blitz (arcee-ai/arcee-blitz)
Краткое содержание
Arcee Blitz — это плотная модель с 24 миллиардами параметров, дистиллированная от DeepSeek и построенная на архитектуре Mistral для повседневного общения. Пиплайн дистилляции плюс дообучения сокращает вычислительные затраты, сохраняя рассуждения в стиле DeepSeek, благодаря чему Blitz превосходит другие модели среднего размера по показателям MMLU, GSM-8K и BBH. С окном контекста по умолчанию размером 128 К и конкурентоспособной пропускной способностью она служит экономически эффективным инструментом для суммирования, мозгового штурма и легкой помощи в коде. Внутри Arcee использует Blitz в качестве стандартного писателя в конвейерах Conductor, когда не требуются более тяжелые решения линейки Virtuoso. Таким образом, пользователи получают качество близкое к 70 миллиардам параметров примерно при трети задержек и стоимости.
Полный текст статьи пока не загружен.