Квен: Квэн-Макс (qwen/qwen-max)

2025-02-01 09:31:29

Краткое содержание

Qwen-Max, основанный на Qwen2.5, обеспечивает наилучшую производительность вывода среди моделей Qwen, особенно для сложных многошаговых задач. Это масштабная модель типа MoE (Mixture of Experts), предварительно обученная на более чем 20 триллионах токенов и дополнительно дообученная методами контролируемого тонкого тюнинга (Supervised Fine-Tuning — SFT) и подкреплённого обучения с обратной связью от человека (Reinforcement Learning from Human Feedback — RLHF). Количество параметров неизвестно.

Полный текст статьи пока не загружен.

Читать оригинал статьи