← Вернуться к списку

Квен: Квэн3 235Б А22Б Инструктаж 2507 (qwen/qwen3-235b-a22b-2507)

Краткое содержание

Qwen3-235B-A22B-Instruct-2507 — мультиязыковая языковая модель типа смесь-экспертов, настроенная на выполнение инструкций и основанная на архитектуре Qwen3-235B, с 22 миллиардами активных параметров на один проход прямого распространения. Модель оптимизирована для универсальной генерации текста, включая следование инструкциям, логическое рассуждение, математику, кодирование и использование инструментов. Поддерживается нативная длина контекста до 262 тысяч токенов, режим «мышления» («blocks») не реализован. По сравнению с базовой версией данная модификация демонстрирует значительное улучшение охвата знаний, способности рассуждать в длинных контекстах, результатов тестирования программирования и соответствия открытым заданиям. Особенно сильна она в мультиязычном понимании, математическом анализе (например, AIME, HMMT) и оценках согласованности вроде Arena-Hard и WritingBench.

Полный текст статьи пока не загружен.