Квен: Квэн3 32Б (qwen/qwen3-32b)
Краткое содержание
Qwen3-32B — плотная языковая модель с причинной структурой, содержащая 32,8 миллиарда параметров, относящаяся к серии Qwen3 и оптимизированная как для сложных рассуждений, так и эффективного ведения диалога. Модель поддерживает плавный переход между режимом «размышления», предназначенным для выполнения задач вроде математики, программирования и логического вывода, и режимом «без размышлений», обеспечивающим быструю общую беседу общего назначения. Данная модель демонстрирует высокую производительность в выполнении инструкций, применении инструментов агентов, творческом письме и многоязычных задачах на более чем ста языках и диалектах. Она изначально обрабатывает контексты длиной до 32К токенов и способна расширяться до обработки контекстов размером 131К токенов благодаря масштабированию на основе технологии YaRN.
Полный текст статьи пока не загружен.