← Вернуться к списку
Квен: Квэн3 8Б (квэн/квэн3-8б)
Краткое содержание
Qwen3-8B — плотная языковая модель с причиной (causal), содержащая 8,2 миллиарда параметров из серии Qwen3, предназначенная как для задач, требующих глубокого анализа, так и эффективного ведения диалогов. Модель поддерживает плавный переход между режимом «мышления», используемым для математики, программирования и логического вывода, и режимом «бездумной беседы» для общего общения. Она дополнительно настроена для выполнения инструкций, интеграции агентов, творческого письма и многоязычного использования на более чем ста языках и диалектах. В модели изначально поддерживается контекстное окно размером до 32К токенов, которое может расширяться до 131К токенов благодаря масштабированию YaRN.
Полный текст статьи пока не загружен.