Qwen 3.6 35 UD 2 K_XL превышает свои пределы веса и квантования (Теперь никто не испытывает дефицита GPU)
Краткое содержание
Привет всем, Я вернулся. Я протестировал модель Qwen 3.6 UD 2 K_XL Unsloth на той же задаче "из статьи в веб-приложение". Модель показывает очень хорошие результаты. Она корректно обработала все вызовы инструментов и также справилась с большим контекстом, используя llama.cpp на ноутбуке с видеопамятью 16 ГБ. Я прикрепил все детали: общее количество вызовов инструментов составило 58, при этом процент успеха — 98,3%. Модель также обработала около 2,7 миллиона токенов при создании приложения по данной статье. Вы можете протестировать эту модель, используя те же навыки (skills), которые я создал ранее с моделью Qwen 35B: statisticalplumber/research-webapp-skill submitted by /u/dreamai87 [ссылка] [комментарии].
Полный текст статьи пока не загружен.