Сравнение Qwen3.5 27B против Gemma 4 31B для задач, связанных с агентами.
Краткое содержание
Сравниваемые модели:Qwen3.5-27B-UD-Q5_K_XLgemma-4-31B-it-UD-Q5_K_XLОсновные параметры для обеих--flash-attn on \--n-gpu-layers 99 \--no-mmap \-c 150000 \--temp 1 --top-p 0.9 --min-p 0.1 --top-k 20 \--ctx-checkpoints 1 \--jinja \-np 1 \--reasoning on \--mmproj 'mmproj-BF16.gguf' \--image-min-tokens 300 --image-max-tokens 512Я знаю, что они могут быть не лучшими, и мне все еще нужны дополнительные эксперименты (спасибоu/Sadman782) Я нахожу эти тесты веселыми и интересными.Наблюдения по моделямQwen3.5-27B-UD-Q5_K_XLБольше шагов, проверка переменных окружения, исправление ошибок для полного удовлетворения запроса, поэтому конечный результат хороший (в примере телеграм-сообщение идеально), иногда создает скрипт Python вместо Bash толькоgemma-4-31B-it-UD-Q5_K_XLБолее прямолинейный (умнее находит URL) но может пропустить конечную цель (в этом примере телеграм-сообщение было обрезаноПожалуйста, сообщите мне, если вам нужны дополнительные тесты.https://preview.redd.it/281gn3pddzug1.png?width=1827&format=png&auto=webp&s=7ced859b3cac05ea8fddd0c2ce7a3ea54c9f046bhttps://preview
Полный текст статьи пока не загружен.