← Вернуться к списку

Оптимизация параметров сэмплирования Qwen 3.6 35B A3B.

Краткое содержание

Я пытаюсь оптимизировать параметры сэмплирования Qwen 3.6 35B A3B, но мне трудно подобрать подходящий эталонный набор данных для этого. Почему я считаю, что рекомендованные настройки могут быть не оптимальными? Одна причина в том, что они рекомендуют одинаковые настройки как для Qwen 3.5, так и для 3.6, хотя при обновлении до 3.6 со всем остальным идентичными параметрами (включая ту же квантизацию) модель 3.6 застревала в циклах вызовов инструментов в некоторых запрограммированных ежедневных задачах, чего не было с 3.5, и решением стало повышение температуры. Другая причина заключается в том, что их числа — это круглые и типичные значения, что, вероятно, означает отсутствие обширной донастройки. Я также очень подозреваю, что рекомендация min_p=0.0 на самом деле оптимальна. Небольшое значение min_p, вероятно, позволит другим сэмплерам быть менее ограничительными в отношении правдоподобных токенов, но более — в отношении менее правдоподобных, чем текущие конфигурации. Я пробовал GSM8K и подмножество metabench из GSM8K, IFEval и GPQA diamond. GSM8K и IFEval слишком насыщены. Подмножество metabench

Полный текст статьи пока не загружен.