← Вернуться к списку

Agentica: Предварительный обзор Deepcoder 14B (бесплатно) (agentica-org/deepcoder-14b-preview)

Краткое содержание

DeepCoder-14B-Preview — это модель генерации кода с 14 миллиардами параметров, дообученная на основе модели DeepSeek-R1-Distill-Qwen-14B методом усиленного обучения с использованием алгоритма GRPO+ и итерационного увеличения длины контекста. Она оптимизирована для синтеза программ с длинным контекстом и демонстрирует высокие результаты на тестовых наборах кодирования, включая показатель 60,6 % на LiveCodeBench версии 5, конкурируя с моделями вроде o3-Mini.

Полный текст статьи пока не загружен.