Квен: Квэн 2.5 Кодер 7Б Инструкшн (qwen/qwen2.5-coder-7b-instruct)
Краткое содержание
Qwen2.5-Coder-7B-Instruct — это языковая модель с инструкциями, оптимизированная для задач, связанных с кодом, таких как генерация кода, рассуждения и исправление ошибок. Она содержит 7 миллиардов параметров и основана на архитектуре Qwen2.5, включающей улучшения вроде RoPE, SwiGLU, RMSNorm и внимания GQA, поддерживая до 128К токенов благодаря экстраполяции на основе YaRN. Модель обучена на большом корпусе исходного кода, синтетических данных и привязке текста-кода, обеспечивая надёжную производительность во множестве языков программирования и рабочих процессов агентного кодирования. Эта модель является частью семейства Qwen2.5-Coder и предлагает отличную совместимость с инструментами типа vLLM для эффективного развёртывания. Доступна под лицензией Apache 2.0.
Полный текст статьи пока не загружен.