← Вернуться к списку
Квен: Квэн 2.5 32Б Инструкшн (qwen/qwen2.5-32b-instruct)
Краткое содержание
Qwen2.5 32B Instruct — это вариант модели серии больших языковых моделей Qwen последнего поколения, настроенный на выполнение инструкций. Модель обладает улучшенными возможностями выполнения команд, повышенной эффективностью в кодировании и математическом рассуждении, а также устойчиво обрабатывает структурированные данные и выходные форматы, такие как JSON. Она поддерживает обработку длинных контекстов до 128К токенов и многоязычные задачи на 29+ языках. В модели используется 32,5 миллиарда параметров, 64 слоя и передовая трансформерная архитектура с применением RoPE, SwiGLU, RMSNorm и смещений внимания QKV. Для получения дополнительной информации обратитесь к блогу Qwen2.5.
Полный текст статьи пока не загружен.