DeepSeek: DeepSeek V3.1 Терминал (deepseek/deepseek-v3.1-terminus)
Краткое содержание
DeepSeek-V3.1 Terminus — это обновление модели DeepSeek V3.1, сохраняющее исходную функциональность и устраняющее проблемы, отмеченные пользователями, такие как согласованность языка и возможности агентов, дополнительно оптимизируя производительность модели в кодировании и поисковых операциях. Это крупная гибридная модель рассуждений (671 млрд параметров, 37 млрд активных), поддерживающая режимы как с мышлением, так и без него. Она расширяет базу DeepSeek-V3 двухфазовым процессом длительного контекстного обучения до 128К токенов и применяет микрошкалирование FP8 для эффективного вывода. Пользователи могут управлять поведением рассуждения через булево значение параметра `reasoning enabled`. Подробности см. в нашей документации. Модель улучшает использование инструментов, генерацию кода и эффективность рассуждений, достигая производительности сопоставимой с DeepSeek-R1 на сложных бенчмарках, отвечая быстрее. Поддерживает структурированные вызовы инструментов, агентов-кодовиков и поисковых агентов, что делает её подходящей для исследований, программирования и агентских рабочих процессов.
Полный текст статьи пока не загружен.