Deep Cogito: Предварительный просмотр Cogito V2 от Deepseek 671B (deepcogito/cogito-v2-preview-deepseek-671b)
Краткое содержание
Cogito v2 — это многоязычная, настроенная на выполнение инструкций модель типа смесь экспертов (MoE), содержащая 671 миллиард параметров. Модель поддерживает как стандартный режим генерации текста, так и основанный на рассуждениях. Введён гибридный подход к рассуждению через метод итерационной дистилляции и усиления (Iterated Distillation and Amplification, IDA) — стратегию итеративного самоулучшения, предназначенную для масштабирования согласованности с общим интеллектом. Cogito v2 оптимизирована для работы в областях естественных наук, технологий, инженерии и математики (STEM), программирования, выполнения инструкций и использования инструментов. Поддерживается контекст длиной до 128K токенов, обеспечивая высокую производительность как в многоязычных, так и в кодоёмких средах. Пользователи могут управлять поведением модели относительно рассуждений с помощью булевого параметра `reasoning enabled`. Узнать больше вы можете в нашей документации.
Полный текст статьи пока не загружен.