← Вернуться к списку
TNG: DeepSeek R1T Chimera (бесплатная версия) (tngtech/deepseek-r1t-chimera)
Краткое содержание
DeepSeek-R1T-Chimera создается путем объединения моделей DeepSeek-R1 и DeepSeek-V3 (версия от 03/24), объединяя способности рассуждения модели R1 с улучшенной эффективностью обработки токенов версии V3. Модель основана на архитектуре трансформера DeepSeek-MoE и оптимизирована для общих задач генерации текста. Модель объединяет предварительно обученные веса обеих исходных моделей для достижения баланса производительности между задачами рассуждений, эффективности и следования инструкциям. Она распространяется под лицензией MIT и предназначена для исследовательского и коммерческого использования.
Полный текст статьи пока не загружен.