ТНГ: ГлубокийПоиск Р1Т2 Химер (бесплатный) (tngtech/deepseek-r1t2-chimera)
Краткое содержание
DeepSeek-TNG-R1T2-Chimera — это вторая версия модели Chimera от компании TNG Tech. Это смесь экспертов для генерации текста с параметрами 671B, собранная из контрольных точек DeepSeek-AI: R1-0528, R1 и V3-0324 методом объединения экспертов. Трехродительский дизайн обеспечивает высокую производительность рассуждений, работая примерно на 20% быстрее оригинальной версии R1 и более чем вдвое быстрее R1-0528 под управлением vLLM, обеспечивая выгодный баланс между стоимостью и интеллектуальными возможностями. Контрольная точка поддерживает контексты до 60 тысяч токенов при стандартном использовании (тестировалась до ~130 тыс.) и сохраняет стабильное поведение токенов, что делает её подходящей для анализа длинных контекстов, диалоговых взаимодействий и других открытых задач генерации.
Полный текст статьи пока не загружен.