← Вернуться к списку
Тенсент: Хунянь А13Б Инструкшен (tencent/hunyuan-a13b-instruct)
Краткое содержание
Hunyuan-A13B — это языковая модель типа смесь-экспертов (Mixture-of-Experts, MoE), разработанная компанией Tencent, содержащая 13 миллиардов активных параметров и имеющая общий объём параметров 80 миллиардов. Модель поддерживает рассуждения через цепочку мыслей (Chain-of-Thought) и демонстрирует конкурентоспособную производительность на эталонных тестах по математике, естественным наукам, кодированию и многотуровым задачам рассуждений, одновременно обеспечивая высокую эффективность вывода благодаря групповому вниманию запросов (Grouped Query Attention, GQA) и поддержке квантования (FP8, GPTQ и др.).
Полный текст статьи пока не загружен.