← Вернуться к списку

Тенсент: Хунянь А13Б Инструкшен (tencent/hunyuan-a13b-instruct)

Краткое содержание

Hunyuan-A13B — это языковая модель типа смесь-экспертов (Mixture-of-Experts, MoE), разработанная компанией Tencent, содержащая 13 миллиардов активных параметров и имеющая общий объём параметров 80 миллиардов. Модель поддерживает рассуждения через цепочку мыслей (Chain-of-Thought) и демонстрирует конкурентоспособную производительность на эталонных тестах по математике, естественным наукам, кодированию и многотуровым задачам рассуждений, одновременно обеспечивая высокую эффективность вывода благодаря групповому вниманию запросов (Grouped Query Attention, GQA) и поддержке квантования (FP8, GPTQ и др.).

Полный текст статьи пока не загружен.