← Вернуться к списку
ТХУДМ: ГЛМ З1 9Б (thudm/glm-z1-9b)
Краткое содержание
GLM-Z1-9B-0414 — языковая модель с параметрами объёмом 9 миллиардов, разработанная лабораторией THUDM в рамках семейства моделей GLM-4. В её архитектуре использованы методы, изначально применявшиеся для больших моделей серии GLM-Z1: расширенное обучение с подкреплением, выравнивание парных ранжирований и тренировки на задачах, требующих интенсивной работы с рассуждениями (математика, кодирование, логика). Несмотря на меньший размер, она демонстрирует высокую производительность в общих задачах аналитического характера и превосходит многие модели открытого исходного кода аналогичной весовой категории.
Полный текст статьи пока не загружен.