MoonshotAI: Kimi K2 0711 (бесплатная версия) (moonshotai/kimi-k2)
Краткое содержание
Kimi K2 Instruct — это масштабная языковая модель типа смесь-экспертов (MoE), разработанная компанией Moonshot AI, обладающая общим числом параметров в 1 триллион, из которых активно используется 32 миллиарда на каждом прямом проходе. Модель оптимизирована для агентских возможностей, включая продвинутые инструменты работы, рассуждения и синтез кода. Kimi K2 демонстрирует выдающиеся результаты во множестве бенчмарков, особенно в задачах кодирования (LiveCodeBench, SWE-bench), рассуждений (ZebraLogic, GPQA) и инструментального взаимодействия (Tau2, AceBench). Она поддерживает обработку длинных контекстов до 128К токенов и разработана с использованием инновационного тренировочного стека, включающего оптимизатор MuonClip для стабильной крупномасштабной тренировки моделей типа MoE.
Полный текст статьи пока не загружен.