МиниМакс: МиниМакс М1 (minimax/minimax-m1)
Краткое содержание
MiniMax-M1 — это масштабная открытая весовая модель рассуждений, предназначенная для обработки расширенного контекста и высокоэффективной логической дедукции. Она основана на гибридной архитектуре смеси экспертов (MoE) совместно с кастомным механизмом «молниеносного внимания», позволяющим обрабатывать длинные последовательности длиной до одного миллиона токенов, сохраняя высокую эффективность операций FLOPS. Модель содержит всего 456 миллиардов параметров, из которых активно задействовано 45,9 миллиарда на каждый токен, что оптимизирует её для сложных многоступенчатых задач рассуждения. Обучение модели проводилось через специализированный конвейер подкрепляющего обучения CISPO, благодаря чему MiniMax-M1 демонстрирует превосходное понимание длинного контекста, разработку программного обеспечения, использование агентских инструментов и математические рассуждения. Тестирование показало высокие результаты на бенчмарках FullStackBench, SWE-bench, MATH, GPQA и TAU-Bench, часто опережая другие открытые модели вроде DeepSeek R1 и Qwen3-235B.
Полный текст статьи пока не загружен.