← Вернуться к списку

Sarvam AI: Sarvam-M (sarvamai/sarvam-m) Сарвам ИИ: Сарвам-М (сарвамай/сарвам-м)

Краткое содержание

Sarvam-M — это производная от модели Mistral-Small-3.1-24B-Base-2503 с настройкой инструкций и объемом параметров 24 миллиарда, прошедшая пост-обучение на английском плюс одиннадцати основных индийских языках (бенгали, хинди, каннада, гуджарати, маратхи, малаялам, ория, панджаби, тамильский, телугу). Модель предлагает двухрежимный интерфейс: режим «без размышлений» для низко-латентной беседы и опциональный этап «размышления», раскрывающий цепочки токенов рассуждений для более сложных аналитических задач, математики и программирования. Результаты бенчмарков демонстрируют устойчивый прирост производительности по сравнению с аналогичными открытыми моделями сопоставимого размера на задаче вопросно-ответа на индийских языках, математике GSM-8K и кодировании SWE-Bench, что делает Sarvam-M практичным универсальным выбором для многоязычных разговорных агентов, а также аналитических нагрузок, включающих английский, родные индийские письменности или тексты латиницей.

Полный текст статьи пока не загружен.