Мистраль: Девстрал Смолл 1.1 (mistralai/devstral-small)
Краткое содержание
Devstral Small 1.1 — это открытая языковая модель весом 24 миллиарда параметров, предназначенная для агентов программного инжиниринга, разработанная компанией Mistral AI совместно с All Hands AI. Модель создана путем дообучения от версии Mistral Small 3.1 и выпущена под лицензией Apache 2.0. Она обладает окном контекста размером 128K токенов и поддерживает форматы вызова функций в стиле Mistral и вывода результатов в формате XML. Модель Devstral Small 1.1 разработана специально для рабочих процессов агентного кодирования и оптимизирована для выполнения задач, таких как исследование исходного кода, редактирование нескольких файлов одновременно, интеграция в автономные системы разработки вроде OpenHands и Cline. По результатам теста SWE-Bench Verified она достигает показателя 53,6%, превосходя другие открытые модели по этому бенчмарку, оставаясь при этом достаточно компактной для запуска на одном графическом процессоре NVIDIA 4090 или устройстве на базе чипа Apple Silicon. В качестве токенайзера используется Tekken-токенайзер с лексиконом объемом 131 тысяча элементов, а развертывание возможно через такие среды исполнения, совместимые с OpenAI API, как vLLM, Transformers, Ollama, LM Studio и другие аналогичные платформы.
Полный текст статьи пока не загружен.