Мистраль: Девстрал Смолл 2505 (mistralai/devstral-small-2505)
Краткое содержание
Devstral-Small-2505 — это агентная языковая модель большого масштаба (LLM), состоящая из 24 миллиардов параметров, дообученная на основе модели Mistral-Small-3.1 совместными усилиями компаний Mistral AI и All Hands AI специально для выполнения сложных инженерных задач в области разработки программного обеспечения. Модель оптимизирована для исследования кодовых баз, редактирования нескольких файлов одновременно и интеграции в агентов программирования, демонстрируя передовые результаты на бенчмарке SWE-Bench Verified (46,8%). Devstral поддерживает контекстное окно размером 128К и использует кастомный токенизатор Tekken. Это исключительно текстовая модель: визуальный энкодер удалён, что позволяет эффективно развернуть её локально на высокопроизводительном потребительском оборудовании (например, видеокарта RTX 4090 или компьютеры Apple с 32 ГБ оперативной памяти). Оптимальное применение Devstral — в рамках агентных рабочих процессов через каркас OpenHands, она совместима с такими фреймворками вывода, как vLLM, Transformers и Ollama. Модель распространяется под лицензией Apache 2.0.
Полный текст статьи пока не загружен.