← Вернуться к списку
Qwen: Qwen 2.5 VL 32B Инструкшн (бесплатный) (qwen/qwen2.5-vl-32b-instruct)
Краткое содержание
Qwen2.5-VL-32B — мультимодальная визуально-лингвистическая модель, дообученная методом подкрепляющего обучения для улучшения возможностей математического рассуждения, структурированных выходов и решения визуальных задач. Модель демонстрирует превосходство в задачах анализа изображений: распознавании объектов, интерпретации текста внутри изображений и точной локализации событий в продолжительных видеофайлах. Qwen2.5-VL-32B показывает передовые результаты на мультимодальных бенчмарках вроде MMMU, MathVista и VideoMME, одновременно поддерживая высокий уровень ясности и точности в текстовых задачах типа MMLU, решении математических задач и генерации программного кода.
Полный текст статьи пока не загружен.