← Вернуться к списку

Квен: Квэн3 ВЛ 30Б А3Б Размышление (qwen/qwen3-vl-30b-a3b-thinking)

Краткое содержание

Qwen3-VL-30B-A3B-Thinking — мультимодальная модель, объединяющая мощную генерацию текста с визуальным пониманием изображений и видеоматериалов. Вариант модели Thinking улучшает способности к рассуждению в области естественных наук (STEM), математики и сложных задач. Она демонстрирует превосходство в восприятии реальных/синтетических категорий объектов, пространственной привязке двумерных и трехмерных сцен, а также в глубоком понимании длинных форматов визуальной информации, достигая конкурентоспособных результатов на мультимодальных бенчмарках. Для агентских применений она поддерживает обработку многошаговых инструкций с несколькими изображениями, синхронизацию временных меток видео, автоматизацию графического интерфейса и создание отлаженного визуального кода интерфейсов на основе эскизов. Текстовые возможности соответствуют флагманским моделям серии Qwen3, подходящим для документной аналитики, оптического распознавания символов (OCR), помощи в разработке интерфейсов, пространственных задач и исследований агентов.

Полный текст статьи пока не загружен.