З.АИ: ГЛМ 4.5В (z-ai/glm-4.5v)
Краткое содержание
GLM-4.5V — это базовая модель видения и языка для мультимодальных агентских приложений. Построенная на архитектуре смеси экспертов (MoE), она содержит 106 миллиардов параметров, из которых активируются 12 миллиардов, достигая передовых результатов в области понимания видео, вопросов и ответов по изображениям, оптического распознавания символов (OCR) и анализа документов, демонстрируя значительные улучшения в веб-кодировании фронтенда, привязке объектов и пространственном рассуждении. Модель предлагает гибридный режим вывода: «режим размышления» для глубокого рассуждения и «нерефлексивный режим» для быстрых ответов. Возможность рассуждений настраивается через булево значение `reasoning.enabled`. Подробнее читайте в нашей документации.
Полный текст статьи пока не загружен.