Гугл: Джемма 3н 4Б (бесплатная) (google/gemma-3n-e4b-it)
Краткое содержание
Gemma 3n E4B оптимизирована для эффективной работы на мобильных устройствах и системах с ограниченными ресурсами, таких как смартфоны, ноутбуки и планшеты. Модель поддерживает мультимодальные входные данные — включая текст, визуальную информацию и аудиосигналы — обеспечивая выполнение различных задач: от генерации текста до распознавания речи, перевода и анализа изображений. Благодаря инновациям вроде технологии кеширования встраиваемых слоев PLE (Per-Layer Embedding) и архитектуры MatFormer, Gemma 3n динамически управляет использованием памяти и вычислительной нагрузки путем выборочной активации параметров модели, существенно снижая требования к ресурсам во время выполнения. Модель охватывает широкий спектр языков (обучена более чем на 140 языках), обладает гибким контекстным окном размером 32К токенов и способна избирательно загружать параметры, оптимизируя использование памяти и вычислений в зависимости от конкретной задачи или возможностей устройства. Это делает её идеальной для приватных решений, работающих офлайн, и локальных приложений искусственного интеллекта. Подробности читайте в блоге.
Полный текст статьи пока не загружен.