Гугл: Джемма 3н 2Б (бесплатная версия) (google/gemma-3n-e2b-it)
Краткое содержание
Gemma 3n E2B IT — мультимодальная, настроенная на выполнение инструкций модель, разработанная компанией Google DeepMind. Она предназначена для эффективной работы с размером параметра 2 миллиарда (2B), используя архитектуру на 6 миллиардов (6B). Основанная на архитектуре MatFormer, она поддерживает вложенные субмодели и модульную композицию через фреймворк Mix-and-Match. Модели серии Gemma 3n оптимизированы для развертывания с ограниченными ресурсами: обеспечивают контекст длиной до 32К токенов и демонстрируют высокую производительность в мультиязычных сценариях и задачах рассуждения согласно общепринятым бенчмаркам. Данная версия модели обучена на разнообразном корпусе данных, включающем код, математику, веб-контент и мультимодальные данные.
Полный текст статьи пока не загружен.