← Вернуться к списку

Байду: ERNIE 4.5 300B A47B (baidu/ernie-4.5-300b-a47b)

Краткое содержание

ERNIE-4.5-300B-A47B — языковая модель типа смесь-экспертов (MoE), разработанная компанией Baidu в рамках серии ERNIE 4.5 и содержащая 300 миллиардов параметров. Модель активирует 47 миллиардов параметров на токен и поддерживает генерацию текста на английском и китайском языках. Оптимизированная для высокопроизводительного вывода и эффективного масштабирования, она использует гетерогенную структуру MoE с продвинутыми стратегиями маршрутизации и квантования, включая форматы FP8 и 2 бита. Эта версия настроена специально для задач обработки естественного языка и поддерживает рассуждения, параметры инструментов и расширенные длины контекста до 131 тысячи токенов. Подходит для универсальных приложений больших языковых моделей с высокими требованиями к производительности и пропускной способности.

Полный текст статьи пока не загружен.