← Вернуться к списку

Являются ли параметры LLM синонимами для размерности?

Краткое содержание

Например, обладает ли Большой Языковой Модель (LLM) с размером параметров 140 миллиардов 140 миллиардами измерений, как определено в глубоком обучении, как количество узлов на входном слое? Другой способ задать этот вопрос может быть таким: эквивалентно ли 140 млрд параметров утверждению о наличии 140 млрд узлов/измерений в кодировщике LLM?

Полный текст статьи пока не загружен.