← Вернуться к списку

NVIDIA: Ллама 3.3 Немотрон Супер 49B версия 1 (nvidia/llama-3.3-nemotron-super-49b-v1)

Краткое содержание

Nemotron Super v1 — это крупная языковая модель (LLM) объемом 49 млрд параметров, оптимизированная для продвинутого рассуждения, диалоговых взаимодействий, генерации с использованием поиска по внешним источникам (RAG) и выполнения внешних запросов. Модель создана на основе архитектуры Meta Llama-3.3-70B-Instruct и применяет подход поиска оптимальной нейронной структуры (Neural Architecture Search, NAS), значительно повышая эффективность вычислений и снижая требования к памяти. Это позволяет модели поддерживать контекст длиной до 128К токенов и эффективно размещаться даже на одиночных высокопроизводительных GPU, таких как NVIDIA H200. Примечание: для включения режима рассуждений обязательно укажите фразу «подробное размышление над». Дополнительную информацию см. в разделе «Рекомендации по использованию».

Полный текст статьи пока не загружен.