NVIDIA: Ллама 3.1 Немотрон Нано 8B v1 (nvidia/llama-3.1-nemotron-nano-8b-v1)

2025-04-08 14:51:13

Краткое содержание

Llama-3.1-Nemotron-Nano-8B-v1 — компактная большая языковая модель (LLM), созданная на основе модели Meta Llama-3.1-8B-Instruct и оптимизированная специально для выполнения рассуждений, ведения диалоговых взаимодействий, генерации с использованием извлечения информации (RAG) и приложений вызова инструментов. Модель сочетает точность и эффективность, легко размещаясь на одной потребительской видеокарте уровня RTX для локального развёртывания. Поддерживает расширенные длины контекста до 128К токенов. Примечание: чтобы включить режим рассуждения, обязательно укажите фразу `detailed thinking on` в подсказке системы. Для получения дополнительной информации см. раздел «Рекомендации по использованию».

Полный текст статьи пока не загружен.

Читать оригинал статьи