← Вернуться к списку

Нано-нейроморфный процессор NVIDIA Nemotron V2 VL

Краткое содержание

arXiv:2511.03929v2 Тип объявления: замена-перекрёстная публикация Аннотация: Мы представляем Nemotron Nano V2 VL — новейшую модель серии Nemotron Vision-Language, предназначенную для эффективного понимания реальных документов, анализа длинных видеоматериалов и выполнения рассуждений. Модель Nemotron Nano V2 VL демонстрирует значительные улучшения по сравнению с предыдущей моделью Llama-3.1-Nemotron-Nano-VL-8B во всех областях зрения и текста благодаря существенным усовершенствованиям архитектуры модели, набору данных и методикам обучения. Nemotron Nano V2 VL основана на гибридной архитектуре Mamba-Transformer (LLM), использующей инновационные методы сокращения токенов, что позволяет добиться высокой производительности вывода при обработке больших объёмов документов и видео. Мы публикуем контрольные точки модели в форматах BF16, FP8 и FP4, а также предоставляем значительную часть наших наборов данных, рецептов и исходного кода обучения.

Полный текст статьи пока не загружен.