nvidia/nemotron-nano-12b-v2-vl

4 Aprile 2026 CopySync Comments Off
NVIDIA Nemotron Nano 2 VL è un modello di ragionamento multimodale aperto con 12 miliardi di parametri, progettato per la comprensione video e l’intelligenza documentale. Introduce un’architettura ibrida Transformer-Mamba, che combina la precisione a livello di Transformer con la modellazione sequenziale efficiente in termini di memoria di Mamba per una velocità di elaborazione significativamente maggiore e una latenza inferiore. Il modello supporta input di testo e documenti multi-immagine, producendo output in linguaggio naturale. È addestrato su dataset sintetici di alta qualità curati da NVIDIA.…