nvidia/nemotron-3-super-120b-a12b-20230311
NVIDIA Nemotron 3 Super è un modello MoE ibrido aperto a 120 miliardi di parametri, che attiva solo 12 miliardi di parametri per la massima efficienza di calcolo e precisione in complesse applicazioni multi-agente. Basato su un’architettura ibrida Mamba-Transformer Mixture-of-Experts con predizione multi-token (MTP), offre una generazione di token superiore di oltre il 50% rispetto ai principali modelli aperti. Il modello presenta una finestra di contesto di 1 milione di token per la coerenza a lungo termine degli agenti, il ragionamento tra documenti e la pianificazione di attività a più fasi. Latente…
Prev Post nvidia/nemotron-3-nano-30b-a3b
Next Post nvidia/nemotron-nano-12b-v2-vl






