nvidia/llama-3.1-nemotron-ultra-253b-v1
Llama-3.1-Nemotron-Ultra-253B-v1 è un modello linguistico di grandi dimensioni (LLM) ottimizzato per il ragionamento avanzato, la chat interattiva con l’uomo, la generazione aumentata dal recupero (RAG) e le attività di chiamata di strumenti. Derivato da Llama-3.1-405B-Instruct di Meta, è stato significativamente personalizzato utilizzando Neural Architecture Search (NAS), con conseguente miglioramento dell’efficienza, riduzione dell’utilizzo della memoria e miglioramento della latenza di inferenza. Il modello supporta una lunghezza del contesto fino a 128.000 token e può operare in modo efficiente su una NVIDIA 8x…
Prev Post nvidia/llama-3.1-nemotron-70b-instruct
Next Post nvidia/llama-3.3-nemotron-super-49b-v1.5






