Un modello a 7,3 miliardi di parametri che supera Llama 2 a 13 miliardi di parametri in tutti i benchmark, con ottimizzazioni per velocità e lunghezza
Mistral Large 3 2512 è il modello più performante di Mistral fino ad oggi, caratterizzato da un’architettura sparse a miscela di esperti con 41 miliardi di
Il modello più piccolo della famiglia Ministral 3, Ministral 3 3B è un modello linguistico compatto, potente ed efficiente, dotato di funzionalità di visione.