deepseek/deepseek-v3.2-20251201

4 Aprile 2026 CopySync Comments Off
DeepSeek-V3.2 è un modello linguistico di grandi dimensioni progettato per armonizzare un’elevata efficienza computazionale con un forte ragionamento e prestazioni di utilizzo degli strumenti agentivi. Introduce DeepSeek Sparse Attention (DSA), un meccanismo di attenzione sparsa a grana fine che riduce i costi di addestramento e inferenza preservando la qualità in scenari a lungo contesto. Un framework di post-addestramento basato sull’apprendimento per rinforzo scalabile migliora ulteriormente il ragionamento, con prestazioni riportate nella classe GPT-5, e il modello ha dimostrato oro…