NVIDIA presenta Nemotron 3 Ultra: il modello open-weight più grande e intelligente d'America

Il 1° giugno 2026, durante la conferenza Computex a Taipei, NVIDIA ha svelato Nemotron 3 Ultra, il suo modello di intelligenza artificiale open-weight più grande e potente mai realizzato. Con 550 miliardi di parametri totali e 55 miliardi di parametri attivi, questo modello rappresenta un significativo passo avanti nella competizione globale per lo sviluppo di modelli di intelligenza artificiale.

Architettura e prestazioni

Nemotron 3 Ultra utilizza un'architettura a "mixture-of-experts", un design che permette di attivare solo i parametri rilevanti per una specifica richiesta, riducendo i costi operativi e migliorando l'efficienza. Questo approccio consente al modello di eseguire inferenze fino a cinque volte più velocemente rispetto ai rivali cinesi e con costi operativi inferiori del 30% rispetto ad alternative open-weight comparabili.

Il modello è stato valutato da Artificial Analysis, un ente indipendente che ha assegnato a Nemotron 3 Ultra un punteggio di 48 sull'Intelligence Index, un benchmark composito che aggrega 10 valutazioni che spaziano dal ragionamento, alla programmazione, alla conoscenza generale e alla performance agentica. Questo punteggio posiziona Nemotron 3 Ultra come il modello open-weight più intelligente prodotto negli Stati Uniti, superando di gran lunga i concorrenti nazionali come Gemma 4 31B di Google e gpt-oss-120b di OpenAI.

La famiglia Nemotron

NVIDIA ha annunciato la famiglia Nemotron nel novembre 2023, con il lancio della terza generazione nel dicembre 2025. La famiglia Nemotron comprende tre modelli di diverse dimensioni: Nano per compiti leggeri, Super per applicazioni aziendali di medio livello e Ultra per workload di ragionamento complesso. Tutti e tre i modelli condividono la stessa architettura ibrida che combina strati Mamba-2, attenzione standard dei Transformer e routing a mixture-of-experts.

Mamba-2 è un'alternativa all'attenzione standard che elabora sequenze lunghe a una frazione del costo, rilevante per modelli capaci di mantenere in memoria un milione di token contemporaneamente. Nemotron 3 Ultra supporta una finestra di contesto di 1 milione di token, permettendo teoricamente a un agente di avere a disposizione un'intera grande base di codice o centinaia di documenti di ricerca contemporaneamente.

Il modello Ultra include anche una tecnica chiamata multi-token prediction (MTP), che consente al modello di prevedere diversi token futuri contemporaneamente invece che uno alla volta, accelerando la generazione. Tutti e tre i modelli Nemotron 3 sono stati post-addestrati utilizzando apprendimento per rinforzo in più ambienti interattivi, insegnando loro a pianificare ed eseguire compiti multi-step invece di limitarsi a rispondere a domande.

Accessibilità e velocità

Nemotron 3 Ultra è disponibile pubblicamente e le sue ricette di addestramento saranno rese pubbliche. Per eseguirlo, è essenziale un supercomputer, ma è possibile accedervi tramite l'API di NVIDIA o fornitori di servizi cloud senza possedere l'hardware necessario, simile all'uso di modelli come GPT o Claude tramite un browser.

La velocità di Nemotron 3 Ultra è uno dei suoi punti di forza. Su un endpoint pre-release DeepInfra, il modello ha servito oltre 300 token di output al secondo. I modelli cinesi nella stessa classe di intelligenza, come DeepSeek V4 Pro e Kimi K2.6, sono serviti a 50–100 token al secondo attraverso le loro API commerciali attuali. Questa differenza di velocità è cruciale per le implementazioni pratiche, specialmente per agenti autonomi che eseguono compiti complessi e multi-step dove l'attesa per ogni passaggio si accumula rapidamente.

La competizione globale

Nonostante le prestazioni impressionanti, Nemotron 3 Ultra non riesce a superare i modelli cinesi in termini di intelligenza. Kimi K2.6 di Moonshot AI, ad esempio, ha un punteggio di 54 sull'Intelligence Index, sei punti più alto di Nemotron 3 Ultra. Questo divario rappresenta una differenza significativa, posizionando Kimi K2.6 al quarto posto tra tutti i modelli di intelligenza artificiale globali, sia open che closed, solo tre punti dietro ai modelli proprietari di punta di Anthropic, Google e OpenAI.

La situazione attuale riflette una tendenza in cui i laboratori cinesi stanno inondando l'ecosistema open con modelli forti, mentre le aziende americane come OpenAI, Anthropic e Google mantengono i loro sistemi migliori dietro API. NVIDIA è il nome americano più grande che sta attivamente cercando di invertire questa tendenza, con un piano quinquennale per spendere 26 miliardi di dollari nello sviluppo di modelli di intelligenza artificiale open-weight.

Il futuro di Nemotron

Nemotron 3 Ultra è il risultato più visibile di questo investimento finora. NVIDIA ha anche annunciato che sta già lavorando su Nemotron 4, la prossima generazione, sviluppata attraverso la Nemotron Coalition, un gruppo di otto laboratori di intelligenza artificiale, tra cui Mistral AI e Perplexity, assemblati da NVIDIA nel marzo 2026 per co-sviluppare modelli open frontier su infrastruttura DGX Cloud. Nemotron 3 Ultra sarà disponibile dal 4 giugno 2026.

L'impatto di Nemotron 3 Ultra sul mercato globale

L'annuncio di Nemotron 3 Ultra rappresenta un momento cruciale per l'industria dell'intelligenza artificiale, con implicazioni che vanno oltre le semplici prestazioni tecniche. La competizione tra Stati Uniti e Cina nel settore dei modelli open-weight è diventata una vera e propria corsa agli armamenti tecnologici, con NVIDIA che cerca di colmare il divario creato dai progressi dei laboratori cinesi.

La sfida cinese e il divario tecnologico

Il punteggio di 54 sull'Intelligence Index di Kimi K2.6, sviluppato da Moonshot AI, evidenzia un divario significativo rispetto a Nemotron 3 Ultra. Questo modello cinese non solo supera il suo omologo americano, ma si posiziona anche al quarto posto nella classifica globale di intelligenza artificiale, dietro solo ai modelli proprietari di punta di Anthropic, Google e OpenAI. La differenza di sei punti nell'Intelligence Index potrebbe sembrare piccola, ma in termini pratici significa che Kimi K2.6 è in grado di gestire compiti più complessi e di risolvere problemi più rapidamente.

La situazione attuale riflette una tendenza preoccupante per gli Stati Uniti: mentre i laboratori cinesi stanno inondando il mercato con modelli open-weight sempre più potenti, le aziende americane come OpenAI, Anthropic e Google continuano a mantenere i loro sistemi migliori dietro API chiuse. Questo approccio ha permesso alle aziende cinesi di guadagnare una quota significativa del mercato, con i modelli open-source cinesi che sono passati da circa l'1,2% del mercato globale alla fine del 2024 a circa il 30% alla fine del 2025.

La risposta di NVIDIA e il futuro di Nemotron

NVIDIA ha riconosciuto la necessità di un cambiamento strategico e ha annunciato un piano quinquennale da 26 miliardi di dollari per lo sviluppo di modelli di intelligenza artificiale open-weight. Nemotron 3 Ultra è il primo passo concreto in questa direzione, ma l'azienda non si ferma qui. La Nemotron Coalition, un gruppo di otto laboratori di intelligenza artificiale tra cui Mistral AI e Perplexity, è stata assemblata per co-sviluppare modelli open frontier su infrastruttura DGX Cloud. Questo approccio collaborativo potrebbe essere la chiave per competere con i progressi dei laboratori cinesi.

Il lancio di Nemotron 4, la prossima generazione di modelli, è già in fase di sviluppo. NVIDIA spera che questa nuova generazione possa colmare il divario tecnologico e riportare gli Stati Uniti in una posizione di leadership nel settore dell'intelligenza artificiale open-weight.

Implicazioni per il mercato e gli utenti

La disponibilità di Nemotron 3 Ultra attraverso l'API di NVIDIA o fornitori di servizi cloud rende questo modello accessibile a un'ampia gamma di utenti, anche senza la necessità di possedere hardware specializzato. Questo potrebbe avere un impatto significativo sul mercato, permettendo a sviluppatori e aziende di integrare modelli di intelligenza artificiale avanzati nelle loro applicazioni senza dover affrontare i costi elevati di un supercomputer.

Tuttavia, la velocità e l'efficienza di Nemotron 3 Ultra non sono sufficienti per superare i modelli cinesi in termini di intelligenza. Questo significa che, mentre NVIDIA continua a migliorare le sue tecnologie, gli utenti che cercano le massime prestazioni potrebbero ancora dover considerare modelli come Kimi K2.6 per applicazioni che richiedono un'alta capacità di ragionamento e problem-solving.

Nemotron 3 Ultra rappresenta un passo importante per NVIDIA e per gli Stati Uniti nella competizione globale per l'intelligenza artificiale open-weight. Tuttavia, il divario tecnologico con i modelli cinesi rimane significativo. La strada verso il futuro dell'IA open-weight sarà lunga e complessa, ma con investimenti strategici e collaborazioni internazionali, NVIDIA potrebbe riuscire a invertire la tendenza e riportare gli Stati Uniti in una posizione di leadership nel settore.

Domande frequenti

  • Qual è la differenza principale tra Nemotron 3 Ultra e i modelli cinesi? La differenza principale risiede nell'Intelligence Index, dove Kimi K2.6 di Moonshot AI supera Nemotron 3 Ultra di sei punti, posizionandosi al quarto posto nella classifica globale.
  • Come posso accedere a Nemotron 3 Ultra? Nemotron 3 Ultra è disponibile attraverso l'API di NVIDIA o fornitori di servizi cloud, permettendo agli utenti di accedervi senza possedere hardware specializzato.
  • Quali sono i piani futuri di NVIDIA per l'IA open-weight? NVIDIA ha annunciato un piano quinquennale da 26 miliardi di dollari per lo sviluppo di modelli di intelligenza artificiale open-weight e sta già lavorando su Nemotron 4, la prossima generazione di modelli.

Nota Editoriale e Disclaimer

Le guide e i contenuti pubblicati su GoYou sono frutto di attività di ricerca e analisi indipendente, a scopo informativo, educativo e di approfondimento.

GoYou non costituisce una testata giornalistica né un prodotto editoriale ai sensi della Legge n. 62/2001 e non svolge attività di informazione in tempo reale.

Il progetto GoYou non fornisce consulenza professionale, tecnica, legale o finanziaria e declina ogni responsabilità per l’uso improprio delle informazioni pubblicate.

Nel settore Crypto, ogni investimento comporta rischi: si invita il lettore a informarsi sempre in modo autonomo prima di assumere qualsiasi decisione.