I token IA sono il nuovo petrolio, così l'ascesa dell'intelligenza artificiale stravolge la geopolitica del settore tech - Affaritaliani.it

Economia

I token IA sono il nuovo petrolio, così l'ascesa dell'intelligenza artificiale stravolge la geopolitica del settore tech

Il commento di Richard Clode, Portfolio manager di Janus Henderson

di Richard Clode

I token sono il nuovo petrolio (per davvero)

Visti i recenti accordi sui chip IA annunciati dal presidente Trump e Jensen Huang in Arabia Saudita e negli Emirati Arabi Uniti si può dire che i token AI (le unità di dati elaborate dai modelli di IA durante l'addestramento e l'inferenza) sono il nuovo petrolio. Microsoft ha dichiarato di aver generato 100 trilioni di token nel primo trimestre del 2025, con un aumento di 5 volte rispetto all'anno precedente, e di averne elaborati 50 trilioni nel mese di marzo. Google, dal canto suo, durante l'evento I/O della scorsa settimana ha affermato che attualmente elabora oltre 480 trilioni di token al mese, con un aumento di 50 volte rispetto all'anno precedente.

NVIDIA ha affermato che la generazione di token è aumentata di dieci volte nell'ultimo anno. Si tratta di un punto di svolta molto importante per una serie di motivi. Il mercato ha discusso a lungo sui casi d'uso dell'IA, considerando la generazione di token un parametro chiave sia per l'utilizzo che per il livello di intelligenza artificiale. Questo aumento evidenzia anche le idee errate emerse durante il “momento DeepSeek” all'inizio di quest'anno, quando il mercato si è concentrato eccessivamente sui minori investimenti in AI necessari per addestrare il modello, trascurando la maggiore intensità di calcolo del modello di ragionamento DeepSeek.

Secondo NVIDIA, i reasoning models possono essere da 100 a 1000 volte più intensi in termini di calcolo rispetto a una singola query di chatbot, dato che il modello “pensa”, esplora più percorsi per risolvere una query più complessa e verifica la sua risposta. Ciò genera anche un numero esponenzialmente maggiore di token, consentendo al contempo nuovi casi d'uso derivanti da un maggiore livello di intelligenza, che si tratti di IA per consumatori o imprese, o di veicoli autonomi e umanoidi fisici alimentati dall'IA. L'innovazione sta moltiplicando i casi d'uso dell'Intelligenza artificiale, fornendo un ritorno sull'investimento credibile e una spesa più sostenibile per le infrastrutture di IA grazie a tale ritorno. Ciò sta sostenendo l'espansione dell'uso dell'IA attraverso l'inferenza, piuttosto che limitarsi ad aumentare la potenza di calcolo per addestrare modelli di IA sempre più avanzati.

Il ruolo del lancio di Blackwell

Allo stesso modo in cui il chip Hopper è stato progettato specificamente per addestrare modelli di trasformazione linguistica di grandi dimensioni, NVIDIA ha progettato il chip Blackwell appositamente per soddisfare le esigenze prestazionali dei modelli di ragionamento di prossima generazione. Interagire con un modello di ragionamento e garantire una qualità del servizio ragionevole, oltre ad evitare costi proibitivi o consumi energetici elevati, ha richiesto a NVIDIA di progettare per la prima volta a livello di rack: l'NVL72 pesa due tonnellate e contiene 1,2 milioni di componenti.

Il risultato è una performance di inferenza 40 volte superiore a quella di Hopper, che porta l'infrastruttura AI di prossima generazione nel mondo del ragionamento AI, rispondendo a molte domande sollevate lo scorso anno sui vantaggi relativi degli ASIC rispetto alle GPU. Il lancio di Blackwell non è stato affatto facile, con una riprogettazione del chip sottostante presso TSMC alla fine dello scorso anno, oltre ai recenti problemi relativi alla scheda e alla resa dei rack GB200. Tuttavia, questi problemi sembrano finalmente superati, consentendo al mercato di guardare con ottimismo a un potenziale aumento significativo della fornitura di rack nel resto dell'anno. NVIDIA ha parlato di hyperscaler che ora implementano in media quasi 1.000 rack NVL 72 a settimana, ovvero 72.000 GPU Blackwell a settimana. I rack Blackwell Ultra GB300 sono ora in fase di campionamento e, con lo stesso ingombro fisico e lo stesso design dei rack GB200, potrebbero garantire un aumento molto più graduale dell'offerta a partire dalla seconda metà del 2025, in modo da soddisfare la crescente domanda di inferenza con prestazioni superiori di circa il 50%.

Implicazioni geopolitiche e deglobalizzazione

L'intelligenza artificiale è in prima linea nella geopolitica e nella lotta per la supremazia tra superpotenze. Dopo il divieto H20, sembra che ci stiamo avvicinando alla fine dell'attività di NVIDIA nel settore dei data center in Cina, ma Jensen Huang ha continuato a sostenere con veemenza che queste restrizioni sono sbagliate. Questo perché non impediranno alla Cina di avere l'intelligenza artificiale o i chip per l'intelligenza artificiale, dato che già dispone di entrambi. Una strategia migliore sarebbe quella di garantire che uno dei più grandi mercati mondiali dell'IA, con metà degli sviluppatori mondiali d, sia costruito su piattaforme e infrastrutture statunitensi.

NVIDIA continua a esplorare opzioni per fornire alla Cina un chip con prestazioni IA ulteriormente ridotte, ma resta da vedere se ciò sarà consentito e se tali chip potranno essere competitivi. Su una nota più positiva, la revoca della AI Diffusion Rule dell'amministrazione Biden, che avrebbe dovuto entrare in vigore il 15 maggio, ha consentito i recenti accordi in Arabia Saudita e negli Emirati Arabi Uniti. NVIDIA ha anche chiarito che, sebbene Singapore contribuisca in modo significativo alle sue vendite, la stragrande maggioranza di tale potenza di calcolo AI finisce a clienti con sede negli Stati Uniti, smentendo le recenti notizie di dirottamento dei chip per aggirare le restrizioni all'esportazione.

Infine, NVIDIA ha confermato che entro un anno produrrà chip per l'intelligenza artificiale negli stabilimenti TSMC in Arizona e assemblerà supercomputer per l'intelligenza artificiale in fabbriche in Texas. Il sostegno di NVIDIA all'obiettivo del presidente Trump di sviluppare la capacità produttiva negli Stati Uniti prosegue la deglobalizzazione delle catene di approvvigionamento a cui abbiamo assistito dopo la pandemia, alla luce della situazione geopolitica, delle guerre commerciali e dei cambiamenti demografici.

L’importanza del quadro d’insieme

Sebbene i mercati guardino solitamente ai risultati finanziari di NVIDIA come indicatori del settore tecnologico e segnali geopolitici, dato il suo ruolo dominante nell'ondata dell'intelligenza artificiale, riteniamo che concentrarsi sul breve termine rischi di non vedere il quadro generale. Mentre l'intelligenza artificiale continua a innovarsi con modelli di ragionamento, l'intelligenza artificiale agentica e fisica sta creando casi d'uso e modelli di remunerazione interessanti.

Ciò sta determinando una svolta nella domanda di infrastrutture di IA, dai cluster di formazione all'inferenza, per supportare uno snodo nella generazione di token con la proliferazione dei modelli di ragionamento e del loro utilizzo, creando così una pista di decollo più lunga, più ampia e più sostenibile per la crescita del settore tecnologico e dell'economia globale.

LEGGI LE NOTIZIE DI ECONOMIA