DeepSeek sfida l’Occidente: la Cina accelera sull’intelligenza artificiale nonostante le restrizioni USA

Con un investimento contenuto e ingegno ingegneristico, la startup cinese ha lanciato un modello linguistico da 671 miliardi di parametri che insidia ChatGPT. Mentre gli USA cercano di frenare Pechino, la “guerra fredda dei petaflop” entra in una nuova fase.

L’industria dell’intelligenza artificiale sta attraversando una delle sue fasi più dinamiche e imprevedibili. In un contesto dominato da modelli sempre più avanzati e da una competizione globale serrata, una nuova e sorprendente protagonista irrompe sulla scena: la cinese DeepSeek, fondata da Liang Wenfeng.

Alla fine di gennaio, DeepSeek ha annunciato il rilascio del suo modello linguistico R1, nella versione da 671 miliardi di parametri. Un colosso dell’IA capace, secondo alcuni benchmark, di superare le performance del celebre ChatGPT. Ma non è solo la potenza del modello a fare notizia: DeepSeek è riuscita a svilupparlo in appena due mesi, con un investimento di soli 5,2 milioni di dollari. Un colpo da maestro, che ha causato un crollo del 23% del titolo Nvidia, colosso americano dei chip.

Il trionfo di DeepSeek ha un significato che va ben oltre i meri dati tecnici. Si inserisce infatti in quella che sempre più analisti definiscono una nuova guerra fredda tecnologica, incentrata sul controllo dell’IA. Da una parte gli Stati Uniti, decisi a mantenere la supremazia attraverso restrizioni sull’export di tecnologie avanzate, in particolare verso la Cina; dall’altra, un Paese capace di aggirare i vincoli e innovare, spingendosi oltre i limiti imposti.

Il cuore del conflitto sono i server IA e le GPU Nvidia, diventate bene strategico. Con i modelli di punta (come A100, A100X e H100) vietati all’export verso la Cina, Nvidia ha commercializzato una versione “limitata” chiamata A800 e poi H800, con connessioni NVLink depotenziate del 33% (da 600 GB/s a 400 GB/s), per ostacolare lo sviluppo cinese.

Tuttavia, il team di DeepSeek ha risposto con creatività e maestria ingegneristica. Attraverso sofisticate tecniche di reverse engineering e un’ottimizzazione a livello di microcodice, sono riusciti a riconfigurare le GPU H800, allocando solo 20 dei 132 multiprocessori per la comunicazione tra server. Una soluzione brillante, che ha ripristinato prestazioni elevate, sfruttando ogni bit disponibile del sistema.

In parallelo, DeepSeek ha integrato algoritmi di pipeline avanzati e ha probabilmente personalizzato ulteriormente le funzioni interne delle GPU tramite il linguaggio PTX (Parallel Thread Execution) di Nvidia. Il risultato? Un training fluido, potente, e competitivo.

L’impresa di DeepSeek è la prova che, nell’arena dell’intelligenza artificiale, l’ingegno umano può ancora prevalere sulla sola potenza di calcolo. E rappresenta un campanello d’allarme per i giganti americani come Google, Amazon, Apple e Meta, i quali – dopo anni di investimenti miliardari – si trovano di fronte a un concorrente agile, efficiente e determinato.

Iscriviti al canale Telegram di Servicematica

Notizie, aggiornamenti ed interruzioni. Tutto in tempo reale.

LEGGI ANCHE

Gennaio 2020: Windows 7 va in pensione. Ecco cosa fare.

Il 14 gennaio 2020 Microsoft concluderà il periodo di supporto a Windows 7 durato 10 anni. Nei primi 5 anni l’azienda ha garantito l’assistenza tecnica…

Comprare casa all’asta: un risparmio medio fino alla metà del prezzo di mercato

Acquistare un immobile tramite asta giudiziaria si conferma un'opportunità economica significativa quest'anno, permettendo di ottenere risparmi consistenti rispetto ai valori di mercato. Ma quali sono…

software trascrizioni automatiche sistema giudiziario

Attiva la banca dati delle sentenze tributarie

E’ attiva, in via sperimentale, la Banca Dati della Giurisprudenza Tributaria di merito gestita dal MEF-Dipartimento della Giustizia Tributaria, per la consultazione delle sentenze native…