L’industria dell’intelligenza artificiale sta attraversando una delle sue fasi più dinamiche e imprevedibili. In un contesto dominato da modelli sempre più avanzati e da una competizione globale serrata, una nuova e sorprendente protagonista irrompe sulla scena: la cinese DeepSeek, fondata da Liang Wenfeng.
Alla fine di gennaio, DeepSeek ha annunciato il rilascio del suo modello linguistico R1, nella versione da 671 miliardi di parametri. Un colosso dell’IA capace, secondo alcuni benchmark, di superare le performance del celebre ChatGPT. Ma non è solo la potenza del modello a fare notizia: DeepSeek è riuscita a svilupparlo in appena due mesi, con un investimento di soli 5,2 milioni di dollari. Un colpo da maestro, che ha causato un crollo del 23% del titolo Nvidia, colosso americano dei chip.
Il trionfo di DeepSeek ha un significato che va ben oltre i meri dati tecnici. Si inserisce infatti in quella che sempre più analisti definiscono una nuova guerra fredda tecnologica, incentrata sul controllo dell’IA. Da una parte gli Stati Uniti, decisi a mantenere la supremazia attraverso restrizioni sull’export di tecnologie avanzate, in particolare verso la Cina; dall’altra, un Paese capace di aggirare i vincoli e innovare, spingendosi oltre i limiti imposti.
Il cuore del conflitto sono i server IA e le GPU Nvidia, diventate bene strategico. Con i modelli di punta (come A100, A100X e H100) vietati all’export verso la Cina, Nvidia ha commercializzato una versione “limitata” chiamata A800 e poi H800, con connessioni NVLink depotenziate del 33% (da 600 GB/s a 400 GB/s), per ostacolare lo sviluppo cinese.
Tuttavia, il team di DeepSeek ha risposto con creatività e maestria ingegneristica. Attraverso sofisticate tecniche di reverse engineering e un’ottimizzazione a livello di microcodice, sono riusciti a riconfigurare le GPU H800, allocando solo 20 dei 132 multiprocessori per la comunicazione tra server. Una soluzione brillante, che ha ripristinato prestazioni elevate, sfruttando ogni bit disponibile del sistema.
In parallelo, DeepSeek ha integrato algoritmi di pipeline avanzati e ha probabilmente personalizzato ulteriormente le funzioni interne delle GPU tramite il linguaggio PTX (Parallel Thread Execution) di Nvidia. Il risultato? Un training fluido, potente, e competitivo.
L’impresa di DeepSeek è la prova che, nell’arena dell’intelligenza artificiale, l’ingegno umano può ancora prevalere sulla sola potenza di calcolo. E rappresenta un campanello d’allarme per i giganti americani come Google, Amazon, Apple e Meta, i quali – dopo anni di investimenti miliardari – si trovano di fronte a un concorrente agile, efficiente e determinato.
Iscriviti al canale Telegram di Servicematica
Notizie, aggiornamenti ed interruzioni. Tutto in tempo reale.
LEGGI ANCHE

Un rapinatore che nel 2014 aveva tentato di sottrarre un Rolex durante una rapina a mano armata, si è visto respingere la sua richiesta di…

Action Figure generate con l’AI: il gioco che rischia di costarti la privacy
Spopolano sui social le miniature digitali create con l’Intelligenza Artificiale. Ma dietro questo trend virale si nascondono rischi seri per i dati personali e biometrici…

La Corte di giustizia UE respinge i ricorsi sullo stato di diritto
Corte UE contro il ricorso di Ungheria e Polonia sullo Stato di diritto Oggi, la Corte europea di Giustizia respinge il ricorso che i governi della Polonia e Ungheria presentavano. Esso riguardava…