L’industria dell’intelligenza artificiale sta attraversando una delle sue fasi più dinamiche e imprevedibili. In un contesto dominato da modelli sempre più avanzati e da una competizione globale serrata, una nuova e sorprendente protagonista irrompe sulla scena: la cinese DeepSeek, fondata da Liang Wenfeng.
Alla fine di gennaio, DeepSeek ha annunciato il rilascio del suo modello linguistico R1, nella versione da 671 miliardi di parametri. Un colosso dell’IA capace, secondo alcuni benchmark, di superare le performance del celebre ChatGPT. Ma non è solo la potenza del modello a fare notizia: DeepSeek è riuscita a svilupparlo in appena due mesi, con un investimento di soli 5,2 milioni di dollari. Un colpo da maestro, che ha causato un crollo del 23% del titolo Nvidia, colosso americano dei chip.
Il trionfo di DeepSeek ha un significato che va ben oltre i meri dati tecnici. Si inserisce infatti in quella che sempre più analisti definiscono una nuova guerra fredda tecnologica, incentrata sul controllo dell’IA. Da una parte gli Stati Uniti, decisi a mantenere la supremazia attraverso restrizioni sull’export di tecnologie avanzate, in particolare verso la Cina; dall’altra, un Paese capace di aggirare i vincoli e innovare, spingendosi oltre i limiti imposti.
Il cuore del conflitto sono i server IA e le GPU Nvidia, diventate bene strategico. Con i modelli di punta (come A100, A100X e H100) vietati all’export verso la Cina, Nvidia ha commercializzato una versione “limitata” chiamata A800 e poi H800, con connessioni NVLink depotenziate del 33% (da 600 GB/s a 400 GB/s), per ostacolare lo sviluppo cinese.
Tuttavia, il team di DeepSeek ha risposto con creatività e maestria ingegneristica. Attraverso sofisticate tecniche di reverse engineering e un’ottimizzazione a livello di microcodice, sono riusciti a riconfigurare le GPU H800, allocando solo 20 dei 132 multiprocessori per la comunicazione tra server. Una soluzione brillante, che ha ripristinato prestazioni elevate, sfruttando ogni bit disponibile del sistema.
In parallelo, DeepSeek ha integrato algoritmi di pipeline avanzati e ha probabilmente personalizzato ulteriormente le funzioni interne delle GPU tramite il linguaggio PTX (Parallel Thread Execution) di Nvidia. Il risultato? Un training fluido, potente, e competitivo.
L’impresa di DeepSeek è la prova che, nell’arena dell’intelligenza artificiale, l’ingegno umano può ancora prevalere sulla sola potenza di calcolo. E rappresenta un campanello d’allarme per i giganti americani come Google, Amazon, Apple e Meta, i quali – dopo anni di investimenti miliardari – si trovano di fronte a un concorrente agile, efficiente e determinato.
Iscriviti al canale Telegram di Servicematica
Notizie, aggiornamenti ed interruzioni. Tutto in tempo reale.
LEGGI ANCHE

L’Intelligenza Artificiale nel mirino degli hacker: una corsa agli armamenti digitali
L'AI Generativa ha portato con sé nuove opportunità, ma anche nuove sfide in termini di sicurezza informatica. Le aziende devono essere consapevoli di questi rischi…

Nasce a Milano la prima piattaforma online per segnalare i magistrati
L’Ordine degli Avvocati di Milano lancia uno strumento digitale riservato per raccogliere segnalazioni, positive e critiche, sul funzionamento degli uffici giudiziari e sull’operato dei magistrati.…

Oggi, 7 giugno 2024, durante l’Open Day dell’Unione Camere Penali a Rimini -evento sostenuto da Servicematica-, si terrà la consegna del Premio “Riccardo Polidoro” ai…