Il gigante dei chip Nvidia ha perso quasi $ 600 miliardi di valore di mercato dopo che il modello di AI cinese ha messo in dubbio la supremazia delle aziende tecnologiche statunitensi.

DeepSeek, una startup cinese poco conosciuta, ha inviato onde d’urto attraverso il settore tecnologico globale con il rilascio di un modello di intelligenza artificiale (AI) le cui capacità competono con le creazioni di Google e Openai.
Il creatore di DeepSeek-R1 afferma che il suo modello è stato sviluppato utilizzando chip di computer meno avanzati e meno che impiegati dai giganti tecnologici negli Stati Uniti.
In un documento di ricerca rilasciato la scorsa settimana, il team di sviluppo del modello ha dichiarato di aver speso meno di $ 6 milioni per il potere informatico per addestrare il modello-una frazione dei budget di AI da multimiliardari goduti da giganti della tecnologia statunitensi come Openi e Google, i creatori di chatgpt e gemelli, rispettivamente.
Marc Andreessen, uno dei più influenti venture capitalist della Silicon Valley, ha salutato il rilascio del modello come “momento di sputnik dell’IA”.
L’improvvisa emergenza di una piccola startup cinese in grado di competere con i migliori giocatori della Silicon Valley ha sfidato le ipotesi sul dominio degli Stati Uniti nell’intelligenza artificiale e ha sollevato timori che le valutazioni del mercato altissime di aziende come Nvidia e Meta possano essere distaccate dalla realtà.
Lunedì, Nvidia, che detiene un quasi monopolio nella produzione dei semiconduttori che l’IA generativa di potenza, ha perso quasi $ 600 miliardi nella capitalizzazione di mercato dopo che le sue azioni sono crollate del 17 percento.
Il presidente degli Stati Uniti Donald Trump, che la scorsa settimana ha annunciato il lancio di un’iniziativa AI da 500 miliardi di dollari guidata da Openi, con sede in Texas e Softbank in Giappone, ha affermato che Deepseek dovrebbe servire da “sveglia” sulla necessità che il settore statunitense sia ” focalizzato sul laser in competizione per vincere ”.
Cos’è DeepSeek?
DeepSeek, che ha sede a Hangzhou, è stato fondato alla fine del 2023 da Liang Wenfeng, un imprenditore seriale che gestisce anche l’hedge fund.
Sebbene poco conosciuto al di fuori della Cina, Liang ha una vasta storia di combinazione di tecnologie fiorenti e investimenti.
Nel 2013, ha co-fondato Hangzhou Jacobi Investment Management, una società di investimento che impiegava AI per attuare strategie di trading, insieme a un co-alunno dell’Università di Zhejiang, secondo i media cinesi di Sina Finance.
Liang ha continuato a stabilire altre due aziende incentrate sugli investimenti diretti da computer-Hangzhou Huanfang Technology Co e Ningbo Huanfang Partnership di gestione degli investimenti quantitativi-rispettivamente nel 2015 e 2016.
In un’intervista con le onde dei media cinesi nel 2023, Liang ha respinto il suggerimento che era troppo tardi per le startup per essere coinvolti nell’intelligenza artificiale o che dovrebbe essere considerato proibitivo.
“La riproduzione da sola è relativamente economica, basata su documenti pubblici e codice open source, tempi minimi di formazione o addirittura perfezionamento. La ricerca, tuttavia, prevede estese esperimenti, confronti e maggiori esigenze computazionali e di talenti “, ha detto Liang, secondo una traduzione dei suoi commenti pubblicati dal Chinatalk Scamart.
Liang ha affermato che il suo interesse per l’IA è stato guidato principalmente dalla “curiosità”.
“Da una prospettiva più ampia, vogliamo convalidare alcune ipotesi. Ad esempio, ipotizziamo che l’essenza dell’intelligenza umana potrebbe essere un linguaggio e che il pensiero umano possa essenzialmente essere un processo linguistico “, ha detto, secondo la trascrizione.
“Quello che pensi come” pensiero “potrebbe effettivamente essere il tuo linguaggio di tessitura del cervello. Ciò suggerisce che l’AGI simile all’uomo potrebbe potenzialmente emergere da modelli di grandi dimensioni “, ha aggiunto, riferendosi all’intelligenza generale artificiale (AGI), un tipo di intelligenza artificiale che tenta di imitare le capacità cognitive della mente umana.
DeepSeek non ha risposto immediatamente a una richiesta di commento.
Lunedì Gregory Zuckerman, giornalista del Wall Street Journal, ha dichiarato di aver appreso che Liang, di cui non aveva sentito parlare in precedenza, ha scritto la prefazione per l’edizione cinese di un libro che ha scritto sul defunto hedge fund Jim Simons .
“Apparentemente Simons ha lasciato un profondo impatto”, ha scritto Zuckerman in una colonna, descrivendo come Liang ha elogiato il suo libro come un tomo che “svela molti misteri precedentemente irrisolti e ci porta una vasta esperienza da cui imparare”.
“Anche mia madre non ha ottenuto molto dal libro”, ha scritto Zuckerman.
Perché DeepSeek ha preso d’assalto il mondo tecnologico?
In parole povere, il successo dell’azienda ha sollevato domande esistenziali sull’approccio all’IA che viene preso sia dalla Silicon Valley che dal governo degli Stati Uniti.
Si presume che le aziende tecnologiche statunitensi abbiano un vantaggio critico nell’intelligenza artificiale, non da ultimo a causa delle loro enormi dimensioni, che consentono loro di trarre i migliori talenti da tutto il mondo e di investire ingenti somme nella costruzione di data center e acquistando grandi quantità di costose alte. Termina patatine.
L’arrivo di Deepseek sulla scena ha sfidato il presupposto che ci siano miliardi di dollari per essere in prima linea nell’IA.
“Openi è stata fondata 10 anni fa, ha 4.500 dipendenti e ha raccolto $ 6,6 miliardi di capitale. DeepSeek è stata fondata meno di 2 anni fa, ha 200 dipendenti ed è stato sviluppato per meno di $ 10 milioni “, ha detto Adam Kobeissi, fondatore della newsletter di analisi del mercato The Kobeissi, lunedì.
“Come sono queste due aziende ora concorrenti?”
Nel loro documento di ricerca, gli ingegneri di Deepseek hanno dichiarato di aver utilizzato circa 2.000 chip Nvidia H800, che sono meno avanzati delle più patatine più all’avanguardia, per addestrare il suo modello.
Il team ha dichiarato di aver utilizzato più modelli specializzati che lavorano insieme per consentire ai chip più lenti di analizzare i dati in modo più efficiente.
Per il governo degli Stati Uniti, l’arrivo di Deepseek sulla scena solleva domande sulla sua strategia di cercare di contenere i progressi dell’IA della Cina limitando le esportazioni di chip di fascia alta.
Il documento di ricerca di DeepSeek suggerisce che i chip più avanzati non sono necessari per creare modelli di intelligenza artificiale ad alte prestazioni o che le aziende cinesi possono ancora procurarsi chip in quantità sufficienti-o una combinazione di entrambi.
I chip H800 di NVIDIA con sede in California, progettati per rispettare i controlli delle esportazioni statunitensi, furono esportati liberamente in Cina fino all’ottobre 2023, quando l’amministrazione dell’allora presidente Joe Biden li aggiunse al suo elenco di articoli limitati.
Nella sua intervista del 2023 con Waves, Liang ha affermato che la sua società ha accumulato 10.000 GPU Nvidia A100 prima che fossero vietati per l’esportazione. Le GPU o le unità di elaborazione grafica sono circuiti elettronici utilizzati per accelerare la grafica e l’elaborazione delle immagini sui dispositivi di elaborazione.
Tanishq Abraham, ex direttore della ricerca di Stability AI, ha dichiarato di non essere sorpreso dal livello di progresso della Cina in AI, dato il lancio di vari modelli da aziende cinesi come Alibaba e Baichuan.
“Mentre ci sono state restrizioni sulla capacità della Cina di ottenere GPU, la Cina è ancora riuscita a innovare e spremere le prestazioni da qualsiasi cosa abbiano”, ha detto Abraham ad Al Jazeera.
“Penso che sia una lezione per le aziende statunitensi da cui ci sono ancora molte prestazioni da cui possono spremere.”
Tara Javidi, co-direttore del Center for Machine Intelligence, Computing and Security presso l’Università della California a San Diego, ha affermato che Deepseek l’ha resa entusiasta del “rapido progresso” che si svolge nello sviluppo dell’IA in tutto il mondo.
“La mia unica speranza è che l’attenzione prestata a questo annuncio favorisca un maggiore interesse intellettuale per l’argomento, amplierà ulteriormente il pool di talenti e, ultimo ma non meno importante, aumenterà gli investimenti sia privati che pubblici nella ricerca di intelligenza artificiale negli Stati Uniti”, ha detto Javidi Al Jazeera.

Nel frattempo, la fiducia degli investitori nella scena tecnologica degli Stati Uniti ha avuto un successo, almeno a breve termine.
A parte la drammatica diapositiva di Nvidia, lunedì Google Parent Alphabet e Microsoft hanno visto i loro prezzi delle azioni scendere rispettivamente del 4,03 per cento e del 2,14 per cento, sebbene Apple e Amazon siano finiti più in alto.
“Se i numeri di costo di Deepseek sono reali, ora praticamente qualsiasi grande organizzazione in qualsiasi azienda può costruirlo e ospitarlo”, ha detto a Al Jazeera Tim Miller, un professore specializzato in AI all’Università del Queensland.
“Quindi, in questo senso, il gioco è cambiato completamente perché esiste una nuova” regola “a cui chiunque può giocare.”
Questo significa che la Cina sta vincendo la gara AI?
Non necessariamente.
Mentre gli analisti tecnologici concordano ampiamente sul fatto che DeepSeek-R1 si comporta a un livello simile a Chatgpt-o anche meglio per determinate attività-il campo si sta muovendo velocemente.
Il CEO di Openai Sam Altman ha dichiarato all’inizio di questo mese che la società avrebbe rilasciato il suo ultimo modello di AI di ragionamento, O3 Mini, entro poche settimane dopo aver considerato il feedback degli utenti.
Lunedì, Altman ha riconosciuto che DeepSeek-R1 era “impressionante” mentre difendeva l’attenzione della sua azienda sulla maggiore potenza informatica.
“Ovviamente offriremo modelli molto migliori e anche legittimo corroborante avere un nuovo concorrente! Ottieremo alcune versioni “, ha detto Altman su X.
“Ma soprattutto siamo entusiasti di continuare a eseguire sulla nostra tabella di marcia di ricerca e credere che più calcolo sia più importante che mai per avere successo nella nostra missione.”

Rui Ma, fondatore di Tech Buzz China, ha affermato che il settore tecnologico cinese era stato preso alla sprovvista quando Openi ha inizialmente rilasciato Chatgpt nel 2022.
“La maggior parte degli imprenditori aveva completamente perso l’opportunità che rappresentava l’intelligenza artificiale e si sentiva molto umiliata”, ha detto Ma ad Al Jazeera.
“È chiaro che da allora sono stati al lavoro. Penso che ciò che lo scorso fine settimana ci mostri sia quanto seriamente si sono auto-riflessi e hanno portato la sfida a “recuperare” la Silicon Valley. Penso che per conservare gli Stati Uniti, Washington dovrebbe concentrarsi sul potenziamento della Silicon Valley invece di sopprimere la Cina. “
Abraham, ex direttore della ricerca di Stability AI, ha affermato che le percezioni possono anche essere distorte dal fatto che, a differenza di DeepSeek, aziende come Openai non hanno reso i loro modelli più avanzati liberamente disponibili al pubblico.
“DeepSeek ha reso il suo miglior modello disponibile gratuitamente. D’altra parte, il miglior modello di Openai non è gratuito “, ha detto.
“Quindi la maggior parte delle persone che usano GATGPT gratuitamente sono scioccate da DeepSeek e credono che ci sia un enorme salto in capacità quando Openai ha avuto un modello di performance simile già per alcuni mesi. Questo muro di pagamento dei modelli di AI di frontiera porta a persone che non afferrano veramente i progressi e le capacità dell’IA. “
Miller, professore dell’Università del Queensland, ha affermato che i progressi di Deepseek e altri recenti sviluppi suggeriscono che la Cina è almeno “lassù” con gli Stati Uniti in AI.
“Ho fatto un po ‘una previsione usa e getta alla fine dell’anno scorso che la prossima svolta scientifica in AI potrebbe provenire da un piccolo giocatore come un singolo ricercatore universitario che non ha accesso a molto potere di calcolo – avrebbero bisogno di essere più intelligenti per competere, “Ha detto.
“L’apparente progresso di Deepseek è quasi un esempio di ciò: non avendo abbastanza potere computazionale per costruire modelli grandi come Chatgpt, dovevano essere intelligenti. La necessità è la madre dell’invenzione. “