În ultimele 48 de ore pe buzele tuturor a ajuns un nou model AI, DeepSeek. Teoretic el a contribuit la picajul valorii la bursă a celor de la NVIDIA şi OpenAI, făcând senzaţie prin funcţionalitatea sa, iar azi aflăm că în spatele său stau cipuri Huawei.
DeepSeek este un model AI din China care se laudă cu faptul că ar depăşi rivalii din SUA la eficiența costurilor. Chatbot-ul open source a ajuns pe locul întâi în App Store în 51 de țări. Azi aflăm că operează pe baza unor cipuri Huawei şi nu NVIDIA, cum se credea. DeepSeek R1 LLM a fost antrenat iniţial pe cipuri NVIDIA H100, dar folosesc un Huawei Ascend 910C pentru generarea de răspunsuri.
Informaţia vine de la @Dorianalexander, care subliniază ca acele cipuri Huawei nu au de-a face cu antrenarea modelului LLM, deci cerinţele de consum la nivel de GPU nu sunt atât de ridicate. Ascend 910C are totuşi o performanţă relativ redusă, de aici şi faptul că nu e bun pentru antrenare. Huawei vrea să rezolve asta cu o nouă generaţie de cipuri, 920C, care vor concura cu Blackwell B200, cel mai bun model de la NVIDIA pentru operaţiuni AI acum.
DeepSeek este o companie chineză de inteligență artificială, fondată în 2023 de Liang Wenfeng, un fost antreprenor în domeniul fondurilor speculative. Compania a dezvoltat modele de limbaj de mari dimensiuni (LLM) open-source, precum DeepSeek-R1 și DeepSeek-V3, care oferă performanțe comparabile cu modele precum ChatGPT de la OpenAI, dar cu costuri de antrenament semnificativ mai mici.
Recent, DeepSeek a lansat o aplicație gratuită de chatbot bazată pe modelul DeepSeek-R1 pentru iOS și Android. Până la 27 ianuarie 2025, aceasta a depășit ChatGPT, devenind cea mai descărcată aplicație gratuită din App Store în Statele Unite. Acest succes a provocat o scădere de 18% a prețului acțiunilor Nvidia, evidențiind impactul semnificativ al DeepSeek asupra pieței tehnologice globale.