Újra kell gondolni az MI-t: az amerikai riválisok költéseinek töredékéből tanították be a Deepseeket.
Mi történt? A kínai DeepSeek mesterségesintelligencia-fejlesztő közölte, hogy mindössze 294 ezer dollárba, azaz kevesebb, mint százmillió forintba került az R1 nevű AI-modell kiképzése, ami töredéke az amerikai riválisok költségeinek. Az adat egy frissen megjelent, a Nature folyóiratban publikált tanulmányban szerepel, és várhatóan újra fellobbantja a vitát Kína helyéről a globális AI-versenyben. A hír azért keltett nagy visszhangot, mert korábban Sam Altman, az OpenAI vezérigazgatója 100 millió dollár feletti összegekről beszélt a hasonló nagymodell-tréningek esetében.
Részletek. A tanulmány szerint a DeepSeek R1-et 512 darab Nvidia H800 chippel tanították, amelyeket kifejezetten a kínai piacra terveztek, miután az Egyesült Államok 2022-ben megtiltotta az erősebb H100 és A100 modellek exportját. Ugyanakkor a cég először ismerte el, hogy A100 chipekkel is rendelkezik, amelyeket a fejlesztés előkészítő fázisaiban használt. Ez azért fontos, mert korábban amerikai tisztviselők azt állították, hogy a vállalat tiltott módon nagy mennyiségű H100-hoz is hozzáférhetett.
Háttér. A DeepSeek januári bejelentése, miszerint olcsóbban tud nagy teljesítményű AI-rendszereket előállítani, megrázta a technológiai piacot, és pánikszerű eladásokat indított el a globális tőzsdéken, mert befektetők attól tartottak, hogy veszélybe kerülhet az amerikai cégek – köztük az Nvidia – piaci dominanciája. Azóta a vállalat és alapítója, Liang Wenfeng ritkán szerepel nyilvánosan, mostani közlésük viszont újabb kérdéseket vet fel a költségek valódiságáról és a chiphasználat hátteréről.
(CNN)