Za svetový rekord môže konkurencia z Číny.
NVIDIA, ktorá sa v minulosti preslávila hlavne ako výrobca grafických kariet a jej produkty sa tešia veľkej popularite aj medzi počítačovými hráčmi, sa pustila aj do sveta AI. Jej GPU v podstate nemajú konkurenciu a hodnota spoločnosti prudko narástla, čo viedlo k paradoxnej situácii, nakoľko spoločnosť svojich zamestnancov vyplácala aj formou akcií, a po prudkom náraste hodnoty firmy sa časť z nich, vrátane skúsených inžinierov, pobrala do dôchodku.
Konkurencia však nespí, a tentoraz prišla z Číny. DeepSeek spustil jeho R1 model umelej inteligencie, ktorý má vyšší výkon ako riešenie od OpenAI a náklady sú pritom len 3% z nákladov firmou vedenou Samom Altmanom. Reťazec udalostí spôsobil prudký pokles cien akcií NVIDIA a behom jedného dňa zaznamenala rekordnú stratu 500 miliárd amerických dolárov.
Týmto sa výrobca dostal na čelo nelichotivého rebríčka a prekonala svoj vlastný rekord vo výške 279 miliárd amerických dolároch z 3. septembra 2024. Najväčšou iróniou je, že DeepSeek využil na trénovanie GPU práve od NVIDIA. Prevádzkovanie umelej inteligencie je veľmi nákladné, samotný OpenAI, ktorý svojim ChatGPT rozšíril povedomie o tomto type AI medzi širokú verejnosť, vykazuje straty.
Čínska AI, ktorej náklady sú oproti konkurencii takto nízke, by teda mohla zamiešať kartami na trhu. V pozore je aj Meta a jej AI model Llama. Riaditeľ infraštruktúry umelej inteligencie Mety Mathew Oldham údajne uviedol, že vlajkový model DeepSeek potenciálne prekoná ďalšiu verziu umelej inteligencie Llama, ktorá sa má dodať začiatkom roka 2025.
Yann LeCun, vedúci pracovník Mety v oblasti umelej inteligencie, hovorí, že obrovský úspech a široké prijatie modelu DeepSeek AI možno pripísať jeho open-source povahe. „Modely s otvoreným zdrojovým kódom prekonávajú proprietárne modely,“ vysvetlil vedúci AI a zopakoval význam modelov s otvoreným zdrojovým kódom a DeepSeek, ktorý môže znovu oživiť pôvodné zakladateľské poslanie OpenAI.
Taktiež sa objavili zatiaľ nie úplne overené informácie o tzv. “štyroch vojnových miestností s inžiniermi”. Dva tímy z týchto “vojnových miestností” majú za úlohu zistiť, ako sa čínskemu startupu v oblasti AI podarilo znížiť náklady na vývoj a tréning svojej umelej inteligencie. Meta údajne využije tieto informácie na usmernenie vývoja svojej ďalšej verzie umelej inteligencie Llama.
Zvyšné tímy budú mať za úlohu určiť údaje použité na trénovanie modelu AI DeepSeek, čo môže predikovať prepracovanie Llama. Táto udalosť samozrejme vyvolala aj právnu odozvu. OpenAI tvrdí, že má dôkazy o tom, že DeepSeek využila modely OpenAI na trénovanie konkurenčného modelu umelej inteligencie. Ak je to pravda, porušuje to podmienky služby spoločnosti.
O svojich dôkazoch informovala aj denník Financial Times, a tvrdí, že DeepSeek používa „destiláciu“ na trénovanie modelov umelej inteligencie. V tomto kontexte sa tento pojem vzťahuje na spoločnosť, ktorá používa výstupy už existujúceho modelu na trénovanie novšieho modelu. Destilácia znižuje náklady na vytvorenie modelu tým, že stavia na už vykonanej práci pre „model učiteľa“.
Destilácia nemusí byť automaticky zlá. V skutočnosti sa v odvetví umelej inteligencie používa často. Niečo, do určitej miery podobné, sa využíva v programovaní bežného softvéru, kde sa využívajú všelijaké knižnice a frameworky, napríklad populárny multiplatformový Electron. Vyvíjanie každého jedného softvéru od nuly by bolo nákladné a pomalé, žiaľ, tieto knižnice a frameworky sa častokrát používajú veľmi neefektívne.
A aj keď je potrebný len malý kúsok kódu, vloží sa celá knižnica, softvér je extrémne pomalý a zachraňuje to len rýchly rast výkonu hardvéru a veľkosť softvéru nadobúda extrémne rozmery. Veľkosť ovládačov pre karty NVIDIA už niekedy presahuje veľkosť inštalačného CD-čka s Windows XP so SP2, čo je mimochodom spôsobené aj nabaľovaním starého kódu.
Problémom v tomto spore OpenAI a DeepSeek je, že v tomto prípade sa podľa obvinení dáta použili spôsobom, ktorý je zakázaný. Spoločnosť teraz čelí obvineniam OpenAI z používania údajov bez povolenia. Samotný OpenAI bol za kradnutie dát obvinený vydavateľom časopisu The New York Times v decembri 2023, a následne vo februári 2024 čelil súdnym sporom s The Intercept, Raw Story a AlterNet.
Je veľmi ironické, že firma, ktorá okrem týchto káuz, používa texty a iné dáta z cudzích webstránok bez súhlasu autorov obsahu a finančného vyrovnania a zarába na nich, žaluje čínsku spoločnosť za to, že jej tieto nekalo získané dáta odcudzila.