DeepSeek: Nová éra umelej inteligencie

Prichádza AI, ktorá prekonala ChatGPT a mení pravidlá hry.

V januári 2025 sa na technologickej scéne objavil nový hráč, ktorý spôsobil revolúciu v oblasti umelej inteligencie (AI). Čínsky DeepSeek, založený len v roku 2023, sa stal lídrom v oblasti AI a jej aplikácia DeepSeek-R1 prekonala ChatGPT od OpenAI, čím sa stala najpopulárnejšou bezplatnou aplikáciou na Apple App Store v USA.

Tento úspech nie je len symbolický, ale aj strategický, pretože ukazuje, že Čína dokáže konkurovať západným technologickým gigantom s minimálnymi zdrojmi. DeepSeek-R1, najnovší model firmy, nielenže prekonáva konkurenciu v kvalite odpovedí, ale je aj výrazne lacnejší na vývoj a prevádzku. DeepSeek so sídlom v Hangzhou sa špecializuje na vývoj veľkých jazykových modelov (LLM).

Spoločnosť bola založená Liangom Wenfengom, spoluzakladateľom kvantitatívneho hedžového fondu High-Flyer, ktorý sa rozhodol presunúť svoje zdroje z finančného sektora do výskumu umelej inteligencie. DeepSeek-R1, najnovší model spoločnosti, bol vyvinutý s použitím len zlomku zdrojov, ktoré využívajú západné spoločnosti ako OpenAI alebo Meta.

Model bol trénovaný na čipoch NVIDIA H800, ktoré sú menej výkonné ako H100, no vďaka inovatívnym metódam tréningu dokázala firma dosiahnuť výsledky porovnateľné s najlepšími modelmi na trhu. Tréning modelu stál 5,58 milióna dolárov, čo je približne desatina nákladov na tréning GPT-4 od OpenAI. DeepSeek-R1 pritom dosahuje výsledky porovnateľné s GPT-4 a Claude 3.5 Sonnet v oblastiach ako matematika, logické uvažovanie a programovanie.

Výhodou je bezplatná aplikácia dostupná na platformách iOS a Android. DeepSeek-R1 sa stal symbolom technologického pokroku Číny, ktorý ukazuje, že aj s obmedzenými zdrojmi je možné dosiahnuť globálny úspech. Tento model je nielen technologicky pokročilý, ale aj cenovo dostupný, čo ho robí atraktívnym pre široké spektrum používateľov. Jedným z najväčších úspechov je jeho schopnosť trénovať modely na obmedzených zdrojoch.

Spoločnosť využila technológie ako zmiešaná presnosť výpočtov, ktorá umožňuje znížiť spotrebu energie a zvýšiť rýchlosť tréningu. Okrem toho optimalizovala komunikáciu medzi GPU, čo minimalizovalo latenciu a maximalizovalo efektivitu. DeepSeek-R1 je založený na architektúre Transformer, ktorá je štandardom pre moderné jazykové modely. Model využíva technológie ako Rotary Positional Embedding (RoPE) na zlepšenie spracovania dlhých kontextov.

Ďalej je to Mixture of Experts (MoE) na efektívne rozdelenie výpočtových zdrojov medzi rôzne úlohy a tiež Multi-Head Latent Attention (MLA) na zlepšenie presnosti odpovedí. Tieto technológie umožňujú modelu spracovávať komplexné úlohy, ako je logické uvažovanie, matematické výpočty a programovanie, s vysokou presnosťou a efektivitou.

DeepSeek sprístupnil svoje algoritmy a tréningové dáta ako open-source, čo umožňuje výskumníkom a vývojárom z celého sveta využívať a vylepšovať jeho technológie. To nielenže podporuje transparentnosť, ale aj urýchľuje vývoj umelej inteligencie na globálnej úrovni. Úspech nováčika spôsobil výrazné otrasy na globálnom trhu. Akcie NVIDIA klesli o 17%, čo predstavuje stratu takmer 600 miliárd dolárov na trhovej kapitalizácii.

Takýto pokles je najväčší v histórii amerických spoločností. A aké sú reakcie technologických gigantov? Apple zatiaľ neuviedol vlastný AI model, no úspech DeepSeek pravdepodobne urýchli vývoj Apple Intelligence. Google integroval svoj modul Gemini do viacerých produktov (napríklad do telefónov Pixel, alebo tiež Samsung Galaxy), no DeepSeek predstavuje vážnu konkurenciu.

Microsoft ako hlavný investor OpenAI čelí výzve, ako udržať ChatGPT konkurencieschopným. DeepSeek ukázal, že americké sankcie na export AI čipov do Číny nemusia byť dostatočne účinné. Čínska vláda považuje úspech DeepSeek za strategický a podporuje jeho ďalší rozvoj. Sú tu ale aj kontroverzie a obavy, najmä tie, ktoré sa týkajú cenzúry.

DeepSeek-R1 totiž obsahuje mechanizmy na cenzúru politicky citlivých tém, ako sú protesty na námestí Tiananmen (protesty na Námestí Nebeského pokoja/mieru v čínskom hlavnom meste Peking medzi 15. aprílom a 4. júnom 1989, ktoré násilne potlačila armáda), alebo otázky týkajúce sa Taiwanu. Tieto obmedzenia vyvolávajú otázky o slobode prejavu a nezávislosti umelej inteligencie.

Navyše DeepSeek zhromažďuje údaje používateľov na serveroch v Číne, čo vyvoláva obavy o ochranu súkromia a možnosť zneužitia údajov na sledovanie alebo dezinformácie. Každý, ktorý chce používať čínsky variant umelej inteligencie by mal dbať, aké údaje AI zadáva a kam sa dané údaje môžu dostať (na čínske servery, ich využitie a pod.) Niektoré krajiny, ako Taiwan a Južná Kórea, už zakázali používanie DeepSeek vo vládnych inštitúciách.

DeepSeek predstavuje nový míľnik v oblasti umelej inteligencie. Úspech ukazuje, že inovácia a efektívnosť môžu prekonať obmedzenia zdrojov a geopolitické prekážky. Napriek kontroverziám a obavám o bezpečnosť má potenciál zmeniť pravidlá hry v globálnom technologickom sektore. Budúcnosť umelej inteligencie je nepochybne ovplyvnená týmto úspechom, ktorý ukazuje, že aj relatívne nová spoločnosť môže konkurovať najväčším hráčom na trhu.

Otázkou zostáva, ako na tento úspech zareagujú západné technologické giganty a aký vplyv bude mať DeepSeek na ďalší vývoj umelej inteligencie. Navyše, je dôkazom, že technologická inovácia nie je len otázkou zdrojov, ale aj kreativity a efektivity. Jeho úspech je inšpiráciou pre ďalšie startupy a ukazuje, že budúcnosť umelej inteligencie je otvorená pre každého, kto má odvahu a víziu.