Apple nedávno predstavil svoj najvýkonnejší čip M3 Ultra, ktorý je súčasťou nového Mac Studio.
Tento čip prináša revolučné možnosti v oblasti spracovania veľkých jazykových modelov (LLM), ako je napríklad DeepSeek R1 s 671 miliardami parametrov. Vďaka unikátnej architektúre a efektívnemu využitiu pamäte sa M3 Ultra stáva cenovo dostupnejšou alternatívou k tradičným riešeniam s viacerými GPU. Nový čip M3 Ultra je dostupný v dvoch konfiguráciách: základná verzia s 28-jadrovým CPU, 60-jadrovým GPU a 96GB jednotnej pamäte.
Potom je tu vyššia verzia s 32-jadrovým CPU, 80-jadrovým GPU a až 512GB pamäte. Cena za najvyššiu konfiguráciu dosahuje zhruba 17-tisíc eur, čo je v porovnaní s tradičnými riešeniami na báze GPU stále výrazne lacnejšie. Jednou z najväčších výhod M3 Ultra je jeho jednotná pamäťová architektúra, ktorá umožňuje efektívne využitie zdrojov.
Na rozdiel od tradičných GPU, ktoré sú obmedzené veľkosťou VRAM, M3 Ultra dokáže alokovať až 448GB pamäte pre náročné úlohy, ako je spracovanie modelu DeepSeek R1. Je to jazykový model s 671 miliardami parametrov, ktorý vyžaduje viac ako 400GB RAM. Tradičné riešenia na báze GPU, ako NVIDIA RTX 5090, by na spracovanie takéhoto modelu potrebovali viac ako 10 grafických kariet, čo by znamenalo náklady presahujúce 40-tisíc eur a spotrebu energie až 7500W.
Na porovnanie, M3 Ultra dokázal tento model spracovať s celkovou spotrebou len 160-170W. Vďaka 4-bitovej kvantizácii modelu sa podarilo znížiť nároky na presnosť, pričom model si zachoval všetkých 671 miliárd parametrov. Aj keď kvantizácia znižuje presnosť výpočtov, výsledky boli stále prekvapivo presné a efektívne.
Hoci M3 Ultra nedosahuje výkon jedinej RTX 5090 v niektorých špecifických úlohách, ako je napríklad rendering v Blenderi, jeho výhoda spočíva v schopnosti spracovať obrovské modely bez potreby viacerých GPU. RTX 5090 má síce vyššiu pamäťovú priepustnosť (1792 GB/s oproti 819 GB/s pri M3 Ultra), no obmedzená veľkosť VRAM (32GB) ju diskvalifikuje pri spracovaní modelov ako DeepSeek R1.
Jednou z najväčších výhod M3 Ultra je jeho nízka spotreba energie. Pri spracovaní modelu DeepSeek R1 systém spotreboval menej ako 200W, čo je len zlomok spotreby tradičných riešení s viacerými GPU. Táto efektivita robí z M3 Ultra ideálnu voľbu pre výskumné a vývojové tímy, ktoré potrebujú spracovávať veľké jazykové modely bez astronomických nákladov na hardvér a energiu.
M3 Ultra je ideálny pre úlohy, ktoré vyžadujú veľkú pamäť a vysokú efektivitu. Jeho schopnosť spracovať modely ako DeepSeek R1 otvára nové možnosti v oblasti umelej inteligencie, strojového učenia a spracovania prirodzeného jazyka. Hoci nie je určený na bežné úlohy, ako je rendering alebo hranie hier, jeho výkon v špecifických aplikáciách je bezkonkurenčný.