Komplexní průzkum AI čipů: NVIDIA vs AMD 2024-2025
Trh s AI čipy zažívá bezprecedentní vývoj, kde NVIDIA Blackwell architektura představuje generační skok s až 30x vyšším výkonem, zatímco AMD agresivně konkuruje s MI300X nabízející 2,4x více paměti než H100. Klíčovým faktorem zůstává software ekosystém, kde CUDA dominuje nad ROCm, ale cenová konkurence AMD vytváří tlak na celý trh.
Současná situace odráží dramatický posun od tradičních HPC aplikací k masivním AI workloadům, kdy firmy jako Meta a OpenAI potřebují tisíce GPU pro trénink nejnovějších modelů. Supply chain omezení pokračují i v roce 2025, kdy TSMC CoWoS kapacity jsou rezervovány do konce roku a HBM paměti trpí chronickým nedostatkem.
NVIDIA současná generace: Hopper dominance pokračuje
H100 Hopper zůstává zlatým standardem AI accelerace s architekturou postavenou na 80 miliardách tranzistorů vyrobených v TSMC 4N procesu. Čip nabízí 3,958 TFLOPS FP8 výkonu v nejvyšší SXM5 konfiguraci s 80 GB HBM3 paměti a propustností 3,35 TB/s. Energetická spotřeba dosahuje až 700W, což vyžaduje pokročilé chladicí systémy.
H200 přináší významné vylepšení hlavně v paměťové kapacitě - 141 GB HBM3e s propustností 4,8 TB/s představuje 76% nárůst kapacity a 43% nárůst rychlosti oproti H100. Všech šest paměťových stacků je aktivních, což poskytuje 1,9x rychlejší inferenci pro Llama2 70B a 18x rychlejší výkon oproti starému A100.
A100 Ampere architektura, přestože technicky překonána, zůstává relevantní pro cost-conscious nasazení s cenami kolem 8-15 tisíc dolarů oproti 25-40 tisícům za H100. Jeho 40-80 GB HBM2e konfigurace stále zvládne menší modely a představuje dostupnou cestu do AI výpočtů.
NVIDIA Blackwell: Revoluce v AI výpočtech
Blackwell představuje první multi-die GPU architekturu pro datacenter s dual-die designem spojeným 10 TB/s NV-High Bandwidth Interface. GB200 kombinuje dva GB100 dies s až 384 GB HBM3e paměti a propustností 8 TB/s na každý die, čímž vytváří bezkonkurenční platformu pro trillion-parametrové modely.
Druhá generace Transformer Engine podporuje nové FP4 a FP6 formáty s micro-tensor scaling, což umožňuje GB200 dosáhnout 20 PFLOPS FP4 výkonu - dramatický nárůst oproti předchozí generaci. Pátá generace NVLink s 1,8 TB/s propustností na GPU umožňuje škálování až na 576 GPU v jednom clusteru.
Výrobní problémy roku 2024 byly úspěšně vyřešeny - design flaw v CoWoS-L packaging od TSMC způsobil nízké výnosy kvůli tepelné expanzi, ale nové masky a redesign top metal layers problém eliminovaly. Celá produkce roku 2025 je již vyprodána hlavním hyperscalerům.
CES 2025 představil Project DIGITS za 3 000 dolarů - personal AI supercomputer s GB10 Grace Blackwell Superchip podporující až 200 miliard parametrů. Spotřebitelské RTX 50 série s DLSS 4 Multi Frame Generation demonstruje šíření Blackwell technologií do mainstream trhu.
AMD aktuální portfolio: Paměťová převaha
MI300X představuje nejsilnější současnou AMD nabídku s 192 GB HBM3 paměti - 2,4x více než H100 - při propustnosti 5,3 TB/s. CDNA 3 architektura s 304 výpočetními jednotkami a 1 216 Matrix Cores dosahuje 2,615 TFLOPS FP8 výkonu, což je konkurenceschopné s NVIDIA.
MI325X navyšuje paměť na 256 GB HBM3E s propustností 6 TB/s při zachování TDP 750W. Tento čip dokáže spustit 70B parametrový model na jednom GPU a podporuje trillion parametrové modely na 8-GPU systému, což představuje značnou výhodu pro memory-intensive aplikace.
MI300A jako APU kombinuje 24 Zen 4 jader s 228 GPU compute jednotkami a 128 GB HBM3, čímž vytváří unikátní hybridní řešení pro aplikace vyžadující silný CPU i GPU výkon současně.
AMD budoucnost: Agresivní roadmapa
MI350 série s CDNA 4 architekturou přichází v polovině roku 2025 s 288 GB HBM3e a 4x generačním nárůstem AI výkonu. Přechod na 3nm proces u XCD čipletů při zachování N6 pro IOD umožňuje 185 miliard tranzistorů v efektivnějším designu.
MI400 série pro rok 2026 slibuje 432 GB HBM4 paměti s propustností 19,6 TB/s a výkon 40 PFLOPS FP4. Helios rack-scale systém s 72 MI400 GPU dosáhne 2,9 ExaFLOPS výkonu s 31 TB celkové HBM4 paměti - přímá konkurence NVIDIA rack-scale řešením.
AMD přešlo na roční kadenci aktualizací místo dvouletého cyklu, což umožňuje rychlejší reakci na tržní vývoj. Cíl 20x zlepšení rack-scale energetické efektivnosti do 2030 již překonali s 38x zlepšením oproti původnímu cíli.
Výkonnostní souboj: Čísla a benchmarky
V současných benchmarcích vedou rozdílné čipy podle aplikace. Llama 2 70B inference ukazuje NVIDIA H200 s 31,712 tokeny/sekundu oproti AMD MI300X s 23,000 tokeny/sekundu. AMD kompenzuje nižší raw výkon vyšší paměťovou kapacitou, což je kritické pro velké modely.
FP8 výkon favorizuje AMD s 2,615 TFLOPS (MI300X) oproti 1,979 TFLOPS (H200), ale NVIDIA Blackwell s podporou FP4 mění pravidla hry s až 20 PFLOPS GB200 vs očekávaných 9,2 PFLOPS AMD MI355X.
Energetická efektivnost zůstává NVIDIA doménou s lepším poměrem TOPS/Watt díky optimalizovanému Hopper architecture, zatímco AMD čipy spotřebovávají více energie (750W vs 700W) za srovnatelný výkon.
Tržní dynamika: Dominance vs alternativa
NVIDIA si udržuje 80-92% podíl trhu AI čipů díky kombinaci technické superiority a ekosystémové dominance. Všichni hlavní hyperscaleři - AWS, Azure, GCP - staví primárně na NVIDIA platformách, zatímco AMD získává pozici jako "second source" pro risk mitigation.
Cenová strategie ukazuje dramatické rozdíly: NVIDIA H100 stojí 25-40 tisíc dolarů oproti AMD MI300X za 10-15 tisíc. Tato 2-4x cenová výhoda AMD vytváří tlak na price-conscious nasazení, zejména u inference workloadů.
Supply chain omezení postihují oba výrobce - HBM paměti od SK Hynix a Micron jsou vyprodány do 2025, zatímco TSMC CoWoS packaging kapacity limitují produkci high-end čipů. Firmy s dlouhodobými kontrakty získávají strategickou výhodu.
Software ekosystém: CUDA vs ROCm bitva
CUDA zůstává nezpochybnitelným lídrem s 17 lety vývoje, rozsáhlou dokumentací a seamless integrací do všech hlavních AI frameworků. Většina vývojářů zná CUDA, což vytváří síťový efekt pro NVIDIA platformy.
ROCm 6.0 přináší 8x zlepšení výkonu a lepší stabilitu, ale stále zaostává za CUDA v out-of-the-box experience. HIP kompatibilita umožňuje portování CUDA kódu, ale vyžaduje dodatečné úsilí. OpenAI plánuje ROCm podporu v Triton 3.0, což může být watershed moment pro AMD adopci.
PyTorch a TensorFlow nabízejí experimentální ROCm podporu, ale produkční nasazení stále favorizuje CUDA kvůli stabilitě a performance optimalizacím. Migrace z CUDA na ROCm je možná, ale vyžaduje investici do retraningu teams.
Strategický výhled: Fragmentace nebo konsolidace
Geopolitické faktory ovlivňují strategické rozhodování hyperscalerů, kteří hledají diverzifikaci dodavatelů. Microsoft Azure již nabízí MI300X instance, zatímco Oracle Cloud Infrastructure investuje do AMD portfolia jako alternative k NVIDIA závislosti.
Startup ekosystém zůstává primárně na NVIDIA platformách kvůli developer familiarity a performance, ale větší firmy experimentují s AMD pro cost-efficiency. Databricks, Essential AI a Lamini představují early adopters AMD řešení.
Shrnutí
Trh AI čipů prochází klíčovým momentem, kdy NVIDIA Blackwell architektura definuje novou performance bar, zatímco AMD agresivně konkuruje s paměťovou kapacitou a cenovou efektivitou. Software ekosystém zůstává rozhodujícím faktorem, kde CUDA dominance poskytuje NVIDIA strukturální výhodu.
Budoucnost bude záviset na schopnosti AMD dosáhnout CUDA-level stability v ROCm a na úspěchu open-source komunity. Supply chain omezení budou pokračovat až do roku 2026, kdy nová HBM4 technologie a 3nm procesy mohou změnit konkurenční dynamiku.
Pro zákazníky představuje současná situace trade-off mezi proven NVIDIA ekosystémem a AMD cost-performance alternativou. Rozhodnutí by mělo vycházet ze specifických workload požadavků, rozpočtových omezení a strategických priorit organizace.
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
Já jsem nakupoval $NVDA v dubnu kolem 100, když jsem zakládal pozici a rozhodoval se mezi ní a $AMD. AMD už bylo hodně vyklesané, měl jsem v plánu přikoupit ale menši pozici už jsem měl a NVDA byla pro mě prostě jasná volba i vzhledem k tomu, jak TRUMP manipuloval trhy jsem si řekl, že NVDA bude větší jistota. Pokud přijde nějaká větší korekce, určitě bych i přikoupil AMD.
Já mám $NVDA jako jednu z větších pozic. $AMD nemám (jen jako součást SMH ETF, které budu v dohledné době odprodávat) a osobně si myslím že na aktuálních cenách je už drahé a je tam dost růstu započítáno, bylo ale zajímavé pod 100 USD, jenže v podobné době se pod 100 USD dala koupit i Nvidia, tak bylo rozhodnutí jasné :)
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
Nakupoval jsem v dubnu hlavně Nvidii a hned po Palantiru je to moje největší pozice.
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
Já mám v portfoliu akcie $AMD a ten hlavní růst je teprve čeká.
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
$NVDA má stále lepší pozici a je to aktuálně největší firma na světě. AMD má nějaké svoje čipy, které jsou dobré, ale nemohou konkurovat Nvidii.
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
AMD je teď rozhodně zajímavější a pokud bude takto pokračovat, tak bude AMD i lepší než Nvidia.