TurboQuant: Proč Trh Přestřelil A MU Micron Je Levnější Než

TurboQuant: Proč Trh Přestřelil A $MU Micron Je Levnější Než Kdy Dříve

Google $GOOGL 24. března zveřejnil algoritmus TurboQuant a trh okamžitě smazal miliardové hodnoty paměťových akcií. Je to přehnaná reakce – nebo reálná hrozba? Po hlubší analýze je odpověď překvapivá.

Co Se Stalo

Ve středu 25. března 2026 zveřejnil Google Research na konferenci ICLR 2026 nový kompresní algoritmus nazvaný TurboQuant. Titulky hlásaly: „6× méně paměti, 8× rychlejší inference, nulová ztráta přesnosti." Trh nečekal – Micron klesl přes 10%, Samsung $SSNLF a SK Hynix $HY9H.F následovaly. Celý paměťový sektor odepsal v jednom dni desítky miliard dolarů tržní kapitalizace.

Jenže realita je – jako vždy – složitější.

Co TurboQuant Skutečně Dělá

TurboQuant je pokročilý algoritmus komprese KV cache (Key-Value cache) v LLM modelech. KV cache je dočasná paměť, kterou model vytváří při generování textu – u dlouhých konverzací může zabírat obrovské množství HBM paměti v GPU.

TurboQuant tento cache komprimuje na 3 bity místo standardních 16 bitů pomocí dvou kroků: algoritmu PolarQuant (převod do polárních souřadnic) a QJL transformace (1-bit komprese reziduí). Benchmarky na NVIDIA H100 jsou skutečně impresivní – 6× redukce KV cache, 8× rychlejší attention operace, nulová degradace přesnosti na standardních testech MMLU a HumanEval.

Technologie je reálná, recenzovaná a fungující. Panika ale fungující nebyla.

Pět Důvodů Proč Je Trh Přestřelil

1. KV cache není celá HBM spotřeba TurboQuant zasahuje pouze dynamickou část inference paměti. Model weights – váhy samotného modelu – zůstávají beze změny. Llama 3 70B má 140 GB vah, ty se nekomprimují. TurboQuant redukuje jen část celkové paměťové zátěže.

2. Training zůstává nedotčen Trénink AI modelů spotřebuje násobně více HBM než inference. H100 a H200 clustery v Microsoftu, Googlu a Amazonu jedou na 100% kapacitě pro trénink. TurboQuant do tréninku nezasahuje vůbec – celý tento obrovský segment poptávky zůstává beze změny.

3. Jensonův paradox jako v lednu 2025 Pamatuješ DeepSeek? V lednu 2025 algoritmus tvrdil, že trénink LLM je 40× levnější. Micron klesl 15% za jeden den. Za šest týdnů byl zpět. Proč? Levnější inference → hyperscaleři nasadili víc modelů, více uživatelů, více požadavků → celková HBM poptávka vzrostla. TurboQuant spustí stejný mechanismus.

4. Kontextová okna rostou rychleji než komprese šetří Modely přechází z 128K na 1M+ tokenů kontextu. I při 6× kompresi je 1M token kontext paměťově náročnější než starý 128K bez komprese. Paměťová poptávka na inference token neklesá – roste.

5. Reálný agregovaný dopad je −15–20% inference paměti, ne 6× celku Inference KV cache tvoří přibližně 20% celkové HBM spotřeby v AI datacentrech. 6× redukce této části = přibližně −15 až 20% celkové AI HBM poptávky. Nikoliv 6× celého trhu, jak titulky naznačovaly.

A Co Micron Konkrétně?

Micron po rekordních Q2 výsledcích (revenue $23,86 mld., gross margin 81%) klesl od post-earnings high $462 na přibližně $370 – tedy −20% za týden. TurboQuant přidal poslední vlnu prodejů. Výsledek: MU se dnes obchoduje na přibližně 4,8× forward P/E na FY2027 EPS ($76–80 dle konsenzus, $100+ dle Barclays).

Pro kontext: Nvidia obchoduje na 28–35× forward P/E. Nasdaq průměr je 25×. Micron, který roste revenue o 90%+ YoY, je na pětině valuace průměru indexu.

Přitom:

HBM pro FY2026 je dle managementu 100% sold out – TurboQuant toto nemění

Pětileté SCA kontrakty s Nvidií garantují objemy bez ohledu na inference efektivitu

Q3 guidance $33,5 mld. revenue a EPS $19,15 zůstávají beze změny

Strukturální výhoda v héliové krizi vůči korejské konkurenci trvá

Historický Precedent: DeepSeek Scénář

Událost Pokles MURecovery časNetto efekt

DeepSeek leden 2025−15%6 týdnů Poptávka vzrostla

TurboQuant březen 2026−20%Odhadováno 4–8 týdnů Pravděpodobně stejný

Jediný reálný rozdíl: DeepSeek zasahoval do tréninku, TurboQuant pouze do inference KV cache. TurboQuant je tedy fundamentálně méně impaktní než DeepSeek – přesto způsobil větší pokles. To je definice přestřelení.

Závěr

TurboQuant je impresivní inženýrský výkon. Není to ale konec paměťového supercyklu. Je to kompresní algoritmus pro jeden specifický typ paměťové operace, u jednoho ze tří hlavních AI workloadů, na technologii která se stane vstupní branou k masivně většímu AI deploymentu.

Micron na $370 s forward P/E 4,8× a HBM sold out pro celý rok 2026 je pro investora se střednědobým horizontem pravděpodobně levnější, než bude za šest měsíců.

Trh panikařil u DeepSeeku. Panikařil znovu. Mechanismus bude pravděpodobně stejný.

Krystof Jane

@krystofjane

Myslím, že je to krátkodobá reakce trhu. Navíc širší trh v posledních dnech výrazně oslabil a Micron $MU se tak vezl částečně s ním. Od začátku roku je ale akcie stále +24 %. Neděje se tedy nic převratného, ale vůbec není od věci to sledovat. I na případné nákupy, pokud by propad pokračoval, to nemusí být špatné.

Like 1