TurboQuant: Proč Trh Přestřelil A $MU Micron Je Levnější Než Kdy Dříve
Google $GOOGL 24. března zveřejnil algoritmus TurboQuant a trh okamžitě smazal miliardové hodnoty paměťových akcií. Je to přehnaná reakce – nebo reálná hrozba? Po hlubší analýze je odpověď překvapivá.
Co Se Stalo
Ve středu 25. března 2026 zveřejnil Google Research na konferenci ICLR 2026 nový kompresní algoritmus nazvaný TurboQuant. Titulky hlásaly: „6× méně paměti, 8× rychlejší inference, nulová ztráta přesnosti." Trh nečekal – Micron klesl přes 10%, Samsung $SSNLF a SK Hynix $HY9H.F následovaly. Celý paměťový sektor odepsal v jednom dni desítky miliard dolarů tržní kapitalizace.
Jenže realita je – jako vždy – složitější.
Co TurboQuant Skutečně Dělá
TurboQuant je pokročilý algoritmus komprese KV cache (Key-Value cache) v LLM modelech. KV cache je dočasná paměť, kterou model vytváří při generování textu – u dlouhých konverzací může zabírat obrovské množství HBM paměti v GPU.
TurboQuant tento cache komprimuje na 3 bity místo standardních 16 bitů pomocí dvou kroků: algoritmu PolarQuant (převod do polárních souřadnic) a QJL transformace (1-bit komprese reziduí). Benchmarky na NVIDIA H100 jsou skutečně impresivní – 6× redukce KV cache, 8× rychlejší attention operace, nulová degradace přesnosti na standardních testech MMLU a HumanEval.
Technologie je reálná, recenzovaná a fungující. Panika ale fungující nebyla.
Pět Důvodů Proč Je Trh Přestřelil
1. KV cache není celá HBM spotřeba TurboQuant zasahuje pouze dynamickou část inference paměti. Model weights – váhy samotného modelu – zůstávají beze změny. Llama 3 70B má 140 GB vah, ty se nekomprimují. TurboQuant redukuje jen část celkové paměťové zátěže.
2. Training zůstává nedotčen Trénink AI modelů spotřebuje násobně více HBM než inference. H100 a H200 clustery v Microsoftu, Googlu a Amazonu jedou na 100% kapacitě pro trénink. TurboQuant do tréninku nezasahuje vůbec – celý tento obrovský segment poptávky zůstává beze změny.
3. Jensonův paradox jako v lednu 2025 Pamatuješ DeepSeek? V lednu 2025 algoritmus tvrdil, že trénink LLM je 40× levnější. Micron klesl 15% za jeden den. Za šest týdnů byl zpět. Proč? Levnější inference → hyperscaleři nasadili víc modelů, více uživatelů, více požadavků → celková HBM poptávka vzrostla. TurboQuant spustí stejný mechanismus.
4. Kontextová okna rostou rychleji než komprese šetří Modely přechází z 128K na 1M+ tokenů kontextu. I při 6× kompresi je 1M token kontext paměťově náročnější než starý 128K bez komprese. Paměťová poptávka na inference token neklesá – roste.
5. Reálný agregovaný dopad je −15–20% inference paměti, ne 6× celku Inference KV cache tvoří přibližně 20% celkové HBM spotřeby v AI datacentrech. 6× redukce této části = přibližně −15 až 20% celkové AI HBM poptávky. Nikoliv 6× celého trhu, jak titulky naznačovaly.
A Co Micron Konkrétně?
Micron po rekordních Q2 výsledcích (revenue $23,86 mld., gross margin 81%) klesl od post-earnings high $462 na přibližně $370 – tedy −20% za týden. TurboQuant přidal poslední vlnu prodejů. Výsledek: MU se dnes obchoduje na přibližně 4,8× forward P/E na FY2027 EPS ($76–80 dle konsenzus, $100+ dle Barclays).
Pro kontext: Nvidia obchoduje na 28–35× forward P/E. Nasdaq průměr je 25×. Micron, který roste revenue o 90%+ YoY, je na pětině valuace průměru indexu.
Přitom:
HBM pro FY2026 je dle managementu 100% sold out – TurboQuant toto nemění
Pětileté SCA kontrakty s Nvidií garantují objemy bez ohledu na inference efektivitu
Q3 guidance $33,5 mld. revenue a EPS $19,15 zůstávají beze změny
Strukturální výhoda v héliové krizi vůči korejské konkurenci trvá
Historický Precedent: DeepSeek Scénář
Událost Pokles MURecovery časNetto efekt
DeepSeek leden 2025−15%6 týdnů Poptávka vzrostla
TurboQuant březen 2026−20%Odhadováno 4–8 týdnů Pravděpodobně stejný
Jediný reálný rozdíl: DeepSeek zasahoval do tréninku, TurboQuant pouze do inference KV cache. TurboQuant je tedy fundamentálně méně impaktní než DeepSeek – přesto způsobil větší pokles. To je definice přestřelení.
Závěr
TurboQuant je impresivní inženýrský výkon. Není to ale konec paměťového supercyklu. Je to kompresní algoritmus pro jeden specifický typ paměťové operace, u jednoho ze tří hlavních AI workloadů, na technologii která se stane vstupní branou k masivně většímu AI deploymentu.
Micron na $370 s forward P/E 4,8× a HBM sold out pro celý rok 2026 je pro investora se střednědobým horizontem pravděpodobně levnější, než bude za šest měsíců.
Trh panikařil u DeepSeeku. Panikařil znovu. Mechanismus bude pravděpodobně stejný.
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
Podle mě je dobré té paniky využít a nakoupit pokud té firmě rozumím. Pokud to chápu správně, tak Micron na tom může vlastně ještě vydělat ne?
Bulios Black
Tento uživatel má díky předplatnému přístup k exkluzivnímu obsahu, nástrojům a funkcím.
Skvely komentar plny hodnoty. Jste z fachu?