Nový algoritmus společnosti Google slibuje šestinásobné snížení paměťových nároků AI modelů. Akcie Samsungu, SK Hynix a Micronu prudce klesají kvůli obavám z poklesu poptávky.

Na první pohled to vypadá jako začátek konce paměťového supercyklu, ve skutečnosti ale může jít spíše o ukázkový případ panické reakce trhu na složitou technologickou zprávu. TurboQuant je zatím laboratorní průlom zaměřený hlavně na efektivnější inference a běžnou DRAM, zatímco strukturální příběh vysokokapacitní HBM klíčového paliva pro trénink velkých AI modelů - zůstává nedotčený a dále trpí nedostatkem nabídky, rostoucí poptávkou a silnými fundamenty ve prospěch hlavních výrobců pamětí.
Průlomová technologie vyvolává paniku na trzích
Společnost Google Research $GOOG představila nový algoritmus pro kompresi paměti nazvaný TurboQuant , který podle vědců dokáže komprimovat klíčovou cache paměť používanou ve velkých jazykových modelech minimálně šestkrát rychleji při až osmkrát rychlejší inferenci, bez snížení přesnosti .
Reakce trhů byla okamžitá a dramatická. Ve čtvrtek akcie dvou největších výrobců paměťových čipů na světě, SK Hynix a Samsung $SSNLF, klesly o 6 % a téměř 5 % v jihokorejském obchodování. Samsung Electronics uzavřel s poklesem 4,71 %, zatímco SK Hynix klesl o 6,23 %, což stáhlo jihokorejský benchmark KOSPI index dolů o 3,22 % .
Podobný trend pokračoval i na amerických trzích, kde se propadly akcie společností jako Micron Technology $MU, které klesly o 7 % , a SanDisk $SNDK, který klesl o 6,8 %. Tyto pohyby následovaly po poklesech akcií SanDisk a Micron v USA ve středu .
Jak TurboQuant funguje a proč investory děsí
TurboQuant představuje revoluční přístup k řešení jednoho z největších úzkých hrdel umělé inteligence - enormních paměťových nároků během inferenčních operací. TurboQuant je metoda komprese, která dosahuje vysokého snížení velikosti modelu s nulovou ztrátou přesnosti, což ji činí ideální pro podporu jak komprese klíčové cache (KV), tak vektorového vyhledávání.
Technologie pracuje ve dvou fázích. První fáze využívá PolarQuant, která přemýšlí o mapování vysokorozměrného prostoru jinak. Místo použití standardních kartézských souřadnic (X, Y, Z) převádí PolarQuant vektory do polárních souřadnic skládajících se z poloměru a sady úhlů. Průlom spočívá v geometrii: po náhodné rotaci se distribuce těchto úhlů stává vysoce předvídatelnou a koncentrovanou.
Druhá fáze působí jako matematický korektor chyb. I s efektivitou PolarQuant zůstává zbytkové množství chyby. TurboQuant aplikuje 1-bitovou kvantizovanou Johnson-Lindenstraussovu (QJL) transformaci na tato zbytková data.
Skutečný dopad na trh zůstává otázkou
Navzdory okamžité tržní reakci analytici varují před přehnanými obavami. Ray Wang, analytik paměti ze společnosti SemiAnalysis, uvedl, že výzkum od společnosti Google nemusí nutně vést k potřebě menšího množství čipů. Cache hodnot je "klíčové úzké hrdlo, které je třeba řešit pro lepší modely a hardwarový výkon," řekl. Wang uvedl, že bude "těžké vyhnout se vyšší spotřebě paměti" v důsledku zlepšení výkonu modelů .
Důležité je také rozlišit mezi různými typy paměti. Je třeba poznamenat, že ve srovnání se standardními DRAM čipy bude mít tato technologie menší dopad na HBM (High Bandwidth Memory). TurboQuant se hlavně používá k optimalizaci inference AI modelů, což je fáze, která většinou vyžaduje pouze obyčejné DRAM čipy. HBM však zůstává nutností ve fázi tréninku AI .
Podle zprávy společnosti CNBC přes čtvrteční pokles akcií pokračuje dokonalá bouře faktorů v dlouhodobé podpoře trhu s pamětmi. Významná poptávka spojená s nedostatkem nabídky tlačila ceny pamětí na nebývalé úrovně a podporovala zisky pro Samsung, SK Hynix a Micron .
Strukturální fundamenty zůstávají pevné
Klíčové je také uvědomit si, že TurboQuant je stále pouze výzkumný projekt. Stojí za to poznamenat, že TurboQuant ještě nebyl nasazen ve větším měřítku; je to stále laboratorní průlom v této době. To činí srovnání s něčím jako DeepSeek, nebo dokonce s fiktivní společností Pied Piper, obtížnějším.
Data ukazují, že velikost trhu HBM vzroste o 58 % na 54,6 miliardy USD v roce 2026, což představuje téměř 40 % trhu DRAM. Náhlý nárůst poptávky vedl k nerovnováze mezi nabídkou a poptávkou. Přesto, že Samsung, SK Hynix a Micron alokují 70 % své nové/dodatečné kapacity na HBM, zůstává kapacitní mezera 50-60% pro HBM .
Podle analytiků Wells Fargo by aktualizace Google TurboQuant mohla být ve skutečnosti pozitivní pro paměťové společnosti. Ačkoli by tento druh průlomu mohl vypadat negativně pro paměťové společnosti, myšlenka Jevonsova paradoxu naznačuje, že se může stát opak - učinění AI efektivnějším snižuje náklady, což ve skutečnosti může podpořit mnohem širší používání a poptávku .
Strukturální ovladače vázané na infrastrukturu AI, omezení dodávek a napjaté trhy HBM podporují odolný dlouhodobý výhled. Investoři by měli rozlišovat mezi krátkodobým šumem a fundamentálními trendy ukotvených v persistentní nedostatku paměti a rozšiřování AI zátěže .