まだベータ版ばい。

グーグル「TurboQuant」技術、AIのメモリー消費を6分の1に圧縮 メモリー市場は縮小か拡大か

グーグルは米国時間2026年3月24日、AIのアテンション計算をエヌビディア製H100 GPU上で最大8倍に高速化しながら、同時にメモリー消費を最大6分の1に削減する …