谷歌推出压缩算法 TurboQuant,宣称实现约 6 倍内存节省
3 月 26 日
谷歌推出压缩算法 TurboQuant,旨在降低大语言模型和向量搜索引擎的内存占用,主要针对 AI 系统键值缓存瓶颈问题,该缓存因上下文窗口变大成主要内存瓶颈。TurboQuant 无需重新训练或微调模型,可将键值缓存压缩至 3bit 精度且基本保持准确率,对开源模型测试显示能实现约 6 倍的键值缓存内存压缩效果。
2026-03-26
谷歌推出压缩算法 TurboQuant,宣称实现约 6 倍内存节省2026-03-26
谷歌新算法引发美股存储板块集体下挫2026-03-26
谷歌新算法声称能「6 倍压缩 KV 缓存」美股存储板块承压走弱2025-10-23
比经典超算快 13000 倍,谷歌芯片实现量子计算新突破2025-10-23
谷歌突破性「量子回声」算法推动量子计算实用化体验专业版特色功能,拓展更丰富、更全面的相关内容。