Moonshot AI 携手清华大学发布 PrfaaS 架构,破解大模型算力瓶颈
上周一
大语言模型(LLM)推理性能瓶颈正被新技术打破,Moonshot AI 与清华大学研究团队联合提出「预填充即服务(PrfaaS)」新型架构。该架构将预填充与解码「手术刀式」分离,实现跨地域高效协同,把高计算密集的预填充任务卸载到专门高计算集群,生成的 KVCache 远程传输至本地解码集群,并引入双时间尺度调度机制确保传输高效。实测中,该架构使服务吞吐量提升 54%,降低响应延迟,实现资源利用率最大化。此次合作提供了新工程思路,为跨地域算力网络构建奠定基础,「预填充即服务」模式或成大模型迈向工业化应用的重要分水岭。
2026-04-20
Moonshot AI 携手清华大学发布 PrfaaS 架构,破解大模型算力瓶颈2025-11-27
清华大学发布 AI 应用指导原则:禁止将 AI 生成内容用作学业成果2025-09-22
华为、浙大发布 DeepSeek-R1-Safe 大模型2025-09-02
清华与东北大学联合推出 UltraRAG 2.02024-08-08
清华「太极 -Ⅱ」光芯片面世,首创全前向智能光计算训练架构体验专业版特色功能,拓展更丰富、更全面的相关内容。