月之暗面推出全新注意力架构 Kimi Linear
2025 年 10 月 31 日
Kimi Linear 架构核心是 Kimi Delta Attention(KDA)线性注意力模块,通过精细门控机制有效利用循环神经网络有限状态记忆。Kimi Linear 模型在任务上性能优异,效率实现巨大突破,与 full attention 模型相比,能减少 75% 的 Key-Value(KV)缓存使用量,处理百万级长下文时解码吞吐量提升 6 倍,可作为全注意力架构「即插即用」替代品,提升性能并增强效率。
2026-01-28
月之暗面 Kimi 正式发布官方编程工具:Kimi Code2026-01-22
月之暗面总裁张予彤:Kimi 仅使用美国顶尖实验室 1% 的资源,新模型很快发布2025-11-08
月之暗面 K2 Thinking 模型训练成本据称为 460 万美元2025-10-31
月之暗面推出全新注意力架构 Kimi Linear2025-07-13
月之暗面发布万亿参数开源大模型 Kimi K22025-06-23
Kimi 旗下首款 Agent 开启内测2025-06-23
月之暗面发布首款自主智能体 Kimi-Researcher2025-01-20
Kimi 推出全新 k1.5 多模态思考模型,性能大幅领先2025-01-15
Kimi 多模态图片理解模型 API 发布,1M tokens 定价 12 元起查看更多
体验专业版特色功能,拓展更丰富、更全面的相关内容。