海光信息成功推出国产化适配 DeepSeek 模型
2025 年 2 月 4 日
中科曙光国家先进计算产业创新中心宣布,海光信息技术团队已完成 DeepSeek V3 和 R1 模型与海光 DCU 的国产化适配并上线。这些基于 Transformer 架构的模型采用 MLA 和 DeepSeek MoE 技术,降低内存占用并提升推理效率,优化模型性能。DCU 是海光信息推出的高性能 GPGPU 架构 AI 加速卡,已在多个领域规模化应用。
体验专业版特色功能,拓展更丰富、更全面的相关内容。
中科曙光国家先进计算产业创新中心宣布,海光信息技术团队已完成 DeepSeek V3 和 R1 模型与海光 DCU 的国产化适配并上线。这些基于 Transformer 架构的模型采用 MLA 和 DeepSeek MoE 技术,降低内存占用并提升推理效率,优化模型性能。DCU 是海光信息推出的高性能 GPGPU 架构 AI 加速卡,已在多个领域规模化应用。