DeepSeek 元旦发布新论文 开启架构新篇章
6 小时前

元旦,DeepSeek 发布新论文,提出名为 mHC(流形约束超连接)的新架构,旨在解决传统超连接在大规模模型训练中的不稳定性问题并保持性能增益。论文第一作者有解振达、韦毅轩、曹焕奇,DeepSeek 创始人 & CEO 梁文锋也在作者名单中。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟