月之暗面 Kimi 发布技术报告,重新设计大模型核心结构残差连接,让每一层可选择性关注此前各层输出,48B 模型训练效率提升 1.25 倍,被视为预告下一代模型关键模块。该研究由月之暗面三位联合创始人带领数十名研究员完成。论文发布后,马斯克、Andrej Karpathy、Jerry Tworek 等均给予高度评价。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验