logo
科技新闻,每天 3 分钟
马斯克 xAI 推出 Grok-1.5 大语言模型:提升推理能力,可处理 128k 上下文
3 月 29 日

马斯克旗下的人工智能公司 xAI 推出了 Grok-1.5 大语言模型,该模型拥有改进的推理能力和 128k 的上下文长度,尤其在编码和数学任务上表现更佳。Grok-1.5 将在𝕏平台上向早期测试人员和现有用户推出。在官方测试中,它在 MATH 和 GSM8k 数学基准上分别取得了 50.6% 和 90% 的成绩,在 HumanEval 基准测试中得分为 74.1%。该模型构建在自定义的分布式训练框架之上,能够自动检测并剔除有问题的训练节点,同时优化了检查点、数据加载和训练作业重新启动,以减少故障时的停机时间。

行业标签
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验