清华大学与瑞莱智慧联合团队推出了大语言模型 RealSafe-R1,旨在提升安全性。该模型基于 DeepSeek-R1 系列模型进行后训练,实验数据显示其在多个基准测试中有效增强了对越狱攻击的抵抗力,并减轻了安全与性能之间的矛盾。瑞莱智慧首席执行官田天表示,RealSafe-R1 模型及数据集将向全球开发者开源,为开源大模型的安全性加固提供支持,并为政务、金融、医疗等场景的应用提供可靠基座。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验
分享