前 DeepSeek 研究员、小米 MiMo 大模型负责人罗福莉与北京大学联合研发出统一的资源管理系统 ARL-Tangram,该系统采用统一动作级公式和弹性调度算法,能满足异构资源约束,缩短动作完成时间,实现定制化异构资源管理器。评估显示,它可提高平均 ACT,缩短强化学习训练步骤持续时间,节省外部资源。这是罗福莉在小米发表的第二份突破性技术成果论文,去年 10 月她已有首篇论文成果。在 2025 小米人车家全生态合作伙伴大会上,罗福莉迎来入职首秀,并在朋友圈官宣加入小米 Xiaomi MiMo 大模型团队。