字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
2024 年 11 月 4 日
字节跳动豆包大模型团队与香港大学合作开源了名为 HybridFlow 的全新 RLHF 框架,该框架支持多种训练和推理框架,兼容不同模型部署和多种 RL 算法,实验结果显示,在各种模型规模和 RL 算法下,HybridFlow 的训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。
体验专业版特色功能,拓展更丰富、更全面的相关内容。
字节跳动豆包大模型团队与香港大学合作开源了名为 HybridFlow 的全新 RLHF 框架,该框架支持多种训练和推理框架,兼容不同模型部署和多种 RL 算法,实验结果显示,在各种模型规模和 RL 算法下,HybridFlow 的训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。