字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架