无需人类知识,DeepMind 新一代围棋程序 AlphaGo Zero 再次登上 Nature
2017 年 10 月 20 日

比较关注 AlphaGo 的朋友对其中一位应该不会陌生,David Silver 是 AlphaGo 团队负责人,也是上一代 AlphaGo 的主要作者 … 最强 AlphaGo 是怎么炼成的提问:深度强化学习本来就是出了名的不稳、容易遗忘,请问你们是如何让 Zero 的训练如此稳定的 … 在 Zero 的论文中我们提到了各个版本的棋力:AlphaGo Master > AlphaGo Lee > AlphaGo Fan,每个版本都让三子击败了它的前一代。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

科技新闻,每天 3 分钟