DeepMind 推出分布式训练框架 IMPALA,开启智能体训练新时代
2018 年 2 月 9 日
DeepMind 开发了一种可用于分布式训练的具备高扩展性的新型智能体架构 IMPALA(Importances Weighted Actor-Learner Architectures),该架构使用一种新型离策略修正算法 V-trace … 为了解决智能体在 DMLab-30 中进行训练的问题,DeepMind 开发了一种新型分布式智能体 IMPALA,它利用高效的 TensorFlow 分布式架构最大化数据吞吐量 … 我们展示了 IMPALA 在 DMLab-30(DeepMind Lab 环境中一组 30 个任务的集合)和 Atari-57(Arcade Learning Environment 中所有可用的 Atari 游戏)中进行多任务强化学习的有效性。
2019-07-26
DeepMind 与 Waymo 合作提高 AI 精度,加速模型训练2018-02-09
DeepMind 推出分布式训练框架 IMPALA,开启智能体训练新时代体验专业版特色功能,拓展更丰富、更全面的相关内容。