据最新一期《自然》杂志宣布,DeepMind公司开拓的一种AI算法MuZero,可以在不奉告其游戏规则的情形下节制围棋、国际象棋、日本将棋和***游戏,这是谷歌人工智能部门得到的又一重大打破。

谷歌AI又获重大年夜打破!新算法无需理解规则也能自学成“棋”_阿尔法_模子 计算机

DeepMind 公司表示,研究职员多年来一贯在探求一种方法,既可以学习建立用于阐明当前环境的模型,也能够利用这个模型来进行最好的决策。
到目前为止,大多数方法都难以在Atari这种游戏中进行有效方案。

MuZero最初在2019年推出,通过只关注环境中最主要的一个方面,来学习建立模型并办理问题。
通过将这种方法与阿尔法狗强大的搜索树技能相结合,MuZero的能力实现了重大飞跃。
此外,MuZero 还利用了前瞻搜索、基于模型的方案来办理问题。

MuZero不会利用规则来找到最佳情形(由于事先不被奉告),而是学习考虑游戏环境的各个方面,自己不雅观察它是否主要。
在数百万场比赛中,它不仅学习规则,而且学习位置的通用代价,成功的通用策略以及事后评估自己行为的办法。
后一种功能可帮助其从自身的缺点中学习、回顾和重做游戏,以考试测验各种不同方法来进一步优化位置和策略代价。

MuZero不仅在国际象棋、围棋和日本将棋上达到了与供应完善规则的阿尔法狗一样的超人水平,在Atari游戏这样的凌乱感知输入环境中也创造了新记录。
研究职员将MuZero描述为“在追求通用算法方面迈出的主要一步”。

编辑:刘义阳