继谷歌旗下DeepMind公司开拓的人工智能模型“阿尔法星际”在《星际争霸2》游戏中击败人类职业选手后,6月12日,海内子工智能软件公司商汤科技宣告其研发出了可媲美职业玩家竞技水平的《星际争霸2》人工智能模型“DI-star”,并展示了该人工智能模型击败人类顶尖职业玩家的对决***。

国产AI在《星际争霸2》中击败人类职业选手_商汤_人类 绘影字幕

人机对战的历史由来已久,从“深蓝”击败人类国际象棋选手到“阿尔法狗”击败人类围棋选手,人工智能已逐渐具备了超越人类顶尖选手的决策能力。
而《星际争霸2》这款业界公认的具有超高游戏难度和公正竞技性的即时计策游戏也成为诸多AI争相寻衅的新“珠峰”。

详细来看,《星际争霸2》的空间繁芜度高达10的1685次方,远远超出围棋10的170次方的繁芜度,在近乎天文数字一样平常的弘大状态空间中进行繁芜的策略博弈,这使得《星际争霸2》成为了考验AI决策能力的绝佳舞台。

在商汤科技聪慧决策与游戏奇迹部技能研发卖力人周航展示的两场比赛中,DI-star在与中国***选手Rex的对战过程中依赖风雅的微操建立了前期上风,而在与前世界冠军Scarlett的对战中,DI-star利用出了女王前压这样的人类选手不常见的战术,终极出奇制胜。
值得一提的是,周航此前曾是中国顶尖的《星际争霸2》选手,曾得到8次全国星际争霸2比赛冠军。

在展示中,周航通过多个对战演示片段,展现了DI-star能够在繁芜对局中快速找到最优策略的能力。
据理解,DI-star领悟了监督学习和强化学习等商汤多项前沿技能,为AI智能体授予人类宗师分段水平的决策能力。
通过监督学习,DI-star让AI反复不雅观摩人类职业玩家对战的高质量录像学习人类的打法,快速节制资源采集、单位生产,以及战斗过程中成百上千步的决策行为。
在监督学习的根本上,DI-star通过强化学习让AI通过自我博弈的办法进行大量对局,持续提升全局的决策能力和整体的竞技水平。

商汤方面表示,商汤AI大装置为DI-star的模型建立、演习和验证供应了强大的算法和算力根本,帮助DI-star用更短的韶光达成媲美乃至降服人类专业高手的对战水平。
依托商汤AI大装置,DI-star通过5周的韶光完成了大约一亿局对战,终极达到了人类最高段位宗师分段竞技水平。
目前,DI-star及其背后的决策智能平台已经在GitHub开源。

在商汤展示的***中,DI-star利用出女王前压这样的人类选手不常见战术出奇制胜

编辑 宋钰婷

校正 柳宝庆