当前位置: 主页 > 行业新闻 >

David Silver:新版AlphaGo不需要依赖外界导师

时间:2017-05-25 09:53 来源:真钱捕鱼游戏,现金捕鱼游戏|手机捕鱼游戏赢现金-|莆田it论坛 作者:admin
  AI科技评论按:围棋峰会第二天,在《AlphaGo研发介绍,AlphaGo意味着什么》主题演讲上,Demis Hassabis+David Silver针对昨天与柯洁鏖战的AlphaGo研发做了公开介绍,其中AlphaGo主程序员David Silver在演讲中讲到AlphaGo研发的关键介绍,AI科技评论根据现场原话整理出下文。
  演讲摘要:有了这样强大的策略网络和价值网络,AlphaGo探索棋步的基本的搜索树规模就得以大幅度缩减。前一个版本AlphaGo Lee还是通过“只考虑人类可能走的位置”和“预判50回合”来限制搜索规模,如今AlphaGo Master已经考虑的是全局最有价值的位置,并且预测更少的回合数目还能达到更高的准确率。这样一来,蒙特卡洛树更窄更浅,回合中考虑的走子位置更少、预判回合数更少,预判依靠更强大的网络,只用4个TPU、AlphaGo Lee十分之一的计算能力就达到了更高的棋力。
  AlphaGo Master的硬件,算法和训练细节
  先从外界一直在关心的AlphaGo硬件问题说起,具体来说,AlphaGo Lee使用了谷歌云上的50个左右TPU。依靠这样的计算能力,我们可以做50层深的搜索,就是说落子前对棋盘上每一个可能的位置可以做50步预判。每秒它可以搜索100,000(one hundred thousand,十万)个位置。听起来挺多的,但是其实20年前的深蓝可以每秒搜索100,000,000(a hundred million,1亿)个位置。所以其实AlphaGo思考的时候比深蓝聪明多了,它用策略网络和价值网络,大大减少了需要搜索的路径数量。

上一篇:卡纳瓦罗谈德比:细节至关重要 对手比我们经验丰富
下一篇:名帅支招巴萨引援:这人必须买 他就是巴萨新大脑