加国无忧旗下站点

加国无忧APP下载

AlphaGo不会计时：时间控制仍需人类干预

发布：2016年06月29日 09:39 来源：新浪科技

发布：2016年06月29日 09:39

来源：新浪科技

北京时间6月28日午间消息，谷歌DeepMind的人工智能围棋系统AlphaGo已成为全球最知名的深度学习技术应用案例。不过，帮助AlphaGo取得成功的某些代码仍来自人工程序员。

今年3月，AlphaGo以4:1的比分击败了韩国围棋冠军李世石。根据此前的报道，AlphaGo自己与自己练习了几百万盘棋，从而掌握了围棋技巧。

AlphaGo是DeepMind的两大神经网络之一。其技术包括监督学习(即研究人类棋手的棋谱)，以及增强学习(自己与自己练习，并从中改进)。不过最新消息显示，有些东西AlphaGo无法通过学习去掌握。

DeepMind研究总监索尔·格雷佩尔(Thore Graepel)表示，最终完成的AlphaGo系统非常善于发现，应当专注于棋盘的哪个区域。不过，AlphaGo并不擅长何时停止思考，完成落子。

这带来了问题，因为顶级围棋赛事有着复杂的计时系统。例如，在与李世石的对局中，双方各有2小时的常规时间去落子，并在时间耗尽后有3次读秒机会。棋手可以选择在某一回合中启动读秒。但如果全部读秒时间耗尽，那么就会被判负。

格雷佩尔表示：“人类能进行复杂的时间管理。在困难的局面下，他们会思考更长时间，而在简单的局面下，他们花的时间较少。我们试图让AlphaGo也能做到这点。”

“时间是重要资源：我们思考某一步棋的时间越长，那么下法就可能越好。然而，时间是有限的。因此我们提出了一些方法，即如果算法在更长时间的思考后不会改变决策，那么我们可以探测出这点。”

研究团队并未在AlphaGo的围棋知识中加入时间规则，而是引入了额外的限制。与核心引擎不同，时间算法是由人工设计的。

不过，这仍完全基于算法。格雷佩尔表示：“通过评价系统，我们进行了优化。我们会比较不同的耗时曲线，例如在开始阶段用时较少，随后用时增多，或是开始用时较多，随后逐渐减少。我们测试了哪种方法效果最好。”

因此，目前还不必担心机器抢走人类的工作，人类仍有工作要做，例如控制秒表

生活服务

大統華密西沙加職位更新06/28 【T&T大统华】

招聘

大统华超级市场

招聘

TESCO （特亿建材）

网友评论

网友评论仅供其表达个人看法，并不表明 51.CA 立场。

人造骨可作建筑材料：替代钢筋水泥减少碳排放

百科 2016-06-29 09:23
中国新超算冠军终结天河二号首用中国自主芯片

中国 2016-06-28 11:25
[集市好物]出让Rogers高速家庭网络1500M计划

推广
模拟火星土壤种的植物能吃:种植效果跟地球一样



百科 2016-06-28 09:18
朱诺号7月初进木星轨道:有望获最清晰木星图像

百科 2016-06-28 09:04
院士：高铁提速不具备技术条件想再快坐飞机

中国 1 评论 2016-06-27 23:39
聂卫平谈阿尔法约战柯洁:可能下不过不比更好

中国 2016-06-27 16:31
你愿意吃昆虫吗?蟋蟀养殖舱或能解决粮食危机



中国 2016-06-27 09:26
4美元印度神机:除了像iPhone还有这些槽点

国际 2016-06-27 09:16
人类或许永远都不知道是否生活在虚拟现实中

社会 2016-06-27 09:15
中科院博导：想破解北斗？不如去研发时光机



中国 1 评论 2016-06-27 09:11