AlphaGo Zero:这个世界人类是多余的!

摘要: 人类的最终极问题的解答是什么?

11-03 03:11 首页 差评

道生一,一生二

二生三,三生万物



今天,人工智能又占领互联网了!


简单的总结就是围棋人工智能 AlphaGo 出了个新版本,叫 AlphaGo Zero,然后做了些很厉害的事儿。


到底有多厉害,来看看官方公布的成绩单就知道了~(以下图片来源:DeepMind 论文)


一开始,AlphaGo Zero 除了基本规则以外,没有任何关于围棋的基础知识,偶尔还会犯些错误,比如填死自己送子,妥妥的萌新。。。


随后,它花了 3 个小时入门了围棋,水平变得和人类初学者一样,低级错误不太会犯了,但策略上很单一,吃子吃得很贪婪。


19 个小时以后,AlphaGo Zero 学会了一些进阶技巧,例如死活,打劫,先占边角这些人类棋手总结出来的 “ 套路 ”。


第 70 个小时,AlphaGo Zero 开始以超越人类的水平下围棋,掌握多种套路,多点布局。


到了第三天,AlphaGo Zero 打赢了 AlphaGo Lee(当初击败李世石的 AlphaGo 版本)战绩是 100 : 0,完胜!


第 21 天AlphaGo Zero 的排位分数和 AlphaGo Master 差不多了,要知道 AlphaGo Master 在今年以 3 比 0 击败过当时的世界第一柯洁。


到了第 40 天, AlphaGo Zero 压倒性战胜了 AlphaGo Master,胜率达到 90%,成为了世界第一的 “ 围棋手 ”。


人类最强棋手柯洁当天发了个微博,表示人类太多余了。


以前的 AlphaGo 用了几千万局人类的棋谱去训练,最新的 Zero 一开始只学会了围棋的基本规则,没有人类棋谱当成训练素材,它自己和自己下,左右互搏。。。


差评君觉得,AlphaGo Zero 和它的前身相比,和人类的差距要小得多,尤其是它得学习过程很像人类。


打个比方,人类刚刚发明围棋的时候,没有棋谱去参考,那么棋手下棋是按着规则和当时的棋局,自己想下一步的。


下得多的棋手会慢慢总结出一些在特定情况下可以套用的下法,靠着这些 “ 经验套路 ",例如 “ 金角银边草肚皮 ”,可以减少思考时间和负担。


这从侧面肯定了人类的围棋研究价值,但是人类花了上千年,阿尔法狗 Zero 只用了几天,感受一下差距。。。


AlphaGo Zero 一开始不靠人类经验直接根据规则来计算下法,这一点和刚接触围棋的人很像。


人类到后来会学习他人的棋谱,总结更多套路,学习他人的经验,而 AlphaGo Zero 不会忘记事情也不知疲倦,更不会犯同一遍错误,因此它独自就完成了对围棋的研究,默默地变成了地球上最厉害的围棋手。




AlphaGo Zero 不光又快又强,还省资源,只用了一台机器和 4 个 TPU (谷歌为机器学习定制的运算器),以前的版本要 48 个 TPU。


省资源这一点也开始渐渐接近人脑了,人脑和计算机比有个很大的优势就是高效,比如说小黑胖就很会吃还不太聪明,计算机要完成黑胖大脑的计算量,一般需要 “ 吃 " 更多能量。


计算机吃的能量是啥,当然是烧东西发的电啊,难不成用爱?


人工智能从今往后可能越来越当得起 “ 智能 ” 二字了。


目前人类让计算机解决问题的方式,还是让计算机按人类的方法做事,只不过利用了计算机不知疲倦,简单计算速度快的特点。


而以后,可能只要把问题交给人工智能,人工智能不用受人类经验的局限,搞出截然不同但是又很高效管用的解决方案。


这么一看,人工智能说不定就能和人类平起平坐了,甚至人类连思考也没什么必要。


最后开个脑洞,当人类走到那一步的时候,不禁产生了人类存在的意义是什么,而这个问题,人类找不到答案,丢给人工智能试试?



“ 我算出来了,42!  --AlphaGo Zero ”


首页 - 差评 的更多文章: