AlphaGo2.0来到中国, “人机大战第二季”激战正酣。
但事实上,AlphaGo已经是围棋人工智能的第三代。在开发围棋人工智能的道路上,人类已经艰难地探索了将近五十年。
第一代围棋人工智能是中国教授发明
围棋的英译名Go是日语的发音译来的,围棋在日语里写成“碁”(即Go的发音),把围棋译成Go或者The game of go大概是最蹩脚的翻译了,尤其是在互联网时代,把围棋译成Go非常不利于围棋的推广,但AlphaGo的出现或能改变这个事实。
棋类游戏是对人类智能的挑战,自然也成了人工智能的标志之一。而围棋一直被认为是人工智能领域里的非常困难的挑战。二战还没结束,图灵就研究计算机下棋,他于1947年编了第一个国际象棋下棋程序,但直到1968年,最早的电脑围棋程序才被编写出来。它是由阿尔伯特·索伯特开发的,引入了一个评估函数对棋局进行分析,来估算双方占空的大小。然而,在相当长的一段时间里,业界的普遍观点是电脑围棋只能达到业余棋手的水准。
真正意义上的第一代围棋AI(人工智能)——“手谈”,是由已故中山大学化学系教授陈志行研发的围棋程序,从1993年到2002年共10次获得电脑围棋世界冠军,而“手谈”这个名字也是围棋除“弈”之外的别称。
陈志行教授原本研究的是量子化学,但同时也是围棋业余高手。在1991年退休后,他才开始潜心研发电脑围棋软件,虽然当时的电脑软件技术水平还非常低,而围棋棋盘大(19 19,一共有361点),空间状态多,打劫、终局规则复杂,一般程序员至少需要设计一两年才可能让电脑学会下围棋。但量子化学专业出身的陈志行,使用速度快但不太常用的汇编程序语言搭建围棋框架和编写围棋对弈引擎,他潜心编写的“Alpha-Beta搜索引擎”速度非常快,在当时领先其他同行几个数量级,达到了13层搜索深度,也就是说“手谈”可以算清后面的13步棋,而其他程序通常只能算七八步。陈志行编写的“模式识别”专家系统在当时也是无人能及。
陈志行潜心研发“手谈”3年后,终于在世界比赛中斩获首个围棋人工智能世界冠军。当时的“手谈”以战斗力超强著称,智能水平遥遥领先国际同行。之后“手谈”对弈水平不断进步,在国际性的电脑围棋对弈比赛上连续夺冠,夺得了该时期大部分世界比赛的冠军。
当时个人电脑系统刚在世界范围内普及,许多围棋爱好者还专门购买电脑安装“手谈”软件,用作学习围棋和训练的工具,“手谈”软件在世界范围内销售量排名第一。可以说,“手谈”软件的成功在国内掀起了一波围棋人工智能研究的热潮。
“蒙特卡洛树”算法开启二代围棋人工智能
当如IBM深蓝那样的超级电脑,已经能够击败世界上最好的国际象棋棋手时,围棋软件却仍然无法击败业余围棋高手。
但是,从2006年开始,随着应用蒙特卡洛方法的树搜索即蒙特卡洛树搜索和机器学习在围棋上的应用,电脑围棋水平有了突飞猛进的增长,棋力普遍提升到业余高段的水准。
围棋的棋子多,组合可能性也多。蒙特卡洛算法是一种基于“随机数”的计算方法,这一方法源于美国在二战中研制原子弹的“曼哈顿计划”。频率决定概率,围棋对弈软件将最常见的对弈定式及棋形输入其中,从而达到较短时间提高棋力的功效。用通俗的语言解释这种算法:“简单来说,人脑下围棋靠的是逻辑思维,而蒙特卡洛算法就是一个抽样调查的方法。其实就是一个赌博概率式的方法,如果电脑下100盘棋,用这种下法赢了60盘,用另一种下法只赢了50盘,那么,它就会认定第一种下法,而淘汰另一种下法。”
蒙特卡洛树搜索算法的出现,可以看作是人工智能取得突破性进展的标志:计算机的思考方式,已经有点接近人类的思维方式了。目前使用蒙特卡洛树搜索的围棋对弈软件有疯石围棋(CrazyStone)、银星围棋(SilverStar)、天顶围棋(ZEN)等,都取得了不错的成绩。
2011年8月欧洲围棋大会,电脑围棋软件ZEN在19路盘上被让五子击败日本职业棋手林耕三六段。2012年3月,ZEN被让四子击败了日本超一流棋手武宫正树九段,这是围棋程序首次在被让四子的情况下战胜第一流职业选手。2013年,CrazyStone被让四子击败日本石田芳夫九段,2014年,CrazyStone被让四子击败日本依田纪基九段。可见围棋软件进步迅速,至少比起十年前对弈水平已经提高一大截,受让四子优势明显。
2015年10月,同样基于蒙特卡洛树搜索的Google旗下人工智能公司DeepMind开发的AlphaGo,在没有任何让子的情况下,以五战全胜的成绩击败了欧洲围棋冠军、职业围棋二段樊麾,这也是电脑围棋程序首次击败围棋职业棋手,当然也意味着围棋AI新时代的来临。
AlphaGo、绝艺以及人机协作
围棋AI之难,难在这项运动本身的多重复杂性——“最简单的规则,最复杂的变化”。在AlphaGo及其开发团队DeepMind出现之前,几乎所有研究者都认为在十年内人工智能战胜围棋大师的机会是渺茫的。而在它出现以后,几乎所有人都在惊呼人工智能已破解了围棋这一历史难题,甚至在极短的时间内两次让研究成果上了《自然》杂志的封面。
据AlphaGo官方介绍,AlphaGo采用了一种更加“通用”的人工智能方法,即采用将改进的蒙特卡洛决策树算法与深度神经网络算法相结合的方法构建最终的学习系统。其包括两个部分:策略网络与价值网络。策略网络在当前给定的棋局中,负责预测下一步的走棋,并对下一步走棋的好坏进行打分,策略网络的作用好比“模仿”人类棋手的各种走法,以达到预测的效果。然而仅凭模仿无法击败最顶级的人类高手,AlphaGo又增加了价值网络来判断当前的局面到底对哪一方有利,但围棋程序的局势评估相当困难,只能通过深度学习网络之间自我训练的方法来达到良好的效果。
2016年3月,AlphaGo以4:1战胜世界围棋名将李世石,AlphaGo的实力首次被世人真正认可。AlphaGo 2.0版本的升级亮点是——摒弃人类棋谱,即仅通过监督学习和强化学习,再度进化出新的“围棋机器人”。
事实上,除了AlphaGo,现在还有其他围棋AI程序也已被证明达到甚至超过了人类棋手的一流水平,比如腾讯AI Lab(腾讯人工智能实验室)研发的围棋人工智能程序“绝艺”(Fine Art),它在今年首次参加UEC杯计算机围棋大赛,就以11连胜夺得了本届UEC杯冠军,在随后的人机大战中完胜日本先锋棋手一力辽。
AI作为工具,被人类棋手“喂招”不断进化后,它也能“反哺”人类,棋手使用围棋AI开展人机协同,AI为人类棋手“蓄力”,1+1>2的进化成为了新看点。随着数据量的高速增长,AI可以分析总结、自我学习,人则可以通过善用AI、人机协作,开启智慧时代,改变现在以及未来的一切。(作者为《机器人产业》杂志副总编)
实战双方形成一场转换,其结果依然是黑棋明显优势,白棋断这个是胜负手这个局部显然是白棋最后的机会。白棋断时黑棋已经无法阻止白棋在空中出棋了,而此时或许AI才刚刚意识到前面的失误。
奥多姆仍处于病危状态,包括艾弗森在内的多位NBA退役以及现役球星为奥多姆祈福,“魔术师”约翰逊回忆往事,称赞奥多姆心地善良待人友善。
广西有一件命案15年没破,人工智能却帮警察抓住了嫌疑人。尽管不方便详细透露案情,但王海波仍然向《科技日报》介绍了机器福尔摩斯近期破获广西一起15年悬疑命案的大致套路。
近日美国名嘴采访机器人被调戏了,看来AI比我们想象的要厉害得多啊。Hanson表示,他以全民女神奥黛丽赫本和他妻子为原型打造了Sophia,而目前他的公司Hanson Robotics已经打造了20个机器人。
而艾弗森作为NBA历史上最矮小的得分王,的确如杜兰特所说,在同等身材的球员出类拔萃。值得一提的是,虽然艾弗森身高只有1.83米,杜兰特的实际身高接近2.10米,但两个人都是NBA历史上数得着的砍分大王。
北京时间3月12日,本月初,费城76人队的传奇球星阿伦-艾弗森的3号球衣正式退役。” 今年3月2日,艾弗森的球衣退役仪式在费城76人队的主场富国银行中心球馆隆重举行,2万多名观众来到现场见证这一伟大的时刻。
北京时间11月7日,据《菲律宾星报》报道,NBA传奇球星阿伦-艾弗森日前正在菲律宾出席篮球慈善赛,在接受当地媒体的采访时,他特别谈到了昔日赛场上的老对手科比-布莱恩特。
北京时间10月31日(费城时间10月30日)消息,阿伦-艾弗森今天在76人主场富国银行中心正式宣布退役。” 艾弗森对于自己的成就非常骄傲,他直言,“我就是费城,当你想起费城篮球,你想起阿伦-艾弗森,这是我努力赢得的。
北京时间7月4日消息,据美国《丹佛邮报》报道,在国王队撤回5600万美元的报价合同后不久,安德烈-伊戈达拉和丹佛掘金重新回到谈判桌,双方将会就一份长期的合同进行谈判。本来国王想要给伊戈达拉提供一份高达5600万美元的合同,但是不久前国王宣布撤回这份报价,这样伊戈达拉仍然是自由球员。
近日,他的前妻塔瓦娜声称艾弗森涉嫌诱拐了他们的孩子,现在她请求法院让前夫把孩子们归还给她。作为孩子们的唯一法定监护人,塔瓦娜相信艾弗森当时并没有带着孩子们去夏洛特,而是把他们留在了佐治亚州的一家喜来登酒店。