李德毅:谈人工智能22次说到“记忆”
——记中国工程院院士、指挥自动化和人工智能专家李德毅
- 发布时间:2016-05-05
- 浏览次数:31627
指挥自动化和人工智能专家李德毅
先讲讲围棋,围棋其实是中国的文化遗产,中国的围棋在全世界很有名。就跟中国的乒乓球一样有名,但乒乓球是舶来品,围棋是我们中国人的。现在围棋好的是中日韩。围棋是谁把谁围住了谁就赢,所以我出了一个题目,叫做形象思维的自动化。下象棋大家都知道主要是吃子,有大小之分。围棋就不一样了,围棋的子没有大小之分,象棋是八分八的棋盘。我想特别回顾一下历史,在2011年9月6号,我们中国人工智能学会组织了九路围棋,81个格子,让北邮的围棋程序Lingo对俞斌,让俞斌让两个子给Lingo,他说不好赢。在2011年的时候包括中央电视台也播了,俞斌是我们中国围棋队总教练,我们的围棋在世界上可以说是稳拿的,两盘都败给了Lingo,当时认为两三年九路棋盘是有希望的。这是五年前的事情,只不过我们中国人工智能学会影响不那么大,全世界不一定都感知到了。
到了2016年3月9号,李世石下了19路围棋,而且后4:1输了。为什么?难在哪里?围棋难以锁定下一个目标,具有更大的不确定性。我有一篇著作叫做“不确定性人工智能”。围棋的不确定性比象棋大很多,象棋更注重逻辑思维,围棋在某个状态下应对的步骤比象棋多很多,既有逻辑思维也更注重形象思维,更大局观。
我们看看在《自然》杂志上,20个作者写了AlphaGo的程序,他们采取的办法。这篇文章里提到一个特定的围棋棋局,有很多的计算量和推理量。我们中国人有一句话叫做千古无同局,所以历来把它认为是给人工智能一个挑战的很好的里程碑。那么我们仔细分析一下,AlphaGo为什么赢?这是我今天要报告的重点。它突破了传统的程序,构建了两道模仿人类思维的深度卷积神经网络。个网络主要担当棋局态势的评估,第二个网络是如何落子,这是人机大战,如果你知道每一步怎么下的,你会得到一个结论,那就是没有看到有天外来客下出不食人间烟火的套路。这句话告诉大家AlphaGo的学习能力很强,因为它是我们围棋手教他的。
所以在全世界一片振动之后,我提出四个问题请大家思考一下。
个问题,如果让AlphaGo或李世石再下一次复盘,让李世石原来怎么下还怎么下,请问AlphaGo能不能复盘,能下出跟原来一样的吗?它是以不确定性为强的,能不能重复?这是个问题。
第二个问题,在比赛之前以及比赛之后,这个程序变了没有?还是原来的程序吗?我们手机坏了实在不行重新启动,还是原来的。AlphaGo的程序还是原来的吗?它跟李世石下了五盘棋学到了什么东西。
第三个问题,跟李世石下棋之前,AlphaGo跟别人下过,如果用相同的版本对比的话结局如何?还有没有意义?能不能提高AlphaGo的水平。
第四个问题,让AlphaGo从此以后不再跟高棋手下棋,AlphaGo的程序水平会不会降低?