仅靠概率论的机器学习无法实现通用智能
- 来源:新智元 原标题:名家王培:仅靠概率论的机器学习无法实现通用智能
- 2016/6/2 9:02:32
- 31584
仅靠概率论的机器学习无法实现通用智能
这是个复杂的问题。一方面,“概率统计”是一个庞大的领域,包括难以数计的结论和方法;而另一方面,对“人工智能”有各种非常不同的理解。在这篇短文中,我试图聚焦于问题的核心。在概率统计中,这里只涉及其基本概念,如“概率函数”和“随机样本”等。而“人工智能的目标”在这里是指通用的、完整的智能系统。这种系统的能力应在各个方面和人脑的信息加工能力有可比性(尽管未必在所有细节上和人脑相同),特别是能够在现实环境中有效处理出乎系统设计者和系统本身预料的问题。
一个自然的想法是给系统的每个信念一个概率值,其初始值或直接从数据中提取,或用各种统计算法和学习算法从相关数据中估计或总结。在此基础上,让系统反复用贝叶斯定理根据新证据修正信念。当需要在不同行动之间做选择时,选取期望效用值高的。这类基于决策论的理性模型早已在经济学、心理学等领域中被广泛应用。随着计算能力的大幅增长和各类数据的广泛收集,在计算机上实现这么个“理性人”的时机是否已经成熟了?
当然没那么简单。首先,“概率”在这里是什么意思?作为一个数学理论,“概率”在概率论中的含义是被有关公理所严格确定的。但如何把这个数学概念应用于现实问题并非显而易见。经典的观点是把“概率”看作一个可重复实验中一个结果出现频率的极限。问题是“极限”是定义在无穷远点的,而我们的观测总是有限的。严格说来,仅从一个数列有限项的值是不能确定其极限的,甚至无法确定这个数列是否有极限。因此,把一个带有不确定性的量看作“随机变量”并讨论它属于某值域的概率,基于一个隐含假设:这个量在重复测量中的取值是有一个相对稳定的分布的。但既然是“假设”,这个条件就不是永远成立的,而在它不能被认为近似成立时,我们就不能谈“概率”,也就更谈不上用概率统计解决问题了。
对概率的上述“频率解释”的局限性早已引起了很多人的关注。在诸多拓广概率使用范围的尝试中,一个有代表性的方案是对概率给予“主观解释”(又叫“私人解释”),即把它看作一个认识主体对信念的相信程度。和频率解释把一个事件的概率当作该事件的客观属性不同,主观解释容许不同认识主体赋予一个事件不同的概率值,而只要求在同一个认识主体的信念中的概率值是一致的,即不会给一个信念两个不同的概率值。这样,不可重复事件和数据不足的事件的概率也都有定义了。
对通用智能系统来说,频率解释失之过窄(很多信念的概率根本没定义),而主观解释失之过宽(信念的概率没办法确定),因此常见的是某种“逻辑解释”(或“贝叶斯解释”,这两个概念的差别在这里不细谈),即把一个信念的概率看成系统已有证据对它的支持程度。对给定信念和证据,这个值是确定的(客观性的一面),尽管对其具体确定方式仍有不同意见。仅对给定信念而言,不同认识主体可以赋予其不同概率(主观性的一面),因为它们所拥有的证据不同。当某信念对应于可重复实验中的一个结果,且此结果的出现频率确有极限时,其概率应当收敛于这个极限。这样一来,这个解释可以说是集中了频率解释和主观解释的优势。
我曾经中对上述三种解释在通用智能系统中的适用性有详细的讨论。尽管逻辑解释(或贝叶斯解释)比前两种在这个语境下更合理,以此为基础的方案仍面临若干严峻挑战。比如说,根据这种解释我们可以谈单个事件的概率,如“张三得了肺炎”。假定我们对张三只知道他的性别(男)和年龄(40),那么直接的办法就是以“40岁男人”为张三的“参考类”,以肺炎在此类中的发病率作为“张三得肺炎”的概率。但问题是张三会同时属于其他参考类(如“退役运动员”、“吸烟者”等等),其中每一个都可能为“张三得肺炎”提供一个不同的概率(因为各个参考类中的概率是根据不同的数据计算的)。在这种情况下,取哪个概率值呢?这就是“参考类问题”。一般的做法是用详细的描述,即“40岁、男性、吸烟者、退役运动员”,但这么详细的统计数据不一定存在,即使存在也可能因数据量太小而失去可靠性。在境况下,“详细的描述”包括张三的所有特点,而此时参考类大概只包含张三自己了。如果选一个我们有大量可靠数据的参考类(如“40岁男人”),则我们的统计结论是关于此类中的一个“随机样本”的,但不是关于张三的。因为我们有关于张三的进一步信息,他已不能被看作一个随机选择的40岁男人了。另一方面,如果不是选择一个参考类,而是同时考虑多个参考类,则必须处理这些参考类所提供的概率值之间的不一致。
上一篇:姚之驹:应建立机器人产业标准体系
版权与免责声明:凡本网注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本网授权不
展开全部
热门评论