上帝按照自己的模样创造了人类。
人类按照自己的模样创造了人工智能(AI)。
至少最开始的时候是这样的。
人类和海豚、黑猩猩、倭黑猩猩一样,可能是低于某个智能门槛的。一些声称拥有基于人工智能系统的公司经常使用人力来处理其在线系统的棘手任务,而用户对此并不知情。这可能会严重混淆公众对现今的人工智能发展程度的认知。
我一直在思考我们需要进行哪些研究,要解决哪些问题,以及为了达到超级人工智能或人类智能水平,我们已经解决了哪些难题。我们已经孜孜不倦地尝试了62年,但显然直到现在我们才接近实现所有必要的突破。
爱因斯坦在1916年预言了引力波的存在,但是在99年之后,也就是2015年,我们人类才首次探测到引力波。
有一些事情的成功就是一个漫长的过程,需要大量的新技术,需要很长的时间将想法变得更成熟,也需要众多出色的人才投身其中。我觉得人类智能水平的人工智能或许就是这样的,而且更为复杂,可能要花上数百年时间才能得以实现。
过去62年里至少有四种人工智能的主要方法。当然,其他人可能还总结了不同的方法。
在我看来,这四种主要方法以及大致的开始日期分别是:
1. 符号(1956年)
2. 神经网络(1954年,1960年,1969年,1986年,2006年….)
3. 传统机器人(1968年)
4. 基于行为的机器人(1985年)
符号
符号通常由字符串表示,这些字符对应一个词。然后人们设定了相互间的联系,对其进行编码,比如instanceof运算符和is字符串。
当我们向搜索引擎输入查询时,我们选择了用符号进入人工智能系统对世界的了解。系统做了一些推理和推论,然后生成一个网页列表,它推断出与我们正在寻找的内容相匹配的信息(它实际上并不知道我们是与其数据库中的“人”符号相对应的) 。然后我们会浏览这些精选出来的信息,点击最匹配的一两个网页,如果不是我们想要的资料,我们就会输入一个新的符号或者修改原来的符号进行新的搜索。
神经网络
2014年11月17日,《纽约时报》报道了一则消息,向全世界展示了一个新功能。谷歌程序自动为以下图片生成的标题:“一群年轻人在玩飞盘游戏”(A group of young people playing a game of Frisbee)。
我认为从那个时候起人们才真正开始注重深度学习。即使对于人工智能研究人员,尤其是基于符号的人工智能的研究人员来说,一个程序能做得这么好是一个奇迹。但是,我也觉得人们将表现和能力混淆了。如果一个人有同等水平的表现,能够准确描述这个画面,那么人们就很自然会期望这个人有足够的能力去理解这个世界,他/她可能会回答以下每个问题:
飞盘是什么形状?
大致上,一个人可以扔多远?
人可以吃飞盘吗?
一次大约有多少人可以一起玩飞盘?
一个三个月大的婴儿可以玩飞盘吗?
今天的天气适合玩飞盘吗?
但是生成上述标题的深度学习神经网络无法回答这些问题。
传统机器人
在人工智能最初的几十年,就是基于符号的人工智能那个阶段,研究人员试图通过制造机器人来实现人工智能。其中有些机器人可以四周移动,并能用来推东西。还有固定在指定位置的机器臂。但是同时具备上述两种功能的带铰接臂的移动机器人在当时是很难制造出来的。
基于行为的机器人
在1985年以前,我花了10年研究计算机视觉,尝试从图像中提取世界的符号描述,并在传统机器人技术中建立机器人的计划系统,以便让机器人在模拟或现实世界中运作。
但是我备受打击。
我开始思考昆虫在现实世界中的导航能力,以及它们是如何用非常少的神经元做到的(当然少于现代深度学习网络中人工神经元的数量)。在思考它们是如何做到这一点时,我意识到简单生物的进化路径可能并非由为世界构建的符号或三维建模系统开始的。相反,这种进化是通过感知和行动之间非常简单的联系开始的。
在这种思维导致的基于行为的方法中,有许多并行的行为同时运行,试图理解一小部分感知,并凭借它们来驱动世界上的简单行为。通常,行为会为机器人的执行器提出相互矛盾的命令,并且必须采取措施解决这个冲突。但是,这不需要回到完整的世界模型中,而是解决冲突的机制在本质上必然是启发式的。正如人们猜想的那样,进化会产生的这种启发式的机制。
下面是这四种人工智能方法和人类小孩的得分对比:
从上表可以看到,如果人类小孩在这6项能力中每项得分为100分的情况下,四种人工智能方法各自的总得分才8到9分。我一如既往地认为我们可能严重高估了现阶段人工智能系统的能力。