AI:人工智能的本质与未来(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-20 19:54:12

点击下载

作者:[英]玛格丽特·博登

出版社:中国人民大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

AI:人工智能的本质与未来

AI:人工智能的本质与未来试读:

01 什么是人工智能

人工智能(Artificial Intellegence,AI)就是让计算机完成人类心智(mind)能做的各种事情。通常,我们会说有些行为(如推理)是“智能的”,而有些(如视觉)又不是。但是,这些行为都包含能让人类和动物实现目标的心理技能,比如知觉、联想、预测、规划和运动控制。

智能不是一维的,而是结构丰富、层次分明的空间,具备各种信息处理能力。于是,人工智能可以利用多种技术,完成多重任务。

人工智能无处不在。

人工智能的实际应用十分广泛,如家居、汽车(无人驾驶车)、办公室、银行、医院、天空……互联网,包括物联网(连接到小物件、衣服和环境中的快速增多的物理传感器)。地球以外的地方也有人工智能的影子:送至月球和火星的机器人;在太空轨道上运行的卫星。好莱坞动画片、电子游戏、卫星导航系统和谷歌的搜索引擎也都以人工智能技术为基础。金融家们预测股市波动以及各国政府用来指导制定公共医疗和交通决策的各项系统,也是基于人工智能技术的。还有手机上的应用程序、虚拟现实中的虚拟替身技术,以及为“陪护”机器人建立的各种“试水”情感模型。甚至美术馆也使用人工智能技术,如网页和计算机艺术展览。当然,它还有一些应用不那么让人欢欣鼓舞,如在战场上穿梭的军事无人机——但是,谢天谢地,它也用在了机器人扫雷舰上。

人工智能有两大主要目标:一个是技术层面的,利用计算机完成有益的事情(有时候不用心智所使用的方法);另一个是科学层面的,利用人工智能概念和模型,帮助回答有关人类和其他生物体的问题。大多数人工智能工作者只关注其中一个目标,但有些也同时关注两个目标。

人工智能不仅可以带来不计其数的技术小发明,还能够对生命科学产生深远的影响。某一科学理论的计算机模型可以检验该理论是否清晰连贯,还能生动形象地证明其含义(通常是未知的)。理论是否正确另当别论,但其依据是从相关科学范畴得出的证据。就算我们发现该理论是错误的,结果也能够给人以启迪。

值得一提的是,心理学家和神经学家利用人工智能提出了各种影响深远的心智—大脑理论,如“大脑的运作方式”和“这个大脑在做什么”的模型:它在回答什么样的计算(心理)问题,以及它能采用哪种信息处理形式来达到这一目标等。这两个问题不一样,但都十分重要。还有一些问题尚未回答,因为人工智能本身已经告诉我们:心智内容十分丰富,远远超出了心理学家们先前的猜想。

生物学家们也用到了人工智能——人工生命(A-Life)。利用这项技术,他们为生物体的不同内部结构建立了计算机模型,以解读不同种类的动物行为、身体的发育、生物进化和生命的本质。

人工智能对哲学也有影响。如今,很多哲学家对心智的解读也基于人工智能概念。例如,他们用人工智能技术来解决众所周知的身心问题、自由意志的难题和很多有关意识的谜题。然而,这些哲学思想都颇具争议。人工智能系统是否拥有“真正的”智能、创造力或生命,人们对此意见不一。

最后,人工智能向我们发出了挑战——如何看待人性,以及未来在何方。的确,有些人会担心我们是否真的有未来,因为他们预言人工智能将全面超过人的智能。虽然他们当中的某些人对这种预想充满了期待,但是大多数人还是会对此感到害怕。他们会问,如果这样,那还有什么地方能保留人类的尊严和责任?

我们将在接下来的几章逐一讨论上述问题。

虚拟机

谈到人工智能,人们可能会说:“那不就是指电脑嘛。”嗯,他们这么说既对也不对。电脑不是重点,重点是电脑做的事情。也就是说,虽然人工智能离不开物理机(如电脑),但是我们最好把它看作计算机科学家所说的虚拟机。

虚拟机和虚拟现实中所描述的机器不一样,和训练机修工时所使用的模拟汽车引擎也不一样,它是程序员在编程时和人们使用它时所想到的信息处理系统。

让我们拿管弦乐队作类比。首先乐器是不能少的。要想让乐器演奏出美妙的音乐,那么木头、金属、皮革和弦线都必须遵循一定的物理定律。但观众在听音乐会时并不在意这一点,他们感兴趣的是音乐。他们也不在意单个音符,更不用说空气中发声的震动了。他们听的是音符产生的音乐“形状”:旋律与和声、主题与变奏、含混音与切分音。

当我们谈到人工智能时,情况也类似。用户使用设计师设计出来的文字处理器直接处理文字和段落。通常情况下,程序本身既不包含文字,也不包含段落(但有些段落也包含,比如用户可以很容易将版权标示插入到文字中)。神经网络(见第4章)也是并行处理信息,即使它通常是在约翰·冯·诺依曼(John von Neumann)结构计算机上(按顺序)实现的。

当然,这并不是说虚拟机只是杜撰或凭空想象出来的东西。虚拟机是真实存在的。我们不仅可以利用虚拟机完成系统内的任务(如果将其连接到照相机或机器人的手等这样的物理设备上),甚至还可以做好外部世界的工作。如果程序突发问题,人工智能工作者通常很少去找硬件方面的原因,而是对虚拟机或软件中的事件和因果关系更感兴趣。

编程语言也是虚拟机(它的指令只有翻译成机器码后才能运行)。有些指令用更低级的编程语言进行定义,所以多个层级的指令都需要翻译。否则,要是用机器码的位组合模式处理信息,大多数人将无法正常思考。如果信息处理过程过于复杂且层级划分过于细化的话,那么也没有人能正常思考。

虚拟机不只是编程语言。虚拟机一般包含各个层级的活动模式(信息处理)。虚拟机也不只是在电脑上运行的虚拟机。在第6章中,我们将看到“人类的心智”也可以被看作在大脑中实现的虚拟机,更确切地说,是并行运行(在不同时间发展和学习得到的)且交互的虚拟机集合。

要实现人工智能领域的进步,我们需要不断完善有趣实用的虚拟机的定义。不断改良物理机(更大、更快)确实有好处,它甚至可能是实现某种虚拟机的必要条件。但是,只有具备海量信息的虚拟机才能在这些物理机上运行,否则后者就算功能再强大也没用(同理,要在神经科学领域取得进步,我们需要清楚了解在神经元上实现什么“心理”虚拟机,详见第7章)。

各类外部世界的信息得到充分利用。所有人工智能系统都需要输入和输出设备,要是只需要一个键盘和一个屏幕就好了。它通常还需要专用传感器(可能是照相机或压敏晶须)或反应器(可能是供音乐或演讲用的声音合成器或机器人的手)。人工智能程序不仅处理内部信息,还与这些计算机的接口连接,或改变它们。

人工智能程序处理通常包含内部的输入和输出设备,供整个系统内部的虚拟机交互。例如,象棋程序的某一部分可能通过注意其他部分的情况来发现自己所面临的潜在威胁,这时候,它就有可能与那个部分配合,共同阻断本次威胁。

人工智能的主要类型

信息处理的方法取决于其所包含的虚拟机。我们将在后面的章节中看到,这主要有五种处理类型,每种处理类型又都包含很多变体。一种是经典逻辑或符号主义,有时称为有效的老式人工智能(Geod Old-Fashioned AI,以下简称GOFAI);另一种是人工神经网络或联结主义。此外,还有进化编程、细胞自动机以及动力系统。

工作者通常只使用一种方法来处理信息,但也存在混合虚拟机。例如,在第4章中提到的一个在符号主义处理和联结主义处理之间不断切换的人类行为理论(这解释了为什么有的人在完成计划任务的过程中,会分心去关注环境中与之无关的东西以及这种现象是如何发生的)。第5章描述了一款集“情境”机器人学、神经网络和进化编程三者于一体的感觉运动装置(在装置的协助下,机器人将纸板三角形用作地标,找到了“回家”的路线)。

除了实际应用外,这些方法能够启发心智、行为和生活。神经网络有助于模拟大脑的内部结构以及进行模式识别和学习。经典逻辑人工智能(特别是与统计学结合时)可以模拟学习、规划和推理。进化编程阐明了生物进化和大脑发育。细胞自动机和动力系统可用来模拟生物体的发育。有些方法更接近于生物学,而不是心理学;有些方法更接近非条件反射行为,而不是慎重思考。要想全面了解心智,除了要用到上述所有方法外,还可能需要更多别的方法。

许多人工智能工作者并不关心心智的运作方式,他们只注重技术效率,而不追求科学理解。即使人工智能技术起源于心理学,但现在与心理学的联系却很少。然而,我们会发现,如果要想在强人工智能(artificial general intelligence)方面取得进步,我们需要加深理解心智的计算架构。

人工智能的预言

19世纪40年代,埃达·洛夫莱斯(Ada Lovelace)伯爵夫人预言了人工智能。更准确地说,她预言了部分人工智能。她专注于符号和逻辑,从未考虑过神经网络、进化编程和动力系统。她也未考虑过人工智能的心理目标,而纯粹对技术目标感兴趣。例如,她说一台机器“可能编写所有复杂程度或长度的细腻且系统的乐曲”,也可能表达“在科学史上具有划时代意义的、自然界的重要事实”(因此,如果当她看到以下情况时,她将不会感到吃惊:两百年以后,科学家们用“大数据”和精心制作的编程方法来推动遗传学、药理学、流行病学等无数领域知识的发展)。

她口中的机器是分析机(Analytical Engine)。这是一台齿轮连嵌齿轮的装置(从未被真正地制造出来),由其密友查尔斯·巴贝奇(Charles Babbage)于1834年设计。虽然这台机器主要用于求解代数和处理数字,但其本质相当于一台通用数字计算机。

她认识到了分析机的潜在通用性和处理符号(表示“宇宙中的所有主体”)的能力。她还描述了现代编程的各种基础知识:存储程序、分层嵌套的子程序、寻址、微程序设计、循环、条件、注释以及程序错误。她并没有谈到编曲或科学推理是如何在巴贝奇的机器上实现的。是的,人工智能可以实现,但是实现的方法当时仍然是一个谜团。

人工智能的起源

一个世纪以后,艾伦·图灵(Alan Turing)解开了这个谜团。1936年,图灵提出,每个合理计算在原则上都可以由现在被称为“通用图灵机”(Turing Machine)的数学系统来执行。图灵机是一个虚构系统,建立和修改用“0”和“1”表示的二进制符号组合。

第二次世界大战期间,图灵在布莱切利园(Bletchley Park)破解德国密码系统后,到20世纪40年代末一直在思考如何让一台物理机最接近抽象定义的图灵机(他帮助设计的第一台现代计算机于1948年在曼彻斯特完成),以及如何让这台物理机智能地执行任务。

与埃达·洛夫莱斯不同,图灵接受了人工智能的两个目标(技术和心理)。他想让新机器做通常需要智能才能完成的有意义的事情(可能通过使用非自然技术),并模拟以生理为基础的心智所发生的过程。

1950年,他那篇以幽默方式提出图灵测试(见第6章)的论文成为了人工智能的宣言[第二次世界大战后不久,其论文得到进一步完善,但《官方保密法》(Official Secrets Ac)阻止其出版]。它抓住了智能信息处理(游戏、知觉、语言和学习)的症结,并暗示了当时计算机领域已经取得的成就,让人跃跃欲试(只有“暗示”,因为布莱切利园的工作仍然属于最高机密)。它甚至给出了算法,如神经网络和进化计算,不过在其论文发表很久以后,这些算法才得到广泛认可。要解开奥秘,这些都只是冰山一角,只是泛泛而谈——纲领性的东西,而不是程序。

图灵坚信,人工智能一定能以某种方式实现。20世纪40年代初,他的这一信念得到了神经病学家/精神病学家沃伦·麦卡洛克(Warren McCulloch)和数学家瓦尔特·皮茨(Walter Pitts)的支持。

他们的论文《神经活动中内在思想的逻辑演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity)结合了图灵的观点与另外两项令人兴奋的成果(可追溯到20世纪早期):伯特兰·罗素(Bertrand Russell)的命题逻辑和查尔斯·谢林顿(Charles Sherrington)的神经突触理论。

命题逻辑的关键点在于它是二进制的。每个句子(也称为命题)假定为真或假。没有中间答案,也不接受不确定性或概率。只允许两个“真值”,即真和假。

此外,利用逻辑运算符(诸如and、or和if-then)构建了复杂命题,完成演绎论证,而逻辑运算符的意义由子命题的真/假来定义的。例如,如果两个(或更多)命题由“and”连接,则认为这两个(所有命题)都是真的。所以当且仅当“玛丽嫁给汤姆”和“弗洛西嫁给彼得”二者都是真命题,那么“玛丽嫁给汤姆和弗洛西嫁给彼得”才是真命题。事实上,如果弗洛西没有嫁给彼得,那么包含“and”的复杂命题就是假命题。

麦卡洛克和皮茨将罗素和谢林顿的观点结合,因为他们都描述了二进制系统。逻辑的真/假(true/false)值映射到图灵机中的脑细胞开/关(on/off)活动和个体状态0/1中。谢林顿认为,神经元不仅进行严格的开/关活动,而且具有固定阈值。因此,逻辑门(and、or和not)被定义为微小的神经网络,可以相互连接来表示高度复杂的命题。任何东西只要能用命题逻辑表述,那就能用某种神经网络和某种图灵机来计算。

简单来说,就是神经生理学、逻辑学和计算被放在一起研究。后来,心理学也被纳入进来一起讨论。麦卡洛克和皮茨相信(就像许多哲学家当时所说的),自然语言在本质上归结为逻辑。所以,从科学论证到精神分裂症错觉的所有推理和观点都可以放到他们的理论“磨坊”里加工。麦卡洛克和皮茨为整个心理学预言了一个时代,“(神经)网络的设计规格将对心理学领域取得的所有成果都有帮助”。

其核心含义在当时很清楚:同一个理论方法,即图灵计算,可用于人和机器智能,麦卡洛克和皮茨的文章甚至影响了计算机的设计。约翰·冯·诺依曼当时打算使用十进制代码,但他后来意识到了问题,改为二进制。

图灵当然赞同图灵计算,但他无法进一步推动人工智能的发展:当时技术太过原始。然而,到20世纪50年代中期,出现了功能更强大且更容易使用的机器。这里的“易于使用”并不是说更容易打开电脑的按钮,也不是说更容易将它在房间里推来推去,而是指定义新的虚拟机更加容易(例如,编程语言),从而有利于定义更高级的虚拟机(例如,用来做数学运算或规划的程序)。

大约本着图灵宣言的精神,符号人工智能的研究在大西洋两岸得以开始。20世纪50年代末期,有一个标志性事件上了新闻头条,即阿瑟·塞缪尔(Arthur Samuel)的跳棋(国际跳棋)程序打败了塞缪尔本人。这无疑暗示着电脑有一天可能会具有超人的智力,超过设计它们的程序员的能力。

20世纪50年代末期,还出现了第二个这样的暗示,即逻辑理论机(Logic Theory Machine)不仅证明了罗素的18个关键逻辑定理,还发现了一个更有效的证明,来证明其中某一个定理。这的确令人印象深刻。塞缪尔只是一个平庸的跳棋选手,但是罗素可是一位世界级的逻辑学家[罗素本人为这项成就感到十分高兴,但是《符号逻辑杂志》(Journal of Symbolic Logic)拒绝发表一篇计算机程序撰写并署名的论文,更为重要的是,它并没有证明一个新定理]。

逻辑理论机很快就被一般问题解决器(General Problem Solution,以下简称GPS)“超越”——“超越”并不是说GPS可以“超越”更多卓越的天才,而是说它的应用范围不再限制在一个领域。顾名思义,GPS可解决用目标、子目标、动作和运算符表示的任何问题(详见第2章)。程序员一旦确定与任何特定领域相关的目标、动作和运算符,剩下的推理工作就可以由GPS负责完成。例如,GPS解决了“牧师和野人”的问题(三个牧师和三个野人在一条河的一边,现在有一艘船,一次最多可以载两个人。问题来了,如何在野人数量不超过牧师数量的情况下确保每个人都能过河)。这个问题对人类来说都不简单,因为每次把两个人运过去之后,都必须让其中一个回来,这样游戏才能继续下去(大家可用便士试一试)。

逻辑理论机和GPS都是GOFAI的早期示例。现在说它们是“老式的”,当然毫无疑问;但它们也是“有效的”,率先运用了“启发法”和“规划”——二者在今天的人工智能领域都至关重要(见第2章)。

并不是只有GOFAI这种人工智能受到论文《神经活动中内在思想的逻辑演算》的启发,联结主义也备受鼓舞。20世纪50年代,计算机上特制或仿真的麦卡洛克和皮茨逻辑神经元网络被用来[如艾伯特·厄特利(Albert Uttley)]模拟联想学习和条件反射(这些神经元网络进行集中式而非分布式处理,与今天的神经元网络不同,详见第4章)。

早期网络模拟并不完全由神经—逻辑统治。雷蒙德·拜沃勒(Raymond Beurle)在20世纪50年代中期实现的系统(在模拟计算机中)大不一样。他的研究工作没有始于精心设计的逻辑门网络,而是始于随机连接的和不同阈值的单元的二维数组。他认为神经自组织的发生是因为动力波的激活——构建、传播、坚持、死亡和时不时的相互作用。

拜沃勒已经意识到,诡辩机可以模拟心理过程,但不等于大脑实际上就是这样的机器。麦卡洛克和皮茨已经指出了这一点,他们发表了一篇具有开创性意义的论文,短短四年后,又在其另外一篇论文中指出了热力学比逻辑更接近大脑的功能。逻辑学被统计学取代,单一单元被集合取代,确定性纯度被概率噪音取代。

换句话说,他们已经描述了我们现在所说的分布式容错算法(见第4章),并认为这种新算法是之前算法的“延伸”,彼此并不矛盾。它在生物学上更现实。

控制论

麦卡洛克比GOFAI和联结主义对早期人工智能的影响更为深远。20世纪40年代,在其神经学和逻辑学研究成果的指引下,处于萌芽期的控制论运动得到蓬勃发展。

当时,控制论者的研究重心是生物自组织。它涵盖了各种适应和新陈代谢,包括自主思考、微观运动行为和(神经)生理调节。其核心思想是“双向循环性”或反馈。关键问题是目的论或目的性。对于反馈取决于目标的差异性而言,这些概念高度相关——目标现阶段的偏差被用于指导下一步动作。

1948年,诺伯特·维纳(Norbert Wiener,其在战争期间设计了反弹道导弹)对该运动进行了命名,将其定义为“关于在动物和机器中控制和通信的研究”。那些控制论者在建立计算机模型的时候,经常从控制工程学和模拟计算机中获取灵感,而不是从逻辑学和数字计算中获取。然而,这种区分并不是十分明确。例如,目标的差异性被用于控制制导导弹,以及解决符号问题。此外,图灵作为经典人工智能的冠军,用动力学方程(描述化学扩散)定义自组织系统。在这些系统中,诸如点或片段的新结构可以从一堆同质的低级个体中产生(见第5章)。

早期参与该运动的成员还包括:经验心理学家肯尼思·克雷克(Kenneth Craik)、数学家约翰·冯·诺伊曼、神经学家威廉·格雷·沃尔特(William Grey Walter)和威廉·罗斯·艾什比(William Ross Ashby)、工程师奥利弗·塞尔弗里奇(Oliver Selfridge)、精神病学家和人类学家格雷戈里·贝特森(Gregory Bateson)以及化学和心理学家戈登·帕斯克(Gordon Pask)。

克雷克(于1943年在一次自行车事故中逝世,享年31岁)在研究神经系统的过程中参考了模拟计算,当时还没出现数字计算机。他根据大脑中“模型”的反馈,大致描述了知觉、微观运动行为和智力。他的大脑模型或表示概念后来在人工智能中产生了巨大的影响。

整个20世纪30年代,约翰·冯·诺依曼都对自组织心存疑惑,同时又因麦卡洛克和皮茨的第一篇论文感到异常兴奋。他不仅将基本的计算机设计从十进制改为二进制,还完善了麦卡洛克和皮茨的观点,以解释生物进化和繁殖。他定义了各种细胞自动机,即由很多基本计算单元组成的各种复杂系统。计算单元的变化遵循简单规则,而这些规则又取决于相邻单元的当前状态。其中一些单元可以复制其他单元。他甚至定义了一个能够复制任何东西的通用复制器——包括复制它自己。他指出,复制错误可能导致进化。

约翰·冯·诺依曼用抽象的信息术语对细胞自动机作了详细说明。但是这些细胞自动机可以用多种方式具现,例如自组装机器人、图灵的化学扩散、拜沃勒的物理波或很快将揭开神秘面纱的DNA。

从20世纪40年代末开始,艾什比制作了同态调节器(Homeostat),它是一个生理性自体调解的电化学模型。它可以维持机体内环境的总体恒定,无论最初分配给它的100个参数值是多少(允许设定近400000种不同的起始条件)。它阐释了艾什比的动态自适应理论在试错法学习和自适应行为中的应用,这种动态自适应可以发生在身体内部(尤其是大脑),也可以发生在身体与外部环境之间的环境。

格雷·沃尔特也在研究自适应行为,但他用的是一种迥然不同的研究方式。他研发了一款类似乌龟的微型机器人,其感觉运动电路模拟了谢林顿的神经反射理论。这些情境机器人先驱的行为栩栩如生,如寻找光线、避开障碍,以及利用有条件的反射进行联想学习。这些有意思的机器人于1951年在“英国节”(Festival of Britain)上向公众展示。

十年后,塞尔弗里奇(伦敦百货商店创始人的孙子)利用符号方法实现了一种叫伏魔殿(Pandemonium)的并行处理系统。

这个GOFAI程序利用许多底层“守护程序”(特征感知器)来学习如何识别模式,每个“守护程序”一直都在感知外界信息,并将感知到的结果传递给更高级的“守护程序”。这些“守护程序”重点关注到目前为止一致的特征(例如,一个F中只有两根水平条),而忽略了任何不合适的特征。置信度可以有差异,而且它们至关重要:声音最洪亮的守护程序影响最大。最后,最高级的守护程序根据既得证据(通常是冲突的),选择最佳模式。这项研究很快对联结主义和符号人工智能产生了影响,一个最近的分支是学习智能分布实体(Learning Intelligent Distribution Agent,以下简称LIDA)的意识模型(详见第6章)。

贝特森对机器没有什么兴趣。他于20世纪60年代提出了与文化、酗酒和(父或母对子女的)“双重约束”精神分裂症有关的理论。但是,这些理论基础却是在早些时候控制论会议上提出的和通信(即反馈)相关的想法。从20世纪50年代中期开始,帕斯克——麦卡洛克口中的“自组织系统天才”,在许多项目中都用到了控制论和符号思想,其中包括:交互式剧院、互通音乐机器人、获悉并适应其用户目标的架构、化学自组织概念和教学机。借助帕斯克的研究,人们能够利用复杂的知识表示来采取不同方法,而这对认知方式为循序渐进型和整体型(以及对不相关事物不同程度的容忍)的学习者都适用。

简言之,到20世纪60年代后期,研究人员考虑了所有主要的人工智能类型,甚至将其实现——有的甚至更早。

大多数相关研究人员至今还广受人们的尊重,但只有图灵一直是人工智能盛宴上的“幽灵”,其影响无处不在。多年来,其他人只被一些研究领域的分支机构所记住。特别是,格雷·沃尔特和艾什比几乎被人们遗忘,直到20世纪80年代后期,他们才被赞誉为“人工生命之父”(与图灵一起)。帕斯克等待的时间更长。要知道其中的原因,我们必须了解计算机建模者们是如何分道扬镳的。

计算机建模者们分道扬镳

20世纪60年代之前,模拟语言/逻辑思维和模拟有目的的/自适应的微观运动行为这两个研究方向是有交叉的。有些专家二者都研究[唐纳德·麦凯(Donald Mackay)甚至建议制造将神经网络与符号处理结合起来的混合计算机]。所有相关工作者都能彼此产生共鸣。研究生理自动调整的工作者们认为自己与注重心理研究的同事们做的是同一件事。他们都参加相同的会议:在美国召开的跨学科Macy研讨会(1946年到1951年,由麦卡洛克担任主席)和在伦敦召开的“思维过程机械化”研讨会(1958年,由厄特利组织)。

然而,大约从1960年开始,工作者们的研究方向便出现了分歧。广义上来说,对生命感兴趣的人只关注控制论,而那些对心智感兴趣的人则关注符号计算。网络爱好者们当然对大脑和心智都感兴趣,但他们通常研究联想学习,而非具体的语义内容或推理,所以他们关注的是控制论而不是符号人工智能。研究的分支越来越多,不幸的是,各分支之间缺乏对彼此应有的尊重。

这个过程中必然会出现一些优秀的小社会圈子,因为他们讨论的理论问题各不相同,既有生理方面的,也有心理方面的。所用的技术也不一样。广义上讲,是微分方程与逻辑之间的较量。专门化趋势不断加强,交流也因此变得越来越困难,而且很大程度上是无利可图的。兼收并蓄的会议已经过时。

即使如此,各分支学派也不应该太操之过急。对控制论和联结主义学派的反感源于专业上的嫉妒和正义的愤慨。这是因为符号计算在发展初期取得了巨大的成功;带有挑衅性的术语“人工智能”[由约翰·麦卡锡(John McCarthy)于1956年提出,以前称为“计算机模拟”]博得了新闻工作者们的眼球;一些不现实的炒作;一些符号主义研究者表现得傲慢自大。

符号主义阵营的成员们认为自己赢得了人工智能的比赛,最初没有太多的敌意。事实上,他们在很大程度上忽视了早期的网络研究,其中的一些领导者[例如,马文·明斯基(Marvin Minsky)]已经开始着手网络的研究。

然而,在1958年,弗兰克·罗森布拉特(Frank Rosenblatt)提出了神经动力学理论,定义了能在随机初始状态下(并且能够容忍初始化阶段的错误)进行自组织学习的并行处理系统,并在他的光电感知器中部分实现了该理论。它与“伏魔殿”不同,无须输入模式让程序员提前分析。符号主义学派无法忽视这种新形式的联结主义。但它很快就被打入“冷宫”。20世纪60年代,明斯基与西摩尔·帕普特(Seymour Papert)一道发表了一篇尖锐的批评文章,声称感知器连一些基本的东西都无法计算(详见第4章)。

神经网络研究的资金来源也因此被切断。这个结果是由于两派攻击者蓄意为之,从而加深了人工智能内部的对抗。

现在大家看来,经典人工智能研究似乎在当时占绝对的主导地位。诚然,格雷·沃尔特的机器乌龟们在英国节上备受赞誉。和伯纳德·威德罗(Bernard Widrow)的模式学习Adaline[1](基于信号处理)一样,罗森布拉特的感知器在20世纪50年代后期也被媒体大肆宣传。但符号主义研究者们的批评让人们完全失去了对感知器的兴趣。20世纪60年代到70年代,在媒体中如日中天的是符号型人工智能(还影响了精神哲学)。

风水轮流转。神经网络,如分布式并行处理(Parallel Distributed Processing,以下简称PDP)于1986年再次登台(见第4章)。本该更懂得此方法的大多数外界人士和一些内部人士都把它当成了一个彻头彻尾的“新”东西。它还吸引了无数研究生和很多新闻媒体(和哲学)的关注。那时,鼻子都被气歪的人恐怕是那些符号人工智能的研究者了。一时间,PDP研究成为时尚,大家普遍认为经典人工智能的研究当时已经失败。

还有一些控制论者因其在1987年命名“人工生命”,终于从大批记者和研究生那里“受宠”。于是,符号人工智能再次受到挑战。

然而,在21世纪,不同的问题需要不同类型的答案——各有所长,这一点显而易见。虽然先前的敌意至今犹存,但不同方法仍有相互尊重和合作的空间。例如,“深度学习”有时用于将符号逻辑与多层概率网络结合的强大系统;还有一些混合方法包含高级复杂的意识模型(见第6章)。

构成人类心智的虚拟机本来就是各式各样的,因此大家没必要对人工智能领域的研究分歧太过惊讶。注释

[1]Adaline是一个早期的单层人工神经网络和实现这个网络的物理设备的名称。网络使用存储电阻器。由伯纳德·威德罗教授及其在斯坦福大学的研究生泰德·霍夫(Ted Hoff)于1960年联合开发。它基于麦卡洛克—皮茨的神经元,由权重、偏差和求和函数组成。——译者注

02 强人工智能:人工智能领域的圣杯

最先进的人工智能是一种神奇美妙的东西,可以提供各式虚拟机,以进行各种不同类型的信息处理。它没有核心秘密,也没有统一的核心技术。人工智能工作者来自各个领域,几乎没有统一的目标和方法。本书只能涵盖最近取得的极少一部分成就。总之,人工智能的方法范围极其宽泛。

可以说,人工智能已经取得了惊人的成就。它的实际运用范围也十分广泛。我们现在有大量针对无数特定任务而设计的人工智能应用程序。生活中各个领域的专业人士和非专业人士几乎都在使用。很多程序甚至比一些专家还牛。由此看来,人工智能的进展的确引人注目。

但是,人工智能先驱们的目标不仅限于专家系统,他们还希望发展通用智能系统。他们模拟的所有人类能力——视觉、推理、语言、学习等——可应对各类挑战。此外,这些能力将适时得到整合。

从这些标准来看,进步的空间非常大!约翰·麦卡锡很早就认识到人工智能需要“共识”。作为1971年和1987年图灵奖的获得者,他在发表获奖感言的时候谈到了人工智能的通用性(Generality in Artificial Intelligence),但他其实是在抱怨,而不是庆祝。到2016年,他的抱怨仍未得到答案。

随着近来计算机能力的不断增强,强人工智能在21世纪再次引起人们的兴趣。如果这一目标得以实现,人工智能系统将减少对专用编程技巧的依赖,而受益于推理和知觉这些通用功能——语言、创造力和情感(所有这些我们都将在第3章中讨论)。

然而,这谈何容易。通用智能仍然是一个严峻的挑战,让人难以捉摸。强人工智能无疑是人工智能领域的圣杯。

只有超级计算机还远远不够

对于任何想要实现这个梦想的人而言,超级计算机必然是一个助推器。组合爆炸——其中需要的计算超过实际能执行的计算——已不再构成威胁。然而,我们不能一直靠增强计算能力来解决问题。

通常,我们还需要新的解决方法。此外,即使某一具体方法从理论上讲是可行的,但也可能需要大量的时间或存储,才能在实践中发挥作用。第4章给出了相关例子(有关神经网络)。同样,穷举法列出了所有可能的象棋步骤,但它需要的存储位置比宇宙中的电子还要多,因此就算有一大堆超级计算机也不能满足需要。

另外,效率也很重要:计算数量越少越好。总之,问题必须易于处理。

如今,已经有几个基本策略可以做到这一点。它们由经典符号人工智能或GOFAI开创,在今天仍然必不可少:第一,只关注一部分搜索空间(问题的计算机表示,解决方案假定就在该表示中);第二,简化假设以构建较小的搜索空间;第三,有效安排搜索过程;第四,用新方式表示问题,以构建不同的搜索空间。

这些方法分别对应的是启发法、规划、数学简化和

知识表示

。接下来的五个部分将分别讨论这些强人工智能策略。

启发式搜索

“启发式的”(heuristic)和“找到了”(Eureka)在英文中有相同的词根:来自意为“寻找”或“发现”的希腊语。启发法得到了早期GOFAI学派的重视,并且经常被看作“编程技巧”。但是,这个术语并非源于编程:逻辑学家和数学家对其早已熟悉。早在数千年前,人类就用启发法解决问题(有意或无意地),远远早于埃达·洛夫莱斯伯爵夫人(Ada Love Lace’s)预见人工智能的时间。

无论是对人还是对机器来说,启发法都有利于问题的解决。强人工智能使用启发法的模式是:让程序只针对搜索空间的某些部分,同时避开其他部分。

很多启发式算法都属于无法保证成功的经验法则,如早期人工智能使用的大多数经验法则。在启发法引导下,系统正好忽略了某部分的搜索空间,而解决方案可能正好位于这部分空间里。例如,在国际象棋中,“保护女王”是一条非常有用的规则,但偶尔也应该违背。

还有一些启发式算法从逻辑学角度或数学角度被证明是合理的。如今,人工智能和计算机科学领域的大量工作都是为了确定程序可证明的属性。这是“友好人工智能”的一个方面,因为人类安全可能由于使用从逻辑学角度看不是很可靠的系统而受到的威胁(详见第7章,启发式算法和算法之间原则上没有区别,许多算法实际上是包含多个特定启发式算法的微型程序)。

无论启发法可靠与否,它对人工智能搜索来说都不可或缺。上文提到人工智能越来越专业化,这部分取决于能显著提高效率的新启发法的定义,但仅限于限制颇多的某类问题或搜索空间。一个非常成功的启发法可能并不适合让其他人工智能程序“借用”。

如果我们给定几种启发法,那么应用它们的顺序就可能变得很重要。例如,即使这种排序偶尔会导致灾难,也应该先考虑“保护女王”,再考虑“保护象”。不同的顺序将定义不同的搜索树遍历整个搜索空间。给启发法下定义和排序是现代人工智能的关键任务(启发法在认知心理学中的地位也很突出,例如,“快速节俭启发式”指出进化如何让人获得对环境作出有效回应的方法)。

利用启发法,我们不再需要穷举搜索整个搜索空间,但它们有时会和(有限的)穷举搜索结合使用。1997年,因击败世界冠军加里·卡斯帕罗夫(Gary Kasparov)而名声大噪的IBM国际象棋程序深蓝(Deep Blue)使用的是专用硬件芯片,每秒能处理2亿个位置,可以知道接下来8步的所有备选棋步。但是,它不得不用启发法来选择备选棋步中的“最佳”棋步。由于启发法可信度不高,所以即使是深蓝,也不能每次都胜出。

人工智能领域中的规划

在今天的人工智能领域中,规划的地位十分突出,尤其是在很多军事活动中。事实上,直到最近才在人工智能上支付大部分研究费用的美国国防部指出,在第一次伊拉克战争的战场上,他们在后勤保障方面省下的钱(利用人工智能规划)超出了其前期投入。

规划不仅限于人工智能:我们都在规划。请想想假期打包东西的情景。你必须找到所有要带的东西,但这些东西可能没有放在同一个地方。你可能还要买一些新东西(比如防晒霜)。你必须决定是把所有东西放一块儿(也许放在床上,也许放在桌子上),还是把每样东西都放在皮箱里。这个决定可能部分取决于你是否决定最后再放衣服,因为你怕把衣服弄皱。你是需要一个背包,还是要一个手提箱,或者两者都要,你如何取舍?

把规划用作人工智能技术的GOFAI程序员们考虑到了有意识的深思熟虑(基于神经网络的人工智能大不一样,因为它不模拟有意识的深思熟虑,详见第4章)。因为负责逻辑理论机(见第1章)和GPS的先驱们主要对人类推理心理学感兴趣。他们的程序基于被试主体为人的实验,要求被试人进行“有声思维”:一边做逻辑谜题,一边描述自己的思考过程。

现代人工智能规划程序并不那么依赖从有意识的内省中或实验观察中获得的想法。它们的规划比早期程序的规划要复杂得多,但基本思想一致。

一个规划列举出一系列在常规层级上表示的动作——一个最终目标、加上很多子目标和次级子目标……这样就不用一次性考虑所有的细节。在某一适当的抽象层级规划上可以修剪搜索空间内的搜索树,因此一些细节根本不需要考虑。有时,最终目标本身就是一个动作规划——可能是调度送向/运出工厂或战场的货物。有时候,它还是一个问题的答案,比如医疗诊断。

针对任何给定目标和预期情况,规划程序需要一个动作列表(即符号运算符),或多种动作类型(通过填写来源于问题的参数,可以将动作实例化),每个动作都能够作出一些相应的变化;针对每个动作,规划程序需要一组必要的前提条件(比较抓住某个东西,前提条件是这个东西必须是在手的可活动范围内);针对所需变化的优先次序和对动作的排序,规划程序需要启发法。如果程序要选定某个特定动作,它可能要设置一个新的子目标以满足前提条件。这个目标制定的过程可以一再重复。

通过规划,程序——或人类用户——可以发现已经做了什么动作,以及为什么这么做。“为什么”指的是目标的层次结构:做这个动作是为了满足那个前提条件,以实现这个子目标。人工智能系统通常采用“正向链接(推理)”和“反向链接(推理)”技术,来解释程序是如何找到解决方案的。这可以帮助用户判断程序的动作或建议是否恰当。

当前,一些规划程序拥有数万行代码,它们在无数层级上定义分层的搜索空间。这些系统通常与早期的规划程序大相径庭。

例如,大多数规划程序假定,并非所有的子目标都可以被独立处理(即问题可完全分解)。毕竟在现实生活中,某一个以目标为导向的行动所产生的结果都可能被另一个行动撤销。今天的系统能处理可部分分解的问题:它们独立处理子目标,但必要的时候,还可以做其他处理,以整合随之产生的各项子规划。

经典系统只能解决那些在完全可观察的、可确定的和有限的静态环境中出现的问题。但是,一些现代规划程序可以处理在部分可观察(即系统的“世界”模型可能不完整或不正确)和不确定的环境中出现的问题。在这些情况下,系统必须监控执行期间的变化情况,以在规划中,或在自己对于“世界”的“信念”中,作出适当改变。一些现代规划程序可以在很长一段时间内一直进行监控:它们可以根据环境变化,不断制定、执行、调整和舍弃目标。

其他许多开发领域已经取得了新进展,并且还在不断进步。所以,在20世纪80年代,一些机器人专家完全否决规划并转而青睐于“情境”机器人学(见第5章)的情况,着实让人惊讶,例如,目标和可能动作的内部表示等概念也被否决了。然而,在很大程度上,这种批评是不对的。批评者们自己的系统可能没有表示目标,但可能表示了其他东西,例如视网膜刺激和奖励。此外,即使是最先遭受此类批评的机器人技术,也常常需要规划以及纯粹的被动回应,例如,制造会踢足球的机器人。

数学简化

鉴于启发法任由搜索空间自由发展(这样程序就可以专注于搜索空间里最合适的部分),简化假设构造了一个不切实际但更易于计算的搜索空间。

一些假设和数学相关,如机器学习中通常使用的“i.i.d.”(独立同分布)假设。与数据中实际的概率构成相比,用i.i.d.表示的概率构成要简单得多。

数学简化在定义搜索空间时的优点是可以利用搜索的数学方法。这种方法定义清晰,而且至少方便数学家理解。这并不代表任何数学定义的搜索都有实际使用价值。如上所述,某一方法在数学层面可以保证解决某一特定类别的所有问题,但是该方法在实际运用中并不适用,因为其时间成本可能是无限的。然而,它可能建议与此类似但更实际的方法,请见第4章中有关“反向传播”的讨论。

在人工智能领域,非数学的简化假设比比皆是,并且通常很直接。一种是假定无须考虑情感因素(见第3章)就能定义和解决问题的(默认)假设。还有很多假设被构建在用来指定任务的一般知识表示中。知识表示

一般来说,实现人工智能的最难部分是最开始如何向系统表示问题。即使人类看似可以直接与程序交流(用英语对着Siri说话或者在谷歌的搜索引擎中输入法语单词),但事实并非如此。人们无论是处理文本还是图像,都必须将包含的信息(“知识”)以机器可以理解的方式表示给系统,换句话说,以系统可以处理的方式表示(机器是否“真”的理解,我们将在第6章中进行讨论)。

人工智能表示问题的方式五花八门。有些是对GOFAI中知识表示的一般方法进行演绎或改动。越来越多的是针对一小类问题制定的一些高度专业化的方法。例如,我们可能为人类某种癌细胞的X射线图像或照片精心设计一种新的表示方法,从而可以得到某个非常具体的医学解释方法(因此,这种新方法不能用来识别猫或CAT 扫描)。

欲实现强人工智能,通用方法是关键。这些方法最初受到人类认知心理学研究的启发,包括:IF—THEN规则集;个体概念的表示;模式化的动作序列;语义网络;以及利用逻辑或概率进行推理。

接下来,我们对上述方法依次展开讨论(第4章描述了另一种知识表示形式,即神经网络)。

基于规则的程序

在基于规则的编程中,大量知识/信念被表示为一套将条件与动作联系起来的“如果—则”(IF—THEN)规则集:如果满足这个条件,则进行那个动作。这种形式的知识表示利用了形式逻辑[埃米尔·珀斯特(Emil Post)的“产生式”系统]。但是人工智能先驱艾伦·纽厄尔(Allen Newell)和赫伯特·西蒙(Herbert Simon,又名司马贺)通常认为它是人类心理学的基础。

条件和动作都可能很复杂,规定的内容可能是几个或多个命题的合取(或析取)。如果同时满足几个条件,则包含最多命题的合取被赋予优先级。所以,“如果目标是制作烤牛肉和约克郡布丁”将优先于“如果目标是制作烤牛肉”,而在条件中增加“和三种蔬菜”又优先于“如果目标是制作烤牛肉和约克郡布丁”。

基于规则的程序不提前规定每一步的顺序。相反,每条规则都在等待被其条件触发。尽管如此,这类系统可以用来做规划。如果不能做规划,那么它们在人工智能方面就只能发挥有限的作用。但是它们的规划方式不同于最古老、最为人们熟悉且最常用的编程形式(有时称为“执行控制”)。

在能进行执行控制的程序(如GPS和逻辑理论机,详见第1章)中,规划被明确表示。程序员按照严格的时间顺序,规定一个寻找目标的指令序列,指出哪一步该执行哪一条指令:“做这个,然后去做那个;然后看看X是否为真;如果是真,就做这个事;如果不是,就做那个事。”“这个事”或“那个事”有时是一条设置某个目标或子目标的明确指令。例如,机器人如果有离开房间的目标,那么可能指示该机器人设置开门的子目标(原文如此);接下来,如果检查门当前状态的结果显示门将被关闭,则设置抓握门把手的子次目标(人类蹒跚学步者可能需要更低级的子次目标——即让成年人抓住自己够不着的门把手,并且如果婴儿要做到这一点,可能需要在更低级别设定几个目标)。

基于规则的程序也可以用来解决如何逃离房间的问题。然而,规划层级不会被表示为按时间顺序排列的明确步骤,而是表示为构成系统的“IF—THEN”规则集合中所隐含的逻辑结构。某一条件可能要求已经建立了这样一个目标(IF你想打开门,而且你不够高)。同样,动作可以包括设置一个新目标或子目标(THEN找一个成人)。更低级的目标将自动激活(IF你想要求一些人做一些事,THEN设置接近他们的目标)。

当然,程序员必须列入相关的IF—THEN规则(上述案例中指的是涉及门和门把手的规则)。但是,他们不需要预期这些规则的所有潜在逻辑含义(这是一把“双刃剑”,因为潜在的不一致可能在很长一段时间都无法被发现)。

被激活的目标/子目标被贴在中央“黑板”上,可供整个系统访问。显示在黑板上的信息不仅包括被激活的目标,还包括感知输入和当前处理的其他方面(该想法不仅影响了一个意识神经心理学的前沿理论,还影响了以它为基础的意识人工智能模型,详见第6章)。

基于规则的程序广泛应用于20世纪70年代早期出现的先驱“专家系统”。这些系统包括:MYCIN系统——在人类医生鉴定感染性疾病和开抗生素药物时提建议;还有树枝状演算法(DENDRAL)——对有机化学中某一特定范围内的分子进行光谱分析。例如,做医疗分析的计算机咨询专家系统MYCIN,它的诊断方法是将症状/病人本身的身体状况(条件)与诊断结论/建议相匹配,以便继续检测或开处方(动作)。这些程序是人工智能远离“从一般化走向专门化之梦”的第一步,同时为实现埃达·洛夫莱斯的梦想迈出了第一步——机器制造科学之梦(见第1章)。

由于基于规则的知识表示,程序能够被逐步建立,因为程序员或者强人工智能系统本身可增加对域的了解。新规则可以随时添加。没有必要从头重新编写程序。但是有一个棘手的问题,即如果新规则与旧规则逻辑冲突,系统将不会总是做它应该做的事,甚至可能和它应该做的事相去甚远。在处理一小组规则时,这些逻辑冲突很容易被避免,但是如果系统较大,它们就很难被识破。

20世纪70年代,新IF—THEN规则在与人类专家不断对话的过程中得到,它们被要求解释自己的决定。今天,尽管许多规则不是来自有意识的内省,但这些规则更高效。现代专家系统(今天很少使用的术语)应用范围广,从大型科学研究和商业程序到手机上小的应用程序。由于受益于其他形式的知识表示,许多系统超过旧系统,如统计和专用视觉识别或大数据的使用(见第4章)。

在某些狭窄领域中,这些程序可以帮助甚至取代人类专家。有些超越了上述领域的世界翘楚。近四十年前,在诊断大豆疾病的时候,一个基于规则的系统比最权威的专家还准确。如今,用它来帮助科学、医学、法律甚至服装设计领域专业人士的例子不胜枚举(这不完全是好事,详见第7章)。

框架、词向量、脚本、语义网络

其他常用的知识表示方法包含个体概念,而不是整个领域(如医学诊断或服装设计)。

例如,可以通过规定分层数据结构(有时称为“框架”)告诉计算机什么是房间。它将一间房表示为有地板、天花板、墙壁、门、窗户和家具(床、浴缸、餐桌……)。真实的房间具有不同数量的墙壁和门窗,因此可在框架中的“插槽”里填充特定数字,并提供缺省赋值(四道墙、一扇门和一扇窗)。

计算机可以使用这类数据结构找到相似类、回答问题、参与对话、创作或理解故事。它们是CYC[1](encyclopedia,即百科全书)的基础:一个试图表示所有人类知识的大胆尝试。有人甚至说这个想法是痴人说梦。

然而,框架也可能造成误导。例如,缺省赋值就有诸多问题(有些房间没有窗户,开放式的房间没有门)。更糟糕的情况是:该如何表示下落或溢出这样的日常概念?符号人工智能这样表示“朴素物理学”的常识性知识:构造对事实进行编码的框架,如未支撑的物体会下落,但也有例外——氦气球就不会下落。考虑清楚这类情况是一项永无止境的任务。

在一些利用最新技术处理大数据的应用中,单个概念可能被表示为一个簇或“云”,由成百上千个偶尔相关的概念组成(概念对之间的相关性概率各不相同,详见第3章)。类似地,概念现在可以用“词矢量”而不是单词来表示。此处的语义特征生成许多不同概念并连接各个概念,由(深度学习)系统发现,可用来预测接下来的词——例如,在机器翻译中的运用。然而,这些表示用在推理或谈话中的时候,不像经典框架那么经得起检验。

有些数据结构(称为“脚本”)表明熟悉动作的顺序。例如,哄小孩子睡觉通常要做以下动作:盖被子、读故事、唱首摇篮曲、打开小夜灯。这样的数据结构既可用来问答问题,也可用来提问题。如果妈妈省掉打开小夜灯的动作,就会出现这样的问题,如“为什么”以及“接下来发生了什么”,换句话说,这里有故事开始的缘由。因此,这种形式的知识表示被用于自动书写故事,也正是和人类能正常交谈的“陪护”计算机所需要的知识表示形式(见第3章)。

概念的另一种知识表示形式是语义网络(这些是集中式网络,见第4章)。20世纪60年代,罗斯·奎利恩(Ross Quillian)率先提出了几个延伸示例(例如WordNet[2])作为人类联想记忆的模型,现在属于公共数据资源。语义网络通过以下方法连接概念:如同义、反义、从属、上位、部分—整体这样的语义关系;以及将真实的世界知识比作语义学的联想连接(见第3章)。

语义网络可能增加为音节、初始字母、语音学和同音异义词编码的连接,来表示概念和词。金·宾斯泰德(Kim Binsted)的JAPE和格雷姆·里奇(Graeme Ritchie)的STAND UP在使用这种网络,它们基于双关语、解释和变换音节来制造笑话(9种不同类型)。例如,问:什么叫沮丧的火车?答:低压机车;问:羊和袋鼠生出来的宝宝是什么?答:一位毛茸茸的跳高运动员。

注意:语义网络与神经网络不同。我们将在第4章中看到,分布式神经网络以迥然不同的方式表示知识。在神经网络中,单个概念不是用精心定义的联想网络中的单个节点来表示,而是用整个网络上活动的变化模式来表示。这类系统可以容忍冲突迹象,因此不需要考虑保持逻辑一致性的问题(将在下一节描述)。但它们无法进行精确推理。不过,这种知识表示类型十分重要(并且是实际应用的一个重要基础),值得我们用一个单独的小节对其展开讨论。注释

[1]CYC是一个致力于将各个领域的本体及常识知识综合地在一起,并在此基础上实现知识推理的人工智能项目。其目标是使人工智能的应用能够以类似人类推理的方式工作。这个项目是由道格拉斯·莱纳特(Douglas Lenat)在1984年设立的,由Cycorp公司开发并维护。——译者注

[2]WordNet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A.米勒的指导下建立和维护的英语字典。开发工作从1985年开始,从此以后该项目接受了超过300万美元的资助(主要来源于对机器翻译有兴趣的政府机构)。由于它包含了语义信息,所以有别于通常意义上的字典。WordNet根据词条的意义将它们分组,每一个具有相同意义的字条组称为一个synset(同义词集合)。WordNet为每一个synset提供了简短、概要的定义,并记录不同synset之间的语义关系。——译者注

逻辑和语义网

如果一个人的最终目标是强人工智能,逻辑似乎是一种超级不错的知识表示。因为逻辑普遍适用。原则上来说,相同的表示(相同的逻辑符号主义)可以用来表示视觉、学习和语言等,当然也适用于由此产生的任意集成。此外,它提供了很有说服力的定理证明方法,以处理信息。

所以,早期人工智能中的知识表示方式首选谓词演算。这种逻辑比命题逻辑的表示能力更强,因为它可以“进入句内”来表达句子的意思。以“这个商店有一顶适合所有人的帽子”这个句子为例。谓词演算可以清楚区分这句话三种可能的意思:“对于每个人来说,这家商店有一顶适合他们的帽子”;“在这家商店有一顶尺寸可调的帽子,适合任何人”;和“在这个商店有一顶帽子(假定被折起来)足够大,可以同时适合所有人。”

对许多人工智能研究人员来说,谓词逻辑仍然是首选。例如,CYC的框架就是基于谓词逻辑。组合语义学中的自然语言处理(NLP)表示也同样如此(见第3章)。我们延伸谓词逻辑来表示时间、

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载