自然语言交流的计算机模型:数据库语义学下的语言理解、推理和生成(应用语言学译丛)(txt+pdf+epub+mobi电子书下载)


发布时间:2021-03-10 18:39:32

点击下载

作者:[德]罗兰德·豪塞尔 著

出版社:商务印书馆

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

自然语言交流的计算机模型:数据库语义学下的语言理解、推理和生成(应用语言学译丛)

自然语言交流的计算机模型:数据库语义学下的语言理解、推理和生成(应用语言学译丛)试读:

审校者的话

本书作者罗兰德·豪塞尔(Roland Hausser)是德国爱尔兰根-纽伦堡大学计算语言学教授。他先后出版了《表面组成语法》《自然人机交流》《计算语言学基础-人机自然语言交流》和《自然语言交流的计算机模型》等多部专著,发表文章近百篇。Hausser是“左结合语法”(Left-Associative grammar,简称LA)的创始人,后来他又进一步提出了“数据库语义学”(Database Semantics,简称DBS)和完整的“语表组合线性内部匹配”理论(Surface compositional Linear Internal Matching,简称SLIM),在计算语言学界形成了他自己独特的风格。

我与Hausser教授曾有一面之交。2002年联合国教科文组织(UNESCO)韩国委员会在韩国首尔(Seoul)举行了一次关于“信息时代的语言问题”的学术研讨会,我和Hausser都被邀请参加了这次会议,在会议期间的交谈中,我对Hausser的独特理论有了初步的了解,回国之后,我又细读了他的《计算语言学基础-人机自然语言交流》(英文版)一书,对他的理论又有了进一步的认识。我认为Hausser教授是一位具有独创精神的计算语言学家。

Hausser认为,面向未来的计算语言学的中心任务就是研究一种人类可以用自己的语言与计算机进行自由交流的认知机器。因此,自然语言的人机交流应当是计算语言学的中心任务。计算语言学研究应当通过对说话人的语言生成过程与听话人解释语言的过程进行建模,在适宜的计算机上复制信息的自然传递过程,从而构建一种可与人用自然语言自由交流的自治的认知机器,这样的认知机器也就是机器人(robot)。为了实现这一目标,必须对自然语言交流机制的功能模型有深刻的理解。

Hausser提出的“语表组合线性内部匹配”(SLIM)理论以人作为人机交流的主体,而不是以语言符号为主体,突出了人在人机交流中的主导作用,SLIM理论要求通过完全显化的机械步骤,使用逻辑和电子的方式来解释自然语言理解和自然语言的生成过程。因此,SLIM理论与现代语言学中的结构主义、行为主义、言语行为等理论是不同的,具有明显的创新特色。

SLIM理论强调“表层成分”(Surface),以语表组合性作为它的方法论原则;SLIM理论强调“线性”(Linear),以时间线性作为它的实证原则;SLIM理论强调语言的“内部因素”(Internal),以语言的内部因素作为它的本体论原则;SLIM理论强调“匹配”(Matching),以语言和语境信息之间的匹配作为它的功能原则。事实上,SLIM这个名字本身就来自于这四项原则的英文名称的首字母缩写。

SLIM理论的技术实现手段叫作“数据库语义学”(DBS)。DBS是把自然语言理解和生成重新建构为“角色转换”(turn-taking)的规则体系。角色转换指的是从“说话人模式”(speaker mode)向“听话人模式”(hearer mode)的转换,或者从“听话人模式”向“说话人模式”的转换。

在自然语言的实际交流过程中,第1个过程是听话人模式中的自然主体从另一个主体或者语境获得信息,第2个过程是自然主体在自己的认知当中分析信息,第3个过程是自然主体思考如何做出反应,第4个过程是自然主体用语言或者行动做出反馈。

DBS的输入与第1个过程相似,要求计算机或者机器人具备外部界面。接下来匹配语境和认知的内容,采用左结合语法(LA)来模拟第2个过程,这个左结合语法是处于听话人模式中的,叫作LA-hear。左结合语法的第二个变体负责在内存词库中搜索合适的内容,叫作LA-think,这一部分操作对应于第3个过程。左结合语法的第三个变体的任务是语言生成,叫作LA-speak,模拟第4个过程。如下图所示:

在这个图中,听话人模式的LA-hear模拟第2个过程,说话人模式的LA-think模拟第3个过程,LA-speak模拟第4个过程。

DBS的分析结果用DBS图(DBS graph)来表示。DBS图是一种树结构,但是,DBS图的树结构与短语结构语法和依存语法的树结构有所不同。

例如,英语的句子“The little girl slept”(那个小女孩睡着了) 用短语结构语法分析后的树结构如下:

在这个短语结构语法的树结构中,S(句子)由NP(名词短语)和VP(动词短语)组成,NP由DET(限定词),ADJ(形容词)和N(名词)组成,它们分别对应于单词the,little和girl,VP对应于单词slept。句子的层次和单词之间的前后线性关系都是很清楚的,但是,在组成S的NP和VP之间,没有说明哪一个是中心词,在组成NP的DET,ADJ 和N之间,也没有说明哪一个是中心词,句子中各个成分的中心不突出。

用依存语法分析后的树结构如下:

在这个依存语法的树结构中,全部结点都是具体的单词,没有S,NP,VP,DET,ADJ,N等表示范畴的结点,各个单词之间的依存关系清楚,这种依存关系是二元关系,支配者是中心词,被支配者的从属词。但是,单词之间的前后线性顺序不如短语结构语法的树结构那样明确。

用DBS图分析后的树结构如下:

DBS图的树结构中,着重对语言内容进行分析,因此,没有表示定冠词 the 的结点,结点上的单词都用原型词表示。DBS图最突出的特色在于,DBS图树结构的结点之间的连线各自有其明确的含义,连线不仅表示结点之间的依存关系,还可以根据连线走向的不同来表示不同的功能:垂直竖线“|” 表示修饰-被修饰关系,例如,上图中little与girl用垂直竖线相连,表示little修饰girl;左斜线 “/” 代表主语-动词关系,例如,上图中girl与sleep用左斜线相连,表示girl是sleep的主语。此外,DBS图树结构还使用右斜线 “\\” 表示宾语-动词关系,使用水平线 “—”表示并列关系。由于连线走向的不同可以表示不同的功能,这样的树结构表示的信息比短语结构语法的树结构和依存语法的树结构丰富多了。这是DBS图树结构最引人瞩目的特点。

上面的DBS图中表示了little做girl的修饰语,girl做sleep的主语,表达的是句子中单词之间的语义关系,所以,Hausser把这样的DBS图叫作“语义关系图”(the semantic relations graph,简称SRG)。

如果把DBS图中每个结点上的单词替换为代表其词性的字母,那么语义关系图就变成了“词性关系图”(the part of speech signature,或者简写为signature)。上一例句的词性关系图如下所示:

语义关系图和词性关系图是同一句子内容的不同表示,它们表示的内容相同,表示的形式不同。

Hausser在2011年的新书中还提出了另外两个图:一个是“编号弧图”(the numbered arcs graph,简称NAG),另一个是“语表实现图”(the surface realization)。这两个图分别表现如何从内容生成语言的过程和结果。编号弧图表示激活语义关系图的时间线性顺序,也就是说,编号弧图在某种程度上可以说是添加了编号弧的语义关系图。语表实现图表示如何按照遍历顺序生成语言的表层形式。

例如,英语句子“The little girl ate an apple”(这个女孩吃了一个苹果)的语义关系图(SRG)如下:

由于语义关系图(SRG)只表示句子的内容,所以,在这个SRG中,没有表示定冠词the的结点,也没有表示不定冠词an的结点,过去时形式ate用不定式动词eat来表示。

这个句子的词性关系图(signature)如下:

在这个词性关系图中,结点上的单词都替换表示其词性的字母。

这个句子的编号弧图(NAG)如下:

由于编号弧图(NAG)要表示激活语义关系图的时间线性顺序,这种时间顺序用编号弧表示,编号弧用虚线标出,并在虚线旁边用数字注上时间的线性顺序:结点eat首先激活的结点girl(编号弧1);接着,结点girl激活结点little(编号弧2),由于它们之间用垂直竖线“|”相连,因此,可推导出little修饰girl(编号弧3);由于结点girl与结点eat之间用左斜线 “/”相连,因此,可推导出girl是eat的主语(编号弧4);然后,结点eat激活结点apple(编号弧5),由于结点apple与结点eat之间用右斜线 “\\”相连,因此,可推导出apple是eat的宾语(编号弧6)。可以看出,所有表示推导的编号弧的方向都是自底向上的。

这个句子的语表实现图如下:123456.girlan_appleThelittleate

这个语表实现图中的数字表示单词生成的顺序。

数据库语义学(DBS)有两个基础:一个是左结合语法(LA-grammar),另一个是单词数据库(word bank)。左结合语法和单词数据库在DBS中紧密结合在一起。Hausser把左结合语法比作火车头,把单词数据库比作火车运行必需的铁路系统。

单词数据库存储单词的内容,其存储形式是一种非递归的特征结注1构,叫作“命题因子”(proplets)。英文 “proplet” 取自 “proposition droplet”,表示命题的构成部分。

一个命题因子是“属性-值偶对”(attribute-value pair) 的集合。每个单词或者句子元素的句法语义信息都体现为相应的属性-值矩阵(attribute-value matrix)。例如,汉语“学生”这个单词的属性-值矩阵如下:

这样的属性-值矩阵就是单词数据库的“命题因子”。在这个命题因子中,sur表示“语表”,pyn表示“拼音”,noun表示“名词”,cat表示“范畴”,sem表示“语义”,fnc表示“函词”,mdr表示“修饰”,prn表示“命题”。

左结合语法是按照自然语言的时间线性顺序自左向右结合进行分析与计算的方法。

具体来讲,每个句子的第一个词为整句分析过程中的第一个“句子起始部分”(sentence start),之后输入下“一个词”(next word),二者经过计算构成新的句子起始部分,再继续与下一个输入的单词进行组合计算。这样不断地进行分析,直到句子结束或者出现语法错误才终止。当出现句法歧义或者词汇歧义时,左结合语法允许按照不同的推导路径并行地继续运算。

Hausser将左结合语法与短语结构语法进行了对比分析。他指出,左结合语法与短语结构语法是同质的语言分析方法。它们之间的差异在于:短语结构语法依据的是“替换原则”(the principle of substitution),而左结合语法依据的则是“可接续性原则”(the principle of continuation)。如果以“a,b,c...” 来代表语言符号,以“+” 代表串联符,那么,左结合语法的计算过程可以表示如下:

左结合语法在进行推导时,总是按照自左向右和自底向上的顺序,沿着树结构的左侧,一步一步地把单词逐一地结合起来的。树结构中的推导顺序如下:

例如,英语句子“Every girl drunk water”(每一个女孩都喝了水)的推导顺序如下:

从这个树结构中可以看出,推导从左侧开始,首先把every与girl结合起来,形成(np),然后把(np)与drank结合起来,形成(np’v),最后把(np’v)与(sn)结合起来,形成(v)。

整个推导过程遵循时间线性(time linearity)的原则。所谓“时间线性”,就是“以时间为序,与时间同向”(linear like time and in the direction of time),也就是说,在推导时,要按照时间前后的顺序进行,要沿着时间的方向推进。

上面我简要地介绍了Hausser的主要理论和方法,希望这些介绍能够帮助读者更好地理解这本《自然语言交流的计算机模型——数据库语义学下的语言理解、推理和生成》。

本书共分三个部分。第一部分介绍了SLIM语言理论的基本框架,包括认知主体的外部界面、数据结构和算法。这一部分涉及很多对整个系统至关重要的问题,比如概念的本质、概念在识别和行动中的作用、不同符号的指代机制、语境层的形式结构,等等。

第二部分系统分析了自然语言的主要结构,以英语在听话人和说话人模式下的示意推导为例。听话人模式下的分析主要介绍如何严格按照时间线性顺序将函词-论元结构(hypotaxis)和并列结构(parataxis)编码为命题因子,并把共指(coreference)作为推理基础上的二级关系来分析。说话人模式下的分析主要介绍如何在词库内进行以提取内容为基础的自动导航,如何按照相应语言的语法要求输出正确的词形、语序,如何析出适当的功能词,等等。

第三部分介绍英语断片,作者构建了一个功能完整但覆盖面有限的英语交流体系。这部分详细介绍了如何理解和生成小样本文本,对词汇、LA-hear、LA-think和LA-speak进行了明确定义。

本书为计算语言学相关的研究人员、学生和软件工程师等提供了一个对自然语言交流进行理论分析的功能框架,这个框架可以适用于任何自然语言的自动处理。

本书译者冯秋香是大连理工大学外国语言学及应用语言学硕士,计算机科学与技术方向博士,具备良好的语言学和计算机科学的跨学科背景,又有很扎实的英语功底。她从2009年10月开始,到德国爱尔兰根-纽伦堡大学学习,师从Hausser教授研究“左结合语法”。她熟悉Hausser教授的计算语言学理论,对于Hausser的“数据库语义学”和“语表组合线性内部匹配”理论有深入的了解。我觉得,冯秋香是本书最适合的中文译者,这个中文译本忠实于原文,译文准确精当,通顺流畅,可读性强。

商务印书馆请我审校此书。我对照本书的英文原文《A Computational Model of Natural Language Communication—Interpretation,Inference and Production in Database Semantics》,仔细地审校了冯秋香的中文译本,并参照有关材料,在这里介绍一些与本书有关的背景知识,希望对于读者理解本书有所帮助。我相信,本书中译本的出版,一定会增进我国语言学界对于当前国外计算语言学独创性理论的了解,从而推进我国计算语言学研究的发展。冯志伟2014年2月4日,于杭州仓前前    言注2《自然哲学的数学原理》第一版的前言里,牛顿把力学分为理论力学和实用力学。理论力学又被称作理性力学,包括精确示范等;实用力学则包括所有的手工技术。如果用同样的方法来对当今的语言学进行分类,会怎样呢?

牛顿会首先强调本学科的重要性,但我们不想这样做。我们直奔主题:什么是理论语言学?什么是实用语言学?实用语言学的例子有语音识别、桌面出版、文字处理、机器翻译、内容提取、文本分类、互联网查询、自动辅导、对话系统和其他所有的自然语言的应用。这些实际应用催生了对实用语言学方法的巨大需求。

但是,现有的实用语言学方法还远远不能满足用户的需求和期待。到今天为止,最成功的实用语言学方法是基于统计学和元数据标注3注的方法。这些是快速解决的方法(smart solutions),不需要关于自然语言交流过程的一般性理论支持,其目的是最大限度地挖掘每一次应用或者每一类应用的特殊性及其本质上的局限性。

我们来看一下实用力学:从准确预测潮汐到预测行星未来的位置,从炮弹瞄准到登陆月球等,都是力学的实际应用。和语言学应用一样,力学的实际应用,对方法也产生了巨大的需求。

但是,和语言学不同的是,实用力学的方法不但能够满足这一需求,甚至还超出人的想象。其原因是,牛顿的理论在应用于具体实践的同时,能够保持与传统工艺技能之间的相容性。虽然每一次应用都很艰难,需要理论知识和实践经验相结合,但是,其结果总是好的。

这就很自然地引出了一个问题:语言学能不能也这样呢?能不能把语言学理论直接转换成各种实际应用的有限的个别的背景,从而设想一个新的能够满足各式各样需求的框架呢?对于基础研究来说,这是一个相当大的挑战。

为了构建一个完整的、具有普遍性的语言学框架,我们首先要重建人类自然语言交流的认知“力学”。本书讨论的数据库语义学注4(Database Semantics,DBS)理论就是会说话的机器人的陈述性规范说明(declarative specification)。数据库语义学在实际应用上的潜力和它能够成功地、充分地模拟人类认知的能力直接相关。这一点注5是我们这个研究项目的本质。

一个会说话的机器人的陈述性规范说明必须是一个能够有效地实现自然语言交流机制的功能模型。为了确保完整性,该模型必须以人与人之间的基于语言的互动为原型。该模型的功能性和数据覆盖面必须通过具体实践来验证,也就是要有一个与之相应的运行有效的计算机程序。从长远看,功能性、完整性和可验证性相结合是模型升级成功的最佳科学基础。

由此得到的系统能够应用于所有与自然语言交流相关的实践活动。大多数情况下,只要降低该模型的功能性和数据覆盖面就可以满足某一具体实践的要求。例如,会说话的机器人具备认知功能、人工视觉、操纵以及移位功能等,要建立一个电话的自动对话系统,只需注6要用到它的认知功能。

其他的应用,例如我们熟知的机器翻译,在降低机器人功能性的同时,还要求对理论进行扩展。不过,数据库语义学有坚实的基础来满足这个要求,因为它也可以模拟单语交流,包括单语理解的过程。

另外,不依存于实践的(理论上的)任何有关词典数据覆盖率、自动词形识别、句法-语义分析、绝对知识和情景知识、推理等方面所取得的进步都可以直接提高现有理论的实际应用能力。方法很简单,就是把相关的部分定期地替换为新版本。这种可能性的来源在于,理论所提供的各个模块以体现功能为目的,各个界面的定义也很明确。

下面我们来尽可能直接地、简单地介绍一下数据库语义学。本书面向语言学和自然语言处理领域的在校研究生、其他研究人员,以及软件工程师等。语言哲学、认知心理学和人工智能等领域的学生和研究人员也可以参阅本书。

对计算语言学和数据库语义学还比较陌生的读者可以读一读《计算语言学基础》(Foundations of Computational Linguistics,1999,2001第二版)。作为一本教材,《计算语言学基础》系统地描述了传统的语法,对各种语言学方法的历史背景也作了对比分析,并提出了SLIM语言学理论。本书也采用了这一理论。

认知心理学方面的知识储备对理解本书也有一定的帮助,如Anderson的ACT-R理论(见 Anderson and Lebiere 1998)。和数据库语义学一样,ACT-R理论在本质上是以符号,而不是以统计为基础的。它也把计算模拟的方法作为验证方法。但是,ACT-R理论的研究焦点是记忆、学习和问题求解,数据库语义学的核心是模拟自然语言交流过程中的说者模式和听者模式。致    谢

本书完成于爱尔兰根-纽伦堡大学的计算语言学系。我要感谢系里的所有成员:Matthias Bethke,Johannes Handl,Besim Kabashi 和Jörg Kapfer(按姓氏的字母顺序排列)。他们和我一起广泛而深入地讨论了与本书相关的理论和实践两方面的技术问题和概念问题,并提出了很多很好的建议。我还要感谢我的学生们,尤其是Arkadius TMKycia。他是第一个采用Java语言来编写说者、思考和听者三个模式下的DBS.1和DBS.2应用程序的人。另外要感谢的人是Brian MacWhinney(卡耐基梅隆大学,匹兹堡)和刘海涛教授(中国传媒大学,北京)。他们对我的早期手稿提出了中肯的意见。Mike Daly(Dallas)承担了手稿的校对工作,也提出了宝贵的建议。Marie Hučinova(查尔斯大学,布拉格),Vladimir Petroff(东北大学,波士顿),Kiyong Lee(韩国大学,首尔),以及Springer的编辑们,在本书出版的最后阶段做了大量的改进工作,在此一并致谢。本书如有错误之处,责任全部在我个人。罗兰德·豪塞尔2006年2月爱尔兰根-纽伦堡书中常引文献的缩写形式

SCG’84        =Hausser,R.(1984)Surface Compositional Grammar,pp.274,München:Wilhelm Fink Verlag

NEWCAT’86=Hausser,R.(1986)NEWCAT:Parsing Natural Language Using Left-Associative Grammar,Lecture Notes in Computer Science 231,pp.540,Berlin Heidelberg New York:Springer

CoL’89=Hausser,R.(1989)Computation of Language,An Essay on Syntax,Semantics,and Pragmatics in Natural Man-Machine Communication,Symbolic Computation:Artificial Intelligence,pp. 425,Berlin Heidelberg New York:Springer

TCS’92=Hausser,R.(1992)“Complexity in Left-Associative Grammar,”Theoretical Computer Science,106.2:283-308,Amsterdam:Elsevier

FoCL’99=Hausser,R.(1999/2001)Foundations of Computational Linguistics,Human-Computer Communication in Natural Language,2nd ed.,pp.578,Berlin Heidelberg New York:Springer

AIJ’01=Hausser,R.(2001)“Database Semantics for natural language.”Artificial Intelligence,130.1:27-74,Amsterdam:Elsevier

L & I’05=Hausser,R.(2005)“Memory-Based pattern completion in Database Semantics,”Language and Information,9.1:69-92,Seoul:Korean Society for Language and Information引    言

Ⅰ. 基本假设

自然语言交流的计算机模型不能仅仅局限于对语言符号进行语法分析,而是必须以认知主体的识别和行动的一般性步骤为起点,把语言理解和语言生成当作特例来处理。

认知主体的识别和行动依赖于认知主体的外部界面,认知主体内部有一个储存内容的数据库。没有语言功能的主体只有一层认知结构,称作语境层。具备语言功能的主体的认知结构则有二层:语境层和语言层。语言与世界之间的联系,即指代关系(reference),完全通过主体的认知步骤建立起来。这种指代关系的建立有两个要素:(i)主体的外部界面,(ii)语言认知层和语境认知层之间通过格式匹配建注7立关联的过程。

数据库语义学(DBS)模拟自然认知主体的行为,包括语言交流,自动(a)把识别得到的命题内容读入主体数据库,以及(b)把命题内容从主体数据库读出来形成行动。识别和行动之间(c)通过能够进行合理(有意义的、理性的、成功的)推理的控制机制联系起来。

Ⅱ. 认知主体构成

从最抽象的层次上看,认知主体包含三个基本组成部分:(i)外注8部界面,(ii)数据库,(iii)算法。它们采用共同的格式,称作数注9据结构,来表示和处理内容。

认知主体需要通过外部界面来完成识别和行动。识别指的是看和听等,其前提是认知主体有眼睛和耳朵。行动指的是说话、操作和走路等,其前提是认知主体有嘴、有手和脚。没有外部界面,认知主体就不能告诉我们它理解了什么,也不能按我们说的去做。

主体的数据库用来存储和提取由外部界面提供的内容。没有数据库,主体将无法判断之前有没有见过某一物体,也无法对某一语言的词汇和意义形成记忆。其功能也就只能局限于直接联系输入与输出的反射行为。

算法负责在外部界面和数据库之间建立联系,(i)把识别到的内容读入数据库,(ii)从数据库中读取内容形成行动。同时,算法还必须(iii)处理数据库里存储的内容,以确定目标、计划行动和导出概论。

自然主体的认知过程中,外部界面、数据库和算法之间紧密互动。因此,自然认知过程的计算机模型当中,这三个部分也必须相互合作、联合行动。初始阶段,这三个基本构成部件可能很简单,但是必须具有普遍性,必须从一开始就能够在功能上整合为一个统一的框架。

Ⅲ. 自然语言处理

自然语言交流模型需要一些传统的语法的构成成分,即针对某一语言的词典,针对某一语言的构词法、句法和语义规则。交流过程中,这些成分必须在(i)听者模式、(ii)思考模式和(iii)说者模式下协同合作。

听者模式下,外部界面提供由语言符号构成的输入;算法对这些符号进行解析,并将其内容以某种表示方式存入数据库。符号解析依靠的是自动词形识别系统和自动句法语义分析系统。

思考模式下,算法实现数据库内的自主导航,选择性激活相应的内容。这种自主导航也用于根据当前输入和数据库存储的内容进行推理以导出行动的过程。

说者模式下,被激活的内容和导出的推理成为语言生成的概念化基础,即解决说什么的问题。根据被激活的内容生成语言还要求对词形进行正确选择、处理语序以及注意一致性问题。

Ⅳ. 侧重点

接下来的章节对数据库语义学(DBS)的某些组成部分作了详细的分析,其他部分则只简单介绍其输入、功能和输出。这是难免的,因为全部作详细介绍的话,任务过于繁重,又因为跨学科的原因,涉及面过宽,而且有些技术相对于其他技术来说比较容易获得。

例如,本书没有说明如何把数据库语义学(DBS)实现为一个实实在在的机器人原型,这个机器人有外部识别和行动界面,即人工视觉、语音识别、操纵和运动的功能。这的确很遗憾,因为数据库里的内容来自主体识别和行动过程中“通过感知”得到的概念(Roy 2003)。

在对人工智能主体的外部界面作高度抽象描述的同时,本书不但从理论上介绍了算法和数据结构,还用具体实例将其开发为模拟听者、思考和说者模式的“片段(fragment)”。这些片段被定义为明TM确的规则体系,并采用Java语言具体实践为一个与之相应的计算机程序。

Ⅴ. 现有体系和方法

目前,我们有很多种分析器可供选择。有的是基于统计的方法,如Chunk句法分析器(Abney 1991;Déjean 1998;Vergne and Giguet 1998),Brill Tagger and Parser(Brill 1993,1994)以及头驱动分析器(Collins 1999;Charniak 2001)。有的是基于短语结构语法的方法,如Earley算法(Earley 1970),Chart句法分析器(Kay 1980;Pereira and Shieber 1987),CYK句法分析器(Cocke and Schwartz 1970;Younger 1967;Kasami 1965),和Tomita句法分析器(Tomita 1986),等等。

同样,我们也有很多句法理论。有的以范畴语法(Le śniewski 1929;Ajdukiewicz 1935;Bar-Hillel 1964)为基础。和范畴语法相关的是配价理论(Tesnière 1959;Herbst 1999;Ágel 2000;Herbst et al.2004),以及依存语法(Mel’čuk 1988;Hudson 1991;Hellwig 2003)。其他的还有短语结构语法(Post 1936;Chomsky 1957),如广义短语结构语法(GPSG,Gazdar et al.1985),词汇功能语法(LFG,Bresnan 1982,2001),头驱动短语结构语法(HPSG,Pollard and Sag 1987,1994)和构式语法(Östman and Fried 2004;Fillmore et al.待出版)等。

语义分析的方法也很多。有的基于模型理论(Tarski 1935,1944;Montague 1974),有的基于言语行为理论(Austin 1962;Grice 1957,1965;Searle 1969)或者语义网络(Quillian 1968;Sowa 1984,2000)。此外,还有修辞结构论(RST,Mann and Thompson 1993)和语篇语言学(Halliday and Hasan 1976;Beaugrande and Dressler 1981)等。从认知心理学角度定义概念的方法也多种多样,如图示、模板、原形和几何离子方法等(见4.2)。

如果加上人们在建立广义机器翻译理论(Dorr 1993)、普遍语义基元集(Schank and Abelson 1977;Wierzbicka 1991)和以应用为导向的语言生成体系(Reiter and Dale 1997)等方面的努力,这个分系统的名单可以列得更长。此外,以基于XML、RDF和OWL的元数据标注法来改进互联网索引和检索(Berners-Lee,Hendler,and Lassila 2001)方面的工作也不容忽视。这就引出了一个问题:要建立一个具有普遍性的、完整的、协调的自然语言交流的计算模型,应该选择哪一个体系来构成其组成成分呢?

一方面,我们没有兴趣去重塑一个已经存在的组件。另一方面,把这些分系统理论整合进自然语言交流的一般理论,其代价是巨大的:现有各种理论的历史背景不同,目的也不同,使之兼容要花费大量的时间和精力。

整合分系统理论除费时费力之外,还存在着另一个问题,这个问题更具有普遍性:它们中的哪一个在原则上适合用来建立一个实用理论以解释自然语言交流如何进行呢?FoCL’就上述大多数理论讨论注10了这个问题。

讨论的结果导致了数据库语义学的诞生。数据库语义学从上述很多思想和方法中吸取了经验,其中最基本的两点是亚里士多德的命题观和索绪尔强调的语言的线性结构。

尽管数据库语义学的语法分析在很多方面仍然是传统的,但是和目前普遍采用的方法不同,数据库语义学的句法分析(组合分析)和语义分析(语义理解)并没有分开,而是按照时间线性顺序同时进行(Tugwell 1998)。纯粹的句法分析和句法语义分析相结合的方法之间存在着区别,这一区别在于(i)前者定义的句子成分的词汇特征比后者少,(ii)前者定义的句子成分之间的关系也比后者少。

Ⅵ. 形式化基础

迄今为止,数据库语义学是第一个,也是唯一的一个将自然语言理解与生成重构为角色转换的规则体系。角色转换指认知主体在听者模式与说者模式之间的转换。数据库语义学重新建构自然语言交流过程的两个基础也都颇有开创性。这两个基础是:

LA语法(the algorithm of Left-Associative Grammar):

LA语法以接续的可能性原则为前提。这完全不同于当今语言学领域的常用算法,如PSG和CG。这些常用语法遵循词的可替代性原则。计算接续可能性符合自然语言的时间线性结构,允许我们把角色转换处理为三种LA语法之间的互动,即LA-hear(听)、LA-think(思考)和LA-speak(说)之间的互动。

词库数据结构(the data structure of a Word Bank)(AIJ’01):

命题内容以非递归特征结构(flat feature structure)的形式存储在词库当中。这种特征结构称作命题因子(proplet)。以替代为基础的分析方法允许嵌套,如主语的特征结构嵌入动词的特征结构(见3.4.5),数据库语义学(DBS)不允许这种情况发生。相反,命题因子仅仅通过特征(feature),即属性-值对(attribute-value pairs)来体现彼此之间的语法关系。以命题因子集合来表示内容的方法,方便(i)数据存储和提取;也方便进行(ii)格式匹配,从而为建立(iia)语法规则和语言之间(见3.4.3和3.5.1),以及(iib)语境层和语言层之间(见3.3.1)的联系奠定基础。

LA语法和词库数据结构共同构成在命题内容之间进行自动导航的前提。命题因子之间的语法关系就像是一套铁路系统,而LA语法则像一辆机车沿着这套铁路系统推动唯一的焦点移动。这种新的数据结构和算法相结合的方法构成基本的思考模型。它可以仅仅用来在词库内选择性激活内容(自由联合),也可以扩展为一个控制结构,通过已存储的知识和推理来建立主体识别和行动之间的联系。

Ⅶ. 语言学分析范围

我们的语言学分析目标是对自然语言的主要结构进行系统研究。自然语言的主要结构包括(i)函词论元结构、(ii)并列结构、(iii)共指结构。这些结构可能存在于命题内部,也可能存在于命题之间,还有可能以其他方式自由组合。

我们严格按照时间线性顺序,在听者和说者模式下对这些结构进行语法分析。实践证明,数据库语义学(DBS)和以符号为导向的方法相比,在功能上更加完备,完全可以进行直接的符合语言学规律的同源分析,能够在计算机上高效实践。

本书的分析也会涉及先天论(Nativism)难以分析的结构,即空缺结构(gapping constructions)(见第8章和第9章),尤其是“右节点提升(right-node-raising)”(FoCL’99),以及“驴句(donkey sentence)”和“巴赫-彼得句(Bach-Peters’ sentences)”中的共指结构(见第10章)。

Ⅷ. 本书结构

本书内容共分三个部分。第一部分介绍SLIM语言理论的基本框架,包括认知主体的外部界面,数据结构和算法。这一部分谈及很多对整个系统至关重要但却无法深入下去的问题,比如概念的本质,以及概念在识别和行动中的作用,不同符号种类的指代机制,以及语境层的形式结构等。

第二部分系统分析自然语言的主要结构,以英语的派生过程为例,概要性介绍听者模式和说者模式下的语言理解和生成过程。听者模式下的分析主要介绍如何严格按照时间线性顺序把函词论元结构和并列结构编码为命题因子集合,并把共指作为推理基础上的二级关系来处理。说者模式下的分析揭示基于内容提取的自动导航(概念化)过程、如何按照相应语言的语法要求输出正确的词形、语序,以及析出适当的功能词。

第三部分介绍几个英语片段。延用Montague的观点,“片段”指功能完整但覆盖面有限的自然语言交流体系。这部分详细介绍如何理解和生成小样本文本,明确定义了词汇、LA-hear、LA-think和LA-speak。

这三个部分各自的范围和抽象程度如下图所示:

抽象程度越高,语言学和技术上的细节越少。反过来,抽象程度越低,语言学和技术上的描述就越详细。

第一部分的框架建立在第二部分之上。第二部分介绍的分析方法以第三部分为基础。第二、第三部分的分析和定义构成指导JSLIM实验操作(Kycia 2004)的陈述性规范说明。目前Jörg Kapfer和TMJohannes Handl正采用第五版Java对JSLIM进行再现(1.5)(译者注:在本译本完成前,该实验已成功结束)。/ 第一部分 /认知交流机制1. 方 法 问 题

在科学领域,验证(verification)是对错误的最外层防御。只要客观,验证可以采用很原始的方法。验证一般针对某一特定理论(或者某一类理论)来设计,验证的方法要和被验证的理论之间产生互动,验证产生的新问题可以(i)多多少少通过验证来进行结论性判定,(ii)其答案与理论发展相关。

在自然科学领域,验证包括(i)明确的定量实验,(ii)可以由任何人在任何地方再现的实验。这就要求理论的点和架构必须精确到一定程度,以满足科学实验设置的需要。但是,对自然语言进行的语法分析,定量的方法恰恰不合适。

我们提出的方法是建立自然语言交流的功能模型。建立这样一个模型需要与之相应的(i)有效技术实现(会说话的机器人的原型)和与之相关的陈述性规范说明,需要(ii)建立客观的观察信道,需要(iii)机器人行为的充分性和理论的正确性之间构成等同关系,也就是说,机器人必须有(iv)和人类一样的各种外部界面,以及(v)和人类一样的处理语言的能力,处理过程中的输入和输出也要与人类的语言输入和输出等价。1.1  以符号还是以主体为导向来进行语言分析?

自然语言的表现形式是语言符号。某一语言环境下,符号与符号之间的结构关系是约定俗成的。认知主体在说者模式下生成语言符号,在听者模式下解析语言符号,这些符号是在说者与听者之间传递内容的媒介。有的科学分析聚焦于孤立的语言符号,有的聚焦于进行语言交流的认知主体,我们据此将这些分析方法分为以符号为导向的和以注11主体为导向的两种。

以符号为导向的方法包括生成语法、真值条件语法和语篇语言学等。它们把自然语言的表达方式作为研究客体,研究材料来源于书本、磁带或者电子媒介物。这种分析是脱离交流的抽象分析。其语言学样本脱离了交流主体,根据可替代性原则被解析为层次结构,不适合也不以模拟说者和听者模式为目的。

数据库语义学(DBS)以主体为导向,不同于以符号为导向的分析方法。数据库语义学(DBS)的分析过程中,语言符号是说者生成语言的结果和听者理解语言的起点。要把语言生成和语言理解结合起来,需要遵循语言的时间线性顺序,根据可接续性原则对主体生成语言和理解语言的各个步骤展开来分析。

数据库语义学的目标是建立一个功能完备、数据完全、计算复杂度小而计算机操作性强的关于自然语言交流的理论。该理论的核心问题是:自然语言交流是如何进行的?

下面,我们以最简单的方式来回答这个问题。

自然语言交流发生在两个认知主体之间。他们在世界上实实在在的存在着,具有各种各样的外部界面。这些外部界面帮助他们进行语境层的非语言识别和行动,以及语言层的语言识别和行动。同时,每一个认知主体都有一个数据库来存储内容。这些内容由主体的知识、记忆、当前识别到的内容、意图和计划等构成。注12

认知主体可以在说者和听者模式之间转换(角色转换)。交流时,说者模式下的主体将数据库中的内容编码为语言符号,通过语言输出界面在外部得到实现。另一个在听者模式下的主体通过语言输入界面来识别这些符号,对其内容进行解码,之后存储到自己的数据库当中。如果由说者编码的内容被听者等价解码并存入数据库,则视为交流成功。

数据库语义学的角色转换模型建立在特殊的数据结构和注LA(Left-Associative,左结合)时间线性算法相结合的基础之上。13LA算法有三个变体,称作LA-hear(听),LA-think(思考)和LA-speak(说)。交流过程中这三个语法相互合作,如下图所示:1.1.1  角色转换基本模型

图右边的主体(说者模式)内,LA-think选择性激活存储在数据库里的内容。被激活的内容通过LA-speak映射为自然语言语表,实现为外部符号(在图中用带s的方块表示)。图左边的主体(听者模式)内,LA-hear对符号进行解析,之后存入自己的数据库。1.1.1所示的角色转换可以从以下两个角度来理解:1.1.2  角色转换的两个角度1. 从外部看

两个交流主体分别担任不同的角色。1.1.1所示图中的两个大方块分别代表两个不同的主体,一个在说者模式下,另一个在听者模式下。2. 从内部看

每个主体本身在说者模式和听者模式之间进行转换。1.1.1所示图中的两个大方块代表同一个主体分别处在听和说两个不同的模式之中,这两个模式之间相互转换(虚线向右的箭头表示转换)。    数据库语义学的角色转换是一个定义明确的计算问题,也是对自然语言进行语言学分析的核心问题,所有的句法和语义分析都必须在角色转换这一最基本的交流机制下进行。没有角色转换,其极端结果就是单方面的自言自语。1.2  验 证 原 则

我们的自然语言交流理论是一套功能型理论,是一套用于高效计算机程序及其相关硬件的陈述性规范说明。陈述性规范说明描述了软件的必要特征,如外部界面、数据结构和算法。计算机模型的偶然性注14特征,如程序语言的选择或者程序员的风格偏好等,不在陈述性规范说明之内。注15

和逻辑学的代数定义(algebraic definition)不同,陈述性规范说明并不完全基于集合理论,而是从程序化的角度,指明输入输出条件下确保系统功能稳定的各成分的一般构造条件。陈述性规范说明必须具有普遍性,提供坚实的数学基础和框架,同时也必须足够详细,能够在不同环境下满足轻松编程的需要。

陈述性规范说明是必要的,因为计算机代码不容易被人理解。以高级编程语言,如Lisp,写成的程序只适合给专家看。一般读者感兴趣的只是软件如何实现其功能的概括性说明。

投入某一具体应用的陈述性规范说明文件有两个层次:(i)一般理论框架(如自然语言交流的功能体系),(ii)一般理论框架的具体化应用(如应用到英语、德语、韩语或者任何其他语言)。反过来,与具体应用相结合的理论框架可以通过(iii)各种不同的,用Lisp语言、C语言或者Java语言等编写出来的操作程序来实践,例如:1.2.1  陈述性规范说明与实践操作之间的关系

陈述性规范说明可以在必要特征等价的前提下应用于不同的实践操作。数据库语义学的陈述性规范说明还在不断发展,它要求至少有一个最新的实践来自动验证该理论在现阶段的功能,检验理论对于范围不断扩大的各种任务的解决能力。这样才能发现理论在现阶段出现的错误、不完备性以及其他弱点(形成明确假说,见FoCL’99,7.2.3)。这是改进陈述性规范说明,使之进入下一个高级阶段的前提。

理论发展和自动检验相互促进正是数据库语义学(DBS)的验证方法。它虽然不同于自然科学的定量方法(可重复性实验),以及数学的逻辑公理方法(一致性证明),但又与之兼容。注16

数据库语义学的验证方法非常重要,原因有以下几点:第一,自然语言符号是约定俗成的,不适合采用自然科学的定量方法。第二,语言学和相关领域(如语文学)的分析流派众多,很难开展对比评估。1.3  等 同 原 则

数据库语义学力争使人造主体的语言交流模型尽可能接近自然。原因有两个:第一,要在实际应用中最大限度地保证用户友好性。人机交流过程中的用户友好性指的是人和机器人之间能够彼此(i)正注17确地相互理解,(ii)人不必刻意去适应机器人。

第二,从长远看,要保证理论的升级能力。在建构会说话的机器人的过程中,升级指的是可以从现有原型出发,毫不费力地过渡到一注18个功能更完善以及/或者数据覆盖面更大的新模型。科学发展史上,注19升级有困难往往是因为理论本身有本质上的问题。

要保证用户友好性和升级能力,数据库语义学必须在各个抽象层次上尽力接近所谓的“心理现实”。为此,我们提出要使理论描述的正确性等于电子模型(会说话的机器人原型)的行为充分性这样一个等同原则。1.3.1  数据库语义学的等同原则

1. 重建的认知结构越接近现实,模型运转得越好。

2. 模型运转得越好,重建的认知结构越接近现实。

等同原则的第一部分需要相关学科的支持和衔接,以提高原型的性能。这就意味着,我们不能与既定的事实背道而驰,也不能过于怀疑动物行为学和发展心理学关于系统发育和个体发育的理论,要接纳解剖学和生理学等学科的实用阐释,要认真对待数学复杂理论的研究成果(不包括不可判定算法或者指数算法),等等。

等同原则的第二部分解决了“真实的”认知软体结构(在各个抽注20象水平上)无法进行直接观察的问题。我们的策略是在人工认知主体的不断升级过程中,间接获得接近现实的重新建构,以求在功能上和数据覆盖上的完备性。1.4  客观化原则

一般意义上的认知功能重建所涉及的数据和重新建构自然语言交流功能模型的数据不一样。二者之间的区别有两个:一是二者所在的体系(constellation)不同,二是不同体系所采用的信道不同。

体系指(i)用户、(ii)科学家、(iii)电子模型(机器人)之间的互动关系。分为如下几类:1.4.1  提供不同数据的体系

1. 用户和机器人之间的互动

2. 用户和科学家之间的互动

3. 科学家和机器人之间的互动

体系不同,数据传输的信道也不同:1.4.2  交流性互动中的数据信道

1. 自动信道(auto-channel)在语境层和语言层自动处理输入,自主生成输出。对于自然认知主体,即用户和科学家,他们的自动信道从一开始就具备完整的功能。人工智能主体的自动信道却必须重新建构——数据库语义学的目标正是要为人工智能主体建造尽可能接近现实的自动信道。

2. 内省外推(extrapolation of introspection)是特殊的自动信道。因为科学家和计算机的使用者都是自然主体,科学家可以尝试从使用者的角度出发来改善人机交流。内省外推就是这一努力的结果。

3. 服务信道(service channel)的设计初衷是帮助科学家来观察和控制人工智能主体。原则上科学家可以完全掌握它的认知构造和功能,所以服务信道是直接访问机器人认知的渠道。

这三个体系以及三个数据信道在用户、科学家和机器人三者之间的互动过程中的作用可以用下图来概括说明:1.4.3  用户、机器人和科学家之间的互动

科学家通过自动信道来观察用户和机器人的外部行为,也就是说,科学家可以观察他们做了什么,当然也可以进行采访。另外,科学家一方面通过科学的内省外推来间接观察用户的认知状态,另一方面通过服务信道来直接观察机器人的认知状态。对科学家来说,用户和机器人都是在世界中真实存在的认知主体,他们的认知状态有相同的本体地位。

三个信道当中,自动信道是用户、机器人和科学家都有的信道,用得最多也最容易出错:比如,在语境层会出现视觉错误,在语言层会出现误解。另外,对话人还可能有意识或者无意识地偏离事实真相,这也可能造成自动信道出错。

如果每天和对话人的接触只局限于自动信道,那么我们永远无法完全确定对话人是否真的像我们希望的那样,理解了我们说的话,或者,我们是不是真的像对话人期待的那样,理解了对话人说的话。我们也无法确定彼此说的话是不是真话。哲学上,这被称作唯我主义(solipsism)(Wittgenstein,1921),是一个一直存有争议的问题。

自然语言交流的科学分析方法更倾向于采用(i)内省外推(ii)服务信道。内省外推过程中,科学家和用户之间的对话只限于用户和机器人之间的互动领域。科学家与用户之间的误解虽然仍然存在,但是相比自由交流要少得多。而且,由服务信道直接访问机器人认知,科学家能够客观地确定人工智能主体的认知是否工作正常。这样,人工智能主体的特别之处就在于它排除了唯我主义的问题。1.5  界面和输入/输出的等价原则

到目前为止提到的数据库语义学的方法论原则有:1. 验证原则

理论以陈述性规范说明的形式出现,其发展要由实验原型在实践中不断去验证(见1.2)。2. 等同原则

从长期可扩展性看,理论的正确性要等同于模型的行为充分性(见1.3)。3. 客观化原则

建立客观信道观察自然主体与人工主体之间的语言交流(见1.4)。

这些方法论原则受以下两个原则的制约:4. 界面等价原则5. 输入/输出等价原则

根据(4)界面等价原则,人工智能主体必须装备有和自然主体一样的与外部世界接触的界面。从最抽象的层次上看,需要语境层和语言层都有识别和行动的外部界面(见2.1.3)。从较低的抽象层次上看,该界面又分为视觉、听觉、触觉等模块(见2.2),以便识别、移位、操纵和行动。

计算机模型和自然主之间的界面等价对于自动重建指代关系(也就是语言和世界之间的关系)来说非常重要。例如,如果机器人不能感知,它就不能理解在共同的任务环境下,人对于新事物的指代。界面等价原则是自然语言语义学理论的基础,尤其是本体论基础(见2.3.1)。(5)输入/输出等价原则预设了(4)界面等价原则。输入/输出等价要求人工智能主体(i)得到与自然主体同样的输入,产生同样的输出,(ii)以同样的方式把输入和输出分解为几个部分,(iii)再以同样的方式在吸入和释放过程中对这几个部分进行排序。和外部界面一样,输入和输出的数据是具体的,因此适合客观的结构分析。

模型和自然人原型之间的输入/输出等价和自然语言交流过程中的符号化自动理解和生成尤其相关。因此,这一原则对于针对自然语

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载