生成词库理论与汉语事件强迫现象研究(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-02 16:38:14

点击下载

作者:宋作艳

出版社:北京大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

生成词库理论与汉语事件强迫现象研究

生成词库理论与汉语事件强迫现象研究试读:

版权信息书名:生成词库理论与汉语事件强迫现象研究作者:宋作艳排版:咪奥出版社:北京大学出版社出版时间:2015-01-01ISBN:9787301252697本书由北京大学音像出版社有限公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —语言关联:从百科知识到语言知识(代序)

2000年秋,我照例给大四学生开“理论语言学”。课堂上有一位女生比较喜欢回答问题,说话有点颤抖,接着还要提问题,思路特别精准,争论问题时[ts、tsh、s]的发音听起来像是[tθ、tθh、θ]。在我接触过的很多学者中,有些有口音的人往往有特殊才华。再说学者不能不激动、不颤抖,太老练圆滑不是求真的学者。我当时的第一反应是,这个女生有培养前途,将来是个学者,不会改行。她就是宋作艳。

本书是她在博士论文基础上的修改发展,是用生成词库理论研究事件强迫现象。事件强迫现象指事物被强迫理解为事件,比如“学习钢琴”通常被强迫理解为“学习弹钢琴”。事件强迫是事件压缩的逆过程,比如“学习弹钢琴”被压缩为“学习钢琴”。压缩是有条件的,“学习盖房子”不可压缩为“学习房子”。“学习修钢琴”在一定条件下也可以压缩为“学习钢琴”。压缩也是有语言类型差异的,英语中John began reading the book可以压缩为John began the book,但汉语中“张三开始读这本书”不可以压缩为“张三开始这本书”。如果我们找不出这里的规则和条件,就只好在词库中注明“学习”有很多义项,其中包括“学习弹”“学习修理”“学习盖”,而且在理论上还得解释说,具体怎么压缩需要上下文条件。本书通过引入生成词库理论,提取了关于事件压缩或事件强迫的规则,并进一步发展了生成词库理论,走出了一条汉语生成词库研究的路子。本书在寻找语言规则时成功地启用了大量百科知识,使我们再次看到语言关联的重要性,即百科知识和语言知识没有绝对的界限,关键是要找到百科知识和语言结构的对应。本书的研究极具方法论价值,可以概括为几个方面。理论模型的启用

区分语言中的规则现象和不规则现象是语言研究中最重要的问题之一。这里所说的规则和不规则,当然不限于形式规则,也有语义、认知等规则。作艳的研究就是要解决事件强迫的规则问题。

作艳的第一个贡献是在理论模型的启用上,她首次系统地在汉语研究中成功地引入了生成词库理论,这本身就是一种极具学术价值的贡献。现在发表的很多论著,通常都有对前人理论模型的方法论分析,但是真正原创性的方法论分析并不多,往往是利用别人的综述评论材料和成果,实际上并没有读过原著。真正原创性的方法论分析必须是在前人没有展开过综述评论的基础上才是有价值的。这种原创性的方法论分析需要阅读原著,有长期分析材料形成的问题积累,这样才能在浩瀚的文献中看出理论模型的重要性和价值,并用这种模型展开汉语研究。我认为作艳做到了这一点。

作艳全面系统地引入生成词库模式分析汉语,在汉语分析方法论上占有重要的一页。前面提到,判定一个语言现象是规则的还是不规则的,是语言研究中最基础的也是至关重要的问题之一。如果是规则组合,不需要记忆;如果是不规则组合,则需要记忆。需要记忆的片段要存放在词库中,可以用规则类推的只需要掌握生成规则或生成机制。但是,要判定一个语言现象是否是规则现象,实际上难度相当大,其中涉及能产性和转换问题,于是在方法论上出现了争论。

关于能产性和转换问题在20世纪60到70年代有过比较深入的讨论,基于认识论的差别,论战双方分成词汇派(lexicalist position)和转换派(transformational position)。词汇派的基本观点是主张把不能产的或准能产的派生形式都存放在词库中。转换派的基本观点是把准能产的形式看成是转换的结果。转换派的代表有Lees和Lakoff。也有些学者采取中立的态度。Chomsky在1965年以前可以看成规则派。Chomsky(1965)在《句法理论的若干问题》(Aspects of the Theory of Syntax)中根据名物化转换(nominalization transformations)把destruction、refusal这样的词处理成转换的结果,因此这些词不需要进入词库。从《论名物化》(Remarks on nominalization)开始,Chomsky(1970)转向了词汇派,他区分了refusal和refusing两种现象,认为refusal是派生的结果,而refusing才是转换的结果。比较起来,Chomsky的词汇派观点更能说明词库和规则的关系。“V-al”受到限制,这是能产性的问题。但是为什么转换派的观点至今仍然有很多支持者?我认为关键在于能产性问题的复杂性没有完全弄清楚。Chomsky所用的例子比较明确,但语言事实中有很多复杂问题并不是那么容易把能产和非能产分开。汉语动词的主动形式、“被”字句形式和“把”字句形式的关系被看成是句法现象,即规则现象,但从主动形式到“被”字句或“把”字句的周遍条件现在还没有找到。汉语的数词和“第X”的关系被看成是派生现象,但周遍条件却是明确的。英语中数词的派生形式“X-th”也有周遍条件。

其实这里的本质取决于我们能否找到平行周遍条件。随着研究的深入,昨天放在词库中的片段,今天或许就可以用规则处理。问题是我们需要启用哪些条件。比如,如果只启用语类的条件,下面的实例都平行但不周遍:

N+鞋:皮鞋、铜鞋、冰鞋、水鞋、*气鞋……

V+鞋:跳鞋、跑鞋、拖鞋、*走鞋、*登鞋……

D+鞋(D:区别词):金鞋、银鞋、男鞋、女鞋、童鞋、*公鞋、*母鞋……

以上每一类都有一定的平行实例,但并不周遍。现在我们考虑百科知识中的条件,如果我们把X的平行特征限制为质料,就可以周遍很多组合:

质料语素+鞋:布鞋、棉鞋、草鞋、皮鞋、铜鞋、银鞋……

这些组合都不需要放入词库。这就是说,在很多貌似没有规则的现象背后,只要我们启用足够的知识,不限于语类、论元、句子成分等知识,规则可能是存在的。

我认为词库派的做法是最保险的,即只要找不到平行周遍条件的片段,都存放在词库中,这就不至于产生过分类推。在很长一段时间里,词库容量不断在增大,这样做的代价是学习负担重,很多语言机制得不到解释。

Pustejovsky的生成词库理论尽管从术语上看是关于词库的一种理论,但我认为Pustejovsky的理论是规则派和词汇派的结合,其理论本质上是要解释很多组合规则以及组合后的引申、隐含规则,这里的“生成”实际上就是通过一定的规则来生成临时组合的各种意义。不过,为了解释生成规则,生成词库理论不仅重视生成机制,也重视词汇的充分描写,即词汇表征。这里的词汇表征不是给词列各种义项,而是在不增加义项的情况下,充分描写词项的论元结构、事件结构、物性结构和词汇类型结构。词的各种义项可以通过这些结构有规则地生成出来,两个成分的组合义、引申义、隐含义也可以通过这些结构有规则地生成出来。这些结构(尤其是物性结构)涉及人类的认知和百科知识,远远超出了词类、论元、句子成分等传统范畴。

作艳用生成词库理论分析汉语事件强迫问题所得到的很多结论证明,这一理论模型在分析句法引申、隐含方面极有价值,对汉语也不例外。作艳能全面系统地引入生成词库理论并证明这一理论在汉语分析中的有效性,这是很不容易的。她能做到这一点和她平时结合研究认真阅读原著的习惯是分不开的。在读博士期间,我布置的主要参考书她都肯花时间精读,比如她读过的Chomsky的一系列著作,都有她密密麻麻的批注,而且都是阅读原文,并且能顺着原著中出现的重要论证展开扩展阅读。Pustejovsky的生成词库理论原著The Generative Lexicon,作艳也精读多次,写出了很长的读书报告,还在我开设的研究生课程“语言学前沿问题讲座”上发表观点展开讨论。经典原著往往是智者长期思考研究的结晶,因此经典原著所集中表述的一些原则和方法,后人极难超越,往往只能换一个角度。经典原著是综述评论等二手资料所不能代替的。但系统阅读经典原著需要意志和对学问浓厚的兴趣。我在研究生必修课“当代语言学”上布置了很多原文经典,要求学生阅读并作报告。很多学生叫苦连天,甚至有师生怀疑我的教学方法是否得当,但作艳是乐在其中的学生之一。冰冻三尺非一日之寒,作艳最后能看准生成词库理论并认为这种理论比较适合分析汉语中的事件强迫问题,这不是偶然的。她首次全面系统地引进这种模型来分析汉语中的事件强迫问题,在汉语分析中开辟了一个很有分量的领域。理论和材料有机结合谈何容易,这需要选择恰当的理论模型,再恰如其分地运用到材料分析中,最后发现规律而不是贴标签。这需要长期的理论积累。除了阅读经典,作艳还有一个特点是积极参加讨论班的各种专题讨论,形成了完整的知识结构。尽管她主攻的方向是共时研究的词汇语法方面,但她往往能融会贯通共时和历时的各个层面,她读书期间在《汉语学习》上发表的关于“一”的变调文章,将音系理论和c-command理论结合起来,尤其能反映她的综合能力。其实她的功力不仅仅在共时研究,她近几年给北师大文学院研究生讲授历史语言学,这门课对历史语言学知识的积累要求是很高的。理论与材料的结合

如果只阅读经典,而没有对材料的长期积累、分析研究和思考,对理解经典是没有深度的。记得Wittgenstein在《逻辑哲学论》序言中说过,“这本书也许只有那些自己已经思考过此书中所表述的思想或者类似的思想的人,才能理解”。我想阅读经典论证很多人都有这种体会。作艳求学期间积极参加科研工作,她所参加的主要课题和研究内容都涉及规则组合和不规则组合的判定问题,这样她在阅读语言学经典著作时往往能够心领神会。这使她最终能够把生成词库理论系统引入汉语,解决一系列难点问题,在汉语研究中开辟了一个阵地。

作艳能够充分理解生成词库学的精华并将其用于汉语分析,跟她长期积累分析材料有很大关系。她的本科论文研究述宾结构的分类,就分析了大量材料,这时她已经开始思考规则组合和不规则组合的判定问题。硕士期间,她又参加了我的“网络汉语研究”课题,这个课题主要想在大规模的网络文本中识别规则组合和不规则组合,尤其是面临网络上大量新产生的语素组,特别是包含有不定位语素的组合时,这一识别需求更为迫切,当时的基本思路是通过半自动方式识别其规则,并将不规则的组合纳入词库。在该课题中,作艳积累了很多关于规则和不规则的控制因素。作艳还由王洪君教授介绍到北大计算语言学所参加计算机处理大规模语料的分析工作,进一步积累了这方面的知识。她最后把硕士论文锁定在字化现象的研究上,该论文的分析思路能够充分体现她的语义分析功力。博士期间,她又到美国陶红印教授那里学习语料库语言学,接触了大量语料,并学习了不少相关的研究方法和技能。

在这些积累的基础上,作艳充分利用现代汉语语料库和汉英双语语料库中的真实语料,首次全面考察了现代汉语中的事件强迫现象,只有对材料和理论都熟悉,才能将二者结合起来,才会出现理论照亮材料的结果。作艳的第二个显著贡献在于,在精读原典的基础上准确理解生成词库理论,以事件强迫为切入点,对汉语中的一些重要现象作了很好的分析和解释,并且往往能够提出很强硬的结论。比如给出了事件强迫的必要条件:“一个动词既可以带VP宾语,也可以带NP宾语,才有可能有事件强迫的用法。”这一结论需要有大量材料分析的支持。理论建设

作艳不仅能够准确理解、启用生成词库理论,并系统地分析汉语述宾结构中的事件强迫现象,而且在理论方法上有显著贡献,其中最重要的三个方面是事件强迫统一论、名词动用论和事件强迫相对论。

在事件强迫统一论中,她通过大规模的材料分析,发现事件强迫现象是各种句法结构或词类活用中存在的一种普遍现象,据此可以把谓词隐含、名词动用、副词做定语等现象做统一的解释。她还准确地指出了事件强迫和事件压缩是同一种现象的理解过程和生成过程的两个方面。

名词动用论不是看源名词在名源动词的语义结构中充当什么语义角色,而是反过来,看名源动词在源名词的语义结构中充当什么物性角色,从而把名词动用进一步概括成了三类,解释力更强。

事件强迫相对论首先承认强迫是一种普遍的语言学机制,在汉语和英语中都有广泛的应用,但两者在事件强迫上存在显著的差异:汉语是一种高解析性的语言,倾向于每一个语义单位都以独立的词项来表达,较少采用压缩形式;相比之下,英语的综合性比较强,倾向于采用压缩形式。作艳所展开的汉英事件强迫的对比研究不仅语料丰富,论证也很有说服力。

作艳之所以能够发展生成词库理论,和她研究的深度和广度有很大关系,即使生成词库理论的建立者本人,也没有用生成词库理论对某一个语言的某一个现象展开如此深入全面的研究。对语言关联的再认识

结合作艳的研究,再回到规则和不规则问题上来。前面我们提到Chomsky(1965)站在词汇派的角度曾经对词库建设问题做了很多透彻的分析,后来的生成语法和很多其他语法模型都很重视词库研究,但普遍的趋势是,找不到规则的现象都存放在词库中,词库负担越来越重。生成词库理论认为,这些不规则现象是有规则可循的,在词汇表征中启用了大量的百科知识。

我们知道,生成词库理论大量起用语言以外的百科知识,曾经受到一些语言学家的批评。这些批评概括起来就是:非语言学知识是否是语言学家的任务?这些非语言学知识如何在语言学中形式化、规则化。格语法、认知语言学理论、广义的语义学理论、功能语法、汉语研究中基于字本位的语义句法理论,都受到过类似的批评。这些理论模型的共同特点都是不同程度地启用了百科知识,因此得到的规则、规律和原则都比较松散,不像结构语言学或转换生成语法那样,尽管研究内容比较窄,但能够得到一系列比较硬的规则、规律和原则。认知语言学曾经打出反对规则化口号,但反规则的态度必然会使科学研究目标和价值降低。其实认知语言学经常在反规则的口号下寻找规则。

我在研究提取语法单位的平行周遍条件时,注意到很多规则都会涉及的百科知识,但百科知识如果控制得不好,描写会很松散,甚至不是规则的条件。我逐渐认识到,语言知识必须要符合一种原则,可以称为语言关联原则,即语言知识应该是语言中能够区分的知识或语言形式和内容能够对应起来的知识,并成为语言规则的条件。找不到语言关联的百科知识,就不算语言知识。前面提到的“X鞋”,只要X是表示鞋的属性的语素,“X鞋”都是可以周遍类推的,比如“木鞋、金鞋、石鞋、黑鞋、白鞋”等,至于表示功用的“跳鞋、跑鞋、拖鞋”由于不满足这个条件,不能周遍类推。这里X是什么词性,能否自由运用,都不是“X鞋”类推规则的条件。这里的关键问题是:“属性”是不是语言学知识?我认为,既然“属性”能够控制这里的周遍类推规则,“属性”就是汉语中的语言学知识。当然我们不能由此认为“自由”“语类”等概念不是语言学知识,因为它们在其他层面会起作用。比如通常自由的语素才可以和介词组合。

百科知识中有很多特征是和语言关联的,在找到这种关联以前,我们认为它们是百科知识,在找到这种关联以后,就进入了语言知识。所以在语言研究中,应该允许分析大量的百科知识,从中发现语言知识。其实最近十多年来,很多学者的个案研究都显示出语言关联的存在,但学界仍然在百科知识和语言知识的问题上争论不休,其中一个主要的原因就是忽略了语言的相对性,即总想在所有语言中找到语言知识和百科知识的统一界限。其实语言关联机制在不同的语言中是有差异的。上面的“属性”语言知识可能只适合部分语言。汉语把小称和儿化语音行为关联起来,这也是一种语言知识。有些语言可能有临时表示小称的方式,但未必和语言关联起来,所以不算是语言知识。

本书的研究是全面深入的,为我们从百科知识中发现语言知识提供了大量例证和方法论思考。本书所启用的汉语知识库,实际上都包括了大量的百科知识。书中找出了很多语言关联条件,并且区分了这些条件哪些是平行不周遍的,哪些是平行周遍的,而不只是在百科知识的层面上做一些松散的描述。关于英汉事件强迫机制的异同研究,进一步说明语言关联是一种相对过程。作艳的研究,无论从具体问题分析还是理论概括,都把生成词库理论推进了一大步,并且再次引导我们从方法论的角度去思考百科知识和语言知识的关系问题。问题与未来前景

本书以事件强迫为切入点,在汉语生成词库理论研究方面已经走出了自己的道路。当然,要使汉语生成词库理论研究繁荣起来,后面还有很多工作需要做。可以从两个大的方面来看。

第一个方面,目前的事件强迫研究还有一些待解决的问题,需要进一步展开研究,以完善方法论。作艳已经在书中作了总结,特别是她已经敏锐地发现了其中存在的一些关键问题,比如事件强迫的典型性问题、强迫的效应问题等。另外,还需要思考“赶论文”“赶公交车”“赶马车”有没有区别,这种区别是基于词库的还是基于规则的。

第二个大的方面是对汉语生成词库研究的扩展。生成词库理论不仅可以用于事件强迫理论,这个模型的本质是要通过词项表征的充分描写,尤其是对各种知识的描写,最终解决传统的语法、语义、语音等参数无法解释的规则和不规则问题。这些规则和不规则问题在汉语和中国少数民族语言的各个层面都存在。中国语言条件丰富,古代汉语和现代汉语,民族语言和汉语,都有类型上的差别。把生成词库理论的方法合理地运用到汉语和中国少数民族语言的研究中,找出人类语言事件强迫行为的类型学异同,并通过大量的材料分析扩展并发展生成词库理论,这方面的研究今后大有作为。

作艳有扎实的理论基础和材料分析功底。地基已经打牢,下一步是怎么搭建更多的房屋。我相信作艳有能力带领她的学生在以上两个方面做出出色的贡献。陈保亚2014年9月13日于北街家园静山斋绪论0.1 本书的研究对象和研究思路

一直以来,语言学中有一个假设,即说话人是通过一个表达形式(expression)的组成部分来理解整个形式的意义。组合性原则(Principle of Compositionality)充分说明了这一思想:

The meaning of an expression is a function of the meanings of its parts and the way they are syntactically combined.(Partee,1984:153)(一个表达形式的整体意义是它的组成部分的意义及其各部分的组合方式的函数。)

这一原则是德国哲学家Frege提出的,因此又称为弗雷格原则(Frege's principle)。这一原则影响深远:经典语义研究强调句法组合与语义组合的严格对应;蒙塔古语法(Montague Grammar)强调意义组合原则,认为自然语言的表层句法组合精确地反映了意义是如何组合的;解释语义学(Interpretative Semantics)明确地把词汇意义与句法结构结合起来,认为意义是组合性的,句子的意义是句法结构和词汇意义共同作用的结果(Katz and Fodor,1963);生成语法(Universal Grammar,UG)也认为,句法语义的界面是句法表现与词汇语义结构之间一一对应的映射关系,这一观点隐藏在论旨准则(θ-Criterion)、投射原则(Projection Principle)(Chomsky,1981)和题元指派一致性假设(The Uniformity of Theta Assignment Hypothesis,UTAH)(Baker,1988)后面。Jacobson(1999)称之为直接组合性假设(Hypothesis of direct compositionality):就像句法直接生成表层表达,组合的意义为每一个这样的表达提供模型论(model-theoretic)解释,不需要一个媒介层。Jackendoff(1997:48—49)称符合组合性原则的形式为句法上透明的语义组合(syntactically transparent semantic composition)或者简单组合(simple composition),除此之外,还有违反这一原则的复杂组合(enriched composition)。

1)简单组合

a.一个句子的意义的所有内容成分都可以在构成此句子的词项(lexical item)的词汇概念结构(Lexical Conceptual Structure,LCS)中找到。

b.词汇概念结构的组合方式只是词项在句法结构(包括论元结构)中组合的方式的一个函数,具体而言:(i)单个词汇概念结构的内部结构不会影响词汇概念结构的组合方式。(ii)语用不会影响词汇概念结构的组合方式。

2)复杂组合

a.一个句子的概念结构除了包含词汇概念结构的概念内容,可能还包含其他成分。这些成分未以词的形式表达出来,但必须在概念结构中出现,要么是(i)为了保证词汇概念结构组合成概念结构时的合格性(well formedness)(用Pustejovsky的术语说就是强迫(coercion)),要么是(ii)为了满足话语语用学或语言外语境的要求。

b.词汇概念结构组合成概念结构的方式部分由词项的句法排列决定,部分由词汇概念结构本身决定(即Pustejovsky的协同组合(co-composition))。

Pustejovsky(1991、1995:54)提出的逻辑转喻(logical metonymy)就是一种重要的复杂组合。逻辑转喻是指一个词的句法论元看起来与那个论元的逻辑形式不同:动词或形容词语义上要求选择一个事件类(event type)论元,而实际上做论元的名词却指事物,不过事件(event)的解读可以从名词的语义获得。例如:(1)a.John began the book.b.John beganto write/to read the book.(2)a.John enjoyed the book.b.John enjoyedreading the book.(3)a.an easy problemb.a problem that is easyto solve(4)a.fast programmerb.someone whoprogrammes fast(5)a.Books bored me.b.Myreading books bored me.(6)a.The movie frightened Mary.b.Mary'swatching the movie frightened Mary.(1a)和(2a)中,begin和enjoy都要求带事件类论元,而the book却是实体类(entity type),不符合这两个动词的语义选择(Semantic selection,S-selection)要求。不过,这两个句子都是合法的,因为可以在理解中重建一个事件,(1b)和(2b)分别是对(1a)和(2a)的解释。同理,easy和fast也是要修饰表动作、事件的动词,而句法层面却是修饰指事物的名词,因此也需要重建一个事件,(3a)和(4a)的意思分别是(3b)和(4b)。例(5)和(6)一样,只是事件的重建在主语位置。在上述例句中,a句和b句表达了相同的意思,只是a句中的事件解读并不明确。a句都是逻辑转喻,在这些句子中都隐含着一个事件,而b句中的事件则直接出现在句法表层。a句实际上是名词短语被用在了动词短语的位置,是用名词短语来表达与之相关的事件,是一种转喻(metonymy)现象(参见Nunberg,1978)。之所以称之为逻辑转喻,是因为与一般的概念转喻不同,这种转喻是动词或形容词对其论元类型(argument type)的选择要求造成的,是不同范畴之间的替代,实体(entity)代事件。而概念转喻本质上是同类范畴之间的替代,表现在语言层面即同类成分之间的替代,如实体代实体(如作者代作品)、事件代事件(如前事件代核心事件)(详见代礼胜,2009)。复杂组合假设在实验中也得到了证明(参见McElree et al.,2001;Pickering et al.,2005;Traxler et al.,2002;Traxler et al.,2005等):被试在理解复杂组合的时候,比简单组合要花费更长的时间。

处理逻辑转喻的理论方法主要有五种:义项列举(sense enumeration)、意义公设(meaning postulate)、语用引申(pragmatic extension)、VP-插入(VP-insertion)和生成词库理论(Generative Lexicon Theory,GL)中的事件强迫(event coercion)。事件强迫是目前处理逻辑转喻的最新方法,因此逻辑转喻又可称为事件强迫。这些处理方法的核心任务是在坚持组合性原则的前提下来解释逻辑转喻意义的模糊性(vagueness)、歧义性(ambiguity),或者说,如何使逻辑转喻的意义解释满足组合性原则。前四种方法是弱组合性的(weakly compositional),坚持对组合性原则的直接满足。生成词库理论则是一种强组合性的(strongly compositional)理论模型,动态地满足组合性原则。具体到逻辑转喻,生成词库理论认为这是由语义类型错配(type mismatch)引起的,可以通过类型强迫(type coercion)这一语义生成机制(generative mechanisms in semantics)来实现解释。逻辑转喻属于类型强迫中的事件强迫:转喻动词(metonymic verb),或者说事件动词(eventive verb)要求带一个事件类宾语,可以是动词短语VP,也可以是指事件的名词短语NP,而实际上却带了实体类的名词短语NP做宾语,因此事件动词就强迫(coerce)这个指实体的NP进行类型转换(type shifting),变成一个事件类,这一类型转换是通过NP核心名词物性结构中的物性信息来实现的。以例(1)为例,begin是个事件动词,要求其宾语是事件论元,句法上通常实现为动词短语VP,(1b)中的to write/to read the book能直接满足这一语义选择要求。而(1a)中的the book是指事物的名词短语NP,出现了类型错配,begin就会强迫the book变成事件类,这种强迫是通过名词book物性结构中的施成角色(agentive role)write或功用角色(telic role)read实现的(如图0-1所示)。图0-1 begin的事件强迫

汉语中存在一些类似的事件强迫现象,如:(7)a.她从小就学习钢琴。b.她从小就学习弹钢琴。(8)a.这场电影不花钱。b.看这场电影不花钱。(9)a.舒服的椅子b.坐起来舒服的椅子

同时,我们发现有些名词短语NP本身是指事件的,却还可以添加一个谓词,重建另一个事件,如(10—11)中的“会议”和“选举”:(10)a.学校决定推迟会议。b.学校决定推迟召开会议。(11)a.上月末,负责波黑选举工作的欧洲安全与合作组织已决定推迟地方选举。b.上月末,负责波黑选举工作的欧洲安全与合作组织已决定推迟举行地方选举。

这些例句与(7—9)是平行的,需要做出统一的解释。本书认为事件强迫是一种解释规则,是自然语言理解中的语义生成机制,a都是一种语义压缩形式,而b都是对a的一种解释,所谓事件强迫就是重建隐含的事件、解压缩的过程。事件强迫不仅发生在句子层面,而且还发生在一些短语甚至是词汇层面以及名词动用中,如:(12)a.鲁迅的书b.鲁迅写/收藏的书(13)a.NP热:西服热、烤鸭热……b.穿西服的热潮、吃烤鸭的热潮(14)a.百度一下,你就知道。b.用百度搜索一下,你就知道

本书的研究对象就是(7—14)这些不同的事件强迫现象。我们认为,事件强迫的本质是语义压缩、事件隐含,是由动词、形容词等触发(trigger)的,这些触发成分激活一个含谓词(轻动词(light verb))的事件解读,名词通过物性结构中的施成角色或功用角色等提供一个具体的谓词,使这个隐含的事件具体化。名词短语NP并没有发生类型转换,比如,“学习钢琴”中的“钢琴”并没有变成事件类,只是“学习”激活了一个含轻动词的语义模式,“钢琴”使这个轻动词“做”变成了具体的动词“弹”。(15)学习:学习做什么学习钢琴:学习弹钢琴

具体说来,在评述前人研究的基础上,本书将界定事件强迫的性质和形式判定方法,然后基于语料库,考察各类事件强迫,找出其中的触发成分以及涉及的名词类;探讨事件强迫现象的半能产性和释义规则,找出哪些因素会影响其生成与解释;基于汉英双语语料库,比较汉语和英语事件强迫现象的异同,并尝试探究其原因。0.2 使用的语料库和语义知识库

1.语料库

汉语语料主要来自国家语委语料库和北京大学中国语言学研究中心的现代汉语语料库;汉英对照语料来自北京大学中国语言学研究中心汉英双语语料库和句酷中英文语料库;英语例句来自英国国家语料库。

1)国家语委语料库:一个大型、通用的现代汉语平衡语料库,分词并标注词性。下面是国家语委语料库的两个网址,分别选择了不同的2000万字。有时候其中一个语料库不可用,就会用另外一个。

http://219.238.40.213:8080/CpsQrySv.srf

http:/www.clr.org.cn/retrieval/link.htm

2)北京大学中国语言学研究中心现代汉语语料库,未经分词和词性标注的生语料库,约6亿字。

http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp?dir=xiandai

3)北京大学中国语言学研究中心汉英双语语料库:包括600多万汉字,近400万英文词,既有汉译英,也有英译汉,语体包括口语和书面语,文体包括应用文、新闻和文学,内容涉及政治、科技、体育、社会文化、工商、艺术和电影。

http://ccl.pku.edu.cn:8080/ccl_cecorpus/index.jsp?dir=chen

4)句酷中英文语料库

http:/www.jukuu.com/

5)英国国家语料库(British National Corpus,BNC)。

http:/www.natcorp.ox.ac.uk/

2.语义知识库

1)知网Mini-HowNet 2005

http:/www.keenage.com/

2)现代汉语语法信息词典详解(电子版)

3)北大CCL现代汉语语义词典

http://ccl.pku.edu.cn/ccl_sem_dict/0.3 本书的章节安排

除绪论和结语之外,全书共包括九章。

绪论部分界定本书的研究对象,简要说明本书的研究思路、语料来源以及章节安排。第一章简要介绍生成词库理论。第二章评述国内外关于逻辑转喻/事件强迫现象的研究方法,指出其中存在的问题,针对这些问题提出本书的解决方案,界定事件强迫的性质,并提出判定事件强迫现象的标准。第三章到第八章分别探讨述宾结构、主谓结构、方位结构、形名结构、副名结构、“的”字结构修饰名词构成的偏正结构、类词缀构词中的事件强迫,并比较汉语和英语在事件强迫上的差异(只涉及述宾结构、方位结构和形名结构),探究差异背后的原因。第九章从事件强迫的角度对名词动用做新的诠释,并比较名词动用与典型的逻辑转喻(宾语强迫)的异同。结语部分概括本书的主要结论及其应用,并指出需要进一步探讨的问题。第一章生成词库理论简介

生成词库理论是一种较新的语义理论,用事件强迫来解释逻辑转喻,在研究事件强迫之前,需要对这一理论的整体架构有所了解,因此本章对此理论作简要的介绍和评述。本章包括四节:1.1 介绍生成词库理论的核心思想;1.2—1.3 介绍其理论架构,包括词汇表征(lexical representation)、语义类型体系(type system)和语义生成机制(generative mechanisms in semantics);1.4 介绍生成词库理论目前的发展及应用;1.5 是本章的小结。1.1 核心思想

生成词库理论(Generative Lexicon Theory,GL)是美国布兰代斯大学(Brandeis University)教授Pustejovsky于1991年提出的。1995年出版了专著《生成词库》(The Generative Lexicon),其理论框架基本成形(1)。之后生成词库理论的基本思想虽然没有变,但整个理论构建发生了一些根本性的变化:基于对物性结构(qualia structure)的分析,提出了名词的三大语义类型(semantic type)——自然类(natural type)、人造类(artifactual type)和合成类(complex type),并把这种分类扩展到了动词和形容词,构建了其语义分类体系;在此基础上,提出了更系统的基于论元选择的语义生成机制。

生成词库理论首次把广义的生成方法引入到词义和其他领域的研究中,是在研究了词的创造性用法的基础上建立的词义表示方法,是基于计算和认知的自然语言意义模型。这一理论关注词义的形式化和计算,试图解释词的不同用法以及在上下文中的创新性用法,其主要目标是研究各语言中的多义、意义模糊、意义不确定(underspecified)和意义变化等现象。尤其关注有规则的多义(regular polysemy)(Apresjan,1973),即系统性多义(systematic polysemy),Pustejovsky(1995:27—38、2011)称之为逻辑性多义(logical polysemy)、语境调节(contextual modulation)。所谓逻辑性多义是指同一个词在不同上下文中的具体意思略有差别,但彼此关联,基本意义不变,而且其关联方式在一个语言中很常见,呈模式化。Pustejovsky(2006、2011)将逻辑性多义分为两类,一类是内在性多义(inherent polysemy),如“学校”“医院”既可以指机构也可以指处所。另一类是选择性多义(selectional polysemy),如begin可以选择不定式短语、动名词短语和名词短语做宾语,会因为宾语的不同而有细微的差异,但begin的基本意思没变。(1)a.John began to read the novel.(不定式短语)b.John began reading the novel.(动名词短语)c.John began the novel.(名词短语)

逻辑性多义不能直接满足组合性原则,传统的语义学采用义项列举(sense enumeration)的方法来解决这一问题,如“学校”“医院”分列两个义项,begin分列三个义项。这是一种静态的词义描写方法,虽然直接满足了组合性原则,体现的却是弱组合性(weak compositionality)(Pustejovsky,1995:59—60;Pustejovsky,2011)。其缺点是不经济,而且阻止了词义的渗透性,不能说明词语在上下文中的创新性用法,不能制约词义在上下文中的变化,也不能说明词汇转换(lexical transfer)的现象。生成词库理论持强组合性(strong compositionality)的观点,认为语言的意义是组合性的(compositional),但这种组合是动态的、生成的,词项(尤其是做论元的词项)会改变自己的意义来适应组合的要求。生成词库理论的核心思想是,一个词项的意义是相对稳定的,到了句子层面,在上下文中,通过一些语义生成机制(组合机制(compositional mechanism))可以获得生成性意义,即词会在组合中受语境的影响而进行自我调节,凸显自己意义的不同方面。要抓住这种生成性的意义,需要丰富词项的词汇表征和语义生成机制,生成词库主要包括这两大部分。内在性多义在词汇表征中解决,选择性多义通过语义生成机制来解决:语义生成机制通过选用(exploit)词项(论元名词)中的信息来生成具体的语义解释。因此,“学校”“医院”、begin三个词在生成词库理论中都只有一个义项。生成词库理论尽量保持了词项语义的单一性,把意义的变化放到组合层面去解决,并提出了相应的语义生成规则,不仅避免了不合理的多义处理,而且把词义与短语、句子的意义联系在了一起。1.2 词汇表征

1.2.1 词汇表征的四个层面

一个词项的词汇表征包括四个层面:论元结构(argument structure)、事件结构(event structure)、物性结构(qualia structure)和词汇类型结构(lexical typing structure)。

1)论元结构:说明论元的具体数目、类型以及如何实现到句法层面。

2)事件结构:说明事件的类型,包括状态事件(state event)、过程事件(process event)和转态事件(transition event),like、run和build分属这三种事件类型;事件可能有子事件(subevent),说明哪个子事件是核心事件(core event);说明事件的组合规则,比如事件发生的先后顺序。

3)物性结构:描写词项所指对象(object)由什么构成、指向什么、怎样产生的以及有什么用途或功能。包括构成特征(constitutive quale)、形式特征(formal quale)、功用特征(telic quale)和施成特征(agentive quale)。这四个特征通常被称为构成角色(constitutive role)、形式角色(formal role)、功用角色(telic role)和施成角色(agentive role)(2)。物性结构最早源于亚里士多德的“四因说”(Aristotle's four causes),四因包括质料因、形式因、目的因和动力因。Moravcsik(1975)将四因解释为生成性因素(generative factor),Pustejovsky受其启发,将四因引入了词义的描写中。四种物性角色(qualia role)提供四个不同方面的语义信息:

A.构成角色:描写对象与其组成部分之间的关系。包括材料(material)、重量(weight)、成分(constituent)和组成部分(part)。

B.形式角色:描写对象在更大的认知域内区别于其他对象的属性。包括方位(orientation)、大小(magnitude)、形状(shape)和维度(dimensionality)等。

C.功用角色:描写对象的用途(purpose)和功能(function)。

D.施成角色:描写对象怎样形成或产生的,如创造、因果关系。

功用角色又分两种,一种是直接功用角色(direct telic role),事物是功用角色所表达的活动的直接对象,表现在名词通常可以做其功用角色的宾语。如啤酒是喝的直接对象,所以“喝”是“啤酒”的直接功用角色。另一种是间接功用角色(indirect telic role),事物不是功用角色所表达的活动的直接对象。工具类名词通常具有间接功用角色,譬如“切”就是“刀”的间接功用角色,因为刀不是切的对象,而是用来切其他东西的工具。(2)a.drink-beerb.cut with a knife

以“小说”为例,它的构成角色是“故事”“封面”等,典型形式角色是“书”,功用角色是“读”,施成角色是“写”。需要注意的是,不是每个词都具有四种角色。除了上述四种角色,自然功用角色(natural telic role)和规约化属性(conventionalized attribute)也开始被纳入广义的物性结构(the extended qualia structure)(3)(参见Pustejovsky and Jezek,2008;Jezek,2012)。自然功用表示事物的天然功能,与意图和目的无关。如“抽压血液”是“心脏”的自然功用。规约化属性指事物的典型特征,包括自然物的典型用途、与事物相关的常规活动等。比如“叫”是“狗”的规约化属性,“消化”是“食物”的规约化属性。图1-1 词汇类型结构中的物性角色继承关系4)词汇类型结构:说明一个词项在一个语言系统中的语义类型。这决定了此词项与其他词项的关联方式,也就是继承关系。这一层面在早期的理论框架中叫词汇继承结构(lexical inheritance structure)。如图1-1所示(Pustejovsky,1995:145),一个词可以从多个上层概念继承特征,dictionary(词典)从reference(参考书)继承功用角色consult(参考)(4),从compiled_matter(编纂物)继承施成角色compile(编纂),从book继承形式角色hold(容纳);play(剧本)从book(书)继承形式、功用和施成角色,book从information(信息)继承功能和施成角色,从Phys_obj(物质实体)继承形式角色。近十几年来,Pustejovsky等学者对这一部分做了很大改动,主要基于物性结构中的物性角色,把词汇的类型分为自然类、人造类和合成类,并据此建构了整个语义类型体系。下文将单列一节来重点介绍和评述这一体系。一个词项α的词汇表征通常如(3)所示(Pustejovsky,2005):(4)是book(书)的词汇表征:book有两个论元,一个指物质实体(physical object),一个指信息,book是二者合并的一个词汇概念聚合(lexical conceptual paradigm,lcp,详见1.2.2 ),它的形式角色是hold,表达的是物质实体里装载着信息。功用角色是read,施成角色是write(Pustejovsky,1995:116)。(5)是kill(杀死)的词汇表征:kill有两个论元,一个指个体的物质实体,一个指有生命的物质实体;kill包括两个子事件,一个表过程kill(杀),一个表状态dead(死),第一个事件是整个事件的核心。kill是个表致使的词汇概念聚合,其施成角色是kill这个动作,其形式角色是dead这个状态(Pustejovsky,1995:102)。这部分的分析与词义分解沿袭自生成语义学(Generative Semantics)的分析。1.2.2 语义类型体系生成词库理论假设人类的认知能力反映在语言中,尤其反映在心理词典(mental lexicon)中,这个词典是复杂、动态(dynamic)而又连贯的知识系统,是结构化的语言学运算(structural linguistic operation)和生成意义的组合规则(compositonal rule)之间的接口(interface)。词汇按其所代表的意义内容分为自然类、人造类和合成类(Pustejovsky,2001、2006)。1)自然类(natural type):与物性结构中的形式角色、构成角色相关的原子概念,从上位类继承形式角色,是其他类的基础,其谓词来自于物质域。图1-2是自然类的上层分类(Upper Natural Type Lattice)。图1-2 自然类的上层分类例(6)中的rabbit(兔子)就是自然类名词:(6)The rabbit died.2)人造类(artifactual type(6)(intentionality),即目的和意图。good是评价性的,与“意向性”相关,(7a)可以说,而(7b)不可以说,就是因为chair(椅子)是人造类而rock(岩石)是自然类。(7)a.This is a good chair.b.*This is a good rock.(7)具体到一个特定的名词,都会跟自然类和人造类发生联系,人造类也需要物质继承,必然与自然类相联系。如人造类beer(啤酒)是自然类liquid(液体)结合了施成角色brew(酿造)、功用角色drink(喝);knife(刀)是自然类phys(物体)结合了施成角色make(制造)、功用角色cut(切)。(8)a.beer:(liquidA brew)Tdrinkb.knife:(physA make)Tcut另如beverage(饮料),它的基础类(ground type),也就是它的自然基础是liquid(液体),它本身是人造类,与功用角色drink相联系。这个类型可以记作liquiddrink,是张量类型(tensor type)。是张量类型构造器(the tensor type constructor),表示把一种物性关系引入到一个类型,使之成为这个类型的一部分。根据不同的具体功能,beverage又可以细分为下面的小类(Pustejovsky,2001):图1-3 beverage的下位类及其功用角色继承这样,通过继承,人造类就有多个功用角色,有的离得近,有的离得远。如coffee(咖啡)就有两个功用角色,一个是继承来的drink(喝),一个是自身的wake-up(提神),咖啡要喝了才能提神,继承的功用角色可以看成是根植在“咖啡”自身功用角色中的施成角色(8),如(9)所示(Pustejovsky,2001):指人的名词也有自然类和人造类之分,如图1-4(9)所示,表职业的名词doctor(医生)、surgeon(外科医生)都是人造类名词。图1-4 自然类、人造类的物性角色继承关系3)合成类(complex type):在生成词库理论中又称为“点对象”(dot object),因为其类型构造以一个圆点为标志。合成类从两三个自然类和/或人造类继承角色,在描写中以lcp为标记:把一个词的不同义项合并到一个元词条(meta-entry)中,这个元词条叫词汇概念聚合(lexical conceptual paradigm,lcp)(10)(Pustejovsky,1995:91)。这样可以大大缩小词库的规模。如上文中例(4)所示,book就是一个合成类[phys·info],是phys_obj(物质实体)与information(信息)合成的,它的形式角色反映了二者之间的关系是hold。另如:EVENT·INFO:lecture,play,seminar,exam,quiz,testEVENT·PHYSOBJ:lunch,breakfast,dinner,teaEVENT·(INFO·SOUND):concert,sonata,symphony,songlecture是事件和信息的合成类,既指一个事件,同时带有信息内容;lunch是事件和物质实体的合成类,既指一个有时间过程的事件,也指具体的食物;concert既是事件,又有信息和声音。合成类用来处理逻辑性多义中的内在性多义。不同的语境会选择合成类的不同义面或整体的意思,例如,(10a)中的量词“摞”凸显了“书”的物质实体义,(10b)中的“有趣”凸显了“书”的信息义,而(10c)中的“书”两个意思都凸显,分别与“厚”和“有趣”组合:(10)a.那儿放着一摞书。(物质实体)b.这是一本有趣的书。(信息)c.那本厚书很有趣。(物质实体·信息)三大语义类的区分是以名词为出发点的,动词、形容词根据其与名词语义类的对应关系也相应地分为三大类,如上文例(6)中的rabbit是自然类,die就是自然类。图1-5是三分的概念网络(Tripartite Concept Lattice),最上层概念被结构化成实体、事件和性质三个域,分别对应名词、动词和形容词三大范畴。每一个域又被结构化成自然类、人造类和合成类,由简单到复杂。图1-5 三分的概念网格下面是三大范畴的分类举例:1)NounN:rock,water,woman,tiger,treeA:knife,beer,husband,dancerC:book,lunch,university,temperature2)VerbN:fall,walk,rain,put,haveA:donate,spoil,quenchC:read,perform3)AdjectiveN:red,large,flatA:useful,good,effectiveC:rising1.2.3 词汇表征的特点与以往的语言学理论模型相比,生成词库理论在词汇表征方面主要有三大创新和特色。1)丰富了名词的词汇表征。与传统的以动词为中心的理论模型不同,生成词库理论强调名词在语义组合中的重要性,认为意义变化等很多语言现象可以从名词的语义中获得解释。因此,像描述动词一样对名词的语义进行了详细的描述。尤其是通过物性结构说明了与一个词项相关的事物、事件和关系的基本属性,说明了一个名词中典型的谓词和关系。物性结构实际上是范畴交叉的表征工具,物性结构为词提供功能标签,把词与概念网络联系起来,是概念逻辑的组织原则。物性结构是词库生成性特征(generative property)的核心,不仅决定了词项的语义类,还为新的语义类的创造提供策略(Pustejovsky,2011)。物性结构之于名词,就像论元结构之于动词。物性结构决定了名词的语义,就像论元结构决定了动词的语义(Pustejovsky,1991;Pustejovsky and Boguraev,1993)。2)通过物性结构,把日常经验知识与词汇语义连接在一起。关于语言知识与非语言知识的问题一直是语义研究中的一个难题,传统语义学认为语言知识与非语言知识有明显的界线,必须加以区分,后者不是语言研究的对象(利奇,1974);认知语言学(Langacker,1987;Lakoff,1987;Taylor,1989)则认为语言知识和非语言知识没有明显的界线;框架语义学

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载