南方语言学(2015)(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-06 13:09:03

点击下载

作者:甘于恩

出版社:暨南大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

南方语言学(2015)

南方语言学(2015)试读:

特稿

“中国音系数据库”的构建及用途

*端木三(密歇根大学 美国密歇根州)

提要 本文先介绍现有的音系数据库UPSID和P-base的收录方法和内容,再指出它们的一些缺点,然后介绍新建的“中国音系数据库”,包括收录方法、内容及应用。本文还通过一些例子,比较详细地讨论音系数据库如何用于理论研究,特别是对特征理论、音节理论和音位分析理论的研究。

关键词 中国音系数据库 语音特征 音位 音节一、现有的音系数据库

音系数据库包含多种语言的音系信息,是探讨语言规律的主要工具。常见的音系数据库有3个,基本信息见(1)~(2)。(1)常见的3个音系数据库的名称。中文英文名简称Stanford Phonology Archive斯坦福音系档案SPAUCLA Phonology Segment 加州洛杉矶大学音UPSIDInventory Database系数据库音系数据库P-baseP-base(2)常见的3个音系数据库的细节。简称创建时间音系数量文献SPA70年代200Crothers et al,1979Maddieson,1984;UPSID80年代451Maddieson & Precoda,1990、2011P-base2004—2007628Mielke,2004-2007

SPA创建于20世纪70年代,包括200个音系(其中一两个点的资料不全)。当时的音系研究很少大量引用资料或量化数据,所以SPA的建立具有开创性意义。SPA的内容可见(3)~(4)。(3)SPA的内容举例:音位特征(Crothers et al.,1979: 5)。(4)SPA的内容举例:音位细节(Crothers et al,1979: 6)。

例(3)所示的是SPA中的第一种语言——Hausa的音位及其特征。例(4)所示的是Hausa的音位细节说明,包括文献来源。可以看出,SPA细节繁多,使用不便,而且没有公开的电子版本,因此现在已经基本上没人使用SPA了。

UPSID的创建紧随SPA之后,它几乎全盘吸收了SPA所收录的音系,而且还增加了许多音系。UPSID的初版有318个音系(Maddieson,1984),后来又扩展到451个音系(Maddieson & Precoda,1990、2011)。UPSID的内容见(5)~(7)。(5)UPSID的音位表(共451种语言、13 966个音位)。(6)UPSID的音标表(共921项)。(7)UPSID的特征表(共64项)。(8)UPSID的元音、辅音表。

例(5)显示每种语言的音位音标。每种语言都有个代码,从2000开始,不过代码意义与本文无关。音标采用的不是国际音标,而是普通的ASCII编码,不同操作系统的电脑都能使用。例(6)是音标表,共921项,每项都有该音标的特征注解。例(7)是特征表,共64个特征术语。例(8)是例(5)信息的重新组合,包括每种语言的代码、名称、音位总数、元音组、元音数、辅音组和辅音数。

SPA和UPSID的建立都有多人参加,而且耗时多年。P-base则是由博士研究生Jeff Mielke一人所建。除了提供音位以外,P-base还详细收录了每种语言的音变规则(allophonic rules)和音位分布规率(distribution patterns),P-base的详细内容见(9)。(9)P-base的内容。

每种语言的内容包括语言名称、资料来源、语言归类、语言使用地区、语言代码、核心音位、边缘音位以及音变规则和分布规律。例(9)只显示了一条语音规则,即英语的元音在鼻音前会产生鼻化。还可以看出,英语没有边缘音位,而且音位全部采用国际音标标注。

以上介绍了现有音系数据库的内容。现在介绍它们的收录方法。SPA和UPSID采用的都是均衡采样(balanced sampling),即以每种语言分支取一种语言作为代表的方法进行收录。而且,因为SPA和UPSID的重点是音位,所以很多资料来源都是短文。P-base为了收集音变规则和分布规律,必须依赖更详细的资料。因此,P-base的资料来源限于专著和博士论文。不过,P-base穷尽收集了图书馆所有的英文出版书目,所以也不失为一份客观采样。二、音系数据库的用途

音系数据库的建立有力地推动了一系列理论研究,特别是对语言规律的探讨。下面我们举一些例子,见(10)。(10)使用音系数据库的研究举例。

Trubetzkoy(1939)是探讨音系普遍规律的主要创始人。他本人收集了200种语言的资料,书中的理论多是以这些语言数据为依据。其他列举的研究多在一流学术刊物上发表,如Language、Science。Liljencrants & Lindblom(1972)提出的元音分布理论,影响深远。他们的音系语料来自Trubetzkoy(1939)以及SPA。Lindblom(1986)对Liljencrants & Lindblom(1972)的理论提出了一些修改,其语料数据也是来自SPA。Haspelmath et al.(2005)更是对世界语言的普遍特征作了一系列的概括,其中有关音系的各种论文共计19篇。Hay & Bauer(2007)、Donohue & Nichols(2011)、Moran et al.(2012)等对音位数量跟人口数量是否有相关性这一问题展开了激烈的讨论。他们的论点有的来自SPA、UPSID的数据,有的来自自己收集的语言数据。而Atkinson(2011)、Wang et al.(2012)则通过音位数量的多少来探讨人类语言的起源地,两篇论文都发表于自然科学的一流刊物Science。

与音位系统有关的研究很多。我们将对主要的一些进行总结,见(11)。其中不少课题来自Haspelmath et al.(2005)的音系部分。(11)跟音位系统有关的研究课题举例:

最常见/罕见的元音/辅音有哪些?

最常见/罕见的音位系统有哪些?

辅音数量跟元音数量是否有互补关系?

音位数量跟音节长短是否有互补关系?

音位数量跟人口数量是否有相关性?

音位数量跟语言是否古老有无相关性?

世界的语言一共有多少不同的元音、辅音?

下面我们对(11)的最后一个问题进行更深一层的讨论。首先,我们同意Maddieson(2005)的说法:元音的数量可以分成两个部分,一部分是基本元音(basic vowels),另一部分是非基本元音(non-basic vowels),见(12)。(12)基本元音与非基本元音。

基本元音:由舌位高低、前后及圆唇变化构成。

非基本元音:双元音,或由基本元音加鼻化、送气、长短构成。

不少人(如Ladefoged,1972;Flemming,1995)认为,很多语音的特征或维度(phonetic features or dimensions)都是延续的。比如,舌位的前后、高低都是延续的。每种语言可以自由决定每个维度分几个对立、每个对立的划分边界在哪里。下面我们用舌位举例。

Flemming(1995)提出,舌位前后、高低的对立由两个因素决定,一个是最小可辨区别(just noticeable difference)、一个是最小听辨距离(minimal perceptual distance),见(13)~(16),其中两个圆点间的距离表示最小可辨区别,整个前后空间假设分为15级可辨区。(13)舌位前后、高低对立的两个因素(Flemming,1995):

a. 最小可辨区别决定最多对立可能。

b. 最小听辨距离(即两个对立点之间的最小可辨区别数)决定实际对立数。(14)舌位前后、高低对立的图示:圆点间距离=最小可辨区别。(15)舌位前后对立的图示:最小听辨距离:前后=2。(16)舌位前后对立的图示:最小听辨距离:前后=4。

根据最小可辨区别,舌位的前后、高低可以分出许多对立等级,两组等级又可以产生许多组合。假如前后对立分15级、高低对立分10级,一共就有150种可能组合,如(14)所示。当然,以最小可辨区别作为对立的分级依据未必实际,难免产生错误。所以,为了听觉的方便,实际要求的最小听辨距离往往大于最小可辨区别。如果我们将前后对立的最小距离定为2(即两个最小可辨区别),那么前后可以有8级对立,见(15)的A~H。如果我们将前后对立的最小距离定为4,那么前后可以有4级对立,见(16)的A~D。

值得注意的是,确定了一个最小听辨距离后,仍然可能有多种不同结果。比如,如果我们将前后对立的最小距离定为4,仍然起码有5种对立系统,见(17)。(17)舌位前后最小听辨距离等于4时,仍然可能有多种对立系统。

Disner(1983)研究了各种语言的元音舌位,发现(17)所示的这种语言的对立系统间的确存在细微区别。因此,在(17)的几个对立系统中,即使每个系统的对立数相同(都是4级对立),我们仍然不能将一个系统中的元音等同于另外一个系统中的相对元音。比如,(17a)的A跟(17b)、(17c)的A位置不一样。(17a)的A跟(17d)的A位置虽然一样,但是(17a)中A~B的距离跟(17d)中A~B的距离不一样。可是,音位数据库中,遇到(17a)~(17e)这种情况,人们往往用同样的一组音标来代表A~D。因此,不少学者认为,按照音标的异同来统计音位数据库中的元音数量在方法上是错误的,在实际上基本是不可能的(如Ladefoged,1972;Disner,1983;Flemming,1995)。

国际音标系统的结论也基本上一样。比如,仅仅围绕[i]这个基本符号,国际音标中起码有9种不同的元音,见(18)。(18)舌位前后、高低对立的图示:两点间距离=最小可辨区别。

对每个元音符号,国际音标可以附加“略前、略后、略高、略低”等符号,因而产生9种对立。如果这些对立不在同一语言里出现,人们往往只选用最简单的符号,即[i],无论它是否略前、略后、略高、略低,那么语音的实际值就被忽略了。

不过,以上有关舌位前后最大对立数的讨论基本属于推测。下面我们讨论音系数据库中实际出现的舌位前后对立。首先,我们讨论音系理论最根本的一个原则,即“对立原则”(Principle of Contrast)。我们用(19)定义对立(contrast),用(20)定义对立原则。这两项定义是音系理论的基础,均无争议。(19)对立(contrast):

a. 如果两个音A、B在任何一种语言里都能够区别词义,A、B就有对立。

b. 如果两个音A、B在任何一种语言里都不区别词义,A、B就无对立。(20)对立原则(Principle of Contrast):

a. 如果两个音A、B有对立,它们必须加以区别(用不同音标表示)。

b. 如果两个音A、B无对立,它们不须加以区别(可用相同音标表示)。

下面我们讨论如何运用对立原则来分析实际出现的舌位前后对立。我们提出如下步骤,见(21)。(21)分析舌位前后的步骤:

a. 从音系数据库提取所有有关舌位前后的不同音标。

b. 将这些音标按舌位前后排序。

c. 逐一排查每个音标是否跟其左右的音标有对立。

d. 去除无对立的音标。

下面我们演示(21)的操作。假如我们从某个音系数据库收集到9个前后不同的音标,如(22)。这些音标只有舌位前后区别,没有其他区别(即其他特征皆为“高”、“非圆唇”、“紧”)。(22)只有舌位前后区别的音标:(9级对立)

首先,我们排查每种语言的元音系统,看是否有对立。如果没有对立,我们可以认为不必区别,就是[i]。所以,我们排除,留[i],见(23)。(23)第一步:检查是否有对立。

a. 排查每种语言的元音系统,看是否有对立。

b. 如果无对立,则不必区别,可以等同于[i]。

c. 排除,简化最大对立组:(8级对立)。

第二步,我们检查[i i],方法相同。如果[i i]无对立,我们可以排除[i],见(24)。如果[i i]有对立,我们进一步检查。如果无对立,我们还是可以排除[i]。(24)第二步:检查[i i]是否有对立。

a. 排查每种语言的元音系统,看[i i]是否有对立。

b. 如果[i i]无对立,则[i i]不必区别,[i]可以等同于[i]。

c. 排除[i],简化最大对立组:(7级对立)。

如果我们用UPSID、P-base这两个音系数据库,重复(23)、(24)的步骤,所得到的结果将是(25)。(25)最大舌位前后对立结果(“高”、“非圆唇”、“紧”元音):

[i ɯ](2级对立)

我们发现,元音舌位前后的对立最多只有两级,高元音如此,其他元音也如此。还可以证明,如果排除长短、舌根前后(有时也叫“松紧”或“tense”),元音的高低也只分两级。比如,英语的前元音有5个[i ɪ e ɛ æ],其中[e]实际上是长元音[e:]或双元音[ei]。如果排除[e],英语的前元音只有4个[i ɪ ɛ æ](甚至只有3个[i ɪ ɛ],因为[æ]经常是个长元音),它们可以用两极高低加两级舌根前后来区别。同样,(18)所示的跟[i]有关的9个元音,牵涉三级前后区别、三级高低区别,但是可以证明,这些区别都无对立性,因此没有区分的必要。

我们得出的结果有两个理论意义:第一,实际的对立系统比前人想象的要简单得多;第二,如果只有两级对立,不同语言的元音就有了可比性,因为对任何一个特征来说,只有这两级对立才是有音系意义的,其他的细微区别都是无音系意义的。三、现有数据库的缺点

现有音系数据库有不少缺点。比如,UPSID的语料来源很多是几

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载