应用语言学研究方法与论文写作:中文版(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-24 15:21:39

点击下载

作者:文秋芳,俞洪亮,周维杰

出版社:外语教学与研究出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

应用语言学研究方法与论文写作:中文版

应用语言学研究方法与论文写作:中文版试读:

前言

2001年外语教学与研究出版社出版了文秋芳用英文撰写的专著Applied Linguistics: Research Methods and Thesis Writing。该书作为研究生课程教本,给英文专业应用语言学方向的研究生在研究方法与论文写作方面提供了系统的帮助。

随着对外开放与交流的进一步扩大,近年来各级各类各语种的语言学习蓬勃发展,非英文专业和中文专业在应用语言学领域的研究也随之需求大增。为了让更多的读者受益,也为了能与这些专业的同行们交流,我们决定用中文撰写《应用语言学研究方法与论文写作》一书。全书分绪论、研究方法、论文写作3个部分,共15章。绪论中介绍了研究的定义、分类和相关的基本概念。研究方法部分是本书的重点,其中包括:提出研究问题、阅读文献、选择研究设计、问卷调查、实验研究、个案研究、微变化研究、统计学入门、定量数据分析和定性数据分析。论文写作部分包括论文结构、论文撰写和论文格式。

本书行文流畅、条理清晰、概念明确、可读性和可操作性强,可作为中文系和各外语语种应用语言学方向研究生的教材,也可作为应用语言学方向研究人员的参考书。本书的出版得到外语教学与研究出版社的大力支持,许家金博士对全书进行了仔细校对,并提出宝贵的修改意见,在此表示衷心感谢。

王艳、郭纯洁允许我们将他们已经发表的论文收编在附录中,在此一并致谢。第一部分绪论

绪论包括两章。第一章介绍“研究”的定义、过程及分类,第二章解释相关的基本概念。通过绪论的学习,你应该能:

·理解“研究”的基本标准;

·了解“研究”全过程;

·区别不同类型的“研究”;

·掌握与“研究”相关的基本概念。第一章 研究的定义、过程及分类第一节 “研究”的界定

应用语言学研究者E. Hatch & H. Farhady(1982)将“研究”定义为:“用系统方法探求问题的答案”(a systematic approach to finding answers to questions)。这个定义涵盖了研究的3个要素:问题(questions)、系统方法(a systematic approach)和答案(answers)。本书将采用Hatch和Farhady的定义,系统描述研究方法和指导论文写作。

图1.1根据上述定义描述了研究的简单模式。所有的研究都始于问题,解决问题的手段是系统的研究方法,最终得到的结果是问题的答案。有了适当的问题,并不能自动产生系统的研究方法,没有系统的方法自然不会得到有效的答案。退一步说,即使找到值得研究的问题,又采用了系统的方法,答案有时也未必有效,因为研究结果的解释可能会有悖逻辑,或经不起推敲。因此,从事研究时,3个要素必须等量齐观,不能厚此薄彼。图1.1:研究模式简图1.确定研究问题

确定研究问题是研究的第一步。然而要找到令人满意的问题并非易事。所谓令人满意的问题必须满足3个条件:有价值(significant)、有新意(original)、有可行性(feasible)。

所谓有价值,指的是实用价值或理论价值。前者指研究结果能对实践活动的改进提出建议;后者指对现存理论提出挑战、支持或补充。一项研究可能具有实用价值或者理论价值,或者两者兼而有之。但不少缺乏研究经验的人时常提出价值不大的问题。例如,有人提出:“在二语写作中,写作水平高的人所犯语法错误是否少于写作水平低的人?”显然,写作水平高的人肯定比写作水平低的人要少犯语法错误,否则何以称作写作水平高的人呢?如果把问题改成“写作水平高的人与写作水平低的人相比,他们在语法准确性方面有何不同?”就有价值了。这样的研究结果一方面可以帮助教师了解写作水平高的人与写作水平低的人在语法准确性上存在的差异;另一方面这些结果可以为建立中介语发展的理论模式提供证据。

所谓问题有新意,是一个相对的概念,它存在于完全没有新意到很有新意的一个连续区间内。完全没有新意的题目可能有两种。一种是前人在这个领域中已经研究得非常透彻,第二种是所提的问题纯属常识性问题,答案不究自明。具有百分之百新意的问题是指没有文献可查考,没有方法可借鉴,一切都需要研究者自己去尝试的问题。笔者认为完全没有新意和具有百分之百新意的问题都不适合硕士生和博士生做研究。比较合适的新意程度是:提出的问题与前人的研究有些相同,又有些不同。不同点可以体现在一个或多个方面,例如学习者成绩上的差别有的是因为学习环境不同,有的是因为学习者的类型不同,有的是因为收集数据和分析数据的方法不同。

所谓有可行性,指的是研究者能在规定的时间范围内,利用现有的人力、物力、财力找到问题的答案。这一要求似乎有点多余,然而初搞研究的人往往对这一点认识不足,常常有好高骛远的毛病。

爱因斯坦曾经说过:“提出一个问题往往比解决一个问题更为重要。解决一个问题也许只需要数学上的运算或实验的操作,而提出新的问题,新的可能性,从新的角度去看旧的问题却需要创造性的想像力,这标志着科学的真正进步。”因此,确定一个好的问题是研究中最难的一部分,而这一点往往被人们忽视。研究就好比长途跋涉,问题确定得不好,就会误入歧途,结果既浪费时间又浪费精力。难怪Nunan(1992:211)在书中强调“只要能把研究问题确定好,花多少时间都值得。”2.运用系统的研究方法

本书所阐述的应用语言学研究是社会科学领域内教育科学和语言科学的交叉性学科研究。众所周知,语言现象、教育过程错综复杂,如果不能运用适当的科学方法,进行系统的研究,往往就无法得到有信度、有效度、有价值的发现。

系统的研究方法是一种科学的、公认的、可操作的、可重复的研究方法。它需要一整套明确、合理的研究步骤。这些步骤的合理性决定了研究结果的可信度。如果是采用定量设计,这些步骤必须在收集数据之前确定,并要通过先导性试验,对不完善的地方进行调整后,再进行正式研究,以确保设计步骤的可行性。如果是采用定性设计,具体步骤通常在研究过程中逐步确定。这两种情况,不管哪一种,选择研究对象的步骤、收集数据的过程和分析数据的方法都应该有理有据,清清楚楚记录在案。换句话说,研究过程中的所有步骤都是公开、透明,可表述的,每个步骤都应该有科学的依据和合理的解释,而不是研究者随心所欲的决定。

运用系统的研究方法从事研究也是社会科学中进行重复研究的必要条件。如果一项研究设计的步骤含混不清,别人就无法重复,无法验证,缺乏可比性。这一点在我国还没有得到足够的重视。自然科学实验结果的发表一般是多次试验的结果。而社会科学研究的对象是千差万别的人,我们不可能在同一批受试者身上多次重复某一项试验,因此社会科学的研究结果必须要由其他研究者进行重复检验,只有在多次重复研究的基础上,我们才能建立比较可信的理论。3.寻求有效度的答案

作为一项研究,就必然希望寻求一个有效度的答案。所谓问题的答案要有效度,就是说答案是惟一的答案。如果还有其他答案,这项研究的效度就要受到怀疑。这里我们不妨来看两个例子。例如:某项研究的问题是:“阅读量与词汇量是否有密切的关系?”研究结果发现阅读量与词汇量之间存在着正相关,换句话说,二语学习者阅读量越大,他们的词汇量就可能越大。这一研究结果看起来既符合我们的直觉又合乎逻辑。然而,一位有经验的研究者很快发现该项研究中所用的词汇测试存在严重问题,这时答案的效度就值得怀疑,因为这个问题现在有了两个答案:(1)阅读量与词汇量之间的确存在着密切关系;(2)阅读量与词汇量可能没有密切关系,但由于词汇测试的偏差,产生了正相关的关系。再如,有一项研究旨在研究二语学习中的性别差异。研究发现在英语水平测试中,英语专业的女生比男生考得好,研究者由此得出结论:在二语学习方面,女生比男生聪明。很明显,关于这一现象,我们可以有十余种解释,如:女生比男生花的时间多;女生比男生把考试当回事;最聪明的男生去学理工科,而没有学英语专业,等等。既然其他的解释也讲得通,那么,这一结论的效度就值得怀疑。第二节 研究过程

人们常常从不同的角度,用不同的方法来观察研究过程。这里,我们介绍的“循环说”和“流程说”就是其中的两种。1.循环说

Rudestam & Newton(1992)认为研究过程的各个阶段是循环往复的。简单地说,研究过程至少由两个循环组成,每个循环有四个阶段(参见图1.2)。第一个循环的各阶段依次为:进行实际观察、提出假设、建构理论框架、产生具体选题。第二个循环的各阶段依次为:收集数据、分析数据、把研究成果纳入某一理论框架,再确定新的研究选题。Rud-estam和Newton认为归纳和演绎应该贯穿研究的全过程,大致说来左边的各步骤使用的是归纳,右边的各步骤使用的是演绎。

第一循环

第一循环始于实际观察,通过观察,确定研究方向;第二阶段提出假设,即以陈述形式对变量之间的关系进行描述,如:学习目的与选择学习策略有关;第三阶段根据相关理论和前人的研究,提出一个理论框架,然后把假设置于理论框架内考察。初做研究的人觉得这一阶段很难、要求很高;第四阶段产生具体的研究选题,选题一旦确定,第一个循环就完成了。

第二循环

第二循环的第一阶段是针对要研究的问题收集数据,这一过程也可以看作为实际观察的一种形式。第二阶段是分析数据。第三阶段形成理论框架,即在分析数据的过程中,研究者通过归纳进行概括,然后把概括出的东西形成理论框架。第四阶段根据理论框架,提出新的研究问题,并进一步明确研究的意义。“循环说”强调研究的动态性和循环性。但这个模型以定量研究为基础,没有考虑定性研究的实际情况。定量研究是为了检验假设,验证理论;而定性研究初期不可能形成完整的假设。我们以后再对这个问题进行讨论。2.流程说

Wen(2001)提出的“流程说”(参见图1.3)比较简单,易于理解,更适合研究新手。它强调的是研究全过程应该完成的任务和步骤,而不是这些任务或步骤之间的相互作用。根据图1.3,研究包括6项任务:确定选题、阅读文献、选择研究设计、收集数据、分析数据、撰写论文。这里用向下的箭头表示6大任务之间的顺序。最后的返回箭头从“撰写论文”又回到“确定选题”,表示论文完成后,研究者将会投入新的研究。图1.2:循环说模型

在研究过程中,这6项任务不能互相替代,不能厚此薄彼,它们是一个有机的整体。其中任何一项任务完成得不好,都有可能毁掉整个研究。这6项任务之间存在着一定的逻辑关系。一般说来,前后顺序不能改变。例如:收集数据不能在确定选题前面,又如:撰写论文不能在分析数据前面。但在实际操作过程中,各项任务之间的顺序不一定总是清楚明了的。例如阅读文献贯穿于选题和选择设计研究的始终。当研究者对研究方向有个大致了解后,就需要通过查找阅读相关文献来缩小研究范围、确定研究焦点。选择研究设计时,还需要阅读文献,这是因为选择研究设计不仅受到选题的制约,而且还受到以前研究方法的限制。

作为研究新手,最好先按照这个顺序逐一完成任务,一旦熟悉了研究的过程,就可以灵活处理,不受这个顺序的限制。Blaxer(1996)曾经指出:“现实中的研究往往杂乱无章。”因此从这个意义上说,流程图没有真实反映研究现实。但流程图有两个好处:一是简明扼要,能够帮助研究入门者记住研究的大致过程,二是既适合定量研究,又适合定性研究。图1.3:研究流程图第三节 研究的分类

不同的研究可以根据研究目的和数据来源这两个参数进行分类(参见表1.1)。依据不同的研究目的,研究可以分为基础理论研究和应用性研究;依据不同的数据来源,研究可分为文献研究和实证研究。表1.1 研究的分类1.基础理论研究和应用性研究

基础理论研究的主要目的在于建构新的理论或检验已有的理论。应用性研究旨在解决教学中的实际问题。从事应用性研究的人往往与二语教学有着直接的联系,如:二语教师、二语教材编写者和二语测试设计者等。

基础理论研究

如前所述,基础理论研究的兴趣所在是理论问题,而不是生活中的实际问题。例如:Krashen对“监控”理论的建构就可以看作理论研究。他的理论模式包括以下5个假说:

1)习得—学得假说;

2)自然顺序假说;

3)监控假说;

4)输入假说;

5)情感过滤假说。

上述理论最初并不是Krashen本人提出的。例如:输入假说最初是MacNamara在1972年提出来的(Krashen,1985),自然顺序假说最初是Corder在1967年提出来的。Krashen通过研究、分析和综合相关文献,加上他本人的实证研究,建构了这一理论。

这类研究的例子在Language Learning(《语言学习》)、Applied Linguistics(《应用语言学》)等国际学术刊物以及《现代外语》、《外语教学与研究》等国内学术刊物上俯拾皆是。我们来看几个例子:

例1(Ye,1994)

本研究旨在测量文化背景知识对二语阅读理解的影响。研究者选择了两篇难度相当,有关不同文化的短文,一篇是关于中国的中秋节,另一篇是关于美国的感恩节。60名非英语专业的学生参加了这项研究,他们在阅读结束后,接受了阅读理解测试。最后,研究者比较了两篇阅读理解的成绩。研究发现,学生对关于中秋节的短文理解得更好。

例2(Wu,1998)

本研究旨在调查学生的语用知识与语言水平的相关性。90名英语专业二年级的学生参加了语用能力测试。根据他们的英语总成绩,研究者把他们分为好、中、差3组。笔者运用统计方法,来比较这3组学生的语用能力。研究结果表明,学生的二语水平与他们的语用知识关系非常密切。

以上两个例子都想检验现行的理论假设。在例1中,Ye以非英语专业的学生为研究对象,验证了“文化背景知识是影响阅读理解质量的一个重要因素”这一假说。在例2中,Wu对语用知识与二语能力的密切关系进行了验证。尽管这两项研究的发现对二语教学均有价值,但是不能解决实际问题。

应用性研究

应用性研究旨在解决课堂教学或与教学相关的一些实际问题,这些研究的成果可以直接为同行试用和借鉴。请看下面两个例子:

例1

本研究使用语言实验室进行口语教学,以探讨大班口语教学的新路子(Wen & Wu,1998)。参加这项研究的29名南京大学外国语学院英语专业二年级的学生来自同一个班级。这项研究为期4个月。学期结束时,要求学生用无记名方式填写“对运用语言实验室进行口语教学意见的问卷”,其内容涉及以下4个方面:1)对在语言实验室里上口语课的态度;2)比较在普通教室和在语言实验室里上口语课自己练习英语机会的多少;3)比较在普通教室和在语言实验室里说英语的紧张程度;4)比较在普通教室和在语言实验室里上口语课口语水平提高的速度。根据学生对问卷的回答,他们发现学生对在语言实验室里进行口语教学所采取的态度是积极的。尽管在语言实验室里上口语课有一些不足之处,但利弊相比,还是利大于弊。

例2

本研究旨在探讨在语言实验室里进行大规模口语测试的可行性。该项实验前后持续了5年,研究的内容涉及以下3个方面:1)测试的内容与难度;2)测试的实施;3)对磁带的评估。来自60所不同高校的3,300名英语专业二年级的学生参加了这项实验。每次实验后,研究者都根据学生和教师对测试所反馈的意见进行修改。最终在1995年5月该项实验被确立为全国英语专业四级口语测试的形式(文秋芳,2000)。

以上两个例子都属于应用性研究,旨在解决实际问题。在例1中,Wen和Wu研究如何更为有效地进行大班口语教学。在例2中,作者旨在设计能在全国各地进行的大规模口语测试。尽管这两项研究成果对实际教学、教学大纲设计以及测试有直接影响,但我们不能因此就说:从理论上讲,在语言实验室进行口语教学,或在语言实验室里测试口语比其他形式要更好。

研究目的:是彼此分离还是相互联系?

在上述的讨论中,Wen根据研究目的列举了不同的例子说明基础理论研究与应用性研究的区别,这可能会给人一个印象:基础理论研究与应用性研究泾渭分明,互不关联。其实不然,基础理论研究与应用性研究的界限只是相对的。在实践中,研究往往带有双重或多重目的。基础理论研究具有实用价值,应用性研究也有理论价值。因此,基础理论研究与应用性研究只是各自目的的侧重点不同而已。2.文献研究和实证研究

根据资料来源,研究可分为文献研究和实证研究。文献研究的资料是文件、著作或杂志中的文章或者已经发表的、别人收集的数据,而实证研究的数据来自现实生活,是第一手信息。

文献研究

文献研究又称为图书馆内研究。例如教师要求硕士生完成一篇学期论文,题目为“选择两个你认为最重要的学习者因素来说明二语学习中的个人差异”。要想完成这篇学期论文,学生首先要到图书馆去查找相关资料阅读,在广泛阅读的基础上,确定两个学习者因素。设想某个学生选择了“动机”与“学习策略”这两个因素。他就需要查找并阅读含有这两个变量的文章,其中有的是理论阐述,有的是别人就这两个变量所从事的实证研究。在阅读的基础上,他需要进行整理、归纳、综合,最后形成一个完整的、有条理的论文。这样的学期论文能够帮助读者系统了解现有文献对某个问题的理论纷争与实际的研究结果。好的学期论文还可以提出富有创造性的见解。

综述性文章是典型的文献研究。研究者回顾某个领域最近的研究,然后对已发表的成果进行总结、分析、评价或综合。虽然研究者回顾的材料并不是新的,但是一篇好的综述性文章同样具有真知灼见。如:Oxford和Crookall在1989年发表的“语言学习策略研究:方法、发现及教学问题”就属于这一类文章。他们根据前人在这一领域使用的研究方法,对各种有关语言学习策略的实证研究进行描写和评价,最后,对以后这一问题的研究,提出了一些很有价值的建议。

实证研究

实证研究的所有资料和数据一般来说都是研究者亲自收集的。研究者既可能从二语学生那儿收集,也可能从二语教师那儿收集。实证研究可以是基础理论研究,也可以是应用性研究。请看下面几个例子:

例1

为了调查善学者与不善学者在阅读策略上的差异,研究者对60名非英语专业的学生进行了问卷调查。这份问卷采用的是5分量表,即:1=这句话完全不适合我;2=这句话通常不适合我;3=这句话有时适合我;4=这句话通常适合我;5=这句话完全适合我。整个问卷由25个问题组成,选择其中一个数字填在每句话后的括号里。最后用统计分析方法对数据进行比较。

例2

为了调查善学者与不善学者在阅读策略上的差异,研究者把12个学生平均分成两组,一组为善学者,另一组为不善学者。接着,研究者要求他们阅读一篇短文,阅读时用有声思维的方式把他们大脑里所想的报告出来。整个过程用录音机记录下来,然后再整理成文字材料。根据口头报告对阅读策略进行分类,最后再把这些类型加以比较。

例3

为了研究英语专业二年级的学生在二语写作过程中使用母语的情况,研究者就在写作不同阶段是否使用母语这一问题对50名学生进行了问卷调查。问卷共15题,采用3分量表,即:从不—有时—通常。研究者首先对问卷调查的结果进行统计分析,然后从50个学生中,分别选出8个使用母语最多的人和使用母语最少的人进行访谈。在访谈中,要求访谈对象详细描述二语的写作过程并解释在写作过程中怎样使用母语和为什么使用母语。最后,对访谈收集的材料进行分类,作为问卷调查的补充。

近年来,随着电脑技术的发展,国内外已建立了许多语料库。这些语料库为研究者提供了翔实的语料,其中既有书面语语料,又有口语语料。对于一个研究新手来说,使用现有语料库的数据进行研究非常方便,因为任何一个研究者在时间和资金有限的情况下,都很难大规模地收集数据。这样,就出现一个问题:使用语料库进行研究,究竟是实证研究还是文献研究呢?笔者认为,就语料库的数据而言,它们是别人收集的,然而,这些原始数据尚未有人如此分析过,因此,这类研究仍属实证研究。

通过上述讨论,笔者试图解释实证研究有别于文献研究。实际上,无论是实证研究还是文献研究都不能孤立地进行。文献研究依赖于实证研究,而实证研究又起源于文献研究。3.对研究生的要求

作为应用语言学研究生,有人可能要问:“我们应该做哪一类的研究?”我们的回答是:“4类研究都应该学会。就学位论文而言,应该是文献研究与实证研究的有机结合。就学期论文而言,一般是文献研究,但不排斥小型或微型的实证研究。值得一提的是,博士论文中的实证研究必须具有理论价值。小结“研究”可定义为:用系统方法探求问题的答案。任何一项好的研究都必须满足3个条件:1)问题要有价值、有新意、有可行性;2)研究步骤应是有理有据、清楚、明确,可以重复进行;3)答案具有效度。对研究过程的描述有“循环说”和“流程说”两种。“循环说”强调的是研究的动态方面,而“流程说”强调的是研究应该完成的6项任务。每个研究新手都应按部就班地完成任务,等到熟练后,可灵活调整顺序。研究就其目的而言,可分为基础理论研究和应用性研究;就其数据来源而言,可分为文献研究和实证研究。这4种研究,研究生都要掌握。而在应用语言学方向的硕士和博士论文中,文献研究与实证研究是论文的主体。讨论题

1.关于“研究”,这本书中的定义与你的定义以及你在其他书上看到的定义有什么不同?

2.在近期出版的国际杂志上找一篇研究论文,和同学讨论下列几个问题:

1)这篇论文研究的问题是什么?

2)这篇论文采用了什么研究方法?

3)研究问题的答案是什么?

3.问题、系统方法和答案这3个研究要素之间的关系是什么?

4.比较“循环说”与“流程说”,找出它们的共同点与不同点。

5.研究者怎样才能进行有效的研究?

6.如何给不同类型的研究分类?

7.举例说明什么是基础理论研究,什么是应用性研究。

8.实证研究在哪些方面需要文献研究的帮助?

9.如何进行文献研究?第二章 基本概念

本章介绍这本书中反复出现的一些基本概念。理解这些基本概念是理解其他章节的基础。这一章要讨论的概念包括:假设、理论、理论模式、总体、样本、变量、测量方法、理论定义和操作定义。第一节 假设、理论及理论模式

不管从事哪类研究,都不可避免地要使用假设、理论及理论模式这些概念。若没有这些概念,人们会对研究的科学性表示怀疑。当然,仅仅靠使用这些概念并不能保证研究的科学性。1.假设(hypothesis)

如前所述,所有的研究都旨在探求问题的答案。有时,研究者在研究之前,就对问题的答案有了某种设想,研究的目的就是用证据来证实或推翻自己的设想。这种对答案的设想称作为“假设”。准确地说,假设应定义为对两个或两个以上变量之间关系的预测。这样的假设是建立在前人研究成果的基础上或是建立在已确立的理论基础上,而不是凭空想像的主观臆断。

比如说,我们的研究问题是:“在英语学习过程中,使用母语的程度与学习成绩有什么关系?”从逻辑的角度讲,它们之间的关系可能有4种假设:

1)零假设亦称为虚无假设或原假设,用H来表示,指使用母语0程度与英语学习成绩之间没有关系的假设;

2)正向假设,用H来表示,指使用母语程度与英语学习成绩之1间有正向关系的假设;

3)负向假设,用H来表示,指使用母语程度与英语学习成绩之2间有负向关系的假设;

4)无向假设,用H来表示,指使用母语程度与英语学习成绩之3间尚未确定是正向还是负向关系的假设。“假设”可分为零假设和备择假设,备择假设又可分为正向假设、负向假设和无向假设(参见图2.1)。图2.1:假设类型

根据前人研究的大量证据,预测两个变量之间的关系是正向的还是负向的,这样的假设叫作有向假设。有时,前人研究的结果不尽一致,有些甚至彼此矛盾,这时无法确定其方向,这时形成的假设叫无向假设。就上述研究问题而言,如果我们认为使用母语程度与英语学习成绩有关系,但不知道是什么样的关系,这就是无向假设。如果我们根本不知道它们之间是否有关系,这时就提出零假设,即两个变量之间没有关系。

零假设在研究中有着特殊的意义。严格说来,一切检验假设的研究都开始于零假设。其原因很简单。在实际生活中,没有任何统计工具能够用数据直接证明有向假设和无向假设,统计工具所能做的就是接受或者推翻零假设。尽管有的研究表面上看起来不是从零假设开始,但研究背后的逻辑推理仍旧与零假设有关。这就好比我们在法庭上难以用证据直接证明某人清白一样。法官必须从零假设开始,即某人不是罪犯。只要有人在法庭上拿出证据足以证明某人犯了法,法官就会推翻零假设。如果证据不充分,法官就只能接受零假设(参见第八章)。

有些研究事先形成了假设,然后再进行验证;有些研究则事先没有假设,问题的答案在研究过程中才渐渐形成,其答案可以成为以后研究有待检验的假设。例如:文秋芳、郭纯洁(1998)研究了学生在英语看图作文中使用母语的情况。他们在开始研究时,并不知道学生在英语看图作文中如何使用母语,因此不可能形成假设。他们要求学生一边作文,一边说出内心的思维活动。研究者在分析学生复杂的内心活动过程中,才逐渐了解了母语在英语看图作文中的不同作用。此项研究的结果就是假设,这些假设需要在其他研究中进一步验证。

总之,假设可能在研究的不同阶段形成,然而,它的形成对于任何研究来说都是至关重要的。研究可以从假设出发,研究过程就是一个验证假设的过程;研究也可以以假设结束,研究过程就是产生新假设的过程。2.理论(theory)

理论由一组互相关联的假设组成。这一组假设对所研究的对象形成系统、完整的阐述。例如,Krashen(1985)提出的二语习得理论包括5个假设(PP.1-3):

1)习得—学得假说

习得与学得是两个互不关联的培养外语能力的途径。习得类似儿童学习母语,在潜意识中进行,能够获得自动化的技能;而学得是有意识的行为,只有助于语言知识的掌握。

2)自然顺序假说

学习者习得语言规则的顺序是可以预测的,但它既不依赖于感知形式的复杂性,也不依赖于教学的顺序。

3)监控假说

通过有意识学得的知识,可以用于监控语言行为,但这里有两个前提:①学习者有意关注准确性;②学习者必须了解相关规则。

4)输入假说

如果学习者大量接触稍微超出其现有语言水平的可理解性的输入,他们便可以习得二语。

5)情感过滤假说

情感过滤器好比一个可以上升或下降的心理障碍物。当它上升时,外部输入就不能进入到长期记忆中去;当它下降时,外部输入进入长期记忆就没有障碍。

以上5个假说紧密联系,形成Krashen的二语习得理论:输入假设说是习得的必要条件;学得的知识只能用于监控语言行为;习得语言的顺序不受外界因素影响;习得语言时情感过滤器不起阻碍作用。归根结底,Krashen的理论强调潜意识的自然习得,忽视有意识的刻意学习。自Krashen的理论提出后,许多追随者试图通过研究找到实证依据,但在所得到的研究结果中,有的支持Krashen的理论,有的却与之大相径庭;在验证Krashen理论的过程中又涌现出新理论,例如Long(1980)的互动交际理论和Swain(1985)的输出理论。这就是说,一种新理论的提出能够引发大量验证性的实证研究,在验证性的研究中,又能产生更新的理论,如此循环,推陈出新,科学就能不断前进。

再如:文秋芳、郭纯洁(1998)在研究二语学习者看图作文中使用母语的情况时,根据学生的口头报告,提出一个理论。这一理论包括以下一些假说:

1)学生接受了图画刺激后,可以有3种选择开始英语写作:①图画⇒外语;②图画⇒转换中介;③图画⇒内容生成中介。学生无论选择哪一种途径,几乎都避免不了使用母语。

2)母语在外语看图作文过程中一般作为转换中介、内容生成中介、形式检索中介、内容验证中介和程序管理中介,它们在外语句子(从句)形成的过程中交替出现。

3)从总体上看,外语写作能力高的学生对母语依赖性小。其中高能力组较多使用中文作为转换中介和内容验证中介;而低能力组较多用中文作为内容生成中介、形式检索中介和程序管理中介。就使用中文的平均长度而言,高能力组用于转换中介和内容验证中介的中文平均长度偏长,而低能力组用于内容生成中介和形式检索中介的中文平均长度偏长。

Wang(2000)最近对上述理论进行了验证性研究。她发现母语功能的种类远远超过上述五类。3.理论模式(model)

尽管在文献中,有人将“理论模式”和“理论”这两个术语混用,但也有许多研究者赞成将这两个术语区别开来。“理论模式”指的是着重用图形来描述的某个有系统的结论,而“理论”指的是着重用语言来描述的某个有系统的结论。例如:Krashen的理论也可用下列图形来表述,这时就称为理论模式(见图2.2)。图2.2:二语习得理论模式

显然,图形表述比语言描述更形象、更生动。但仅有图形还不够,在描写变量之间的相互关系时,语言比图形更加清晰、更加明确。因此,笔者建议无论在写硕士论文还是写博士论文时,最好是既有图形表述,又有语言描述,这样会便于读者理解。第二节 研究对象总体与样本1.研究对象总体界定

研究对象总体是指所要研究的全部人或事物的总和。它可以是人、课本、试卷等。在大部分情况下总体用于指人。例如:如果研究者想测量南京中学生的英语水平,那么研究对象总体就是南京所有的中学生;如果研究者对过去10年高考英语试题的难度进行评估,那么研究对象总体就是10年的高考英语试题。

样本是研究对象总体中具有代表性的一部分。样本的抽取通常采用随机程序,即在抽样过程中,总体中的每个个体被抽中的机会完全相同。经过随机程序抽取的样本称为随机样本。第六章将详细介绍随机抽样技术。2.研究对象总体与样本的关系

如果样本是随机抽取的,从统计的角度,我们就可以认定样本是研究对象总体的一个缩影。通过研究样本,研究者最终能推测出整个研究对象总体的情况。

如图2.3所示,首先从研究对象总体中抽出样本,然后对样本进行研究。一旦有了样本研究的结果,研究者就可以从样本结果中推测出研究对象总体的情况。这样推测的准确性有多高,取决于样本在多大程度上能够代表研究对象的总体。图2.3:研究对象总体与样本(Punch,1998:106)第三节 变量

变量是指数值可以变化的量,例如学生的成绩。为了研究问题的方便,我们常常把所要研究的要素,人为转化成一个数值,比如:性别、婚姻状况、受教育程度等。通常,人们将男性设定为1,将女性设定为0或2。有些变量的变化极其有限。例如:性别的变化只有2种:男性或女性。婚姻状态的变化有4种:未婚、已婚、离婚和丧偶。教育程度的变化可能有4种:初等教育、中等教育、高等教育和研究生教育。然而,有些变量的变化范围比较大。例如:学生成绩的变化可以从0到100。身高和体重的变化比考试成绩的变化还要多。根据变量的作用,我们把变量分为自变量(independent variable)、因变量(dependent variable)、调节变量(moderator variable)、控制变量(control variable)和干扰变量(intervening variable)。下面我们逐一讨论。1.自变量与因变量

自变量与因变量关系非常密切,互相依存。没有自变量就没有因变量。同样,没有因变量也就没有自变量。

自变量与因变量可在2种情况下使用,第一种情况,自变量是一个刺激变量(stimulus variable)或输入变量(input)。因变量是一个反应变量(response variable)或输出变量(output)。例如:研究者研究X和Y两个变量之间的因果关系。如果它们之间的关系可解释为:“如果X变大或变小,Y会怎么样?”那么,X就是一个自变量,Y就是一个因变量。

第二种情况,自变量是用来预测另一个变量,而因变量是个可以被自变量所预测的变量。它们之间的关系不是因果关系,而是预测与被预测的关系。例如,某研究者进行一项相关研究,旨在弄清性别在多大程度上可以预测学习者的二语成绩。在这项研究中,性别是一个自变量,二语成绩是一个因变量。更为确切地说,性别是一个预测变量,二语成绩是一个被预测变量。

一言以蔽之,在第一种情况中,自变量是个动因,引起因变量的变化;在第二种情况中,自变量是个用来预测另外一个变量的变量。有的研究只有一个自变量和一个因变量;有的研究涉及多个自变量和一个因变量;也有的研究涉及一个自变量和多个因变量。下面我们举些例子,来看看哪些是自变量,哪些是因变量。

例1

假设:有两种二语写作教学法,一种要求学生把同一篇作文修改多次,简称为“反复修改法”。另一种要求学生多写一些不同的文章,简称为“多篇作文练习法”。该项研究认为反复修改法比多篇作文练习法对提高学生的写作能力更有效。

自变量:写作教学方法

方法1:反复修改法

方法2:多篇作文练习法

因变量:二语写作能力的提高

在例1中,由于不同的写作教学方法能够导致写作能力提高的程度有所不同,因此写作教学方法是一个自变量,而二语写作能力的提高是一个因变量。

例2

假设:频繁使用多种学习策略的人比使用学习策略种类少且频率低的人英语学习成绩要好。

自变量:使用学习策略的种类与频率

因变量:英语学习成绩

在例2中,研究者假设使用学习策略的种类与频率能够影响二语学习成绩。使用学习策略的种类越多,且频率越高,他们取得的学习成绩就越好。也就是说,学习策略的使用与英语学习结果之间存在因果关系。因此使用学习策略的种类与频率是自变量,英语学习成绩是因变量。

例3

假设:学生对教育的态度可部分预测他们对“好”老师的看法。

自变量:学生对教育的态度

因变量:学生对“好”老师的看法

在例3中,研究者假设了解学生对教育的态度可以预测学生对“好”老师的看法。因此,前者是一个自变量,后者是一个因变量。

例4

假设:父母的教育程度能够预测学生学习成绩的好坏。

自变量:父母受教育程度

因变量:学生的学习成绩

在例4中,研究者假设父母的教育程度与子女的学习成绩存在着密切的关系。这就是说,父母的教育程度越高,子女的学习成绩可能越好。很显然,父母受教育程度与学生的学习成绩之间关系不是因果关系。因此,父母受教育程度是预测变量,学生的学习成绩是被预测变量。2.调节变量

调节变量是一个可以调节自变量与因变量之间关系的变量。它有时又被称作为第二自变量。“调节”这个词表明了为什么要把第二自变量专门挑出来进行研究。如果研究者研究自变量X对因变量Y的影响,但怀疑X和Y之间的关系可能由于因素Z的影响而发生改变,因此Z就作为调节变量来研究。

我们来看两个例子。第一个例子:研究者在教英语时想看视觉刺激(使用图画)和听觉刺激(使用磁带)哪种方法更为有效。首先,她随便把学生分成两个班,一个班用视觉刺激,另一个班用听觉刺激。经过3个月的实验,所有的学生参加同一测验,结果,两个班的成绩差不多。这时,研究者想到有些学生喜欢用眼睛接受信息,有些学生喜欢用耳朵接受信息,很可能学生所偏向的学习风格会影响到学习成绩。因此,她设计了问卷来测量学生所偏爱的学习风格。然后,她把偏爱视觉刺激的学生和偏爱听觉刺激的学生分开,原来模糊不清的图画,一下子豁然开朗。如果把这两种方法与偏爱这些学习风格的人搭配起来,那么这两种方法都非常有效。在这种情况下,学生所偏爱的学习风格可以被看作调节教学方法(自变量)与方法的有效性(因变量)的调节变量。

第二个例子是研究考试环境(自变量)与考试成绩(因变量)之间的关系。假定研究者提供两种考试环境。一是以考生为目标(把姓名写在试卷上,我们测量的就是你);另一是以试题为目标(不把姓名写在试卷上,我们测量的是试题的难度)。考生的焦虑程度可看作成调节变量。结果发现焦虑程度高的人在以试题为目标的考试中考得比较好;焦虑程度低的人在以考生为目标的考试中考得比较好。这就是说,自变量、调节变量和因变量之间有相互作用。二语教学的情况非常复杂,在研究中最好至少要包含一个调节变量。常常由于研究者没有把一些至关重要的调节变量挑选和测量出来,使得自变量与因变量之间的关系显露得不清楚。我们再来看一些例子。

例1

假设:男性研究者比女性研究者更为有效地获取所有研究对象的信息,而女性研究者比男性研究者更为有效地获取男性研究对象的信息。

自变量:研究者的性别

调节变量:研究对象的性别

因变量:获取研究对象信息的多少

例2

假设:在学习英语的过程中,使用母语对学生的学习成绩有消极影响。该消极影响对成人比对儿童更为明显。

自变量:使用母语

调节变量:年龄

因变量:学习成绩

例3

假设:管理策略对英语学习成绩有影响,且对低水平学习者的影响更大。

自变量:管理策略

调节变量:英语水平

因变量:学习成绩3.控制变量

实际工作中,我们往往不可能同时对所有变量进行研究。当我们使其中某些变量保持中立,确保这些中立的变量不影响自变量与因变量的关系。这些保持中立的变量就称为“控制变量”。确定控制变量的目的就是控制这些变量可能会对研究结果有影响。例如:在一项关于课外阅读对培养阅读理解能力的影响的研究中,研究者有意地选择了四级英语80分以上的学生作为研究对象。这样,研究对象的总体水平就是控制变量。在另一项研究中,研究者想弄清测试策略的训练在多大程度上可以影响测试成绩。所有的研究对象都是女生,这样,性别就是控制变量。

尽管某些变量偶尔也充当调节变量,但它们在大部分情况下都是控制变量。例如:性别、智力和学习者从前的学习情况。研究者在设计研究时,总需要决定哪些变量需要研究,哪些变量需要控制。4.干扰变量

干扰变量是指在研究中任何一个没有测量出来,但和自变量与调节变量一起对因变量产生影响的变量。研究中有两类干扰变量。第一类是指研究者想测量,但很难测量的变量。第二类是指可以测量,但研究者因时间、资源有限或研究经验不足而忽略的变量。一般说来,这两类干扰变量常常同时出现。例如:你想进行一项研究旨在搞清楚阅读量(自变量)与词汇量(因变量)的关系。在这两种变量之间,还有另外一些变量在起作用,如:阅读动机、已掌握的词汇量、记忆单词的策略、个体记忆能力。

再如:你想比较是利用闭路电视上英语课的效果好,还是现场听老师上课效果好。这项研究中的自变量是上课方式,因变量是学习效果。经过3个月的实验,结果发现在现场听老师上课比通过闭路电视上课效果要好。很显然,教学方式对学习结果有影响。如果你问为什么一种教学方式比另一种教学方式好,回答可能是现场听老师上课可以给学生提供参与课堂讨论的机会,而闭路电视教学只能单向交流。因此,学生的参与量就是一个干扰变量,它可能会对学生的学习结果产生影响。实际上,你可以列举出一连串的干扰变量,如:重新播放电视的机会、学生对使用闭路电视不熟悉,等等。

一个好的研究者必须能够在研究中识别干扰变量。知道什么是干扰变量会有助于解释自变量引起因变量变化的原因。不仅如此,弄清干扰变量的影响会使研究者在解释研究结果时谨慎从事,而不至于把话说得太满,甚至解释错了。5.变量之间的关系

上述5种变量之间的关系怎么样?下面根据Brown(1988:13)的图(参见图2.4)说明了它们之间的关系。自变量与因变量之间的关系要么是因果关系,要么是相关关系。调节变量又称为第二自变量,可改变自变量与因变量之间的关系。控制变量在研究中保持恒定,即没有变化,目的是更好地研究自变量对因变量的影响。干扰变量不是直接可以观察到的,因此,放在虚线箭头里。干扰变量越多,就越难说清楚两个变量之间的因果关系。

一个变量的功能并不是这个变量本身所固有的。因此,变量在图中的位置不是一成不变的,它随着研究的变化而变化。有时在同一研究内,在不同的研究问题内变量的功能也可能不同。例如:动机这一变量在这个研究里是自变量,到了另一个研究里就变成因变量、调节变量、控制变量或干扰变量。研究者必须要确定某个变量在不同研究问题中的不同功能。图2.4:不同变量之间的关系第四节 测量方式

变量除了功能上的差异以外,还有测量方式上的差异。一般说来,应用语言学有3种不同的测量方式:称名测量、等级测量和等距测量。与之相对应的有3种变量:称名变量、等级变量和等距变量。下面我们来逐一讨论这3种测量方式。1.称名测量

顾名思义,称名测量是用来给事物命名或给事物分类。一个称名变量包含几个类别,这些类别彼此相互排斥。例如性别这个称名变量包含两个类别:男性和女性。一个人就其性别而言,要么是男,要么是女,不可能既是男,又是女。换句话说,每个类别都是独一无二的。我们可以根据母语、性别或国籍把研究对象进行分类。尽管称名测量非常简单,但许多极为有趣的变量都属于这一类,常见的称名变量有性别、职业和母语。

就其实质而言,称名测量不是一种真正意义上的测量,因为它不涉及数学上的数量概念。为了统计的方便,我们常常把这些不同的类别转换为数字,例如:把男性标为1,女性标为2;也可以把女性标为1,男性标为2。通过统计,我们很快就能得到样本中的男女百分比。但这里的2没有一般数字上的意义,它不是1的2倍,也不能进行加减乘除。哪个数字代表哪一类型是随意的,只要每一类有个数字就行。从这个意义上说,称名测量就是给某个变量内部的不同种类冠以一个名称,以便区分。下面我们来看几个例子。

例1:性别

1=男性

2=女性

例2:婚姻状况

1=未婚

2=已婚

3=离婚

4=丧偶

例3:母语

1=汉语

2=俄语

3=英语

4=日语

5=朝鲜语

6=瑞典语

例4:国籍

1=美国

2=法国

3=德国

4=英国

5=澳大利亚

6=加拿大2.等级测量

等级测量除了给人或事物命名以外,还提供他们拥有特征的相对量级。例如:在英语演讲比赛中,最终选出6名最好的选手,分别为第一名、第二名、第三名、第四名、第五名和第六名。这样一个排列顺序就是一个等级测量,表明谁比谁好。然而,第一名和第二名之间的差距,以及第二名与第三名之间的差距,我们不能准确地测量出来。再如:老师在评价学生作文时,没有给出精确的分数,而是给它们5个等级,即A、B、C、D和E。很明显,得A的学生比得B的学生作文写得好。可A与B或B与C之间到底有多少差异呢?这正是等级测量所缺少的。

在数据编码过程中,人们常用阿拉伯数字代表等级。例如:用5代表A,用4代表B。用数字表示等级并不能把两个等级之间的差距准确地测量出来。如果想比较两个等级变量,我们只能说1<2<3或3>2>1。在英语口语考试中,我们可以说张比李考得好,但没有朱考得好。3.等距测量

等距测量除了能完成称名测量和等级测量所作的一切以外,还能保证每两个连续点之间的距离是相等的。例如:1分钟到2分钟与4分钟到5分钟的时间是相同的。同样,2米到3米与4米到5米的距离是相同的。因此,在测量时间、长度和距离等时,经常用到等距测量。

在学校里,考试使用的百分制属于等距测量,每两点之间的距离是等值的,都是1分。如果有两个学生,一个考了100分,另一个考了95分,我们可以说一个学生比另一个学生考得好,因为他多考了5分。这5分当中,每两个分值之间的差距完全相等。百分制就是建立在这样一个假设的基础上,即1分到2分与5分到6分,或99分到100分的距离相同。

然而,上述观点似乎过于简单化。考试项目通常难度不一,因此,不同项目所得的分数不一定等值。但在考试中,难度差异一般被忽略不计,我们把这样的测量方式仍旧看作是等距测量。

等级测量与等距测量的差别可在图2.5上体现出来,这个图是根据Bachman(1990:28)的图修改而成。例如:考第一名的学生得了95分,考第二名的学生得了93.5分,考第三名的学生得了90分。第一名与第二名之间的差距是1.5分。而第二名与第三名的差距是3.5分。由此观之,第一名和第二名之间的差距,与第二名和第三名之间的差距是不等的。与之相对应的等距测量,每两个分值之间的差距是相等的,都是1分。图2.5:等级测量与等距测量的比较

比较理想的是,在用等距测量测量一个变量时,变量之间的差距是相等的。一般情况下,这一点比较容易做到,如时间和重量。但在另一些情况下,就不能保证。例如:年龄是研究的一个变量,你可能认为一年就是一年。然而,对于二语学习者来说,每两年之间的差异并不相等。很明显,在10岁至20岁之间,每两年的差异或许要比在60岁至70岁之间每两年的差异要小得多。

研究中,我们经常采用3分量表或者5分量表,通过问卷调查学生对某个问题的看法或做法。严格说来,这样的测量只能是等级测量。但这些研究往往把这样的等级测量当作等距测量来对待(Boyle,1970;Labovitz,1971)。例如:目前我们还没有任何工具可以准确地测量出人们对学习二语的兴趣。问卷中采用不感兴趣、感兴趣和非常感兴趣三个不同类别让被调查者选择。接着给每一类一个数字,如:不感兴趣=1,感兴趣=2,非常感兴趣=3。最后把1-2-3作为等距变量处理,计算出平均数。从理论上讲,这种测量问题颇多,首先,我们无法得知不感兴趣、感兴趣与非常感兴趣之间的距离,其次每两个连续点之间的距离难以相等。然而,社会科学中的许多研究都把这样的问卷调查看作等距测量,为的是便于统计。目前这一做法已广为人们接受(Rudestam & Newton,1992)。4.三种测量之间的关系

3种测量中,就准确性而言,称名测量处在最低级,最不准确;等距测量处在最高级,最准确;等级测量处在两者之间,比称名测量准确,但不及等距测量。称名测量只表示类别;等级测量不仅表示类别,而且表示类别的顺序;等距测量除了表示类别和类别的顺序还表示顺序排列之间的距离。根据Brown(1988:23)的测量方式,我们把3种测量总结如下(参见表2.1)。表2.1 测量方式及其特点

较高级的测量可转变为较低级的测量,但较低级的测量不能转变为较高级的测量。以学生的水平测试为例,我们可以把百分制变成5个等级,但不可能把5个等级转变为百分制。

虽说用什么方式测量变量取决于研究者,但研究的一般规则是“尽可能用最高级的测量方式来测量。这就是说,如果能用等距测量,决不要用等级测量”(Bernard,1994:35)。第五节 如何将理论定义变为操作定义?

在本节中,我们先讨论理论定义和操作定义的差别,然后讨论如何将理论定义变为操作定义。1.理论定义和操作定义

一个变量需要从理论和操作两个方面进行界定。理论定义提供人们理解某个变量的概念特征。操作定义提供人们测量某个变量的具体方法。下面的例子可说明理论定义与操作定义的差别。

我们先来看日常生活中的一个例子。你可能听别人说“老张的房子很宽敞。”可这里的“宽敞”是什么意思?《朗文英语和文化词典》把“宽敞”界定为“有许多空间”(1993:1271)。根据这一定义,人们很难确定某人的房子是否宽敞。在研究住房问题的时候,研究者把“宽敞”定义为人均面积在15平方米以上。根据研究者这一定义,我们就可以确定某人房子是否宽敞。由此观之,词典上的定义是理论定义,研究者的定义是操作定义。

我们再看一个第二语言研究方面的例子。Gardner(1985)把动机定义为“努力+实现学习目标的愿望+对学习语言的积极态度”(p.10)。也就是说,动机包括3个部分:态度、愿望和努力。这是动机的理论定义。Gardner难以用这个定义去测量每个学习者的动机。于是他根据动机的3个部分分别设计了3个问卷让学习者去回答。每个学习者的动机就是对这3个问卷的反应。这里3份问卷就成了动机的操作定义。

从上面例子可以看出,虽然理论定义有助于我们理解变量的概念特征,但用途极为有限,我们不能借助理论定义进行测量。没有测量,我们就不能直接进行比较。有了操作定义,研究者不仅可以测量某个变量,而且可以讨论、评价其合理性。

在应用语言学和其他社会科学领域里,理论定义常常出现在文献回顾中,操作定义常常出现在研究方法的描述中。在给变量下理论定义时,必须注意到由于研究者的观点不同,又由于理论的发展,在不同文献中,同一术语的理论定义不一定相同。碰到这样的情况,研究者必须选择适合自己研究的理论定义,或者根据自己的研究,对现有的理论定义稍加修改,并说明其理由。以二语水平为例,二语水平曾一度被定义为语法、词汇和语音3方面知识的总和;20世纪五六十年代时被定义为听、说、读、写四种技能的总和(Lado,1961);70年代时被定义为交际能力(Hymes,1972);八九十年代时该定义进一步扩大,又增加了策略能力(Bachman,1990)。如果某人想研究学生的二语能力,就会面临数种选择。需要指出的是,选择的理论定义会直接影响其操作定义。比如说,如果把二语水平看成为4种技能,那么二语水平的操作定义必须相应地与4种技能有关。换句话说,在一项研究中,同一术语的理论定义与操作定义必须一致且逻辑上相关。同样,如果认为二语水平是由语言能力、语用能力和策略能力组成,而所选用的测试是托福,那理论定义和操作定义就不一致,因为托福不能测量语用能力和策略能力。

然而,理论定义与操作定义的一致并不意味着操作定义必须测量理论定义中所描述的所有内容。人们常常因为测量工具的缺陷、时间的限制以及人力、物力和财力的不足,实际所测量的通常少于理论定义所界定的内容。换句话说,操作定义肯定不能百分之百地体现理论定义。例如:没有哪一个英语考试可以体现二语水平理论定义的各个方面。即使理论定义相同,不同的研究中使用的操作定义也可能不一样。例如:50年代时,有些研究者的语言能力的操作定义是Carrol 和Sapon设计的“现代语言能力测试”(MLAT)的成绩。60年代时,另一些研究者的语言能力的操作定义是Pimsleur设计的“语言能力测试”(LAB)的成绩。尽管MLAT和LAB这两种测试都声称能测量语言能力,但准确地说,它们实际所测量的不是同一方面。Skehan(1989)指出“与MLAT相比,LAB强调语言学习的推理能力和听的能力。……与MLAT相比,LAB所缺少的是语法敏感性的测试以及有效记忆范围的测试”(p.29)。

从逻辑关系上说,我们应该首先确定变量的理论定义,然后再是变量的操作定义。在实践中,这一过程往往不是线性的。例如:也许你最初按照目前最全面的观点:二语能力包括语言能力、语用能力和策略能力。后来,你可能发现没有同时测量3种能力的权威测试。如果你坚持这一理论定义,你就无法使之操作化。因此,你必须修改理论定义。2.操作定义

变量的操作定义要明确说明如何测量理论定义所界定的内容。这一定义的特点是:清楚、明确。下面是Wen(1993)在研究学习者可控因素与学习结果关系时,所给出的一些操作定义:

1)二语水平

英语专业四级考试的分数。

2)努力程度

研究对象报告的一周之内课后学习英语的时间。

3)学习目的

对问卷调查项目的回答,诸如:你学习英语的原因是对其语言和文化感兴趣还是渴望未来找到一份好工作,等等。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载