TIMSS测评:国际青少年科学素质全景解读(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-31 11:49:36

点击下载

作者:杨文源,李秀菊

出版社:社会科学文献出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

TIMSS测评:国际青少年科学素质全景解读

TIMSS测评:国际青少年科学素质全景解读试读:

序言

当今社会,科学技术迅速发展,科技实力逐渐成为决定国家竞争力的关键因素。国家的发展迫切需要高科学素质的专业人才。与此同时,科技产品已经渗透到人们生活的各个方面,公民需要具备基本的科学素质,才能在面对生活中与科学相关的议题时做出理性的判断和决策,从而更有效地适应、更好地生活在科学技术高度发达的社会。当今的青少年是未来的社会公民,更是未来的国家建设者,青少年的科学素质水平成为国家未来发展的重要基础。青少年科学素质测评已经成为科学教育领域备受关注的话题。

国际上对青少年科学素质的测评已有50余年的历史。目前,世界范围内持续时间较长、规模较大的青少年科学素质测评项目主要有三个:由经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)发起的国际学生测评项目(Programme for International Student Assessment,PISA),由国际教育成就评价协会(International Association for the Evaluation of Educational Achievement,IEA)发起的国际数学与科学学习趋势项目(Trends in International Mathematics and Science Study,TIMSS),美国国家教育进展评估(National Assessment of Education Progress,NAEP)。从国际视野看,PISA、TIMSS、NAEP的共同特点在于以评促建,测评的重要目标在于发现影响学生科学素质水平的因素,使得参与国家(地区)认识到自身在科学教育上的优势和不足。因此,对上述三个青少年科学素质测评项目结果的深入分析,有助于全面了解和解读各国家(地区)的科学教育现状,以及学生科学素质和能力水平的现状,为更好地提出全面提升我国青少年科学素质的方案和对策提供支撑。

本套丛书共有三本:《PISA测评:国际青少年科学素质全景解读》《TIMSS测评:国际青少年科学素质全景解读》《NAEP测评:国际青少年科学素质全景解读》。其中,由于PISA和TIMSS参与国家(地区)较多,课题组在分析过程中基于教育发达程度、各个大洲代表以及GDP等多个角度,选择了15~18个国家(地区)进行分析;至于NAEP,则对其历年数据进行分析。本套丛书的分析数据均来源于PISA、TIMSS和NAEP官网的公开数据,经过课题组的再整合、再分析,最终将提炼的精华呈现给大家。

在本套丛书即将出版之际,感谢PISA、TIMSS和NAEP所有工作人员的辛劳以及公开分享各类数据的无私;感谢中国科普研究所各位领导和所有同事的指导、支持与帮助;感谢参与本套丛书工作的所有课题组成员;感谢社会科学文献出版社的支持!

感谢关心和支持本套丛书出版的所有人!

由于著者水平能力有限,纰漏难免,希望大家多批评指正,共同努力推进我国青少年科学素质提升工作!第一章 关于“国际数学与科学学习趋势项目”(TIMSS)

国际数学与科学学习趋势项目(Trends in International Mathematics and Science Study,TIMSS)是一项由国际教育成就评价学会(International Association for the Evaluation of Educational Achievement,IEA)发起的关注学生数学和科学学习成就的国际比较研究项目。TIMSS是一项国际化的大样本测评项目,自1995年起,每4年测评一次,以面向未来生活和社会发展所必需的数学和科学素质为测评内容,以4年级和8年级的在读青少年学生为测评对象;有些年份还会同时开展TIMSS高阶(TIMSS Advanced)测评,对中学毕业年级学生的数学和物质科学素质进行测评。其中,TIMSS测评重点关注4年级和8年级学生的数学和科学学业水平,TIMSS高阶测评则有倾向性地关注中学毕业年级学生的数学和物理学业水平及其与大学相关专业的衔接。TIMSS测评和TIMSS高阶测评都以政策为导向,除了考查学生的数学和科学学业水平外,还会通过问卷来收集相关背景信息(包括学校资源配置、学生学习态度、教师教学行为和家庭对学习的支持),探索影响学生学习的因素,以期为参评国家/地区的教育政策的改进提供可靠的依据。通过深入分析TIMSS报告,国家/地区教育决策者、教育研究者、教学管理者和教学实践者可以获得以下方面[1]的信息。(1)在全球背景下评估国家/地区教育系统的效能。(2)对比学习资源和机会与其他国家/地区的差异。(3)精确指出需要改进的方面并激励课程改革。(4)评估新的教育举措带来的影响。(5)训练研究者和教师在考试评价方面的能力。一 TIMSS科学素质测评的目标

当今世界,科学技术是第一生产力,社会发展离不开科学技术的发展,国家竞争力在很大程度上依赖于科技实力,因此,国家和社会的进步需要具备高水平科学素质的专业人才。与此同时,人们日常生活的每一天都会面对各种各样的科学技术产品和科学相关信息,全球变暖、食品安全、疾病治疗等科学议题与每个人的生活息息相关,公民需要具备基本的科学素质才能更有效地生活在这个世界上。科学素质是TIMSS测评的重点内容,“以评促建”,通过测评来促进科学教育的发展是TIMSS主办方IEA长期关注的研究话题。(一)TIMSS拟解决的问题

早在1995年TIMSS第一次测评之前,其主办方IEA就已经积累了非常丰富的测评经验和评价研究成果。本着“以评促建”的宗旨,TIMSS科学素质测评以学生在学校的科学学习成效为测评内容,同时关注学生的学习背景,最终找出直接影响学生学习的因素,进而通过教育政策的调整来改善这些因素,促进学生的学习,例如,课程的设置、资源的分配、教学的方式等。基于评价的宗旨和目标,TIMSS在1995年第一次测评时就将其评价工作系统地界定为广义的课程评价,并在后续历次测评中延用这一模型(见图1-1)。TIMSS的课程评价模型包含三个层面,这三个层面综合起来对学生的学业水平起到决定性影响:①预期的课程(the intended curriculum),即期待教授的内容,反映了社会对人才培养的预期,但是也受到国家/地区教育资源的限制;②实际执行的课程(the implemented curriculum),即在课堂上实际教授的内容,虽然以预期的课程为指导,但是在很大程度上取决于教师的教学行为,而教师的教学行为又在很大程度上受到他们自身的受教育经历、培训和经验以及学校的组织机构、与同事的合作和学生的生源组成的影响;③实际达成的课程(the attained curriculum),即学生实际学到的内容,学生的学业成绩虽然在一定程度上依赖于预期的课程和实际执行的课程,但是在更大程度上取决于学生个体的特征,包括学生自身能力、态度、兴趣和努力。图1-1 TIMSS的课程评价模型资料来源:Mullis,I.V.S.,Martin,M.O.(Eds.).TIMSS 2019 Assessment Frameworks .Chestnut Hill,MA:International Association for the Evaluation of Educational Achievement (IEA),2017:4.

TIMSS课程评价模型的三个层面看似指向了三个不同的方面,但实际上是一个统一的系统,三个层面综合作用最终体现在学生的学业[2]水平上。基于这一模型,TIMSS提出了四个研究问题。(1)期待学生学习的内容是什么?(2)提供教学支持的是谁?(3)如何组织教学?(4)学生实际学到了什么?

第一个研究问题指向的是课程评价模型中预期的课程,TIMSS通过比较分析参与国家/地区的课程文件和教科书来回答这个问题。第二个研究问题指向的是课程评价模型中实际执行的课程,要解决如下子问题:每个国家/地区的师资力量有何特征(例如,受教育情况、教学经验、教学态度和指导思想)?教师是如何开展课堂教学的(例如,教师运用什么教学方法,教师看重什么课程内容)?第三个研究问题指向的是实际达成的课程,要解决如下子问题:学生实际学到了什么?不同国家/地区的学生在学业水平上有何差异?什么因素影响着学生的学习?(二)TIMSS测评对象

TIMSS所界定的广义的课程评价模型,实际上将教育系统的要素有机地整合在一起,整套系统的效能最终体现为学生的培养质量(即学生的学业水平),其他要素都是有可能影响学生学业水平的因素。其中,学生的学业水平是TIMSS测评的核心内容,每次测评都会开发专门的测评工具来评价学生的学业水平;影响学生学业水平的因素则通过配套的背景问卷来调查。

为了实现评价目标、反映教育系统效能并找出影响因素,TIMSS以三个时间点的在读青少年学生为测评对象。(1)具备一定的认知能力,已经能够自主作答的9岁左右的学生,通常这个年龄的学生在读年级主要集中在4年级,也有一小部分在读3年级;自2011年测评起,不再跨年级抽样,而是整体抽取处在4年级的班级,因为TIMSS关注的课程和教学都是以年级为基础的,同时,整体抽取班级对学校来讲更便于组织,也能减少对学校正常教学秩序的影响。(2)在大多数国家/地区已经完成了小学的学习并进入中学学习的13岁左右学生,通常这个年龄的学生在读年级主要集中在8年级,也有一小部分在读7年级;同样的,自2011年测评起,也不再跨年级抽样,而是整体抽取处在8年级的班级。(3)中学最后一年的学生,包括职业学校的学生。

其中,8年级测评是每次测评的必测内容,4年级测评和中学毕业年级的测评不是每一次都开展。就目前来看,已经举行的6次TIMSS测评中,每次测评都有对8年级在读学生的测评,有5次测评同时开展了对4年级在读学生的测评,有3次测评同时开展了对中学毕业年级在读学生的测评。在参与测评的国家/地区当中,有的国家/地区从第一次测评开始就持续参加历次TIMSS测评,有的陆续参与到TIMSS测评当中来,有的则中断过TIMSS测评。表1-1直观呈现了各个国家/地区参与历次TIMSS测评的情况(按国家/地区英文名字母顺序排序)。其中,深色底纹的国家/地区为本书的重点分析样本,在本书第二~五章将逐一分析这些国家/地区参与历次TIMSS测评的结果。本书分析样本的选择原则与青少年科学素质丛书系列的第一册《PISA测评:国际青少年科学素质全景解读》一致,即:①2016年国家/地区生产总值排名前10;②教育发达国家/地区;③地区均衡,能覆盖或代表某一个地区。在PISA分析选中的18个国家/地区当中,有3个国家/地区(印度、中国澳门、巴西)没有参加过TIMSS测评,因此排除这3个国家/地区,本书重点对余下的15个国家/地区进行TIMSS测评结果的分析。此外,我国大陆地区目前也还没有参加过TIMSS测评,所以不在分析之列。表1-1 历次TIMSS科学素质测评的参与国家/地区续表续表续表(三)TIMSS抽样方法

所有国家/地区可以自行决定是否参加TIMSS测评,确定参加TIMSS测评后也可以自主选择参加哪个年级的测评。一旦选定了,则需要严格遵循TIMSS的抽样方法进行抽样,以保证所收集数据具有代表性且能够真实反映拟测评的内容。在1995年的第一次测评中,TIMSS就发布了详细的抽样规则,在后续测评中,根据已有测评经验,综合考虑代表性和可操作性,TIMSS陆续对抽样规则和方法进行了调整和改进。总的来说,TIMSS的抽样步骤没有大的变化,主要包含三个环节:列出参与国家/地区所辖的全部符合条件的学校,在学校层面建立参测学校样本库,抽取学校并对被抽中学校的班级和学生个体进行抽样(见图1-2)。图1-2 TIMSS抽样模型

上述抽样的每一个环节都有详细的规则和说明,以下将以最近一[3]次TIMSS测评(即2015年测评)的抽样规则为例,说明TIMSS的抽样方法。理想状态下,TIMSS期待参与测评的国家/地区所辖的全部符合年龄条件的在读学生都参加测评,但是,现实情况是复杂多样的,不是所有国家/地区都能保证所有学生参加,比如有的国家/地区包含一些无法用当地语言作答的国际学生,或者一些特殊学校的学生也可能存在无法完成作答的情况。根据TIMSS抽样的统一标准,参与国家/地区定义的目标群体不得少于该国家/地区期待的目标群体的95%;此外,定义本国/地区的目标群体时剔除的学校比例以及学生个体层面剔除的比例之和不得大于5%。

首先,参与国家/地区需要在本国/地区团队和TIMSS抽样专家的共同协作下,严格按照TIMSS抽样规则来列出符合条件的全部学校(参与国家/地区期待的目标群体)。在这个过程中,各参与国家/地区需要依照TIMSS期待的目标人群来确定本国/地区参与测评的年级,然后把本国/地区包含该年级的全部学校列出来,如果学校不包含拟测评的年级则自动从学校样本中剔除。大部分国家/地区的测评年级都是4年级和8年级,但有个别国家/地区法定入学年纪较小(比如英国、北爱尔兰、新西兰),这些国家/地区参与测评的年级则是5年级和9年级。

接着,各国家/地区需要建立参测学校样本库,定义本国/地区的目标群体。学校样本库的覆盖率控制在全国/地区所有符合条件的学校数量的95%及以上,只有极少数符合以下条件的学校能够从学校样本库中剔除:①学校地理位置非常偏远;②学校只有极少数学生;③学校的课程和建制与该国家/地区的主流教育体系不一样;④学校是为特殊需求的学生开办的。

然后,各国家/地区在学校样本库(即参与国/地区定义的目标群体)中抽取参与测评的学校和学生。按照TIMSS对样本量的要求,每个年级的测评中,各参与国家/地区应当至少抽取150所学校的4000名学生参与。如果参与国家/地区愿意,可以抽取更多的学校和学生参与测评。在抽中的学校当中,学生是以班级为单位参与测评的,每所学校至少抽取一个班的学生参与测评,也可以抽取多个班级。对于班额较小的国家/地区,有可能需要抽取多于150所学校才能凑足4000名适龄学生;而对于班额较大的国家/地区,则有可能150所学校各抽取一个班最终学生总数远多于4000人。这一环节主要分为三个步骤:从样本库中抽取学校,从被抽中学校中抽取班级,对被抽中班级中的个别学生样本进行剔除。抽取学校的方法与PISA抽样方法一致,采用按规模大小进行的概率比例抽样方法——PPS抽样法(Probability Proportional to their Size)。在抽中的学校当中,运用官方统一提供的校内抽样软件WinW3S对校内的班级进行抽样;各国家/地区将被抽中学校的班级数量和教师信息输入该软件,该软件将机会均等地从中抽取班级;被抽中班级的全体学生参加TIMSS测评。在被抽中的班级中,可能有个别学生无法参加TIMSS测评,可以从最终样本中剔除。学生个体的剔除也有严格的规定,需要满足如下条件之一:①学生存在身体疾病,无法完成TIMSS测评;②学生存在智力问题或精神疾病(读写困难不在此列),无法完成TIMSS测评;③非本土母语的学生,无法使用当地语言进行阅读和表达(包括语言学习短于一年的学生)。经过这一环节确定的样本就是各国家/地区实际参测的有效目标群体。二 TIMSS科学素质测评的设计

围绕测评目标,TIMSS对评价工作进行了整体设计,通过文本分析的方式对各国家/地区课程文件和教科书进行分析,以描述一个国家/地区“预期的课程”;通过问卷调查的方式,对学生所处的背景环境和学生个人的学习态度进行调查,以了解“实际执行的课程”和学生的特征;通过测评的方式对学生的科学素质进行评价,以探查“实际达成的课程”。其中,关于“预期的课程”的分析没有公开共享数据,也没有见到相应的官方报告;对学生科学素质的测评以及背景环境和学生个人特征的调查数据是开放共享的,基于这些数据的分析能够看出一个国家/地区学生科学素质水平的发展变化及其影响因素,也能反映一个国家/地区各方面水平在国际上所处的位置。历次TIMSS对学生科学素质的测评以及背景环境和学生个人特征的调查都做了详细的设计,下面将基于文本分析来呈现和解读TIMSS科学素质测评相关设计的变化发展。(一)科学素质学业水平测评框架

在对4年级和8年级的测评当中,TIMSS自2003年起才出现明确界定的测评框架,1995年和1999年的测评则只是在技术报告中描述了测评的领域但没有区分年级。表1-2呈现了1995年和1999年TIMSS科学素质学业水平测评领域,表1-3呈现了2003~2019年TIMSS科学素质学业水平测评框架。表1-2 1995年和1999年TIMSS科学素质学业水平测评领域表1-3 2003~2019年TIMSS科学素质学业水平测评框架

从表1-2和表1-3可以看到,TIMSS科学素质测评框架在2003年发生了较大变化,相较于前两次测评的设计,区分了年级,更加清晰地呈现了科学素质学业水平要测评的内容是什么,划分维度也让测评内容之间的关系更加明确。自2003年起,TIMSS科学素质学业水平测评题目的命制都是围绕内容维度和认知维度展开的,即一个题目涉及内容和认知两个维度的属性。其中,“内容维度”对应1995年和1999年测评的“内容”领域,“认知维度”对应1995年和1999年测评的“表现预期”领域。2007年测评框架相较于2003年又发生了一次变化,认知维度从2003年的事实性知识、概念性知识以及推理和分析修订为知道、应用以及推理。此后这一框架一直沿用至今,包括还未开展的2019年测评也沿用了这一框架。

在对中学毕业年级的测评(即TIMSS高阶测评)当中,TIMSS科学素质学业水平测评只考查学生的物理学业水平。同样的,在1995年的TIMSS高阶测评中,物理学业水平测评没有明确界定测评框架;在之后的两次高阶测评中,具有清晰界定的测评框架(见表1-4)。表1-4 2008年和2015年TIMSS高阶测评物理学业水平测评框架

从表1-4可以看到,2015年TIMSS高阶测评相较于2008年,在内容维度上都关注力学、电磁学和原子/核物理,2008年的“热和温度”修订为“热力学”,同时新增了对“波动现象”的考查;在认知维度上都包含“知道”“应用”“推理”三个方面。对比表1-3中关于4年级和8年级的科学素质测评框架,TIMSS高阶测评在内容维度上只关注物理学科,而认知维度则与4年级和8年级的测评一致。(二)科学素质测评内容比例

基于内容维度和认知维度中各个要素的重要性以及在实际生活中运用的比例,参考各参与国家/地区科学课程中不同学科内容所占的比重,TIMSS拟定了考查各个要素的题目比例(见表1-5、表1-6)。表1-5 1995年和1999年TIMSS科学素质测评内容比例

在1995年和1999年的测评设计中,只对测评的“内容”领域进行了比例分配,没有对“表现预期”进行比例分配。从表1-5可以看到,在1995年和1999年的测评内容比例分配中,“生命科学”的题量和分值比例都是所有内容中比重最大的;“物理”与“生命科学”的题量相当,但分值少2个百分点;“科学探究与科学本质”的题量和分值比例与“环境和资源问题”较为接近,所占比重分别为最小和次小。对比表1-5和表1-2的“内容”要素,发现在1995年和1999年的测评中,实际测试题目的内容分配与测评框架拟测评的内容并不一致,测评框架中的“物质科学”在实际命题时被拆分为“物理”和“化学”;测评框架中的“科学史和技术”在实际命题时并没有出现;测评框架中的“科学与其他学科”在实际命题时同样没有出现,取而代之的是“科学探究与科学本质”。表1-6 2003~2019年TIMSS科学素质测评内容比例

从表1-6可以看到,自2003年测评框架发生变化起,内容维度和认知维度下各要素所占的测评比重变化不大。总体来看,在内容维度中,无论是4年级还是8年级测评,占比最大的都是“生命科学”(8年级具体为“生命科学/生物学”),相较于1995年和1999年,“生命科学”与其他学科的题目比重差异进一步拉大;在认知维度中,历次4年级测评和历次8年级测评的比例分配都相对稳定,没有太大的变化,但是,相较来看,4年级对“知道”和“应用”的考查显著多于对“推理”的考查,而8年级对“推理”的考查比例有所提升,对认知维度三个要素的考查相对均衡。对比表1-6和表1-3可以看到,自2003年起,TIMSS科学素质测评命制的题目与该项目拟定的测评框架之间具有良好的对应关系,完全以测评框架为指导来分配题目比例。

TIMSS高阶测评以衔接大学物理专业为导向,在内容比例的分配上也相应地以大学物理专业的关注热点为依据。对应于表1-4的高阶测评框架,TIMSS设置了相应的题目比例,见表1-7。表1-7 2008年和2015年TIMSS高阶测评内容比例(三)科学素质测评的题型

自1995年第一次测评起,TIMSS测评的题型一直稳定地保持为两类:单项选择题和开放题。其中,单项选择题易于评阅,但并不是所有的内容都能够通过单项选择题进行有效的考查;开放题则能够弥补单项选择题的局限性。TIMSS测评的单项选择题中通常每个题会提供4~5个选项,只有一个选项是最佳答案;选项中不会出现“我不知道”或者“以上都不是”这样的内容;题干也不会暗示或者建议学生靠猜来回答问题,而是鼓励学生选择“他们认为最恰当的答案”。开放题要求学生自主作答,写出他们的答案,评阅时会按照统一的评分标准对学生的答案进行编码。从历年公开的题目来看,TIMSS测评的单项选择题命题方式较为灵活,有些题目是我们非常熟悉的四选一的单选题形式(如例题1),有的则更像是我们熟悉的判断题(如例题2)。例题1:(2015年4年级科学)有些动物是非常稀有的,比如西伯利亚虎。如果西伯利亚虎只剩下雌性,最有可能会发生什么事情?A 雌虎将与另一物种的雄性动物交配并繁殖更多的西伯利亚虎。B 雌虎相互交配并繁殖更多的西伯利亚虎。C 雌虎只能繁殖出雌性西伯利亚虎。D 雌虎不能繁殖出更多的西伯利亚虎,最终走向灭绝。例题2:(2015年8年级科学)物质从液态变为气态,有些特征和性质会发生变化,有些不会发生变化,在对应的空格内画×。#####

在开放题方面,考虑到学生本身的书写能力,4年级试题(如例题3)的文字书写量通常比8年级试题(如例题4)的文字书写量要少一些。例题3:(2015年4年级科学)下图展示了一个池塘。观察上图,区分生物和非生物,在下面空白处分别列出三种。生物  非生物1     12     23     3例题4:(2015年8年级科学)一些鸟会吃蛇。有一种蛇,生活在森林中的种群具有深色的外壳,而生活在田野中的种群则具有浅色的外壳。解释外壳颜色的差异对于这种蛇的生存有何意义。(四)背景调查的框架

除了对学生学业水平的测评外,历次TIMSS测评都对学生的背景信息进行调查,用以挖掘影响学生学业水平的因素,从而为教育系统的改革提供建议和对策。与科学素质测评的框架不同,从第一次TIMSS测评起,对背景信息的调查就有明确的设计,并且在历次测评中调查的维度也在不断发展变化。图1-3呈现了历次TIMSS测评背景调查框架。图1-3 1995~2019年TIMSS测评背景调查框架[1]International Association for the Evaluation of Educational Achievement (IEA).About TIMSS & PIRLS International Study Center.https://timss.bc.edu/about.html.2018-10-27.[2]Martin,M.O.,Kelly,D.L.(Eds.).TIMSS Technical Report Volume I,Design and Development .Chestnut,MA:International Association for the Evaluation of Educational Achievement (IEA),1996:1-4.[3]LaRoche,S.,Joncas,M.,& Foy,P.(2016).Sample Design in TIMSS 2015.In Martin,M.O.,Mullis,I.V.S.,& Hooper,M.(Eds.).Trends in International Mathematics and Science Study (TIMSS):Methods and Procedures in TIMSS 2015.(pp.3.1-3.38).Chestnut Hill,MA:International Association for the Evaluation of Educational Achievement (IEA).第二章 欧洲地区TIMSS测评第一节 高质量稳步发展:德国学生科学素质表现分析

德国学生参与TIMSS测评的情况如表2-1所示,在1995年参加了8年级测试,在2007年、2011年、2015年参加了4年级测试。表2-1 参加测评学生平均年龄统计一 总体发展趋势(一)8年级学生和4年级学生的总体学业水平

德国8年级学生只在1995年参加了一次TIMSS测评,其平均成绩为531分,高出国际平均得分15分,低分段学生(后5%学生)的分数为360分,高分段学生(前25%学生)的分数为600分。与8年级相比,4年级学生则参加了2007年、2011年和2015年三次测评。从图2-1中可以看出,德国4年级学生的平均得分在2007年、2011年、2015年三次测评中均没有变化,维持在528分的水平,并且均显著高于相应年份的国际平均水平。从表2-2中可以进一步看出,低分段的学生得分维持在400分左右,高分段的学生得分基本稳定地维持在570~600分的区间内。从平均得分以及学生得分的分布情况来看,2007~2015年的近10年中,德国4年级学生整体水平非常稳定。图2-1 德国4年级学生历年TIMSS测评总分变化情况表2-2 德国历次TIMSS测评得分情况汇总(1995~2015年)(二)不同性别学生的得分变化趋势

对不同性别学生的平均得分进行比较,8年级学生在1995年测评中的表现为:男生平均得分542分,女生平均得分524分,二者之间存在比较明显的差异。对于4年级学生而言,男、女生之间的得分差距逐渐缩小(见图2-2)。2007年、2011年两次测评中,男生平均成绩显著高于女生,而在2015年,男、女生之间的得分差距基本消失,男、女生的平均得分几乎相同。图2-2 德国4年级不同性别学生得分的变化情况(三)与国际科学素质基准的比较结果

根据国际科学素质基准,TIMSS将学生的得分进行了转化,分为极高水平(Advanced International Benchmark,625分)、高水平(High International Benchmark,550分)、中等水平(Intermediate International Benchmark,475分)以及低水平(Low International Benchmark,400分)四个层次。

8年级学生,在1995年的测评中,54%的学生处于中等水平及以上,其中29%的学生处于高水平,11%的学生属于极高水平。4年级学生中各个层级的比例总体保持稳定,没有显著变化。95%左右的学生能够达到低水平的层次,80%左右的学生能够达到中等水平的层次,40%左右的学生能够达到高水平的层次,10%左右的学生达到极高水平的层次(见图2-3)。这一比例说明,在4年级学生群体中,绝大部分学生处于中等水平及以上,有近四成的学生处于高水平和有一成多的学生处于极高水平。图2-3 德国4年级学生依据国际科学素质基准的水平分布二 学生在各学科维度上的得分变化

2003年起,8年级学生参与了地球科学、生命科学、物理、化学四个学科维度的测评,4年级学生参与了地球科学、生命科学、物质科学三个学科维度的测试。由于1995年TIMSS评分规则与2003年及以后的评分规则不同,所以本部分不分析8年级学生的得分情况,仅对4年级学生在各学科维度上的得分以及变化情况进行描述和分析。

从表2-3和图2-4的结果可以看出,学生在各个学科上的表现均相对稳定。具体而言,在生命科学领域,学生2011年的得分相对较低,但2015年则有所回升,且三次测评分数相差不大,并无显著性的变化;在物质科学领域,学生2011年成绩最高,2015年有所回落,但仍高于2007年水平,三次得分也无显著变化;在地球科学领域,与前两科不同,虽然得分持续下降,但降幅最大为4分,同样没有统计学意义的显著性变化。表2-3 德国4年级学生历次TIMSS测评各学科成绩统计图2-4 德国4年级学生在各学科的得分变化情况三 学生在认知维度上的得分变化

自2007年开始,TIMSS在认知维度划分上进化为知道(Knowing)、应用(Applying)以及推理(Reasoning)三个方面,并在后续测评中沿用至今。以下就4年级学生在认知维度上的变化情况进行描述。

从表2-4和图2-5中可以看到,4年级学生在“知道”和“应用”两个认知维度上的表现虽有所起伏,但相对稳定,无显著变化。在“推理”维度上,得分自2007年以后便逐渐升高,但分差不大(相差7分)。总体而言,德国4年级学生在认知维度上的表现同样是较为稳定的。表2-4 德国4年级学生各认知维度的历次成绩统计图2-5 德国4年级学生在各认知维度的得分变化情况四 学生家庭学习资源情况分析

TIMSS调查了学生家中学习资源的丰富程度,并将其与学生所获得的学习成绩进行了关联和比较。(一)1995年8年级学生家庭教育资源与学业成就间的联系

按照1995年TIMSS的测评框架,学生家庭教育资源包括学生在家拥有字典、书桌、电脑的情况,以及家庭所拥有的书籍数量等指标。

从表2-5可以看出,拥有全部三项的学生比例为66%,与非三项都有的学生相比,前者的平均得分高出后者28分。在字典、书桌、电脑三项的比较中,拥有字典的比例最高,达到98%,拥有电脑的比例最低,为71%。当然,1995年,学生家庭中有71%的比例拥有电脑,能够看出,德国学生的家庭条件是很好的。表2-5 学生学业成就与拥有字典、书桌、电脑情况的统计

学生家庭拥有的书籍数量则是TIIMSS考量的另一指标,TIMSS将学生家庭拥有的图书数量分为0~10本、11~25本、26~100本、101~200本、多于200本共5个层级,对每个层级的学生比例以及学业成就进行了统计,结果如表2-6所示。从表中可以看出,8年级学生的学业水平与其家中藏书数量有着明显的正相关性,家中拥有101~200本图书的学生比仅有0~10本图书学生的平均分高出99分,但拥有200本以上图书的学生比拥有101~200本图书学生的平均分仅高出14分,这表明对于德国8年级学生而言,拥有图书数量与分数之间的相关性随着图书数量的增多而递减。表2-6 学生学业成就与家庭拥有图书数量情况的统计(二)2007年、2015年4年级学生家庭教育资源与学业成就间的联系

在2007年、2015年,衡量4年级学生家庭教育资源丰富程度的指标有所变化。2007年的指标主要有:①家庭书籍的拥有量;②拥有电脑和网络的情况。2015年则为:①家庭书籍的拥有量;②父母的受教育程度;③书桌、电脑的拥有情况;④父母的工作情况;⑤父母报告拥有儿童读物的数量。对这些指标进行整合,划分为“许多资源”(Many Resources)、“一些资源”(Some Resources)和“很少资源”(Few Resources)三个层级。“许多资源”表示学生拥有超过100本图书,具有书桌和电脑两项学习用品,父母中至少一方完成了大学教育,父母报告拥有超过25本儿童读物,至少一方具有专业性的职业。“很少资源”表示学生拥有不超过25本图书,没有书桌以及电脑,父母均没有接受过高中以上的教育,父母报告拥有少于10本儿童读物,而且双方既不是小业主也不是“白领”或从事专业技术的人员。其余学生均属于“一些资源”的层级。

表2-7和表2-8展示了4年级学生在2007年时拥有图书数量、拥有电脑和网络情况及其与学业成绩之间的关系。从中可以看出,拥有的图书数量、电脑和网络情况,均与学业成绩之间呈现显著的正相关性。表2-7 学生学业成就与家庭拥有图书数量情况的统计表2-8 学生学业成就与家庭拥有电脑和网络情况的统计

在2015年,从表2-9中可以看出,资源的丰富程度与学生的学业成就显著正相关。拥有“许多资源”的学生平均成绩高于拥有“一些资源”的学生52分。与所有参与国家/地区的平均水平相比,德国处于中间水平的学生比例更高,只有个别学生的教育资源处于低水平。此外,德国4年级学生的水平整体显著高于国际平均水平,暗示学生素质、学校教育系统等均优于国际平均水平。表2-9 2015年4年级学生学业成就与家庭教育资源的相关性

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载