教育评估的体制创新(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-25 18:52:52

点击下载

作者:袁益民

出版社:江苏科学技术出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

教育评估的体制创新

教育评估的体制创新试读:

引言

我国关于教育评估、测量、统计、考试、督导等相关研究成果已有很多,近年来,在基础教育和高等教育质量保障体系方面也取得了研究成果。但是,很少有从整个教育评估政策和体制层面切入的研究,本书试图从这一方面进行探讨。

教育评估中的许多问题最终都必须反映到政策与体制层面,才能得到根本的解决。创新评估体制不仅是发挥现代评估功能、落实评估政策、实现评估目的,及整体提高评估水平的一个有效的切入点,同时也是从根本上认识和解决评估乃至整个教育质量保障问题的必备条件。随着教育大众化、普及化程度的提高,教育质量越来越成为人们关注的议题。规模的扩大和数量的增加不仅不会自动带来质量的提高,而且相反,容易造成质量保障压力的增加,甚至引起质量的相对下滑。而质量方面的问题又会反过来制约就学机会、教育规模、性别平等和均衡发展等方面问题的解决。与此同时,在我国加入世界贸易组织后,通过改进教育质量来提高教育的国际竞争力的任务更为迫切,而随着教育资源的跨国配置和教育服务的跨国提供的增多以及学分跨国转移和学历国际互认需求的增长,教育质量评估标准与评估办法本身与国际接轨的压力也明显增加,教育评估体制及政策制约教育改革与发展的问题日益凸现。

在这样的背景下,主动反思我国的教育评估的政策,创新和完善评估体制,不仅是保障教育质量的必须之举,改进教育质量的必然选择,而且也是面对经济全球化和教育国际化的必要应答和提升教育竞争力、谋求教育可持续发展的必由之路。作为今后一个时期教育改革和发展的主题,我国必须积极面对教育质量和教育评估所面临的现实挑战,重新认识教育质量及其保障与改进途径,推动教育评估的体制创新,构建与国际接轨、有中国特色的评估体制,切实保障和改进教育质量。

对教育评估进行政策与体制层面的整体思考,必须对与教育质量、绩效、发展状况等相关的比较宽泛意义上的各类教育评估进行全面审视,包括教育督导、政府主导的管理性评估、社会中介性质的评估活动,教育考试、监测、鉴定,院校认证、行政性审批检查验收、立法机关的审查监督检查、研究性质的评估调查、社会评议与评论等。这些教育评估相关活动尽管在日常工作中并不都称为评估,而且在我国也是非常分散地进行的,相互之间缺乏沟通和联系,但是实质上均属于教育评估性质的活动,在国际上也均被归入教育评估范畴。本书试图聚焦在体制层面和创新角度,对与评估有关的教育系统内外的所有相关活动进行全面的反思,对教育评估体系进行系统的梳理。

高等教育与基础教育的现有评估工作的体制安排(包括项目管理、评估目标、政策依据、评估主体、组织方式和结果使用等)存在一些差别,但是本书仍将它们放在整个教育评估的大框架内进行讨论。这一安排的主要考虑包括:各层次教育评估的内在同一性和关联性(如基础教育阶段的学生综合评价,与高等院校入学前后的评估,甚至是正规教育以后的终生学习项目的评估都有着越来越紧密的联系)使这两个领域联系起来讨论具有内在的合理性;我国教育管理体制的集中化,和各类评估活动管理机关的一致性,使这样的讨论具有合法性;教育评估体制问题的独特性(它与国家教育管理的统一政策、行政架构和运作机制有很高的关联度,两个层面的体制安排问题本来就应该统一考虑)使其具有适切性;国外(如美国)同时涉及基础教育和高等教育的院校认证的成功实践和已有经验,使其更具可接受性;本书试图探索整个教育评估体制(包括基础教育与高等教育等各个层次)的创新问题的研究定位也使其具有必要性;在统一的研究中,两者之间可以不排斥必要的分别讨论的可行性,又使其保持更多的正当性。

所以,对于“教育评估”的概念,这里采取比较宽泛的理解,是指与教育工作对象、机构、项目、状况、现象、事物、活动、政策等相关的,任何基于证据的事实和价值判断的过程,这种判断不论主体和客体的身份和地位的不同以及判断的对象和内容、基点和准则、手段和方法、结果和影响、时间和空间的不同。这一过程开始于对某变量进行测量,继而与前面定义过的参照点或基准相比较,根据测量结果与参数间的距离,作出是否和在多大程度上够标准或不够标准的事实和价值判断。只要符合这些活动和过程的核心要素就属于教育评估。

作为一个功能性概念,“教育评估体制”则是指评估教育相关方面或因素的制度化的成套活动的组织系统,模式化和程序化的管理体系,以及基于法律、法规或以其他正式形式规定的,引导一个国家评估活动执行的,具有恒久性的方向定位的制度安排和运作机制的总和。这里侧重于教育评估的组织系统、管理体系以及政策规定的、制度安排的工作模式与运行机制等。英文中的“System”一词在翻译成汉语时可以指“系统”“体系”“制度”“体制”“秩序”“规律”和“方法”等,本书采用“体制”作为该词的在汉语中的基本对应概念。然而,在具体讨论过程中涉及到汉语中的约定俗成的提法时,将尽量尊重汉语中的习惯用法。但是,不论使用哪种汉语表达方式,本书在“系统”“体系”“制度”“体制”之间不作严格的区分。

为了避免理解的混淆,这里对本书中涉及的“评估”和“评价”两个概念的使用作简要说明。一是本书对“评估”和“评价”概念不作定义上的区分。我国以往的教育评估实践中,一般基础教育阶段使用“评价”的居多(包括研究组织名称、政府文件和日常实际工作中),而高等教育领域更多地是使用“评估”,但其实两者没有实质意义上的区别。尽管注意到有一些学者对这两个概念作了区分,但是认为既然教育评估实践中是没有实质区分的,在外来文献翻译的过程中也是没有统一且明确的区分的,从理论上对其加以区分也没有实际意义,而且人为地或者牵强地给予不同的定义,可能会给理论与实践之间的对话带来困惑,给国内与国外之间的对话带来混淆。二是对“评估”和“评价”两词在不同语景出现的实际情形不作语义上的统一。既尊重工作实践中的实际使用惯例,也尊重不同语景和语言搭配关系中的习惯用法。本书把“评估”作为一个更加宽泛的概念,用它来等同和涵盖“评价”概念,并倾向于在涉及政策、体制及宏观管理时尽量使用“评估”概念,更多地对应于英文中的“Evaluation”,而在讨论手段、技术以及具体方法时,主张不排斥使用“评价”概念,更多地对应于英文中的“As-sessment”。涉及文件和机构名称等的直接引述完全尊重原文,间接引述也尽量尊重原文。

研究教育评估的整个体制如何创新的问题必然要首先基于对现有体制的认识,同时需要讨论与体制建立直接相关的政策、管理体系、系统目标等方面问题,还需要涉及现有的主要评估活动及其影响。为了使评估体制的创新建立在比较宽广的视野之上,还应该关注教育评估系统内外、教育系统内外和国内外的相关方面的发展状况和趋势。所以,本书以教育评估体制创新所涉及的基本问题为主线,力求从历史、现状和未来的不同维度,从理论、实践、政策的不同层面,从公共管理、教育和评估等不同的系统,从政府、社会和学校的不同角度,从地方、国家和国际的不同视野出发,多方位地审视和宏观分析教育评估问题,以便为教育评估体制的创新建立一个比较宽广而坚实的认识基础。本书的结构分为三大部分:现状的概述、反思和相关分析;新情况、新趋势和新理念;未来的方向、架构和制度。

大凡涉及体制创新,特别是作为一个十分复杂的社会科学研究领域和一个十分敏感的社会实践活动的教育评估体制的创新,都不会是简单或孤立的工作,而会涉及到许多方面的改革。同时,教育内外的环境变迁决定了教育评估的体制创新永远也不会有一个一劳永逸的解决方案,它必然是一个常创常新的课题。但是,如果能够摆脱“问题追赶型”研究模式,除了反思自己的不足,积极吸收别人的经验,适当超越时空限制,努力通过更宽的视野、未来的导向和长远的眼光,对教育评估体制进行根本性的重新反思和基础性的重新建构,那么,探索一套不会很快被“改革”的改革不是完全没有可能的。

当然,教育评估体制问题本身涉及到对于许多根本性问题的回答,如它的功能定位、各类评估之间的关系、评估机构角色的定位与监管措施、如何保障评估本身的质量、教育评估的法制保障等,不可能在一本书中得到完整的回答。本书提出的一些革新思路充其量只能算是一种可供选择的建设性方案,如果能够给予那些对教育评估的政策与体制感兴趣的决策者、研究人员和其他教育工作者一点新的启示,就足可聊以自慰了。

第一章 我国教育评估体制概述

教育评估体制的创新是建立在体制的现实基础之上的,也扎根于其历史背景和社会环境的土壤。所以,在讨论体制创新的思路和具体建议之前首先有必要对现代教育评估在我国的发展作一简要的回顾和大致的总结,对教育评估的现有体系、管理体制和政策作一介绍,并对现有评估的影响作一初步分析。

一、现代教育评估在我国的发展

(一)世纪回顾

1.总体印象

作为古代教育评估制度的封建科举制度在20世纪初废止后,由于众多原因,现代意义上的教育评估的理论研究与实践活动在我国一度没有得到很好的发展。直到1977年我国恢复高考制度以后,为了适应教育改革和发展的需要,迅速地提高学校教育的质量,保证教育政策的执行和目标的实现,教育评估研究和实践才逐步地得到了恢复和发展。

回顾近一个世纪我国教育评估走过的坎坷道路,可以比较安全地作出这样的判断:现代教育评估在我国的产生、生长、曲折和发展有其深刻的社会根源。从上个世纪初教育测量引入我国并得到一定的发展,到曲折徘徊后陷入停顿;从现代教育评估的空白期,到一边倒的单一苏联模式;从无所适从的政治迷茫期,到理论研究的中断;从恢复高考到最近二十多年来的逐步发展等。我们可以清楚地看到,政治社会因素是影响教育评估在我国发展的主要动因。

我们从教育评估在教育内外的环境因素影响下自身发展的线索和规律这一个侧面也不难看出,在上个世纪大部分时间里,教育评估的发展显得没可能、没需求、没必要。如果民族的生存问题还没解决,动荡的社会里不能放下一张可以安静读书的书桌,那就谈不上教育的发展,更谈不上促进教育质量提高的评估的发展;同时,如果教育的生存问题还没解决,老百姓的基本学习需求远远不能得到满足,那就还不需要过早地考虑更高层次需求的满足,就没必要花时间和精力来评判是非曲直、善恶功过的问题,也没有评论好坏优劣、成败得失的正当前提,更没有评价公平效益、价值附加的“奢侈”需求;再者,如果连评估工作在教育发展中应该发挥什么作用的问题还没有解决,学校教育过多地受到外部力量的影响和左右,或者教育管理仍然实行政府大包大揽,教育的计划、实施和总结反馈“一竿子到底”,那也就没有开展独立的评估活动和独立的评估研究的必要。

从这个意义上来说,现代教育评估作为一种专门的社会活动,其发展所需的社会条件在我国过去一个世纪的大部分时间是不充分的,其作为一个相对独立的专业和完备的制度而存在的理由更是不存在的。这也从根本上部分地解释了为什么现代教育评估传入我国后,虽然在漫长岁月中也有总体的上升(如研究在深入,重视程度在加大,活动在增多,政策在完善等),但一直未能发展到理想的水平。

2.主要特点

百年教育评估发展主要呈现出六个基本特点。(1)非连续性。封建科举制度与现代教育评估制度之间没有很好地过渡和衔接,在引入和开展现代意义上的教育评估的过程中的大部分时期,也没有出现较长时间的持续发展,即便是在连续性比以往增强的最近二十多年间,全国性的有组织的评估活动、评估研究组织的活动和国家出台的评估政策等,也还是存在缺乏连贯性的问题。(2)非主创性。尽管科举制度是祖先对教育评估的卓越贡献,但是“后发外启”的现代教育评估起步较晚,发展较慢,至今仍然相对落后。现代教育评估在我国的出现明显是由外部推动的,之后的发展也一度受到外部思想和模式的主导,即便是最近二十多年来的自主评估实践探索与真正意义上的理论创新也还是受到外部很大的影响的,甚至今后仍需要大量借鉴国外在教育评估方面的理论成果与比较成熟的实践经验。尽管我国最近二十多年来的教育评估工作是在一个比较高的起点上开始起步的,不需要重复国外半个多世纪走过的道路,但是从引进、消化、吸收、适应,到改造、实践、跟踪、超越,需要一个不短的过程。(3)非独立性。由于教育受外部社会政治条件的影响较大,而评估依附于教育行政管理的程度又较高,加之评估本身的先天不足和后继乏力,我国的教育评估长期未能成为一个专门的研究领域和独立的社会实践活动。其发展中期的政治影响以及后期的政策推动与政府主导是我国教育评估发展的基调。即便是最近十多年来相继成立的具有某种社会中介性质的教育评估专业机构,也一直未能获得独立的社会人格。评估工作至今仍然被看作是教育管理的抓手和行政权利的延伸。(4)非集中化。总体而言,我国的现代教育评估自发分散多于集中统一。早期的现代教育评估活动和相关研究以零星的为主,中期单一的评估模式也还是在地方和学校分散进行的,后期除了标准化教育考试、基础教育督导和高等教育个别评估项目外,实际上也是集中统一少、自发分散多。与后期评估政策制订和管理体制上的相对集中化相反,大面上的评估工作多是非集中化的,评估活动和评估研究以地方和学校自发分散进行的居多,同时呈现出突击性和非制度化的特点。全国的及地方的为决策和管理服务的有组织的研究活动与高度集中化的评估活动均是不多见的。即便是像后期的标准化考试和少量院校评估项目,尽管由教育部制订政策,有的直接由教育部牵头实施,但是同样呈现出给予省、地两级更多自主权和强调院校职责的趋势。

教育评估的非集中化问题是一个非常复杂的问题。应该承认,中后期我国教育评估相关政策的制订本身是集中化的,如制订统一的政策与标准等,从理论上来讲这些政策与标准是要求各地、各学校统一执行的。但是,各项评估政策之间又是不统合的,大部分政策法规的法律地位也较低,有些政策本身的强制性也不大,各地在政策执行过程中又有许多自主权,甚至在有些方面地方可以制订完全不同的政策。同时也应该看到,中后期我国教育评估的管理体制有高度集中化的一面。如国家教育部直接参与有些评估方案的制订,并直接组织实施;又如,督导、招生与考试等的管理采用自上而下与地方负责相结合的管理模式。但是,在实际管理过程中,地方负责的管理要多一些。而且,各类教育评估本身是分散进行的,相互之间很少有统一的协调。就是在国家教育部内部,涉及不同教育评估管理和项目实施的部门也非常分散。在各地,教育评估活动的主体以及活动内容与方式更是千差万别。所以,非集中化实际上多于集中化。这与法国的高度集中化管理框架下的具体管理活动的高度非集中化十分相似。(5)非应用性。总体而言,教育评估在我国更多的还是个理论研究的命题、时髦的现实尝试和行政权利的延伸。真正意义上的作为一种专业化社会服务的教育评估,主要还停留在“经院”里的研究层面,而实践中的教育评估工作实际上主要是行政管理的一个方面、一种手段、一个抓手,离现代意义上的教育评估相去甚远。即便是现有的行政性教育评估实践也是与评估理论结合得不够紧密的,知与行相互脱离的情况比较普遍。早期一度比较多的教育测量研究最终没有被实践所接纳,中期是有实践没研究,后期则是理论与实践分离,两者之间缺乏有效沟通和互动。

近年来,带有社会中介性质的专业评估机构成立后,知行脱节的状况没有丝毫改变,所谓专业化评估实际上仍然是以往管理性评估的继承和行政性评估的变种。一方面,理论界的应用性研究缺乏,使教育督导评估人员、社会评估机构和学校教育工作者普遍感到实际工作中缺乏理论指导和方法与技术方面的支持,只能凭经验办事,往往显得孤立无援。另一方面,许多相关的教育决策者实际上并不真正重视专业评估的作用和评估专业人员的判断,使教育评估工作并不需要有多少技术含量。这样一来,评估知识及理论研究与评估工作实践之间的脱节问题一直得不到很好的解决。(6)非整体性。政策的系统性,管理上的体制性安排,各类评估活动之间的协调性和互补性以及各地评估实践的平衡性向来是比较缺乏的。督导、检查、监测、调查、考试、测试等各类相关评估活动之间,个体、项目、机构、区域评估之间,内部评估与外部评估之间,高等教育评估与基础教育评估之间普遍缺乏相互联系和有机的结合。

3.基本结论

回顾近一个世纪的发展历程,虽然最近二十多年来教育评估已经在我国的一定范围内得到重视并在一定程度上取得进展,但总体而言,其作为尚有待于进一步消化吸收、系统改造和理论创新的“舶来品”,至今还没有得到很好的发展,更无法奢谈后发优势的发挥,在理论和实践两个层面均还处于相对落后的状况。这种落后首先是思想观念上的,同时也是技术方法上的,最终更是体现在政策及体制上的。这种落后在现实中突出地表现为有组织的系统研究的缺乏(专门的系列研究不多,专门的民间社团组织不多,评估实践的全面总结不多等),理论创新成果数量和质量的缺乏,高水平和有影响的评估活动的缺乏,评估研究及专业人员队伍数量的缺乏,评估一线从业人员专业知识和职业能力的缺乏,专业评估中介机构的缺乏,评估研究和实践的常驻协调机制的缺乏,有效引领评估体制改革方向并切实保障教育质量的政策的缺乏等。

当然,总体发展水平的欠理想状态和比较弱势,并不能否定我国在教育评估理论与实践两个方面取得的进展,尽管这种进展仍然只是初步的。一些政策的出台、督导工作的加强、考试评价制度的改革、各类评估活动的增多、民间专业社团的建立、对外交流合作的开展、社会中介机构的出现、个别专业杂志的创办、评估领域研究生的培养等,都说明评估在发展,其作用在得到发挥,影响在逐步扩大。

最近二十多年来,教育评估理论与实践方面的初步进展为教育评估进一步的改革与发展奠定了重要的基础,为其在我国的真正繁荣创造了有利的前提条件。作为教育评估持续发展的初始期,这一初级阶段的发展过程中积累的经验和存在的问题都将是今后进一步发展的生长点,也是进行根本性的重新反思和基础性的重新建构的出发点及推动新一轮体制创新的新起点。(二)教育评估的最新进展

1.取得进展的主要领域

恢复高考后的最近二十多年是我国教育评估稳步发展时间最长的一个时期,通过大量介绍和引进海外的教育评估理论成果,逐步深化认识,并在实践中不断探索,现已初步建立起了具有中国特色的教育质量评估体系的大致框架。可以从几个主要方面来观察这一时期的进展。

首先,政府主导。通过制订政策、成立相关的机构、建立制度,以及开展督导检查、监督活动和重点、示范、合格、教学水平等评估,引导、规范和推动教育评估工作健康有序地进行。中央政府及其教育主管部门发布了大量的有关教育督导评估、考试等质量保障方面的文件,推动了教育评估制度的建立和教育评估活动的开展,为考试、督导、评估机构的建立提供了组织保障。特别是在县以上各级政府成立教育督导机构,并不断地提升其地位,发挥了监督、检查和促进各级政府的教育工作的作用。领导重视、政策推动和政府主导是这个时期教育评估取得进展的主要动力源。国家教育部设立全国性的高等教育评估机构的举措,为推动高等教育质量保障工作的全面改进提供了可能。基础教育新一轮课程改革将评估作为重要的保证措施,为教育评估的进一步发展提供了广阔的空间。

其次,教育评估的实践活动也越来越多地开展起来。随着一系列教育评估政策的出台,相关机构的逐步建立,特别是学校教育的改革与发展,教育评估的范围不断扩大,教育评估实践活动多种多样。如各类特定工作领域与项目的评估,针对个体的评估,学校及教育机构的评估,区域教育评估,教育发展动态监测,教育统计调查等。可以说,只要能想到的评估对象,就会有相应的评估项目。教育评估主要作为教育管理的一种手段,在实践中得到广泛的运用。特别是基础教育领域针对学生的评估与各类学校教育评估,以及高等教育领域的本科教学水平评估与高职高专人才培养工作水平评估,已经对学校和整个教育系统产生了较大的影响。

再者,教育评估的理论研究不断深入。从主要以引进境外的研究成果,逐步转向通过引进、转化和自我实践进行自主创新研究,对教育评估理论的本土化研究和教育评估实践的总结研究都有所增多,民间专业社团的活动近年来也有所增多。除了创办少量专门评估类杂志(如《中国高等教育评估》《大学·研究与评价》等)以外,其他一般教育类杂志刊登评估方面论文的越来越多。评估领域研究生的培养和评估研讨活动的增多,对于教育评估专业队伍建设和教育机构的相关能力建设,起到了较大的促进作用。国家鼓励开展教育评估理论研究和实验。在推进基础教育课程改革过程中,积极组织考试和评估制度的改革,把它作为课改的重要组成部分之一。

第四,评估体制创新取得一定进展。近年来,国家开始鼓励社会中介力量介入教育评估工作,并开始培育教育评估专业机构,以政府为主,“官民并举”的格局正在逐步形成。政府指导、社会参与、学校自主发展的评估体制改革原则正逐步在观念上被接受,调动社会各方面因素来关注教育质量,允许各方利益关系人参与教育评估的评估工作发展方向初见端倪。

第五,教育评估领域的国际交流与合作日益增多。尽管中外教育评估发展的道路不同,但是我国正在通过引进和交流逐步缩短差距,逐步与国际接轨,实现异途同归。随着我国教育国际化水平的提高,参与跨国评估交流和国际性评估研究的机会增多,理论研究与实践活动呈现逐步趋同的趋势。一方面国外的评估概念、模式、方法更多地被引进,与国外的相互交流经验的机会也逐步增多,另一方面我国参与的国际性评估活动越来越多。除了小范围涉及了国际教育成就评估协会(IEA)的相关研究和经合组织(OECD)的国际学生评估项目(PISA)研究以外,我国相关单位还参与了联合国教科文组织全民教育(EFA)评估监测,与联合国教科文组织和联合国儿童基金会合作开展了小学生学习质量调查,与国际学校理事会(CIS)和美国部分院校认证机构等组织合作开展了在华外籍人员子女学校的认证工作,与国际高等教育质量保障机构网络(INQAAHE)、亚太地区质量网络(APQN)和英国教育标准局(OFSTED)等组织建立了交流合作关系。

最近二十多年来,我国教育评估领域最值得称道的进展是出现了观念的逐步转变和现代评估文化的萌芽。对考试评价制度改革的强烈愿望与探索,对教育质量保障体系研究的重视,对政府主导的评估的重新反思,对强调利益相关人主体参与的民主评估和人文评估的诉求,对外来新概念(如形成性评估、质性研究、表现性评估、增值措施、组织性学习)的接纳和部分吸收等,都孕育着一场教育评估思想的革命,昭示着我国现代教育评估新一轮发展即将到来。教育评估的版图正在悄然发生改变,单一纸笔测验一统天下的境况正变为历史,教育质量综合评估架构正初现端倪,同行参与、专业支撑的社会中介评估正逐渐受到青睐。教育评估各种潜在的功能和现实意义正在得到重视,教育评估结果的使用和作用的发挥开始得到一些教育决策者的关注。科学的、人文的教育评估不再只是时髦的用语,而正在成为一部分人的现实追求。

2.发展走向与分析线索

纵览二十多年来教育评估在我国的进展,20世纪70~80年代从起步到初步发展,20世纪90年代是理论成果、实践活动、机构的成立等比较集中的一个年代,可以说是教育评估发展的一个活跃期和高潮期,而新的世纪则又进入了一个全新的时期。

通过粗略的分析也可以看到一个逐步发展的过程,为了进一步了解这一过程中的相对趋势和大致走向,不妨可以从多重线索进行观察。当然,这些不同年代的趋势和走向是相互联系和交织在一起的,而不是完全独立或相互分离的。这些相互联系的趋势和走向可以从特定的事件和标志性的进展所反映出的阶段性主题中得到印证(见表1)。

从组织层面看,20世纪70年代后期机构恢复,80年代建立督导制度,90年代成立社会评估中介机构和研究组织,本世纪初成立全国性教育评估机构;从制度层面看,20世纪70年代后期高考制度恢复,80年代建章立制,90年代进一步完善政策,本世纪初开始强调制度创新;从发展状况看,20世纪70年代后期工作恢复,80年代实验铺垫,90年代大力拓展,本世纪初走向规范;从工作侧重点看,20世纪70年代后期开展对学校的检查,80年代重点学校评估,90年代示范学校评估,本世纪初发展性学校评估;从评估工作的目标来看,20世纪70年代后期着眼于选拔人才,80年代监督指导,90年代以评促建,本世纪初同行交流;从评估工作的功能来看,20世纪70年代后期以高考选拔为主,80年代开始建立自学考试制度,90年代建立高中会考制度,本世纪初强调综合素质评价;从评估研究来看,20世纪70年代后期恢复评估研究,80年代开始大量引进国外成果,90年代深化本土研究和更新观念,本世纪初与国际交流与融合的同时强调自主创新;从评估主体的身份来看,20世纪70年代后期政府督促,80年代开始政府主导的督导评估,90年代民间组织开始介入,本世纪初呈现出“官民并举”和社会中介力量越来越多地参与的趋势。

总体来说,政治影响、政策推动和政府主导仍是这二十多年教育评估发展的主线,以行政机构的管理性评估为主的居高临下式的外部评估是这个时期工作的基调。评估的主要目的与原则体现“以评促建”,主要基点是条件改善而非内涵发展,是事实判断而非价值提升,是工作促进而非质量保障。评估理论方面的深层次应用性研究,评估活动的正当性和独立性,评估方法的科学性和人文性,评估结果的使用和影响的控制等乃是我国这个时期教育评估的“软肋”。

二、教育评估的现有体系

我国现有的教育评估的体系主要包括几个方面的构成要素:以各类测试为内容的直接学业评估,测试以外的教育系统内部的各类评估,以教育系统内部为主但也涉及到系统以外的对于教育质量及教育发展状况等的监测、监控,涉及到教育系统内部但以外部为主的对于更宽领域教育目标达成情况的评估。为了帮助进一步分析和提出关于体制创新的建议,这里有必要对这些方面的政策、体制和现状,做一个简略的介绍。(一)直接学业评估(测试)

我国《教育法》第二十条规定:“国家教育考试由国务院教育行政部门确定种类,由国家批准的实施教育考试的机构承办”。我国现行的国家教育考试主要包括入学考试,如高考、中考、研究生入学考试等;水平考试,如高中会考、汉语水平考试、外语水平考试等;学历认证考试,如中等专业教育自学考试、高等教育自学考试等。国务院教育行政部门和省级教育行政部门设有专门的考试机构,负责组织和实施国家教育考试。部分高等教育机构经过批准,也可组织和实施国家教育考试。教育考试机构对受教育者的知识和水平的测定应按照国务院教育行政部门所确定的考试内容、考试原则和考试程序来进行。

1.高等学校入学考试

我国1977年恢复全国性的高等学校入学考试。考试对象主要针对约18周岁的高中毕业生,往年毕业的学生也可以申请参加。考试科目与高中学习的科目是基本对应的,包括语文、数学、外语、物理、化学、生物、政治、历史、地理等9个科目。近年来,为了更好地落实素质教育,高考科目设置方面正进行不断的改革,使高考成为既有统一性又有选择性的考试,增强高考科目设置方案的灵活性,扩大高等学校和考生的选择权。国家允许各省、市、自治区根据自己的情况制定各自的高考方案。现在普遍采用的是所谓“3+X”的方案,“3”为语文、数学、外语三门必考科目,“X”为其他可以自主选定的科目。各地的“X”自选科目组合包括“物、化、生”理科综合、“政、史、地”文科综合和“1+1”模式等。“1+1”就是高校可以要求选一门,学生也可以选一门,但在实际操作过程中这两门都是由学生自己根据情况确定的。

国家关于高考制度的现行法规依据是国家教育部2004年5月19日发布的《国家教育考试违规处理办法》。《考试法》的起草工作将适时启动。高考的管理机构是国家教育部的考试中心和地方的高校招生委员会办公室(考试院)。这一考试是每年举办1次(少部分省市2次)的制度化考试,高中毕业生和同等学力者可以自愿报名参加。近年来,为了推动高中新课改,江苏等省区对高考方案进行了新的探索。

2.普通高中会考

为了全面贯彻教育方针,加强教学管理,推动教学改革,提高教学质量,给中学教学以正确的导向,原国家教育委员会发布《关于在普通高中实行毕业会考制度的意见》,决定从1990年起在全国推行普通高中毕业会考制度。2000年,教育部又根据《中共中央国务院关于深化教育改革全面推进素质教育的决定》的有关精神,发布《关于普通高中毕业会考制度改革的意见》,提出:①各省、自治区、直辖市对普通高中会考改革具有统筹决策权;②不再进行普通高中会考的地方,要建立和完善普通高中学校毕业考试制度;③继续实施普通高中会考的地方,要在省级教育行政部门的指导下,以全面实施素质教育为宗旨,进行会考制度的改革;④无论由学校自行组织毕业考试,还是继续实施毕业会考,都要根据普通高中学科大纲、教材,坚持毕业水平考试的性质。据此,各省(区、市)结合本地情况制定了本省(区、市)会考改革的具体方案。

普通高中会考一般在相应学科教学全部结束后进行,学完一门考一门,考试科目以高中所学科目为基础,具体方案由省一级自主决定。是否组织会考由省级教育行政部门提出意见,报省级人民政府批准,并报教育部备案。经省级教育行政部门认定,部分质量好、信誉高的学校可免予会考,允许其自行组织毕业考试,对成绩合格者颁发会考合格证书。普通高中会考面向全体高中毕业生,部分省市开始面向其他社会人员。有些地方把通过会考与参加高考的资格挂钩。会考不合格的,可以多次参加补考。

3.中考

初中毕业、升学考试(简称“中考”)是面向全体初中毕业生的升学考试,一般由地市一级教育部门负责组织,考试科目是初中所学课程中的部分科目。

国家教育部2000年印发了《关于2000年初中毕业、升学考试改革的指导意见》,明确提出初中毕业、升学考试要有利于中小学实施素质教育,培养学生的创新精神和实践能力,减轻学生过重的负担,促进学生生动、活泼、主动地学习。在中考命题上要求加强与社会、学生生活实际的联系,重视对学生运用所学知识分析问题、解决问题的能力的考查,有助于学生创造性的发挥。2005年,国家教育部在小范围实验的基础上又印发了《国家基础教育课程改革实验区初中毕业考试与普通高中招生制度改革的指导意见》的通知,要求2005年在全国更大范围进行改革,并要求改变以升学考试科目分数简单相加作为唯一录取标准的做法,提出在初中毕业生学业考试、综合素质评价、高中招生录取三方面改革的具体指导意见。

4.其他考试和竞赛

除了上述面向全体初中或高中毕业生的规定必须参加或者一般都会参加的考试以外,我国有许多由教育行政部门批准、相关教育机构组织的专门考试和竞赛,包括数学、物理、化学、生物、计算机、外语等科目。在这些竞赛中获奖有利于学生获得大学入学保送或者推荐入学的资格。另外,还有一些特色课程方面的竞赛,如体育、艺术、技术类的竞赛。这些竞赛中获奖的学生也容易得到大学保送的机会。有些考试,如外语、计算机、音乐等考试还与相关的资格等级挂钩,通过考试可获得相应的资格等级。所有这些考试和竞赛都是自愿报名参加的。(二)其他方面的系统内评估

除了考试、竞赛,与教育质量评估相关的系统内部评估还主要包括以下方面。

1.教师评估

我国学校对教师的评估和考核,一般包括三个方面内容:德育工作(包括班主任工作考核)、教学工作(主要是课堂教学和教学绩效)、教学研究(包括教科研成果、参加继续教育课时数、职称等)。在实际的评估过程中,一般比较看重学生的学业成绩,一些学校和地方片面追求升学率的倾向比较严重。地方教育主管部门对教师的评估一般是通过确定教师资格、教师职称评定、教师年度考核等方法来实现的。地方教育主管部门还每年对校长进行制度化评估考核,有些地方还对校长任职资格及校长职级进行评定。

2001年,国家教育部针对新一轮基础教育课程改革颁布的《基础教育课程改革纲要(试行)》提出,“建立促进教师不断提高的评价体系,强调教师对自己教学行为的分析和反思,建立以教师自评为主,校长、教师、学生、家长共同参与的评价制度,使教师从多种渠道获得信息,不断提高教学水平”。

我国《教育法》第三十四条规定,通过考核加强教师队伍建设。1991年,原国家教委和全国教育工会颁布的《中小学教师职业道德规范》对中小学教师修养提出了政治思想、业务水平、工作态度、工作成绩等方面的要求。《教师法》列专章对教师考核的机构、内容、原则、结果作了具体规定,为教师考核工作提供了重要的法律依据。《教师法》第二十四条规定:“教师考核结果是受聘任教,晋升工资、实施奖惩的依据”。这是对教师考核结果效力的规定。一般说来,教师考核结果分为优秀、称职、不称职等层次。经考核优秀者,可优先晋级、晋职,予以奖励。经考核称职者,可以续聘和正常晋升;不称职者,可以低聘或者解聘。

2.学校评估

教育行政部门对学校教育的评估,一开始是以创建重点学校为主要内容的,当时比较重视硬件建设标准。重点学校的评估一方面在教育资源相对不足的条件下促进和带动了一部分学校的发展,另一方面也带来了教育资源配置的不均衡。1995年开始,我国开始开展示范性普通高中评估,强化了素质教育的要求和示范辐射作用的发挥,对于提高学校的办学内涵起到了一定的作用,但是依然存在着面向少数和“千校一面”等问题。为了解决重点学校评估和示范性学校评估的弊端,配合基础教育新一轮课程改革,促进学生全面而有个性的发展,教师的专业发展和学校自我规划、自主发展,目前国家教育部正在研究出台普通高中发展性评估的新方案。这一方案的出台将对普通高中以及其他各级各类学校的评估产生影响。

学校评估一般是由地方教育主管部门或教育督导机构组织的,在有些省市是教育评估专业机构负责实施的。学校评估一般是强制性的,但近年来学校自主选择参与的评估也开始增多。学校评估的时间往往是不固定的,但近年来开展几年一轮的周期性、制度化评估的呼声越来越高,有些省市已经开始这方面的工作。

高等院校的评估是由国家教育部负责,全国性高教评估中心和省市教育主管部门分工实施的。目前,主要评估项目包括本科教学水平评估和高职高专人才培养工作水平评估。这些评估均是强制性的,有固定的周期、标准、程序和结果等级。近期,对于高等学校转向分类评估和侧重对专业的评估的呼声不断。

3.课程评估

2001年,国家教育部发布的《基础教育课程改革纲要(试行)》提出,“建立促进课程不断发展的评价体系。周期性地对学校课程执行的情况、课程实施中的问题进行分析评估,调整课程内容、改进教学管理,形成课程不断革新的机制”。改变课程评估过分强调甄别与选拔的功能,发挥评估促进学生发展、教师提高和改进教学实践的功能。

在高等教育领域,国家和省级教育主管部门负责对学校的专业设置、课程质量和实验室建设情况等进行评估。教育部学位与研究生教育发展中心负责进行对研究生课程的评估审核,同时还通过省市教育主管部门对研究生论文进行抽检,对学位点进行评估。近年来,国家和省级教育主管部门还在对高等院校进行评估时将专业的剖析作为主要活动内容之一。2007年,国家教育部更是在年度工作要点和出台的相关文件中提出了建立专业认证体系的问题。所有这些措施对于高等学校的课程建设起到了积极的促进作用。

4.学生评估

在我国,学校内部对学生的评估除了学期中、学期末的考试和平时的测试以外,在学期结束时还给学生的各方面表现写出评语,连同考试成绩一起向家长报告。2001年,国家教育部颁布的《基础教育课程改革纲要(试行)》提出,“建立促进学生全面发展的评价体系。评价不仅要关注学生的学业成绩,而且要发现和发展学生多方面的潜能,了解学生发展中的需求,帮助学生认识自我,建立自信。发挥评价的教育功能,促进学生在原有水平上的发展”。随着新课改的实施、升学考试的改革和学分制的推行,对学生表现性的评估受到更大关注,学校采用成长记录册来描述学生成长过程的评估方式日益普及。高等院校的学生评估以学业考试为主,普遍采用学分制,学习成绩和在校表现作为学校推荐就业和学生自主择业的重要依据。

5.督导评估

在我国,教育主管部门、教育督导机构等组织对教育系统执行国家政策和发展状况等进行督导、评估。《教育法》规定,“国家实行教育督导制度和学校及其他教育机构教育评估制度”。

教育督导的对象包括政府和学校,简称督政和督学。督政主要是对政府履行教育职责的情况进行评估和监督,目前我国已经建立了对县级人民政府教育工作进行督导评估的制度。此项督导评估的内容主要包括:领导的教育职责、教育改革与发展、经费投入与管理、办学条件、教师队伍建设及教育管理等六个方面。其结果要列入县级人民政府及其主要领导政绩考核的主要内容。督学主要是对学校依法办学的情况进行评估和指导。我国建立了中小学校督导评估制度。此项督导评估的内容主要包括办学方向、管理体制、领导班子、教师管理与提高、教育教学工作、行政工作的常规管理、教育质量等七个方面。其结果作为学校评选先进和奖惩、任免校长的重要依据。

督导机构的评估实质上多为教育系统内的政府评估。

除了督导机构以外,我国教育系统内涉及学校教育外部评估的组织仍然主要是由各级教育主管部门负责的,有些省市也有教育评估机构参与。这种外部评估活动主要还是属于系统内的官方背景的评估。(三)对于教育质量及教育发展状况的监控、监测与检查、调查

除了直接的考试、测验和其他校内评估以外,我国有比较完整的跟踪学生学业进步的学生情况申报制度。教育主管部门通过监控学生学业进步的指标,如及格率、留级人数、巩固率、升学率和毕业率等校本数据,收集、了解学生学业进步的情况。

各级教育主管部门都定期统计收集教育系统相关基本信息,教育管理信息系统(EMIS)正逐步完善。目前,教育部正计划在一些地方开展以个体为信息采集单元的校本数据统计的试点工作,以弥补现有统计数据方面的不足。国家统计局也开展了一些入户调查,收集涉及教育的相关信息。人口普查也涉及有关教育数据,但是一般比较单一。如2000年全国人口普查所提供的数据并不包含详细分学段的人口等数据。

为了动态了解义务教育发展情况,国家教育督导部门在全国选择了60个县开展相关监测活动,逐步建立义务教育的监测制度。监测内容包括学生辍学情况、中小学公用经费和办学条件等。监测结果为领导科学决策提供重要依据。

教育主管部门、教育督导机构、人大政协等也对所辖区域教育部门执行国家政策的情况、事业发展状况,以及学校依法治校和落实素质教育等情况进行调研、检查和评议,督促有关方面更加重视和更好地发展教育。教育主管部门直接开展的评估往往是以评选、评比、检查、验收、审批、评审、抽查、认证、评议等形式和名义进行的。

近年来,国家和一些省市也发表年度教育发展报告,这一做法正逐步演变成一种制度。

研究机构也根据研究需要或者与国外同行联合开展针对我国教育发展情况的各类教育调查,有时也接受有关方面委托开展教育调查,调查结果以研究报告或决策建议等形式递交或公开发表。我国与联合国教科文组织(UNESCO)、联合国儿童基金会(UNICEF)、国际教育成就评估协会(IEA)和经合组织(OECD)的国际学生评估项目(PISA)均合作开展过一些教育调查与研究。

近年来对于大学的媒体排名在教育系统内外产生了一定的影响,也引起不小的争议。(四)对于更宽领域教育目标达成情况的评估

除了直接学业评估,教育系统内的其他各类评估和教育系统内外对教育质量和绩效等的监控、监测、调查和检查以外,相关部门还对涉及更宽领域教育目标达成的情况进行统计、分析、研究、监测、检测和考核测试等。

国家各级统计部门通过年度统计公报,对教育和影响教育的环境因素进行统计分析;科技主管部门和人事管理部门进行人才评价和统计分析工作,并进行人才规划和对策研究;各级妇女联合会组织对妇女儿童的就学问题和发展状况进行统计监测;卫生部门对青少年健康状况长期进行检测、评估和管理;各级体育部门长期关注和介入青少年的体质监测和学校体育工作;劳动部门对学生职业技能进行考核并颁发相应技术等级证书;环保部门对学校的环境教育等进行评估和指导。这些更宽泛意义上的教育评估活动是教育评估的重要组成部分,其评估结果是调整教育目标和教育发展规划的十分重要的依据。

从某种意义上来讲,这类评估不仅是对前面介绍的各项评估的必要补充,而且是对它们的有效检验。

三、教育评估的管理体制

从教育评估的现有体系可以看出,除了系统外的与教育相关的评估活动由其他部门独立或会同教育部门负责开展,主要由教育部门负责的直接学业评估和系统内评估占了相当的比重,而在系统内评估中,管理性评估处于支配位置。在高等教育领域,院校评估和重点项目评估的影响比较大;而在基础教育领域,针对学生的直接学业评估和重点(示范)学校评估的影响比较大。从曾经开展过的评估来看,高等教育领域的评估活动主要包括重点院校与重点项目(如“211”工程、“985”项目、学位授权点、重点学科、各类建设基地等)的评估、各类工作评估和学校内部开展的评估。基础教育领域的评估活动主要包括直接学业评估、学生评估、教师评估、重点和示范学校评估、区域教育评估以及政府督导评估等。

在这些评估中,政治影响、政策推动和政府主导的官方色彩比较浓,以外部(一般是教育主管部门)施加的自上而下的评估为主。在这样的评估体系中,管理体制的集中化和一定程度的强制性的特点是显而易见的,尽管在具体实施过程中情况有各种各样的不同,非集中化的现象也相当普遍。随着《行政许可法》的颁布和机关职能的进一步转变,这类评估活动吸纳社会中介组织参与的情况将越来越多。实际上,在《民办教育促进法》和《中外合作办学条例》等文件中已经明确规定可以允许社会中介组织参与相关评估。但是,就现有参与情况来看,所谓社会中介评估实际上还是政府评估的一种延伸。

教育督导是制度化程度最高的一项教育评估活动。我国在县级以上政府设立的教育督导机构已经形成了一个比较完整的组织系统和工作体系。督导机构有一个垂直的工作系统,但主要还是由各级地方政府的教育主管部门负责管理。督导中的“督政”部分的工作对象主要是地方政府及其教育主管部门,特别是县(市、区)这一级,而“督学”部分主要是针对中小学校。督导工作的性质是政府主导的行政性监督行为。

招生、考试也是制度化程度很高的一项教育评估活动,已经形成了比较完整的组织系统和工作体系。它也有一个垂直的管理系统,但主要也是由各级地方政府的教育主管部门负责管理。所不同的是,招生与考试在“招考分离”的原则指导下形成了两个更加独立的工作系统,尽管在有些地方两者的职能被放到了同一个机构。考试本应该是一种社会化专业服务,但在我国目前的实际工作中,政府往往站到了前台,对招生和考试都介入得比较深。随着考试评价制度改革的深化,招生与考试将进一步分离,同时,学校内部的考试评价、社会公共考试评价以及高一级学校的考试评价将更好地贯通和结合。

高等教育的评估管理体制(见图1)集中化的特点比较明显。国家教育部通过其下设的机构直接开展或指定省级教育主管部门负责开展高等院校的评估。目前,本科教学水平评估由全国高教评估中心具体实施,高职高专人才培养工作水平评估委托省级教育主管部门负责具体实施,国家教育部制订评估政策与标准,并审定评估结果。有一些非综合性的单项评估和临时性的院校评估项目,如研究生教育项目、实验室项目、精品课程项目、大学高水平运动队项目和电大开放教育项目等的评估,也是由教育部制订政策、方案和标准,委托教育部相关部门或地方教育主管部门负责实施。在分工负责的基础上,评估工作的重心逐步向省一级转移。由于在大部分省市还没有建立社会中介性质的教育评估专业机构,也没有像普通教育系统那样的督导机构,所以就目前而言,在省市一级由省市教育主管部门直接负责实施的情况比较普遍。图1:中国高等教育评估管理体制框架

基础教育的评估管理体制(见图2)相对复杂一点,但基本架构是相近的。其集中化的程度比高等教育要低一些,学校外部的直接学业评估和学校评估由不同层级负责实施,但是从本质上来看,也具有自上而下、一定程度的强制性和集中化的特点,尤其是自上而下的特点相当明显。即便是社会中介性质的机构(从理论上讲应该是相对独立的)也依附于相应级别的教育主管部门,甚至可以向下级人民政府教育主管部门发文。由于在大部分省市还没有建立社会中介性质的教育评估专业机构,基础教育领域的评估以省、地、县三级教育主管部门及其督导,招生与考试机构负责实施的情况比较普遍,少部分地方也有教育科研部门参与的情况。

与评估相关的主要政策和基本标准的制订由教育部主导,具体评估项目的实施虽然是分级进行的,但是大部分的外部评估以省级为主,地级以下的评估基本上是从属性的而非独立的,而校本为主的内部评估也是在教育主管部门的指导下按照上级的要求实施的。无论是直接学业评估、学校评估还是区域教育评估等,一般均是以国家一级的政策和标准为依据、省级实施方案为蓝本进行的。所以,尽管重心下移了,但是评估管理体制方面的集中化的特点依然存在,自上而下的特点尤其突出。图2:中国基础教育评估管理体制框架

归纳起来,我国教育评估的管理体制有几个基本特点:一是全国性的评估政策、内容和标准,二是逐步走向以省级为主的实施方案和统一部署,三是政府主导的运作模式,四是自上而下的运行机制,五是不同项目的分工负责和分散组织,六是指令性的强制实施和单一性的外部参与。

四、教育评估的现有政策概况

尽管政策可以通过书面报告、建立规章、成立特定机构、举办专门的活动,甚至是领导人的讲话等方式来宣示,但是在我国更多的是通过文件形式正式出台的。20世纪80年代以来,国家出台的教育文件中涉及考试评价和督导等教育评估问题的内容越来越多,并公布了不少专门的文件。在本书的附录中,已将相关文件及大部分相关内容的摘要以表格形式一一列出。从这些文件可以看出,我们对教育评估的认识是逐步加深的,推动的力度是逐步加大的,从一开始的仅仅提及要建立相应的制度,由此将之纳入了教育工作的视野,到开始实际建立自学考试、督导、高中会考等制度和推动“两基”验收等评估活动,再到后来的引导和规范各类教育评估的实际开展,并提出关于考试评价制度改革的意见,直至近年来将开展教育评估的要求渗透到课程改革、民办教育、中外合作、职业教育和义务教育均衡发展等各个教育领域。这些文件的出台无疑对教育评估的开展起到了促进、引导和规范的作用,为教育评估提供了发展动力、制度保障和法制基础。

涉及教育评估的专门文件主要包括三个方面:一是法律法规,包括教育考试和督导等方面的条例、暂行规定和暂行办法,以建立单项的评估制度为主要内容;二是指导性文件,包括考试评价和督导等方面的意见、指导纲要和指导意见,以提出教育评估的单项或综合改进要求和建议为主;三是实施意见,包括“两基”验收和教育考试等的评估办法、验收办法和处理办法,是有关具体评估工作的操作性处理意见。

这些文件除了推动相关制度的建立和指导具体的评估实践,还作出了许多具有导向性的政策规定和建议。这些政策导向是多方面的,起码包括以下一些方面。首先,要求各级政府,特别是教育主管部门,重视教育评估,把它作为改进教育工作和提高教育质量的重要抓手,不断完善各项教育评估制度。其次,各项评估工作要坚持以评促建、以评促改、评建结合、重在建设的方针,把评估工作的立足点放在教育发展上,充分发挥其加强学校建设和促进教育改革与发展的作用。第三,加强教育督导工作,促进“两基”达标和巩固,推进义务教育均衡发展。第四,建立符合素质教育要求的考试评价制度,促进学生全面而有个性的发展、教师与校长的专业发展和学校的自主发展。第五,适应高等教育大众化的趋势,通过加强评估切实保障和改进高等教育的质量,为高水平大学的建设和整体提高高等院校的办学水平和教育质量服务。第六,转变政府职能,建立健全社会中介组织,包括教育评估机构,允许社会中介组织参与相关评估。

五、教育评估的影响分析

尽管现代教育评估在我国起步较晚、发展仍处于初级阶段,然而有些教育评估活动所产生的各种即时的影响和带来的各种后续效应是巨大的。这一方面与评估本身作为敏感性很强的社会实践活动的性质有关,同时也与我国突出教育评估的选拔、评优、等级认定等功能的定位以及评估与实际利益挂钩的做法有关,甚至与我国的社会文化背景有着密切的联系。

教育评估结果用于工作改进和问责的具体情况应该是分析评估影响的主要方面。同时,教育评估对于教育服务对象个体以及学校教育系统整体的影响,在教育工作者及公众心目中产生的总体印象也是分析的重要视角。在我国目前的实践中,教育评估对于教育系统、教育对象和社会公众的影响很大,有许多正面的影响,也有不少负面的影响。因此,对于我国现有教育评估活动的影响可以主要从以下方面来观察。(一)升学与就业

直接学业评估为测量学生的学习情况、升学和诊断学生的学习需求和问题提供依据。作为直接学业评估的各类考试、测验的影响是最明显、最广泛和最深远的,它与升学、就业直接或间接地挂钩,对于教育服务对象未来的发展与社会流动以及国家的人才培养等有着非常密切的关系。特别是主要的升学考试更是涉及到千家万户,牵动着无数家长的心,也直接关系到受教育者的健康成长。

直接学业评估一方面是迄今为止最有效的教育工具之一,对于人才选拔和带动整个社会向上提升产生了十分积极的作用,它同时为教育公平及社会公平提供了一个关键的平台,但如果使用不当也会产生严重的后果。一个时期以来,片面追求升学率的倾向已经产生了很大的消极影响,受到了社会各界的关注。除了直接学业评估,学校内部对学生的评估(如综合性评估)以及外部的各类水平测试、资格鉴定等,也对升学与就业产生不同程度的影响。(二)督导与检查

督导制度的建立是我国教育评估走向制度化的重要阶段。我国教育督导的组织机构不断完善,制度化程度比较高,对推动政府的管理性目标的达成,特别是对专项工作的促进起到了很大的作用。现在,教育督导已经成为基础教育领域除学业评估以外影响最大的主要教育评估活动,是目前基础教育评估,特别是政府评估的主要支柱,对于教育管理目标的实现起到了较大的作用。但是,仍然存在着“督政”不到位、“督学”不深入和整体来说专业性不够的问题。

除了督导以外,教育主管部门和“人大”、“政协”等还对教育进行各种检查,这些检查大部分是非制度化和不定期的。这样的检查总体来说对于教育工作的改进是必要的,也是有利的,但是在许多地方也有过频、过多、过滥的现象。(三)改进与问责

系统内外的各类教育评估为提高教育质量和绩效发挥了重要的作用。我国的教育评估一贯强调“以评促建”和“以评促改、以评促管、以评促发展”,充分发挥评估的指导、监督等各种管理功能,把评估作为促进教育质量提高和事业发展的重要抓手。参与过一些教育评估的机构普遍反映,尽管有些评估给学校制造的压力太大,效果也不一定都好,但是总体来说教育评估对学校的发展是有促进作用的,如果能进一步改进,如更多地强调发展性,将对学校建设起到更大的作用。在评估的两项最基本的功能(质量保障与质量改进)中,我国的现有评估大部分侧重于质量改进。教育方面的有些增长指标成为一些地方落实政府责任的目标,教育主管部门和组织人事部门将把绩效考核结果作为干部任用、教师评聘的重要依据。

在目前的实际工作中,教育评估对于办学条件改善的影响是相当大的,它要远远大于对于内涵建设、价值提升和质量保障等方面的影响。同时,把升学率实际上作为评价学生甚至是教师和校长的唯一依据的做法在许多地方仍相当普遍。有些地方甚至还公开地以学生的成绩来给学校、班级和学生排队。而教育评估在强化诊断与发展功能,促进教育改革与发展,特别是教育的均衡发展、人的和谐发展和学校的自主发展等方面则还做得很不够。教育评估用于对教师和校长进行绩效问责时也往往给他们带来过度的压力。由于评估结果经常与学校的地位、收费、招生甚至是校长的升迁有某种联系乃至是直接挂钩,教育评估承载了许多本不该承载的责任。(四)准入与投入

把专业性的教育评估用于资格审查、拨款审批,在我国的教育实践中不太常见,专业性评估除了在高等学校设置中采用以外,一般很少在这些方面使用,这与国外有很大的不同。大部分教育机构设置过程中的资格审查以及经费的拨给基本上是通过行政审批途径解决的。虽然在《民办教育促进法》和《中外合作办学条例》等文件中已经明确规定可以允许社会中介组织参与相关评估,但是实际上真正做到的应该没有。教育投入或者专项拨款一般也与专业评估无关。除了对入门关重视不够,这与政府部门的职能过宽有很大关系,与社会中介行业的不发达也有关系。(五)决策与规划

教育评估在教育改革与发展中应有的一项重要职能是为领导决策和进行未来的规划提供咨询。对教育事业发展状况的把握以及今后需要如何应对,都需要用事实与数据来说话,这就需要评估来作事实与价值判断。近年来,我国在教育统计、教育管理信息系统和教育事业发展报告等方面取得了长足进展,但是在质量监测、评估分析和研究结果利用等方面仍然比较薄弱,基于评估结论进行教育决策与规划的情况仍然少见。(六)总结与推广

教育行政部门和相关研究机构针对教育质量的调查研究活动是重要的评估活动内容。这些研究无论是否直接为实践服务或者得到公开发表,都会对教育质量相关研究成果的推广和评估实践的理论总结作出贡献。当然,目前很少见到这样有影响的调查研究。

对于我国的大部分地方来说,各级教育主管部门还是教育评估的主角。他们通过开展各类评估,通过向被评机构反馈评估发现和向社会公布评估结果,增加工作透明度,接受社会和家长对教育工作的监督,促进教育质量的改进。教育主管部门还经常通过一些不属于教育评估但具有评估性质并起到评估作用的活动,如开展调查研究,并通过年报、年审、年检制度,为决策提供咨询报告,用以更好地规范办学行为、改进资源配置、调整学校布局、调控招生计划等。教育主管部门每年出台年度计划和工作目标,将考核机制用于教育工作的各个领域及层面,并通过年度总结与报告制度了解学校工作情况及绩效,为指导学校制订新一年的发展计划和工作目标提供依据。教育主管部门还通过校长年度工作汇报会、研讨会交流各自的工作经验,树立典型,推广经验,促进共同提高。

第二章 对教育评估的理性反思

从上一章可以看出,现代教育评估在我国的发展是在曲折中前进,在前进中又有不足,是在总体上升中仍有整体的相对落后。教育评估体系表面上正在变得越来越庞杂,而实际上又有许多领域有待于进一步拓展。管理体制日益明晰,而过度集中与缺乏统合并存。现有政策不断得到丰富和完善,而其适切性和有效性还有待于进一步提高。评估影响正逐步扩大,而发展形势是喜忧参半。我们已经感受到了教育“评估时代”的到来,同时又感觉到了这个时代的任重而道远,而只有通过对教育评估的理性反思,才能理清这个时代的脉络。

一、当前教育评估存在的主要问题

现代意义上的教育评估在我国起步较晚,尽管发展较快,但仍有很大的改进空间。有关教育督导、考试和评估的大量文件的出台说明对于教育评估的认识在不断深入,实际上也推动了我国各类教育评估活动的开展,为教育评估朝着健康的方向发展,从而为有效的保障教育质量、促进教育发展奠定了良好的基础。但是,评估地位的明确性,评估政策的适切性,评估体制的完整性,评估项目的正当性,评估内容的全面性,评估主体的专业性,评估机制的民主性,评估对象的参与性,评估行为的规范性,结果使用的合理性,评估工作的有效性等方面,归结起来就是整个评估活动的科学性与人文性,都仍然不尽如人意。英国学者纽本(Tim Newburn)提出的五种类型虚假评估:走马观花型(不求深入)、文过饰非型(隐瞒问题)、暗渡陈仓型(另有动机)、表面文章型(做给人看)、借口推托型(推卸责任)等,在我国的评估实践中也均有表现。

从活动层面来说,许多评估项目缺乏正当性,主要表现为项目过多过滥,特别是没有很大效果的单项评估和应景式的突击性评估。同时,评估目标的适切性和评估的发展性功能体现不够,片面强调评估的甄别功能和选拔功能,重结果、轻过程,重结论、轻影响,重外部评估、轻自我参与,学校作为评估活动的主要利益相关人无法有效地参与评估的主要过程,往往被排斥在主要的评估活动之外,处于任人摆布的地位,评估活动的操作往往缺乏人文性。评估方案普遍存在价值偏差,学生的学习目标、教师的教学目标和校长的管理目标经常被严重扭曲。片面强调学生的学业成绩,忽视对学生全面素质和体现学校办学水平的其他因素的评估。评估指标一直以来普遍存在面向少数、片面要求、千校一面、“目中无人”、忽视个性的问题。

从技术层面来说,评估工作仍不够规范,专业性、权威性、公正性和相对的独立性明显不足,专业评估人员参与的评估专业服务不够。居高临下、外部主宰式的管理性评估过多,同行主导、共同学习式的专业性评估过少。对照指标和标准核对、进行简单加减和凭印象判断的方法使用较多,尊重科学性,恪守专业性,利用现代评估工具进行深入、细致的剖析和提供专业化服务较少,经验型评估的痕迹还比较明显。评估很少讲究科学性,除了在我国评估起步晚这个原因外,与重视不够,发展不够快,实践中反思还太少,理论总结太少等也有很大的关系。此外,评估技术手段的科学化、专业化、信息化程度有待进一步提高。

从政策层面来说,评估政策缺乏适切性,教育评估的目标与教育质量的目标严重脱节,教育评估的实践与国家现有的评估政策所追求的价值趋向相去甚远,教育评估政策对教育评估的支撑力度不够。教育评估的法律地位不够明确,各类教育评估手段之间的关系也不够明确。有利于现代学校制度和学校自主发展、教育均衡化和真正落实素质教育的评估政策还不够完善。评估实践呼唤科学合理、可操作性更强的评估政策,以切实改变目前单一的仅通过高考分数选拔人才和用升学率作为评估学校的唯一依据的状况,真正纠正片面追求升学率的倾向,把素质教育落到实处,切实改变“以考代评”、“以分取人”和“一评定终生”等现象。

从制度层面来说,存在上述诸多问题的根本原因是,保障和改进教育质量的评估体制没有安装到位。目前,覆盖全国的区域教育质量监控与评估网络尚未形成,教育问责制度尚需完善;民间中介力量参与和社会性评估体系建设有待加强,评估人员队伍建设仍需加强;通过教育评估引导公众正确认识教育质量还不够,有利于素质教育的社会舆论氛围尚未形成;学校评估中对学校自我规划、自主发展、形成特色意识和能力形成还重视不够;教育评估到底为何评,应该由谁来评,评什么,怎么评,何时评,评了怎样,这些根本性问题远远未能得到回答。教育评估应该更多地关注条件是否合格,还是条件合格后的目标达成和质量保障?教育质量保障与改进的责任应该由哪些方面来承担,如何承担?政府机构、学校与民间力量应该以怎样的身份参与评估活动?教育评估机构应该对谁负责,如何负责?对这些问题的完整回答对于完善我国现代教育评估制度十分必要。

教育评估中存在的有些问题是迫切需要解决的整个教育改革与发展中的重大问题,如素质教育评估体系的问题、教育质量保障体制问题、评估促进均衡发展的问题、评估促进现代学校制度完善的问题等。以素质教育问题来说,我国目前的学业评估、学生评估、教师(教学)评估、学校评估和区域教育评估还没有真正按照教育质量的要求进行。不论是考试的内容,还是其他教育评估的指标体系均没有很好地反映真正的教育质量的要求、目标和标准,教育目标被严重扭曲。评估的立足点不是要通过其诊断功能发展某方面的后进生,而是淘汰所谓差生;不是从不会评到会,而是要从会一直评到不会;不是一个也不能少,而是一个也不能多,没有很好地顾及学生全面而有个性的发展。

为什么全国在实施素质教育中普遍存在“素质教育轰轰烈烈,应试教育扎扎实实”的问题,究其根源有两条:一是教育评估评不出素质,二是实际上就没有真正地按照素质教育的要求去评估教育。其实,考试中侧重于素质的考核已经有许多现成的经验,区分素质教育的课堂和传统的应试教育的课堂也十分容易,所谓家长以及社会舆论压力也是可以引导的,要改变有的校长、教育局长和地方领导对升学率的片面重视其实也非难事,至于与此相关的优质教育资源相对不足和教育发展不均衡带来的升学竞争的矛盾,也是可以通过加大投入和正确的政策导向逐步从根本上予以解决的,关键是在教育系统内有没有一个真正的素质教育的评估体系,首先是有没有这样一种真正落实素质教育的强烈的意愿、决心和切实的行动。

这一系统内的评估体系的缺失反映到制度层面就是,没有这样的一种真正保证素质教育得以实施的法定的评估管理系统和相应的系统化的评估活动机制。2005年,在全国范围引起广泛关注的所谓“南京高考之痛”和所谓“县中模式”的争议在众说纷纭中不了了之,就清楚地表明了我国权威的、有利于促进素质教育实施的评估机制还不存在。所以,要切实改变目前单一的仅通过高考分数选拔人才和用升学率作为评估学校的唯一依据的状况,真正纠正片面追求升学率的倾向,必须推动教育评估体制的创新,从制度上保证素质教育以及整个有质量的教育的要求落到实处。

总之,理论与实践两个方面都需要反思,都需要改进。首先从理论研究层面来看,我国的现代教育评估在引进、消化国外相关成果,进行自己的实践探索方面取得了一定的进展,形成了一些理论成果,建立了一些学术研究组织,学术交流活动越来越多,近年来更培养了一批专门的评估专业人才。但是,整体实力不强,研究水平不够高,在理论创新方面少有突破。理论研究与评估实践相脱离的情况比较严重,一方面理论研究多集中在国外理论的介绍和从概念到概念的研究,结合我国的实际现状和需要的应用性研究不多;另一方面教育评估实践中遇到的许多实际问题得不到理论研究的支撑,专业性评估应有的地位得不到落实,基本上处于孤立无援的境地。

从评估实践层面来看,教育评估越来越受到各界关注,评估活动的触角已经伸到了教育工作的各个方面。有组织的评估包括政府主导的教育考试,基础教育的督导活动和重点与示范学校的评审,高等教育的若干机构与项目评估等方面。日常的教育评估活动更是无处不在,事事能评,教育工作中涉及的任何个体、项目、机构、现象和事项都能成为评估的对象和内容。但是,总体而言属于“散兵游勇”式的活动居多,在政策与体制层面少有突破。在名目繁多的教育评估活动的“繁荣”景象后面可以看到,大部分评估活动仍存在科学性的不足和人文性的缺失,制度化、模式化的高水平评估并不多见。

归纳起来,在具体的教育评估活动中比较突出的问题主要有以下方面。(1)片面强调评估的甄别与选拔功能,忽视其诊断与促进发展的功能。一方面忽视评估本身应有的问题诊断和质量保障功能,没有做到就事论事、对事不对人;另一方面忽视评估本身应有的工作改进和人员激励功能,没有做到人文关怀、见物也见人。很少有人去关心那冷冰冰的评估数据可能关系到学生的健康成长、教师的专业提高、校长的升迁和学校的未来发展。(2)片面强调评估结果,忽视评估过程。是好是坏一评见分晓,不论你的起始条件与水平是怎样,不管你与其他学校有什么个性差异,也不问过程中的具体问题和情形,不问来龙去脉、前因后果,结果怎样,你就是怎样。似乎评估就是为了证明结果,哪怕这种结果对学校发展本身没有任何意义。(3)片面强调学生的学业成绩,评估内容忽视学生全面素质和体现办学水平的其他因素。学生的学习目标被严重扭曲。学习成绩和升学率不恰当地成了事实上替代其他方面指标的主要的甚至是唯一的决定性的关键指标。而殊不知,升学率不仅不是判断学校发展的唯一依据,也不是主要依据,甚至不是重要依据,而只是体现学校发展的一个方面的带有印证性质的必要参照依据。学校发展不仅要看学生学业成就,还要有学生的全面素质要求,以及学校整体组织效率和教职员满意度等方面要求。(4)片面强调外部评估的作用,忽视自我评估和自主参与。学校作为主要利益关系人没有能有效地参与评估的主要过程,往往被排斥在评估的舞台之外,处于一种任人摆布的地位。评估变成了一种涉及自身但自己却无法参与其中的、来自外部的、自上而下的活动。实质上,学校的地位更多地是由政府及教育部门规定的,甚至可以说是限定的,因为他们没有自主规划和主动发展的条件,评估有时只能使有些学校显得更加无助和失望。(5)片面强调政府在外部评估中的主导作用,忽视社会参与在专业服务、公平公正、民主评估等方面的重要作用。(6)片面强调教育评估的绩效改进功能,忽视其首要的质量保障功能。这就使教育追逐短期的利益而不是长远的利益和可持续的发展。

二、教育评估实践的认识误区

在我国的教育评估实践中,本土理论研究的稚嫩及不足与外部理论引进的良莠不齐及消化不良并存。同时,除了理论研究与评估实践之间存在严重脱节以外,在理论研究者和评估实践者中间都普遍存在着诸多的迷思、认识断层甚至误区。这里只列举比较普遍和突出的几个方面。(一)变更考试科目与加大综合素质评价分量是解决素质教育的关键吗

在教育评估发展的历史上,考试曾经是教育评估的代名词,在现代教育评估出现后,它的地位仍然重要。在我国当前的素质教育老大难问题中,“应试教育”的问题仍然是个核心问题。那么,纠正“应试教育”主要就是改革考试和学业评价制度吗?改革考试和学业评价制度主要就是变更考试科目与加大综合素质评价的分量吗?这样的改革能够解决素质教育问题吗?长期困扰素质教育全面推行的事实说明,要么在思想层面,要么在技术层面,要么同时在这两个方面还存在关键问题没有解决。

所谓“应试教育”的症结在于教育质量保障与改进的系统不健全,实现途径比较单一,评估目标扭曲教育目标。教育评估往往跟着学生的学业评估转,而学业评估主要依靠考试手段,“以考代评”现象比较普遍,其他管理性的评估措施也没能有效地弥补全面质量测评与监控体系的缺位,各种监督检查的实际效果有限,使片面追求升学率的倾向一直未能很好地得到纠正。而过分依赖考试在教育评估中的作用无疑是罪魁祸首。

当然,考试本身的甄别与诊断功能不是发挥得过了,而是远远还不够。应试教育带来素质缺失的问题是考试内容、考试的指导思想、考试结果的错误解读和片面使用造成的,而不是考试本身及其产生的以分数来标识的结果造成的。不能由于分数中找不到素质,看不到分数的诊断价值与教育意义,就忽视分数、否定考试,而是相反,应该通过真正的改革使考试能尽量测出素质并使考试的诊断功能充分地发挥出来。考试考不出素质,素质教育难以实现。

除了考试,开展学生综合素质评价也是十分重要的,综合素质评价如果处理得当可以有利于促进素质教育。但是加大综合素质教育评价的分量,提高其在升学中的作用,不能演变成“应评教育”。如果不恰当地将综合素质评价的结果作为升学的依据,那么其危害比一张试卷定终生更为可怕。

其实,即便是改革了考试和学生学业评价制度,对于落实素质教育来说也是远远不够的。不难看出,片面追求升学率的出发点其实并不是要更多的孩子升学,而是要通过更多学生的升学使教育工作者在针对教育的绩效问责中保持有利地位,起码能避免各种打击。莱利·E.弗雷哲和威廉·斯居雷希利在《教育的十大迷思》一书中质疑标准化考试总会提高学校的成绩,他们认为过分强调考试的作用会使学校追求短期效果。那种“为考试教”(Teaching to the tests)甚至是“教考试”(Teaching the test)是不可取的。考试“可以成为教师监测进展以改进其教学、课程,特别是改进其学生表现的一种方式。但考试项目如果被看作是对教师和学校的行政监视则意味着灾难”。当前,有些地方的领导甚至明确要求教育部门像抓GDP那样抓升学率,这是十分有害的。

所以,问题的关键是如何从政策与体制层面切入,真正地以素质教育和有质量的教育的要求来首先评估教师、校长、教育局长和市长。教育工作者不能真正按照素质教育的要求来评估教育,对于学生的素质教育终将难以实现。(二)教育评估是教育管理的重要手段和抓手吗

在日常工作中,理所当然地把评估作为教育管理的重要手段和抓手,实际上各种名目的教育评估也确实多沦为了管理部门的“指挥棒”。那么,教育评估到底应该更多地是管理的抓手和“指挥棒”,还是教育质量的内部质量保障手段和措施,甚或是保障和改进教育质量和绩效的专门研究与专业服务?应该承认,评估使管理更加有效,教育评估在落实行政主管部门的管理要求和促进教育的改革与发展方面已经起到了较大的作用。但是,在政府转变职能实行更多的非集中化管理、宏观管理和间接管理的今天,如何进一步完善现代学校制度,落实学校的教育质量主体的责任,在教育评估中变要我评为我要评,已是当务之急。

目前,在教育评估实践中仍然普遍存在着把评估作为直接的行政管理手段,甚至是政府权利的延伸,由此也带来评估工作简单化和出现种种价值偏差。既然是抓手,那就变成想抓就抓,缺乏制度化的安排。似乎样样得评,评估越多越好。评估主体缺乏专业性,相关的行政部门谁都可以来评,而参与的官员和教育同行又缺少专业培训,行政性干扰太强,独立性和权威性不够。而事实上,评估作为一项专业服务,更多地应该是管理的一项间接手段,它不应该成为教育管理者可以随心所欲使用的抓手。

与教育评估是管理抓手的想法有关,在实际工作中人们往往相信评估能够解决所有教育问题,评估越多越好、越全越好、越细越好,夸大评估的作用,把它看作是包治百病的良药和到处能用的万金油。似乎什么都可以评,连所谓“特色”都要评。同时,还把全面性作为教育评估的一项重要原则,习惯于包罗万象,指标从一级、二级到三级甚至可以有几百条。其实,评估的作用是有限的,要正确发挥教育评估的作用,具体的评估项目应有明确的功能和有限的目标。(三)教育大众化、普及化、多样化必然带来评估的多元化吗

随着基础教育普及化、高等教育大众化、办学类型以及活动的多样化,教育质量的多样性越来越显现出来,使得采用一个标准评估学校越来越困难。那么,在这种情况下教育质量评估是否也就应该呈现多元化呢?现在不少学者和其他教育工作者主张应该实行多元化评估。不同层次的学校和同一层次不同类型的学校都要采用不同的评估标准,执行不同的评估方案,甚至对同一所学校也要根据不同的要求(如基础性、发展性、自主性、差异性)采用不同的标准和方案。这样的想法在学者中和不少地方的实际工作者中间具有相当程度的代表性。

但是,多元化评估并不是唯一的,甚至并不一定是明智的选择。评估关注哪一个方面的具体标准多一点,取决于一定的教育目标所要求的具体评估项目的目的。所以,教育大众化、普及化、多样化造成的质量的多样性和多元视角,当然会通过教育目标的调整反映到评估目的和评估标准中来。但是,质量的多样性和多元视角并不意味着评估的多元化。保障教育质量并非评估越多越好,越全越好,而是必须有系统的综合解决方案。

从根本上来说,学校教育质量主要是学校自身的职责。尽管学校保障其教育质量必须得到外部其他利益相关人的帮助,但这一帮助服从并服务于学校内部教育质量保障。在基于内部保障基础之上的学校教育质量保障体系中,外部质量标准是相对统一的、最基本的要求和最核心的评估基准,内部标准则是自我追求的自定义标准。学校主体参与和外部利益相关人的多元参与相结合,有利于提高评估的针对性、有效性、客观性和可接受性。但是,除了参与主体的多元化诉求和内部质量标准的多样性追求以外,外部评估方案与标准并不需要多元化。多元化的外部评估方案与标准不仅不会自动回应教育质量多元的问题,而且如果处理不当容易造成评估目标与教育目标的扭曲,因为两者之间并不是一一对应的关系。外部评估过多地干预内部发展的多元定位很容易出现偏差,带来“种瓜得豆”的风险。

所以,基于统一的最核心基准的外部质量保障与依据自主发展目标的多元追求的内部质量改进相结合,才是解决基础教育普及化、高等教育大众化、办学类型以及活动的多样化背景下教育质量保障的根本出路。

质量的多样性和质量问题的多元视角,并不妨碍达成关于质量定义、质量管理、质量保障与改进途径以及质量评估的共识。院校类型和层次的多样化,也并不能否定存在一种共同的质量标准。这一质量标准可以是不同类型院校共同遵守的基本的质量准则,标准体现在诸如目标的适切性,资源的有效利用与组织效率,教育成就,满足教育消费者现实的和潜在的需要,关注公平和权益,教职员的满意度(Faculty Satisfaction),及学生友好型学习与学校环境(Student-friendly Learning and School Environment)等方面。院校评估认证在指标的选择上应寻求不同类型院校存在的共性的、基本的质量标准,以确保学校达到基本的办学水平。至于学校质量的多元化发展则是学校自主的内在诉求,是由自身的办学定位和目标追求所决定的,政府不应涉足,也不应干预。(四)民主评估就是强调大家一视同仁参与的阳光评估吗

在实际工作中,当遇到评估的专业性不强、技术含量不高且劳民伤财的情况时,当看到有些评估带有歧视性、缺乏规范性和暗箱操作时,人们就会呼唤科学评估、民主评估。要求民主评估的具体事例很多,如要求平等对待所有学校,要让每一所学校一视同仁地参与评估;让所有利益相关人都来参与评估;以公开性为由向社会公布评估结果等。

其实,让具有不同条件、情况和需要的学校平等参与一项评估本身就可能是一种不平等、不公正,不同的学校在具体的要求上应该有所区别对待。利益相关人参与评估也并非越多越好,参与的方式与程度也应当各不相同,评估主要还是评估者的专业性工作和教育同行之间的交流。而公开评估结果也是十分敏感的事,公开的内容与方式应当得到被评者的认可,随意公开不仅会破坏被评者的民主权益,而且可能产生其他消极影响。

民主与自由是孪生兄弟,但自由并不是随心所欲。在现代民主社会里,民主与自由总是在一定的法制环境中存在的。学校及其他被评者到底有什么权利和义务?又有什么自由?评估者又有什么权利、义务和自由?这些都必须在教育评估中予以明确。像学校这样的被评估者有平等参与且得到公正对待的权利,也有向社会公开办学情况的义务,又有在行使完权利和履行完义务后免遭更多干扰的自由。

真正的民主评估有两个要点:一是过程参与,二是结果共商。目前的许多评估活动排斥其参与性,是外部要他评,过程中又是任人摆布,决定评估结果时更是毫无发言权,评估活动的人文性、自主权以及被评对象的自主规划、主体参与、自我评价和自我完善被忽视了。个体、项目和机构等评估中都存在缺乏民主的问题,缺乏过程参与和结果共商,缺乏自主权和人文性。(五)促进改革发展比保证质量合格更重要吗“以评促建”的方针似乎是所有教育评估活动的最高原则。人们强调“以评促建、以评促改、以评促发展”,并用斯塔菲比姆的“评估不是为了证明,而是为了改进”的名言作为佐证,近年来更是随意地给所倡导的评估贴上所谓发展性评估的标签,似乎离开了“促建、促改、促发展”就是过时的落后的评估。其实,建设标准不明确、审批标准不严格是谈不上可以“以评促建”的评估标准的,建设标准和审批标准永远落后于评估标准就谈不上发展。未达到建设标准就审批通过了,再去“以评促建”,评估标准够不着再去打折扣,这种现象在教育现实中非常普遍,这本身不是一种正常的、值得鼓励的现象。

当然,这与我国过去教育资源严重匮乏的情况是密切相关的,当时的战略思考是先集中力量办好一部分重点学校和项目,再对其他条件较差的发挥引领和示范辐射作用,先进带后进,使原来不合格的逐步合格,使原来不先进的慢慢走向先进。同时,这与政府过去那种大包大揽的管理模式也是直接有关的。其基本逻辑是我有多大能力就先办多大事,我认为你合格了你就可以开办,开办后我再给你改善条件,需要评估时我再与你一起创造条件争取得到发展。现在,我国的经济社会和教育发展的形势发生了很大的变化,但是,当时的思维逻辑还一直延续到今天,并且在转变政府职能、扩大学校办学自主权和鼓励社会力量办学的新形势下反而得到了某种程度的强化。

在强调和谐社会和科学发展,强调教育均衡化、民主化、教育机会均等,办人民满意的教育,特别是强调完善现代学校制度,让所有学校享有国民待遇的今天,这样的思维逻辑越来越显得与时代格格不入。应该看到,强调基准面的公平,强调基本的合格条件,强调基本的标准配置,强调基于基本办学标准和目标的评估,从而改变那种多标准或者实际无标准审批准入,高标准或者低标准建设与发展,到一个标准对多个标准的评估的怪圈(实质上这就是所谓的“以评促建”),必将是大势所趋。所以,不能轻易地、轻松地去讲评估的改进功能、提高功能,要把着眼点和关注点更多地放在学校建设标准以及具体学校的办学和教育目标的制订上,首先是放在准入审批的合格标准上。改变过去那种审批准入标准、建设发展标准与评估认证标准不一致及基本办学条件、基本发展目标与基本评估要求不一致的状况。

当然,同时也仍要考虑我国目前的实情,那就是:依法治教的水平还不高,现在政府的主导作用还很强,学校办学目标和要求还不够明确,学校的自主规划意识和能力还不强,评估的专业服务还不完善。因此,在当前情况下,超越具体学校的建设标准的“以评促建、以评促发展”还可能会延续一段时间。

但是,要明确评估首先是一种保障措施,而不是改进措施。人们在反思过去强调评估的甄别功能和评估结果的同时,反而忽视了评估本来应该具有的事实与价值判断和作出鉴定和选择的功能。其实,本来我国的教育评估技术含量就不高,科学性和专业性不强,独立性和权威性不够,因此忽视评估首先应该具有的鉴定和选择功能是不明智的。“评估不是为了证明”,但评估首先必须做好证明的工作,评估本来就是一种证明,没有证明就没有评估,通过证明来辨别事实的真伪,判断价值的高低,反映目标的达成度,鉴别绩效的高低,落实责任的归属,给出选择的依据。当前学术界普遍认为现在的评估是过多地面向证明过去、忽视发展未来的,但现实的问题是过分相信未来,而还没有能足够地把握现在。现在缺少的就是科学的鉴定、准确的判断,也就是学会做证明的工作。

其实,评估本来是可以同时具备多项功能的,而且这些功能又是可以相互补充的。评估可以保证质量、改进工作、绩效问责、增进知识、提升价值、建设能力、强化共识、凝聚人心,但是最基本的首先就是通过鉴别真伪、明辨是非和区分优劣来保障质量合格。具体的评估方案的作用总是有限度的,评估作为一种社会活动也是有疆界的,但是任何评估的影响可以是多方面的,而通过鉴定更好地保障质量是评估的基本使命。(六)保持荣誉和面子能以牺牲诚信和育人为代价吗

这个看似多余的问题却在教育评估中没有很好地处理。前已述及,教育评估承载了许多本不应该承载的责任,它产生的过多压力使评估目标和价值产生了扭曲,使评估功能和过程产生了异化。评估本就是把双刃剑,它既可以保障教育质量、促进教育发展,但如果使用不当也可以破坏教育质量,毒化教育环境,妨碍教育发展。实际工作中,往往容易片面强调评估的正面作用,但对于其也容易带来追求短期目标、资源配置失衡、教育不公、弄虚作假等负面影响缺乏足够的警惕。然而,教育评估允许甚至纵容追求短期目标的做法,在强调科学发展、协调发展、和谐发展的今天是不可接受的;在促进发展的过程中带来资源配置失衡和教育不公的后果,对于一个教育资源仍总体不足、有待于进一步推进均衡的发展中的中国来说,也是难以承受的;而在评估中出现弄虚作假的现象对于教育工作者来说,更是无法容忍的。因此,在继续坚持发挥教育评估的积极作用的同时,更应该严肃地反思评估可能带来的消极作用。事实上,消极的现象不容易被看到,也不容易被承认。

对于评估这样一项根据事实和证据进行价值判断的工作来说,荣誉与育人、面子与诚信,孰轻孰重一目了然,毋庸置疑,但不幸的是,荣誉和面子比教育发展、教书育人和社会诚信还要重要的情况在现实的教育评估中时有发生。以“应试教育”中的升学率牺牲“素质教育”中人的发展、人的健康与人的幸福仅是一个极端的例子,而在其他一般的教育评估中那种为了荣誉和面子而作出不该作出的牺牲也是经常会发生的。如在学校评估中,有些学校就会以评估结果的优良等级来牺牲社会诚信、学术尊严,暂时“忘记”自己的育人目标。如果教育评估由于水平不高不能达到评估目的,最多只是浪费钱财,而如果在一个教书育人的地方明目张胆地弄虚作假,甚至要求广大教师和学生配合和参与作假,那么教育评估就已经严重地被滥用了,其负面影响是不可估量的。这种情况即便不带有普遍性,但其影响极为恶劣。也许有人会解释为迫于无奈,或者用“以评促建”的成果为自己开脱,但事实上是过分看重荣誉和面子,不实事求是,这其实与教育评估的本意完全背离。就像育人是教育的最高目标和最高原则一样,诚信是评估的最低标准和最后底线。

三、教育评估的管理体制障碍

教育评估取得许多进展和评估活动的日益频繁,并不表明我国教育评估在理论、技术、政策和制度等层面已走向完善,尤其是在体制层面还存在许多迫切需要解决的问题。教育评估体制涉及的问题涵盖直接学业评估,教育系统内的其他各类评估,对于教育质量及教育发展状况的监测、检查、调查,以及对于更宽领域教育目标达成情况的评估等方面。具体活动包括:教育督导、政府主导的管理性评估、社会中介性质的评估活动、教育考试、监测、鉴定、院校认证、行政性审批检查验收、立法机关的审查监督检查、研究性质的评估调查、社会评议与评论等。所有这些活动均是由不同的部门分散进行的,没有统一的管理系统,相互之间尽管有少量的职能交叉,但基本上是相互不贯通的。涵盖各类教育评估的整体管理架构尚未建立,各种教育评估各行其是,无法相互沟通、互动、补充和形成合力。

我国教育评估体制目前最为突出的问题包括:教育质量保障和改进工作的管理体制的改革,促进学校自主发展和推动现代学校制度进一步完善的院校认证制度的建立,社会评估中介机构的培育与监管制度的建立等。

首先是教育质量保障和改进工作的管理体制的改革问题。目前,我国没有一个相对统一的负责教育质量保障与改进工作的完整的管理系统。国家教育部内没有设立专门负责质量保障与改进工作协调和管理的部门。其下设的高等教育教学评估中心和学位与研究生教育发展中心直接负责实施高等教育领域的相关评估,但对其他组织或部门没有行政管理职能。其下属的考试中心和基础教育课程教材发展中心评估处等也不具有相关管理职能。现在这方面的职能实际上是由教育部各相关业务司局及教育督导团办公室分担的。基础教育领域有自上而下的相对独立的督导和招生考试系统,它们与其他部门有工作上的合作和职能交叉,但没有非常清晰的职能分工,也不对其他同级部门具有管理职能。在高等教育领域,大部分的评估都是由教育部内相关单位直接或通过(委托)省级教育主管部门向高等学校实施的点对点的单独评估。除此以外,教育部对教育的质量管理主要是通过向省级教育主管部门和高等学校下发相关指导性政策文件进行的。但是,这些政策文件内容绝大多数都是对不同教育评估的分项指导,专门针对教育质量评估的文件很少,关于整合各类评估活动的制度性安排或者改革建议方面的文件则还没有。总之,从政策与体制层面来看,尽管主要由各级教育主管部门统一负责,但是部门之间和上下之间的沟通和协调是不够的。

其次是社会评估中介机构的培育与监管制度的建立。目前,我国行政部门主导的教育评估尚未能很好地保障教育质量和为教育改革发展提供有效支撑,而社会中介机构介入教育评估还没有形成气候,处于数量不多、地位不明、实力不强、发展不快的状况,需要大力培育。同时,对于现有的机构如何发展、如何监管,缺乏政策与相应的制度。

第三个最为突出的问题是有利于推动现代学校制度进一步完善的院校认证制度的建立。我国对大中小学都实施过许多的评估,如高等院校的重点、合格、水平评估,中小学的重点、实验、等级、特色、示范、发展性评估等。这些评估一方面产生了一些积极作用,但同时在工作中面临许多问题,在教育系统内外引起了一些争议,目前对于进一步的改革方向不是非常明确。现有院校评估存在若干制度性的缺陷,如现代学校制度不完善,政府、社会、学校三者的关系不明晰;学校自我规划、自主发展的空间很小,变“要我评”为“我要评”的动力机制缺失;学校教育质量保障与改进的主要责任归属不确定,明确学校参评权利和义务的法规基础不坚实;学校内部质量保障系统与外部质量保障系统不衔接。

随着高等教育大众化的进展和基础教育新一轮课程改革的不断深入,教育评估制约教育改革与发展的问题将日益凸现,管理体制滞后,评估整合不够,政府作用过大与教育的管、办、评三位一体的状况,以及社会评估中介管理的严重缺位等,将成为未来阻碍教育质量保障与改进的主要因素。

四、教育评估的政策保障问题

教育评估体制的障碍是与教育评估政策的不完善直接相关的。现有政策不完整,一方面有些方面的教育评估缺乏配套政策,另一方面不同的教育评估的政策不衔接或者相互之间不贯通,对于各类评估之间应该是怎样的关系基本上少有交代,政策的体制性安排不够。大部分政策要么过于笼统或模糊,要么过于具体或琐碎,政策导向不明。除了对教育评估作用的描述语言和要求重视教育评估工作,对教育评估在质量工作及整个教育工作中应有何法定地位没有明确,现有政策文件大部分法律地位也都较低。所以,尽管我国发布的相关文件数量并不少,但是总体来说,教育评估的法制基础仍然薄弱。

法制基础的薄弱对教育体制的完善和评估事业的繁荣带来了消极的影响。政府、社会与学校三者在教育评估中的关系和地位得不到明确,评估实际沦为行政管理的工具和权力的延伸。社会中介组织缺乏发展的空间,最后仍然成了政府的附庸。虽然一些文件中已经明确规定可以允许社会中介组织参与相关评估,但是文件中一个“或”字实际上使得这种参与无法落实。同时,对评估机构如何监管,政策规定上是个空白。《行政许可法》颁布后,对于法律规定的可以行业自律的部分也缺乏规范和政策支撑。

有利于真正落实素质教育和支撑课程改革的考试评价制度的完善缺乏明确的导向。符合素质教育要求的评估制度或体系到底是怎样的?评估为什么在素质教育面前遭遇尴尬、得不到切实的加强?素质教育成为老大难问题长期困扰人才培养和教育发展,其中一个最核心的问题是教育评估的角色没有扮演好,包括考什么、怎么考、评什么、怎么评等问题都没有很好地解答。如果没有根本性的重新反思和基础性的重新构建,考试评价制度改革本身就会像素质教育问题一样陷入困境,整个教育质量评估工作将受到牵制。

总之,教育评估存在法律地位的不确定性。现在似乎评估的合法性问题尚未提上议事日程,在实际工作中,似乎有没有政策依据对评不评和如何评都没有太大关系。如社会中介性评估专业机构的法律地位问题就是十分不确定的。有些地方已有这类机构,大部分地方还没有。这类机构属于什么性质的机构,是事业单位还是参照公务员管理,今后是向非赢利性社会组织方面靠拢,还是发展为赢利性中介公司,这些都不明确。又如,学校评估的法律地位问题也不明确。纳税人出钱办的学校要有质量保障和绩效问责,但是不是一定要评、谁来评、评什么、怎么评,现在缺少制度化的安排,远没有建立起完善的学校评估制度,其地位更未在法律中予以明确。此外,政策对能够开展和不能开展哪些评估以及如何开展没有明确的规定,使许多教育评估项目缺乏正当性。评估项目建立缺乏认证,现有评估过多、过频、过滥、不受欢迎;单项评估、重复评估也太多;民主性、公开性不够,存在暗箱操作。其实,通过制订相关政策,确立政府、社会和学校在评估中的角色和地位,明确评估主体与客体的关系,建立必要的工作规范,从政策上保障教育评估的健康运行,比制订多少评估方案、标准和开展多少评估项目要重要得多。

第三章 评估体制的社会文化及教育背景分析

我国教育评估的现实状况及存在的问题是与本国的国情、管理文化以及教育系统的特点和目标息息相关的。只有理解了国情、管理文化及教育系统的特点和目标,才能真正理解教育评估的过去、现在和将来,也才能真正把握我国教育评估体制创新和整体发展的脉搏。

一、教育评估与国情

各国的教育评估体制就像教育体制一样存在很大差异,这是历史发展和社会现实因素决定的。我国教育发展的状况以及教育评估体制的现状与国情密切相关。

我国是一个发展中人口大国,人口分布很不均衡。我国同时又是一个统一的多民族国家,国家推广全国通用的普通话,但各民族都有使用和发展自己的语言文字的自由。我国地域辽阔,区域之间、城乡之间发展极不平衡。改革开放以来,伴随着工业化和城市化的进程,我国经济快速发展,人民生活水平不断提高。市场经济体制逐步得到完善,民主政治和法制建设进一步加强,社会不断取得全面进步。我国的立法和政策制订的权力主要集中在中央和省两级,在此基础上根据不同的权限实行分级管理。近几年来,随着行政许可法的颁布和政府职能的进一步转变,管理非集中化的趋势越来越明显,社会发展更加趋于多元化。这些国情比较吻合地反映到了我国教育评估的现状和未来的趋势中间。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载