认知诊断评价理论基础(txt+pdf+epub+mobi电子书下载)-txtepub下载

作者：罗照盛

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

认知诊断评价理论基础试读：

前言

经典测量理论在指导实践的过程中暴露出许多不足和矛盾，如理论假设很难实际界定和操作、参数依赖于样本、项目特性与被试特性之间没有建立内在联系，等等。项目反应理论作为心理与教育测量理论新的发展成果，具有经典测量理论无法比拟的优势。项目反应理论很好地解决了经典测量理论存在的一些问题，因此，在指导研究实践中具有更强的生命力。认知诊断评价理论则能够对被试进行更加细致的诊断性评价，发现被试发展中的不足，并提出有针对性的补救措施，因此受到越来越多的研究者和实践者的关注。

然而，无论项目反应理论还是认知诊断评价理论，其推广和应用均受到许多因素的阻碍，以至于只有专门从事测量学基础理论研究的学者才能较好地理解和掌握它们，而其他心理学和教育学研究者只能继续使用经典测量理论的方法和技术。这使得项目反应理论和认知诊断评价理论的优势无法转变成现实应用。影响项目反应理论和认知诊断评价理论推广和应用的主要因素有：①理论模型相对比较复杂，包含许多数学函数，这让许多学者只能退而求其次；②这些理论的方法和技术的实现过程比较复杂，包含一系列的参数估计过程，这个过程又涉及许多数理统计的知识，这让许多学者又望而却步；③相对于经典测量理论可以使用如SPSS等软件，项目反应理论及认知诊断评价理论中各种参数和技术的应用没有简单易用的计算机软件支持；④测量学研究者与心理学、教育学其他领域的广大实践应用者之间缺乏足够的交流。以上因素使测量学基础理论研究者与其他领域的研究者之间相互隔离，无法相互学习、相互促进。

我一直希望能够拉近测量学理论研究者与心理学、教育学等其他领域研究者之间的距离，使测量学理论的最新研究成果能够应用于心理学和教育学的研究和应用实践，而心理学和教育学的研究和应用实践又反过来促进测量学理论和技术的发展。为了达到这个目的，我希望能够撰写两本书来介绍关于项目反应理论和认知诊断评价理论的基础知识。在此写作原则基础上，《项目反应理论基础》一书已经在几年前出版，而本书主要介绍认知诊断评价理论的一些基础知识。

本书的写作原则有三个。

一是内容要具有基础性和启发性。所有内容为认知诊断评价理论的基础性内容，为读者理解认知诊断评价理论中的模型、技术和方法，打下了较好的基础。许多内容的选择是为了启发读者进一步理解该领域其他相似的内容。

二是内容叙述要更加通俗。本书力求把认知诊断评价理论中的原理、技术、方法通过文字的形式和更加简单的式子呈现给读者，尽量从一个未接触认知诊断评价理论的心理学或教育学研究者的角度，来剖析认知诊断评价理论中的各种原理、技术和方法，尽量通过日常实例进行讲解。

三是内容要与国内外发展接轨，概念能反映国际的统一界定。

本书共包括十章内容：第一章主要讲述了经典测量理论与项目反应理论的发展，以及认知诊断评价理论的兴起及其相对已有测量理论的优势；第二章主要介绍了与认知诊断评价理论有关的一些认知心理学基本概念；第三章则介绍了认知诊断评价理论本身的一些基础性概念；第四章介绍了认知诊断评价理论的一些基本假设及其检验方法；第五章介绍了认知诊断测验及题目属性的定义方法；第六章介绍了认知诊断评价理论的一些代表性模型；第七章讲述了认知诊断评价理论模型项目参数与被试参数估计的原理，及各种常用的参数估计方法，并用实例进行了讲解；第八章介绍了认知诊断评价测验的编制方法与过程；第九章介绍了认知诊断计算机化自适应测验的编制方法；第十章介绍了认知诊断测验中正在发展的一些专题，主要是关于测验信息函数和等值的内容。

此书是本人在20多年的学习、研究和实践的基础上，根据个人理解写成的。喻晓锋博士为参数估计一章中的各种参数估计方法提供了详细的示例，郭小军博士为本书的写作查阅了大量的文献。

由于认知诊断评价理论本身受到关注的时间并不是很长，许多问题仍然在研究中，再加上写作时间较紧，有些问题的叙述不一定完全恰当，如有不妥之处，敬请不吝指正。

在本书即将完成之际，特别感谢本人学术生涯中的各位指导老师：张厚粲教授、漆书青教授、戴海琦教授、丁树良教授、张华华教授，他们在我求学的不同阶段给予了我悉心的指导和关心。师恩永不忘！另外，也要感谢江西师范大学心理测量学研究团队所有成员的支持，大家一起努力才有了我们心理测量学研究的不断深入发展以及学术事业长青。罗照盛2019年春第一章绪论

摘要：心理测量学理论从经典测量理论发展到项目反应理论和认知诊断评价理论，反映了社会对心理测量结果和过程精确化的要求。本章简要回顾了心理测量学理论的发展过程，重点介绍了认知诊断评价理论的提出及其主要研究内容。

心理测量是通过各种方法给我们的心理特质赋值的过程，心理测量学研究的是如何保证赋值结果稳定且有效，为此，心理测量学需要研究测量工具的质量、测量过程的质量以及赋值方式的质量。第一节心理测量学简述

心理测量学研究心理测量活动，以如何有效测量人的心理现象为目标。心理测量活动包括测量的对象、测量的方法与技术、测量结果的解释与应用。心理测量学理论则研究心理测量活动的一般规律，包括心理特质的赋值理论、测量方法及过程的质量保证、测量结果的分析与应用。一、心理测量活动的广泛性

当今社会，心理测量活动几乎无处不在。从人的发展来看，升学升级要测验，应聘谋职要测验，执业上岗要测验，晋职晋级要测验。从人的素质来看，评估人的心理发展水平有心理成熟测验；评估人的智力发展水平有智力测验；评估人的心理健康水平有心理健康测验；评估人的人格特征有人格测验；评估人的学业水平有教育成就测验；评估人的职业能力有执业资格测验；评估人的学术潜力有学术性向测验。从社会行业来看，金融、文化、教育等行业，三百六十行，行行有考试。心理测量是社会管理的重要途径，心理测量应用的广泛性标志着社会的发展和进步。心理测量的繁荣发展既对心理测量本身提出了更高的要求，同时也呼唤更多的专业人员关心和从事该项事业，去研究测量理论、钻研测量技术，开发出更多更好的心理测量方法。二、心理特质的可测性

心理测量学作为一门科学，研究的是测量的理论与技术。但由于人类心理现象的复杂性和非物质性，心理测量学首先要回答的一个基本理论问题，就是人的心理特质到底能不能被测量。俗话说人心难测，如果人的心理根本不能测量，那么心理测量学就不是一门科学。人的心理可测吗？1918年，现代心理测量学的创始人之一，美国心理学家爱德华·桑代克（Edward Lee Thorndike）提出：凡客观存在的事物都有其数量。另一位美国测量学家威廉·麦柯尔（William A.McCall，1939）进一步指出：凡有其数量的事物都可以测量。事实上，“从辩证唯物主义的观点看，任何事物都是质和量的统一，事物的质的差异是分类的前提，而事物的量的差异则是测量的前提”。心理学的研究已经证明，人的心理既有质的不同，也有量的差别。质的不同提供了定性分析的基础，量的差别提供了测量的基础。

人的心理是主观的、内隐的，难以直接测量。但是，人的心理可以通过人的外显行为表现出来，心理状态也影响着人的实际行为表现。人的行为是外显的，是客观存在的，是可以被观察到的，因此我们可以通过测量人的外显行为来推测人的内部心理状态。

另外，认知神经科学认为，人类的心理现象总是可以表现为特定的神经活动过程和状态，于是，我们可以通过直接观察人类神经活动的规律来测量人的心理现象。然而，这种测量方式当前还存在很大的局限性：一是很难大规模应用于测量群体心理特质水平；二是由于心理现象的整体性和复杂性，许多复杂的心理现象还很难通过这种方式进行精确测量。三、心理测量的间接性

基于以上分析，就当前的科学研究发展水平而言，人的许多心理现象还难以进行直接测量，只能通过测量人的外部行为来推测人的心理状态。因此，心理测量仍然主要是一种间接的测量活动。与直接测量相比，间接测量的难度更大，可能的测量误差源比较多。要做好间接测量必须设计好中介媒质。物理测量中也有间接测量，如测气温。我们通常根据温度计的读数报告气温，实际上我们读的是温度计中水银柱的高度，这里水银是测气温的中介媒质。我们利用的是水银的热胀冷缩性质，利用的是在温度计内横截面积不变的条件下，水银柱的高度与外界温度之间的线性函数关系。心理测量活动的中介媒质是人的外显行为，利用的是人的外显行为与人的内部心理的关系。作为测量中介媒质的外显行为种类众多而且复杂多变，外显行为与人的内部心理的关联度也有高有低，加上人还有保护自身安全的社会心理防御机制，使得同是间接测量的心理测量，要比温度测量的难度更大。四、测量误差的普遍性

任何测量活动都是存在误差的。各种误差的区别只在于误差的性质、误差的大小、误差的来源和误差控制的难度。任何测量活动要想完全消灭测量误差是不可能的。心理测量活动也不可能例外。心理测量活动不仅存在误差，而且相对于其他一些测量活动来说，存在的误差较为复杂。从一定意义上说，研究心理测量活动的主要任务也是最富挑战性的任务，是如何控制测量的误差。（一）测量误差的类型

心理测量活动中的误差有两种类型，一种是随机误差，另一种是系统误差。

测量的随机误差是指测量所得观察值与欲测特质真实值之间的差异值，其大小和方向都会随机变化。测量的系统误差是指测量所得观察值与欲测特质真实值之间的差异值，其大小和方向都不变。举一个简单的例子，我们用一台灵敏度极高的台秤反复称同一件物品，会发现每次的测值都不一样，有时重一点，有时轻一点，这就是测量的随机误差。如果这台秤的托盘不经意间被换成了一个比原托盘重5克的托盘，那么无论哪次秤，秤什么，物品的重量读数都会比它的实际重量少5克，这就是测量的系统误差。心理测量活动中出现测量误差的情况要比此例复杂得多。在通常情况下，心理测量的随机误差和系统误差是与实际观察值共居一体、混淆难分的，我们的任务是要将它们从实际观察值中分离出来，评估它们的大小，研究进一步控制它们的办法。（二）测量误差形成的原因

心理测量误差出现的原因是多方面的。

首先，作为测量目标的人的心理特质的特殊性使得测量容易产生误差。我们说，人的心理特质具有内隐性、抽象性，也就可能造成我们对测量目标的认识不清晰，导致我们对它的测量产生误差。另外，人的心理特质还具有不稳定性，受测者即时的生理、心理状态的不同都会导致所测特质的波动起伏，从而导致误差的产生。再者也可能是受测者未掌握正确的作答技能，致使作答不能代表其真实水平。还有一种特殊的情况是受测者故意掩饰他真实的想法致使测验对他的评价出现误差。

其次，使用质量不高的测量方法可能造成测量误差。心理测量是间接测量，我们要靠编制工具“刺激”出人的外显行为来推测人的心理。那么，如果所编的“刺激”项目引出的外显行为不是欲测心理特质的代表性行为，或所编的“刺激”项目只引出了欲测心理特质的一部分行为，或引出的外显行为不是那么清晰和稳定，也都会造成测量误差。

最后，心理测量活动的施测过程和施测环境安排控制不当也可能造成测量误差。比如，施测过程没有统一要求，测试指导语没有统一版本，反应起始时间和长短不统一，测试时的内外环境使被试不能集中精力，都可能造成测量误差。一种特殊的情况是测试过程失控、纪律混乱，由舞弊而导致测量误差，这种情况就更为严重。

心理测量活动中主试自身的一些因素也可能造成测量误差。就目前的技术水平而言，心理测量对主试还有较多依赖。测量工具是由主试使用的，主试对所测心理特质的理解有误，就会导致测量误差；测量是由主试主持的，主试实施的程序有误，也会导致测量误差；测量结果是由主试评定的，评分标准掌握不准确也会导致测量误差。

心理测量学理论可以指导我们给心理特质合理地赋值。当前，心理测量学理论研究的焦点主要是经典测量理论、项目反应理论和认知诊断评价理论。另外，概化理论也受到许多关注。第二节从经典测量理论到项目反应理论一、经典测量理论的优势和不足

经典测量理论（classical test theory，CTT）围绕着真分数（true score）的概念建立了第一代心理测量学理论架构，认为测量所得观察分数等于真分数加上误差分数，真分数包括目标真分数和非目标真分数（系统误差分数），误差分数是随机误差影响的结果。目标真分数是研究者希望测量到的心理特质的实际水平值，记为V；随机误差分数是在测量过程中由于各种随机误差因素影响而产生的分数，记为E；非目标真分数是由于系统性误差的影响产生的分数，记为I。随机误差分数和非目标真分数都是误差分数，是测量者要严加控制乃至希望消除的测量值。测量学还将目标真分数与非目标真分数合在一起称为真分数，记为T。真分数是使用测量工具实际观察到的稳定的测量值，真分数中不含随机误差分数，但它含有我们主观上不想测量但实际上却测量到了的非目标真分数。经典测量理论进一步假设：真分数T是目标真分数V与非目标真分数I的线性组合，观察分数X是真分数T和随机误差分数E的线性组合，即

经典测量理论还假设目标真分数、非目标真分数与随机误差分数都是相互独立的。由此推得以下两个公式：

上面公式中的符号分别代表各种相应分数的方差。方差代表的是分数离散程度的大小，同时也说明了相应因素（心理特质、随机误差、系统误差）对分数取值影响的大小。方差越大表示该因素对被试的评价结果所起的作用越大。将目标真分数方差、非目标真分数方差与随机误差分数方差三者相比，我们显然希望目标真分数方差越大越好，而非目标真分数方差与随机误差分数方差都越小越好。根据以上公式可知，三者大小取决于各自在观察分数方差中所占的比例。

经典测量理论的核心概念包括真分数、信度和效度。这些概念的操作性定义主要是基于相关分析技术的。比如，真分数就是使用同一方法对被试同一心理特质进行多次重复测量后获得的一致分数，该一致性程度通过信度系数来表示，而信度系数就是多次测量结果之间的相关性程度。经典测量理论从建立起到现在一直是指导各类测量活动或研究的重要理论，该理论的主要优势是基于经验的分析方法和简单易懂的分析技术。

经典测量理论由于简单易懂和效果良好而成为应用最为广泛的一种心理与教育测量学理论。然而，在测量学研究走向精细化时，经典测量理论一些不足的方面就表现出来了：首先，被试水平是通过观察分数总分来评价的，这个分数只能表示被试在本次测试中的相对地位（通过导出分数）和对内容掌握的程度，无法进行更精细的定位和描述；其次，数据分析结果依赖于样本，也就是说，被试水平描述和项目参数特性会随着测试样本的变化而变化，获取的参数无法迁移应用到其他测试情境中；再次，被试参数和项目参数不在同一度量单位系统，被试水平和项目作答结果之间没有内在的关联通道；最后，测量标准误被定义在测验整体质量的评价上，无法评价单个项目对单个被试的测量质量。二、项目反应理论的优势和不足

影响被试在项目上的作答结果的主要因素有两个：一是被试自身的能力水平；二是项目的计量学属性，如项目难度、区分度、猜测性等。按照一般经验来说，在同一个项目上，能力水平越高的被试，答对这个项目的可能性就越大；而对于同一个被试来说，越容易的项目就越可能被答对。

作为现代测量理论代表之一的项目反应理论（item response theory，IRT），它的特点是以概率函数的形式来描述项目作答反应结果是如何受到被试能力水平和项目特性联合作用的影响的。具体来说，就是依据被试在各个项目上的实际作答反应结果，经数学模型的运算，统一估计出被试的能力（abilities）水平或潜在心理特质（latent traits）水平，以及项目的计量学参数。描述被试能力水平、项目参数与项目作答结果之间关系的数学模型称为项目特征函数（item characteristic function，ICF），以图形表示则称为项目特征曲线（item characteristic curve，ICC）。图1-1为典型的项目特征曲线：横轴表示被试的能力水平，纵轴表示概率。例如，曲线上有A、B、C、D、E 5个点，它们分别代表了5位不同能力水平的被试在该项目上的答对概率。由图可知，在一定范围内，能力值（θ）越大，答对该项目的概率（p）就越大。图1-1 典型的项目特征曲线图

项目反应理论将项目视为测量被试能力水平的基本单位，项目的属性通过项目参数来描述。项目一般包含以下3个典型的计量学参数：①a参数，即区分度参数，它的值越大表示项目对不同被试能力水平的鉴别力越强；反之，则鉴别力越弱。在项目特征曲线图中，a参数反映了项目特征曲线的斜率，其理论值介于-∞和+∞之间，但在实际应用中的取值一般介于0和3之间。②b参数，即难度参数，它的值越大表示项目越难，在项目特征曲线图中，它反映了项目特征曲线位于能力量尺上的位置，因假定被试的能力值介于-∞和+∞之间，所以b参数的理论值范围亦然。不过，在实际应用中，被试能力值取值一般介于-3和+3之间。③c参数，就是猜测参数，代表了被试仅凭猜测答对项目的可能性，它的值越大表示不论被试能力水平高低，均更容易答对这个项目；值越小，则表示光凭猜测不易答对这个项目。c参数反映项目特征曲线的左下渐近线（lower asymptote）的高度，其理论值介于0与1之间。但是，在实际应用中，c参数过高的项目经常不被接受。

项目反应理论以项目特征函数来描述项目作答反应结果与被试能力水平及项目参数之间的关系，因所包含的参数个数不同，函数可被区分为不同的模型。常用的数学模型有单参数模型、双参数模型及三参数模型3种。各模型的项目特征函数如式（1-6）至式（1-8）所示。

单参数模型：

双参数模型：

三参数模型：

式子中：D为常数1.7；e为自然对数的底；j为被试编号；θ为第jj位被试的能力值；i为项目编号；a，b，c分别表示第i题的区分度参iii数、难度参数、猜测参数；P（θ）表示能力值为θ的被试答对第i题ijjj的概率。当然，也可以将函数式用图形表示，称为项目特征曲线。

项目反应理论弥补了经典测量理论主要的不足，在指导测量实践方面体现了更大的优势，同时也一直是测量学领域研究的主要方向之一。项目反应理论在对被试群体进行总结性评价（summative assessment）时具有明显的优势，在各类竞争性选拔测试中如入学、入职、晋升、荣誉授予等方面得到广泛应用。然而，项目反应理论研究者一直没有足够重视对被试潜在特质的精细化分析。虽然多维项目反应理论将测试的潜在特质引向了精细化的方向，但研究者一直没有充分地关注对测试的特质内容本身的意义的分析。第三节认知诊断评价理论的兴起

每一种新的测量学理论的兴起总是伴随着原有理论研究的深入和社会发展的进步。认知诊断评价理论在项目反应理论深入研究的基础上，顺应了社会对评价信息更加精细的需求。一、认知诊断评价理论的主要优势

随着社会大众和教育工作者对测量分析信息要求的转变，一个更加关注测量的特质内容本身意义的理论——认知诊断评价理论（cognitive diagnostic assessment theory，CDAT）逐步受到研究者关注。认知诊断评价理论由于强调了一个核心的概念——属性模式的作用，而被研究者认为是一个相对独立的测量学理论架构。认知诊断评价理论在形成性评价（formative assessment）中具有独特的优势。

认知诊断评价理论代表了心理测量学理论一个新的蓬勃发展的领域，它具有发展成为拥有诸多优势的理论的潜力。

认知诊断评价理论的一个主要优势，是能够在给被试特质赋值时提供更加深入细致的诊断性信息。认知诊断评价理论在给被试特质赋值时，不是给其赋一个笼统的观察总分（如CTT）或潜在特质水平分数（如IRT），而是根据被试的不同作答模式，提供出现这种作答模式的内隐的、潜在的认知结构分析。根据对被试认知结构的分析，我们可以知道被试在被测量的领域里认知发展的优势和劣势，知道被试哪些方面的认知水平发展得比较好，哪些方面发展得不足。因此，我们称这种赋值模式为认知诊断，支撑这种赋值模式的各种理论假设、数学模型、分析技术和分析方法构成了认知诊断评价理论的基本内容。二、认知诊断评价理论的主要发展历程

认知诊断评价理论还非常“年轻”，然而其理论架构却已经非常“健壮”。认知诊断评价的思想在20世纪八九十年代被提出并逐步发展。1989年，罗伯特·林（Robert Linn）编辑的《教育测量》（Educational Measurement）中的两个章节的作者塞缪尔·梅西克（Samuel Messick）和理查德·斯诺（Richard Snow）、戴维·洛曼（David Lohman）提出了认知心理学与教育测量学结合的意义。另外，有一些代表性的文章和著作专门研究和讨论了认知诊断评价的问题，如弗雷德里克森、格拉泽、莱斯格德、沙夫特（Frederiksen，Glaser，Lesgold，Shafto）在1990年出版的书《技能与知识获得过程诊断》（Diagnostic Monitoring of Skill and Knowledge Acquisition）；尼科尔斯（Nichols）在1994年发表的文章《认知诊断评价的一般过程》（A Framework for Developing Cognitively Diagnostic Assessments）；尼科尔斯、奇普曼、布伦南（Nichols，Chipman，Brennan）在1995年出版的书《认知诊断评价》（Cognitively Diagnostic Assessment）。进入21世纪后，以美国2001年发布的《不让一个孩子掉队法案》为标志，教育与心理测量学研究者开始大规模地关注和研究认知诊断评价问题，使认知诊断评价理论在各个方向上都取得了快速的发展。在这一时期，各种认知诊断评价模型、模型参数估计方法、认知诊断计算机化自适应测验、测验属性定义等领域的研究成果大量出现。这一时期的代表性成果如龙冈（Tatsuoka）在2009年出版的书《认知评价：规则空间方法》（Cognitive Assessment：An Introduction to the Rule Space Method）；莱顿、吉尔（Leighton，Gierl）在2007年出版的书《基于认知诊断的教育评价》（Cognitive Diagnostic for Education Assessment）；以及各种代表性认知诊断模型如DINA模型（Junker & Sijtsma，2001）、RRUM模型（Hartz，2002）、GDINA模型（de la Torre，2011）、GDM模型（von Davier，2008）等。认知诊断计算机化自适应测验研究也受到了极大关注（Cheng，2009；Cheng，2010；Hsu，Wang，& Chen，2013；Kang，Zhang，& Chang，2017；Kaplan，de la Torre，Barrada，2015；Liu，Ying，Zhang，2015）。当然，在这一时期，国内学者在认知诊断评价理论的各个领域也做了大量卓有成效的基础研究和实践应用工作，取得了大量原创性成果，在部分领域的研究甚至走在了世界前沿，在国内外发表了一系列研究成果，并出版了一批学术著作，培养了一批青年学者。三、认知诊断评价理论的主要研究内容

认知诊断评价理论的主要研究内容有以下几个方面。（一）领域认知模型的构建

领域认知模型定义了该领域的知识、技能、加工策略等，以及这些知识技能之间的结构关系。领域认知模型是测量和评价的内容目标，也是进行认知诊断评价的基础工作，定义了认知诊断测验结构效度评估的目标架构。（二）如何命制一份具有良好质量的认知诊断测验

测验的信度和效度是衡量测验质量的主要标准。认知诊断测验要能够稳定、精确、精细地区分不同被试在目标领域中的掌握状态。测验结构应该与领域认知模型一致，同时能够在尽量精简的情形下，稳定地区分被试的发展水平。（三）测验属性矩阵的定义

在定义了领域认知模型后，要保证测验编制过程中和编制结束后，测验及其题目能够很好地反映领域认知模型，测验题目与测量目标属性之间的关系定义是合适的。（四）选择一个拟合良好的认知诊断模型或方法

该模型或方法能够基于测试数据和测验属性矩阵，估计每个被评价被试对领域认知目标的掌握状态。（五）提供一份具有很好辅导作用的诊断性评价结果

根据被试的实际表现和领域认知模型，提供被试在该领域上的发展水平剖析信息，特别是存在不足的方面，并提出合理的改进意见。（六）其他研究主题

认知诊断计算机化自适应测验、等值。

本书主要围绕上述内容展开叙述，但叙述的顺序会有调整。

本章小结

本章简要介绍了几个典型的心理与教育测量学理论的发展过程，简要分析了经典测量理论和项目反应理论的主要优势及存在的不足，并由此分析了认知诊断评价理论兴起的原因，最后还简要介绍了认知诊断评价理论的主要研究内容。

思考题

1.经典测量理论和项目反应理论的优势和不足分别是什么？

2.相对于已有的测量学理论，认知诊断评价理论的优势是什么？第二章认知心理学中的一些相关概念

摘要：认知心理学是认知诊断评价理论研究的支撑学科，研究人类认知过程的内在机制，帮助我们了解信息的获取过程、信息的存储和加工过程以及信息的提取和应用过程，是建构各领域认知模型的最佳指导理论。本章简要介绍了认知心理学中关于信息加工过程的一些基础知识和概念，以便研究者建立起认知诊断评价与认知心理学之间的知识桥梁。

认知诊断评价理论以分析诊断被试的认知成分和结构发展状态为目标，因此，认知心理学自然就是认知诊断评价理论的实质心理学基础。在理解认知诊断评价理论中的各种概念、模型、技术和方法前，我们需要了解认知心理学中一些相关的基本概念。第一节认知心理学简述

认知心理学是一个非常重要的心理学理论流派，也是当前心理学发展的主流理论。一、认知心理学理论流派的兴起

冯特（1832—1920）是近代心理学的创始人之一，在心理学发展史上，他的名字与心理学的独立和实验（内容）心理学的建立直接联系在一起。

自冯特1879年建立第一个标准心理学实验室以来，整个心理学界出现了过去从未有过的热烈的学术研讨的繁荣局面。在冯特的内容心理学之后，又相继出现了各种各样、大大小小的心理学流派上百个。这些心理学流派分布广泛，遍布世界各地。其中，具有比较重要影响的心理学流派包括内容心理学派、意动心理学派、构造主义心理学派、机能主义心理学派、行为主义心理学派、格式塔心理学派、精神分析心理学派、日内瓦学派、人本主义心理学派、认知心理学派。

认知心理学起始于20世纪50年代中期，60年代以后飞速发展。1967年美国心理学家奈瑟（U.Neisser）《认知心理学》一书的出版，标志着认知心理学成为一个独立的心理学流派。

认知心理学是心理学发展的结果，其主要特点是强调知识的作用，认为知识是决定人类行为的主要因素。它与西方传统哲学也有一定的联系，如英国的经验主义哲学等。笛卡儿强调演绎法的作用，认知心理学同样重视演绎法。康德的图式概念已成为认知心理学的一个重要概念。

认知心理学也继承了早期实验心理学的传统。19世纪赫尔姆霍茨等人提出的反应时研究法，是今天认知心理学家广泛采用的研究方法。冯特是现代实验心理学的奠基人，认知心理学关于心理学的研究对象和研究方法的看法与他的观点很接近。他认为心理学的研究对象是经验，是意识内容，研究方法是控制条件下的内省。有些心理学家说，认知心理学又返回到冯特的意识心理学上去了，所不同的是方法更加可靠了。

格式塔心理学对认知心理学的影响也很明显。它以知觉和高级心理过程的研究著称，强调格式塔的组织、结构等原则，反对行为主义心理学把人看成是被动的刺激反应器。这些观点对认知心理学有着重大影响，如认知心理学把知觉定义为对感觉信息的组织和解释，强调信息加工的主动性等。在方法上，格式塔心理学主张研究直接的生活经验，主张把直接的生活经验材料与实验资料结合起来，如重视观察者对自己知觉内容的直接描述，并把这个方法称为现象学方法。这种观点，既不同于冯特和铁钦纳只承认经过严格训练的被试的内省，也不同于行为主义只重视实验室实验的做法，却与认知心理学的基本观点相一致。

认知心理学有广义、狭义之分，广义的认知心理学是指凡是研究人的认识过程的，都属于认知心理学。而目前西方心理学界通常所指的认知心理学，是指狭义的认知心理学，也就是所谓的信息加工心理学，它是指用信息加工的观点和术语，通过与计算机相类比、模拟、验证等方法来研究人的认知过程，认为人的认知过程就是信息的接受、编码、存储、交换、操作、检索、提取和使用的过程，并将这一过程归纳为四种系统模式：感知系统、记忆系统、控制系统和反应系统。它还强调人已有的知识和知识结构对他的行为和当前的认知活动起决定作用。其最重大的成果是在记忆和思维领域的突破性研究。

现代认知心理学的基本观点就是把人看作信息传递器和信息加工系统。其主要理论观点有：

第一，把人脑看作类似于计算机的信息加工系统。它认为人脑信息加工系统由感受器（receptor）、反应器（effector）、记忆（memory）和处理器（或控制系统）（processor）四部分组成。首先，环境向感觉系统即感受器输入信息，感受器对信息进行信号转换；其次，转换后的信息在进入长时记忆之前，要经过控制系统进行符号重构、辨别和比较；再次，记忆系统存储着可供提取的符号结构；最后，反应器对外界做出反应。

第二，强调人脑中已有的知识和知识结构对人的行为和当前的认识活动有决定作用。完整的认知过程是定向—抽取特征—与记忆中的知识相比较等一系列循环的过程。知识是通过图式来起作用的。所谓图式（schema）是一种心理结构，指的是我们对于外部世界的已经内化了的知识单元。内部图式接收到适合于它的外部信息时就被激活。被激活的图式使人产生内部知觉的期望，用来指导感觉器官有目的地搜索特殊形式的信息。

第三，强调认知过程的整体性。现代认知心理学认为，人的认知活动是认知要素相互联系、相互作用的统一整体，任何一种认知活动都是在与其相联系的其他认知活动配合下完成的。在人的认知过程中，情境关系很重要。它不仅包括人们接触到的语言材料的上下文关系、各类事物之间的关系，还包括人脑中原有知识之间、原有知识和当前认知对象之间的关系。

第四，强调产生式系统。产生式系统（production system）的概念源于数学和计算机科学，1970年开始被广泛应用于心理学。它说明了人们解决问题时的程序。在一个产生式系统中，一个事件系列产生一个活动系列，即条件—活动（C-A）。其中的条件是概括性的，同一个条件可以产生同一类的活动；其次，条件也会涉及某些内部目的和内部知识。可以说，产生式的条件不仅包括外部刺激还包括记忆中存储的信息，反映现代认知心理学的概括性和内在性。二、人类信息加工的观点

心理学研究各种心理现象的发生和发展规律。认知是人的最基本的心理过程，是指人们获得知识或应用知识的过程，它包括感觉、知觉、记忆、思维、想象和语言等。具体来说，人们获得知识或应用知识的过程开始于感觉与知觉。感觉是对事物个别属性和特性的认识，如感觉到颜色、明暗、声调、香臭、粗细、软硬等。而知觉是对事物的整体及其联系与关系的认识，如看到一面红旗、听到一阵嘈杂的人声、摸到一件轻柔的毛衣等。人们通过感知觉所获得的知识经验，在刺激物停止作用之后，并没有马上消失，而是仍保留在人们的头脑中，并在需要时能再现出来。这种积累和保存个体经验的心理过程，就叫记忆。

人不仅能直接感知个别具体的事物，认识事物的表面联系和关系，还能运用头脑中已有的知识和经验去间接、概括地认识事物，揭露事物的本质及其内在的联系和规律，形成事物的概念，进行推理和判断，解决面临的各种各样的问题，这就是思维。人们还能利用语言把自己思维活动的结果、认识活动的成果与别人进行交流，接受别人的经验，这就是语言活动。人们还具有想象的活动，这是凭借在头脑中保存的具体形象来进行的。

认知心理学是现代心理学研究中的一个主要学术流派。以信息加工的观点研究人类认知现象是现代认知心理学的主流，它将人看作一个信息加工的系统，认为认知的过程就是信息加工的过程，包括信息的输入编码、存储、加工和提取输出的全过程。按照这一观点，认知过程可以分解为一系列的加工阶段，而反应则是这一系列加工阶段的产物。信息加工系统的各个组成部分之间都以某种方式相互联系着。认知心理学家关心的是作为人类行为基础的内部心理加工机制，其核心是信息输入和信息输出之间发生的内部心理过程。研究人类认知过程规律的主要方法是认知行为实验法和认知神经科学实验法。认知行为实验法通过输入刺激和输出反应来推论认知活动的内部心理加工成分和过程；认知神经科学实验法则通过直接观察、记录大脑活动状态和过程，来解释输入刺激和输出反应之间的关系。三、信息输入、存储和提取

信息输入是人类通过各种感官从外界获取刺激信息的过程，如通过视觉通道（眼睛）获取各种视觉刺激信息、通过听觉通道（耳朵）获取各种听觉刺激信息，等等。这些刺激信息会被登记、编码、存储或与其他信息一起得到进一步加工。在信息的感觉输入阶段，这些刺激信息会被即时登记、编码，因此这一过程也叫即时记忆。大量的即时记忆信息会立刻消退，而有些信息则会被传入更高级的信息加工阶段。

信息存储是将获得的输入信息或加工信息进行编码、存储，以便进一步加工。一般来说，信息存储的过程并不是简单地堆砌，而是需要对大量信息进行深入加工、分门别类，以便在需要时能够被合理提取。信息存储系统即记忆系统，记忆系统经常被分为短时工作记忆系统（short-term working memory system）和长时记忆系统（long-term memory system）。短时工作记忆系统中存储的信息容量有限，可以被快速提取，是意识状态下正在加工的信息。而长时记忆系统中存储的信息一般被认为是不限容量的，需要慢慢搜索提取，未被提取的信息并不处于当前的加工状态。当被试处于意识状态下时，短时工作记忆系统一般处于激活状态。而当被试面临一个具体的问题情境时，被试需要在工作记忆系统中分析各类相关信息，经常需要到长时记忆系统中搜索提取相关信息。信息一旦被提取，它就处于激活状态，并且进入有意识的加工，以解决当前面临的问题情境。

长时记忆中的信息组织形式可以分为言语编码和表象编码两种形式。言语编码通过词来加工信息，按意义、语法关系、系统分类等方法把言语材料组成组块，以帮助记忆。表象编码利用视觉、听觉、味觉和触觉形象组织材料来帮助记忆。一般人在长时记忆中对信息的编码往往是将两种方式结合起来，互相补充，但也存在个体差异：有人偏于用这一种方式编码，有人偏于用另一种方式编码。依照所存储的信息类型，长时记忆还可分为情景记忆和语义记忆。情景记忆接受和存储关于个人的特定时间的情景或事件及这些事件的时空联系的信息。语义记忆存储有关字词或其他语言符号、其意义和指代物及它们之间的联系，以及有关规则、公式和操纵这些符号、概念和关系的算法等有关内容。

长时记忆系统中的信息是按组块的形式组织的。组块将相似的或相关联的信息组织在一起，这样的组织形式有利于提高信息存储和提取的效率。信息的相似性和关联性存在程度的不同，越相似或关联性越强的信息结合越紧密，然后根据相似性和关联性程度往外延展。每个信息就像网络中的一个节点，相似性或关联性程度强的信息的节点距离近，相似性或关联性程度弱的信息的节点距离远。所有的信息在长时记忆系统中组成一个复杂的、相互关联的、相互影响的、有层次的概念网络。每个组块可以代表一个概念，组块的范围有大有小，如鸟的概念就包括了羽毛和飞的概念，但羽毛又可以和别的信息组合在一起形成一个新的概念。

信息提取的过程是从已存储的信息中提取信息，在短时工作记忆系统中进行一定的加工组合后做出恰当的反应的过程。在面对一个具体的问题情境时，被试需要提取已存储的各类相关信息，在进行综合分析后，提出一种最合理的方案。有些问题情境可能是非常熟悉的，所以被试很容易提取相应的信息加以解决，然而有些问题情境可能比较复杂，需要提取的信息比较多，甚至有些信息是模糊的或缺失的，这时候，被试就很难有十足的把握解决问题，只能在已有信息的基础上，提出一个对自己来说最佳的方案。当然，这个方案很有可能会导致问题解决失败。因此，在面对问题情境时，影响问题解决的关键因素可能有3类：一是被试根本没有存储与问题有关的合理信息，或信息存在部分缺失，或信息处于模糊不清的状态；二是被试在提取相关信息时出现偏差，没有提取关键的有用信息，或者提取了错误的信息；三是被试虽然提取了所有相关的信息，然而在信息整合阶段进行了错误的加工，提出了有偏差的方案。第二节认知诊断评价与认知心理学一、认知诊断评价中的问题任务

认知诊断评价通过分析被试在解决实际问题任务中的表现来判断其对领域知识属性的掌握状态和模式。因此，实际问题任务与领域知识属性之间是相对应的关系。领域知识属性代表了某个领域的概念范畴和知识结构。问题任务是被试在实践中可能碰到的实际问题或任务，它可能以不同的具体形式出现，所以被试需要在掌握相应领域知识属性的基础上才能顺利解决它。

解决问题任务的过程涉及被试对问题本身的理解以及基于已有知识经验提出解决问题任务的方案。在认知诊断评价实践中，一般假设被试对问题任务本身是理解的，关键是解决问题任务的方案和过程。问题任务解决的过程涉及相关信息的提取、对信息的组合分析，以及做出恰当的反应决策。整个问题任务的加工和解决的过程反映了被试对问题涉及的知识技能的掌握状态以及对这些知识技能的组合策略。只有掌握了相关的知识技能并进行了合理的组合，才能最终解决问题。二、认知心理学对定义问题任务的指导作用

基于领域知识属性对问题任务进行定义是认知诊断评价的关键步骤。首先，认知诊断评价是对被试进行精细化的评价，因此，也必须对领域知识属性进行精细化的定义；其次，必须对领域知识属性和问题任务之间的对应关系进行精细化的定义，这样才能保证评价结果不会产生偏差；最后，认知诊断评价的目的是能够给不同被试提出具有针对性的改进意见，因此，我们还必须精细化定义领域知识属性的结构特征，分析各知识属性之间的关系。

认知心理学理论提供了关于知识的存储模式和提取模式的理论支持。同时，在认知心理学的指导下，可以通过一系列的实验研究方法，分析被试在某领域具体问题任务解决过程中涉及的内部心理加工成分（知识）及其加工进程（技能与策略），从而对领域知识属性及其结构模型进行精细化的定义。因此，认知心理学理论及其研究方法对于认知诊断评价具有重要的基础性指导作用。

许多认知诊断评价理论的研究者对知识、技能和策略概念的理解还比较模糊。按照认知心理学理论，知识指的是问题所涉及的认知成分，包括概念、规则、命题、情境描述等，在大脑中以相对独立的形式被表征。技能和策略是提取相关的知识并将其组合在一起解决问题的方法。知识的缺乏或技能与策略的不合理都可能导致问题解决的失败。梅耶对知识的分类可以给我们很好的启示，他将知识分成三大类：语义知识、程序性知识、策略性知识。语义知识指个人世界的知识。程序性知识指用于解决具体情境问题的算法或一套步骤。策略性知识指如何学习、记忆或解决问题的一般方法，包括应用策略进行自我监控等。于是，关于知识我们可以有以下认识：

第一，个体通过与环境相互作用后获得的信息及其组织，被存储于个体内的知识，即个体的知识；通过书籍或其他媒介存储于个体外的知识，即人类共享的知识。知识是后天经验的产物，不包括先天的适应机制；知识的获得过程是主客体相互作用的过程；知识的范围广泛，从获得具体信息到机体的认知结构的根本变化，都属于知识范畴。

第二，可以区分广义与狭义两种知识观。狭义的知识观中的知识仅包括它的存储和提取，如布卢姆教育目标分类中的“知识”、安德森的“陈述性知识”和梅耶的“语义知识”，都属于狭义的知识。广义的知识观中的知识不仅包括它的存储与提取，还包括它的运用，如布卢姆教育目标分类中的领会、运用、分析、综合、评价，都是指知识的应用。广义的知识观已经将知识、技能与策略融为一体了。所以，知识可概括为三大类：陈述性知识、程序性知识、策略性知识。把技能纳入广义的知识范畴，只是就知识掌握深度和熟练程度而言的。把策略性知识纳入广义的知识范畴，则使知识概念的内涵和外延都发生了深刻的变化。随着认知策略领域研究的深入，有关人们对自身认识过程的知识将作为一种普遍可以迁移的技能来学习。

本章小结

认知诊断评价通过分析被试在问题任务解决中的表现来推论其对领域知识属性的掌握状态。认知心理学的信息加工观点和研究方法可以指导对领域知识属性及其结构进行定义，因此在认知诊断评价理论中具有基础性的指导作用。

思考题

1.认知心理学中关于信息的存储、加工和提取的基本观点是什么？

2.以某个学科领域为例，基于认知心理学信息加工理论的观点，分析思考学科领域中某个问题解决的过程。第三章认知诊断评价理论的基础概念

摘要：认知诊断评价理论建立了一套比较完整的概念、研究范式和技术路线。测验属性及相关概念的定义是进行认知诊断评价的核心和基础。本章主要介绍了认知诊断评价中属性及基于属性衍生的相关概念。

认知诊断评价理论涉及许多基本概念，且各种概念之间相互关联。本章将解释各种概念的一般内涵及其相互联系。第一节关于诊断

诊断（diagnosis）是一个具有普遍意义的用词，是通过各种技术、方法和手段来全面深入了解对象，并在评价判断的基础上给出详尽的分析报告的过程。因此，诊断需要在对对象全面评价的基础上进行，诊断的目的是找到对象的优势和不足，从而为后续发挥优势和改善不足提出合理建议。运用诊断技术的领域非常广泛，如物理领域诊断（汽车故障诊断、电力设备故障诊断、铁道信号诊断、建筑稳定性诊断等），化学成分诊断，生物和生理领域诊断，医学诊断和环境诊断等。

医学诊断是最容易被认识到的诊断领域。在医学上，医生通过问询、体检、实验检查等手段来了解对象的身体特征，然后根据一定的标准对这些特征做出正常或异常的评价。医生运用既有的知识和经验，进行综合、分析、联想、推理，才能对对象进行合理诊断。在全面诊断分析的基础上，医生提出治疗或康复的有效措施，以让对象成长为一个健康的个体。

与其他领域的诊断一样，心理诊断越来越成为大众关注的领域。心理学家通过问询、观察、检查、实验等手段对个体的心理状态特征进行全面的了解，然后根据一定的标准如常模等，对个体各方面或某一个方面的特征做出正常或异常的评价。心理学家根据自己已有的知识理论和经验，对该评价结果的原因、机制和可能的发展后果做出全面细致的诊断，并提出保持已有优势、辅助改善不足的具体方案措施，以让诊断对象成长为能力、气质、性格、价值观等各方面表现优秀的个体。心理诊断包括各种心理现象的诊断，如注意力、言语表达能力、思维方式、性格特征、人际交往、社会适应、学业水平等。

教育领域也有各种类型的诊断，包括工作诊断、教学诊断、学习诊断等。这里主要讨论的是学习诊断与评价。根据评价目的，教育领域的评价一般可以分为筛查性评价、诊断性评价和终结性评价。筛查性评价一般以确定是否存在明显偏离正常水平的群体或个体为评价目的；诊断性评价一般通过收集完整的对象信息，以服务于确定培养目标和方案、需要个体辅导的对象为目的；终结性评价则以阶段性目标是否达成为评价目的。教育诊断评价的内容一般包括生理发展状况、心理发展状态、教育过程资料和社会适应性方面。教育诊断评价的方法包括观察法、访谈法、评定量表法和测验法等。

从以上可以注意到，教育诊断评价相对于心理诊断评价的内容更加广泛，而心理评估也是其中的重要内容。

认知，是指人们获得知识或应用知识的过程，这是人类的最基本的心理过程，它包括感觉、知觉、记忆、思维、想象和语言等心理现象。认知诊断评价主要是通过测验的形式，来了解个体或群体在测验上的表现，进而对其认知水平发展（知识掌握）状态进行评价，并在此基础上提出改善个体认知状态的辅助方案和针对性建议。认知诊断评价对个体或群体知识的掌握状态进行评价、诊断和提出针对性改进措施，相对于项目反应理论和经典测量理论，认知诊断评价理论的优势正在于此。第二节属性及其结构一、属性

属性（attribute）是认知诊断评价理论中最基础的概念。万物均有各种属性，属性是事物的性质与事物之间关系的统称。人本身就包括生理属性和心理属性。生理属性包括性别、身高、体重、视力、血压等，而心理属性包括感觉、知觉、思维、情绪、性格、能力等，这些都是人的属性。在这些属性中，能力有高低之分，情绪有稳定与不稳定之分，等等。这些属性及其表现描述了不同人之间的差异和关系。属性和关系可以完整地描绘一个特定的人，如一个情绪稳定、性格外向、能力超强的人。

在认知诊断评价理论中，属性专门指人的心理属性，而当前绝大部分研究涉及的心理属性仅指知识、技能等标志能力类的属性，当然这并不意味着这个概念不包括性格、情绪等心理属性。在本书中，除非特别说明，属性专门指知识、技能等能力类的心理特质，在其他特质领域的应用可以合理地进行类比。

关于能力特质，从不同角度或层面看就会有不同的认识，由此，心理学就提出了许多的能力结构理论。在此，我们根据各种能力结构

试读结束[说明：试读内容隐藏了图片]

下载完整电子书

认知诊断评价理论基础试读：

相关推荐

培训师进阶指南：研讨式工作坊运营手册(txt+pdf+epub+mobi电子书下载)

2018年贵州公务员录用考试专项教材：常识判断【考点精讲＋典型题（含历年真题）详解】(txt+pdf+epub+mobi电子书下载)

中华学生百科全书——环球览胜(txt+pdf+epub+mobi电子书下载)

工业锅炉管理与维护问答 第2版(txt+pdf+epub+mobi电子书下载)

从严治党：依法惩治贪官胡长清成克杰(txt+pdf+epub+mobi电子书下载)

地球探秘(txt+pdf+epub+mobi电子书下载)

我们的言论(2008-2014)(txt+pdf+epub+mobi电子书下载)

十三不靠：依靠自己去成功(txt+pdf+epub+mobi电子书下载)

分析与展望：中国中小微企业生存发展报告(2014-2015)(txt+pdf+epub+mobi电子书下载)

自然奇景(txt+pdf+epub+mobi电子书下载)

海小枪枪的作文课1：走进校园(txt+pdf+epub+mobi电子书下载)

且听梦吟(txt+pdf+epub+mobi电子书下载)

北大口才课(txt+pdf+epub+mobi电子书下载)

全国会计从业资格考试无纸化上机考试题库——会计基础(txt+pdf+epub+mobi电子书下载)

蒙田随笔集(txt+pdf+epub+mobi电子书下载)

人族崛起6(txt+pdf+epub+mobi电子书下载)

土地法律纠纷处理依据与解读(txt+pdf+epub+mobi电子书下载)

Lonely Planet孤独星球旅行指南：桂林(txt+pdf+epub+mobi电子书下载)

世界上下五千年——现代卷(txt+pdf+epub+mobi电子书下载)

让心灵充满阳光(txt+pdf+epub+mobi电子书下载)

最新文章

人生就要不断精进(txt+pdf+epub+mobi电子书下载)

做个心智成熟的人：人生可以不走弯路(txt+pdf+epub+mobi电子书下载)

跟谁都能聊不停：一看就能用的魔鬼搭讪学(txt+pdf+epub+mobi电子书下载)

赴美留学必知(txt+pdf+epub+mobi电子书下载)

我的男友(txt+pdf+epub+mobi电子书下载)

中国东北与东北亚古代交通史(txt+pdf+epub+mobi电子书下载)

幸福生活讲座(txt+pdf+epub+mobi电子书下载)

情商决定一生(txt+pdf+epub+mobi电子书下载)

夜雨寄北(txt+pdf+epub+mobi电子书下载)

让学生热爱学习(txt+pdf+epub+mobi电子书下载)

On Dreams(txt+pdf+epub+mobi电子书下载)

我的史学人生(txt+pdf+epub+mobi电子书下载)

Creo2.0完全学习手册(txt+pdf+epub+mobi电子书下载)

2018年陕西省军转干部安置考试《公共基础知识》题库【真题精选＋章节题库＋模拟试题】(txt+pdf+epub+mobi电子书下载)

假如给我三天光明(txt+pdf+epub+mobi电子书下载)

带出高效执行力(txt+pdf+epub+mobi电子书下载)

北史（四）(txt+pdf+epub+mobi电子书下载)

影响力的企业富豪(上册)(txt+pdf+epub+mobi电子书下载)

商界40年：逐鹿人(1999-2008)(txt+pdf+epub+mobi电子书下载)

The Boats of the Glen Carrig(txt+pdf+epub+mobi电子书下载)

工业锅炉管理与维护问答第2版(txt+pdf+epub+mobi电子书下载)