与大数据同行:学习和教育的未来(txt+pdf+epub+mobi电子书下载)


发布时间:2021-02-27 21:02:17

点击下载

作者:维克托·迈尔·舍恩伯格,(英)库克耶

出版社:华东师范大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

与大数据同行:学习和教育的未来

与大数据同行:学习和教育的未来试读:

序一 未来教育的形态

与大数据同行的学习就是未来的教育,这既是书名的意义,也是本书的主题。“大数据”一词反映了人们愈益意识到我们大家留下的数字痕迹,就如“大数据”关注数据本身一样。哥伦比亚大学心理学教授邓肯·沃兹(Duncan Watts)认为,有关人们行为和喜好的丰沛数据正改变着社会科学,使社会科学从数据最贫瘠的领域转变为数据最丰富的领域。在从商务学到社会学再到文学这样一个又一个领域中,我们获取和解释数据的能力得到迅速成长,同时也需要获得新的工具。

与其他任何领域相比,这一点在教育领域或许显得更为真实。多年以来,事实上是多个世纪以来,教育领域的决策从来就是在缺乏任何数据的基础上作出的。常识(common sense)一直成为正常的决策资源,即使在常识导致消极结果的情况下也是如此,而常识其实只是习惯和一厢情愿的混合物罢了。

迈尔-舍恩伯格和库克耶写到塞巴斯蒂安·迪亚兹(Sebástian Díaz)受数据驱动的关于学生矫正教育(remedial education)的发现:要求学生修读全部大学课程可能确实会导致他们辍学而不是毕业。迪亚兹的这一发现与当前美国政策所鼓励之事并不一致,而这种政策与现实之间的背离足以让教育家们欲哭无泪。由此可见,如果仅通过常识来设计一种教育体系,只不过是在浪费时间和金钱,那就只会导致一种情况——正如作者所指出的——我们当前的政策或许正在浪费生命,而我们却还没有制定出可以取代它们的有效政策。

弄明白哪些教学技术确实会产生作用,而哪些教学技术不会产生作用,正是本书所探讨的一场革命。

与大数据同行的学习意味着两种迥异的学习过程。对于学生而言,他们是在一个同样也在向他们学习的体系中学习着课程。这一体系知道学生何时需要加倍依赖于概念,知道何时需要继续往下学习,还知道如何让学生在每一天中平衡“温故”和“知新”。这些学生是在伴随着大数据而学习,因为在他们所身处的系统之中,有关他们如何从事与他人和课程目标相关之事的证据,可以在分秒之中产生,而不是需要一个学期或学年才能出现。

但是,教育工作者们也在伴随着大数据而学习。我们第一次有机会来检验假设,来比较方法,来了解(而不只是猜测)什么是有效的和什么是无效的。反馈循环(feedback loop)对于学生来说将是一种改进,而对于教师来说则会是一种转型。

克里斯·阿吉瑞斯(Chris Argyris)是一位组织理论专家,他介绍了学习型组织的理论。大多数组织采用被阿吉瑞斯称为“单回路学习”(single-loop learning)的模式,它们在学习中犯了错误之后才会努力去纠正。例如,当一所学校进行的一次考试或一堂课的难度过低或者过高时,学校就会确定问题并在下一次加以克服。这就是单回路学习——犯了错误,将其抓住并予以纠正,尔后继续前行。“双回路学习”(double-loop learning)则与之不同。一个践行双回路学习的组织会纠正自身的错误,但它还会做许多更重要的事情,包括分析其犯错的原因。双回路的学习需要分析组织本身在反馈回路中所使用的大量数据。本书中诸多有趣的故事都是关于双回路学习的,例如萨尔曼·可汗(Salman Khan)在运用学生如何学习的数据时,他不只是在设计教学,而是在设计可汗学院本身。

迈尔-舍恩伯格和库克耶认识到了这一巨大的进步。大多数组织习惯性地拒绝变革,而且并不认为这种变革将是迅速的或是由精英们领导的。只有当创新经常出现时,比如要改变人们过去受到不好的服务或根本没有受到服务的状况,这种变革才会发生:人们需要矫正教育,人们处在当前功能健全的机构之外,当前的教育制度让所有年龄段的人感到失败。

迈尔-舍恩伯格和库克耶认为,这一变革最终将波及各行各业。从生物学界到篮球界,最初都会有一些员工在短期内抗拒数据驱动的分析,但在数据能够影响结果的每一个领域,最终都会采纳数据驱动的决策方法。教育机构同样如此,一开始只有少数机构愿意接受,但最终会扩展到全部。

正如作者所说:“信息技术作为进步的基础是不容置辩的,但当下面临的变革并不是技术层面上的。”当前的变革是组织变革。要作出应用数据的决定,就不得不成为知道如何变革自身的那种组织,以便回应新信息,回应经常与传统实践相冲突的新信息。

我们第一次要求自己拥有理解学生正在做什么的能力。我们能够理解在最大规模情况下学生是如何学习的,理解在任何给定的学年中数以百万计的各种数据。我们能够理解在最小规模情况下学生是如何学习的,理解每一个个体在10分钟的课程中是如何学习的,而不只是每一个个体是如何学习的。不同于旧有的调查世界和样本,我们能够连接上述两类规模——大数据是数以亿万计的小数据的汇集。

高等教育的未来依赖于本书巧妙而有力地论证的特征:教学的个性化、把有效努力从无效努力中分离出来的反馈循环,以及由大规模数据集的概率预测而产生的设计或体系。决定着教育之未来的,是那些更好地利用大数据来适应学习的组织。[美]克莱·舍基(Clay Shirky)美国纽约大学、上海纽约大学教授被誉为“互联网革命最伟大的思考者”著有《认知盈余:自由时间的力量》等畅销书

序二 大数据时代教育的新图景

欣闻维克托·迈尔-舍恩伯格与肯尼思·库克耶新作、赵中建教授翻译的《与大数据同行:学习和教育的未来》即将出版,受邀为该书撰写序言,于是有机会先睹这本介绍大数据时代教育变革的新书。

初识赵中建教授,缘于他关于其《创新引领世界——美国创新和竞争力战略》一书内容的讲学。今天,又看到赵教授翻译的《与大数据同行:学习和教育的未来》,感觉很酷。这是一本与时俱进,站在当今信息技术与教育变革最前沿的力作,让读者一下子就站在时代的前沿,对大数据与教育的关系有个初步的了解。可以说,这是身处大数据时代的每一位教育工作者都需要阅读的一本关于未来教育发展的普及读物。

在这本书里,作者迈尔-舍恩伯格和库克耶通过一个又一个生动的故事、大量惊人的证据、高瞻远瞩的科学家视野,阐明了他们对大数据时代教育将如何变革的深刻理解,给读者描绘了未来大数据时代人们全新的生活、工作和思维方式的图景。

大数据对社会生产和生活的影响,在教育以外的行业已经十分明显,无论是银行、电信、铁路、航空,还是军事、政治、工业、商业,基于大数据的决策已经成为现代社会各行业运行的基础。

以医疗行业为例,21世纪,临床医学借助新兴科技的发展,进入了以科学和大数据为基础的现代医学时代。例如,计算机图像处理技术与X射线、超声波、核磁共振技术相结合,促进了基于大数据的新型复杂成像技术的发展。生物信息学、计算机辅助药物设计以及大数据分析在医学临床和科研中的广泛应用,从根本上改变了疾病的诊断、治疗和预防的理念与技术。在解剖、病理、生化、药理等基础学科的实验基础之上,医学从古代经验型医学的范式,进入现代循证医学(evidence-based medicine, EBM)时代,在临床中采用前瞻性随机双盲对照及多中心研究的科学方法,系统地收集、整理大数据样本研究所获得的客观证据以作为医疗决策的基础。临床医生根据最新的指南对疾病进行诊疗,避免了过去依据个体经验积累来进行医疗决策时有可能发生的偏差和失误。

但是,迄今为止,我们的教育系统依然沿袭远古教育的范式,主要依靠教师的个人教学经验对课堂上学生的学习行为进行判断和制定教学决策。21世纪后,世界各国的教育改革都倡导针对学生个体差异实施个性化教学,力争做到像医学一样根据学生的学习行为大数据来调整教学策略,在课堂教学中采用基于证据的教学(evidence-based teaching, EBT),这一直是人们所追求的未来教育的理想形态。

过去,在学校的教育教学活动中开展实证教学受到技术水平的局限,要收集和处理学生在教学活动中的大数据比较困难。现在,随着全社会移动终端的普及、云计算服务的发展、大数据分析技术的突破,基于学生行为大数据分析的教学将逐步变成现实。

在本书中,作者具体介绍了教育中运用大数据技术的实例,如可汗学院的学习分析系统、Coursera的主讲教师如何基于大数据改进教学、亚马逊如何基于大数据实现高精确度的个性化推荐服务的故事,深入讨论了大数据给教育带来的深刻影响,给读者展示了大数据改变教育教学的美好前景。全书内容丰富,观点新颖,可供关心新兴技术对教育发展之影响的研究者参考,更值得广大一线教师阅读学习。黎加厚上海师范大学教育技术学术带头人教育部全国教师教育信息化专家委员会委员英特尔未来教育中国项目专家组专家

1 薄暮

大数据正在进入教育的方方面面,并将对这个世界的学习产生深远的影响。大数据能告诉我们什么是最有效率的,并且揭示那些过去无从发现的谜题。

截然不同的教学形式

达瓦(Dawa)正在集中注意力。他在笔尖上蘸一抹颜料,小心翼翼地下笔画出一条细细的黑线,然后又蘸了一点颜料,再画出一条细细的黑线。几小时后,一副唐卡——由迷人的几何细节构成的、描绘佛祖的丝绸卷轴画——逐渐成形。

屋外,环绕着不丹首都廷布四周的喜马拉雅雪峰,在傍晚阳光的照射下闪闪发光。屋内,达瓦和他那些同样20来岁、身着蓝色长袍的同学们,已经在中年师父的注视下持续作业了很长时间。

唐卡画家的培养遵循传统。达瓦和他的同学们来到这里,不是为了拓宽思维,而是为了成为一个训练有素的学徒。这里的学习,不是探究,而是模仿。早在几百年前就制定下的诸多规则,决定了该画什么、画在哪里和怎么画。

达瓦的师父要确保这些年轻人严格遵守他的指令,重复那些先代唐卡画家的操作。对规则有任意一点的偏离或是破坏,不仅会惹得师父怒上眉头,还会遭到严令禁止。最好的画家,是能够完美再现师父作品的学徒。尽管师父给予的持续指导能够实现即时的反馈,但这仍然是一种极度缺乏数据的学习形式。

这与吴恩达(Andrew Ng)的教学形式有根本上的区别。吴恩达是斯坦福大学计算机科学家,在互联网上教授他的机器学习(machine learning,计算机科学的一个分支)课程。吴恩达教授是提供在线课程服务的新兴公司Coursera的创始人之一,他的尝试预示着大数据对教育的变革。

吴恩达教授收集所有关于学生举动的信息,从中提取最有效的内容并将其纳入系统设计,从而使他的课程能够自动实现:教学的改善,学生理解力和成绩的提高,基于个人需求的定制教育。

比如,他追踪学生与视频讲座的互动行为:当学生观看视频时,点击了暂停或快进键,又或是在视频结束前选择了放弃——这种数字互动意味着学生提早溜出了课堂。他能发现学生多次回看同一门课程,或者后退至上一个视频浏览课程内容的行为。此外,他也会在视频课程中穿插突击测验,其目的并不是要督促学生集中注意力学习,这种重视课堂纪律的古老教学形式不是他关注的内容,他想知道的是,学生是否正在领会教学材料,以及是否卡在了某个问题上。每一个学生个体,都是他的观察对象。

通过追踪学生在计算机或平板电脑上完成作业和测验的情况,吴恩达教授能够确定学生需要额外帮助的具体内容。他可以分析整个班级的数据,观察这一群体的学习情况,并以此为依据对课程进行调整。他甚至可以把这些信息与不同年级的不同班级作对比,从中判断最有效的课程元素。

数据的非凡效果

这些举措的确扩大了吴恩达教授的班级规模——成千上万的学生参与了他的课程学习——数量大到足以支撑他的研究成果,而大多数教育研究的开展仅仅基于小范围的观察对象。然而,班级规模本身并不是重点,数据才是其中的关键。

吴恩达教授已经发掘了数据的非凡效果。比方说,在追踪学生观看视频课程顺序的过程中,他发现了一个令人困惑的现象——大部分学生的学习是循序渐进的,然而在课程进行了数周之后(第7课前后),他们会跳回到第3课——其中的原因是什么?

他做了进一步的研究,发现第7课要求学生用线性代数书写一条公式,而第3课是一堂关于数学知识的复习课,显然许多学生对自己的数学能力信心不足。由此,吴恩达教授知道了该如何改进他的课程,即在那些容易让学生感到气馁的地方提供更多的数学知识回顾。而具体在哪里加入复习的知识点,正是数据提示给他的。

还有一次,他发现许多学生在重复同一主题的课程。针对这一现象,他采取的手段是进行数据可视化处理:当用户的学习进程出现顺序上的交错时,统计数据的显示颜色将由深蓝色变为鲜红色。在第75课和第80课,正常的学习秩序被打乱了,学生们在以各种各样的顺序反复观看视频。对此,吴恩达教授的心得是:学生们正在努力尝试把握其中的概念。于是他认识到,如果教师具备这样的洞察力,就会重新制作课程,并且检查由此产生的数据,以确保此类情况得到改善。

大数据正在进入教育的方方面面

除此以外,还有大量的数据得以发掘。通常,论坛帖子的内容价值,是通过对文章的读者人数和评论人数的追踪加以判断的。但是,吴恩达教授开展了一个更为复杂的统计研究,用以“真实判断”课程论坛发帖的有效性。他查看的数据是:在家庭作业或测验中做错了某个习题,但在阅读了某个特定的论坛帖子之后,能够正确解答同一习题的学生比例。

例如,2011年,在一门机器学习的课程中,有成千上万的学生做错了关于“计算成本”的线性回归。但在浏览过第830篇论坛文章的学生中,则有64%不会再犯同样的错误。

以后,当有学生犯同样的错误时,系统就会自动推送第830篇论坛文章为他们答疑。在这里,确定最适合学习的论坛内容,凭借的是数据驱动的手段,而不是学生的自行判断。

这种大数据应用策略并不局限于吴恩达教授在斯坦福的课程,相关课程仅仅是这个领域中的先驱尝试。大数据正在进入教育的方方面面,并将对这个世界的学习产生深远的影响。

有别于“讲台上的贤能者”的传统教育

本书讲述的是大数据如何改变教育。大数据帮助我们以前所未有的视角判断什么可行、什么不可行;展示那些以前不可能观察到的学习层面,实现学生学业表现的提升;可以基于学生的需求定制个性化课程,促进理解并提高成绩。

大数据帮助教师确定最有效的教学方式,这非但不会剥夺他们的工作,反而会提高工作的效率和趣味性。学校管理者和政策制定者也能以较低的成本提供更多的教育机会,从而减少社会收入差距和社会差异。我们第一次拥有了强大的实证工具,让我们能了解如何教,又能了解如何学。

这并不是一本关于MOOCs(massive open online courses,大规模开放在线课程,通常称为“慕课”)——在过去几年中占据新闻头条、类似吴恩达教授在斯坦福开设的大规模开放在线课程——的书籍。MOOCs使教育大众化成为了可能,因此受到全世界的瞩目,这无疑是一个极大的飞跃。但是在某些方面,MOOCs仍然等同于强调“讲台上的贤能者”的传统教育,其差别仅在于信息获取的难易程度上。

而MOOCs的其中一个构成要素却是崭新而强大的,那就是它能产生大数据。大数据能告诉我们什么是最有效率的,并且揭示那些过去无从发现的谜题。

风投资金涌入教育领域

大数据促进了教育和技术的结合,激发了创业者的想象力,吸引着投资人的资金。仅2012年一年,就有超过10亿美元的风投资金注入教育领域,这个数字比5年前足足增加了一倍。这一迹象表明,教育科技的时代已经到来,业界充斥着特有而晦涩的缩写名称,如LMS(learning management systems,学习管理系统)和ITS(intelligent tutoring systems,智能教学系统)等。而像Noodle、Knewton和Knowillage Systems这些有着可爱名称的公司也随处可见。

传统企业,如麦格劳-希尔公司(McGraw-Hill)、新闻集团(News Corp.)、培生教育集团(Pearson)和楷博教育(Kaplan)已经在这一领域建立据点,投入的研发和收购资金达到数十亿美元。根据知名教育科技市场调查机构GSV Advisors的估计,在线学习市场的价值超过千亿美元,并且以每年25%的速度不断飙升。在美国,对教育的整体开支高达1.3万亿美元,相当于GDP的9%,仅次于医疗卫生。

大数据服务于各行各业

从根本上说,本书讲述的内容不仅仅针对教育,其中的核心内容是说明教育作为社会和经济的一个重要组成部分,应该如何运用数据,并且为大数据在未来如何改变生活和工作提供个案研究。尽管在这本书里,我们关注的是大数据在教育领域的发展,但是其中涉及的概念却与所有的行业、企业和组织相关,无论是医院、石油公司、科技创业公司、慈善团体还是军队。

本书也扩展了有关“如何学”和“学什么”的人类知识——社会必须加深对这个世界的概率本质的理解,而不是拘泥于自古以来便左右人类探究行为的因果关系的概念之中。

因此,本书旨在引导各行各业的专业人才,去迎接这一划时代的转变。如果你对大数据时代人类如何获取知识感兴趣,这本书也能给予解答。

在下一章,我们将提出大数据重塑学习的三个主要特征:反馈(feedback)、个性化(individua-lization)和概率预测(probabilistic predictions),并围绕由可汗学院推广的“翻转课堂”(flipped classroom)等概念展开描述。“翻转课堂”指的是学生在家观看课程视频并在课堂上完成作业,与传统课堂惯例相反的教学模式。

第三章介绍了改变教与学方式的各种平台,包括在线课程和电子课本等。并深入探讨了适应性学习(adaptive learning)和学习分析(learning analytics)理念。前者依照每个学生的个性化需求定制教学进度和内容,后者帮助我们寻找最高效的教学方式。

第四章关注的是大数据教育应用的潜在危害,从由数据留存引发的忧虑,到新形式的编组制带来的问题。学生可能会成为量化评估的受害者,如仅仅因为表现出的倾向而非实际行动便遭到预防性的惩罚。

第五章对大数据重塑教育带来的根本变化加以总结,即概率高于精确。

大数据和教育的结合激发出许多关于教育的假设:在制定教学日和校历表的时代,大部分人还在农场工作,而新的数据可能显示这在今天已不太适用;学生们按照年龄升年级,而一个支持自定义进度的课程系统能够证明这类因循守旧的做法效率不高且意义甚小。因此,在大数据的世界里,我们要面对的重要问题是,对其带来的变化是否做好了准备、面对这些变化是否采取了行动以及能够从中发现什么。

大数据将为教育带来巨大变革

达瓦注视着他模仿师父画下的黑线,随后又画了一次,试图做到如师父教导的那般精确。这一过程似乎过于机械,难以称之为教育,而西方的传统教育也曾经一度与不丹的唐卡画家培训非常相似。

据传说,过去的法国教育部长们只需查看一下他们的怀表,就能准确得知这个国家每一个孩子在那个时间点上正在学习什么。在美国,1899年的教育署长威廉·哈里斯(William Harris)也曾夸口说,学校有着“机器的外观”,能够培养孩子“有条不紊地行动,并在自己的位置上端坐”等被动服从的美德。

的确,假如生活在两三个世纪前的人物——比如英国的弗洛伦斯·南丁格尔(Florence Nightingale)、法国的塔列郎(Talleyrand)、美国的本杰明·富兰克林(Benjamin Franklin)——走进今天的教室,他们会感到相当的熟悉。他们可能会说:没有什么变化——即使校园之外的世界早已变得几乎面目全非。

而与此同时,人们一直在关注利用CD、电视、广播、电话和计算机等技术变革教育的机会。“在公立学校里,书本将很快过时,”托马斯·爱迪生(Thomas Edison)在1913年满怀信心地说,“人类知识的所有门类都可以通过动态影像来进行教学。我们的学校系统会在十年内发生翻天覆地的变化。”大数据能否超越那些力量甚微的创新而真正地变革教育呢?

对吴恩达教授而言,这场变化的发生速度,已经超出了他的想象。过去在校园里,他的机器学习课程一个学期的选修人数是几百名,而当他在2011年把课程搬上互联网之后,注册的学生突破了10万人,其中约有4.6万人确实开始了课程学习,并提交了第一次的作业。在为期4个月的课程结束之前,他又扩充了113个长度约10分钟的视频,这时已有2.3万人完成了大部分的学习任务,有1.3万人因成绩合格而获得了结业证书。

10%的完成率看起来似乎相当低下,而其他网络课程的完成率甚至只有5%。事实上,吴恩达教授的一位斯坦福同事——Udacity(Coursera公司的竞争对手)创始人之一的塞巴斯蒂安·特龙(Sebastian Thrun)——曾经于2013年秋天公开宣称MOOCs是一个失败的新生事物,而他提出该主张的原因就在于其过低的完成率。然而这类忧虑忽略了一个更为重要的事实,那就是,即使就这个完成率而言,吴恩达教授单独一门课程的学生人数,如果凭借传统的教学手段,则需要他终其一生才能达成。

大数据已经做好准备为教育带来它所期待的巨大变革。下面,就让我们来共同关注这些变化将会如何发生。

2 改变

大数据改善学习的三大核心要素:反馈、个性化和概率预测。过去我们相信自己发现因果关系的能力,如今必须意识到我们通过大数据看到的往往是相关关系。

令人愉快的双赢设计

路易斯·冯·安(Luis Von Ahn)的外表与行为和大家身边典型的美国大学生没什么两样。他喜欢打电子游戏,喜欢飞快地驾驶他的蓝色跑车,他就像现代的汤姆·索亚(Tom Sawyer),热衷于差遣别人替他做事。但是人不可貌相,实际上,冯·安是世界上最杰出的计算机科学教授之一,而帮他做过事的,足足有10亿人。

10年前,22岁的研究生冯·安参与创造了一项名为CAPTCHAs的技术,要求人们在注册电子邮件等网络应用时输入弯弯曲曲的文字,以证明进行此操作的是人类而非恶意灌水的程序。冯·安把CAPTCHAs的升级版(reCAPTCHA)卖给了谷歌,这个版本要求人们输入扭曲文字的目的不仅是作验证,更主要的目的,是为了破解“谷歌图书扫描计划”中那些计算机难以识别的文字。这是个聪明的做法,发挥了一项数据的两种作用:在线注册的同时识别文字。

在那之后,成为卡内基梅隆大学(Carnegie Mellon University)教授的冯·安开始寻觅更多的“一石二鸟之计”——使人们提供的零散数据为两种目的服务。于是,在2012年,他启动了新的设计——多邻国(Duolingo),通过网站和智能手机APP帮助人们学习外语。作为一个幼年在危地马拉学习英语的人,冯·安对学习外语抱有共鸣,而更重要的是,多邻国的教学方式非常巧妙。

它要求人们在同一时间翻译一些较短的词组,或者评价和修正其他人的翻译。不同于一般翻译软件呈现其自创词组的做法,多邻国呈现的是需要翻译的文档中的真实句子,因此公司能够从中获取报酬。一旦有足够的学习者能够翻译或验证特定词组,系统就会接受他们的译文,并收集所有零散的句子,将其整合到完整的文档之中。

多邻国的客户包括CNN和BuzzFeed等媒体公司,后者通过多邻国的服务,翻译用于其海外市场的相关内容。和reCAPTCHA一样,多邻国也是个令人愉快的“双赢”技术:学习者免费获得外语学习指导,同时制造具有经济价值的产物作为回报。

此外,还有第三个益处,那就是多邻国收集的“数据尾气”(data exhaust),即由人们与网站之间的互动中衍生的副产品:如熟练掌握一门语言的某一方面需要多长时间、最合适的习题量是多少、落下几天进度的后果等等。冯·安意识到,所有这些数据都可以采取某种方式加以处理,从而揭示出促进人们学习的最佳策略。在非数据环境中,做到这一点并不容易。然而,对于2013年间的每一天都有大约100万访问者,并且人均花费30多分钟用于线上学习的多邻国来说,巨大的用户数量足以支撑此类研究。

冯·安最重要的发现是:关于“人们怎样学得最好”的问题是错误的。重点不在于“人”怎样学得最好,而是具体的“哪个”人。对此,他解释说,针对最佳语言学习方法的实证研究数量很少,比方说,在许多理论中,主张先教形容词,再教副词,但几乎没有确凿的数据支撑。他指出,即使存在相关数据,通常也是针对数百名学生的小规模研究所得,将之作为普遍的研究发现加以推广,终究是不可靠的。为什么不以多年来数以千万的学习者为研究对象得出结论呢?多邻国的出现,使这样的研究成为可能。

冯·安在处理数据的过程中得到了一个重要的发现,即语言教学手段有效与否取决于学习者的母语以及他们将要学习的语言。以西班牙语使用者为例,通常,他们在学习英语的最初阶段就会接触到“he”“she”和“it”等代词。然而冯·安却发现,“it”一词容易引起他们的迷惑和焦虑,原因是“it”很难翻译成西班牙语。于是冯·安进行了几次测试,只教“he”和“she”,直到数周后坚持学习而不放弃的人数显著增加,再开始“it”一词的教学。这样就能显著提高坚持学习的人数。

他还有一些发现是有悖直觉的:女性的体育术语学得更好;男性更擅长学习与烹调和食物相关的单词;在意大利,女性总体来说比男性在英语学习上表现得更出色。许多类似的发现始终在不断涌现。

多邻国的故事为我们呈现了大数据重塑教育的最有前景的方式之一。其中反映了大数据改善学习的三大核心要素:反馈、个性化和概率预测。

小数据时代单向度的反馈

在正规教育中,从幼儿园到大学,反馈随处可见。我们从家庭作业、课堂参与、论文和测验中获得成绩,有时,甚至仅凭出勤率就能得到分数。在一个人的求学生涯中,会积累数以百计的此类数据点,我们将其称为“小数据”(small data),这些数据代表的是学生在教师眼中的学业表现。我们越来越依赖于这种反馈,将其作为衡量学习行为的指标。然而,这种教育反馈系统几乎在所有方面都存在很大的缺陷。

我们并不是总在收集正确的信息,即便是,我们所收集的数量远远不足。而且,收集的数据也没有得到有效的使用。

这是很可笑的。当年,美国国家航空航天局(NASA)的电脑主机能把宇航员安全地送上月球并接回,如今,iPhone的性能大大超越了美国国家航空航天局当时的电脑主机;电子表格软件和绘图工具有着令人惊叹的丰富功能,而向学生、家长和教师提供一个便利的、针对学生行为和成绩的全面评价体系,却仍然停留在科幻小说中。

最需要了解的是,我们通过现行的教育反馈进行评价的对象是什么。我们对学生的学习表现进行打分,并要求他们对这一结果负责。然而我们却很少评价自己,更不会全面或大规模地对自己的教学进行评估。我们并未衡量所采用的教科书、测验和课堂讲解等教学内容与手段是否对学习有益。

在小数据时代,对此类数据的收集过于昂贵和困难,所以我们只能评价那些简单的元素,如测验成绩等。其结果是,反馈几乎是单向度的,从教师和校方指向学生和家长。

这种做法在其他行业里是极不合理的。没有一个制造商或是销售商会只对客户开展评价。它们想要获得的反馈,在很大程度上是关于自身的,即它们的产品和服务——其目的是使之得到改进。对特定的学生而言,反馈主要是关于学生对课程的理解程度(最终是教师以频率不高的标准化测试为手段所了解到的),而不是关于教师或教学工具的优劣。这种反馈针对的是学习的结果,而不是学习的过程。其原因在于数据的捕捉和分析存在较大困难。

大数据正在改变这一现状。我们能够收集到过去无法获取的学习数据,并用于学习过程的处理。我们还能用新的方式组合数据,并充分发挥其作用以提高学习理解和学业表现,同时分享给教师和管理者以改善教育系统。

电子教科书的优势

就阅读而言,人们重复阅读某个特定的段落,是因为其文笔优雅,还是晦涩难懂,这在过去无从得知。学生是否在特定段落的空白处做了笔记?为什么要做笔记?是否有些读者在文章结束前就放弃了阅读?如果是,放弃的位置在何处?这些问题能够揭示大量信息,但却难以把握——直到电子书(e-book)的出现。

当教科书出现在平板电脑或计算机上,以上提到信息就可以被收集和处理,并用于向学生、教师和出版商提供反馈。因此,主流教材出版公司争先恐后地开拓电子书市场的举动毫不奇怪。培生、楷博教育和麦格劳-希尔公司等需要掌握与其教材使用情况相关的数据,以改进教材内容,并基于学生的特定需求为其定制补充材料。这不仅能够提高教材的相关性和有效性、促进学生的学业成绩,还能帮助公司更好地与同行竞争。

举例来说,出版商希望了解的一个问题是“衰减曲线”(decay curve),即追踪学生对曾经阅读过的并且有可能记住的内容的遗忘程度。这样,系统就能确切地知道应该在何时与学生共同回顾学习内容,以提高其记忆保留的概率。因此,学生可能会收到一则消息,告知他如果在测验前两天的晚上——不是前一天晚上,也不是测验当天早上——观看复习视频,那么他将有85%的概率记住复习内容,并在测验中作出正确解答。

会“回话”的电子教科书

此类进展改变着教育书籍市场。在这个市场中,写得不好的教科书比由于无趣而遭到搁置的小说更加有害,因为学生们可能会受到有缺陷的教材的影响而无法发挥他们的潜能。我们只需要打开一本20世纪40年代的小学低年级课本,看到书中密密麻麻的字体、晦涩难懂的语言、脱离现实的古怪示例,就不难想象当时的儿童教育是怎样的一出悲喜剧。

当然,在今天,有学校审查委员会对大量教材进行审核。但是委员会的评估工作往往存在局限。他们可以检验内容的精确程度和偏误,并将之与公认的教学标准作对比,却缺少了解教材是否对学生有效的实证方法,同时也无从得知学生对书中特定部分的反馈情况。而这些正是有助于弥补教科书缺陷的要素。

与之相比,教科书出版商更希望获得来自电子书平台上的综合数据分析,包括有关学生如何应用他们的教材、其中哪些地方取悦了他们、哪些地方干扰了他们等方面的数据。作者无需强制读者作出反馈,只需要通过接收的手段,就能更清楚地认识到书中的有效内容和无效内容。写作既是一门艺术,也是一门手艺,因此有必要不断地加以完善。针对读者反馈的大数据分析,是完善写作的基础。

要使之成为现实,仍然有很长的路要走。在美国,印第安纳州、路易斯安那州、佛罗里达州、犹他州和西弗吉尼亚州允许州内学校在课堂中使用电子教科书。然而,即使电子书的销量已经逼近纸质书,在课堂中使用电子教科书的学校仅占全美学校的5%。

尽管如此,潜在的收益是巨大的。吴恩达教授的Coursera能够从数万名选修他的斯坦福课程的学生那里挖掘点击数据,从而实现课程的改善,那么教科书也同样可以“了解”学生的使用情况。在过去,信息的流动是单向的,即从出版商到学生,而如今,信息的传递是双向进行的,我们的电子教科书会“回话”给教师。

相关信息不仅可用于既有教学内容的重新设计,还可以通过实时分析,自动在某一时刻显示出适合学生特定需求的学习内容。这种技术被称为适应性学习,它正在引领教育进入一个高度个性化的新时代。

教育机会均等的代价

学习一直以来都是个人行为。我们将自己的所见所闻转化成某种见解,最终形成对世界的独到看法。但是我们听到和看到的、我们在学校和专业培训课程中学习的,是经过打包和标准化处理的信息,就像均码的服装。这是我们为提高教育的可获取性付出的代价——过去的教育主要为贵族、教士和富人服务,如今它成为大多数人能够享有的事物。

两个世纪之前,关于正规学校教育的理念是难以得见的。在升入大学之前,那些精英人士的孩子接受单独辅导,或是在昂贵的小型院校中学习。这实际上是一种随时根据学生的需求而特别定制的服务,这种形式显然无法推广,并且只能为极少数人所拥有。到了19世纪和20世纪,教育进入大众化时代,从此开始了教育的大规模批量生产。这是我们不得不为教育普及付出的代价。

在今天,几乎所有类别的消费品都为我们提供了成千上万种选择。这些产品是批量生产的,但是消费者能够根据个人的喜好进行选择,这避免了“一个尺寸适合所有人”的思路。亨利·福特(Henry Ford)就曾经在这个思路的引导下说过:“任何顾客可以将这辆车漆成任何他们愿意的颜色,只要它是黑色的。”然而我们在其他行业见到的类似多样性和定制化,尚未在教育领域大规模地显现。

缺乏个性化的教学改革

迄今为止,教学形式发生了很大的改变:学生有时围坐在一起,教师也不再严格地站在最前方;学生们参与小组合作,并且被鼓励要向彼此学习;教师是亲切和友好的;在发达国家,笔记本电脑和平板电脑正在蔓延到学校中。

然而从某个重要的角度来看,学校几乎没有取得什么进展。现代教育仍然类似于伴随着其发展的工业化时代的教育:学生们受到同样的对待、使用同样的教材、做同样的习题集。这不能称为个性化学习。正规教育的运行仍然近似于工厂里的装配生产线:教材相当于可替换的零件;教学——尽管在新颖性和教师的亲切度上倾注了最大的努力——就其本质而言,对所有学生的处理都是一成不变的;教与学都参照统一标准,基于平均值,而不顾个人的喜好、特质或需求。这反映了工业化时代的大规模生产模式。

保持一致步伐,并在同一时间呈现完全一样的内容——传统教育迎合的是教师和系统的要求,而不是学生的利益。实际上,大多数正规学校的教育,在其设计之初考虑的是处于平均水平的学生——比坐在前排的神童学得慢,但比教室后排的笨蛋学得快的虚构的学习群体。而现实中,并没有归属于这一类别的学生。《平均时代的终结》(Average Is Over)一书的作者,美国经济学家泰勒·考恩(Tyler Cowen)宣称,我们现在拥有根据个人喜好和需求定制事物的技术,不再需要服从过去的同质性了。

“一个尺寸适合一个人”

事实上,改变现状是极其重要的,因为基于平均水准设计教育系统的做法,会同时损害位于正态分布曲线两侧的学生。以虚构的中等学生为对象实施教学,会使领悟力高的学生感到厌烦(甚至引发纪律问题),而领悟力低的学生会学得非常吃力。正如线上教学和个性化教学的先驱者——可汗学院的创始人萨尔曼·可汗所说的:这实际上是“一个尺寸适合少数人”的方式。

我们需要的是“一个尺寸适合一个人”的方式,而且我们有能力去实现。我们可以对知识的传递进行个性化处理,使之更好地适应特定的学习环境、偏好和学生能力。这样的做法,虽然不能让每个人都成为火箭专家,并且对学习者的专注、执著和精力仍然有要求,但是可以打破“一个尺寸适合所有人”的同质性,从而使学习优化成为可能。

补习班:适应性学习软件的用武之地

为每一个学生定制教育,是适应性学习软件长期以来的目标。这个观念已经存在了几十年。在过去,适应性学习系统的价值非常有限。专业人员驾驭计算机技术,使其更快、更具个性化,但是他们没有利用数据来实现私人定制的、个性化的学习。目前正在发生的变化,类似于计算机科学家在机器翻译上所经历的演变——从把正确的译文编入软件,过渡到依赖数据来推断最适当的翻译。

接触到数据之后,适应性学习系统开始进入飞速发展阶段。2013年,一项由比尔和梅琳达·盖茨基金会(the Bill and Melinda Gates Foundation)委托进行的报告指出,有大约40家公司提供适应性学习软件。Carnegie Learning是其中之一,该公司将“认知导引”(cognitive tutor)系统运用于高中数学,根据学生对先前问题的回答情况制定后续的提问内容。这样,就可以找出学生的问题所在并深入了解它们,而不是像传统方式那样,试图涵盖一切内容,却遗漏了很多知识。这套系统曾经以俄克拉荷马州的400名高中新生为对象进行过一次严格的测试,结果显示,与接受传统教学的学生相比,使用该系统的学生达到同等数学能力所花费的时间节省了12%。

最大的获利并不发生在常规课堂中,因为教师有时会抗拒新的方式(教师和教师工会担心数据会被用于业绩排名,或作为学校管理人员裁员的参考)。最适合适应性学习系统的学习场所,其实是补习班。那里的学生因为传统教学方式的失败,已经在学习上落后于他人,因此,为了提高成绩,应该采取更具突破性的手段。

在补习班,适应性学习取得了实质性的收获。比尔·盖茨(Bill Gates)在2013年的大学理事会会议中提出:“在这些新形式的补习课程中,学生的表现优于在常规课程中。”他同时补充道:“各大学还观察到,花费在每个学生身上的成本降低了28%。”

个性化学习最令人印象深刻的特征是其动态性,学习内容可以随着数据的收集、分析和反馈加以改变与调整。如果一个学生对某个部分的学习存在困难,那么这个部分将会被纳入之后的习题集,以确保[1]该学生有足够的练习机会。这个常识性的概念被称为“掌握学习”(mastery learning),学生必须证明自己打下了坚实的基础,才能够进入下一阶段的学习。

比如,自2009年开始,在纽约地区的数所中学推广了一个名为“个人的学校”的数学项目。每个学生都拥有他们的个人“播放列表”,通过相关算法分析个人需求,为他们指定每天需要解答的数学习题。“如果有不理解的地方,我可以尝试用一种崭新的方式,根据自己的时间安排开展学习,我不需要采用和其他人一样的学习方式。”伊莎贝尔·冈萨雷斯(Isabel Gonzales)—— 一名“个人的学校”的学生——如是说。由国家和私立教育服务机构进行的独立研究显示:完成该项目的学生在数学上的表现大大优于其他学生。[1] 掌握学习,主要是指在“所有学生都能学好”的思想指导下,以集体教学(班级授课制)为基础,辅之以经常及时的反馈,为学生提供所需的个别化帮助以及所需的额外学习时间,从而使大多数学生能够达到课程目标所规定的掌握标准。美国教育心理学家布鲁姆教授为掌握学习观点的主要倡导者,他认为只要给予足够的时间和适当的教学,几乎所有学生对几乎所有的内容都可以达到掌握的程度。——译者注

大规模定制:创建个人的“播放列表”

既然我们可以截取、混合最爱的音乐并将之刻录到iPod播放器中,那为什么不能对我们的学习做出同样的操作呢?这显然更有意义。

在未来,学习绝不会是按照一本给定的教科书、一门科目或课程,以同样的顺序和步调进行,而将是有数千种不同的组合方式。这类似于在线视频游戏,比如Zynga公司的FarmVille游戏不只是有一个版本,而是有几百个迎合玩家兴趣和特点的版本。

教师不再需要凭借主观判断选择最适合教学的书籍,大数据分析将指引他们选出最有效的、支持进一步完善和私人定制的教材。当然,同一组学生仍然会使用相同的教材,毕竟他们需要通过相同的测验,但是教材是可以进行个性化处理的。

大规模定制——其产品的生产成本并不比批量生产成本高出许多——重塑了各行各业的面貌,使这些行业和汽车制造业与计算机产业一样,有能力推出品种繁多的产品。大规模定制的进行,其要求来自消费者的详细信息,而生产者则基于这些信息,创建并提供有意义的自定义选项。消费者需要做到不费力且准确地表达他们的喜好和选择。在学习环境下,大规模个性化的实现,需要有更丰富的反馈数据流向教师和管理人员。个性化建立在大数据反馈的基础上,并将其恰当地付诸实践。

因为我们将要收集来自众多学生的大量反馈数据,所以有可能以先前收集数据时未曾想到的方式实现个性化处理。在小数据时代,我们只能收集用于解答既存问题的数据(如考试成绩),因为数据收集和分析的代价过于昂贵。在大数据时代,我们拥有如此多的信息,并且可以“让数据说话”,也就是说,可以洞察那些过去几乎无从得知的事物(如能够改善测验结果的论坛帖子)。

于是,我们将会了解学习中的有效因素和无效因素——不仅在一般情况下,还细分到背景和群组,甚至小到个人水平。系统将吸收反馈结果,并动态地调整教学材料和环境,使其适应所有的学生。

理性对待概率预测

通过大数据,我们能够对人们的整体学习状况和个体的知识掌握情况产生独到的见解。然而这些见解并不是完美的。我们对“学习的学习”(learning about learning)可以说只是一种“可能性”。我们可以基于高度的可能性,对个体为提高其学业成绩需要实施的行为作出预测。比如,选择最有效的教材、教学风格和反馈机制。但这仅仅是概率预测。

比方说,我们发现某类教材能够提高特定学生的测试成绩,且预测的准确性达到95%,但这仍然意味着存在5%的判断失误的可能性,即学生的成绩不会提高。然而,这并不代表我们应该放弃此类预测。很显然,相对于过去传统的、同质化的教育,这是一种进步,通过预测提供个性化定制所需的成本也相对低廉。但是在遵循预测时,我们必须意识到这些见解存在着局限性,并不是百分百正确的。

人们通常不太乐意接受概率。我们更喜欢二者择其一的回答,如是或否、开或关、黑或白。这些回答能够直接并且快速地指导我们作出决定。假如大数据分析告诉我们,改用另一本教材就有70%的概率能改善女儿的汉语学习,这是否足以说服我们更换她的教材?假如改善的可能性有70%,但是改善的程度却相对较低(如5%~10%),抑或是更换教材后,可能造成如成绩大幅下降等严重后果——面对有较大可能性获得一定收益的同时,存在较小可能性出现巨大负面风险的后果。我们是否愿意接受这样的选择?

亚马逊的推送信息和谷歌翻译(Google Translate)的备选推荐(二者都使用了基于大数据分析的概率预测)是可以被接受的,因为即使预测有误,其造成的后果并不严重。然而一旦涉及教育决策,概率预测将成为潜在的巨大威胁,因为这将对人们未来的成功与否造成极大的影响。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载