写给所有人的极简统计学(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-11 03:30:44

点击下载

作者:(日)永野裕之

出版社:北京时代华文书局

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

写给所有人的极简统计学

写给所有人的极简统计学试读:

写给所有人的极简统计学(日)永野裕之著李俊译北京时代华文书局图书在版编目(CIP)数据写给所有人的极简统计学 /(日)永野裕之著;李俊译.——北京:北京时代华文书局,2017.5ISBN 978-7-5699-1438-2Ⅰ.①写…Ⅱ.①永…②李…Ⅲ.①统计学 Ⅳ.①C8中国版本图书馆CIP数据核字(2017)第040751号北京市版权局著作权合同登记号 图字:01-2016-9561TOKEIGAKU NO TAME NO SUGAKU KYOSHITSUby Hiroyuki Naganosupervised by KENSUKE OKADAillustrated by Ryuji KitamiCopyright ©2015 by Hiroyuki NaganoChinese(in simplified character only)translation copyright©2017 by SunnbookCulture &Art Co.,Ltd.All rights reserved.Original Japanese language edition published by Diamond, Inc.Chinese(in simplified character only)translation rights arranged with Diamond, Inc.through BARDON-CHINESE MEDIaAGENCY写给所有人的极简统计学著者|(日)永野裕之译者|李俊出版人|王训海选题策划|阳光博客责任编辑|陈丽杰 袁思远责任校对|陈丽杰 袁思远装帧设计|阳光博客+李昆仑责任印制|刘社涛出版发行|北京时代华文书局 http://www.bjsdsj.com.cn北京市东城区安定门外大街136号皇城国际大厦A座8楼邮编:100011 电话:010-64267120 64267397印刷|三河市华成印务有限公司 电话:0316-3521288(如发现印装质量问题,请与印刷厂联系调换)开本|710×930mm 1/16 印张|24.75字数|280千字版次|2017年5月第1版 印次|2017年5月第1次印刷书号|ISBN 978-7-5699-1438-2定价|56.00元版权所有,侵权必究序言

统计学能力的代沟

2015年1月份,日本被称作“非自主教育时代”的第一届高中生参加了全国统一大学入学考试。以下问题,是这些高中生们数学考试中的必答题(不必现在思考如何解析,可以快速阅览一遍,答案将在后面揭晓)。

一个有40人的高二班级,让每个学生分别扔出两次手球,之后统计每次手球飞出的距离。图2是以每个人第一次扔出的距离作横轴、第二次扔出的距离作纵轴绘制出的点位图。因一人缺席,现有39人的数据。(协方差为第一组数值的偏差【指各数值与平均值的差】与第二组数值偏差的乘积的平均数)(1)从①~⑩中选出最恰当的选项。

与两组数值的相关系数最接近的值是_______。

①0.67 ②0.71 ③0.75 ④0.79 ⑤0.83

⑥0.87 ⑦0.91 ⑧0.95 ⑨0.99 ⑩1.03(2)从①~⑧中选出应填入空格中的不等式关系。

后来,也让之前缺席的那位学生做了相同的两次投掷,并记录了数据。第一次的数据为24.7m,第二次为26.9m。将此学生的数据加入之前全班的数据中重新计算。假设新的共同方差为A,之前的共同方差为B,新的相关系数为C,之前的相关系数为D。那么A与B, C与D的大小关系成立的是_______。

①A>B, C>D ②A>B, C=D ③A>B, C

④A=B, C>D ⑤A=B, C=D ⑥A=B, C

⑦AD ⑧A“非自主教育时代”的高中生,无论是文科还是理科,在被称作“数据分析”的数学必修课中,都被要求掌握柱状图、箱形图、方差、标准差、相关系数等统计学的基础。

我觉得1974年之前高中毕业的人,能将这个问题顺利解析出来的应该不多。因为,1974年之前,包括我自己在内,大部分读者读书时,统计学只是一门选修课(且大部分人都不会选),在学校学习统计学的人少之又少。

而对于2015年3月份以后高中毕业的一代人来说,这个问题根本不是什么难题。作为刚毕业不久的社会新人,在“统计学知识(应用统计学的能力)”这个问题上,与我们这代人之间存在巨大的代沟。

西内启的畅销书《看穿一切数字的统计学》(钻石出版社)的出版,让大家开始关注统计学,其中有一节是这么写的:“如今,有了计算机这个强有力的伙伴,各个领域,世界上的每一个角落,以及人生中的每一个瞬间,所有待解的难题,都能从统计学中找到答案。”

在信息过剩与价值观多样化的现代,能够理解并表达出通过统计学运算得出的结论,已经成为在社会上行走必须具备的一项能力。毋庸置疑的是,统计学知识已经成为现代人不可或缺的一项技能。

社会人士无法理解统计学的原因

我在一家名为“永野数学私塾”的数学教育机构,给社会人士做数学方面的培训。学员们重新学习数学的原因各不相同,最近听到比较多的一个原因是“想学统计学”。我一开始觉得:“市面上都出了这么多统计学的书籍,还特地过来学习,一定是想了解统计学领域比较深奥的知识吧。”可是,讲了几节课之后,我发现难住很多学生的不是统计学知识,而是数学基础知识。由于不理解统计学书籍中出现的那些初、高中数学知识,因此连基础的统计学都看不懂。换句话说,只要学好数学,就可以参考各种介绍统计学知识的书籍自主学习了。

让人觉得不可思议的是,市面上介绍“用在统计学上的数学”的书寥寥无几。正因为如此,我才提笔写了这本书。读者朋友们即便在学校没有选修统计学,也可以轻松自学和统计学相关的数学基础知识。

本书的内容

本书精选了学习统计学所需的初、高中阶段的基础数学知识。从除法的意义与比值(第一章)这种小学水平的算术开始,到平方根、多项式的计算(第二章)、函数与表格(第三章)、概率、∑记号(第四章)、极限、微积分(第五章)等,涵盖的内容相当广。每个章节都尽可能地以“易于理解”为第一主旨。北见龙子小姐的插画也帮了我很大的忙。同时,在篇幅允许的情况下,我列举了一些例题与练习题。这些题目,可以帮助大家确认是否掌握了书中介绍的知识点,请勿跳过,一定要试着做做看!

本书还介绍了相关数学知识在统计学中的应用范围与具体方法。这部分内容还特地邀请了心理统计学研究室的冈田谦介教授担任编辑顾问。冈田老师会在书中登场亮相,为大家解析哦!

本书将“非自主教育时代”的统计学必修内容归纳在前三章中,希望读者通过对第四章的学习,理解“离散型数据”(即零零散散的数据),通过第五章理解“连续型数据的概率密度函数”等相关内容。简单来说,此书将会为大家总结“对收集的数据加以分析”的统计方法,以及介绍“从部分数据中推算出整体情况”的推测统计的入门知识。

统计数学是社会人士必须掌握的数学能力

在写这本书的时候,我深深觉得,这本书中介绍的数学知识真的是社会人士必须要掌握的(虽然只是针对统计学选择的一小部分数学知识)。只要掌握了本书中的数学知识,即便是和数学能力很强的人交谈,也不用再胆怯、自卑了。除此之外,看到满是数字的资料和Excel中的函数,也能轻松应对了,甚至可以用图表做出更精彩、更成功的演讲。对思考能力的锻炼也更加不在话下!

写到这儿,也差不多该进入正题了。我将通过此书,带你通过最短的捷径抵达目标。所以,请相信我,一起来学习吧!(开头数学问题的答案:(1)⑧  (2)⑧)第1章 数据整理的基础知识第1章 前言

总的来说,统计就是将收集到的数据(数值)进行整理并加以分析的学问。注释:数据与数值的意思是相同的。在中小学通常称之为“数值”,到了高中以后大多称之为“数据”。本书将统一写作“数据”。

在这一章,我们先学习整理数据过程中必须要掌握的平均、比例以及图表等概念的相关知识。这些内容虽说都是小学数学水平,不过也别抱着“这种简单的知识我都知道”的心态掉以轻心。你还别不信,来看看这道题目吧。问题 对某初中三年级100名学生的身高进行测量,计算出的平均值为163.5cm。以此结果为依据,对以下命题进行判断。正确的在前面的空格中画√,错误的画×。□ (1)身高在163.5cm以上和163.5cm以下的学生各有50名。□(2)将这100名学生的身高相加求和,结果等于163.5×100=16350cm□(3)将学生身高以10cm为单位分成若干区间,如身高在“130~140cm”“140~150cm”……那么身高在“160~170cm”这个区间的学生人数最多。(选自:日本数学协会主页)

这是日本数学协会在2011年,针对全国约6000名大学生进行的“大学生数学基础知识调查”中的第一道题。结果显示,这道题的正确率为76%。当时,媒体以“大学生平均4人中就有一人不会”为热点进行了大肆报道。这道题,你有自信答对吗?(该题答案将在本章最后揭晓。)

在学习数学的过程中,“比例”这一知识点,是很让学生头疼的一个难点。国家教育政策研究所在2013年进行的 “全国学生学习能力与状况调查”结果显示,有关除法的问题,正确率排在最后一位。要准确理解“比例”这一概念,就必须从根本上理解除法的两个意义。但根据我的教学经验,即便是成年人,能正确理解“除法的两个意义”的也只有寥寥数人而已。“比例”这个概念,是学习统计学的基础,而且“比例”与“概率”之间存在千丝万缕的联系,只要在理解上稍有偏差,就可能为今后学习统计学埋下祸根。

接下来,我们再说说图表。将数据加以整理,并以图表形式呈现出来,可以说图表是一种方便大家理解的有力工具。但是,若选错图表,导致你使用的图表与想呈现的数据或内容不相匹配,不但不能起到方便理解的作用,反而会让人越看越乱,甚至造成误导。相信某些读者朋友们有过这种经历,公司开会时,上司愤怒地指责你:“用这种图表,你觉得谁能看懂?”被这样责骂,还不是因为没有选择恰当的图表。

综上所述,在这一章节,我们就重新学习一遍“平均”“比例”以及“图表”等整理数据所需的基础知识吧!平均数“平均”一词,顾名思义,是指将事物平等、均等分配的意思。

例如,有如下三个长方形,高度分别为2、7、3。要想让这三个长方形一样高(平均),要怎么做呢?将高度为“7”的长方形切断,然后分给其他两个长方形,如图所示:

使高度一致后,我们得到了一个大的长方形。这个长方形的纵向长度为平均数(长),横向长度为个数(宽),面积就是总数。即:

那么,由此可以得到

将以上内容,用代数整理。将所有的数据列为:

x,x,x,…,x123n

数据总个数为n。用这些数据的总和除以n就是平均数。在数学中一般用“x”表示平均数,即在字母上方添加一横来表示。平均数的定义

那么,马上来练习一下吧!例题1-1  下表为两个小组的数学测验成绩,分别是有6人的A组与有5人的B组。求出两组各自的平均分。【解析】

A组平均分

B组平均分

两组的平均分都是50分。

像这样数据个数(人数)不同的多组数据之间,也可以相互比较。

但是,仔细观察两组数据中每个人的分数,不难发现:A组的分数中,低于平均分、与平均分持平以及高于平均分三个领域的学生各有2名,分布较均匀;而B组的分数中,未达到平均分的有4人,高于平均分的仅有一人。由此可见,B组中是100分的学生拉高了整组的平均分。

在这些数据中,还有许多通过平均数无法发现的特点。在统计学中,作为显示数据特征的数值,除了平均数以外,还会使用中位数与众数(这些概念将在后面进行详述)。

接下来,我们要学习的是“除法的两个意义”。这部分内容在我的另一本书《数学好的人是如何思考的》中提及过,但这个知识点是理解概率和比例这两个概念的前提,因此在这里再详细给大家介绍一遍。除法的两个意义

我们先做一个实验。

如下图所示,有6个圆。

用这些圆,将6÷3=2

表现出来。因为此题不存在唯一的正确答案,所以大家可以放开思维,任意遐想。如果可以,让家人、朋友也一起来做做这道题吧。做完之后,你会发现一些有趣的答案。(A)(B)

你画的是哪一种图形呢?恐怕大多数同学都画成了(A)图吧。不过,一定也有一部分人画成了(B)。就像一开始所说的,此题不存在唯一的正确答案,两种画法都是正确的,都表示出了6÷3=2

的意思。(A)除法的意义(1)——将一个整体平分

假设有如下问题:“现有6个包子。如果3个人平分,每人能得到多少个?”

在这种情况下,当然是通过6÷3=2

计算得出,“每人可以得到2个”。“把6个包子平均分成3份,每份为2个”就是这则除法运算的意义。类似这样,将一个整体平均分配的除法,专业术语叫作“等分除”。反过来做乘法,可以如下计算:2(每份的量)×3=6

也就是说,(A)的思维模式,也可以理解成“以求出每份所含的量为目的”的计算。(B)除法的意义(2)——将整体平均分成数个等份

我们将问题改变一下:“现在有6个包子。一盒装3个打包,需要多少个盒子?”

这次,通过与(A)部分相同的计算:6÷3=2

可以得出“需要2个盒子”的答案。

但是,此次计算的意义就变成了:“将6个物品以3个1份平均分,可以得到2份”,或者可以说成“6个包含3个2份”。

类似这种,将整体分成数个等份的除法,专业术语叫作“包含除”。

与之前一样,将此计算理解成乘法的逆计算,(B)的思维方式是:

3×2(份数)=6

即在“每份的量”为3的情况下,求“份数”的计算。

到底哪一个更正确呢?

再强调一遍,这两种对除法的理解都是正确的。关键是要清楚地认识到,除法有(A)和(B)两种意义。除法的两个意义a÷n=p(A)将a分成n等份,则每份有p个。【等分除】(B)将a按照每份有n个等分,则可以分成p份(a有p份的n个)。【包含除】

说了这么多,大家可能会觉得这些都是很简单的知识。但是,如果没有分清二者的区别,在加减乘除运算法则中,会对除法的理解模糊不清,导致无法很好地掌握“比例”这个知识点,所以一定要重视哦!

准备已经足够充分,下面将正式开始学习“比例”这个知识点。比例

首先,从比例的定义开始讲起。比例的定义比例=比较量÷基准量

来看一道简单的例题吧。例题1-2 某个班级共有50人,其中男生有30人。求男生在班级中所占的比例。【解析】

在这道题中,比较量(男生数量)为30人,基准量(班级总人数)为50人,则30÷50=0.6

从而得出,男生占比为0.6(60%)。

以上解析,只是单纯地把数值带入比例的定义式中做了除法,大家不一定能从根本上理解比例这个概念。为了充分理解比例的概念,我们来重新思考一下。相同单位的比例为包含除

相同单位的比例可以理解为包含除。在上一例题中,可以理解成在50人的班级中,包含0.6(60%)份男生,也就是30个男生。

相同单位的比例,即包含除的比例,其实是比较量(部分)在基准量(全体)中所占的比率。不同单位的比例为等分除

假设一家超市中有两种牛奶出售。A是400ml,卖120日元;B是900ml,卖300日元。哪种牛奶性价比更高呢?因为规格不同,所以单纯比较价格是无法比较性价比的。有意思的是,遇到这种情况,比例可以起到相当大的作用。使用比例,就可以在同样的基准上比较大小。

现在,将规格(容积)作为基准量,使用比例来比较一下价格吧。

这道题中的比例为:

由此可以计算出,A为:

B为:

但是,将这些除法(分数)的意义按照包含除理解的话,就变成120日元是400ml的0.3个……这让人难以理解。

其实,将不同单位的比例思考成等分除,意思就很清楚了。那么,算式

就可以理解为,将120日元等分为400份,也就是A牛奶的1ml价格为0.3日元。这正是等分除的概念。同样的,对于B:

可以得出,B牛奶的1ml价格为0.333…日元。根据1ml这一相同单位的牛奶价格,可以得知A商品性价比更高。一般情况下,等分除概念中的比例表示的是单位量(如1ml,1s,1g等)。

综上所述,不同单位的比例,即等分除概念中的比例,表示的是单位量的大小。

同样都是比例,相同单位的比例是包含除不同单位的比例是等分除

我个人觉得,有些解释会让人产生“比例是一个很复杂(或者让人难以理解)的概念”的感觉。如果你对比例有一种“貌似知道,但是貌似又有些不懂”的印象,那么你可能还没有将这二者加以区分。因为,如果你彻底理解了包含除和等分除的概念,就很容易理解比例的概念。

下面来做一道例题吧。这道题是国家教育政策研究所在2013年进行的“全国学习能力与状况调查”中,针对小学六年级学生提出的问题。顺便说一句,这道题的正确率为50.2%,是所有问题中正确率最低的。例题1-3  现有A与B两块木板。下表中列出了两张木板上各自的人数与面积。木板上的人数与木板的面积为了调查哪块木板上更拥挤,做了以下计算。A:12÷6=2B:8÷5=1.6从以下四个选项中,选择一个正确的选项()。1.因为每平方米的人数分别为2人与1.6人,故A比较拥挤。2.因为每平方米的人数分别为2人与1.6人,故B比较拥挤。223.因为每个人所占的面积分别为2m 与1.6m ,故A比较拥挤。224.因为每个人所占的面积分别为2m 与1.6m ,故B比较拥挤。(出自:国家教育政策研究所首页)【解析】“A:12÷6=2”与“B:8÷5=1.6”都是用人数除以面积。因为是不同单位的比例,即等分除的比例,所以,该算式是表示作为基准单2位的面积(此题中为1m )对应其数值大小的比例。22

也就是说,通过“A:12(人)÷6(m )=2(人/m )”计算出2A木板上平均每平方米为2人,通过“B:8(人)÷5(m )=1.6(人/2m )”可以计算出B木板上平均每平方米为1.6人。自然,A木板比较拥挤。正确答案是1。图表

在这一部分中,我们选择最具代表性的4种图表(分别是柱状图、折线图、饼图与带状图)进行介绍。各自的特点如下:图表的特点:(1)柱状图:表示大小(2)折线图:表示变化(3)饼图:表示比例(4)带状图:比较比例(1)柱状图:表示大小(出处:气象局丨每月突发强风次数)

柱状图是一种用于比较数量大小的图表。

上图是气象局1991年~2008年统计的共508次突发强风现象,按月整理之后绘制出的图表。从此图可以看出,7月~10月之间是突发强风的多发期。

另一方面,强风突发事件在多发期,也就是7月~10月的四个月,发生次数约占总体发生次数的60%,但是这个数字很难从此图中看出来。(2)折线图:表示变化(出处:气象局丨天气预报的准确率验证结果)

折线图是一种用于表示数据变化与推移的图表。

上图为气象局根据1985年~2013年间东京地区气象预报的准确度数据整理绘制出的图表。人们常说“天气预报不大准啊”,但是从此表可以看出,近年来的准确率有很大的提高。顺便说一句,右侧的“最高气温预报误差”一项,纵轴向上方向的数值是递减的,就是想通过这种看起来从左至右逐渐上升的形状,让人更直观地感受到天气预报的准确率有所改善。

但是,在观察折线图的时候,有一个需要特别注意的地方,那就是图表绘制者可以(在某种程度上)改变读者对数据变化程度的印象。比如,上面的“预报准确度”的折线图左侧的纵轴数值范围为“75%~90%”、右侧的纵轴是“1.0~2.5”。如果将这两个值的间隔变大,即便是相同的数据,读者也会觉得数据变化幅度不是很大。反之,若将这个值的间隔缩小,就会使读者觉得数据发生了明显的变化。在观察折线图的时候,务必要注意这一点。注:(1)中的柱状图也可以通过在图表中的数值间隔上“下功夫”,改变读者的印象。(3)饼图:表示比例(出处:能源白皮书2013版)

饼图适用于表示在一个整体中每个项目各占多少比例。

此饼图为日本能源厅取自“能源白皮书2013版”中的“世界可开采煤炭储量”的数据而做成的饼状图。从这张图可以看出,全球8609亿吨的煤炭总量中,美国的储量占比(27.6%)为第一位,其次为俄罗斯(18.2%),第三为中国(13.3%)。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载