应用统计学(第3版)(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-16 12:43:27

点击下载

作者:潘鸿 张小宇 吴勇民

出版社:人民邮电出版社有限公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

应用统计学(第3版)

应用统计学(第3版)试读:

内容提要

本书系统讲述了应用统计学的基本知识和基本技能,融入了电子表格(Excel)的实际应用,介绍了参数估计、假设检验、方差分析、相关与回归分析、时间序列分析、指数分析等应用统计方法。本书突出体现了应用统计学的应用性、层次性和趣味性,保持统计研究方法体系的完整性,注重传统与创新的统一及统计理论在实践中的应用,便于教师授课与学生自学。

本书配有电子课件、电子教案、上机操作数据、上机测试题及解答、视频和文字案例、模拟试卷、统计调查方案范例等教学资料,索取方式参见更新勘误表和配套资料索取示意图。

本书可作为经济管理类专业本科生的教材,也可作为从事相关工作人员的培训教材。

第3版前言

承蒙广大读者厚爱,自本书第2版出版三年来,我们收到了很多宝贵的意见和建议。本着对读者负责的态度,并结合已收到的意见、建议和编者近三年来的教学经验,本次修订着重做了以下工作。

一是更新了书中的数据。经过三年的时间,社会经济领域发生了很大变化,有些数据已过时,本次修订对部分例题及实验中所用的数据进行了更新。

二是对第2版中出现的错误进行了修正。

三是增加了第十一章的内容——相关与回归分析。

四是部分章节补充了一些内容及习题,如第八章增加了双因素方差分析的内容。

五是扩充了一些课外学习材料,以二维码的方式提供了一些视频案例、部分知识点授课视频等。

经过修订,我们力图使第3版教材更具实用性。

本次修订由潘鸿主持,妥燕方、黄博文、王佳新、刘能毓、李芬、王帅参与了本次修订工作。

使用本书第2版的广大读者提出了许多宝贵的修改意见,编者在此表示诚挚的谢意!鉴于作者水平有限,书中错误之处在所难免,恳请广大读者继续批评指正。潘鸿2019年1月

第1版前言

应用统计学是高等院校经济管理类专业的核心课程之一,其重要性不言而喻,但学生却普遍反映比较难学,原因是应用统计学用到的数学知识较多,计算工作量大而复杂。为了解决这一问题,在近几十年的教学实践中,笔者一直致力于探索统计学的课程及其教材建设,曾为专科生、本科生、研究生讲授过“社会经济统计学原理”“农业统计学”“国民经济统计学”“应用统计学”“经济计量软件应用”“计量经济学”“统计与计量经济综合演练”等课程,在教学中积累了大量的经验,特别是在应用统计学教学和教材建设方面进行了一些有益的尝试。

本书共分十章,系统讲述了应用统计学的基本知识和基本技能,并结合计算机应用介绍了抽样、假设检验、方差分析、时间序列分析、指数分析等应用统计方法。本书将本领域较新的研究成果和教学实践结合起来,使用电子表格作为统计分析软件(考虑界面友好性和功能齐全性,本书电子表格软件选用Excel 2007,较早版本或更新版本Excel也可参考使用;除数据分析外,其他任务也可选用WPS表格),实现了理论讲解与实验操作的有机结合。

第一章绪论,对“统计”一词的内涵进行了分析,并梳理了统计学的发展历史,重点介绍了应用统计学中常用的概念,包括总体、样本、标志、指标、指标体系、参数、统计量和变量等;第二章至第四章分别介绍了统计数据的收集、整理及描述性统计;第五章至第八章为推断统计的内容,主要包括抽样、参数估计、假设检验和方差分析;第九章为时间序列分析;第十章为统计指数。

在编写过程中,我们力图使本书突出以下几个特点:

其一,突出应用。在系统阐述统计学有关理论的前提下,突出统计方法和技术的应用,利用电子表格进行统计分析,使之实用化。

其二,体现层次。无论是内容、结构还是叙述方法都力求言简意赅、层次分明,方便学生掌握。

其三,教学资源丰富。本书配有电子课件、电子教案、习题答案和上机操作用数据、补充阅读等资料,以方便教师授课及学生学习(索取方式参见配套资料索取示意图)。

本书由多位教师共同编写完成,潘鸿负责全书的内容设计和统稿,同时负责第三章、第八章、第九章的编写和实验指导书的编写;张小宇负责第二章、第四章、第六章、第七章的编写;吴勇民负责第一章、第五章、第十章的编写。参与收集数据、文字校对和课件修改的有兰欢、刘刚、刘志强、罗甜、马杰、乔俏、覃多贵、王卓识、吴坤、赵锴、周惠珺、罗侠。

在本书编写过程中,参考和采纳了书末所列主要参考文献中所列著作中的一些观点,在此向各位作者表示诚挚的谢意。

鉴于我们的水平有限,本书难免会存在错误和不妥之处,恳请广大读者批评指正。编者2011年2月

致读者

1.为什么要学习应用统计学

关于为什么要学习应用统计学,编者在此不再论述,读者可咨询老师或已经进入职场的师兄、师姐是否经常遇到以下几个问题(或场景)。(1)做市场调研,大多数情况下只能做局部调查,如何能让调研结果更真实、更可靠?最终的调研数据可信度有多高?用什么方法能了解消费者的需求?(2)有了调研数据,如何进行分析、整理,用什么样的图或表去展示能更直观?(3)如何通过历年的销售数据较准确地预测下年度的销售情况,以便提前做好工作计划。(4)如何判断新产品的质量是否有明显提高?又如何判断各家连锁店在全面质量管理方面是否存在显著差异?(5)股票指数、消费者价格指数、恩格尔系数都是怎么来的?平均工资、平均房价是把数据罗列后的简单平均吗?

以上这些内容在本课程中都会一一介绍。

2.为什么选择电子表格作为实训软件

在统计学课程的教学中,编者也曾使用过专业统计软件,但对于非统计专业学生的教学效果并不理想。专业统计软件操作复杂,更重要的是学生未来的职业生涯中基本不会使用专业统计软件。许多上过本课程的学生进入职场后因为Excel用得好而大大提高了工作效率,解决问题的能力增强,纷纷建议在校的学弟、学妹加强Excel等电子表格的学习;笔者在日常的学习、科研甚至生活中也广泛运用Excel解决问题,效率的提高是显而易见的。

总之,电子表格(本书以Excel为例,绝大部分操作在WPS表格中也可实现)是职场中最常用的办公软件之一,简单易用,能基本满足日常统计数据的处理、分析与推断的需要,较专业统计软件更实用。

3.对学习者的建议

如何学习应用统计学,编者有以下几点建议。(1)弄清名词术语的含义。如果弄不明白相关名词术语的含义,应付完考试后很快就会忘记所学过的内容。(2)不要害怕公式,统计学中有的公式貌似复杂,其实主要运算方式还是加减乘除,只要仔细分析即可知其意义。除了考试需要的部分内容以外,大部分公式不必死记硬背,利用书上的例题、书后的习题加深对公式的理解即可,大部分公式在电子表格中有对应的函数,遇到时直接调用函数即可。(3)加强上机练习,熟练掌握使用电子表格进行统计运算的方法和技巧。人邮教育社区(www.ryjiaoyu.com)的本书页面内有实验所用的全套数据表格,注册后即可下载。至于电子表格软件版本则不太重要,无论是WPS表格还是Excel,只要是2000年之后的版本,都可满足学习本书的需要。(4)本书内“学习指引”“统计讲堂”等栏目中的一般性内容可供读者在学习中参考,有助于读者加深对所学知识的理解,对一些提高性的内容或建议,学有余力的读者可加以关注。(5)本书附录3中的二维码分别是两套自测试卷和答案、章后习题答案,可供读者自行检测学习效果。编者想提醒的是,无论是进行上机实验还是完成课后习题,结果都不重要,重要的是过程!

4.对教学的几点建议

经过多年探索,编者将课堂教学、上机实验学时的分配大体固定为2∶1,并鼓励学生课外自行增加上机练习机会。除正文中的例题和课后习题外,建议教师安排学生自主选题设计统计调查方案及组织实施计划,让学生独立进行实地调查、汇总数据,最终形成规范的调查报告,这样给学生带来的能力提升远非听课、做课后作业所能比拟,建议教师在教学中对此加以重视。

编者建议教师在教学中采用全面、全程考核模式。在本课程的学习过程中,统计调查方案设计、实地调查、数据汇总、调查报告撰写、软件操作、案例分析、统计方法的综合实验及统计学基本理论测试均应作为考核环节,这对提高学生学习兴趣,推动其掌握统计理论、方法及技能非常必要。

本书附录包括实验指导书和概率分布表生成方法;与本书配套使用的电子文件是“应用统计学实验用素材”和“上机测试题及答案”(可在人邮教育社区的本书页面内下载),“应用统计学实验用素材”资料包内含各章课件、各章相应的Excel操作内容及练习题。此外,还可在该页面内下载本书部分内容的视频讲解和文字案例、模拟试卷、习题答案、统计调查方案范例及评语等资料,这些资料的具体下载方式见更新勘误表和配套资料索取示意图。

5.期待与读者的交流

扫描更新勘误表和配套资料索取示意图中的二维码可看到本书“更新勘误及意见建议记录表”,其中有编辑邮箱,期待各位读者向我们反馈学习、教学中发现的本书及其配套资料中的问题、心得体会和意见、建议,我们会及时更新该表,以便使各位读者能看到其他读者的意见和建议。

第一章 绪论

【本章要点】

1.了解统计学的内涵和研究对象;

2.了解统计学产生与发展的历史;

3.了解统计学的应用与分科;

4.掌握统计学的基本概念。

【实验导引】

第一章~第四章的上机实验内容参见“附录1实验指导书”中实验二的概述部分,计划为8学时,建议上机实验与理论教学交叉进行,本书实验素材的电子文档可从人邮教育社区(www.ryjiaoyu.com)本书页面内下载(文件名中含“应用统计学实验用素材”)。本章上机实验主要练习电子表格(以Excel为例,亦可使用WPS表格)的常用操作,如工作表的移动、复制;单元格的选择;单元格格式设置;单元格的隐藏与显示;行、列、单元格的插入与删除;窗口的重排;绝对地址与相对地址的使用;序列的填充等。

房价同比上涨,环比下降,房价到底是在涨还是在降?“平均工资”不就是个平均数吗,为什么还会有工资“被平均”的说法?2017年中国产品抽样合格率近9成;全国第六次人口普查资料显示,全国男女出生性别比为118.06∶100;2014年中国国内生产总值(GDP)首次突破10万亿美元,2018年上半年国内生产总值已经超过6万亿美元,按可比价格计算,同比增长了6.8%;2017年中国居民消费价格指数(CPI)同比增长1.6%。这些数据是如何测算出来的,科学依据是什么?上述问题都将在本课程的学习中得以解决。学习指引在主流财经网站都可查到中国宏观经济数据,如新浪财经网站登录方式为“新浪财经→数据→经济数据→中国宏观经济数据”。

统计活动古已有之,现代意义上的统计最初应用在描述一个国家或地区各种形势资料上,随着经济的发展,统计开始应用于商务活动中。美国著名的统计学家休哈特(Walter A.Shewhart)对推动统计在商务中的应用作出了卓越的贡献,休哈特运用抽样调查方法发现军人的军衣、军鞋尺寸的分布近似于正态分布,根据该分布规律设计出的军衣和军鞋符合大多数军人的需要,从而解决了急用军需品的规格和尺寸的设计问题。

进入21世纪,统计在社会经济领域的应用越来越广泛,我们日常接触到的很多数据都来自专业的统计,人口普查、宏观经济监测与预测、企业质量管理、顾客行为分析、可持续发展与环境保护、新药开发、疾病监控等数据的收集、问题的发现、规律的探索及决策的制定都需要科学的统计方法。

对于非统计专业的读者,可以通过了解国内生产总值、存贷款基准利率、物价指数等数据变化,判断未来宏观经济走势,在买房还是租房、富余资金投资方向、大学毕业后选择什么行业等问题中作出更稳妥的决策;不仅如此,未来的工作中也会经常遇到平均数、增长率、调查和预测等很多统计知识,如果读者能掌握好基本的统计知识并能熟练掌握电子表格(Excel、WPS表格)的操作,则可以把工作做得更好、让自己的人生更精彩!

第一节 统计与统计学

一、什么是统计学

统计作为一种古老的社会实践活动,已在人类社会存续了数千年;而统计学作为这种社会实践活动的经验总结和理论概括,也有了300多年的历史。可以说,自从有了人类社会文明,就有了统计实践活动。无论是在人们的日常生活中还是在国家治理中,统计都作为一种重要的管理手段被广泛地重视,进而演变成一种系统的理论工具。

人们通常所说的“统计”,包括统计工作、统计资料和统计学。统计工作是人们对客观事物数量方面进行调查研究的认识活动,包括数据资料的收集、整理和分析等;统计资料是统计工作的直接结果,包括调查得到的经过整理具有信息价值的各种统计数据和分析报告;统计学则是一门收集、整理、描述、显示和分析统计数据的科学,是统计工作实践经验的理论概括,其目的是探索数据内在的数量规律性,是数据的科学。

与其他学科一样,统计学是随着人类社会的发展和社会管理的需要而发展起来的。伴随着人类社会由低级向高级演进,统计活动也逐渐变得复杂起来,仅仅用数字计量的简单统计活动已不能满足社会的需要,人们开始对客观现象进行定量分析,并不断地在数据的处理和分析中进行抽象、概括和总结,于是,就顺理成章地产生了统计学。

统计学家们给统计学(statistics)下了不同但相似的定义,《不列颠百科全书》将统计学定义为“一门收集、分析、表述和解释数据的科学”;《韦伯斯特国际辞典》对统计学的定义是“统计学是一门收集、分析、解释和提供数据的科学”;美国学者特里奥拉在他所著的《初级统计学》一书中指出,“统计学指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论”;我国学者贾俊平在其所编著的《统计学》(第2版)中给统计学下的定义是“统计学是收集、处理、分析、解释数据,并从数据中得出结论的科学”。上述关于统计学的概念有一个共同的特点,都与数据的解释与分析相关。总结上述定义,我们可以将统计学的定义概括如下。

定义 1.1 统计学,是一门研究大量社会现象和自然现象的总体数量,包括收集、整理和分析统计数据的方法论科学。

为了能对统计学的定义有一个更清楚的理解,我们将统计学归纳出如下几个特点。

1.数量性

统计学实际上是“信息提炼学”,它直接利用数学中研究好的计算方法研究如何去提炼出蕴藏于数据中的信息,自然首先具有数量性的特点。

2.总体性

统计学研究的是社会现象和自然现象的数量方面(指的是总体的数量方面)。从总体上研究社会现象和自然现象在数量方面的规律,是统计学区别于其他社会科学的一个重要特点。社会现象是各种社会规律相互作用的结果,它呈现出一种复杂多变的情景。统计学对社会现象总体数量方面的调查研究,用的是综合研究方法,而不是对单个事物的研究,但其研究过程是从个体到总体,即必须对大量的个体(这些个体都表现出一定的差别、差异)进行登记、整理和综合,使它过渡到总体的数量方面,从而把握社会现象的总规律、总水平及其变化发展的总趋势。比如,了解市场物价情况,统计着眼于整个物价指数(如居民消费价格指数)的变动,而不是某一种商品价格的变动,但物价统计必须从了解相关代表性商品的价格变动情况开始,然后经过一系列的统计工作,才能达到认识物价总体数量变动情况的目的。

3.具体性

统计学研究的数量方面是指社会现象和自然现象的具体数量,而不是抽象的数量关系,这是它不同于数学的重要特点。统计学与数学相比,有如下两点不同。首先,从研究对象上看,数学研究的是没有量纲或没有单位的抽象的数,而统计学研究的是有具体实例或有计量单位的数据。其次,统计学与数学研究中所使用的逻辑方法也是不同的,数学研究中使用的是纯粹的演绎,而统计学则是演绎与归纳相结合,占主导地位的是归纳。数学家可以坐在屋里,凭借聪明的大脑从假设命题出发,推导出漂亮的结果,而统计学家则要深入实际收集数据,并与具体的实际问题相结合,经过大量的归纳才能得出有用的结论。

4.指导性

统计学是一门研究大量社会现象和自然现象数量规律的方法论科学,所以统计学方法可以帮助其他学科探索内在的数量规律性,为人们的实践活动提供方法论依据,从而指导人们的实践活动。例如,美国季度国内生产总值增长率、月度通胀率或失业率一公布,马上会引起银根松紧、利率调整,甚至股价涨跌等一系列的连锁反应。不仅如此,这些数据往往能在几分钟内传遍全世界,一些国家不得不迅速作出相应的反应。统计数据对经济政策的影响和指导作用显而易见。

二、统计学的研究对象

统计学将大量社会现象和自然现象的总体数量作为研究对象,并提供一套历史的考察方法来分析和探索数量的内在规律性。我们可以通过以下几个具体的例子来说明统计学的研究对象。

对于人类的身高,人们通常认为,父母的身高越高,孩子的身高就会越高;反之,父母的身高越矮,孩子的身高就会越矮。统计学家费朗西斯·高尔顿(Francis Galton)发现了这是一个错误的认识!在他的生物统计实验室里,他收集了大量人类的身高数据,并对这些数据进行了分析。他发现,非常高的父亲,其儿子往往要比父亲矮一些;而非常矮的父亲,其儿子往往要比父亲高一些。似乎是某种神秘的力量,使得人类的身高从高矮两极移向所有人的平均值,这个现象被他称之为“向平均回归”(regression to the mean)。他将这一发现纳入了所构建的统计模型中,从而对人类身高进行了进一步研究。他指出,假设不发生这种向平均值的回归,那么从平均意义上看,高身材父亲的儿子将与他们的父亲一样也会很高,在这种情况下,一些儿子的身高必须高于他们的父亲,以抵消身材比父亲矮小者的影响,使平均值不变。高身材者儿子这一代人的儿子也将如此,那么会有一些后代身材更高。这个过程将一代一代传下去。同样地,矮身材父亲的儿子将与他们的父亲一样也会很矮,还有一些儿子身高会矮于他们的父亲,以抵消身材比父亲高的人的影响。这个过程一代一代传下去,将会有一些后代身材更加矮小。如此下去,不用多少代,人类种族就将由特别高和特别矮的两极构成。显然,上述的情形并没有发生,人类的身高在平均意义上趋向于保持稳定。

在现实生活中被人们饶有兴趣地观察的另一个例子是人类性别的结构。众所周知,一个家庭新生婴儿的性别是随机分布的。从表面上看,新生婴儿的性别比例似乎没什么规律可循。但如果对新生婴儿的性别进行大量观察统计,就会发现性别比例还是有规律可循的,即婴儿总数中男孩的数量要多于女孩,大致为每生育100个女孩,就会生育107个左右的男孩。这个107∶100的比例就是新生婴儿男女性别的数量规律性,古今中外大致相同,它是人类社会长期遗传与发展的结果。人类社会要延续、要发展,就要保持男女人数的大致相同。但从新生婴儿的性别比例来看,却出现了男女比例的失衡。这难道不违背人类永续生存的自然规律吗?统计学家们对这一现象进行了分析解释,他们认为,尽管从新生婴儿的数量来看,男性要高于女性,但男孩的死亡率高于女孩,到了中青年时,男女人数就大致相同了。进入中老年后,男性的死亡率仍然高于女性,导致男性的平均预期寿命比女性短,老年男性的数量要少于老年女性的数量。从一个国家乃至全人类看,如果没有人为的B超、堕胎等干扰,其规律是:婴幼儿时男性的数量略多于女性,中青年时男女人数大致相同,老年时女性的数量又略多于男性。这样既保证了人类在中青年结婚生育时性别比例的大致平衡,又使得在人口总数上男性与女性的数量也大体相当,有利于人类社会的进化和发展。统计学家往往通过对大量数据的分析,来挖掘数据现象背后的规律。

上面的两个例子说明,通过多次观察或实验得到大量的统计数据,我们利用统计方法是可以探索出其内在数量规律性的。客观事物本身的特点再加上科学设计的统计方法,使得我们能够在探索数据的规律方面不断前进。

从客观事物特点来说,任何客观事物都是必然性与偶然性的对立统一,同样,任何一个数据,也都是必然性与偶然性共同作用的结果。必然性反映了事物本质的特征和联系,是比较稳定的,因而它决定了事物的内在本质是有规律可循的;偶然性则反映了该事物每个表现形式的差异。如果客观事物只有必然性一个方面的特征,事物的表现形式会比较简单,我们可以比较容易地把握它的规律性。正是由于偶然性的存在,造成了事物的表现形式与必然性和规律性发生了偏移,从而形成了表面形式的千姿百态和数据表现形式的千差万别,这样,就导致了必然的数量规律性被掩盖在表面的差异之中。

前面所说的两个例子,个别家庭父母和子女的身高和每个新生婴儿的性别都是随机现象,其表现形式也是偶然性的,但每个例子本身可以通过对大量数据的收集整理和研究得出其内在的规律性。应用统计方法可以从偶然性中探索到内在的、本质的数量规律:从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。当然,如果事物本身的规律比较简单,所用的统计方法也就相对容易;如果事物本身的规律错综复杂,那么所用的统计方法也就相对复杂。而这些又都是统计学所重点关注的问题。思考实践统计学存在于我们身边许多客观事物中,你还能举出一些例子来说明统计学对人类生活的意义吗?

三、统计学的产生与发展

尽管统计活动在人类社会中已存续了数千年,但统计学作为一门独立的学科却只有300多年的历史。一般认为,统计学产生于17世纪中叶,其形成过程是从几个不同的领域开始的,在各自的领域又产生了许多不同的学派,如形成于德国的“国势学派”,形成于英国的“政治算术学派”,产生于19世纪中叶的“数理统计学派”“社会统计学派”等。然而,考察统计学产生的历史,无论是古典统计学、近代统计学,还是现代统计学,其发展过程都是沿袭两条主线展开的:其一是以“政治算术学派”为开端形成和发展起来的以社会经济问题为主要研究对象的社会经济统计;其二是以概率论的研究为开端并以概率论为基础形成和发展起来的数理统计。我们对统计学历史的考察就是围绕这两条主线展开的。

1.政治算术——社会经济统计

政治算术学派产生于17世纪中叶的英国,其主要代表人物是威廉·配第(William Petty,1623—1687)和约翰·格朗特(John Graunt,1620—1674)。

威廉·配第在其代表性著作《政治算术》(1676年)一书中,运用大量的数字资料和定量的研究方法对英国、法国、荷兰3国的经济实力进行了分析与比较,为统计学的产生奠定了基础。配第的这些开创性工作,得到了马克思的高度评价,马克思在《资本论》中评价配第“是政治经济学之父,在某种程度上也可以说是统计学的创始人”。

政治算术学派的另一个代表性人物是约翰·格朗特,他在1662年出版了《关于死亡表的自然观察与政治观察》。当时,伦敦瘟疫流行,死亡情况严重,引起了社会不安。他根据“死亡率公报”对伦敦人口的出生率、死亡率、性别比例作了分类计算和预测,证明没有悲观的必要。另外,在该书中,他通过大量的观察,研究并发现了人口与社会现象中重要的数量规律性。如新生婴儿的男女比例稳定在14∶13,即我们在前面的例子中谈到的107∶100,并解释了这一比例出现的原因。他得出了男性在各年龄组中死亡率均高于女性;男性新生婴儿的死亡率较高;一般疾病与事故的死亡率较稳定,而传染病的死亡率波动较大等很多富有启发性的结论。更为重要的是,约翰·格朗特在研究中运用多种方法对统计资料进行了间接的推算,并相互印证。由于约翰·格朗特的这些研究成果,该书被许多统计学家誉为“真正统计科学的肇端”。

政治算术学派的统计学家们基本上沿着威廉·配第开创的政治经济统计和约翰·格朗特开创的人口统计而展开进一步的研究。在经济统计方面,出现了农业统计、工商统计和物价指数计算方法的研究。在人口统计方面,由于对研究对象进行了扩展,出现了保险统计、卫生统计和医疗统计等分支。除此之外,人口调查、社会调查、道德统计等也逐渐发展起来。

19世纪中叶以后,包括政治统计、人口统计、经济统计、犯罪统计、道德统计、社会统计等多方面内容的“社会统计学”开始发展起来,与之相适应的社会调查与社会研究也有了较大的发展,并成为社会科学研究的重要方法之一。人们试图通过社会调查,收集、整理、分析资料,以揭示社会现象和问题,并提出解决问题的具体办法。例如,法国经济学家和社会改良家李·普莱(Le Play,1806—1882)曾利用“家庭预算表”来研究社会生活水平和贫困问题;德国统计学家恩斯特·恩格尔(Ernest Engel,1821—1896)在他的《比利时工人家庭的生活费》(1895年)一文中,提出了著名的“恩格尔法则”,即“家庭收入越多,则饮食消费支出在家庭收入中所占的百分比越少;家庭收入越少,则饮食支出在家庭收入中所占的百分比越大”。在这一法则的基础上,他又引申出至今仍得到人们广泛应用的“恩格尔系数”,用于衡量人们生活水平的高低。

与此同时,经济调查和经济统计学也迅速发展起来。比如,早在1835年挪威就与人口普查相结合从事农业统计调查;1839—1840年法国进行了第一次农业普查;1846年比利时进行了农业普查;1790年美国进行了第一次人口普查等。在这期间,美国、德国等还进行了工业普查。到了20世纪,这些调查活动日臻成熟。为满足国家和社会客观需要而进行的各种经济调查,不仅取得了大量的社会经济数据,为经济学家证实或提出新的经济理论提供了依据,也为统计学家概括和提出新的统计方法提供了数据材料。到了19世纪中叶,德国经济学家和统计学家克尼斯(K.G.A.Knies)在他的论文《独立科学的统计学》(1850年)中提出,统计学是一门独立的科学。可见,随着统计实践和学科门类的发展和分工,统计学作为一门对社会现象和自然现象进行数量对比分析的方法论科学,已为社会所公认。学习指引关于中国的人口普查数据,可在中华人民共和国国家统计局(以下称“国家统计局”)网站按以下路径查询:首页→统计数据→数据查询→普查数据。

此外,20世纪对国民收入的计算和研究、指数的编制及其方法研究、时间序列分析、经济预测和计量经济学等,也都取得了长足的进展。而这些成就,其思想渊源都可追溯到政治算术学派所开创的统计学的理论和方法,这为后来的社会经济统计的发展奠定了基础。

2.概率论——数理统计

统计学产生与发展的第二条主线是以概率论为基础形成和发展起来的以随机现象为主要研究对象的数理统计。

在西方,概率论的思想渊源最早可以追溯到意大利的文艺复兴时代,最初的研究是为赌徒们找出掷骰子取胜的一套办法,从而合理地算出成功的概率。这一时期的标志性著作是意大利数学家卡尔达诺(Kirolamo Cardano,1501—1576)编著的《论赌博》一书,他的研究成果为运用数学理论研究概率论开辟了道路。著名的天文学家伽利略·伽利雷(Galileo Galilei,1564—1642)写了一篇同样题目的论文,提出了概率论的基本原理,奠定了数理统计的基础。

几乎与政治算术学派的研究一致,概率论的真正研究历史是从17世纪中叶开始的,这一时期是古典统计学的黄金时代,其主要奠基人是法国的帕斯卡(B.Pascal,1623—1662)和费马特(P.Fermat,1606—1665)。他们将赌博中出现的具体问题归纳为一般的概率原理,为后来概率论和统计学的发展奠定了重要的基础。到了18世纪,积极研究概率论的还有瑞士数学家贝努里(J.Bernoulli,1654—1705),贝努里全面论述了概率论原理并将概率论建立在数学的基础上,在其所著的《推算法》一书中,提出了著名的“贝努里定理”,这是大数法则的早期形式。

古典统计时期的概率论基本上是独立发展的,它与社会经济统计没有太多的联系,但这一时期也有学者尝试着将概率论应用于社会现象的研究。到了19世纪,用概率论研究社会经济现象的人日益增多,在这方面作出重大贡献的是法国数学家拉普拉斯(P.S.Laplace,1749—1827)和比利时统计学家凯特勒(A.Quetelet,1796—1874)。拉普拉斯在其所著的《概率论分析》一书中,总结了前人的研究成果,并以大数法则为桥梁,将概率论与社会经济现象联系起来;凯特勒在发展和应用概率与统计方面作出了重要贡献,其著作主要有《概率论书简》和《社会物理学》等,其主要贡献是将自然科学的研究方法引进社会现象的研究中,他发展了大量观察法并为数理统计学的发展奠定了基础。

从19世纪中叶到20世纪中叶,概率论的进一步发展为数量统计学的形成和发展奠定了基础。英国生物学家和统计学家高尔顿(F.Galton,1822—1911)首次提出并阐述了“相关”的概念,并首次提出了“相关系数”的概念;英国数理统计学家卡尔·皮尔逊(K.Pearson,1857—1936)提出了计算复相关和偏相关的方法,并将复相关和回归理论扩展到许多领域。

20世纪初期,大工业的发展对产品质量检验问题提出了新的要求,即只抽取少量产品,作为样本对全部产品的质量好坏作出推断。因为对大批量产品要作全面的检验,既费时又费钱,加之对有些产品再作全部质量检验已不可能,数理统计学派的先驱、英国统计学家戈塞特(W.S.Gosset,1876—1937)建立了“小样本理论”,即所谓的“t分布”。通过这个理论,人们可以从大量的产品中只抽取较小的样本来完成对全部产品质量的检验和推断,这样就使统计学进入了现代统计学(主要是推断统计学)的新阶段。后来著名统计学家R.A.费希尔(R.A.Fisher,1890—1962)研究出了F统计量、极大似然估计、方差分析等方法。奈曼(J.Neyman,1894—1981)创立了区间估计理论,并和伊根·夏普·皮尔逊(E.S.Pearson,1857—1936)共同发展了假设检验理论。20世纪杰出的统计学家不胜枚举,正是他们的努力,推动了统计理论的发展和应用。到了20世纪中叶,现代统计学的基本框架已经确立。

从20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的新阶段。一方面,统计学受计算机科学、信息论、混沌理论、人工智能、大数据等现代科学技术的影响,新的研究领域不断出现,如多元统计分析、现代时间序列分析、贝叶斯统计、非参数统计、线性统计模型、探索性数据分析、数据挖掘等。另一方面,统计方法的应用领域也不断扩展,几乎所有的科学研究都离不开统计方法。因为无论是自然科学、工程技术、农学、医学、军事科学,还是社会科学,都离不开数据,对数据进行研究和分析就必然要用到统计方法,现在连纯文科领域的法律、历史、语言、文学、新闻等都越来越重视对统计数据的分析,国外的人文与社会学科普遍开设了统计学的课程,可见,统计学已经成为一门极其重要的基础性学科。学习指引推荐扫描二维码观看国家统计局制作的统计科普视频“漫话统计·统计的源流”,该视频既专业又浅显地介绍了统计的含义、统计在中国的产生和发展以及统计在世界范围内产生和发展的简史。

第二节 统计学的应用与分科

一、统计学的应用

统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。目前,随着定量研究的日趋重要,统计方法已被应用到自然科学和社会科学的众多领域,统计学也已发展成为由若干分支学科组成的科学体系。可以说,几乎所有的研究领域都要用到统计方法,比如日常生活、公司或企业的生产经营管理、政府部门和学术研究领域等。下面列出在不同领域中应用统计方法的一些例子。

1.生活中的统计学

我们在日常生活中,经常遇到与统计相关的问题,如果我们从统计学的角度看问题,就能更容易看清事物的本质。以我们生活中最为常见的彩票为例,人们购买彩票都想中大奖,希望能用2元钱获得500万元的大奖。殊不知,大家在抱着这样的心态购买彩票时,却很少理性地计算中奖的概率。以国内流行的体彩七星彩和福彩双色球为例,只要稍加计算,就能知道我们有多大的中奖概率。体彩七星彩的玩法如下:该类体育彩票每注由7位自然数组成,每一位数字都有07~9共10种变化,其排列组合共有10×10×10×10×10×10×10种,即10,也就是共有1000万注,中一等奖的概率是。而福彩双色球(33选6、16选1)中头奖的概率是显然,用2元钱博得500万元的大奖这样的小概率事件,在统计学中被认为是几乎不可能发生的事情。即便有的人实在受不住大奖的诱惑,也可以自己比较一下这两种彩票中奖的概率,理性地选择购买体彩七星彩,从而增加自己中奖的概率。

2.企业中的统计学

在企业的生产经营活动中,时时刻刻都在利用统计信息作为其行动的指南。充分有效的统计数据在企业了解市场供求状况、把握投资机会、选择投资方向、降低投资风险、调整产品结构、加快产品开发、制定发展战略、加强产品质量管理、进行财务分析以及进行市场前景预测等方面都有积极的作用。

下面以我国的影碟机市场为例来说明统计学在企业决策方面的指导作用。20世纪90年代末,我国影碟机市场已经进入了“微利时代”,影碟机厂商之间的竞争已达到白热化,影碟机厂商是要在这个微利市场继续经营,还是要改变投资方向选择退出呢?他们在作出决策之前会对这个市场进行详细的调研,考虑众多因素后再对其经营方向进行抉择。2000年蓝田市场研究公司对全国31个城市的影碟机市场中消费者未来两年购买影碟机的意向进行了抽样统计调查,调查样本家庭用户总计22429个。图1.1为2000年全国城市消费者两年内购买影碟机的意向。图1.1 2000年全国城市消费者两年内购买影碟机的意向

从图1.1中的统计数字可以看出,城市的影碟机市场发展空间有限,在所有被访家庭中,仅有14.4%的家庭在未来两年内有购买影碟机的意向,影碟机市场在城市的发展空间很小。这些信息为影碟机厂商经营决策提供了重要的参考。

3.军事中的统计学

统计在军事中也起着极为重要的作用。要打赢高技术条件下的局部战争,必须对有限的军需资源进行有效、合理的配置。完善成熟的三军联勤体制是使军需资源达到最优配置的制度保障,而要使这一体制得以正常运作,获得及时、准确、充分、翔实的军需资源统计信息就显得至关重要。比如,在瞬息万变的战场上,必须随时计算士兵的伤亡率、物资消耗率、给养食品利用率等各种指标,只有这样,指挥者才能实时监控战争动态,才能将有限的军需资源,如作战口粮、救生口粮等进行合理有效的配置。

4.政府中的统计学

对国家的宏观经济进行调控是现代政府部门治理国家的一项重要职能,宏观经济政策关系到一个国家经济的健康发展。而宏观经济政策的制定与实施的主要依据就是统计部门为政府提供的相关统计指标和数据,比如,国内生产总值(GDP)增长率、通货膨胀率、失业率等指标。政府相关部门根据这些数据进行宏观经济预警,进而采取有针对性的政策和措施,避免国家经济出现大起大落。

5.科学研究中的统计学

在统计学产生与发展的历史进程中,统计学广泛应用于各门学科的相关研究中,从自然科学、社会科学到人文科学,已成为科学研究必不可少的工具。下面举一个统计学在文学研究中应用的例子。

我国古代四大名著之一《红楼梦》的著作者一直存有争议。众所周知,《红楼梦》一书共计120回,自从胡适作《红楼梦考证》以来,一般认为前80回为曹雪芹所著,后40回由高鹗所续。尽管如此,红学界一直对这个问题争论不休,争论主要集中于后40回是否为高鹗一人所续。那么,怎样对这个争论进行一个客观的论证呢?统计学给我们提供了一个客观的方法。20世纪80年代,复旦大学的李贤平副教授和他的学生对这一争议从统计学的视角进行了新颖的注解。他们将《红楼梦》看成120个样本,然后确定与情节无关的47个虚词(之,其,或,亦,……;呀,吗,咧,罢,……;的,着,是,在,……;可,便,就,但,……,儿等)作为变量。我们知道,不同的作家由于写作特点和习惯的差异,在描述相似的情节时,所用的虚词是有差别的。李教授他们的创造性想法是将120回《红楼梦》看作120个样本,将与情节无关的虚词作为变量,将每一回中这些虚词出现的次数作为数据,然后利用多元统计分析中的聚类分析法对这120组数据进行分类,结果果然是两类,前80回一类,后40回一类,这就客观地证实了《红楼梦》不是出自一个人的手笔。他们进一步进行了分析,前80回是否为曹雪芹所写?他们找了一本曹雪芹的其他著作作类似分析,结果表明虚词用词手法一致,证明了《红楼梦》前80回确实出自曹雪芹之手。而《红楼梦》的后40回又是否为高鹗所写呢?论证结果推翻了后40回为高鹗一人所续的说法,而是曹雪芹亲友将其草稿整理而成,宝黛故事为一人所写,贾府衰败情景为另一人所写,等等。这个论证结果在红学界引起了很大的轰动,李教授用多元统计的方法解释了红学界争论多年的问题,使红学界大为赞叹,它从客观的文本入手,不带有任何主观色彩,可信度自然也很高。

我们所学的统计学就是这样一门应用性学科,它用于社会生活的方方面面。我们通过对它的学习,掌握基本的统计理论和方法,了解信息时代怎样收集信息,怎样对收集到的信息进行整理和分析,从中得出有价值的结论来。个人可以利用统计数据进行科学理财和作出更为理性的决策;企业可以利用统计数据来分析经营决策环境,研究供求状况,指导企业活动;政府部门可以利用统计数据和资料进行宏观经济调控,克服市场失灵,实现资源的优化配置。思考实践利用统计学知识解释《红楼梦》著作归属问题不禁令人赞叹,同学们不妨也对《红楼梦》中自己感兴趣的章节中的某些部分进行统计分析,说不定也有意外的发现。

二、统计学的分科

统计学在其他学科中的广泛应用使得统计学逐渐出现与其他学科交叉融合的趋势,比如,与生物学的交叉,形成生物统计学;与医学的交叉,形成卫生统计学;与人口学的交叉,形成人口统计学;与金融学的交叉,形成金融统计学;等等。统计学为多个学科提供了一种共同的数据分析方法,使学科的界限变得越来越模糊,进而逐渐发展成为若干分支学科组成的学科体系。大体来说,根据统计方法研究和应用的侧重点不同,我们可以将统计学分为理论统计学和应用统计学;根据统计方法的构成不同,也可以将统计学分为描述统计学和推断统计学。

1.理论统计学和应用统计学

理论统计学是以数学原理为核心的统计学,它主要研究统计学的一般理论和统计方法的数学理论。现代统计学的一个重要特点是充分利用了现有的数学理论成果,一般来说,从事统计理论和统计方法研究的人员需要具备坚实的数学基础,数学中的概率论是统计推断的理论基础。正因为如此,广义的统计学是包括概率论在内的。理论统计学是统计方法的理论基础,没有理论统计学的发展,统计学也不可能发展成为今天这样一个完善的科学学科体系。

与很多学科一样,在统计研究方面,从事理论统计学研究的人只占很少的比例,而大部分人的研究集中在统计学的应用领域。应用统计学就是如何运用统计学方法去解释和解决实际问题的学科。由于统计学是一门研究数量方面的方法论科学,无论是自然科学领域还是社会科学领域,都存在数量现象并需要通过统计数据来发掘其内在的规律,进而达到解决实际问题的目的,因此,统计方法的应用几乎拓展到所有科学研究领域。正如在前面阐述的那样,统计方法在金融学中的应用形成了金融统计学;在生物学中的应用形成了生物统计学;在医学中的应用形成了医疗卫生统计学;在农业试验、育种等方面的应用形成了农业统计学;等等。这些不同的分支学科所运用的基本统计方法和理论都是一样的,但由于各应用领域都有其特殊性,统计方法就在应用的时候又形成了一些不同的特点,对统计数据分析得出的结论还需要利用各专业学科的专业知识才能得到进一步的解释。

2.描述统计学和推断统计学

描述统计学(descriptive statistics)是研究如何收集反映客观现象的数据并通过图形、表格和概括性的数字对这些数据进行描述的统计方法,通过对统计数据进行加工、分组、编制统计表、绘制统计图以及计算平均数、方差等,从而综合与分析得出反映客观现象数量特征和数量关系的规律。对所收集的数据资料进行描述是统计分析的起点和基础性工作,其主要目的是使反映客观事物的统计数据可以一目了然、条理清晰,并能简洁地概括事物的根本特征。对统计数据的收集、整理与显示,以及数据分布特征的测度等内容,在本书后面的章节进行详细说明。例1.1通过绘制人数分布区间柱形图给出了描述统计学的一些基本特征。【例1.1】表1.1是20××级物流管理某班统计学的成绩表。根据这个成绩表,试对该班的统计学成绩按人数分布画出柱形图。

根据表1.1的数据,我们可以使用电子表格对该班统计学成绩进行简单的描述统计。本章只给出该班人数的分数分布区间,画出柱形图,从而对描述统计有一个大致的认识,关于描述统计的详细内容和分析步骤,在本书后面的章节中进行系统的介绍。

根据表1.2的分布区间,我们利用电子表格生成20××级物流管理某班统计学成绩人数分布柱形图,见图1.2。表1.1 20××级物流管理某班统计学成绩表表1.2 20××级物流管理某班统计学成绩人数分布表

推断统计学(inferential statistics)是研究如何根据抽样出来的样本数据去推断事物总体数量特征的方法,包括对总体进行估计、假设检验、预测等。它是在对样本数据进行描述统计的基础上,对统计总体的未知数量特征和规律作出概率形式的表述。例如,在财务的审计中,审计人员并非对所有发票进行一一审查,而是抽取一定数量的发票作为样本发票,然后根据样本发票推断全部发票出现错误的概率。又如,美国盖洛普(Gallup)调查公司在美国总统大选前通常会从全美国的选民中随机抽取l500人左右,调查这些选民的总统选举意向,盖洛普调查公司根据抽样调查的结果在允许有2%左右误差的条件下,对大选结果进行预测。这是两个利用样本信息推断事物总体特征的代表性例子。图1.2 20××级物流管理某班统计学成绩人数分布柱形图学习指引推荐扫描二维码观看国家统计局制作的统计科普视频“漫话统计·统计与生活”。该视频介绍了统计与我们生活的关系,用生活中的大量实例告诉我们为什么要学习统计学,一些常用统计指标该怎么理解,一些常见现象背后的统计学原理是什么等。

描述统计学和推断统计学几乎包含了现代统计学的全部内容。描述统计学是整个统计学的基础,统计学分析问题的出发点就是运用描述统计学所收集到的统计数据并提供有效的样本信息,推断出事物的总体数量特征是推断统计学的主要任务。需要指出的是,在现实问题的应用研究中,由于我们获得的数据主要是样本数据,因此,推断统计学在现代统计学中的地位和作用越来越重要,已成为统计学的核心内容。

第三节 统计学的基本概念

现代统计学概念众多,其中有一些概念是经常用到的,正确理解这些概念对以后各章的学习至关重要,因此有必要对其单独介绍,这些概念包括总体、样本、标志、指标、指标体系、参数、统计量和变量等。

一、总体和样本

定义 1.2 在同一性质基础上结合起来要研究的许多个别事物(数据)的集合被称为统计总体,简称总体(population)。

总体通常由所研究的一些个体组成。例如,要研究乡镇工业企业的数量特征,多个乡镇工业企业构成的集合就形成一个总体,因为每一个乡镇工业企业的经济职能是相同的(同一性质),即进行工业生产活动的基本单位。各个事物在某一点上的共同性(即同质性),是形成统计总体的必要条件,也是作为统计总体的一个重要特征。组成总体的每一个元素称为总体单位或个体。在乡镇工业企业总体中,每个乡镇工业企业是一个个体。

在统计学的研究中,确定总体的范围是开展研究工作的第一步。但总体范围的确定有时比较明确,而有时却比较困难。比如,要研究某省的乡镇工业企业的利润情况,这个省在册的乡镇工业企业构成的集合就是一个总体,每个乡镇工业企业就是一个个体,总体的范围很清楚。而对于某食品公司新推出的一种新口味食品,要想知道消费者是否喜欢,首先必须弄清楚哪些人是消费的对象,也就是要确定构成该口味食品的消费者这一总体。但在现实生活中,我们很难确定哪些消费者是这种新口味食品的潜在消费者,这个总体范围的确定就变得十分困难。在总体范围难以确定的情况下,可以根据研究的需要,重新定义总体,例如,上例中,我们可以通过定义消费者的年龄来缩小总体范围。

一个统计总体中所包括的单位数可以是无限的,称为无限总体;也可以是有限的,称为有限总体。例如,在科学实验中,每个实验数据可以看作一个总体中的一个元素,而实验则可以无限地进行下去,因此,由这些实验数据构成的总体就是一个无限总体。在现实的统计学研究中,统计总体大多数是有限的,例如,人口总数、企业总数、待检验的产品总数等,都是有限总体。

对无限总体和有限总体的划分,其主要目的是为了满足推断统计的需要。对无限总体而言,每次抽取一个单位,并不影响下一次的抽样结果,因此,每次抽取可以看作是独立的;对于有限总体来说,抽取一个单位后,总体元素就会减少一个,前一次的抽样结果会影响第二次的抽样结果,因此,每次抽样是不独立的。所以,对不同类型的总体进行抽样,抽样对推断结果的影响是不一样的。

定义 1.3 从总体中抽取的一部分元素的集合,称为样本(sample)。

定义 1.4 构成样本的元素的数目,称为样本容量(sample size),通常简称为样本量。

上面已经提到,从总体中抽取一部分元素作为样本,目的就是要根据样本提供的有关信息去推断总体的特征。比如,要测算新生产出来的1000台液晶显示器的平均寿命,可以从这1000台液晶显示器中随机抽取50台,这50台液晶显示器就构成了一个样本。然后,我们可以根据这50台液晶显示器的平均寿命去推断这1000台液晶显示器的平均寿命。

二、标志、指标和指标体系

(一)标志

定义 1.5 标志(characteristic),是表达总体单位或个体的特征、属性的名称。

例如,在研究某企业职工的构成状况时,该企业的职工就是一个总体单位,职工的性别、年龄、民族、工资收入等是每个职工个体所具有的标志。

标志按其表现形式可以分为品质标志和数量标志。品质标志是表明个体的特征或属性,一般用文字表述,不能用数值表示,如某职工的性别为“女”、民族为“汉族”,某产品的等级为“A”,这里的“女”“汉族”和“A”分别是品质标志“性别”“民族”和“产品等级”的属性,是这类品质的具体表现。品质标志主要作为统计分组的依据,数量标志是反映个体量的特征。数量标志可用数值具体表示,如某职工的年龄是30岁、工资收入是3000元,则“年龄”和“工资”是数量标志,而“30岁”和“3000元”是数值表示。数量标志除了用于统计分组以外,还可用于计算有关平均指标。(二)指标

定义 1.6 指标(index)是反映总体数量特征的概念。

指标是统计学中最重要的基本概念。在统计中,统计指标占据中心地位,许多统计方法都是围绕指标而产生的。例如人口数、职工人数、工农业总产值、国内生产总值、商品销售额、劳动生产率、失业率等。统计指标通常有三个要素,即指标名称、计量单位和计算方法。需要特殊说明的是,统计指标的含义有时还包括具体数值,比如,2008年按支出法核算的我国国内生产总值(GDP)总额为306859.8亿元,其中货物和服务净出口额为244134.9亿元。这些都是统计指标,按照这种理解,统计指标除包括上面三个要素之外,还包括时间限制、空间限制和指标数值三个要素。这六个要素可以归纳为两个组成部分,一是统计指标概念,二是统计指标数值。

1.指标的主要特点

指标主要有以下三个特点。(1)数量性。指标反映的是客观现象的量,而且是一定可以用数字表示的,不存在不能用数字表示的统计指标,即使是不包括数值的统计指标也具有这个特点。客观现象必须是可以度量的,才能够用数字表示它。(2)综合性。统计指标说明的对象是总体而不是个体,它是许多个体现象数量综合的结果。一个人的年龄、一个人的工资等都不叫作统计指标,而许多人的平均年龄,许多人的工资总额和平均工资才是统计指标,个体现象的数量综合成为统计指标有一个前提条件,就是这些个体在性质上必须是同类的,把性质不同类的现象综合成统计指标会歪曲人们对客观现象的认识。(3)具体性。统计指标不是抽象的概念和数字,它是具体的社会现象和自然现象量的反映。不存在脱离了质的内容的统计指标。

2.指标的分类

指标从不同的角度可划分为不同的种类。

指标按其所说明的总体现象内容的特征,可分为数量指标和质量指标。①数量指标亦称外延指标,是反映社会经济现象发展总规模、总水平或工作总量的统计指标。如全国人口数量、国内生产总值等;②质量指标亦称内含指标,它是反映总体内部的结构、比例和水平等数量关系的,如第三产业在国内生产总值的比重、城镇居民平均每人可支配的生活费收入等。

指标按其表现形式,可分为总量指标、相对指标和平均指标。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载