2018年应用统计硕士(MAS)考试专用教材(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-04 09:51:52

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

2018年应用统计硕士(MAS)考试专用教材

2018年应用统计硕士(MAS)考试专用教材试读:

第一部分 应用统计硕士考试大纲解读及全国各院校考研真题比较分析

《统计学》是全日制应用统计硕士(MAS)专业学位研究生入学考试科目之一,总分为150分。

考试要求是测试考生对于与分析有用的统计数据搜集整理和分析应用相关的基本概念、基础知识、主要方法的掌握情况和运用能力。

本部分通过解读《统计学》考试科目命题指导意见、重点院校《统计学》命题规律及比较分析全国各院校考研真题,引导考生了解宏观备考方向,并为考生提供具体可行的备考方案,使考生成功迈出《统计学》备考的第一步。

第一章 《统计学》考试科目命题指导意见解读

应用统计专业学位研究生入学统一考试专业课程考试的考试科目为《统计学》,包括统计学、概率论两部分内容,主要要求考生掌握数据收集和处理的基本方法、数据分析的基本原理和方法、基本的概率论知识以及运用统计方法分析数据和解释数据的基本能力。

一、考试性质

统计学是全国应用统计硕士入学初试考试的专业基础课程。

二、考查目标

全国硕士研究生入学统一考试应用统计硕士专业学位《统计学》考试是为高等院校和科研院所招收应用统计硕士生而设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以利用选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据处收集、处理和分析的一些基本统计方法。

具体来说,要求考生:

1.掌握数据收集和处理的基本分方法;

2.掌握数据分析的金发原理和方法;

3.掌握了基本的概率论知识;

4.具有运用统计方法分析数据和解释数据的基本能力。

三、考查内容(一)统计学

1.调查的组织和实施;

2.概率抽样与非概率抽样;

3.数据的预处理;

4.用图表展示定性数据;

5.用图表展示定量数据;

6.用统计量描述数据的水平:平均数、中位数、分位数和众数;

7.用统计量描述数据的差异:极差、标准差、样本方差;

8.参数估计的基本原理;

9.一个总体和两个总体参数的区间估计;

10.样本量的确定;

11.假设检验的基本原理;

12.一个总体和两个总体参数的检验;

13.方差分析的基本原理;

14.单因子和双因子方差分析的实现和结果解释;

15.变量间的关系;相关关系和函数关系的差别;

16.一元线性回归的估计和检验;

17.用残差检验模型的假定;

18.多元线性回归模型;

19.多元线性回归的拟合优度和显著性检验;

20.多重共线性现象;

21.时间序列的组成要素;

22.时间序列的预测方法。(二)概率论

1.事件及关系和运算;

2.事件的概率;

3.条件概率和全概率公式;

4.随机变量的定义;

5.离散型随机变量的分布列和分布函数;离散型均匀分布、二项分布和泊松分布;

6.连续型随机变量的概率密度函数和分布函数;均匀分布、正态分布和指数分布;

7.随机变量的期望与方差;

8.随机变量函数的期望与方差。

四、考试方式与分值

本科目满分150分,考试时间180分钟。由各培养单位自行命题,全国统一考试。答题方式为闭卷、笔试。允许使用计算器(仅仅具备四则运算和开方运算功能的计算器),但不得使用带有公式和文本存储功能的计算器。

说明:命题指导意见指出《统计学》考试包括统计学和概率论两部分内容。但是,命题指导意见仅供各培养单位自行命题时作为参考,各培养单位可适当调整。一般院校,如中央财经大学、中国人民大学、上海财经大学等,不给出参考书目,仅注明参考指定大纲。有的院校会在考试大纲的基础上提供具体的参考书目,例如东北大学、华中科技大学等。考生在确定目标院校之后,务必要弄清楚目标院校的大纲及考试内容,合理安排自己的复习内容及进度。

第二章 参考教材、教辅、课程和题库说明

一、参考教材

应用统计硕士考试只有一个命题指导意见(仅供各院校参考,各培养单位自行命题),没有指定统一的参考教材,但是在分析命题指导意见的具体考查内容并对比大量的教材和各院校历年考研真题后,发现各院校考题与下述教材的内容最为相近。因此,我们推荐《统计学》考试的参考教材为:

1.《统计学》(贾俊平等编,中国人民大学出版社)

2.《统计学》(袁卫等编,高等教育出版社)

3.《概率论与数理统计》(盛骤等编,高等教育出版社)

4.《概率论与数理统计教程》(茆诗松等编,高等教育出版社)

注意:命题指导意见规定的考试内容基本与这四本教材的内容相同,并且偏向于基本概念与基本理论的考查。大多数院校较少涉及比较难的内容。统计学部分侧重贾俊平老师的《统计学》,因为这一本书涵盖了统计学所有的知识,另外课后习题要好好做做,争取每道题都弄明白,因为部分院校统计硕士考研真题就是把课后题直接综合起来出题。概率论部分建议茆诗松老师的《概率论与数理统计教程》,有些院校注重数学基础,比如上海财经大学、南开大学、华中科技大学等学校统计硕士入学考试出的题中概率论占的比重较大,大概各占50%,建议报这些学校的考生在以后的备考中需要加以重视。因此,建议考生在备考的时候,如果目标院校只是使用该命题指导意见作为考试大纲,最好参考上述四本教材,有针对性的来做大量的练习。

二、教辅、课程和题库(一)参考教辅(圣才考研网主编,中国石化出版社)

1.应用统计硕士(MAS)考试专用教材

2.应用统计硕士(MAS)考试过关必做习题集(含名校考研真题详解)

说明:这两本教辅是精华本,需要好好复习。对于时间充裕的学员来说,推荐反复做一下后一本教辅中的名校历年考研真题!(二)课程和题库

人大、中财、厦大、上财、东财等院校应用统计硕士考试辅导课程和题库:

更多关于各个高校应用统计硕士的辅导方案【保过班、网授班、3D电子书、3D题库等】,详情登录www.100xuexi.com(圣才考研网)。

第三章 重点院校《统计学》命题规律及考研真题比较分析

通过分析全国重点院校《统计学》考研真题,可以看出不同院校的考研真题有着相似的命题规律,但同时又存在一定的差异。

一、重点院校《统计学》考研真题的命题规律(一)参数估计、假设检验、方差分析、线性回归的概念及其应用是重点考查内容

参数估计、假设检验、方差分析、线性回归理论是应用统计专业最基础的知识。常考的知识点主要包括评价估计量的标准、极大似然估计、区间估计、假设检验、方差分析、线性回归的概念及其应用等。一般较多出现在简答题和计算与分析题中,所占分值比重较大,而在选择题中多为概念题型。例如:

1.【简答题】什么是区间估计,如何理解置信区间与参数真值间的关系?[山东大学2016应用统计硕士]

2.【简答题】简述假设检验中的两类错误,两类错误之间存在什么关系?[浙江工商大学2016应用统计硕士]

3.【简答题】假设检验基本思想及步骤。[东北财经大学2017应用统计硕士]

4.【简答题】简述评估计量的标准[上海海事大学2015应用统计硕士]

5.【简答题】给出参数估计量的无偏性和有效性定义。[厦门大学2013应用统计硕士]

6.【计算与分析题】对某地区居民家庭月平均生活费用进行抽样调查,样本容量为400户,其中有80户为贫困户,样本平均数为1250元,标准差为140元。以95%的置信度推断(已知Z=1.96):0.025(1)该地区居民家庭月平均生活费用的置信区间(保留2位小数)。(2)若贫困率定义为贫困户占总户数的比重,试给出贫困率的置信区间(保留2位小数)。(3)要使月平均生活费用的最大容许误差不超过10元,则至少应抽多少户做样本。[中央财经大学2015应用统计硕士]

7.【单项选择题】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或者更极端的概率称为(  )。[山东大学2016应用统计硕士]

A.临界值

B.统计量

C.P值

D.实际显著性水平

8.【简答题】以总体均值来举例说明双侧检验与单侧检验拒绝域的不同。[西安交通大学2015应用统计硕士]

9.【简答题】单因素方差分析基本思想和方式。[南京大学2015、2011应用统计硕士]

10.【计算与分析题】设有五种治疗荨麻疹的药,要比较它们的疗效,假定将30个病人分成5组,每组6人,令同组病人使用同一种药,并记录下病人从服药开始到痊愈所需天数。这里药物是因子,有五个水平,用单因子方差分析法得方差分析表为:(1)给出原(零)假设,填补表中空缺数值;(2)给出F的表示式,说明F值与假设检验的关系;(3)就本题解释P表示什么事件的概率,P值大小反映了什么?[武汉大学2015应用统计硕士]

11.【简答题】简述多元线性回归模型中存在高度多重共线性的后果,常用的检验方法以及补救办法。[中央财经大学2015应用统计硕士]

12.【计算与分析题】某商业企业2008~2012年五年内商品销售额的年平均值为421万元,标准差为30.07万元;商业利润的年平均数为113万元,标准差为15.41万元。五年内销售额与商业利润的乘积和为240170万元,各年销售额的平方和为890725万元,各年商业利润的平方和为65033万元,试就以上资料计算:(1)商业销售额与商业利润的样本相关系数并解释其含义。(2)假设商业销售额与商业利润之间存在线性相关关系。当商品销售额为600万元时,试估计商业利润为多少万元?[山东大学2015应用统计硕士]

复习建议:

这类考题都具有一个相同的命题思路:围绕参数估计、假设检验、方差分析、线性回归的基本理论,考查考生对基本理论的灵活掌握和应用程度。

对于这类考题,考生要熟练掌握参数估计、假设检验、方差分析、线性回归的基本理论,仔细看教材的经典例题,对其作适当的归纳、分析和总结,并且辅之以一定量的练习。(二)注重统计学中各知识点概念的考查

无论是主观题还是客观题,关于统计学中各知识点概念的理解及其运用都是考核的重要内容,比如调查的各种组织方式,就是考察考生对各种调查组织方式的定义、适用场合情况及其作用的理解程度。例如:

1.【单项选择题】下面那种调查方式的样本不是随机选取的?(  )[山东大学2016应用统计硕士]

A.分层抽样

B.系统抽样

C.整群抽样

D.判断抽样

2.【单项选择题】统计分组中的组内同质性是指改组内个体(  )。[浙江工商大学2016应用统计硕士]

A.在某一标志上具有相同性质

B.在所有标志上具有相同性质

C.在一些标志上具有相同性质

D.在某一标志或某些标志上具有相同性质

3.【单项选择题】抽样误差(  )。[中央财经大学2015应用统计硕士]

A.既可以避免,也可以控制

B.既不可以避免,也不可以控制

C.可以避免,但不可以控制

D.不能避免,但可以控制

4.【单项选择题】单位产品原材料消耗是(  )。[四川大学2014应用统计硕士]

A.数量指标

B.平均指标

C.质量指标

D.逆指标

5.【简答题】简述概率抽样的特点。[山东大学2015应用统计硕士]

6.【简答题】离散趋势的指标有哪些?[西安交通大学2015应用统计硕士]

7.【简答题】简述统计总体和总体单位及其关系。[华中农业大学2015应用统计硕士]

复习建议:

这类考题都具有一个相同的命题思路:考察的都是对统计学中各知识点概念的理解及其运用。

考生在学习统计学的时候,要牢记各知识点的定义、适用范围及其作用,并且辅之以一定量的练习,加强理解,有个全面和细致的掌握。(三)概率论中条件概率、随机变量及其分布、期望和方差是重点考查内容

条件概率多以计算形式题型出现,考察考生的主要是条件概率的两大经典公式:全概率公式和贝叶斯公式。随机变量及其分布、期望和方差多以选择题型出现,有时也出现在计算题中。例如:

1.【单项选择题】设当事件A,B同时发生时,事件C必然发生,则有(  )。[山东大学2016应用统计硕士]

A.P(C)≤P(A)+P(B)-1

B.P(C)≥P(A)+P(B)-1

C.P(C)=P(AB)

D.P(C)=P(A∪B)

2.【单项选择题】如果,则事件A与B必定(  )。[山东大学2016应用统计硕士]

A.独立

B.不独立

C.相容

D.不相容

3.【单项选择题】设随机变量X和Y独立同分布,其分布为正态分布,则分布为(  )。[中国科学技术大学2013应用统计硕士]

A.自由度为1,1的F分布

B.自由度1,2的F分布

C.自由度为2,1的F分布

D.自由度2,2的F分布

4.【计算与分析题】设随机变量X具有概率密度f(x)(-∞<X2x<∞),求Y=X的概率密度f(y)。[山东大学2015应用统计硕士]Y

5.【简答题】简述乘法公式和全概率公式。[南京大学2015应用统计硕士,山东大学2015应用统计硕士]

6.【计算与分析题】一商场销售的某种产品来自甲、乙、丙三家工厂,分别占总量的25%、35%和40%,若三家工厂所生产产品的次品率依次为5%、4%和2%,现从混合后的产品中任取一件,试求:(1)所取产品为次品的概率;(2)若取到的为次品,分别求它来自甲厂、乙厂和丙厂的概率。[华中农业大学2015应用统计硕士]

复习建议:

这类考题都具有一个相同的命题思路:考察考生对条件概率、随机变量及其分布、期望和方差的概念理解程度以及基本的运算能力。

对于这类考题,考生要熟练掌握条件概率、随机变量及其分布、期望和方差的基本理论及其计算公式,仔细阅读教材的经典例题,并且辅之以一定量的练习。(四)各院校所出考题相似度很高

通过查看相关院校历年考研真题,发现各院校所出考题相似度很高,甚至完全类同。例如:

1.【简答题】简述假设检验中的两类错误,两类错误之间存在什么关系?[浙江工商大学2016应用统计硕士]

2.【简答题】简述假设检验中的两类错误及两者的关系。[山东大学2015应用统计硕士]

3.【简答题】假设检验中的两类错误是什么?他们之间有何关系?[上海海事大学2015应用统计硕士,厦门大学2014应用统计硕士,华中师范大学2014应用统计硕士]

4.【简答题】假设检验中Ⅰ型错误与Ⅱ型错误有何区别与联系?了解这两类错误有何实际意义?[江西财经大学2015应用统计硕士]

5.【简答题】简述假设检验中存在的两类错误。[浙江工商大学2012应用统计硕士]

6.【简答题】假设检验的第Ⅰ类错误和第Ⅱ类错误分别是指什么?[江苏大学2012应用统计硕士]

7.【简答题】什么是拒真错误?什么是采伪错误?犯拒真错误的概率与犯采伪错误的概率有何联系与区别?[东北财经大学2012应用统计硕士]

8.【简答题】什么是假设检验的第一和第二类错误?[首都师范大学2012应用统计硕士]

复习建议:

大家会发现前四道考题、后两道考题分别非常相似。当然,通过查看相关院校历年真题,发现类似这样相似的考题非常多,甚至还出现过两所院校一模一样的考题。研究这些相似度非常高的考题,会发现这些考题都是非常重要的考点。因此,考生在复习备课过程中,要重点留意这些重要的考点,做到有的放矢的复习。

建议考生复习备考过程中一定要认真研究分析历年真题,其中包括其他水平相当院校的历年真题。这也是圣才考研网编辑出版《应用统计硕士(MAS)考试过关必做习题集(含名校考研真题详解)》的原由,将各高校历年真题按照章节、题型予以分类、详解,其目的就在于方便考生复习备考。

二、重点院校《统计学》考研真题的差异(一)同一院校历年试题的题型、题量和分值会有差异《统计学》科目是院校自主命题,没有统一规定的考试大纲,因此,大多数院校在命题方面呈现出很强的灵活性。尤其是当题型和分值等发生较大变动时,考生对此一定要引起注意,用心揣摩出题者的命题思路,并有针对性的复习备考。需要说明的是,考生不要把最新一年的考试题型作为惟一的参考依据,以前考过的题型或未考到的题型均有可能出现。

例如,东北财经大学2013年B卷真题的题型、题量和分值为:单项选择题(共10题,20分)、多项选择题(共5题,15分)、判断题(共5题,15分)、简答题(共5题,50分)、计算题(共5题,50分);2014年C卷真题的题型、题量和分值为:概念题(共5题,10分)、填空题(共5题,5分)、单项选择题(共5题,10分)、多项选择题(共5题,10分)、简述题(共3题,50分)、计算题(共5题,65分)。(二)不同院校的试题在题型、题量和分值、考试内容等方面存在差异

1.题型、题量和分值不同《统计学》的考试题型主要有:单项选择题、简答题、填空题、证明题、计算与分析题等几大题型。

不同的院校题型是不相同的,分值分布也不同。例如,2015年中山大学432统计学试题一共有两种题型,分别为单项选择题(60分)、计算与证明题(90分);2014年中央财经大学432统计学试题一共有四种题型,分别为单项选择题(30分)、多项选择题(10分)、简答题(32分)、计算与分析题(78分);2014年中国科学技术大学432统计学试题一共有两种题型,分别为计算和简述题(70分)、计算题(80分);2013年上海财经大学432统计学试题一共有三种题型,分别为单项选择题(60分)、简答题(40分)、计算题(50分)。

考生在确定报考院校之后,要了解该院校历年真题的题型,针对不同的题型进行相应的练习。不同题型的复习策略方法是不同的,比如针对同一个概念,可能出现选择题和解答题。选择题只要求考生在已经给出的选项中,选出正确的答案,相对比较简单;对于简答题,考生必须对相对的概念做到熟练掌握,比如它的定义、适用范围、作用等。

当然,不管题型、题量和分值怎么变化,但万变不离其宗,解题水平的提高建立在对知识点的熟练掌握基础之上。因此,各种考试题型的训练是必不可少的,要掌握相应的解题思路和答题方法。

2.考试内容不同

对于考试内容,本部分的第一章做了简要的介绍。相对来说,各院校都依照《统计学》考试科目命题指导意见来命题,较少出现超纲题。在这里,我们主要针对各校的历年真题分析出题的侧重点。每个院校有各自的特点,命题老师的出题风格也不同。因此,建议考生在复习备考过程中,要认真研究所报院校历年真题,通过对历年真题的研究掌握命题规律和出题风格。

比如说,中央财经大学、中山大学、浙江工商大学和安徽财经大学的432统计学试题涉及范围较广且考点细腻,题型较为多样,且比较注重方差分析、一元线性回归的计算分析,题目都是偏于应用型;简答题多为概念性的题,如P值、假设检验中的两类错误、假设检验的步骤、抽样误差、相关系数、判定系数等等诸如此类的概念性考题需要考生很扎实的基础知识。

3.出题风格和难度不同

每个学校都有自己的出题风格,有的学校重理论,有的学校偏应用,还有的学校题目多为理论联系实际。一般认为第三类的题目相对更灵活,难度更大,要求考生能够运用统计学的理论知识去解决实际生活中遇到的问题。

一般来说,名校考题相对来说“活”一些,更注重考察考生的分析能力;普通院校考题相对基础一些,更注重考察考生的基础水平,概念性考题较多。另外,不要好高骛远,考生要结合自身实际情况来确定所报院校和专业,备考过程中灵活地根据相关情况予以调整。

总的来看,各院校的历年试题之间和不同院校的试题之间在基础知识和能力要求、知识点考查的范围等方面都存在差异。考生可以根据个人的实际情况选择不同院校。但是,《统计学》归根结底是考查考生对基本知识的掌握程度以及应用能力。在对基本概念和重要理论熟练掌握后,多做一些重点院校的历年考研真题,弥补复习广度和深度的不足,提高《统计学》的综合应试能力。

第二部分 统计学

第一章 统计数据的搜集

第一节 统计调查概述

一、统计学的概念

统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。数据分析所用的方法可分为描述统计方法和推断统计方法。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。

例1:研究如何利用样本数据来推断总体特征的统计学方法是(  )。

A.描述统计

B.理论统计

C.推断统计

D.应用统计【答案】C

二、统计数据搜集的方式

统计数据的搜集是根据统计研究预定的目的和任务,运用科学的调查方法与手段,有计划、有组织地向客观实际采集数据的过程。从统计工作过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段。

1.直接向调查对象搜集反映调查单位的统计资料(一般称为原始资料),这种方式通常称为统计调查;

2.根据研究的目的,搜集已经加工、整理过的、说明总体现象的资料(一般称为次级资料)。

例2:下列各项中,属于二手统计资料的主要来源的是(  )。

A.网络调查

B.统计调查

C.统计年鉴

D.直接观察【答案】C

三、统计调查的方式和方法

1.统计调查的方式

按照搜集资料的组织方式不同,分为专门调查和统计报表两种。(1)专门调查

专门调查是指为了某些特定目的而专门进行的调查。这种调查多属一次性调查,一般有普查、重点调查、抽样调查和典型调查四种。

①普查

普查是专门组织的一种全面性调查。它主要是用来调查不能或不宜用定期全面的调查报表来搜集的统计资料,来搞清国情、国力。它的主要特点有:第一,它是非经常性的调查,一般间隔较长时间才进行一次;第二,它是一种全面调查,比任何一种调查形式更能掌握大量、详细、全面的统计资料及数据。

普查的组织形式有两种:

第一种,通过组织普查机构,配备一定数量的普查人员,对调查单位直接进行登记调查;

第二种,利用调查单位的原始记录和核算资料,结合清库盘点,由调查单位自行填报调查表格。

在组织普查工作中需注意:一是规定统一的标准时点;二是确定统一的普查期限;三是规定普查的项目和指标。

②重点调查

重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查。

重点单位的选择主要着眼于现象的量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。

其适用范围是当调查任务只要求掌握调查对象的基本情况,而部分单位又能比较集中地反映研究的项目,即有重点单位的存在,此时采用重点调查比较适宜。

③抽样调查

a.抽样调查的含义

抽样调查是一种非全面调查,它包括概率抽样和非概率抽样。概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查总体的数量特征;非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

b.抽样调查的特点

第一,样本单位按随机原则抽取,排除了主观因素对选样的影响,保证每个单位有相等的机会被抽取;

第二,用所调查样本的实际资料对调查总体的数量特征做出估计;

第三,抽样误差可以事先计算并加以控制。

c.抽样调查的适用范围

第一,对一些不可能或不必要进行全面调查的社会现象,采用抽样调查;

第二,对普查资料进行必要的修正。

由于普查涉及面广,工作量大,容易产生登记误差,即出现重复登记或遗漏现象。通常,可以在普查之后,作一次小规模的抽样调查,将抽样调查的结果同原来的普查资料进行核对,计算出差错(重复或遗漏)比率,然后以此作为修订系数,对普查资料进行必要的修正。

d.抽样调查应遵循的原则

第一,随机原则,就是要使所有调查单位都有同样的被抽取的概率;

第二,最大抽样效果原则,就是在既定的调查费用下使抽样估计的误差最小,或者是在给定的精确度下,使调查费用最少。

④典型调查

它是一种专门组织的非全面调查,是根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。

专门调查的内容总结如表1-1所示。

表1-1  专门调查分类(2)统计报表

统计报表是按国家有关法规的规定,自上而下地统一布置,逐级提供统计资料的一种统计调查方式。

统计报表的分类有:

①全面和非全面统计报表(按调查范围不同分类)

全面统计报表要求调查对象中的每一个单位都要填报;非全面统计报表只要求调查对象中的一部分单位填报,它需要结合重点调查、典型调查和抽样调查来应用。

②国家统计报表、部门统计报表和地方统计报表(按报表内容和实施范围不同分类)

国家统计报表也称国民经济基本统计报表,由国家统计部门统一制发,用以反映全国性的经济和社会基本情况的统计资料。

部门统计报表是为了适应本部门业务管理需要而制定的专业统计报表,在本系统内实行,用以搜集有关部门的业务技术资料。

地方统计报表是针对地区特点而补充规定的地区性统计报表,它是为本地区的计划和管理服务的。

③日报、旬报、月报、季报、半年报和年报(按报送周期长短分类)

④基层统计报表和综合统计报表(按填报单位的不同分类)

基层统计报表即由基层企事业单位填报的报表;综合统计报表是由主管部门或统计部门根据基层报表逐级汇总填报的报表。

例3:某地为推广先进企业的生产经营管理经验,对效益最好的几个企业进行调查,此种调查属于(  )。

A.重点调查

B.典型调查

C.普查

D.抽样调查【答案】B

例4:下列各项中,属于重点调查的是(  )。

A.对全国几大石油企业进行调查,并借此了解全国石油生产的基本情况

B.对商业企业的库存情况进行普查

C.了解一批炮弹的杀伤力

D.抽选一部分单位对已有的资料进行复查【答案】A

2.统计调查的方法(1)直接观察法

直接观察法是指调查人员到现场对调查对象进行观察、计量和登记以取得资料的方法。优点在于能够直接取得第一手资料,并能够保证资料的准确性。缺点是需要大量的人力、物力和财力及较长的时间,并且受一定条件的限制。(2)报告法

报告法是指报告单位以各种原始记录和核算资料为依据,向有关单位提供统计资料的方法。(3)采访法

采访法是指调查员和应答者之间用对话方式进行调查的方法。

①优点

第一,应答率比较高,一般在80%以上;

第二,调查员可以设法确保应答者独立回答问题,而且可以做到没有任何第三者在场的情况下完成调查;

第三,调查员可以直接观察、记录被调查者的态度等非语言性的资料,并且对应答者的诚实程度作出评估;

第四,可以使用复杂的调查表,并且能保证应答者答案的完整性和保证所有的问题均得到回答。

②缺点

第一,采访调查的费用高;

第二,在采访调查中,误差来自应答者和调查员双方,而这种误差往往由偏见引起;

第三,调查时间长;

第四,应答者情绪受干扰时不易被调整;

第五,匿名保证较差。(4)邮寄调查法

邮寄调查法是通过邮政系统分发和收回调查表的调查方法。

①优点

第一,调查的费用低;

第二,可以在很大的地域范围内进行;

第三,调查所花费的时间较短;

第四,在进行敏感性问题的调查中,运用邮寄调查法可以得到比较可行的资料;

第五,可避免调查员的偏见。

②缺点

第一,应答率低;

第二,邮寄调查所得到的是一种一次性的结果,如果应答者有含糊不清等情况则无法补救;

第三,调查环境无法控制,研究者不知道应答者是否和别人讨论后才形成答案,无法知道应答者是否独立完成调查,是否有一部分甚至全部问卷都由别人代答;

第四,研究者没有机会增补应答者在回答问题时的非语言性资料。

第二节 抽样调查

一、概率抽样

概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

1.特点(1)抽样时是按一定的概率以随机原则抽取样本。

所谓随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。(2)每个单位被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行估计时,不仅要考虑样本的标志量,还要考虑到每个样本单位被抽中的概率。

概率抽样与等概率抽样的区别:概率抽样是指总体中的每个单位都有一定的非零概率被抽中,单位之间被抽中的概率可以相等,也可以不等。若单位之间被抽中的概率相等,则称为等概率抽样;若不等,则称为不等概率抽样。

概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。从另一个方面讲,也可以按照要求的精确度,计算必要的样本单位数目。

2.概率抽样方式的类型(1)简单随机抽样

抽样框通常包括所有总体单位的信息,不仅提供了备选单位的名单以供抽选,还是计算各个单位入样概率的依据。

简单随机抽样:从包括N个总体单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位入样的概率是相等的。

简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。其突出特点是简单、直观。但是在实际应用中也有一些局限:

第一,它要求包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;

第二,根据这种方法抽出的单位很分散,给实施调查增加了困难;

第三,没有利用其他辅助信息以提高估计的效率。(2)分层抽样

将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。

优点:

第一,保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度;

第二,在一定条件下为组织实施调查提供了方便(当层的划分是按行业或行政区划进行时);

第三,既可以对总体参数进行估计,也可以对各层的目标量进行估计。(3)整群抽样

将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。

与简单随机抽样相比,整群抽样的特点在于简化了编制抽样框的工作量,并且调查的地点相对集中。从而节省了调查费用,方便了调查的实施。

整群抽样的主要弱点是估计的精度较差。(4)系统抽样

将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。

主要优点:操作简便。如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的精度。

缺点:对估计量方差的估计比较困难。(5)多阶段抽样

二阶段抽样是指采用类似整群抽样的方法。首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

优点:

第一,保证了样本相对集中,从而节约了调查费用;

第二,不需要包含所有低阶段抽样单位的抽样框;

第三,由于实行了再抽样,使调查单位在更广泛的范围内展开。

在较大规模的抽样调查中,多阶段抽样是经常被采用的方法。

不同概率抽样方式的优缺点总结如表1-2所示。

表1-2  概率抽样方式的类型

二、非概率抽样

指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

非概率抽样方式的类型:

1.方便抽样

调查过程中由调查员依据方便的原则,自行确定入样单位。

方便抽样的最大特点是容易实施,调查的成本低,但是由于方便样本无法代表有明确定义的总体,将方便样本的调查结果推广到总体是没有任何意义的。

2.判断抽样

指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。(1)重点抽样:从调查对象的全部单位中选择少数重点单位,对其实施调查。这些重点单位的数量虽然不多,但在总体中占有重要地位。(2)典型抽样:从总体中选择若干个典型的单位进行深入的调研,目的是通过典型单位来描述或揭示所研究问题的本质和规律。因此,选择的典型单位应该具有研究问题的本质或特征。(3)代表抽样:通过分析,选择具有代表性的单位作为样本,在某种程度上,也具有典型抽样的含义。

判断抽样是主观的,样本选择的好坏取决于调研者的判断、经验、专业程度和创造性。这种方式的抽样成本比较低,也容易操作,但由于样本是人为确定的,没有依据随机的原则,因而调查结果不能用于对总体有关参数进行估计。

3.自愿样本

指被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。

4.滚雪球抽样

往往使用于对稀少群体的调查中。在滚雪球抽样中,首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。

滚雪球抽样的主要优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低。它适合对特定群体进行研究的资料搜集。

5.配额抽样

类似于概率抽样中的分层抽样,它首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。

这种抽样方式操作比较简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的结构和总体的结构类似。

非概率抽样具体内容总结如表1-3所示。

表1-3  非概率抽样分类

三、概率抽样与非概率抽样的比较

非概率抽样适合探索性的研究和市场调查中的概念测试,其特点是操作简便、时效快、成本低,而且对于抽样中的统计学专业技术要求不是很高。

如果调查的目的在于掌握研究对象总体的数量特征,得到总体参数的置信区间,就应当使用概率抽样的方法。概率抽样的技术含量更高,无论抽选样本和对调查数据进行分析,都要求有较高的统计学专业知识,调查的成本也比非概率抽样的调查成本高。

例5:下列选项中,抽样调查的结果不能用于对总体有关参数进行估计的是(  )。

A.分层抽样

B.判断抽样

C.整群抽样

D.系统抽样【答案】B

例6:某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是(  )。

A.面访

B.深度访谈

C.计算机辅助电话调查

D.邮寄调查【答案】C

第三节 统计调查的方案设计

统计调查的方案主要包括以下几项内容:

一、确定调查目的

即明确统计调查要解决什么问题,只有明确调查目的,资料的搜集工作才能有序地进行。

二、确定调查对象和调查单位

调查对象:指需要调查的现象总体,该总体是由许多性质相同的调查单位组成的。

界定调查总体的关键:根据调查目的,审核总体中的各个单位的同质性。对于抽样调查,根据所确定的调查对象建立抽样框,并从抽样框中按一定的规则抽取单位调查。

调查单位:指所要调查的具体单位,它是进行调查登记的标志的承担者。

报告单位(亦称填报单位):负责向上报告调查内容、提交统计资料的单位。

调查单位与报告单位的关系:(1)报告单位一般是在行政上、经济上具有一定独立性的单位;而调查单位可以是个人、企事业单位,也可以是物。(2)根据不同的调查目的,调查单位与报告单位,有时是一致的,有时不一致。

三、确定调查项目

即调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志和数量标志所构成。

四、调查表格和问卷的设计

将各个调查项目按照一定的顺序排列在一定的表格上,就构成了调查表。调查表一般有两种形式:(1)一览表,是把许多调查单位填写在一张表上;(2)单一表,是每个调查单位填写一份,可容纳较多的调查项目。

问卷调查是一种特殊的调查形式,根据调查目的,在调查对象中随机选择或有意识地确定调查单位,以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。问卷设计的基本要求是:主题明确、形式简明、文字通俗、容易理解和便于回答等。

五、确定调查时间和调查期限(1)调查时间(又称客观时间):指调查资料所属的时间。

在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期;如果所要调查的是时点现象,调查时间就是规定的统一标准时点。(2)调查期限(称主观时间):进行调查工作的时限,包括搜集资料和报送资料的工作所需时间。

六、确定调查的组织实施计划

调查组织工作包括确定调查机构,组织和培训调查人员,落实调查经费的来源和开支办法,确定调查资料的报送方法和公布调查结果的时间。

第四节 调查误差

数据的误差指通过调查搜集到的数据与研究对象真实结果之间的差异。数据的误差有两类:抽样误差和非抽样误差。

一、数据的误差

数据的误差有两类:抽样误差和非抽样误差,如表1-4所示。

表1-4  调查误差分类

注意:非抽样误差不仅存在于概率抽样之中,也存在于非概率抽样之中。

例7:以下关于非抽样误差的说法正确的是(  )。

A.全面调查中也会存在非抽样误差

B.增大样本容量可以降低非抽样误差

C.采用分层抽样方法可以显著降低非抽样误差

D.以上都不对【答案】A

例8:指出下面的陈述中哪一个是错误的。(  )

A.抽样误差只存在于概率抽样中

B.非抽样误差只存在于非概率抽样中

C.无论是概率抽样还是非概率抽样都存在非抽样误差

D.在全面调查中也存在非抽样误差【答案】B

二、误差的控制

1.抽样误差

抽样误差是由抽样的随机性带来的,只要采用概率抽样,抽样误差就不可避免。控制抽样误差的主要方法是改变样本量,要求的抽样误差越小,所需要的样本量就越大。影响抽样误差的因素主要有:(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越小;抽样数目越少,抽样误差越大。当n=N时,就是全面调查,抽样误差此时为零。(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。(3)抽样方法。通常不重复抽样的抽样误差要小于重复抽样的抽样误差。当n相对N非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

例9:抽样误差(  )。

A.既可以避免,也可以控制

B.既不可以避免,也不可以控制

C.可以避免,但不可以控制

D.不能避免,但可以控制【答案】D

例10:以下关于抽样误差的说法错误的是(  )。

A.其它条件相同时,总体的差异程度越大,抽样误差就越大

B.其它条件相同时,样本容量越大,抽样误差越小

C.不重复抽样中的抽样误差要大于重复抽样

D.在非概率抽样中无法对抽样误差进行控制【答案】C【解析】影响抽样误差大小的因素主要有:①总体单位标志值的差异程度;②样本单位数的多少;③抽样方法;④抽样调查的组织形式。C项,重复抽样比不重复抽样误差要大些。

2.非抽样误差

非抽样误差与抽取样本的随机性无关,有很多的原因造成非抽样误差,因此控制起来比较困难。非抽样误差控制的重要方面是调查过程的质量控制。这包括:调查员的挑选,调查员的培训,督导员的调查专业水平,对调查过程进行控制的具体措施,对调查结果进行检验、评估,对现场调查人员进行奖惩的制度等。

第二章 数据的图表展示

第一节 统计数据的类型

统计数据按不同的分类标准分类结果如表2-1所示。

表2-1  统计数据的类型

例1:一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明,45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。该调查所搜集的数据是(  )。

A.分类数据

B.顺序数据

C.数值型数据

D.实验数据【答案】A

第二节 数据的预处理

数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。

一、数据审核

即检查数据中是否有错误。

1.原始数据主要从完整性和准确性两个方面去审核(1)完整性审核:主要是检查应调查的单位或个体是否有遗漏,所有的调查项目是否填写齐全等;(2)准确性审核:主要是检查数据是否有错误,是否存在异常值等。

对于异常值要仔细进行鉴别:如果异常值属于记录时的错误,在分析之前应予以纠正;如果异常值是一个正确的值,则应予以保留。

2.二手数据着重审核数据的适用性和时效性(1)首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合分析研究的需要,不能盲目生搬硬套;(2)对于一些时效性较强的问题,如果所取得的数据过于滞后,就可能失去研究的意义。

二、数据筛选

即根据需要找出符合特定条件的某类数据。数据筛选可借助计算机自动完成。

三、数据排序

数据排序是按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。除此之外,排序还有助于对数据检查纠错,以及为重新归类或分组等提供方便。

排序后的数值型数据称为顺序统计量。

第三节 品质数据的整理与展示

一、分类数据的整理与图示

1.频数与频数分布

频数是落在某一特定类别或组中的数据个数。把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布。由两个或两个以上变量交叉分类的频数分布表也称为列联表。二维的列联表(两个变量交叉分类)也称为交叉表。

2.分类数据的图示(1)条形图

条形图指用宽度相同的条形来表示数据多少的图形。可以横置或纵置,纵置时也称为柱形图。条形图有简单条形图、对比条形图等形式。

当分类变量在不同时间或空间上有多个取值时,为对比分类变量的取值在不同时间或空间上的差异或变化趋势,可以绘制对比条形图。(2)帕累托图

帕累托图指按各类别数据出现的频数多少排序后绘制的条形图。通过对条形图的排序,容易看出哪类数据出现得多,哪类数据出现得少。(3)饼图

饼图指用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。饼图对于研究结构性问题十分有用。(4)环形图

把饼图叠在一起,挖去中间的部分就是环形图。

环形图与饼图类似,但又有区别。环形图中间有一个“空洞”,每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本或总体各部分所占的相应比例,从而有利于进行比较研究。

二、顺序数据的整理与图示

分类数据的频数分布表和图示方法适用于对顺序数据的整理与显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,还可以计算累积频数和累积频率(百分比)。

1.累积频数(或频率)

累积频数(或频率)是将各有序类别或组的频数(或频率)逐级累加起来得到的频数(或频率)。它有向上累积频数(或频率)和向下累积频数(或频率)两种。(1)向上累积频数(或频率)分布,其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累积;向上累积频数表明某组上限以下的各组单位数之和是多少,向上累积频率表明某组上限以下的各组单位数之和占总体单位数的比重。(2)向下累积频数(或频率)分布,其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累积;向下累积频数表明某组下限以上的各组单位数之和是多少,向下累积频率表明某组下限以上的各组单位数之和占总体单位数的比重。

2.顺序数据的图示

根据累积频数(或频率),可以绘制累积频数(或频率)分布曲线。

对于不同类型的品质数据,数据的整理和图示总结如表2-2所示。

表2-2  品质数据的整理与展示

第四节 数值型数据的整理与展示

一、数据分组

数据分组是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。数据分组的主要目的是观察数据的分布特征。数据经分组后再计算出各组中数据出现的频数,就形成了一张频数分布表。

1.数据分组的方法(1)单变量值分组和组距分组

单变量值分组是把每一个变量值作为一组,这种分组通常只适合离散变量,且在变量值较少的情况下使用;

组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。

连续型变量或者变动范围较大的离散型变量,适宜采用组距式分组。(2)间断组距式分组和连续组距式分组

在组距式分组中,凡是组限不相连的,称为间断组距式分组;凡是组限相连(或相重叠的),即以同一数值作为相邻两组的共同界限,称为连续组距式分组。

连续型变量只能采用连续组距式分组(要遵循“上限不在内”原则);对于离散型变量的组距式分组,既可以采用间断组距式分组,也可以采用连续组距式分组。(3)等距分组和异距分组

等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。等距分组便于计算,便于绘制统计图。

异距分组即各组的组距不相等。一般地,异距分组适用于如下几种场合:

①标志值分布很不均匀的场合;

②标志值相等的量具有不同意义的场合;

③标志值按一定比例发展变化的场合。

2.分组和编制频数分布表的具体步骤(1)确定组数

一般情况下,一组数据所分的组数不应少于5组且不多于15组,即5≤K≤15。实际应用时,可根据数据的多少和特点及分析的要求来确定组数。(2)确定各组的组距

组距是一个组的上限与下限之差。组距可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。

在编制组距式变量数列时,使用“××以下”及“××以上”这样不确定组距的组,称为开口组,开口组通常以相邻组的组距作为其组距。

为便于计算,组距宜取5或10的倍数,而且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。(3)根据分组整理成频数分布表

3.组距分组的注意事项(1)组距分组需要遵循“不重不漏”的原则“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。

①对于离散变量,可以采用相邻两组组限间断的办法解决“不重”的问题;

②对于连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内”的规定解决“不重”的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。(2)组距分组要避免出现空白组(即没有变量值的组)或个别极端值被漏掉

在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,可采用开口组的形式。

4.组限和组中值(1)组限

在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。

一般情况下,按相邻组的组距来计算开口组的组限,即:

首组开口的下限=首组上限-邻组组距;

末组开口的上限=末组下限+邻组组距。(2)组中值

组中值是每一组中下限值与上限值中间的值,即

开口组的组中值的计算方法如下:

在组距分组时,通常用组中值作为该组数据的一个代表值。使用组中值代表一组数据时有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧呈对称分布。

例2:某同学统计学考试成绩为80分,应将其计入(  )。

A.成绩为80分以下人数中

B.成绩为70~80分的人数中

C.成绩为80~90分的人数中

D.根据具体情况来具体确定【答案】C【解析】统计分组时习惯上规定“上组限不在内”。

二、数值型数据的图示

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载