2018年统计师《统计基础理论及相关知识(中级)》复习全书【核心讲义+历年真题详解】(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-15 08:18:35

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

2018年统计师《统计基础理论及相关知识(中级)》复习全书【核心讲义+历年真题详解】

2018年统计师《统计基础理论及相关知识(中级)》复习全书【核心讲义+历年真题详解】试读:

第一部分 复习指南

第一章 中级统计师考试概述

一、组织领导

国家统计局和人事部成立全国统计专业技术资格考试办公室,负责统计专业技术资格考试的组织实施和考务工作,考试办公室设在国家统计局人事司。国家统计局设立统计专业技术资格考试大纲、考试用书编写暨命题委员会。该委员会负责考试大纲、考试用书的编写和命题工作。委员会的日常工作由国家统计局人事司负责。各地方人事考试中心负责本地区考试的具体组织与实施工作。

二、考试日期及时间(一)统计专业中级资格考试每年举行一次,考试日期一般设在每年10月的第三个星期日,分在两个半天进行,考试时间均为2.5小时。(二)考生应考时,须携带黑色墨水笔、2B铅笔、橡皮、无声无文本编辑功能计算器。(三)中级考试均为客观性试题,采取闭卷笔答方式。

三、考试科目

中级统计师的考试科目分为《统计基础理论及相关知识》与《统计工作实务》两个科目。

参加考试并成绩合格者,获得相应级别的专业技术资格。

四、报考条件(一)在统计岗位上从事统计工作的专业技术人员,报名参加统计专业中级资格考试,应具备下列基本条件:

1.拥护中国共产党在社会主义初级阶段的基本路线,遵纪守法。

2.热爱统计工作,能够履行岗位职责,完成本职工作任务,遵守职业道德。(二)报名参加统计专业中级资格考试人员,还须具备下列条件之一:

1.大学专科毕业,从事专业工作满六年;大学本科毕业,从事专业工作满四年。

2.获第二学士学位或研究生班结业,从事专业工作满二年。

3.获硕士学位,从事专业工作满一年;获博士学位。

4.实行资格考试制度前,已担任统计师专业技术职务的人员,符合上述第(一)条基本条件中规定的要求,如本人自愿,也可参加统计专业中级资格考试。(三)上述报考条件中有关学历的要求是指经国家教育行政主管部门承认的正规学历,从事专业工作年限的要求是指报名人员取得规定学历前后从事本专业工作时间的总和,截止日期为考试报名年度当年年底前。(四)根据人事部《关于做好香港、澳门居民参加内地统一举行的专业技术人员资格考试有关问题的通知》(国人部发〔2005〕9号)文件精神,自2005年度起,凡符合统计专业技术资格考试有关规定的香港、澳门居民,均可按照规定的程序和要求报名参加相应专业考试。

香港、澳门居民申请参加统计专业技术资格考试,在报名时应向报名点提交本人身份证明、国务院教育行政部门认可的相应专业学历或学位证书,以及相应专业机构从事相关专业工作年限的证明。

五、考试报名

符合条件的报考人员,可在规定时间内登录本地区人事考试网在线填写提交报考信息,并按有关规定办理资格审查及网上缴费手续。(具体报名安排详见当次的报考文件。)

考试凭准考证和身份证在规定的时间和地点参加考试。

六、考试成绩和证书管理

考试成绩查询系统将于考试结束两个月后在网上开通,考生可登录“统计专业技术资格考试”专栏,查询考试成绩及合格标准。

统计专业技术中级资格考试成绩均实行非滚动管理,参加考试的人员必须在当年通过应试科目。

中级考试合格者,由当地人力资源和社会保障局颁发人力资源和社会保障部统一印制,人力资源和社会保障部、国家统计局用印的相应级别《专业技术资格证书》,全国范围内有效。

七、考试大纲《统计基础理论及相关知识》科目

一、考试目的

考察统计专业技术人员综合运用统计方法、经济学基础理论、会计基础知识等有关理论和实践经验,根据不同要求进行数据描述、参数估计、假设检验,并对数据进行定性和定量分析的能力;利用统计和会计资料进行经济社会发展情况判断和分析的能力。

二、考试基本要求(一)统计学基础知识

1.掌握搜集数据的常用方法、特点及应用条件;熟悉统计学基本概念;了解数据来源的主要渠道。

2.掌握描述统计数据特征的基本方法及其适用性。

3.掌握参数估计方法,掌握样本量的影响因素和确定方法;熟悉评价估计量优劣的标准。

4.掌握总体均值与比例的假设检验方法;熟悉总体方差的假设检验方法;了解假设检验的基本原理。

5.掌握回归模型的参数估计方法及检验;熟悉回归预测方法及效果评价;了解相关分析与回归分析的基本思想。

6.掌握时间序列基本分析方法;熟悉时间序列构成分析。

7.掌握统计指数的编制原理及方法。(二)经济学基础知识

1.熟悉需求函数、供给函数和价格供给弹性分析,熟悉市场失灵的原因与后果;了解消除市场失灵的政策与手段,了解收入分配理论。

2.掌握利用国民经济恒等式分析国民经济总量的平衡关系,掌握投资乘数、政府购买乘数、税收乘数和平衡预算乘数计算方法;熟悉消费函数和储蓄函数。

3.掌握IS-LM模型,判断产品市场和货币市场的均衡状况;熟悉货币需求函数和货币供给的过程;了解宏观经济政策目标以及财政政策和货币政策的作用及其适用条件,了解不同宏观经济学派的基本观点和政策主张。

4.熟悉国际收支平衡表和汇率的影响因素,熟悉净出口和国际资本流动的影响因素。

5.熟悉不同类型通货膨胀及其对经济的影响,熟悉主要的经济增长模型和不同类型的经济周期;了解短期和长期菲利普斯曲线。(三)会计基础知识

1.掌握会计要素、会计计量属性、会计等式及经济业务对会计等式的影响,掌握会计核算的基本程序与方法;熟悉会计基本假设、会计核算的基础及会计信息的质量要求;了解会计的目标、分类、核算对象、基本职能及会计法律规范等。

2.掌握企业主要业务的核算方法;熟悉会计科目及账户的分类,熟悉借贷记账法基本内容;了解会计科目和账户的含义,了解会计科目设置原则及账户的结构。

3.熟悉会计凭证及会计账簿的基本情况及错账的更正方法;熟悉账务处理程序的种类及步骤;了解对账与结账的意义。

4.掌握各类财产清查结果的处理步骤及方法;熟悉财产清查的种类和方法;了解财产清查的概念和意义。

5.掌握资产负债表和利润表,熟悉所有者权益变动表和现金流量表;了解财务报表分类、编制要求及附注的主要内容。

6.掌握财务报表分析内容;熟悉财务报表数据分析方法;了解财务报表分析的局限性。《统计工作实务》科目

一、考试目的

考察统计专业技术人员运用我国现有统计调查设计与管理、国民经济核算和专业统计等统计实务知识进行宏观经济分析的能力;利用统计和国民核算资料解决统计工作中实际问题的能力;利用统计及相关法律法规依法统计和处理统计违法案件的能力。

二、考试基本要求(一)统计法规

1.掌握统计法律规范的基本特征、效力和基本原则。

2.掌握统计调查对象的权利义务,违法行为种类和相应法律责任。

3.掌握统计机构、统计人员的职责职权,违法行为种类和相应法律责任。

4.掌握统计行政许可项目的法律依据、认定机关及许可程序。

5.掌握统计执法检查的对象、主要内容、机构和统计执法检查人员的主要职责和职权以及依法查处统计违法案件。

6.掌握统计行政处罚的特征、基本原则及实施机关,熟悉适用统计行政处罚的违法行为种类,熟悉相应的统计行政处罚措施。

7.掌握统计政务处分的适用对象、实施机关,熟悉适用处分的违法行为种类,熟悉相应的处分措施。

8.掌握统计法关于刑事责任的有关规定。

9.掌握统计行政复议机构、范围及有关复议的管辖和复议程序。

10.掌握统计行政诉讼的起诉、受案范围,熟悉如何依法进行统计行政应诉。(二)统计实务

1.统计调查设计与管理(1)掌握我国现有统计调查设计的主要内容和方法步骤,了解统计调查设计在提高我国统计数据质量中的作用。(2)掌握我国现有统计调查方法体系、我国现有统计调查的主要方法及其优缺点。(3)掌握我国现有的常用统计分类标准的类别及其主要内容、适用范围,并能正确使用各种统计分类标准。(4)掌握法人单位和产业活动单位的概念、认定方法、区别与联系。

2.国民经济核算(1)掌握国内生产总值(GDP)三种核算方法,分析判断三种方法的基本特点及其相互关系,分析GDP在宏观经济分析和中长期规划制定中的作用。(2)掌握我国目前投入产出表的基本结构和内容,理解投入产出表的含义,掌握分析方法。(3)掌握我国目前资金流量表的基本结构和内容,分析资金流量表的平衡关系;分析国内生产总值、国民总收入、国民可支配总收入之间的关系;分析政府、企业、居民三者收入分配的关系;利用资金流量表进行经济分析;理解资金流量表的含义。(4)掌握我国国际收支平衡表的基本结构和内容;利用国际收支平衡表计算国民总收入;分析国际收支平衡状况;理解国际收支平衡表的含义。(5)掌握我国资产负债表的内容和基本结构;理解资产负债表的内容和结构、主要平衡关系以及资产负债差额。

3.周期性普查(1)掌握我国现行周期性普查的种类和特点。(2)熟悉我国现行周期性普查的频次、标准时点、普查对象、普查范围、普查方法和主要内容。

4.专业统计(1)掌握常规统计调查制度中主要指标的含义;了解我国现行常规统计调查制度的主要内容和统计方法。(2)掌握专业统计的统计范围、调查单位和调查方法。(3)掌握主要统计指标计算方法。(4)掌握主要统计指标在国民经济核算和宏观经济分析中的作用和影响。

第二章 中级统计师考试复习技巧

中级统计师考试(又名:统计师考试)的内容很多,考试所涉及的知识点几乎遍及教材各有关章节,要记住全部内容,显然有些力不从心。如果在考试复习的过程中养成读书做笔记的习惯,则可以利用笔记将“厚”书读“薄”,既读得进去,又读得出来,从而高效率的掌握教材的总体知识。那么,怎样做好读书笔记呢?

一是对教材中的重点内容做重点笔记,概括其要点,提纲挈领,提炼出全书的内容和逻辑结构,同时,还要结合教材的详细内容,依据考试大纲,认真研读,真正吃透,抓住重点。

二是在教材的相应位置做好眉批笔记,可圈可点,可增可减,边看边做。这一过程既是读书的过程,也是记忆的过程。

三是对所学内容做好心得笔记。根据学习过程中产生的思考、对比、分析、体会等随手记下来,对于提高学习效率大有裨益。

很多参加中级统计师职称考试的考生并非都是科班出身,零基础报考中级统计师职称考试的考生大有人在,一举通过考试的也不在少数,究其原因,无非是我们对学习的态度和方法是否端正。接下来,和大家分享一下关于中级统计师职称考试的有效方法:

一、三大忠告(1)学习态度要老实:一就是一,二就是二,决不自欺欺人,不懂不能装懂,虚心向他人请教。(2)平时学习要扎实:不放过每一个知识点,尤其对容易混淆的东西要下更大工夫搞清楚,基础要牢固,半途改行者更要夯实基础,而牢固的基础来自扎扎实实的点滴积累。(3)正确理解学习和考试的关系:学习的目的是为了掌握新的知识,而考试只是验证自己掌握知识程度的一种手段。因此在学习过程中,要尽可能全面、熟练地掌握书中的内容,而不是单纯从考试的角度去考虑哪些内容需要,哪些内容不需要。这样,即使考试时题目难一点或偏一点,也不会茫然无措。

二、六大学习方法(1)会看书:要取得好成绩,抓住教材内容的细小变化很重要。充分利用教材与圣才题库和电子书。(2)带着思考学习:多问为什么,给自己出题,书本常合起来想想,实践中遇到这类题该怎么办?注意比较归纳,逐步浓缩,形成清晰的知识串。久而久之,离开课本也头头是道,不会到考试时,脑子里一团糟。(3)关注错误:平常多做实战演习,每次对照标准答案做总结,把做错的知识点在教材中标出来,并对做错的题目进行深入分析,找出真正的原因:是概念理解不正确,是计算错误,还是粗心大意?通过对比反思,归纳小结,加深对概念的理解。然后适当做一些相关练习,提高计算的正确率,严密关注错误,做到不再重犯。(4)重视弱点:记忆是成人学习的薄弱环节,但有些内容又必须要记。所以在记忆环节,要格外重视。(5)开阔视野:要博采众长,平时多看相关的报刊杂志,及时学习新准则、新方法,这样考试时遇到新知识点就不慌了。(6)温故而知新:在完成一个章节学习内容后,先趁热打铁,对该章内容融会贯通,再将第一章至该章的内容贯穿起来过一遍,然后才开始学习新的章节。

第二部分 核心讲义

上篇 统计学基础知识

第一章 统计和数据

一、基本含义

1统计和统计学

统计就是用来处理数据的,它是关于数据的一门学问。

统计学是用以收集数据,分析数据和由数据得出有用信息以帮助决策的一组概念、原则和方法。统计分析数据的方法大体上可分为描述统计和推断统计两大类。(1)描述统计

描述统计是研究数据搜集、处理和描述的统计学方法,其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。(2)推断统计

推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计和假设检验两大类。

2统计的应用(1)统计的应用领域

统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言。(2)统计的误用与滥用

统计的误用有些是常识性的,有些是技术性的,有些则是故意的。几乎所有的领域都应用统计,但是在应用中应注意分辨被误用与滥用的现象。

二、数据类型

统计数据是对客观现象特征的反映,而由于客观现象的复杂性,在反映这些现象特征时可从不同的角度进行采集,从而得到不同类型的数据。

1.定性变量(数据)与定量变量(数据)、数值型数据(1)定性变量

定性变量只反映现象的属性特点,而不能刻画出数量的差异。常见的定型变量:“天气形势”“职业”和“教育程度”。

定性变量的观察结果称为定性数据。定性变量可分为分类变量和顺序变量。

①分类变量

分类变量是指只能反映现象分类特征的变量,分类变量的观察结果就是分类数据。分类变量没有数值特征,所以不能对其数据进行数学运算。由此可见,分类数据只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。如用编号1来代表性别男,用编号2来代表性别女。

②顺序变量

顺序变量是指反映现象类别的变量还具有一定顺序的变量,相应的观察结果就是顺序数据。顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。因此,其功能比分类数据要强一些,对事物的划分也更精细一些。

但是,顺序数据无法计算相互之间大小、高低或优劣的距离。如产品质量可以分为1、2、3级品。这时顺序数据的数据仍然是用来表示事物在性质上的差异,而不能用来反映事物在数量上的差异。(2)定量变量

定量变量是指不仅能分类而且能测量出来具体大小和差异的变量,可以用数值表示其观察结果,而且这些数值具有明确的数值含义。

常见的定量变量:“天气温度”“上证股指”“月收入”。

定量变量也称为数值变量,定量变量的观察结果称为定量数据。(3)数值型数据

数值型数据的特征在于它们都是以数值的形式出现。有些数值型数据只可以计算数据之间的绝对差(绝对距离),而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差(相对距离)。

数值型数据的计量功能大于定性数据,其计量精度也远远高于定性数据。因此,在统计研究中,数值型数据有着最广泛的用途。(4)三种数据类型的比较

分类数据、顺序数据及数值型数据对事物的描述是由定性到定量、由低级到高级、从粗略到精细。相应的适用于不同数据的数据处理方法也是由少到多,由易到难。很多适用于数值型数据的统计方法并不适用于定性数据,但适用于定性数据的方法则大多可以应用于数值型数据。

2.观测数据和实验数据(1)在社会经济问题研究中,观测是取得数据最主要的方法。(2)自然科学研究中所用的数据多为实验数据。

观测数据可能是全面数据也可能是样本数据;实验数据一般都是样本数据。

3.横截面数据、时间序列数据与面板数据

横截面数据是多种变量或多个样本在同一时间节点上或同一段时间内(一般小于一年)所收集的数据,描述多个事物在相同一段时间内或相同时间节点上的表现。

时间序列数据是某种变量或样本,按时间顺序在不同时间段或时点上取得的一系列数据,描述事物随着时间变化而变化的情况。

面板数据是对不同样本在不同时间段或时点上所收集的数据,描述多个事物随着时间变化而变化的情况。

例如2000~2017年全国各直辖市的GDP数据。对于面板数据,如果只考虑某一时间段或时点的时候,它就是截面数据;如果只考虑某一样本的时候,它就是时间序列数据。

三、数据的搜集

1数据的来源(1)原始数据/第一手统计数据

搜集数据最基本的形式就是进行统计调查或进行实验活动,统计调查或进行实验就是统计数据的直接来源。

①观测数据

统计调查是指根据统计研究预定的目标、要求和任务,运用科学的方法,有计划、有组织地搜集客观实际资料的过程。通过统计调查得到的数据,一般称为观测数据。

②实验数据

通过实验法得到的数据就是实验数据。实验法不仅是一种搜集数据的方式,也是一种重要的研究方式。它是通过有意识地改变或控制某些输入变量,观察其他输出变量的变化,从而达到对事物本质或相互联系的认识。

实验法要注意的是:

a.实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机地分配到实验组或对照组,而不应是经过有意识地挑选的。

b.实验组和对照组还应当是匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。

不论是统计调查还是实验法,所搜集的数据都是原始数据,这是统计数据最基本的来源。(2)次级数据/第二手统计数据

次级数据(第二手数据)是指由其他人搜集和整理得到的统计数据,这种来自他人调查整理基础上的次级数据也称为数据的间接来源。一切间接的统计数据都是从原始的、第一手数据过渡而来的。

数据的间接来源主要包括以下方面:

①公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。如:《中国统计年鉴》《人口普查资料汇编》及某大学、科研机构发布的研究数据等等。

②尚未公开发表的统计数据。如各企业的经营报表数据、专业调查咨询机构未公开发布的调查结果数据。

应用间接数据注意的问题:

a.适用性:研究者应当分析原始资料搜集的目的与自己的研究目的是否相符,研究原始资料搜集的方法是否科学,原始资料的提供者是否公正、客观,应注意数据的含义、计算口径和计算方法等是否可比,避免误用或滥用;

b.时效性:不使用过时的数据,并注明数据的出处,尊重他人的劳动成果。

2数据的搜集(1)常用的统计调查方式

统计调查方案应当围绕Who(向谁调查?谁来组织调查?)、When(何时进行调查?资料所属的时间?)、Where(在哪里实施调查?)、What(调查的内容是什么?)和How(怎样进行调查?)来设计。常用的统计调查种类有以下几种:

1)普查

①定义

普查是为某一特定目的而专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的社会现象总量。它适于搜集某些不能或不适宜于定期的全面统计报表搜集的统计资料,以摸清重大的国情、国力。

②基本要求

a.要有严密的组织和高质量的普查人员队伍;

b.要有严格的时间要求;

c.普查的登记工作应在整个普查范围内同时进行,以保证普查资料的时效性准确性;

d.调查项目和指标必须集中统一;

e.同类普查的内容和时间在历次普查中应尽可能保持连贯性。

③特点

普查是一种全面调查,具有资料包括范围全面、详尽、系统的优点;它是一次性的专门调查,准确性和标准化程度较高,因工作量大致使时间周期较长、耗资也较多,一般不宜经常举行。

2)抽样调查

①定义

抽样调查是一种非全面调查,它是按照一定程序从总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据调查方法。

②特点

a.经济性。这是抽样调查的一个最显著优点。

b.时效性强。

c.适应面广。

d.准确性高。

③概率抽样

a.含义

概率抽样也称随机抽样,它是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。从理论上讲,概率抽样是最科学的抽样方法,它能保证抽出来的部分单位(样本单位)对总体单位的代表性。

b.特点

第一,按照随机原则抽取样本。随机原则是指在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中,且被抽中的概率是已知的。

第二,用样本统计量推断总体参数。概率抽样是依据随机原则抽选样本,因此样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计。

第三,可以计算并控制抽样误差的大小。虽然抽样误差不可避免,但是可以计算并采取相应方法加以控制。

c.常用的概率抽样方式

第一,简单随机抽样(也称纯随机抽样)

Ⅰ.定义:简单随机抽样是直接从总体单位中抽选样本单位,每个个体被选入样本的概率都相等,是一种最基本的抽样方法。

Ⅱ.优点:简单、直观,用样本统计量对目标量进行估计及计算估计量误差均比较方便。

Ⅲ.缺点:实践中难以构造总体单位很大的抽样框;抽出的单位较为分散;没有充分利用其他辅助信息来提高估计效率。

第二,分层抽样(也称类型抽样)

Ⅰ.定义:分层抽样是首先将抽样单位按某种特征或某种规则划分为不同的层(组),然后按照等比例或最优比例的方式从每一层(组)中独立、随机地抽取样本,最后将各层的样本结合起来对总体的目标量进行估计。

Ⅱ.优点:提高估计的精度;在一定条件下为组织实施提供方便;可对总体参数和各层的目标量进行估计等。

第二,整群抽样

Ⅰ.定义:整群抽样是先将总体分为R个群(即次级单位或子总体),每个群包含若干总体单位;然后按某种方式从中随机抽取r个群,再对抽中的群中所有单位都进行调查的一种抽样方式。

Ⅱ.优点:与简单随机抽样相比,第一,大大简化编制抽样框的工作量、节省调查费用;第二,方便调查的实施。

Ⅲ.缺点:估计的精度较差。

第三,系统抽样(也称等距抽样)

Ⅰ.定义:系统抽样(也称等距抽样)是将总体N个单位按某种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法。典型的系统抽样是先从数字1-k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k,……

Ⅱ.优点:操作简便;若总体内的单位有组织的排列,可以有效地提高估计的精度。

Ⅲ.缺点:对估计量方差的估计比较困难。

④非概率抽样

a.含义

非概率抽样是没有完全按照随机原则选取样本单位。

b.常用的非概率抽样方式

第一,方便抽样

Ⅰ.定义:方便抽样(也称便利抽样、偶遇抽样)是纯粹以方便着眼点的抽样方法,事先并不预定样本,调查过程中由调查员依据方便的原则自行确定入抽样本的单位,碰到即问或被调查者主动回答问题。

Ⅱ.优点:容易实施,调查的成本低。

Ⅲ.缺点:样本单位的确定带有随意性,样本无法代表有明确定义的总体。

第二,判断抽样

Ⅰ.定义:判断抽样是调查者根据主观经验和判断从总体中选取有代表性的单位构成样本的一种非概率抽样方法。

Ⅱ.缺点:不能获得估计值的精度,其精度取决于抽样者的经验。

Ⅲ.适用范围:适用于总体单位极不相同而样本容量又很小的情况。

第三,配额抽样

Ⅰ.含义:配额抽样类似于概率抽样中的分层抽样,通常分为两个步骤:第一,根据研究人员认为较重要的一些变量把总体单位分类,指定每一类中的样本数额;第二,在每一类中使用方便抽样或判断抽样的方法抽选指定数量的样本单位。

Ⅱ.优点:操作比较简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本中,使得样本的结构和总体的结构类似。

第四,雪球抽样

Ⅰ.含义:雪球抽样(也称滚雪球抽样)是先找到最初的样本单位,然后根据他们提供的信息去获得新的样本单位;这种过程不断继续,直到完成规定的样本容量为止。

Ⅱ.适用范围:滚雪球抽样往往用于对稀少的特定群体的调查。3)统计报表

①定义

统计报表是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等),自上而下地统一布置、自下而上地逐级提供基本统计资料的一种调查方式。国家利用它定期地取得全社会的国民经济与社会发展情况的基本统计资料,是国家取得调查资料的方法之一。

②分类

按照报送范围,统计报表分为全面报表和非全面报表。全面报表要求调查对象中的每一个单位均要填报,非全面报表则只要求一部分调查单位填报。

按照报送周期,统计报表主要有月报、季报、年报组成。月报内容简单、时效性强;年报则内容比较全面。

③内容

表式:由国家统计部门根据研究的任务与目的而专门设计制定的统计报表表格,用于搜集统计资料,是统计报表制度的主体。

填表说明:对统计表的统计范围、指标等作出的规定,具体有:填报范围、指标解释、分类目录、其他有关事项的规定。

4)重点调查

重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。重点调查的关键是准确恰当地选取重点样本。选取重点样本时,一般采取系统分析、综合比较的方法,选择对总体能起主要或决定作用的因素。这些重点单位虽然数目不多,但它们具有所研究现象的总量在总体总量中占据绝大部分的特点。同全面调查比较,重点调查可以节省人力、财力,而且及时。

5)典型调查

①定义

典型调查是一种非全面的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。

②作用

a.补充全面调查的不足。例如补充定期报表、年度报表只有数据而没有具体情况的不足;

b.在一定的条件下可以验证全面调查数据的真实性。

③特点

典型调查同其他调查方法比较,具有灵活机动、通过少数典型即可取得深入、详实的统计资料的优点。但是,在很大程度上受人们主观认识上的影响,因此,必须同其他调查结合起来使用,才能避免出现片面性。

具体采用以上哪种调查方法,要根据调查的目的与任务以及调查对象的特点来决定。各种调查的特点,列表说明如表1-1所示。表1-1 各类统计调查方法的特点(2)搜集数据的方式

搜集数据的方式归纳起来可分为询问调查(访谈调查)和观察实验两大类。

1)询问调查(访谈调查)

询问调查是调查者与被调查者直接或间接接触以获得数据的一种方法。常用的询问调查方法:

①面访调查

a.定义:面访调查是调查者与被调查者通过面对面地交谈,从而得到所需数据的调查方法。

b.分类:面访调查的方式可分为标准式访问和非标准式访问两种。

c.应用:市场调查和社会调查中常采用访问式调查。

②邮寄调查(也称邮寄问卷调查)

邮寄调查(也称邮寄问卷调查)是一种标准化调查。

③电话调查

优点:速度快、成本低;缺点:容易以各种理由终止。

④电脑辅助电话调查

含义:电脑辅助电话调查是一种电脑与电话相结合完成调查全过程的一种数据搜集方法。

优点:大大缩短调查的时间,提高调查的效率;缺点:一般需要借助专门的软件进行,硬件设备要求较高。

⑤座谈会(也称集体访谈)

优点:有利于取得较为广泛、深入的想法和意见。

适用范围:主要用于定性问题的研究。

⑥个别深入访谈

含义:个别深入访谈是一种一次只有一名被调查者参加的特殊的调查方法。

适用范围:该方法常用于动机研究,最适用于研究较为隐秘的问题如个人隐私或较敏感的问题,如政治方面的问题。

此外,近年来出现了很多新型调查方法。各种调查方法各有优劣,调查者需根据调查目的、调查对象特点、调查时间、调查费用等诸多因素进行合理选择。

2)观察实验

①观察法

观察法是在一个真实或模拟的环境里,调查对象完全没有意识到的情况下,就调查对象的行动和意识,调查人员边观察边记录以收集所需信息进行分析。它包括直接观察与间接观察。

②实验法

实验调查是在事先确定调查的问题中,选择影响这些问题的诸多因素中的一个或几个因素,将其置于一定的条件下,进行小规模实验的方法。

四、数据的误差

调查误差可归纳为两大类:抽样误差与非抽样误差。

1.抽样误差

抽样误差是由于抽取样本的随机性所造成的样本值与总体值之间的差异,也称为代表性误差。在抽样调查中,抽样误差是不可避免的。然而在概率抽样中,抽样误差是能够计量且可以得到控制的。

抽样误差的大小取决于以下因素:

第一,总体内部的差异程度。在其他条件不变时,总体内部差异越大,抽样误差就越大;反之,抽样误差就小。

第二,样本容量的大小。在其他条件不变时,样本容量越大,抽样误差越小。抽样误差常会随着样本容量的增加而缩小,但在一定阶段后便稳定下来。

第三,抽样的方式与方法。不同的抽样方法产生的抽样误差也有差异。相同条件下,重复抽样比不重复抽样的抽样误差要大。

2.非抽样误差

非抽样误差是指除了抽样误差之外调查中因各种原因所引起的调查误差,通常认为是由于调查程序执行中的错误与不足引起的,它不仅出现在概率抽样和非概率抽样中,也出现在全面调查和非全面调查中。非抽样误差不能通过增大样本容量加以控制。

非抽样误差分为以下几种:(1)抽样框误差

抽样框是指为抽样所使用的所有调查单位的名册或清单,是抽样的基础。抽样框误差指目标总体和抽样总体不一致时产生的误差。

为避免抽样框误差,应尽可能使抽样框与目标总体相一致。

抽样框误差包括以下几种情形:

①丢失目标总体单元;

②包含非目标总体单元;

③复合连接:抽样框中的单元与目标总体单元不完全是一对一对应而是存在一对多或多对多的现象;

④不正确的辅助信息。(2)应答误差(3)无回答误差

无回答误差可以分为单位无回答和项目无回答。(4)计量误差

计量误差是除了抽样框误差、应答误差和无回答误差之外的非抽样误差,它是由多种复杂原因所造成的调查中获得的数据与其真值不一致的误差。

第二章 数据描述

本章重点介绍如何简单地利用统计图表和少量数据来概括某些事物的基本特征。

一、用图表展示定性数据

定性数据包括分类数据和顺序数据,通常可以用频数分布表和图形来描述。

1.生成频数分布表

定性数据本身就是对事物现象属性特征的观测结果。换言之,只要先把所有的属性特征都列示出来,然后观测出每一属性特征的频数,就得到一张频数分布表。频数分布表中落在某一特定属性特征的数据个数称为次数或频数。通过频数分布可以观察不同属性特征数据的分布情况。各组频数与各组次数总和之比称为频率。

2.定性数据的图形表示(1)饼图

饼图又称圆饼图、圆形图等,它是利用圆形及圆内扇形面积来表示数值大小的图形。饼图主要用于表示一个样本(或总体)中各组成部分的数据在全部数据中的比重。饼图用于表示一个样本(或总体)中各组成部分的数据在全部数据中的比重,主要用于结构性问题研究中。(2)条形图

条形图是用宽度相同的条形高度或长短来表述数据变动的图形,用于观察不同类别数据的多少或分布情况。绘制时,各类别可以放在纵轴,也可以放在横轴。(3)环形图

环形图可以反映多个样本(或总体)之间的结构差异。环形图由若干个“空心圆”组成,每一个样本(或总体)用一个环来表示,样本(或总体)中的每一部分数据用环中的一段表示。环形图可用于结构比较研究,主要用于展示分类数据和顺序数据。(4)帕累托图

帕累托图是按照各类别数据的频数多少排序(即根据频率降序排列)绘制,并在同一张图中画出累积百分比。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下的数据分散在大部分类别中。

二、用图表展示定量数据

定性数据图表表示方法,也都适用于定量数据,但定量数据在使用这些图表之前要进行数据分组的处理。此外,定量数据还有一些特定的图示方法,它们并不适用于定性数据。

1.生成频数分布表

生成定量数据的频数分布表的步骤:(1)对数据进行分组

通过统计分组将不同性质的单位区分开来,同时把相同性质的单位合并在一起,从而显示出数据的分布特性。组数的多少以能够适当观察数据的分布特征为准。可以采用斯德吉斯Sturges提出的经验公式确定:k

式中K表示组数,n表示数据个数,2>n。

一般的分组个数在5~15之间。(2)确定组距

在组数确定的情况下,组距等于全距(全部数据中的最大值与最小值之差)除以组数。

各组的组距是各组的最大差异,即各组变量值中的最大值与最小值之差。每一组组距都相等的数列称为等距数列,每一组组距不全相等的数列称为不等距数列或异距数列。各组组中值(平均值)等于上限与下限之和除以2。

确定组距的原则:

①要考虑各组的划分是否能区分总体内部各个组成部分的性质差别;

②要能准确、清晰地反映总体单位的分布特征。

在确定组距时,当研究的现象变动比较均匀时,可以采用等距分组;而当研究的现象变动很不均匀时,一般采用不等距分组。(3)统计各组的频数得出频数分布表

在统计各组频数时,若相邻两组的上下限重叠,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内,即采取“上限不在内”的原则,以保证一项数据只被分在某一组。

2.定量数据的图形表示(1)常用来表述定量数据统计图形有:直方图、折线图、散点图、茎叶图、箱线图、气泡图、雷达图等。

①直方图

直方图用横坐标代表变量各组的界限,纵坐标代表各变量值出现的频数或频率,各组与相应的频数就形成了一个矩形,即直方图。

直方图用矩形的面积来表示各组的频数分布,但对于不等距分组其纵轴必须表示为频数密度:

频数密度=频数/组距(面积之和=总频数)

直方图与条形图不同:①条形图是用条形的高度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义;②直方图的各矩形通常是连续排列,条形图则是分开排列。

②折线图

折线图是利用线段的升降起伏来表现描述的变量在一段时期内的变动情况,主要用于显示时间序列的数据。以反映事物发展变化的的规律和趋势。

③散点图

散点图是在直角坐标系中用相对应的两个变量值作为图中一个点的横坐标和纵坐标描点得到的图形,是观察两个变量之间的相关程度和类型最直观的方法。

④茎叶图

茎叶图是反映原始数据分布的图形。它由茎和叶两部分构成,其图形是由数字组成的。通过茎叶图,可以看出数据的分布形状及数据的离散状况,主要用于显示未分组原始数据的分布。

与直方图相比,茎叶图既反映数据的分布状况,又能保留原始数据的信息;而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,而茎叶图通常适用于小批量数据。

⑤箱线图

箱线图也是用于描述数据分布特征的一种图形,常用于显示未分组原始数据的分布。箱线图由一组数据的5个特征值(即最大值、最小值、中位数(M或Q)和两个四分位数(下四分位数或Q或Q,e2L1上四分位数Q或Q)绘制而成。U3

⑥气泡图

气泡图可用于展示三个变量之间的关系,它与散点图类似。绘制气泡图时将一个变量放在横轴,另一个变量放在纵轴,第三个变量则用气泡的大小来表示。

⑦雷达图

雷达图是显示多个变量的常用图示方法,也称为蜘蛛图。雷达图可显示或对比各变量的数值总和,利用雷达图也可以研究多个样本之间的相似程度。(2)绘制统计图时应注意的事项主要包括:

①选择恰当的图形类型、刻度、长宽比例;

②尽量简明;

③有清楚的标题和必要的说明;

④反复加工和修改以获得优秀统计图形。

三、用统计表来表示数据

统计表是一种用密集统计资料最基本的表现形式归纳数据的方法。它主要是利用行和列中的数据来表述现象特征。统计表可使数据资料表述的更加紧凑、简明,条理清晰、通俗易懂,便于进行数据的比较。

利用统计表的主要目的:(1)在文章中使用它以支持自己的观点;(2)利用统计表组织数据。

一个完整的统计表从结构上看一般包括:表头、行标题、列标题、数据资料,对表中指标或数据的补充说明一般作为附加部分放在统计表的下方。

统计表的使用要注意以下几个方面:(1)表头应该放在表的上方,它概括说明表的主要内容;(2)行标题和列标题一般放在表的第一列和第一行,它表示的是所研究的问题类别的名称和指标名称;(3)表的其余部分是具体的数字资料;(4)表外附加通常放在统计表的下方,用来说明资料来源、指标注释和必要的说明等内容;(5)通常情况下,统计表的左右两边不能封口。

制作统计表的基本原则:(1)统计表的标题简明扼要,满足3W(When,Where,What)要求;(2)结构合理,长宽比例要适当;(3)统计表为“开口式”;(4)数据计量单位相同时,可放在表的右上角标明;不同时应放在每个指标后或单列出一列标明;(5)表中的数据格式统一、缺项需标明;(6)必要时可在表的下方加上注释。

四、用数字来概括数据

针对一组数据的分布特征,可以从三个方面来考查:

①该组数据的集中趋势,即该组数据的数值向其中心值的靠拢程度;

②该组数据的离散程度,它反映的是该组数据的各个数值远离其中心值的趋势和程度;

③分布的形状,即分布函数的“高矮胖瘦”。

这三个方面反映了数据分布特征的不同侧面,在实际应用中应该从不同视角来分析统计数据,以达到分析和运用统计数据的目的。

1.数据集中趋势的度量

常用的数据集中趋势测度值有众数、中位数、分位数、平均数。

定性数据主要是计数,比较简单。对顺序数据的集中趋势常用的方法就是计算百分比、中位数和众数,分类数据集中趋势常用的方法是计算众数;而定量数据的数值有实际含义,可以进行加减乘除计算,所以反映定量数据集中趋势的测度值有平均数、中位数、众数和分位数。(1)众数

众数是指一组数据中出现次数或出现频率最多的数值。它是一种位置平均数,不受极端变量值的影响。众数主要用于测度分类数据的集中趋势,也可以用来测度顺序数据和数值型数据的集中趋势。

计算等距分组数据的众数有两种方法:一是用众数所在组的组中值估计分组数据的众数;二是根据下面的计算公式计算:

其中L为众数所在组的下限,Δ是众数组与前一组频数的差,Δ12是众数组与后一组频数的差,d为众数组的组距。(2)中位数

中位数是将一组数据按照大小排列之后处在数列中点位置的数值(如果样本量为奇数),或者中间两个数的平均(如果样本量为偶数)。中位数是典型的位置平均数,不受极端变量值的影响。中位数主要用于顺序数据,也可用数值型数据,但不能用于分类数据。对于一组数据来说,中位数是唯一的。

对于分组资料,其计算公式为:

其中L为中位数所在组的下限值,N为总次数,f为中位数所在m组的次数,S为向上累计(由变量值最低的组向变量值最高的m-1组)至中位数所在组的前一组的累计次数,d为中位数所在组的组距。(3)分位数

把顺序排列的一组数据分割为若干相等部分的分割点的数值即为相应的分位数。(4)平均数

①算数平均数

算术平均数也称为均值,是把某一组数据进行算术平均,用以表述某一事物的平均水平。平均数的计算方法比较简单、应用非常广泛,但容易受到极端值的影响。其计算公式为:

设原始数据被分成了k组,各组的组中值分别用M,M,…,M12k表示,各组变量值出现的频数分别用f,f,…,f表示,则样本加权12k平均数的计算公式为:

其中,n=∑f,即样本量。i

②几何平均数

几何平均数等于n个变量值乘积的n次方根。常用于计算平均的比率、增长率等。其计算公式为:

以f加权的加权几何平均数的计算公式为:i

注:平均数的主要缺点是更容易受少数极端数值的影响;中位数和众数提供信息较少,但不受极端值的影响,具有统计上的稳健性。当数据呈单峰对称分布时,均值、中位数、众数三者大小相等;当呈左偏分布时,三者大小关系为:众数>中位数>均值;呈右偏分布时,三者大小关系为:均值>中位数>众数。

2.数据离中趋势的度量

反映数据离中趋势(离散程度)的常用测度指标有:异众比率、极差、四分位距、平均差、标准差、方差和离散系数。(1)异众比率

异众比率是指非众数组的频数占总频数的比率。异众比率主要用于衡量众数对一组数据的代表程度,适合测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。其计算公式为:

其中:f为众数组的频数。0(2)极差

极差又称全距,是最简单的离散指标,它是一组数据中最大值和最小值之差。它的特点是简单直观,但是容易受极端值的影响,因此,不能准确地描述数据的分散程度。其计算公式为:

R=max(x)-min(x)ii

其中max(x)和min(x)分别表示一组数据的最大值和最小ii值。(3)四分位距

四分距是上下四分位数之差,也称为样本的内距或四分位差,用Q表示。四分位距主要用于测度顺序数据的离散程度,对于数值型d数据也可以计算四分位距,但它不适合分类数据。其计算公式为:

Q=Q-QdUL(4)平均差

平均差(也称为平均绝对差)是一组数据与其均值之差的绝对值的平均数。主要用于数值型数据,因其数学性质较差,不常使用。(5)方差和标准差

方差是将各个变量值与其均值离差平方的平均数,它反映了样本中各个观测值到其均值的平均离散程度。

方差与标准差的计算公式如表2-1所示:表2-1

在一个统计样本中,其标准差越大,说明它的各个观测值分布的越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就越好。(6)离散系数

离散系数也称为变异系数、标准差系数,是将一组数据的标准差除以其均值,用来测度离散程度的相对数。

计算离散系数的目的为:①消除数据本身数值大小的影响;②消除计量单位不同的影响。

离散系数的计算公式为:

总体数据的离散系数:

样本数据的离散系数:(7)标准分数

标准分数也称作标准化值或Z分数,是变量值与其平均数的离差除以标准差后的值,用以测定某一数据在该组数据中的相对位置。其计算公式为:

标准分数用途是可以把两组数据中的两个不同均值、不同标准差的数据进行对比,以判定它们在各组中的相对位置。

3.偏态与峰度的度量

偏态和峰态可以用来测度数据的分布形状。(1)偏态系数

数据的不对称性称为偏态,测度数据的偏斜程度用偏态系数(SK)。

根据未分组原始数据计算偏态系数时,通常采用下列公式:

对于分组数据,其计算公式为:

偏度系数越大,表示数据分布的偏斜程度越大。当SK大于零时,表示正偏离差数值较大,可判断为正偏或右偏;反之可判断为负偏或左偏。(2)峰度系数

数据分布的平峰或尖峰程度称为峰态,测度数据的偏态程度用峰度系数。

根据未分组原始数据计算峰态系数时,通常采用下列公式:

对于分组数列,其计算公式为:

峰态通常是与标准正态分布相比较而言的。如果数据服从标准正态,则峰度系数等于零;若峰度系数的值明显不为零,则表明数据的分布比正态分布更平或更尖。

第三章 参数估计

一、抽样分布

1总体分布与总体参数

总体分布是总体中所有观察值所形成的分布。

总体参数是对总体特征的某个概括性的度量。在只研究一个总体2时人们所关心的参数通常有总体均值(μ)、总体方差(σ)、总体比例(π)等。

2统计量与抽样分布(1)统计量

统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。因此统计量是不含任何未知参数的样本的函数。由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也是随机的。因此根据统计量来推断总体参数具有某种不确定性,不同的样本可以计算出不同的统计量值。(2)抽样分布

抽样分布是样本统计量所形成的概率分布,即抽样分布就是统计_量的分布,如样本均值(x)的分布、样本比例(p)的分布等。抽样分布是一种理论分布,构成了推断总体参数的理论基础。

①重复抽样与不重复抽样

设总体共有N个元素,从中随机抽取一个容量为n的样本,在重n复抽样过程中总体单位总数始终不变时,共有N种抽法,即可以组n成N个不同的样本。在不重复抽样过程中总体单位总数始终在减少时,共有个可能的样本。_

②样本均值(x)的抽样分布

样本均值的抽样分布就是指所有可能抽出来的样本的分布。_

样本均值的均值是总体均值。即:E(x)=μ。2

重复抽样中,样本均值的方差为总体方差σ的1/n,即:

不重复抽样中,样本均值的方差略小于重复抽样的方差,即:

当总体服从正态分布时,样本均值一定服从正态分布,即有X~2N(μ,σ)时

若总体为未知的非正态分布时,只要样本容量n足够大(通常要求n≥30),样本均值仍会接近正态分布。

如果总体不是正态分布,当n为小样本时(通常n<30),样本均值的分布则不服从正态分布。

②样本比例(p)的抽样分布

比例是指具有某种属性的单位占全部单位数的比重。比例有总体比例和样本比例。总体比例(π)通常是未知的,是一个参数;样本比例(p)是一个样本统计量,是可以观察到的随机变量。

当样本容量比较大时,样本比例p近似服从正态分布,且P的数学期望就是总体比率π,即E(p)=π。

在重复抽样时,p的分布为:

在不重复抽样时,p的分布为:

一般讲,当     ≥5且     (1-     )≥5时,就可以认为样本容量足够大。

③样本方差的分布

总体分布为正态分布时,样本方差的分布为:

3统计量的标准误差

统计量的标准误差也称为标准误,是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。(1)样本均值的标准误计算公式为:

当总体标准差σ未知时,可用样本标准差s代替计算。(2)样本比例的标准误计算公式为:

当总体比例的方差π(1-π)未知时用样本比例的方差p(1-p)代替。

二、参数估计

参数估计是推断统计的重要内容之一,是用样本统计量去估计总体的参数。在参数估计中,用来推断总体参数的统计量称为估计量,根据具体的样本所计算出来的估计量的数值称为估计值。同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值不确定。

1.点估计与区间估计(1)点估计

点估计是用样本统计量的某个实际值作为相应的总体参数的估计_值。常用的点估计是用样本均值x估计总体均值μ,用样本比例p估计22总体比例π;用样本方差s估计总体方差σ等。(2)区间估计

区间估计是根据估计可靠程度的要求,利用随机抽取的样本的统计量值确定能够覆盖总体参数的可能区间的一种估计方法。常见的三种置信水平下的置信区间的计算如下:

①68.27%的置信水平(z=1)推断总体参数μ的置信区间为

②95.45%的置信水平(z=2)推断总体参数μ的置信区间为

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载