作者:圣才学习网
出版社:圣才教育
格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT
曾五一《统计学导论》笔记和课后习题(含考研真题)详解试读:
第一章 绪 论
1.1 复习笔记
一、统计
1.统计的含义
统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。
2.统计研究对象的特点(1)数量性:统计研究对象的基本特点。(2)总体性:统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析,得出反映现象总体的数量特征。(3)变异性:统计研究同类现象总体的数量特征,其前提是总体各单位的特征表现存在着差异,而且这些差异事先不可预知。
3.统计学与统计实践活动的关系
统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。统计学与统计实践活动的关系是理论与实践的关系。统计数据是统计实践活动的成果,人们对统计数据的要求是:客观性、准确性和及时性。
4.统计研究的基本环节
统计研究全程包括四个基本环节: (1)统计设计:根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准;同时提出收集、整理和分析数据的方案和工作进度等。(2)收集数据:经过统计设计,形成方案后,就可以开始收集统计数据。收集统计数据的基本方式包括科学实验和统计调查。(3)整理与分析:原始的统计数据收集上来之后,必须经过整理、加工和分析才能真正发挥其作用。所用方法分为统计描述和统计推断两大类。描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。(4)统计资料的积累、开发与应用:对于已经公布的统计资料需要加以积累,并结合相关的实质性学科的理论知识进行分析和利用。该过程必须将实质性学科的理论与统计方法相结合。
上述统计研究的全过程如图1-1所示:
二、统计学的种类及其性质
1.统计学的产生与发展
统计学发展过程中有重要影响的学派主要有:政治算术学派、国势学派、社会统计学派和数理统计学派。其中,最早使用“统计学”这一术语的是国势学派。纵观统计学发展的历史,可以发现:统计学最初是从设置指标研究社会经济现象的数量开始的。从当前世界各国的状况来看,统计学已经成为研究社会经济现象和自然现象数量方面的有力工具,它既研究确定现象的数量方面,也研究随机现象的数量方面。
2.理论统计学和应用统计学
现代统计学可分为两大类:(1)理论统计学:是以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据的方法,是具有理学性质的通用方法论科学。(2)应用统计学:是以各个不同领域的具体数量为研究对象,是有具体对象的方法论,具有边缘交叉学科和复合型学科的性质。
3.统计学与有关学科的联系和区别(1)统计学与数学的联系和区别
①联系:
a.两者都研究数量规律,都要利用各种公式进行运算。
b.现代统计学中运用了大量的数学理论与方法;数学中的概率论,为统计学提供了数量分析的理论基础。
c.数学分析的方法包括统计的数量分析。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容可看作是数学的一个分支。
②区别:
a.从研究对象看,数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学特别是应用统计学则总是与客观的对象联系在一起的。
b.从研究方法看,数学的研究方法主要是逻辑推理和演绎论证的方法;而统计的方法,本质上是归纳的方法,根据实验或调查观察到大量情况,来归纳判断总体的情况。(2)统计学与其他学科的联系
统计学为经济学和管理学等实质性学科提供数量分析工具,经济学和管理学等实质性学科对统计学在本领域的应用(包括统计指标的设定、统计方法的选择和统计分析)起理论指导作用。
三、统计学的基本概念
1.总体与总体单位(1)统计总体:由客观存在的、具有某种共同性质的许多个别单位所构成的整体,应具备同质性和大量性。根据总体包括单位数量不同,总体可分为有限总体与无限总体。(2)总体单位(简称单位):是组成总体的个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动过程等非实物单位。
注意:总体和单位的概念是相对的,随着研究目的不同、总体范围不同而变化。同一个研究对象,在一种情况下为总体,但在另一种情况下又可能变成单位。
2.样本
样本是由总体抽出的部分单位构成的集合体,由一定数量的单位构成,为总体的代表。
3.标志的定义及分类(1)定义
标志反映了总体各单位的属性或特征。(2)分类
①根据所反映单位的特征:品质标志和数量标志。
品质标志表明单位属性方面的特征,只能用文字、语言来描述来表现。数量标志表明单位数量方面的特征,可以用数值来表现。
②根据其在各单位的表现:变异标志和不变标志。
不变标志是指一个总体中各单位有关标志的具体表现都相同。变异标志是指在一个总体中,标志在各单位的具体表现有可能不同。
4.统计指标与指标体系(1)统计指标
①定义
统计指标是通过对标志进行汇总计算而得到的反映总体数量特征的概念和数值,它是统计研究对象的具体化。
②分类
根据其所反映的数量特点:数量指标和质量指标。
数量指标是反映现象总规模、总水平的统计指标,也称为总量指标,用绝对数来表示。质量指标是反映现象相对水平和工作质量的统计指标,是总量指标的派生指标,用相对数或平均数来表示。
③统计指标与标志的联系
标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。由于总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。(2)统计指标体系
统计指标体系是由一系列相互联系的统计指标组成的有机整体,用以反映所研究现象各方面相互依存、相互制约的关系。
5.统计数据(1)变量与变量值
变量是说明现象某一数量特征的概念,变量的具体取值是变量值。统计数据就是统计变量的具体表现。
①根据变量值是否连续出现:连续型变量和离散型变量。
连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。离散型变量是指变量的数值只能用计数的方法取得,其取值是整数值,可以一一列举。
②根据变量的取值是否确定:确定性变量和随机变量。
确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。随机变量是受许多微小的不确定因素(又称随机因素)影响的变量,变量取值无法事先确定。(2)数据的计量尺度
根据对研究对象计量的不同精确程度,分为四个层次:
①定类尺度:最粗略、计量层次最低的计量尺度,是按照客观现象的某种属性对其进行分类。所使用的数值只是作为各种分类的代码,并不反映各类的优劣、量的大小或顺序。
②定序尺度:是对客观现象各类之间的等级差或顺序差的一种测度。该尺度不仅可将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。
③定距尺度:是对现象类别或次序之间间距的测度。该尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。
④定比尺度:是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。(3)数据的类型
根据对客观现象观察的角度:横截面数据和时间序列数据。
横截面数据(又称静态数据)是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据(又称动态数据)是指在不同时间对同一总体的数量表现进行观察而获得的数据。(4)数据的表现形式
①绝对数:一般用于表现现象的规模和水平,其计量单位一般为实物单位或价值单位,有时也采用复合单位。
②相对数:由两个互相联系的数值对比求得。常用相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。
③平均数:反映现象总体的一般水平或分布的集中趋势。
1.2 课后习题详解
一、判断题
1.统计学是数学的一个分支。( )【答案】错【解析】统计学和数学都是研究数量关系的,两者虽然关系非常密切,但两个学科有不同的性质特点。数学撇开具体的对象,以最一般的形式研究数量的联系和空间形式;而统计学的数据则总是与客观的对象联系在一起。特别是统计学中的应用统计学与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。
2.统计学是一门独立的社会科学。( )【答案】错【解析】统计学是跨社会科学领域和自然科学领域的多学科性的科学。
3.统计学是一门实质性科学。( )【答案】错【解析】实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。
4.统计学是一门方法论科学。( )【答案】对【解析】统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。
5.描述统计是用文字和图表对客观世界进行描述。( )【答案】错【解析】描述统计是对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用信息,所以描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。
6.对于有限总体不必应用推断统计方法。( )【答案】错【解析】一些有限总体,由于各种原因(如成本太高),并不一定都能采用全面调查的方法。例如,某一批电视机是有限总体,要检验其显像管的寿命,不可能每一台都去进行观察和实验,只能应用抽样调查方法。
7.经济社会统计问题都属于有限总体的问题。( )【答案】错【解析】不少社会经济的统计问题属于无限总体。例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。
8.理论统计学与应用统计学是两类性质不同的统计学。( )【答案】对【解析】统计学沿着两个不同方向发展,形成了理论统计学和应用统计学,理论统计具有通用方法论的性质,而应用统计学则与各不同领域的实质性学科有着非常密切的联系,是有具体对象的方法论。它们之间的学科性质也有所差异。
二、单项选择题
1.社会经济统计学的研究对象是( )。
A.社会经济现象的数量方面
B.统计工作
C.社会经济的内在规律
D.统计方法 【答案】A【解析】社会经济统计学的研究对象是社会经济现象总体的数量特征和数量关系,通过这些数量方面的研究反映社会经济现象发展变化的规律性。
2.考察全国的工业企业的情况时,以下标志中属于不变标志的有( )。
A.产业分类
B.职工人数
C.劳动生产率
D.所有制 【答案】A【解析】不变标志是指在一个统计总体中各总体单位表现相同的标志。题中全国的工业企业总体中,各工业企业的产业分类均属于工业,故属于不变标志。
3.要考察全国居民的人均住房面积,其统计总体是( )。
A.全国所有居民户
B.全国的住宅
C.各省市自治区
D.某一居民户 【答案】A【解析】统计总体是指由客观存在的某些性质上相同的许多个体所组成的整体;总体单位是指构成统计总体的各个个体。题中,统计总体是全国所有居民户,总体单位是全国每一个居民户。
4.最早使用统计学这一学术用语的是( )。
A.政治算术学派
B.国势学派
C.社会统计学派
D.数理统计学派 【答案】B【解析】最早使用“统计学”这一术语的是德国的阿亨瓦尔(G.Achenwall,1719~1772)。他认为统计学是关于国家显著事项的学问,主要通过对国家组织、人口、军队、领土、居民职业以及资源财产等事项的记述对国情国力进行研究。后人把从事这方面研究的德国学者称为“国势学派”。
三、分析问答题
1.试分析以下几种统计数据所采用的计量尺度属于何种计量尺度。
人口数 民族 信教人数 进出口总额 经济增长率 教育程度
答:根据对研究现象计量的精确程度不同,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。可以根据它们的数学特征和具体性质来对它们进行区分:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。定序尺度的数学特征是“>”或“<”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。
2.请举一个实例说明品质标志、数量标志、质量指标、数量指标之间的区别与联系。
答:例如考察全国人口的情况,全国所有的人为统计总体,而每个人就是总体单位,每个人都有许多属性和特征,比如民族、性别、文化程度、年龄、身高、体重等,这些就是标志,标志可以分为品质标志和数量标志,性别、民族和文化程度都是品质标志,年龄、身高、体重等则是数量标志;而指标是说明统计总体数量特征的,用以说明全国人口的规模如人口总数等指标就是数量指标,而用以说明全国人口某一方面相对水平的相对量指标和平均量指标如死亡率、出生率等指标就是质量指标,质量指标通常是数量指标的派生指标。
3.请举一实例说明统计总体、样本、单位的含义,以及它们三者之间有什么联系。
答:总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体,简称总体;构成总体的个体称为总体单位;样本是从总体中抽取的一部分元素的集合,是总体的一部分单位。例如,考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。
1.3 考研真题与典型习题详解
一、选择题
1.以下关于数据类型的说法错误的是( )。[华东师范大学2013研]
A.温度属于定距类型的数据
B.考试成绩(百分制)属于定比类型的数据
C.性别属于定类类型的数据
D.评级(如:优、良、中、差)属于定序类型的数据【答案】B【解析】定距型数据通常指诸如身高、体重、血压等的连续性数据,也包括诸如人数、商品件数等离散型数据;定序型数据具有内在固有大小或高低顺序,但它又不同于定距型数据,一般可以数值或字符表示;定类型数据是指没有内在固定大小或高低顺序,一般以数值或字符表示的分类数据。定比尺度,也可以称为比例尺度,它与定距尺度属于同一层次,它与定距尺度的区别在于是否有绝对零点。在定距尺度中,“0”表示某一个数值,而定比尺度中,“0”表示“没有”或“无”。
2.为了研究北京市财政支付能力,从北京统计年鉴搜集到历年北京市财政支出额数据,则该数据为( )。[首都经济贸易大学2013研]
A.时间序列数据
B.截面数据
C.观察数据
D.实验数据【答案】A【解析】时间序列数据用于描述现象随时间发展变化的特征。
3.下列变量属于数值型变量的是( )。[东北财经大学2013研]
A.定类变量
B.定序变量
C.定距变量
D.定比变量
E.定性变量【答案】CD【解析】CD两项,定距变量和定比变量均是区别同一类别个案中等级次序及其距离的变量。定比变量除了具有定距变量加与减的特性外,还具有乘与除的数学特质,二者均属于数值型变量。AB两项,定类变量和定序变量属于定性变量,表现为某事物的属性特征。
4.指出下面的数据哪一个属于定序数据( )。[江苏大学2012研]
A.上班的出行方式:自驾车,乘坐公共交通工具,骑自行车
B.5个人的年龄(岁):21,26,35,22,28
C.学生的考试成绩:优秀,良好,中,及格,不及格
D.各季度的汽车产量(万辆):25,27,30,26【答案】C【解析】按照所采用的计量尺度不同,可以将统计数据分为以下四种类型:
①定类数据——表现为类别,但不区分顺序,是由定类尺度计量形成的。
②定序数据——表现为类别,但有顺序,是由定序尺度计量形成的。
③定距数据——表现为数值,可进行加、减运算,是由定距尺度计量形成的。
④定比数据——表现为数值,可进行加、减、乘、除运算,是由定比尺度计量形成的。
A项属于定类数据,B项属于定距尺度,C项属于定序尺度,D项属于定比尺度。
5.以下哪一种情形涉及定性数据的收集?( )[中山大学2012研]
A.质量控制工程师测量电灯灯泡的寿命
B.社会学家通过抽样调查来估计广州市市民的平均年收入
C.运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时作的调查
D.婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销【答案】C【解析】分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
6.用部分数据去估计总体数据的理论和方法,属于( )。[首都经济贸易大学2011研]
A.描述统计
B.复杂统计
C.推断统计
D.简单统计【答案】C【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。
7.不便于确定中位数、众数和分位数的数据类型是( )。[中南财经政法大学2002研]
A.定类尺度
B.定序尺度
C.定比尺度
D.定距尺度【答案】A【解析】定类尺度也称类别尺度或名义尺度,是将调查对象分类,标以各种名称,并确定其类别的方法。它实质上是一种分类体系;定序尺度也称等级尺度或顺序尺度,是按照某种逻辑顺序将调查对象排列出高低或大小,确定其等级及次序的一种尺度;定距尺度也称等距尺度或区间尺度,是一种不仅能将变量(社会现象)区分类别和等级,而且可以确定变量之间的数量差别和间隔距离的方法;定比尺度也称比例尺度或等比尺度,是一种除有上述三种尺度的全部性质之外,还有测量不同变量(社会现象)之间的比例或比率关系的方法。从四者的定义中发现定类尺度是不便于确定中位数、众数和分位数的。
8.用来描述样本特征的概括性数字度量称为( )。
A.参数
B.统计量
C.变量
D.变量值【答案】B【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于样本是随机的,因此统计量是样本的函数。抽样的目的就是用样本统计量去估计总体参数。
二、多选题
1.下列变量中是连续变量的有( )。[首都经贸2007研]
A.产品产值
B.商品销售额
C.产品总成本
D.工资总额
E.基本单位数量【答案】ABCD【解析】离散型变量是只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举。连续型变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举。E项是离散型变量。
2.统计总体的形成,从客观条件看,主要是( )。[首都经贸2006研]
A.同质性
B.目的性
C.客观性
D.差异性【答案】ACD【解析】统计总体形成的三个条件是:①客观性,总体和总体单位必须是客观存在的,可以观察和计量的;②同质性,组成总体的所有个体必须是在某些性质上是相同的;③差异性,构成总体的各单位除了同质性一面还必须有差异性的一面,否则就不需要统计研究了。
三、简答题
1.简述统计的基本程序和基本内容。[东北财经大学2014研]
答:统计是指对某一现象有关的数据的搜集、整理、计算和分析等的活动。(1)统计的基本程序
①统计设计:是根据统计研究的目的和研究对象的特点,明确统计指标和指标体系,以及应对的分组方法,并以分析方法指导实际的统计活动。
②收集资料:是根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。
③整理资料:是将收集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。
④分析资料:是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,做出科学合理的解释。(2)统计的基本内容
①统计工作:指收集、整理和分析客观事物总体数量方面资料的工作过程,是统计的基础。
②统计资料:统计工作所取得的各项数字资料及有关文字资料。
③统计科学:研究如何搜集、整理和分析统计资料的理论与方法。
2.你是如何认识统计学与其它学科的关系的(如统计学与经济学、统计学与会计学、统计学与数学)?[西南财大2003研复试]
答:统计学是研究客观现象数量特征和数量关系的,它和数学的关系十分密切,不论统计指标的设计与计算,统计分布的描述,统计估计与检验等都离不开数学方法的应用。概率论的引入为建立现代化理论统计学的理论框架奠定了基础。随着科学技术的进步和统计方法的改善,数学的应用必将更加广泛。但是统计学和数学仍然有性质上的区别。数学研究抽象的数量关系和空间形式,阐明适合所有领域的运算规则,统计学则是研究现实存在的数量关系,表明所研究领域客观现象的数量规律的具体表现。从研究方法看,数学的研究主要是逻辑推理和演绎论证的方法,从严格的定义、假设的命题和给定的条件出发去推证有关的结论。而统计学则是应用归纳推断的方法,根据调查或实验观察到大量现象的个体情况,来归纳判断出现象总体的情况。统计数据是反映客观事实的,要认识问题、解决问题,就必须抓住客观事物的内在联系,不能把统计问题简单归结为数学问题。
3.举例说明离散型变量和连续型变量。
答:(1)离散型变量是指其数值只能用自然数或整数单位计算的变量。如,企业个数、职工人数、设备台数等。(2)连续型变量是指在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸、人体测量的身高、体重、胸围等为连续型变量。
第二章 数据的收集、整理与显示
2.1 复习笔记
一、统计数据的收集
1.统计数据的收集方法(1)概念
统计数据收集是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地收集反映客观现实的统计资料的过程。(2)统计数据收集的方式
①直接向调查对象收集反映调查单位的统计数据(或称原始资料);
②收集已经加工、整理过的、说明总体现象的数据(一般称为二手资料)。(3)统计数据的分类
按其性质不同划分为调查数据和试验数据。(4)统计数据收集的方法
①直接观察法:由调查人员到现场直接对调查对象进行观察点数和计量。
②报告法(通讯法):一般是由统计工作机构将调查表格分发或电传给被调查者,被调查者则根据填报的要求将填好的调查表格寄回。
③采访法:是根据被调查者的答复来收集统计资料,又可分为口头询问法和被调查者自填法。
口头询问法是由调查人员对被调查者逐一采访,当面填答;被调查者自填法,即调查人员把调查表交给被调查者,由被调查者按实际情况填写,而后交调查人员审核收回。
④登记法:是由有关的组织机构发出通告,规定当事人在某事发生后到该机构进行登记,填写所需登记的材料。
⑤其他方法:计算机、网络、光电技术、卫星遥感、地理信息系统等高新技术已经或正在被广泛地引入统计数据收集的领域中(例如,上述各种调查方法都可以与网络相结合,形成网络调查)。
2.统计调查方式(1)定义
调查方式是指组织收集调查数据的形式与方法。(2)分类
①按调查的范围划分:全面调查和非全面调查。
全面调查是对调查对象的所有单位一一进行调查;非全面调查是对调查对象其中的一部分单位进行调查,以取得调查对象的一部分资料,用来推断总体或反映总体的基本情况。
②按时间标志划分:连续性(经常性)调查和不连续性(一次性)调查。
连续性(经常性)调查是指随着研究现象的变化,连续不断地进行调查登记;不连续性(一次性)调查是指间隔一段较长的时间对事物的变化进行一次性调查。(3)常用统计调查方式
①普查
普查是专门组织的一种全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料。对国情国力的调查一般采用普查。
a.主要特点
第一,属于非经常性的调查,一般间隔较长的时间才进行一次;
第二,属于全面调查,它比任何一种调查形式更能掌握大量、详细、全面的统计资料。
b.组织形式
第一,经过组织的普查机构,配备一定数量的普查人员,对调查单位直接进行登记(例如我国人口普查);
第二,利用调查单位的原始记录和核算资料,结合清库盘点,由调查单位自行填报调查表格(例如我国物资库存普查)。
②抽样调查
抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据所获得的样本数据,对调查对象总体特征作出具有一定可靠程度的推算,是一种非全面调查。
抽样调查可以分为概率抽样和非概率抽样:
概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征;非概率抽样是随便地或有意识地抽取单位进行调查,从而认识研究对象的变动情况或发展规律。一般不以样本数据推断总体数量特征,其调查误差也难以事先计算。
a.概率抽样的特点
第一,样本单位按随机原则抽取,排除了主观因素对选样的影响;
第二,根据部分调查的实际资料对调查对象总体的数量特征作出估计;
第三,抽样误差可以事先计算并加以控制。
b.抽样调查的适用场合
第一,针对一些不可能或不必要进行全面调查的社会现象;
第二,对普查资料进行必要的修正。
③重点调查
重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查。重点单位的选择主要着眼于它在所研究现象的标志总量中所占的比重。
重点调查的适用场合:当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,采用重点调查比较适宜。但重点调查无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。
④统计报表制度
统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。
a.主要特点
第一,报表资料的来源建立在各个基层单位原始记录的基础上,基层单位可利用其资料对生产、经营活动进行监督管理;
第二,由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料,了解本地区、本部门的经济和社会发展情况;
第三,由于统计报表是属于经常性(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。
b.局限性
随着社会主义市场经济的发展,统计调查单位变动频繁,再加上决策主体和利益主体的多层次化,各方面对统计数字真实性的干扰明显增加,从而影响统计数据的准确性。
3.统计调查体系(1)统计调查体系是一个国家开展统计调查方法和制度的总称。(2)我国新的统计调查体系是以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的调查体系。(3)我国的统计调查体系还采用科学的推算方法,即统计推算。
①定义:统计推算是在不可能或不必直接通过调查取得资料的情况下,根据已掌握的资料,运用各种统计方法进行科学的估计推算,以间接方式取得所需的资料。
②分类:静态推算(对同一时期内的未知项所作的推算)和动态推算(针对未来的时期所作的推算)。
③内容:从一个现象推算另一现象、从局部推算总体、从现在推算未来。
④方法:比例推算法、因素估算法、平衡估算法、线性插值法、拉格朗日插值法及各种动态数列的预测方法等。
4.统计调查的方案设计(1)明确调查目的。明确统计调查要解决什么问题,只有明确调查目的,数据的搜集工作才能有序地进行。(2)确定调查对象和调查单位。
①调查对象:是指需要调查的现象总体。
②调查单位:是指所要调查的具体单位,它是进行调查登记的标志的承担者。
③报告单位:亦称填报单位,是负责向上报告调查内容、提交统计资料的单位。
④调查单位与报告单位的区别:报告单位一般是在行政上、经济上具有一定独立性的单位。而调查单位可以是个人、企事业单位,也可以是物。根据不同的调查目的,调查单位与报告单位,有时是一致的,有时不一致。
注意:对于抽样调查,确定调查对象就是明确目标总体,这是建立抽样框的前提。抽样调查单位是构成抽样框的基本要素。进行抽样调查方案设计,还应包括确定样本量的大小、样本的抽取方式和抽样的组织形式。(3)设计调查项目。调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质标志和数量标志所构成。(4)设计调查表格和问卷。
调查表一般包括一览表和单一表两种形式;问卷调查是一种特殊的调查形式,常用于民意测验或市场调查。(5) 确定调查时间。包括调查时间和调查期限两种含义:
调查时间是指调查资料所属的时间,若所调查的是时期现象,就要明确规定调查资料所反映的起止日期,若调查时点现象,则调查时间为规定的统一标准时点;调查期限是进行调查工作的时限,包括收集资料和报送资料的工作所需的时间,应尽可能缩短。(6) 组织实施调查计划。调查组织工作包括确定调查机构,组织和培训调查人员,落实调查经费的来源和开支办法,确定调查数据的处理方法、报送方式和公布调查结果的时间。(7) 调查报告的撰写。
5.二手资料的主要来源渠道(1)统计年鉴。主要有 《中国统计年鉴》、《国际统计年鉴》、地方统计年鉴和《中国统计摘要》等。(2)有关期刊。主要有《中国经济景气月报》、《中国经济数据分析》和《经济预测分析》等。(3)有关网站。主要有中国统计信息网、国研网、中国经济信息网和中国经济时报网等。
二、统计数据的整理
1.数据整理概述(1)两种含义:第一种是指对统计调查所收集到的各种数据进行分类和汇总,称为汇总性整理;第二种是对现成的综合统计资料进行整理。(本节所指为第一种含义)(2)数据整理的内容
统计汇总方案的设计包括两方面:
①确定总体的处理方法。主要是如何对所要研究的总体进行统计分组。
②确定汇总哪些统计指标。汇总方案确定之后,可根据汇总方案,进行数据处理,计算各项指标数值。并利用统计表或统计图的形式,描述整理的结果。(3)数据整理的程序
①统计资料的审核。检查原始数据的完整性与准确性。
②资料的分组和汇总。对全部调查数据资料,按其性质和特点分组归类,上机进行数据处理,综合汇总形成各项统计指标。
③编制统计表或绘制统计图。
④统计数据资料的积累、保管和公布。
2.统计分组(1)统计分组的概念
根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。统计分组的对象是总体,分组标志可以是品质标志,也可以是数量标志。(2)统计分组的种类
①按分组标志的多少划分:简单分组和复合分组;
简单分组就是对研究现象按一个标志进行分组,它只能从某一方面说明和反映事物的分布状况和内部结构;复合分组是用两个或两个以上标志分组,即先按一个标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成更小的组。
②按分组标志的性质划分:品质分组(或称属性分组)和数量分组(或称变量分组)。
品质分组就是按品质(或属性)标志进行分组,适用于以定类尺度(列名尺度)或定序尺度(顺序尺度)计量的数据;数量分组就是按数量标志分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。(3)统计分组的原则
①穷尽原则:指总体中的每一个单位都应有组可归,或者说给出的各分组足以容纳总体所有的单位。
②互斥原则:指在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时归属于几个组。(4)品质分组的方法
有些品质分组比较简单,分组标志一经确定,组的名称和组数也随之确定。有些品质分组还取决于统计分析对分组层次的不同要求,对于一些类别繁多的分组又称为分类。(5)数量分组的方法
按数量标志分组,应注意两个问题:首先,分组时各组数量界限的确定必须能反映事物质的差别;其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。
①单项式分组与组距式分组
单项式分组:是指用一个变量值作为一组,形成单项式变量数列。一般适用于变动范围不大的离散型变量。
组距式分组:是将变量依次划分为几段区间,一段区间表现为从“……到……”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。一般适用于连续型变量或者变动范围较大的离散型变量。
②间断型组距式分组和连续型组距式分组
在组距式分组中,每一组变量值的最小值为下限,最大值为上限。组距是上下限之间的距离,相邻两组的界限,称为组限。
凡是组限不相连的,称为间断型组距式分组;凡是组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限,称为连续型组距式分组。连续型变量,只能采用连续组距式分组。
注意:遵循“上限不在内”原则,即凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。
③等距分组与异距分组
等距分组:是指标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。适用于标志值变动比较均匀的情况。优点是便于计算,便于绘制统计图。
异距分组:是指各组的组距不相等。适用于标志值分布很不均匀的场合、标志值相等的量具有不同意义的场合、标志值按一定比例发展变化的场合等。
④组距式分组相关指标的计算
a.连续型组距式分组的组距=本组上限-本组下限
间断型组距式分组的组距=本组上限-本组下限+1
b.组数:组数的多少与组距的大小有直接关系。组距大,组数就少;组距小,组数就多。美国学者斯特杰斯提出确定组数和组距的一种经验公式,即斯特杰斯经验公式:
式中,n为组数,N为总体单位数,d为组距,R为全距,即最大变量值与最小变量值之差。
c.组中值:上下限之间的中点数值称为组中值,组中值的计算公式为:
在计算平均指标或进行其他统计分析时,常以组中值来代表各组标志值的平均水平。当各组标志值均匀分布时,组中值代表各组标志值的水平其代表性就高。
注意:当连续型变量按离散型变量表示时,组距数列的编制采取相邻组限不重叠的形式,组中值的确定应考虑到连续型变量自身的特点。
d.开口组的组距与组中值:在编制组距式变量数列时,使用“××以上”或“××以下”这样不确定组距的组,称为开口组。开口组的组距是以相邻组的组距为本组的组距。
3.频数分布(1)频数分布的基本概念
在统计分组的基础上,可以将总体所有的单位按某一标志进行归类排列,并计算其相应出现的次数,所得的分布称为频数分布(或次数分布)。通过对零乱的、分散的原始资料进行有次序的整理,形成一系列反映总体各组之间单位分布状况的数列,即分布数列。
①分布数列的分类:品质分布数列(亦称品质数列)和变量分布数列(亦称变量数列)。
品质数列是按品质标志分组所形成的数列;变量数列是按数量标志分组所形成的数列。
②分布数列二要素
a.总体按某标志所分的组;
b.各组所出现的单位数,即频数(亦称次数)。
注意:对于变量数列,总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,一般用表示;频数(次)用表示。
③频率:将各标志出现的频数与总体单位总和相除可以得到频率,其性质包括:
a.任何频率都是介于0和1之间的一个分数;
b.各组频率之和等于1。
④频数密度与频率密度
为消除异距分组所造成的影响须计算频数密度和频率密度,其计算公式为:
频数密度=频数/组距
频率密度=频率/组距
各组频数密度与各组组距乘积之和等于总体单位数,各组频率密度与各组组距乘积之和等于1。
4.累计频数与累计频率(1)向上累计频数(或频率)分布:表明某组上限以下的各组单位数之和占总体单位数的比重。其方法是先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。(2)向下累计频数(或频率)分布:表明某组下限以上的各组单位数之和占总体单位数的比重。其方法是先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。
三、统计数据的显示
1.统计表
(1)统计表的定义和结构
①定义
统计表是指分析表和容纳各种统计资料的表格,它可以有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。
②结构
a.从表式上看,包括:总标题、横行标题、纵栏标题和指标数值;
总标题:是统计表的名称,它扼要地说明该表的基本内容,并指明时间和范围
横行标题:是横行的名称,一般放在表格的左方
纵栏标题:是纵栏的名称,一般放在表格的上方
指标数值列:用来说明总体及其组成部分的数量特征,位于横行和纵栏的交叉处,是统计表格的核心部分
b.从内容上看,包括:统计表由主词栏和宾词栏。
主词栏:是统计表所要说明的总体及其组成部分
宾词栏:是统计表用来说明总体数量特征的各个统计指标
此外,统计表还有补充资料、注解、资料来源、填表单位和填表人等。(2) 统计表的分类
①按主词的结构划分:
a.简单表:主词未经任何分组的统计表称为简单表;
b.简单分组表:主词只按一个标志进行分组形成的统计表,也称简单分组表;
c.复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。
②按宾词设计划分:
a.宾词简单排列:宾词不进行任何分组,按一定顺序排列在统计表上;
b.宾词分组平行排列:宾词栏中各分组标志彼此分开,平行排列;
c.宾词分组层叠排列:统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起。
③主词分组与宾词分组的区别:
主词分组的结果使总体分成许多组成部分,它们需要用统计指标(宾词)来描述,具有独立的意义;宾词分组的结果并不增加统计总体的各组成部分,仅仅是比较详细地描述总体已有的各个组成部分,从属于主词的要求。(3)统计表的设计
总体要求是:简练、明确、实用、美观,便于比较。注意事项如下:
①线条的绘制。统计报表的上下端以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。
②合计栏的设置。统计表各纵列若需要合计时,一般应将合计列在最后一行,各横行若需要合计时,可将合计列在最前一栏或最后一栏。
③标题设计。统计表的总标题,横行、纵栏标题应简明扼要,统计资料的内容、资料所属的空间和时间范围应以简练而又准确的文字表述。
④指标数值。表中数字应该填写整齐,对准位数。当数字小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“…”表示;不应有数字时用符号“一”表示。
⑤计量单位。统计表必须注明数字资料的计量单位。
⑥注解或资料来源。必要时,在统计表下应加注解或说明,以便查考。
2.统计图(1)直方图
直方图是用直方形的宽度和高度来表示次数分布的图形。绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方),若没有比率,直方图只保留左侧的次数。(2)折线图
折线图是以线段的起伏表示其数量分布的特征。绘图时,可以在直方图的基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成。(3)曲线图
当变量数列的组数无限多时,折线便表现为一条平滑曲线。曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。(4)累计曲线图
①累计曲线图的绘制
累计曲线图包括向上累计频数(频率)分布图和向下累计频数(频率)图。
在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即向上累计曲线;在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即向下累计曲线。
向上累计曲线呈上升状,向下累计曲线呈下降状。组的次数(或频率)越少,曲线显得越平缓;组的次数(或频率)越多,曲线显得越陡峭。
②洛伦茨曲线图
美国的洛伦茨博士把累计频数(或频率)分布曲线运用于研究社会财富、土地和工资收入的分配是否公平。这种累计曲线又称洛伦茨曲线图。其绘制方法如下:
a.将分配对象和接受分配者的数量化成结构相对数并进行向上累计;
b.纵轴和横轴均为百分比尺度,纵轴自下而上,用以测定分配的对象(如一国的财富、土地或收入等的分配状况),横轴由左向右用以测定接受分配者(如一个地区人口);
c.根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点并使之平滑化,所得曲线即所要求的洛伦茨曲线。图2-1
如图2-1所示,横轴是累积的人口百分比,纵轴是累积的收入或财富百分比。用实际收入分配曲线与绝对平等线所包围的面积对比总面积,计算基尼系数,计算公式如下:
式中:A表示实际收入L曲线与绝对平均线(对角线)之间的面积;B表示实际收入L曲线与绝对不平均线之间的面积。基尼系数值越小,即实际收入分配曲线越靠近绝对平等线,则收入分配越平等;反之,基尼系数值越大。
3.频(次)数分布图的类型(1)钟型分布
钟型分布的特征是“两头小,中问大”,即中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口古钟。(2)U型分布
与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U型分布。(3)J型分布
J型分布有两种类型:一种是次数随着变量的增大而增多;另一种呈反J型分布,即次数随着变量增大而减少。
四、Excel在统计整理与统计图表中的应用
1.编制分布数列
编制分布数列的两种方法:
①使用相关的函数(如Countif函数、Dcount数据库函数或Frequency函数)。
②应用[直方图]分析工具。
注意:[直方图]分析工具与Frequency函数在编制分布数列时,并不符合统计分组的“上限不在内”原则,在实际应用时必须进行调整。
2.绘制统计图
Excel可以绘制出各种各样的统计图形,如直方图、折线图、曲线图、饼图、散点图、雷达图等。
注意:Excel中的图表类型与统计中的图表类型并不完全一样,如Excel中的“散点图”既包括了统计上的散点图,又包括了统计上的曲线图。
2.2 课后习题详解
一、单项选择题
1.统计调查对象是( )。
A.总体各单位标志值
B.总体单位
C.现象总体
D.统计指标 【答案】C【解析】统计调查对象是需要进行调查的社会经济现象的总体,它是由性质上相同的许多调查单位组成的。
2.我国统计调查体系中,作为“主体”的是( )。
A.经常性抽样调查
B.必要的统计报表
C.重点调查及估计推算等
D.周期性普查【答案】A【解析】统计调查体系是一个国家开展统计调查方法和制度的总称。我国现行的统计调查体系是:以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。
3.要对某企业生产设备的实际生产能力进行调查,则该企业的“生产设备”是( )。
A.调查对象
B.调查单位
C.调查项目
D.报告单位【答案】A【解析】调查对象是指需要调查的现象总体,调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。对于本题,该企业的所有生产设备为调查对象,而企业的每个生产设备为调查单位。与调查单位不同,报告单位是负责向上报告调查内容、提交统计资料的单位,它一般在行政上、经济上具有一定独立性。而调查单位可以是个人、企事业单位,也可以是物。根据不同的调查目的,两者有时一致,有时不一致。对于本题,报告单位是该企业。
二、多项选择题
1.下面哪些现象适宜采用非全面调查?( )
A.企业经营管理中出现的新问题
B.某型号日光灯耐用时数检查
C.某地区居民储蓄存款
D.某地区森林的木材积蓄量【答案】ABCD【解析】统计调查按调查对象的范围不同,可分为:全面调查和非全面调查。全面调查是对构成调查对象的所有单位进行逐一的、无一遗漏的调查,包括全面统计报表和普查;非全面调查是对调查对象中的一部分单位进行调查,包括非全面通缉报表、抽样调查、重点调查和典型调查等。非全面调查是对调查对象其中的一部分单位进行调查,以取得调查对象的一部分资料,用来推断总体或反映总体的基本情况。ABCD四项宜采用非全面调查法。
2.抽样调查( )。
A.是一种非全面调查
B.是一种非连续性的调查
C.可以消除抽样误差
D.应遵循随机原则【答案】ABD【解析】抽样调查是,一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。可分为概率抽样和非概率抽样。习惯上将概率抽样称为抽样调查。概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
3.洛伦茨曲线( )。
A.是一种向下累计曲线
B.可用于反映财富的分布曲线
C.用以衡量收入分配公平与否
D.越接近对角线基尼系数越大【答案】BC【解析】美国的洛伦茨博士把累计频数(或频率)分布曲线运用于研究社会财富、土地和工资收入的分配是否公平,又称洛伦茨曲线,是一种向上累计曲线。用实际收入分配曲线与绝对平等线所包围的面积对比总面积,计算基尼系数,以它衡量收入分配的平等与否。基尼系数值越小,即实际收入分配曲线越靠近绝对平等线,则收入分配越平等。
三、分析判断题
1.有人说抽样调查“以样本资料推断总体数量特征”,其误差肯定比全面调查的误差大,你认为呢?
答:这种说法不对。从理论上分析,统计上的误差可分为登记性误差、代表性误差和推算误差。无论是全面调查还是抽样调查都会存在登记误差。而代表性误差和推算误差则是抽样调查所固有的。这样从表面来看,似乎全面调查的准确性一定会高于统计估算。但是,在全面调查的登记误差特别是其中的系统误差相当大,而抽样调查实现了科学化和规范化的场合,后者的误差也有可能小于前者。我国农产量调查中,利用抽样调查资料估算的粮食产量数字的可信程度大于全面报表的可信程度,就是一个很有说服力的事例。
2.过去统计报表在我国统计调查体系中占据统治地位多年,为什么现在要缩小其使用范围?
答:统计报表制度是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。
统计报表主要特点有:第一,报表资料的来源建立在各个基层单位原始记录的基础上,基层单位可利用其资料对生产、经营活动进行监督管理;第二,由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料,了解本地区、本部门的经济和社会发展情况;第三,由于统计报表是属于经常性(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。
但随着社会主义市场经济的发展,统计报表的局限性显现出来:统计调查单位变动频繁,再加上决策主体和利益主体的多层次化,各方面对统计数字真实性的干扰明显增加,从而影响统计数据的准确性;此外,统计报表的日常维持需要大量的人力、物力、财力;而且统计报表的统计指标、指标体系不容易调整,对现代社会经济调查来说很不合适。因此,现在逐渐缩小其使用范围。
3.对足球赛观众按男、女、老、少分为四组以分析观众的结构,这种分组方法合适吗?
答:这种分组方法不合适。科学的统计分组应遵循两个原则:(1)符合“穷尽原则”,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体的所有单位;(2)遵守“互斥原则”,即总体任一单位都只能归属于一组,而不能同时或可能归属于几个组。
本题所示的分组方式违反了“互斥性原则”,例如,一观众是少女,若按以上分组,她既可被分在女组,又可被分在少组。
4.以一实例说明统计分组应遵循的原则。
试读结束[说明:试读内容隐藏了图片]