贾俊平《统计学》(第7版)笔记和课后习题(含考研真题)详解(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-05 23:26:40

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

贾俊平《统计学》(第7版)笔记和课后习题(含考研真题)详解

贾俊平《统计学》(第7版)笔记和课后习题(含考研真题)详解试读:

第1章 导 论

1.1 复习笔记

一、统计学

1统计学

统计学是收集、处理、分析、解释数据并从数据中得出结论的科学,其目的是探索数据内在的数量规律性。

数据收集是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。

2数据分析所用的方法(1)描述统计:研究数据收集、处理、汇总、图表描述、概括与分析的统计方法;(2)推断统计:研究如何利用样本资料来推断总体特征的统计方法。

3统计学的应用领域(1)企业发展战略(2)产品质量管理(3)市场研究(4)财务分析(5)经济预测(6)人力资源管理

二、统计数据的类型

1分类数据、顺序数据、数值型数据(按计量尺度不同分类)(1)分类数据:只能归于某一类别的非数字型数据,是对事物进行分类的结果,数据表现为类别,一般用文字来表述;(2)顺序数据:只能归于某一有序类别的非数字型数据,数据表现为类别,但类别有序;(3)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。

关系:(1)分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据;(2)对不同类型的数据,可采用不同的统计方法来处理和分析。例如,对分类数据可以计算出各类别的频率,但对其进行加、减、乘或除等数学运算是没有意义的。而数值型数据则可以进行数学运算,比如计算均值和方差等统计量。

2观测数据和实验数据(按收集方法分类)(1)观测数据:通过直接调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的;(2)实验数据:在实验中控制实验对象以及所处的实验环境而收集到的数据。

3截面数据和时间序列数据(按被描述的现象与时间的关系分类)(1)截面数据:又称为静态数据,它是指在同一时间对同一总体的数量进行观察而获得的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;(2)时间序列数据:又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。

三、统计中的几个基本概念

1总体和样本(1)总体

①总体、个体

总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体的每一个元素称为个体。

②总体的分类

根据总体所包含的单位数目是否可数可以分为:

a.有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的;

b.无限总体:指总体所包括的元素是无限的,不可数的。(2)样本、样本量

①样本:从总体中抽取的部分单位组成的集合;

②样本量:构成样本的单位的数目。

2参数和统计量(1)参数

参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等,参数是一个未知的常数。(2)统计量

统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、样本比例等,统计量不含任何未知的参数。

3变量(1)变量、变量值

①变量:说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化,可以有两个或更多个可能的取值。

②变量值:变量的具体取值。(2)变量的类型

①分类变量

是说明事物类别的一个名称,其取值是分类数据。

②顺序变量

是说明事物有序类别的一个名称,其取值是顺序数据。

③数值型变量

是说明事物数字特征的一个名称,其取值是数值型数据。根据其取值的不同,又可以分为:

a.离散型变量:只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举;

b.连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举。(3)变量的其他分类

①随机变量、非随机变量

②经验变量、理论变量

经验变量所描述的是周围环境中可以观察到的事物;理论变量是由统计学家用数学方法所构造出来的一些变量。

1.2 课后习题详解

一、思考题

1什么是统计学?

答:统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,统计所研究的是来自各领域的数据。数据收集即取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。

2解释描述统计和推断统计。

答:数据分析所用的方法可分为描述统计方法和推断统计方法。(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。

3统计数据可分为哪几种类型?不同类型的数据各有什么特点?

答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。

①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;

②顺序数据也表现为类别,但这些类别之间是有顺序的;

③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。

①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;

②实验数据是在实验中通过控制实验对象收集到的数据,自然科学领域的大多数数据都是实验数据。(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。

①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;

②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。

4解释分类数据、顺序数据和数值型数据的含义。

答:(1)分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。为便于统计处理,可以用数字代码来表示各个类别。(2)顺序数据是只能归于某一有序类别的非数字型数据。顺序数据表现为有序的类别。(3)数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。

分类数据和顺序数据说明的是事物的品质特征,因此可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,因此也可称为定量数据或数量数据。

5举例说明总体、样本、参数、统计量、变量这几个概念。

答:(1)总体是包含所研究的全部个体(数据)的集合。比如,要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。(2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。比如,从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。(3)参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。比如总体平均数、总体标准差、总体比例等。(4)统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的_函数。比如,样本平均数用x表示,样本标准差用s表示,样本比例用p表示等。(5)变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察,结果会呈现出差别或变化。如“商品销售额”“受教育程度”“产品的质量等级”等都是变量。变量的具体取值称为变量值。

6变量可分为哪几类?

答:变量可以分为:(1)分类变量,是说明事物类别的一个名称,其取值是分类数据;(2)顺序变量,是说明事物有序类别的一个名称,其取值是顺序数据;(3)数值型变量,是说明事物数字特征的一个名称,其取值是数值型数据。

7举例说明离散型变量和连续型变量。

答:(1)离散型变量是指其数值只能用自然数或整数单位计算的变量。如,企业个数、职工人数、设备台数等。(2)连续型变量是指在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸、人体测量的身高、体重、胸围等都是连续型变量。

8请举出统计应用的几个例子。

答:统计应用举例如下:(1)每隔10年进行一次的全国人口普查;(2)对居民手存现金情况的调查;(3)对某学校历年考研成绩的调查。

9请举出应用统计的几个领域。

答:应用统计的领域:(1)企业发展战略;(2)人力资源管理;(3)企业进行市场研究;(4)财务分析;(5)经济预测;(6)企业产品质量管理。

二、练习题

1指出下面变量的类型。(1)年龄。(2)性别。(3)汽车产量。(4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。

答:变量可以分为:分类变量、顺序变量和数值型变量。(2)(5)属于分类变量;(4)属于顺序变量;(1)(3)属于数值型变量。

2某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。要求:(1)描述总体和样本。(2)指出参数和统计量。

答:(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”。(2)参数是“城市所有职工家庭的年人均收入”,统计量是“抽取的2000个家庭计算出的年人均收入”。

3一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在15000元以上,50%的人回答他们的消费支付方式是用信用卡。

回答以下问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?

答:(1)总体是“所有IT从业者”;(2)月收入是数值型变量;(3)消费支付方式是分类变量;(4)这项研究涉及的是截面数据。

4一项调查表明,消费者每月在网上购物的平均花费是2000元,他们选择在网上购物的主要原因是“价格便宜”。

回答以下问题:(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?(3)研究者所关心的参数是什么?(4)“消费者每月在网上购物的平均花费是2000元”是参数还是统计量?(5)研究者所使用的主要是描述统计方法还是推断统计方法?

答:(1)这一研究的总体是“所有的网上购物者”;(2)“消费者在网上购物的原因”是分类变量;(3)研究者所关心的参数是“所有的网上购物者的月平均花费”;(4)“消费者每月在网上购物的平均花费是2000元”是统计量;(5)研究者所使用的主要是推断统计方法。

1.3 典型习题详解

一、单项选择题

1下列选项中,属于分类变量的有(  )。

A.年龄

B.工资

C.汽车产量

D.性别(男、女)【答案】D【解析】分类变量是说明事物类别的一个名称,其取值是分类数据,例如颜色可以分为红、橙、黄、绿等,性别可以分为男、女。数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,ABC三项都是数值型变量。

2下列选项中,属于数值型变量的有(  )。

A.年龄

B.性别

C.购买商品时的支付方式(现金、信用卡、支票)

D.员工对企业某项改革措施的态度(赞成、中立、反对)【答案】A【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据;BC两项是分类变量,说明的是事物的类别;D项是顺序变量,赞成、中立、反对是三种有序的态度类别。

3某研究部门准备在全市500万个家庭中抽取5000个家庭,推断该城市所有职工家庭的年人均消费。这项研究的总体是____、样本是____、参数是____。(  )

A.500万个家庭;500万个家庭的人均消费;5000个家庭

B.500万个家庭的人均消费;500万个家庭;5000个家庭

C.500万个家庭;5000个家庭;500万个家庭的人均消费

D.500万个家庭的人均消费;5000个家庭;500万个家庭【答案】C【解析】总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成;样本是从总体中抽取的一部分元素的集合;参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。

4对某市高等学校科研所进行调查,统计总体是(  )。

A.某市所有的高等学校

B.某一高等学校科研所

C.某一高等学校

D.某市所有高等学校科研所【答案】D【解析】总体是包含所研究的全部个体的集合。

5有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为(  )。

A.200个公司的全部职工

B.200个公司

C.200个公司职工的全部工资

D.200个公司每个职工的工资【答案】A

6下列属于数值型变量的是(  )。

A.月工资

B.学历

C.健康状况

D.性别【答案】A【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据;BC两项是顺序变量,学历和健康状况的取值都是有序的;D项是分类变量。

7某研究部门准备在全市500万个家庭中抽取5000个家庭,推断该城市所有职工家庭的年人均消费。这项研究的统计量是(  )。

A.5000个家庭

B.500万个家庭

C.5000个家庭的年人均消费

D.500万个家庭的年人均消费【答案】C【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差、样本比例等。5000个家庭的年人均消费为样本平均数,因此为统计量。A项为样本容量;B项为总体;D项为参数。

8某省的统计机构要考察本省居民的人均住房面积。随机抽取了8000个家庭进行调查。这里的总体是(  )。

A.本省所有居民

B.本省所有居民的住房面积

C.8000户家庭

D.8000户家庭的住房面积【答案】A【解析】总体是包含所研究的全部个体的集合。

9在同一时间序列中,各指标值的时间单位一般要求(  )。

A.必须为月

B.必须为年

C.相同

D.必须为日【答案】C【解析】同一时间序列中,各指标值的时间单位一般要求相同,这样在分析研究中无须考虑时间单位不同所造成的差异。

10某地区2009~2018年的每年年末人口数是(  )。

A.时间序列数据

B.截面数据

C.分类数据

D.顺序数据【答案】A【解析】时间序列数据是是按时间顺序,在不同时间上收集到的数据,用于描述现象随时间变化的情况。截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。年末人口数是数值型数据。

112018年城镇家庭的人均收入数据属于(  )。

A.分类数据

B.顺序数据

C.截面数据

D.时间序列数据【答案】C【解析】城镇家庭的人均收入数据属于数值型数据;截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。时间序列数据是是按时间顺序,在不同时间上收集到的数据,用于描述现象随时间变化的情况。

12下列不属于描述统计问题的是(  )。

A.根据样本信息对总体进行的推断

B.了解数据分布的特征

C.分析感兴趣的总体特征

D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】数据分析方法可以分为描述统计方法和推断统计方法。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。BCD三项都属于描述统计问题。

13某大学的一位研究人员希望估计该大学本科生平均每月的生活费支出,为此,他调查了200名学生,发现他们每月平均生活费支出是600元。该统计量是(  )。

A.该大学的所有学生

B.所有大学生的总生活费支出

C.该大学所有的在校本科生

D.200名学生每月平均生活费支出【答案】D【解析】统计量是样本的函数,是用来描述样本特征的概括性数字度量。200名学生的月平均生活费支出是根据样本数据计算得到的,是一个统计量。

14在下列叙述中,采用推断统计方法的是(  )。

A.用饼图描述某企业职工的年龄构成

B.某日从某食品厂随机抽取了50袋饼干,利用这50袋饼干的平均重量估计这天生产的所有袋装饼干的平均重量

C.一个城市在1月份的平均汽油价格

D.反映大学生统计学成绩的条形图【答案】B【解析】ACD三项属于描述统计。

15一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。该调查所收集的数据是(  )。

A.分类数据

B.顺序数据

C.数值型数据

D.实验数据【答案】A【解析】分类数据是指只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。实验数据是在实验中控制实验对象而收集到的数据,观测数据是通过调查或观测而收集到的数据,故该调查所搜集的数据为观测数据而非实验数据。

16根据样本计算的用于推断总体特征的概括性度量值称作(  )。

A.参数

B.总体

C.样本

D.统计量【答案】D【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差、样本比例等。

17为了估计某城市中拥有空调的家庭比例,抽取500个家庭的一个样本,得到拥有空调的家庭比例为80%,这里的80%是(  )。

A.参数值

B.统计量的值

C.样本量

D.变量【答案】B

18到商场购物停车变得越来越困难,管理人员希望掌握顾客找到停车位的平均时间。为此某一个管理人员跟踪了50名顾客并记录下他们找到车位的时间。这里管理人员感兴趣的总体是(  )。

A.管理人员跟踪过的50名顾客

B.上午在商场停车的顾客

C.在商场停车的所有顾客

D.到商场购物的所有顾客【答案】C【解析】总体是包含所研究的全部个体的集合,A项为总体的样本。

19只能归于某一有序类别的非数字型数据称为(  )。

A.分类数据

B.顺序数据

C.数值型数据

D.观测数据【答案】B【解析】分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。按照统计数据的收集方法,可以将其分为观测数据和实验数据。观测数据是通过调查或观测而收集到的数据;实验数据则是在实验中控制实验对象而收集到的数据。

20通过调查或观测而收集到的数据称为(  )。

A.观测数据

B.实验数据

C.时间序列数据

D.截面数据【答案】A【解析】观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物实施人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。实验数据是在实验中通过控制实验对象而收集到的数据。时间序列数据和截面数据是按被描述的现象与时间的关系进行分类得到的。

21最近发表的一份报告称,“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”。这一结论属于(  )。

A.对样本的描述

B.对样本的推断

C.对总体的描述

D.对总体的推断【答案】D【解析】推断统计是研究如何利用样本数据来推断总体特征的统计方法。现实中常常通过对样本的研究来推断总体的相关特征。

二、多项选择题

1按照所采用的计量尺度,统计数据可以分为(  )。

A.分类数据

B.实验数据

C.顺序数据

D.二手数据

E.数值型数据【答案】ACE【解析】按照所采用的计量尺度,统计数据可以分为三类:①分类数据:由定类尺度计量形成的,表现为类别,通常用文字表述,但不区分顺序;②顺序数据:由定序尺度计量形成的,表现为类别,通常用文字表述,但有顺序;③数值型数据:由定距尺度和定比尺度计量形成的,说明的是现象的数量特征,通常用数值来表现。

2数值型变量根据其取值的不同,可以分为(  )。

A.离散变量

B.顺序变量

C.连续变量

D.随机变量

E.非随机变量【答案】AC【解析】数值型变量根据其取值的不同,又可以分为离散变量和连续变量。其中,离散变量只能取有限值,而且其取值都以整位数断开,可以一一列举;连续变量可以取无穷多个值,其取值是连续不断的,不能一一列举。

3分类数据和顺序数据统称(  )。

A.二手数据

B.定性数据

C.品质数据

D.定量数据

E.数值型数据【答案】BC【解析】分类数据和顺序数据所说明的都是事物的品质特征,通常用文字表述,其结果表现为类别,故分类数据和顺序数据统称为定性数据或品质数据。A项,二手数据说的是数据的来源,分类数据和顺序数据有可能是二手数据,也可能是一手数据。

4连续变量具有的特点包括(  )。

A.可以取无穷多个值

B.取值连续不断

C.只可以取有限值

D.其取值都以整位数断开

E.取值不能一一列举【答案】ABE【解析】CD两项描述的是离散变量的特点。

5下列数值型变量中,属于连续变量的有(  )。

A.年龄

B.温度

C.企业数

D.人口数

E.零件尺寸【答案】ABE【解析】ABE三项均可以取无穷多个值,其取值是连续不断的,不能一一列举,故属于连续变量;CD两项均只能取有限值,而且其取值都以整位数断开,可以一一列举,故属于离散变量。

第2章 数据的搜集

2.1 复习笔记

一、数据的来源

1数据的直接来源

数据的直接来源是指通过直接调查或实验活动直接获得一手数据,直接来源的数据又分为调查数据和实验数据。它们的不同之处在于:(1)调查数据为通过调查方法得到的数据,而实验数据为通过实验方法得到的数据。(2)调查数据通常是针对社会现象而获取的,而实验数据大多是针对自然现象而获取的;(3)调查数据通常取自有限总体,即总体所包含的个体单位是有限的;而实验数据是指在实验中通过控制实验对象所搜集到的变量的数据。

2数据的间接来源(1)间接来源的数据(二手资料)

如果与研究内容有关的原信息已经客观存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据。(2)二手资料的优点

搜集方便;数据采集快;采集成本低。(3)二手资料的作用

分析所要研究的问题;提供研究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻找研究问题的思路和途径。(4)二手资料的局限性

针对性不够;资料的相关性不够;口径可能不一致;数据也许不准确,也许过时等。(5)对二手资料进行评估的内容

①资料是谁搜集的?数据搜集者的实力和社会信誉度会在一定程度上影响数据说服力;

②搜集的目的是什么?为了某种特殊的利益而搜集的数据是值得怀疑的;

③数据是怎样搜集的?搜集数据的方法有很多,不同方法所采集到的数据,其解释力和说服力都是不同的。如果不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。数据的质量来源于数据的产生过程;

④什么时候搜集的?过时的数据的说服力会受到质疑。(6)使用二手数据的注意事项

使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。

二、调查方法

1概率抽样和非概率抽样(1)概率抽样

概率抽样(随机抽样):指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

①概率抽样的特点

a.抽样时是按一定的概率以随机原则抽取样本,随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中;

b.每个单位被抽中的概率是已知的,或是可以计算出来的;

c.当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。

②概率抽样的优点

概率抽样最主要的优点是可以依据调查结果,计算估计量误差,从而得到对总体目标量进行推断的可靠程度。还可以按照要求的精确度,计算必要的样本单位数目。这些为统计估计结果的评估提供了有力的依据。

③概率抽样与等概率抽样的区别

概率抽样是指总体中的每个单位都有一定的非零概率被抽中,单位之间被抽中的概率可以相等,也可以不等。

等概率抽样是指总体中的每个单位都以相等的非零概率被抽中,如果单位之间被抽中的概率不等,则称为不等概率抽样。

④概率抽样的方式

a.简单随机抽样

抽样框:抽样框通常包括所有总体单位的信息,它不仅提供了备选单位的名单以供抽选,还是计算各个单位入样概率的依据。

简单随机抽样:也称为纯随机抽样,指从包括总体N个单位的抽样框中随机地、一个一个地抽取n个单位作为样本,每个单位的入样概率是相等的。简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。

特点:简单、直观,在抽样框完整时,可以直接从中抽取样本,由于每个单位被选中概率相同,能比较方便的用样本统计量对目标量进行估计及计算估计量误差。

局限性:第一,它要求将包含所有总体单位的名单作为抽样框,当总体单位个数N很大时,很难构造这样的抽样框;第二,根据这种方法抽出的单位很分散,给实施调查增加了困难;第三,没有利用其他辅助信息以提高估计的效率。

b.分层抽样

概念:分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。

优点:第一,保证样本中含有总体各种特征的抽样单位,样本的结构与总体的结构相近,有效地提高估计的精度;第二,在一定条件下使组织实施调查更加方便(当层的划分是按行业或行政区划进行时);第三,在对总体参数进行估计的同时,也可以对各层的目标量进行估计等等。

缺点:整体差异不明显时不适用,在使用时需要与其他抽样方法综合使用。

c.整群抽样

概念:将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。

优点:与简单随机抽样相比,整群抽样的优点在于简化了编制抽样框的工作量,并且调查的地点相对集中,减少调查费用,易于调查实施。

缺点:整群抽样的主要缺点是估计的精度较差。在样本量相同的情况下,整群抽样的

抽样误差通常比较大,所以要得到与简单随机抽样相同的精度,需要增加基本调查单位。

d.系统抽样

概念:将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先制定好的规则确定其他样本单位,这种抽样方法称为系统抽样。

优点:操作简便,如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的精度。

缺点:对估计量方差的估计比较困难。

e.多阶段抽样

概念:采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查。因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样,将这种方法推广,使抽样的阶段数增多,就称为多阶段抽样。

优点:具有整群抽样的优点。第一,样本相对集中,减少调查费用;第二,不需要包含所有低阶段抽样单位的抽样框;第三,由于实行了再抽样,使调查单位在更广泛的范围内展开。

适用范围:在较大规模的抽样调查中,多阶段抽样是经常被采用的方法。(2)非概率抽样

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。表2-1 非概率抽样的方式(3)概率抽样与非概率抽样的比较

①概率抽样是依据随机原则抽选样本,样本统计量的理论分布存在,而非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的。

②概率抽样可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,而非概率抽样无法做到这些。

③概率抽样适合调查目的在于掌握研究对象总体的数量特征的调查,而非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做准备。

④概率抽样的技术含量高,要求有较高的统计学专业知识,调查的成本比较高,而非概率抽样操作简便,时效快,成本低,对抽样中的统计专业技术要求不是很高。

2搜集数据的基本方法

样本单位确定之后,对这些单位实施调查,即从样本单位那里得到所需要的数据,可以采用不同的方法,搜集数据的基本方法有以下几种。表2-2 搜集数据的基本方法

3数据搜集方法的选择

选择数据搜集方法时需要考虑的问题有:①抽样框中的有关信息;②目标总体的特征;③调查问题的内容;④有形辅助物的使用;⑤实施调查的资源;⑥管理与控制;⑦质量要求。

三种搜集数据方法的特点如表2-3所示。表2-3 搜集数据不同方法的特点

三、实验方法

搜集数据的另一类方法是通过实验,在实验中控制一个或多个变量,在有控制的条件下得到观测结果。实验数据是指在实验中控制实验对象而搜集到的变量的数据。

1实验组和对照组

实验法的基本逻辑:有意识地改变某个变量的情况(设为A项),然后看另一个变量变化的情况(设为B项)。如果B项随着A项的变化而变化,就说明A项对B项有影响。为此,需要将研究对象分为两组,一个为实验组,一个为对照组。

实验组:指随机抽选的实验对象的子集。在这个子集中,每个单位接受某种特别的处理。

对照组:每个单位不接受实验组成员所接受的某种特别的处理。

匹配:指对实验单位的背景材料进行分析比较,将情况类似的每对单位分别随机地分配到实验组和对照组。

随机:实验组和对照组的产生应遵循随机原则,即将实验单位随机地分配到实验组和随机组。

一个好的实验,实验组和对照组的产生不仅应该是随机的,而且应该是匹配的。

2实验中的若干问题

实验法的逻辑严密,是证明假设、分析事物因果关系的一个良好方式。但在实验过程中也会遇到一些问题:(1)人的意愿;(2)心理问题;(3)道德问题。

3实验中的统计(1)统计在实验过程中的作用

①确定进行实验所需要的单位的个数,以保证实验可以达到统计显著的结果;

②将统计的思想融入实验设计,使实验设计符合统计分析的标准;

③提供尽可能最有效的能同时研究几个变量影响的方法。(2)一个好的实验,应该在两个方面都有效:

①内部的有效性

内部的有效性意味着实验测量的准确性。实验的目的是要考察自变量和因变量之间的因果关系,而如果实验观察结果受到其他无关变量的影响,就很难推断自变量与因变量之间的因果关系。

②外部的有效性

外部的有效性决定是否可以将实验中发现的因果关系进行推广,即能否将结果推广到实验环境以外的情况。

四、数据的误差

数据的误差是指通过调查搜集到的数据与研究对象真实结果之间的差异。

1数据误差类型

据的误差有两类:抽样误差和非抽样误差。抽样误差是由抽样的随机性引起的样本结果与总体真值之间的差异。非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异。

抽样误差是一种随机性误差,只存在于概率抽样中;非抽样误差则不同,无论是概率抽样、非概率抽样,还是在全面调查中,都有可能产生非抽样误差。表2-4 两种误差类型

2数据误差影响因素(1)影响抽样误差大小因素

①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位的数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。

②总体的变异性。总体的变异性越大,即各单位之间的差异越大,抽样的误差也就越大;反之,总体的变异性越小,各单位之间越相似,抽样误差也就越小。如果所有的单位完全一样,调查一个就可以精确无误地推断总体,抽样误差也就不存在了。

③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。

④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性不同。通常将抽样误差作为比较各种抽样组织方式优劣的标准。(2)影响非抽样误差大小因素

现实生活中有很多原因造成非抽样误差,如抽样框误差,无回答误差等等。

3误差的控制(1)抽样误差的控制

抽样误差是由于抽样的随机性带来的,只要采用概率抽样,抽样误差就不可避免,控制抽样误差的主要方法是改变样本量,要求的抽样误差越小,所需要的样本量就越大。(2)非抽样误差的控制

非抽样误差与抽取样本的随机性无关,因而在概率抽样和非概率抽样中都会存在(但抽样框误差仅在概率抽样中存在)。有很多原因造成非抽样误差,因此控制起来比较困难。这里仅介绍几种简单方法。

①对于抽样框误差,构造抽样框时广泛地搜集有关信息,改进抽样框;

②对于无回答误差,可以从以下两方面进行控制。一方面是预防,即在调查前做好各方面的准备工作,尽量把无回答降到最低程度。另一方面,当无回答出现后,分析无回答产生的原因,采取一些补救措施。例如,在无回答单位中再抽取一个样本,实施更有力的调查,并以此作为无回答层的代表,和回答层的数据结合起来对总体进行估计;

③对于理解误差,要注意问卷中的措辞,一份好的调查问卷可以有效地减少理解调查误差,做好问卷设计是减少非抽样误差的一个方面;

④对于记忆误差,要缩短调查所涉及的时间间隔;

⑤对于有意识误差,要注重对调查过程进行控制的具体措施,对调查结果进行检验、评估,对现场调查人员进行奖惩的制度等。

2.2 课后习题详解

1什么是二手资料?使用二手资料需要注意些什么?

答:(1)如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为进行统计分析可以使用的数据,则称为间接来源的数据,即二手资料。(2)在使用二手资料前,对二手资料进行评估是必要的。对二手资料进行评估应考虑如下一些内容:

①资料是谁搜集的?这主要是考察数据搜集者的实力和社会信誉度。

②搜集的目的是什么?为了某个集团的利益而搜集的数据是值得怀疑的。

③数据是怎样搜集的?搜集数据可以有多种方法,不同方法所采集到的数据,其解释力和说服力都是不同的。如果不了解搜集数据所用的方法,很难对数据的质量做出客观的评价。数据的质量取决于数据的生产过程。

④什么时候搜集的?对于过时的数据,其说服力自然受到质疑。

另外,使用二手数据,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。

2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

答:(1)①非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因此无法使用样本的结果对总体相应的参数进行推断。非概率样本的特点是操作简便、时效快、成本低,而且对于抽样中的统计学专业技术要求不是很高。

②概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据样本的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间;在进行抽样设计时,对估计的精度提出要求,可以计算出所需要的样本量;概率抽样的技术含量更高,无论抽选样本还是对调查数据进行分析,都要求掌握较多的统计学专业知识,调查的成本也比非概率抽样的高。(2)①非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做准备。非概率抽样也适合市场调查中的概念测试,如产品包装测试、广告测试等,这时不需要将调查结果投影到总体的情况。

②若调查的结果要求对总体的有关参数进行估计,计算估计的误差,得到总体参数的置信区间,并对估计的精度提出了要求,则应选择概率抽样,如调查不同年龄层的消费水平等。

3调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法?

答:搜集数据的方法除了自填式、面访式、电话式,还有观察式,即调查人员通过直接观测的方法获取信息,如利用安置在超市中的录像设备观察顾客挑选商品时的表情;在十字路口通过计数的方法估算车流量等。

4自填式、面访式、电话式调查各有什么利弊?

答:(1)①自填式的长处:

a.调查组织者对自填式方法的管理相对容易,只要把问卷正确地送达被调查者手中即可;

b.调查成本最低,增大样本量对调查费用的影响很小,所以可以进行大范围的调查;

c.被调查者可以选择方便的时间填答问卷,可以参考有关记录而不必依靠记忆进行回答。这种方式可以在一定程度上减小被调查者回答敏感问题的压力。

②自填式的弊端:

a.问卷的回收率比较低;

b.自填式方法不适合结构复杂的问卷,调查的内容会受局限;

c.调查周期通常都比较长;

d.对于在数据搜集过程中出现的问题,一般难以及时采取调改措施。(2)①面访式的长处:

a.可以激发被调查者的参与意识,提高调查的回答率;

b.调查员可以在现场解释问卷,回答被调查者的问题,对被调查者的回答进行鉴别和澄清,提高调查数据的质量,并且可以对识字率低的群体实施调查;

c.在问卷设计中可以采用更多的技术手段,使得调查问题的组合更为科学、合理。例如,可以借助其他调查工具(图片、照片、卡片、实物等)丰富调查内容;

d.能对数据搜集所花费的时间进行调节。

②面访式的弊端:

a.调查的成本比较高;

b.在调查过程的质量控制方面有一定难度;

c.对于敏感问题,在面对面条件下,被调查者通常不会像自填式方法下那样放松,也不愿意回答,还有可能会造假。(3)①电话式的长处:

a.速度快,能够在很短的时间内完成调查;

b.特别适合样本单位十分分散的情况,由于不需要支付调查员的交通费,数据搜集的成本比较低;

c.对调查员是安全的;

d.对访问过程的控制比较容易。

②电话式的缺点:

a.容易受电话工具的限制;

b.进行访问的时间不能太长;

c.调查所使用的问卷要简洁明了,问题不能太多;

d.由于不是面对面的交流,在被访者不愿意接受调查时,要说服他们会更困难。

5请举出(或设计)几个实验数据的例子。

答:实验数据是指在实验中控制实验对象而搜集到的变量的数据。例如:对在一起饲养的一群牲畜,分别喂给不同的饲料,以检验不同饲料对牲畜增重的影响;对其他条件完全相同的几块农田,分别施不同的肥料,以检验不同肥料对农田收成的影响。

6你认为应当如何控制调查中的回答误差?

答:回答误差是指被调查者在接受调查时给出的回答与真实情况不符。控制调查中的回答误差需要根据导致回答误差的原因进行分析,导致回答误差的原因有多种,主要有理解误差、记忆误差和有意识误差。(1)对于理解误差,要注意问卷中的措辞,设计一份好的调查问卷;(2)对于记忆误差,要缩短调查所涉及的时间间隔;(3)对于有意识误差,调查人员要做好被调查者的思想工作,让他们打消顾虑;调查人员要遵守职业道德,为被调查者保密;调查中尽量避免敏感问题。

7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。

答:针对无回答误差应做好预防工作,出现了无回答误差,要具体分析导致误差的原因,进行补救。(1)如果无回答误差是随机的,可以通过增大样本量的方式解决。

例如:调查设计要求完成1000个样本单位,结果回答了800个,无回答率为20%,这时可以再随机抽250个单位,并对其进行调查,如果无回答率仍旧为20%,就可以得到200个单位的回答。同时还应增加调查员的责任心和耐心。(2)如果无回答误差是系统性误差,解决的途径主要在两个方面:

①预防,即在调查进行前做好各方面的准备工作,尽量把无回答降到最低程度。例如,要调查某地区居民每月的生活费用支出,在可能的条件下,可充分利用调查组织者的权威性和社会影响力,激发被调查者的参与意识;另外,在调查前可预先通知、对调查作出详细的解释说明;雇佣与被调查者熟悉的人做调查员,如居民委员会成员、下岗职工等也有助于打消被调查者的顾虑。

②当无回答出现后,分析无回答产生的原因,采取一些补救措施。

例如:在无回答单位中再抽取一个样本,实施更有力的调查,并以此作为无回答层的代表,和回答层的数据结合起来对总体进行估计。

2.3 典型习题详解

一、单项选择题

1二手数据的特点是(  )。

A.搜集方便、数据采集快、采集成本低

B.采集数据的成本低,搜集比较困难

C.数据可靠性较好

D.数据的相关性较好【答案】A【解析】二手数据是指与研究相关的原信息已经存在,只是对原信息重新加工、整理,使之成为进行统计分析可以使用的数据。二手数据具有搜集方便、数据采集快、采集成本低等优点,但是得到的数据往往缺乏相关性。

2从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为(  )。

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样【答案】A【解析】简单随机抽样就是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。系统抽样将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。整群抽样将总体中若干个单位合并为组,这样的组称为群;抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。

3为了调查某校学生的每月的生活费支出,从全校抽取8个班级的学生进行调查,这种调查方法是(  )。

A.简单随机抽样

B.系统抽样

C.分层抽样

D.整群抽样【答案】D【解析】将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。题中某校学生为总体,班级的学生为群,从全校抽取8个班级的学生进行调查,这种调查方法是整群抽样。

4某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方法是(  )。

A.代表抽样

B.典型抽样

C.简单随机抽样

D.重点抽样【答案】D【解析】重点抽样是从调查对象的全部单位中选择少数重点单位,对其实施调查。这些重点单位的数量虽然不多,但在总体中占有重要地位。对占比重比较大的五个大型水泥厂进行调查以掌握该地区水泥生产的质量情况,属于重点抽样调查。

5有意识地选择三个农村点调查农业收入情况,此调查方法属于(  )。

A.重点抽样

B.简单随机抽样

C.代表抽样

D.典型抽样【答案】D【解析】典型抽样是从总体中选择若干个典型的单位进行深入的调研,目的是通过典型单位来描述或揭示所研究问题的本质和规律。选择的典型单位应该具有研究问题的本质或特征,所以有意识地选择三个农村点调查农业收入情况,属于典型抽样。

6为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是(  )。

A.简单随机抽样

B.整群抽样

C.系统抽样

D.分层抽样【答案】C【解析】系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。所以将学生排序后,每隔50名学生抽一名进行调查,属于系统抽样。

7在商店进行拦截式调查获得样本数据的方式属于(  )。

A.普查

B.方便抽样调查

C.判断抽样调查

D.随机抽样调查【答案】B【解析】方便抽样调查是指调查过程中由调查员依据方便的原则,自行确定入选样本的单位。

8研究人员根据对研究对象的了解有目的地选择一些单位作为样本,这种调查方式是(  )。

A.自愿抽样

B.配额抽样

C.方便抽样

D.判断抽样【答案】D【解析】判断抽样是一种比较方便的抽样方式,是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。

9为了了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用(  )。

A.分层抽样

B.简单随机抽样

C.等距抽样

D.整群抽样【答案】A【解析】分层抽样是将抽样单位按照某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。要了解某地区各行业职工的劳动强度和收入状况,并进行对比分析,采用分层抽样的方式,将此地区职工按行业分类,再从各类中随机抽取调查单位调查其收入状况。

10一般来说,使样本单位在总体中分布最不均匀的抽样组织方式是(  )。

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样【答案】D【解析】将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。因此,整群抽样中样本单位在总体中分布最不均匀。在这方面,简单随机抽样、分层抽样和系统抽样均优于整群抽样。

11下列选项中,抽样调查的结果不能用于对总体有关参数进行估计的是(  )。

A.分层抽样

B.判断抽样

C.整群抽样

D.系统抽样【答案】B【解析】判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选取一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表性抽样等方式。判断抽样属于非概率抽样,抽取样本时不是依据随机原则,因而调查结果不能用于对总体有关参数进行估计。ACD均属于概率抽样。

12如果要对稀少群体进行调查,适宜采用的调查方式是(  )。

A.滚雪球抽样

B.判断抽样

C.系统抽样

D.整群抽样【答案】A【解析】滚雪球抽样往往适用于对稀少群体的调查中。它的主要优点是容易找到那些属于特定群体的被调查者,调查的成本也比较低。它适合对特定群体进行研究的资料搜集。

13下列选项中,属于概率抽样的有(  )。

A.重点抽样

B.配额抽样

C.系统抽样

D.滚雪球抽样【答案】C【解析】调查实践中经常采用的概率抽样方式有以下几种:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。ABD均为非概率抽样。

14先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。这种抽样方式称为(  )。

A.分类抽样

B.配额抽样

C.系统抽样

D.整群抽样【答案】B【解析】配额抽样类似于概率抽样中的分层抽样,在市场调查中有广泛的应用。它是首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。

15与概率抽样相比,非概率抽样的优点是(  )。

A.样本统计量的分布是确定的

B.可以利用样本的结果对总体相应的参数进行推断

C.操作简便、时效快、成本低

D.技术含量更高【答案】C【解析】非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,无法使用样本的结果对总体相应的参数进行推断。非概率抽样的优点是操作简便、时效快、成本低,而且对于抽样中的统计学专业技术要求不是很高。

16某所大学需要了解学生每天的时间分配情况,改善学校的上自习困难问题。调查人员将问卷发给上自习者,填写后再收上来。此种收集数据的方法属于(  )。

A.面访式问卷调查

B.自填式问卷调查

C.实验调查

D.观察式调查【答案】B【解析】自填式问卷调查是指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷。

17为了了解某厂生产的电灯泡寿命,在收集数据时,最有可能采用的数据搜集方法是(  )。

A.普查

B.公开发表的资料

C.随机抽样

D.实验调查【答案】C【解析】随机抽样也称概率抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。由于要了解电灯泡寿命属于破坏性的,所以不可能进行普查,只能采取随机抽样的方式利用样本数据推断总体参数。

18下列关于抽样误差的说法,正确的是(  )。

A.抽样误差是针对某个具体样本的检测结果与总体真实结果的差异而言的

B.样本量越大,抽样误差就越小

C.抽样调查变成普查时,抽样误差大于零

D.总体的变异性越大,抽样误差也就越小【答案】B【解析】抽样误差并不是针对某个具体样本的检测结果与总体真实结果的差异而言的,它描述的是所有样本可能的结果与总体真值之间的平均性差异;当抽样调查变成普查,抽样误差就会减小到零,因为这时已经不存在样本选择的随机性问题了;总体的变异性越大,即各单位之间的差异越大,抽样误差也就越大,因为有可能抽中特别大或特别小的样本单位,使样本结果偏大或偏小。

19如果一个样本因人故意操纵而出现偏差,这种误差属于(  )。

A.抽样误差

B.实验误差

C.设计误差

D.非抽样误差【答案】D【解析】数据的误差有两类:抽样误差和非抽样误差。抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。因人故意操纵而出现的偏差属于非抽样误差。

20某餐厅为了解顾客对餐厅的意见和看法,管理人员随机抽取了50名顾客,上门通过问卷进行调查。这种数据的收集方法称为(  )。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载