首都经济贸易大学统计学院应用统计硕士复试历年真题及详解(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-12 06:14:36

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

首都经济贸易大学统计学院应用统计硕士复试历年真题及详解

首都经济贸易大学统计学院应用统计硕士复试历年真题及详解试读:

2012年首都经济贸易大学统计学院应用统计硕士复试真题

2012年首都经济贸易大学统计学院应用统计硕士复试真题及详解

1.(20分)为分析受教育程度与收入之间是否有关系,某人计算了受教育年限与月收入之间的相关系数,发现相关系数很低,只有0.25,请问能否得出两者之间无关的结论,为什么?

答:相关系数r仅仅是自变量x与因变量y之间线性关系的一个度量,它不能用于描述非线性关系。r=0.25说明两个变量之间的线性相关程度极弱,可视为不相关。此处只能得出两者之间无线性相关关系,不能得出两者之间无关的结论。

2.(20分)某企业计划分析产品销售额是否受到促销方式、售后服务、产品价格、对销售员的售货的奖金提成、卖场的地理位置等因素的影响。请你为该企业提出建议,可以采取什么方法进行分析。

答:多元线性回归分析。把产品销售额作为因变量,促销方式、售后服务、产品价格、对销售员售货的奖金或提成、卖场的地理位置等因素作为自变量,建立多元线性回归方程。然后对回归系数进行检验,若系数显著不为零,则认为该系数对应的自变量对因变量的影响显著,否则不显著。

3.(20分)请简要说明利用回归分析与时间数列分析两种方法进行预测的应用条件。若对未来半年内的CPI进行预测,你建议采用什么方法?为什么?

答:利用回归分析进行估计或预测时,需要进行以下假定:(1)因变量y与自变量x之间具有线性关系。(2)在重复抽样中,自变量x的取值是固定的,即假定x是非随机的。(3)误差项ε是一个期望值为0的随机变量。2(4)对于所有的x值,ε的方差σ都相同。(5)误差项ε是一个服从正态分布的随机变量,且独立。

不能用样本数据之外的x值去预测相对应的y值。因为在一元线性回归分析中,总是假定因变量y与自变量x之间的关系用线性模型表达是正确的。利用时间序列法进行预测时,时间序列应为非平稳时间序列,即时间序列含有不同的成分,如趋势、季节性、周期性和随机成分等。

若对未来半年内的CPI进行预测,建议采用时间序列预测法,因为对于CPI数据,它带有明显的时间属性,随着时间的变化,CPI数据也在不停的变化,采用时间序列预测法可以更好的考虑它的时间效应,如果采用回归分析,就不能很好的表达出时间因素对CPI数据的影响。

4.(20分)为了研究小麦品种和施肥方式对产量的影响,针对三种品种和两种施肥方式进行实验,得方差分析数据如下:

方差分析表

要求:根据上述数据回答以下问题:(1)试写出与该检验对应的原假设与备择假设。(2)说明品种、施肥方式及其交叉作用对小麦产量的影响是否显著。

解:(1)设不同品种的小麦种子的平均产量分别为。

提出假设:H:μ=μ=μ,H:μ,μ,μ不全相等01231123

设不同施肥方式的小麦平均产量分别为。

提出假设:,(2)由于P-value=0.0000<α=0.05,拒绝原假设。表明不同品种的种子对小麦产量的影响有显著差异。

P-value=0.0000<α=0.05,拒绝原假设。表明不同施肥方案对小麦产量的影响有显著差异。

P-value=0.3793>α=0.05,不拒绝原假设。没有证据表明不同的品种和不同的施肥方式对小麦产量有交互影响。

5.(20分)案例分析:

某汽车经销商委托某高校统计学院调查研究某城市对家用轿车的需求分析,希望从家庭收入、家庭人口、家庭所在地、住房面积、家庭成员所从事职业等方面分析这些因素对家用轿车需求量的影响,并要求进行定量分析,建立统计模型,该模型能够用于统计预测。该学院研究人员经多次与经销商沟通,设计出调查问卷,准备进行抽样调查。初步提出以下两种抽样调查方案:

方案一:充分利用学校学生众多的优势,展开调查。具体做法是:根据学校学籍登记表得到学生学号,从中随机抽取一定量的学生,针对这些被抽中学生的家庭进行问卷调查;

方案二:安排该校学生进行街头拦截访问,随机拦访一定量的行人。

根据以上资料,回答以下问题:(1)请说明该抽样调查中调查总体是什么?理想的抽样框和抽样单位是什么?(2)请说明上述三种抽样方案各是什么抽样方法,并评价其优劣;(3)请根据上述资料提出你认为比较合理的抽样方案。

答:(1)该调研中调查对象总体是该市的所有家庭户。

理想的抽样框应当包括该市所有家庭户的信息。抽样单位是该市的每一家庭户。(2)方法一:分层抽样

分层抽样保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而可以有效地提高估计的精度;分层抽样在一定条件下为组织实施调查提供了方便,不仅可以对总体参数进行估计,还可以对各层的目标量进行估计。

方法二:整群抽样

此处采用这种方法抽样框可能没有包括该市所有的家庭户。

方法三:方便抽样

由于方便抽样的抽样单位带有随意性,因此,方便抽样无法代表有明确定义的总体,将方便抽样的调查结果推广到总体是没有任何意义的。因此,采用方便抽样得到的调查结果不能用来对该市所有家庭户对家用轿车需求量的统计预测。(3)认为比较合理的抽样方案应为方案一。

2013年首都经济贸易大学统计学院应用统计硕士复试真题

2013年首都经济贸易大学统计学院应用统计硕士复试真题及详解

一、名称解释(每题3分,共15分)

1.标准分数

答:变量值与其平均数的离差除以标准差后的值称为标准分数,标准分数能够消除量纲影响,真实反映一个分数与平均数之间的相对标准距离。

2.显著性水平

答:显著性水平的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率,是由人们根据检验的要求确定的。

3.相关系数

答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,其取值一般在-1<r<1之间,|r|→1说明两个变量之间的线性关系越强;|r|→0说明两个变量之间的线性关系越弱。

4.统计量

答:统计量是由样本构造的量,是关于样本的一个函数,不依赖任何未知参数,是统计中用来对数据进行分析、检验的变量。

5.国内生产总值

答:国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值。

二、简答题(本题共25分)

1.请给出总体分布、样本分布和抽样分布的含义,并说明它们的区别和联系。(本题5分)

答:(1)总体分布、样本分布和抽样分布的含义:①总体实际上就是一个随机变量X,随机变量的分布就称为总体分布;②样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布;③样本统计量是由样本构造的。由于样本的随机性,样本统计量是一个随机变量,它的分布称为抽样分布。(2)总体分布、样本分布和抽样分布的区别和联系:

①联系:抽样分布是研究样本分布与总体分布之间关系的桥梁,由于总体的分布一般未知,常用样本分布来估计总体分布;

②区别:抽样分布是关于样本统计量的分布,它由样本统计量的所有可能取值和与之对应的概率所组成;样本分布是关于样本观测值的分布;总体分布就是随机变量的分布。

2.假定两个班学生水平类似,由于任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。一班分数的均值和标准差分别为78.53和9.43,而二班的均值和标准差分别为70.19和7.00。那么一班得分为90分的A同学是不是比二班得分为82分的B同学成绩要更好呢?怎么比较才能合理?(本题10分)

答:一班得分为90的A同学不比二班得分82的B同学学习好。应该使用标准分数对一班得分为90的A同学与二班得分为82分的B同学的成绩进行比较。

变量值与其平均数的离差除以标准差后的值称为标准分数,在对多个具有不同量纲的变量进行处理时,常常需要对变量进行标准化处理,标准分数可以测量每个数据在该组中的相对位置,并可以用它来判断一组数据是否有离群数据。实际上标准分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组中的位置,也没有改变该组数据分布的形状。在该题中两个班学生水平相似,只是老师评卷标准不同,因此,只需比较这两个学生的成绩在各自班级的相对位置就可知这A、B两个学生谁的成绩好。

A、B两同学的标准分数为:

由计算结果可知,,所以,不能认为一班得分为90分的A同学比二班得分为82分的B同学成绩要更好。

3.在对一些实际问题进行显著性检验时,如何理解原假设H和0备择假设H之间的地位不对等性,试举例说明。(本题10分)1

答:假设检验中一般按照下面几个原则建立原假设:

(1)通常把有把握的、不能轻易被否定的命题作为原假设H,而0把无把握的、不能轻易被肯定的命题作为备择假设H。1(2)当检验的目的是希望得到对某一陈述强有力的支持时,把这一陈述的对立面作为原假设H。0(3)尽量使后果严重的错误成为第一类错误。

如考虑新工艺是否能提高效益,只有真正能提高效益的新工艺才能被采用,这是因为采用新工艺必然要购进新设备、调整生产线、培训人员等进行人力、物力、财力的投入,作为企业的主管部门,作出采用新工艺的决策应持慎重态度,若以u代表采用新工艺的平均效益,则原假设和备择假设必须设为:

这样当在显著性水平α下拒绝原假设H时,才可认为新工艺确实0提高效益,因为这样可以保证这个结论错误的概率不超过α。

三、计算分析题(每题15分,共45分)

1.某单位有400架电话分机,每个分机有5%的时间需要外线通话,假定每个电话分机用不用外线是独立的。试问总机约备多少条外线才能有95%的把握保证每个分机用外线不必等候?()

答:记每个电话分机是否需要外线电话为随机变量X,X服从0-1ii分布,所以为二项分布,由于n=400取值较大,则由中心极限定理得

则总机至少备有n条电话线才能有95%的把握保证每个分机用外线不必等候可表述为:

解得n=27.17

则总机至少备28条外线才能有95%的把握保证每个分机用外线不必等候。

2.方差分析(1)方差分析的三个基本假定是什么?(2)方差分析和回归分析的区别和联系是什么?(3)已知某方差分析表如下,请在表中横线处填入合适的值,将其补充完整。

答:(1)方差分析中有三个基本假定:

①每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;2

②各个总体的方差σ必须相同。也就是说,各组观察数据是从具有相同方差的正态总体中抽取的;

③观测值是相互独立的。(2)方差分析和回归分析的联系:

①在概念上具有相似性。回归分析是为了分析一个变量如何依赖其他变量而提出的统计分析方法;方差分析是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响;

②在假设条件上具有相似性;

③总变差分解的形式上具有相似性;

④在确定影响因素的基本思路上具有相似性;

⑤在统计显著性检验上具有相似性。

方差分析和回归分析的区别:

①回归分析主要是为了得到自变量与因变量之间的定量关系——回归方程;方差分析则是用于区分因素对试验指标的影响度,从而找出“最佳”的试验水平。

②回归分析要求因素变量是定量的,而方差分析则不要求因素变量是定量的。

③回归分析要求对所有试验水平都进行相应试验,而方差分析则只需要有选择的对某些试验水平进行试验,例如正交设计。(3)

3.为了研究初中成绩与高中成绩的关系,随机抽查50名高一学生,登记其初三成绩与高一成绩,并利用SPSS统计软件进行一元线性回归分析,结果输出如下:

判定系数

方差分析

回归系数

试根据以上结果回答以下问题:(1)说明学生初三成绩与高一成绩之间的相关关系的形态;(2)写出估计的回归方程并解释回归系数的实际含义;(3)对上述拟合的回归方程进行评价。

答:(1)由SPSS回归结果可知,初三成绩与高一成绩的相关系数为0.795,说明初三成绩与高一成绩之间存在着高度的正相关关系。(2)由回归结果可知,设高一成绩为y,初三成绩为x,则初三成绩与高一成绩之间的回归方程为:y=26.444+0.651x

回归结果表明,初三成绩每变动一单位,高一成绩同向平均变动0.651个单位。(3)由回归结果可知,判定系数为0.632,调整后的判定系数为0.625,表明初三成绩解释了高一成绩变动的63.2%,说明回归方程拟合的较好。对回归方程进行检验的F值和进行回归系数检验的t值的显著性概率都为零,均通过检验,说明初三成绩确实对高一成绩有显著性影响。

四、论述题(本题15分)

中国互联网络中心(CINIC)为了解全国互联网络发展状况,决定在全国范围内抽取2000名在校大学生进行调查,以了解当前在校大学生互联网络的使用状况、对互联网络的评价及满意程度等。你认为该项调查应采取哪种抽样方法比较合适?请设计出一份简要的抽样方案。

答:因为调查的目的是了解当前在校大学生互联网的使用情况、对互联网的评价及满意程度,因此,采用多阶段抽样与简单随机抽样的抽签法相结合的方法比较合适。

互联网发展状况抽样调查方案

一、调查目的、范围和对象

1.调查目的:了解当前在校大学生互联网的使用情况、对互联网的评价及满意程度

近年来,随着互联网在校园里的普及,越来越多的网络经销商把目光投向了校园这一潜在的巨大市场,为了了解当前在校大学生互联网的使用情况、对互联网的评价及满意程度,中国互联网络中心决定在全国范围内抽取2000名在校大学生进行调查。

2.调查范围:全国范围内的在校大学生。

3.调查内容:被调查人的性别和年级、是否使用互联网、对互联网的评价及满意程度等。

二、抽样方案设计的原则和特点

抽样设计按照科学、效率、便利的原则。首先,作为一项全国性的抽样调查,整体方案必须是严格的概率抽样,要求样本对全国有代表性;其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查的精度尽可能高;再次,方案需有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。

三、抽样调查设计

第一步:确定调查方法

本调查决定采用多阶段抽样与简单随机抽样的抽签法相结合的抽样方法进行方案设计,调查的最小单元为全国各个高校的在校大学生。决定调查的各个阶段为学校、学院、学生。在学院采取简单随机抽样的方法抽取学生。

第二步:确定样本量及各阶段样本量的配置

我们在全国抽取2000名大学生进行调查。

第三步:具体的抽样过程

以全国在校大学生为总体,采用多阶段抽样方法抽取样本。(1)第一阶段:以全国各高校作为初级单元。

将全国所有高校依次进行编号,然后将序号写到签上,用抽签法进行抽选学校。抽选到的学校作为样本学校。(2)第二阶段:以抽到高校的各个学院作为二级单元。

在每一个被抽中的高校,将其所有的学院依次进行编号,然后将序号写到签上,用抽签法抽取专业,则抽到的学院为样本学院。(3)第三阶段:以抽到的样本学院的学生作为三级单位。

四、时间安排(略)

2014年首都经济贸易大学统计学院应用统计硕士复试真题

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载