中央财经大学统计与数学学院应用统计硕士复试真题及详解(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-15 18:51:35

点击下载

作者:圣才电子书

出版社:圣才电子书

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

中央财经大学统计与数学学院应用统计硕士复试真题及详解

中央财经大学统计与数学学院应用统计硕士复试真题及详解试读:

2011年中央财经大学统计学院应用统计硕士复试真题

2011年中央财经大学统计学院应用统计硕士复试真题详解

一、简答题

1

答:(1)可以使用两个独立样本的t检验来检验大学中男生和女生的学习成绩总体均值的差异,使用该检验方法需假设两个样本数据均来自正态总体且方差未知。(2)检验步骤:

①提出原假设和备择假设

H:m≥m;H:m<m012112

其中m,m分别为男生和女生大学期间学习成绩的平均值。12

②计算两个样本的方差,使用F检验来检验两个总体的方差是否相等,若相等则采用方差相等时的t检验来检验总体均值的差异,否则采用方差不等时的t检验。

③计算在已知样本下t检验统计量的数值。当它落在拒绝域时拒绝原假设,认为在大学中女生的成绩好于男生;否则不能拒绝原假设,即没有充分证据表明该观点。

2

答:对未来一年12个月的冰箱销售情况作出预测,需要搜集过去若干年每月的冰箱销量情况,然后用时间序列分析的方法进行预测。预测时可以使用时间序列分解预测法或ARIMA模型等。(1)时间序列分解预测法

基本原理:依据时间序列的结构模型将序列中的各种非随机成分分离出来,分别进行预测,最后将各部分预测值合成总的预测值。

步骤(以乘法模型为例):

①用移动平均法或时间回归法测定出模型中的长期趋势;

②通过计算季节指数测定模型中的季节变动:

a.测定出时间序列的长期趋势成分后,将原时间序列各观测值除以相应的长期趋势值,得到剔除长期趋势后的时间序列;

b.计算剔除长期趋势后的时间序列的同期(同月或同季度)平均值,得到未调整的季节指数;用未调整的季节指数除以剔除长期趋势后的时间序列的总平均值,得到调整后的季节指数。

③用剩余法测定循环变动:

求出时间序列Y的长期趋势T和季节变动S后,从时间序列中除ttt去长期趋势和季节变动有:C×I=Y/(T×S),再用移动平均法除去tttttC×I中的不规则变动I,即得到循环变动C。tttt∧∧∧

④合成预测值Y=T×S×C,其中T可以由时间回归法建t+lt+lt+lt+lt+l立趋势模型得到。(2)ARIMA模型

基本原理:时间序列可以看作一个随机离散过程的一次样本实现。对于平稳时间序列来说,它在第t期的取值通常可以近似表示为它自身过去若干期的值和当期及过去若干期随机冲击的线性函数。然而大多数反映社会、经济现象的时间序列会呈现出明显的趋势性,此时可以对其进行差分使之平稳,然后再建立适应的ARMA模型。

步骤:

①画出时间序列的线图,观察它是否平稳。若不平稳则对其逐阶进行差分,直至将其变换为平稳时间序列。

②画出差分平稳后时间序列的自相关函数和偏自相关函数图形,根据图形特征确定模型的阶数。

③根据确定出的阶数建立合适的ARMA模型,并根据已有样本数据估计出模型参数。

④利用上述步骤建立的ARIMA模型即可对未来期的因变量值作出预测。

3

答:(1)主成分分析常用来实现对数据的降维处理。在进行统计分析研究时常常会涉及到多个变量,而这些变量之间往往存在着相关性,多个变量及变量之间的相关性增加了研究的复杂程度。主成分分析可以实现用少数几个不相关的主成分来代表原来的多个变量,方便了对问题的研究分析。(2)主成分分析的步骤:

①计算原始变量的相关系数矩阵R;

②计算相关系数矩阵R的特征值,并将其按大小顺序排列,记为l≥l≥…≥l;12p

③计算各特征值对应的特征向量,特征向量中的元素表示主成分与自变量之间的系数;

④确定主成分个数,通常有两种方法:a.根据主成分的特征值来确定,通常要求入选的主成分特征值大于1;b.根据主成分的累计贡献率来确定,通常要求入选的主成分累计贡献率大于85%。

4

答:(1)SPSS

操作界面友好,通过点击按钮即可完成统计分析工作,输出的结果较为美观,适合于初学者和跨专业学习者使用。(2)S-Plus

有较强大的统计功能,应用上以理论研究、统计建模为主,需要有较好的数量统计基础和较强的编程能力。(3)Stata

软件小巧,绘图美观,统计分析能力较强;但数据接口差,且不提供对话框界面,以命令行方式操作。(4)SAS

功能齐全但价格相当不菲。需要一定的训练才能进入,可以进行编程,但是对于基本统计课程不是很方便。(5)R

免费软件,编程语言类似于S-Plus,很方便。函数的数量和更新远超过其他统计软件,很受统计师生欢迎。

说明:本题可灵活作答。

二、_

解:(1)容易算得该组数据均值为x=43.75(分钟)。

将该组数据从小到大排列得:10,25,25,30,30,40,45,50,55,55,70,90.可知该组数据的中位数为第6个数据和第7个数据的平均数即(40+45)/2=42.5,众数为25、30、和55。

上述三个指标中中位数最能反映这组数据的一般水平,因为它唯一且不受极端值影响。_(2)由已知可计算得该组数据的离散系数为cv=(s/x)×100%=(22.1/43.75)×100%=50.51%

三、

答:(1)(a)由表可知,收入的均值为2840.02,均值的95%置信区间为[2540.96,3139.08],中位数为2944.5。(b)由表可知样本数据的偏度=-0.105<0,故可判断该组数据呈左偏分布。(2)检验的原假设和备择假设为H:m≤2500;H:m>250001

由于t=2.256>0,右侧检验的p值=双侧检验的p值/2=0.013obs<0.05,故在5%的显著性水平下拒绝原假设,即能认为总体的平均收入大于2500元。(3)(a)研究多个总体均值之间的差异,可以采用方差分析的方法。(b)方差分析的假设条件:各总体中的因变量都服从正态分布;各总体的因变量的方差都相等;各个观测值之间相互独立。(c)由表可知,3家公司收入的标准差中最大值与最小值之比为1704.981/1385.110=1.23<2,故由经验方法可以认为研究数据符合同方差的假设条件。(d)由表可知F检验的p值=0.382>0.05,故不能拒绝原假设,即认为3家公司的平均收入没有显著差异。

四、

答:(1)保证普通最小二乘方法估计量的优良性质所需假设条件:

①随机误差项的期望值为0,即E(u)=0t2

②随机误差项的方差为常数,即Var(u)=st

③随机误差项之间互相独立。2

④随机误差项服从正态分布,即u~N(0,s)t(2)F检验的原假设和备择假设:

H:β=β=β=0;H:β,β,β不全为001231123

由方差分析表可知,F检验p值显著为0<0.01,故拒绝原假设,认为因变量与三个自变量之间的整体线性关系是显著的。(3)由回归系数的估计结果可得到估计的回归方程为:∧

Y=-91.759+1.077X+0.252X+8.740Xt1t2t3t

变量X回归系数的含义为:在其他变量不变的条件下,年龄每1增加1岁,患中风的风险评分平均上升1.077个单位;

变量X回归系数的含义为:在其他变量不变的条件下,血压每2增加1个单位,患中风的风险评分平均上升0.252个单位;

变量X回归系数的含义为:在其他变量不变的条件下,抽烟的3人比不抽烟的人患中风的风险评分平均高出8.740个单位。

又由表可知:三个自变量的回归系数t检验的p值都小于0.05,故在0.05的显著性水平下认为三个自变量各自对于因变量的影响都是显著的;∧(4)当X=70,X=165,X=1时,由估计的回归方程可得:Y123t=-91.759+1.077×70+0.252×165+8.740=33.951,即一名70岁、血压为165并且抽烟的人患中风的风险评分为33.951。(5)当自变量之间存在多重共线性时,可能会出现方程的整体线性关系显著而某个重要自变量的单个系数检验不显著的情况,故在回归分析中需要同时作F检验和t检验。

五、

答:(1)因子分析的主要作用:因子分析是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息,称之为因子。(2)根据旋转成分矩阵可知,第一个公因子在变量数学成绩、科学成绩上有较大的系数,可以抽象为理科成绩因子;第二个公因子在变量阅读成绩、写作成绩和社会学成绩上有较大的系数,可以抽象为文科成绩因子。(3)标准化的阅读得分≈0.250×第一个公因子+0.859×第二个公因子

2012年中央财经大学统计学院应用统计硕士复试真题

2012年中央财经大学统计学院应用统计硕士复试真题详解

一、简答题

1

答:数据的计量尺度通常分为:定类尺度、定序尺度、定距尺度、定比尺度。(1)四种计量尺度的区别有:①定类尺度将数据按照客观事物的某种属性进行无顺序的分类或分组;②定序尺度将数据按客观事物的某种无须确认的顺序进行排列,它是在分类基础之上的排序;③定距尺度是对事物类别和次序之间的差距的确认,是在排序基础上进行的,它计量形成的定距数据表现为数值,可进行加减运算;④定比计量是有固定起点的定距计量,由它计量形成的定比数据也表现为数值,可进行加减乘除运算。(2)四种计量尺度的统计方法主要包括:①定类数据和定序数据统称为定性数据,它们适用频数分布表、条形图、饼图等描述统计方法,对定性数据进行相关分析时常采用列联表独立性检验,对其进行回归分析时常采用Logistic回归模型;②定距数据和定比数据统称为定量数据,它们适用频数分布表、累计频数分布表、直方图、茎叶图、箱线图等描述统计方法,对定量数据进行相关分析时则采用常规的散点图、相关系数等,对其进行回归分析时则采用常规的线性回归模型,对于定量数据还可使用方差分析等统计方法。

2

答:(1)统计指标方法——偏度:正态分布是关于X=μ的对称分布,故当一样本来自正态分布总体时,其概率密度曲线的偏度应等于0。(2)图形方法——Q-Q图:当一样本来自正态分布总体时,其Q-Q图中的点应该紧密分布在一条0-1之间的上升斜线附近;还可以通过观察分组后数据的直方图对样本的分布作出直观上的判断。(3)检验方法——K-S检验:可利用非参数检验方法K-S检验对样本的分布形态作出判断。

3

答:对应选项A-G设置虚拟变量X至X,当选项A被选时令X=1,171未被选时令X=0,其余变量以此类推。则对于每一个观测,可以得1到一个0-1序列。对每一个虚拟变量的取值分别进行加总,可得到选项A-G的频数分布,频数越大认为该选项对失业人员再就业的影响越大。对于选项H,可观察出现得较多的答案,然后将它们分别单独作为一个选项,再进行如上所述的处理。

二、计算分析题

1

答:(1)由表可知,阅读成绩的95%置信区间为(51.4533,54.0967)。(2)由于阅读成绩的95%置信区间没有包含50,故在5%的显著性水平下不能认为总体的平均值等于50。_(3)表中的Std. Error即样本均值x的标准误,Std. Deviation即样本的标准差S;在重复抽样条件下有:

其中总体标准差σ可用样本标准差S来估计(4)表中的Skewness即偏度,Kurtosis即峰度。由表可知,该样本数据的偏度=-0.482<0,峰度=-0.750<0。则它的分布形态为左偏、平峰分布。

22

答:(1)c检验的基本原理:设观测频数为O,期望频数为iE,在原假设成立的条件下二者的差异应该都是由于抽样的随机性造i成的,因此不应该很大。则可构造检验统计量:(其中k是样本分类的个数,当样本容量足够大时,该检验统计量2服从自由度为k-1的c分布)

当该统计量的值很大时,就有理由拒绝原假设。2(2)由表可知,c检验的p值=0.17>0.05,故不能拒绝原假设,可以认为当地人口中10%是Hispanic,10%是Asian,10%是African American,70%是White folks。

32

答:(1)设男生写作成绩的总体方差为s,女生写作成绩的总12体方差为s。2

则表中F检验的原假设和备择假设分别为2222

H:s=s;H:s≠s012112

由表可知F检验的p值=0.001<0.05,故在5%的显著性水平下拒绝原假设,认为男生和女生写作成绩的总体方差不相等。(2)由(1)可知,应该采用方差不等情况下的t检验值(即-3.656)。

t检验的原假设和备择假设分别为H0:m1=m2;H1:m1≠m2,其中m,m分别为男生和女生写作成绩的平均值。12

由表可知t检验的p值显著为0,故在5%的显著性水平下拒绝原假设,认为男生和女生的平均写作成绩不相等。

4

答:(1)Wilcoxon秩和检验的基本思想:

假设(x,x,…,x)和(y,y,…,y)是来自两个总体12m12n的随机样本。把这两个样本数据混合在一起并将它们从小到大排序,确定每一个观测值的秩,然后计算m个x的秩和W、n个y的秩和ixjW,再除以各自的样本量得到平均秩。y

如果两个总体具有相似的分布形状,且中位数也大致相同,那么由m个x和n个y组成的样本可以看作来自同一个总体的一个随机样ij本,此时经上述步骤计算得到的两个样本的平均秩应非常接近,否则就说明两个总体的中位数不相等。(2)由表可知Wilcoxon秩和检验的p值=0.001<0.05,故在5%的显著性水平下拒绝原假设,认为男生和女生的平均写作成绩不相等。(3)当要检验两个独立样本是否来自具有相同位置特征的总体时,适合用Wilcoxon秩和检验;当两个独立样本都来自正态总体,且为小样本,方差未知,要进行两个总体均值之差的检验时,适合用t检验。

5∧

答:(1)由回归系数的估计结果可得到估计的回归方程为:Yt=23.959+0.552Xt2

又由表可知,该回归方程的调整R为0.353,即写作成绩的全部离差中有35.3%可以由该回归方程解释,说明方程的拟合效果不是很理想。但自变量系数的t检验p值显著为0,说明阅读成绩对写作成绩的影响是显著的。(2)Std. Error of the Estimate即估计标准误﹦8.62,其含义为:根据阅读成绩对写作成绩进行预测时,平均的预测误差为8.62分。(3)由该表可知,给定一名学生的阅读成绩为60分,其写作成绩的点估计为57.06175分,95%区间估计为(41.96620,72.15730)(采用后一个置信区间即个值置信区间)。

6

答:(1)第一个表格显示了各个变量的共同度,即公因子从各个原始变量中提取出的信息成分大小;第二个表格为因子载荷矩阵;第三个表格为旋转成分矩阵。旋转成分矩阵中的元素与因子载荷矩阵中的元素相比更加趋向于0或±1。(2)对因子载荷矩阵进行旋转后得到旋转成分矩阵,其主要目的是使旋转成分矩阵中的元素更加趋向于0或±1,因此旋转后的因子有更加明确的意义,便于抽象解释。

根据旋转成分矩阵可知,第一个公因子在变量数学成绩、科学成绩、阅读成绩上有较大的系数,可以抽象为理科成绩因子;第二个公因子在变量写作成绩和社会研究成绩上有较大的系数,可以抽象为文科成绩因子。

7

答:(1)判别分析的基本思想:根据已掌握的若干样本的数据信息,建立判别公式和判别准则,对样本进行分类。当遇到新的样本点时,根据总结出的判别公式和判别准则,即能判断该样本点所属的类别。(2)由表格可知,用建立的判别函数来对训练集中的样本进行预测时正确率为58.7%,对测试集中样本进行预测时正确率为56.0%,说明判别分析的效果不是很理想。

2013年中央财经大学统计与数学学院应用统计硕士复试真题

2013年中央财经大学统计与数学学院应用统计硕士复试真题详解

一、简答题

1

答:概率抽样主要包括简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样等。(1)简单随机抽样的特点:是最基本的抽样方法,数学性质简单,理论也最为成熟;但在实际调查中实施具有一定困难,常将它与其他抽样方法结合使用。(2)分层抽样的特点:①分层抽样抽取得到的样本单位具有较强的代表性;②用分层抽样方法抽取得到的样本的结构更近似于总体结构;③在研究总体的同时还获取了总体内部的某些信息;④各层中的样本量由抽样者控制,而不是由抽样过程随机决定。(3)整群抽样的特点:①样本单位比较集中,容易集中力量进行调查,便于组织和管理,节省调查时间和费用;②由于整群抽样只对被抽中的群进行全面调查,故它不需要所有总体单位的抽样框;③因为样本单位不能均匀地分布在总体各个部分,故样本的代表性较差。(4)系统抽样的特点:①抽取样本的步骤简便易懂;②样本单位在总体中分布比较均匀,有利于提高估计精度;但当总体单元的排列出现周期性变化时,所抽取样本的代表性可能很差;③该抽样方法的抽样误差估计较为困难。(5)多阶段抽样的特点:多阶段抽样的各个阶段中可使用任何一种抽样方法,因此它的特点之一是灵活;但当阶数较多时,抽样调查的设计就会变得复杂,估计也变得困难。

2

答:(1)假设检验中p值的含义:

p值是在原假设成立的条件下,出现检验统计量的样本观测结果或更极端结果的概率,也称为观测到的实际显著性水平。(2)根据p值做假设检验的步骤:

①根据实际问题建立检验假设H和H;01

②构建检验统计量,根据观测样本计算在原假设成立条件下检验统计量的值,并给出样本观察结果或更极端结果出现的概率即p值;

③根据选定的显著性水平,决定拒绝或不能拒绝H。当p值小于0给定的显著性水平时,拒绝原假设,否则不能拒绝原假设。

3

答:在回归预测中通常有两种置信区间:均值置信区间和个值置信区间。

均值置信区间指的是利用估计的回归方程,对于自变量x的一个给定值x,求出因变量y的平均值的估计区间;个值置信区间指的是0利用估计的回归方程,对于自变量x的一个给定值x,求出因变量y的0一个个别值的估计区间。

均值置信区间是对总体均值作出的区间估计,个值置信区间是对单个自变量观测值所对应因变量取值作出的区间估计。

4

答:方差分析的假设条件:

①各总体中的因变量都服从正态分布;

②各总体的因变量的方差都相等;

③各个观测值之间相互独立。

二、_

答:(1)容易算得该组数据均值为x=46.3(分钟)。

将该组数据从小到大排列得:10,25,25,30,30,40,40,45,50,55,55,60,70,70,90可知该组数据的中位数为第8个数据即45,众数为25、30、40、55和70

上述三个指标中中位数最能反映这组数据的一般水平,因为它唯一且不受极端值影响。(2)该组数据的茎叶图如下所示:(3)由于数据个数n=15,故四分位数的位置分别为:(n+1)/4=4,2(n+1)/4=8,3(n+1)/4=12,则有:Q=30,Q=1245,Q=603

箱线图的底端为该组数据落在区间(Q,Q-1.5IQR)内的最11小值,计算得到该值=10;箱线图的顶端为该组数据落在区间(Q,Q-1.5IQR)内的最大值,计算得到该值=70;同时可知9033为极端值。(其中,IQR=Q-Q)31

根据以上计算结果,画出该组数据的箱线图如下:

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载