高而基考研心理学(统考版)——心理统计学(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-05 02:26:11

点击下载

作者:迷死他赵,心理学眼泪

出版社:浙江出版集团数字传媒有限公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

高而基考研心理学(统考版)——心理统计学

高而基考研心理学(统考版)——心理统计学试读:

版权信息书名:高而基考研心理学(统考版)——心理统计学作者:迷死他赵;心理学眼泪排版:青杨出版社:浙江出版集团数字传媒有限公司出版时间:2016-6-7本书由浙江出版集团数字传媒有限公司授权北京当当科文电子商务有限公司制作与发行。— · 版权所有 侵权必究 · —第一章绪论本章导读

通过本章简单的概要,我们可以大致了解心理统计学中的内容和一些基本概念。我们要知道心理统计学是一门琢磨数据的工具,那么它都要琢磨些啥呢?首先,我们要用简单的形式来描述一坨杂乱无章的数据(描述统计);然后我们要通过少数的、有限的数据来得出规律,以更好地推断大多数人的情况(推断统计)。

知识结构简图一、心理与教育统计学的内容

心理与教育统计是心理教育科学研究中的一种重要的定量研究工具。它处理的数据具有随机性、变异性、规律性等特点,它的目标是通过部分数据来推测总体特征。具体包括:(一)描述统计

描述统计(descriptive statistics)主要研究心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体包括:

1.统计图表:用于描述一组数据的分布情况。

2.集中量数:用于描述一组数据的集中趋势。

3.差异量数:用于描述一组数据的离中趋势,即数据的变异性。

4.相关分析:用于分析两个变量之间的相互关系。(二)推论统计

推论统计(inferential statistics)主要研究如何通过局部数据所提供的信息,推论总体的情形。具体包括:

1.数学基础:概率论。

2.参数估计:根据样本分布理论,在参数模型下通过样本特征值对总体未知的参数进行的估计。

3.假设检验:通过样本统计量得出的差异,判断总体参数之间是否存在差异,从而做出一般性推论的过程。

4.方差分析:又称变异数分析,其主要功能在于分析实验数据中不同来源变异对总体变异的贡献大小,从而确定实验中自变量是否对因变量有重要影响。

5.卡方检验:对计数数据按照卡方分布原理进行假设检验的方法。能够处理一个因素两项或多项分类的实际观察频数与理论频数分布是否一致或有误差异的问题。

6.非参数检验:对总体的分布没有严格假定,对总体参数也没有特殊规定条件的假设检验方法。往往用于处理顺序、等级数据等计量信息较弱的数据资料。

7.一元线性回归:回归分析是用一定模型来表述变量间相互关系的一种统计方法。一次函数是变量间各种关系模型中最简单的形式,对于这种线性关系的回归分析叫线性回归,只有一个自变量的线性回归叫一元线性回归。

8.多元统计分析初步:初步处理多因素研究数据的多变量统计分析方法。

9.统计功效与效果量:(1)统计功效即统计检验力、统计效力,指假设检验中能正确拒绝一个错误的虚无假设的概率,它反映着正确辨认真实差异的能力,统计学中用(1-β)来表示;(2)效果量是测量自变量效果的量数,反映自变量和因变量的关联程度。二、心理与教育统计学基础概念(一)数据类型

1.按数据的观测方法和来源分(1)计数数据:计算个数的数据。(2)测量数据:借助一定的测量工作或一定的测量标准而获得的数据。

2.按数据反映的测量水平(1)称名数据:说明的是某一事物与其他事物在属性上的不同或类别上的差异,具有独立的分类单位,其数值一般都取整数形式。这类数据只计算个数,并不说明事物之间的差异,不能进行加减乘除运算。(2)顺序数据:既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排序后获得的数据资料。这类数据不能进行加减乘除运算。(3)等距数据:具有相等单位,但无绝对零的数据。这类数据可以进行加减运算,不能进行乘除运算。(4)比率数据:具有相等单位,也有绝对零的数据。这类数据可以进行加减乘除运算。

3.按数据是否具有连续性(1)离散数据:任两个数据点之间所取的数值的个数是有限的。(2)连续数据:任两个数据点之间都可以细分出无限多个大小不同的数值。(二)其他

1.变量、观测值、随机变量、常数(1)变量是一个可以取不同数值的物体的属性或事件,其数值具有不确定性;(2)观测值是变量的确定值;(3)随机变量是取值之前不能预测取到什么值的变量;(4)常数是与变量相反的,它在一定范围内数值不会随意改变。

2.总体、个体、样本、随机样本(1)总体是具有某种特征的一类事物的全体;(2)个体是构成总体的每个基本单元;(3)样本是总体中的一部分个体;(4)总体中每个成员都有相等的机会被选上,通过这种方法所选择的样本就是随机样本,它是总体的一个子集。

3.次数、比率、频率、概率(1)次数是某一事件在某一类别中出现的数目,又称为频数;(2)比率是两个数的比,又称比例,百分数或百分率是比例的另一种表现形式;(3)频率是某一时间发生的次数与总的事件发生次数的比值,又称相对次数,用比例或百分数来表示;(4)概率是某一事件在无限的观测中所能预料的相对出现的次数,它反映的是某一种事件发生的可能性的大小。

4.参数、统计量(1)参数是描述一个总体情况的统计指标,又称总体参数,它是一个常数;(2)统计量是样本的特征值,又称特征值,它是一个变量。【关键词】

描述统计 推论统计 数据类型 参数 统计量【想一想】

就称名数据、顺序数据、等距数据、比率数据各举一例,比较各种数据的异同。第二章统计图表本章导读

面对100……0个不一样的数据,要我们去描述!我们怎么办!我们要想办法简化啊,那么最容易想到的是什么?就是把它们分门别类,那么通过本章的学习,我们会了解到一系列分门别类的方法~

知识结构简图一、统计表

统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。

统计表一般由下面几个部分组成:表号;标目;数字;表注。

主要包括:(一)次数分布表

1.简单次数分布表:适合数据个数和分布范围比较小的时候用,依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。

2.分组次数分布表:适合数据个数和分布范围比较大的时候用,数据量很大时,应该把所有的数据先划分在若干区间,然后按其数值大小划分到相应区域的组别内,分别统计各个组别中包括的数据的个数,再用列表的形式呈现出来。(1)编制步骤:

①求全距,即最大数和最小数之间的差距。

②定组距和组数。

组距(i),任意一组的起点和终点的距离,根据全距来定。全距大,组距也可以大一些,一般取2、3、4、5、10、20等数值,这样便于计算。

组数(K),分组数目,要根据数目的多少来确定,如果数据在100个以上,一般分10~20组。i=全距/K。

③列分组区间:即组限,一个组的起点和终点之间的距离。组限有表述上下限(10~19;20~29)和精确上下限(9.5~19.499;19.5~29.499),一般书写时按照表述上下限,计算和分组时按照精确上下限。

由于连续变量中一个特定的数值并不是代表一个点,而是对应实数的一个区间,对于上述10~19中10这个分数,实际上是代表的是9.5~11.5这一段区域,所以在次数分布表中,10~19这个组的下限是9.5而不是10。

④登次数:将数据登记到相应的组别内。

⑤算次数:计算各组次数和总次数并核对,然后写出组中值、次数、频数和百分次数。

注:组中值为每组精确下限加上组距的二分之一,或精确上下限之和的一半。(2)评价

①优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。

②缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。

3.相对次数分布表:用频数比率或百分数来表示次数。

4.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。

5.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

6.不等距次数分布表:例如工资级别,年龄分组。(二)其他表

1.简单表:只列出名称、地点时序或统计指标名字的统计表。

2.分组表:只有一个分类标志的统计表,也称单向表。

3.复合表:拥有两个或两个以上分类标志的统计表。二、统计图

统计图一般采用直角坐标系,通常横轴表示自变量(类别),称为分类轴。纵轴表示因变量(次数),称为数值轴。

统计图一般由下面几个部分组成:图号及图题;图目;图尺;图形;图例;图注。

主要包括:(一)次数分布图

次数分布图是在次数分布表基础上绘制的图,更为直观,包括:

1.直方图:以矩形面积表示连续性随机变量次数分布的图形,又称等距直方图,没画矩形时的直方图叫组织图。横轴为等距分组点,纵轴为频数。

其中,一个矩形面积大小与每组频数分布等价。若将总面积定为1,则每部分面积为该部分次数/总次数的比值。

2.次数多边形图:是一种表示连续性随机变量次数分布的线形图。横轴为组中值,纵轴为频数。

次数多边形对次数的轮廓显示的更好,在样本较大时可以找出次数分布的经验公式,可以用于多个同质的次数分布的比较。

3.累加次数分布图:根据累加次数分布表绘制而成,分为:(1)累加直方图:横轴为等距分组点,纵轴为累加次数。(2)累加曲线:又称递加线,可以连接累加直方图各组矩形右顶点而来。横轴为精确上限或精确下限,纵轴为累加次数。其形状有以下三种:

正偏态、负偏态和正态。例如,若一次测验大多数人分数偏低,只有少数人才能得高分,也就是少数人的分数朝向高分一端,分布即为正偏态。(二)其他图

1.条形图:主要用于表示离散型数据,用直条长短表示数量的大小。一个轴为分类轴,一个轴为数量轴。区别与直方图:描述数据不同,表示数据的方式不同,标尺分点意义不同,图形形状不同。

2.圆形图:也叫饼图,用于表示间断性资料,表示各部分在整体中所占比重大小。

3.线形图(折线图、曲线图):更多用于表示连续数据,可以用于:(1)表示两个变量之间的函数关系;(2)描述某种现象在时间上的发展趋势;(3)描述一种现象随另一种现象变化的情况。

4.散点图:用圆点多少和分布疏密来表示两个变量的相关程度。

5.茎叶图:当观测数据不是很多时使用,茎代表观测值中十位数部分,叶代表个位数部分,例如,X=75时,7为茎,5为叶。如果是分组数据,茎代表分组区间,叶为落在各区间的每个数,例如,茎7代表着七十几。

主要优点是既保留了全部原始数据,又呈现出直方图的形式,具有次数分布表与直方图的双重优点。

6.箱型图:是一种用作显示一组数据分散情况的统计图,主要包含上边缘,上四分位数,中位数,下四分位数,下边缘,异常值这六个节点。【关键词】

分组次数分布表 直方图 累加次数分布图 散点图 线形图【想一想】

测验的难度与分数分布的形状有何关系?举例说明。第三章集中量数本章导读

虽然学过用图表来描述一组数据,但是这样工作量还是巨大有木有,还要买尺子画图!那么我们能不能用一个数字来表示一坨数据呢?答案是能,本章要学的集中量数就是用于描述数据分布中大量数据朝某个方向集中的程度:

知识结构简图一、算术平均数(一)概述

1.含义

数据总和除以数据个数,简称为平均数或均数,M。平均数是一个平衡点,是一组数据的重心。

总体参数:;样本统计量:。

2.特点(1)在一组数据中每个变量与平均数之差(称为离均差)的总和等于零。另外,离均差的平方和最小,即每个数据与平均数之差的平方和都小于每个数据与任一常数之差的平方和,即平均数的“最小平方”原理。(2)在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C。(3)在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C。

3.评价(1)优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法演算、较少受抽样变动影响。(2)缺点:易受极端数据的影响、不能在出现模糊数据时计算。

Tip

其实,平均数就像跷跷板的支点一样,如果玩的好好的,一个体态比较丰腴的人坐上来……

所以,在使用平均值的时候一定要注意那个“丰腴”的极端值。

4.应用

算数平均数是应用最普遍的一种集中量数,它在大多情况下是真值最好的估计值。在应用时要注意以下原则:同质性原则、平均数与个体数值相结合的原则、平均数与方差及标准差相结合的原则。(二)计算

1.未分组(1)定义式(2)用估计平均数计算

2.分组二、中数(一)概述

1.含义

按顺序排列在一起的一组数据中居于中间位置的数,Md。在这组数据中,有一半数据比它大,一半数据比它小,等价于百分位数是50的那个数。

2.评价(1)优点:计算简单、容易理解、不受极端值影响。(2)缺点:代表性差、不够灵敏、稳定性低、需要排序、不能做进一步的代数运算。

3.应用

当一组数据中出现两个极端值时、当需要快速估计一组数据的代表值时、当一组数据中有模糊数据时或当存在顺序型数据时可以使用。(二)计算

1.未分组(1)数据总个数为奇数时,第(n+1)/2个数就是中数。(2)数据总个数为偶数时,可取位于中间的两个数的平均数作为中数。(3)分布中有相等重复的数时,须紧扣中数定义或使用画图法。

2.分组三、众数(一)概述

1.含义

在次数分布中出现次数最多的那个数的数值,Mo。众数可能不只一个。

2.评价(1)优点:容易理解、能避免极端值干扰。(2)缺点:代表性差、不够灵敏、不稳定、不准确、不能做进一步的代数运算。

3.应用

当一组数据中出现两极端值或双众数时、当需要快速而粗略求出一组数据的代表值时、当数据不同质时或当存在称名型数据时可以使用。(二)计算

1.直接观察

2.公式法:Mo = 3Md - 2M四、平均数,中数,众数三者的关系

1.正态分布:平均数,中数,众数相等,三值重合。

2.偏态分布:平均数最靠近尾端;中数位于平均数与众数之间。

正偏态分布:Mo ﹤ Md ﹤ M

负偏态分布:M ﹤ Md ﹤ Mo

Tip

有木有发现中数同学一直在中间,不同的只是众数和平均数的位置,所以……我们只用牢记众数或平均数其中一个的情况就行~【关键词】

平均数 中数 众数 三者关系【想一想】

如何利用中数的定义来计算中数?第四章差异量数本章导读“王家有财八十万,九个邻居穷光蛋。平均起来算一算,个个都是王八蛋(万)。”劲酒虽好,不可贪杯;我们虽可用一个集中量数来代表一坨数据,但是这坨数据如果彼此分散很大(如贫富差距很大),那么这样是不太妥的,所以我们要引用另外一个东西,即差异量数。它是用于描述数据分布中大量数据彼此分散的程度。差异量数越大,表示数据间的差别越大;差异量数越小,表示数据间越近似。

知识结构简图一、差异量数(一)全距

1.概述

全距又称两级差,指数据中最大值与最小值之差,R。

全距计算简单、容易理解;但全距不稳定、不可靠、不灵敏也易受极端值的影响。

2.计算:R=Xmax–Xmin(二)离差和平均差

1.离差(1)概述

是某一数据与平均数的差,表示每一个观测值与平均数距离的大小,正负号说明了偏差的方向,所以所有观测值离差的总和总是为0。(2)计算

2.平均差(1)概述

是所有原始数据离差绝对值的平均值。

平均差充分考虑了每个数值的离中情况,完整的反应了全部数值的分散程度,在反应离中趋势方面比较灵敏,计算方法也比较简单;但是它需要对离差取绝对值,不利于进一步做统计分析,较低效。(2)计算(三)方差和标准差

方差和标准差是表示一组数据离散程度的最好指标,其值越大,说明次数分布的离散程度越大。

1.方差(1)概述

①含义

每个数据与该组数据平均数之差平方后的均值,即离均差平方后的均数。作为样本统计量用符号s2表示,作为总体参数用符号σ2表示,也叫均方。

②特点

具有可加性和可分解性的特点。方差分析就是利用方差的这个特点,并进一步说明各种变异对总结果的影响。(2)计算

①未分组

A.基本式:

B.原始式:

②已分组

A.基本式:

B.估算式:

③总方差合成:

2.标准差(1)概述

①含义

方差的平方根。作为样本统计量用符号s表示,作为总体参数用符号σ表示。

②特点

A.每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差。

B.每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载