SPSS实战与统计思维(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-21 05:25:40

点击下载

作者:武松

出版社:清华大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

SPSS实战与统计思维

SPSS实战与统计思维试读:

前言

终于鼓起勇气,准备独自撰写一本SPSS实用教程。教书18载,看见太多的学生、教师及相关科研工作者为统计分析而发愁。我也经常纳闷,咱们本科生、研究生及博士生阶段都学习了统计,为什么一到用时就惊慌失措呢?这其中必然有教师和学生两方面的原因,教师应付教学,学生应付考试,但归根结底还是统计老师的原因。

虽然古人告诉我们“不仅要知其然,还要知其所以然”,但是松哥对此表示不同意,在科技发展如此迅猛的今天,我们能够知其然已属不易,知其所以然已不可能。比如手机已经成为我们生活的一部分,咱们会用就可以了,何必追究其工作原理,除非通信就是你的研究专业。对于统计学习,松哥一直提倡实战主义,因为需要数据分析的绝大多数用户都是非统计专业人士,过多的学习和掌握统计学的公式推导,就已将非统计专业人士的精力消耗殆尽,面对后续分析的学习,已经没有继续的勇气。所以对于初学者,如果能用简明形象的语言传授其统计的思想,然后以实际案例进行分析与解读,其效果将远胜于前者。正所谓:为伊消得人憔悴,一用就错学不会;舍得应付换应用,案例实战真英雄。

鉴于此,松哥立意写一本没有统计公式的统计分析与SPSS实战教程,一些统计思想与理论尽量用一些白话方式进行表达。思想阐明以后,就以实际案例进行案例分析,SPSS实战操作与结果的详细解读。其实松哥在2014年曾出过一本《SPSS统计分析大全》,销量很好,出版社已经多次加印,但回头看还有很多地方不太完善,甚至今天松哥对当时的写作思路都开始否定。于是决定,重新撰写一本《SPSS实战与统计思维》,这是一个疯狂的、自虐式的决定,松哥给自己一年的时间,将自己的经验与心得呈现在读者的面前,松哥相信这会是一本值得收藏的好书!

本书分为六个篇章进行讲述,第一篇:统计思维;第二篇:SPSS数据库构建与数据管理;第三篇:初级统计说一说(描述性统计);第四篇:中级统计比一比(差异性分析);第五篇:高级找关系(统计模型);第六篇:专项统计。本书定位是一本初学者的入门宝典,中级用户的提升指南,高级用户的拓展手册。本书发行后会继续征集读者意见,修订完善,最终成为一本SPSS学习的红宝书!

本书得到安徽省教育厅重点研究项目(2015jyxm186)、安徽中医药大学教学研究课题(NO.YB201012)和(2013xjzc012)资助,特此感谢。

写书是无比艰辛的,给自己一个目标,在岁月的河流中,留下活过的印记!立字为据!松哥统计2017年5月21日于安徽合肥第一篇 统计思维

吾思故吾在。——【法】笛卡儿

统计学习分为统计思想学习与统计方法学习两个部分。统计思想是统计之道,统计方法是统计之术。无道之术犹如脱缰野马,无术之道犹如空中楼阁,良术背后必有道,道术兼修方可大成。

统计思想亦为统计之魂,统计方法可为统计之躯,魂之躯之基,躯之魂所依,无魂似野尸,无躯则游魂。魂躯分之两所弃,合则人之灵。

统计之道,学之苦涩,佳境难,需悟之;统计之术,学之甘糜,提升快,可速成;故凡者多易追逐统计之术,统计之道常轻之,故常常得法不得道,每逢实战之时,反而乱了阵脚,浑身统计之术,不知使出哪招方可破敌千里。

故统计学习道术不可偏废,道先行,术跟上,思之先,践之后,是谓本书之始,统计思维也!松哥统计第1章 核心统计概念

统计学是处理复杂科学问题的艺术,概念是思维的基本单位,是思维的出发点和终点。统计概念为统计的基石,一些统计核心概念的掌握将会促进初学者对统计思维的理解与学习!本章重点讲解一些核心的统计概念,其他概念会在相关章节讲解。1.1 总体与样本(population and sample)1.1.1 总体

总体是指根据研究目的所确定的观察单位某项特征的集合。比如说我想研究安徽中医药大学所有在校生的平均体重,那根据此目的,我们研究的总体就是:安徽中医药大学所有在校生的体重数据的集合。但是需要注明一点:总体分为有限总体和无限总体,上面的例子就是有限总体,毕竟安徽中医药大学的学生还是有限的,然而科研过程中面临的大多数是无限的总体,如茫茫宇宙中星体的平均质量,如空气中某种物质的浓度,我们是无法取得其总体进行研究的。那我们面对无限总体怎么办呢?

中国古话云:“君子性非异也,善假于物也。”大意是聪明的人并不是本质上与一般人就不一样,只不过善于利用某种工具罢了。因此,我们为了研究无限总体,发明了抽样的方法,就像我们想知道一锅老母鸡汤的咸淡,不需要喝完所有的汤,只要摇匀,尝其一勺就可以了,这种思想就叫“抽样”。1.1.2 样本

样本就是从总体中抽出的部分观察单位某项特征的集合。但是在抽样过程中必须遵守随机化的原则。我们通常都是通过研究样本去推断研究总体的属性与特征。

生活中处处存在抽样的思想,如“一叶知秋”“豹窥一斑”、3·15质量抽检报告等。1.2 参数与统计量(parameter and statistics)

参数是用于描述总体特征的指标,如总体均数(μ),总体标准差(σ)、总体率(π)、总体相关系数(ρ)。

统计量是用于描述样本特征的指标,如样本均数(),样本标准差(s)、样本率(p)、样本相关系数(r)。

一般而言,我们进行科学研究直接获取到的仅是样本的统计量而已,可是我们的研究目的却是想获知总体的属性特征,即总体参数。统计学存在的核心价值就在于可以通过描述样本的统计量去推断描述总体的参数,这是通过偶然去发现必然、通过一般去发现普遍,这是以小见大的过程。参数与统计量的关系如图1-1所示。图1-1 统计四概念关系1.3 概率与频率(probability and frequency)1.3.1 概率

概率(P)是用于反映某一事物发生可能性大小的一种量度。一般用大写的斜体P表示。

我们根据事物发生概率的大小,把事件分为3类:P=1为必然事件,发生率为100%;P=0为不可能事件,发生率为0;0

小概率事件非常重要,是统计推断的基础,松哥举个例子:统计起源于赌博游戏,咱们虚构一个游戏,在一个不透明的箱子中有100个乒乓球,其中5个是黄色的,95个是白色的,现在在一个100名学生的班级中,请大家每人上来交1元钱,然后随机抽取一个球,如果抽中黄球给10元,抽不中就谢谢参与,请问你是抽呢,还是不抽呢?呵呵!

基于统计的判断,你是不该抽的,为什么呢?因为黄球所占的比例为0.05,是小概率事件,而小概率事件的应用意义为在一次抽样过程中发生的概率为0,因此,你基本不可能抽中,然而小概率事件在一次抽样过程中发生概率为0,但在群体事件中可以发生,本例发生概率为5%,班上100名同学,理论上有5名同学可以抽到。算一下,每人1元,共收到100元,减去5名抽中的奖金50元,松哥还稳赚50元呢。1.3.2 频率

频率(f)是指我们进行了N次试验,其中一个事件出现的次数m与总的试验次数N的比值。

问题是:统计是基于概率说话的,我们到底如何才能够得到某一事件发生的概率呢,比如说谁能够告诉我一支半截粉笔从讲台上掉下摔断的概率P是多大呢?我们至今的科学发展也没有办法通过公式去计算该值。那我们是怎么做的呢?有句话叫作“有些事情越想越烦,做起来却极其简单”。我们只需要拿两盒同样的粉笔进行重复摔就可以了,如果总共100支粉笔,断了98支,那断的频率就等于f=98/100=0.98。而统计学上证实,当某事件发生次数较多时,频率就会收敛于概率,意即f≈P。因此,其实我们就是通过频率去估计概率的。

你可以这样理解:频率是针对过去的,概率是针对未来的。频率是针对已经发生的样本的,概率是针对尚不知晓的总体的,频率就像样本统计量,概率更像总体参数,而我们是用频率去估计概率的。1.4 误差(error)

误差是观察值与真值之差,即我们通过一次试验得到的结果与事件真实结果之间的差值。误差根据其产生的原因分为四种。1. 系统误差(systematic error)

系统误差是因为试剂未校正或者仪器没有调零等因素造成的研究结果倾向性的增大或减小。如我们路过药房,门口放置一个体重计,请问我们在称自己的体重之前,首先要干的第一件事情是什么呢?有同学说先把手上的包放掉,有同学说把鞋子脱掉,还有同学说我看看是不是要收费的再说,呵呵!但从统计学角度,我们应该看看体重计上的指针是不是对准零,如果体重计本身就有5kg底重,那我们所有的同学去称,都将会重5kg,即发生倾向性的偏大。系统误差其特点为:倾向性的增大或减小,可以避免,如果我们进行调零,系统误差就可以避免。2. 随机误差(random error)

随机误差是由各种偶然因素造成的观察值与真值之差。比如某班级所有同学用同一把尺子测量松哥的身高,结果发现我的身高值是不一样的。随机误差的特点为:不可以避免,但可以减少。统计学有一定律叫作“测不准定律”,不管你怎么测,就是测不准,那对于重要的指标我们怎么办呢?正如网上流行的一句话“重要的事情说三遍”,那么我们对重要的指标,就多测几遍喽!3. 抽样误差(sampling error)

抽样误差是因为抽样造成的样本统计量与总体参数之间的差异。有同学肯定会说,刚才那一勺老母鸡汤的咸淡应该和锅里汤的咸淡是完全一样的啊!是的,刚才的例子是让你明白抽样的原理,而我们科学研究和喝老母鸡汤是不一样的,因为汤里的氯化钠是均匀分布的,而我们科学研究的目标事件是不均匀分布的。比如某个班级120名同学的近视眼患病率为50%,松哥按照随机化原则随机抽取50名同学,这50名同学的近视眼患病率理论不会等于50%,因为近视眼同学在班级中的分布是不均匀的,能理解吧!因此抽样误差的特点为:不可以避免,但可以减少,我们可以通过增大样本量进行减少,可以看图1-2帮助理解哦。图1-2 均匀分布与不均匀分布4. 过失误差(gross error)

过失误差是由于观察过程中的不仔细造成的错误判断或记录。过失误差可以通过仔细核对避免。

那么统计学的存在,主要是解决哪种误差呢?我们通过统计设计减少系统误差,通过统计学检验去排除抽样误差。测量误差不可避免,可以通过培训降低;过失误差可以通过质量控制消除。1.5 同质与变异(homogeneity and variation)1.5.1 同质

同质是指观察单位所受的影响因素相同。而我们科研的观察单位所受的影响因素只可能相对的相同,不可能绝对的相同,因此,同质是相对的。我们科研所确定的总体或者样本,在某些因素上必须是同质的,只有这样我们才能将其作为一个群体进行研究。1.5.2 变异

变异是指观察单位在同质基础上的个体差异。很多哲言或谚语都在说明变异的存在,如天底下没有两片完全一样的树叶;一个人不可能两次踏入同一条河流;刚才说话的我已经不是现在说话的我了;天下唯一不变的就是变化。因此,变异是绝对的。

这一对概念对研究统计的意义:如果没有同质,就没有我们研究的总体或者样本。因为如果不同质,我们是不可能把他们放在一起进行研究的。如果没有变异,就根本没有统计学产生的必要,因为如果没有变异,我们拿1种药物治疗某病的1个病人,如果有效,该药对所有患该病的病人都应该有效,而那是不可能的。因为人与人之间的变异性是绝对存在的,对你有效,对我却未必有效,而统计学就是在群体的水平上去发现事物背后的本质与规律的。1.6 随机化原则(random principle)

随机化原则是指我们在选择受试对象、对受试对象分组以及对受试对象施加不同的干预措施时,受试对象被抽到的概率、被随机分到各组的概率以及接受不同干预措施的概率是相等的。统计学中随机化的具体体现包括随机化抽样、随机化分组和随机化顺序。三种随机化的模式见图1-3。

随机化抽样是指我们从研究总体中抽取研究样本时,总体中的任何一个个体被抽到作为样本进行研究的概率相等。

随机化分组是指我们获取研究样本后,样本中的每个受试对象具有同等的机会被分配到各个研究组中去。

随机化顺序是指当我们进行交叉试验时,随机化分组后的研究组接受不同干预措施的顺序是随机的。图1-3 三种随机化模式A:随机化抽样;B:随机化分组;C:随机化顺序1.7 因素与水平(factor and level)1.7.1 因素

因素是可能对应变量有影响的变量,而分析的目的就是比较不同水平对应变量的影响是否相同。如性别可能对性格有影响,性别此时就是因素;而性格可能对某种疾病有影响,此时性格就是因素了。某个变量到底是不是研究因素,是由研究目的确定的!1.7.2 水平

因素的不同取值等级称作水平,例如,因素性别有男、女两个水平,血型有A、B、O和AB型4个水平。水平往往是统计学分组的依据。1.8 变量(variable)

变量为观察单位的某项特征,如人的身高、体重、性别、年龄、血型、营养程度等,通俗讲就是我们研究的指标。根据变量特征的属性,变量可以分为计量变量、等级变量和计数变量。1.8.1 计量变量

计量变量时通过定量的方法检测出来的指标,通常以阿拉伯数字呈现,具有单位,并可以定量地比较,如身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、工资、年龄等。计量变量支持加减法(+/-)运算。计量变量很多书上又称为数值变量,连续性变量,定量变量。1.8.2 计数变量

计数变量反映的是互不相容的属性和类别,反映的是一种我中无你、你中无我的关系。常通过计数的方式获得,如血型(A、B、O和AB)、性别(男、女)、生肖属相、民族等。计数变量之间支持不等号(≠)。计数变量又称为分类变量,无序分类变量。1.8.3 等级变量

等级变量具备计数变量的性质,同时又具有半定量比较的性质,如病情(轻、中、重)、职称(初级、中级、高级)、学历(文盲、小学、中学、本科及以上)、福利待遇(好、中、差)。这类变量各水平之间互不相容,但又有级别上的轻重关系。等级变量支持大于号和小于号(>/<)。1.8.4 变量之间相互转换

同一受试对象身上可以检测出上述的三种变量,三种变量反映受试对象信息的能力顺序依次为计量变量、等级变量和计数变量。为了方便大家记忆,我们把三种变量依次称为老大、老二和老三。变量之间可以相互转化,但只能从高级别变量向低级别变量转化。意思是计量可以转为等级和计数,等级可以转为计数,但不可以逆转。

正如某医院的院长是老大、科室主任是老二、科里的医生是老三。哪一天这位院长不想干了,他可以到科室当主任、也可以当科员,但是科员不是想当主任、想当院长就能当的。

从专业上举个例子,如某人收缩压180mmHg(计量变量),可以转化为等级变量(高血压、正常、低血压),也可以转化为计数变量(正常、异常),但是如果我只告诉你,松哥的血压不正常,你是无法知道我是高是低,以及具体血压数值的。这点也给我们一个启示,科研过程中尽量去获取计量资料,因为其信息多,而且可以转化。第2章 常见统计设计

统计方法的选择可以总结为15字口诀:方法看变量,设计看类型,目的定乾坤。意思是选择哪一类统计方法首先看变量到底属于我们前面说的三种中的哪一种,然后决定统计方法,具体统计方法选择哪一类型,得看设计类型,当然最终方法的选择还得考虑研究的目的,比如某班级不同性别两组大学生比较体重,一看研究指标是体重,为计量变量,而且是2组,基本就考虑是t检验了,可是t检验有3种,到底如何选择呢?因为给出的不同性别两组大学生,男女生之间相互独立,因此本例应该选择2独立样本t检验(此时数据应该符合独立、正态、方差齐,否则还得换方法)。这个例子有点早,还没怎么开始学,可能读者理解不了。下面我们就先学习统计设计,然后回头看这个例子也许会好点。2.1 成组设计

成组设计是一种将受试对象随机分组或者按照某种属性特征将受试对象分配到2组或K组中去。它的特征为组间的受试对象相互独立。成组设计模式图见图2-1和图2-2。图2-1 成组设计——2组模式图2-2 成组设计——K组模式

大家注意,统计学上存在一种“2K效应”,成组设计中的2组与K组(K≥3),虽然设计都是成组设计,但后续采用的统计分析方法是不一样的!如研究变量为计量变量,成组2组设计优先考虑2独立样本t检验,而K组优先考虑单因素设计方差分析。2.2 配比设计

配比设计是指受试对象按照一定的条件进行匹配,然后再随机分组的方法,包括配对设计和配伍组设计。2.2.1 配对设计

配对设计见图2-3,包括同一组受试对象干预前后配对(A);同一个受试对象身体不同部位配对(B);条件相同的2个受试对象配成对子,然后随机分到2组中设计(C);以及同一份标本分别接受不同的处理(D)。图2-3 配对设计四种类型模式图2-4 配伍组设计四种类型模式2.2.2 配伍组设计

配伍组设计为配对设计的进一步扩大,如图2-4所示,每一种情况都是对图2-3的扩大化。其中的A为干预前、中和后,这种情况当是单组设计时可以当作配伍组设计方差分析,但当是多组设计时,应该考虑用重复测量数据方差分析;B为同一个受试对象对身体K个部位进行检测;C为按照条件选择K个受试对象构成一个配伍组,然后配伍组中的每个受试对象随机分配到各组中去;D为同一份标本采用K种方法检测。2.3 析因设计

问大家一个问题,比如果园里一个男性工人每小时单独可以摘100个苹果,一个女性工人单独可以采摘80个苹果,请问一男一女搭档工作,一小时采摘180个苹果吗?松哥并不想让你们告诉我答案,只想你们能达成一个共识,就是因素与因素之间可能会发生相互影响,也就是交互作用。

同样,统计学当研究多因素的时候,因素与因素之间也可能发生交互作用,可是我们可以通过什么方法进行研究呢?本节的析因设计就是研究交互作用的一种方法。

析因设计是多因素多水平全面组合,每一种组合就是一个研究分组的试验设计方法。试验设计模式图见图2-5。图中可见研究2个因素,因素A有图2-5 析因设计模式用和不用2个水平,因素B有用和不用2个水平,2×2全面组合,将有4组,如图中4个框。

此时,我们可以进行三次假设分别解决三个问题,即因素A有没有效果、因素B有没有效果,以及A×B之间有没有交互作用。析因设计是一种非常浪费样本量的方法,因此实际工作中研究因素一般不超过3个,水平数亦不可过多。如3×3×3析因设计,共27组,按照每组10只老鼠计算,270只老鼠,再适当扩充一点以防止老鼠死亡损失,则300多只老鼠,这对于一个课题组而言是不可思议的,很难保证这么多老鼠的干预措施的同质性。如果研究因素较多,可以考虑正交设计或者均匀设计的方法。2.4 重复测量设计

重复测量设计是近年受到重视的一种设计,该设计是指对同一个受试对象在不同的测量时间点进行重复检测的设计。图2-6 重复测量数据模式

注意:重复检测必须在同一个受试对象上,很多实验取材检测需要处死受试对象,此时已经不能算作重复测量设计。一句话,坚持住不能死,一定要做“鼠坚强”,否则应该当作析因设计进行分析。2.5 其他设计

其他设计还包括交叉设计、正交设计、拉丁方设计、嵌套设计、均匀设计等,此处不赘,当讲到相应内容时再讲解。第3章 统计思想

任何一门学科,都有其定位的思想,其为学科之根,只有根深蒂固的思想,方能开出灿烂的学科之花。统计学也不例外,以下5点统计学思想可供参考。3.1 抽样的思想

除非研究目的非常特殊,不然我们的研究对象不可能获取到总体,几乎都是总体中的样本,而样本都是从总体中按照随机化的原则抽取获得的。随机化抽样是指根据研究目的确定的研究总体中任何一个研究对象都要有同等的机会被抽到作为样本进行研究,从而推断总体情况。

抽样思想的精髓为化繁为简,化无限为有限,化不可能为可能。通过抽样我们可以获取研究样本,对有限的研究样本进行研究,从而得到样本统计量,进而推断总体情况。3.2 总体推断思想

样本统计量是实际可以检测获得的,可是我们却志存高远,目的是研究总体。因为抽样误差的必然存在,所以样本统计量不等于总体参数,但会与总体参数比较接近。我们在一定误差的控图3-1 参数估计模式制下,可以通过样本统计量去预测总体参数,具体包括两种方法:点值估计法和区间范围估计法,见图3-1。

点值估计认为样本统计量就等于总体参数,忽略了抽样误差,因此该法风险偏大,基本不用;参数估计法是指通过样本统计量,去预测一个总体参数的95%(或90%、99%,根据研究目的确定,95%最为常用)可信区间。

抽样思想与总体推断思想相互结合应用。只抽样,不推断,丧失了抽样的初衷。不抽样,又失去了推断的基础。3.3 反证法思想

反证法的思想就是将我们要研究的问题凝练为两种可能A和B,然后证明其中的A不可能发生,那真理就是B。如一个警察追逐一个小偷至一个Y形路口,小偷不是往左上跑就是往右上跑,如果我们能够证明小偷往左上跑的概率P<0.05,那么请问警察应该往哪边追呢?按照小概率事件在一次事件过程中不可能发生的规则,警察应该往右上去追。

我们科研过程中,验证某药是否有疗效,我们将研究结局分为两种可能,H:药物无效;H:药物有效。然后采用对应的统计分析方01法,去获取H(药物无效)发生的概率,如果P<0.05,则H(药物00无效)不可能发生,则H(药物有效)成立。若P>0.05,则H(药10物无效)是可能发生的,则我们不能够拒绝H,因此尚不能认为该药0无效。3.4 小概率思想

在第1章中,我们已经学过小概率事件,即发生概率P≤0.05或P≤0.01的事件。小概率事件的应用意义就是小概率事件在一次抽样过程中发生的概率为0。因此,一旦我们判断出某事件的发生概率P≤0.05,我们判断该事件在个体水平不会发生。

小概率思想是统计推断的核心,是统计学价值的基础。假设检验就是反证法与小概率事件思想相结合的具体体现。图3-2中,他爱那个她吗?他爱你还是不爱你,用反证法去试试吧!图3-2 小概率漫画3.5 误差控制思想

尽管可以采用小概率事件原理进行统计推论以保证推论的准确性,然而,如果整个实验或试验或调查没有进行很好的质量控制,也是白搭,因此,实验设计必须有着误差控制的思想。误差控制可以具体体现在“三要素”和“四原则”上。同时假设检验也会发生统计学I类和II类错误,统计分析时均需加以考虑,方能在最大程度上推测总体的真实面目。统计学误差包括系统误差、抽样误差、随机测量误差和过失误差,相关章节已述,此处不赘。第二篇 SPSS数据库构建与数据管理

合抱之木,生于毫末;九层之台,起于垒土;千里之行,始于足下。——《老子》

第一篇类似于统计学之基础,第二篇是SPSS统计软件的基础,统计学的基础为统计理论的基础,SPSS软件的基础类似于统计实战的基础,一文一武,学习之后,咱们就开始真正的实战。第4章 SPSS简介与数据库构建4.1 SPSS简介

SPSS是全球领先的统计分析与数据挖掘产品,是世界上应用最广泛的专业统计和数据模型软件之一,全称为Statistical Product and Service Solutions,是由美国斯坦福大学的三位研究生于1968年开发的;而SAS成立于1976年;Stata成立于1985年;R软件于1995年才开始研发,R语言的前身S语言研发于1989年;Matlab创立于1982年;Eviews前身是1981年第1版的Micro TSP;Minitab INC成立于1983年;微软公司创立于1975年。可见SPSS是最早的一款专业的统计分析软件。2009年SPSS公司被IBM收购,自SPSS 19.0开始,产品名称更名为“IBM-SPSS”。截至2018年5月本书完稿之时,SPSS已经发布25.0版本。“易学易用易普及”已成为SPSS软件最大的竞争优势之一,也是广大数据分析人员对其偏爱有加的主要原因;而大量成熟的统计分析方法、完善的数据定义操作管理、开放的数据接口以及灵活的统计表格和统计图形,更是SPSS长盛不衰的重要法宝。SPSS在全球100多个国家和地区有分支机构或合作伙伴,约有28万家产品用户,分布于金融保险证券、制造业、市场调研、政府税务、教育科研、医疗卫生、化工行业、零售业、电子商务等多个领域和行业,全球500强中约有80%的公司使用SPSS;而在市场研究和市场调查领域有超过80%的市场占有率,SPSS是世界上应用最广泛的专业统计软件之一。4.2 SPSS 24.0安装

登录IBM SPSS主页(https://www.ibm.com/analytics/cn/zh/technology/spss/)可以获取下载试用版本,也可以通过百度搜索“SPSS 24.0”获取下载链接。本文主要讲解Windows试用版如何安装(MAC版和Linux版安装类似,不再讲解),试用版除了使用期限有限制外,功能与正式版一样。4.2.1 确定计算机系统

SPSS 24.0分为32位系统和64位系统版本,你安装前首先得知道自己计算机为何种系统。你可以在计算机桌面找到“计算机”图标,然后右键→属性,即可查看。

注意:64位的计算机系统可以安装32位的软件,32位系统不可以安装64位软件,但最好版本一致,使用才会更加顺畅。4.2.2 安装步骤

点击SPSS 24.0安装图标,安装过程的所有界面如图4-1~图4-12所示,按图操作即可,没有特别之处。图4-1 准备安装图4-2 空间计算图4-3 欢迎向导图4-4 是否屏幕阅读图4-5 是否加载Python图4-6 是否接受许可图4-7 是否接受Python协议图4-8 开始复制文件图4-9 安装确定图4-10 安装中图4-11 完成安装图4-12 输入邮箱

单击“完成”按钮,SPSS 24.0将启动运行,如果未能启动,可以在程序栏中找到IBM SPSS Statistics 24.0程序,单击运行,首次运行会弹出图4-12,在电子邮件框中填入正确的邮箱,即可以获取试用权限进行试用。

填入电子邮件后,弹出SPSS数据视图,如图4-13所示,至此,SPSS 24.0试用版已经安装完毕,可以开始SPSS数据分析之旅啦!如果你安装出现问题,请百度搜索“网易云课堂”,在云课堂中搜索“松哥统计”,可以找到松哥发布的SPSS快速入门的免费视频教程进行学习。图4-13 SPSS界面4.3 SPSS启动与退出

在Windows桌面,单击“开始”—“所有程序”—“IBM SPSS”—“IBM SPSS Statistics 24.0”命令,即开始运行SPSS 24.0。当软件安装结束后,你也可以在桌面创建SPSS 24.0的快捷方式。SPSS有多种退出方式:单击SPSS窗口右上角的“×”图标;选择并单击菜单中的“Exit”命令;双击SPSS窗口左上角的窗口控制菜单图标。这些都比较简单,无须细讲。4.4 SPSS 24.0窗口简介

SPSS主要窗口包括:数据视图(data view)、变量视图(variable view)、结果输出窗口(output view)、图表编辑窗口(chart editor)、语法编辑器窗口(syntax editor)和脚本编辑窗口(script view);其中最常用的是数据视图、变量视图,其他窗口在需要用到时再讲解。知识的学习存在二八定律,我们初学者一定要将有限的精力放在最常用、最重要的知识点上哦!4.4.1 数据编辑窗口

当我们启动SPSS后,出现的第一个窗口即为数据编辑窗口,如图4-14所示。数据编辑窗口是用户进行数据处理与分析的主要窗口界面,用户可在此窗口进行数据输入、观察、编辑和统计分析等操作,是SPSS最主要的操作窗口界面。图4-14 SPSS 24.0数据编辑窗口

1. “标题栏”:箭头1所指区域,显示窗口名称和编辑的数据文件名。如果当前数据编辑器中是一个新建的文件,其显示为“未标题1【数据集0】—IBM SPSS Statistics数据编辑器”。

2. “菜单栏”:箭头2所指区域,从左至右包括“File”“Edit”“View”“Data”“Transform”“Analyze”“Direct Marketing”“Graphs”“Utilities”“Add-ons”“Windw”和“Help”菜单。

3. “常用工具栏”:箭头3所指区域,列出了数据编辑所使用的常用工具。SPSS数据窗口最常用的工具见图4-15。图4-15 工具栏常用工具

4. “数据和单元格信息显示栏”:箭头4所指区域,其中灰色区域显示单元格的位置;空白区域为数据编辑区,显示当前选中的单元格的内容,用户可在该区域输入或修改相应的内容。

5. “数据编辑显示区”:箭头5所在的中部网格区,该区最左边列显示单元序列号,最上边一行显示变量名称。选中的单元格呈黄色显示,其内容将出现在数据和单元格信息显示栏中,在此输入或修改单元格内容。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载