SPSS轻松学——实战案例(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-21 09:14:43

点击下载

作者:汤后林

出版社:人民卫生出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

SPSS轻松学——实战案例

SPSS轻松学——实战案例试读:

前言

SPSS是一款好学易懂的统计学软件,既可以通过窗口菜单,也可以通过语法程序进行数据整理和统计分析,是当前应用最为广泛的统计分析软件之一。

随着计算机信息技术发展,各行各业在工作和科研活动中产生了海量的原始数据,这些原始数据需要借用专门的数据分析软件进行整理、分析和利用,以用于指导开展工作或撰写报告和论文。作为一名公共卫生工作人员和一线临床医生,在日常的疾病监测、疾病控制、专题调查、临床实践等活动中,收集到了大量的数据,而这些数据整理和分析用一般计算器无法完成,需要借用专门的统计分析软件进行整理和分析。笔者在过去几年到各级医疗机构和疾病控制机构与工作人员进行沟通时发现,大家普遍感觉到在数据分析方面心有余而力不足,不能很好地分析利用现有的数据,甚至有时错误应用统计方法进行统计分析,迫切希望有一款通俗易懂、操作性和专业性强的参考书来指导进行现有数据分析利用,解决基层工作人员的实际问题。

结合多年SPSS使用和从事公共卫生和临床数据分析工作的经验,针对基层从事公共卫生工作人员和一线临床医生撰写了此本SPSS参考书,本书不求介绍高深复杂的统计方法,唯求简单、简洁和实用。第一章至第四章主要介绍SPSS数据整理方法,第五章主要介绍SPSS中的常用抽样方法,第六章主要介绍SPSS中常用图的作图方法,第七章主要介绍常用检验方法和回归模型,第八章和第九章主要介绍工作数据和论文数据的数据整理和统计分析方法,第十章主要介绍数据整理和数据分析中的一些技巧,第十一章主要介绍了近年来公开发表论文中的一些统计学方法误用及如何纠正。本书主要采取实际工作中的案例进行剖析讲解,力求达到举一反三的效果。

本书在编写中存在一定的不足,希望大家在使用过程中提出更多的宝贵意见和建议。汤后林2018年5月第一章 初步认识SPSS

社会科学统计软件包(statistical package for the social science,SPSS)是世界上应用最广泛的专业统计和数据模型软件之一。经过四十多年的发展,在全球已拥有大量的用户。目前,SPSS使用Windows的窗口方式展示各种管理和分析数据的方法,可方便地用于各类商业管理和科研数据管理及统计分析工作。本章概要介绍SPSS的发展、主要版本、运行方式和启动与退出的使用。

1968年,3位美国斯坦福大学的学生开发了最早的SPSS系统,并基于这一系统于1975年在芝加哥合伙成立了SPSS公司。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。2009年IBM收购了SPSS公司。SPSS被IBM全资收购后,成为IBM软件部的一个产品,现该产品归属在大数据与分析集团Analytics下。

到目前为止,SPSS已成为适合于DOS、Windows、UNIX等多种操作系统的产品,国内常用的是其适用于DOS和Windows的版本。本书以运行于Windows操作系统上的SPSS 24.0 for Windows标准版为例,并在本书后面的内容中简称为SPSS。

学习软件,得先掌握软件的基本模块及其逻辑关系。因此,要想熟练掌握SPSS软件并在数据分析中熟练运用,先要掌握SPSS软件的基本模块及其基本步骤。第一节 SPSS运行窗口

SPSS软件的安装非常简单方便,直接根据安装盘的提示进行安装即可,市场上各类SPSS软件教材均有介绍,本文不再赘述。本书中有关操作步骤和界面是以“IBM SPSS Statistics 24”为例,不同版本的SPSS软件之间显示界面稍微有些差别,但不影响读者使用。一、SPSS如何打开

1.打开SPSS软件的方法,既可以直接双击桌面快捷图标,也可以从电脑桌面通过“开始—所有程序—IBM SPSS Statistics”的目录下,点击“IBM SPSS Statistics 24”,如图1-1所示。图1-1 打开SPSS软件

2.打开SPSS后,如图1-2所示界面。这时,SPSS浮现窗口会问“你希望做什么”,对于初学者,可以不用管它,直接点击“取消”按钮(第二章具体讲如何读取数据至SPSS软件中),这样就打开了SPSS主界面。图1-2 打开SPSS软件对话界面

3.SPSS主界面的数据编辑窗口由菜单栏、工具栏、编辑栏、变量名栏、内容区、窗口切换标签页和状态栏组成,如图1-3所示。图1-3 SPSS数据编辑窗口

4.SPSS提供了多种语言的用户界面,可以根据需要进行切换。(1)如果希望打开的界面是中文界面,可以通过菜单栏点击 “编辑—选项—常规”,在打开的对话框的右下角“用户界面”,根据需要选择语言种类,如果希望用户界面为英文,选择“英文”即可。如图1-4所示。图1-4 用户界面中文切换英文(2)如果希望打开的界面是英文界面,可以通过菜单栏依次点击“Edit-Options-General”,在打开的对话框的右下角“User interface”根据需要选择语言种类;如果希望用户界面为简体中文,切换到“Chinese(simplified)”即可回到中文界面,如图1-5所示。图1-5 用户界面英文切换中文二、SPSS运行窗口

SPSS是多窗口软件工具,软件运行时所使用的窗口主要有4种:数据编辑窗口、结果输出窗口、语法程序窗口和脚本窗口,其中前3种在实际工作中比较常用,需要大家熟练掌握,灵活运用。(一)数据编辑窗口

SPSS处理数据的主要工作在此窗口中进行。此窗口打开后会在左下角出现两个视图:数据视图和变量视图,两个视图之间可以通过鼠标点击窗口左下角的数据视图或变量视图进行切换。一旦启动SPSS后,默认打开的界面就是数据编辑窗口。

1.数据视图显示具体的数据内容,这些数据可以是直接录入或者从外部数据导入,其中的行代表观察个体(个案),每行表示一条个案记录,列代表个案的不同变量值,如图1-6所示。图1-6 数据视图窗口

2.变量视图显示个案的不同变量的具体信息如:变量名称、类型、宽度、小数、标签、值等信息,如图1-7所示。图1-7 变量视图窗口(二)结果输出窗口

SPSS结果输出窗口用于显示和编辑数据分析的输出结果。如果分析过程正确,显示分析结果。如果分析过程中发生错误使处理失败,则在窗口中显示出系统给出的错误信息,通过给出的错误信息,就可以知道分析过程中出现的具体问题。结果输出窗口分为两个区:左侧目录区和右侧内容区。

1.目录区显示的是SPSS不同分析结果的目录。

2.内容区显示的是与目录一一对应的具体分析结果。

3.通过点击结果输出窗口中的不同级别的目录,在右侧的内容区中会显示该目录下的分析结果的具体内容,对于多次执行不同的分析,产生的分析内容比较多,通过点击目录,查找对应的分析结果就非常方便,如图1-8所示。图1-8 结果输出窗口(三)语法命令窗口

也称命令语句窗口或语法编辑窗口,是编辑和运行程序命令的编辑器。与其他一些数据分析软件类似,SPSS也提供了语法程序运行方式进行数据分析,一方面与菜单运行方式进行互补,另一方面便于对重复工作进行简化,一次编辑完成,多次使用。例如图1-9是对变量(地区级别)进行频数分析的程序语法语句。图1-9 语法命令窗口

1.第1~2行是从计算机中读取SPSS数据库文件。

2.第3行是临时生成的数据库并作为活动数据集(注:SPSS读取数据库文件后会自动生成一个临时活动数据集,这样便于操作运行后保存为所需要的数据库文件)。

3.第4~5行是对变量“地区级别”进行频数分析。(四)脚本窗口

SPSS脚本是用Sax Basic语言编写的程序。在脚本窗口也可以像SPSS宏一样构建和运行SPSS命令语句。可以将经常做的工作编辑成脚本文件,供使用时直接调用,这样可以大大提高工作效率,对于一般使用者来说,没必要去专门学习掌握。三、SPSS选项设置

打开SPSS后,各窗口的界面显示方式可以根据用户喜好或者需要进行设置。这里就好比装修房子,把需要的各类材料尺寸、颜色等规格都预先设置一下,这样就既省工又省料,界面看上去还很美观。那么怎么做到呢?在打开的SPSS数据视图界面的菜单中选择“编辑—选项”,如图1-10所示,以下主要介绍常用的功能。图1-10 常规选项设置

1.常规

对变量列表、角色、Windows观感效果、输出语言方式、用户界面的语言界面等进行设置,设置完毕点击“应用”或者直接点击“确定”按钮。

2.查看器

对各种结果的初始输出状态进行设置,包括输出的标题、页面标题和文本输出的字体、大小、颜色等进行设置。如图1-11所示。图1-11 查看器选项设置

3.数据

通过预先设置数据的转换与合并、显示新数值变量的格式等等,在随后的数据管理过程中就会默认预先设置的结果。如图1-12所示。图1-12 数据选项设置

4.货币

预先设置货币型数值的显示格式。

5.图表

对输出图表的宽高比、字体、样式、各条目的对比、线条等进行设置。

6.枢轴表

主要是对输出的统计表格的外观、列宽等进行设置,以便符合统计要求。此项功能比较重要,默认为缺失,一般根据统计学习惯要求,选择“Academic”。当然也可以根据大家的喜好,进行多种选择。如图1-13所示。图1-13 枢轴表选项设置

7.语法编辑器

主要是对语法程序语句格式进行设置,不同语句的编码显示颜色,错误的语句编码显示颜色,以便于区分和识别。如图1-14所示。图1-14 语法编辑器选项设置

● 请注意:“从对话框粘贴语法”默认为“自上一条命令之后”,就是说,每次粘贴一个操作的语法程序到语法程序窗口中,自动粘贴在上一次粘贴的语法程序之后,这样就不会乱,也便于后期保存连续操作后的全部语法程序,以便下一次重复该项操作时,直接运行语法程序即可得到预期的结果。这个在后面讲实战案例时,大家就更有体会。第二节 SPSS运行方式

本节主要介绍SPSS常用的两种运行方式:窗口菜单运行方式和语法程序运行方式。一、窗口菜单运行方式

1.这种运行方式就是在使用SPSS过程中,完全依靠菜单、按钮和对话框输入等方式进行数据录入、数据整理和数据分析的操作过程。完全窗口菜单方式是在Windows图形界面下最常用的管理方式,操作简单、方便直观。这也是SPSS作为非常友好的软件而受到广大用户欢迎的原因。SPSS中几乎所有的统计功能都可以通过SPSS提供的菜单模式实现,不需要记住复杂的统计功能命令和语法。

2.窗口菜单方式的缺点也是非常明显的,就是每次进行同类数据的整理和统计分析,都要将相应的菜单和所需参数操作一遍,对于大量的重复性统计分析工作,这种方式的处理效率低下,速度较慢,也容易产生操作和输入错误。因此,进行大量重复性统计分析工作时,就需要借用另外一种运行方式:语法程序运行方式。

3.窗口菜单的操作方式,大家根据自己的喜好选择中文或英文用户界面后,SPSS提供了多种类型的操作菜单,每个菜单下分为具体的菜单项,根据需要进行选择。本节不对各个菜单项的具体功能进行逐一介绍,在后续的数据库处理和案例分析过程中,将结合实例给大家进行详细介绍:(1)数据编辑窗口:提供了11种用户菜单:文件、编辑、视图、数据、转换、分析、直销、图形、实用程序、窗口和帮助。(2)结果输出窗口:提供了13种用户菜单:文件、编辑、视图、数据、转换、插入、格式、分析、直销、图形、实用程序、窗口和帮助。(3)语法窗口:提供了13种用户菜单:文件、编辑、视图、数据、转换、分析、直销、图形、实用程序、运行、工具、窗口和帮助。(4)脚本窗口:提供了7种用户菜单:文件、编辑、查看、宏、调试、表和帮助。二、语法程序运行方式

1.语法程序运行方式是在SPSS的语法窗口中直接运行已编辑程序的一种方式。在语法窗口中输入SPSS各种命令组成的程序,然后根据需要选中部分程序或全部程序,提交SPSS系统执行,运行完毕给出分析结果。程序运行方式适合于大规模或重复性的统计分析工作,编写好的程序保存后可以随时调用。

2.语法程序也可以通过菜单方式选择数据整理和(或)数据分析的菜单和选项,选择完毕后,在对话框中点击“粘贴”按钮,SPSS系统会自动打开一个语法窗口,并将通过菜单方式选择的数据整理和(或)数据分析转换为系列命令程序,粘贴到打开的语法窗口,用户可根据分析需要,对语法窗口的程序进行编辑、修改和保存,在语法窗口的菜单栏中,选择“运行”,然后选择“全部”(对所有程序进行运行)或“选择”(先通过光标选择需要运行的部分程序)运行,完成程序的执行操作。如图1-15和图1-16所示。图1-15 从窗口菜单导出程序命令图1-16 窗口操作转换为语法命令第二章 SPSS数据录入和获取

使用SPSS软件目的是通过软件实现对数据的管理和分析,数据是分析基础,因此,建立SPSS数据文件是进行数据管理和分析的基础。本章将介绍进行SPSS数据文件创建的方法和操作。第一节 数据属性及定义

只要打开SPSS软件,系统就会自动生成一个空数据文件,大家根据自己的需要先在数据编辑窗口的变量视图中定义变量,然后录入数据并保存即可。图2-1就是一个打开的空白数据文件的数据录入界面。图2-1 SPSS数据编辑窗口

一个完整的SPSS数据结构包括变量名、变量类型、宽度、小数、标签、变量值、缺失值的定义、列宽、对齐方式等。关于定义变量,市场上的SPSS教材均有介绍,本书从实用的角度进行简明扼要的介绍,特别是一些需要强调的注意事项,下面进行逐一讲解。(一)变量名

变量名是变量参与分析的唯一标识。在采取直接录入方式录入数据前,首先就是定义变量结构,定义变量结构时首先应该给出每个变量的变量名(图2-2)。如果不事先指定变量名,SPSS系统默认以“VAR”开头的变量名,后面跟5个数字,如第一个没指定的变量名VAR00001,遇到第二个没有指定的变量名VAR00002,以此类推。变量名命名原则需要掌握:图2-2 定义变量名

1.变量名首字符必须是字母或汉字,后面可以为任意字母或数字。

2.变量名必须是唯一的且不区分大小写。

3.变量名不能超过64个字符。

4.变量名结尾不能以圆点、句点或者下划线。

5.SPSS的保留字符(ALL、NE、LE、GE、BY、AND、NOT、WITH、EQ 等)不能作为变量名。(二)变量类型

主要有数值型、字符型和日期型,这3种变量类型在实际工作中会经常用到,需要熟练掌握,在后续章节会具体介绍如何进行不同类型变量之间的相互转换。

1.数值型变量

根据其功能和显示方式,数值型变量又可以细分为6种类型:标准数值型、逗号数值型(每3位用逗号分隔)、圆点数值型(每3位用圆点分隔)、科学计数法数值型、美元数值型(显示时带有美元符号)和自定义货币数值型。系统默认的变量类型为标准数值型,也是最为常用的数值型。如图2-3所示。图2-3 数值型变量对话框

2.字符型变量

字符型变量是非数值型变量,其值是由字符串构成的。字符型变量的默认显示宽度8个字符,可以修改字符串长度(图2-4)。字符串变量值不能直接参与数学运算,但是可以通过SPSS软件的函数转化为数值型变量进行数学运算。这个功能会在后续有关数据管理的章节中进行具体讲解。图2-4 字符型变量对话框

3.日期型变量

日期型变量用来表示日期和时间的变量类型。SPSS提供了29种日期型变量的显示格式。SPSS软件在打开的日期型变量对话框中显示所有的日期型变量格式,供大家根据需要进行选择(图2-5)。如mm/dd/yyyy,mm表示两位数显示的月份,如1月份为01,dd表示两位数的天数,如第8天为08,yyyy表示四位数的年份,如1998年。日期型变量在SPSS中的存储是以该日期与1582年10月14日零点相差的秒数,如果将日期型变量转换为数值型,显示的就是差值的秒数。在实际工作中会经常用到两个日期之差来计算相隔多少小时、多少天、多少年等。如相差的秒数除以60×60×24等于天数。图2-5 日期型变量对话框(三)变量标签

变量标签是对变量名和变量值的进一步解释,这个可以有也可以没有,变量标签分为变量名标签和变量值标签。

1.变量名标签

是对变量名的进一步解释。因为在进行数据分析前,为了数据分析的方便,可能用一些字母加编号或英文单词等作为变量名,那么这个变量名的具体含义是什么,代表什么,就可以在变量名标签中进行解释。变量名标签的定义方法直接在该变量名的标签栏双击进入编辑状况,输入该变量名标签即可。如图2-6所示。图2-6 添加变量名标签

2.变量值标签

变量值标签是数值型变量值的含义的进一步解释。对于数据库文件中的数值型变量用非数值型变量表示非常有用,这在日常数据分析工作中会经常用到,它使数据分析结果的可读性得到进一步加强。如学历在数据库中用数值型变量表示,取值1~6,1表示文盲,2表示小学,3表示初中,4表示高中及中专,5表示大专及本科,6表示研究生。定义变量值标签时,在数据编辑窗口的变量视图中,点击该变量的“值”那一栏,该栏的右侧会显示一个“…”的隐藏框,点击这个隐藏框,出现变量值设置对话框,如图2-7所示。在变量值设置对话框中,在“值”后面空白框中输入变量值,在“标签”后面空白框中输入该变量值表示的含义,完成后点击“添加”按钮,就在其右侧的空白框中显示变量值及其表示的含义,以此类推。将所有变量值及其标签输入完后,点击“确定”按钮,完成对该变量的标签设定。如果需要修改或删除某个变量标签,就在右侧空白框中选择该变量标签,然后点击修改,在上方的“标签”后面空白框中修改,修改完毕点击“修改”;如果删除某个变量标签,直接在右侧的空白框中选中该变量标签,然后点击“删除”即可。图2-7 变量值标签的设置(四)缺失值

变量值的缺失是在数据收集和录入过程中由于种种原因(如拒答、数值异常、跳转等)产生。但是在数据分析时又无法回避。此时,需要在数据整理阶段对变量值缺失进行定义。

在SPSS中缺失值有用户自定义缺失值和系统缺失值两大类。一般对数值型变量的缺失,系统缺失值默认圆点表示。字符串型变量缺失,系统缺失值默认为空字符串。在实际工作中,可能会对缺失值预先制定一个缺失值代码来表示,以便与正常值进行区分和识别。在数据编辑窗口的变量视图中,点击该变量的“缺失”那一栏,该栏的右侧会显示一个“…”的隐藏框,点击这个隐藏框,出现缺失值设置对话框,有3种选择,第一种就是没有缺失值;第二种离散缺失值,最多可以设置3个值,比如可以对某个变量如果出现缺失值,以数字“9”表示(此处需要注意:如果该变量值有9,就不能用数字9作为缺失值的指代);第三种是指定缺失值所在范围,并可以指定一个具体的离散值,如图2-8所示。图2-8 变量缺失值的设置(五)度量标准

度量标准就是定义变量的测量尺度,它能更进一步准确说明变量的含义和属性,根据对数据的测量尺度,可将变量分为3大度量类型即定距型尺度(度量,scale)、定类型尺度(名义,nominal)和定序型尺度(序号,ordinal),如图2-9所示。变量的3个度量标准也可以用统计学上常用的表达方式:连续性变量、无序分类变量和有序分类变量,这种表述进行统计分析尤其多因素分析模型时(如多因素线性回归模型、Logistic回归模型、Cox比例风险模型等),对进入模型的变量的设置非常重要,需要根据不同的变量度量标准进行设置,这在后面案例分析章节进行详细讲解。实际工作中,经常有人会在设置变量进入模型时出现错误,其主要原因就是没有搞明白变量的度量标准!图2-9 变量度量标准的设置

1.定距型尺度

指对事物类别或次序之间距离的测量尺度,其也称为连续型变量。如温度,长度,年龄等。典型特征是可以表示类别之间的差距多少,其结果可以进行运算。

2.定类型尺度

指对事物的类别或属性的一种测量尺度,其也称为无序分类变量,如性别、职业。典型特征是不能比较该事物类别或属性的大小。

3.定序型尺度

指对事物之间等级或顺序的一种测量尺度,其也称为有序分类变量。如满意度(非常满意、满意、一般、不满意)和疾病预后(痊愈、好转、无效)等。典型特征是可以排序和比较优劣。(六)角色

角色就是预先设定该变量在分析变量中所扮演的角色。分为输入、目标、两者都有、无、分区和拆分。默认状况下为输入。这个主要运用在数据挖掘模块,一般工作中很少用到,所以不用理它。如图2-10所示。图2-10 变量角色的设置第二节 直接录入数据

定义好变量属性后,点击SPSS数据编辑窗口右下角“数据视图”界面即可进行数据录入了,如图2-11所示。数据视图界面中的数据录入表格的上方是变量名,左侧是每条个案记录的顺序号。图2-11 数据录入界面一、录入数据

将光标放在录入的单元格,单元格变为黄色,处于激活状态,直接录入数据,录入完毕后,按回车键或键盘向下“↓” 键,进入下一行,重复相同操作,直到该变量的所有记录录入完毕。或者按键盘中的向右“→”键,进入下一个变量的录入状态,直接录入数据,重复相同操作,直到该个案的所有变量值均录入完毕。或者按键盘中的向右“Tab”键,逐行录入,直到所有记录全部录入完毕。

如果录入的数据带有变量值标签,既可以直接录入变量值,也可以通过打开变量值标签,录入变量值会直接显示相应变量值的标签。在数据编辑窗口通过打开“视图”,勾选“值标签”即可,如图2-12所示。反之,如果不想显示变量的值标签,关闭这个“值标签”即可。图2-12 变量值标签的设置二、插入变量

在数据编辑窗口,在数据视图中的某个变量前插入一个变量,选中该变量,点击鼠标右键,然后左键选中“插入变量”,或者通过菜单“编辑—插入变量”,如图2-13所示,如果在变量“gender”前面插入新变量,但是对该变量的属性进行定义,需要点击变量视图,逐项对该变量的变量名进行修改,对其属性进行定义。也可以直接在变量视图中,某个变量前插入一个变量,选中该变量所在行,点击鼠标右键,然后左键选中“插入变量”,如图2-14所示。图2-13 数据视图中插入变量

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载