SPSS统计分析从入门到精通(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-15 12:35:46

点击下载

作者:杜强,贾丽艳

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

SPSS统计分析从入门到精通

SPSS统计分析从入门到精通试读:

前 言

统计学描绘了一套包括观察事物现象、收集测量数据、处理所得数据的体系,是指导我们进行数据分析的优秀的方法论;而新的统计分析软件的出现,为我们把这套方法应用到实际生活中提供了极大的便利。把统计分析方法和计算机结合起来的较好范例就是SPSS,它既适用于对数据分析感兴趣的初级用户,也适用于不同领域的统计分析专家。

在数据挖掘、机器学习、智能决策等领域欣欣向荣的同时,SPSS软件也积极跟进、不断发展。2009年7月,IBM宣布收购SPSS,优秀的统计分析软件SPSS结合IBM的资源优势,必将为用户提供更加实用的分析体验。随后推出的IBM SPSS Statistics 18.0和19.0,其操作友好性、模型可靠性和与其他平台的兼容性等,都有了非常大的提升。

与SPSS 15.0相比,SPSS 19.0增加了许多新的功能:增加了Bootstrapping、直销(Direct Marketing)等模块,极大地方便了分析专家和市场研究人士应用相关功能;新模块IBM SPSS Statistics Developer使SPSS可以与R软件协作;增加了部分更新的分析方法(广义线性模型)和报告方式(轻量表);对于从外部来源读取的数据以及在会话中创建的新变量,改进了确定其默认测量级别的方法;增强的语法编辑器,可将编辑器窗格拆分为上下两个,支持语法加亮和自动完成等功能;加入支持salesforce.com的数据库驱动程序;改进了软件架构和性能,如枢纽表的显示效果与交互性能、描述性分析过程的性能等。

本书是一本实用的参考手册,对于读者关心的各种模型参数含义及其设置方法,书中力求讲解详尽;从软件操作步骤到行业案例分析,都配有图形指示和样本数据实例分析;对于数理统计和分析方法的相关背景,书中做简单铺垫后,给出算法的基本思想或关键步骤,重点介绍软件操作方法和参数设置,以期达到读者可以通过本书理解和应用相关统计方法的目的;若读者再参考有关统计分析的专业书籍或不同背景知识的书籍,再加上不断的操作演练和实践,就能做更深入的算法改进、应用创新等研究性工作。

程序文件下载网址为:www.ptpress.com.cn。

 致谢:

在此,感谢人民邮电出版社各位编辑同志和金羽工作室张铮老师的帮助和指导,感谢罗瑞芳博士、何力武博士、鲍青波、李广鹏、王杉和王命达等人的参与和给出的宝贵建议。

由于编写水平有限,统计理论和软件的发展非常迅速,书中难免会存在纰漏和不足之处,恳请广大读者提出批评与指正,我们真诚希望与大家相互交流,共同进步。读者可以发送邮件到editor@book95.com,或登录我们的答疑互动网站bbs.book95.com找到本书的主题帖与作者交流。编者第1章SPSS 19.0概述

SPSS通过简单的菜单式操作,就可以方便地规范和融合搜集到的各种数据,并能实施从简单的描述性统计分析到复杂的时序分析等多种方法,对数据进行建模,返回有意义的分析结果,比如客户特征的分类、发展趋势的预测等。把这些结果应用于实际,可以帮助读者在发掘潜在客户、制定长远规划等工作上做出更加准确的判断。

本章首先介绍SPSS 19.0软件环境的设置内容和设置方式,让用户打造适合自己的SPSS 19.0工作环境。1.1 SPSS简介

IBM于2009年收购SPSS后,连续推出了IBM SPSS Statistics 18.0和IBM SPSS Statistics 19.0。业界领先的统计分析软件SPSS,结合IBM的资源优势,必将为用户提供更加方便和强大的智能分析体验。

SPSS 19.0加入了许多新的功能,包括:增加了Bootstrapping、直销(Direct Marketing)等模块,极大地方便了分析专家和市场研究人士应用相关功能;新模块IBMS PSS Statistics Developer使SPSS可以与R软件协作;增加了部分更新的分析方法(广义线性模型)和报告方式(轻量表);改进的默认测量级别,对于从外部来源读取的数据以及在会话中创建的新变量,改进了确定其默认测量级别的方法;增强的语法编辑器,可将编辑器窗格拆分为上下两个窗格,支持语法加亮和自动完成等功能;加入支持salesforce.com的数据库驱动程序;改进了软件架构和性能,例如枢纽表交互性能和显示效果、描述性分析过程的性能等。1.SPSS的特点(1)界面友好,操作简单。SPSS的命令语句、子命令及各种选项绝大部分都包含在各种菜单和对话框中,因此用户无需花大量时间记忆繁杂的命令、过程和选项。在SPSS中,大多数操作可以通过菜单和对话框来完成,因此操作便捷,易于学习和使用。(2)适用性好,因人而异。虽然大部分统计分析方法可以通过菜单和对话框来完成,但是,对于熟悉SPSS编程语法的用户,也可以在语法窗口中直接编写程序语句,从而灵活地完成各种复杂的统计分析任务。另外,用对话框指定命令、子命令和选项之后,通过单击界面上的“粘贴”按钮,可把当前对话框设置对应的语法命令,自动粘贴到语法编辑窗口中,并允许保存为文件。(3)算法隐藏。具有第四代语言的特点,只需通过菜单的选择以及对话框的操作告诉系统要做什么,无需告诉系统怎样做。用户只需了解统计分析原理,无需通晓统计分析的各种算法,即可得到统计分析结果。(4)接口完善。具有完善的数据转换接口,其他软件生成的数据文件(例如Excel文件、Access文件、关系数据库生成的DBF文件、文本编辑软件生成的ASCII码数据文件、SAS数据文件、salesforce.com提供的数据等)均可方便地转换成可供SPSS分析的数据文件。

SPSS支持OLE技术和ActiveX技术,生成的交互表格和图形对象可以与同类软件进行自动嵌入与链接。现在,SPSS 19.0还支持Sax Basic和Python语言。(5)功能强大。SPSS的核心部分是统计功能,可以完成数理统计分析任务,提供了从简单的单变量分析到复杂的多变量分析的多种方法,既包括常规的相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验,也包括多元回归分析、聚类分析、判别分析、主成分分析和因子分析,还包括时间序列分析、生存分析和可靠性分析等。(6)表格和图形化功能。SPSS可以直接生成数十种风格的表格(OLAP Cubes),伴随其他分析过程又可生成一般表、多响应表和频数表等表格。利用专门的编辑窗口或结果查看窗口,能编辑所生成的表格,如表1-1所示。表1-1 SPSS生成表格样例

SPSS拥有强大的图形功能,能生成数十种统计图形,包括条形图、线图、面积图、饼图、高低图、帕累托图、控制图、箱图、误差条图、散点图、直方图、P-P概率图、Q-Q概率图和时间序列图等。通过直观、漂亮的统计图形,能更加形象地显示分析结果,如图1-1所示。图1-1 SPSS图形样例

SPSS 19.0的模型浏览器,能够交互式地改变部分图形的内容和结构,使得以前输出的多个图表,能在一个界面中以交互的方式进行分析,再加上鼠标提示的功能,可给用户带来更好的分析体验。2.SPSS 19.0的不同版本

SPSS软件是分模块销售的,用户可根据自己的应用需要和用户数量,确定所需要使用的配置。下面所指SPSS Statistics客户端,即大家熟悉的SPSS统计分析软件。(1)教育版SPSS Statistics的客户端,有以下4种选择:SPSS基本版,只有Base模块,适合做数据处理、交叉行列分析和描述统计;SPSS标准版,含有Base、Advanced、Regression三个模块,能够完成常见的多元统计分析;SPSS高级版,含有Base、Advanced、Regression、Forecasting、Exact Tests 5个模块,适合经济类和医学类等教学应用中的高级用户;SPSS专业版,含有SPSS客户端的所有16个模块。(2)商业版SPSS Statistics的客户端,有以下三种:SPSS标准版,含有Base、Advanced、Regression、Custom Tables 4个模块,能够进行数据探索及常见的多元统计分析;SPSS专业版,在标准版基础上增加了6个模块,适合做预测分析和营销分析的高级用户;SPSS白金版,含有SPSS客户端的所有16个模块,并进一步增加了三个独立产品SamplePower、Visualization Designer和Amos。(3)对于企业级应用,SPSS推荐采用企业级的三层体系架构,即DB Server+SPSS Server+SPSS Clients。该方案具备有力的海量数据运算能力,充分利用了数据库系统的性能、多线程分析和多CPU分布式计算的优势及优化的变量挑选算法等。1.2 SPSS的安装、启动和退出

本节介绍SPSS安装和启动操作,从这里本书开始踏上SPSS应用的旅程。1.2.1 SPSS 19.0的安装

运行SPSS 19.0的安装程序后,首先见到的是图1-2所示的准备界面,稍等片刻即进入图1-3所示的安装向导界面,此后为标准的Windows安装过程,一直单击“下一步”按钮,直到完成安装。建议在安装的过程中不要运行其他程序。图1-2 SPSS安装准备界面图1-3 SPSS安装向导界面

安装的最后一步界面如图1-4所示,单击“确定”按钮后,进入授权和注册界面,要求用户选择授权类型,也可以单击“取消”按钮稍后注册。图1-4 SPSS安装确定界面1.2.2 SPSS 19.0的启动

本书主要介绍SPSS的窗口菜单运行方式,通过选择窗口、菜单与对话框来完成各种分析过程。1.启动

启动SPSS程序,可以双击图1-5所示的SPSS桌面图标,也可以在“开始”菜单中依次单击“程序→IBM SPSS Statistics→IBM SPSS Statistics 19”启动程序。启动后,首先出现图1-6所示的启动界面,显示该软件的版本信息。首次启动后,会先打开图1-7所示的选择界面,表明SPSS已正常启动,在此可以设置“以后不再显示此对话框”。图1-5 SPSS的桌面图标图1-6 SPSS的启动界面图1-7 SPSS启动选择界面

对于初学者,一个好的开始是查看软件自身的帮助教程,SPSS 19.0提供了较为完善和实用的帮助系统,并支持中文,不过需要单独安装SPSS官方提供的语言包“SPSS_Statistics_19_Language”。

在图1-7中,单击选中“运行教程”单选框,再单击“确定”按钮,就打开图1-8所示的教程界面(单击主菜单“帮助→教程”也可打开此教程),这是一个循序渐进的实践指南。另外,SPSS 19.0的帮助系统是通过网页方式访问的。图1-8 SPSS帮助教程2.SPSS的注册

IBM SPSS Statistics 19.0在Windows桌面“开始/程序”菜单中的项目如图1-9所示,单击“许可证授权向导”后,进入如图1-10所示的许可证状态界面,显示当前的软件许可信息(临时授权),单击“下一步”按钮,可更改SPSS 19.0软件的授权方式(许可证还是临时)。图1-9 SPSS注册图1-10 SPSS的许可证状态界面3.其他三种运行方式(1)程序运行方式。直接在语法命令窗口或脚本窗口编辑和运行程序,这种方式要求用户掌握SPSS的语法命令(Syntax)语言或Sax Basic、Python编程语言。(2)混合运行方式。首先在“完全窗口”方式下的数据编辑器窗口中输入数据,或者利用“文件”菜单打开已经存在的数据文件;然后利用菜单和对话框操作,设置数据处理的参数;参数设置好后单击设置界面中的“粘贴”按钮,将选择的过程及参数转换成相应的语法命令,并自动粘贴至语法编辑窗口;然后,在语法编辑窗口中添加语句、参数,或者修改已有命令中的参数,单击窗口中的运行功能执行分析。(3)SPSS 19.0提供了用户自定义对话框的功能,在图1-7中单击菜单“实用程序→定制对话框→自定义对话框构建程序”,打开如图1-11所示的设计界面,在此用户可以定制设计能实现特定功能的对话框,包括运行各种SPSS功能和程序。图1-11 定制对话框的设计界面1.2.3 SPSS 19.0的退出

在图1-11所示的数据编辑器窗口,单击菜单“文件→退出”,或者单击窗口右上角的关闭按钮,都可以退出SPSS。

如果进行了任何设置或分析操作,退出时首先弹出如图1-12所示的输出内容保存对话框,指定是否保存SPSS查看器窗口的输出项目。图1-12 提示保存SPSS查看器的输出内容

如果对要关闭的文件进行了修改,退出时还会弹出如图1-13所示的文件保存对话框,保存后即可正常退出(注意:非正常退出可能引起数据丢失)。图1-13 提示更改文件保存对话框1.3 SPSS 19.0的界面及设置

本节首先介绍SPSS常用的几个界面及其功能,对大多数用户来讲,SPSS是“窗口+对话框”方式的应用工具,熟悉和了解这些界面,对提高使用SPSS进行统计分析的工作效率是非常必要的。随后介绍SPSS 19.0的环境参数设置,这些设置将影响常用窗口的运行方式,通过更改它们能够把SPSS的工作环境定制为自己喜欢的方式。关于系统的操作、输出和显示等参数,都可以依次单击菜单“编辑→选项……”进行设置。

若无特殊声明,以下几点对每个设置界面均有效:新的设置仅对应用它们之后产生的输出起作用,而应用新设置之前的输出不会改变;更改参数后,单击“确定”或“应用”按钮即可应用新设置;需要重新设置或暂时不需要进行设置工作时,单击“取消”按钮退出“选项”设置对话框,返回到SPSS主界面,已设置的参数无效。1.3.1 常用界面

SPSS的基本界面有数据编辑器窗口、输出查看器窗口、对象编辑窗口、草稿输出窗口、语法编辑器窗口和脚本编辑窗口,分别介绍如下。1.数据编辑器窗口

正常启动SPSS后,进入的第一个窗口通常是数据编辑器窗口,如图1-14所示,是该窗口的数据视图;单击底部的“变量视图”标签,可以切换到变量视图,如图1-15所示;单击“数据视图”标签又可切换回数据视图。在数据编辑器窗口中可以进行数据的录入、编辑以及对变量属性的定义和编辑,这是SPSS的基本操作界面。图1-14 数据视图图1-15 变量视图2.输出查看器窗口

SPSS中大多数统计分析结果都将以表或者图的形式在输出查看器窗口中显示,如图1-16所示。通过设置,当用户进行了某个操作(例如打开文件、OLAP报告、回归等)后,输出查看器窗口可以自动弹出;不自动弹出时,相关结果也会在后台显示在此窗口中,只需激活即可看到。双击后缀名为.spv的SPSS 19.0输出结果文件,也可以打开本窗口。图1-16 输出查看器窗口

注 意:后缀名为.spo的旧版SPSS输出文件,只能用旧的SPSS Viewer才能打开。

在图1-16中,右边的显示窗口输出SPSS统计分析的结果(包括日志、表格、图形等),左边的导航窗口显示输出结果的目录,单击其中的加、减符号可以显示或隐藏相关内容,在左边窗口选中某项时出现一个红色箭头指向它,所选内容的细节显示在右边的显示窗口。3.对象编辑(SPSS Object)窗口

在图1-16的显示窗口里,用鼠标右键单击某个表格,在弹出的快捷菜单里选中“编辑内容→在单独窗口中”,会弹出如图1-17所示的枢轴表编辑窗口,在此可对表格内容进行编辑,而更改表格布局的“透视托盘”需要在此界面通过单击“透视→透视托盘”来打开,如图1-18所示。在图1-16中,直接双击某个表格,也可打开此编辑窗口,或者在图1-16中以嵌入的方式打开此编辑窗口。图1-17 枢轴表编辑窗口图1-18 透视托盘

在图1-16的显示窗口里,用鼠标右键单击某个图形,在弹出的快捷菜单里选中“编辑内容→在单独窗口中”,会弹出如图1-19所示的图表编辑器窗口,在此可对图形细节进行编辑。在图1-16中,直接双击某个图形,也可打开此编辑窗口。图1-19 图表编辑器窗口4.草稿输出窗口

这是旧版SPSS 15.0的一项功能,SPSS 19.0已不再支持。

SPSS 15.0的Draft Viewer窗口如图1-20所示,可以设置它为默认的结果输出窗口,这样执行分析过程后会自动显示此窗口。依次单击菜单“文件→新建→Draft Output”或“文件→打开→Output”,也可以打开此窗口。图1-20 Draft Viewer窗口

在Draft Viewer输出窗口中,枢纽表(Pivot table)转换为文本输出,Chart图形转换为图元文件,它们都可以编辑,这一点对于把相关项目应用在类似Word的编辑环境中非常有用。5.语法编辑器窗口

依次单击菜单“文件→新建→语法”或“文件→打开→语法”可以打开语法编辑器窗口,单击任何统计分析对话框上的“粘贴”按钮,可自动把对话框设置的各种命令和选项粘贴到语法编辑器窗口中,如图1-21所示,SPSS 19.0的语法编辑已支持语法加亮和自动填充功能。在此,用户可以直接输入SPSS语句命令,或者对复制的内容进行修改,依次单击菜单“运行→全部”可执行这些命令。将编写好的SPSS程序保存至后缀名为“.sps”的文件,可供以后调用。图1-21 语法编辑器窗口6.脚本编辑窗口

依次单击菜单“文件→新建→脚本”或“文件→打开→脚本”,可以打开脚本编辑窗口,如图1-22所示。在此可编写SPSS内嵌的Sax Basic语言程序(一种类似VB的语言),一方面可以开发SPSS的便捷功能或插件,另一方面也可以编写自动化数据处理的程序。图1-22 脚本编辑窗口1.3.2 常规选项参数

依次单击菜单“编辑→选项……”,打开如图1-23所示的设置界面,常规选项面板可设置SPSS软件系统的各种通用参数(例如启动选项、临时文件夹选项和显示语言等)。在此所设参数,重新启动SPSS后不需要重新设置。具体设置内容如下。图1-23 常规选项设置界面1.变量列表

在此设置各种统计分析对话框中变量列表的显示方式,设置内容如表1-2所示。表1-2 通用变量列表显示参数

例如在如图1-24所示的OLAP分析对话框里,左侧变量列表的显示方式。图1-24 对话框变量列表2.角色

某些对话框支持预先选择分析变量的预定义角色,当打开这样的对话框时,满足角色要求的变量将自动显示在目标列表中。在支持此功能的对话框中,用户还可以在预定义角色和自定义分配之间切换。此处的设置仅控制每个数据集的初始默认行为。

可选的设置方式有两种:使用预定义角色,表示默认情况下基于定义的角色预先选择变量;使用定制分配,表示默认情况下不要使用角色预先选择变量。

SPSS中的可用角色包括:输入(如预测变量、自变量)、输出或目标(如因变量)、两者(同时用作输入和输出)、分区(区分训练、检验和验证样本)、无(没有角色分配)。3.Windows观感

设置SPSS界面的风格,可选项有三种:SPSS Standard、SPSS Classic、Windows。用户可以尝试一下这三种风格,再选中自己喜欢的那一个。本书统一使用的是SPSS Standard风格。4.在启动时打开语法窗口

如果经常使用语法命令,或是喜欢使用命令语句的有经验的用户,单击选中此复选框,表示在启动SPSS时自动打开一个语法编辑器窗口。5.一次只能打开一个数据集

默认情况下,每次使用菜单和对话框打开新数据源时,该数据源会在新的“数据编辑器”窗口中打开,并且在其他“数据编辑器”窗口中打开的任何其他数据源都会保持打开状态,并在会话期间可用,直到明确关闭。

选中此复选框,表示每次使用菜单和对话框打开其他数据源时,都需要关闭当前打开的数据源。该选项会立即生效,但不会关闭在更改设置时所打开的任何数据集。6.数据和语法的字符编码

在此指定读写数据文件和语法文件编码方式的默认行为,注意只能在未打开数据源时更改此设置,并且该设置对后续会话继续有效,直到明确更改。

Locale的写入系统:使用当前区域设置确定读写文件的编码方式,也称为代码页模式。关于当前区域设置的信息,可参阅LOCALE Subcommand (SET command)。

Unicode(通用字符设置):使用Unicode编码(UTF-8)来读写文件,也称为Unicode模式。以Unicode模式读取代码页数据文件时,所有字符串变量的限定宽度扩大为原来的三倍。要将每个字符串变量的宽度自动设置为该变量的最长观察值,可选择“打开数据”对话框中的“根据观察值来最小化字符串宽度”选项。

注 意:以Unicode编码保存的SPSS数据文件和语法文件不能在16.0以前版本的SPSS上使用。对于语法文件,用户可在保存文件时指定编码方式;对于数据文件,如果要使用较早的版本读取文件,则应该以代码模式打开数据文件,然后重新保存。7.表格中较小的数值没有科学计数法

对于输出中较小的数值不显示科学计数法,而是显示为0(或者0.000)。8.将本地数字分组格式应用到数值

将当前的区域数字分组格式应用到枢纽表和图表中的数值以及数据编辑器中的数值。例如:值34419.57可显示为34419.57(多一空格);该选项还适用于以DTIME格式数值来显示日期值,如以ddd hh:mm格式显示ddd的值。

分组格式不适用于树、模型查看器项目、DOT或COMMA格式的数值以及DOLLAR或自定义货币格式的数值。9.测量系统

此栏设置枢纽表单元格边距、单元格宽度、打印表格的间隔等内容的度量单位。下拉列表中的可选项有点、英寸和厘米(默认)。10.语言

此栏设置输出结果的显示语言,但是对简单文本输出、地图不起作用。下拉菜单可选的语言种类和SPSS的安装版本有关,如图1-25所示。图1-25 输出的显示语言列表

注 意:修改此项后,依赖于特定一种语言或字符的自定义脚本可能无法正常显示。11.提示

在此设置程序运行结果的通知方式,各设置选项的含义如表1-3所示。表1-3 程序运行结果通知方式12.用户界面

指定控制菜单、对话框和其他用户界面功能中使用的语言,但不会影响输出语言。可选的语言种类与图1-25所示相同。1.3.3 查看器选项参数

在图1-23中单击“查看器”标签,打开如图1-26所示的选项界面,在此对SPSS查看器窗口(如图1-16所示)的参数进行设置,包括输出文字的字体、大小和颜色等。在此可以单独设置不同输出对象(文本、表格、图形等)的显示方式和对齐方式。图1-26 查看器选项设置界面(1)初始输出状态栏:设置特定输出结果的初始状态参数。首先单击“项”下拉菜单(或左侧的项目图标)选中要设置的输出对

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载