SAS统计分析与应用实例(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-25 23:25:35

点击下载

作者:刘荣

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

SAS统计分析与应用实例

SAS统计分析与应用实例试读:

前言

SAS(Statistical Analysis System,统计分析系统)作为当今国际最著名的数据分析软件系统,被广泛应用于金融、保险、医疗卫生、教育和科研等各行业与领域。

本书的编排遵循从理论到实践的原则,首先介绍基本统计原理,然后结合实例应用SAS9.2的编程和菜单操作的方式完成各项统计分析,并结合例题实际背景对分析结果进行详细阐述。

以下介绍本书的基本结构:本书共13章,前3章为基础知识介绍,后10章为统计分析实验。

第1章为SAS系统简介,介绍了SAS系统的应用范围、主要模块、界面操作、文件管理及SAS逻辑库与数据集的部分操作。

第2章为SAS编程简介,主要介绍了SAS数据步中的输入、赋值、控制语句,SAS程序步中的VAR、BY等语句,并引入ODS输出系统和SAS宏。

第3章为SAS菜单操作,引入SAS/ASSIST、SAS/INSIGHT和SAS/Analyst三个菜单操作模块。

第4章为定量数据描述性统计分析,介绍了连续型数据描述性统计分析方法,以及统计图形的绘制。

第5章为参数估计与假设检验,介绍了单样本均值和方差的区间估计、独立和配对样本T检验及正态分布拟合检验。

第6章为方差分析,主要介绍单因素、多因素方差分析(包括区组设计、析因设计和拉丁方设计)和协方差分析。

第7章为相关与回归分析,介绍了相关分析、线性回归和非线性回归。

第8章为列联表分析,介绍了列联表的编制及其拟合优度检验、独立性检验、一致性检验、趋势检验和计算属性关联度。

第9章为非参数检验,介绍了单样本、两独立(配对)样本和多个独立样本的位置检验。

第10章到第13章为多元回归分析部分,主要包括主成分与因子分析、典型相关分析、判别与聚类分析。

本书内容丰富、层次清晰。在程序中添加了详细的注释;菜单操作过程介绍清晰。随书附赠的光盘中分章收录了本书所有的例题、实验、上机练习的数据和程序;并包含8小时随书全程实录,力求让读者形象、直观地掌握SAS系统的一般统计分析方法。

本书的读者对象是高等院校各专业学习应用统计的大学生、研究生,以及企事业单位数据分析工作者。

本书主要由刘荣编写,同时,参与本书编写工作的还有张玉兰、孙明、唐伟、王杨、顾辉、李成、陈杰、张霁芬、张计、陈军、张强、杨明、李建、李兵等人。

因作者水平有限,书中错误、纰漏之处难免,欢迎广大读者批评指正。编著者第1章 SAS系统简介

SAS(Statistical Analysis System)系统于1976年由SAS软件研究所(SAS Institute Inc.)研制推出。历经多年发展,最新版本SAS9.3于2011年7月问世,它作为国际公认的著名数据统计分析软件系统之一,受到许多国家和地区的机构青睐。本章将简介SAS系统主要模块、界面操作和文件管理,并在引入SAS逻辑库和数据库后介绍新建逻辑库、数据集的方法,及数据集的排序、连接、合并及与外部数据文件相互转换等操作的实现,在章末将重点介绍SAS帮助系统的使用,“授人以鱼,不如授人以渔”,希望读者能举一反三,将SAS软件灵活运用于学习和工作实践中。1.1 SAS系统概述

SAS系统将数据管理和统计分析融为一体,能够在不同的操作系统(如UNIX、MS-DOS、VMS等)和不同的机器类型下运行,系统具备完备的数据存取、数据管理、数据分析和数据展示的功能。在Windows版的SAS运行环境下,用户不仅能够以灵活的编程方式,还可选择操作简单的菜单方式进行各种统计分析。目前,SAS系统被广泛应用于金融、医疗卫生、生产、运输、通信、科研和教育等领域。它运用统计分析、时间序列分析、运筹决策等科学的方法进行质量控制、财务管理、生产优化、风险管理、市场调查和预测等业务,并可将各种数据以灵活的报表、图形和三维透视的形式直观地表现出来。

SAS系统包含众多模块以完成不同任务,本书内容涉及的有:

SAS/BASE(基础)——完成数据整理和初步统计分析。

SAS/STAT(统计)——广泛的统计分析。

SAS/ASSIST(面向任务的通用菜单驱动界面)——交互式菜单操作。

SAS/GRAPH(图形)——提供了许多产生图形过程并支持众多图形设备。

SAS/BASE是SAS系统的核心平台,提供了多个SAS过程,可以实现简单报表计算、生成报表、计算得分(标准化数据、数据排秩等)及排序等功能。

SAS/STAT提供SAS系统用来解决实际问题的具体统计分析过程,主要包括方差分析、回归分析、属性数据分析、多变量分析、聚类分析、判别分析等。

SAS/GRAPH具有强大的绘图功能,能够用于绘制二维曲线图、条形图、饼图、区域图等。

本书将基于Win7系统下的SAS9.2多国语言版的SAS(English(ODBS))版本(该版本系统语言为英文,但支持一般的中文字符输入),首先概述SAS系统、简介SAS编程和菜单操作,然后介绍具体统计方法基本原理及其在SAS系统中的实现。

注意:建议读者先快速浏览通读本书,对介绍的基本内容形成大致印象,在遇到实际问题时再具体参考相应章节。若时间充裕,也可以通过观看随书附赠的光盘中的教学视频练习本书介绍的案例来熟练掌握SAS软件。1.2 SAS界面操作与文件管理

下面介绍SAS系统的启动和退出、界面特性及文件管理,完成以上操作前请用户将SAS软件安装在一台满足SAS系统配置的计算机中。1.2.1 SAS系统的启动与退出

SAS系统的启动:

在系统的“开始”菜单列表中找到SAS系统文件夹,左键单击“SAS9.2(Additional Languages)”文件夹下的项目“SAS 9.2(English(DBCS))”即可启动系统,如图1-1所示。图1-1 启动SAS系统

若右键单击项目“SAS 9.2(English(DBCS))”,在下拉选项中选择“发送到”|“桌面快捷方式”,即可双击桌面上的图标启动SAS系统。

SAS系统的退出:

选择菜单File|Exit,在弹出的确认对话框中左键单击“确定”按钮。

单击系统主界面右上角按钮,在弹出的确认对话框中单击“确定”按钮。1.2.2 SAS系统界面简介

启动SAS系统将出现如图1-2所示的工作界面。它在一个主窗口内包含有若干个子窗口,并有菜单栏、工具栏、状态栏等。下面介绍SAS系统界面的主要窗口:Editor程序编辑窗口、Log运行记录窗口、Output输出记录窗口、Explorer窗口和Results窗口。图1-2 SAS系统工作界面

Editor程序编辑窗口——主要用于编辑SAS源程序文件,操作时光标可在整个窗口随意移动,且支持Windows系统常规编辑操作方式,如剪切、复制、粘贴等。SAS9.2的智能编辑功能可根据用户输入的不同的SAS程序部分显示出不同的颜色。若用户输入有误,对应的颜色不对,以警告错误的发生。

Log运行记录窗口——用于显示和记录SAS程序的运行情况,说明其运行成功或提示错误信息。当程序运行不成功,Log运行记录窗口将分别用绿色字符和红色字符显示警告和错误信息。

Output输出记录窗口——分页显示SAS程序运行的文本型输出结果,可使用主界面菜单的File|Save As将其保存在磁盘中,文件扩展名为.lst,该类型文件可用文字处理软件如Word、写字板、记事本等将其打开和编辑。SAS程序运行的图形输出结果将由Graphics窗口显示,可选择菜单File|Export as Im age将图形导出并保存在磁盘内,并可在“保存类型”下拉列表中选择图形文件的保存格式。

Explorer窗口——用于显示SAS逻辑库(SAS系统命名的库名和磁盘某文件的关联)及SAS数据集。

Results窗口——用于显示SAS成功运行时程序输出结果的目录。

可用左键单击窗口内的任意一处的方式切换到以上任一窗口。在使用时可根据需要直接单击窗口右上角的按钮关闭窗口,也可使用主菜单View的下拉菜单打开或切换窗口。

SAS主窗口标题栏下是主菜单,注意SAS菜单随着光标出现在不同的窗口是动态变化的。其主要命令及功能实现如下:

File(文件)——实现SAS文件的调入、保存、转换及打印等功能。

Edit(编辑)——实现窗口的编辑(清空、剪切、复制、粘贴等)功能。

View(浏览)——实现打开或切换到SAS的各个工作窗口的功能。

Tools(工具)——提供对各种输出结果进行编辑的工具,如表格、图形、报告等,并支持进行系统环境和状态的设置(如修改界面字体等)。

Run(运行)——提交程序,仅在当前窗口为Editor程序编辑窗口时有效。

Solutions(解决方案)——SAS图形界面模块操作窗口,如SAS/ASSIST。

Help(帮助)——提供SAS软件自带的帮助系统。

主菜单下是一个命令输入栏和图表工具栏。在命令栏中可以输入SAS的显示管理命令,如在此输入“WSAVE”则表示永久保存对SAS系统的设置。工具栏图标提供了常见任务的快捷操作方式,其功能解释如下:New——建立新的编辑窗口。Open——打开文件到编辑窗口。注意:用户指定一个文件调入到编辑窗口内,以后的存盘操作将自动存入此文件。Save——保存编辑窗口内容。注意:若此窗口已经与一个文件相联系,存盘功能将覆盖文件原有内容。Print——打印当前窗口内容。Print preview——打印预览。Cut——剪切选定文本。Copy——复制选定文本。Paster——粘贴。

注意:这些操作是对Windows剪贴板进行的,所以它不仅支持SAS编辑窗口内的复制和剪切操作,还可用来与其他Windows应用程序交换文本、数据等。Undo——撤销编辑操作。New Library——建立新的SAS逻辑库。SAS Explorer——打开SAS管理窗口查看、管理SAS的各个逻辑库及其中的文件。Submit——提交Editor程序编辑窗口中的程序。Clear All——清空当前窗口内容。Break——中断正在运行的SAS程序。Help——进入SAS的帮助界面。1.2.3 SAS数据集和逻辑库

SAS文件主要包括数据集(Database)文件、索引文件和SAS目录文件(Catalog)等。数据集是SAS使用和分析计算的原始数据来源,而正确合理地生成SAS数据集是数据分析的首要条件,因此数据集是SAS最重要的文件类型。SAS目录文件主要用以保存各种不能表示成行列结构表格形式的数据,如系统设置、图像、声音等。

SAS数据集可以看作由若干行和列组成的表格,数据集的每一行称为一个观测(Observation),每一列称为一个变量(Variable),变量可以取不同的类型值,如整数型、浮点值、时间值、字符串、货币值等。

如图1-3所示的数据集范例中包括了3条观测,代表了3个客户的情况;包含5个变量,分别为客户编号(ID)、姓名(name)、持卡类型(Type)、年龄(birth)和消费次数(N)。注意到该图中数据集名称为Chap1.Example1,ID、name、Type、birth和N为变量名。在SAS系统中使用的数据集、变量名、逻辑库名等统称为“标识符”,SAS系统对标识符有以下严格规定:图1-3 数据集范例

SAS标识符必须由英文字母、数字、下画线组成。

第一个字符必须是字母或下画线。

标识符中字母不区分大小写。

标识符的长度不宜过长。

由此可知name、area、ABC、X2、_Nall_等都是合法标识符,area和AREA为同一标识符,但number-3(不能有减号)、a bit(不*能有空格)、team(不能有特殊字符)等却不合法。

SAS数据集存储在被称为SAS逻辑库(Library)的文件集中。通俗地说,SAS逻辑库是一个连接,将磁盘中存储的文件和SAS系统联系起来。SAS逻辑库命名遵循上述SAS命名规则,可用编程和菜单操作的方式建立逻辑库。

编程建立逻辑库:使用Libname命令可以指定逻辑库,命名格式为: Libname 逻辑库标记"文件夹路径";

例如,要建立指向已存在的文件目录“E:\data\chap1”的逻辑库chap1,可在Editor程序编辑窗口输入以下语句: Libname chap1 'E:\data\chap1';

再选择Run|Submit菜单或左键单击工具栏上的图标提交程序完成操作。

菜单方式建立逻辑库:此方式操作过程如下:进入Explorer窗口,双击Library图标,再单击右键,选择new命令,在弹出的窗口(如图1-4所示)的Name栏中输入逻辑库名,在Path栏中输入路径或单击右侧的Browse(浏览)按钮选择磁盘中的文件夹,选中右侧的Enable at startup(启动时可用)使其永久有效,最后单击OK按钮完成。图1-4 新建逻辑库

以上介绍了新建逻辑库的一般方法,接下来概述两种逻辑库类型:临时库和永久库,以及其对应的临时数据集和永久数据集的命名区别。

临时库和永久库:临时库仅有WORK逻辑库,它存储SAS临时文件,在每次启动SAS系统时自动生成,关闭SAS系统时库中的数据集被自动删除;永久库中存储SAS永久文件,SAS预定义Sasuser和Sashelp两个永久逻辑库,其中Sasuser用以保存与个人设置有关的文件,Sashelp逻辑库保存与SAS帮助系统、应用实例有关的文件。除此之外,用户可使用上述介绍的编程和菜单操作的方式建立SAS永久库。

临时数据集和永久数据集命名区别:临时数据集可以用“单水平名”,即只有数据集名,如stu01,这种名字的数据集被保存在WORK逻辑库中,因此也可用WORK.stu01表示。永久数据集由两部分组成,前一部分为它的库名,后一部分为数据集名,中间用小数点连接,如放在chap1库(即“E:\data\chap1”子目录)中的数据集ex1需要用chap1.ex1表示。临时数据集在重启SAS系统时将会被自动删除,而永久数据集不会。1.2.4 数据集文件操作

SAS管理器(SAS Explorer)用来管理SAS逻辑库和文件,SAS系统默认启动时在主界面左侧显示SAS管理器,若不慎将其关闭,可通过主菜单命令View|Explorer将其打开。以下介绍对逻辑库中数据文件的复制、删除、改名等操作。

文件复制:不同逻辑库之间的数据文件可以复制备份,操作为:左键双击逻辑库名,单击选择需要复制的数据文件,右键单击,在弹出的快捷菜单中选择Copy(复制)命令实现复制,再左键双击打开目标逻辑库名,右键单击,在弹出的快捷菜单中选择Paster(粘贴)命令完成备份。

文件删除:选择目标数据文件,右键单击,在弹出的快捷菜单中选择Delete(删除)命令。

文件重命名:选择目标数据文件,右键单击,在弹出的快捷菜单中选择Rename(更名)命令,再在弹出的对话框中输入改后的文件名,左键单击OK按钮保存设置并退出。1.3 SAS数据集整理

本章1.2节简单介绍了SAS的界面,并引入SAS逻辑库和数据集,详述了新建逻辑库的方法,以及数据集文件的复制、删除等操作。以下介绍SAS数据集的一般操作。1.3.1 新建数据集

在SAS系统中可以使用编程和Viewtable表的方式新建SAS数据集,并对数据集进行修改、增删记录等操作。以下通过例1-1介绍这两种方法的具体使用。

例1-1 请根据表1-1所示信息新建数据集chap1.example1_1。表1-1 某公司客户信息表

方法一:编写如下程序(其在光盘中的存储路径为“proc\chap1\example1_1.sas”)。 libname chap1 'E:\data\chap1'; /*新建指向路径为“E:\data\chap1”的逻辑库chap1*/ data chap1.example1_1; /*新建永久SAS数据集chap1.example1*/ input ID $1-4 name $5-11 Type$13-19 birth YYMMDD8. +1 N; /*定义变量输入格式*/cards; 0101 张 三 金 卡 64/10/06 20 0102 李 四 银 卡 82/09/16 13 0103 王 五 普通卡 87/01/27 5 ; /*输入数据*/ proc print; format birth YYMMDD8.; /*设置变量birth的输出格式*/ run;

选择Run|Submit命令提交程序,在Output输出记录窗口显示如图1-5所示,且在新建的逻辑库chap1中出现了数据集example1。图1-5 结果输出

注意:日期格式的变量在SAS中默认保存为从1960年1月1日至某日期的天数,如1964年10月6号,默认输出为1740。在打印输出日期格式的变量时,为了得到特定格式,务必使用format语句指定输出格式。而SAS数据集chap1.example1,变量birth也将显示天数,此时右键单击变量名,在快捷菜单中选择Column Attribute(变量属性),单击弹出的对话框中的format后的按钮,在此可以选择设置变量的输出格式。

方法二:Viewtable表新建数据集。

步骤一:打开新表

选择菜单Tools|Table Editor打开一个新表,如图1-6所示。图1-6 Viewtable表视窗

步骤二:定义变量

右键单击A列,选择Column Attributes(变量属性)命令,弹出如图1-7所示对话框,在Name栏中输入变量名ID,Type(类型)为默认Character(字符型),Length(长度)为8,Format(输出格式)和Informat(输入格式)为$8.(默认设置)。左键单击Apply(应用)按钮,再单击Close(关闭)按钮;或者直接单击Close按钮完成第一列姓名变量的属性设置。图1-7 设置变量属性

重复以上操作,定义变量Name、Type时变量类型(Type)选择Character,输出格式(Format)和输入格式(Informat)选择默认值$8.;定义变量birth时变量类型(Type)选择Numeric,Format(输出格式)和Informat(输入格式)选择yy/mm/dd;定义变量N时变量类型(Type)选择Numeric,Format(输出格式)和Informat(输入格式)选择默认值$8.。

说明:用户根据变量性质选择设置变量类型(Type)为字符型(Character)和数值型(Numeric)。Informat和Format分别代表数据的输入格式和输出格式,可单击格式右侧的“…”按钮设置。在窗口的Label栏中可以输入变量标签。若不定义变量标签,则系统默认变量名为标签名。打开数据集时,Viewtable表头为标签名,可通过主菜单View|Columns Labels和View|Columns Names进行切换。

步骤三:输入数据、保存数据集

直接在表中输入相应数据,然后直接单击工具栏上的保存图标,或者选择菜单File|Save,在弹出的对话框中左键单击选择需要存入的库名chap1,在Member Na me(对象名称)框中输入数据集名example1,单击Save(保存)按钮保存设置。

若要修改已有数据集的变量标签,可选择菜单Editor|Edit Mode(编辑模式)更改系统默认的Browse(浏览)模式。

若要更改已存在的数据集变量名,可使用RENAME语句用编程的方式实现,它的一般使用格式如下: RENAME OLD1=NEW1 OLD2=NEW2 OLD3=NEW3;

注意:建议读者在观测和变量不多,数据形式不复杂的情形下选用编程的方式新建数据集,否则可选择便捷的Viewtable表建立SAS数据集。若是海量数据,则采用从外部数据库将数据导入SAS系统进行计算的方式。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载