数据分析与量化投资——基于SAS的应用(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-18 06:16:52

点击下载

作者:林煜恩

出版社:电子工业出版社有限公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数据分析与量化投资——基于SAS的应用

数据分析与量化投资——基于SAS的应用试读:

开始

,我开发了autoexec程序,并将多年来编写(与收集)的宏语法都打包进去,同时修正了《SAS 在财务研究中的应用》书中的一些宏语法,并且让这些宏语法可以在SAS 9.4 M3中运行,也使用了 SAS EG平台进行分析,让不熟悉编程的读者可以利用类似于SPSS的点击功能去完成统计分析,更重要的是可以调用本书中提供的宏语法快速进行分析。

本书主要内容如下:

第1章介绍SAS EG模块的基础界面,并阐述SAS EG的过程流与项目式管理;第2章介绍自动运行宏文件,以弥补SAS在菜单功能上的不足,并且介绍如何将程序运行结果输出为 Word文档、在 SAS中发送电子邮件的命令功能,以及SAS EG的排程设计。

第3章介绍本书后续章节中所要使用的数据,包括报酬率数据、财务报表数据和公司治理数据;第4章介绍数据处理的宏语法,分别是变量转换宏、移动窗口转换宏、领先/滞后宏、缩尾宏、缺失值处理宏以及行业变量计算宏。这6种宏在进行数据分析时是最常遇到的,因此本书特别将其写成标准化的宏,让读者了解其用法,以便在日后可以随时随地调用。

第5章探讨关于基本投资策略的绩效;第6章介绍Lewellen投资策略,一次性考虑多个投资变量,并借此建立投资组合;第7章介绍能够获利的投资组合。

第8章介绍描述性统计宏,可以生成实证研究中的描述性统计表和相关系数表;第9章介绍样本分配趋势宏、两群体差异性检验宏和组合差异性检验宏;第10章介绍回归宏语法架构,在设置中可以运行5种基础回归方法,以及使用回归宏语法;第11章综合了第8~10章的内容,设计出基础论文宏、中介论文宏和调节论文宏,通过运行论文宏,可以直接生成实证论文中的基础表格,这对于研究分析者而言,可以节省很多制表的时间。

第12章讲述解释变量内生性的解决之道,第13章讲述样本选择性问题。

读者可以在http://www.broadview.com.cn/37320处下载本书提供的资源文件。林煜恩2019年6月30日于吉林大学匡亚明楼第1篇 基础篇

在大数据时代,越来越多的工作需要进行数据分析,而在日常数据分析中,往往进行的都是重复性工作,因此很多人使用Excel或者SPSS通过菜单操作来进行数据分析。然而,Excel或者SPSS的使用虽然方便,但是其缺少记录操作过程的功能。而在 SAS EG 模块中,所有操作过程都会被记录下来,并且可以反复运行该操作过程,因此只要进行过一次操作,就可以以此为标准来重复运行,并且也能够让新进入的工作伙伴直接使用该操作过程。鉴于此,本书就以SAS EG为主来进行数据分析的介绍。

但是对数据进行分析并不是我们的真正工作,我们的真正工作是能够在Word文档中呈现表格,并且即时发送给所需要的人。因此,在基础篇中除介绍宏语法外,还会介绍将SAS的结果输出为Word文档,并且利用SAS编程将结果直接发送给所需要的人。

本篇的第1章介绍 SAS EG 模块的基础界面,并阐述 SAS EG 的过程流与项目式管理;第2章介绍自动运行宏文件,以弥补SAS在菜单功能上的不足,并且介绍如何将程序运行结果输出为 Word文档、在 SAS中发送电子邮件的命令功能,以及SAS EG的排程设计。第1章 SAS EG基础界面

首先介绍SAS EG模块的主要菜单功能,以便让用户能够顺利操作SAS EG。然后介绍过程流与项目式管理,协助用户重复运用项目进行日常分析工作。

本书使用的是SAS 9.4中的EG 7.1,有些功能仅在EG 7.1版本以上才能使用,若读者的SAS版本过低,则请更新。1.1 SAS EG菜单

SAS EG是SAS Enterprise Guide的简称,即SAS企业向导模块,其强大的功能对企业和科研人员都有很大的帮助作用。下面介绍 SAS EG模块的启动界面,如图1-1所示。

从图1-1中可以看到SAS EG有文件、编辑、视图、任务、程序、工具以及帮助菜单。利用 SAS EG的“文件”菜单中的功能选项,我们可以进行文件的编辑修改和数据的输入,即它纳入了 Office 中的 Word 和 Excel的功能。图1-1 SAS EG模块的启动界面

如图1-2所示,可以使用 SAS EG 模块的报表功能来撰写文本内容。SAS EG模块可以将数据分析和出具报告的文本撰写功能结合在一起。图1-2 使用SAS EG的报表功能

在“文件”菜单中还有“数据”功能选项,选择该选项可以进行数据的输入,如图1-3所示。图1-3 手动输入数据的生成样式

在“新建数据”对话框中,我们可以以类似于 Excel 的方式来输入数据。需要注意的是,数据名称应为英文,不能输入中文名称,但标签可以输入中文名称,如图1-4所示。图1-4 数据标签设置

将数据标签设置好之后,在将数据输出为Word文档时,就会生成如图1-5所示的形式。

如图1-5所示的信息也是本书后面要介绍的宏文件的各项说明。但由于目前大家的使用习惯仍然以 Excel 输入为主,因此本书对于数据的输入并不多加介绍,而是着重于介绍SAS格式数据,以及如何将外部记事本和Excel中的内容导入SAS中并进行分析。

接下来,我们介绍SAS EG的“任务”菜单功能。打开“任务”菜单,显示如图1-6所示。图1-5 输出数据形式图1-6 SAS EG的“任务”菜单

我们发现,SAS EG的“任务”菜单的功能与SPSS的“分析”菜单的功能类似,如图1-7所示。图1-7 SPSS的“分析”菜单

因此,本书最主要的内容不是教用户如何利用 SAS EG 来进行通过SPSS可以完成的操作,而是主要介绍在SAS EG中,结合项目管理的过程流以及笔者所撰写的宏语法形成的“标准化”数据分析,这是 SAS EG与SPSS最大的差异点。SAS EG能够记录操作过程的过程流,这些过程流只要运用得当,就能够被用户反复利用,并且可以让不同的人一起使用,以提高日常工作的效率。1.2 过程流与项目管理

本节主要介绍标准化的SAS EG管理。此处我们使用“01-数据分析的项目管理.egp”数据,数据文件位于“D:\The Power of SAS\data\CH01”中(说明:读者需要根据自己文件的实际存储位置来修改路径),其下共有11个文件,如图1-8所示。图1-8 数据分析使用的数据文件

我们采用下列命令来读取数据。

将“2000”这个文件的数据导入SAS EG中,并命名为“anadata”。导入数据后,在SAS EG中将呈现如图1-9所示的数据形态。图1-9 导入SAS EG后的数据形态

从图1-9中可以看到导入数据后的变量名称,分别为股票代号(Stkcd)、年份(year)、月份(month)、成交值(value)、报酬率(ret)以及换手率(turnover)。

我们先将成交值取自然对数,这需要使用查询生成器的功能。单击查询生成器,显示界面如图1-10所示。图1-10 查询生成器界面

选择所有相关变量,然后单击“计算列”,打开“新建计算列”对话框,选择类型,如图1-11所示。图1-11 选择类型

由于我们的目标是针对变量做计算,所以这里选择“高级表达式”。单击“下一步”按钮,生成高级表达式,如图1-12所示。图1-12 生成高级表达式

在“输入表达式”框中,输入log(value)命令,在函数的类别中可以搜索到SAS EG中的所有相关函数。单击“下一步”按钮,修改其他选项,如图1-13所示。图1-13 修改其他选项

输入计算之后的变量名称和标签,单击“下一步”按钮。属性汇总如图1-14所示。图1-14 属性汇总

在属性汇总中,可以看到所有步骤的属性分析,确认之后单击“下一步”按钮,得到经过处理后的数据,如图1-15所示。图1-15 经过处理后的数据

接下来,我们可以根据自己的数据进行不同的查询计算,直到求得所有的数据,然后单击“运行”按钮。运行结果如图1-16所示。图1-16 查询生成器运行结果

可以看到,SAS EG已经帮我们完成了对成交值取自然对数的计算。接下来单击所有的过程流接口,看看SAS EG是如何保存刚才运行的SAS程序以及查询生成器的操作的。

从图1-17中可以看出,SAS EG并非单纯地使用菜单或者编程进行分析,而是结合两者进行分析的。接下来,我们针对查询生成器生成的数据进行描述性统计、相关分析和回归分析,如图1-18所示。图1-17 导入数据以及查询生成器操作的过程图1-18 描述性统计、相关分析和回归分析的过程流

如图1-19所示为利用SAS EG直接分析数据的结果。假设这是某工作人员在2000年年底所要做的工作,到2001年年底时,公司又传送一份数据给他,如果他已经保存了2000年年底所做的项目工作,那么他只需要修改程序中的一个步骤即可。图1-19 2000年数据的过程流分析结果

如果他使用的是SPSS的数据,则需要重复图1-10至图1-17所示的步骤,而且还需要记得一年前所做的每项工作。而现在他只需要将“2000”修改为“2001”,然后按照图1-20所示进行操作,就可以重新生成结果。图1-20 选择“运行‘过程流’”

如图1-21所示为由2001年的数据所生成的描述性统计表。在运行过程中,我们对任务稍做修改,读者在进行数据分析时,将显示如图1-21所示的格式。虽然使用SAS EG的过程流可以帮助我们标准化进行数据分析,但是在结果呈现上却不是很美观。因此,本书另外提供了24个宏语法,除让表格输出得更加美观外,还让数据分析更加方便。图1-21 2001年数据的描述性统计表

虽然本例的做法相当简单,但是对于经常需要周期性地进行相同格式的不同数据分析的工作人员而言,他们在使用 SAS EG的过程流后,就不需要每月都进行重复的工作了,只要修改数据路径就可以由软件自动生成报告。1.3 小结

本章主要介绍了SAS EG的菜单、过程流和项目管理。SAS EG界面不同于以传统编程为主的SAS界面,它比较符合企业经营的需要,而且在使用上结合了编程以及存储项目操作过程的方式,能使业界人士在进行周期性的数据分析以及交接工作时更加流畅,也使数据分析标准化成为可能。

本章讲解的是2000年和2001年的数据分析,读者可以利用2002—2010年的数据来了解使用过程流进行数据分析的优点。在接下来的章节中,将介绍宏语法、RTF以及E-mail语言,以方便数据分析人员进行文件传送。第2章 数据分析小工具

在第1章中,我们介绍了SAS EG的基本菜单和过程流,使用基本菜单的功能,确实能够进行一些数据分析工作,并且通过过程流的保存,也使用户能够保留操作过程。但在表格输出结果的呈现上仍有不足之处,因此本书提供了24个在数据分析和量化投资分析中能够运作良好的宏语法,帮助大家进行标准化的数据分析。

本章将介绍 SAS表格输出为 Word格式的操作。不管数据分析做得多好,如果结果仅能呈现在统计软件上面,那么该结果都将是无用的。因此,本章还将介绍相关Word语法的设计。

除数据分析外,针对大数据进行数据处理往往需要花费大量的时间,我们不可能时时守在电脑前面等待结果,此时就可以在程序的最后写上一封发送给自己的E-mail,提示程序已经运行完成,并进行下一阶段的任务。这段命令虽然与数据分析无关,但却能够使我们在开发程序时,更灵活地掌握自己的时间,而不会被绑死在电脑前面等待数据处理的结果。因此,本章还会介绍使用SAS来发送E-mail。

本章最后将介绍SAS EG中的排程功能,该功能可以让SAS EG在特定时间自动执行已经完成的项目。不管是财务会计从业人员,还是学术工作者,总会有一些周期性的数据整理工作要做,此时通过排程功能,就可以让SAS在电脑后台进行分析。2.1 SAS自带宏语法与本书提供的自带宏

对于数据分析师而言,手上总有属于自己的私密工具箱,也就是保存着不同功能的宏语法的文档,在使用时虽然方便,但是却要记得其保存的路径;否则,在调用宏语法时,就会因为找不到文档路径而造成麻烦。因此,我们先介绍SAS的一个特殊功能,即自动读取autoexec.sas文件。

要想让SAS一启动就读取autoexec.sas文件,需要将该文件保存在SAS软件的安装位置。以本书为例,安装路径为:C:\Program Files\SASHome\SASFoundation\9.4,将 autoexec.sas 文件放置在如图2-1所示的安装路径下,就能够确保SAS一启动就会读取该文件,并且立即执行里面所有的语法。该文件总共包含SAS命令大约8600行,宏程序超过30个。图2-1 autoexec.sas文件的存放位置

将autoexec.sas文件存放到该路径下,只要启动SAS BASE,就可以看到其日志文件,显示如图2-2所示。

SAS BASE在启动时会自动执行autoexec.sas中的所有命令,在数据分析领域中,这个自动执行语法通常是用来设计工作环境的,但在工作环境之外,如果我们将自行设计的宏语法统一放到autoexec.sas文件中,那么就能够拥有自带完整数据分析宏语法的SAS了。图2-2 日志文件

然而,对于初学者而言,编写宏语法是相当困难的,因此本书提供了笔者所编写的autoexec.sas文件供读者下载使用,下载数据如图2-3所示。图2-3 本书提供的下载数据

读者获得autoexec.sas文件后,就可以使用自带宏语法的功能了,也可以将自己编写的宏语法添加到该文件中,如此就可以增加SAS本身的功能。在本书提供的autoexec.sas文件中,一共包含31个宏语法,宏语法功能说明如表2-1所示。表2-1 宏语法功能说明1 Add0宏在本书中并没有介绍,但是在其他宏语法中必须使用该宏的功能。若要了解Add0的使用,则可以参考“SAS之家”公众号的推文,地址:http://dwz.cn/6iy2bm。续表

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载