经济计量学精要(原书第4版)(txt+pdf+epub+mobi电子书下载)


发布时间:2021-03-06 21:26:44

点击下载

作者:(美)古扎拉蒂(Gujarati,D.N.),(美)波特(Porter,D.C.)

出版社:机械工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

经济计量学精要(原书第4版)

经济计量学精要(原书第4版)试读:

前言

与前几版一样,《经济计量学精要》第4版最主要的目的是向读者通俗易懂地介绍经济计量学的理论和技术。本书主要面向经济学和工商管理专业的本科生以及MBA学员,也适用于涉及经济计量分析,尤其是回归分析的其他社会科学和行为科学专业的学生。本书力求通过大量的实例、翔实的解释和丰富的习题帮助学生理解经济计量技术。

虽然我已年过80,但是对于经济计量学的热爱丝毫未减,并努力跟踪这个领域的最新进展。我的助手,南加州大学洛杉矶分校马歇尔商学院统计学助理教授道恩博士(也是本书的作者之一)给了我极大的支持与帮助。本书第4版凝结了我们的坚持与付出。

本版特点

在介绍本书

内容变更

之前,首先提醒读者关注本版的一些特点:(1)为了直接进入线性回归这个核心内容,本版把统计学基础知识放在了附录部分,这样可以随时翻阅附录回顾统计学知识。(2)本版案例中的数据都进行了更新。(3)本版增加了一些新例子。(4)在某些章节还对原版的例子进行了扩展。(5)本版还给出了一些例子的计算机输出结果。大多数例子都是基于EViews 6、STATA和MINITAB实现的。(6)本版还提供了一些新图形。(7)本版引入了新的数据集。(8)为了简约版面,本版仅罗列出一些小样本数据,大样本数[1]据在网上教材中给出。当然,网上教材提供了书中使用到的所有数据。[1]网上教材请登录www.mhhe.com/gujaratiess4e,本书后面提到的案例中的数据读者均可在该网址获得;也可登录华章公司网站www.hzbook.com获得。——编者注内容变更

第1章:扩充了网上数据资源。

第2章和第3章:在双变量回归模型中引入了一个新的例子:家庭收入和学生S.A.T分数的关系。

第4章:简单介绍了非随机预测元和随机预测元的概念。增加了不同国家教育支出一例,用以说明回归的假设检验。

第5章:利用学生数学S.A.T分数一例说明了各种函数形式。增加的5.10节介绍了标准化变量的回归。此外,本章还增加了一些习题。

第6章:通过一流商学院录取率一例说明了虚拟变量的作用。此外,本章还增加了一些习题。

第8章:本章增加了一些习题。

第9章:通过工资和教育水平、受教育年限一例说明了异方差的概念。

第10章:本章增加了一节内容,即举例说明了纽维-韦斯特(Newey-West)标准误校正方法。此外,在本章最后附录部分增加了用于诊断自相关的布鲁尔什-戈弗雷(Breusch-Godfrey)检验。

第12章:通过一个新例子说明了逻辑回归。

附录A~附录D:附录是第3版第2~5章的内容。这样安排主要是考虑到了内容的连续性以及便于随时温习统计学知识。附录中的数据进行了更新。

此外,原版书中出现的一些印刷错误也进行了更正。

数学要求

本书很少用到矩阵代数和微积分。我们一直坚信应该以最直观的方式向初学者介绍经济计量学,而无须涉及大量的矩阵代数和微积分。证明过程基本省略,除非这些证明过程很容易理解。当然,教师可以根据需要,在适当的地方给出证明。

计算机与经济计量学

许多优秀的统计软件对初学者学习经济计量学大有益处,但也不必过分夸大统计软件的作用。本书的例子中使用了EViews、Excel、MINITAB和STATA等统计软件,很容易获得这些软件的学生版。网上教材中的数据是以Excel形式给出的,当然,其他标准的统计软件,比如LIMDEP、RATS、SAS和SPSS也能够直接读取这些数据。

附录E给出了使用相同数据并利用EViews、Excel、MINITAB和STATA输出的计算结果。这些软件的统计过程大致相同,但每个软件都有各自独特之处。

结语

本书的目的是以一种轻松的方式向初学者介绍经济计量学这门学科。我希望本书对读者将来的学术或专业研究有所帮助,同时也希望本书成为读者学习高级经济计量学的基础教材。在本书的最后部分给出了有关高级经济计量学的参考书目。

致谢

衷心感谢以下评论者,他们为本书提供了宝贵的修改意见。

此外,还要感谢McGraw-Hill的Douglas Renier为全书编辑所做的工作;感谢McGraw-Hill的助理编辑Noelle Fox全程参与本书的编辑;感谢Manjot Singh Dodi为编辑本书所做的精心安排;感谢Ann Sass为编辑本书中的公式和符号所付出的辛勤劳动。达莫达尔 N.古扎拉蒂(美国西点军事学院)道恩 C.波特(美国南加利福尼亚大学洛杉矶分校)

作者简介

达莫达尔 N. 古扎拉蒂(Damodar N.Gujarati)

达莫达尔 N. 古扎拉蒂曾执教于纽约城市大学(25年多)和西点军事学院社会科学系(17年)。古扎拉蒂博士于1960年获孟买大学商学硕士学位,1963年获芝加哥大学MBA硕士学位,1965年获芝加哥大学博士学位。古扎拉蒂曾在Review of Economics and Statistics,Economic Journal,Journal of Financial and Quantitative Analysis,Journal of Business等国际著名杂志上发表多篇论文。古扎拉蒂博士曾任Journal of Quantitative Economics和官方刊物Indian Econometric Society的编委会成员。古扎拉蒂博士代表著作有《退休金与纽约市的财政危机》(Pensions and New York City Fiscal Crisis,American Enterprise Institute,1978),《政府和企业》(Government and Business,McGraw-Hill,1984)和《经济计量学》(Basic Econometrics,5th ed,McGraw-Hill,2009)。古扎拉蒂博士在经济计量学领域的著作已被译成多种文字出版。

古扎拉蒂博士曾是英国谢菲尔德大学的访问教授(1970~1971年),富布莱特项目访问教授(印度,1981~1982年),新加坡国立大学访问教授(1985~1986年),澳大利亚新南威尔士大学经济计量学访问教授(1988年夏)。古扎拉蒂博士曾先后在澳大利亚、中国、孟加拉国、德国、印度、以色列、毛里求斯、韩国等讲授宏观和微观经济学专题。

道恩 C. 波特(Dawn C.Porter)

道恩 C. 波特于2006年秋季开始担任南加利福尼亚大学马歇尔商学院信息和运营管理系助理教授,为本科生、MBA和研究生讲授统计学课程。此前,道恩曾任乔治敦大学麦克多诺商学院助理教授,纽约大学艺术和科学研究生院心理学系客座教授,纽约大学斯特恩商学院讲师。道恩在纽约大学斯特恩商学院获得统计学博士学位,在康奈尔大学获数学学士学位。

道恩博士的研究领域涉及范畴分析、契约度量、多变量建模以及这些方法在心理学方面的应用,现在重点关注的是从统计学角度研究在线拍卖模型。道恩博士曾在Joint Statistical Meetings、Decision Sciences Institute Meetings、International Conference on Information Systems会议上发表学术演讲,并参加了伦敦经济学院、纽约大学等高校,以及各种电子商务和统计研讨会。道恩博士还合著出版了《商业统计精要》(第2版)(Essentials of Business Statistics)以及《经济计量学》(第5版)(Basic Econometrics)。

此外,道恩博士还担任毕马威公司、美国政府国民抵押贷款协会、反斗城玩具公司、IBM公司、Cosmaire公司、纽约大学媒体中心等多家公司的统计咨询顾问。

教学建议

教学目的

本课程教学的目的在于让学生掌握经济计量学的基本知识和原理,主要包括经典假设下的经济计量学模型、放宽假设的经济计量学模型、联立方程模型的理论与应用和单方程回归模型的几个专题四个部分,要求学生不仅要熟练掌握经济计量学的基础知识,还要能够运用经济计量模型分析经济现象。

前期需要掌握的知识

微积分、线性代数、概率论与数理统计、微观经济学、宏观经济学等课程相关知识。

课时分布建议

第1章 经济计量学的特征及研究范围

在经济学、金融学、管理学、营销学及其他相关学科的研究中,越来越多地使用到定量分析。对于这些领域的初学者来说,掌握一两门经济计量方面的课程是必要的——经济计量学现已成为最热门的专业之一。本章向初学者概括地介绍经济计量学。1.1 什么是经济计量学

简单地说,经济计量学(econometrics)就是经济的测度。虽然对诸如国民生产总值(GDP)、失业、通货膨胀、进口、出口等经济概念的定量测度十分重要,但从下面的定义中,我们不难看出经济计量学的研究范围更为宽泛:

经济计量学是利用经济理论、数学、统计推断等工具对经济现象[1]进行分析的一门社会科学。

经济计量学运用数理统计学分析经济数据,对构建于数理经济学[2]基础之上的模型进行实证分析,并得出数值结果。[1]Arthur S.Goldberger,Econometric Theory,Wiley,New York,1964,p.1.[2]P.A.Samuelson,T.C.Koopmans,and J.R.N.Stone,“Report of the Evaluative Committee for Econometrica,”Econometrica,vol.22,No.2,April 1954,pp.141-146.1.2 为什么要学习经济计量学

从上述定义可以看出,经济计量学涉及经济理论、数理经济学、经济统计学(即经济数据)以及数理统计学。然而,它又是一门有独立研究方向的学科,原因如下。

从本质上说,经济理论所提出的命题和假说,多以定性描述为主。例如,微观经济理论中提到的:在其他条件不变的情况下(经济学中著名的ceteris paribus从句),一种商品价格的上升会引起该商品需求量的减少。因此,经济理论假定:商品的价格与其需求量反方向变动——这就是著名的向下倾斜的需求定律,简称需求定律。但是,该理论本身却无法定量测度这两个变量之间的强度关系,也就是说,我们无法得知商品的价格发生某一变动时,其需求量增加或减少了多少。经济计量学家的任务就是提供这样的数值估计。经济计量学依据观测或试验,对大多数经济理论给出经验解释。如果在研究或试验中发现商品价格上涨一个单位(1美元),引起该商品需求量下降,比如下降了100个单位,那么我们不仅验证了需求定律,而且给出了价格和需求量这两个变量之间的数值估计。

数理经济学(mathematical economics)主要是用数学形式或方程(或模型)描述经济理论,而不考虑对经济理论的测度和经验验证。而经济计量学主要关注的却是对经济理论的经验验证。在随后的内容中我们将会看到,经济计量学家通常采用数理经济学家提出的数学模型,只不过是把这些模型转换成可以用于经验验证的形式。

经济统计学主要涉及经济数据的收集、处理、绘图、制表。经济统计学家的工作是收集GDP、失业、就业、价格等数据,而不是利用这些数据来验证经济理论。但这些数据恰恰是经济计量分析的原始数据。

虽然数理统计学提供了许多分析工具,但由于经济数据独特的性质(大多数经济数据的生成并非可控试验的结果),因此,经济计量学经常需要使用特殊方法。类似于气象学,经济计量学所依据的数据往往不能直接控制。所以,公共和私人机构收集到的消费、收入、投资、储蓄、价格等数据从本质上说都是非试验性的。经济计量学家通常把这些数据看成是给定的,这就产生了数理统计学不能正常解决的特殊问题。而且,这些数据很可能包含了测量误差、遗漏或是误计错误,这就要求经济计量学家建立特殊的分析方法来处理这些测度误差。

对于主修经济学和商学专业的学生来说,学习经济计量学还在于其实用性。毕业以后,在工作中或许会遇到需要预测销售量、利息率、货币供给量或是估计商品的需求函数、供给函数以及价格弹性等工作。经济学家通常以专家身份出现在联邦及州管制委员会面前,代表了整体公众的利益。因此,在州管制委员会决定汽油和电提价之前(汽油和电的价格是由州管制委员会规定的),需要经济学家能够估计出提议的价格上涨对用电需求量的影响。在这种情况下,经济学家需要建立一个关于用电量的需求函数,并根据这个需求函数估计需求的价格弹性,即价格变动的百分比引起需求量改变的百分比。掌握经济计量学知识对于估计这些需求函数很有帮助。

客观地说,在经济学和商业专业培训中,经济计量学已成为不可或缺的部分。1.3 经济计量学方法论

怎样进行经济计量研究?一般来说,经济计量分析步骤如下:(1)建立一个理论假说。(2)收集数据。(3)设定数学模型。(4)设立统计或经济计量模型。(5)估计经济计量模型参数。(6)核查模型的适用性:模型设定检验。(7)检验源自模型的假设。(8)利用模型进行预测。

为了阐明经济计量学方法论,不妨考虑这样一个问题:经济形势会影响人们进入劳动力市场的决策吗?也就是说,经济形势是否对人们的工作意愿有影响?假设用失业率(UNR)度量经济形势,用劳动力参与率(LFPR)度量劳动力参与,UNR和LFPR的数据由政府按时公布。我们按上述步骤回答这个问题。1.3.1 建立一个理论假说

首先要了解经济理论对这一问题是怎样阐述的。在劳动力经济学中,关于经济形势对人们工作意愿的影响有两个互相对立的假说。受挫-工人假说(效应)认为当经济形势恶化时(表现为较高的失业率),许多失业工人放弃寻找工作的愿望并退出劳动力市场。增加-工人假说(效应)认为当经济形势恶化时,许多尚未进入劳动力市场的后备工人(比如带孩子的母亲)可能会由于养家的人失去工作而决定进入劳动力市场,即使这些工作的报酬很低,只要可以弥补由于养家的人失去工作而造成的收入损失就行。

总而言之,劳动力参与率的增加或减少取决于增加-工人效应和受挫-工人效应的强弱对比。如果增加-工人效应占主导,则LFPR将升高,即使是在失业率很高的情况下。相反,如果是受挫-工人效应占主导,那么LFPR将会下降。如何得到这一结果呢?这就成了一个实证问题。1.3.2 收集数据

因此,在实证分析中需要这两个变量的定量信息。一般来说,有三类数据可用于实证分析:(1)时间序列数据。(2)截面数据。(3)合并数据(时间序列数据与截面数据的组合)。

时间序列数据(times series data)是按时间跨度收集得到的。比如GDP、失业、就业、货币供给、政府赤字等,这些数据是按照规则的时间间隔收集得到的——每天(比如股票价格)、每周(比如货币供给)、每月(比如失业率)、每季度(比如GDP)或每年(比如政府预算)。这些数据可能是定量的(比如价格、收入、货币供给等),也可能是定性的(比如男或女、失业或就业、已婚或未婚、白人或黑人等)。你会发现,定性变量(又称为虚拟变量或分类变量)与定量变量同样重要。

截面数据(cross-sectional data)是指一个或多个变量在某一时点上的数据集合。例如美国人口调查局每十年进行的人口普查(最近一次是在2000年4月1日进行的),密执安大学进行的消费者支出调查以及Gallup、Harris和其他投票组织进行的民意测验等。

合并数据(pooled data)既包括时间序列数据又包括截面数据。例如,如果要收集20年间10个国家的失业率数据,那么这个数据集就是一个合并数据——每个国家20年间的失业率构成时间序列数据,而10个不同国家每年的失业率又组成截面数据。在合并数据中,共有200个观察值——10个国家20年间的失业率数据。

面板数据(panel data)是一种特殊类型的合并数据,也称纵向数据(longitudinal data)或微观面板数据(micropanel data)。即同一个横截面单位(比如某个家庭或某个公司)的跨期调查数据。例如,美国商务部在一定时间间隔内对住房供给的调查。在每一时期的调查中,调查同样的家庭(或住在相同住址的人群),观察自上次调查以来,其住房和财务状况是否发生变化。面板数据就是在周期性时间间隔内,通过重复观察同一住户得到的,它提供了研究家庭行为动态变化的有效信息。

数据来源 任何一项成功的经济计量研究,其关键都在于数据的数量和质量。幸运的是,互联网为我们提供了大量翔实的数据。附录A1列出了一些提供各类微观和宏观经济数据的网址。学生必须熟悉这些数据资源,并学会下载数据。当然,这些数据在不断更新,读者可以得到最新数据。

为了便于分析,这里给出一组时间序列数据。表1-1给出了美国1980~2007年城市劳动力参与率(CLFPR)和城市失业率(CUNR)[1]数据。城市失业率是指城市失业人口占城市劳动力的百分比。

与物理学不同,许多收集的经济数据(比如GDP、货币供给、道琼斯指数、汽车销售量等)是非试验性的,也就是说,数据收集机构(比如政府)并不直接监控这些数据。因而,劳动力参与率和失业率的数据来源于劳动力市场上参与者提供给政府的信息。在某种意义上,政府是数据的被动收集者。在收集数据的过程中,政府或许并不知道受挫-工人假说、增加-工人假说或者其他假说,因此,收集到的数据可能是影响个人劳动力参与率决策的若干因素综合作用的结果。也就是说,同样的数据可能适用于不同的理论。[1]这里我们仅考虑加总的CLFPR和CUNR,数据也可按年龄、性别和种族分类。1.3.3 设定劳动力参与率的数学模型

为了观察CLFPR与CUNR的变动关系,首先根据变量数据做散点图(scatter diagram),见图1-1。图 1-1 城市劳动力参与率(%)与城市失业率(%)回归图

从图中可以看出,CLFPR与CUNR呈反方向变动,这或许表明:[1]总体上看,受挫-工人效应强于增加-工人效应。作为一次近似,可以描绘出一条穿过散点的直线,并写出CLFPR和CUNR两者之间的简单数学模型:

CLFPR=B+BCUNR (1-1)12

式(1-1)表明CLFPR与CUNR线性相关。B和B为线性函数的12[2]参数(parameters)。B为截距(intercept),即当CUNR为零时1[3]CLFPR的值。B为斜率(slope),度量了单位CUNR变动引起2CLFPR的变化率。更一般地,斜率度量了等式右边变量的单位变动引起的等式左边变量的变化率。斜率系数B可正(若增加-工人效应2强于受挫-工人效应)可负(若受挫-工人效应强于增加-工人效应)。图1-1表明此例中的斜率为负。[1]参见Shelly Lundberg,“The Added Worker Effect,”Journal of Labor Economics,vol.3,January 1985,pp.11-37.[2]概括说来,参数是一个未知量,可能在某个区间内变动。在统计学中,随机变量的概率密度函数(PDF)通常由其参数,比如均值和方差来描述。详细的讨论参见第2章和第3章。[3]在第2章回归分析内容中给出了截距更准确的定义。1.3.4 设定劳动力参与率的统计或经济计量模型

式(1-1)给出了城市劳动力参与率与城市失业率关系的纯数学模型,数理经济学家或许对它感兴趣,但它对经济计量学家的吸引力却是有限的。因为,这样一个模型设定了变量之间的精确或确定性关系;也就是说,给定一个CUNR值,有唯一一个CLFPR值与之对应。在现实中,很难发现经济变量之间存在如此精确的关系,更一般的情形是变量之间的关系往往是不确定的或是统计的。

我们可以通过图1-1给出的散点图清楚地看到这一点。虽然两个变量存在反方向变动关系,但是两个变量之间并非准确的或完全线性相关的,因为,如果通过这28个数据点做一条直线,并不是所有的[1]数据点都准确地落在这条直线上。两点确定一条直线,为什么这28个数据点没有准确地落在这条由数学模型设定的直线上呢?别忘了劳动力和失业数据都是非试验收集得到的。如前所述,除了增加-工人假说和受挫-工人假说外,还有其他因素影响劳动力参与率决策。因此,所观察到的城市劳动力参与率与城市失业率之间的关系很可能是不精确的。

我们把所有其他影响劳动力参与率的因素都包括在变量u中,式(1-1)可以写成:

CLFPR=B+BCUNR+u (1-2)12

其中,u代表随机误差项(random error term),简称误差项[2](error term)。u包括了除城市失业率以外其他所有影响城市劳动参与率,但并未在模型中具体体现的因素以及纯随机影响。在第二部分中,我们会看到经济计量学中的误差项不同于纯数理经济学中的误差项。

式(1-2)就是一个统计的,或经验的,或经济计量学的模型。更准确地说,它是一个线性回归模型(linear regression model),这正是本书讨论的主题。在这个模型中,等式左边的变量称为应变量(dependent variable),等式右边的变量称为自变量(independent variable)或解释变量(explanatory variable)。线性回归分析的主要目标就是解释一个变量(应变量)与其他一个或多个变量(解释变量)之间的行为关系,当然这种关系并非完全精确。

值得注意的是,式(1-2)描述的经济计量模型来自式(1-1)所表示的数学模型。这表明数理经济学和经济计量学是互相补充的学科。我们一开始给出的经济计量学定义也清楚地反映出这一点。

在继续下文之前,有一个概念值得我们注意——因果关系(causation)。在回归模型(1-2)中,我们说城市劳动力参与率是应变量,城市失业率是自变量或解释变量。这两个变量之间存在因果关系(即城市失业率是因,城市劳动力参与率是果)吗?换句话说,回归包含因果关系吗?并不一定。正如Kendall和Stuart所说:“统计关系无论有多强,有多紧密,也决不能建立起因果关系:因果关系的概[3]念来自统计学之外的某个理论。”在本例中,是根据经济理论(比如受挫-工人假说)在应变量和解释变量之间建立起“因和果”这样的关系。如果不能建立起因果关系,不妨称之为预测关系:给定CUNR,能够预测CLFPR吗?[1]我们甚至试图根据图1-1的散点拟合出一条抛物线,但结果与线性设定并没有实质性的差别。[2]用统计语言,random error term也称为stochastic error term。[3]M.G.Kendall and A.Stuart,The Advanced Theory of Statistics,Charles Griffin Publishers,New York,1961,vol.2,Chap.26,p.279.1.3.5 估计经济计量模型参数

利用表1-1给出的CLFPR和CUNR数据如何估计模型(1-2)中的参数B和B呢?即如何确定这些参数的具体数值(即估计值)呢?12这是本书第二部分的重点——建立适当的算法,尤其是普通最小二乘法(OLS)。运用OLS和表1-1给出的数据,得到如下结果:

注意,我们在CLFPR上加上符号∧(读做“CLFPR帽”)提示大家:式(1-3)是式(1-2)的估计值。图1-1是根据真实数据估计得到的回归直线。

从式(1-3)可知,B的估计值≈69.5,B≈-0.58(符号≈表示近12似)。因此,在其他条件不变的情况下,失业率每上升一个单位(比如说一个百分点),平均而言,城市劳动力参与率将下降0.58个百分点;也就是说,当经济状况恶化时,劳动力参与率平均净减少0.58个百分点,这或许表明了受挫-工人效应占主导。我们讲“平均”是因为前面提到误差项u的存在可能导致变量之间的关系不够精确,这一点可以从图1-1中清楚地看到:真实数据点并未落在估计的回归线上。回归直线上的点与真实数据点的(垂直)距离就是估计的u′s。在第6章中我们会看到,估计的u′s称为残差。简言之,估计的回归直线,式(1-3)给出了平均城市劳动力参与率与城市失业率之间的关系——单位CUNR的变化所引起的CLFPR平均改变量是多少。69.5表明当CUNR为零时CLFPR的平均值为69.5%。也就是说,当充分就业[1]时(即零失业),城市适龄工作人口的69.5%将参与就业。[1]这只是截距机械的解释。在第2章中,我们会看到在不同情况下怎样赋予截距不同的意义。1.3.6 核查模型的适用性:模型设定检验

模型(1-3)是否适当呢?人们在进入劳动力市场前,通常会根据一些因素,比如说失业率,来考虑劳动力市场的状况。例如,1982年(不景气的一年)城市失业率约为9.7%,而2001年仅为4.7%。显然,与5%的失业率相比,当失业率为9%时,人们更不情愿进入劳动力市场。此外,还有其他一些因素影响人们进入劳动力市场的决策,比如小时工资或收入,也是重要的决策变量。至少在短期内,在其他条件不变的情况下,工资越高越能吸引工人进入劳动力市场。为了说明其重要性,表1-1还给出了实际平均每小时工资(AHE82)的数据(1982年美元价)。考虑到AHE82的影响,得到如下模型:

CLFPR=B+BCUNR+BAHE82+u (1-4)123

式(1-4)是一个多元线性回归模型,而式(1-2)是一个简单(双变量)线性回归模型。在双变量模型中只有一个解释变量,而在多元回归模型中有若干个(或称多元)解释变量。值得注意的是,在多元回归模型(1-4)中,同样包括了误差项u,因为无论模型中有多少个解释变量,都不能完全解释应变量的行为。一个多元回归模型究竟需要引入多少个解释变量,需根据具体情况而定。当然,基本的经济理论通常会告诉我们哪些变量需要包括到模型之中。但需要注意的是,正如前面所提到的:回归并不意味着存在因果关系;一个或多个解释变量是否与应变量存在因果关系,必须根据相关理论来判定。

如何估计式(1-4)中的参数呢?我们将在第2章和第3章讨论完双变量模型之后,在第4章中详细说明。首先考虑双变量模型,是因为它是多元回归模型的基础。在第4章中将会看到,在许多方面,多元回归模型是双变量模型的直接扩展。

在本例中,式(1-4)的经验估计如下(基于OLS):

这个结果很有意思,两个斜率系数均为负数。负的CUNR表明,在其他条件不变的情况下(即AHE82为常数),失业率每增加1%,城市劳动力参与率平均减少0.64%。这个结果再一次支持了受挫-工人假说。另一方面,当CUNR为一常数时,平均每小时工资每增加一美元,[1]CLFPR平均减少1.44个百分点。负的AHE82系数有经济意义吗?为什么不预期该系数为正呢(即小时工资越高,则劳动力市场越有吸引力)?我们可以通过微观经济学的两个孪生概念——收入效应和替代[2]效应,来验证系数为负。

究竟选择哪一个模型呢,式(1-3)还是式(1-5)?既然式(1-5)包容式(1-3),而且增加了一个分析变量(收入),所以我们可能选择式(1-5)。毕竟,式(1-2)隐含地假定了除失业率以外其他变量均为常数。但是,我们的分析到哪儿才是尽头呢?例如,劳动力参与率可能还依赖于家庭财富、6岁以下孩子的个数(这对已婚妇女决定进入劳动力市场至关重要)、孩子日托的便利程度、宗教信仰、福利费领取便利与否、失业保险等。即使这些变量的数据都是可获得的,我们也不会把它们都引入模型,因为经济计量建模的目的不是包容全部现实,而仅仅是一些显著因素。如果试图在回归模型中引入每一个可以想象到的变量,那么这个模型将会难以处理,以致没有任何实际用处了。最终选择的模型应该是对现实的合理复制。在第7章中,我们将进一步讨论这个问题,并探讨如何着手建立模型。[1]在第4章中将会看到,式(1-5)中CUNR和AHE82的系数称为偏回归系数,在那里,我们会讨论偏回归系数的准确含义。[2]参阅微观经济学标准教科书。对这一结果的直观判断是:假定夫妇双方都进入了劳动力市场,夫妇一方的工资有明显增加,在家庭收入不受实质性影响的情况下,这很可能促使另一方退出劳动力市场。1.3.7 检验源自模型的假设

模型最终确定之后,需要进行假设检验(hypothesis testing),即验证估计的模型是否有经济意义,以及估计的结果是否与经济理论相符。例如,受挫-工人假说认为劳动力参与率与失业率之间负相关。这个假设与结果相符吗?统计结果看起来与假设一致,因为CUNR系数的估计值为负。

然而,假设检验可能更为复杂。在这个例子中,假定得知在先前的研究中,城市失业率的系数约为-1。这和我们的结果一致吗?如果选择模型(1-3),则得到一个结果,但如果选择模型(1-5),则可能得到另一个结果。怎样解决这个问题呢?这需要建立一些必要的工具解决诸如此类的问题,但需要注意的是:对某个假设的回答取决于最终选择的模型。

回归分析中很重要的一点是:我们感兴趣的不仅仅是对模型参数的估计,而且还对检验源自某个经济理论(或先验经验)的假设感兴趣。1.3.8 利用模型进行预测

经过上述多个步骤之后,很自然地提出这样一个问题:我们利用估计的模型做什么,比如式(1-5)?通常利用模型进行预测(prediction,forecasting)。例如,假设现有2008年CUNR和AHE82的数据,分别是6.0和10。代入式(1-5),得到2008年CLFPR的预测值为62.9473%,即如果2008年的失业率为6%,实际每小时工资为10美元,则当年的城市劳动力参与率约为63%。当然,当获得2008年城市劳动力参与率的实际值之后,可与预测值进行比较。两者之间的差距代表了预测误差。我们希望预测误差尽可能小。这是否可能呢?我们将在第2章和第3章回答这个问题。

总结一下经济计量分析的步骤:

虽然我们只是用劳动力经济学的一个例子阐述经济计量学方法论,但可以用同样的步骤分析任何领域中不同变量之间的定量关系。事实上,回归分析已应用于政治学、国际关系学、心理学、社会学、气象学以及其他许多领域。1.4 全书结构

以上我们概括地介绍了经济计量学的特征及研究范围。本书共分四个部分。

附录A、附录B、附录C和附录D帮助那些淡忘了统计知识的读者回顾概率和统计的基础知识。读者需要掌握统计学的入门知识。

第一部分介绍了经济计量学的基本分析工具——古典线性回归模型(CLRM)。读者必须对古典线性回归模型有一个完整的理解,这样才能进行经济和商业领域的研究。

第二部分介绍了回归分析在实践中的运用,并讨论了当违背古典回归模型假设时需解决的各类问题。

第三部分讨论了两个高级专题——联立方程回归模型和时间序列经济计量学。

本书主要针对的是经济计量学初学者,因此大多数专题的讨论简[1]单明确,不牵涉数学证明和推导等。我始终坚信,对初学者用这样的方法讲授看似难以接受的经济计量学,能够使他们了解这门学科的价值,而不至于卷入烦琐的数学和统计推导细节上。学生需要记住:与统计学一样,经济计量学主要讨论的也是估计和假设检验,所不同的,或者说更有意思、更有用的是,经济计量学需要估计或检验的参数并不仅仅是均值和方差,而且还有变量之间的关系,这也正是经济学和其他社会科学所关心的。

最后值得提出的一点是,通过使用一些价格便宜的计算机软件包,初学者可以更易于掌握经济计量学这门课程。本书主要应用了四种软件包:EViews,Excel,STATA和MINITAB。这些软件易于掌握,而且应用广泛。一旦熟悉了这类软件,你会发现学习经济计量学其乐无穷,并且有助于更好地理解经济学。[1]部分证明和推导参阅作者的《经济计量学基础》(Basic Econometrics,5th ed.,McGraw-Hill,New York,2009)一书。关键术语和概念

本章介绍的主要术语和概念有:

经济计量学

数理经济学

受挫-工人假说(效应)

增加-工人假说(效应)

时间序列数据

a)定量的

b)定性的

截面数据

合并数据

面板(或称纵向或微观面板数据)

散点图

a)参数

b)截距

c)斜率

随机误差项(误差项)

线性回归模型:

应变量

自变量(或解释变量)

确定性关系与统计关系

因果关系

参数估计值

假设检验

预测问题

1.1 假设地方政府决定在其管辖区内提高居民财产税税率。这对当地房价有何影响?按照本章讨论的八个步骤回答这一问题。

1.2 如何理解经济计量学在商业和经济学中的决策作用?

1.3 假设你是联邦储备委员会主席的经济顾问,若联邦储备委员会主席询问你对增加货币供给以刺激经济有何建议,那么你会考虑哪些因素?你如何运用经济计量学进行分析?

1.4 为了减少对外国石油供给的依赖,政府正考虑对汽油收取联邦税。假设福特汽车公司雇用你分析税收增加对汽车需求量的影响,你将如何向公司提出建议?

1.5 假设美国总统正考虑对进口钢材征收关税以保护国内钢铁行业的利益。作为总统经济顾问,你的建议是什么?你如何展开经济计量研究以分析征收关税的影响?习题

1.6 表1-2给出了美国1980~2007年间消费者价格指数(CPI)、标准普尔500股票指数(S&P 500)和3月期国债利率的数据。(a)以时间为横轴,上述三个变量为纵轴作图。当然,你可以对每个变量分别作图。(b)你预计CPI与S&P指数之间的关系如何?CPI与3月期国债利率的关系如何?为什么?(c)对每个变量,根据散点图目测其回归线。

1.7 表1-3给出了英镑与美元之间的汇率数据(1美元兑换多少英镑),以及两个国家1985~2007年间消费者价格指数。(a)以时间(年)为横轴,以汇率(ER)与两个消费者价格指数为纵轴作图。(b)求相对价格比率(RPR)(用英国CPI除美国CPI)。(c)用ER对RPR作图。(d)目测描绘通过散点图的回归线。[1]附录1A 互联网上的经济数据

经济统计学情况介绍:提供了产出、收入、就业、失业、收入、生产和商业活动、价格和货币、信用和证券市场以及国际统计等方面的数据。

http://www.whitehouse.gov/fsbr/esbr.htm

联邦储备系统棕皮书:联邦储备区提供的当前经济情况概要。共有12个联邦储备区。

www.federalreserve.gov/FOMC/Beigebook/2008

国家经济研究局(NBER)主页:一个享有盛誉的经济研究机构,提供资产价格、劳动力、生产率、货币供给、商业周期指标等详实数据。NBER还可以直接链接到许多其他网站。

http://www.nber.org

面板研究:提供了自1968年以来每年美国个人和家庭的纵向抽样调查数据。

http://www.umich.edu/~psid

联邦网络定位器:提供联邦政府各部门信息,并提供国际链接。

www.lib.auburn.edu/madd/docs/fedolo.html

WebEC:经济学互联网资源,关于经济案例和数据的综合图书馆。

www.helsinke,fi/WebEc

http://wuecon.wustl.edu/adnetec/WebEc/WebEc.html

美国股票交易所:提供在第二大股票市场上市的近700家公司的信息。

http://www.amex.com/

经济分析局(BEA)主页:美国商务部的代理机构,发布商业调查,提供各种经济活动信息。

www.bea.gov

商业周期指标:提供256个经济时间序列数据。

http://www.globalexposure.com/bci.html

CIA出版物:提供各国每年的基本国情(World Fact Book)。

www.cia.gov/library/publications

能源信息管理(能源部):提供各类燃料的经济信息和数据。

http://www.eia.doe.gov/

FRED数据库:圣路易斯联邦储备银行发布经济和社会数据,包括利率、货币和商业指标、汇率等。

http://www.stls.frb.org/fred/

国际贸易管理机构:提供贸易统计,跨国项目等网络链接。

http://www.ita.doc.gov/

STAT-USA数据库:国家贸易数据银行提供最全面的国际贸易和出口促销信息,以及若干国家人口统计,政治和社会经济等方面的数据。

http://www.stat-usa.gov/

劳工统计局:主页包括就业、失业和收入相关的各种数据。

http://www.stats.bls.gov

美国普查局主页:提供了社会、人口统计以及收入、就业、收入分配和贫困等经济数据。

http://www.census.gov/

一般社会调查:提供从1972年开始的美国家庭个体调查数据。超过35000人次回答了2500个不同的问题。

www.norc.org/GCS+Website

贫困研究所:一个以大学为依托的无党派、非营利研究中心,提供与贫困和社会公平有关的数据信息。

http://www.ssc.wisc.edu/irp/

社会保障管理机构:社会保障管理机构的官方网站,提供各种数据。

http://www.ssa.gov/

联邦存款保险公司,银行数据和统计。

http://www.fdic.gov/bank/statistical/

美国联邦储备委员会,经济研究和数据。

http://www.fedralreserve.gov/econresdata

美国调查局主页。

http://www.census.gov

美国商务部,经济分析局。

www.eia.doe.gov/overview_hd.html

美国健康和人员服务部,国家健康统计中心。

http://www.cdc.gov/nchs

美国住房和城市发展部,数据集。

http://www.huduser.org/datasets/pdrdatas.html

美国劳工部,劳动统计局。

http://www.bls.gov

美国交通部。

http://www.transtats.bts.gov

美国财政部,国内税收统计。

http://www.irs.gov/taxstats

洛克菲勒政府协会,州和地方财政数据。

www.rockinst.org/research/sl_finance

美国经济协会,经济学家资源库。

http://www.rfe.org

美国统计协会,商业和经济统计。

www.amstat.org/sections/sis/

欧洲中央银行。

http://www.ecb.int/stats

世界银行,数据和统计。

http://www.worldbank.org/data

国际货币基金,统计专题。

http://www.imf.org/external/np/sta

Penn世界表。

http://pwt.econ.upenn.edu

人口调查。

http://www.bls.census.gov/cps/

消费者支出调查。

http://www.bls.gov/cex/

消费者财务调查。

http://www.federalreserve.gov/pubs/oss/

城市和农村数据。

http://www.census.gov/prod/www/ccdb.html

收入变动的面板研究。

http://psidonline.isr.umich.edu

国家纵向调查。

http://www.bls.gob/nls/

美国房屋建造协会,经济和住房供给数据。

http://www.nahb.org/page.aspx/category sectionID=113

国家科学基金,科学资源分类统计。

http://www.nsf.gov/sbe/srs/

总统经济报告。

http://www.gpoaccess.gov/eop/

各类经济数据集。

http://www.econonmy.com/freelunch/

经济学家市场指数。

http://www.economist.com/markets/indicators

军事统计资源。

http:www.lib.umich.edu/govdocs/stmil.html

世界经济指数。

http://devdata.worldbank.org/

经济时间序列数据。

http://www.economagic.com/[1]这里提供的不是全部网络数据资源。罗列出的数据资源会不断更新。获取信息的最好方法是利用关键词(例如失业率)进行搜索。搜索到大量相关信息也不必感到惊讶。第一部分 线性回归模型

第一部分包括5章内容,介绍了经济计量学的基础工具——线性回归模型。

第2章通过最简单的线性回归模型——双变量模型探讨了线性回归的基本思想。区别了总体回归模型与样本回归模型(用后者估计前者),并介绍了最常用的估计方法——最小二乘法。

第3章讨论了假设检验。在统计学中,假设检验用来探求回归模型中参数的估计值是否与其假设值相一致。我们是在古典线性回归模型(CLRM)的框架下进行假设检验的。本章讨论了为什么要用古典线性回归模型,并进一步指出CLRM是研究其他回归模型的起点。在本书的第二部分中,还将介绍当古典线性回归模型的一个或若干个基本假设不满足时会有什么样的后果。

第4章把前两章讨论的双变量回归模型的思想推广到多元回归模型,即模型中的解释变量不只一个。虽然在许多方面,多元回归模型是双变量模型的直接推广,但关于模型系数的解释以及假设检验还是存在一些差异的。

线性回归模型,无论是双变量模型还是多变量模型,仅仅要求模型的参数是线性的,而进入模型的变量并不要求是线性的。

第5章讨论了若干类型的参数线性(或能够转化成线性)但变量非线性的模型,并通过一些具体实例说明了什么时候以及如何使用这些模型。

有些时候,进入模型的解释变量是定性的,比如性别、颜色、宗教信仰等。

第6章讨论如何使这些变量“定量化”,以及在线性回归模型中如何考虑这类变量的影响。

整个第一部分都力求理论联系实际。虽然用户界面友好回归软件使得我们无须掌握太多的理论就可以对回归模型进行估计,但别忘了,“一知半解是危险的”。因此,即便理论很枯燥,但它们对于理解和解释回归结果是不可或缺的。此外,我们省略了所有的数学推导,这将会使理论变得简单一些。第2章 线性回归的基本思想:双变量模型

第1章曾提到,在对经济现象(例如需求法则)建立经济计量模型时,经济计量学家大量地使用了回归分析(regression analysis)这一统计技术,本章和下一章将通过最简单的线性回归模型——双变量模型,来介绍回归分析的基本思想。随后几章将讨论双变量模型的修正及其扩展。2.1 回归的含义

回归分析用于研究一个变量(称为被解释变量或应变量)与另一个或多个变量(称为解释变量或自变量)之间的关系。

我们或许对商品的需求量与该商品价格、消费者收入以及其他竞争性商品价格之间的关系感兴趣;或许对产品的销售量(比如,汽车)与广告宣传费之间的关系感兴趣;或许对国防开支与国内生产总值(GDP)之间的关系感兴趣。在上述各例中,相关的经济理论可能表明某个变量与其他一个或多个变量有关。例如,在第一个例子中,需求定律就提供了这样一个理论基础——产品的需求量依赖于该产品的价格以及上面提到的其他几个变量。

为了统一符号,从现在起,用Y代表应变量,X代表自变量或解释变量。如果有多个解释变量,则用适当的下标表示各个不同的X(例如X,X,X等)。123

时刻记住第1章中给出的警示:回归分析研究的是一个应变量与另一个或多个自变量之间的关系,但它并不一定表明存在因果关系;即它并不意味着自变量是因,应变量是果。如果两者之间存在因果关系,则一定建立在某个经济理论基础之上。例如,需求定律表明:当所有其他变量保持不变时,一种商品的需求量(反向)依赖于该商品的价格。这里,微观经济理论表明价格是因,需求量是果。总之,回归并不意味着存在因果关系,因果关系的判定或推断必须建立在经实践检验的相关理论基础之上。

回归分析有如下目的:(1)根据自变量的取值,估计应变量的均值。(2)检验(建立在经济理论基础之上的)假设。例如,对于需求函数,现在检验假设:需求的价格弹性为-1.0,即需求曲线具有单一价格弹性。在其他影响因素保持不变的情况下,如果商品的价格上涨1%,商品的需求量平均减少1%。(3)根据样本外自变量的取值,预测应变量的均值。例如,附录C讨论的S.A.T一例,可以根据学生数学成绩预测语文平均成绩(见表2-15)。(4)可同时进行上述各项分析。2.2 总体回归函数(PRF):假想一例

我们通过一个具体例子说明回归分析。在高中的最后两年,大部分美国学生都要参加S.A.T大学入学考试。测试包括三部分内容:逻辑(以前叫词汇部分)、数学和作文,每部分的满分都是800分。由于作文部分比较难计分,因此主要关注数学分数。假定我们感兴趣的是学生的家庭年收入与其数学分数有怎样的关系。令Y表示数学S.A.T分数,X代表家庭年收入。收入变量分为10组:(<10000美元),(10000~20000美元),(20000~30000美元),……,(80000~100000美元)和(>100000美元)。为简便起见,我们用每一组的中点代表该收入组别,最后一组用150000美元表示其中点。表2-1给出了由100个高中生组成的假想总体。

表2-1说明如下:一个家庭年收入5000美元的学生,其数学S.A.T是460分。另外9个家庭年收入5000美元的学生,加上第一个学生,他们的数学S.A.T平均得分是452分。一个家庭收入15000美元的学生,其数学S.A.T是480分。在这个收入水平上,数学S.A.T平均得分是475分。表中的其他数据可类似解释。

根据上面的数据做散点图(scattergram),见图2-1。图中,纵轴为家庭年收入(Y),横轴为学生的数学S.A.T分数(X)。对应于每[1]类收入水平,有若干个S.A.T分数(本例中是10个)。连线中的数据点是每组收入水平下的数学平均分,看上去数学分数呈现出总体向上的趋势,即收入越高,数学分数就越高。如果注意图中的圆圈点,这种趋势就更加明显。这些圆圈点称为条件均值(conditional mean)或条件期望值(conditional expected values)(详细讨论参见附录B)。由于假设这些数据代表的是数学分数的总体,因此条件均值的连线称为总体回归线(population regression line,PRL)。总体回归线给出了对应于自变量(家庭年收入)的每个取值相应的应变量(数学S.A.T分数)的均值。因此,如果家庭年收入为25000美元,则数学S.A.T的平均分为478分。如果家庭年收入为45000美元,则数学S.A.T的平均分为496分。简言之,总体回归线表明了Y(应变量)的均值与每个X(自变量)的变动关系。图 2-1 家庭年收入与数学S.A.T分数

由于图2-1的总体回归线近似线性,因此可以表示成如下函数形式:

这是直线的数学表达式。在式(2-1)中,E(Y|X)表示与给定iX值相对应的Y的均值。下标i代表第i个子总体。因而,在表2-1中,E(Y|X=5000)=452,即在第1个子总体中,Y的期望值或均值为452。i

表2-1的最后一列给出了Y的条件均值。需要指出的是,E(Y|X)i是X的函数(本例中是线性函数)。这意味着Y依赖于X,更专业地称i为Y对X的回归,即给定X条件下,Y分布的均值。换句话说,总体回归线穿过Y的条件期望值。式(2-1)是总体回归线的数学表达式,称为总体回归函数(population regression function,PRF)。本例中的总体回归函数是线性的(2.6节将讨论线性更准确的含义)。

在式(2-1)中,B、B称为参数(parameters),也称为回归系12数(regression coefficients)。B称为截距(intercept),B称为斜率12(slope)。斜率系数度量了X每变动一单位,Y(条件)均值的变化率。例如,如果斜率系数为0.001,则表明家庭年收入每增加1美元,Y的(条件)均值增加0.001分,考虑到量纲的问题,单位用千美元表述更容易理解,即家庭年收入每增加1千美元,预期数学S.A.T分数平均提高1分。B是当X为0时Y的(条件)均值,即表明家庭年收入为0时,1数学S.A.T的平均分。在随后的章节中还将进一步解释截距的意义。

如何求斜率和截距的估计值(或数值)呢?我们将在2.8节回答这个问题。

在继续新内容之前,首先对一个术语做出说明。第1章曾指出:回归分析关注的是在给定自变量取值条件下应变量的变化。因此,严格地说,回归分析是条件回归分析(conditional regression analysis)。[2]所以,无须每时每刻都加上“条件”二字。表达式E(Y|X)可以i简写为E(Y),但需要明确后者是前者的简略写法。当然,在容易混淆的地方,仍将沿用完整的符号。[1]为简便起见,这里仅仅假定对应于每个收入水平有10个数学分数。现实中,对应于每个X(收入),Y的取值可能很多,而且每一组观察值的个数也不一定相同。[2]条件回归分析并不意味着X是Y的原因,其目的在于观察变量Y的变化与变量X的关系。例如,当联邦储备银行改变利率时,它关注的是经济如何变化。2008年经济危机期间,联储几次降低利率以刺激经济复苏。决定住房需求的一个重要因素是贷款利率,因此潜在房主非常关注贷款利率的变动。当联储降低利率时,其他利率也随之调整。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载