应用计量经济学:EViews与SAS实例(北京大学经济学教材系列)(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-02 12:38:25

点击下载

作者:秦雪征

出版社:北京大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

应用计量经济学:EViews与SAS实例(北京大学经济学教材系列)

应用计量经济学:EViews与SAS实例(北京大学经济学教材系列)试读:

前言

近年来,随着我国社会经济的蓬勃发展,经济学学科现代化、科学化水平的不断提高,实证经济学研究在学术界和政策分析领域受到了广泛的重视,其作用也日益凸显。越来越多的财经院校学生和经济爱好者希望了解与掌握这些研究背后所使用的实证分析方法,“知其然,并知其所以然”,从而提升自身学习思考、分析解决现实经济问题的能力。这就引出了我们对一门独特的学科——应用计量经济学——的关注与研究。

应用计量经济学是一门交叉学科,它的产生和发展体现了人们利用现实数据检验经济学理论的诉求。因此,它以微观经济学、宏观经济学等学科为研究导向和理论支持,以数理计量经济学和统计学为方法依托,同时注重对实证数据分析规律和经验的总结。在近年来,随着应用计量经济学方法的不断突破,它不但被应用于经济学研究,同时在世界很多国家被广泛应用于社会学、历史学等人文社会科学研究以及医学、心理学等自然科学领域的研究。

作为经济学科的核心课程,计量经济学自20世纪70年代末被引入我国后,已经有了较长的教学历史,然而很多学生在学习过计量经济学之后却不知该如何应用,导致学习效果并不理想。总结起来,不外乎两个原因:一是计量经济学中有很多繁杂的公式,学生们往往花费大量时间学习公式的推导而没有理解公式背后的研究思想和分析方法,导致初学者在首次接触计量经济学时望而却步;二是由于教学时间有限,当学生们完成了对理论和公式的研读后,往往无法进行足够的实践操作,导致学到的计量经济学模型没有被及时地应用到实际研究和分析中。以上问题使很多学生在后续的理论学习或数据分析工作中不能学以致用,面对大数据时代的信息资源常常变得手足无措,虽然头脑里存储了各种各样的计量经济学模型和公式,却无法主动地调用出来,或不知该如何对模型进行合理选择与调整。

针对以上问题,本书的一大特点是突出计量经济学的“应用价值”,力争提高这门学科的工具性、可操作性和实用性。在各章内容里,本书主要做出了以下努力:第一,尽量减少对数学公式的依赖。本书在介绍计量经济学模型时,一般只列举与该模型有关且必要的数学表达式,而对于非必要的公式推导,我们则将其替换为简明易懂的文字叙述和解读。这样做是为了用更加平实的语言讲出模型背后的原理和思想,从而帮助初学者理解这些模型并学会在实际分析时加以使用。第二,在介绍完相关的计量经济学理论之后,每一章会用较大篇幅详细介绍1—2个计算机应用实例,以EViews和SAS两种常用计量经济分析软件为工具,向读者展示实证研究的具体步骤和计量经济模型的使用方法。希望这种“手把手”的展示方式能够帮助初学者体验实证研究,并尽快掌握在具体数据环境下对相关模型的应用和操作技巧。各章计算机实例的相关数据资料,读者可登陆北京大学出版社网站(http://www.pup.cn)获取,选择“下载专区”→“课件下载”→“经管”,搜索或查找本书书名并下载。

本书的结构基本按照专题的形式,由浅入深,逐步展开。我们从最简单的二元线性回归模型和普通最小二乘估计法开始,先后介绍了方程形式的选择技巧,假设检验的操作方法,对异方差、自相关、时间趋势和季节性等常见问题的处理,逐渐过渡到针对特殊数据结构的分析模型,如时间序列模型、混合截面数据模型、面板数据模型、二元选择及有限因变量模型等。最后,我们介绍了几种较为高级的计量经济学模型,如工具变量模型、联立方程模型等。在本书的使用中,由于各章节的内容相对独立,因此教师和学生可以根据教学安排或研究需要选择相关章节阅读使用。同时,本书也可以作为应用计量经济学的工具书,供读者在做研究或数据分析时对相关专题和模型进行查阅参考。

本书适合大专院校财经类本科高年级学生或硕士研究生使用。由于本书在介绍计量经济学模型时重在对模型原理和应用方法的叙述,而尽量简化模型的推导过程,因此学生在阅读本书之前应该具有一定的数理统计学基础,从而对书中涉及的统计学概念具有直观和准确的理解。另外,由于本书介绍的应用计量经济学分析工具同样也适用于很多其他的社会科学研究领域,因此本书也可以作为非财经类专业学生和其他对实证研究感兴趣的爱好者使用。

本书的主要内容来源于笔者在多年讲授计量经济学过程中的讲义和课件,同时参考了国内外出版的若干计量经济学经典教材。同时,在本书写作过程中,有多位在北京大学选修“应用计量经济学”课程的学生在资料搜集、计算机程序整理和书稿校阅等方面提供了帮助,作者在此对他们一并致以诚挚的谢意。他们是刘一鸣、续田增、胡博、招杰、胡子寒、沈芳瑶、胡修修、林智贤、王皓齐、王天宇、庄晨、栾国阳。

当然,对计量经济学的学习不能止于书本,而应该“且行且悟”,在大量研究实践中不断摸索和提高。希望本书作为一本融合理论与应用的参考教材,能够帮助那些对实证经济研究感兴趣的学生尽快开始这一探索过程,在系统了解计量经济学基本理论和模型的基础上,不断提高自身对客观经济现象和规律的定量分析能力。也祝愿以应用计量经济学为主要分析工具的实证经济学研究在我国的学术界和政策研究界能有更加长远和深入的发展。

由于作者水平有限,书中错误与疏漏之处在所难免,敬请广大专家、读者批评指正。秦雪征2016年3月于北京大学第一章计量经济学导论本章概要

本章对计量经济学涵盖的主要内容进行了概括,包括计量经济学的研究对象、研究内容,计量经济学与其他学科的关系,计量经济学的研究方法、研究步骤和主要数据类型,以及计量经济分析的常用软件等。学习目标

1. 理解计量经济学的研究内容

2. 理解计量经济学与其他学科的关系

3. 了解计量经济研究的步骤

4. 了解计量经济学涉及的主要数据类型

5. 了解一些常用的计量经济分析软件第一节 引言

对于很多人来说,计量经济学似乎是一座高不可攀的山峰,繁杂的数学公式让人望而生畏。而对另一些人来说,计量经济学又仿佛是高深莫测的“炼金术”,科研数据在模型中“摇身一变”后的拟合结论着实令人眼前一亮。其实,计量经济学并没有那么可怕或神秘,它的根本目的是利用科学的方法(主要是数学和统计学的工具)去解决现实的经济问题,让我们得以更清晰地了解经济现象背后的内在规律。例如,我们可以思考下面这个经济学问题:随着我国人口素质的提高和人力资本的积累,劳动者在工作中得到的预期收入也不断增加。这时,经济学家们开始关注“教育的回报率”(Return to Schooling),希望通过某项全国性的收入调查来探究劳动者所受正规教育程度对其个人收入的量化影响。一个看似合理的测算方案是直接对受教育程度较高和较低的两类人群的不同收入水平进行比较。然而,这种直接比较的方法至少存在两种缺陷:第一,除教育水平以外,诸如工作经验、政治面貌等其他因素同样会对个人的工资收入产生影响,忽略这些因素将导致对教育回报率的估计产生偏差;第二,预期收入高的人群可能会主动选择接受更好的教育,因此两组人群的收入差异可能是由组内个体的性格和能力差异导致的,不能够完全用教育程度来解释。以上两种缺陷都会显著影响我们测算教育回报率的准确度,使看似合理的直接比较无法得到正确的结果。要解决这些问题,我们起初似乎无从下手,然而通过学习计量经济学,我们将会知道如何构建合理的模型来科学、规范地评价教育回报率。类似地,我们还可以通过计量经济学的方法来剖析现实中的其他社会经济问题或对相关的经济学理论做出检验。第二节 什么是计量经济学一、计量经济学的定义

计量经济学(Econometrics)是依据经济理论,使用数学和统计推断等工具,用观测数据对现实状况(尤其是经济和商务活动)进行实证研究,测度和检验经济变量之间经验关系的学科。简单来说,计量经济学可以概括为四个字:“检验”和“预测”。“检验”指的是通过数据的挖掘分析来寻找当前状态下各变量之间的关系,例如前文中提到的教育程度和收入水平之间的关系;“预测”指的是通过对现有数据归纳模型来估计未来经济状况和指标,最常见的就是对诸如利率、通货膨胀率和国内生产总值等重要宏观经济变量的预测。二、计量经济学的学科特点

计量经济学的起源可以追溯到20世纪30年代。1930年12月,首届诺贝尔经济学奖得主弗里希(Frisch)、丁伯根(Tinbergen)以及著名宏观经济学家费雪(Fischer)等在美国克里夫兰成立计量经济学会。并从1933年起,定期出版《计量经济学》杂志。弗里希在该杂志发刊词中明确提出计量经济学的范围和方法,指出计量经济学是经济理论、数学和统计学的综合,但它又不等同于这三门学科中的任何一个。

从本质上说,经济学理论所提出的命题和假说,多以定性描述为主,但计量经济学会对定量研究更感兴趣。比如,微观经济学中有一个著名的需求定律(Law of Demand):商品的价格与其需求量呈反向变动关系。但是,该理论本身却无法定量地测度这两个变量之间的相互关系,而计量经济学家的任务就是给出这样的数值估计。计量经济学通过对历史经济数据的分析,测算当商品的价格发生某一变动时,其需求量会增加或减少多少。比如,在研究或试验中发现商品价格每上涨1%,则引起该商品需求量下降2%,那么我们不仅验证了需求定律,还得到了价格和需求量这两个变量之间关系的定量估计值,即需求弹性(Demand Elasticity)。计量经济学的初衷就是依据观测或试验,对大多数经济理论给出假设检验或经验解释。

数理经济学是将数学与经济学紧密结合在一起的产物。虽然数理经济学同样关注变量之间的定量关系,但数理经济学主要是用数学形式或方程描述经济理论,而不考虑对经济理论的测度和经验验证,而后者正是计量经济学主要关注的对象。

统计学是关于如何收集、整理、分析数据的科学。经济学与统计学结合形成了经济统计学,这门学科主要涉及经济数据的收集、处理、绘图、制表。经济统计学家的工作是收集GDP、失业、就业、价格等数据,而不是利用这些数据来验证经济理论。但这些数据恰恰是计量经济分析的原始数据(Raw Data)。

大多数经济数据的生成并非通过可控试验(Controlled Experiment),这是经济数据所具有的独特性质。例如,公共和私人机构收集到的消费、收入、投资、储蓄、价格等数据从本质上说都是非实验性的。在这种情况下,我们往往只能把这些数据看成是给定的,或用计量经济学的术语来讲这些数据是外生的(Exogenous),这就使很多常规的数理统计学模型无法得到正确的结论(例如引言中给出的教育回报率测算问题)。同时,这些原始数据往往有这样那样的问题,比如存在测量误差(Measurement Error)或变量遗漏(Variable Omission)。对于这样的数据,直接运用数量统计模型往往效果不好,而计量经济学所建立的模型分析方法则可以较为科学合理地解决这些问题。

为了更好地说明计量经济学的学科特点,下面我们以对商品市场需求的研究为例,试图说明计量经济学的研究内容及其与其他学科(尤其是数理经济学)的异同。

在研究某商品市场需求的时候,经济理论假定该商品的需求量取决于它的价格、其他有关商品(如替代品或互补品)的价格、消费者的收入以及消费偏好。基于以上假定,我们可以很明确地写出需求量Q与其他变量之间的关系。数理经济学往往用线性需求函数的形式来表示上述四种因素对商品需求量的影响:

Q=b0+b1P1+b2P2+b3P3+b4Y+b5T(1.1)

其中,

Q——某商品的需求量;P1——该商品的价格;P2,P3——与该商品有关的其他商品的综合价格;Y——消费者的收入;T——消费者的偏好函数。

在上述函数关系中,b0、b1、b2、b3、b4、b5为需求函数中的待定参数,它们表示在其他变量不变时第j个(j=0,…,5)变量每变化一个单位引起的需求量变化的幅度。

上述模型表明,只有方程右边的四个因素中某些发生变化时,需求量Q才随之变化,除此之外,再没有其他因素影响需求量了。然而实际生活中的真实情况绝非如此,人们的社会环境、心理变化、所处地理位置,甚至天气等偶然因素,都可能会对需求量产生影响。虽然不是主要影响,但也必须加以考虑。为此,计量经济学构建如下模型:

Q=b0+b1P1+b2P2+b3P3+b4Y+b5T+u(1.2)

在模型(1.2)中,u是一个随机变量,或称为随机误差项(Random Error Term),其作用是反映数理经济学模型中未纳入考虑的非主要因素的影响,从而将数理经济学所描述的确定性关系转化为计量经济学中的随机关系(Stochastic Relationship)。第三节 计量经济研究的步骤一、计量经济模型与实证分析

与理论经济学不同,计量经济学更注重对真实世界内在运行规律的检验,即利用现实数据来检验某个经济理论或定量估计某种经济关系,这就是实证分析(Empirical Analysis)。在多数情况下,特别是涉及对经济理论的检验时,我们需要构造一个规范的经济学模型,这些模型一般由描述各种关系的数理方程构成。例如,在微观经济学中,个人在预算约束下的消费决策便可由一些数理模型来描述。这些模型背后的基本假设是个体追求效用最大化,即个人在资源约束条件下做出最大化其福利的选择。这一假定为我们构建一些简便的经济模型以及做出一些明确的预测提供了强有力的框架。在此框架下研究消费决策时,我们通过效用最大化推导出一系列需求方程。在每个需求方程中,每种商品的需求量取决于该商品的价格、其替代品和互补品的价格、消费者的收入和与消费者个人喜恶相关的偏好特征。这些方程便构成了对消费需求进行计量经济分析的基础。

经济学家也会使用诸如效用最大化框架之类的基本分析工具来解释那些初看起来具有非经济性质的行为。例如,加里·贝克尔(Garry Becker)在1988年的论文中提出了著名的理性成瘾模型,用以研究诸如吸烟这样的看似非理性的行为。虽然吸烟本身作为一种消费可以直接带来效用,但除了货币的支出外,吸烟还存在其他成本。吸烟的非货币成本包括对自身和家人健康的影响等;此外,由于吸烟对健康有害,与戒烟者相比,吸烟者还存在更高的死亡风险。因此,从贝克尔的视角来看,决定是否吸烟的决策是资源配置的方式之一,并且这种决策是在当事人充分考虑了各种可选择行为的成本和收益后决定的。在一般的假定之下,我们可以把吸烟者的香烟消费数量描述成一个受各种因素影响的函数。这个方程可以表示为:

smo=f(inc,cigpri,othpri,fresel,frefam,age)(1.3)

其中,

smo——香烟消费数量;inc——吸烟者收入;cigpri——香烟价格;othpri——其他消费品价格;fresel——吸烟者自身患病概率;frefam——吸烟者家人患病概率;age——吸烟者年龄。

虽然通常还有其他因素会影响个人是否吸烟的决策,但上述因素在规范的经济分析看来很可能具有较强的代表性。如经济理论的惯常做法那样,我们未对式(1.3)中的函数f(·)进行任何设定。这个函数隐含了吸烟者的潜在效用偏好,其函数具体形式可能无人知晓。尽管如此,我们还是可以用经济理论来预测每个变量对香烟消费数量可能具有的影响。这正是对个人吸烟行为进行计量经济学分析的基础。

虽然规范的经济建模有时是经验分析的起点,但更普遍的情况是,依据实际数据所进行的经验分析往往并不是那么规范,甚至完全依赖直觉。例如,方程(1.3)中所出现的吸烟行为的决定因素从常识来看也是合情合理的;其函数关系的假定也许并不需要依据效用最大化的理论推导,而是通过直觉而得到。我们承认尽管在某些情况下,直觉建模具有其独特的优点和便利。但是我们同样强调,严格的计量经济分析和模型构建应该始终建立在规范的经济理论推导的基础之上,这不仅仅是因为经济学理论能够为模型的构造提供直觉所看不到的洞见,同时也是因为经济学理论能够为实证分析的结果提供最有力的理论解释。二、计量模型与经济模型

在设定一个经济模型之后,我们需要把它变为计量模型,所以有必要先了解一下计量模型和经济模型之间的关系。与传统经济分析不同,在进行计量经济分析之前,我们必须明确f(·)的形式,并且要对不能合理观测到的变量做相应的处理。比如,在上例中我们考虑一个人吸烟带来的患病概率时,原则上这个概率是清楚界定的,但对一个特定的人来说,这个概率是很难观测到的,甚至是无从知晓的。虽然对某个给定的个人,诸如其吸烟带来的患病概率之类的变量并不能切实得到,但至少我们能去当地医院找到有关呼吸道疾病的统计数据,从而推导出一个近似的替代变量来衡量吸烟的患病概率。

通过在吸烟行为和可能的影响因素之间设定一个特定的计量经济模型,我们就解决了经济模型中其函数形式的模糊性:

smo=β0+β1inc+β2cigpri+β3othpri+β4fresel+β5frefam+β6age+u(1.4)

其中,smo为香烟消费的数量,inc为吸烟者的收入,cigpri为香烟的价格,othpri为其他消费品的价格,fresel为吸烟者自身患病的概率(用所有吸烟者在当地医院的呼吸道疾病就诊频率替代),frefam为吸烟者家人患病的概率(用所有吸烟者家人在当地医院的呼吸道疾病就诊频率替代),age为吸烟者年龄。对这些变量的选择,既以经济理论为依据,又考虑到了数据的可获得性。u这一项则包括了不可观测的因素,诸如先天的健康禀赋、家庭环境等,以及在度量吸烟消费数量时的测量误差。虽然我们也可以在模型中加入家庭背景变量,如兄弟姐妹的个数、父母所受教育等,但我们仍不能完全消除所有其他遗漏变量所导致的影响,因此u依然存在。常数β0,β1,…,β6都是这个计量模型中的待估参数,它们描述了各个吸烟决定因素和吸烟行为之间的关系和相关强度。这样,我们就构建了一个可以较好模拟当事人吸烟行为决策的一个计量模型。

现在我们来考虑一个实际问题:假设某公司为提升员工的电脑应用能力而对其雇员进行了培训。作为一位劳动经济学家,你希望对这项在职培训项目的效果进行评估,即估算参加培训所带来的工资提升幅度。在评估中你注意到所有培训都是在非工作时间进行,并且员工自愿选择是否参加该培训。在此情形下,我们几乎不需要什么规范的经济理论就可以通过常识认识到,所受教育、工作经历和培训等因素会影响工人的生产力。此外,经济学家还清楚地知道,工人的工资与其生产力相称。这种简单的推理使我们得到如下模型:

wage=f(educ,exper,training)(1.5)

其中,wage为小时工资率,eudc为接受正规教育的年限,exper为工作年数,training为花在工作培训上的周数。虽然存在其他因素可能影响工资率,但(1.5)式涵盖了这个问题的所有核心因素。基于(1.5)式,我们可以构建一个完整的计量经济模型:

wage=β0+β1educ+β2exper+β3training+u(1.6)

其中u是随机误差项,它包含的因素有天生能力、教育质量、家庭背景等一些不可观测的工资决定因素。如果专门考虑工作培训的影响,那β3就是我们所关注的参数。

一旦设定了一个类似于(1.4)式或(1.6)式的计量模型,我们所关心的各种假设便可用未知参数的估计值来表述。比如,在方程(1.6)中,我们可以重点关注在职培训training对工资wage是否有显著影响。在该计量模型中,这相当于构建一个待检验的参数假设β3=0。三、计量经济研究的基本步骤

在搜集到各变量的相关数据之后,我们便可以用计量经济方法来估计模型中的参数,并规范、科学地检验所关心的假设。

当然,我们在应用计量经济学的方法进行实证研究时需要遵循一定的范式,也就是以下概括的计量经济研究的基本步骤,在本书中我们会不断演示和强调这些步骤。(1)确定要研究的问题。这个问题可能是来自于长时间对于某一现象的关注,也有可能来自于你对某一问题突发奇想的好奇。哈尔·范里安(Hal Varian)教授曾经建议学生从学术期刊之外寻找灵感,可能就在报纸或者杂志上面,甚至在日常生活的琐事中。(2)运用经济学的理论对这一问题进行思考。例如,在这一问题中涉及了哪些变量,它们之间可能的关系是什么。在确定问题之后,研究者需要根据自己的研究目的建立经济模型,并罗列出要解决或待验证的问题及假设。(3)获取样本数据。根据研究需要及数据的可得性,可以从诸如政府统计部门、学术机构、专业数据搜集机构等获取所需要的数据;当然,如果条件允许,也可以直接根据研究需要自己设计问卷,收集第一手的数据。(4)根据经济模型来选择计量模型。基于对研究问题的理论思考,我们需要选择合适的函数形式构建可以用于回归估计的计量模型,并且对误差项的性质进行合理的假设。(5)在统计软件的帮助下对参数进行估计,并根据研究需要进行预测或假设检验。(6)对计量模型的主要假设或函数形式进行稳健性检验,从而诊断计量分析的合理性,进而判断所得到的结论是否稳健。(7)通过参数估计以及假设检验的结果,对所研究问题的内在机理和逻辑进行判断,讲清楚模型背后的故事。例如,解释两个变量因果关系的作用机制,或者利用模型估计值对相关变量的未来走势进行预测。

另外,此处我们需要强调的是,虽然包括本书在内的绝大多数计量经济学教材主要讲授的是进行步骤4—7的方法,但一个实证研究的好坏往往在更大程度上取决于研究主题的选择以及经济与计量模型的确立,即步骤1—3。而研究者对于步骤1—3的掌握(即如何选择有价值的研究题目、如何建立合理的经济及计量模型、如何获取合适的研究数据)却往往不能通过教材或课堂讲授而实现,它需要我们在大量的研究实践中不断摸索。第四节 计量经济学涉及的主要数据类型

数据是实证分析中必不可少的要素。经济数据的类型多种多样。尽管有些计量方法可以适用于不同的数据类型,但我们仍有必要对一些有代表性的数据及其特殊性质进行阐释,从而更好地加以利用。一般说来,用于实证分析的数据可分为以下四类:(1)时间序列数据;(2)横截面数据;(3)混合截面数据;(4)面板数据。一、时间序列数据

时间序列数据(Time Series Data)是指按时间跨度收集到的数据。比如不同时间点的GDP、失业率、货币供给、政府赤字等,这些数据是按照一定的时间间隔收集得到的。这些数据可能是定量的,例如价格、收入、货币供给、股票每天收盘时的价格等;也可能是定性的,例如男或女、失业或就业、少数民族或非少数民族等。表1-1给出了关于中国GDP及工业增加值的两组时间序列数据。表1-1 2001—2013年中国GDP及工业增加值单位:亿元资料来源:国家统计局2005年和2013年发布的统计公报。二、横截面数据

横截面数据(Cross-sectional Data)是不同观测样本的一个或多个变量在同一时间点上的数据集合。例如,某一天收盘时所有上市股票的价格数据、国家统计局在2010年收集得到的第六次全国人口普查数据等。作为举例,表1-2给出了在2000年中国部分省市男女人数及性别比的横截面数据。表1-2 2000年中国部分省市男女人数及性别比例资料来源:国家统计局第五次人口普查数据(2000)。三、混合截面数据

混合截面数据(Pooled Cross-sectional Data)既包括了时间序列因素又具有横截面数据的特征,它是在不同时间点进行独立取样所获得的数据。例如,假设对某地的家庭进行了两次横截面数据的调查,一次在2000年,一次在2005年。在2000年,对家庭的一个随机样本调查了工资、储蓄、家庭结构等变量。到了2005年,用同样的调查问题又对该地区一个新的随机家庭抽样样本进行调查,将这两年的数据合并在一起便得到一个混合截面数据。由于两次调查都是独立随机抽样的,因此两次调查的样本不会完全相同(某些家庭可能碰巧在两次调查中都被选中,但这种重复出现的情况纯属偶然),这一点使得混合截面数据区别于后面介绍的面板数据。与普通横截面数据相比,使用混合截面数据的最大好处是扩大了研究的样本容量。同时,如果在两次调查之间发生了某项政策改革,那么使用混合截面数据也可以使我们更好地测度改革所产生的影响。作为例证,表1-3给出了由2000年和2009年两年截面数据所合并生成的混合截面数据。表1-3 2000年和2009年中国部分省份GDP混合截面数据单位:亿元资料来源:国家统计局2005年和2009年发布的统计年报。四、面板数据

面板数据(Panel Data)是一种特殊类型的合并数据,虽然它反映的也是在不同时点的样本信息,但与混合截面数据相比,面板数据是对同一个观测个体在不同时点追踪得到的信息。以上述对某地的家庭抽样调查为例,面板数据所涵盖的样本必须反映的是同一组家庭在不同年份中的情况。由于面板数据的这种性质,它非常适合于研究不同个体随时间变化或政策变革所产生的行为变化,利用相应的面板数据模型,我们可以通过追踪个体在不同时点的特征来剥离其不可观测的异质性,从而更加准确地测度某一政策所导致的净影响。作为举例,表1-4给出了2005年、2006年以及2007年中国、英国及美国的GDP面板数据。表1-4 中国、英国、美国的三年GDP比较单位:美元资料来源:国家统计局国际统计数据(2009)。五、常用数据集

一些计量经济学的初学者在掌握了计量模型后往往迫不及待地希望将模型应用于实际数据,但他们在尝试获取数据时却常常感到困惑,不知道从哪里能得到想要的数据。为了解决这一问题,这里简要介绍一些国内外实证研究中比较常用的数据集。当然,随着现代社会信息技术的发展和大量数据收集工作的开展,我们在实证研究中可以应用的数据远远不止于此,但由于这些数据大多可以免费申请获得,并且其权威性已经得到很多研究的论证,因此对于初学者而言,它们不失为上佳之选。

首先,让我们了解一些常用的针对国内情况的数据:(1)中国家庭动态追踪调查(CFPS)。它是由北京大学中国社会科学调查中心(ISSS)实施的一项旨在通过跟踪搜集个体、家庭、社区三个层次的信息,反映中国社会经济、人口、教育和健康的变迁情况的数据。其调查目的主要是为社会科学学术研究和政策决策提供参考。其中2008年和2009年两年在北京、上海、广东三地进行了试调查,2010年进行了第一次全国调查。经2010年基线调查界定出来的所有基线家庭成员及其今后的血缘/领养子女将作为CFPS的基因成员,成为永久追踪对象。CFPS调查问卷共有社区问卷、家庭问卷、成人问卷和少儿问卷四种主体问卷类型,并在此基础上不断发展出针对不同性质家庭成员的长问卷、短问卷、代答问卷、电话访谈问卷等多种问卷类型。(2)中国健康与养老追踪调查(CHARLS)。它是由北京大学国家发展研究院中国经济研究中心主持的数据收集项目,在我国每两年追踪调查一次,目的是采集能够代表年龄在45岁以上(包括45岁)的中国居民的情况。2008年秋季已经在我国甘肃、浙江两省进行了预调查,2011年进行了第一次全国调查。CHARLS抽样以保证样本的无偏性和代表性为宗旨,通过四个阶段,分别在县(区)-村(居)-家户-个人层面上进行抽样。具体而言,在县(区)-村(居)两级抽样中,CHARLS均采用按人口规模比例的概率抽样(简称为PPS抽样)。在县级抽样阶段,按照PPS方法,以每个区县2009年人口数量为基础,使用地区、城乡和GDP为分层指标,直接从全国30个省级行政单位(不包括西藏自治区、台湾省以及香港和澳门特别行政区)范围内随机抽取150个区县;在村级抽样阶段,按照PPS方法,以每个村或社区2009年常住人口为基础,从上述150个区县中各随机抽取3个村或社区,最后得到450个村/社区。CHARLS问卷内容包括:个人基本信息、家庭结构、经济收支状况、健康状况(含实际体格测量)、医疗服务利用和医疗保险以及社区基本情况等。(3)中国健康与营养调查(CHNS)。它是由中国疾病预防与控制中心、美国北卡罗来纳大学以及中国预防科学研究院合作主持的数据收集项目。该调查始于1989年,以后又分别在1991年、1993年、1997年、2002年、2006年、2009年及2011年进行。该调查在全国随机抽取辽宁、黑龙江、山东、江苏、河南、湖北、湖南、广西、贵州等9个省份中的城乡社区及家庭,调查内容包括家庭和个人的基本特征、收入和支出状况、健康情况、营养摄入、医疗保险及使用等情况,以及社区基础设施、公共服务等环境特征。(4)中国家庭收入调查(CHIP)。它是由中国社会科学院与国家统计局合作主持的数据收集项目。该调查始于1988年,目前共有1988年、1995年、2002年和2007年等四个截面数据。调查内容包括城市住户问卷、农村住户问卷和城市农民工问卷。调查信息由三个部分组成:城镇住户调查、农村住户调查和流动人口调查,详细记录了家庭收入与消费信息。(5)万得(Wind)数据库。该数据库以宏观经济指标和金融市场信息为主体,从1990年开始,内容涵盖股票、基金、债券、外汇、保险、期货、金融衍生品等领域,收集了所有金融品种完整的数据(包括上市前与上市后)。同时,它涵盖了非常细致的财经新闻以及实时的股票信息。(6)中经网数据库。它是由国家信息中心中经网凭借与国家发改委、国家统计局、海关总署及各行业主管部门的合作,提供的一个综合、有序的经济统计数据库群。其内容涵盖宏观经济、行业经济、区域经济以及世界经济等各领域,包括六个子库,分别是宏观月度库、行业月度库、海关月度库、综合年度库、城市年度库以及世界经济统计数据库。

另外,以下是国际上一些常用的数据集:(1)当前人口调查(CPS)是由美国人口普查局主持的反映美国家庭基本信息的月度调查数据。它提供了美国劳动力市场就业、失业情况;工作时间;收入支出以及相应的人口统计信息。(2)长期追踪调查(NLS)是旨在收集美国劳动人口长期劳动力市场表现及其他重要生活决策信息的一系列调查,到目前为止已经进行了超过40年。对于经济学家、社会学家以及其他研究人员,长期追踪调查具有非常重要的意义。(3)医疗支出面板调查(MEPS)是针对美国家庭、个人、医疗服务提供者以及企业雇主的一系列大规模调查。它提供了关于医疗保健支出、医疗服务利用以及医疗保险覆盖等与医疗和健康有关的全面信息。(4)资产价格研究数据库(CRSP)是由美国芝加哥大学商学院资产价格研究中心收集维护的、旨在提供与美国证券交易相关的基础与衍生金融产品数据。它主要包括美国股票数据库、美国资产组合配置数据库、美国财政数据库以及美国共同基金数据库,等等。(5)宾夕法尼亚大学世界表(The Penn World Table,PWT)由其前身联合国国际比较项目(International Comparison Programme,ICP)发展而来。数据库早期由Irving Kravis、Robert Summers与Alan Heston等知名学者创建与维护。1991年首次用于Summer和Heston的论文“宾大世界表:一个扩展的国际比较,1950—1988年”[1]。其公开版本于1993年问世,此后不断更新与修正。当前最新的是PWT 8.0版本,由宾夕法尼亚大学出版,由收入与物价国际比较中心发布。PWT 8.0数据库涵盖了1950—2011年167个国家或地区的30个涉及国民经济核算与贸易活动的统计数据。第五节 计量经济学的主要研究方法

计量经济学的估计方法主要可以分为参数估计(Parametric Estimation)、半参数估计(Semi-parametric Estimation)以及非参数估计(Nonparametric Estimation)三种类型。

参数估计以样本统计量作为未知总体参数的估计量,通过对样本单位的实际观察取得样本数据,并计算样本统计量的取值作为被估计参数的估计值。参数估计中变量之间的关系是以确定的函数形式表示的,同时对随机误差项的分布特征进行了具体的假定,这是参数估计区别于非参数估计及半参数估计的主要特点。例如,一个参数估计的回归方程可能是:

y=b0+b1x1+b2x2+u,u~(0,σ2)(1.7)

常用的参数估计方法有最小二乘法(OLS)和极大似然估计(MLE)。在接下来的章节中,我们将对这两种估计方法进行具体的讨论。

在参数估计中,研究者需要对模型的数学形式及随机误差项的分布做出假定,这使得参数估计的准确性在很大程度上取决于该假定的正确性。这种强假定的影响往往使很多研究者心存疑虑。含正态分布干扰项的线性回归模型便是一个典型的例子。

非参数估计法基本上放弃了有关函数形式和随机误差项分布的固定假定,因此比参数估计更加灵活并贴近现实。但由于其有限的函数结构(非参数估计受计算维度的影响,一般无法刻画多个变量之间的关系),非参数设定很少能对多变量之间的关系提供十分精确的推断。一个常用的非参数估计的例子是对x与y变量之间未知函数关系的核回归(Kernel Regression)估计,即E(y|x)=F(x),其中F(x)函数形式未知。

在核回归估计中,我们用

来估计F(x)。

其中代表对F(x)函数形式的估计,wi为加权权重,其取值受x的影响。因此,核回归的本质是将观测点周围的样本取值进行加权平均从而得到估计值,它有很强的样本依赖性,即对于不同样本所做的核回归可能得到对x与y之间截然不同的关系估计,这是该方法与参数估计方法的重要区别。

半参数估计介于参数估计与非参数估计之间,同时兼具二者的特点。现在许多不同的半参数估计方法正在不断地被研发出来。下面是两个半参数模型的例子。

部分线性模型(Partial Linear Model):

y=b0+b1x1+g(x2)+u

其中g(·)是未知函数。

指数模型[2](Index Model):

y=g(b0+b1x1+b2x2)+u

其中g(·)是未知函数。第六节 计量经济分析软件

在建立计量经济模型过程中需要处理大量的数据信息,所以随着计量经济模型的广泛应用和计算机技术的快速发展,专业软件商开发出了许多优秀的计量经济专用软件和统计分析软件,使得计量经济学的建模和分析过程变得日趋简洁和方便。(1)EViews软件是美国QMS公司研制的计量经济学专用软件。该软件将计量经济分析的基本元素(如序列、数据、矩阵等)和分析结果(如方程、图形、系统等)都视为“对象”,每个对象都有自己的窗口,通过对各个对象的观察(view),来分析对象的属性和特征,解释不同对象之间的关系和变化规律。EViews软件提供了三种操作方式:菜单驱动(利用系统提供的命令菜单完成有关操作),输入命令(在命令窗口中直接键入有关命令和相应参数),运行程序(将一系列命令编制成程序调用执行)。EViews软件还在各个对象窗口设置了与该对象有关的常用命令按钮。多种操作方式使得EViews软件的操作非常方便灵活。另外,由于EViews软件是由计量经济学家研制并专门用于计量经济分析的专用软件,因此随着软件的不断升级更新,EViews可以及时反映计量经济学的最新研究成果和发展情况。(2)SAS软件是美国SAS软件研究所研制开发的大型集成软件系统。经过几十年的发展,SAS软件现已成为国际上知名度最高的统计分析软件之一,具有完备的数据访问、数据管理、数据展示、数据分析以及应用开发等功能,被广泛地应用于社会科学和自然科学的各个领域。国际学术界有条不成文的规定:凡是用SAS统计分析的结果,在国际学术交流中可以不必说明其算法,由此可见其权威性与信誉度。SAS软件系统由多个应用模块组成,其中包括时间序列分析等与计量经济研究密切相关的模块。由于SAS系统具有强大的统计分析功能,与多种统计软件都有数据接口,并且能够根据用户需要编制程序执行特殊的数据处理过程,因此也得到众多经济学家的喜爱,并广泛应用于计量经济分析。(3)STATA软件是一款小巧但功能丰富的统计分析软件,最初由美国计算机资源中心研制,现在是STATA公司的产品。整个系统的大小只有50M左右(12.0版),在分析过程中将数据全部读入内存,运算速度很快。软件操作方式主要是程序的编辑和运行,也包括菜单驱动及直接输入命令等方式。由于其命令格式简洁规范、形式灵活、易学易懂,并且用户可以根据统计分析的需要采用各种编程技巧以达到分析目的,因此该软件现在越来越受到统计及计量经济分析人员的重视和欢迎。本章总结

本章介绍了计量经济学的定义、学科特点、研究步骤和数据分类。计量经济学是连接经济学理论与实践的桥梁。它建立在经济模型基础之上,结合统计学的研究方法,通过对收集到的数据进行分析处理,得到变量间的统计关系,进而实现经济预测或验证经济结论。要学好计量经济学,同学们需要理解计量经济学的特点,熟练掌握处理不同类型数据的计量模型,并学会使用计量经济常用软件对实际问题进行建模分析。思考与练习

1. 计量经济学是怎样的一门学科?它与经济学、统计学和数学的关系是什么?

2. 计量经济模型一般由哪些要素组成?

3. 计量经济学中所用的数据是怎样进行分类的?每种数据的应用需要注意哪些问题?

4. 计量经济模型的建立与应用一般需要进行哪些工作步骤?

[1]The Penn World Table(Mark 5):An Expended Set of International Comparisons,1950—1988. Quarterly Journal of Economics,May 1991,pp.327—368.

[2]不含常数项的指数模型。第二章EViews与SAS软件简介本章概要

本章简要介绍了两个常用的计量经济分析软件——EViews和SAS。这两个软件都可以对较为复杂的数据进行管理,并实现计量经济分析、回归及预测等功能。在第一节中,我们将介绍EViews软件的界面、导入数据的方法以及数据描述、简单数据转换等操作。在第二节中,我们将介绍SAS软件的界面、常用操作以及数据处理的步骤。在此过程中,我们将结合具体案例进行讲解。学习目标

1. 掌握EViews软件和SAS软件的基本界面和操作方法

2. 能够使用EViews软件和SAS软件进行数据处理和简单的回归分析第一节 EViews简介“EViews”是Econometrics Views的缩写,它是一款采用计量经济学方法与技术,对社会经济关系与经济活动的数量规律进行“观察”的计量经济分析软件。EViews由美国QMS公司(Quantitative Micro Software Co.)开发,运行于Windows环境下,其前身是Micro TSP。相比Micro TSP,EViews引入了全新的面向对象的操作概念,通过相关操作实现各种计量分析功能,界面的设计也更加友好。

不同于其他的计量分析软件,EViews有多种工作方式,分别为:① 菜单按钮导向方式;② 简单命令方式;③ 命令参数方式(即方式①与方式②相结合);④ 程序运行方式(采用EViews命令编制程序来操作)。其中第一种方式是最受初学者欢迎的方式,也是使用起来最简易便捷的方式。相比其他以程序运行为主的计量分析软件,EViews是更适合计量经济学初学者进行数据处理的软件。

从功能和应用领域来看,EViews软件拥有数据处理、作图、统计分析、建模分析(包括线性、非线性单方程模型,联立方程模型,时间序列模型,动态回归模型,面板数据模型,离散选择模型等多种估计方法)、预测和模拟等六大类功能。它的应用领域也很广泛。在科学数据分析与评价、金融分析、宏观经济预测、销售预测和成本分析等方面均得到广泛使用。

自1981年起,QMS公司分别推出了EViews软件的1.0、2.0、4.1、5.0、6.0等版本,本书选择目前较为常用的6.0版本为例进行讲解。一、EViews的界面

在安装EViews 6.0软件后,打开桌面图标,即进入主窗口,如图2-1所示。图2-1 主窗口(1)标题栏。界面最上面一栏为标题栏,可进行最大化、最小化等操作。(2)菜单栏。界面第二栏为菜单栏,共有九个可用菜单,操作主要在这里进行。下面分别介绍各个菜单。

a. File(文件):与Word等软件的File菜单类似,主要进行工作文件(Workfile)的基本操作,如新建(New)、打开(Open)、保存/另存为(Save/Save As)、关闭(Close)、读入(Import)、读出(Export)、打印(Print)、运行程序(Run)、退出EViews(Exit)等。

b. Edit(编辑):对工作文件中的程序文字等进行编辑,包括复制(Copy)、粘贴(Paste)、剪切(Cut)、删除(Delete)、查找(Find)、替换(Replace)等操作。

c. Objects(对象):提供有关对象的基本操作,包括建立新对象(New Objects)、从数据库获取新对象(Fetch/Update from DB)、将工作文件中的对象存储到数据库(Store to DB)、复制对象(Copy Selected)、重命名(Rename)、删除(Delete)等。在EViews中,处理的数据及运行结果都被称为“对象”,如序列(Series)、方程(Equations)、模型(Models)、系数(Coefficients)等。“对象”这一概念我们将在后面的章节中多次解释。

d. View(查看):其功能随窗口的不同而变化,主要涉及变量的各种查看方式。

e. Procs(过程):它的功能也随窗口的不同而变化,其主要功能为对一般对象进行操作。

f. Quick(快速):提供快速统计分析过程。

g. Options(选项):系统参数设定选项。

h. Window(窗口):在使用EViews的过程中将会有多个子窗口。该菜单提供子窗口的切换和关闭功能。

i. Help(帮助):提供索引方式和目录方式的帮助功能,是我们学习EViews的得力助手。(3)命令窗口。菜单栏下面是命令窗口。窗口最左端的竖线是提示符,允许用户在提示符后通过键盘输入EViews(TSP风格)命令。如果熟悉TSP(DOS)版的命令,即可以直接在此键入,按照DOS版的方式使用EViews。按F1键(或移动箭头),键入的历史命令将重新显示出来,供用户选用。但是这种方式并不适合初学者。EViews的优势就在于通过可视化的针对对象的操作来实现命令的简化,因此我们不推荐以DOS命令的方式来操作EViews。(4)主显示窗口。命令窗口之下是EViews的主显示窗口。以后操作产生的窗口(称为子窗口)均在此范围之内,不能移出主窗口之外。(5)状态栏。主窗口之下是状态栏。左端显示信息,中部显示当前路径,右下端显示当前状态(例如有无工作文件等)。二、建立文件

前文提到,EViews是面向对象(Objects)的计量分析软件。而EViews软件对于对象的具体操作是在工作文件(Workfile)中进行的。也就是说,如果想用EViews进行具体的操作,必须先新建一个Workfile或打开一个已经存在于硬盘上的Workfile,在此Workfile中进行输入数据、建造模型等操作。

要新建一个Workfile,依次单击“File”→“New”→“Workfile”即可。这时屏幕上会出现一个工作文件定义对话框,要求用户指定序列观测数据的频率和样本大小(见图2-2)。图2-2 工作文件定义——时间序列

在图2-2的对话框中,工作频率项(Frequency)即数据的间隔属性,可根据具体情况选择年度(Annual)、季度(Quarterly)、月度(Monthly)等样式,并在下面的空格输入数据的起止时间。其中年度须用四位数表示年份,如“1950”。在Start date后输入开始年份,在End date后输入终止年份。季度数据的输入格式为“年份:季度”,如“1960:1”,“年份:”后面的1、2、3、4四个数字,代表四个季度。月度数据的输入格式为“年份:月份”,如“1970:03”,“年份:”后面的数字表示第几个月份。周(Weekly)和日(Daily)选项的格式为“月份:日期:年份”,如1980年10月31日应表示为“10:31:1980”,请注意单位之间是用冒号相隔的。

上述格式适用于时间序列的数据,如果数据类型是横截面数据,则在“Workfile structure type”中选择“Unstructured/Undated”,此时只要在右边输入样本数即可(见图2-3)。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载