动态因子模型:理论与G20经济体建模实践(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-14 18:03:29

点击下载

作者:何新华 著

出版社:社会科学文献出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

动态因子模型:理论与G20经济体建模实践

动态因子模型:理论与G20经济体建模实践试读:

前言

自2010年起,中国已成为全球第二大经济体。中国经济的快速崛起,令世人瞩目。经过30多年的改革开放,中国已与世界经济紧密地联系在一起。中国在世界经济中影响力与日俱增的同时,也越来越多地受到世界经济的影响与制约。在这种背景下,及时准确地把握我国主要贸易伙伴的宏观经济运行情况,对于我国宏观经济的平稳运行至关重要。

成立于1999年的二十国集团(G20)作为一个新的国际经济合作论坛,在全球经济合作中发挥着越来越重要的作用。G20的成员包括:七国集团成员国的美国、日本、德国、法国、英国、意大利、加拿大;曾经的八国集团成员俄罗斯;作为一个经济实体的欧盟;澳大利亚、中国以及南非、阿根廷、巴西、印度、印度尼西亚、墨西哥、沙特阿拉伯、韩国和土耳其。这些国家(地区)的国民生产总值约占全世界的85%,人口约占世界总人口的2/3。能够对上述经济体的经济走势作出预测,则基本可对世界经济走势作出相对准确的判断。2014年我国对G20经济体的贸易占我国进出口总额的58%,是我国对外贸易的重要组成部分。GDP增长率和通货膨胀率短期走势是宏观经济调控的主要观测指标,准确判断其短期走向、为制定宏观经济政策提供可靠的决策依据是本研究项目的主要目标。

对宏观经济指标的准确预测取决于两个重要因素,即原始数据和预测方法。原始数据的准确性取决于各国(地区)统计部门,我们无法干预,只能寄希望于通过选取恰当的预测方法以最大限度地提高预测精度。鉴于本研究项目的重点在于对GDP增长率和通货膨胀率的短期走势进行预测,在广泛调查研究各种经济预测方法的适用性的基础上,我最终决定采用动态因子模型这一技术手段为G20各经济体建立GDP增长率和通货膨胀率的短期预测模型。实践证明,所建模型中的绝大多数对相应经济指标的预测精度都已与国际货币基金组织出版的《世界经济发展报告》水平相当。

为了最大限度地减少人工干预所带来的预测误差,2015年下半年,我尝试通过Eviews编程使整个模型构建过程实现完全自动化。现在只需从CEIC数据库中将数据导出至Excel文件,再将数据读入Eviews,运行相应的Eviews程序(见附录五)即可得出预测结果。

本书共分三部分及附录:

第一部分由第一章至第四章组成,重点对为什么选择动态因子模型、动态因子模型的特点、建立通货膨胀率和GDP增长率动态因子模型需要解决的问题等进行了讨论;

第二部分由第五章至第八章组成,第五章以中国为例,全面介绍了通货膨胀率动态因子模型的建设过程,第六章至第八章则记录了各国家(地区)通货膨胀率动态因子模型的相关内容;

第三部分由第九章至第十二章组成,第九章以中国为例,全面介绍了GDP增长率动态因子模型建模过程,第十章至第十二章则记录了各国家(地区)GDP增长率动态因子模型的相关内容;

附录则给出了包括完整的Eviews动态因子模型程序在内的相关信息。

感谢北京师范大学刘一萌等人协助完成了本书中动态因子模型基础变量表的翻译,以及对附录三和附录四的整理工作。当然,相关内容已经我审定,如存在错误当由我承担。

本研究项目得到了国家自然科学基金(项目编号71173235)的资助。中国社会科学院创新工程给予了配套经费支持。何新华2017年5月于北京第一章关于经济预测的几点思考摘要:进行经济预测必须要考虑其潜在的使用者的具体需求。作为经济计量研究领域最困难的经济建模,由于模型是对现实世界的极大简化,无论多么完美的预测模型在一定程度上都是不准确的。导致经济预测产生误差的原因很多。统计部门对基础数据的不断修订,对基于时间序列数据而进行的经济预测结果所产生的影响有时是灾难性的。综合考虑宏观经济数据的大N小t现象,选用最合适的经济预测方法,是保证得到有参考价值的预测结果的前提。第一节经济预测的服务对象

经济系统作为纷繁庞杂的社会系统的一部分,其运行轨迹受到众多因素的影响。对经济运行轨迹的探寻是经济学家们不懈的追求。

社会各界基于自身的需求对经济预测有着不同的期许。我们可以大致做如下划分:(1)普通居民想通过了解经济运行的趋势及时调整自身的投资和消费行为;(2)企业家密切关注经济运行状况以及时调整经营策略和方向;(3)机构投资者对经济运行状况高度关注,以捕获转瞬即逝的投资机会;(4)政府有关部门为及时制定相关政策,防止经济的过冷或过热,以保障宏观经济的平稳有序运行,更对及时把握经济运行状况有迫切的需求。

鉴于各界对经济预测的不同期许,对经济预测的时效性和预测精度的要求有着相当大的差异。普通居民或许只需要了解未来几年经济的大体走势。较之对整体宏观经济形势的预测,企业家或许对行业发展趋势的预测结果更感兴趣。机构投资者或许会对月度或更高频的预测更加关注。政府部门为及时出台宏观经济调控政策,或许不仅需要关注近期经济动向还需要把握更长时期的经济发展趋势。“经济预测”这个词语显然太过宽泛,我们不仅可以把对任何经济指标的预测统称为经济预测,也可以把任何对未来经济的文字性描述称为经济预测。我们可以把基于大型宏观经济模型而做出的预测称为经济预测,也可以把对经济变量的简单自回归结果称为经济预测。显然,用户的需求是经济预测模型建立的前提。为满足不同需求而建立的经济预测模型必然是不同的。没有任何一个经济模型能够同时满足不同客户群的需求。认清这一点对于我们开展经济建模研究至关重要。第二节经济预测为什么让人望而却步

中国经济学教育科研网微信公众号2016年4月9日曾经转载过一篇中国人民大学经济学院周业安教授写的文章《何以水平越高的经济学家越不愿意预测?》,文中谈道“自费雪之后,水平越高的经济学家越不愿意预测,这是因为高水平经济学家对经济学的局限知之甚深,也就越不敢去预测了。反而是各种半桶水、或已不再从事理论研究的那些人,才会去预测”。此言虽有些偏激,但也确实道出了一些实情。虽然对经济预测的需求与日俱增,但预测结果很快就被历史数据检验对错的现实吓退了大多曾致力于经济预测的研究者。显然,“高水平”的经济学家更乐于从事理论研究,发表些无从证明其真伪的“高论”。

从历史的角度看,在经济学中支持实践的预测理论是建立在两个假设的基础之上的:模型是现实经济的真实代表,以及经济结构将保持相对稳定。但现实的情况是,预测模型并不准确,现实经济也常常出现不可预期的变化。因此,不能做出准确的预测是相当普遍的事(大卫·亨德里和尼尔·埃里克松,2003)。

D.F.韩德瑞和秦朵(1998)从经济计量学方法论的角度将经济计量研究归纳为四类。第一类对应于统计学中的概率论部分,即假定生成经济数据过程的理论结构,包括所有的理论参数的值,是全部已知的;第二类对应于统计学中的估计与推断,即仍假定理论结构是已知的,但假定理论参数的值是未知的;第三类与我们通常所接触的实际情况最为接近,即假定有关数据背后的理论生成结构也是未知的;第四类是待预测的未来。因此,预测是经济计量研究领域内最困难的一部分。

经济模型是对现实世界的极大简化。正如大卫·亨德里和尼尔·埃里克松(2003)所说,经济学家们已认识到,无论多么完美的预测模型,由于对现实事物进行了大量简化,因此从一定程度上来说任何模型都是不准确的。

经济预测让人望而却步的另一个重要原因,即预测结果准确与否会在短期内接受实际数据的考验。“当天气预测错误时,气象学家得到的是新的超级计算机;当经济学家预测错误时,我们得到的是预算削减。”(大卫·亨德里和尼尔·埃里克松,2003)这导致不少曾经致力于经济预测的学者,不得不屈从于现实。第三节经济预测的误差来源

经济预测的误差来源于多个不同层面。认清这些误差来源,不仅对于设法提高预测精度至关重要,同时也有益于对预测结果的准确性树立正确的认识,即有益于对经济预测结果的解读和评判。

经济预测的误差可能来源于以下几个方面。(1)经济预测模型是对现实的极大简化,任何预测模型都不可能穷尽所有的变量,因而在建模的过程中必然存在对变量的取舍,未能包括在模型中的部分变量很可能会对所预测的变量有一定的影响。(2)任何依据经济计量方法建立的经济预测模型都不可避免地存在估计误差,因而依据所建模型做出的预测结果必然存在误差。(3)经济预测的误差也可能来源于对原始数据的修订。宏观经济数据的不断更新和统计口径调整对以宏观经济时间序列数据为基础的经济计量模型建设者而言,可以说是无法绕开的梦魇。

以中国国内生产总值(GDP)数据为例,同一年度的GDP数据有以下几个不同版本,从核算角度的不同分为生产法GDP、支出法GDP和收入法GDP。从发布时间的先后,分为次年1月在《国民经济和社会发展统计公报》中发布的初步核算GDP,次年5月随《中国统计摘要》发布的初步核实GDP,次年9月随《中国统计年鉴》发布的[1]最终核实GDP。对于中国季度GDP而言(仅有生产法核算数据),季度GDP初步核算数一般于季后15天左右完成,在季度国民经济运行情况新闻发布会和《中国经济景气月报》上公布;季度GDP初步核实数在年度GDP初步核实数发布后45天内完成,在《中国经济景气月报》上公布;季度GDP最终核实数在年度GDP最终核实数发布后45天内完成,在《中国经济景气月报》上公布,以上数据也在国[2]家统计局数据库上同步公布。这一系列的修订统称为常规修订。另外,在中国国家统计局不定期进行的相关调查活动后,还会对GDP历史数据(包括年度数据和季度数据)进行一系列调整,即所谓的全[3]面修订。由于我国从1985年才开始以联合国所推广的国民经济核算体系(SNA)进行国民经济核算,至1993年正式开始公布基于SNA体系的生产法和支出法年度GDP核算数据。1978~1992年的GDP数据是依据SNA原则在原物质平衡表体系(MPS)的基础上补充得到的。在1993~1995年首次第三产业普查后,又对1978~1993年国内生产总值进行过调整。《中国统计年鉴2006》中注明:“2005年,根据第一次经济普查资料,按照《经济普查年度GDP核算方案》的要求,重新计算了经济普查年度(即2004年)国内生产总值数据,并利用趋势离差法(即先根据经济普查数据计算出历史数据的趋势值,然后,利用原有历史数据实际值和趋势值的比例修订根据经济普查数据计算的历史数据趋势值,得到新的历史数据修订值)修订了国内生产总值历史数据。”《中国统计年鉴2007》中注明:“因1999年国际收支平衡表中的数据发生变化,故对该年支出法国内生产总值做相应调整。”《中国统计年鉴2008》中注明:“2006年全国农业普查后,对2005年、2006年第一产业数据进行了调整,2004年及以前年份数据未做调整。”另外,根据《中国统计年鉴》中的注释(见1999年以后各期),年鉴中所公布的最后一年的数据均非最终数据,并且如果遇到普查年,在能够获得更为详细的基础资料的情况下,国内生产总值的历史数据也会作相应调整(何新华,2010)。[4]

当然,对宏观经济历史数据进行调整的情况并不仅限于中国。对GDP数据进行修订是国际上通行的做法。例如,美国对季度GDP数据进行两次修订:一般在季后15天计算季度GDP初步数,在季后45天进行第一次修订,在季后75天进行第二次修订。美国的年度GDP数据要进行三次修订。此外,美国还利用每5年一次的普查资料对年度GDP数据进行全面修订。加拿大对季度GDP数据进行两次修订:一般在季后60天计算季度GDP初步数,在获得比较全面的资料后对初步数进行第一次修订。加拿大季度GDP核算以年度投入产出表为基准,待年度投入产出表编制出来后(一般滞后4年),对季度GDP数据进行最终修订,形成季度GDP最终数据。加拿大的年度GDP数据要修订4次,在每年第一季度对前4年的GDP数据进行修订,逐步形成最终数据。加拿大在开展普查、计算方法发生变化或调整基期时,也要对GDP历史数据进行修订。

在传统的结构型宏观经济模型中,一项数据的调整往往涉及对数个方程的重新估计,而重新估计方程时极有可能出现原方程中发现的结构不复存在的情形。例如,在我们所开发的“中国宏观经济季度模型China_QEM”(何新华等,2005)中,共有18个行为方程,其中有6个方程包括GDP,也就是说,一旦GDP数据有所调整,则这6个方程均需重新进行估计。因此,即使建立模型的样本区间相同,由于原始数据已经过调整,所得方程也可能有极大的不同,以原方程为基础做出的预测结果自然也就不可能准确。

作为数据使用者,我们无法超越数据的生产者先验地知晓真实的数据,只能被动地尽量采用最新版本的数据进行模型的构建,并承担预测失误的后果。(4)以时间序列数据为基础建立的经济预测模型,寄希望于对经济运行规律的发现,若经济运行机制已不同于模型得以建立的时间区间,则经济运行规律已发生变化,从而经济模型的预测结果必然会出现偏差。在对日本通货膨胀率建模初期,我们就遇到了因日本增加消费税而导致的日本消费者价格指数出现大幅波动,严重偏离原运行轨迹,从而预测结果出现严重失真的状况。不幸的是,不可重复性是经济系统固有的特性,因而只有在经济系统变化缓慢的情况下,经济预测模型才能给出相对准确的预测结果。(5)预测期内各方的参与对经济运行轨迹必然产生影响,因而预测结果得以成立的“假设一切保持不变”(Ceteris Paribus)实际并不存在。一个显而易见的例子:假如政府对宏观经济进行调控,那么一旦政策得以实施必然会影响经济的运行轨迹。从这个意义上讲,或许只有对已经发生但尚未公布的数据进行预测(Nowcasting),才有可能做到预测结果的相对准确。第四节宏观经济数据的特点

宏观经济研究领域内的数据,相较于微观经济或其他社会科学研究领域内的数据,有其自身独有的特点,即大N小t。

从具体时点看,反映宏观经济各不同侧面的数据包罗万象,不胜枚举。但从时间序列的角度看,不仅数据频率不一,而且每一个序列的长度又十分有限。这种现象不仅存在于广大发展中国家(地区),发达国家(地区)也同样如此。

以CEIC数据库中最具代表性的GDP数据为例,截至2014年底,中国的GDP年度数据仅有62个(始于1952年),GDP季度数据仅有63个(始于1999年第一季度);日本的GDP年度数据仅为20个(始于1994年),GDP季度数据仅为83个(始于1994年第一季度);美国GDP在所有国家(地区)中拥有最长的时间序列数据,其GDP年度数据仅为85个(始于1929年),GDP季度数据也不过271个(始于[5]1947年第一季度)。

宏观经济数据的另一个突出特点是数据的不可重复性。宏观经济现象是在多种行为主体的共同参与下发生的,所有的数据只能通过观测得到,并且它们只能被记录而不能被人为重复。

在对宏观经济时间序列数据进行分析的过程中,重要的假设条件之一是在所研究的时间区间(样本区间)内经济运行机制保持不变,即各项理论参数值是固定不变的。显然,从现实经济运行情况看这是一个非常强的假设,因而客观上必然限制了样本区间的长度。第五节经济预测方法比较

Pagan(2003)根据不同经济计量方法对数据和理论的依赖程度给出了一幅非常形象的示意图,在此笔者仿照他的做法绘制出了图1-1。从图中可以看出,动态随机一般均衡(DSGE)模型方法是最具理论依赖性的建模方法,而动态因子模型方法是最具数据依赖性的建模方法。关于DSGE方法、伦敦经济学院(LSE)方法和向量自回归(VAR)方法的比较可见何新华(2007)的相关讨论。图1-1 各种宏观经济计量建模方法比较

DSGE模型高度依赖经济学理论。LSE方法强调以探寻数据生成过程作为建模的出发点。虽然真正的数据生成过程是未知的,但LSE方法以现行经济理论为起点,结合公认的经济常识(common sense),并在对数据进行先期分析的基础上,力图找出对所关注变量产生影响的所有可能的因素。在将所有可能的影响因素纳入分析范围,形成一个“一般模型”之后,运用“检验、检验、再检验”的行为准则对该“一般模型”进行“约化”,以寻求信息损失最小的简洁模型(Hendry,2001)。作为20世纪80年代曾风靡全美国的VAR方法(Maddala and Kim,1998),其在经济预测中曾发挥了重要作用(Diebold,1998;Allen and Morzuch,2006)。在VAR方法出现之前,人们把太多的注意力放在了由经济理论所决定的具有因果关系的变量上,而忽略了经济系统的动态特性。对经济动态特性的关注,使只是把注意力集中在较小范围内的具有因果关系的变量之上的VAR方法也取得了令人瞩目的成绩。但由于宏观经济数据样本通常较小,而VAR方法随变量的增加和滞后阶数的加大,待估参数呈几何级增长,使VAR方法的应用受到了极大的限制。动态因子模型方法的问世,在一定程度上化解了VAR方法在实际应用中所遇到的困扰,其卓越的降维特性也使人们不再受限于对少量影响因素的研究。

综合考察LSE方法、VAR方法和动态因子模型方法后,笔者认为,假如借鉴LSE方法中所奉行的以探寻数据生成过程作为建模的起点,然后充分利用动态因子模型的卓越的降维特性,再辅之以VAR方法对经济变量进行预测,应该能取得理想的预测结果。事实上,Faust和Wright(2013)在考察了多个预测模型之后已得出结论,认为非常简单地把当期数据和长期预测调查(long-run survey forecasts,LSF)相结合,就可以对相关统计指标做出很好的预测。鉴于LSF系多家预测机构综合考虑各种影响因素的预测结果,其在一定程度上恰恰反映的是动态因子模型中所提取的影响因子所具有的特性,但这里所涉及的因子均为与所需预测的变量高度相关的因子。第六节经济预测方法的选取

经济预测涉及经济运行的方方面面,我们可大致作如下划分。(1)按预测变量所涵盖的地理范围可分为世界经济预测、区域经济预测、国别经济预测和省(市、县)经济预测。例如,在每年分春、秋两季出版的《世界经济展望》(World Economic Outlook)中,国际货币基金组织(IMF)会发表其有关世界经济、区域经济、国别经济等的预测结果;在经济合作与发展组织(OECD)的定期出版物《经济展望》(Economic Outlook)中会对OECD国家的经济运行情况进行预测;中国“经济蓝皮书”中会给出有关中国经济的预测结果;各省(市、县)也会针对本地经济进行预测。(2)按预测指标进行分类,可分为宏观经济预测和微观经济预测。对宏观经济指标所进行的预测称为宏观经济预测,对微观经济指标所进行的预测称为微观经济预测。如对GDP增长率所进行的预测属于宏观经济预测,对产品价格所进行的预测属于微观经济预测。(3)按拟预测区间的长短可分为短期预测、中期预测和长期预测。一般预测期在一年以内的称为短期预测,一年至五年称为中期预测,五年以上的称为长期预测。(4)按预测结果划分,可分为对指标转折点出现时间的预测、对具体时点指标取值的点预测、对具体时点指标取值的区间预测等。

鉴于本研究项目旨在对G20所包括的经济体之GDP增长率和通货膨胀率的短期走势进行预测,所选用的预测方法必然要求满足以下条件:(1)适用于对不同国别进行预测,最好能对不同国家建立标准化的预测操作流程;(2)适用于对宏观经济指标进行预测,即预测的基础数据为大N小t类数据,同时要考虑基础数据中可能包括不同频率的数据;(3)适用于进行短期经济预测,即需要操作简单,易于迅速获取预测结果;(4)点预测不可缺少,但最好能给出区间预测,以方便对预测精度和宏观经济走势的判断。

针对以上要求,显然不宜选择建立大规模的宏观经济结构模型,一来其建模过程繁杂并且维护成本很高,二来其在预测精度上的表现也难满足要求。虽然DSGE模型近年来被广泛用于宏观经济预测,但[6]考虑到其对经济学理论的过分依赖,其预测结果在很大程度上难以反映宏观经济的真实运行轨迹。而VAR模型因其仅适用于对少量同频率变量建模,也无法满足本研究的需要。因而笔者最终把目光锁定在了动态因子模型上。

[1] 见中国国家统计局网站,http://www.stats.gov.cn/tjsj/zxfb/201501/t20150121_671820.html。

[2] http://data.stats.gov.cn/workspace/index?m=hgjd.

[3] http://www.stats.gov.cn/tjsj/zxfb/201501/t20150121_671820.html.

[4] http://www.bjstats.gov.cn/sjjd/jjgj/jjgc/200605/t20060528_42949.htm.

[5] 根据美国经济分析局(Bureau of Economic Analysis)网站(http://www.bea.gov/national/index.htm)提供的数据看,美国GDP年度数据始于1929年,季度数据始于1947年。即便如此,在克莱茵建立第一个宏观经济模型时,GDP年度数据也仅仅只有20多个观测点(Klein and Goldberger,1955)。

[6] 况且有些DSEG模型仅仅是看上去很美,但实际上却经不起推敲,见何新华(2014)的相关分析。第二章动态因子模型简介摘要:动态因子模型以其卓越的降维特性在经济预测领域独领风骚,它不仅使模型中所包括的解释变量的数目得到了极大的扩展,而且其对混频数据的处理能力也使经济预测模型得到了前所未有的发展。本章在简述动态因子模型发展的基础上,对采用动态因子模型进行经济预测时所需注意的技术细节进行了讨论。第一节什么是动态因子模型?

从开展宏观经济预测的角度出发,提高预测结果的准确性始终是经济学工作者所面临的一大挑战。第一章已述及影响预测结果准确性的各种因素。本章将集中讨论如何通过采用适当的宏观经济计量技术以最大限度地降低预测误差,提高预测精度。

现实中,各国宏观经济数据均具有大N小t的特征,即虽然可供使用的宏观经济指标数量异常庞大,但具体到每个宏观经济指标,其观测值的个数却极为有限。与此同时,不同频率的宏观经济指标大量存在(不仅有年度数据、半年数据、月度数据、季度数据,还有旬数据、周数据等),并且从发布时间上看一般具有相当长的时滞。长期以来,宏观经济计量研究者一直致力于寻找一种能够从上述混合型数据集中析出高质量信息的方法,以对特定宏观经济指标进行及时、准确的预测。能够大幅度进行空间维度压缩的动态因子模型的问世,为从纷繁庞杂的宏观经济指标中滤出对特定宏观经济指标有效的预测信息提供了可能。Y=AF+e      (2-1)tttF=B(L)F+θ      (2-2)ttt-1

典型的动态因子模型由以上两个方程组成,其中Y(n维列向量)t[1]为经标准化后的观测变量;F(m维列向量)为驱动系统的隐性因t子即动态因子();A(n×m)和B(L)(m×m)为待估系数矩阵,e(n维列向量)和θ(m维列向量)为随机扰动,并且假定两tt者不相关。

显然,上述动态因子模型具有典型的状态空间模型形式(高铁梅,2009)。方程(2-1)为量测方程(measurement equation)或信号方程(signal equation),方程(2-2)为转移方程(transition equation)或状态方程(state equation)。第二节动态因子模型发展概述

自Geweke(1977)同Sargent和Sims(1977)的开创性工作开始,动态因子模型已有了40年的发展历史。Geweke(1977)和Sargent和Sims(1977)的工作集中在频域,其主要致力于寻找动态因子结构存在的证据和因子估计的重要性,并不能据以直接对因子进行估计,因而也无法将其应用于预测。因此,有关动态因子模型的后续研究转向了可以对因子直接进行估计的时域之中。

根据Stock和Watson(2011)的划分,对时域内动态因子模型的求解方法大致可划分为三个阶段。第一阶段,主要致力于对较低维度(N较小)的动态因子模型的求解,所采用的估计方法主要是采用卡尔曼滤波的高斯极大似然法。在计算技术受到极大限制的20世纪80年代,参数估计过程中所需要进行的非线性优化客观上限制了待估参数的个数,因而也就限定了模型的规模,即模型中所包括的观测变量的个数。第二阶段,采取了求取均值(加权平均)的非参数估计法对动态因子模型进行求解,如采用主成分分析(principal components)对模型参数进行估计,模型规模得到了适度扩张。虽然模型中的观测变量仅限于相同频率,但当N足够大时,已可对待预测变量进行较为准确的预测。第三阶段,得益于计算技术的普及,2000年以来已可对包括不同频率的大量观测序列的动态因子模型采用状态空间模型方法进行求解。由于所提取的动态因子涵盖了更多有价值的信息,对待预测变量的预测性能得到了进一步的改善。第三节动态因子模型的求解

对由式(2-1)和式(2-2)组成的动态因子模型一般可采用卡尔曼滤波(Kalman Filter)得出动态因子F及参数矩阵A和B(L)的相t应估计值。当前已有不少统计分析软件可进行状态空间模型的求解,具体操作虽有所差异,但实现起来并不难。在Eviews中对动态因子模型的求解大致分为以下几步。

第一,确定动态因子的个数。Bai和Ng(2002),Onatski(2010),以及常用的主成分分析均可用于确定动态因子的个数。从笔者的实践看,采用这几种方法给出的动态因子个数差异多在两个以内,并且在主成分分析中,当选取累积方差贡献率达到85%的因子个数时基本可以得到满意的结果。因此,从实践的角度看,不必过多纠结于各方法给出的因子个数间的差异,应把简单、高效视为首选。在原始数据集为混频(mixed frequency)数据且数据更新时间不一(“ragged”/“jagged” edge problem)的情况下,用于进行主成分分析的子集,不仅将只限于数据集中的最高频序列,而且需要在样本长度和所包括的序列个数间做出取舍。从笔者的实践来看,当该子集中的最长序列数量较少时,以牺牲样本长度换取序列个数的增加是较为可取的做法。

第二,为状态空间模型的求解设定迭代初值。状态空间模型在Eviews中是以迭代的方式进行求解的,因此在运行状态空间模型前必须对待求解的A、B(L)、F等赋予初始迭代值,同时对e和θ进行限ttt定。F的初始值可选用主成分分析中所获取的相应的主成分,A、tB(L)可以通过单方程最小二乘法确定,e和θ可以限定为V(e)=Ittt和V(θ)=I。t

第三,求解状态空间模型。Eviews中的状态空间模型为sspace。运行sspace前,需要先定义相应的信号方程和状态方程,然后在给出迭代步长和迭代精度后方可运行。在求解的过程中,B(L)中的滞后阶数视AIC(Akaike Information Criterion)或SIC(Schwarz Information Criterion)的取值而定,即选取使AIC或SIC值最小的B(L)滞后阶数。

值得注意的是,尽管状态空间模型适用于混频和样本期参差不齐的数据,但其适用范围也需满足一定的条件。从式(2-1)和式(2-2)可以看出,状态空间模型中的待估参数包括A(n×m)和B(L)(m×m)。由于B(L)为对角阵,所以待估参数总计为(n×m)+(m×l)个(l为状态方程的滞后阶数)。因此,为保证状态空间模型能够运行,需要(n×m)+(m×l)个连续观测值。换句话说,虽然并不要求包括在动态因子模型中的所有时间序列在整个样本区间内均有观测值,但当某时间点所有时间序列的观测值均缺失时,该点将被视为无效观测点,即被视为非连续观测值。例如,对于包括35个最高频率为月度数据的动态因子模型而言,若待提取的因子个数为4,并且状态方程的滞后阶数为3的话,则需要至少含有一个有效数据的连续观测值的个数至少为152,也就是需要至少13年的月度数据(152/12=12.7)才可对模型进行求解。在其他条件不变的情况下,当时间序列个数增加至50时,待估参数总计将达到212个,所需样本期长度将延长至18年(212/12=17.7)。所以,在选取原始数据的过程中,所选数据序列并非越多越好。第四节用动态因子模型进行预测

动态因子模型方法的问世,在一定程度上化解了VAR方法在实际应用中所遇到的困扰,其卓越的降维特性也使人们不再受限于对少量影响因素的研究。然而实践中人们却过分享受了这一特性,认为既然整个经济系统系由少量隐性因子所驱动,那么只要将所有能够收集到的变量尽可能多地纳入模型,则必然可以滤出所需隐性因子,从而对所关注的经济变量做出最佳预测。如Stock和Watson(2002)在对通货膨胀的预测中选用了多达143个变量;Giannone等(2008)在对GDP的预测中选用了超过200个变量。由于对影响因素无节制的涉猎,使所获取的动态因子失去了对所关注变量的针对性,因而使其预测效果不可避免地受到了影响,以至于Stock和Watson(2011)得出了动态因子模型对通货膨胀率预测效果较差的结论。

另外,考虑到上一节中提到的动态因子模型对数据的要求,当越来越多的变量被纳入动态因子模型之后,待估参数必然迅速上升。而为了使状态空间模型能够运行,势必要增加样本期的长度。上一章曾提到,当样本期过长时,样本期内经济运行规律将有较大的概率已发生变化,从而将导致所滤出的动态因子对待预测变量的预测能力出现下降,甚至失去应有的预测能力。

实践中,比较可行而且应该遵守以下原则选取变量。一是所选取的变量应与待预测变量高度相关;二是所选取的变量间有高度的共性,即能够保证待提取的因子个数不至于太大;三是所选取的变量应该尽可能全面地涵盖所有对待预测变量有影响的因素;四是应该在保证状态空间模型能够运行的前提下尽可能地缩短样本期;五是应该尽可能多地选取高频数据,以保证数据的时效性;六是尽量不选取已停用(将不再更新)的变量;七是变量的选取必须以提高对待预测变量之预测的准确性为前提。

根据Stock和Watson(2011)的观点,采用动态因子模型进行预测时,对预测期内动态因子的取值有两种处理方式,一是直接以样本期内的动态因子取值进行预测,即在对h期进行预测时以Y直接对Y、tht+F及其滞后项进行回归;二是先以各动态因子构成一个VAR模型,对t预测期内动态因子的取值进行预测,而后利用这些预测值对Y进行th+预测。从过去的实践看,两种方法并未表现出明显优劣。笔者选取了[2]后一种方法,并且借助PcGive给出了扇形区间预测。

本研究项目为G20内的大多数经济体建立了对GDP增长率和通货膨胀率进行短期预测的动态因子模型。由于缺少相应的数据或利用现有数据尚无法得出令人满意的预测结果,笔者最后不得不放弃了对阿根廷GDP增长率和通货膨胀率(数据样本区间过短,只有一到两年)的建模努力。

后续章节安排如下:接下来用两章的篇幅分别介绍通货膨胀率动态因子模型和GDP增长率动态因子模型,然后以中国为例较为详细地介绍通货膨胀率动态因子模型建模过程。随后将G20中其余经济体的通货膨胀率动态因子模型分为G7及欧盟、其他亚洲经济体和其余经济体分别进行讨论。在以中国为例较为详细地介绍GDP增长率动态因子模型建模过程的基础上,同上将G20中其余经济体的GDP增长率动态因子模型分为G7及欧盟、其他亚洲经济体和其余经济体分别进行讨论。

为方便读者尝试利用动态因子模型进行预测,本书最后以附录的形式给出动态因子模型的Eviews程序。

[1] 通过标准化可以去除各变量因计量单位的选取而对所提取的动态因子产生的影响。

[2] 部分预测结果见http://xinhuahe.blog.sohu.com/。第三章通货膨胀率动态因子模型摘要:本章首先讨论了通货膨胀率的影响因素,其次简要讨论了不同口径的通货膨胀率定义,对采用动态因子模型进行通货膨胀率预测的实践进行了简要回顾。通过对比《世界经济展望》和中国“经济蓝皮书”中的相关预测结果,证实预测结果是可信的并且具有较高的精度。最后对建模实践中所遇到的问题进行了分析。第一节通货膨胀率的影响因素

通货膨胀或通货紧缩是一种货币现象,当过多的货币追逐一定量的商品或服务时就必然会出现价格的上涨,反之当一定量的货币面对过多的商品或服务时就必然出现价格的下跌。

从宏观经济层面上看,反映整体价格水平的指标主要有两个,即GDP减缩指数和居民消费价格指数(也称作消费者价格指数)。GDP减缩指数受限于GDP的发布频率,目前多数国家(地区)只能做到每季度发布一次,部分国家(地区)甚至仅发布年度数据,因而时效性较差。相比之下,多数国家(地区)都能以月度频率发布的居民消费价格指数更具参考意义,因而也是实践中更常使用的指标。

反映一般价格水平的居民消费价格指数受到众多因素的影响。从居民消费价格指数的生产过程看,其综合了食品、烟酒、饮料、服装、家庭用设备及维修、医疗保健、交通、通信、娱乐、教育、文化、居住等商品和服务的价格变动。从价格传导过程看,作为下游的居民消费价格指数不仅间接受到如商品零售价格指数、农产品价格指数、工业品出厂价格指数等上游产品类价格指数的影响,还间接受到诸多服务类价格指数的影响。而上述产品类价格指数又进一步受到诸如原材料价格指数、生产资料价格指数、燃料动力价格指数等生产性投入品类价格指数的影响。从货币供应的角度看,货币供应量的消长、市场利率的高低,以及更进一步的存款准备金率的调整、基础货币的投放、外汇储备存量的增减、财政赤字的多少等均可对居民消费价格指数产生影响。从资产配置的角度看,股指的波动会对实体经济中货币的流通产生影响,因而也会间接对居民消费价格指数产生影响。从购买力的角度看,人均收入的波动,以及人均工资的增速、失业率的上升或下降,反映消费者意愿的消费者信心指数等,都会对居民消费价格指数产生影响。进一步看,影响上述因素的国内生产总值增长速度及第一、二、三产业的增长速度均会间接影响到居民消费价格指数。在开放经济条件下,国际市场上商品和服务价格的涨跌,以及汇率的波动也会对居民消费价格指数产生影响。

可见,通过居民消费价格指数的变动可以完整地反映一个经济体的整体价格变动情况。因而,对通货膨胀或通货紧缩进行研究,就必须同时考虑到以上诸多因素的影响,简单择取部分变量所进行的分析必然是片面的和值得商榷的。第二节各种不同口径的通货膨胀率数据

现实中,居民消费价格指数有多种不同的统计口径。从时间维度上划分,可分为年度居民消费价格指数、季度居民消费价格指数、月度居民消费价格指数。从基期维度上划分,则可分为同比居民消费价格指数、环比居民消费价格指数和定基比居民消费价格指数。从地域上划分,如在我国可分为国家、省(自治区、直辖市)、市(地区)、县等居民消费价格指数。从群体上划分,如在我国可分为城镇居民消费价格指数和农村居民消费价格指数。理解各种不同口径居民消费价格指数间的关系是准确选择和使用数据的前提。在此,我们仅讨论国家层面的居民消费价格指数。

首先,年度居民消费价格指数分为以上年为基期和以特定年份为基期的价格指数,前者用于描述年度价格变动情况,后者用于描述相对于特定年份的价格变动情况。如2015年《中国统计年鉴》中的表5-1就是以上年为基期的价格指数,可以看到2014年居民消费价格指数为102.0(上年=100),即相对上年本年度消费者价格上升了2%。2015年《中国统计年鉴》中的表5-2则给出了以1978年为基期的居民消费价格指数,2014年居民消费价格指数为606.7(1978年=100)。上年=100记t年度以上年为基期的价格指数为P,t年度以特定年份为基t特定年份=100期的价格指数为P,则两种价格指数间的关系如下:t

所以,对于年度价格指数而言,当能够找到以特定年度为基期的价格指数,但缺乏以上年为基期的价格指数时,可以特定年度为基期的价格指数推导出以上年为基期的价格指数。

其次,季度价格指数分为季同比价格指数和定基比季度价格指数。季同比价格指数指以上年同一季度为基期的价格指数,定基比季度价格指数指以特定时期为基期的价格指数。如根据CEIC数据库,2015年第4季度中国居民消费价格指数同比为1.468%,同期中国以2010年=100的定基比居民消费价格指数为115.200。若记t年度i季度特同比价格指数为P,t年度i季度以特定时期为基期的价格指数为Pti,定时期=100,则两种价格指数间的关系如下:ti,

根据CEIC数据库,2014年第四季度以2010年=100的定基比居民消费价格指数为113.533,根据式(3-2)得(115.200/113.533-1)×100%=1.468%,即为2015年第四季度居民消费价格指数同比数据。

值得一提的是,由于价格波动呈现较强的季节特性,多数国家会对季度价格数据进行季节调整。所谓季节调整是指依据时间序列所包含的4种变动要素(即长期趋势要素、循环要素、季节变动要素和不规则要素)对数据进行相应调整,以去除其中的季节变动要素所带来的影响。Census X12季节调整方法是最常用的季节调整方法,具体做法请参阅高铁梅(2009)。

另外,我国还公布一种累计同比价格指数,分别有1季度同比价格指数、1~2季度同比价格指数、1~3季度同比价格指数、1~4季度同比价格指数。显然,1~4季度同比价格指数等同于以上年为基期的年度价格指数,1季度累计同比价格指数与1季度同比价格指数相同。但1~2季度(半年)同比价格指数和1~3季度(前三季度)累计同比价格指数与季同比价格指数间并无直接对应关系。在引用这类数据时需加以注意。

最后,月度价格指数分为月同比价格指数、月环比价格指数和定基比月度价格指数。月同比价格指数指以上年同月为基期的价格指数,月环比价格指数指以上月为基期的价格指数,定基比月度价格指数则是以特定时期为基期的价格指数。如根据2016年1月《中国经济景气月报》,2015年12月我国同比居民消费价格指数为101.6,环比居民消费价格指数为100.5。

需要指出的是,月度居民消费价格指数与季度和年度居民消费价格指数间的关系比较复杂,并不能直接进行转换,详见何新华(2006)的讨论。第三节通货膨胀率预测

构建动态因子模型时应遵循的变量选取原则已在前一章中讨论过。具体到构建通货膨胀率动态因子模型的实践,笔者遵循了以下原则。首先,从经济学的角度出发,选取对通货膨胀率有直接影响的诸多变量(见本章第一节)形成一个初选的数据集。其次,对该初选的数据集从统计学的角度出发,通过计算各变量与通货膨胀率间的相关系数,剔除其中与通货膨胀率相关性较小的变量后形成最终用于构建通货膨胀率动态因子模型的数据集。

在实际对G20经济体通货膨胀率动态因子模型的建模中,由于受到数据来源等多方面的限制,尽管不同经济体选取的变量不尽相同,但在遵循上述原则的基础上,对多数经济体的通货膨胀率动态因子模型的构建中仅选用了30个左右的变量。

自2015年年初开始,依据本研究项目所建动态因子模型做出的[1]预测结果相继被公布在互联网上。从实际经济运行情况看,预测结果令人满意。例如,2015年3月5日,笔者预测我国CPI将逐步企稳回[2]升而并非如绝大多数人所预期的将陷入负增长;2015年5月13日,[3]笔者预测CPI同比增长率为负的概率已降至零。事实上,2015年我[4]国CPI同比增长率的最低点为0.8%,出现在2015年1月。再如,2015年5月12日,笔者的预测结果显示,美国CPI年内月同比增长率将运行在2%以下,据此笔者大胆做出了与绝大多数人完全不同的判[5]断:“年内美联储加息的可能性极小!”2015年12月9日,笔者依据[6]预测结果判断“美联储12月份加息已成定局”。事实上,美联储2015年12月16日例会后宣布了加息决定。又如,2015年5月22日,笔者依据预测结果判断“俄罗斯通货膨胀率年底降至11%左右的目标恐[7]难实现”。事实上,2015年12月俄罗斯通货膨胀率仍高达12.9%。[8]2015年5月26日,笔者的预测显示英国陷入通货紧缩的可能性较大。根据目前已公布的数据,2015年英国CPI同比自2月份起一直在-0.1%~0.1%区间波动,并且9月、10月两月连续出现了同比-0.1%。

国际货币基金组织每年春、秋两季发布《世界经济展望》报告,其预测结果在世界经济研究领域有很高的影响力。对其2014年春季(4月8日公布)和秋季(10月7日公布)报告进行分析发现,春季对G20经济体CPI的预测与实际值相比,平均绝对误差为0.6个百分点,秋季对G20经济体CPI的预测与实际值相比,平均绝对误差为0.3个百分点。国内最具影响的“经济蓝皮书”亦分春、秋两季对中国CPI进行预测(春季报告在每年4~5月出版,秋季报告最初在10月出版,但近年逐渐推后,至今出版日期已推迟至年初,故本年前11个月份的CPI数据已公布)。2010~2014年“经济蓝皮书”春季报告对CPI的预测与实际值相比,平均绝对误差为0.7个百分点;秋季报告对本年CPI的预测与实际值相比,平均绝对误差为0.1个百分点;秋季报告对次年CPI的预测与实际值相比,平均绝对误差为1.2个百分点。

相比之下,笔者采用动态因子模型所给出的CPI点预测结果,经与实际值进行比较,第一个月的平均绝对误差为0.149个百分点,第二个月的平均绝对误差为0.205个百分点,第三个月的平均绝对误差为0.281个百分点,第四个月的平均绝对误差为0.377个百分点,第五个月的平均绝对误差为0.574个百分点,第六个月的平均绝对误差为[9]0.934个百分点。

由于笔者所有的预测结果均以区间预测而非仅仅点预测的形式给出,客观上使预测结果更具参考价值。以区间预测的形式给出预测结果,在当前国内宏观经济预测领域尚属首例,在国际宏观经济预测领域也是不多见的。第四节G20经济体通货膨胀率动态因子模型建设情况

在2012年本研究项目正式立项后,经过数年的努力,G20经济体通货膨胀率动态因子模型相继建成(见表3-1),并自2015年年初开始投入使用,但由于种种原因不仅各经济体模型的建成时间跨越了整整一年,而且对阿根廷通货膨胀率动态因子模型的建设最终也只能选择了放弃。表3-1 G20通货膨胀率动态因子模型建设进度第五节通货膨胀率动态因子模型建模实践中遇到的问题

尽管笔者对G20各经济体通货膨胀率动态因子模型的建模实践证实了这一宏观经济预测手段是可行的,并且其预测结果也达到了令人满意的精度,为进一步开展有效的通货膨胀率预测带来了希望,但是笔者的建模实践也发现了动态因子模型所面临的不少挑战。下面略举几例。

笔者在建模中遇到了三种来自数据方面的挑战。图3-1 巴西失业率

资料来源:CEIC数据库。

第一种情形,虽然名称相同,但数据序列长度不一,定义不同,难以组合成一个跨越整个样本期的完整的时间序列。例如CEIC数据库中有关2000~2016年巴西失业率统计有三个序列(见图3-1):第一个(序列1353701)时间跨度为2000年1月至2002年12月,所注明的数据来源为巴西央行(Central Bank of Brazil);第二个(序列1355101)时间跨度为2001年10月至2016年2月,所注明的数据来源为巴西地理与统计研究所(Brazilian Institute of Geography and Statistics);第三个(序列367049217)始自2012年3月,所注明的数据来源也是巴西地理与统计研究所,是目前巴西失业率唯一一个仍在更新的序列。根据数据库中的说明,编码为1355101的数据序列仅包括了累西腓、萨尔瓦多等6个城区,而编码为367049217的数据序列则扩展至对20多个城区的统计。从重合时段的数据看,巴西央行与巴西地理与统计研究所的指标显然不同,而从定义看巴西地理与统计研究所的两个失业率统计序列也存在巨大差异。巴西通货膨胀率模型始建于2016年1月8日(见表3-1),当时考虑到采用第二个序列仅缺少2000年1月至2001年9月的数据,而这部分数据处于模型样本期的初期,对未来的通货膨胀率预测影响较小,故选用了第二个序列。然而2016年2月起该数据序列停止更新后,仍在更新中的第三个序列至2016年底仅有57个数据点,2012年2月及以前的数据又因口径与第二个序列差异较大无法据以补齐,在动态因子模型中缺少失业率数据是否会对模型的预测产生大的影响还有待进一步观察。

第二种情形,原本正常更新的数据序列不再更新,并且不存在可替代序列的情形亦较常见。例如,CEIC数据库中有关巴西实际工资指数(Real Average Wage Index,编码256109901)的数据时间跨度为2000年12月至2015年12月(数据来源为巴西地理与统计研究所),之后不再更新。遗憾的是,搜遍CEIC数据库也未能找到可以替代这一序列的相关数据。无奈之下,在后期更新时笔者只能放弃这一原本有益于预测CPI走势的序列。当多个时间序列同时出现此类情形时,对已建成的动态因子模型而言自然是灾难性的,也就是说,我们不得不重新选取数据,构建一个全新的动态因子模型。

第三种情形,由于意外冲击导致原有数据序列波动异常。例如,由于日本于2014年4月1日起将消费税率自5%上调至8%,日本月同比CPI增长率从2014年3月的1.6%迅速上升至2014年4月的3.4%,而一年之后则从2015年3月的2.3%迅速回落至2015年4月的0.6%。于2015年5月19日建成的日本通货膨胀率动态因子模型虽然明确给出了通货[10]膨胀率即将迅速下降的预测,但由于当时基础数据截至2015年3月,笔者对通货膨胀率迅猛下降的时点还是出现了近两个月的误判。不过好在当前笔者的动态因子模型的运行速度有了较大的提升,新数据公布之后可以迅速校正预测结果,一定程度上可以弥补其对转折点预测的时效性(见图3-2)。图3-2 日本通货膨胀率

资料来源:CEIC数据库。

建模实践中笔者还发现,采用不同样本区间所建立的动态因子模型存在较大的不同,而与理论上应保持相对稳定的假设相左。例如,在对中国通货膨胀率建模的过程中,当样本期为2000年1月至2015年1月时,笔者得到了图3-3中所示的3个动态因子。而当样本期为2000年1月至2015年3月时,笔者则得到了图3-4中所示的3个动态因子。两个不同样本期中所得到的动态因子并不相同。其实,这一结果从动态因子模型的建模过程中很好理解。图3-3 中国CPI动态因子模型中所提取的动态因子(1)

注:样本期2000年1月至2015年1月。

资料来源:笔者计算。图3-4 中国CPI动态因子模型中所提取的动态因子(2)

注:样本期2000年1月至2015年3月。

资料来源:笔者计算。

为避免因计量单位的不同对所提取的因子产生影响,在提取动态因子之前需要先对用于提取动态因子的数据集中的序列进行标准化。当样本区间不同时,各序列的均值和标准差绝非理论上假定的保持不变,而是会有所差异,这样一来在样本区间发生变化后,实际上我们[11]所得到的是一个全新的数据集。尽管这个数据集与之前的数据集在进行标准化之前大部分是重合的,但在这个全新的数据集中所提取的动态因子肯定不会完全与之前所提取的动态因子重合。当然如果考虑到因数据统计口径和对历史数据进行更新,抑或是因某些数据序列已停止更新而不得不重新选取数据进行替代时,新提取的因子将更加偏离之前所提取的因子。

不过,尽管孤立地看各动态因子间存在差异,但当将每次所提取的动态因子进行综合时,其中所包括的信息却是高度一致的,因而将其用于对相关变量的预测所产生的结果也是值得期待的。详见第五章中的相关分析。

[1] http://xinhuahe.blog.sohu.com/.

[2] http://xinhuahe.blog.sohu.com/308054206.html.

[3] http://xinhuahe.blog.sohu.com/308795031.html.

[4] 我国公布CPI数据的时滞为10日左右,2015年2月份的数据于3月10日公布。

[5] http://xinhuahe.blog.sohu.com/308781232.html.

[6] http://xinhuahe.blog.sohu.com/310847268.html,本文阅读量超过7000人次。

[7] http://xinhuahe.blog.sohu.com/308885581.html.

[8] http://xinhuahe.blog.sohu.com/308923688.html.

[9] 以上统计包括对加拿大、美国、中国、英国、法国、德国、意大利、欧盟、俄罗斯等2015年3月至2015年10月所做的预测。

[10] http://xinhuahe.blog.sohu.com/308843180.html.

[11] 请注意,这里尚不包括因数据统计口径和对历史数据进行更新所带来的变化。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载