高频金融数据建模:理论、方法与应用(txt+pdf+epub+mobi电子书下载)


发布时间:2021-04-04 00:46:48

点击下载

作者:张波

出版社:清华大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

高频金融数据建模:理论、方法与应用

高频金融数据建模:理论、方法与应用试读:

前言

20世纪90年代以前,学者们对金融市场进行实证研究所依据的数据都是日、周、月、季度或者年度等频率数据,这种金融数据在金融计量学研究领域通常称为低频数据.由于金融市场往往是连续运行的,基于低频数据的金融市场研究无疑会造成大量有用市场信息的损失.因此一种能更准确地描述金融市场运行原始特征的高频数据呼之欲出.所谓高频数据(high frequency data)即日内数据,是指在金融市场运行过程中以小时、分钟、秒或实际交易间隔为采集频率的数据.近年来,随着计算机与通信技术的迅猛发展,记录、收集、存储和操作金融市场实时交易数据的成本大大降低,越来越多的学者、市场交易者开始尝试寻找和挖掘埋藏在海量、高频交易数据中的金矿.高频金融数据建模理论与实证研究成为金融、统计、计量经济学等学科的热门研究题目,高频交易模式也逐渐在华尔街等主流金融市场流行.我们自2006年开始学习高频金融数据的研究方法,通过多年的科研、教学积累,在该领域取得了一定的成绩和进展,部分研究成果也得到了学界的认可.我们对近几年在高频金融数据研究领域取得的研究成果进行了归纳、梳理,并集结成书,希望本书能为对该领域感兴趣的研究人员、金融从业者提供有价值的参考.

本书共14章,按照内容可分为4大部分.第一部分包括绪论、预备知识、证券市场微观结构3章,主要给出高频金融数据研究的背景和现状、必备的数学知识背景、证券市场运行的基本知识等内容.第二部分为第4~8章,主要介绍基于高频数据的积分波动率和瞬时波动率的估计问题.第三部分为第9~11章,主要研究了高频金融数据中普遍存在的跳跃行为,主要包括一维和多维情况下跳跃行为的检验方法及跳跃特征行为的研究.第四部分为第12~14章,主要内容为我们构建的已实现向上和向下幂变差的理论结果及在此基础上扩展出来的正负跳跃度量与交易量、日内序列相关性之间关系的实证研究.本书可作为高等院校金融专业、统计专业本科生和研究生教材,也可以作为金融从业人员的参考书目.由于作者知识水平有限,选题也限于作者的兴趣,本书难免存在疏漏,欢迎广大读者不吝赐教.

香港科技大学数学系荆炳义教授在百忙之中阅读了本书初稿并提出了宝贵的意见和建议,特此致谢!本书是中国人民大学科学研究基金项目成果(中央高校基本科研业务费专项资金资助,编号10XNL007),作者对中国人民大学的支持表示感谢!著者2015.4第1章绪论1.1高频金融数据

近年来,受经济全球化、金融自由化及金融创新加速等因素的影响,金融市场规模迅速扩大、效率明显提高的同时,资产价格的波动性和风险也大为加剧.从亚洲金融危机到美国次贷危机引发的全球金融危机,金融市场剧烈震荡等极端事件频繁发生,既使金融机构和个人投资者遭受巨额损失,也给金融体系稳定及宏观经济政策设计带来了巨大挑战.在此背景下对我国金融市场价格运行规律、信息传导机制等市场微观结构进行深入研究,并在此基础上有效识别、测度与管理各种金融风险,对于有效防范与规避风险、控制恶性风险事件的冲击、维护金融系统安全具有重要意义.

20世纪90年代以前,学者们通常只能利用日、周、月、季度或者年度等频率的数据对金融市场的上述问题进行研究,这类金融数据通常被称为低频数据.近年来,计算机技术的快速发展使得数据存储成本大幅降低,证券交易所和数据服务商开始提供高频数据供学者和金融从业人员使用.所谓高频金融数据(high frequency data)即金融资产的日内交易数据,是指在金融市场运行过程中以小时、分钟、秒或更高频率采集的数据.相比于传统的低频率数据,高频数据的一个显著特征就是数据量大.从理论上说,金融市场中的信息会连续不断地对资产价格的动态过程产生影响,采集频率越高,信息丢失则相对越少.当数据采集频率逐渐增高时,数据所包含的资产价格信息渐近接近于理论上连续时间的资产价格模型.因此,高频金融数据包含金融资产价格更丰富的信息,能提供对金融市场更精细的分析,这正是研究高频数据的一大优势.此外,高频数据不仅包含丰富的资产价格信息,还包含众多其他维度的信息,例如交易的时间间隔、交易量、买卖价差,等等,这些不同的信息维度对于理解市场价格的形成、信息的传递机制等市场微观结构方面的特征具有相当重要的作用.因此,高频数据有助于对市场微观结构、波动性以及风险测度与管理等传统金融问题进行全新的审视,具有重要的研究价值.

然而另一方面,高频数据又具有与传统的日、周、月、季度或者年度等低频时间序列数据不同的数据特征.例如,受市场交易规则的影响,日内的高频交易价格一般都具有最小变动单位,资产价格数据的取值是离散化的.另外,交易的非同步性以及市场摩擦都会导致数据的实际观测值与理论值之间存在偏差,这类偏差通常称为市场微观结构噪声.现有的研究已经证实市场微观结构噪声的影响会导致具有良好理论性质的计量方法在高频数据的实际应用中失效.正是高频金融数据具备的这些独特特征,给高频数据的理论和实证研究带来了巨大的挑战,从而促使高频数据的研究成为近二十年来计量经济领域研究的热点问题之一.1.2应用领域

高频金融数据有助于对金融市场的微观结构、波动性、资产价格的动态规律以及风险度量等问题进行深入研究,具有广泛的应用背景.本节将对高频数据的这些理论和应用研究领域做简要介绍.1.2.1 市场微观结构

金融市场微观结构的概念有狭义与广义之分.狭义的市场微观结构仅指市场价格发现机制,广义的市场微观结构则是各种交易制度的总称,包括价格发现机制、清算机制与信息传播机制等.关于市场微观结构的研究对象和内容,许多学者从不同的角度给出了不同定义.按O'Hara(1995)的说法,市场微观结构研究“给定交易规则下,资产的交换过程及其结果”.主要包括有关交易机制的研究,在特定交易规则下价格在资产交易中的动态形成过程,交易机制对交易的结果,即资源配置和信息是否有效,以及相应的社会福利最大化等问题.Madhavan(2000)认为“市场微观结构研究投资者的潜在需求最终转化为价格和交易量的过程”.Engle(2002)从信息和高频金融数据研究角度出发,认为市场微观结构理论主要研究金融资产价格如何根据新信息进行调整,以及交易机制如何影响资产价格.由于市场微观结构的研究内容丰富、包罗万象,本节我们主要介绍基于高频数据的日内收益率序列相关性研究,以及交易机制,例如开收盘机制,对波动性的影响研究.1.日内收益率序列相关性

在市场微观结构领域,对资产收益率序列相关性进行研究具有重要的意义,因为资产收益率序列的相关性有助于揭示交易过程的基本特征.Fama(1970)的弱式市场有效性假说认为收益率序列应该不存在序列相关性.如若不然,则资产价格过程就在某种程度上可以预测,即理性交易者可以通过预测资产价格获得超额收益.国内外很多关于弱式市场有效性假说的实证研究显示个股和股指的日收益率序列不存在序列相关性,即支持股票市场弱式有效性的假说.但是也有一些实证结果拒绝了股票市场弱式有效性的假说.Roll(1984)的研究显示个股收益率序列存在负的序列相关性.Atchison(1987)的研究表明股指收益率序列存在正的序列相关性.Lo和MacKinlay(1988,1989)构建了方差比检验(variance ratio test)来研究个股和股指收益率序列的序列相关性,并构建理论模型解释了股指收益率序列存在正序列相关是因为异步交易现象(asynchronous trade)的存在.Goodhart和Figliuoli(1991)、McNish和Wood(1991)的实证结果显示收益率序列存在负的一阶序列相关.以上的实证研究虽然结果不同但都是基于日收益率序列、周收益率序列甚至是月收益率序列等低频数据的.近年来,随着高频和超高频数据的数据质量和可获得性的提高,很多学者利用高频和超高频数据来研究资产收益率序列的序列相关性问题.Low和Muthusuamy(1996)最先利用高频数据研究收益率序列相关性,他们利用方差比检验研究了不同汇率收益率序列相关性问题,并得到了存在负的序列相关性的结论.Thomas和Patnaik(2003)利用方差比检验研究了印度股市个股和股指收益率序列的序列相关性问题,并研究了序列相关与流动性之间的关系.他们的研究显示个股收益率序列呈现出显著的负相关,而股指收益率序列则不存在显著的序列相关性.Bianco和Reno(2006)的研究显示由于买卖跳动效应的影响意大利股指期货收益率序列存在负的序列相关,并且序列相关与波动率之间存在着关系.Bianco和Reno(2009)研究了美国S&P500股指期货收益率的序列相关性,其实证结果显示收益率序列存在负相关,序列相关与总的日波动率呈正相关而与未预期到的波动率呈负相关.国内学者于亦文等(2005)利用方差比检验检验了上证综指5分钟高频数据收益率序列的序列相关问题,其结果显示收益率序列存在显著的正自相关性.吴斌哲等(2008)研究发现上证综指收益率序列大约具有20分钟的时间相关性且在5~15分钟存在负的序列相关.2.开收盘机制对波动性的影响

证券交易机制是指有组织的证券交易场所为履行其基本职能而制定的与证券交易有关的运作规则,它的重要功能之一是使潜在的投资需求转化为实际交易,发现市场的出清价格.这种证券价格的形成机制,能够将投资者的潜在需求和对证券未来走势的预期用实际的价格和成交量反映出来.在古典的经济学理论中,经济学家认为价格是供求关系平衡的结果,和交易机制没有太大的关系.但是现实的市场并非如此,现实市场中不仅存在交易成本,而且信息也各不相同,市场参与者不只是以达到供求平衡为目标,更多地,他们看中的是如何充分利用市场信息使自己的收益最大化.所以,在考虑证券价格发现过程和收益率序列波动性的时候,我们必须考虑交易机制的不同对它们的影响.

世界上现有的证券交易机制主要分为三种:连续竞价交易机制、集合竞价交易机制和做市商交易机制.但常见的只有连续竞价和集合竞价两种.连续竞价是指交易者在输入其买卖指令后,只要系统中有能与其匹配成交的存量指令,输入的指令即可立即执行,因而,在交易时间内,任何时点上交易都可发生,其成交价格完全由“即时”的市场供求订单决定.集合竞价是在规定时间内将订单数量累积到一定数量后再通过竞价最大限度地实现订单执行的一种价格生成机制,集合竞价的成交价为“单一”价格,所有执行成交的订单均按该价格成交.中国大陆证券交易市场的开收盘机制大致如此.每个交易日上午9:15~9:25为集合竞价阶段,由此产生的证券当日的第一笔成交价形成开盘价格.接下来从9:30开始为连续竞价阶段,中午11:30到下午1:00休市,从1:00开始直接进入连续竞价阶段,下午3:00以后收市,并形成收盘价.收盘价是当日该证券最后一笔交易前一分钟所有交易的成交量加权平均得到的价格.当日没有成交的,以前收盘价作为当日收盘价.集合竞价这种价格决定方式有较好的价格发现功能,对市场的影响成本比较小.开盘价格是市场每个交易日产生的第一个价格,它包含了由于隔夜没有发生交易而累积的市场信息,以及很多未透露的“黑箱”信息,并且它对之后的证券价格变动有着重要影响.这对于弄清楚证券市场的微观结构有着十分重要的作用.收盘价格则包含了一整天的市场信息的累积,也有着不可忽视的地位.

国内外学者对开收盘机制以及它们如何影响证券价格进行了深入研究.Garman(1976)发现交易系统有一个演变模式,即随着交易量的增加,交易机制通常由集合竞价模式转向连续竞价模式.Amihud和Mendelson(1987)研究了开盘机制对证券价格变动的影响,他们对纽约证交所道琼斯指数的30种成分股的开盘价格收益率和收盘价格收益率作了检验,发现开盘价格收益率方差大于收盘收益率方差,显示了开盘相对于收盘波动性更大.Muscarella和Piwowar(2001)对巴黎交易所的股票进行研究发现,从连续竞价到集合竞价的转换降低了股票的交易量和交易价格.王春峰等(2005)采用上证180的100只典型个股样本对上海股市开收盘的波动性进行了实证研究,结果表明我国股市开盘回报的波动性显著大于收盘波动性.他们还进一步对影响波动性的因素进行考察,认为开盘方式和开盘交易过程中释放的私人信息是造成上述现象的重要原因.黄剑(2007)利用EGARCH模型,对2000年1月至2007年4月间沪深两市具有代表性的股票及指数的开收盘收益率的波动性进行实证分析,结果表明收益率序列有明显的ARCH效应,其波动性具有显著的非对称性的冲击的持续性;在样本期内,上交所的个股和指数未能观察到开盘波动性高于收盘波动性的现象,而深交所个股在2006年7月实施收盘集合竞价机制之后比较明显地观察到开盘波动性高于收盘波动性的现象.许香存等(2007)运用上海A股股票的交易数据,对开盘竞价透明度提高前后的价格变化进行了实证分析,结果表明开盘竞价的透明度提高之后,由开盘到连续竞价价格变化的幅度明显减小,连续竞价开始后15分钟内的价格波动率也减少.进一步,根据价格随着信息的变化而进行调整的过程,得到开盘竞价透明度增加能够提高开盘竞价收集信息的功能,稳定连续竞价市场的结论.1.2.2 市场波动性

波动性是金融市场的重要特征,它与市场的不确定性和风险直接相关,是体现金融市场质量和效率的有效指标,同时也是证券组合理论、资产定价模型、套利定价模型及期权定价公式的核心变量.因此,如何有效地刻画金融市场波动的动态行为一直是金融市场学研究的热点问题.尤其在金融经济波动频发,各国金融市场相互依存,全球金融风险不断扩大的经济环境下,深入探索波动的本质及其规律性对于金融风险防范与规避具有重大的理论与实际意义.在传统的低频数据研究领域,对波动性的研究主要通过建立时间序列模型,最有代表性的是GARCH族模型和SV族模型.这两类模型都能很好地刻画金融资产收益率序列波动的各种特性,在实际中有很广泛的应用.但由于高频金融数据所具有的一些独特特征,在低频数据领域具有很好拟合效果的GARCH族模型和SV族模型对于高频金融数据波动率建模效果不佳.近年来,在基于高频数据的波动率研究中,积分波动率这一类非参数波动率测度受到广泛关注.究其原因,主要是因为它不仅充分利用了日内的高频数据信息,而且在价格服从扩散过程的假设下,积分波动率正好是价格过程的二次变差,它的计算不依赖于模型具体形式,极为简便.1.波动率非参数估计

自Andersen和Bollerslev(1998)提出利用日内高频数据计算已实现波动率用以评价ARCH类模型的预测能力之后,越来越多的学者对这种事后的积分波动率的非参数估计问题进行了研究.Barndorff-Nielsen和Shephard(2002)证明了当资产价格过程服从扩散模型时,已实现波动率是积分波动率的一致估计量,并给出了中心极限定理.Christensen和Posolskij(2005)提出利用日内价格极差信息构造已实现极差波动率来估计积分波动率,同样证明了扩散模型假设下估计量的一致性与中心极限定理.当资产价格过程包含跳跃行为时,Barndorff-Nielson(2004,2006,2007)提出了二次幂变差与多次幂变差过程,得到了对跳跃稳健的积分波动率估计量.Christensen和Posolskij(2006)结合Barndorff-Nielson的思想提出了对跳跃稳健的已实现极差二次变差过程.Mancini(2004,2009)提出了阈值已实现波动率.积分波动率的估计是近二十年来高频数据领域研究的热点问题,它实际上刻画的是过去某段时间内波动的总量特征,Kristensen(2010)指出在更多场合下,瞬时波动率的估计对于投资者更实用、更有意义,尤其对于市场上出现的越来越多的高频交易者而言,他们需要比传统时间单位更为精细的日内风险测度,这就需要利用高频数据对日内的瞬时波动率进行估计.

对于瞬时波动率的估计,在低频领域常见的有ARCH、GARCH类模型、SV模型,而在高频领域,这些模型都不再适用,为了避免设定任一模型所带来的误差,非参数估计提供了很好的解决方法.一般而言,瞬时波动率,即价格过程中的扩散函数是既随时间变化又与价格水平有关的,然而由于实际中我们只能观测到价格过程的一条路径,没有足够的信息去确定这样一个二元函数,因此目前的研究都只单独考虑与时间或者价格水平有关的一元扩散函数的非参数估计问题.当价格过程服从扩散过程时,Foster和Nelson(1996)最早提出了rolling window估计量;Fan,Jiang和Zhang(2003)考虑了期限结构模型的时变扩散函数的非参数估计问题;另外Andreou和Ghysels(2002),Fan,Fan和Lv(2007),Mykland和Zhang(2003,2006)都研究了时变扩散函数的非参数估计问题;Bandi和Phillips(2003)利用核方法估计了与价格水平有关的扩散函数.当价格过程中包含跳跃时,Bandi和Nguyen(2003)以及Johannes(2004)在跳跃过程具有限活跃度且有界的假设下得到了与价格水平有关的扩散函数的核估计:Mancini和Renò(2006)分别在模型包含有限活跃度和无限活跃度跳跃行为的情况下给出了与价格水平有关的扩散函数的核方法估计.而对于时变的扩散函数的研究却相对较少,只有Kristensen(2010)给出了当价格过程服从扩散模型时瞬时波动率的核估计方法,将已实现波动率与瞬时波动率的估计联系了起来,并指出当价格过程包含跳跃时可以结合幂变差过程与核估计方法来估计跳跃扩散模型里的扩散函数.另外,Fan和Wang(2008)利用核方法给出了瞬时波动率矩阵的非参数估计.2.波动率建模

大量研究结果表明,高频金融数据存在很多低频数据所没有的特征和信息,传统的低频波动率模型不再适用.许多学者在研究已实现波动率序列特征的基础上,提出了基于高频数据的波动率建模方法.Corsi(2004)基于异质市场假说,将三类市场参与者的投资行为分别对应波动率的三种异质市场驱动因素,提出了不同波动率驱动成分的简单叠加模型HAR-RV.Barndorff-Nielsen和Shephard(2004)提出了已实现二次幂变差(realized bipower variation)将波动率分解为连续部分和跳跃部分.Andersen,Bollerslev和Diebold(2007)利用Barndorff-Nielsen和Shephard(2004)提出的方法对Corsi(2004)的模型进行了扩展,构建了HAR-RV-CJ模型,研究了波动率中跳跃部分和连续部分对波动率预测精度的影响.Brandt和Jones(2006)研究表明高低极差(high-low range)可以显著地提高波动率预测的精度.Ghysels,Santa-Clara和Valkanov(2006)提出了绝对幂变差(absolute power variation),指出该统计量可以很好地对波动率进行预测.Engle和Gallo(2006)将已实现波动率与GARCH模型相结合,以利用高频数据信息提高日波动率预测精度.

大量实证结果表明,金融资产收益率序列的波动具有显著的非对称性.目前国外学者将波动非对称性的产生机制主要归结为杠杆效应(leverage effect).Black(1976)和Christie(1982)研究发现美国股票的当期收益率与未来波动存在负相关关系,并试图解释个股收益的这种不对称波动特征,他们将此现象解释为杠杆效应,即在其他条件不变的条件下,股票价格的下跌导致公司价值的降低,增加债务/权益比率,从而加剧波动性和持股风险.反之股票价格的上升会降低债务/权益比率,减少波动性和持股风险.因此,股票当前收益和未来波动之间负相关.Nelson(1991),Engle和Ng(1993),Glosten,Jagannathan和Runkle(1993)将杠杆效应引入GARCH族模型的建模中,取得了良好的拟合和预测效果.以上对波动非对称性的研究都是基于低频数据的,近年来,有少数学者利用高频数据研究了波动非对称性的建模问题.Barndorff-Nielse,Kinnebrock和Shephard(2009)提出了已实现半方差(realized semi-variance)来度量高频金融数据的下方风险,并将已实现半方差引入波动率模型的建模中以研究波动的非对称性.Visser(2008)提出了向下绝对幂变差(downward absolute power variation)并将其引入GARCH族模型的建模中以提高对未来波动率的预测精确度.Corsi和Reno(2009)对HAR-RV-CJ模型进行了进一步的推广,加入了杠杆效应的影响,构建了LHAR-RV-CJ模型.

近年来,国内不少学者也对基于高频数据的市场波动性问题进行了研究.施红俊、马玉林和陈伟忠(2003)总结了关于已实现波动率的研究成果.张伟、李平和曾勇(2008)对中国股票市场的个股进行了已实现波动率的估计.徐正国和张世英(2004),唐勇和刘峰涛(2005)则比较了已实现波动率、GARCH模型和SV模型对波动率的预测能力,通过实证研究表明已实现波动率优于其他波动率模型的预测结果,并阐述了后两种方法的维数灾难等问题.在波动率的长记忆性研究方面,陈梦根(2003),王春峰、张庆翠和李刚(2003)对中国股市的长记忆性进行了实证研究.徐正国和张世英(2004)提出了用调整已实现波动来降低其测量误差,并且用ARFIMAX模型来研究这个调整的已实现波动率的长记忆性.李胜歌和张世英(2007)讨论了在估计波动率时二次幂变差和多次幂变差的有效性问题.目前,国内也有大量学者对HAR-RV模型进行研究与推广.西村友作和门明(2009)采用跳跃显著性检验方法、HAR-RV-J及HAR-RV-CJ模型进行了深证成指已实现波动率的跳跃特征研究.他们发现中国股市的已实现波动率发生显著性跳跃的频率高、幅度大,但是有些跳跃成分不影响未来波动率的预测.同时,陈国进和王占海(2010)对沪深300指数进行了分析,分离出已实现波动率中的连续性波动和跳跃性波动序列,并检验了这两种波动成分的统计性质和杠杆效应.他们发现,我国A股市场的连续性波动与跳跃性波动都具有显著自相关性,并且这种滞后相关性较美国股票市场要更为长久,而杠杆效应在考察期内则不显著.1.2.3 资产价格跳跃行为

传统的资产价格模型以效率市场理论(EMH)为基础,认为资产价格主要反映经济体及企业自身基本面的变化.然而,我们在现实的金融市场观察到,即使经济基本面或者企业基本面没有出现显著变化,资产价格也有可能出现极端波动;同时,未预期到的信息如企业特殊事件或者央行公告等事件的披露也会使资产价格出现极端波动.近年兴起的行为金融学更是指出,即使没有任何实体经济面的变化,投资者心理变化也会导致极端的资产价格变动.近年来基于高频数据的实证研究结果也印证了我们在现实金融市场中观察到的资产价格运动的跳跃行为.学界关于资产价格模型的研究主要分为连续时间模型和非连续时间模型.连续时间资产价格模型构建一直是金融领域的热点问题,大量学者对该问题进行了深入研究并取得了一系列重要的成果.粗略地说,金融资产价格连续时间模型构建经历了如下几个阶段.(1)扩散过程(连续路径)

扩散过程是最基本的资产价格模型.在扩散过程中,资产价格被假定来源于连续过程,即资产价格运动路径是连续的.例如,Black和Scholes(1973),Merton(1973)提出的著名的期权定价模型即假定资产价格服从隶属于扩散过程的几何Brown(布朗)运动.(2)跳扩散过程(扩散过程+大跳)

金融市场不时出现的极端资产价格变化使人们意识到用连续时间扩散过程构建资产价格模型存在一定的局限性,有学者开始利用跳跃扩散过程来构建资产价格模型.跳跃扩散过程包括用来解释价格过程中连续性波动的扩散过程及解释价格极端变化的跳跃过程,如Merton(1976)对扩散过程进行扩展加入了Poisson跳跃过程.Aït-Sahalia,Wang和Yared(2001),Andersen,Benzoni和Lund(2002),Ball和Torous(1985),Bates(1996),Duffie,Pan和Singleton(2000)也分别从理论和实证角度对跳跃扩散过程进行了研究.(3)纯跳过程(大跳+小跳)

纯跳过程仅使用跳跃过程来对资产价格进行建模,即资产价格运动过程仅由市场本身引起的微小跳跃过程和由企业特殊事件或者央行公告等事件的披露导致的资产价格极端波动组成.一些学者认为对资产价格建模时没有必要包含连续成分,如Geman,Madan和Yor(2001),Carr,Geman,Madan和Yor(2002)认为由市场出清条件引起的资产价格应该构建为一纯跳过程模型而不包含连续鞅成分.(4)Itô(伊藤)半鞅(扩散过程+大跳+小跳)

Itô半鞅是描述资产价格过程最一般化的模型,它包括连续成分、大跳和小跳,即资产价格运动过程由资产价格的连续性运动、市场本身引起的微小跳跃过程和由企业特殊事件或者央行公告等事件的披露导致的资产价格极端波动三部分组成.实际上,样本总是在离散时间上观测到的.所以,通过样本决定一个金融时间序列是否能由扩散过程、跳跃过程或两者的组合构建模型就变得十分重要.在大跳发生的情况下,对于数据集直观的判断就足以解决这一问题.但是对大多数实际时间序列的直观判断并不能提供小跳是否存在的清晰证据.由于频繁发生的小跳无疑应该包含在资产价格模型中,而且模型中是否含跳跃会使模型具有不同的数学性质并导致期权套期保值、资产组合优化等金融实践活动产生不同的结果,所以解决这一问题的统计方法就变得极为重要.

连续时间扩散过程模型已经成为金融研究的一个简便工具,它提供了市场完备性和无套利衍生定价公式,这些假设在Black-Scholes期权定价模型及相关的动态对冲策略的有效性中十分关键.但大量的理论和实证研究表明连续时间扩散过程模型难以准确地描述现实中的资产价格运动.自Merton的开创性论文以来,金融计量经济学界对资产价格跳跃行为的研究进行了深入的研究,相关文献回顾可见Cont和Tankov(2004).随着高频数据的可获得,有部分学者研究了通过样本确定资产价格过程是否存在跳跃的统计检验问题.Aït-Sahalia(2004)使用转移函数构造了判断跳跃是否存在的参数检验方法.Carr和Wu(2003)基于高频数据研究了短期期权的微分性质并以此为基础构造了跳跃是否存在的检验方法.Barndorff-Nielsen和Shephard(2004,2006)提出了跳跃稳健波动率估计量——已实现二次幂变差,并基于已实现方差和二次幂变差之间的差值构建了跳跃检验统计量.Cont和Mancini(2011)提出了已实现门限积分波动率并根据该波动率估计量构造了跳跃检验方法.Fan和Wang(2007)利用小波技术对资产价格过程中的跳跃成分进行剥离并据此提出了跳跃检验方法.Jiang和Oomen(2008)基于对方差掉期复制策略应用Itô公式构造了跳跃检验统计量.Lee和Mykland(2008)通过对已实现收益率进行标准化得到了非参数的跳跃检验方法.Aït-Sahalia和Jacod(2009)根据已实现幂变差的渐近理论性质提出了确定资产价格过程中跳跃是否存在的非参数检验方法.

近年来,国内学者对基于高频数据的资产价格过程跳跃行为相关问题进行了研究.李胜歌和张世英(2007)研究表明跳跃行为对于股票市场波动过程具有重要影响.王春峰、姚宁、房振明和李晔(2011)以上证综指数据为研究对象,研究了已实现波动率中的跳跃行为,他们发现已实现波动率中的连续成分占据了波动率的主要部分,但是跳跃行为对波动率也有显著的影响.沈根祥(2010)构造了跳跃行为的Hausman检验统计量并对沪深300指数高频数据进行了分析,研究发现沪深300指数样本区间内有三分之一以上的交易日存在跳跃行为.陈国进和王占海(2010)根据Barndorff-Nielsen和Shephard(2004,2006)的思路研究了中国股票市场的跳跃行为,他们发现中国股票市场的跳跃行为比美国股票市场具有更长期的滞后相关性.王春峰、郝鹏和房振明(2011)基于高频数据特征构建了跳跃检验及估计跳跃时刻和规模的统计方法,并研究了跳跃的特征及跳跃与信息融人效率之间的关系.杨科和陈浪南(2011)基于中国股票市场数据运用核估计量及修正的已实现门限多次幂变差估计跳跃行为及相应的跳跃特征.1.2.4 风险度量

Markowitz(1952)提出的均值-方差理论是现代资产组合理论的重要理论基础.在这一理论框架下,描述资产价格收益率不确定性的方差被作为风险的替代变量.虽然方差在数学计算上比较简单,但是当收益率分布为非对称分布时,用方差度量风险存在明显的不足.实际上,根据Kahneman和Tversky(1979)的研究,投资者对于投资损失更为敏感,而作为风险度量的方差不能反映出投资者对于投资损失的关注.Markowitz(1959)也意识到了方差作为风险度量的缺点,他提出用半方差作为风险度量并将均值-方差模型扩展到了均值-半方差模型.Granger(2008)指出一项投资风险主要与较低收益甚至负收益有关,收益率分布的左尾构成了下方风险.从风险厌恶投资者的视角来看,在金融实践活动中,下方风险的定义更能反映投资者对于损失的关注.实际上,下方风险理论并不是金融计量经济学领域的新理论,目前已经有大量的学者对该理论进行了深入的研究.对下方风险进行度量和建模可以回溯到Roy(1952)提出的“安全第一准则”.Roy的安全第一准则首次提出了某一资产组合收益率低于某一设定投资目标的概率最小的风险控制准则,并据此进行了最优资产组合的选择.紧接着,Markowitz(1959)提出的半方差风险度量吸引了大量金融计量经济学家及金融从业者的关注.Mao(1970)指出对于金融决策者而言半方差能更好地度量风险.另一个广义的下方风险度量是下偏矩,该风险度量只考虑低于某一投资目标的负收益(Bawa(1975,1977),Fishburn(1977)).近年来,由于风险价值(value-at-risk)和期望损失(expected shortfall)在风险管理和监管领域的广泛应用,下方风险又吸引了大量学者的关注.Sortino和Stachell(2001)对下方风险理论及其最新发展进行了详细的叙述和总结.

20世纪90年代以来,高频金融数据的可获得促使高频金融计量经济学迅猛发展.但是,到目前为止国内外学界仅有几篇文献涉及基于高频数据的下方风险度量和建模.Barndorff-Nielsen,Kinnebrock和Shephard(2009)提出了基于高频负收益率构建的已实现向下半方差来度量下方风险.在该篇文献中,他们证明了已实现向下半方差的中心极限定理并指出该风险度量对于未来波动率预测的良好性质.另一个基于高频数据构造的下方风险度量是Visser(2008)提出的向下绝对幂变差.在该篇文献中,Visser利用高频数据负收益构造了向下绝对幂变差并将其引入GARCH模型以提高波动率预测精度,但该文没有给出关于向下绝对幂变差的理论性质.从投资者角度来看,下方风险度量虽然更能反映投资者对于损失的关注,但是不同投资者对于风险的认识不同.对于股票市场卖空的投资者而言,股票价格的下跌反而会给他们带来不菲的收益,而股票价格的上涨将导致他们的损失.Markowitz(1959)在提出向下半方差的同时也提出了向上半方差.同样,Barndorff-Nielsen,Kinnebrock和Shephard(2009)也基于高频正收益率构建了已实现向上半方差(realized upside semivariance)并推导了其理论性质.1.3本书的主要内容

本书在总结前人研究成果的基础上利用金融市场高频数据对市场微观结构、资产价格的跳跃行为、高频波动率测度以及下方风险度量等问题进行了研究.这些研究结果有助于深刻理解金融市场的价格形成和信息传导机制,能为投资者的投资策略优化、风险管理、监管部门的市场监管等提供有效的理论指导与决策支持,具有重要的理论和实践意义.本书共14章.第1章对高频金融数据及其应用领域进行了简要介绍.第2章介绍了本书中要用到的一些预备知识.第3章对我国金融市场的微观结构进行了简介,以便读者了解我国高频金融数据的产生机制.第4~14章是本书的主要内容,包括高频数据波动率测度、资产价格的跳跃行为、下方风险度量以及日内高频收益率序列特征、价格跳跃、交易量等市场微观结构问题的理论和实证研究.下面对本书的各章节内容作具体介绍,以便读者阅读.

第1章是本书的绪论部分,主要介绍了高频金融数据及其应用领域,以及本书的结构及主要内容.

第2章对本书要用到的一些预备知识进行了总结,主要包括Brown运动、Itô积分、扩散过程、Lévy过程、鞅以及半鞅等相关基础知识.

第3章对证券市场的微观结构基础进行了简要的介绍,主要包括证券市场微观结构的概念、范畴和组成及中国证券市场微观结构组成等部分.该部分的内容能使我们更深入地理解中国证券市场的微观结构,以便对高频数据的产生背景和机制有更全面的了解.

第4章主要介绍目前文献中常见的几种利用高频数据估计积分波动率的代表性方法.本章分别在价格过程服从连续的扩散过程、资产价格包含跳跃以及考虑实际价格受市场微观结构噪声污染这三类情形下介绍了积分波动率的估计方法.

第5章主要介绍了当资产价格服从扩散过程的假设下,如何利用高频数据对瞬时波动率进行估计,重点介绍了瞬时波动率的核估计方法.

第6~8章主要研究资产价格在服从连续的扩散过程,以及包含非连续的“跳跃”行为,和实际观测值受市场微观结构噪声污染的三种情形下瞬时波动率的非参数估计问题.在资产价格过程服从跳扩散过程假设下,利用阈值方法抑制跳跃的影响,提出了瞬时波动率的阈值核估计量,研究了估计量的统计性质,并对不同的统计量进行了模拟对比研究.进一步,考虑资产价格受市场微观结构噪声污染情况下,提出了用预平均阈值核估计量对瞬时波动率进行估计,并探讨了估计量的统计性质,最后对估计量的估计效果进行了模拟研究.

第9~11章对资产价格过程中的“跳跃”行为进行了研究,包括对一维资产“跳跃”的检验方法、多维资产的“共同跳跃”检验方法,以及跳跃活跃度指数等跳跃特征的研究.

第12章基于高频数据构造了广义的下方风险度量——已实现向下幂变差,并在对数资产价格是Itô半鞅过程的假设下得到了已实现向下幂变差的渐近理论性质并利用蒙特卡洛模拟对理论结果进行了验证.

第13~14章利用中国股票市场高频数据研究了股指和个股的负跳跃和正跳跃行为,研究了日内序列相关性、交易量分别与跳跃稳健波动率、负跳跃及正跳跃之间的关系.第2章预备知识基于本书对于随机过程、随机分析的基本知识的需求,本章对Brown运动、Itô积分、扩散过程、Lévy过程、鞅以及半鞅等相关基础知识做简要介绍.对于相关内容的详尽论述请见Meyer(2001)、Øksendal(2006)、Applebaum(2009).2.1Brown运动2.1.1 基本概念与性质

定义2.1 随机过程是概率空间上的一族随机变量{X(t),t∈T},其中t是参数,属于某个参数集T.

常用的参数集有T={0,1,2,…}或T=[a,b],其中a,b可以分别取-∞,∞.t一般表示时间,当T={0,1,2,…}时,称为时间序列.在对相关金融问题建模时,我们通常考虑的T是非负实数集的一个子集.随机过程{X(t,ω),t∈T,ω∈Ω}也可视为定义在T×Ω上00的二元函数.对于固定的样本点ω∈Ω,X(t,ω)就是定义在T上的一个函数,称为X(t)的一条样本路径或一个样本函数,而对于固定的时刻t∈T,X(t)=X(t,ω)是概率空间上的一个随机变量,其取值随着试验的结果而变化,变化有一定的规律,称为概率分布.

下面介绍另一个重要概念:Brown运动.我们首先从简单的随机游动开始.假设有一个粒子在直线上随机游动,在每个单位时间内等可能地向左或向右移动一个单位的长度.现在加速这个过程,在越来越小的时间间隔中以越来越小的步长移动.若能以正确的方式趋于极限,我们就得到Brown运动.详细地说,令该粒子每隔∆t时间等概率地向左或向右移动∆x的距离.如果以X(t)记时刻t粒子的位置,则(2.1)其中[t/∆t]表示t/∆t的整数部分,其中i且假设诸X相互独立ii由于E[X]=0,Var[X]==1及(2.1)式,有E[X(t)]2=0,Var[X(t)]=(∆x)[t/∆t].现在要令∆x和∆t趋于零,并使得极限有意义.如果取∆x=∆t,令∆t→0,则Var[X(t)]→0,从而X(t)3=0,a.s..如果取∆t=(∆x),则Var[X(t)]→∞,这是不合理的.因为粒子的运动是连续的,不可能在很短时间内远离出发点.因此,我们作下面的假设:令,σ为某个正常数,从上面2的讨论可见,当∆t→0时,E[X(t)]=0,Var[X(t)]→σt.

下面来看这一极限过程的一些直观性质.由(2.1)式及中心极限定理可得:2(1)X(t)服从均值为0,方差为σt的正态分布.

此外,由于随机游动的值在不相重叠的时间区间中的变化是独立的,所以有(2){X(t),t≥0}有独立增量.

又因为随机游动在任一时间区间中的位置变化的分布只依赖于区间的长度,可见(3){X(t),t≥0}有平稳增量.

下面我们就给出Brown运动的严格定义.

Brown运动 随机过程{X(t),t≥0}如果满足:(1)X(0)=0;(2){X(t),t≥0}有平稳独立增量;2(3)对每个t>0,X(t)服从正态分布N(0,σt).则称{X(t),t≥0}为Brown运动,也称为Wiener过程.常记为{B(t),t≥0}或{W(t),t≥0}.

如果σ=1,称之为标准Brown运动,如果σ≠1,则可考虑{X(t)/σ,t≥0},它是标准Brown运动.故不失一般性,可以只考虑标准Brown运动的情形.

由于这一定义在应用中不是十分方便,我们不加证明地给出下面的性质作为Brown运动的等价定义,其证明可以在许多随机过程的著作中找到.

性质2.1 Brown运动是具有下述性质的随机过程{B(t),t≥0}.(1)(正态增量)B(t)-B(s)~N(0,t-s),即B(t)-B(s)服从均值为0,方差为t-s的正态分布.当s=0时,B(t)-B(0)~N(0,t).(2)(独立增量)B(t)-B(s)独立于过程的过去状态B(u),0≤u≤s.(3)(路径的连续性)B(t),(t≥0)是t的连续函数.

下面给出关于Brwon运动的概率计算的例子.

例2.1 设{B(t),t≥0}是标准Brown运动,计算P{B(2)≤0}和P{B(t)≤0,t=0,1,2}.

解 由于B(2)~N(0,2),所以P{B(2)≤0}=.因为B(0)=0,所以P{B(t)≤0,t=0,1,2}=P{B(t)≤0,t=1,2}=P{B(1)≤0,B(2)≤0}.虽然B(1)和B(2)不是独立的,但由性质2.1的(2)和(3)可知B(2)-B(1)与B(1)是相互独立的标准正态分布随机变量,于是利用分解式B(2)=B(1)+(B(2)-B(1))我们有

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载