应用时间序列分析(txt+pdf+epub+mobi电子书下载)


发布时间:2020-11-15 01:10:08

点击下载

作者:何书元

出版社:北京大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

应用时间序列分析

应用时间序列分析试读:

前言

时间序列分析是概率统计学科中应用性较强的一个分支,在金融经济、气象水文、信号处理、机械振动等众多领域有着广泛的应用.本书以时间序列的线性模型和平稳序列的谱分析为主线,介绍时间序列的基本知识、常用的建模和预测方法.在内容上强调平稳序列的频率特性,注重解释功率谱的统计含义.为了便于读者了解估计方法的可使用性,本书还就估计方法作了随机模拟计算,顺便介绍了随机模拟的基本方法.

时间序列分析已经有完整的理论系统,许多理论结果对于应用有重要的指导意义,但是部分定理的证明又涉及到更多的预备知识.由于本书以介绍基本的应用理论和方法为主,所以在叙述上采取避重就轻,将部分定理的证明略去,将需要以泛函分析和条件数学期望作为基础的内容打上星号“”,供读者选择使用.不带“”的内容是本书的基本内容.

作者从20世纪80年代末开始在北京大学讲授“应用时间序列分析”课程,并长期从事时间序列分析方面的应用和研究工作,在地震预测、气象和金融数据分析、时间序列的不完全观测和异常值处理等方面都做过实际项目,特别对潜周期模型的参数估计和应用以及对时间序列的频谱特性等都有较深体会.多年来,北京大学的时间序列分析讨论班在江泽培教授的带领下取得了许多研究成果,其中的部分成果在理论和应用上具有特色,借此机会作者也将适用的内容介绍出来,以表达对江泽培先生的感激之情.本书作为讲义在2002年秋使用时,姬志成等同学对讲义进行了认真的校对,作者对他们表示衷心的感谢.

由于本人水平有限和时间仓促,书中难免有不妥之处,希望读者不吝指教.何书元2003年2月于北京大学第一章 时间序列【答案链接】

时间序列是按时间次序排列的随机变量序列.任何时间序列经过合理的函数变换后都可以被认为是由三个部分叠加而成.这三个部分是趋势项部分、周期项部分和随机噪声项部分.从时间序列中把这三个部分分解出来是时间序列分析的首要任务.本章通过举例介绍了时间序列的分解方法,介绍了时间序列和随机过程的关系,重点介绍了平稳序列的性质.§1.1 时间序列的分解A. 时间序列

按时间次序排列的随机变量序列

X1,X2,… (1.1)

称为时间序列.如果用

x1,x2,…,xN (1.2)

分别表示随机变量X1,X2,…,XN的观测值,就称(1.2)是时间序列(1.1)的N个观测样本.这里N是观测样本的个数.如果用

x1,x2,… (1.3)

表示X1,X2,…的依次观测值,就称(1.3)是(1.1)的一次实现或一条轨道.

在实际问题中所能得到的数据只是时间序列的有限观测样本(1.2).时间序列分析的主要任务就是根据观测数据的特点为数据建立尽可能合理的统计模型.然后利用模型的统计特性去解释数据的统计规律,以期达到控制或预报的目的.

为了表达方便,我们用{Xt}表示时间序列(1.1),用{xt}表示观测样本(1.2)或(1.3).为了表达简单,有时还用X(t)表示Xt,用x(t)表示xt.

例1.1 北京作为古都,历史上自然灾害频繁发生.在各种自然灾害中,水旱灾害发生的机遇最多,危害最大.表1.1.1列出了北京地区1949至1964年的洪涝灾害面积的数据(单位:万亩,来源见文献[2]).表1.1.1 北京地区洪涝灾害数据

现在考虑受灾面积.用X1表示第1年(1949年)的受灾面积,X2表示第2年(1950年)的受灾面积等等.X1,X2,…,是一列按时间次序排列的随机变量,因而是一个时间序列.用x1,x2,…,x16分别表示第1年,第2年,…,第16年的实际受灾面积,则

x1=331.12, x2=380.44, …, x16=55.36

是时间序列{Xt}的观测样本.样本量N=16.它是时间序列{Xt}的一次实现的一部分.

如果用Y1,Y2,…,Y16分别表示第1,2,…,第16年的成灾面积,则

y1=243.96, y2=293.90, …, y16=41.90

是时间序列{Yt}的16个观测样本.时间序列的观测样本可以用数据图1.1.1表出.图1.1.1 北京地区洪涝灾害数据图,虚线是成灾面积

由于{Xt}和{Yt}之间存在着相关关系,所以还需要研究向量值的时间序列

ξt=(Xt,Yt)T, t=1,2,…,

这里和以后AT表示向量或矩阵A的转置.向量值的时间序列又称为多维时间序列.我们将在第九章进行介绍.

类似地,时间序列可以表示:(1)某地区的月降水量.(2)某航空公司的逐日客流量.(3)北京地区每月的煤炭消耗量.(4)某渔业公司的逐月水产品的产量.(5)某国家的逐月失业率.B. 时间序列的分解

上述例子中,时间指标都是等间隔排列的.为了研究和叙述的方便,如果没有特殊说明,本书中时间序列时间指标都是等间隔排列的.时间序列分析的主要任务就是对时间序列的观测样本建立尽可能合适的统计模型.合理的模型会对所关心的时间序列的预测、控制和诊断提供帮助.大量时间序列的观测样本都表现出趋势性、季节性和随机性,或者只表现出三者中的其二或其一.这样,可以认为每个时间序列,或经过适当的函数变换的时间序列,都可以分解成三个部分的叠加

Xt=Tt+St+Rt, t=1,2,…, (1.4)

其中{Tt}是趋势项,{St}是季节项,{Rt}是随机项.时间序列{Xt}是这三项的叠加.

通常认为趋势项{Tt}={T(t)}是时间t的实值函数.它是非随机的,因而不是本书考虑的重点.相应于时间序列{Xt}的分解(1.4),观测样本{xt}也有相应的分解.为研究问题的方便,在不引起混淆的情况下,我们往往不对{Xt}和{xt}进行严格区分.在研究和关心数据的统计性质时常用大写的Xt,在用于数据的计算时常用小写的xt.

时间序列分析的首要任务是通过对观测样本(1.2)的观察分析,把时间序列的趋势项、季节项和随机项分解出来.这项工作被称为时间序列的分解.在模型(1.4)中,如果季节项{St}只存在一个周期s,则

S(t+s)=S(t), t=1,2,….

于是,{St}在任何一个周期内的平均是常数

把模型(1.4)改写成

Xt=(Tt+c)+(St-c)+Rt, t=1,2,…,

就得到新的季节项{St-c}.它仍有周期s且在任何一个周期内的和是零.于是,在模型(1.4)中可以要求

同理,可以要求随机项的数学期望等于零,即

ERt=0, t=1,2,…. (1.6)

例1.2 下面的表1.1.2中的数据是某城市1991~1996年中每个季度的民用煤消耗量(单位:吨).数据图形由图1.1.2给出.表1.1.2 某城市居民季度用煤消耗量 (单位:吨)图1.1.2 例1.2的数据图和分段趋势

下面通过对例1.2中的数据分析,介绍几种常用的分解时间序列的方法.

方法1 分段趋势.

从数据图1.1.2可以看出,数据随着季节的变化有明显的周期s=4.从年平均看出,数据有缓慢的逐年上升趋势.最直接和最简单的方法是把趋势项{Tt}定义成年平均值.例如对1≤j≤4,是1991年的数据平均(见图1.1.2).这样得到

利用原始数据{xt}减去趋势项的估计得到的数据基本只含有季节项和随机项.可以用第k季度的平均值作为季节项S(k),1≤k≤4的估计.如果用xj,k,Tj,k分别表示第j年第k个季度的数据和趋势项,则时刻(j,k)的时间次序指标为k+4(j-1).

这时,.最后,利用原始数据{xt}减去趋势项的估计和季节项的估计得到的数据就是随机项的估计(见图1.1.3):图1.1.3 季节项和随机项

方法2 回归直线趋势.

由于数据有缓慢的上升趋势,可以试用回归直线表示趋势项.这时认为(xt,t)满足一元线性回归模型

xt=a+bt+εt, t=1,2,….

定义(a,b)T的最小二乘估计由公式

决定,经计算得到

回归方程为

xt=5780.1+21.9t.

这时,趋势项{Tt}的估计值是回归直线(见图1.1.4):图1.1.4 数据和直线趋势项

利用原始数据{xt}减去趋势项的估计后得到的数据基本只含有季节项和随机项.仍可以用第k季度的平均值作为季节项S(k)的估计.利用方法1中的公式(1.7)计算出

这时,.

最后,利用原始数据{xt}减去趋势项的估计和季节项的估计后得到的数据就是随机项的估计,1≤t≤24.见图1.1.5.图1.1.5 季节项和随机项

为得到1997年的预报值,可以利用公式

这里,是用例1.2中的24个观测数据对第24+k个数据的预测值.经计算得到1997年的预测值为:

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载