欢迎来到学术参考网

基于时间序列ARIMA模型的人民币汇率走势预测

发布时间:2015-12-14 12:01

摘 要:2010年6月19日,央行为进一步增强人民币汇率弹性,推出第二次人民币汇率形成机制改革。本文旨在研究第二次汇改后的人民币兑美元汇率的波动情况。本文为探究时间序列长度对预测准确性的影响,使用R软件选择出一个较为适用的模型即ARIMA模型,使用2010年6月19日至2011年7月19日的的人民币兑美元中间价进行拟合,并对未来半月汇率进行预测。同时,为对比长短与样本对预测精度的影响,又使用2011年1月1日至7月19日的交易日汇率数据进行预测。对比发现两中ARIMA模型对汇率预测均有效,而短样本预测精度较长样本更优。据进行预测。对比发现两中ARIMA模型对汇率预测均有效,而短样本预测精度较长样本更优。

关键词:ARIMA模型 汇率改革 汇率预测
  一、研究背景
  从时间序列角度研究人民币汇率的前期研究成果并不罕见。
  1997年,王祥云、范正琦使用ARMA模型对汇改前1996年的数据进行了相关研究。得出的结论是人民币汇率将在短期内稳定。该结论是正确的,但在汇改过后,由于政策性的变化,人民又在一次对人民币汇率进行了时间序列模型的拟合。
  2010年,赵天荣、李成使用了汇改后数据,利用二元VAR-GARCH模型,对汇率波动与利率波动的关系进行了研究,模型成功拟合并预测了汇率未来走势。同年,相瑞、陶士贵在《GARCH 模型检验人民币汇率趋势的有效性研究》得出结论,人民汇率水平将在短期内保持在现有水平。而从现阶段来看,从10年下半年开始到现在,人民币再一次进入了升值期。
  由此来看,预测是否成功与时间段的选取有重要关系,因此本文基于ARIMA模型使用长样本与段样本两种数据对未来汇率进行预测。本文选用的长样本数据是2011年6月19日-2011年7月19日的美元兑人民币数据进行预测,而短样本则是2011年以后的数据1。以下对模型的建立、拟合、预测进行详细的说明。  
  二、ARIMA模型拟合预测的基本步骤2
  (一)、根据时间序列的散点图、自相关函数和偏自相关函数图,或用ADF单位根检验判断序列方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来说,经济运行的时间序列都不是平稳序列。
  (二)、对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
  (三)、根据时间序列模型的识别规则,建立相应的ARMA模型。
  (四)、进行参数估计,检验是否具有统计意义。
  (五)、进行假设检验,诊断残差序列是否为白噪声。若通过白噪声检验,说明序列的信息已被提取完整,停止进一步分析。
  (六)、根据相应规则判定模型有效性后,利用已通过检验的模型进行预测分析。  
  三、数据处理
  本文使用外汇管理局网站上公布的2010年6月19日至2011年7月19日共265个交易日人民币兑美元中间价所转换的间接汇率作为人民币兑美元汇率的时间序列样本数据进行研究。我们的研究将进行两组模型的对比分析,目的是判别出何种方法可以更好的做出短期预测。第一组对比主要探究用哪一种模型对汇率进行拟合预测效果更好。下面我们分别用ARIMA模型与GARCH模型进行预测。
  3.1 长样本ARIMA模型的选定
  以下,我们按照第二章中的ARIMA模型拟合预测基本步骤对样本数据进行ARIMA模型拟合:我们首先对人民币兑美元的265个日数据进行平稳性检验。可知,该数据存在非常明显的上升趋势,一定是不平稳的。为避免主观因素,我们用ADF单位根检验对原序列进行平稳性判定。由R计算得,原序列ADF检验的P值为0.8567,在1%的显著性水平下无法拒绝序列存在单位根的原假设,即原序列不平稳。
  第二步,我们对原序列进行差分处理,试图使序列平稳。得出差分序列后,同样通过ADF单位根检验再次判定差分后的新序列的平稳性。可知,新序列ADF检验的p值为0.01,在1%的显著性水平下拒绝原假设,则差分后序列已平稳。
  第三步,在对原序列进行了平稳性识别以及平稳化处理后,我们根据相应的时间序列规则建立相应的模型。这里我们选用的是常用的AIC赤池信息原则3来选定模型。AIC赤池信息原则是衡量统计模型拟合优良性的一种标准。模型所对应的AIC值越小,模型的拟合程度越好。
  由R软件计算出的自相关系数和偏自相关系数,可知自相关系数acf在前6阶系数较大,而偏自相关系数则在前5阶系数相对较大,因此在确定ARIMA模型的p,q阶数时,应该比较ARIMA(p,1,q),其中p=1,2,…5;q=1,2,…6,三十种模型的AIC值,选取其中最小的一对系数作为我们拟合的模型系数。

阶数

Acf

0.153733

-0.01529

0.00073

-0.05451

0.090979

0.089475

-0.00311

-0.07823

-0.02477

-0.05502

Pacf

0.988045

0.037561

-0.0412

-0.02065

0.066592

-0.01139

-0.04224

-0.01807

0.025748

0.025464

  表3.1.1. 序列自相关系数及偏自相关系数
  通过R软件编辑程序,计算得出30种模型的AIC值,可知当p=2,q=1,时模型的AIC值最小为-3911.63,因此我们确定拟合模型为ARIMA(2,1,1)。
在选定的ARIMA(2,1,1)模型作为拟合模型后,我们对原序列进行拟合回归的参数估计,见表3.1.2。

ARIMA(2,1,1)

 

 

 

 

 

     ar1

ar2

ma1

intercept

Coefficients:   -0.7447

0.1448

1.0001

0.00E+00

 

      s.e.

0.0636

0.0637

0.0136

1.00E-04

 

sigma^2 estimated as 2.066e-08, log likelihood = 1959.81, aic = -3911.63

   表3.1.2. ARIMA(2,1,1)模型参数估计
  由上表的数据可运算得出系数均显著,因此符合统计意义。
  最后,我们对ARIMA(2,1,1)进行残差自相关检验,此处我们用的检验方法是ljung-box检验,由ljung-box的P值为0.8302,且原假设为残差各阶自相关系数均为零可知:p值大于置信水平,故不能拒绝原假设,则残差已为白噪声序列,可停止对序列进行分析。
  于是可写出ARIMA(2,1,1)的具体模型为:

  3.2半年样本ARIMA模型选定
  为研究样本长度对模型预测准确性的影响,我们选取原样本的后半段,即2011年1月1日至2011年7月19日共133个交易日人民币兑美元中间价所转换的间接汇率作为人民币兑美元汇率的时间序列样本数据进行研究。这里我们仅使用ARIMA模型进行研究方法与上一节 中长样本拟合方法类似得出模型具体形式为:

  四、模型对比分析与总结
  我们先分别计算出长样本ARIMA(2,1,1)与短样本ARIMA(1,1,0)两者的拟合值与实际值之间的差异,前者的平均误差为2.501099e-05,而后者小于前者为1.947257e-05,即ARIMA(1,1,0)拟合的更好。
  然后我们利用以上两模型分别对7月19日之后半个月的数据进行预测,作出折线图4.1.1。可看出,短样本ARIMA(1,1,0)拟合的更好,其平均预测误差为0.00007788,长样本ARIMA(2,1,1)的平均预测误差为0.0001025。
    图4.1.1. 长样本ARIMA与短样本ARIMA模型半月期预测与实际值比较

  从以上折线图可看出短样本预测值明显更加接近实际值,这似乎与我们通常所认为的样本越多预测越准确的常识不相吻合。但从时间序列的基本原理来看,这样的结果是可以接受的。时间序列的本质即通过分析历史数据的信息来预测未来数据的走势。当我们用长样本数据来进行拟合预测时,一些久远的数据很可能对未来数据的预测并没有太多的参考价值,但我们却使用了这些包含久远数据拟合出的模型对未来数据进行了预测,势必会干扰预测的准确性。另一方面,ARIMA模型本身的一大缺陷即在于没有考虑到一些外界可变因素的干扰作用,因此当样本较长时很可能会因这些外界干扰而出现异常值,从而降低预测的准确性,于是此时将样本长度缩小可能可以对模型预测的效果有所改善。
  综上所述,我们在对比长样本ARIMA模型以及短样本ARIMA模型时可以发现,短样本数据更能帮助我们改善汇率预测的准确性,原因可能是短期数据包含较少与未来预测数据相关性较小的久远数据,因此也不容易参杂可能的干扰数据。
参考文献:
[1]《人民币汇率与利率之间的动态关系》赵天荣,李成2010
[2]《VAR-GARCH 模型检验人民币汇率趋势的有效性研究》 相瑞,陶士贵,2009
[3]《ARCH类模型及其在时间序列分析中的应用》李奇松,2007
[4]《影响人民币汇率波动因素的研究》岳桂宁,杨柳芬,蒋桂湘,2005
[5]《时间序列分析方法及人民币汇率预测的应用研究》戴晓枫,肖庆宪,2005
[6]《ARMA模型在汇率时间数列预测中的应用》范正琦,王祥云,1997

上一篇:上证指数波动范围研究

下一篇:我国存款准备金发展研究