联系我们:微信:qhltcn | 微信群:点开扫码 | QQ:116589960 | QQ主群:65771077 | 量化编程群:84426168 | 外盘期货群:92869075 | 期货杂志群:15274076;
返回列表 发帖

赫斯特指数

赫斯特指数

有效市场假说(EMH)基本上说,由于即时价格已经反映了所有可获得的或公开的信息,未来的价格只能由新的信息决定。所有过去的信息既然已经被反映在价格里了,未来的价格只能有新的信息决定。市场于是就会遵循随机游动。每一天的价格运动与前一天的活动不相关。有效市场假说隐含地假定,所有投资者立即对价格作出反应,所以未来与过去或现在都不相关。基本的哲学暗示随机性和确定性不能共存。对于将中心极限定理应用于资本市场分析,这一假定是必不可少的。对于使用概率微积分和现行模型,中心极限定理又是必不可少的。

人们真的以这种方式决策吗?一般说,有些人确实一接受到信息就马上做出反应,然而,大多数人会等着确认信息,并且不等到趋势已经十分明显就不作出反应。证实一个趋势所需的确认信息的时间是不同的,但对于信息的不均等的消化可能会导致一个有偏的随机游动。

赫斯特指数

在构造一个模型时,一个普通的做法就是假定系统的不可控制的部分遵循随机游动。在处理一个有着许多自由度的大系统时,这是一个很普通的假设。当赫斯特决定检验这一假定时,给出一个新的统计量——赫斯特指数。如果序列是随机的,极差应该随时间的平方根增加。(遵循T1/2 法则。金融经济学上应用它来做易变性或标准差的年度化。)赫斯特利用这一原则检测数据的随机特性。为了使这个度量在时间上标准化,赫斯特决定通过用观测值的标准差去除极差来建立一个无量纲比率。由此,这种分析方法被叫做重标极差分析法。

赫斯特指数对于所有时间序列分析都有广泛的用途,因为它是特别强健的。他对于被研究的系统所要求的假定很少。而且它可以将时间序列分类。它可以把一个随机序列从一个非随机序列区分开来,即使随机序列是非高斯的也不要紧,赫斯特发现大多数自然系统都不遵循随机游动而遵循一种有偏的随机游动——一个趋势加上噪声。趋势的强度和噪声的水平可以根据重标极差随时间的变化情况来度量,即看H比0.5大多少。

假若有一时间序列x={ x[1],...x[n]} 代表n个连续值。对于市场来说,它可能是股票指数的价格的每日变化。时间系列X的均值Xm可定义如下:

Xm =(x[1]+...+x[n]) / n                                            

标准差Sn是:    Sn= sqr((x[r]- Xm) *  ((x[r]- Xm) /n))

重标极差:      Z[r] =(x[r] -Xm)   ;       (r=1,....,n)

则:Z  = Z[1]+...+Z[n] =0

产生一个累计离差时间序列 :Y[1] = (Z[1]+Z[r] ) ;   r = 2,..., n

由定义可知,最后一个Y(Y[n])将永远是零,因为Z有一个零均值。调整过的极差Rn是Y[n]的最大值减去最小值:

R[n]= max(Y[1]...Y[n])-min(Y[1],...,Y[n])

对于下标现在表明对于x[1],...x[n] 是个调整过的极差。因为Y已经被调整为零均值,Y的最大值总是大于或等于零,最小值总是小于或等于零。这样的调整的极差R[n]总是非负的。

这个调整的极差,R[n]是系统对于时间指数n遍历的距离。假如设n =T,能够运用等式R =sqr(T)  ,在时间序列x{...}对于n的增加值是独立的。对于不是布朗运动的时间序列一般化等式R =sqr(T) 并且解释非独立系统:

(R/S)[n] = c * pow(n,H)             对于下标n为x[1],...,x[n]的R/S的值,c = a常数

因为具有零的均值和以局部标准差形式的表现,这个等式被称作重标极差。在一般情况下,R/S值以增加的时间增量而规模变化,n,基于幂法则,值等于H,称作赫斯特指数。

分形规模依据逆幂法则在规模上递减,这个反幂函数值等于结构的分形维。在时间序列的情况下,我们诉诸从比较小到比较大的时间增量。而不是像肺一样,从较大到较小的枝节。再者它是分形的一个特征,尽管不是唯一的。重标极差分析也能描述没有特征规模变化的时间序列。

对(R/S)[n] = c *pow ( n, H )        两边取对数,很等变形得到:

log(R/S) =H*log(N)+log(c)

因此,找出R/S对于N的log/log 图的斜率可以给我们一个对于H的估计。这个H的估计量对于其背后的分布的形状未做任何假定。对于非常长的N我们会期望序列收敛到H=0.5 ,以为记忆效应会减弱到度量不到的那个点。换句话说,有着长H的观测在记忆效应耗散时会表现出类似于常规布朗运动或纯随机游动的性质。因此,回归应该用H收敛到0.5之前的数据进行。相关性度量并不适用于所有的增量。自相关函数在确定短期依赖性时很有效。倾向于低估非高斯序列的长期相关性。

R/S分析是一个极为强有力的工具。发现H =0.5 并不能证明一个高斯随机游动,他仅仅能证明没有长期的记忆过程。换句话说,任何独立系统,无论是不是高斯的,都会产生H=0.5。

赫斯特的经验法则:

赫斯特也给出一个公式用于从一个单个的R/S值估计H的值:

H= log(R/S ) / log(n/2)                                 其中n =观测次数

这个等式假定上一个一般式中的常数a等于0.5,该等式倾向于当H大于0.7时高估H,而在H<=0.4时低估H,在数据太少而不能做回归时,这个经验法则可以作为一个合理的估计。

根据统计学原理,如果序列是一个随机游动,H应该为0.5,.当赫斯特把它的统计量用于尼罗河的流出量时,他发现H=0.9 。他试了不同的自然现象,在所有场合,他都发现H比0.5大。当H不等于0.5 时,观测就不是独立的。每一个观测都带着在它之前发生的所有事件的记忆。这种记忆是长期的,理论上他是永远延续的。近期事件的影响比远期大,但残留的影响总是存在的。在更宽泛的尺度上,一个表现出赫斯特统计特性的系统是一长串相互联系的时间的结果。对于未来的影响可以表现为一种相关性:

C = pow(2,(2H-1)) - 1

其中: C=相关性度量 H=赫斯特指数

赫斯特指数有三个不同的类型:

1. H=0.5;

2. 0<=H<0.5;

3. 0.5<H <1.00

0.5< H <=1.00 我们就得到一个持久性的或趋势增强的序列。趋势增强的行为的强度或持久性,随H接近于1或C显示的相关性为接近100%的相关性程度而增加。对于下一个时间区间是和前一个时间区间的趋势相同的。趋势比较明显。暗示了一个持续的时间序列,而这一序列被长期记忆效用特征化了。从理论上讲,今天发生的一切都将永远影响将来。用混沌的话来说,就是,存在对初始条件敏感的依赖情形。这个长期记忆发生并不考虑时间的比例变化。所有逐日变化是相关所有未来的逐日变化;所有的周变化是相关于所有将来周的变化。不存在特征性时间规模变化,即分形时间序列的关键特征。H越接近于0.5,其噪声就越大。趋势就越不稳定。持久性序列是有偏的随机游动,偏移的强度依赖于H比0.5大多少。

0<= H <0.50 这一类型的系统是反持久性的或遍历性的时间序列。一个反持续性系统比随机系统覆盖较短的距离。因为一个系统覆盖较短的距离,他必然比随机过程较高的频率翻转自身。他经常被称为是“均值回复”的。如果一个系统在前一时期是向上走的,那么他在下一个期间多半是向下走的。这种反持久性行为的强度依赖于H距离零有多近。这种时间序列具有比随机序列更强的突变性或易变性。因为它是有频繁出现的逆转构成的。具有正统背景的理论家会将这一行为等同为均值回归过程。因此,反持续假定研究下的系统具有稳定的均值。分形理论没有做出这一假定。

H等于0.5标志着一个序列是随机的,事件是随机的和不相关的,C=0 ,现在不会影响将来。它的概率密度函数可能是钟型曲线,也可能不是。R/S分析可以区分一个独立的事件序列,其背后的分布形状是无关紧要的。赫斯特指数反驳了自然界服从正态分布的教条。H一般都比0.5大。

持久性时间序列在自然界很多。资本市场仅是其中的一例。然而是什么引起持久性呢?为什么它牵涉到记忆效应?

赫斯特指数的性质:

持久性时间序列,其定义为0.5< H<=1.0是分形,H描述了两个相邻事件发生的可能性。如果H=0.7,那么基本上可以说,要是上一个移动是正的,下一个移动也是正的可能性较高。这不是一种真正的概率。它仅仅是偏倚的度量。因为每一个点出现的可能性不是(像在随机游动中那样)相等的,所以概率分布的分形为维数不是2;它是1和2之间的一个数。H的倒数就是分形维数。一个随机游动确实是二维的,而且会填充一个平面。

当H增加时,累积线变得越来越光滑,参差不齐程度越来越小。系统中的噪声越来越少。而趋势或偏离平均值的离差则越来越明显。赫斯特指数度量一个时间序列的参差不齐的程度。一个完全确定的系统会产生一条光滑的曲线。一个分形时间序列把一个纯粹的随机序列从一个被随机事件扰动的确定性系统中分离出来。

分形维与赫斯特指数(H)

时间序列或随机游动的累积变化的分形维数是1.50.一条线的分形维数是1.0 ,一个几何平面的分形维数是2.0.。因此,一个随机游动的分形维数是在线和平面之间或1.50.

转换:

D= 2- H      H——赫斯特指数,D——分形维数

0.5<H <=1.0的值会产生一个更接近于一条线的分形维。也就是说,赫斯特术语中的持久性时间序列会导致一条比随机游动更光滑,更少参差不齐的线,H的一个反持久性的值(0<H<0.5)会导致一个更高的分形维和一条比随机游动更参差不齐的线,即一个有更多的逆转的系统。这当然精确地标志出一个反持久性序列。

赫斯特指数的倒数1/H和D是不同的,D是时间轨迹的分形维,而前者是概率空间的分形维度量。D度量的是时间序列的参差不齐性,而1/H度量的是概率密度函数尾部的肥胖性。分形还有另外两个特性,分形分布倾向于有趋势和循环。其次是容易有突然和激烈的逆转。在正态分布中一个大的变化是因为很大数目的小变化而发生的。定价被认为是连续的。这个连续定价的假定使得资产组合保险成为一种可能的实用钱财管理战略。在分形分布中,大变化是通过很小数目的大变化而发生的。大的变化可以是不连续的和突然的。

有两项重要信息可以从R/S分析确定:赫斯特指数和平均循环长度。循环长度的存在对于动量分析有着重要意义,H的一个不同于0.5的值意味着概率不是正态的,如果0.5<H<1,那么,序列是分形。分形时间序列与随机游动的行为是不同的。
期货论坛管理员,官方开户、量化、广告以及合作事宜,联系微信:qhltcn  QQ:116589960

返回列表