具体实施方式
下面结合附图及实施案例对本发明作进一步描述:
一种基于结构推理的多干旱指数融合方法,包括:
首先对各个符号做定义:
隐性状态(latent state){l0...lN-1},模式变量(model variable)(也可以看做是隐性状态)m1和m2;
观测值序列 (t=1,...,T),其中,T为时间序列的维度;
初始状态、模式概率分布P(lt=1(i))、 和 简记为 和
隐性状态转移概率P(lt(i)|lt-1(i′)),(i,i′=1,...,N),简记为 或隐性状态转移矩阵P(lt|lt-1),简记为al;
模式转移概率和 (j,j′,k,k′=0,1),分别简写为 和 或模式转移矩阵和分别简记为am1和am2;
观测值概率 简记为bi,j,k(Dt);或观测值概率矩阵 简记为b(Dt);
前向概率 和后向概率
1)、进行结构推理:
如图1a、1b所示:首先确定目标l和两特征x1和x2间的关系,通常存在4种可能的关系:a)与x1和x2相关,b)仅与x1相关,c)仅与x2相关,d)与x1和x2均无关;然后依据确定好的模式M1和M2,进行模型参数的估计,即模式选择和参数估计。具体为:
变量m1和m2控制模型的模式。m1和m2为二值模式,1表示相关(前景),0表示不相关(背景)。假设目标l的参数为Θl,x1和x2的前景参数分别为Θ1和Θ2,背景参数为Θb,那么,联合概率可以表示成:
由公式(1-1)可知,m1和m2不同的取值组合,可衍生出4种模式,即:
当m1=0,且m2=0时,
P(D|l,m1,m2)=P(x1|Θb)·P(x2|Θb) (1-2);
当m1=1,且m2=0时,
P(D|l,m1,m2)=P(x1|l,Θ1)·P(x2|Θb) (1-3);
当m1=0,且m2=1时,
P(D|l,m1,m2)=P(x1|Θb)·P(x2|l,Θ2) (1-4);
当m1=1,且m2=1时,
P(D|l,m1,m2)=P(x1|l,Θ1)·P(x2|l,Θ2) (1-5);
2)、对结构推理进行时间维度扩展:
如图2所示:FHMM在时间序列上的每一个时间点上仅有一个观测节点,但存在多个状态节点,lt、和均为状态节点,在FHMM中,层的特性仅允许同一层状态的转移,这样把状态分解成若干层,因此系统可以模拟几个松弛耦合的动态过程。
多干旱指数的融合处理,是给定观测值时间序列{D1,...,Dt′},估计最大后验概率 所对应的隐形状态l(t为当前时间节点),针对t′的取值条件,当t′=t时,其可理解为对时间序列的过滤化处理,即为在线操作,多干旱指数的过滤处理可表示为:
假设 那么,
而,
对公式(1-7)进行了符号简化,即:
而对于初始时刻,即t=1时,
由公式(1-8)和公式(1-9)可知,整个估计过程主要由状态先验概率分布 和 状态转移概率 和以及观测值概率bi,j,k(Dt)的参数控制。
模型参数包括初始状态概率分布、状态转移举证、观测值概率矩阵。对于FHMM模型的参数,采用EM(Expectation-Maximization)算法进行估计,对于EM算法,需给定模型参数的初始值,然后通过迭代完成参数的估计。
初始状态概率分布:即隐性状态(P(lt=1(i)))、模式 和 在t=1 时刻的先验概率,其中,i=0,...,N-1,j,k=0,1。可以通过统计历史数据获取该概率参数,概率初始化公式为:
其中, num(·)为统计符合条件个数的函数;符号≌表示不等于。
状态转移矩阵:由模型的定义及干旱监测应用可知,模式转移矩阵为2×2矩阵,而隐性状态转移矩阵为6×6矩阵(6种旱情状态),转移概率可以表示为:
其中,numl(i|i′)函数表示:对于l,从其i′状态转移到i的个数;同理, 和 分别表示从m1的j′状态转移到j状态的个数,和从m2的k′状态转移到k状态的个数。
观测值概率矩阵:为确定参数Θ1、Θ2和Θb,公式(1-2)~公式(1-5)中,P(x1|Θb)、P(x2|Θb)、P(x1|l,Θ1)和P(x2|l,Θ2)分别为6×1、6×1、6×6和6×6矩阵,按以下初始化公式:
对于FHMM模型参数的优化,采用前向-后向算法,如图3所示。在利用前向-后向算法进行参数求解之前,需确定FHMM模型的前向概率 和后向概率 根据前向概率的定义 我们可以通过公式(1-7)计算得到,而后向概率可表示为:
对其展开之后可表示为:
在给出前向概率和后向概率之后,我们还需定义两个变量:
a)、给定模型参数λ和观察序列D条件下,定义t时刻位于隐藏状态i,j,k和t+1时刻位于隐性状态i′,j′,k′的概率变量为
根据前向变量和后向变量的定义,上式可用前向、后向变量表示为:
b)、给定模型参数λ和观察序列D条件下,定义t时刻位于隐藏状态i,j,k的概率变量为
同样,该变量可由前向、后向变量表示为:
其中,分母的作用是确保
而上述定义的两个变量间存在如下关系:
对于时间轴t上的所有相加,可以得到一个总和,可以被解释为从其他隐藏状态访问i,j,k的期望值(所有时间的期望);或者,如果求和时不包括时间轴上的t=T时刻,那么可以被解释为从隐藏状态i,j,k出发的状态转移期望值,即相似地,如果对 在时间轴t上求和(从t=1到t=T-1),那么该和可以被解释为从状态i,j,k的到 状态i′,j′,k′的状态转移期望值,即
利用这两个变量及其期望值来重新估计FHMM模型,得到新的参数
由于不断地重新估计FHMM参数,在多次迭代后可得到FHMM模型的一个最大似然估计。
估计FHMM参数λ=(A,B,π),以最大化P(D|λ),即arg maxλP(D|λ)。其步骤为,
a)、初始化参数λ0;
b)、基于初始化参数λ0和观测值D计算出前向概率和后向概率
c)、利用和估计出以下期望频数:
c1)、从状态i转移到状态j的期望数量;
c2)、观测值Dt下,处于状态i,j,k的期望数量;
c3)、从状态i′,j′,k′开始的期望数量;
d)、利用期望频数,估计出新的λ;
e)、如果logP(D|λ)-logP(D|λ0)<ΔA,则迭代终止;
f)、否则,λ0=λ,并返回到步骤b)。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。