一种基于结构推理的多干旱指数融合方法
技术领域
本发明涉及一种基于结构推理的多干旱指数融合方法。
背景技术
随着全球气候变化的加剧,气温不断升高,干旱发生的频率和强度不断增强,干旱地区的扩大与干旱化程度日趋严重,干旱化趋势已成为全球关注的焦点。在长期无雨或少雨的情况下,土壤水分亏缺,蒸散作用使得农作物体内水分平衡严重失调,正常生理活动遭到破坏,从而引发农作物干旱事件。中国处于季风气候区,降雨分布不均,造成的干旱问题尤为突出,中国常年农作物受旱面积约2×107~2.7×107hm2,造成每年粮食损失约2.5×1010~3×1010kg,占各种自然灾害损失总量的60%左右。美国等一些涵盖农业产业的发达国家,同样不同程度地遭受着干旱的威胁。农业干旱是一个持续的过程,成灾范围一般呈片状,且干旱的发生、发展不受时间和空间的限制。目前,农业干旱监测主要采用干旱指数来反映干旱持续的时间和强度。世界气象组织(World Meteorological Organization)将干旱指数定义为:它是跟持续、异常的水分不足造成的累积效应相关的指数,应用较为广泛的干旱监测指数主要有两类:一类是基于传统地面气象观测数据的干旱指数,即气象干旱指数,该类指数都是基于单点观测,其空间上的监测精度受控于气象站点的分布密度,很难反映精细的干旱状况;另一类是基于卫星遥感信息的干旱监测指数,主要是应用多时相、多光谱、多角度遥感数据从不同侧面定性或半定量地评价土壤水分分布状况,具有覆盖范围广、时空间分辨率高等优点。各类农作物作为世界上主要的粮食作物品种,干旱的发生将直接造成粮食危机,威胁到人类的温饱水平,故有必要对其进行较为精细的旱情监测。
由于干旱自身的复杂特性和对社会影响的广泛性,干旱指标大都是建立在特定的地域和时间范围内,有其相应的时空尺度,单个干旱指标很难达到时空上普遍适用的条件。现行干旱监测方法虽有基于遥感和气象观测指标的多干旱指数融合模型,但并没有考虑数据本身在时空尺度上的有效性。
发明内容
本发明的目的是提供一种基于结构推理的多干旱指数融合方法。
为达到上述目的,本发明采用的技术方案是:
1、一种基于结构推理的多干旱指数融合方法,包括:
1)、进行结构推理,确定目标1的两个特征模式变量m1和m2,根据两个特征模式变量m1和m2的关系进行模式选择,对该模式下的联合概率进行估算;
2)、对结构推理进行时间维度扩展,其采用FHMM模型,获取FHMM模型参数, 将模型参数带入FHMM模型,估计当前时间点上多干旱指数的融合。
优选地,在1)中,包括m1和m2相关、仅m1相关、仅m2相关、m1和m2均无关四种模式。
优选地,在2)中,FHMM模型在时间序列上的每一个时间点上仅有一个观测节点,并包括多个状态节点,在该时间点t上的lt、和均为状态节点。
进一步优选地,对多干旱指数进行融合时,为对时间序列进行过滤化处理。
优选地,在2)中,模型参数包括初始状态概率分布、状态转移举证、观测值概率矩阵。
进一步优选地,初始状态概率分布通过统计历史数据获取。
进一步优选地,模型参数采用EM算法进行估计,先给定模型参数的初始值,通过迭代完成参数的估计。
优选地,在2)中,通过前向-后向算法对FHMM模型参数进行优化。
其中:
结构推理(Structure Inference)可看做是因果推论(Causal Inference)的子类,它们都是基于结果发生的条件,得出关于因果关联的结论,以两实体相关性的先验为基础,可指示当前它们之间的因果联系,但必须利用其它指标建立两实体因果联系的精确形式。
因子隐马尔可夫模型(Factorial Hidden Markov Model,FHMM)是HMM的一种扩展形式,采用更为复杂的状态结构来提升HMM模型的表征能力,通过松耦合的方式对多个随机过程进行建模。它假定系统存在着多条Markov链,形成了由若干层组成的信任网络,每一层都是一个状态变量的Markov过程,层与层之间统计独立,但是观测到的变量依赖于每一层的当前状态。
由于上述技术方案运用,本发明与现有技术相比具有下列优点和效果:
本发明顾及了各指数在时间维度上的有效性,优化了融合结果,对SPI指数和PA-VCI指数的错分、漏分现象有一定程度的改善,监测出的旱情在空间布局上较为集中,与DM监测的吻合度相对较好,因此,可为农作物旱情监测提供辅助手段。
附图说明
附图1a为本实施例中结构推理的变结构图示;
附图1b为本实施例中结构推理的变模式图示;
附图2为本实施例中FHMM模型图;
附图3为本实施例中前向-后向算法示意图。
具体实施方式
下面结合附图及实施案例对本发明作进一步描述:
一种基于结构推理的多干旱指数融合方法,包括:
首先对各个符号做定义:
隐性状态(latent state){l0...lN-1},模式变量(model variable)(也可以看做是隐性状态)m1和m2;
观测值序列(t=1,...,T),其中,T为时间序列的维度;
初始状态、模式概率分布P(lt=1(i))、和简记为和
隐性状态转移概率P(lt(i)|lt-1(i′)),(i,i′=1,...,N),简记为或隐性状态转移矩阵P(lt|lt-1),简记为al;
模式转移概率和(j,j′,k,k′=0,1),分别简写为和或模式转移矩阵和分别简记为am1和am2;
观测值概率简记为bi,j,k(Dt);或观测值概率矩阵简记为b(Dt);
前向概率和后向概率
1)、进行结构推理:
如图1a、1b所示:首先确定目标l和两特征x1和x2间的关系,通常存在4种可能的关系:a)与x1和x2相关,b)仅与x1相关,c)仅与x2相关,d)与x1和x2均无关;然后依据确定好的模式M1和M2,进行模型参数的估计,即模式选择和参数估计。具体为:
变量m1和m2控制模型的模式。m1和m2为二值模式,1表示相关(前景),0表示不相关(背景)。假设目标l的参数为Θl,x1和x2的前景参数分别为Θ1和Θ2,背景参数为Θb,那么,联合概率可以表示成:
由公式(1-1)可知,m1和m2不同的取值组合,可衍生出4种模式,即:
当m1=0,且m2=0时,
P(D|l,m1,m2)=P(x1|Θb)·P(x2|Θb) (1-2);
当m1=1,且m2=0时,
P(D|l,m1,m2)=P(x1|l,Θ1)·P(x2|Θb) (1-3);
当m1=0,且m2=1时,
P(D|l,m1,m2)=P(x1|Θb)·P(x2|l,Θ2) (1-4);
当m1=1,且m2=1时,
P(D|l,m1,m2)=P(x1|l,Θ1)·P(x2|l,Θ2) (1-5);
2)、对结构推理进行时间维度扩展:
如图2所示:FHMM在时间序列上的每一个时间点上仅有一个观测节点,但存在多个状态节点,lt、和均为状态节点,在FHMM中,层的特性仅允许同一层状态的转移,这样把状态分解成若干层,因此系统可以模拟几个松弛耦合的动态过程。
多干旱指数的融合处理,是给定观测值时间序列{D1,...,Dt′},估计最大后验概率所对应的隐形状态l(t为当前时间节点),针对t′的取值条件,当t′=t时,其可理解为对时间序列的过滤化处理,即为在线操作,多干旱指数的过滤处理可表示为:
假设那么,
而,
对公式(1-7)进行了符号简化,即:
而对于初始时刻,即t=1时,
由公式(1-8)和公式(1-9)可知,整个估计过程主要由状态先验概率分布 和状态转移概率和以及观测值概率bi,j,k(Dt)的参数控制。
模型参数包括初始状态概率分布、状态转移举证、观测值概率矩阵。对于FHMM模型的参数,采用EM(Expectation-Maximization)算法进行估计,对于EM算法,需给定模型参数的初始值,然后通过迭代完成参数的估计。
初始状态概率分布:即隐性状态(P(lt=1(i)))、模式和在t=1 时刻的先验概率,其中,i=0,...,N-1,j,k=0,1。可以通过统计历史数据获取该概率参数,概率初始化公式为:
其中,num(·)为统计
符合条件个数的函数;符号≌表示不等于。
状态转移矩阵:由模型的定义及干旱监测应用可知,模式转移矩阵为2×2矩阵,而隐性状态转移矩阵为6×6矩阵(6种旱情状态),转移概率可以表示为:
其中,numl(i|i′)函数表示:对于l,从其i′状态转移到i的个数;同理,和分别表示从m1的j′状态转移到j状态的个数,和从m2的k′状态转移到k状态的个数。
观测值概率矩阵:为确定参数Θ1、Θ2和Θb,公式(1-2)~公式(1-5)中,P(x1|Θb)、P(x2|Θb)、P(x1|l,Θ1)和P(x2|l,Θ2)分别为6×1、6×1、6×6和6×6矩阵,按以下初始化公式:
对于FHMM模型参数的优化,采用前向-后向算法,如图3所示。在利用前向-后向算法进行参数求解之前,需确定FHMM模型的前向概率和后向概率根据前向概率的定义我们可以通过公式(1-7)计算得到,而后向概率可表示为:
对其展开之后可表示为:
在给出前向概率和后向概率之后,我们还需定义两个变量:
a)、给定模型参数λ和观察序列D条件下,定义t时刻位于隐藏状态i,j,k和t+1时刻位于隐性状态i′,j′,k′的概率变量为
根据前向变量和后向变量的定义,上式可用前向、后向变量表示为:
b)、给定模型参数λ和观察序列D条件下,定义t时刻位于隐藏状态i,j,k的概率变量为
同样,该变量可由前向、后向变量表示为:
其中,分母的作用是确保
而上述定义的两个变量间存在如下关系:
对于时间轴t上的所有相加,可以得到一个总和,可以被解释为从其他隐藏状态访问i,j,k的期望值(所有时间的期望);或者,如果求和时不包括时间轴上的t=T时刻,那么可以被解释为从隐藏状态i,j,k出发的状态转移期望值,即相似地,如果对在时间轴t上求和(从t=1到t=T-1),那么该和可以被解释为从状态i,j,k的到 状态i′,j′,k′的状态转移期望值,即
利用这两个变量及其期望值来重新估计FHMM模型,得到新的参数
由于不断地重新估计FHMM参数,在多次迭代后可得到FHMM模型的一个最大似然估计。
估计FHMM参数λ=(A,B,π),以最大化P(D|λ),即arg maxλP(D|λ)。其步骤为,
a)、初始化参数λ0;
b)、基于初始化参数λ0和观测值D计算出前向概率和后向概率
c)、利用和估计出以下期望频数:
c1)、从状态i转移到状态j的期望数量;
c2)、观测值Dt下,处于状态i,j,k的期望数量;
c3)、从状态i′,j′,k′开始的期望数量;
d)、利用期望频数,估计出新的λ;
e)、如果logP(D|λ)-logP(D|λ0)<ΔA,则迭代终止;
f)、否则,λ0=λ,并返回到步骤b)。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。