CN107452017A - 一种基于期望最大化算法的机动目标跟踪方法 - Google Patents

一种基于期望最大化算法的机动目标跟踪方法 Download PDF

Info

Publication number
CN107452017A
CN107452017A CN201710678700.XA CN201710678700A CN107452017A CN 107452017 A CN107452017 A CN 107452017A CN 201710678700 A CN201710678700 A CN 201710678700A CN 107452017 A CN107452017 A CN 107452017A
Authority
CN
China
Prior art keywords
mrow
msub
msup
mover
moment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710678700.XA
Other languages
English (en)
Inventor
郭锐
张旭东
汪磊
张凤静
钱诗君
陈健
张轩
王红阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 28 Research Institute
Original Assignee
CETC 28 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 28 Research Institute filed Critical CETC 28 Research Institute
Priority to CN201710678700.XA priority Critical patent/CN107452017A/zh
Publication of CN107452017A publication Critical patent/CN107452017A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/207Analysis of motion for motion estimation over a hierarchy of resolutions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/251Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/292Multi-camera tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects

Abstract

本发明公开了一种基于期望最大化算法的机动目标跟踪方法,通过Markov跳变系统对机动目标的运动模式建立模型;通过批处理期望最大化算法,推导非齐次转移概率的代价函数;基于非齐次转移概率的代价函数,通过Viterbi算法获得非齐次转移概率在最大后验概率准则下的估计表达式;引入高层转移概率的概念,为将高层转移概率融入经典的交互式多模型算法中,对交互式多模型算法进行改进推导;最后基于非齐次转移概率代价函数的近似表达式,通过Viterbi算法和改进的交互式多模型算法,获得非齐次转移概率在最大后验概率准则下的估值。

Description

一种基于期望最大化算法的机动目标跟踪方法
技术领域
本发明属于信息融合技术领域,尤其涉及一种基于期望最大化算法的机动目标跟踪方法。
背景技术
由于机动目标运动模式的不确定性,无法获得充分的先验信息对其运动模式精确建模;特别是当机动目标的运动模式随时间不断发生变化时,其精确建模的难度进一步加大,导致利用经典的卡尔曼滤波器(Kalman filter)所获得的目标状态估计性能严重降低。对此,Markov跳变系统(jump Markov system)常被用于对机动目标未知的运动模式建立模型集合,并在此基础上,利用多模型(multiple model)方法对目标的运动状态进行估计。
Markov跳变系统对目标未知的运动模式具有优越的建模特性,被广泛应用于机动目标跟踪、计算机视觉、无线通信、故障诊断等众多应用领域。其主要思想假设目标的运动模型集合由一组数量有限的确定性先验模型组成,模型间的相互切换随时间变化构成一个Markov链;机动目标在每个时刻真实的运动模型随机取自于该模型集合。多模型方法是Markov跳变系统状态估计的主流方法,该方法基于模型集合中各个先验模型,分别利用卡尔曼滤波器或其改进算法对系统状态进行估计,并对基于各模型的系统状态估值加权融合,获得系统状态的总体估值。相比卡尔曼滤波器及其改进算法,多模型方法对机动目标未知的运动模式具有较强的自适应辨识能力,能够通过模型权重的自动调节获得机动目标状态的精确估值。现有研究已经验证,在目标运动模式未知的条件下,多模型方法对机动目标的状态估计性能优于卡尔曼滤波器及其改进算法的性能。
采用多模型方法对Markov跳变系统进行状态估计时,引入了某些不确定信息,如Markov跳变系统未知的转移概率(transition probabilities)。转移概率用于量化描述不同模型之间相互切换的可能性,在多模型方法理论框架下,转移概率的精确性直接影响Markov跳变系统的状态估计性能。尽管多模型方法在目标运动模式未知的条件下,能够获得理想的状态估计性能,但一般都假设Markov跳变系统的转移概率先验已知。在实际应用中,机动目标运动模型间的先验转移概率通常是不准确甚至是无法获得的,导致在使用多模型方法时,机动目标的状态估计性能下降。因此,如何获得Markov跳变系统精确的转移概率已经成为多模型方法状态估计研究的重难点之一。
根据转移概率是否随时间变化发生改变,将其分为齐次转移概率和非齐次转移概率。在实际应用中,由于受不确定因素的影响,机动目标运动模式间互相切换的可能性随时间推移会产生变化,由此表现出复杂多变的动态特性。在这种情况下,应将机动目标运动模式间的转移概率建模成非齐次转移概率。齐次转移概率实质上是非齐次转移概率的一种特殊形式,非齐次转移概率形成的运动模型序列可看做由有限个分段齐次转移概率形成的运动模型序列构成。因此,相比齐次Markov跳变系统,非齐次Markov跳变系统在实际应用中更为普遍和通用,对非齐次Markov跳变系统状态估计方法的研究更具一般性和指导性。
目前,有学者引入高层转移概率的思想,假设非齐次转移概率在一个数量有限的确定性候选集合中随机选取,且受控于一个高层的确定性齐次转移概率。在多模型方法的理论框架下,推导获得非齐次Markov跳变系统的最优状态估计表达式和计算上可行的次优估值。然而,该方法通过合并策略对不同转移概率下的系统状态估值进行加权融合,导致系统状态的总体估计性能介于基于不同转移概率的系统状态估计性能之间。其中,不精确的转移概率会影响系统状态最终的融合结果。因此,在使用该方法时,很有必要自适应地辨识产生系统最优状态估计性能的转移概率,筛除不精确的转移概率,以提高非齐次Markov跳变系统的状态估计精度。
发明内容
发明目的:在应用现有的非齐次Markov跳变系统状态估计方法时,很有必要自适应地辨识产生非齐次Markov跳变系统最优状态估计性能的转移概率,以筛除不精确的转移概率,提高系统状态估计的精度。为实现该目的,针对通过非齐次Markov跳变系统建模形成的机动目标运动模型,提出一种较高精度的目标状态估计方法。
本发明提供了一种基于期望最大化算法的机动目标跟踪方法,包括以下步骤:
步骤1、通过Markov跳变系统对机动目标的运动模式建立模型;
步骤2、通过批处理期望最大化算法,推导非齐次转移概率的代价函数;
步骤3、基于非齐次转移概率的代价函数,通过Viterbi算法获得非齐次转移概率在最大后验概率准则下的估计表达式;
由于基于批处理期望最大化算法的非齐次转移概率估计方法(步骤2~步骤3)计算复杂度较高,不利于机动目标的实时状态估计,因此,在批处理期望最大化算法的基础上,提出一种基于递推期望最大化算法的非齐次转移概率估计方法(步骤4~步骤7):
步骤4、通过递推期望最大化算法,推导非齐次转移概率的代价函数;
步骤5、为方便工程计算,引入相关假设前提,对非齐次转移概率的代价函数推导近似表达式;
步骤6、引入高层转移概率的概念,为将高层转移概率融入经典的交互式多模型算法中,对交互式多模型算法进行改进推导。从后续推导可以发现,融入了高层转移概率的改进交互式多模型算法,在表达形式上依然与原算法保持完全一致。
步骤7、基于非齐次转移概率代价函数的近似表达式,通过Viterbi算法和改进的交互式多模型算法,获得非齐次转移概率在最大后验概率准则下的估值。
步骤1包括:Markov跳变系统被用于对复杂多变的机动目标运动模式建立模型:
xk+1=A(rk+1)xk+B(rk+1)wk+1 (1)
yk=C(rk)xk+D(rk)vk (2)
其中,k是离散时间点,取值范围为任意自然数;
xk+1和xk分别是Markov跳变系统在k+1时刻的基状态和k时刻的基状态,且初值满足高斯分布:其中,是均值为x0、方差为P0的高斯密度函数;
rk+1和rk分别是Markov跳变系统在k+1时刻的离散模式状态和k时刻的离散模式状态,且rk+1,rk∈{1,2,...,M},M为任意大小的自然数;
yk是Markov跳变系统在k时刻的含噪观测值;
wk+1是Markov跳变系统在k+1时刻的过程噪声,满足其中,是均值为0、方差为Qk+1的高斯密度函数;
vk是Markov跳变系统在k时刻的观测噪声,满足其中,是均值为0、方差为Rk的高斯密度函数;
A(rk+1)是Markov跳变系统的基状态在k+1时刻的转移矩阵,B(rk+1)是Markov跳变系统的过程噪声在k+1时刻的转移矩阵,C(rk)是Markov跳变系统在k时刻的观测函数,D(rk)是Markov跳变系统的观测噪声在k时刻的转移矩阵。
rk满足一阶非齐次Markov链,其在k时刻的转移概率真值为∏k。设未知的∏k为随机变量,且在数量有限的确定性候选集合内随机取值,其中,∏(1),∏(2),...,∏(S)为S个确定的候选转移概率,S为任意大小的自然数,为定义符号。∏k在任意时刻的切换随着时间变化,构成一阶齐次Markov链。引入高层转移概率(参见Zhao S.和Liu F.于2013年在《Journal of the Franklin institute》第350卷第10期所著《Bayesian estimation for jump Markov linear systems with non-homogeneoustransition probabilities》,P3029~P3044),由∏k构成的Markov链受控于λ,其中,是第r个候选转移概率∏(r)到第q个候选转移概率∏(q)的转移概率,∏k-1是Markov跳变系统在k–1时刻的模式状态rk-1的转移概率真值,∏(q)和∏(r)分别为Ω中第q个候选转移概率和第r个候选转移概率,1≤r,q≤S,[·]S×S为S维矩阵,P(·|·)为条件概率运算符,·|·为条件运算符。
步骤2包括:定义Markov跳变系统的隐状态为其中,为Markov跳变系统在k时刻前的基状态序列,为Markov跳变系统在k时刻前的模式状态序列,为Markov跳变系统在k时刻前的含噪观测值序列,为Markov跳变系统非齐次转移概率在k时刻前的真值序列,是Markov跳变系统非齐次转移概率在k时刻第l次迭代估计时产生的估值序列,l为任意自然数。给定非齐次转移概率在k时刻第l+1次的批处理迭代估计过程中产生的代价函数如下所示:
其中,f(·)为概率密度函数运算符,f(·|·)为条件概率密度函数运算符,E{·|·}为条件期望运算符,log(·)为求对数运算符,n为k时刻内的任意离散时间点,满足1≤n≤k,yn为Markov跳变系统在n时刻的含噪观测值,xn、xn-1分别Markov跳变系统在n时刻的基状态和n–1时刻的基状态,rn、rn-1分别为Markov跳变系统在n时刻的离散模式状态和n–1时刻的离散模式状态,∏n、∏n-1分别为Markov跳变系统模式状态在n时刻的转移概率真值和n–1时刻的转移概率真值。
步骤3包括:非齐次转移概率在k时刻第l+1次的迭代过程中,通过Viterbi算法(参见Pulford G.W.和La Scala.B.于2002年在《IEEE Transactions on Aerospace andElectronic Systems》第38卷第2期所著《MAP estimation of target manoeuvresequence with the expectation-maximization algorithm》,P367~P377)对代价函数求解最大化,获得非齐次转移概率序列在最大后验概率准则下的估计表达式:
其中,为使得函数g(φ)达到最大时的变量φ的值。
步骤4包括:为降低基于批处理期望最大化算法的非齐次转移概率估计方法的计算复杂度,在k时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数如下所示:
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的递推估值序列,为Markov跳变系统非齐次转移概率在k–1时刻的递推估值。
利用Viterbi算法对求解最大化时,对每一个节点∏k,需重新确定到达该节点之前的最优估值序列因此,将在k–1时刻获得的递推估值序列重新假设为未知量,则变换成:
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的真值序列,∏k-1为Markov跳变系统非齐次转移概率在k–1时刻的真值,Qrec(∏k,∏k-1)为Markov跳变系统非齐次转移概率基于真值序列∏k-1的递推代价函数,xk-1是Markov跳变系统在k–1时刻的基状态,rk-1∈{1,2,...,M}为Markov跳变系统在k–1时刻的离散模式状态,为Markov跳变系统在k–1时刻前的基状态序列,为Markov跳变系统在k–1时刻前的模式状态序列,Yk-1为Markov跳变系统在k–1时刻前的含噪观测值序列,为将参数θ视为变量时,函数I(θ)的最大值。
步骤5包括:为方便工程计算,引入如下假设前提(参见Pulford G.W.和LaScala.B.于2002年在《IEEE Transactions on Aerospace and Electronic Systems》第38卷第2期所著《MAP estimation of target manoeuvre sequence with the expectation-maximization algorithm》,P367~P377):
(a)在k时刻,Markov跳变系统状态的平滑估值能够被其滤波估值近似;
(b)在k时刻,给定Markov跳变系统在k–2时刻的基状态估计量,则可忽略Markov跳变系统的基状态估值、基状态估值的误差协方差和模式状态估值对∏k-2的依赖。其中,为Markov跳变系统转移概率在k–2时刻前的真值序列。
利用假设前提(a),变换成如下形式:
其中,为k–1时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数,为Markov跳变系统转移概率在k–2时刻前的估值序列,中间变量Δk-1,k定义为:
其中,j为Markov跳变系统在k时刻的模式状态,i为Markov跳变系统在k–1时刻的模式状态,满足1≤j,i≤M;
与∏k的取值无关,因此,当对∏k求解最大化时,可忽略该项;
(8)的中间变量P(rk=j,rk-1=i|Yk,∏k-1)可变换为:
其中,
为模式状态rk-1=i到模式状态rk=j的转移概率;
为Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态似然函数,为相应的基状态似然函数矢量,(·)T为矩阵转置算子;
为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值,为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值误差协方差,cov{·}为协方差运算符;
为Markov跳变系统在k–1时刻,基于∏k-1的模式状态rk-1=i后验概率估值,为相应的模式状态后验概率估值矢量。
利用假设前提(b),在当前k时刻,∏k-2的最优路径保持为不变,其中,为在k–1时刻所确定的前k–2时刻内转移概率的Viterbi估值序列,则可分别近似为:
其中,
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值;
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值误差协方差;
为Markov跳变系统在k–1时刻,基于和∏k-1的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k时刻,基于rk=j、k-1和∏k的基状态似然函数。
步骤6包括:引入高层转移概率,对已有的交互式多模型算法(参见Blom H.A.P.和Bar-Shalom Y.于1988年在《IEEE Transactions on Automatic Control》第33卷第8期所著《The interacting multiple model algorithm for systems with Markovianswitching coefficients》,P780~P783)做如下改进推导:
步骤6-1,计算Markov跳变系统模式状态rk-1=i的混合权重
步骤6-2,计算在模式状态rk=j条件下,Markov跳变系统的混合基状态概率密度函数f(xk-1|rk=j,∏k,Yk-1):
由于系统状态满足高斯分布,上式转换成:
其中,是均值为方差为的高斯概率密度函数。
将M个高斯密度函数的加权和近似成一个高斯密度函数:
其中,是均值为方差为的高斯概率密度函数,且:
步骤6-3,计算模式状态的条件滤波估值:
通过卡尔曼滤波公式(参见Greg Welch和Gary Bishop于2004年所著技术报告《AnIntroduction to Kalman Filter》,P1~P16),计算Markov跳变系统在k时刻,基于模式状态rk=j的基状态估值基状态估值误差协方差与似然函数
步骤6-4,计算模式状态rk=j的后验概率
步骤6-5,计算Markov跳变系统在k时刻的融合估值xk|k和融合估值的误差协方差Pk|k
其中,f(xk|rk=j,Yk,∏k)是Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态概率密度函数,可由一个高斯密度函数近似:
其中,是均值为xk|k,方差为Pk|k的高斯概率密度函数,且:
步骤7-1包括:给定通过步骤6-1至步骤6-4推导获得的改进交互式多模型算法,计算
其中,为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态误差协方差;
为Markov跳变系统在k时刻,基于∏k-1=∏(r)和∏k=∏(q)的模式状态rk=j后验概率估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值误差协方差。
步骤7-2包括:遍历Markov跳变系统k时刻的转移概率,分别基于不同的∏k=∏(q),估计Markov跳变系统在k–1时刻的转移概率
其中,∏k-1∈{∏(1),∏(2),...,∏(S)},为在已知∏k=∏(q)条件下的中间变量Δk-1,k,可由公式(8)和公式(9)获得。
步骤7-3包括:分别基于不同的∏k=∏(q),更新转移概率在k时刻的最优估值的候选序列
步骤7-4包括:分别基于不同的∏k=∏(q),更新Markov跳变系统在k时刻的转移概率代价函数
其中,为在条件下,Markov跳变系统非齐次转移概率在k–1时刻的递推代价函数,为在条件下的中间变量Δk-1,k
步骤7-5包括:估计Markov跳变系统k时刻的转移概率
本发明提出的方法,令任意时刻的非齐次转移概率在一个数量有限的确定性候选集合中随机选取,且受控于一个高层的确定性齐次转移概率。针对不精确的转移概率对系统状态估计性能的影响,首先提出基于批处理期望最大化算法的Markov跳变系统非齐次转移概率估计方法。在此基础上,为降低批处理算法的计算负担,在最大后验概率准则下,推导与非齐次转移概率相关的代价函数。在一定的假设前提下,对代价函数求解最大化以获得非齐次转移概率在最大后验概率准则下的估值。在估计过程中,经典的交互式多模型算法需做相应的改进,以将引入的高层转移概率融入多模型状态估计方法的推导过程中。
由于基于批处理期望最大化算法的非齐次转移概率估计方法计算复杂度较高,不利于机动目标的实时状态估计,因此,本发明在批处理期望最大化算法的基础上,又进一步提出一种基于递推期望最大化算法的非齐次转移概率估计方法。通过递推期望最大化算法,推导非齐次转移概率的代价函数;为方便工程计算,引入相关假设前提,以对非齐次转移概率的代价函数推导近似表达式;
本发明提出的方法能够避免不精确的转移概率对Markov跳变系统状态估计性能的影响,自适应地辨识产生机动目标最优状态估计性能的转移概率,筛除不精确的转移概率,提高机动目标的跟踪精度。
有益效果:本发明与现有技术相比,其显著优点为:
(1)新颖性突出。针对不精确的转移概率对Markov跳变系统状态估计性能的影响,首先提出基于批处理期望最大化算法的非齐次转移概率估计方法。在此基础上,为降低批处理算法的计算负担,又提出一种基于递推期望最大化算法的非齐次转移概率估计方法。在最大后验概率准则下,推导与非齐次转移概率相关的代价函数。在一定的假设前提下,对代价函数求解最大化以获得非齐次转移概率在最大后验概率准则下的估值。在估计过程中,经典的交互式多模型算法需做相应的改进,以将引入的高层转移概率融入多模型状态估计方法的推导过程中
(2)精确性高。已有的Markov跳变系统非齐次转移概率估计方法在多模型方法的理论框架下,通过合并策略对不同候选转移概率下的系统状态估值进行加权融合,导致系统状态的总体估计性能介于基于不同转移概率的系统状态估计性能之间。其中,不精确的转移概率会影响系统状态最终的融合结果。本发明提出的方法能够自适应地辨识产生系统最优状态估计性能的转移概率,筛除不精确的转移概率,因此相比已有方法,能够提高非齐次Markov跳变系统状态估计的精度。
(3)适用性广。齐次转移概率是非齐次转移概率的一种特殊形式,非齐次转移概率所形成的时间序列可看做由有限个分段齐次转移概率所形成的时间序列构成。因此,非齐次Markov跳变系统相比齐次Markov跳变系统,在实际应用中是一类更普遍的系统,对其未知转移概率估计方法的研究更具一般性和指导性。本发明提出的方法不仅可用于Markov跳变系统非齐次转移概率的估计,还能够实现对系统齐次转移概率的估计,因此在复杂多变的机动目标跟踪应用领域具有广泛的适用性。
(4)可信度强。本发明通过正确的目标运动模型建模、严谨的数学推导、合理的工程近似手段和充分的仿真验证试验,提出基于期望最大化算法的机动目标跟踪方法,具有较强的可信度。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1是本发明涉及的基于期望最大化算法的机动目标跟踪方法流程图;
图2是Markov跳变系统非齐次转移概率的真值和基于本发明所提方法获得的估值图;
图3是通过现有基于合并策略的估计方法(参见Zhao S.和Liu F.于2013年在《Journal of the Franklin institute》第350卷第10期所著《Bayesian estimation forjump Markov linear systems with non-homogeneous transition probabilities》,P3029~P3044)和本发明所提方法分别获得的Markov跳变系统基状态估值的平均绝对误差图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
本发明的机动目标跟踪方法的工作流程如图1所示。共分为以下七个主要步骤:
步骤1、通过Markov跳变系统对机动目标的运动模式建立模型;
步骤2、通过批处理期望最大化算法,推导非齐次转移概率的代价函数;
步骤3、基于非齐次转移概率的代价函数,通过Viterbi算法获得非齐次转移概率在最大后验概率准则下的估计表达式;
由于基于批处理期望最大化算法的非齐次转移概率估计方法(步骤2~步骤3)计算复杂度较高,不利于机动目标的实时状态估计,因此,在批处理期望最大化算法的基础上,提出一种基于递推期望最大化算法的非齐次转移概率估计方法(步骤4~步骤7):
步骤4、通过递推期望最大化算法,推导非齐次转移概率的代价函数;
步骤5、为方便工程计算,引入相关假设前提,对非齐次转移概率的代价函数推导近似表达式;
步骤6、引入高层转移概率的概念,为将高层转移概率融入经典的交互式多模型算法中,对交互式多模型算法进行改进推导。从后续推导可以发现,融入了高层转移概率的改进交互式多模型算法,在表达形式上依然与原算法保持完全一致。
步骤7、基于步骤5获得的非齐次转移概率代价函数的近似表达式,通过Viterbi算法和改进的交互式多模型算法,获得非齐次转移概率在最大后验概率准则下的估值。
结合图1,本发明通过Markov跳变系统对机动目标的运动模式建立模型,具体如下所示:
xk+1=A(rk+1)xk+B(rk+1)wk+1 (1)
yk=C(rk)xk+D(rk)vk (2)
其中,k是离散时间点,取值范围为任意自然数;
xk+1和xk分别是Markov跳变系统在k+1时刻和k时刻的基状态,且初值满足高斯分布:其中,是均值为x0、方差为P0的高斯密度函数;
rk+1和rk分别是Markov跳变系统在k+1时刻和k时刻的离散模式状态,且rk+1,rk∈{1,2,...,M},M为任意大小的自然数;
yk是Markov跳变系统在k时刻的含噪观测值;
wk+1是Markov跳变系统在k+1时刻的过程噪声,满足其中,是均值为0、方差为Qk+1的高斯密度函数;
vk是Markov跳变系统在k时刻的观测噪声,满足其中,是均值为0、方差为Rk的高斯密度函数;
A(rk+1)是Markov跳变系统的基状态在k+1时刻的转移矩阵,B(rk+1)是Markov跳变系统的过程噪声在k+1时刻的转移矩阵,C(rk)是Markov跳变系统在k时刻的观测函数,D(rk)是Markov跳变系统的观测噪声在k时刻的转移矩阵。
rk满足一阶非齐次Markov链,其在k时刻的转移概率真值为∏k。设未知的∏k为随机变量,且在数量有限的确定性候选集合内随机取值,其中,∏(1),∏(2),...,∏(S)为S个确定的候选转移概率,S为任意大小的自然数,为定义符号。∏k在任意时刻的切换随着时间变化,构成一阶齐次Markov链。引入高层转移概率由∏k构成的Markov链受控于λ,其中,是第r个候选转移概率∏(r)到第q个候选转移概率∏(q)的转移概率,∏k-1是Markov跳变系统在k–1时刻的模式状态rk-1的转移概率真值,∏(q)和∏(r)分别为Ω中第q个和第r个候选转移概率,1≤r,q≤S,[·]S×S为S维矩阵,P(·|·)为条件概率运算符,·|·为条件运算符。
结合图1,通过批处理期望最大化算法,推导非齐次转移概率的代价函数,具体如下所示:
定义Markov跳变系统的隐状态为其中,为Markov跳变系统在k时刻前的基状态序列,为Markov跳变系统在k时刻前的模式状态序列,为Markov跳变系统在k时刻前的含噪观测值序列,为Markov跳变系统非齐次转移概率在k时刻前的真值序列,是Markov跳变系统非齐次转移概率在k时刻第l次迭代估计时产生的估值序列,l为任意自然数。给定非齐次转移概率在k时刻第l+1次的批处理迭代估计过程中产生的代价函数如下所示:
其中,f(·)为概率密度函数运算符,f(·|·)为条件概率密度函数运算符,E{·|·}为条件期望运算符,log(·)为求对数运算符,n为k时刻内的任意离散时间点,满足1≤n≤k,yn为Markov跳变系统在n时刻的含噪观测值,xn、xn-1分别Markov跳变系统在n时刻和n–1时刻的基状态,rn、rn-1分别为Markov跳变系统在n时刻和n–1时刻的离散模式状态,∏n、∏n-1分别为Markov跳变系统模式状态在n时刻和n–1时刻的转移概率真值。
结合图1,通过Viterbi算法对代价函数求解最大化,获得非齐次转移概率序列在最大后验概率准则下的估计表达式:
其中,为使得函数g(φ)达到最大时的变量φ的值。
结合图1,通过递推期望最大化算法,推导非齐次转移概率的代价函数,具体如下所示:在k时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数如下所示:
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的递推估值序列,为Markov跳变系统非齐次转移概率在k–1时刻的递推估值。
利用Viterbi算法对求解最大化时,对每一个节点∏k,需重新确定到达该节点之前的最优估值序列因此,将在k–1时刻获得的递推估值序列重新假设为未知量,则变换成:
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的真值序列,∏k-1为Markov跳变系统非齐次转移概率在k–1时刻的真值,Qrec(∏k,∏k-1)为Markov跳变系统非齐次转移概率基于真值序列∏k-1的递推代价函数,xk-1是Markov跳变系统在k–1时刻的基状态,rk-1∈{1,2,...,M}为Markov跳变系统在k–1时刻的离散模式状态,为Markov跳变系统在k–1时刻前的基状态序列,为Markov跳变系统在k–1时刻前的模式状态序列,Yk-1为Markov跳变系统在k–1时刻前的含噪观测值序列,为将参数θ视为变量时,函数I(θ)的最大值。
结合图1,为方便工程计算,引入如下假设前提:
(a)在k时刻,Markov跳变系统状态的平滑估值能够被其滤波估值近似;
(b)在k时刻,给定Markov跳变系统在k–2时刻的基状态估计量,则可忽略Markov跳变系统的基状态估值、基状态估值的误差协方差和模式状态估值对∏k-2的依赖。其中,为Markov跳变系统转移概率在k–2时刻前的真值序列。
利用假设前提(a),变换成如下形式:
其中,为k–1时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数,为Markov跳变系统转移概率在k–2时刻前的估值序列,中间变量Δk-1,k定义为:
其中,j为Markov跳变系统在k时刻的模式状态,i为Markov跳变系统在k–1时刻的模式状态,满足1≤j,i≤M;
与∏k的取值无关,因此,当对∏k求解最大化时,可忽略该项;
(8)的中间变量P(rk=j,rk-1=i|Yk,∏k-1)可变换为:
其中,
为模式状态rk-1=i到模式状态rk=j的转移概率;
为Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态似然函数,为相应的基状态似然函数矢量,(·)T为矩阵转置算子;
为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值,为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值误差协方差,cov{·}为协方差运算符;
为Markov跳变系统在k–1时刻,基于∏k-1的模式状态rk-1=i后验概率估值,为相应的模式状态后验概率估值矢量。
利用假设前提(b),在当前k时刻,∏k-2的最优路径保持为不变,其中,为在k–1时刻所确定的前k–2时刻内转移概率的Viterbi估值序列,则可分别近似为:
其中,
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值;
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值误差协方差;
为Markov跳变系统在k–1时刻,基于和∏k-1的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k时刻,基于rk=j、k-1和∏k的基状态似然函数。
结合图1,引入高层转移概率,对交互式多模型算法做如下改进推导:
(a)计算Markov跳变系统模式状态rk-1=i的混合权重
(b)计算在模式状态rk=j条件下,Markov跳变系统的混合基状态概率密度函数f(xk-1|rk=j,∏k,Yk-1):
由于系统状态满足高斯分布,上式可转换成:
其中,是均值为方差为的高斯概率密度函数。
将M个高斯密度函数的加权和近似成一个高斯密度函数:
其中,是均值为方差为的高斯概率密度函数,且:
(c)计算模式状态的条件滤波估值:
通过卡尔曼滤波器,计算Markov跳变系统在k时刻,基于模式状态rk=j的基状态估值基状态估值误差协方差与似然函数
(d)计算模式状态rk=j的后验概率
(e)计算Markov跳变系统在k时刻的融合估值xk|k和融合估值的误差协方差Pk|k
其中,f(xk|rk=j,Yk,∏k)是Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态概率密度函数,可由一个高斯密度函数近似:
其中,是均值为xk|k,方差为Pk|k的高斯概率密度函数,且:
结合图1,通过Viterbi算法和改进的交互式多模型算法,获得非齐次转移概率在最大后验概率准则下的估值。具体如下所示:
(a)结合图1,给定通过公式(14)至公式(24)推导获得的改进交互式多模型算法,计算
其中,为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态误差协方差;
为Markov跳变系统在k时刻,基于∏k-1=∏(r)和∏k=∏(q)的模式状态rk=j后验概率估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值误差协方差。
(b)遍历Markov跳变系统k时刻的转移概率,分别基于不同的∏k=∏(q),估计Markov跳变系统在k–1时刻的转移概率
其中,∏k-1∈{∏(1),∏(2),...,∏(S)},为在已知∏k=∏(q)条件下的中间变量Δk-1,k,可由公式(8)和公式(9)获得。
(c)分别基于不同的∏k=∏(q),更新转移概率在k时刻的最优估值的候选序列
(d)分别基于不同的∏k=∏(q),更新Markov跳变系统在k时刻的转移概率代价函数
其中,为在条件下,Markov跳变系统非齐次转移概率在k–1时刻的递推代价函数,为在条件下的中间变量Δk-1,k
(e)估计Markov跳变系统k时刻的转移概率:
下面结合实施例对本发明做进一步的说明。
步骤1、机动目标的运动状态方程和观测方程分别建立如下模型:
y(k)=p(k)+υ(k) (30)
其中,p(k)、v(k)和a(k)分别代表目标的位置(m)、速度(m/s)和加速度(m/s2)。机动目标的位置和速度构成基状态,且初值分别满足:加速度过程是一个包含3个先验模型的一阶Markov链,有a1=0、a2=25和a3=-25。令加速度过程的非齐次转移概率∏k在确定性的候选集合Ω={∏(1),∏(2)}内切换,且受控于一个高层的齐次转移概率λ,满足以下条件:
为白过程噪声,为白观测噪声,采样间隔为Ts=10s。
步骤2、在k时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数如下所示:
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的递推估值序列,为Markov跳变系统非齐次转移概率在k–1时刻的递推估值。
利用Viterbi算法对求解最大化时,对每一个节点∏k,需重新确定到达该节点之前的最优估值序列因此,将在k–1时刻获得的递推估值序列重新假设为未知量,则变换成:
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的真值序列,∏k-1为Markov跳变系统非齐次转移概率在k–1时刻的真值,Qrec(∏k,∏k-1)为Markov跳变系统非齐次转移概率基于真值序列∏k-1的递推代价函数,xk-1是Markov跳变系统在k–1时刻的基状态,rk-1∈{1,2,...,M}为Markov跳变系统在k–1时刻的离散模式状态,为Markov跳变系统在k–1时刻前的基状态序列,为Markov跳变系统在k–1时刻前的模式状态序列,Yk-1为Markov跳变系统在k–1时刻前的含噪观测值序列,为将参数θ视为变量时,函数I(θ)的最大值。
步骤3、为方便工程计算,引入如下假设前提:
(a)在k时刻,Markov跳变系统状态的平滑估值能够被其滤波估值近似;
(b)在k时刻,给定Markov跳变系统在k–2时刻的基状态估计量,则可忽略Markov跳变系统的基状态估值、基状态估值的误差协方差和模式状态估值对∏k-2的依赖。其中,为Markov跳变系统转移概率在k–2时刻前的真值序列。
利用假设前提(a),变换成如下形式:
其中,为k–1时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数,为Markov跳变系统转移概率在k–2时刻前的估值序列,中间变量Δk-1,k定义为:
其中,j为Markov跳变系统在k时刻的模式状态,i为Markov跳变系统在k–1时刻的模式状态,满足1≤j,i≤M;
与∏k的取值无关,因此,当对∏k求解最大化时,可忽略该项;
(34)的中间变量P(rk=j,rk-1=i|Yk,∏k-1)可变换为:
其中,
为模式状态rk-1=i到模式状态rk=j的转移概率;
为Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态似然函数,为相应的基状态似然函数矢量,(·)T为矩阵转置算子;
为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值,为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值误差协方差,cov{·}为协方差运算符;
为Markov跳变系统在k–1时刻,基于∏k-1的模式状态rk-1=i后验概率估值,为相应的模式状态后验概率估值矢量。
利用假设前提(b),在当前k时刻,∏k-2的最优路径保持为不变,其中,为在k–1时刻所确定的前k–2时刻内转移概率的Viterbi估值序列,则可分别近似为:
其中,
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值;
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值误差协方差;
为Markov跳变系统在k–1时刻,基于和∏k-1的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k时刻,基于rk=j、k-1和∏k的基状态似然函数。
步骤4-1、计算Markov跳变系统模式状态rk-1=i的混合权重
步骤4-2、计算在模式状态rk=j条件下,Markov跳变系统的混合基状态概率密度函数f(xk-1|rk=j,∏k,Yk-1):
由于系统状态满足高斯分布,上式可转换成:
其中,是均值为方差为的高斯概率密度函数。
将M个高斯密度函数的加权和近似成一个高斯密度函数:
其中,是均值为方差为的高斯概率密度函数,且:
步骤4-3、计算模式状态的条件滤波估值:
利用卡尔曼滤波器,计算Markov跳变系统在k时刻,基于模式状态rk=j的基状态估值基状态估值误差协方差与似然函数
步骤4-4、计算模式状态rk=j的后验概率
步骤4-5、计算Markov跳变系统在k时刻的融合估值xk|k和融合估值的误差协方差Pk|k
其中,f(xk|rk=j,Yk,∏k)是Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态概率密度函数,可由一个高斯密度函数近似:
其中,是均值为xk|k,方差为Pk|k的高斯概率密度函数,且:
步骤5-1、给定通过公式(40)至公式(50)推导获得的改进交互式多模型算法,计算
其中,为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态误差协方差;
为Markov跳变系统在k时刻,基于∏k-1=∏(r)和∏k=∏(q)的模式状态rk=j后验概率估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值误差协方差。
步骤5-2、遍历Markov跳变系统k时刻的转移概率,分别基于不同的∏k=∏(q),估计Markov跳变系统在k–1时刻的转移概率
其中,为在已知∏k=∏(q)条件下的中间变量Δk-1,k,可由公式(34)和公式(35)获得。
步骤5-3分别基于不同的∏k=∏(q),更新转移概率在k时刻的最优估值的候选序列
步骤5-4、分别基于不同的∏k=∏(q),更新Markov跳变系统在k时刻的转移概率代价函数
其中,为在条件下,Markov跳变系统非齐次转移概率在k–1时刻的递推代价函数,为在条件下的中间变量Δk-1,k
步骤5-5、估计Markov跳变系统k时刻的转移概率:
对该机动目标运动模型进行200次Monte Carlo仿真试验,每次仿真的离散时间样本数为120。非齐次转移概率随时间变化的真值与本发明所提方法获得的估值分别如图2所示。其中,纵坐标的整数值代表Ω中候选转移概率的序号。仿真结果表明,非齐次转移概率的估值与真值吻合。
转移概率的精确估值是利用多模型方法对Markov跳变系统进行状态估计的重要前提,因此,将以下两种方法对Markov跳变系统基状态的估计性能进行比较:
●现有基于合并策略的估计方法
●本发明所提方法
为评价不同估计方法的性能,通过估值的平均绝对误差(mean absolute error,MAE)指标,对200次Monte Carlo仿真产生的基状态估值与真值之间的误差进行评估:
评估仿真结果如图3所示。可以发现,本发明所提方法的状态估计性能优于现有基于合并策略的估计方法。本发明所提方法在任意时刻,能够自适应地筛除Markov跳变系统不精确的候选转移概率,利用转移概率当前的最优估值,获得理想的机动目标状态估计性能,从而解决现有方法的不足。

Claims (8)

1.一种基于期望最大化算法的机动目标跟踪方法,其特征在于,包括以下步骤:
步骤1、通过Markov跳变系统对机动目标的运动模式建立模型;
步骤2、通过批处理期望最大化算法,推导非齐次转移概率的代价函数;
步骤3、基于非齐次转移概率的代价函数,通过Viterbi算法获得非齐次转移概率在最大后验概率准则下的估计表达式;
步骤4、通过递推期望最大化算法,推导非齐次转移概率的代价函数;
步骤5、引入相关假设前提,对非齐次转移概率的代价函数推导近似表达式;
步骤6、将高层转移概率融入经典的交互式多模型算法中,对交互式多模型算法进行改进推导;
步骤7、基于非齐次转移概率代价函数的近似表达式,通过Viterbi算法和改进的交互式多模型算法,获得非齐次转移概率在最大后验概率准则下的估值。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:
通过Markov跳变系统对机动目标的运动模式建立如下模型:
xk+1=A(rk+1)xk+B(rk+1)wk+1
yk=C(rk)xk+D(rk)vk
其中,k是离散时间点,取值范围为任意自然数;
xk+1和xk分别是Markov跳变系统在k+1时刻的基状态和k时刻的基状态,且初值满足高斯分布:其中,是均值为x0、方差为P0的高斯密度函数;
rk+1和rk分别是Markov跳变系统在k+1时刻的离散模式状态和k时刻的离散模式状态,且rk+1,rk∈{1,2,...,M},M为任意大小的自然数;
yk是Markov跳变系统在k时刻的含噪观测值;
wk+1是Markov跳变系统在k+1时刻的过程噪声,满足其中,是均值为0、方差为Qk+1的高斯密度函数;
vk是Markov跳变系统在k时刻的观测噪声,满足其中,是均值为0、方差为Rk的高斯密度函数;
A(rk+1)是Markov跳变系统的基状态在k+1时刻的转移矩阵,B(rk+1)是Markov跳变系统的过程噪声在k+1时刻的转移矩阵,C(rk)是Markov跳变系统在k时刻的观测函数,D(rk)是Markov跳变系统的观测噪声在k时刻的转移矩阵;
rk满足一阶非齐次Markov链,其在k时刻的转移概率真值为∏k;设未知的∏k为随机变量,且在数量有限的确定性候选集合内随机取值,其中,∏(1),∏(2),...,∏(S)为S个确定的候选转移概率,S为任意大小的自然数,为定义符号;∏k在任意时刻的切换,随着时间变化,构成一阶齐次Markov链;引入高层转移概率由∏k构成的Markov链受控于λ,其中,是第r个候选转移概率∏(r)到第q个候选转移概率∏(q)的转移概率,∏k-1是Markov跳变系统在k–1时刻的模式状态rk-1的转移概率真值,∏(q)和∏(r)分别为Ω中第q个候选转移概率和第r个候选转移概率,1≤r,q≤S,[·]S×S为S维矩阵,P(·|·)为条件概率运算符,·|·为条件运算符。
3.根据权利要求2所述的方法,其特征在于,步骤2包括:
定义Markov跳变系统的隐状态为其中,为Markov跳变系统在k时刻前的基状态序列,为Markov跳变系统在k时刻前的模式状态序列,为Markov跳变系统在k时刻前的含噪观测值序列,为Markov跳变系统非齐次转移概率在k时刻前的真值序列,是Markov跳变系统非齐次转移概率在k时刻第l次迭代估计时产生的估值序列,l为任意自然数,给定则非齐次转移概率在k时刻第l+1次的批处理迭代估计过程中,产生的代价函数如下所示:
<mrow> <msub> <mi>Q</mi> <mrow> <mi>b</mi> <mi>a</mi> <mi>t</mi> </mrow> </msub> <mrow> <mo>(</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msub> <mi>M</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>s</mi> </mrow> </msub> <mo>,</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>}</mo> </mrow>
<mrow> <mtable> <mtr> <mtd> <mrow> <mo>=</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mo>{</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>n</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mrow> <mi>n</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>r</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>n</mi> </msub> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>n</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>n</mi> </msub> <mo>|</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>n</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>}</mo> <mo>}</mo> </mrow> </mtd> </mtr> </mtable> <mo>,</mo> </mrow>
其中,f(·)为概率密度函数运算符,f(·|·)为条件概率密度函数运算符,E{·|·}为条件期望运算符,log(·)为求对数运算符,n为k时刻内的任意离散时间点,满足1≤n≤k,yn为Markov跳变系统在n时刻的含噪观测值,xn、xn-1分别Markov跳变系统在n时刻的基状态和n–1时刻的基状态,rn、rn-1分别为Markov跳变系统在n时刻的离散模式状态和n–1时刻的离散模式状态,∏n、∏n-1分别为Markov跳变系统模式状态在n时刻和n–1时刻的转移概率真值。
4.根据权利要求3所述的方法,其特征在于,步骤3包括:
非齐次转移概率在k时刻第l+1次的迭代过程中,通过Viterbi算法对代价函数求解最大化,获得非齐次转移概率序列在最大后验概率准则下的估计表达式:
<mrow> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>l</mi> <mo>+</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> </munder> <msub> <mi>Q</mi> <mrow> <mi>b</mi> <mi>a</mi> <mi>t</mi> </mrow> </msub> <mrow> <mo>(</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msubsup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>l</mi> <mi>k</mi> </msubsup> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,为使得函数g(φ)达到最大时的变量φ的值。
5.根据权利要求4所述的方法,其特征在于,步骤4包含:
在k时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数如下所示:
<mrow> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msub> <mi>M</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>s</mi> </mrow> </msub> <mo>,</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>,</mo> </mrow>
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的递推估值序列,为Markov跳变系统非齐次转移概率在k–1时刻的递推估值;
利用Viterbi算法对求解最大化时,对每一个节点∏k,重新确定到达该节点之前的最优估值序列因此,将k–1时刻获得的递推估值序列重新假设为未知量,则变换成:
<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> </munder> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> </munder> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msub> <mi>M</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>s</mi> </mrow> </msub> <mo>,</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> </munder> <mo>{</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>X</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>R</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>}</mo> </mrow> </mtd> </mtr> </mtable> <mo>,</mo> </mrow>
其中,为Markov跳变系统非齐次转移概率在k–1时刻前的真值序列,∏k-1为Markov跳变系统非齐次转移概率在k–1时刻的真值,Qrec(∏k,∏k-1)为Markov跳变系统非齐次转移概率基于真值序列∏k-1的递推代价函数,xk-1是Markov跳变系统在k–1时刻的基状态,rk-1∈{1,2,...,M}为Markov跳变系统在k–1时刻的离散模式状态,为Markov跳变系统在k–1时刻前的基状态序列,为Markov跳变系统在k–1时刻前的模式状态序列,Yk-1为Markov跳变系统在k–1时刻前的含噪观测值序列,为将参数θ视为变量时,函数I(θ)的最大值。
6.根据权利要求5所述的方法,其特征在于,步骤5包括:
步骤5-1,引入如下假设前提:
(a)在k时刻,Markov跳变系统状态的平滑估值能够被其滤波估值近似;
(b)在k时刻,给定Markov跳变系统在k–2时刻的基状态估计量,则忽略Markov跳变系统的基状态估值、基状态估值的误差协方差和模式状态估值对∏k-2的依赖,其中,为Markov跳变系统转移概率在k–2时刻前的真值序列;
步骤5-2,利用假设前提(a),变换成如下形式:
<mrow> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>&amp;ap;</mo> <msub> <mi>&amp;Delta;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,为k–1时刻,Markov跳变系统非齐次转移概率在递推形式下的代价函数,为Markov跳变系统转移概率在k–2时刻前的估值序列,中间变量Δk-1,k定义为:
<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <mi>&amp;Delta;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> </munder> <mo>{</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> </munder> <mo>{</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>+</mo> <mi>E</mi> <mo>{</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>}</mo> <mo>}</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>+</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> </munder> <mo>{</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mi>log</mi> <mi> </mi> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mi>|</mi> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mi>}</mi> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> 3
其中,j为Markov跳变系统在k时刻的模式状态,i为Markov跳变系统在k–1时刻的模式状态,满足1≤j,i≤M;
与∏k的取值无关,因此,当对∏k求解最大化时,可忽略该项;
(1)的中间变量P(rk=j,rk-1=i|Yk,∏k-1)变换为:
<mrow> <mtable> <mtr> <mtd> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mfrac> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>,</mo> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <mo>,</mo> <msubsup> <mi>P</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <mo>)</mo> </mrow> </mrow> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>k</mi> </msub> <mo>|</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> </mfrac> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>|</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>&amp;Lambda;</mi> <mi>k</mi> <mi>i</mi> </msubsup> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> <mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>T</mi> </msubsup> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <msub> <mi>&amp;Lambda;</mi> <mi>k</mi> </msub> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
其中,
为Markov跳变系统从模式状态rk-1=i到模式状态rk=j的转移概率;
为Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态似然函数,为相应的基状态似然函数矢量,(·)T为矩阵转置算子;
为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值,为Markov跳变系统在k–1时刻,基于模式状态rk-1=i和∏k-1的基状态估值误差协方差,cov{·}为协方差运算符;
为Markov跳变系统在k–1时刻,基于∏k-1的模式状态rk-1=i后验概率估值,为相应的模式状态后验概率估值矢量;
步骤5-3,利用假设前提(b),在当前时刻k,∏k-2的最优路径保持为不变,其中,为在k–1时刻所确定的前k–2时刻内转移概率的Viterbi估值序列,则 分别近似为:
<mrow> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <mo>&amp;ap;</mo> <mi>E</mi> <mo>{</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>}</mo> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <msubsup> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <msub> <mo>|</mo> <mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>;</mo> </mrow>
<mrow> <msubsup> <mi>P</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <mo>=</mo> <mi>cov</mi> <mo>{</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>}</mo> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <msubsup> <mover> <mi>P</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <msub> <mo>|</mo> <mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>;</mo> </mrow>
<mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <mo>&amp;ap;</mo> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>|</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msub> <mi>y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <msubsup> <mover> <mi>&amp;mu;</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <msub> <mo>|</mo> <mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>;</mo> </mrow>
<mrow> <msubsup> <mi>&amp;Lambda;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mo>&amp;ap;</mo> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>,</mo> <msubsup> <mover> <mi>x</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <msub> <mo>|</mo> <mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>,</mo> <msubsup> <mover> <mi>P</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>|</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> <msub> <mo>|</mo> <mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>)</mo> </mrow> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <msubsup> <mover> <mi>&amp;Lambda;</mi> <mo>&amp;OverBar;</mo> </mover> <mi>k</mi> <mi>j</mi> </msubsup> <msub> <mo>|</mo> <mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> </mrow> </msub> <mo>,</mo> </mrow> 4
其中,
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值;
为Markov跳变系统在k–1时刻,基于rk-1=i、和∏k-1的基状态估值误差协方差;
为Markov跳变系统在k–1时刻,基于和∏k-1的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k时刻,基于rk=j、k-1和∏k的基状态似然函数。
7.根据权利要求6所述的方法,其特征在于,步骤6推导的改进交互式多模型算法包括:
步骤6-1,计算Markov跳变系统模式状态rk-1=i的混合权重
<mrow> <mtable> <mtr> <mtd> <mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mrow> <mi>i</mi> <mo>|</mo> <mi>j</mi> </mrow> </msubsup> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mfrac> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>|</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> <mrow> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>|</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> <mrow> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> <mo>,</mo> </mrow>
步骤6-2,计算在模式状态rk=j条件下,Markov跳变系统的混合基状态概率密度函数f(xk-1|rk=j,∏k,Yk-1):
<mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>|</mo> <msub> <mi>r</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mi>i</mi> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mrow> <mi>i</mi> <mo>|</mo> <mi>j</mi> </mrow> </msubsup> <mo>,</mo> </mrow>
由于系统状态满足高斯分布,上式转换成:
其中,是均值为方差为的高斯概率密度函数;
将M个高斯密度函数的加权和近似成一个高斯密度函数:
其中,是均值为方差为的高斯概率密度函数,且:
其中(·)T为矩阵转置算子;
步骤6-3,计算模式状态的条件滤波估值:
通过卡尔曼滤波公式,计算Markov跳变系统在k时刻,基于模式状态rk=j的基状态估值基状态估值误差协方差与似然函数
步骤6-4,计算模式状态rk=j的后验概率
<mrow> <msubsup> <mi>&amp;mu;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mover> <mo>=</mo> <mi>&amp;Delta;</mi> </mover> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>|</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> </mrow>
<mrow> <mtable> <mtr> <mtd> <mrow> <mo>&amp;ap;</mo> <mfrac> <mrow> <msubsup> <mi>&amp;Lambda;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> <mrow> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msubsup> <mi>&amp;Lambda;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mi>P</mi> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>&amp;Lambda;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> <mrow> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msubsup> <mi>&amp;Lambda;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&amp;pi;</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> <mi>i</mi> </msubsup> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> <mo>;</mo> </mrow>
步骤6-5,计算Markov跳变系统在k时刻的融合估值xk|k和融合估值的误差协方差Pk|k
<mrow> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>|</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mi>f</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>k</mi> </msub> <mo>|</mo> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>=</mo> <mi>j</mi> <mo>,</mo> <msup> <mi>Y</mi> <mi>k</mi> </msup> <mo>,</mo> <msup> <mi>&amp;Pi;</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> <msubsup> <mi>&amp;mu;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mo>,</mo> </mrow>
其中,f(xk|rk=j,Yk,∏k)是Markov跳变系统在k时刻,基于模式状态rk=j和∏k的基状态概率密度函数,由一个高斯密度函数近似:
其中,是均值为xk|k,方差为Pk|k的高斯概率密度函数,且:
<mrow> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> <mi>j</mi> </msubsup> <msubsup> <mi>&amp;mu;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mo>,</mo> </mrow>
<mrow> <msub> <mi>P</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mo>&amp;lsqb;</mo> <msubsup> <mi>P</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> <mi>j</mi> </msubsup> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> <mi>j</mi> </msubsup> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>x</mi> <mrow> <mi>k</mi> <mo>|</mo> <mi>k</mi> </mrow> <mi>j</mi> </msubsup> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>&amp;rsqb;</mo> <msubsup> <mi>&amp;mu;</mi> <mi>k</mi> <mi>j</mi> </msubsup> <mo>.</mo> </mrow>
8.根据权利要求7所述的方法,其特征在于,步骤7包括:
步骤7-1,给定通过步骤6-1至步骤6-4推导获得的改进交互式多模型算法,计算
其中,为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)的模式状态rk-1=i后验概率估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态估值;
为Markov跳变系统在k–1时刻,基于∏k-1=∏(r)和模式状态rk-1=i的基状态误差协方差;
为Markov跳变系统在k时刻,基于∏k-1=∏(r)和∏k=∏(q)的模式状态rk=j后验概率估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值;
为Markov跳变系统在k时刻,基于模式状态rk=j、∏k-1=∏(r)和∏k=∏(q)的基状态估值误差协方差;
步骤7-2,遍历Markov跳变系统k时刻的转移概率,分别基于不同的∏k=∏(q),估计Markov跳变系统在k–1时刻的转移概率
<mrow> <msub> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </munder> <mo>{</mo> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;Delta;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>k</mi> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>&amp;Pi;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mi>},</mi> </mrow>
其中,∏k-1∈{∏(1),∏(2),...,∏(S)},为在已知∏k=∏(q)条件下的中间变量Δk-1,k,由公式(1)和公式(2)获得;
步骤7-3分别基于不同的∏k=∏(q),更新转移概率在k时刻的最优估值的候选序列
<mrow> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>k</mi> </msup> <msub> <mo>|</mo> <mrow> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mi>={</mi> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> <mo>,</mo> <msub> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>}</mo> <mo>,</mo> </mrow>
步骤7-4,分别基于不同的∏k=∏(q),更新Markov跳变系统在k时刻的转移概率代价函数
<mrow> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;Delta;</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>k</mi> </mrow> </msub> <msub> <mo>|</mo> <mrow> <mo>(</mo> <msub> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mo>|</mo> <mrow> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mo>)</mo> <mo>&amp;RightArrow;</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> </mrow> </msub> <mo>,</mo> </mrow>
其中,为在条件下,Markov跳变系统非齐次转移概率在k–1时刻的递推代价函数,为在条件下的中间变量Δk-1,k
步骤7-5,估计Markov跳变系统k时刻的转移概率
<mrow> <msub> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mi>k</mi> </msub> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> </munder> <mo>{</mo> <msub> <mi>Q</mi> <mrow> <mi>r</mi> <mi>e</mi> <mi>c</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>&amp;Pi;</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mi>&amp;Pi;</mi> <mrow> <mo>(</mo> <mi>q</mi> <mo>)</mo> </mrow> </msup> <mo>,</mo> <msup> <mover> <mi>&amp;Pi;</mi> <mo>^</mo> </mover> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>}</mo> <mo>.</mo> </mrow> 7
CN201710678700.XA 2017-08-10 2017-08-10 一种基于期望最大化算法的机动目标跟踪方法 Pending CN107452017A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710678700.XA CN107452017A (zh) 2017-08-10 2017-08-10 一种基于期望最大化算法的机动目标跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710678700.XA CN107452017A (zh) 2017-08-10 2017-08-10 一种基于期望最大化算法的机动目标跟踪方法

Publications (1)

Publication Number Publication Date
CN107452017A true CN107452017A (zh) 2017-12-08

Family

ID=60491885

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710678700.XA Pending CN107452017A (zh) 2017-08-10 2017-08-10 一种基于期望最大化算法的机动目标跟踪方法

Country Status (1)

Country Link
CN (1) CN107452017A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110426671A (zh) * 2019-07-04 2019-11-08 重庆邮电大学 Wsn中基于模型概率实时修正的imm目标跟踪方法及装置
CN113641102A (zh) * 2021-08-10 2021-11-12 杭州电子科技大学 城市轨道交通车站正系统建模与混杂滤波器设计方法
CN113656746A (zh) * 2021-07-21 2021-11-16 东南大学 一种动态结构下考虑群体异质性的出行方式链选择方法
CN115687885A (zh) * 2023-01-03 2023-02-03 中国电子科技集团公司第二十八研究所 用于运动模式不确定的机动单元运动状态预测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110426671A (zh) * 2019-07-04 2019-11-08 重庆邮电大学 Wsn中基于模型概率实时修正的imm目标跟踪方法及装置
CN110426671B (zh) * 2019-07-04 2023-05-12 重庆邮电大学 Wsn中基于模型概率实时修正的imm目标跟踪方法及装置
CN113656746A (zh) * 2021-07-21 2021-11-16 东南大学 一种动态结构下考虑群体异质性的出行方式链选择方法
CN113656746B (zh) * 2021-07-21 2022-06-17 东南大学 一种动态结构下考虑群体异质性的出行方式链选择方法
CN113641102A (zh) * 2021-08-10 2021-11-12 杭州电子科技大学 城市轨道交通车站正系统建模与混杂滤波器设计方法
CN113641102B (zh) * 2021-08-10 2024-01-30 杭州电子科技大学 城市轨道交通车站正系统建模与混杂滤波器设计方法
CN115687885A (zh) * 2023-01-03 2023-02-03 中国电子科技集团公司第二十八研究所 用于运动模式不确定的机动单元运动状态预测方法

Similar Documents

Publication Publication Date Title
CN107452017A (zh) 一种基于期望最大化算法的机动目标跟踪方法
CN106054170B (zh) 一种约束条件下的机动目标跟踪方法
CN107341820B (zh) 一种融合Cuckoo搜索和KCF的突变运动目标跟踪方法
CN103853908B (zh) 一种自适应交互式多模型的机动目标跟踪方法
CN104020466B (zh) 基于变结构多模型的机动目标跟踪方法
CN107396322A (zh) 基于路径匹配与编码译码循环神经网络的室内定位方法
CN107644217B (zh) 基于卷积神经网络和相关滤波器的目标跟踪方法
CN102721951B (zh) 一种高机动目标跟踪方法
CN104331623B (zh) 一种机动策略自适应的目标跟踪信息滤波方法
CN110501696B (zh) 一种基于多普勒量测自适应处理的雷达目标跟踪方法
CN105510882B (zh) 基于目标机动参数估计的快速自适应采样周期跟踪方法
CN107402381A (zh) 一种迭代自适应的多机动目标跟踪方法
CN106933106A (zh) 一种基于模糊控制多模型算法的目标跟踪方法
CN109798896A (zh) 一种室内机器人定位与建图方法及装置
CN110046378A (zh) 一种基于进化多目标优化的选择性分层集成高斯过程回归软测量建模方法
CN104156984A (zh) 一种不均匀杂波环境下多目标跟踪的概率假设密度方法
CN107783944A (zh) 一种多模型自校准无迹卡尔曼滤波方法
CN110289989A (zh) 一种基于容积卡尔曼滤波算法的分布式状态估计方法
CN110208792A (zh) 同时估计目标状态和轨迹参数的任意直线约束跟踪方法
CN107403439A (zh) 基于Cam‑shift的预测跟踪方法
CN107797106A (zh) 一种加速em未知杂波估计的phd多目标跟踪平滑滤波方法
CN112881979A (zh) 一种基于ekf滤波的初始状态自适应融合定位方法
CN110514567A (zh) 基于信息熵的气体源搜索方法
CN104795063A (zh) 一种基于声学空间非线性流形结构的声学模型构建方法
CN114881339A (zh) 车辆轨迹预测方法、系统、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208

RJ01 Rejection of invention patent application after publication