CN116667816A - 基于神经网络的高精度非线性卡尔曼滤波器设计方法 - Google Patents
基于神经网络的高精度非线性卡尔曼滤波器设计方法 Download PDFInfo
- Publication number
- CN116667816A CN116667816A CN202310548410.9A CN202310548410A CN116667816A CN 116667816 A CN116667816 A CN 116667816A CN 202310548410 A CN202310548410 A CN 202310548410A CN 116667816 A CN116667816 A CN 116667816A
- Authority
- CN
- China
- Prior art keywords
- neural network
- kalman filter
- kalman
- estimation
- deep neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 87
- 238000013461 design Methods 0.000 title claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 28
- 230000004927 fusion Effects 0.000 claims abstract description 24
- 238000004088 simulation Methods 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims description 50
- 238000003062 neural network model Methods 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 18
- 238000013135 deep learning Methods 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 101150032192 dkf-1 gene Proteins 0.000 description 5
- 101150116958 dkf-2 gene Proteins 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012614 Monte-Carlo sampling Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0248—Filters characterised by a particular frequency response or filtering method
- H03H17/0255—Filters based on statistics
- H03H17/0257—KALMAN filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H2222/00—Indexing scheme relating to digital filtering methods
- H03H2222/04—Indexing scheme relating to digital filtering methods using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Feedback Control In General (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
本发明公开了基于神经网络的高精度非线性卡尔曼滤波器设计方法,所述设计方法为将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征,建立深度神经网络卡尔曼滤波器,基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法,通过仿真实验表明,深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器,融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器。本发明采用上述基于神经网络的高精度非线性卡尔曼滤波器设计方法,可以实现线性高斯系统目标状态跟踪过程,将传统卡尔曼滤波预测步骤、更新步骤中的结果及结果组合作为神经网络输入特征,来训练其最优非线性组合形式的离线滤波器。
Description
技术领域
本发明涉及状态估计技术领域,尤其是涉及基于神经网络的高精度非线性卡尔曼滤波器设计方法。
背景技术
卡尔曼滤波是一种时域滤波方法,它采用状态空间法和最小均方误差递推形式来描述目标系统。卡尔曼滤波不仅能处理平稳随机过程,而且能处理立方和非平稳随机过程。目前,卡尔曼滤波理论作为最优估计理论之一,广泛应用于各个领域。然而,KF系统状态噪声的统计信息仅仅被用于计算卡尔曼增益,且求解的状态估计值仅仅是状态预测值、卡尔曼增益与新息的线性最优组合形式。如何求取其非线性最优组合形式以及更好地利用系统模型信息,成为了一个值得探索的新方向。
深度学习的空前成功刺激了许多基于深度神经网络(DNN)的方法用于模型预测优化的相关任务。深度学习的一个关键优势在于,除了输入和目标数据之外,我们不需要知道任何关于系统模型的信息,便可以直接迭代求解输入到输出的非线性组合形式。近期,Kyeongjun提出了一种基于DNN的卡尔曼滤波求解方法,将KF求解过程与DNN相结合,进行状态估计。然而,该方法仅在非线性系统中优于扩展卡尔曼滤波器(EKF),在处理线性系统状态估计问题时,估计精度仍然低于KF。并且在迭代求解的过程中,由于全连接神经网络无法对时间序列数据进行很好的建模处理,这将导致预测过程稳定性变差,估计误差会随着时间变大。相比于全连接神经网络和卷积神经网络,对于目标跟踪、航迹预测等时间序列的处理,循环神经网络(RNN)展现了其强大的优势,成为时间相关数据处理时的普遍选择。LSTM是一种改进型循环神经网络,能够有效捕获长序列中的上下文信息,有效解决RNN中梯度消失和爆炸的问题。LSTM还具有良好的扩展能力,例如多层堆叠的LSTM,使得模型的参数量得到提升,能够处理更复杂的数据和场景。尽管如此,深度神经网络并不以规定性的方式来并入一些结构化模型的领域知识,而是需要大量的可训练参数和大数据集,缺乏例如KF等结构化方法的可解释性。这些约束限制了DNN在某些场景中(例如,缺乏很好的表征状态信息的输入标签)进行实时状态预测的应用。
发明内容
本发明的目的是提供基于基于神经网络的高精度非线性卡尔曼滤波器设计方法,可以实现线性高斯系统目标状态跟踪过程,将传统卡尔曼滤波预测步骤、更新步骤中的结果及结果组合作为神经网络输入特征,来训练其最优非线性组合形式的离线滤波器。
为实现上述目的,本发明提供了基于神经网络的高精度非线性卡尔曼滤波器设计方法,所述设计方法为将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征,在线训练输入到输出的非线性映射模型,建立深度神经网络卡尔曼滤波器,基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法,通过仿真实验表明,对于线性高斯系统,在离线迭代预测过程中,深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器,融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器的估计精度。
优选的,所述设计方法包括系统模型表述模块、线性卡尔曼滤波模块、深度神经网络卡尔曼滤波器设计模块、深度神经网络卡尔曼滤波器在线执行模块、线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块。
优选的,所述系统模型表述模块为给定线性高斯动态系统:
xk+1=Ak+1|kxk+wk
yk+1=Ck+1xk+1+vk+1
其中,xk+1∈Rn为状态向量,Ak+1|k∈Rn×n为k→k+1系统状态转移矩阵,wk∈Rn为状态建模误差,yk+1∈Rm为测量向量,Ck+1∈Rn×m为测量输出矩阵,vk+1∈Rm表示观测噪声;
状态噪声和测量噪声之间有如下统计特性:
E{wk}=E{vk+1}=0
其中,其中,Qk为半正定矩阵,Rk+1为正定矩阵。
优选的,所述线性卡尔曼滤波模块是根据测量方差,对含有噪声的系统状态进行估计,主要分为预测步骤与更新步骤两个阶段;
预测步骤:
更新步骤:
其中,与/>表示卡尔曼滤波状态预测值与测量预测值,/>与/>表示预测估计误差协方差与估计误差协方差,/>表示新息,Kk+1表示卡尔曼增益,/>表示卡尔曼滤波最终估计值。
优选的,所述深度神经网络卡尔曼滤波器设计模块是基于线性卡尔曼滤波过程的求解结果来作为深度学习网络模型的输入,迭代训练其最合适的非线性组合形式,将深度卡尔曼滤波器公式化,包括第一神经网络模型和第二神经网络模型,分别用来预测系统状态估计值与估计误差协方差。
优选的,所述深度神经网络卡尔曼滤波器设计模块包括如下步骤:
(1)标签样本集,基于卡尔曼滤波结果建立深度学习训练的标签样本数据集,引入状态预测误差做为包含状态噪声信息的一个结果,选取第一神经网络模型的3个输入特征依次分别为/>与/>用于预测系统状态估计值,选取/>与作为第二神经网络模型的输入特征,用于预测系统估计误差协方差矩阵,表示将/>的元素依次按列展开为列向量;
(2)深度神经网络卡尔曼滤波器模型搭建,通过步骤(1)中的输入特征,分别建立预测系统状态估计值与估计误差协方差的两个神经网络模型:
其中,G(*)与F(*)分别表示预测系统状态估计值与估计误差协方差的神经网络模型,ω与b分别表示用于预测系统状态估计值神经网络模型的两种过程参数权值和偏置,α与β分别表示用于预测系统状态估计误差协方差神经网络模型的权值和偏置,ηk+1与分别表示两个神经网络模型的随机扰动;
(3)设计深度神经网络卡尔曼滤波器模型的具体架构,采用全连接层,将输入特征线性映射至更高的维度上,中间层采用LSTM网络,为整个模型的核心部分,实现输入特征到目标输出的非线性组合,第三部分采用全连接层,将其特征维度线性映射为一维,输出网络的预测值。
优选的,深度神经网络卡尔曼滤波器在线执行模块是基于建立的深度神经网络卡尔曼滤波器,建立从M1+1时刻起的离线迭代预测求解过程,每个时刻的状态估计值与估计误差协方差分别表示如下:
其中,状态估计误差协方差求解如下:/>
优选的,所述线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块是将k+1时刻线性卡尔曼滤波的估计值和深度神经网络卡尔曼滤波的估计值组合:
其中 与分别表示在k+1时刻卡尔曼滤波与深度神经网络卡尔曼滤波求解的状态估计误差,方差为/>的正态分布。
本发明所述的基于神经网络的高精度非线性卡尔曼滤波器设计方法的优点和积极效果是:
1、本发明既保持了KF结构模型的稳定性,也解决了DNN缺乏可训练标签的问题。
2、加入预测误差作为输入标签可以利用更多的系统模型信息,提升离线滤波器估计精度。
3、本发明采用LSTM模型进行训练,克服了深度卡尔曼滤波器递归求解误差逐渐变大的问题。
4、本发明提出了一种融合滤波器估计方法,在线性高斯系统中,可以实现比深度卡尔曼滤波和KF更优的估计结果,减少能源的浪费。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明实施例融合算法框图;
图2为本发明验证例目标状态1的估计结果图;
图3为本发明验证例目标状态2的估计结果图;
图4为本发明验证例目标状态1的估计误差图;
图5为本发明验证例目标状态2的估计误差图。
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
实施例
基于神经网络的高精度非线性卡尔曼滤波器设计方法,将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征,在线训练输入到输出的非线性映射模型,建立深度神经网络卡尔曼滤波器,基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法,通过仿真实验表明,对于线性高斯系统,在离线迭代预测过程中,深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器,融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器的估计精度。
设计方法包括系统模型表述模块、线性卡尔曼滤波(LKF)模块、深度神经网络卡尔曼滤波器(DKF)设计模块、深度神经网络卡尔曼滤波器在线执行模块、线性卡尔曼滤波(LKF)与深度神经网络卡尔曼滤波(DKF)结果融合模块。
系统模型表述模块为给定线性高斯动态系统:
xk+1=Ak+1|kxk+wk
yk+1=Ck+1xk+1+vk+1
其中,xk+1∈Rn为状态向量,Ak+1|k∈Rn×n为k→k+1系统状态转移矩阵,wk∈Rn为状态建模误差,yk+1∈Rm为测量向量,Ck+1∈Rn×m为测量输出矩阵,vk+1∈Rm表示观测噪声;
状态噪声和测量噪声之间有如下统计特性:
E{wk}=E{vk+1}=0
其中,其中,Qk为半正定矩阵,Rk+1为正定矩阵。
线性卡尔曼滤波(LKF)模块是根据测量方差,对含有噪声的系统状态进行估计,LKF具有实时性和递归性的优点,因此适合在线求解,主要分为预测步骤与更新步骤两个阶段;
预测步骤:
更新步骤:
其中,与/>表示卡尔曼滤波状态预测值与测量预测值,/>与/>表示预测估计误差协方差与估计误差协方差,/>表示新息,Kk+1表示卡尔曼增益,/>表示卡尔曼滤波最终估计值。
可以发现,卡尔曼滤波器的推导过程中,系统状态噪声的统计信息仅仅被用于计算卡尔曼增益,且卡尔曼滤波估计值仅为预测过程与更新过程结果的线性组合形式。因此,为了更好地利用卡尔曼过程与系统模型信息,设计一种神经网络卡尔曼滤波器。
深度神经网络卡尔曼滤波器(DKF)设计模块是基于线性卡尔曼滤波过程的求解结果来作为深度学习网络模型的输入,迭代训练其最合适的非线性组合形式,将深度卡尔曼滤波器公式化,包括第一神经网络模型和第二神经网络模型,分别用来预测系统状态估计值与估计误差协方差。
深度神经网络卡尔曼滤波器设计模块包括如下步骤:
(1)标签样本集,基于卡尔曼滤波结果建立深度学习训练的标签样本数据集,引入状态预测误差做为包含状态噪声信息的一个结果,选取第一神经网络模型的3个输入特征依次分别为/>与/>用于预测系统状态估计值,选取/>与/>作为第二神经网络模型的输入特征,用于预测系统估计误差协方差矩阵,/>表示将的元素依次按列展开为列向量。
预测误差服从正态分布,即/>因此,可以进行通过蒙特卡洛采样得到预测误差。
(2)深度神经网络卡尔曼滤波器模型搭建,通过步骤(1)中的输入特征,分别建立预测系统状态估计值与估计误差协方差的两个神经网络模型:
其中,G(*)与F(*)分别表示预测系统状态估计值与估计误差协方差的神经网络模型;ω与b分别表示用于预测系统状态估计值神经网络模型的两种过程参数,即权值和偏置。同样,α与β分别表示用于预测系统状态估计误差协方差神经网络模型的权值和偏置。ηk+1与分别表示两个神经网络模型的随机扰动;
(3)设计深度神经网络卡尔曼滤波器模型的具体架构,采用全连接层,将输入特征线性映射至更高的维度上,中间层采用LSTM网络,为整个模型的核心部分,实现输入特征到目标输出的非线性组合,第三部分采用全连接层,将其特征维度线性映射为一维,输出网络的预测值。
设X与Y分别表示预测状态估计值神经网络模型与预测状态估计误差协方差神经网络模型的两个样本数据集,数据集长度都设置为M1,即与/>那么有:
其中,Pk+1|k+1表示真实估计误差协方差。
深度神经网络卡尔曼滤波器(DKF)在线执行模块是基于建立的深度神经网络卡尔曼滤波器,建立从M1+1时刻起的离线迭代预测求解过程,每个时刻的状态估计值与估计误差协方差分别表示如下:
其中,状态估计误差协方差求解如下:/>
若系统工作环境在M1+M2时刻发生变化,那么需要在M1+M2+1时刻重新训练深度网络模型,以适应未来的状态更新过程。
线性卡尔曼滤波(LKF)与深度神经网络卡尔曼滤波(DKF)结果融合模块是将k+1时刻线性卡尔曼滤波的估计值和深度神经网络卡尔曼滤波的估计值组合:
其中 与分别表示在k+1时刻卡尔曼滤波与深度神经网络卡尔曼滤波求解的状态估计误差,/>服从均值为0,方差为/>的正态分布,即/>
对式(1)进行移项整理,可以得到xk+1表达式如下所示:
那么可以求解得k+1时刻LKF与DKF的状态融合估计值为:
继续求解k+1时刻卡尔曼滤波状态融合估计误差为
因此,k+1时刻卡尔曼滤波状态融合估计误差协方差矩阵求解如下
根据式(5),可以得出如下结论:
因此,融合滤波器(FDKF)估计的结果同时优于KF与DKF,基于KF与DKF的融合滤波器结构框图如图1所示。图1中LKF,DKF与FDKF分别表示线性卡尔曼滤波、深度神经网络卡尔曼滤波与卡尔曼融合滤波估计结果,hk-1与hk分别表示LSTM网络上一时刻的输入与当前时刻的输出,σ为非线性激活函数。
验证例
在系统模型表述模块建立的高斯动态系统模型下进行数值仿真,将建立的滤波方法与相关线性滤波方法进行比较。建立数值仿真如下所示:
其中,wk与vk+1分别为状态噪声与测量噪声,均满足高斯动态系统模型,状态噪声协方差矩阵Qk=diag{0.8,1.2},测量噪声协方差矩阵Rk+1=0.95,初始条件为[x0,1,x0,2],=[0.2,0.5]T。
表1中DKF-1表示神经网络输入特征为DKF-2代表深度神经网络卡尔曼滤波;FDKF代表融合卡尔曼滤波方法。
采用学习率为0.01的Adam优化器来进行网络优化训练,样本集大小M1=10000。批训练大小设置为2500,采用均方误差MSE来度量每一个样本输出的损失函数。在网络训练完成后,连续进行100次的离线迭代对本发明方法进行测试。图2与图3中的空心圆曲线分别代表两种目标状态的实际曲线,其余曲线则分别代表四种滤波方法对两个目标状态的估计曲线。图4与图5为每种滤波方法的估计误差曲线。表1统计四种方法的平均估计误差,并将卡尔曼滤波器(KF)与另外三种方法进行对比分析,表中数据为每种方法相比真实值的平均估计误差,‘+’表示相比LKF方法精度提升;‘-’表示相比LKF方法精度下降。
表1 Comparison chart ofstate estimation errors
X1 | X2 | |
LFK | 0.5748 | 0.5893 |
DKF-1 | 0.6739 | 0.6636 |
提升效果 | -17.24% | -7.43% |
DKF-2 | 0.4924 | 0.5057 |
提升效果 | +14.34% | +14.19% |
FDKF | 0.4528 | 0.4294 |
提升效果 | +21.22% | +27.13% |
通过分析图表可以发现,在线性高斯系统状态估计中,DKF-1相比KF估计精度差,而本发明建立的DKF-2相比DKF-1加入预测误差作为输入特征,对目标状态1与目标状态2的估计效果相比KF均提升14%以上,估计精度同时优于DKF-1与KF。这表明在线性高斯系统中,DKF-2利用到了更多系统模型信息,利用到的信息越多,那么也就可以获得更高的估计精度。
融合滤波器估计方法(FDKF)综合利用了KF与DKF-2的估计信息。对于两个目标状态的估计精度相比KF分别提升22.75%与26.63%。因此,FDKF同时优于KF与DKF-2的估计精度,且整个预测过程稳定性更高。
因此,本发明采用上述基于基于神经网络的高精度非线性卡尔曼滤波器设计方法,可以实现线性高斯系统目标状态跟踪过程,将传统卡尔曼滤波预测步骤、更新步骤中的结果及结果组合作为神经网络输入特征,来训练其最优非线性组合形式的离线滤波器。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
Claims (8)
1.基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:所述设计方法为将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征,在线训练输入到输出的非线性映射模型,建立深度神经网络卡尔曼滤波器,基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法,通过仿真实验表明,对于线性高斯系统,在离线迭代预测过程中,深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器,融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器的估计精度。
2.根据权利要求1所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:所述设计方法包括系统模型表述模块、线性卡尔曼滤波模块、深度神经网络卡尔曼滤波器设计模块、深度神经网络卡尔曼滤波器在线执行模块、线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块。
3.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:所述系统模型表述模块为给定线性高斯动态系统:
xk+1=Ak+1|kxk+wk
yk+1=Ck+1xk+1+vk+1
其中,xk+1∈Rn为状态向量,Ak+1|k∈Rn×n为k→k+1系统状态转移矩阵,wk∈Rn为状态建模误差,yk+1∈Rm为测量向量,Ck+1∈Rn×m为测量输出矩阵,vk+1∈Rm表示观测噪声;
状态噪声和测量噪声之间有如下统计特性:
E{wk}=E{vk+1}=0
其中,Qk为半正定矩阵,Rk+1为正定矩阵。
4.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:所述线性卡尔曼滤波模块是根据测量方差,对含有噪声的系统状态进行估计,主要分为预测步骤与更新步骤两个阶段;
预测步骤:
更新步骤:
其中,与/>表示卡尔曼滤波状态预测值与测量预测值,/>与/>表示预测估计误差协方差与估计误差协方差,/>表示新息,Kk+1表示卡尔曼增益,/>表示卡尔曼滤波最终估计值。
5.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:所述深度神经网络卡尔曼滤波器设计模块是基于线性卡尔曼滤波过程的求解结果来作为深度学习网络模型的输入,迭代训练其最合适的非线性组合形式,将深度卡尔曼滤波器公式化,包括第一神经网络模型和第二神经网络模型,分别用来预测系统状态估计值与估计误差协方差。
6.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于,所述深度神经网络卡尔曼滤波器设计模块包括如下步骤:
(1)标签样本集,基于卡尔曼滤波结果建立深度学习训练的标签样本数据集,引入状态预测误差做为包含状态噪声信息的一个结果,选取第一神经网络模型的3个输入特征依次分别为/>与/>用于预测系统状态估计值,选取/>与/>作为第二神经网络模型的输入特征,用于预测系统估计误差协方差矩阵,/>表示将/>的元素依次按列展开为列向量;
(2)深度神经网络卡尔曼滤波器模型搭建,通过步骤(1)中的输入特征,分别建立预测系统状态估计值与估计误差协方差的两个神经网络模型:
其中,G(*)与F(*)分别表示预测系统状态估计值与估计误差协方差的神经网络模型,ω与b分别表示用于预测系统状态估计值神经网络模型的两种过程参数权值和偏置,α与β分别表示用于预测系统状态估计误差协方差神经网络模型的权值和偏置,ηk+1与分别表示两个神经网络模型的随机扰动;
(3)设计深度神经网络卡尔曼滤波器模型的具体架构,采用全连接层,将输入特征线性映射至更高的维度上,中间层采用LSTM网络,为整个模型的核心部分,实现输入特征到目标输出的非线性组合,第三部分采用全连接层,将其特征维度线性映射为一维,输出网络的预测值。
7.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:深度神经网络卡尔曼滤波器在线执行模块是基于建立的深度神经网络卡尔曼滤波器,建立从M1+1时刻起的离线迭代预测求解过程,每个时刻的状态估计值与估计误差协方差分别表示如下:
其中,状态估计误差协方差求解如下:/>
8.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法,其特征在于:所述线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块是将k+1时刻线性卡尔曼滤波的估计值和深度神经网络卡尔曼滤波的估计值组合:
其中 与/>分别表示在k+1时刻卡尔曼滤波与深度神经网络卡尔曼滤波求解的状态估计误差,方差为/>的正态分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310548410.9A CN116667816A (zh) | 2023-05-16 | 2023-05-16 | 基于神经网络的高精度非线性卡尔曼滤波器设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310548410.9A CN116667816A (zh) | 2023-05-16 | 2023-05-16 | 基于神经网络的高精度非线性卡尔曼滤波器设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116667816A true CN116667816A (zh) | 2023-08-29 |
Family
ID=87710293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310548410.9A Pending CN116667816A (zh) | 2023-05-16 | 2023-05-16 | 基于神经网络的高精度非线性卡尔曼滤波器设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116667816A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117192063A (zh) * | 2023-11-06 | 2023-12-08 | 山东大学 | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 |
-
2023
- 2023-05-16 CN CN202310548410.9A patent/CN116667816A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117192063A (zh) * | 2023-11-06 | 2023-12-08 | 山东大学 | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 |
CN117192063B (zh) * | 2023-11-06 | 2024-03-15 | 山东大学 | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | DL-PDE: Deep-learning based data-driven discovery of partial differential equations from discrete and noisy data | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN112116138A (zh) | 基于数据驱动的电力系统预测状态估计方法及系统 | |
CN110175425B (zh) | 一种基于mmalstm的齿轮剩余寿命的预测方法 | |
CN116667816A (zh) | 基于神经网络的高精度非线性卡尔曼滤波器设计方法 | |
de Avila Belbute-Peres et al. | HyperPINN: Learning parameterized differential equations with physics-informed hypernetworks | |
Schiassi et al. | Bellman neural networks for the class of optimal control problems with integral quadratic cost | |
Yang et al. | A neural network learning algorithm of chemical process modeling based on the extended Kalman filter | |
CN107704944B (zh) | 一种基于信息论学习的股市波动区间预测模型的构建方法 | |
De Florio et al. | AI-Lorenz: A physics-data-driven framework for black-box and gray-box identification of chaotic systems with symbolic regression | |
Luo et al. | A novel nonlinear combination model based on support vector machine for stock market prediction | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
Springer et al. | Robust parameter estimation of chaotic systems | |
CN117334271A (zh) | 一种基于指定属性生成分子的方法 | |
Li et al. | Luenberger-like observer design and optimal state estimation of logical control networks with stochastic disturbances | |
CN111539157A (zh) | 一种基于多层感知机的动载荷时域识别方法 | |
CN114819107B (zh) | 基于深度学习的混合数据同化方法 | |
Prakash et al. | Constrained state estimation using the ensemble Kalman filter | |
Belbute-Peres et al. | HyperPINN: Learning parameterized differential equations with physics-informed hypernetworks | |
CN114548400A (zh) | 一种快速灵活全纯嵌入式神经网络广域寻优训练方法 | |
CN115545200A (zh) | 一维混沌时间序列的精准长期预测方法 | |
CN113344175A (zh) | 一种团簇能量预测方法及系统 | |
CN113962369B (zh) | 一种基于改进Levenberg-Marquardt的径向基神经网络优化方法 | |
Pal et al. | Identification of a Box-Jenkins structured two stage cascaded model using simplex particle swarm optimization algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |