CN116667816A

CN116667816A - 基于神经网络的高精度非线性卡尔曼滤波器设计方法

Info

Publication number: CN116667816A
Application number: CN202310548410.9A
Authority: CN
Inventors: 文成林; 文韬; 刘晋卓
Original assignee: Guangdong University of Petrochemical Technology
Current assignee: Guangdong University of Petrochemical Technology
Priority date: 2023-05-16
Filing date: 2023-05-16
Publication date: 2023-08-29

Abstract

本发明公开了基于神经网络的高精度非线性卡尔曼滤波器设计方法，所述设计方法为将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征，建立深度神经网络卡尔曼滤波器，基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法，通过仿真实验表明，深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器，融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器。本发明采用上述基于神经网络的高精度非线性卡尔曼滤波器设计方法，可以实现线性高斯系统目标状态跟踪过程，将传统卡尔曼滤波预测步骤、更新步骤中的结果及结果组合作为神经网络输入特征，来训练其最优非线性组合形式的离线滤波器。

Description

基于神经网络的高精度非线性卡尔曼滤波器设计方法

技术领域

本发明涉及状态估计技术领域，尤其是涉及基于神经网络的高精度非线性卡尔曼滤波器设计方法。

背景技术

卡尔曼滤波是一种时域滤波方法，它采用状态空间法和最小均方误差递推形式来描述目标系统。卡尔曼滤波不仅能处理平稳随机过程，而且能处理立方和非平稳随机过程。目前，卡尔曼滤波理论作为最优估计理论之一，广泛应用于各个领域。然而，KF系统状态噪声的统计信息仅仅被用于计算卡尔曼增益，且求解的状态估计值仅仅是状态预测值、卡尔曼增益与新息的线性最优组合形式。如何求取其非线性最优组合形式以及更好地利用系统模型信息，成为了一个值得探索的新方向。

深度学习的空前成功刺激了许多基于深度神经网络(DNN)的方法用于模型预测优化的相关任务。深度学习的一个关键优势在于，除了输入和目标数据之外，我们不需要知道任何关于系统模型的信息，便可以直接迭代求解输入到输出的非线性组合形式。近期，Kyeongjun提出了一种基于DNN的卡尔曼滤波求解方法，将KF求解过程与DNN相结合，进行状态估计。然而，该方法仅在非线性系统中优于扩展卡尔曼滤波器(EKF)，在处理线性系统状态估计问题时，估计精度仍然低于KF。并且在迭代求解的过程中，由于全连接神经网络无法对时间序列数据进行很好的建模处理，这将导致预测过程稳定性变差，估计误差会随着时间变大。相比于全连接神经网络和卷积神经网络，对于目标跟踪、航迹预测等时间序列的处理，循环神经网络(RNN)展现了其强大的优势，成为时间相关数据处理时的普遍选择。LSTM是一种改进型循环神经网络,能够有效捕获长序列中的上下文信息，有效解决RNN中梯度消失和爆炸的问题。LSTM还具有良好的扩展能力,例如多层堆叠的LSTM，使得模型的参数量得到提升，能够处理更复杂的数据和场景。尽管如此，深度神经网络并不以规定性的方式来并入一些结构化模型的领域知识，而是需要大量的可训练参数和大数据集，缺乏例如KF等结构化方法的可解释性。这些约束限制了DNN在某些场景中(例如，缺乏很好的表征状态信息的输入标签)进行实时状态预测的应用。

发明内容

本发明的目的是提供基于基于神经网络的高精度非线性卡尔曼滤波器设计方法，可以实现线性高斯系统目标状态跟踪过程，将传统卡尔曼滤波预测步骤、更新步骤中的结果及结果组合作为神经网络输入特征，来训练其最优非线性组合形式的离线滤波器。

为实现上述目的，本发明提供了基于神经网络的高精度非线性卡尔曼滤波器设计方法，所述设计方法为将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征，在线训练输入到输出的非线性映射模型，建立深度神经网络卡尔曼滤波器，基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法，通过仿真实验表明，对于线性高斯系统，在离线迭代预测过程中，深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器，融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器的估计精度。

优选的，所述设计方法包括系统模型表述模块、线性卡尔曼滤波模块、深度神经网络卡尔曼滤波器设计模块、深度神经网络卡尔曼滤波器在线执行模块、线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块。

优选的，所述系统模型表述模块为给定线性高斯动态系统：

x_k+1＝A_k+1|kx_k+w_k

y_k+1＝C_k+1x_k+1+v_k+1

其中，x_k+1∈Rⁿ为状态向量，A_k+1|k∈R^n×n为k→k+1系统状态转移矩阵，w_k∈Rⁿ为状态建模误差，y_k+1∈R^m为测量向量，C_k+1∈R^n×m为测量输出矩阵，v_k+1∈R^m表示观测噪声；

状态噪声和测量噪声之间有如下统计特性：

E{w_k}＝E{v_k+1}＝0

其中，其中，Q_k为半正定矩阵，R_k+1为正定矩阵。

优选的，所述线性卡尔曼滤波模块是根据测量方差，对含有噪声的系统状态进行估计，主要分为预测步骤与更新步骤两个阶段；

预测步骤：

更新步骤：

其中，与/>表示卡尔曼滤波状态预测值与测量预测值，/>与/>表示预测估计误差协方差与估计误差协方差，/>表示新息，K_k+1表示卡尔曼增益，/>表示卡尔曼滤波最终估计值。

优选的，所述深度神经网络卡尔曼滤波器设计模块是基于线性卡尔曼滤波过程的求解结果来作为深度学习网络模型的输入，迭代训练其最合适的非线性组合形式，将深度卡尔曼滤波器公式化，包括第一神经网络模型和第二神经网络模型，分别用来预测系统状态估计值与估计误差协方差。

优选的，所述深度神经网络卡尔曼滤波器设计模块包括如下步骤：

(1)标签样本集，基于卡尔曼滤波结果建立深度学习训练的标签样本数据集，引入状态预测误差做为包含状态噪声信息的一个结果，选取第一神经网络模型的3个输入特征依次分别为/>与/>用于预测系统状态估计值，选取/>与作为第二神经网络模型的输入特征，用于预测系统估计误差协方差矩阵，表示将/>的元素依次按列展开为列向量；

(2)深度神经网络卡尔曼滤波器模型搭建，通过步骤(1)中的输入特征，分别建立预测系统状态估计值与估计误差协方差的两个神经网络模型：

其中，G(*)与F(*)分别表示预测系统状态估计值与估计误差协方差的神经网络模型，ω与b分别表示用于预测系统状态估计值神经网络模型的两种过程参数权值和偏置，α与β分别表示用于预测系统状态估计误差协方差神经网络模型的权值和偏置，η_k+1与分别表示两个神经网络模型的随机扰动；

(3)设计深度神经网络卡尔曼滤波器模型的具体架构，采用全连接层，将输入特征线性映射至更高的维度上，中间层采用LSTM网络，为整个模型的核心部分，实现输入特征到目标输出的非线性组合，第三部分采用全连接层，将其特征维度线性映射为一维，输出网络的预测值。

优选的，深度神经网络卡尔曼滤波器在线执行模块是基于建立的深度神经网络卡尔曼滤波器，建立从M₁+1时刻起的离线迭代预测求解过程，每个时刻的状态估计值与估计误差协方差分别表示如下：

其中，状态估计误差协方差求解如下：/>

优选的，所述线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块是将k+1时刻线性卡尔曼滤波的估计值和深度神经网络卡尔曼滤波的估计值组合：

其中与分别表示在k+1时刻卡尔曼滤波与深度神经网络卡尔曼滤波求解的状态估计误差，方差为/>的正态分布。

本发明所述的基于神经网络的高精度非线性卡尔曼滤波器设计方法的优点和积极效果是：

1、本发明既保持了KF结构模型的稳定性，也解决了DNN缺乏可训练标签的问题。

2、加入预测误差作为输入标签可以利用更多的系统模型信息，提升离线滤波器估计精度。

3、本发明采用LSTM模型进行训练，克服了深度卡尔曼滤波器递归求解误差逐渐变大的问题。

4、本发明提出了一种融合滤波器估计方法，在线性高斯系统中，可以实现比深度卡尔曼滤波和KF更优的估计结果，减少能源的浪费。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明实施例融合算法框图；

图2为本发明验证例目标状态1的估计结果图；

图3为本发明验证例目标状态2的估计结果图；

图4为本发明验证例目标状态1的估计误差图；

图5为本发明验证例目标状态2的估计误差图。

具体实施方式

以下通过附图和实施例对本发明的技术方案作进一步说明。

除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。

实施例

基于神经网络的高精度非线性卡尔曼滤波器设计方法，将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征，在线训练输入到输出的非线性映射模型，建立深度神经网络卡尔曼滤波器，基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法，通过仿真实验表明，对于线性高斯系统，在离线迭代预测过程中，深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器，融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器的估计精度。

设计方法包括系统模型表述模块、线性卡尔曼滤波(LKF)模块、深度神经网络卡尔曼滤波器(DKF)设计模块、深度神经网络卡尔曼滤波器在线执行模块、线性卡尔曼滤波(LKF)与深度神经网络卡尔曼滤波(DKF)结果融合模块。

系统模型表述模块为给定线性高斯动态系统：

x_k+1＝A_k+1|kx_k+w_k

y_k+1＝C_k+1x_k+1+v_k+1

状态噪声和测量噪声之间有如下统计特性：

E{w_k}＝E{v_k+1}＝0

其中，其中，Q_k为半正定矩阵，R_k+1为正定矩阵。

线性卡尔曼滤波(LKF)模块是根据测量方差，对含有噪声的系统状态进行估计，LKF具有实时性和递归性的优点，因此适合在线求解，主要分为预测步骤与更新步骤两个阶段；

预测步骤：

更新步骤：

可以发现，卡尔曼滤波器的推导过程中，系统状态噪声的统计信息仅仅被用于计算卡尔曼增益，且卡尔曼滤波估计值仅为预测过程与更新过程结果的线性组合形式。因此，为了更好地利用卡尔曼过程与系统模型信息，设计一种神经网络卡尔曼滤波器。

深度神经网络卡尔曼滤波器(DKF)设计模块是基于线性卡尔曼滤波过程的求解结果来作为深度学习网络模型的输入，迭代训练其最合适的非线性组合形式，将深度卡尔曼滤波器公式化，包括第一神经网络模型和第二神经网络模型，分别用来预测系统状态估计值与估计误差协方差。

深度神经网络卡尔曼滤波器设计模块包括如下步骤：

(1)标签样本集，基于卡尔曼滤波结果建立深度学习训练的标签样本数据集，引入状态预测误差做为包含状态噪声信息的一个结果，选取第一神经网络模型的3个输入特征依次分别为/>与/>用于预测系统状态估计值，选取/>与/>作为第二神经网络模型的输入特征，用于预测系统估计误差协方差矩阵，/>表示将的元素依次按列展开为列向量。

预测误差服从正态分布，即/>因此，可以进行通过蒙特卡洛采样得到预测误差。

其中，G(*)与F(*)分别表示预测系统状态估计值与估计误差协方差的神经网络模型；ω与b分别表示用于预测系统状态估计值神经网络模型的两种过程参数，即权值和偏置。同样，α与β分别表示用于预测系统状态估计误差协方差神经网络模型的权值和偏置。η_k+1与分别表示两个神经网络模型的随机扰动；

设X与Y分别表示预测状态估计值神经网络模型与预测状态估计误差协方差神经网络模型的两个样本数据集，数据集长度都设置为M₁，即与/>那么有：

其中，P_k+1|k+1表示真实估计误差协方差。

深度神经网络卡尔曼滤波器(DKF)在线执行模块是基于建立的深度神经网络卡尔曼滤波器，建立从M₁+1时刻起的离线迭代预测求解过程，每个时刻的状态估计值与估计误差协方差分别表示如下：

其中，状态估计误差协方差求解如下：/>

若系统工作环境在M₁+M₂时刻发生变化，那么需要在M₁+M₂+1时刻重新训练深度网络模型，以适应未来的状态更新过程。

线性卡尔曼滤波(LKF)与深度神经网络卡尔曼滤波(DKF)结果融合模块是将k+1时刻线性卡尔曼滤波的估计值和深度神经网络卡尔曼滤波的估计值组合：

其中与分别表示在k+1时刻卡尔曼滤波与深度神经网络卡尔曼滤波求解的状态估计误差，/>服从均值为0，方差为/>的正态分布，即/>

对式(1)进行移项整理，可以得到x_k+1表达式如下所示：

那么可以求解得k+1时刻LKF与DKF的状态融合估计值为：

继续求解k+1时刻卡尔曼滤波状态融合估计误差为

因此，k+1时刻卡尔曼滤波状态融合估计误差协方差矩阵求解如下

根据式(5)，可以得出如下结论：

因此，融合滤波器(FDKF)估计的结果同时优于KF与DKF，基于KF与DKF的融合滤波器结构框图如图1所示。图1中LKF，DKF与FDKF分别表示线性卡尔曼滤波、深度神经网络卡尔曼滤波与卡尔曼融合滤波估计结果，h_k-1与h_k分别表示LSTM网络上一时刻的输入与当前时刻的输出，σ为非线性激活函数。

验证例

在系统模型表述模块建立的高斯动态系统模型下进行数值仿真，将建立的滤波方法与相关线性滤波方法进行比较。建立数值仿真如下所示：

其中，w_k与v_k+1分别为状态噪声与测量噪声，均满足高斯动态系统模型，状态噪声协方差矩阵Q_k＝diag{0.8,1.2}，测量噪声协方差矩阵R_k+1＝0.95，初始条件为[x_0,1,x_0,2],＝[0.2,0.5]^T。

表1中DKF-1表示神经网络输入特征为DKF-2代表深度神经网络卡尔曼滤波；FDKF代表融合卡尔曼滤波方法。

采用学习率为0.01的Adam优化器来进行网络优化训练，样本集大小M₁＝10000。批训练大小设置为2500，采用均方误差MSE来度量每一个样本输出的损失函数。在网络训练完成后，连续进行100次的离线迭代对本发明方法进行测试。图2与图3中的空心圆曲线分别代表两种目标状态的实际曲线，其余曲线则分别代表四种滤波方法对两个目标状态的估计曲线。图4与图5为每种滤波方法的估计误差曲线。表1统计四种方法的平均估计误差，并将卡尔曼滤波器(KF)与另外三种方法进行对比分析，表中数据为每种方法相比真实值的平均估计误差，‘+’表示相比LKF方法精度提升；‘-’表示相比LKF方法精度下降。

表1 Comparison chart ofstate estimation errors

	X1	X2
			LFK	0.5748	0.5893
DKF-1	0.6739	0.6636
			提升效果	-17.24％	-7.43％
DKF-2	0.4924	0.5057
			提升效果	+14.34％	+14.19％
FDKF	0.4528	0.4294
			提升效果	+21.22％	+27.13％

通过分析图表可以发现，在线性高斯系统状态估计中，DKF-1相比KF估计精度差，而本发明建立的DKF-2相比DKF-1加入预测误差作为输入特征，对目标状态1与目标状态2的估计效果相比KF均提升14％以上，估计精度同时优于DKF-1与KF。这表明在线性高斯系统中，DKF-2利用到了更多系统模型信息，利用到的信息越多，那么也就可以获得更高的估计精度。

融合滤波器估计方法(FDKF)综合利用了KF与DKF-2的估计信息。对于两个目标状态的估计精度相比KF分别提升22.75％与26.63％。因此，FDKF同时优于KF与DKF-2的估计精度，且整个预测过程稳定性更高。

因此，本发明采用上述基于基于神经网络的高精度非线性卡尔曼滤波器设计方法，可以实现线性高斯系统目标状态跟踪过程，将传统卡尔曼滤波预测步骤、更新步骤中的结果及结果组合作为神经网络输入特征，来训练其最优非线性组合形式的离线滤波器。

最后应说明的是：以上实施例仅用以说明本发明的技术方案而非对其进行限制，尽管参照较佳实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对本发明的技术方案进行修改或者等同替换，而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims

1.基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：所述设计方法为将卡尔曼预测与更新过程的求解结果组合做为神经网络的输入特征，在线训练输入到输出的非线性映射模型，建立深度神经网络卡尔曼滤波器，基于卡尔曼滤波器与深度神经网络卡尔曼滤波器设计了一种融合滤波器估计方法，通过仿真实验表明，对于线性高斯系统，在离线迭代预测过程中，深度神经网络卡尔曼滤波器的估计精度优于卡尔曼滤波器，融合滤波器估计方法的估计精度同时优于深度神经网络卡尔曼滤波器与卡尔曼滤波器的估计精度。

2.根据权利要求1所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：所述设计方法包括系统模型表述模块、线性卡尔曼滤波模块、深度神经网络卡尔曼滤波器设计模块、深度神经网络卡尔曼滤波器在线执行模块、线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块。

3.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：所述系统模型表述模块为给定线性高斯动态系统：

x_k+1＝A_k+1|kx_k+w_k

y_k+1＝C_k+1x_k+1+v_k+1

状态噪声和测量噪声之间有如下统计特性：

E{w_k}＝E{v_k+1}＝0

其中，Q_k为半正定矩阵，R_k+1为正定矩阵。

4.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：所述线性卡尔曼滤波模块是根据测量方差，对含有噪声的系统状态进行估计，主要分为预测步骤与更新步骤两个阶段；

预测步骤：

更新步骤：

5.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：所述深度神经网络卡尔曼滤波器设计模块是基于线性卡尔曼滤波过程的求解结果来作为深度学习网络模型的输入，迭代训练其最合适的非线性组合形式，将深度卡尔曼滤波器公式化，包括第一神经网络模型和第二神经网络模型，分别用来预测系统状态估计值与估计误差协方差。

6.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于，所述深度神经网络卡尔曼滤波器设计模块包括如下步骤：

(1)标签样本集，基于卡尔曼滤波结果建立深度学习训练的标签样本数据集，引入状态预测误差做为包含状态噪声信息的一个结果，选取第一神经网络模型的3个输入特征依次分别为/>与/>用于预测系统状态估计值，选取/>与/>作为第二神经网络模型的输入特征，用于预测系统估计误差协方差矩阵，/>表示将/>的元素依次按列展开为列向量；

7.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：深度神经网络卡尔曼滤波器在线执行模块是基于建立的深度神经网络卡尔曼滤波器，建立从M₁+1时刻起的离线迭代预测求解过程，每个时刻的状态估计值与估计误差协方差分别表示如下：

其中，状态估计误差协方差求解如下：/>

8.根据权利要求2所述基于神经网络的高精度非线性卡尔曼滤波器设计方法，其特征在于：所述线性卡尔曼滤波与深度神经网络卡尔曼滤波结果融合模块是将k+1时刻线性卡尔曼滤波的估计值和深度神经网络卡尔曼滤波的估计值组合：

其中与/>分别表示在k+1时刻卡尔曼滤波与深度神经网络卡尔曼滤波求解的状态估计误差，方差为/>的正态分布。