CN114580285A

CN114580285A - 一种基于cae网络的双曲型系统模型约简方法

Info

Publication number: CN114580285A
Application number: CN202210217132.4A
Authority: CN
Inventors: 艾岭; 甘俊哲
Original assignee: Harbin University of Science and Technology
Current assignee: Harbin Liangsu Agricultural Technology Co ltd
Priority date: 2022-03-07
Filing date: 2022-03-07
Publication date: 2022-06-03
Anticipated expiration: 2042-03-07
Also published as: CN114580285B

Abstract

本发明公开了一种基于CAE网络的双曲型系统模型约简方法，所述方法包括如下步骤：步骤1：采集传感器时空数据，并对时空数据进行预处理；步骤2：对高维时空数据进行模型约简，训练CAE网络，获得编码器网络和解码器网络，由此计算系统的低维表示；步骤3：训练GRU网络，建立系统低维表示的低维时间序列模型；步骤4：将系统最近的时空数据经标准化后送入CAE编码器获得双曲型系统的低维表示，利用低维时间序列模型预测下一时刻低维表示的输出值，再由CAE解码器进行解码，重构未来输出的预测值，进行反标准化得到系统原始传感器时空数据的预测值。该方法通过使用CAE网络，提高了双曲型系统的模型约简精度。

Description

一种基于CAE网络的双曲型系统模型约简方法

技术领域

本发明涉及一种双曲型系统模型约简方法，具体涉及一种基于CAE(Convolutional AutoEncoder，卷积自编码器)网络的双曲型系统模型约简方法。

背景技术

在实际工业控制系统中，广泛存在着一类具有时空耦合的非线性系统，其系统动态特性可以由PDE(Partial Differential Equation，偏微分方程)描述，这类系统可以被称为分布参数系统。由于这类复杂系统存在无限维空间分布特性，往往还会存在非线性和不确定性，对其进行精确建模具有一定的挑战性。一般情况下，首先要对系统进行模型约简，先降低原始系统的维数，建立模型，随后再进行控制器的设计。

模型约简通常可分为时空离散化和时空分解两类。对于抛物型系统，由于动态特性可以划分为慢模态和快模态，采用基于PCA(Principal Component Analysis，主成分分析法)等时空分解方法可通过忽略快模态将高维系统用一组表征慢模态的空间基函数转化为求解相应的低维时间系数的系统辨识问题。然而，对于另一类广泛存在的双曲型系统，不存在主导基函数(慢模态)，采用传统方法(如谱方法、PCA等)无法找到其低维表示，只能采用有限差分或特征线法等时空离散化方法进行模型约简，这就导致双曲型系统的模型阶数偏高。

近年来，深度学习理论发展迅速，已经有学者尝试将数据分析中的降维算法引入到分布参数系统的建模问题中。然而，目前所采用的算法在处理双曲型系统时仍存在模型精度偏低、训练过程复杂等不足。

发明内容

本发明针对过程工业中常见的双曲型系统，提供了一种基于CAE网络的双曲型系统模型约简方法。该方法通过使用CAE网络，提高双曲型系统的模型约简精度，并给出一种基于GRU(Gated Recurrent Unit，门控循环单元)网络的低维时间序列预测模型。

本发明的目的是通过以下技术方案实现的：

一种基于CAE网络的双曲型系统模型约简方法，包括如下步骤：

步骤1：采集足够获得双曲型系统全部动态特性的传感器时空数据，并对采集的时空数据进行预处理，具体步骤如下：

(1)由如下一阶双曲型PDE描述双曲型系统动态特性：

初始条件和边界条件满足：

Y_s(x,0)＝y₀(x)；

Y_s(a,t)＝L(t)；

其中，x表示空间变量，t表示时间变量，Y_s(x,t)表示关于空间变量x和时间变量t的时空数据，f(x,t)和g(Y_s,x,t)是关于空间变量x和时间变量t的光滑非线性函数，y₀(x)表示系统的初始状态，a表示系统的左边界，L(t)表示关于时间变量t的连续光滑函数；

(2)假设在空间上布置足够采集双曲型系统全部动态特征的M个传感器，采用合适的采样时间t_s对系统时空数据进行采集，共采集N个时刻的时空数据

表示系统在x_m位置上第t_n时刻的采样值，m＝0,1,...,M-1，n＝0,1,...,N-1，

表示系统在t_n时刻所有传感器测量值组成的列向量，被称为系统输出在t_n时刻的闪点，

表示系统的第m个传感器测量的全部采样值，上角标T表示矩阵转置；

(3)将采集的时空数据

进行预处理，得到标准化至[0,1]区间的时空数据

其中，

和

分别表示向量

中各元素的最小值和最大值；

步骤2：对高维时空数据进行模型约简，训练CAE网络，获得编码器网络T⁺和解码器网络T^-，并由此计算双曲型系统的低维表示，具体步骤如下：

(1)进行CAE网络初始化，设定层数p，每一层的卷积核个数m_p-1，其中：

所述CAE网络包含编码器、解码器两部分，均采用堆叠卷积层M-m₁-…-m_p-2-m的形式，每层所有卷积核的宽度均设置为1，卷积核长度由该层输入数据的维度决定，卷积层输出数据的维度等于卷积核个数，编码器通过逐层减少卷积核个数，最终实现数据的降维；解码器网络结构m-m_p-2-…-m₁-M与编码器网络结构完全对称，卷积核个数与之相反达到扩张维度的目的，便于下一步计算重构损失；

(2)使用BP(Back Propagation，反向传播)算法对CAE网络进行训练，选择Adam(Adaptive momentum，自适应矩估计)作为优化器，采用RMSE(Root Mean Square Error，均方根误差)作为评价指标，更新CAE网络权值直至网络收敛，获得编码器网络T⁺和解码器网络T^-，由此计算出双曲型系统的低维表示y＝T⁺(Y)，其中，T⁺表示编码器网络，y∈R^m×N表示系统低维表示；

步骤3：训练GRU网络，建立双曲型系统低维表示的低维时间序列模型，具体步骤如下：

(1)初始化GRU网络，划分前N₁个数据为训练集，后N₂个数据为测试集，N₁+N₂＝N，训练GRU网络获得低维时间序列模型，其中：

所述GRU网络由GRU层与全连接层组成，GRU层包含2个门和2个状态，分别是更新门Z_t、重置门r_t、候选状态

和隐藏状态h_t：

更新门：Z_t＝σ(W_z[h_t-1,y_t]+b_z)；

重置门：r_t＝σ(W_r[h_t-1,y_t]+b_r)；

候选状态：

隐藏状态：

其中，

表示当前时刻的输入向量，

表示上一时刻的隐藏状态向量，ν表示GRU层神经元数量，W_z和b_z分别表示更新门的权值矩阵和偏置向量，σ表示Sigmoid函数，

Z_t表示更新门的激活向量，r_t表示重置门，W_r与b_r分别表示重置门的权值矩阵和偏置向量，

⊙表示Hadamard乘积运算；隐藏状态在一个单元输出之后传导至下一个单元，最后一个时刻的隐藏状态即为GRU层的输出；在这之后接全连接层匹配低维表示的维度，全连接层公式如下：

其中，W_y表示维度匹配矩阵，h_t表示输出层神经元向量，

表示GRU网络的最终输出，即低维表示的未来预测值；

(2)设GRU层的层数为c，每层节点数为d，则GRU网络结构为d₀-d₁-…-d_c-1，应用滑动窗格法，设滑窗宽度为l+1，滑窗的步长为1，使用BP算法对GRU网络进行训练，更新GRU网络权值直至网络收敛，得到低维表示的未来预测值

步骤4：将双曲型系统最近的时空数据经标准化后送入CAE编码器获得双曲型系统的低维表示，利用低维时间序列模型预测下一时刻低维表示的输出值，再由CAE解码器进行解码，重构未来输出的预测值，进行反标准化得到双曲型系统原始传感器时空数据的预测值，具体步骤如下：

依次将双曲型系统最近的时空数据Y_s|_t经标准化为Y|_t后送入CAE编码器获得系统的低维表示y_t，利用低维时间序列模型G预测下一时刻低维表示的输出值

再由CAE解码器进行解码，从而获得系统未来输出的预测值

y_t＝T⁺(Y|_t)；

其中，Y|_t表示系统在t时刻标准化的闪点数据，

表示模型在t+1时刻标准化的闪点预测值，

表示模型在t+1时刻的闪点预测值，G表示GRU网络，T^-表示解码器网络。

相比于现有技术，本发明具有如下优点：

本发明采用CAE网络实现双曲型系统的模型约简，相比于传统SAE(StackAutoEncoder，堆叠自编码器)，使用一维卷积方式对输入信号进行线性变换，其权重是共享的，能够更好地挖掘系统的抽象特征，再通过逐层深度学习的方式，可以更好地提取到高维系统的本质特征，降低了系统维数，同时利用GRU网络获得低维时间序列精确模型，有效地提高了双曲型系统预测模型的重构精度，弥补了现有技术无法获得双曲型系统精确低维模型的问题。

附图说明

图1为基于CAE和GRU网络的双曲型系统建模方法；

图2为平流系统数值解；

图3为基于PCA方法的系统重建时空数据；

图4为基于SAE方法的系统重建时空数据；

图5为基于CAE方法的系统重构时空数据；

图6为基于GRU网络的系统低维表示；

图7为基于CAE和GRU网络的系统时空数据预测值。

具体实施方式

下面结合附图对本发明的技术方案作进一步的说明，但并不局限于此，凡是对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的保护范围中。

本发明提供了一种基于CAE网络的双曲型系统模型约简方法，包括如下步骤：

步骤1：采集足够获得双曲型系统全部动态特性的传感器时空数据，并对采集的时空数据进行预处理。

本步骤中，不失一般性，选择一阶双曲型系统进行说明，考虑系统动态特性可以由如下一阶双曲型PDE描述：

初始条件和边界条件满足：

Y_s(x,0)＝y₀(x) (2)；

Y_s(a,t)＝L(t) (3)；

其中，x表示空间变量，t表示时间变量，Y_s(x,t)表示关于空间变量x和时间变量t的时空数据，f(x,t)和g(Y_s,x,t)是关于空间变量x和时间变量t的光滑非线性函数，y₀(x)表示系统的初始状态，a表示系统的左边界，L(t)表示关于时间变量t的连续光滑函数。

假设在空间上布置足够采集系统全部动态特征的M个传感器，采用合适的采样时间t_s对系统时空数据进行采集，共采集N个时刻的时空数据

表示系统的第m个传感器测量的全部采样值，上角标T表示矩阵转置。将采集的时空数据进行预处理，得到标准化至[0,1]区间的时空数据

其中，

和

分别表示向量

中各元素的最小值和最大值。

步骤2：对高维时空数据进行模型约简，训练CAE网络，获得编码器网络T⁺和解码器网络T^-，并由此计算双曲型系统的低维表示。

本步骤中，进行CAE网络初始化，设定层数p，每一层的卷积核个数m_p-1。

可选的：激活函数可以选择线性整流函数，其数学表达式为：

可选的，激活函数可以选择一种具有单侧抑制特点和稀疏激活性的改进的线性整流函数ELU函数，其数学表达式为：

其中，α是预先给定的超参数。

本发明所提方法中，所述CAE网络包含编码器、解码器两部分，均采用堆叠卷积层M-m₁-…-m_p-2-m的形式，每层所有卷积核的宽度均设置为1，卷积核长度由该层输入数据的维度决定，则实际的第一层卷积核大小为M×1，第二层卷积核大小m₁×1，以此类推。卷积层输出数据的维度等于卷积核个数，编码器通过逐层减少卷积核个数，最终实现数据的降维。解码器网络结构m-m_p-2-…-m₁-M与编码器网络结构完全对称，卷积核个数与之相反达到扩张维度的目的，便于下一步计算重构损失。为便于说明，编码和解码过程分别用T⁺和T^-抽象表达，则该过程可表示为：

y＝T⁺(Y) (7)；

其中，T⁺表示编码器网络，y∈R^m×N表示系统低维表示，T^-表示解码器网络，

是高维重建时空数据。

选择衡量损失的评价指标为：

使用BP算法对网络进行训练，更新CAE网络权值直至网络收敛。

可选的，优化器选择Adam，学习率设置为0.001。

步骤3：训练GRU网络，建立双曲型系统低维表示的低维时间序列模型。

本步骤中，建立基于GRU网络独立的低维时间序列模型。初始化GRU网络，划分前N₁个数据为训练集，后N₂个数据为测试集，N₁+N₂＝N，训练GRU网络获得低维时间序列模型。GRU网络由GRU层与全连接层组成，GRU层包含2个门和2个状态，分别是更新门Z_t、重置门r_t、候选状态

和隐藏状态h_t：

更新门：Z_t＝σ(W_z[h_t-1,y_t]+b_z) (10)；

重置门：r_t＝σ(W_r[h_t-1,y_t]+b_r) (11)；

候选状态：

隐藏状态：

其中，

表示当前时刻的输入向量，

⊙表示Hadamard乘积运算。隐藏状态在一个单元输出之后传导至下一个单元，最后一个时刻的隐藏状态即为GRU层的输出。在这之后需要接全连接层来匹配低维表示的维度，全连接层公式如下：

其中，W_y表示维度匹配矩阵，h_t表示输出层神经元向量，

表示GRU网络的最终输出，即低维表示的未来预测值。设GRU层的层数为c，每层节点数为d，则GRU网络结构为d₀-d₁-…-d_c-1。应用滑动窗格法，设滑窗宽度为l+1，滑窗的步长为1，使用BP算法对网络进行训练，更新GRU网络权值直至网络收敛。

可选的：优化器选择Adam，学习率设置为0.001。

步骤4：将双曲型系统最近的时空数据经标准化后送入CAE编码器获得双曲型系统的低维表示，利用低维时间序列模型预测下一时刻低维表示的输出值，再由CAE解码器进行解码，重构未来输出的预测值，进行反标准化得到双曲型系统原始传感器时刻数据的预测值。

本步骤中，依次将系统最近的时空数据Y_s|_t经标准化为Y|_t后送入CAE编码器获得系统的低维表示y_t，利用低维时间序列模型G预测下一时刻低维表示的输出值

再由CAE解码器进行解码，从而获得系统未来输出的预测值

y_t＝T⁺(Y|_t) (15)；

其中，Y|_t表示系统在t时刻标准化的闪点数据，

表示模型在t+1时刻标准化的闪点预测值，

表示模型在t+1时刻的闪点预测值，G表示GRU网络函数。图1给出了所提建模方法的示意图。

本发明采用CAE网络对双曲型系统进行模型约简同现有方法相比，在相同降阶维度下，具有更优秀的建模精度，更少的网络训练时间和简单的网络结构。

实施例：

本实施例提供了一种基于CAE网络模型约简方法的具体应用，并给出一种基于GRU网络的低维时间序列预测模型。如图1所示，包括以下步骤：

步骤S01：考虑由一阶双曲型PDE描述的平流输运过程建模问题，假设在系统轴向等间隔设置足够的传感器，选择合适的采样时间采集系统的闪点值，并对获得的数据进行预处理。

在本实施例中，平流输运过程可由如下一阶双曲型PDE描述：

初始条件：

其中，Y(x,t)表示关于时间t和空间x上的某物理量(如热量、湿度或盐度)的函数，s表示该物理量的输运速度；当s为常数时，可以得到方程的行波解为：

当α＝5，s＝1，x∈[-2,2]，t∈[-2,2]时，传感器位置间隔Δx＝0.04，采样时间为t_s＝0.001，取方程的行波解在100个传感器位置上的4000个采样值作为系统的真实输出值Y_s(x_m,t_n)∈R^100×4000，按式(4)的方法对数据Y_s进行预处理后的数据为Y(x_m,t_n)，如图2所示。

步骤S02：对高维时空数据进行模型约简，采用Adam优化器训练CAE网络，获得编码器网络T⁺和解码器网络T^-，并由此计算平流系统的低维表示；同时，采用相同的编解码器网络结构训练SAE网络和PCA降维算法作为估计所提方法性能的对比算法。

在本实施例中，设编码器结构为100-20-10-2，解码器结构为2-10-20-100，卷积层均使用ELU函数作为激活函数，α＝1。使用BP算法对网络进行训练，选择Adam作为优化器，采用评价指标(9)，更新CAE网络权值直至网络收敛，获得编码器网络T⁺和解码器网络T^-，由此计算出平流系统Y的低维表示y。基于PCA方法、SAE方法和CAE方法的系统重构时空数据分别如图3-图5所示。

步骤S03：训练GRU网络，建立平流系统低维表示的时间序列模型G。

在本实施例中，初始化GRU网络，划分训练集N₁＝2500和测试集N₂＝1500，设置GRU层神经元数量v＝100，全连接层结构为100-80-2，滑窗宽度l＝5。根据式(10)-(14)使用BP算法对网络进行训练，选择Adam作为优化器，对GRU网络进行训练，得到系统的未来预测值

系统低维表示和基于GRU网络的预测输出如图6所示。

步骤S04：将平流系统最近的时空数据经标准化后送入CAE编码器获得系统的低维表示，利用低维时间序列模型预测下一时刻低维表示的输出值，再由CAE解码器进行解码，重构未来输出的预测值，进行反标准化得到平流系统原始传感器时刻数据的预测值。

在本实施例中，依次将系统最近的5个时刻的时空数据Y_s|_t-4…Y_s|_t送入CAE编码器T⁺获得平流系统的低维表示y_t-4…y_t，利用低维时间序列模型(16)预测下一时刻低维表示的输出值

再由CAE解码器T^-进行解码，根据式(17)重构未来输出的预测值

对其进行反标准化得到平流系统原始的

基于CAE和GRU网络的系统时空数据预测值如图7所示。

将本发明所提CAE网络模型约简方法同PCA和SAE模型约简方法对比，降阶后的维数均选择2维，比较网络性能如表1所示。本实验环境应用Intel酷睿i56300HQ 2.8GHz处理器，12GB内存空间，Nvidia GTX 960M 2GB显卡，Windows 10操作系统以及Pytorch 1.6深度学习平台。

表1网络性能比较

采用方法	模型阶数	循环次数	训练时间	RMSE
					PCA	2	1	1.0325s	0.2542
SAE	2	15000	36.5625s	0.0358
					CAE	2	3500	14.1821s	0.0031

从表1和图2中可以看出，PCA方法虽然计算简单用时少，但是在低阶模型上表现很差，损失较大，以致无法在实际问题中应用。从表1和图3中可以看出，SAE网络相比本发明所提方法达到稳定的循环次数多，训练时间长，精度低。SAE网络RMSE达到0.0358，误差最大值0.13，达到原始值的13％。

从表1和图4中可以看出，本发明所提方法RMSE仅为0.0031，误差最大值0.03，仅为原始值的3％。从仿真结果可以看出，本发明所提的CAE网络可以很好地对双曲型系统进行模型降阶，模型精度高，实现简单。

本发明还给出了一种基于GRU网络的低维表示建模方法。从图6中可以看出，GRU网络对低维时间序列的预测值与真实值接近，训练集和测试集RMSE分别为0.0078和0.0204，在训练集和测试集上都能很好地体现低维时间序列的动态变化规律。从图7可以看出通过CAE网络模型降阶和GRU网络时间序列预测后系统重建时空数据可以很好地复现原始数据，证明了本发明所提方法具有良好的建模效果。

本发明采用CAE网络实现双曲型系统的模型约简，相比于传统SAE，使用一维卷积方式对输入信号进行线性变换，其权重是共享的，能够更好地挖掘系统的抽象特征，再通过逐层深度学习的方式，可以更好地提取到高维系统的本质特征，降低了系统维数，同时利用GRU网络获得低维时间序列精确模型，有效地提高了双曲型系统预测模型的重构精度，弥补了现有技术无法获得双曲型系统精确低维模型的问题。

Claims

1.一种基于CAE网络的双曲型系统模型约简方法，其特征在于所述方法包括如下步骤：

步骤1：采集足够获得双曲型系统全部动态特性的传感器时空数据，并对采集的时空数据进行预处理；

步骤2：对高维时空数据进行模型约简，训练CAE网络，获得编码器网络T⁺和解码器网络T^-，并由此计算双曲型系统的低维表示；

步骤3：训练GRU网络，建立双曲型系统低维表示的低维时间序列模型；

步骤4：将双曲型系统最近的时空数据经标准化后送入CAE编码器获得双曲型系统的低维表示，利用低维时间序列模型预测下一时刻低维表示的输出值，再由CAE解码器进行解码，重构未来输出的预测值，进行反标准化得到双曲型系统原始传感器时空数据的预测值。

2.根据权利要求1所述的基于CAE网络的双曲型系统模型约简方法，其特征在于所述步骤1的具体步骤如下：

(1)由如下一阶双曲型PDE描述双曲型系统动态特性：

初始条件和边界条件满足：

Y_s(x,0)＝y₀(x)；

Y_s(a,t)＝L(t)；

(3)将采集的时空数据

进行预处理，得到标准化至[0,1]区间的时空数据

其中，

和

分别表示向量

中各元素的最小值和最大值。

3.根据权利要求1所述的基于CAE网络的双曲型系统模型约简方法，其特征在于所述步骤2的具体步骤如下：

(1)进行CAE网络初始化，设定层数p，每一层的卷积核个数m_p-1；

(2)使用BP算法对CAE网络进行训练，选择Adam作为优化器，采用RMSE作为评价指标，更新CAE网络权值直至网络收敛，获得编码器网络T⁺和解码器网络T^-，由此计算出双曲型系统的低维表示y＝T⁺(Y)，其中，T⁺表示编码器网络，y∈R^m×N表示系统低维表示。

4.根据权利要求3所述的基于CAE网络的双曲型系统模型约简方法，其特征在于所述CAE网络包含编码器、解码器两部分，均采用堆叠卷积层M-m₁-…-m_p-2-m的形式，每层所有卷积核的宽度均设置为1，卷积核长度由该层输入数据的维度决定，卷积层输出数据的维度等于卷积核个数，编码器通过逐层减少卷积核个数，最终实现数据的降维；解码器网络结构m-m_p-2-…-m₁-M与编码器网络结构完全对称，卷积核个数与之相反达到扩张维度的目的，便于下一步计算重构损失。

5.根据权利要求3所述的基于CAE网络的双曲型系统模型约简方法，其特征在于所述