CN108647643B - 一种基于深度学习的填料塔液泛状态在线辨识方法 - Google Patents
一种基于深度学习的填料塔液泛状态在线辨识方法 Download PDFInfo
- Publication number
- CN108647643B CN108647643B CN201810445800.2A CN201810445800A CN108647643B CN 108647643 B CN108647643 B CN 108647643B CN 201810445800 A CN201810445800 A CN 201810445800A CN 108647643 B CN108647643 B CN 108647643B
- Authority
- CN
- China
- Prior art keywords
- moment
- data
- samples
- output
- packed tower
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000012360 testing method Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims abstract description 23
- 238000012795 verification Methods 0.000 claims abstract description 19
- 230000003044 adaptive effect Effects 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 33
- 239000011159 matrix material Substances 0.000 claims description 33
- 230000004913 activation Effects 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 230000007787 long-term memory Effects 0.000 claims description 7
- 230000006403 short-term memory Effects 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 210000004027 cell Anatomy 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000013100 final test Methods 0.000 claims description 3
- 230000009191 jumping Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000003068 static effect Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 abstract description 5
- 230000000007 visual effect Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000007788 liquid Substances 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000005514 two-phase flow Effects 0.000 description 1
- 238000010977 unit operation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
- G06V20/47—Detecting features for summarising video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Image Analysis (AREA)
Abstract
一种基于深度学习的填料塔液泛状态在线辨识方法,首先运行填料塔设备,获取其运行过程中的视频数据和标签数据;然后对数据进行预处理,包括视频截取和图像的时序化处理,并利用处理后的数据和标签数据制作数据集,将数据集分为训练集、验证集和测试集三部分;随后建立卷积长短期记忆神经网络模型并利用自适应矩估计训练模型;最后利用测试集评估训练后的网络模型是否满足辨识要求。本发明相较于传统方法更加准确且直观,利用深度学习技术对填料塔运行过程中的视频数据进行处理和分析,最终实现对其运行状态的在线辨识。
Description
技术领域
本发明涉及一种基于视频分析的填料塔运行状态辨识方法,本发明属于填料塔液泛状态辨识领域,涉及填料塔视频数据的处理和分析方法。
背景技术
填料塔作为一种重要的分离设备,由于其大通量、低压降、高效率等特点,在化工、环保、食品及医药等各个领域有着广泛的应用,它是决定生产效益和产品质量的关键。填料塔投资一般占总投资额的20%,而其能耗则占所有单元操作的50%。填料处于正常运行状态时,其效率随着操作气速的增加而增大,能耗与碳排放也随之减少;而处于液泛状态时,其效率会迅速下降,产品会不合格,严重时要停车检修,给企业带来经济损失,要极力避免液泛的发生。因此,有效辨识填料塔的液泛状态,保障设备运行于安全、高效的操作条件是填料塔优化节能的关键。
液泛是一种复杂的气液逆流现象,其影响因素众多,想要单纯从理论上推导其变化规律是十分困难的。为了实现对液泛状态的辨识,中外学者们做了大量的研究,主要分为三类:视觉观测、持液量测量、塔内关键变量监测。视觉观测方法仅对透明塔体有效,且存在延迟现象,当观测到液泛时,损坏可能已经发生,且通过人肉眼观测存在不确定的主观因素;持液量测量方法需要停止气液两相流动,排尽塔底液体进行测量,不适用于实际工业生产中的在线监测;塔内关键变量监测方法是一种间接方法,不能直接反映液泛的发生,存在一定误差和滞后。因此,需要一种准确且直观的填料塔运行状态在线辨识方法。
发明内容
为了克服已有方法的不足和缺陷,本发明提出一种基于深度学习的填料塔液泛状态在线辨识方法,该方法相较于传统方法更加准确且直观,利用深度学习技术对填料塔运行过程中的视频数据进行处理和分析,最终实现对其运行状态的在线辨识。
本发明解决其技术问题所采用的技术方案是:
一种基于深度学习的填料塔液泛状态在线辨识方法,包括以下步骤:
1)获取视频数据和标签数据:运行填料塔设备,调用摄像头采集其运行过程中的视频数据,同时通过人工观测的方式获得标签数据,并根据时间将视频数据和标签数据进行匹配;
2)数据预处理并制作数据集:视频数据和标签数据不能直接用于建立网络模型,需要对这些数据进行预处理,包括:视频截取和时序化处理。利用处理后的数据制作数据集,并将其分为训练集、验证集和测试集三部分;
3)建立卷积长短期记忆神经网络并训练:首先利用卷积长短期记忆单元搭建卷积长短期记忆层提取视频数据中的时间和空间特征;然后在卷积长短期记忆层后搭建分类器层,利用提取到的特征信息对填料塔下一时刻处于液泛状态或非液泛状态进行判断;最后利用自适应矩估计算法在训练集上优化网络模型参数;
4)评估网络模型辨识性能:采用准确率、精确率、召回率和调和均值评价指标在测试集上对网络模型的辨识性能进行评估,是否满足要求。
进一步,所述步骤2)中,数据预处理并制作数据集的过程如下:
2.1:对视频数据进行截取
视频数据由静态图像数据按照时间顺序堆叠而成,每一帧的图像都代表了不同时刻填料塔的工作状态,按照一秒一帧的方式截取视频数据,每一帧图像表示填料塔不同时刻的工作状态;
2.2:对截取的图像数据进行时序化处理
将截取到的连续几张图像按照时间顺序排列组成一个输入样本,总的输入样本表示如下:
χ=[x1,x2,…,xi,…,xN]T
其中,N为样本总数;xi是第i个输入样本,可表示为一个四维张量,第一维表示单个样本包含的图像帧数;第二维表示单张图像在宽度上分布的像素点;第三维表示单张图像在高度上分布的像素点;第四维表示图像的通道数,彩色图像通道数为3,灰度图像通道数为1;
2.3:制作数据集,并将其分为训练集、验证集和测试集三部分
数据集包括输入样本和输出样本,输出样本中的标签表示对应的输入样本的下一时刻填料塔是否处于液泛状态,其中处于液泛状态为1,否则为0,输出样本表示如下:
Y=[y1,y2,…,yi,…,yN]T
其中,yi∈{0,1},是第i个输出样本;
将数据集分为训练集、验证集和测试集,训练集用于模型的训练,其样本数为总样本数的60%;验证集用于对模型的超参数进行选择,选择在验证集上表现最好的模型作为最终的测试模型,其样本数为总样本数的10%;测试集用于对最终的模型进行评估,其样本数为总样本数的30%。
再进一步,所述步骤3)中,建立卷积长短期记忆神经网络并训练的过程如下:
3.1:建立卷积长短期记忆神经网络
采用卷积长短期记忆单元建立卷积长短期记忆层以提取视频数据中的时间和空间特征,其计算流程如下:
其中,表示第i个输入样本中t时刻对应的输入图像数据;表示当前时刻输入数据与遗忘门之间的权值矩阵;表示上一时刻网络中隐藏层的输出;表示上一时刻网络隐藏层输出与遗忘门之间的权值矩阵;表示遗忘门的偏置;*表示卷积运算;σ是sigmoid激活函数;是遗忘门的输出,表示“遗忘”上一时刻信息的比例;
其中,表示新状态的候选值用于当前状态更新的比例;wal表示当前时刻输入数据与输入门之间的权值矩阵;whl表示上一时刻网络隐藏层输出与输入门之间的权值矩阵;bl表示输入门的偏置;σ是sigmoid激活函数;
建立分类器层,利用提取到的特征对输入样本进行分类,由于输出样本中的标签只有两类,分类器层中只有一个神经元,其激活函数为sigmoid函数;
3.2:确定网络模型的目标函数
训练集的目标函数表示如下:
其中,θ表示模型参数,包括模型中的权值和偏置;Ntrain表示训练集的样本数;hθ(xi)为模型的预测值;
3.3:利用自适应矩估计算法训练模型
自适应矩估计算法在参数更新过程中通过对梯度的一阶矩估计和二阶矩估计,自适应的为每一个参数设置不同的学习率进行更新;在概率论中,如果一个随机变量X服从某个分布,X的一阶矩定义为E(X),也就是样本均值;X的二阶矩定义为E(X2),也就是样本平方的均值;
利用自适应矩估计算法优化模型参数,首先定义α表示初始学习率,它控制参数的更新比率,定义较大的值在更新过程中会有更快的更新速度,网络会更快的收敛,而定义较小的值时参数的更新速度会相应变慢,但网络会收敛到更好的性能;定义β1表示一阶矩估计指数衰减率;定义β2表示二阶矩估计指数衰减率;定义m表示梯度的一阶矩;定义n表示梯度的二阶矩;定义t表示时间步。
更进一步,所述步骤3.3中,自适应矩估计算法的优化流程如下:
3.3.1)初始化相关参数:在0时刻,令α=0.001,β1=0.9,β2=0.999,m=0,n=0,不断优化θ,直到目标函数f(θ)满足求解要求;
3.3.2)更新一阶矩和二阶矩:在任意时刻,只要目标函数f(θ)不满足求解要求,就会在下一时刻更新一阶矩和二阶矩,过程如下:
mt=β1·mt-1+(1-β1)·gt
上面两个式子分别对一阶矩和二阶矩进行更新;
3.3.3)更新网络参数,过程如下所示:
其中,θt是t时刻更新后的权值矩阵;θt-1是t-1时刻待更新的权值矩阵;同时为了避免分母为零,令参数ε=10-8;
若θt满足求解要求,则停止优化并输出结果,否则跳回2)继续优化。
本发明中,填料塔视频数据具有丰富的时间和空间信息,每一帧图像都能准确反映填料塔的运行状态。深度学习是机器学习研究中的一个新的领域,其核心是原始数据的特征都不是利用人工来设计的,而是使用一种通用的学习过程从数据中直接学到。本文利用深度学习技术对填料塔运行过程中的视频数据进行处理和分析以实现对其运行状态的在线辨识。
本发明的有益效果主要表现在:采用卷积长短期记忆神经网络模型提取填料塔运行过程中视频数据的时间和空间特征,并利用提取到的特征信息对下一时刻填料塔处于液泛状态或非液泛状态进行判断,并给出下一时刻处于液泛状态的概率,其结果可以应用到填料塔运行状态的在线辨识中。
附图说明
图1是卷积长短期记忆神经网络模型结构图;
图2是模型的辨识结果。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于深度学习的填料塔液泛状态在线辨识方法,包括以下步骤:
1)获取视频数据和标签数据
运行填料塔设备,调用摄像头采集其运行过程中的视频数据,同时通过人工观测的方式获得标签数据,并根据时间将视频数据和标签数据进行匹配,其中处于液泛状态的图像标签为1,否则为0。
2)数据预处理并制作数据集,过程如下:
2.1:对视频数据进行截取
视频数据由静态图像数据按照时间顺序堆叠而成,每一帧的图像都代表了不同时刻填料塔的工作状态,按照一秒一帧的方式截取视频数据,每一帧图像可以表示填料塔不同时刻的工作状态。
2.2:对截取的图像数据进行时序化处理
将截取到的连续几张图像按照时间顺序排列组成一个输入样本,总的输入样本可表示如下:
χ=[x1,x2,…,xi,…,xN]T
其中,N为样本总数;xi是第i个输入样本,可表示为一个四维张量,第一维表示单个样本包含的图像帧数;第二维表示单张图像在宽度上分布的像素点;第三维表示单张图像在高度上分布的像素点;第四维表示图像的通道数,彩色图像通道数为3,灰度图像通道数为1。
2.3:制作数据集,并将其分为训练集、验证集和测试集三部分
数据集包括输入样本和输出样本,输出样本中的标签表示对应的输入样本的下一时刻填料塔是否处于液泛状态,其中处于液泛状态为1,否则为0,输出样本可表示如下:
Y=[y1,y2,…,yi,…,yN]T
其中,yi∈{0,1},是第i个输出样本。
将数据集分为训练集、验证集和测试集。训练集用于模型的训练,其样本数一般为总样本数的60%;验证集用于对模型的超参数进行选择,选择在验证集上表现最好的模型作为最终的测试模型,其样本数一般为总样本数的10%;测试集用于对最终的模型进行评估,其样本数一般为总样本数的30%。
3)建立卷积长短期记忆神经网络并训练,过程如下:
3.1:建立卷积长短期记忆神经网络
视频数据由静态图像数据按照时间顺序堆叠而成,是图像数据的时序表示。卷积神经网络(CNN)主要用于图像数据建模,长短期记忆神经网络(LSTM NN)主要用于时间序列数据建模。本发明将CNN和LSTM NN结合提出一种卷积长短期记忆单元(ConvLSTM)用于建立卷积长短期记忆层以提取视频数据中的时间和空间特征,其计算流程如下:
其中,表示第i个输入样本中t时刻对应的输入图像数据;表示当前时刻输入数据与遗忘门之间的权值矩阵;表示上一时刻网络中隐藏层的输出;表示上一时刻网络隐藏层输出与遗忘门之间的权值矩阵;表示遗忘门的偏置;*表示卷积运算;σ是sigmoid激活函数;是遗忘门的输出,表示“遗忘”上一时刻信息的比例;
其中,表示新状态的候选值用于当前状态更新的比例;wal表示当前时刻输入数据与输入门之间的权值矩阵;whl表示上一时刻网络隐藏层输出与输入门之间的权值矩阵;bl表示输入门的偏置;σ是sigmoid激活函数。
建立分类器层,利用提取到的特征对输入样本进行分类。由于输出样本中的标签只有两类,分类器层中只有一个神经元,其激活函数为sigmoid函数。
3.2:确定网络模型的目标函数
目标函数用来衡量网络模型的预测值和真实值之间的误差。由于是二分类问题,采用交叉熵损失函数作为模型的目标函数。训练集的目标函数可表示如下:
其中,θ表示模型参数,包括模型中的权值和偏置;Ntrain表示训练集的样本数;hθ(xi)为模型的预测值。
3.3:利用自适应矩估计算法训练模型
自适应矩估计算法在参数更新过程中通过对梯度的一阶矩估计和二阶矩估计,自适应的为每一个参数设置不同的学习率进行更新。在概率论中,如果一个随机变量X服从某个分布,X的一阶矩定义为E(X),也就是样本均值;X的二阶矩定义为E(X2),也就是样本平方的均值。
利用自适应矩估计算法优化模型参数,首先定义α表示初始学习率,它控制参数的更新比率,定义较大的值在更新过程中会有更快的更新速度,网络会更快的收敛,而定义较小的值时参数的更新速度会相应变慢,但网络会收敛到更好的性能;定义β1表示一阶矩估计指数衰减率;定义β2表示二阶矩估计指数衰减率;定义m表示梯度的一阶矩;定义n表示梯度的二阶矩;定义t表示时间步。自适应矩估计算法的优化流程可归纳如下:
3.3.1)初始化相关参数。在0时刻,令α=0.001,β1=0.9,β2=0.999,m=0,n=0。不断优化θ,直到目标函数f(θ)满足求解要求。
3.3.2)更新一阶矩和二阶矩。在任意时刻,只要目标函数f(θ)不满足求解要求,就会在下一时刻更新一阶矩和二阶矩,具体过程如下:
mt=β1·mt-1+(1-β1)·gt
上面两个式子分别对一阶矩和二阶矩进行更新。
3.3.3)更新网络参数。具体过程如下所示:
其中,θt是t时刻更新后的权值矩阵;θt-1是t-1时刻待更新的权值矩阵;同时为了避免分母为零,令参数ε=10-8。
若θt满足求解要求,则停止优化并输出结果,否则跳回2)继续优化。
4)评估网络模型辨识性能
网络模型经过训练后不能直接用于液泛状态辨识,应对其进行评估,满足要求后才能使用。采用准确率、精确率、召回率和调和均值等评价指标在测试集上对网络模型的辨识性能进行评估。
准确率的定义为:对于给定的测试数据,正确分类的样本数与总样本数的比值。计算公式如下所示:
其中,Ntest是测试集的样本数;I是指示函数,当yi=hθ(xi)时为1,否则为0。
在分类任务中,通常以关注的类为正类,其他类为负类。在填料塔的液泛状态辨识问题中,以液泛状态作为正类,非液泛状态作为负类。模型预测结果在测试集上预测正确或不正确,会出现以下四种情况:
1.TP:将正类预测为正类;
2.FN:将正类预测为负类;
3.FP:将负类预测为正类;
4.TN:将负类预测为负类。
精确率(Precision,P)定义为测试集中模型将正类预测为正类的样本数与模型预测正类的样本数的比值,如下所示:
召回率(Recall,R)定义为测试集中模型将正类预测为正类的样本数与测试集中正类样本数的比值,如下所示:
在同一个分类任务中,准确率和召回率往往不能两全其美,常常用二者的调和均值综合评价一个分类器的性能,如下所示:
实例:一种基于深度学习的填料塔液泛状态在线辨识方法,包括以下步骤:
1)进行实验并选获取实验数据
运行填料塔实验设备,调用摄像头采集其运行过程中的视频数据,共采集到四十一分五十八秒的视频数据。同时通过人工观测的方式获得标签数据。
2)数据预处理并制作数据集
首先按照一秒的时间间隔截取视频数据,共得到2447张图像;然后将图像按照时间顺序排列,并将五帧连续的图像组合为一个输入样本,单个输入样本可表示为一个四维张量(5×128×128×3);接着与人工观测得到的标签数据进行匹配,构造输出样本;经过预处理共得到2442组样本,最后将得到的样本分为训练集、验证集和测试集,其中训练集样本为1648个,验证集样本为183个,测试集样本为611个。
3)建立卷积长短期记忆神经网络模型,并利用自适应矩估计算法训练模型。
卷积长短期记忆神经网络模型如图1所示。利用卷积长短期记忆单元搭建两个卷积长短期记忆层,其中第一层和第二层中分别有20和30个卷积长短期记忆单元。卷积核尺寸为3×3。在卷积长短期记忆层后搭建分类器层,利用提取到的特征对输入样本进行分类。由于输出样本中的标签只有两类,分类器层中只有一个神经元,其激活函数为sigmoid函数。网络模型搭建好之后,利用自适应矩估计算法在训练集上训练模型,同时在验证集上进行验证,保存在验证集上表现最好的模型及其参数。
4)评估模型辨识性能
利用训练后的模型对测试集中的样本进行辨识,结果如图2所示。在测试集中,第1个样本至第400个样本的标签为0,从第401个样本开始标签为1。第396和398个样本的真实标签为0,但模型将其预测为1,在其他样本上都能正确预测。
采用准确率、精确率、召回率和调和均值等评价指标在测试集上对模型的辨识性能进行评估,结果如表1所示。
表1。
Claims (2)
1.一种基于深度学习的填料塔液泛状态在线辨识方法,其特征在于,所述方法包括以下步骤:
1)获取视频数据和标签数据:运行填料塔设备,调用摄像头采集其运行过程中的视频数据,同时通过人工观测的方式获得标签数据,并根据时间将视频数据和标签数据进行匹配;
2)数据预处理并制作数据集:视频数据和标签数据不能直接用于建立网络模型,需要对这些数据进行预处理,包括:视频截取和时序化处理;利用处理后的数据制作数据集,并将其分为训练集、验证集和测试集三部分;
3)建立卷积长短期记忆神经网络并训练:首先利用卷积长短期记忆单元搭建卷积长短期记忆层提取视频数据中的时间和空间特征;然后在卷积长短期记忆层后搭建分类器层,利用提取到的特征信息对填料塔下一时刻处于液泛状态或非液泛状态进行判断;最后利用自适应矩估计算法在训练集上优化网络模型参数;
4)评估网络模型辨识性能:采用准确率、精确率、召回率和调和均值评价指标在测试集上对网络模型的辨识性能进行评估,是否满足要求;
所述步骤3)中,建立卷积长短期记忆神经网络并训练的过程如下:
3.1:建立卷积长短期记忆神经网络
采用卷积长短期记忆单元建立卷积长短期记忆层以提取视频数据中的时间和空间特征,其计算流程如下:
其中,表示第i个输入样本中t时刻对应的输入图像数据;表示当前时刻输入数据与遗忘门之间的权值矩阵;表示上一时刻网络中隐藏层的输出;表示上一时刻网络隐藏层输出与遗忘门之间的权值矩阵;表示遗忘门的偏置;*表示卷积运算;σ是sigmoid激活函数;是遗忘门的输出,表示“遗忘”上一时刻信息的比例;
其中,表示新状态的候选值用于当前状态更新的比例;wal表示当前时刻输入数据与输入门之间的权值矩阵;whl表示上一时刻网络隐藏层输出与输入门之间的权值矩阵;bl表示输入门的偏置;σ是sigmoid激活函数;
建立分类器层,利用提取到的特征对输入样本进行分类,由于输出样本中的标签只有两类,分类器层中只有一个神经元,其激活函数为sigmoid函数;
3.2:确定网络模型的目标函数
训练集的目标函数表示如下:
其中,θ表示模型参数,包括模型中的权值和偏置;Ntrain表示训练集的样本数;hθ(xi)为模型的预测值;
3.3:利用自适应矩估计算法训练模型
自适应矩估计算法在参数更新过程中通过对梯度的一阶矩估计和二阶矩估计,自适应的为每一个参数设置不同的学习率进行更新;在概率论中,如果一个随机变量X服从某个分布,X的一阶矩定义为E(X),也就是样本均值;X的二阶矩定义为E(X2),也就是样本平方的均值;
利用自适应矩估计算法优化模型参数,首先定义α表示初始学习率,它控制参数的更新比率,定义较大的值在更新过程中会有更快的更新速度,网络会更快的收敛,而定义较小的值时参数的更新速度会相应变慢,但网络会收敛到更好的性能;定义β1表示一阶矩估计指数衰减率;定义β2表示二阶矩估计指数衰减率;定义m表示梯度的一阶矩;定义n表示梯度的二阶矩;定义t表示时间步;
所述步骤3.3中,自适应矩估计算法的优化流程如下:
3.3.1)初始化相关参数:在0时刻,令α=0.001,β1=0.9,β2=0.999,m=0,n=0,不断优化θ,直到目标函数f(θ)满足求解要求;
3.3.2)更新一阶矩和二阶矩:在任意时刻,只要目标函数f(θ)不满足求解要求,就会在下一时刻更新一阶矩和二阶矩,过程如下:
mt=β1·mt-1+(1-β1)·gt
上面两个式子分别对一阶矩和二阶矩进行更新;
3.3.3)更新网络参数,过程如下所示:
其中,θt是t时刻更新后的权值矩阵;θt-1是t-1时刻待更新的权值矩阵;同时为了避免分母为零,令参数ε=10-8;
若θt满足求解要求,则停止优化并输出结果,否则跳回2)继续优化。
2.如权利要求1所述的一种基于深度学习的填料塔液泛状态在线辨识方法,其特征在于,所述步骤2)中,数据预处理并制作数据集的过程如下:
2.1:对视频数据进行截取
视频数据由静态图像数据按照时间顺序堆叠而成,每一帧的图像都代表了不同时刻填料塔的工作状态,按照一秒一帧的方式截取视频数据,每一帧图像表示填料塔不同时刻的工作状态;
2.2:对截取的图像数据进行时序化处理
将截取到的连续几张图像按照时间顺序排列组成一个输入样本,总的输入样本表示如下:
χ=[x1,x2,…,xi,…,xN]T
其中,N为样本总数;xi是第i个输入样本,可表示为一个四维张量,第一维表示单个样本包含的图像帧数;第二维表示单张图像在宽度上分布的像素点;第三维表示单张图像在高度上分布的像素点;第四维表示图像的通道数,彩色图像通道数为3,灰度图像通道数为1;
2.3:制作数据集,并将其分为训练集、验证集和测试集三部分
数据集包括输入样本和输出样本,输出样本中的标签表示对应的输入样本的下一时刻填料塔是否处于液泛状态,其中处于液泛状态为1,否则为0,输出样本表示如下:
Y=[y1,y2,…,yi,…,yN]T
其中,yi∈{0,1},是第i个输出样本;
将数据集分为训练集、验证集和测试集,训练集用于模型的训练,其样本数为总样本数的60%;验证集用于对模型的超参数进行选择,选择在验证集上表现最好的模型作为最终的测试模型,其样本数为总样本数的10%;测试集用于对最终的模型进行评估,其样本数为总样本数的30%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810445800.2A CN108647643B (zh) | 2018-05-11 | 2018-05-11 | 一种基于深度学习的填料塔液泛状态在线辨识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810445800.2A CN108647643B (zh) | 2018-05-11 | 2018-05-11 | 一种基于深度学习的填料塔液泛状态在线辨识方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647643A CN108647643A (zh) | 2018-10-12 |
CN108647643B true CN108647643B (zh) | 2021-08-03 |
Family
ID=63754326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810445800.2A Active CN108647643B (zh) | 2018-05-11 | 2018-05-11 | 一种基于深度学习的填料塔液泛状态在线辨识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647643B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109725531B (zh) * | 2018-12-13 | 2021-09-21 | 中南大学 | 一种基于门控制机制的连续学习方法 |
CN110675361B (zh) * | 2019-08-16 | 2022-03-25 | 北京百度网讯科技有限公司 | 建立视频检测模型以及视频检测的方法、装置 |
JP6792749B1 (ja) * | 2019-09-13 | 2020-12-02 | 国立研究開発法人産業技術総合研究所 | 気液混相流の流動様式評価装置、流動様式評価方法、及びガス生産システム |
CN110767239A (zh) * | 2019-09-20 | 2020-02-07 | 平安科技(深圳)有限公司 | 一种基于深度学习的声纹识别方法、装置及设备 |
CN112070685B (zh) * | 2020-08-10 | 2023-08-18 | 武汉大学 | Hifu治疗系统的动态软组织运动预测的方法 |
CN112613536B (zh) * | 2020-12-08 | 2024-07-05 | 燕山大学 | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 |
CN113723169B (zh) * | 2021-04-26 | 2024-04-30 | 中国科学院自动化研究所 | 基于SlowFast的行为识别方法、系统及设备 |
CN113569993A (zh) * | 2021-08-27 | 2021-10-29 | 浙江工业大学 | 一种聚合反应过程质量预测模型构建方法 |
CN113723686B (zh) * | 2021-08-31 | 2022-06-14 | 江南大学 | 有机硅单体分馏过程能耗的多任务灰箱预测方法及系统 |
CN115102674B (zh) * | 2022-06-17 | 2023-08-22 | 西安电子科技大学 | 基于Bi-LSTM网络的高速链路预测眼图方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001179001A (ja) * | 1999-12-22 | 2001-07-03 | Tokyo Gas Co Ltd | 異径充填カラム型蒸留塔 |
CN104359503A (zh) * | 2014-10-17 | 2015-02-18 | 浙江工业大学 | 基于压降标准偏差分析的填料塔液泛预测方法 |
CN106118715A (zh) * | 2016-07-05 | 2016-11-16 | 袁璞 | 石油分馏塔运行状况观测器 |
-
2018
- 2018-05-11 CN CN201810445800.2A patent/CN108647643B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001179001A (ja) * | 1999-12-22 | 2001-07-03 | Tokyo Gas Co Ltd | 異径充填カラム型蒸留塔 |
CN104359503A (zh) * | 2014-10-17 | 2015-02-18 | 浙江工业大学 | 基于压降标准偏差分析的填料塔液泛预测方法 |
CN106118715A (zh) * | 2016-07-05 | 2016-11-16 | 袁璞 | 石油分馏塔运行状况观测器 |
Non-Patent Citations (1)
Title |
---|
填料塔液泛预测的深度学习建模研究;范煜;《CNKI》;20180315;第14-21、30-32页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108647643A (zh) | 2018-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647643B (zh) | 一种基于深度学习的填料塔液泛状态在线辨识方法 | |
Cheng et al. | Fault detection and diagnosis for Air Handling Unit based on multiscale convolutional neural networks | |
CN108900546A (zh) | 基于lstm的时间序列网络异常检测的方法与装置 | |
CN110633750A (zh) | 一种基于lstm模型的电动阀门故障检测方法 | |
CN108197743A (zh) | 一种基于深度学习的预测模型软测量方法 | |
CN110757510B (zh) | 一种机器人剩余寿命预测方法及系统 | |
CN106815639A (zh) | 流数据的异常点检测方法及装置 | |
CN112560948B (zh) | 数据偏差下的眼底图分类方法及成像方法 | |
CN109298633A (zh) | 基于自适应分块非负矩阵分解的化工生产过程故障监测方法 | |
CN111340110A (zh) | 一种基于工业过程运行状态趋势分析的故障预警方法 | |
CN114974540A (zh) | 医疗设备寿命预测及分析方法、系统、介质、设备及终端 | |
CN112434390A (zh) | 基于多层网格搜索的pca-lstm轴承剩余寿命预测方法 | |
CN112149884A (zh) | 一种面向大规模学员的学业预警监测方法 | |
Xu et al. | Global attention mechanism based deep learning for remaining useful life prediction of aero-engine | |
CN112381213A (zh) | 一种基于双向长短期记忆网络的工业设备剩余寿命预测方法 | |
CN115115416A (zh) | 一种商品销量预测方法 | |
CN114298183B (zh) | 飞行动作智能识别方法 | |
CN117032165A (zh) | 一种工业设备故障诊断方法 | |
CN118397429A (zh) | 一种基于计算机视觉的查验货物智能分拣的集成系统及方法 | |
CN113551904B (zh) | 基于层次机器学习的齿轮箱多类型并发故障诊断方法 | |
CN111210085A (zh) | 一种基于多视图集成学习的煤矿瓦斯浓度预警方法 | |
Agarwal | Application of Deep Learning in Chemical Processes: Explainability, Monitoring and Observability | |
CN114496118A (zh) | 药敏结果识别方法、装置、电子设备及可读存储介质 | |
CN111258996B (zh) | 一种面向工业大数据的产品质量多源深度融合预报方法 | |
CN114298413A (zh) | 一种水电机组振摆趋势预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |