CN114326639A - 基于混合注意力卷积神经网络的工业过程性能评估方法 - Google Patents
基于混合注意力卷积神经网络的工业过程性能评估方法 Download PDFInfo
- Publication number
- CN114326639A CN114326639A CN202111682868.0A CN202111682868A CN114326639A CN 114326639 A CN114326639 A CN 114326639A CN 202111682868 A CN202111682868 A CN 202111682868A CN 114326639 A CN114326639 A CN 114326639A
- Authority
- CN
- China
- Prior art keywords
- model
- layer
- attention
- neural network
- xgboost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 26
- 238000011156 evaluation Methods 0.000 title claims abstract description 12
- 238000013527 convolutional neural network Methods 0.000 title claims description 15
- 238000003745 diagnosis Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 238000002372 labelling Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 230000007246 mechanism Effects 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000004971 IR microspectroscopy Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 3
- 239000006185 dispersion Substances 0.000 claims description 3
- 238000011049 filling Methods 0.000 claims description 3
- 238000012060 immune response imaging Methods 0.000 claims description 3
- 238000010030 laminating Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 210000004205 output neuron Anatomy 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 239000003921 oil Substances 0.000 description 6
- 239000000571 coke Substances 0.000 description 5
- 238000004939 coking Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000009776 industrial production Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000010724 circulating oil Substances 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Complex Calculations (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,包括如下步骤:步骤1、以一定频率采集工业过程中系统变量的运行数据,建立包含多变量,多类型故障的数据集,并对其进行数据预处理,在此基础上对故障类型进行编号打标签,设置对应的关系,之后对故障类型和标签划分相应的训练集和测试集;步骤2、构建注意力卷积神经网络故障诊断模型;步骤3:利用划分好的训练集训练注意力卷积网络模型;步骤4:将模型性能最好时所提取到的特征输入到XGBoost分类器中拟合提升树;步骤5:故障诊断:将测试集输入到ACNN‑XGBoost模型中,XGBoost分类器的输出可以反映模型最终的诊断结果。
Description
技术领域
本发明属于自动化过程控制领域,特别涉及到一种混合注意力卷积神经网络与XGBoost算法(ACNN-XGBoost)的工业过程故障诊断方法。
背景技术
工业生产涉及到我们生活的方方面面。随着工业的进步,工业设备集成度越来越高,其一旦发生故障,将严重影响工业生产过程并造成重大的经济损失。因此一个高效的工业过程故障诊断方法对工业生产具有十分重要的意义。
截止到目前,工业过程故障诊断方法总的来说可以概括为三大类:基于模型的方法、基于知识推理的方法和基于数据驱动的方法。基于模型的方法通过构建数学模型来探寻对象运行规律,适用于具备过程精确的定量数学模型。基于知识推理的方法不需要建立精确的系统模型,但对专家经验和系统原理知识有很高的依赖。基于数据驱动的方法在不需要了解系统的原理及物理模型的情况下,仅仅需要对测得的状态监测信号和历史信号数据进行分析就能提取特征,从而实现系统的故障诊断。近年来,随着信息和通信技术的飞速发展,大量的工业过程数据被高效的收集和处理,数据驱动的故障诊断方法凭借其实用性和高效性,在复杂的工业过程中越来越重要。
基于数据驱动的故障诊断方法又大致分为三类,即多元统计的方法、浅层学习方法以及深度学习方法。基于多元统计的故障诊断方法虽然在工业应用中经常会看到,但是面对现代工业产生的庞大数据量,这个方法的复杂度变得非常高,诊断效果并不尽人意。基于浅层学习的故障诊断方法,对人工特征降维和提取的依赖性较高,其诊断效果好坏取决于人工特征降维和提取的质量,然而在面对现代工业高纬度、高耦合的庞大数据,并不能有效提取数据特征,因此,浅层学习的故障诊断方法还有待完善。深度学习是由浅层学习发展而来,深度学习方法不同于浅层学习的分段学习手段,采取的是端到端的学习手段,其摆脱了传统方法提取特征繁琐的步骤,对提取原始数据中的特征具有非常大的优势,因此被广泛应用在自然语言识别、图像处理以及文本分析等领域。
深度学习相较于传统方法具有巨大的优势,其利用多隐层的网络结构直接对输入的数据样本进行有效分析并提取隐藏的数据特征信息,非常适用于大规模复杂的工业过程数据,是目前故障诊断领域研究的热点。但是不可否认的是,每种深度学习模型都有其自身的长处和短板,整体的诊断精度还有待进一步提高。目前基于深度学习的故障诊断方法在工业过程的应用主要存在以下问题:
当模型深度达到一定层数后,会发生模型退化问题;
特征提取存在冗余信息,导致最终的诊断精度不能达到更优;
常见的softmax分类器无法进一步提高诊断精度。
发明内容
为了解决现有技术存在的上述技术问题,本发明的目的是针对现有工业过程故障诊断方法中存在的问题,提出一种混合注意力卷积神经网络与XGBoost算法(ACNN-XGBoost)的工业过程故障诊断方法。其能够有效去除提取特征中的冗余数据,大幅提高工业过程的故障诊断精度。
本发明的具体实施步骤包括:
步骤1、数据处理;
以一定频率采集工业过程中系统变量的运行数据,建立一个包含多变量,多类型故障的数据集,并对其进行数据预处理,在此基础上对故障类型进行编号打标签,设置对应的关系,之后对故障类型和标签划分相应的训练集和测试集;
数据预处理是指对数据集进行离差标准化处理(Min-maxnormalization),该方法可以将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析,具体转换函数如下:
式中min(x)和max(x)分别表示数据样本中的最小值和最大值,xi表示样本数据。
故障样本打标签是指对数据集进行one-hot编码,又称为一位有效编码,其使用N位状态寄存器来对N个故障进行编码,每个故障都有各自独立的寄存器位,且在任意时刻,只有其中一位有效。
步骤2、构建注意力卷积神经网络故障诊断模型;
注意力卷积神经网络模型主要由三层普通卷积神经网络与两个注意力卷积模块以及FC层叠加构成,其中:
三层卷积神经网络中每层都与BN层叠加,卷积层对数据进行卷积运算,采用elu激活函数,padding采用same表示填充输入,使得输出与输入具有相同的长度,并使用L2正则化技术。其中卷积层的卷积运算如下式所示:
x[l]=f(W[l]*x[l-1]+b[l]) (2)
式中x[l]表示第l层的输出,l∈[1,2,…,n],W[l]表示第l层卷积核,“*”表示卷积运算,b[l]表示第l层对应的偏置,f(·)表示激活函数。
BN层对输入数据进行批归一化操作,使得输出数据的均值0,方差为1。相关操作如下:
两个注意力卷积模块与普通卷积神经网络的不同之处在于在每两次卷积之后添加了一个注意力机制模块。该模块能够通过通道注意力和空间注意力对之前卷积送来的有用特征进行强化,无用特征进行抑制,从而实现对上一步提取的特征进行增强的作用。注意力机制模块函数表示如下:
先设输入特征为F∈RC*H*W,CABM依次推断出一个一维通道权重系数:MC∈RC*1*1和一个二维的空间权重系数:Ms∈R1*H*W,整体的公式为:
elu激活函数与其它修正类激活函数不同的是,它是一个近似的零中心化的非线性函数,它包括一个负指数项为负值输入添加了一个非零输出,从而防止静默神经元出现,导数收敛为零,从而有效避免了relu激活函数的缺陷,提高学习效率,其计算公式为:
FC层通过权值矩阵将提取的深层特征进行融合,经Dropout层后,输入到softmax层,并将输出结果与真实标签的交叉熵作为损失函数。
dropout层以概率p随机丢弃网络中的神经元,加强模型的泛化能力,其具体操作为:
r(l)~Bernoulli(p)
式中Bernoulli(p)函数表示以概率p随机生成一个0或1的向量,wi,bi分别表示第i个神经元的权重和偏置,yl表示第l层的输入,f(·)表示激活函数之后将输出结果输入到Softmax分类层。
Softmax分类层将输入特征进行分类运算,其计算公式如下:
式中zi表示第i个输出神经元的输出;
步骤3:利用划分好的训练集训练注意力卷积网络模型;
将上述划分好的训练集输入到ACNN模型中进行训练,以故障类型标签作为所述模型的输出,将输出标签与真实标签的交叉熵作为损失函数,利用adam优化器进行反向传播,更新整个模型的参数,优化损失函数。
步骤4:将模型性能最好时所提取到的特征输入到XGBoost分类器中拟合提升树;
式中F={f(x)=wq(x)}(q:Rm→T,w∈RT)为提升树构成的函数空间;q表示将示例映射到相应叶索引的每棵树的结构;T树上叶子的数目;每个fk对应一棵独立树结构q以及权重w。
XGBoost的目标损失函数L主要由正则项Ω和损失函数l所组成,具体为
XGBoost算法使用二阶泰勒展开进行近似以便优化损失函数,如下
对wj求导计算最优权重
通过计算得到相应的最优目标函数值
通过贪心算法比较分裂增益来选择特征的切分点,设IL和IR是分割后左右节点的集合,则分裂增益值可以用下式表示:
公式(15)通常在实践中用于评估拆是否分裂以及具体的分裂节点。
步骤5:故障诊断。
将测试集输入到ACNN-XGBoost模型中,XGBoost分类器的输出可以反映模型最终的诊断结果。
与现有的工业过程故障诊断方法相比,本发明具有以下有益效果:
开发了一种新的混合XGBoost算法与ACNN的故障诊断方法。其中,ACNN中的注意力机制能有效减少特征提取中的冗余信息,对网络中有用的特征信息进行增强,无用的特征信息进行抑制,从而提高特征提取效率。
在最后的分类阶段,采用XGBoost分类算法对提取到的特征信息进行故障识别和分类,而不是传统的softmax分类器。实验结果表明,XGBoost的分类性能比传统的分类器要更加优异。
附图说明
图1所示为本发明所提出的ACNN-XGBoost故障诊断流程图;
图2所示为五种模型在正常状态,故障1,故障3,故障4和故障5上的F1-Score值;
图3所示为本发明所提出的ACNN-XGBoost模型诊断结果的混淆举证图。
具体实施方式
下面结合附图对本发明所提出方法的具体实施方式进行详细描述。
实施例
工业焦化炉F101/3是一种立管式加热炉,它通过对原料渣油和分馏塔底部的循环油迅速加热,为原有的进一步加工提供原料。工作时气体分别从南北两侧进入焦化炉,原料渣油分别从南北两侧送入焦化炉对流室预加热约330℃,然后一起送入分馏塔底,与焦化炉塔顶来的油气接触并传热传质;在此过程中混合油料中较轻的成份蒸发,上升至精馏段进行分离,而原料中蜡油以上馏分与来自焦炭塔顶油气中被冷凝的成份一起流入塔底。约360℃的分馏塔底油经加热炉辐射进料泵分两路送至加热炉辐射室迅速加热至495℃,之后进入焦炭塔进行裂解反应。
本次实例验证中在焦化炉中预先设计了几种常见的不同类型的故障,具体故障情况与标签对应关系如表1所示:
表1。
图1是本发明所提出的ACNN-XGBoost工业过程故障诊断方法的实施流程图,其具体包括以下步骤:
步骤1、采集工业焦化炉中8个主要的过程变量的运行数据,建立一个含有8个变量,5种类型故障的数据集,具体为两个含氧量测量点、两个辐射室内的温度测量点、炉内热效率测量点、PRC8112A回路中的操纵变量、PRC8112A以及PRC8112B的压力测量点。每种故障包括1850个样本,我们将所有样本标记之后进行随机混合打乱,然后从中随机抽取8000个样本作为训练集,其余1250个样本作为测试集合,即按照4:1对训练集和测试集进行划分。
数据预处理是指对数据集进行离差标准化处理(Min-maxnormalization),该方法可以对采集的原始信号数据集进行线性变化,使数据样本落在[0,1]区间,相关转换函数如下:
式中min(x)和max(x)分别表示数据样本中的最小值和最大值,xi表示样本数据;
故障样本打标签是指对数据集进行one-hot编码,又称为一位有效编码,其使用N位状态寄存器来对N个故障进行编码,每个故障都有各自独立的寄存器位,且在任意时刻,只有其中一位有效。
步骤2、构建注意力卷积神经网络故障诊断模型;
注意力卷积神经网络采用的模型主要由三层普通卷积神经网络与两层注意力卷积模块以及FC层叠加构成,其中:
三层卷积神经网络每层都与BN层叠加,卷积层对数据进行卷积运算,采用elu激活函数,padding采用same表示填充输入,使得输出与输入具有相同的长度,并使用L2正则化技术。其中卷积层的卷积运算如下式所示:
x[l]=f(W[l]*x[l-1]+b[l]) (2)
式中x[l]表示第l层的输出,l∈[1,2,…,n],W[l]表示第l层卷积核,“*”表示卷积运算,b[l]表示第l层对应的偏置,f(·)表示激活函数。
BN层对输入数据进行批归一化操作,使得输出数据的均值0,方差为1。相关操作如下:
两个注意力卷积模块与普通卷积神经网络的不同之处在于在每两次卷积之后添加了一个注意力机制模块。该模块能够通过通道注意力和空间注意力对之前卷积送来的有用特征进行强化,对无用特征进行抑制,从而实现增强提取特征的作用。注意力机制模块函数表示如下:
先设输入特征为F∈RC*H*W,CABM依次推断出一个一维通道权重系数:MC∈RC*1*1和一个二维的空间权重系数:Ms∈R1*H*W,整体的公式为:
elu激活函数与其它修正类激活函数不同的是,它是一个近似的零中心化的非线性函数,它包括一个负指数项为负值输入添加了一个非零输出,从而防止静默神经元出现,导数收敛为零,从而有效避免了relu激活函数的缺陷,提高学习效率,其计算公式为:
FC层通过权值矩阵将提取的深层特征进行融合,经Dropout层后,输入到softmax层,并将输出结果与真实标签的交叉熵作为损失函数。
dropout层以概率p随机丢弃网络中的神经元,加强模型的泛化能力,其具体操作为:
r(l)~Bernoulli(p)
式中Bernoulli(p)函数表示以概率p随机生成一个0或1的向量,wi,bi分别表示第i个神经元的权重和偏置,yl表示第l层的输入,f(·)表示激活函数之后将输出结果输入到Softmax分类层。
Softmax分类层将输入特征进行分类运算,其计算公式如下:
式中zi表示第i个输出神经元的输出;
步骤3:利用划分好的训练集训练注意力卷积网络模型;
将上述划分好的训练集输入到ACNN模型中进行训练,以故障类型标签作为所述模型的输出,将输出标签与真实标签的交叉熵作为损失函数,利用优化器进行反向传播,更新整个模型的参数,优化损失函数。
步骤4:将模型性能最好时所提取到的特征输入到XGBoost分类器中拟合提升树;
其中F={f(x)=wq(x)}(q:Rm→T,w∈RT)为提升树构成的函数空间;q表示将示例映射到相应叶索引的每棵树的结构;T树上叶子的数目;每个fk对应一棵独立树结构q以及权重w。
XGBoost的目标损失函数L主要由正则项Ω和损失函数l所组成,具体为
XGBoost算法使用二阶泰勒展开进行近似以便优化损失函数,如下
对wj求导计算最优权重
通过计算得到相应的最优目标函数值
通过贪心算法比较分裂增益来选择特征的切分点,设IL和IR是分割后左右节点的集合,则分裂增益值可以用下式表示:
公式(15)通常在实践中用于评估拆是否分裂以及具体的分裂节点。
步骤5:故障诊断。
将测试集输入到ACNN-XGBoost模型中,XGBoost分类器的输出可以反映模型最终的诊断结果。
为了更好的说明本发明的技术效果,本次实验分别采用CNN、ResCNN、LSTM以及CNN-LSTM作为对比模型,上述都是目前取得较好效果的网络模型,为了实验结果的可对比性,四种对比模型的参数设置基本与本发明相同。
本次实验中采用Keras库和python3.8实现本发明所提出的融合ACNN-XGBoost模型以及四个对比模型,模型训练时的迭代次数都设置为210,批次大小设置为64,损失函数选择交叉熵损失函数,初始学习率设置为0.001,并且每迭代90次学习率下降十分之一。在对XGBoost分类器的参数设置上,将学习率设置为0.2,树的个数设置为1000,深度设置为8,叶子节点最小权重设置为1。
表2是五种模型对每种故障类型具体的精确率(P)和召回率(R),以微平均精确率和召回率两个评价指标可以看出,本发明所提出模型的微平均精确率和召回率是五种模型最高的,绝大部分都达到99%以上,显示出本发明所提模型具有突出的诊断精度。具体到每种故障类型可以发现,除了故障2,ACNN-XGBoost对其他五种类型的微平均精率和召回率都得到较大程度的提升。为了更直观的看出各模型的效果,我们将除故障2以外各状态的F1-Score值以直方图的形式展现出来,如图2所示。可以看出,本文所提方法的效果是所有模型中最好的,各状态F1-Score值都接近100%,大幅领先对比模型。图3是五种模型的混淆矩阵,图中可以直观的看出,所提方法基本不存在错分。以上实验结果进一步验证了所提方法的有效性,与现有模型相比,其最终的诊断精度得到了大幅度的提高。
表2。
Claims (8)
1.一种混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,其特征在于包括如下步骤:
步骤1、数据处理:以一定频率采集工业过程中系统变量的运行数据,建立包含多变量,多类型故障的数据集,并对其进行数据预处理,在此基础上对故障类型进行编号打标签,设置对应的关系,之后对故障类型和标签划分相应的训练集和测试集;
步骤2、构建注意力卷积神经网络故障诊断模型;
步骤3:利用划分好的训练集训练注意力卷积网络模型;
步骤4:将模型性能最好时所提取到的特征输入到XGBoost分类器中拟合提升树;
步骤5:故障诊断:将测试集输入到ACNN-XGBoost模型中,XGBoost分类器的输出可以反映模型最终的诊断结果。
3.如权利要求2所述的混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,其特征在于:所述注意力卷积神经网络故障诊断模型由三层卷积神经网络、两个注意力卷积模块以及FC层叠加构成。
4.如权利要求3所述的混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,其特征在于:
所述三层卷积神经网络中每层都与BN层叠加,卷积层对数据进行卷积运算,采用elu激活函数,padding采用same表示填充输入,使得输出与输入具有相同的长度,并使用L2正则化技术;其中卷积层的卷积运算如下式所示:
x[l]=f(W[l]*x[l-1]+b[l]) (2)
式中x[l]表示第l层的输出,l∈[1,2,…,n],W[l]表示第l层卷积核,“*”表示卷积运算,b[l]表示第l层对应的偏置,f(·)表示激活函数;
BN层对输入数据进行批归一化操作,使得输出数据的均值0,方差为1。相关操作如下:
6.如权利要求5所述的混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,其特征在于:
所述elu激活函数,其计算公式为:
FC层通过权值矩阵将提取的深层特征进行融合,经Dropout层后,输入到softmax层,并将输出结果与真实标签的交叉熵作为损失函数;
Dropout层以概率p随机丢弃网络中的神经元,加强模型的泛化能力,其具体操作为:
式中Bernoulli(p)函数表示以概率p随机生成一个0或1的向量,wi,bi分别表示第i个神经元的权重和偏置,yl表示第l层的输入,f(·)表示激活函数之后将输出结果输入到Softmax分类层;
Softmax分类层将输入特征进行分类运算,其计算公式如下:
式中zi表示第i个输出神经元的输出。
7.如权利要求6所述的混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,其特征在于:步骤3具体为:
将上述划分好的训练集输入到ACNN模型中进行训练,以故障类型标签作为所述模型的输出,将输出标签与真实标签的交叉熵作为损失函数,利用adam优化器进行反向传播,更新整个模型的参数,优化损失函数。
8.如权利要求7所述的混合注意力卷积神经网络与XGBoost算法的工业过程性能评估方法,其特征在于:
式中F={f(x)=wq(x)}(q:Rm→T,w∈RT)为提升树构成的函数空间;q表示将示例映射到相应叶索引的每棵树的结构;T树上叶子的数目;每个fk对应一棵独立树结构q以及权重w;
XGBoost的目标损失函数L主要由正则项Ω和损失函数l所组成,具体为
XGBoost算法使用二阶泰勒展开进行近似以便优化损失函数,如下
对wj求导计算最优权重
通过计算得到相应的最优目标函数值
通过贪心算法比较分裂增益来选择特征的切分点,设IL和IR是分割后左右节点的集合,则分裂增益值可以用下式表示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682868.0A CN114326639B (zh) | 2021-12-30 | 2021-12-30 | 基于混合注意力卷积神经网络的工业过程性能评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111682868.0A CN114326639B (zh) | 2021-12-30 | 2021-12-30 | 基于混合注意力卷积神经网络的工业过程性能评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114326639A true CN114326639A (zh) | 2022-04-12 |
CN114326639B CN114326639B (zh) | 2024-06-25 |
Family
ID=81023235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111682868.0A Active CN114326639B (zh) | 2021-12-30 | 2021-12-30 | 基于混合注意力卷积神经网络的工业过程性能评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114326639B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115758897A (zh) * | 2022-11-24 | 2023-03-07 | 天津华翼蓝天科技股份有限公司 | 一种基于机器学习的模拟机故障诊断方法 |
CN116839900A (zh) * | 2023-07-06 | 2023-10-03 | 昌辉汽车转向系统(黄山)有限公司 | 基于因果注意的时序卷积网络的故障诊断方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446187A (zh) * | 2018-10-16 | 2019-03-08 | 浙江大学 | 基于注意力机制与神经网络的复杂装备健康状态监测方法 |
CN110675423A (zh) * | 2019-08-29 | 2020-01-10 | 电子科技大学 | 一种基于孪生神经网络和注意力模型的无人机跟踪方法 |
CN111881924A (zh) * | 2020-08-05 | 2020-11-03 | 广东工业大学 | 结合光照不变性与短曝光光照增强的暗光车照识别方法 |
CN112651998A (zh) * | 2021-01-18 | 2021-04-13 | 沈阳航空航天大学 | 基于注意力机制和双流多域卷积神经网络的人体跟踪算法 |
CN112949823A (zh) * | 2021-02-05 | 2021-06-11 | 杭州电子科技大学 | 基于一维多尺度深度卷积神经网络的工业过程性能诊断方法 |
CN113052218A (zh) * | 2021-03-15 | 2021-06-29 | 杭州电子科技大学 | 工业过程的多尺度残差卷积与lstm融合性能评估方法 |
CN113611323A (zh) * | 2021-05-07 | 2021-11-05 | 北京至芯开源科技有限责任公司 | 一种基于双通道卷积注意力网络的语音增强方法及系统 |
CN113705661A (zh) * | 2021-08-26 | 2021-11-26 | 杭州电子科技大学 | 一种混合深度残差收缩网络与XGBoost算法的工业过程性能评估方法 |
-
2021
- 2021-12-30 CN CN202111682868.0A patent/CN114326639B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109446187A (zh) * | 2018-10-16 | 2019-03-08 | 浙江大学 | 基于注意力机制与神经网络的复杂装备健康状态监测方法 |
CN110675423A (zh) * | 2019-08-29 | 2020-01-10 | 电子科技大学 | 一种基于孪生神经网络和注意力模型的无人机跟踪方法 |
CN111881924A (zh) * | 2020-08-05 | 2020-11-03 | 广东工业大学 | 结合光照不变性与短曝光光照增强的暗光车照识别方法 |
CN112651998A (zh) * | 2021-01-18 | 2021-04-13 | 沈阳航空航天大学 | 基于注意力机制和双流多域卷积神经网络的人体跟踪算法 |
CN112949823A (zh) * | 2021-02-05 | 2021-06-11 | 杭州电子科技大学 | 基于一维多尺度深度卷积神经网络的工业过程性能诊断方法 |
CN113052218A (zh) * | 2021-03-15 | 2021-06-29 | 杭州电子科技大学 | 工业过程的多尺度残差卷积与lstm融合性能评估方法 |
CN113611323A (zh) * | 2021-05-07 | 2021-11-05 | 北京至芯开源科技有限责任公司 | 一种基于双通道卷积注意力网络的语音增强方法及系统 |
CN113705661A (zh) * | 2021-08-26 | 2021-11-26 | 杭州电子科技大学 | 一种混合深度残差收缩网络与XGBoost算法的工业过程性能评估方法 |
Non-Patent Citations (2)
Title |
---|
张荣涛;陈志高;李彬彬;焦斌;: "基于深度卷积神经网络模型和XGBoost算法的齿轮箱故障诊断研究", 机械强度, no. 05 * |
马怀祥 等: "基于CNN和XGBoost的滚动轴承故障诊断方法", 中国工程机械学报, pages 254 - 259 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115758897A (zh) * | 2022-11-24 | 2023-03-07 | 天津华翼蓝天科技股份有限公司 | 一种基于机器学习的模拟机故障诊断方法 |
CN116839900A (zh) * | 2023-07-06 | 2023-10-03 | 昌辉汽车转向系统(黄山)有限公司 | 基于因果注意的时序卷积网络的故障诊断方法 |
CN116839900B (zh) * | 2023-07-06 | 2024-01-30 | 昌辉汽车转向系统(黄山)有限公司 | 基于因果注意的时序卷积网络的故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114326639B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101480B (zh) | 一种多变量聚类与融合的时间序列组合预测方法 | |
CN110033021B (zh) | 一种基于一维多路卷积神经网络的故障分类方法 | |
CN112966954B (zh) | 一种基于时间卷积网络的防洪调度方案优选方法 | |
CN113052218A (zh) | 工业过程的多尺度残差卷积与lstm融合性能评估方法 | |
CN111337768A (zh) | 变压器油中溶解气体的深度并行故障诊断方法及系统 | |
CN108875771B (zh) | 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 | |
CN114326639A (zh) | 基于混合注意力卷积神经网络的工业过程性能评估方法 | |
CN108803520B (zh) | 一种基于变量非线性自相关性剔除的动态过程监测方法 | |
CN111651931B (zh) | 基于深度神经网络的高炉故障诊断规则导出方法 | |
CN112949823A (zh) | 基于一维多尺度深度卷积神经网络的工业过程性能诊断方法 | |
Zhao et al. | Soft sensor modeling of chemical process based on self-organizing recurrent interval type-2 fuzzy neural network | |
CN108595803B (zh) | 基于递归神经网络的页岩气井生产压力预测方法 | |
CN112147432A (zh) | 基于注意力机制的BiLSTM模块、变压器状态诊断方法和系统 | |
CN114169091A (zh) | 工程机械部件剩余寿命的预测模型建立方法及预测方法 | |
CN114326638A (zh) | 一种多尺度卷积与深度双向gru网络融合性能评估方法 | |
CN110046377B (zh) | 一种基于异构相似度的选择性集成即时学习软测量建模方法 | |
CN115510975A (zh) | 基于并行Transofmer-GRU的多变量时序异常检测方法及系统 | |
CN111046961A (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN113705661A (zh) | 一种混合深度残差收缩网络与XGBoost算法的工业过程性能评估方法 | |
CN110245398B (zh) | 空气预热器转子热变形量的软测量深度学习方法 | |
CN114625883A (zh) | 一种面向工业设备异常监测的时序数据与知识融合表征方法 | |
CN117036760A (zh) | 一种基于图对比学习的多视图聚类模型实现方法 | |
CN117035013A (zh) | 一种采用脉冲神经网络预测动态网络链路的方法 | |
CN113159225B (zh) | 多变量工业过程故障分类方法 | |
CN108491878B (zh) | 一种基于多个误差生成模型的故障分类诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |