CN117590753A - 一种基于深度学习的无监督批量控制方法 - Google Patents
一种基于深度学习的无监督批量控制方法 Download PDFInfo
- Publication number
- CN117590753A CN117590753A CN202410068917.9A CN202410068917A CN117590753A CN 117590753 A CN117590753 A CN 117590753A CN 202410068917 A CN202410068917 A CN 202410068917A CN 117590753 A CN117590753 A CN 117590753A
- Authority
- CN
- China
- Prior art keywords
- data
- input
- statistics
- individuals
- unsupervised
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 230000002068 genetic effect Effects 0.000 claims abstract description 21
- 238000012544 monitoring process Methods 0.000 claims abstract description 19
- 238000004519 manufacturing process Methods 0.000 claims abstract description 13
- 238000001514 detection method Methods 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 23
- 238000003062 neural network model Methods 0.000 claims description 15
- 230000035772 mutation Effects 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 5
- 238000004821 distillation Methods 0.000 claims description 5
- 239000008235 industrial water Substances 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 claims description 3
- 238000004321 preservation Methods 0.000 claims 2
- 238000004364 calculation method Methods 0.000 claims 1
- 238000010606 normalization Methods 0.000 claims 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 abstract description 14
- 238000005265 energy consumption Methods 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000004886 process control Methods 0.000 abstract description 2
- 239000003814 drug Substances 0.000 abstract 1
- 239000003208 petroleum Substances 0.000 abstract 1
- 239000000126 substance Substances 0.000 abstract 1
- 230000008569 process Effects 0.000 description 10
- 239000008215 water for injection Substances 0.000 description 6
- 230000014759 maintenance of location Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000013480 data collection Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012824 chemical production Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000008238 pharmaceutical water Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Genetics & Genomics (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的无监督批量控制方法,该方法涉及机器学习、深度学习、无监督、过程控制等领域。首先,设计基于遗传算法的多路偏最小二乘自动编码器对数据进行特征提取并计算动态控制极限;其次,在每个时间间隔使用核密度估计来估计学习的潜在特征和残差的控制极限,进行故障监测,确保加工厂安全运行和最终产品高质量生产。与其他方法相比,本发明优势在于提升系统制水效率、降低能源消耗,提高设备运行的稳定性和鲁棒性,提高智能制造系统的可靠性,可广泛应用于化工、石油、制药、水处理等大型工业。
Description
技术领域
本发明涉及机器学习、深度学习、无监督、过程控制领域,具体为一种基于深度学习的无监督批量控制方法。
背景技术
医疗注射用水作为一种接近洁净的水资源常常作为配制注射剂、溶剂或制药用水的稀释液并广泛应用于医药容器的精洗,在医药行业具有不可替代的作用,其用量巨大,医疗注射用水的制备已经成为药企的能源消耗大户。
目前,医药行业使用的注射用水普遍采用多效蒸馏方法,蒸汽只能顺级、单次利用,循环利用率不足并且大量高温凝结水直接排空,造成能源的巨大浪费,无法满足节能减排的目标。因此,有效的过程监控对于安全操作这些过程并将过程的关键状态(温度、压力、pH)保持在最佳操作范围内至关重要。此外准确的过程监控模型将推动必要的纠正措施,以保持安全运行和最佳生产。
在线故障检测是一种监测过程最佳运行和安全的技术。根据在线故障检测的模型类型,再现故障检测算法大致分为三类:基于知识的方法、基于模型的方法与基于数据的方法。由于工业过程的精确机械模型难以获得,因此故障检测算法大多优先选择基于数据的检测算法。
综上所述,基于数据驱动的方法可以根据多元统计分析的方法利用统计学的中的理论知识进行分析,得到每个变量的特征统计量实现诊断功能。本发明提出了一种称为多路偏最小二乘自动编码器的深度学习架构,进行基于多效蒸馏技术的医疗注射用水高效制备系统优化设计、建模与控制以及核心关键部件高效强鲁棒性喷射器的研究有助于提升系统制水效率、降低能源消耗,提高设备运行的稳定性和鲁棒性,具有重要的理论价值和广阔的应用前景。
发明内容
本发明旨在对工业制水过程中的关键变量(温度、压力、pH)进行检测,提高系统制水效率。本无监督学习的方法具体为提出了一种多路偏最小二乘自动编码器的深度学习架构,并使用具有新目标函数的遗传优化算法进行训练,具体步骤如下:
步骤1:数据采集以及预处理,收集工业制水批次数据构建输入矩阵,对其进行归一化处理,并分为训练样本和测试样本。
步骤1.1:假设所有的测量值和噪声都符合正态分布。对N个变量进行K次不同的独
立采样,通过收集正常运行数据构建输入矩阵和,n为样本数,m和l分别表示X和Y变量个数,其中。
步骤1.2:对数据进行归一化处理,提升模型的收敛速度和精度以及消除单位差异
带来的影响,需要将获取的原始数据和归一化处理为均值为0、方差为1的数据矩阵X,利
用处理好的数据构建训练样本train和测试样本test,公式如下:
,
其中,和为的最大值和最小值,为所有特征变量归一化处理后
的数据矩阵。
步骤2:基于遗传算法构建自编码神经网络模型,通过遗传算法对批次数据进行特征选择,构建自编码神经网络模型,将训练样本输入模型,以无监督的方式进行算法训练。
步骤2.1:初始化种群个数、迭代次数、当前代数、灾变计数、变异以及交叉概率;
步骤2.2:利用构建自编码神经网络模型对个体基因型进行编码操作,通常由编码器网络和解码器网络组成,以提取数据中的隐藏模式并降低输入数据的维数。编码器被训练为将输入数据压缩到由隐藏层定义的缩小的潜在空间上,并且解码器将隐藏层输出解压缩回重构的输入,如下所示:
步骤2.2.1:训练后的编码器将得到的最优个体压缩到由隐藏层定义的缩小的潜在空间上,并且解码器将隐藏层的输出解压缩变为重构的输入,如下所示:
,
其中,是隐藏层的输出,是编码器的选定非线性激活函数,是编码器加权
矩阵,是数据预处理后的数据矩阵,是编码层的偏置向量;
步骤2.2.2:解码器根据以下操作从特征或潜在空间重构输入变量:
,
其中,是重构输入变量,是解码器的选定激活函数,,分别是解码器加
权矩阵和偏置向量,是隐藏层的输出。
步骤2.3:设置适应度函数,计算个体的适应度值,保留适应度最大的个体,对网络的初始权值和阈值进行优化从而减小网络的误差,将蒸馏时间t视为伪变量,适应度函数如下:
,
其中,、、、、分别是训练样本个数、输入样本、重构输入样本、可输出伪
变量和预测输出伪变量的数量,为加权因子。
步骤2.4:选用精英保留策略,将适应度强的部分个体进行直接保留并复制后代,同时让适应度弱的个体直接淘汰,精英保留的具体策略为:
步骤2.4.1:保留前20%适应度个体并复制两倍直接进入下一代;
步骤2.4.2:保留20%-50%的个体进入下一代;
步骤2.4.3:直接淘汰50%的个体。
步骤2.5:为防止遗传算法在搜索时陷入局部最优解,且长时间无法跳出,在选择交叉变异后增加灾变策略,具体做法如下:在迭代进化循环外添加一个计数变量,每迭代一次遗传算法对该次迭代的最优个体进行记录,若该次最优个体优于整体最优个体,则更新整体最优,同时将计数变量清零。
步骤2.6:采用基于GA遗传算法的对数据进行特征提取,具体流程如下:
步骤2.6.1:初始化参数,包括种群个数、迭代次数、当前代数、灾变计数、变异以及交叉概率;
步骤2.6.2:初始化种群即生成个体,并对个体基因型进行编码;
步骤2.6.3:计算种群个体适应度,对个体基因型进行解码操作;
步骤2.6.4:对个体基因进行选择、交叉以及变异操作;
步骤2.6.5:记录最优个体,并判断是否发生灾变操作;
步骤2.6.6:判断是否迭代完成,若迭代完成则结束算法,反之更新种群,返回步骤2.6.3。
步骤3:确定控制极限,采用统计量和SPE统计量进行故障诊断,使用核密度估
计法确定控制限。使用高斯核来估计每个时间间隔k的单变量数据(统计量和统
计量)的概率分布函数,如下所示:
,
,
其中,为概率密度函数,为高斯核,b为批次数,为控制分布
平滑度的带宽参数,为控制函数宽度的参数,为每个时间间隔k的单变量数据,为
第批次的统计量,为数据预处理后的数据矩阵,使用以下方程计算预先指定的显著性
水平的:
,
其中,为预先指定的显著水平,为概率密度函数,为动态控制极
限,为训练样本在时间间隔k的动态控制极限。
步骤4:对比监控指标,计算故障检测率,将监控指标的统计量与正常情况下计算出来的控制极限进行对比,通过判定逻辑确定故障是否发生,计算故障检测率。
步骤4.1:计算监控指标下的统计量和SPE统计量,分别如下式所示:
,
其中,是第b批中第k个样品的统计量,第b批第k个样本潜在变量
的第d个z维数,和分别是所有训练批次中第k个样本的第d个z维度的均值和
方差,R是自编码神经网络模型的隐含层神经元个数;
,
其中,统计量是第b批中的第k个样本的SPE统计量,和是第b批
次中的第k个样本的第d个z维度,分别用于输入和重构输入。
步骤4.2:将监控指标的统计量与正常情况下计算出来的控制限进行对比,通过判
定逻辑确定故障是否发生,若统计量、统计量均分别小于控制极限、
控制极限,则可视为正常样本,否则视为异常样本,判定逻辑如下:
,
,
平均故障检测率为正常平均总体故障检测率和异常平均总体故障检测率的加权和:
,
其中,是第b批中第k个样品的统计量,统计量是第b批中的第k个
样本的SPE统计量,为正常操作样本数量,为存在故障的样本数量,b是训练
数据集中正常批次的总数,为正常操作样本的平均故障检测率,为
存在故障样本的平均故障检测率。
与现有的技术相比,本发明的技术方案具有以下有益技术效果:
(1)针对医疗注射用水系统机械结构复杂、部分变量难以观测、故障难预警等问题,本发明设计了一种称为多路偏最小二乘自动编码器的深度学习架构,提出了一种新的无监督间歇过程监控目标函数,并使用具有新目标函数的遗传优化算法进行训练。
(2)本发明简单易行优化医疗注射用水设备,实现制水设备整体系统联系运行不中断,保证产水连续供给,提升整体制水装备运行效率,减少环境污染等目标,加速医药设备领域现代化、智能化进程。
下面参照附图,对本发明作进一步详细的说明。
附图说明
图1是本发明用于系统框架的结构图。
具体实施方式
在为使本发明的目的、技术方案和优点更佳清楚,下面结合附图及具体实时例对本发明进行详细描述。
参见附图1为本发明实施例的整体流程图,本实施例提供一种基于深度学习的无监督批量控制方法,以化工生产的青霉素发酵为例,具体包括以下流程:数据采集及预处理、基于遗传算法构建自编码神经网络模型、确定控制极限、对比监控指标,计算故障检测率。
具体实施步骤如下:
实施步骤1:数据采集以及预处理,收集工业制水批次数据构建输入矩阵,对其进行归一化处理,并分为训练样本和测试样本。
步骤1.1:假设所有的测量值和噪声都符合正态分布。对N个变量进行K次不同的独
立采样,通过收集正常运行数据构建输入矩阵和,n为样本数,m和l分别表示X和Y变量个数,其中。
步骤1.2:对数据进行归一化处理,提升模型的收敛速度和精度以及消除单位差异
带来的影响,需要将获取的原始数据和归一化处理为均值为0、方差为1的数据矩阵X,利
用处理好的数据构建训练样本train和测试样本test,公式如下:
,
其中,和为的最大值和最小值,为所有特征变量归一化处理后
的数据矩阵。
实施步骤2:基于遗传算法构建自编码神经网络模型,通过遗传算法对批次数据进行特征选择,构建自编码神经网络模型,将训练样本输入模型,以无监督的方式进行算法训练。
步骤2.1:初始化种群个数、迭代次数、当前代数、灾变计数、变异以及交叉概率;
步骤2.2:利用构建自编码神经网络模型对个体基因型进行编码操作,通常由编码器网络和解码器网络组成,以提取数据中的隐藏模式并降低输入数据的维数。编码器被训练为将输入数据压缩到由隐藏层定义的缩小的潜在空间上,并且解码器将3隐藏层输出解压缩回重构的输入,如下所示:
步骤2.2.1:训练后的编码器将得到的最优个体压缩到由隐藏层定义的缩小的潜在空间上,并且解码器将隐藏层的输出解压缩变为重构的输入,如下所示:
,
其中,是隐藏层的输出,是编码器的选定非线性激活函数,是编码器加权
矩阵,是数据预处理后的数据矩阵,是编码层的偏置向量;
步骤2.2.2:解码器根据以下操作从特征或潜在空间重构输入变量:
,
其中,是重构输入变量,是解码器的选定激活函数,,分别是解码器加
权矩阵和偏置向量,是隐藏层的输出。
步骤2.3:设置适应度函数,计算个体的适应度值,保留适应度最大的个体,对网络的初始权值和阈值进行优化从而减小网络的误差,将蒸馏时间t视为伪变量,适应度函数如下:
,
其中,、、、、分别是训练样本、输入样本、重构输入样本、可输出伪变量
和预测输出伪变量的数量,为加权因子。
步骤2.4:选用精英保留策略,将适应度强的部分个体进行直接保留并复制后代,同时让适应度弱的个体直接淘汰,精英保留的具体策略为:
步骤2.4.1:保留前20%适应度个体并复制两倍直接进入下一代;
步骤2.4.2:保留20%-50%的个体进入下一代;
步骤2.4.3:直接淘汰50%的个体。
步骤2.5:为防止遗传算法在搜索时陷入局部最优解,且长时间无法跳出,在选择交叉变异后增加灾变策略,具体做法如下:在迭代进化循环外添加一个计数变量,每迭代一次遗传算法对该次迭代的最优个体进行记录,若该次最优个体优于整体最优个体,则更新整体最优,同时将计数变量清零。
步骤2.6:采用基于GA遗传算法的对数据进行特征提取,具体流程如下:
步骤2.6.1:初始化参数,包括种群个数、迭代次数、当前代数、灾变计数、变异以及交叉概率;
步骤2.6.2:初始化种群即生成个体,并对个体基因型进行编码;
步骤2.6.3:计算种群个体适应度,对个体基因型进行解码操作;
步骤2.6.4:对个体基因进行选择、交叉以及变异操作;
步骤2.6.5:记录最优个体,并判断是否发生灾变操作;
步骤2.6.6:判断是否迭代完成,若迭代完成则结束算法,反之更新种群,返回步骤2.6.3。
实施步骤3:确定控制极限,采用统计量和SPE统计量进行故障诊断,使用核密
度估计法确定控制限。使用高斯核来估计每个时间间隔k的单变量数据(统计量和统计量)的概率分布函数,如下所示:
,
,
其中,为概率密度函数,为高斯核,b为批次数,为控制分布
平滑度的带宽参数,为控制函数宽度的参数,为每个时间间隔k的单变量数据,为
第批次的统计量,为数据预处理后的数据矩阵,使用以下方程计算预先指定的显著性
水平的:
,
其中,为预先指定的显著水平,为概率密度函数,为动态控制极
限,为训练样本在时间间隔k的动态控制极限。
实施步骤4:对比监控指标,计算故障检测率,将监控指标的统计量与正常情况下计算出来的控制极限进行对比,通过判定逻辑确定故障是否发生,计算故障检测率。
步骤4.1:计算监控指标下的统计量和SPE统计量,分别如下式所示:
,
其中,是第b批中第k个样品的统计量,第b批第k个样本潜在变量
的第d个z维数,和分别是所有训练批次中第k个样本的第d个z维度的均值和
方差,R是自编码神经网络模型的隐含层神经元个数;
,
其中,统计量是第b批中的第k个样本的SPE统计量,和是第b批
次中的第k个样本的第d个z维度,分别用于输入和重构输入。
步骤4.2:将监控指标的统计量与正常情况下计算出来的控制限进行对比,通过判
定逻辑确定故障是否发生,若统计量、统计量均分别小于控制极限、
控制极限,则可视为正常样本,否则视为异常样本,判定逻辑如下:
,
,
平均故障检测率为正常平均总体故障检测率和异常平均总体故障检测率的加权和:
,
其中,是第b批中第k个样品的,统计量是第b批中的第k个样本的
SPE统计量,为正常操作样本数量,为存在故障的样本数量,b是训练数据集
中正常批次的总数,为正常操作样本的平均故障检测率,为存在故
障样本的平均故障检测率。
Claims (4)
1.一种基于深度学习的无监督批量控制方法,其特征在于,包括以下步骤:
步骤1:数据采集以及预处理,收集工业制水批次数据构建输入矩阵,对其进行归一化处理,并分为训练样本和测试样本;
步骤2:基于遗传算法构建自编码神经网络模型,通过遗传算法对批次数据进行特征选择,构建自编码神经网络模型,将训练样本输入模型,以无监督的方式进行算法训练;
步骤3:确定控制极限,采用统计量和SPE统计量进行故障诊断,使用核密度估计法确定控制限;
步骤4:对比监控指标,计算故障检测率,将监控指标的统计量与正常情况下计算出来的控制极限进行对比,通过判定逻辑确定故障是否发生,计算故障检测率。
2.根据权利要求1所述的一种基于深度学习的无监督批量控制方法,其特征在于,步骤2所述的基于遗传算法构建自编码神经网络模型,通过遗传算法对批次数据进行特征选择,构建自编码神经网络模型,将训练样本输入模型,以无监督的方式进行算法训练,具体按照以下步骤实施:
步骤2.1:初始化种群个数、迭代次数、当前代数、灾变计数、变异以及交叉概率;
步骤2.2:利用构建自编码神经网络模型对个体基因型进行编码操作,其由编码器网络和解码器网络组成,用以提取数据中的隐藏模式并降低输入数据的维数,编码器被训练为将输入数据压缩到由隐藏层定义的缩小的潜在空间上,并且解码器将隐藏层的输出解压缩变为重构的输入,步骤如下:
步骤2.2.1:训练后的编码器将得到的最优个体压缩到由隐藏层定义的缩小的潜在空间上,并且解码器将隐藏层的输出解压缩变为重构的输入,如下所示:
,
其中,是隐藏层的输出,/>是编码器的选定非线性激活函数,/>是编码器加权矩阵,是数据预处理后的数据矩阵,/>是编码层的偏置向量;
步骤2.2.2:解码器根据以下操作从特征或潜在空间重构输入变量:
,
其中,是重构输入变量,/>是解码器的选定激活函数,/>,/>分别是解码器加权矩阵和偏置向量,/>是隐藏层的输出;
步骤2.3:设置适应度函数,计算个体的适应度值,保留适应度最大的个体,对网络的初始权值和阈值进行优化从而减小网络的误差,将蒸馏时间t视为伪变量,适应度函数如下:
,
其中,、/>、/>、/>、/>分别是训练样本、输入样本、重构输入样本、可输出伪变量和预测输出伪变量的数量,/>为加权因子;
步骤2.4:选用精英保留策略,将适应度强的部分个体进行直接保留并复制后代,同时让适应度弱的个体直接淘汰,精英保留的具体策略为:
步骤2.4.1:保留前20%适应度个体并复制两倍直接进入下一代;
步骤2.4.2:保留20%-50%的个体进入下一代;
步骤2.4.3:直接淘汰50%的个体;
步骤2.5:为防止遗传算法在搜索时陷入局部最优解,且长时间无法跳出,在选择交叉变异后增加灾变策略,具体做法如下:在迭代进化循环外添加一个计数变量,每迭代一次遗传算法对该次迭代的最优个体进行记录,若该次最优个体优于整体最优个体,则更新整体最优,同时将计数变量清零;
步骤2.6:采用基于GA遗传算法的对数据进行特征提取,具体流程如下:
步骤2.6.1:初始化参数,包括种群个数、迭代次数、当前代数、灾变计数、变异以及交叉概率;
步骤2.6.2:初始化种群即生成个体,并对个体基因型进行编码;
步骤2.6.3:计算种群个体适应度,对个体基因型进行解码操作;
步骤2.6.4:对个体基因进行选择、交叉以及变异操作;
步骤2.6.5:记录最优个体,并判断是否发生灾变操作;
步骤2.6.6:判断是否迭代完成,若迭代完成则结束算法,反之更新种群,返回步骤2.6.3。
3.根据权利要求1所述的一种基于深度学习的无监督批量控制方法,其特征在于,步骤3所述的确定控制极限,采用统计量和SPE统计量进行故障诊断,使用核密度估计法确定控制限,具体按照以下步骤实施:
采用统计量监测质量相关子空间和SPE统计量监测质量无关的故障,进行故障诊断,控制极限的计算根据核密度估计法进行确定,使用高斯核来估计每个时间间隔k的单变量数据(/>和/>)的概率分布函数,如下所示:
,
,
其中,为概率密度函数,/>为高斯核,b为批次数,/>为控制分布平滑度的带宽参数,/>为控制函数宽度的参数,/>为每个时间间隔k的单变量数据,/>为第/>批次的统计量,/>为数据预处理后的数据矩阵,使用以下方程计算预先指定的显著性水平的/>:
,
其中,为预先指定的显著水平,/>为概率密度函数,/>为动态控制极限,为训练样本在时间间隔k的动态控制极限。
4.根据权利要求1所述的一种基于深度学习的无监督批量控制方法,其特征在于,步骤4所述的对比监控指标,计算故障检测率,将监控指标的统计量与正常情况下计算出来的控制极限进行对比,通过判定逻辑确定故障是否发生,计算故障检测率,具体按照以下步骤实施:
步骤4.1:计算监控指标下的统计量和SPE统计量,分别如下式所示:
,
其中,是第b批中第k个样品的/>统计量,/>第b批第k个样本潜在变量的第d个z维数,/>和/>分别是所有训练批次中第k个样本的第d个z维度的均值和方差,R是自编码神经网络模型的隐含层神经元个数;
,
其中,统计量是第b批中的第k个样本的SPE统计量,/>和/>是第b批次中的第k个样本的第d个z维度,分别用于输入和重构输入;
步骤4.2:将监控指标的统计量与正常情况下计算出来的控制极限进行对比,通过判定逻辑确定故障是否发生,若统计量、/>统计量均分别小于/>控制极限、/>控制极限,则可视为正常样本,否则视为异常样本,判定逻辑如下:
,
,
平均故障检测率为正常平均总体故障检测率和异常平均总体故障检测率的加权和:
,
其中,是第b批中第k个样品的/>统计量,/>统计量是第b批中的第k个样本的SPE统计量,/>为正常操作样本数量,/>为存在故障的样本数量,b是训练数据集中正常批次的总数,/>为正常操作样本的平均故障检测率,/>为存在故障样本的平均故障检测率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410068917.9A CN117590753B (zh) | 2024-01-17 | 2024-01-17 | 一种基于深度学习的无监督批量控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410068917.9A CN117590753B (zh) | 2024-01-17 | 2024-01-17 | 一种基于深度学习的无监督批量控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117590753A true CN117590753A (zh) | 2024-02-23 |
CN117590753B CN117590753B (zh) | 2024-07-09 |
Family
ID=89910257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410068917.9A Active CN117590753B (zh) | 2024-01-17 | 2024-01-17 | 一种基于深度学习的无监督批量控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117590753B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022645A (zh) * | 2016-06-07 | 2016-10-12 | 李祖毅 | 非侵入式在线实时电力负荷识别方法及识别系统 |
CN112765896A (zh) * | 2021-01-29 | 2021-05-07 | 湖南大学 | 一种基于lstm的水处理时序数据异常检测方法 |
CN113806857A (zh) * | 2021-08-17 | 2021-12-17 | 西安理工大学 | 一种基于变分图自编码器的高速列车节能制动方法 |
US20210406717A1 (en) * | 2020-06-29 | 2021-12-30 | Oracle International Corporation | Enabling efficient machine learning model inference using adaptive sampling for autonomous database services |
CN114818806A (zh) * | 2022-04-25 | 2022-07-29 | 重庆大学 | 一种基于小波包与深度自编码器的变速箱故障诊断方法 |
CN115597869A (zh) * | 2022-09-26 | 2023-01-13 | 三峡大学(Cn) | 基于MTF-SDAE-LightGBM的轴承故障诊断方法 |
CN116362186A (zh) * | 2021-12-24 | 2023-06-30 | 复旦大学 | 一种基于图嵌入的连续空间运算放大器拓扑优化方法 |
CN116996286A (zh) * | 2023-07-31 | 2023-11-03 | 南京信同诚信息技术有限公司 | 一种基于大数据分析的网络攻击和安全漏洞治理框架平台 |
-
2024
- 2024-01-17 CN CN202410068917.9A patent/CN117590753B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022645A (zh) * | 2016-06-07 | 2016-10-12 | 李祖毅 | 非侵入式在线实时电力负荷识别方法及识别系统 |
US20210406717A1 (en) * | 2020-06-29 | 2021-12-30 | Oracle International Corporation | Enabling efficient machine learning model inference using adaptive sampling for autonomous database services |
CN112765896A (zh) * | 2021-01-29 | 2021-05-07 | 湖南大学 | 一种基于lstm的水处理时序数据异常检测方法 |
CN113806857A (zh) * | 2021-08-17 | 2021-12-17 | 西安理工大学 | 一种基于变分图自编码器的高速列车节能制动方法 |
CN116362186A (zh) * | 2021-12-24 | 2023-06-30 | 复旦大学 | 一种基于图嵌入的连续空间运算放大器拓扑优化方法 |
CN114818806A (zh) * | 2022-04-25 | 2022-07-29 | 重庆大学 | 一种基于小波包与深度自编码器的变速箱故障诊断方法 |
CN115597869A (zh) * | 2022-09-26 | 2023-01-13 | 三峡大学(Cn) | 基于MTF-SDAE-LightGBM的轴承故障诊断方法 |
CN116996286A (zh) * | 2023-07-31 | 2023-11-03 | 南京信同诚信息技术有限公司 | 一种基于大数据分析的网络攻击和安全漏洞治理框架平台 |
Non-Patent Citations (1)
Title |
---|
李永飞 等: "《基于可解释性深度学习的物联网水质监测数据异常检测》", 《计算机工程》, 12 October 2023 (2023-10-12), pages 1 - 13 * |
Also Published As
Publication number | Publication date |
---|---|
CN117590753B (zh) | 2024-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111914873B (zh) | 一种两阶段云服务器无监督异常预测方法 | |
CN112784965B (zh) | 面向云环境下大规模多元时间序列数据异常检测方法 | |
CN113642754B (zh) | 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法 | |
CN109146246B (zh) | 一种基于自动编码器和贝叶斯网络的故障检测方法 | |
CN110929765B (zh) | 一种基于批次图像化的卷积自编码故障监测方法 | |
CN116757534A (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN114282443B (zh) | 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法 | |
CN117290800A (zh) | 一种基于超图注意力网络的时序异常检测方法及系统 | |
CN112101400A (zh) | 工业控制系统异常检测方法、设备和服务器、存储介质 | |
CN113222045B (zh) | 基于加权特征对齐自编码器的半监督故障分类方法 | |
CN109298633A (zh) | 基于自适应分块非负矩阵分解的化工生产过程故障监测方法 | |
CN115169430A (zh) | 基于多尺度解码的云网端资源多维时间序列异常检测方法 | |
CN117316334B (zh) | 一种水厂混凝剂用量预测方法及系统 | |
CN116502164A (zh) | 基于对抗训练和频域改良自注意力机制的多维时序数据异常检测方法、设备及介质 | |
CN116007937A (zh) | 一种机械设备传动部件智能故障诊断方法及装置 | |
CN115185937A (zh) | 一种基于sa-gan架构的时间序列异常检测方法 | |
CN111191823A (zh) | 一种基于深度学习的生产物流预测方法 | |
CN110779988A (zh) | 一种基于深度学习的螺栓寿命预测方法 | |
Yang et al. | Teacher–student uncertainty autoencoder for the process-relevant and quality-relevant fault detection in the industrial process | |
CN116304587A (zh) | 一种基于cae和agru的滚动轴承退化趋势预测方法 | |
CN117590753B (zh) | 一种基于深度学习的无监督批量控制方法 | |
CN114297795A (zh) | 一种基于PR-Trans的机械设备剩余寿命预测方法 | |
CN117851821A (zh) | 一种基于mdn和gru的水电机组劣化趋势预测方法 | |
CN116933643A (zh) | 基于偏鲁棒m回归和多重插补的智能数据监测方法 | |
CN117633690A (zh) | 一种基于数据驱动的旋转机械健康状态监测方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |