CN115169735A - 一种基于样本扩充的电瓷质量预测方法及系统 - Google Patents
一种基于样本扩充的电瓷质量预测方法及系统 Download PDFInfo
- Publication number
- CN115169735A CN115169735A CN202210921275.3A CN202210921275A CN115169735A CN 115169735 A CN115169735 A CN 115169735A CN 202210921275 A CN202210921275 A CN 202210921275A CN 115169735 A CN115169735 A CN 115169735A
- Authority
- CN
- China
- Prior art keywords
- quality
- sample
- network
- electric porcelain
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 109
- 229910052573 porcelain Inorganic materials 0.000 claims abstract description 56
- 230000008569 process Effects 0.000 claims abstract description 37
- 230000015654 memory Effects 0.000 claims abstract description 25
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 19
- 230000007246 mechanism Effects 0.000 claims abstract description 15
- 230000035945 sensitivity Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 10
- 230000003042 antagnostic effect Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 28
- 238000012797 qualification Methods 0.000 claims description 23
- 239000002002 slurry Substances 0.000 claims description 19
- 238000001035 drying Methods 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 238000002360 preparation method Methods 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 7
- 238000010304 firing Methods 0.000 claims description 7
- 238000005245 sintering Methods 0.000 claims description 7
- 238000003723 Smelting Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 2
- 238000004140 cleaning Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 8
- 230000008034 disappearance Effects 0.000 abstract description 3
- 238000004880 explosion Methods 0.000 abstract description 3
- 230000000306 recurrent effect Effects 0.000 abstract description 3
- 238000010606 normalization Methods 0.000 description 8
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 6
- 230000004913 activation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011143 downstream manufacturing Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011268 mixed slurry Substances 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000011085 pressure filtration Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Molecular Biology (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Manufacturing & Machinery (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于质量预测技术领域,提供了一种基于样本扩充的电瓷质量预测方法及系统,本发明中利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,通过样本扩充,解决了不充足数据样本影响预测结果的问题;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度,避免了采用循环神经网络时易出现梯度消失和爆炸的问题,保证了合格率的预测精度;本发明通过先使用ACGAN模型扩充数据集,再使用一种基于注意力机制和双向长短记忆模型的方法,得到了一种预测电瓷质量的合格率的完整方法。
Description
技术领域
本发明属于质量预测技术领域,尤其涉及一种基于样本扩充的电瓷质量预测方法及系统。
背景技术
特高压瓷绝缘子,简称电瓷,是电力系统中多个领域内必需的绝缘设备,随着智能电网的发展,对电瓷的质量要求也不断提升。如图1所示,电瓷生产工艺流程主要有新浆制备、旧浆制备、混浆制备、压滤、粗炼、陈腐、精炼、成型、烘干、施釉、烧成、胶装养护、拉伸和电检等工艺步骤。可以看出电瓷的生产是极其复杂的,需分步经过多层工艺的制作,这使得电瓷制造过程中的实时和历史数据呈现出数据类型繁多、多特征和多噪声的特性。这些特性给电瓷质量预测带来巨大的挑战。
发明人发现,目前在对电瓷质量预测的方面,确切地说还没有一个完整的方法预测电瓷质量的合格率,而且电瓷在多阶段的生产过程中产生的数据类型繁多、多特征和多噪声等特点,增加了对电瓷质量预测的难度。同时,收集到少量的电瓷生产数据,不充足的数据样本使得预测结果并没有达到理想的状态。
发明内容
本发明为了解决上述问题,提出了一种基于样本扩充的电瓷质量预测方法及系统,本发明由两部分组成,先使用ACGAN(Auxiliary Classifier GAN)模型扩充数据集,再使用一种基于注意力机制(Attention mechanism)和双向长短记忆模型(BidirectionalLong Short-Term Memory,BiLSTM)的方法来预测电瓷产品合格率。
为了实现上述目的,本发明是通过如下的技术方案来实现:
第一方面,本发明提供了一种基于样本扩充的电瓷质量预测方法,包括:
获取电瓷生产过程中多个工序的参数变量数据;
依据获取的参数变量数据,以及预设的电瓷质量预测模型,预测得到电瓷质量的合格率;
其中,所述电瓷质量预测模型训练时,首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度。
进一步的,多个工序包括生浆制备工序、净浆制备工序、粗炼过程工序、烘干工序和烧成工序。
进一步的,对参数变量数据进行特征提取;采用全连接层得到生浆制备特征,采用全连接层得到净浆的特征,采用全连接层得到泥段粗炼过程的特征,采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征,采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征;五部分的特征进行融合,得到一个向量。
进一步的,衍生网络ACGAN中,判别器的损失函数为:
LS=E[logP(S=real|Xreal)]+E[logP(S=fake|Xfake)]
LQ=E[logP(Q=q|Xreal)]+E[logP(Q=q|Xfake)]
生成器的损失函数为:
LS=E[logP(S=fake|Xfake)]
LQ=E[logP(Q=q|Xfake)]
其中,S为数据真实与否的损失;LQ为预测合格率的损失;E为期望值;对于判别器分别要判断数据源是否为真实数据的概率分布P(S|X)以及数据源对于合格率标签的概率分布P(Q|X);Xreal代表真实样本;Xfake为生成样本。
进一步的,通过最小化生成器的损失LS-LQ和最大化判别器的损失LS+LQ,构成最大最小博弈来训练模型。
进一步的,对训练样本进行数据进行清洗,以及进行去量纲化。
进一步的,采用全连接层得到生浆制备特征,采用全连接层得到净浆的特征,采用全连接层得到泥段粗炼过程的特征,采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征,采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征;五部分的特征进行融合,得到一个向量。
第二方面,本发明还提供了一种基于样本扩充的电瓷质量预测系统,包括:
数据采集模块,被配置为:获取电瓷生产过程中多个工序的参数变量数据;
合格率预测模块,被配置为:依据获取的参数变量数据,以及预设的电瓷质量预测模型,预测得到电瓷质量的合格率;
其中,所述电瓷质量预测模型训练时,首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度。
第三方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了第一方面所述的基于样本扩充的电瓷质量预测方法的步骤。
第四方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了第一方面所述的基于样本扩充的电瓷质量预测方法的步骤。
与现有技术相比,本发明的有益效果为:
本发明中,首先,利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数,通过样本扩充,解决了不充足数据样本影响预测结果的问题;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度,避免了采用循环神经网络时易出现梯度消失和爆炸的问题,保证了合格率的预测精度;本发明通过先使用ACGAN模型扩充数据集,再使用一种基于注意力机制和双向长短记忆模型的方法,得到了一种预测电瓷质量的合格率的完整方法。
附图说明
构成本实施例的一部分的说明书附图用来提供对本实施例的进一步理解,本实施例的示意性实施例及其说明用于解释本实施例,并不构成对本实施例的不当限定。
图1为本发明实施例1的电瓷工艺流程简图;
图2为本发明实施例1的流程图;
图3为本发明实施例1的基于Attention-BiLSTM的电瓷质量预测方法的模型图;
图4为本发明实施例1的改进后ACGAN的网络结构图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
样本扩充:扩充数据集中样本的数量。
电瓷质量预测:使用智能的方法预测电瓷生产的合格率。
全连接层:每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。
BiLSTM:一种用来处理时间序列的深度学习领域中的方法。
生成对抗网络(Generative Adversarial Networks,GAN):一种无监督学习算法。
ACGAN:GAN的一种衍生网络。
注意力机制:深度学习领域中的一种方法,类似于:人可以一眼找到图像中最重要的部分。
损失函数:用来表现预测与实际数据的差距程度。
平均绝对值误差、均方根误差:衡量变量精度的两个最常用的指标,也是机器学习中评价模型的两把重要标尺。
量纲:是指物理量的基本属性,物理量的大小与单位有关;
无量纲:物理量大小与单位无关。
标准化:一种特征缩放的方法,使得数据呈现正态分布。
归一化:一种特征缩放的方法,将特征缩放到[0,1]这个区间,把量纲转为无量纲的过程。
拼接:将两个向量或多个向量拼成一个向量。
电瓷又名电工陶瓷或电力瓷,是电力系统中电气绝缘用的硬质瓷器件,分瓷绝缘子和电器用瓷套两大类。
实施例1:
本实施例提供了一种基于样本扩充的电瓷质量预测方法,包括:
获取电瓷生产过程中多个工序的参数变量数据;
依据获取的参数变量数据,以及预设的电瓷质量预测模型,预测得到电瓷质量的合格率;
其中,所述电瓷质量预测模型训练时,首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度。
本实施例中,在电瓷的工艺流程中,选取影响质量最重要的五个工序,包括生浆制备工序、净浆制备工序、粗炼过程工序、烘干工序和烧成工序,然后收集到这五个工序中的参数变量数据,整合在一起作为电瓷质量预测数据集的一部分,所述参数变量数据可以理解的为水分值、激光粒度、细度、机械铁和泥浆温度等。但数据集样本量不多,因此本实施例中在电瓷样本不充足的条件下,采用ACGAN模型有效地生成以假乱真的虚假样本并扩充了该数据集样本;然后,使用一种基于Attention-BiLSTM的预测方法预测电瓷质量的合格率,整体技术方案的模型如图2所示。具体实施方案如下:
数据生成器,本实施例中设计了一个数据集生成器来解决样本不充足的问题。生成对抗网络GAN常被用来生成数据,GAN由两个基础神经网络即生成器神经网络(GeneratorNeural Network)和判别器神经网络(Discriminator Neural Network)所组成,其中一个用于生成内容,另一个则用于判别生成的内容。GAN受博弈论中的零和博弈启发,将生成问题视作判别器(discriminator)和生成器(Generator)这两个网络的对抗和博弈:生成器从给定噪声中产生合成数据,给定噪声一般是指均匀分布或者正态分布,判别器分辨生成器的的输出和真实数据。生成器试图产生更接近真实的数据,相应地,判别器试图更完美地分辨真实数据与生成数据。在基于GAN的各种衍生网络中,采用ACGAN作为数据生成器的主体方法,该网络的损失函数分为判别损失和分类损失两种,特别地,如3图所示,本实施例中,对ACGAN中两种损失函数进行了改进,分别用LS和LQ表示,以便让ACGAN更加适用于电瓷质量预测领域;其中,样本的合格率标签(Q)可以作为条件,在判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差(Mean Absolute Error,MAE)替代原始ACGAN中的分类的损失函数。
判别器的损失函数由公式(1)和(2)两部分组成:
LS=E[logP(S=real|Xreal)]+E[logP(S=fake|Xfake)] (1)
LQ=E[logP(Q=q|Xreal)]+E[logP(Q=q|Xfake)] (2)
其中,LS为数据真实与否的损失;LQ为预测合格率的损失;E为期望值;对于判别器分别要判断数据源是否为真实数据的概率分布P(S|X)以及数据源对于合格率标签的概率分布P(Q|X);Xreal代表真实样本;Xfake为生成样本。生成器的损失函数由公式(3)和(4)组成:
LS=E[logP(S=fake|Xfake)] (3)
LQ=E[logP(Q=q|Xfake)] (4)
通过最小化生成器的损失LS-LQ和最大化判别器的损失LS+LQ,构成最大最小博弈来训练模型,让生成器生成的数据更加逼真。
生成的这些数据作为数据集的一部分与原数据集整合到一起,放入下面的预测模型中,训练模型。
基于Attention-BiLSTM的预测方法,由于收集的原始生产质量数据存在着很多问题,因此,在开始建模前需要进行数据的处理加工,从而确保数据的完整可靠性,这是非常重要且必不可少的一个步骤;针对原始数据存在的问题,对数据进行处理,主要是:
对数据进行清洗,对数据集通过丢弃、填充、替换和去重等操作,实现去除异常、纠正错误和补足缺失的目的;
消除量纲影响,不同类别的数据差异巨大,具有自己的属性,如果不对数据进行无量纲变换,可能会对预测结果产生不利的影响,降低模型的可信度。较为常用的数据去量纲化的方法有标准化和归一化。
本实施例中标准化采用的是Z-Score标准化(Zero-Mena normalization),该方法的公式如(5)所示:
其中:x′代表数据标准化后的值;x代表原始数据;μ代表样本均值;σ代表样本标准差。
本实施例中,归一化采用用Min-Max方法,该法的公式如(6)所示:
其中:x′代表数据归一化后的值;x代表数据的原始值;xmax,xmin代表原始数据的最小值和最大值;最终,使用标准化来处理原始数据。
本实施例中采用的五个工序在时间上存在先后关系,因此这些数据可以被认为是序列数据。循环神经网络(Recurrent Neural Network,RNN)类的模型在处理序列上有着优秀的表现能里,但易出现梯度消失和爆炸问题,而长短期记忆网络(Long Short-TermMemory,LSTM)可以解决这一问题,但LSTM只能建立从前向后的关系,因此,将使用双向长短时记忆网络(BiLSTM)对这些工艺进行前后两个方向的建模,然后再结合注意力机制(Attention)增强模型对于不同时刻工序特征的敏感度,提高模型预测的准确度,最后得到预测结果。本实施例中的模型设计如图4所示,具体的实施步骤如下:
特征提取,对于生浆阶段影响质量的主要有4个因素,采用一个全连接层得到生浆制备特征。
在净浆制备阶段影响质量的主要有4个因素,比如水分值、激光粒度、机械铁和泥浆温度,也采用和上阶段一样的做法,用一个全连接层得到净浆的特征:
在烘干阶段,成型的坯件经过窑头预热、中间高温加热和窑尾降温三个部分,并且在窑头和窑尾部分分别由一个温度传感器和湿度传感器,中间具有两个温度传感器,将烘干参数表示为 和分别表示温度和湿度,而参数不足四个使用0填充。烘干的整个阶段需要经过三天,采集到的数据在时间上有着一个先后关系,决定使用
BiLSTM对烘干参数在时间序列上进行建模,得到烘干参数的特征,用公式(10)表示:
烧成阶段。坯件在烧成窑内先后经过2天时间的高温煅烧,在窑内共有33个温度传感器不断检测温度的变化。两天内对这33个温度传感器的值进行采样,平均20分钟采集一次,烧成参数用x5=[T1,T2,…,T144]表示,Ti=[t1,t2,…,t33]。
同样这些烧成的所有参数,在时间上也存在先后的关系,再次使用BiLSTM对不同时间上的温度参数进行建模,得到烧成特征X5:
特征融合,前面得到的五个工艺的特征表示,而这五个特征也是在时间上有着明显的先后关系,因此使用BiLSTM或BiGRU对五部分的特征进行融合,得到最终的一个向量,用X表示:
X=F([X1,X2,X3,X4,X5]) (12)
其中,F代表BiLSTM或BiGRU对五个特这个的融合操作;[]表示拼接操作。
注意力机制(Attention),在这五部分工艺中,每一个工艺对最后的预测模型效果都起着不同的用,因此,通过使用注意力机制(Attention)对5个特征表示重新分配权重,以此来提高预测模型的准确度。
C′=Attention(X) (13)
最后使用向量表示X′,对合格率进行预测:
Y=f′(wfc·X′) (13)
其中,wfc表示使用ReLU激活函数的线性层;f′表示不使用任何激活函数的线性层;Y代表预测的合格率。
模型评估,为了分析模型的预测效果,采用平均绝对误差(MAE)、均方根误差(RMSE)对上述模型方法在电瓷质量预测场景中的效果进行定量评估,MAE、RMSE公式如(15)和(16)所示:
本实施例可以解决当前电瓷样本不充足以及没有可行的方法用于电瓷质量预测的问题;在电瓷样本不充足的条件下,采用ACGAN模型有效地生成以假乱真的虚假样本并扩充样本量较少的数据集样本;提出的一种基于Attention-BiLSTM的预测方法来预测电瓷质量的合格率,使用BiLSTM能够捕获电瓷生产过程中上下游工艺数据间的复杂关联特性,进一步用Attention机制通过增强模型对不同工艺特征的敏感度,可以避免BiLSTM易忽略部分重要工艺特征的不足,最终可以实现电瓷质量合格率的准确预测。
实施例2:
本实施例提供了一种基于样本扩充的电瓷质量预测系统,包括:
数据采集模块,被配置为:获取电瓷生产过程中多个工序的参数变量数据;
合格率预测模块,被配置为:依据获取的参数变量数据,以及预设的电瓷质量预测模型,预测得到电瓷质量的合格率;
其中,所述电瓷质量预测模型训练时,首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度。
所述系统的工作方法与实施例1的基于样本扩充的电瓷质量预测方法相同,这里不再赘述。
实施例3:
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现了实施例1所述的基于样本扩充的电瓷质量预测方法的步骤。
实施例4:
本实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现了实施例1所述的基于样本扩充的电瓷质量预测方法的步骤。
以上所述仅为本实施例的优选实施例而已,并不用于限制本实施例,对于本领域的技术人员来说,本实施例可以有各种更改和变化。凡在本实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实施例的保护范围之内。
Claims (10)
1.一种基于样本扩充的电瓷质量预测方法,其特征在于,包括:
获取电瓷生产过程中多个工序的参数变量数据;
依据获取的参数变量数据,以及预设的电瓷质量预测模型,预测得到电瓷质量的合格率;
其中,所述电瓷质量预测模型训练时,首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度。
2.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法,其特征在于,多个工序包括生浆制备工序、净浆制备工序、粗炼过程工序、烘干工序和烧成工序。
3.如权利要求2所述的一种基于样本扩充的电瓷质量预测方法,其特征在于,对参数变量数据进行特征提取;采用全连接层得到生浆制备特征,采用全连接层得到净浆的特征,采用全连接层得到泥段粗炼过程的特征,采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征,采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征;五部分的特征进行融合,得到一个向量。
4.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法,其特征在于,衍生网络ACGAN中,判别器的损失函数为:
LS=E[logP(S=real|Xreal)]+E[logP(S=fake|Xfake)]
LQ=E[logP(Q=q|Xreal)]+E[logP(Q=q|Xfake)]
生成器的损失函数为:
LS=E[logP(S=fake|Xfake)]
LQ=E[logP(Q=q|Xfake)]
LS为数据真实与否的损失;LQ为预测合格率的损失;E为期望值;对于判别器分别要判断数据源是否为真实数据的概率分布P(S|X)以及数据源对于合格率标签的概率分布P(Q|X);Xreal代表真实样本;Xfake为生成样本。
5.如权利要求4所述的一种基于样本扩充的电瓷质量预测方法,其特征在于,通过最小化生成器的损失LS-LQ和最大化判别器的损失LS+LQ,构成最大最小博弈来训练模型。
6.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法,其特征在于,对训练样本进行数据进行清洗,以及进行去量纲化。
7.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法,其特征在于,采用全连接层得到生浆制备特征,采用全连接层得到净浆的特征,采用全连接层得到泥段粗炼过程的特征,采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征,采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征;五部分的特征进行融合,得到一个向量。
8.一种基于样本扩充的电瓷质量预测系统,其特征在于,包括:
数据采集模块,被配置为:获取电瓷生产过程中多个工序的参数变量数据;
合格率预测模块,被配置为:依据获取的参数变量数据,以及预设的电瓷质量预测模型,预测得到电瓷质量的合格率;
其中,所述电瓷质量预测模型训练时,首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充,样本的合格率标签作为条件,在衍生网络ACGAN的判别器中对样本的合格率进行预测,并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数;然后,考虑多个工序在时间上存在的先后关系,使用双向长短时记忆网络对多个工序进行前后两个方向的建模;最后,结合注意力机制增强模型对于不同时刻工序特征的敏感度。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现了如权利要求1-7任一项所述的基于样本扩充的电瓷质量预测方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现了如权利要求1-7任一项所述的基于样本扩充的电瓷质量预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210921275.3A CN115169735A (zh) | 2022-08-02 | 2022-08-02 | 一种基于样本扩充的电瓷质量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210921275.3A CN115169735A (zh) | 2022-08-02 | 2022-08-02 | 一种基于样本扩充的电瓷质量预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115169735A true CN115169735A (zh) | 2022-10-11 |
Family
ID=83477682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210921275.3A Withdrawn CN115169735A (zh) | 2022-08-02 | 2022-08-02 | 一种基于样本扩充的电瓷质量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115169735A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476125A (zh) * | 2023-12-27 | 2024-01-30 | 豆黄金食品有限公司 | 一种基于数据分析的腐竹余液回收数据处理系统 |
-
2022
- 2022-08-02 CN CN202210921275.3A patent/CN115169735A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117476125A (zh) * | 2023-12-27 | 2024-01-30 | 豆黄金食品有限公司 | 一种基于数据分析的腐竹余液回收数据处理系统 |
CN117476125B (zh) * | 2023-12-27 | 2024-04-05 | 豆黄金食品有限公司 | 一种基于数据分析的腐竹余液回收数据处理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110376522B (zh) | 一种数据融合的深度学习网络的电机故障诊断方法 | |
CN114219147A (zh) | 一种基于联邦学习的配电站故障预测方法 | |
CN108875771A (zh) | 一种基于稀疏高斯伯努利受限玻尔兹曼机和循环神经网络的故障分类模型及方法 | |
CN109934222A (zh) | 一种基于迁移学习的绝缘子串自爆识别方法 | |
JP6172615B2 (ja) | 電力システムにおける要素パラメータと電力補正係数の識別方法及びシステム | |
CN110596506A (zh) | 基于时间卷积网络的变换器故障诊断方法 | |
CN113191253A (zh) | 一种边缘机器学习下基于特征融合的非侵入式负荷识别方法 | |
CN115169735A (zh) | 一种基于样本扩充的电瓷质量预测方法及系统 | |
CN115905835B (zh) | 一种融合多维特征的低压交流电弧故障诊断方法 | |
CN111046961A (zh) | 基于双向长短时记忆单元和胶囊网络的故障分类方法 | |
CN115015683B (zh) | 电缆生产的性能测试方法、装置、设备及存储介质 | |
CN112596016A (zh) | 基于多个一维卷积神经网络集成的互感器故障诊断方法 | |
CN114169091A (zh) | 工程机械部件剩余寿命的预测模型建立方法及预测方法 | |
Ganjun et al. | Partial discharge pattern recognition of high voltage cables based on the stacked denoising autoencoder method | |
CN113408808B (zh) | 训练方法、数据生成方法、装置、电子设备以及存储介质 | |
CN114118149A (zh) | 基于有限元仿真和对称特征迁移的感应电机故障诊断系统 | |
CN109557434A (zh) | 基于复合字典稀疏表示分类的强背景噪声下局部放电信号识别方法 | |
Mousavi et al. | A CUSUM chart for monitoring a proportion with autocorrelated binary observations | |
CN109061544B (zh) | 一种电能计量误差估计方法 | |
CN109784777B (zh) | 基于时序信息片段云相似度度量的电网设备状态评估方法 | |
JP2020177282A (ja) | 異常判別システムおよびその構築方法 | |
CN112418324B (zh) | 用于电气设备状态感知的跨模态数据融合方法 | |
Wu et al. | Hilbert ID considering multi-window feature extraction for transformer deep vision fault positioning | |
CN113552489A (zh) | 一种基于灰色神经网络的电站备用电源荷电状态估计方法 | |
JP6950647B2 (ja) | データ判定装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20221011 |