CN115169735A

CN115169735A - 一种基于样本扩充的电瓷质量预测方法及系统

Info

Publication number: CN115169735A
Application number: CN202210921275.3A
Authority: CN
Inventors: 王孝红; 吴春燕
Original assignee: University of Jinan
Current assignee: University of Jinan
Priority date: 2022-08-02
Filing date: 2022-08-02
Publication date: 2022-10-11

Abstract

本发明属于质量预测技术领域，提供了一种基于样本扩充的电瓷质量预测方法及系统，本发明中利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充，通过样本扩充，解决了不充足数据样本影响预测结果的问题；然后，考虑多个工序在时间上存在的先后关系，使用双向长短时记忆网络对多个工序进行前后两个方向的建模；最后，结合注意力机制增强模型对于不同时刻工序特征的敏感度，避免了采用循环神经网络时易出现梯度消失和爆炸的问题，保证了合格率的预测精度；本发明通过先使用ACGAN模型扩充数据集，再使用一种基于注意力机制和双向长短记忆模型的方法，得到了一种预测电瓷质量的合格率的完整方法。

Description

一种基于样本扩充的电瓷质量预测方法及系统

技术领域

本发明属于质量预测技术领域，尤其涉及一种基于样本扩充的电瓷质量预测方法及系统。

背景技术

特高压瓷绝缘子，简称电瓷，是电力系统中多个领域内必需的绝缘设备，随着智能电网的发展，对电瓷的质量要求也不断提升。如图1所示，电瓷生产工艺流程主要有新浆制备、旧浆制备、混浆制备、压滤、粗炼、陈腐、精炼、成型、烘干、施釉、烧成、胶装养护、拉伸和电检等工艺步骤。可以看出电瓷的生产是极其复杂的，需分步经过多层工艺的制作，这使得电瓷制造过程中的实时和历史数据呈现出数据类型繁多、多特征和多噪声的特性。这些特性给电瓷质量预测带来巨大的挑战。

发明人发现，目前在对电瓷质量预测的方面，确切地说还没有一个完整的方法预测电瓷质量的合格率，而且电瓷在多阶段的生产过程中产生的数据类型繁多、多特征和多噪声等特点，增加了对电瓷质量预测的难度。同时，收集到少量的电瓷生产数据，不充足的数据样本使得预测结果并没有达到理想的状态。

发明内容

本发明为了解决上述问题，提出了一种基于样本扩充的电瓷质量预测方法及系统，本发明由两部分组成，先使用ACGAN(Auxiliary Classifier GAN)模型扩充数据集，再使用一种基于注意力机制(Attention mechanism)和双向长短记忆模型(BidirectionalLong Short-Term Memory，BiLSTM)的方法来预测电瓷产品合格率。

为了实现上述目的，本发明是通过如下的技术方案来实现：

第一方面，本发明提供了一种基于样本扩充的电瓷质量预测方法，包括：

获取电瓷生产过程中多个工序的参数变量数据；

依据获取的参数变量数据，以及预设的电瓷质量预测模型，预测得到电瓷质量的合格率；

其中，所述电瓷质量预测模型训练时，首先利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充，样本的合格率标签作为条件，在衍生网络ACGAN的判别器中对样本的合格率进行预测，并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数；然后，考虑多个工序在时间上存在的先后关系，使用双向长短时记忆网络对多个工序进行前后两个方向的建模；最后，结合注意力机制增强模型对于不同时刻工序特征的敏感度。

进一步的，多个工序包括生浆制备工序、净浆制备工序、粗炼过程工序、烘干工序和烧成工序。

进一步的，对参数变量数据进行特征提取；采用全连接层得到生浆制备特征，采用全连接层得到净浆的特征，采用全连接层得到泥段粗炼过程的特征，采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征，采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征；五部分的特征进行融合，得到一个向量。

进一步的，衍生网络ACGAN中，判别器的损失函数为：

L_S＝E[logP(S＝real|X_real)]+E[logP(S＝fake|X_fake)]

L_Q＝E[logP(Q＝q|X_real)]+E[logP(Q＝q|X_fake)]

生成器的损失函数为：

L_S＝E[logP(S＝fake|X_fake)]

L_Q＝E[logP(Q＝q|X_fake)]

其中，_S为数据真实与否的损失；L_Q为预测合格率的损失；E为期望值；对于判别器分别要判断数据源是否为真实数据的概率分布P(S|X)以及数据源对于合格率标签的概率分布P(Q|X)；X_real代表真实样本；X_fake为生成样本。

进一步的，通过最小化生成器的损失L_S-L_Q和最大化判别器的损失L_S+L_Q，构成最大最小博弈来训练模型。

进一步的，对训练样本进行数据进行清洗，以及进行去量纲化。

进一步的，采用全连接层得到生浆制备特征，采用全连接层得到净浆的特征，采用全连接层得到泥段粗炼过程的特征，采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征，采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征；五部分的特征进行融合，得到一个向量。

第二方面，本发明还提供了一种基于样本扩充的电瓷质量预测系统，包括：

数据采集模块，被配置为：获取电瓷生产过程中多个工序的参数变量数据；

合格率预测模块，被配置为：依据获取的参数变量数据，以及预设的电瓷质量预测模型，预测得到电瓷质量的合格率；

第三方面，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现了第一方面所述的基于样本扩充的电瓷质量预测方法的步骤。

第四方面，本发明还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现了第一方面所述的基于样本扩充的电瓷质量预测方法的步骤。

与现有技术相比，本发明的有益效果为：

本发明中，首先，利用生成对抗网络的衍生网络ACGAN对训练数据集进行样本扩充，样本的合格率标签作为条件，在衍生网络ACGAN的判别器中对样本的合格率进行预测，并使用损失函数平均绝对值误差替代原始衍生网络ACGAN中分类的损失函数，通过样本扩充，解决了不充足数据样本影响预测结果的问题；然后，考虑多个工序在时间上存在的先后关系，使用双向长短时记忆网络对多个工序进行前后两个方向的建模；最后，结合注意力机制增强模型对于不同时刻工序特征的敏感度，避免了采用循环神经网络时易出现梯度消失和爆炸的问题，保证了合格率的预测精度；本发明通过先使用ACGAN模型扩充数据集，再使用一种基于注意力机制和双向长短记忆模型的方法，得到了一种预测电瓷质量的合格率的完整方法。

附图说明

构成本实施例的一部分的说明书附图用来提供对本实施例的进一步理解，本实施例的示意性实施例及其说明用于解释本实施例，并不构成对本实施例的不当限定。

图1为本发明实施例1的电瓷工艺流程简图；

图2为本发明实施例1的流程图；

图3为本发明实施例1的基于Attention-BiLSTM的电瓷质量预测方法的模型图；

图4为本发明实施例1的改进后ACGAN的网络结构图。

具体实施方式

下面结合附图与实施例对本发明作进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

样本扩充：扩充数据集中样本的数量。

电瓷质量预测：使用智能的方法预测电瓷生产的合格率。

全连接层：每一个结点都与上一层的所有结点相连，用来把前边提取到的特征综合起来。

BiLSTM：一种用来处理时间序列的深度学习领域中的方法。

生成对抗网络(Generative Adversarial Networks，GAN)：一种无监督学习算法。

ACGAN：GAN的一种衍生网络。

注意力机制：深度学习领域中的一种方法，类似于：人可以一眼找到图像中最重要的部分。

损失函数：用来表现预测与实际数据的差距程度。

平均绝对值误差、均方根误差：衡量变量精度的两个最常用的指标，也是机器学习中评价模型的两把重要标尺。

量纲：是指物理量的基本属性，物理量的大小与单位有关；

无量纲：物理量大小与单位无关。

标准化：一种特征缩放的方法，使得数据呈现正态分布。

归一化：一种特征缩放的方法，将特征缩放到[0，1]这个区间，把量纲转为无量纲的过程。

拼接：将两个向量或多个向量拼成一个向量。

电瓷又名电工陶瓷或电力瓷，是电力系统中电气绝缘用的硬质瓷器件，分瓷绝缘子和电器用瓷套两大类。

实施例1：

本实施例提供了一种基于样本扩充的电瓷质量预测方法，包括：

获取电瓷生产过程中多个工序的参数变量数据；

本实施例中，在电瓷的工艺流程中，选取影响质量最重要的五个工序，包括生浆制备工序、净浆制备工序、粗炼过程工序、烘干工序和烧成工序，然后收集到这五个工序中的参数变量数据，整合在一起作为电瓷质量预测数据集的一部分，所述参数变量数据可以理解的为水分值、激光粒度、细度、机械铁和泥浆温度等。但数据集样本量不多，因此本实施例中在电瓷样本不充足的条件下，采用ACGAN模型有效地生成以假乱真的虚假样本并扩充了该数据集样本；然后，使用一种基于Attention-BiLSTM的预测方法预测电瓷质量的合格率，整体技术方案的模型如图2所示。具体实施方案如下：

数据生成器，本实施例中设计了一个数据集生成器来解决样本不充足的问题。生成对抗网络GAN常被用来生成数据，GAN由两个基础神经网络即生成器神经网络(GeneratorNeural Network)和判别器神经网络(Discriminator Neural Network)所组成，其中一个用于生成内容，另一个则用于判别生成的内容。GAN受博弈论中的零和博弈启发，将生成问题视作判别器(discriminator)和生成器(Generator)这两个网络的对抗和博弈：生成器从给定噪声中产生合成数据，给定噪声一般是指均匀分布或者正态分布，判别器分辨生成器的的输出和真实数据。生成器试图产生更接近真实的数据，相应地，判别器试图更完美地分辨真实数据与生成数据。在基于GAN的各种衍生网络中，采用ACGAN作为数据生成器的主体方法，该网络的损失函数分为判别损失和分类损失两种，特别地，如3图所示，本实施例中，对ACGAN中两种损失函数进行了改进，分别用L_S和L_Q表示，以便让ACGAN更加适用于电瓷质量预测领域；其中，样本的合格率标签(Q)可以作为条件，在判别器中对样本的合格率进行预测，并使用损失函数平均绝对值误差(Mean Absolute Error，MAE)替代原始ACGAN中的分类的损失函数。

判别器的损失函数由公式(1)和(2)两部分组成：

L_S＝E[logP(S＝real|X_real)]+E[logP(S＝fake|X_fake)] (1)

L_Q＝E[logP(Q＝q|X_real)]+E[logP(Q＝q|X_fake)] (2)

其中，L_S为数据真实与否的损失；L_Q为预测合格率的损失；E为期望值；对于判别器分别要判断数据源是否为真实数据的概率分布P(S|X)以及数据源对于合格率标签的概率分布P(Q|X)；X_real代表真实样本；X_fake为生成样本。生成器的损失函数由公式(3)和(4)组成：

L_S＝E[logP(S＝fake|X_fake)] (3)

L_Q＝E[logP(Q＝q|X_fake)] (4)

通过最小化生成器的损失L_S-L_Q和最大化判别器的损失L_S+L_Q，构成最大最小博弈来训练模型，让生成器生成的数据更加逼真。

生成的这些数据作为数据集的一部分与原数据集整合到一起，放入下面的预测模型中，训练模型。

基于Attention-BiLSTM的预测方法，由于收集的原始生产质量数据存在着很多问题，因此，在开始建模前需要进行数据的处理加工，从而确保数据的完整可靠性，这是非常重要且必不可少的一个步骤；针对原始数据存在的问题，对数据进行处理，主要是：

对数据进行清洗，对数据集通过丢弃、填充、替换和去重等操作，实现去除异常、纠正错误和补足缺失的目的；

消除量纲影响，不同类别的数据差异巨大，具有自己的属性，如果不对数据进行无量纲变换，可能会对预测结果产生不利的影响，降低模型的可信度。较为常用的数据去量纲化的方法有标准化和归一化。

本实施例中标准化采用的是Z-Score标准化(Zero-Mena normalization)，该方法的公式如(5)所示：

其中：x′代表数据标准化后的值；x代表原始数据；μ代表样本均值；σ代表样本标准差。

本实施例中，归一化采用用Min-Max方法，该法的公式如(6)所示：

其中：x′代表数据归一化后的值；x代表数据的原始值；x_max，x_min代表原始数据的最小值和最大值；最终，使用标准化来处理原始数据。

本实施例中采用的五个工序在时间上存在先后关系，因此这些数据可以被认为是序列数据。循环神经网络(Recurrent Neural Network，RNN)类的模型在处理序列上有着优秀的表现能里，但易出现梯度消失和爆炸问题，而长短期记忆网络(Long Short-TermMemory，LSTM)可以解决这一问题，但LSTM只能建立从前向后的关系，因此，将使用双向长短时记忆网络(BiLSTM)对这些工艺进行前后两个方向的建模，然后再结合注意力机制(Attention)增强模型对于不同时刻工序特征的敏感度，提高模型预测的准确度，最后得到预测结果。本实施例中的模型设计如图4所示，具体的实施步骤如下：

特征提取，对于生浆阶段影响质量的主要有4个因素，采用一个全连接层得到生浆制备特征。

其中，σ表示ReLU激活函数；

表示全连接层；

这四个参数代表影响质量问题的四个因素，比如水分值、激光粒度、细度和机械铁。

在净浆制备阶段影响质量的主要有4个因素，比如水分值、激光粒度、机械铁和泥浆温度，也采用和上阶段一样的做法，用一个全连接层得到净浆的特征：

式中，

其中，

表示全连接层。

在泥段粗炼过程中影响电瓷质量的主要是泥段的水分值，这个水分值需要按时检测三次，因此我们用

来表示三个水分值，粗炼过程的特征为X₃。

其中，

表示全连接层。

在烘干阶段，成型的坯件经过窑头预热、中间高温加热和窑尾降温三个部分，并且在窑头和窑尾部分分别由一个温度传感器和湿度传感器，中间具有两个温度传感器，将烘干参数表示为

和

分别表示温度和湿度，而

参数不足四个使用0填充。烘干的整个阶段需要经过三天，采集到的数据在时间上有着一个先后关系，决定使用

BiLSTM对烘干参数在时间序列上进行建模，得到烘干参数的特征，用公式(10)表示：

其中，

表示烘干过程中第j个参数(温度或湿度)的第k个数值。

烧成阶段。坯件在烧成窑内先后经过2天时间的高温煅烧，在窑内共有33个温度传感器不断检测温度的变化。两天内对这33个温度传感器的值进行采样，平均20分钟采集一次，烧成参数用x₅＝[T₁，T₂，…，T₁₄₄]表示，T_i＝[t₁，t₂，…，t₃₃]。

同样这些烧成的所有参数，在时间上也存在先后的关系，再次使用BiLSTM对不同时间上的温度参数进行建模，得到烧成特征X₅：

其中，x₅表示烧成的所有参数；

表示烧成的第j个温度传感器的温度。

特征融合，前面得到的五个工艺的特征表示，而这五个特征也是在时间上有着明显的先后关系，因此使用BiLSTM或BiGRU对五部分的特征进行融合，得到最终的一个向量，用X表示：

X＝F([X₁，X₂，X₃，X₄，X₅]) (12)

其中，F代表BiLSTM或BiGRU对五个特这个的融合操作；[]表示拼接操作。

注意力机制(Attention)，在这五部分工艺中，每一个工艺对最后的预测模型效果都起着不同的用，因此，通过使用注意力机制(Attention)对5个特征表示重新分配权重，以此来提高预测模型的准确度。

C′＝Attention(X) (13)

最后使用向量表示X′，对合格率进行预测：

Y＝f′(w_fc·X′) (13)

其中，w_fc表示使用ReLU激活函数的线性层；f′表示不使用任何激活函数的线性层；Y代表预测的合格率。

模型评估，为了分析模型的预测效果，采用平均绝对误差(MAE)、均方根误差(RMSE)对上述模型方法在电瓷质量预测场景中的效果进行定量评估，MAE、RMSE公式如(15)和(16)所示：

式中，n表示要预测合格率的数目；

为第i个电瓷合格率的实际值；y_i为第i个电瓷质量预测模型的预测值。

本实施例可以解决当前电瓷样本不充足以及没有可行的方法用于电瓷质量预测的问题；在电瓷样本不充足的条件下，采用ACGAN模型有效地生成以假乱真的虚假样本并扩充样本量较少的数据集样本；提出的一种基于Attention-BiLSTM的预测方法来预测电瓷质量的合格率，使用BiLSTM能够捕获电瓷生产过程中上下游工艺数据间的复杂关联特性，进一步用Attention机制通过增强模型对不同工艺特征的敏感度，可以避免BiLSTM易忽略部分重要工艺特征的不足，最终可以实现电瓷质量合格率的准确预测。

实施例2：

本实施例提供了一种基于样本扩充的电瓷质量预测系统，包括：

所述系统的工作方法与实施例1的基于样本扩充的电瓷质量预测方法相同，这里不再赘述。

实施例3：

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现了实施例1所述的基于样本扩充的电瓷质量预测方法的步骤。

实施例4：

本实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现了实施例1所述的基于样本扩充的电瓷质量预测方法的步骤。

以上所述仅为本实施例的优选实施例而已，并不用于限制本实施例，对于本领域的技术人员来说，本实施例可以有各种更改和变化。凡在本实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本实施例的保护范围之内。

Claims

1.一种基于样本扩充的电瓷质量预测方法，其特征在于，包括：

获取电瓷生产过程中多个工序的参数变量数据；

2.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法，其特征在于，多个工序包括生浆制备工序、净浆制备工序、粗炼过程工序、烘干工序和烧成工序。

3.如权利要求2所述的一种基于样本扩充的电瓷质量预测方法，其特征在于，对参数变量数据进行特征提取；采用全连接层得到生浆制备特征，采用全连接层得到净浆的特征，采用全连接层得到泥段粗炼过程的特征，采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征，采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征；五部分的特征进行融合，得到一个向量。

4.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法，其特征在于，衍生网络ACGAN中，判别器的损失函数为：

L_S＝E[logP(S＝real|X_real)]+E[logP(S＝fake|X_fake)]

L_Q＝E[logP(Q＝q|X_real)]+E[logP(Q＝q|X_fake)]

生成器的损失函数为：

L_S＝E[logP(S＝fake|X_fake)]

L_Q＝E[logP(Q＝q|X_fake)]

L_S为数据真实与否的损失；L_Q为预测合格率的损失；E为期望值；对于判别器分别要判断数据源是否为真实数据的概率分布P(S|X)以及数据源对于合格率标签的概率分布P(Q|X)；X_real代表真实样本；X_fake为生成样本。

5.如权利要求4所述的一种基于样本扩充的电瓷质量预测方法，其特征在于，通过最小化生成器的损失L_S-L_Q和最大化判别器的损失L_S+L_Q，构成最大最小博弈来训练模型。

6.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法，其特征在于，对训练样本进行数据进行清洗，以及进行去量纲化。

7.如权利要求1所述的一种基于样本扩充的电瓷质量预测方法，其特征在于，采用全连接层得到生浆制备特征，采用全连接层得到净浆的特征，采用全连接层得到泥段粗炼过程的特征，采用双向长短时记忆网络对烘干参数在时间序列上进行建模得到烘干参数的特征，采用双向长短时记忆网络对不同时间上的温度参数进行建模得到烧成特征；五部分的特征进行融合，得到一个向量。

8.一种基于样本扩充的电瓷质量预测系统，其特征在于，包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现了如权利要求1-7任一项所述的基于样本扩充的电瓷质量预测方法的步骤。

10.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现了如权利要求1-7任一项所述的基于样本扩充的电瓷质量预测方法的步骤。