CN112101445B

CN112101445B - 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法

Info

Publication number: CN112101445B
Application number: CN202010943916.6A
Authority: CN
Inventors: 宋执环; 陈雨薇; 魏驰航
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-09-09
Filing date: 2020-09-09
Publication date: 2023-11-28
Anticipated expiration: 2040-09-09
Also published as: CN112101445A

Abstract

本发明公开一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，该方法首先使用T阈值下的K均值算法对样本进行预处理，随后使用堆叠缺陷相关的自编码器提取有效特征，作为分类模型的输入，对钢铁连铸过程中的夹渣情况进行预测估计。针对夹渣故障分类中的正负样本不平衡特点，本发明的方法在对占多数的正常样本集进行K‑means聚类时，引入阈值T的限制，使获得的各类大小趋于一致，提升样本的平衡度；针对训练样本中存在与缺陷不相关或相关性较小的信息，在数据预训练时采用了基于缺陷相关的堆叠自编码器特征提取方法，减少不相关的信息，以提高后续分类准确性。

Description

一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法

技术领域

本发明属于连铸坯皮下夹渣缺陷预测领域，涉及样本不平衡问题的解决以及利用缺陷信息指导相关要素提取的方法，尤其涉及一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法。

背景技术

在连续铸钢的过程中，由于钢坯表面温度极高，与空气接触很容易发生氧化，为了保护钢坯，连铸过程中往往会在钢坯表面覆上保护渣，待钢坯冷却后将保护渣扫落。然而会有部分保护渣嵌入钢体中，在嵌入部分出现夹渣现象，导致在后续利用钢坯(如拉丝或者展平)时发生断裂或者表面凹陷，大大降低钢制品的质量。因此，皮下夹渣检测是铸钢流水线上亟待解决的工程技术问题。

过程监测方法可以分为三类：第一类是基于模型的方法，它是最为传统的一种，依赖于精确的过程机理模型；第二类是基于知识的方法，它需要过程行为的可用知识以及工厂操作员的经验，创建一个尽可能完整的知识库，但是需要经过漫长的积累；第三类是基于数据的方法，它不需要精确的模型和丰富的专家知识，监测结果往往更加直观。然而，目前的研究几乎没有针对连铸坯皮下夹渣这一工业问题提出合适的故障诊断模型，通过过程机理模型减少夹渣的方法都需要较为稳定的生产环境，在实际生产过程中这些要求很难达到，因此，通过构建故障诊断预测模型来减少夹渣问题显得十分必要。

考虑到夹渣样本集存在正负样本不平衡性，而多数分类器是基于“类”的大小近似这一假设工作的，在样本不平衡的情况下，分类性能不佳，因此，首要是在数据预处理中添加消除不平衡问题的算法，它将直接影响到随后分类器的设计。此前，有不少学者提出过欠采样的分组算法，从与故障样本占相同大小的正常样本中随机选择一个子集，利用此子集和故障类进行分类，最后将这些子分类器合并以生成最终分类结果。但是欠采样的方法会失去正常样本的部分信息，不能有效地解决故障样本稀缺性问题。与之相对应的，如基于SMOTE的过采样方法，它通过随机增加故障样本来减小不平衡性带来的弊端，然而只是在故障集的族类边界内添加样本，这些添加的样本无法跳出稀缺的“类”，可能导致过拟合现象。为了避免过采样导致的过拟合与欠采样带来的信息缺失等负面影响，采用T阈值下的K均值算法将正常类划分为与故障类大小近似的若干类，从而将二分类问题转化为多分类问题。

考虑到训练样本中存在与缺陷不相关或相关性较小的信息，可能导致神经网络冗余、性能降低和训练时间延长。当前很多深度学习预训练网络只针对样本数据指导要素学习，而没有利用训练集的标签信息。

发明内容

针对钢坯连铸的工艺过程，并且为了克服常用模型在解决样本不平衡问题上的不足，增强缺陷信息对要素提取的指导作用，本发明提出一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，将有监督的特征提取思想引入多分类模型，帮助模型准确快速地进行故障分类，实现了连铸过程中的夹渣情况实时预测。

本发明的目的通过如下的技术方案来实现：

一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，该方法包括如下步骤：

S1：收集钢坯连铸过程数据的一部分作为训练数据集P(x，y)∈R^n×m，其中包含输入数据x和与夹渣故障变量相关的二分类标签y，n表示样本个数，R表示实数集，输入数据维数为m-1，标签维数为1；所述的输入数据x包括发生故障的正样本和没有发生故障的负样本；

S2：对训练数据集P(x，y)进行预处理，具体如下：

S2.1：将步骤一获得的训练数据集P(x，y)归一化，即将其线性映射到(0，1)区间，得到新数据集

S2.2：鉴于中的样本不平衡性，首先采用T阈值下的K-means算法对负样本聚为K类，由此，训练集分为大小近似的K+1类，其中：

T＝abnormal

K＝math.ceil(normal/abnormal)

这里，abnormal、normal、math.ceil分别表示训练集的故障样本数、训练集的正常样本数，以及向上取整函数；

S2.3：将二分类标签y按照相应的类别映射为多分类标签其中[1，0，0，0，...，0]为第一类的标签，[0，1，0，0，...，0]为第二类的标签，[0，0，1，0，...，0]为第三类的标签，以此类推直到[0，0，0，0，...，1]为第K+1类的标签；第一类的标签为故障样本集的标签，第二类～第K+I类的标签为正常样本集的标签；至此，实现训练集预处理，预处理后的新训练集记为/>其中，/>表示归一化后的输入数据，/>为多分类标签，输入数据维数为m-1，标签维数为K+1；

S3：利用数据预处理后的新训练集建立分类模型，具体如下：

S3.1构建堆叠缺陷相关的自编码器，即SDAE，对新训练集进行有监督的预训练，以提取特征；

(1)分割为输入数据/>和标签数据/>将/>作为第一层DAE的输入，经过隐藏层的非线性变换，得到编码器输出/>其中，f为激活函数；

(2)使H经过两个随机初始化后的解码器分别得到输入数据和标签数据的重构和/>

(3)通过最小化重构误差完成第一层DAE的训练，得到第一层DAE的权重和偏置参数；

(4)以第一层训练得到的编码器输出H作为第二层DAE的输入，执行和第一步相同的操作，完成第二层DAE的训练，得到第二层DAE的权重和偏置参数；以此类推，直到完成末层DAE的训练；将得到的每层DAE的权重和偏置参数用于构建堆叠缺陷相关的自编码器，达到逐层减少不相关的信息并从原始数据逐步聚焦与缺陷相关功能的目的；所述的训练集经过SDAE预训练，得到更新了输入数据后的训练集/>其中h为末层DAE编码器输出的特征；

S3.2：在特征h和标签数据之间搭建简易分类器，记录分类器的相关参数；

S4：在钢坯连铸过程中，通过专家经验知识实时获得一组有效的过程数据x∈R^1×m，并将其进行归一化处理，映射到(0，1)区间；

S5：将归一化后的数据输入到SDAE中，利用已有的模型参数，逐层进行特征计算，第一层DAE输出/>作为第二层DAE输入，第二层DAE输出h₂＝f(h₁·W_h2+b_h2)作为第三层DAE输入，...，最终获得末层DAE输出h＝f(h_i-1·W_hi+b_hi)∈R^1×q，其中q为末层DAE隐藏层节点数；

S6：将预训练后得到的h作为简易分类器的输入，得到预测的标签数据y∈R^1×(K+1)，将该一维数组中最大值所在的列，作为该样本所在的类，若类别属于第一类，预测结果判为该样本发生夹渣故障，反之判为正常。

进一步地，所述的S3.1的步骤(4)中，在得到每层DAE的权重和偏置参数后，将这些参数作为初始参数，建立2i+1层微调网络，其中i为SDAE堆叠层数，这里包含输入层输出层/>2i-1层隐藏层，输入层至第i层隐藏层的网络架构与SDAE一致，微调网络以第i层隐藏层为中心，两边呈现对称架构，第i层至第i+1层为末层DAE的重构输出，第i+1层至第i+2层为次末层DAE的重构输出，以此类推，直到微调网络的输出层/>以最小化重构误差来实现SDAE的微调，该参数将替代S3.1步骤(4)中的参数，作为SDAE预训练模型的最优参数。

进一步地，所述的S3.2中的简易分类器为三层BP神经网络，第一层为特征输入，中间层为隐藏层，末层为输出层。利用经过SDAE预训练后的新训练集对BP神经网络进行训练。训练规则如下：

隐藏层输出H＝f(h·W₁+b₁)，其中W₁，b₁分别是输入层到隐藏层的权重和偏置参数

末层输出Y＝f(h·W₂+b₂)，其中W₂，b₂分别是隐藏层到输出层的权重和偏置参数

由于神经网络输出Y和真实输出之间存在误差，将均方误差/>逆向反馈，以调整各层权重，经过多次迭代，最终使全部样本下的误差函数/>最小，至此完成BP神经网络的训练。

本发明的有益效果如下：

针对夹渣故障分类中的正负样本不平衡特点，本发明的方法在对占多数的正常样本集进行K-means聚类时，引入阈值T的限制，使获得的各类大小趋于一致，进一步提升样本的平衡度；针对训练样本中存在与缺陷不相关或相关性较小的信息，在数据预训练时采用了基于缺陷相关的堆叠自编码器特征提取方法，相比于无监督的自编码器，缺陷相关自编码器将训练集的缺陷信息也作为输入的一部分，参与神经网络的训练，指导神经网络提取潜在特征，并通过逐层堆叠的方式，减少不相关的信息，以提高后续分类准确性。

附图说明

图1是基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法的流程图；

图2是缺陷相关自编码器(DAE)的原理图；

图3是SDAE的微调过程图。

图4是钢坯连铸工艺过程图；

图5是随不平衡度变化的神经网络模型的预测输出结果图；

图6是T阈值K均值预处理相比其他预处理的优势图；

图7是SDAE预训练相比其他预训练的优势图。

具体实施方式

下面根据附图和优选实施例详细描述本发明，本发明的目的和效果将变得更加明白，应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明的基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，包括如下步骤：

S2：对训练数据集P(x，y)进行预处理，具体如下：

T＝abnormal

K＝math.ceil(normal/abnormal)

S2.3：将二分类标签y按照相应的类别映射为多分类标签其中[1，0，0，0，...，0]为第一类的标签，[0，1，0，0，...，0]为第二类的标签，[0，0，1，0，...，0]为第三类的标签，以此类推直到[0，0，0，0，...，1]为第K+1类的标签；第一类的标签为故障样本集的标签，第二类～第K+1类的标签为正常样本集的标签；至此，实现了训练集预处理，预处理后的新训练集记为/>其中，/>表示归一化后的输入数据，/>为多分类标签，输入数据维数为m-1，标签维数为K+1；

T阈值下的K-means算法面对工业流程中的不平衡数据集，仍有较好的分类性能。T阈值下的K-means算法提供了应对平衡数据集和不平衡数据集通用的方法，由于阈值T限定为占少数的故障样本的大小，从而确定了占大多数的正常样本集可以分割的类数，K和T的乘积大致为正常样本集的大小。

可以发现，当样本的平衡性较好时，该步预处理的存在不会阻碍后续的分类，一般情况下，K的计算结果都为1，即正常样本无需分割，自然地归为一类。当样本的平衡性较差，即正常样本数远大于故障样本数时，该分类经过阈值T＝abnormal的限制，相比于普通的K-means算法而言，更有效地控制分割后样本集大小，针对性地解决不平衡问题。

(4)以第一层训练得到的编码器输出H作为第二层DAE的输入，执行和第一步相同的操作，完成第二层DAE的训练，得到第二层DAE的权重和偏置参数；以此类推，直到完成末层DAE的训练；将得到的每层DAE的权重和偏置参数用于构建堆叠缺陷相关的自编码器，达到逐层减少不相关的信息并从原始数据逐步聚焦与缺陷相关功能的目的；如图2所示。所述的训练集经过SDAE预训练，得到更新了输入数据后的训练集/>其中h为末层DAE编码器输出的特征；

S3.2：在特征h和标签数据之间搭建简易分类器，记录分类器的权重参数W和偏置参数b；

作为其中一种实施方式，简易分类器为BPNN分类器，三层BP神经网络，第一层为特征输入，中间层为隐藏层，末层为输出层。利用经过SDAE预训练后的新训练集对BP神经网络进行训练。训练规则如下：

隐藏层输出H＝f(h·W₁+b₁)，其中W₁，b₁分别是输入层到隐藏层的权重和偏置参数末层输出Y＝f(h·W₂+b₂)，其中W₂，b₂分别是隐藏层到输出层的权重和偏置参数

S6：将预训练后得到的h作为BPNN分类器的输入，得到预测的标签数据y∈R^1×(K+1)，将该一维数组中最大值所在的列，作为该样本所在的类，若类别属于第一类，预测结果判为该样本发生夹渣故障，反之判为正常。

为了进一步优化参数，在S3.1的步骤(4)中，在得到每层DAE的权重和偏置参数后，将这些参数作为初始参数，建立2i+1层微调网络，如图3所示，其中i为SDAE堆叠层数，这里包含输入层输出层/>2i-1层隐藏层，输入层至第i层隐藏层的网络架构与SDAE一致，微调网络以第i层隐藏层为中心，两边呈现对称架构，第i层至第i+1层为末层DAE的重构输出，第i+1层至第i+2层为次末层DAE的重构输出，以此类推，直到微调网络的输出层/>以最小化重构误差/>来实现SDAE的微调，该参数将替代S3.1步骤(4)中的参数，作为SDAE预训练模型的最优参数。

下面以一个具体的实施例验证本发明的方法的有益效果。

如图4所示，为钢坯连铸工艺过程图。工厂采集过程数据时，专家根据操作经验和过程机理知识选择了33个常规测量的过程变量，如表1所示。

表1：样本变量说明

标签	名称	标签	名称
				U1	大包重量	U18	结晶器冷却水流量(东)
U2	大包温度	U19	结晶器冷却水入口压力
				U3	大包长水口密封氩气流量	U20	结晶器冷却水出口压力(北)
U4	大包长水口氩气密封压力	U21	结晶器冷却水出口压力(南)
				U5	中间包重量	U22	结晶器冷却水出口压力(西)
U6	中间包温度	U23	结晶器冷却水出口压力(东)
				U7	中间包(吹扫)氩气流量1	U24	结晶器开度值实际值(北)
U8	中间包(吹扫)氩气流量2	U25	结晶器开度值实际值(南)
				U9	中间包(吹扫)氩气入口压力	U26	结晶器开度值实际值(西)
U10	结晶器冷却水进口温度	U27	结晶器开度值实际值(东)
				U11	结晶器冷却水出口温度(北)	U28	拉速设定值
U12	结晶器冷却水出口温度(南)	U29	拉速实际值
				U13	结晶器冷却水出口温度(西)	U30	上水口氩气流量(5升)
U14	结晶器冷却水出口温度(东)	U31	上水口氩气压力
				U15	结晶器冷却水流量(北)	U32	塞棒氩气流量
U16	结晶器冷却水流量(南)	U33	塞棒氩气背压
				U17	结晶器冷却水流量(西)	Y	样本标签

为考察正负样本的不平衡情况，从获取的不同钢种中，随机抽取10个钢种的训练样本集，计算不平衡度，发现绝大部分钢种数据都存在一定的不平衡性，小部分有相对严重的不平衡情况。由于在工艺过程中，钢坯初轧时小区域的夹渣，在经过精轧后，会随着钢体的展平，展开成大面积的夹渣，因此在样本集里，并没有出现其他工艺过程中可能存在的极度不平衡情况。

根据不同样本集的不平衡度从小到大的顺序，以四项评估指标为依据对模型性能进行测试，如图5所示。不平衡度越小，训练得到的模型效果越佳，并且在不平衡度10附近时，故障点召回率有所提升；其后，随着不平衡度的上升，模型性能逐渐变差，主要表现为F1值的下降。根据抽样显示，不平衡度小于15的占比约为80％，位于模型性能较好的参数附近；可见对于大部分钢种而言，本发明的基于SDAE的神经网络分类模型适用于夹渣故障检测。

该实施例分析比较了九种不同建模方法的性能。将数据集分别通过T阈值K均值算法、Smote算法进行数据预处理，随后通过堆叠缺陷相关的自编码器(SDAE)、堆叠自编码器(SAE)进行预训练，基于提取出的特征训练基于BP神经网络的分类器，以及不经过预处理、不经过预训练的简单分类方法等。通过对一不平衡度为11的样本集的实验分析不同预处理、不同预训练算法所构造的模型之间的预测性能，如表2所示。

表2：预测性能与九种不同建模方法的比较

网络类型	Accuracy	Precision	Recall	F1
					TK-SDAE-BPNN	0.921	0.625	0.524	0.570
TK-SAE-BPNN	0.926	0.618	0.500	0.553
					TK-BPNN	0.926	0.633	0.452	0.528
Smote-SDAE-BPNN	0.916	0.535	0.548	0.541
					Smote-SAE-BPNN	0.920	0.568	0.500	0.532
Smote-BPNN	0.907	0.488	0.500	0.494
					SDAE-BPNN	0.916	0.543	0.452	0.494
SAE-BPNN	0.909	0.500	0.476	0.488
					BPNN	0.907	0.488	0.476	0.482

从一、二、三组网络类型的平行比较中(图6)，发现T阈值下的K均值算法相较于Smote算法能够得到更高的准确率和精确率；相对而言，Smote预处理后建立的神经网络模型可以获得更高的召回率；但在分类问题的最关键衡量指标F1上，即认为召回率和精确率同样重要的前提下，T阈值K均值算法体现出更优性能。

分别从一、二、三组网络内部比较来看(图7)，含有堆叠自编码器的网络相比于不含堆叠自编码器的网络在故障点召回率和F1上均有一定的提升，说明堆叠自编码器(SAE)可以通过降维来提取更优特征、减少无关信息、有效提升后续分类效果的特点。并且发现，有监督的堆叠自编码器相比于无监督自编码器而言，故障召回率和F1可以得到进一步提升，可见SAE虽然可以逐层减少无关的信息，但是并不能从原始样本的输出数据中学习到有效信息；这一点在SDAE中得到了改进，证实了带缺陷信息的标签对样本潜在特征提取的指导作用。

本领域普通技术人员可以理解，以上所述仅为发明的优选实例而已，并不用于限制发明，尽管参照前述实例对发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内，所做的修改、等同替换等均应包含在发明的保护范围之内。

Claims

1.一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，其特征在于，该方法包括如下步骤：

S2：对训练数据集P(x，y)进行预处理，具体如下：

T＝abnormal

K＝math.ceil(normal/abnormal)

S2.3：将二分类标签y按照相应的类别映射为多分类标签其中[1，0，0，0，...，0]为第一类的标签，[0，1，0，0，...，0]为第二类的标签，[0，0，1，0，...，0]为第三类的标签，以此类推直到[0，0，0，0，...，1]为第K+1类的标签；第一类的标签为故障样本集的标签，第二类～第K+1类的标签为正常样本集的标签；至此，实现训练集预处理，预处理后的新训练集记为/>其中，/>表示归一化后的输入数据，/>为多分类标签，输入数据维数为m-1，标签维数为K+1；

2.根据权利要求1所述的基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，其特征在于，所述的S3.1的步骤(4)中，在得到每层DAE的权重和偏置参数后，将这些参数作为初始参数，建立2i+1层微调网络，其中i为SDAE堆叠层数，这里包含输入层输出层/>2i-1层隐藏层，输入层至第i层隐藏层的网络架构与SDAE一致，微调网络以第i层隐藏层为中心，两边呈现对称架构，第i层至第i+1层为末层DAE的重构输出，第i+1层至第i+2层为次末层DAE的重构输出，以此类推，直到微调网络的输出层/>以最小化重构误差来实现SDAE的微调，该参数将替代S3.1步骤(4)中的参数，作为SDAE预训练模型的最优参数。

3.根据权利要求1所述的基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法，其特征在于，所述的S3.2中的简易分类器为三层BP神经网络，第一层为特征输入，中间层为隐藏层，末层为输出层；利用经过SDAE预训练后的新训练集对BP神经网络进行训练；训练规则如下：