CN112101445B - 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法 - Google Patents
一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法 Download PDFInfo
- Publication number
- CN112101445B CN112101445B CN202010943916.6A CN202010943916A CN112101445B CN 112101445 B CN112101445 B CN 112101445B CN 202010943916 A CN202010943916 A CN 202010943916A CN 112101445 B CN112101445 B CN 112101445B
- Authority
- CN
- China
- Prior art keywords
- layer
- training
- dae
- data
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002893 slag Substances 0.000 title claims abstract description 32
- 230000007547 defect Effects 0.000 title claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 28
- 238000009749 continuous casting Methods 0.000 title claims abstract description 24
- 238000007920 subcutaneous administration Methods 0.000 title claims abstract description 14
- 238000013277 forecasting method Methods 0.000 title description 2
- 238000012549 training Methods 0.000 claims abstract description 93
- 238000000034 method Methods 0.000 claims abstract description 53
- 230000008569 process Effects 0.000 claims abstract description 26
- 230000006870 function Effects 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000003064 k means clustering Methods 0.000 abstract description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 18
- 239000000498 cooling water Substances 0.000 description 14
- 229910000831 Steel Inorganic materials 0.000 description 12
- 239000010959 steel Substances 0.000 description 12
- 229910052786 argon Inorganic materials 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 238000009966 trimming Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000010926 purge Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 229910001208 Crucible steel Inorganic materials 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000005491 wire drawing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Abstract
本发明公开一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,该方法首先使用T阈值下的K均值算法对样本进行预处理,随后使用堆叠缺陷相关的自编码器提取有效特征,作为分类模型的输入,对钢铁连铸过程中的夹渣情况进行预测估计。针对夹渣故障分类中的正负样本不平衡特点,本发明的方法在对占多数的正常样本集进行K‑means聚类时,引入阈值T的限制,使获得的各类大小趋于一致,提升样本的平衡度;针对训练样本中存在与缺陷不相关或相关性较小的信息,在数据预训练时采用了基于缺陷相关的堆叠自编码器特征提取方法,减少不相关的信息,以提高后续分类准确性。
Description
技术领域
本发明属于连铸坯皮下夹渣缺陷预测领域,涉及样本不平衡问题的解决以及利用缺陷信息指导相关要素提取的方法,尤其涉及一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法。
背景技术
在连续铸钢的过程中,由于钢坯表面温度极高,与空气接触很容易发生氧化,为了保护钢坯,连铸过程中往往会在钢坯表面覆上保护渣,待钢坯冷却后将保护渣扫落。然而会有部分保护渣嵌入钢体中,在嵌入部分出现夹渣现象,导致在后续利用钢坯(如拉丝或者展平)时发生断裂或者表面凹陷,大大降低钢制品的质量。因此,皮下夹渣检测是铸钢流水线上亟待解决的工程技术问题。
过程监测方法可以分为三类:第一类是基于模型的方法,它是最为传统的一种,依赖于精确的过程机理模型;第二类是基于知识的方法,它需要过程行为的可用知识以及工厂操作员的经验,创建一个尽可能完整的知识库,但是需要经过漫长的积累;第三类是基于数据的方法,它不需要精确的模型和丰富的专家知识,监测结果往往更加直观。然而,目前的研究几乎没有针对连铸坯皮下夹渣这一工业问题提出合适的故障诊断模型,通过过程机理模型减少夹渣的方法都需要较为稳定的生产环境,在实际生产过程中这些要求很难达到,因此,通过构建故障诊断预测模型来减少夹渣问题显得十分必要。
考虑到夹渣样本集存在正负样本不平衡性,而多数分类器是基于“类”的大小近似这一假设工作的,在样本不平衡的情况下,分类性能不佳,因此,首要是在数据预处理中添加消除不平衡问题的算法,它将直接影响到随后分类器的设计。此前,有不少学者提出过欠采样的分组算法,从与故障样本占相同大小的正常样本中随机选择一个子集,利用此子集和故障类进行分类,最后将这些子分类器合并以生成最终分类结果。但是欠采样的方法会失去正常样本的部分信息,不能有效地解决故障样本稀缺性问题。与之相对应的,如基于SMOTE的过采样方法,它通过随机增加故障样本来减小不平衡性带来的弊端,然而只是在故障集的族类边界内添加样本,这些添加的样本无法跳出稀缺的“类”,可能导致过拟合现象。为了避免过采样导致的过拟合与欠采样带来的信息缺失等负面影响,采用T阈值下的K均值算法将正常类划分为与故障类大小近似的若干类,从而将二分类问题转化为多分类问题。
考虑到训练样本中存在与缺陷不相关或相关性较小的信息,可能导致神经网络冗余、性能降低和训练时间延长。当前很多深度学习预训练网络只针对样本数据指导要素学习,而没有利用训练集的标签信息。
发明内容
针对钢坯连铸的工艺过程,并且为了克服常用模型在解决样本不平衡问题上的不足,增强缺陷信息对要素提取的指导作用,本发明提出一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,将有监督的特征提取思想引入多分类模型,帮助模型准确快速地进行故障分类,实现了连铸过程中的夹渣情况实时预测。
本发明的目的通过如下的技术方案来实现:
一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,该方法包括如下步骤:
S1:收集钢坯连铸过程数据的一部分作为训练数据集P(x,y)∈Rn×m,其中包含输入数据x和与夹渣故障变量相关的二分类标签y,n表示样本个数,R表示实数集,输入数据维数为m-1,标签维数为1;所述的输入数据x包括发生故障的正样本和没有发生故障的负样本;
S2:对训练数据集P(x,y)进行预处理,具体如下:
S2.1:将步骤一获得的训练数据集P(x,y)归一化,即将其线性映射到(0,1)区间,得到新数据集
S2.2:鉴于中的样本不平衡性,首先采用T阈值下的K-means算法对负样本聚为K类,由此,训练集分为大小近似的K+1类,其中:
T=abnormal
K=math.ceil(normal/abnormal)
这里,abnormal、normal、math.ceil分别表示训练集的故障样本数、训练集的正常样本数,以及向上取整函数;
S2.3:将二分类标签y按照相应的类别映射为多分类标签其中[1,0,0,0,...,0]为第一类的标签,[0,1,0,0,...,0]为第二类的标签,[0,0,1,0,...,0]为第三类的标签,以此类推直到[0,0,0,0,...,1]为第K+1类的标签;第一类的标签为故障样本集的标签,第二类~第K+I类的标签为正常样本集的标签;至此,实现训练集预处理,预处理后的新训练集记为/>其中,/>表示归一化后的输入数据,/>为多分类标签,输入数据维数为m-1,标签维数为K+1;
S3:利用数据预处理后的新训练集建立分类模型,具体如下:
S3.1构建堆叠缺陷相关的自编码器,即SDAE,对新训练集进行有监督的预训练,以提取特征;
(1)分割为输入数据/>和标签数据/>将/>作为第一层DAE的输入,经过隐藏层的非线性变换,得到编码器输出/>其中,f为激活函数;
(2)使H经过两个随机初始化后的解码器分别得到输入数据和标签数据的重构和/>
(3)通过最小化重构误差完成第一层DAE的训练,得到第一层DAE的权重和偏置参数;
(4)以第一层训练得到的编码器输出H作为第二层DAE的输入,执行和第一步相同的操作,完成第二层DAE的训练,得到第二层DAE的权重和偏置参数;以此类推,直到完成末层DAE的训练;将得到的每层DAE的权重和偏置参数用于构建堆叠缺陷相关的自编码器,达到逐层减少不相关的信息并从原始数据逐步聚焦与缺陷相关功能的目的;所述的训练集经过SDAE预训练,得到更新了输入数据后的训练集/>其中h为末层DAE编码器输出的特征;
S3.2:在特征h和标签数据之间搭建简易分类器,记录分类器的相关参数;
S4:在钢坯连铸过程中,通过专家经验知识实时获得一组有效的过程数据x∈R1×m,并将其进行归一化处理,映射到(0,1)区间;
S5:将归一化后的数据输入到SDAE中,利用已有的模型参数,逐层进行特征计算,第一层DAE输出/>作为第二层DAE输入,第二层DAE输出h2=f(h1·Wh2+bh2)作为第三层DAE输入,...,最终获得末层DAE输出h=f(hi-1·Whi+bhi)∈R1×q,其中q为末层DAE隐藏层节点数;
S6:将预训练后得到的h作为简易分类器的输入,得到预测的标签数据y∈R1×(K+1),将该一维数组中最大值所在的列,作为该样本所在的类,若类别属于第一类,预测结果判为该样本发生夹渣故障,反之判为正常。
进一步地,所述的S3.1的步骤(4)中,在得到每层DAE的权重和偏置参数后,将这些参数作为初始参数,建立2i+1层微调网络,其中i为SDAE堆叠层数,这里包含输入层输出层/>2i-1层隐藏层,输入层至第i层隐藏层的网络架构与SDAE一致,微调网络以第i层隐藏层为中心,两边呈现对称架构,第i层至第i+1层为末层DAE的重构输出,第i+1层至第i+2层为次末层DAE的重构输出,以此类推,直到微调网络的输出层/>以最小化重构误差来实现SDAE的微调,该参数将替代S3.1步骤(4)中的参数,作为SDAE预训练模型的最优参数。
进一步地,所述的S3.2中的简易分类器为三层BP神经网络,第一层为特征输入,中间层为隐藏层,末层为输出层。利用经过SDAE预训练后的新训练集对BP神经网络进行训练。训练规则如下:
隐藏层输出H=f(h·W1+b1),其中W1,b1分别是输入层到隐藏层的权重和偏置参数
末层输出Y=f(h·W2+b2),其中W2,b2分别是隐藏层到输出层的权重和偏置参数
由于神经网络输出Y和真实输出之间存在误差,将均方误差/>逆向反馈,以调整各层权重,经过多次迭代,最终使全部样本下的误差函数/>最小,至此完成BP神经网络的训练。
本发明的有益效果如下:
针对夹渣故障分类中的正负样本不平衡特点,本发明的方法在对占多数的正常样本集进行K-means聚类时,引入阈值T的限制,使获得的各类大小趋于一致,进一步提升样本的平衡度;针对训练样本中存在与缺陷不相关或相关性较小的信息,在数据预训练时采用了基于缺陷相关的堆叠自编码器特征提取方法,相比于无监督的自编码器,缺陷相关自编码器将训练集的缺陷信息也作为输入的一部分,参与神经网络的训练,指导神经网络提取潜在特征,并通过逐层堆叠的方式,减少不相关的信息,以提高后续分类准确性。
附图说明
图1是基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法的流程图;
图2是缺陷相关自编码器(DAE)的原理图;
图3是SDAE的微调过程图。
图4是钢坯连铸工艺过程图;
图5是随不平衡度变化的神经网络模型的预测输出结果图;
图6是T阈值K均值预处理相比其他预处理的优势图;
图7是SDAE预训练相比其他预训练的优势图。
具体实施方式
下面根据附图和优选实施例详细描述本发明,本发明的目的和效果将变得更加明白,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,包括如下步骤:
S1:收集钢坯连铸过程数据的一部分作为训练数据集P(x,y)∈Rn×m,其中包含输入数据x和与夹渣故障变量相关的二分类标签y,n表示样本个数,R表示实数集,输入数据维数为m-1,标签维数为1;所述的输入数据x包括发生故障的正样本和没有发生故障的负样本;
S2:对训练数据集P(x,y)进行预处理,具体如下:
S2.1:将步骤一获得的训练数据集P(x,y)归一化,即将其线性映射到(0,1)区间,得到新数据集
S2.2:鉴于中的样本不平衡性,首先采用T阈值下的K-means算法对负样本聚为K类,由此,训练集分为大小近似的K+1类,其中:
T=abnormal
K=math.ceil(normal/abnormal)
这里,abnormal、normal、math.ceil分别表示训练集的故障样本数、训练集的正常样本数,以及向上取整函数;
S2.3:将二分类标签y按照相应的类别映射为多分类标签其中[1,0,0,0,...,0]为第一类的标签,[0,1,0,0,...,0]为第二类的标签,[0,0,1,0,...,0]为第三类的标签,以此类推直到[0,0,0,0,...,1]为第K+1类的标签;第一类的标签为故障样本集的标签,第二类~第K+1类的标签为正常样本集的标签;至此,实现了训练集预处理,预处理后的新训练集记为/>其中,/>表示归一化后的输入数据,/>为多分类标签,输入数据维数为m-1,标签维数为K+1;
T阈值下的K-means算法面对工业流程中的不平衡数据集,仍有较好的分类性能。T阈值下的K-means算法提供了应对平衡数据集和不平衡数据集通用的方法,由于阈值T限定为占少数的故障样本的大小,从而确定了占大多数的正常样本集可以分割的类数,K和T的乘积大致为正常样本集的大小。
可以发现,当样本的平衡性较好时,该步预处理的存在不会阻碍后续的分类,一般情况下,K的计算结果都为1,即正常样本无需分割,自然地归为一类。当样本的平衡性较差,即正常样本数远大于故障样本数时,该分类经过阈值T=abnormal的限制,相比于普通的K-means算法而言,更有效地控制分割后样本集大小,针对性地解决不平衡问题。
S3:利用数据预处理后的新训练集建立分类模型,具体如下:
S3.1构建堆叠缺陷相关的自编码器,即SDAE,对新训练集进行有监督的预训练,以提取特征;
(1)分割为输入数据/>和标签数据/>将/>作为第一层DAE的输入,经过隐藏层的非线性变换,得到编码器输出/>其中,f为激活函数;
(2)使H经过两个随机初始化后的解码器分别得到输入数据和标签数据的重构和/>
(3)通过最小化重构误差完成第一层DAE的训练,得到第一层DAE的权重和偏置参数;
(4)以第一层训练得到的编码器输出H作为第二层DAE的输入,执行和第一步相同的操作,完成第二层DAE的训练,得到第二层DAE的权重和偏置参数;以此类推,直到完成末层DAE的训练;将得到的每层DAE的权重和偏置参数用于构建堆叠缺陷相关的自编码器,达到逐层减少不相关的信息并从原始数据逐步聚焦与缺陷相关功能的目的;如图2所示。所述的训练集经过SDAE预训练,得到更新了输入数据后的训练集/>其中h为末层DAE编码器输出的特征;
S3.2:在特征h和标签数据之间搭建简易分类器,记录分类器的权重参数W和偏置参数b;
作为其中一种实施方式,简易分类器为BPNN分类器,三层BP神经网络,第一层为特征输入,中间层为隐藏层,末层为输出层。利用经过SDAE预训练后的新训练集对BP神经网络进行训练。训练规则如下:
隐藏层输出H=f(h·W1+b1),其中W1,b1分别是输入层到隐藏层的权重和偏置参数末层输出Y=f(h·W2+b2),其中W2,b2分别是隐藏层到输出层的权重和偏置参数
由于神经网络输出Y和真实输出之间存在误差,将均方误差/>逆向反馈,以调整各层权重,经过多次迭代,最终使全部样本下的误差函数/>最小,至此完成BP神经网络的训练。
S4:在钢坯连铸过程中,通过专家经验知识实时获得一组有效的过程数据x∈R1×m,并将其进行归一化处理,映射到(0,1)区间;
S5:将归一化后的数据输入到SDAE中,利用已有的模型参数,逐层进行特征计算,第一层DAE输出/>作为第二层DAE输入,第二层DAE输出h2=f(h1·Wh2+bh2)作为第三层DAE输入,...,最终获得末层DAE输出h=f(hi-1·Whi+bhi)∈R1×q,其中q为末层DAE隐藏层节点数;
S6:将预训练后得到的h作为BPNN分类器的输入,得到预测的标签数据y∈R1×(K+1),将该一维数组中最大值所在的列,作为该样本所在的类,若类别属于第一类,预测结果判为该样本发生夹渣故障,反之判为正常。
为了进一步优化参数,在S3.1的步骤(4)中,在得到每层DAE的权重和偏置参数后,将这些参数作为初始参数,建立2i+1层微调网络,如图3所示,其中i为SDAE堆叠层数,这里包含输入层输出层/>2i-1层隐藏层,输入层至第i层隐藏层的网络架构与SDAE一致,微调网络以第i层隐藏层为中心,两边呈现对称架构,第i层至第i+1层为末层DAE的重构输出,第i+1层至第i+2层为次末层DAE的重构输出,以此类推,直到微调网络的输出层/>以最小化重构误差/>来实现SDAE的微调,该参数将替代S3.1步骤(4)中的参数,作为SDAE预训练模型的最优参数。
下面以一个具体的实施例验证本发明的方法的有益效果。
如图4所示,为钢坯连铸工艺过程图。工厂采集过程数据时,专家根据操作经验和过程机理知识选择了33个常规测量的过程变量,如表1所示。
表1:样本变量说明
标签 | 名称 | 标签 | 名称 |
U1 | 大包重量 | U18 | 结晶器冷却水流量(东) |
U2 | 大包温度 | U19 | 结晶器冷却水入口压力 |
U3 | 大包长水口密封氩气流量 | U20 | 结晶器冷却水出口压力(北) |
U4 | 大包长水口氩气密封压力 | U21 | 结晶器冷却水出口压力(南) |
U5 | 中间包重量 | U22 | 结晶器冷却水出口压力(西) |
U6 | 中间包温度 | U23 | 结晶器冷却水出口压力(东) |
U7 | 中间包(吹扫)氩气流量1 | U24 | 结晶器开度值实际值(北) |
U8 | 中间包(吹扫)氩气流量2 | U25 | 结晶器开度值实际值(南) |
U9 | 中间包(吹扫)氩气入口压力 | U26 | 结晶器开度值实际值(西) |
U10 | 结晶器冷却水进口温度 | U27 | 结晶器开度值实际值(东) |
U11 | 结晶器冷却水出口温度(北) | U28 | 拉速设定值 |
U12 | 结晶器冷却水出口温度(南) | U29 | 拉速实际值 |
U13 | 结晶器冷却水出口温度(西) | U30 | 上水口氩气流量(5升) |
U14 | 结晶器冷却水出口温度(东) | U31 | 上水口氩气压力 |
U15 | 结晶器冷却水流量(北) | U32 | 塞棒氩气流量 |
U16 | 结晶器冷却水流量(南) | U33 | 塞棒氩气背压 |
U17 | 结晶器冷却水流量(西) | Y | 样本标签 |
为考察正负样本的不平衡情况,从获取的不同钢种中,随机抽取10个钢种的训练样本集,计算不平衡度,发现绝大部分钢种数据都存在一定的不平衡性,小部分有相对严重的不平衡情况。由于在工艺过程中,钢坯初轧时小区域的夹渣,在经过精轧后,会随着钢体的展平,展开成大面积的夹渣,因此在样本集里,并没有出现其他工艺过程中可能存在的极度不平衡情况。
根据不同样本集的不平衡度从小到大的顺序,以四项评估指标为依据对模型性能进行测试,如图5所示。不平衡度越小,训练得到的模型效果越佳,并且在不平衡度10附近时,故障点召回率有所提升;其后,随着不平衡度的上升,模型性能逐渐变差,主要表现为F1值的下降。根据抽样显示,不平衡度小于15的占比约为80%,位于模型性能较好的参数附近;可见对于大部分钢种而言,本发明的基于SDAE的神经网络分类模型适用于夹渣故障检测。
该实施例分析比较了九种不同建模方法的性能。将数据集分别通过T阈值K均值算法、Smote算法进行数据预处理,随后通过堆叠缺陷相关的自编码器(SDAE)、堆叠自编码器(SAE)进行预训练,基于提取出的特征训练基于BP神经网络的分类器,以及不经过预处理、不经过预训练的简单分类方法等。通过对一不平衡度为11的样本集的实验分析不同预处理、不同预训练算法所构造的模型之间的预测性能,如表2所示。
表2:预测性能与九种不同建模方法的比较
网络类型 | Accuracy | Precision | Recall | F1 |
TK-SDAE-BPNN | 0.921 | 0.625 | 0.524 | 0.570 |
TK-SAE-BPNN | 0.926 | 0.618 | 0.500 | 0.553 |
TK-BPNN | 0.926 | 0.633 | 0.452 | 0.528 |
Smote-SDAE-BPNN | 0.916 | 0.535 | 0.548 | 0.541 |
Smote-SAE-BPNN | 0.920 | 0.568 | 0.500 | 0.532 |
Smote-BPNN | 0.907 | 0.488 | 0.500 | 0.494 |
SDAE-BPNN | 0.916 | 0.543 | 0.452 | 0.494 |
SAE-BPNN | 0.909 | 0.500 | 0.476 | 0.488 |
BPNN | 0.907 | 0.488 | 0.476 | 0.482 |
从一、二、三组网络类型的平行比较中(图6),发现T阈值下的K均值算法相较于Smote算法能够得到更高的准确率和精确率;相对而言,Smote预处理后建立的神经网络模型可以获得更高的召回率;但在分类问题的最关键衡量指标F1上,即认为召回率和精确率同样重要的前提下,T阈值K均值算法体现出更优性能。
分别从一、二、三组网络内部比较来看(图7),含有堆叠自编码器的网络相比于不含堆叠自编码器的网络在故障点召回率和F1上均有一定的提升,说明堆叠自编码器(SAE)可以通过降维来提取更优特征、减少无关信息、有效提升后续分类效果的特点。并且发现,有监督的堆叠自编码器相比于无监督自编码器而言,故障召回率和F1可以得到进一步提升,可见SAE虽然可以逐层减少无关的信息,但是并不能从原始样本的输出数据中学习到有效信息;这一点在SDAE中得到了改进,证实了带缺陷信息的标签对样本潜在特征提取的指导作用。
本领域普通技术人员可以理解,以上所述仅为发明的优选实例而已,并不用于限制发明,尽管参照前述实例对发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内,所做的修改、等同替换等均应包含在发明的保护范围之内。
Claims (3)
1.一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,其特征在于,该方法包括如下步骤:
S1:收集钢坯连铸过程数据的一部分作为训练数据集P(x,y)∈Rn×m,其中包含输入数据x和与夹渣故障变量相关的二分类标签y,n表示样本个数,R表示实数集,输入数据维数为m-1,标签维数为1;所述的输入数据x包括发生故障的正样本和没有发生故障的负样本;
S2:对训练数据集P(x,y)进行预处理,具体如下:
S2.1:将步骤一获得的训练数据集P(x,y)归一化,即将其线性映射到(0,1)区间,得到新数据集
S2.2:鉴于中的样本不平衡性,首先采用T阈值下的K-means算法对负样本聚为K类,由此,训练集分为大小近似的K+1类,其中:
T=abnormal
K=math.ceil(normal/abnormal)
这里,abnormal、normal、math.ceil分别表示训练集的故障样本数、训练集的正常样本数,以及向上取整函数;
S2.3:将二分类标签y按照相应的类别映射为多分类标签其中[1,0,0,0,...,0]为第一类的标签,[0,1,0,0,...,0]为第二类的标签,[0,0,1,0,...,0]为第三类的标签,以此类推直到[0,0,0,0,...,1]为第K+1类的标签;第一类的标签为故障样本集的标签,第二类~第K+1类的标签为正常样本集的标签;至此,实现训练集预处理,预处理后的新训练集记为/>其中,/>表示归一化后的输入数据,/>为多分类标签,输入数据维数为m-1,标签维数为K+1;
S3:利用数据预处理后的新训练集建立分类模型,具体如下:
S3.1构建堆叠缺陷相关的自编码器,即SDAE,对新训练集进行有监督的预训练,以提取特征;
(1)分割为输入数据/>和标签数据/>将/>作为第一层DAE的输入,经过隐藏层的非线性变换,得到编码器输出/>其中,f为激活函数;
(2)使H经过两个随机初始化后的解码器分别得到输入数据和标签数据的重构和/>
(3)通过最小化重构误差完成第一层DAE的训练,得到第一层DAE的权重和偏置参数;
(4)以第一层训练得到的编码器输出H作为第二层DAE的输入,执行和第一步相同的操作,完成第二层DAE的训练,得到第二层DAE的权重和偏置参数;以此类推,直到完成末层DAE的训练;将得到的每层DAE的权重和偏置参数用于构建堆叠缺陷相关的自编码器,达到逐层减少不相关的信息并从原始数据逐步聚焦与缺陷相关功能的目的;所述的训练集经过SDAE预训练,得到更新了输入数据后的训练集/>其中h为末层DAE编码器输出的特征;
S3.2:在特征h和标签数据之间搭建简易分类器,记录分类器的相关参数;
S4:在钢坯连铸过程中,通过专家经验知识实时获得一组有效的过程数据x∈R1×m,并将其进行归一化处理,映射到(0,1)区间;
S5:将归一化后的数据输入到SDAE中,利用已有的模型参数,逐层进行特征计算,第一层DAE输出/>作为第二层DAE输入,第二层DAE输出h2=f(h1·Wh2+bh2)作为第三层DAE输入,...,最终获得末层DAE输出h=f(hi-1·Whi+bhi)∈R1×q,其中q为末层DAE隐藏层节点数;
S6:将预训练后得到的h作为简易分类器的输入,得到预测的标签数据y∈R1×(K+1),将该一维数组中最大值所在的列,作为该样本所在的类,若类别属于第一类,预测结果判为该样本发生夹渣故障,反之判为正常。
2.根据权利要求1所述的基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,其特征在于,所述的S3.1的步骤(4)中,在得到每层DAE的权重和偏置参数后,将这些参数作为初始参数,建立2i+1层微调网络,其中i为SDAE堆叠层数,这里包含输入层输出层/>2i-1层隐藏层,输入层至第i层隐藏层的网络架构与SDAE一致,微调网络以第i层隐藏层为中心,两边呈现对称架构,第i层至第i+1层为末层DAE的重构输出,第i+1层至第i+2层为次末层DAE的重构输出,以此类推,直到微调网络的输出层/>以最小化重构误差来实现SDAE的微调,该参数将替代S3.1步骤(4)中的参数,作为SDAE预训练模型的最优参数。
3.根据权利要求1所述的基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法,其特征在于,所述的S3.2中的简易分类器为三层BP神经网络,第一层为特征输入,中间层为隐藏层,末层为输出层;利用经过SDAE预训练后的新训练集对BP神经网络进行训练;训练规则如下:
隐藏层输出H=f(h·W1+b1),其中W1,b1分别是输入层到隐藏层的权重和偏置参数
末层输出Y=f(h·W2+b2),其中W2,b2分别是隐藏层到输出层的权重和偏置参数
由于神经网络输出Y和真实输出之间存在误差,将均方误差/>逆向反馈,以调整各层权重,经过多次迭代,最终使全部样本下的误差函数/>最小,至此完成BP神经网络的训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010943916.6A CN112101445B (zh) | 2020-09-09 | 2020-09-09 | 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010943916.6A CN112101445B (zh) | 2020-09-09 | 2020-09-09 | 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101445A CN112101445A (zh) | 2020-12-18 |
CN112101445B true CN112101445B (zh) | 2023-11-28 |
Family
ID=73752278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010943916.6A Active CN112101445B (zh) | 2020-09-09 | 2020-09-09 | 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101445B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112869754B (zh) * | 2021-01-08 | 2022-06-14 | 浙江大学 | 一种脑机融合的神经信号测谎方法 |
CN112904810B (zh) * | 2021-01-13 | 2022-07-01 | 中南大学 | 基于有效特征选择的流程工业非线性过程监测方法 |
CN114210932B (zh) * | 2022-02-21 | 2022-04-22 | 龙口市和义机械配件有限公司 | 一种加快铁水流速的浇道优化结构及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101850410A (zh) * | 2010-06-22 | 2010-10-06 | 攀钢集团钢铁钒钛股份有限公司 | 一种基于神经网络的连铸漏钢预报方法 |
CN102343427A (zh) * | 2011-09-29 | 2012-02-08 | 天津理工大学 | 基于拉坯阻力的板坯连铸结晶器漏钢预报方法 |
WO2015158198A1 (zh) * | 2014-04-17 | 2015-10-22 | 北京泰乐德信息技术有限公司 | 一种基于神经网络自学习的故障识别方法及系统 |
CN107505837A (zh) * | 2017-07-07 | 2017-12-22 | 浙江大学 | 一种半监督神经网络模型及基于该模型的软测量建模方法 |
CN111476263A (zh) * | 2019-12-27 | 2020-07-31 | 江苏科技大学 | 基于sdae和改进gwo-svm的轴承缺陷识别方法 |
-
2020
- 2020-09-09 CN CN202010943916.6A patent/CN112101445B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101850410A (zh) * | 2010-06-22 | 2010-10-06 | 攀钢集团钢铁钒钛股份有限公司 | 一种基于神经网络的连铸漏钢预报方法 |
CN102343427A (zh) * | 2011-09-29 | 2012-02-08 | 天津理工大学 | 基于拉坯阻力的板坯连铸结晶器漏钢预报方法 |
WO2015158198A1 (zh) * | 2014-04-17 | 2015-10-22 | 北京泰乐德信息技术有限公司 | 一种基于神经网络自学习的故障识别方法及系统 |
CN107505837A (zh) * | 2017-07-07 | 2017-12-22 | 浙江大学 | 一种半监督神经网络模型及基于该模型的软测量建模方法 |
CN111476263A (zh) * | 2019-12-27 | 2020-07-31 | 江苏科技大学 | 基于sdae和改进gwo-svm的轴承缺陷识别方法 |
Non-Patent Citations (1)
Title |
---|
基于BP神经网络的大方坯质量在线预报模型;常运合;曾智;张家泉;何庆文;申景霞;张利平;钢铁;第46卷(第005期);33-37 * |
Also Published As
Publication number | Publication date |
---|---|
CN112101445A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101445B (zh) | 一种基于监督神经网络的连铸坯皮下夹渣缺陷实时预报方法 | |
CN111444940A (zh) | 风机关键部位故障诊断方法 | |
Wang et al. | Random convolutional neural network structure: An intelligent health monitoring scheme for diesel engines | |
CN113221441B (zh) | 一种电厂设备健康评估的方法及装置 | |
CN113505655B (zh) | 面向数字孪生系统的轴承故障智能诊断方法 | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
CN111353373A (zh) | 一种相关对齐域适应故障诊断方法 | |
CN113901977A (zh) | 一种基于深度学习的电力用户窃电识别方法及系统 | |
CN112904810B (zh) | 基于有效特征选择的流程工业非线性过程监测方法 | |
CN112504682A (zh) | 基于粒子群优化算法的底盘发动机故障诊断方法及系统 | |
CN111680712B (zh) | 基于日内相似时刻的变压器油温预测方法、装置及系统 | |
CN114548199A (zh) | 一种基于深度迁移网络的多传感器数据融合方法 | |
CN114298134A (zh) | 风电功率预测方法及装置、电子设备 | |
CN115793590A (zh) | 适用于系统安全运维的数据处理方法及平台 | |
CN115348074A (zh) | 深度时空混合的云数据中心网络流量实时检测方法 | |
CN116861232A (zh) | 基于dbn-ocsvm的空气质量数据异常检测模型 | |
CN116304941A (zh) | 一种基于多模型组合的海洋数据质量控制方法及装置 | |
CN116150687A (zh) | 一种基于多分类g-wlstsvm模型的流体管道泄漏识别方法 | |
CN115081514A (zh) | 一种数据不平衡情况下的工业设备故障识别方法 | |
Li et al. | Knowledge enhanced ensemble method for remaining useful life prediction under variable working conditions | |
CN115271186A (zh) | 一种基于延时因子和PSO RNN Attention模型的水库水位预测预警方法 | |
Yao et al. | Multi-step-ahead tool state monitoring using clustering feature-based recurrent fuzzy neural networks | |
Zhao et al. | Fault Diagnosis of Rolling Bearings based on GA-SVM model | |
CN110599460A (zh) | 基于混合卷积神经网络的地下管网检测评估云系统 | |
CN115288994B (zh) | 一种基于改进dcgan的压缩机异常状态检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |