CN111258996B - 一种面向工业大数据的产品质量多源深度融合预报方法 - Google Patents
一种面向工业大数据的产品质量多源深度融合预报方法 Download PDFInfo
- Publication number
- CN111258996B CN111258996B CN202010040200.5A CN202010040200A CN111258996B CN 111258996 B CN111258996 B CN 111258996B CN 202010040200 A CN202010040200 A CN 202010040200A CN 111258996 B CN111258996 B CN 111258996B
- Authority
- CN
- China
- Prior art keywords
- data
- steel plate
- cnn
- dimensional
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 19
- 238000013277 forecasting method Methods 0.000 title claims abstract description 14
- 238000004519 manufacturing process Methods 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 11
- 238000013135 deep learning Methods 0.000 claims abstract description 9
- 238000009776 industrial production Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 239000002356 single layer Substances 0.000 claims abstract description 7
- 238000004140 cleaning Methods 0.000 claims abstract description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 60
- 229910000831 Steel Inorganic materials 0.000 claims description 38
- 239000010959 steel Substances 0.000 claims description 38
- 239000010410 layer Substances 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000005065 mining Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 4
- 239000000047 product Substances 0.000 description 29
- 239000012467 final product Substances 0.000 description 15
- 238000005096 rolling process Methods 0.000 description 6
- 238000001816 cooling Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种面向工业大数据的产品质量多源深度融合预报方法,涉及工业大数据处理与复杂工业智能建模技术领域。该方法首先收集实际工业现场中的生产数据,并进行数据清洗与数据预处理,统一样本的数据维度;将生产过程数据按照工业生产的实际工艺流程与数据特征分为不同的数据块,同时求取每个数据块与最终质量数据的相关系数;针对不同的数据块,分别设计特定的深度学习网络提取隐含在数据内部的特征信息;利用之前求取的相关系数,为各个数据块提取到的特征信息进行加权融合,并利用一个单层神经网络对产品质量进行预报。该方法通过一种特征融合的思想,将复杂工业过程中的多源异构数据进行深度融合,实现对产品质量的精确预报。
Description
技术领域
本发明涉及工业大数据处理与复杂工业智能建模技术领域,尤其涉及一种面向工业大数据的产品质量多源深度融合预报方法。
背景技术
近些年来,随着人工智能在理论与技术方面发展的越来越成熟,大数据的应用也越来越广泛,并且在医学,电子信息,图像识别等领域取得了相对较成熟的结果。作为一种分析大数据的有效手段,深度学习在近些年来受到越来越多人的关注,同时在各个领域中取得了突破性的成就。利用深度学习方法处理大数据的好处是,它能够利用有监督或者半监督的学习方法提取大数据中的有效特征,不需要人为手动提取特征。
尽管目前的深度学习方法能够有效的处理大数据中的高维数据,通过智能算法自动挖掘高维数据中的特征,然而目前的深度学习方法需要大量的统一维度的训练样本,这在实际应用中会产生许多困扰。
深度学习算法能够从大量的训练样本中发掘规律,但这要求所有样本的输入数据维度相同,然而现实中的数据往往难以保证具有统一的输入维度,尤其对于工业数据来说。复杂工业数据大多来源于多个传感器,数据存储格式因数据的来源不同而不同,因此样本的输入数据往往呈现出多源异构性,这对利用复杂工业大数据进行建模提出了挑战。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种面向工业大数据的产品质量多源深度融合预报方法,通过充分挖掘隐含在复杂工业大数据中的规律,对最终的产品质量进行预报。
为解决上述技术问题,本发明所采取的技术方案是:一种面向工业大数据的产品质量多源深度融合预报方法,包括以下步骤:
步骤1、采集实际工业现场中的多源异构生产数据作为样本数据,并存储到数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测试集;
步骤2、将采集到的样本数据利用数据清洗算法去除数据中的异常样本,同时利用数据补齐算法对输入数据进行数据预处理,使所有样本数据的维度统一;
步骤3、将步骤2处理过的多源异构数据根据工业生产的实际工艺流程与数据特征划分为不同的一维数据块、二维数据块和三维数据块,对不同的数据块分别求取均值,方差,最大值,最小值,用以表征该整体数据块的信息,将上述所有的统计量组合成一维统计指标向量,表示如下:
其中,分别表示第i个样本数据所在的第n个数据块的均值、方差、最大值和最小值;
计算所有样本数据的统计指标S={s1,s2,…,si}与最终的产品质量标签Y={y1,y2,…,yi}之间的最大互信息系数(Maximal Information Coefficient,即MIC),得到连续变量S与Y之间的相关系数,表示如下:
其中,分别为第n个数据块的均值、方差、最大值、最小值与最终的产品质量标签的最大互信息系数;
将每个数据块的均值、方差、最大值、最小值与最终的产品质量标签之间的最大互信息系数求和,得到不同数据块与最终产品质量之间的相关系数M={m1,m2,…,mn},其中,mn表示第n个数据块与最终产品质量之间的相关系数,即
步骤4、针对复杂工业过程中产生的不同数据块,分别使用不同的深度学习网络作为数据特征提取层,挖掘隐含在数据内部的特征;
针对一维数据块,采用LSTM网络提取数据特征,如下公式所示:
A(1)=fLSTM(I(1);θLSTM)
其中,I(1)表示输入到LSTM网络的一维数据,A(1)表示一维数据经过LSTM网络后提取到的特征,fLSTM(·)表示LSTM的网络结构,θLSTM表示LSTM中参数的集合;
针对二维数据块,采用Inception V4 CNN架构提取数据特征;去掉网络框架中的最后一层输出层,只保留其中的特征提取层,并利用二维数据对CNN模型进行训练,提取二维数据中的特征,如下公式所示:
A(2)=fCNN(I(2);θCNN)
其中,I(2)表示输入到CNN网络的二维数据,A(2)表示二维数据经过CNN网络后提取到的特征,fCNN(·)表示CNN的网络结构,θCNN表示CNN中参数的集合;
针对三维数据,采用3D卷积神经网络提取数据特征,如下公式所示:
A(3)=f3D-CNN(I(3);θ3D-CNN)
其中,I(3)表示输入到3D卷积神经网络的三维数据,A(3)表示三维数据经过3D-CNN网络后提取到的特征,f3D-CNN(·)表示3D卷积神经网络的网络结构,θ3D-CNN表示3D卷积神经网络中参数的集合;
步骤5、根据步骤3中计算得到的不同数据块与最终产品质量之间的相关系数,为步骤4中提取到的每个数据块中的数据特征分配权重,同时将加权后的数据特征进行融合,得到加权融合后的数据特征,如下公式所示:
其中,An表示第n个数据块通过相应的数据提取层后得到的数据特征向量,A′表示数据加权融合后的数据特征;
将加权融合后的数据特征输入到一个单层神经网络中,从数据特征中提取到生产过程数据中隐含的产品质量标签信息,如下公式所示:
Z=f(A′),Z∈R1×C
其中,f(·)表示一个单层的神经网络,C表示最终的产品质量标签数量,Z=[z1,z2,…,zC]表示从生产过程数据中提取到的产品质量标签信息,其中每个数值对应一个产品质量标签;
利用softmax函数将提取到的质量标签信息做空间归一化,得到最终的质量标签预测值其中,/>如下公式所示:
使用交叉熵损失函数计算质量标签预测值与真实标签y之间的损失,如下公式所示:
步骤6、利用步骤2中经过数据预处理后得到的产品数据,训练步骤3、步骤4、步骤5中建立起来的神经网络结构,得到产品质量的预报模型F,通过该预报模型利用工业生产过程中的多源异构数据预报出产品的质量。
采用上述技术方案所产生的有益效果在于:本发明提供的一种面向工业大数据的产品质量多源深度融合预报方法,能够有效的解决复杂工业生产过程中由于数据存储格式不同而导致的问题,能够有效的融合生产过程中产生的多源异构数据,进而建立产品质量的预报模型,相比于传统的建模方法,能够有效的利用隐含在多源异构数据中的信息,使模型的预报准确率更高,从而指导生产过程,降低产品的不合格率,提高生产效益。
附图说明
图1为本发明实施例提供的一种面向工业大数据的产品质量多源深度融合预报方法的流程图。
图2为本发明实施例提供的一种面向工业大数据的产品质量多源深度融合预报方法的过程示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以钢板生产过程为例,采用本发明的面向工业大数据的产品质量多源深度融合预报方法对钢板生产过程中的钢板板形质量进行预报。
一种面向工业大数据的产品质量多源深度融合预报方法,如图1和2所示,包括以下步骤:
步骤1、采集实际工业现场中的多源异构生产数据作为样本数据,并存储到关系型数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测试集;其中训练集样本数据用于训练模型,验证集样本数据用于在每一次迭代过程中验证模型的准确率,测试集样本数据不参与训练,在模型训练完成后测试模型的泛化能力;
本实施例中,从某厂钢板生产过程的历史数据库中选取近期的30000个钢板数据样本作为训练数据。将生产过程数据作为输入数据,将标识板形质量好坏的质量标签数据作为输出数据,利用该部分数据训练对板形质量进行预报的预报模型。
步骤2、将采集到的样本数据利用数据清洗算法去除数据中的异常样本,同时针对不同数据样本尺寸不同导致的数据维度的差异,利用数据补齐算法对输入数据进行数据预处理,在样本数据的周围添加零数据,使所有样本数据的维度统一;
对选取到的30000个钢板数据进行数据清洗与数据过滤,去除过程数据中的异常数据样本,得到剩余的28700个钢板数据。
步骤3、由于工业产品生产过程的复杂性,产品的输入数据往往是多源异构的,在生产过程中会产生一维指标数据,二维图像数据,三维时序数据等多个异构数据块,将步骤2处理过的多源异构数据根据工业生产的实际工艺流程与数据特征分为不同的一维数据块、二维数据块和三维数据块,对不同的数据块分别求取均值、方差、最大值和最小值,用以表征该整体数据块的信息,将上述所有的统计量组合成一维统计指标向量,表示如下:
其中,分别表示第i个样本数据所在的第n个数据块的均值、方差、最大值和最小值;
计算所有样本数据的统计指标S={s1,s2,…,si}与最终的产品质量标签Y={y1,y2,…,yi}之间的最大互信息系数(Maximal Information Coefficient,即MIC),得到连续变量S与Y之间的相关系数,表示如下:
其中,分别为第n个数据块的均值、方差、最大值、最小值与最终的产品质量标签的最大互信息系数;
最大互信息系数(MIC)用于度量两个连续型变量之间的相关性,它通过对连续型变量实施不等间隔的离散化寻优来挖掘非线性关联,并进一步通过标准化校正使得MIC(S,Y)∈[0,1]。首先将两个连续型变量S与Y化为散点图,并将变量S与Y分为ns与ny段,得到ns×ny个小方格,通过计算当前散点落入到每一个小方格上的概率,近似表示S与Y的联合概率分布;然后计算变量S与Y的互信息,表示如下:
其中,I(S;Y)表示变量S与Y的互信息,p(S,Y)表示在某一个小方格上变量S与Y的联合概率分布,p(S)和p(Y)分别表示在某一个小方格上,变量S与Y的概率分布;
则连续变量S与Y的最大互信息系数如下公式所示:
其中,MIC(S;Y)表示连续变量S与Y的最大互信息系数;
将每个数据块的均值、方差、最大值、最小值与最终的产品质量标签之间的最大互信息系数求和,得到不同数据块与最终产品质量之间的相关系数M={m1,m2,…,mn},其中,mn表示第n个数据块与最终产品质量之间的相关系数,即
钢板的生产过程要经过加热,轧制,冷却多个工序,其生产过程数据是典型的多源异构数据。本实施例中,根据钢板生产过程的实际工艺流程,将钢板生产过程数据按照数据维度的差异,分成不同的数据块,主要分为一维指标数据,二维图像数据,三维时序数据,如表1所示。
表1不同数据块对应的数据维度
序号 | 数据块名称 | 数据块维度 |
1 | 加热炉内温度的统计量 | 一维向量数据 |
2 | 加热炉的炉温数据 | 二维图像数据 |
3 | 加热炉出口处温度的统计量 | 一维向量数据 |
4 | 粗轧阶段轧辊的控制信息 | 三维时序数据 |
5 | 粗轧阶段钢板的输出指标信息 | 三维时序数据 |
6 | 精轧阶段轧辊的控制信息 | 三维时序数据 |
7 | 精轧阶段钢板的输出指标信息 | 三维时序数据 |
8 | 轧制结束后钢板的统计指标 | 一维向量数据 |
9 | 冷却开始前钢板的温度数据 | 二维图像数据 |
10 | 冷却过程中上导管的水流量数据 | 二维图像数据 |
11 | 冷却过程中下导管的水流量数据 | 二维图像数据 |
12 | 冷却结束后钢板的温度数据 | 二维图像数据 |
步骤4、针对复杂工业过程中产生的一维数据块,二维数据块和三维数据块,分别使用不同的深度学习网络作为数据特征提取层,挖掘隐含在数据内部的特征;
针对一维数据,采用LSTM网络提取数据特征,针对二维数据,采用卷积神经网络提取数据特征,针对三维数据,采用3D卷积神经网络提取数据特征,将上述的所有网络结构做并行处理,作为特征提取层的网络结构,如下公式所示:
A=fext(I;θext)
其中,fext(·)表示特征提取层的网络结构,θext表示特征提取层中的网络参数集,I表示具有多源异构特性的输入数据,A表示输入数据经过特征提取层后得到的特征向量。
针对一维数据块,采用LSTM网络提取数据特征,如下公式所示:
A(1)=fLSTM(I(1);θLSTM)
其中,I(1)表示输入到LSTM网络的一维数据,A(1)表示一维数据经过LSTM网络后提取到的特征,fLSTM(·)表示LSTM的网络结构,θLSTM表示LSTM中参数的集合;
LSTM网络是一种特殊形式的循环神经网络(RNN),相比于普通的RNN结构,LSTM网络加入了输入门限,遗忘门限和输出门限。遗忘门负责决定保留多少上一时刻的单元状态到当前时刻的单元状态;输入门负责决定保留多少当前时刻的输入到当前时刻的单元状态;输出门负责决定当前时刻的单元状态有多少输出。能够提取到更多的有效信息,并且能够避免梯度消失的问题。
针对二维数据块,采用Google的Inception V4 CNN架构提取数据特征;InceptionV4是Google的开源CNN模型,它基于大型图像数据库ImageNet的数据进行训练。本发明去掉网络框架中的最后一层输出层,只保留其中的特征提取层,并利用二维数据对CNN模型进行训练,提取二维数据中的特征,如下公式所示:
A(2)=fCNN(I(2);θCNN)
其中,I(2)表示输入到CNN网络的二维数据,A(2)表示二维数据经过CNN网络后提取到的特征,fCNN(·)表示CNN的网络结构,θCNN表示CNN中参数的集合;
针对三维时序数据,采用3D卷积神经网络提取数据特征,如下公式所示:
A(3)=f3D-CNN(I(3);θ3D-CNN)
其中,I(3)表示输入到3D卷积神经网络的三维数据,A(3)表示三维数据经过3D-CNN网络后提取到的特征,f3D-CNN(·)表示3D卷积神经网络的网络结构,θ3D-CNN表示3D卷积神经网络中参数的集合;
3D卷积最早是用于进行行为识别,普通的二维卷积神经网络只能识别静态的图像数据,无法有力的捕捉在时间维度上的信息,而3D卷积神经网络将二维卷积核进行扩展,形成一个立方体的三维卷积核,使得其能够在时间维度上捕捉数据的变化信息,适合对三维数据的特征提取,从而使得最终提取到的特征更加精确。
步骤5、根据步骤3中计算得到的不同数据块与最终产品质量之间的相关系数,为步骤4中提取到的每个数据块中的数据特征分配权重,同时将加权后的数据特征进行融合,得到加权融合后的数据特征,如下公式所示:
其中,An表示第n个数据块通过相应的数据提取层后得到的数据特征向量,A′表示数据加权融合后的数据特征;
将加权融合后的数据特征输入到一个单层神经网络中,从数据特征中提取到生产过程数据中隐含的产品质量标签信息,如下公式所示:
Z=f(A′),Z∈R1×C
其中,f(·)表示一个单层的神经网络,C表示最终的产品质量标签数量,Z=[z1,z2,…,zC]表示从生产过程数据中提取到的产品质量标签信息,其中每个数值对应一个产品质量标签;
利用softmax函数将提取到的质量标签信息做空间归一化,得到最终的质量标签预测值其中,/>如下公式所示:
使用交叉熵损失函数计算质量标签预测值与真实标签y之间的损失,如下公式所示:
步骤6、利用步骤2中经过数据预处理后得到的产品数据,训练步骤3、步骤4、步骤5中建立起来的神经网络结构,得到产品质量的预报模型F,通过该预报模型利用工业生产过程中的多源异构数据预报出产品的质量。
本实施例中,利用步骤2中经过数据预处理后得到的28700个钢板数据,训练上述步骤3-5中建立起来的神经网络结构,得到产品质量的预报模型F,将该预报模型投入到实际生产过程中,将每一块钢板的实际生产过程数据输入到该预报模型中,预报最终的钢板板形质量,进而通过预测结果指导生产过程,提高产品的合格率。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (3)
1.一种面向工业大数据的产品质量多源深度融合预报方法,其特征在于:包括以下步骤:
步骤1、采集实际工业现场中的多源异构钢板生产过程的生产数据作为样本数据,并存储到数据库;利用样本划分算法,将采集到的数据样本划分为训练集、验证集、测试集;
步骤2、将采集到的样本数据利用数据清洗算法去除数据中的异常样本,同时利用数据补齐算法对输入数据进行数据预处理,使所有样本数据的维度统一;
步骤3、将步骤2处理过的多源异构数据根据工业生产的实际工艺流程与数据特征分为不同的数据块,将每个数据块的均值、方差、最大值、最小值与最终的钢板板型质量标签之间的最大互信息系数求和,得到不同数据块与最终钢板板型质量之间的相关系数;
将采集到的生产过程中的多源异构数据根据工业生产的实际工艺流程与数据特征划分为一维数据块、二维数据块和三维数据块,对不同的数据块分别求取均值、方差、最大值和最小值,用以表征该数据块的信息,将上述所有的统计量组合成一维统计指标向量,表示如下:
其中,分别表示第i个样本数据所在的第n个数据块的均值、方差、最大值和最小值;
计算所有样本数据的统计指标S={s1,s2,…,si}与最终的钢板板型质量标签Y={y1,y2,…,yi}之间的最大互信息系数,得到连续变量S与Y之间的相关系数,表示如下:
其中,分别为第n个数据块的均值、方差、最大值、最小值与最终的钢板板型质量标签的最大互信息系数;
将每个数据块的均值、方差、最大值、最小值与最终的钢板板型质量标签之间的最大互信息系数求和,得到不同数据块与最终钢板板型质量之间的相关系数M={m1,m2,…,mn},其中,mn表示第n个数据块与最终钢板板型质量之间的相关系数,即
步骤4、针对复杂工业过程中产生的不同数据块,分别使用不同的深度学习网络作为数据特征提取层,挖掘隐含在数据内部的特征;
步骤5、根据步骤3中计算得到的不同数据块与最终钢板板型质量之间的相关系数,为步骤4中提取到的每个数据块中的数据特征分配权重,同时将加权后的数据特征进行融合,得到加权融合后的数据特征;将加权融合后的数据特征输入到一个单层神经网络中,从数据特征中提取到钢板生产过程数据中隐含的钢板板型质量标签信息;利用softmax函数将提取到的质量标签信息做空间归一化,得到最终的质量标签预测值;使用交叉熵损失函数计算质量标签预测值与真实标签之间的损失;
步骤6、利用步骤2中经过数据预处理后得到的钢板数据,训练步骤3、步骤4、步骤5中建立起来的神经网络结构,得到钢板板型质量的预报模型F,通过该预报模型利用工业生产过程中的多源异构数据预报出钢板板型质量。
2.根据权利要求1所述的一种面向工业大数据的产品质量多源深度融合预报方法,其特征在于:所述步骤4的具体方法为:
针对一维数据块,采用LSTM网络提取数据特征,如下公式所示:
A(1)=fLSTM(I(1);θLSTM)
其中,I(1)表示输入到LSTM网络的一维数据,A(1)表示一维数据经过LSTM网络后提取到的特征,fLSTM(·)表示LSTM的网络结构,θLSTM表示LSTM中参数的集合;
针对二维数据块,采用Inception V4 CNN架构提取数据特征;去掉网络框架中的最后一层输出层,只保留其中的特征提取层,并利用二维数据对CNN模型进行训练,提取二维数据中的特征,如下公式所示:
A(2)=fCNN(I(2);θCNN)
其中,I(2)表示输入到CNN网络的二维数据,A(2)表示二维数据经过CNN网络后提取到的特征,fCNN(·)表示CNN的网络结构,θCNN表示CNN中参数的集合;
针对三维数据,采用3D卷积神经网络提取数据特征,如下公式所示:
A(3)=f3D-CNN(I(3);θ3D-CNN)
其中,I(3)表示输入到3D卷积神经网络的三维数据,A(3)表示三维数据经过3D-CNN网络后提取到的特征,f3D-CNN(·)表示3D卷积神经网络的网络结构,θ3D-CNN表示3D卷积神经网络中参数的集合。
3.根据权利要求2所述的一种面向工业大数据的产品质量多源深度融合预报方法,其特征在于:步骤5所述得到的加权融合后的数据特征,如下公式所示:
其中,An表示第n个数据块通过相应的数据提取层后得到的数据特征向量,A′表示数据加权融合后的数据特征;
从数据特征中提取到生产过程数据中隐含的钢板板型质量标签信息,如下公式所示:
Z=f(A′),Z∈R1×C
其中,f(·)表示一个单层的神经网络,C表示最终的钢板板型质量标签数量,Z=[z1,z2,…,zC]表示从生产过程数据中提取到的钢板板型质量标签信息,其中每个数值对应一个钢板板型质量标签;
得到最终的钢板板型质量标签预测值其中,/>如下公式所示:
使用交叉熵损失函数计算质量标签预测值与真实标签y之间的损失,如下公式所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010040200.5A CN111258996B (zh) | 2020-01-15 | 2020-01-15 | 一种面向工业大数据的产品质量多源深度融合预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010040200.5A CN111258996B (zh) | 2020-01-15 | 2020-01-15 | 一种面向工业大数据的产品质量多源深度融合预报方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111258996A CN111258996A (zh) | 2020-06-09 |
CN111258996B true CN111258996B (zh) | 2023-09-01 |
Family
ID=70953129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010040200.5A Active CN111258996B (zh) | 2020-01-15 | 2020-01-15 | 一种面向工业大数据的产品质量多源深度融合预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111258996B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112069220B (zh) * | 2020-08-04 | 2023-11-10 | 扬州制汇互联信息技术有限公司 | 一种工业大数据平台快速查询方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118079A (zh) * | 2018-08-07 | 2019-01-01 | 山东纬横数据科技有限公司 | 一种制造业产品质量数据关联分析方法 |
CN110428175A (zh) * | 2019-08-05 | 2019-11-08 | 东北大学秦皇岛分校 | 一种基于深度学习的热轧带钢板凸度预报方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11501042B2 (en) * | 2014-03-24 | 2022-11-15 | Imagars Llc | Decisions with big data |
-
2020
- 2020-01-15 CN CN202010040200.5A patent/CN111258996B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109118079A (zh) * | 2018-08-07 | 2019-01-01 | 山东纬横数据科技有限公司 | 一种制造业产品质量数据关联分析方法 |
CN110428175A (zh) * | 2019-08-05 | 2019-11-08 | 东北大学秦皇岛分校 | 一种基于深度学习的热轧带钢板凸度预报方法 |
Non-Patent Citations (1)
Title |
---|
张洁 ; 高亮 ; 秦威 ; 吕佑龙 ; 李新宇 ; .大数据驱动的智能车间运行分析与决策方法体系.计算机集成制造系统.2016,(05),60-68. * |
Also Published As
Publication number | Publication date |
---|---|
CN111258996A (zh) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A new lightweight deep neural network for surface scratch detection | |
CN107967542B (zh) | 一种基于长短期记忆网络的售电量预测方法 | |
CN112381787A (zh) | 一种基于迁移学习的钢板表面缺陷的分类方法 | |
CN111695731B (zh) | 基于多源数据和混合神经网络的负荷预测方法、系统及设备 | |
CN107273924B (zh) | 基于模糊聚类分析的多数据融合的电厂故障诊断方法 | |
CN111258984B (zh) | 工业大数据环境下的产品质量端-边-云协同预报方法 | |
CN112396234A (zh) | 一种基于时域卷积神经网络的用户侧负荷概率预测方法 | |
CN113837859B (zh) | 一种小微企业画像构建方法 | |
CN109543693A (zh) | 基于正则化标签传播的弱标注数据降噪方法 | |
CN115147341A (zh) | 一种基于生物视觉启发的织物表面缺陷分类深度网络方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN114298134A (zh) | 风电功率预测方法及装置、电子设备 | |
CN112613542A (zh) | 一种基于双向lstm的企业除污设备负荷辨识方法 | |
CN117349583A (zh) | 用于低温液体储罐的智能检测方法及系统 | |
CN111258996B (zh) | 一种面向工业大数据的产品质量多源深度融合预报方法 | |
CN116956189A (zh) | 一种电流异常检测系统、方法、电子设备及介质 | |
CN115169453A (zh) | 基于密度聚类协同深度残差网络的热连轧宽度预测方法 | |
CN117315380B (zh) | 一种基于深度学习的肺炎ct图像分类方法及系统 | |
Ding et al. | A high-precision and transparent step-wise diagnostic framework for hot-rolled strip crown | |
Wu et al. | A novel GPR-based prediction model for strip crown in hot rolling by using the improved local outlier factor | |
Zhang et al. | Duak: Reinforcement learning-based knowledge graph reasoning for steel surface defect detection | |
CN116525135A (zh) | 基于气象因素的时空模型对疫情发展态势进行预测的方法 | |
CN115545342A (zh) | 一种企业电费回收的风险预测方法与系统 | |
Gong et al. | Short-term electricity price forecasting based on novel SVM using artificial fish swarm algorithm under deregulated power | |
He et al. | GA-based optimization of generative adversarial networks on stock price prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |