CN115481715A - 一种基于am-gru-bpnn的产品质量指标预测方法、系统 - Google Patents
一种基于am-gru-bpnn的产品质量指标预测方法、系统 Download PDFInfo
- Publication number
- CN115481715A CN115481715A CN202210966854.XA CN202210966854A CN115481715A CN 115481715 A CN115481715 A CN 115481715A CN 202210966854 A CN202210966854 A CN 202210966854A CN 115481715 A CN115481715 A CN 115481715A
- Authority
- CN
- China
- Prior art keywords
- gru
- data
- bpnn
- prediction model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 125
- 230000008569 process Effects 0.000 claims abstract description 69
- 238000012360 testing method Methods 0.000 claims abstract description 45
- 238000004519 manufacturing process Methods 0.000 claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 230000007246 mechanism Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 13
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 8
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000015654 memory Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000010835 comparative analysis Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000004445 quantitative analysis Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 abstract description 6
- 230000007547 defect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 235000004257 Cordia myxa Nutrition 0.000 description 1
- 244000157795 Cordia myxa Species 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于AM‑GRU‑BPNN的产品质量指标预测方法、系统。方法包括:收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;对样本数据集中的每组样本数据进行预处理;划分为训练集数据和测试集数据;构建AM‑GRU‑BPNN预测模型,对AM‑GRU‑BPNN预测模型进行训练,获得训练好的AM‑GRU‑BPNN预测模型;利用训练好的AM‑GRU‑BPNN预测模型对测试集数据进行测试。本发明有针对性地解决了流程制造行业产品质量预测难的问题,可提前预判缺陷和及时弥补缺陷,进而提高质量指标的预测精度,降低了企业成本,为实现流程生产过程精准预测与优化调控提供方法和途径。
Description
技术领域
本发明涉及一种基于AM-GRU-BPNN的产品质量指标预测方法、系统,属于时间序列预测技术领域。
背景技术
与传统的离散制造不同,流程式工业生产线中每一条工序的设备特性、工序配方、原材料属性以及控制参数等均与生产性能指标有着紧密联系。因此,如何将设备、物料、产品等生产要素实时数据进行交互与融合,实现系统内资源配置和运行的按需响应、快速迭代、动态优化,提升生产活动计划的预见性和联动性是重塑流程工业智能化生产模式的核心问题。因此有必要从解决智能制造环境下流程制造过程多工序耦合生产过程中全流程要素的自感知、自计算和自预测的瓶颈问题出发,以期在成品前就可以提前预测到产品质量问题,降低企业成本,为实现流程生产过程精准预测与优化调控提供方法和途径。
发明内容
本发明提供了一种基于AM-GRU-BPNN的产品质量指标预测方法、系统,以用于构建AM-GRU-BPNN模型实现流程制造生产线中产品质量指标的预测。
本发明的技术方案是:一种基于AM-GRU-BPNN的产品质量指标预测方法,包括:
收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;其中,工况数据包括工艺参数数据、质量指标数据;
对样本数据集中的每组样本数据进行预处理,获得无冗余数据;
依据比例按时间顺序,将无冗余数据划分为训练集数据和测试集数据;
构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型;其中,所述AM-GRU-BPNN预测模型包括时序注意力机制AM、门控循环单元网络预测模型GRU、BP神经网络预测模型;
利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果。
所述预处理包括:先对样本数据集中的样本数据中的空缺值进行均值填充,接着运用 3sigma准则对样本数据进行剔除;对经过3sigma准则判断的样本数据集进行归一化处理;基于信息熵将工艺参数对质量指标的影响进行量化分析,运用信息熵阈值实现对归一化数据的特征筛选,得到无冗余数据。
所述构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型,包括:
将t时刻的训练集数据与前一时刻的隐藏状态ht-1结合,作为时序注意力机制AM的输入,通过计算得到t时刻工况数据特征对应的工况数据权重将t时刻工况数据特征对应的工况数据权重与对应的工况数据特征相乘得到工况数据特征的关联特征xt';
门控循环单元网络预测模型GRU包括输入层、隐藏层、输出层,将时序注意力机制AM 的输出xt'作为门控循环单元网络预测模型GRU的输入,通过计算得到重构后的工况数据,将重构后的工况数据作为隐藏层的输入,通过更新t时刻的GRU隐藏层状态,得到处理后的滑动数据X'作为GRU的输出,得到T组滑动数据;
将门控循环单元网络预测模型GRU输出的滑动数据X'作为BP神经网络预测模型的输入,将t时刻BP神经网络预测模型的输入矩阵c1,c2,...,cT,将输入矩阵与引入的权重矩阵 W1,W2,...,WT结合,得到输出关联程度将输出关联程度与t时刻对应的BP神经网络预测模型输入矩阵相乘,得到工序权重θf;对f个工序的工序权重进行归一化,得到归一化工序权重将归一化工序权重视为一个神经元,连接全连接层网络并进行反向传播计算,对所述预设神经网络模型中的参数进行更新,得到训练好的AM-GRU-BPNN模型。
所述门控循环单元网络预测模型GRU隐藏层的神经元为64、20、50。
所述利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果,具体为:将训练好的AM-GRU-BPNN预测模型分别与其它模型在测试集数据上进行测试,获得预测结果,并对预测结果的评价指标进行对比分析。
所述其它模型为AM-GRU模型、GRU模型、LSTM模型、BPNN模型中的一种或者多种。
根据本发明的另一方面,还提供了一种多工序工艺参数的预测系统,包括:
收集模块,用于收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;其中,工况数据包括工艺参数数据、质量指标数据;
第一获得模块,用于对样本数据集中的每组样本数据进行预处理,获得无冗余数据;
划分模块,用于依据比例按时间顺序,将无冗余数据划分为训练集数据和测试集数据;
训练模块,用于构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型;其中,所述AM-GRU-BPNN预测模型包括时序注意力机制AM、门控循环单元网络预测模型GRU、BP神经网络预测模型;
第二获得模块,利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果。
根据本发明的另一方面,还提供了一种终端设备,包括存储器、处理器以及存储在所述存储器上并可被所述处理器运行的程序,所述处理器执行所述程序时实现上述中任意一项所述的基于AM-GRU-BPNN的产品质量指标预测方法。
根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的基于AM-GRU-BPNN的产品质量指标预测方法。
本发明的有益效果是:本发明有针对性地解决了流程制造行业产品质量预测难的问题,也就是在成品前就可以提前预测到产品质量问题,即可提前预判缺陷和及时弥补缺陷,进而提高质量指标的预测精度,降低了企业成本,为实现流程生产过程精准预测与优化调控提供方法和途径。
具体地:本发明对样本数据进行了预处理,其中包括对样本数据进行填充和剔除、归一化处理、特征筛选。通过对样本数据进行填充和剔除,可以使得样本数据更稳定,为后续构建高精准预测模型奠定了基础;归一化处理,将数据转换至0~1之间,节约了计算资源,加快了神经网络的收敛速度;通过信息熵将工艺参数对质量指标的影响进行量化分析,实现对高维工艺参数的特征筛选,解决了生产过程中对工艺参数特征存在高维时序性的特征提取问题;本发明为工艺参数特征引入时序注意力机制,通过对工艺参数特征向量进行注意力权重的分配,实现工艺参数时序数据的自主处理,解决了循环神经网络的短期记忆问题;通过增加GRU网络单元来增加模型的深度有助于提高模型的预测能力;再进一步配合BPNN模型得到工序权重加强了工艺参数的时序信息对质量指标输出的表达,提高了质量预测模型的稳定性。
附图说明
图1是本发明的流程示意图;
图2为本发明时序注意力机制AM的内部单元结构图;
图3为本发明门控循环单元网络GRU的内部单元结构图;
图4为本发明BPNN的内部单元结构图;
图5为本发明实施例中采用AM-GRU-BPNN模型在测试集上对质量指标进行预测的预测值曲线与实际值曲线对比示意图。
具体实施方式
下面结合附图和实施例,对发明做进一步的说明,但本发明的内容并不限于所述范围。
实施例1:如图1-5所示,一种基于AM-GRU-BPNN的产品质量指标预测方法,包括:
收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;其中,工况数据包括工艺参数数据、质量指标数据;
对样本数据集中的每组样本数据进行预处理,获得无冗余数据;通过对样本数据进行预处理,可以使得样本数据更稳定;而采用稳定的样本数据为后续构建高精准预测模型奠定基础。
依据比例按时间顺序,将无冗余数据划分为训练集数据Train=(Xtrain,Ytrain)和测试集数据Test=(Xtest,Ytest);其中,训练集数据Train=(Xtrain,Ytrain),对于每一组训练集数据由 {x(1),x(2),…,x(n)}构成,即n-1维工艺参数数据和1维质量指标数据,即一组训练集数据共n 维;
构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型;其中,所述AM-GRU-BPNN预测模型包括时序注意力机制AM、门控循环单元网络预测模型GRU、BP神经网络预测模型;
利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果。
进一步地,可以设置所述预处理包括:先对样本数据集中的样本数据中的空缺值进行均值填充,接着运用3sigma准则对样本数据进行剔除;对经过3sigma准则判断的样本数据集进行归一化处理;基于信息熵将工艺参数对质量指标的影响进行量化分析,运用信息熵阈值实现对归一化数据的特征筛选,得到无冗余数据。
具体而言,所述归一化处理指将样本数据映射到[0,1]之间,其归一化的公式如下:
式中:xi*表示归一化后的数据;xmax、xmin分别表示样本数据集中归一化之前的样本数据的最大值、最小值;xi表示原始样本数据;
所述信息熵计算公式如下:
式中:I(X;Y)表示工艺参数X和质量指标Y之间的信息熵;p(x)、p(y)分别表示工艺参数 X、质量指标Y的边际密度函数;p(x,y)表示工艺参数X和质量指标Y的联合概率密度函数;熵值越大表明两者相关性越强;
进一步地,如图2-图4所示,所述构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN 预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型,包括:
将t时刻的训练集数据与前一时刻的隐藏状态ht-1结合,作为时序注意力机制AM的输入,通过计算得到t时刻工况数据特征对应的工况数据权重将t时刻工况数据特征对应的工况数据权重与对应的工况数据特征相乘得到工况数据特征的关联特征xt',AM输出网络单元记为fGRU1;其中,通过不断地对关联特征xt'进行迭代,可以保证每个时刻的隐层状态ht都包含了关联特征xt';
门控循环单元网络预测模型GRU包括输入层、隐藏层、输出层,将时序注意力机制AM 的输出xt'作为门控循环单元网络预测模型GRU的输入,对网络单元fGRU1进行计算得到重构后的工况数据,将重构后的工况数据作为隐藏层的输入,通过更新t时刻的GRU隐藏层状态,得到处理后的滑动数据X'作为GRU的输出,得到T组滑动数据,GRU输出网络单元记为fGRU2;其中输入层的神经元为26,隐藏层的神经元为64、20、50;经实验,通过设置隐藏层的神经元为64、20、50,可以使得计算速度更快,同时可以防止过拟合。
将门控循环单元网络预测模型GRU输出的滑动数据X'作为BP神经网络预测模型的输入,将t时刻BP神经网络预测模型的输入矩阵c1,c2,...,cT,cT=fGRU2(cT-1,X'),将输入矩阵与引入的权重矩阵W1,W2,...,WT结合,得到输出关联程度将输出关联程度与t时刻对应的BP神经网络预测模型输入矩阵相乘,得到工序权重θf;对f个工序的工序权重进行归一化,得到归一化工序权重将归一化工序权重视为一个神经元,连接全连接层网络并进行反向传播计算,对所述预设神经网络模型中的参数进行更新,得到训练好的AM-GRU-BPNN模型。
具体而言,本发明的AM-GRU-BPNN预测模型,先引入AM使得模型能更深层次的提取数据特征,提高模型的预测精度;根据BPNN的特性放在GRU的后面:一个是根据多工序的特点,更贴合实际工艺的表达;另外更加突出BPNN连接全连接层的优势,使整个模型的计算更高效。
进一步地,所述工况数据权重计算公式如下:
式中:表示t时刻第n个工况数据特征对应的工况数据权重;Wt (n)表示第n个工况数据特征对应的权重矩阵;ht-1表示工况数据特征t时刻时前一时刻的隐层状态;Bt表示t时刻工况数据特征对应的偏差项;Selu表示激活函数;
所述关联特征的计算公式如下:
所述不断对关联特征进行迭代的计算公式如下:
ht=fGRU1(ht-1,x't)
式中:ht表示t时刻AM的隐层状态;x't表示工况数据特征的关联特征;fGRU1表示门控循环单元网络预测模型GRU的输入侧网络单元;
所述GRU训练计算公式如下:
rt=Sigmoid(Wxzxt+Whzh't-1+br)
zt=Sigmoid(Wxzxt+Whzh't-1+bz)
X'=σ(Whoh't+by)
式中:rt表示重置门;Zt表示更新门;表示隐藏门;σ表示激活函数Sigmoid;Wxz表示 GRU网络输入层与Zt计算权重;Wxh表示t时刻GRU网络输入层与rt计算权重;Whz表示隐藏层t-1时刻与Zt计算权重;Whr表示隐藏层t-1时刻与rt计算权重;Who表示隐藏层t时刻与 GRU网络输出层计算权重,bh表示t时刻GRU网络隐藏层计算偏置,by表示t时刻GRU网络输出层计算偏置。
所述反向传播计算公式如下:
进一步地,可以设置所述利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果,具体为:将训练好的AM-GRU-BPNN预测模型分别与其它模型在测试集数据上进行测试,获得预测结果,并对预测结果的评价指标进行对比分析。
进一步地,可以设置所述其它模型为AM-GRU模型、GRU模型、LSTM模型、BPNN 模型中的一种或者多种。
具体而言,所述预测结果使用平均绝对误差MAE、均平方误差MSE、拟合优度R2的计算公式如下:
式中:m表示测试数据集的样本容量;和yj表示第j时刻质量指标的实际值和预测值;表示预测值样本与实际值的平均值,其中j=1,2,…,m;其中MAE和MSE数值越小、R2的值越接近1,表示拟合优度越大,模型预测结果越准确。
示例性地,下面对本发明一种可选的实施方式进行详细说明,但本发明的内容并不限于所述范围。
本实施例针对流程型制造中多工序数据的高维、时序和耦合特征,且现有的机器学习预测方法存在依据经验选取关键参数的不足,提出了一种基于AM-GRU-BPNN的智能多工序工艺参数关联预测方法。首先采用互信息方法对多态异构生产数据进行筛选作为输入,并构造成时间序列输入到注意力机制-门控循环单元网络-BP神经网络预测模型进行训练计算,最后完成出料含水率质量指标预测。
样本数据集使用某流程制造企业的制丝生产线2021年9月7日至2021年9月14日,数据采集周期为15s,共2432组样本数据构成的样本数据集,每组样本数据由72维工艺参数数据和1维质量指标数据构成;对样本数据集中的每组样本数据进行预处理,剔除了432组样本数据,再基于信息熵将工艺参数对质量指标的影响进行量化分析,确定信息熵阈值为0.25,选择信息熵大于0.25的工艺参数,由此得到25维工艺参数特征,实现了对高维工艺参数的特征筛选,最后获得2000组由25维工艺参数和1维质量指标数据构成的样本数据。按8:2的比例分配,使用数据集后400组作为20%的测试集,使用上述样本数据在不同模型下进行预测,验证本发明提出的基于AM-GRU-BPNN的智能多工序工艺参数关联预测方法。
通过训练集数据进行训练得到注意力机制-门控循环单元网络-BP神经网络预测方法构建的预测模型,模型参数的设置如表1所示。
表1注意力机制-门控循环单元网络-BP神经网络模型的参数
参数 | 数值(层) |
维度 | 26 |
时序注意力机制神经元 | 26 |
GRU输入神经元 | 26 |
GRU隐藏层神经元 | 64、20、50 |
BPNN输入层神经元 | 6 |
BPNN输出层神经元 | 1 |
结合评价指标,将本发明所提出的AM-GRU-BPNN模型与AM-GRU模型、GRU模型、LSTM模型、BPNN模型进行质量指标的出料含水率预测,评价指标如表2所示。即将训练好的AM-GRU-BPNN模型分别与AM-GRU模型、GRU模型、LSTM模型、BPNN模型在测试集数据Test=(Xtest,Ytest)上进行测试,并预测未来400个时刻的质量指标值,然后计算测试结果的MAE、MSE和R2值,将各模型的这三个评价指标进行对比分析。分析可知:本发明所提出的AM-GRU-BPNN方法相比于AM-GRU、GRU、LSTM、BPNN预测模型相比, MAE指标分别降低了1.11%、1.62%、2.6%、0.64%,MSE指标分别降低了1.16%、1.51%、 0.18%、0.94%,说明了AM-GRU-BPNN模型在处理时间序列问题方面有着更好的预测效果,体现出了引入注意力机制的必要性,有效提高了模型对生产工艺参数复杂特征提取的能力。最后量化分析5种预测模型的效果,由决定系数R2的计算结果可知:本发明所提的 AM-GRU-BPNN预测模型的R2值为0.9717,最接近于1,即模型预测效果最好。
表2不同预测模型对比
预测模型 | MAE/% | MSE/% | R<sup>2</sup> |
AM-GRU-BPNN | 1.43 | 0.07 | 0.9717 |
AM-GRU | 2.54 | 1.23 | 0.9313 |
GRU | 3.05 | 1.58 | 0.9047 |
LSTM | 4.03 | 0.25 | 0.9158 |
BPNN | 2.07 | 1.01 | 0.9425 |
本发明提出的一种注意力机制-门控循环单元网络-BP神经网络(AM-GRU-BPNN)模型预测的出料含水率质量指标与实际值的变化曲线如图5所示,从图中可以看出本发明所提出的AM-GRU-BPNN模型预测精度最高,对实际出料含水量质量指标有着更好的拟合能力,与实际出料含水率变化趋势基本一致。
通过上述分析可知,为验证本发明方法的有效性,本实施例采用本发明方法 AM-GRU-BPNN模型分别与AM-GRU模型、GRU模型、LSTM模型、BPNN模型在同一数据的测试集上进行质量指标预测。结果表征,GRU模型与LSTM模型相比,GRU模型结构更为简单,提高了模型的计算能力和降低了计算成本;LSTM模型与BPNN模型相比,BPNN 模型很好的映射能力以及泛化能力,有助于提高模型的预测能力;AM-GRU模型与GRU模型相比,时序注意力机制AM实现对工艺参数数据的自主处理,充分提取工况数据特征,解决了现有技术中没有充分提取工艺参数特征从而导致预测精度不够的问题。因此, AM-GRU-BPNN模型能极大限度地发挥时序注意力机制AM、GRU模型和BPNN模型的优点,有效处理工艺参数与质量指标之间复杂关系,使模型参数达到最优,实现多工序的生产质量控制,提升生产线工艺质量参数的预测精度,使质量指标的预测结果具有很高的准确性。通过使用本发明方法能够有效挖掘变量特征,解决智能制造环境下流程制造过程多工序耦合生产过程中全流程要素的自感知、自计算和自预测的瓶颈问题,进而提高质量指标的预测精度,降低了企业成本,为实现流程生产过程精准预测与优化调控提供方法和途径。
实施例2:
根据本发明实施例的另一方面,还提供了提供了一种多工序工艺参数的预测系统,包括:
收集模块,用于收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;其中,工况数据包括工艺参数数据、质量指标数据;
第一获得模块,用于对样本数据集中的每组样本数据进行预处理,获得无冗余数据;
划分模块,用于依据比例按时间顺序,将无冗余数据划分为训练集数据和测试集数据;
训练模块,用于构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型;其中,所述AM-GRU-BPNN预测模型包括时序注意力机制AM、门控循环单元网络预测模型GRU、BP神经网络预测模型;
第二获得模块,利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;和/或,上述各个模块以任意组合的方式位于不同的处理器中。
实施例3:
根据本发明实施例的另一方面,还提供了一种终端设备,包括存储器、处理器以及存储在所述存储器上并可被所述处理器运行的程序,所述处理器执行所述程序时实现上述中任意一项所述的基于AM-GRU-BPNN的产品质量指标预测方法。
实施例4:
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的基于AM-GRU-BPNN的产品质量指标预测方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (9)
1.一种基于AM-GRU-BPNN的产品质量指标预测方法,其特征在于:包括:
收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;其中,工况数据包括工艺参数数据、质量指标数据;
对样本数据集中的每组样本数据进行预处理,获得无冗余数据;
依据比例按时间顺序,将无冗余数据划分为训练集数据和测试集数据;
构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型;其中,所述AM-GRU-BPNN预测模型包括时序注意力机制AM、门控循环单元网络预测模型GRU、BP神经网络预测模型;
利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果。
2.根据权利要求1所述的基于AM-GRU-BPNN的产品质量指标预测方法,其特征在于:所述预处理包括:先对样本数据集中的样本数据中的空缺值进行均值填充,接着运用3sigma准则对样本数据进行剔除;对经过3sigma准则判断的样本数据集进行归一化处理;基于信息熵将工艺参数对质量指标的影响进行量化分析,运用信息熵阈值实现对归一化数据的特征筛选,得到无冗余数据。
3.根据权利要求1所述的基于AM-GRU-BPNN的产品质量指标预测方法,其特征在于:所述构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型,包括:
将t时刻的训练集数据与前一时刻的隐藏状态ht-1结合,作为时序注意力机制AM的输入,通过计算得到t时刻工况数据特征对应的工况数据权重λt (1),λt (2),...,λt (n),将t时刻工况数据特征对应的工况数据权重与对应的工况数据特征相乘得到工况数据特征的关联特征xt';
门控循环单元网络预测模型GRU包括输入层、隐藏层、输出层,将时序注意力机制AM的输出xt'作为门控循环单元网络预测模型GRU的输入,通过计算得到重构后的工况数据,将重构后的工况数据作为隐藏层的输入,通过更新t时刻的GRU隐藏层状态,得到处理后的滑动数据X'作为GRU的输出,得到T组滑动数据;
4.根据权利要求3所述的基于AM-GRU-BPNN的产品质量指标预测方法,其特征在于:所述门控循环单元网络预测模型GRU隐藏层的神经元为64、20、50。
5.根据权利要求1所述的基于AM-GRU-BPNN的产品质量指标预测方法,其特征在于:所述利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果,具体为:将训练好的AM-GRU-BPNN预测模型分别与其它模型在测试集数据上进行测试,获得预测结果,并对预测结果的评价指标进行对比分析。
6.根据权利要求5所述的基于AM-GRU-BPNN的产品质量指标预测方法,其特征在于:所述其它模型为AM-GRU模型、GRU模型、LSTM模型、BPNN模型中的一种或者多种。
7.一种多工序工艺参数的预测系统,其特征在于:包括:
收集模块,用于收集流程制造生产线的多组来自多工序的工况数据作为样本数据集;其中,工况数据包括工艺参数数据、质量指标数据;
第一获得模块,用于对样本数据集中的每组样本数据进行预处理,获得无冗余数据;
划分模块,用于依据比例按时间顺序,将无冗余数据划分为训练集数据和测试集数据;
训练模块,用于构建AM-GRU-BPNN预测模型,对AM-GRU-BPNN预测模型进行训练,获得训练好的AM-GRU-BPNN预测模型;其中,所述AM-GRU-BPNN预测模型包括时序注意力机制AM、门控循环单元网络预测模型GRU、BP神经网络预测模型;
第二获得模块,利用训练好的AM-GRU-BPNN预测模型对测试集数据进行测试,获得预测结果。
8.一种终端设备,其特征在于:包括存储器、处理器以及存储在所述存储器上并可被所述处理器运行的程序,所述处理器执行所述程序时实现如权利要求1-6中任意一项所述的基于AM-GRU-BPNN的产品质量指标预测方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1-6中任意一项所述的基于AM-GRU-BPNN的产品质量指标预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210966854.XA CN115481715A (zh) | 2022-08-11 | 2022-08-11 | 一种基于am-gru-bpnn的产品质量指标预测方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210966854.XA CN115481715A (zh) | 2022-08-11 | 2022-08-11 | 一种基于am-gru-bpnn的产品质量指标预测方法、系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115481715A true CN115481715A (zh) | 2022-12-16 |
Family
ID=84422844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210966854.XA Pending CN115481715A (zh) | 2022-08-11 | 2022-08-11 | 一种基于am-gru-bpnn的产品质量指标预测方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115481715A (zh) |
-
2022
- 2022-08-11 CN CN202210966854.XA patent/CN115481715A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109060001B (zh) | 一种基于特征迁移学习的多工况过程软测量建模方法 | |
KR102139358B1 (ko) | 머신러닝 기반 플랫폼을 이용한 공정제어방법, 그를 수행하기 위한 컴퓨터 프로그램 매체 및 공정제어장치 | |
CN110135635B (zh) | 一种区域电力饱和负荷预测方法及系统 | |
CN111144552B (zh) | 一种粮食品质多指标预测方法及装置 | |
CN111126575A (zh) | 基于机器学习的气体传感器阵列混合气体检测方法及装置 | |
CN112000084B (zh) | 一种基于1d-cnn和gru-svm的控制器模块智能bit设计方法 | |
CN111768000A (zh) | 在线自适应微调深度学习的工业过程数据建模方法 | |
CN112613536A (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN115456460A (zh) | 一种制丝松散回潮工艺的多质量指标输出预测方法、系统 | |
CN107704883A (zh) | 一种菱镁矿矿石的品级的分类方法及系统 | |
CN105046323B (zh) | 一种正则化rbf网络多标签分类方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN114298134A (zh) | 风电功率预测方法及装置、电子设备 | |
CN109960146A (zh) | 提高软测量仪表模型预测精度的方法 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
CN113762078A (zh) | 基于vmd-cssa-lstm-mlr组合模型的湖泊tn预测方法 | |
CN111861002A (zh) | 基于数据驱动高斯学习技术的建筑物冷热负荷预测方法 | |
CN116933025A (zh) | 基于vmd与dbo-lstm-at的变压器顶层油温预测方法 | |
CN115481715A (zh) | 一种基于am-gru-bpnn的产品质量指标预测方法、系统 | |
CN116662925A (zh) | 一种基于加权稀疏神经网络工业过程软测量方法 | |
CN116341929A (zh) | 一种基于聚类和自适应梯度提升决策树的预测方法 | |
CN114492988A (zh) | 一种催化裂化过程的产品收率的预测方法及装置 | |
CN116089801A (zh) | 一种基于多重置信度的医疗数据缺失值修复的方法 | |
CN115952824A (zh) | 一种航空制造设备大数据故障诊断方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |