CN113128124B - 基于改进神经网络的多牌号C-Mn钢力学性能预测方法 - Google Patents
基于改进神经网络的多牌号C-Mn钢力学性能预测方法 Download PDFInfo
- Publication number
- CN113128124B CN113128124B CN202110442000.7A CN202110442000A CN113128124B CN 113128124 B CN113128124 B CN 113128124B CN 202110442000 A CN202110442000 A CN 202110442000A CN 113128124 B CN113128124 B CN 113128124B
- Authority
- CN
- China
- Prior art keywords
- brnn
- model
- data
- steel
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 229910000831 Steel Inorganic materials 0.000 title claims abstract description 51
- 239000010959 steel Substances 0.000 title claims abstract description 51
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 20
- 238000004519 manufacturing process Methods 0.000 claims abstract description 32
- 230000008569 process Effects 0.000 claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000005096 rolling process Methods 0.000 claims abstract description 22
- 239000002245 particle Substances 0.000 claims description 58
- 210000002569 neuron Anatomy 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 20
- 238000005457 optimization Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 229910052717 sulfur Inorganic materials 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000010219 correlation analysis Methods 0.000 abstract description 5
- 238000005272 metallurgy Methods 0.000 abstract description 2
- 239000011572 manganese Substances 0.000 description 29
- 230000006870 function Effects 0.000 description 16
- 238000009826 distribution Methods 0.000 description 13
- 238000001816 cooling Methods 0.000 description 10
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 6
- 238000012417 linear regression Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 4
- 239000011651 chromium Substances 0.000 description 4
- 239000010949 copper Substances 0.000 description 4
- 239000010955 niobium Substances 0.000 description 4
- 229910052710 silicon Inorganic materials 0.000 description 4
- 239000010703 silicon Substances 0.000 description 4
- 239000010936 titanium Substances 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 2
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 229910052804 chromium Inorganic materials 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 229910052748 manganese Inorganic materials 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229910052759 nickel Inorganic materials 0.000 description 2
- 229910052758 niobium Inorganic materials 0.000 description 2
- GUCVJGMIXFAOAE-UHFFFAOYSA-N niobium atom Chemical compound [Nb] GUCVJGMIXFAOAE-UHFFFAOYSA-N 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229910052719 titanium Inorganic materials 0.000 description 2
- 229910052720 vanadium Inorganic materials 0.000 description 2
- LEONUFNNVUYDNQ-UHFFFAOYSA-N vanadium atom Chemical compound [V] LEONUFNNVUYDNQ-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 238000005098 hot rolling Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/04—Constraint-based CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Control Of Metal Rolling (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于改进神经网络的多牌号C‑Mn钢力学性能预测方法,首先采集多牌号C‑Mn钢在热连轧生产过程中的生产数据并进行数据处理,然后采用前向选择的相关性分析方法生成各力学性能的样本集,采用PSO算法对BRNN网络模型训练过程中的参数进行优化,通过选取多个牌号的C‑Mn钢生产数据,使数据样本中包含了更加全面的生产工艺信息,解决了单钢种生产工艺的数据无法包括全面的工艺信息的问题;通过采用数据处理和相关性分析方法,使数据更加稳定且更具规律性,并可以有效简化预测模型的结构;通过引入PSO算法对BRNN模型进行改进,解决了其存在的容易陷入局部最小值的问题,经过改进的神经网络具有良好的泛化能力,能够更客观地符合物理冶金学规律。
Description
技术领域
本发明属于钢铁工业生产和数据统计建模的交叉技术领域,特别涉及一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法。
背景技术
近年来,随着计算机技术的快速发展以及分布式控制系统在钢铁行业中的广泛应用,钢铁生产过程中产生的大量数据被采集并存储下来,这些数据综合反映了钢铁生产过程中各环节之间的内在联系,具有巨大的应用价值。但如何从这些大量的数据中挖掘出有用的信息以实现产品性能的精准预测以及稳定性控制,一直没有很好的解决。人工智能技术的兴起为工业数据挖掘提供了新的思路,利用人工智能技术实现热轧产品力学性能预测以及控制已经成为当前研究的热点。
其中,采用人工神经网络(Artificial Neural Networks,ANN)建立热轧带钢力学性能预测模型是当前常用的一种方法。但目前,现有技术中钢铁生产数据建模主要是采用单钢种进行建模,由于单钢种生产工艺的单一性,导致数据分布集中于轧钢工艺的设定目标值。这样选取的数据无法包括全面的工艺信息,导致模型适用性差;而且由于实际工业数据不可避免的存在数据冗余、异常值以及分布不均衡的问题,如果基于未经处理的数据建立预测模型,所建模型的预测精度难以达到理想状态;此外,钢铁生产数据建模多基于贝叶斯正则化方法的神经网络(Byesian Regularization Neural Networks,BRNN),BRNN模型在训练时采用Levenberg-Marguardt算法进行权值、阈值的更新优化,其在进行参数寻优时容易陷入局部最小点,导致算法最终寻找的参数往往不是最优参数,故模型的精度有待提高。
发明内容
针对现有技术的不足,本发明提出一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,该方法采集多牌号C-Mn钢在热连轧生产过程中的生产数据并进行数据处理,利用前向选择法选取出与力学性能相关性较高的参数构成数据集,并且引入粒子群算法(Partical Swarm Optimization,PSO)对BRNN模型进行改进,最终基于改进的神经网络建立了多牌号C-Mn钢的力学性能预测模型,达到热轧带钢力学性能高精度预测的目的。
一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,包括:
步骤1:采集多个牌号的C-Mn钢在热连轧生产过程中的生产数据;
步骤2:对采集到的生产数据进行数据处理;
步骤3:对于处理后的数据采用前向选择的相关性分析方法,筛选出与各力学性能相关性较高的前N个特征参数,将前N个特征参数对应的数据作为相应力学性能的样本集,所述力学性能包括屈服强度YS、抗拉强度TS和伸长率EL;
步骤4:将各力学性能的样本集划分为训练集和测试集,利用训练集对BRNN网络进行训练,训练过程中采用PSO算法对BRNN网络模型的权值和阈值进行优化,利用测试集对模型进行测试,得到每个力学性能对应的参数最优BRNN网络模型;
步骤5:利用参数最优BRNN网络模型对C-Mn钢的力学性能进行预测。
所述步骤2中数据处理包括:填充空缺值、层次聚类、异常值剔除、数据归一化处理以及数据均衡化处理。
所述步骤4包括:
步骤4.1:初始化PSO算法的参数;
步骤4.2:基于PSO算法利用训练集求解出最优权值和阈值,并赋值给BRNN网络模型,完成PSO优化过程。
所述步骤4.2包括:
步骤4.2.1:确定BRNN模型的网络结构,设置BRNN模型的隐藏层个数、隐藏层神经元个数以及超参数α与β;
步骤4.2.2:计算PSO算法中粒子维度p,根据BRNN模型的网络结构确定PSO算法中每个粒子的维度p,粒子维度p等于BRNN模型中所有权值和阈值数量的总和,即
p=(d+l'+1)q+l'
式中,d为输入层神经元个数,q为隐藏层神经元个数,l'为输出层神经元个数;
步骤4.2.3:随机产生一个包含S'个粒子的初始种群;
步骤4.2.4:计算各粒子的适应度函数值F(J),根据各粒子的适应度函数值,更新粒子个体最优位置pb以及全局最优位置gb;
式中,Mm'是第m’个样本的实测值;Pm'是第m’个样本经BRNN网络输出的预测值;M’为样本数;
步骤4.2.5:判断全局最优位置gb的适应度函数值是否低于期望误差或者网络训练是否已经达到最大迭代次数,如果满足条件,则进行步骤4.2.6,否则更新各粒子的位置和速度,执行步骤4.2.4;
步骤4.2.6:将全局最优位置gb进行解码,得到最优的权值和阈值,并赋值给BRNN模型;
步骤4.2.7:得到权值和阈值最优的BRNN模型后,利用测试集对模型进行测试,完成PSO优化过程。
本发明的有益效果是:
本发明提出了一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,构建训练样本集时选取多个牌号的C-Mn钢生产数据,使数据样本中包含了更加全面的生产工艺信息,解决了单钢种的生产工艺数据无法包括全面工艺信息的问题,有效提高了所建模型的适用性;采用填充空缺值、层次聚类、异常值剔除、数据归一化处理和数据均衡化处理的数据处理手段以及基于前向选择的相关性分析方法构建各力学性能的数据集,解决了实际工业数据存在数据冗余、异常值以及分布不均衡的问题,使数据更加稳定且呈现出合理的规律性,并且在保证模型精度的前提下有效简化了模型结构;引入粒子群算法对基于贝叶斯正则化方法的神经网络进行改进,解决了基于贝叶斯正则化方法的神经网络存在的容易陷入局部最小值的问题,并且经过改进的神经网络模型具有良好的泛化能力,能够反映出符合物理冶金学的规律。
附图说明
图1为本发明中基于改进神经网络的多牌号C-Mn钢力学性能预测方法流程图;
图2为本发明中生产数据处理流程图;
图3为本发明中前向选择流程图;
图4为本发明中前向选择中R2曲线图,其中(a)表示确定屈服强度的特征参数时前向选择过程中R2的趋势,(b)表示确定抗拉强度的特征参数时前向选择过程中R2的趋势,(c)表示确定伸长率的特征参数时前向选择过程中R2的趋势;
图5为本发明中利用PSO优化BRNN模型的流程图;
图6为本发明中PSO算法粒子移动位置示意图;
图7为本发明中BRNN模型隐藏层节点数搜索曲线图,其中(a)表示屈服强度对应的BRNN模型的隐藏层节点数搜索曲线图,(b)表示抗拉强度对应的BRNN模型的隐藏层节点数搜索曲线图,(c)表示伸长率对应的BRNN模型的隐藏层节点数搜索曲线图;
图8为本发明中BRNN和PSO-BRNN两种模型的R2值比较图;
图9为本发明中BRNN和PSO-BRNN两种模型在测试数据上的误差分布,其中,(a)是两种模型对屈服强度测试的误差分布;(b)是两种模型对抗拉强度测试的误差分布;(c)是两种模型对伸长率测试的误差分布。
具体实施方式
下面结合附图和具体实施实例对发明做进一步说明。
如图1所示,一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,包括:
步骤1:采集多个牌号的C-Mn钢在热连轧生产过程中一定时间段内的生产数据,所有生产数据构成一个二维数据集,同一钢卷号对应一组生产数据,每组生产数据中包含影响C-Mn钢力学性能的各参数,所述力学性能包括屈服强度YS、抗拉强度TS和伸长率EL;
对于热轧C-Mn钢来说,化学成分、工艺参数是直接影响力学性能的关键因素,此外还有外界环境、工况等也将对性能产生影响。本实施例中选择的影响C-Mn钢力学性能的生产数据一方面来自于C-Mn钢本身的各化学成分质量所占百分比,另一方面来自于C-Mn钢在热连轧生产过程中的工艺参数,其中化学成分包括碳C、硅Si、锰Mn、磷P、硫S、镍Ni、铬Cr、铜Cu、铝Al、铌Nb、钒V、钛Ti、氮N,工艺参数包括粗轧出口厚度(Rougth Delivery Height,RDH)、粗轧出口温度(Rougth Delivery Temperature,RDT)、精轧出口厚度(FinishDelivery Height,FDH)、精轧出口温度(Finish Delivery Temperature,FDT)、卷取温度(Coiling temperature,CT)、出炉温度(Soaking Re-furnace Temperature,SRT)、热卷箱内保温时间(t)、精轧后3机架的压下率(ε)、层流冷却平均冷速(Cooling Rate,CR)、冷却开始温度(Cooling Starting Temperature,CST)、冷却结束温度(Cooling EndingTemperature,CET)、轧辊辊径以及各道次的轧制力。
步骤2:对采集到的生产数据进行数据处理,所述数据处理包括填充空缺值、层次聚类、异常值剔除、数据归一化处理以及数据均衡化处理,处理过程如图2所示;
步骤2.1:填充空缺值,根据物理冶金原理确定出影响C-Mn钢力学性能的关键参数和非关键参数,得到影响C-Mn钢力学性能的关键参数,对于关键参数缺失的钢卷则直接剔除整卷钢卷对应的一组生产数据,除关键参数之外的生产数据则为非关键参数,对于非关键参数缺失的钢卷采用相邻两组样本数据中该参数的均值替代,所述关键参数包括碳C质量分数、硅Si质量分数、锰Mn质量分数、磷P质量分数、硫S质量分数、铌Nb质量分数、钛Ti质量分数、C-Mn钢在粗轧出口处的厚度和温度、C-Mn钢在精轧出口处的厚度和温度、C-Mn钢卷取时的温度、C-Mn钢在出炉口处的温度、C-Mn钢在热卷箱内保温的时间、精轧后3机架的压下率、层流冷却平均冷速、冷却开始温度以及冷却结束温度;所述非关键参数包括辊径、各道次轧制力、镍Ni质量分数、铬Cr质量分数、铜Cu质量分数、铝Al质量分数、钒V质量分数、氮N质量分数;
步骤2.2:层次聚类,针对钢铁工业大数据中的异常值和数据冗余问题,填充空缺值后的数据采用基于马氏距离的层次聚类方法对数据进行归纳分类,基于马氏距离的层次聚类是一种自下而上的分类过程,首先将各类参数中的每个样本数据当做一个初始的聚类簇,然后通过计算每两个聚类簇之间的马氏距离找到距离最近的两个聚类簇进行合并,从而实现数据的分类。马氏距离dM可以通过下式求出:
式中,x为两个对象的差值矩阵;为均值向量;Σ为协方差矩阵。
通过选择合适的聚类簇个数,本实例中预设的聚类簇个数为1000,可将样本数据集划分成不同的聚类簇,实现数据的分类。结合轧制工艺理论,当同一聚类簇中的关键成分、工艺参数相同或相近时,可认为是同一轧制规程生产的数据,从而实现统计学理论和轧制理论的结合。
步骤2.3:异常值剔除,在层次聚类的基础上,根据同一聚类簇中钢卷的个数选择不同的异常值剔除准则,即当聚类簇中样本数大于阈值30时,采用3σ准则剔除聚类簇中的异常值,否则,采用格拉布斯准则进行异常值剔除。在异常值剔除的基础上,同一聚类簇中的钢卷数据反映的信息认为是相同或相似,故在异常值剔除后,对同一聚类簇下各影响参数内的数据分别求和取均值,即同一聚类簇内所有影响参数的均值构成一组新的数据。
步骤2.4:数据归一化处理,设异常值剔除后的某类参数下的所有数据为Xi=(X1i,X2i,…,Xmi),数据归一化处理可以表示为:
式中,m为数据总个数,Xji表示第i类参数下的第j个数据。
步骤2.5:数据均衡化处理,数据分布的离散性使得模型在学习过程中容易忽略掉部分信息,采用数据均衡化处理可解决此问题,具体步为:将数据集分别按屈服强度、抗拉强度和伸长率分类,并划分成n个区间,则数据分布可表示为M={M1,M2,…,Mk,…,Mn}。设定X={X1,X2,…,Xk,…,Xn}为均衡化后的数据分布,调整因子为μ=[μ1,μ2,…,μk,…,μn],μ∈N+,k=1,2,…,n。Xk、Mk、μk之间的关系可以表示为Xk=μk·Mk。设Mmax表示那个区间中的最大频数,Mmax=max(M),则待优化目标函数定义为:
式中,μk的值可通过求解最小F值来获得。
表1示出了数据处理前后各参数的数据特征。可以看出,经过数据处理后,大部分参数标准差减小,数据更加稳定且数据在数量上有了较大的精简,其中YS表示屈服强度,TS表示抗拉强度,EL表示伸长率,w[C]表示碳的质量分数,w[Si]表示硅的质量分数,w[Mn]表示锰的质量分数,w[P]表示磷的质量分数,w[S]表示硫的质量分数,w[Si]表示硅的质量分数;
表1 C-Mn钢数据处理结果
步骤3:对于处理后的数据采用前向选择的相关性分析方法,筛选出与各力学性能相关性较高的前N个特征参数,将前N个特征参数对应的数据作为相应力学性能的样本集;
前向选择法(Forward Selection,FS)是当前常用的一种相关性分析方法,可从众多相关参数中筛选出与目标参数相关性最高的参数组合,其流程如图3所示。FS方法通过建立单个参数和目标参数之间的线性相关模型,根据回归模型的模型确定性系数R2来衡量该参数的相关程度。R2表示自变量对因变量的解释程度,R2越大表示两者之间的相关程度越高,否则,两者间的相关性越低。前向选择法的具体步:
(1)建立各参数和目标参数的回归模型
设模型输入参数为x,输出参数为y,其中输入参数x中包含n’个参数,则x和y之间线性回归模型可表示为:y=f(xi’),i’=1,2,…,n’。
(2)确定FS的首个特征xn’
根据输入参数和输出参数之间的回归模型,计算出各参数对应的模型的R2,选择R2值最高的参数作为FS的首个特征输入参数xn’。
(3)提取新的多元特征集,构建多元线性回归模型
将已确定的特征输入参数xi’分别和其他变量xm’结合,构建二元回归模型:y=f(xn’,xm’),m'=1,2,…,n’。计算各个回归模型的R2,选择R2值最高的参数组合,从而确定第二个特征输入参数。类似上述过程,构建多元回归模型,选择特征输入参数集合,直至满足要求。随着输入参数的增加,R2值一般是增大的,当下一个参数的引入,R2值的变化不明显,则可停止前向选择过程。
以屈服强度为例进行前向选择。首先根据所有钢卷的屈服强度值与任意参数下的所有数据构建该参数与屈服强度之间的线性回归模型,求解出各参数分别与屈服强度之间的线性回归模型后,计算出每个线性回归模型对应的模型确定性系数R2,将R2取最大时的参数作为相关性最强的第一个特征参数,在所有参数中选择出精轧出口厚度FDH与屈服强度之间的R2值最大,表明FDH与屈服强度之间的相关性最强,选择FDH作为第一个特征参数。
在FDH的基础上,继续添加其他影响因子,将FDH与其他各参数分别进行组合,计算屈服强度与各组合之间的二元回归模型,得到卷取温度CT与FDH的组合构建出的二元回归模型的R2值最小,表明FDH、CT与屈服强度之间的相关性最强,选择CT作为第二个特征参数。在FDH、CT的基础上,继续添加其他影响因子,计算得到的每个回归模型的R2值如表2所示,当构建到十二元的回归模型时,发现将热卷箱内保温时间t参数作为第十二个特征参数时计算得到的最小R2值增加幅度小于0.5%,继续添加其他参数,R2值基本不变,表明再继续补充其他参数与已选择的特征参数之间存在较强的耦合关系,继续添加将不会对最终的结果产生影响,可认为参数筛选过程结束。同理,依次完成抗拉强度以及伸长率的特征参数筛选。
表2前向选择过程中计算得到的R2值
图4示出了屈服强度、抗拉强度以及伸长率前向选择过程中R2值的变化趋势,可以看出随着参数的增加R2值是逐渐增大的。当引入下一个参数时,R2值增长幅度小于1%,可认为已筛选出重要参数,最终筛选结果见表3。
表3 FS所筛选的参数
基于贝叶斯正则化方法的神经网络通过在网络训练目标函数中引入代表网络结构复杂程度的约束项,从而可以保证模型在训练过程中不仅仅考虑到预测值和实测值之间的误差,同时也能够考虑到网络结构的复杂程度带来的影响,因而可有效地防止过拟合。
BRNN预测模型训练时采用的是Levenberg-Marguardt算法,此类算法通常从某初始解出发,根据负梯度方法迭代寻找最优参数值,在每次迭代过程中,通过计算当前点的梯度,根据梯度正负确定下一步的搜索方向。当前参数如果使得目标函数的梯度为0时,说明函数已达到局部最优点,迭代将停止,最优参数也随之确定。如果目标函数只有一个局部最优点,则该点就是全局最优点,然而,当目标函数存在多个局部最优点时,将不能保证寻找到的局部最优点就是全局最优点。此时,利用神经网络构建各力学性能的BRNN预测模型,其预测精度有待提高。为此,采用PSO算法(即粒子群算法)对BRNN网络参数进行优化,以寻找出最优网络参数,防止模型训练陷入局部最优解,从而提高模型预测精度。
PSO算法是通过模拟鸟群捕食行为而提出的一种智能优化算法,其核心思想是:每个粒子通过向个体最优和群体最优学习,不断调整自己的速度和位置,从而搜索到全局最优解,粒子移动轨迹如图6所示。故本实例利用PSO搜索BRNN模型的权值w、阈值b以改善BRNN预测模型的精度。
设由权值、阈值构成的目标优化问题的解是p维向量,根据PSO算法,在参数空间中随机分布S'个粒子,每个粒子包括p个属性,其中粒子数称为种群规模Sizepop(一般取值为20~40),其位置为xs=(xs1,xs2,…,xsp),s=1,2,…,S',速度为v=(vs1,vs2,…,vsp)。训练集实测值和预测值之间的均方根误差作为适应度函数值F(J),根据每一个粒子的F(J)值,更新粒子个体最优位置pb(Part best)以及全局最优位置gb(Global best)。粒子通过向个体最优和全局最优来更新自身的速度和位置,计算公式如下:
xs(τ+1)=xs(τ)+vs(τ) (5)
式中,c1、c2为学习因子,τ为迭代次数,w为惯性权重,vs(τ+1)为第τ+1次迭代时粒子的速度,w(τ)为第τ次迭代时的惯性权重,vs(τ)为第τ次迭代时粒子的速度,rand()为生成0到1之间随机数的函数,psb(τ)为第τ次迭代时粒子个体最优位置,gb(τ)为第τ次迭代时全局最优位置,xs(τ)为第τ次迭代时粒子的位置,xs(τ+1)为第τ+1次迭代时粒子的位置;式(4)中第一项为粒子的初始速度,第二项为粒子的速度增加量,第三项为粒子的学习进化。
惯性权重w表示当前粒子的运动惯性,w值越大,粒子的空间搜索能力越强,PSO算法的全局搜索能力增强;w值越小,粒子对下代粒子的影响越小,越有利于PSO算法的局部搜索。在此,采用下式对w值进行合理选择,保证PSO算法有全局搜索能力的同时可快速局部搜索到全局最小点。
式中,w(τ)表示第τ次迭代时的惯性权重,wmax、wmin表示惯性权重的最大值、最小值,τ为迭代次数,itermax表示最大迭代次数。
步骤4:将各力学性能的样本集划分为训练集和测试集,利用训练集对BRNN网络进行训练,训练过程中采用PSO算法对BRNN网络模型的权值和阈值进行优化,利用测试集对模型进行测试,得到每个力学性能对应的参数最优BRNN网络模型,利用PSO算法对BRNN模型进行参数优化的流程图如图5所示,得到的模型简称PSO-BRNN模型;包括:
步骤4.1:初始化PSO算法的参数;
在利用PSO算法对BRNN进行参数寻优时,首先需要确定PSO算法中的参数,这些参数的取值将影响到粒子的行动速度、探索能力,针对不同的力学性能预测模型,PSO算法的参数值如表4所示。
表4 PSO参数值
步骤4.2:基于PSO算法利用训练集求解出最优权值和阈值,并赋值给BRNN网络模型,完成PSO优化过程;包括:
步骤4.2.1:确定BRNN模型的网络结构,设置BRNN模型的隐藏层个数、隐藏层神经元个数以及超参数α与β;
这里设置超参数α=0、β=1,隐藏层个数为1,最优的隐藏层神经元个数由人工试凑法确定。以训练数据实测值和预测值的均方误差(MSE)作为模型精度度量标准,将相同的数据集分别输入含有1~18个隐藏层神经元的BRNN模型,其中获得最低MSE的BRNN模型效果最好,其隐藏层神经元个数即为最优的隐藏层神将元个数。屈服强度、抗拉强度和伸长率预测模型不同隐藏层神经元个数与MSE的关系如图7所示。从图7中可以看出:屈服强度对应的BRNN模型的隐藏层神经元个数应该设置为9;抗拉强度对应的BRNN模型的隐藏层神经元个数应该设置为8;伸长率对应的BRNN模型的隐藏层神经元个数应该设置为8。
步骤4.2.2:计算PSO算法中粒子维度p,根据BRNN模型的网络结构确定PSO算法中每个粒子的维度p,粒子维度p等于BRNN模型中所有权值和阈值数量的总和,即
p=(d+l'+1)q+l' (7)
式中,d为输入层神经元个数,q为隐藏层神经元个数,l'为输出层神经元个数;
步骤4.2.3:随机产生一个包含S'个粒子的初始种群,第s个粒子的速度为vs=(vs1,vs2,…,vsp),位置为:
式中,vs和xs分别代表第s个粒子的速度和位置,s=1,2,…,S';wk'h'代表第k'个输入层神经元与第h'个隐藏层神经元之间的连接权值,wh'j'代表第h'个隐藏层神经元与第j'个输出层神经元之间的连接权值,代表第h'个隐藏层神经元的阈值,/>代表第j'个输出层神经元的阈值,其中k'=1,2,…,d,h'=1,2,…,q,j'=1,2,…,l'。将各粒子的位置xs和vs分别在[-5,5]和[-1,1]的范围内进行随机初始化,从而产生一个由S'个粒子组成的初始种群;
步骤4.2.4:计算各粒子的适应度函数值,寻找当前粒子的个体最优与全局最优。选择训练集实测值和预测值之间的均方根误差(RMSE)作为适应度函数值F(J),F(J)如式(8)所示。首先将各粒子的初始位置xs'解码为权值和阈值赋予BRNN模型,然后把训练集的样本数据输入各BRNN模型,通过计算得到相应的输出,进一步得到各粒子的适应度函数值。根据各粒子的适应度函数值,更新粒子个体最优位置pb(Part best)以及全局最优位置gb(Global best)。
式中,Mm'是第m’个样本的实测值;Pm'是第m’个样本经BRNN网络输出的预测值;M’为样本数。
步骤4.2.5:判断全局最优位置gb的适应度函数值是否小于期望误差或者网络训练是否达到最大迭代次数,若果满足条件,则进行步骤4.2.6;否则根据公式(4)和(5)更新各粒子的位置和速度,再次执行步骤4.2.4完成BRNN模型训练过程中的一次迭代。
步骤4.2.6:将全局最优位置gb进行解码,得到最优的权值和阈值,并赋值给BRNN模型;
步骤4.2.7:得到权值和阈值最优的BRNN模型后,利用测试集对模型进行测试,完成PSO优化过程。
步骤5:利用参数最优BRNN网络模型对C-Mn钢的力学性能进行预测。
为保证结果的可比性,利用相同数据集中的数据作为对比实验的实验数据,以样本数据实测值和预测值的均方根误差(RMSE)和平均相对误差(AARE)作为模型精度的衡量指标。对比实验中的两个对比模型设置如下:(1)本发明提出的利用PSO算法优化BRNN网络结构参数进行建模,这种建模方法简称PSO-BRNN;(2)直接进行BRNN建模,即得到BRNN模型。采用实验数据依次完成上述对比模型的训练,利用所构建的模型对力学性能进行预测。
实验数据预测值和实测值之间的均方根误差和平均相对误差计算结果如表5所示,从表中可以看出BRNN模型经过粒子群算法优化后,屈服强度预测值和实测值的均方根误差由原来的22.65MPa降低到19.43MPa,平均相对误差由原来的0.062MPa降低到0.047MPa;抗拉强度预测值和实测值的均方根误差由原来的19.16MPa降低到16.12MPa,平均相对误差由原来的0.041MPa降低到0.029MPa;伸长率预测值和实测值的均方根误差由原来的9.58%降低到3.56%,平均相对误差由原来的0.139%降低到0.084%。
两种模型的确定性系数R2如图8所示,R2越大,代表预测值和实测值拟合程度越好,模型的精度也就越高。从图8中可以看出,本发明方法提供的PSO-BRNN模型的R2明显大于未经PSO优化的BRNN模型,即利用PSO优化的BRNN模型的预测精度高于未经PSO优化的BRNN模型。
表5不同模型预测结果对比
图9示出了两种模型在测试数据上的预测误差分布情况。从图9中可以看出,两种模型的预测误差都呈现正态分布的特征,但PSO-BRNN预测模型的误差明显较窄,集中在中间区域,即模型的预测误差较小。而未经PSO优化的BRNN模型的误差分布较宽,意味着模型的预测误差较大,这表明BRNN模型经过PSO算法优化后,网络参数的选择更加合理,模型预测精度得到了提高。
Claims (1)
1.一种基于改进神经网络的多牌号C-Mn钢力学性能预测方法,其特征在于,包括:
步骤1:采集多个牌号的C-Mn钢在热连轧生产过程中的生产数据;
步骤2:对采集到的生产数据进行数据处理;
步骤3:对于处理后的数据采用前向选择的相关性分析方法,筛选出与各力学性能相关性较高的前N个特征参数,将前N个特征参数对应的数据作为相应力学性能的样本集,所述力学性能包括屈服强度YS、抗拉强度TS和伸长率EL;
步骤4:将各力学性能的样本集划分为训练集和测试集,利用训练集对BRNN网络进行训练,训练过程中采用PSO算法对BRNN网络模型的权值和阈值进行优化,利用测试集对模型进行测试,得到每个力学性能对应的参数最优BRNN网络模型;
步骤5:利用参数最优BRNN网络模型对C-Mn钢的力学性能进行预测;
所述步骤2中数据处理包括:填充空缺值、层次聚类、异常值剔除、数据归一化处理以及数据均衡化处理;
所述步骤4包括:
步骤4.1:初始化PSO算法的参数;
步骤4.2:基于PSO算法利用训练集求解出最优权值和阈值,并赋值给BRNN网络模型,完成PSO优化过程;
所述步骤4.2包括:
步骤4.2.1:确定BRNN模型的网络结构,设置BRNN模型的隐藏层个数、隐藏层神经元个数以及超参数α与β;
步骤4.2.2:计算PSO算法中粒子维度p,根据BRNN模型的网络结构确定PSO算法中每个粒子的维度p,粒子维度p等于BRNN模型中所有权值和阈值数量的总和,即
p=(d+l'+1)q+l'
式中,d为输入层神经元个数,q为隐藏层神经元个数,l'为输出层神经元个数;
步骤4.2.3:随机产生一个包含S'个粒子的初始种群;
步骤4.2.4:计算各粒子的适应度函数值F(J),根据各粒子的适应度函数值,更新粒子个体最优位置pb以及全局最优位置gb;
式中,Mm'是第m’个样本的实测值;Pm'是第m’个样本经BRNN网络输出的预测值;M’为样本数;
步骤4.2.5:判断全局最优位置gb的适应度函数值是否低于期望误差或者网络训练是否已经达到最大迭代次数,如果满足条件,则进行步骤4.2.6,否则更新各粒子的位置和速度,执行步骤4.2.4;
步骤4.2.6:将全局最优位置gb进行解码,得到最优的权值和阈值,并赋值给BRNN模型;
步骤4.2.7:得到权值和阈值最优的BRNN模型后,利用测试集对模型进行测试,完成PSO优化过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110442000.7A CN113128124B (zh) | 2021-04-23 | 2021-04-23 | 基于改进神经网络的多牌号C-Mn钢力学性能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110442000.7A CN113128124B (zh) | 2021-04-23 | 2021-04-23 | 基于改进神经网络的多牌号C-Mn钢力学性能预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113128124A CN113128124A (zh) | 2021-07-16 |
CN113128124B true CN113128124B (zh) | 2023-09-15 |
Family
ID=76779521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110442000.7A Active CN113128124B (zh) | 2021-04-23 | 2021-04-23 | 基于改进神经网络的多牌号C-Mn钢力学性能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113128124B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113936744B (zh) * | 2021-10-22 | 2024-03-29 | 兰州理工大学 | 热连轧流程生产钒微合金结构钢的在线性能预测方法及系统 |
CN114386325B (zh) * | 2021-12-27 | 2023-04-28 | 北京科技大学 | 一种基于规则寻优的带钢力学性能预报方法 |
CN117807424B (zh) * | 2024-02-29 | 2024-04-30 | 山东钢铁股份有限公司 | 工业大数据驱动的宽厚钢板质量动态在线识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740467A (zh) * | 2016-03-07 | 2016-07-06 | 东北大学 | 一种C-Mn钢工业大数据的挖掘方法 |
CN106503790A (zh) * | 2015-08-28 | 2017-03-15 | 余学飞 | 一种改进粒子群优化神经网络的压力导丝温度补偿方法 |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
-
2021
- 2021-04-23 CN CN202110442000.7A patent/CN113128124B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503790A (zh) * | 2015-08-28 | 2017-03-15 | 余学飞 | 一种改进粒子群优化神经网络的压力导丝温度补偿方法 |
CN105740467A (zh) * | 2016-03-07 | 2016-07-06 | 东北大学 | 一种C-Mn钢工业大数据的挖掘方法 |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
改进的新BRNN网络集成及其二级结构预测的研究;林丽玉;黄高昂;左瑞娟;;计算机与应用化学(第08期);65-68 * |
热轧C-Mn钢工业大数据预处理对模型的改进作用;吴思炜;周晓光;曹光明;史乃安;刘振宇;王国栋;;钢铁(第05期);93-99+105 * |
Also Published As
Publication number | Publication date |
---|---|
CN113128124A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113128124B (zh) | 基于改进神经网络的多牌号C-Mn钢力学性能预测方法 | |
Kuo et al. | Integration of particle swarm optimization and genetic algorithm for dynamic clustering | |
CN111353656B (zh) | 一种基于生产计划的钢铁企业氧气负荷预测方法 | |
CN107992976B (zh) | 热点话题早期发展趋势预测系统及预测方法 | |
CN109472088B (zh) | 一种页岩气调产井生产压力动态预测方法 | |
CN114678080B (zh) | 转炉终点磷含量预测模型及构建方法、磷含量预测方法 | |
CN104375478B (zh) | 一种轧钢生产过程产品质量在线预测与优化的方法及装置 | |
CN109472397B (zh) | 基于粘度变化的聚合工艺参数调节方法 | |
CN113330468A (zh) | 金属材料的设计支援方法、预测模型的生成方法、金属材料的制造方法以及设计支援装置 | |
CN114357852A (zh) | 一种基于长短期记忆神经网络和粒子群优化算法的分层注水优化方法 | |
CN111079926B (zh) | 基于深度学习的具有自适应学习率的设备故障诊断方法 | |
CN102722103A (zh) | 基于模糊分析和可视化技术的多目标参数寻优方法 | |
CN112987666A (zh) | 电厂机组运行优化调控方法及系统 | |
CN114897227A (zh) | 基于改进随机森林算法的多钢种力学性能预报方法 | |
GB2600213A (en) | Plate performance prediction method and apparatus | |
Tembusai et al. | K-nearest neighbor with K-fold cross validation and analytic hierarchy process on data classification | |
CN107274016A (zh) | 随机蛙跳算法优化对称极限学习机的带钢出口厚度预测方法 | |
CN110110447B (zh) | 一种混合蛙跳反馈极限学习机带钢厚度预测方法 | |
CN116070750A (zh) | 一种选矿日综合生产指标多目标鲁棒优化决策方法 | |
CN104732067A (zh) | 一种面向流程对象的工业过程建模预测方法 | |
Wang et al. | Reinforced quantum-behaved particle swarm-optimized neural network for cross-sectional distortion prediction of novel variable-diameter-die-formed metal bent tubes | |
Tian et al. | Dynamic operation optimization based on improved dynamic multi-objective dragonfly algorithm in continuous annealing process. | |
CN116689502A (zh) | 基于sa-scso-scn神经网络的热连轧厂精轧机组工艺的弯辊力参数设定方法 | |
CN116502455A (zh) | 一种激光选区熔化技术的工艺参数确定方法及系统 | |
CN116484745A (zh) | 物理冶金指导工业大数据挖掘的热轧低合金钢设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |