CN112439794B - 一种基于lstm的热轧弯辊力预测方法 - Google Patents

一种基于lstm的热轧弯辊力预测方法 Download PDF

Info

Publication number
CN112439794B
CN112439794B CN202011411870.XA CN202011411870A CN112439794B CN 112439794 B CN112439794 B CN 112439794B CN 202011411870 A CN202011411870 A CN 202011411870A CN 112439794 B CN112439794 B CN 112439794B
Authority
CN
China
Prior art keywords
network
lstm
data
output
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011411870.XA
Other languages
English (en)
Other versions
CN112439794A (zh
Inventor
李旭
栾峰
王琳
吴艳
韩月娇
张殿华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202011411870.XA priority Critical patent/CN112439794B/zh
Publication of CN112439794A publication Critical patent/CN112439794A/zh
Priority to US17/784,430 priority patent/US20230004781A1/en
Priority to PCT/CN2021/109203 priority patent/WO2022116571A1/zh
Application granted granted Critical
Publication of CN112439794B publication Critical patent/CN112439794B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B37/00Control devices or methods specially adapted for metal-rolling mills or the work produced thereby
    • B21B37/28Control of flatness or profile during rolling of strip, sheets or plates
    • B21B37/38Control of flatness or profile during rolling of strip, sheets or plates using roll bending
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B21MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
    • B21BROLLING OF METAL
    • B21B2269/00Roll bending or shifting
    • B21B2269/02Roll bending; vertical bending of rolls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Neurology (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Control Of Metal Rolling (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于LSTM的热轧弯辊力预测方法,采集不锈钢轧机热轧工艺的最终机架轧制数据并划分为训练集traindata和测试集testdata;对traindata进行归一化处理;构造矩阵P;将矩阵P的最后一行作为训练集的标签即真实值;对网络的输出值和真实值计算并更新;网络训练完成后,取出LSTM网络的最后m个输出数据作为下一时刻的输入,得到网络下一时刻的输出,即为下一时刻的弯辊力预测值;重复上述步骤直至获得足够数目的预测数据;将处理后的数据与testdata中的真实值进行比较,检验网络的有效性。本发明方法与传统LSTM网络相比,加入了更新机制后的网络模型准确度有所提升,且网络更加稳定。

Description

一种基于LSTM的热轧弯辊力预测方法
技术领域
本发明涉及一种轧制弯辊力预测技术,具体为一种基于LSTM的热轧弯辊力预测方法。
背景技术
高精度轧制要求轧材板形控制系统具有高精度、快速响应和抗扰动性。液压弯辊力控制是板材轧制生产中板形控制系统的基本环节,原理是通过向工作辊和支撑辊辊颈施加弯辊力,使轧辊产生弯曲变形来改变辊缝凸度,从而影响轧制过程中有载辊缝形状,促使带钢形状沿宽度方向发生改变,补偿由于其他轧制工艺因素变化带来的板形不良,保证带钢出口板形精度。因此弯辊力的预测精度对板形和板形控制精度有重要影响,尤其是带钢的头部。较高的弯辊力预测精度有利于其闭环反馈控制。在实际生产中,弯辊力通常是根据带钢的温度、厚度、宽度、轧制力、材质、轧辊的热膨胀、轧辊磨损及平直度和凸度等影响因素进行综合计算。然而,现有的基于传统数学方法的弯辊力预测模型,结构非常复杂,各影响因素具有非线性、强耦合、时变性的特点,严重影响了弯辊力预测模型的精度提高。因此,探索新的弯辊力预测模型显得十分必要。
神经网络以其独特的性质在许多领域得到了广泛的应用,神经网络的特点在于其能够完成内部关系复杂的系统建模,可以解决传统的非线性问题。此外,其自身还具有良好的鲁棒性和容错性。近年来,许多学者逐渐将神经网络算法应用于弯辊力预测领域,并且取得了较好的预测效果。如遗传算法的热连轧机弯辊力预设定控制;BP神经网络的弯辊力预设定优化;遗传算法优化神经网络的热轧带钢弯辊力预报模型等。然而,现有的神经网络弯辊力预测模型大多需要采集影响弯辊力的诸多参数作为输入,这些参数分散于整个轧制过程的各组成部分,导致数据采集工作难度大,任务繁重。同时,较多的输入参数不仅增加了数据处理上的任务,且容易导致模型复杂,进而影响网络的训练速度与预测精度。分析轧制过程可以发现,实际轧制过程中,轧制弯辊力是连续性的,每个轧制弯辊力都是与前期相关的,因此带有时间序列特性,而普通的神经网络不考虑时间上下文信息,使得普通的神经网络难以学习时间序列的趋势走向,会导致预测模型的准确度很低,难以对后续时刻的弯辊力做出准确预测。
发明内容
针对现有技术中存在的上述不足,本发明要解决的问题是提供一种基于LSTM的热轧弯辊力预测方法,能够准确、高效预测热轧带钢弯辊力。
为解决上述技术问题,本发明采用的技术方案是:
本发明提供一种基于LSTM的热轧弯辊力预测方法,包括以下步骤:
1)采集不锈钢轧机热轧工艺的最终机架轧制数据,搜集弯辊力数据用于实验;
2)将弯辊力数据按照规定的比例在时间顺序上划分为训练集traindata和测试集testdata两个部分;
3)对traindata进行归一化处理得到归一化之后的向量;
4)利用步骤3)中的向量A构造矩阵P;
5)取步骤4)中矩阵P的前m行作为输入送到LSTM网络中;
6)将矩阵P的最后一行作为训练集的标签即真实值;对网络的输出值和真实值利用公式进行计算得到误差,再运用梯度下降法对网络的权重和偏置进行更新;
7)网络训练完成后,取出LSTM网络的最后m个输出数据作为下一时刻的输入,进而得到网络下一时刻的输出,该输出即为下一时刻的弯辊力预测值;
8)重复步骤7)直至获得足够数目的预测数据;
9)对得到的弯辊力预测值进行反归一化处理,将处理后的数据与testdata中的真实值进行比较,检验网络的有效性。
步骤4)中,矩阵
Figure BDA0002817779210000021
其中参数m为神经网络的输入层单元数,n为神经网络训练集所包含的样本数目。
步骤5)中,LSTM网络可采用传统LSTM网络,也可以采用ON-LSTM网络或双层ON-LSTM网络,采用双层ON-LSTM网络为:
取步骤4)中矩阵P的前m行作为第一层LSTM的输入,并且将得到的输出数据作为输入送到第二层LSTM,第二层LSTM的输出数据为该网络整体的输出。
双层ON-LSTM网络的第一层以及第二层LSTM引入了更新机制的有序神经元LSTM即ON-LSTM,在对LSTM进行参数更新时,使各神经元排序,并引入重要程度,即层次结构;层次较高的信息表示重要信息,需要在网络中保留;相反,低层次信息表示不重要信息,需要用新的输入数据更新,详细过程及计算公式如下:
假设与重要信息相对应的初级层次位置用S1表示,而与不重要信息相对应的次要层次位置用S2表示,S1和S2分别计算为:
S1=F1(xt,ht-1)=index max(soft max(Wf~xt+Uf~ht-1+bf~))
S2=F2(xt,ht-1)=index max(soft max(Wi~xt+Ui~ht-1+bi~))
其中indexmax函数的作用是求出向量中最大元素对应的位置序号;xt为输入数据,ht-1为递归数据,Wf~、Uf~为主遗忘门权重矩阵,bf~为主遗忘门偏置,Wi~、Ui~为主输入门权重矩阵,bi~为主输入门偏置;
当S2≥S1时,重要信息和不重要信息所对应的位置有部分重叠,当前细胞状态ct的计算公式:
Figure BDA0002817779210000031
当S2<S1时,重要信息和次要信息所对应的位置相互独立,当前细胞状态ct由下式计算:
Figure BDA0002817779210000032
其中k为ct的维数,ft和it分别为遗忘门输出和输入门输出,
Figure BDA0002817779210000033
为中间单元状态,ct-1为前一时刻的细胞状态。
分别将
Figure BDA0002817779210000034
Figure BDA0002817779210000035
定义为主遗忘门和主输入门;wt1、wt2和wt3分别表示分层结构中的高、中和低等级,则有:
Figure BDA0002817779210000036
Figure BDA0002817779210000037
Figure BDA0002817779210000038
Figure BDA0002817779210000039
Figure BDA00028177792100000310
其中,
Figure BDA00028177792100000311
为主遗忘门输出,
Figure BDA00028177792100000312
为主输入门输出。
本发明具有以下有益效果及优点:
1.本发明一种基于LSTM的热轧弯辊力预测方法选用了LSTM(Long Short-TermMemory)神经网络模型,只需要将一定数目的弯辊力历史数据输入到网络中即可对未来时刻的弯辊力数据进行有效预测;除传统LSTM以外,还使用增添了更新机制的ON-LSTM网络进行预测。与传统LSTM网络相比,加入了更新机制后的网络模型准确度有所提升,且网络更加稳定。
2.本发明将更新机制与双层结构进行了融合,提升了网络性能,使网络的预测精度有了进一步提高,通过对传统LSTM、ON-LSTM以及双层ON-LSTM网络在上述三个数据集上进行实验,并对人工神经网络(ANN)用同样的数据集进行对比实验,比较实验结果证明了本发明提出的LSTM(传统LSTM、ON-LSTM、双层ON-LSTM)网络模型的有效性。
附图说明
图1为本发明基于LSTM的热轧弯辊力预测方法流程图;
图2为传统LSTM隐层结构图;
图3为ON-LSTM隐层结构图;
图4为双层LSTM结构图;
图5A为四种网络模型误差对比图数据集(一);
图5B为四种网络模型误差对比图数据集(二);
图5C为四种网络模型误差对比图数据集(三);
图6A为传统LSTM网络的弯辊力预测结果数据集(一);
图6B为传统LSTM网络的弯辊力预测结果数据集(二);
图6C为传统LSTM网络的弯辊力预测结果数据集(三);
图7A为ON-LSTM网络的弯辊力预测结果数据集(一);
图7B为ON-LSTM网络的弯辊力预测结果数据集(二);
图7C为ON-LSTM网络的弯辊力预测结果数据集(三);
图8A为双层ON-LSTM网络的弯辊力预测结果数据集(一);
图8B为双层ON-LSTM网络的弯辊力预测结果数据集(二);
图8C为双层ON-LSTM网络的弯辊力预测结果数据集(三);
图9A为ANN网络的弯辊力预测结果数据集(一);
图9B为ANN网络的弯辊力预测结果数据集(二);
图9C为ANN网络的弯辊力预测结果数据集(三)。
具体实施方式
下面结合说明书附图对本发明作进一步阐述。
如图1所示,本发明提供一种基于LSTM的热轧弯辊力预测方法,包括以下步骤:
1)采集不锈钢轧机1580mm热轧工艺的最终机架轧制数据,搜集弯辊力数据用于实验;
2)将弯辊力数据按照规定的比例在时间顺序上划分为训练集traindata和测试集testdata两个部分;
3)对输入数据进行归一化处理得到归一化之后的向量,具体为:
对traindata进行线性归一化处理,得到归一化之后的向量A=(a1,a2,......an)T,其中参数n为神经网络训练集所包含的样本数目,a1~an为神经网络训练集所包含的样本;
4)利用步骤3)中的向量A构造矩阵P;
Figure BDA0002817779210000051
其中参数m为神经网络的输入层单元数,n为样本数;
5)取步骤4)中矩阵P的前m行作为输入送到LSTM网络中;
6)将矩阵P的最后一行作为训练集的标签即真实值;对网络的输出值和真实值利用公式进行计算得到误差,再运用梯度下降法对网络的权重和偏置进行更新;
7)网络训练完成后,取出LSTM网络的最后m个输出数据作为下一时刻的输入,进而得到网络下一时刻的输出,该输出即为下一时刻的弯辊力预测值;
8)重复步骤7)直至获得足够数目的预测数据;
9)对得到的弯辊力预测值进行反归一化处理,将处理后的数据与testdata中的真实值进行比较,检验网络的有效性。
步骤5)中,LSTM网络可采用传统LSTM网络(其隐层结构如图2所示),也可以采用ON-LSTM(其隐层结构如图3所示)网络或双层ON-LSTM网络(其隐层结构如图4所示)。
采用ON-LSTM网络,步骤1)~9)与传统LSTM网络相同。
采用双层ON-LSTM网络,步骤1)~4)、6)~9)与传统LSTM网络相同,步骤5)为;步骤4)中矩阵P的前m行作为第一层LSTM的输入,并且将得到的输出数据作为输入送到第二层LSTM。第二层LSTM的输出数据为该网络整体的输出。
步骤5)中,第一层以及第二层LSTM是引入了更新机制的有序神经元LSTM即ON-LSTM。该更新机制的作用具体表现在对LSTM进行参数更新时,使各神经元按照一定的顺序排序,并引入重要程度,即层次结构。层次较高的信息表示重要信息,需要在网络中保留。相反,层次较低的信息表示不重要信息。例如某一时刻的弯辊力数据与前后时刻相差很大,产生很大的跳变,它对于整个弯辊力数据的趋势学习贡献不大,则为不重要信息,其他的数据相对来说则为重要信息。
需要用新的输入数据更新。详细过程及计算公式如下:
假设与重要信息相对应的初级层次位置用S1表示,而与不重要信息相对应的次要层次位置用S2表示。通过xt和ht-1,S1和S2分别计算为:
S1=F1(xt,ht-1)=index max(softmax(Wf~xt+Uf~ht-1+bf~))
S2=F2(xt,ht-1)=index max(softmax(Wi~xt+Ui~ht-1+bi~))
其中indexmax函数的作用是求出向量中最大元素对应的位置序号(从1开始排序);xt为输入数据,ht-1为递归数据,W和U为权重矩阵,b为偏置。
网络基于这些层次位置更新ct。考虑S1和S2之间的相对幅度,有两类更新模型:(1)当S2≥S1时,重要信息和次要信息所对应的位置会有部分重叠,当前细胞状态ct的计算公式:
Figure BDA0002817779210000061
当S2<S1时,重要信息和次要信息所对应的位置相互独立,当前细胞状态ct由下式计算:
Figure BDA0002817779210000062
其中k为ct的维数,ft和it分别为遗忘门输出和输入门输出,
Figure BDA0002817779210000063
为中间单元状态。
为了方便描述上述更新过程,分别将
Figure BDA0002817779210000064
Figure BDA0002817779210000065
定义为主遗忘门和主输入门;wt1、wt2和wt3分别表示分层结构中的高、中和低等级。
Figure BDA0002817779210000066
Figure BDA0002817779210000067
Figure BDA0002817779210000068
Figure BDA0002817779210000069
Figure BDA00028177792100000610
ON-LSTM网络的完整更新公式为:
Figure BDA0002817779210000071
其中cumax函数为cumsum(softmax())的简写。
步骤6)中所提到的LSTM网络权重和偏置的更新计算过程具体如下:
传统LSTM以及ON-LSTM网络的加权输入误差项的计算公式为:
Figure BDA0002817779210000072
采用双层结构的双层ON-LSTM,在对权重和偏置进行更新时,两层网络的计算略有不同。第一层和第二层LSTM的加权输入误差项计算公式分别为:
(1)第一层LSTM:
Figure BDA0002817779210000073
(2)第二层LSTM:
Figure BDA0002817779210000074
其中ft为遗忘门输出,it为输入门输出ot为输出门输出,ct为当前细胞状态,ct-1为前一时刻细胞状态,
Figure BDA0002817779210000081
为中间单元状态,xt为输入数据,ht为递归数据,ht-1为前一时刻的递归数据,
Figure BDA0002817779210000082
为主遗忘门输出,
Figure BDA0002817779210000083
为主输入门输出,wt1为高等级、wt2为中等级、wt3为低等级,Wfx、Wix、Wcx、Wox
Figure BDA0002817779210000084
Figure BDA0002817779210000085
Wfh、Wih、Wch、Woh
Figure BDA0002817779210000086
为权重矩阵,bf、bi、bc、bo
Figure BDA0002817779210000087
为偏置向量;δt为t时刻的误差项,δf,t、δi,t
Figure BDA0002817779210000088
以及δo,t分别为ft、it、ct以及ot这四个加权输入所对应的误差项。
权重梯度的计算:
Figure BDA0002817779210000089
Figure BDA00028177792100000810
偏置梯度的计算:
Figure BDA00028177792100000811
其中E为误差,
Figure BDA00028177792100000812
为ht-1的转置,
Figure BDA00028177792100000813
为xt的转置,Woh,t为t时刻的Woh,同理Wfh,t、Wih,t、Wch,t、Wox,t、Wfx,t、Wix,t、Wcx,t、bo,t、bf,t、bi,t、bc,t为t时刻的Wfh、Wih、Wch、Wox、Wfx、Wix、Wcx、bo、bf、bi、bc
根据轧制过程的连续性和时间序列特征,本发明选用了LSTM(Long Short-TermMemory)神经网络模型。LSTM是长短期记忆网络,是一种时间递归神经网络(RNN),主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。
本发明选择了LSTM网络进行弯辊力的预测。与传统的神经网络或者其他机器学习方法不同,本发明不需要预先采集大量的对弯辊力有影响的输入参数,简化了前期数据准备工作,只需要将当前时刻为止采集到的每一时刻的弯辊力数据组成一个时间序列作为输入送到网络当中,即可对LSTM网络进行训练并对后续时刻的弯辊力进行预测。
本发明共采用了三种不同的LSTM网络模型对弯辊力进行预测,除了传统LSTM网络以外,还提出了另外两种改进的LSTM网络用于实验。所述两种改进的LSTM网络分别为:
(1)ON-LSTM网络:ON-LSTM网络在传统LSTM网络的基础上增加了更新机制,与传统LSTM相比,ON-LSTM可以有效增强网络的鲁棒性,提高网络的准确度。
(2)双层ON-LSTM:双层ON-LSTM网络将更新机制与双层结构进行了有机结合。由于双层结构具有强大的拟合函数的能力,因而双层ON-LSTM可以在ON-LSTM的基础上进一步提高网络的预测精度。
为了证明本发明提出的LSTM(传统LSTM、ON-LSTM、双层ON-LSTM)网络模型的有效性,采集某不锈钢轧机1580mm热轧工艺的弯辊力数据,对其进行划分组成三个不同的数据集,每个数据集包含500个样本点。分别对传统LSTM、ON-LSTM以及双层ON-LSTM网络在上述三个数据集上进行实验,并对人工神经网络(ANN)用同样的数据集进行对比实验,比较实验结果。三种不同的网络模型在三个数据集上的最大误差和平均误差如下图5A~5C所示。根据图5A~5C)可以看到三种LSTM网络的预测误差均远远小于ANN网络,三种LSTM网络在数据集1-3(数据集1-3是对采集到的弯辊力数据进行切割划分,选取其中较为有代表性的三段不同的数据作为三个数据集进行实验)上均取得了良好表现,并且可以发现增加了更新机制的ON-LSTM网络优于传统LSTM网络。此外,在将ON-LSTM构造成双层结构后,网络性能得到了进一步提升,双层ON-LSTM网络在三种LSTM网络中误差最小,表现最好。
分别对三个不同的数据集取前450个样本点进行网络训练,并用训练好的LSTM网络对未来50个样本点即未来50个时刻的弯辊力数据进行预测,其结果如下图6A~6C、图7A~7C以及图8A~8C所示,可以看到本专利所提出的三种LSTM网络均能够有效地预测未来时刻的弯辊力数据,具有良好的拟合能力。三种LSTM网络的优良程度从高到低分别为:双层ON-LSTM、ON-LSTM、传统LSTM。
保持所用数据集,训练样本数以及预测样本数等条件不变的情况下,将本发明所用的LSTM网络替换成ANN网络进行对比实验,其结果如下图9A~9C所示。实验结果表明,采用ANN网络对弯辊力进行预测得到的结果误差较大,其效果远不如本专利提出的三种LSTM网络的预测效果好。并且通过与ANN网络进行对比,可以看到LSTM网络在处理连续时间序列方面具有强大的优势,可以有效解决本专利提出的弯辊力预测问题,具有很大的现实意义和应用价值。

Claims (1)

1.一种基于LSTM的热轧弯辊力预测方法,其特征在于包括以下步骤:
1)采集不锈钢轧机热轧工艺的最终机架轧制数据,搜集弯辊力数据用于实验;
2)将弯辊力数据按照规定的比例在时间顺序上划分为训练集traindata和测试集testdata两个部分;
3)对traindata进行归一化处理得到归一化之后的向量;
4)利用步骤3)中的向量A构造矩阵P;
5)取步骤4)中矩阵P的前m行作为输入送到LSTM网络中;
6)将矩阵P的最后一行作为训练集的标签即真实值;对网络的输出值和真实值利用公式进行计算得到误差,再运用梯度下降法对网络的权重和偏置进行更新;
7)网络训练完成后,取出LSTM网络的最后m个输出数据作为下一时刻的输入,进而得到网络下一时刻的输出,该输出即为下一时刻的弯辊力预测值;
8)重复步骤7)直至获得足够数目的预测数据;
9)对得到的弯辊力预测值进行反归一化处理,将处理后的数据与testdata中的真实值进行比较,检验网络的有效性;
步骤4)中,矩阵
Figure FDA0003151363810000011
其中参数m为神经网络的输入层单元数,n为神经网络训练集所包含的样本数目;
步骤5)中,LSTM网络可采用传统LSTM网络,也可以采用ON-LSTM网络或双层ON-LSTM网络,采用双层ON-LSTM网络为:
取步骤4)中矩阵P的前m行作为第一层LSTM的输入,并且将得到的输出数据作为输入送到第二层LSTM,第二层LSTM的输出数据为该网络整体的输出;
双层ON-LSTM网络的第一层以及第二层LSTM引入了更新机制的有序神经元LSTM即ON-LSTM,在对LSTM进行参数更新时,使各神经元排序,并引入重要程度,即层次结构;层次较高的信息表示重要信息,需要在网络中保留;相反,低层次信息表示不重要信息,需要用新的输入数据更新,详细过程及计算公式如下:
假设与重要信息相对应的初级层次位置用S1表示,而与不重要信息相对应的次要层次位置用S2表示,S1和S2分别计算为:
Figure FDA00031513638100000213
Figure FDA00031513638100000214
其中indexmax函数的作用是求出向量中最大元素对应的位置序号;xt为输入数据,ht-1为递归数据,
Figure FDA00031513638100000216
为主遗忘门权重矩阵,
Figure FDA00031513638100000215
为主遗忘门偏置,
Figure FDA00031513638100000217
为主输入门权重矩阵,
Figure FDA00031513638100000218
为主输入门偏置;
当S2≥S1时,重要信息和不重要信息所对应的位置有部分重叠,当前细胞状态ct的计算公式:
Figure FDA0003151363810000021
当S2<S1时,重要信息和次要信息所对应的位置相互独立,当前细胞状态ct由下式计算:
Figure FDA0003151363810000022
其中k为ct的维数,ft和it分别为遗忘门输出和输入门输出,
Figure FDA0003151363810000023
为中间单元状态,ct-1为前一时刻的细胞状态;
分别将
Figure FDA0003151363810000024
Figure FDA0003151363810000025
定义为主遗忘门和主输入门;wt1、wt2和wt3分别表示分层结构中的高、中和低等级,则有:
Figure FDA0003151363810000026
Figure FDA0003151363810000027
Figure FDA0003151363810000028
Figure FDA0003151363810000029
Figure FDA00031513638100000210
其中,
Figure FDA00031513638100000211
为主遗忘门输出,
Figure FDA00031513638100000212
为主输入门输出。
CN202011411870.XA 2020-12-04 2020-12-04 一种基于lstm的热轧弯辊力预测方法 Active CN112439794B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011411870.XA CN112439794B (zh) 2020-12-04 2020-12-04 一种基于lstm的热轧弯辊力预测方法
US17/784,430 US20230004781A1 (en) 2020-12-04 2021-07-29 Lstm-based hot-rolling roll-bending force predicting method
PCT/CN2021/109203 WO2022116571A1 (zh) 2020-12-04 2021-07-29 一种基于lstm的热轧弯辊力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011411870.XA CN112439794B (zh) 2020-12-04 2020-12-04 一种基于lstm的热轧弯辊力预测方法

Publications (2)

Publication Number Publication Date
CN112439794A CN112439794A (zh) 2021-03-05
CN112439794B true CN112439794B (zh) 2021-09-24

Family

ID=74739439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011411870.XA Active CN112439794B (zh) 2020-12-04 2020-12-04 一种基于lstm的热轧弯辊力预测方法

Country Status (3)

Country Link
US (1) US20230004781A1 (zh)
CN (1) CN112439794B (zh)
WO (1) WO2022116571A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112439794B (zh) * 2020-12-04 2021-09-24 东北大学 一种基于lstm的热轧弯辊力预测方法
CN113239569A (zh) * 2021-05-31 2021-08-10 北京科技大学 一种基于数据驱动的板形预测方法及装置
CN115660032B (zh) * 2022-08-31 2024-05-10 华能江苏综合能源服务有限公司 基于BI-LSTM神经网络融合attention机制的楼宇屋顶光伏功率预测方法
CN117272782B (zh) * 2023-08-07 2024-06-21 兰州理工大学 基于自适应多支路深度可分离的热轧钢力学性能预测方法
CN116756531B (zh) * 2023-08-23 2023-10-13 北京科技大学 一种面向模型交互联动的带钢热连轧过程监控方法和装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06297012A (ja) * 1993-04-16 1994-10-25 Toshiba Corp 熱間圧延機のロールベンディング力設定装置
JPH0724512A (ja) * 1993-07-12 1995-01-27 Nkk Corp 熱間走間板厚変更時のクラウン形状制御方法
JP2003326306A (ja) * 2002-03-07 2003-11-18 Jfe Steel Kk 熱間仕上タンデム圧延方法
KR100832971B1 (ko) * 2006-12-05 2008-05-27 주식회사 포스코 연연속 압연에서 압연롤의 벤더력 제어방법
CN106269903B (zh) * 2015-06-02 2018-05-18 上海梅山钢铁股份有限公司 一种热连轧机弯辊优化设定方法
CN108655186B (zh) * 2018-04-19 2019-08-06 中冶南方工程技术有限公司 基于人工神经网络与数学模型的轧制力预设定方法
CN108805346A (zh) * 2018-06-04 2018-11-13 东北大学 一种基于多隐层极限学习机的热连轧轧制力预报方法
CN109558677A (zh) * 2018-11-29 2019-04-02 东北大学 一种基于数据驱动的热轧板凸度预测方法
CN110428175B (zh) * 2019-08-05 2022-05-24 东北大学秦皇岛分校 一种基于深度学习的热轧带钢板凸度预报方法
CN111241657B (zh) * 2019-12-30 2023-03-10 新大陆数字技术股份有限公司 一种基于深度学习的冷轧带钢板形预测方法
CN111209967A (zh) * 2020-01-08 2020-05-29 太原科技大学 一种基于支持向量机的轧制过程板凸度预测方法
CN111482467A (zh) * 2020-04-15 2020-08-04 中冶赛迪重庆信息技术有限公司 一种轧机参数管理方法
CN112439794B (zh) * 2020-12-04 2021-09-24 东北大学 一种基于lstm的热轧弯辊力预测方法

Also Published As

Publication number Publication date
WO2022116571A1 (zh) 2022-06-09
US20230004781A1 (en) 2023-01-05
CN112439794A (zh) 2021-03-05

Similar Documents

Publication Publication Date Title
CN112439794B (zh) 一种基于lstm的热轧弯辊力预测方法
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN110428175B (zh) 一种基于深度学习的热轧带钢板凸度预报方法
WO2023130666A1 (zh) 一种基于数据驱动和机理模型融合的板带钢凸度预测方法
CN111190429B (zh) 一种基于强化学习的无人机主动容错控制方法
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
Barzola-Monteses et al. Energy consumption of a building by using long short-term memory network: a forecasting study
CN112037209A (zh) 一种钢板轧辊磨损量预测方法及系统
CN110782083B (zh) 基于深度Croston方法的航空发动机备用需求预测方法
CN114117919B (zh) 基于样本协同表示的即时学习的软测量建模方法
CN109493921B (zh) 一种基于多代理模型的常压精馏过程建模方法
CN114819395A (zh) 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法
Li et al. Modeling and validation of bending force for 6-high tandem cold rolling mill based on machine learning models
CN111080000A (zh) 基于psr-dbn的超短期母线负荷预测方法
CN113988415A (zh) 一种中长期电力负荷预测方法
CN114510864A (zh) 一种基于K-means聚类算法的神经网络预报轧制力的预报方法
CN116689502A (zh) 基于sa-scso-scn神经网络的热连轧厂精轧机组工艺的弯辊力参数设定方法
Ma et al. Bidirectional minimal gated unit-based nonlinear dynamic soft sensor modeling framework for quality prediction in process industries
CN115794805A (zh) 一种中低压配网量测数据补齐方法
CN112364527B (zh) 一种基于aliesn在线学习算法的脱丁烷塔软测量建模方法
CN109376957A (zh) 一种火电厂负荷的预测方法
Srivastava et al. Weather Prediction Using LSTM Neural Networks
CN114943328A (zh) 基于bp神经网络非线性组合的sarima-gru时序预测模型
CN111626465A (zh) 一种新能源功率短期区间预测方法及系统
Yang et al. ELM weighted hybrid modeling and its online modification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant