CN117019883B - 一种基于深度学习的带材轧制过程板形预测方法 - Google Patents
一种基于深度学习的带材轧制过程板形预测方法 Download PDFInfo
- Publication number
- CN117019883B CN117019883B CN202311082568.8A CN202311082568A CN117019883B CN 117019883 B CN117019883 B CN 117019883B CN 202311082568 A CN202311082568 A CN 202311082568A CN 117019883 B CN117019883 B CN 117019883B
- Authority
- CN
- China
- Prior art keywords
- model
- network
- acceptance
- strip
- rolling process
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000005096 rolling process Methods 0.000 title claims abstract description 48
- 238000013135 deep learning Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000004364 calculation method Methods 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000010276 construction Methods 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims abstract description 7
- 238000005457 optimization Methods 0.000 claims abstract description 5
- 230000004931 aggregating effect Effects 0.000 claims abstract description 3
- 230000006870 function Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 22
- 238000012360 testing method Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000013461 design Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000005496 tempering Methods 0.000 claims description 3
- 239000012014 frustrated Lewis pair Substances 0.000 claims description 2
- 241000764238 Isis Species 0.000 claims 2
- 238000007781 pre-processing Methods 0.000 abstract description 4
- 238000012546 transfer Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B21—MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
- B21B—ROLLING OF METAL
- B21B37/00—Control devices or methods specially adapted for metal-rolling mills or the work produced thereby
- B21B37/28—Control of flatness or profile during rolling of strip, sheets or plates
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B21—MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
- B21B—ROLLING OF METAL
- B21B1/00—Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations
- B21B1/22—Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations for rolling plates, strips, bands or sheets of indefinite length
- B21B1/24—Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations for rolling plates, strips, bands or sheets of indefinite length in a continuous or semi-continuous process
- B21B1/28—Metal-rolling methods or mills for making semi-finished products of solid or profiled cross-section; Sequence of operations in milling trains; Layout of rolling-mill plant, e.g. grouping of stands; Succession of passes or of sectional pass alternations for rolling plates, strips, bands or sheets of indefinite length in a continuous or semi-continuous process by cold-rolling, e.g. Steckel cold mill
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B21—MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
- B21B—ROLLING OF METAL
- B21B38/00—Methods or devices for measuring, detecting or monitoring specially adapted for metal-rolling mills, e.g. position detection, inspection of the product
- B21B38/02—Methods or devices for measuring, detecting or monitoring specially adapted for metal-rolling mills, e.g. position detection, inspection of the product for measuring flatness or profile of strips
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B21—MECHANICAL METAL-WORKING WITHOUT ESSENTIALLY REMOVING MATERIAL; PUNCHING METAL
- B21B—ROLLING OF METAL
- B21B38/00—Methods or devices for measuring, detecting or monitoring specially adapted for metal-rolling mills, e.g. position detection, inspection of the product
- B21B38/04—Methods or devices for measuring, detecting or monitoring specially adapted for metal-rolling mills, e.g. position detection, inspection of the product for measuring thickness, width, diameter or other transverse dimensions of the product
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的带材轧制过程板形预测方法,涉及带材轧制技术领域,包括以下步骤,S1:工业数据采集及数据集构建;S2:结合残差学习和聚合多尺度残差变换的方法,构建Inception‑ResNet模型;S3:使用AdaBound优化算法和两阶段学习率调整方法来训练网络模型;S4:根据模型评估指标,预测性能对比,选取最优模型,进行预测。本发明构建的深度全卷积网络可以直接接收带材轧制工艺参数,不需要额外的数据预处理方法,可以有效地解决轧制领域板形预测中的多输入多输出的多层级非线性问题,所提出的Inception‑ResNet网络具有较少的模型参数和较低的计算复杂性,其中Inception‑ResNet‑39网络包含39层可学习参数,实现了最先进的预测性能,此方法为模型构建及转移应用提供完整的流程。
Description
技术领域
本发明涉及带材轧制技术领域,尤其是涉及一种基于深度学习的带材轧制过程板形预测方法。
背景技术
在带材冷连轧过程中,板形偏差直接影响产品质量和尺寸形状,严重的板形缺陷会导致带材轧制过程的断带、轧制速度降低和设备损坏等事故。传统的基于物理的板形预测数值仿真模型侧重于力学和变形机理,一般情况不能解决涉及复杂工作条件和大规模工艺变量的连轧生产过程。因此,带材冷连轧过程的板形预测仍然是一个具有挑战性的理论与工程难题。
因此,有必要提供一种基于深度学习的带材轧制过程板形预测方法,来解决上述问题。
发明内容
本发明的目的是提供一种基于深度学习的带材轧制过程板形预测方法,构建的深度全卷积网络可以直接接收轧制工业参数,不需要额外的数据预处理方法,可以有效地解决冷连轧板形预测的多输入多输出的多层非线性问题,所提出的Inception-ResNet网络具有较少的模型参数和较低的计算复杂性,其中Inception-ResNet-39网络有39层可学习参数,实现了最先进的预测性能,为模型转移应用构建提供完整的流程。
为实现上述目的,本发明提供了一种基于深度学习的带材轧制过程板形预测方法,包括以下步骤:
S1:工业数据采集及数据集构建;
S2:结合残差学习和聚合多尺度残差变换的方法,构建Inception-ResNet网络模型;
S3:使用AdaBound优化算法和两阶段学习率调整方法来训练网络模型;
S4:根据模型评估指标,预测性能对比,选取最优模型,进行预测。
优选的,在步骤S1中,工业采集数据包括带材板形参数、轧制工艺参数,所述带材板形参数包括20个板形测量辊沿带材宽度方向测量值,所述轧制工艺参数包括68个轧制工艺参数,网络模型的输入变量是68维工艺参数,网络输出层的预测变量是带材宽度上的20维板形偏差值;
轧制工艺参数数据在输入网络之前使用Z归一化方法将其转换为一致的尺度,该方法调整每个训练样本的每个维度特征的大小,使其均值为0,方差为1,具体为:
N个样本计算每个维度特征x的均值μ和方差σ2:
新特征经过以下计算后得到:
优选的,在步骤S2中,聚合多尺度残差变换具体包括以下步骤:
S2A:Inception-ResNet网络在局部Inception模块设计中采用了不同大小的卷积核3×3,5×5,进行多条分支特征的非线性处理,基于切分-变化-合并split-transform-merge策略对输入特征进行特征转换合并;
S2B:堆叠网络拓扑模块Inception块,网络通过前馈计算中的级联聚合多尺度特征转换;
残差学习过程中,前馈网络通过迭代公式(1)传播信息:
其中xl,zl和xl+1分别为第l层的输入、权重参数、网络激活和输出,/>是堆叠网络层需要学习的新特征变换函数,/>是要学习的残差映射,f是非线性激活函数;
h(xl)=xl是一个恒等映射,根据万能近似定理,残差函数与残差学习表示为:
xl+1=f(zl),
h(xl)=xl通过恒等跳跃连接identity shortcut实现,通过张量的逐元素操作方式element-wise操作执行张量加运算,输入张量Xl与输出张量Xl+1之间的特征形状和通道数不匹配时,跳跃连接采用仿射变换匹配维度;
极端情况下,激活函数f是一个恒等映射,xl+1≡zl,从式(1)中得到:
通过具有l层的网络进行信息前馈传播计算的过程被简化如下:
其中,x0为网络的输入数据,网络进行误差反向传播时,为损失函数,由反向传播的链式法则得到:
构建Inception-ResNet模型包括以下具体步骤:
S21:基于聚合的多尺度残差变换的设计原则创建Inception-ResNet;
S22:Inception-ResNet的深度由超参数p和q决定;
S23:Inception-ResNet的主干网络在第一层卷积后包括一个Pre-Inception模块;
S24:Inception模块堆叠之前的每个阶段都使用ResBlock-B作为下采样处理器;
优选的,在步骤S3中,AdaBound算法中的参数分别采用默认值,优化器中的学习率设置为在训练计划的前五个轮次(epochs)逐渐预热,学习率衰减模式包括一阶段方法和两阶段方法,一阶段方法具体使用分段常数衰减方法StepLR,其中学习率每25个轮次(epoch)减半,最大学习率设置为3e-3;两阶段方法包括前30个轮次(epochs)采用分段常数衰减方法StepLR,后期使用余弦回火策略调整学习率,两个阶段的最大学习率分别为3e-3和2e-4。
优选的,步骤S3中,模型训练过程网络的损失函数采用均方误差损失函数MSE(Mean Squared Error),使用两种方法计算训练和测试过程的风险函数Rexp:
其中Nbatch是小批量的大小,Nsensor是板形测量辊沿带材宽度的测量点数量,数据集第i个样本的真实值为yi,是相对应的预测值;
在步骤S4中,模型评估指标包括:平均绝对误差MAE(Mean Absolute Error)、均方根误差RMSE(Root Mean Square Error)和相关性决定系数R2得分,MAE为风险度量,对应于绝对误差损失的预期值,MAE在整个数据集nsamples上进行计算:
其中,数据集第i个样本的真实值为yi,是相对应的预测值;
均方根误差RMSE为风险指标,对应于二次平方根误差的预期值,表示为:
相关性决定系数R2-score,表示为R2,用于评估模型预测精度,表示被预测变量的方差在模型中能够被预测变量解释的比例,R2定义为:
R2允许为负值,最佳数值设置为1.0,不考虑输入特征的情况下,模型始终预测y的预期平均值的常量模型获得0.0的R2;
引入浮点运算量FLOPs(floatingpoint operations),衡量算法模型的复杂度,以及模型参数量Params表示模型的大小,根据计算复杂度、参数大小以及在测试集上的预测性能,选取最佳模型为Inception-ResNet-39。
因此,本发明采用上述一种基于深度学习的带材轧制过程板形预测方法,具备以下有益效果:
(1)本发明构建的深度全卷积网络可以直接接收轧制工业参数,不需要额外的数据预处理方法,可以有效地解决冷连轧板形预测的多输入多输出的多层非线性问题。
(2)本发明所提出的Inception-ResNet网络具有较少的模型参数和较低的计算复杂性,显示较高的板形预测性能。
(3)本发明Inception-ResNet-39网络有39层可学习参数,实现了最先进的预测性能。
(4)本发明基于深度学习的端到端板形预测的有益实现,为模型转移应用构建提供完整的流程。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1是本发明一种基于深度学习的带材轧制过程板形预测方法的Inception-ResNetBase的网络结构;
图2是本发明实施例中获取工艺参数的仪器布置带材的冷连轧现场图;
图3是本发明实施例中训练模型的两种学习率调整策略图;
图4是本发明实施例中ResBlock-B用于下采样的处理器结构示意图;
图5是本发明实施例中一维Inception模块的一个内部网格结构;
图6是本发明实施例中Inception-ResNet39板形预测的预测性能和误差直方图;
图7是本发明实施例中基于实际测量值和Inception-ResNet-39网络预测值的轧制带材板形的3D云图;
图8是本发明一种基于深度学习的带材轧制过程板形预测方法的整体技术路线。
具体实施方式
以下通过附图和实施例对本发明的技术方案作进一步说明。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
本发明中使用的“包括”或者“包含”等类似的词语意指在该词前的要素涵盖在该词后列举的要素,并不排除也涵盖其它要素的可能。术语“内”、“外”、“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。在本发明中,除非另有明确的规定和限定,术语“附着”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
实施例
如图1和图8所示,本发明提供了一种基于深度学习的带材轧制过程板形预测方法,包括以下步骤:
S1:工业数据采集及数据集构建;数据来源于国内某钢厂1450mm五机架冷连轧线多卷带材的实际生产过程,共包含1928组离散样本,如图2所示,采集数据包括带材板形参数、轧制工艺参数,带材板形参数包括20个板形测量辊沿带材宽度方向测量值,轧制参数包括68个轧制工艺参数,网络模型的输入变量是68维工艺参数,网络输出层的预测变量是带材宽度上的20维板形偏差值;
在步骤S1中,工业采集数据包括带材板形参数、轧制工艺参数,所述带材板形参数包括20个板形测量辊沿带材宽度方向测量值,所述轧制参数包括68个轧制工艺参数,网络模型的输入变量是68维工艺参数,网络输出层的预测变量是带材宽度上的20维板形偏差值;
轧制工艺参数数据在输入网络之前使用Z归一化方法将其转换为一致的尺度,该方法调整每个训练样本的每个维度特征的大小,使其均值为0,方差为1,具体为:
N个样本计算每个维度特征x的均值μ和方差σ2:
新特征经过以下计算后得到:
为了增强网络的泛化能力和鲁棒性,数据集被随机分为1528个样本用于训练,200个样本用于验证,200个样本用于测试。测试集和验证集的区别在于,验证集用于网络训练优化中的人为干预,因此验证集存在信息泄漏;测试集是训练过程中从未使用过的、能够真实展现网络泛化能力和预测精度的数据集。
S2:结合残差学习和聚合多尺度残差变换的方法,如图5所示,构建Inception-ResNet网络模型;在步骤S2中,聚合多尺度残差变换具体包括以下步骤:
S2A:Inception-ResNet网络在局部Inception模块设计中采用了不同大小的卷积核3×3,5×5,进行多条分支特征的非线性处理,基于split-transform-merge策略对输入特征进行特征转换合并;
S2B:堆叠网络拓扑模块Inception块,网络通过前馈计算中的级联聚合多尺度特征转换;
残差学习过程中,前馈网络通过迭代公式(1)传播信息:
其中xl,zl和xl+1分别为第l层的输入、权重参数、网络激活和输出,/>是堆叠网络层需要学习的新特征变换函数,/>是要学习的残差映射,f是非线性激活函数;
h(xl)=xl是一个恒等映射,根据万能近似定理,残差函数与残差学习表示为:
xl+1=f(zl),
h(xl)=xl通过恒等跳跃连接identity shortcut实现,通过element-wise操作执行张量加运算,输入张量Xl与输出张量Xl+1之间的特征形状和通道数不匹配时,跳跃连接采用仿射变换匹配维度;如图4所示,ResBlock-B是用于下采样的处理器。
极端情况下,激活函数f是一个恒等映射,xl+1≡zl,从式(1)中得到:
通过具有l层的网络进行信息前馈传播计算的过程被简化如下:
其中,x0为网络的输入数据,网络进行误差反向传播时,为损失函数,由反向传播的链式法则得到:
构建Inception-ResNet模型包括以下具体步骤:
S21:基于聚合的多尺度残差变换的设计原则创建Inception-ResNet;
S22:Inception-ResNet的深度由超参数p和q决定;
S23:Inception-ResNet的主干网络在第一层卷积后包括一个Pre-Inception模块;
S24:Inception模块堆叠之前的每个阶段都使用ResBlock-B作为下采样处理器;不同深度的Inception-ResNet的结构、Params和FLOPs如表1所示;
表1Inception ResNet的结构、深度、参数和FLOPs之间的关系:
S3:使用AdaBound优化算法和两阶段学习率调整方法来训练网络模型;如图3所示,在步骤S3中,AdaBound算法中的参数分别采用默认值,优化器中的学习率设置为在训练计划的前五个轮次(epochs)逐渐预热,学习率衰减模式包括一阶段方法和两阶段方法,一阶段方法具体使用分段常数衰减方法StepLR,其中学习率每25个轮次(epoch)减半,最大学习率设置为3e-3;两阶段方法包括前30个轮次(epochs)采用分段常数衰减方法StepLR,后期使用余弦回火策略调整学习率,两个阶段的最大学习率分别为3e-3和2e-4。
S4:根据模型评估指标,预测性能对比,选取最优模型,进行预测。如图6-图7所示,步骤S4中,所述模型训练过程网络的损失函数采用均方误差损失函数MSE,使用两种方法计算训练和测试过程的风险函数Rexp:
其中Nbatch是小批量的大小,Nsensor是板形测量辊沿带材宽度的测量点数量,数据集第i个样本的真实值为yi,是相对应的预测值;
所述模型测试评估指标包括:平均绝对误差MAE、均方根误差RMSE和相关性决定系数R2得分。MAE为风险度量,对应于绝对误差损失的预期值,MAE在整个数据集nsamples上进行计算:
其中,数据集第i个样本的真实值为yi,是相对应的预测值;
均方根误差RMSE为风险指标,对应于二次平方根误差的预期值,表示为:
相关性决定系数R2-score,表示为R2,用于评估模型预测精度,表示被预测变量的方差在模型中能够被预测变量解释的比例,R2定义为:
R2允许为负值,最佳数值设置为1.0,不考虑输入特征的情况下,模型始终预测y的预期平均值的常量模型获得0.0的R2;Inception-ResNet-39获得最高的R2为0.8653。
表2不同结构网络的计算复杂度、参数大小以及在测试集上的预测性能
引入浮点运算量FLOPs,衡量算法模型的复杂度,以及模型参数量Params表示模型的大小,在特征张量的每个阶段最多堆叠两个残差块,并执行最多三个下采样过程,根据计算复杂度、参数大小以及在测试集上的预测性能,选取最佳模型为Inception-ResNet-39。
Inception-ResNet39准确地捕获了板形分布云图的细微变化,并准确地恢复了带材不同区域的板形值IU的分布。结果可用于指导板形控制系统和操作员提前给出轧机的板形执行器的调节量,优化板形偏差的分布。
因此,本发明采用上述一种基于深度学习的带材轧制过程板形预测方法,构建的深度全卷积网络可以直接接收轧制工业参数,不需要额外的数据预处理方法,可以有效地解决冷连轧板形预测的多输入多输出的多层非线性问题,所提出的Inception-ResNet网络具有较少的模型参数和较低的计算复杂性,其中Inception-ResNet-39网络有39层可学习参数,实现了最先进的预测性能,为模型转移应用构建提供完整的流程。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
Claims (5)
1.一种基于深度学习的带材轧制过程板形预测方法,其特征在于:包括以下步骤:
S1:工业数据采集及数据集构建;
S2:结合残差学习和聚合多尺度残差变换的方法,构建Inception-ResNet网络模型;
S3:使用AdaBound优化算法和两阶段学习率调整方法来训练网络模型;
S4:根据模型评估指标,预测性能对比,选取最优模型,进行预测。
2.根据权利要求1所述的一种基于深度学习的带材轧制过程板形预测方法,其特征在于:在步骤S1中,工业采集数据包括带材板形参数、轧制工艺参数,所述带材板形参数包括20个板形测量辊沿带材宽度方向测量值,所述轧制工艺参数包括68个轧制工艺参数,网络模型的输入变量是68维工艺参数,网络输出层的预测变量是带材宽度上的20维板形偏差值;
轧制工艺参数数据在输入网络之前使用Z归一化方法将其转换为一致的尺度,该方法调整每个训练样本的每个维度特征的大小,使其均值为0,方差为1,具体为:
N个样本计算每个维度特征x的均值μ和方差σ2:
新特征经过以下计算后得到:
3.根据权利要求2所述的一种基于深度学习的带材轧制过程板形预测方法,其特征在于:在步骤S2中,聚合多尺度残差变换具体包括以下步骤:
S2A:Inception-ResNet网络在局部Inception模块设计中采用了不同大小的卷积核3×3,5×5,进行多条分支特征的非线性处理,基于切分-变化-合并(split-transform-merge)策略对输入特征进行特征转换合并;
S2B:堆叠网络拓扑模块Inception块,网络通过前馈计算中的级联聚合多尺度特征转换;
残差学习过程中,前馈网络通过迭代公式(1)传播信息:
其中xl,zl和xl+1分别为第l层的输入、权重参数、网络激活和输出,/>是堆叠网络层需要学习的新特征变换函数,/>是要学习的残差映射,f是非线性激活函数;
h(xl)=xl是一个恒等映射,根据万能近似定理,残差函数与残差学习表示为:
xl+1=f(zl),
h(xl)=xl通过恒等跳跃连接(identity shortcut)实现,通过张量的逐元素操作方式(element-wise)操作执行张量加运算,输入张量Xl与输出张量Xl+1之间的特征形状和通道数不匹配时,跳跃连接采用仿射变换匹配维度;
极端情况下,激活函数f是一个恒等映射,xl+1≡zl,从式(1)中得到:
通过具有l层的网络进行信息前馈传播计算的过程被简化如下:
其中,x0为网络的输入数据,网络进行误差反向传播时,为损失函数,由反向传播的链式法则得到:
构建Inception-ResNet模型包括以下具体步骤:
S21:基于聚合的多尺度残差变换的设计原则创建Inception-ResNet;
S22:Inception-ResNet的深度由超参数p和q决定;
S23:Inception-ResNet的主干网络在第一层卷积后包括一个Pre-Inception模块;
S24:Inception模块堆叠之前的每个阶段都使用ResBlock-B作为下采样处理器。
4.根据权利要求3所述的一种基于深度学习的带材轧制过程板形预测方法,其特征在于:在步骤S3中,AdaBound算法中的参数分别采用默认值,优化器中的学习率设置为在训练计划的前五个轮次(epochs)逐渐预热,学习率衰减模式包括一阶段方法和两阶段方法,一阶段方法具体使用分段常数衰减方法StepLR,其中学习率每25个轮次(epoch)减半,最大学习率设置为3e-3;两阶段方法包括前30个轮次(epoch)采用分段常数衰减方法StepLR,后期使用余弦回火策略调整学习率,两个阶段的最大学习率分别为3e-3和2e-4。
5.根据权利要求4所述的一种基于深度学习的带材轧制过程板形预测方法,其特征在于:步骤S3中,模型训练过程网络的损失函数采用均方误差损失函数MSE,使用两种方法计算训练和测试过程的风险函数Rexp:
其中Nbatch是小批量的大小,Nsensor是板形测量辊沿带材宽度的测量点数量,数据集第i个样本的真实值为是相对应的预测值;
步骤S4中,模型评估指标包括:平均绝对误差MAE、均方根误差RMSE和相关性决定系数R2得分,MAE为风险度量,对应于绝对误差损失的预期值,MAE在整个数据集nsamples上进行计算:
其中,数据集第i个样本的真实值为是相对应的预测值;
均方根误差RMSE为风险指标,对应于二次平方根误差的预期值,表示为:
相关性决定系数R2-score,表示为R2,用于评估模型预测精度,表示被预测变量的方差在模型中能够被预测变量解释的比例,R2定义为:
R2允许为负值,最佳数值设置为1.0,不考虑输入特征的情况下,模型始终预测y的预期平均值的常量模型获得0.0的R2;
引入浮点运算量FLOPs,衡量算法模型的复杂度,以及模型参数量Params表示模型的大小,根据计算复杂度、参数大小以及在测试集上的预测性能,选取最佳模型为Inception-ResNet-39。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311082568.8A CN117019883B (zh) | 2023-08-25 | 2023-08-25 | 一种基于深度学习的带材轧制过程板形预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311082568.8A CN117019883B (zh) | 2023-08-25 | 2023-08-25 | 一种基于深度学习的带材轧制过程板形预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117019883A CN117019883A (zh) | 2023-11-10 |
CN117019883B true CN117019883B (zh) | 2024-02-13 |
Family
ID=88644852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311082568.8A Active CN117019883B (zh) | 2023-08-25 | 2023-08-25 | 一种基于深度学习的带材轧制过程板形预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117019883B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596143A (zh) * | 2018-05-03 | 2018-09-28 | 复旦大学 | 基于残差量化卷积神经网络的人脸识别方法及装置 |
CN108805259A (zh) * | 2018-05-23 | 2018-11-13 | 北京达佳互联信息技术有限公司 | 神经网络模型训练方法、装置、存储介质及终端设备 |
CN111242911A (zh) * | 2020-01-08 | 2020-06-05 | 来康科技有限责任公司 | 一种基于深度学习算法确定图像清晰度的方法及系统 |
CN111241657A (zh) * | 2019-12-30 | 2020-06-05 | 新大陆数字技术股份有限公司 | 一种基于深度学习的冷轧带钢板形预测方法 |
CN111274980A (zh) * | 2020-01-23 | 2020-06-12 | 天津大学 | 基于yolov3和非对称卷积的小尺寸交通标志识别方法 |
CN114192587A (zh) * | 2021-12-13 | 2022-03-18 | 东北大学 | 一种基于误差反向传播算法的冷轧板形控制参数设定方法 |
FR3116926A1 (fr) * | 2020-11-30 | 2022-06-03 | Thales | Procédé d'évaluation de la performance d'un algorithme de prédiction et dispositifs associés |
CN115007658A (zh) * | 2022-04-26 | 2022-09-06 | 东北大学 | 基于深层循环神经网络的冷连轧轧制板形动态预测方法 |
JP2022148420A (ja) * | 2021-03-24 | 2022-10-06 | 日産自動車株式会社 | 予測モデルの学習方法、予測モデル及び学習装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220414531A1 (en) * | 2021-06-25 | 2022-12-29 | International Business Machines Corporation | Mitigating adversarial attacks for simultaneous prediction and optimization of models |
-
2023
- 2023-08-25 CN CN202311082568.8A patent/CN117019883B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596143A (zh) * | 2018-05-03 | 2018-09-28 | 复旦大学 | 基于残差量化卷积神经网络的人脸识别方法及装置 |
CN108805259A (zh) * | 2018-05-23 | 2018-11-13 | 北京达佳互联信息技术有限公司 | 神经网络模型训练方法、装置、存储介质及终端设备 |
CN111241657A (zh) * | 2019-12-30 | 2020-06-05 | 新大陆数字技术股份有限公司 | 一种基于深度学习的冷轧带钢板形预测方法 |
CN111242911A (zh) * | 2020-01-08 | 2020-06-05 | 来康科技有限责任公司 | 一种基于深度学习算法确定图像清晰度的方法及系统 |
CN111274980A (zh) * | 2020-01-23 | 2020-06-12 | 天津大学 | 基于yolov3和非对称卷积的小尺寸交通标志识别方法 |
FR3116926A1 (fr) * | 2020-11-30 | 2022-06-03 | Thales | Procédé d'évaluation de la performance d'un algorithme de prédiction et dispositifs associés |
JP2022148420A (ja) * | 2021-03-24 | 2022-10-06 | 日産自動車株式会社 | 予測モデルの学習方法、予測モデル及び学習装置 |
CN114192587A (zh) * | 2021-12-13 | 2022-03-18 | 东北大学 | 一种基于误差反向传播算法的冷轧板形控制参数设定方法 |
CN115007658A (zh) * | 2022-04-26 | 2022-09-06 | 东北大学 | 基于深层循环神经网络的冷连轧轧制板形动态预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117019883A (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101630376B (zh) | 多模型神经网络的生物发酵过程软测量建模方法及软仪表 | |
CN103761423B (zh) | 一种基于pso-elm的热轧板材组织-性能预测方法 | |
CN111160520A (zh) | 一种基于遗传算法优化的bp神经网络风速预测方法 | |
CN108537366B (zh) | 基于最优卷积二维化的水库调度方法 | |
CN112170501B (zh) | 一种轧辊磨损凸度和热凸度的预测方法 | |
CN105302973A (zh) | 基于moea/d算法的铝电解生产优化方法 | |
CN110428175A (zh) | 一种基于深度学习的热轧带钢板凸度预报方法 | |
CN104462850A (zh) | 基于模糊高斯混合模型的多阶段间歇过程软测量方法 | |
CN103177289B (zh) | 一种噪声不确定复杂非线性动态系统的建模方法 | |
CN104375478A (zh) | 一种轧钢生产过程产品质量在线预测与优化的方法及装置 | |
CN107958309A (zh) | 一种高坝多点变形性态联合预报方法 | |
CN111783336B (zh) | 一种基于深度学习理论的不确定性结构频响动力学模型修正方法 | |
CN115470595A (zh) | 一种数据与机理融合的热轧带钢凸度预测方法 | |
CN102680646A (zh) | 一种不饱和聚酯树脂反应釜中反应物浓度软测量方法 | |
CN104634265A (zh) | 一种基于多元图像特征融合的矿物浮选泡沫层厚度软测量方法 | |
CN112668234A (zh) | 一种转炉炼钢终点智能控制方法 | |
CN114896733A (zh) | 一种基于深度强化学习的滚动轴承故障类型识别方法 | |
CN117019883B (zh) | 一种基于深度学习的带材轧制过程板形预测方法 | |
CN114925723A (zh) | 采用编码器和解码器的滚动轴承剩余使用寿命预测方法 | |
CN114239396A (zh) | 一种风机齿轮箱状态预测方法及系统 | |
CN116630728A (zh) | 基于注意力残差孪生网络的加工精度预测方法 | |
CN114297795B (zh) | 一种基于PR-Trans的机械设备剩余寿命预测方法 | |
CN113973403B (zh) | 基于结构离散测点拓扑的温致应变场重分布智能感知方法 | |
Liu et al. | Soft-sensors based on Gaussian process regression for wastewater treatment plants | |
Wang et al. | A deep learning model for the accurate prediction of the microstructure performance of hot rolled steel |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |