CN111429979A

CN111429979A - 一种基于支持向量机分位数回归的钢材力学性能预测方法

Info

Publication number: CN111429979A
Application number: CN202010208411.5A
Authority: CN
Inventors: 何晓霞; 张信
Original assignee: Wuhan University of Science and Engineering WUSE
Current assignee: Wuhan University of Science and Engineering WUSE; Wuhan University of Science and Technology WHUST
Priority date: 2020-03-23
Filing date: 2020-03-23
Publication date: 2020-07-17

Abstract

本发明提出一种基于支持向量机分位数回归的钢材力学性能预测方法，包括以下步骤：数据处理；模型估计值获取；变量选择；参数获取；模型确定。本发明提供的基于支持向量机分位数回归的钢材力学性能预测方法、装置、存储介质，针对目前力学性能预测中不能同时考虑数据的异质性以及建模的因素之间的非线性的问题，提供了一种基于支持向量机分位数回归的钢材力学性能预测方法。

Description

一种基于支持向量机分位数回归的钢材力学性能预测方法

技术领域

本发明涉及微合金钢热轧产品力学性能预测领域，具体涉及一种基于支持向量机分位数回归的钢材力学性能，尤其是热轧产品的抗拉强度预测方法。

背景技术

近年来，由于钢材广泛应用于建筑、桥梁等许多行业领域，钢材产品的需求呈现出高速增长态势；人们对钢材产品质量要求越来越严格，不仅要求钢材的力学性能符合标准，而且要求钢材有良好的表面质量。冶金工作者一直致力于降低冶金成本和提高钢材产品质量，因此在钢材冶炼之前对钢铁性能进行预测是必要的；然而，钢材产品性能的好坏取决于其内部组织，内部组织受到其本身成分、制造工艺等因素的影响，并且彼此之间存在着复杂的关系，同时微合金钢生产过程涉及到诸多物理、化学等反应，其过程中的不确定因素也难以测定和评估。热轧钢材组织性能预报一直是钢铁冶金行业关注的难点问题，是一项十分复杂的冶金前沿技术。因此，基于对实际大规模生产数据的适当处理，构建具有足够精度且相对可靠的钢材力学性能预报模型，实现钢材产品的抗拉强度等力学性能进行精准预测，并合理揭示影响钢材力学性能的因素，一直是钢铁企业关注的热点问题及重点问题。热轧钢材性能预报模型对产品力学性能的准确预测，有助于优化钢种成分、减少带钢取样量、控制产品力学性能、设计新产品。根据反馈的预测结果设置工艺参数，可以提高产品生产效率，增强企业竞争力。

目前针对钢铁性能预测领域主要分为机理建模和数据建模，机理建模的预测方法相对于其他建模方法而言，它能较好地反映出实际热轧过程中钢材组织结构的演变规律，具有一定的可靠性和普适性。然而仅包含能显著影响钢板性能的主要化学成分就达15种以上，而且还包括能显著影响钢板性能的多种工艺参数，也很难描述钢铁冶炼过程的各种非线性关系因此，基于物质机理的钢板性能研究方法，主要适用于单钢种，在多钢种存在一定的局限性，存在计算量繁杂庞大、效率低下、精度不高等缺陷。数据建模在一定程度上能解决这些问题，但是数据建模在该领域上的应用因起步较晚，在实际应用中还不能取得满意的效果。值得注意的是，一些传统的数据建模(人工神经网络)预测模型在确定训练参数时可能会出现预测结果的急剧波动。在寻找最小误差时，容易陷入局部最优。同时，从数据质量的角度来看，数据模型对样本数据的要求较高，这对实现数据模型的可靠性和可扩展性具有很大的影响。

发明内容

本发明是为了解决上述问题而进行的，针对目前力学性能预测中不能同时考虑数据的异质性以及建模的因素之间的非线性的问题，提供了一种基于支持向量机分位数回归的钢材力学性能预测方法。

为实现上述目的，本发明提出一种基于支持向量机分位数回归的钢材力学性能预测方法，具有这样的特征，包括以下步骤：

数据处理：基于第一预设规则对初始数据进行标准化处理，得到标准化数据；

模型估计值获取：定义支持向量机回归模型，根据所述标准化数据，得到支持向量机分位数回归模型估计值；

变量选择：根据最小绝对收缩和选择算法变量选择方法，基于所述标准化数据和所述模型估计值，得到对所述力学性能影响较大的变量；

参数获取：基于第二预设规则和贝叶斯最小准则，得到相应的最终调整参数，基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数；

模型确定：根据所述变量、最终调整参数和所述惩罚参数、各预设核函数，得到具有不同所述预设核函数的各训练模型，利用所述标准化数据分别对所述训练模型进行回测，选择预测值与实测值最贴近的合适核函数，确定最终预测模型。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述第一预设规则包括：

X′＝atan(X)*2/π

其中，所述第一预设规则的映射区间为[0,1]，所述性能数据X>0。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述获取模型估计值步骤中，还包括以下步骤：

基于所述支持向量机回归模型得到最优参数解，并将检验函数代入所述最优参数解；

引入松弛变量，得到代入了所述检验函数的所述最优参数解的二次规划问题；

根据第一约束条件，由所述二次规划问题得到所述支持向量机分位数回归模型估计值。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述支持向量回归机模型为：

f(x)＝m(x)＝w·φ(x)+b

其中，w为权重向量，b为阈值，x为解释变量，φ(x)为x的非线性映射函数。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述最优参数解(w,b)为：

其中，C为惩罚参数，

k为样本总量，

x_t为样本t的自变量，

y_t为样本t的响应变量，

f(x_t)为样本t的解释变量x的预测值。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述检验函数ρ_τ(u)为：

ρ_τ(u)＝u(τ-I(u))

其中，分位点τ∈(0,1)，

u为变量，

示性函数

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，将所述检验函数代入所述最优参数解得到：

其中，w为没有分位点情况下的权重向量，

所述w_τ为分位点τ上的权重向量，

β为变量系数，β_τ为在分位点τ下的变量系数，

为β_τ的转置，

z_t为与x_t定义相同的自变量，

为w_τ的转置，

φ(x_t)为解释变量x_t的非线性映射函数。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述二次规划问题为：

其中，w^T为w的转置，

ξ_t、

分别为松弛变量。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述第一约束条件包括：

其中，β^T为β的转置，

w^T为w的转置。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述支持向量机分位数回归模型估计值为：

其中，α_t,

为样本t时的最优拉格朗日乘子数，

α为由α_t构成的拉格朗日乘子向量,

α^*为由α_t ^*构成的拉格朗日乘子向量,

(b_τ,β_τ)^T为在τ分位点下变量系数和阈值组成的向量的转置,

矩阵

为z_t的转置，

U^T为U的转置，

响应变量y＝{y_t|t∈I_SV}，

支持向量的索引集I_SV＝{t＝1,2,3...k|0＜α_t＜τC,0＜α_t ^*＜(1-τ)C}，

为τ分位点下的预测值，

b_τ为在τ分位点下的阈值，

K为核函数,

K_t为样本t的核函数。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述变量选择步骤中，还包括以下步骤:

基于最小绝对收缩和选择算法变量选择方法，得到相应的损失函数；

基于所述损失函数中的最小值

得到极限值

并代入所述损失函数，得到损失函数极限值；基于预设的损失变量δ，对所述损失函数极限值中的参数b,β,γ分别求偏导，得到参数偏导；

根据高效迭代加权最小二乘算法，基于所述参数偏导，循环迭代直至收敛，得到所述损失函数的最小值点的各参数值b_τ,β_τ,γ_τ，所述β_τ中包含对所述力学性能影响较大的变量。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述损失函数为：

其中，修改后检查函数

实际值与预测值的差值r＝y-b-β^Tz-Kγ，

δ为损失变量，所述ρ_τ,δ(r)的应用范围为区间间隔(-δ,δ)，

I为对角线元素为1的矩阵，

参数γ＝α-α^*，

γ^T为γ的转置，

λ_j为第j个变量的调整参数，

P为变量的个数，

β_j为第j个变量的系数，

为第j个变量的压缩系数，

m为迭代次数。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述损失函数最小值为：

其中，Z是由

构成的k×p矩阵，

样本t＝1，2，···,k，

Z^T为Z的转置，

W是由w_tt组成的对角阵，

实际值与预测值的差值

b_τ为在τ分位点下的阙值，

K_τ为τ分位点下的核函数，

γ_τ为τ分位点下的α-α^*，

D^(m)为d×d对角矩阵，其第j个对角分量由

给出，

1为元素为1的矩阵。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述损失函数极限值为：

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述参数偏导为：

其中，

为在循环l+1次时τ分位点下的阈值，

为在循环l+1次时τ分位点下变量的系数，

为在循环l+1次时τ分位点下的α-α^*，

1^T为元素为1的矩阵的转置，

D为d×d对角矩阵，其第j个对角分量由

构成。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述高效迭代加权最小二乘算法规则包括以下步骤：

设定参数b_τ,β_τ,γ_τ的初始值分别为

由所述损失变量δ，所述分位点τ及所述实际值与预测值的差值

得到矩阵W，

其中，

为在循环l次时τ分位点下的阈值，

为在循环l次时τ分位点下变量的系数，

为在循环l 次时τ分位点下的α-α^*，

为

的转置；

从所述参数偏导中更新

循环迭代直到收敛，得到所述损失函数的最小值点的各参数值 b_τ,β_τ,γ_τ，所述β_τ中包含对所述力学性能影响较大的变量。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述参数获取步骤中，还包括以下步骤：

基于第二预设规则，定义调整参数；

根据贝叶斯最小准则得到所述调整参数定义中的调整参数初始给定值λ₀，并进一步得到每个变量的最终调整参数；

基于广义近似交叉验证模型的计算结果，作为所述支持向量分位数回归模型的最终惩罚参数。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述第二预设规则包括：

定义相关系数和不相关系数的最大收缩量a_n＝max{λ_j:1≤j≤d₀}，

相关系数和不相关系数的最小收缩量b_n＝min{λ_j:d₀+1≤j≤d}，

其中，n^-3/5a_n→0，

n^-11/10b_n→∞，

d为收宿参数的个数，

d₀为最大收宿量。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述调整参数为：

其中，

是未惩罚的估计值

的第j列，

λ₀为调整参数初始给定值，

λ_j为第j个变量的调整参数，

γ＝3/2，

λ₀n^-3/5→0，

λ₀n^-1/2→∞。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述贝叶斯最小准则为：

其中，由

确定的非零系数的个数df_λ为0≤df_λ≤d,

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述最终调整参数为：

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述广义近似交叉验证模型为：

其中，v是预设超参数集，

Q_τ(y|z_t,x_t)为模型预测值，

H是帽子矩阵，且

(Q_τ(y|z₁,x₁),...,Q_τ(y|z_p,x_p))′＝Hy

H矩阵中的对应元素

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述训练模型为：

所述训练模型为：

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述合适核函数为高斯核函数：

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，还具有这样的特征，所述最终预测模型为:

此外，为实现上述目的，本发明还提供了一种电子装置，其特征在于，该电子装置包括：存储器、处理器，所述存储器上存储有基于支持向量机分位数回归的钢材力学性能预测程序，所述基于支持向量机分位数回归的钢材力学性能预测程序被所述处理器执行时实现以下步骤：

数据处理模块：基于第一预设规则对初始数据进行标准化处理，得到标准化数据；

获取模型估计值模块：定义支持向量机回归模型，根据所述标准化数据，得到模型估计值；

变量选择模块：根据最小绝对收缩和选择算法变量选择方法，基于所述标准化数据和所述模型估计值，得到对所述力学性能影响较大的变量；

参数获取模块：基于第二预设规则和贝叶斯最小准则，得到相应的最终调整参数，基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数；

确定模型模块：根据所述变量、最终调整参数和所述惩罚参数、各预设核函数，得到具有不同所述预设核函数的各训练模型，利用所述标准化数据分别对所述训练模型进行回测，选择预测值与实测值最贴近的合适核函数，确定最终预测模型。

此外，为实现上述目的，本发明还提供了一种计算机可读存储介质，具有这样的特征，所述计算机可读存储介质上存储有所述基于支持向量机分位数回归的钢材力学性能预测程序，所述基于支持向量机分位数回归的钢材力学性能预测程序被处理器执行时实现上述基于支持向量机分位数回归的钢材力学性能预测方法的步骤。

发明作用和效果

本发明所涉及的基于支持向量机分位数回归的钢材力学性能预测方法、装置、存储介质中，由于支持向量机可以解决建模中的非线性问题，分位数回归在实际应用中考虑整个分布等特性，能很好的处理数据异质性，对离群值不敏感，具有较好的“鲁棒”性。因此本发明将支持向量机和分位数结合起来构造支持向量机分位数回归方法来预测钢材性能，对未来提高预测精度有很重要的意义。。另外，本发明的基于支持向量机分位数回归的钢材力学性能预测方法具有很强的扩展性和自适应性，解决建模中的非线性问题以及考虑极端值情况下的抗拉强度，有效改善和提高热轧产品力学性能的预测精度，具有较广泛的推广价值。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1是本发明电子装置一实施例的示意图；

图2示本发明的基于支持向量机分位数回归的钢材力学性能预测程序一实施例的程序模块图；

图3为本发明的一实施例的训练集的预测抗拉强度与实测抗拉强度对比示意图；

图4为本发明的一实施例的训练集的拉伸强度预测值和测量值分布示意图；

图5为本发明的一实施例的测试集的拉伸强度预测值和测量值分布示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

以下参照附图及实施例对本发明所涉及的一种基于支持向量机分位数回归的钢材力学性能预测方法作详细的描述。以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

图1是本发明电子装置一实施例的示意图；

本发明提供一种电子装置1。参照图1所示，为本发明电子装置1较佳实施例的示意图。

在本实施例中，该电子装置1包括存储器11、处理器12，网络接口13及通信总线。其中，通信总线用于实现这些组件之间的连接通信。

网络接口13可以包括标准的有线接口、无线接口(如WI-FI接口)。

存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中，所述可读存储介质可以是所述电子装置1的内部存储单元，例如该电子装置1的硬盘。在另一些实施例中，所述可读存储介质也可以是所述电子装置1的外部存储设备，例如所述电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。

在本实施例中，所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的基于支持向量机分位数回归的钢材力学性能预测程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行基于支持向量机分位数回归的钢材力学性能预测程序10等。

图1仅示出了具有组件11-13以及基于支持向量机分位数回归的钢材力学性能预测程序10的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选的，该电子装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。

可选地，该电子装置1还可以包括显示器，在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode，OLED)触摸器等。显示器用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。

图2示本发明的基于支持向量机分位数回归的钢材力学性能预测程序一实施例的程序模块图。

在图1所示的装置实施例中，作为一种计算机存储介质的存储器11中包括基于支持向量机分位数回归的钢材力学性能预测程序10，处理器12执行存储器11中存储的基于支持向量机分位数回归的钢材力学性能预测程序10时包括以下模块：数据处理模块110，模型估计值获取模块120，变量选择模块 130，参数获取模块140，模型确定模块150。在本实施例中，基于支持向量机分位数回归的钢材力学性能预测程序10可以包括：

数据处理模块110：基于第一预设规则对初始数据进行标准化处理，得到标准化数据。

为了消除不同参数之间数据量级不同造成的影响，必须将数据进行标准化处理，经过标准化处理后的数据使网络性能得到提升，更加有利于后续分析与建模。本发明中可使用atan函数转换，或反正切函数来实现数据的归一化。

进一步，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述第一预设规则包括：

X′＝atan(X)*2/π (1)

使用这个方法需要注意的是如果想映射的区间为[0,1]，则数据都应该大于等于0，小于0的数据将被映射到[-1,0]区间上。

模型估计值获取模块120：定义支持向量机回归模型，根据所述标准化数据，根据第一约束条件，得到支持向量机分位数回归模型估计值。

所述模型估计值获取模块中，还包括以下步骤：

具体而言，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，支持向量机是由 Vapnik基于统计学习理论和结构风险最小化原则提出的，当支持向量机应用回归问题时，称为SVR。

所述支持向量回归机模型为：

f(x)＝m(x)＝w·φ(x)+b (2)

其中，w为权重向量，b为阈值，x为解释变量，φ(x)为x的非线性映射函数，即将输入向量X(即由自变量x组成的向量)投影到更高维的特征空间中。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述最优参数解 (w,b)为：

其中，C为惩罚参数，

k为样本总量，

x_t为样本t的自变量，

y_t为样本t的响应变量(因变量)，

f(x_t)为样本t的解释变量x的预测值。

引入分位数回归代替经典的均值回归，当x是解释变量而不是条件均值时，它为响应变量y整个条件分布提供了全面的策略及方法。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中检验函数(非对称损失函数)由Koenker提出，它可以通过最小化检验函数得到最优参数。所述检验函数ρ_τ(u)为：

ρ_τ(u)＝u(τ-I(u)) (4)

其中，分位点τ∈(0,1)，

u为变量，

示性函数

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，将所述检验函数代入所述最优参数解，所述支持向量机分位数回归模型可通过求解得到：

其中，w为没有分位点情况下的权重向量，

所述w_τ为分位点τ上的权重向量，

β为变量系数，β_τ为在分位点τ下的变量系数，

为β_τ的转置，

z_t为与x_t定义相同的自变量，

为w_τ的转置，

φ(x_t)为解释变量x_t的非线性映射函数，即将输入向量X(即由自变量x_t组成的向量)投影到更高维的特征空间中。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述二次规划问题为：

其中，w^T为w的转置，

ξ_t、

分别为松弛变量。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，为了将(7)式转为规划问题，所述第一约束条件包括：

其中，β^T为β的转置，

w^T为w的转置。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，为了解决优化问题，引入松弛变量来构造拉格朗日函数，可得SVQR的估计量所述模型估计值如下：

其中，α_t,

为样本t时的最优拉格朗日乘子数，

α为由α_t构成的拉格朗日乘子向量,

α^*为由α_t ^*构成的拉格朗日乘子向量,

矩阵

为z_t的转置，

U^T为U的转置，

响应变量(或因变量)y＝{y_t|t∈I_SV}，

为τ分位点下的预测值，

b_τ为在τ分位点下的阈值，

K为核函数,

K_t为样本t的核函数，

K_t＝K(x_s,x_t)＝φ(x_s)^Tφ(x_t)，t∈I_SV(s＝1,2...T)，

x_s为样本s的自变量，

x_t为样本t的自变量，

K(x_s,x_t)为x_s和x_t的内积，

φ(x_t)为x_t的非线性映射函数，

φ(x_s)为x_s的非线性映射函数，

φ(x_s)^T为φ(x_s)的转置。

变量选择模块130：根据最小绝对收缩和选择算法变量选择方法，基于所述标准化数据和所述模型估计值，得到对所述力学性能影响较大的变量。

具体而言，所述变量选择模块中，还包括以下步骤:

基于所述损失函数中的最小值

得到极限值

并代入所述损失函数，得到损失函数极限值；

基于预设的损失变量δ，对所述损失函数极限值中的参数b,β,γ分别求偏导，得到参数偏导；

为了识别线性部分的重要变量，本发明提出了一种自适应的最小绝对收缩和选择算法变量选择方法 (LASSO)，并给出相应的损失函数，

所述损失函数为：

其中，为了更好地估计参数b_τ，β_τ，α_t，

令参数γ_τ＝α-α^*，且为了克服ρ_τ在0处的不可微性，本发明将在充分小的区间间隔(-δ,δ)上使用修改后的检查函数ρ_τ,δ，ρ_τ,δ定义如下：

实际值与预测值的差值r＝y-b-β^Tz-Kγ，

δ为预设的充分小的损失变量(几乎为0)，所述ρ_τ,δ(r)的应用范围为区间间隔(-δ,δ)，

I为对角线元素为1的矩阵，

参数γ＝α-α^*，

γ^T为γ的转置，

λ_j为第j个变量的调整参数，

P为变量的个数，

β_j为第j个变量的系数，

为第j个变量的压缩系数，

m为迭代次数。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述损失函数最小值为：

其中，Z是由

构成的k×p矩阵，

样本t＝1，2，···,k，

Z^T为Z的转置，

W是由w_tt组成的对角阵，

实际值与预测值的差值

b_τ为在τ分位点下的阙值，

K_τ为τ分位点下的核函数，

γ_τ为τ分位点下的α-α^*，

D^(m)为d×d对角矩阵，它的第j个对角分量由

给出，

1为元素为1的矩阵。

所述损失函数中的最小值

的极限值由

表示，由于极限值

是基于分位数和LASSO方法的组合而得到的，因此我们也将其称为分位数LASSO估计值。

具体而言，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述损失函数极限值为：

通过设置上述的足够小的δ，可以得到最优问题的一个很好的近似解。现在(14)式变成求上述损失函数极限值的最小值点b_τ,β_τ,γ_τ。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述参数偏导为：

其中，

为在循环l+1次时τ分位点下的阈值，

为在循环l+1次时τ分位点下变量的系数，

为在循环l+1次时τ分位点下的α-α^*，

1^T为元素为1的矩阵的转置，

D为d×d对角矩阵，它的第j个对角分量由

构成。

本发明中的LASSO变量选择方法是将无关因素或者影响较小的因素的系数压缩为0从而达到变量选择的目的，通过高效迭代加权最小二乘算法(IRWLS)的三个步聚实现。

具体而言，所述高效迭代加权最小二乘算法规则包括以下步骤：

设定参数b_τ,β_τ,γ_τ的初始值分别为

得到矩阵W，其中，

为在循环l次时τ分位点下的阈值，

为在循环l次时τ分位点下变量的系数，

为在循环l次时τ分位点下的α-α^*，

为

的转置；

从

中更新

循环迭代直到收敛，得到所述损失函数的最小值点的各参数值b_τ,β_τ,γ_τ，所述β_τ中包含对所述力学性能影响较大的变量。

参数获取模块140：基于第二预设规则和贝叶斯最小准则，得到相应的最终调整参数，基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数；

具体而言，所述参数获取模块中，还包括以下步骤：

基于第二预设规则，定义调整参数；

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述第二预设规则包括：

其中，n^-3/5a_n→0，

n^-11/10b_n→∞，

d为收宿参数，即若干个变量的个数，

d₀为最大收宿量，即从所述若干个变量里确定最终影响较大的变量的数量。

其中，

是未惩罚的估计值

的第j列，

λ₀为调整参数初始给定值，

λ_j为第j个变量的调整参数，

γ＝3/2，

λ₀n^-3/5→0，

λ₀n^-1/2→∞。

因此，原来关于λ∈R^d的d维问题变成了关于λ₀∈R¹的单变量问题。λ₀可以根据以下贝叶斯(BIC) 最小准则来选择。

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，所述贝叶斯最小准则为：

其中，由

确定的非零系数的个数df_λ为0≤df_λ≤d,

另外，本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中，需从众多调整参数中，选择出基于BIC最小准则的调整参数。所述最终调整参数为：

其中，v是预设超参数集，

Q_τ(y|z_t,x_t)为模型预测值，

H是帽子矩阵，且

(Q_τ(y|z₁,x₁),...,Q_τ(y|z_p,x_p))′＝Hy (23)

是H矩阵中的对应元素。

H也可以由(9)式和(12)式得到：

模型确定模块150：

根据所述变量、最终调整参数和所述惩罚参数、各预设核函数，得到具有不同所述预设核函数的各训练模型，利用所述标准化数据分别对所述训练模型进行回测，选择预测值与实测值最贴近的合适核函数，确定最终预测模型。

所述训练模型为：

其中，z_t、x_t为变量下的不同样本值，α_t、

为拉格朗日乘子数。

根据代入预设的不同核函数，可以得到基于不同核函数的各训练模型，以进行训练。

具体而言，在本发明的标准化数据中，可选择一定比例(如80％)的数据作为训练集，用于输入各所述训练模型得到各力学性能预测值，并与各实际值进行对比，选择与所述实际值最贴近的训练模型中所采用的核函数作为合适核函数。所述标准化数据中的剩余数据(如20％)作为测试集，用于输入代入了所述合适核函数的训练模型得到预测值，并与实际值进行对比，用于评价所述模型的预测准确度。

为评价各训练模型的预测准确度，本发明中，在使用测试集对各训练模型进行测试时，计算所述预测值与所述实际值之间平均绝对百分误差(MAPE)和均方根误差(RMSE)。

其中，f_i为测试样本i的模型预测值，m_i为测试样本i的实测值，q为数据的测试样本量。

另外，在一些实施例中，所述合适核函数为高斯核函数：

则所述最终预测模型为:

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有基于支持向量机分位数回归的钢材力学性能预测程序，所述基于支持向量机分位数回归的钢材力学性能预测程序被处理器执行时实现如下操作：

本发明之计算机可读存储介质的具体实施方式与上述基于支持向量机分位数回归的钢材力学性能预测方法的具体实施方式大致相同，在此不再赘述。

实施例1

基于LASSO变量选择支持向量机分位数回归对钢材力学性能预测具体实施步聚如下：

1.利用(1)式，对原始收集的热轧数据进行标准化处理，部分标准化数据如表1所示

表1、部分数据结构

2.选取合适的核函数

将标准化数据划分训练集和测试集，基于(25)式，采用所述训练集数据对代入了不同核函数的训练模型进行回测，根据回测的结果选择拟合效果最好的核函数，作为合适核函数，从而得到最终的预测模型。本实施例选择的核函数为高斯核函数。

3.确定影响因子以及调整参数与惩罚参数

根据

及

确定最终调整参数，同时利用

确定最终惩罚参数。

4.建立支持向量分位数回归模型，预测热轧产品的抗拉强度

根据(25)式

计算出对应的抗拉强度。

图3为本发明的一实施例的训练集的预测抗拉强度与实测抗拉强度对比示意图。

本模型的预测抗拉强度与实际抗拉强度如图3所示，预测值与实测值拟合程度较高。

图4为本发明的一实施例的训练集的拉伸强度预测值和测量值分布示意图。

如图4、5所示，结果表明，训练集和测试集上的预测值与实测值(即测量值)具有高度的相关性，因此新模型具有较高的预测精度。计算过程不需要人工干预或修正，抗拉强度预测值与实测值的偏差在合理范围内。根据表2的结果显示，本发明所提出基于LASSO变量选择支持向量机分位数回归的钢材力学性能预测方法是可行的，且相对其他FS(随机森林)、RF(前向选择法)预测方法而言，预测精度更高。

表2不同方法预测误差

实施例的作用与效果

根据本实施例所涉及的基于支持向量机分位数回归的钢材力学性能预测方法、装置、存储介质中，由于支持向量机可以解决建模中的非线性问题，分位数回归在实际应用中考虑整个分布等特性，能很好的处理数据异质性，对离群值不敏感，具有较好的“鲁棒”性。因此本实施例将支持向量机和分位数结合起来构造支持向量机分位数回归方法来预测钢材性能，对未来提高预测精度有很重要的意义。另外，本实施例的基于支持向量机分位数回归的钢材力学性能预测方法具有很强的扩展性和自适应性，解决建模中的非线性问题以及考虑极端值情况下的抗拉强度，有效改善和提高热轧产品力学性能的预测精度，具有较广泛的推广价值。

上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述第一预设规则包括：

X′＝atan(X)*2/π

3.根据权利要求1所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述获取模型估计值步骤中，还包括以下步骤：

4.根据权利要求3所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述支持向量回归机模型为：

f(x)＝m(x)＝w·φ(x)+b

5.根据权利要求4所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述最优参数解(w,b)为：

其中，C为惩罚参数，

k为样本总量，

x_t为样本t的自变量，

y_t为样本t的响应变量，

f(x_t)为样本t的解释变量x的预测值。

6.根据权利要求5所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述检验函数ρ_τ(u)为：

ρ_τ(u)＝u(τ-I(u))

其中，分位点τ∈(0,1)，

u为变量，

示性函数

7.根据权利要求6所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，将所述检验函数代入所述最优参数解得到：

其中，w为没有分位点情况下的权重向量，

所述w_τ为分位点τ上的权重向量，

β为变量系数，β_τ为在分位点τ下的变量系数，

为β_τ的转置，

z_t为与x_t定义相同的自变量，

为w_τ的转置，

φ(x_t)为解释变量x_t的非线性映射函数。

8.根据权利要求7所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述二次规划问题为：

其中，w^T为w的转置，

ξ_t、

分别为松弛变量。

9.根据权利要求8所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述第一约束条件包括：

其中，β^T为β的转置，

w^T为w的转置。

10.根据权利要求9所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述支持向量机分位数回归模型估计值为：

其中，α_t,

为样本t时的最优拉格朗日乘子数，

α为由α_t构成的拉格朗日乘子向量,

α^*为由α_t ^*构成的拉格朗日乘子向量,

矩阵

为z_t的转置，

U^T为U的转置，

响应变量y＝{y_t|t∈I_SV}，

为τ分位点下的预测值，

b_τ为在τ分位点下的阈值，

K为核函数,

K_t为样本t的核函数。

11.根据权利要求10所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述变量选择步骤中，还包括以下步骤:

基于所述损失函数中的最小值

得到极限值

并代入所述损失函数，得到损失函数极限值；

12.根据权利要求11所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述损失函数为：

其中，修改后检查函数

实际值与预测值的差值r＝y-b-β^Tz-Kγ，

δ为损失变量，所述ρ_τ,δ(r)的应用范围为区间间隔(-δ,δ)，

I为对角线元素为1的矩阵，

参数γ＝α-α^*，

γ^T为γ的转置，

λ_j为第j个变量的调整参数，

P为变量的个数，

β_j为第j个变量的系数，

为第j个变量的压缩系数，

m为迭代次数。

13.根据权利要求12所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述损失函数最小值为：

其中，Z是由

构成的k×p矩阵，

样本t＝1，2，···,k，

Z^T为Z的转置，

W是由w_tt组成的对角阵，

实际值与预测值的差值

b_τ为在τ分位点下的阙值，

K_τ为τ分位点下的核函数，

γ_τ为τ分位点下的α-α^*，

D^(m)为d×d对角矩阵，其第j个对角分量由

给出，

1为元素为1的矩阵。

14.根据权利要求13所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述损失函数极限值为：

15.根据权利要求14所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述参数偏导为：

其中，

为在循环l+1次时τ分位点下的阈值，

为在循环l+1次时τ分位点下变量的系数，

为在循环l+1次时τ分位点下的α-α^*，

1^T为元素为1的矩阵的转置，

D为d×d对角矩阵，其第j个对角分量由

构成。

16.根据权利要求15所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述高效迭代加权最小二乘算法规则包括以下步骤：

设定参数b_τ,β_τ,γ_τ的初始值分别为

得到矩阵W，

其中，

为在循环l次时τ分位点下的阈值，

为在循环l次时τ分位点下变量的系数，

为在循环l次时τ分位点下的α-α^*，

为

的转置；

从所述参数偏导中更新

17.根据权利要求16所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述参数获取步骤中，还包括以下步骤：

基于第二预设规则，定义调整参数；

18.根据权利要求17所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述第二预设规则包括：

其中，n^-3/5a_n→0，

n^-11/10b_n→∞，

d为收宿参数的个数，

d₀为最大收宿量。

19.根据权利要求18所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述调整参数为：

其中，

是未惩罚的估计值

的第j列，

λ₀为调整参数初始给定值，

λ_j为第j个变量的调整参数，

γ＝3/2，

λ₀n^-3/5→0，

λ₀n^-1/2→∞。

20.根据权利要求19所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述贝叶斯最小准则为：

其中，由

确定的非零系数的个数df_λ为0≤df_λ≤d,

21.根据权利要求20所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述最终调整参数为：

22.根据权利要求21所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述广义近似交叉验证模型为：

其中，v是预设超参数集，

Q_τ(y|z_t,x_t)为模型预测值，

H是帽子矩阵，且

(Q_τ(y|z₁,x₁),...,Q_τ(y|z_p,x_p))′＝Hy

H矩阵中的对应元素

23.根据权利要求22所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述训练模型为：

其中，z_t、x_t为同一变量下的不同样本值，

α_t、

为拉格朗日乘子数。

24.根据权利要求23所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述合适核函数为高斯核函数：

25.根据权利要求24所述的基于支持向量机分位数回归的钢材力学性能预测方法，其特征在于，所述最终预测模型为:

26.一种电子装置，其特征在于，该电子装置包括：存储器、处理器，所述存储器上存储有一种基于支持向量机分位数回归的钢材力学性能预测程序，所述一种基于支持向量机分位数回归的钢材力学性能预测程序被所述处理器执行时实现以下步骤：

27.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有所述基于支持向量机分位数回归的钢材力学性能预测程序，所述基于支持向量机分位数回归的钢材力学性能预测程序被处理器执行时实现如权利要求1至26中任意一项所述的基于支持向量机分位数回归的钢材力学性能预测方法的步骤。