CN111429979A - 一种基于支持向量机分位数回归的钢材力学性能预测方法 - Google Patents
一种基于支持向量机分位数回归的钢材力学性能预测方法 Download PDFInfo
- Publication number
- CN111429979A CN111429979A CN202010208411.5A CN202010208411A CN111429979A CN 111429979 A CN111429979 A CN 111429979A CN 202010208411 A CN202010208411 A CN 202010208411A CN 111429979 A CN111429979 A CN 111429979A
- Authority
- CN
- China
- Prior art keywords
- support vector
- quantile
- vector machine
- mechanical property
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 127
- 229910000831 Steel Inorganic materials 0.000 title claims abstract description 125
- 239000010959 steel Substances 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000003860 storage Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 98
- 239000013598 vector Substances 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 33
- 238000012360 testing method Methods 0.000 claims description 28
- 238000002790 cross-validation Methods 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 11
- 238000010187 selection method Methods 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000001568 sexual effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 229910000742 Microalloyed steel Inorganic materials 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005098 hot rolling Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000002436 steel type Substances 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 238000003723 Smelting Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009851 ferrous metallurgy Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 238000005272 metallurgy Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/20—Metals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Biochemistry (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Mathematical Optimization (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Investigating And Analyzing Materials By Characteristic Methods (AREA)
Abstract
本发明提出一种基于支持向量机分位数回归的钢材力学性能预测方法,包括以下步骤:数据处理;模型估计值获取;变量选择;参数获取;模型确定。本发明提供的基于支持向量机分位数回归的钢材力学性能预测方法、装置、存储介质,针对目前力学性能预测中不能同时考虑数据的异质性以及建模的因素之间的非线性的问题,提供了一种基于支持向量机分位数回归的钢材力学性能预测方法。
Description
技术领域
本发明涉及微合金钢热轧产品力学性能预测领域,具体涉及一种基于支持向量机分位数回归的钢材力学性能,尤其是热轧产品的抗拉强度预测方法。
背景技术
近年来,由于钢材广泛应用于建筑、桥梁等许多行业领域,钢材产品的需求呈现出高速增长态势;人们对钢材产品质量要求越来越严格,不仅要求钢材的力学性能符合标准,而且要求钢材有良好的表面质量。冶金工作者一直致力于降低冶金成本和提高钢材产品质量,因此在钢材冶炼之前对钢铁性能进行预测是必要的;然而,钢材产品性能的好坏取决于其内部组织,内部组织受到其本身成分、制造工艺等因素的影响,并且彼此之间存在着复杂的关系,同时微合金钢生产过程涉及到诸多物理、化学等反应,其过程中的不确定因素也难以测定和评估。热轧钢材组织性能预报一直是钢铁冶金行业关注的难点问题,是一项十分复杂的冶金前沿技术。因此,基于对实际大规模生产数据的适当处理,构建具有足够精度且相对可靠的钢材力学性能预报模型,实现钢材产品的抗拉强度等力学性能进行精准预测,并合理揭示影响钢材力学性能的因素,一直是钢铁企业关注的热点问题及重点问题。热轧钢材性能预报模型对产品力学性能的准确预测,有助于优化钢种成分、减少带钢取样量、控制产品力学性能、设计新产品。根据反馈的预测结果设置工艺参数,可以提高产品生产效率,增强企业竞争力。
目前针对钢铁性能预测领域主要分为机理建模和数据建模,机理建模的预测方法相对于其他建模方法而言,它能较好地反映出实际热轧过程中钢材组织结构的演变规律,具有一定的可靠性和普适性。然而仅包含能显著影响钢板性能的主要化学成分就达15种以上,而且还包括能显著影响钢板性能的多种工艺参数,也很难描述钢铁冶炼过程的各种非线性关系因此,基于物质机理的钢板性能研究方法,主要适用于单钢种,在多钢种存在一定的局限性,存在计算量繁杂庞大、效率低下、精度不高等缺陷。数据建模在一定程度上能解决这些问题,但是数据建模在该领域上的应用因起步较晚,在实际应用中还不能取得满意的效果。值得注意的是,一些传统的数据建模(人工神经网络)预测模型在确定训练参数时可能会出现预测结果的急剧波动。在寻找最小误差时,容易陷入局部最优。同时,从数据质量的角度来看,数据模型对样本数据的要求较高,这对实现数据模型的可靠性和可扩展性具有很大的影响。
发明内容
本发明是为了解决上述问题而进行的,针对目前力学性能预测中不能同时考虑数据的异质性以及建模的因素之间的非线性的问题,提供了一种基于支持向量机分位数回归的钢材力学性能预测方法。
为实现上述目的,本发明提出一种基于支持向量机分位数回归的钢材力学性能预测方法,具有这样的特征,包括以下步骤:
数据处理:基于第一预设规则对初始数据进行标准化处理,得到标准化数据;
模型估计值获取:定义支持向量机回归模型,根据所述标准化数据,得到支持向量机分位数回归模型估计值;
变量选择:根据最小绝对收缩和选择算法变量选择方法,基于所述标准化数据和所述模型估计值,得到对所述力学性能影响较大的变量;
参数获取:基于第二预设规则和贝叶斯最小准则,得到相应的最终调整参数,基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数;
模型确定:根据所述变量、最终调整参数和所述惩罚参数、各预设核函数,得到具有不同所述预设核函数的各训练模型,利用所述标准化数据分别对所述训练模型进行回测,选择预测值与实测值最贴近的合适核函数,确定最终预测模型。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述第一预设规则包括:
X′=atan(X)*2/π
其中,所述第一预设规则的映射区间为[0,1],所述性能数据X>0。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述获取模型估计值步骤中,还包括以下步骤:
基于所述支持向量机回归模型得到最优参数解,并将检验函数代入所述最优参数解;
引入松弛变量,得到代入了所述检验函数的所述最优参数解的二次规划问题;
根据第一约束条件,由所述二次规划问题得到所述支持向量机分位数回归模型估计值。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述支持向量回归机模型为:
f(x)=m(x)=w·φ(x)+b
其中,w为权重向量,b为阈值,x为解释变量,φ(x)为x的非线性映射函数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述最优参数解(w,b)为:
其中,C为惩罚参数,
k为样本总量,
xt为样本t的自变量,
yt为样本t的响应变量,
f(xt)为样本t的解释变量x的预测值。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述检验函数ρτ(u)为:
ρτ(u)=u(τ-I(u))
其中,分位点τ∈(0,1),
u为变量,
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,将所述检验函数代入所述最优参数解得到:
其中,w为没有分位点情况下的权重向量,
所述wτ为分位点τ上的权重向量,
β为变量系数,βτ为在分位点τ下的变量系数,
zt为与xt定义相同的自变量,
φ(xt)为解释变量xt的非线性映射函数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述二次规划问题为:
其中,wT为w的转置,
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述第一约束条件包括:
其中,βT为β的转置,
wT为w的转置。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述支持向量机分位数回归模型估计值为:
α为由αt构成的拉格朗日乘子向量,
α*为由αt *构成的拉格朗日乘子向量,
(bτ,βτ)T为在τ分位点下变量系数和阈值组成的向量的转置,
UT为U的转置,
响应变量y={yt|t∈ISV},
支持向量的索引集ISV={t=1,2,3...k|0<αt<τC,0<αt *<(1-τ)C},
bτ为在τ分位点下的阈值,
K为核函数,
Kt为样本t的核函数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述变量选择步骤中,还包括以下步骤:
基于最小绝对收缩和选择算法变量选择方法,得到相应的损失函数;
根据高效迭代加权最小二乘算法,基于所述参数偏导,循环迭代直至收敛,得到所述损失函数的最小值点的各参数值bτ,βτ,γτ,所述βτ中包含对所述力学性能影响较大的变量。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述损失函数为:
实际值与预测值的差值r=y-b-βTz-Kγ,
δ为损失变量,所述ρτ,δ(r)的应用范围为区间间隔(-δ,δ),
I为对角线元素为1的矩阵,
参数γ=α-α*,
γT为γ的转置,
λj为第j个变量的调整参数,
P为变量的个数,
βj为第j个变量的系数,
m为迭代次数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述损失函数最小值为:
样本t=1,2,···,k,
ZT为Z的转置,
W是由wtt组成的对角阵,
bτ为在τ分位点下的阙值,
Kτ为τ分位点下的核函数,
1为元素为1的矩阵。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述损失函数极限值为:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述参数偏导为:
1T为元素为1的矩阵的转置,
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述高效迭代加权最小二乘算法规则包括以下步骤:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述参数获取步骤中,还包括以下步骤:
基于第二预设规则,定义调整参数;
根据贝叶斯最小准则得到所述调整参数定义中的调整参数初始给定值λ0,并进一步得到每个变量的最终调整参数;
基于广义近似交叉验证模型的计算结果,作为所述支持向量分位数回归模型的最终惩罚参数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述第二预设规则包括:
定义相关系数和不相关系数的最大收缩量an=max{λj:1≤j≤d0},
相关系数和不相关系数的最小收缩量bn=min{λj:d0+1≤j≤d},
其中,n-3/5an→0,
n-11/10bn→∞,
d为收宿参数的个数,
d0为最大收宿量。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述调整参数为:
λ0为调整参数初始给定值,
λj为第j个变量的调整参数,
γ=3/2,
λ0n-3/5→0,
λ0n-1/2→∞。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述贝叶斯最小准则为:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述最终调整参数为:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述广义近似交叉验证模型为:
其中,v是预设超参数集,
Qτ(y|zt,xt)为模型预测值,
H是帽子矩阵,且
(Qτ(y|z1,x1),...,Qτ(y|zp,xp))′=Hy
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述训练模型为:
所述训练模型为:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述合适核函数为高斯核函数:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述最终预测模型为:
此外,为实现上述目的,本发明还提供了一种电子装置,其特征在于,该电子装置包括:存储器、处理器,所述存储器上存储有基于支持向量机分位数回归的钢材力学性能预测程序,所述基于支持向量机分位数回归的钢材力学性能预测程序被所述处理器执行时实现以下步骤:
数据处理模块:基于第一预设规则对初始数据进行标准化处理,得到标准化数据;
获取模型估计值模块:定义支持向量机回归模型,根据所述标准化数据,得到模型估计值;
变量选择模块:根据最小绝对收缩和选择算法变量选择方法,基于所述标准化数据和所述模型估计值,得到对所述力学性能影响较大的变量;
参数获取模块:基于第二预设规则和贝叶斯最小准则,得到相应的最终调整参数,基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数;
确定模型模块:根据所述变量、最终调整参数和所述惩罚参数、各预设核函数,得到具有不同所述预设核函数的各训练模型,利用所述标准化数据分别对所述训练模型进行回测,选择预测值与实测值最贴近的合适核函数,确定最终预测模型。
此外,为实现上述目的,本发明还提供了一种计算机可读存储介质,具有这样的特征,所述计算机可读存储介质上存储有所述基于支持向量机分位数回归的钢材力学性能预测程序,所述基于支持向量机分位数回归的钢材力学性能预测程序被处理器执行时实现上述基于支持向量机分位数回归的钢材力学性能预测方法的步骤。
发明作用和效果
本发明所涉及的基于支持向量机分位数回归的钢材力学性能预测方法、装置、存储介质中,由于支持向量机可以解决建模中的非线性问题,分位数回归在实际应用中考虑整个分布等特性,能很好的处理数据异质性,对离群值不敏感,具有较好的“鲁棒”性。因此本发明将支持向量机和分位数结合起来构造支持向量机分位数回归方法来预测钢材性能,对未来提高预测精度有很重要的意义。。另外,本发明的基于支持向量机分位数回归的钢材力学性能预测方法具有很强的扩展性和自适应性,解决建模中的非线性问题以及考虑极端值情况下的抗拉强度,有效改善和提高热轧产品力学性能的预测精度,具有较广泛的推广价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明电子装置一实施例的示意图;
图2示本发明的基于支持向量机分位数回归的钢材力学性能预测程序一实施例的程序模块图;
图3为本发明的一实施例的训练集的预测抗拉强度与实测抗拉强度对比示意图;
图4为本发明的一实施例的训练集的拉伸强度预测值和测量值分布示意图;
图5为本发明的一实施例的测试集的拉伸强度预测值和测量值分布示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下参照附图及实施例对本发明所涉及的一种基于支持向量机分位数回归的钢材力学性能预测方法作详细的描述。以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1是本发明电子装置一实施例的示意图;
本发明提供一种电子装置1。参照图1所示,为本发明电子装置1较佳实施例的示意图。
在本实施例中,该电子装置1包括存储器11、处理器12,网络接口13及通信总线。其中,通信总线用于实现这些组件之间的连接通信。
网络接口13可以包括标准的有线接口、无线接口(如WI-FI接口)。
存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中,所述可读存储介质可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。在另一些实施例中,所述可读存储介质也可以是所述电子装置1的外部存储设备,例如所述电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的基于支持向量机分位数回归的钢材力学性能预测程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行基于支持向量机分位数回归的钢材力学性能预测程序10等。
图1仅示出了具有组件11-13以及基于支持向量机分位数回归的钢材力学性能预测程序10的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选的,该电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置1还可以包括显示器,在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。显示器用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。
图2示本发明的基于支持向量机分位数回归的钢材力学性能预测程序一实施例的程序模块图。
在图1所示的装置实施例中,作为一种计算机存储介质的存储器11中包括基于支持向量机分位数回归的钢材力学性能预测程序10,处理器12执行存储器11中存储的基于支持向量机分位数回归的钢材力学性能预测程序10时包括以下模块:数据处理模块110,模型估计值获取模块120,变量选择模块 130,参数获取模块140,模型确定模块150。在本实施例中,基于支持向量机分位数回归的钢材力学性能预测程序10可以包括:
数据处理模块110:基于第一预设规则对初始数据进行标准化处理,得到标准化数据。
为了消除不同参数之间数据量级不同造成的影响,必须将数据进行标准化处理,经过标准化处理后的数据使网络性能得到提升,更加有利于后续分析与建模。本发明中可使用atan函数转换,或反正切函数来实现数据的归一化。
进一步,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述第一预设规则包括:
X′=atan(X)*2/π (1)
其中,所述第一预设规则的映射区间为[0,1],所述性能数据X>0。
使用这个方法需要注意的是如果想映射的区间为[0,1],则数据都应该大于等于0,小于0的数据将被映射到[-1,0]区间上。
模型估计值获取模块120:定义支持向量机回归模型,根据所述标准化数据,根据第一约束条件,得到支持向量机分位数回归模型估计值。
所述模型估计值获取模块中,还包括以下步骤:
基于所述支持向量机回归模型得到最优参数解,并将检验函数代入所述最优参数解;
引入松弛变量,得到代入了所述检验函数的所述最优参数解的二次规划问题;
根据第一约束条件,由所述二次规划问题得到所述支持向量机分位数回归模型估计值。
具体而言,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,支持向量机是由 Vapnik基于统计学习理论和结构风险最小化原则提出的,当支持向量机应用回归问题时,称为SVR。
所述支持向量回归机模型为:
f(x)=m(x)=w·φ(x)+b (2)
其中,w为权重向量,b为阈值,x为解释变量,φ(x)为x的非线性映射函数,即将输入向量X(即由自变量x组成的向量)投影到更高维的特征空间中。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述最优参数解 (w,b)为:
其中,C为惩罚参数,
k为样本总量,
xt为样本t的自变量,
yt为样本t的响应变量(因变量),
f(xt)为样本t的解释变量x的预测值。
引入分位数回归代替经典的均值回归,当x是解释变量而不是条件均值时,它为响应变量y整个条件分布提供了全面的策略及方法。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中检验函数(非对称损失函数)由Koenker提出,它可以通过最小化检验函数得到最优参数。所述检验函数ρτ(u)为:
ρτ(u)=u(τ-I(u)) (4)
其中,分位点τ∈(0,1),
u为变量,
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,将所述检验函数代入所述最优参数解,所述支持向量机分位数回归模型可通过求解得到:
其中,w为没有分位点情况下的权重向量,
所述wτ为分位点τ上的权重向量,
β为变量系数,βτ为在分位点τ下的变量系数,
zt为与xt定义相同的自变量,
φ(xt)为解释变量xt的非线性映射函数,即将输入向量X(即由自变量xt组成的向量)投影到更高维的特征空间中。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述二次规划问题为:
其中,wT为w的转置,
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,为了将(7)式转为规划问题,所述第一约束条件包括:
其中,βT为β的转置,
wT为w的转置。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,为了解决优化问题,引入松弛变量来构造拉格朗日函数,可得SVQR的估计量所述模型估计值如下:
α为由αt构成的拉格朗日乘子向量,
α*为由αt *构成的拉格朗日乘子向量,
(bτ,βτ)T为在τ分位点下变量系数和阈值组成的向量的转置,
UT为U的转置,
响应变量(或因变量)y={yt|t∈ISV},
支持向量的索引集ISV={t=1,2,3...k|0<αt<τC,0<αt *<(1-τ)C},
bτ为在τ分位点下的阈值,
K为核函数,
Kt为样本t的核函数,
Kt=K(xs,xt)=φ(xs)Tφ(xt),t∈ISV(s=1,2...T),
xs为样本s的自变量,
xt为样本t的自变量,
K(xs,xt)为xs和xt的内积,
φ(xt)为xt的非线性映射函数,
φ(xs)为xs的非线性映射函数,
φ(xs)T为φ(xs)的转置。
变量选择模块130:根据最小绝对收缩和选择算法变量选择方法,基于所述标准化数据和所述模型估计值,得到对所述力学性能影响较大的变量。
具体而言,所述变量选择模块中,还包括以下步骤:
基于最小绝对收缩和选择算法变量选择方法,得到相应的损失函数;
基于预设的损失变量δ,对所述损失函数极限值中的参数b,β,γ分别求偏导,得到参数偏导;
根据高效迭代加权最小二乘算法,基于所述参数偏导,循环迭代直至收敛,得到所述损失函数的最小值点的各参数值bτ,βτ,γτ,所述βτ中包含对所述力学性能影响较大的变量。
为了识别线性部分的重要变量,本发明提出了一种自适应的最小绝对收缩和选择算法变量选择方法 (LASSO),并给出相应的损失函数,
所述损失函数为:
实际值与预测值的差值r=y-b-βTz-Kγ,
δ为预设的充分小的损失变量(几乎为0),所述ρτ,δ(r)的应用范围为区间间隔(-δ,δ),
I为对角线元素为1的矩阵,
参数γ=α-α*,
γT为γ的转置,
λj为第j个变量的调整参数,
P为变量的个数,
βj为第j个变量的系数,
m为迭代次数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述损失函数最小值为:
样本t=1,2,···,k,
ZT为Z的转置,
W是由wtt组成的对角阵,
Kτ为τ分位点下的核函数,
1为元素为1的矩阵。
具体而言,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述损失函数极限值为:
通过设置上述的足够小的δ,可以得到最优问题的一个很好的近似解。现在(14)式变成求上述损失函数极限值的最小值点bτ,βτ,γτ。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述参数偏导为:
1T为元素为1的矩阵的转置,
本发明中的LASSO变量选择方法是将无关因素或者影响较小的因素的系数压缩为0从而达到变量选择的目的,通过高效迭代加权最小二乘算法(IRWLS)的三个步聚实现。
具体而言,所述高效迭代加权最小二乘算法规则包括以下步骤:
参数获取模块140:基于第二预设规则和贝叶斯最小准则,得到相应的最终调整参数,基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数;
具体而言,所述参数获取模块中,还包括以下步骤:
基于第二预设规则,定义调整参数;
根据贝叶斯最小准则得到所述调整参数定义中的调整参数初始给定值λ0,并进一步得到每个变量的最终调整参数;
基于广义近似交叉验证模型的计算结果,作为所述支持向量分位数回归模型的最终惩罚参数。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述第二预设规则包括:
定义相关系数和不相关系数的最大收缩量an=max{λj:1≤j≤d0},
相关系数和不相关系数的最小收缩量bn=min{λj:d0+1≤j≤d},
其中,n-3/5an→0,
n-11/10bn→∞,
d为收宿参数,即若干个变量的个数,
d0为最大收宿量,即从所述若干个变量里确定最终影响较大的变量的数量。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述调整参数为:
λ0为调整参数初始给定值,
λj为第j个变量的调整参数,
γ=3/2,
λ0n-3/5→0,
λ0n-1/2→∞。
因此,原来关于λ∈Rd的d维问题变成了关于λ0∈R1的单变量问题。λ0可以根据以下贝叶斯(BIC) 最小准则来选择。
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,所述贝叶斯最小准则为:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,需从众多调整参数中,选择出基于BIC最小准则的调整参数。所述最终调整参数为:
另外,本发明提出的基于支持向量机分位数回归的钢材力学性能预测方法中,还具有这样的特征,所述广义近似交叉验证模型为:
其中,v是预设超参数集,
Qτ(y|zt,xt)为模型预测值,
H是帽子矩阵,且
(Qτ(y|z1,x1),...,Qτ(y|zp,xp))′=Hy (23)
H也可以由(9)式和(12)式得到:
模型确定模块150:
根据所述变量、最终调整参数和所述惩罚参数、各预设核函数,得到具有不同所述预设核函数的各训练模型,利用所述标准化数据分别对所述训练模型进行回测,选择预测值与实测值最贴近的合适核函数,确定最终预测模型。
所述训练模型为:
根据代入预设的不同核函数,可以得到基于不同核函数的各训练模型,以进行训练。
具体而言,在本发明的标准化数据中,可选择一定比例(如80%)的数据作为训练集,用于输入各所述训练模型得到各力学性能预测值,并与各实际值进行对比,选择与所述实际值最贴近的训练模型中所采用的核函数作为合适核函数。所述标准化数据中的剩余数据(如20%)作为测试集,用于输入代入了所述合适核函数的训练模型得到预测值,并与实际值进行对比,用于评价所述模型的预测准确度。
为评价各训练模型的预测准确度,本发明中,在使用测试集对各训练模型进行测试时,计算所述预测值与所述实际值之间平均绝对百分误差(MAPE)和均方根误差(RMSE)。
其中,fi为测试样本i的模型预测值,mi为测试样本i的实测值,q为数据的测试样本量。
另外,在一些实施例中,所述合适核函数为高斯核函数:
则所述最终预测模型为:
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于支持向量机分位数回归的钢材力学性能预测程序,所述基于支持向量机分位数回归的钢材力学性能预测程序被处理器执行时实现如下操作:
数据处理:基于第一预设规则对初始数据进行标准化处理,得到标准化数据;
模型估计值获取:定义支持向量机回归模型,根据所述标准化数据,得到支持向量机分位数回归模型估计值;
变量选择:根据最小绝对收缩和选择算法变量选择方法,基于所述标准化数据和所述模型估计值,得到对所述力学性能影响较大的变量;
参数获取:基于第二预设规则和贝叶斯最小准则,得到相应的最终调整参数,基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数;
模型确定:根据所述变量、最终调整参数和所述惩罚参数、各预设核函数,得到具有不同所述预设核函数的各训练模型,利用所述标准化数据分别对所述训练模型进行回测,选择预测值与实测值最贴近的合适核函数,确定最终预测模型。
本发明之计算机可读存储介质的具体实施方式与上述基于支持向量机分位数回归的钢材力学性能预测方法的具体实施方式大致相同,在此不再赘述。
实施例1
基于LASSO变量选择支持向量机分位数回归对钢材力学性能预测具体实施步聚如下:
1.利用(1)式,对原始收集的热轧数据进行标准化处理,部分标准化数据如表1所示
表1、部分数据结构
2.选取合适的核函数
将标准化数据划分训练集和测试集,基于(25)式,采用所述训练集数据对代入了不同核函数的训练模型进行回测,根据回测的结果选择拟合效果最好的核函数,作为合适核函数,从而得到最终的预测模型。本实施例选择的核函数为高斯核函数。
3.确定影响因子以及调整参数与惩罚参数
4.建立支持向量分位数回归模型,预测热轧产品的抗拉强度
图3为本发明的一实施例的训练集的预测抗拉强度与实测抗拉强度对比示意图。
本模型的预测抗拉强度与实际抗拉强度如图3所示,预测值与实测值拟合程度较高。
图4为本发明的一实施例的训练集的拉伸强度预测值和测量值分布示意图。
图5为本发明的一实施例的测试集的拉伸强度预测值和测量值分布示意图。
如图4、5所示,结果表明,训练集和测试集上的预测值与实测值(即测量值)具有高度的相关性,因此新模型具有较高的预测精度。计算过程不需要人工干预或修正,抗拉强度预测值与实测值的偏差在合理范围内。根据表2的结果显示,本发明所提出基于LASSO变量选择支持向量机分位数回归的钢材力学性能预测方法是可行的,且相对其他FS(随机森林)、RF(前向选择法)预测方法而言,预测精度更高。
表2不同方法预测误差
实施例的作用与效果
根据本实施例所涉及的基于支持向量机分位数回归的钢材力学性能预测方法、装置、存储介质中,由于支持向量机可以解决建模中的非线性问题,分位数回归在实际应用中考虑整个分布等特性,能很好的处理数据异质性,对离群值不敏感,具有较好的“鲁棒”性。因此本实施例将支持向量机和分位数结合起来构造支持向量机分位数回归方法来预测钢材性能,对未来提高预测精度有很重要的意义。另外,本实施例的基于支持向量机分位数回归的钢材力学性能预测方法具有很强的扩展性和自适应性,解决建模中的非线性问题以及考虑极端值情况下的抗拉强度,有效改善和提高热轧产品力学性能的预测精度,具有较广泛的推广价值。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (27)
1.一种基于支持向量机分位数回归的钢材力学性能预测方法,其特征在于,包括以下步骤:
数据处理:基于第一预设规则对初始数据进行标准化处理,得到标准化数据;
模型估计值获取:定义支持向量机回归模型,根据所述标准化数据,得到支持向量机分位数回归模型估计值;
变量选择:根据最小绝对收缩和选择算法变量选择方法,基于所述标准化数据和所述模型估计值,得到对所述力学性能影响较大的变量;
参数获取:基于第二预设规则和贝叶斯最小准则,得到相应的最终调整参数,基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数;
模型确定:根据所述变量、最终调整参数和所述惩罚参数、各预设核函数,得到具有不同所述预设核函数的各训练模型,利用所述标准化数据分别对所述训练模型进行回测,选择预测值与实测值最贴近的合适核函数,确定最终预测模型。
2.根据权利要求1所述的基于支持向量机分位数回归的钢材力学性能预测方法,其特征在于,所述第一预设规则包括:
X′=atan(X)*2/π
其中,所述第一预设规则的映射区间为[0,1],所述性能数据X>0。
3.根据权利要求1所述的基于支持向量机分位数回归的钢材力学性能预测方法,其特征在于,所述获取模型估计值步骤中,还包括以下步骤:
基于所述支持向量机回归模型得到最优参数解,并将检验函数代入所述最优参数解;
引入松弛变量,得到代入了所述检验函数的所述最优参数解的二次规划问题;
根据第一约束条件,由所述二次规划问题得到所述支持向量机分位数回归模型估计值。
4.根据权利要求3所述的基于支持向量机分位数回归的钢材力学性能预测方法,其特征在于,所述支持向量回归机模型为:
f(x)=m(x)=w·φ(x)+b
其中,w为权重向量,b为阈值,x为解释变量,φ(x)为x的非线性映射函数。
17.根据权利要求16所述的基于支持向量机分位数回归的钢材力学性能预测方法,其特征在于,所述参数获取步骤中,还包括以下步骤:
基于第二预设规则,定义调整参数;
根据贝叶斯最小准则得到所述调整参数定义中的调整参数初始给定值λ0,并进一步得到每个变量的最终调整参数;
基于广义近似交叉验证模型的计算结果,作为所述支持向量分位数回归模型的最终惩罚参数。
18.根据权利要求17所述的基于支持向量机分位数回归的钢材力学性能预测方法,其特征在于,所述第二预设规则包括:
定义相关系数和不相关系数的最大收缩量an=max{λj:1≤j≤d0},
相关系数和不相关系数的最小收缩量bn=min{λj:d0+1≤j≤d},
其中,n-3/5an→0,
n-11/10bn→∞,
d为收宿参数的个数,
d0为最大收宿量。
26.一种电子装置,其特征在于,该电子装置包括:存储器、处理器,所述存储器上存储有一种基于支持向量机分位数回归的钢材力学性能预测程序,所述一种基于支持向量机分位数回归的钢材力学性能预测程序被所述处理器执行时实现以下步骤:
数据处理模块:基于第一预设规则对初始数据进行标准化处理,得到标准化数据;
获取模型估计值模块:定义支持向量机回归模型,根据所述标准化数据,得到模型估计值;
变量选择模块:根据最小绝对收缩和选择算法变量选择方法,基于所述标准化数据和所述模型估计值,得到对所述力学性能影响较大的变量;
参数获取模块:基于第二预设规则和贝叶斯最小准则,得到相应的最终调整参数,基于广义近似交叉验证模型选择所述支持向量分位数回归模型的最终惩罚参数;
确定模型模块:根据所述变量、最终调整参数和所述惩罚参数、各预设核函数,得到具有不同所述预设核函数的各训练模型,利用所述标准化数据分别对所述训练模型进行回测,选择预测值与实测值最贴近的合适核函数,确定最终预测模型。
27.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有所述基于支持向量机分位数回归的钢材力学性能预测程序,所述基于支持向量机分位数回归的钢材力学性能预测程序被处理器执行时实现如权利要求1至26中任意一项所述的基于支持向量机分位数回归的钢材力学性能预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010208411.5A CN111429979A (zh) | 2020-03-23 | 2020-03-23 | 一种基于支持向量机分位数回归的钢材力学性能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010208411.5A CN111429979A (zh) | 2020-03-23 | 2020-03-23 | 一种基于支持向量机分位数回归的钢材力学性能预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111429979A true CN111429979A (zh) | 2020-07-17 |
Family
ID=71549704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010208411.5A Pending CN111429979A (zh) | 2020-03-23 | 2020-03-23 | 一种基于支持向量机分位数回归的钢材力学性能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429979A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113198835A (zh) * | 2021-04-28 | 2021-08-03 | 北京科技大学 | 一种基于Adam-SVM模型的AH36级热轧球扁钢制备方法 |
CN116682505A (zh) * | 2023-06-14 | 2023-09-01 | 东北大学 | 一种基于分位数回归森林的hrb400e钢材力学性能预测方法 |
-
2020
- 2020-03-23 CN CN202010208411.5A patent/CN111429979A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113198835A (zh) * | 2021-04-28 | 2021-08-03 | 北京科技大学 | 一种基于Adam-SVM模型的AH36级热轧球扁钢制备方法 |
CN116682505A (zh) * | 2023-06-14 | 2023-09-01 | 东北大学 | 一种基于分位数回归森林的hrb400e钢材力学性能预测方法 |
CN116682505B (zh) * | 2023-06-14 | 2023-11-21 | 东北大学 | 一种基于分位数回归森林的hrb400e钢材力学性能预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Su et al. | On time-varying factor models: Estimation and testing | |
Bandara et al. | MSTL: A seasonal-trend decomposition algorithm for time series with multiple seasonal patterns | |
Kneip et al. | A new panel data treatment for heterogeneity in time trends | |
Ng | Variable selection in predictive regressions | |
Meinshausen et al. | Monte Carlo methods for the valuation of multiple‐exercise options | |
CN106980910B (zh) | 中长期电力负荷测算系统及方法 | |
Guggenberger et al. | A more powerful subvector Anderson Rubin test in linear instrumental variables regression | |
CN111429979A (zh) | 一种基于支持向量机分位数回归的钢材力学性能预测方法 | |
CN112907062A (zh) | 融合温度特征的电网电量预测方法、装置、介质及终端 | |
CN112330153A (zh) | 基于非线性正交回归的行业规模预测模型建模方法及装置 | |
CN114154716B (zh) | 一种基于图神经网络的企业能耗预测方法及装置 | |
Pál et al. | Fitted value function iteration with probability one contractions | |
Sun et al. | Online renewable smooth quantile regression | |
JPH06337852A (ja) | ニューラルネットワークによる時系列予測方法 | |
Canova et al. | Estimating overidentified, non-recursive, time varying coefficients structural VARs | |
CN107704944B (zh) | 一种基于信息论学习的股市波动区间预测模型的构建方法 | |
Bee et al. | Realized extreme quantile: A joint model for conditional quantiles and measures of volatility with EVT refinements | |
CN117277312A (zh) | 一种基于灰色关联分析的电力负荷影响因素方法及设备 | |
CN104200283A (zh) | 一种基于因子-主属性模型的中长期电力负荷预测方法 | |
Mohd Lip et al. | Comparative study of smoothing methods and box-jenkins model in forecasting unemployment rate in Malaysia | |
CN114692529A (zh) | 一种cfd高维响应的不确定度量化方法、装置、计算机设备 | |
CN114238102A (zh) | 一种基于复合变量特性的分阶段工作量预测方法及系统 | |
Chou et al. | Risk evaluations with robust approximate factor models | |
CN112529268A (zh) | 一种基于流形学习的中短期负荷预测方法及装置 | |
Saito et al. | Robustness of non-homogeneous gamma process-based software reliability models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200717 |