CN111444963A - 一种基于ssa-svr模型的高炉铁水硅含量预测方法 - Google Patents

一种基于ssa-svr模型的高炉铁水硅含量预测方法 Download PDF

Info

Publication number
CN111444963A
CN111444963A CN202010226187.2A CN202010226187A CN111444963A CN 111444963 A CN111444963 A CN 111444963A CN 202010226187 A CN202010226187 A CN 202010226187A CN 111444963 A CN111444963 A CN 111444963A
Authority
CN
China
Prior art keywords
svr
data
component
prediction model
silicon content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010226187.2A
Other languages
English (en)
Other versions
CN111444963B (zh
Inventor
尹林子
陈思
蒋朝辉
许雪梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010226187.2A priority Critical patent/CN111444963B/zh
Publication of CN111444963A publication Critical patent/CN111444963A/zh
Application granted granted Critical
Publication of CN111444963B publication Critical patent/CN111444963B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Manufacturing & Machinery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Manufacture Of Iron (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于SSA‑SVR模型的高炉铁水硅含量预测方法,所述方法包括以下步骤:S1、对原始数据进行预处理;S2、经奇异谱分析/SSA方法进行数据降噪:将样本数据分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量,然后基于改进的奇异谱分析判决方法去除噪声分量,将趋势分量和波动分量重构为去噪数据集;S3、SVR建模与优化;S4、硅含量预测。本方法使得高炉铁水硅含量的预测更准确。

Description

一种基于SSA-SVR模型的高炉铁水硅含量预测方法
技术领域
本发明涉及高炉铁水硅含量预测技术领域,尤其涉及一种基于SSA-SVR模型的高炉铁水硅含量预测方法。
背景技术
在高炉炼铁过程中,铁水中的硅含量是高炉优化控制的关键参数。因此,建立一个合理准确预测硅含量的模型可以为高炉操作者提前判断炉况变化趋势以及调控幅度提供参考依据,进而保证炼铁过程顺利进行,使得铁水质量保持在正常范围内,从而遏制可能发生的故障并降低能耗。
由于高炉冶炼数据具有强烈的非线性特征,基于支持向量机(SVM)的硅含量预测模型研究成为了当前的主流方法之一,现有技术中有采用最小二乘法支持向量机模型,有将小波理论与支持向量机结合建立预测模型,但支持向量机预测的效果在很大程度上依赖于良好的训练集。然而,由于机理复杂、环境恶劣、高温高压等因素的影响,高炉冶炼过程中采集的数据中含有大量噪声,因此,必须采取合理的方法降低数据噪声才能获得准确的预测模型。
发明内容
(一)要解决的技术问题
基于上述问题,本发明提供一种基于SSA-SVR模型的高炉铁水硅含量预测方法,采用奇异谱分析/SSA方法降低数据噪声,使得支持向量机回归/SVR的硅含量预测模型的预测更准确。
(二)技术方案
基于上述的技术问题,本发明提供一种基于SSA-SVR模型的高炉铁水硅含量预测方法,所述方法包括以下步骤:
S1、对原始数据进行预处理:选取决策属性数据即硅含量数据,及与硅含量相关的条件属性数据,补全缺失值,对数据进行归一化处理,获得模型所需要的训练数据集和测试数据集;
S2、经奇异谱分析/SSA方法进行数据降噪:将所述训练数据集的一种条件属性数据分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量,然后基于改进的奇异谱分析判决方法去除噪声分量,将趋势分量和波动分量重构为去噪数据集,再对所述训练数据集中的其它条件属性数据重复步骤S2;
S3、SVR建模与优化:建立SVR预测模型,并利用十字交叉算法对SVR参数寻优,将得到的最佳参数传递给所述SVR预测模型;
S4、硅含量预测:利用所述训练数据集训练得到的所述SVR预测模型对高炉铁水中的硅含量进行预测。
进一步的,步骤S1所述的与硅含量相关的条件属性数据采用粗糙集进行约简,所述的与硅含量相关的条件属性数据包括:富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度。
进一步的,步骤S2包括以下步骤:
S2.1、分解分量:将所述训练数据集的一种条件属性数据分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量;包括以下步骤:
S2.1.1、构造轨迹矩阵,所述轨迹矩阵为:
Figure BDA0002427730830000031
其中K=n-L+1,L为窗口长度,2≤L≤n,n为训练数据集的数据总个数,yk为一种条件属性数据的训练数据集的原始数据,k=1,2,…,n;
S2.1.2、奇异值分解:采用协方差矩阵S=XXT,然后利用S的奇异值分解方法生成L个奇异值,即特征值λ1,λ2,...,λL,以及对应的特征向量U1,U2,...,UL,从L个奇异值中选出d个不为0的奇异值,则所述轨迹矩阵重写为:
X=X1+X2+...+Xd,0<d≤L,
其中,
Figure BDA0002427730830000032
I=1,2,…,d,λI、UI分别为奇异值及其对应的特征向量,向量VI为主成分向量;
S2.2、分量重构:基于改进的奇异谱分析判决方法去除噪声分量,将趋势分量和波动分量重构为去噪数据集;包括以下步骤:
S2.2.1、分组:第一个奇异值代表原始数据的变化趋势,即为趋势分量,再基于改进的奇异谱分析判决方法去除噪声分量,得到波动分量;
S2.2.2、重构:通过对角平均,通过如下公式将每一个XI转为一个时间序列,该时间序列是初始时间序列的一个和分量,即
Figure BDA0002427730830000041
其中,yk *为该时间序列的子项,表示一种条件属性数据的训练数据集的重构数据,k=1,2,…,n,zpq表示一个(L×K)的对角平均转移矩阵Z的每一个元素,1≤p≤L,1≤q≤K,
Figure BDA0002427730830000042
L*=min(L,K),K*=max(L,K),n=K+L-1。
进一步的,所述步骤S2.2.1中所述的改进的奇异谱分析判决方法包括:
S2.2.1.1、构建奇异值曲线图:横轴为第I个奇异值,纵轴为奇异值λI
S2.2.1.2、对不包含第一个奇异值部分的奇异值曲线进行微分,获得奇异值斜率变化曲线f(λI);
S2.2.1.3、设置阈值a,若f(λI)>a,则表明第I个奇异值属于波动分量,否则属于噪声分量。
进一步的,所述步骤S3包括以下步骤:
S3.1、基于支持向量机回归建立SVR预测模型:将步骤S1中所述的条件属性数据作为所述SVR预测模型的输入向量,将步骤S1中所述的决策属性数据作为所述SVR预测模型的输出向量;
S3.2、对所述SVR模型执行十字交叉算法,求解SVR预测模型的最佳参数;
S3.3、将上述求得的最佳参数传递给SVR预测模型,训练样本数据建立最佳SVR预测模型。
进一步的,所述步骤S3.1包括以下步骤:
S3.1.1、设置所述SVR预测模型的输入量为条件属性数据xt,设置所述SVR预测模型的输出向量为对应条件属性数据xt的决策属性数据yt,其中t=1,2,3…,n;
S3.1.2、将所述的条件属性数据xt和所述的决策属性数据yt构成数据集(xt,yt)并采用非线性映射核函数将数据映射到高维空间,构成所述SVR预测模型函数;
S3.1.3、引入非负的松弛变量和拉格朗日函数,利用库恩塔克条件,将SVR预测模型函数f(x)写为
Figure BDA0002427730830000051
其中,αt,αt *是拉格朗日乘子,k(xt,x)是核函数,b为SVR预测模型阈值;
S3.1.4、确定所述核函数,建立所述SVR预测模型。
进一步的,步骤S3.1.4所述的核函数为高斯核函数,则所述SVR预测模型为:
Figure BDA0002427730830000061
其中,σ为高斯核函数的带宽。
(三)有益效果
本发明的上述技术方案具有如下优点:
(1)本发明解决了异常数据和含有噪声数据导致的建模不可靠的问题,将奇异谱分析SSA方法引入高炉冶炼数据处理,将数据分解为趋势分量、波动分量以及噪声分量,在保留有效数据分量的前提下,去除噪声分量,大大降低了建立不可靠模型的风险,能有效防止预测模型出现过拟合、甚至不稳定的现象,提高预测模型的准确度;
(2)本发明提出了一种改进的奇异谱分析判决方法,该方法对奇异值曲线进行微分,建立奇异值斜率变化曲线图,并定义阈值,实现噪声分量与波动分量分割的稳定性,有效区分波动分量和噪声分量,提高了降噪的有效性,避免传统人为选择的随意性与不确定性,从而提高预测模型的精确性;
(3)本发明基于支持向量机回归建立SVR模型能够很好地作用于非线性系统,具有良好的泛化能力。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明基于SSA-SVR模型的高炉铁水硅含量预测方法的流程图;
图2为本发明实施例采集的部分原始数据表;
图3为本发明实施例的奇异值曲线图;
图4为本发明实施例的奇异值斜率变化曲线图;
图5为本发明实施例的趋势分量重构图;
图6为本发明实施例的波动分量重构图;
图7为本发明实施例的降噪前硅含量数据图;
图8为本发明实施例的降噪后硅含量数据图;
图9为本发明实施例的SSA-SVR预测模型硅含量的预测结果图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明公开了一种基于SSA-SVR模型的高炉铁水硅含量预测方法,如图1所示,包括以下步骤:
S1、对数据进行预处理:
选取决策属性数据即硅含量数据,及与硅含量相关的条件属性数据,对于数据中含有缺失值的现象,采取人工筛选进行取值;同时,为了消除量纲的影响,对数据进行归一化处理,并获得模型所需要的训练数据集和测试数据集。
实施例一以国内某钢铁厂2650m3高炉为应用对象,选取2017年10月,共735条数据。该数据包含富氧率,透气性指数,标准风速,冷风流量,鼓风动能,顶压,富氧压力,全压差,理论燃烧温度等15种指标数据,以及其对应的硅含量数据。本文采用粗糙集对15种指标数据进行约简,选取出与硅含量相关的11种指标建立SSA-SVR预测模型,包括富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度,这11种指标数据为条件属性数据,硅含量数据为决策属性数据,条件属性数据和决策属性数据的部分采集数据如图2所示,按步骤S1进行预处理后,对736条数据按照8:2的比例划分训练数据集和测试数据集。
S2、经奇异谱分析/SSA方法进行数据降噪;由于数据采集是处于复杂多变的工业现场,导致数据中含有噪声,因此采用奇异谱分析/SSA方法对数据进行降噪处理:将所述训练数据集的一种条件属性数据分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量,然后基于改进的奇异谱分析判决方法去除噪声分量,将趋势分量和波动分量重构为去噪数据集,再对所述训练数据集中的其它条件属性数据重复步骤S2。此过程可分为两个阶段:分解分量和分量重构,即
S2.1、分解分量:将所述训练数据集的一种条件属性数据,分别分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量;此过程又可分为两个阶段:构造轨迹矩阵和奇异值分解(SVD);
S2.1.1、构造轨迹矩阵:
假设有一维时间序列数据Y(t)={y1,y2,…,yn}表示一种条件属性数据的训练数据集,子项yk表示一种条件属性数据的训练数据集的原始数据,k=1,2,…,n,选择合适的窗口长度L(2≤L≤n),将Y(t)转化为轨迹矩阵:
Figure BDA0002427730830000091
其中K=n-L+1,n为训练数据集的数据总个数。
在实施例一中,n=589,以一天24小时作为一个周期,选择窗口长度L=24,K=565,yk表示富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度中的一种条件属性数据的训练数据集数据。
S2.1.2、奇异值分解(SVD):
在这一步骤中,采用协方差矩阵S=XXT,然后利用S的奇异值分解方法生成一系列奇异值(特征值)λ1,λ2,…,λL以及对应的一系列特征向量U1,U2,…,UL,从L个奇异值中选出d个不为0的奇异值,则轨迹矩阵可重写为:
X=X1+X2+…+Xd,0<d≤L
其中,
Figure BDA0002427730830000101
I=1,2,…,d,λI、UI分别为奇异值及其对应的特征向量,向量VI为主成分向量。
对所述条件属性数据及其对应的硅含量数据进行SVD分解,在这一阶段,奇异谱分析SSA只需要考虑窗口长度L这一参数。
S2.2、分量重构:去除噪声分量,将趋势分量和波动分量重构为去噪数据集;此过程也可分为两个阶段:分组和重构;
S2.2.1、分组:
进行奇异值分解后,将得到的式子分解为若干组,并在这些组中求和。具体来说就是,将(1,2,…,d)分解为m个不相交的组(I1,I2,…,Im)。假设I={i1,i2,…,ir},m×r=d,则每个XI可分解为:
Figure BDA0002427730830000102
因此,
Figure BDA0002427730830000103
在此分组过程中,需要能准确分辨出每个奇异值所代表的分量类型,也就是说,它属于趋势分量,还是波动分量或者噪声分量。由于奇异值的大小代表了该奇异值所对应的特征向量对原始序列的贡献高低。即奇异值越大,其对应的特征向量所含信息越高,即奇异值越大,其对应的特征向量越重要,越不能被摒弃。
通常,第一个奇异值代表原始数据的变化趋势,即为趋势分量。后面的奇异值则包含了波动分量与噪声分量,并且越到后面,低频信号越强,噪声分量越明显。但是,很多奇异值的大小相差并不是很大,也就是说它们之间的相关性很强,属于同一种类型分量概率很大,导致波动与噪声的界限(即中低频边界)十分模糊。因此,提出了一种改进的奇异谱分析判决方法来解决低频边界选择问题,包括以下步骤:
S2.2.1.1、构建奇异值曲线图;
S2.2.1.2、对不包含第一个奇异值部分的奇异值曲线进行微分,获得奇异值斜率变化曲线f(λI);
S2.2.1.3、设置阈值a,若f(λI)>a,则表明第I个奇异值属于波动分量,否则属于噪声分量。
该方法采用求导的方式量化波动分量与噪声分量之间的区别,这样可以避免在对每个属性数据进行降噪时标准不统一的问题,同时,微分方法可以较好分辨波动分量与噪声分量之间的差异。当出现斜率小于a的值时,即可判定此奇异值代表噪声。
实施例一的奇异值曲线如图3所示,横轴为奇异值数,表示第I个奇异值,纵轴为奇异值λI;不包含第一个奇异值部分的奇异值斜率变化曲线如图4所示,横轴为奇异值数,纵轴为奇异值斜率;经过多次试验,设置导数阈值a为0.5时效果最佳,因此,当出现斜率小于0.5的值时,即可判定此奇异值代表噪声分量,从图4中可以看出前四个点可以判定为包含波动分量的奇异值。
S2.2.2、重构:
通过对角平均,通过如下公式将每一个XI转为一个时间序列,该时间序列是初始时间序列的一个和分量。
Figure BDA0002427730830000121
其中,yk *为该时间序列的子项,表示一种条件属性数据的训练数据集的重构数据,k=1,2,…,n,zpq表示一个(L×K)的对角平均转移矩阵Z的每一个元素,1≤p≤L,1≤q≤K,
Figure BDA0002427730830000122
L*=min(L,K),K*=max(L,K),n=K+L-1。
实施例一的趋势分量和波动分量通过重构公式得到的重构图分别如图5和图6所示,横轴为所述训练数据集的数据条数,纵轴为对应的趋势分量值和波动分量值;
为了验证降噪结果的效果,采用以下公式对其进行验证:
Figure BDA0002427730830000123
Figure BDA0002427730830000124
Figure BDA0002427730830000125
其中,yk代表原始数据,yk *代表重构数据;SNR代表信噪比,其值越低表示噪声越高,通过增加信噪比的值,可以减少信号中的噪声,N为测试数据集的数据总个数,N=147;MSE是均方误差,其值越小越好,n为训练数据集的数据总个数,n=589;PSNR是峰值信噪比,其值越大越好。
图7和图8分别为实施例一的降噪前和降噪后的硅含量数据对比图,横轴为所述训练数据集的数据条数,纵轴为硅的百分含量,信噪比SNR为25.5822,峰值信噪比PSNR为31.0310,均方误差MSE为0.0007。
S3、SVR建模与优化;建立SVR预测模型,并利用十字交叉算法对SVR参数寻优,将得到的最佳参数传递给SVR预测模型;
S3.1、基于支持向量机回归建立SVR预测模型:将条件属性数据作为所述SVR预测模型的输入向量,将决策属性数据作为所述SVR预测模型的输出向量;
S3.1.1、设置所述SVR预测模型的输入量为条件属性数据xt,设置所述SVR预测模型的输出向量为对应条件属性数据xt的决策属性数据yt,其中t=1,2,3…,n;
S3.1.2、将所述的条件属性数据xt和所述的决策属性数据yt构成数据集(xt,yt)并采用非线性映射核函数将数据映射到高维空间,构成所述SVR预测模型函数:
Figure BDA0002427730830000131
其中,w是高维空间元素,
Figure BDA0002427730830000141
是非线性映射函数,b为SVR预测模型阈值;
S3.1.3、引入非负的松弛变量和拉格朗日函数,利用库恩塔克条件(KKT)条件,可将SVR预测模型函数f(x)写为:
Figure BDA0002427730830000142
其中,αt,αt *是拉格朗日乘子,k(xt,x)是核函数,n为训练数据集的数据总个数;
S3.1.4、确定所述SVR模型的核函数为高斯核函数
Figure BDA0002427730830000143
建立所述SVR模型:
Figure BDA0002427730830000144
其中,σ为高斯核函数的带宽;
S3.2、对所述SVR模型执行十字交叉算法,求解SVR预测模型的最佳参数;
S3.3、将上述求得的最佳参数传递给SVR预测模型,训练样本数据建立最佳SVR预测模型。
实施例一采用径向基函数作为支持向量机回归的核函数,并采用交叉验证结合网格搜索法寻找最佳参数,选取C=4.7,σ=0.0278,C为支持向量机回归中的惩罚参数,建立最佳SVR预测模型,预测结果如图9所示,横轴为所述测试数据集的数据条数,纵轴为硅的百分含量。
为了能进一步定量地看出预测结果和性能,本发明采用了几种传统的统计方法,平均绝对误差MAE,均方误差MSE,此外,还计算了误差在±0.1%内的准确率。
Figure BDA0002427730830000151
其中,y′t为模型预测值yt对应的实际值,N为测试数据集的数据总个数,N=147,经计算,预测误差在0.1%内准确率为93.88%,平均绝对误差MAE为0.0405,均方误差MSE为0.0029,因此,预测模型的硅含量预测值较为准确。
S4、硅含量预测:利用训练数据集训练得到的所述SVR预测模型对高炉铁水中的硅含量进行预测。
综上可知,通过上述的一种基于SSA-SVR的高炉铁水硅含量预测方法,具有以下优点:
(1)本发明解决了异常数据和含有噪声数据导致的建模不可靠的问题,将奇异谱分析SSA方法引入高炉冶炼数据处理,将数据分解为趋势分量、波动分量以及噪声分量,在保留有效数据分量的前提下,去除噪声分量,大大降低了建立不可靠模型的风险,能有效防止预测模型出现过拟合、甚至不稳定的现象,提高预测模型的准确度;
(2)本发明提出了一种改进的奇异谱分析判决方法,该方法对奇异值曲线进行微分,建立奇异值斜率变化曲线图,并定义阈值,实现噪声分量与波动分量分割的稳定性,有效区分波动分量和噪声分量,提高了降噪的有效性,避免传统人为选择的随意性与不确定性,从而提高预测模型的精确性;
(3)本发明基于支持向量机回归建立SVR模型能够很好地作用于非线性系统,具有良好的泛化能力。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (7)

1.一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,所述方法包括以下步骤:
S1、对原始数据进行预处理:选取决策属性数据即硅含量数据,及与硅含量相关的条件属性数据,补全缺失值,对数据进行归一化处理,获得模型所需要的训练数据集和测试数据集;
S2、经奇异谱分析/SSA方法进行数据降噪:将所述训练数据集的一种条件属性数据分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量,然后基于改进的奇异谱分析判决方法去除噪声分量,将趋势分量和波动分量重构为去噪数据集,再对所述训练数据集中的其它条件属性数据重复步骤S2;
S3、SVR建模与优化:建立SVR预测模型,并利用十字交叉算法对SVR参数寻优,将得到的最佳参数传递给所述SVR预测模型;
S4、硅含量预测:利用所述训练数据集训练得到的所述SVR预测模型对高炉铁水中的硅含量进行预测。
2.根据权利要求1所述的一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S1所述的与硅含量相关的条件属性数据采用粗糙集进行约简,所述的与硅含量相关的条件属性数据包括:富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度。
3.根据权利要求1所述的一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S2包括以下步骤:
S2.1、分解分量:将所述训练数据集的一种条件属性数据分解为独立的具有解释性的分量,包括趋势分量、波动分量和噪声分量;包括以下步骤:
S2.1.1、构造轨迹矩阵,所述轨迹矩阵为:
Figure FDA0002427730820000021
其中K=n-L+1,L为窗口长度,2≤L≤n,n为训练数据集的数据总个数,yk为一种条件属性数据的训练数据集的原始数据,k=1,2,…,n;
S2.1.2、奇异值分解:采用协方差矩阵S=XXT,然后利用S的奇异值分解方法生成L个奇异值,即特征值λ1,λ2,…,λL,以及对应的特征向量U1,U2,…,UL,从L个奇异值中选出d个不为0的奇异值,则所述轨迹矩阵重写为:
X=X1+X2+…+Xd,0<d≤L,
其中,
Figure FDA0002427730820000022
λI、UI分别为奇异值及其对应的特征向量,向量VI为主成分向量;
S2.2、分量重构:基于改进的奇异谱分析判决方法去除噪声分量,将趋势分量和波动分量重构为去噪数据集;包括以下步骤:
S2.2.1、分组:第一个奇异值代表原始数据的变化趋势,即为趋势分量,再基于改进的奇异谱分析判决方法去除噪声分量,得到波动分量;
S2.2.2、重构:通过对角平均,通过如下公式将每一个XI转为一个时间序列,该时间序列是初始时间序列的一个和分量,即
Figure FDA0002427730820000031
其中,yk *为该时间序列的子项,表示一种条件属性数据的训练数据集的重构数据,k=1,2,…,n,zpq表示一个(L×K)的对角平均转移矩阵Z的每一个元素,1≤p≤L,1≤q≤K,
Figure FDA0002427730820000032
L*=min(L,K),K*=max(L,K),n=K+L-1。
4.根据权利要求3所述的一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,所述步骤S2.2.1中所述的改进的奇异谱分析判决方法包括:
S2.2.1.1、构建奇异值曲线图:横轴为第I个奇异值,纵轴为奇异值λI
S2.2.1.2、对不包含第一个奇异值部分的奇异值曲线进行微分,获得奇异值斜率变化曲线f(λI);
S2.2.1.3、设置阈值a,若f(λI)>a,则表明第I个奇异值属于波动分量,否则属于噪声分量。
5.根据权利要求1所述的一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,所述步骤S3包括以下步骤:
S3.1、基于支持向量机回归建立SVR预测模型:将步骤S1中所述的条件属性数据作为所述SVR预测模型的输入向量,将步骤S1中所述的决策属性数据作为所述SVR预测模型的输出向量;
S3.2、对所述SVR模型执行十字交叉算法,求解SVR预测模型的最佳参数;
S3.3、将上述求得的最佳参数传递给SVR预测模型,训练样本数据建立最佳SVR预测模型。
6.根据权利要求5所述的一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,所述步骤S3.1包括以下步骤:
S3.1.1、设置所述SVR预测模型的输入量为条件属性数据xt,设置所述SVR预测模型的输出向量为对应条件属性数据xt的决策属性数据yt,其中t=1,2,3…,n;
S3.1.2、将所述的条件属性数据xt和所述的决策属性数据yt构成数据集(xt,yt)并采用非线性映射核函数将数据映射到高维空间,构成所述SVR预测模型函数;
S3.1.3、引入非负的松弛变量和拉格朗日函数,利用库恩塔克条件,将SVR预测模型函数f(x)写为
Figure FDA0002427730820000051
其中,αt,αt *是拉格朗日乘子,k(xt,x)是核函数,b为SVR预测模型阈值;
S3.1.4、确定所述核函数,建立所述SVR预测模型。
7.根据权利要求6所述的一种基于SSA-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S3.1.4所述的核函数为高斯核函数,则所述SVR预测模型为:
Figure FDA0002427730820000052
其中,σ为高斯核函数的带宽。
CN202010226187.2A 2020-03-27 2020-03-27 一种基于ssa-svr模型的高炉铁水硅含量预测方法 Active CN111444963B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010226187.2A CN111444963B (zh) 2020-03-27 2020-03-27 一种基于ssa-svr模型的高炉铁水硅含量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010226187.2A CN111444963B (zh) 2020-03-27 2020-03-27 一种基于ssa-svr模型的高炉铁水硅含量预测方法

Publications (2)

Publication Number Publication Date
CN111444963A true CN111444963A (zh) 2020-07-24
CN111444963B CN111444963B (zh) 2023-08-25

Family

ID=71649052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010226187.2A Active CN111444963B (zh) 2020-03-27 2020-03-27 一种基于ssa-svr模型的高炉铁水硅含量预测方法

Country Status (1)

Country Link
CN (1) CN111444963B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949186A (zh) * 2021-03-05 2021-06-11 西南石油大学 一种基于ssa-lssvm模型预测含蜡原油析蜡点温度的方法
CN113255960A (zh) * 2021-04-14 2021-08-13 北京市燃气集团有限责任公司 一种融合issa-svr的燃气用气量预测方法及装置
CN113761787A (zh) * 2021-07-19 2021-12-07 中南大学 基于深度迁移网络的高炉铁水硅含量在线预测方法及系统
CN117807380A (zh) * 2024-01-02 2024-04-02 中国科学院西北生态环境资源研究院 一种时间序列数据补全方法、装置、存储介质及电子设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040239323A1 (en) * 2003-01-28 2004-12-02 University Of Southern California Noise reduction for spectroscopic signal processing
WO2011146422A1 (en) * 2010-05-17 2011-11-24 Dh Technologies Development Pte. Ltd. Systems and methods for feature detection in mass spectrometry using singular spectrum analysis
US20130080066A1 (en) * 2011-09-28 2013-03-28 Saudi Arabian Oil Company Reservoir properties prediction with least square support vector machine
KR20140018497A (ko) * 2012-08-01 2014-02-13 한국전력공사 단기 풍속 예측을 통한 풍력 발전량 예측 방법과, 그 기능을 이용한 배전선로 전압 예측 방법
US20150212051A1 (en) * 2012-07-12 2015-07-30 Commissariat A L'energie Atomique Et Aux Ene Alt Method for processing signals acquired by ultrasonic probing, corresponding program and ultrasonic probing device
CN104899425A (zh) * 2015-05-07 2015-09-09 浙江大学 一种高炉铁水硅含量的变量选择预报方法
JP2017083441A (ja) * 2015-10-26 2017-05-18 エーザイ・アール・アンド・ディー・マネジメント株式会社 特異値解析法を用いた電子ノイズ除去法および特異値解析用プログラム
CN107730054A (zh) * 2017-11-15 2018-02-23 西南石油大学 一种基于支持向量回归的燃气负荷组合预测方法
US20180173173A1 (en) * 2016-10-19 2018-06-21 Sas Institute Inc. Advanced control systems for machines
CN108647824A (zh) * 2018-05-10 2018-10-12 广东工业大学 一种电价超短期预测方法
CN108983058A (zh) * 2018-08-29 2018-12-11 三峡大学 基于改进的变分模态和奇异值分解的变压器局部放电特高频信号去噪方法
WO2019200742A1 (zh) * 2018-04-17 2019-10-24 平安科技(深圳)有限公司 短期盈利的预测方法、装置、计算机设备和存储介质
CN110390436A (zh) * 2019-07-25 2019-10-29 上海电力大学 一种基于ssa与lstm深度学习的电厂存煤量短期预测方法
CN110657985A (zh) * 2019-10-11 2020-01-07 重庆邮电大学 基于奇异值谱流形分析的齿轮箱故障诊断方法及系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040239323A1 (en) * 2003-01-28 2004-12-02 University Of Southern California Noise reduction for spectroscopic signal processing
WO2011146422A1 (en) * 2010-05-17 2011-11-24 Dh Technologies Development Pte. Ltd. Systems and methods for feature detection in mass spectrometry using singular spectrum analysis
US20130080066A1 (en) * 2011-09-28 2013-03-28 Saudi Arabian Oil Company Reservoir properties prediction with least square support vector machine
US20150212051A1 (en) * 2012-07-12 2015-07-30 Commissariat A L'energie Atomique Et Aux Ene Alt Method for processing signals acquired by ultrasonic probing, corresponding program and ultrasonic probing device
KR20140018497A (ko) * 2012-08-01 2014-02-13 한국전력공사 단기 풍속 예측을 통한 풍력 발전량 예측 방법과, 그 기능을 이용한 배전선로 전압 예측 방법
CN104899425A (zh) * 2015-05-07 2015-09-09 浙江大学 一种高炉铁水硅含量的变量选择预报方法
JP2017083441A (ja) * 2015-10-26 2017-05-18 エーザイ・アール・アンド・ディー・マネジメント株式会社 特異値解析法を用いた電子ノイズ除去法および特異値解析用プログラム
US20180173173A1 (en) * 2016-10-19 2018-06-21 Sas Institute Inc. Advanced control systems for machines
CN107730054A (zh) * 2017-11-15 2018-02-23 西南石油大学 一种基于支持向量回归的燃气负荷组合预测方法
WO2019200742A1 (zh) * 2018-04-17 2019-10-24 平安科技(深圳)有限公司 短期盈利的预测方法、装置、计算机设备和存储介质
CN108647824A (zh) * 2018-05-10 2018-10-12 广东工业大学 一种电价超短期预测方法
CN108983058A (zh) * 2018-08-29 2018-12-11 三峡大学 基于改进的变分模态和奇异值分解的变压器局部放电特高频信号去噪方法
CN110390436A (zh) * 2019-07-25 2019-10-29 上海电力大学 一种基于ssa与lstm深度学习的电厂存煤量短期预测方法
CN110657985A (zh) * 2019-10-11 2020-01-07 重庆邮电大学 基于奇异值谱流形分析的齿轮箱故障诊断方法及系统

Non-Patent Citations (12)

* Cited by examiner, † Cited by third party
Title
伍龙等: "基于奇异谱分析的最优分解层数确定算法", 计算机工程与应用, vol. 48, no. 36, pages 137 - 141 *
刘佳音;于晓光;王琦;李宏坤;: "基于Hankel矩阵与奇异值分解降噪方法的齿轮故障诊断研究", no. 01, pages 158 - 162 *
吴金花: "高炉冶炼过程分析及其铁水硅含量预测模型研究", pages 023 - 14 *
唐贤伦;庄陵;李学勤;罗萍;: "基于混沌粒子群支持向量回归的高炉铁水硅含量预测", no. 04, pages 141 - 145 *
唐贤伦;庄陵;胡向东;: "铁水硅含量的混沌粒子群支持向量机预报方法", vol. 26, no. 08, pages 839 *
康伟等: "基于奇异谱和冗余提升小波分析的齿轮箱故障诊断", 机械传动, vol. 42, no. 04, pages 170 - 176 *
梁小珍;乔晗;汪寿阳;张;: "基于奇异谱分析的我国航空客运量集成预测模型", vol. 37, no. 06, pages 1480 *
梁小珍等: "基于奇异谱分析的我国航空客运量集成预测模型", vol. 37, no. 6, pages 1480 *
蒋朝辉: "基于分数阶的多向微分算子的高炉料面轮廓自适应检测", 自动化学报, vol. 43, no. 12, pages 2115 - 2126 *
蒋朝辉等: "基于Bootstrap的高炉铁水硅含量二维预报", 自动化学报, vol. 42, no. 05, pages 715 - 723 *
赵学智;叶邦彦;陈统坚;: "基于奇异值曲率谱的有效奇异值选择", vol. 38, no. 38, pages 1 - 2 *
陆静良: "奇异谱分析-支持向量回归机耦合模型 在月降水量预测中的应用研究", 水利技术监督, no. 04, pages 115 - 118 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949186A (zh) * 2021-03-05 2021-06-11 西南石油大学 一种基于ssa-lssvm模型预测含蜡原油析蜡点温度的方法
CN112949186B (zh) * 2021-03-05 2023-03-24 西南石油大学 一种基于ssa-lssvm模型预测含蜡原油析蜡点温度的方法
CN113255960A (zh) * 2021-04-14 2021-08-13 北京市燃气集团有限责任公司 一种融合issa-svr的燃气用气量预测方法及装置
CN113761787A (zh) * 2021-07-19 2021-12-07 中南大学 基于深度迁移网络的高炉铁水硅含量在线预测方法及系统
CN117807380A (zh) * 2024-01-02 2024-04-02 中国科学院西北生态环境资源研究院 一种时间序列数据补全方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN111444963B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
CN111444963B (zh) 一种基于ssa-svr模型的高炉铁水硅含量预测方法
CN110414788B (zh) 一种基于相似日和改进lstm的电能质量预测方法
CN112819802B (zh) 基于风口信息深度学习的监督及预测高炉炉况异常的方法
CN109711609B (zh) 基于小波变换和极限学习机的光伏电站输出功率预测方法
CN110309608B (zh) 一种针对时滞不确定信息的高炉铁水硅含量预报方法
CN111079926B (zh) 基于深度学习的具有自适应学习率的设备故障诊断方法
CN112001115B (zh) 一种半监督动态软测量网络的软测量建模方法
CN113362913A (zh) 一种基于随机森林回归的汽油辛烷值损失预测及优化方法
CN112330153A (zh) 基于非线性正交回归的行业规模预测模型建模方法及装置
CN114880948A (zh) 一种基于随机森林优化算法的谐波预测建模方法和系统
CN114444811A (zh) 一种基于注意力机制的铝电解混频数据过热度预测方法
CN112418522B (zh) 一种基于三支集成预测模型的工业加热炉钢温预测方法
Yang et al. Multisource Information Fusion for Autoformer: Soft Sensor Modeling of FeO Content in Iron Ore Sintering Process
CN112801388B (zh) 一种基于非线性时间序列算法的电力负荷预测方法及系统
CN114742289A (zh) 一种面向生产工艺参数的高斯过程稳健优化方法
CN117743768B (zh) 基于去噪生成对抗网络和扩散模型的信号去噪方法及系统
CN115687899B (zh) 基于高维度纺纱数据的混合特征选择方法
CN114384870B (zh) 基于核局部线性嵌入pls的复杂工业过程运行状态评价方法
Wei et al. Short-Term Prediction of Coke Pushing Current Peak Based on Improved ARIMA Model
He et al. A Novel Approach to Automatically Detect Power Quality Disturbances Based on Dynamic Pocket Network
Ma et al. A Sample Selection Method Based on Deep Bayesian Active Learning
Wang et al. Final sulfur content prediction model in hot metal desulphurization process based on IEA-SVM
Xu et al. Model Quality Evaluation based on Improved MTF Data Image and Classification
CN118015348A (zh) 一种高炉炉况智能分类与识别方法及系统
Yang et al. Feature learning of nonlinear process fault detection detection based on SRB-SCAE

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant