CN111680720A - 基于改进cs-svr模型的高炉铁水硅含量预测方法 - Google Patents

基于改进cs-svr模型的高炉铁水硅含量预测方法 Download PDF

Info

Publication number
CN111680720A
CN111680720A CN202010416730.5A CN202010416730A CN111680720A CN 111680720 A CN111680720 A CN 111680720A CN 202010416730 A CN202010416730 A CN 202010416730A CN 111680720 A CN111680720 A CN 111680720A
Authority
CN
China
Prior art keywords
nest
silicon content
svr
improved
blast furnace
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010416730.5A
Other languages
English (en)
Other versions
CN111680720B (zh
Inventor
尹林子
陈思
蒋朝辉
许雪梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202010416730.5A priority Critical patent/CN111680720B/zh
Publication of CN111680720A publication Critical patent/CN111680720A/zh
Application granted granted Critical
Publication of CN111680720B publication Critical patent/CN111680720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Software Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biophysics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Manufacture Of Iron (AREA)

Abstract

本发明公开了一种基于改进CS‑SVR模型的高炉铁水硅含量预测方法,所述方法包括:S1、数据预处理并划分为训练集和测试集;S2、SVR建模;S3:SVR参数优化:利用改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,得到目标参数C和σ的最优解;S4、硅含量预测:将所述目标参数C和σ的最优解代入所述的SVR模型,对高炉铁水中的硅含量进行预测。本发明通过改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,建立更精确的支持向量机回归模型,提高高炉铁水硅含量的预测结果的准确度。

Description

基于改进CS-SVR模型的高炉铁水硅含量预测方法
技术领域
本发明涉及高炉铁水硅含量预测技术领域,尤其涉及一种基于改进CS-SVR模型的高炉铁水硅含量预测方法。
背景技术
在高炉炼铁过程中,铁水中的硅含量是高炉优化控制的关键参数。因此,建立一个合理准确预测硅含量的模型可以为高炉操作者提前判断炉况变化趋势以及调控幅度提供参考依据,进而保证炼铁过程顺利进行,使得铁水质量保持在正常范围内,从而遏制可能发生的故障并降低能耗。
由于高炉冶炼数据具有强烈的非线性特征,基于支持向量机回归 /SVR的硅含量预测模型研究成为了当前的主流方法之一。但是支持向量机回归的性能依赖于惩罚参数C以及核函数中的σ,因此,必须采取合理的方法优化支持向量机回归中的参数。
发明内容
(一)要解决的技术问题
基于上述问题,本发明提供一种基于改进CS-SVR模型的高炉铁水硅含量预测方法,通过改进的布谷鸟搜索算法(Cuckoo Search,CS)对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,从而建立更精确的支持向量机回归模型,提高高炉铁水硅含量的预测结果的准确度。
(二)技术方案
基于上述的技术问题,本发明提供一种基于改进CS-SVR模型的高炉铁水硅含量预测方法,所述方法包括以下步骤:
S1、数据预处理并划分为训练集和测试集:选取决策属性数据即硅含量数据,及与硅含量相关的条件属性数据;
S2、SVR建模:向支持向量机回归输入所述训练集,对模型进行训练,得到SVR预测模型,输入与硅含量相关的条件属性数据,输出硅含量数据;
S3:SVR参数优化:利用改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,得到目标参数 C和σ的最优解;
S4、硅含量预测:将步骤S3中所述的目标参数C和σ的最优解代入步骤S2中所述的SVR预测模型,对高炉铁水中的硅含量进行预测;
步骤S3包括以下步骤:
S3.1、初始化参数:设置迭代次数T,巢穴数量n,目标参数即惩罚参数C、高斯核函数的带宽σ的搜索可行范围[xmin,xmax],并在搜索可行范围内随机初始化巢穴位置,
Figure BDA0002495348750000021
i=1,…,n, t=0,…,T表示第i个巢穴的第t次迭代的巢穴位置;
S3.2、将每个巢穴的参数代入所述SVR预测模型,计算每个巢穴的适应度值fi 0,i=1,…,n,保存当前迭代即0迭代适应度值最小的巢穴的位置;
所述适应度值计算公式为:
Figure BDA0002495348750000022
表示第i个巢穴的第t迭代的适应度值,i=1,…,n,
Figure BDA0002495348750000031
表示训练集第I个根据条件属性数据输出的硅含量的预测值,随不同迭代的不同个巢穴的巢穴位置而变化,yI表示训练集第I个决策性数据,即硅含量的实际值,N为训练集个数;
S3.3、第一次更新巢穴位置
Figure BDA0002495348750000032
计算各个
Figure BDA0002495348750000033
的适应度值
Figure BDA0002495348750000034
并与对应的上一迭代巢穴
Figure BDA0002495348750000035
的适应度值
Figure BDA0002495348750000036
对比,保存适应度值小的巢穴位置至下一迭代,即若
Figure BDA0002495348750000037
则新巢穴
Figure BDA0002495348750000038
否则新巢穴
Figure BDA0002495348750000039
S3.4、判断步骤S3.3所述新巢穴中的目标参数是否超出对应的所述搜索可行范围[xmin,xmax],若未超出,则进入步骤S3.5;若超出,则按下式处理得到新巢穴:
Figure BDA00024953487500000310
其中,ρ为最大越界值,通过巢穴的概率分布函数确定参数A和B;
S3.5、判断步骤S3.4所述新巢穴是否为“劣质”巢穴,若不是,则新巢穴
Figure BDA00024953487500000311
若是,则第二次更新巢穴位置得到新巢穴
Figure BDA00024953487500000312
S3.6、计算步骤S3.5所述新巢穴
Figure BDA00024953487500000313
的适应度值,并将其与对应的更新前的巢穴
Figure BDA00024953487500000314
的适应度值进行对比,保存适应度值小的巢穴位置,即若
Figure BDA00024953487500000315
则新巢穴
Figure BDA00024953487500000316
否则新巢穴
Figure BDA00024953487500000317
并保存当前迭代适应度值最小的巢穴的位置;
S3.7、判断是否当前迭代t≥最大迭代次数T,若否,则返回到步骤S3.3,若是,则输出适应度值最小的巢穴位置,即为目标参数C和σ的最优解。
进一步的,步骤S1所述的数据预处理还包括对于数据中含有的缺失值采取人工筛选进行取值,不合理数据进行人工筛选删除,对数据进行归一化处理。
优选地,步骤S1所述的与硅含量相关的条件属性数据采用粗糙集进行约简,所述的与硅含量相关的条件属性数据包括:富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度。
进一步的,步骤S2所述的SVR预测模型为:
Figure BDA0002495348750000041
其中,
Figure BDA0002495348750000042
αI均为拉格朗日乘子,通过SMO算法求解,b为偏置量,根据KKT条件求解,xI为N维条件属性数据,即输入向量,yI为决策属性数据,即目标输出硅含量,N为训练集个数。
进一步的,步骤S3.3所述的第一次更新巢穴位置的计算公式为:
Figure BDA0002495348750000043
其中,α代表步长控制因子,
Figure BDA0002495348750000044
代表点乘,Levy(β)代表Levy随机搜索方式。
优选地,步骤S3.4所述的参数A为巢穴的目标参数C或σ的累计概率大于10%的界限值,参数B=xmax-A+xmin
进一步的,步骤S3.5所述的第二次更新巢穴位置的计算公式为:
Figure BDA0002495348750000051
其中,
Figure BDA0002495348750000052
是随机选择的两个不同巢穴,s是步长。
优选地,步骤S3.5中所述“劣质”巢穴通过如下方法判断:若当前适应度值
Figure BDA0002495348750000053
则当前巢穴不属于“劣质”巢穴;若当前适应度值
Figure BDA0002495348750000054
则当前巢穴为“劣质”巢穴,其中,
Figure BDA0002495348750000055
Figure BDA0002495348750000056
Figure BDA0002495348750000057
分别为当前迭代适应度最大值和最小值,
Figure BDA0002495348750000058
即为当前迭代适应度最大值和最小值的四分之三中位数。
本发明也公开了一种基于改进CS-SVR模型的高炉铁水硅含量预测系统,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行一种基于改进CS-SVR模型的高炉铁水硅含量预测方法。
本发明也公开了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行一种基于改进CS-SVR模型的高炉铁水硅含量预测方法。
(三)有益效果
本发明的上述技术方案具有如下优点:
(1)本发明通过改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,从而建立更精确的支持向量机回归模型,提高高炉铁水硅含量的预测结果的准确度;
(2)本发明将布谷鸟搜索算法改进,将随机判断巢穴是否被更新改进为根据巢穴质量判断巢穴是否被更新,更新低质量巢穴,减少随机评判导致的高质量巢穴误判的问题,从而提高寻优精度,从而提高预测准确性;
(3)本发明中巢穴质量的优劣通过适应度值判断,而适应度值通过SVR预测模型的预测输出与实际输出的误差和求得,适应度值低于当前迭代适应度最大值与最小值的四分之三中位数的巢穴即为不需要更新的高质量巢穴,该判断方法具有推广意义;
(4)本发明针对标准布谷鸟搜索算法中参数越界问题采用了新的边界优化方法,不再通过搜索可行范围两端作为界限值,而是根据概率分布确定界限值A、B,然后对超过界限值的值按大小分布,解决参数大量聚集在边界处的问题,使得改进的布谷鸟搜索算法保持其多样性,提高了寻优精度,从而提高预测准确性。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1为本发明实施例基于改进CS-SVR模型的高炉铁水硅含量预测方法的整体流程示意图;
图2为本发明实施例采集的部分原始数据表;
图3为本发明实施例改进的布谷鸟搜索算法对目标参数的优化流程示意图;
图4为本发明实施例基于改进CS-SVR模型的高炉铁水硅含量测试集预测结果对比图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明提供的一种基于改进的CS-SVR模型的高炉铁水硅含量预测方法,如图1所示,该方法主要步骤包括:
S1、数据预处理:选取决策属性数据即硅含量数据,及与硅含量相关的条件属性数据,对于数据中含有的缺失值采取人工筛选进行取值,不合理数据进行人工筛选删除,同时,为了消除量纲的影响,对数据进行归一化处理,并将736条样本数据按照8:2的比例划分为训练集和测试集;
实施例一以国内某钢铁厂2650m3高炉为应用对象,选取2017年 10月,共735条数据。该数据包含富氧率,透气性指数,标准风速,冷风流量,鼓风动能,顶压,富氧压力,全压差,理论燃烧温度等15 种指标数据,以及其对应的硅含量数据。本文采用粗糙集对15种指标数据进行约简,选取出与硅含量相关的11种指标建立CS-SVR预测模型,包括富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度,这11种指标数据为条件属性数据,硅含量数据为决策属性数据,条件属性数据和决策属性数据的部分采集数据如图2所示,按步骤S1进行预处理后,对736条数据按照8:2的比例划分训练集和测试集。
S2、SVR建模:向支持向量机回归输入所述训练集,对模型进行训练;
假设给定训练样本数据集:
D={(x1,y1),(x2,y2),…,(xI,yI)|xI∈RN,yI∈R},
其中xI为N维条件属性数据,即输入向量,yI为决策属性数据,即目标输出硅含量。首先考虑线性回归函数的情况,可定义为 f(x)=ω·x+b
其中,ω为高维空间元素,b为偏置量;
根据结构风险最小化模型,将上述线性回归函数转化为最优化问题,所述结构风险最小化模型为:
Figure BDA0002495348750000081
其约束条件:
Figure BDA0002495348750000082
其中,C为惩罚因子,是一个常数,用于平衡回归函数f(x)的平坦程度和偏差大于ε样本点的个数。ξI,
Figure BDA0002495348750000083
为松弛变量。
通过对偶原理以及拉格朗日乘子法构建二次规划模型:
Figure BDA0002495348750000084
Figure BDA0002495348750000085
Figure BDA0002495348750000086
其中,
Figure BDA0002495348750000091
αI均为拉格朗日乘子,<xI,yI>为核函数,比较常见的核函数有线性核函数,多项式核函数,高斯核函数等。这里选择高斯核函数
Figure BDA0002495348750000092
至此可将二次规划模型转化为回归函数,即SVR预测模型:
Figure BDA0002495348750000093
Figure BDA0002495348750000094
αI可用SMO算法求解,偏置量b可根据KKT条件求解,支持向量机回归的性能依赖于惩罚参数C以及高斯核函数的带宽σ。
核函数参数σ的大小影响着支持向量机回归模型在训练时对所有输入特征集的反应敏感度,当σ过小时,会致使支持向量机对所输入的特征值过于敏感,从而使得输入特征值的微小变动就会引发支持向量机的剧烈反应,导致训练学习结果不稳定;相应的,当σ过大时,会致使支持向量机对特征值的反应过于迟缓,从而使得支持向量机不能根据特征值的变化做出快速调节。
当惩罚参数C过小时,支持向量机回归模型对训练集采样的误差容忍度变大,从而导致训练好的预测模型误差变大,泛化能力降低;而当惩罚参数C过大时,预测模型在训练过程中拟合度较高,虽然泛化能力增强,但复杂度提高。
因此优化惩罚参数C以及高斯核函数的带宽σ,可以使得训练得到的硅含量的支持向量机回归模型的预测准确性更高。
S3、SVR参数优化:利用改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,具体步骤如图 3所示,包括:
S3.1、初始化参数:设置迭代次数T,巢穴数量n=20,以及目标参数即惩罚参数C、高斯核函数的带宽σ的搜索可行范围[xmin,xmax],并在搜索可行范围内随机初始化巢穴位置,第i个巢穴位置可以定义为:
Figure BDA0002495348750000101
其中t表示第t次迭代,惩罚参数C、高斯核函数的带宽σ的搜索可行范围分别为C∈[0.01,1500],σ∈[0.01,10];
S3.2、将每个巢穴的参数代入所述SVR预测模型,计算每个巢穴的适应度值:
Figure BDA0002495348750000102
i=1,…,n,并保存当前迭代适应度值最小的巢穴的位置,其中,
Figure BDA0002495348750000103
表示训练集第I个根据条件属性数据输出的硅含量的预测值,随不同迭代的不同个巢穴的巢穴位置而变化,yI表示训练集第I个决策性数据,即硅含量的实际值,N为训练集个数,实施例一中,N=589;fi t表示第i个巢穴的第t次迭代的适应度值;这里采用误差平方和作为适应度函数,因此适应度值越小越好。
S3.3、第一次更新巢穴位置:计算
Figure BDA0002495348750000104
计算
Figure BDA0002495348750000105
的适应度值
Figure BDA0002495348750000106
并与对应的上一迭代巢穴
Figure BDA0002495348750000107
的适应度值fi t-1对比,保存适应度值小的巢穴位置至下一迭代,即若fi t-1<fi t′,则新巢穴
Figure BDA0002495348750000108
否则新巢穴
Figure BDA0002495348750000109
更新公式中,α(α>0)代表步长控制因子,
Figure BDA00024953487500001010
代表点乘。Levy(β)代表Levy随机搜索方式,其搜索形式可用Mantegna算法表示:
Figure BDA0002495348750000111
1<β≤3,这里的u和v是两个服从正态分布的随机数,可定义为
Figure BDA0002495348750000112
Figure BDA0002495348750000113
σv=1,这里的Γ是Gamma/伽马函数。
S3.4、判断步骤S3.3所述新巢穴中的目标参数是否超出对应的搜索可行范围[xmin,xmax],若未超出,则进入步骤S3.5;若超出,则根据下面的方式进行巢穴越界处理:
Figure BDA0002495348750000114
其中,ρ为原始方法最大越界值。然后通过巢穴的概率分布函数确定参数A和B,可以选出累计概率大于10%的界限值,记作A,而 B=xmax-A+xmin
原始的布谷鸟搜索算法的边界处理方式如下:
Figure BDA0002495348750000115
从上式可以看出,当参数越界时,参数会被拉到边界值处,这样会导致边界值大量聚集,从而大大降低了巢穴的多样性,降低了寻优精度。
根据仿真结果可知,原始方法修正参数σ、C后,其参数点主要分布在两侧,大致呈镜像分布。针对参数σ,当x=1时,累计概率超过10%,因此A=1,B=xmax-A+xmin=10-1+0.01=9.01;针对参数C,当x=100时,累计概率超过10%,因此,A=100, B=xmax-A+xmin=1500-100+0.01=1400.01,而通过分析越界情况确定它们的ρ分别为2000,300000。
S3.5、判断步骤S3.4所述新巢穴是否为“劣质”巢穴,即巢穴优劣判断,若当前适应度值
Figure BDA0002495348750000121
则当前巢穴不属于“劣质”巢穴,则新巢穴
Figure BDA0002495348750000122
若当前适应度值
Figure BDA0002495348750000123
则当前巢穴为“劣质”巢穴,需要对其进行第二次更新,在此,只需要对适应度值大于
Figure BDA0002495348750000124
的巢穴进行更新,第二次更新公式如下:
Figure BDA0002495348750000125
在这里,
Figure BDA0002495348750000126
是随机选择的两个不同巢穴,s是步长,α是步长缩放因子,而
Figure BDA0002495348750000127
Figure BDA0002495348750000128
Figure BDA0002495348750000129
分别为当前迭代适应度最大值和最小值,
Figure BDA00024953487500001210
即为当前迭代适应度最大值和最小值的四分之三中位数。
S3.6、再次计算S3.5所述新巢穴的适应度值,并将其与对应的旧巢穴
Figure BDA00024953487500001211
的适应度值进行对比,保存适应度值小的巢穴位置,即若 fi t′<fi t,则新巢穴
Figure BDA00024953487500001212
否则新巢穴
Figure BDA00024953487500001213
并保存当前迭代适应度值最小的巢穴的位置。
S3.7、判断是否当前迭代t≥最大迭代次数T,若否,则返回到步骤S3.3进行循环搜索,若是,则输出适应度值最小的巢穴位置,即为目标参数C和σ的最优解。
按照上述步骤,最终输出的参数C=82.26,σ=9.17。
S4、硅含量预测:将步骤S3中所述目标参数C和σ的最优解代入步骤S2中所述的SVR预测模型,对高炉铁水中的硅含量进行预测。
将实施例一测试集的147个样本数据代入检测所述SVR预测模型的准确性,如图4所示。为更清楚本发明所述方法的技术效果,将粒子群优化算法(PSO)、十字交叉算法以及标准布谷鸟搜索算法同样用于参数优化,由测试集样本数据代入检测准确性,与本发明所述方法对比,结果如表1所示:
表1 PSO-SVR、十字交叉-SVR、CS-SVR和改进的CS-SVR硅含量预测结果
PSO-SVR 十字交叉-SVR CS-SVR 改进的CS-SVR
0.1%内准确率 89.727% 89.727% 90.87% 91.82%
0.05%准确率 62% 61.637% 61.9% 70.00%
上表记录了PSO-SVR、十字交叉-SVR、CS-SVR和改进的CS-SVR 对高炉铁水硅含量的预测结果。通过比较,可以看出,采用改进的布谷鸟搜索算法对支持向量机回归算法中的参数进行优化,所建立的预测模型对高炉铁水中的硅含量预测结果最好。而且与原始CS-SVR相比,在0.1%内,改进的CS-SVR硅含量预测准确率提高了0.95%,在 0.5%内,提高了8.1%;与PSO-SVR、十字交叉-SVR相比,在0.1%内,均提高了2.093%,在0.5%内,分别提高了8%、8.363%。
需要说明的是,上述的控制方法可以转换为软件程序指令,既可以使用包括处理器和存储器的控制系统来运行实现,也可以通过非暂态计算机可读存储介质中存储的计算机指令来实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等) 或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
综上可知,通过上述的一种基于改进CS-SVR模型的高炉铁水硅含量预测方法,具有如下优点:
(1)本发明通过改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,从而建立更精确的支持向量机回归模型,提高高炉铁水硅含量的预测结果的准确度;
(2)本发明将布谷鸟搜索算法改进,将随机判断巢穴是否被更新改进为根据巢穴质量判断巢穴是否被更新,更新低质量巢穴,减少随机评判导致的高质量巢穴误判的问题,从而提高寻优精度,从而提高预测准确性;
(3)本发明中巢穴质量的优劣通过适应度值判断,而适应度值通过SVR预测模型的预测输出与实际输出的误差和求得,适应度值低于当代适应度最大值与最小值的四分之三中位数的巢穴即为不需要更新的高质量巢穴,该判断方法具有推广意义;
(4)本发明针对标准布谷鸟搜索算法中参数越界问题采用了新的边界优化方法,不再通过搜索可行范围两端作为界限值,而是根据概率分布确定界限值A、B,然后对超过界限值的值按大小分布,解决参数大量聚集在边界处的问题,使得改进的布谷鸟搜索算法保持其多样性,提高了寻优精度,从而提高预测准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,所述方法包括以下步骤:
S1、数据预处理并划分为训练集和测试集:选取决策属性数据即硅含量数据,及与硅含量相关的条件属性数据;
S2、SVR建模:向支持向量机回归输入所述训练集,对模型进行训练,得到SVR预测模型,输入与硅含量相关的条件属性数据,输出硅含量数据;
S3:SVR参数优化:利用改进的布谷鸟搜索算法对支持向量机回归中的惩罚参数C以及高斯核函数的带宽σ进行优化,得到目标参数C和σ的最优解;
S4、硅含量预测:将步骤S3中所述的目标参数C和σ的最优解代入步骤S2中所述的SVR预测模型,对高炉铁水中的硅含量进行预测;
步骤S3包括以下步骤:
S3.1、初始化参数:设置迭代次数T,巢穴数量n,目标参数即惩罚参数C、高斯核函数的带宽σ的搜索可行范围[xmin,xmax],并在搜索可行范围内随机初始化巢穴位置,
Figure FDA0002495348740000011
Figure FDA0002495348740000012
表示第i个巢穴的第t次迭代的巢穴位置;
S3.2、将每个巢穴的参数代入所述SVR预测模型,计算每个巢穴的适应度值fi 0,i=1,…,n,保存当前迭代即0迭代适应度值最小的巢穴的位置;
所述适应度值计算公式为:
Figure FDA0002495348740000013
表示第i个巢穴的第t迭代的适应度值,i=1,…,n,
Figure FDA0002495348740000021
表示训练集第I个根据条件属性数据输出的硅含量的预测值,随不同迭代的不同个巢穴的巢穴位置而变化,yI表示训练集第I个决策性数据,即硅含量的实际值,N为训练集个数;
S3.3、第一次更新巢穴位置
Figure FDA0002495348740000022
计算各个
Figure FDA0002495348740000023
的适应度值fi t′,并与对应的上一迭代巢穴
Figure FDA0002495348740000024
的适应度值fi t-1对比,保存适应度值小的巢穴位置至下一迭代,即若fi t-1<fi t′,则新巢穴
Figure FDA0002495348740000025
否则新巢穴
Figure FDA0002495348740000026
S3.4、判断步骤S3.3所述新巢穴中的目标参数是否超出对应的所述搜索可行范围[xmin,xmax],若未超出,则进入步骤S3.5;若超出,则按下式处理得到新巢穴:
Figure FDA0002495348740000027
其中,ρ为最大越界值,通过巢穴的概率分布函数确定参数A和B;
S3.5、判断步骤S3.4所述新巢穴是否为“劣质”巢穴,若不是,则新巢穴
Figure FDA0002495348740000028
若是,则第二次更新巢穴位置得到新巢穴
Figure FDA0002495348740000029
S3.6、计算步骤S3.5所述新巢穴
Figure FDA00024953487400000210
的适应度值,并将其与对应的更新前的巢穴
Figure FDA00024953487400000211
的适应度值进行对比,保存适应度值小的巢穴位置,即若fi t′<fi t,则新巢穴
Figure FDA00024953487400000212
否则新巢穴
Figure FDA00024953487400000213
并保存当前迭代适应度值最小的巢穴的位置;
S3.7、判断是否当前迭代t≥最大迭代次数T,若否,则返回到步骤S3.3,若是,则输出适应度值最小的巢穴位置,即为目标参数C和σ的最优解。
2.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S1所述的数据预处理还包括对于数据中含有的缺失值采取人工筛选进行取值,不合理数据进行人工筛选删除,对数据进行归一化处理。
3.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S1所述的与硅含量相关的条件属性数据采用粗糙集进行约简,所述的与硅含量相关的条件属性数据包括:富氧率,透气性指数,标准风速,鼓风动能,炉富煤气量,炉富煤气量指数,理论燃烧温度,冷风压力,热风压力,实际风速,以及热风温度。
4.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S2所述的SVR预测模型为:
Figure FDA0002495348740000031
其中,
Figure FDA0002495348740000032
αI均为拉格朗日乘子,通过SMO算法求解,b为偏置量,根据KKT条件求解,xI为N维条件属性数据,即输入向量,yI为决策属性数据,即目标输出硅含量,N为训练集个数。
5.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S3.3所述的第一次更新巢穴位置的计算公式为:
Figure FDA0002495348740000041
其中,α代表步长控制因子,
Figure FDA0002495348740000042
代表点乘,Levy(β)代表Levy随机搜索方式。
6.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S3.4所述的参数A为巢穴的目标参数C或σ的累计概率大于10%的界限值,参数B=xmax-A+xmin
7.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S3.5所述的第二次更新巢穴位置的计算公式为:
Figure FDA0002495348740000043
其中,
Figure FDA0002495348740000044
是随机选择的两个不同巢穴,s是步长。
8.根据权利要求1所述的基于改进CS-SVR模型的高炉铁水硅含量预测方法,其特征在于,步骤S3.5中所述“劣质”巢穴通过如下方法判断:若当前适应度值
Figure FDA0002495348740000045
则当前巢穴不属于“劣质”巢穴;若当前适应度值
Figure FDA0002495348740000046
则当前巢穴为“劣质”巢穴,其中,
Figure FDA0002495348740000047
Figure FDA0002495348740000048
Figure FDA0002495348740000049
分别为当前迭代适应度最大值和最小值,
Figure FDA00024953487400000410
即为当前迭代适应度最大值和最小值的四分之三中位数。
9.一种基于改进CS-SVR模型的高炉铁水硅含量预测系统,其特征在于,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至8任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至8任一项所述的方法。
CN202010416730.5A 2020-05-18 2020-05-18 基于改进cs-svr模型的高炉铁水硅含量预测方法 Active CN111680720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010416730.5A CN111680720B (zh) 2020-05-18 2020-05-18 基于改进cs-svr模型的高炉铁水硅含量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010416730.5A CN111680720B (zh) 2020-05-18 2020-05-18 基于改进cs-svr模型的高炉铁水硅含量预测方法

Publications (2)

Publication Number Publication Date
CN111680720A true CN111680720A (zh) 2020-09-18
CN111680720B CN111680720B (zh) 2022-03-08

Family

ID=72434167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010416730.5A Active CN111680720B (zh) 2020-05-18 2020-05-18 基于改进cs-svr模型的高炉铁水硅含量预测方法

Country Status (1)

Country Link
CN (1) CN111680720B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113155774A (zh) * 2021-03-31 2021-07-23 桂林电子科技大学 一种纺织品材料太赫兹光谱定量检测方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101211383A (zh) * 2007-12-21 2008-07-02 浙江大学 一种高炉铁水硅含量的特征分析预报方法
CN104318329A (zh) * 2014-10-20 2015-01-28 国家电网公司 一种布谷鸟搜索算法改进支持向量机的电力负荷预测方法
CN104899425A (zh) * 2015-05-07 2015-09-09 浙江大学 一种高炉铁水硅含量的变量选择预报方法
CN105574297A (zh) * 2016-02-16 2016-05-11 中国石油大学(华东) 自适应高炉铁水硅含量趋势预报方法
CN106384122A (zh) * 2016-09-05 2017-02-08 江苏科技大学 一种基于改进cs‑lssvm的设备故障模式识别方法
CN106646158A (zh) * 2016-12-08 2017-05-10 西安工程大学 基于多分类支持向量机变压器故障诊断提升方法
CN106844826A (zh) * 2016-12-02 2017-06-13 上海电机学院 一种用于风电机组齿轮箱故障预测诊断的方法
CN107463781A (zh) * 2017-08-10 2017-12-12 中南大学 一种用于高炉铁水硅含量预测模型的数据约简处理方法及装置
CN108038271A (zh) * 2017-11-22 2018-05-15 华中科技大学 一种铣刀的磨损预测方法及状态识别的方法
CN108121781A (zh) * 2017-12-18 2018-06-05 辽宁师范大学 基于高效样本选取与参数优化的相关反馈图像检索方法
CN108132226A (zh) * 2018-03-07 2018-06-08 桂林电子科技大学 橡胶补强剂炭黑的太赫兹光谱定量分析方法
US20180225585A1 (en) * 2017-02-08 2018-08-09 Board Of Regents, The University Of Texas System Systems and methods for prediction of occupancy in buildings
CN108998608A (zh) * 2018-07-24 2018-12-14 中南大学 一种基于红外机器视觉的高炉出铁口铁水温度测量方法及系统
CN109637121A (zh) * 2018-06-05 2019-04-16 南京理工大学 一种基于cs-svr算法的短时道路交通拥堵预测方法
CN109816204A (zh) * 2018-12-25 2019-05-28 南京理工大学 一种基于ga-svm的地铁运营安全态势预测方法
WO2019209874A2 (en) * 2018-04-24 2019-10-31 Healthtell Inc. Markers of immune wellness and methods of use thereof
CN110489790A (zh) * 2019-07-10 2019-11-22 合肥工业大学 基于改进abc-svr的igbt结温预测方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101211383A (zh) * 2007-12-21 2008-07-02 浙江大学 一种高炉铁水硅含量的特征分析预报方法
CN104318329A (zh) * 2014-10-20 2015-01-28 国家电网公司 一种布谷鸟搜索算法改进支持向量机的电力负荷预测方法
CN104899425A (zh) * 2015-05-07 2015-09-09 浙江大学 一种高炉铁水硅含量的变量选择预报方法
CN105574297A (zh) * 2016-02-16 2016-05-11 中国石油大学(华东) 自适应高炉铁水硅含量趋势预报方法
CN106384122A (zh) * 2016-09-05 2017-02-08 江苏科技大学 一种基于改进cs‑lssvm的设备故障模式识别方法
CN106844826A (zh) * 2016-12-02 2017-06-13 上海电机学院 一种用于风电机组齿轮箱故障预测诊断的方法
CN106646158A (zh) * 2016-12-08 2017-05-10 西安工程大学 基于多分类支持向量机变压器故障诊断提升方法
US20180225585A1 (en) * 2017-02-08 2018-08-09 Board Of Regents, The University Of Texas System Systems and methods for prediction of occupancy in buildings
CN107463781A (zh) * 2017-08-10 2017-12-12 中南大学 一种用于高炉铁水硅含量预测模型的数据约简处理方法及装置
CN108038271A (zh) * 2017-11-22 2018-05-15 华中科技大学 一种铣刀的磨损预测方法及状态识别的方法
CN108121781A (zh) * 2017-12-18 2018-06-05 辽宁师范大学 基于高效样本选取与参数优化的相关反馈图像检索方法
CN108132226A (zh) * 2018-03-07 2018-06-08 桂林电子科技大学 橡胶补强剂炭黑的太赫兹光谱定量分析方法
WO2019209874A2 (en) * 2018-04-24 2019-10-31 Healthtell Inc. Markers of immune wellness and methods of use thereof
CN109637121A (zh) * 2018-06-05 2019-04-16 南京理工大学 一种基于cs-svr算法的短时道路交通拥堵预测方法
CN108998608A (zh) * 2018-07-24 2018-12-14 中南大学 一种基于红外机器视觉的高炉出铁口铁水温度测量方法及系统
CN109816204A (zh) * 2018-12-25 2019-05-28 南京理工大学 一种基于ga-svm的地铁运营安全态势预测方法
CN110489790A (zh) * 2019-07-10 2019-11-22 合肥工业大学 基于改进abc-svr的igbt结温预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LING SUN 等: "Research on prediction classification and compensation for silicon contents in blast furnace based on ridge regression", 《2ND GLOBAL CONFERENCE ON ROBOTICS, ARTIFICIAL INTELLIGENCE AND ENGINEERING TECHNOLOGY》 *
MINLAN JIANG 等: "A Cuckoo Search-Support Vector Machine Model for Predicting Dynamic Measurement Errors of Sensors", 《IEEE ACCESS》 *
刘超湖: "改进布谷鸟算法优化支持向量机的边坡变形预测研究", 《中国优秀博硕士学位论文全文数据库(硕士)基础科学辑》 *
尹林子 等: "基于粗糙集理论与神经网络的铁水硅含量预测", 《钢铁研究学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113155774A (zh) * 2021-03-31 2021-07-23 桂林电子科技大学 一种纺织品材料太赫兹光谱定量检测方法

Also Published As

Publication number Publication date
CN111680720B (zh) 2022-03-08

Similar Documents

Publication Publication Date Title
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
WO2021004198A1 (zh) 一种板材性能的预测方法及装置
CN114662780A (zh) 碳排放量预测方法、装置、电子设备及存储介质
CN111476422A (zh) 一种基于机器学习框架下LightGBM的建筑冷负荷预测方法
CN111006240B (zh) 一种生物质锅炉炉膛温度和负荷预测方法
CN113392594B (zh) 一种基于abc极限学习机的力学性能区间预测方法及装置
CN107545101A (zh) 一种设计目标与设计变量均为区间的优化设计方法
CN107085371A (zh) 基于数据驱动的原油蒸馏装置经济模型预测控制方法
CN111680720B (zh) 基于改进cs-svr模型的高炉铁水硅含量预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN112668234A (zh) 一种转炉炼钢终点智能控制方法
CN115270988A (zh) 知识表征解耦的分类模型的微调方法、装置和应用
CN114581141A (zh) 基于特征选择与lssvr的短期负荷预测方法
CN110276478B (zh) 基于分段蚁群算法优化svm的短期风电功率预测方法
CN110837853A (zh) 一种快速分类模型构建方法
CN116341753A (zh) 一种使用机器学习对区域二氧化碳排放预测的方法
CN116227350A (zh) 锅炉多目标优化方法及装置
CN113988919A (zh) 一种购电结构调整方法、系统及介质
CN113656707A (zh) 一种理财产品推荐方法、系统、存储介质及设备
CN111813669B (zh) 基于多目标群体智能的适应性随机测试用例生成方法
CN112529183A (zh) 一种基于知识蒸馏的模型自适应更新方法
CN116862078B (zh) 一种换电套餐用户逾期的预测方法、系统、装置及介质
CN112613909A (zh) 一种基于改进lstm模型的农产品短期价格预测方法及装置
CN117152588B (zh) 一种数据优化方法、系统、装置及介质
CN112801388B (zh) 一种基于非线性时间序列算法的电力负荷预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant