CN115392629A - 一种基于改进svr的煤矸石发热量软测量方法 - Google Patents

一种基于改进svr的煤矸石发热量软测量方法 Download PDF

Info

Publication number
CN115392629A
CN115392629A CN202210810899.8A CN202210810899A CN115392629A CN 115392629 A CN115392629 A CN 115392629A CN 202210810899 A CN202210810899 A CN 202210810899A CN 115392629 A CN115392629 A CN 115392629A
Authority
CN
China
Prior art keywords
sample
svr
value
coal gangue
support vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210810899.8A
Other languages
English (en)
Inventor
高湘彬
贾博
马小晶
张家旺
刘寒
李�根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Urumqi Electric Power Construction And Debugging Institute Xinjiang Xinneng Group Co ltd
Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd
Original Assignee
Urumqi Electric Power Construction And Debugging Institute Xinjiang Xinneng Group Co ltd
South China University of Technology SCUT
Xinjiang University
Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Urumqi Electric Power Construction And Debugging Institute Xinjiang Xinneng Group Co ltd, South China University of Technology SCUT, Xinjiang University, Electric Power Research Institute of State Grid Xinjiang Electric Power Co Ltd filed Critical Urumqi Electric Power Construction And Debugging Institute Xinjiang Xinneng Group Co ltd
Priority to CN202210810899.8A priority Critical patent/CN115392629A/zh
Publication of CN115392629A publication Critical patent/CN115392629A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Molecular Biology (AREA)
  • Mining & Mineral Resources (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

本发明公开了一种基于改进SVR的煤矸石发热量软测量方法。所述方法包括以下步骤:收集数据,形成样本数据集,形成样本集合D;数据集处理,将样本数据集分为训练验证集和测试集;利用拉普拉斯分值法对样本集合D进行特征选择,根据重要性度量对特征进行排序,并进行特征选择;建立支持向量机回归SVR模型;改进麻雀搜索算法,使用改进后的麻雀搜索算法优化支持向量机回归SVR模型中的惩罚系数C、核参数σ;对测试集样本进行检测,利用测试样本对训练好的支持向量机回归SVR模型进行测试,训练好的支持向量机回归SVR模型的输出为煤矸石热值预测的结果。本发明提高了工业场景中在线煤矸石热值预测的快速性与准确性。

Description

一种基于改进SVR的煤矸石发热量软测量方法
技术领域
本发明涉及工业过程中软测量技术领域,具体涉及一种基于改进SVR的煤矸石发热量软测量方法。
背景技术
煤矸石是一种在采、洗煤过程中产生的固体排放物。开采煤炭所带出的煤矸石数量庞大,目前煤矿排矸量约为其煤炭开采量的10%~25%。据不完全统计,我国煤矸石累计堆存量已达70亿吨,并以8亿吨/年的速度增长,全国煤矸石山2000多座,占地20多万亩,造成了极大的资源浪费。煤矸石中的硫化物逸出或浸出会污染大气、农田和水体。为了消除污染,自60年代起,很多国家开始重视煤矸石的处理和利用。目前煤矸石的利用途径主要包括煤矸石沸腾炉发电、煤泥循环流化床发电、煤矸石制砖、煤矸石生产水泥等,这些生产方式主要都是利用煤矸石燃烧产生的热量,从而达到节能减排和降低成本的目的。因此对煤矸石发热量的测定具有重要的意义。传统煤矸石发热量测量方法通常通过充分燃烧煤矸石样本,利用热量仪测量煤矸石燃烧释放的热量。但此类发热量检测方法不仅易受到仪器和人为因素的影响,且存在检测速度慢、分析周期长等缺陷(低热值煤发热量测定方法的研究_杨永利)。
同时有人用数理统计中的回归分析原理及现代计算机手段研究过褐煤的发热量,类比到煤矸石热值测量,其过程需要进行工业分析,然后根据工业分析结果与元素成分之间的关系数据推导出发热量的多元回归式。该法同样对实验仪器的精密度要求较高,实验方法比较复杂,实验者也必须掌握很高的实验技能,因此这种方法具有一定的局限性(基于SVR与特征变量选择方法的煤炭发热量预测_李大虎)。
发明内容
针对传统煤矸石热值测量设备操作复杂、过程繁琐等问题,本发明提出一种基于改进SVR的煤矸石发热量软测量方法,该方法利用拉普拉斯分值法对影响煤矸石热值的特征进行选择,提出一种改进的麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA)优化算法,使用ISSA优化SVR(Support Vector Regression)中的惩罚系数C、核参数σ,得到ISSA-SVR优化模型,满足在线检测场景下快速精准预测煤矸石热值的要求。
本发明的目的至少通过如下技术方案之一实现。
一种基于改进SVR的煤矸石发热量软测量方法,包括以下步骤:
S1、收集数据,形成样本数据集,将来自不同区域的煤矸石样本的4种工业分析指标、5种元素分析指标以及每个样本的热值NCV进行收集,形成样本集合D;
S2、数据集处理,将样本数据集分为训练验证集和测试集;
S3、利用拉普拉斯分值法对样本集合D进行特征选择,根据重要性度量对特征进行排序,并进行特征选择;
S4、建立支持向量机回归SVR模型;
S5、使用精英反向学习策略、莱维飞行策略改进麻雀搜索算法(Sparrow SearchAlgorithm,SSA),使用改进后的麻雀搜索算法优化支持向量机回归SVR模型中的惩罚系数C、核参数σ;
S6、对测试集样本进行检测,利用测试样本对训练好的支持向量机回归SVR模型进行测试,训练好的支持向量机回归SVR模型的输出为煤矸石热值预测的结果。
进一步地,步骤S1中,所述4种工业分析指标包括煤矸石样本中水分Mad、灰分Aad、挥发分Vad和固定碳Fcad的含量;
所述5种元素分析指标包括煤矸石样本中碳C、氢H、氮N、硫S、氧O的含量;
将热值NCV与9种分析指标结合记为一个样本点,形成样本集合D={D1,D2…,Dm},m为样本总数;每个样本包括的9个分析指标即为该样本的特征值。
进一步地,步骤S2中,训练验证集用于通过最小化统计误差来优化支持向量机回归SVR模型的参数,训练验证集包括训练集和验证集,训练集用于训练支持向量机回归SVR模型,验证集用于得到最优的支持向量机回归SVR模型,测试集用于检验优化后的支持向量机回归SVR模型的分类性能;
训练集、验证集、测试集的数据比例为6∶2∶2。
进一步地,步骤S3包括以下步骤:
S3.1、计算拉普拉斯权重矩阵S,t为常量,Sj为矩阵S第i行第j列元素,若样本集合D中第i个样本点Di与第j个样本点Dj是相邻的,则:
Figure BDA0003740763590000031
否则:
Sij=0;
S3.2、拉普拉斯分值可以有效的衡量各个特征的权重,特征的拉普拉斯分值定义为:
Figure BDA0003740763590000032
其中,Lr表示第r个特征的拉普拉斯分值,(hri-hrj)表示第i个样本点Di与第j个样本点Dj的第r个特征值的差值;Var(hr)表示第r个特征在所有样本点上的方差,第r个特征的拉普拉斯分值Lr越低,表明该特征越好;
S3.3、利用拉普拉斯分值法的分值重要性度量对特征进行排序,依次选择所述r个特征的前1个、前2个、前3个…直至全部9个特征作为特征子集,在进行支持向量机回归SVR模型建模时,特征子集被作为输入变量,使用特征选择的方法可以高效的筛选掉与目标无关或冗余的特征以提高模型性能。
进一步地,步骤S4中,建立支持向量机回归SVR模型,以第i个样本点Di为例,将第i个样本点Di的特征子集选作输入变量,记为xi,对应第i个样本点Di的煤矸石样本的热值NCV为目标变量是支持向量机回归SVR模型的期望输出,记为zi;支持向量机回归SVR模型是将特征子集xi的特征值矩阵和其对应的煤矸石热值zi,通过一个非线性映射函数
Figure BDA0003740763590000041
映射到高维特征空间上,特征子集xi的特征值矩阵输入数据与g(xi)输出数据之间的非线性关系为:
Figure BDA0003740763590000042
其中,g(xi)即为特征子集xi的特征值矩阵对应的煤矸石热值zi,参数w,b分别为超平面的法向量和截距;
支持向量机回归SVR模型的重点在于获得最优超平面并最小化训练集中的训练样本与损失函数之间的误差,然后将整体误差最小化,因此支持向量机回归SVR模型可以写成如下需要优化的目标函数:
Figure BDA0003740763590000043
其中,C是目标函数中第一项和第二项的调整参数,也即惩罚因子;
Figure BDA0003740763590000044
和ξi分别为取自样本集合D的第i个样本点所对应的第一松弛因子和第二松弛因子,其值非负,作用是使得分界线不受异常点的出现而剧烈摆动,同时能够容忍一定的误差(分类错误);Rε为构造的广义拉格朗日函数,第一松弛因子
Figure BDA0003740763590000045
用于调整离群点在建模时的权重大小,或称重要性度量,以保持回归函数平坦性并惩罚大权重,并且通过使用最大化两个相互分离的训练样本之间距离的思想来调节它们;第二松弛因子ξi用于惩罚通过采用不敏感损失来训练g(x)与zi之间的误差约束条件,其约束条件如下所示:
Figure BDA0003740763590000046
Figure BDA0003740763590000047
Figure BDA0003740763590000048
通过引入拉格朗日乘子可以将上述优化问题转换为拉格朗日函数,并推得出:
Figure BDA0003740763590000051
代入原式得到新的SVR回归公式为:
Figure BDA0003740763590000052
其中,
Figure BDA0003740763590000053
γi分别为取自样本集合D的第i个样本点所对应的第一拉格朗日乘子和第二拉格朗日乘子;K(xi,x)为RBF核函数,煤矸石热值预测模型中RBF(radial basisfunction)核函数训练的模型相较于其他核函数训练的模型有更好的总体性能,提高热值的识别精度,RBF核函数表示为:
Figure BDA0003740763590000054
其中,σ为RBF核函数参数,以下简称核参数,它的作用是控制径向作用范围,换句话说,核参数可以控制高斯核函数的局部作用范围,直观地,该参数定义了单个训练样本的影响大小,核参数值越大影响越大,核参数值越小影响越小。
进一步地,步骤S5中,采用反向学习和Lévy策略改进Sparrow Search Algorithm(SSA)优化算法,使用改进后的Sparrow Search Algorithm(SSA)优化算法优化支持向量机回归SVR模型中的惩罚因子C、核参数σ,具体包括以下步骤:
S5.1、设定最大迭代次数T,麻雀种群数量N,确定捕食者、加入者、警戒者比例;
S5.2、初始化位置,麻雀中发现者位置按下式随机生成,麻雀每个位置代表一对参数[C(惩罚因子),σ(核参数)],根据有关文献,决定惩罚因子C∈[10-1,102],核参数σ∈[10-3,102],n为训练集样本总数,yn,1表示第n个样本的惩罚因子,yn,2表示第n个样本的核参数,Y为所有的惩罚因子和核参数组成的矩阵,具体如下:
Figure BDA0003740763590000061
S5.3、采用反向学习对Sparrow Search Algorithm(SSA)优化算法进行改进,假设yp=(yp,1,yp,2)是2维搜索空间中的精英个体,p=1~n,其反向解为
Figure BDA0003740763590000062
所有反向个体构成反向群体OP,训练集样本构成原种群RP,将反向群体OP与原种群RP合并得到{RP∪OP}群体,反向解
Figure BDA0003740763590000063
的组成元素以下式定义:
Figure BDA0003740763590000064
其中,k为区间[0,1]上的随机值,yp,q为精英解yp的q维向量,aq=max(yp,q),bq=min(yp,q);
样本个体包括的参数赋值支持向量机回归SVR模型,根据所选用的特征子集对样本热值进行预测,比较预测值zp与实际测量值
Figure BDA0003740763590000065
以下式计算适应度fitness;
Figure BDA0003740763590000066
选取应度值前一半的麻雀个体组成新的种群;
S5.4、更新发现者位置;
S5.5、更新加入者位置,加入Lévy策略,避免陷入局部最优。
S5.6、更新预警者的位置;
S5.7、根据适应度fitness计算更新后麻雀位置的适应度值;
S5.8、t>T时,输出麻雀位置(C,σ),否则重复执行步骤S5.3-S5.7。
进一步地,步骤S5.4中,按下式更新发现者位置:
Figure BDA0003740763590000071
其中,t表示当前迭代数,
Figure BDA0003740763590000072
表示第t次迭代中第p个麻雀在第q维中的位置信息,α为区间(0,1)中的一个随机数,预警值R2∈[0,1],安全值ST∈[0.5,1],Q为服从正态分布(0,1)的随机数,L=1×2矩阵,该矩阵内每个元素均为1。
进一步地,步骤S5.5中,按下式更新加入者位置,加入Lévy策略,避免陷入局部最优,更新策略如下式:
Figure BDA0003740763590000073
其中,
Figure BDA0003740763590000074
表示麻雀在第t次迭代中第q维的最差位置,
Figure BDA0003740763590000075
表示第t+1次迭代的最优位置,其中
Figure BDA0003740763590000076
u和v为服从正态分布的随机数,
Figure BDA0003740763590000077
Figure BDA0003740763590000078
δv=1,δu以下式定义,式中β=1.5;
Figure BDA0003740763590000079
进一步地,步骤S5.6中,按下式更新预警者的位置:
Figure BDA00037407635900000710
其中,E为[-1,1]之间的一个随机数,表示步长控制参数,同时也代表麻雀的移动方向;γ为服从均值为0,方差为1的正态分布随机数;e为一个避免分母为零的极小常数;fp为第p只麻雀当前个体的适应度值,fg为当前麻雀种群的最优适应度值,fw当前麻雀种群的最差适应度值。
进一步地,步骤S6中,采用测试集的测试样本对优化后的支持向量机回归SVR模型进行检测,得到最优的支持向量机回归SVR模型,最优的支持向量机回归SVR模型的输出煤矸石热值预测的结果。
本发明的有益效果是通过利用拉普拉斯分值方法对影响煤矸石热值主要特征进行排序和选择,利用改进的麻雀算法优化SVR建模时的惩罚系数与核参数,使用改进的SVR算法对煤矸石热值软预测进行建模;其中软测量模型根据已有数据训练建立,依次选择前1个、前2个、前3个…直至全部9个特征作为输入进行建模,并利用历史数据进行检验,选出准确率最高时的特征子集作为最终子集,对应的SVR模型即为最优模型。该方法解决了煤矸石热值测量设备操作复杂、过程繁琐、实时性差以及难以实现在线测量的技术问题,提高了工业场景中在线预测矸石热值的快速性与准确性,为将来煤矸石热值的利用提供了很好的铺垫。
附图说明
图1为本发明实施例中一种基于改进SVR的煤矸石发热量软测量方法流程图;
图2为本发明实施例中特征选择的方法流程图;
图3为本发明实施例中使用精英反向学习策略、莱维飞行策略改进麻雀搜索算法(Sparrow Search Algorithm,SSA),使用改进后的麻雀搜索算法优化支持向量机回归SVR模型的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合附图并举实施例,对本发明的具体实施进行详细说明。
实施例:
一种基于改进SVR的煤矸石发热量软测量方法,如图1所示,包括以下步骤:
S1、收集数据,形成样本数据集,将来自不同区域的煤矸石样本的4种工业分析指标、5种元素分析指标以及每个样本的热值NCV进行收集,形成样本集合D;
所述4种工业分析指标包括煤矸石样本中水分Mad、灰分Aad、挥发分Vad和固定碳Fcad的含量;
所述5种元素分析指标包括煤矸石样本中碳C、氢H、氮N、硫S、氧O的含量;
将热值NCV与9种分析指标结合记为一个样本点,形成样本集合D={D1,D2…,Dm},m为样本总数;每个样本包括的9个分析指标即为该样本的特征值。
S2、数据集处理,将样本数据集分为训练验证集和测试集;
训练验证集用于通过最小化统计误差来优化支持向量机回归SVR模型的参数,训练验证集包括训练集和验证集,训练集用于训练支持向量机回归SVR模型,验证集用于得到最优的支持向量机回归SVR模型,测试集用于检验优化后的支持向量机回归SVR模型的分类性能;
训练集、验证集、测试集的数据比例为6∶2∶2。
S3、利用拉普拉斯分值法对样本集合D进行特征选择,根据重要性度量对特征进行排序,并进行特征选择,如图2所示,包括以下步骤:
S3.1、计算拉普拉斯权重矩阵S,t为常量,Sj为矩阵S第i行第j列元素,若样本集合D中第i个样本点Di与第j个样本点Dj是相邻的,则:
Figure BDA0003740763590000091
否则:
Sij=0;
S3.2、拉普拉斯分值可以有效的衡量各个特征的权重,特征的拉普拉斯分值定义为:
Figure BDA0003740763590000101
其中,Lr表示第r个特征的拉普拉斯分值,(hri-hrj)表示第i个样本点Di与第j个样本点Dj的第r个特征值的差值;Var(hr)表示第r个特征在所有样本点上的方差,第r个特征的拉普拉斯分值Lr越低,表明该特征越好;
S3.3、利用拉普拉斯分值法的分值重要性度量对特征进行排序,依次选择所述r个特征的前1个、前2个、前3个…直至全部9个特征作为特征子集,在进行支持向量机回归SVR模型建模时,特征子集被作为输入变量,使用特征选择的方法可以高效的筛选掉与目标无关或冗余的特征以提高模型性能。
S4、建立支持向量机回归SVR模型;
建立支持向量机回归SVR模型,以第i个样本点Di为例,将第i个样本点Di的特征子集选作输入变量,记为xi,对应第i个样本点Di的煤矸石样本的热值NCV为目标变量是支持向量机回归SVR模型的期望输出,记为zi;支持向量机回归SVR模型是将特征子集xi的特征值矩阵和其对应的煤矸石热值zi,通过一个非线性映射函数
Figure BDA0003740763590000102
映射到高维特征空间上,特征子集xi的特征值矩阵输入数据与g(xi)输出数据之间的非线性关系为:
Figure BDA0003740763590000103
其中,g(xi)即为特征子集xi的特征值矩阵对应的煤矸石热值zi,参数w,b分别为超平面的法向量和截距;
支持向量机回归SVR模型的重点在于获得最优超平面并最小化训练集中的训练样本与损失函数之间的误差,然后将整体误差最小化,因此支持向量机回归SVR模型可以写成如下需要优化的目标函数:
Figure BDA0003740763590000111
其中,C是目标函数中第一项和第二项的调整参数,也即惩罚因子;
Figure BDA0003740763590000112
和ξi分别为取自样本集合D的第i个样本点所对应的第一松弛因子和第二松弛因子,其值非负,作用是使得分界线不受异常点的出现而剧烈摆动,同时能够容忍一定的误差(分类错误);Rε为构造的广义拉格朗日函数,第一松弛因子
Figure BDA0003740763590000113
用于调整离群点在建模时的权重大小,或称重要性度量,以保持回归函数平坦性并惩罚大权重,并且通过使用最大化两个相互分离的训练样本之间距离的思想来调节它们;第二松弛因子ξi用于惩罚通过采用不敏感损失来训练g(x)与zi之间的误差约束条件,其约束条件如下所示:
Figure BDA0003740763590000114
Figure BDA0003740763590000115
Figure BDA0003740763590000116
通过引入拉格朗日乘子可以将上述优化问题转换为拉格朗日函数,并推得出:
Figure BDA0003740763590000117
代入原式得到新的SVR回归公式为:
Figure BDA0003740763590000118
其中,
Figure BDA0003740763590000119
γi分别为取自样本集合D的第i个样本点所对应的第一拉格朗日乘子和第二拉格朗日乘子;K(xi,x)为RBF核函数,煤矸石热值预测模型中RBF(radial basisfunction)核函数训练的模型相较于其他核函数训练的模型有更好的总体性能,提高热值的识别精度,RBF核函数表示为:
Figure BDA0003740763590000121
其中,σ为RBF核函数参数,以下简称核参数,它的作用是控制径向作用范围,换句话说,核参数可以控制高斯核函数的局部作用范围,直观地,该参数定义了单个训练样本的影响大小,核参数值越大影响越大,核参数值越小影响越小。
S5、使用精英反向学习策略、莱维飞行策略改进麻雀搜索算法(Sparrow SearchAlgorithm,SSA),使用改进后的麻雀搜索算法优化支持向量机回归SVR模型中的惩罚系数C、核参数σ;
采用反向学习和Lévy策略改进Sparrow Search Algorithm(SSA)优化算法,使用改进后的Sparrow Search Algorithm(SSA)优化算法优化支持向量机回归SVR模型中的惩罚因子C、核参数σ,如图3所示,具体包括以下步骤:
S5.1、设定最大迭代次数T,麻雀种群数量N,确定捕食者、加入者、警戒者比例;
S5.2、初始化位置,麻雀中发现者位置按下式随机生成,麻雀每个位置代表一对参数[C(惩罚因子),σ(核参数)],根据有关文献,决定惩罚因子C∈[10-1,102],核参数σ∈[10-3,102],n为训练集样本总数,yn,1表示第n个样本的惩罚因子,yn,2表示第n个样本的核参数,Y为所有的惩罚因子和核参数组成的矩阵,具体如下:
Figure BDA0003740763590000122
S5.3、采用反向学习对Sparrow Search Algorithm(SSA)优化算法进行改进,假设yp=(yp,1,yp,2)是2维搜索空间中的精英个体,p=1~n,其反向解为
Figure BDA0003740763590000131
所有反向个体构成反向群体OP,训练集样本构成原种群RP,将反向群体OP与原种群RP合并得到{RP∪OP}群体,反向解
Figure BDA0003740763590000132
的组成元素以下式定义:
Figure BDA0003740763590000133
其中,k为区间[0,1]上的随机值,yp,q为精英解yp的q维向量,aq=max(yp,q),bq=min(yp,q);
样本个体包括的参数赋值支持向量机回归SVR模型,根据所选用的特征子集对样本热值进行预测,比较预测值zp与实际测量值
Figure BDA0003740763590000134
以下式计算适应度fitness;
Figure BDA0003740763590000135
选取应度值前一半的麻雀个体组成新的种群;
S5.4、按下式更新发现者位置:
Figure BDA0003740763590000136
其中,t表示当前迭代数,
Figure BDA0003740763590000137
表示第t次迭代中第p个麻雀在第q维中的位置信息,α为区间(0,1)中的一个随机数,预警值R2∈[0,1],安全值ST∈[0.5,1],Q为服从正态分布(0,1)的随机数,L=1×2矩阵,该矩阵内每个元素均为1。
S5.5、更新加入者位置,加入Lévy策略,避免陷入局部最优;
按下式更新加入者位置,加入Lévy策略,避免陷入局部最优,更新策略如下式:
Figure BDA0003740763590000138
其中,
Figure BDA0003740763590000141
表示麻雀在第t次迭代中第q维的最差位置,
Figure BDA0003740763590000142
表示第t+1次迭代的最优位置,其中
Figure BDA0003740763590000143
u和v为服从正态分布的随机数,
Figure BDA0003740763590000144
Figure BDA0003740763590000145
δv=1,δu以下式定义,式中β=1.5;
Figure BDA0003740763590000146
S5.6、按下式更新预警者的位置:
Figure BDA0003740763590000147
其中,E为[-1,1]之间的一个随机数,表示步长控制参数,同时也代表麻雀的移动方向;γ为服从均值为0,方差为1的正态分布随机数;e为一个避免分母为零的极小常数;fp为第p只麻雀当前个体的适应度值,fg为当前麻雀种群的最优适应度值,fw当前麻雀种群的最差适应度值;
S5.7、根据适应度fitness计算更新后麻雀位置的适应度值;
S5.8、t>T时,输出麻雀位置(C,σ),否则重复执行步骤S5.3-S5.7。
S6、对测试集样本进行检测,利用测试样本对训练好的支持向量机回归SVR模型进行测试,训练好的支持向量机回归SVR模型的输出为煤矸石热值预测的结果;
采用测试集的测试样本对优化后的支持向量机回归SVR模型进行检测,得到最优的支持向量机回归SVR模型,最优的支持向量机回归SVR模型的输出煤矸石热值预测的结果。

Claims (10)

1.一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,包括以下步骤:
S1、收集数据,形成样本数据集,将来自不同区域的煤矸石样本的4种工业分析指标、5种元素分析指标以及每个样本的热值NCV进行收集,形成样本集合D;
S2、数据集处理,将样本数据集分为训练验证集和测试集;
S3、利用拉普拉斯分值法对样本集合D进行特征选择,根据重要性度量对特征进行排序,并进行特征选择;
S4、建立支持向量机回归SVR模型;
S5、使用精英反向学习策略、莱维飞行策略改进麻雀搜索算法(Sparrow SearchAlgorithm,SSA),使用改进后的麻雀搜索算法优化支持向量机回归SVR模型中的惩罚系数C、核参数σ;
S6、对测试集样本进行检测,利用测试样本对训练好的支持向量机回归SVR模型进行测试,训练好的支持向量机回归SVR模型的输出为煤矸石热值预测的结果。
2.根据权利要求1所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S1中,所述4种工业分析指标包括煤矸石样本中水分Mad、灰分Aad、挥发分Vad和固定碳Fcad的含量;
所述5种元素分析指标包括煤矸石样本中碳C、氢H、氮N、硫S、氧O的含量;
将热值NCV与9种分析指标结合记为一个样本点,形成样本集合D={D1,D2…,Dm},m为样本总数;每个样本包括的9个分析指标即为该样本的特征值。
3.根据权利要求1所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S2中,训练验证集用于通过最小化统计误差来优化支持向量机回归SVR模型的参数,训练验证集包括训练集和验证集,训练集用于训练支持向量机回归SVR模型,验证集用于得到最优的支持向量机回归SVR模型,测试集用于检验优化后的支持向量机回归SVR模型的分类性能;
训练集、验证集、测试集的数据比例为6:2:2。
4.根据权利要求3所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S3包括以下步骤:
S3.1、计算拉普拉斯权重矩阵S,t为常量,Sij为矩阵S第i行第j列元素,若样本集合D中第i个样本点Di与第j个样本点Dj是相邻的,则:
Figure FDA0003740763580000021
否则:
Sij=0;
S3.2、拉普拉斯分值可以有效的衡量各个特征的权重,特征的拉普拉斯分值定义为:
Figure FDA0003740763580000022
其中,Lr表示第r个特征的拉普拉斯分值,(hri-hrj)表示第i个样本点Di与第j个样本点Dj的第r个特征值的差值;Var(hr)表示第r个特征在所有样本点上的方差,第r个特征的拉普拉斯分值Lr越低,表明该特征越好;
S3.3、利用拉普拉斯分值法的分值重要性度量对特征进行排序,依次选择所述r个特征的前1个、前2个、前3个…直至全部9个特征作为特征子集,在进行支持向量机回归SVR模型建模时,特征子集被作为输入变量。
5.根据权利要求4所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S4中,建立支持向量机回归SVR模型,以第i个样本点Di为例,将第i个样本点Di的特征子集选作输入变量,记为xi,对应第i个样本点Di的煤矸石样本的热值NCV为目标变量是支持向量机回归SVR模型的期望输出,记为zi;支持向量机回归SVR模型是将特征子集xi的特征值矩阵和其对应的煤矸石热值zi,通过一个非线性映射函数
Figure FDA0003740763580000031
映射到高维特征空间上,特征子集xi的特征值矩阵输入数据与g(xi)输出数据之间的非线性关系为:
Figure FDA0003740763580000032
其中,g(xi)即为特征子集xi的特征值矩阵对应的煤矸石热值zi,参数w,b分别为超平面的法向量和截距;
支持向量机回归SVR模型写成如下需要优化的目标函数:
Figure FDA0003740763580000033
其中,C是目标函数中第一项和第二项的调整参数,也即惩罚因子;
Figure FDA0003740763580000034
和ξi分别为取自样本集合D的第i个样本点所对应的第一松弛因子和第二松弛因子,其值非负;Rε为广义拉格朗日函数,第一松弛因子
Figure FDA0003740763580000035
用于调整离群点在建模时的权重大小,或称重要性度量,以保持回归函数平坦性并惩罚大权重,并且通过使用最大化两个相互分离的训练样本之间距离的思想来调节它们;第二松弛因子ξi用于惩罚通过采用不敏感损失来训练g(x)与zi之间的误差约束条件,其约束条件如下所示:
Figure DA00037407635861143987
Figure DA00037407635861154934
Figure DA00037407635861176898
通过引入拉格朗日乘子将上述优化问题转换为拉格朗日函数,并推得出:
Figure FDA0003740763580000039
代入原式得到新的SVR回归公式为:
Figure FDA0003740763580000041
其中,
Figure FDA0003740763580000042
γi分别为取自样本集合D的第i个样本点所对应的第一拉格朗日乘子和第二拉格朗日乘子;K(xi,x)为RBF核函数,RBF核函数表示为:
Figure FDA0003740763580000043
其中,σ为RBF核函数参数,以下简称核参数,它的作用是控制径向作用范围,核参数可以控制高斯核函数的局部作用范围,直观地,该参数定义了单个训练样本的影响大小,核参数值越大影响越大,核参数值越小影响越小。
6.根据权利要求5所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S5中,采用反向学习和Lévy策略改进Sparrow Search Algorithm(SSA)优化算法,使用改进后的Sparrow Search Algorithm(SSA)优化算法优化支持向量机回归SVR模型中的惩罚因子C、核参数σ,具体包括以下步骤:
S5.1、设定最大迭代次数T,麻雀种群数量N,确定捕食者、加入者、警戒者比例;
S5.2、初始化位置,麻雀中发现者位置按下式随机生成,麻雀每个位置代表一对参数[C(惩罚因子),σ(核参数)],根据有关文献,决定惩罚因子C∈[10-1,102],核参数σ∈[10-3,102],n为训练集样本总数,yn,1表示第n个样本的惩罚因子,yn,2表示第n个样本的核参数,Y为所有的惩罚因子和核参数组成的矩阵,具体如下:
Figure FDA0003740763580000051
S5.3、采用反向学习对Sparrow Search Algorithm(SSA)优化算法进行改进,假设yp=(yp,1,yp,2)是2维搜索空间中的精英个体,p=1~n,其反向解为
Figure FDA0003740763580000056
所有反向个体构成反向群体OP,训练集样本构成原种群RP,将反向群体OP与原种群RP合并得到{RP∪OP}群体,反向解
Figure FDA0003740763580000052
的组成元素以下式定义:
Figure FDA0003740763580000053
其中,k为区间[0,1]上的随机值,yp,q为精英解yp的q维向量,aq=max(yp,q),bq=min(yp,q);
样本个体包括的参数赋值支持向量机回归SVR模型,根据所选用的特征子集对样本热值进行预测,比较预测值zp与实际测量值
Figure FDA0003740763580000054
以下式计算适应度fitness;
Figure FDA0003740763580000055
选取应度值前一半的麻雀个体组成新的种群;
S5.4、更新发现者位置;
S5.5、更新加入者位置,加入Lévy策略,避免陷入局部最优;
S5.6、更新预警者的位置;
S5.7、根据适应度fitness计算更新后麻雀位置的适应度值;
S5.8、t﹥T时,输出麻雀位置(C,σ),否则重复执行步骤S5.3-S5.7。
7.根据权利要求6所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S5.4中,按下式更新发现者位置:
Figure FDA0003740763580000061
其中,t表示当前迭代数,
Figure FDA0003740763580000062
表示第t次迭代中第p个麻雀在第q维中的位置信息,α为区间(0,1)中的一个随机数,预警值R2∈[0,1],安全值ST∈[0.5,1],Q为服从正态分布(0,1)的随机数,L=1×2矩阵,该矩阵内每个元素均为1。
8.根据权利要求7所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S5.5中,按下式更新加入者位置,加入Lévy策略,避免陷入局部最优,更新策略如下式:
Figure FDA0003740763580000063
其中,
Figure FDA0003740763580000064
表示麻雀在第t次迭代中第q维的最差位置,
Figure FDA0003740763580000065
表示第t+1次迭代的最优位置,其中
Figure FDA0003740763580000066
u和v为服从正态分布的随机数,
Figure FDA0003740763580000067
Figure FDA0003740763580000068
δv=1,δu以下式定义,式中β=1.5;
Figure FDA0003740763580000069
9.根据权利要求8所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S5.6中,按下式更新预警者的位置:
Figure FDA00037407635800000610
其中,E为[-1,1]之间的一个随机数,表示步长控制参数,同时也代表麻雀的移动方向;γ为服从均值为0,方差为1的正态分布随机数;e为一个避免分母为零的极小常数;fp为第p只麻雀当前个体的适应度值,fg为当前麻雀种群的最优适应度值,fw当前麻雀种群的最差适应度值。
10.根据权利要求1~9任一项所述的一种基于改进SVR的煤矸石发热量软测量方法,其特征在于,步骤S6中,采用测试集的测试样本对优化后的支持向量机回归SVR模型进行检测,得到最优的支持向量机回归SVR模型,最优的支持向量机回归SVR模型的输出煤矸石热值预测的结果。
CN202210810899.8A 2022-07-11 2022-07-11 一种基于改进svr的煤矸石发热量软测量方法 Pending CN115392629A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210810899.8A CN115392629A (zh) 2022-07-11 2022-07-11 一种基于改进svr的煤矸石发热量软测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210810899.8A CN115392629A (zh) 2022-07-11 2022-07-11 一种基于改进svr的煤矸石发热量软测量方法

Publications (1)

Publication Number Publication Date
CN115392629A true CN115392629A (zh) 2022-11-25

Family

ID=84117576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210810899.8A Pending CN115392629A (zh) 2022-07-11 2022-07-11 一种基于改进svr的煤矸石发热量软测量方法

Country Status (1)

Country Link
CN (1) CN115392629A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595449A (zh) * 2023-06-06 2023-08-15 西安科技大学 基于改进ssa优化支持向量机的异步电机故障诊断方法
CN116777120A (zh) * 2023-08-16 2023-09-19 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于路网od对的城市道路移动源碳排放计算方法
CN117572295A (zh) * 2024-01-12 2024-02-20 山东和兑智能科技有限公司 一种高压套管多模态在线监测及预警方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595449A (zh) * 2023-06-06 2023-08-15 西安科技大学 基于改进ssa优化支持向量机的异步电机故障诊断方法
CN116595449B (zh) * 2023-06-06 2023-12-12 西安科技大学 基于改进ssa优化支持向量机的异步电机故障诊断方法
CN116777120A (zh) * 2023-08-16 2023-09-19 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于路网od对的城市道路移动源碳排放计算方法
CN116777120B (zh) * 2023-08-16 2023-10-27 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于路网od对的城市道路移动源碳排放计算方法
CN117572295A (zh) * 2024-01-12 2024-02-20 山东和兑智能科技有限公司 一种高压套管多模态在线监测及预警方法
CN117572295B (zh) * 2024-01-12 2024-04-12 山东和兑智能科技有限公司 一种高压套管多模态在线监测及预警方法

Similar Documents

Publication Publication Date Title
CN115392629A (zh) 一种基于改进svr的煤矸石发热量软测量方法
CN106202946A (zh) 基于深度信念网络模型的水泥熟料游离钙含量预测方法
CN111144552B (zh) 一种粮食品质多指标预测方法及装置
CN113011796A (zh) 一种基于“层次分析-神经网络”的食用油安全预警方法
CN110880369A (zh) 基于径向基函数神经网络的气体标志物检测方法及应用
Gu et al. Bayesian Takagi–Sugeno–Kang fuzzy model and its joint learning of structure identification and parameter estimation
CN113011660A (zh) 空气质量预测方法、系统及存储介质
CN107992945A (zh) 基于深度学习和进化计算的特征基因选择方法
CN114565193A (zh) 基于机器学习的煤自燃倾向性预测方法
CN115096357A (zh) 一种基于ceemdan-pca-lstm的室内环境质量预测方法
CN115034129A (zh) 一种面向火电厂脱硝装置的NOx排放浓度软测量方法
Hao et al. Prediction of nitrogen oxide emission concentration in cement production process: a method of deep belief network with clustering and time series
Lughofer et al. Robust generalized fuzzy systems training from high-dimensional time-series data using local structure preserving PLS
CN117521912A (zh) 一种碳排放测算模型及对比评价方法及其应用
CN112434888A (zh) 一种基于深度学习的双向长短期记忆网络的pm2.5预测方法
Chen et al. Prediction method of sulfur dioxide emission
Wang et al. A new input variable selection method for soft sensor based on stacked auto-encoders
CN105974058A (zh) 基于电子鼻-人工神经网络的快速检测烟叶中钾含量的方法
Li et al. Long short-term memory based on random forest-recursive feature eliminated for hot metal silcion content prediction of blast furnace
Wang et al. Attention-inspired rnn encoder-decoder for sensory time series forecasting
CN115064207A (zh) 蛋白质亚细胞定位的空间蛋白质组学深度学习预测方法
CN111062118B (zh) 一种基于神经网络预测分层的多层软测量建模系统及方法
CN111160419B (zh) 一种基于深度学习的电子式互感器数据分类预测方法及装置
CN113326971A (zh) 一种基于PCA和Adaboost的隧道交通事故持续时间预测方法
Xiao et al. Sausage quality classification of hyperspectral multi-data fusion based on machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Gao Xiangbin

Inventor after: Jia Bo

Inventor after: Li Gen

Inventor before: Gao Xiangbin

Inventor before: Jia Bo

Inventor before: Ma Xiaojing

Inventor before: Zhang Jiawang

Inventor before: Liu Han

Inventor before: Li Gen

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240227

Address after: Room 801, block B, Shanghai building, 430 East Hebei Road, Xinshi District, Urumqi, Xinjiang Uygur Autonomous Region 830011

Applicant after: Urumqi Electric Power Construction and Debugging Institute, Xinjiang Xinneng Group Co.,Ltd.

Country or region after: China

Applicant after: STATE GRID XINJIANG ELECTRIC POWER CO., LTD., ELECTRIC POWER Research Institute

Applicant after: SOUTH CHINA University OF TECHNOLOGY

Address before: Room 801, Block B, Shanghai Building, 430 East Hebei Road, Urumqi City, Xinjiang Uygur Autonomous Region

Applicant before: Urumqi Electric Power Construction and Debugging Institute, Xinjiang Xinneng Group Co.,Ltd.

Country or region before: China

Applicant before: STATE GRID XINJIANG ELECTRIC POWER CO., LTD., ELECTRIC POWER Research Institute

Applicant before: XINJIANG University

Applicant before: SOUTH CHINA University OF TECHNOLOGY

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240429

Address after: Room 801, block B, Shanghai building, 430 East Hebei Road, Xinshi District, Urumqi, Xinjiang Uygur Autonomous Region 830011

Applicant after: Urumqi Electric Power Construction and Debugging Institute, Xinjiang Xinneng Group Co.,Ltd.

Country or region after: China

Applicant after: STATE GRID XINJIANG ELECTRIC POWER CO., LTD., ELECTRIC POWER Research Institute

Address before: Room 801, block B, Shanghai building, 430 East Hebei Road, Xinshi District, Urumqi, Xinjiang Uygur Autonomous Region 830011

Applicant before: Urumqi Electric Power Construction and Debugging Institute, Xinjiang Xinneng Group Co.,Ltd.

Country or region before: China

Applicant before: STATE GRID XINJIANG ELECTRIC POWER CO., LTD., ELECTRIC POWER Research Institute

Applicant before: SOUTH CHINA University OF TECHNOLOGY