CN101520856A - 基于kkt条件和最近邻法的支持向量回归机自适应建模方法 - Google Patents

基于kkt条件和最近邻法的支持向量回归机自适应建模方法 Download PDF

Info

Publication number
CN101520856A
CN101520856A CN200910029371A CN200910029371A CN101520856A CN 101520856 A CN101520856 A CN 101520856A CN 200910029371 A CN200910029371 A CN 200910029371A CN 200910029371 A CN200910029371 A CN 200910029371A CN 101520856 A CN101520856 A CN 101520856A
Authority
CN
China
Prior art keywords
sample
sample set
newly
similarity
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910029371A
Other languages
English (en)
Other versions
CN101520856B (zh
Inventor
周建新
司风琪
徐治皋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN2009100293711A priority Critical patent/CN101520856B/zh
Publication of CN101520856A publication Critical patent/CN101520856A/zh
Application granted granted Critical
Publication of CN101520856B publication Critical patent/CN101520856B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种机器学习领域中的基于KKT条件和最近邻法的支持向量回归机自适应建模方法。该方法先根据离线稳态试验获得的样本集进行建模与学习,再对新增样本进行标准化,判断其是否满足KKT条件,建立滚动时间窗,根据与新增样本最相似的样本计算相关相似度并定义阈值和与其比较的上下限值,用该阈值与上下限值进行比较,根据比较结果对样本集进行相应的调整并校正步骤开头构建的模型,直到所有新增样本均处理完毕。本发明方法使回归模型充分利用历史训练结果,能够显著减少后续训练时间,大大有利于工业生产、特别是电站锅炉燃烧过程参数在线软测量的实施。

Description

基于KKT条件和最近邻法的支持向量回归机自适应建模方法
技术领域
本发明涉及一种建模方法,尤其涉及一种基于KKT条件和最近邻法的支持向量回归机自适应建模方法,属于机器学习建模领域。
背景技术
机器学习(Machine Learning)是从已知样本数据或信息中通过挖掘、归纳、演绎、类比等方法获取知识的手段和机制,它是继专家系统之后人工智能应用的又一重要研究领域,并引起了广泛的关注。机器学习的目的就是根据设计的某种方法或算法,对事先给定的训练样本进行学习,然后求取对某系统输入输出之间依赖关系的估计,并使该估计能够较好的对未知输出作出尽可能准确的预测或对其性质进行判断。支持向量回归机(Support VectorRegression,SVR)是由Vapnik等人于20世纪90年代中期在统计学理论基础上发展并提出的一种新的机器学习算法,作为统计学习理论的核心内容,SVR能够较好的解决小样本学习问题,支持向量回归机已经成为机器学习建模领域的研究热点。
电站锅炉是火力发电厂的三大主要设备之一,不断提高锅炉的经济性、安全性和环保性,能够促进火电机组的节能降耗,对于整个国民经济与和谐社会的可持续发展均具有重要的战略意义。同时,由于电站锅炉是一个典型的多输入、多输出时变系统,炉内燃烧具有强非线性、大时滞等特点,是一个复杂的物理化学过程,因此,针对电站锅炉燃烧优化是一项复杂而庞大的系统工程,涉及到包括燃烧过程参数实时检测在内的多方面的研究工作。电站已有的燃烧参数测量仪表运行的不可靠、不稳定以及测量不准确性的现状迫切需要加强对锅炉燃烧过程参数的实时准确测量进行研究。软测量技术是解决这一问题的有效方法,也是该领域的一个研究热点。
目前通过软测量获得预估模型还存在一个模型的在线训练与更新问题,主要是由于很多热工问题是一些渐变问题(如燃烧设备老化、更换或者某些工况的变化),伴随着现场数据样本的不断积累和完善,新样本也在不断涌现和增加,这类新样本所携带的信息与原始样本或者试验样本是有所区别的,此时已获得的静态模型将不能如实反映实际运行工况的变化。
发明内容
本发明为解决软测量获得的模型的在线训练与更新问题而提出一种基于KKT条件和最近邻法的支持向量回归机自适应建模方法。
一种基于KKT条件和最近邻法的支持向量回归机自适应建模方法,包括如下步骤:
(1)通过离线稳态试验获得先验稳态样本集D={x1,x2,...,xL},并将该样本集D作为初始的训练样本集进行模型的构建与学习,预先设定初始训练样本集的最大容量M;
(2)设第一样本xk为样本集D之外的新增样本,对该新增样本进行标准化,判断其是否满足KKT条件,若满足,则进入步骤(5),否则进入步骤(3);
(3)建立一个宽度为L的滚动时间窗,由下述(A)式找到与第一样本xk相似度最高的第二样本xp,并通过下述(B)式计算第二样本xp与第三样本xi的平均相似度Save及第一样本xk与第二样本xp的相似度Sp
S case ( x , x i ) = | | x - x i | | S case ( x k , x p ) = min { S case ( x k , x i ) } , i = 1,2 , . . . , L - - - ( A )
S ave = 1 L - 1 Σ i = 1 , i ≠ p L S case ( x p , x i ) S p = S case ( x k , x p ) - - - ( B )
其中:Scase(x,xi)为相似度函数;xi、xp∈D;i是样本集D中元素编号,i≠p,L为自然数;
(4)定义阈值 K = S p S ave , 并预设阈值K比较的下限K1和上限K2,两者取值根据实际样本的数据特点而定,其中:K1≤1,K2>1;
(5)比较阈值K与下限K1和上限K2的大小:
若K≤K1,说明第一样本xk与第二样本xp高度相似,则样本集D不需要更新,维持样本集D及步骤(1)构建的模型结构参数不变;
若K2>K>K1,则说明第一样本xk与第二样本xp相似度较高,以第一样本xk代替第二样本xp,样本集D更新为第二样本集D′={x1,x2,...,xp-1,xp+1,...,xL,xk},然后校正步骤(1)构建的模型;
若K≥K2,则说明第一样本xk与第二样本xp相似度低,第一样本xk进入样本集D,调整滚动时间窗的宽度L′=L+1,样本集D更新为第三样本集D"={x1,x2,...,xL,xk},然后校正步骤(1)构建的模型;若此时L′>M,则保持初始训练样本集最大容量M不变,根据时间先后顺序,随时间窗的滚动将最早进入时间窗的数据滚动剔除,其中:L′为调整后的滚动时间窗宽度;
(6)令k=k+1,转到步骤(2),根据实际需要,直至所有新增样本全处理完毕,其中:k为新增样本编号,为自然数。
本发明方法具有如下有益效果:
1、本发明方法使回归模型充分利用历史训练结果,能够显著减少后续训练时间,将大大有利于工业生产、特别是电站锅炉燃烧过程参数在线软测量的实施;
2、本发明方法使回归模型无需保存海量历史数据就可实现模型的实时更新,减少了建模过程对存储空间的要求,便于应用于在线学习中;
3、本发明方法具备自校正学习功能,能够自主发现新样本中所携带的信息并进行自适应学习,对完全依靠原始训练样本获得的预估模型能够作不断的自我动态调整。
附图说明
图1是本发明中软测量自适应建模流程图。
具体实施方式
一种基于KKT(Karush-Kuhn-Tucker)条件和最近邻法的支持向量回归机自适应建模方法,包括如下步骤:
(1)通过离线稳态试验获得先验稳态样本集D={x1,x2,...,xL},并将该样本集D作为初始的训练样本集进行模型的构建与学习,预先设定初始训练样本集的最大容量M;
(2)设第一样本xk为样本集D之外的新增样本,对该新增样本进行标准化,判断其是否满足KKT条件,只有违反KKT条件的样本才包含新的信息并可能成为新的支持向量,若满足KKT条件,则进入步骤(5),否则进入步骤(3);
(3)建立一个宽度为L的滚动时间窗,由下述(A)式找到与第一样本xk相似度最高的第二样本xp’并通过下述(B)式计算第二样本xp与第三样本xi的平均相似度Save及第一样本xk与第二样本xp的相似度Sp
S case ( x , x i ) = | | x - x i | | S case ( x k , x p ) = min { S case ( x k , x i ) } , i = 1,2 , . . . , L - - - ( A )
S ave = 1 L - 1 Σ i = 1 , i ≠ p L S case ( x p , x i ) S p = S case ( x k , x p ) - - - ( B )
其中:Scase(x,xi)为相似度函数;‖·‖为欧氏空间距离;xi、xp∈D;i是样本集D中元素编号,i≠p,L为自然数;
(4)定义阈值 K = S p S ave , 并预设阈值K比较的下限K1和上限K2,两者取值根据实际样本的数据特点而定,其中:K1≤1,K2>1;
(5)比较阈值K与下限K1和上限K2的大小:
若K≤K1,说明第一样本xk与第二样本xp高度相似,则样本集D不需要更新,维持样本集D及步骤(1)构建的模型结构参数不变;
若K2>K>K1,则说明第一样本xk与第二样本xp相似度较高,以第一样本xk代替第二样本xp,样本集D更新为第二样本集D′={x1,x2,...,xp-1,xp+1,...,xL,xk},然后校正步骤(1)构建的模型;
若K≥K2,则说明第一样本xk与第二样本xp相似度低,第一样本xk进入样本集D,调整滚动时间窗的宽度L′=L+1,样本集D更新为第三样本集D"={x1,x2,...,xL,xk},然后校正步骤(1)构建的模型;若此时L′>M,则保持初始训练样本集最大容量M不变,根据时间先后顺序,随时间窗的滚动将最早进入时间窗的数据滚动剔除,保证了训练样本数量不会无限扩大,避免了因数据量增大所造成的计算时间过长和内存空间不够的问题,其中:L′为调整后的滚动时间窗宽度;
(6)令k=k+1,转到步骤(2),根据实际需要,直至所有新增样本全处理完毕,其中:k为新增样本编号,为自然数。
下面以锅炉燃烧过程参数的软测量为例来介绍本发明提供的自适应建模方法的具体实施步骤,整个自适应建模过程主要有输入数据预处理、KPCA提取辅助变量、模型建立及优化和模型在线自校正等四个核心模块。详细流程如图1所示:
1、来自DCS的现场数据通过“网络交换机”进入“数据输入接口机”;
2、数据进入输入数据预处理环节后,首先根据燃烧过程参数生成机理和影响因素分析确定建模的初始输入变量,然后对获取的原始数据进行预处理和样本提取;
3、利用核主元分析(KPCA)提取用于软测量的辅助变量后直接进入建模环节;
4、在模型建立与优化环节,SVR建模过程采取GA参数寻优法,与离线建模不同的是这里增加了一个在线自校正环节;
5、在模型的在线自校正环节,实时检测是否有新样本进入,然后根据自校正算法及时更新训练样本集和模型;
6、最终实时获得最新的软测量回归模型,对测试样本输出软测量预测结果,并及时更新燃烧过程参数的模型库;
7、借助已获得的软测量模型实施优化策略,并通过锅炉燃烧优化系统将预测数据与优化指导结果输出到客户端。

Claims (1)

1、一种基于KKT条件和最近邻法的支持向量回归机自适应建模方法,其特征在于包括如下步骤:
(1)通过离线稳态试验获得先验稳态样本集D={x1,x2,...,xL},并将该样本集D作为初始的训练样本集进行模型的构建与学习,预先设定初始训练样本集的最大容量M;
(2)设第一样本xk为样本集D之外的新增样本,对该新增样本进行标准化,判断其是否满足KKT条件,若满足,则进入步骤(5),否则进入步骤(3);
(3)建立一个宽度为L的滚动时间窗,由下述(A)式找到与第一样本xk相似度最高的第二样本xp,并通过下述(B)式计算第二样本xp与第三样本xi的平均相似度Save及第一样本xk与第二样本xp的相似度Sp
S case ( x , x i ) = | | x - x i | | S case ( x k , x p ) = min { S case ( x k , x i ) } , i = 1,2 , . . . , L - - - ( A )
S ave = 1 L - 1 Σ i = 1 , i ≠ p L S case ( x p , x i ) S p = S case ( x k , x p ) - - - ( B )
其中:Scase(x,xi)为相似度函数;xi、xp∈D;i是样本集D中元素编号,i≠p,L为自然数;
(4)定义阈值 K = S p S ave , 并预设阈值K比较的下限K1和上限K2,两者取值根据实际样本的数据特点而定,其中:K1≤1,K2>1;
(5)比较阈值K与下限K1和上限K2的大小:
若K≤K1,说明第一样本xk与第二样本xp高度相似,则样本集D不需要更新,维持样本集D及步骤(1)构建的模型结构参数不变;
若K2>K>K1,则说明第一样木xk与第二样本xp相似度较高,以第一样本xk代替第二样本xp,样本集D更新为第二样本集D′={x1,x2,...,xp-1,xp+1,...,xL,xk},然后校正步骤(1)构建的模型;
若K≥K2,则说明第一样本xk与第二样本xp相似度低,第一样本xk进入样本集D,调整滚动时间窗的宽度L′=L+1,样本集D更新为第三样本集D"={x1,x2,...,xL,xk},然后校正步骤(1)构建的模型;若此时L′>M,则保持初始训练样本集最大容量M不变,根据时间先后顺序,随时间窗的滚动将最早进入时间窗的数据滚动剔除,其中:L′为调整后的滚动时间窗宽度;
(6)令k=k+1,转到步骤(2),根据实际需要,直至所有新增样本全处理完毕,其中:k为新增样本编号,为自然数。
CN2009100293711A 2009-04-10 2009-04-10 基于kkt条件和最近邻法的支持向量回归机自适应建模方法 Expired - Fee Related CN101520856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100293711A CN101520856B (zh) 2009-04-10 2009-04-10 基于kkt条件和最近邻法的支持向量回归机自适应建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100293711A CN101520856B (zh) 2009-04-10 2009-04-10 基于kkt条件和最近邻法的支持向量回归机自适应建模方法

Publications (2)

Publication Number Publication Date
CN101520856A true CN101520856A (zh) 2009-09-02
CN101520856B CN101520856B (zh) 2011-09-07

Family

ID=41081437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100293711A Expired - Fee Related CN101520856B (zh) 2009-04-10 2009-04-10 基于kkt条件和最近邻法的支持向量回归机自适应建模方法

Country Status (1)

Country Link
CN (1) CN101520856B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787507A (zh) * 2016-02-16 2016-07-20 中国石油大学(华东) 基于预算支持向量集的LS-SVMs在线学习方法
CN106292590A (zh) * 2016-08-19 2017-01-04 广东亚仿科技股份有限公司 一种电厂煤耗及碳排放监测方法及系统
CN107742000A (zh) * 2017-08-31 2018-02-27 国网江西省电力公司电力科学研究院 锅炉燃烧含氧量建模方法
CN107842713A (zh) * 2017-11-03 2018-03-27 东北大学 基于knn‑svr的海底管道漏磁数据缺失插补方法
CN110134088A (zh) * 2019-05-21 2019-08-16 浙江大学 一种基于增量支持向量回归的自适应质量预报方法
CN111459030A (zh) * 2020-04-16 2020-07-28 南京英璞瑞自动化科技有限公司 一种用于锅炉闭环燃烧优化的自适应建模方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617455A (zh) * 2013-11-29 2014-03-05 广东电网公司电力科学研究院 基于虚拟机组子群的网厂两级负荷优化调度方法
CN103778324A (zh) * 2014-01-02 2014-05-07 浙江大学 基于负荷重采样的电厂燃烧过程机器学习建模方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100461210C (zh) * 2006-12-14 2009-02-11 东华大学 一种基于模糊逻辑的神经网络输入参数筛选方法
CN101339577B (zh) * 2008-08-07 2010-06-02 中国电子科技集团公司第十研究所 基于支持向量回归机的平板裂缝天线建模方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787507A (zh) * 2016-02-16 2016-07-20 中国石油大学(华东) 基于预算支持向量集的LS-SVMs在线学习方法
CN106292590A (zh) * 2016-08-19 2017-01-04 广东亚仿科技股份有限公司 一种电厂煤耗及碳排放监测方法及系统
CN107742000A (zh) * 2017-08-31 2018-02-27 国网江西省电力公司电力科学研究院 锅炉燃烧含氧量建模方法
CN107742000B (zh) * 2017-08-31 2021-01-05 国网江西省电力公司电力科学研究院 锅炉燃烧含氧量建模方法
CN107842713A (zh) * 2017-11-03 2018-03-27 东北大学 基于knn‑svr的海底管道漏磁数据缺失插补方法
CN107842713B (zh) * 2017-11-03 2019-04-05 东北大学 基于knn-svr的海底管道漏磁数据缺失插补方法
CN110134088A (zh) * 2019-05-21 2019-08-16 浙江大学 一种基于增量支持向量回归的自适应质量预报方法
CN111459030A (zh) * 2020-04-16 2020-07-28 南京英璞瑞自动化科技有限公司 一种用于锅炉闭环燃烧优化的自适应建模方法
CN111459030B (zh) * 2020-04-16 2022-03-29 南京英璞瑞自动化科技有限公司 一种用于锅炉闭环燃烧优化的自适应建模方法

Also Published As

Publication number Publication date
CN101520856B (zh) 2011-09-07

Similar Documents

Publication Publication Date Title
CN101520856B (zh) 基于kkt条件和最近邻法的支持向量回归机自适应建模方法
TWI543102B (zh) 異因分析與校正方法與系統
CN109222208A (zh) 面向卷烟生产指标控制的制丝工艺分析优化方法及系统
Zhang et al. Local parameter optimization of LSSVM for industrial soft sensing with big data and cloud implementation
CN105209984B (zh) 用于确定技术系统输出值的模型的方法
CN111148118A (zh) 基于时间序列的流量预测和载波关断方法和系统
CN103543719B (zh) 一种基于工况的流程行业操作模式自适应调整方法
CN107609667B (zh) 基于Box_cox变换和UFCNN的供热负荷预测方法及系统
CN106156434A (zh) 基于局部时滞重构的滑动窗时间差‑高斯过程回归建模方法
CN104539601B (zh) 动态网络攻击过程可靠性分析方法及系统
CN109847916B (zh) 一种水泥原料立磨系统的节能优化方法
CN109615124B (zh) 一种基于深度学习的scada主站负荷预测方法
CN106778838A (zh) 一种预测空气质量的方法
CN102004444A (zh) 稀土萃取过程组分含量多模型预测控制方法
CN113469449A (zh) 脱硫系统的寻优控制方法及系统
Herrera et al. On-line learning of predictive kernel models for urban water demand in a smart city
CN116307746A (zh) 基于分时体感温度相关性的lstm配变负荷预测实现方法
CN104122878B (zh) 工业节能减排控制装置的控制方法
CN103558762B (zh) 基于图形化组态技术的免疫遗传pid控制器的实现方法
CN112183642A (zh) 一种基于随机森林模型的水泥烧成煤耗检测方法与系统
CN111507777A (zh) 一种基于轻量级梯度提升算法预测电价的系统模型
CN113033109B (zh) 一种基于学习的工业网络系统边缘感知与控制设计方法
CN116505556B (zh) 基于一次调频的风电场功率控制系统及方法
Chen et al. An Improved Twin Support Vector Regression Machine Based on Adjusted Cosine Similarity for Load Prediction
Wang A new variable selection method for soft sensor based on deep learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110907

Termination date: 20180410

CF01 Termination of patent right due to non-payment of annual fee