一种火电机组调峰能力预测方法、装置及系统
技术领域
本发明涉及火电厂发电技术领域,特别涉及一种火电机组调峰能力预测方法、装置及系统。
背景技术
火力发电是一个极为复杂的生产过程,在不同煤质和季节下,机组带负荷能力存在显著差异,要实现火电机组调峰能力监测和评估,采用传统方法很难取得较好效果,因此,如何对海量运行历史数据进行挖掘,自动划分机组运行工况,并预测出每个工况下的机组调峰能力是电网安全可靠调度、运行以及智能电网建设的要求,也是目前仍待研究的问题。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供一种火电机组调峰能力预测方法、装置及系统,对火电机组调峰能力进行在线预测,能为电网编制负荷调度策略提供数据基础。
本发明提供了一种火电机组调峰能力预测方法、装置及系统。
根据本发明实施例的一种火电机组调峰能力预测方法,包括以下步骤:
从火电机组正常运行的历史数据中筛选出包含若干个训练样本的数据集,所述训练样本中包含工况参数和寻优参数;
根据BIC值确定所述数据集的最优聚类个数;
基于K-means算法按照所述最优聚类个数对所述数据集进行一次聚类,得到一次聚类结果;
基于GMM算法并以所述最优聚类个数以及所述一次聚类结果作为输入参数对所述数据集进行二次聚类,得到二次聚类结果,并且在所述二次聚类结果中确定每个类簇中寻优参数的最大值、以及所有类簇中寻优参数的最小值;
将采集的实时数据在所有类簇中确定相似度最高的类簇,将所述相似度最高的类簇中寻优参数的最大值、以及所述所有类簇中寻优参数的最小值作为预测结果。
根据本发明的一些实施例,所述工况参数包括:入炉煤质参数、循环水入口温度和磨煤机给煤量,所述入炉煤质参数包括:收到基水分、收到基灰分、干燥无灰基挥发分以及低位发热量。
根据本发明的一些实施例,所述将采集的实时数据在所有类簇中确定相似度最高的类簇之前,还包括步骤:
基于软测量方法对所述入炉煤质参数进行实时预测。
根据本发明的一些实施例,所述软测量方法为三层BP神经网络算法。
根据本发明的一些实施例,所述在所有类簇中确定相似度最高的类簇,进一步包括:
设定最优聚类个数为K,将采集的实时数据与所述二次聚类结果中的K个高斯模型期望值进行相似度计算并选取相似度最高的类簇。
根据本发明实施例的一种火电机组调峰能力预测装置,包括:
样本数据获取组件、最优聚类个数确定组件、多重聚类计算组件、以及预测结果确定组件;
所述样本数据获取组件用于从火电机组正常运行的历史数据中筛选出包含若干个训练样本的数据集,所述训练样本中包含工况参数和寻优参数;
所述最优聚类个数确定组件用于根据BIC值确定所述数据集的最优聚类个数;
所述多重聚类计算组件用于基于K-means算法按照所述最优聚类个数对所述数据集进行一次聚类,得到一次聚类结果;
所述多重聚类计算组件还用于基于GMM算法并以所述最优聚类个数以及所述一次聚类结果作为输入参数对所述数据集进行二次聚类,得到二次聚类结果,并且在所述二次聚类结果中确定每个类簇中寻优参数的最大值、以及所有类簇中寻优参数的最小值;
所述预测结果确定组件用于将采集的实时数据在所有类簇中确定相似度最高的类簇,将所述相似度最高的类簇中寻优参数的最大值、以及所述所有类簇中寻优参数的最小值作为预测结果。
根据本发明的一些实施例,还包括实时预测组件;
所述实时预测组件用于基于软测量方法对所述工况参数中的入炉煤质参数进行实时预测。
根据本发明实施例的一种火电机组调峰能力预测系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述的一种火电机组调峰能力预测方法。
相对于现有技术,本公开实施例披露的技术方案具有以下优点:
本发明方法分别通过BIC值、以及K-means算法确定训练样本集的最优聚类个数、以及GMM算法的初始参数,能够有效提升GMM算法中利用EM算法求解高斯分布参数的准确性,从而提升最终预测的准确性;本发明提供的一种火电机组调峰能力预测方法、装置及系统能够对火电机组调峰能力进行在线预测,能为电网编制负荷调度策略提供数据基础。
本公开实施例所实现的更多特点和优势,将在具体实施方式或实践中给出。
附图说明
下面结合附图和实施例对本发明进一步地说明;
图1为本发明实施例提供的一种火电机组调峰能力预测方法的流程示意图;
图2为本发明实施例提供的不同聚类个数对应的BIC值的示意图;
图3为本发明实施例提供的火电机机组调峰能力在线预测结果示意图;
图4为本发明实施例提供的低位发热量的实时预测结果示意图;
图5为本发明实施例提供的收到基水分的实时预测结果示意图;
图6为本发明实施例提供的干燥无灰基挥发分的实时预测结果示意图;
图7为本发明实施例提供的收到基灰分的实时预测结果示意图;
图8为本发明实施例提供的一种火电机组调峰能力预测装置的结构示意图;
图9为本发明实施例提供的一种火电机组调峰能力预测方法的流程示意图。
具体实施方式
下面将结合附图,对本公开实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。需要说明的是,在不冲突的情况下,本公开实施例及实施例中的特征可以相互组合。另外,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本公开的每个技术特征和整体技术方案,但其不能理解为对本公开保护范围的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
参照图1,本发明的一个实施例,提供了一种火电机组调峰能力预测方法,包括以下步骤:
步骤S100、从火电机组正常运行的历史数据中筛选出包含若干个训练样本的数据集,训练样本中包含工况参数和寻优参数;
作为一种可实施方式,获取火电厂机组运行的历史数据,筛选正常运行历史数据得到正常状态数据集X={xi∈RD,yi|i=1,2,…,n}作为训练样本,其中,xi为第i个样本中的工况参数,D为工况参数的个数,yi为第i个样本中寻优参数(机组负荷),n为数据集中样本的个数;这里的工况参数包括:入炉煤质参数、循环水入口温度、以及磨煤机给煤量,其中,入炉煤质参数包括:收到基水分、收到基灰分、干燥无灰基挥发分、低位发热量;这里的寻优参数即机组负荷。
步骤S200、根据BIC值确定数据集的最优聚类个数;
在本步骤中,根据最佳聚类数的搜索范围,初步确定聚类个数k的范围为:
这里,以贝叶斯信息准则(Bayesian Information Criterion,BIC)作为判断聚类个数的评价标准的依据,确定BIC值最大的聚类个数为最优聚类个数K,式如下:
BIC=2 lk(X,Θ)-Dlog(n) (1)
在式(1)中,lk(X,Θ)表示k个聚类时训练样本的似然函数,D表示工况参数个数,n表示训练样本个数。
步骤S300、根据最优聚类个数,基于K-means算法对数据集进行一次聚类,得到一次聚类结果;
详细步骤如下:
步骤S310、确定正常状态数据集X中工况参数数值范围,在参数范围内任选K个工况参数数据点,作为初始聚类中心点
步骤S320、计算数据集X中每一组样本x
i到每一聚类中心
的欧式距离,选取距离它最近的聚类中心
划分到聚类中心
所属类簇
其中
步骤S330、采取求均值的方法重新计算分类后的各聚类中心
步骤S340、计算距离函数
若E(X,U
0)收敛,则输出最终的聚类中心
和K个类簇
若E(X,U
0)不收敛,则跳转至步骤S320;
步骤S350、确定每个类簇的
和
作为下一步高斯混合模型的初始参数,计算如下;
上述式(2)、(3)、以及(5)中
和
分别表示第j个类簇的权值、期望和协方差(即一次聚类结果)。
步骤S400、根据一次聚类结果以及最优聚类个数,基于GMM算法对数据集进行二次聚类,得到二次聚类结果,并且在二次聚类结果中确定每个类簇中寻优参数的最大值、以及所有类簇中寻优参数的最小值;
本步骤是将上述步骤S200得到的最优聚类个数以及步骤S300得到的聚类结果作为输入参数,根据GMM算法进行聚类,最后确定收敛后的每个聚类中寻优参数的最大值、以及所有聚类中寻优参数的最小值;
详细步骤如下:
首先,根据上述步骤S200中的BIC确定的最优聚类个数K和K-means算法确定的初始输入参数
利用式(8)、(9)、(10)、以及(11)不断迭代,直到前后两次参数的差值小于设定好的阈值,得到最终GMM(高斯混合模型)的参数Θ。
其中,GMM的详细描述如下:
概率密度函数可以用高斯混合模型表示为:
在式(6)中,K为高斯模型的最优聚类个数,ωk为第k个高斯分量的权重,μk、Σk分别为局部高斯模型的均值和协方差,g(xi|μk,Σk)为第k个高斯分量的多元高斯密度函数,可以表示为:
然后,通过期望最大化(EM)算法对GMM方法中的未知参数进行求解,即在p(X;μ,Σ)为最大值条件下(样本点xi已经发生,故可认为p(X;μ,Σ)是样本xi发生的最大概率),求得μ和Σ。
根据训练样本X={x
i∈R
D,y
i|i=1,2,…,n}、最优聚类个数K和由K-means聚类算法确定的初始值:
利用EM算法通过不断重复E-step和M-step来更新参数,以保证训练数据似然度单调增加到一定值。
其中,EM算法的迭代步骤如下:
E-step:
式(8)中,p(s)(Ck|xi)为第s次迭代后第i个训练样本xi属于第k个高斯分量的后验概率。
M-step:
在式(9)、(10)、(11)中,
和
分别为第(s+1)次迭代后第k个高斯分量的期望、协方差和先验概率。
在得到高斯混合模型的数学求解结果后,基于EM算法不断求解迭代可以得到各个模型参数,从而进一步实现了对训练样本X的K个工况划分。
最后,根据越大越优的寻优目标,确定每个类簇中寻优参数的最大值maxk;根据越小越优的寻优目标,确定所有类簇中寻优参数的最小值min。
步骤S500、将采集的实时数据在所有类簇中确定相似度最高的类簇,将相似度最高的类簇中寻优参数的最大值、以及所有类簇中寻优参数的最小值作为预测结果。
详细步骤如下:
计算一组实时数据与K个类簇的相似系数sim(μk|xi),具体式如下:
j=argmax(sim(μk|xi)) (13)
xi∈μj (14)
在式(12)中,xi为现场采集的一组实时数据(即实时工况参数),分别与高斯混合模型中的K个高斯模型期望值μk进行相似度计算,相似度最高的类簇作为实时数据xi所属类簇j。
该类簇j下的寻优参数的最大值maxj和所有类簇中寻优参数的最小值min作为采集实时数据的预测结果。
本实施例的预测结果如图2与图3所示,在图2中,BIC值最小为最优聚类个数,从图中可以看出聚类个数为20的时候为最优聚类个数(聚类个数即运行工况);在图3中,预测了20个运行工况带负荷能力的最小值和最大值。
由于在本领域中,通过EM算法求解高斯分布参数对初始参数以及聚类个数的要求是很高的,不同的初始参数以及聚类个数会输出不同的估计结果,本实施例提供的方法通过算法手段让输入参数尽可能贴合实际情况和业务要求;本实施例通过BIC值、以及K-means算法确定训练样本集的最优聚类个数、以及GMM算法的初始参数,能够显著提高EM算法的收敛速度,从而提高EM算法求解高斯分布参数的准确性,从而提升最终预测的准确性;本实施例方法能够对火电机组调峰能力进行在线预测,能为电网编制负荷调度策略提供数据基础。
优选的,在步骤S500之前还包括步骤:基于软测量方法对入炉煤质参数进行实时预测。
入炉煤煤质参数包括:收到收到基水分、收到基灰分、干燥无灰基挥发分、低位发热量,这些参数在本领域中难以直接测量,而且又是火电机组运行工况划分的必须参数,因此需要对这些参数进行预测。
为了方便理解,对以下术语进行解释:
软测量技术(又叫做软仪表技术),是依据较易测得的辅助过程变量(也称自变量)与难以直接测量的待测主导变量(也称因变量)之间的相关关系,通过数学或者其他方法计算获得待测变量的技术。软测量的核心是寻找辅助过程变量和待测主导变量之间的相关关系并建立相应数学模型。建模的方法非常多,比如回归分析、模糊数学、模式识别、人工神经网络,其中,神经网络具有很好的泛化能力,容错性较高。
为了提高计算结果精确度以及计算效率,本步骤使用BP神经网络算法对入炉煤质参数进行预测,即对收到基水分、收到基灰分、干燥无灰基挥发分和低位发热量进行实时预测。
作为一种可实施方式,本实施例采用3层BP网络结构,选取的输出层参数、输入层参数和隐含层数目如下表1所示:
表1
例如,从某厂600MW火电机组运行数据中共选取1873份样本,选取1700份样本进行模型训练,173份样本进行预测,结果如图4至图7所示,图中为实际值与预测值的趋势对比,由图可见,相对误差在5%以内,由此验证了实施例提供的模型、方法的实用性。
在本实施例中,通过BP神经网络对工况参数中的收到基水分、收到基灰分、干燥无灰基挥发分和低位发热量进行在线预测,有效解决了目前入炉煤质化验结果严重滞后的问题,达到了实时预测的要求。
参照图8,本发明的另一个实施例,提供了一种火电机组调峰能力预测装置,包括:
样本数据获取组件、最优聚类个数确定组件、多重聚类计算组件、以及预测结果确定组件;
样本数据获取组件用于从火电机组正常运行的历史数据中筛选出包含若干个训练样本的数据集,训练样本中包含工况参数和寻优参数;
最优聚类个数确定组件用于根据BIC值确定数据集的最优聚类个数;
多重聚类计算组件用于根据最优聚类个数,基于K-means算法对数据集进行一次聚类,得到一次聚类结果;
多重聚类计算组件还用于根据一次聚类结果以及最优聚类个数,基于GMM算法对数据集进行二次聚类,得到二次聚类结果,并且在二次聚类结果中确定每个类簇中寻优参数的最大值、以及所有类簇中寻优参数的最小值;
预测结果确定组件用于将采集的实时数据在所有类簇中确定相似度最高的类簇,将相似度最高的类簇中寻优参数的最大值、以及所有类簇中寻优参数的最小值作为预测结果。
优选的,还包括实时预测组件,实时预测组件用于基于软测量方法对工况参数中的入炉煤质参数进行实时预测。
可以理解的是,由于本实施例中的一种火电机组调峰能力预测装置与上述一种火电机组调峰能力预测方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本装置实施例,此处不再详述。
本发明的另一个实施例,提供了一种火电机组调峰能力预测系统,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述实施例中的一种火电机组调峰能力预测方法。
可以理解的是,由于本实施例中的一种火电机组调峰能力预测系统与上述一种火电机组调峰能力预测方法、以及一种火电机组调峰能力预测装置基于相同的发明构思,因此,方法实施例、以及装置实施例中的相应内容同样适用于本系统实施例,此处不再详述。
参照图9,本发明的另一个实施例,提供了一种火电机组调峰能力预测方法,包括以下步骤:
步骤1:给定训练样本X;
步骤2:提取工况参数和寻优参数;
步骤3:根据BIC值确定最优聚类个数;
步骤4:采用K-means算法进行聚类,直至收敛,输出聚类结果权值、期望和协方差;
步骤5:采用GMM算法进行进一步聚类,直至收敛;
步骤6:存储每个类簇工况参数的算数平均值、寻优参数的最大值和所有类簇寻优参数最小值;
步骤7:实时采集BP神经网络输入参数;
步骤8:采用BP神经网络算法对入炉煤质参数进行实时预测;
步骤9:实时采集循环水入口温度和磨煤机给煤量;
步骤10:结合入炉煤质参数和循环水入口温度和磨煤机给煤量形成实时工况参数;
步骤11:根据实时工况参数与各类簇工况参数算数平均值计算相似度,从所有类簇中找出相似性最高的类簇;
步骤12:把该类簇下寻优参数的最大值和所有类簇寻优参数最小值作为预测结果。
在本实施例中,步骤1至步骤6的具体过程等同上述方法实施例中的步骤S100-步骤S400,此处不再详述;步骤7和步骤8是基于软测量方法对入炉煤质参数进行实时预测,这里使用BP神经网络算法对入炉煤质参数进行预测,以解决本领域中入炉煤质参数难以直接测量的缺陷;步骤9和步骤10是采集循环水入口温度和磨煤机给煤量并结合进行预测后的入炉煤质参数形成实时输入数据;步骤11和步骤12等同上述方法实施例中的步骤S500,此处不再详述。
本实施例提供的一种火电机组调峰能力预测方法,通过BIC值、以及K-means算法确定训练样本集的最优聚类个数、以及GMM算法的初始参数,能够显著提高EM算法的收敛速度,从而提高EM算法求解高斯分布参数的准确性,从而提升最终预测的准确性;
通过BP神经网络对工况参数中的收到基水分、收到基灰分、干燥无灰基挥发分和低位发热量进行在线预测,有效解决了目前入炉煤质化验结果严重滞后的问题,达到了实时预测的要求;
本实施例对火电机组调峰能力进行在线预测,能为电网编制负荷调度策略提供数据基础。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现。本领域技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ReadOnly Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所述技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。