CN110413601B - 基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法 - Google Patents

基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法 Download PDF

Info

Publication number
CN110413601B
CN110413601B CN201910598184.9A CN201910598184A CN110413601B CN 110413601 B CN110413601 B CN 110413601B CN 201910598184 A CN201910598184 A CN 201910598184A CN 110413601 B CN110413601 B CN 110413601B
Authority
CN
China
Prior art keywords
data
identification
parameter
training
naive bayes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910598184.9A
Other languages
English (en)
Other versions
CN110413601A (zh
Inventor
潘蕾
王钱超
徐宏灿
尹琦
沈炯
李益国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201910598184.9A priority Critical patent/CN110413601B/zh
Publication of CN110413601A publication Critical patent/CN110413601A/zh
Application granted granted Critical
Publication of CN110413601B publication Critical patent/CN110413601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,包括分析所选辨识对象特性,得到相应的辨识参数;针对对象经验辨识结果和数据本身的分布特性,选择适量的可辨识和难以辨识的数据组成训练集;利用训练集对高斯朴素贝叶斯分类器进行训练,得到各个参数的先验概率;利用训练后的分类器对测试集进行粗分,得到多个可用数据段;利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。本发明节省了大量的数据处理时间,避免了多次重复劳动,同时提高了筛选数据的精度。

Description

基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法
技术领域
本发明属于大数据技术领域,涉及一种基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法-GaussianNB-PEM数据筛选法。
背景技术
大数据技术正在推动发电企业的科技创新。对海量实时数据进行有效性甄别和选择是大数据方法应用成功的重要环节。由于工业现场数据中包含所有影响因素,如设备大范围变工况、随机干扰、多扰动等,需要通过数据检验方法选择出符合特定应用需求的数据段。
贝叶斯算法是一种基于统计的分类算法,将分类问题转化为概率问题看,所有的概率都是从数据中计算或者估计得到。朴素贝叶斯分类算法是一种可以和决策树、神经网络分类算法相媲美的算法,不仅能够运用到大型数据库中,而且方法简单、且分类准确率高、速度快。其中引入了“属性条件独立性假设”条件,形成两个基础假设:1、对于每一个假设特征都互相独立;2、任何属性与输出结果都是有关系的,并且影响程度相等。高斯朴素贝叶斯,在处理连续数据时,假设每个分类相关的特征是连续的且按照高斯分布。
预报误差法是指利用k时刻之前的输入和输出信号计算(k+1)直到未来时刻的输出的方法。给定观测量z(k)之后,调整参数θ,使预报的均方根误差达到最小参数估计。
若能将高斯朴素贝叶斯分类器和预报误差结合,则可在训练集不完全准确的情况下,在大范围实际数据中找出能较为准确辨识的数据段,避免大量重复劳动和节约数据筛选时间,而目前尚没有相关文献和专利。
发明内容
发明目的:针对火电厂实时运行数据中不确定因素多、模型辨识数据样本难以正确筛选的问题,本发明尝试利用贝叶斯算法进行样本的统计学习,以筛选获得有效的闭环辨识数据样本。
技术方案:为实现上述发明目的,本发明采用以下技术方案:
基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,包括以下步骤:
(1)分析发电机组辨识对象特性,得到相应的辨识参数作为筛选法的输入参数;
(2)针对发电机组辨识对象经验辨识结果和辨识参数数据本身的分布特性,选择适量的可辨识和难以辨识的数据组成训练集;利用训练集对高斯朴素贝叶斯分类器进行训练,得到各个参数的先验概率;利用训练后的分类器对测试集进行粗分,得到多个可用数据段;
(3)利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
进一步的,步骤(1)具体为:辨识对象为发电机组内部环节,选择与辨识对象相关的主要参数,即辨识参数,作为GaussianNB-PEM数据筛选法的输入参数,包括发电机组的被控参数集合y、控制参数集合u和扰动参数集合r;每一个辨识参数均作为辨识对象的一个属性,共有d个,d为正整数;输入参数的数据分为若干个类别,某个类别用序号表示为第c个类别,c为正整数,建立在{y,u,r}属性集上,每个属性上的取值记为{xi,i∈1~d}。
进一步的,步骤(2)具体为:根据发电机组辨识参数数据特性和辨识参数数据所需长度选择合适的可辨识参数数据和难以辨识参数数据组成训练集,将可辨识参数中的每一组数据的标签记为1,难以辨识参数中的每一组数据的标签记为2,共分两类,c=1或c=2,以此训练集对分类器进行训练;发电机组辨识参数的非训练集数据均属于测试集;
训练和筛选步骤如下:
(21)利用训练集计算各辨识参数的先验概率,对分类器进行训练:
Figure GDA0003249523300000021
其中,P(c|x)为第c个类别相对于训练样本x的类条件概率;P(x)是用于归一化的因子;P(x|c)是训练样本x相对于第c个类别的类条件概率;P(c)是先验概率;P(xi|c)为x在第i个属性上的取值相对于第c个类别的类条件概率;xi为x在第i个属性上的取值;d为属性数目;对于已知训练样本x,P(x)与类标记无关,基于训练集提供的信息来计算得到P(c)和P(x|c);
(22)利用高斯朴素贝叶斯分类器对测试样本进行初步分类:
高斯朴素贝叶斯分类器,在处理连续数据时,假设每个分类相关的特征是连续的且按照高斯分布,即可得到P(x|c):
Figure GDA0003249523300000031
其中,μc对应类别c下xi的均值;σ2 c是方差;
(23)对测试集进行分类
将测试集代入训练好的分类器中,用已知类标记的所有可能值计算概率Pnb,并选择输出概率最大的结果所代表的类别作为最终输出:
Figure GDA0003249523300000032
其中,Pnb(x)是测试集数据分别在c=1和c=2两类标记下的概率。
进一步的,步骤(3)具体为:
(31)预报误差的协方差阵为:
Figure GDA0003249523300000033
其中,N为辨识参数数据长度;e(k,θ)辨识参数预报误差,θ为辨识参数估计;
利用与协方差阵有关的标量函数J2 N(θ)作为代价函数,J2 N(θ)取极小时的参数估计值θ,称为预报误差估计:
J2(θ)=lg[detD(θ)];
(32)用步骤(31)求得的辨识参数预报误差e(k,θ),且得到一个最好的辨识模型:
z(k)=f[z(k-1),...,z(1),z(0),u(k-1),...,u(1),θ]+e(k,θ)=f[zk-1,uk-1,θ]+e(k,θ);
其中,z(k-1)为k-1时刻的辨识模型输出;u(k-1)为k-1时刻的辨识模型输入;e(k,θ)表示k时刻的辨识参数预报误差;
(33)利用得到的预报误差模型的拟合度对初步分类数据段进行二次细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
进一步的,步骤(33)中对初步分类数据段进行二次细分得到最优可辨识数据段的具体方法为:
(a)拟合度计算公式为:
Figure GDA0003249523300000041
其中,yi是实际输出;
Figure GDA0003249523300000042
是拟合输出;
Figure GDA0003249523300000043
是实际输出的均值;
(b)在所有的模型拟合度中选择拟合度最大的数据段作为最优可辨识数据段。
进一步的,步骤(33)中设置拟合度阈值,得到多个辨识较好数据段具体方法为:
(a)拟合度计算公式为:
Figure GDA0003249523300000044
其中,yi是实际输出;
Figure GDA0003249523300000045
是拟合输出;
Figure GDA0003249523300000046
是实际输出的均值;
(b)设定拟合度阈值为λ,λ取值为0~100之间,在所有的模型拟合度中选择拟合度大于λ的数据段作为辨识较好的数据段。
有益效果:与现有技术相比,本发明具有以下优点:
(1)本发明的数据筛选结合了辨识模型的实际数据特性,具有普适性;
(2)结合了高斯朴素贝叶斯和预报误差法二者的优点,既能够大范围筛选可用的实际数据,又能够小范围筛选并验证数据段的可用性;
(3)二级减温水系统仿真控制试验表明,利用本发明筛选出的数据进行建模相比于实际数据,更加贴近设定值且过热汽温波动较小。
附图说明
图1是本发明方法的流程图;
图2是本发明二级减温水原理图;
图3是本发明末级过热汽温辨识数据,图(a)为模型输出量与扰动量数据,图(b)为模型控制量数据;
图4是本发明阀门开度仿真与实际对比,图(a)的仿真模型由第9000-19000组数据辨识得到,图(b)的仿真模型由第105000-115000组数据辨识得到;
图5是本发明末级过热器出口蒸汽温度仿真与实际对比,图(a)的仿真模型由第9000-19000组数据辨识得到,图(b)的仿真模型由第105000-115000组数据辨识得到。
具体实施方式
下面结合附图和具体实施例对本发明的技术方案进行详细说明。
发电机组包括各种控制回路,本发明以南京某电厂二级减温水控制回路的实际数据为例,对本发明技术方案进一步详细说明:
如图1所示,本发明的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,即GaussianNB-PEM数据筛选法,包括以下步骤:
步骤1:分析二级减温水控制回路特性,得到相应的辨识参数;
二级减温水控制回路原理图如图2所示,图中二级喷水减温控制回路采用串级PID控制。入口过热蒸汽汽温进入减温器,由减温水对其进行减温使其温度达到θ1;θ1作为反馈输入到外回路P控制中。过热蒸汽再经过末级过热器加热达到温度θ2;θ2作为反馈输入到内回路PID控制中。最终由上述串级PID控制器计算下一次喷水减温的减温水量,由执行器执行。
二级减温水控制末级过热器出口蒸汽温度一般控制在540±5℃范围内,若出口蒸汽温度降低,则整体热效率降低且安全性受到影响;出口蒸汽温度每降低5℃,整体热效率会降低约1%,如果出口蒸汽温度过高则会出现爆管或者其他设备损坏的事故;二级减温水控制回路在实际电厂中存在许多扰动。如减温水阀可能存在泄漏问题造成阀门开度偏小,或者阀门设计误差造成的震荡使得流量不稳定等。末级过热器段存在大滞后、管路腐蚀等问题。除此以外还有锅炉燃烧方式、煤质变化,磨煤机运行稳定性,火焰中心位置等均会对该回路造成扰动。
经分析得到二级减温水控制回路模型辨识所需参数选取如表1所示:
表1模型辨识所需参数
Figure GDA0003249523300000061
表1中7个辨识所需参数作为GaussianNB-PEM数据筛选法的输入参数,均为二级减温水控制回路的属性,以这7个属性组成属性集合,即d=7。二级减温水回路实际数据的分类建立在此属性集合上。每个属性上的取值记为{xi,i∈1~7}。
本发明末级过热汽温实际辨识参数数据如图3所示:由图3(a)可以看出,负荷不断变化的时,总风量因为未知扰动存在一定的突变情况;末级过热器出入口的蒸汽温度波动性较强,存在持续扰动和突变情况。由图3(b)可以看出,减温水阀门开度和对应的喷水流量存在较强的波动性,数据在某些时段存在大量未知扰动;减温水阀门进出口蒸汽温度,波动性较强。
步骤2、针对对象经验辨识结果,和辨识参数数据本身的分布特性,选择适量的可辨识和难以辨识的数据组成训练集,利用训练集对高斯朴素贝叶斯分类器进行训练,利用训练后的分类器对测试集进行粗分,得到多个可用数据段:
通过分析辨识参数数据的波动性,可以表明可用于辨识的数据段占少数,因而在选取训练样本集时选取了长度为10000组的可辨识训练样本集和长度为90000组的难以辨识训练样本集,将可辨识样本集中的每一组数据的标记设为1,难以辨识样本集中的每一组数据的标记设为2,共分两类,c=1或c=2。以此训练集对分类器进行训练;发电机组辨识参数的非训练集数据均属于测试集。
训练和筛选步骤如下:
1)利用训练样本集计算各辨识参数的先验概率,对分类器进行训练:
Figure GDA0003249523300000062
其中,P(c|x)为第c个类别相对于训练样本x的类条件概率;P(x)是用于归一化的因子;P(x|c)是训练样本x相对于第c个类别的类条件概率;P(c)是先验概率,分别为1/10和9/10;P(xi|c)为x在第i个属性上的取值相对于第c个类别的类条件概率;xi为x在第i个属性上的取值;d为属性数目;对于已知样本x,P(x)与类标记无关,基于训练集提供的信息来计算得到P(c)和P(x|c)。
2)利用高斯朴素贝叶斯分类器对测试样本进行初步分类:
求取训练集各个类的每个属性的均值μc即末级过热器进出口温度均值、主蒸汽流量均值、总风量均值、阀门进出口蒸汽温度均值、阀门开度均值。
求取训练集同一类的各属性的方差与各属性之间的协方差σc,以此来确定同类各辨识参数之间的线性关系。
高斯朴素贝叶斯,在处理连续数据时,假设每个分类相关的特征是连续的且按照高斯分布:
Figure GDA0003249523300000071
其中,μc对应类别c下xi的均值;σ2 c是方差。
(3)对测试集进行分类
将测试集代入训练好的分类器中,用已知类标记的所有可能值计算概率Pnb,并选择输出概率最大的结果所代表的类别作为最终输出:
Figure GDA0003249523300000072
其中,Pnb(x)是测试集数据分别在c=1和c=2两类标记下的概率。
步骤3、利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段:
1)预报误差的协方差阵为:
Figure GDA0003249523300000073
其中,N为辨识参数数据长度;e(k,θ)辨识参数预报误差,θ为辨识参数估计。
利用与协方差阵有关的标量函数J2(θ)作为代价函数,J2(θ)取极小时的辨识参数估计值θ,称为辨识参数预报误差估计:
J2(θ)=lg[detD(θ)];
2)用步骤1)求得的辨识参数预报误差e(k,θ),且得到一个最好的辨识模型:
z(k)=f[z(k-1),...,z(1),z(0),u(k-1),...,u(1),θ]+e(k,θ)=f[zk-1,uk-1,θ]+e(k,θ);
式中:z(k-1)为k-1时刻的辨识模型输出;u(k-1)为k-1时刻的辨识模型输入;e(k,θ)表示k时刻的辨识参数预报误差。
3)利用粗分的数据段进行模型拟合,PEM模型的拟合度fit对初步分类数据段进行二次细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
拟合度计算公式为:
Figure GDA0003249523300000081
其中,yi是实际输出;
Figure GDA0003249523300000082
是拟合输出;
Figure GDA0003249523300000083
是实际输出的均值。
选择拟合度最高的数据段作为最优可辨识数据段,或者设定拟合度阈值为40,选择拟合度大于40的多个数据段作为多个辨识较好数据段。
本发明GaussianNB-PEM筛选算法流程为:
Figure GDA0003249523300000084
可知,训练集的选取对分类器的训练至关重要,通过计算训练集中辨识参数的均值和协方差,和利用高斯函数来判定测试集中参数的可用性;
图4所示为本发明阀门开度仿真与实际对比,分别为图(a)由第9000-19000组数据辨识得到和图(b)由第105000-115000组数据辨识得到,图中虚线是实际阀门开度,实线是仿真阀门开度,可以看出,实际阀门存在较多小扰动,抗扰能力差,波动性较大,仿真值与实际值波动趋势一致。
图5本发明末级过热器出口蒸汽温度仿真与实际对比,分别为图(a)由第9000-19000组数据辨识得到和图(b)由第105000-115000组数据辨识得到,其中点画线是实际末级过热器汽温温度,虚线是仿真末级过热器汽温温度,实线为末级过热汽温设定值,可以看出,末级过热器出口汽温实际值波动较多,在设定值附近震荡;仿真值比实际值更加贴近设定值,且扰动和震荡较少。
综上所述,本发明所述基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法-GaussianNB-PEM数据筛选法,结合了高斯朴素贝叶斯和预报误差法的特点,利用大数据技术,既能够快速地在庞大的实际数据中筛选出多个可用于辨识的数据段,又避免了因实际数据组成的训练集存在误差而造成的筛选错误,提高了筛选数据的精度。本发明也节省了大量的数据处理时间,避免了多次重复劳动。

Claims (6)

1.基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,包括以下步骤:
(1)分析发电机组辨识对象特性,得到相应的辨识参数作为筛选法的输入参数;
(2)针对发电机组辨识对象经验辨识结果和辨识参数数据本身的分布特性,根据需求选择可辨识和难以辨识的数据组成训练集;利用训练集对高斯朴素贝叶斯分类器进行训练,得到各个参数的先验概率;利用训练后的分类器对测试集进行粗分,得到多个可用数据段;
(3)利用预报误差法的模型拟合度对可用数据段进行细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
2.根据权利要求1所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(1)具体为:辨识对象为发电机组内部环节,选择与辨识对象相关的主要参数,即辨识参数,作为GaussianNB-PEM数据筛选法的输入参数,包括发电机组的被控参数集合y、控制参数集合u和扰动参数集合r;每一个辨识参数均作为辨识对象的一个属性,共有d个,d为正整数;输入参数的数据分为若干个类别,某个类别用序号表示为第c个类别,c为正整数,建立在{y,u,r}属性集上,每个属性上的取值记为{xi,i∈1~d}。
3.根据权利要求1所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(2)具体为:根据发电机组辨识参数数据特性和辨识参数数据所需长度选择可辨识参数数据和难以辨识参数数据组成训练集,将可辨识参数中的每一组数据的标签记为1,难以辨识参数中的每一组数据的标签记为2,共分两类,c=1或c=2,以此训练集对分类器进行训练;发电机组辨识参数的非训练集数据均属于测试集;
训练和筛选步骤如下:
(21)利用训练集计算各辨识参数的先验概率,对分类器进行训练:
Figure FDA0003206324380000011
其中,P(c|x)为第c个类别相对于训练样本x的类条件概率;P(x)是用于归一化的因子;P(x|c)是训练样本x相对于第c个类别的类条件概率;P(c)是先验概率;P(xi|c)为x在第i个属性上的取值相对于第c个类别的类条件概率;xi为x在第i个属性上的取值;d为属性数目;对于已知训练样本x,P(x)与类标记无关,基于训练集提供的信息来计算得到P(c)和P(x|c);
(22)利用高斯朴素贝叶斯分类器对测试样本进行初步分类:
高斯朴素贝叶斯分类器,在处理连续数据时,假设每个分类相关的特征是连续的且按照高斯分布,即可得到P(x|c):
Figure FDA0003206324380000021
其中,μc对应类别c下xi的均值;σ2 c是方差;
(23)对测试集进行分类
将测试集代入训练好的分类器中,用已知类标记的所有类别计算概率Pnb,并选择输出概率最大的结果所代表的类别作为最终输出:
Figure FDA0003206324380000022
其中,Pnb(x)是测试集数据分别在c=1和c=2两类标记下的概率。
4.根据权利要求1所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(3)具体为:
(31)预报误差的协方差阵为:
Figure FDA0003206324380000023
其中,N为辨识参数数据长度;e(k,θ)辨识参数预报误差,θ为辨识参数估计;
利用与协方差阵有关的标量函数J2 N(θ)作为代价函数,J2 N(θ)取极小时的参数估计值θ,称为预报误差估计:
J2(θ)=lg[detD(θ)];
(32)用步骤(31)求得的辨识参数预报误差e(k,θ),且得到一个最好的辨识模型:
z(k)=f[z(k-1),...,z(1),z(0),u(k-1),...,u(1),θ]+e(k,θ)=f[zk-1,uk-1,θ]+e(k,θ);
其中,z(k-1)为k-1时刻的辨识模型输出;u(k-1)为k-1时刻的辨识模型输入;e(k,θ)表示k时刻的辨识参数预报误差;
(33)利用得到的预报误差模型的拟合度对初步分类数据段进行二次细分,得到最优可辨识数据段,或者设置拟合度阈值,得到多个辨识较好数据段。
5.根据权利要求4所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(33)中对初步分类数据段进行二次细分得到最优可辨识数据段的具体方法为:
(a)拟合度计算公式为:
Figure FDA0003206324380000031
其中,yi是实际输出;
Figure FDA0003206324380000032
是拟合输出;
Figure FDA0003206324380000033
是实际输出的均值;
(b)在所有的模型拟合度中选择拟合度最大的数据段作为最优可辨识数据段。
6.根据权利要求4所述的基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法,其特征在于,步骤(33)中设置拟合度阈值,得到多个辨识较好数据段具体方法为:
(a)拟合度计算公式为:
Figure FDA0003206324380000034
其中,yi是实际输出;
Figure FDA0003206324380000035
是拟合输出;
Figure FDA0003206324380000036
是实际输出的均值;
(b)设定拟合度阈值为λ,λ取值为0~100之间,在所有的模型拟合度中选择拟合度大于λ的数据段作为辨识较好的数据段。
CN201910598184.9A 2019-07-04 2019-07-04 基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法 Active CN110413601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910598184.9A CN110413601B (zh) 2019-07-04 2019-07-04 基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910598184.9A CN110413601B (zh) 2019-07-04 2019-07-04 基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法

Publications (2)

Publication Number Publication Date
CN110413601A CN110413601A (zh) 2019-11-05
CN110413601B true CN110413601B (zh) 2021-10-19

Family

ID=68360193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910598184.9A Active CN110413601B (zh) 2019-07-04 2019-07-04 基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法

Country Status (1)

Country Link
CN (1) CN110413601B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091194B (zh) * 2019-11-13 2022-05-20 西安交通大学 一种基于cavwnb_kl算法的操作系统识别方法
CN111401431B (zh) * 2020-03-12 2023-07-25 成都小步创想慧联科技有限公司 群租房识别方法及系统及存储介质
CN111340310A (zh) * 2020-03-20 2020-06-26 重庆港力环保股份有限公司 一种基于大数据模型的餐饮油烟预测方法
CN114239464B (zh) * 2021-12-17 2023-08-11 深圳国微福芯技术有限公司 基于贝叶斯筛选器与重采样的电路的良率预测方法及系统
CN117037950A (zh) * 2023-08-01 2023-11-10 溪砾科技(深圳)有限公司 基于贝叶斯和药效团模型的靶向rna小分子筛选及试验方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800995A (zh) * 2019-01-30 2019-05-24 北京数介科技有限公司 一种电网设备故障识别方法及系统
CN109938723A (zh) * 2019-03-08 2019-06-28 度特斯(大连)实业有限公司 一种人体疾病风险的判别方法及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10140576B2 (en) * 2014-08-10 2018-11-27 Palo Alto Research Center Incorporated Computer-implemented system and method for detecting anomalies using sample-based rule identification
CN107735661B (zh) * 2015-06-30 2020-10-09 兹布里奥有限公司 使用机器学习算法识别跌倒风险

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800995A (zh) * 2019-01-30 2019-05-24 北京数介科技有限公司 一种电网设备故障识别方法及系统
CN109938723A (zh) * 2019-03-08 2019-06-28 度特斯(大连)实业有限公司 一种人体疾病风险的判别方法及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Prediction error-based clustering approach for multiple-model learning using statistical testing;Chinta Sivadurgaprasad, Abhishek Sivaram, Raghunathan Renga;《Engineering Applications of Artificial Intelligence》;20190131;第125-135页 *
管式加热炉燃烧状态监测系统的开发;李兴军;《中国优秀硕士学位论文全文数据库 工程科技I辑》;20140815;B019-246 *

Also Published As

Publication number Publication date
CN110413601A (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN110413601B (zh) 基于高斯朴素贝叶斯和预报误差法的发电机数据筛选法
CN110532674B (zh) 一种燃煤电站锅炉炉膛温度测量方法
CN112365045A (zh) 一种基于大数据的主蒸汽温度智能预测方法
US11860608B2 (en) Industrial equipment operation, maintenance and optimization method and system based on complex network model
CN110717610A (zh) 一种基于数据挖掘的风电功率预测方法
CN110400018B (zh) 用于燃煤火力电厂制粉系统的运行控制方法、系统和装置
CN113515049A (zh) 一种燃气蒸汽联合循环发电机组运行调控系统及调控方法
Zhao et al. Generalized predictive control using improved recurrent fuzzy neural network for a boiler-turbine unit
CN111931436A (zh) 一种基于数值模拟与神经网络的燃烧器喷口风量预测方法
CN113050602B (zh) 基于鲁棒半监督判别分析的工业过程故障分类方法
CN113221442B (zh) 一种电厂设备健康评估模型的构建方法及装置
CN110728031B (zh) 一种基于ann建模平衡复杂石化过程产能的多目标优化方法
CN116430726A (zh) 基于减法聚类和模糊神经网络的涡轮机组控制方法
CN115526433A (zh) 一种基于集成混合模型的电厂再热烟气挡板操作预测方法
Ehring et al. Greedy sampling and approximation for realizing feedback control for high dimensional nonlinear systems
Wang et al. Power plant data filtering based on Gaussian naive Bayesian classification and prediction error method
Tarik et al. Optimization of neural network hyperparameters for gas turbine modelling using Bayesian optimization
Hussain et al. Application of artificial intelligence techniques in process fault diagnosis
CN111897203A (zh) 基于数据驱动和机理建模状态监测的加热器经济调节方法
CN112036479A (zh) 一种船舶空调系统故障识别方法、装置及存储介质
Sheng et al. Sliding mode controller with AGA for drum water level of ship boiler
CN105117530B (zh) 一种粗细结合调节实现汽轮机及其调速系统参数辨识方法
CN115435603B (zh) 一种水泥烧成系统实时优化控制技术的实现方法
Chen et al. Study on boiler combustion optimization based on sparse least squares support vector machine
CN114021449B (zh) 一种磨煤机安全性评估的预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant