CN116629409A - 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 - Google Patents
一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 Download PDFInfo
- Publication number
- CN116629409A CN116629409A CN202310501709.9A CN202310501709A CN116629409A CN 116629409 A CN116629409 A CN 116629409A CN 202310501709 A CN202310501709 A CN 202310501709A CN 116629409 A CN116629409 A CN 116629409A
- Authority
- CN
- China
- Prior art keywords
- sofc system
- probability
- characteristic
- alpha
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000011161 development Methods 0.000 claims abstract description 4
- 239000010755 BS 2869 Class G Substances 0.000 claims description 23
- 239000000446 fuel Substances 0.000 claims description 13
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 9
- 239000003546 flue gas Substances 0.000 claims description 9
- 238000002485 combustion reaction Methods 0.000 claims description 7
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 6
- 239000001257 hydrogen Substances 0.000 claims description 6
- 229910052739 hydrogen Inorganic materials 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 4
- 230000003313 weakening effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 5
- 238000010606 normalization Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 238000009499 grossing Methods 0.000 description 3
- 230000000246 remedial effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010248 power generation Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E60/00—Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
- Y02E60/30—Hydrogen technology
- Y02E60/50—Fuel cells
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Mathematics (AREA)
- Biophysics (AREA)
- Operations Research (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Economics (AREA)
- Pure & Applied Mathematics (AREA)
- Fuzzy Systems (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
Abstract
本发明属于SOFC系统故障预测领域,具体涉及一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法。所述方法为:从某SOFC系统的历史数据库中提取历史开发数据并进行预处理,创建训练集与测试集,从训练集数据中确定特征属性与输出类别空间,根据训练集发生故障的参数数据统计各特征属性取值先验概率,采用先验概率学习计算条件概率,当特征属性取值为连续值和离散值时分别采用不同的条件概率计算,选择两两特征组合的方式计算相应的条件概率提高模型的泛化性能,由先验概率联合计算后验概率,建立朴素贝叶斯模型分类器,采用测试集进行验证,将实时SOFC系统参数数据输入模型获取相应的故障几率大小。
Description
技术领域
本发明属于SOFC系统故障预测领域,具体涉及一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法。
背景技术
SOFC系统运行过程中时常发生故障,使得其性能产生退化,严重的话,甚至会导致燃料电池的失效,这成为了限制SOFC系统发展的一个主要原因。而发电过程中许多参数都会对故障发生产生影响,比如电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度等。通过及时掌握SOFC系统运行时的这些数据变化情况,采取合理的故障预测方法判断出故障发生的概率,则可及时安排对SOFC系统设备进行维护,有利于延长其使用寿命。
朴素贝叶斯方法发源于古典理论,该方法对数据的处理学习效率高,且对数据缺失不敏感,通过该方法对SOFC系统数据处理从而进行故障预测具有良好的应用前景。
发明内容
为了克服现有故障预测方法的不足与局限性,造成相关技术人员无法对相应的故障参数进行控制,使得故障难以控制、反复发生的问题,本发明提出了一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法。该方法通过获取实时系统参数值作为特征输入,以建立的朴素贝叶斯模型分类计算出的SOFC系统故障概率作为特征输出进行判断,在进行补救决策时具有较好的现实指导意义。
为了实现上述目的,一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法,具体实施步骤如下:
1)收集训练集数据,从某SOFC系统的历史数据库中提取历史开发数据并进行预处理,即数据的ELT清洗,数据平滑去噪,数据的归一化处理,将预处理后的各参数数据进行多段随机抽样,按照预设比例8:2形成训练集与测试集;
2)从训练集数据中确定特征属性与输出类别空间:
2-1)确定的特征属性为SOFC系统故障参数数据,包括电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度;
2-2)根据确定的特征属性,依次将以上特征属性的取值记为αi,电堆电压记为α1,电堆电流密度为α2,空气流量为α3,氢气流量为α4,旁路流量为α5,热交换器入口空气温度记为α6,混合器入口空气温度记为α7,电堆入口空气温度记为α8,燃烧室入口空气温度记为α9,热交换器入口燃料温度记为α10,电堆入口燃料温度记为α11,燃烧室入口燃料温度记为α12,燃烧室出口烟气温度记为α13,热交换器出口烟气温度记为α14,热交换器最高温度记为α15,燃烧室最高温度记为α16,确定特征属性的取值为朴素贝叶斯模型的特征输入,以上确定的特征属性取值记为向量X=(α1,α2,α3,α4Lα15,α16);
2-3)确定以特征属性取值相应计算得到的SOFC系统故障概率为朴素贝叶斯模型的特征输出,用Y表征输出类别训练元组,记Y=(G1,G2),其中G1表示未发生故障,G2表示发生故障,用|Gk,Y|表示Y中类Gk的训练个数。
3)利用训练集进行半监督学习训练,建立朴素贝叶斯模型:
3-1)由训练集样本统计各特征属性取值先验概率P(X=αi)(i=1,2L 16)和分类类别的先验概率P(Y=Gk)(k=1,2),类的先验概率可以采用下式求得:
其中|Gk,Y|是Y中类Gk的训练元组数,|Y|为输出类别总的训练元组数;
3-2)学习计算条件概率P(X=α|Y=Gk);
3-3)计算每个特征属性的联合概率P(Y=Gk|X=αi):
其中,P(Y|X)为故障几率类别的后验概率,P(Y=Gk)为类Gk的先验概率,P(X)为特征概率,P(X|Y=Gk)表示Gk类别中X的条件概率;
4)采用测试集对训练结果进行验证;
5)朴素贝叶斯模型的实际运用获取SOFC系统实际参数数据输入该朴素贝叶斯模型,获取相应的SOFC系统故障发生几率;
由朴素贝叶斯算法模型,可以计算以故障发生与否的概率作为特征输出的后验概率,将后续SOFC系统的实时参数数据输入该模型进行预测分析:
5-1)获取实时SOFC系统参数数据输入模型,计算各类的P(X|Gk)P(Gk),则基于特征故障参数αi分类到Gk的条件如下:
P(X|Gk)P(Gk)>P(X|Gm)P(Gm)(k≠m)
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
即基于特征故障参数X被划分到P(X|Gk)P(Gk)几率较大的类Gk。
进一步的,所述步骤3)中计算条件概率P(X|Y)时,当特征属性值αi为连续型特征值,在实例中通常取αi的先验概率为正态分布,此时的条件分布为:
其中μk和是特征属性取值满足正态分布的期望和方差,μk为训练集类别Gk中,所有αi的平均值,/>为训练集类别Gk中,所有αi的方差,/>为训练集中特征输入取值;
当特征属性取值αi为离散值,如特征属性为空气流量时,则条件概率P(αi|Gk):
其中是训练集中Y元组属性αi的Gk类的训练个数,/>为Y中Gk类训练个数;
除了区分特征属性属于离散值还是连续值外,由于SOFC系统参数之间相互产生影响,在本发明实施方案中,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,两两特征组合又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的故障机理分类器的泛化性能;
由此当特征属性为离散值时的组合特征联合条件概率为:
其中,为故障类别Gk中第i号和第j号特征取值的个数,/>为Y中Gk类的训练个数;
当特征属性取值为连续值时:
其中α为满足特征属性i号和j号的取值区间,μk和是特征属性取值α满足正态分布的期望和方差,μk为训练集类别Gk中,所有α的平均值,/>为训练集类别Gk中,所有α的方差;
进一步的,所述步骤3)中在一个可选的实例中,由朴素贝叶斯模型得到的各特征属性的联合概率因为分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是相对独立的,所以其联合概率可简化为计算:
当上述两两特征组合的方法求取条件概率,则相应的后验概率为简化计算:
由该朴素贝叶斯算法模型,可以计算以SOFC系统故障概率作为特征输出的后验概率,将后续SOFC系统的实时参数数据输入该朴素贝叶斯模型进行预测分析,得到新SOFC系统基于确定的故障参数的实时故障发生几率,根据相应的故障几率实时调整SOFC系统参数取值,采取合理的补救决策从而指导系统的继续运行。
本发明的有益效果是:本发明针对目前SOFC系统故障预测几率研究不足的情况,开展了SOFC系统故障几率研究,提出了结合历史数据进行故障几率预测的方法。对于历史的经验数据,主要是采用先验概率学习计算条件概率,当特征属性取值为连续值和离散值时分别采用不同的条件概率计算,选择两两特征组合的方式计算相应的条件概率提高模型的泛化性能,由先验概率联合计算后验概率,建立朴素贝叶斯模型分类器,采用验证集进行验证,将实时SOFC系统参数数据输入模型获取相应的故障几率大小。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
图1是SOFC系统历史数据预处理框图;
图2是基于朴素贝叶斯算法的故障概率预测流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
1)图1为本发明技术方案中的SOFC系统历史数据预处理框图,如图1所示,在本发明的实施方案中,可用于进行故障预测的SOFC系统历史数据都储存在软件数据库中。在用朴素贝叶斯算法建立分类模型从而对测量数据进行挖掘与学习之前,需要对测量数据进行数据预处理;
在本发明的实施方案中,上述的数据预处理包括:
1-1)对历史测量数据进行ELT清洗(即数据的抽取,加载,转换),将其处理为可供机器学习模型(即朴素贝叶斯算法)处理的结构化数据;
1-2)采用噪声数据平滑技术对数据进行去噪处理,数据平滑去噪采用按平均值平滑的方法,即对同一类值中的数据求平均值,用平均值替代该类中的所有数据,减少噪声数据对数据的干扰影响;
1-3)数据预处理的归一化处理,本发明方案采用L2范数归一化,L2范数归一化方法使得数据标准统一化,提高数据的可比性,削弱数据的解释性,在后续应用中可以提高模型的收敛速度与精度。L2范数归一化通过将多组数据转化为无单位的分值,适用于对离散数据的处理,即将属性的原始数据通过L2范数归一化标准化为α’;
1-4)在本发明实施方案中,基于SOFC系统故障发生参数采用朴素贝叶斯算法的SOFC系统故障几率预测模型是一个半监督学习的过程。为避免数据划分带来的额外误差而对最终的分类结果准确性产生影响,划分数据应注意保持数据分布的一致性,同时为了保证数据的代表性,划分数据采用多段随机抽样的方式划分为训练集和测试集,将上述预处理后的SOFC系统故障参数数据进行多段随机抽样,并按照预设比例8:2划分成训练集和测试集;
2)图2是基于朴素贝叶斯算法的SOFC系统故障几率预测流程图,如图2所示,在本发明方案的具体实施案例中,数据收集与预处理后的SOFC系统数据参数包含16个可用特征属性,包括电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度,输出类别空间Y包含两个输出类别,即未发生故障和发生故障;
2-1)将特征属性的取值记为αi,依次将电堆电压记为α1,电堆电流密度为α2,空气流量为α3,氢气流量为α4,旁路流量为α5,热交换器入口空气温度为α6,混合器入口空气温度为α7,电堆入口空气温度为α8,燃烧室入口空气温度为α9,热交换器入口燃料温度为α10,电堆入口燃料温度为α11,燃烧室入口燃料温度为α12,燃烧室出口烟气温度为α13,热交换器出口烟气温度为α14,热交换器最高温度为α15,燃烧室最高温度记为α16,将确定的特征属性取值依次记为向量X=(α1,α2,α3,α4,α5,α6,α7,α8,α9,α10,α11,α12,α13,α14,α15,α16);
2)利用训练集进行半监督学习训练,建立朴素贝叶斯模型;
3-1)根据训练集SOFC系统故障参数数据统计各特征属性取值先验概率P(αi);
3-2)用Gk表征输出类别,记为Y=(G1,G2),其中G1表示未发生故障,G2表示发生故障,类的先验概率可以采用
求得,其中|Gk,Y|是Y中类Gk的训练个数,|Y|为总的输出类别训练个数;
3-3)计算条件概率,当特征属性值αi为连续型特征值,在实例中通常取αi的先验概率为正态分布,此时的条件分布为:
其中μk和是特征属性取值满足正态分布的期望和方差,μk为训练集类别Gk中,所有αi的平均值,/>为训练集类别Gk中,所有αi的方差,/>为训练集中特征输入取值;
当特征属性取值αi为离散值,如特征属性为空气流量时,则条件概率
其中是训练集中Y元组属性αi的Gk类的元组数,/>为Y中Gk类元组数;
由于SOFC系统各参数之间会产生相互作用共同对故障发生与否产生影响,可以选择两两特征组合的方式计算相应的条件概率,这种特征组合的方式可以一定地弱化朴素贝叶斯算法的特征条件独立性假设,又能避免特征之间产生较强的依赖关系造成学习模型计算复杂度增大和过拟合的发生,从而提高基于朴素贝叶斯算法的故障机理分类器的泛化性能;
由此当特征属性为离散值时的组合特征联合条件概率为:
其中,为故障类别Gk中第i号和第j号特征取值的个数,/>为Y中Gk类的训练个数;
当特征属性取值为连续值时:
其中α为满足特征属性i号和j号的取值区间,μk和是特征属性取值α满足正态分布的期望和方差,μk为训练集类别Gk中,所有α的平均值,/>为训练集类别Gk中,所有α的方差;
3-5)根据处理好的训练集建立朴素贝叶斯模型,采用训练集数据进行学习训练。采用计算好的先验概率计算特征属性的联合概率P(Y=Gk|X):
因为上式分母对于所有类别为常数,只需要将分子最大化即可,又因为各特征属性是假设相对独立的,所以可以简化为计算:
若采用基于上述两两特征组合的方式计算相应的联合条件概率则为:
3-6)在本发明实施方案中,基于先验概率和条件概率构建目标函数(即后验概率),并基于朴素贝叶斯算法对所述目标函数进行求解的过程即为训练过程,从而生成了基于朴素贝叶斯算法的SOFC系统故障几率预测分类器。
4)采用测试集测试该SOFC系统故障几率预测分类器;
5)利用该SOFC系统故障几率预测分类器对SOFC系统新参数进行故障概率预测识别。
5-1)获取实时SOFC系统参数数据输入模型,计算各类的P(X|Gk)P(Gk),则基于特征故障参数αi分类到Gk的条件如下:
P(X|Gk)P(Gk)>P(X|Gm)P(Gm)(k≠m)
5-2)弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合计算后验概率并进行判断:
在本发明的实施方案中,将待预测的实时SOFC系统数据输入SOFC系统故障几率预测分类器中,通过比较故障发生与否的概率大小,即可获得相应的故障发生预测结果以及故障概率大小,从而指导发电过程的补救决策。
以上所述具体技术方案仅用以说明本发明,并不用于限制本发明;尽管参照上述具体技术方案对本发明进行了详细的说明,本领域的普通技术人员应当理解。凡是基于本发明的精神和原则之内,所做的任何修改和等同替换均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于朴素贝叶斯算法的SOFC系统故障几率预测方法,其特征在于,包括如下步骤:
S1、收集训练集数据,从某SOFC系统的历史数据库中提取历史开发数据并进行预处理,将预处理后的SOFC系统参数数据进行多段随机抽样,按照预设比例8:2形成训练集与测试集;从训练集数据中确定特征属性,将其取值为朴素贝叶斯模型的特征输入,确定输出类别,建立向量组;利用训练集进行半监督学习训练,建立朴素贝叶斯模型;
S2、利用测试集对训练结果进行验证;
S3、朴素贝叶斯模型的实际运用,获取SOFC系统实际参数数据输入该朴素贝叶斯模型,获取相应的SOFC系统故障几率。
2.根据权利要求1所述的基于朴素贝叶斯算法的SOFC系统故障几率预测方法,其特征在于,所述S1具体为:
确定SOFC系统故障参数数据为特征属性,包括电堆电压,电堆电流密度,空气流量,氢气流量,旁路流量,热交换器入口空气温度,混合器入口空气温度,电堆入口空气温度,燃烧室入口空气温度,热交换器入口燃料温度,电堆入口燃料温度,燃烧室入口燃料温度,燃烧室出口烟气温度,热交换器出口烟气温度,热交换器最高温度,燃烧室最高温度;确定以特征属性的取值为特征输入,确定以相应特征属性取值计算的SOFC系统故障概率为特征输出,根据确定的特征属性,依次将上述16个特征取值分别记为αi,以上确定的特征属性取值记为向量X=(α1,α2,α3,α4Lα15,α16);用Y表征输出类别训练元组,记Y=(G1,G2),其中G1表示SOFC系统未发生故障,G2表示SOFC系统发生故障,用|Gk,Y|表示Y中类Gk的训练个数;由训练集样本统计SOFC系统各特征属性取值的先验概率P(X=αi)(i=1,2L 16)并计算分类类别的先验概率P(Y=Gk)(k=1,2):
式中|Gk,Y|是Y中类Gk的训练个数,|Y|为总的输出类别训练个数;
将上述先验概率联合学习计算条件概率P(X=α|Y=Gk);
若SOFC系统特征属性值为连续型特征值,所述的条件概率根据以下公式计算:
其中μk和是SOFC系统特征属性取值满足正态分布的期望和方差,μk为训练集类别Gk中,所有αi的平均值,/>为训练集类别Gk中,所有αi的方差,/>为训练集中特征输入取值;
若SOFC系统特征属性取值为离散值,所述的条件概率根据以下公式计算:
其中是训练集中Y元组属性αi的Gk类的元组数,/>为Y中Gk类元组数;
SOFC系统特征属性为离散值时的组合特征联合条件概率根据以下公式计算:
为SOFC系统故障类别Gk中第i号和第j号特征取值的个数,/>为Y中Gk类的训练个数;
SOFC系统特征属性取值为连续值时的组合特征联合条件概率根据以下公式计算:
其中α为满足SOFC系统特征属性i号和j号的取值区间,μk和是SOFC系统特征属性取值α满足正态分布的期望和方差,μk为训练集类别Gk中,所有α的平均值,/>为训练集类别Gk中,所有α的方差;
采用计算好的SOFC系统先验概率和条件概率计算联合后验概率P(Y=Gk|α),即计算P(X|Y=Gk)P(Y=Gk):
3.根据权利要求2所述的基于朴素贝叶斯算法的SOFC系统故障几率预测方法,其特征在于,所述S3具体为:
获取实时SOFC系统参数数据输入模型,计算各类的P(X|Y=Gk)P(Y=Gk),通过弱化朴素贝叶斯算法的特征条件独立性假设提高模型的泛化性能,采用两两特征组合的方式计算SOFC系统每个类的后验概率,通过比较两个类别的后验概率,判断出基于SOFC系统特征故障参数X被划分到P(X|Y=Gk)P(Y=Gk)较大的类Gk,并求出了SOFC系统相应的类Gk的发生概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310501709.9A CN116629409A (zh) | 2023-05-06 | 2023-05-06 | 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310501709.9A CN116629409A (zh) | 2023-05-06 | 2023-05-06 | 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116629409A true CN116629409A (zh) | 2023-08-22 |
Family
ID=87616254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310501709.9A Pending CN116629409A (zh) | 2023-05-06 | 2023-05-06 | 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116629409A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117691719A (zh) * | 2024-01-30 | 2024-03-12 | 深圳市方利来科技有限公司 | 一种电动牙刷的充电控制方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529341A (zh) * | 2021-02-09 | 2021-03-19 | 西南石油大学 | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 |
-
2023
- 2023-05-06 CN CN202310501709.9A patent/CN116629409A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112529341A (zh) * | 2021-02-09 | 2021-03-19 | 西南石油大学 | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117691719A (zh) * | 2024-01-30 | 2024-03-12 | 深圳市方利来科技有限公司 | 一种电动牙刷的充电控制方法和系统 |
CN117691719B (zh) * | 2024-01-30 | 2024-04-05 | 深圳市方利来科技有限公司 | 一种电动牙刷的充电控制方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109164343B (zh) | 基于特征信息量化与加权knn的变压器故障诊断方法 | |
CN110579709B (zh) | 一种有轨电车用质子交换膜燃料电池故障诊断方法 | |
US9135557B2 (en) | Internal abnormality diagnosis method, internal abnormality diagnosis system, and decision tree generation method for internal abnormality diagnosis of oil-filled electric apparatus utilizing gas concentration in oil | |
CN112906764B (zh) | 基于改进bp神经网络的通信安全设备智能诊断方法及系统 | |
CN114386537B (zh) | 基于CatBoost的锂电池故障诊断方法、装置及电子设备 | |
CN110059714A (zh) | 基于多分类支持向量机的变压器故障诊断方法 | |
CN110458039A (zh) | 一种工业过程故障诊断模型的构建方法及其应用 | |
CN116629409A (zh) | 一种基于朴素贝叶斯算法的sofc系统故障几率预测方法 | |
CN107992880A (zh) | 一种电力变压器最优集总分类故障诊断方法 | |
CN109033513A (zh) | 电力变压器故障诊断方法与电力变压器故障诊断装置 | |
CN113205125A (zh) | 一种基于XGBoost的特高压换流阀运行状态评估方法 | |
CN111207067A (zh) | 一种基于模糊支持向量机的空压机故障诊断方法 | |
CN111695288A (zh) | 一种基于Apriori-BP算法的变压器故障诊断方法 | |
CN111767657A (zh) | 一种核动力系统故障诊断方法和系统 | |
CN107664690A (zh) | 一种预测变压器油中溶解气体浓度的方法 | |
CN113469252A (zh) | 一种考虑不平衡样本的特高压换流阀运行状态评估方法 | |
CN115729761B (zh) | 一种硬盘故障预测方法、系统、设备及介质 | |
CN109342862A (zh) | 基于非监督聚类与和svm分类的变压器故障诊断方法 | |
CN110017989B (zh) | 一种风力机轴承故障诊断的方法 | |
CN114358160A (zh) | 一种电力系统中的数据异常检测方法 | |
CN112507526B (zh) | 一种质子交换燃料电池系统性能预测方法及系统 | |
CN111459838B (zh) | 一种基于流形对齐的软件缺陷预测方法及系统 | |
Yue et al. | Similarity Makes Difference: SSHTN for Generalized Zero-Shot Industrial Fault Diagnosis by Leveraging Auxiliary Set | |
CN114626433A (zh) | 一种智能电能表故障预测并分类方法、装置及系统 | |
CN112699229A (zh) | 基于深度学习模型的自适应推题方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |