CN116070158A - 一种基于改进深度森林的智能bit设计方法 - Google Patents
一种基于改进深度森林的智能bit设计方法 Download PDFInfo
- Publication number
- CN116070158A CN116070158A CN202211662089.9A CN202211662089A CN116070158A CN 116070158 A CN116070158 A CN 116070158A CN 202211662089 A CN202211662089 A CN 202211662089A CN 116070158 A CN116070158 A CN 116070158A
- Authority
- CN
- China
- Prior art keywords
- forest
- training
- data set
- data
- improved depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及人工智能领域,尤其涉及一种基于改进深度森林的智能BIT设计方法,包括,S1,对重型燃气轮机控制系统的模拟量输出模块进行BIT数据采集,形成模拟量输出模块的功能电路BIT采样历史数据集;S2,采用经验模态分解算法对所述功能电路BIT采样历史数据集进行特征提取;S3,将S2中提取到的特征向量采用分类树回归算法训练随机森林决策树,并将提取到的特征向量采用旋转策略训练旋转森林;S4,训练改进的深度森林,采集模拟量输出模块的功能电路BIT采样在线数据集,并通过改进的深度森林对功能电路BIT采样在线数据集进行正常、间歇故障和永久故障三种状态的识别;本发明通过构建深度森林,对模拟量输出通道电路BIT状态的精准分类。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于改进深度森林的智能BIT设计方法。
背景技术
在重型燃气轮机控制系统中,控制器可以通过模拟量输出模块,将模拟信号传输至现场阀门、给水泵等执行机构,实现远距离传输控制的任务。模拟量输出模块的可靠性水平一定程度上影响着整个控制任务的稳定性,决定了整个控制任务的成败。为了提升模拟量输出模块的可靠性,许多学者将机内测试技术(Built-in Test,BIT)引入其中,通过闭环回绕测试法设计BIT检测电路,从而提升模拟量输出模块的可靠性。然而常规BIT技术往往伴随着较高的虚警率,高虚警的产生会给模拟量输出模块的可靠性带来严重的负面影响,从而造成用户对整个控制系统信心的丧失,同时,高虚警率对模拟量输出模块的复检维修也会造成困难。
拟量输出模块一般包含D/A输出、信号放大电路和V/I(电压/电流)转换电路。模拟量输出模块在实际工作中,经常由于运算放大器的负反馈开路、电路中电阻老化、二极管开路、三极管短路等原因发生间歇故障。但是由于间歇故障信号发生具有随机性,且没有明确的频率或波形,同时包含永久故障信号和正常信号的部分特性,在实际工作中采集到的间歇故障信号样本集较少,约占全部数据集的百分之零点几。因此,间歇故障信号具有采集成本高、辨识难、可重复出现、样本集小的特点,由此可见,如何有效降低模拟量输出模块BIT的虚警率,提高可靠性,成为目前亟待解决的问题。
发明内容
为此,本发明提供一种基于改进深度森林的智能BIT设计方法,用以克服现有技术中模拟量输出模块BIT的虚警率高,可靠性低的问题。
为实现上述目的,本发明提供一种基于改进深度森林的智能BIT设计方法,包括,步骤S1,对重型燃气轮机控制系统的模拟量输出模块进行BIT数据采集,形成模拟量输出模块的功能电路BIT采样历史数据集。
步骤S2,采用经验模态分解算法对所述功能电路BIT采样历史数据集进行特征提取。
步骤S3,将步骤S2中提取到的特征向量采用分类树回归算法训练随机森林决策树;并将提取到的特征向量采用旋转策略训练旋转森林。
步骤S4,训练改进的深度森林,采集模拟量输出模块的功能电路BIT采样在线数据集,并通过改进的深度森林对功能电路BIT采样在线数据集进行正常、间歇故障和永久故障三种状态的识别。
进一步地,对不同工作状态下的模拟量输出通道电路可表征功能电路状态的电流或电压进行采样,其中包括模拟量输出通道电路主要功能电路的正常数据、所述永久故障数据和所述间歇故障数据,得到所述功能电路BIT采样数据集,采用所述经验模态分解算法对采样数据集进行特征提取,并构造每种状态的所述特征向量,作为训练决策树的输入,包括下述步骤,
第一步,寻找数据集X中的全部极值点,通过样条曲线将局部极大值点连成上包络线,局部极小值点连成下包络线,上下包络线之间包含全部数据点。
第二步,由上包络线和下包络线的平均值m1,得出,h1=X-m1,若h1满足内涵模态分量,在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不超过1个,在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,则可认为h1是X的第一个IMF分量。
第三步,若不符合IMF条件,则将h1作为原始数据,重复所述第一步、所述第二步,得到上、下包络的均值m11,通过计算h11=h1-m11是否适合IMF分量的必备条件,若不满足,重复如上两步p次,直到满足IMF条件,得到第一个IMF分量c1,c1=h1p。
第四步:将c1从X中分离得到r1,r1=X-c1将r1作为原始信号重复第一步至第三步,循环q次,得到第二个至第q个IMF分量c2至cq,则
第五步,当rq变成单调函数后,rq称为残余分量,停止分解,此时原始信号被分解为q个IMF分量和一个单点函数rq之和,即:
第六步,用各IMF分量构造特征向量,
将所有的样本都进行EMD特征提取后,组成数据集D:
可选的,为保证所述数据的均匀性和分布的一致性,对提取到的所述特征向量进行k折交叉验证,数据集D是由特征向量Tn组成的,将数据集D等比例化为k个大小互斥的子集,每次将k-1个子集的并集作训练集,另一份作验证集,最终得到k组训练样本,将此k组数据作为训练决策树的输入。
将所述k组数据集采用CART算法训练随机森林决策树,从所述数据集D所有的A个属性中随机选出一个包含A′=log2A个属性的子集,再在A′中以当前数据基尼指数最小的作为属性特征继续参与下次分支,基尼指数公式为:
用Gini(A)决定随机森林决策树分支的生长方向,当前节点所包含的样本都属于同一类别,或当前节点所覆盖的样本个数小于某一阈值分裂停止,然后对这棵树采用错误率降低剪枝法(Reduced-Error Pruning,REP)进行适当剪枝,从而生产一棵随机森林决策树,对其余的k-1组数据分别采用CART算法训练随机森林决策树,得到k棵随机森林决策树。
将提取到的所述特征向量采用旋转策略训练旋转森林。
进一步地,将每组训练集进行75%重采样得到所述数据集D中的训练样本Dk,采用主成分分析(Principle Component Analysis,PCA)对所述训练样本Dk进行变换,得到该训练样本的主成分系数特征向量Pk=[p1k,p2k,…,pdk],将k个所述特征向量合并成对角系数矩阵R,
并根据所述特征向量对应的原始样本特征位置重新旋转得到矩阵R*,重构新样本Xnew=X*R*。用Xnew训练旋转森林决策树。
将随机森林和旋转森林组合构成改进的深度森林的一层,将随机森林和旋转森林的决策结果与数据集D作为深度森林下一层的输入。
在所述步骤S4中,将模拟量输出模块主要功能电路的BIT检测数据采用EMD算法提取特征向量后,输入到改进的深度森林网络中,进行投票选择,完成状态的识别,识别的状态包括,正常状态、间歇故障状态和永久故障状态。
在进行投票选择时,投票过程为,
与现有技术相比,本发明的有益效果在于,针对重型燃气轮机控制系统模拟量输出模块BIT虚警率高的问题,通过改进深度森林算法对模拟量输出模块BIT检测数据的状态进行分类,准确识别模拟量输出模块的间歇状态,有效降低模拟量输出模块BIT的虚警率,为可靠性的提升提供了一个有效的方法思路。
附图说明
图1为本实施例所述的基于改进深度森林的智能BIT整体流程示意图;
图2为本实施例所述的基于改进深度森林的智能BIT设计流程图;
图3为本实施例所述的k折交叉验证流程图;
图4为本实施例所述的改进的深度森林决策流程图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明做进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体的连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本实施例所述的基于改进深度森林的智能BIT整体流程示意图,本实施例公开一种基于改进深度森林的智能BIT设计方法,包括,步骤S1,对重型燃气轮机控制系统的模拟量输出模块进行BIT数据采集,形成模拟量输出模块的功能电路BIT采样历史数据集。
步骤S2,采用经验模态分解算法对所述功能电路BIT采样历史数据集进行特征提取。
步骤S3,将步骤S2中提取到的特征向量采用分类树回归算法训练随机森林决策树;并将提取到的特征向量采用旋转策略训练旋转森林。
步骤S4,训练改进的深度森林,采集模拟量输出模块的功能电路BIT采样在线数据集,并通过改进的深度森林对功能电路BIT采样在线数据集进行正常、间歇故障和永久故障三种状态的识别。
请继续参阅图2所示,其为本实施例所述的基于改进深度森林的智能BIT设计流程图,具体而言,对不同工作状态下的模拟量输出通道电路可表征功能电路状态的电流或电压进行采样,其中包括模拟量输出通道电路主要功能电路的正常数据、所述永久故障数据和所述间歇故障数据,得到所述功能电路BIT采样数据集,采用所述经验模态分解算法对采样数据集进行特征提取,并构造每种状态的所述特征向量,作为训练决策树的输入,包括下述步骤,
第一步,寻找数据集X中的全部极值点,通过样条曲线将局部极大值点连成上包络线,局部极小值点连成下包络线,上下包络线之间包含全部数据点。
第二步,由上包络线和下包络线的平均值m1,得出,h1=X-m1,若h1满足内涵模态分量,在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不超过1个,在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,则可认为h1是X的第一个IMF分量。
第三步,若不符合IMF条件,则将h1作为原始数据,重复所述第一步、所述第二步,得到上、下包络的均值m11,通过计算h11=h1-m11是否适合IMF分量的必备条件,若不满足,重复如上两步p次,直到满足IMF条件,得到第一个IMF分量c1,c1=h1p。
第四步:将c1从X中分离得到r1,r1=X-c1将r1作为原始信号重复第一步至第三步,循环q次,得到第二个至第q个IMF分量c2至cq,则
第五步,当rq变成单调函数后,rq称为残余分量,停止分解,此时原始信号被分解为q个IMF分量和一个单点函数rq之和,即:
第六步,用各IMF分量构造特征向量,
将所有的样本都进行EMD特征提取后,组成数据集D:
请继续参阅图3所示,其为本实施例所述的k折交叉验证流程图,具体而言,为保证所述数据的均匀性和分布的一致性,对提取到的所述特征向量进行k折交叉验证,数据集D是由特征向量Tn组成的,将数据集D等比例化为k个大小互斥的子集,每次将k-1个子集的并集作训练集,另一份作验证集,最终得到k组训练样本,将此k组数据作为训练决策树的输入。
将所述k组数据集采用CART算法训练随机森林决策树,从所述数据集D所有的A个属性中随机选出一个包含A′=log2A个属性的子集,再在A′中以当前数据基尼指数最小的作为属性特征继续参与下次分支,基尼指数公式为:
用Gini(A)决定随机森林决策树分支的生长方向,当前节点所包含的样本都属于同一类别,或当前节点所覆盖的样本个数小于某一阈值分裂停止,然后对这棵树采用错误率降低剪枝法(Reduced-Error Pruning,REP)进行适当剪枝,从而生产一棵随机森林决策树,对其余的k-1组数据分别采用CART算法训练随机森林决策树,得到k棵随机森林决策树。
将提取到的所述特征向量采用旋转策略训练旋转森林。
进一步地,将每组训练集进行75%重采样得到所述数据集D中的训练样本Dk,采用主成分分析(Principle Component Analysis,PCA)对所述训练样本Dk进行变换,得到该训练样本的主成分系数特征向量Pk=[p1k,p2k,…,pdk],将k个所述特征向量合并成对角系数矩阵R,
并根据所述特征向量对应的原始样本特征位置重新旋转得到矩阵R*,重构新样本Xnew=X*R*。用Xnew训练旋转森林决策树。
请继续参阅图4所示,其为本实施例所述的改进的深度森林决策流程图,具体而言,将随机森林和旋转森林组合构成改进的深度森林的一层,将随机森林和旋转森林的决策结果与数据集D作为深度森林下一层的输入。
在所述步骤S4中,将模拟量输出模块主要功能电路的BIT检测数据采用EMD算法提取特征向量后,输入到改进的深度森林网络中,进行投票选择,完成状态的识别,识别的状态包括,正常状态、间歇故障状态和永久故障状态。
在进行投票选择时,投票过程为,
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于改进深度森林的智能BIT设计方法,其特征在于,包括,
步骤S1,对重型燃气轮机控制系统的模拟量输出模块进行BIT数据采集,形成模拟量输出模块的功能电路BIT采样历史数据集;
步骤S2,采用经验模态分解算法对所述功能电路BIT采样历史数据集进行特征提取;
步骤S3,将步骤S2中提取到的特征向量采用分类树回归算法训练随机森林决策树,并将提取到的特征向量采用旋转策略训练旋转森林;
步骤S4,训练改进的深度森林,采集模拟量输出模块的功能电路BIT采样在线数据集,并通过改进的深度森林对功能电路BIT采样在线数据集进行正常、间歇故障和永久故障三种状态的识别。
2.根据权利要求1所述的基于改进深度森林的智能BIT设计方法,其特征在于,对不同工作状态下的模拟量输出通道电路可表征功能电路状态的电流或电压进行采样,其中包括模拟量输出通道电路主要功能电路的正常数据、所述永久故障数据和所述间歇故障数据,得到所述功能电路BIT采样历史数据集,采用所述经验模态分解算法对功能电路BIT采样历史数据集进行特征提取,并构造每种状态的所述特征向量,作为训练决策树的输入,包括,
第一步,寻找数据集X中的全部极值点,通过样条曲线将局部极大值点连成上包络线,局部极小值点连成下包络线,上下包络线之间包含全部数据点;
第二步,由上包络线和下包络线的平局值m1,得出,h1=X-m1,若h1满足内涵模态分量,在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不超过1个,在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,则可认为h1是X的第一个IMF分量;
第三步,若不符合IMF条件,则将h1作为原始数据,重复所述第一步、所述第二步,得到上、下包络的均值m11,通过计算h11=h1-m11是否适合IMF分量的必备条件,若不满足,重复如上两步p次,直到满足IMF条件,得到第一个IMF分量c1,c1=h1 p;
第四步,将c1从X中分离得到r1,r1=X-c1将r1作为原始信号重复第一步至第三步,循环q次,得到第二个至第q个IMF分量c2至cq,则
第五步,当rq变成单调函数后,rq称为残余分量,停止分解,此时原始信号被分解为q个IMF分量和一个单点函数rq之和,即,
第六步,用各IMF分量构造特征向量,
将所有的样本都进行EMD特征提取后,组成数据集D,
3.根据权利要求2所述的基于改进深度森林的智能BIT设计方法,其特征在于,对提取到的所述特征向量进行k折交叉验证,数据集D是由特征向量Tn组成的,将数据集D等比例化为k个大小互斥的子集,每次将k-1个子集的并集作训练集,另一份作验证集,最终得到k组训练样本,将此k组数据作为训练决策树的输入。
6.根据权利要求5所述的基于改进深度森林的智能BIT设计方法,其特征在于,将随机森林和旋转森林组合构成改进的深度森林的一层,将随机森林和旋转森林的决策结果与数据集D作为所述改进的深度森林下一层的输入。
7.根据权利要求6所述的基于改进深度森林的智能BIT设计方法,其特征在于,在所述步骤S4中,将模拟量输出模块主要功能电路的BIT检测数据采用EMD算法提取特征向量后,输入到改进的深度森林网络中,进行投票选择,完成状态的识别,识别的状态包括,正常状态、间歇故障状态和永久故障状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211662089.9A CN116070158A (zh) | 2022-12-23 | 2022-12-23 | 一种基于改进深度森林的智能bit设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211662089.9A CN116070158A (zh) | 2022-12-23 | 2022-12-23 | 一种基于改进深度森林的智能bit设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116070158A true CN116070158A (zh) | 2023-05-05 |
Family
ID=86179478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211662089.9A Pending CN116070158A (zh) | 2022-12-23 | 2022-12-23 | 一种基于改进深度森林的智能bit设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116070158A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933012A (zh) * | 2023-08-14 | 2023-10-24 | 华北电力大学 | 基于TiDE模型的火电机组典型设备故障智能预警方法 |
-
2022
- 2022-12-23 CN CN202211662089.9A patent/CN116070158A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933012A (zh) * | 2023-08-14 | 2023-10-24 | 华北电力大学 | 基于TiDE模型的火电机组典型设备故障智能预警方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635928B (zh) | 基于深度学习模型融合的电压暂降原因识别方法 | |
CN109946389B (zh) | 基于总体经验模态分解与卷积神经网络的结构损伤识别法 | |
CN110929847A (zh) | 一种基于深度卷积神经网络的换流变压器故障诊断方法 | |
CN110969194B (zh) | 基于改进型卷积神经网络的电缆早期故障定位方法 | |
CN111339872A (zh) | 一种基于分类模型的电网故障分类方法 | |
CN105335752A (zh) | 一种基于主成分分析多变量决策树的接线方式识别方法 | |
CN110726898B (zh) | 一种配电网故障类型识别方法 | |
CN109142969A (zh) | 一种基于连续隐马尔可夫模型的输电线路故障选相方法 | |
CN113011481B (zh) | 一种基于决策树算法的电能表功能异常评估方法及系统 | |
CN111722046A (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
CN116070158A (zh) | 一种基于改进深度森林的智能bit设计方法 | |
CN117077044B (zh) | 一种发电机用真空断路器故障判别方法及装置 | |
CN111027629A (zh) | 基于改进随机森林的配电网故障停电率预测方法及系统 | |
CN115563563A (zh) | 基于变压器油色谱分析的故障诊断方法及装置 | |
CN112364928A (zh) | 一种变电站故障数据诊断中的随机森林分类方法 | |
CN116401532B (zh) | 一种电力系统受扰后频率失稳识别方法及系统 | |
CN113705396A (zh) | 一种电机故障诊断方法、系统及设备 | |
CN112418175A (zh) | 基于域迁移的滚动轴承故障诊断方法、系统及存储介质 | |
CN111553112A (zh) | 一种基于深度置信网络的电力系统故障辨识方法及装置 | |
CN116842337A (zh) | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 | |
CN112381667B (zh) | 一种基于深度学习的配网电气拓扑识别方法 | |
CN111080001A (zh) | 一种应用于风电场风速的深度神经网络预测方法 | |
CN113496255B (zh) | 基于深度学习与决策树驱动的配电网混合观测布点方法 | |
CN113158555A (zh) | 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 | |
CN110245617B (zh) | 基于暂态录波波形的人工智能分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |