CN113158555A - 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 - Google Patents
一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 Download PDFInfo
- Publication number
- CN113158555A CN113158555A CN202110331921.6A CN202110331921A CN113158555A CN 113158555 A CN113158555 A CN 113158555A CN 202110331921 A CN202110331921 A CN 202110331921A CN 113158555 A CN113158555 A CN 113158555A
- Authority
- CN
- China
- Prior art keywords
- input module
- analog input
- expert system
- random forest
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供了一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,属于测试和人工智能领域。该方法用于提高现有模拟量输入模块的可靠性,解决模拟量输入模块BIT虚警率高的问题。步骤如下:通过知识获取机制,采用产生式规则构建模拟量输入模块专家系统知识库,采用正向推理策略设计专家系统推理机。采用LMD算法对BIT检测数据进行特征提取,将提取到的特征向量采用CART算法训练决策树,适当对每颗决策树剪枝后,将每棵树以投票的方式生成随机森林,由随机森林对BIT检测数据进行状态识别,将过滤掉间歇状态的检测数据后送入专家系统推理机,由专家系统给出诊断结果,实现模拟量输入模块精确故障定位。
Description
技术领域
本发明属于测试和人工智能领域,具体涉及一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法。
背景技术
模拟量输入模块是重型燃气轮机控制系统与现场工业设备模拟量数据交换的媒介,对于重型燃气轮机控制系统来说是一个十分重要的硬件模块,其可靠性程度一定意义上决定了整个控制系统整体的可靠性与稳定性。近年来分散控制系统越来越多的应用于许多重要的控制任务中,为了提升分散控制系统可靠性与稳定性,降低设备的维修成本,往往引入机内测试技术(Built-in Test,简称BIT)。
虚警率是影响BIT发展的重要原因,高虚警率不仅直接影响了BIT系统的稳定性,而且会对整个任务的完成以及系统的可用性、维修和备件等产生不利的影响,甚至造成使用人员对其丧失信心。
将专家系统技术引入BIT技术领域,依据专家经验构建模拟量输入模块的知识库,利用高效推理机可以很大程度上的降低BIT虚警率,但是专家系统的推理机信息获取来源是不经过任何筛选的,如果将间歇故障的信息送入专家系统推理机,则会造成无效诊断,从而对整个任务带来不可估量的损失,因此只是将专家系统引入BIT技术领域依旧没有从根本上降低由于间歇故障引起的BIT虚警率。
发明内容
鉴于以上存在的技术问题,本发明提供一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法。
为解决上述技术问题,本发明采用如下的技术方案:
一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,包括以下步骤:
通过知识获取机制,构建重型燃气轮机控制系统模拟量输入模块专家系统知识库,知识库中每一条故障知识包含一条完整故障的所有信息,包括规则ID、规则前件、规则后件、置信度、规则解释、故障原理。
采用正向推理机制设计专家系统推理机。
对不同工作状态下的模拟量输入模块可表征功能电路状态的电流或电压进行采样,其中包括模拟量输入模块主要功能电路的正常数据、永久故障数据和间歇故障数据,得到功能电路BIT采样数据集X。
采用LMD(Local Mean Decomposition,局部均值分解)算法对功能电路BIT采样数据集X进行特征提取,用各PF分量构造特征向量Tn。
将构造得到的特征向量Tn组成数据集D,同时,为保证数据分布的一致性和均匀性,对数据集D进行“k折交叉验证”处理,生成k组测试集和训练集。
将k组训练集分别采用CART(Classification And Regression Tree,分类树回归)算法训练决策树,从数据集D所有的A个属性中随机选出一个包含A′=log2A个属性的子集,再在A′中以当前数据基尼指数最小的作为属性特征继续参与下次分支,用Gini(D)决定决策树分支的生长方向,当前节点所包含的样本都属于同一类别,或当前节点所覆盖的样本个数小于某一阈值分裂停止,然后对这棵树采用REP法(Reduced-Error Pruning,错误率降低剪枝)进行适当剪枝,最终训练得到k棵决策树。
将每棵决策树以投票的方式生成随机森林,利用随机森林分类器对实时BIT检测数据进行正常、间歇故障、永久故障三种状态的识别。
加载过滤间歇状态的功能电路BIT检测数据至推理机,实现故障原因的推理。
采用本发明具有如下的有益效果:该设计方法针对模拟量输入模块BIT虚警率高的问题,在引入专家系统的基础上加入了随机森林分类的方法,通过随机森林分类器对模拟量输入模块功能电路BIT检测数据的状态进行分类,将过滤掉间歇故障状态的BIT检测数据送入专家系统推理机进行推理,提高了推理的高效性和准确性,两者的结合提高了模拟量输入模块的可靠性,为重型燃气轮机控制系统可靠性的提升提供了一个有效的方法思路。
附图说明
图1为本发明实施例的基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计流程图。
图2为专家系统正向推理机制流程图。
图3为k折交叉验证流程图。
图4为随机森林决策流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
(1)构建模拟量输入模块专家系统知识库。
通过特定的知识获取机制(采用人工获取方式获取),构建模拟量输入模块专家系统知识库,知识库中每一条故障知识包含一条完整故障的所有信息,包括规则ID、规则前件、规则后件、置信度、规则解释、故障原理;构建故障知识表(见表1),用于存放模拟量输入模块故障知识。
表1模拟量输入模块故障知识表。
字段名称 | 字段命名 | 数据类型 |
规则ID | ruleid | char(2) |
前件 | ifs | nvarchar(MAX) |
后件 | thens | nvarchar(MAX) |
置信度 | cf | float |
解释 | explains | nvarchar(MAX) |
故障原理 | fnoDe | char(2) |
规则库采用产生式规则表示故障与原因之间的因果关系。
IF E1 AND E2 AND…AND EN THEN H(CF)
其中,E1,E2,…,EN指证据;H指结论(或者在相应证据下成立的假设),可以是单个对象,也可以是多个对象;CF指可信度,由专家根据经验直接给出。
(2)设计正向推理机制。
采用正向推理机制设计专家系统推理机,推理流程参照附图2,步骤如下。
第一步:将模拟量输入模块主要功能电路的BIT检测数据加载至专家系统推理机中,激活动态数据库。
第二步:从规则集中取出一条知识与动态数据库中的事实进行匹配,若匹配成功转到第三步,若失败转到第四步。
第三步:取出匹配成功规则的结论部分,暂时删除已被匹配的规则,并判断结论部分是否在动态数据库中,若是,继续匹配剩余规则,转到第二步,若否,将结论加载至动态数据库中,再转到第二步。
第四步:从动态数据库中找出最终结论,并输出结果。
(3)收集采样数据并提取特征向量。
对不同工作状态下的模拟量输入模块可表征功能电路状态的电流或电压进行采样,其中包括模拟量输入模块主要功能电路的正常数据、永久故障数据和间歇故障数据,得到功能电路BIT采样数据集X:
将数据集X采用LMD算法进行特征提取,并将提取到的特征向量构造数据集D,其中数据集D代表正常、永久故障和间歇故障三种状态的特征向量,作为训练决策树的输入,包括下述步骤:
第一步:得到采样数据集X后,对X采用LMD算法进行特征提取,首先求取每个BIT检测数据的x(t)每个半波振动所有局部极值点ni,并计算ni和ni+1的平均值mi:
将平均值mi直线延伸到局部均值线段m11(t),对m11(t)采用滑动平均方法进行平滑处理得到局部均值函数m11(t)。
第二步:求局部包络函数ai:
同样将所有ai连接起来并采用平滑化处理,得到包络估计函数a11(t)。
第三步:从原始BIT检测数据中分离局部均值函数m11(t):
h11(t)=x(t)-m11(t)
第四步:解调h11(t):
理想的s11(t)是一个纯调频信号,包含估计函数a12(t),且a12(t)值为1,若不满足该条件,则将s11(t)作为原始数据重复上述4步直到得到一个纯调频信号s1n(t),即|s1n(t)|≤1。迭代过程如下:
其中
第五步:把迭代过程中产生的所有包络估计函数相乘得到PF分量的包络信号a1(t):
第六步:第一个PF分量为包络信号a1(t)和纯调频信号s1n(t)的乘积
PF1(t)=a1(t)s1n(t)
第七步:将PF1(t)从原始信号x(t)中分离出来,相减余下u1(t)作为待分解信号重复以上步骤,循环k次,直到uk(t)为单调函数。
经过k次循环之后,将原始信号分解为k个PF分量和一个单调函数uk(t)之和,即
第八步,计算得到各PF分量的能量值Ep:
式中p表示分量的个数,PFi j表示第p个PF分量的第j个数据点。用各PF分量Ep构造特征向量
将所有的样本都进行LMD特征提取后,组成数据集D:
(4)采用k折交叉验证算法
为保证数据的均匀性和分布的一致性,在训练决策树之前,先将提取到的特征向量进行k折交叉验证。K折交叉验证的示意图如图3所示。数据集D是由特征向量Tn组成的,将数据集D等比例化为k个大小互斥的子集,每次将k-1个子集的并集作训练集,另一份作验证集,最终得到k组训练样本,将此k组数据作为训练决策树的输入。
(5)训练决策树
采用CART算法训练决策树,决策树训练流程参照图4,步骤如下。
从数据集D所有的A个属性中随机选出一个包含A′=log2A个属性的子集,再在A′中以当前数据基尼指数最小的子集作为属性特征继续参与下次分支,基尼指数公式为:
其中pi表示样本集D中第i类样本所占的比例,用Gini(D)决定决策树分支的生长方向,当前节点所包含的样本都属于同一类别,或当前节点所覆盖的样本个数小于某一阈值分裂停止,然后对这棵树进行适当剪枝,剪枝采用REP法(Reduced-Error Pruning,错误率降低剪枝):
将k组训练集预留一部分数据作为验证集,当决策树训练完之后,用验证集自决策树底部起对非叶节点进行验证考察,判断依据为替换该叶节点可以提升决策树的泛化性能,则将该叶节点删除,反复该操作,从底向上处理节点,删除那些能够最大限度的提高验证集合的精度的结点。
将其余的k-1组数据分别采用CART算法训练决策树,最终得到k棵决策树。
(6)采用随机森林分类器实现决策。
将模拟量输入模块主要功能电路的BIT检测数据采用LMD算法提取特征向量后,输入到由步骤(5)产生的随机森林网络中,进行投票选择,最终判断出该数据属于何种状态,分类的记过由决策树投票数量的多少来决定,投票过程为:
(7)将BIT检测数据送至推理机进行推理。
该设计方法针对模拟量输入模块BIT虚警率高的问题,在引入专家系统的基础上加入了随机森林分类的方法,通过随机森林分类器对原始BIT数据状态进行分类,将过滤掉间歇故障状态的BIT检测数据送入专家系统推理机进行推理,提高了推理的高效性和准确性,两者的结合提高了模拟量输入模块的可靠性,为重型燃气轮机控制系统可靠性的提升提供了一个有效的方法。
应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。
Claims (8)
1.一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,包括以下步骤:
通过知识获取机制,采用产生式规则构建模拟量输入模块专家系统知识库;
采用正向推理机制设计专家系统推理机;
采用LMD算法对BIT检测数据进行特征提取;
将提取到的特征向量采用CART算法训练决策树并进行决策树剪枝;
将每棵决策树以投票的方式生成随机森林;
由随机森林对BIT检测数据进行正常、间歇故障、永久故障三种状态的识别;
过滤间歇状态的检测数据后送入专家系统推理机,由专家系统给出诊断结果,实现模拟量输入模块精确故障定位。
2.如权利要求1所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,知识库中每一条故障知识包含一条完整故障的所有信息,包括规则ID、规则前件、规则后件、置信度、规则解释、故障原理,表现形式为:
IF E1 AND E2 AND … AND EN THEN H(CF)
其中,E1,E2,…,EN指证据;H指结论(或者在相应证据下成立的假设),可以是单个对象,也可以是多个对象;CF指置信度,是该条规则的前提对结论的支撑程度。
3.如权利要求1所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,专家系统推理机采用正向推理机制实现,包括下述步骤:
第一步:将模拟量输入模块主要功能电路的BIT检测数据加载至专家系统推理机中,激活动态数据库;
第二步:从规则集中取出一条知识与动态数据库中的事实进行匹配,若匹配成功转到第三步,若失败转到第四步;
第三步:取出匹配成功规则的结论部分,暂时删除已被匹配的规则,并判断结论部分是否在动态数据库中,若是,继续匹配剩余规则,转到第二步,若否,将结论加载至动态数据库中,再转到第二步;
第四步:从动态数据库中找出最终结论,并输出结果。
4.如权利要求1所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,对不同工作状态下的模拟量输入模块可表征功能电路状态的电流或电压进行采样,其中包括模拟量输入模块主要功能电路的正常数据、永久故障数据和间歇故障数据,得到功能电路BIT采样数据集,采用LMD算法对采样数据集进行特征提取,并构造每种状态的特征向量,作为训练决策树的输入,包括下述步骤:
第一步:首先求取原始BIT检测信号x(t)每个半波振动所有局部极值点ni,并计算ni和ni+1的平均值mi:
将平均值mi直线延伸到局部均值线段m11(t),对m11(t)采用滑动平均方法进行平滑处理得到局部均值函数m11(t);
第二步:求局部包络函数ai:
同样将所有ai连接起来并采用平滑化处理,得到包络估计函数a11(t);
第三步:从原始BIT信号中分离局部均值函数m11(t):
h11(t)=x(t)-m11(t)
第四步:解调h11(t):
理想的s11(t)是一个纯调频信号,包含估计函数a12(t),且a12(t)值为1,若不满足该条件,则将s11(t)作为原始数据重复上述4步直到得到一个纯调频信号s1n(t),即|s1n(t)|≤1。迭代过程如下:
其中
第五步:把迭代过程中产生的所有包络估计函数相乘得到PF分量的包罗信号a1(t):
第六步:第一个PF分量为包络信号a1(t)和纯调频信号s1n(t)的乘积
PF1(t)=a1(t)s1n(t)
第七步:将PF1(t)从原始信号x(t)中分离出来,相减余下u1(t)作为待分解信号重复以上步骤,循环k次,直到uk(t)为单调函数
经过k次循环之后,将原始信号分解为k个PF分量和一个单调函数uk(t)之和,即
第八步,计算得到各PF分量的能量值Ep:
式中p表示分量的个数,PFi j表示第p个PF分量的第j个数据点。用各PF分量Ep构造特征向量
将所有的样本都进行LMD特征提取后,组成数据集D:
5.如权利要求1和4所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,为保证数据的均匀性和分布的一致性,对提取到的特征向量进行k折交叉验证。数据集D是由特征向量Tn组成的,将数据集D等比例化为k个大小互斥的子集,每次将k-1个子集的并集作训练集,另一份作验证集,最终得到k组训练样本,将此k组数据作为训练决策树的输入。
6.如权利要求1至5所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,将k组数据集采用CART算法训练决策树,包括下述步骤:
从数据集D所有的A个属性中随机选出一个包含A′=log2A个属性的子集,再在A′中以当前数据基尼指数最小的作为属性特征继续参与下次分支,基尼指数公式为:
用Gini(A)决定决策树分支的生长方向,当前节点所包含的样本都属于同一类别,或当前节点所覆盖的样本个数小于某一阈值分裂停止,然后对这棵树采用REP法(Reduced-Error Pruning,错误率降低剪枝)进行适当剪枝,从而生产一棵决策树,对其余的k-1组数据分别采用CART算法训练决策树,最终得到k棵决策树。
8.如权利要求1至7所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法,其特征在于,将模拟量输入模块原始BIT检测数据经过LMD分解提取特征向量后,送入训练好的随机森林决策器中,对该信号进行正常、间歇故障、永久故障三种状态的分类,并将过滤掉间歇故障的BIT检测数据送入专家系统推理机中进行匹配推理,最终实现模拟量输入模块故障的精确定位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110331921.6A CN113158555A (zh) | 2021-03-29 | 2021-03-29 | 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110331921.6A CN113158555A (zh) | 2021-03-29 | 2021-03-29 | 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113158555A true CN113158555A (zh) | 2021-07-23 |
Family
ID=76885386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110331921.6A Pending CN113158555A (zh) | 2021-03-29 | 2021-03-29 | 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113158555A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116631572A (zh) * | 2023-07-24 | 2023-08-22 | 中国人民解放军总医院 | 基于人工智能的急性心肌梗死临床决策支持系统及设备 |
-
2021
- 2021-03-29 CN CN202110331921.6A patent/CN113158555A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116631572A (zh) * | 2023-07-24 | 2023-08-22 | 中国人民解放军总医院 | 基于人工智能的急性心肌梗死临床决策支持系统及设备 |
CN116631572B (zh) * | 2023-07-24 | 2023-12-19 | 中国人民解放军总医院 | 基于人工智能的急性心肌梗死临床决策支持系统及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110728360B (zh) | 一种基于bp神经网络的微能源器件能量识别方法 | |
CN112069310B (zh) | 基于主动学习策略的文本分类方法及系统 | |
Coenen et al. | Threshold tuning for improved classification association rule mining | |
CN106874963B (zh) | 一种基于大数据技术的配电网故障诊断方法及系统 | |
CN113255573B (zh) | 基于混合簇中心标签学习的行人重识别方法和存储介质 | |
Xingrong | Research on time series data mining algorithm based on Bayesian node incremental decision tree | |
Tsipouras et al. | Random forests with stochastic induction of decision trees | |
CN113158555A (zh) | 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法 | |
De Matteis et al. | A new approach to fuzzy random forest generation | |
Feng et al. | Fsrf: an improved random forest for classification | |
CN110020637B (zh) | 一种基于多粒度级联森林的模拟电路间歇故障诊断方法 | |
CN113239199B (zh) | 一种基于多方数据集的信用分类方法 | |
CN112990130B (zh) | 训练样本的数据清洗方法、装置及一种分类器 | |
CN109409434A (zh) | 基于随机森林的肝脏疾病数据分类规则提取的方法 | |
CN114862081A (zh) | 一种基于案例推理和人工神经网络的辅助决策方法 | |
CN112785015A (zh) | 基于案例推理的装备故障诊断方法 | |
CN112924808A (zh) | 一种船舶区域配电电力系统短路故障诊断方法 | |
CN112487933A (zh) | 一种基于自动化深度学习的雷达波形识别方法及系统 | |
CN115130617B (zh) | 一种自适应卫星数据模式不断增长的检测方法 | |
CN111340637A (zh) | 一种基于机器学习反馈规则增强的医疗保险智能审核系统 | |
CN116070158A (zh) | 一种基于改进深度森林的智能bit设计方法 | |
Ishibashi et al. | Knowledge extraction using a genetic fuzzy rule-based system with increased interpretability | |
Li et al. | Feature ranking-guided fuzzy rule interpolation | |
Rabcan et al. | Comparison of algorithms for fuzzy decision tree induction | |
CN111950615A (zh) | 一种基于树种优化算法的网络故障特征选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |