CN113158555A

CN113158555A - 一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块bit设计方法

Info

Publication number: CN113158555A
Application number: CN202110331921.6A
Authority: CN
Inventors: 黄从智; 申振东; 张建华; 侯国莲
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2021-03-29
Filing date: 2021-03-29
Publication date: 2021-07-23

Abstract

本发明提供了一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，属于测试和人工智能领域。该方法用于提高现有模拟量输入模块的可靠性，解决模拟量输入模块BIT虚警率高的问题。步骤如下：通过知识获取机制，采用产生式规则构建模拟量输入模块专家系统知识库，采用正向推理策略设计专家系统推理机。采用LMD算法对BIT检测数据进行特征提取，将提取到的特征向量采用CART算法训练决策树，适当对每颗决策树剪枝后，将每棵树以投票的方式生成随机森林，由随机森林对BIT检测数据进行状态识别，将过滤掉间歇状态的检测数据后送入专家系统推理机，由专家系统给出诊断结果，实现模拟量输入模块精确故障定位。

Description

一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法

技术领域

本发明属于测试和人工智能领域，具体涉及一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法。

背景技术

模拟量输入模块是重型燃气轮机控制系统与现场工业设备模拟量数据交换的媒介，对于重型燃气轮机控制系统来说是一个十分重要的硬件模块，其可靠性程度一定意义上决定了整个控制系统整体的可靠性与稳定性。近年来分散控制系统越来越多的应用于许多重要的控制任务中，为了提升分散控制系统可靠性与稳定性，降低设备的维修成本，往往引入机内测试技术(Built-in Test，简称BIT)。

虚警率是影响BIT发展的重要原因，高虚警率不仅直接影响了BIT系统的稳定性，而且会对整个任务的完成以及系统的可用性、维修和备件等产生不利的影响，甚至造成使用人员对其丧失信心。

将专家系统技术引入BIT技术领域，依据专家经验构建模拟量输入模块的知识库，利用高效推理机可以很大程度上的降低BIT虚警率，但是专家系统的推理机信息获取来源是不经过任何筛选的，如果将间歇故障的信息送入专家系统推理机，则会造成无效诊断，从而对整个任务带来不可估量的损失，因此只是将专家系统引入BIT技术领域依旧没有从根本上降低由于间歇故障引起的BIT虚警率。

发明内容

鉴于以上存在的技术问题，本发明提供一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法。

为解决上述技术问题，本发明采用如下的技术方案：

一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，包括以下步骤：

通过知识获取机制，构建重型燃气轮机控制系统模拟量输入模块专家系统知识库，知识库中每一条故障知识包含一条完整故障的所有信息，包括规则ID、规则前件、规则后件、置信度、规则解释、故障原理。

采用正向推理机制设计专家系统推理机。

对不同工作状态下的模拟量输入模块可表征功能电路状态的电流或电压进行采样，其中包括模拟量输入模块主要功能电路的正常数据、永久故障数据和间歇故障数据，得到功能电路BIT采样数据集X。

采用LMD(Local Mean Decomposition，局部均值分解)算法对功能电路BIT采样数据集X进行特征提取，用各PF分量构造特征向量T_n。

将构造得到的特征向量T_n组成数据集D，同时，为保证数据分布的一致性和均匀性，对数据集D进行“k折交叉验证”处理，生成k组测试集和训练集。

将k组训练集分别采用CART(Classification And Regression Tree，分类树回归)算法训练决策树，从数据集D所有的A个属性中随机选出一个包含A′＝log₂A个属性的子集，再在A′中以当前数据基尼指数最小的作为属性特征继续参与下次分支，用Gini(D)决定决策树分支的生长方向，当前节点所包含的样本都属于同一类别，或当前节点所覆盖的样本个数小于某一阈值分裂停止，然后对这棵树采用REP法(Reduced-Error Pruning，错误率降低剪枝)进行适当剪枝，最终训练得到k棵决策树。

将每棵决策树以投票的方式生成随机森林，利用随机森林分类器对实时BIT检测数据进行正常、间歇故障、永久故障三种状态的识别。

加载过滤间歇状态的功能电路BIT检测数据至推理机，实现故障原因的推理。

采用本发明具有如下的有益效果：该设计方法针对模拟量输入模块BIT虚警率高的问题，在引入专家系统的基础上加入了随机森林分类的方法，通过随机森林分类器对模拟量输入模块功能电路BIT检测数据的状态进行分类，将过滤掉间歇故障状态的BIT检测数据送入专家系统推理机进行推理，提高了推理的高效性和准确性，两者的结合提高了模拟量输入模块的可靠性，为重型燃气轮机控制系统可靠性的提升提供了一个有效的方法思路。

附图说明

图1为本发明实施例的基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计流程图。

图2为专家系统正向推理机制流程图。

图3为k折交叉验证流程图。

图4为随机森林决策流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

(1)构建模拟量输入模块专家系统知识库。

通过特定的知识获取机制(采用人工获取方式获取)，构建模拟量输入模块专家系统知识库，知识库中每一条故障知识包含一条完整故障的所有信息，包括规则ID、规则前件、规则后件、置信度、规则解释、故障原理；构建故障知识表(见表1)，用于存放模拟量输入模块故障知识。

表1模拟量输入模块故障知识表。

字段名称	字段命名	数据类型
			规则ID	ruleid	char(2)
前件	ifs	nvarchar(MAX)
			后件	thens	nvarchar(MAX)
置信度	cf	float
			解释	explains	nvarchar(MAX)
故障原理	fnoDe	char(2)

规则库采用产生式规则表示故障与原因之间的因果关系。

IF E1 AND E2 AND…AND EN THEN H(CF)

其中，E1，E2，…，EN指证据；H指结论(或者在相应证据下成立的假设),可以是单个对象,也可以是多个对象；CF指可信度，由专家根据经验直接给出。

(2)设计正向推理机制。

采用正向推理机制设计专家系统推理机，推理流程参照附图2，步骤如下。

第一步：将模拟量输入模块主要功能电路的BIT检测数据加载至专家系统推理机中，激活动态数据库。

第二步：从规则集中取出一条知识与动态数据库中的事实进行匹配，若匹配成功转到第三步，若失败转到第四步。

第三步：取出匹配成功规则的结论部分，暂时删除已被匹配的规则，并判断结论部分是否在动态数据库中，若是，继续匹配剩余规则，转到第二步，若否，将结论加载至动态数据库中，再转到第二步。

第四步：从动态数据库中找出最终结论，并输出结果。

(3)收集采样数据并提取特征向量。

对不同工作状态下的模拟量输入模块可表征功能电路状态的电流或电压进行采样，其中包括模拟量输入模块主要功能电路的正常数据、永久故障数据和间歇故障数据，得到功能电路BIT采样数据集X：

其中n代表正常、永久故障和间歇故障三种状态，在这个实例中n应该取3，在后续的决策树训练中也可以当标签使用，

代表第n种状态的第h个样本数据。

将数据集X采用LMD算法进行特征提取，并将提取到的特征向量构造数据集D，其中数据集D代表正常、永久故障和间歇故障三种状态的特征向量，作为训练决策树的输入，包括下述步骤：

第一步：得到采样数据集X后，对X采用LMD算法进行特征提取，首先求取每个BIT检测数据的x(t)每个半波振动所有局部极值点n_i，并计算n_i和n_i+1的平均值m_i：

将平均值m_i直线延伸到局部均值线段m₁₁(t)，对m₁₁(t)采用滑动平均方法进行平滑处理得到局部均值函数m₁₁(t)。

第二步：求局部包络函数a_i：

同样将所有a_i连接起来并采用平滑化处理，得到包络估计函数a₁₁(t)。

第三步：从原始BIT检测数据中分离局部均值函数m₁₁(t)：

h₁₁(t)＝x(t)-m₁₁(t)

第四步：解调h₁₁(t)：

理想的s₁₁(t)是一个纯调频信号，包含估计函数a₁₂(t)，且a₁₂(t)值为1，若不满足该条件，则将s₁₁(t)作为原始数据重复上述4步直到得到一个纯调频信号s_1n(t)，即|s_1n(t)|≤1。迭代过程如下：

其中

第五步：把迭代过程中产生的所有包络估计函数相乘得到PF分量的包络信号a₁(t)：

第六步：第一个PF分量为包络信号a₁(t)和纯调频信号s_1n(t)的乘积

PF₁(t)＝a₁(t)s_1n(t)

第七步：将PF₁(t)从原始信号x(t)中分离出来，相减余下u₁(t)作为待分解信号重复以上步骤，循环k次，直到u_k(t)为单调函数。

经过k次循环之后，将原始信号分解为k个PF分量和一个单调函数u_k(t)之和，即

第八步，计算得到各PF分量的能量值E_p：

式中p表示分量的个数，PF_i ^j表示第p个PF分量的第j个数据点。用各PF分量E_p构造特征向量

将所有的样本都进行LMD特征提取后，组成数据集D：

(4)采用k折交叉验证算法

为保证数据的均匀性和分布的一致性，在训练决策树之前，先将提取到的特征向量进行k折交叉验证。K折交叉验证的示意图如图3所示。数据集D是由特征向量T_n组成的，将数据集D等比例化为k个大小互斥的子集，每次将k-1个子集的并集作训练集，另一份作验证集，最终得到k组训练样本，将此k组数据作为训练决策树的输入。

(5)训练决策树

采用CART算法训练决策树，决策树训练流程参照图4，步骤如下。

从数据集D所有的A个属性中随机选出一个包含A′＝log₂A个属性的子集，再在A′中以当前数据基尼指数最小的子集作为属性特征继续参与下次分支，基尼指数公式为：

其中p_i表示样本集D中第i类样本所占的比例，用Gini(D)决定决策树分支的生长方向，当前节点所包含的样本都属于同一类别，或当前节点所覆盖的样本个数小于某一阈值分裂停止，然后对这棵树进行适当剪枝，剪枝采用REP法(Reduced-Error Pruning，错误率降低剪枝)：

将k组训练集预留一部分数据作为验证集，当决策树训练完之后，用验证集自决策树底部起对非叶节点进行验证考察，判断依据为替换该叶节点可以提升决策树的泛化性能，则将该叶节点删除，反复该操作，从底向上处理节点，删除那些能够最大限度的提高验证集合的精度的结点。

将其余的k-1组数据分别采用CART算法训练决策树，最终得到k棵决策树。

(6)采用随机森林分类器实现决策。

将模拟量输入模块主要功能电路的BIT检测数据采用LMD算法提取特征向量后，输入到由步骤(5)产生的随机森林网络中，进行投票选择，最终判断出该数据属于何种状态，分类的记过由决策树投票数量的多少来决定，投票过程为：

其中

其中，h_i代表不同的决策树，

为每棵决策树的预测结果，

的大小作为投票的依据，选择能够使

最大的C_j作为最终的随机森林分类结果，也就是模拟量输入模块功能电路状态的识别结果。

(7)将BIT检测数据送至推理机进行推理。

该设计方法针对模拟量输入模块BIT虚警率高的问题，在引入专家系统的基础上加入了随机森林分类的方法，通过随机森林分类器对原始BIT数据状态进行分类，将过滤掉间歇故障状态的BIT检测数据送入专家系统推理机进行推理，提高了推理的高效性和准确性，两者的结合提高了模拟量输入模块的可靠性，为重型燃气轮机控制系统可靠性的提升提供了一个有效的方法。

应当理解，本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例，本领域普通技术人员应当理解，在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下，可以做出各种形式和细节的改变。

Claims

1.一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，包括以下步骤：

通过知识获取机制，采用产生式规则构建模拟量输入模块专家系统知识库；

采用正向推理机制设计专家系统推理机；

采用LMD算法对BIT检测数据进行特征提取；

将提取到的特征向量采用CART算法训练决策树并进行决策树剪枝；

将每棵决策树以投票的方式生成随机森林；

由随机森林对BIT检测数据进行正常、间歇故障、永久故障三种状态的识别；

过滤间歇状态的检测数据后送入专家系统推理机，由专家系统给出诊断结果，实现模拟量输入模块精确故障定位。

2.如权利要求1所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，知识库中每一条故障知识包含一条完整故障的所有信息，包括规则ID、规则前件、规则后件、置信度、规则解释、故障原理，表现形式为：

IF E1 AND E2 AND … AND EN THEN H(CF)

其中，E1，E2，…，EN指证据；H指结论(或者在相应证据下成立的假设)，可以是单个对象，也可以是多个对象；CF指置信度，是该条规则的前提对结论的支撑程度。

3.如权利要求1所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，专家系统推理机采用正向推理机制实现，包括下述步骤：

第一步：将模拟量输入模块主要功能电路的BIT检测数据加载至专家系统推理机中，激活动态数据库；

第二步：从规则集中取出一条知识与动态数据库中的事实进行匹配，若匹配成功转到第三步，若失败转到第四步；

第三步：取出匹配成功规则的结论部分，暂时删除已被匹配的规则，并判断结论部分是否在动态数据库中，若是，继续匹配剩余规则，转到第二步，若否，将结论加载至动态数据库中，再转到第二步；

第四步：从动态数据库中找出最终结论，并输出结果。

4.如权利要求1所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，对不同工作状态下的模拟量输入模块可表征功能电路状态的电流或电压进行采样，其中包括模拟量输入模块主要功能电路的正常数据、永久故障数据和间歇故障数据，得到功能电路BIT采样数据集，采用LMD算法对采样数据集进行特征提取，并构造每种状态的特征向量，作为训练决策树的输入，包括下述步骤：

第一步：首先求取原始BIT检测信号x(t)每个半波振动所有局部极值点n_i，并计算n_i和n_i+1的平均值m_i：

将平均值m_i直线延伸到局部均值线段m₁₁(t)，对m₁₁(t)采用滑动平均方法进行平滑处理得到局部均值函数m₁₁(t)；

第二步：求局部包络函数a_i：

同样将所有a_i连接起来并采用平滑化处理，得到包络估计函数a₁₁(t)；

第三步：从原始BIT信号中分离局部均值函数m₁₁(t)：

h₁₁(t)＝x(t)-m₁₁(t)

第四步：解调h₁₁(t)：

其中

第五步：把迭代过程中产生的所有包络估计函数相乘得到PF分量的包罗信号a₁(t)：

PF₁(t)＝a₁(t)s_1n(t)

第七步：将PF₁(t)从原始信号x(t)中分离出来，相减余下u₁(t)作为待分解信号重复以上步骤，循环k次，直到u_k(t)为单调函数

第八步，计算得到各PF分量的能量值E_p：

将所有的样本都进行LMD特征提取后，组成数据集D：

其中T_n代表第n种状态的特征向量，

代表第n种的第h个样本向量。

5.如权利要求1和4所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，为保证数据的均匀性和分布的一致性，对提取到的特征向量进行k折交叉验证。数据集D是由特征向量T_n组成的，将数据集D等比例化为k个大小互斥的子集，每次将k-1个子集的并集作训练集，另一份作验证集，最终得到k组训练样本，将此k组数据作为训练决策树的输入。

6.如权利要求1至5所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，将k组数据集采用CART算法训练决策树，包括下述步骤：

从数据集D所有的A个属性中随机选出一个包含A′＝log₂A个属性的子集，再在A′中以当前数据基尼指数最小的作为属性特征继续参与下次分支，基尼指数公式为：

用Gini(A)决定决策树分支的生长方向，当前节点所包含的样本都属于同一类别，或当前节点所覆盖的样本个数小于某一阈值分裂停止，然后对这棵树采用REP法(Reduced-Error Pruning，错误率降低剪枝)进行适当剪枝，从而生产一棵决策树，对其余的k-1组数据分别采用CART算法训练决策树，最终得到k棵决策树。

7.如权利要求1至6所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，对于已训练好的决策树，生成随机森林的投票过程为：

其中

其中，h_i代表不同的决策树，

为每棵决策树的预测结果，

的大小作为投票的依据，选择能够使

8.如权利要求1至7所述的一种基于专家系统和随机森林分类器的重型燃机控制系统模拟量输入模块BIT设计方法，其特征在于，将模拟量输入模块原始BIT检测数据经过LMD分解提取特征向量后，送入训练好的随机森林决策器中，对该信号进行正常、间歇故障、永久故障三种状态的分类，并将过滤掉间歇故障的BIT检测数据送入专家系统推理机中进行匹配推理，最终实现模拟量输入模块故障的精确定位。