CN110135392A - 一种电气负载类型识别方法 - Google Patents

一种电气负载类型识别方法 Download PDF

Info

Publication number
CN110135392A
CN110135392A CN201910443648.9A CN201910443648A CN110135392A CN 110135392 A CN110135392 A CN 110135392A CN 201910443648 A CN201910443648 A CN 201910443648A CN 110135392 A CN110135392 A CN 110135392A
Authority
CN
China
Prior art keywords
input feature
feature vector
electrical load
node
subordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910443648.9A
Other languages
English (en)
Inventor
黄云章
凌云
周建华
肖伸平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN201910443648.9A priority Critical patent/CN110135392A/zh
Publication of CN110135392A publication Critical patent/CN110135392A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)

Abstract

一种电气负载类型方法,采用改进决策树分类器或者是复合优化决策树分类器进行电气负载类型识别,分类器的输入特征包括电气负载的启动电流特征和电气负载的稳态电流频谱特征,启动电流特征包括启动过程时间、启动电流最大值、启动电流最大值时间;能够在不同电气负载类型的所有输入特征均落入相应的区间化输入特征重叠区域,或者是部分输入特征均落入相应的区间化输入特征的有效区间之外,而另外的输入特征均落入相应的区间化输入特征重叠区域时,完成电气负载类型识别,且泛化能力与识别准确率高。

Description

一种电气负载类型识别方法
技术领域
本发明涉及一种设备识别及分类装置与方法,尤其是涉及一种电气负载类型识别方法。
背景技术
目前,主流的,包括电气负载性质识别在内的电气负载类型识别装置、方法有基于负载功率综合系数算法的电气负载识别方法、基于电磁感应的电气负载识别方法、基于神经网络算法的电气负载识别方法、基于周期性离散变换算法的电气负载识别方法等。各种方法均能够在一定程度是实现电气负载性质的识别,但由于特征性质单一,识别手段单一,普遍存在泛化能力不够及不能完全准确识别的问题。
发明内容
本发明的目的在于,针对现在已有技术的缺陷,提供一种电气负载类型识别方法,采用分类器进行电气负载类型识别,分类器的输入特征包括电气负载的启动电流特征和电气负载的稳态电流频谱特征。所述启动电流特征包括启动过程时间、启动电流最大值、启动电流最大值时间;对训练分类器的输入特征样本进行区间化,得到区间化输入特征。
所述分类器为基于隶属比例平方和的改进决策树分类器,或者是基于隶属比例和的改进决策树分类器,构建流程如下:
步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征;
步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化;
步骤⑶、计算当前节点待选择输入特征的信息量;所述待选择输入特征是指每一个待选择作为当前节点判别属性(分类属性)的输入特征;
步骤⑷、计算当前节点待判别电气负载的每个待选择输入特征的信息熵;
步骤⑸、计算当前节点的每个待选择输入特征的总信息熵;
步骤⑹、计算当前节点的每个待选择输入特征的信息增益;
步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立;
步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属比例平方和,采用隶属比例平方和作为该节点的判别属性,选择其中隶属比例平方和最大的电气负载类型输出;对不是纯净集的输出节点,或者是分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属比例和,采用隶属比例和作为该节点的判别属性,选择其中隶属比例和最大的电气负载类型输出。
所述分类器或者是在基于隶属比例平方和的改进决策树分类器的步骤⑴至步骤⑻基础上,增加下述步骤所构建的基于隶属比例平方和和贝叶斯的复合优化决策树分类器,或者是在基于隶属比例和的改进决策树分类器的步骤⑴至步骤⑻基础上,增加下述步骤所构建的基于隶属比例和和贝叶斯的复合优化决策树分类器,增加的步骤如下:
步骤⑼、采用步骤⑴获取的电气负载样本输入特征中的训练数据样本,训练并建立贝叶斯分类器;
步骤⑽、记录步骤⑻中所有采用隶属比例平方和(或者是隶属比例和)作为节点判别属性的节点,准备进行分类优化;
步骤⑾、选择一个采用隶属比例平方和(或者是隶属比例和)作为节点判别属性,未进行分类优化的节点进行分类优化,方法是,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用隶属比例平方和(或者是隶属比例和)作为节点判别属性时的总电气负载识别准确率;该节点使用贝叶斯分类器分类,替代该节点采用隶属比例平方和(或者是隶属比例和)作为节点判别属性的方法,将步骤⑴获取的电气负载样本输入特征的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率;选择总电气负载识别准确率高的方法作为该节点进行电气负载类型识别的方法;
步骤⑿、若步骤⑻中所有采用隶属比例平方和(或者是隶属比例和)作为节点判别属性的节点未全部完成分类优化,返回步骤⑾;若步骤⑻中所有采用隶属比例平方和(或者是隶属比例和)作为节点判别属性的节点全部完成分类优化,完成复合优化决策树分类器的构造。
步骤⑴中,对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征,是指将每个输入特征的训练数据样本中的最小值作为区间化输入特征的下限值,将每个输入特征的训练数据样本中的最大值作为区间化输入特征的上限值。
步骤⑵中,每个特征参数的中间分裂点,是指每个区间化输入特征中,能够将当前节点需要分类的电气负载类型区分的分界点。
步骤⑶中,计算当前节点每个输入特征的信息量的方法是:
式中,X代表该信息量所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征;p为在当前节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在当前节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。
步骤⑷中,计算当前节点待判别电气负载的每个输入特征的信息熵的方法是:
式中,X代表该信息熵所针对的输入特征,X包括且只包括属于当前节点待选择的输入特征;i代表该信息熵所针对的电气负载类型,i包括且只包括属于当前节点待判别的电气负载类型;Pi为该电气负载类型输入特征X的区间范围中与该节点待选择的其他输入特征均不重叠的区间范围;Ni为该电气负载类型输入特征X的区间范围中与当前节点待选择的其他输入特征相重叠的区间范围。
步骤⑸中,计算当前节点的每个待选择输入特征的总信息熵的方法是:
式中,X代表该信息熵或者总信息熵所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征;i代表待识别的某种电气负载类型,k代表需分类的电气负载类型的种类总数;Pi为与i所代表电气负载类型输入特征X的区间范围中与该节点待选择的其他输入特征均不重叠的区间范围;Ni为与i所代表电气负载类型输入特征X的区间范围中与当前节点待选择的其他输入特征相重叠的区间范围;p为在该节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在该节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。
步骤⑹中,计算当前节点的每个待选择输入特征的信息增益的方法是:
gain(X)=IX(p,n)-E(X)
式中,X代表该信息熵或者总信息熵所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征。
步骤⑻中,当选择采用隶属比例平方和作为该节点的判别属性时,则步骤⑻至步骤⑿中采用隶属比例和作为该节点的判别属性不会被使用;当选择采用隶属比例和作为该节点的判别属性时,则则步骤⑻至步骤⑿中采用隶属比例平方和作为该节点的判别属性不会被使用。隶属比例平方和为所有输入特征在该种电气负载类型中的隶属比例的平方和;隶属比例和为所有输入特征在该种电气负载类型中的隶属比例的和;隶属比例平方和或者是隶属比例和的计算方法是,分别计算所有输入特征在该种电气负载类型中的隶属比例,再计算隶属比例平方和或者是隶属比例和。
计算输入特征在电气负载类型中的隶属比例的方法是:
式中,X代表该隶属比例所针对的输入特征,i代表所针对的电气负载类型,即ri(X)代表输入特征X在i所代表电气负载类型中的隶属比例;d0为输入特征X在i所代表电气负载类型区间化输入特征的区间中心值,d1为输入特征X在i所代表电气负载类型区间化输入特征的区间下限值,d为输入特征X的实际输入值。
步骤⑼中,训练并建立贝叶斯分类器的方法是:
步骤①、对某个输入特征属性进行分段划分,即进行离散化处理;
步骤②、将步骤⑴中的训练数据样本作为贝叶斯分类器的训练数据样本;计算每类电气负载类型训练数据样本在所有电气负载类型训练数据样本中所占有的比例;
步骤③、计算训练样本每个类型(类别)条件下各个输入特征属性分段的比例(频率),统计得到各类型(类别)下各个输入特征属性的条件概率估计。
步骤⑾中,节点使用贝叶斯分类器分类的方法是:
步骤㈠、将复合优化决策树分类器的输入特征作为贝叶斯分类器的输入特征;
步骤㈡、按照式
计算每种电气负载类别的后验概率,其中
步骤㈢、针对该节点所有待识别电气负载类型,选择其中后验概率最大的电气负载类型输出。
步骤⑾中,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,是指将多组测试数据样本分组依次输入至复合优化决策树分类器;统计该节点采用隶属比例平方和(或者是隶属比例和)作为节点判别属性时的总电气负载识别准确率,是指在多组测试数据样本中,该节点采用隶属比例平方和(或者是隶属比例和)作为节点判别属性时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本数与总测试数据样本数的百分比值;统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率,是指在多组测试数据样本中,该节点采用贝叶斯分类器分类时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本数与总测试数据样本数的百分比值。
所述负载电流频谱特征通过以下方法获得:
步骤一、获取电气负载的稳态电流信号,并将其转换为对应的稳态电流数字信号;
步骤二、对稳态电流数字信号进行傅立叶变换,得到负载电流频谱特性;
步骤三、将负载电流频谱特性中谐波次数为m次的奇次谐波信号相对幅值作为负载电流频谱特征,m=3,5,…,M;所述M表示谐波最高次数且M大于等于3。
所述启动电流特征由信息处理模块通过以下方法获得:
步骤1、电气负载启动前,开始对电气负载的负载电流连续采样并对负载电流大小进行判断;当负载电流有效值大于ε时,判定电气负载开始启动并转向步骤2;所述ε为大于0的数值;
步骤2、对电气负载的负载电流进行连续采样,以工频周期为单位计算负载电流有效值并保存,计算最近N个工频周期的负载电流有效值的平均值,直至当最近N个工频周期之内的每个工频周期的负载电流有效值与该N个工频周期的负载电流有效值的平均值相比较,波动幅度均小于设定的相对误差范围E时,判定电气负载进入稳定状态,转向步骤3;所述N的取值范围为50~500;所述E的取值范围为2%~20%;
步骤3、将最近N个工频周期之内的负载电流有效值的平均值作为电气负载稳态电流有效值;将电气负载开始启动时刻至最近N个工频周期起始时刻之间的时间作为启动过程时间;将电气负载开始启动时刻至启动过程时间之内负载电流有效值最大的工频周期之间的时间作为启动电流最大值时间;将启动电流最大值时间所在工频周期的负载电流有效值与电气负载稳态电流有效值之间的比值作为启动电流最大值。
所述采用包括信息采集模块、信息处理模块、通信模块的电气负载类型识别装置实现;所述信息采集模块用于采集电气负载的负载电流并转换成电流数字信号,电流数字信号被送至信息处理模块,通信模块用于发送信息处理模块的电气负载类型识别结果至上位机,信息处理模块依据输入的电流数字信号,采用分类器进行电气负载类型识别。所述信息采集模块包括电流传感器、前置放大器、滤波器、A/D转换器;所述信息处理模块的核心为DSP,或者为ARM,或者为单片机,或者为FPGA。
所述A/D转换器可以采用信息处理模块的核心中包括的A/D转换器。
所述信息采集模块、信息处理模块、通信模块的全部或者部分功能集成在一片SoC上。
所述通信模块还接收上位机的相关工作指令;所述通信模块与上位机之间的通信方式包括无线通信方式与有线通信方式;所述无线通信方式包括ZigBee、蓝牙、WiFi、433MHz数传方式;所述有线通信方式包括485总线、CAN总线、互联网、电力载波方式。
本发明的有益效果是:提供了一种能够识别电气负载类型的方法与装置,同时采用电气负载的启动电流特征、电气负载的稳态电流频谱特征作为识别特征,并同时提供了如何提取电气负载的启动电流特征、电气负载的稳态电流频谱特征的方法;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征,区间化之后的输入特征减小了训练数据样本大小对决策树分类的影响,能够很大程度上弥补样本问题造成的训练数据缺失;采用基于隶属比例平方和(或者是隶属比例和)的改进决策树分类器或者是基于隶属比例平方和(或者是隶属比例和)和贝叶斯的复合优化决策树分类器进行识别分类,避免当不同电气负载类型的所有输入特征均落入相应的区间化输入特征重叠区域,仅靠将区间化输入特征的区间分段化无法完全实现决策分类识别的情况;以及避免当因为训练数据样本覆盖不全,或者是因为测量干扰误差,造成部分输入特征均落入相应的区间化输入特征的有效区间之外,而另外的输入特征均落入相应的区间化输入特征重叠区域,仅靠将区间化输入特征的区间分段化无法完全实现决策分类识别的情况;所述方法的泛化能力与识别准确率高。
附图说明
图1为本发明电气负载类型识别装置实施例的结构示意图;
图2为启动冲击性电阻类负载的启动过程电流波形;
图3为无启动冲击电阻类负载的启动过程电流波形;
图4为异步电机类负载的启动过程电流波形;
图5为整流滤波类负载的启动过程电流波形;
图6为识别装置进行电气负载类型识别的流程图;
图7为根节点区间化输入特征ΔI*的区间分段化的示意图;
图8为根节点区间化输入特征ΔTS的区间分段化的示意图;
图9为排除异步电机类负载后区间化输入特征ΔTS的区间分段化的示意图;
图10为排除异步电机类负载后区间化输入特征ΔA7的区间分段化的示意图。
具体实施方式
以下结合附图对本发明作进一步说明。
图1为本发明电气负载类型识别装置实施例的结构示意图,包括信息采集模块101、信息处理模块102、通信模块103。
信息采集模块102用于采集电气负载的负载电流并将负载电流转换成电流数字信号,电流数字信号被送至信息处理模块102。信息采集模块中包括电流传感器、前置放大器、滤波器、A/D转换器等组成部分,分别完成负载电流信号的传感、放大、滤波与模数转换功能。当负载电流范围较大时,可以选择具有程控功能的前置放大器,或者是在A/D转换器前再增加一个独立的程控放大器,对范围较大的负载电流实行分段控制放大,使输入至A/D转换器的电压信号范围保持在合理的区间,保证转换精度。滤波器用于滤除高频分量,避免频谱混叠。
信息处理模块102依据输入的电流数字信号,采用分类器实现电气负载类型识别。分类器的输入特征包括电气负载的启动电流特征和电气负载的稳态电流频谱特征。信息处理模块102的核心为DSP、ARM、单片机,或者为FPGA。当信息处理模块的核心中包括有A/D转换器且该A/D转换器满足要求时,信息采集模块101中的A/D转换器可以采用信息处理模块102的核心中包括的A/D转换器。
通信模块103用于实现与上位机之间的通信,将识别结果发送至上位机。通信模块102与上位机之间的通信方式包括无线通信方式与有线通信方式,可以采用的无线通信方式包括ZigBee、蓝牙、WiFi、433MHz数传等方式,可以采用的有线通信方式包括485总线、CAN总线、互联网、电力载波等方式。通信模块103还可以接收上位机的相关工作指令,完成指定的工作任务。上位机可以是管理部门的服务器,也可以是各种工作站,或者是各种移动终端。
信息采集模块101、信息处理模块102、通信模块103的全部或者部分功能可以集成在一片SoC上,减小识别装置体积,方便安装。
不同的电气负载设备具有不同的启动电流特征。如图2所示为启动冲击性电阻类负载的启动过程电流波形。启动冲击性电阻类负载包括白炽灯,采用钨、钼材料的高温电阻炉等。以白炽灯为例,白炽灯的灯丝通常用耐高温的金属钨制造,但金属钨的电阻随温度变化大,以Rt表示钨丝在t℃时的电阻,以R0表示钨丝在0℃时的电阻,则两者有下述的关系
Rt=R0(1+0.0045t)
例如,设白炽灯的灯丝(钨丝)在正常工作时的温度为2000℃,一只“220V 100W”的白炽灯的灯丝在2000℃正常工作时的电阻为
其在不通电时0℃的电阻为
其在不通电时20℃的电阻为
R20=R0(1+0.0045t)=52.8Ω
即白炽灯在启动通电的瞬间电流超过其额定电流的9倍,且最大启动电流发生在启动时刻。随着白炽灯钨丝温度的升高,白炽灯的负载电流按照指数规律减小,然后进入稳定状态。负载电流减小的速度与启动冲击性电阻类负载,即电阻丝的热惯性大小有关,白炽灯的热惯性小,负载电流减小的速度快;大型电阻炉电阻丝的热惯性大,负载电流减小的速度慢。
设电气负载稳态电流有效值为IW,且定义电气负载电流有效值进入电气负载稳态电流有效值的一个设定的相对误差范围之内并稳定在这个相对误差范围之内,则电气负载进入稳定状态。相对误差范围可以设定为10%,也可以设定为2%、5%、15%、20%等2%~20%之间的值。图2中,设定的相对误差范围为10%,当负载电流按照指数规律减小到其IW的10%误差范围时,如图2中的时刻TS,启动过程结束,即启动过程时间为TS。IW为有效值。
选择启动过程时间、启动电流最大值I*、启动电流最大值时间作为电气负载的启动电流特征;启动电流最大值为标么值,即启动电流最大值I*为电气负载的启动电流的最大有效值IM与电气负载的稳态电流有效值IW的比值。
图2中,启动冲击性电阻类负载的启动过程时间为TS;启动电流最大值I*为IM/IW;启动电流最大值时间为TM
如图3所示为无启动冲击电阻类负载的启动过程电流波形。低温电阻炉等无启动冲击电阻类负载通常采用镍铬、铁铬铝等电热合金丝,其共同特点是电阻温度修正系数小,电阻值稳定。以牌号为Cr20Ni80的镍铬电热丝为例,其在1000℃时的电阻修正系数为1.014,即1000℃时相对于20℃时,牌号为Cr20Ni80的镍铬电热丝电阻只增加1.4%。因此,低温电阻炉等无启动冲击电阻类负载在通电启动时即进入稳定状态;启动电流最大值I*=1,考虑到测量误差及干扰影响,I*的测量值在1左右;启动电流最大值时间为TM,考虑到测量滞后及电阻丝本身的小电感影响,TM的测量值略大于0。
如图4所示为异步电机类负载的启动过程电流波形,异步电机类负载包括单相异步电机、三相异步电机等。异步电机类负载既具有电感性负载特性,又具有反电动势负载特性。启动时刻,由于电感的作用,启动时刻的启动电流为0;随后电流迅速上升,在电机反电动势未建立之前,达到电流峰值IM;此后,电机转速增加,电机负载电流逐步减小,直到进入稳定状态。图4中,异步电机类负载的启动过程时间为TS;启动电流最大值I*为IM/IW;启动电流最大值时间为TM
如图5所示为整流滤波类负载的启动过程电流波形,包括计算机,各种开关电源类负载,变频器负载等。整流滤波类负载因为对电容充电的影响,在启动瞬间会产生一个很大的浪涌电流,其峰值可达到稳态电流有效值IW的几倍至十几倍,时间为1至2个工频周期。图5中,整流滤波类负载的启动过程时间为TS;启动电流最大值I*为IM/IW;启动电流最大值时间为TM
获取电气负载的启动电流特征的方法是:
电气负载启动前,负载电流值为0(未开机)或者很小(处于待机状态)时,信息处理模块102即开始对负载电流进行连续采样;当采样得到的负载电流值有效值开始大于0或者是开始大于电气负载的待机电流时,即判断出电气负载已经启动,记录该时刻为T0。用一个较小的非负阈值ε来区分电气负载启动前后的负载电流值,当ε取值特别小时,例如,ε取值1mA时,所述装置不考虑待机情况,即认为待机也是电气负载的启动状态;当ε取值较小但大于电气负载的待机电流时,例如,ε取值20mA时,所述装置会将电气负载的待机状态认为是未启动状态,但同时也会的部分功率特别小的电气负载造成漏识别。
信息处理模块102对负载电流进行连续采样,且以工频周期为单位计算负载电流有效值并保存;当电气负载已经启动,且连续采样达到N个工频周期后,采样的同时连续计算最近N个工频周期的负载电流有效值的平均值IV;信息处理模块102对最近N个工频周期之内每个工频周期的负载电流有效值与该N个工频周期的负载电流有效值的平均值进行比较,误差(或波动)幅度均小于设定的相对误差范围E时,判定电气负载进入稳定状态,该最近N个工频周期的起始时刻为启动过程的结束时刻,记录该时刻为T1
将最近N个工频周期之内的负载电流有效值的平均值作为电气负载稳态电流有效值IW;将电气负载开始启动时刻T0至最近N个工频周期起始时刻T1之间的时间作为启动过程时间TS;将T0至T1之内负载电流有效值最大的工频周期所在时刻记录为T2,将T0至T2之间的时间作为启动电流最大值时间TM;将T2所在工频周期的负载电流有效值与电气负载稳态电流有效值IW之间的比值作为启动电流最大值I*。
由于预先不知道电气负载稳态电流有效值IW,因此,将N个工频周期,即一段持续时间TP之内波动范围小于设定的相对误差范围E时的负载电流有效值的平均值作为电气负载稳态电流有效值IW。由于普通电气负载的启动过程较快,所以,TP的取值范围为1-10s,典型取值是2s,相应的工频周期数量N的取值范围为50~500,N的典型取值是100。所述相对误差范围E的取值范围为2%~20%,E的典型取值是10%。
分类器的输入特征还包括电气负载的负载电流频谱特征。电气负载的负载电流频谱特征由信息处理模块102控制信息采集模块101,通过以下步骤获得:
步骤I、待电气负载进入稳定状态后,获取电气负载的稳态电流信号,并将其转换为对应的稳态电流数字信号。
步骤II、对稳态电流数字信号进行傅立叶变换,得到负载电流频谱特性。为保证傅立叶变换的顺利进行,在前述获取电气负载的稳态电流信号,并将其转换为对应的稳态电流数字信号的过程中,A/D转换器的精度和速度需要满足傅立叶变换的要求,采样频率可以设定为10kHz,或者是其他数值;信息处理模块102对采集到的稳态电流数字信号进行FFT运算,计算其频谱。
步骤III、将负载电流频谱特性中的m次奇次谐波信号相对幅值作为负载电流频谱特征,其中,m=3,5,…,M;在组成分类器的输入特征向量时,m次奇次谐波信号相对幅值在输入特征向量中按照3,5,…,M的顺序依次排列。所述谐波信号相对幅值为谐波信号幅值与电气负载稳态电流有效值IW的比值。所述M表示奇次谐波最高次数,M大于等于3。
如图6所示为电气负载类型判断装置进行电气负载类型识别的流程图,电气负载类型判断装置进行电气负载类型识别的方法是:
步骤A、等待电气负载启动;
步骤B、采集电气负载启动电流数据并保存,直至电气负载启动过程结束;
步骤C、分析采集的电气负载启动电流数据,获取电气负载的启动电流特征;
步骤D、采集电气负载稳态工作时的数据并保存;
步骤E、分析采集的电气负载稳态工作时的数据,获取电气负载的负载电流频谱特征;
步骤F、将启动电流特征和负载电流频谱特征作为分类器的输入特征,由分类器进行电气负载类型识别;
步骤G、输出电气负载类型识别结果。
步骤F中的分类器为基于隶属比例平方和的改进决策树分类器,或者是为基于隶属比例和的改进决策树分类器,其构建流程如下:
步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征。
步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化。
步骤⑶、计算当前节点待选择输入特征的信息量IX(p,n)。
步骤⑷、计算当前节点待判别(待识别)电气负载的每个待选择输入特征的信息熵EX(Hi)。
步骤⑸、计算当前节点的每个待选择输入特征的总信息熵E(X)。
步骤⑹、计算当前节点的每个待选择输入特征的信息增益gain(X)。
步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立。
步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属比例平方和,采用隶属比例平方和作为该节点的判别属性,选择其中隶属比例平方和最大的电气负载类型输出;对不是纯净集的输出节点,或者是分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属比例和,采用隶属比例和作为该节点的判别属性,选择其中隶属比例和最大的电气负载类型输出。
用一个简单的4类负载分类实例来说明决策树分类器的构建过程。该4类负载分类实例针对包括启动冲击性电阻类、无启动冲击电阻类、异步电机类、整流滤波类的4类负载,采用启动电流最大值I*、启动电流最大值时间TM、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7作为输入特征进行电气负载类型识别。
步骤⑴中,获取多组电气负载的输入特征样本,是指对每一种相同类别中的各种电气负载均进行数据采集并采用滤波等处理手段,减小各种干扰给测量数据带来的误差影响,例如,剔除粗大误差,减小系统误差和偶然误差的影响,所获取的输入特征样本。例如,每一种相同类别的电气负载均获取200组以上的输入特征样本,或者是每一种相同类别的电气负载均获取500组以上的输入特征样本,等等。随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本,例如,每一种相同类别的电气负载均获取600组的输入特征样本,每一种相同类别的电气负载均随机选择其中的300组输入特征样本作为训练数据样本,其他的300组输入特征样本作为测试数据样本。
步骤⑴中,对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征,区间化之后的输入特征减小了训练数据样本大小对决策树分类的影响,能够很大程度上弥补样本问题造成的训练数据缺失,提高了决策树分类器的分类准确率。表一的区间化输入特征实例1即为4类负载分类实例的区间化结果。在4类负载分类实例中,对4类负载分别获取500组的输入特征样本,每一种相同类别的电气负载均随机选择其中的100组输入特征样本作为训练数据样本。在启动冲击性电阻类负载的100组输入特征训练数据样本中,其启动电流最大值I*的最大值为9.82,最小值为8.51,则启动电流最大值I*的区间化输入特征ΔI*为8.51~9.82;其启动电流最大值时间TM的最大值为0.04,最小值为0.01,启动电流最大值时间TM的区间化输入特征ΔTM为0.01~0.04;其3次谐波相对幅值A3的最大值为2.22,最小值为0.70,3次谐波相对幅值A3的区间化输入特征ΔA3为0.70~2.22;等等;表一中其他数据区间的含义相同,例如,整流滤波类负载7次谐波相对幅值A7的最大值为7.17,最小值为0.89,则其7次谐波相对幅值A7的区间化输入特征ΔA7为0.89~7.17。表一中,各次谐波相对幅值数据是谐波幅值与基波幅值之间的百分比,例如,3次谐波相对幅值A3的最大值为2.22,是指3次谐波幅值为其基波幅值的2.22%。理论上,冲击性电阻类的最大值应该在启动时刻,即TM的理论值为0;实际的区间化输入特征ΔTM为0.01~0.04,是测量导致的时间滞后所致,因为交流信号的有效值无法直接测量,需要进行周期区间测量并间接计算;无冲击电阻类负载等的ΔTM,以及ΔTs等也有类似的情况。
表一 区间化输入特征实例1
步骤⑵中每个特征参数的中间分裂点,是指每个区间化输入特征中,能够将当前节点需要分类的电气负载类型区分的分界点。根节点的待选择作为判别属性的输入特征包括所有6种输入特征,图7为表一区间化输入特征实例1中,在根节点针对启动电流最大值I*的区间化输入特征ΔI*进行区间分段化的示意图。区间1.01~1.35只属于无启动冲击电阻类负载,没有与其他负载的区间化输入特征重叠,区间1.35~1.41为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,所以1.35为根节点区间化输入特征ΔI*的一个中间分裂点;区间1.41~2.31只属于整流滤波类负载,没有与其他负载的区间化输入特征重叠,所以2.31为根节点区间化输入特征ΔI*的一个中间分裂点;区间2.31~4.55为整流滤波类负载与异步电机类的区间化输入特征重叠,所以2.31为根节点区间化输入特征ΔI*的一个中间分裂点;区间4.55~8.51只属于异步电机类负载,没有与其他负载的区间化输入特征重叠,所以2.31为根节点区间化输入特征ΔI*的一个中间分裂点;区间8.51~9.82为启动冲击性电阻类负载与异步电机类的区间化输入特征重叠,所以8.51为根节点区间化输入特征ΔI*的一个中间分裂点;区间9.82~14.22只属于异步电机类负载,没有与其他负载的区间化输入特征重叠,所以9.82为根节点区间化输入特征ΔI*的一个中间分裂点。
步骤⑶中,计算当前节点每个输入特征的信息量的方法是:
式(2)中的X代表该信息量所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征;p为正例集,即p为在当前节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为反例集,即n为在当前节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。
在4类负载分类实例中,根节点的X包括I*、TM、TS、A3、A5、A7。以计算根节点输入特征I*的信息量为例,从图7可知,区间范围p包括:能准确区分无启动冲击电阻类负载的区间1.01~1.35,能准确区分整流滤波类负载的区间1.41~2.31,能准确区分异步电机类负载的区间4.55~8.51和区间9.82~14.22,区间p的大小为:
p=(1.35-1.01)+(2.31-1.41)+(8.51-4.55)+(14.22-9.82)=9.6
区间范围n包括:区间1.35~1.41为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,区间2.31~4.55为整流滤波类负载与异步电机类的区间化输入特征重叠,区间8.51~9.82为启动冲击性电阻类负载与异步电机类的区间化输入特征重叠,n的大小为:
n=(1.41-1.35)×2+(4.55-2.31)×2+(9.82-8.51)×2=7.22
式中各区间值乘以2,是因为各区间参数均有2种负载类型的参数重叠;如果是3种负载类型的参数重叠,则相应的区间需要乘以3,以此类推。将根节点输入特征I*的p、n代入式(2),计算得到根节点输入特征I*能做出正确的类型判别所需的信息量为0.98。
根节点需要计算所有输入特征(即所有属性)的信息量。以计算根节点输入特征TS的信息量为例,图8为表一区间化输入特征实例1中,在根节点针对区间化输入特征ΔTS进行区间分段化的示意图,在步骤⑵所产生的中间分裂点分别为0.12、0.17、0.31、0.51和0.95。从图8可知,区间范围p包括:能准确区分无启动冲击电阻类负载的区间0.12~0.17,能准确区分异步电机类负载的区间0.31~0.51,能准确区分启动冲击性电阻类的区间0.95~6.16,区间p的大小为:
p=(0.17-0.12)+(0.51-0.31)+(6.16-0.95)=5.46
区间范围n包括:区间0.02~0.12为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,区间0.51~0.95为启动冲击性电阻类负载与异步电机类的区间化输入特征重叠,n的大小为:
n=(0.12-0.02)×2+(0.95-0.51)×2=1.08
将根节点输入特征TS的p、n代入式(2),计算得到根节点输入特征TS能做出正确的类型判别所需的信息量为0.65。采用同样方法,可以计算出根节点其他输入特征启动电流最大值时间TM、3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7的信息量。
当前节点不是根节点时,无需计算所有当前节点之前所有父节点中已经被作为判别属性使用的输入特征的信息量。例如,假设根节点使用的判别属性(即分类属性)为输入特征启动电流最大值时间TM时,根节点的下一级子节点的待选择输入特征包括启动电流最大值I*、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7等5种输入特征,只需要计算该5种输入特征的信息量,无需计算已经被作为判别属性使用的启动电流最大值时间TM的信息量。在进行子节点输入特征的信息量计算时,其正例集、反例集中不包括在当前节点之前已经被排除的电气负载类型,而只包括属于该节点待判别的电气负载类型。例如,假设根节点使用的判别属性为输入特征TM,在根节点,ΔTM的中间分裂点包括0.03、0.04;设该子节点的代号为Q,其输入特征TM属性区间为0.01~0.03,该属性区间明确排除的电气负载类型为异步电机类负载,只属于该节点待判别的电气负载类型为无启动冲击电阻类负载、启动冲击性电阻类负载和整流滤波类负载。图9为表一区间化输入特征实例1中,排除异步电机类负载后针对区间化输入特征ΔTS进行区间分段化的示意图,在步骤⑵所产生的中间分裂点分别为0.12、0.17和0.51。从图9可知,TS的区间范围p包括:能准确区分无启动冲击电阻类负载的区间0.12~0.17和能准确区分启动冲击性电阻类负载的区间0.51~6.16,区间p的大小为:
p=(0.17-0.12)+(6.16-0.51)=5.7
区间范围n包括:区间0.02~0.12为无启动冲击电阻类负载与整流滤波类负载的区间化输入特征重叠,n的大小为:
n=(0.12-0.02)×2=0.2
将该子节点输入特征TS的p、n代入式(2),计算得到该子节点输入特征TS能做出正确的类型判别所需的信息量为0.21。图10为表一区间化输入特征实例1中,排除异步电机类负载后针对区间化输入特征ΔA7进行区间分段化的示意图,在步骤⑵所产生的中间分裂点分别为0.23、0.29、0.34和0.89。从图10可知,A7的区间范围p包括:能准确区分无启动冲击电阻类负载的区间0.12~0.17和能准确区分启动冲击性电阻类负载的区间0.20~0.23和0.29~0.34,以及能准确区分整流滤波类负载的区间0.89~7.17,区间p的大小为:
p=(0.23-0.2)+(0.34-0.29)+(7.17-0.89)=6.36
区间范围n包括:区间0.23~0.29为无启动冲击电阻类负载与启动冲击性电阻类负载的区间化输入特征重叠,n的大小为:
n=(0.29-0.23)×2=0.12
将该子节点输入特征A7的p、n代入式(2),计算得到该子节点输入特征A7能做出正确的类型判别所需的信息量为0.13。
采用同样方法,可以计算出该子节点其他输入特征启动电流最大值I*、3次谐波相对幅值A3、5次谐波相对幅值A5的信息量。其他子节点的计算方法相同。
步骤⑷中,计算当前节点待判别电气负载的每个输入特征的信息熵E(Hi)的方法是:
式(3)中的X代表该信息熵所针对的输入特征,X包括且只包括属于当前节点待选择的输入特征;i代表该信息熵所针对的电气负载类型,i包括且只包括属于当前节点待判别的电气负载类型;Pi为该电气负载类型所包含的正例,即输入特征X的区间范围Hi中与该节点待选择的其他输入特征均不重叠的区间范围;Ni为该电气负载类型所包含的反例,即输入特征X的区间范围Hi中与当前节点待选择的其他输入特征相重叠的区间范围。
在4类负载分类实例中,计算根节点的信息熵时,需要区分4种电气负载类型,i等于1、2、3、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载、整流滤波类负载;需要针对6种输入特征分别计算4种电气负载类型的信息熵,X包括I*、TM、TS、A3、A5、A7。以输入特征I*作为决策树的根时,I*将电气负载类型的区间范围H分为4个子集,包括启动冲击性电阻类负载的区间范围H1(8.51~9.82),无启动冲击电阻类负载的区间范围H2(1.01~1.41),异步电机类负载的区间范围H3(2.31~14.22),整流滤波类负载的区间范围H4(1.31~4.55);每种电气负载类型Hi中含有Pi个正例和Ni个反例,根节点针对输入特征I*时各类电气负载Hi的信息熵为:
根节点输入特征I*的启动冲击性电阻类负载的区间范围H1(8.51~9.82)全部被包括在异步电机类负载H3(2.31~14.22)之中,故P1=0,N1=9.82-8.51=1.31,将P1、N1代入式(3)中,有
即根节点输入特征I*的启动冲击性电阻类负载的信息熵
根节点输入特征I*的无启动冲击电阻类负载的区间范围H2(1.01~1.41)与另外3种负载类型均不重叠的区间是(1.01~1.35),即P2=1.35-1.01=0.34,而区间(1.35~1.41)则与整流滤波类负载重叠,即N2=1.41-1.35=0.06,将P2、N2代入式(3)中,得到根节点输入特征I*的无启动冲击电阻类负载的信息熵
根节点输入特征I*的异步电机类负载的区间范围H3(2.31~14.22)中,与另外3种负载类型均不重叠的区间是P3=(14.22-9.82)+(8.51-4.55)=8.36,而区间(2.31~4.55)与整流滤波类负载重叠,区间(8.51~9.82)与启动冲击性电阻类负载重叠,即N3=(4.55-2.31)+(9.82-8.51)=3.55,将P3、N3代入式(3)中,得到根节点输入特征I*的异步电机类负载的信息熵同样地,可以计算出根节点输入特征I*的整流滤波类负载的信息熵
以输入特征TM作为决策树的根时,TM将电气负载类型的区间范围H分为4个子集,包括启动冲击性电阻类负载的区间范围H1(0.01~0.04),无启动冲击电阻类负载的区间范围H2(0.01~0.03),异步电机类负载的区间范围H3(0.03~0.12),整流滤波类负载的区间范围H4(0.01~0.04);每种电气负载类型Hi中含有Pi个正例和Ni个反例,根节点针对输入特征TM时各类电气负载Hi的信息熵为:
根节点输入特征TM的启动冲击性电阻类负载的区间范围H1(0.01~0.04)与整流滤波类负载的区间范围H4(0.01~0.04)完全重叠,无启动冲击电阻类负载的区间范围H2(0.01~0.03)被完全包括在启动冲击性电阻类负载的区间范围H1(0.01~0.04)中,故根节点输入特征TM的启动冲击性电阻类负载的信息熵无启动冲击电阻类负载的信息熵整流滤波类负载的信息熵均为0。
根节点输入特征TM的异步电机类负载的区间范围H3(0.03~0.12)中,与另外3种负载类型均不重叠的区间是(0.04~0.12),故P3=0.12-0.04=0.08,而区间(0.03~0.04)与其他类负载重叠,即N3=0.04-0.03=0.01,将P3、N3代入式(3)中,得到根节点输入特征TM的异步电机类负载的信息熵
以输入特征TS作为决策树的根时,依据上述方法,计算出根节点输入特征TS的启动冲击性电阻类负载的信息熵无启动冲击电阻类负载的信息熵异步电机类负载的信息熵整流滤波类负载的信息熵依据上述方法,同样能够计算出根节点输入特征3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7分别针对启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载的信息熵、整流滤波类负载的信息熵。
当前节点不是根节点时,无需计算所有当前节点之前的所有父节点中已经被作为判别属性使用的输入特征的信息熵。例如,假设根节点使用的判别属性为输入特征启动电流最大值时间TM时,根节点的下一级子节点的待选择输入特征包括启动电流最大值I*、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7等5种输入特征,只需要计算该5种输入特征的信息熵,无需计算已经被作为判别属性使用的启动电流最大值时间TM的信息熵。在进行子节点输入特征的信息熵计算时,其正例集PE、反例集NE不包括在当前节点之前已经被排除的电气负载类型,而只包括属于该节点待判别的电气负载类型,当前节点之前已经被排除的电气负载类型针对该节点所有待选择输入特征的信息熵直接定义为0。例如,假设根节点使用的判别属性为输入特征TM,在根节点,ΔTM的中间分裂点包括0.03、0.04;设子节点Q的输入特征TM属性区间为0.01~0.03,该属性区间明确排除的电气负载类型为异步电机类负载,只属于该节点待判别的电气负载类型为启动冲击性电阻类负载、无启动冲击电阻类负载和整流滤波类负载,则该子节点只需要区分包括启动冲击性电阻类负载、无启动冲击电阻类负载和整流滤波类负载在内的3种电气负载类型,需要针对启动电流最大值I*、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7等5种输入特征分别计算启动冲击性电阻类负载、无启动冲击电阻类负载和整流滤波类负载的信息熵。采用式(3)计算时,i等于1、2、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、整流滤波类负载;X包括I*、TS、A3、A5、A7均被直接定义为0。
以输入特征TS作为该子节点Q的判别属性为例,此时TS将电气负载类型的区间范围H分为3个子集,包括启动冲击性电阻类负载的区间范围H1(0.51~6.16),无启动冲击电阻类负载的区间范围H2(0.02~0.17),整流滤波类负载的区间范围H4(0.02~0.12);输入特征A7的启动冲击性电阻类负载的区间范围H1(0.51~6.16)与另外2种负载类型均不重叠,即P1=5.65,N1=0,将P1、N1代入式(3)中,得到该子节点输入特征TS的启动冲击性电阻类负载的信息熵输入特征TS的无启动冲击电阻类负载的区间范围H2(0.02~0.17)中,与另外2种负载类型均不重叠的区间是(0.12~0.17),即P2=0.05,N2=0.10,将P2、N2代入式(3)中,得到该子节点输入特征TS的无启动冲击电阻类负载的信息熵整流滤波类负载的区间范围H4(0.02~0.12)全部被包含在无启动冲击电阻类负载的区间范围H2(0.02~0.17)中,故P4=0,N4=0.1,将P4、N4代入式(3)中,得到该子节点输入特征A7的整流滤波类负载的信息熵
以输入特征A7作为该节点Q的判别属性为例,此时A7将电气负载类型的区间范围H分为3个子集,包括启动冲击性电阻类负载的区间范围H1(0.20~0.34),无启动冲击电阻类负载的区间范围H2(0.23~0.29),整流滤波类负载的区间范围H4(0.89~7.17);输入特征A7的启动冲击性电阻类负载的区间范围H1(0.20~0.34)中,与另外2种负载类型均不重叠的区间是(0.20~0.23)和(0.29~0.34),即P1=0.08,与无启动冲击电阻类负载重叠的区间是(0.23~0.29),即N1=0.06,将P1、N1代入式(3)中,得到该子节点输入特征A7的启动冲击性电阻类负载的信息熵 输入特征A7的无启动冲击电阻类负载的区间范围H2(0.23~0.29)中,没有与另外2种负载类型均不重叠的区间,即P2=0,H2(0.23~0.29)被全部包括在启动冲击性电阻类负载的区间范围中,即N2=0.06,将P2、N2代入式(3)中,得到该子节点输入特征A7的启动冲击性电阻类负载的信息熵整流滤波类负载的区间范围H4(0.89~7.17)全部与另外2种负载类型均不重叠,故P4=7.17-0.89=6.28,N4=0,将P4、N4代入式(3)中,得到该子节点输入特征A7的整流滤波类负载的信息熵采用同样方法,可以计算出该子节点其他输入特征启动电流最大值I*、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5分别针对启动冲击性电阻类负载、无启动冲击电阻类负载、整流滤波类负载的信息熵。其他子节点的计算方法相同。
步骤⑸中,计算当前节点的每个待选择输入特征的总信息熵E(X)的方法是:
式(4)中的X代表该信息熵(总信息熵)所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征;i代表待识别的某种电气负载类型,k代表需分类的电气负载类型的种类数,在4类负载分类实例中,k等于4;Pi为与i所代表电气负载类型所包含的正例,即输入特征X的区间范围Hi中与该节点待选择的其他输入特征均不重叠的区间范围;Ni为与i所代表电气负载类型所包含的反例,即输入特征X的区间范围Hi中与当前节点待选择的其他输入特征相重叠的区间范围;Pi+Ni为i所代表电气负载类型中输入特征X的区间范围大小;p为在该节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在该节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。
当前节点以根节点为例,i等于1、2、3、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载、整流滤波类负载。以I*作为根节点的判别属性时, 分别等于0、0.61、0.89、0.87,其总信息熵E(I*)为
以TM作为根节点的判别属性时,分别等于0、0、0.51、0,其总信息熵E(TM)为
以TS为根节点判别属性的总信息熵E(TS)为
采用同样方法,可以分别计算出根节点其他输入特征,即3次谐波相对幅值A3、5次谐波相对幅值A5和7次谐波相对幅值A7的总信息熵。
当前节点以前述代号为Q的子节点为例,i等于1、2、3、4分别代表启动冲击性电阻类负载、无启动冲击电阻类负载、异步电机类负载、整流滤波类负载。此时,分别计算出等于0、0.92、0,被定义为0,计算信息量时的p、n分别为5.7、0.2,则以TS为该子节点Q判别属性的总信息熵E(TS)为
分别计算出等于0.99、0、0,被定义为0,计算信息量时的p、n分别为6.36、0.12,则以A7为该子节点Q判别属性的总信息熵E(A7)为
采用同样方法,可以分别计算出该节点其他输入特征,即启动电流最大值I*、3次谐波相对幅值A3和5次谐波相对幅值A5的总信息熵。其他子节点的计算方法相同。
步骤⑹中,计算当前节点的每个待选择输入特征的信息增益gain(X)的方法是:
gain(X)=IX(p,n)-E(X) (5)
式(5)中的X代表该信息熵(总信息熵)所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征。
以当前节点是根节点为例,以I*作为根节点的判别属性时,其信息增益gain(I*)为
以TS作为根节点的判别属性时,其信息增益gain(I*)为
采用同样的方法,可以计算出根节点分别以TM、A3、A5、A7作为根节点判别属性时的信息增益。
以当前节点是前述子节点Q为例,以TS为该子节点的判别属性时,其信息增益gain(TS)为
以A7为该子节点Q的判别属性时,其信息增益gain(A7)为
采用同样的方法,可以计算出子节点Q分别以I*、A3、A5作为该子节点判别属性时的信息增益。其他子节点的计算方法相同。
步骤⑺中,形成分支完成当前节点的建立时,分支数量与被选择作为判别属性的区间化输入特征被步骤⑵中得到的中间分裂点,进行区间分段化得到的区间分段数量有关。以当前节点是根节点为例,如图7所示,决策树最终以I*作为根节点的判别属性时,区间分段数量为7段,形成的分支数量为9个,其中有2个为I*在ΔI*之外所形成的分支,实际分类时,由于采样干扰导致出现误差,或者是训练数据不完整,造成待判别电气负载数据的I*小于1.01,或者是大于14.22时,由其他输入特征实现分类;如图8所示,决策树最终以TS作为根节点的判别属性时,区间分段数量为6段,形成的分支数量为8个,其中的3个分支为训练数据中,没有任何电气负载类型有数据分布的区间段所形成的分支,实际分类时,由于采样干扰导致出现误差,或者是训练数据不完整,造成待判别电气负载数据的TS采样值落于区间段(0.17~0.31),或者是小于0.02,或者是大于6.16时,由其他输入特征实现分类。以当前节点是前述子节点Q为例,如图9所示,以TS作为该子节点的判别属性时,区间分段数量为4段,形成的分支数量为6个;如图10所示,以A7作为该子节点的判别属性时,区间分段数量为5段,形成的分支数量为7个。
步骤⑺中,完成所有判别分支建立的判别依据是,新节点没有未使用的输入特征,或分类结果为确定的电气负载类型,则已经完成所有判别分支的建立。
步骤⑻中,不是纯净集的输出节点,指的是该输出节点输出的识别结果不是唯一的电气负载类型,而是为2种或者2种以上电气负载类型,或者未能给出识别的电气负载类型。
2种情况会导致最终节点输出的识别结果不是唯一的电气负载类型。一是2种或者是2种以上电气负载类型的所有区间化输入特征均存在重叠区域,分类时,所有输入特征均落入相应的重叠区域;例如,在表一给出的4类负载分类实例数据中,启动冲击性电阻类负载与异步电机类负载在启动电流最大值I*、启动电流最大值时间TM、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5、7次谐波相对幅值A7等6个区间化输入特征均存在重叠区域,ΔI*的重叠区域是(8.51~9.82),ΔTM的重叠区域是(0.03~0.04),ΔTS的重叠区域是(0.51~0.95),ΔA3的重叠区域是(0.86~2.22),ΔA5的重叠区域是(0.69~0.86),ΔA7的重叠区域是(0.29~0.34),设输入特征I*、TM、TS、A3、A5、A7的实际输入值分别是9、0.032、0.7、1.2、0.75、0.3时,无法完成分类。另外一种是2种或者是2种以上电气负载类型的部分区间化输入特征存在重叠区域,分类时,输入特征中的该部分输入特征均落入相应的重叠区域,而另外的输入特征均落入相应的区间化输入特征的有效区间之外;例如,在表一给出的4类负载分类实例数据中,异步电机类负载与整流滤波类负载中,ΔI*的重叠区域是(2.31~4.55),ΔTM的重叠区域是(0.03~0.04),ΔA3的重叠区域是(3.90~8.14),ΔA5的重叠区域是(1.17~3.78),ΔA7的重叠区域是(0.89~2.23)),输入特征I*、TM、A3、A5、A7的实际输入值分别是3.1、0.036、5.2、2.75、1.3,均在相应的重叠区域,而输入特征的实际输入值是0.18,落入相应的输入特征的有效区间之外时,无法完成分类。
计算输入特征在电气负载类型中的隶属比例的方法是:
式(6)中的X代表该隶属比例所针对的输入特征,i代表所针对的电气负载类型,即ri(X)代表输入特征X在i所代表电气负载类型中的隶属比例;d0为输入特征X在i所代表电气负载类型区间化输入特征的区间中心值,d1为输入特征X在i所代表电气负载类型区间化输入特征的区间下限值,d为输入特征X的实际输入值。
例如,设输入特征I*、TM、TS、A3、A5、A7的实际输入值分别是9、0.032、0.7、1.2、0.75、0.3;启动冲击性电阻类负载中ΔI*的区间中心值为9.165,下限值为8.51,此时启动冲击性电阻类负载中I*的隶属比例是:
启动冲击性电阻类负载中ΔTM的区间中心值为0.025,下限值为0.01,此时启动冲击性电阻类负载中TM的隶属比例是:
异步电机类负载中ΔTM的区间中心值为0.075,下限值为0.03,此时异步电机类负载中TM的隶属比例是:
异步电机类负载中ΔA7的区间中心值为1.26,下限值为0.29,此时异步电机类负载中A7的隶属比例是:
采用同样的方法,可以计算出此时启动冲击性电阻类负载中TS的隶属比例r1(TS),A3的隶属比例r1(A3),A5的隶属比例r1(A5),A7的隶属比例r1(A7),以及异步电机类负载中I*的隶属比例r3(I*),TS的隶属比例r3(TS),A3的隶属比例r3(A3),A5的隶属比例r3(A5)。
采用隶属比例平方和作为该节点的判别属性,选择其中隶属比例平方和最大的电气负载类型输出时,所有输入特征针对启动冲击性电阻类负载的隶属比例平方和为
R1=r1 2(I*)+r1 2(TM)+r1 2(TS)+r1 2(A3)+r1 2(A5)+r1 2(A7);
所有输入特征针对异步电机类负载的隶属比例平方和为
R3=r3 2(I*)+r3 2(TM)+r3 2(TS)+r3 2(A3)+r3 2(A5)+r3 2(A7);
依据实际的输入特征进行分类,当输入的所有输入特征均处于重叠区域,决策树无法利用中间分裂点实现分类时,若R1比R3大,则选择启动冲击性电阻类负载为当前实际输入特征所对应的输出类型;若R3比R1大,则选择异步电机类负载为当前实际输入特征所对应的输出类型。
采用隶属比例和作为该节点的判别属性,选择其中隶属比例和最大的电气负载类型输出时,所有输入特征针对启动冲击性电阻类负载的隶属比例和为
R1′=r1(I*)+r1(TM)+r1(TS)+r1(A3)+r1(A5)+r1(A7);
所有输入特征针对异步电机类负载的隶属比例和为
R3′=r3(I*)+r3(TM)+r3(TS)+r3(A3)+r3(A5)+r3(A7);
依据实际的输入特征进行分类,当输入的所有输入特征均处于重叠区域,决策树无法利用中间分裂点实现分类时,若R1′比R3′大,则选择启动冲击性电阻类负载为当前实际输入特征所对应的输出类型;若R3′比R1′大,则选择异步电机类负载为当前实际输入特征所对应的输出类型。
例如,设输入特征I*、TM、TS、A3、A5、A7的实际输入值分别是3.1、0.036、0.18、5.2、2.75、1.3;异步电机类负载中ΔTM的区间中心值为0.075,下限值为0.03,此时异步电机类负载中TM的隶属比例是:
异步电机类负载中ΔTS的区间中心值为0.63,下限值为0.31,此时异步电机类负载中TS的隶属比例是:
r3(TS)=0
整流滤波类负载中ΔI*的区间中心值为2.95,下限值为1.35,此时整流滤波类负载中I*的隶属比例是:
整流滤波类负载中ΔTS的区间中心值为0.07,下限值为0.02,此时整流滤波类负载中TS的隶属比例是:
r4(TS)=0
采用同样的方法,可以计算出此时异步电机类负载中I*的隶属比例r3(I*),A3的隶属比例r3(A3),A5的隶属比例r3(A5),A7的隶属比例r3(A7),以及整流滤波类负载中TM的隶属比例r4(TM),A3的隶属比例r4(A3),A5的隶属比例r4(A5),A7的隶属比例r4(A7)。
采用隶属比例平方和作为该节点的判别属性,选择其中隶属比例平方和最大的电气负载类型输出时,所有输入特征针对异步电机类负载的隶属比例平方和为
R3=r3 2(I*)+r3 2(TM)+r3 2(TS)+r3 2(A3)+r3 2(A5)+r3 2(A7);
针对整流滤波类负载的隶属比例平方和为
R4=r4 2(I*)+r4 2(TM)+r4 2(TS)+r4 2(A3)+r4 2(A5)+r4 2(A7);
此时,若R4比R3大,则选择整流滤波类负载为当前实际输入特征所对应的输出类型;若R3比R4大,则选择异步电机类负载为当前实际输入特征所对应的输出类型。
采用隶属比例和作为该节点的判别属性,选择其中隶属比例和最大的电气负载类型输出时,所有输入特征针对异步电机类负载的隶属比例和为
R3′=r3(I*)+r3(TM)+r3(TS)+r3(A3)+r3(A5)+r3(A7);
针对整流滤波类负载的隶属比例和为
R4′=r4(I*)+r4(TM)+r4(Ts)+r4(A3)+r4(A5)+r4(A7);
此时,若R4′比R3′大,则选择整流滤波类负载为当前实际输入特征所对应的输出类型;若R3′比R4′大,则选择异步电机类负载为当前实际输入特征所对应的输出类型。
分类过程中,当某个输入特征实际值落入相应的输入特征的有效区间之外时,该输入特征的实际值可能为粗大误差值,让该输入特征的隶属比例值固定选择为0值,避免隶属比例值小于0,消除该输入特征对隶属比例平方和(或者是隶属比例和)大小的影响;此时,不同电气负载类型的隶属比例平方和大小,或者是隶属比例和大小,只由其他处于重叠区域输入特征的隶属比例值来决定。选择求隶属比例的平方和,可以让输入特征离区间中心值越近,在隶属比例平方和中起的作用越大,相应电气负载类型被选择的机会就越大。输入特征离区间中心值越远,则其在隶属比例平方和中起的作用越小,相应电气负载类型被选择的机会就越小。输入特征落入输入特征的有效区间之外,则其在隶属比例平方和,或者是隶属比例和中不起作用,不会增加相应电气负载类型被选择的机会。
上述决策树分类器的构建过程中,步骤⑴至步骤⑺构建了一个基本决策树分类器,步骤⑻在基本决策树分类器的基础上进行扩充,构建了一个基于隶属比例平方和(或者是隶属比例和)的改进决策树分类器,对无法直接利用具有明确分界的中间分裂点实现分类时,按照正态分布法则,输入特征离中心近,隶属比例值大(隶属度高),通过分析、判别所有输入特征的综合隶属特性,采用隶属比例平方和(或者是隶属比例和)作为其判别属性,实现电气负载类型的分类。
为方便进行计算与说明,4类负载分类实例比较简单。在无启动冲击电阻类负载、启动冲击性电阻类负载、异步电机类负载和整流滤波类负载之外,电气负载类型还有阻感类负载、直流电机类负载等;另外,整流滤波类负载还可以进一步细分为计算机类负载、开关电源类负载、变频器类负载等,异步电机类负载可以进一步细分为鼠笼式异步电机类负载、绕线式异步电机类负载等。当需要分类的电气负载类型种类增加时,区间化输入特征均存在重叠区域的情况更加明显与复杂,此时,仅依靠上述扩展决策树分类器,无法得到很好的分类效果。为达到更好的分类效果,输入特征还可以全部或者部分增加9次谐波相对幅值A9,11次谐波相对幅值A11,以及基波电压电流相位差等特征量;或者是在基于隶属比例平方和(或者是隶属比例和)的改进决策树分类器基础上,构建基于隶属比例平方和(或者是隶属比例和)和贝叶斯的复合优化决策树分类器。当输入特征中还需包括基波电压电流相位差时,信息采集模块还需要包括有电压传感器来检测负载电压,信息处理模块同时对负载电压与负载电流进行连续采样,并通过分析计算,得到基波电压电流相位差。
表二的区间化输入特征实例2为5类负载分类实例的区间化结果。5类负载包括启动冲击性电阻类、无启动冲击电阻类、异步电机类、整流滤波类、阻感类,采用启动电流最大值I*、启动电流最大值时间TM、启动过程时间TS、3次谐波相对幅值A3、5次谐波相对幅值A5、基波电压电流相位差Φ作为输入特征进行电气负载类型识别。Φ的单位是弧度,基波电压相位比电流相位超前时,Φ为正值。
表二区间化输入特征实例2
以计算此时根节点输入特征I*的信息量为例,区间p的大小为:
p=(1.02-1.01)+(2.31-1.74)+(8.51-4.55)+(14.22-9.82)=9.94
区间范围n的大小为:
n=(1.35-1.02)×2+(1.41-1.35)×3+(1.74-1.41)×2+(4.55-2.31)×2+(9.82-8.51)×2=8.6
将此时根节点输入特征I*的p、n代入式(2),计算得到根节点输入特征I*能做出正确的类型判别所需的信息量为0.996。根节点其他输入特征,以及非根节点输入特征信息量同样可以计算出来。
根节点输入特征TM的阻感类负载的区间范围H5(0.02~0.34)中,与另外4种负载类型均不重叠的区间是P3=0.34-0.12=0.22,与另外4种负载类型重叠的区间是(0.01~0.12),N3=0.11,将P3、N3代入式(3)中,得到根节点输入特征TM的阻感类负载的信息熵根节点其他输入特征针对不同负载类型,以及非根节点输入特征针对不同负载类型的信息熵同样可以计算出来。
基于隶属比例平方和和贝叶斯的复合优化决策树分类器,或者是基于隶属比例和和贝叶斯的复合优化决策树分类器的构建流程如下:
步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征。
步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化。
步骤⑶、计算当前节点待选择输入特征的信息量IX(p,n)。
步骤⑷、计算当前节点待判别电气负载的每个待选择输入特征的信息熵EX(Hi)。
步骤⑸、计算当前节点的每个待选择输入特征的总信息熵E(X)。
步骤⑹、计算当前节点的每个待选择输入特征的信息增益gain(X)。
步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立。
步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属比例平方和,采用隶属比例平方和作为该节点的判别属性,选择其中隶属比例平方和最大的电气负载类型输出;对不是纯净集的输出节点,或者是分别计算所有输入特征针对该节点所有待识别电气负载类型的隶属比例和,采用隶属比例和作为该节点的判别属性,选择其中隶属比例和最大的电气负载类型输出。
步骤⑼、采用步骤⑴获取的电气负载样本输入特征中的训练数据样本,训练并建立贝叶斯分类器。
步骤⑽、记录步骤⑻中所有采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性的节点,准备进行分类优化。
步骤⑾、选择一个采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性,未进行分类优化的节点进行分类优化,方法是,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性时的总电气负载识别准确率;该节点使用贝叶斯分类器分类,替代该节点采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性的方法,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率;选择采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性和使用贝叶斯分类器分类两者中总电气负载识别准确率高的方法作为该节点进行电气负载类型识别的方法。
步骤⑿、若步骤⑻中所有采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性的节点未全部完成分类优化,返回步骤⑾;若步骤⑻中所有采用隶属比例平方和(或者是采用隶属比例和)作为节点判别属性的节点全部完成分类优化,完成复合优化决策树分类器的构造。
步骤⑻中,当选择采用隶属比例平方和作为该节点的判别属性时,则采用隶属比例和作为该节点的判别属性不会被使用;步骤⑻中,当选择采用隶属比例和作为该节点的判别属性时,则采用隶属比例平方和作为该节点的判别属性不会被使用。当步骤⑻中采用隶属比例平方和作为该节点的判别属性时,步骤⑽、步骤⑾和步骤⑿中的采用隶属比例平方和(或者是采用隶属比例和)为采用隶属比例平方和;当步骤⑻中采用隶属比例和作为该节点的判别属性时,步骤⑽、步骤⑾和步骤⑿中的采用隶属比例平方和(或者是采用隶属比例和)为采用隶属比例和。
贝叶斯分类器可以选择NBC分类器(朴素贝叶斯分类器)、TAN分类器(树扩展朴素贝叶斯分类器)、BAN分类器(增强的贝叶斯分类器)等三种贝叶斯分类器之中的一种。以朴素贝叶斯分类器为例,其定义如下:
⑴设x={a1,a2,…,am}为一个待识别项,而每个a为x的一个特征属性;
⑵有类别集合C={y1,y2,…,yn};
⑶计算P(y1|x),P(y2|x),…,P(yn|x);
⑷如果P(yk|x)=max{P(y1|x),P(y2|x),…,P(yn|x)|,则x∈yk
计算第⑶步中的各个条件概率的具体方法是:
①找到一个已知分类的待识别项集合作为训练样本集;
②统计得到各类别下各个特征属性的条件概率估计;
P(a1|y1),P(a2|y1),…,P(am|y1);
P(a1|y2),P(a2|y2),…,P(am|y2);
…;
P(a1|yn),P(a2|yn),…,P(am|yn)。
③根据贝叶斯定理,有:
且:
步骤⑼中,训练并建立贝叶斯分类器的方法是:
步骤①、对某个输入特征属性进行分段划分,即进行离散化处理。
步骤②、将步骤⑴中的训练数据样本作为贝叶斯分类器的训练数据样本;计算每类电气负载类型训练数据样本在所有电气负载类型训练数据样本中所占有的比例。
步骤③、计算训练样本每个类型(类别)条件下各个输入特征属性分段的比例(频率),统计得到各类型(类别)下各个输入特征属性的条件概率估计。
以4类负载分类实例来具体说明训练并建立贝叶斯分类器的方法。复合优化决策树分类器的输入特征是{I*,TM,TS,A3,A5,A7},令贝叶斯分类器的特征属性组合x={a1,a2,a3,a4,a5,a6}中的元素与复合优化决策树分类器的输入特征集合中的元素按序{TS,I*,TM,A1,A3,IW}一一对应;贝叶斯分类器的输出类别集合C={y1,y2,y3,y4}则分别与无启动冲击电阻类负载、启动冲击性电阻类负载、异步电机类负载、整流滤波类负载一一对应。
步骤①中,采取的输入特征属性离散化方法是:
a1:{a1<4,4≤a1≤7,a1>7};
a2:{a2<0.035,a2≥0.35};
a3:{a3<0.3,0.3≤a3≤1,a3>1};
a4:{a4<3,3≤a4≤10,a4>10};
a5:{a5<1.1,1.1≤a5≤3.9,a5>3.9};
a6:{a6<0.31,0.31≤a6≤2.3,a6>2.3}。
步骤②中,需要分别计算P(y1)、P(y2)、P(y3)、P(y4)。当每类电气负载均采集相同的样本数量时,例如,对4类负载分别获取500组输入特征样本,其中每类电气负载类型随机选择100组样本作为训练数据样本,其他则作为测试数据样本,总的训练数据样本为400组,则有
P(y1)=P(y2)=P(y3)=P(y4)=0.25。
步骤③中,计算训练样本每个类型(类别)条件下各个输入特征属性分段的比例(频率),统计得到各类型(类别)下各个输入特征属性的条件概率估计,即分别统计计算
P(a1<4|y1)、P(4≤a1≤7|y1)、P(a1>7|y1);
P(a1<4|y2)、P(4≤a1≤7|y2)、P(a1>7|y2);
P(a1<4|y3)、P(4≤a1≤7|y3)、P(a1>7|y3);
P(a1<4|y4)、P(4≤a1≤7|y4)、P(a1>7|y4);
P(a2<0.035|y1)、P(a2≥0.035|y1);
P(a2<0.035|y2)、P(a2≥0.035|y2);
P(a2<0.035|y3)、P(a2≥0.035|y3);
P(a2<0.035|y4)、P(a2≥0.035|y4)。
P(a3<0.3|y1)、P(0.3≤a3≤1|y1)、P(a3>1|y1);
P(a3<0.3|y2)、P(0.3≤a3≤1|y2)、P(a3>1|y2);
P(a3<0.3|y3)、P(0.3≤a3≤1|y3)、P(a3>1|y3);
P(a3<0.3|y4)、P(0.3≤a3≤1|y4)、P(a3>1|y4);
P(a4<3|y1)、P(3≤a4≤10|y1)、P(a4>10|y1);
P(a4<3|y2)、P(3≤a4≤10|y2)、P(a4>10|y2);
P(a4<3|y3)、P(3≤a4≤10|y3)、P(a4>10|y3);
P(a4<3|y4)、P(3≤a4≤10|y4)、P(a4>10|y4);
P(a5<1.1|y1)、P(1.1≤a5≤3.9|y1)、P(a5>3.9|y1);
P(a5<1.1|y2)、P(1.1≤a5≤3.9|y2)、P(a5>3.9|y2);
P(a5<1.1|y3)、P(1.1≤a5≤3.9|y3)、P(a5>3.9|y3);
P(a5<1.1|y4)、P(1.1≤a5≤3.9|y4)、P(a5>3.9|y4);
P(a6<0.31|y1)、P(0.31≤a6≤2.3|y1)、P(a6>2.3|y1);
P(a6<0.31|y2)、P(0.31≤a6≤2.3|y2)、P(a6>2.3|y2);
P(a6<0.31|y3)、P(0.31≤a6≤2.3|y3)、P(a6>2.3|y3);
P(a6<0.31|y4)、P(0.31≤a6≤2.3|y4)、P(a6>2.3|y4)。
经过上述的步骤①、步骤②、步骤③,贝叶斯分类器训练完成。其中,步骤①对输入特征属性进行分段划分由人工确定,对每一个输入特征进行分段离散化时,分段的数量为2段或者2段以上,例如,特征a2分为2段,其余特征都分为3段。每一个特征具体分为多少段,分段阈值的选择可以根据训练后的贝叶斯分类器对测试数据样本测试后的结果进行调整。当待识别的电气负载类型增多时,可以增加分段的数量,提高贝叶斯分类器的分类精度。步骤①对输入特征属性的分段,与复合优化决策树分类器步骤⑵中将区间化输入特征的区间分段化不同,步骤①的分段考虑了输入特征的所有取值区间,避免了因为训练数据样本覆盖不全,造成部分输入特征均落入相应的区间化输入特征的有效区间之外,而另外的输入特征均落入相应的区间化输入特征重叠区域,仅靠将区间化输入特征的区间分段化无法完全实现决策分类的情况。步骤②、步骤③由信息处理模块102或者是计算机计算完成。
步骤⑾中,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,是指将多组测试数据样本分组依次输入至复合优化决策树分类器。例如,4类负载分类实例中有400组测试数据样本,将400组测试数据样本,分400次,依次输入至复合优化决策树分类器。统计该节点采用某种方法的总电气负载识别准确率,是指在多组测试数据样本中,该节点采用该方法时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本数与总测试数据样本数的百分比值;例如,在400组测试数据样本中,该节点采用某种方法时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本是370个,则该节点采用该方法时的总电气负载识别准确率为92.5%。
步骤⑾中,节点使用贝叶斯分类器分类的方法是:
步骤㈠、将复合优化决策树分类器的输入特征作为贝叶斯分类器的输入特征。
步骤㈡、按照式
计算每种电气负载类别的后验概率,其中
步骤㈢、针对该节点所有待识别电气负载类型,选择其中后验概率最大的电气负载类型输出。
以4类负载分类实例进行说明。
步骤㈠中,将复合优化决策树分类器的输入特征集合{I*,TM,TS,A3,A5,A7}作为贝叶斯分类器的输入特征x,且有x={a1,a2,a3,a4,a5,a6}。
步骤㈡中,因为每类电气负载类型的训练数据样本数量均为100组,分母P(x)对于所有电气负载类别为相等常数,令P(x)=1替代实际的P(x)值,不影响每种电气负载类别后验概率之间的相互大小比较,此时有
即有
步骤㈡中,计算每种电气负载类别的后验概率,可以是计算所有电气负载类别的后验概率,例如,4类负载分类实例中,计算所有4类电气负载类别的后验概率;也可以是只计算该节点所有待识别的电气负载类型的后验概率,例如,该节点是启动冲击性电阻类负载与异步电机类负载在6个区间化输入特征均存在重叠区域时无法区分该两类负载的节点,只计算该节点启动冲击性电阻类负载与异步电机类负载的后验概率。
步骤㈢中,针对该节点所有待识别电气负载类型,选择其中后验概率最大的电气负载类型输出。例如,对启动冲击性电阻类负载与异步电机类负载在6个区间化输入特征均存在重叠区域时无法区分该两类负载的节点,选择启动冲击性电阻类负载与异步电机类负载中后验概率最大的电气负载类型输出。

Claims (10)

1.一种电气负载类型识别方法,采用分类器进行电气负载类型识别,其特征在于,所述分类器的输入特征包括电气负载的启动电流特征和电气负载的稳态电流频谱特征;所述启动电流特征包括启动过程时间、启动电流最大值、启动电流最大值时间;所述分类器为基于隶属比例平方和和贝叶斯的复合优化决策树分类器,其构建流程如下:
步骤⑴、获取多组电气负载的输入特征样本,随机选择其中部分输入特征样本作为训练数据样本,其他输入特征样本作为测试数据样本;对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征;
步骤⑵、根据电气负载区间化输入特征的重叠状态,找到当前节点待选择输入特征的中间分裂点,将区间化输入特征的区间分段化;
步骤⑶、计算当前节点待选择输入特征的信息量;
步骤⑷、计算当前节点待判别电气负载的每个待选择输入特征的信息熵;
步骤⑸、计算当前节点的每个待选择输入特征的总信息熵;
步骤⑹、计算当前节点的每个待选择输入特征的信息增益;
步骤⑺、选择当前节点待选择输入特征中信息增益最大的输入特征作为当前节点的判别属性,形成分支完成当前节点的建立;递归调用步骤⑵到步骤⑺,完成所有判别分支的建立;
步骤⑻、对不是纯净集的输出节点,分别计算所有输入特征针对该节点所有待分类电气负载类型的隶属比例平方和,采用隶属比例平方和作为该节点的判别属性,选择其中隶属比例平方和最大的电气负载类型输出;
步骤⑼、采用步骤⑴获取的电气负载样本输入特征中的训练数据样本,训练并建立贝叶斯分类器;
步骤⑽、记录步骤⑻中所有采用隶属比例平方和作为节点判别属性的节点,准备进行分类优化;
步骤⑾、选择一个采用隶属比例平方和作为节点判别属性且未进行分类优化的节点进行分类优化,方法是,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用隶属比例平方和作为节点判别属性时的总电气负载识别准确率;该节点使用贝叶斯分类器分类,替代该节点采用隶属比例平方和作为节点判别属性的方法,将步骤⑴获取的电气负载样本输入特征的测试数据样本依次输入至复合优化决策树分类器,统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率;选择总电气负载识别准确率高的方法作为该节点进行电气负载启动运行识别的方法;
步骤⑿、若步骤⑻中所有采用隶属比例平方和作为节点判别属性的节点未全部完成分类优化,返回步骤⑾;若步骤⑻中所有采用隶属比例平方和作为节点判别属性的节点全部完成分类优化,完成复合优化决策树分类器的构造。
2.如权利要求1所述的电气负载类型识别方法,其特征在于,步骤⑶中,计算当前节点每个输入特征的信息量的方法是:
式中,X代表该信息量所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征;p为在当前节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在当前节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。
3.如权利要求2所述的电气负载类型识别方法,其特征在于,步骤⑷中,计算当前节点待判别电气负载的每个输入特征的信息熵的方法是:
式中,X代表该信息熵所针对的输入特征,X包括且只包括属于当前节点待选择的输入特征;i代表该信息熵所针对的电气负载类型,i包括且只包括属于当前节点待判别的电气负载类型;Pi为该电气负载类型输入特征X的区间范围中与该节点待选择的其他输入特征均不重叠的区间范围;Ni为该电气负载类型输入特征X的区间范围中与当前节点待选择的其他输入特征相重叠的区间范围。
4.如权利要求3所述的电气负载类型识别方法,其特征在于,步骤⑸中,计算当前节点的每个待选择输入特征的总信息熵的方法是:
式中,X代表该信息熵或者总信息熵所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征;i代表待分类的某种电气负载类型,k代表需分类的电气负载类型的种类总数;Pi为与i所代表电气负载类型输入特征X的区间范围中与该节点待选择的其他输入特征均不重叠的区间范围;Ni为与i所代表电气负载类型输入特征X的区间范围中与当前节点待选择的其他输入特征相重叠的区间范围;p为在该节点待判别电气负载类型中能准确地区分出电气负载类型的该负载特征参数区间范围的总和;n为在该节点待判别电气负载类型中不能准确地区分出电气负载类型的该负载特征参数区间范围的总和。
5.如权利要求4所述的电气负载类型识别方法,其特征在于,步骤⑹中,计算当前节点的每个待选择输入特征的信息增益的方法是:
gain(X)=IX(p,n)-E(X)
式中,X代表该信息熵或者总信息熵所针对的输入特征,X包括且只包括属于当前节点待选择作为判别属性的输入特征。
6.如权利要求5所述的电气负载类型识别方法,其特征在于,步骤⑻中,分别计算所有输入特征针对该节点所有待分类电气负载类型的隶属比例平方和,计算所有输入特征针对其中一种电气负载类型的隶属比例平方和的方法是,分别计算所有输入特征在该种电气负载类型中的隶属比例,隶属比例平方和为所有输入特征在该种电气负载类型中的隶属比例的平方和;
计算输入特征在电气负载类型中的隶属比例的方法是:
式中,X代表该隶属比例所针对的输入特征,i代表所针对的电气负载类型,即ri(X)代表输入特征X在i所代表电气负载类型中的隶属比例;d0为输入特征X在i所代表电气负载类型区间化输入特征的区间中心值,d1为输入特征X在i所代表电气负载类型区间化输入特征的区间下限值,d为输入特征X的实际输入值。
7.如权利要求6所述的电气负载类型识别方法,其特征在于,步骤⑾中,将步骤⑴获取的电气负载样本输入特征中的测试数据样本依次输入至复合优化决策树分类器,是指将多组测试数据样本分组依次输入至复合优化决策树分类器。
8.如权利要求7所述的电气负载类型识别方法,其特征在于,步骤⑾中,统计该节点采用隶属比例平方和作为节点判别属性时的总电气负载识别准确率,是指在多组测试数据样本中,该节点采用隶属比例平方和作为节点判别属性时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本数与总测试数据样本数的百分比值;统计该节点采用贝叶斯分类器分类时的总电气负载识别准确率,是指在多组测试数据样本中,该节点采用贝叶斯分类器分类时,复合优化决策树分类器能够正确识别出电气负载类型的测试数据样本数与总测试数据样本数的百分比值。
9.如权利要求1所述的电气负载类型识别方法,其特征在于,步骤⑴中,对训练数据样本中每个输入特征的数据分别进行区间化预处理,得到区间化输入特征,是指将每个输入特征的训练数据样本中的最小值作为区间化输入特征的下限值,将每个输入特征的训练数据样本中的最大值作为区间化输入特征的上限值。
10.如权利要求1所述的电气负载类型识别方法,其特征在于,步骤⑵中,每个特征参数的中间分裂点,是指每个区间化输入特征中,能够将当前节点需要分类的电气负载类型区分的分界点。
CN201910443648.9A 2019-05-27 2019-05-27 一种电气负载类型识别方法 Pending CN110135392A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910443648.9A CN110135392A (zh) 2019-05-27 2019-05-27 一种电气负载类型识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910443648.9A CN110135392A (zh) 2019-05-27 2019-05-27 一种电气负载类型识别方法

Publications (1)

Publication Number Publication Date
CN110135392A true CN110135392A (zh) 2019-08-16

Family

ID=67581712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910443648.9A Pending CN110135392A (zh) 2019-05-27 2019-05-27 一种电气负载类型识别方法

Country Status (1)

Country Link
CN (1) CN110135392A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179548A (zh) * 2019-12-28 2020-05-19 杭州拓深科技有限公司 一种基于电流指纹技术的独居人员安全预警方法及系统
CN114737099A (zh) * 2021-01-07 2022-07-12 湖南工业大学 一种NbCrReRuMo高强难熔高熵合金及其制备方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
侯文浩 等: "《一种基于组合分类器的用电负载类型判断方法》", 《新型工业化》, vol. 8, no. 7, 31 July 2018 (2018-07-31), pages 1 - 4 *
吴定海 等: "柴油机振动信号分析与故障诊断研究", 国防工业出版社, pages: 123 *
罗森林 等: "《生物信号处理技术与方法》", 31 January 2015, 北京理工大学出版社, pages: 55 - 56 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111179548A (zh) * 2019-12-28 2020-05-19 杭州拓深科技有限公司 一种基于电流指纹技术的独居人员安全预警方法及系统
CN114737099A (zh) * 2021-01-07 2022-07-12 湖南工业大学 一种NbCrReRuMo高强难熔高熵合金及其制备方法
CN114737099B (zh) * 2021-01-07 2024-02-09 苏州雷佳诺电子科技有限公司 一种NbCrReRuMo高强难熔高熵合金及其制备方法

Similar Documents

Publication Publication Date Title
CN105866581B (zh) 一种电器类型识别方法
CN105759148B (zh) 一种用电器类型判断方法
CN105913005A (zh) 电器负载类型智能识别方法与装置
CN105913006A (zh) 一种用电负载类型识别方法
CN109387712A (zh) 基于状态矩阵决策树的非侵入式负荷检测与分解方法
CN111830347B (zh) 一种基于事件的两阶段非侵入式负荷监测方法
CN111123048A (zh) 一种基于卷积神经网络的串联故障电弧检测装置及方法
CN105785187A (zh) 一种学生宿舍用电器类型判断方法
CN108875783A (zh) 一种面向不平衡数据集的极限学习机变压器故障诊断方法
CN108763420A (zh) 数据对象的分类方法、装置、终端和计算机可读存储介质
US20130138669A1 (en) System and method employing a hierarchical load feature database to identify electric load types of different electric loads
CN110135392A (zh) 一种电气负载类型识别方法
CN110070048A (zh) 基于双次K-means聚类的设备类型识别方法及系统
CN110488112A (zh) 非侵入式负荷识别及其基于识别结果实现的分类计量方法
CN105759149B (zh) 学生宿舍用电器类型判断器
CN106597133B (zh) 一种低压电网单相线路相序识别分类方法及装置
CN109815994A (zh) 一种用户用电负荷特征分析方法
CN109376944A (zh) 智能电表预测模型的构建方法及装置
CN109359665A (zh) 一种基于支持向量机的家电负荷识别方法及装置
CN114943367A (zh) 基于bp神经网络模型的非侵入式负荷识别方法
CN105891633A (zh) 学生宿舍用电器类型判断装置
CN105868790A (zh) 用电负载类型识别器
CN110110708A (zh) 电气负载类型识别装置
CN110135393A (zh) 电气负载启动运行识别装置
CN110197220A (zh) 一种电气负载启动运行识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190816