CN114325236B - 一种基于频谱熵和随机森林的配电网故障识别方法及系统 - Google Patents

一种基于频谱熵和随机森林的配电网故障识别方法及系统 Download PDF

Info

Publication number
CN114325236B
CN114325236B CN202111633173.3A CN202111633173A CN114325236B CN 114325236 B CN114325236 B CN 114325236B CN 202111633173 A CN202111633173 A CN 202111633173A CN 114325236 B CN114325236 B CN 114325236B
Authority
CN
China
Prior art keywords
sample
fault
power distribution
distribution network
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111633173.3A
Other languages
English (en)
Other versions
CN114325236A (zh
Inventor
黄城
黄达文
张茵翠
魏子力
梁锦灿
原瀚杰
莫定佳
江沛琼
陈剑锋
卢剑桃
王伟光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Zhaoqing Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Zhaoqing Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Zhaoqing Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202111633173.3A priority Critical patent/CN114325236B/zh
Publication of CN114325236A publication Critical patent/CN114325236A/zh
Application granted granted Critical
Publication of CN114325236B publication Critical patent/CN114325236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Landscapes

  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明提供了一种基于频谱熵和随机森林的配电网故障识别方法及系统,其中本发明提供的故障识别方法包括将发生故障后的电气量信息、故障录波信息、系统网络结构作为样本的特征,故障类型作为每个样本的标签,将故障录波信息经频谱熵作用后生成每个样本的能量特征向量也作为样本特征后利用随机森林算法生成若干颗决策树;对每颗决策树选取不同的样本特征进行训练并基于投票制度生成强分类器;将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。本发明频谱熵对故障录波信息进行处理,可以充分利用其中的谐波信息,增强了对于配电网弱数据特征的识别。并且利用随机森林算法可以实现对拥有多个特征的样本进行高准确率的故障识别。

Description

一种基于频谱熵和随机森林的配电网故障识别方法及系统
技术领域
本发明属于电力系统及其自动化技术领域,具体涉及一种基于频谱熵和随机森林的配电网故障识别方法及系统。
背景技术
配电网架空线主要分布于城镇,跨越地形多种多样,因此配电网的架空线的故障类型呈多样化,包含:线路绝缘子闪络、变压器合闸产生涌流、单相接地、相间短路、雷击异常等故障类型。与高压输电网络不同,配电网由于其电压等级较低,线路长度较长,线路的参数量级和高压输电网不可一概而论。因此,由于网络线路参数的不同,当网络中发生故障时,相同的故障类型在高压输电网和配电网中发生时其故障信息存在着较为明显的差异。最明显的特征是在高压输电网中原本明显的数据特征(称为强特征)在配电网中将不再明显,称之为弱特征。传统的故障辨识方法将无法进行准确的辨识。另一方面,随着风能、太阳能和生物质能等多种新能源微电网接入配电网,分布式电网带来的网络结构变化使得故障电流的流向也会相应地产生变化。同时拓扑结构的变化也使得故障发生的位置产生变化。以上种种因素使得配电网故障信息的弱特征识别困难重重,故障辨识也难以进行。
发明内容
有鉴于此,本发明旨在解决使用传统故障辨识方法无法对配电网较弱的数据特征进行准确识别且由于拓扑结构变化导致故障辨识难以进行的问题。
为了解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供了一种基于频谱熵和随机森林的配电网故障识别方法,包括如下步骤:
将配电网发生故障后的电气量信息、故障录波信息和系统网络结构作为样本特征,以矩阵的形式输入到待训练的故障识别网络中,每个样本对应的标签为发生故障的类型;
将故障录波信息经频谱熵作用后生成的每个样本的能量特征向量也作为样本特征并利用随机森林算法生成若干颗决策树;
基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器;
将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。
进一步地,故障录波信息经频谱熵作用生成每个样本的能量特征向量的具体过程包括:
将每个样本的故障录波信息的频带区间和幅值区间分别等分为若干个子区间;
计算每个频带子区间内各个幅值子区间的幅值系数概率;
基于各个幅值子区间的幅值系数概率和幅值子区间的数目计算每个频带子区间的熵值,将各个频带子区间的熵值组合得到每个样本的能量特征向量。
进一步地,频带子区间的数目根据以下公式确定:
式中:N为频带子区间的数目,f为故障录波信息的采样频率。
进一步地,每个频带子区间的熵值根据以下公式确定:
式中:Ei为第i个频带子区间的熵值,M为幅值子区间的数目,1≤j≤M,pij为第i个频带子区间内第j个幅值子区间的幅值系数概率。
进一步地,基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器具体包括:
每颗决策树均按随机且有放回地从样本的训练集中抽取若干训练样本作为其训练集;
每颗决策树的每个树枝均选取一个样本特征进行训练并基于样本发生故障的类型计算不同样本特征下训练样本的信息增益;
选取拥有最大信息增益的特征所在的决策树共同组合成为强分类器。
第二方面,本发明提供了一种基于频谱熵和随机森林的配电网故障识别系统,包括:
数据输入单元,用于将配电网发生故障后的电气量信息、故障录波信息和系统网络结构作为样本特征,以矩阵的形式输入到待训练的故障识别网络中,每个样本对应的标签为发生故障的类型;
决策树生成单元,用于将故障录波信息经频谱熵作用后生成每个样本的能量特征向量也作为样本特征后利用随机森林算法生成若干颗决策树;
分类器构建单元,用于基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器;
识别单元,用于将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。
进一步地,决策树生成单元包括频谱熵计算单元,频谱熵计算单元具体用于:
将每个样本的故障录波信息的频带区间和幅值区间分别等分为若干个子区间;
计算每个频带子区间内各个幅值子区间的幅值系数概率;
基于各个幅值子区间的幅值系数概率和幅值子区间的数目计算每个频带子区间的熵值,将各个频带子区间的熵值组合得到每个样本的能量特征向量。
进一步地,频带子区间的数目根据以下公式确定:
式中:N为频带子区间的数目,f为故障录波信息的采样频率。
进一步地,每个频带子区间的熵值根据以下公式确定:
式中:Ei为第i个频带子区间的熵值,M为幅值子区间的数目,1≤j≤M,pij为第i个频带子区间内第j个幅值子区间的幅值系数概率。
进一步地,分类器构建单元具体包括:
训练样本抽取单元,用于为每颗决策树均按随机且有放回地从样本的训练集中抽取若干训练样本作为其训练集;
信息增益计算单元,用于为每颗决策树的每个树枝均选取一个样本特征进行训练并基于样本发生故障的类型计算不同样本特征下训练样本的信息增益;
强分类器构建单元,用于选取拥有最大信息增益的特征所在的决策树共同组合成为强分类器。
综上,本发明提供了一种基于频谱熵和随机森林的配电网故障识别方法及系统,其中本发明提供的故障识别方法包括将发生故障后的电气量信息、故障录波信息、系统网络结构作为样本的特征,故障类型作为每个样本的标签,将故障录波信息经频谱熵作用后生成每个样本的能量特征向量也作为样本特征后利用随机森林算法生成若干颗决策树;基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器;将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。本发明针对故障录波信息进行频谱熵作用,可以充分利用其中的谐波信息,增强了对于配电网弱数据特征的识别。并且利用随机森林算法可以实现对拥有多个特征的样本进行高准确率的故障识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的一种基于频谱熵和随机森林的配电网故障识别方法的流程示意图;
图2是本发明实施例提供的配电网拓扑结构图;
图3是本发明实施例提供的IEEE33节点标准配网图。
具体实施方式
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
配电网架空线主要分布于城镇,跨越地形多种多样,因此配电网的架空线的故障类型呈多样化,包含:线路绝缘子闪络、变压器合闸产生涌流、单相接地、相间短路、雷击异常等故障类型。与高压输电网络不同,配电网由于其电压等级较低,线路长度较长,线路的参数量级和高压输电网不可一概而论。因此,由于网络线路参数的不同,当网络中发生故障时,相同的故障类型在高压输电网和配电网中发生时其故障信息存在着较为明显的差异。最明显的特诊是在高压输电网中原本明显的数据特征(称为强特征)在配电网中将不再明显,称之为弱特征。传统的故障辨识方法将无法进行准确的辨识。另一方面,随着风能、太阳能和生物质能等多种新能源微电网接入配电网,分布式电网带来的网络结构变化使得故障电流的流向也会相应地产生变化。同时拓扑结构的变化也使得故障发生的位置产生变化。以上种种因素使得配电网故障信息的弱特征识别困难重重,故障辨识难也难以进行。
传统的故障辨识方法有:(1)理论辨识法,依据理论上不同故障时电气量的特征,运行人员是通过实际经验和理论知识进行故障的辨识。(2)专家系统法,其原理是将专家的个人经验和推理方法形成一定的规则,同时将其转化成计算机能够识别运用的知识库,在事故处理期间,其能够对所采集到的电力系统设备的信息进行退辑推理和判断,并将故障诊断的结果呈现出来。(3)基于人工神经网络的辨识方法,人工神经网络具有强大的非线性映射、信息并行处理和模式识别功能,其知识无需人工进行整理和总结,只需将其用实际的案例进行训练即可进行故障辨识。(4)基于解析模型的故障辨识法,基本思路是将故障后停电区域内部的一次设备作为故障可疑设备,根据设备与保护和断路器之前的配合遐辑,构造一个能够表示保护装置和断路器的实际状态与其期望状落之间差异的目标函数,将电力系统故障诊断的问题转换为一个整数规划问题,接着用优化算法进行求解,寻找最优故障假说。
基于此,本发明提供了一种基于频谱熵和随机森林的配电网故障识别方法及系统。
以下是对本发明提供的一种基于频谱熵和随机森林的配电网故障识别方法进行的详细介绍。
请参阅图1,本实施例提供了一种基于频谱熵和随机森林的配电网故障识别方法,包括:
S100:将配电网发生故障后的电气量信息、故障录波信息和系统网络结构作为样本特征,以矩阵的形式输入到待训练的故障识别网络中,每个样本对应的标签为发生故障的类型。
需要说明的是,待训练的故障识别网络是基于随机森林算法训练而成的。随机森林(Random Forest,RF),作为新兴起的、高度灵活的一种机器学习算法,具有强大的运算能力和极高的准确率。
配电网发生的故障情况包括单相接地故障、相间短路故障、绝缘子污闪故障、合闸涌流以及雷击异常等故障情况。模拟各种故障发生后采集配电网此时的各项信息以构成拥有多种样本特征的样本进行输入。
S200:将故障录波信息经频谱熵作用后生成的每个样本的能量特征向量也作为样本特征并利用随机森林算法生成若干颗决策树;
需要说明的是,频谱熵(Frequency Spectrum Entropy)是反应信号能量分布的一种方法。基于配电网独特的网络结构参数,当发生故障时,故障录波信息中将包含大量谐波,这些谐波蕴含着不同类型故障所具有的特征,传统方法是对这些信息直接进行辨识,难以将这些谐波信息有效利用。使用频谱熵则可以将谐波信息以能量特征的形式表现出来,实现了对谐波信息的高效利用。
故障录波信息经频谱熵作用生成每个样本的能量特征向量的具体过程如下:
S201:将每个样本的故障录波信息的频带区间和幅值区间分别等分为若干个子区间。
需要说明的是,为展现信号频谱在不同区段的能量分布,需将信号频谱划分为不同的区段或层数。在选择分解层数时,应考虑两个方面:频谱和计算复杂度。分解应保证得到的频谱至少要能涵盖1kHz以下的频谱(f为故障录波信息的采样频率,第n级f/2N的频率上限<1kHz),以确保分析几乎整个高频频谱,并避免100Hz(第n级f/2N+1的下限>100Hz)频带的出现,其中包含由外部故障引起的二次谐波。同时,为了产生尽可能少的计算负担,应采用满足频率要求的最小N。因此,根据下式计算频带的分解层数N:
式中:N为频带子区间的数目,f为故障录波信息的采样频率。
S202:计算每个频带子区间内各个幅值子区间的幅值系数概率。
需要说明的是,将上一步骤中的各个频段的能量分布,即各区段频谱的幅值序列作为一个整体,并以幅值序列的最大值、最小值分别作为上下限,构成区间,将此幅值区间等分为M份。第i(1≤i≤N)频带中的幅值系数共计xi个,散落分布在幅值区间的M个小区间中。其中,分布在第j(1≤j≤m)区间的个数记为xij,所占的比例记为概率p(xij),即第i个频带子区间内第j个幅值子区间的幅值系数概率,计算公式如下:
S203:基于各个幅值子区间的幅值系数概率和幅值子区间的数目计算每个频带子区间的熵值,将各个频带子区间的熵值组合得到每个样本的能量特征向量。
需要说明的是,每个频带子区间的熵值根据以下公式确定,该公式得到的是第i(1≤i≤N)频段的熵值:
式中:Ei为第i个频带子区间的熵值,M为幅值子区间的数目,1≤j≤M,pij为第i个频带子区间内第j个幅值子区间的幅值系数概率。
能量值特征向量维度为N,将各个频段的熵值组合在一起形成能量值特征向量如下:
E=[E1,E2,...,EN]。
S300:基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器。
需要说明的是,生成强分类器的具体过程如下:
S301:每颗决策树均按随机且有放回地从样本的训练集中抽取若干训练样本作为其训练集。
需要说明的是,将总样本集按照8:2的比例划分为训练集和测试集。每颗决策树按随机且有放回(bootstrap sample)地从划分好的训练集中抽取T个训练样本作为该树的训练集(T是从按照8:2比例划分的训练集中有放回地抽取得到的)。
S302:每颗决策树的每个树枝均选取一个样本特征进行训练并基于样本发生故障的类型计算不同样本特征下训练样本的信息增益。
需要说明的是,每棵树的某一树枝选取样本的单一类型特征作用于训练过程,如单独选取录波频谱熵或电气量信息等。若选取特征A作为训练用特征,则经过特征A作用以后,训练样本X被分为k(k为所辨识的故障种类)个子样本Xj(j=1,2,...,k),此时样本X的信息熵为:
上式中:k为样本X中数据种类数;Pj为第j个子样本占样本总数的比例。
S303:选取拥有最大信息增益的特征所在的决策树共同组合成为强分类器。
需要说明的是,经过网络训练,计算每种特征的信息增益,根据信息增益的大小,选取拥有最大信息增益的特征所在的决策树共同组合成为强分类器。信息增益根据以下公式计算:
G(X,A)=H(X)-HA(X)
式中:G(X,A)为样本X选取特征A训练计算得到的信息增益,H(X)为样本X的原始信息熵,HA(X)为样本X选取特征A训练计算得到的信息熵。
S400:将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。
以下将结合图2的配电网网络拓扑结构对本发明的一种基于频谱熵和随机森林的配电网故障识别方法进行详细介绍。
图2为某一拥有11个网络节点的配电网拓扑结构。按照步骤S100的规则将该配电网结构中的各项数据进行输入,并对选取到的电气量信息经由采样数据得到故障录波信息。进一步将该故障录波信息经由频谱熵处理得到能量特征向量。将该能量特征向量输入随机森林网络进行训练。训练步骤如下:
随机选取一定比例的样本数作为每棵决策树的训练样本,采取bootstrap sample法选取60%的样本作为每棵树的训练样本进行训练。训练得到的信息增益如下:
G(X,A)=H(X)-HA(X)
其中X为总训练样本,A为样本的某种特征,G(X,A)为样本X选取特征A训练计算得到的信息增益,H(X)为样本X的原始信息熵,HA(X)为样本X选取特征A训练计算得到的信息熵。
选取信息增益最大的决策树组合得到强分类器,构建得到识别准确率高的故障识别网络。
采用如图3所示的IEEE33节点标准配网图,设置不同类型故障,生成样本,划分为训练集和测试集。将训练好的故障识别网络在测试集上验证。
图3所示的系统共有33个节点32条支路,在首端节点18,22,25,以及末端节点17,21,24,32处安装FTU作为量测装置,分别在0.2秒时设置单相接地故障、相间短路故障、绝缘子污闪故障、合闸涌流、雷击异常故障。故障发生0.2秒后保护装置动作,故障被切除。在故障发生前0.1秒开始对数据进行采集,32条支路总共有64000组数据构成数据样本集,样本集的设置中,以8:2的比例将样本集划分为训练集和测试集。每棵决策树的训练样本采取bootstrap sample法,比例为60%。样本的标签为发生故障的类型。最后设置故障时添加60分贝噪声增加模型抗干扰能力,提高模型稳定性。
将得到的64000组数据输入网络中进行训练,经过训练的网络在测试集上进行测试。经测试,选取不同特征作为故障辨识依据的故障辨识准确率如下表所示。
特征 准确率 特征 准确率
短路电流0.5倍频 87% 短路电流负序分量 81%
短路电流2倍频 92% 短路电压5倍频 95%
短路电流奇数频 81% 短路电压负序分量 93%
由于电力系统量测装置的统一标准,不同网络所提供的故障数据的形式和特征基本相似,输入数据基本具有相似分布,因此,训练好的随机森林网络具有较好的泛化性。网络拓扑结构的不同基本不影响算法对故障类型的辨识。
经验证表明,该方法实现了在配电网复杂信息情况下的故障辨识。通过对随机森林网络的大数量、高维度样本训练,能够实现在不同拓扑条件下的故障识别。实现了在实际工程中的应用。该方法具有较强的普适性,可以结合实际配网拓扑图训练,训练好的随机森林网络精度极高,可靠性强,能够实现现代新能源背景下的复杂配电网信息高效利用,并实现弱特征前提下的故障辨识,适应拓扑结构种类多变,具有一定的发展前景。
本实施例提供了一种基于频谱熵和随机森林的配电网故障识别方法,包括将发生故障后的电气量信息、故障录波信息、系统网络结构作为样本的特征,故障类型作为每个样本的标签,将故障录波信息经频谱熵作用后生成每个样本的能量特征向量也作为样本特征后利用随机森林算法生成若干颗决策树;基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器;将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。本方法针对故障录波信息进行频谱熵作用,可以充分利用其中的谐波信息,增强了对于配电网弱数据特征的识别。并且利用随机森林算法可以实现对拥有多个特征的样本进行高准确率的故障识别。
以上是对本发明的一种基于频谱熵和随机森林的配电网故障识别方法的实施例进行的详细介绍,以下对本发明的一种基于频谱熵和随机森林的配电网故障识别系统的实施例进行详细介绍。
本实施例提供了一种基于频谱熵和随机森林的配电网故障识别系统,包括:数据输入单元、决策树生成单元、分类器构建单元和识别单元。
在本实施例中,数据输入单元用于将配电网发生故障后的电气量信息、故障录波信息和系统网络结构作为样本特征,以矩阵的形式输入到待训练的故障识别网络中,每个样本对应的标签为发生故障的类型。
决策树生成单元,用于将故障录波信息经频谱熵作用后生成每个样本的能量特征向量也作为样本特征后利用随机森林算法生成若干颗决策树。
需要说明的是,决策树生成单元包括频谱熵计算单元,频谱熵计算单元具体用于:
将每个样本的故障录波信息的频带区间和幅值区间分别等分为若干个子区间;
计算每个频带子区间内各个幅值子区间的幅值系数概率;
基于各个幅值子区间的幅值系数概率和幅值子区间的数目计算每个频带子区间的熵值,将各个频带子区间的熵值组合得到每个样本的能量特征向量。
进一步地,频带子区间的数目根据以下公式确定:
式中:N为频带子区间的数目,f为故障录波信息的采样频率。
进一步地,每个频带子区间的熵值根据以下公式确定:
式中:Ei为第i个频带子区间的熵值,M为幅值子区间的数目,1≤j≤M,pij为第i个频带子区间内第j个幅值子区间的幅值系数概率。
在本实施例中,分类器构建单元用于基于样本发生故障的类型对每颗决策树选取不同的样本特征进行训练并在所有决策树完成训练之后基于投票制度生成强分类器。
需要说明的是,分类器构建单元具体包括:
训练样本抽取单元,用于为每颗决策树均按随机且有放回地从样本的训练集中抽取若干训练样本作为其训练集;
信息增益计算单元,用于为每颗决策树的每个树枝均选取一个样本特征进行训练并基于样本发生故障的类型计算不同样本特征下训练样本的信息增益;
强分类器构建单元,用于选取拥有最大信息增益的特征所在的决策树共同组合成为强分类器。
在本实施例中,识别单元用于将强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别。
需要说明的是,本实施例提供的配电网故障识别系统用于实现前述实施例的配电网故障识别方法,各单元的具体设置以实现该方法为准,在此不再赘述。
本实施例提供了一种基于频谱熵和随机森林的配电网故障识别系统,包括数据输入单元、决策树生成单元、分类器构建单元和识别单元。本系统针对故障录波信息进行频谱熵作用,可以充分利用其中的谐波信息,增强了对于配电网弱数据特征的识别。并且利用随机森林算法可以实现对拥有多个特征的样本进行高准确率的故障识别。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种基于频谱熵和随机森林的配电网故障识别方法,其特征在于,包括如下步骤:
将配电网发生故障后的电气量信息、故障录波信息和系统网络结构作为样本特征,以矩阵的形式输入到待训练的故障识别网络中,每个样本对应的标签为发生故障的类型;
将所述故障录波信息经频谱熵作用后生成的每个样本的能量特征向量也作为样本特征并利用随机森林算法生成若干颗决策树;
基于样本发生故障的类型对每颗所述决策树选取不同的所述样本特征进行训练并在所有所述决策树完成训练之后基于投票制度生成强分类器;
将所述强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别;
所述故障录波信息经频谱熵作用生成每个样本的能量特征向量的具体过程包括:
将每个样本的所述故障录波信息的频带区间和幅值区间分别等分为若干个子区间;
计算每个频带子区间内各个幅值子区间的幅值系数概率;
基于各个幅值子区间的所述幅值系数概率和所述幅值子区间的数目计算每个频带子区间的熵值,将各个频带子区间的所述熵值组合得到每个样本的所述能量特征向量;
所述频带子区间的数目根据以下公式确定:
式中:为所述频带子区间的数目,/>为所述故障录波信息的采样频率。
2.根据权利要求1所述的基于频谱熵和随机森林的配电网故障识别方法,其特征在于,每个频带子区间的熵值根据以下公式确定:
式中:为第i个频带子区间的熵值,/>为所述幅值子区间的数目,/>,/>为第i个频带子区间内第j个幅值子区间的幅值系数概率。
3.根据权利要求1所述的基于频谱熵和随机森林的配电网故障识别方法,其特征在于,基于样本发生故障的类型对每颗所述决策树选取不同的所述样本特征进行训练并在所有所述决策树完成训练之后基于投票制度生成强分类器具体包括:
每颗所述决策树均按随机且有放回地从样本的训练集中抽取若干训练样本作为其训练集;
每颗所述决策树的每个树枝均选取一个所述样本特征进行训练并基于样本发生故障的类型计算不同样本特征下所述训练样本的信息增益;
选取拥有最大信息增益的特征所在的决策树共同组合成为所述强分类器。
4.一种基于频谱熵和随机森林的配电网故障识别系统,其特征在于,包括:
数据输入单元,用于将配电网发生故障后的电气量信息、故障录波信息和系统网络结构作为样本特征,以矩阵的形式输入到待训练的故障识别网络中,每个样本对应的标签为发生故障的类型;
决策树生成单元,用于将所述故障录波信息经频谱熵作用后生成的每个样本的能量特征向量也作为样本特征并利用随机森林算法生成若干颗决策树;
分类器构建单元,用于基于样本发生故障的类型对每颗所述决策树选取不同的所述样本特征进行训练并在所有所述决策树完成训练之后基于投票制度生成强分类器;
识别单元,用于将所述强分类器作为训练好的故障识别网络并对待识别的配电网进行故障识别;
所述决策树生成单元包括频谱熵计算单元,所述频谱熵计算单元具体用于:
将每个样本的所述故障录波信息的频带区间和幅值区间分别等分为若干个子区间;
计算每个频带子区间内各个幅值子区间的幅值系数概率;
基于各个幅值子区间的所述幅值系数概率和所述幅值子区间的数目计算每个频带子区间的熵值,将各个频带子区间的所述熵值组合得到每个样本的所述能量特征向量;
所述频带子区间的数目根据以下公式确定:
式中:为所述频带子区间的数目,/>为所述故障录波信息的采样频率。
5.根据权利要求4所述的基于频谱熵和随机森林的配电网故障识别系统,其特征在于,每个频带子区间的熵值根据以下公式确定:
式中:为第i个频带子区间的熵值,/>为所述幅值子区间的数目,/>,/>为第i个频带子区间内第j个幅值子区间的幅值系数概率。
6.根据权利要求4所述的基于频谱熵和随机森林的配电网故障识别系统,其特征在于,所述分类器构建单元具体包括:
训练样本抽取单元,用于为每颗所述决策树均按随机且有放回地从样本的训练集中抽取若干训练样本作为其训练集;
信息增益计算单元,用于为每颗所述决策树的每个树枝均选取一个所述样本特征进行训练并基于样本发生故障的类型计算不同样本特征下所述训练样本的信息增益;
强分类器构建单元,用于选取拥有最大信息增益的特征所在的决策树共同组合成为所述强分类器。
CN202111633173.3A 2021-12-28 2021-12-28 一种基于频谱熵和随机森林的配电网故障识别方法及系统 Active CN114325236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111633173.3A CN114325236B (zh) 2021-12-28 2021-12-28 一种基于频谱熵和随机森林的配电网故障识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111633173.3A CN114325236B (zh) 2021-12-28 2021-12-28 一种基于频谱熵和随机森林的配电网故障识别方法及系统

Publications (2)

Publication Number Publication Date
CN114325236A CN114325236A (zh) 2022-04-12
CN114325236B true CN114325236B (zh) 2023-08-18

Family

ID=81014499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111633173.3A Active CN114325236B (zh) 2021-12-28 2021-12-28 一种基于频谱熵和随机森林的配电网故障识别方法及系统

Country Status (1)

Country Link
CN (1) CN114325236B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101210948A (zh) * 2006-12-27 2008-07-02 通用电气公司 用于检测电气系统中的串联电弧的方法和系统
CN102879196A (zh) * 2012-09-25 2013-01-16 西安交通大学 利用矩阵小波变换的行星齿轮箱复合故障诊断方法
CN103335617A (zh) * 2013-06-19 2013-10-02 清华大学 一种基于振动信号的铁路钢轨几何形变检测方法
CN106405339A (zh) * 2016-11-11 2017-02-15 中国南方电网有限责任公司 基于高低频小波特征关联的输电线路故障原因辨识方法
CN108388860A (zh) * 2018-02-12 2018-08-10 大连理工大学 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法
CN110058110A (zh) * 2019-04-16 2019-07-26 重庆大学 一种有源逆变器间歇故障诊断方法
CN110488161A (zh) * 2019-07-23 2019-11-22 南京航空航天大学 一种多负载串联电弧故障检测及定位方法
CN111239549A (zh) * 2020-02-18 2020-06-05 国网信通亿力科技有限责任公司 一种基于离散小波变换的配电故障快速定位方法
CN112327219A (zh) * 2020-10-29 2021-02-05 国网福建省电力有限公司南平供电公司 特征自动挖掘和参数自动寻优的配电变压器故障诊断方法
CN113255591A (zh) * 2021-06-25 2021-08-13 四川九通智路科技有限公司 一种基于随机森林和融合特征的轴承故障诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11656263B2 (en) * 2019-06-11 2023-05-23 Arizona Board Of Regents On Behalf Of Arizona State University Effective feature set-based high impedance fault detection

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101210948A (zh) * 2006-12-27 2008-07-02 通用电气公司 用于检测电气系统中的串联电弧的方法和系统
CN102879196A (zh) * 2012-09-25 2013-01-16 西安交通大学 利用矩阵小波变换的行星齿轮箱复合故障诊断方法
CN103335617A (zh) * 2013-06-19 2013-10-02 清华大学 一种基于振动信号的铁路钢轨几何形变检测方法
CN106405339A (zh) * 2016-11-11 2017-02-15 中国南方电网有限责任公司 基于高低频小波特征关联的输电线路故障原因辨识方法
CN108388860A (zh) * 2018-02-12 2018-08-10 大连理工大学 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法
CN110058110A (zh) * 2019-04-16 2019-07-26 重庆大学 一种有源逆变器间歇故障诊断方法
CN110488161A (zh) * 2019-07-23 2019-11-22 南京航空航天大学 一种多负载串联电弧故障检测及定位方法
CN111239549A (zh) * 2020-02-18 2020-06-05 国网信通亿力科技有限责任公司 一种基于离散小波变换的配电故障快速定位方法
CN112327219A (zh) * 2020-10-29 2021-02-05 国网福建省电力有限公司南平供电公司 特征自动挖掘和参数自动寻优的配电变压器故障诊断方法
CN113255591A (zh) * 2021-06-25 2021-08-13 四川九通智路科技有限公司 一种基于随机森林和融合特征的轴承故障诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于小波包能量熵和随机森林的级联 H 桥多电平逆变器故障诊断;陈石等;南京大学学报(自然科学);第56卷(第2期);第284-289页 *

Also Published As

Publication number Publication date
CN114325236A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
Guo et al. Deep-learning-based fault classification using Hilbert–Huang transform and convolutional neural network in power distribution systems
Chen et al. Intelligent transient overvoltages location in distribution systems using wavelet packet decomposition and general regression neural networks
CN109444667B (zh) 基于卷积神经网络的配电网早期故障分类方法及装置
Wei et al. Waveform matching approach for fault diagnosis of a high-voltage transmission line employing harmony search algorithm
CN112147462A (zh) 一种基于深度学习的输电线路故障辨识方法
Rohani et al. A hybrid method based on optimized neuro-fuzzy system and effective features for fault location in VSC-HVDC systems
Mishra et al. A universal high impedance fault detection technique for distribution system using S-transform and pattern recognition
CN110543921A (zh) 一种基于波形学习的电缆早期故障识别方法
Narasimhulu et al. LWT based ANN with ant lion optimizer for detection and classification of high impedance faults in distribution system
Li et al. Data-driven fault detection and classification for MTDC systems by integrating HCTSA and softmax regression
Sima et al. Edge–cloud collaboration detection approach for small-sample imbalanced faults in power lines
CN108399579B (zh) 变电站设备监控数据信号的智能解析系统
Said et al. Support vector machine parameters optimization for 500 kv long ohtl fault diagnosis
CN114660375A (zh) 一种电力设备故障的辨识方法
Zeng et al. Machine-learning-based single-phase-to-ground fault detection in distribution systems
Li et al. A fault cause identification methodology for transmission lines based on support vector machines
CN114325236B (zh) 一种基于频谱熵和随机森林的配电网故障识别方法及系统
CN110221168B (zh) 一种主导谐波源定位和谐波污染传播路径追踪方法
Tang et al. Classification for transient overvoltages in offshore wind farms based on sparse decomposition
Jamali et al. Phase selective protection in microgrids using combined data mining and modal decomposition method
Wang et al. Synthetic data in DC microgrids: Label creation for ensemble learning for fault isolation
Torres et al. A comparison of new methods based on ANNs for detecting and locating faults in MTDC systems
Vikram Raju et al. Mono ANN Module Protection Scheme and Multi ANN Modules for Fault Location Estimation for a Six-Phase Transmission Line Using Discrete Wavelet Transform
Ponukumati et al. Unbalanced Distribution Network Cross-Country Fault Diagnosis Method with Emphasis on High-Impedance Fault Syndrome
Sun et al. Application of islanding detection and classification of power quality disturbance in hybrid energy system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant