CN113589098A - 基于大数据驱动的电网故障预测和诊断方法 - Google Patents
基于大数据驱动的电网故障预测和诊断方法 Download PDFInfo
- Publication number
- CN113589098A CN113589098A CN202110786418.XA CN202110786418A CN113589098A CN 113589098 A CN113589098 A CN 113589098A CN 202110786418 A CN202110786418 A CN 202110786418A CN 113589098 A CN113589098 A CN 113589098A
- Authority
- CN
- China
- Prior art keywords
- fault
- data
- degree
- association
- scada
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005065 mining Methods 0.000 claims abstract description 25
- 238000012544 monitoring process Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 238000012512 characterization method Methods 0.000 claims abstract description 5
- 230000008878 coupling Effects 0.000 claims abstract description 3
- 238000010168 coupling process Methods 0.000 claims abstract description 3
- 238000005859 coupling reaction Methods 0.000 claims abstract description 3
- 230000000875 corresponding effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000007418 data mining Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 2
- 238000009412 basement excavation Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract description 7
- 238000002405 diagnostic procedure Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000010224 classification analysis Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000009413 insulation Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/088—Aspects of digital computing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Abstract
基于大数据驱动的电网故障预测和诊断方法,以某地区电网N年的大数据集为基础,并通过数据采集与监控系统SCADA提取所记录的事件和故障;时间窗口化阶段:在该阶段,通过处理原始的数据采集与监控系统SCADA,以提取故障前和故障后的时间窗口,为基于数据集的故障表征提供基础;关联规则挖掘阶段:该阶段自动识别代表故障前和故障后窗口的所有强耦合关联规则;关联分类器分析阶段:用于评估数据集的预测‑诊断潜力。本发明一种基于大数据驱动的电网故障预测和诊断方法,能够通过电网中记录的海量运行数据实现预测性维护、执行有效故障诊断和减少后续相关支出,以提高用户用电的可靠性和安全性。
Description
技术领域
本发明涉及配电网故障诊断与预测技术领域,具体涉及一种基于大数据驱动的电网故障预测和诊断方法。
背景技术
随着传统电网向智能电网模式的转变,电网结构愈发复杂,海量监控数据涌入集控主机,仪器仪表、通信和数据分析方面的显著进步,使得引入有效的电网监控和管理解决方案成为可能,从而使得电力系统运行更加可靠,实现了电网的故障诊断和预测。近期的研究显示了大数据分析方法在电力系统中的有效应用。然而,现如今检修模式逐步向预测性维护转变,很少有研究专门致力于电网预测性维护。为此,利用描述电网运行数据集以及记录电网设备故障和报警信号的历史数据指导预测性维护方案的制定显得尤为重要。
发明内容
本发明提供一种基于大数据驱动的电网故障预测和诊断方法,能够通过电网中记录的海量运行数据实现预测性维护、执行有效故障诊断和减少后续相关支出,以提高用户用电的可靠性和安全性。
本发明采取的技术方案为:
基于大数据驱动的电网故障预测与诊断模型建模方法,为了通过电网中记录的海量运行数据实现预测性维护、执行有效故障诊断和减少后续相关支出,以提高用户用电的可靠性和安全性。考虑以数据采集与监控系统SCADA在实际中压配电网络中收集的N年数据集,由基于数据特征提取、时间窗、关联规则挖掘和关联分类器分析的方法进行评估,并自动识别相关性,从故障中断前后时间窗,建立预测-诊断模型。
基于大数据驱动的电网故障预测和诊断方法,包括以下步骤:
步骤一、以某地区电网超N年的大数据集为基础,并通过数据采集与监控系统SCADA提取所记录的事件和故障;
步骤二、时间窗口化阶段:
在该阶段,将数据采集与监控系统SCADA中所记录的未经清洗与降维的数据进行窗口化模块处理,以提取故障前和故障后的时间窗口,为基于数据集的故障表征提供基础;
步骤三:关联规则挖掘阶段:
该阶段自动识别代表故障前和故障后窗口的所有强耦合关联规则;
步骤四:关联分类器分析阶段:
用于评估数据集的预测-诊断潜力。
所述步骤一中,对符合以下三点的故障进行特征提取:
①故障持续事件超过180秒;
②故障位置已被识别;
③故障诱因已被确定;
这些故障事件被认定为永久服务中断PSI,故障事件包含45种不同的故障原因并与30个受不同程度影响的电网组件相关联。
所述步骤二中,
时间窗口指的是:在时间维度上,定义了一个PSI发生前的时间窗口,称为故障前窗口PFW,紧接PSI发生后的时间窗口,称为故障后窗口AFW;
在空间维度中,只考虑在电网中发生PSI的同一部分观察到的SCADA事件,即由作为收集数据来源的同一馈线报告的事件。考虑到最关注的是预测未来一个月内发生PSI的可能性,因此设定PFW的时间窗口为1、7、30天,AFW的时间窗口为1小时、1天、7天。
所述步骤三中,
关联规则挖掘指的是:
假设D是一个数据集,其一般记录r由一组同时发生的事件组成,即在同一时间窗口内发生的事件。每个事件,也称为项,是一对属性值,该属性为SCADA事件类型、故障原因、故障波及组件,如果该属性在某时间窗口中为真,则该值为1,否则为0。
SCADA事件可能表示在分析PSI之前或之后发生的另一个PSI或小故障。项目集I是数据集D记录r中一组共同发生的事件、故障波及组件、故障原因。PFW或AFW中的这一组项目I够成了规则挖掘提取的输入特征量。
项目集I的支持度计数是包含I的记录r的数目。项目集I的支持度是S(I)是包含I的记录r相对于整个数据集中记录r的总数的百分比。当其支持度大于或等于最小支持度阈值Minsup时,则称项集是频繁的。
所述步骤三中,
关联规则挖掘的目的是根据统计相关的度量,识别经常存在于分析数据集中的频繁项集。为了提取在数据挖掘过程中最有意义的关联规则,可以利用支持度、置信度和提升度作为相应的度量指标。
支持度S(X,Y)表示在数据集中包含X和Y记录的百分比,它代表了X∪Y的先验概率,其概率表达式如式(1)所示。
置信度C(X→Y)表示在Y发生的条件下X发生的可能性,其概率表达式如式(2)所示。
S(X→Y)=P(X∪Y) (1)
当挖掘出一定关联规则后,采用提升度来删除冗余规则,使得挖掘结果更加精炼。
提升度代表一条关联规则X→Y前因后果的相关程度,其概率表达式如式(3)所示。如果提升度L(X,Y)=1,则代表二者在统计上是相互独立的,项集X和Y不相关;如果提升小于1,则表示项集X和Y之间呈现负相关,而提升度高于1的关联规则则表示X和Y呈现正相关,较高的提升度代表了更强的关联规则。
所述步骤四中,关联规则从通用预测-诊断方法中提取,关联规则属性包括a.受故障影响的成分;b.故障的原因,这是预测-诊断背景中两个期望的目标变量;使用的关联分类器是L3型分类器。
本发明一种基于大数据驱动的电网故障预测和诊断方法,结合不同的探索性方法评估数据集预测未来电网可能发生的故障、故障波及的电网设备和诱发故障原因的能力,并在检测到故障后执行此类诊断;且利用了基于关联规则挖掘的数据分析方法,在数据集中自动提取故障之前(预测性)和故障之后(诊断性)所发生事件之间的高于特定统计阈值的所有相关性。本发明用于预测和诊断电网故障的模型具有较高的可读性。
附图说明
图1为本发明的模型整体架构图。
图2(a)为本发明实施例中7天-PFW(星)与1天-AFW(点)关联规则分布图(置信度-提升度)。
图2(b)为本发明实施例中7天-PFW(星)与1天-AFW(点)关联规则分布图(支持度-提升度)。
图3(a)为本发明应用实施例中关联分类器规则度量指标分布图一;
图3(b)为本发明应用实施例中关联分类器规则度量指标分布图二。
具体实施方式
基于大数据驱动的电网故障预测与诊断模型,其整体架构如下:
中压配电网系统通过数据采集与监控系统SCADA提供广泛的事件数据集。实际电网运行过程中所产生的数据集,经过数据挖掘分析需要提取故障特征和相关性从而实现电网的维护。因此,本发明研究存在两个重点:
(1)提出一种能够自动评估所提供数据集的故障预测和诊断潜力的方法;
(2)提出通过关联规则分析方法,所给出诊断和预测结果的可读性。通过数据采集特征阶段以确定最频繁的SCADA项集,以及确定在故障前后所需监控事件的时长,从而为故障诊断和预测潜力评估提供有效的特征信息。
图1为本发明预测-诊断模型的整体架构。第一阶段为时间窗口化阶段,在该阶段,将数据采集与监控系统SCADA中所记录的未经清洗与降维的数据进行窗口化模块处理,以提取故障前和故障后的时间窗口,为基于数据集的故障表征提供基础。第二阶段为关联规则挖掘阶段,该阶段自动识别代表故障前和故障后窗口的所有强耦合关联规则。第三阶段为关联分类器分析阶段,用于评估数据集的预测-诊断潜力。
本发明所分析的数据库,为华中某地区实际运行电网数据采集与监控系统SCADA在其中压配电网上记录的事件。
本发明主要对符合以下三点的故障进行特征提取:
①故障持续事件超过180秒;
②故障位置已被识别;
③故障诱因已被确定。
这些故障事件被认定为永久服务中断(PSI),包含45种不同的故障原因并与30个受不同程度影响的电网组件相关联。
本发明中所述时间窗口:
由于本发明的目标是评估SCADA事件对PSI的预测和诊断潜力,因此,在时间和空间维度中重点关注PSI发生之前和之后的事件相关关系。在时间维度上,定义了一个PSI发生前的时间窗口,称为故障前窗口(PFW),紧接PSI发生后的时间窗口,称为故障后窗口(AFW)。在空间维度中,只考虑在电网中发生PSI的同一部分观察到的SCADA事件,即由作为收集数据来源的同一馈线报告的事件。考虑到电力公司最关注的是预测未来一个月内发生PSI的可能性,因此设定PFW的时间窗口为1、7、30天,AFW的时间窗口为1小时、1天、7天。
本发明中所述关联规则挖掘:
假设D是一个数据集,其一般记录r由一组同时发生的事件组成,即在同一时间窗口内发生的事件。每个事件,也称为项,是一对属性值,该属性为SCADA事件类型、故障原因、故障波及组件,如果该属性在某时间窗口中为真(例如,SCADA事件存在,故障波及组件存在,或确定了故障原因),则该值为1,否则为0。值得注意的是,SCADA事件可能表示在分析PSI之前或之后发生的另一个PSI或小故障。项目集I是数据集D记录r中一组共同发生的事件、故障波及组件、故障原因。PFW或AFW中的这一组项目I够成了规则挖掘提取的输入特征量。
项目集I的支持度计数是包含I的记录r的数目。项目集I的支持度是S(I)是包含I的记录r相对于整个数据集中记录r的总数的百分比。当其支持度大于或等于最小支持度阈值Minsup时,则称项集是频繁的。
关联规则挖掘的目的是根据统计相关的度量,识别经常存在于分析数据集中的频繁项集。为了提取在数据挖掘过程中最有意义的关联规则,可以利用支持度、置信度和提升度作为相应的度量指标。支持度S(X,Y)表示在数据集中包含X和Y记录的百分比,它代表了X∪Y的先验概率,其概率表达式如式(1)所示。置信度C(X→Y)表示在Y发生的条件下X发生的可能性,其概率表达式如式(2)所示。
S(X→Y)=P(X∪Y) (1)
所有关联规则的支持度和置信度都必须大于最小支持度阈值和最小置信度阈值,此种情况下的关联规则才是有意义的。当挖掘出一定关联规则后,采用提升度来删除冗余规则,使得挖掘结果更加精炼。提升度代表一条关联规则X→Y前因后果的相关程度,其概率表达式如式(3)所示。如果提升度L(X,Y)=1,则代表二者在统计上是相互独立的,项集X和Y不相关;如果提升小于1,则表示项集X和Y之间呈现负相关,而提升度高于1的关联规则则表示X和Y呈现正相关。较高的提升度代表了更强的关联规则,也代表着该条规则更具分析意义。
实施例:
本发明所分析的数据库为华中某地区实际运行电网数据采集与监控系统SCADA在其中压配电网上记录的事件。该数据集涵盖了6年时间(2012-2018年)。数据集包含39011个故障特征,30种不同的受故障影响的电网组件,153094个在电网正常运行期间记录的常规事件。SCADA事件分为67种不同的事件类型,一般故障事件占79833个。本发明主要对符合以下三点的故障进行特征提取:①故障持续事件超过180秒;②故障位置已被识别;③故障诱因已被确定。这些故障事件被认定为永久服务中断(PSI),包含45种不同的故障原因并与30个受不同程度影响的电网组件相关联。
通过分析PSI的分布和SCADA事件类型简要地描述数据集的特征。考虑到PSI最常见地45种常见原因的概率分布,前4种原因占PSI的75%,其中“电气故障”是最常见的原因(45%)。超过20%的PSI是由自然原因引起的,如:天气问题、植物坠落、冰雪覆盖、动物接触等。此外,另外20%的PSI是由于未知的“其他原因”所引起。关于最常见的SCADA事件类型的概率分布,只有75%的SCADA事件属于6种不同的类型,最常见的事件频率超过30%。
对提取的规则进行各种参数值的分析:
本发明设定最小支持度阈值设定为Minsup=0.02;提升度高于1.5。图2(a),图2(b)中显示了7天PFW(红点)和1天AFW(蓝点)的规则数。散点图显示了置信度和提升度-1的关系。诊断潜力(AFW)被更多的规则所证实,在预测能力(PFW)方面具有更好的质量指标。总的来说:在AFW中有45条规则,而在PFW中有3条规则;在AFW中的最大规则置信度为50%,而PFW为25%;在AFW中最大提升度为2.73,而PFW为1.9;在AFW中最大支持度为8%,而PFW中为4.5%。
从表1的结果可以看到,SCADA事件和组件的最有趣的组合与PSI有关,影响配电网中最高百分比的组件,即架空线路和电缆。以中压线路最大电流第二阈值越限的结果为例,它意味着系统有一个故障发生,而继电器没有立即跳闸的线路,随着时间的推移和故障的重复,故障电流不断的损害设备绝缘,设备最终会产生接地故障。由于这种情况下的故障电流要大得多,所以RG CTO干预会产生类似的影响,幅度更大。
表1 PFW时间窗内关联规则挖掘结果
表2 AFW时间窗内关联规则挖掘结果
作为表1中的先行事件在PFW中作为预测信号,可以推断,在系统引入故障后,随着时间的推移,绝缘恶化的累积效应将在未来引起明显的PSI。
如果比较表2中结果的最后两项可以清楚地看到,置信度相当高,即高于41%,这表明T-junction是最容易受到攻击的薄弱环节。然而,如果仔细检查SCADA事件,其表明故障不能自行清除,并发展为永久故障。对于其他类型的故障,它们可以自己清除,自动重合闸继电器(RDA)将使线路重合闸并恢复工作。另一方面,最典型的永久故障将是设备本身的故障,在这种情况下,就是T-junction的故障。因此,研究清楚地捕捉到了T-junction发生故障并产生故障电流的现象。由于它不能自行清除,有关的继电器永久地跳过相关线路使其带故障运行逐步发展成为PSI。
关联规则从以故障前时间窗-故障后时间窗阶段为基准的通用预测-诊断方法中提取。
通用预测-诊断方法就是之前提出的时间窗这部分是常规的预测-诊断方法的基准步骤,简称为通用预测-诊断方法。
所提取的关联特征属性包括①受故障影响的成分和②故障的原因,这是预测-诊断背景中两个期望的目标变量。但是对于关联规则,挖掘的目标并不是预先确定的。因此,引入了基于关联分类器分析的方法,该分类器为L3型分类器,其依据SCADA系统所记录数据中涉及受PSI所波及的电网设备以及PSI的故障原因这两类标签划分训练集,采用闭频繁模式(CLOSET+)产生完全候选项目集并采用类间规则剪枝策略,减少了大量冗余的分类规则,该方法针对预定的目标属性(即类别)优化了所提取的规则。另外,这种方法能够实现将给定的数据集进行分析,评估数据集应用于预测受故障影响组件的潜力和诊断故障发生原因的能力。
为了应用关联分类器,对输入数据集执行数据准备工作流,包括两个步骤:①类删除和②特征选择。
因为关联分类器是建立在事件频率的基础上,所以需要许多描述每个类行为的样本来有效地学习预测类标签数据。因此,从数据集中移除数量小于阈值Sn的样本。这种修剪减少了类的数量,从30个组件和45个故障原因减少到表3中的最终数量,其结果是通过设置Sn=100获得的。
表3关联分类器挖掘规则结果(Sn=100,Fi=10%,minsup=5%,minconf=40%)
接下来采用Scikitlearn中提供的基于随机森林的特征选择方法,以选择最相关的属性,从而降低模型的复杂性。对于最重要特征值,去除那些重要度低于阈值Fi的特征。表3给出了在Fi=10%的情况下,特征选择过程后可用的特征数量。对于AFW时间窗口而言,可用的特征数量明显高于PFW窗口,也即意味着不论是对于故障原因还是受故障波及的组件,整个SCADA数据集对于故障的诊断潜力要略高于对故障的预测潜力。
针对最小支持阈值和最小置信阈值的不同值,对关联分类器的结果进行了分析。本发明中L3关联分类器设定最小支持度为5%,最小置信度为40%。需要区分的是,关联分类器的最小支持度阈值被引用到每个类中,而在关联规则挖掘的最小支持阈值是应用于整个数据集。因此,关联分类器的5%阈值意味着只有当其支持度至少是该类标签样本数的5%时,才能为给定的类标签提取相应的规则。
为了评估预测-诊断潜力,分析了关联分类器规则度量指标的分布,分别用于PFW(预测)和AFW(诊断),以及每个类标签(故障波及组件或故障原因),测试结果如图3所示。通过利用个度量指标:置信度和提升度。在大多数情况下,从PFW(预测)和AFW(诊断)结果的比较中可以发现诊断规则具有更好的度量指标。
具体来说,当目标类是受故障波及的组件时,见图3(a),其通常具有更高的度量指标。最高度量指标总是属于AFW,具有更高的支持度和提升度,以及稍高的置信度。当分类器针对故障原因时,见图3(b)。AFW和PFW规则对于度量指标有较为相似的值。然而,应该考虑,故障原因-PFW分类问题要容易得多,因为与故障原因-AFW(9类)相比,故障原因-PFW类(3)的数量要低得多,如表3所示。因此,SCADA数据集的故障诊断潜力依旧略高于故障预测潜力。为再次证明上述结论,在70%的数据集上训练了一个基于L3的预测模型,并在剩余的30%上测试了模型生成的规则,以预测受故障波及的组件和故障诱因。分类结果如表4所示,其证实了规则挖掘分析表明的预测潜力较低。故障原因预测L3模型为927个样本(96%的测试集)提供了一个标签,平均精度(mAP)为0.34,平均召回率(Recall)为0.54,对大多数类的预测不平衡。受故障波及组件预测L3模型得到的结果甚至更低,平均精度低到0.01,平均召回率为0.12,预测结果极不平衡。
表4基于L3关联分类器预测模型
表5显示在PFW或AFW期间观察到的SCADA事件,以及具有最高置信度的关联规则的相应结果。在每组(组件/原因,PFW/AFW)中,检查了前15条规则,显示了每个子集内最小置信度的值:组件-PFW-64.3%;原因-PFW-83.6%;组件-AFW-63.3%;原因-AFW-69.4%。
表5 SCADA事件高置信度规则
在组件-PFW的情况下,所有检查的规则都显示架空线路或电缆作为PSI所波及的电网组件。这是相当合理的,因为大多数保护、开关以及断路器都是安装来操作它们的。
此外,短路故障在规则中也会多次出现,因为它们会给系统带来相对较高的影响。关于故障原因-PFW,较少有意义的规则被识别,其中一部分规则显示,考虑到一些SCADA事件的发生(永久故障,中压线路断开),一些植物可能会接触到电网的某个组件,但这些事件不太可能专门预测这种PSI。各种类型的中压线路断开可能导致PSI影响这种类型的组件。最后,在原因-AFW的情况下,可以观察到,当接地故障被记录时,自动重合闸继电器(DRA)不能解决问题时,这是由于电气故障所导致。这与运行经验是一致的,因为DRA只有在故障的原因可以在短时间内自行解决的情况下才有用,例如短暂接触异物。
本发明分析了实际运行的中压配电网记录的6年数据,目的是将SCADA事件用于评估严重故障PSI(即永久服务中断)的预测和诊断潜力。所提出的方法,包括时间窗数据表征、关联规则挖掘提取和关联分类分析,能够评估数据用于故障预测和诊断的潜力。具体而言,收集的监控和数据采集系统事件可以有效地支持故障诊断任务,包括受影响组件和故障原因的诊断,而它们对于故障预测的潜力是有限的。经过关联分类分析,数据中在AFW时间窗中有较强的关联规则,但在PFW时间窗中,所能提取的故障特征量却具有较小的相关性,并且基于这些规则的预测模型在平均精度和平均召回率中也显示了较低的应用潜力。本发明对SCADA数据进行了详尽的分析,确定了相应数据集对PSI的预测和诊断潜力,为后续的研究提供了部分参考,未来工作可以研究如何提高SCADA数据对不同类型故障的诊断精度,以便实现大数据的充分利用。
Claims (7)
1.基于大数据驱动的电网故障预测与诊断模型建模方法,其特征在于:考虑以数据采集与监控系统SCADA在实际中压配电网络中收集的数据集,由基于数据特征提取、时间窗、关联规则挖掘和关联分类器分析的方法进行评估,并自动识别相关性,从故障中断前后时间窗,建立预测-诊断模型。
2.基于大数据驱动的电网故障预测和诊断方法,其特征在于包括以下步骤:
步骤一、以某地区电网N年的大数据集为基础,并通过数据采集与监控系统SCADA提取所记录的事件和故障;
步骤二、时间窗口化阶段:
在该阶段,将数据采集与监控系统SCADA中所记录的数据进行窗口化模块处理,以提取故障前和故障后的时间窗口,为基于数据集的故障表征提供基础;
步骤三:关联规则挖掘阶段:
该阶段自动识别代表故障前和故障后窗口的所有强耦合关联规则;
步骤四:关联分类器分析阶段:
用于评估数据集的预测-诊断潜力。
3.根据权利要求2所述基于大数据驱动的电网故障预测和诊断方法,其特征在于:所述步骤一中,对符合以下三点的故障进行特征提取:
①故障持续事件超过180秒;
②故障位置已被识别;
③故障诱因已被确定;
这些故障事件被认定为永久服务中断PSI,故障事件包含45种不同的故障原因并与30个受不同程度影响的电网组件相关联。
4.根据权利要求2所述基于大数据驱动的电网故障预测和诊断方法,其特征在于:所述步骤二中,时间窗口指的是:在时间维度上,定义了一个PSI发生前的时间窗口,称为故障前窗口PFW,紧接PSI发生后的时间窗口,称为故障后窗口AFW;
在空间维度中,只考虑在电网中发生PSI的同一部分观察到的SCADA事件,即由作为收集数据来源的同一馈线报告的事件;考虑到最关注的是预测未来一个月内发生PSI的可能性,因此设定PFW的时间窗口为1、7、30天,AFW的时间窗口为1小时、1天、7天。
5.根据权利要求2所述基于大数据驱动的电网故障预测和诊断方法,其特征在于:所述步骤三中,关联规则挖掘指的是:
设D是一个数据集,其一般记录r由一组同时发生的事件组成,即在同一时间窗口内发生的事件;每个事件,也称为项,是一对属性值,该属性为SCADA事件类型、故障原因、故障波及组件,如果该属性在某时间窗口中为真,则该值为1,否则为0;
SCADA事件可能表示在分析PSI之前或之后发生的另一个PSI或小故障;项目集I是数据集D记录r中一组共同发生的事件、故障波及组件、故障原因;PFW或AFW中的这一组项目I够成了规则挖掘提取的输入特征量;
项目集I的支持度计数是包含I的记录r的数目;项目集I的支持度是S(I)是包含I的记录r相对于整个数据集中记录r的总数的百分比;当其支持度大于或等于最小支持度阈值Minsup时,则称项集是频繁的。
6.根据权利要求5所述基于大数据驱动的电网故障预测和诊断方法,其特征在于:
所述步骤三中,
关联规则挖掘的目的是根据统计相关的度量,识别经常存在于分析数据集中的频繁项集;为了提取在数据挖掘过程中最有意义的关联规则,可以利用支持度、置信度和提升度作为相应的度量指标;
支持度S(X,Y)表示在数据集中包含X和Y记录的百分比,它代表了X∪Y的先验概率,其概率表达式如式(1)所示;
置信度C(X→Y)表示在Y发生的条件下X发生的可能性,其概率表达式如式(2)所示;
S(X→Y)=P(X∪Y) (1)
当挖掘出一定关联规则后,采用提升度来删除冗余规则,使得挖掘结果更加精炼;
提升度代表一条关联规则X→Y前因后果的相关程度,其概率表达式如式(3)所示;如果提升度L(X,Y)=1,则代表二者在统计上是相互独立的,项集X和Y不相关;如果提升小于1,则表示项集X和Y之间呈现负相关,而提升度高于1的关联规则则表示X和Y呈现正相关,较高的提升度代表了更强的关联规则;
7.根据权利要求1所述基于大数据驱动的电网故障预测和诊断方法,其特征在于:所述步骤四中,关联规则从通用预测-诊断方法中提取,关联规则属性包括a.受故障影响的成分;b.故障的原因,这是预测-诊断背景中两个期望的目标变量;使用的关联分类器是L3型分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110786418.XA CN113589098A (zh) | 2021-07-12 | 2021-07-12 | 基于大数据驱动的电网故障预测和诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110786418.XA CN113589098A (zh) | 2021-07-12 | 2021-07-12 | 基于大数据驱动的电网故障预测和诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113589098A true CN113589098A (zh) | 2021-11-02 |
Family
ID=78247099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110786418.XA Pending CN113589098A (zh) | 2021-07-12 | 2021-07-12 | 基于大数据驱动的电网故障预测和诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113589098A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116660672A (zh) * | 2023-08-02 | 2023-08-29 | 国网四川省电力公司乐山供电公司 | 基于大数据的电网设备故障诊断方法及系统 |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996077A (zh) * | 2014-05-22 | 2014-08-20 | 中国南方电网有限责任公司电网技术研究中心 | 一种基于多维时间序列的电气设备故障预测方法 |
CN104020396A (zh) * | 2014-06-12 | 2014-09-03 | 国家电网公司 | 一种基于数据挖掘的电网故障诊断方法 |
CN104268375A (zh) * | 2014-09-10 | 2015-01-07 | 中国人民解放军海军工程大学 | 基于知识petri网的船用电站故障诊断方法 |
CN104698343A (zh) * | 2015-03-26 | 2015-06-10 | 广东电网有限责任公司电力调度控制中心 | 基于历史录波数据的电网故障判断方法和系统 |
CN105974265A (zh) * | 2016-04-29 | 2016-09-28 | 北京四方继保自动化股份有限公司 | 一种基于svm分类技术的电网故障原因诊断方法 |
CN106383920A (zh) * | 2016-11-28 | 2017-02-08 | 东南大学 | 一种基于关联规则的重特大交通事故致因识别方法 |
CN107797063A (zh) * | 2017-09-19 | 2018-03-13 | 北京瑞盈同创智能技术研究院有限公司 | 基于scada的风电机组运行状态评估及故障诊断方法 |
CN108267673A (zh) * | 2018-01-23 | 2018-07-10 | 国网山东省电力公司德州供电公司 | 一种配网故障选线大数据降维方法和装置 |
CN109387740A (zh) * | 2018-09-18 | 2019-02-26 | 中国路桥工程有限责任公司 | 一种铁路配电网故障信息诊断系统及方法 |
CN110244184A (zh) * | 2019-07-04 | 2019-09-17 | 国网江苏省电力有限公司 | 一种频繁项集的配网线路故障规律挖掘方法、系统及介质 |
CN110632439A (zh) * | 2019-09-29 | 2019-12-31 | 国网河南省电力公司电力科学研究院 | 基于同步波形与关联规则的配电网单相接地故障诊断技术 |
CN110765185A (zh) * | 2019-11-15 | 2020-02-07 | 王靖淏 | 一种基于智能配电网的故障诊断方法 |
CN111552843A (zh) * | 2020-04-23 | 2020-08-18 | 中国电子科技集团公司第五十四研究所 | 一种基于加权因果依赖图的故障预测方法 |
CN111950084A (zh) * | 2020-08-11 | 2020-11-17 | 中国民航大学 | 一种面向机载航线维修的航电故障诊断系统的实现方法 |
WO2021016978A1 (zh) * | 2019-08-01 | 2021-02-04 | 中国科学院深圳先进技术研究院 | 电信网络告警预测方法及系统 |
CN112348339A (zh) * | 2020-10-28 | 2021-02-09 | 国网信通亿力科技有限责任公司 | 一种基于大数据分析的配电网规划方法 |
CN112464439A (zh) * | 2020-11-02 | 2021-03-09 | 天津理工大学 | 基于三层数据挖掘的电力系统故障类型分析方法及装置 |
-
2021
- 2021-07-12 CN CN202110786418.XA patent/CN113589098A/zh active Pending
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996077A (zh) * | 2014-05-22 | 2014-08-20 | 中国南方电网有限责任公司电网技术研究中心 | 一种基于多维时间序列的电气设备故障预测方法 |
CN104020396A (zh) * | 2014-06-12 | 2014-09-03 | 国家电网公司 | 一种基于数据挖掘的电网故障诊断方法 |
CN104268375A (zh) * | 2014-09-10 | 2015-01-07 | 中国人民解放军海军工程大学 | 基于知识petri网的船用电站故障诊断方法 |
CN104698343A (zh) * | 2015-03-26 | 2015-06-10 | 广东电网有限责任公司电力调度控制中心 | 基于历史录波数据的电网故障判断方法和系统 |
CN105974265A (zh) * | 2016-04-29 | 2016-09-28 | 北京四方继保自动化股份有限公司 | 一种基于svm分类技术的电网故障原因诊断方法 |
CN106383920A (zh) * | 2016-11-28 | 2017-02-08 | 东南大学 | 一种基于关联规则的重特大交通事故致因识别方法 |
CN107797063A (zh) * | 2017-09-19 | 2018-03-13 | 北京瑞盈同创智能技术研究院有限公司 | 基于scada的风电机组运行状态评估及故障诊断方法 |
CN108267673A (zh) * | 2018-01-23 | 2018-07-10 | 国网山东省电力公司德州供电公司 | 一种配网故障选线大数据降维方法和装置 |
CN109387740A (zh) * | 2018-09-18 | 2019-02-26 | 中国路桥工程有限责任公司 | 一种铁路配电网故障信息诊断系统及方法 |
CN110244184A (zh) * | 2019-07-04 | 2019-09-17 | 国网江苏省电力有限公司 | 一种频繁项集的配网线路故障规律挖掘方法、系统及介质 |
WO2021016978A1 (zh) * | 2019-08-01 | 2021-02-04 | 中国科学院深圳先进技术研究院 | 电信网络告警预测方法及系统 |
CN110632439A (zh) * | 2019-09-29 | 2019-12-31 | 国网河南省电力公司电力科学研究院 | 基于同步波形与关联规则的配电网单相接地故障诊断技术 |
CN110765185A (zh) * | 2019-11-15 | 2020-02-07 | 王靖淏 | 一种基于智能配电网的故障诊断方法 |
CN111552843A (zh) * | 2020-04-23 | 2020-08-18 | 中国电子科技集团公司第五十四研究所 | 一种基于加权因果依赖图的故障预测方法 |
CN111950084A (zh) * | 2020-08-11 | 2020-11-17 | 中国民航大学 | 一种面向机载航线维修的航电故障诊断系统的实现方法 |
CN112348339A (zh) * | 2020-10-28 | 2021-02-09 | 国网信通亿力科技有限责任公司 | 一种基于大数据分析的配电网规划方法 |
CN112464439A (zh) * | 2020-11-02 | 2021-03-09 | 天津理工大学 | 基于三层数据挖掘的电力系统故障类型分析方法及装置 |
Non-Patent Citations (3)
Title |
---|
EVANDRO AGOSTINHO RECHE: "Data Mining-Based Method to Reduce Multiple Estimation for Fault Location in Radial Distribution Systems", 《IEEE TRANSACTIONS ON SMART GRID》, 31 December 2019 (2019-12-31) * |
GANG FANG: "A Double Algorithm of Web Usage Mining Based on Sequence Number", 《2009 INTERNATIONAL CONFERENCE ON INFORMATION ENGINEERING AND COMPUTER SCIENCE》, 31 December 2009 (2009-12-31) * |
李征: "一种基于关联规则与 K-means 的领域本体构建方法", 《河南师范大学学报(自然科学版)》, vol. 48, no. 1, 31 January 2020 (2020-01-31) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116660672A (zh) * | 2023-08-02 | 2023-08-29 | 国网四川省电力公司乐山供电公司 | 基于大数据的电网设备故障诊断方法及系统 |
CN116660672B (zh) * | 2023-08-02 | 2023-10-10 | 国网四川省电力公司乐山供电公司 | 基于大数据的电网设备故障诊断方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Anderson et al. | An improved model for protective-system reliability | |
Billinton et al. | Weather-based distribution system reliability evaluation | |
CN106019084B (zh) | 基于配用电数据关联的中压配电网断线故障诊断方法 | |
CN103971024A (zh) | 小样本失效数据下继电保护系统可靠性评估方法 | |
CN108988487B (zh) | 一种基于多维数据的电网停电事件辨识方法 | |
CN108491990A (zh) | 一种风电场设备状态评价及检修决策支持检测方法及系统 | |
CN106842106A (zh) | 电能表故障预测方法和装置 | |
Rahman et al. | Largest blackouts around the world: Trends and data analyses | |
CN112561736A (zh) | 智能变电站继电器保护装置故障诊断系统和方法 | |
CN113268590A (zh) | 一种基于设备画像和集成学习的电网设备运行状态评估方法 | |
Renga et al. | Data-driven exploratory models of an electric distribution network for fault prediction and diagnosis | |
CN113589098A (zh) | 基于大数据驱动的电网故障预测和诊断方法 | |
CN114493238A (zh) | 供电服务风险预测方法、系统、存储介质及计算机设备 | |
JP3213304B2 (ja) | 配電線事故診断方法及びその装置 | |
Fogliatto et al. | Power distribution system interruption duration model using reliability analysis regression | |
Sun et al. | A multi-model-integration-based prediction methodology for the spatiotemporal distribution of vulnerabilities in integrated energy systems under the multi-type, imbalanced, and dependent input data scenarios | |
CN108596450B (zh) | 电网风险预警方法和系统 | |
Nisi et al. | Transparently Mining Data from a Medium-voltage Distribution Network: A Prognostic-diagnostic Analysis. | |
CN110261143A (zh) | 中低速磁浮列车在线运营条件下的可靠性试验方法及系统 | |
Meléndez et al. | Analysis of sequences of events for the characterisation of faults in power systems | |
CN115267616A (zh) | 基于企业数据中台的变压器运行状态监测系统及方法 | |
CN111313355B (zh) | 一种人工监督下的监控信号事件规则更新的方法 | |
Da Silva et al. | Reliability evaluation of distribution systems considering automatic reclosers | |
CN110674193A (zh) | 一种智能变电站继电保护故障信息建模方法 | |
Jiang et al. | A Gaussian process based fleet lifetime predictor model for unmonitored power network assets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |