CN113496262A - 数据驱动的有源配电网异常状态感知方法及系统 - Google Patents

数据驱动的有源配电网异常状态感知方法及系统 Download PDF

Info

Publication number
CN113496262A
CN113496262A CN202111046394.0A CN202111046394A CN113496262A CN 113496262 A CN113496262 A CN 113496262A CN 202111046394 A CN202111046394 A CN 202111046394A CN 113496262 A CN113496262 A CN 113496262A
Authority
CN
China
Prior art keywords
data
abnormal state
power distribution
distribution network
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111046394.0A
Other languages
English (en)
Other versions
CN113496262B (zh
Inventor
吕天光
王邵瑞
陈建
李文博
孙东磊
艾芊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202111046394.0A priority Critical patent/CN113496262B/zh
Publication of CN113496262A publication Critical patent/CN113496262A/zh
Application granted granted Critical
Publication of CN113496262B publication Critical patent/CN113496262B/zh
Priority to JP2022071358A priority patent/JP7240691B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
    • Y04S10/52Outage or fault management, e.g. fault detection or location

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种数据驱动的有源配电网异常状态感知方法及系统,包括:获取配电网异常状态发生后的节点参数数据,将数据输入到训练好的配电网异常状态预测模型中,输出配电网异常状态预测结果;其中,配电网异常状态预测模型的训练过程包括:对配电网历史异常状态节点参数数据进行聚类,通过关联规则算法找出与配电网异常状态类型强相关的数据样本,形成用于进行训练的样本数据集;基于样本数据集对配电网异常状态预测模型进行训练。本发明采用三层数据挖掘结构,通过数据分类与关联规则提取,得到含有与对应异常状态类型强关联的数据样本,能够提高数据集的利用效率,提高异常状态预测精度,缩短计算时间,减小预测误差。

Description

数据驱动的有源配电网异常状态感知方法及系统
技术领域
本发明涉及配电网异常状态分类与预测技术领域,尤其涉及一种数据驱动的有源配电网异常状态感知方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着有源配电网智能实时监测的深入,监测与保护装置大量的安装在有源配电网中,通过这些装置采集电网运行状态数据,基于数据分析处理,判断有源配电网的运行状态是否正常。然而这样的诊断方案需要耗费大量的成本装设监测设备,同时存在诊断低精度的问题。
为了避免上述这些传统故障诊断方案的问题,人工智能依靠其自学习自趋优等优点,被用于有源配电网短路故障、断线故障或者过负荷等异常状态的诊断中。常见故障诊断方法有专家系统、模糊理论、人工神经网络、贝叶斯网络和Petri网等方法。基于专家系统的故障诊断方法利用有源配电网的运行状态等数据,结合专家的经验知识,建立了一个专家模型,对故障类型进行推断。基于模糊理论的诊断方法通过模糊控制实现对任意非线性连续函数的逼近模拟。基于人工神经网络的诊断方法模仿人类大脑或者自然神经网络,对已有的历史数据进行建模,完成相关参数的训练,从而获得问题的解集。基于Petri网络的诊断方法能对离散的动态有源配电网故障进行有效处理,无需复杂的信息库,但存在容错能力差的问题。
在有源配电网规模庞大,故障数据较多情况下,对故障数据的分析效果很大程度上依赖于算法的选择。并且,目前大多数结合人工智能的故障诊断方案往往只采用了单一的人工智能算法或模型,其诊断精确程度有待提高,且存在容错能力差、对专家经验依赖性强等的局限性。
发明内容
为了解决上述问题,本发明提出了一种数据驱动的有源配电网异常状态感知方法及系统,使用三层数据挖掘对有源配电网异常状态进行分类和预测,可以针对性地解决异常状态分类与预测精度低、时间长的问题。
为了实现上述目的,在一些实施方式中,采用如下技术方案:
一种数据驱动的有源配电网异常状态感知方法,包括:
获取配电网异常状态发生后的节点参数数据,将所述数据输入到训练好的配电网异常状态预测模型中,输出配电网异常状态预测结果;
其中,所述配电网异常状态预测模型的训练过程包括:对配电网历史异常状态节点参数数据进行聚类,通过关联规则算法找出与配电网异常状态类型强相关的数据样本,形成用于训练的样本数据集;基于所述样本数据集进行所述配电网异常状态预测模型的训练。
作为进一步地方案,所述对配电网历史异常状态节点参数数据进行聚类,具体过程包括:
基于欧氏距离对数据样本进行分类;
通过判别函数判断数据样本聚类是否完成;
计算误差平方和,通过SSE-K曲线图确定参考的聚类个数,基于所述参考的聚类个数,确定最终的聚类个数。
作为进一步地方案,在对配电网历史异常状态节点参数数据进行聚类之后,还包括:
对聚类后的数据样本进行自编码,形成第一样本数据集,第一样本数据集中的元素为向量,每一个向量由TV和Fi构成;其中,TV ={N0C 1 , N0C 2 ,. . .,N0C a }为自编码后的数据,C取值范围为[1, K],a为进行数据采集的节点编号;Fi为异常状态类型的值;
所述自编码后的数据至少包含数据所在的节点位置信息和数据所属的聚类类别信息。
作为进一步地方案,所述通过关联规则算法找出与配电网异常状态类型强相关的数据样本,形成用于进行训练的样本数据集,具体包括:
将第一样本数据集中每一个向量的两类元素TV与Fi合并为一类元素,组成新的数据集M:{Z1,Z2,…,Zi},其中Zi表示一个自编码后的数据与对应异常状态类型组成的新矢量;i为新矢量的个数;
用频繁项集的支持度和可信度量化所述新矢量中两个或多个元素之间的联系,将满足支持度和可信度要求的非0矢量提取出来,形成第二样本数据集,所述第二样本数据集用于进行配电网异常状态预测模型的训练。
作为进一步地方案,所述的基于所述样本数据集对所述配电网异常状态预测模型进行训练,具体包括:
基于得到的样本数据集,采用随机梯度下降算法进行回归训练,得到配电网异常状态预测模型的最优参数解。
作为进一步地方案,所述配电网异常状态预测模型具体为:
Figure 277315DEST_PATH_IMAGE001
其中,w为预测模型函数的权重矢量,b表示预测模型函数的截距,wT(CVj)表示矢量w与矢量CVj的数量积;矢量CVj为训练样本。
作为进一步地方案,还包括:通过优化目标函数来衡量所述配电网异常状态预测模型的拟合度,所述优化目标函数具体为:
Figure 621709DEST_PATH_IMAGE002
其中,L(Fi,f(CVj))表示损失函数,α为超参数,为设定值; R(w)为正则项;n为样本数据集总量,Fi为异常状态类型的值。
在另一些实施方式中,采用如下技术方案:
一种数据驱动的有源配电网异常状态感知系统,包括:
数据获取模块,用于获取配电网异常状态发生后的节点参数数据;
异常状态预测模块,用于将所述数据输入到训练好的配电网异常状态预测模型中,输出配电网异常状态预测结果;
其中,所述配电网短路异常状态模型的训练过程包括:对配电网历史故障节点参数数据进行聚类,通过关联规则算法找出与配电网短路异常状态强相关的数据样本,形成用于进行训练的样本数据集;基于所述样本数据集对所述配电网异常状态预测模型进行训练。
与现有技术相比,本发明的有益效果是:
(1)本发明含分布式电源的配电网异常状态预测采用三层数据挖掘结构,通过数据分类与关联规则提取,得到含有与对应故障类型强相关的数据样本,能够提高数据集的利用效率;通过三层数据挖掘结构可以提高异常状态的预测精度,缩短计算时间,减小预测误差。
(2)本发明提出了自编码简化数据格式的方法,通过设置不同异常状态类型标签,有效避免了数据关联性不清晰、不明确的问题,从而使与异常状态类型有强相关的数据能被精准的提取出来,增强了数据集的有效性。
附图说明
图1为本发明实施例中第一层数据挖掘过程的流程图;
图2为本发明实施例中第三层数据挖掘过程的流程图;
图3为本发明实施例中误差平方和SSE与参考K值的曲线示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
在一个或多个实施方式中,公开了一种数据驱动的有源配电网异常状态感知方法,包括以下过程:
(1)获取配电网异常状态发生后的节点参数数据;其中,节点参数数据包括但不限于:节点电压数据或节点电流数据。
(2)将所述数据输入到训练好的配电网异常状态预测模型中,输出配电网异常状态预测结果。
其中,所述配电网异常状态预测模型的训练过程包括:对配电网历史异常状态节点参数数据进行聚类,通过关联规则算法找出与配电网异常状态类型强相关的数据样本,形成用于进行训练的样本数据集;基于得到的样本数据集对配电网异常状态预测模型进行训练。
本实施例配电网异常状态预测主要针对单相接地短路、两相相间短路、两相接地短路和三相短路四种有源配电网短路故障以及负荷异常和断线故障。
本实施例中,对于每一种异常状态,分别建立一个预测模型,以四种短路故障、负荷异常和断线故障为例,对这些异常状态分别建立预测模型,建模方法和思路都相同,在总的预测系统中可以包含这些异常状态,将异常状态发生后的数据输入,预测模型并行计算,最后得出较为可靠的预测结果。
本实施例使用三层数据挖掘方法实现对配电网异常状态预测模型的训练:
第一层数据挖掘利用K均值聚类算法对原始异常状态数据进行分类,然后利用一种自编码规则以简化原始异常状态数据的格式。
第二层数据挖掘在第一层得到的已经分类的异常状态数据的基础上,利用关联规则,有效剔除对异常状态预测结果影响较小的数据,并将与配电网异常状态类型存在强相关的数据提取出来,作为预测模型参数回归训练的数据集。
其中,与配电网异常状态类型存在强相关的数据样本指的是满足设定的最小支持度,且满足设定的最小可信度的数据样本。
第三层数据挖掘利用随机梯度下降算法,以第二层数据挖掘得到的数据作为训练集,来获取每一种异常状态类型的预测模型。
下面分别对三层数据挖掘过程进行详细说明。
1.第一层数据挖掘
首先采集异常状态发生后的节点电压数据,再利用K均值聚类算法对这些数据进行分类。本实施例提出了一种自编码规则,用来对分类完成的数据进行编码,以简化数据的格式。K均值聚类算法和自编码共同组成了第一层数据挖掘过程,经过第一层数据挖掘处理产生的数据组成第一样本数据集。
参照图1,K均值聚类算法主要包含了三个方面:欧氏距离用于数据样本分类;判别函数用于判断样本聚类是否完成;手肘法用于确定参考的聚类数K值,然后基于参考的聚类数K值确定最终的K值。
具体地,K均值聚类算法根据样本点与各类中心样本点之间的欧氏距离来判断该数据样本属于某一个聚类。当一个数据样本与某一类中心样本点之间的欧氏距离最小时,则该数据样本属于此中心样本点所在的聚类。欧式距离计算公式如下:
Figure 385266DEST_PATH_IMAGE003
其中P = (p1, p2, . . .,pn)表示n维空间里的一个数据样本,例如在三机九节点系统里,n=9,则P = (p1, p2, . . .,p9)表示某一时刻九个节点的电压数据。
Figure 688071DEST_PATH_IMAGE004
表示第j个聚类的中心样本点,P、Qj均为矢量。在首次迭代计算欧氏距离的过程中,各聚类的中心样本点可以任意选取。
在分类没有完成时,需要对各聚类的中心点进行更新。取每个聚类中所有样本数据的平均值作为下一次迭代的新的中心点,同时用判别函数来判断迭代更新是否停止,也即分类是否完成。这里的判别函数表示所有聚类中的样本与样本中心的差的平方总和最小,其计算公式为:
Figure 169868DEST_PATH_IMAGE005
其中K表示分类的个数,
Figure 317953DEST_PATH_IMAGE006
表示第j个聚类的样本中心,Pj表示第j个聚类中的任一个样本数据,
Figure 936016DEST_PATH_IMAGE007
均表示n维样本数据中的一个元素。
当公式(2)表示的判别函数收敛到最小时,各聚类的样本中心将不再明显变化,此时停止迭代,分类过程完成,所有的样本点将分为K类。
K均值聚类算法的一个缺点在于无法提前知道分类的个数,导致聚类过程难以很好的进行,同时聚类质量不高。因此获得参考的聚类数K是该聚类算法的关键;
本实施例采用手肘法,通过计算误差平方和(SSE),获取参考的K值。当K越来越大时,原始数据的分类越来越精细,同时,每一个聚类的聚合度越来越高,而误差平方和越来越小。因此当K取到某一个值时,误差平方和会骤降,反映在SSE-K曲线图中则是SSE曲线的斜率陡然变缓,斜率下降速度最快,再随着K变大,而SSE将缓慢变化。这样的变化趋势形似手肘弯曲的肘部,故将这种方法称为手肘法。手肘部位对应的K值即为参考的聚类数。
误差平方和的计算公式如下:
Figure 409722DEST_PATH_IMAGE008
在迭代计算SSE的过程中,K为人为取定的数值,往往从1开始增大,直到合适的上限(比如15,可以更好的观察曲线趋势),最终通过SSE-K曲线确定参考的K值。Ci表示第i个聚类,p表示Ci中的任一个数据样本,mi表示Ci中所有样本数据的平均值,也就是其样本中心。
基于参考的K值,结合数据样本容量和数据格式的冗杂程度,确定最终的K值;最终的K值为大于或等于参考K值的数。
经过K均值聚类算法之后,每一聚类的数据样本有特定的相似性,但是此时数据格式仍然比较复杂,不适合进一步的处理。本实施例采取自编码的方法,对已经分完类的数据进行简化。为了保留原始数据的关键信息,例如该数据所在的节点以及该数据所在聚类,采用如下编码规则进行自编码:N0C(4)
其中,N表示该数据所在的节点位置,C表示该数据所属的聚类,中间的0为了便于识别,无实义。以某一数据经过自编码之后,数据格式为406为例,406表示某一时刻节点4的电压数据属于聚类6。
上述自编码规则只针对节点数据,异常状态类型的数据标签人为设定,比如,本实施例中,异常状态类型的值Fi
Figure 113236DEST_PATH_IMAGE009
{110, 120, 130, 100,140,150},当Fi=110时,异常状态为单相接地故障,当Fi=120时,异常状态为两相相间故障,当Fi=130时,异常状态为两相接地故障,当Fi=100时,异常状态为三相短路故障,当Fi=140时,异常状态为负荷异常,当Fi=150时,异常状态为断线故障。
初始数据集{NV,Fi}经过以上K均值聚类和自编码处理之后,组成了第一样本数据集,第一样本数据集中的元素为向量,每一个向量由TV和Fi构成;其中,TV ={N0C 1 , N0C 2 ,.. .,N0C a }为自编码后的数据,C取值范围为[1, K],a为进行数据采集的节点编号,但不包含故障节点;Fi为异常状态类型的值。
2.第二层数据挖掘
有源配电网中异常状态类型与节点电压之间存在一定的联系,异常状态发生时,节点电压波形也会产生相应的变化,本实施例将关联规则算法应用于第二层数据挖掘,以找出与对应的异常状态类型强相关的数据样本,将这些数据作为训练集,训练出异常状态预测模型,从而提高模型的精确度。
Apriori算法是一类挖掘频繁项集的关联规则算法。首先将第一样本数据集中的两类元素TV与Fi合并为一类元素,即将相对应的异常状态类型和节点电压数据组成一个矢量,形成了新的数据集M:{Z1,Z2,…,Zi},其中Zi表示一个自编码后的数据与对应异常状态类型组成的新矢量,i表示新矢量的个数。
用频繁项集的支持度和可信度量化所述新矢量中两个或多个元素之间的联系,将满足支持度和可信度要求的非0矢量提取出来,形成第二样本数据集,用于进行配电网异常状态预测模型的训练。
频繁项集的关联规则也就是一个矢量中,两个或多个元素之间的联系,这种联系用频繁项集的支持度和可信度量化,从而测量元素之间的关联度。满足支持度和可信度要求的非0矢量被提取出来,组成第二样本数据集。
假设Zx、Zy分别为数据集M中的两个非0矢量,则支持度和可信度的计算公式将在下面进行阐述。
支持度表示Zx和Zy同时出现的概率,计算公式为:
Figure 799433DEST_PATH_IMAGE010
其中,Zx、Zy分别为数据集M中的两个非0矢量。
可信度表示Zx出现时,Zy同时出现的概率,计算公式如下:
Figure 537581DEST_PATH_IMAGE011
数据集M中满足上述支持度、可信度要求的非0矢量,将被提取出来;然后数据集M中的每一个元素再按照节点数据和异常状态类型拆分成[CV,Fi]的形式,组成第二样本数据集;其中CV表示被提取出来的样本数据,与异常状态类型的值Fi相对应。
原始数据集、第一样本数据集和第二样本数据集的区别在于:
原始数据集、第一样本数据集有相同的维度和样本数量,第一样本数据集是原始数据集经过K均值聚类和自编码处理之后产生的,而第二样本数据集是第一样本数据集经过关联规则算法处理后产生的,仅含有与对应异常状态类型强相关的数据样本,其样本数量与第一样本数据集相比大大减少。
3.第三层数据挖掘
经过前两层数据挖掘之后,原始数据得到了分类,与有源配电网异常状态类型具有强相关关系的数据样本被挖掘出来,组成了第二样本数据集。
作为具体的示例,原始数据集中的数据有4万组,经过处理后的第二样本数据集中的数据在2.5-3万组,数据量大幅下降。
参照图2,第三层数据挖掘以第二样本数据集作为训练集,采用随机梯度下降(SGD)算法通过回归训练,获取异常状态预测模型的最佳参数。
随机梯度下降算法是一种迭代优化算法,常被用来解决机器学习里的模型参数的最优化问题。随机梯度下降算法是梯度下降算法的改进形式,已被成功应用在文本分类、自然语言处理等大型稀疏机器学习问题中。梯度用来获取多元函数的参数偏微分,并将其组成为一个矢量。当梯度中的所有偏微分均为0时,也就得到了模型参数的最优解。随机梯度下降算法每次进行迭代时,只随机使用一个样本数据,当样本总量很大,只有小部分样本被用于迭代计算,从而减少了模型训练时间。
本实施例以第二样本数据集作为训练集,假设每一节点的电压数据的权重是线性的,从而建立了一个线性的模型函数,如下:
Figure 182189DEST_PATH_IMAGE012
其中,w为预测模型函数的权重矢量,b表示预测模型函数的截距,wT(CVj)表示矢量w与矢量CVj的数量积。
损失函数用来衡量实际异常状态类型值Fi与模型预测值f(CVj)之间的差异,用L(Fi,f(CVj))表示,本发明采用逻辑回归损失函数,计算公式如下:
Figure 372999DEST_PATH_IMAGE013
风险函数是损失函数的期望值,用Er表示,计算公式如下:
Figure 128466DEST_PATH_IMAGE014
由此可见,目标函数就是要使风险函数最小化,然而,由于历史数据较多和函数的复杂度较高,容易导致预测结果的过拟合。为了避免这种情况发生,本发明引入结构风险函数,用Sr表示:
Figure 721121DEST_PATH_IMAGE015
其中,
Figure 271051DEST_PATH_IMAGE016
为设定的超参数,比如:0.1;通过设定
Figure 949157DEST_PATH_IMAGE016
来缩小参数的范围,从而达到简化模型的目的,并使模型有较好的泛化能力。正则项R(w)用来衡量损失函数的复杂度,起到限制损失函数参数的作用。本实施例采用L2正则化,即
Figure 242735DEST_PATH_IMAGE017
本实施例中,利用优化目标函数用来衡量预测模型的拟合度,当风险函数和结构风险函数越小时,模型拟合程度越高,最终的优化目标函数为:
Figure 955476DEST_PATH_IMAGE018
w为预测模型函数的权重矢量,b表示预测模型函数的截距,n为第二样本数据集总量,Fi为异常状态类型的值。
随机梯度下降算法每次使用一部分测试集进行迭代计算,当进行迭代时,模型参数按照下式进行更新:
Figure 410728DEST_PATH_IMAGE019
其中
Figure 576130DEST_PATH_IMAGE020
是随时间变化的学习速率,计算公式为:
Figure 407820DEST_PATH_IMAGE021
其中,t为时间步长,t0为初始时间。
本实施例基于三层数据挖掘结构,依次利用聚类算法、关联规则、随机梯度下降对原始数据进行处理,来训练有源配电网异常状态的预测模型,可以针对性地解决异常状态分类与预测精度低、时间长的问题,从而便于及时采取对应措施,以缩短异常状态持续时间,减少断电损失。
其他异常状态的感知预测方法与上述过程类似。
为了验证本实施例方法的效果,本实施例以IEEE三机九节点系统为例,在此模型的基础上,调试常见的四种短路故障以及负荷异常和断线故障,并采集节点电压数据,其中短路故障将故障节点设置在节点8,负荷异常设置为节点8处的负荷脱落,断线故障设置为线路7-8断开,采集除节点8以外的其他节点的电压数据。
(1)第一层数据挖掘
K均值聚类算法中先用手肘法确定合适的K值作为聚类数,当四种类型的短路故障发生时,提取节点2的短路电压幅值数据,通过手肘法之后,得到误差平方和SSE与K值的曲线如图3所示。由图3可见,K=5时,斜率下降速度最快,K>5时,SSE变化缓慢,因此,手肘处对应的参考K值为5;则最终的K值可以取大于或等于5的值(当最终的K值小于5时,分类精细程度不够,数据聚合度不够高),这样就缩小了K值的取值范围,有利于更快的取得更加合适的K值。
由于最终的K值大于或等于5时,不会丢失数据之间的相似特性,但是数值过大时,又会使得聚类数过多。结合本实施例的数据样本容量,为了在后续自编码的过程中,不会因聚类数较小而导致数据格式频繁重复,也不会因聚类数过多而使数据格式冗杂,便于第二层数据挖掘顺利进行,因此在本次实验中,在K=5的基础上,逐次递增选取K值试验,最终确定K=8,所有的数据样本分为8类,每一聚类的数据有更大的相似性。
数据经过分类之后,再按照自编码规则进行数据格式简化,以三相短路故障发生后的节点2电压数据为例,其电压值处于区间[-16.01kV,15.85kV],分为8类,则每一类为[-16.01kV,-12.03kV],[-12.03 kV,-8.04 kV],[-8.04 kV,-4.06 kV],[-4.06 kV,-0.08kV],[-0.08 kV,3.90kV],[3.90kV,7.88kV],[7.88 kV,11.87 kV],[11.87 kV,15.85kV],当某一时刻的电压值为5.36kV时,根据自编码规则,其数据格式变为206;以负荷异常发生后的节点4电压数据为例,其电压值处于区间[-196.582kV,206.754kV],分为8类,则每一类为[-196.582kV,-146.1648kV],[-146.164 kV,-95.747 kV],[-95.747 kV,-45.330 kV],[-45.330 kV,5.086 kV],[5.086 kV,55.503 kV],[55.503 kV,105.920 kV],[105.920 kV,156.337kV],[156.337 kV,206.754 kV],当某一时刻的电压值为20.048kV时,根据自编码规则,其数据格式变为405;以断线故障发生后的节点1电压数据为例,其电压值处于区间[-14.454 kV,14.468 kV],分为8类,则每一类为[-14.454kV,-10.839 kV],[-10.839 kV,-7.224kV],[-7.224 kV,-3.608kV],[-3.608kV,0.006 kV],[0.006kV,3.621kV],[3.621 kV,7.237kV],[7.237kV,10.852 kV],[10.852 kV,14.468 kV],当某一时刻的电压值为9.581kV时,根据自编码规则,其数据格式变为107。其余节点的电压数据经过同样的处理过程,其最终的结果如下表1所示。
表1数据库Ⅰ部分自编码数据
Figure 975068DEST_PATH_IMAGE022
(2)第二层数据挖掘
经过第一次数据挖掘之后,将数据库Ⅰ中的数据输入到Apriori算法中,进行强相关数据挖掘。首先,预先设置最小支持度为0.2,最小可信度为0.8,数据库Ⅰ中满足最小支持度的数据样本为频繁项集,频繁项集中满足最小可信度的数据为强相关数据。第二次数据挖掘的结果如表2所示。
表2第二次数据挖掘的结果
Figure 866800DEST_PATH_IMAGE023
以序号8的关联规则{205、407、603} → {130}为例,其表示当节点2的电压在第5聚类,节点4的电压在第7聚类,节点6的电压在第3聚类中时,异常状态类型为两相接地短路的可能性极大,以序号11的关联规则{508} → {140}为例,其表示当节点5的电压在第8聚类中时,异常状态类型为负荷异常的可能性极大,以序号14的关联规则{105、405、603} →{150}为例,其表示当节点1的电压在第5聚类中,节点4的电压在第5聚类中,节点6的电压在第3聚类中时,异常状态类型为断线故障的可能性极大。通过关联规则算法,得到的数据库Ⅱ如表3所示。
表3数据库Ⅱ部分数据
Figure 519499DEST_PATH_IMAGE024
(3)第三次数据挖掘
在第三次数据挖掘中,将超参数α设置为0.1,迭代次数为500次。将数据库Ⅱ数据样本输入到随机梯度下降算法中,训练出的模型参数如表4所示。
表4模型参数数据
Figure 154879DEST_PATH_IMAGE025
(4)结果分析
为了衡量以上分类与预测模型的准确性,本文用10000个数据样本作为测试集。异常状态分类与预测的准确性较高,三相短路故障预测模型准确率为85.30%,单相接地短路故障的模型的准确率为74.80%,两相相间短路模型的准确率为78.20%,而两相接地短路预测模型的准确率为87%,负荷异常预测模型准确率为93.29%,断线故障预测模型准确率为89.25%。
本方法基于三层数据挖掘,首先通过聚类和自编码,将所有的数据样本格式进行简化,对于某一节点的数据只有固定的K种格式,有效抹除了可能出现的异常数据以及坏点与正常数据之间的差异性(如幅值突变或数据缺失),同时充分挖掘数据之间的相似性,例如负荷异常时,节点4处的电压数据中出现了15个异常数据样本,通过聚类和自编码之后,这些异常数据点均属于第8聚类,即他们的数据格式均为408,在此情况下,如果第8聚类中包含大量数据,通过自编码将这些异常数据点同化为正常数据,从而降低了异常数据及坏点的影响,如果第8聚类中只有这15个数据样本,通过第二层强相关提取,即可减少这些数据。
通过第二层数据挖掘,按照支持度和可信度两个量化标准,将异常状态强相关的数据样本提取出来,提高了算法进行模型训练的容错能力,增强了模型训练的准确度。
与传统方法的容错能力相比,本方法不直接考虑原始数据的情况,先对数据进行处理,容错能力有所提升,同时减少了数据样本个数,缩短了训练时间,模型进行训练的时间约为350秒,预测时间在20秒以内。
将本实施例的异常状态感知方法与直接使用传统的支持向量机进行异常状态感知的方法进行对比,表5、表6和表7分别从预测准确度、预测时间和容错能力方面给出了对比结果。
表5预测准确度对比
Figure 576633DEST_PATH_IMAGE026
表6预测时间对比
Figure 639267DEST_PATH_IMAGE027
表7容错能力对比(通过预测准确度量化)
Figure 779262DEST_PATH_IMAGE028
通过上述的对比结果可以得出,本实施例方法在预测时间、预测准确度和容错能力方面,均明显由于传统的支持向量机的方法。
实施例二
在一个或多个实施方式中,公开了一种数据驱动的有源配电网异常状态感知系统,包括:
数据获取模块,用于获取配电网异常状态发生后的节点参数数据;
故障预测模块,用于将所述数据输入到训练好的配电网异常状态预测模型中,输出配电网短路异常状态预测结果;
其中,所述配电网异常状态预测模型的训练过程包括:对配电网历史异常状态节点参数数据进行聚类,通过关联规则算法找出与配电网异常状态强相关的数据样本,形成用于进行训练的样本数据集;基于所述样本数据集对所述配电网异常状态预测模型进行训练。
需要说明的是,本实施例的上述模块的具体实现方法已经在实施例一中进行了详细的说明,此处不再赘述。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.一种数据驱动的有源配电网异常状态感知方法,其特征在于,包括:获取配电网异常状态发生后的节点参数数据,将所述数据输入到训练好的配电网异常状态预测模型中,输出配电网异常状态预测结果;
其中,所述配电网异常状态预测模型的训练过程包括:对配电网历史异常状态节点参数数据进行聚类,通过关联规则算法找出与配电网异常状态类型强相关的数据样本,形成用于训练的样本数据集;基于所述样本数据集进行所述配电网异常状态预测模型的训练。
2.如权利要求1所述的一种数据驱动的有源配电网异常状态感知方法,其特征在于,所述对配电网历史异常状态节点参数数据进行聚类,具体过程包括:
基于欧氏距离对数据样本进行分类;
通过判别函数判断数据样本聚类是否完成;
计算误差平方和,通过SSE-K曲线图确定参考的聚类个数,基于所述参考的聚类个数,确定最终的聚类个数。
3.如权利要求1所述的一种数据驱动的有源配电网异常状态感知方法,其特征在于,在对配电网历史异常状态节点参数数据进行聚类之后,还包括:
对聚类后的数据样本进行自编码,形成第一样本数据集,第一样本数据集中的元素为向量,每一个向量由TV和Fi构成;其中,TV ={N0C 1 , N0C 2 ,. . .,N0C a }为自编码后的数据,C取值范围为[1, K],a为进行数据采集的节点编号;Fi为异常状态类型的值;
所述自编码后的数据至少包含数据所在的节点位置信息和数据所属的聚类类别信息。
4.如权利要求3所述的一种数据驱动的有源配电网异常状态感知方法,其特征在于,所述通过关联规则算法找出与配电网异常状态类型强相关的数据样本,形成用于进行训练的样本数据集,具体包括:
将第一样本数据集中每一个向量的两类元素TV与Fi合并为一类元素,组成新的数据集M:{Z1,Z2,…,Zi},其中Zi表示一个自编码后的数据与对应异常状态类型组成的新矢量;i为新矢量的个数;
用频繁项集的支持度和可信度量化所述新矢量中两个或多个元素之间的联系,将满足支持度和可信度要求的非0矢量提取出来,形成第二样本数据集,所述第二样本数据集用于进行配电网异常状态预测模型的训练。
5.如权利要求1所述的一种数据驱动的有源配电网异常状态感知方法,其特征在于,所述的基于所述样本数据集对所述配电网异常状态预测模型进行训练,具体包括:
基于得到的样本数据集,采用随机梯度下降算法进行回归训练,得到配电网异常状态预测模型的最优参数解。
6.如权利要求1所述的一种数据驱动的有源配电网异常状态感知方法,其特征在于,所述配电网异常状态预测模型具体为:
Figure 812242DEST_PATH_IMAGE001
其中,w为预测模型函数的权重矢量,b表示预测模型函数的截距,wT(CVj)表示矢量w与矢量CVj的数量积;矢量CVj为训练样本。
7.如权利要求6所述的一种数据驱动的有源配电网异常状态感知方法,其特征在于,还包括:通过优化目标函数来衡量所述配电网异常状态预测模型的拟合度,所述优化目标函数具体为:
Figure 678567DEST_PATH_IMAGE002
其中,L(Fi,f(CVj))表示损失函数,α为超参数,为设定值; R(w)为正则项;n为样本数据集总量,Fi为异常状态类型的值。
8.一种数据驱动的有源配电网异常状态感知系统,其特征在于,包括:
数据获取模块,用于获取配电网异常状态发生后的节点参数数据;
异常状态预测模块,用于将所述数据输入到训练好的配电网异常状态预测模型中,输出配电网异常状态预测结果;
其中,所述配电网短路异常状态模型的训练过程包括:对配电网历史异常状态节点参数数据进行聚类,通过关联规则算法找出与配电网异常状态强相关的数据样本,形成用于进行训练的样本数据集;基于所述样本数据集对所述配电网异常状态预测模型进行训练。
CN202111046394.0A 2021-09-08 2021-09-08 数据驱动的有源配电网异常状态感知方法及系统 Active CN113496262B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111046394.0A CN113496262B (zh) 2021-09-08 2021-09-08 数据驱动的有源配电网异常状态感知方法及系统
JP2022071358A JP7240691B1 (ja) 2021-09-08 2022-04-25 データドライブの能動配電網異常状態検知方法及びシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111046394.0A CN113496262B (zh) 2021-09-08 2021-09-08 数据驱动的有源配电网异常状态感知方法及系统

Publications (2)

Publication Number Publication Date
CN113496262A true CN113496262A (zh) 2021-10-12
CN113496262B CN113496262B (zh) 2022-02-08

Family

ID=77996999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111046394.0A Active CN113496262B (zh) 2021-09-08 2021-09-08 数据驱动的有源配电网异常状态感知方法及系统

Country Status (2)

Country Link
JP (1) JP7240691B1 (zh)
CN (1) CN113496262B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116773234A (zh) * 2023-05-05 2023-09-19 华电莱州发电有限公司 一种磨煤机故障监测系统
CN116258282B (zh) * 2023-05-12 2023-07-21 国网浙江省电力有限公司金华供电公司 一种基于云平台的智能电网资源调度分配方法
CN116304931B (zh) * 2023-05-12 2023-08-04 山东英伟电子技术有限公司 一种基于大数据的电力数据挖掘方法
CN116304641B (zh) * 2023-05-15 2023-09-15 山东省计算中心(国家超级计算济南中心) 基于参考点搜索和特征交互的异常检测解释方法及系统
CN116304763B (zh) * 2023-05-18 2023-10-24 国网山东省电力公司日照供电公司 一种电力数据预分析方法、系统、设备及介质
CN116799741B (zh) * 2023-05-24 2024-03-26 华斗数字科技(上海)有限公司 一种基于斜率检测的精密设备短路监测保护方法及系统
CN116720983A (zh) * 2023-08-10 2023-09-08 上海飞斯信息科技有限公司 一种基于大数据分析的供电设备异常检测方法及系统
CN116933895B (zh) * 2023-09-07 2023-12-08 苏州讯途益智能科技有限公司 一种基于机器学习的物联网数据挖掘方法及系统
CN117154716B (zh) * 2023-09-08 2024-04-26 国网河南省电力公司 一种分布式电源接入配电网的规划方法及系统
CN116881746B (zh) * 2023-09-08 2023-11-14 国网江苏省电力有限公司常州供电分公司 电力系统中异常数据的辨识方法、辨识装置
CN116993327B (zh) * 2023-09-26 2023-12-15 国网安徽省电力有限公司经济技术研究院 用于变电站的缺陷定位系统及其方法
CN117111589B (zh) * 2023-10-23 2024-01-02 中国机械总院集团云南分院有限公司 一种基于Petri网的数控机床控制系统故障诊断方法
CN117458710A (zh) * 2023-10-26 2024-01-26 国网江苏省电力有限公司南通供电分公司 一种变电站遥控防误操作方法及系统
CN117650971B (zh) * 2023-12-04 2024-06-14 武汉烽火技术服务有限公司 一种通信系统设备故障预防的方法和装置
CN117420345B (zh) * 2023-12-18 2024-03-08 广东云百科技有限公司 基于数据驱动的电网运行异常状态监测系统
CN117725402B (zh) * 2023-12-21 2024-05-28 北京谛声科技有限责任公司 一种基于设备运行音频的设备异常状态确定方法及系统
CN117768923B (zh) * 2024-02-22 2024-05-28 武汉电动汽车技术开发有限公司 基于5g短切片专网的新能源汽车数据传输优化方法及系统
CN117891238B (zh) * 2024-03-13 2024-05-28 青岛科技大学 一种阻拦着舰装备中定长冲跑阀故障诊断方法
CN117893030B (zh) * 2024-03-14 2024-05-28 中智(福建)科技有限公司 基于大数据的电力系统风险预警方法
CN118092403A (zh) * 2024-04-23 2024-05-28 广汽埃安新能源汽车股份有限公司 电控检测模型训练方法、电控系统检测方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106019084A (zh) * 2016-06-16 2016-10-12 上海交通大学 基于配用电数据关联的中压配电网断线故障诊断方法
US20160334447A1 (en) * 2015-05-14 2016-11-17 General Electric Technology Gmbh Angle-based management of a power grid system
CN110837866A (zh) * 2019-11-08 2020-02-25 国网新疆电力有限公司电力科学研究院 基于XGBoost的电力二次设备缺陷程度评估方法
CN112084237A (zh) * 2020-09-09 2020-12-15 广东电网有限责任公司中山供电局 一种基于机器学习和大数据分析的电力系统异常预测方法
CN112667750A (zh) * 2019-09-30 2021-04-16 中兴通讯股份有限公司 一种报文类别的确定、识别方法及装置
CN112966259A (zh) * 2021-03-03 2021-06-15 北京科东电力控制系统有限责任公司 电力监控系统运维行为安全威胁评估方法及设备
CN113065278A (zh) * 2021-03-15 2021-07-02 国家电网公司华北分部 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111211994B (zh) 2019-11-28 2022-08-19 南京邮电大学 一种基于SOM与K-means融合算法的网络流量分类方法
CN112464439A (zh) 2020-11-02 2021-03-09 天津理工大学 基于三层数据挖掘的电力系统故障类型分析方法及装置
CN112686404B (zh) 2020-12-29 2022-05-06 山东华科信息技术有限公司 一种基于配电网故障抢修的协同优化方法
CN112466435B (zh) 2021-02-02 2022-05-13 南京硅基智能科技有限公司 心理辅导方案的确定方法及装置、存储介质、电子装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160334447A1 (en) * 2015-05-14 2016-11-17 General Electric Technology Gmbh Angle-based management of a power grid system
CN106019084A (zh) * 2016-06-16 2016-10-12 上海交通大学 基于配用电数据关联的中压配电网断线故障诊断方法
CN112667750A (zh) * 2019-09-30 2021-04-16 中兴通讯股份有限公司 一种报文类别的确定、识别方法及装置
CN110837866A (zh) * 2019-11-08 2020-02-25 国网新疆电力有限公司电力科学研究院 基于XGBoost的电力二次设备缺陷程度评估方法
CN112084237A (zh) * 2020-09-09 2020-12-15 广东电网有限责任公司中山供电局 一种基于机器学习和大数据分析的电力系统异常预测方法
CN112966259A (zh) * 2021-03-03 2021-06-15 北京科东电力控制系统有限责任公司 电力监控系统运维行为安全威胁评估方法及设备
CN113065278A (zh) * 2021-03-15 2021-07-02 国家电网公司华北分部 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZONGPENG LI等: "Analysing Fault Cause of Smart Electricity Meters Based on Association Mining", 《IEEE》 *
王琨等: "面向智能电网应用的电力大数据关键技术研究", 《微型电脑应用》 *
郑继刚: "《数据挖掘及其应用研究》", 31 May 2014 *

Also Published As

Publication number Publication date
JP7240691B1 (ja) 2023-03-16
JP2023042527A (ja) 2023-03-27
CN113496262B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN113496262B (zh) 数据驱动的有源配电网异常状态感知方法及系统
Li et al. Data-driven bearing fault identification using improved hidden Markov model and self-organizing map
CN109490814B (zh) 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法
Chen et al. Railway turnout system RUL prediction based on feature fusion and genetic programming
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
US11840998B2 (en) Hydraulic turbine cavitation acoustic signal identification method based on big data machine learning
CN110609524A (zh) 一种工业设备剩余寿命预测模型及其构建方法和应用
CN111738520A (zh) 一种融合孤立森林与长短期记忆网络的系统负载预测方法
CN111367777B (zh) 告警处理的方法、装置、设备及计算机可读存储介质
CN112163682B (zh) 一种基于信息差异图模型的电力调度自动化系统故障溯源方法
CN113111591B (zh) 基于模块化配电终端内部故障自动诊断方法、装置及设备
CN110991471B (zh) 一种高速列车牵引系统故障诊断方法
CN111026058A (zh) 基于瓦瑟斯坦距离和自编码器的半监督深度学习故障诊断方法
CN111898690A (zh) 一种电力变压器故障分类方法及系统
CN112464439A (zh) 基于三层数据挖掘的电力系统故障类型分析方法及装置
CN116562114A (zh) 一种基于图卷积神经网络的电力变压器故障诊断方法
Kefalas et al. Automated machine learning for remaining useful life estimation of aircraft engines
CN115859777A (zh) 一种多故障模式下产品系统寿命预测的方法
CN116049686A (zh) 基于距离度量的铁路直流继电器运行状态评估方法
CN116011158A (zh) 一种低压台区的拓扑识别方法、系统及装置
Gao et al. Design and application of a fault diagnosis and monitoring system for electric vehicle charging equipment based on improved deep belief network
CN114116832A (zh) 一种基于数据驱动的配电网异常识别方法
CN113884807A (zh) 基于随机森林和多层架构聚类的配电网故障预测方法
Huang et al. A hybrid bayesian deep learning model for remaining useful life prognostics and uncertainty quantification
CN115859594A (zh) 基于层次分析的变电设备的健康评估算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant