CN117786587B - 基于数据分析的电网数据质量异常诊断方法 - Google Patents

基于数据分析的电网数据质量异常诊断方法 Download PDF

Info

Publication number
CN117786587B
CN117786587B CN202410217394.XA CN202410217394A CN117786587B CN 117786587 B CN117786587 B CN 117786587B CN 202410217394 A CN202410217394 A CN 202410217394A CN 117786587 B CN117786587 B CN 117786587B
Authority
CN
China
Prior art keywords
sample
power grid
grid data
dimension
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410217394.XA
Other languages
English (en)
Other versions
CN117786587A (zh
Inventor
王圆圆
宋大为
贾一博
王世谦
李为
费稼轩
李秋燕
华远鹏
卜飞飞
于雪辉
王玉乐
常安
武鸿斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Jiuyu Tenglong Information Engineering Co ltd
State Grid Smart Grid Research Institute Co ltd
Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Original Assignee
Henan Jiuyu Tenglong Information Engineering Co ltd
State Grid Smart Grid Research Institute Co ltd
Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Jiuyu Tenglong Information Engineering Co ltd, State Grid Smart Grid Research Institute Co ltd, Economic and Technological Research Institute of State Grid Henan Electric Power Co Ltd filed Critical Henan Jiuyu Tenglong Information Engineering Co ltd
Priority to CN202410217394.XA priority Critical patent/CN117786587B/zh
Publication of CN117786587A publication Critical patent/CN117786587A/zh
Application granted granted Critical
Publication of CN117786587B publication Critical patent/CN117786587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及基于数据分析的电网数据质量异常诊断方法,该方法包括:采集电网数据;构建孤立树,获取近邻样本序列和局部协方差矩阵的最大特征值,进而获取各样本的局部时稳指数;获取各样本的第一特征序列和第二特征序列,进而获取各样本的节点特征微变指数;计算各样本的电网局部变异指数,进而获取各样本组的改进孤立树深度;获取电网数据的维度差异识别指数,进而获取孤立树各层的分割维度,根据分割维度构建改进孤立森林,进而获取各电网数据的异常得分,完成对电网数据质量异常诊断。本发明旨在解决由于电网数据日益增长的趋势导致异常数据检测效率低的问题。

Description

基于数据分析的电网数据质量异常诊断方法
技术领域
本申请涉及数据处理技术领域,具体涉及基于数据分析的电网数据质量异常诊断方法。
背景技术
电网是指电力系统中各种电压的变电所及输配电线路组成的整体,称为电力网,包含变电、输电、配电三个单元,电力网的任务是输送与分配电能,改变电压。随着新型电力系统的发展,电网系统运行电压等级不断提高,电网规模日益扩大,结构日趋复杂。
为保障电网的稳定运行,以确保电力供应的可靠性,对电网数据的异常检测和定位成为电网稳定性分析的重要内容,而随着电力设备的不断普及和应用,电网规模日益扩大,使电网数据呈现指数级增长的趋势,导致传统的电网数据的异常检测存在检测效率低问题,由于孤立森林(Isolation Forest)算法是一种基于树结构的算法,在处理大规模数据、高维数据时具有较高的计算效率,同时孤立森林算法不受数据分布情况的影响,性能相对稳定,且每颗孤立树是独立构建的,具有并行化的优势,能够进一步提高检测效率,但对于参数较为敏感,如孤立树深度的设置,传统的孤立森林算法中每棵孤立树的深度都是相同的,若异常样本在孤立树中能够较早的检测分割出来,在后续的检测分割中不会提高检测精度,只会增加计算量,导致检测效率降低。
发明内容
为了解决上述技术问题,本发明提供基于数据分析的电网数据质量异常诊断方法,以解决现有的问题。
本发明的基于数据分析的电网数据质量异常诊断方法采用如下技术方案:
本发明一个实施例提供了基于数据分析的电网数据质量异常诊断方法,该方法包括以下步骤:
采集各维度的电网数据,其中所述维度包括但不限于电压幅值与相角、电流、负荷有功功率与无功功率、发电机注入有功功率与无功功率;
根据电网数据获取各样本组,根据样本组中的样本构建孤立树,获取样本组中各样本的近邻样本序列,根据近邻样本序列获取各样本的局部协方差矩阵的最大特征值,根据最大特征值获取各样本的局部时稳指数;根据各样本的局部协方差矩阵的特征值获取各样本的第一特征序列和第二特征序列,根据第一特征序列和第二特征序列中的元素获取各样本的节点特征微变指数;根据节点特征微变指数和局部时稳指数获取各样本的电网局部变异指数;根据电网局部变异指数计算各样本组的改进孤立树深度;根据电网数据获取各样本组的孤立树中各层样本的各维度的电网数据的维度差异识别指数;根据各维度的维度差异识别指数获取孤立树各层的分割维度,根据分割维度构建改进孤立森林;
根据改进孤立森林获取各电网数据的异常得分,根据异常得分对电网数据质量进行异常诊断。
进一步,所述获取各样本组,根据样本组中的样本构建孤立树,获取样本组中各样本的近邻样本序列,根据近邻样本序列获取各样本的局部协方差矩阵的最大特征值,包括:
将每个采样时刻获取的所有维度的电网数据作为一个样本,对所有样本进行随机抽样抽取其中n个样本按照时间顺序排序组成样本组,抽取Q次获取Q个样本组,根据各样本组中的样本构建孤立树,n为预设抽取数据个数,Q为预设抽取数据次数;
对于各样本组中的各样本,选取样本组中距离样本最近的其他a+1个样本按照时间顺序组成近邻样本序列,将近邻样本序列中的各样本在不同维度中的数据作为各列向量、同一维度的各样本的数据值作为行向量组成局部近邻矩阵,计算局部近邻矩阵的协方差矩阵作为各样本的局部协方差矩阵;
使用M-P律算法对各样本的局部协方差矩阵进行处理,所述M-P律算法输出各样本的局部协方差矩阵对应的一组特征值,将所述一组特征值中的最大值作为各样本的局部协方差矩阵的最大特征值。
进一步,所述获取各样本的局部时稳指数,包括:
对于各样本的近邻样本序列,计算近邻样本序列中各样本与其后一相邻样本的协方差矩阵的最大特征值的差值绝对值,计算所述差值绝对值与所述后一相邻样本的协方差矩阵的最大特征值的乘积,计算所述乘积与预设协调因子的和值的倒数,将所述近邻样本序列中所有所述倒数的均值作为各样本的局部时稳指数。
进一步,所述获取各样本的第一特征序列和第二特征序列,包括:
对于各样本的近邻样本序列,统计近邻样本序列中各样本的局部协方差矩阵的最大特征值、最小特征值,将近邻样本序列中所有所述最大特征值组成个样本的第一特征序列,将近邻样本序列中所有所述最小特征值组成各样本的第二特征序列。
进一步,所述获取各样本的节点特征微变指数,包括:
计算各样本的第一特征序列中第d个元素与第二特征序列中第d个元素之间的差值,计算所述差值与所述第一特征序列中第d个元素的乘积,计算所述第一特征序列的赫斯特指数与预设指数因子的和值,计算以所述乘积为底数、以所述和值为指数的指数函数的计算结果,
将各样本的第一特征序列和第二特征序列计算得到的所有所述计算结果的和值作为各样本的节点特征微变指数。
进一步,所述获取各样本的电网局部变异指数,包括:
对于各样本的近邻样本序列,计算近邻样本序列中各样本的局部时稳指数与第一个样本的局部时稳指数的比值,计算数字1与所述比值的差值,计算以自然常数为底、以所述差值的负值为指数的指数函数的计算结果,计算数字1与所述计算结果的和值,计算所述和值的倒数,计算各样本的近邻样本序列中所有倒数的和值,将各样本的节点特征微变指数与所述所有倒数的和值的乘积作为各样本的电网局部变异指数。
进一步,所述根据电网局部变异指数计算各样本组的改进孤立树深度,包括:
对于各样本组,计算样本组所有样本中电网局部变异指数的最大值和最小值的差值作为第一差值,计算样本组所有样本中电网局部变异指数的最大值与各样本的电网局部变异指数的差值作为第二差值,计算第一差值与第二差值的比值作为第一比值,计算样本组中所有第一比值的和值;
计算样本组中所有样本构建的孤立树的最大深度与样本组中样本个数的比值作为第二比值,将第二比值与所述和值的乘积的向上取整值作为各样本组的改进孤立树深度。
进一步,所述获取各样本组的孤立树中各层样本的各维度的电网数据的维度差异识别指数,包括:
对于各样本组的孤立树,计算第k层中各样本在第u维度的电网数据与第k层中所有样本在第u个维度中的电网数据的最小值之间的差值作为第三差值,将第k层中所有样本在第u个维度中的电网数据的最大值与第k层中各样本在第u个维度的电网数据之间的差值作为第四差值,统计第k层中第u个维度的各电网数据的第三差值与第四差值的最小值,将第k层中第u个维度的所有电网数据所述最小值的和值作为各样本组的孤立树的第k层中第u个维度的维度差异识别指数。
进一步,所述获取孤立树各层的分割维度,根据分割维度构建改进孤立森林,包括:
对于各样本组的孤立树,将各层中所有维度的维度差异识别指数的最大值所对应的维度作为各层的分割维度,将各层样本中分割维度的电网数据作为大津阈值分割法的输入,输出为各层样本的分割阈值,通过分割阈值对各层样本进行分割,若孤立树达到改进孤立树深度或样本不可再分,构建改进孤立树;
若未达到所述改进孤立树深度,对分割后的孤立树下一层中样本数量多的节点按照下一层的分割维度进行分割,直至达到所述改进孤立树深度或者样本不可再分,将所有改进孤立树组成改进孤立森林。
进一步,所述根据改进孤立森林获取各电网数据的异常得分,根据异常得分对电网数据质量进行异常诊断,包括:
将电网数据输入到改进孤立森林算法中,所述改进孤立森林算法的输出为各电网数据的异常得分;当各电网数据的异常得分大于预设评估阈值时,电网数据质量异常;反之,电网数据质量正常。
本发明至少具有如下有益效果:
本发明通过随机抽样的方式确定构建孤立树时所需样本,基于所选取样本确定近邻时间内各维度数据所构成的局部近邻矩阵,进而确定局部协方差矩阵及最大特征值,结合M-P律分析电网数据发生异常情况时最大特征值的变化情况构建局部时稳指数,反映电网数据发生较明显异常的程度;通过分析电网数据发生微小异常时局部协方差矩阵最大特征值与最小特征值的变化趋势及规律,并结合局部时稳指数构建电网局部变异指数,反映电网数据发生微小异常或存在异常趋势程度,提高对微小异常及异常趋势的准确率;基于电网局部变异指数改进孤立森林中孤立树的深度,改进后的孤立森林算法能够根据电网数据样本特征,自适应的确定孤立树深度,避免对正常值无意义的分割导致算法效率降低,提高算法的运算效率,解决了由于电网数据日益增长的趋势导致异常数据检测效率低的问题,便于对电网数据进行实时异常诊断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的基于数据分析的电网数据质量异常诊断方法的流程图;
图2为改进孤立森林获取流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于数据分析的电网数据质量异常诊断方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于数据分析的电网数据质量异常诊断方法的具体方案。
本发明一个实施例提供的基于数据分析的电网数据质量异常诊断方法,具体的,提供了如下的基于数据分析的电网数据质量异常诊断方法,请参阅图1,该方法包括以下步骤:
步骤S001,采集电网数据并进行预处理。
广域测量系统(wide area measurement system, WAMS)是由同步相量测量装置、高速数字通信设备、电网动态过程分析设备共同组建而成的综合系统,能够在电网运行过程中对各维度的电网数据进行采集,所述电网数据能够反映电网运行时的状态,各维度电网数据包括但不限于电压幅值与相角、电流、负荷有功功率与无功功率、发电机注入有功功率与无功功率,记采集间隔为T,本实施例中采集间隔的取值为1s,记采集次数为N,本实施例中采集次数的取值为10000,将一个时间点记为一个样本,记数据维度为M,本实施例中数据维度的取值为7。
由于在采集数据的过程中可能出现缺失值等异常情况,为避免缺失值对后续步骤产生影响,需要对缺失值进行填充,为保留数据间的变化规律,本实施例使用回归填充法对缺失值进行填充处理,同时为避免量纲不同导致后续步骤计算时出现数据不合理的情况,本实施例使用Z-score方法对填充后的每种采集数据分别进行归一化处理。其中回归填充法与Z-score归一化方法为公知技术,具体过程本实施例不再赘述。
至此,得到预处理后的电网数据。
步骤S002,对算法参数进行初始化设置,通过简单随机抽样确定构建孤立树时所需样本,据此构建局部时稳指数,反映样本随时间变化的局部稳定程度,进而结合局部协方差矩阵的最大、最小特征值构建电网局部变异指数,改进孤立森林算法中孤立树的深度,对电网数据进行异常检测。
具体的,将参数初始化,并选择构建孤立树时的样本。使用孤立森林算法对电网数据进行异常检测时,需要对算法中的参数进行初始化设置,记构建孤立树时所选取的样本数为n,本实施例中样本数n的取值为256,记森林中孤立树的数量为Q,本实施例中孤立树的数量Q的取值为200。
具体的,对于步骤S001获取的预处理后的电网数据,将每个采样时刻获取的M个维度的电网数据作为一个样本,在构建孤立树的过程中,对所有样本进行随机抽样抽取其中n个样本,重复上述过程Q次,得到Q个样本组,每个样本组中的样本数量为n,每个样本的维度为M。
进一步的,基于所选取样本构建局部时稳指数。通过上述步骤所得Q个样本组,为方便描述,本实施例以对第i个样本组中第j个样本的处理为例进行描述,将第i个样本组中第j个样本记为,将样本/>所在的时间点记为/>,按照时间顺序取与/>时间点时间间隔最近的(a+1)个时间点,将第i组中(a+1)个时间点对应样本所组成的序列记为样本/>的近邻样本序列,本实施例中a的取值为10;将近邻样本序列中各样本所在组所随机选取的各维度数据所构成的矩阵记为样本/>局部近邻矩阵,其中,局部近邻矩阵的列向量为样本在不同数据维度的数据值,行向量为同一维度各样本的数据值,矩阵维度为/>,据此计算其协方差矩阵,记为样本/>的局部协方差矩阵,矩阵维度为/>。其中,计算协方差矩阵的方法为公知技术,在此不做赘述。
将样本的局部协方差矩阵作为M-P律的输入,输出为样本/>局部协方差矩阵的一组特征值,则根据M-P律可知,当电网数据处于稳态时,样本局部协方差矩阵的最大特征值较为稳定,不同样本的局部协方差矩阵的最大特征值应较为接近,当电网数据出现异常时,样本的局部协方差矩阵的最大特征值变化较大且远大于电网稳态时的变化率,且在异常发生时刻,样本的局部协方差矩阵的最大特征值会发生显著变化,其中M-P律的计算过程为公知技术,具体过程本实施例不再赘述。据此本实施例构建局部时稳指数,反映样本的局部稳定程度,局部时稳指数的计算公式如下:
其中表示样本/>的局部时稳指数;a表示所选取距离/>时间点最近时间点的数量,本实施例中a的取值为10,/>、/>分别表示样本/>的近邻样本序列中第b个、第b+1个样本所对应局部协方差矩阵的最大特征值,/>表示协调因子,用于避免分母为零导致无法计算,本实施例中取值为1。
在样本的近邻样本序列中,相邻两个样本所对应局部协方差矩阵的最大特征值差异越小,即/>越小,同时样本的最大特征值越小,即/>越小,表明该样本所对应时间点的电网数据越可能处于稳定状态,越可能未出现异常状况,故计算出的局部时稳指数越大。
至此,获取计算各样本组中各样本的局部时稳指数。
进一步的,基于局部时稳指数构建电网局部变异指数。通过上述步骤所得局部时稳指数,能够反映电网数据出现较大程度的异常情况,而随着故障程度的减小以及信噪比的降低,各样本局部协方差矩阵的最大特征值变化率降低,导致异常检出时刻略有滞后,特别是当电网发生轻微异常时,如线路干扰、环境引起的电网数据波动等,异常早期的状态变量小幅度缓慢变化,使相应的矩阵特征值变化不明显,异常检出时刻滞后现象较为严重,对应的电网电压下降较大,对电网的影响更大。据此本实施例基于局部时稳指数构建电网局部变异指数,综合反映电网发生早期异常与较大异常的程度,其构建过程如下:
按照上述步骤所得样本的近邻样本序列,则可以将样本/>的近邻样本序列中各样本的局部协方差矩阵的最大特征值与最小特征值所构成的序列分别记为样本/>的第一特征序列与第二特征序列,则可以计算电网局部变异指数,其计算公式如下:
其中表示样本/>的节点特征微变指数,a表示所选取距离/>时间点最近时间点的数量,本实施例中取值为10,/>、/>分别表示样本/>的第一特征序列、第二特征序列中第d个元素,/>表示由样本/>第一特征序列所计算出的赫斯特指数,/>表示指数因子,本实施例中取值为2,由于赫斯特指数的取值范围为[0,1],为提高指数的增长速度,更敏感的识别出电网数据较小的异常波动,添加指数因子提高底数部分的增长速率;/>表示样本/>的电网局部变异指数,/>、/>分别表示样本/>的近邻样本序列中第e个、第1个样本的局部时稳指数,exp()表示以自然常数为底的指数函数。其中赫斯特指数的计算为公知技术,具体过程本实施例不再赘述。
在电网数据样本中,若样本的近邻样本序列中各样本所对应局部协方差矩阵的最大特征值与最小特征值之差越大,即/>越大,越表明此时电网数据越可能发生异常波动,导致样本所对应协方差矩阵的最大特征值与最小特征值差异增大,同时电网数据样本所对应的最大特征值越大,即/>越大,表明此时电网数据越不满足M-P律,越可能存在异常现象,如电网电压降低、供电电流降低等,同时样本/>第一特征序列的赫斯特指数越大,即/>越大,越表明样本/>的近邻样本序列中各样本所对应局部协方差矩阵的最大特征值所具有的趋势性越明显,表明此时电网数据可能已经开始发生异常并具有明显的趋势性,若不及时进行处理,可能会造成较严重的后果,故计算出的节点特征微变指数越大,同时电网数据样本/>的近邻样本序列中各样本的局部时稳指数出现变小的趋势,即随着e的增加/>变小,/>变大,表明此时电网的稳态存在被破坏的趋势,并通过指数函数放大这种微小差异,故计算出的电网变异指数越大。
进一步的,基于电网局部变异指数计算孤立树深度。通过上述步骤所得一组样本中各样本的电网局部变异指数,反映各电网数据在局部时间上的异常程度,在一组样本中不同异常程度的样本数量不同,则通过该组样本构建孤立树时,将异常电网数据分割出的次数也不同,故构建孤立树时孤立树的深度也不同,据此本实施例基于电网局部变异指数改进孤立树的深度,改进孤立树深度的计算公式如下:
其中表示通过第i个样本组构建孤立树时的改进孤立树深度,int()表示向上取整函数,/>表示孤立树深度的最大值,本实施例中取值为100,n表示第i个样本组中的样本数,本实施例中取值为256,/>、/>分别表示第i组样本中电网局部变异指数的最大值、最小值,/>表示第i组样本中第c个样本的电网局部变异指数。
第i组样本中样本的电网局部变异指数与最大值越接近,即越大,表明该样本所对应的电网数据越可能在时间变化中存在异常,同时第i组样本中电网局部变异指数与最大值接近的样本越多,即/>越大,表明第i组样本中可能存在较多的异常样本,即越多的电网数据随着时间的增加,其异常特征越来越明显,故通过第i组样本构建孤立树时,越需要较多次的分割才能将异常样本分割出来,故计算出的改进孤立树深度越大。
进一步的,基于改进孤立树深度构建孤立树,进而构建孤立森林。通过上述步骤确定每棵孤立树的深度,则可以通过孤立树各层的样本的M个维度中各维度的数据值计算维度差异识别指数,反映各层样本中各维度的数据值的差异区分程度,维度差异识别指数的计算公式如下:
其中表示通过第i组样本构建孤立树时第k层选取样本第u个维度时的维度差异识别指数,/>表示通过第i组样本构建孤立树时在孤立树中第k层的样本数,/>表示取最小值函数,/>表示通过第i组样本构建孤立树时在孤立树中第k层的样本中在第v个样本在第u个维度上的值,/>、/>分别表示通过第i组样本构建孤立树时在孤立树中第k层的所有样本在第u个维度上样本的最小值、最大值。
通过第i组样本构建孤立树时,孤立树中第k层样本在第u个维度上的值与最小值、最大值之间的差异越大,即或/>越小,表明第k层样本在第u个维度上的值越偏离中心点,越接近边界点,根据第u个维度对样本进行分割时的效果越好,故对第k层样本进行分割时,越应该选择第u个维度,故计算出的维度差异识别指数越大。
通过上述步骤计算一层样本中各维度的维度差异识别指数,将维度差异识别指数最大值所对应的维度作为该层的分割维度,将该层样本中该维度的数据作为大津阈值分割法的输入,输出为该层样本的分割阈值,通过分割阈值对该层样本的分割,若达到所述改进孤立树深度或样本不可再分,则改进孤立树构建完成,若未达到所述改进孤立树深度,则对分割后孤立树下一层中较多样本的节点按照上述步骤再次进行分割,直至达到所述改进孤立树深度。其中大津阈值分割法为公知技术,具体过程本实施例不再赘述。
按照上述步骤,完成一棵改进孤立树的构建,将上述步骤重复Q次,得到Q棵改进孤立树,Q棵改进孤立树所构成的结果即为改进孤立森林,改进孤立森林的获取如图2所示。
步骤S003,基于改进孤立森林计算电网数据的异常得分,对电网状态进行异常诊断。
基于上述步骤所得改进孤立森林,则可以将采集到的电网数据放入改进孤立森林,通过电网数据在改进孤立森林中各孤立树的路径长度计算电网数据的异常得分。
根据上述步骤所得电网数据异常得分,通过对孤立森林算法的改进,可提高电网数据的异常得分计算精度,保证电网数据质量异常诊断结果,改进孤立森林算法得到的各电网数据的异常得分可综合反映出电网数据的异常程度,为实现对电网数据质量的异常诊断,本实施例根据预设阈值对电网数据质量进行诊断评估;若电网数据的异常得分大于预设评估阈值,表明此时电网状态存在较大的异常,应立即进行检修,排除风险,以保障用户用电的稳定;反之,电网数据正常,表明此时电网状态存在微小的波动,为正常状态,可能是局部波动等原因引起的。其中,本实施例中预设评估阈值设定为0.6。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。

Claims (6)

1.基于数据分析的电网数据质量异常诊断方法,其特征在于,该方法包括以下步骤:
采集各维度的电网数据,其中所述维度包括但不限于电压幅值与相角、电流、负荷有功功率与无功功率、发电机注入有功功率与无功功率;
根据电网数据获取各样本组,根据样本组中的样本构建孤立树,获取样本组中各样本的近邻样本序列,根据近邻样本序列获取各样本的局部协方差矩阵的最大特征值,根据最大特征值获取各样本的局部时稳指数;根据各样本的局部协方差矩阵的特征值获取各样本的第一特征序列和第二特征序列,根据第一特征序列和第二特征序列中的元素获取各样本的节点特征微变指数;根据节点特征微变指数和局部时稳指数获取各样本的电网局部变异指数;根据电网局部变异指数计算各样本组的改进孤立树深度;根据电网数据获取各样本组的孤立树中各层样本的各维度的电网数据的维度差异识别指数;根据各维度的维度差异识别指数获取孤立树各层的分割维度,根据分割维度构建改进孤立森林;
根据改进孤立森林获取各电网数据的异常得分,根据异常得分对电网数据质量进行异常诊断;
所述获取各样本的局部时稳指数,包括:
对于各样本的近邻样本序列,计算近邻样本序列中各样本与其后一相邻样本的协方差矩阵的最大特征值的差值绝对值,计算所述差值绝对值与所述后一相邻样本的协方差矩阵的最大特征值的乘积,计算所述乘积与预设协调因子的和值的倒数,将所述近邻样本序列中所有所述倒数的均值作为各样本的局部时稳指数;
所述获取各样本的节点特征微变指数,包括:
计算各样本的第一特征序列中第d个元素与第二特征序列中第d个元素之间的差值,计算所述差值与所述第一特征序列中第d个元素的乘积,计算所述第一特征序列的赫斯特指数与预设指数因子的和值,计算以所述乘积为底数、以所述和值为指数的指数函数的计算结果,
将各样本的第一特征序列和第二特征序列计算得到的所有所述计算结果的和值作为各样本的节点特征微变指数;
所述获取各样本的电网局部变异指数,包括:
对于各样本的近邻样本序列,计算近邻样本序列中各样本的局部时稳指数与第一个样本的局部时稳指数的比值,计算数字1与所述比值的差值,计算以自然常数为底、以所述差值的负值为指数的指数函数的计算结果,计算数字1与所述计算结果的和值,计算所述和值的倒数,计算各样本的近邻样本序列中所有倒数的和值,将各样本的节点特征微变指数与所述所有倒数的和值的乘积作为各样本的电网局部变异指数;
所述根据电网局部变异指数计算各样本组的改进孤立树深度,包括:
对于各样本组,计算样本组所有样本中电网局部变异指数的最大值和最小值的差值作为第一差值,计算样本组所有样本中电网局部变异指数的最大值与各样本的电网局部变异指数的差值作为第二差值,计算第一差值与第二差值的比值作为第一比值,计算样本组中所有第一比值的和值;
计算样本组中所有样本构建的孤立树的最大深度与样本组中样本个数的比值作为第二比值,将第二比值与所述和值的乘积的向上取整值作为各样本组的改进孤立树深度。
2.如权利要求1所述的基于数据分析的电网数据质量异常诊断方法,其特征在于,所述获取各样本组,根据样本组中的样本构建孤立树,获取样本组中各样本的近邻样本序列,根据近邻样本序列获取各样本的局部协方差矩阵的最大特征值,包括:
将每个采样时刻获取的所有维度的电网数据作为一个样本,对所有样本进行随机抽样抽取其中n个样本按照时间顺序排序组成样本组,抽取Q次获取Q个样本组,根据各样本组中的样本构建孤立树,n为预设抽取数据个数,Q为预设抽取数据次数;
对于各样本组中的各样本,选取样本组中距离样本最近的其他a+1个样本按照时间顺序组成近邻样本序列,将近邻样本序列中的各样本在不同维度中的数据作为各列向量、同一维度的各样本的数据值作为行向量组成局部近邻矩阵,计算局部近邻矩阵的协方差矩阵作为各样本的局部协方差矩阵;
使用M-P律算法对各样本的局部协方差矩阵进行处理,所述M-P律算法输出各样本的局部协方差矩阵对应的一组特征值,将所述一组特征值中的最大值作为各样本的局部协方差矩阵的最大特征值。
3.如权利要求1所述的基于数据分析的电网数据质量异常诊断方法,其特征在于,所述获取各样本的第一特征序列和第二特征序列,包括:
对于各样本的近邻样本序列,统计近邻样本序列中各样本的局部协方差矩阵的最大特征值、最小特征值,将近邻样本序列中所有所述最大特征值组成个样本的第一特征序列,将近邻样本序列中所有所述最小特征值组成各样本的第二特征序列。
4.如权利要求1所述的基于数据分析的电网数据质量异常诊断方法,其特征在于,所述获取各样本组的孤立树中各层样本的各维度的电网数据的维度差异识别指数,包括:
对于各样本组的孤立树,计算第k层中各样本在第u维度的电网数据与第k层中所有样本在第u个维度中的电网数据的最小值之间的差值作为第三差值,将第k层中所有样本在第u个维度中的电网数据的最大值与第k层中各样本在第u个维度的电网数据之间的差值作为第四差值,统计第k层中第u个维度的各电网数据的第三差值与第四差值的最小值,将第k层中第u个维度的所有电网数据所述最小值的和值作为各样本组的孤立树的第k层中第u个维度的维度差异识别指数。
5.如权利要求1所述的基于数据分析的电网数据质量异常诊断方法,其特征在于,所述获取孤立树各层的分割维度,根据分割维度构建改进孤立森林,包括:
对于各样本组的孤立树,将各层中所有维度的维度差异识别指数的最大值所对应的维度作为各层的分割维度,将各层样本中分割维度的电网数据作为大津阈值分割法的输入,输出为各层样本的分割阈值,通过分割阈值对各层样本进行分割,若孤立树达到改进孤立树深度或样本不可再分,构建改进孤立树;
若未达到所述改进孤立树深度,对分割后的孤立树下一层中样本数量多的节点按照下一层的分割维度进行分割,直至达到所述改进孤立树深度或者样本不可再分,将所有改进孤立树组成改进孤立森林。
6.如权利要求1所述的基于数据分析的电网数据质量异常诊断方法,其特征在于,所述根据改进孤立森林获取各电网数据的异常得分,根据异常得分对电网数据质量进行异常诊断,包括:
将电网数据输入到改进孤立森林算法中,所述改进孤立森林算法的输出为各电网数据的异常得分;当各电网数据的异常得分大于预设评估阈值时,电网数据质量异常;反之,电网数据质量正常。
CN202410217394.XA 2024-02-28 2024-02-28 基于数据分析的电网数据质量异常诊断方法 Active CN117786587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410217394.XA CN117786587B (zh) 2024-02-28 2024-02-28 基于数据分析的电网数据质量异常诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410217394.XA CN117786587B (zh) 2024-02-28 2024-02-28 基于数据分析的电网数据质量异常诊断方法

Publications (2)

Publication Number Publication Date
CN117786587A CN117786587A (zh) 2024-03-29
CN117786587B true CN117786587B (zh) 2024-06-04

Family

ID=90385254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410217394.XA Active CN117786587B (zh) 2024-02-28 2024-02-28 基于数据分析的电网数据质量异常诊断方法

Country Status (1)

Country Link
CN (1) CN117786587B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN109308306A (zh) * 2018-09-29 2019-02-05 重庆大学 一种基于孤立森林的用户用电异常行为检测方法
CN110751643A (zh) * 2019-10-21 2020-02-04 睿视智觉(厦门)科技有限公司 一种水质异常检测方法、装置及设备
CN111625399A (zh) * 2020-05-19 2020-09-04 国网天津市电力公司电力科学研究院 一种计量数据恢复方法及系统
CN112990330A (zh) * 2021-03-26 2021-06-18 国网河北省电力有限公司营销服务中心 用户用能异常数据检测方法及设备
WO2022142042A1 (zh) * 2020-12-29 2022-07-07 平安科技(深圳)有限公司 异常数据的检测方法、装置、计算机设备和存储介质
CN116451035A (zh) * 2023-04-25 2023-07-18 国网安徽省电力有限公司电力科学研究院 一种提高分布式光伏预测精度的数据特征工程处理方法
CN116488159A (zh) * 2023-04-25 2023-07-25 国网江苏省电力有限公司电力科学研究院 一种电网特征提取及源荷协同分析方法、装置和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN109308306A (zh) * 2018-09-29 2019-02-05 重庆大学 一种基于孤立森林的用户用电异常行为检测方法
CN110751643A (zh) * 2019-10-21 2020-02-04 睿视智觉(厦门)科技有限公司 一种水质异常检测方法、装置及设备
CN111625399A (zh) * 2020-05-19 2020-09-04 国网天津市电力公司电力科学研究院 一种计量数据恢复方法及系统
WO2022142042A1 (zh) * 2020-12-29 2022-07-07 平安科技(深圳)有限公司 异常数据的检测方法、装置、计算机设备和存储介质
CN112990330A (zh) * 2021-03-26 2021-06-18 国网河北省电力有限公司营销服务中心 用户用能异常数据检测方法及设备
CN116451035A (zh) * 2023-04-25 2023-07-18 国网安徽省电力有限公司电力科学研究院 一种提高分布式光伏预测精度的数据特征工程处理方法
CN116488159A (zh) * 2023-04-25 2023-07-25 国网江苏省电力有限公司电力科学研究院 一种电网特征提取及源荷协同分析方法、装置和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于模糊聚类和孤立森林的用电数据异常检测;赵嫚;李英娜;李川;杨莉;;陕西理工大学学报(自然科学版);20200820(04);全文 *

Also Published As

Publication number Publication date
CN117786587A (zh) 2024-03-29

Similar Documents

Publication Publication Date Title
CN106248801B (zh) 一种基于多声发射事件概率的钢轨裂纹检测方法
CN107273920A (zh) 一种基于随机森林的非侵入式家用电器识别方法
CN111722046B (zh) 一种基于深度森林模型的变压器故障诊断方法
CN112257530B (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN114564982A (zh) 雷达信号调制类型的自动识别方法
CN111628494B (zh) 一种基于逻辑回归法的低压配电网拓扑识别方法及系统
CN113538353B (zh) 基于单通道图数据增强和迁移训练残差网络的五相异步电动机滚动轴承故障诊断方法
CN114169377A (zh) 基于g-mscnn的有噪环境中滚动轴承故障诊断方法
CN112651426A (zh) 一种风电机组滚动轴承故障诊断方法
CN104504361B (zh) 基于方向特征的手掌静脉主方向特征提取方法
Zeng et al. Bearing fault diagnosis with denoising autoencoders in few labeled sample case
CN110020680B (zh) 一种基于随机矩阵理论和模糊c均值聚类算法的pmu数据分类方法
CN112751633B (zh) 一种基于多尺度窗口滑动的宽带频谱检测方法
CN112633368B (zh) 基于改进多粒度级联森林的扁平振动电机缺陷检测系统及方法
CN117786587B (zh) 基于数据分析的电网数据质量异常诊断方法
CN109145738A (zh) 基于加权非凸正则化和迭代重约束低秩表示的动态视频分割方法
CN112507881A (zh) 一种基于时间卷积神经网络的sEMG信号分类方法及系统
CN116561692A (zh) 一种动态更新的实时量测数据检测方法
CN111626559A (zh) 一种基于主因子分析法的中压配电网线损关键特征指标提取方法及系统
CN116561569A (zh) 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法
CN116488151A (zh) 一种基于条件生成对抗网络的短期风电功率预测方法
CN113537010B (zh) 基于单通道图数据增强和迁移训练残差网络的十五相异步电动机滚动轴承故障诊断方法
CN109684749A (zh) 一种考虑运行特性的光伏电站等值建模方法
Ma et al. Anomaly Detection of Mountain Photovoltaic Power Plant Based on Spectral Clustering
Li et al. Comparative analysis of machine learning algorithms in water extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240513

Address after: 1-10 / F, C building, No.87 courtyard, Songshan South Road, Erqi District, Zhengzhou City, Henan Province

Applicant after: ECONOMIC TECHNOLOGY RESEARCH INSTITUTE OF STATE GRID HENAN ELECTRIC POWER Co.

Country or region after: China

Applicant after: State Grid Smart Grid Research Institute Co.,Ltd.

Applicant after: Henan Jiuyu Tenglong Information Engineering Co.,Ltd.

Address before: 518000 Room 302, complex building 2, Songbai Industrial Park, No. 4, Yangyong Industrial Road, tangxiayong community, Yanluo street, Bao'an District, Shenzhen, Guangdong Province

Applicant before: Shenzhen Fushan Automation Technology Co.,Ltd.

Country or region before: China

Applicant before: ECONOMIC TECHNOLOGY RESEARCH INSTITUTE OF STATE GRID HENAN ELECTRIC POWER Co.

Applicant before: State Grid Smart Grid Research Institute Co.,Ltd.

Applicant before: Henan Jiuyu Tenglong Information Engineering Co.,Ltd.

GR01 Patent grant
GR01 Patent grant