CN114356900A - 一种电力数据异常检测方法、装置、设备及介质 - Google Patents
一种电力数据异常检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114356900A CN114356900A CN202111481341.1A CN202111481341A CN114356900A CN 114356900 A CN114356900 A CN 114356900A CN 202111481341 A CN202111481341 A CN 202111481341A CN 114356900 A CN114356900 A CN 114356900A
- Authority
- CN
- China
- Prior art keywords
- power data
- data
- detection
- anomaly detection
- normal distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 156
- 238000009826 distribution Methods 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 56
- 230000002159 abnormal effect Effects 0.000 claims abstract description 44
- 230000005856 abnormality Effects 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 22
- 238000003860 storage Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Landscapes
- Remote Monitoring And Control Of Power-Distribution Networks (AREA)
Abstract
本发明提供了一种电力数据异常检测方法、装置、设备及介质,所述方法包括:在判断到电力数据存在重复时,对电力数据进行重复异常检测,并得到对应的异常检测结果,若不重复,则在判断搭配电力数据符合正态分布时,对电力数据进行正态分布异常检测,在判断到不符合正态分布时,判断电力数据是否为分位数;若是,则对电力数据进行非参数化异常检测;若否,则对电力数据进行任意分布异常检测。采用本发明实施例,能够按照重复异常检测、正态分布异常检测、非参数化异常检测、任意分布异常检测等方法,进行数据样本异常检测,解决了现有技术数据异常的检测手段较为单一的技术问题,从而进一步提高了电力数据异常检测的准确率。
Description
技术领域
本发明涉及数据异常检测领域,尤其涉及一种电力数据异常检测方法、装置、设备及介质。
背景技术
随着电力信息采集系统的推广,越来越多的电力数据被采集,为基于电力数据的各种应用分析提供了坚实的数据基础。但由于各电力业务系统之间的数据不匹配,电力数据缺乏统一规范的异常检测方法,不可避免地出现异常的电力数据,进而影响基于电力数据的应用分析的准确性。因此,需要对电力数据进行异常检测。
但是本发明人在实施本发明的过程中发现,现有技术中存在以下技术问题:目前,大多数电力部门采用传统的统计方法进行电力数据的异常检测,通过与单一阈值的比较结果作为数据异常的检测标准,检测的手段较为单一,无法根据不同的电力数据进行针对性的检测,检测的准确率较低。
发明内容
本发明提供一种电力数据异常检测方法、装置、设备及介质,能够解决现有技术数据异常的检测手段较为单一的技术问题。
为实现上述目的,本发明实施例提供了一种电力数据异常检测方法,包括以下步骤:
获取待检测的电力数据,并判断所述电力数据是否重复;
若是,则对所述电力数据进行重复异常检测,并得到对应的异常检测结果,若否,则判断所述电力数据是否符合正态分布,并得到判断结果;
当所述判断结果为是时,对所述电力数据进行正态分布异常检测,并得到对应的异常检测结果,当所述判断结果为否时,判断所述电力数据是否为分位数;
若是,则对所述电力数据进行非参数化异常检测,并得到对应的异常检测结果;
若否,则对所述电力数据进行任意分布异常检测,并得到对应的异常检测结果。
作为其中一种可选的实施例,通过以下方式对所述电力数据进行重复异常检测:
对于所述电力数据中的每一属性,获取每一属性的电力数据对应的数据总个数以及每一属性的所述电力数据中重复的数据个数;
根据所述重复的数据个数与所述数据总个数的比值得到每一属性的所述电力数据的重复分值;
当判断到所述重复分值大于预设重复阈值时,判定所述重复得分对应的电力数据异常。
作为其中一种可选的实施例,通过以下方式对所述电力数据进行正态分布异常检测:
对所述电力数据采用三倍标准差准则设定阈值;其中,所述阈值的区间为[μ-3σ,μ+3σ],μ表示经过正态分布处理后的电力数据的平均值,σ表示经过正态分布处理后的电力数据的标准差;
判断经过所述正态分布处理后的电力数据是否超过所述阈值;
若是,则所述电力数据异常,若否,则所述电力数据正常。
作为其中一种可选的实施例,通过以下方式对所述电力数据进行非参数化异常检测:
获取所述电力数据的上分位数值和下分位数值;
根据所述上分位数值和所述下分位数值,得到异常的电力数据。
作为其中一种可选的实施例,所述根据所述上分位数值和所述下分位数值,得到异常的电力数据,包括:
根据所述上分位数值和所述下分位数值,确定对应的检测区间范围;
当所述电力数据的数值不在所述检测区间范围内时,判定所述电力数据异常。
作为其中一种可选的实施例,所述检测区间范围为:
[Q1-k(Q3-Q1),Q3+k(Q3-Q1)]
其中,Q1为所述下分位数值,Q3为所述上分位数值,k为预设常数。
作为其中一种可选的实施例,通过贝叶斯估计法对所述电力数据进行任意分布异常检测。
本发明另一实施例对应提供了一种电力数据异常检测装置,包括:
重复判断单元,用于获取待检测的电力数据,并判断所述电力数据是否重复;
重复异常检测单元,用于若是,则对所述电力数据进行重复异常检测,并得到对应的异常检测结果,若否,则判断所述电力数据是否符合正态分布,并得到判断结果;
正态分布异常检测单元,用于当所述判断结果为是时,对所述电力数据进行正态分布异常检测,并得到对应的异常检测结果,当所述判断结果为否时,判断所述电力数据是否为分位数;
非参数化异常检测单元,用于若是,则对所述电力数据进行非参数化异常检测,并得到对应的异常检测结果;
任意分布异常检测单元,用于若否,则对所述电力数据进行任意分布异常检测,并得到对应的异常检测结果。
本发明另一实施例对应提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述发明实施例所述的电力数据异常检测方法。
本发明另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述发明实施例所述的电力数据异常检测方法。
与现有技术相比,本发明实施例提供的一种电力数据异常检测方法、装置、设备及介质,能够对基于正常行为获取到的电力数据的真实样本,按照重复异常检测、正态分布异常检测、非参数化异常检测、任意分布异常检测等方法,进行数据样本异常检测,解决了现有技术数据异常的检测手段较为单一的技术问题,从而进一步提高了电力数据异常检测的准确率。
附图说明
图1是本发明实施例提供的一种电力数据异常检测方法的流程示意图;
图2是本发明实施例提供的一种电力数据异常检测装置的结构示意图;
图3是本发明实施例提供的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例提供的一种电力数据异常检测方法的流程示意图,所述方法包括步骤S11至步骤S15:
S11、获取待检测的电力数据,并判断所述电力数据是否重复;
S12、若是,则对所述电力数据进行重复异常检测,并得到对应的异常检测结果,若否,则判断所述电力数据是否符合正态分布,并得到判断结果;
S13、当所述判断结果为是时,对所述电力数据进行正态分布异常检测,并得到对应的异常检测结果,当所述判断结果为否时,判断所述电力数据是否为分位数;
S14、若是,则对所述电力数据进行非参数化异常检测,并得到对应的异常检测结果;
S15、若否,则对所述电力数据进行任意分布异常检测,并得到对应的异常检测结果。
可以理解的是,在现有的电力系统中,例如:营销管理系统、计量自动化系统、GIS系统、配网生产系统等业务系统模型中,均包含大量的电力数据。但是,由于各业务系统模型的数据不匹配、多源异构配/用电数据缺乏统一、规范的异常检测及比对校验方法,导致数据质量较差,线损统计分析及异常问题较为突出。目前,现有的解决的方式主要是依赖于人工发现和完善质量较差的数据,即使可通过计算机软件系统来判断数据质量,但因计算机软件系统的判断标准结果不太令人信赖,结果只作为参考使用,大量工作仍是依赖人工现场确认,极大制约了电网运行维护及深化业务应用发展。而数据质量的准确性、完备性、一致性、确实性较差,主要的原因如下:
1、同一数据在不同系统中不一致、不匹配的问题较为突出。营销管理系统、计量自动化系统、GIS系统等均包含用户档案数据、低压配电网的电网结构数据、计量数据、线损数据等,这些数据在不同计算机系统中均存在,但因业务系统不贯通,造成同一数据存在多个来源,或因数据复制未保证时间同步性,造成带不同时间戳的同一数据存在于不同系统,导致数据不一致的问题。
2、现有数据不满足准确性、实时性、高精度等数据质量要求。一方面是现实中较难获得高质量数据,通常用低质量数据代替使用;另一方面是没有有效的计算机辅助措施来检验数据质量,使得低质量数据无法被发现而长期存在。
而与现有技术相比,本发明实施例提供的一种电力数据异常检测方法,能够对基于正常行为获取到的电力数据的真实样本,按照重复异常检测、正态分布异常检测、非参数化异常检测、任意分布异常检测等方法,进行数据样本异常检测,解决了现有技术数据异常的检测手段较为单一的技术问题,从而进一步提高了电力数据异常检测的准确率。
作为其中一种可选的实施例,通过以下方式对所述电力数据进行重复异常检测:
对于所述电力数据中的每一属性,获取每一属性的电力数据对应的数据总个数以及每一属性的所述电力数据中重复的数据个数;
根据所述重复的数据个数与所述数据总个数的比值得到每一属性的所述电力数据的重复分值;
当判断到所述重复分值大于预设重复阈值时,判定所述重复得分对应的电力数据异常。
示例性的,数据重复或复制是GIS系统、营销系统、计量系统中常出现的操作,属于档案数据质量中的一致性质量。不一致性风险被认为与(数据)重复的个数成正比,针对不同数据库中存储的电力数据,例如:在表j的第i列的每个属性中,能发现重复,按照k个属性分组并找到对应行的重复,计算出重复得分。
具体过程如下:
令X=A/B,其中,A表示存在重复时的数据项的个数,B表示考虑的数据项的个数,由此可知,X越小越好。
对应存在多个数据库表的情况:
Aj=∑iDij(j=1···T)
Bj=mj*nj(j=1···T)
式中:Dij表示在第j个表的第i列中发现的重复值的个数,T表示表的个数,mj表示第j个表的行数,nj表示第j个表的列数。
可以理解的是,在检测重复的异常数据之前,需要将数据进行分组,一个事件可以具备多维度的数据属性,以事件为列,数据维度为行进行重复计算,例如:电能表可以包括电压、电流、电量、温度、湿度。
作为其中一种可选的实施例,通过以下方式对所述电力数据进行正态分布异常检测:
对所述电力数据采用三倍标准差准则设定阈值;其中,所述阈值的区间为[μ-3σ,μ+3σ],μ表示经过正态分布处理后的电力数据的平均值,σ表示经过正态分布处理后的电力数据的标准差;
判断经过所述正态分布处理后的电力数据是否超过所述阈值;
若是,则所述电力数据异常,若否,则所述电力数据正常。
示例性的,正态分布的表达式为:
式中:参数μ是均值(峰值的位置),σ2是方差(σ普遍称为标准差)。对于正态(高斯)分布,区间(μ-σ,μ+σ)大约占合集的68%,而距离均值两个标准差地区间占合集的95%,距离均值三个标准差的区间占合集的99.7%。如果测试样本距离均值2倍或3倍方差以外,可认为该测试样本是不确定的,并判为异常。
需要说明的是,所述的采用三倍标准差准则仅为示例说明,在实际应用过程中,可以根据实际需求进行设定,在此不作限定。
作为其中一种可选的实施例,通过以下方式对所述电力数据进行非参数化异常检测:
获取所述电力数据的上分位数值和下分位数值;
根据所述上分位数值和所述下分位数值,得到异常的电力数据。
作为其中一种可选的实施例,所述根据所述上分位数值和所述下分位数值,得到异常的电力数据,包括:
根据所述上分位数值和所述下分位数值,确定对应的检测区间范围;
当所述电力数据的数值不在所述检测区间范围内时,判定所述电力数据异常。
作为其中一种可选的实施例,所述检测区间范围为:
[Q1-k(Q3-Q1),Q3+k(Q3-Q1)]
其中,Q1为所述下分位数值,Q3为所述上分位数值,k为预设常数。
可以理解是的,采用非参数化方法辨识出异常数据,该方法考虑到分位数的使用,分位数是一个随机变量的累计分布函数固定间隔所在的点。Q分位数将有序数据分为Q个大体上相等大小的数据子集,分位数是标记连续子集间边界的数据值。如果数据值落在期望极限的范围之外,则出现了拥有不准确数据的风险。可以将异常值定义为在这个范围之外的对于某个常数k的任何观测值:
[Q1-k(Q3-Q1),Q3+k(Q3-Q1)]
其中Q1和Q3是下分数和上分位数。例如:在k=1.5的四分位范围方法中,异常值是低于Q1-1.5(IQR)或高于Q3+1.5(IQR)的观测值。
需要说明的是,在实际应用过程中,k的数值可以根据实际需求进行设定,在此不作限定。
作为其中一种可选的实施例,通过贝叶斯估计法对所述电力数据进行任意分布异常检测。
可以理解的是,在判断到某组数据不符合正态分布,可以认为其是任意分布,并校验该组数据的所有值接近均值分布,找出不符合均值分布的某数值或一组数值,辨识为异常数据。
示例性的,对于任意分布,异常值的最大数量的估计是:
其中,X为随机变量,μ为期望值,k为实数(k>0),σ为标准差。对于任意分布,考虑到几乎所有值接近均值,则认为不超过1/k2的该分布的值离均值的距离大于k个标准差,则对应的数据为异常数据。
参见图2,是本发明实施例提供的一种电力数据异常检测装置的结构示意图,包括:
重复判断单元21,用于获取待检测的电力数据,并判断所述电力数据是否重复;
重复异常检测单元22,用于若是,则对所述电力数据进行重复异常检测,并得到对应的异常检测结果,若否,则判断所述电力数据是否符合正态分布,并得到判断结果;
正态分布异常检测单元23,用于当所述判断结果为是时,对所述电力数据进行正态分布异常检测,并得到对应的异常检测结果,当所述判断结果为否时,判断所述电力数据是否为分位数;
非参数化异常检测单元24,用于若是,则对所述电力数据进行非参数化异常检测,并得到对应的异常检测结果;
任意分布异常检测单元25,用于若否,则对所述电力数据进行任意分布异常检测,并得到对应的异常检测结果。
可以理解的是,在现有技术中,考虑到配电网分为稳态运行和故障状态,可以把配电网的异常检测辨识的分为稳态运行基础数据的检测辨识分析和对电网故障特征数据的检测辨识分析两大类。其中:
1、配电网稳态运行基础数据检测辨识
到目前为止,国内外进行配电网稳态运行基础数据检测辨识的研究方法大致可以归纳为基于状态估计和基于数据挖掘的两大类方法。
(1)基于状态估计的基础数据检测辨识方法
基于状态估计的基础数据检测辨识方法主要有估计辨识法、残差搜索法、零残差法和非二次准则法。基于状态估计的基础数据检测辨识方法的缺点是在检测辨识过程中可能会出现残差淹没或残差污染现象,从而造成误检或漏检。另外由于在辨识过程中需进行多次状态估计,因此会有很大计算量。
(2)基于数据挖掘的基础数据检测辨识方法
基于数据挖掘的基础数据检测辨识方法根据分析方法的不同可以分为基于间隙统计、基于模糊理论和聚类分析以及基于神经网络的三种方法,其中较为常见的是基于模糊理论和聚类分析以及基于神经网络方法。
①基于模糊理论和聚类分析的方法
基于模糊聚类的迭代自组织数据分析技术采用数据挖掘方法中的模糊集方法和聚类分析方法相结合的方法来实现不良数据的检测辨识,此方法的不足之处在于要人为的确定隶属度的大小,带有一定的主观性。
②基于神经网络的方法
神经网络方法的优点是其结构简单,缺点是阈值的选取通常带有很大的主观性和经验性,使得实际应用比较困难。
2、配电网故障特征数据检测辨识
电网的故障特征数据主要包括保护装置的动作信息数据及开关的状态变化信息数据等,此类信息数据的检测辨识研究目前并没有形成统一的结论,并无专门的理论方法对其进行检测辨识。目前国内外对故障特征数据的检测辨识主要是利用电力系统的故障诊断相关方法来实现的,在电网故障特征数据检测辨识方法中应用最成熟有效的是基于专家系统开发的算法,该算法是根据建立的专家系统知识库和规则库,利用计算机强大的逻辑推理能力,得出故障数据分析结果。但该方法无自学习能力、推理速度低、知识库和规则库的维护量大等缺点,且专家系统在推理过程中不涉及任何不确定的信息,但电力系统的故障是具有很大随机性的,所以无法存在一个专家系统知识库能包含所有的电网故障情况,当出现之前没有出现过的情况时,专家系统的诊断往往就会得出不正确的结果,影响其鲁棒性。
而与现有技术相比,本发明实施例提供的一种电力数据异常检测装置,能够对基于正常行为获取到的电力数据的真实样本,按照重复异常检测、正态分布异常检测、非参数化异常检测、任意分布异常检测等方法,进行数据样本异常检测,解决了现有技术数据异常的检测手段较为单一的技术问题,从而进一步提高了电力数据异常检测的准确率。
另外,需要说明的是,本实施例的电力数据异常检测装置的各实施例的相关具体描述和有益效果可以参考上述的电力数据异常方法的各实施例的相关具体描述和有益效果,在此不作赘述。
参见图3,是本发明实施例提供的一种终端设备的结构示意图。该实施例的终端设备3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序。所述处理器30执行所述计算机程序时实现上述各个车载氛围灯的控制方法实施例中的步骤。或者,所述处理器30执行所述计算机程序时实现上述各装置实施例中各模块的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器31中,并由所述处理器30执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备3中的执行过程。
所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备3可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,所述示意图仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备3还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器30是所述终端设备3的控制中心,利用各种接口和线路连接整个终端设备3的各个部分。
所述存储器31可用于存储所述计算机程序和/或模块,所述处理器30通过运行或执行存储在所述存储器31内的计算机程序和/或模块,以及调用存储在存储器31内的数据,实现所述终端设备3的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器31可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述终端设备3集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器30执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述所述的电力数据异常检测方法。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种电力数据异常检测方法,其特征在于,包括以下步骤:
获取待检测的电力数据,并判断所述电力数据是否重复;
若是,则对所述电力数据进行重复异常检测,并得到对应的异常检测结果,若否,则判断所述电力数据是否符合正态分布,并得到判断结果;
当所述判断结果为是时,对所述电力数据进行正态分布异常检测,并得到对应的异常检测结果,当所述判断结果为否时,判断所述电力数据是否为分位数;
若是,则对所述电力数据进行非参数化异常检测,并得到对应的异常检测结果;
若否,则对所述电力数据进行任意分布异常检测,并得到对应的异常检测结果。
2.根据权利要求1所述的电力数据异常检测方法,其特征在于,通过以下方式对所述电力数据进行重复异常检测:
对于所述电力数据中的每一属性,获取每一属性的电力数据对应的数据总个数以及每一属性的所述电力数据中重复的数据个数;
根据所述重复的数据个数与所述数据总个数的比值得到每一属性的所述电力数据的重复分值;
当判断到所述重复分值大于预设重复阈值时,判定所述重复得分对应的电力数据异常。
3.根据权利要求1所述的电力数据异常检测方法,其特征在于,通过以下方式对所述电力数据进行正态分布异常检测:
对所述电力数据采用三倍标准差准则设定阈值;其中,所述阈值的区间为[μ-3σ,μ+3σ],μ表示经过正态分布处理后的电力数据的平均值,σ表示经过正态分布处理后的电力数据的标准差;
判断经过所述正态分布处理后的电力数据是否超过所述阈值;
若是,则所述电力数据异常,若否,则所述电力数据正常。
4.根据权利要求1所述的电力数据异常检测方法,其特征在于,通过以下方式对所述电力数据进行非参数化异常检测:
获取所述电力数据的上分位数值和下分位数值;
根据所述上分位数值和所述下分位数值,得到异常的电力数据。
5.根据权利要求4所述的电力数据异常检测方法,其特征在于,所述根据所述上分位数值和所述下分位数值,得到异常的电力数据,包括:
根据所述上分位数值和所述下分位数值,确定对应的检测区间范围;
当所述电力数据的数值不在所述检测区间范围内时,判定所述电力数据异常。
6.根据权利要求5所述的电力数据异常检测方法,其特征在于,所述检测区间范围为:
[Q1-k(Q3-Q1),Q3+k(Q3-Q1)]
其中,Q1为所述下分位数值,Q3为所述上分位数值,k为预设常数。
7.根据权利要求1所述的电力数据异常检测方法,其特征在于,通过贝叶斯估计法对所述电力数据进行任意分布异常检测。
8.一种电力数据异常检测装置,其特征在于,包括:
重复判断单元,用于获取待检测的电力数据,并判断所述电力数据是否重复;
重复异常检测单元,用于若是,则对所述电力数据进行重复异常检测,并得到对应的异常检测结果,若否,则判断所述电力数据是否符合正态分布,并得到判断结果;
正态分布异常检测单元,用于当所述判断结果为是时,对所述电力数据进行正态分布异常检测,并得到对应的异常检测结果,当所述判断结果为否时,判断所述电力数据是否为分位数;
非参数化异常检测单元,用于若是,则对所述电力数据进行非参数化异常检测,并得到对应的异常检测结果;
任意分布异常检测单元,用于若否,则对所述电力数据进行任意分布异常检测,并得到对应的异常检测结果。
9.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的电力数据异常检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的电力数据异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111481341.1A CN114356900A (zh) | 2021-12-06 | 2021-12-06 | 一种电力数据异常检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111481341.1A CN114356900A (zh) | 2021-12-06 | 2021-12-06 | 一种电力数据异常检测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114356900A true CN114356900A (zh) | 2022-04-15 |
Family
ID=81097690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111481341.1A Pending CN114356900A (zh) | 2021-12-06 | 2021-12-06 | 一种电力数据异常检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114356900A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227543A (zh) * | 2023-05-09 | 2023-06-06 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN118035925A (zh) * | 2024-04-11 | 2024-05-14 | 国网信息通信产业集团有限公司 | 一种基于电力大模型的数据处理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726198A (zh) * | 2018-12-06 | 2019-05-07 | 中科恒运股份有限公司 | 异常数据处理方法及装置 |
CN111767938A (zh) * | 2020-05-09 | 2020-10-13 | 北京奇艺世纪科技有限公司 | 一种异常数据检测方法、装置及电子设备 |
CN112001596A (zh) * | 2020-07-27 | 2020-11-27 | 北京科技大学 | 一种时间序列数据异常点检测方法及系统 |
CN112612824A (zh) * | 2020-12-15 | 2021-04-06 | 重庆梅安森科技股份有限公司 | 基于大数据的供水管网异常数据检测方法 |
-
2021
- 2021-12-06 CN CN202111481341.1A patent/CN114356900A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726198A (zh) * | 2018-12-06 | 2019-05-07 | 中科恒运股份有限公司 | 异常数据处理方法及装置 |
CN111767938A (zh) * | 2020-05-09 | 2020-10-13 | 北京奇艺世纪科技有限公司 | 一种异常数据检测方法、装置及电子设备 |
CN112001596A (zh) * | 2020-07-27 | 2020-11-27 | 北京科技大学 | 一种时间序列数据异常点检测方法及系统 |
CN112612824A (zh) * | 2020-12-15 | 2021-04-06 | 重庆梅安森科技股份有限公司 | 基于大数据的供水管网异常数据检测方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227543A (zh) * | 2023-05-09 | 2023-06-06 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN116227543B (zh) * | 2023-05-09 | 2023-08-04 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN118035925A (zh) * | 2024-04-11 | 2024-05-14 | 国网信息通信产业集团有限公司 | 一种基于电力大模型的数据处理系统 |
CN118035925B (zh) * | 2024-04-11 | 2024-07-26 | 国网信息通信产业集团有限公司 | 一种基于电力大模型的数据处理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034244B (zh) | 基于电量曲线特征模型的线损异常诊断方法及装置 | |
CN114298863B (zh) | 一种智能抄表终端的数据采集方法及系统 | |
CN112529061B (zh) | 一种光伏功率异常数据的识别方法、装置及终端设备 | |
CN114356900A (zh) | 一种电力数据异常检测方法、装置、设备及介质 | |
CN115865649B (zh) | 一种智能运维管理控制方法、系统和存储介质 | |
CN113391256B (zh) | 一种现场作业终端的电能表计量故障分析方法及系统 | |
CN111176953A (zh) | 一种异常检测及其模型训练方法、计算机设备和存储介质 | |
CN110634081A (zh) | 一种水电站异常数据的处理方法及装置 | |
CN115454778A (zh) | 大规模云网络环境下的时序指标异常智能监控系统 | |
CN111352794B (zh) | 异常检测方法、装置、计算机装置及存储介质 | |
CN113591393A (zh) | 智能变电站的故障诊断方法、装置、设备和存储介质 | |
CN111984442A (zh) | 计算机集群系统的异常检测方法及装置、存储介质 | |
CN110647913A (zh) | 基于聚类算法的异常数据检测方法及装置 | |
CN117849700B (zh) | 可控制测量的模块化电能计量系统 | |
CN116593897A (zh) | 动力电池故障诊断方法、系统、车辆及存储介质 | |
CN117150233B (zh) | 一种电网异常数据治理方法、系统、设备及介质 | |
CN116860562B (zh) | 一种用于数据中台数据质量的监控方法及系统 | |
CN117035563B (zh) | 产品质量安全风险监测方法、设备、监测系统及介质 | |
CN113806343B (zh) | 一种车联网数据质量的评估方法和系统 | |
CN118176499A (zh) | 一种三元正极材料粉碎粒度预测方法及装置 | |
CN117171176A (zh) | 一种基于人工智能的用电大数据自升级监管平台 | |
CN117592656A (zh) | 基于碳数据核算的碳足迹监控方法及系统 | |
CN112069037A (zh) | 一种云平台无阈值检测的方法和装置 | |
CN110688273B (zh) | 分类模型的监控方法、装置、终端以及计算机存储介质 | |
CN115494431A (zh) | 一种变压器故障告警方法、终端设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |