CN114330583B - 一种异常用电识别方法和异常用电识别系统 - Google Patents

一种异常用电识别方法和异常用电识别系统 Download PDF

Info

Publication number
CN114330583B
CN114330583B CN202111677609.9A CN202111677609A CN114330583B CN 114330583 B CN114330583 B CN 114330583B CN 202111677609 A CN202111677609 A CN 202111677609A CN 114330583 B CN114330583 B CN 114330583B
Authority
CN
China
Prior art keywords
data
electricity utilization
historical
compressed
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111677609.9A
Other languages
English (en)
Other versions
CN114330583A (zh
Inventor
胡文曦
刘慧自
肖先勇
汪颖
孙一浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202111677609.9A priority Critical patent/CN114330583B/zh
Publication of CN114330583A publication Critical patent/CN114330583A/zh
Application granted granted Critical
Publication of CN114330583B publication Critical patent/CN114330583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种异常用电识别方法和异常用电识别系统,所述异常用电识别方法包括:采集历史用电数据;对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。本发明所提供的异常用电识别方法和异常用电识别系统,能够解决现有异常用电识别受限的问题。

Description

一种异常用电识别方法和异常用电识别系统
技术领域
本发明涉及用电数据处理技术领域,具体涉及一种异常用电识别方法和异常用电识别系统。
背景技术
异常用电识别是用电稽查、计量装置运行状态辨识的重要内容,对维护电网的安全运行和保障正常用户权益有重要意义。现有人工排查方法难以应对不同异常用电原因所呈现的多样性、随机性等特点,导致识别结果往往准确率不高,且效率较低。随着人工智能算法的发展,基于回归模型、分类模型与聚类模型的集中式计算方法被广泛应用。但是为了识别用户多元用电模式,这些方法在保证识别准确性的基础上容易造成计算过于复杂,而考虑效率的简单计算方法又难以准确度量不同用电模式的相似性,因此难以兼顾计算效率与准确性;此外,将用电数据上传至云端集中计算会占用大量网络带宽和计算资源,进一步限制了异常辨识的应用。因此迫切需要一种分布式的异常识别方法以平衡准确性和计算效率。
发明内容
本发明的目的在于提供一种异常用电识别方法和异常用电识别系统,以解决现有异常用电识别受限的问题。
本发明解决上述技术问题的技术方案如下:
本发明提供一种异常用电识别方法,所述异常用电识别方法包括:
采集历史用电数据;
对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;
根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
本发明还提供一种异常用电识别方法,其应用于边缘端,所述异常用电识别方法包括:
对历史用电数据进行数据处理操作,得到新的用电数据,其中,所述历史用电数据包括多个历史用电子数据,所述新的用电数据包括多个与所述历史用电子数据一一对应的新的用电子数据;
计算每个所述历史用电子数据的阈值;
根据多个所述历史用电子数据的阈值和多个所述新的用电子数据,对所述历史用电数据进行分段处理,得到分段处理结果;
计算每段处理结果的平均值,得到计算结果;
根据所述计算结果,得到压缩数据序列;
根据所述压缩数据序列,得到所述压缩后的历史用电数据。
可选择地,所述对所述历史用电数据进行数据处理操作包括:
对所述历史用电数据中的每个历史用电子数据进行差分运算操作,得到差分运算后的用电数据;
取所述差分运算后的用电数据的绝对值,得到所述新的用电数据。
可选择地,所述计算每个所述历史用电子数据的阈值包括:
将目标历史用电子数据的目标范围内的值作为所述目标用电子数据的阈值的计算窗口;
根据所述目标用电子数据的阈值的计算窗口,得到所述目标历史用电子数据的阈值。
可选择地,所述目标历史用电子数据的阈值的计算方式为:
Figure BDA0003452618330000021
其中,thj表示xj+1相对于xj允许的最大变化量,μ表示计算窗口中数据的平均值,σ表示计算窗口中数据的标准差,pj为能量比率,且
Figure BDA0003452618330000031
Ej和ET分别为计算窗口中信号的能量和整个信号的总能量,且
Figure BDA0003452618330000032
Figure BDA0003452618330000033
cnt表示常数,xj表示历史数据中第j个历史子数据。
可选择地,所述根据多个所述历史用电子数据的阈值和多个所述新的用电子数据,对所述历史用电数据进行分段处理,得到分段处理结果包括:
若当前所述新的用电子数据大于与当前所述新的用电子数据对应的历史用电子数据的阈值,则将该历史用电子数据作为分段点;
利用所述分段点对所述历史用电数据进行分段,得到多段历史用电数据;
将多段所述历史用电数据作为分段处理结果输出。
本发明还提供一种异常用电识别方法,其应用于云端,所述异常用电识别方法包括:
获取压缩后的用电数据中的压缩数据序列;
计算多个所述压缩数据序列间的分段加权DTW距离和滑动欧式距离,得到第一距离计算结果和第二距离计算结果;
根据所述第一距离计算结果和所述第二距离计算结果,得到综合相似度;
根据所述综合相似度,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
可选择地,所述分段加权DTW距离为:
DTW(A,B)=D(m,n)
其中,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离;A和B分别表示压缩数据序列A和压缩数据序列B,D(m,n)表示累积距离矩阵的第m行n列的值,D是m×n的距离矩阵;
所述滑动欧式距离为:
Figure BDA0003452618330000041
其中,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离,ak和bk分别表示压缩数据序列A和压缩数据序列B中第k个元素ak和第k个元素bk
所述综合相似度为:
S(A,B)=α·DTW(A,B)+β·ED(A,B)
其中,S(A,B)表示综合相似度,α和β分别为加权DTW距离和滑动欧式距离的权重,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离。
可选择地,所述根据所述综合相似度,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果包括:
根据所述综合相似度,得到综合相似度矩阵;
根据所述综合相似度矩阵的行数,得到最小聚类点数;
对所述综合相似度矩阵中每行元素进行排序,得到排序后的每行元素;
取排序后的每行元素中所述最小聚类点数值所在列的所有数据,并对其进行最大最小值归一化处理,得到处理结果;
根据所述处理结果绘制曲线;
若所述曲线中目标点与其相邻点间的变化量大于预设阈值,则将满足该条件的第一个所述目标点处理之前的值作为邻域半径;
将所述邻域半径、所述最小聚类点数和所述相似度矩阵输入所述基于密度的聚类算法中进行识别,得到识别结果。
基于上述技术方案,本发明还提供一种异常用电识别系统,所述异常用电识别系统利用上述的异常用电识别方法,并且,所述异常用电识别系统包括:
数据采集模块,所述数据采集模块用于采集历史用电数据;
数据压缩模块,所述数据压缩模块用于对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;
数据传输模块,所述数据传输模块用于将所述压缩后的用电数据传输至数据识别处理模块;
数据识别处理模块,所述数据识别处理模块用于根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
本发明具有以下有益效果:
1.本发明基于云边协同计算架构,相比于集中式计算降低了数据传输的带宽占用,缓解了云端服务器的计算压力,提高了计算架构的整体性能。
2.本发明采用分段加权DTW距离和滑动欧式距离对压缩数据的综合相似性进行度量,考虑了压缩数据整体和局部的特征,为异常识别准确性奠定了基础。
3.本发明根据用电数据的特点,采用其统计特征和熵等多种判据作为分段依据,使数据的平稳段和波动段得到了不同压缩率的处理,保证了压缩数据的准确性。
附图说明
图1为本发明所提供的异常用电识别系统的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1
本发明提供一种异常用电识别方法,所述异常用电识别方法包括:
采集历史用电数据;
对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;
根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
本发明还提供一种异常用电识别方法,其应用于边缘端,所述异常用电识别方法包括:
对历史用电数据进行数据处理操作,得到新的用电数据,其中,所述历史用电数据包括多个历史用电子数据,所述新的用电数据包括多个与所述历史用电子数据一一对应的新的用电子数据;
计算每个所述历史用电子数据的阈值;
根据多个所述历史用电子数据的阈值和多个所述新的用电子数据,对所述历史用电数据进行分段处理,得到分段处理结果;
计算每段处理结果的平均值,得到计算结果;
根据所述计算结果,得到压缩数据序列;
根据所述压缩数据序列,得到所述压缩后的历史用电数据。
可选择地,所述对所述历史用电数据进行数据处理操作包括:
对所述历史用电数据中的每个历史用电子数据进行差分运算操作,得到差分运算后的用电数据;
取所述差分运算后的用电数据的绝对值,得到所述新的用电数据。
可选择地,所述计算每个所述历史用电子数据的阈值包括:
将目标历史用电子数据的目标范围内的值作为所述目标用电子数据的阈值的计算窗口;
根据所述目标用电子数据的阈值的计算窗口,得到所述目标历史用电子数据的阈值。
可选择地,所述目标历史用电子数据的阈值的计算方式为:
Figure BDA0003452618330000071
其中,thj表示xj+1相对于xj允许的最大变化量,μ表示计算窗口中数据的平均值,σ表示计算窗口中数据的标准差,pj为能量比率,且
Figure BDA0003452618330000072
Ej和ET分别为计算窗口中信号的能量和整个信号的总能量,且
Figure BDA0003452618330000073
Figure BDA0003452618330000074
cnt表示常数,xj表示历史数据中第j个历史子数据。
可选择地,所述根据多个所述历史用电子数据的阈值和多个所述新的用电子数据,对所述历史用电数据进行分段处理,得到分段处理结果包括:
若当前所述新的用电子数据大于与当前所述新的用电子数据对应的历史用电子数据的阈值,则将该历史用电子数据作为分段点;
利用所述分段点对所述历史用电数据进行分段,得到多段历史用电数据;
将多段所述历史用电数据作为分段处理结果输出。
本发明还提供一种异常用电识别方法,其应用于云端,所述异常用电识别方法包括:
获取压缩后的用电数据中的压缩数据序列;
计算多个所述压缩数据序列间的分段加权DTW距离和滑动欧式距离,得到第一距离计算结果和第二距离计算结果;
根据所述第一距离计算结果和所述第二距离计算结果,得到综合相似度;
根据所述综合相似度,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
可选择地,所述分段加权DTW距离为:
DTW(A,B)=D(m,n)
其中,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离;A和B分别表示压缩数据序列A和压缩数据序列B,D(m,n)表示累积距离矩阵的第m行n列的值,D是m×n的距离矩阵;
所述滑动欧式距离为:
Figure BDA0003452618330000081
其中,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离,ak和bk分别表示压缩数据序列A和压缩数据序列B中第k个元素ak和第k个元素bk,m表示压缩数据序列和压缩数据序列中长度更短的那一个。
所述综合相似度为:
S(A,B)=α·DTW(A,B)+β·ED(A,B)
其中,S(A,B)表示综合相似度,α和β分别为加权DTW距离和滑动欧式距离的权重,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离。
可选择地,所述根据所述综合相似度,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果包括:
根据所述综合相似度,得到综合相似度矩阵;
根据所述综合相似度矩阵的行数,得到最小聚类点数;
对所述综合相似度矩阵中每行元素进行排序,得到排序后的每行元素;
取排序后的每行元素中所述最小聚类点数值所在列的所有数据,并对其进行最大最小值归一化处理,得到处理结果;
根据所述处理结果绘制曲线;
若所述曲线中目标点与其相邻点间的变化量大于预设阈值,则将满足该条件的第一个所述目标点处理之前的值作为邻域半径;
将所述邻域半径、所述最小聚类点数和所述相似度矩阵输入所述基于密度的聚类算法中进行识别,得到识别结果。
基于上述技术方案,本发明还提供一种异常用电识别系统,所述异常用电识别系统利用上述的异常用电识别方法,并且,所述异常用电识别系统包括:
数据采集模块,所述数据采集模块用于采集历史用电数据;
数据压缩模块,所述数据压缩模块用于对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;
数据传输模块,所述数据传输模块用于将所述压缩后的用电数据传输至数据识别处理模块;
数据识别处理模块,所述数据识别处理模块用于根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
本发明具有以下技术效果:
1、本发明考虑了高采样率的用电数据对集中式的异常用电识别方法计算效率和传输带宽上的负面影响,为此,基于本发明所提供的异常用电识别系统,根据边缘端和云端的算力差异和传输限制,本发明将计算量较小的数据压缩模块部署在边缘端,且边缘端仅将压缩后的数据上传至云端,这将极大地减少带宽占用。而云端则根据压缩数据的相似度识别异常,由于数据长度减小,这也将释放云端的部分算力,提高协同计算架构整体的性能。
2、本发明考虑了传统数据压缩方法固定压缩率对信息准确性造成的影响。由于用电曲线中大部分波形较为平稳,反而是少部分波动较大的信号段包含较多信息,因此对其中波动剧烈的数据段,如果直接进行等压缩率的处理会丢失许多重要的特征信息,无法实现用电信息的动态表达,这将直接影响后续云端的异常识别结果。本发明对压缩方法的分段策略进行改进,让其依据数据自身的统计特征选取分段窗口长度,动态调整压缩率,如平稳段的压缩率变大,而波动段的压缩率变小,甚至直接将其保留,使用电数据的信息得到动态的表达。
3、本发明考虑了异常识别算法对相似性度量准确性的依赖,为此,基于分段加权DTW距离和滑动欧式距离计算数据的综合相似度,考虑了压缩数据的整体和局部特征,提高了相似性度量的准确性。
实施例2
由于电网中各种仪表的采样率不断提高,使得电力企业能掌握到的用户用电数据更为精细,然而这些高精度的数据对算力提出了更高的要求。为了节约计算资源,需要先对数据进行压缩。
对于历史用电数据X={x1,x2,…,xn},先对其作差分运算并取绝对值得到新的用电数据X'={x'1,x'2,…,x'n-1},其中,x'n-1=|xn-xn-1|。
历史用电数据X中的每个值xj,取其前k个和后k个值作为一个该值的阈值计算窗口,阈值计算方式为:
Figure BDA0003452618330000101
其中,thj表示xj+1相对于xj允许的最大变化量,μ表示计算窗口中数据的平均值,σ表示计算窗口中数据的标准差,pj为能量比率,且
Figure BDA0003452618330000102
Ej和ET分别为计算窗口中信号的能量和整个信号的总能量,且
Figure BDA0003452618330000103
Figure BDA0003452618330000104
cnt表示常数,xj表示历史数据中第j个历史子数据。
由于
Figure BDA0003452618330000105
和pj都没有量纲,因此引入常数cnt,用以校正th的数量级,使之与x'j相匹配。同时也可以通过控制这个参数的大小,来得到最匹配边缘服务器算力的数据量。
在进行分段加权DTW距离的计算过程中:
首先,设两个经过压缩的压缩数据序列A={a1,a2,…,am}和压缩数据序列B={b1,b2,…,bn},其中的元素ai和bj实际上是两个分段的数据取平均得来的,且
Figure BDA0003452618330000111
式中ais和bjt分别为ai和bj所对应的数据分段元素。ai和bj代表了分段的信息,相当于分段内的点取相同的权值得到的综合数据点,其包含了曲线的局部特征信息。
他们的长度分别为m和n,先构造一个m×n的初始距离矩阵M:
Figure BDA0003452618330000112
式中d(ai,bj)表示ai和bj两个点之间的距离,通常采用欧式距离,即
Figure BDA0003452618330000113
其次,在初始距离矩阵M中找到一条满足边界条件和单调性的压缩数据序列A和压缩数据序列B之间的对齐路径p={p1,p2,…,pk},式中p1=(1,1),pk=(m,n),pk为路径中第k个点的坐标,且max(m,n)≤k≤m+n-1;若pt=(i,j),则pt+1只能是(i+1,j),(i,j+1),(i+1,j+1)这三种情况之一。
之后,根据初始距离矩阵M和上述的路径形成规则,通过递归法计算累积距离矩阵D的元素
Figure BDA0003452618330000114
式中D(i,j)表示矩阵M中的d(a1,b1)到d(ai,bj)的最小累积距离。
最后,压缩数据序列A和压缩数据序列B之间的分段加权DTW距离为:
DTW(A,B)=D(m,n)
其中,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离;A和B分别表示压缩数据序列A和压缩数据序列B,D(m,n)表示累积距离矩阵的第m行n列的值,D是m×n的距离矩阵;
将压缩数据序列A的第一个数据和压缩数据序列B第一个数据对齐后计算欧式距离,假设压缩数据序列A的长度小于压缩数据序列B的长度,则其两者间的滑动欧式距离为:
Figure BDA0003452618330000121
其中,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离,ak和bk分别表示压缩数据序列A和压缩数据序列B中第k个元素ak和第k个元素bk,m表示压缩数据序列和压缩数据序列中长度更短的那一个。
之后将压缩数据序列A的第一个数据和压缩数据序列B第一个数据对齐后计算对应的欧式距离,直到压缩数据序列A的所有数据和压缩数据序列B的所有数据均计算过欧式距离,则输出所有数值中的最小值,作为两条数据之间的滑动欧式距离。
结合分段加权DTW距离和滑动欧式距离计算综合相似度矩阵,则综合相似度为:
S(A,B)=α·DTW(A,B)+β·ED(A,B)
其中,S(A,B)表示综合相似度,α和β分别为加权DTW距离和滑动欧式距离的权重,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离。
之后,利用综合相似度矩阵,利用DBSCAN算法,对历史用电数据中的异常用电数据进行识别,具体包括:
①若输入算法的样本数,即综合相似度矩阵S的行数为n,那么最小聚类点数一般取
Figure BDA0003452618330000122
②将相似度矩阵S的每行按照升序排序后取出第MinPts列,先将该列进行最大最小值归一化,然后按照升序绘制曲线。
③若曲线相邻两点间的变化量δ>0.1,则将该第一个满足条件的点归一化前的值作为邻域半径Eps。
④将两个参数和相似度矩阵输入DBSCAN算法中,DBSCAN识别的异常点即为本发明识别出的异常用电数据。
基于上述技术方案,同时鉴于如今用电数据的采样率普遍较高,采用集中式的异常识别方法势必给数据传输带宽和服务器算力造成巨大的压力,而云边协同的方式能利用大量的边缘服务器预处理冗余数据,节约了数据传输带宽和云端服务器算力,可极大地提升系统性能。因此本发明的异常用电识别系统包括数据采集模块、数据压缩模块、数据传输模块和数据处理识别模块,具体参考图1,数据采集模块选择较为常见的智能电表,数据压缩模块采用边缘节点,数据传输模块选用通信传输线,数据处理识别模块包括云端的相似性度量和云端的异常识别组成。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种异常用电识别方法,其特征在于,所述异常用电识别方法包括:
采集历史用电数据;
对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;
根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果;所述异常用电识别方法应用于边缘端,包括:
对历史用电数据进行数据处理操作,得到新的用电数据,其中,所述历史用电数据包括多个历史用电子数据,所述新的用电数据包括多个与所述历史用电子数据一一对应的新的用电子数据;
计算每个所述历史用电子数据的阈值;
根据多个所述历史用电子数据的阈值和多个所述新的用电子数据,对所述历史用电数据进行分段处理,得到分段处理结果;
计算每段处理结果的平均值,得到计算结果;
根据所述计算结果,得到压缩数据序列;
根据所述压缩数据序列,得到所述压缩后的历史用电数据;
所述异常用电识别方法应用于云端,包括:
获取压缩后的用电数据中的压缩数据序列;
计算多个所述压缩数据序列间的分段加权DTW距离和滑动欧式距离,得到第一距离计算结果和第二距离计算结果;
根据所述第一距离计算结果和所述第二距离计算结果,得到综合相似度;
根据所述综合相似度,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果;
所述分段加权DTW距离为:
DTW(A,B)=D(m,n)
其中,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离;A和B分别表示压缩数据序列A和压缩数据序列B,D(m,n)表示累积距离矩阵的第m行n列的值,D是m×n的距离矩阵;
所述滑动欧式距离为:
Figure FDA0003862239570000021
其中,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离,ak和bk分别表示压缩数据序列A和压缩数据序列B中第k个元素ak和第k个元素bk
所述综合相似度为:
S(A,B)=α·DTW(A,B)+β·ED(A,B)
其中,S(A,B)表示综合相似度,α和β分别为加权DTW距离和滑动欧式距离的权重,DTW(A,B)表示压缩数据序列A和压缩数据序列B之间的分段加权DTW距离,ED(A,B)表示压缩数据序列A和压缩数据序列B之间的滑动欧式距离;
所述根据所述综合相似度,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果包括:
根据所述综合相似度,得到综合相似度矩阵;
根据所述综合相似度矩阵的行数,得到最小聚类点数;
对所述综合相似度矩阵中每行元素进行排序,得到排序后的每行元素;
取排序后的每行元素中所述最小聚类点数值所在列的所有数据,并对其进行最大最小值归一化处理,得到处理结果;
根据所述处理结果绘制曲线;
若所述曲线中目标点与其相邻点间的变化量大于预设阈值,则将满足该条件的第一个所述目标点处理之前的值作为邻域半径;
将所述邻域半径、所述最小聚类点数和所述相似度矩阵输入所述基于密度的聚类算法中进行识别,得到识别结果。
2.根据权利要求1所述的异常用电识别方法,其特征在于,所述对所述历史用电数据进行数据处理操作包括:
对所述历史用电数据中的每个历史用电子数据进行差分运算操作,得到差分运算后的用电数据;
取所述差分运算后的用电数据的绝对值,得到所述新的用电数据。
3.根据权利要求1所述的异常用电识别方法,其特征在于,所述计算每个所述历史用电子数据的阈值包括:
将目标历史用电子数据的目标范围内的值作为所述目标用电子数据的阈值的计算窗口;
根据所述目标用电子数据的阈值的计算窗口,得到所述目标历史用电子数据的阈值。
4.根据权利要求3所述的异常用电识别方法,其特征在于,所述目标历史用电子数据的阈值的计算方式为:
Figure FDA0003862239570000031
其中,thj表示xj+1相对于xj允许的最大变化量,μ表示计算窗口中数据的平均值,σ表示计算窗口中数据的标准差,pj为能量比率,且
Figure FDA0003862239570000032
Ej和ET分别为计算窗口中信号的能量和整个信号的总能量,且
Figure FDA0003862239570000033
Figure FDA0003862239570000034
cnt表示常数,xj表示历史数据中第j个历史子数据。
5.根据权利要求2-4中任意一项所述的异常用电识别方法,其特征在于,所述根据多个所述历史用电子数据的阈值和多个所述新的用电子数据,对所述历史用电数据进行分段处理,得到分段处理结果包括:
若当前所述新的用电子数据大于与当前所述新的用电子数据对应的历史用电子数据的阈值,则将该历史用电子数据作为分段点;
利用所述分段点对所述历史用电数据进行分段,得到多段历史用电数据;
将多段所述历史用电数据作为分段处理结果输出。
6.一种异常用电识别系统,其特征在于,所述异常用电识别系统利用根据权利要求1-5中任意一项所述的异常用电识别方法,并且,所述异常用电识别系统包括:
数据采集模块,所述数据采集模块用于采集历史用电数据;
数据压缩模块,所述数据压缩模块用于对所述历史用电数据进行数据压缩处理,得到压缩后的用电数据;
数据传输模块,所述数据传输模块用于将所述压缩后的用电数据传输至数据识别处理模块;
数据识别处理模块,所述数据识别处理模块用于根据所述压缩后的用电数据,利用基于密度的聚类算法,对所述历史用电数据中的异常用电进行识别,得到识别结果。
CN202111677609.9A 2021-12-31 2021-12-31 一种异常用电识别方法和异常用电识别系统 Active CN114330583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111677609.9A CN114330583B (zh) 2021-12-31 2021-12-31 一种异常用电识别方法和异常用电识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111677609.9A CN114330583B (zh) 2021-12-31 2021-12-31 一种异常用电识别方法和异常用电识别系统

Publications (2)

Publication Number Publication Date
CN114330583A CN114330583A (zh) 2022-04-12
CN114330583B true CN114330583B (zh) 2022-11-08

Family

ID=81023743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111677609.9A Active CN114330583B (zh) 2021-12-31 2021-12-31 一种异常用电识别方法和异常用电识别系统

Country Status (1)

Country Link
CN (1) CN114330583B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116166978B (zh) * 2023-04-23 2023-07-25 山东民生集团有限公司 一种用于供应链管理的物流数据压缩存储方法
CN116257735B (zh) * 2023-05-16 2023-07-25 保定思齐智科信息科技有限公司 用于智慧城市治理的数据处理方法及系统
CN116320043B (zh) * 2023-05-24 2023-08-01 深圳龙电华鑫控股集团股份有限公司 一种提高多载波通信系统传输效率的方法及系统
CN117970182A (zh) * 2024-03-28 2024-05-03 国网山东省电力公司曲阜市供电公司 一种基于dtw算法的漏电预警方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220906A (zh) * 2017-05-31 2017-09-29 国网上海市电力公司 基于用电采集系统的多时间尺度用电异常分析方法
CN109145995A (zh) * 2018-08-31 2019-01-04 国网福建省电力有限公司 一种基于聚类离散点检测的反窃电方法
CN110837874A (zh) * 2019-11-18 2020-02-25 上海新炬网络信息技术股份有限公司 基于时间序列分类的业务数据异常检测方法
CN112381264A (zh) * 2020-10-20 2021-02-19 昆明理工大学 一种基于改进图卷积神经网络的用电负荷辨识方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017053876A1 (en) * 2015-09-24 2017-03-30 Earth Networks, Inc. Remote sensing to derive calibrated power measurements
CN112131441B (zh) * 2020-09-27 2023-09-19 国网内蒙古东部电力有限公司 一种快速识别用电异常行为的方法及系统
CN113033598A (zh) * 2021-01-20 2021-06-25 昆明理工大学 一种基于曲线相似度和集成学习算法的窃电识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220906A (zh) * 2017-05-31 2017-09-29 国网上海市电力公司 基于用电采集系统的多时间尺度用电异常分析方法
CN109145995A (zh) * 2018-08-31 2019-01-04 国网福建省电力有限公司 一种基于聚类离散点检测的反窃电方法
CN110837874A (zh) * 2019-11-18 2020-02-25 上海新炬网络信息技术股份有限公司 基于时间序列分类的业务数据异常检测方法
CN112381264A (zh) * 2020-10-20 2021-02-19 昆明理工大学 一种基于改进图卷积神经网络的用电负荷辨识方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种基于离群算法的窃电行为检测的研究;蔡耀年;《计算技术与自动化》;20180630;73-77 *

Also Published As

Publication number Publication date
CN114330583A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN114330583B (zh) 一种异常用电识别方法和异常用电识别系统
CN111199016B (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN109873779B (zh) 一种基于lstm的分级式无线信号调制类型识别方法
CN108435819B (zh) 一种铝型材挤压机能耗异常检测方法
CN112819299A (zh) 一种基于中心优化的差分K-means负荷聚类方法
CN110874381B (zh) 一种基于空间密度聚类的用户侧负荷数据异常值识别方法
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN109636667A (zh) 一种基于用户周用电特征的低压用户用电异常检测方法
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
CN112101765A (zh) 一种配电网运行指标数据异常数据处理方法及系统
CN110879927A (zh) 一种用于海目标检测的海杂波幅度统计分布现场建模方法
CN113657678A (zh) 一种基于信息新鲜度的电网电力数据预测方法
CN116148753A (zh) 一种智能电能表运行误差监测系统
Wen et al. Probabilistic wind power forecasting via Bayesian deep learning based prediction intervals
CN117744916A (zh) 储能容量的预测方法、装置、计算机设备及可读存储介质
CN117473351B (zh) 基于物联网的电源信息远程传输系统
CN114266457A (zh) 一种配电线路异损诱因检测的方法
CN117170979B (zh) 一种大规模设备的能耗数据处理方法、系统、设备及介质
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN117688362A (zh) 基于多元数据特征增强的光伏功率区间预测方法及装置
CN113112177A (zh) 一种基于混合指标的台区线损处理方法及系统
Li et al. Online course learning outcome evaluation method based on big data analysis
CN115935212A (zh) 一种基于纵向趋势预测的可调节负荷聚类方法及系统
CN117154716A (zh) 一种分布式电源接入配电网的规划方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant