CN112926645A - 一种基于边缘计算的窃电检测方法 - Google Patents

一种基于边缘计算的窃电检测方法 Download PDF

Info

Publication number
CN112926645A
CN112926645A CN202110196794.3A CN202110196794A CN112926645A CN 112926645 A CN112926645 A CN 112926645A CN 202110196794 A CN202110196794 A CN 202110196794A CN 112926645 A CN112926645 A CN 112926645A
Authority
CN
China
Prior art keywords
data
user
model
cnn
svm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110196794.3A
Other languages
English (en)
Other versions
CN112926645B (zh
Inventor
李琪林
黄嘉鹏
张哲敏
严平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marketing Service Center Of State Grid Sichuan Electric Power Co
Original Assignee
Marketing Service Center Of State Grid Sichuan Electric Power Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marketing Service Center Of State Grid Sichuan Electric Power Co filed Critical Marketing Service Center Of State Grid Sichuan Electric Power Co
Priority to CN202110196794.3A priority Critical patent/CN112926645B/zh
Publication of CN112926645A publication Critical patent/CN112926645A/zh
Application granted granted Critical
Publication of CN112926645B publication Critical patent/CN112926645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Probability & Statistics with Applications (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于边缘计算的窃电检测方法,涉及窃电检测方法领域,解决了边缘计算平台采集用户信息进行基于分类器的检测分析的分析模型不适宜导致计算复杂度高,硬件软件成本高的问题。本发明包括对历史用电信息数据进行聚类,进行多类别CNN特征提取模型的训练,传入多台边缘式数据处理中心中,使用CNN特征提取模型对历史用电数据进行特征提取后输入SVM进行训练,得到训练好的CNN‑SVM模型,将实时用户用电数据传入对应的边缘式据处理中心中,边缘式数据中心根据训练好的CNN‑SVM模型进行分类,得到预测是否为窃电用户的结果。本发明的聚类方法提高运算速度,特征提取器具有较好的收敛性能,准确度更好且计算复杂度低,适合边缘数据中心部署。

Description

一种基于边缘计算的窃电检测方法
技术领域
本发明涉及窃电检测方法,具体涉及一种基于边缘计算的窃电检测方法。
背景技术
现有边缘计算平台采集用户信息进行基于分类器的检测分析,往往因为分析模型不适宜导致计算复杂度高,硬件软件成本高,不适合进行边缘数据部署。
发明内容
本发明所要解决的技术问题是:边缘计算平台采集用户信息进行基于分类器的检测分析的分析模型不适宜导致计算复杂度高,硬件软件成本高,本发明提供了解决上述问题的一种基于边缘计算的窃电检测方法。
本发明通过下述技术方案实现:
一种基于边缘计算的窃电检测方法,依据采集到的用户用电信息和历史用电数据对实时用户用电数据预测的步骤如下:
步骤一:采集用户的历史用电信息,上传到集中式数据处理中心;
步骤二:所述集中式数据处理中心利用快速搜索密度峰值聚类技术(CFSFDP),对步骤一采集到的历史用电信息数据进行聚类,得到与所述用户的用电行为相似的多类用户用电数据;
步骤三:所述集中式数据处理中心对多类用户用电数据进行多类别CNN特征提取模型的训练;
步骤四:集中式数据处理中心将步骤三中训练好的CNN特征提取模型参数分类传入多台边缘式数据处理中心中;
步骤五:在边缘式数据处理中心中,使用训练好的CNN特征提取模型对历史用电数据进行特征提取,将提取后的特征输入SVM进行训练,得到SVM分类器模型参数,得到训练好的CNN-SVM模型;
步骤六:将实时用户用电数据传入对应的边缘式据处理中心中,边缘式数据中心根据训练好的CNN-SVM模型进行分类,得到预测是否为窃电用户的结果。
进一步地,在所述步骤一,还包括对用户历史用电数据进行统计,将统计的数据随机分为CNN样本和SVM样本,其中,CNN样本或SVM样本分为训练样本和测试样本。
进一步地,在所述步骤二,利用快速搜索密度峰值聚类技术包括两个步骤;
步骤2.1,对采集到的历史用电信息数据进行PCA特征提取;
步骤2.2,提取后寻找息数据的密度峰值点并根据峰值点距离进行分类。
进一步地,其中,PCA特征提取得到用户用电行为矩阵V,V的形式如下:
Figure BDA0002947108970000021
其中:k代表用户特征的个数,用户特征包括用户用电月负荷均值,最大值,最小值,月负荷序列的标准差;矩阵里的Vuifk代表用户i在特征k上的值,步骤2.2中,寻找密度峰值点并根据距离进行分类,定义密度峰值点根据如下公式:
Figure BDA0002947108970000022
Figure BDA0002947108970000023
ρ(i)为局部密度;
其中,公式(2)为截止距离法表示的局部密度,其中
Figure BDA0002947108970000024
(i,j)是点i和点j之间的欧氏距离,dc为截止距离;公式(3)为核距离方法表示的局部密度;
δ(i)为峰值距离:
Figure BDA0002947108970000025
CFSFDP算法计算局部密度ρ和更高密度距离δ,将数据集映射成二维图并构造一个决策图以供选择,在决策图中,选ρ和δ较大值点为聚类中心,ρ和δ都很大的点,在决策图靠右靠上的点,在选择聚类中心后,再将剩余点分配给距离最近的聚类中心完成聚类。
进一步地,在步骤三中,使用历史用电数据对CNN特征提取模型进行训练包括如下详细步骤:
将一维用电数据转换成二维数据作为输入,使用三种输入数据,分别为一维日负荷数据、二维周负荷用电数据和二维月负荷用电数据;
其中一维日负荷用电数据输入形状如下:
M1×d=[P1 P2 … Pd] (5)
其中d为用户历史用电数据总用电天数;
二维周负荷用电数据输入形状如下:
Figure BDA0002947108970000031
其中w为用户历史用电数据总用电周数;
二维月负荷用电数据输入形状如下:
Figure BDA0002947108970000032
其中m为用户历史用电数据总用电月数;
得到输入数据后,首先是局部感知;其次是参数共享,利用参数共享来达到参数数量的大量减少,得到有效的特征提取的结果;最后是卷积,用于特征的提取;其中,激活函数和优化函数分别是ReLU和sgd算法,在多层体系结构中使用了dropout,减少模型参数数量,降低出现过拟合问题的概率。神经元采用以下公式进行激活:
Figure BDA0002947108970000033
其中yj是第j个神经元中完全连接层的输出,n是一维输入数据长度,wi,j表示第1个输入值和第j个神经元之间的神经元权重,b1是偏差。
进一步地,CNN模型不断迭代更新训练至收敛或满足训练次数为止,一维卷积提取日负荷特征和二维卷积提取的周、月负荷特征使用它们的输出的加权和作为隐藏特征进行组合,再经过全连接层最后输出32维特征向量作为SVM分类器模型的输入样本。
进一步地,各边缘式数据中心利用从集中式数据处理中心传来CNN特征提取模型,提取SVM样本的32维特征向量作为输入样本,然后构建和训练SVM模型,使用网格搜索来搜索c和δ,c表示惩罚系数,δ表示模型复杂程度参数,最后保存CNN特征提取模型和SVM分类模型。
进一步地,用户实时数据依据距离划分给保存相应模型参数的边缘式数据处理中心并通过保存在相应模型处的CNN特征提取模型和SVM分类模型来预测最终结果。
本发明具有如下的优点和有益效果:
本发明的聚类方法符合边缘计算分布式处理思想,提高运算速度,特征提取器具有较好的收敛性能,此外,与基于各类分类器的方法相比,所提方法准确度更好且计算复杂度低,适合边缘数据中心部署。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明的窃电检测方法流程图。
图2为本发明的DP算法决策图。
图3为本发明的日、周、月CNN模型结构图。
图4为本发明的性能指标对比效果图。
图5为本发明神经网络结构的混淆矩阵图。
图6为普通Letnet5模型神经网络结构的混淆矩阵图。
具体实施方式
在对本发明的任意实施例进行详细的描述之前,应该理解本发明的应用不局限于下面的说明或附图中所示的结构的细节。本发明可采用其它的实施例,并且可以以各种方式被实施或被执行。基于本发明中的实施例,本领域普通技术人员在没有做出创造性改进前提下所获得的所有其它实施例,均属于本发明保护的范围。
一种基于边缘计算的窃电检测方法,如图1所示,依据采集到的用户用电信息和历史用电数据对实时用户用电数据预测的步骤如下:
步骤一:采集用户的历史用电信息,上传到集中式数据处理中心;
步骤二:所述集中式数据处理中心利用快速搜索密度峰值聚类技术(CFSFDP),对步骤一采集到的历史用电信息数据进行聚类,得到与所述用户的用电行为相似的多类用户用电数据;
步骤三:所述集中式数据处理中心对多类用户用电数据进行多类别CNN特征提取模型的训练;
步骤四:集中式数据处理中心将步骤三中训练好的CNN特征提取模型参数分类传入多台边缘式数据处理中心中;
步骤五:在边缘式数据处理中心中,使用训练好的CNN特征提取模型对历史用电数据进行特征提取,将提取后的特征输入SVM进行训练,得到SVM分类器模型参数,得到训练好的CNN-SVM模型;
步骤六:将实时用户用电数据传入对应的边缘式据处理中心中,边缘式数据中心根据训练好的CNN-SVM模型进行分类,得到预测是否为窃电用户的结果。
进一步地,在所述步骤一,还包括对用户历史用电数据进行统计,将统计的数据随机分为CNN样本和SVM样本,其中,CNN样本或SVM样本分为训练样本和测试样本。
进一步地,在所述步骤二,利用快速搜索密度峰值聚类技术包括两个步骤;
步骤2.1,对采集到的历史用电信息数据进行PCA特征提取;
步骤2.2,提取后寻找息数据的密度峰值点并根据峰值点距离进行分类。
进一步地,其中,PCA特征提取得到用户用电行为矩阵V,V的形式如下:
Figure BDA0002947108970000051
其中:k代表用户特征的个数,用户特征包括用户用电月负荷均值,最大值,最小值,月负荷序列的标准差;矩阵里的Vuifk代表用户i在特征k上的值,步骤2.2中,寻找密度峰值点并根据距离进行分类,定义密度峰值点根据如下公式:
Figure BDA0002947108970000052
Figure BDA0002947108970000053
ρ(i)为局部密度;
其中,公式(2)为截止距离法表示的局部密度,其中
Figure BDA0002947108970000054
(i,j)是点i和点j之间的欧氏距离,dc为截止距离;公式(3)为核距离方法表示的局部密度;
δ(i)为峰值距离:
Figure BDA0002947108970000055
CFSFDP算法计算局部密度ρ和更高密度距离δ,将数据集映射成二维图并构造一个决策图以供选择,在决策图中,选ρ和δ较大值点为聚类中心,ρ和δ都很大的点,如图2所示,在决策图靠右靠上的点,在选择聚类中心后,再将剩余点分配给距离最近的聚类中心完成聚类。
进一步地,在步骤三中,使用历史用电数据对CNN特征提取模型进行训练包括如下详细步骤:
将一维用电数据转换成二维数据作为输入,使用三种输入数据,分别为一维日负荷数据、二维周负荷用电数据和二维月负荷用电数据;
其中一维日负荷用电数据输入形状如下:
M1×d=[P1 P2 … Pd] (5)
其中d为用户历史用电数据总用电天数;
二维周负荷用电数据输入形状如下:
Figure BDA0002947108970000061
其中w为用户历史用电数据总用电周数;
二维月负荷用电数据输入形状如下:
Figure BDA0002947108970000062
其中m为用户历史用电数据总用电月数;
得到输入数据后,首先是局部感知;其次是参数共享,利用参数共享来达到参数数量的大量减少,得到有效的特征提取的结果;最后是卷积,用于特征的提取;其中,激活函数和优化函数分别是ReLU和sgd算法,在多层体系结构中使用了dropout,减少模型参数数量,降低出现过拟合问题的概率。神经元采用以下公式进行激活:
Figure BDA0002947108970000063
其中yj是第j个神经元中完全连接层的输出,n是一维输入数据长度,wi,j表示第1个输入值和第j个神经元之间的神经元权重,b1是偏差。
进一步地,如图3所示,CNN模型不断迭代更新训练至收敛或满足训练次数为止,一维卷积提取日负荷特征和二维卷积提取的周、月负荷特征使用它们的输出的加权和作为隐藏特征进行组合,再经过全连接层最后输出32维特征向量作为SVM分类器模型的输入样本。
进一步地,各边缘式数据中心利用从集中式数据处理中心传来CNN特征提取模型,提取SVM样本的32维特征向量作为输入样本,然后构建和训练SVM模型,使用网格搜索来搜索c和δ,c表示惩罚系数,δ表示模型复杂程度参数,最后保存CNN特征提取模型和SVM分类模型。
进一步地,用户实时数据依据距离划分给保存相应模型参数的边缘式数据处理中心并通过保存在相应模型处的CNN特征提取模型和SVM分类模型来预测最终结果。
基于上述技术方案的实施例1:
步骤一:构建训练样本集,选取窃电用户数据集,所述数据集包含1035天内42372个用电客户的用电量数据(from Jan.1,2014to Oct.31,2016),其中有3615个窃电用户,38757个正常用户;
步骤二:数据预处理。利用前后均值代替的方法,对所有缺失值进行填补。之后对所有数据进行随机分类,将数据分为CNN训练样本和SVM训练样本。分类比例选择0.7∶0.3。
步骤三:数据聚类。使用前述CFSFDP算法将所有CNN训练样本聚类,最终得到K类数据。其中尽量使5≤K≤10,本实施例中为K取10。仿真实验一共需要k+1个核,其中1个核用来模拟集中式数据处理中心。其他k核用来模拟多个边缘时数据处理中心;
步骤四:K个核中建立日、周、月负荷特征提取模型,训练特征提取模型。构建的CNN日、周、月负荷特征提取模型如图3,其具体描述如下表:
表1 CNN结构表
Figure BDA0002947108970000071
Figure BDA0002947108970000081
将交叉熵作为优化目标对CNN进行n轮迭代训练,得到CNN模型参数,保存在本地,并导入各个其他核中。其中50≤n≤100,本实施例中为n取100,在n=100时,loss下降逐渐平稳,达到收敛。
步骤五:打开其他k个核,输入SVM训练样本数据,导入训练好的CNN特征提取模型,对SVM训练样本进行特征提取,选取倒数第二个全连接层dense_2的输出参数作为SVM分类器的输入特征,然后利用网格搜索算法对SVM中两个参数进行全局寻优搜索,即惩罚因子c和模型复杂度参数δ。尝试所有可能的c,δ组合,使用交叉验证方法,选择使精度最高的c,δ组合。在本实施例中,最后交叉验证得到的c,δ值分别为:(1,0.03125);
仿真条件和结果:
仿真实验操作系统为WINDOWS 10,处理器为intel i5-8265u,频率为1.60GHz,内存为8G,实验平台选择kaggle,服务器CPU内存为13GB,GPU为15.9GB。
仿真结果分析:
在仿真结果中,选取了其他典型算法的准确率、查全率和F1得分与本发明进行比较,从图4可以看到,本发明与其他算法相比,各个指标有了明显的上升。
仅与深度学习进行比较,本发明与未使用本发明网络结构的CNN特征提取检测窃电方法其混淆矩阵比较,得出图5中的本发明神经网络结构的混淆矩阵,图6中的普通Letnet5模型神经网络结构的混淆矩阵;其中,TP表示预测为正常用户实际也是正常用户;TN表示预测为异常用户实际也是异常用户,TP和TN越高说明检测效果越好,即本发明的网络结构效果优于一般网络结构。
本次仿真还使用一个核进行了未聚类情况下的模拟,即只在集中式数据处理中心处理数据的情况,根据sklearn自带的评分函数进行模型好坏的评估,得到如下表2,不难看出,本发明的聚类后分布式处理的方法能够大幅提升模型评分。
表2发明效果对比表
方法 Model.score
集中处理方法 0.8930873
本发明方法 0.9929987
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于边缘计算的窃电检测方法,其特征在于,依据采集到的用户用电信息和历史用电数据对实时用户用电数据预测的步骤如下:
步骤一:采集用户的历史用电信息,上传到集中式数据处理中心;
步骤二:所述集中式数据处理中心利用快速搜索密度峰值聚类技术,对步骤一采集到的历史用电信息数据进行聚类,得到与所述用户的用电行为相似的多类用户用电数据;
步骤三:所述集中式数据处理中心对多类用户用电数据进行多类别CNN特征提取模型的训练;
步骤四:集中式数据处理中心将步骤三中训练好的CNN特征提取模型参数分类传入多台边缘式数据处理中心中;
步骤五:在边缘式数据处理中心中,使用训练好的CNN特征提取模型对历史用电数据进行特征提取,将提取后的特征输入SVM进行训练,得到SVM分类器模型参数,得到训练好的CNN-SVM模型;
步骤六:将实时用户用电数据传入对应的边缘式据处理中心中,边缘式数据中心根据训练好的CNN-SVM模型进行分类,得到预测是否为窃电用户的结果。
2.根据权利要求1所述的一种基于边缘计算的窃电检测方法,其特征在于,在所述步骤一,还包括对用户历史用电数据进行统计,将统计的数据随机分为CNN样本和SVM样本,其中,CNN样本或SVM样本分为训练样本和测试样本。
3.根据权利要求1所述的一种基于边缘计算的窃电检测方法,其特征在于,在所述步骤二,利用快速搜索密度峰值聚类技术包括两个步骤;
步骤2.1,对采集到的历史用电信息数据进行PCA特征提取;
步骤2.2,提取后寻找息数据的密度峰值点并根据峰值点距离进行分类。
4.根据权利要求3所述的一种基于边缘计算的窃电检测方法,其特征在于,其中,PCA特征提取得到用户用电行为矩阵V,V的形式如下:
Figure FDA0002947108960000011
其中:k代表用户特征的个数,用户特征包括用户用电月负荷均值,最大值,最小值,月负荷序列的标准差;矩阵里的Vuifk代表用户i在特征k上的值,步骤2.2中,寻找密度峰值点并根据距离进行分类,定义密度峰值点根据如下公式:
Figure FDA0002947108960000012
Figure FDA0002947108960000021
ρ(i)为局部密度;
其中,公式(2)为截止距离法表示的局部密度,其中
Figure FDA0002947108960000022
(i,j)是点i和点j之间的欧氏距离,dc为截止距离;公式(3)为核距离方法表示的局部密度;
δ(i)为峰值距离:
Figure FDA0002947108960000023
CFSFDP算法计算局部密度ρ和更高密度距离δ,将数据集映射成二维图并构造一个决策图以供选择,在决策图中,选ρ和δ较大值点为聚类中心,在选择聚类中心后,再将剩余点分配给距离最近的聚类中心完成聚类。
5.根据权利要求4所述的一种基于边缘计算的窃电检测方法,其特征在于,在步骤三中,使用历史用电数据对CNN特征提取模型进行训练包括如下详细步骤:
将一维用电数据转换成二维数据作为输入,使用三种输入数据,分别为一维日负荷数据、二维周负荷用电数据和二维月负荷用电数据;
其中一维日负荷用电数据输入形状如下:
M1×d=[P1 P2 … Pd] (5)
其中d为用户历史用电数据总用电天数;
二维周负荷用电数据输入形状如下:
Figure FDA0002947108960000024
其中w为用户历史用电数据总用电周数;
二维月负荷用电数据输入形状如下:
Figure FDA0002947108960000025
其中m为用户历史用电数据总用电月数;
得到输入数据后,首先是局部感知;其次是参数共享,最后是卷积,用于特征的提取。
6.根据权利要求5所述的一种基于边缘计算的窃电检测方法,其特征在于,CNN模型不断迭代更新训练至收敛或满足训练次数为止,一维卷积提取日负荷特征和二维卷积提取的周、月负荷特征使用它们的输出的加权和作为隐藏特征进行组合,再经过全连接层最后输出32维特征向量作为SVM分类器模型的输入样本。
7.根据权利要求6所述的一种基于边缘计算的窃电检测方法,其特征在于,各边缘式数据中心利用从集中式数据处理中心传来CNN特征提取模型,提取SVM样本的32维特征向量作为输入样本,然后构建和训练SVM模型,使用网格搜索来搜索c和δ,c表示惩罚系数,δ表示模型复杂程度参数,最后保存CNN特征提取模型和SVM分类模型。
8.根据权利要求7所述的一种基于边缘计算的窃电检测方法,其特征在于,用户实时数据依据距离划分给保存相应模型参数的边缘式数据处理中心并通过保存在相应模型处的CNN特征提取模型和SVM分类模型来预测最终结果。
CN202110196794.3A 2021-02-22 2021-02-22 一种基于边缘计算的窃电检测方法 Active CN112926645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110196794.3A CN112926645B (zh) 2021-02-22 2021-02-22 一种基于边缘计算的窃电检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110196794.3A CN112926645B (zh) 2021-02-22 2021-02-22 一种基于边缘计算的窃电检测方法

Publications (2)

Publication Number Publication Date
CN112926645A true CN112926645A (zh) 2021-06-08
CN112926645B CN112926645B (zh) 2022-11-15

Family

ID=76170040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110196794.3A Active CN112926645B (zh) 2021-02-22 2021-02-22 一种基于边缘计算的窃电检测方法

Country Status (1)

Country Link
CN (1) CN112926645B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116434081A (zh) * 2023-04-25 2023-07-14 广东工业大学 一种基于5g+云边端水下机器人控制管理方法及系统
CN117171612A (zh) * 2023-08-11 2023-12-05 天津大学 适应于能源互联网云边环境下用户窃电行为智能检测方法
CN115169405B (zh) * 2022-07-14 2024-02-02 北京威控科技股份有限公司 基于支持向量机的酒店客房设备故障诊断方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146705A (zh) * 2018-07-02 2019-01-04 昆明理工大学 一种用电特征指标降维与极限学习机算法进行窃电检测的方法
CN110008276A (zh) * 2019-04-26 2019-07-12 清湖光旭数据科技(北京)有限公司 一种检测电表异常的方法、装置及设备
CN110188826A (zh) * 2019-05-31 2019-08-30 湖南科技大学 基于智能电表数据的家用电器运行状态非侵入式检测方法
CN110705694A (zh) * 2019-09-30 2020-01-17 国网山东省电力公司电力科学研究院 基于特征提取的面向边缘数据中心的窃电监测方法
CN111091247A (zh) * 2019-12-24 2020-05-01 天津相和电气科技有限公司 基于深度神经网络模型融合的电力负荷预测方法、装置
US20200184028A1 (en) * 2018-12-10 2020-06-11 Institute For Information Industry Optimization method and module thereof based on feature extraction and machine learning
CN111666502A (zh) * 2020-07-08 2020-09-15 腾讯科技(深圳)有限公司 一种基于深度学习的异常用户识别方法、装置及存储介质
CN111738364A (zh) * 2020-08-05 2020-10-02 国网江西省电力有限公司供电服务管理中心 一种基于用户负荷与用电参量相结合的窃电检测方法
CN111861781A (zh) * 2020-02-29 2020-10-30 上海电力大学 一种居民用电行为聚类中的特征优选方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146705A (zh) * 2018-07-02 2019-01-04 昆明理工大学 一种用电特征指标降维与极限学习机算法进行窃电检测的方法
US20200184028A1 (en) * 2018-12-10 2020-06-11 Institute For Information Industry Optimization method and module thereof based on feature extraction and machine learning
CN110008276A (zh) * 2019-04-26 2019-07-12 清湖光旭数据科技(北京)有限公司 一种检测电表异常的方法、装置及设备
CN110188826A (zh) * 2019-05-31 2019-08-30 湖南科技大学 基于智能电表数据的家用电器运行状态非侵入式检测方法
CN110705694A (zh) * 2019-09-30 2020-01-17 国网山东省电力公司电力科学研究院 基于特征提取的面向边缘数据中心的窃电监测方法
CN111091247A (zh) * 2019-12-24 2020-05-01 天津相和电气科技有限公司 基于深度神经网络模型融合的电力负荷预测方法、装置
CN111861781A (zh) * 2020-02-29 2020-10-30 上海电力大学 一种居民用电行为聚类中的特征优选方法及系统
CN111666502A (zh) * 2020-07-08 2020-09-15 腾讯科技(深圳)有限公司 一种基于深度学习的异常用户识别方法、装置及存储介质
CN111738364A (zh) * 2020-08-05 2020-10-02 国网江西省电力有限公司供电服务管理中心 一种基于用户负荷与用电参量相结合的窃电检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
QILIN LI: "Energy Theft Detection in an Edge Data Center Using Deep Learning", 《HINDAWI》 *
YINGHUA HAN: "Electricity Theft Detection in Power Grids with Deep Learning and Random Forests", 《HINDAWI》 *
张哲敏: "基于CFSFDP算法的边缘电路数据异常检测", 《四川电力技术》 *
徐瑶: "基于CNN-GS-SVM的用户异常用电行为检测", 《控制工程》 *
陈俊艺: "基于改进快速密度峰值算法的电力负荷曲线聚类分析", 《电路系统保护与控制》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115169405B (zh) * 2022-07-14 2024-02-02 北京威控科技股份有限公司 基于支持向量机的酒店客房设备故障诊断方法及系统
CN116434081A (zh) * 2023-04-25 2023-07-14 广东工业大学 一种基于5g+云边端水下机器人控制管理方法及系统
CN117171612A (zh) * 2023-08-11 2023-12-05 天津大学 适应于能源互联网云边环境下用户窃电行为智能检测方法

Also Published As

Publication number Publication date
CN112926645B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN112926645B (zh) 一种基于边缘计算的窃电检测方法
Li et al. SHREC’14 track: Extended large scale sketch-based 3D shape retrieval
CN107766929B (zh) 模型分析方法及装置
CN102324038B (zh) 一种基于数字图像的植物种类识别方法
CN106599797A (zh) 一种基于局部并行神经网络的红外人脸识别方法
CN111178611B (zh) 一种日电量预测的方法
CN104392250A (zh) 一种基于MapReduce的图像分类方法
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN111488917A (zh) 一种基于增量学习的垃圾图像细粒度分类方法
CN111368926B (zh) 图像筛选方法、装置和计算机可读存储介质
CN107704883A (zh) 一种菱镁矿矿石的品级的分类方法及系统
CN110502989A (zh) 一种小样本高光谱人脸识别方法及系统
CN108898273B (zh) 一种基于形态分析的用户侧负荷特征聚类评价方法
Urgun et al. Composite system reliability analysis using deep learning enhanced by transfer learning
CN108596118B (zh) 一种基于人工蜂群算法的遥感影像分类方法及系统
CN113435101B (zh) 一种基于粒子群优化的支持向量机停电预测方法
Xu Mt-resnet: a multi-task deep network for facial attractiveness prediction
CN114004364A (zh) 采样优化方法、装置、电子设备及存储介质
Zapranis et al. Identification of the head-and-shoulders technical analysis pattern with neural networks
Das et al. Optimization based feature generation for handwritten odia-numeral recognition
CN108898157B (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
CN114048854B (zh) 一种深度神经网络大数据内部数据文件的管理方法
Das et al. Off-line signature verification with PSO-NN algorithm
CN114238852A (zh) 运营数据的分析方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant