CN112991093B - 一种基于边缘计算的窃电检测方法及系统 - Google Patents
一种基于边缘计算的窃电检测方法及系统 Download PDFInfo
- Publication number
- CN112991093B CN112991093B CN202110197301.8A CN202110197301A CN112991093B CN 112991093 B CN112991093 B CN 112991093B CN 202110197301 A CN202110197301 A CN 202110197301A CN 112991093 B CN112991093 B CN 112991093B
- Authority
- CN
- China
- Prior art keywords
- data
- electricity
- electricity consumption
- power
- daily
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 title claims abstract description 26
- 230000005611 electricity Effects 0.000 claims abstract description 175
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000003064 k means clustering Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 4
- 230000006399 behavior Effects 0.000 claims description 52
- 238000000605 extraction Methods 0.000 claims description 26
- 238000007637 random forest analysis Methods 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 17
- 230000003442 weekly effect Effects 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 description 13
- 238000005457 optimization Methods 0.000 description 10
- 210000002569 neuron Anatomy 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000000556 factor analysis Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012847 principal component analysis method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的一种基于边缘计算的窃电检测方法和系统,系统包括用电信息采集模块、集中式数据处理中心、分类边缘式数据中心和多个边缘式数据中心,窃电检测工作由集中式数据中心与边缘式数据中心(包括多个边缘式数据中心和分类边缘式数据中心)分工合作,由多个边缘式数据中心分担了集中式数据中心的大量计算工作,分散式计算,节约带宽同时提高计算效率;集中式数据中心只参与历史数据和检测数据的预处理过程、历史数据的聚类过程;令具有K均值聚类模型的分类边缘式数据中心来对检测数据进行分类,聚类方法符合边缘计算中分布式处理的思想,提高运算速度和准确度。
Description
技术领域
本发明涉及技术领域,具体涉及一种基于边缘计算的窃电检测方法和系统。
背景技术
近年来,我国社会经济获得了突飞猛进的发展,对供电的需求范围也因此变得越来越广,但也在一定程度上为窃电工作提供了可乘之机,个别用电户为谋取不法利益,窃电行为屡禁不止,因此反窃电工作作为低压用电检查班组在日常工作中的一项必不可少的工作;目前窃电检测有:通过人工到现场进行排查;硬件上通过防非法开启、防电磁干扰等来防止窃电;软件上通过实时监控系统、对智能电表进行软件加密等来进行窃电检测等。目前基于大数据分析的窃电检测方法虽然可以通过实时监控来判断是否窃电,但也存在有很多不足之处:大量的电力数据上传至数据库后,直接由集中式数据中心对数据进行处理、检测,会占用很大的带宽,计算量大、过程冗杂混乱。
发明内容
为解决上述技术问题,本发明提供一种基于边缘计算的窃电检测方法和系统,集中式数据中心与边缘式数据中心(包括普通边缘式数据中心和分类边缘式数据中心)分工合作,由多个边缘式数据中心分担了集中式数据中心的大量计算工作,分散式计算,节约带宽同时提高计算效率。
本发明通过下述技术方案实现:
本方案提供一种基于边缘计算的窃电检测方法,包括步骤:
以年为单位采集各电力用户的日用电量数据,集中式数据中心对日用电量数据进行预处理得到各电力用户的用电行为特征集;集中式数据中心将各电力用户的用电行为特征集发送给分类边缘式数据中心;
分类边缘式数据中心将各电力用户的用电行为特征集输入已构建好的K均值聚类模型中进行KNN分类训练得到用电行为相似的多个用电行为数据类;
每个用电行为数据类匹配对应的边缘式数据中心,边缘式数据中心使用训练好的CNN-RF 模型对各用电行为数据类先进行CNN特征提取再基于提取的特征进行RF分类;
基于分类结果输出各电力用户是否为窃电电力用户。
本方案工作原理:现有的大数据分析的窃电检测方法,通常在建模阶段和训练阶段,甚至整个分析计算过程都是由集中式数据中心来集中处理,由于电力用户的日用电量数据繁杂,数据输入量大,导致集中式数据中心负荷过重,不仅占用很大带宽,还计算量大、过程冗杂混乱;本方案将窃电检测工作由集中式数据中心与边缘式数据中心(包括普通边缘式数据中心和分类边缘式数据中心)分工合作,由多个边缘式数据中心分担了集中式数据中心的大量计算工作,分散式计算,节约带宽同时提高计算效率。
进一步优化方案为,对日用电数据进行数据预处理过程包括:
替换日用电数据中存在的因计量设备故障导致的统计错误值;
插补由于存储和传输故障导致的缺失值;
对日用电数据进行标准化处理;
将日用电数据以用电行为特征集的形式表示。
进一步优化方案为,替换日用电数据中存在的因计量设备故障导致的统计错误值时,替换值计算公式为:
其中i表示某个电力用户i,xi,t为电力用户在日t的日用电数据,avg(xi,t)为该电力用户的历史日用电平均值,σ(xi,t)为该电力用户历史日用电量的标准差,θ为人为设定的偏离阈值;
插补由于存储和传输故障导致的缺失值,需要依据公式(2)进行单一缺失值的插补:
其中i表示某个电力用户i,xi,t为电力用户在t日的日用电数据,xi,t-1、xi,t+1分别表示该电力用户在t日前、后一天的日用电数据;如果xi为空,则将其表示为NaN,意为智能电表上传的缺失值;
采用Min-Max法对数据进行标准化:
其中i表示某个电力用户i,xi,t为电力用户在日t的日用电数据,min(xi,t)表示电力用户所有日用电数据中的最小值,max(xi,t)表示电力用户所有日用电数据中的最大值。
进一步优化方案为,用电行为特征集的具体表示形式为:
其中,avg、max、min、σ、k、tra、trb分别表示电力用户用电月负荷均值,最大值,最小值,月负荷序列的标准差、负荷数据线性拟合的斜率、前r1个月与后r1个月平均负荷的差值、前r2个月与后r2个月平均负荷的差值、前r3个月与后r3个月平均负荷的差值、上升趋势指标、下降趋势指标。
进一步优化方案为,K均值聚类模型构建方法为:
T1.以年为单位采集各电力用户的历史日用电量数据,集中式数据中心对历史日用电量数据进行预处理得到各电力用户的历史用电行为特征集;
T2.集中式数据中心基于成分分析法对历史用电行为特征集进行分析,构造出2个相互独立的新变量;
T3.集中式数据中心以2个相互独立的新变量作为电力用户的用电特征进行k-means聚类后分得k个历史用电行为数据类;
T4.以k个历史用电行为数据类作为K均值聚类模型的KNN模型训练样本传入分类边缘式数据中心。
通过成分分析法(主成分分析或因子分析)构造相互独立的新变量,消除原始变量之间的信息重叠。实施时选取主成分分析法,按照以下公式进行主成分提取。
构成2个两个相互独立的新变量xi=<xi.pi,xi.qi>,以此作为电力用户的用电特征进行 k-means聚类。
初始化k个初始聚类中心(在实施中一般选择5≤K≤10),随机选取k个电力用户作为初始化质心。之后依据初始化质心划分数据点。计算所有电力用户用电特征与选取k个质心用电特征之间的距离,公式如下:
电力用户xi=<xi.pi,xi.qi>,质心ck=<ck.pk,ck.qk>
各点找到相聚最近的质心后,就归属于该质心的簇,总电力用户数据被划分为k个簇,对各簇进行均值化,作为下一个更新的质心。之后不断更新质心位置,直至满足如下判定条件为止:
||ci-cj||<<γ (6)
ci为上一次质心,cj为最新一次质心,γ为人为设定的经验值。
聚类后分得k个数据集。
进一步优化方案为,CNN-RF模型构建方法为:
使用训练好的CNN特征提取模型对历史用电行为数据类中的数据进行特征提取,将提取后的特征输入随机森林算法RF中进行训练,得到RF分类器模型参数。
进一步优化方案为,CNN特征提取模型包括CNN日负荷特征提取模型、CNN周负荷特征提取模型和CNN月负荷特征提取模型。
使用历史用电数据对CNN特征提取模型进行训练。首先是将一维用电数据转换成二维数据作为输入,便于提取特征。使用三种输入数据,分别为一维日负荷数据、二维周负荷用电数据和二维月负荷用电数据。
进一步优化方案为,使用训练好的CNN特征提取模型对历史用电行为数据类中的数据进行特征提取时使用三种输入数据:一维日负荷用电数据、二维周负荷用电数据和二维月负荷用电数据。
进一步优化方案为,三种输入数据形式为:
一维日负荷用电数据输入形式为:
M1×d=[P1 P2 … Pd] (7)
其中d为电力用户历史用电数据总用电天数。
二维周负荷用电数据输入形式为:
其中w为电力用户历史用电数据总用电周数。
二维月负荷用电数据输入形式为:
其中m为电力用户历史用电数据总用电月数。
得到输入数据后,首先是局部感知;其次是参数共享,利用参数共享来达到参数数量的大量减少,得到有效的特征提取的结果;最后是卷积,用于特征的提取。激活函数和优化函数分别是ReLU和sgd算法,在多层体系结构中使用了dropout,减少模型参数数量,降低出现过拟合问题的概率。神经元采用以下公式进行激活:
其中yj是第j个神经元中完全连接层的输出,n是一维输入数据长度,wi,j表示第1个输入值和第j个神经元之间的神经元权重,b1是偏差。
将全连接层的最后一层的32维数据作为输入样本,作为电力用户的用电特征,构建和训练随机森林(RF)模型。使用网格搜索算法优化RF中的决策树的数量m和分裂属性数n。步骤是首先确定m,n的范围并设定步长,在坐标系中建立二维网络,使用每个网格节点作为参数对构建模型,然后不断更换节点确定使分类误差达到最小的参数对,使其作为RF的参数。
基于上述基于边缘计算的窃电检测方法本发明还提供一种基于边缘计算的窃电检测系统,包括:用电信息采集模块、集中式数据处理中心、分类边缘式数据中心和多个边缘式数据中心;
用电信息采集模块用于以年为单位采集各电力用户的日用电量数据;
集中式数据处理中心用于对日用电量数据进行预处理得到各电力用户的用电行为特征集;
分类边缘式数据中心将各电力用户的用电行为特征集输入已构建好的K均值聚类模型中进行KNN分类训练得到用电行为相似的多个用电行为数据类;
每个用电行为数据类匹配对应的边缘式数据中心,边缘式数据中心使用训练好的CNN-RF 模型对各用电行为数据类先进行CNN特征提取再基于提取的特征进行RF分类,基于检测结果输出各电力用户是否为窃电电力用户。
本发明与现有技术相比,具有如下的优点和有益效果:
1.本发明提出的一种基于边缘计算的窃电检测方法和系统,将窃电检测工作由集中式数据中心与边缘式数据中心(包括普通边缘式数据中心和分类边缘式数据中心)分工合作,由多个边缘式数据中心分担了集中式数据中心的大量计算工作,分散式计算,节约带宽同时提高计算效率。
2.本发明提出的一种基于边缘计算的窃电检测方法和系统,集中式数据中心只参与历史数据和检测数据的预处理过程、历史数据的聚类过程;令具有K均值聚类模型的分类边缘式数据中心来对检测数据进行分类,聚类方法符合边缘计算中分布式处理的思想,提高运算速度和准确度。
3.本发明提出的一种基于边缘计算的窃电检测方法和系统,特征提取器采用符合电力数据特点的网络结构,具有较好的收敛性能;此外,与基于各类分类器的方法相比,所提供的方法准确度更好且计算复杂度低,适合边缘数据中心部署。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。
图1是基于边缘计算的窃电检测方法流程图;
图2是CNN特征提取模型结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
本实施例根据本发明设计的基于边缘计算的窃电检测方法,如图1所示,具体步骤如下:
步骤一:电力用户用电信息采集系统采集至少一年电力用户历史用电信息(日用电信息),并上传到集中式数据处理中心;集中式数据中心进行数据预处理。数据预处理包括数据清洗、缺失值插补、数据归一化和以用电行为特征集形式表示步骤。
数据清洗能去掉原始数据中存在的由于电表故障等原因得到的统计错误值。一般在实施时按照以下公式恢复异常值;
其中i表示某个电力用户i,xi,t为电力用户在日t的日用电数据,avg(xi,t)为该电力用户的历史日用电平均值,σ(xi,t)为电力用户历史日用电量的标准差,θ为人为设定的偏离阈值。
由于存储、传输时故障问题,用电数据中一般存在缺失值,需要在实施时根据以下公式进行单一缺失值的插补;
其中i表示某个电力用户i,xi,t为电力用户在t日的日用电数据,xi,t-1、xi,t+1分别表示电力用户在t日前、后一天的日用电数据。如果xi为空,则将其表示为NaN,意为智能电表上传的缺失值。
因为神经网络对不同数据敏感,所以需要对数据进行标准化,在实施时采用Min-Max法对数据进行标准化,该方法参照以下格式;
其中i表示某个电力用户i,xi,t为电力用户在日t的日用电数据,min(xi,t)表示电力用户所有日用电数据中的最小值,max(xi,t)表示电力用户所有日用电数据中的最大值。
采用
的形式表示某个电力用户用电行为特征,其中,avg、max、min、σ、k、/> tra、trb分别表示电力用户用电月负荷均值,最大值,最小值,月负荷序列的标准差、负荷数据线性拟合的斜率、前r1个月与后r1个月平均负荷的差值、前r2个月与后r2个月平均负荷的差值、前r3个月与后r3个月平均负荷的差值、上升趋势指标、下降趋势指标。
步骤二:集中式数据处理中心利用K均值聚类算法(K-means),对采集数据进行聚类,得到用多个电行为相似的用电行为数据类;
通过主成分分析或因子分析构造相互独立的新变量,消除原始变量之间的信息重叠。实施时选取主成分分析法,按照以下公式进行主成分提取。
构成2个两个相互独立的新变量xi=<xi.pi,xi.qi>,以此作为电力用户的用电特征进行k-means聚类。初始化k个初始聚类中心(在实施中一般选择5≤K≤10),随机选取k个电力用户作为初始化质心。之后依据初始化质心划分数据点。计算所有电力用户用电特征与选取 k个质心用电特征之间的距离,公式如下:
电力用户xi=<xi.pi,xi.qi>,质心ck=<ck.pk,ck.qk>
各点找到相聚最近的质心后,就归属于该质心的簇,总电力用户数据被划分为k个簇,对各簇进行均值化,作为下一个更新的质心。之后不断更新质心位置,直至满足如下判定条件为止:
||ci-cj||<<γ (6)
ci为上一次质心,cj为最新一次质心,γ为人为设定的经验值。
步骤三,将聚类后分得得k个用电行为数据类传入k个边缘式数据中心中。K个边缘式数据中心中建立日、周、月负荷特征提取模型,训练特征提取模型。构建的CNN日、周、月负荷特征提取模型如图2所示。
使用历史用电数据对CNN特征提取模型进行训练。首先是将一维用电数据转换成二维数据作为输入,便于提取特征。使用三种输入数据,分别为一维日负荷数据、二维周负荷用电数据和二维月负荷用电数据。
其中一维日负荷用电数据输入形状如下:
M1×d=[P1 P2 … Pd] (7)
其中d为电力用户历史用电数据总用电天数。
二维周负荷用电数据输入形状如下:
其中w为电力用户历史用电数据总用电周数。
二维月负荷用电数据输入形状如下:
其中m为电力用户历史用电数据总用电月数。
得到输入数据后,首先是局部感知;其次是参数共享,利用参数共享来达到参数数量的大量减少,得到有效的特征提取的结果;最后是卷积,用于特征的提取。激活函数和优化函数分别是ReLU和sgd算法,在多层体系结构中使用了dropout,减少模型参数数量,降低出现过拟合问题的概率。神经元采用以下公式进行激活:
其中yj是第j个神经元中完全连接层的输出,n是一维输入数据长度,wi,j表示第1个输入值和第j个神经元之间的神经元权重,b1是偏差。
步骤四:在边缘式数据处理中心中,使用训练好的CNN特征提取模型对历史日用电数据进行特征提取,将提取后的特征输入随机森林算法(RF)进行训练,得到RF分类器模型参数;
将全连接层的最后一层的32维数据作为输入样本,作为电力用户的用电特征,构建和训练随机森林(RF)模型。使用网格搜索算法优化RF中的决策树的数量m和分裂属性数n。步骤是首先确定m,n的范围并设定步长,在坐标系中建立二维网络,使用每个网格节点作为参数对构建模型,然后不断更换节点确定使分类误差达到最小的参数对,使其作为RF的参数。
步骤五:对实时电力用户用电数据由集中式数据中心预处理后,将其传入聚类边缘式据处理中心中进行KNN模型的训练分类,确定电力用户的用电行为类型,再传入具有与该电力用户用电行为相似类型数据训练的CNN-RF模型的边缘式数据中心中,进行窃电检测,进而得到预测是否为窃电电力用户的结果。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于边缘计算的窃电检测方法,其特征在于,包括步骤:
以年为单位采集各电力用户的日用电量数据,集中式数据中心对日用电量数据进行预处理得到各电力用户的用电行为特征集,集中式数据中心将各电力用户的用电行为特征集发送给分类边缘式数据中心;
对日用电数据进行数据预处理过程包括:
替换日用电数据中存在的因计量设备故障导致的统计错误值;
插补由于存储和传输故障导致的缺失值;
对日用电数据进行标准化处理;
将日用电数据以用电行为特征集的形式表示;
用电行为特征集的具体表示形式为:
其中,avg、max、min、σ、k、tra、trb分别表示电力用户用电月负荷均值,最大值,最小值,月负荷序列的标准差、负荷数据线性拟合的斜率、前r1个月与后r1个月平均负荷的差值、前r2个月与后r2个月平均负荷的差值、前r3个月与后r3个月平均负荷的差值、上升趋势指标、下降趋势指标;
分类边缘式数据中心将各电力用户的用电行为特征集输入已构建好的K均值聚类模型中进行KNN分类训练得到用电行为相似的多个用电行为数据类;
K均值聚类模型构建方法为:
T1.以年为单位采集各电力用户的历史日用电量数据,集中式数据中心对历史日用电量数据进行预处理得到各电力用户的历史用电行为特征集;
T2.集中式数据中心基于成分分析法对历史用电行为特征集进行分析,构造出2个相互独立的新变量;
T3.集中式数据中心以2个相互独立的新变量作为电力用户的用电特征进行k-means聚类后分得k个历史用电行为数据类;
T4.以k个历史用电行为数据类作为K均值聚类模型的KNN模型训练样本传入分类边缘式数据中心;
每个用电行为数据类匹配对应的边缘式数据中心,边缘式数据中心使用构建好的CNN-RF模型对各用电行为数据类先进行CNN特征提取再基于提取的特征进行RF分类;
CNN-RF模型构建方法为:
使用训练好的CNN特征提取模型对历史用电行为数据类中的数据进行特征提取,将提取后的特征输入随机森林算法RF中进行训练,得到RF分类器模型参数;
CNN特征提取模型包括CNN日负荷特征提取模型、CNN周负荷特征提取模型和CNN月负荷特征提取模型;
使用训练好的CNN特征提取模型对历史用电行为数据类中的数据进行特征提取时使用三种输入数据:一维日负荷用电数据、二维周负荷用电数据和二维月负荷用电数据;
三种输入数据形式为:
一维日负荷用电数据输入形式为:
M1×d=[P1 P2 … Pd] (7)
其中d为电力用户历史用电数据总用电天数;
二维周负荷用电数据输入形式为:
其中w为电力用户历史用电数据总用电周数;
二维月负荷用电数据输入形式为:
其中m为电力用户历史用电数据总用电月数;
基于分类结果输出各电力用户是否为窃电电力用户。
2.根据权利要求1所述的一种基于边缘计算的窃电检测方法,其特征在于,
替换日用电数据中存在的因计量设备故障导致的统计错误值时,替换值计算公式为:
其中i表示某个电力用户i,xi,t为电力用户在日t的日用电数据,avg(xi,t)为该电力用户的历史日用电平均值,σ(xi,t)为该电力用户历史日用电量的标准差,θ为人为设定的偏离阈值;
插补由于存储和传输故障导致的缺失值依据公式为:
其中i表示某个电力用户i,xi,t为电力用户在t日的日用电数据,xi,t-1、xi,t+1分别表示该电力用户在t日前、后一天的日用电数据;如果xi为空,则将其表示为NaN,意为智能电表上传的缺失值;
采用Min-Max法对数据进行标准化:
其中i表示某个电力用户i,xi,t为电力用户在日t的日用电数据,min(xi,t)表示电力用户所有日用电数据中的最小值,max(xi,t)表示电力用户所有日用电数据中的最大值。
3.一种基于边缘计算的窃电检测系统,应用于权利要求1或2所述的一种基于边缘计算的窃电检测方法,其特征在于,包括:用电信息采集模块、集中式数据处理中心、分类边缘式数据中心和多个边缘式数据中心;
用电信息采集模块用于以年为单位采集各电力用户的日用电量数据;
集中式数据处理中心用于对日用电量数据进行预处理得到各电力用户的用电行为特征集,集中式数据中心将各电力用户的用电行为特征集发送给分类边缘式数据中心;
分类边缘式数据中心将各电力用户的用电行为特征集输入已构建好的K均值聚类模型中进行KNN分类训练得到用电行为相似的多个用电行为数据类;
每个用电行为数据类匹配对应的边缘式数据中心,边缘式数据中心使用构建好的CNN-RF模型对各用电行为数据类先进行CNN特征提取再基于提取的特征进行RF分类,基于检测结果输出各电力用户是否为窃电电力用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110197301.8A CN112991093B (zh) | 2021-02-22 | 2021-02-22 | 一种基于边缘计算的窃电检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110197301.8A CN112991093B (zh) | 2021-02-22 | 2021-02-22 | 一种基于边缘计算的窃电检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112991093A CN112991093A (zh) | 2021-06-18 |
CN112991093B true CN112991093B (zh) | 2024-02-02 |
Family
ID=76349356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110197301.8A Active CN112991093B (zh) | 2021-02-22 | 2021-02-22 | 一种基于边缘计算的窃电检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112991093B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432136A (zh) * | 2023-04-28 | 2023-07-14 | 国网四川省电力公司营销服务中心 | 一种基于用电采集系统的分布式用电异常检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146705A (zh) * | 2018-07-02 | 2019-01-04 | 昆明理工大学 | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 |
CN110288039A (zh) * | 2019-06-29 | 2019-09-27 | 河南工业大学 | 基于用户用电负荷特征窃电检测方法 |
KR20200056340A (ko) * | 2018-11-14 | 2020-05-22 | 가톨릭대학교 산학협력단 | 개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법 |
CN111695800A (zh) * | 2020-06-03 | 2020-09-22 | 南京中电科能技术有限公司 | 一种云边协同逐级分析定位异常用电行为用户的方法 |
CN111861786A (zh) * | 2020-06-12 | 2020-10-30 | 国网浙江省电力有限公司电力科学研究院 | 一种基于特征选择和孤立随机森林的专变窃电识别方法 |
-
2021
- 2021-02-22 CN CN202110197301.8A patent/CN112991093B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146705A (zh) * | 2018-07-02 | 2019-01-04 | 昆明理工大学 | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 |
KR20200056340A (ko) * | 2018-11-14 | 2020-05-22 | 가톨릭대학교 산학협력단 | 개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법 |
CN110288039A (zh) * | 2019-06-29 | 2019-09-27 | 河南工业大学 | 基于用户用电负荷特征窃电检测方法 |
CN111695800A (zh) * | 2020-06-03 | 2020-09-22 | 南京中电科能技术有限公司 | 一种云边协同逐级分析定位异常用电行为用户的方法 |
CN111861786A (zh) * | 2020-06-12 | 2020-10-30 | 国网浙江省电力有限公司电力科学研究院 | 一种基于特征选择和孤立随机森林的专变窃电识别方法 |
Non-Patent Citations (1)
Title |
---|
基于特征提取的面向边缘数据中心的窃电监测;张宇帆;艾芊;李昭昱;肖斐;饶渝泽;;电力系统自动化(第09期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112991093A (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832647A (zh) | 异常流量检测系统及方法 | |
CN110750524A (zh) | 一种有源配电网故障特征的确定方法及系统 | |
CN110807518A (zh) | 一种面向电网数据的离群点检测方法 | |
CN113177357B (zh) | 一种电力系统暂态稳定评估方法 | |
CN113807568A (zh) | 一种电力负荷预测方法、装置及终端设备 | |
CN112183656A (zh) | 一种电网故障中scada数据频繁项集挖掘方法 | |
CN112991093B (zh) | 一种基于边缘计算的窃电检测方法及系统 | |
CN110852344A (zh) | 一种基于智能变电站网络故障分类的方法 | |
CN108427753A (zh) | 一种新的数据挖掘方法 | |
CN114169998A (zh) | 一种金融大数据分析与挖掘算法 | |
CN113726558A (zh) | 基于随机森林算法的网络设备流量预测系统 | |
CN117421994A (zh) | 一种边缘应用健康度的监测方法和监测系统 | |
CN109635008B (zh) | 一种基于机器学习的设备故障检测方法 | |
CN115563477B (zh) | 谐波数据识别方法、装置、计算机设备和存储介质 | |
CN113726559B (zh) | 基于人工智能网络安全分析预警系统 | |
CN114818849A (zh) | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 | |
CN114066239A (zh) | 一种用户用电量异常检测方法及装置 | |
CN112966163A (zh) | 电力用户用电费用的审计方法、系统及电子设备 | |
Xia et al. | Smart substation network fault classification based on a hybrid optimization algorithm | |
CN116993307B (zh) | 一种具有人工智能学习能力的协同办公方法及系统 | |
CN116365519B (zh) | 一种电力负荷预测方法、系统、存储介质及设备 | |
CN113822473B (zh) | 一种基于多维数据的牵引力能耗合理区间预测方法 | |
CN117762113B (zh) | 基于集成模型的自动监控迭代调参方法及系统 | |
Zhao et al. | Research on machine learning-based correlation analysis method for power equipment alarms | |
Wang | Research on Fault Prevention and Maintenance System of Automatic Substation Primary Equipment Based on Decision Tree Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |