CN110147871A - 一种基于som神经网络与k-均值聚类的窃电检测方法及系统 - Google Patents
一种基于som神经网络与k-均值聚类的窃电检测方法及系统 Download PDFInfo
- Publication number
- CN110147871A CN110147871A CN201910308311.7A CN201910308311A CN110147871A CN 110147871 A CN110147871 A CN 110147871A CN 201910308311 A CN201910308311 A CN 201910308311A CN 110147871 A CN110147871 A CN 110147871A
- Authority
- CN
- China
- Prior art keywords
- cluster
- customer charge
- sample
- initial
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 title claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 85
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 29
- 210000002569 neuron Anatomy 0.000 claims description 34
- 230000005611 electricity Effects 0.000 claims description 17
- 210000004027 cell Anatomy 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 240000002853 Nelumbo nucifera Species 0.000 claims description 3
- 235000006508 Nelumbo nucifera Nutrition 0.000 claims description 3
- 235000006510 Nelumbo pentapetala Nutrition 0.000 claims description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000000819 phase cycle Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于SOM神经网络与K‑均值聚类的窃电检测方法及系统,其中方法包括:从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本;基于SOM神经网络对所述处理样本进行聚类,获取所述处理样本的聚类数和初始聚类中心;将所述聚类数和所述初始聚类中心作为K‑均值聚类的初始值,基于所述K‑均值聚类对所述处理样本进行聚类,获取用户负荷特征曲线;计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取所述待检测用户负荷与其用户负荷特征曲线的欧式距离;当所述欧式距离大于预先设定的阈值时,则将所述用户判断为窃电嫌疑用户。
Description
技术领域
本发明涉及电力窃电检测技术领域,更具体地,涉及一种基于SOM神经网络与K-均值聚类的窃电检测方法及系统。
背景技术
随着市场经济的发展和人民生活水平的提高。用电需求日益扩大。为节省用电开支,追求高额利润。许多不法个人或单位采取各种方式窃电。使国家蒙受巨大的经济损失。据统计,我国电力企业每年因窃电产生的损失高达200亿,电力企业受到了极大的经济损失,社会供用电秩序也受到了极大的影响,因此,电力相关部门必须开展高效的反窃电工作,尽可能降低电力企业的经济损失,维护社会正常的用电秩序,促进电力管理工作的顺利开展。
目前传统的反窃电方法可分为技术手段与管理手段。技术手段主要是通过加装反窃电装置,或在表计中增加反窃电模块,如:双向计量,无法电流回路正接或者反接表计都能进行正确的电能计量;事件记录,包括表计的断相、失压、失流、电压电流不平衡、开表盖、逆相序等事件的记录。现有技术的反窃电方法能取得一定的作用,但是需要长期加装设备或资金投入加大,且跟不上窃电手段变化,效率低下。管理手段有设立稽查队伍、宣传相关法律知识等措施,但该方法不能有效取证、准确定量、及时反馈信息。
因此,需要一种技术。以实现对电力用户的窃电行为进行检测。
发明内容
本发明技术方案提供一种基于SOM神经网络与K-均值聚类的窃电检测方法及系统,以解决如何检测电力用户的窃电问题。
为了解决上述问题,本发明提供了一种基于SOM神经网络与K-均值聚类的窃电检测方法,所述方法包括:
从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本;
基于SOM神经网络对所述处理样本进行聚类,获取所述处理样本的聚类数和初始聚类中心;
将所述聚类数和所述初始聚类中心作为K-均值聚类的初始值,基于所述K-均值聚类对所述处理样本进行聚类,获取用户负荷特征曲线;
计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取所述待检测用户负荷与其用户负荷特征曲线的欧式距离;
当所述欧式距离大于预先设定的阈值时,则将所述用户判断为窃电嫌疑用户。
优选地,所述从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本,包括:
所述归一化处理的公式为:其中xmax为将所述训练样本中去掉最大值后所剩余的所述训练样本中的最大值,xmin为将所述训练样本中去掉最小值后所剩余的所述训练样本的最小值,x为训练样本,x*为处理样本。
优选地,包括:所述SOM神经网络的排列方式为4×4的二维拓扑结构。
优选地,方法还包括:
对所述SOM神经网络的输出层各神经元权系数赋予随机数并进行归一化处理,得到wj(j=1,2,...,m),建立初始优胜邻域和学习率η初始值;m为输出层神经元数目;wj为神经元j的权系数;j为神经元j;
设置表示用户负荷的输入向量的集合为X=[x1,x2,x3,...,xn]T,并从用户负荷曲线数据中随机抽取n个样本作为训练集并进行归一化处理,得到处理样本Xp(p=1,2,...,k),k为输入层神经元数目;x1,x2,x3,...,xn为输入向量的元素;
计算XP与wj的点积,从中找到点积最大的获胜节点j;
设j*为中心确定t时刻的权值调整域,一般初始领域较大,训练过程中随训练时间收缩;
对优胜领域内所有节点调整权值,权值训练公式为:
其中wij(t+1)为第t+1次迭代节点i至节点j的连接权值;wij(t)为第t次迭代节点i至节点j的连接权值;α(t,N)为训练时间和第j个神经元与获胜神经元j*之间的拓扑距离N的函数;为输入向量第i个元素;j*为获胜节点;为获胜节点的优胜领域。
优选地,方法还包括:K-均值聚类的K值为SOM神经网络的聚类数,初始聚类中心为从SOM神经网络聚类结果中选取各类结果的均值作为初始聚类中心。
优选地,所述计算待检测用户负荷与所述用户负荷特征曲线的欧式距离,计算公式为:
其中xn表示待测用户的归一化电量;yn表示用户特征曲线的归一化电量;x1、x2为待检测用户的第1,2个元素;y1、y2为负荷特征向量的第1,2个元素。
基于本发明的另一方面,提供一种基于SOM神经网络与K-均值聚类的窃电检测系统,所述系统包括:
初始单元,用于从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本;
第一聚类单元,用于基于SOM神经网络对所述处理样本进行聚类,获取所述处理样本的聚类数和初始聚类中心;
第二聚类单元,用于将所述聚类数和所述初始聚类中心作为K-均值聚类的初始值,基于所述K-均值聚类对所述处理样本进行聚类,获取用户负荷特征曲线;
计算单元,用于计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取所述待检测用户负荷与其用户负荷特征曲线的欧式距离;
判断单元,用于当所述欧式距离大于预先设定的阈值时,则将所述用户判断为窃电嫌疑用户。
优选地,所述初始单元用于从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本,还用于:
所述归一化处理的公式为:其中xmax为将所述训练样本中去掉最大值后所剩余的所述训练样本中的最大值,xmin为将所述训练样本中去掉最小值后所剩余的所述训练样本的最小值,x为训练样本,x*为处理样本。
优选地,包括:所述SOM神经网络的排列方式为4×4的二维拓扑结构。
优选地,所述初始单元还用于:
对所述SOM神经网络的输出层各神经元权系数赋予随机数并进行归一化处理,得到wj(j=1,2,...,m),建立初始优胜邻域和学习率η初始值;m为输出层神经元数目;wj为神经元j的权系数;j为第j个神经元;
设置表示用户负荷的输入向量的集合为X=[x1,x2,x3,...,xn]T,并从用户负荷曲线数据中随机抽取n个样本作为训练集并进行归一化处理.得到处理样本Xp(p=1,2,...,k),k为输入层神经元数目;x1,x2,x3,...,xn为输入向量的元素;
计算XP与wj的点积,从中找到点积最大的获胜节点j;
设j*为中心确定t时刻的权值调整域,一般初始领域较大,训练过程中随训练时间收缩;
对优胜领域内所有节点调整权值。权值训练公式为:
其中wij(t+1)为第t+1次迭代节点i至节点j的连接权值;wij(t)为第t次迭代节点i至节点j的连接权值;α(t,N)为训练时间和第j个神经元与获胜神经元j*之间的拓扑距离N的函数;为输入向量第i个元素;j*为获胜节点;为获胜节点的优胜领域。
优选地,还包括:K-均值聚类的K值为SOM神经网络的聚类数,初始聚类中心为从SOM神经网络聚类结果中选取各类结果的均值作为初始聚类中心。
优选地,所述计算单元用于计算待检测用户负荷与所述用户负荷特征曲线的欧式距离,计算公式为:
其中xn表示待测用户的归一化电量;yn表示用户特征曲线的归一化电量;x1、x2为待检测用户的第1,2个元素;y1、y2为负荷特征向量的第1,2个元素。
本发明技术方案提供一种基于SOM神经网络与K-均值聚类的窃电检测方法及系统,其中方法包括:从用户负荷曲线中随机抽取数据作为训练样本,并对训练样本进行归一化处理,获取处理样本;基于SOM神经网络对处理样本进行聚类,获取处理样本的聚类数和初始聚类中心;将聚类数和初始聚类中心作为K-均值聚类的初始值,基于K-均值聚类对处理样本进行聚类,获取用户负荷特征曲线;计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取待检测用户负荷与其用户负荷特征曲线的欧式距离;当欧式距离大于预先设定的阈值时,则将用户判断为窃电嫌疑用户。本发明技术方案提供的一种基于SOM神经网络与K-均值聚类的窃电检测方法及系统,能够准确识别待测用户是否存在窃电嫌疑,能够有效指导窃电稽查工作。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测方法流程图;
图2为根据本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测方法流程图;
图3为根据本发明优选实施方式的通过聚类得出的第一类典型负荷的用户特征曲线图;
图4为根据本发明优选实施方式的通过聚类得出的第二类典型负荷的用户特征曲线;
图5为根据本发明优选实施方式的通过聚类得出的第三类典型负荷的用户特征曲线;
图6为根据本发明优选实施方式的通过聚类得出的第四类典型负荷的用户特征曲线;
图7为根据本发明优选实施方式的待测用户A的日负荷特征曲线;
图8为根据本发明优选实施方式的待测用户B的日负荷特征曲线;
图9为根据本发明优选实施方式的待测用户C的日负荷特征曲线;以及
图10根据本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测系统结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
图1为根据本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测方法流程图。本申请实施方式属于负荷聚类与窃电检测领域,是一种用于典型用户用电信息的特征提取聚类方法以及通过对比被测用户与典型用户信息的窃电嫌疑用户检测方法。本申请包括SOM神经网络对负荷曲线聚类、K-均值聚类、负荷曲线匹配度评估等三个阶段。其中在SOM神经网络聚类阶段,需要输入用户日负荷曲线信息,得到初始的聚类数与聚类中心。在K-均值聚类阶段,使用将K值设为上一阶段的聚类数,初始聚类中心也使用上一阶段的聚类结果。在负荷曲线匹配度评估阶段,计算负荷曲线与其典型日负荷曲线的欧式距离,判断是否大于阈值,如果大于阈值,则判断为窃电嫌疑用户,如果小于阈值,则判断为正常用户。本申请综合了SOM神经网络与K-均值聚类二者的优缺点,能够得出准确的典型用户的负荷曲线作为窃电检测的标准,通过计算待测用户与其典型负荷曲线的匹配度,能够准确找出存在窃电嫌疑的用户,指导现场窃电稽查工作。如图1所示,一种基于SOM神经网络与K-均值聚类的窃电检测方法,方法包括:
优选地,在步骤101:从用户负荷曲线中随机抽取数据作为训练样本,并对训练样本进行归一化处理,获取处理样本;优选地,从用户负荷曲线中随机抽取数据作为训练样本,并对训练样本进行归一化处理,获取处理样本,包括:归一化处理的公式为:其中xmax为将训练样本中去掉最大值后所剩余的训练样本中的最大值,xmin为将训练样本中去掉最小值后所剩余的训练样本的最小值,x为训练样本,x*为处理样本。优选地,SOM神经网络的排列方式为4×4的二维拓扑结构。
优选地,在步骤102:基于SOM神经网络对处理样本进行聚类,获取处理样本的聚类数和初始聚类中心。
优选地,在步骤103:将聚类数和初始聚类中心作为K-均值聚类的初始值,基于K-均值聚类对处理样本进行聚类,获取用户负荷特征曲线。优选地,方法还包括:K-均值聚类的K值为SOM神经网络的聚类数,初始聚类中心为从SOM神经网络聚类结果中选取各类结果的均值作为初始聚类中心。
优选地,还包括:对SOM神经网络的输出层各神经元权系数赋予随机数并进行归一化处理,得到wj(j=1,2,...,m),建立初始优胜邻域和学习率η初始值;m为输出层神经元数目;wj为神经元j的权系数;j为第j个神经元;如图2所示。
设置表示用户负荷的输入向量的集合为X=[x1,x2,x3,...,xn]T,并从用户负荷曲线数据中随机抽取n个样本作为训练集并进行归一化处理.得到处理样本Xp(p=1,2,...,k),k为输入层神经元数目;x1,x2,x3,...,xn为输入向量的元素;
计算XP与wj的点积,从中找到点积最大的获胜节点j;
设j*为中心确定t时刻的权值调整域,一般初始领域较大,训练过程中随训练时间收缩。
对优胜领域内所有节点调整权值,权值训练公式为:
其中wij(t+1)为第t+1次迭代节点i至节点j的连接权值;wij(t)为第t次迭代节点i至节点j的连接权值;α(t,N)为训练时间和第j个神经元与获胜神经元j*之间的拓扑距离N的函数;为输入向量第i个元素;j*为获胜节点。
当学习率α(t)≤αmin时,输出聚类数目与聚类中心Cj。否则重新设置输入向量。
设置阈值ε,重置迭代次数k=0,用上述步骤所得的聚类数目与聚类中心作为K-means聚类算法的初始值进行迭代计算,直至算法收敛。
最后输出聚类结果。
优选地,在步骤104:计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取待检测用户负荷与其用户负荷特征曲线的欧式距离。优选地,计算待检测用户负荷与用户负荷特征曲线的欧式距离,计算公式为:
其中xn表示待测用户的归一化电量;yn表示用户特征曲线的归一化电量;x1、x2为待检测用户的第1,2个元素;y1、y2为荷特征向量的第1,2个元素。
优选地,在步骤105:当欧式距离大于预先设定的阈值时,则将用户判断为窃电嫌疑用户。本申请的阈值可根据具体情况设定,优选地,可将阈值整定为3.6,3.8,4.0等。
本申请实施方式与传统检测方法相比,是基于数据分析方法,考虑不同类型负荷的用电特性,通过对比待测用户与典型负荷的日负荷曲线,既能准确识别用户是否存在窃电嫌疑,能够有效地提高了窃电稽查效率。由于传统的K-means聚类方法需要事先给定聚类数K,对初始值要求较为严格。而SOM神经网络能够自动确定聚类数,但不能输出准确的聚类信息。本申请综合了二者的优缺点,先使用SOM神经网络对样本进行聚类,再将聚类结果作为K-均值聚类的初始输入进行二次聚类,从而得出准确的典型负荷的日负荷曲线,提高了窃电检测的准确性。
附图3至附图6为根据权利要求1聚类得到的四类典型用户的负荷特征曲线,附图7为待测用户A的日负荷曲线,计算该用户与其典型日负荷曲线的欧式距离,计算得到其距离为4.86,大于预先设定的阈值,诊断结果为窃电嫌疑用户;
附图8为待测用户B的日负荷特征曲线,计算该用户与其典型日负荷曲线的欧式距离,计算得到其距离为1.56,小于预先设定的阈值,诊断结果为正常用户;
附图9为待测用户C的日负荷特征曲线,计算该用户与其典型日负荷曲线的欧式距离,计算得到其距离为7.08,大于预先设定的阈值,诊断结果为窃电用户。
图10根据本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测系统结构图。如图10所示,一种基于SOM神经网络与K-均值聚类的窃电检测系统,系统包括:
初始单元1001,用于从用户负荷曲线中随机抽取数据作为训练样本,并对训练样本进行归一化处理,获取处理样本。
优选地,初始单元1001用于从用户负荷曲线中随机抽取数据作为训练样本,并对训练样本进行归一化处理,获取处理样本,还用于:
归一化处理的公式为:其中xmax为将训练样本中去掉最大值后所剩余的训练样本中的最大值,xmin为将训练样本中去掉最小值后所剩余的训练样本的最小值,x为训练样本,x*为处理样本。
优选地,包括:SOM神经网络的排列方式为4×4的二维拓扑结构。
优选地,初始单元1001还用于:
对SOM神经网络的输出层各神经元权系数赋予随机数并进行归一化处理,得到wj(j=1,2,...,m),建立初始优胜邻域和学习率η初始值;m为输出层神经元数目;wj为神经元j的权系数;j为第j个神经元;
设置表示用户负荷的输入向量的集合为X=[x1,x2,x3,...,xn]T,并从用户负荷曲线数据中随机抽取n个样本作为训练集并进行归一化处理.得到处理样本Xp(p=1,2,...,k),k为输入层神经元数目;x1,x2,x3,...,xn为输入向量的元素;
计算XP与wj的点积,从中找到点积最大的获胜节点j;
设j*为中心确定t时刻的权值调整域,一般初始领域较大,训练过程中随训练时间收缩;
对优胜领域内所有节点调整权值,权值训练公式为:
其中wij(t+1)为第t+1次迭代节点i至节点j的连接权值;wij(t)为第t次迭代节点i至节点j的连接权值;α(t,N)为训练时间和第j个神经元与获胜神经元j*之间的拓扑距离N的函数;为输入向量第i个元素;j*为获胜节点;为获胜节点的优胜领域。
第一聚类单元1002,用于基于SOM神经网络对处理样本进行聚类,获取处理样本的聚类数和初始聚类中心。
第二聚类单元1003,用于将聚类数和初始聚类中心作为K-均值聚类的初始值,基于K-均值聚类对处理样本进行聚类,获取用户负荷特征曲线。
计算单元1004,用于计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取待检测用户负荷与其用户负荷特征曲线的欧式距离。
优选地,计算单元1004用于计算待检测用户负荷与用户负荷特征曲线的欧式距离,计算公式为:
其中xn表示待测用户的归一化电量;yn表示用户特征曲线的归一化电量;x1、x2为待检测用户的第1,2个元素;y1、y2为负荷特征向量的第1,2个元素。
判断单元1005,用于当欧式距离大于预先设定的阈值时,则将用户判断为窃电嫌疑用户。
优选地,还包括:K-均值聚类的K值为SOM神经网络的聚类数,初始聚类中心为从SOM神经网络聚类结果中选取各类结果的均值作为初始聚类中心。
本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测系统1000与本发明优选实施方式的基于SOM神经网络与K-均值聚类的窃电检测方法100相对应,在此不再进行赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
Claims (12)
1.一种基于SOM神经网络与K-均值聚类的窃电检测方法,所述方法包括:
从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本;
基于SOM神经网络对所述处理样本进行聚类,获取所述处理样本的聚类数和初始聚类中心;
将所述聚类数和所述初始聚类中心作为K-均值聚类的初始值,基于所述K-均值聚类对所述处理样本进行聚类,获取用户负荷特征曲线;
计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取所述待检测用户负荷与其用户负荷特征曲线的欧式距离;
当所述欧式距离大于预先设定的阈值时,则将所述用户判断为窃电嫌疑用户。
2.根据权利要求1所述的方法,所述从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本,包括:
所述归一化处理的公式为:其中xmax为将所述训练样本中去掉最大值后所剩余的所述训练样本中的最大值,xmin为将所述训练样本中去掉最小值后所剩余的所述训练样本的最小值,x为训练样本,x*为处理样本。
3.根据权利要求1所述的方法,包括:所述SOM神经网络的排列方式为4×4的二维拓扑结构。
4.根据权利要求1所述的方法,还包括:
对所述SOM神经网络的输出层各神经元权系数赋予随机数并进行归一化处理,得到wj(j=1,2,...,m),建立初始优胜邻域和学习率η初始值;m为输出层神经元数目;wj为输出层神经元权值;j为输出层神经元数目;
设置表示用户负荷的输入向量的集合为X=[x1,x2,x3,...,xn]T,并从用户负荷曲线数据中随机抽取n个样本作为训练集并进行归一化处理,得到处理样本Xp(p=1,2,...,k),k为输入层神经元数目;x1,x2,x3,...,xn为用户每15min所消耗的电能值;
计算XP与wj的点积,从中找到点积最大的获胜节点j;
设j*为中心确定t时刻的权值调整域,一般初始领域较大,训练过程中随训练时间收缩;
对优胜领域内所有节点调整权值,权值训练公式为:
其中wij(t+1)为第t+1次迭代节点i至节点j的连接权值;wij(t)为第t次迭代节点i至节点j的连接权值;α(t,N)为训练时间和第j个神经元与获胜神经元j*之间的拓扑距离N的函数;为输入向量第i个元素;j*为获胜节点;为获胜节点的优胜领域。
5.根据权利要求1所述的方法,还包括:K-均值聚类的K值为SOM神经网络的聚类数,初始聚类中心为从SOM神经网络聚类结果中选取各类结果的均值作为初始聚类中心。
6.根据权利要求1所述的方法,所述计算待检测用户负荷与所述用户负荷特征曲线的欧式距离,计算公式为:
其中xn表示待测用户的归一化电量;yn表示用户特征曲线的归一化电量;x1、x2为待检测用户向量的第1,2个元素;y1、y2为负荷特征向量的第1,2个元素。
7.一种基于SOM神经网络与K-均值聚类的窃电检测系统,所述系统包括:
初始单元,用于从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本;
第一聚类单元,用于基于SOM神经网络对所述处理样本进行聚类,获取所述处理样本的聚类数和初始聚类中心;
第二聚类单元,用于将所述聚类数和所述初始聚类中心作为K-均值聚类的初始值,基于所述K-均值聚类对所述处理样本进行聚类,获取用户负荷特征曲线;
计算单元,用于计算待检测用户负荷与其用户负荷特征曲线的欧式距离,获取所述待检测用户负荷与其用户负荷特征曲线的欧式距离;
判断单元,用于当所述欧式距离大于预先设定的阈值时,则将所述用户判断为窃电嫌疑用户。
8.根据权利要求7所述的系统,所述初始单元用于从用户负荷曲线中随机抽取数据作为训练样本,并对所述训练样本进行归一化处理,获取处理样本,还用于:
所述归一化处理的公式为:其中xmax为将所述训练样本中去掉最大值后所剩余的所述训练样本中的最大值,xmin为将所述训练样本中去掉最小值后所剩余的所述训练样本的最小值,x为训练样本,x*为处理样本。
9.根据权利要求7所述的系统,包括:所述SOM神经网络的排列方式为4×4的二维拓扑结构。
10.根据权利要求7所述的系统,所述初始单元还用于:
对所述SOM神经网络的输出层各神经元权系数赋予随机数并进行归一化处理,得到wj(j=1,2,...,m),建立初始优胜邻域和学习率η初始值;m为输出层神经元数目;wj为神经元j的权系数;j为第j个神经元;
设置表示用户负荷的输入向量的集合为X=[x1,x2,x3,...,xn]T,并从用户负荷曲线数据中随机抽取n个样本作为训练集并进行归一化处理,得到处理样本Xp(p=1,2,...,k),k为输入层神经元数目;x1,x2,x3,...,xn为输入向量的元素;
计算XP与wj的点积,从中找到点积最大的获胜节点j;
设j*为中心确定t时刻的权值调整域,一般初始领域较大,训练过程中随训练时间收缩;
对优胜领域内所有节点调整权值,权值训练公式为:
其中wij(t+1)为第t+1次迭代节点i至节点j的连接权值;wij(t)为第t次迭代节点i至节点j的连接权值;α(t,N)为训练时间和第j个神经元与获胜神经元j*之间的拓扑距离N的函数;为为输入向量第i个元素;j*为获胜节点;为获胜节点的优胜领域。
11.根据权利要求7所述的系统,还包括:K-均值聚类的K值为SOM神经网络的聚类数,初始聚类中心为从SOM神经网络聚类结果中选取各类结果的均值作为初始聚类中心。
12.根据权利要求7所述的系统,所述计算单元用于计算待检测用户负荷与所述用户负荷特征曲线的欧式距离,计算公式为:
其中xn表示待测用户的归一化电量;yn表示用户特征曲线的归一化电量;x1、x2为待检测用户向量的第1,2个元素;y1、y2为为负荷特征向量的第1,2个元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910308311.7A CN110147871A (zh) | 2019-04-17 | 2019-04-17 | 一种基于som神经网络与k-均值聚类的窃电检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910308311.7A CN110147871A (zh) | 2019-04-17 | 2019-04-17 | 一种基于som神经网络与k-均值聚类的窃电检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110147871A true CN110147871A (zh) | 2019-08-20 |
Family
ID=67589617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910308311.7A Pending CN110147871A (zh) | 2019-04-17 | 2019-04-17 | 一种基于som神经网络与k-均值聚类的窃电检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110147871A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110824270A (zh) * | 2019-10-09 | 2020-02-21 | 中国电力科学研究院有限公司 | 结合台区线损和异常事件的窃电用户辨识方法及装置 |
CN110910028A (zh) * | 2019-11-28 | 2020-03-24 | 温岭市非普电气有限公司 | 基于时间特征分析的光伏窃电发现方法和系统 |
CN110969539A (zh) * | 2019-11-28 | 2020-04-07 | 温岭市非普电气有限公司 | 基于曲线形态分析的光伏窃电发现方法和系统 |
CN111140986A (zh) * | 2019-12-23 | 2020-05-12 | 珠海格力电器股份有限公司 | 空调系统的运行状态检测方法、装置、存储介质及空调 |
CN111199252A (zh) * | 2019-12-30 | 2020-05-26 | 广东电网有限责任公司 | 一种电力通信网络智能运维系统的故障诊断方法 |
CN112270374A (zh) * | 2020-11-10 | 2021-01-26 | 河北大学 | 基于som聚类模型的数学表达式的聚类方法 |
CN113469566A (zh) * | 2021-07-21 | 2021-10-01 | 燕山大学 | 一种发电机起始分配方案的确定方法及系统 |
CN113554079A (zh) * | 2021-07-14 | 2021-10-26 | 中国地质大学(北京) | 一种基于二次检测法的电力负荷异常数据检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761568A (zh) * | 2014-01-23 | 2014-04-30 | 国家电网公司 | 基于som神经网络聚类算法的日负荷特征曲线提取方法 |
CN106204335A (zh) * | 2016-07-21 | 2016-12-07 | 广东工业大学 | 一种电价执行异常判断方法、装置及系统 |
CN109146705A (zh) * | 2018-07-02 | 2019-01-04 | 昆明理工大学 | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 |
-
2019
- 2019-04-17 CN CN201910308311.7A patent/CN110147871A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761568A (zh) * | 2014-01-23 | 2014-04-30 | 国家电网公司 | 基于som神经网络聚类算法的日负荷特征曲线提取方法 |
CN106204335A (zh) * | 2016-07-21 | 2016-12-07 | 广东工业大学 | 一种电价执行异常判断方法、装置及系统 |
CN109146705A (zh) * | 2018-07-02 | 2019-01-04 | 昆明理工大学 | 一种用电特征指标降维与极限学习机算法进行窃电检测的方法 |
Non-Patent Citations (2)
Title |
---|
王文生等: "SOM神经网络和C-均值法在负荷分类中的应用" * |
钟小强;陈程;董雨;李春生;徐冬冬;: "基于SOM神经网络的公变用户日负荷特征曲线提取分析" * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110824270A (zh) * | 2019-10-09 | 2020-02-21 | 中国电力科学研究院有限公司 | 结合台区线损和异常事件的窃电用户辨识方法及装置 |
CN110824270B (zh) * | 2019-10-09 | 2022-04-26 | 中国电力科学研究院有限公司 | 结合台区线损和异常事件的窃电用户辨识方法及装置 |
CN110910028A (zh) * | 2019-11-28 | 2020-03-24 | 温岭市非普电气有限公司 | 基于时间特征分析的光伏窃电发现方法和系统 |
CN110969539A (zh) * | 2019-11-28 | 2020-04-07 | 温岭市非普电气有限公司 | 基于曲线形态分析的光伏窃电发现方法和系统 |
CN110969539B (zh) * | 2019-11-28 | 2024-02-09 | 温岭市非普电气有限公司 | 基于曲线形态分析的光伏窃电发现方法和系统 |
CN111140986A (zh) * | 2019-12-23 | 2020-05-12 | 珠海格力电器股份有限公司 | 空调系统的运行状态检测方法、装置、存储介质及空调 |
CN111199252A (zh) * | 2019-12-30 | 2020-05-26 | 广东电网有限责任公司 | 一种电力通信网络智能运维系统的故障诊断方法 |
CN112270374A (zh) * | 2020-11-10 | 2021-01-26 | 河北大学 | 基于som聚类模型的数学表达式的聚类方法 |
CN113554079A (zh) * | 2021-07-14 | 2021-10-26 | 中国地质大学(北京) | 一种基于二次检测法的电力负荷异常数据检测方法及系统 |
CN113469566A (zh) * | 2021-07-21 | 2021-10-01 | 燕山大学 | 一种发电机起始分配方案的确定方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147871A (zh) | 一种基于som神经网络与k-均值聚类的窃电检测方法及系统 | |
Swarna et al. | A KNN based random subspace ensemble classifier for detection and discrimination of high impedance fault in PV integrated power network | |
Xia et al. | Detection methods in smart meters for electricity thefts: A survey | |
Santoso et al. | Power quality disturbance waveform recognition using wavelet-based neural classifier. II. Application | |
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN103135009B (zh) | 基于使用者回馈信息的电器侦测方法与系统 | |
CN108520357A (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN103678766B (zh) | 一种基于pso算法的异常用电客户检测方法 | |
CN108490288B (zh) | 一种窃电检测方法及系统 | |
CN109145949A (zh) | 基于集成学习的非侵入式电力负荷监测与分解方法及系统 | |
CN111830347B (zh) | 一种基于事件的两阶段非侵入式负荷监测方法 | |
CN111027408A (zh) | 一种基于支持向量机和v-i曲线特征的负荷识别方法 | |
CN106529707A (zh) | 一种负荷用电模式识别方法 | |
CN109598451A (zh) | 一种基于pca与lstm神经网络的非侵入式负荷辨识方法 | |
CN111242161B (zh) | 一种基于智能学习的非侵入式非居民用户负荷辨识方法 | |
CN107942160A (zh) | 基于bp神经网络的线路参数特性辨识模型的建立方法 | |
Cheng et al. | Enhanced state estimation and bad data identification in active power distribution networks using photovoltaic power forecasting | |
CN108920868A (zh) | 基于智能电表数据的负荷辨识模型参数修正方法 | |
CN110535149A (zh) | 一种公变台区电力负荷三相不平衡预测方法 | |
CN110288039A (zh) | 基于用户用电负荷特征窃电检测方法 | |
CN110188090A (zh) | 一种基于数据挖掘的配网拓扑数据质量评估方法及装置 | |
CN108764603A (zh) | 一种基于高维随机矩阵的用户窃电行为辨识方法 | |
CN109902340A (zh) | 一种计及复杂气象耦合特性的多源-荷联合场景生成方法 | |
CN108510147A (zh) | 一种基于残差波动模型的电能质量综合评价方法 | |
CN109947815A (zh) | 一种基于离群点算法的窃电辨识方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |