CN110288383B - 基于用户属性标签的群体行为配电网用电异常检测方法 - Google Patents

基于用户属性标签的群体行为配电网用电异常检测方法 Download PDF

Info

Publication number
CN110288383B
CN110288383B CN201910473316.5A CN201910473316A CN110288383B CN 110288383 B CN110288383 B CN 110288383B CN 201910473316 A CN201910473316 A CN 201910473316A CN 110288383 B CN110288383 B CN 110288383B
Authority
CN
China
Prior art keywords
user
power
electricity consumption
representing
electricity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910473316.5A
Other languages
English (en)
Other versions
CN110288383A (zh
Inventor
田英杰
吴力波
周阳
马戎
施正昱
陈伟
苏运
郭乃网
瞿海妮
张琪祁
时志雄
宋岩
庞天宇
沈泉江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
North China Electric Power University
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Fudan University
North China Electric Power University
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University, North China Electric Power University, State Grid Shanghai Electric Power Co Ltd filed Critical Fudan University
Priority to CN201910473316.5A priority Critical patent/CN110288383B/zh
Publication of CN110288383A publication Critical patent/CN110288383A/zh
Application granted granted Critical
Publication of CN110288383B publication Critical patent/CN110288383B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明涉及一种基于用户属性标签的群体行为配电网用电异常检测方法,包括以下步骤:步骤1:建立用电量序列;步骤2:采用随机前沿模型计算用户负载效率系数;步骤3:建立用电趋势序列;步骤4:提取其台账信息数据并进行标签标记;步骤5:循环执行步骤1至步骤4得到针对区域内的所有用电用户的单位周期内的特征矩阵;步骤6:针对所有用电用户的单位周期内的特征矩阵利用局部离群因子算法得出局部离群得分;步骤7:将局部离群得分组成个体异常矩阵后与历史异常用户异常用电行为对应数据比对得出用户用电异常检测结果。与现有技术相比,本发明具有检测准确度高,针对性强等优点。

Description

基于用户属性标签的群体行为配电网用电异常检测方法
技术领域
本发明涉及配电网用电异常检测技术领域,尤其是涉及一种基于用户属性标签的群体行为配电网用电异常检测方法。
背景技术
配电网用户异常用电行为包含了偷电、漏电、窃电以及用电性质变更、用户变更的行为,该类行为会降低需求侧管理效率与政策制定有效性,是用电行为分析技术中的研究热点之一。
针对国内偷电漏电样本数据较少,无法利用有监督学习进行异常用电行为辨识模型学习与构建的现状,一种通过综合异常指标与分项异常指标判别用户异常用电程度与类型,辅助用户管理单位进行用电稽查、用户管理等方面工作,提升电力公司相关部门工作效率的配电网用电异常检测方法亟待开发。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于用户属性标签的群体行为配电网用电异常检测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于用户属性标签的群体行为配电网用电异常检测方法,该方法包括以下步骤:
步骤1:针对单个用电用户建立用电量序列;
步骤2:针对单个用电用户采用随机前沿模型计算用户负载效率系数;
步骤3:针对单个用电用户建立用电趋势序列;
步骤4:针对单个用电用户提取其台账信息数据并进行标签标记;
步骤5:针对单个用户结合步骤1至步骤4中各步骤获取的数据信息建立用户单位周期内的特征矩阵并循环执行步骤1至步骤4得到针对区域内的所有用电用户的单位周期内的特征矩阵;
步骤6:针对所有用电用户的单位周期内的特征矩阵利用局部离群因子算法得出局部离群得分;
步骤7:将局部离群得分组成个体异常矩阵后与历史异常用户异常用电行为对应数据比对得出用户用电异常检测结果。
进一步地,所述的步骤1中用电量序列,其描述公式为:
式中,表示电力用户Vn第r个周期的用电量序列,/>表示电力用户Vn第r个周期的以1~T天各天用电量为一个周期的用电量值,r和T表示自然数。
进一步地,所述步骤2中的用户负载效率系数的计算公式为:
式中,TEt表示用户负载效率系数,Wt表示用户用电功率,Ut表示扩展后的空闲容量,Wst表示合同容量,R表示自然数。
进一步地,所述的用户用电功率的计算公式为:
式中,β表示待估计参数向量,ut表示扩展前的空闲容量,vt表示随机扰动项,f()表示生产函数。
进一步地,所述步骤3包括以下分步骤
步骤31:计算多个周期对应的用电趋势值;
步骤32:将所有的用电趋势值组合成用电趋势序列。
进一步地,所述的步骤31中的用电趋势值的计算公式为:
式中,ΔLr t表示电力用户Vn第r个周期的用电趋势值,和/>表示电力用户Vn第r个周期中前后两天各自的用电量值。
进一步地,所述的步骤32中的用电趋势序列,其描述公式为:
式中,ΔLr n表示用电趋势序列,表示用电趋势序列中的各个用电趋势元素值。
进一步地,所述步骤5中的单位周期内的特征矩阵内的元素信息包括每个用户的每个周期内的用电趋势、标准差、平均用电水平、用户用电类型、合同容量和信用等级。
与现有技术相比,本发明具有以下优点:
(1)检测准确度高,本发明先以单个用户作为目标,按次序依次进行步骤1:针对单个用电用户建立用电量序列;步骤2:针对单个用电用户采用随机前沿模型计算用户负载效率系数;步骤3:针对单个用电用户建立用电趋势序列;步骤4:针对单个用电用户提取其台账信息数据并进行标签标记的操作后,以用户的用电数据及用户台账信息数据中经济类型、风险等级、信用等级、合同容量作为输入指标,采用LOF离群算法,得出异常度并据此与历史数据对比进一步得到检测结果,检测准确度高。
(2)针对性强,本发明针对台账信息包含了:用户类型、行业分类、信用等级等数据。停电停役数据由生产管理系统中停电影响用户列表构成,用于排除因电力公司运行检修或线路故障引起的异常用电误判,与电力系统实际环境匹配程度高。
附图说明
图1为本发明中的局部离群因子算法示意图;
图2为本发明中的局部离群因子算法的k-distance示意图;
图3为本发明中的局部离群因子算法的可达距离示意图;
图4为本发明方法的过程示意图;
图5为本发明实施例的用电曲线图;
图6为本发明实施例的用户X的群体异常度变化趋势图;
图7为本发明实施例的用户X与群体中心用户用电曲线对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
基于密度的局部离群点检测(Local Outlier Factor,LOF)算法,是基于密度的离群点检测方法中一个比较有代表性的算法。该算法会给数据集中的每个点计算一个离群因子LOF,通过判断LOF是否接近于1来判定是否是离群因子。若LOF远大于1,则认为是离群因子,接近于1,则是正常点。
局部离群因子算法LOF赋予每个对象一个表征其离群程度的因子,而不是将其硬性划分为正常或离群对象。LOF的基本思想是比较数据集中某个对象和其近邻对象的局部密度,由图1可见,对象A的局部密度远小于其近邻对象。
局部离群因子算法(LOF算法),建立在以下几个定义的基础之上:
1.对象p的k距离
对于正整数k,对象p的第k距离可记作k-distance(P)。在样本空间中,存在对象o,它与对象p之间的距离基座d(p,o)。如果满足以下两个条件,则认为k-distance(P)=d(p,o):
1)在样本空间中,至少存在k个对象q,使得d(p,q)<=d(p,o);
2)在样本空间中,至多存在k-1个对象q,使得d(p,q)<d(p,o);
k-distance(P)=max||p-o||,p的第k距离,也就是距离p第k远的点的距离,不包括p,如图2:
显然易见,如果使用k-distance(P)来量化对象p的局部空间区域范围,那么对于对象密度较大的区域,k-distance(P)值较小,而对象密度较小的区域,k-distance(P)值较大。
2.对象p的第k距离领域已经对象p的第k距离,那么,与对象p之间距离小于等于k-distance(P)的对象集合称为对象p的第k距离领域,记作:Nk(p)该领域其实是以p为中心,k-distance(P)为半径的区域内所有对象的集合(不包括p本身)。由于可能同时存在多个第k距离的数据,因此该集合至少包括k个对象。可以想象,离群度越大的对象的范围往往比较大,而离群度比较小的对象范围小。
3.对象p相对于对象o的可达距离公式:
reachdist(p,o)=max{k-distance(o),||p-o||}
也就是说,如果对象p远离对象o,则两者之间的可达距离就是它们之间的实际距离,但是如果它们足够近,则实际距离用o的k距离代替。
根据该定义,如图3中,对象B和对象C关于对象A的可达距离(k=3)相等。
4.局部可达密度
对象p的局部可达密度定义为p的k最近邻点的平均可达密度的倒数
5.局部离群点因子:表征了称p是离群点的程度,定义如下:
如果对象p不是局部离群点,则LOF(p)接近于1。即p是局部离群点的程度较小,对象o的局部可达密度和对象p的局部可达密度相似,最后所得的LOF(p)值应该接近1。相反,p是局部离群点的程度越大,最后所得的LOF(p)值越高。通过这种方式就能在样本空间数据分布不均匀的情况下也可以准确发现离群点。
本发明的基本原理为:群体行为异常提取用户的用电数据以及用户的台账信息数据作为基础数据,获取得到用户的用电特征,形成用户的用电特征矩阵,采用欧式距离获取任意两个用户之间的相似度得到用户的相似度矩阵,进而采用局部离群算法获取得到用户的群体行为异常度。
具体流程如图4所示,如图,提取用户用电数据以及用户台账数据,在用户用电数据中提取用户的用电量数据,获取每一周期内的用电趋势、平均用电水平、标准差等特征;提取用户的台账数据中的合同容量、用电分类等信息,采用标签标记,构成用户属性的特征指标数据。主要计算步骤如下:
1)把电力用户Vn的N天用电量序列以T天用电量为一个周期,分割为a个周期,/>电力用户Vn第r(r∈[1,a])个周期的用电量序列为
2)采用随机前沿模型计算用户负载效率系数。假设用户在时间t的用电功率满足:
式中,β表示待估计参数向量,ut表示扩展前的空闲容量,vt表示随机扰动项,f()表示生产函数。
扩展Battese对“效率”的定义,可得负载效率系数TEt为:
3)计算电力用户Vn每个周期r(1≤r≤a)内的用电趋势序列;第r个周期Vn的用电趋势序列为其中/>
4)提取用户的台账信息数据,进行标签标记。不同的类型标记为1,2,3…
5)每个用户的每周期内的用电趋势、标准差、平均用电水平以及用户的用电类型、合同容量、信用等级构成特征矩阵F。
6)计算每个周期的异常度:对每个用户分别进行计算用电行为的局部离群得分fn,每个周期内取均值即为个体的每个周期的异常度。得出个体异常矩阵
群体异常分析是提取用户台账信息数据及提取用户用电特征数据,检测每个周期内的用户对同类用户群体的离群程度,以第229个用户为例,用户的2015年用电曲线如图5所示,
在26个周期内的群体异常度变化趋势如图6所示。
由图5和图6可知用户X在第11周期和第18周期群体异常度偏高,在第14周期左右群体异常度达到最大。把该用户第11周期至第18周期(共112天)用电曲线与所属群体的中心用户用电曲线对比,如图7所示,由图可知,群体异常辨识可较好的识别出用户用电特征与同类用户之间行为同步性,将出现用电行为特征脱离所属群体用电行为的用户进行有效分离,并标记为群体行为特征分项指标异常的配电用户。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (6)

1.一种基于用户属性标签的群体行为配电网用电异常检测方法,其特征在于,该方法包括以下步骤:
步骤1:针对单个用电用户建立用电量序列;
步骤2:针对单个用电用户采用随机前沿模型计算用户负载效率系数;
步骤3:针对单个用电用户建立用电趋势序列;
步骤4:针对单个用电用户提取其台账信息数据并进行标签标记;
步骤5:针对单个用户结合步骤1至步骤4中各步骤获取的数据信息建立用户单位周期内的特征矩阵并循环执行步骤1至步骤4得到针对区域内的所有用电用户的单位周期内的特征矩阵;
步骤6:针对所有用电用户的单位周期内的特征矩阵利用局部离群因子算法得出局部离群得分;
步骤7:将局部离群得分组成个体异常矩阵后与历史异常用户异常用电行为对应数据比对得出用户用电异常检测结果;
所述步骤2中的用户负载效率系数的计算公式为:
式中,TE t 表示用户负载效率系数,W t 表示用户用电功率,U t 表示扩展后的空闲容量,W st 表示合同容量,R表示自然数;
所述步骤5中的单位周期内的特征矩阵内的元素信息包括每个用户的每个周期内的用电趋势、标准差、平均用电水平、用户用电类型、合同容量和信用等级;
所述局部离群得分基于局部离群因子获得,所述局部离群点因子的计算公式为:
其中,为局部离群点因子,/>、/>为对象po的局部可达密度,是以p为中心,/>为半径的区域内所有对象的集合,不包括p本身,是距离pk远的点的距离。
2.根据权利要求1所述的一种基于用户属性标签的群体行为配电网用电异常检测方法,其特征在于,所述的步骤1中用电量序列,其描述公式为:
式中,表示电力用户V nr个周期的用电量序列,/>表示电力用户V nr个周期的以1~T天各天用电量为一个周期的用电量值,r和T表示自然数。
3.根据权利要求1所述的一种基于用户属性标签的群体行为配电网用电异常检测方法,其特征在于,所述的用户用电功率的计算公式为:
式中,表示待估计参数向量,u t 表示扩展前的空闲容量,v t 表示随机扰动项,f()表示生产函数。
4.根据权利要求1所述的一种基于用户属性标签的群体行为配电网用电异常检测方法,其特征在于,所述步骤3包括以下分步骤
步骤31:计算多个周期对应的用电趋势值;
步骤32:将所有的用电趋势值组合成用电趋势序列。
5.根据权利要求4所述的一种基于用户属性标签的群体行为配电网用电异常检测方法,其特征在于,所述的步骤31中的用电趋势值的计算公式为:
式中,表示电力用户V nr个周期的用电趋势值,/>和/>表示电力用户V nr个周期中前后两天各自的用电量值。
6.根据权利要求4所述的一种基于用户属性标签的群体行为配电网用电异常检测方法,其特征在于,所述的步骤32中的用电趋势序列,其描述公式为:
式中,表示用电趋势序列,/>表示用电趋势序列中的各个用电趋势元素值。
CN201910473316.5A 2019-05-31 2019-05-31 基于用户属性标签的群体行为配电网用电异常检测方法 Active CN110288383B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910473316.5A CN110288383B (zh) 2019-05-31 2019-05-31 基于用户属性标签的群体行为配电网用电异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910473316.5A CN110288383B (zh) 2019-05-31 2019-05-31 基于用户属性标签的群体行为配电网用电异常检测方法

Publications (2)

Publication Number Publication Date
CN110288383A CN110288383A (zh) 2019-09-27
CN110288383B true CN110288383B (zh) 2024-02-02

Family

ID=68003102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910473316.5A Active CN110288383B (zh) 2019-05-31 2019-05-31 基于用户属性标签的群体行为配电网用电异常检测方法

Country Status (1)

Country Link
CN (1) CN110288383B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541016A (zh) * 2020-11-26 2021-03-23 南方电网数字电网研究院有限公司 用电异常检测方法、装置、计算机设备和存储介质
CN113781254A (zh) * 2021-08-04 2021-12-10 广西电网有限责任公司 一种基于周用电量相关系数的异常用电检测算法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230013A (zh) * 2017-05-11 2017-10-03 华北电力大学 一种无监督学习下配网用户异常用电辨识与时间定位方法
CN108805747A (zh) * 2018-06-13 2018-11-13 山东科技大学 一种基于半监督学习的异常用电用户检测方法
CN109308306A (zh) * 2018-09-29 2019-02-05 重庆大学 一种基于孤立森林的用户用电异常行为检测方法
CN109377409A (zh) * 2018-09-29 2019-02-22 重庆大学 一种基于bp神经网络的用户用电异常行为检测方法
CN109740694A (zh) * 2019-01-24 2019-05-10 燕山大学 一种基于非监督学习的智能电网非技术性损失检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9595006B2 (en) * 2013-06-04 2017-03-14 International Business Machines Corporation Detecting electricity theft via meter tampering using statistical methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107230013A (zh) * 2017-05-11 2017-10-03 华北电力大学 一种无监督学习下配网用户异常用电辨识与时间定位方法
CN108805747A (zh) * 2018-06-13 2018-11-13 山东科技大学 一种基于半监督学习的异常用电用户检测方法
CN109308306A (zh) * 2018-09-29 2019-02-05 重庆大学 一种基于孤立森林的用户用电异常行为检测方法
CN109377409A (zh) * 2018-09-29 2019-02-22 重庆大学 一种基于bp神经网络的用户用电异常行为检测方法
CN109740694A (zh) * 2019-01-24 2019-05-10 燕山大学 一种基于非监督学习的智能电网非技术性损失检测方法

Also Published As

Publication number Publication date
CN110288383A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
Rajabi et al. A comparative study of clustering techniques for electrical load pattern segmentation
Haben et al. Analysis and clustering of residential customers energy behavioral demand using smart meter data
CN103135009B (zh) 基于使用者回馈信息的电器侦测方法与系统
Nizar et al. Identification and detection of electricity customer behaviour irregularities
CN106204335A (zh) 一种电价执行异常判断方法、装置及系统
KR20170078252A (ko) 시계열의 데이터를 모니터링 하는 방법 및 그 장치
Zhu et al. Networked time series shapelet learning for power system transient stability assessment
US20200125970A1 (en) Defect factor estimation device and defect factor estimation method
CN110288383B (zh) 基于用户属性标签的群体行为配电网用电异常检测方法
KR101708709B1 (ko) 데이터마이닝 기법을 이용하여 고객기준부하를 추정하는 방법 및 그에 따른 장치
CN112258337A (zh) 一种自我补全修正的基站能耗模型预测方法
CN113125903A (zh) 线损异常检测方法、装置、设备及计算机可读存储介质
CN114611738A (zh) 一种基于用户用电行为分析的负荷预测方法
CN115660262A (zh) 一种基于数据库应用的工程智慧质检方法、系统及介质
CN110298765B (zh) 一种基于客观关联因素的配电网用电功率异常检测方法
Haq et al. Classification of electricity load profile data and the prediction of load demand variability
CN111126445A (zh) 一种面向智能电表海量数据的多步聚合负荷预测方法
Grigoras et al. Processing of smart meters data for peak load estimation of consumers
Jin et al. Power load curve clustering algorithm using fast dynamic time warping and affinity propagation
JP6207405B2 (ja) データ処理装置
Kojury-Naftchali et al. AMI data analytics; an investigation of the self-organizing maps capabilities in customers characterization and big data management
Wang et al. Application of clustering technique to electricity customer classification for load forecasting
Li et al. Distribution transformer mid-term heavy load and overload pre-warning based on logistic regression
US20150268062A1 (en) Detecting a selected mode of household use
Davarzani et al. Study of missing meter data impact on domestic load profiles clustering and characterization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Tian Yingjie

Inventor after: Zhang Qiqi

Inventor after: Shi Zhixiong

Inventor after: Song Yan

Inventor after: Pang Tianyu

Inventor after: Shen Quanjiang

Inventor after: Wu Libo

Inventor after: Zhou Yang

Inventor after: Ma Rong

Inventor after: Shi Zhengyu

Inventor after: Chen Wei

Inventor after: Su Yun

Inventor after: Guo Naiwang

Inventor after: Qu Haini

Inventor before: Tian Yingjie

Inventor before: Zhang Qiqi

Inventor before: Shi Zhixiong

Inventor before: Song Yan

Inventor before: Pang Tianyu

Inventor before: Shen Quanjiang

Inventor before: Wu Libo

Inventor before: Zhou Yang

Inventor before: Ma Rong

Inventor before: Shi Zhengyu

Inventor before: Chen Wei

Inventor before: Su Yun

Inventor before: Guo Naiwang

Inventor before: Qu Haini

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant