CN115146735A - 用户用电异常识别 - Google Patents

用户用电异常识别 Download PDF

Info

Publication number
CN115146735A
CN115146735A CN202210845519.4A CN202210845519A CN115146735A CN 115146735 A CN115146735 A CN 115146735A CN 202210845519 A CN202210845519 A CN 202210845519A CN 115146735 A CN115146735 A CN 115146735A
Authority
CN
China
Prior art keywords
data
user
power
abnormal
electricity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210845519.4A
Other languages
English (en)
Inventor
黄志春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Weihong Intelligent Technology Co ltd
Original Assignee
Guangzhou Weihong Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Weihong Intelligent Technology Co ltd filed Critical Guangzhou Weihong Intelligent Technology Co ltd
Priority to CN202210845519.4A priority Critical patent/CN115146735A/zh
Publication of CN115146735A publication Critical patent/CN115146735A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及电力技术领域,且公开了用户用电异常识别,其包括以下步骤:S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据;S2、构建用电特征指标,其中,用电特征指标包括:1)电压不平衡;2)电流不平衡;3)二次侧分流;4)有功之和异常;5)用户自身负荷曲线异常;S3、计算指标权重,应用AHP算法,将专家经验量化;S4、对上述指标加权。该用户用电异常识别,通过采集终端采集到的用户电气特征数据和电量数据,首先构建用电特征指标,其次应用AHP算法为指标赋权,最后应用随机森林算法进行用户用电异常识别,相比传统的专家现场巡查识别方式,耗费时间短,人工成本低,针对性强,效率高,可满足当前用电异常检测的需求。

Description

用户用电异常识别
技术领域
本发明涉及电力技术领域,具体为用户用电异常识别。
背景技术
近年来,随着市场经济的日益发展,电能作为一种清洁能源被广泛使用于国民经济的各个领域和人民的生产、生活中,由于电能费用占企业成本比重较大,一些不法经营者、个体私营业主为谋取暴利,置国家法律、法规于不顾,不择手段地窃取国家电能,猖狂的窃电行为严重损害了企业和个人的合法权益,扰乱了正常的供用电秩序,阻碍了电力事业的发展,给安全用电带来了严重威胁,窃电已经上升为一个不容忽视的社会问题。
随着各行业对电的需求不断扩大,违窃电问题变的越来越突出,违窃电等用户用电异常情况可能对电网的供电安全产生影响,同时也影响了供电企业的利益,如何精准识别用户用电异常行为成为供电企业特别关注的问题,传统的用电异常检测主要依靠经验丰富的专家现场巡查完成,耗时费力,针对性差,成本高,时间维度长,已经无法满足当前用电异常检测需求,针对上述方法的不足,需要引入当前流行的机器学习算法来自动而高效的识别异常信息。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了用户用电异常识别,具备用电特征凝聚专家经验,机器学习算法自动高效等优点,解决了传统的用户用电异常识别效率低、精准度差的问题。
(二)技术方案
为实现上述用电特征凝聚专家经验,机器学习算法自动高效的目的,本发明提供如下技术方案:用户用电异常识别,其包括以下步骤:
S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据;
S2、构建用电特征指标;
S3、计算指标权重,应用AHP算法,将专家经验量化;
S4、对上述指标加权,应用随机森林算法对用户用电进行异常识别。
优选的,所述用电特征指标包括:
1)电压不平衡;
2)电流不平衡
3)二次侧分流;
4)有功之和异常;
5)用户自身负荷曲线异常。
其中,1)-4)指标根据专家经验判断规则计算,5)指标应用聚类算法来自动识别异常。
优选的,所述用户电量数据包括日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征和空值特征,且所述特征包括最大值、最小值、平均值、方差、偏度、峰度、中位数、上四分位数、下四分位数和四分位差。
优选的,所述随机森林算法做特征选择的步骤如下:首先,对每一颗决策树选择相应的袋外数据,并计算袋外数据误差,记为errOOB1,随机对袋外数据OOB所有样本的特征X加入噪声干扰,重复计算袋外数据误差,记为errOOB2,假设森林中有N棵树,则特征X的重要性为:
∑(errOOB2-errOOB1)/N。
优选的,所述数据获取还包括数据挖掘,且数据挖掘包括确定数据挖掘的目标,收集数据挖掘所需要的输入数据集合,对数据进行预处理,导入模型,运行模型,完成数据训练。
优选的,所述确定数据挖掘的目标,在窃电行为分析上就是明确识别模型的目标,即准确识别出窃电用户,所述收集数据挖掘所需要的输入数据集合,窃电用户识别的模型数据来源主要是用电信息采集系统中的用户电力数据。
优选的,所述数据预处理,对输入数据进行预处理,其预处理包括数据清洗和数据的归一化,使杂乱无章的数据更加有序,模型表达与解释,模型输出的结果一般情况下为一系列数据集合,为了更为直观的表达,将数据转换为折线图或者直方图的形式,展现训练结果。
(三)有益效果
与现有技术相比,本发明提供了用户用电异常识别,具备以下有益效果:
该用户用电异常识别,通过采集终端采集到的用户电气特征数据和电量数据,首先构建用电特征指标,其次应用AHP算法为指标赋权,最后应用随机森林算法进行用户用电异常识别,相比传统的专家现场巡查识别方式,耗费时间短,人工成本低,针对性强,效率高,可满足当前用电异常检测的需求。
附图说明
图1为本发明提出的用户用电异常识别的步骤流程示意图;
图2为本发明提出的用户用电异常识别的数据挖掘流程示意图;
图3为本发明提出的用户用电异常识别的基于随机森林的核心特征图。
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本实施例中的用户用电异常识别,其包括以下步骤:
S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据,用户电量数据包括日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征和空值特征,且特征包括最大值、最小值、平均值、方差、偏度、峰度、中位数、上四分位数、下四分位数和四分位差;
S2、构建用电特征指标;
S3、计算指标权重,应用AHP算法,将专家经验量化,AHP是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法,它的特点是把复杂问题中的各种因素通过划分为相互联系的有序层次,使之条理化,根据对一定客观现实的主观判断结构(主要是两两比较)把专家意见和分析者的客观判断结果直接而有效地结合起来,将一层次元素两两比较的重要性进行定量描述;
S4、对上述指标加权,应用随机森林算法对用户用电进行异常识别,随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
其中,用电特征指标包括:
1)电压不平衡;
2)电流不平衡
3)二次侧分流;
4)有功之和异常;
5)用户自身负荷曲线异常。
其中,1)-4)指标根据专家经验判断规则计算,5)指标应用聚类算法来自动识别异常。
另外,随机森林算法做特征选择的步骤如下:首先,对每一颗决策树选择相应的袋外数据,并计算袋外数据误差,记为errOOB1,袋外数据指每次建立决策树时,通过重复抽样得到一个数据用于训练决策树,这时还有大约1/3的数据没有被利用,没有参与决策树的建立,这部分数据可以用于对决策树的性能进行评估,计算模型的预测错误率,称为袋外数据误差,随机对袋外数据OOB所有样本的特征X加入噪声干扰,重复计算袋外数据误差,记为errOOB2,假设森林中有N棵树,则特征X的重要性为:
∑(errOOB2-errOOB1)/N,这个数值之所以能够说明特征的重要性,是因为加入随机噪声后,袋外数据准确率大幅下降,即errOOB2上升,说明这个特征对于样本的预测结果有很大影响,进而说明重要程度比较高。
需要说明的是,数据获取还包括数据挖掘,且数据挖掘包括确定数据挖掘的目标,收集数据挖掘所需要的输入数据集合,对数据进行预处理,导入模型,运行模型,完成数据训练,确定数据挖掘的目标,在窃电行为分析上就是明确识别模型的目标,即准确识别出窃电用户,收集数据挖掘所需要的输入数据集合,窃电用户识别的模型数据来源主要是用电信息采集系统中的用户电力数据,数据预处理,对输入数据进行预处理,其预处理包括数据清洗和数据的归一化,使杂乱无章的数据更加有序,模型表达与解释,模型输出的结果一般情况下为一系列数据集合,为了更为直观的表达,将数据转换为折线图或者直方图的形式,展现训练结果。
本发明的有益效果是:
通过采集终端采集到的用户电气特征数据和电量数据,首先构建用电特征指标,其次应用AHP算法为指标赋权,最后应用随机森林算法进行用户用电异常识别,相比传统的专家现场巡查识别方式,耗费时间短,人工成本低,针对性强,效率高,可满足当前用电异常检测的需求。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (7)

1.用户用电异常识别,其特征在于,包括以下步骤:
S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据;
S2、构建用电特征指标;
S3、计算指标权重,应用AHP算法,将专家经验量化;
S4、对上述指标加权,应用随机森林算法对用户用电进行异常识别。
2.根据权利要求1所述的用户用电异常识别,其特征在于,所述用电特征指标包括:
1)电压不平衡;
2)电流不平衡
3)二次侧分流;
4)有功之和异常;
5)用户自身负荷曲线异常。
其中,1)-4)指标根据专家经验判断规则计算,5)指标应用聚类算法来自动识别异常。
3.根据权利要求1所述的用户用电异常识别,其特征在于,所述用户电量数据包括日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征和空值特征,且所述特征包括最大值、最小值、平均值、方差、偏度、峰度、中位数、上四分位数、下四分位数和四分位差。
4.根据权利要求1所述的用户用电异常识别,其特征在于,所述随机森林算法做特征选择的步骤如下:首先,对每一颗决策树选择相应的袋外数据,并计算袋外数据误差,记为errOOB1,随机对袋外数据OOB所有样本的特征X加入噪声干扰,重复计算袋外数据误差,记为errOOB2,假设森林中有N棵树,则特征X的重要性为:
∑(errOOB2-errOOB1)/N。
5.根据权利要求1所述的用户用电异常识别,其特征在于,所述数据获取还包括数据挖掘,且数据挖掘包括确定数据挖掘的目标,收集数据挖掘所需要的输入数据集合,对数据进行预处理,导入模型,运行模型,完成数据训练。
6.根据权利要求5所述的用户用电异常识别,其特征在于,所述确定数据挖掘的目标,在窃电行为分析上就是明确识别模型的目标,即准确识别出窃电用户,所述收集数据挖掘所需要的输入数据集合,窃电用户识别的模型数据来源主要是用电信息采集系统中的用户电力数据。
7.根据权利要求5所述的用户用电异常识别,其特征在于,所述数据预处理,对输入数据进行预处理,其预处理包括数据清洗和数据的归一化,使杂乱无章的数据更加有序,模型表达与解释,模型输出的结果一般情况下为一系列数据集合,为了更为直观的表达,将数据转换为折线图或者直方图的形式,展现训练结果。
CN202210845519.4A 2022-07-19 2022-07-19 用户用电异常识别 Pending CN115146735A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210845519.4A CN115146735A (zh) 2022-07-19 2022-07-19 用户用电异常识别

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210845519.4A CN115146735A (zh) 2022-07-19 2022-07-19 用户用电异常识别

Publications (1)

Publication Number Publication Date
CN115146735A true CN115146735A (zh) 2022-10-04

Family

ID=83412220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210845519.4A Pending CN115146735A (zh) 2022-07-19 2022-07-19 用户用电异常识别

Country Status (1)

Country Link
CN (1) CN115146735A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795354A (zh) * 2023-02-06 2023-03-14 北京志翔科技股份有限公司 三合一场所的识别方法和识别装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795354A (zh) * 2023-02-06 2023-03-14 北京志翔科技股份有限公司 三合一场所的识别方法和识别装置
CN115795354B (zh) * 2023-02-06 2023-04-25 北京志翔科技股份有限公司 三合一场所的识别方法和识别装置

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN111738364B (zh) 一种基于用户负荷与用电参量相结合的窃电检测方法
Angelos et al. Detection and identification of abnormalities in customer consumptions in power distribution systems
CN103617568B (zh) 稳态电能质量预警机制中的异常数据判定阈值设定方法
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN112101635A (zh) 一种用电异常的监测方法和系统
CN111008193B (zh) 一种数据清洗与质量评价方法及系统
CN106447534A (zh) 一种基于灰色关联度分析的用电模式稳定性判别方法
CN115865649B (zh) 一种智能运维管理控制方法、系统和存储介质
CN113408658A (zh) 一种基于数据挖掘技术的自动化窃电识别方法
CN110675020A (zh) 一种基于大数据的高价低接用户识别方法
CN111861786A (zh) 一种基于特征选择和孤立随机森林的专变窃电识别方法
CN112418687B (zh) 基于用电特征的用户用电异常识别方法、装置和存储介质
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN111506635A (zh) 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法
CN116739829B (zh) 一种基于大数据的电力数据分析方法、系统及介质
CN109214464A (zh) 一种基于大数据的疑似窃电用户识别装置及识别方法
CN115146735A (zh) 用户用电异常识别
CN113869721A (zh) 一种变电设备健康状态分类方法及装置
CN116796271A (zh) 一种居民用能异常识别方法
CN115660262A (zh) 一种基于数据库应用的工程智慧质检方法、系统及介质
CN112733456B (zh) 一种反窃电行为识别方法和系统
CN111178690A (zh) 基于风控评分卡模型的用电客户窃电风险评估方法
CN113077165B (zh) 一种发电机组市场力滥用判别方法
CN111612054A (zh) 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination