CN110046796A - 一种基于机器学习模型的电力风险客户筛选方法 - Google Patents

一种基于机器学习模型的电力风险客户筛选方法 Download PDF

Info

Publication number
CN110046796A
CN110046796A CN201910164599.5A CN201910164599A CN110046796A CN 110046796 A CN110046796 A CN 110046796A CN 201910164599 A CN201910164599 A CN 201910164599A CN 110046796 A CN110046796 A CN 110046796A
Authority
CN
China
Prior art keywords
client
electric power
model
user
peels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910164599.5A
Other languages
English (en)
Inventor
张宏达
王伟峰
陶晖
李熊
李磊
劳琦江
严华江
卢恩泽
张江伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
Zhejiang Huayun Information Technology Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Zhejiang Electric Power Co Ltd
Zhejiang Huayun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Zhejiang Electric Power Co Ltd, Zhejiang Huayun Information Technology Co Ltd filed Critical State Grid Corp of China SGCC
Publication of CN110046796A publication Critical patent/CN110046796A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于机器学习模型的电力风险客户筛选方法,属于电力技术领域。现有的在电力客户管理中,异常用电的客户一直是企业关心的重点,但电力企业一直缺少有效的手段识别异常用电客户,以往主要通过对单个客户的用电负荷曲线进行观察,面临效率低下,无法从海量客户中直接筛选出异常用电的客户。本发明包括以下步骤:步骤1,获取客户用电数据;步骤2,设计电力离群用户识别指标体系;步骤3,基于局部异常因子算法LOF,建立电力离群用户识别模型;步骤4,对模型进行应用,实现电力离群客户的自动筛选。本发明基于机器学习算法,能够实现自动化识别异常用电客户,保障电网安全运行,避免电网经济损失,提高电网管理水平。

Description

一种基于机器学习模型的电力风险客户筛选方法
技术领域
本发明涉及一种基于机器学习模型的电力风险客户筛选方法,属于电力技术领域。
背景技术
随着客户服务意识的提高,以及电力系统精益化管理水平要求的提高,以往的粗放式管理已经难以满足时代和企业的发展需求。另一方面,随着信息化系统的建设应用,电力系统积累了大量的用户用电采集数据。在电力客户管理中,异常用电的客户一直是企业关心的重点,但电力企业一直缺少有效的手段识别异常用电客户,以往主要通过对单个客户的用电负荷曲线进行观察,面临效率低下,无法从海量客户中直接筛选出异常用电的客户。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种通过对客户的用电负荷数据进行指标提炼,并利用LOF(局部异常因子)算法,识别异常用电客户,实现自动化识别异常用电客户的基于机器学习模型的电力风险客户筛选方法。
为实现上述目的,本发明的技术方案为:
一种基于机器学习模型的电力风险客户筛选方法,包括以下步骤:
步骤1,获取客户用电数据
通过ETL抽取系统数据,并对原始数据进行清洗和处理,选择训练样本和测试样本;
步骤2,设计电力离群用户识别指标体系
基于用电负荷数据,从峰谷用电、节假日用电情况、用电增长情况三个方面构建基础指标;
步骤3,基于局部异常因子算法LOF,建立电力离群用户识别模型
综合上述三个维度指标,通过局部异常因子算法LOF建立模型,用以识别异常用电客户;
步骤4,对模型进行应用,实现电力离群客户的自动筛选
通过建立的模型,实现筛选异常用电客户,并对其进行后续跟踪管理。
本发明基于机器学习算法,通过对客户的用电负荷数据进行指标提炼,并利用LOF(局部异常因子)算法,识别异常用电客户,实现自动化识别异常用电客户,保障电网安全运行,避免电网经济损失,提高电网管理水平。
作为优选技术措施,模型的输出结果为判断每个用户的局部异常系数,若该指标远大于1,说明该用户是异常用电用户,方案简单实用,切实可行。
与现有技术相比,本发明具有以下有益效果:
本发明基于机器学习算法,通过对客户的用电负荷数据进行指标提炼,并利用LOF(局部异常因子)算法,识别异常用电客户,实现自动化识别异常用电客户,保障电网安全运行,避免电网经济损失,提高电网管理水平。
附图说明
图1为本发明流程图;
图2为本发明筛选的某异常用电客户A用电负荷曲线与行业整体情况对比;
图3为本发明筛选的某异常用电客户B用电负荷曲线与行业整体情况对比。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
如图1-3所示,一种基于机器学习模型的电力风险客户筛选方法,包括以下步骤:
步骤1,获取客户用电数据
通过ETL抽取系统数据,并对原始数据进行清洗和处理,选择训练样本和测试样本。
步骤2,设计电力离群用户识别指标体系
基于用电负荷数据,从峰谷用电、节假日用电情况、用电增长情况三个方面构建基础指标。
步骤3,基于局部异常因子算法LOF,建立电力离群用户识别模型
综合上述三个维度指标,通过局部异常因子算法LOF建立模型,用以识别异常用电客户;模型的输出结果为判断每个用户的局部异常系数,若该指标远大于1,说明该用户是异常用电用户,方案简单实用,切实可行。
步骤4,对模型进行应用,实现电力离群客户的自动筛选
通过建立的模型,实现筛选异常用电客户,并对其进行后续跟踪管理。
本发明基于机器学习算法,通过对客户的用电负荷数据进行指标提炼,并利用LOF(局部异常因子)算法,识别异常用电客户,实现自动化识别异常用电客户,保障电网安全运行,避免电网经济损失,提高电网管理水平。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于机器学习模型的电力风险客户筛选方法,其特征在于,包括以下步骤:
步骤1,获取客户用电数据
通过ETL抽取系统数据,并对原始数据进行清洗和处理,选择训练样本和测试样本;
步骤2,设计电力离群用户识别指标体系
基于用电负荷数据,从峰谷用电、节假日用电情况、用电增长情况三个方面构建基础指标;
步骤3,基于局部异常因子算法LOF,建立电力离群用户识别模型
综合上述三个维度指标,通过局部异常因子算法LOF建立模型,用以识别异常用电客户;
步骤4,对模型进行应用,实现电力离群客户的自动筛选
通过建立的模型,实现筛选异常用电客户,并对其进行后续跟踪管理,保障电网安全运行,避免电网经济损失,提高电网管理水平。
2.如权利要求1所述的一种基于机器学习模型的电力风险客户筛选方法,其特征在于,模型的输出结果为判断每个用户的局部异常系数,若该指标远大于1,说明该用户是异常用电用户。
CN201910164599.5A 2019-01-04 2019-03-05 一种基于机器学习模型的电力风险客户筛选方法 Pending CN110046796A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910007608 2019-01-04
CN201910007608X 2019-01-04

Publications (1)

Publication Number Publication Date
CN110046796A true CN110046796A (zh) 2019-07-23

Family

ID=67274417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910164599.5A Pending CN110046796A (zh) 2019-01-04 2019-03-05 一种基于机器学习模型的电力风险客户筛选方法

Country Status (1)

Country Link
CN (1) CN110046796A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956281A (zh) * 2019-10-29 2020-04-03 广东电网有限责任公司 一种基于Log分析的电力设备异常检测报警系统
CN116894151A (zh) * 2023-09-07 2023-10-17 无锡市锡容电力电器有限公司 基于人工智能的智慧电网异常数据清洗方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022592A (zh) * 2016-05-16 2016-10-12 中国电子科技集团公司电子科学研究院 一种用电行为异常检测与治安风险预警方法及装置
CN106373025A (zh) * 2016-08-22 2017-02-01 重庆邮电大学 基于离群点检测的用电信息采集系统实时防窃电监测方法
US20170061322A1 (en) * 2015-08-31 2017-03-02 International Business Machines Corporation Automatic generation of training data for anomaly detection using other user's data samples
CN107292513A (zh) * 2017-06-21 2017-10-24 国网辽宁省电力有限公司 一种基于svm分类算法实现电力客户管理的方法
CN108416693A (zh) * 2018-02-01 2018-08-17 东华大学 一种基于模糊神经网络的用电异常行为识别方法
CN108805747A (zh) * 2018-06-13 2018-11-13 山东科技大学 一种基于半监督学习的异常用电用户检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170061322A1 (en) * 2015-08-31 2017-03-02 International Business Machines Corporation Automatic generation of training data for anomaly detection using other user's data samples
CN106022592A (zh) * 2016-05-16 2016-10-12 中国电子科技集团公司电子科学研究院 一种用电行为异常检测与治安风险预警方法及装置
CN106373025A (zh) * 2016-08-22 2017-02-01 重庆邮电大学 基于离群点检测的用电信息采集系统实时防窃电监测方法
CN107292513A (zh) * 2017-06-21 2017-10-24 国网辽宁省电力有限公司 一种基于svm分类算法实现电力客户管理的方法
CN108416693A (zh) * 2018-02-01 2018-08-17 东华大学 一种基于模糊神经网络的用电异常行为识别方法
CN108805747A (zh) * 2018-06-13 2018-11-13 山东科技大学 一种基于半监督学习的异常用电用户检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
施伯乐 等: "数据库与智能数据分析——技术、实践与应用", 复旦大学出版社, pages: 203 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110956281A (zh) * 2019-10-29 2020-04-03 广东电网有限责任公司 一种基于Log分析的电力设备异常检测报警系统
CN116894151A (zh) * 2023-09-07 2023-10-17 无锡市锡容电力电器有限公司 基于人工智能的智慧电网异常数据清洗方法
CN116894151B (zh) * 2023-09-07 2023-11-14 无锡市锡容电力电器有限公司 基于人工智能的智慧电网异常数据清洗方法

Similar Documents

Publication Publication Date Title
Parwez et al. Big data analytics for user-activity analysis and user-anomaly detection in mobile wireless network
CN107358305A (zh) 一种智慧社区管理的商业模式
Kim et al. Detection for non-technical loss by smart energy theft with intermediate monitor meter in smart grid
Zhou et al. A dynamic programming algorithm for leveraging probabilistic detection of energy theft in smart home
US20160187864A1 (en) Apparatus and System for Providing Energy Information
CN110046796A (zh) 一种基于机器学习模型的电力风险客户筛选方法
CN205334561U (zh) 一种基于多模态生物识别技术的云考勤系统
CN106789292A (zh) 一种异常行为监控方法和装置
Jindal et al. Tackling energy theft in smart grids through data-driven analysis
CN108257025B (zh) 孤儿保单分配方法和装置
CN106844645A (zh) 一种电力通信设备信息查询系统
CN107680097A (zh) 一种输电线路杆塔识别鸟巢的方法
Ford et al. Clustering of smart meter data for disaggregation
CN107707386A (zh) 基于复合物联网的燃气表故障提示方法及物联网系统
CN105375631B (zh) 用于电网的地下电缆监控系统
CN109636252A (zh) 流动人口大数据多维分析方法及系统
CN106779485A (zh) 基于soa架构的综合管理系统及数据处理方法
CN104599110A (zh) 一种办公信息管理系统
Saad et al. Data analytics-based anomaly detection in smart distribution network
CN109995868A (zh) 一种基于区块链技术和边缘计算网络的数据资源管理系统
CN109946543A (zh) 用于非侵入式负荷监测的v-i图样本数据集筛选方法
CN110531926A (zh) 一种基于云平台的电力数据管理系统
CN108876182A (zh) 基于热力图的智慧园区系统及工作方法
Wang et al. Mining time-dependent communities
CN102882854B (zh) 电网数据接入方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination