CN110288114A - 基于电力营销数据的违规用电行为预测方法 - Google Patents

基于电力营销数据的违规用电行为预测方法 Download PDF

Info

Publication number
CN110288114A
CN110288114A CN201910222802.XA CN201910222802A CN110288114A CN 110288114 A CN110288114 A CN 110288114A CN 201910222802 A CN201910222802 A CN 201910222802A CN 110288114 A CN110288114 A CN 110288114A
Authority
CN
China
Prior art keywords
user
electricity consumption
data
power utilization
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910222802.XA
Other languages
English (en)
Inventor
方舟
裘炜浩
程清
牟黎
陈逍潇
季超
吴恺源
裴旭斌
王以良
龚康家
周后盘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Hangzhou Electronic Science and Technology University
Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Hangzhou Electronic Science and Technology University
Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Electronic Science and Technology University, Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd filed Critical Hangzhou Electronic Science and Technology University
Priority to CN201910222802.XA priority Critical patent/CN110288114A/zh
Publication of CN110288114A publication Critical patent/CN110288114A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提出了基于电力营销数据的违规用电行为预测方法,包括从电力营销数据库中获取用户用电数据,对用户用电数据进行处理,得到用户用电相关系数矩阵,对获取到的系数矩阵进行整理得到用户用电数据表;构建卷积神经网络模型;将用户用电数据表划分为训练数据集和测试参数集,基于训练数据集对卷积神经网络模型进行训练,将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测。从电力用户最近若干个月的用电数据中提取关键信息对该用户是否正在违规用电进行预测,通过根据以往电量使用的规律来判断该用户是否违规,能够提升判定的准确性。

Description

基于电力营销数据的违规用电行为预测方法
技术领域
本发明属于用电监测领域,尤其涉及基于电力营销数据的违规用电行为预测方法。
背景技术
随着科学技术和社会的发展,对智能电网集中监控电力远程自动化系统日常安全运行的要求越来越高,目前电网中还存在一些违规用电行为。利用本发明可以有效的检测日常用电中的违规用电行为,对于智能电网,通过检测可以保证电网的稳定,节省人工的使用,降低电网运作成本,使电网能够有效且经济的运行。
目前存在多种检测违规用户的方法,多数使用的是传统方法,例如利用高斯混合模型来检验离群点、随机森林的方法(RF)做检测、支持向量机的方法(SVM)等。但是这些方法多数依赖于采集数据,而对于营销方面来说检测违规用户的方法很少。
发明内容
为了解决现有技术中存在的缺点和不足,本发明提出了基于电力营销数据的违规用电行为预测方法,从电力用户最近若干个月的用电数据中提取关键信息对该用户是否正在违规用电进行预测,通过根据以往电量使用的规律来判断该用户是否违规,能够提升判定的准确性。
具体的,所述预测方法包括:
从电力营销数据库中获取用户用电数据,对用户用电数据进行处理,得到用户用电相关系数矩阵,对获取到的系数矩阵进行整理得到用户用电数据表;
构建卷积神经网络模型;
将用户用电数据表划分为训练数据集和测试参数集,基于训练数据集对卷积神经网络模型进行训练,将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测。
可选的,所述从电力营销数据库中获取用户用电数据,对用户用电数据进行处理,得到用户用电相关系数矩阵,对获取到的系数矩阵进行整理得到用户用电数据表,包括:
根据编写的SQL脚本语句从电网数据库中取出用电的用电数据;
所述用电数据中包括如部门编号在内的空属性,对这些属性进行删除,保留包括用户类别、用户编号、用户电量、用户用电年月在内的有用属性;
从上一步的处理结果中取出电量、电费,对每个用户进行归类,计算每个用户的月用电量以及电费,整理在一张表中,保存以备用;
基于公式一对每个用户计算用电量的相关系数矩阵,
公式描述:公式cov(x,y)为x、y的协方差,D(x)、D(y)分别为x、y的方差,x、y为用户季度用电信息;
将每个用户计算的相关系数矩阵整理成一张表并保存。
可选的,所述构建卷积神经网络模型,包括:
对卷积神经网络中的输入层以及两个卷积层的参数进行设置;
在卷积神经网络后增设BP神经网络,对BP神经网络的结构和隐藏参数进行设置。
可选的,所述基于训练数据集对卷积神经网络模型进行训练,包括:
前向计算每个神经元输出值;
反向计算每个神经元的误差项;
根据相应误差项,计算每个权重的梯度,对模型参数进行优化,调节各层的隐藏单元个数、学习速率、Drop的比率,是否采用平均池化、是否需要添加卷积层数、是否需要添加Dropout层等;
可选的,所述将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测,包括:
从测试参数集中读取一条用户的数据,获取所述用户的用电相关系数矩阵;
将用电相关系数矩阵送入已经训练好的模型进行预测,输出为0到1之间的小数,将大于0.5的标记为违规用电行为,小于0.5的标记为正常用户。
本发明提供的技术方案带来的有益效果是:
将数据由一维变为二维进而通过卷积神经网络来对数据进行特征提取,特征更加丰富。面对需要大量人工筛查才能检测的违规用电行为能够通过模型进行快速识别,提高了筛查的效率。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实例提出的基于电力营销数据的违规用电行为预测方法的流程示意图;
图2是本申请实例提出的一个用户的相关系数矩阵图;
图3是本申请实例提出的根据用户电量电费计算出的相关系数矩阵图。
具体实施方式
为使本发明的结构和优点更加清楚,下面将结合附图对本发明的结构作进一步地描述。
实施例一
本申请提出了基于电力营销数据的违规用电行为预测方法,如图1所示,所述预测方法包括:
11、从电力营销数据库中获取用户用电数据,对用户用电数据进行处理,得到用户用电相关系数矩阵,对获取到的系数矩阵进行整理得到用户用电数据表;
12、构建卷积神经网络模型;
13、将用户用电数据表划分为训练数据集和测试参数集,基于训练数据集对卷积神经网络模型进行训练,将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测。
在实施中,传统的电网部门没有一套专门的检测违规用电行为的方法,通常的做法是通过一些异常规则检测出一些异常行为,然后通过人工上门检验或者数据重审来确定这个异常的类型,这种方法耗费大量人力资源且检验耗时长。本发明提出建立一种模型来发现违规用电行为减少人工核查数量节省资源,通过本模型可以较好的应对上述问题。
本申请提出的预测方法通过计算下相关系数不仅将数据归一化而且将一维数据映射到二维数据,也契合了卷积神经网络的输入模式,为我们使用卷积神经网络处理提供了便利性。
本方法充分考虑用户月度用电量之间以及月度电费之间的关系,还考虑了不同的计费方式、不同的用户类别来提高预测的准确性。
步骤11获取用户用电数据表的具体步骤,包括:
111、根据编写的SQL脚本语句从电网数据库中取出用电的用电数据;
112、所述用电数据中包括如部门编号在内的空属性,对这些属性进行删除,保留包括用户类别、用户编号、用户电量、用户用电年月在内的有用属性;
113、从上一步的处理结果中取出电量、电费,对每个用户进行归类,计算每个用户的月用电量以及电费,整理在一张表中,保存以备用;
114、基于公式一对每个用户计算用电量的相关系数矩阵,
公式描述:公式cov(x,y)为x、y的协方差,D(x)、D(y)分别为x、y的方差,x、y为用户季度用电信息;
115、将每个用户计算的相关系数矩阵整理成一张表并保存。
下面为某个用户一年的用电数据,前12个为用电量,后12个为用电费用:
[225,335,394,549,421,401,281,412,437,1074,880,443,188.55,280.73,211.97,295.36,226.5,215.74,151.18,221.66,241.86,631.51,535.17,423.87]
通过计算每一季度和每一季度之间的相关系数建立一个相关系数矩阵,该用户计算结果如图2所示。
步骤12中提出了进行预测的卷积神经网络的步骤,具体包括:
121、对卷积神经网络中的输入层以及两个卷积层的参数进行设置;
122、在卷积神经网络中增设BP神经网络,对BP神经网络的结构和隐藏参数进行设置。
在实施中,具体的建立步骤包括:
步骤2.1、将卷积神经网络的输入设置为(1×8×8),第一层的Filter设置为16个,第二层的Filter设置为32个,两层卷积核大小都设置为3×3大小,在两层卷积后分别加入池化层,池化层采用最大池化,大小为2×2,最后添加一层Dropout,Drop比率设置为0.2,对边界进行补零即设置padding参数为same;
步骤2.2、在卷积神经网络后添加全连接层,之后连接BP神经网络,隐藏层数依次设置为1024、512、32、7,在第二层BP神经网络后面添加一层Dropout层,Dropout比率设置为0.2;
步骤2.3、将卷积层和BP神经网络层的激活函数设置为Relu函数,损失函数使用Binary_crossentropy函数(二分类损失函数),模型优化器选择Adam或者Rmsprop,学习率设置为0.0001。
步骤13中提及到的对已建立的卷积神经网络进行训练步骤,包括:
311、前向计算每个神经元输出值;
312、反向计算每个神经元的误差项;
313、根据相应误差项,计算每个权重的梯度,对模型参数进行优化,调节各层的隐藏单元个数、学习速率、Drop的比率,是否采用平均池化、是否需要添加卷积层数、是否需要添加Dropout层等;
在训练完成后,就可以将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测,包括:
411、从测试参数集中读取一条用户的数据,获取所述用户的用电相关系数矩阵;
412、将用电相关系数矩阵送入已经训练好的模型进行预测,输出为0到1之间的小数,将大于0.5的标记为违规用电行为,小于0.5的标记为正常用户。
在实施中,本次实验选取一个普通居民用户,将普通居民用户数据做预处理送入模型进行预测,实验结果如下:
本次选取用户一年的电量电费数据如下所示:
本次电量的单位为千瓦·时,电费单位为元
表1用户一年的电量及电费
用上面用户每季和每季用电量和用电费计算出的相关系数矩阵如图3所示。
将以上得到的相关系数矩阵送入模型进行预测得到0.7236578,大于0.5,所以可以判断该用户具有异常行为。
上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中的先后顺序。
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.基于电力营销数据的违规用电行为预测方法,其特征在于,所述预测方法包括:
从电力营销数据库中获取用户用电数据,对用户用电数据进行处理,得到用户用电相关系数矩阵,对获取到的系数矩阵进行整理得到用户用电数据表;
构建卷积神经网络模型;
将用户用电数据表划分为训练数据集和测试参数集,基于训练数据集对卷积神经网络模型进行训练,将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测。
2.根据权利要求1所述的基于电力营销数据的违规用电行为预测方法,其特征在于,所述从电力营销数据库中获取用户用电数据,对用户用电数据进行处理,得到用户用电相关系数矩阵,对获取到的系数矩阵进行整理得到用户用电数据表,包括:
根据编写的SQL脚本语句从电网数据库中取出用电的用电数据;
所述用电数据中包括如部门编号在内的空属性,对这些属性进行删除,保留包括用户类别、用户编号、用户电量、用户用电年月在内的有用属性;
从上一步的处理结果中取出电量、电费,对每个用户进行归类,计算每个用户的月用电量以及电费,整理在一张表中,保存以备用;
基于公式一对每个用户计算用电量的相关系数矩阵,
公式描述:公式cov(x,y)为x、y的协方差,D(x)、D(y)分别为x、y的方差,x、y为用户季度用电信息;
将每个用户计算的相关系数矩阵整理成一张表并保存。
3.根据权利要求1所述的基于电力营销数据的违规用电行为预测方法,其特征在于,所述构建卷积神经网络模型,包括:
对卷积神经网络中的输入层以及两个卷积层的参数进行设置;
在卷积神经网络后增设BP神经网络,对BP神经网络的结构和隐藏参数进行设置。
4.根据权利要求1所述的基于电力营销数据的违规用电行为预测方法,其特征在于,所述基于训练数据集对卷积神经网络模型进行训练,包括:
前向计算每个神经元输出值;
反向计算每个神经元的误差项;
根据相应误差项,计算每个权重的梯度,对模型参数进行优化,调节各层的隐藏单元个数、学习速率、Drop的比率,是否采用平均池化、是否需要添加卷积层数、是否需要添加Dropout层。
5.根据权利要求1所述的基于电力营销数据的违规用电行为预测方法,其特征在于,所述将测试参数集导入训练后的卷积神经网络模型中进行违规用电行为预测,包括:
从测试参数集中读取一条用户的数据,获取所述用户的用电相关系数矩阵;
将用电相关系数矩阵送入已经训练好的模型进行预测,输出为0到1之间的小数,将大于0.5的标记为违规用电行为,小于0.5的标记为正常用户。
CN201910222802.XA 2019-03-22 2019-03-22 基于电力营销数据的违规用电行为预测方法 Pending CN110288114A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910222802.XA CN110288114A (zh) 2019-03-22 2019-03-22 基于电力营销数据的违规用电行为预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910222802.XA CN110288114A (zh) 2019-03-22 2019-03-22 基于电力营销数据的违规用电行为预测方法

Publications (1)

Publication Number Publication Date
CN110288114A true CN110288114A (zh) 2019-09-27

Family

ID=68001264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910222802.XA Pending CN110288114A (zh) 2019-03-22 2019-03-22 基于电力营销数据的违规用电行为预测方法

Country Status (1)

Country Link
CN (1) CN110288114A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861128A (zh) * 2021-01-21 2021-05-28 微梦创科网络科技(中国)有限公司 一种批量识别机器账号的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550700A (zh) * 2015-12-08 2016-05-04 国网山东省电力公司电力科学研究院 一种基于关联分析和主成分分析的时间序列数据清洗方法
CN107507076A (zh) * 2017-09-26 2017-12-22 贵州电网有限责任公司 基于数据挖掘的电力客户的综合评级的方法
CN107871136A (zh) * 2017-03-22 2018-04-03 中山大学 基于稀疏性随机池化的卷积神经网络的图像识别方法
CN108765004A (zh) * 2018-05-28 2018-11-06 贵州黔驰信息股份有限公司 一种基于数据挖掘识别用户窃电行为的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550700A (zh) * 2015-12-08 2016-05-04 国网山东省电力公司电力科学研究院 一种基于关联分析和主成分分析的时间序列数据清洗方法
CN107871136A (zh) * 2017-03-22 2018-04-03 中山大学 基于稀疏性随机池化的卷积神经网络的图像识别方法
CN107507076A (zh) * 2017-09-26 2017-12-22 贵州电网有限责任公司 基于数据挖掘的电力客户的综合评级的方法
CN108765004A (zh) * 2018-05-28 2018-11-06 贵州黔驰信息股份有限公司 一种基于数据挖掘识别用户窃电行为的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861128A (zh) * 2021-01-21 2021-05-28 微梦创科网络科技(中国)有限公司 一种批量识别机器账号的方法及系统

Similar Documents

Publication Publication Date Title
CN102591854B (zh) 针对文本特征的广告过滤系统及其过滤方法
CN107507038B (zh) 一种基于stacking和bagging算法的电费敏感用户分析方法
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN105184316A (zh) 一种基于特征权学习的支持向量机电网业务分类方法
CN111325619A (zh) 一种基于联合学习的信用卡欺诈检测模型更新方法及装置
CN108921602B (zh) 一种基于集成神经网络的用户购买行为预测方法
CN111191099B (zh) 一种基于社交媒体的用户活动类型识别方法
CN113469266B (zh) 一种基于改进深度卷积神经网络的窃电行为检测方法
CN110110915A (zh) 一种基于cnn-svr模型的负荷集成预测方法
CN113282623A (zh) 数据处理方法及装置
CN111986027A (zh) 基于人工智能的异常交易处理方法、装置
CN111178957A (zh) 一种用电客户电量突增预警的方法
CN110019820A (zh) 一种病历中主诉与现病史症状时间一致性检测方法
CN108228787A (zh) 按照多级类目处理信息的方法和装置
CN105096033A (zh) 一种提供决策信息的方法和装置
CN110288114A (zh) 基于电力营销数据的违规用电行为预测方法
CN104133808B (zh) 基于复杂对应系统的用户行为一致性度测量方法
CN115018207B (zh) 一种基于上下游的供应链管理方法、系统和设备
CN112614005B (zh) 企业复工状态的处理方法和装置
CN115618926A (zh) 一种面向纳税人企业分类的重要因子提取方法及装置
CN115907937A (zh) 基于神经网络的供应链金融风险监控方法及系统
CN113589034A (zh) 一种配电系统的窃电检测方法、装置、设备和介质
CN114723554A (zh) 异常账户识别方法及装置
CN106384308A (zh) 电力系统用电负荷数据的处理方法和装置
CN111768066A (zh) 基于融合特征的园区电热负荷耦合关系分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190927