CN116340765A - 一种窃电用户预测方法、装置、存储介质及电子设备 - Google Patents
一种窃电用户预测方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116340765A CN116340765A CN202310123282.3A CN202310123282A CN116340765A CN 116340765 A CN116340765 A CN 116340765A CN 202310123282 A CN202310123282 A CN 202310123282A CN 116340765 A CN116340765 A CN 116340765A
- Authority
- CN
- China
- Prior art keywords
- sequence
- target
- electricity
- data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 212
- 238000000034 method Methods 0.000 title claims abstract description 72
- 239000013598 vector Substances 0.000 claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 47
- 230000015654 memory Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 13
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 abstract description 17
- 230000008859 change Effects 0.000 abstract description 9
- 238000012216 screening Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 12
- 230000006399 behavior Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请的实施例公开了一种窃电用户预测方法、装置、存储介质及电子设备,涉及电网监测技术领域,包括:将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,一维向量数据基于用户当前的日用电量与当前日台区线损率获得。本申请通过减少监测所需数据,直接预测每一用户的窃电概率,保证实时性的同时避免筛查导致效率降低,降低数据复杂度,使模型训练难度降低,由于训练时对当前的日用电量与线损率做出了预测,解决正负样本对数量不平衡问题的同时使模型学习到变化趋势特征,有效提升了对用户窃电行为的监测质量。
Description
技术领域
本申请涉及电网监测技术领域,具体涉及一种窃电用户预测方法、装置、存储介质及电子设备。
背景技术
目前电力局采集系统中对用户是否窃电的监测,依然停留在对低压公变台区的线损监控,通过对台区的日数据进行分析,从中发现进行窃电的用户,监测的质量较差,不但监测准确率低,还不具备实时性,需要用较长的统计周期才能筛选出少量的疑似窃电用户,而此时窃电行为已经进行了相当长的一段时间,并且当发现台区线损异常时,仍需要台区管理人员对整个台区进行地毯式排查才能具体查出窃电用户。
发明内容
本申请的主要目的在于提供一种窃电用户预测方法、装置、存储介质及电子设备,旨在解决现有技术中对用户窃电行为的监测质量差的问题。
为实现上述目的,本申请的实施例采用的技术方案如下:
第一方面,本申请实施例提供一种窃电用户预测方法,包括以下步骤:
获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列;
将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。
在第一方面的一种可能实现方式中,获取目标数据之前,窃电用户预测方法还包括:
剔除目标时间段内的日用电量序列中,最大值等于最小值的序列,获得第一目标序列。
在第一方面的一种可能实现方式中,获取目标数据之前,窃电用户预测方法还包括:
分别将第一目标序列与第二目标序列规范化处理,获得规范化第一目标序列与规范化第二目标序列;
将规范化第一目标序列与规范化第二目标序列拼接,获得目标二维向量序列数据。
在第一方面的一种可能实现方式中,将目标数据输入窃电预测模型,获得目标用户的窃电概率之前,窃电用户预测方法还包括:
分别将第一序列与第二序列规范化处理,获得规范化第一规范化序列与规范化第二序列;
根据规范化第一规范化序列与规范化第二序列预测,分别获得用户当前的日用电量与当前日台区线损率;
将规范化第一规范化序列与规范化第二序列拼接,获得二维向量序列数据;
将用户的历史窃电概率、用户当前的日用电量以及当前日台区线损率拼接,获得一维向量数据;
以二维向量序列数据作为输入、一维向量数据作为输出,训练获得窃电预测模型。
在第一方面的一种可能实现方式中,以二维向量序列数据作为输入、一维向量作为输出,训练获得窃电预测模型,包括:
以二维向量序列数据作为输入、一维向量作为输出,训练获得第一预测模型;
判断第一预测模型的损失值是否小于目标值,在判断结果为是的情况下,根据第一预测模型,获得窃电预测模型。
在第一方面的一种可能实现方式中,判断结果为否的情况下,利用验证集获得正常用户的误判率与窃电用户的识别率;
根据窃电用户的识别率与正常用户的误判率的比值,获得评估指标;
根据评估指标中数值最大的指标对应的第一预测模型,获得窃电预测模型。
在第一方面的一种可能实现方式中,根据规范化第一规范化序列与规范化第二序列预测,分别获得用户当前的日用电量与当前日台区线损率,包括:
根据规范化第一规范化序列与规范化第二序列的曲线数据预测,分别获得用户当前的日用电量与当前日台区线损率。
第二方面,本申请实施例提供一种窃电用户预测装置,包括:
获取模块,获取模块用于获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列;
预测模块,预测模块用于将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。
第三方面,本申请实施例提供一种计算机可读存储介质,储存有计算机程序,计算机程序被处理器加载执行时,实现如上述第一方面中任一项提供的窃电用户预测方法。
第四方面,本申请实施例提供一种电子设备,包括处理器及存储器,其中,
存储器用于存储计算机程序;
处理器用于加载执行计算机程序,以使电子设备执行如上述第一方面中任一项提供的窃电用户预测方法。
与现有技术相比,本申请的有益效果是:
本申请实施例提出的一种窃电用户预测方法、装置、存储介质及电子设备,该方法包括:获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列;将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。本申请的方法通过匹配目标时间段内用户的日用电量数据与日台区线损率数据,大幅度降低监测所需要的数据量,直接预测每一用户的窃电概率,一方面保证实时性,另一方面避免二次筛查导致效率降低,训练数据的形式处理为二维向量,降低数据复杂度,使模型的训练难度降低,由于窃电预测模型的训练数据已经利用各序列数据对当前的日用电量与线损率做出了预测,既解决了正负样本对数量不平衡的问题,又使模型学习到了各序列数据的变化趋势特征,进一步提升了对于用户窃电概率预测的准确性,有效提升了对用户窃电行为的监测质量。
附图说明
图1为本申请实施例涉及的硬件运行环境的电子设备结构示意图;
图2为本申请实施例提供的窃电用户预测方法的流程示意图;
图3为本申请实施例提供的窃电用户预测装置的模块示意图;
图4为本申请实施例提供的窃电用户预测方法中窃电预测模型的模型构架示意图;
图中标记:101-处理器,102-通信总线,103-网络接口,104-用户接口,105-存储器。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例的主要解决方案是:提出一种窃电用户预测方法、装置、存储介质及电子设备,该方法包括:获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列;将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。
目前电力局采集系统中对低压公变台区的线损监控仅靠台区的日数据进行分析,不具备实时性,需要用较长的统计周期才能筛选出少量的疑似窃电用户,如统计三个月的用户日电量数据与所在台区线损率数据的变化一致性概率大于50%视为疑似窃电用户。由于此类方法的准确率不高,当发现台区线损异常时,仍需要台区管理人员对整个台区进行地毯式排查,此方式无法做到迅速及有效地对台区线损进行治理。
现有的反窃电数据分析技术以特征统计为主流思路,存在以下问题:
采用人工特征,存在特征僵化问题;根据经验来设定若干特征,如:对用户用电量进行聚类统计、对用户日电量数据与台区线损率数据的变化一致性进行统计。不同的人工特征往往仅针对某个极小特定范围内的窃电手段,存在特征僵化问题,难以涵盖日渐增多的各类窃电手法。
分析周期较长,不利于及时进行台区线损的治理;目前主流的反窃电数据分析技术需对各类人工特征进行较长周期的统计,方能提高对疑似窃电用户的识别准确率,此统计周期往往长达两三个月,不利于及时发现窃电现象并及时进行线损治理。
没有充分考虑到时序数据的波动规律;不论是正常用户还是窃电用户,其用电需求必然符合一定的实际生活生产需要,故而在时间周期上是存在波动规律的。而以统计的方式得出的指标未能包含周期性特征,这也是识别率较低、需要较长分析周期的原因之一。
为此,本申请提供一种解决方案,通过匹配目标时间段内用户的日用电量数据与日台区线损率数据,大幅度降低监测所需要的数据量,直接预测每一用户的窃电概率,一方面保证实时性,另一方面避免二次筛查导致效率降低,训练数据的形式处理为二维向量,降低数据复杂度,使模型的训练难度降低,由于窃电预测模型的训练数据已经利用各序列数据对当前的日用电量与线损率做出了预测,既解决了正负样本对数量不平衡的问题,又使模型学习到了各序列数据的变化趋势特征,进一步提升了对于用户窃电概率预测的准确性,有效提升了对用户窃电行为的监测质量。
参照附图1,附图1为本申请实施例方案涉及的硬件运行环境的电子设备结构示意图,该电子设备可以包括:处理器101,例如中央处理器(Centra lProcess i ng Un i t,CPU),通信总线102、用户接口104,网络接口103,存储器105。其中,通信总线102用于实现这些组件之间的连接通信。用户接口104可以包括显示屏(Di sp l ay)、输入单元比如键盘(Keyboard),可选用户接口104还可以包括标准的有线接口、无线接口。网络接口103可选的可以包括标准的有线接口、无线接口(如无线保真(WI re l ess-F I de l ity,WI-F I)接口)。存储器105可选的可以是独立于前述处理器101的存储装置,存储器105可能是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可能是稳定的非易失性存储器(Non-Vo l at i l e Memory,NVM),例如至少一个磁盘存储器;处理器101可以是通用处理器,包括中央处理器、网络处理器等,还可以是数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本领域技术人员可以理解,附图1中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如附图1所示,作为一种存储介质的存储器105中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及电子程序。
在附图1所示的电子设备中,网络接口103主要用于与网络服务器进行数据通信;用户接口104主要用于与用户进行数据交互;本申请中的处理器101、存储器105可以设置在电子设备中,电子设备通过处理器101调用存储器105中存储的窃电用户预测装置,并执行本申请实施例提供的窃电用户预测方法。
参照附图2,基于前述实施例的硬件设备,本申请的实施例提供一种窃电用户预测方法,包括以下步骤:
S10:获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列。
在具体实施过程中,目标用户为需要查验用电情况的用户,由于是对用户当前的状态进行预测,因此目标时间为当前时间点之前的一段时间,并且为最近的一段时间,本实施例中以日用电量与日台区线损率为基础,因此目标时间段为当前时间之前的N日,即最近的N日,每日的数据情况,N为正整数。如N取14,当前为第15天,那么目标时间段即为最近14天,预测的则是第15天的情况。
序列,是被排成一列的对象,第一目标序列为目标用户在目标时间段内的日用电量序列,同理,第二目标序列为在目标时间段内日台区线损率序列,也就是说,各自序列中按照日期的先后顺序将每日的数据情况进行排列。二维向量序列,也即将第一目标序列与第二目标序列对应组合,所构成的二维坐标式的序列,即为目标数据。
S20:将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。
在具体实施过程中,窃电预测模型,也即在现有的模型基础上,通过本申请实施例中的训练数据训练后的模型。与目标数据所进行的处理同理,通过提前获得一些用户的在时间段内的日用电量序列,即第一序列,以及在时间段内日台区线损率序列,即第二序列,该时间段表示历史记录中一段连续的天数。
由于需要预测当前情况,则对应需要有预测的输出样本,由此考虑分别通过对第一序列与第二序列做出预测,获得当前用户当前的日用电量与当前日台区线损率,以此来实现正负样本对数量的平衡,进而模型也可学习到各个序列的变化趋势,对当前情况做出预测,而为了便于简化输出标签,降低模型收敛速度,将所有预测的数据进行整合,通过一维向量的形式输出。
本实施例中,通过匹配目标时间段内用户的日用电量数据与日台区线损率数据,大幅度降低监测所需要的数据量,直接预测每一用户的窃电概率,一方面保证实时性,另一方面避免二次筛查导致效率降低,训练数据的形式处理为二维向量,降低数据复杂度,使模型的训练难度降低,由于窃电预测模型的训练数据已经利用各序列数据对当前的日用电量与线损率做出了预测,既解决了正负样本对数量不平衡的问题,又使模型学习到了各序列数据的变化趋势特征,进一步提升了对于用户窃电概率预测的准确性,有效提升了对用户窃电行为的监测质量。
在一种实施例中,获取目标数据之前,窃电用户预测方法还包括:
剔除目标时间段内的日用电量序列中,最大值等于最小值的序列,获得第一目标序列。
在具体实施过程中,为提升预测的准确性,剔除第一目标序列中的无效数据,将目标时间段内的日用电量序列中,最大值等于最小值的序列剔除,序列最大值等于最小值,也即每日用电量完全相同,丝毫不存在波动,显然这是与实际情况不符合的无效数据,或称之为无效用户,将这些用户需要排除在外。
在一种实施例中,获取目标数据之前,窃电用户预测方法还包括:
分别将第一目标序列与第二目标序列规范化处理,获得规范化第一目标序列与规范化第二目标序列;
将规范化第一目标序列与规范化第二目标序列拼接,获得目标二维向量序列数据。
在具体实施过程中,数据规范化又称数据规格化,指对原始数据进行规范化处理,以能正确地反映实际情况。规范化处理后的序列分别记为规范化第一目标序列与规范化第二目标序列,分别记为XE与XS;将对应的规范化第一目标序列与规范化第二目标序列进行拼接,构成形如(P,Q)的二维向量序列,其中P代表长度,Q代表维度,也即二维向量时Q为2。
在一种实施例中,将目标数据输入窃电预测模型,获得目标用户的窃电概率之前,窃电用户预测方法还包括:
分别将第一序列与第二序列规范化处理,获得规范化第一规范化序列与规范化第二序列;
根据规范化第一规范化序列与规范化第二序列预测,分别获得用户当前的日用电量与当前日台区线损率;
将规范化第一规范化序列与规范化第二序列拼接,获得二维向量序列数据;
将用户的历史窃电概率、用户当前的日用电量以及当前日台区线损率拼接,获得一维向量数据;
以二维向量序列数据作为输入、一维向量数据作为输出,训练获得窃电预测模型。
在具体实施过程中,提前训练模型,以提升预测效率,对训练数据的处理类似于对目标数据所进行的处理,在之前也可以进行剔除无效数据的操作。先对N日用户的日用电量序列及N日台区线损率序列分别进行规范化处理,规范化所用公式为:Xn=(Xn-Xmean)/Xstd,其中n∈[1,N],Xnean为序列的均值,Xstd为序列的标准差。N日用户日用电量序列规范化后的序列记为XE,第N+1日的用户日用电量数据规范化后的结果记为XEn+1;N日台区线损率序列规范化后的序列记为XS,第N+1日的台区线损率数据规范化后的结果记为XSn+1。将XE与XS拼接为二维向量序列,记为X,对应窃电预测模型的输入。
然后对应每一组X需要准备相应的输出样本,为了简化输出,参考历史数据,将历史数据中有过窃电行为的用户的窃电概率均记为1,将未发生过窃电行为的用户的窃电概率记为0,而后通过预测的XEn+1、XSn+1、窃电概率拼接为一维向量,记为Ylabel,对应窃电预测模型的输出。为根据对离散的点数据进行预测,根据规范化第一规范化序列与规范化第二序列预测,分别获得用户当前的日用电量与当前日台区线损率,包括:
根据规范化第一规范化序列与规范化第二序列的曲线数据预测,分别获得用户当前的日用电量与当前日台区线损率。
通过将序列的点数据转化为线性数据,能够清楚地反应曲线走势,进而根据变化趋势可以大幅度提升预测的准确性。
一组对应的训练样本由输出与输入确定,记为(X,Ylabel),由于输入与输出已经明确,训练过程并不需要让模型自行学习其他规律,因此采用有监督的学习训练模型即可。在此步骤中,训练样本中可抽取70%作为训练集,30%作为验证集,以便于对模型进行验证集优化,并且每一次的预测数据又可以收集作为训练数据,以不断提高模型预测的准确性。
参照附图4,为本申请实施例中窃电预测模型的构架,将N日用户日用电量序列(N,1)及N日台区线损率序列(N,1)分别进行规范化预处理后构成的二维序列数据X(N,2),输入时序神经网络模型得到隐层输出H(hc,1),再经过全连接层将维度转换为3x1的最终结果Y(3,1),分别为:第N+1日用电量的预测Y1、第N+1日线损率的预测Y2、窃电概率的预测Y3,Y3通过Sigmod函数,将结果映射至(0,1)区间获得,作为用户窃电概率的预测值,即最终对于用户的窃电概率预测关注Y3部分即可。
在一种实施例中,以二维向量序列数据作为输入、一维向量作为输出,训练获得窃电预测模型,包括:
以二维向量序列数据作为输入、一维向量作为输出,训练获得第一预测模型;
判断第一预测模型的损失值是否小于目标值,在判断结果为是的情况下,根据第一预测模型,获得窃电预测模型。
在具体实施过程中,为了使模型能够有明确的训练结束的依据,提前设置目标值,目标值为根据实际情况设定的一个足够小的正实数ε。将训练集中的X输入初始的模型中,获得输出Y,此时的模型记为第一预测模型,计算其损失值来反应模型的好坏程度,并根据反向传播算法实现网络训练,反向传播算法,简称BP算法,适合于多层神经网络的一种学习算法,它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系:一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力。
损失值l oss的计算公式为:
其中:Y1与对应第N+1日的用户日用电量,Y2与/>对应第N+1日的台区线损率,Y3与/>对应窃电概率。如果判断出l oss小于预设的训练目标即一个足够小的正实数ε则训练结束,当前的第一预测模型即可作为窃电预测模型。反之,在判断结果为否的情况下,利用验证集获得正常用户的误判率与窃电用户的识别率;
根据窃电用户的识别率与正常用户的误判率的比值,获得评估指标;
根据评估指标中数值最大的指标对应的第一预测模型,获得窃电预测模型。
在具体实施过程中,损失值较大的情况下,进入模型验证阶段,将验证集中的X输入窃电概率预测模型,获得输出Y。根据Y中的Y3与验证集中的可得到正常用户的误判率R1和窃电用户的识别率R2,然后R2/R1得到评估指标,该指标越大则视为窃电概率预测模型的效果越好,并保存历史最优评估指标对应的模型权重参数,也即评估指标中数值最大的指标对应的第一预测模型可作为窃电预测模型。
参照附图3,基于与前述实施例中同样的发明构思,本申请实施例还提供一种窃电用户预测装置,该装置包括:
获取模块,获取模块用于获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列;
预测模块,预测模块用于将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。
本领域技术人员应当理解,实施例中的各个模块的划分仅仅是一种逻辑功能的划分,实际应用时可以全部或部分集成到一个或多个实际载体上,且这些模块可以全部以软件通过处理单元调用的形式实现,也可以全部以硬件的形式实现,或是以软件、硬件结合的形式实现,需要说明的是,本实施例中窃电用户预测装置中各模块是与前述实施例中的窃电用户预测方法中的各步骤一一对应,因此,本实施例的具体实施方式可参照前述窃电用户预测方法的实施方式,这里不再赘述。
基于与前述实施例中同样的发明构思,本申请的实施例还提供一种计算机可读存储介质,储存有计算机程序,计算机程序被处理器加载执行时,实现如本申请实施例提供的窃电用户预测方法。
基于与前述实施例中同样的发明构思,本申请的实施例还提供一种电子设备,包括处理器及存储器,其中,
存储器用于存储计算机程序;
处理器用于加载执行计算机程序,以使电子设备执行如本申请实施例提供的窃电用户预测方法。
此外,基于与前述实施例中同样的发明构思,本申请的实施例还提供一种计算机程序产品,包括计算机程序,当计算机程序被执行时,用于执行如本申请实施例提供的窃电用户预测方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。计算机可以是包括智能终端和服务器在内的各种计算设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台多媒体终端设备(可以是手机,计算机,电视接收机,或者网络设备等)执行本申请各个实施例所述的方法。
综上,本申请提供的一种窃电用户预测方法、装置、存储介质及电子设备,包括:获取目标数据;其中,目标数据为目标二维向量序列数据,目标二维向量序列数据基于第一目标序列与第二目标序列获得,第一目标序列为目标用户在目标时间段内的日用电量序列,第二目标序列为在目标时间段内日台区线损率序列;将目标数据输入已训练的窃电预测模型,获得目标用户的窃电概率;其中,窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,二维向量序列数据基于第一序列与第二序列获得,第一序列为用户在时间段内的日用电量序列,第二序列为在时间段内日台区线损率序列,一维向量数据基于用户当前的日用电量与当前日台区线损率获得,用户当前的日用电量基于第一序列预测获得,当前日台区线损率基于第二序列预测获得。本申请通过匹配目标时间段内用户的日用电量数据与日台区线损率数据,大幅度降低监测所需要的数据量,直接预测每一用户的窃电概率,一方面保证实时性,另一方面避免二次筛查导致效率降低,训练数据的形式处理为二维向量,降低数据复杂度,使模型的训练难度降低,由于窃电预测模型的训练数据已经利用各序列数据对当前的日用电量与线损率做出了预测,既解决了正负样本对数量不平衡的问题,又使模型学习到了各序列数据的变化趋势特征,进一步提升了对于用户窃电概率预测的准确性,有效提升了对用户窃电行为的监测质量。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种窃电用户预测方法,其特征在于,包括以下步骤:
获取目标数据;其中,所述目标数据为目标二维向量序列数据,所述目标二维向量序列数据基于第一目标序列与第二目标序列获得,所述第一目标序列为目标用户在目标时间段内的日用电量序列,所述第二目标序列为在所述目标时间段内日台区线损率序列;
将所述目标数据输入已训练的窃电预测模型,获得所述目标用户的窃电概率;其中,所述窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,所述二维向量序列数据基于第一序列与第二序列获得,所述第一序列为用户在时间段内的日用电量序列,所述第二序列为在所述时间段内日台区线损率序列,所述一维向量数据基于用户当前的日用电量与当前日台区线损率获得,所述用户当前的日用电量基于所述第一序列预测获得,所述当前日台区线损率基于所述第二序列预测获得。
2.根据权利要求1所述的窃电用户预测方法,其特征在于,所述获取目标数据之前,所述窃电用户预测方法还包括:
剔除所述目标时间段内的日用电量序列中,最大值等于最小值的序列,获得所述第一目标序列。
3.根据权利要求1所述的窃电用户预测方法,其特征在于,所述获取目标数据之前,所述窃电用户预测方法还包括:
分别将所述第一目标序列与所述第二目标序列规范化处理,获得规范化第一目标序列与规范化第二目标序列;
将所述规范化第一目标序列与所述规范化第二目标序列拼接,获得所述目标二维向量序列数据。
4.根据权利要求1所述的窃电用户预测方法,其特征在于,所述将所述目标数据输入窃电预测模型,获得所述目标用户的窃电概率之前,所述窃电用户预测方法还包括:
分别将所述第一序列与所述第二序列规范化处理,获得规范化第一规范化序列与规范化第二序列;
根据所述规范化第一规范化序列与所述规范化第二序列预测,分别获得所述用户当前的日用电量与所述当前日台区线损率;
将所述规范化第一规范化序列与所述规范化第二序列拼接,获得所述二维向量序列数据;
将所述用户的历史窃电概率、所述用户当前的日用电量以及所述当前日台区线损率拼接,获得所述一维向量数据;
以所述二维向量序列数据作为输入、所述一维向量数据作为输出,训练获得所述窃电预测模型。
5.根据权利要求4所述的窃电用户预测方法,其特征在于,所述以所述二维向量序列数据作为输入、所述一维向量作为输出,训练获得所述窃电预测模型,包括:
以所述二维向量序列数据作为输入、所述一维向量作为输出,训练获得第一预测模型;
判断所述第一预测模型的损失值是否小于目标值,在判断结果为是的情况下,根据所述第一预测模型,获得所述窃电预测模型。
6.根据权利要求5所述的窃电用户预测方法,其特征在于,所述判断结果为否的情况下,利用验证集获得正常用户的误判率与窃电用户的识别率;
根据所述窃电用户的识别率与所述正常用户的误判率的比值,获得评估指标;
根据所述评估指标中数值最大的指标对应的第一预测模型,获得所述窃电预测模型。
7.根据权利要求4所述的窃电用户预测方法,其特征在于,所述根据所述规范化第一规范化序列与所述规范化第二序列预测,分别获得所述用户当前的日用电量与当前日台区线损率,包括:
根据所述规范化第一规范化序列与所述规范化第二序列的曲线数据预测,分别获得所述用户当前的日用电量与当前日台区线损率。
8.一种窃电用户预测装置,其特征在于,包括:
获取模块,所述获取模块用于获取目标数据;其中,所述目标数据为目标二维向量序列数据,所述目标二维向量序列数据基于第一目标序列与第二目标序列获得,所述第一目标序列为目标用户在目标时间段内的日用电量序列,所述第二目标序列为在所述目标时间段内日台区线损率序列;
预测模块,所述预测模块用于将所述目标数据输入已训练的窃电预测模型,获得所述目标用户的窃电概率;其中,所述窃电预测模型基于若干二维向量序列数据与一维向量数据训练获得,所述二维向量序列数据基于第一序列与第二序列获得,所述第一序列为用户在时间段内的日用电量序列,所述第二序列为在所述时间段内日台区线损率序列,所述一维向量数据基于用户当前的日用电量与当前日台区线损率获得,所述用户当前的日用电量基于所述第一序列预测获得,所述当前日台区线损率基于所述第二序列预测获得。
9.一种计算机可读存储介质,储存有计算机程序,其特征在于,所述计算机程序被处理器加载执行时,实现如权利要求1-7中任一项所述的窃电用户预测方法。
10.一种电子设备,其特征在于,包括处理器及存储器,其中,
所述存储器用于存储计算机程序;
所述处理器用于加载执行所述计算机程序,以使所述电子设备执行如权利要求1-7中任一项所述的窃电用户预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310123282.3A CN116340765B (zh) | 2023-02-16 | 2023-02-16 | 一种窃电用户预测方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310123282.3A CN116340765B (zh) | 2023-02-16 | 2023-02-16 | 一种窃电用户预测方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116340765A true CN116340765A (zh) | 2023-06-27 |
CN116340765B CN116340765B (zh) | 2024-02-09 |
Family
ID=86886670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310123282.3A Active CN116340765B (zh) | 2023-02-16 | 2023-02-16 | 一种窃电用户预测方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116340765B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008057808A2 (en) * | 2006-11-02 | 2008-05-15 | Current Technologies, Llc | Power theft detection system and method |
CN109784388A (zh) * | 2018-12-29 | 2019-05-21 | 北京中电普华信息技术有限公司 | 窃电用户识别方法和装置 |
CN209572026U (zh) * | 2019-04-26 | 2019-11-01 | 国网四川省电力公司电力科学研究院 | 基于北斗gps泛在物联网资产智能化管理系统 |
WO2020191663A1 (zh) * | 2019-03-27 | 2020-10-01 | 华北电力大学扬中智能电气研究中心 | 一种用电行为检测方法、装置、电子设备及存储介质 |
CN113377827A (zh) * | 2021-04-30 | 2021-09-10 | 西安电子科技大学 | 一种基于Conv-LSTM网络的窃电检测方法和系统 |
CN113393103A (zh) * | 2021-06-03 | 2021-09-14 | 西南科技大学 | 一种基于遗传算法优化bp神经网络的反窃电系统 |
CN113408658A (zh) * | 2021-07-14 | 2021-09-17 | 国网吉林省电力有限公司营销服务中心 | 一种基于数据挖掘技术的自动化窃电识别方法 |
EP3968040A1 (en) * | 2019-06-21 | 2022-03-16 | Siemens Aktiengesellschaft | Abnormal electricity use recognition method and device, and computer readable storage medium |
CN114818849A (zh) * | 2022-03-09 | 2022-07-29 | 福建工程学院 | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 |
CN114839433A (zh) * | 2022-03-21 | 2022-08-02 | 国网北京市电力公司 | 窃电行为确定方法、装置及电子设备 |
WO2023007506A1 (en) * | 2021-07-28 | 2023-02-02 | Vishwakarma Rajesh | Electric limiter for converting high alternating potential difference to provide limited electric power per second |
-
2023
- 2023-02-16 CN CN202310123282.3A patent/CN116340765B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008057808A2 (en) * | 2006-11-02 | 2008-05-15 | Current Technologies, Llc | Power theft detection system and method |
CN109784388A (zh) * | 2018-12-29 | 2019-05-21 | 北京中电普华信息技术有限公司 | 窃电用户识别方法和装置 |
WO2020191663A1 (zh) * | 2019-03-27 | 2020-10-01 | 华北电力大学扬中智能电气研究中心 | 一种用电行为检测方法、装置、电子设备及存储介质 |
CN209572026U (zh) * | 2019-04-26 | 2019-11-01 | 国网四川省电力公司电力科学研究院 | 基于北斗gps泛在物联网资产智能化管理系统 |
EP3968040A1 (en) * | 2019-06-21 | 2022-03-16 | Siemens Aktiengesellschaft | Abnormal electricity use recognition method and device, and computer readable storage medium |
CN113377827A (zh) * | 2021-04-30 | 2021-09-10 | 西安电子科技大学 | 一种基于Conv-LSTM网络的窃电检测方法和系统 |
CN113393103A (zh) * | 2021-06-03 | 2021-09-14 | 西南科技大学 | 一种基于遗传算法优化bp神经网络的反窃电系统 |
CN113408658A (zh) * | 2021-07-14 | 2021-09-17 | 国网吉林省电力有限公司营销服务中心 | 一种基于数据挖掘技术的自动化窃电识别方法 |
WO2023007506A1 (en) * | 2021-07-28 | 2023-02-02 | Vishwakarma Rajesh | Electric limiter for converting high alternating potential difference to provide limited electric power per second |
CN114818849A (zh) * | 2022-03-09 | 2022-07-29 | 福建工程学院 | 基于大数据信息的卷积神经网络和遗传算法的反窃电方法 |
CN114839433A (zh) * | 2022-03-21 | 2022-08-02 | 国网北京市电力公司 | 窃电行为确定方法、装置及电子设备 |
Non-Patent Citations (3)
Title |
---|
ASHRAF ULLAH 等: "CNN and GRU based Deep Neural Network for Electricity Theft Detection to Secure Smart Grid", 《2020 INTERNATIONAL WIRELESS COMMUNICATIONS AND MOBILE COMPUTING (IWCMC)》, pages 1598 - 1602 * |
万泉 等: "基于用电行为分析的绕越窃电识别研究", 《电力信息与通信技术》, vol. 20, no. 06, pages 115 - 121 * |
崔雪原: "数据驱动的用户侧窃电检测方法", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》, pages 042 - 2964 * |
Also Published As
Publication number | Publication date |
---|---|
CN116340765B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650919A (zh) | 一种基于卷积神经网络的信息系统故障诊断方法及装置 | |
CN108573358A (zh) | 一种逾期预测模型生成方法及终端设备 | |
CN111260249A (zh) | 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置 | |
CN111506723A (zh) | 问答响应方法、装置、设备及存储介质 | |
CN115936180A (zh) | 光伏发电功率预测方法、装置和计算机设备 | |
CN110489142A (zh) | 设备软件升级的评估方法及装置、存储介质、终端 | |
CN111898247A (zh) | 滑坡位移预测方法、设备及存储介质 | |
Zu et al. | A simple gated recurrent network for detection of power quality disturbances | |
CN116307059A (zh) | 配电网区域故障预测模型构建方法及装置、电子设备 | |
CN115695025A (zh) | 网络安全态势预测模型的训练方法及装置 | |
CN114021425B (zh) | 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质 | |
CN115296933A (zh) | 一种工业生产数据风险等级评估方法及系统 | |
CN111783827B (zh) | 一种基于负荷数据的企业用户分类方法和装置 | |
CN113628043A (zh) | 基于数据分类的投诉有效性判断方法、装置、设备及介质 | |
CN116500335B (zh) | 基于一维特征和二维特征的智能电网窃电检测方法及系统 | |
CN110855474B (zh) | Kqi数据的网络特征提取方法、装置、设备及存储介质 | |
CN116340765B (zh) | 一种窃电用户预测方法、装置、存储介质及电子设备 | |
CN117134315A (zh) | 一种基于bert算法的配电变压器负荷预测方法及装置 | |
CN111967919A (zh) | 一种基于自回归和自适应提升算法的居民用电行为分析的系统及方法 | |
CN116843395A (zh) | 一种业务系统的告警分级方法、装置、设备及存储介质 | |
CN116976491A (zh) | 一种信息预测方法、装置、设备、存储介质及程序产品 | |
CN114358186A (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
CN107679478A (zh) | 输电线路空间负荷状态的提取方法和系统 | |
CN111402042B (zh) | 一种用于股市大盘形态分析的数据分析与显示方法 | |
CN117745423B (zh) | 一种异常账户的识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |