CN109919520A - 窃电行为检测方法及装置 - Google Patents

窃电行为检测方法及装置 Download PDF

Info

Publication number
CN109919520A
CN109919520A CN201910274260.0A CN201910274260A CN109919520A CN 109919520 A CN109919520 A CN 109919520A CN 201910274260 A CN201910274260 A CN 201910274260A CN 109919520 A CN109919520 A CN 109919520A
Authority
CN
China
Prior art keywords
electricity
utilization
sample
power
power consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910274260.0A
Other languages
English (en)
Other versions
CN109919520B (zh
Inventor
周颖杰
洪晔
朱策
杨松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN201910274260.0A priority Critical patent/CN109919520B/zh
Publication of CN109919520A publication Critical patent/CN109919520A/zh
Application granted granted Critical
Publication of CN109919520B publication Critical patent/CN109919520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供一种窃电行为检测方法及装置,应用于用电数据监测设备,所述设备中存储有至少一个用户账号对应的检测分类器模型,其中所述检测分类器模型是基于该用户账号的历史用电数据所对应的用电特征参数集合训练得到的。所述方法通过使用对应用户账号的检测分类器模型对该用户账号的用电数据进行窃电行为检测的方式,确保了窃电行为检测的精度及效率,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。

Description

窃电行为检测方法及装置
技术领域
本申请涉及智能电网技术领域,具体而言,涉及一种窃电行为检测方法及装置。
背景技术
随着科学技术的不断发展,智能电网系统的应用越发广泛。对智能电网系统而言,检测用户用电行为中是否存在窃电行为,是智能电网系统监测用电行为过程中一个极为重要的方面。
目前,业界主流通常采用直接利用用户的电能使用量数据进行神经网络模型的训练,以通过训练后的神经网络模型对用户用电模式的窃电行为进行检测,或针对智能电网系统安装额外的测量设备,来实现窃电行为的检测。其中,在前一种方式中,无法很好的区分用电模式的变化是由用户用电的随机性引起的还是由用户的窃电行为引起的,整体的窃电行为检测精度不高,同时也需要划分大量的时间来针对神经网络模型进行训练,同时也因神经网络模型的复杂度而无法很快地实现窃电行为检测。在后一种方式中,在进行设备部署时存在较大困难,且会增加智能电网的运营成本。
发明内容
为了克服现有技术中的上述不足,本申请的目的在于提供一种窃电行为检测方法及装置,所述窃电行为检测方法通过使用基于历史用电数据的用电特征参数集合训练得到的检测分类器模型对对应用户的用电数据进行窃电行为检测的方式,确保了窃电行为检测的精度及效率,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数集合进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。
就方法而言,本申请实施例提供一种窃电行为检测方法,应用于用电数据监测设备,所述设备中存储有至少一个用户账号对应的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型,及与所述历史用电数据中的非窃电用电数据对应的各用电类型的事件用电均值,所述方法包括:
获取目标用户账号的待检测用电数据,并按照用电日期对所述待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,其中所述样本用电情况多时间序列集合包括不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括同一用电类型在当日不同采样时间点对应的用电量;
计算每个样本用电情况多时间序列的第一用电特征及第二用电特征;
根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列集合包括不同用电类型在当日对应的样本用电事件序列,所述样本用电事件序列包括同一用电类型下不同用电事件在当日对应的用电量平均值,所述用电量平均值为同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值;
计算每个样本用电事件序列的第三用电特征;
获取所述目标用户账号对应的各用电类型的事件用电均值,并将每个样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算,得到与该样本用电情况多时间序列集合对应的样本用电偏差多时间序列集合,其中所述样本用电偏差多时间序列集合包括不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括同一用电类型下非用电事件在当日不同采样时间点对应的用电量,及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值之间的用电偏差;
计算每个样本用电偏差多时间序列的第四用电特征及第五用电特征;
将计算得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征;
获取与所述目标用户账号对应的检测分类器模型,并将每个用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为。
就装置而言,本申请实施例提供一种窃电行为检测装置,应用于用电数据监测设备,所述设备中存储有至少一个用户账号对应的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型,及与所述历史用电数据中的非窃电用电数据对应的各用电类型的事件用电均值,所述装置包括:
样本序列生成模块,用于获取目标用户账号的待检测用电数据,并按照用电日期对所述待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,其中所述样本用电情况多时间序列集合包括不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括同一用电类型在当日不同采样时间点对应的用电量;
用电特征计算模块,用于计算每个样本用电情况多时间序列的第一用电特征及第二用电特征;
事件序列生成模块,用于根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列集合包括不同用电类型在当日对应的样本用电事件序列,所述样本用电事件序列包括同一用电类型下不同用电事件在当日对应的用电量平均值,所述用电量平均值为同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值;
所述用电特征计算模块,还用于计算每个样本用电事件序列的第三用电特征;
偏差序列生成模块,用于获取所述目标用户账号对应的各用电类型的事件用电均值,并将每个样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算,得到与该样本用电情况多时间序列集合对应的样本用电偏差多时间序列集合,其中所述样本用电偏差多时间序列集合包括不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括同一用电类型下非用电事件在当日不同采样时间点对应的用电量,及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值之间的用电偏差;
所述用电特征计算模块,还用于计算每个样本用电偏差多时间序列的第四用电特征及第五用电特征;
参数集合生成模块,用于将计算得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征;
检测分类模块,用于获取与所述目标用户账号对应的检测分类器模型,并将每个用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为。
相对于现有技术而言,本申请实施例提供的一种窃电行为检测方法及装置具有以下有益效果:所述窃电行为检测方法通过使用基于历史用电数据的用电特征参数集合训练得到的检测分类器模型对对应用户的用电数据进行窃电行为检测的方式,确保了窃电行为检测的精度及效率,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。首先,所述方法在获取到目标用户账号的待检测用电数据后,会按照用电日期对该待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,并得到每个样本用电情况多时间序列的第一用电特征及第二用电特征。而后,所述方法将根据所述样本用电情况多时间序列集合及该目标用户账号对应的各用电类型的事件用电均值得到对应的样本用电事件序列集合及样本用电偏差多时间序列集合,并得到每个样本用电事件序列的第三用电特征,和每个样本用电偏差多时间序列的第四用电特征及第五用电特征,从而得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征。最后,所述方法通过将每个用电特征参数集合输入到与所述目标用户账号对应的基于该目标用户账号的历史用电数据的用电特征参数集合训练得到的检测分类器模型中,以通过所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为,从而确保由所述检测分类器模型最终输出的窃电行为检测结果具有极高的准确度,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数集合进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举本申请较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对本申请权利要求保护范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的用电数据监测设备的方框示意图;
图2为本申请实施例提供的窃电行为检测方法的流程示意图之一;
图3为本申请实施例提供的窃电行为检测方法的流程示意图之二;
图4为本申请实施例提供的窃电行为检测装置的方框示意图之一;
图5为本申请实施例提供的窃电行为检测装置的方框示意图之二。
图标:10-用电数据监测设备;11-存储器;12-处理器;13-通信单元;100-窃电行为检测装置;110-样本序列生成模块;120-用电特征计算模块;130-事件序列生成模块;140-偏差序列生成模块;150-参数集合生成模块;160-检测分类模块;170-窃电数据模拟模块;180-样本序列均衡模块;190-用电均值计算模块;210-模型训练模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,是本申请实施例提供的用电数据监测设备10的方框示意图。在本申请实施例中,所述用电数据监测设备10用于对各用户账号的用电数据进行监测,并基于监测到的各用户账号的用电数据判断该用电数据中是否存在窃电行为。其中,所述用电数据监测设备10可以是网页服务器、云端服务器、集群服务器等。
在本实施例中,所述用电数据监测设备10包括窃电行为检测装置100、存储器11、处理器12及通信单元13。所述存储器11、处理器12及通信单元13各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,所述存储器11、处理器12及通信单元13这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
在本实施例中,所述存储器11可用于存储各用户账号的历史用电数据,所述历史用电数据为各用电账号在进行窃电行为检测时的一段历史时间内的电能使用量数据。所述存储器11可用于存储针对用电数据进行用电类型识别的预设类型识别规则,其中所述用电类型用于表示用户在用电过程中使用了何种用电设备,例如,所述用电类型可以包括空调用电、麻将机用电、微波炉用电、洗衣机用电等。
所述存储器11可用于存储针对用电数据进行用电事件识别的预设事件识别规则,其中所述用电事件用于指示用户在针对某种用电类型的用电过程中进行了何种用电操作,例如,空调用电类型下的空调降温用电事件及空调升温用电事件等,洗衣机用电类型下的洗衣机洗涤用电事件及洗衣机脱水用电事件等。
所述存储器11可存储用于判断某个用电类型下的各用电事件是否在某个时刻发生的预设用电量阈值,所述预设用电量数值可以是各用电类型的电器设备正常工作时的平均功率的十分之一,也可以是各用电类型的电器设备正常工作时的平均功率的二十分之一。
所述存储器11还可用于存储各用户账号的用电数据所对应的样本用电情况多时间序列集合,其中所述样本用电情况多时间序列集合包括对应用户账号的不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括对应用户账号的同一用电类型在当日不同采样时间点对应的用电量,每个样本用电情况多时间序列集合对应一个用电日,此时所述用电量为相邻两个采样时间点之间的具体电能使用数值。
所述存储器11还可用于存储各用户账号的用电数据所对应的样本用电事件序列集合,其中所述样本用电事件序列集合包括对应用户账号的不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电事件序列包括对应用户账号的同一用电类型下不同用电事件在当日对应的用电量平均值,每个样本用电事件序列集合对应一个用电日,此时所述用电量为相邻两个采样时间点之间的具体电能使用数值,所述用电量平均值为对应用户账号的同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值。
所述存储器11还可用于存储各用户账号的与历史用电数据中的非窃电用电数据对应的各用电类型的事件用电均值,其中所述事件用电均值用于表示对应用电类型在非窃电行为的历史用电数据所对应的各样本用电事件序列集合中的所有用电量均值之间的平均值,所述用电量均值为与所述非窃电用电数据对应的样本用电事件序列集合中的对应样本用电事件序列的各用电事件在当日对应的用电量平均值之间的平均值。
所述存储器11还可用于存储各用户账号的用电数据所对应的样本用电偏差多时间序列集合,其中所述样本用电偏差多时间序列集合与上述的样本用电事件序列集合对应,所述样本用电偏差多时间序列集合由上述样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算得到。所述样本用电偏差多时间序列集合包括对应用户账号的不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括对应用户账号的同一用电类型下非用电事件在当日不同采样时间点对应的用电量,及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值之间的用电偏差。
所述存储器11还可用于存储各用户账号的用电数据中的每种用电类型对应的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征。其中,每种用电类型的第一用电特征可以是该用电类型在对应样本用电情况多时间序列中不同采样时间点的用电量的均值。每种用电类型的第二用电特征可以是该用电类型在对应样本用电情况多时间序列中不同采样时间点的用电量的方差。每种用电类型的第三用电特征可以是该用电类型在对应样本用电事件序列中的不同用电事件的用电量平均值的信息熵。每种用电类型的第四用电特征可以是该用电类型在对应样本用电偏差多时间序列中的非用电事件所对应的不同采样时间点的用电量与各用电事件所对应的不同采样时间点的用电偏差的均值。每种用电类型的第五用电特征可以是该用电类型在对应样本用电偏差多时间序列中的非用电事件所对应的不同采样时间点的用电量与各用电事件所对应的不同采样时间点的用电偏差的方差。此时,同一用电数据下的每个用电日的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征组成一个用电日的用电特征参数集合。
在本实施例中,所述存储器11还可用于存储每个用户账号的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型,所述检测分类器模型用于对匹配的用户账号的用电数据进行窃电行为检测。所述检测分类器模型的训练过程因采用用电数据的用电特征参数集合进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。其中,所述历史用电数据可以是对应用户账号在当前时间点以往一个月内的用电数据,也可以是对应用户账号在当前时间点以往三个月内的用电数据。
在本实施例中,所述存储器11还可用于还可以存储程序,所述处理器12在接收到执行指令后,可相应地执行所述程序。
在本实施例中,所述处理器12可以是一种具有信号的处理能力的集成电路芯片。所述处理器12可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、网络处理器(Network Processor,NP)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。
在本实施例中,所述通信单元13用于通过网络建立所述用电数据监测设备10与其他电子设备之间的通信连接,并通过所述网络收发数据。例如,所述用电数据监测设备10可通过所述通信单元13从各用户账号所对应的智能电表处获取该用户账号的用电数据。
在本实施例中,所述窃电行为检测装置100包括至少一个能够以软件或固件的形式存储于所述存储器11中或固化在所述用电数据监测设备10的操作系统中的软件功能模块。所述处理器12可用于执行所述存储器11存储的可执行模块,例如所述窃电行为检测装置100所包括的软件功能模块及计算机程序等。所述用电数据监测设备10通过所述窃电行为检测装置100使用基于对应用户账号的检测分类器模型对该用户账号的用电数据进行窃电行为检测的方式,确保了窃电行为检测的精度及效率,无需增加智能电网的运营成本。其中,检测分类器模型的训练过程因采用用电数据的用电特征参数进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。
可以理解的是,图1所示的框图仅为用电数据监测设备10的一种结构组成示意图,所述用电数据监测设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参照图2,是本申请实施例提供的窃电行为检测方法的流程示意图之一。在本申请实施例中,所述窃电行为检测方法应用于上述的用电数据监测设备10,所述用电数据监测设备10中存储有至少一个用户账号对应的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型,及与所述历史用电数据中的非窃电用电数据对应的各用电类型的事件用电均值。下面对图2所示的窃电行为检测方法的具体流程和步骤进行详细阐述。
步骤S210,获取目标用户账号的待检测用电数据,并按照用电日期对所述待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合。
在本实施例中,所述用电数据监测设备10在获取到某个目标用户账号的待检测用电数据后,会根据预设类型识别规则及该待检测用电数据的用电日期对该待检测用电数据进行数据分解,得到至少一个样本用电情况多时间序列集合。其中,所述样本用电情况多时间序列集合的数目与该待检测用电数据的用电天数相同,每个样本用电情况多时间序列集合对应一个用电日,每个所述样本用电情况多时间序列集合包括对应用电账号的不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括对应用电账号的同一用电类型在当日不同采样时间点对应的用电量。其中,所述采样时间点可以是以1s为时间间隔进行的采样操作,也可以是以20s为时间间隔进行的采样操作。
步骤S220,计算每个样本用电情况多时间序列的第一用电特征及第二用电特征。
在本实施例中,所述用电数据监测设备10在得到每个用电日对应的样本用电情况多时间序列集合后,会针对每个样本用电情况多时间序列集合中的每个样本用电情况多时间序列,计算该样本用电情况多时间序列的第一用电特征及第二用电特征。
在本实施例的一种实施方式中,所述用电数据监测设备10以样本用电情况多时间序列中的同一用电类型在当日不同采样时间点对应的用电量的均值,来作为该样本用电情况多时间序列的第一用电特征,此时第一用电特征可用如下公式进行表示:
其中,μr,s表示第s个样本用电情况多时间序列集合中的第r个用电类型所对应的样本用电情况多时间序列的第一用电特征,T为当日采样时间点总数,Xr,s(t)为第s个样本用电情况多时间序列集合中的第r个用电类型在当日的采样时间点t的用电量。
在本实施例的一种实施方式中,所述用电数据监测设备10以样本用电情况多时间序列中的同一用电类型在当日不同采样时间点对应的用电量的方差,来作为该样本用电情况多时间序列的第二用电特征,此时第二用电特征可用如下公式进行表示:
其中,σr,s表示第s个样本用电情况多时间序列集合中的第r个用电类型所对应的样本用电情况多时间序列的第二用电特征。
步骤S230,根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合。
在本实施例中,所述用电数据监测设备10在得到每个用电日对应的样本用电情况多时间序列集合后,会根据预设用电量阈值对该样本用电情况多时间序列集合进行数据处理,以得到至少一个样本用电事件序列集合。其中,所述样本用电事件序列集合的数目与该待检测用电数据的用电天数相同,每个样本用电事件序列集合对应一个用电日,每个所述样本用电事件序列集合包括对应用电账号的不同用电类型在当日对应的样本用电事件序列,所述样本用电事件序列包括对应用电账号的同一用电类型下不同用电事件在当日对应的用电量平均值,所述用电量平均值为对应用电账号的同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值。
可选地,所述根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合的步骤包括:
从每个样本用电情况多时间序列集合的每个样本用电情况多时间序列中提取出数值不小于所述预设用电量阈值的用电量;
对同一样本用电情况多时间序列中的被提取出的用电量进行事件识别,得到该样本用电情况多时间序列对应的用电序列集合,其中所述用电序列集合包括同一用电类型下不同用电事件在当日对应的用电序列,所述用电序列包括同一用电事件在当日不同采样时间点的用电量;
根据每个用电序列集合计算对应的样本用电事件序列,得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列中的每个用电事件的用电量平均值,等于该用电事件在所述用电序列集合中对应的用电序列的所有用电量的平均值。
其中,所述用电数据监测设备10可采用预设事件识别规则对各项用电量数据进行事件识别,以识别出该项用电量数据所对应的用电事件。
步骤S240,计算每个样本用电事件序列的第三用电特征。
在本实施例中,所述用电数据监测设备10在得到每个用电日对应的样本用电事件序列集合后,会针对每个样本用电事件序列集合中的每个样本用电事件序列,计算该样本用电事件序列的第三用电特征。
在本实施例的一种实施方式中,所述用电数据监测设备10以样本用电事件序列中的同一用电类型下不同用电事件在当日对应的用电量平均值的信息熵,来作为该样本用电事件序列的第三用电特征。其中,所述用电数据监测设备10可采用分箱法来对每个样本用电事件序列对应的第三用电特征进行计算。例如,将每个样本用电事件序列中的不同用电事件在当日对应的用电量平均值按照从小到大的顺序进行排序,并将该样本用电事件序列对应的排序后的用电量平均值分散到连续的多个分箱区间内,以根据每个分箱区间内的用电量平均值数目及分箱区间数目计算该样本用电事件序列对应的信息熵,并以计算出的信息熵作为该样本用电事件序列的第三用电特征,其中所述多个分箱区间所对应的最小边界值等于该样本用电事件序列中的最小用电量平均值,所述多个分箱区间所对应的最大边界值等于该样本用电事件序列中的最大用电量平均值。
此时,所述第三用电特征可用如下公式进行表示:
其中,Jr,s表示第s个样本用电事件序列集合中的第r个用电类型所对应的样本用电事件序列,entropy(Jr,s)表示第s个样本用电事件序列集合中的第r个用电类型所对应的样本用电事件序列的第三用电特征,bin_num表示分箱区间的总数,pk表示Jr,s中落在第k个分箱区间内的用电量平均值的数目与Jr,s中用电量平均值总数目之间的比值。
步骤S250,获取所述目标用户账号对应的各用电类型的事件用电均值,并将每个样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算,得到与该样本用电情况多时间序列集合对应的样本用电偏差多时间序列集合。
在本实施例中,所述用电数据监测设备10在得到每个用电日对应的样本用电情况多时间序列集合后,会针对每个样本用电情况多时间序列集合中的每个样本用电情况多时间序列,将该样本用电情况多时间序列中数值不小于所述预设用电量阈值的用电量,与对应用电类型在所述历史用电数据中的非窃电用电数据处的事件用电均值进行相减运算,得到每个用电日对应的样本用电偏差多时间序列集合。其中每个样本用电偏差多时间序列集合包括对应用户账号的不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括对应用户账号的同一用电类型下非用电事件在当日不同采样时间点对应的用电量,及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值之间的用电偏差。
步骤S260,计算每个样本用电偏差多时间序列的第四用电特征及第五用电特征。
在本实施例中,所述用电数据监测设备10在得到每个用电日对应的样本用电偏差多时间序列集合后,会针对每个样本用电偏差多时间序列集合中的每个样本用电偏差多时间序列,计算该样本用电偏差多时间序列的第
四用电特征及第五用电特征。
在本实施例的一种实施方式中,所述用电数据监测设备10以样本用电偏差多时间序列中的同一用电类型下非用电事件在当日不同采样时间点对应的用电量与各用电事件在当日不同采样时间点对应的用电偏差的均值,5来作为该样本用电偏差多时间序列的第四用电特征,此时第四用电特征可
用如下公式进行表示:
其中,表示第s个样本用电偏差多时间序列集合中的第r个用电类型所对应的样本用电偏差多时间序列的第四用电特征,T为当日采样时间点总数,为第s个样本用电偏差多时间序列集合中的第r个用电类型在当日的采样时间点t的用电量数值。
在本实施例的一种实施方式中,所述用电数据监测设备10以样本用电偏差多时间序列中的同一用电类型下非用电事件在当日不同采样时间点对应的用电量与各用电事件在当日不同采样时间点对应的用电偏差的方差,来作为该样本用电偏差多时间序列的第五用电特征,此时第五用电特征可用如下公式进行表示:
其中,表示第s个样本用电偏差多时间序列集合中的第r个用电类型所对应的样本用电偏差多时间序列的第五用电特征。
步骤S270,将计算得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到数目与用电天数对应的至少一个用电特征参数集合。
在本实施例中,所述用电数据监测设备10在得到与所述待检测用电数据对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征后,会通过对所述所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征按照用电日期进行数据整理,以得到每个用电日对应的用电特征参数集合,其中每个用电特征参数集合包括对应用户账号在当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征。
步骤S280,获取与所述目标用户账号对应的检测分类器模型,并将每个用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为。
在本实施例中,所述用电数据监测设备10可通过根据用户账号与检测分类器模型之间的关联关系查找该目标用户账号对应的检测分类器模型的方式,得到该目标用户账号对应的检测分类器模型,并将每个用电日对应的用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在对应用电日中是否存在窃电行为。
其中,所述用电特征参数集合可表征用户基于对应的用电习惯进行的不同用电类型下的不同用电事件的分布规律,所述用电数据监测设备10通过以用户账号的对应的检测分类器模型对该用户账号的用电数据进行窃电行为检测的方式,可显著降低用户用电随机性对于窃电行为检测造成的影响,确保由所述检测分类器模型最终输出的窃电行为检测结果具有极高的准确度,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数集合进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。
请参照图3,是本申请实施例提供的窃电行为检测方法的流程示意图之二。在本申请实施例中,所述窃电行为检测方法还可以包括步骤S301、步骤S302、步骤S303、步骤S304、步骤S305、步骤S306、步骤S307、步骤S308、步骤S309、步骤S310及步骤S311。
步骤S301,针对每个用户账号,按照用电日期对该用户账号的历史用电数据进行数据分解,得到该历史用电数据对应的多个非窃电样本用电情况多时间序列集合,以及多个窃电样本用电情况多时间序列集合。
在本实施例中,所述用电数据监测设备10会针对每个用户账号的历史用电数据训练其对应的检测分类器模型,其中所述历史用电数据是以进行窃电行为检测的时间点的以前一段时间内的用电数据。在本实施例的一种实施方式中,所述用电数据监测设备10能以某个用电账号进行窃电行为检测的时间点的以前一个月时间内的用电数据,作为该用电账号当前对应的历史用电数据。例如,所述用电数据监测设备10在针对当月的用电数据进行窃电行为检测时所采用的检测分类器模型是以上月的历史用电数据进行模型训练的,所述用电数据监测设备10在针对下月的用电数据进行窃电行为检测时所采用的检测分类器模型是以本月的历史用电数据进行模型训练的。
所述用电数据监测设备10在进行检测分类器模型训练时,会获取对应用户账号的历史用电数据,并对该用户账号的历史用电数据进行数据分解,得到数目与历史用电天数相同的多个样本用电情况多时间序列集合,并根据各样本用电情况多时间序列集合的历史标签,将对应样本用电情况多时间序列集合归为非窃电样本用电情况多时间序列集合或者窃电样本用电情况多时间序列集合。其中,样本用电情况多时间序列集合的历史标签在初始的一段时间内默认全为非窃电样本,以后根据上一段时间的检测结果确定其历史标签是非窃电样本还是窃电样本;历史标签为非窃电样本的样本用电情况多时间序列集合即为与该历史用电数据中的非窃电用电数据所对应的非窃电样本用电情况多时间序列集合,历史标签为窃电样本的样本用电情况多时间序列集合即为与该历史用电数据中的窃电用电数据所对应的窃电样本用电情况多时间序列集合。
步骤S302,基于得到的所述非窃电样本用电情况多时间序列集合进行窃电数据模拟,得到多个用于表示模拟的窃电用电数据的模拟样本用电情况多时间序列集合。
步骤S303,根据所述模拟样本用电情况多时间序列集合及所述窃电样本用电情况多时间序列集合对所述非窃电样本用电情况多时间序列集合进行窃电数据与非窃电数据之间的数据均衡。
在本实施例中,所述根据所述模拟样本用电情况多时间序列集合及所述窃电样本用电情况多时间序列集合对所述非窃电样本用电情况多时间序列集合进行窃电数据与非窃电数据之间的数据均衡的步骤包括:
根据窃电样本用电情况多时间序列集合的数目及所述模拟样本用电情况多时间序列集合的数目,对所述非窃电样本用电情况多时间序列集合进行数据复制,以使复制得到的所有非窃电样本用电情况多时间序列集合的数目,等于所述模拟样本用电情况多时间序列集合的数目及所述窃电样本用电情况多时间序列集合的数目之和。
其中,所述用电数据监测设备10在进行数据复制时,可从当前存在的所有非窃电样本用电情况多时间序列集合中随机选取一部分非窃电样本用电情况多时间序列集合进行至少一次数据复制操作,直至最终得到的所有非窃电样本用电情况多时间序列集合的总数目,与所述模拟样本用电情况多时间序列集合的数目及所述窃电样本用电情况多时间序列集合的数目之和相同。
步骤S304,计算数据均衡后存在的所有样本用电情况多时间序列集合中每个样本用电情况多时间序列的第一用电特征及第二用电特征。
步骤S305,根据预设用电量阈值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电事件序列集合。
步骤S306,计算每个样本用电事件序列集合中各样本用电事件序列的第三用电特征。
步骤S307,计算每个用电类型在所有的与所述非窃电用电数据对应的样本用电事件序列集合中的事件用电均值。
在本实施例中,所述计算每个用电类型在所有的与所述非窃电用电数据对应的样本用电事件序列集合中的事件用电均值的步骤包括:
针对所有与非窃电用电数据对应的样本用电事件序列集合中的每个样本用电事件序列,计算该样本用电事件序列中各用电事件在当日对应的用电量平均值之间的平均值,得到该样本用电事件序列所对应的用电类型的用电量均值;
将同一用电类型在与所述非窃电用电数据对应的所有样本用电事件序列集合中对应的所有用电量均值进行平均值计算,得到该用电类型对应的所述事件用电均值。
步骤S308,根据每个用电类型的事件用电均值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电偏差多时间序列集合。
步骤S309,计算每个样本用电偏差多时间序列集合中各样本用电偏差多时间序列的第四用电特征及第五用电特征。
步骤S310,按照用电日期对得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到与该用户账号对应的多个用电特征参数集合。
在本实施例中,步骤S304、步骤S305、步骤S306、步骤S308、步骤S309、步骤S310的执行过程与上述步骤S220、步骤S230、步骤S240、步骤S250、步骤S260及步骤S270的执行过程一一对应,在此就不再赘述。
步骤S311,基于得到的所有用电特征参数集合对SVM分类器模型进行训练,得到该用户账号对应的检测分类器模型。
在本实施例中,所述用电数据监测设备10在得到某个用户账号的与历史用电数据对应的各个用电日的用电特征参数集合后,会基于网格搜索算法在SVM(Support VectorMachine,支持向量机)分类器模型上,对该SVM分类器模型的核函数、参数惩罚系数、终止判断条件、核参数及训练点分数上限进行参数优化训练,并最终得到与该用户账号对应的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型。
请参照图4,是本申请实施例提供的窃电行为检测装置100的方框示意图之一。在本申请实施例中,所述窃电行为检测装置100包括样本序列生成模块110、用电特征计算模块120、事件序列生成模块130、偏差序列生成模块140、参数集合生成模块150及检测分类模块160。
所述样本序列生成模块110,用于获取目标用户账号的待检测用电数据,并按照用电日期对所述待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,其中所述样本用电情况多时间序列集合包括不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括同一用电类型在当日不同采样时间点对应的用电量。
所述用电特征计算模块120,用于计算每个样本用电情况多时间序列的第一用电特征及第二用电特征。
所述事件序列生成模块130,用于根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列集合包括不同用电类型在当日对应的样本用电事件序列,所述样本用电事件序列包括同一用电类型下不同用电事件在当日对应的用电量平均值,所述用电量平均值为同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值。
所述用电特征计算模块120,还用于计算每个样本用电事件序列的第三用电特征。
所述偏差序列生成模块140,用于获取所述目标用户账号对应的各用电类型的事件用电均值,并将每个样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算,得到与该样本用电情况多时间序列集合对应的样本用电偏差多时间序列集合,其中所述样本用电偏差多时间序列集合包括不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括同一用电类型下非用电事件在当日不同采样时间点对应的用电量,及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值的用电偏差。
所述用电特征计算模块120,还用于计算每个样本用电偏差多时间序列的第四用电特征及第五用电特征。
所述参数集合生成模块150,用于将计算得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征。
所述检测分类模块160,用于获取与所述目标用户账号对应的检测分类器模型,并将每个用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为。
请参照图5,是本申请实施例提供的窃电行为检测装置100的方框示意图之二。在本申请实施例中,所述窃电行为检测装置100还可以包括窃电数据模拟模块170、样本序列均衡模块180、用电均值计算模块190及模型训练模块210。
所述样本序列生成模块110,还用于针对每个用户账号,按照用电日期对该用户账号的历史用电数据进行数据分解,得到该历史用电数据中的非窃电用电数据所对应的多个非窃电样本用电情况多时间序列集合,以及该历史用电数据中的窃电用电数据所对应的多个窃电样本用电情况多时间序列集合。
所述窃电数据模拟模块170,用于基于得到的所述非窃电样本用电情况多时间序列集合进行窃电数据模拟,得到多个用于表示模拟的窃电用电数据的模拟样本用电情况多时间序列集合。
所述样本序列均衡模块180,用于根据所述模拟样本用电情况多时间序列集合及所述窃电样本用电情况多时间序列集合对所述非窃电样本用电情况多时间序列集合进行窃电数据与非窃电数据之间的数据均衡。
所述用电特征计算模块120,还用于计算数据均衡后存在的所有样本用电情况多时间序列集合中每个样本用电情况多时间序列的第一用电特征及第二用电特征。
所述事件序列生成模块130,还用于根据预设用电量阈值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电事件序列集合。
所述用电特征计算模块120,还用于计算每个样本用电事件序列集合中各样本用电事件序列的第三用电特征。
所述用电均值计算模块190,用于计算每个用电类型在所有的与所述非窃电用电数据对应的样本用电事件序列集合中的事件用电均值。
所述偏差序列生成模块140,还用于根据每个用电类型的事件用电均值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电偏差多时间序列集合。
所述用电特征计算模块120,还用于计算每个样本用电偏差多时间序列集合中各样本用电偏差多时间序列的第四用电特征及第五用电特征。
所述参数集合生成模块150,用于按照用电日期对得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到与该用户账号对应的多个用电特征参数集合。
所述模型训练模块210,用于基于得到的所有用电特征参数集合对SVM分类器模型进行训练,得到该用户账号对应的检测分类器模型。
综上所述,在本申请实施例提供的一种窃电行为检测方法及装置中,所述窃电行为检测方法通过使用基于历史用电数据的用电特征参数集合训练得到的检测分类器模型对对应用户的用电数据进行窃电行为检测的方式,确保了窃电行为检测的精度及效率,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。
首先,所述方法在获取到目标用户账号的待检测用电数据后,会按照用电日期对该待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,并得到每个样本用电情况多时间序列的第一用电特征及第二用电特征。
而后,所述方法将根据所述样本用电情况多时间序列集合及该目标用户账号对应的各用电类型的事件用电均值得到对应的样本用电事件序列集合及样本用电偏差多时间序列集合,并得到每个样本用电事件序列的第三用电特征,和每个样本用电偏差多时间序列的第四用电特征及第五用电特征,从而得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征。
最后,所述方法通过将每个用电特征参数集合输入到与所述目标用户账号对应的基于该目标用户账号的历史用电数据的用电特征参数集合训练得到的检测分类器模型中,以通过所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为,从而确保由所述检测分类器模型最终输出的窃电行为检测结果具有极高的准确度,无需增加智能电网的运营成本,其中检测分类器模型的训练过程因采用用电数据的用电特征参数集合进行训练,可确保分类器模型的训练时间足够短,同时也降低了分类器模型的复杂度,确保所述分类器模型可以很快地实现窃电行为检测功能。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种窃电行为检测方法,其特征在于,应用于用电数据监测设备,所述设备中存储有至少一个用户账号对应的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型,及与所述历史用电数据中的非窃电用电数据对应的各用电类型的事件用电均值,所述方法包括:
获取目标用户账号的待检测用电数据,并按照用电日期对所述待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,其中所述样本用电情况多时间序列集合包括不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括同一用电类型在当日不同采样时间点对应的用电量;
计算每个样本用电情况多时间序列的第一用电特征及第二用电特征;
根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列集合包括不同用电类型在当日对应的样本用电事件序列,所述样本用电事件序列包括同一用电类型下不同用电事件在当日对应的用电量平均值,所述用电量平均值为同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值;
计算每个样本用电事件序列的第三用电特征;
获取所述目标用户账号对应的各用电类型的事件用电均值,并将每个样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算,得到与该样本用电情况多时间序列集合对应的样本用电偏差多时间序列集合,其中所述样本用电偏差多时间序列集合包括不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括同一用电类型下非用电事件在当日不同采样时间点对应的用电量,及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值之间的用电偏差;
计算每个样本用电偏差多时间序列的第四用电特征及第五用电特征;
将计算得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征;
获取与所述目标用户账号对应的检测分类器模型,并将每个用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为。
2.根据权利要求1所述的方法,其特征在于,所述根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合的步骤包括:
从每个样本用电情况多时间序列集合的每个样本用电情况多时间序列中提取出数值不小于所述预设用电量阈值的用电量;
对同一样本用电情况多时间序列中的被提取出的用电量进行事件识别,得到该样本用电情况多时间序列对应的用电序列集合,其中所述用电序列集合包括同一用电类型下不同用电事件在当日对应的用电序列,所述用电序列包括同一用电事件在当日不同采样时间点的用电量;
根据每个用电序列集合计算对应的样本用电事件序列,得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列中的每个用电事件的用电量平均值,等于该用电事件在所述用电序列集合中对应的用电序列的所有用电量的平均值。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对每个用户账号,按照用电日期对该用户账号的历史用电数据进行数据分解,得到该历史用电数据中的非窃电用电数据所对应的多个非窃电样本用电情况多时间序列集合,以及该历史用电数据中的窃电用电数据所对应的多个窃电样本用电情况多时间序列集合;
基于得到的所述非窃电样本用电情况多时间序列集合进行窃电数据模拟,得到多个用于表示模拟的窃电用电数据的模拟样本用电情况多时间序列集合;
根据所述模拟样本用电情况多时间序列集合及所述窃电样本用电情况多时间序列集合对所述非窃电样本用电情况多时间序列集合进行窃电数据与非窃电数据之间的数据均衡;
计算数据均衡后存在的所有样本用电情况多时间序列集合中每个样本用电情况多时间序列的第一用电特征及第二用电特征;
根据预设用电量阈值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电事件序列集合;
计算每个样本用电事件序列集合中各样本用电事件序列的第三用电特征;
计算每个用电类型在所有的与所述非窃电用电数据对应的样本用电事件序列集合中的事件用电均值;
根据每个用电类型的事件用电均值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电偏差多时间序列集合;
计算每个样本用电偏差多时间序列集合中各样本用电偏差多时间序列的第四用电特征及第五用电特征;
按照用电日期对得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到与该用户账号对应的多个用电特征参数集合;
基于得到的所有用电特征参数集合对支持向量机SVM分类器模型进行训练,得到该用户账号对应的检测分类器模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述模拟样本用电情况多时间序列集合及所述窃电样本用电情况多时间序列集合对所述非窃电样本用电情况多时间序列集合进行窃电数据与非窃电数据之间的数据均衡的步骤包括:
根据窃电样本用电情况多时间序列集合的数目及所述模拟样本用电情况多时间序列集合的数目,对所述非窃电样本用电情况多时间序列集合进行数据复制,以使复制得到的所有非窃电样本用电情况多时间序列集合的数目,等于所述模拟样本用电情况多时间序列集合的数目及所述窃电样本用电情况多时间序列集合的数目之和。
5.根据权利要求3所述的方法,其特征在于,所述计算每个用电类型在所有的与所述非窃电用电数据对应的样本用电事件序列集合中的事件用电均值的步骤包括:
针对所有与所述非窃电用电数据对应的样本用电事件序列集合中的每个样本用电事件序列,计算该样本用电事件序列中各用电事件在当日对应的用电量平均值之间的平均值,得到该样本用电事件序列所对应的用电类型的用电量均值;
将同一用电类型在与所述非窃电用电数据对应的所有样本用电事件序列集合中对应的所有用电量均值进行平均值计算,得到该用电类型对应的所述事件用电均值。
6.根据权利要求1-5中任意一项所述的方法,其特征在于,每种用电类型的第一用电特征为该用电类型在对应样本用电情况多时间序列中不同采样时间点的用电量的均值;
每种用电类型的第二用电特征为该用电类型在对应样本用电情况多时间序列中不同采样时间点的用电量的方差。
7.根据权利要求6所述的方法,其特征在于,每种用电类型的第三用电特征为该用电类型在对应样本用电事件序列中的不同用电事件的用电量平均值的信息熵。
8.根据权利要求7所述的方法,其特征在于,每种用电类型的第四用电特征为该用电类型在对应样本用电偏差多时间序列中的非用电事件所对应的不同采样时间点的用电量与各用电事件所对应的不同采样时间点的用电偏差的均值;
每种用电类型的第五用电特征为该用电类型在对应样本用电偏差多时间序列中的非用电事件所对应的不同采样时间点的用电量与各用电事件所对应的不同采样时间点的用电偏差的方差。
9.一种窃电行为检测装置,其特征在于,应用于用电数据监测设备,所述设备中存储有至少一个用户账号对应的基于历史用电数据的用电特征参数集合训练得到的检测分类器模型,及与所述历史用电数据中的非窃电用电数据对应的各用电类型的事件用电均值,所述装置包括:
样本序列生成模块,用于获取目标用户账号的待检测用电数据,并按照用电日期对所述待检测用电数据进行数据分解,得到数目与用电天数对应的至少一个样本用电情况多时间序列集合,其中所述样本用电情况多时间序列集合包括不同用电类型在当日对应的样本用电情况多时间序列,所述样本用电情况多时间序列包括同一用电类型在当日不同采样时间点对应的用电量;
用电特征计算模块,用于计算每个样本用电情况多时间序列的第一用电特征及第二用电特征;
事件序列生成模块,用于根据预设用电量阈值及每个样本用电情况多时间序列集合计算得到与该样本用电情况多时间序列集合对应的样本用电事件序列集合,其中所述样本用电事件序列集合包括不同用电类型在当日对应的样本用电事件序列,所述样本用电事件序列包括同一用电类型下不同用电事件在当日对应的用电量平均值,所述用电量平均值为同一用电事件在当日对应的所有数值不小于所述预设用电量阈值的用电量的平均值;
所述用电特征计算模块,还用于计算每个样本用电事件序列的第三用电特征;
偏差序列生成模块,用于获取所述目标用户账号对应的各用电类型的事件用电均值,并将每个样本用电情况多时间序列集合中数值不小于所述预设用电量阈值的用电量与对应用电类型的事件用电均值进行相减运算,得到与该样本用电情况多时间序列集合对应的样本用电偏差多时间序列集合,其中所述样本用电偏差多时间序列集合包括不同用电类型在当日对应的样本用电偏差多时间序列,所述样本用电偏差多时间序列包括同一用电类型下非用电事件在当日不同采样时间点对应的用电量及同一用电类型下各用电事件在当日不同采样时间点对应的用电量与所述事件用电均值之间的用电偏差;
所述用电特征计算模块,还用于计算每个样本用电偏差多时间序列的第四用电特征及第五用电特征;
参数集合生成模块,用于将计算得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到数目与用电天数对应的至少一个用电特征参数集合,其中所述用电特征参数集合包括当日对应的所有第一用电特征、所有第二用电特征、所有第三用电特征、所有第四用电特征及所有第五用电特征;
检测分类模块,用于获取与所述目标用户账号对应的检测分类器模型,并将每个用电特征参数集合输入到所述检测分类器模型中,使所述检测分类器模型基于输入的所述用电特征参数集合判断所述目标用户账号在当日是否存在窃电行为。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括窃电数据模拟模块、样本序列均衡模块、用电均值计算模块及模型训练模块;
所述样本序列生成模块,还用于针对每个用户账号,按照用电日期对该用户账号的历史用电数据进行数据分解,得到该历史用电数据中的非窃电用电数据所对应的多个非窃电样本用电情况多时间序列集合,以及该历史用电数据中的窃电用电数据所对应的多个窃电样本用电情况多时间序列集合;
所述窃电数据模拟模块,用于基于得到的所述非窃电样本用电情况多时间序列集合进行窃电数据模拟,得到多个用于表示模拟的窃电用电数据的模拟样本用电情况多时间序列集合;
所述样本序列均衡模块,用于根据所述模拟样本用电情况多时间序列集合及所述窃电样本用电情况多时间序列集合对所述非窃电样本用电情况多时间序列集合进行窃电数据与非窃电数据之间的数据均衡;
所述用电特征计算模块,还用于计算数据均衡后存在的所有样本用电情况多时间序列集合中每个样本用电情况多时间序列的第一用电特征及第二用电特征;
所述事件序列生成模块,还用于根据预设用电量阈值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电事件序列集合;
所述用电特征计算模块,还用于计算每个样本用电事件序列集合中各样本用电事件序列的第三用电特征;
所述用电均值计算模块,用于计算每个用电类型在所有的与所述非窃电用电数据对应的样本用电事件序列集合中的事件用电均值;
所述偏差序列生成模块,还用于根据每个用电类型的事件用电均值计算得到所述所有样本用电情况多时间序列集合各自对应的样本用电偏差多时间序列集合;
所述用电特征计算模块,还用于计算每个样本用电偏差多时间序列集合中各样本用电偏差多时间序列的第四用电特征及第五用电特征;
所述参数集合生成模块,用于按照用电日期对得到的第一用电特征、第二用电特征、第三用电特征、第四用电特征及第五用电特征进行数据整理,得到与该用户账号对应的多个用电特征参数集合;
所述模型训练模块,用于基于得到的所有用电特征参数集合对支持向量机SVM分类器模型进行训练,得到该用户账号对应的检测分类器模型。
CN201910274260.0A 2019-04-08 2019-04-08 窃电行为检测方法及装置 Active CN109919520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910274260.0A CN109919520B (zh) 2019-04-08 2019-04-08 窃电行为检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910274260.0A CN109919520B (zh) 2019-04-08 2019-04-08 窃电行为检测方法及装置

Publications (2)

Publication Number Publication Date
CN109919520A true CN109919520A (zh) 2019-06-21
CN109919520B CN109919520B (zh) 2020-02-11

Family

ID=66968817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910274260.0A Active CN109919520B (zh) 2019-04-08 2019-04-08 窃电行为检测方法及装置

Country Status (1)

Country Link
CN (1) CN109919520B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837934A (zh) * 2019-11-11 2020-02-25 四川大学 一种基于深度学习的智能电网短期住宅负荷预测方法
CN110909813A (zh) * 2019-11-29 2020-03-24 四川万益能源科技有限公司 一种基于边缘算法的商业体异常用电检测方法
CN113282613A (zh) * 2021-04-16 2021-08-20 广东电网有限责任公司计量中心 专变和低压用户用电分析方法、系统、设备及存储介质
CN113377827A (zh) * 2021-04-30 2021-09-10 西安电子科技大学 一种基于Conv-LSTM网络的窃电检测方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866321A (zh) * 2012-08-13 2013-01-09 广东电网公司电力科学研究院 一种自适应的防窃漏电诊断方法
CN103455855A (zh) * 2013-09-12 2013-12-18 国家电网公司 一种基于用电信息数据分析的反间歇性窃电检测方法
CN103488800A (zh) * 2013-10-16 2014-01-01 云南电力试验研究院(集团)有限公司电力研究院 一种基于svm的用电异常检测方法
WO2016194814A1 (ja) * 2015-05-29 2016-12-08 東京電力ホールディングス株式会社 配電系統監視システム、配電系統監視装置、配電系統監視方法、及びプログラム
CN106780115A (zh) * 2016-11-30 2017-05-31 国网上海市电力公司 异常用电监测与定位系统及方法
CN109583680A (zh) * 2018-09-30 2019-04-05 国网浙江长兴县供电有限公司 一种基于支持向量机的窃电辨识方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866321A (zh) * 2012-08-13 2013-01-09 广东电网公司电力科学研究院 一种自适应的防窃漏电诊断方法
CN103455855A (zh) * 2013-09-12 2013-12-18 国家电网公司 一种基于用电信息数据分析的反间歇性窃电检测方法
CN103488800A (zh) * 2013-10-16 2014-01-01 云南电力试验研究院(集团)有限公司电力研究院 一种基于svm的用电异常检测方法
WO2016194814A1 (ja) * 2015-05-29 2016-12-08 東京電力ホールディングス株式会社 配電系統監視システム、配電系統監視装置、配電系統監視方法、及びプログラム
CN106780115A (zh) * 2016-11-30 2017-05-31 国网上海市电力公司 异常用电监测与定位系统及方法
CN109583680A (zh) * 2018-09-30 2019-04-05 国网浙江长兴县供电有限公司 一种基于支持向量机的窃电辨识方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RONG JIANG ETC.: "Energy-theft detection issues for advanced metering infrastructure in smart grid", 《TSINGHUA SCIENCE AND TECHNOLOGY》 *
简富俊 等: "基于SVM的AMI环境下用电异常检测研究", 《电测与仪表》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110837934A (zh) * 2019-11-11 2020-02-25 四川大学 一种基于深度学习的智能电网短期住宅负荷预测方法
CN110837934B (zh) * 2019-11-11 2023-04-07 四川大学 一种基于深度学习的智能电网短期住宅负荷预测方法
CN110909813A (zh) * 2019-11-29 2020-03-24 四川万益能源科技有限公司 一种基于边缘算法的商业体异常用电检测方法
CN110909813B (zh) * 2019-11-29 2022-04-22 四川万益能源科技有限公司 一种基于边缘算法的商业体异常用电检测方法
CN113282613A (zh) * 2021-04-16 2021-08-20 广东电网有限责任公司计量中心 专变和低压用户用电分析方法、系统、设备及存储介质
CN113282613B (zh) * 2021-04-16 2023-05-26 广东电网有限责任公司计量中心 专变和低压用户用电分析方法、系统、设备及存储介质
CN113377827A (zh) * 2021-04-30 2021-09-10 西安电子科技大学 一种基于Conv-LSTM网络的窃电检测方法和系统
CN113377827B (zh) * 2021-04-30 2023-07-25 西安电子科技大学 一种基于Conv-LSTM网络的窃电检测方法和系统

Also Published As

Publication number Publication date
CN109919520B (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
CN109919520B (zh) 窃电行为检测方法及装置
CN110009171B (zh) 用户行为模拟方法、装置、设备及计算机可读存储介质
CN109100655B (zh) 一种动力电池的数据处理方法和装置
CN111459700A (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
CN112149873B (zh) 一种基于深度学习的低压台区线损合理区间预测方法
CN109891508A (zh) 单细胞类型检测方法、装置、设备和存储介质
CN101738998B (zh) 一种基于局部判别分析的工业过程监测系统及方法
CN107730097B (zh) 一种母线负荷预测方法、装置及计算设备
CN115469590B (zh) 智能电表接口的低功耗控制方法、装置、设备及存储介质
CN111738348B (zh) 一种电力数据异常检测方法和装置
CN110569876A (zh) 非侵入式负荷识别方法、装置及计算设备
CN109492783A (zh) 一种基于gbdt的电力计量设备故障风险预测方法
CN113591900A (zh) 一种高需求响应潜力用户的识别方法、装置及终端设备
CN115514068A (zh) 一种锂电池梯次利用的电芯压差优化方法
CN115617784A (zh) 一种信息化配电的数据处理系统及其处理方法
CN116593897A (zh) 动力电池故障诊断方法、系统、车辆及存储介质
CN111539840A (zh) 一种融合聚类与密度估计的窃电检测方法及系统
CN110736888A (zh) 一种用户用电行为异常的监测方法
CN115327391B (zh) 一种基于梯次利用电池的检测方法及装置
CN110826196A (zh) 一种工业设备运行数据的处理方法及装置
US20220222580A1 (en) Deterioration detection method, non-transitory computer-readable storage medium, and information processing device
CN105227410A (zh) 基于自适应神经网络的服务器负载检测的方法及系统
CN115275975A (zh) 一种光储充电站电力数据匹配度的确定方法及装置
CN107291722B (zh) 一种描述词的分类方法及设备
CN112685610A (zh) 虚假注册账号识别方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant