CN117972579A

CN117972579A - 窃电行为检测方法、装置、设备及存储介质

Info

Publication number: CN117972579A
Application number: CN202410072789.5A
Authority: CN
Inventors: 朱三元; 薛梓维; 朱磊; 王波
Original assignee: Hubei Engineering University
Current assignee: Hubei Engineering University
Priority date: 2024-01-17
Filing date: 2024-01-17
Publication date: 2024-05-03

Abstract

本发明涉及数据检测技术领域，并公开了一种窃电行为检测方法、装置、设备及存储介质，该方法包括：获取用电终端在第一检测周期内的历史用电数据，并为历史用电数据分配数据标签；对历史用电数据中的缺失数据进行数据预处理，得到预处理数据；基于预处理数据和带有数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，预设模型基于OS_CNN技术和AutoXGB技术构建；通过窃电行为检测模型检测用电终端是否存在窃电行为。本发明通过对基于OS_CNN技术和AutoXGB技术构建后得到的预设模型进行训练和测试，得到窃电行为检测模型，从而能够通过窃电行为检测模型快速准确地检测到用电终端是否存在窃电行为。

Description

窃电行为检测方法、装置、设备及存储介质

技术领域

本发明涉及数据检测技术领域，尤其涉及一种窃电行为检测方法、装置、设备及存储介质。

背景技术

电力的使用在日常生活中无处不在，全球各地每时每刻不在进行电力消耗。同时电力在传输和转换的过程中都存在一定的损失，一般来说，电力损失可以分为技术损失和非技术损失。技术损失是不可避免的，因为它主要是由于电力传输过程中电力线的焦耳效应和变压器损耗而产生的。由于技术损失的本身特性，技术损失的计算是相当复杂的，并且不能完全消除技术损失，只能通过一些现有的技术来减少技术损失。非技术损失产生的主要原因是由于计费延迟和违规、能源盗窃、电表故障、欺诈和未付账单。

近年来，少数用户通过篡改电表数据，减少用电量，窃取电力是造成非技术损失的主要原因之一。与此同时，窃取电力也可能会对电网的稳定性造成破坏，比如，电网会无法正确计算出地区的用电负荷，无法正确升级匹配所对应的供电设施，当出现用电高峰时，很可能因为电网负载过大，而导致地区电网陷入瘫痪，造成直接或间接的经济损失。根据调查，不同的国家都遭受过非技术损失所带来的经济损失。而传统的人工检测方法不仅要消费大量的人力物力，并且检测精度和效率也不尽人意。基于此，如何快速准确地检测用电终端是否存在窃电行为是行业内的重要研究方向之一。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供了一种窃电行为检测方法、装置、设备及存储介质，旨在解决现有技术无法快速准确地检测用电终端是否存在窃电行为的技术问题。

为实现上述目的，本发明提供了一种窃电行为检测方法，所述方法包括以下步骤：

获取用电终端在第一检测周期内的历史用电数据，并为所述历史用电数据分配数据标签，所述数据标签包括正常用户和窃电用户；

对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据；

基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，所述预设模型基于OS_CNN技术和AutoXGB技术构建；

通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为。

可选地，所述对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据的步骤，包括：

对所述历史用电数据进行分段三次埃尔米特插值，得到差值函数；

基于所述差值函数对所述历史用电数据中的缺失数据进行数据填充，得到填充后的历史用电数据；

对所述填充后的历史用电数据进行标准化处理，得到预处理数据。

可选地，所述基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型的步骤，包括：

将所述预处理数据和带有所述数据标签的历史用电数据组成的数据集按照预设比例划分为原始训练样本集和测试数据集；

通过合成少数类过采样技术和编辑最近邻节点算法对所述原始训练样本集进行样本增强，得到训练数据集；

基于所述训练数据集和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。

可选地，所述基于所述训练数据集和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型的步骤，包括：

通过特征提取网络对所述训练数据集进行特征提取，得到训练数据特征；

将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率；

基于所述训练数据集中每一条数据对应的预测概率和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。

可选地，所述通过特征提取网络对所述训练数据集进行特征提取，得到训练数据特征的步骤，包括：

对预设数量的全尺度卷积神经网络进行堆叠，得到特征提取网络；

通过所述特征提取网络对所述训练数据集进行特征提取，得到训练数据特征。

可选地，所述将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率的步骤，包括：

基于自动超参数优化的极限梯度提升算法构建分类网络，将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率，所述预测概率包括正常用户概率和窃电用户概率。

可选地，所述通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为的步骤，包括：

将所述用电终端在第二检测周期内的用电数据输入至所述窃电行为检测模型中，得到模型输出结果；

基于所述模型输出结果判断所述用电终端是否存在窃电行为，并在所述用电终端存在所述窃电行为时进行警报。

此外，为实现上述目的，本发明还提出一种窃电行为检测装置，所述窃电行为检测装置包括：

标签标记模块，用于获取用电终端在第一检测周期内的历史用电数据，并为所述历史用电数据分配数据标签，所述数据标签包括正常用户和窃电用户；

数据处理模块，用于对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据；

模型构建模块，用于基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，所述预设模型基于OS_CNN技术和AutoXGB技术构建；

窃电检测模块，用于通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为。

此外，为实现上述目的，本发明还提出一种窃电行为检测设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的窃电行为检测程序，所述窃电行为检测程序配置为实现如上文所述的窃电行为检测方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有窃电行为检测程序，所述窃电行为检测程序被处理器执行时实现如上文所述的窃电行为检测方法的步骤。

本发明通过获取用电终端在第一检测周期内的历史用电数据，并为所述历史用电数据分配数据标签，所述数据标签包括正常用户和窃电用户；对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据；基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，所述预设模型基于OS_CNN技术和AutoXGB技术构建；通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为。相比于传统的窃电行为检测方法，由于本发明上述方法通过对基于OS_CNN技术和AutoXGB技术构建后得到的预设模型进行训练和测试，得到窃电行为检测模型，从而能够通过该窃电行为检测模型快速准确地检测到用电终端是否存在窃电行为，进而避免了传统人工检测方法所带来的技术弊端。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的窃电行为检测设备的结构示意图；

图2为本发明窃电行为检测方法第一实施例的流程示意图；

图3为本发明窃电行为检测方法第二实施例的流程示意图；

图4为本发明窃电行为检测方法第三实施例的流程示意图；

图5为本发明窃电行为检测方法中特征提取网络流程示意图；

图6为本发明窃电行为检测方法中窃电行为检测模型示意图；

图7为本发明窃电行为检测方法中分类网络结构示意图；

图8为本发明窃电行为检测方法中窃电行为检测模型在测试集上的混淆矩阵热力示意图；

图9为本发明窃电行为检测装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的窃电行为检测设备结构示意图。

如图1所示，该窃电行为检测设备可以包括：处理器1001，例如中央处理器(Central Processing Unit，CPU)，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity，Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory，RAM)，也可以是稳定的非易失性存储器(Non-Volatile Memory，NVM)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对窃电行为检测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及窃电行为检测程序。

在图1所示的窃电行为检测设备中，网络接口1004主要用于与网络服务器进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明窃电行为检测设备中的处理器1001、存储器1005可以设置在窃电行为检测设备中，所述窃电行为检测设备通过处理器1001调用存储器1005中存储的窃电行为检测程序，并执行本发明实施例提供的窃电行为检测方法。

本发明实施例提供了一种窃电行为检测方法，参照图2，图2为本发明窃电行为检测方法第一实施例的流程示意图。

本实施例中，所述窃电行为检测方法包括以下步骤：

步骤S1：获取用电终端在第一检测周期内的历史用电数据，并为所述历史用电数据分配数据标签，所述数据标签包括正常用户和窃电用户。

需要说明的是，本实施例方法的执行主体可以是具有模型构建、数据处理以及程序运行功能的终端设备，例如智能手机、计算机等，也可以是具有相同或相似功能的电子设备，例如上述窃电行为检测设备。以下以窃电行为检测设备(以下简称检测设备)为例对本实施例及下述各实施例进行说明。

可理解的是，上述用电终端可以是指用电用户所使用的所有需要通过电力运行的终端集合，例如家用电器、移动设备、工业设备、医疗设备等，本实施例对此不加以限制。

应理解的是，上述第一检测周期可以由管理员自行设置，例如24小时、一周、一个月等；上述历史用电数据可以包括电量数据(例如总电量、峰时电量、谷时电量和平时电量等)、用电时间(例如每天的用电时间、每月的用电时间等)、负荷数据(例如最大负荷、平均负荷和最小负荷等)、电压数据(例如电压的实时值、最大值、最小值和平均值等)、电流数据(例如电流的实时值、最大值、最小值和平均值等)、功率因数数据(例如功率因数的实时值、最大值、最小值和平均值等)、异常数据(例如停电、跳闸、故障等)或其他能够反映用电终端用电情况的数据，本实施例对此不加以限制。

步骤S2：对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据。

需要说明的是，上述历史用电数据中的缺失数据可以是历史用电数据中的空值数据。

应理解的是，可以基于以下方法对上述历史用电数据中的缺失数据进行数据预处理，从而得到上述预处理数据。插值法：使用统计方法，如均值、中位数或众数，来估算缺失值。前向填充法或后向填充法：使用前一个非缺失值(前向填充)或后一个非缺失值(后向填充)来填充缺失值。模型预测法：使用其他特征来预测缺失值，可以使用回归、分类或聚类等机器学习模型。均方根误差插值法：使用与缺失值最接近的k个邻居的加权平均值来估算缺失值。多重插补法：利用多轮模型训练，迭代估算缺失值，直到收敛为止。深度学习方法：对于复杂的数据关系，可以使用深度学习方法，如自编码器(Autoencoder)来学习数据的表示并填充缺失值。

步骤S3：基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，所述预设模型基于OS_CNN技术和AutoXGB技术构建。

需要说明的是，上述OS_CNN(Convolutional Neural Network，卷积神经网络)技术为基于对多层全尺寸卷积神经网络进行堆叠的技术，上述AutoXGB技术为一种基于XGBoost(eXtreme Gradient Boosting，极端梯度提升)算法的用于执行特征工程、超参数优化和模型选择等任务的技术。

在具体实现中，可以基于Python的深度学习框架Pytorch框架建立上述预设模型。

步骤S4：通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为。

在具体实现中，可以将上述用电终端中的待检测数据输入至上述窃电行为检测模型中，从而根据模型数据结果判断上述用电终端是否存在窃电行为。

本实施例通过获取用电终端在第一检测周期内的历史用电数据，并为所述历史用电数据分配数据标签，所述数据标签包括正常用户和窃电用户；对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据；基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，所述预设模型基于OS_CNN技术和AutoXGB技术构建；通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为。相比于传统的窃电行为检测方法，由于本实施例上述方法通过对基于OS_CNN技术和AutoXGB技术构建后得到的预设模型进行训练和测试，得到窃电行为检测模型，从而能够通过该窃电行为检测模型快速准确地检测到用电终端是否存在窃电行为，进而避免了传统人工检测方法所带来的技术弊端。

参考图3，图3为本发明窃电行为检测方法第二实施例的流程示意图。

基于上述第一实施例，在本实施例中，为了提升历史用电数据的数据完整性，所述步骤S2，可以包括：

步骤S21：对所述历史用电数据进行分段三次埃尔米特插值，得到差值函数。

在具体实现中，设函数f(x)在节点a＝x₀<x₁<…<x_k-1<…<x_n＝b上的函数y₀,y₁,…,y_k-1,y_k,…,y_n第k个子区间[x_k-1,x_k]对应的函数区间为[y_k-1,y_k]。于是，区间上的三次Hermite(埃尔米特)插值函数P_k(x)可以定义为：

其中，d_k-1,d_k分别表示插值函数P_k(x)在子区间左、右端点的函数值和一阶导数。

如果区间端点函数值已知，则确定插值函数在各节点上的导数是构造区间单调三次Hermite插值函数的关键。对于每一个中间节点k＝1,2,…,n-1相应的导数用左右相邻两个区间的一阶差商进行加权的方式进行近似计算：

d₀＝δ₁,d_n＝δ_n。

步骤S22：基于所述差值函数对所述历史用电数据中的缺失数据进行数据填充，得到填充后的历史用电数据。

步骤S23：对所述填充后的历史用电数据进行标准化处理，得到预处理数据。

在具体实现中，可以基于以下公式对上述填充后的历史用电数据进行标准化处理：

其中，x表示每日用电量数据的向量，x_i表示x的第i天的数据值，μ表示样本x的均值，σ表示样本的标准差。

进一步地，在本实施例中，为了及时对用电终端的窃电行为进行警报，从而尽可能地减少窃电行为所带来的损失，所述步骤S4可以包括：

步骤S41：将所述用电终端在第二检测周期内的用电数据输入至所述窃电行为检测模型中，得到模型输出结果。

需要说明的是，上述第二检测周期可以由管理员自行设置，例如24小时、一周、一个月等。

步骤S42：基于所述模型输出结果判断所述用电终端是否存在窃电行为，并在所述用电终端存在所述窃电行为时进行警报。

在具体实现中，可以通过向管理员发送邮件的方式进行警报，也可以通过扬声器设备向管理员播报的方式进行警报，本实施例对此不加以限制。

本实施例通过对所述历史用电数据进行分段三次埃尔米特插值，得到差值函数；基于所述差值函数对所述历史用电数据中的缺失数据进行数据填充，得到填充后的历史用电数据；对所述填充后的历史用电数据进行标准化处理，得到预处理数据；将所述用电终端在第二检测周期内的用电数据输入至所述窃电行为检测模型中，得到模型输出结果；基于所述模型输出结果判断所述用电终端是否存在窃电行为，并在所述用电终端存在所述窃电行为时进行警报。相较于传统的窃电行为检测方法，本实施例上述方法通过对历史用电数据进行分段三次埃尔米特插值和标准化处理来实现对历史用电数据中缺失数据的数据预处理，从而提升了历史用电数据的数据完整性；同时通过及时对用电终端的窃电行为进行警报，从而减少了已发生的窃电行为所带来的损失。

参考图4，图4为本发明窃电行为检测方法第三实施例的流程示意图。

基于上述各实施例，在本实施例中，所述步骤S3，可以包括：

步骤S31：将所述预处理数据和带有所述数据标签的历史用电数据组成的数据集按照预设比例划分为原始训练样本集和测试数据集。

步骤S32：通过合成少数类过采样技术和编辑最近邻节点算法对所述原始训练样本集进行样本增强，得到训练数据集。

步骤S33：基于所述训练数据集和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。

在具体实现中，可以基于以下步骤对上述原始训练样本集进行样本增强。输入：训练数据集(X_train)由多数类数据样本(X_train_maj)和少数类数据样本(X_train_min)所组成，少数类样本数量(X_train_min)，采样率(N)％，邻近节点数(K)，新生成的少数类样本(x_s)。输出：如果N<100则随机从X_train_min中选择T^*N％个样本，在X_train中找到X_train_min的K个最近邻节点Xinn,nn∈{1,2,…,K}，当x_s<(N/100)*T则任意的从Xinn中选取一个样本Xiab，计算其余当前遍历样本Xicd的向量差，将此差值与0～1之间的随机数相乘，再加上当前遍历样本，得到新的少数类异常数据类样本x_s＝x_icd+(x_iab-x_icd)*rand(0,1)。根据KNN算法，对新生成的数据样本进行预测分类。如果与其K近邻样本的大部分类型相同，则保存该数据，否则删除。最后添加新的样本到原始数据中，返回增强后的数据样本。

进一步地，在本实施例中，所述步骤S33，可以包括：

步骤S331：通过特征提取网络对所述训练数据集进行特征提取，得到训练数据特征。

步骤S332：将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率。

参考图5，图5为本发明窃电行为检测方法中特征提取网络流程示意图。在图5中，Concatenation表示连接层，Batchnorm表示分类网络的加速收敛层Relu表示激活函数，Layer output表示输出层。

在具体实现中，特征提取网络中主要通过一个简单而通用的规则，可以使得一维卷积神经网络自动设置内核选择，以达到覆盖不同时间序列尺度的感受野；该规则来自于哥德巴赫猜想，在哥德巴赫猜想中，任何一个正偶数都可以写成两个素数之和；对此，一层全尺度卷积神经网络使用多层一维卷积神经网络，在其中使用一组素数作为内核的大小，仅在最后一层上使用1和2作为内核大小，从而达到覆盖不同时间序列尺度的感受野。具体的内核选择公式介绍如下：

其中，p⁽ⁱ⁾表示第i层的内核大小。

步骤S333：基于所述训练数据集中每一条数据对应的预测概率和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。

参考图6，图6为本发明窃电行为检测方法中窃电行为检测模型示意图。

进一步地，在本实施例中，所述步骤S331，可以包括：

步骤S3311：对预设数量的全尺度卷积神经网络进行堆叠，得到特征提取网络。

步骤S3312：通过所述特征提取网络对所述训练数据集进行特征提取，得到训练数据特征。

在具体实现中，本发明中特征提取网络使用多层全尺度卷积神经网络构成，最终将训练数据进行特征提取，降低到50维，具体的特征提取网络公式表示如下：

X′_out＝Relu(BatchNormld(Conv_1d(ConstandPad_1d(X_in)))),P⁽ⁱ⁾∈{1,2,3,5,…,p_k}

X”_out＝Relu(BatchNormld(Conv_1d(ConstandPad_1d(X'_out)))),P⁽ⁱ⁾∈{1,2,3,5,…,p_k}

X_out＝Relu(BatchNormld(Conv_1d(ConstandPad_1d(X”_out)))),P⁽ⁱ⁾∈{1,2}

以上公式表示的是一层全尺度卷积神经网络，其中X_in是输入特征提取的数据，在第一层中表示的是输入的数据集样本，在后续层里面表示的是上一层输出的数据特征，P⁽ⁱ⁾表示不同层的卷积神经网络的内核大小，前两层代表的是一个自适应所产生的素数，最后一层上使用1和2作为内核大小，从而达到覆盖不同时间序列尺度的感受野。X′_out，X”_out代表每一层的输出，X_out代表的是一层全尺度卷积神经网络的输出。ConstandPad_1d()代表的是填充操作，Conv_1d()是卷积运算符号，BatchNormld()是归一化操作，Relu()是激活函数符号。本实施例中使用了3层全尺度卷积神经网络的堆叠进行残差连接，从而来对数据集样本进行特征提取和特征降维。

参照图7，图7为本发明窃电行为检测方法中分类网络结构示意图。

参照图8，图8为本发明窃电行为检测方法中窃电行为检测模型在测试集上的混淆矩阵热力示意图。通过图8可见，758次窃电行为中被正确判定为窃电行为的次数为709次，被误判为正常用电行为的次数为49次，漏报率仅为6.4％。在误报率上，7717次正常用电行为中，被误判为窃电行为的次数累计为18次，误报率仅为0.23％。模型整体分类准确率为(7699+709)/(7717+758)＝99.2％。

进一步地，在本实施例中，所述步骤S332，可以包括：

步骤S3321：基于自动超参数优化的极限梯度提升算法构建分类网络，将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率，所述预测概率包括正常用户概率和窃电用户概率。

在具体实现中，可以通过全尺度卷积神经网络的数据集样本进行特征提取，然后将提取到的特征输入到分类网络中，分类网络由自动超参数优化的极限梯度提升(AutoXGB)算法所构成，AutoXGB使用优化的梯度提升增强库(XGBoost)来训练模型，使用Optuna一种为机器学习和深度学习特别设计的自动超参数优化框架来对XGBoost的超参数进行优化。不再需要工程师再次对XGBoost超参数进行优化，节约了优化步骤和时间，且相比较于人工经验的超参数优化，更能寻找到更为合适的超参数，提升模型的性能。

本实施例通过将所述预处理数据和带有所述数据标签的历史用电数据组成的数据集按照预设比例划分为原始训练样本集和测试数据集；通过合成少数类过采样技术和编辑最近邻节点算法对所述原始训练样本集进行样本增强，得到训练数据集；对预设数量的全尺度卷积神经网络进行堆叠，得到特征提取网络；通过所述特征提取网络对所述训练数据集进行特征提取，得到训练数据特征；基于自动超参数优化的极限梯度提升算法构建分类网络，将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率，所述预测概率包括正常用户概率和窃电用户概率；基于所述训练数据集中每一条数据对应的预测概率和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。相较于传统的窃电行为检测方法，由于本实施例上述方法通过对基于OS_CNN技术和AutoXGB技术构建后得到的预设模型进行训练和测试，得到窃电行为检测模型，从而能够通过该窃电行为检测模型快速准确地检测到用电终端是否存在窃电行为，进而避免了传统人工检测方法所带来的技术弊端。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有窃电行为检测程序，所述窃电行为检测程序被处理器执行时实现如上文所述的窃电行为检测方法的步骤。

参照图9，图9为本发明窃电行为检测装置第一实施例的结构框图。

如图9所示，本发明实施例提出的窃电行为检测装置包括：

标签标记模块901，用于获取用电终端在第一检测周期内的历史用电数据，并为所述历史用电数据分配数据标签，所述数据标签包括正常用户和窃电用户；

数据处理模块902，用于对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据；

模型构建模块903，用于基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型，所述预设模型基于OS_CNN技术和AutoXGB技术构建；

窃电检测模块904，用于通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为。

基于本发明上述窃电行为检测装置的第一实施例，提出本发明窃电行为检测装置的第二实施例。

在本实施例中，所述数据处理模块902，还用于对所述历史用电数据进行分段三次埃尔米特插值，得到差值函数；基于所述差值函数对所述历史用电数据中的缺失数据进行数据填充，得到填充后的历史用电数据；对所述填充后的历史用电数据进行标准化处理，得到预处理数据。

进一步地，所述模型构建模块903，还用于将所述预处理数据和带有所述数据标签的历史用电数据组成的数据集按照预设比例划分为原始训练样本集和测试数据集；通过合成少数类过采样技术和编辑最近邻节点算法对所述原始训练样本集进行样本增强，得到训练数据集；基于所述训练数据集和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。

进一步地，所述模型构建模块903，还用于通过特征提取网络对所述训练数据集进行特征提取，得到训练数据特征；将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率；基于所述训练数据集中每一条数据对应的预测概率和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型。

进一步地，所述模型构建模块903，还用于对预设数量的全尺度卷积神经网络进行堆叠，得到特征提取网络；通过所述特征提取网络对所述训练数据集进行特征提取，得到训练数据特征。

进一步地，所述模型构建模块903，还用于基于自动超参数优化的极限梯度提升算法构建分类网络，将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率，所述预测概率包括正常用户概率和窃电用户概率。

进一步地，所述窃电检测模块904，还用于将所述用电终端在第二检测周期内的用电数据输入至所述窃电行为检测模型中，得到模型输出结果；基于所述模型输出结果判断所述用电终端是否存在窃电行为，并在所述用电终端存在所述窃电行为时进行警报。

本发明窃电行为检测装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种窃电行为检测方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1所述的窃电行为检测方法，其特征在于，所述对所述历史用电数据中的缺失数据进行数据预处理，得到预处理数据的步骤，包括：

3.如权利要求1所述的窃电行为检测方法，其特征在于，所述基于所述预处理数据和带有所述数据标签的历史用电数据对预设模型进行训练和测试，得到窃电行为检测模型的步骤，包括：

4.如权利要求3所述的窃电行为检测方法，其特征在于，所述基于所述训练数据集和所述测试数据集对预设模型进行训练和测试，得到窃电行为检测模型的步骤，包括：

5.如权利要求4所述的窃电行为检测方法，其特征在于，所述通过特征提取网络对所述训练数据集进行特征提取，得到训练数据特征的步骤，包括：

6.如权利要求5所述的窃电行为检测方法，其特征在于，所述将所述训练数据特征输入至分类网络中进行分类任务预测，得到所述训练数据集中每一条数据对应的预测概率的步骤，包括：

7.如权利要求1所述的窃电行为检测方法，其特征在于，所述通过所述窃电行为检测模型检测所述用电终端是否存在窃电行为的步骤，包括：

8.一种窃电行为检测装置，其特征在于，所述窃电行为检测装置包括：

9.一种窃电行为检测设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的窃电行为检测程序，所述窃电行为检测程序配置为实现如权利要求1至7中任一项所述的窃电行为检测方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有窃电行为检测程序，所述窃电行为检测程序被处理器执行时实现如权利要求1至7中任一项所述的窃电行为检测方法的步骤。