CN121030552B - 一种基于智能电表数据的窃电检测方法及系统 - Google Patents

一种基于智能电表数据的窃电检测方法及系统

Info

Publication number
CN121030552B
CN121030552B CN202511545997.3A CN202511545997A CN121030552B CN 121030552 B CN121030552 B CN 121030552B CN 202511545997 A CN202511545997 A CN 202511545997A CN 121030552 B CN121030552 B CN 121030552B
Authority
CN
China
Prior art keywords
user
electricity
data
users
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202511545997.3A
Other languages
English (en)
Other versions
CN121030552A (zh
Inventor
邹继东
吴晓彦
史寅东
张玉姣
马烨
邵方静
孙靓
孙刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Caio Million Hong Electronics Co ltd
Marketing Service Center of State Grid Shaanxi Electric Power Co Ltd
Original Assignee
Jiangsu Caio Million Hong Electronics Co ltd
Marketing Service Center of State Grid Shaanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Caio Million Hong Electronics Co ltd, Marketing Service Center of State Grid Shaanxi Electric Power Co Ltd filed Critical Jiangsu Caio Million Hong Electronics Co ltd
Priority to CN202511545997.3A priority Critical patent/CN121030552B/zh
Publication of CN121030552A publication Critical patent/CN121030552A/zh
Application granted granted Critical
Publication of CN121030552B publication Critical patent/CN121030552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R22/00Arrangements for measuring time integral of electric power or current, e.g. electricity meters
    • G01R22/06Arrangements for measuring time integral of electric power or current, e.g. electricity meters by electronic methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2337Non-hierarchical techniques using fuzzy logic, i.e. fuzzy clustering
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Automation & Control Theory (AREA)
  • Fuzzy Systems (AREA)
  • Power Engineering (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Burglar Alarm Systems (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明提供一种基于智能电表数据的窃电检测方法及系统,涉及窃电检测技术领域,方法包括:获取检测区域中各个变压器侧的观察表数据和多个用户的用电数据,并通过对比分析法,确定疑似窃电区域;根据疑似窃电区域中的各个观察表数据和对应的各个用电数据,确定各个用户的比率剖面序列并提取频域特征;基于频域特征,通过聚类算法对各个用户进行分组,得到多个不同的用电模式组别;计算各个用户对各个用电模式组别的隶属度,并根据各个隶属度,计算各个用户的异常得分;若异常得分大于预设异常得分,将用户判定为疑似窃电用户,并根据疑似窃电用户的频域特征,通过基于随机森林的窃电检测模型,确定窃电用户;否则,将用户判定为正常用户。

Description

一种基于智能电表数据的窃电检测方法及系统
技术领域
本发明涉及窃电检测技术领域,特别是指一种基于智能电表数据的窃电检测方法及系统。
背景技术
随着智能电网与物联网技术的快速发展,智能电表作为电力系统的重要终端设备,已在居民、商业和工业用电场景中广泛应用。智能电表能够实现对用电数据的实时采集、远程抄表及双向通信,为电力公司提供精准的用户负荷信息与能耗特征。然而,在智能电表广泛部署的同时,窃电行为仍然屡禁不止,不仅造成了电力企业的经济损失,还威胁到电网运行的安全与稳定。因此,如何基于智能电表采集的大数据实现对异常用电行为的自动识别与窃电检测,成为电力信息化领域的重要研究方向。
随着智能电表和大数据技术的发展,基于数据驱动的智能分析方法逐渐成为研究热点。这类方法利用机器学习或深度学习算法,对智能电表采集的时序用电数据进行特征提取和建模分析,通过分类或聚类模型识别异常用户,从而实现窃电行为的自动检测。该类方法较传统规则法更具自适应性和精度,能够从大量数据中挖掘潜在的非线性特征,为电力企业提供更高效的风险识别手段。
然而,现有技术通常仅从单一维度对可疑用户进行判断,未能充分考虑变压器侧与用户侧之间的关联关系,导致可疑区域的定位精度较低。同时,现有的检测结果多依赖静态阈值或固定分类模型,缺乏对不同用户与异常群体之间关系的量化分析,无法在聚类层面实现检测策略的自适应调整,从而使异常判定的准确性和可靠性受到限制。
发明内容
为了解决现有技术通常仅从单一维度对可疑用户进行判断,未能充分考虑变压器侧与用户侧之间的关联关系,导致可疑区域的定位精度较低。同时,现有的检测结果多依赖静态阈值或固定分类模型,缺乏对不同用户与异常群体之间关系的量化分析,无法在聚类层面实现检测策略的自适应调整,从而使异常判定的准确性和可靠性受到限制的技术问题,本发明提供了一种基于智能电表数据的窃电检测方法及系统。
本发明实施例提供的技术方案如下:
第一方面:
本发明实施例提供的一种基于智能电表数据的窃电检测方法,包括:
S1:获取检测区域中各个变压器侧的观察表数据和多个用户的用电数据;
S2:基于各个所述观察表数据和各个所述用电数据,通过对比分析法,确定疑似窃电区域;
S3:根据所述疑似窃电区域中的各个所述观察表数据和对应的各个所述用电数据,确定各个所述用户的比率剖面序列;
S4:提取各个所述比率剖面序列的频域特征;
S5:基于所述频域特征,通过聚类算法对各个所述用户进行分组,得到多个不同的用电模式组别;
S6:计算各个所述用户对各个所述用电模式组别的隶属度,并根据各个所述隶属度,计算各个所述用户的异常得分;
S7:判断各个所述用户的异常得分是否大于预设异常得分;若是,将所述用户判定为疑似窃电用户,进入S8;否则,将所述用户判定为正常用户;
S8:根据所述疑似窃电用户的频域特征,通过基于随机森林的窃电检测模型,确定窃电用户。
第二方面:
本发明实施例提供的一种基于智能电表数据的窃电检测系统,包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如第一方面所述的基于智能电表数据的窃电检测方法。
第三方面:
本发明实施例提供的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的基于智能电表数据的窃电检测方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
在本发明中,通过引入变压器侧的观察表数据与用户侧的用电数据进行联合分析,建立了供电端与用电端之间的能量传输关联关系,从而增强了对用电异常区域的定位能力。通过对用户频域特征进行聚类分析,构建多个用电模式组别,并基于隶属度函数对用户在各组别中的归属程度进行量化,进而建立用户个体与不同用电行为群体之间的关联模型。同时,进一步结合自适应的异常得分机制以及加法树模型实现最终的智能判定,有效突破了对静态阈值或固定分类模型的依赖,显著提升了检测结果的准确性与可靠性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于智能电表数据的窃电检测方法的流程示意图。
图2为本发明实施例提供的一种基于智能电表数据的窃电检测系统的结构示意图。
具体实施方式
下面结合附图,对本发明中的技术方案进行描述。
在本发明实施例中,“示例地”、“例如”等词用于表示作例子、例证或说明。本发明中被描述为“示例”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用示例的一词旨在以具体方式呈现概念。此外,在本发明实施例中,“和/或”所表达的含义可以是两者都有,或者可以是两者任选其一。
本发明实施例中,“图像”,“图片”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。 “相应的(corresponding,relevant)”和“对应的(corresponding)”有时可以混用,应当指出的是,在不强调其区别时,其所要表达的含义是一致的。
本发明实施例中,有时候下标如W1可能会写为非下标的形式如W1,在不强调其区别时,其所要表达的含义是一致的。
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
参考说明书附图1,示出了本发明实施例提供的一种基于智能电表数据的窃电检测方法的流程示意图。
本发明实施例提供了一种基于智能电表数据的窃电检测方法,该方法可由基于智能电表数据的窃电检测设备实现,该基于智能电表数据的窃电检测设备可以是终端或服务器。基于智能电表数据的窃电检测方法的处理流程可以包括如下的步骤:
S1:获取检测区域中各个变压器侧的观察表数据和多个用户的用电数据。
在一种可能的实施方式中,S1具体包括:
S101:在检测区域中的各个变压器侧部署观察电表,获取多个观察表数据。
其中,观察电表(Observer Meter)是一种安装在配电变压器出线侧的高精度计量设备,用于实时监测整个供电台区或配电区域的总供电量。与普通用户电表不同,观察电表并不针对单个用户计量,而是对某一变压器下所有用户的总能量输出进行汇总计量。
S102:通过用户安装的智能电表,获取各个变压器侧的多个用户的用电数据。
其中,智能电表(Smart Meter)是一种具备自动计量、远程通信与数据管理功能的用户端电能计量设备。与传统机械式电表不同,智能电表能够以固定时间间隔(如每 15 分钟或每小时)自动采集用户的用电量、电压、电流等信息,并通过无线或有线通信方式上传至数据集中器或主站系统。
具体而言,在每个检测区域的变压器出线侧安装观察电表(Observer Meter),该电表能够实时记录该区域在一定时间间隔内(例如每15分钟或1小时)的总供电量数据。观察表的数据包含时间戳、电能读数及线路编号等信息,用于反映该区域的整体供电负荷情况。同时,在该变压器供电范围内的每个用户端安装或接入智能电表(Smart Meter)。智能电表能够自动采集并上传用户在同一时间间隔内的实际用电量数据。进而得到各个变压器侧的观察表数据和多个用户的用电数据。
S2:基于各个观察表数据和各个用电数据,通过对比分析法,确定疑似窃电区域。
需要说明的是,对比分析法是一种基于能量守恒原理的异常检测方法,常用于配电网的窃电识别与能耗分析中。该方法通过对比同一供电区域内不同层级的电能计量数据,判断是否存在异常损耗或计量偏差。
在一种可能的实施方式中,S2具体包括:
S201:对各个变压器侧所对应的各个用户的用电数据进行求和,得到多个用户总用电数据。
S202:基于各个变压器侧的观察表数据和对应的用户总用电数据,计算用电误差值:
其中,表示在第t个时间段的用电误差值,表示第t个时间段的观察表数据,n表示用户总数,表示第i个用户在第t个时间段的用电量,表示用户总用电数据量。
S203:计算各个变压器侧对应的动态用电误差阈值:
其中,表示动态用电误差阈值,表示同一变压器侧的历史用电误差值的平均值,表示动态系数,表示同一变压器侧的历史用电误差值的标准差。
S204:判断各个用电误差值是否小于对应的动态用电误差阈值。若是,返回S1,等待下一轮检测。否则,将变压器侧对应的供电区域标记为疑似窃电区域。
在本发明实施例中,通过对变压器侧观察表数据与各用户智能电表数据进行能量差分计算,可以准确反映配电台区的供用电平衡状况,从而实现对异常损耗的实时识别。同时,所引入的动态阈值根据历史误差的均值和标准差自适应调整,可自动适应季节变化、负荷波动等运行环境差异,减少误报与漏报情况,能准确的识别出疑似窃电区域。
S3:根据疑似窃电区域中的各个观察表数据和对应的各个用电数据,确定各个用户的比率剖面序列。
需要说明的是,比率剖面序列是一种用于表征用户相对用电行为的特征序列,通过消除整体负荷波动对个体用电数据的影响,从而更准确地反映用户自身的用电特征。
在一种可能的实施方式中,S3具体包括:
S301:根据疑似窃电区域中的观察表数据和各个用电数据,计算比率剖面值:
其中,表示比率剖面值即第i个用户在第t个时间段的用电量占第t个时间段的整个疑似窃电区域总用电量的比例,表示疑似窃电区域中第i个用户在第t个时间段的用电量,表示疑似窃电区域中变压器侧在第t个时间段的观察表数据。
S302:根据各个比率剖面值,提取各个用户的比率剖面序列:
其中,表示第i个用户的比率剖面序列,表示第i个用户在第t个时间段的用电量占第t时间段内整个疑似窃电区域总用电量的比例,t=1,2,…T,T表示时间段总数。
在本发明实施例中,以变压器侧观察表数据作为区域总供电量的参考基准,将各用户在相同时段的用电量与该总量进行归一化比值计算,形成时间序列式的比率剖面。该特征不仅能够抵消因季节、气候或用电需求变化所导致的整体负荷波动,还能突出个体用户在相对比例上的异常变化特征,从而增强后续特征提取与聚类分析的稳定性和可比性。通过比率剖面序列的构建,系统可实现跨时间段、跨区域的用电行为对比,为后续频域特征提取与窃电模式识别提供更加鲁棒和标准化的输入数据。
S4:提取各个比率剖面序列的频域特征。
在一种可能的实施方式中,S4具体包括:
S401:通过db1小波基,对各个用户的比率剖面序列进行4层离散小波变换分解。
其中,db1小波基(Daubechies1小波基)是一种常用的离散小波变换基函数,由Ingrid Daubechies提出,属于小波族中最简单的形式。
需要说明的是,db1小波基能有效提取时序信号的低频趋势与高频突变特征,适用于用电数据这类具有明显周期性与局部波动特征的时间序列分析,因此常用于用户用电行为的频域特征提取与异常检测中。
S402:在每一个分解层中,分别使用低通滤波器和高通滤波器对上一层的近似系数进行卷积和下采样,得到各层的低频成分和高频成分:
其中,表示第p层的低频成分,v表示下采样后的系数索引,w表示离散时间索引,表示低通滤波器系数,表示第p-1层的低频成分,表示p层的高频成分,表示高通滤波器系数。
S403:提取各个比率剖面序列的第4层低频成分,并对各个第4层低频成分进行归一化处理,得到各个比率剖面序列的频域特征。
具体而言,在本阶段,通过离散小波变换(DWT)提取用户比率剖面序列的频域特征。首先选用db1小波基(对每个用户的比率剖面序列进行四层分解,依次分离出不同尺度的低频与高频成分。在分解过程中,系统分别利用低通滤波器和高通滤波器对信号进行卷积与下采样,得到各层的近似系数和细节系数。最后,提取第4层近似系数(低频成分)并进行归一化处理,形成用户的频域特征向量。该特征能够保留用户长期稳定的用电规律,同时过滤短期波动,为后续聚类与异常检测提供稳定可靠的输入数据。
需要说明的是,选择第4层低频成分作为比率剖面序列的频域特征,主要是为了在分辨率与平滑度之间取得平衡。离散小波变换的每一层分解都会将信号的时间分辨率降低一倍、频率分辨率提高一倍,分解层数越高,得到的低频成分越平滑,代表的时间尺度越长。若分解层数过低(如1~2层),信号中仍包含较多短期波动与噪声,不利于反映用户长期用电规律。而分解层数过高,则可能导致特征过度平滑,丢失细节信息。经实验验证,在对日级或小时级用电序列进行分析时,四层分解能够较好地保留用户长期用电趋势,同时有效抑制异常尖峰、短时突变等高频干扰,因此选取第4层低频成分作为最终的频域特征向量,既能反映典型用电模式,又能保持较高的特征区分度。
在本发明实施例中,采用db1小波基对比率剖面序列进行四层离散小波分解,并提取第4层低频成分作为频域特征,能够有效分离用户用电数据中的长期趋势与短期波动,从而提高特征的稳定性与抗干扰能力。同时,多层分解结构可将用户的比率剖面序列分解为不同尺度的频率分量,其中高频部分反映短期波动或突变行为,低频部分则反映长期用电规律,通过提取第4层低频成分并进行归一化处理,可以有效保留用户长期用电模式特征,消除异常波动、计量误差或随机噪声对检测结果的影响。
S5:基于频域特征,通过聚类算法对各个用户进行分组,得到多个不同的用电模式组别。
其中,聚类算法是一种无监督学习方法,用于根据样本间的相似性或距离关系,将数据自动划分为若干组(即簇),使得同一簇内的数据具有较高的相似度,而不同簇之间的差异较大。
可选地,聚类算法采用模糊C均值算法。
在一种可能的实施方式中,S5具体包括:
S501:初始化聚类参数,其中,聚类参数包括聚类数、模糊指数、隶属度变化阈值以及最大迭代次数。
S502:构建聚类目标函数:
其中,J表示聚类目标函数值,n表示用户总数,c表示聚类数即簇数,表示第i个用户在更新簇时的加权贡献,ε=2表示模糊指数,表示欧几里得距离的平方,表示第i个用户的频域特征向量,表示第j个簇的中心向量。
S503:以最小化聚类目标函数为目标,迭代更新各个用户的隶属度和聚类中心:
其中,表示第i个用户对第j个簇的隶属度,k表示聚类索引,表示第k个簇。
S504:在各个用户中的最大隶属度变化量小于隶属度变化阈值或者当前迭代次数达到最大迭代次数的情况下,停止迭代,完成用电模式组别的聚类。
S505:计算各个用户的轮廓系数,并根据各个轮廓系数,计算平均轮廓系数。
S506:判断平均轮廓系数是否大于预设轮廓系数。若是,判定聚类结果有效,进入S507。否则,返回S501,重新聚类。
需要说明的是,本领域技术人员可以根据实际需要自行设置预设轮廓系数的大小,本发明在此不做限定。
S507:将更新后的各个聚类中心定义为不同的用电模式组别。
S508:利用最大隶属度原则,将各个用户划分至对应的用电模式组别中。
具体而言,在本阶段,通过对用户的频域特征进行聚类分析,实现不同用电模式的自动识别。系统首先根据提取的用户频域特征向量,初始化聚类数、模糊指数、隶属度变化阈值和最大迭代次数等参数。随后,采用模糊C均值算法进行聚类,通过最小化目标函数迭代更新用户隶属度和聚类中心,直到结果收敛。完成聚类后,系统计算轮廓系数以评估聚类质量,若结果有效,则将聚类中心定义为典型用电模式组别,并依据最大隶属度原则将用户划分至相应组别中。该过程可将具有相似用电特征的用户归为一类,为后续异常得分计算和窃电用户识别提供基础数据支持。
在本发明实施例中,利用模糊C均值(FCM)算法,根据用户频域特征之间的相似性,将用户划分为多个不同的用电模式组别,与传统硬聚类不同,FCM允许用户同时隶属于多个簇,并通过隶属度值反映其用电特征的模糊程度,更符合实际电力用户行为的复杂性。同时,通过迭代优化目标函数,可使同组内用户特征更为接近,不同组别之间差异更加明显,从而提升分组结果的区分度。
进一步地,通过轮廓系数对聚类质量进行验证,可自动判断聚类是否合理,保证最终结果的稳定性与可信度。
S6:计算各个用户对各个用电模式组别的隶属度,并根据各个隶属度,计算各个用户的异常得分。
其中,用电模式组别的隶属度表示用户在不同用电模式中的相似程度,是连接“聚类分组”和“异常识别”的关键量化指标。
在一种可能的实施方式中,S6具体包括:
S601:根据聚类结果,获取各个用户对各个聚类中心的隶属度。
S602:根据各个隶属度,计算各个用户在高用电簇和低用电簇中的加权平均用电量:
其中,表示第j个簇的加权平均用电量,n表示用户总数,表示第i个用户对第j个簇的隶属度,表示第i个用户的实际用电量,表示高用电簇,表示低用电簇。
S603:基于各个加权平均用电量,计算各个用户的异常得分:
其中,表示第i个用户的异常得分,表示用户在高用电簇中的加权平均用电量,表示用户在低用电簇中的加权平均用电量。
在本发明实施例中,利用模糊聚类的隶属度信息,本发明能够综合反映用户在高用电簇与低用电簇中的相似性程度,通过加权平均计算得到各簇的典型用电水平,实现用户行为的软判定,而非单一阈值判断,该机制考虑了用户在不同模式间的模糊边界,使得异常检测更符合实际用电特征分布。同时,通过计算异常得分能够定量描述用户相对于正常高用电模式的偏离程度,当用户的用电量显著低于其应属于的正常模式时,异常得分将明显升高,从而直观反映潜在的窃电或异常计量行为。
S7:判断各个用户的异常得分是否大于预设异常得分。若是,将用户判定为疑似窃电用户,进入S8。否则,将用户判定为正常用户。
需要说明的是,本领域技术人员可以根据实际需要自行设置预设异常得分的大小,本发明在此不做限定。
S8:根据疑似窃电用户的频域特征,通过基于随机森林的窃电检测模型,确定窃电用户。
在一种可能的实施方式中,S8具体包括:
S801:基于已知标签的历史频域特征数据,构建原始数据集。
S802:随机从原始数据集中选择多个自助样本。其中,每个自助样本包含多个样本数据。
S803:基于各个自助样本,构建多棵决策树:
其中,表示第b棵决策树在输入数据x上的预测值,x表示输入数据点,hb表示第b棵决策树的树结构,M表示决策树中的叶子节点总数,μm表示第m个叶子节点中所有样本的目标值的平均值,Rm表示第m个叶子节点的样本集I( )表示指示函数,表示样本x属于叶子节点Rm表示样本x不属于叶子节点Rm
在一种可能的实施方式中,S803具体包括:
S8031:在自助样本中选择多个分裂变量。
S8032:在各个分裂变量中选择分割点,并基于分割点将各个分裂变量分割为左右两个子集。
S8033:以最小化每个子集的残差平方和为目标,确定最佳分裂点:
其中,min表示最小化,μ1表示左子集中目标变量的均值,xi表示第i个样本的特征向量,R1表示分裂后的左子集,yi表示第i个样本的目标变量,μ2表示右子集中目标变量的均值,R2表示分裂后的右子集,j表示特征,s表示分裂点。
需要说明的是,当某一特征被选作节点分裂变量时,其分裂可带来残差平方和下降的幅度;该下降量反映了该特征对分类结果的贡献程度。模型在所有决策树中累计并平均各个特征的分裂贡献度,便可得到各个特征的重要性得分。通过这种方式,系统能够自动识别对窃电行为影响较大的关键特征,如频域波动幅度、用电稳定性指标或聚类隶属度变化等,从而提高模型的可解释性与透明度。
S8034:根据最佳分裂点,将当前节点分割为左子节点和右子节点,并对左子节点以及右子节点递归执行S8031至S8034。
S8035:当自助样本中的样本数据数量低于预设样本数据数量或树的深度达到最大深度时,停止分裂,完成各棵决策树的构建。
S804:组合各棵决策树,构建窃电检测模型:
其中,表示随机森林对输入数据x的最终预测值,B表示随机森林中树的总数,x表示输入数据点,hb表示第b棵决策树的树结构,表示第b棵决策树在输入数据x上的预测值。
S805:将各个频域特征输入至窃电检测模型,确定窃电用户。
具体而言,通过随机森林模型对疑似窃电用户进行最终判定。首先,系统利用已标注的历史用户频域特征数据构建训练数据集,并随机选取多个自助样本用于训练多棵决策树。每棵决策树在不同的样本和特征子集上独立训练,生成相应的树结构模型。决策树在节点分裂时以最小化残差平方和为目标,选择最优分裂特征和分裂点,从而提升分类精度。所有决策树训练完成后,系统将它们进行集成,形成随机森林模型。对于新的输入样本(即疑似窃电用户的特征向量),模型会将其输入至每棵决策树中进行预测,并对所有树的输出结果取平均得到最终预测值。该预测值可视为用户存在窃电行为的概率。概率大于预设阈值时,系统将该用户判定为窃电用户,否则判定为正常用户。
在本发明实施例中,随机森林模型通过自助采样构建多棵相互独立的决策树,并采用投票或平均的方式输出最终预测结果,能够有效减少单棵决策树的过拟合风险。每棵树在不同特征子集和样本子集上训练,使模型具备较强的随机性与鲁棒性,从而在面对复杂的用户用电特征分布时仍能保持高精度的识别能力。同时,在模型训练阶段,随机森林通过在每个节点分裂时以最小化残差平方和为目标,评估不同特征的分裂贡献度,从而建立特征重要性评估机制,能够实现更稳定的分类判定,显著降低误报与漏报率,提升窃电用户识别的准确性。
本发明实施例提供的技术方案带来的有益效果至少包括:
在本发明中,通过引入变压器侧的观察表数据与用户侧的用电数据进行联合分析,建立了供电端与用电端之间的能量传输关联关系,从而增强了对用电异常区域的定位能力。通过对用户频域特征进行聚类分析,构建多个用电模式组别,并基于隶属度函数对用户在各组别中的归属程度进行量化,进而建立用户个体与不同用电行为群体之间的关联模型。同时,进一步结合自适应的异常得分机制以及加法树模型实现最终的智能判定,有效突破了对静态阈值或固定分类模型的依赖,显著提升了检测结果的准确性与可靠性。
参考说明书附图2,示出了本发明提供的一种基于智能电表数据的窃电检测系统的结构示意图。
本发明还提供一种基于智能电表数据的窃电检测系统20,应用于上述的基于智能电表数据的窃电检测方法,包括:
处理器201。
存储器202,存储器202上存储有计算机可读指令,计算机可读指令被处理器201执行时,实现如方法实施例的基于智能电表数据的窃电检测方法。
本发明提供的基于智能电表数据的窃电检测系统20能够执行上述的基于智能电表数据的窃电检测方法,并实现相同或相似的技术效果,为避免重复,本发明不再赘述。
应理解,在本发明实施例中的处理器可以是中央处理单元(central processingunit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signalprocessor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
还应理解,本发明实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random accessmemory,RAM)可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
上述实施例,可以全部或部分地通过软件、硬件(如电路)、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质。半导体介质可以是固态硬盘。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系,但也可能表示的是一种“和/或”的关系,具体可参考前后文进行理解。
本发明中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a, b, c, a-b, a-c, b-c, 或a-b-c,其中a,b,c可以是单个,也可以是多个。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如方法实施例所述的基于智能电表数据的窃电检测方法。
本发明提供的一种计算机可读存储介质可以实现上述方法实施例的基于智能电表数据的窃电检测方法的步骤和效果,为避免重复,本发明不再赘述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
有以下几点需要说明:
(1)本发明实施例附图只涉及到与本发明实施例涉及到的结构,其他结构可参考通常设计。
(2)为了清晰起见,在用于描述本发明的实施例的附图中,层或区域的厚度被放大或缩小,即这些附图并非按照实际的比例绘制。可以理解,当诸如层、膜、区域或基板之类的元件被称作位于另一元件“上”或“下”时,该元件可以“直接”位于另一元件“上”或“下”或者可以存在中间元件。
(3)在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合以得到新的实施例。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种基于智能电表数据的窃电检测方法,其特征在于,包括:
S1:获取检测区域中各个变压器侧的观察表数据和多个用户的用电数据;
S2:基于各个所述观察表数据和各个所述用电数据,通过对比分析法,确定疑似窃电区域;
S3:根据所述疑似窃电区域中的各个所述观察表数据和对应的各个所述用电数据,确定各个所述用户的比率剖面序列;
S4:提取各个所述比率剖面序列的频域特征;
S5:基于所述频域特征,通过聚类算法对各个所述用户进行分组,得到多个不同的用电模式组别;
S6:计算各个所述用户对各个所述用电模式组别的隶属度,并根据各个所述隶属度,计算各个所述用户的异常得分;
S7:判断各个所述用户的异常得分是否大于预设异常得分;若是,将所述用户判定为疑似窃电用户,进入S8;否则,将所述用户判定为正常用户;
S8:根据所述疑似窃电用户的频域特征,通过基于随机森林的窃电检测模型,确定窃电用户;
其中,所述S4具体包括:
S401:通过db1小波基,对各个所述用户的比率剖面序列进行4层离散小波变换分解;
S402:在每一个分解层中,分别使用低通滤波器和高通滤波器对上一层的近似系数进行卷积和下采样,得到各层的低频成分和高频成分;
S403:提取各个所述比率剖面序列的第4层低频成分,并对各个所述第4层低频成分进行归一化处理,得到各个所述比率剖面序列的频域特征;
其中,所述S5具体包括:
S501:初始化聚类参数,其中,所述聚类参数包括聚类数、模糊指数、隶属度变化阈值以及最大迭代次数;
S502:构建聚类目标函数;
S503:以最小化所述聚类目标函数为目标,迭代更新各个所述用户的隶属度和聚类中心;
S504:在各个所述用户中的最大隶属度变化量小于所述隶属度变化阈值或者当前迭代次数达到所述最大迭代次数的情况下,停止迭代,完成所述用电模式组别的聚类;
S505:计算各个所述用户的轮廓系数,并根据各个所述轮廓系数,计算平均轮廓系数;
S506:判断所述平均轮廓系数是否大于预设轮廓系数;若是,判定聚类结果有效,进入S507;否则,返回S501,重新聚类;
S507:将更新后的各个所述聚类中心定义为不同的用电模式组别;
S508:利用最大隶属度原则,将各个所述用户划分至对应的所述用电模式组别中。
2.根据权利要求1所述的基于智能电表数据的窃电检测方法,其特征在于,所述S1具体包括:
S101:在所述检测区域中的各个变压器侧部署观察电表,获取多个所述观察表数据;
S102:通过用户安装的智能电表,获取各个变压器侧的多个所述用户的用电数据。
3.根据权利要求1所述的基于智能电表数据的窃电检测方法,其特征在于,所述S2具体包括:
S201:对各个变压器侧所对应的各个所述用户的用电数据进行求和,得到多个用户总用电数据;
S202:基于各个变压器侧的观察表数据和对应的所述用户总用电数据,计算用电误差值;
S203:计算各个变压器侧对应的动态用电误差阈值;
S204:判断各个所述用电误差值是否小于对应的所述动态用电误差阈值;若是,返回S1,等待下一轮检测;否则,将所述变压器侧对应的供电区域标记为所述疑似窃电区域。
4.根据权利要求1所述的基于智能电表数据的窃电检测方法,其特征在于,所述S3具体包括:
S301:根据所述疑似窃电区域中的观察表数据和各个所述用电数据,计算比率剖面值;
S302:根据各个所述比率剖面值,提取各个所述用户的比率剖面序列。
5.根据权利要求1所述的基于智能电表数据的窃电检测方法,其特征在于,所述S6具体包括:
S601:根据聚类结果,获取各个所述用户对各个聚类中心的隶属度;
S602:根据各个所述隶属度,计算各个所述用户在高用电簇和低用电簇中的加权平均用电量;
S603:基于各个所述加权平均用电量,计算各个所述用户的异常得分。
6.根据权利要求1所述的基于智能电表数据的窃电检测方法,其特征在于,所述S8具体包括:
S801:基于已知标签的历史频域特征数据,构建原始数据集;
S802:随机从所述原始数据集中选择多个自助样本;其中,每个所述自助样本包含多个样本数据;
S803:基于各个所述自助样本,构建多棵决策树;
S804:组合各棵所述决策树,构建所述窃电检测模型;
S805:将各个所述频域特征输入至所述窃电检测模型,确定所述窃电用户。
7.根据权利要求6所述的基于智能电表数据的窃电检测方法,其特征在于,所述S803具体包括:
S8031:在所述自助样本中选择多个分裂变量;
S8032:在各个所述分裂变量中选择分割点,并基于所述分割点将各个所述分裂变量分割为左右两个子集;
S8033:以最小化每个所述子集的残差平方和为目标,确定最佳分裂点;
S8034:根据所述最佳分裂点,将当前节点分割为左子节点和右子节点,并对所述左子节点以及所述右子节点递归执行S8031至S8034;
S8035:当所述自助样本中的样本数据数量低于预设样本数据数量或树的深度达到最大深度时,停止分裂,完成各棵所述决策树的构建。
8.一种基于智能电表数据的窃电检测系统,其特征在于,包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至7中任一项所述的基于智能电表数据的窃电检测方法。
CN202511545997.3A 2025-10-28 2025-10-28 一种基于智能电表数据的窃电检测方法及系统 Active CN121030552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202511545997.3A CN121030552B (zh) 2025-10-28 2025-10-28 一种基于智能电表数据的窃电检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202511545997.3A CN121030552B (zh) 2025-10-28 2025-10-28 一种基于智能电表数据的窃电检测方法及系统

Publications (2)

Publication Number Publication Date
CN121030552A CN121030552A (zh) 2025-11-28
CN121030552B true CN121030552B (zh) 2026-01-23

Family

ID=97776369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202511545997.3A Active CN121030552B (zh) 2025-10-28 2025-10-28 一种基于智能电表数据的窃电检测方法及系统

Country Status (1)

Country Link
CN (1) CN121030552B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358838A1 (en) * 2013-06-04 2014-12-04 International Business Machines Corporation Detecting electricity theft via meter tampering using statistical methods
CN112884000A (zh) * 2021-01-15 2021-06-01 国网河南省电力公司营销服务中心 一种基于数据挖掘的用电检查智能诊断方法及诊断系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113850296A (zh) * 2021-08-31 2021-12-28 国网湖南省电力有限公司 一种基于fcm算法的终端窃电检测方法、系统、设备及可读存储介质
CN114610706B (zh) * 2022-03-23 2024-10-15 广东电网有限责任公司 基于过采样和改进随机森林的窃电检测方法、系统及装置
CN118822571B (zh) * 2024-08-07 2025-05-06 广东电网有限责任公司信息中心 一种电力营销稽查粒度预警管控方法
CN119538144B (zh) * 2024-10-30 2025-11-18 国网河北省电力有限公司营销服务中心 基于神经网络模型的窃电检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358838A1 (en) * 2013-06-04 2014-12-04 International Business Machines Corporation Detecting electricity theft via meter tampering using statistical methods
CN112884000A (zh) * 2021-01-15 2021-06-01 国网河南省电力公司营销服务中心 一种基于数据挖掘的用电检查智能诊断方法及诊断系统

Also Published As

Publication number Publication date
CN121030552A (zh) 2025-11-28

Similar Documents

Publication Publication Date Title
Li et al. Electricity theft detection in power grids with deep learning and random forests
CN110113226B (zh) 一种检测设备异常的方法及装置
Zhao et al. A novel multivariate time-series anomaly detection approach using an unsupervised deep neural network
Arif et al. Big data analytics for identifying electricity theft using machine learning approaches in microgrids for smart communities
Gao et al. Electricity theft detection based on contrastive learning and non-intrusive load monitoring
CN118624851A (zh) 基于多维参数的水质监测方法、装置、设备及存储介质
CN119026906B (zh) 基于时序分析的电力营商服务风险防控方法及系统
Binna et al. Subset level detection of false data injection attacks in smart grids
CN104484602A (zh) 一种入侵检测方法、装置
CN113327008A (zh) 一种基于时序自动编码器的窃电检测方法、系统及介质
CN118607676A (zh) 基于机器学习的滑坡灾害预警方法、设备及存储介质
Yao et al. Natural gas pipeline leak detection based on dual feature drift in acoustic signals
CN118427757A (zh) 企业账户的全生命周期监控方法、装置、设备及存储介质
Sui et al. Argo data anomaly detection based on transformer and Fourier transform
Zhang et al. A multiscale electricity theft detection model based on feature engineering
Ragapriya et al. Machine learning based house price prediction using modified extreme boosting
CN116628612B (zh) 一种无监督异常检测方法、装置、介质及设备
CN121030552B (zh) 一种基于智能电表数据的窃电检测方法及系统
CN119904330B (zh) 基于图神经网络的智能电价匹配与核查方法及相关装置
CN117978620B (zh) 一种电子配线架异常检测方法及系统
KS et al. A robust methodology evaluation to predict poverty levels using elevated deep learning procedure
CN119478773B (zh) 动态场景图的生成方法、装置、电子设备、存储介质和程序产品
Norouzi et al. A novel framework to detect electricity theft in regions with traditional metering; applying a hybrid machine learning-based approach to low-sampling-rate data
Sharify et al. Improved LOF algorithm using random point
Alshara [Retracted] Multilayer Graph‐Based Deep Learning Approach for Stock Price Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant