CN113282613A - 专变和低压用户用电分析方法、系统、设备及存储介质 - Google Patents

专变和低压用户用电分析方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113282613A
CN113282613A CN202110411606.4A CN202110411606A CN113282613A CN 113282613 A CN113282613 A CN 113282613A CN 202110411606 A CN202110411606 A CN 202110411606A CN 113282613 A CN113282613 A CN 113282613A
Authority
CN
China
Prior art keywords
electricity
users
training
self
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110411606.4A
Other languages
English (en)
Other versions
CN113282613B (zh
Inventor
冯小峰
郭文翀
李经儒
阙华坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Measurement Center of Guangdong Power Grid Co Ltd
Original Assignee
Measurement Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Measurement Center of Guangdong Power Grid Co Ltd filed Critical Measurement Center of Guangdong Power Grid Co Ltd
Priority to CN202110411606.4A priority Critical patent/CN113282613B/zh
Publication of CN113282613A publication Critical patent/CN113282613A/zh
Application granted granted Critical
Publication of CN113282613B publication Critical patent/CN113282613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Measurement Of Current Or Voltage (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种专变和低压用户用电分析方法及、系统、设备及存储介质,涉及用电检测技术领域。所述方法包括获取若干历史用电数据;根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征;引入有监督的分类层,对自编码器的参数进行微调;采用基于随机欠采样和重采样的类别不平衡处理方法,得到随机森林分类器;采用随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。本发明能够结合窃电排查目标,制定更加合理有效的排查策略,以克服现有窃电排查方法费时费力,且精确度不高的问题。

Description

专变和低压用户用电分析方法、系统、设备及存储介质
技术领域
本发明涉及用电检测技术领域,尤其涉及一种专变和低压用户用电分析方 法及、系统、设备及存储介质。
背景技术
窃电是指用电客户采取非法的隐蔽手段或者其他违规行为实现其用电量 计量比实际使用量偏少的过程。窃电危害甚广,窃电用户私自对电能表改装、 对输电线路改接,极易导致电气设备故障、线路短路,甚至导致人员伤亡。窃 电行为不仅在数量上规模可观,窃电人群也呈现专业化、多元化,由于窃电主 体变化多样,对专变和低压用户用电进行分析是很有必要的。
发明内容
本发明目的在于,提供一种专变和低压用户用电分析方法及、系统、设备 及存储介质,结合窃电排查目标,制定更加合理有效的排查策略,以克服现有 窃电排查方法费时费力,且精确度不高的问题。
为实现上述目的,本发明实施例提供一种专变和低压用户用电分析方法, 包括:
获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数 据和正常用户的用电数据;
根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
引入有监督的分类层,对所述自编码器的参数进行微调;
采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡 的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练 子集进行训练,得到n个训练完毕的随机森林分类器;
采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成 各个分类器的分类结果,输出测试集上各用户的窃电置信度。
优选地,所述历史用电数据采集的不同用户的用户数据采集的时间相同, 且采样跨度大于1周。
优选地,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的 用电特征,包括:
所述自编码器包括编码阶段和解码阶段,所述编码阶段中,设输入的用户 电量集合为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户 个数,xi为用户i的d维电量向量;
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元 个数为m,则fi的表达式为:
fi=s(ω·xi+b),fi∈Rm
其中,,Rm为m维的实数向量空间,ω和b分别为编码公式的权重向量和 偏差;s为激活函数,包括sigmoid和tanh;电量向量由d维降至m维。
优选地,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的 用电特征,包括:
所述自编码器包括编码阶段和解码阶段,在解码阶段中,隐藏层F={f1,f2,…,fN}被映射到输出层
Figure BDA0003024372720000031
表达式为:
Figure BDA0003024372720000032
其中,
Figure BDA0003024372720000033
Figure BDA0003024372720000034
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid 和tanh,fi为映射到隐藏层的特征向量,
Figure BDA0003024372720000035
为输出层的输出重构向量。
优选地,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的 用电特征,包括:
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对 原始数据的降维;
将重构过程中的损失函数定义为:
Figure BDA0003024372720000036
其中,N为输入样本的个数,xi为输入向量,
Figure BDA0003024372720000037
为输出向量,m为向量的维 度,L2为特定常数,ω为权重向量;第一项
Figure BDA0003024372720000038
为输入向量和输出向量间 的重构误差,第二项
Figure BDA0003024372720000039
为L2正则范数,用以减小重构过程中的过拟合问题。
优选地,所述采用所述随机森林分类器,分别对测试集上的各用户进行分 类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度,包 括
对所述分类结果进行集成
Figure BDA00030243727200000310
其中,αi为各个随机森林的 集成权重,θ为分类阈值,Hi为各个子分类器的分类结果,s为子分类器的数 量,sgn()为符号函数,H为最终的集成分类结果。
本发明实施例还提供一种专变和低压用户用电分析系统,包括:
数据获取模块,用于获取若干历史用电数据;其中,所述历史用电数据包 括窃电用户的用电数据和正常用户的用电数据;
用电特征获取模块,用于根据所述历史用电数据训练并堆叠自编码器,输 出降维后的用电特征;
微调模块,用于引入有监督的分类层,对所述自编码器的参数进行微调;
训练模块,用于采用基于随机欠采样和重采样的类别不平衡处理方法,建 立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算 法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
窃电置信度获取模块,用于采用所述随机森林分类器,分别对测试集上的 各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃 电置信度。
优选地,所述历史用电数据采集的不同用户的用户数据采集的时间相同, 且采样跨度大于1周。
本发明实施例还提供一种计算机终端设备,包括一个或多个处理器和存储 器。存储器与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个 程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任 一实施例所述的专变和低压用户用电分析方法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序, 所述计算机程序被处理器执行时实现如上述任一实施例所述的专变和低压用户 用电分析方法。
与现有技术相比,本发明具有以下有益效果:
本发明基于台区用户的排查结果,分别采集排查出的窃电用户和其他正常 用户的历史电表数据,然后提取各用户的用电特征,最后通过基于随机森林的 分类算法,识别出未被排查出的潜在窃电用户。
本发明对反窃电研究中固有的类别不平衡问题进行处理,首先通过对正常 用户的样本集进行随机欠采样,采样数目与少数用户的样本集一致,得到多个 类别平衡的组合样本集,然后考虑各个组合样本集中少数用户样本的一致性, 对各组合样本集采取自助采样法进行重采样,符合后续分类算法的数据处理特 点。
本发明综合考虑子分类器的分类结果,通过对分类结果的置信度分析,确 定实地工作的重点排查对象。采用投票法对各随机森林分类器的分类结果进行 组合,最终输出总体的分类置信度,通过对置信度进行分析,只需要重点排查 分类结果中的低置信度用户,减轻了实地排查工作量,提高了排查效率。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
图1是本发明某一实施例提供的专变和低压用户用电分析方法的流程示意 图;
图2是本发明另一实施例提供的专变和低压用户用电分析方法的流程示意 图;
图3是本发明另一实施例提供的专变和低压用户用电分析方法中不平衡样 本集处理方法的流程示意图;
图4是本发明某一实施例提供的专变和低压用户用电分析系统的结构示意 图;
图5是本发明某一实施例提供的计算机终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执 行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的 目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的 那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该” 意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件 的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/ 或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能 组合,并且包括这些组合。
请参阅图1,图1为本发明某一实施例提供的专变和低压用户用电分析方法 的流程示意图。本实施例提供的专变和低压用户用电分析方法,包括以下步骤:
S110,获取若干历史用电数据。其中,历史用电数据包括窃电用户的用电 数据和正常用户的用电数据。
S120,根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征。
S130,引入有监督的分类层,对自编码器的参数进行微调。
S140,采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类 别平衡的训练子集,以训练子集为输入量,调用随机森林分类算法,对训练子 集进行训练,得到n个训练完毕的随机森林分类器。
S150,采用随机森林分类器,分别对测试集上的各用户进行分类,通过集 成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
可选的实施方式中,历史用电数据采集的不同用户的用户数据采集的时间 相同,而对于其采样跨度一般至少为1周。
为了更形象的说明本发明的流程步骤,请参阅图2,图2为本发明另一实施 例提供的专变和低压用户用电分析方法的流程示意图。
(1)按照用户户号,获取排查出的窃电用户以及正常用户的历史电表数 据。需要获取台区下排查出的窃电用户以及正常用户的历史电表数据,电表数 据应具有即时性、丰富性的基本特点,而且各用户的采集时刻应该保持相同, 即历史用电数据采集的不同用户的用户数据采集的时间相同,而对于其采样跨 度一般至少为1周。
(2)为了提高用电特征对分类算法的适应性,采用堆叠自编码器(stacked autoencoder,SAE)算法,首先通过训练并堆叠各个自编码器,输出降维后的 用电特征,然后引入有监督的分类层,对SAE的参数进行微调,提高输出特 征对分类算法的适应性;需要基于同台区用户的历史电表,采用堆叠自编码器 (stacked auto encoder,SAE)算法,训练并堆叠各个自编码器,输出降维后的 用电特征,SAE由多个自编码器(auto encoder,AE)堆叠而成,自编码器主要 包括编码和解码两个步骤,与常规神经网络最大的不同之处在于,自编码器关 注编码过程,在输出层尽可能还原输入层信息的前提下,提取隐藏层中的编码 结果,作为其特征提取的输出结果。
(3)采用基于随机欠采样和重采样的类别不平衡处理方法,建立多个类别 平衡的训练子集1~n,保证了子集间的多样性,减小训练过程中的过拟合问题。 本实施例中,不平衡样本集处理方法如图3所示,对用户用电特征中的正常用 户进行欠采样,输出各个同窃电用户数相同的正常用户子集,然后将各正常用 户子集同窃电用户集合进行组合,再从中进行放回式随机采样的重采样方法, 建立最终的平衡数据子集。
(4)以n个平衡的训练子集为输入量,调用随机森林分类算法,对各个 训练子集进行训练,输出n个训练完毕的随机森林分类器1~n;调用随机森林 分类算法对各个训练子集进行训练。
(5)采用训练好的分类器,分别对测试集上的各用户进行分类,通过集 成各个分类器的分类结果,最终输出测试集上各用户的窃电置信度;对于每个 随机森林分类器的分类结果进行集成,计算公式为
Figure BDA0003024372720000071
其中,αi 为各个随机森林的集成权重,θ为分类阈值,Hi为各个子分类器的分类结果, s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
获取了输出测试集上各用户的窃电置信度后,可以结合具体的窃电排查目 标,制定合理的窃电排查策略。
例如,某台区下的专变用户中窃电用户为50户,正常用户为450户,窃 电占比为10%,整理其中典型窃电用户及正常用户的周电表曲线,因为窃电用 户相对正常用户的数量较少,因此需要对样本集进行处理,本实施例提出基于 欠采样和重采样的不平衡样本集处理方法。能够获得0~1的分类置信度下,各 区间内的正常用户和窃电用户的所占比例,以及其中窃电用户的占比情况。
在某一实施例中,需要基于同台区用户的历史电表,采用堆叠自编码器 (stackedauto encoder,SAE)算法,训练并堆叠各个自编码器,输出降维后的用 电特征,SAE由多个自编码器(auto encoder,AE)堆叠而成。根据历史用电数 据训练并堆叠自编码器,输出降维后的用电特征,包括:
自编码器包括编码阶段和解码阶段,编码阶段中,设输入的用户电量集合 为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户个数,xi 为用户i的d维电量向量。
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元 个数为m,则fi的表达式为:
fi=s(ω·xi+b),fi∈Rm
其中,Rm为m维的实数向量空间,ω和b分别为编码公式的权重向量和偏 差。s为激活函数,包括sigmoid和tanh。电量向量由d维降至m维。
在某一实施例中,根据历史用电数据训练并堆叠自编码器,输出降维后的 用电特征,包括:
自编码器包括编码阶段和解码阶段,在解码阶段中,隐藏层F={f1,f2,…, fN}被映射到输出层
Figure BDA0003024372720000081
表达式为:
Figure BDA0003024372720000082
式中:
Figure BDA0003024372720000083
Figure BDA0003024372720000084
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid 和tanh,fi为映射到隐藏层的特征向量,
Figure BDA0003024372720000085
为输出层的输出重构向量。隐藏层的 电量特征被还原为d维。
在某一实施例中,根据历史用电数据训练并堆叠自编码器,输出降维后的 用电特征,包括:
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对 原始数据的降维。
将重构过程中的损失函数定义为:
Figure BDA0003024372720000091
其中,N为输入样本的个数,xi为输入向量,
Figure BDA0003024372720000092
为输出向量,m为向量的维 度,L2为特定常数,ω为权重向量;第一项
Figure BDA0003024372720000093
为输入向量和输出向量间 的重构误差,第二项
Figure BDA0003024372720000094
为L2正则范数,用以减小重构过程中的过拟合问题。
在某一实施例中,采用随机森林分类器,分别对测试集上的各用户进行分 类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度,包 括
对分类结果进行集成
Figure BDA0003024372720000095
其中,αi为各个随机森林的集成 权重,θ为分类阈值,Hi为各个子分类器的分类结果,s为子分类器的数量, sgn()为符号函数,H为最终的集成分类结果。
请参阅图4,图4为本发明某一实施例提供的专变和低压用户用电分析系统 的结构示意图。在本实施例中与上述实施例相同的部分,在此不再赘述。在本 实施例中,专变和低压用户用电分析系统包括:
数据获取模块210,用于获取若干历史用电数据。其中,历史用电数据包括 窃电用户的用电数据和正常用户的用电数据,一种可选的实施方式中,历史用 电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
用电特征获取模块220,用于根据历史用电数据训练并堆叠自编码器,输出 降维后的用电特征。
微调模块230,用于引入有监督的分类层,对自编码器的参数进行微调。
训练模块240,用于采用基于随机欠采样和重采样的类别不平衡处理方法, 建立n个类别平衡的训练子集,以训练子集为输入量,调用随机森林分类算法, 对训练子集进行训练,得到n个训练完毕的随机森林分类器。
窃电置信度获取模块250,用于采用随机森林分类器,分别对测试集上的各 用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电 置信度。
请参阅图5,图5为本发明某一实施例提供的计算机终端设备的结构示意图。 本实施例提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器 与所述处理器耦接,用于存储一个或多个程序,当所述一个或多个程序被所述 一个或多个处理器执行,使得所述一个或多个处理器实现如上述任意一个实施 例中的专变和低压用户用电分析方法。
处理器用于控制该计算机终端设备的整体操作,以完成上述的专变和低压 用户用电分析方法的全部或部分步骤。存储器用于存储各种类型的数据以支持 在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备 上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可 以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随 机存取存储器(Static Random AccessMemory,简称SRAM),电可擦除可编程只 读存储器(Electrically Erasable ProgrammableRead-Only Memory,简称EEPROM), 可擦除可编程只读存储器(Erasable ProgrammableRead-Only Memory,简称 EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM), 只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或 光盘。
在一示例性实施例中,计算机终端设备可以被一个或多个应用专用集成电 路(Application Specific 1ntegrated Circuit,简称AS1C)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场 可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制 器、微处理器或其他电子元件实现,用于执行上述的专变和低压用户用电分析 方法,并达到如上述方法一致的技术效果。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介 质,该程序指令被处理器执行时实现上述任意一个实施例中的专变和低压用户 用电分析方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令 的存储器,上述程序指令可由计算机终端设备的处理器执行以完成上述的专变 和低压用户用电分析方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技 术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这 些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种专变和低压用户用电分析方法,其特征在于,包括:
获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数据和正常用户的用电数据;
根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
引入有监督的分类层,对所述自编码器的参数进行微调;
采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
2.根据权利要求1所述的专变和低压用户用电分析方法,其特征在于,所述历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
3.根据权利要求1所述的专变和低压用户用电分析方法,其特征在于,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
所述自编码器包括编码阶段和解码阶段,所述编码阶段中,设输入的用户电量集合为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户个数,xi为用户i的d维电量向量;
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元个数为m,则fi的表达式为:
fi=s(ω·xi+b),fi∈Rm
其中,Rm为m维的实数向量空间,ω和b分别为编码公式的权重向量和偏差;s为激活函数,包括sigmoid和tanh;电量向量由d维降至m维。
4.根据权利要求1所述的专变和低压用户用电分析方法,其特征在于,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
所述自编码器包括编码阶段和解码阶段,在解码阶段中,隐藏层F={f1,f2,…,fN}被映射到输出层
Figure FDA0003024372710000021
表达式为:
Figure FDA0003024372710000022
其中,
Figure FDA0003024372710000023
Figure FDA0003024372710000024
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid和tanh,fi为映射到隐藏层的特征向量,
Figure FDA0003024372710000025
为输出层的输出重构向量。
5.根据权利要求1所述的专变和低压用户用电分析方法,其特征在于,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对原始数据的降维;
将重构过程中的损失函数定义为:
Figure FDA0003024372710000026
其中,N为输入样本的个数,xi为输入向量,
Figure FDA0003024372710000027
为输出向量,m为向量的维度,L2为特定常数,ω为权重向量;第一项
Figure FDA0003024372710000028
为输入向量和输出向量间的重构误差,第二项
Figure FDA0003024372710000029
为L2正则范数,用以减小重构过程中的过拟合问题。
6.根据权利要求1所述的专变和低压用户用电分析方法,其特征在于,所述采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度,包括
对所述分类结果进行集成
Figure FDA00030243727100000210
其中,αi为各个随机森林的集成权重,θ为分类阈值,Hi为各个子分类器的分类结果,s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
7.一种专变和低压用户用电分析系统,其特征在于,包括:
数据获取模块,用于获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数据和正常用户的用电数据;
用电特征获取模块,用于根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
微调模块,用于引入有监督的分类层,对所述自编码器的参数进行微调;
训练模块,用于采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
窃电置信度获取模块,用于采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
8.根据权利要求7所述的专变和低压用户用电分析系统,其特征在于,所述历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
9.一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6任一项所述的专变和低压用户用电分析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的专变和低压用户用电分析方法。
CN202110411606.4A 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质 Active CN113282613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110411606.4A CN113282613B (zh) 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110411606.4A CN113282613B (zh) 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113282613A true CN113282613A (zh) 2021-08-20
CN113282613B CN113282613B (zh) 2023-05-26

Family

ID=77276729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110411606.4A Active CN113282613B (zh) 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113282613B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120321174A1 (en) * 2011-06-15 2012-12-20 Siemens Aktiengesellschaft Image Processing Using Random Forest Classifiers
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN107862347A (zh) * 2017-12-04 2018-03-30 国网山东省电力公司济南供电公司 一种基于随机森林的窃电行为的发现方法
CN109919520A (zh) * 2019-04-08 2019-06-21 四川大学 窃电行为检测方法及装置
CN111861786A (zh) * 2020-06-12 2020-10-30 国网浙江省电力有限公司电力科学研究院 一种基于特征选择和孤立随机森林的专变窃电识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120321174A1 (en) * 2011-06-15 2012-12-20 Siemens Aktiengesellschaft Image Processing Using Random Forest Classifiers
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN107862347A (zh) * 2017-12-04 2018-03-30 国网山东省电力公司济南供电公司 一种基于随机森林的窃电行为的发现方法
CN109919520A (zh) * 2019-04-08 2019-06-21 四川大学 窃电行为检测方法及装置
CN111861786A (zh) * 2020-06-12 2020-10-30 国网浙江省电力有限公司电力科学研究院 一种基于特征选择和孤立随机森林的专变窃电识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
熊霞;陶晓峰;叶方彬;吴竹筠;: "基于台区识别和关联监测加权算法的窃电检测方法", 计算机应用 *
邓高峰;赵震宇;王?;严勤;李赫;: "基于改进自编码器和随机森林的窃电检测方法", 中国测试 *

Also Published As

Publication number Publication date
CN113282613B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
Du et al. Achieving 100x acceleration for N-1 contingency screening with uncertain scenarios using deep convolutional neural network
Ding et al. An investigation of missing data methods for classification trees applied to binary response data.
CN109507535B (zh) 变电站接地网运行阶段及运行寿命预测方法及装置
CN107679572B (zh) 一种图像判别方法、存储设备及移动终端
CN113673564B (zh) 窃电样本生成方法、装置、计算机设备和存储介质
CN113011889B (zh) 账号异常识别方法、系统、装置、设备及介质
CN113362118B (zh) 一种基于随机森林的用户用电行为分析方法及系统
CN112308124B (zh) 一种面向用电信息采集系统的智能防窃电方法
CN112330078B (zh) 用电量预测方法、装置、计算机设备和存储介质
Fürnkranz Round robin ensembles
Zhou et al. Improved softmax loss for deep learning‐based face and expression recognition
CN116310425B (zh) 一种细粒度图像检索方法、系统、设备及存储介质
Yoon et al. Deep learning-based method for the robust and efficient fault diagnosis in the electric power system
Liao et al. Anomaly detection based on selection and weighting in latent space
CN111352926B (zh) 数据处理的方法、装置、设备及可读存储介质
Suganuma et al. Hierarchical feature construction for image classification using genetic programming
CN113282613A (zh) 专变和低压用户用电分析方法、系统、设备及存储介质
Pai et al. An enhanced support vector machines model for classification and rule generation
CN111581439A (zh) 一种用于机器学习分析的大数据信息处理方法及系统
Dawood et al. Power quality disturbance classification based on efficient adaptive Arrhenius artificial bee colony feature selection
Moitra et al. Crude oil prediction using LSTM
CN108629356B (zh) 一种面向用电负荷分类应用的数据存储方法和装置
CN115223157A (zh) 一种基于循环神经网络的电网设备铭牌光学字符识别方法
CN114064898A (zh) 一种基于文本分类和匹配融合模型的意图识别方法及装置
Jiang et al. PruneFaceDet: Pruning lightweight face detection network by sparsity training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant