CN110634080B - 异常用电检测方法、装置、设备及计算机可读存储介质 - Google Patents

异常用电检测方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN110634080B
CN110634080B CN201810661989.9A CN201810661989A CN110634080B CN 110634080 B CN110634080 B CN 110634080B CN 201810661989 A CN201810661989 A CN 201810661989A CN 110634080 B CN110634080 B CN 110634080B
Authority
CN
China
Prior art keywords
user
detected
users
abnormal electricity
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810661989.9A
Other languages
English (en)
Other versions
CN110634080A (zh
Inventor
黎昱
汪建
汤奕
崔晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201810661989.9A priority Critical patent/CN110634080B/zh
Publication of CN110634080A publication Critical patent/CN110634080A/zh
Application granted granted Critical
Publication of CN110634080B publication Critical patent/CN110634080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明介绍了一种异常用电检测方法、装置、设备及计算机可读存储介质,该方法包括:根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组;根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。本发明减少了人工现场排查异常用户的工作量,提高了对异常用电用户的判别准确率。

Description

异常用电检测方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及电力系统运行检测技术领域,尤其涉及一种异常用电检测方法、装置、设备及计算机可读存储介质。
背景技术
一直以来,非技术性电力损耗给电力公司造成了巨大的经济损失,主要包括例如:窃电行为、费率错误、表计故障等的异常用电行为。异常用电行为在发达国家和发展中国家均有不同程度的发生。因此,从全球角度而言,如何进行异常用电检测是一个备受关注的问题。针对异常用电行为的传统检测方法包括:现场勘察、负控中心校对和用电数据分析等方法。目前,电力消费具有用户数量众多、电力消费量大和电力消费采集数据量庞大的特点。传统方法难以适应快速发展的电力消费市场和各种新的异常用电问题。此外,异常用电行为存在着发现难的问题:主要依靠群众举报和电力公司例行检查,通常只能发现冰山一角,电力公司的人力物力难以匹配大规模的电力消费市场;异常用电行为还存在着取证难的问题:发现异常用电用户后进行实地检查不一定能够保持窃电现场。
发明内容
本发明的主要目的在于提出一种异常用电检测方法、装置、设备及计算机可读存储介质,减少了人工现场排查异常用户的工作量,提高了对异常用电用户的判别准确率。
为实现上述目的,本发明提供了一种异常用电检测方法,所述方法包括:
根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组;
根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。
可选的,在所述通过预设聚类算法,对各个待检测用户进行聚类分组之前,所述方法还包括:
对获取到的各个待检测用户的用电数据进行预处理;所述预处理包括:修正异常用电数据和填补缺失用电数据。
可选的,所述通过预设聚类算法,对各个待检测用户进行聚类分组,包括:
通过预设聚类算法,对各个待检测用户进行聚类分组,并根据聚类分组结果,计算评估指标;
在评估指标小于第一预设阈值的情况下,调整所述预设聚类算法的参数值,并重新进行聚类分组以及计算评估指标,直至评估指标大于等于第一预设阈值。
可选的,按照如下公式计算评估指标CSI:
Figure BDA0001706615860000021
其中,N为聚类数量;
Figure BDA0001706615860000022
为第x个聚类的中心向量;
Figure BDA0001706615860000023
为第y个聚类的中心向量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000024
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
可选的,所述根据聚类分组结果,计算每个待检测用户的异常用电指标,包括:
按照如下公式计算所有待检测用户中的第k个待检测用户的异常用电指标UDI:
Figure BDA0001706615860000031
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000032
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000033
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000034
为第k个待检测用户所处聚类的中心向量。
可选的,在所述从疑似异常用电用户中确定出真实异常用电用户之前,所述方法还包括:
获取训练样本;其中,所述训练样本包括:各个样本用户的用电数据;
获取现场核查结果,并根据所述现场核查结果将所述训练样本中的各个样本用户标记为异常用电用户或正常用电用户;
根据标记后的训练样本,对预设分类算法进行训练,得到用于判断疑似异常用电用户是否为真实异常用电用户的分类器。
可选的,所述根据标记后的训练样本,对预设分类算法进行训练,得到用于判断疑似异常用电用户是否为真实异常用电用户的分类器,包括:
将所述训练样本中的样本用户平均划分为n个集合,并从n个集合中确定出训练集合和测试集合;
通过训练集合对预设分类算法进行训练,并通过测试集合对训练后得到的分类器进行测试;
在测试结果小于第二预设阈值的情况下,重新划分集合并重新对预设分类算法进行训练,直至测试结果大于等于第二预设阈值。
此外,为实现上述目的,本发明还提出一种异常用电检测装置,所述装置包括:
聚类模块,用于获取各个待检测用户的用电数据,并通过预设聚类算法,对各个待检测用户进行聚类分组;
计算模块,用于根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
确定模块,用于通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。
此外,为实现上述目的,本发明还提出一种异常用电检测设备,所述设备包括:处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的异常用电检测程序,以实现上述介绍的异常用电检测方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储有异常用电检测程序;
当所述异常用电检测程序被至少一个处理器执行时,导致所述至少一个处理器执行上述介绍的异常用电检测方法的步骤。
本发明提出的异常用电检测方法、装置、设备及计算机可读存储介质,将无监督的聚类算法与有监督的分类器相结合;先通过无监督的聚类算法从全体用户中快速的筛选出疑似异常用电用户,相比于传统的分析方法,聚类算法可以减少耗时,并可以降低人工排查的工作量;再通过有监督的分类器对疑似异常用电用户进行异常用电行为的二次判断,从而提高对异常用电用户的判别准确率。
附图说明
图1是本发明第一实施例的异常用电检测方法的流程图;
图2是本发明第二实施例的异常用电检测方法的流程图;
图3是本发明第三实施例中的聚类结果示意图;
图4是本发明第三实施例中的人工神经网络的组成结构示意图;
图5是本发明第四实施例中的聚类结果示意图;
图6是本发明第四实施例中的SVM的组成结构示意图;
图7是本发明第五实施例中的决策树的组成结构示意图;
图8是本发明第六实施例中的随机森林的组成结构示意图;
图9是本发明第七实施例的异常用电检测装置的组成结构示意图;
图10是本发明第八实施例的异常用电检测设备的组成结构示意图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明第一实施例,提出了一种异常用电检测方法,如图1所示,所述方法具体包括以下步骤:
步骤S101:根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组。
具体的,在所述通过预设聚类算法,对各个待检测用户进行聚类分组之前,所述方法还包括:
对获取到的各个待检测用户的用电数据进行预处理;所述预处理包括:修正异常用电数据和填补缺失用电数据。优选的,预处理包括:插值算法;通过预处理,能够剔除异常用电数据,并填补缺失用电数据,从而提高用电数据质量,为后续研究提供基础。
进一步的,所述通过预设聚类算法,对各个待检测用户进行聚类分组,包括:
通过预设聚类算法,对各个待检测用户进行聚类分组,并根据聚类分组结果,计算评估指标;
在评估指标小于第一预设阈值的情况下,调整所述预设聚类算法的参数值,并重新进行聚类分组以及计算评估指标,直至评估指标大于等于第一预设阈值。
在本发明实施例中,聚类算法为无监督机器学习算法,无需知道异常用电用户与正常用电用户的区别。在本发明实施例中,还需要对聚类分组结果进行评估,并根据评估结果动态调整聚类算法的参数,直至聚类分组结果达到评估要求。
更进一步的,聚类分组结果的评估可采用主观评估或客观评估。主观评估为:根据降维后的用电数据绘制展示图像(平面图或者三维图),采用不同颜色标记各个待检测用户,通过观察展示图像中各种颜色点的分布判断聚类分组结果是否合理;其中,观察展示图像中各种颜色点的分布包括:聚类分组之间是否相互分离、是否存在规模较小的聚类、是否存在聚类中心点很近的情况。客观评价为:按照如下公式计算评估指标CSI:
Figure BDA0001706615860000061
其中,N为聚类数量;
Figure BDA0001706615860000062
为第x个聚类的中心向量;
Figure BDA0001706615860000063
为第y个聚类的中心向量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000064
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
步骤S102:根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户。
具体的,所述根据聚类分组结果,计算每个待检测用户的异常用电指标,包括:
按照如下公式计算所有待检测用户中的第k个待检测用户的异常用电指标UDI:
Figure BDA0001706615860000071
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000072
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000073
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000074
为第k个待检测用户所处聚类的中心向量。
进一步的,所述根据每个待检测用户的异常用电指标,确定出疑似异常用电用户,包括:
将异常用电指标大于第三预设阈值的待检测用户确定为疑似异常用电用户。
步骤S103:通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。
在本发明实施例中,通过分类器进行二次判断,以从疑似异常用电用户中确定出真实异常用电用户,从而提高识别异常用电形成的准确率。
具体的,在所述从疑似异常用电用户中确定出真实异常用电用户之前,所述方法还包括:
步骤A1:获取训练样本;其中,所述训练样本包括:各个样本用户的用电数据;
步骤A2:获取现场核查结果,并根据所述现场核查结果将所述训练样本中的各个样本用户标记为异常用电用户或正常用电用户;
在本发明实施例中,充分利用了电力稽查人员的现场核查信息,通过现场核查结果对样本用户进行标记;
步骤A3:根据标记后的训练样本,对预设分类算法进行训练,得到用于判断疑似异常用电用户是否为真实异常用电用户的分类器。
更进一步的,步骤A3,包括:
将所述训练样本中的样本用户平均划分为n个集合,并从n个集合中确定出训练集合和测试集合;
通过训练集合对预设分类算法进行训练,并通过测试集合对训练后得到的分类器进行测试;
在测试结果小于第二预设阈值的情况下,重新划分集合并重新对预设分类算法进行训练,直至测试结果大于等于第二预设阈值。
例如,为了提高分类器适应性,将样本用户随机分成数量相等的10份,取9份作为训练样本集,1份作为测试样本集,并通过训练样本集对预设分类算法进行训练,并通过测试样本集验证训练得到的分类器的正确率是否达到第二预设阈值,在正确率达不到第二预设阈值的情况下,重新将样本用户随机分成数量相等的10份,并重新对预设分类算法进行训练,直至最终得到的分类器的正确率能够达到第二预设阈值。
本发明第二实施例,提出了一种异常用电检测方法,如图2所示,所述方法具体包括以下步骤:
步骤S201:按照设定时间间隔,定期获取各个样本用户的用电数据。
例如,每小时、或每天从各个样本用户的智能电表中获取用电数据。
步骤S202:根据样本用户信息和采集时间两个维度对用电数据进行整理汇总,形成负荷侧数据库。
步骤S203:对负荷侧数据库中的用电数据进行预处理;所述预处理包括:修正异常用电数据和填补缺失用电数据。
步骤S204:将预处理后的负荷侧数据库输入预设聚类算法中,对各个样本用户进行聚类分组,并根据聚类分组结果计算评估指标。
具体的,按照如下公式计算评估指标CSI:
Figure BDA0001706615860000091
其中,N为聚类数量;
Figure BDA0001706615860000092
为第x个聚类的中心向量;
Figure BDA0001706615860000093
为第y个聚类的中心向量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000094
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
步骤S205:判断评估指标是否小于第一预设阈值;
若是,则执行步骤S206;若否,则执行步骤S207。
步骤S206:修改预设聚类算法的参数,并重新执行步骤S204和步骤S205,直至评估指标大于等于第一预设阈值。
步骤S207:根据聚类分组结果,计算每样本用户的异常用电指标,并根据每个样本用户的异常用电指标,确定出疑似异常用电用户,并将疑似异常用电用户的用电数据存储到训练数据库中。
具体的,所述根据聚类分组结果,计算每样本用户的异常用电指标,包括:
按照如下公式计算所有样本用户中的第k个样本用户的异常用电指标UDI:
Figure BDA0001706615860000095
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000096
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000097
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000098
为第k个待检测用户所处聚类的中心向量。
进一步的,所述根据每个样本用户的异常用电指标,确定出疑似异常用电用户,包括:
将异常用电指标大于第二预设阈值的样本用户确定为疑似异常用电用户。
步骤S208:获取电力稽查人员针对疑似异常用电用户进行实地核查后的核查结果,并根据核查结果将所述训练数据库中的各个疑似异常用电用户标记为真实异常用电用户或误判异常用电用户。
步骤S209:根据训练数据库,通过机器学习的分类算法进行学习训练,找到真实异常用电用户、误判异常用电用户与用电数据之间的映射关系,训练得到分类器。
具体的,步骤S209,包括:
将训练数据库中的样本用户平均划分为n个集合,并从n个集合中确定出训练集合和测试集合;
通过训练集合对分类算法进行训练,得到分类器,并通过测试集合对分类器进行测试;
在测试结果小于第三预设阈值的情况下,重新划分集合并重新对预设分类算法进行训练,直至测试结果大于等于第三预设阈值。
例如,为了提高分类器适应性,将样本用户随机分成数量相等的10份,取9份作为训练样本集,1份作为测试样本集,并通过训练样本集对预设分类算法进行训练,并通过测试样本集验证训练得到的分类器的正确率是否达到第三预设阈值,在正确率达不到第三预设阈值的情况下,重新将样本用户随机分成数量相等的10份,并重新对预设分类算法进行训练,直至最终得到的分类器的正确率能够达到第三预设阈值。
步骤S210:通过预设聚类算法和分类器对待检测用户进行异常用电行为的识别。
具体的,步骤S210,包括:
步骤B1:根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组;
步骤B2:根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
步骤B3:通过分类器,从疑似异常用电用户中确定出真实异常用电用户。
本发明第三实施例,提出了一种异常用电检测方法,所述方法具体包括以下步骤:
步骤C1:每小时从各个样本用户的智能电表中获取用电数据,并将各个样本用户的用电数据存储到第一数据库中。
在本发明实施例中,以某区域内智能电表采集到的用电数据作为分析数据源,进行异常用电用户的识别。优选的,在实际应用中,对各个样本用户进行编号,使用用户编号来表示每个样本用户,从而隐去用户信息。如表1所示,是用户编号为10的样本用户在24小时内的用电量情况。
表1
Figure BDA0001706615860000111
具体的,各个样本用户的智能电表将实时采集到的用电数据通过多种通讯方式(包括输电线路载波、GPRS和RS-485等)传输至上级数据中心,数据中心将所有样本用户的用电数据汇集后最终逐级上传至第一数据库。
步骤C2:利用K均值K-Means聚类算法,对第一数据库中的用电数据进行聚类处理,并根据聚类结果调整K-Means聚类算法的参数,直至根据聚类结果计算得到的评估指标达到第一预设阈值。
具体的,步骤C2,包括:
步骤C21:利用K-Means聚类算法,对第一数据库中的用电数据进行聚类处理;
步骤C22:根据聚类结果,计算评估指标;
具体的,按照如下公式计算评估指标CSI:
Figure BDA0001706615860000121
其中,N为聚类数量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000122
为第x个聚类的中心向量;
Figure BDA0001706615860000123
为第y个聚类的中心向量;
Figure BDA0001706615860000124
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
步骤C23:判断评估指标是否小于第一预设阈值;
若是,则执行步骤C24;若否,则结束流程;
步骤C24:调整K-Means聚类算法的参数,并重复执行步骤C21至步骤C23,直至评估指标大于等于第一预设阈值。
如图3所示,为聚类结果示意图,在本发明实施例中,聚类数目为5,从图4中可以看出,数据空间分布邻近的用户能够被划分到统一的聚类中,而数据空间分布较远的用户则被划分到不同的聚类中。在聚类过程中,聚类数目通过多次尝试,比较聚类效果得到最终的聚类数目。
步骤C3:根据聚类结果计算各个样本用户的离群指标,并根据各个样本用户的离群指标确定出疑似异常用电用户。
具体的,按照如下公式计算所有样本用户中的第k个样本用户的异常用电指标UDI:
Figure BDA0001706615860000125
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000126
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000127
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000131
为第k个待检测用户所处聚类的中心向量。
进一步的,所述据各个样本用户的离群指标确定出疑似异常用电用户,包括:
步骤C31:根据各个样本用户的离群指标,进行降序排序;
如表2所示,为根据离群指标的降序排序结果:
表2
用户编号 71 123 301 69 271 172 13 209
UDI 5.7 5.6 5.3 4.9 4.9 4.8 4.7 4.5
步骤C32:将离群指标大于第二预设阈值的样本用户确定为疑似异常用电用户,将疑似异常用电用户的用电数据存储到第二数据库中。
步骤C4:获取电力公司稽查人员录入的现场核查结果,并根据录入的现场核查结果对第二数据库中的各个疑似异常用电用户进行标记。
通过步骤C3,可以缩小需要稽查人员现场核查的用户数量,从而减少稽查人员的工作量;在步骤C4中,稽查人员依次对疑似异常用电用户进行现场核查,确定疑似异常用电用户是否为真实的异常用电用户,稽查人员并将现场核查结果录入到第二数据库中,并根据稽查人员的现场核查结果在第二数据库中对各个疑似异常用电用户进行标记。
本发明实施例引入了人工标记数据,能够充分利用现场核查信息,相对于传统研究中缺少标记数据的情况是极大的改观。如表3所示,为第二数据库中的数据样本结构:
表3
用户编号 第1小时用电量 第2小时用电量 …… 第24小时用电量 标记
其中,标记位为一个二值量,0代表误判异常用电用户,1代表真实异常用电用户。
步骤C5:根据第二数据库,对分类算法进行训练,得到分类器。
优选的,本发明实施例采用人工神经网络作为分离算法,本发明包括但不仅限于该算法。如图4所示,人工神经网络由三层结构组成,分别是输入层、隐层和输出层,能够拟合各种复杂的数据关系,在异常用电行为识别这一数据关联复杂的问题中,具有较高的适用性。
具体的,步骤S305,包括:
将疑似异常用电用户随机分为10组,并采用10折交叉验证法从10组中选取9组作为训练集,1组作为测试集;
通过9组训练集对分类算法进行训练,得到分类器;并通过测试集对分类器进行测试,得到测试结果;
当测试结果误差较大时,重新执行上述步骤,直至测试结果的误差值在预设范围内。
本发明第四实施例,提出了一种异常用电检测方法,所述方法具体包括以下步骤:
步骤E1:每天从各个样本用户的智能电表中获取用电数据,并将各个样本用户的用电数据存储到第一数据库中。
在某居民小区内,每户均安装了智能电表以测量用户每天的用电情况。在本发明实施例中,用电数据以每日增量的形式记录,如表4所示,是用户编号为200的样本用户从2017/3/2至2017/3/8日(一周)的用电量情况。
表4
用户编号 2017/3/2 2017/3/3 2017/3/4 2017/3/5 2017/3/6 2017/3/7 2017/3/8
200 1816 3779 4053 7626 9004 12746 12317
具体的,各个样本用户的智能电表将实时采集到的用电数据通过多种通讯方式(包括输电线路载波、GPRS和RS-485等)传输至上级数据中心,数据中心将所有样本用户的用电数据汇集后最终逐级上传至第一数据库。
步骤E2:对第一数据库中的用电数据进行数据预处理。
本发明实施例的数据为智能电表实测的数据,可能存在数据差错、数据格式不一致、数据量差异等问题,因此不能直接作为算法的训练样本。数据预处理包括以下流程:用电量异常值筛选、样本格式化处理等。
步骤E3:利用DBSCAN(Density-Based Spatial Clustering of Applicationswith Noise)聚类算法,对第一数据库中的用电数据进行聚类处理,并根据聚类结果调整DBSCAN聚类算法的参数,直至根据聚类结果计算得到的评估指标达到第一预设阈值。
具体的,步骤E3,包括:
步骤E31:利用DBSCAN聚类算法,对第一数据库中的用电数据进行聚类处理;
步骤E32:根据聚类结果,计算评估指标;
具体的,按照如下公式计算评估指标CSI:
Figure BDA0001706615860000151
其中,N为聚类数量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000152
为第x个聚类的中心向量;
Figure BDA0001706615860000153
为第y个聚类的中心向量;
Figure BDA0001706615860000154
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
步骤E33:判断评估指标是否小于第一预设阈值;
若是,则执行步骤E34;若否,则结束流程;
步骤E34:调整DBSCAN聚类算法的参数,并重复执行步骤E31至步骤E33,直至评估指标大于等于第一预设阈值。
如图5所示,为聚类结果示意图,图中聚类结果表明数据中仅有两种类型的用户,一种为偏离原点较远的,一种聚集在原点附近,两类用户的内聚特性几号。
步骤E4:根据聚类结果计算各个样本用户的离群指标,并根据各个样本用户的离群指标确定出疑似异常用电用户。
具体的,按照如下公式计算所有样本用户中的第k个样本用户的异常用电指标UDI:
Figure BDA0001706615860000161
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000162
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000163
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000164
为第k个待检测用户所处聚类的中心向量。
进一步的,所述据各个样本用户的离群指标确定出疑似异常用电用户,包括:
步骤E41:根据各个样本用户的离群指标,进行降序排序;
如表5所示,为根据离群指标的降序排序结果:
表5
用户编号 5731 6103 2741 7120 5733 5792 4782 1025
UDI 5.7 5.6 5.3 4.9 4.9 4.8 4.7 4.5
步骤E42:将离群指标大于第二预设阈值的样本用户确定为疑似异常用电用户,将疑似异常用电用户的用电数据存储到第二数据库中。
步骤E5:获取电力公司稽查人员录入的现场核查结果,并根据录入的现场核查结果对第二数据库中的各个疑似异常用电用户进行标记。
通过步骤E4,可以缩小需要稽查人员现场核查的用户数量,从而减少稽查人员的工作量;在步骤E5中,稽查人员依次对疑似异常用电用户进行现场核查,确定疑似异常用电用户是否为真实的异常用电用户,稽查人员并将现场核查结果录入到第二数据库中,并根据稽查人员的现场核查结果在第二数据库中对各个疑似异常用电用户进行标记。
本发明实施例引入了人工标记数据,能够充分利用现场核查信息,相对于传统研究中缺少标记数据的情况是极大的改观。如表6所示,为第二数据库中的数据样本结构:
表6
Figure BDA0001706615860000171
其中,标记位为一个二值量,0代表误判异常用电用户,1代表真实异常用电用户。
步骤E6:根据第二数据库,对分类算法进行训练,得到分类器。
优选的,本发明实施例采用SVM(Support Vector Machine,支持向量机)作为分离算法,其方法原理是将问题空间用超平面切割形成分类标准,如附图6所示。图中有三角形和圆形两种类型的样本,为了将不同样本分开,在坐标平面内用直线进行分割,在分割线两侧分别为两种样本。然而,分出的两个平面中也包含了误分类的情况,如图中虚线所夹的样本。本实施例SVM核函数选择为高斯核函数,通过Matlab实现。
步骤E7:通过预设聚类算法和分类器对待检测用户进行异常用电行为的识别。
本发明第五实施例,提出了一种异常用电检测方法,所述方法具体包括以下步骤:
步骤F1:每15分钟从各个样本用户的智能电表中获取用电数据,并将各个样本用户的用电数据存储到第一数据库中。
在某工业园内,每家生产企业都装有智能电表,能够采集高密度用电数据。数据规模为2016年1月1日到2016年12月31号,共计523户,智能电表采样频率为15分钟一次。工业负荷用电受产品类型和生产计划的安排影响较大,存在多种用电模式,因此不同企业的用电行为差异较大。
步骤F2:对第一数据库中的用电数据进行数据预处理。
本发明实施例的用户数据的采样频率较高,若直接应用至机器学习算法中会造成运算时间过长。因此,首先对数据进行降维处理,将数据采样值归算至每小时的用电量。经过数据预处理,原始用电数据中的每个企业形成一个366天,每天24个用电量的数据集。此外,主成分分析法也可用于数据预处理,该实施例中用户数量较少,故不再采用该方法降维。
步骤F3:利用自组织映射神经网络聚类算法,对第一数据库中的用电数据进行聚类处理,并根据聚类结果调整自组织映射神经网络聚类算法的参数,直至根据聚类结果计算得到的评估指标达到第一预设阈值。
具体的,步骤F3,包括:
步骤F31:利用自组织映射神经网络聚类算法,对第一数据库中的用电数据进行聚类处理;
步骤F32:根据聚类结果,计算评估指标;
具体的,按照如下公式计算评估指标CSI:
Figure BDA0001706615860000181
其中,N为聚类数量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000182
为第x个聚类的中心向量;
Figure BDA0001706615860000183
为第y个聚类的中心向量;
Figure BDA0001706615860000184
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
步骤F33:判断评估指标是否小于第一预设阈值;
若是,则执行步骤F34;若否,则结束流程;
步骤F34:调整自组织映射神经网络聚类算法的参数,并重复执行步骤F31至步骤F33,直至评估指标大于等于第一预设阈值。
步骤F4:根据聚类结果计算各个样本用户的离群指标,并根据各个样本用户的离群指标确定出疑似异常用电用户。
具体的,按照如下公式计算所有样本用户中的第k个样本用户的异常用电指标UDI:
Figure BDA0001706615860000191
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000192
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000193
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000194
为第k个待检测用户所处聚类的中心向量。/>
进一步的,所述据各个样本用户的离群指标确定出疑似异常用电用户,包括:
步骤F41:根据各个样本用户的离群指标,进行降序排序;
如表7所示,为根据离群指标的降序排序结果:
表7
用户编号 231 409 142 84 375 117 208 432
UDI 22.5 20.4 19.8 19.3 19.1 18.9 18.2 17.7
步骤F42:将离群指标大于第二预设阈值的样本用户确定为疑似异常用电用户,将疑似异常用电用户的用电数据存储到第二数据库中。
步骤F5:获取电力公司稽查人员录入的现场核查结果,并根据录入的现场核查结果对第二数据库中的各个疑似异常用电用户进行标记。
通过步骤F4,可以缩小需要稽查人员现场核查的用户数量,从而减少稽查人员的工作量;在步骤F5中,稽查人员依次对疑似异常用电用户进行现场核查,确定疑似异常用电用户是否为真实的异常用电用户,稽查人员并将现场核查结果录入到第二数据库中,并根据稽查人员的现场核查结果在第二数据库中对各个疑似异常用电用户进行标记。
本发明实施例引入了人工标记数据,能够充分利用现场核查信息,相对于传统研究中缺少标记数据的情况是极大的改观。如表8所示,为第二数据库中的数据样本结构:
表8
Figure BDA0001706615860000201
其中,标记位为一个二值量,0代表误判异常用电用户,1代表真实异常用电用户。
步骤F6:根据第二数据库,对分类算法进行训练,得到分类器。
优选的,本发明实施例采用决策树作为分离算法,其方法原理是将问题中的各个属性参数进行评估,形成一个树状判断流程,如附图7所示。
步骤F7:通过预设聚类算法和分类器对待检测用户进行异常用电行为的识别。
本发明第六实施例,提出了一种异常用电检测方法,所述方法具体包括以下步骤:
步骤G1:每日从各个样本用户的智能电表中获取用电数据,并将各个样本用户的用电数据存储到第一数据库中。
在某商业区内有1082家店铺,每户均装设智能电表,根据物业校对使用电量,该区域内各电表测量值与变压器处测量值存在18%的差异,经过计算分析,该损耗量远超过正常线损,商区内存在窃电行为,但因店铺中存在营业区与生活区混合的情况,很难发现异常用电用户。
步骤G2:对第一数据库中的用电数据进行数据预处理。
由于商区内店铺开设的时间不同,也存在更换经营者的情况,数据较为复杂,经过数据预处理,首先剔除错误数据,按照每个用户每天数据形成一个样本。根据用电数据的规律,剔除不符合单日用电量,每一时段用电量的数据,通过邻近时段的进行替代。将遗漏的数据通过相似用户的数据进行填补,完善数据结构。
步骤G3:利用模糊C均值聚类算法,对第一数据库中的用电数据进行聚类处理,并根据聚类结果调整模糊C均值聚类算法的参数,直至根据聚类结果计算得到的评估指标达到第一预设阈值。
具体的,步骤G3,包括:
步骤G31:利用模糊C均值聚类算法,对第一数据库中的用电数据进行聚类处理;
步骤G32:根据聚类结果,计算评估指标;
具体的,按照如下公式计算评估指标CSI:
Figure BDA0001706615860000211
其中,N为聚类数量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000212
为第x个聚类的中心向量;
Figure BDA0001706615860000213
为第y个聚类的中心向量;
Figure BDA0001706615860000214
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
步骤G33:判断评估指标是否小于第一预设阈值;
若是,则执行步骤G34;若否,则结束流程;
步骤G34:调整模糊C均值聚类算法的参数,并重复执行步骤G31至步骤G33,直至评估指标大于等于第一预设阈值。
步骤G4:根据聚类结果计算各个样本用户的离群指标,并根据各个样本用户的离群指标确定出疑似异常用电用户。
具体的,按照如下公式计算所有样本用户中的第k个样本用户的异常用电指标UDI:
Figure BDA0001706615860000221
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000222
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000223
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000224
为第k个待检测用户所处聚类的中心向量。
进一步的,所述据各个样本用户的离群指标确定出疑似异常用电用户,包括:
步骤G41:根据各个样本用户的离群指标,进行降序排序;
如表9所示,为根据离群指标的降序排序结果:
表9
用户编号 729 543 201 235 643 831 195 809
UDI 10.7 8.6 8.3 7.9 7.9 7.8 7.7 6.5
步骤G42:将离群指标大于第二预设阈值的样本用户确定为疑似异常用电用户,将疑似异常用电用户的用电数据存储到第二数据库中。
步骤G5:获取电力公司稽查人员录入的现场核查结果,并根据录入的现场核查结果对第二数据库中的各个疑似异常用电用户进行标记。
通过步骤G4,可以缩小需要稽查人员现场核查的用户数量,从而减少稽查人员的工作量;在步骤G5中,稽查人员依次对疑似异常用电用户进行现场核查,确定疑似异常用电用户是否为真实的异常用电用户,稽查人员并将现场核查结果录入到第二数据库中,并根据稽查人员的现场核查结果在第二数据库中对各个疑似异常用电用户进行标记。
步骤G6:根据第二数据库,对分类算法进行训练,得到分类器。
优选的,本发明实施例采用随机森林作为分离算法,其方法原理是将多个不同参数的决策树模型进行组合,如附图8所示。随机森林算法能够对多种决策树模型的输出进行综合评估,防止出现预测结果的准确性偏差较大的问题。采用随机森林对175个样本进行学习训练,得到分类模型,进行异常用电用户检测,该算法通过MATLAB实现,配置为5组决策树组合。
步骤G7:通过预设聚类算法和分类器对待检测用户进行异常用电行为的识别。
本发明第七实施例,提出了一种异常用电检测装置,如图9所示,所述装置具体包括以下组成部分:
聚类模块901,用于获取各个待检测用户的用电数据,并通过预设聚类算法,对各个待检测用户进行聚类分组;
计算模块902,用于根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
确定模块903,用于通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。
具体的,所述装置还包括:
在所述通过预设聚类算法,对各个待检测用户进行聚类分组之前,对获取到的各个待检测用户的用电数据进行预处理;所述预处理包括:修正异常用电数据和填补缺失用电数据。
进一步的,聚类模块901,具体包括:
计算单元:用于通过预设聚类算法,对各个待检测用户进行聚类分组,并根据聚类分组结果,计算评估指标;
调整单元,用于在评估指标小于第一预设阈值的情况下,调整所述预设聚类算法的参数值,并重新进行聚类分组以及计算评估指标,直至评估指标大于等于第一预设阈值。
更进一步的,计算单元,具体用于:
按照如下公式计算评估指标CSI:
Figure BDA0001706615860000241
其中,N为聚类数量;
Figure BDA0001706615860000242
为第x个聚类的中心向量;
Figure BDA0001706615860000243
为第y个聚类的中心向量;
q为第x个聚类中的用户数量;
Figure BDA0001706615860000244
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
进一步的,计算模块902,具体用于:
按照如下公式计算所有待检测用户中的第k个待检测用户的异常用电指标UDI:
Figure BDA0001706615860000245
其中,n为第k个待检测用户所处聚类的用户数量;
Figure BDA0001706615860000246
为根据第k个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000247
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure BDA0001706615860000248
为第k个待检测用户所处聚类的中心向量。
进一步的,所述装置还包括:
训练模块,用于在所述从疑似异常用电用户中确定出真实异常用电用户之前,获取训练样本;其中,所述训练样本包括:各个样本用户的用电数据;
获取现场核查结果,并根据所述现场核查结果将所述训练样本中的各个样本用户标记为异常用电用户或正常用电用户;
根据标记后的训练样本,对预设分类算法进行训练,得到用于判断疑似异常用电用户是否为真实异常用电用户的分类器。
更进一步的,训练模块,具体用于:
将所述训练样本中的样本用户平均划分为n个集合,并从n个集合中确定出训练集合和测试集合;
通过训练集合对预设分类算法进行训练,并通过测试集合对训练后得到的分类器进行测试;
在测试结果小于第二预设阈值的情况下,重新划分集合并重新对预设分类算法进行训练,直至测试结果大于等于第二预设阈值。
本发明第八实施例,提出了一种异常用电检测设备,如图10所示,所述设备包括:处理器1001、存储器1002及通信总线;
通信总线用于实现处理器1001和存储器1002之间的连接通信;
处理器1001用于执行存储器1002中存储的异常用电检测程序,以实现以下步骤:
根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组;
根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。
本发明的第九实施例,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有异常用电检测程序;
当所述异常用电检测程序被至少一个处理器执行时,导致所述至少一个处理器执行以下步骤操作:
根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组;
根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户。
本发明实施例中介绍的异常用电检测方法、装置、设备及计算机可读存储介质,将无监督的聚类算法与有监督的分类器相结合;先通过无监督的聚类算法从全体用户中快速的筛选出疑似异常用电用户,相比于传统的分析方法,聚类算法可以减少耗时,并可以降低人工排查的工作量;再通过有监督的分类器对疑似异常用电用户进行异常用电行为的二次判断,从而提高对异常用电用户的判别准确率。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。

Claims (9)

1.一种异常用电检测方法,其特征在于,所述方法包括:
根据获取到的各个待检测用户的用电数据,通过预设聚类算法,对各个待检测用户进行聚类分组;
根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户;
所述根据聚类分组结果,计算每个待检测用户的异常用电指标,包括:
按照如下公式计算所有待检测用户中的第k个待检测用户的异常用电指标UDI:
Figure FDA0003886968310000011
其中,n为第k个待检测用户所处聚类的用户数量;
Figure FDA0003886968310000012
为根据第k个待检测用户的用电数据形成的向量;
Figure FDA0003886968310000013
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure FDA0003886968310000014
为第k个待检测用户所处聚类的中心向量。
2.根据权利要求1所述的异常用电检测方法,其特征在于,在所述通过预设聚类算法,对各个待检测用户进行聚类分组之前,所述方法还包括:
对获取到的各个待检测用户的用电数据进行预处理;所述预处理包括:修正异常用电数据和填补缺失用电数据。
3.根据权利要求1所述的异常用电检测方法,其特征在于,所述通过预设聚类算法,对各个待检测用户进行聚类分组,包括:
通过预设聚类算法,对各个待检测用户进行聚类分组,并根据聚类分组结果,计算评估指标;
在评估指标小于第一预设阈值的情况下,调整所述预设聚类算法的参数值,并重新进行聚类分组以及计算评估指标,直至评估指标大于等于第一预设阈值。
4.根据权利要求3所述的异常用电检测方法,其特征在于,按照如下公式计算评估指标CS I:
Figure FDA0003886968310000021
其中,N为聚类数量;
Figure FDA0003886968310000022
为第x个聚类的中心向量;
Figure FDA0003886968310000023
为第y个聚类的中心向量;
q为第x个聚类中的用户数量;
Figure FDA0003886968310000024
为根据第x个聚类中的第p个待检测用户的用电数据形成的向量;
N、q、x、y均为正整数,且x≠y。
5.根据权利要求1所述的异常用电检测方法,其特征在于,在所述从疑似异常用电用户中确定出真实异常用电用户之前,所述方法还包括:
获取训练样本;其中,所述训练样本包括:各个样本用户的用电数据;
获取现场核查结果,并根据所述现场核查结果将所述训练样本中的各个样本用户标记为异常用电用户或正常用电用户;
根据标记后的训练样本,对预设分类算法进行训练,得到用于判断疑似异常用电用户是否为真实异常用电用户的分类器。
6.根据权利要求5所述的异常用电检测方法,其特征在于,所述根据标记后的训练样本,对预设分类算法进行训练,得到用于判断疑似异常用电用户是否为真实异常用电用户的分类器,包括:
将所述训练样本中的样本用户平均划分为n个集合,并从n个集合中确定出训练集合和测试集合;
通过训练集合对预设分类算法进行训练,并通过测试集合对训练后得到的分类器进行测试;
在测试结果小于第二预设阈值的情况下,重新划分集合并重新对预设分类算法进行训练,直至测试结果大于等于第二预设阈值。
7.一种异常用电检测装置,其特征在于,所述装置包括:
聚类模块,用于获取各个待检测用户的用电数据,并通过预设聚类算法,对各个待检测用户进行聚类分组;计算模块,用于根据聚类分组结果,计算每个待检测用户的异常用电指标,并根据每个待检测用户的异常用电指标,确定出疑似异常用电用户;
确定模块,用于通过预设的分类器,从疑似异常用电用户中确定出真实异常用电用户;
所述计算模块,具体用于按照如下公式计算所有待检测用户中的第k个待检测用户的异常用电指标UD I:
Figure FDA0003886968310000031
其中,n为第k个待检测用户所处聚类的用户数量;
Figure FDA0003886968310000032
为根据第k个待检测用户的用电数据形成的向量;
Figure FDA0003886968310000033
为根据第k个待检测用户所处聚类中的第m个待检测用户的用电数据形成的向量;
Figure FDA0003886968310000034
为第k个待检测用户所处聚类的中心向量。
8.一种异常用电检测设备,其特征在于,所述设备包括:处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的异常用电检测程序,以实现权利要求1至6中任一项所述的异常用电检测方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有异常用电检测程序;
当所述异常用电检测程序被至少一个处理器执行时,导致所述至少一个处理器执行权利要求1至6中任一项所述的异常用电检测方法的步骤。
CN201810661989.9A 2018-06-25 2018-06-25 异常用电检测方法、装置、设备及计算机可读存储介质 Active CN110634080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810661989.9A CN110634080B (zh) 2018-06-25 2018-06-25 异常用电检测方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810661989.9A CN110634080B (zh) 2018-06-25 2018-06-25 异常用电检测方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110634080A CN110634080A (zh) 2019-12-31
CN110634080B true CN110634080B (zh) 2023-03-31

Family

ID=68968019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810661989.9A Active CN110634080B (zh) 2018-06-25 2018-06-25 异常用电检测方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110634080B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111893B (zh) * 2020-01-09 2022-12-16 中国移动通信集团四川有限公司 一种数据的处理方法、系统以及电子设备
CN111401420B (zh) * 2020-03-06 2023-04-18 普迪飞半导体技术(上海)有限公司 晶圆测试的异常数据聚类方法、装置、电子设备与介质
CN113435464B (zh) * 2020-03-08 2022-05-17 阿里巴巴集团控股有限公司 异常数据检测方法、装置、电子设备及计算机存储介质
CN111753907A (zh) * 2020-06-24 2020-10-09 国家电网有限公司大数据中心 一种电量数据的处理方法、装置、设备和存储介质
CN111784042B (zh) * 2020-06-28 2022-11-25 佛山市南海区公共安全技术研究院 一种用电节点安全风险预测方法、装置及存储介质
CN112036725A (zh) * 2020-08-24 2020-12-04 国网河北省电力有限公司营销服务中心 一种电能表故障识别方法
CN112213687B (zh) * 2020-10-10 2023-05-16 国网四川省电力公司电力科学研究院 基于伪异常点辨识的关口电能表数据异常检测方法及系统
CN112256735B (zh) * 2020-10-23 2024-04-09 北京合众伟奇科技股份有限公司 一种用电监测方法、装置、计算机设备和存储介质
CN112418687B (zh) * 2020-11-26 2023-03-24 广东电网有限责任公司 基于用电特征的用户用电异常识别方法、装置和存储介质
CN112816774B (zh) * 2020-12-15 2023-01-06 国网宁夏电力有限公司营销服务中心(国网宁夏电力有限公司计量中心) 一种基于大数据的窃电排查方法
CN112906790B (zh) * 2021-02-20 2023-08-18 国网江苏省电力有限公司营销服务中心 一种基于用电数据的独居老人识别方法和系统
CN112990329B (zh) * 2021-03-26 2023-06-23 清华大学 一种系统异常诊断方法和装置
CN113125903A (zh) * 2021-04-20 2021-07-16 广东电网有限责任公司汕尾供电局 线损异常检测方法、装置、设备及计算机可读存储介质
CN113011530B (zh) * 2021-04-29 2023-04-07 国网新疆电力有限公司营销服务中心(资金集约中心、计量中心) 一种基于多分类器融合的智能电表故障预测方法
CN113988723A (zh) * 2021-12-28 2022-01-28 广东电网有限责任公司佛山供电局 一种基于用电数据异常分析的用户行为锁定方法和系统
CN114461594A (zh) * 2021-12-31 2022-05-10 国网河北省电力有限公司营销服务中心 数据压缩方法、边缘设备及计算机存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630885B (zh) * 2015-12-18 2019-05-28 国网福建省电力有限公司泉州供电公司 一种用电异常检测方法及系统
CN106707099B (zh) * 2016-11-30 2019-04-12 国网上海市电力公司 基于异常用电检测模型的监测定位方法
CN108198408B (zh) * 2017-12-08 2020-06-26 囯网河北省电力有限公司电力科学研究院 一种基于用电信息采集系统的自适应反窃电监控方法及系统

Also Published As

Publication number Publication date
CN110634080A (zh) 2019-12-31

Similar Documents

Publication Publication Date Title
CN110634080B (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN109146705B (zh) 一种用电特征指标降维与极限学习机算法进行窃电检测的方法
CN106650797B (zh) 一种基于集成elm的配电网窃电嫌疑用户智能识别方法
CN106022509B (zh) 考虑地域和负荷性质双重差异的配电网空间负荷预测方法
CN110991786A (zh) 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN111104981A (zh) 一种基于机器学习的水文预报精度评价方法及系统
CN106570778A (zh) 一种基于大数据的数据集成与线损分析计算的方法
CN109446812A (zh) 一种嵌入式系统固件安全分析方法及系统
CN104574141A (zh) 一种业务影响度分析方法
CN115222303B (zh) 基于大数据的行业风险数据分析方法、系统及存储介质
CN107589391A (zh) 一种检测电能计量装置整体误差的方法、装置和系统
CN111177208A (zh) 基于大数据分析的用电异常检测方法
CN103902798B (zh) 数据预处理方法
Dent et al. An approach for assessing clustering of households by electricity usage
CN103310235A (zh) 一种基于参数识别与估计的隐写分析方法
CN107862433A (zh) 一种特高压直流输电线路带电作业安全评估方法和系统
CN114519514A (zh) 一种低压台区合理线损值测算方法、系统及计算机设备
CN111178690A (zh) 基于风控评分卡模型的用电客户窃电风险评估方法
CN110889196A (zh) 水环境承载力评估方法、装置及存储介质
CN116467551B (zh) 一种基于相关系数的供水管网漏损定位方法及系统
CN111797188B (zh) 一种基于开源地理空间矢量数据的城市功能区定量识别方法
CN113516192A (zh) 一种用户用电异动识别方法、系统、装置及存储介质
CN106651630B (zh) 关键用电行业识别方法和系统
Alvarez‐Guerra et al. A SOM‐based methodology for classifying air quality monitoring stations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant