CN117633571A - 一种基于多重聚类的异常用户预警方法及装置 - Google Patents
一种基于多重聚类的异常用户预警方法及装置 Download PDFInfo
- Publication number
- CN117633571A CN117633571A CN202311660837.4A CN202311660837A CN117633571A CN 117633571 A CN117633571 A CN 117633571A CN 202311660837 A CN202311660837 A CN 202311660837A CN 117633571 A CN117633571 A CN 117633571A
- Authority
- CN
- China
- Prior art keywords
- clustering
- user
- abnormal
- users
- early warning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 41
- 230000005611 electricity Effects 0.000 claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 17
- 230000005484 gravity Effects 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 12
- 238000003064 k means clustering Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 6
- 238000007689 inspection Methods 0.000 description 25
- 238000001514 detection method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2337—Non-hierarchical techniques using fuzzy logic, i.e. fuzzy clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Automation & Control Theory (AREA)
- Quality & Reliability (AREA)
- Fuzzy Systems (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多重聚类的异常用户预警方法及装置,包括:获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重;根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;获取各用户的用电变化量数据,并通过第二预设聚类算法,以用电变化量数据为基础,对第一聚类结果进行二次聚类,从而输出得到第二聚类结果;根据第二聚类结果形成的不同聚类中心,对第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。本发明解决现有技术中数据缺乏针对性,存在工作量繁杂、效率与准确率低,无法保障电力系统安全稳定运行的技术问题。
Description
技术领域
本发明涉及电力稽查技术领域,尤其涉及一种基于多重聚类的异常用户预警方法及装置。
背景技术
随着供电公司大力推进工作业务的信息化、智能化,通过大量智能采集终端和管理系统上线,可以使业务部门迅速掌控电力用户用电状态信息,对于负荷监测预警、负荷调度控制以及用电异常检测等具有重要意义。
目前,针对异常用户的检测,主要是利用海量数据挖掘进与分析来实现的,而大部分数据主要通过人为的方式进行筛选与稽查,从而导致人为分析的数据缺乏针对性,同时也存在工作量繁杂、效率与准确率低的问题,从而带来电网系统的经济损失,无法保障电力系统安全稳定运行。
因此,目前亟需一种能够快速且准确地实现对电网异常用户进行检测与预警的方法。
发明内容
本发明提供了一种基于多重聚类的异常用户预警方法及装置,以解决现有技术中数据缺乏针对性,存在工作量繁杂、效率与准确率低,无法保障电力系统安全稳定运行的技术问题。
为了解决上述技术问题,本发明实施例提供了一种基于多重聚类的异常用户预警方法,包括:
获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重;
根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;其中,所述第一聚类结果包括非异常用户和异常用户;
获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果;
根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。
作为优选方案,所述获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重,具体为:
获取各用户的历史指标数据;其中,所述历史指标数据包括有功功率、无功功率和记录数据的基础指标;
通过熵权法,对每一个用户的历史指标数据进行归一化处理后,分别进行比重和信息熵值的计算;
根据每一个用户的历史指标数据对应的比重和信息熵值,计算得到有功功率权重值、无功功率权重值和记录数据权重值;其中,每一个用户均有对应其历史指标数据中的有功功率权重值、无功功率权重值和记录数据权重值。
作为优选方案,所述比重、信息熵值和权重的计算公式为:
其中,zmn表示第m个用户的第n个历史指标数据bmn经过归一化处理的数据;pmn表示第m个用户的第n个基础指标的比重;en表示所有用户中的第n个基础指标的信息熵值;ωn表示所有用户中的第n个基础指标的权重。
作为优选方案,所述根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果,具体为:
根据每一个用户中的各个历史指标数据对应的权重,计算得到每一个用户所对应的综合聚类指标值;
通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果。
作为优选方案,所述通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果,具体为:
以非异常用户和异常用户为聚类目标,设定聚类中心的数目;
随机选取两个用户的综合聚类指标值作为初始聚类中心,对剩余用户其分别计算到初始聚类中心的距离;
根据每一个用户到该两个初始聚类中心的距离及其差值,从而确定所有用户关于初始聚类中心的初步聚类,并以初始聚类结果为基础,通过平均值法更新计算聚类中心,并计算更新后的聚类中心及对应该更新后的聚类中心所剩余的用户,其对于更新后聚类中心的距离;
当迭代更新至预设条件后,输出得到最终的包括非异常用户和异常用户的聚类中心的第一聚类结果。
作为优选方案,所述获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果,具体为:
获取各用户的用电变化量数据;其中,所述用电变化量数据包括有功功率变化量数据和无功功率变化量数据;
通过模糊C均值聚类算法,对第一聚类结果中的异常用户进行二次聚类,以使得在二次聚类过程中,根据各异常用户的聚类中心,初始化隶属度矩阵,并根据每个异常用户所对应的用电变化量数据,对所述隶属度矩阵进行迭代更新,直至迭代更新至预设条件后,从而得到包括各异常用户的多个聚类中心的第二聚类结果。
作为优选方案,所述根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,具体为:
对异常用户的第二聚类结果形成的聚类中心进行归一化计算,并根据归一化计算的结果,计算不同异常用户经过二次聚类后的评价分数;
根据所述评价分数,结合预设风险等级表,得到异常用户的风险预警等级。
相应地,本发明还提供一种基于多重聚类的异常用户预警装置,包括:权重模块、第一聚类模块、第二聚类模块和预警模块;
所述权重模块,用于获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重;
所述第一聚类模块,用于根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;其中,所述第一聚类结果包括非异常用户和异常用户;
所述第二聚类模块,用于获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果;
所述预警模块,用于根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。
相应地,本发明还提供一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项所述的基于多重聚类的异常用户预警方法。
相应地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任意一项所述的基于多重聚类的异常用户预警方法。
相比于现有技术,本发明实施例具有如下有益效果:
本发明的技术方案通过获取各用户的历史指标数据,从而通过熵权法来评估指标相对重要程度,进而来计算不同指标的权重,从而形成综合聚类指标,以综合指标作为聚类中心计算基础,采用第一预设聚类算法得到包括非异常用户和异常用户的第一聚类结果,进而采用第二预设聚类算法来对异常用户的第一聚类结果进行二次聚类,从而得到实现不同异常用户相对差异程度的有效描述与刻画,显著提升了电网稽查系统对异常用户的辨识准确率和效率,并基于二次聚类结果转化为适用于风险预警的评价分数,划分异常用户风险等级,以便于工作人员按照预警等级级别不同分别开展电网稽查工作,有效降低了稽查工作量,提高了用户体验。
附图说明
图1:为本发明实施例所提供的一种基于多重聚类的异常用户预警方法的步骤流程图;
图2:为本发明实施例所提供的一种基于多重聚类的异常用户预警装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1,为本发明实施例提供的一种基于多重聚类的异常用户预警方法,包括以下步骤S101-S104:
步骤S101:获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重。
在本实施例中,异常用户预警方法主要用于电网管理系统中的稽查系统,以便于工作人员能够在对不同的用户进行电网用电行为监控与查询,从而维护正常电价秩序。通过电网业务的信息化、智能化,以及大量智能采集终端和管理系统上线,可以使电网业务部门能够迅速掌控电力用户用电状态信息,对于负荷监测预警、负荷调度控制以及用电异常检测等具有重要意义。
在本实施例中,梳理并获取稽查系统所有用户所对应的有功功率、无功功率、检修记录频繁程度等基础指标,利用熵权法计算不同指标的权重,形成综合聚类指标。优选地,基础指标主要包括有功功率、无功功率和记录数据,而记录数据包括检修记录数据和投诉记录数据。
作为本实施例的优选方案,所述获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重,具体为:
获取各用户的历史指标数据;其中,所述历史指标数据包括有功功率、无功功率和记录数据的基础指标;通过熵权法,对每一个用户的历史指标数据进行归一化处理后,分别进行比重和信息熵值的计算;根据每一个用户的历史指标数据对应的比重和信息熵值,计算得到有功功率权重值、无功功率权重值和记录数据权重值;其中,每一个用户均有对应其历史指标数据中的有功功率权重值、无功功率权重值和记录数据权重值。
在本实施例中,从稽查系统提取用户在用电过程中中的有功功率和无功功率等实时数据、检修记录和投诉记录等历史数据作为基础指标,稽查系统用户不同基础指标的原始数据可采用矩阵A表示为:
其中,amn表示第m个用户的第n个基础指标的数值,1≤m≤M,1≤n≤N;M表示稽查系统用户的总数量;N表示基础指标的总数量。
进一步地,为量化不同指标的相对重要程度,利用熵权法进行各基础指标权重计算,即比重、信息熵值以及权重的计算公式为:
其中,zmn表示第m个用户的第n个历史指标数据bmn经过归一化处理的数据;pmn表示第m个用户的第n个基础指标的比重;en表示所有用户中的第n个基础指标的信息熵值;ωn表示所有用户中的第n个基础指标的权重。
步骤S102:根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;其中,所述第一聚类结果包括非异常用户和异常用户。
作为本实施例的优选方案,所述根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果,具体为:
根据每一个用户中的各个历史指标数据对应的权重,计算得到每一个用户所对应的综合聚类指标值;通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果。
在本实施例中,稽查系统第m个用户综合聚类指标可表示为:
ω={ω1,ω2,...,ωN}
Cm=ω1ηm+ω2Tm+ω3Rm+ω4Sm
其中,ω1、ω2、ω3和ω4分别表示稽查系统用户有功功率、无功功率、检修记录和投诉记录的基础指标的权重,其中,N=4;Cm表示第m个稽查系统用户综合聚类指标值;ηm表示第m个稽查系统用户有功功率;Tm表示第m个稽查系统用户无功功率;Rm表示第m个稽查系统用户检修记录;Sm表示第m个稽查系统用户投诉记录。
作为本实施例的优选方案,所述通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果,具体为:
以非异常用户和异常用户为聚类目标,设定聚类中心的数目;随机选取两个用户的综合聚类指标值作为初始聚类中心,对剩余用户其分别计算到初始聚类中心的距离;根据每一个用户到该两个初始聚类中心的距离及其差值,从而确定所有用户关于初始聚类中心的初步聚类,并以初始聚类结果为基础,通过平均值法更新计算聚类中心,并计算更新后的聚类中心及对应该更新后的聚类中心所剩余的用户,其对于更新后聚类中心的距离;当迭代更新至预设条件后,输出得到最终的包括非异常用户和异常用户的聚类中心的第一聚类结果。
在本实施例中,通过K-means聚类方法将稽查系统用户按照有无异常划分为异常用户与非异常用户两大类,具体步骤为:
11)设定聚类数目,根据稽查系统用户实际情况将聚类数目确定为k=2,即本实施例中,具有2个聚类中心;
12)随机选取两个样本点(稽查系统用户综合聚类指标数值)作为初始聚类中心,对剩余样本分别计算到2个初始聚类中心的距离,计算方法为:
其中,am表示第m个稽查系统用户综合聚类指标数值;和/>分别表示第m个稽查系统用户到初始聚类中心α和β的距离;/>和/>分别表示初始聚类中心α和β的综合聚类指标数值。
13)比较第m个稽查系统用户dmα和dmβ的差值,按照最小原则确定第m个稽查系统用户类别,完成所有稽查系统用户在2个聚类中心的初步聚类,以聚类结果为基础,通过平均值方法更新计算聚类中心和/>并计算剩余稽查系统用户到经过一次迭代后的新聚类中心的距离/>和/>
14)当迭代次数达到设定的终止次数或 δ表示极小数,迭代终止,并给出最终聚类结果;否则返回步骤12)和步骤13)进行下一轮迭代。
步骤S103:获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果。
在本实施例中,以稽查系统异常用户在用电过程中的有功功率和无功功率变化量为基础,利用改进模糊C均值聚类方法对稽查系统异常用户进行二次聚类,实现不同异常用户相对差异程度的有效描述。
作为本实施例的优选方案,所述获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果,具体为:
获取各用户的用电变化量数据;其中,所述用电变化量数据包括有功功率变化量数据和无功功率变化量数据;通过模糊C均值聚类算法,对第一聚类结果中的异常用户进行二次聚类,以使得在二次聚类过程中,根据各异常用户的聚类中心,初始化隶属度矩阵,并根据每个异常用户所对应的用电变化量数据,对所述隶属度矩阵进行迭代更新,直至迭代更新至预设条件后,从而得到包括各异常用户的多个聚类中心的第二聚类结果。
在本实施例中,基于稽查系统异常用户在用电过程中的有功功率和无功功率变化量数据,采用改进模糊C均值聚类方法对稽查系统异常用户进行二次聚类,以便于判断不同异常用户的异常程度,为后续风险预警等级制定提供支撑。
在本实施例中,二次聚类具体步骤如下:
21)不同异常用户的聚类中心cmj计算公式为:
其中,r为邻域半径;j为聚类中心的数量;A为在邻域半径范围内的异常用户数量。
22)初始化隶属度矩阵U,经过第t次迭代更新后的隶属度矩阵为:
Ut={umj}
其中,表示经过第t次迭代后第m个稽查系统异常用户属于第j个聚类中心的隶属程度,umj∈[0,1];/>表示经过第t次迭代后第m个稽查系统异常用户到第j个聚类中心的值;/>表示经过第t次迭代后第m个稽查系统异常用户到第g个聚类中心的值,g∈[1,j]。
经过第t次迭代更新后的聚类中心矩阵为:
其中,表示经过第t次迭代后第m个稽查系统异常用户到第j个聚类中心的值;K表示比例系数。
23)当迭代次数达到设定的终止次数或ξ表示极小数,迭代终止,并给出计算结果;否则返回步骤22)进行下一轮迭代。
步骤S104:根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。
在本实施例中,以二次聚类结果形成的不同聚类中心为基础,采用灰色定权聚类方法将异常用户二次聚类结果转化为适用于风险预警的评价分数,划分异常用户风险预警等级,按照预警等级级别不同分别开展稽查工作。
作为本实施例的优选方案,所述根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,具体为:
对异常用户的第二聚类结果形成的聚类中心进行归一化计算,并根据归一化计算的结果,计算不同异常用户经过二次聚类后的评价分数;根据所述评价分数,结合预设风险等级表,得到异常用户的风险预警等级。
在本实施例中,为方便于后续评价分数的转化,对异常用户二次聚类结果形成的聚类中心归一化计算,即利用极大值型方法将异常用户二次聚类形成的聚类中心进行归一化处理,计算表达式为:
其中,Hg表示第g个二次聚类中心经过归一化处理后的值;cg表示第g个二次聚类中心数值。
在本实施例中,利用灰色定权聚类方法将异常用户的二次聚类结果以聚类中心为基础转化为数值形式,计算得到不同异常用户经过二次聚类后的评价分数。
需要说明的是,二次聚类后的形成了g个聚类中心,优选地,g=5。
其中,和/>表示异常用户二次聚类结果形成的第g个聚类中心在不同风险等级中对应的评价分数。
进一步地,根据不同风险等级的评价分数计算结果,结合预先指定的风险等级表,从而得到异常用户风险预警等级,并根据不同风险预警等级制定相对应的稽查应对操作,以便于工作人员能够直接得到对应的操作选项,提高了业务工作的效率。
可示例性地,基于异常用户评价分数的风险预警等级如表1所示:
表1异常用户评价分数的风险等级表
其中,风险预警等级与二次聚类结果形成的第g个聚类中心的数量相同,以便于能够进行一一对应。
可以理解的是,本实施例全面梳理了稽查系统用户的有功功率、无功功率、检修记录频繁程度等基础指标,利用熵权法评估指标相对重要程度,计算不同指标的权重,从而形成综合聚类指标,以综合指标作为聚类中心计算基础,采用K-means聚类方法将稽查系统用户划分为非异常和异常两种类型,实现异常用户的初步辨识与检测,采用稽查系统异常用户在用电过程中的有功功率和无功功率变化量为聚类基础,利用改进模糊C均值聚类方法对稽查系统异常用户进行二次聚类,实现不同异常用户相对差异程度的有效描述与刻画,显著提升了稽查系统异常用户的辨识准确率,并基于二次聚类结果,采用灰色定权聚类方法将异常用户二次聚类结果转化为适用于风险预警的评价分数,划分异常用户风险等级,为工作人员提供用户状态感知与风险预警,以便于工作人员按照预警等级级别不同分别开展稽查工作,有效降低了稽查工作量。
实施以上实施例,具有如下效果:
本发明的技术方案通过获取各用户的历史指标数据,从而通过熵权法来评估指标相对重要程度,进而来计算不同指标的权重,从而形成综合聚类指标,以综合指标作为聚类中心计算基础,采用第一预设聚类算法得到包括非异常用户和异常用户的第一聚类结果,进而采用第二预设聚类算法来对异常用户的第一聚类结果进行二次聚类,从而得到实现不同异常用户相对差异程度的有效描述与刻画,显著提升了电网稽查系统对异常用户的辨识准确率和效率,并基于二次聚类结果转化为适用于风险预警的评价分数,划分异常用户风险等级,以便于工作人员按照预警等级级别不同分别开展电网稽查工作,有效降低了稽查工作量,提高了用户体验。
实施例二
请参阅图2,其为本发明所提供一种基于多重聚类的异常用户预警装置,包括:权重模块201、第一聚类模块202、第二聚类模块203和预警模块204。
所述权重模块201,用于获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重。
所述第一聚类模块202,用于根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;其中,所述第一聚类结果包括非异常用户和异常用户。
所述第二聚类模块203,用于获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果。
所述预警模块204,用于根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。
作为本实施例的优选方案,所述获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重,具体为:
获取各用户的历史指标数据;其中,所述历史指标数据包括有功功率、无功功率和记录数据的基础指标;通过熵权法,对每一个用户的历史指标数据进行归一化处理后,分别进行比重和信息熵值的计算;根据每一个用户的历史指标数据对应的比重和信息熵值,计算得到有功功率权重值、无功功率权重值和记录数据权重值;其中,每一个用户均有对应其历史指标数据中的有功功率权重值、无功功率权重值和记录数据权重值。
作为本实施例的优选方案,所述比重、信息熵值和权重的计算公式为:
其中,zmn表示第m个用户的第n个历史指标数据bmn经过归一化处理的数据;pmn表示第m个用户的第n个基础指标的比重;en表示所有用户中的第n个基础指标的信息熵值;ωn表示所有用户中的第n个基础指标的权重。
作为本实施例的优选方案,所述根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果,具体为:
根据每一个用户中的各个历史指标数据对应的权重,计算得到每一个用户所对应的综合聚类指标值;通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果。
作为本实施例的优选方案,所述通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果,具体为:
以非异常用户和异常用户为聚类目标,设定聚类中心的数目;随机选取两个用户的综合聚类指标值作为初始聚类中心,对剩余用户其分别计算到初始聚类中心的距离;根据每一个用户到该两个初始聚类中心的距离及其差值,从而确定所有用户关于初始聚类中心的初步聚类,并以初始聚类结果为基础,通过平均值法更新计算聚类中心,并计算更新后的聚类中心及对应该更新后的聚类中心所剩余的用户,其对于更新后聚类中心的距离;当迭代更新至预设条件后,输出得到最终的包括非异常用户和异常用户的聚类中心的第一聚类结果。
作为本实施例的优选方案,所述获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果,具体为:
获取各用户的用电变化量数据;其中,所述用电变化量数据包括有功功率变化量数据和无功功率变化量数据;通过模糊C均值聚类算法,对第一聚类结果中的异常用户进行二次聚类,以使得在二次聚类过程中,根据各异常用户的聚类中心,初始化隶属度矩阵,并根据每个异常用户所对应的用电变化量数据,对所述隶属度矩阵进行迭代更新,直至迭代更新至预设条件后,从而得到包括各异常用户的多个聚类中心的第二聚类结果。
作为本实施例的优选方案,所述根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,具体为:
对异常用户的第二聚类结果形成的聚类中心进行归一化计算,并根据归一化计算的结果,计算不同异常用户经过二次聚类后的评价分数;根据所述评价分数,结合预设风险等级表,得到异常用户的风险预警等级。
所属领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
实施以上实施例,具有如下效果:
本发明的技术方案通过获取各用户的历史指标数据,从而通过熵权法来评估指标相对重要程度,进而来计算不同指标的权重,从而形成综合聚类指标,以综合指标作为聚类中心计算基础,采用第一预设聚类算法得到包括非异常用户和异常用户的第一聚类结果,进而采用第二预设聚类算法来对异常用户的第一聚类结果进行二次聚类,从而得到实现不同异常用户相对差异程度的有效描述与刻画,显著提升了电网稽查系统对异常用户的辨识准确率和效率,并基于二次聚类结果转化为适用于风险预警的评价分数,划分异常用户风险等级,以便于工作人员按照预警等级级别不同分别开展电网稽查工作,有效降低了稽查工作量,提高了用户体验。
实施例三
相应地,本发明还提供一种终端设备,包括:处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上任意一项实施例所述的基于多重聚类的异常用户预警方法。
该实施例的终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序、计算机指令。所述处理器执行所述计算机程序时实现上述实施例一中的各个步骤,例如图1所示的步骤S101至S104。或者,所述处理器执行所述计算机程序时实现上述装置实施例中各模块/单元的功能,例如第二聚类模块203。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。例如,所述第二聚类模块203,用于获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,示意图仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据移动终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
实施例四
相应地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任意一项实施例所述的基于多重聚类的异常用户预警方法。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于多重聚类的异常用户预警方法,其特征在于,包括:
获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重;
根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;其中,所述第一聚类结果包括非异常用户和异常用户;
获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果;
根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。
2.如权利要求1所述的一种基于多重聚类的异常用户预警方法,其特征在于,所述获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重,具体为:
获取各用户的历史指标数据;其中,所述历史指标数据包括有功功率、无功功率和记录数据的基础指标;
通过熵权法,对每一个用户的历史指标数据进行归一化处理后,分别进行比重和信息熵值的计算;
根据每一个用户的历史指标数据对应的比重和信息熵值,计算得到有功功率权重值、无功功率权重值和记录数据权重值;其中,每一个用户均有对应其历史指标数据中的有功功率权重值、无功功率权重值和记录数据权重值。
3.如权利要求2所述的一种基于多重聚类的异常用户预警方法,其特征在于,所述比重、信息熵值和权重的计算公式为:
其中,zmn表示第m个用户的第n个历史指标数据bmn经过归一化处理的数据;pmn表示第m个用户的第n个基础指标的比重;en表示所有用户中的第n个基础指标的信息熵值;ωn表示所有用户中的第n个基础指标的权重。
4.如权利要求3所述的一种基于多重聚类的异常用户预警方法,其特征在于,所述根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果,具体为:
根据每一个用户中的各个历史指标数据对应的权重,计算得到每一个用户所对应的综合聚类指标值;
通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果。
5.如权利要求4所述的一种基于多重聚类的异常用户预警方法,其特征在于,所述通过K-means聚类算法,以每一个用户的综合聚类指标值作为聚类中心的计算基础,从而得到包括非异常用户和异常用户的聚类中心的第一聚类结果,具体为:
以非异常用户和异常用户为聚类目标,设定聚类中心的数目;
随机选取两个用户的综合聚类指标值作为初始聚类中心,对剩余用户其分别计算到初始聚类中心的距离;
根据每一个用户到该两个初始聚类中心的距离及其差值,从而确定所有用户关于初始聚类中心的初步聚类,并以初始聚类结果为基础,通过平均值法更新计算聚类中心,并计算更新后的聚类中心及对应该更新后的聚类中心所剩余的用户,其对于更新后聚类中心的距离;
当迭代更新至预设条件后,输出得到最终的包括非异常用户和异常用户的聚类中心的第一聚类结果。
6.如权利要求5所述的一种基于多重聚类的异常用户预警方法,其特征在于,所述获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果,具体为:
获取各用户的用电变化量数据;其中,所述用电变化量数据包括有功功率变化量数据和无功功率变化量数据;
通过模糊C均值聚类算法,对第一聚类结果中的异常用户进行二次聚类,以使得在二次聚类过程中,根据各异常用户的聚类中心,初始化隶属度矩阵,并根据每个异常用户所对应的用电变化量数据,对所述隶属度矩阵进行迭代更新,直至迭代更新至预设条件后,从而得到包括各异常用户的多个聚类中心的第二聚类结果。
7.如权利要求6所述的一种基于多重聚类的异常用户预警方法,其特征在于,所述根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,具体为:
对异常用户的第二聚类结果形成的聚类中心进行归一化计算,并根据归一化计算的结果,计算不同异常用户经过二次聚类后的评价分数;
根据所述评价分数,结合预设风险等级表,得到异常用户的风险预警等级。
8.一种基于多重聚类的异常用户预警装置,其特征在于,包括:权重模块、第一聚类模块、第二聚类模块和预警模块;
所述权重模块,用于获取各用户的历史指标数据,并通过熵权法计算出每一个用户中的各个历史指标数据对应的权重;
所述第一聚类模块,用于根据每一个用户中的各个历史指标数据对应的权重,通过第一预设聚类算法,输出得到关于用户的第一聚类结果;其中,所述第一聚类结果包括非异常用户和异常用户;
所述第二聚类模块,用于获取各用户的用电变化量数据,并通过第二预设聚类算法,以所述用电变化量数据为基础,对所述第一聚类结果进行二次聚类,从而输出得到第二聚类结果;
所述预警模块,用于根据所述第二聚类结果形成的不同聚类中心,对所述第二聚类结果进行异常用户的风险预警等级划分,从而完成对异常用户的预警。
9.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述的基于多重聚类的异常用户预警方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至7中任意一项所述的基于多重聚类的异常用户预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311660837.4A CN117633571A (zh) | 2023-12-05 | 2023-12-05 | 一种基于多重聚类的异常用户预警方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311660837.4A CN117633571A (zh) | 2023-12-05 | 2023-12-05 | 一种基于多重聚类的异常用户预警方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117633571A true CN117633571A (zh) | 2024-03-01 |
Family
ID=90025015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311660837.4A Pending CN117633571A (zh) | 2023-12-05 | 2023-12-05 | 一种基于多重聚类的异常用户预警方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117633571A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118260789A (zh) * | 2024-05-30 | 2024-06-28 | 江苏西欧电子有限公司 | 一种基于数据分析的电能表数据存储方法及系统 |
CN118585841A (zh) * | 2024-08-06 | 2024-09-03 | 厦门工学院 | 气溶胶自适应报警方法、系统、电子设备及可读存储介质 |
-
2023
- 2023-12-05 CN CN202311660837.4A patent/CN117633571A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118260789A (zh) * | 2024-05-30 | 2024-06-28 | 江苏西欧电子有限公司 | 一种基于数据分析的电能表数据存储方法及系统 |
CN118260789B (zh) * | 2024-05-30 | 2024-08-02 | 江苏西欧电子有限公司 | 一种基于数据分析的电能表数据存储方法及系统 |
CN118585841A (zh) * | 2024-08-06 | 2024-09-03 | 厦门工学院 | 气溶胶自适应报警方法、系统、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114298863B (zh) | 一种智能抄表终端的数据采集方法及系统 | |
WO2021052031A1 (zh) | 基于统计四分位距的商品库存风险预警方法、系统及计算机可读存储介质 | |
CN117633571A (zh) | 一种基于多重聚类的异常用户预警方法及装置 | |
CN112100219B (zh) | 基于数据库查询处理的报表生成方法、装置、设备和介质 | |
CN108959187B (zh) | 一种变量分箱方法、装置、终端设备及存储介质 | |
CN111786385B (zh) | 一种电网运维方案规划方法、系统及设备 | |
WO2023103527A1 (zh) | 一种访问频次的预测方法及装置 | |
CN113516275A (zh) | 一种配电网超短期负荷预测方法、装置及终端设备 | |
CN112002949A (zh) | 一种动力电池主动均衡的监测管理方法及系统 | |
CN113220551A (zh) | 指标趋势预测及预警方法、装置、电子设备及存储介质 | |
CN113610225A (zh) | 质量评估模型训练方法、装置、电子设备及存储介质 | |
CN116049658B (zh) | 一种风电机组异常数据识别方法、系统、设备及介质 | |
CN116703109A (zh) | 一种配电网项目选取方法、装置、设备及存储介质 | |
CN116485019A (zh) | 一种数据处理方法及装置 | |
CN110728540A (zh) | 一种企业推荐方法、装置、设备和介质 | |
CN114254857A (zh) | 电力设备库存情况评价方法及服务器 | |
CN115344495A (zh) | 批量任务测试的数据分析方法、装置、计算机设备及介质 | |
CN115204501A (zh) | 企业评估方法、装置、计算机设备和存储介质 | |
CN111652281B (zh) | 信息数据的分类方法、装置及可读存储介质 | |
CN114970928A (zh) | 一种电力数据能耗分析预测方法 | |
CN111260085B (zh) | 器件更换工时评估方法、装置、设备及介质 | |
CN113705920A (zh) | 火电厂用水数据样本集的生成方法和终端设备 | |
CN110852767A (zh) | 客流量聚类方法及终端设备 | |
WO2022227213A1 (zh) | 行业推荐方法、装置、计算机设备及存储介质 | |
CN118278750B (zh) | 一种基于大数据技术的电网规划风险识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |