CN109492048A - 一种电力用户用电特性的提取方法、系统及终端设备 - Google Patents

一种电力用户用电特性的提取方法、系统及终端设备 Download PDF

Info

Publication number
CN109492048A
CN109492048A CN201910052354.3A CN201910052354A CN109492048A CN 109492048 A CN109492048 A CN 109492048A CN 201910052354 A CN201910052354 A CN 201910052354A CN 109492048 A CN109492048 A CN 109492048A
Authority
CN
China
Prior art keywords
electricity consumption
data
power consumer
consumption data
load pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910052354.3A
Other languages
English (en)
Inventor
荆志朋
邵华
王颖
张章
张倩茅
马国真
袁博
胡诗尧
李振伟
齐晓光
张丽洁
习朋
郑紫尧
刘芮
卢锦玲
马冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Original Assignee
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd filed Critical Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Priority to CN201910052354.3A priority Critical patent/CN109492048A/zh
Publication of CN109492048A publication Critical patent/CN109492048A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种电力用户用电特性的提取方法、系统及终端设备,方法包括:获取样本数据,并对所述样本数据进行处理获得目标用电数据集;通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数;通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。本发明通过将DBSCAN聚类算法和聚类有效性指标相结合,能快速提取电力用户用电特性。

Description

一种电力用户用电特性的提取方法、系统及终端设备
技术领域
本发明属于电力分析技术领域,尤其涉及一种电力用户用电特性的提取方法、系统及终端设备。
背景技术
对海量用户用电数据的有效分析不仅可以满足负荷预测、风险预警、异常检测、负荷模式提取、优化生产调度、需求响应分析等的基础工作,还可以科学地提高电网自动化水平,从而实现电网可靠、安全、经济、高效、和谐友好和用电安全的环境。
由于电力用户数据量的日益增多,现有提取电力用户用电特性的方法效率低。
发明内容
有鉴于此,本发明实施例提供了一种电力用户用电特性的提取方法、系统及终端设备,以解决现有技术中提取用户用电特性效率低的问题。
本发明实施例的第一方面提供了一种电力用户用电特性的提取方法,包括:
获取样本数据,并对所述样本数据进行处理获得目标用电数据集;
通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数;
通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
本发明实施例的第二方面提供了一种电力用户用电特性的提取系统,包括:数据获取模块,用于获取样本数据,并对所述样本数据进行处理获得目标用电数据集;
数据计算模块,用于通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数;
数据提取模块,用于通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述电力用户用电特性的提取方法的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述电力用户用电特性的提取方法的步骤。
本发明通过将DBSCAN聚类算法和聚类有效性指标相结合,能快速提取电力用户用电特性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一个实施例提供的电力用户用电特性的提取方法的流程示意图;
图2是本发明的一个实施例提供的常用无监督降维方法试验对比图;
图3是本发明的一个实施例提供的常用聚类指标与聚类数的关系;
图4是本发明的一个实施例提供的负荷模式聚类数的求算流程图;
图5是本发明的一个实施例提供的图1中步骤1的流程示意图;
图6是本发明的一个实施例提供的电力用户用电特性的提取系统的结构示意图;
图7是本发明的一个实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
本发明的说明书和权利要求书及上述附图中的术语“包括”以及其他任何变形,是指“包括但不限于”,意图在于覆盖不排他的包含。例如包含一系列步骤或单元的过程、方法或系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例1:
图1示出了本发明一实施例所提供的电力用户用电特性的提取方法的实现流程图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
如图1所示,本发明实施例所提供的一种电力用户用电特性的提取方法,包括:
S101,获取样本数据,并对所述样本数据进行处理获得目标用电数据集。
在本实施例中,获取样本数据是从大数据中提取的一部分电力用户用电的数据信息作为样本数据,数据信息包括电力用户编号或电力用户名称、对应的用电日期和用电数据采集的日期等。
S102,通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数。
在本实施例中,由于DBSCAN聚类算法的负荷模式聚类数是不确定的,所以要先确定负荷模式聚类数。
在本实施例中,改进DBSCAN聚类算法是将原始DBSCAN聚类算法和聚类有效性指标相结合,并引入二分法思想,进而形成的一种具有聚类速率快,聚类结果可靠性高的改进DBSCAN聚类算法。
S103,通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
在本发明的一个实施例中,在S101之后还包括:
S104,对所述目标用电数据集降维,得到降维后的用电数据集;
相应的,通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数,包括:
通过DBSCAN聚类算法和聚类有效性指标,计算所述降维后的用电数据集的负荷模式聚类数,所述聚类有效性指标包括:DBI指标和CHI指标。
相应的,通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线,包括:
将降维后的用电数据集还原为目标用电数据集,通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
在本实施例中,对用电数据进行处理后得到的用户典型日负荷曲线仍具有维度高的特点,使得后续聚类耗时较长。为了对海量用户进行负荷模式提取时能够进一步提高效率,有必要对高维数据进行降维处理,降维的目的是用较低维数的向量来表示负荷曲线。降维不仅能够节约数据的存储空间,还能够减少计算时间,提高算法效率。
主成分分析PCA(principal component analysis,PCA)的目标是通过某种线性投影,将高维的数据映射到低维的空间中表示,并期望在所投影的维度上数据的方差最大,以此使用较少的数据维度,同时保留住较多的原数据的特性。PCA降维不受样本标签限制,各主成分之间正交,可消除原始数据成分之间的相互影响,并且计算方法简单,易于在计算机上实现。故采用PCA对目标用电数据集中的数据进行降维。
如图2所示,常用无监督降维方法试验对比图,对当下主流的无监督降维方法如:主成分分析PCA、局部保持投影LPP、特征值提取FE进行对比分析,从而选取一种最优降维方法。随着数据量的增加,LPP用时最多,PCA用时最少,且数据量越大越明显,故选用主成分分析PCA来对样本数据进行降维最佳。
在本发明的一个实施例中,聚类有效性指标包括:DBI指标和CHI指标。
在本实施例中,如图3所示,常用聚类指标与聚类数的关系,四种常用聚类有效性指标DBI(Davies-Bouldin Index)、XBI(Xie-Beni Index)、CHI(Calinski-HarabaszIndex)和PBM进行试验,从而得到各聚类指标和聚类数的关系,实验数据取自SEAI发布的爱尔兰智能电表实际量测数据,采集频率为30min,实验数据包含24611条负荷曲线。对实验数据进行处理并聚类,从而得到图3所示关系。从图3可以看出,四种聚类指标随着聚类数目的增加都有一个最大转折点,即为对应的最优聚类数。不同的是,PBM指标数值较大,而XBI指标数值较小,若作为评价指标使用则对比效果不明显,此外,若采用单一聚类指标评价聚类结果,则可靠性不高。由于CHI与DBI指标特点具有互补性,且指标数值较为接近。故采用CHI与DBI指标相结合的方法,以提高聚类结果的准确性和稳定性。
其中,DBI指标包括:
其中,DBI(K)为DBI指标;K为负荷模式聚类数;Ca为类簇a所构成的集合;Wa为Ca中所有数据到其聚类中心的平均距离;|Cab|为Ca和Cb中心之间的距离;Wb为Cb中所有数据到其聚类中心的平均距离;na为Ca中数据xa的个数;Za为Ca中心点;Zb为Cb中心点。
可以看出DBI指标越小表示类与类之间的相似度越低,同一类内的相似度越高,从而对应的聚类数越佳。
CHI指标包括:
其中,WGSS为类内离差;BGSS为类间离差;Z为目标负荷模式聚类数集的中心;K为负荷模式聚类数;N为电力用户数;Za为类簇Ca的中心;xa为类簇Ca内的样本。
CHI指标分母衡量类内紧密性,分子衡量类间分离性,因此CHI指标越大聚类效果越好。
若采用单一聚类指标评价聚类结果,则可靠性不高。因此采用CHI与DBI指标相结合的方法,以提高聚类结果的准确性和稳定性。
在本发明的一个实施例中,S102具体包括:
S201,参数设置,其中,参数包括:最小负荷模式聚类数、最大负荷模式聚类数、DBI指标参考值、CHI指标参考值和参考权值;
S202,利用最小负荷模式聚类数、最大负荷模式聚类数和参考权值,通过DBSCAN聚类算法和聚类有效性指标,选取候选负荷模式聚类数,并计算所述候选负荷模式聚类数对应的候选DBI指标和候选CHI指标;
S203,若所述候选DBI指标小于DBI指标参考值,且候选CHI指标大于CHI指标参考值,则将所述候选负荷模式聚类数设为目标负荷模式聚类数,得到目标负荷模式聚类数集;
S204,选取目标负荷模式聚类数集中,所述目标负荷模式聚类数对应的DBI指标值和CHI指标值的差值最大的为负荷模式聚类数。
在本实施例中,根据图3,可以设置最小负荷模式聚类数Kmin=2、最大负荷模式聚类数其中N为电力用户数、DBI指标参考值λ1=0.5、CHI指标参考值λ2=0.9和参考权值α=0.5或α=0.8。
做为举例,如图4所示,负荷模式聚类数的求算流程图,参数设置:最小负荷模式聚类数Kmin、最大负荷模式聚类数Kmax、DBI指标参考值λ1、CHI指标参考值λ2和参考权值α,K的原始取值范围为{Kmin,Kmax}。
计算K=Kmin时的DBImin和CHImin,并将DBImin与λ1比较,CHImin与λ2比较,若不满足DBImin<λ1,CHImin>λ2,则Kmin不满足要求,不是负荷模式聚类数,则将Kmin舍弃;
计算Kv1=α*Kmax(取整)时的DBIv1和CHIv1,并将DBIv1与λ1比较,CHIv1与λ2比较,若不满足DBIv1<λ1,CHIv1>λ2,则Kv1不满足要求,不是负荷模式聚类数。
计算Kv2=α*Kv1(取整)时的DBIv2和CHIv2,并将DBIv与λ1比较,CHIv2与λ2比较,若不满足DBIv2<λ1,CHIv2>λ2,则Kv2不满足要求,不是负荷模式聚类数。
计算Kv3=α*Kv2(取整)时的DBIv3和CHIv3,并将DBIv3与λ1比较,CHIv3与λ2比较,若满足DBIv3<λ1,CHIv3>λ2,则Kv3满足要求,是负荷模式聚类数。
计算Kv4=α*Kv4(取整)时的DBIv4和CHIv4,并将DBIv4与λ1比较,CHIv4与λ2比较,若满足DBIv4<λ1,CHIv4>λ2,则Kv4满足要求,是负荷模式聚类数。
则将K的取值范围缩小到{Kv4,Kv3}之间,若CHIv3-DBIv3>CHIv4-DBIv4,则取Kv3为负荷模式聚类数。
如图5所示,在本发明的一个实施例中,S101具体包括:
S1101,获取样本数据,将所述样本数据拆分成与每个电力用户相对应的样本集。
在本实施例中,将样本数据拆分成与每个电力用户相对应的样本集,也就是每个用户的用电数据组成一个样本集。
作为举例,a用户的样本集为A,b用户的样本集为B…….,样本集包括电力用户名称或电力用户编号、用电日期、用电数据采集时刻和用电数据。
S1102,从所述样本集中筛选满足第一预设条件的异常用电数据。
在本实施例中,异常用电数据包括离群点和空缺值。
S1103,根据所述样本集计算得到正常替换数据,并将所述异常用电数据用所述正常替换数据替换,得到每个电力用户对应的候选用电数据集。
在本实施例中,候选用电数据集是指用正常替换数据替换异常用电数据后的样本集。
作为举例,a用户的样本集为A中的a1为异常数据,其他的a2-an为正常数据,正常替换数据为a11,用a11替换a1,则候选用电数据集包括a11,a2-an。
S1104,将每个电力用户对应的候选用电数据集归一化处理,并将所有归一化后的候选用电数据集组合得到目标用电数据集。
在本发明的一个实施例中,S1102具体包括:
S2201,将样本集中同一时刻不同用电日的数据按大小顺序排列,得到样本子集。
在本实施例中,样本集中的数据记为表示电力用户i,在s天j时刻的用电数据,i=1,2,...,N,N为电力用户总数,s=1,2,...,t,t为每个电力用户采集总天数,j=1,2,...,n,n为每天用电数据采集总数。
S2202,在样本子集中,分别计算得到处于G1和G2位置上的数值。
在本实施例中,G1和G2为前四分位和后四分位上的数值,也就是样本子集处在25%和75%位置上的数值。
S2203,利用计算得到的处于G1和G2位置上的数值,计算得到最小截断点值和最大截断点值,其中,最小截断点值和最大截断点值包括:
Q1=λdF-FL
Q2=FU+(1-λ)dF
dF=FU-FL
其中,Q1为最小截断点值;Q2为最大截断点值;FL为计算得到的处于G1位置上的数值;FU为计算得到的处于G2位置上的数值;λ为常数,λ去0.5-1,一般为0.85;G1为处于样本子集20%-30%位置上的数值;G2为处于样本子集70%-80%位置上的数值。
S2204,从样本子集中筛选出大于最大截断点值和小于最小截断点值的数据为候选异常用电数据。
S2205,从所述候选异常用电数据中,筛选满足第二预设条件的候选异常用电数据为异常用电数据,其中第二预设条件包括:
其中,为候选异常用电数据;为电力用户i第s天用电量的平均值;为电力用户i第s天用电量的方差;为电力用户i第s天j时刻的用电量;ε为预设阀值,取值范围为1-1.5,一般取1.1;n为每天用电数据采集总数;i为电力用户;j为每天用电数据采集时刻;s为用电日。
在本实施例中,满足公式为异常用电数据。
在本实施例中,由于用电数据在横向上具有相似性,短时间间隔内(一般短期用电数据采集时间间隔为30min或15min)在纵向上具有无突变性的特点,而且用电数据为单一属性数据。故提出一种“横向-纵向”法来辨别修正异常用电数据。
在横向上利用四分位法简单快速的优势来对异常用电数据进行初步定位。在横向上用四分位法对用电数据进行粗辨识后,利用短时间间隔内用电数据在纵向上无突变性的特点,对初步筛选出的候选异常用电数据在纵向上用3σ法的精确性对其进一步辨别并修正得到异常用电数据。
在本发明的一个实施例中,S1103还包括:
计算样本集中所述异常用电数据所在时刻的正常用电数据的平均值,将所述平均值记为正常替换数据。
在本发明的一个实施例中,S1104具体包括:
对异常用电数据进行处理后,取各电力用户同一时刻所有数据(不含周末)平均值作为典型日负荷曲线,每条负荷曲线表示为xi,j={xi,j,j=1,2,...,n},由于每个负荷样本具有不同的最大最小负荷,为了后续方便分析,采用如下的方法进行数据归一化
其中,x′i,j为电力用户i在j时刻数据归一化后的值;xi,j为候选用电数据集的工作日中j时刻的数据的平均值;xi,min为所有平均值中最小的平均值;xi,max为所有平均值中最大平均值。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例2:
如图6所示,本发明的一个实施例提供的电力用户用电特性的提取系统100,用于执行图1所对应的实施例中的方法步骤,其包括:
数据获取模块110,用于获取样本数据,并对所述样本数据进行处理获得目标用电数据集;
数据计算模块120,用于通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数;
数据提取模块130,用于通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
在本发明的一个实施例中,数据获取模块110包括:
数据获取单元,用于获取样本数据,将所述样本数据拆分成与每个电力用户相对应的样本集;
第一处理单元,用于从所述样本集中筛选满足第一预设条件的异常用电数据;
第二处理单元,用于根据所述样本集计算得到正常替换数据,并将所述异常用电数据用所述正常替换数据替换,得到每个电力用户对应的候选用电数据集;
归一化单元,用于将每个电力用户对应的候选用电数据集归一化处理,并将所有归一化后的候选用电数据集组合得到目标用电数据集。
在本发明的一个实施例中,第一处理单元包括:
数据处理子单元,用于将样本集中同一时刻不同用电日的数据按大小顺序排列,得到样本子集;
第一计算子单元,用于在样本子集中,分别计算得到处于G1和G2位置上的数值;
第二计算子单元,用于利用计算得到的处于G1和G2位置上的数值,计算得到最小截断点值和最大截断点值,其中,最小截断点值和最大截断点值包括:
Q1=λdF-FL
Q2=FU+(1-λ)dF
dF=FU-FL
其中,Q1为最小截断点值;Q2为最大截断点值;FL为计算得到的处于G1位置上的数值;FU为计算得到的处于G2位置上的数值;λ为常数;G1为处于样本子集20%-30%位置上的数值;G2为处于样本子集70%-80%位置上的数值;
第一数据筛选子单元,用于从样本子集中筛选出大于最大截断点值和小于最小截断点值的数据为候选异常用电数据;
第二数据筛选子单元,用于从所述候选异常用电数据中,筛选满足第二预设条件的候选异常用电数据为异常用电数据,其中第二预设条件包括:
其中,为候选异常用电数据;为电力用户i第s天用电量的平均值;为电力用户i第s天用电量的方差;为电力用户i第s天j时刻的用电量;ε为预设阀值;n为每天用电数据采集总数;i为电力用户;j为每天用电数据采集时刻;s为用电日。
在本发明的一个实施例中,第二处理单元还用于:
计算样本集中所述异常用电数据所在时刻的正常用电数据的平均值,将所述平均值记为正常替换数据。
在本发明的一个实施例中,归一化单元用于:
其中,x′i,j为电力用户i在j时刻数据归一化后的值;xi,j为候选用电数据集的工作日中j时刻的数据的平均值;xi,min为所有平均值中最小的平均值;xi,max为所有平均值中最大平均值。
在本发明的一个实施例中,与数据获取模块110相连的还包括:
对所述目标用电数据集降维,得到降维后的用电数据集;
相应的,通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数,包括:
通过DBSCAN聚类算法和聚类有效性指标,计算所述降维后的用电数据集的负荷模式聚类数,所述聚类有效性指标包括:DBI指标和CHI指标。
在本发明的一个实施例中,数据提取模块130包括:
参数设置单元,用于参数设置,其中,参数包括:最小负荷模式聚类数、最大负荷模式聚类数、DBI指标参考值、CHI指标参考值和参考权值;
数据计算单元,用于利用最小负荷模式聚类数、最大负荷模式聚类数和参考权值,通过DBSCAN聚类算法和聚类有效性指标,选取候选负荷模式聚类数,并计算所述候选负荷模式聚类数对应的候选DBI指标和候选CHI指标;
判断单元,用于若所述候选DBI指标小于DBI指标参考值,且候选CHI指标大于CHI指标参考值,则将所述候选负荷模式聚类数设为目标负荷模式聚类数,得到目标负荷模式聚类数集;
数据选择单元,用于选取目标负荷模式聚类数集中,所述目标负荷模式聚类数对应的DBI指标值和CHI指标值的差值最大的为负荷模式聚类数。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即所述电力用户用电特性的提取系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述电力用户用电特性的提取系统中模块的具体工作过程,可以参考前述方法实施例1中的对应过程,在此不再赘述。
实施例3:
图7是本发明一实施例提供的终端设备的示意图。如图7所示,该实施例的终端设备7包括:处理器70、存储器71以及存储在所述存储器71中并可在所述处理器70上运行的计算机程序72。所述处理器70执行所述计算机程序72时实现如实施例1中所述的各实施例中的步骤,例如图1所示的步骤S101至S103。或者,所述处理器70执行所述计算机程序72时实现如实施例2中所述的各系统实施例中的各模块/单元的功能,例如图6所示模块110至130的功能。
所述终端设备7是指具有数据处理能力的终端,包括但不限于计算机、工作站、服务器,甚至是一些性能优异的智能手机、掌上电脑、平板电脑、个人数字助理(PDA)、智能电视(Smart TV)等。终端设备上一般都安装有操作系统,包括但不限于:Windows操作系统、LINUX操作系统、安卓(Android)操作系统、Symbian操作系统、Windows mobile操作系统、以及iOS操作系统等等。以上详细罗列了终端设备7的具体实例,本领域技术人员可以意识到,终端设备并不限于上述罗列实例。
所述终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是终端设备7的示例,并不构成对终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备7还可以包括输入输出设备、网络接入设备、总线等。
所称处理器70可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器71可以是所述终端设备7的内部存储单元,例如终端设备7的硬盘或内存。所述存储器71也可以是所述终端设备7的外部存储设备,例如所述终端设备7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器71还可以既包括所述终端设备7的内部存储单元也包括外部存储设备。所述存储器71用于存储所述计算机程序以及所述终端设备7所需的其他程序和数据。所述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
实施例4:
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如实施例1中所述的各实施例中的步骤,例如图1所示的步骤S101至步骤S103。或者,所述计算机程序被处理器执行时实现如实施例2中所述的各系统实施例中的各模块/单元的功能,例如图6所示的模块110至130的功能。
所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
在上述实施例中,对各个实施例的描述都各有侧重,实施例1至4可以任意组合,组合后形成的新的实施例也在本申请的保护范围之内。某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的系统/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种电力用户用电特性的提取方法,其特征在于,包括:
获取样本数据,并对所述样本数据进行处理获得目标用电数据集;
通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数;
通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
2.如权利要求1所述的电力用户用电特性的提取方法,其特征在于,所述获取样本数据,并对所述样本数据进行处理获得目标用电数据集包括:
获取样本数据,将所述样本数据拆分成与每个电力用户相对应的样本集;
从所述样本集中筛选满足第一预设条件的异常用电数据;
根据所述样本集计算得到正常替换数据,并将所述异常用电数据用所述正常替换数据替换,得到每个电力用户对应的候选用电数据集;
将每个电力用户对应的候选用电数据集归一化处理,并将所有归一化后的候选用电数据集组合得到目标用电数据集。
3.如权利要求2所述的电力用户用电特性的提取方法,其特征在于,所述从所述样本集中筛选满足第一预设条件的异常用电数据,包括:
将样本集中同一时刻不同用电日的数据按大小顺序排列,得到样本子集;
在样本子集中,分别计算得到处于G1和G2位置上的数值;
利用计算得到的处于G1和G2位置上的数值,计算得到最小截断点值和最大截断点值,其中,最小截断点值和最大截断点值包括:
Q1=λdF-FL
Q2=FU+(1-λ)dF
dF=FU-FL
其中,Q1为最小截断点值;Q2为最大截断点值;FL为计算得到的处于G1位置上的数值;FU为计算得到的处于G2位置上的数值;λ为常数;G1为处于样本子集20%-30%位置上的数值;G2为处于样本子集70%-80%位置上的数值;
从样本子集中筛选出大于最大截断点值和小于最小截断点值的数据为候选异常用电数据;
从所述候选异常用电数据中,筛选满足第二预设条件的候选异常用电数据为异常用电数据,其中第二预设条件包括:
其中,为候选异常用电数据;为电力用户i第s天用电量的平均值;为电力用户i第s天用电量的方差;为电力用户i第s天j时刻的用电量;ε为预设阀值;n为每天用电数据采集总数;i为电力用户;j为每天用电数据采集时刻;s为用电日。
4.如权利要求2所述的电力用户用电特性的提取方法,其特征在于,所述根据所述样本集计算得到正常替换数据,包括:
计算样本集中所述异常用电数据所在时刻的正常用电数据的平均值,将所述平均值记为正常替换数据。
5.如权利要求2所述的电力用户用电特性的提取方法,其特征在于,所述将每个电力用户对应的候选用电数据集归一化处理,包括:
其中,x′i,j为电力用户i在j时刻数据归一化后的值;xi,j为候选用电数据集的工作日中j时刻的数据的平均值;xi,min为所有平均值中最小的平均值;xi,max为所有平均值中最大平均值。
6.如权利要求1所述的电力用户用电特性的提取方法,其特征在于,在得到所述目标用电数据集之后,还包括:
对所述目标用电数据集降维,得到降维后的用电数据集;
相应的,通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数,包括:
通过DBSCAN聚类算法和聚类有效性指标,计算所述降维后的用电数据集的负荷模式聚类数,所述聚类有效性指标包括:DBI指标和CHI指标。
7.如权利要求6所述的电力用户用电特性的提取方法,其特征在于,所述通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数,包括:
参数设置,其中,参数包括:最小负荷模式聚类数、最大负荷模式聚类数、DBI指标参考值、CHI指标参考值和参考权值;
利用最小负荷模式聚类数、最大负荷模式聚类数和参考权值,通过DBSCAN聚类算法和聚类有效性指标,选取候选负荷模式聚类数,并计算所述候选负荷模式聚类数对应的候选DBI指标和候选CHI指标;
若所述候选DBI指标小于DBI指标参考值,且候选CHI指标大于CHI指标参考值,则将所述候选负荷模式聚类数设为目标负荷模式聚类数,得到目标负荷模式聚类数集;
选取目标负荷模式聚类数集中,所述目标负荷模式聚类数对应的DBI指标值和CHI指标值的差值最大的为负荷模式聚类数。
8.一种电力用户用电特性的提取系统,其特征在于,包括:
数据获取模块,用于获取样本数据,并对所述样本数据进行处理获得目标用电数据集;
数据计算模块,用于通过DBSCAN聚类算法和聚类有效性指标,计算所述目标用电数据集的负荷模式聚类数;
数据提取模块,用于通过所述DBSCAN聚类算法,将所述目标用电数据集按照所述负荷模式聚类数聚类,得到电力用户用电特性曲线。
9.一种终端设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述电力用户用电特性的提取方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述电力用户用电特性的提取方法的步骤。
CN201910052354.3A 2019-01-21 2019-01-21 一种电力用户用电特性的提取方法、系统及终端设备 Pending CN109492048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910052354.3A CN109492048A (zh) 2019-01-21 2019-01-21 一种电力用户用电特性的提取方法、系统及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910052354.3A CN109492048A (zh) 2019-01-21 2019-01-21 一种电力用户用电特性的提取方法、系统及终端设备

Publications (1)

Publication Number Publication Date
CN109492048A true CN109492048A (zh) 2019-03-19

Family

ID=65714802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910052354.3A Pending CN109492048A (zh) 2019-01-21 2019-01-21 一种电力用户用电特性的提取方法、系统及终端设备

Country Status (1)

Country Link
CN (1) CN109492048A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401420A (zh) * 2020-03-06 2020-07-10 普迪飞半导体技术(上海)有限公司 晶圆测试的异常数据聚类方法、装置、电子设备与介质
CN111724278A (zh) * 2020-06-11 2020-09-29 国网吉林省电力有限公司 一种面向电力多元负荷用户的精细分类方法及系统
CN111915107A (zh) * 2019-05-07 2020-11-10 华北电力大学 一种基于动态聚类的负荷分群控制方法
CN112163781A (zh) * 2020-10-15 2021-01-01 国网冀北电力有限公司智能配电网中心 基于多维度指标聚类的园区用电群体生命周期评价方法
CN112381137A (zh) * 2020-11-10 2021-02-19 重庆大学 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN112700069A (zh) * 2021-01-15 2021-04-23 国家电网有限公司 一种含储能的区域配电网短期负荷预测方法
CN113449793A (zh) * 2021-06-28 2021-09-28 国网北京市电力公司 用电状态的确定方法及装置
CN113780452A (zh) * 2021-09-16 2021-12-10 国网北京市电力公司 独居群体的监控方法、监控装置以及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646354A (zh) * 2013-11-28 2014-03-19 国家电网公司 基于有效指标fcm和rbf神经网络的变电站负荷特性分类方法
CN105184394A (zh) * 2015-08-26 2015-12-23 中国电力科学研究院 基于配电网cps在线数据挖掘的优化控制方法
CN106204335A (zh) * 2016-07-21 2016-12-07 广东工业大学 一种电价执行异常判断方法、装置及系统
CN106354803A (zh) * 2016-08-26 2017-01-25 清华大学 基于特性指标的电力输变电设备负荷坏数据检测算法
CN106529704A (zh) * 2016-10-31 2017-03-22 国家电网公司 月最大电力负荷预测方法及装置
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107784518A (zh) * 2017-09-20 2018-03-09 国网浙江省电力公司电力科学研究院 一种基于多维指标的电力客户细分方法
CN108412710A (zh) * 2018-01-30 2018-08-17 同济大学 一种风电机组风功率数据清洗方法
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646354A (zh) * 2013-11-28 2014-03-19 国家电网公司 基于有效指标fcm和rbf神经网络的变电站负荷特性分类方法
CN105184394A (zh) * 2015-08-26 2015-12-23 中国电力科学研究院 基于配电网cps在线数据挖掘的优化控制方法
CN106204335A (zh) * 2016-07-21 2016-12-07 广东工业大学 一种电价执行异常判断方法、装置及系统
CN106354803A (zh) * 2016-08-26 2017-01-25 清华大学 基于特性指标的电力输变电设备负荷坏数据检测算法
CN106529704A (zh) * 2016-10-31 2017-03-22 国家电网公司 月最大电力负荷预测方法及装置
CN107423769A (zh) * 2017-08-03 2017-12-01 四川大学 基于形态特征的电力负荷曲线自适应聚类方法
CN107784518A (zh) * 2017-09-20 2018-03-09 国网浙江省电力公司电力科学研究院 一种基于多维指标的电力客户细分方法
CN108412710A (zh) * 2018-01-30 2018-08-17 同济大学 一种风电机组风功率数据清洗方法
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915107A (zh) * 2019-05-07 2020-11-10 华北电力大学 一种基于动态聚类的负荷分群控制方法
CN111401420A (zh) * 2020-03-06 2020-07-10 普迪飞半导体技术(上海)有限公司 晶圆测试的异常数据聚类方法、装置、电子设备与介质
CN111401420B (zh) * 2020-03-06 2023-04-18 普迪飞半导体技术(上海)有限公司 晶圆测试的异常数据聚类方法、装置、电子设备与介质
CN111724278A (zh) * 2020-06-11 2020-09-29 国网吉林省电力有限公司 一种面向电力多元负荷用户的精细分类方法及系统
CN112163781A (zh) * 2020-10-15 2021-01-01 国网冀北电力有限公司智能配电网中心 基于多维度指标聚类的园区用电群体生命周期评价方法
CN112381137A (zh) * 2020-11-10 2021-02-19 重庆大学 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN112381137B (zh) * 2020-11-10 2024-06-07 重庆大学 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN112700069A (zh) * 2021-01-15 2021-04-23 国家电网有限公司 一种含储能的区域配电网短期负荷预测方法
CN112700069B (zh) * 2021-01-15 2024-04-19 国网湖北省电力有限公司经济技术研究院 一种含储能的区域配电网短期负荷预测方法
CN113449793A (zh) * 2021-06-28 2021-09-28 国网北京市电力公司 用电状态的确定方法及装置
CN113780452A (zh) * 2021-09-16 2021-12-10 国网北京市电力公司 独居群体的监控方法、监控装置以及电子设备
CN113780452B (zh) * 2021-09-16 2024-06-14 国网北京市电力公司 独居群体的监控方法、监控装置以及电子设备

Similar Documents

Publication Publication Date Title
CN109492048A (zh) 一种电力用户用电特性的提取方法、系统及终端设备
CN110347732A (zh) 一种数据转换方法及装置
CN107678845A (zh) 应用程序管控方法、装置、存储介质及电子设备
CN107704070A (zh) 应用清理方法、装置、存储介质及电子设备
CN109740630A (zh) 异常数据处理方法及装置
CN107463683A (zh) 代码元素的命名方法及终端设备
CN107248031B (zh) 一种针对负荷曲线峰谷差的快速电力用户分类方法
CN107894827A (zh) 应用清理方法、装置、存储介质及电子设备
KR102472573B1 (ko) 전기 이용 고객 데이터 군집 분석 방법
CN109241357A (zh) 链式结构模型及其构建方法、系统和终端设备
CN110069546A (zh) 一种数据分类方法、数据分类装置及终端设备
CN110543889A (zh) 电力负荷分层聚类方法、装置、计算机设备及存储介质
CN110445558A (zh) 性能测试方法、装置及终端设备
CN111078803A (zh) 一种基于非侵入式技术的负荷事件多维特征匹配方法与系统
CN113987152B (zh) 一种知识图谱抽取方法、系统、电子设备及介质
CN110389932A (zh) 电力文件自动分类方法及装置
CN110543426A (zh) 一种软件性能风险检测方法及装置
CN109848052A (zh) 一种货物分拣的方法及终端设备
CN109961163A (zh) 性别预测方法、装置、存储介质及电子设备
CN107645583A (zh) 一种联系人排序方法、移动终端及计算机可读存储介质
CN108280224B (zh) 万级维度数据生成方法、装置、设备以及存储介质
CN113743519B (zh) 电网母线典型负荷曲线识别方法
CN113935407A (zh) 一种异常行为识别模型确定方法及装置
CN102254288A (zh) 一种用于银行进行风险缓释的数据处理方法及系统
CN111768066A (zh) 基于融合特征的园区电热负荷耦合关系分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190319