CN112163595B - 用户典型用电模式的获取方法、获取装置和电子设备 - Google Patents
用户典型用电模式的获取方法、获取装置和电子设备 Download PDFInfo
- Publication number
- CN112163595B CN112163595B CN202010903047.4A CN202010903047A CN112163595B CN 112163595 B CN112163595 B CN 112163595B CN 202010903047 A CN202010903047 A CN 202010903047A CN 112163595 B CN112163595 B CN 112163595B
- Authority
- CN
- China
- Prior art keywords
- consensus
- cluster
- clustering
- sample
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明公开了一种用户典型用电模式的获取方法、获取装置和电子设备,该方法包括:获取待分析用户的智能电表的历史负荷数据,提取历史负荷数据中的负荷点以生成日负荷曲线集;对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,对处理后的日负荷曲线集进行归一化处理以获得完整样本集;获取计算参数;针对每一种用电模式数目,重复进行多轮k‑均值聚类以获得聚类结果,根据聚类结果确定探测区间内的最优值,在最优值对应的用电模式数目下,对完整样本集进行k‑均值聚类以获得目标聚类结果,并根据目标聚类结果计算样本‑簇共识度,剔除共识度低的样本,计算簇共识度,剔除共识度低的簇,计算剩余簇的平均负荷曲线以获得用户典型用电模式。
Description
技术领域
本发明涉及电力系统负荷分析技术领域,特别涉及一种用户典型用电模式的获取方法、用户典型用电模式的获取装置、电子设备和非临时性计算机可读存储介质。
背景技术
近年来,随着智能电表在用户侧的不断普及,可获取的用户用电数据规模不断增加,数据驱动的方法正在逐步替代传统物理建模方法,在用户用电行为分析领域得到广泛应用。一般来说,用户都有着相对固定的用电习惯,因此虽然其负荷存在一定的随机性和波动性,但也蕴含着很强的规律性。通过对用户历史负荷数据的分析,能够辨识用户的典型用电模式。对用户用电模式的辨识,一方面有助于电网公司或负荷聚合商设计合适的需求响应策略和负荷管理办法,另一方面也有助于提升配网及母线负荷预测精度,提升电力系统运行的稳定性和经济性。传统物理建模方法通过对用户用电设备建立电气模型和使用模型得到其典型用电模式,存在精度低、成本高等缺点。数据驱动方法直接从用户历史负荷数据中根据统计规律提取典型用电模式,具有模型简单、精度高等优点。因而,相较传统模型,数据驱动的方法应用更加广泛。
目前,用户的典型用电模式辨识主要通过数据驱动的聚类方法实现,相关技术已经成为行业研究热点。来自合肥工业大学的学者们在综述中指出,比较常用的用户负荷聚类方法包括k-均值聚类、模糊c-均值聚类、自组织映射和层次聚类(K.Zhou,S.Yang,C.Shen,A review of electric load classification in smart grid environment[J].Renewable and Sustainable Energy Reviews,2013,24:103-110)。东芬兰大学的研究者提出了将自组织映射和经典无监督聚类算法(如层次聚类、k-均值聚类等)结合的用户负荷曲线分类方法,并应用于芬兰北部3989户终端用户负荷数据集,结果表明,自组织映射和k-均值聚类结合的办法相比其他组合具有一定的优越性(T.D.Voukantsis,H.Niska,et.al.Data-based method for creating electricity use load profilesusing large amount of customer-specific hourly measured electricity use data[J].Applied Energy,2010,87(11):3538–3545)。都柏林理工大学的研究者比较了k-均值、k-中心点和自组织映射三种方法在提取用户典型用电模式中的优劣,结果表明,k-均值和自组织映射具有相近的表现,但均显著优于k-中心点(F.McLoughlin,A.Duffy,M.Conlon,Aclustering approach to domestic electricity load profile characterisationusing smart metering data[J].Applied energy,2015,141,190-199)。巴斯大学的研究者提出了一种多分辨率的用户负荷聚类算法,通过提取时域负荷信号的频谱特征,直接在频域对负荷曲线进行聚类。该方法在爱尔兰6369户终端用户负荷数据集上的表现优于普通的k-均值聚类方法(R.Li,F.Li,N.D.Smith,Multi-Resolution Load Profile Clusteringfor Smart Metering Data[J].IEEE Transactions on Power Systems,2016,31(6):4473-4482)。鲁汶大学的研究者提出了一种用户负荷建模方法,该方法使用k-均值聚类辨识典型用电模式(W.Labeeuw,G.Deconinck,Residential Electrical Load Model Basedon Mixture Model Clustering and Markov Models[J],IEEE Transactions onIndustrial Informatics,2013,9(3):1561-1569)。华北电力大学的研究者比较了k-均值聚类、模糊c-均值聚类、自组织映射三种方法,得出k-均值聚类略优于模糊c-均值聚类,显著优于自组织映射的结论(T.Zhang,G.Zhang,J.Lu,et.al.A new index andclassification approach for load pattern analysis of large electricitycustomers[J],IEEE Transactions on Power Systems,2012,27(1):153-160)。
目前,已有研究表明,k-均值聚类具有普适、简便、快速、可靠等优点,适用于负荷曲线聚类任务。然而,k-均值聚类存在两大主要问题,一是需要提前确定k值,二是聚类结果容易受到异常数据影响。随着安装智能电表的用户群体规模不断增加,用户之间的差异性增强,难以对不同用户提前设置准确的用电模式数目。同时,由于用户负荷的波动性大,随机性强,原始k-均值聚类的结果不稳定,容易受到极端用电情况的影响,从而导致辨识出的典型用电模式失真。
发明内容
本发明旨在至少在一定程度上解决上述技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种用户典型用电模式的获取方法,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
本发明的第二个目的在于提出一种用户典型用电模式的获取装置。
本发明的第三个目的在于提出一种电子设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
为达到上述目的,本发明第一方面实施例提出了一种用户典型用电模式的获取方法,包括:步骤S1,获取待分析用户的智能电表的历史负荷数据,并提取所述历史负荷数据中的负荷点以生成日负荷曲线集;步骤S2,对所述日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集;步骤S3,获取计算参数,其中,所述计算参数包括:用户典型用电模式数目探测区间、所述探测区间对应的用电模式数目、每次参与聚类的样本数量、簇共识度检验阈值和样本-簇共识度检验阈值;步骤S4,针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据所述聚类结果计算共识矩阵和共识指数分布,以及根据所述共识矩阵和所共识指数分布确定所述探测区间内的最优值,其中,每轮聚类的样本随机采样自所述完整样本集;步骤S5,在所述最优值对应的用电模式数目下,对所述完整样本集进行k-均值聚类以获得目标聚类结果,并根据所述目标聚类结果计算目标共识矩阵,以及根据所述目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集;步骤S6,对所述样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据所述目标共识矩阵计算簇共识度以获得簇共识度集;步骤S7,对所述簇共识度集进行处理以剔除共识度低于所述簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。
根据本发明实施例的用户典型用电模式的获取方法,首先获取待分析用户的智能电表的历史负荷数据,并提取历史负荷数据中的负荷点以生成日负荷曲线集,以及对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集。然后获取计算参数,并针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据聚类结果计算共识矩阵和共识指数分布,以及根据共识矩阵和所共识指数分布确定探测区间内的最优值,其中,每轮聚类的样本随机采样自完整样本集,最后在最优值对应的用电模式数目下,对完整样本集进行k-均值聚类以获得目标聚类结果,并根据目标聚类结果计算目标共识矩阵,根据目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集,以及对样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据目标共识矩阵计算簇共识度以获得簇共识度集,对簇共识度集进行处理以剔除共识度低于簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。由此,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
另外,根据本发明上述实施例提出的用户典型用电模式的获取方法还可以具有如下附加的技术特征:
在本发明的一个实施例中,所述步骤S2,具体包括:
获取所述待分析用户的历史负荷最大值lmax和最小值lmin,并根据所述历史负荷最大值lmax和最小值lmin,通过以下公式对所述日负荷曲线集合中的日负荷曲线逐元素归一化:
在本发明的一个实施例中,所述步骤S4,具体包括:
步骤S41,将所述探测区间记作[2,Kmax],k-均值聚类执行次数记作H,所述每次参与聚类的样本数量记作NS,所述样本-簇共识度检验阈值记作m0,所述簇共识度检验阈值记作n0,所述NS小于N;
步骤S42,对任一k∈[2,Kmax],连续进行H轮k-均值聚类,其中,每轮聚类下标记作h,当第h轮聚类开始前,从所述完整样本集中随机选取NS个样本,样本下标构成的集合记为Dh。计算N×N阶指示矩阵Ih:
其中,所述i和j为集合Dh中的任意元素,对选中的样本进行k-均值聚类,聚类时样本之间的相似度定义为两条负荷曲线之间的欧氏距离:
H次聚类后,得到连接矩阵序列M1,M2,...,MH和指示矩阵序列I1,I2,...,IH;
步骤S43,根据多轮聚类的结果计算N×N阶共识矩阵CK:
其中,1{cond}为指示函数,当cond成立时函数值为1,否则为0。求离散累积概率分布函数的级数:
在本发明的一个实施例中,所述步骤S5、所述步骤S6和所步骤S7,具体包括:
在剩余负荷曲线的基础上计算簇共识度:
计算留存簇的平均日负荷曲线:
对平均负荷曲线去归一化,得到用户典型用电模式:
为达到上述目的,本发明第二方面实施例提出了一种用户典型用电模式的获取装置,包括:第一获取模块,用于获取待分析用户的智能电表的历史负荷数据,并提取所述历史负荷数据中的负荷点以生成日负荷曲线集;归一化处理模块,用于对所述日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集;第二获取模块,用于获取计算参数,其中,所述计算参数包括:用户典型用电模式数目探测区间、所述探测区间对应的用电模式数目、每次参与聚类的样本数量、簇共识度检验阈值和样本-簇共识度检验阈值;确定模块,用于针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据所述聚类结果计算共识矩阵和共识指数分布,以及根据所述共识矩阵和所共识指数分布确定所述探测区间内的最优值,其中,每轮聚类的样本随机采样自所述完整样本集;第三获取模块,用于在所述最优值对应的用电模式数目下,对所述完整样本集进行k-均值聚类以获得目标聚类结果,并根据所述目标聚类结果计算目标共识矩阵,以及根据所述目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集;第四获取模块,用于对所述样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据所述目标共识矩阵计算簇共识度以获得簇共识度集;计算模块,用于对所述簇共识度集进行处理以剔除共识度低于所述簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。
本发明实施例的用户典型用电模式的获取装置,通过第一获取模块获取待分析用户的智能电表的历史负荷数据,并提取历史负荷数据中的负荷点以生成日负荷曲线集,通过归一化处理模块对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集,通过第二获取模块获取计算参数,通过确定模块针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据聚类结果计算共识矩阵和共识指数分布,以及根据共识矩阵和所共识指数分布确定探测区间内的最优值,通过第三获取模块在最优值对应的用电模式数目下,对完整样本集进行k-均值聚类以获得目标聚类结果,并根据目标聚类结果计算目标共识矩阵,以及根据目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集,通过第四获取模块对样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据目标共识矩阵计算簇共识度以获得簇共识度集,通过计算模块对簇共识度集进行处理以剔除共识度低于簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。由此,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
为达到上述目的,本发明第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如本发明第一方面实施例所述的用户典型用电模式的获取方法。
本发明实施例的电子设备,通过处理器执行存储在存储器上的计算机程序,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
为达上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如本发明第一方面实施例所述的用户典型用电模式的获取方法。
本发明实施例的非临时性计算机可读存储介质,通过执行其存储的计算机程序,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的用户典型用电模式的获取方法的流程图;以及
图2是根据本发明一个实施例的用户典型用电模式的获取装置的方框示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面结合附图来描述本发明实施例的用户典型用电模式的获取方法、用户典型用电模式的获取装置、电子设备和非临时性计算机可读存储介质。
本发明实施例,针对相关技术中,传统聚类算法应用于用户典型用电模式辨识中存在的无法准确设置超参数,尤其是用电模式数目以及辨识结果波动性大,不稳定等问题,提出一种用户典型用电模式的获取方法。
图1是根据本发明一个实施例的用户典型用电模式的获取方法的流程图。在本发明的实施例中,本发明的用户典型用电模式的获取方法可适用于电网公司、配电公司和电力交易中心的实际应用。
如图1所示,本发明实施例的用户典型用电模式的获取方法,可包括以下步骤:
S1,获取待分析用户的智能电表的历史负荷数据,并提取历史负荷数据中的负荷点以生成日负荷曲线集。其中,历史负荷数据可包括智能电表计量信息。
在本发明的实施例中,智能电表可将历史负荷数据上传至云服务器中,从而方便相关工作人员获取,或者将历史负荷数据直接存储在本地的存储空间中。
具体地,相关工作人员可直接连接相关的云服务器,获取待分析用户的智能电表的历史负荷数据,或者直接从本地的存储空间中获取。然后,按照“天”为单位提取历史负荷数据中的负荷点以生成日负荷曲线集。应说明的是,该实施例中所描述的日负荷曲线集可包括待分析用户的智能电表每天的日负荷曲线。
S2,对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集。
剔除日负荷曲线集中存在缺失数据的日负荷曲线,以生成日负荷曲线集合其中,i为小于等于N的正整数i=1,...,N,N为日负荷曲线集合中日负荷曲线的数量。获取待分析用户的历史负荷最大值lmax和最小值lmin,并根据历史负荷最大值lmax和最小值lmin,通过以下公式对日负荷曲线集合中的日负荷曲线逐元素归一化:将归一化后的负荷曲线集合作为完整样本集,其中,为负荷曲线中的元素归一化后的值。
S3,获取计算参数,其中,计算参数包括:用户典型用电模式数目探测区间、探测区间对应的用电模式数目、每次参与聚类的样本数量、簇共识度检验阈值和样本-簇共识度检验阈值。
在本发明的实施例中,探测区间、样本-簇共识度检验阈值和簇共识度检验阈值均可根据实际情况进行标定,例如,探测区间可为[2,10],样本-簇共识度检验阈值可为0.2,簇共识度检验阈值可为0.05。
S4,针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据聚类结果计算共识矩阵和共识指数分布,以及根据共识矩阵和所共识指数分布确定探测区间内的最优值,其中,每轮聚类的样本随机采样自完整样本集。
进一步而言,步骤S4,具体包括:
步骤S42,对任一k∈[2,Kmax],连续进行H轮k-均值聚类,其中,每轮聚类下标记作h,当第h轮聚类开始前,从完整样本集中随机选取NS个样本,样本下标构成的集合记为Dh。计算N×N阶指示矩阵Ih:其中,i和j为集合Dh中的任意元素,对选中的样本进行k-均值聚类,聚类时样本之间的相似度定义为两条负荷曲线之间的欧氏距离:在第h次聚类中,被分入的簇记作Θh(i),根据聚类结果计算N×N阶连接矩阵Mh:经过H次聚类后,得到连接矩阵序列M1,M2,...,MH和指示矩阵序列I1,I2,...,IH。
步骤S43,根据多轮聚类的结果计算N×N阶共识矩阵CK:其中,共识矩阵元素CK(i,j)为样本i和样本j的共识指数;将共识矩阵上三角元素从小到大排列,得到序列计算共识指数的离散累积概率分布函数:其中,1{cond}为指示函数,当cond成立时函数值为1,否则为0。求离散累积概率分布函数的级数:其中,
需要说明的是,上述实施例中所描述的k-均值聚类,可以是一种迭代求解的聚类算法,将多个主体按照距离远近划分为k个簇。该聚类算法具体步骤包括:随机选取k个样本作为聚类中心;计算各样本与各聚类中心之间的距离;将各样本划归至距离最近的聚类中心;计算各簇的样本均值,作为新的聚类中心;判定簇中心不再发生变化或达到迭代次数,算法结束,否则回到第二步。k-均值聚类需要提前设置簇数目k和定义样本距离,其理论和应用可详见A.K.Jain.Data clustering:50years beyond K-means[J]//Patternrecognition letters.2010,31(8):651-666。
S5,在最优值对应的用电模式数目下,对完整样本集进行k-均值聚类以获得目标聚类结果,并根据目标聚类结果计算目标共识矩阵,以及根据目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集。
S6,对样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据目标共识矩阵计算簇共识度以获得簇共识度集。
S7,对簇共识度集进行处理以剔除共识度低于簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。
进一步而言,步骤S5、步骤S6和所步骤S7,具体可包括:对完整样本集中全体样本进行k-均值聚类,将其分为Kopt类,聚类完成后,簇k中样本下标构成的集合为Ωk,负荷曲线的类别记作Θ(i),而后根据步骤43中的操作计算目标共识矩阵C。
对于负荷曲线计算其与所在簇Θ(i)的共识度(即,样本-簇共识度):其中,|ΩΘ(i)|为簇Θ(i)中所含元素个数;剔除mi<m0的曲线,簇k中样本下标构成的集合为在剩余负荷曲线的基础上计算簇共识度:移除nk<n0的簇,剩余簇的数量记为
计算留存簇的平均日负荷曲线:对平均负荷曲线去归一化,得到用户典型用电模式:由此,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性,同时利用本发明的用户典型用电模式的获取方法,还能够在没有先验知识的情况下对用户用电行为分类并得出具有鲁棒性的典型用电模式。
在本发明的实施例中,实现了对智能电表采集负荷数据的利用,建立了基于共识度检验的用户典型用电模式辨识,相比于现有方法,本发明的方法通过共识度检验为基础聚类算法超参数的选择提供了可靠办法,考虑到用户负荷的波动性和随机性,本发明的方法通过多轮聚类求期望,共识度检验剔除极端样本和极端类别,提升了聚类结果的鲁棒性,使得辨识结果准确可靠。应用本发明的方法,能够更好地对用户负荷模式进行辨识,一方面有助于电网公司或负荷聚合商设计合适的需求响应策略和负荷管理办法,另一方面也有助于提升配网及母线负荷预测精度,提升电力系统运行的稳定性和经济性,具有重要的现实意义和良好的应用前景。
综上,根据本发明实施例的用户典型用电模式的获取方法,首先获取待分析用户的智能电表的历史负荷数据,并提取历史负荷数据中的负荷点以生成日负荷曲线集,以及对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集。然后获取计算参数,并针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据聚类结果计算共识矩阵和共识指数分布,以及根据共识矩阵和所共识指数分布确定探测区间内的最优值,其中,每轮聚类的样本随机采样自完整样本集,最后在最优值对应的用电模式数目下,对完整样本集进行k-均值聚类以获得目标聚类结果,并根据目标聚类结果计算目标共识矩阵,根据目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集,以及对样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据目标共识矩阵计算簇共识度以获得簇共识度集,对簇共识度集进行处理以剔除共识度低于簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。由此,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
图2是根据本发明一个实施例的用户典型用电模式的获取装置的方框示意图。
如图2所示,本发明实施例的用户典型用电模式的获取装置1000,可包括:第一获取模块100、归一化处理模块200、第二获取模块300、确定模块400、第三获取模块500、第四获取模块600、计算模块700。
其中,第一获取模块100用于获取待分析用户的智能电表的历史负荷数据,并提取历史负荷数据中的负荷点以生成日负荷曲线集。
归一化处理模块200用于对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集。
第二获取模块300用于获取计算参数,其中,计算参数包括:用户典型用电模式数目探测区间、探测区间对应的用电模式数目、每次参与聚类的样本数量、簇共识度检验阈值和样本-簇共识度检验阈值。
确定模块400用于针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据聚类结果计算共识矩阵和共识指数分布,以及根据共识矩阵和所共识指数分布确定探测区间内的最优值,其中,每轮聚类的样本随机采样自完整样本集。
第三获取模块500用于在最优值对应的用电模式数目下,对完整样本集进行k-均值聚类以获得目标聚类结果,并根据目标聚类结果计算目标共识矩阵,以及根据目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集。
第四获取模块600用于对样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据目标共识矩阵计算簇共识度以获得簇共识度集。
计算模块700用于对簇共识度集进行处理以剔除共识度低于簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。
需要说明的是,本发明实施例的用户典型用电模式的获取装置中未披露的细节,请参照本发明实施例的用户典型用电模式的获取方法中所披露的细节,具体这里不再赘述。
综上,本发明实施例的用户典型用电模式的获取装置,通过第一获取模块获取待分析用户的智能电表的历史负荷数据,并提取历史负荷数据中的负荷点以生成日负荷曲线集,通过归一化处理模块对日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集,通过第二获取模块获取计算参数,通过确定模块针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据聚类结果计算共识矩阵和共识指数分布,以及根据共识矩阵和所共识指数分布确定探测区间内的最优值,通过第三获取模块在最优值对应的用电模式数目下,对完整样本集进行k-均值聚类以获得目标聚类结果,并根据目标聚类结果计算目标共识矩阵,以及根据目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集,通过第四获取模块对样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据目标共识矩阵计算簇共识度以获得簇共识度集,通过计算模块对簇共识度集进行处理以剔除共识度低于簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。由此,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
为了实现上述实施例,本发明还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序,以实现前述实施例的用户典型用电模式的获取方法。
本发明实施例的电子设备,通过处理器执行存储在存储器上的计算机程序,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现前述实施例的用户典型用电模式的获取方法。
本发明实施例的非临时性计算机可读存储介质,通过执行其存储的计算机程序,能够在k-均值聚类的基础上引入共识度的概念,通过共识性检验确定k-均值聚类的最优类别数,克服了样本随机性给聚类过程带来的不稳定,提升了鲁棒性和置信度,保证了所提取的用户用电模式的典型性和准确性。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (7)
1.一种用户典型用电模式的获取方法,其特征在于,包括:
步骤S1,获取待分析用户的智能电表的历史负荷数据,并提取所述历史负荷数据中的负荷点以生成日负荷曲线集;
步骤S2,对所述日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集;
步骤S3,获取计算参数,其中,所述计算参数包括:用户典型用电模式数目探测区间、所述探测区间对应的用电模式数目、每次参与聚类的样本数量、簇共识度检验阈值和样本-簇共识度检验阈值;
步骤S4,针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据所述聚类结果计算共识矩阵和共识指数分布,以及根据所述共识矩阵和所共识指数分布确定所述探测区间内的最优值,其中,每轮聚类的样本随机采样自所述完整样本集;
步骤S5,在所述最优值对应的用电模式数目下,对所述完整样本集进行k-均值聚类以获得目标聚类结果,并根据所述目标聚类结果计算目标共识矩阵,以及根据所述目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集;
步骤S6,对所述样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据所述目标共识矩阵计算簇共识度以获得簇共识度集;
步骤S7,对所述簇共识度集进行处理以剔除共识度低于所述簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。
2.根据权利要求1所述的用户典型用电模式的获取方法,其特征在于,所述步骤S2,具体包括:
获取所述待分析用户的历史负荷最大值lmax和最小值lmin,并根据所述历史负荷最大值lmax和最小值lmin,通过以下公式对所述日负荷曲线集合中的日负荷曲线逐元素归一化:
3.根据权利要求2所述的用户典型用电模式的获取方法,其特征在于,所述步骤S4,具体包括:
步骤S41,将所述探测区间记作[2,Kmax],k-均值聚类执行次数记作H,所述每次参与聚类的样本数量记作NS,所述样本-簇共识度检验阈值记作m0,所述簇共识度检验阈值记作n0,所述NS小于N;
步骤S42,对任一k∈[2,Kmax],连续进行H轮k-均值聚类,其中,每轮聚类下标记作h,当第h轮聚类开始前,从所述完整样本集中随机选取NS个样本,样本下标构成的集合记为Dh,计算N×N阶指示矩阵Ih:
其中,所述i和j为集合Dh中的任意元素,对选中的样本进行k-均值聚类,聚类时样本之间的相似度定义为两条负荷曲线之间的欧氏距离:
H次聚类后,得到连接矩阵序列M1,M2,...,MH和指示矩阵序列I1,I2,...,IH;
步骤S43,根据多轮聚类的结果计算N×N阶共识矩阵CK:
其中,1{cond}为指示函数,当cond成立时函数值为1,否则为0求离散累积概率分布函数的级数:
4.根据权利要求3所述的用户典型用电模式的获取方法,其特征在于,所述步骤S5、所述步骤S6和所步骤S7,具体包括:
在剩余负荷曲线的基础上计算簇共识度:
计算留存簇的平均日负荷曲线:
对平均负荷曲线去归一化,得到用户典型用电模式:
5.一种用户典型用电模式的获取装置,其特征在于,包括:
第一获取模块,用于获取待分析用户的智能电表的历史负荷数据,并提取所述历史负荷数据中的负荷点以生成日负荷曲线集;
归一化处理模块,用于对所述日负荷曲线集进行处理以剔除存在缺失数据的日负荷曲线,并对处理后的日负荷曲线集进行归一化处理以获得完整样本集;
第二获取模块,用于获取计算参数,其中,所述计算参数包括:用户典型用电模式数目探测区间、所述探测区间对应的用电模式数目、每次参与聚类的样本数量、簇共识度检验阈值和样本-簇共识度检验阈值;
确定模块,用于针对每一种用电模式数目,重复进行多轮k-均值聚类以获得聚类结果,并根据所述聚类结果计算共识矩阵和共识指数分布,以及根据所述共识矩阵和所共识指数分布确定所述探测区间内的最优值,其中,每轮聚类的样本随机采样自所述完整样本集;
第三获取模块,用于在所述最优值对应的用电模式数目下,对所述完整样本集进行k-均值聚类以获得目标聚类结果,并根据所述目标聚类结果计算目标共识矩阵,以及根据所述目标共识矩阵计算样本-簇共识度以获得样本-簇共识度集;
第四获取模块,用于对所述样本-簇共识度集进行处理以剔除共识度低于样本-簇共识度检验阈值的样本,并基于处理后的样本-簇共识度集,根据所述目标共识矩阵计算簇共识度以获得簇共识度集;
计算模块,用于对所述簇共识度集进行处理以剔除共识度低于所述簇共识度检验阈值的簇,并计算处理后的簇共识度集的平均负荷曲线以获得用户典型用电模式。
6.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4中任一所述的用户典型用电模式的获取方法。
7.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-4中任一所述的用户典型用电模式的获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010903047.4A CN112163595B (zh) | 2020-09-01 | 2020-09-01 | 用户典型用电模式的获取方法、获取装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010903047.4A CN112163595B (zh) | 2020-09-01 | 2020-09-01 | 用户典型用电模式的获取方法、获取装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112163595A CN112163595A (zh) | 2021-01-01 |
CN112163595B true CN112163595B (zh) | 2022-05-06 |
Family
ID=73857810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010903047.4A Active CN112163595B (zh) | 2020-09-01 | 2020-09-01 | 用户典型用电模式的获取方法、获取装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112163595B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113077011A (zh) * | 2021-04-26 | 2021-07-06 | 华南理工大学 | 基于一致性聚类的基准子集选取方法、系统和存储介质 |
CN113723481A (zh) * | 2021-08-19 | 2021-11-30 | 吉林大学 | 一种基于符号聚合近似表示的多元负荷分类方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
EP3188373A1 (en) * | 2015-12-30 | 2017-07-05 | Mitsubishi Electric R&D Centre Europe B.V. | Fast distributed clustering for cooperation in telecommunications networks |
-
2020
- 2020-09-01 CN CN202010903047.4A patent/CN112163595B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3188373A1 (en) * | 2015-12-30 | 2017-07-05 | Mitsubishi Electric R&D Centre Europe B.V. | Fast distributed clustering for cooperation in telecommunications networks |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
Non-Patent Citations (4)
Title |
---|
Cluster Ensemble Based on Iteratively Refined Co-Association Matrix;CAIMING ZHONG,etc.;《IEEE Access》;20181109;全文 * |
基于共识和分类改善文档聚类的识别信息方法;王留洋等;《计算机应用》;20200430(第04期);全文 * |
基于聚类融合技术的电力用户负荷模式提取方法;李玉娇等;《电测与仪表》;20180825;全文 * |
聚类融合与深度学习在用电负荷模式识别的应用研究;林锦波;《中国优秀硕士学位论文全文数据库信息科技辑》;20150115;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112163595A (zh) | 2021-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rajabi et al. | A comparative study of clustering techniques for electrical load pattern segmentation | |
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
CN109891508B (zh) | 单细胞类型检测方法、装置、设备和存储介质 | |
CN112163595B (zh) | 用户典型用电模式的获取方法、获取装置和电子设备 | |
US20130138651A1 (en) | System and method employing a self-organizing map load feature database to identify electric load types of different electric loads | |
CN116502112B (zh) | 一种新能源电源测试数据管理方法及系统 | |
CN109934301B (zh) | 一种电力负荷聚类分析方法、装置和设备 | |
Xiong et al. | A data-driven method for extracting aging features to accurately predict the battery health | |
CN109858522A (zh) | 一种基于数据挖掘的管理线损异常识别方法 | |
CN114114039B (zh) | 一种电池系统的单体电芯一致性的评估方法和装置 | |
Lu et al. | A weekly load data mining approach based on hidden Markov model | |
CN112819299A (zh) | 一种基于中心优化的差分K-means负荷聚类方法 | |
CN112418687B (zh) | 基于用电特征的用户用电异常识别方法、装置和存储介质 | |
CN110796159A (zh) | 基于k-means算法的电力数据分类方法及系统 | |
CN116148753A (zh) | 一种智能电能表运行误差监测系统 | |
CN115994131A (zh) | 基于用电时序数据的居民社区特征标签计算方法及系统 | |
CN115759393A (zh) | 基于集成学习的累积负荷基线预测方法 | |
CN111027841A (zh) | 一种基于梯度提升决策树的低压台区线损计算方法 | |
CN110851502B (zh) | 一种基于数据挖掘技术的负荷特征场景分类方法 | |
CN112329868A (zh) | 基于clara聚类的制造加工设备群能效状态评价方法 | |
CN117236022A (zh) | 互感器剩余寿命预测模型训练方法、应用方法及电子设备 | |
CN116780537A (zh) | 非侵入式负荷监测方法、装置、存储介质 | |
CN116776181A (zh) | 基于改进模糊聚类的终端侧负荷辨识方法、介质及系统 | |
CN113642645B (zh) | 基于模糊c均值与豪斯多夫距离的低压用户相别识别方法 | |
CN114186631A (zh) | 一种基于非侵入式智能终端的负荷识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |