CN108599140B - 用电负荷特征分析方法和装置、存储介质 - Google Patents
用电负荷特征分析方法和装置、存储介质 Download PDFInfo
- Publication number
- CN108599140B CN108599140B CN201810068907.XA CN201810068907A CN108599140B CN 108599140 B CN108599140 B CN 108599140B CN 201810068907 A CN201810068907 A CN 201810068907A CN 108599140 B CN108599140 B CN 108599140B
- Authority
- CN
- China
- Prior art keywords
- time interval
- clustering
- user
- load
- subinterval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种用电负荷特征分析方法和装置、存储介质,涉及家庭用电技术领域。该方法包括:抽取用于分析用电负荷特征的用户,形成用户集合;确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;针对所述时间区间中的每一个子区间,建立对应的负荷文件;根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。
Description
技术领域
本发明涉及家庭用电技术领域,具体涉及一种用电负荷特征分析方法和装置、存储介质。
背景技术
随着智能电表的广泛部署,人们能够十分便捷地采集细粒度的家庭智能用电数据。但是由于智能电表能够每15分钟采集一次数据,因此会产生大量的用电负荷数据。如此海量、高维、稀疏的时间序列形式的用电负荷数据增加了数据中心的存储压力、计算压力,同时也为数据的分析和应用带来极大的困难。
目前,多采用聚类技术(例如,k-means聚类算法)对用户进行聚类,进而对得到的各类用户的用电负荷特征进行分析。
但是当聚类算法直接应用在海量、高维、稀疏的用电负荷数据时,会面临很高的计算压力,使得运算效率较低。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种用电负荷特征分析方法和装置、存储介质,解决了现有技术运算效率低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明实施例提供一种电负荷特征分析方法,该方法包括:
抽取用于分析用电负荷特征的用户,形成用户集合;
确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;
针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;
根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;
根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;
根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。
第二方面,本发明实施例提供一种用电负荷特征分析装置,该装置包括:
用户抽取模块,用于抽取用于分析用电负荷特征的用户,形成用户集合;
数据获取模块,用于确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;
文件建立模块,用于针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;
第一聚类模块,用于根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;
第二聚类模块,用于根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;
特征分析模块,用于根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。
第三方面,本发明实施例提供一种计算机可读存储介质,该介质上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时可实现上述的方法。
(三)有益效果
本发明实施例提供了一种用电负荷特征分析方法和装置、存储介质,具备以下有益效果:
1、本方法针对时间区间内的每一个子区间建立对应的负荷文件,然后基于各个子区间各自对应的负荷文件进行用户聚类,可以得到各个子区间各自对应的初始聚类结果,进而根据多个初始聚类结果确定一个最终的聚类结果即综合聚类结果,进而根据综合聚类结果进行用电负荷特征分析。本方法没有在整个时间区间上直接进行聚类,而是在比时间区间更细分的子区间内进行聚类,这样在每一子区间内进行聚类的过程中,输入数据的维度降低,从而提高了计算效率;
2、本方法依据初始聚类结果确定综合聚类结果,保留了完整的时间区间上的用电负荷数据,因此没有因为降维而造成数据的丢失;
3、本方法能够充分利用各个初始聚类结果,有效降低孤立点和噪声对综合聚类结果的影响,提高综合聚类结果的鲁棒性和稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例中用电负荷特征分析方法的流程示意图;
图2示出了本发明实施例中用电负荷特征分析装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,本发明实施例提供一种用电负荷特征分析方法,该方法可以但不限于应用在家庭用电的数据分析方面。如图1所示,该方法包括:
S100、抽取用于分析用电负荷特征的用户,形成用户集合;
在实际应用中,可以设置智能电表每隔一定的时间采集一次用户的用电负荷数据,例如,智能电表每隔30分钟采集一次用电负荷数据,这样智能电表在一天内可以在48个时间点上采集用电负荷数据,即采集48次用电负荷数据。进一步,可以将智能电表采集的用电负荷数据按照用户编号传输至分布式数据中心进行存储。其中,分布式数据中心中的各个数据中心依据用户的地理位置分布设置,将用电负荷数据存储到用户所在区域内的数据中心。当然,除了将用电负荷数据存储到数据中心之外,还可以将用户的住宅特征信息、家庭特征信息和/或家电特征信息等信息存储到数据中心。其中,住宅特征信息包括:住宅面积、房型信息等,家庭特征信息包括人口数量、户主年龄、户主受教育情况等,家电特征信息包括各电器的种类、数量等信息。
在具体实施时,当用电负荷数据存储在数据中心时,可以根据需要进行负荷分析的区域抽取用户。具体抽取过程可以包括:
S101、确定进行用电负荷特征分析的区域,并确定所述区域内所有用于存储用电负荷数据的数据中心;
S102、根据各个所述数据中心内存储的用电负荷数据对应的用户数量,确定各个数据中心对应的用户抽取比例;
S103、根据预设的用户抽取总量和各个数据中心各自对应的用户抽取比例,确定各个数据中心对应的用户抽取数量;
S104、根据每一数据中心对应的用户抽取数量,在该数据中心中进行用户抽取。
举例来说,需要进行用电负荷特征分析的区域内一共有3个数据中心。第1个数据中心存储有100个用户的用电负荷数据,第2个数据中心存储有200个用户的用电负荷数据,第3个数据中心存储有300个用户的用电负荷数据,这三个数据中心对应的用户抽取比例为1:2:3,假设预设的用户抽取总量为120个,则需要从三个数据中心中抽取的用户数量即用户抽取数量分别是:20、40、60。
在某个数据中心抽取用户时,可以先随机确定第一个用户,然后利用循环的等距抽样方法完成此数据中心内的用户抽样。
举例来说,抽取的用户数量有N个,这N个用户构成的用户集合可以记为Xini={X1,...,XN}。在具体实施时,在将抽取到的各个用户形成用户集合之前,还可以对抽取到的用户数据进行数据清洗,处理异常值,清除缺失用户。清除缺失用户后,将剩余n个用户构成的集合记为X={x1,...,xn}。
S200、确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;
在具体实施时,进行用电负荷特征分析的时间区间[T1,Ts]可以根据需要设置,例如,可以设置为一个月(此时s=30)、两个月(此时s=60)、一个星期(此时s=7)或其他时间段。
下文中提到的子区间为时间区间中的组成单元,无论时间区间设置为何值,时间区间都可由多个子区间构成。例如,时间区间设置为1个月,子区间可以设置为1天,这样时间区间中包括30个子区间。再例如,时间区间设置为1个星期,子区间也可以设置为1天,这样时间区间中包括7个子区间。当然,子区间也可以设置为其他值,例如,2天。
S300、针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;
以时间区间为1个月以及子区间为1天为例,假设智能电表每隔30分钟采集一次用电负荷数据,则这一个月内的每一天对应的负荷文件中包括各个用户各自在这一天产生的48个用电负荷数据。
在具体实施时,针对所述时间区间中的每一个子区间,建立对应的负荷文件的过程可以包括以下步骤:
S301、针对所述用户集合中的每一个用户,建立该用户在所述时间区间内的每一个子区间的负荷子文件;其中,所述负荷子文件中包括该用户在该子区间内的用电负荷数据;
S302、根据所述用户集合中所有用户在每一子区间内的负荷子文件,形成该子区间对应的负荷文件;其中,所述该子区间对应的负荷文件包括所述用户集合中所有用户在该子区间内的负荷子文件。
举例来说,假设时间区间为一个月,每个子区间为1天,每个子区间对应的负荷子文件也可以称之为日负荷文件。对于用户xj(1≤j≤n),总共建立s个日负荷文件。将为用户xj(1≤j≤n)建立的第i个日负荷文件记作DPj,i,DPj,i记录了用户xj(1≤j≤n)在第i天上的用电负荷数据,其中,代表在第i天的第c(1≤c≤48)个时间点上所采集的用户xj(1≤j≤n)的用电负荷数据。
由集合X中的所有用户即n个用户各自的日负荷文件形成的第i个负荷文件可以用矩阵的形式表示,例如:
可见,对于时间区间[T1,Ts],可以分为s个子区间,因此可以形成s个负荷文件。
S400、根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;
举例来说,对于时间区间[T1,Ts]中的每个DP.,i(1≤i≤s),均可以采用预设的聚类算法(例如,k-means聚类算法)进行用户聚类,获得该子区间对应的分类结果L(i)=(L(i)(1),...,L(i)(n))T,L(i)是由每个用户所属的种类的编号构成的列向量。
在具体实施时,步骤S400的具体过程可以包括:
针对所述时间区间内的每一个子区间,执行以下步骤:
S401、针对预设的聚类数目选择区间中的每一个聚类数目备选值,计算在该聚类数目备选值下的聚类有效性指标;
S402、将所述聚类数目选择区间中对应聚类有效性指标极值的聚类数目备选值作为该子区间对应的聚类数目;
举例来说,对DP.,i执行聚类方法时,将聚类数目选择区间设置为[2,20],聚类数目选择区间中的每一个聚类数目备选值均为整数。针对区间[2,20]内的每个整数z,计算聚类有效性指标DB的值,以z值为横坐标,DB指标值为纵坐标,绘制DB指标值随z值变化的图形,将DB指标值降低的拐点处对应的z值确定为聚类数目,从而将对应聚类有效性指标极值的聚类数目备选值作为最终的聚类数目。
S403、根据该子区间对应的聚类数目和负荷文件,采用预设聚类算法进行用户聚类。
在实际应用时,聚类算法可以根据需要选择,例如,可以选择k-means聚类算法,该算法首先需要指定聚类数目,然后随机初始化聚类中心,通过计算对象到每个聚类中心的距离,将对象分配到距离最近的簇,再计算簇的均值来更新聚类中心,进行迭代,进而完成聚类。
为了进一步提高运算效率,各个子区间可以并行执行聚类操作,也就是说,针对各个子区间执行的上述步骤S400可以并行执行。
S500、根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;
由于通过步骤S500可以得到多个初始聚类结果,还需要对这多个初始聚类结果进行综合处理,得到最终的聚类结果即综合聚类结果,进而根据综合聚类结果进行特征分析。
在具体实施时,步骤S500的具体过程可以包括:
S501、根据所述时间区间内的各个子区间对应的初始聚类结果,计算相似度矩阵;其中,所述相似度矩阵中第i行第j列的元素为所述用户集合中的第i个用户和第j个用户被分到同一类中的频率;
其中,相似度矩阵可以用Sn×n表示,矩阵Sn×n中的元素S(p,q)代表的是,在s个聚类结果中,两个用户xp(1≤p≤n)和xq(1≤q≤n)被分到同一个类中的频率。
具体的计算过程可以为:
S502、将所述时间区间内各个子区间对应的聚类数目中出现次数最多的聚类数目作为所述时间区间对应的聚类数目;
例如,在s次聚类中,聚类数目8出现的次数最多,则可以将8作为步骤S502中时间区间对应的聚类数目。
S503、根据所述相似度矩阵以及所述时间区间对应的聚类数目,采用谱聚类算法进行用户聚类,得到所述时间区间对应的综合聚类结果。
例如,对矩阵Sn×n采用谱聚类方法,确定对用户的最终分类结果即综合聚类结果:Lfinal=(L(1),...,L(n))T。
S600、根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。
在以上步骤中获取用电负荷数据的同时、之前或之后,还可以获取所述用户集合中各个用户在所述时间区间内的住宅特征信息、家庭特征信息和/或家电特征信息等。这样步骤S600的具体实现过程可以包括以下步骤:
S601、以所述时间区间对应的综合聚类结果为因变量,以所述住宅特征信息、所述家庭特征信息和/或所述家电特征信息作为自变量,建立多值Logistic回归分析模型;
S602、根据所述多值Logistic回归分析模型,确定影响各个用户聚类的用电负荷的因素。
例如,将用户分类结果中平均用电水平最低的一类作为模型中的对照组,选择95%的置信区间。根据模型的显著性结果,得到影响各群体用电负荷的具体因素。
本发明实施例提供的用电负荷特征分析方法,针对时间区间内的每一个子区间建立对应的负荷文件,然后基于各个子区间各自对应的负荷文件进行用户聚类,可以得到各个子区间各自对应的初始聚类结果,进而根据多个初始聚类结果确定一个最终的聚类结果即综合聚类结果,进而根据综合聚类结果进行用电负荷特征分析。本方法没有在整个时间区间上直接进行聚类,而是在比时间区间更细分的子区间内进行聚类,这样在每一子区间内进行聚类的过程中,输入数据的维度降低,从而提高了计算效率,同时本方法还会依据初始聚类结果确定综合聚类结果,保留了完整的时间区间上的用电负荷数据,因此没有因为降维而造成数据的丢失。另外,本方法能够充分利用各个初始聚类结果,有效降低孤立点和噪声对综合聚类结果的影响,提高综合聚类结果的鲁棒性和稳定性。
第二方面,本发明实施例提供一种用电负荷特征分析装置,该装置与第一方面中提供的用电负荷特征分析方法相对应,如图2所示,该装置包括:
用户抽取模块,用于抽取用于分析用电负荷特征的用户,形成用户集合;
数据获取模块,用于确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;
文件建立模块,用于针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;
第一聚类模块,用于根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;
第二聚类模块,用于根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;
特征分析模块,用于根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。
在一些实施例中,用户抽取模块具体用于:确定进行用电负荷特征分析的区域,并确定所述区域内所有用于存储用电负荷数据的数据中心;根据各个所述数据中心内存储的用电负荷数据对应的用户数量,确定各个数据中心对应的用户抽取比例;根据预设的用户抽取总量和各个数据中心各自对应的用户抽取比例,确定各个数据中心对应的用户抽取数量;根据每一数据中心对应的用户抽取数量,在该数据中心中进行用户抽取。
在一些实施例中,文件建立模块具体用于:针对所述用户集合中的每一个用户,建立该用户在所述时间区间内的每一个子区间的负荷子文件;其中,所述负荷子文件中包括该用户在该子区间内的用电负荷数据;根据所述用户集合中所有用户在每一子区间内的负荷子文件,形成该子区间对应的负荷文件;其中,所述该子区间对应的负荷文件包括所述用户集合中所有用户在该子区间内的负荷子文件。
在一些实施例中,第一聚类模块具体用于:并行执行所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果的步骤。
在一些实施例中,第一聚类模块具体用于:针对所述时间区间内的每一个子区间,执行以下步骤:针对预设的聚类数目选择区间中的每一个聚类数目备选值,计算在该聚类数目备选值下的聚类有效性指标;将所述聚类数目选择区间中对应聚类有效性指标极值的聚类数目备选值作为该子区间对应的聚类数目;根据该子区间对应的聚类数目和负荷文件,采用预设聚类算法进行用户聚类。
在一些实施例中,第二聚类模块具体用于:根据所述时间区间内的各个子区间对应的初始聚类结果,计算相似度矩阵;其中,所述相似度矩阵中第i行第j列的元素为所述用户集合中的第i个用户和第j个用户被分到同一类中的频率;将所述时间区间内各个子区间对应的聚类数目中出现次数最多的聚类数目作为所述时间区间对应的聚类数目;根据所述相似度矩阵以及所述时间区间对应的聚类数目,采用谱聚类算法进行用户聚类,得到所述时间区间对应的综合聚类结果。
在一些实施例中,数据获取模块还用于:获取所述用户集合中各个用户在所述时间区间内的住宅特征信息、家庭特征信息和/或家电特征信息;对应的,特征分析模块具体用于:以所述时间区间对应的综合聚类结果为因变量,以所述住宅特征信息、所述家庭特征信息和/或所述家电特征信息作为自变量,建立回归分析模型;根据所述回归分析模型,确定影响各个用户聚类的用电负荷的因素。
在一些实施例中,用户抽取模块在形成用户集合之前,还对抽取到的用户数据进行数据清洗,将清洗后的剩余用户形成所述用户集合。
在一些实施例中,装置还可以包括可视化模块,用于显示各个初始聚类结果、综合聚类结果、特征分析结果等信息。
可理解的是,本方面提供的装置与第一方面中提供的方法相对应,其有关部分的解释、说明、举例、有益效果等部分可以参考第一方面中的相应内容,此处不再赘述。
第三方面,本发明实施例提供一种计算机可读存储介质,该介质上存储有计算机程序,在处理器执行所述计算机程序时可实现第一方面中的方法。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种用电负荷特征分析方法,其特征在于,包括:
抽取用于分析用电负荷特征的用户,形成用户集合;
确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;
针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;
根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;
根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;
根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征;
其中:所述根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果,包括:
根据所述时间区间内的各个子区间对应的初始聚类结果,计算相似度矩阵;其中,所述相似度矩阵中第i行第j列的元素为所述用户集合中的第i个用户和第j个用户被分到同一类中的频率;
将所述时间区间内各个子区间对应的聚类数目中出现次数最多的聚类数目作为所述时间区间对应的聚类数目;
根据所述相似度矩阵以及所述时间区间对应的聚类数目,采用谱聚类算法进行用户聚类,得到所述时间区间对应的综合聚类结果;
所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果,包括:
针对所述时间区间内的每一个子区间,执行以下步骤:
针对预设的聚类数目选择区间中的每一个聚类数目备选值,计算在该聚类数目备选值下的聚类有效性指标;
将所述聚类数目选择区间中对应聚类有效性指标极值的聚类数目备选值作为该子区间对应的聚类数目;
根据该子区间对应的聚类数目和负荷文件,采用预设聚类算法进行用户聚类。
2.如权利要求1所述的方法,其特征在于,所述抽取用于分析用电负荷特征的用户,包括:
确定进行用电负荷特征分析的区域,并确定所述区域内所有用于存储用电负荷数据的数据中心;
根据各个所述数据中心内存储的用电负荷数据对应的用户数量,确定各个数据中心对应的用户抽取比例;
根据预设的用户抽取总量和各个数据中心各自对应的用户抽取比例,确定各个数据中心对应的用户抽取数量;
根据每一数据中心对应的用户抽取数量,在该数据中心中进行用户抽取。
3.如权利要求1所述的方法,其特征在于,所述针对所述时间区间中的每一个子区间,建立对应的负荷文件,包括:
针对所述用户集合中的每一个用户,建立该用户在所述时间区间内的每一个子区间的负荷子文件;其中,所述负荷子文件中包括该用户在该子区间内的用电负荷数据;
根据所述用户集合中所有用户在每一子区间内的负荷子文件,形成该子区间对应的负荷文件;其中,所述该子区间对应的负荷文件包括所述用户集合中所有用户在该子区间内的负荷子文件。
4.如权利要求1所述的方法,其特征在于,所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果,包括:
并行执行所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果的步骤。
5.如权利要求1所述的方法,其特征在于,还包括:获取所述用户集合中各个用户在所述时间区间内的住宅特征信息、家庭特征信息和/或家电特征信息;
对应的,所述根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征,包括:
以所述时间区间对应的综合聚类结果为因变量,以所述住宅特征信息、所述家庭特征信息和/或所述家电特征信息为自变量,建立多值Logistic回归分析模型;
根据所述多值Logistic回归分析模型,确定影响各个用户聚类的用电负荷的因素。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述形成用户集合之前,所述方法还包括:
对抽取到的用户数据进行数据清洗,将清洗后的剩余用户形成所述用户集合。
7.一种用电负荷特征分析装置,其特征在于,包括:
用户抽取模块,用于抽取用于分析用电负荷特征的用户,形成用户集合;
数据获取模块,用于确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;
文件建立模块,用于针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;
第一聚类模块,用于根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;
第二聚类模块,用于根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;
特征分析模块,用于根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征;
其中:所述根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果,包括:
根据所述时间区间内的各个子区间对应的初始聚类结果,计算相似度矩阵;其中,所述相似度矩阵中第i行第j列的元素为所述用户集合中的第i个用户和第j个用户被分到同一类中的频率;
将所述时间区间内各个子区间对应的聚类数目中出现次数最多的聚类数目作为所述时间区间对应的聚类数目;
根据所述相似度矩阵以及所述时间区间对应的聚类数目,采用谱聚类算法进行用户聚类,得到所述时间区间对应的综合聚类结果;
所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果,包括:
针对所述时间区间内的每一个子区间,执行以下步骤:
针对预设的聚类数目选择区间中的每一个聚类数目备选值,计算在该聚类数目备选值下的聚类有效性指标;
将所述聚类数目选择区间中对应聚类有效性指标极值的聚类数目备选值作为该子区间对应的聚类数目;
根据该子区间对应的聚类数目和负荷文件,采用预设聚类算法进行用户聚类。
8.一种计算机可读存储介质,该介质上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时可实现权利要求1~6任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810068907.XA CN108599140B (zh) | 2018-01-24 | 2018-01-24 | 用电负荷特征分析方法和装置、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810068907.XA CN108599140B (zh) | 2018-01-24 | 2018-01-24 | 用电负荷特征分析方法和装置、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108599140A CN108599140A (zh) | 2018-09-28 |
CN108599140B true CN108599140B (zh) | 2021-01-29 |
Family
ID=63608668
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810068907.XA Active CN108599140B (zh) | 2018-01-24 | 2018-01-24 | 用电负荷特征分析方法和装置、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108599140B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424235A (zh) * | 2013-08-26 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 实现用户信息聚类的方法和装置 |
CN104809255A (zh) * | 2015-05-21 | 2015-07-29 | 国家电网公司 | 一种负荷形态获取方法和系统 |
CN105843919A (zh) * | 2016-03-24 | 2016-08-10 | 云南大学 | 一种基于多特征融合与聚类集成的移动对象轨迹聚类方法 |
CN106600119A (zh) * | 2016-11-30 | 2017-04-26 | 南方电网科学研究院有限责任公司 | 基于k均值的电力用户聚类方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008054439A (ja) * | 2006-08-25 | 2008-03-06 | Toyota Motor Corp | 電力システム |
JP6245030B2 (ja) * | 2014-03-27 | 2017-12-13 | 富士通株式会社 | 消費電力予測方法、消費電力予測プログラム及び消費電力予測装置 |
-
2018
- 2018-01-24 CN CN201810068907.XA patent/CN108599140B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104424235A (zh) * | 2013-08-26 | 2015-03-18 | 腾讯科技(深圳)有限公司 | 实现用户信息聚类的方法和装置 |
CN104809255A (zh) * | 2015-05-21 | 2015-07-29 | 国家电网公司 | 一种负荷形态获取方法和系统 |
CN105843919A (zh) * | 2016-03-24 | 2016-08-10 | 云南大学 | 一种基于多特征融合与聚类集成的移动对象轨迹聚类方法 |
CN106600119A (zh) * | 2016-11-30 | 2017-04-26 | 南方电网科学研究院有限责任公司 | 基于k均值的电力用户聚类方法及装置 |
Non-Patent Citations (3)
Title |
---|
基于改进 k-均值聚类的负荷概率模型;陈凡 等;《电力系统保护与控制》;20170420;第41卷(第22期);第128-133页 * |
基于自适应人工免疫进化的网格聚类算法研究;白鹭;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120315(第3期);第I138-1623页 * |
模糊c均值聚类及其有效性检验与应用研究;周开乐;《中国博士学位论文全文数据库 信息科技辑》;20150715(第7期);第1138-34页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108599140A (zh) | 2018-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610280B (zh) | 一种电力负荷短期预测方法、模型、装置及系统 | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
CN109376772B (zh) | 一种基于神经网络模型的电力负荷组合预测方法 | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN109934301B (zh) | 一种电力负荷聚类分析方法、装置和设备 | |
CN112330078B (zh) | 用电量预测方法、装置、计算机设备和存储介质 | |
Shamim et al. | Multi-domain feature extraction for improved clustering of smart meter data | |
CN111815060A (zh) | 一种用电地区短期负荷预测方法及装置 | |
CN111784204A (zh) | 一种基于用户用电行为画像的优质用户挖掘方法及系统 | |
CN112614004A (zh) | 用电信息的处理方法及装置 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
CN113094448B (zh) | 住宅空置状态的分析方法及分析装置、电子设备 | |
CN114118624A (zh) | 一种电力需求响应潜力评估方法、装置、设备及存储介质 | |
CN108599140B (zh) | 用电负荷特征分析方法和装置、存储介质 | |
CN117113126A (zh) | 一种基于改进聚类算法的行业用电特性分析方法 | |
CN116467631A (zh) | 电力指纹识别模型训练方法、电力指纹识别方法及装置 | |
CN116596574A (zh) | 电网用户画像构建方法及系统 | |
CN114004408A (zh) | 一种基于数据分析的用户电力负荷预测方法 | |
CN111860634A (zh) | 基于OCHNN-Kmeans算法的负荷聚类方法 | |
CN109493249B (zh) | 一种用电数据在多时间尺度上的分析方法 | |
CN110175705B (zh) | 一种负荷预测方法及包含该方法的存储器、系统 | |
CN111915116A (zh) | 一种基于K-means聚类的电力居民用户分类方法 | |
Davarzani et al. | Study of missing meter data impact on domestic load profiles clustering and characterization | |
CN112862179A (zh) | 一种用能行为的预测方法、装置及计算机设备 | |
Bao et al. | An analysis method for residential electricity consumption behavior based on UMAP-CRITIC feature optimization and SSA-assisted clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |