CN106600119A - 基于k均值的电力用户聚类方法及装置 - Google Patents

基于k均值的电力用户聚类方法及装置 Download PDF

Info

Publication number
CN106600119A
CN106600119A CN201611081164.7A CN201611081164A CN106600119A CN 106600119 A CN106600119 A CN 106600119A CN 201611081164 A CN201611081164 A CN 201611081164A CN 106600119 A CN106600119 A CN 106600119A
Authority
CN
China
Prior art keywords
cluster
power
preset time
time point
power consumer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611081164.7A
Other languages
English (en)
Other versions
CN106600119B (zh
Inventor
李秋硕
李鹏
孙宇军
赵云
钱斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute of Southern Power Grid Co Ltd
Original Assignee
Power Grid Technology Research Center of China Southern Power Grid Co Ltd
Research Institute of Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Power Grid Technology Research Center of China Southern Power Grid Co Ltd, Research Institute of Southern Power Grid Co Ltd filed Critical Power Grid Technology Research Center of China Southern Power Grid Co Ltd
Priority to CN201611081164.7A priority Critical patent/CN106600119B/zh
Publication of CN106600119A publication Critical patent/CN106600119A/zh
Application granted granted Critical
Publication of CN106600119B publication Critical patent/CN106600119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了一种基于K均值的电力用户聚类方法及装置,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,并获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷并初始化为预设聚类个数的聚类中心,再采用K均值聚类算法对各电力用户进行聚类。不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷并初始化聚类中心,可合理地初始化聚类中心,在初始化聚类中心后进行聚类,可获得较为准确的聚类结果,提高聚类准确性。

Description

基于K均值的电力用户聚类方法及装置
技术领域
本发明涉及电力技术领域,特别涉及一种基于K均值的电力用户聚类方法及装置。
背景技术
在电力系统为用户提供电能过程中,不同电力用户用电情况可能不同,电力用户分类对电力系统的经济分析、运行以及规划具有重要影响。目前,常采用的电力用户聚类方法是K-means(K均值)聚类算法,主要从数据集S中选择K个数据作为初始聚类的中心,将数据集中的每个数据与距离中心最近的中心聚类。首先随机选择K个数据作为初始中心,计算各个数据到所选出来的各个中心的距离,将数据指派到最近的中心形成一类,计算每个类的均值,循环反复执行,直到满足聚类准则函数收敛为止。其中,输入:初始数据集S和类的数目K。输出:K个聚类类别,满足平方误差准则函数收敛,其具体的工作步骤为:1)从数据集中任意选择K个数据作为初始聚类中心;2)计算各个数据到所选出来的各个中心的距离,将数据指派到最近的中心形成一类;3)将形成的类中数据的均值作为对应的新的聚类中心,将每个数据更新至最类似的类;4)计算聚类准则函数E(一般为均方差),直到准则函数E开始收敛为止。
K-means聚类算法首先是要初始化聚类中心,也就是说,初始的聚类中心对后续聚类效果有较大影响,然而,采用K-means聚类算法进行电力用户聚类时,是随机在数据集中选择K个数据作为初始中心,再进行后续的聚类步骤,无法确保电力用户聚类的准确性。
发明内容
基于此,有必要针对的电力用户聚类不准确的问题,提供一种提高电力用户聚类准确性的基于K均值的电力用户聚类方法及装置。
一种基于K均值的电力用户聚类方法,包括如下步骤:
获取电力用户在各预设时间点的用电负荷;
根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;
根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果。
本发明还提供一种基于K均值的电力用户聚类装置,包括:
负荷获取模块,用于获取电力用户在各预设时间点的用电负荷;
排序模块,用于根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;
选取模块,用于根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
构建模块,用于根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
聚类模块,用于将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果。
上述基于K均值的电力用户聚类方法及装置,获取电力用户在各预设时间点的用电负荷,根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。通过上述基于K均值的电力用户聚类方法及装置初始化预设聚类个数的聚类中心时,不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷,并初始化为所述预设聚类个数的聚类中心,这样可合理地初始化预设聚类个数的聚类中心,在初始化聚类中心后根据K均值聚类算法对各电力用户进行聚类,可获得较为准确的聚类结果,提高聚类准确性。
附图说明
图1为一实施例的基于K均值的电力用户聚类方法的流程图;
图2为另一实施例的基于K均值的电力用户聚类方法的子流程图;
图3为一实施例的基于K均值的电力用户聚类装置的模块图;
图4为另一实施例的基于K均值的电力用户聚类装置的子模块图。
具体实施方式
请参阅图1,提供一种实施例的基于K均值的电力用户聚类方法,包括如下步骤:
S110:获取电力用户在各预设时间点的用电负荷。
电力系统为电力用户供电,每个电力用户对应有各自的用电负荷,且电力用户在每个时刻有其对应的用电负荷,例如,电力用户A在某一天中的第一个预设时间点的用电负荷为10。在本实施例中,预设时间点的数量可为24,也就是说,各预设时间点可预先设置,例如,可选择一天中每个小时中的某一时刻作为预设时间点,从而可设置24个预设时间点。在本实施例中,通过获取电力用户在各预设时间点的用电负荷,也就即可获取到该电力用户在每个预设时间的用电负荷,例如,可获取电力用户A在一天中24个预设时间点对应的用电负荷,电力用户为多个时,即可获取每个电力用户在一天中24个预设时间点对应的用电负荷。其中,电力用户在各预设时间点的用电负荷包括了预设时间点的个数的用电负荷。
S120:根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集。
由于各电力用户用电情况的不同,其对应的用电负荷不同,且同一电力用户在不同预设时间点的用电负荷也可能不同,从而,各电力用户在同一预设时间点的用电负荷可能不同,在本实施例中,根据预设排序规则,可对各电力用户在每个预设时间点的用电负荷进行排序,例如,对各电力用户在一天中某个预设时间点比如一天中第一个小时对应的第一个预设时间点对应的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集。例如,电力用户A在第一预设时间点对应的用电负荷为16,电力用户B在第一预设时间点对应的用电负荷为61,电力用户C在第一预设时间点的用电负荷为23,对上述三个电力用户在同一预设时间点的用电负荷进行排序,获得第一预设时间点对应的电力用户的用电负荷集。对各电力用户在每个预设时间点的用电负荷进行上述类似的排序过程,从而,可获得各预设时间点对应的电力用户的用电负荷集。每个用电负荷集中元素的数量为电力用户的数量。
S130:根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷。
在对电力用户进行聚类时,预先设置有预设聚类个数,在获得各预设时间点对应的电力用户的用电负荷集后,需要从各预设时间点对应的电力用户的用电负荷集中分别选取排位数对应的用电负荷,例如,预设聚类个数为10,获取到10个排位数,比如10个排位数分别为8、17、26、35、44、53、62、71、80和89,首先从各用电负荷集中选择排位数为8的用电负荷,获得排位数8对应的各用电负荷,同理地,从各用电负荷集中选择其他9个排位数分别对应的各用电负荷,从而,获取到每个排位数对应的各用电负荷。单个排位数对应的各用电负荷的数量与预设时间点的个数相同。其中,预设排序规则可以为时间从小到大的排序规则,也可以为时间从大到小的排序规则。
S140:根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷。
单个在各预设时间点的新用电负荷中包括预设时间点的个数的用电负荷,由于在对用户聚类中,需要预先设置预设聚类个数,排位数的个数与预设聚类个数相同,从而,在获取到每个排位数对应的各用电负荷后,可构建预设聚类个数的在各预设时间点的新用电负荷。
S150:将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。
获得预设聚类个数的排位数,可从各用电负荷集中获取排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,可分别构建预设聚类个数的在各预设时间点的新用电负荷。利用K均值聚类算法进行聚类时,首先是需要初始化预设聚类个数的聚类中心,在本实施例中,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,然后,利用K均值聚类算法对电力用户进行聚类获得聚类结果,其中,聚类时,采用的聚类特征是电力用户在各预设时间点的用电负荷。
上述基于K均值的电力用户聚类方法,获取电力用户在各预设时间点的用电负荷,根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。通过上述基于K均值的电力用户聚类方法初始化预设聚类个数的聚类中心时,不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷,并初始化为所述预设聚类个数的聚类中心,这样可合理地初始化预设聚类个数的聚类中心,在初始化聚类中心后根据K均值聚类算法对各电力用户进行聚类,可获得较为准确的聚类结果,提高聚类准确性。
在电力系统为用户提供电能过程中,不同电力用户用电情况可能不同,电力用户聚类结果对电力系统的经济分析、运行以及规划具有重要影响,从而,在对电力用户进行聚类获得聚类结果后,可根据电力用户的聚类结果,可对电力系统进行规划,例如,可为用电负荷较大的一类电力用户提供较大功率的电能。通过提高电力用户的聚类结果的准确性,从而可有效准确地对电力系统进行规划,使电力系统稳定运行。
在其中一个实施例中,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果的步骤包括:
S251:预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心。
将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,即可获得预设聚类个数的聚类中心。
S252:分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离。
S253:将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别。
电力用户在各预设时间点的用电负荷中包括了预设时间点个数的用电负荷,例如,预设时间点个数为24,分别为一天中每个小时中的某一个时刻,则电力用户在各预设时间点的用电负荷相当于一个具有24个元素的向量,其中,24个元素分别为24个预设时间点对应的用电负荷,每个聚类中心中也包括了预设时间个数的新用电负荷,也就是说,在预设时间点个数为24时,聚类中心中也是为包括了24个元素的向量,聚类中心中的24个元素为在24个预设时间点对应的新用电负荷。电力用户在各预设时间点的用电负荷中数量与聚类中心中的新用电负荷的数量是一样的,相当于两个元素数量相同的向量,在计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离时,相当于计算两个向量之间的距离。
由于聚类中心的数量有预设聚类个数,从而,需要计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离。然后,将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别。
S254:计算各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值。
将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别后,每个聚类类别中可能包括多个电力用户,聚类类别的电力用户间的用电负荷可能不同,需要聚类列别中包括的电力用户在各预设时间点对应的用电负荷值,例如,一个聚类类别中包括电力用户A和电力用户B,电力用户A的用电负荷中,在第一个预设时间点的用电负荷为10,在第二个预设时间点的用电负荷为20,电力用户B的用电负荷中,在第一个预设时间点的用电负荷为16,在第二个预设时间点的用电负荷为18,聚类类别中电力用户的用电负荷在第一个预设时间点对应的用电负荷均值为18,聚类类别中电力用户的用电负荷在第二个预设时间点对应的用电负荷均值为19,对于其他聚类中心执行类似的操作,可获得各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值。
S255:将电力用户所在聚类类别的聚类中心更新为聚类类别中电力用户在各预设时间点对应的用电负荷均值。
在获得各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值后,需要更新每个聚类类别对应的聚类中心,即将聚类中心更新为聚类类别中电力用户在各预设时间点对应的用电负荷均值。例如,某一个聚类中心为第一预设时间点的用电负荷为10,第二预设时间点的用电负荷为20,聚类中心中包括电力用户A和电力用户B,该聚类类别中电力用户A和电力用户B的用电负荷在第一个预设时间点对应的用电负荷均值为18,在第二个预设时间点对应的用电负荷均值为19,在进行更新时,即将该聚类中心的第一预设时间对应的用电负荷更新为第一预设时间对应的用电负荷均值18,将该聚类中心的第二预设时间对应的用电负荷更新为在第二预设时间对应的用电负荷均值19,对每个聚类中心执行上述类似的更新动作,实现每个聚类中心的更新。
S256:根据更新后的聚类中心,计算各聚类类别对应的预设标准测度函数的目标值。
在进行聚类,且更新聚类中心后,需要计算每个聚类类别对应的预设标准测度函数的目标值,用做后续终止聚类的条件。在本实施例中,聚类类别对应的预设标准测度函数为聚类类别中各电力用户在各预设时间点的用电负荷到聚类中心的平方误差和,即通过公式可获得预设标准测度函数的目标值,其中,J为预设标准测度函数的目标值,i为1到n的整数,n为该聚类类别中电力用户的数量,Xi为第i个电力用户在个预设时间点的用电负荷,U为聚类中心。也就是说,聚类类别对应的预设标准测度函数为聚类类别中每个电力用户在各预设时间点的用电负荷到聚类中心的平方误差和,预设标准测度函数的目标值即为平方误差和值。
S257:判断预设标准测度函数的目标值是否小于预设值。
当预设标准测度函数的目标值小于预设值时,执行以下步骤:
S258:确定各电力用户的聚类结果为预设聚类个数的聚类类别。
当预设标准测度函数的目标值不小于预设值时,则返回分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离的步骤。
也就是说,在预设标准测度函数的目标值不小于预设值时,说明聚类还未满足用户想要的准确度,需要返回重新计算电力用户在各预设时间点的用电负荷分别到各更新后的额聚类中心的聚类,然后重新进行聚类获得新的聚类结果,断重复上述步骤,直到预设标准测度函数的目标值小于预设值,表示满足聚类终止条件,此时,即可确定获得的各电力用户的聚类结果为预设聚类个数的聚类类别。
在其中一个实施例中,根据预设选择规则,获得预设聚类个数的排位数包括:
根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1。
其中,Ph为第h个排位数,1≤h≤K,K为预设聚类个数,m为电力用户的数量,round函数为四舍五入的函数。
下面以一具体实施例对上述基于K均值的电力用户聚类方法加以具体说明,具体地,假设需要聚类的电力用户的数量为100个,要聚成10类,即预设聚类个数K为10,预设时间点的数量为24,分别为一天24个小时中每个小时中对应的时刻,分别为时刻1,时刻2,…,,时刻24。具体聚类步骤如下:
(1)初始化10个聚类中心
(1.1)负荷值排序
对于所有进行聚类的电力用户的数据记录(电力用户在24个预设时间点的用电负荷),每一条数据记录对应一个电力用户在24个预设时间的用电负荷,即包含24个时刻的用电负荷,例如,包括时刻1的负荷值,时刻2的用电负荷,…,时刻24的用电负荷,对所有电力用户的数据记录的一个时刻的用电负荷(如时刻1的用电负荷)进行由小到大的排序,获得时刻1对应的电力用户的用电负荷集(集合1),排序后的结果具体为:{时刻1的用电负荷16,时刻1的用电负荷23,…,时刻1的用电负荷61},即是一个用电负荷由小到大排列的100个值组成的集合1。对所有电力用户的数据记录的在其他23个时刻的用电负荷进行上述类似的排序,得到集合2,集合3,…,集合24。
(1.2)确定选取的排位数
依据公式:round(m/(k+1))*h-1(注:round是四舍五入的函数,h=1,2,3,...k,k是预设聚类个数,m是聚类的样本数的个数即电力用户的数量)选取排位数,选取的排位数分别为8,17,26,35,44,53,62,71,80,89。
(1.3)初始中心点选取
分别从集合1,集合2,…,集合24中选取第8个元素,可获得24个用电负荷,获得排位数8对应的各用电负荷,包括时刻1的用电负荷,时刻2的用电负荷,…,时刻24的用电负荷,时刻1的用电负荷值为集合1中的第8个元素,时刻2的用电负荷为集合2中的第8个元素,…时刻24的用电负荷为集合24中第8个元素,组成一条新数据记录1,然后,同样的在这24个集合中再选取其他的排位数对应的各用电负荷,组成9条新的数据记录,从而可获得10条新的数据记录,即根据每个排位数对应的各用电负荷,分别构建的预设聚类个数的在各预设时间点的新用电负荷。
10条新的数据记录即为10个在24个预设时间点的新用电负荷,每个新用电负荷中包括24个时刻对应的用电负荷,以这10条新的数据记录初始化K-means聚类算法的聚类中心。
(2)进行第一次聚类
进行聚类时,分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离,将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别,如此所有电力用户在各预设时间点的用电负荷找到自己对应的聚类中心进行聚类。
(3)更新聚类中心
计算同一类的所有电力用户的用电负荷在各预设时间点对应的用电负荷均值。以同一类中电力用户在各预设时间点对应的用电负荷均值更新聚类中心,其他所有的聚类类别进行相同的操作得到10个更新的聚类中心。
(4)持续聚类到收敛为止
以产生的10个更新的聚类中心,计算各聚类类别对应的预设标准测度函数的目标值,当预设标准测度函数的目标值不小于预设值时,返回分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离的步骤重新计算,选取最近的聚类中心作为其聚类中心,不断重复上面的步骤,直到预设标准测度函数的目标值小于预设值为止。
请参阅图3,本发明还提供一种实施例的基于K均值的电力用户聚类装置,包括:
负荷获取模块310,用于获取电力用户在各预设时间点的用电负荷。
排序模块320,用于根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集。
选取模块330,用于根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷。
构建模块340,用于根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷。
聚类模块350,用于将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。
上述基于K均值的电力用户聚类装置,获取电力用户在各预设时间点的用电负荷,根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。通过上述基于K均值的电力用户聚类装置初始化预设聚类个数的聚类中心时,不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷,并初始化为所述预设聚类个数的聚类中心,这样可合理地初始化预设聚类个数的聚类中心,在初始化聚类中心后根据K均值聚类算法对各电力用户进行聚类,可获得较为准确的聚类结果,提高聚类准确性。
在其中一个实施例中,聚类模块包括:
初始化模块451,用于预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心。
距离计算模块452,用于分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离。
聚类类别获取模块453,用于将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别。
均值计算模块454,用于计算各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值。
更新模块455,用于将电力用户所在聚类类别的聚类中心更新为聚类类别中电力用户在各预设时间点对应的用电负荷均值。
目标值获取模块456,用于根据更新后的聚类中心,计算各聚类类别对应的预设标准测度函数的目标值。
判断模块457,用于判断预设标准测度函数的目标值是否小于预设值。
确定模块458,用于当预设标准测度函数的目标值小于预设值时,确定各电力用户的聚类结果为预设聚类个数的聚类类别。
在其中一个实施例中,上述基于K均值的电力用户聚类装置还包括:
返回模块459,用于当预设标准测度函数的目标值不小于预设值时,返回距离计算模块分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离的步骤。
在其中一个实施例中,聚类类别对应的预设标准测度函数为平方误差和。
在其中一个实施例中,选取模块还具体用于根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1。
其中,Ph为第h个排位数,1≤h≤K,K为预设聚类个数,m为电力用户的数量,round函数为四舍五入的函数。
上述基于K均值的电力用户聚类装置为实现上述基于K均值的电力用户聚类方法的装置,技术特征一一对应,在此不再赘述。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于K均值的电力用户聚类方法,其特征在于,包括如下步骤:
获取电力用户在各预设时间点的用电负荷;
根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;
根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果。
2.根据权利要求1所述的基于K均值的电力用户聚类方法,其特征在于,所述将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果的步骤包括:
所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心;
分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离;
将所述电力用户分别划分至距离最近的所述聚类中心,获得所述预设聚类个数的聚类类别;
计算各所述聚类类别中所述电力用户的用电负荷在各所述预设时间点对应的用电负荷均值;
将所述电力用户所在所述聚类类别的所述聚类中心更新为所述聚类类别中所述电力用户在各所述预设时间点对应的用电负荷均值;
根据更新后的所述聚类中心,计算各所述聚类类别对应的预设标准测度函数的目标值;
当所述预设标准测度函数的目标值小于预设值时,确定各所述电力用户的聚类结果为所述预设聚类个数的聚类类别。
3.根据权利要求2所述的基于K均值的电力用户聚类方法,其特征在于,还包括步骤:
当所述预设标准测度函数的目标值不小于预设值时,返回所述分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离的步骤。
4.根据权利要求2所述的基于K均值的电力用户聚类方法,其特征在于,所述聚类类别对应的预设标准测度函数为平方误差和。
5.根据权利要求1所述的基于K均值的电力用户聚类方法,其特征在于,所述根据预设选择规则,获得预设聚类个数的排位数包括:
根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1;
其中,所述Ph为第h个排位数,1≤h≤K,所述K为预设聚类个数,所述m为所述电力用户的数量,所述round函数为四舍五入的函数。
6.一种基于K均值的电力用户聚类装置,其特征在于,包括:
负荷获取模块,用于获取电力用户在各预设时间点的用电负荷;
排序模块,用于根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;
选取模块,用于根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
构建模块,用于根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
聚类模块,用于将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果。
7.根据权利要求6所述的基于K均值的电力用户聚类装置,其特征在于,所述聚类模块包括:
初始化模块,用于所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心;
距离计算模块,用于分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离;
聚类类别获取模块,用于将所述电力用户分别划分至距离最近的所述聚类中心,获得所述预设聚类个数的聚类类别;
均值计算模块,用于计算各所述聚类类别中所述电力用户的用电负荷在各所述预设时间点对应的用电负荷均值;
更新模块,用于将所述电力用户所在所述聚类类别的所述聚类中心更新为所述聚类类别中所述电力用户在各所述预设时间点对应的用电负荷均值;
目标值获取模块,用于根据更新后的所述聚类中心,计算各所述聚类类别对应的预设标准测度函数的目标值;
确定模块,用于当所述预设标准测度函数的目标值小于预设值时,确定各所述电力用户的聚类结果为所述预设聚类个数的聚类类别。
8.根据权利要求7所述的基于K均值的电力用户聚类装置,其特征在于,还包括:
返回模块,用于当所述预设标准测度函数的目标值不小于预设值时,返回所述距离计算模块分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离的步骤。
9.根据权利要求7所述的基于K均值的电力用户聚类装置,其特征在于,所述聚类类别对应的预设标准测度函数为平方误差和。
10.根据权利要求6所述的基于K均值的电力用户聚类装置,其特征在于,所述选取模块还具体用于根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1;
其中,所述Ph为第h个排位数,1≤h≤K,所述K为预设聚类个数,所述m为所述电力用户的数量,所述round函数为四舍五入的函数。
CN201611081164.7A 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置 Active CN106600119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611081164.7A CN106600119B (zh) 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611081164.7A CN106600119B (zh) 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置

Publications (2)

Publication Number Publication Date
CN106600119A true CN106600119A (zh) 2017-04-26
CN106600119B CN106600119B (zh) 2020-11-03

Family

ID=58594010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611081164.7A Active CN106600119B (zh) 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置

Country Status (1)

Country Link
CN (1) CN106600119B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657266A (zh) * 2017-08-03 2018-02-02 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN108599140A (zh) * 2018-01-24 2018-09-28 合肥工业大学 用电负荷特征分析方法和装置、存储介质
CN111915116A (zh) * 2019-05-10 2020-11-10 国网能源研究院有限公司 一种基于K-means聚类的电力居民用户分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140320388A1 (en) * 2013-04-25 2014-10-30 Microsoft Corporation Streaming k-means computations
CN106022578A (zh) * 2016-05-12 2016-10-12 国网天津市电力公司 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140320388A1 (en) * 2013-04-25 2014-10-30 Microsoft Corporation Streaming k-means computations
CN106022578A (zh) * 2016-05-12 2016-10-12 国网天津市电力公司 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657266A (zh) * 2017-08-03 2018-02-02 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法
CN107657266B (zh) * 2017-08-03 2021-01-08 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法
CN108599140A (zh) * 2018-01-24 2018-09-28 合肥工业大学 用电负荷特征分析方法和装置、存储介质
CN108599140B (zh) * 2018-01-24 2021-01-29 合肥工业大学 用电负荷特征分析方法和装置、存储介质
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN111915116A (zh) * 2019-05-10 2020-11-10 国网能源研究院有限公司 一种基于K-means聚类的电力居民用户分类方法

Also Published As

Publication number Publication date
CN106600119B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN110568359B (zh) 一种锂电池剩余寿命预测方法
CN106600119A (zh) 基于k均值的电力用户聚类方法及装置
CN108090510A (zh) 一种基于间隔优化的集成学习方法及装置
CN104464304A (zh) 一种基于路网特性的城市道路车辆行驶速度预测方法
CN105488528A (zh) 基于改进自适应遗传算法的神经网络图像分类方法
CN103853786A (zh) 数据库参数的优化方法与系统
CN104424235A (zh) 实现用户信息聚类的方法和装置
CN106934722A (zh) 基于k节点更新与相似度矩阵的多目标社区检测方法
CN105139282A (zh) 一种电网指标数据处理方法、装置以及计算设备
CN110333991A (zh) 云平台任务最大资源使用率预测方法
Sahu et al. Fuzziness: a mathematical tool
CN106202388A (zh) 一种用户等级自动划分方法及系统
CN106548301A (zh) 电力用户聚类方法及装置
CN104217296A (zh) 一种上市公司绩效综合评价方法
Su et al. Comparing the Performance of Evolutionary Algorithms for Sparse Multi-Objective Optimization via a Comprehensive Indicator [Research Frontier]
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
CN104698838B (zh) 基于论域动态划分和学习的模糊调度规则挖掘方法
CN109858785A (zh) 一种评价智能电能表运行状态的方法和系统
Naik et al. Choice of effective fitness functions for genetic algorithm-aided dynamic fuzzy rule interpolation
CN109508820A (zh) 基于差异化建模的校园用电量预测建模方法
CN111337833B (zh) 一种基于动态时变权重的锂电池容量集成预测方法
Gangeraj et al. Estimation of origin–destination matrix from traffic counts based on fuzzy logic
CN104679988A (zh) 一种基于云topsis的多属性决策方法
CN108875961A (zh) 一种基于预界机制的在线加权极限学习机方法
CN108764586A (zh) 模糊Petri网参数优化方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210603

Address after: 510700 3rd, 4th and 5th floors of building J1 and 3rd floor of building J3, No.11 Kexiang Road, Science City, Luogang District, Guangzhou City, Guangdong Province

Patentee after: China Southern Power Grid Research Institute Co.,Ltd.

Address before: 510080 water Donggang 8, Dongfeng East Road, Yuexiu District, Guangzhou, Guangdong.

Patentee before: China Southern Power Grid Research Institute Co.,Ltd.

Patentee before: CSG POWER GRID TECHNOLOGY RESEARCH CENTER