CN106600119B - 基于k均值的电力用户聚类方法及装置 - Google Patents

基于k均值的电力用户聚类方法及装置 Download PDF

Info

Publication number
CN106600119B
CN106600119B CN201611081164.7A CN201611081164A CN106600119B CN 106600119 B CN106600119 B CN 106600119B CN 201611081164 A CN201611081164 A CN 201611081164A CN 106600119 B CN106600119 B CN 106600119B
Authority
CN
China
Prior art keywords
power
clustering
preset
preset time
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611081164.7A
Other languages
English (en)
Other versions
CN106600119A (zh
Inventor
李秋硕
李鹏
孙宇军
赵云
钱斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute of Southern Power Grid Co Ltd
Original Assignee
Power Grid Technology Research Center of China Southern Power Grid Co Ltd
Research Institute of Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Power Grid Technology Research Center of China Southern Power Grid Co Ltd, Research Institute of Southern Power Grid Co Ltd filed Critical Power Grid Technology Research Center of China Southern Power Grid Co Ltd
Priority to CN201611081164.7A priority Critical patent/CN106600119B/zh
Publication of CN106600119A publication Critical patent/CN106600119A/zh
Application granted granted Critical
Publication of CN106600119B publication Critical patent/CN106600119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于K均值的电力用户聚类方法及装置,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,并获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷并初始化为预设聚类个数的聚类中心,再采用K均值聚类算法对各电力用户进行聚类。不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷并初始化聚类中心,可合理地初始化聚类中心,在初始化聚类中心后进行聚类,可获得较为准确的聚类结果,提高聚类准确性。

Description

基于K均值的电力用户聚类方法及装置
技术领域
本发明涉及电力技术领域,特别涉及一种基于K均值的电力用户聚类方法及装置。
背景技术
在电力系统为用户提供电能过程中,不同电力用户用电情况可能不同,电力用户分类对电力系统的经济分析、运行以及规划具有重要影响。目前,常采用的电力用户聚类方法是K-means(K均值)聚类算法,主要从数据集S中选择K个数据作为初始聚类的中心,将数据集中的每个数据与距离中心最近的中心聚类。首先随机选择K个数据作为初始中心,计算各个数据到所选出来的各个中心的距离,将数据指派到最近的中心形成一类,计算每个类的均值,循环反复执行,直到满足聚类准则函数收敛为止。其中,输入:初始数据集S和类的数目K。输出:K个聚类类别,满足平方误差准则函数收敛,其具体的工作步骤为:1)从数据集中任意选择K个数据作为初始聚类中心;2)计算各个数据到所选出来的各个中心的距离,将数据指派到最近的中心形成一类;3)将形成的类中数据的均值作为对应的新的聚类中心,将每个数据更新至最类似的类;4)计算聚类准则函数E(一般为均方差),直到准则函数E开始收敛为止。
K-means聚类算法首先是要初始化聚类中心,也就是说,初始的聚类中心对后续聚类效果有较大影响,然而,采用K-means聚类算法进行电力用户聚类时,是随机在数据集中选择K个数据作为初始中心,再进行后续的聚类步骤,无法确保电力用户聚类的准确性。
发明内容
基于此,有必要针对的电力用户聚类不准确的问题,提供一种提高电力用户聚类准确性的基于K均值的电力用户聚类方法及装置。
一种基于K均值的电力用户聚类方法,包括如下步骤:
获取电力用户在各预设时间点的用电负荷;
根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;
根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果。
本发明还提供一种基于K均值的电力用户聚类装置,包括:
负荷获取模块,用于获取电力用户在各预设时间点的用电负荷;
排序模块,用于根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;
选取模块,用于根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
构建模块,用于根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
聚类模块,用于将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果。
上述基于K均值的电力用户聚类方法及装置,获取电力用户在各预设时间点的用电负荷,根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。通过上述基于K均值的电力用户聚类方法及装置初始化预设聚类个数的聚类中心时,不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷,并初始化为所述预设聚类个数的聚类中心,这样可合理地初始化预设聚类个数的聚类中心,在初始化聚类中心后根据K均值聚类算法对各电力用户进行聚类,可获得较为准确的聚类结果,提高聚类准确性。
附图说明
图1为一实施例的基于K均值的电力用户聚类方法的流程图;
图2为另一实施例的基于K均值的电力用户聚类方法的子流程图;
图3为一实施例的基于K均值的电力用户聚类装置的模块图;
图4为另一实施例的基于K均值的电力用户聚类装置的子模块图。
具体实施方式
请参阅图1,提供一种实施例的基于K均值的电力用户聚类方法,包括如下步骤:
S110:获取电力用户在各预设时间点的用电负荷。
电力系统为电力用户供电,每个电力用户对应有各自的用电负荷,且电力用户在每个时刻有其对应的用电负荷,例如,电力用户A在某一天中的第一个预设时间点的用电负荷为10。在本实施例中,预设时间点的数量可为24,也就是说,各预设时间点可预先设置,例如,可选择一天中每个小时中的某一时刻作为预设时间点,从而可设置24个预设时间点。在本实施例中,通过获取电力用户在各预设时间点的用电负荷,也就即可获取到该电力用户在每个预设时间的用电负荷,例如,可获取电力用户A在一天中24个预设时间点对应的用电负荷,电力用户为多个时,即可获取每个电力用户在一天中24个预设时间点对应的用电负荷。其中,电力用户在各预设时间点的用电负荷包括了预设时间点的个数的用电负荷。
S120:根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集。
由于各电力用户用电情况的不同,其对应的用电负荷不同,且同一电力用户在不同预设时间点的用电负荷也可能不同,从而,各电力用户在同一预设时间点的用电负荷可能不同,在本实施例中,根据预设排序规则,可对各电力用户在每个预设时间点的用电负荷进行排序,例如,对各电力用户在一天中某个预设时间点比如一天中第一个小时对应的第一个预设时间点对应的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集。例如,电力用户A在第一预设时间点对应的用电负荷为16,电力用户B在第一预设时间点对应的用电负荷为61,电力用户C在第一预设时间点的用电负荷为23,对上述三个电力用户在同一预设时间点的用电负荷进行排序,获得第一预设时间点对应的电力用户的用电负荷集。对各电力用户在每个预设时间点的用电负荷进行上述类似的排序过程,从而,可获得各预设时间点对应的电力用户的用电负荷集。每个用电负荷集中元素的数量为电力用户的数量。
S130:根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷。
在对电力用户进行聚类时,预先设置有预设聚类个数,在获得各预设时间点对应的电力用户的用电负荷集后,需要从各预设时间点对应的电力用户的用电负荷集中分别选取排位数对应的用电负荷,例如,预设聚类个数为10,获取到10个排位数,比如10个排位数分别为8、17、26、35、44、53、62、71、80和89,首先从各用电负荷集中选择排位数为8的用电负荷,获得排位数8对应的各用电负荷,同理地,从各用电负荷集中选择其他9个排位数分别对应的各用电负荷,从而,获取到每个排位数对应的各用电负荷。单个排位数对应的各用电负荷的数量与预设时间点的个数相同。其中,预设排序规则可以为时间从小到大的排序规则,也可以为时间从大到小的排序规则。
S140:根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷。
单个在各预设时间点的新用电负荷中包括预设时间点的个数的用电负荷,由于在对用户聚类中,需要预先设置预设聚类个数,排位数的个数与预设聚类个数相同,从而,在获取到每个排位数对应的各用电负荷后,可构建预设聚类个数的在各预设时间点的新用电负荷。
S150:将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。
获得预设聚类个数的排位数,可从各用电负荷集中获取排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,可分别构建预设聚类个数的在各预设时间点的新用电负荷。利用K均值聚类算法进行聚类时,首先是需要初始化预设聚类个数的聚类中心,在本实施例中,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,然后,利用K均值聚类算法对电力用户进行聚类获得聚类结果,其中,聚类时,采用的聚类特征是电力用户在各预设时间点的用电负荷。
上述基于K均值的电力用户聚类方法,获取电力用户在各预设时间点的用电负荷,根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。通过上述基于K均值的电力用户聚类方法初始化预设聚类个数的聚类中心时,不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷,并初始化为所述预设聚类个数的聚类中心,这样可合理地初始化预设聚类个数的聚类中心,在初始化聚类中心后根据K均值聚类算法对各电力用户进行聚类,可获得较为准确的聚类结果,提高聚类准确性。
在电力系统为用户提供电能过程中,不同电力用户用电情况可能不同,电力用户聚类结果对电力系统的经济分析、运行以及规划具有重要影响,从而,在对电力用户进行聚类获得聚类结果后,可根据电力用户的聚类结果,可对电力系统进行规划,例如,可为用电负荷较大的一类电力用户提供较大功率的电能。通过提高电力用户的聚类结果的准确性,从而可有效准确地对电力系统进行规划,使电力系统稳定运行。
在其中一个实施例中,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果的步骤包括:
S251:预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心。
将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,即可获得预设聚类个数的聚类中心。
S252:分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离。
S253:将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别。
电力用户在各预设时间点的用电负荷中包括了预设时间点个数的用电负荷,例如,预设时间点个数为24,分别为一天中每个小时中的某一个时刻,则电力用户在各预设时间点的用电负荷相当于一个具有24个元素的向量,其中,24个元素分别为24个预设时间点对应的用电负荷,每个聚类中心中也包括了预设时间个数的新用电负荷,也就是说,在预设时间点个数为24时,聚类中心中也是为包括了24个元素的向量,聚类中心中的24个元素为在24个预设时间点对应的新用电负荷。电力用户在各预设时间点的用电负荷中数量与聚类中心中的新用电负荷的数量是一样的,相当于两个元素数量相同的向量,在计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离时,相当于计算两个向量之间的距离。
由于聚类中心的数量有预设聚类个数,从而,需要计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离。然后,将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别。
S254:计算各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值。
将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别后,每个聚类类别中可能包括多个电力用户,聚类类别的电力用户间的用电负荷可能不同,需要聚类列别中包括的电力用户在各预设时间点对应的用电负荷值,例如,一个聚类类别中包括电力用户A和电力用户B,电力用户A的用电负荷中,在第一个预设时间点的用电负荷为10,在第二个预设时间点的用电负荷为20,电力用户B的用电负荷中,在第一个预设时间点的用电负荷为16,在第二个预设时间点的用电负荷为18,聚类类别中电力用户的用电负荷在第一个预设时间点对应的用电负荷均值为18,聚类类别中电力用户的用电负荷在第二个预设时间点对应的用电负荷均值为19,对于其他聚类中心执行类似的操作,可获得各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值。
S255:将电力用户所在聚类类别的聚类中心更新为聚类类别中电力用户在各预设时间点对应的用电负荷均值。
在获得各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值后,需要更新每个聚类类别对应的聚类中心,即将聚类中心更新为聚类类别中电力用户在各预设时间点对应的用电负荷均值。例如,某一个聚类中心为第一预设时间点的用电负荷为10,第二预设时间点的用电负荷为20,聚类中心中包括电力用户A和电力用户B,该聚类类别中电力用户A和电力用户B的用电负荷在第一个预设时间点对应的用电负荷均值为18,在第二个预设时间点对应的用电负荷均值为19,在进行更新时,即将该聚类中心的第一预设时间对应的用电负荷更新为第一预设时间对应的用电负荷均值18,将该聚类中心的第二预设时间对应的用电负荷更新为在第二预设时间对应的用电负荷均值19,对每个聚类中心执行上述类似的更新动作,实现每个聚类中心的更新。
S256:根据更新后的聚类中心,计算各聚类类别对应的预设标准测度函数的目标值。
在进行聚类,且更新聚类中心后,需要计算每个聚类类别对应的预设标准测度函数的目标值,用做后续终止聚类的条件。在本实施例中,聚类类别对应的预设标准测度函数为聚类类别中各电力用户在各预设时间点的用电负荷到聚类中心的平方误差和,即通过公式
Figure BDA0001166979860000081
可获得预设标准测度函数的目标值,其中,J为预设标准测度函数的目标值,i为1到n的整数,n为该聚类类别中电力用户的数量,Xi为第i个电力用户在个预设时间点的用电负荷,U为聚类中心。也就是说,聚类类别对应的预设标准测度函数为聚类类别中每个电力用户在各预设时间点的用电负荷到聚类中心的平方误差和,预设标准测度函数的目标值即为平方误差和值。
S257:判断预设标准测度函数的目标值是否小于预设值。
当预设标准测度函数的目标值小于预设值时,执行以下步骤:
S258:确定各电力用户的聚类结果为预设聚类个数的聚类类别。
当预设标准测度函数的目标值不小于预设值时,则返回分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离的步骤。
也就是说,在预设标准测度函数的目标值不小于预设值时,说明聚类还未满足用户想要的准确度,需要返回重新计算电力用户在各预设时间点的用电负荷分别到各更新后的额聚类中心的聚类,然后重新进行聚类获得新的聚类结果,断重复上述步骤,直到预设标准测度函数的目标值小于预设值,表示满足聚类终止条件,此时,即可确定获得的各电力用户的聚类结果为预设聚类个数的聚类类别。
在其中一个实施例中,根据预设选择规则,获得预设聚类个数的排位数包括:
根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1。
其中,Ph为第h个排位数,1≤h≤K,K为预设聚类个数,m为电力用户的数量,round函数为四舍五入的函数。
下面以一具体实施例对上述基于K均值的电力用户聚类方法加以具体说明,具体地,假设需要聚类的电力用户的数量为100个,要聚成10类,即预设聚类个数K为10,预设时间点的数量为24,分别为一天24个小时中每个小时中对应的时刻,分别为时刻1,时刻2,…,,时刻24。具体聚类步骤如下:
(1)初始化10个聚类中心
(1.1)负荷值排序
对于所有进行聚类的电力用户的数据记录(电力用户在24个预设时间点的用电负荷),每一条数据记录对应一个电力用户在24个预设时间的用电负荷,即包含24个时刻的用电负荷,例如,包括时刻1的负荷值,时刻2的用电负荷,…,时刻24的用电负荷,对所有电力用户的数据记录的一个时刻的用电负荷(如时刻1的用电负荷)进行由小到大的排序,获得时刻1对应的电力用户的用电负荷集(集合1),排序后的结果具体为:{时刻1的用电负荷16,时刻1的用电负荷23,…,时刻1的用电负荷61},即是一个用电负荷由小到大排列的100个值组成的集合1。对所有电力用户的数据记录的在其他23个时刻的用电负荷进行上述类似的排序,得到集合2,集合3,…,集合24。
(1.2)确定选取的排位数
依据公式:round(m/(k+1))*h-1(注:round是四舍五入的函数,h=1,2,3,...k,k是预设聚类个数,m是聚类的样本数的个数即电力用户的数量)选取排位数,选取的排位数分别为8,17,26,35,44,53,62,71,80,89。
(1.3)初始中心点选取
分别从集合1,集合2,…,集合24中选取第8个元素,可获得24个用电负荷,获得排位数8对应的各用电负荷,包括时刻1的用电负荷,时刻2的用电负荷,…,时刻24的用电负荷,时刻1的用电负荷值为集合1中的第8个元素,时刻2的用电负荷为集合2中的第8个元素,…时刻24的用电负荷为集合24中第8个元素,组成一条新数据记录1,然后,同样的在这24个集合中再选取其他的排位数对应的各用电负荷,组成9条新的数据记录,从而可获得10条新的数据记录,即根据每个排位数对应的各用电负荷,分别构建的预设聚类个数的在各预设时间点的新用电负荷。
10条新的数据记录即为10个在24个预设时间点的新用电负荷,每个新用电负荷中包括24个时刻对应的用电负荷,以这10条新的数据记录初始化K-means聚类算法的聚类中心。
(2)进行第一次聚类
进行聚类时,分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离,将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别,如此所有电力用户在各预设时间点的用电负荷找到自己对应的聚类中心进行聚类。
(3)更新聚类中心
计算同一类的所有电力用户的用电负荷在各预设时间点对应的用电负荷均值。以同一类中电力用户在各预设时间点对应的用电负荷均值更新聚类中心,其他所有的聚类类别进行相同的操作得到10个更新的聚类中心。
(4)持续聚类到收敛为止
以产生的10个更新的聚类中心,计算各聚类类别对应的预设标准测度函数的目标值,当预设标准测度函数的目标值不小于预设值时,返回分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离的步骤重新计算,选取最近的聚类中心作为其聚类中心,不断重复上面的步骤,直到预设标准测度函数的目标值小于预设值为止。
请参阅图3,本发明还提供一种实施例的基于K均值的电力用户聚类装置,包括:
负荷获取模块310,用于获取电力用户在各预设时间点的用电负荷。
排序模块320,用于根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集。
选取模块330,用于根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷。
构建模块340,用于根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷。
聚类模块350,用于将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。
上述基于K均值的电力用户聚类装置,获取电力用户在各预设时间点的用电负荷,根据预设排序规则,对各电力用户在每个预设时间点的用电负荷进行排序,获得各预设时间点对应的电力用户的用电负荷集,根据预设选择规则,获得预设聚类个数的排位数,从各用电负荷集中分别选取排位数对应的用电负荷,获得每个排位数对应的各用电负荷,根据每个排位数对应的各用电负荷,分别构建预设聚类个数的在各预设时间点的新用电负荷,将预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心,根据电力用户在各预设时间点的用电负荷、聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各电力用户的聚类结果。通过上述基于K均值的电力用户聚类装置初始化预设聚类个数的聚类中心时,不再是随机在电力用户中选取在各预设时间点的用电负荷作为初始化聚类中心,而是根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷,并初始化为所述预设聚类个数的聚类中心,这样可合理地初始化预设聚类个数的聚类中心,在初始化聚类中心后根据K均值聚类算法对各电力用户进行聚类,可获得较为准确的聚类结果,提高聚类准确性。
在其中一个实施例中,聚类模块包括:
初始化模块451,用于预设聚类个数的在各预设时间点的新用电负荷分别初始化为预设聚类个数的聚类中心。
距离计算模块452,用于分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离。
聚类类别获取模块453,用于将电力用户分别划分至距离最近的聚类中心,获得预设聚类个数的聚类类别。
均值计算模块454,用于计算各聚类类别中电力用户的用电负荷在各预设时间点对应的用电负荷均值。
更新模块455,用于将电力用户所在聚类类别的聚类中心更新为聚类类别中电力用户在各预设时间点对应的用电负荷均值。
目标值获取模块456,用于根据更新后的聚类中心,计算各聚类类别对应的预设标准测度函数的目标值。
判断模块457,用于判断预设标准测度函数的目标值是否小于预设值。
确定模块458,用于当预设标准测度函数的目标值小于预设值时,确定各电力用户的聚类结果为预设聚类个数的聚类类别。
在其中一个实施例中,上述基于K均值的电力用户聚类装置还包括:
返回模块459,用于当预设标准测度函数的目标值不小于预设值时,返回距离计算模块分别计算电力用户在各预设时间点的用电负荷分别到各聚类中心的距离的步骤。
在其中一个实施例中,聚类类别对应的预设标准测度函数为平方误差和。
在其中一个实施例中,选取模块还具体用于根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1。
其中,Ph为第h个排位数,1≤h≤K,K为预设聚类个数,m为电力用户的数量,round函数为四舍五入的函数。
上述基于K均值的电力用户聚类装置为实现上述基于K均值的电力用户聚类方法的装置,技术特征一一对应,在此不再赘述。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于K均值的电力用户聚类方法,其特征在于,包括如下步骤:
获取电力用户在各预设时间点的用电负荷;所述用电负荷反映在电力系统为所述电力用户提供电能的过程中,所述电力用户的用电情况;
根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;所述预设排序规则为用电负荷从小到大的排序规则,或用电负荷从大到小的排序规则;
根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果,所述聚类结果用于确定所述电力系统为各所述电力用户提供电能的功率大小;
所述根据预设选择规则,获得预设聚类个数的排位数包括:
根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1;
其中,所述Ph为第h个排位数,1≤h≤K,所述K为预设聚类个数,所述m为所述电力用户的数量,所述round函数为四舍五入的函数。
2.根据权利要求1所述的基于K均值的电力用户聚类方法,其特征在于,所述将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果的步骤包括:
所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心;
分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离;
将所述电力用户分别划分至距离最近的所述聚类中心,获得所述预设聚类个数的聚类类别;
计算各所述聚类类别中所述电力用户的用电负荷在各所述预设时间点对应的用电负荷均值;
将所述电力用户所在所述聚类类别的所述聚类中心更新为所述聚类类别中所述电力用户在各所述预设时间点对应的用电负荷均值;
根据更新后的所述聚类中心,计算各所述聚类类别对应的预设标准测度函数的目标值;
当所述预设标准测度函数的目标值小于预设值时,确定各所述电力用户的聚类结果为所述预设聚类个数的聚类类别。
3.根据权利要求2所述的基于K均值的电力用户聚类方法,其特征在于,还包括步骤:
当所述预设标准测度函数的目标值不小于预设值时,返回所述分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离的步骤。
4.根据权利要求2所述的基于K均值的电力用户聚类方法,其特征在于,所述聚类类别对应的预设标准测度函数为平方误差和。
5.一种基于K均值的电力用户聚类装置,其特征在于,包括:
负荷获取模块,用于获取电力用户在各预设时间点的用电负荷;所述用电负荷反映在电力系统为所述电力用户提供电能的过程中,所述电力用户的用电情况;
排序模块,用于根据预设排序规则,对各所述电力用户在每个所述预设时间点的用电负荷进行排序,获得各所述预设时间点对应的所述电力用户的用电负荷集;所述预设排序规则为用电负荷从小到大的排序规则,或用电负荷从大到小的排序规则;
选取模块,用于根据预设选择规则,获得预设聚类个数的排位数,从各所述用电负荷集中分别选取所述排位数对应的用电负荷,获得每个所述排位数对应的各所述用电负荷;
构建模块,用于根据每个所述排位数对应的各所述用电负荷,分别构建所述预设聚类个数的在各所述预设时间点的新用电负荷;
聚类模块,用于将所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心,根据所述电力用户在各所述预设时间点的用电负荷、所述聚类中心以及K均值聚类算法对各电力用户进行聚类,获得各所述电力用户的聚类结果,所述聚类结果用于确定所述电力系统为各所述电力用户提供电能的功率大小;
所述根据预设选择规则,获得预设聚类个数的排位数包括:
根据以下公式获取预设聚类个数的排位数:
Ph=round(m/(K+1))*h-1;
其中,所述Ph为第h个排位数,1≤h≤K,所述K为预设聚类个数,所述m为所述电力用户的数量,所述round函数为四舍五入的函数。
6.根据权利要求5所述的基于K均值的电力用户聚类装置,其特征在于,所述聚类模块包括:
初始化模块,用于所述预设聚类个数的在各所述预设时间点的新用电负荷分别初始化为所述预设聚类个数的聚类中心;
距离计算模块,用于分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离;
聚类类别获取模块,用于将所述电力用户分别划分至距离最近的所述聚类中心,获得所述预设聚类个数的聚类类别;
均值计算模块,用于计算各所述聚类类别中所述电力用户的用电负荷在各所述预设时间点对应的用电负荷均值;
更新模块,用于将所述电力用户所在所述聚类类别的所述聚类中心更新为所述聚类类别中所述电力用户在各所述预设时间点对应的用电负荷均值;
目标值获取模块,用于根据更新后的所述聚类中心,计算各所述聚类类别对应的预设标准测度函数的目标值;
确定模块,用于当所述预设标准测度函数的目标值小于预设值时,确定各所述电力用户的聚类结果为所述预设聚类个数的聚类类别。
7.根据权利要求6所述的基于K均值的电力用户聚类装置,其特征在于,还包括:
返回模块,用于当所述预设标准测度函数的目标值不小于预设值时,返回所述距离计算模块分别计算所述电力用户在各所述预设时间点的用电负荷分别到各所述聚类中心的距离的步骤。
8.根据权利要求6所述的基于K均值的电力用户聚类装置,其特征在于,所述聚类类别对应的预设标准测度函数为平方误差和。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述方法的步骤。
CN201611081164.7A 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置 Active CN106600119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611081164.7A CN106600119B (zh) 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611081164.7A CN106600119B (zh) 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置

Publications (2)

Publication Number Publication Date
CN106600119A CN106600119A (zh) 2017-04-26
CN106600119B true CN106600119B (zh) 2020-11-03

Family

ID=58594010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611081164.7A Active CN106600119B (zh) 2016-11-30 2016-11-30 基于k均值的电力用户聚类方法及装置

Country Status (1)

Country Link
CN (1) CN106600119B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657266B (zh) * 2017-08-03 2021-01-08 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法
CN108599140B (zh) * 2018-01-24 2021-01-29 合肥工业大学 用电负荷特征分析方法和装置、存储介质
CN108460410A (zh) * 2018-02-08 2018-08-28 合肥工业大学 居民需求侧的用电模式识别方法和系统、存储介质
CN111915116A (zh) * 2019-05-10 2020-11-10 国网能源研究院有限公司 一种基于K-means聚类的电力居民用户分类方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022578A (zh) * 2016-05-12 2016-10-12 国网天津市电力公司 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140320388A1 (en) * 2013-04-25 2014-10-30 Microsoft Corporation Streaming k-means computations

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022578A (zh) * 2016-05-12 2016-10-12 国网天津市电力公司 基于数据高维化和K-means聚类的居民用电峰谷平时段划分方法

Also Published As

Publication number Publication date
CN106600119A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN106600119B (zh) 基于k均值的电力用户聚类方法及装置
CN106355449B (zh) 用户选取方法和装置
CN111327377B (zh) 场强预测方法、装置、设备及存储介质
US10902025B2 (en) Techniques for measuring a property of interest in a dataset of location samples
CN110827924B (zh) 基因表达数据的聚类方法、装置、计算机设备及存储介质
JPWO2016001998A1 (ja) 類似度算出システム、類似度算出方法およびプログラム
Mikhailiuk et al. Active sampling for pairwise comparisons via approximate message passing and information gain maximization
WO2020053789A1 (en) Global ancestry determination system
Seridi et al. Multi-objective evolutionary algorithm for biclustering in microarrays data
US7991617B2 (en) Optimum design management apparatus from response surface calculation and method thereof
CN106548301B (zh) 电力用户聚类方法及装置
US11386332B2 (en) Optimization calculation method and information processing apparatus
US10248462B2 (en) Management server which constructs a request load model for an object system, load estimation method thereof and storage medium for storing program
JP2016537702A (ja) システムから取得される測定値を評価する方法及びシステム
CN111949530B (zh) 测试结果的预测方法、装置、计算机设备及存储介质
Couto et al. Effects of threshold on the topology of gene co-expression networks
CN109978023A (zh) 面向高维大数据分析的特征选择方法及计算机存储介质
CN111008705A (zh) 一种搜索方法、装置及设备
US20210026853A1 (en) Combination search system, information processing device, method, and program
CN110428164A (zh) 一种电网运行状态监测方法、装置、设备及可读存储介质
Denysiuk et al. A new hybrid evolutionary multiobjective algorithm guided by descent directions
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes
CN104636489B (zh) 描述属性数据的处理方法和装置
Erol A model selection algorithm for mixture model clustering of heterogeneous multivariate data
CN112561138A (zh) 电力负荷预测方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210603

Address after: 510700 3rd, 4th and 5th floors of building J1 and 3rd floor of building J3, No.11 Kexiang Road, Science City, Luogang District, Guangzhou City, Guangdong Province

Patentee after: China Southern Power Grid Research Institute Co.,Ltd.

Address before: 510080 water Donggang 8, Dongfeng East Road, Yuexiu District, Guangzhou, Guangdong.

Patentee before: China Southern Power Grid Research Institute Co.,Ltd.

Patentee before: CSG POWER GRID TECHNOLOGY RESEARCH CENTER