CN112464059B - 配电网用户分类方法、装置、计算机设备和存储介质 - Google Patents

配电网用户分类方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112464059B
CN112464059B CN202011425469.1A CN202011425469A CN112464059B CN 112464059 B CN112464059 B CN 112464059B CN 202011425469 A CN202011425469 A CN 202011425469A CN 112464059 B CN112464059 B CN 112464059B
Authority
CN
China
Prior art keywords
clustering
cluster
load data
result
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011425469.1A
Other languages
English (en)
Other versions
CN112464059A (zh
Inventor
张华赢
李鸿鑫
康文韬
邓世聪
刘恒勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Power Supply Bureau Co Ltd
Original Assignee
Shenzhen Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Power Supply Bureau Co Ltd filed Critical Shenzhen Power Supply Bureau Co Ltd
Priority to CN202011425469.1A priority Critical patent/CN112464059B/zh
Publication of CN112464059A publication Critical patent/CN112464059A/zh
Application granted granted Critical
Publication of CN112464059B publication Critical patent/CN112464059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种配电网用户分类方法、装置、计算机设备的存储介质,该方法通过获取预设聚类个数的最大值和最小值;从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果,根据每个聚类结果,计算每个聚类结果的聚类评价指标;根据每个聚类结果的聚类评价指标确定目标聚类个数,根据目标聚类个数对应的聚类结果,确定用户的聚类类别。本发明涉及的配电网用户分类方法对用户的分类的准确性较高。

Description

配电网用户分类方法、装置、计算机设备和存储介质
技术领域
本发明涉及分类技术领域,特别是涉及一种配电网用户分类方法、装置、计算机设备和存储介质。
背景技术
随着智能电网建设的不断推进,电力企业与负荷用户之间的交互行为飞速增长,配电网逐步积累了大量的用户侧数据。目前,电力企业的工作重心正逐步从单纯的输电和发电转向电力需求侧管理。因此,如何利用配电网积累的用户侧数据,对用户进行分类,以便于配电网满足不同类型的用户的个性化需求是现在需要重点研究的内容。
传统技术中,通常使用k-means聚类方法对用户侧数据进行聚类分别,实现对用户的分类。但是,该方法的对用户的分类不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种配电网用户分类方法、装置、计算机设备和存储介质。
一方面,本申请一个实施例提供一种配电网用户分类方法,其特征在于,包括:
获取预设聚类个数的最大值和最小值;
从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;
根据每个聚类结果,计算每个聚类结果的聚类评价指标;
根据每个聚类结果的聚类评价指标确定目标聚类个数;
根据目标聚类个数对应的聚类结果,确定用户的聚类类别。
在其中一个实施例中,根据每个聚类结果的聚类评价指标确定目标聚类个数,包括:
将多个聚类评价指标降序排列,计算排列后的多个聚类评价指标下降的速度;
将聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为目标聚类个数。
在其中一个实施例中,从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果,包括:
将最小值作为初始聚类个数;
根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果;
将初始聚类个数加1作为新的初始聚类个数,返回执行根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果的步骤,直至初始聚类个数与最大值相等为止。
在其中一个实施例中,根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果,包括:
根据初始聚类个数确定多个初始聚类中心,其中,初始聚类中心的个数与初始聚类个数相同;
计算多个用户的用电负荷数据与每个初始聚类中心之间的距离;
针对每个用户的用电负荷数据,将用户的用电负荷数据分配到距离最小的初始聚类中心对应的聚类类别中;
若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,则将当前聚类类别确定为初始聚类个数的聚类结果;
若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于预设距离阈值的距离,则返回执行根据初始聚类个数确定多个初始聚类中心的步骤。
在其中一个实施例中,根据目标聚类个数对应的聚类结果,确定用户的聚类类别,包括:
计算每个用户的用电负荷数据的特征值数据,得到多个特征值数据,其中,特征值数据包括平均用电负荷、负载率和用电负荷百分比;
根据目标聚类个数对多个特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果;
根据特征值聚类结果,确定用户的聚类类别。
在其中一个实施例中,还包括:
根据特征值聚类结果,获取第一聚类类别中的用户的总数,得到第一聚类数,其中,第一聚类类别为包括的用户个数最多的聚类类别;
获取第二聚类类别中的用户的总数,得到第二聚类数,其中,第二聚类类别包括从特征值聚类结果中除去第一聚类类别后的所有聚类类别;
根据第一聚类和所述第二聚类数,确定准确性评价指标;
根据准确性评价指标,确定特征值聚类结果的准确性。
在其中一个实施例中,还包括:
根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,负荷数据聚类结果是根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果;
根据特征值聚类结果,确定每个用户对应的聚类类别,构成多个聚类序列;
根据多个聚类序列的熵的平均值,确定第一聚类结果和第二聚类结果的相似性。
另一方面,本申请一个实施例提供一种配电网用户分类装置,包括:
获取模块,用于获取预设聚类个数的最大值和最小值;
确定模块,用于从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;
计算模块,用于根据每个聚类结果,计算每个聚类结果的聚类评价指标;
确定模块,还用于根据每个聚类结果的聚类评价指标确定目标聚类个数;
确定模块,还用于根据目标聚类个数对应的聚类结果,确定用户的聚类类别。
本申请一个实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现如上实施例提供的方法的步骤。
本申请一个实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上实施例提供的方法的步骤。
本申请提供一种配电网用户分类方法、装置、计算机设备和存储介质。该方法通过从预设聚类个数的最小值开始,遍历预设聚类个数的最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;根据每个聚类个数的聚类结果的聚类评价指标确定目标聚类个数,根据目标聚类个数对应的聚类结果,确定用户的聚类类别。这样通过遍历选取最优的目标聚类个数,无需人为指定聚类个数,可以保证在目标聚类个数对应的聚类结果的准确性,从而能够提高对用户进行分类的准确性。
附图说明
为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域不同技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图2为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图3为本申请一个实施例提供的聚类评价指标与聚类个数之间的关系的示意图;
图4为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图5为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图6为本申请一个实施例提供的用户聚类分析后的聚类结果的示意图;
图7为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图8为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图9为本申请一个实施例提供的配电网用户分类的步骤流程示意图;
图10为本申请一个实施例提供的用户序号与熵的关系的示意图;
图11为本申请一个实施例提供的配电网用户分类装置的结构示意图;
图12为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供的配电网用户分类方法可以应用于智能电网中对大量的用户侧的数据进行处理,实现对配电网用户的分类,使得配电网可以根据不同用户的需求进行供电,从而可以满足不同类型的用户的个性化需求,进而提高配电网的适用性。
本申请提供的配电网用户分类方法可以通过计算机设备实现,计算机设备包括但不限于控制芯片、个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。本申请提供的方法可以通过JAVA软件实现,也可以应用于其他软件,通过其他编程语言实现配电网用户分类。
请参见图1,本申请一个实施例提供一种配电网用户分类方法,该方法涉及的时计算机设备根据用户侧的数据对用户进行分类的过程,具体的实现步骤包括:
步骤100、获取预设聚类个数的最大值和最小值;
预设聚类个数的最大值和最小值可以是由工作人员根据用电负荷数据的数量和实际经验设置的。预设聚类个数的数量均为整数。预设聚类个数的最大值和最小值可以由工作人员存储在计算机设备的存储器中,计算机设备在实施配电网用户分类方法时直接从存储器中获取即可。预设聚类个数的最大值和最小值也可以在计算机设备实施配电网用户分类方法的过程中,由工作人员输入。本实施例对获取预设聚类个数的最大值和最小值的方法不作任何限制,只要能够实现其功能即可。
步骤200、从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果。
预设聚类个数的最大值和最小值之间包括多个聚类个数。一个用户的用电负荷数据包括与该用户相对应的配电变压器在预设时间段内采集的该用户的用电负荷数据。一个配电变压器对应一个用户。预设时间段可以是由工作人员根据实际需求设置的,可以是一天,一个月或者一年。一个配电变压器在预设时间段内采集的对应的用户的用电负荷数据可以形成d维向量,其中,d表示预设时间段内的d个时刻采集的用户的用电负荷数据,即,每个时刻该配电变压器都可以采集到用户的负荷数据,将一个配电变压器在预设时间段内的d个时刻采集的对应的用户的全部的负荷数据称为该用户的用电负荷数据。用电负荷数据可以是用电功率。配电网中包括多个用户,对应多个配电变压器,则最终可以得到多个用户的用电负荷数据。在一个具体的实施例中,计算机设备还可以对得到的用户的用电负荷数据进行预处理,可以将用户的用电负荷数据中冗余的数据删除,缺失的数据选择历史数据中对应时刻的数据进行补充,当用电负荷数据存在大量缺失时,可以对其进行线性补齐。
聚类分析是将相似的用电负荷数据通过静态分类的方法分成不同的类别,这样使得在同一类别中的用电负荷数据都有相似的一些特性。计算机设备从最小值开始,根据最小值到最大值之间的每个聚类个数,均对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果。聚类结果是指根据聚类个数对用电负荷数据进行聚类分析后,将多个用电负荷数据分为不同的聚类类别,每个聚类类别中的用电负荷数据之间有相似的特性。其中,聚类类别的个数与聚类个数相同。在本实施例中的聚类分析采用的是基于质心的聚类算法,具体的,可以采用k-means聚类算法进行聚类分析。
步骤300、根据每个聚类结果,计算每个聚类结果的聚类评价指标。
聚类结果的聚类评价指标可以用于表示该聚类结果的聚类效果。计算机设备对得到的每个聚类结果计算聚类结果的聚类评价指标,即,一个聚类结果与对聚类结果的聚类评价指标相对应。本实施例对计算聚类结果聚类评价指标的具体方法不作任何限制,只要能够得到可以表示聚类结果的聚类效果即可。
在一个可选的实施例中,根据目标聚类个数、聚类类别和多个用户的用电负荷数据,计算聚类结果的聚类评价指标。其中,聚类类别是指聚类结果中包括的聚类类别。具体的,聚类结果的聚类评价指标可以使用如下公式计算:其中,E表示聚类结果的聚类评价指标,k表示目标聚类个数,i表示第i个聚类中心,j表示用户的个数;ai表示第i个聚类中心所在的聚类类别中用户的个数,τ表示多个用户的用电负荷数据预设时间段的时刻,C(τ)表示在τ时刻的用户的用电负荷数据,n表示预设时间段,d表示预设时间段内一个用户的用电负荷数据的数量。
步骤400、根据每个聚类结果的聚类评价指标确定目标聚类个数。
计算机设备对计算得到的多个聚类结果的评价指标进行对比,确定出目标的聚类结果的聚类评价指标,并将该聚类结果的评价指标对应的聚类个数确定为目标聚类个数,即,将计算该聚类结果的聚类评价指标时使用的聚类个数确定为目标聚类个数。目标聚类结果的聚类评价指标即为最优的聚类评价指标。目标聚类结果的聚类评价指标的选取可以根据该聚类结果的聚类评价指标的大小与聚类效果之间的关系进行选取。例如:聚类结果的聚类评价指标越小,说明该聚类结果的效果越好,则确定多个聚类结果的聚类评价指标中最小的聚类结果的聚类评价指标为目标聚类结果的聚类评价指标。
步骤500、根据目标聚类个数对应的聚类结果,确定用户的聚类类别。
目标聚类个数是目标聚类结果的聚类评价指标对应的聚类个数,则目标聚类个数对应的聚类结果即为目标聚类结果。该聚类结果为最优的聚类结果,即,该聚类结果的聚类效果最好。计算机设备根据目标聚类结果,确定用户的聚类类别。目标聚类结果中包括多个聚类类别,每个聚类类别中均包括有用户的用电负荷数据。用户的聚类类别即为该用户的用电负荷数据属于的聚类类别。这样根据聚类结果可以将具有相似特性的用户分配到一个聚类类别中,从而可以实现对用户的分类。
本申请实施例提供的配电网用户分类方法通过从预设聚类个数的最小值开始,遍历预设聚类个数的最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;根据每个聚类个数下的聚类结果的聚类评价指标确定目标聚类个数,根据目标聚类个数对应的聚类结果,确定用户的聚类类别。这样通过遍历选取最优的目标聚类个数,无需人为指定聚类个数,可以保证在目标聚类个数对应的聚类结果的准确性,从而能够提高对用户进行分类的准确性。并且本申请实施例提供的配电网用户分类方法具有较强的适用性,可以适用于用户侧具有大量用户负荷数据的情况下。
=请参见图2,在一个实施例中,步骤400“根据每个聚类结果的聚类评价指标确定目标聚类个数”的一种可能的实现方式包括:
步骤410、将多个聚类评价指标降序排列,计算排列后的多个聚类评价指标下降的速度。
计算机设备将计算得到的多个聚类评价指标按照从大到小的顺序进行排列,然后计算排列后的多个聚类评价指标下降的速度。在一个可选的实施例中,可以通过计算排列后的多个聚类评价指标中相邻的聚类评价指标之间的变换量,可以得到排列后的多个聚类评价指标的下降速度。在另一个可选的实施例中,如图3所示,绘制排列后的多个聚类评价指标与聚类个数之间的曲线图,计算每个聚类个数对应处的曲线的斜率,可以得到排列后的多个聚类评价指标的下降速度。
步骤420、将聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为目标聚类个数。
预设阈值可以是由工作人员根据多次实验得到的阈值。计算机设备将计算得到的聚类评价指标下降速度与预设阈值进行对比,将聚类评价指标下降速度小于预设阈值时对应聚类个数确定为目标聚类个数。在一个可选的实施例中,若聚类评价指标下降速度小于预设阈值时对应的聚类个数有多个,则考虑到在使用相关的聚类算法对多个用户的用电负荷数据进行聚类分析时,较高的聚类个数对聚类算法的收敛速率的影响,选择较低的聚类个数作为目标聚类个数,这样可以提高聚类算法的稳定性。如图3中,在聚类个数为4和6时,聚类评价指标的下降速度均小于预设阈值,选取目标聚类个数为4。在本实施例中,确定目标聚类个数的方法简单,易懂。
请参见图4,在一个实施例中,步骤200“从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果”的一种可能的实现方式包括:
步骤210、将最小值作为初始聚类个数。
步骤220、根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果。
计算机设备将预设聚类个数中的最小值作为初始聚类个数,根据该初始聚类个数对多个用户的用电负荷数据进行聚类分析,可以将多个用户的用电负荷数据分配到不同的聚类类别,得到初始聚类个数的聚类结果。对聚类分析的描述可以参考上述实施例中的具体描述,在此不再赘述。
步骤230、将初始聚类个数加1作为新的初始聚类个数,返回执行根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果的步骤,直至初始聚类个数与最大值相等为止。
计算机设备将初始个数加1后作为新的初始聚类个数,在根据新初始聚类个数对多个用户的用电负荷数据进行聚类分析,可以得到新的初始聚类个数的聚类结果。依此类推,直到初始聚类个数与聚类个数的最大值相等时停止计算。这样可以计算出最小值和最大值之间的每个聚类个数对应的聚类结果,从而可以得到每个聚类个数的聚类结果。在本实施例中,通过加1的方法遍历最小值和最大值之间的聚类个数,可以避免遗漏聚类个数,从而能够提高配电网用户分了方法的可靠性。
请参见图5,在一个实施例中,步骤220“根据初始聚类个数对多个所述用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果”的一种可能的实现方式包括:
步骤221、根据初始聚类个数确定多个初始聚类中心,其中,初始聚类中心的个数与初始聚类个数相同。
在进行聚类算法时,初始聚类中心的个数与初始聚类个数相同,则计算机设备根据确定的初始聚类个数可以确定多个初始聚类中心。多个初始聚类中心可以是在多个用户的用电负荷数据中选取的,也可以是工作人员根据多次实验确定的不属于多个用户的用电负荷数据中的数据。本实施例对多个初始聚类中心的确定方法不作任何限制,只要能够实现其功能即可。
步骤222、计算多个用户的用电负荷数据与每个初始聚类中心之间的距离。
若多个初始聚类中心不属于多个用户的用电负荷数据,则计算机设备分别计算每个用户的用电负荷数据与每个初始聚类中心之间的距离。例如:初始聚类中心包括第一初始聚类中心和第二初始聚类中心,则计算每个用户的用电负荷数据与第一初始聚类中心之间距离,以及每个用户的用电负荷数据与第二初始聚类中心之间的距离。
若多个初始聚类中心属于多个用户的用电负荷数据,即,一个初始聚类中心是多个用电负荷数据中的一个用户的用电负荷数据。此时,计算机设备需要计算多个用户的用电负荷数据中除去初始聚类中心后的剩余的用户的用电负荷数据与每个初始聚类中心之间的距离。
步骤223、针对每个用户的用电负荷数据,将用户的用电负荷数据分配到距离最小的初始聚类中心对应的聚类类别中。
计算机设备根据计算出的多个用户的用电负荷数据与每个初始聚类中心之间的距离,对多个用户的用电负荷数据进行分配。具体的分配过程为:将用户的用电负荷数据分配到距离最小的初始聚类中心对应的聚类类别中。例如:一个用户的用电负荷数据与第一初始聚类之间的距离为A,该用户的用电负荷数据与第二初始聚类的之间的聚类为B,B大于A,则将该用户的用电负荷数据分配到第一初始聚类中心对应的聚类类别中。聚类类别的个数与初始聚类中心的个数相同。
步骤224,判断每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的聚类与预设距离阈值的关系。
步骤225、若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,则将当前聚类类别确定为初始聚类个数的聚类结果。
步骤226、若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于预设距离阈值的距离,则返回执行根据初始聚类个数确定多个初始聚类中心的步骤。
计算机设备判断每个聚类类别中的用户的用电负荷数据与初始聚类中心之间的距离是否小于预设距离阈值。若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,说明当前聚类类别为最优的聚类类别,则将当前聚类类别确定为初始聚类个数的聚类结果。若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于预设距离阈值的距离,说明当前聚类类别不是最优的聚类类别,则返回执行步骤221-226。换句话说,在每个聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中只要存在一个距离大于或等于预设距离阈值,则说明当前聚类类别不是最优的聚类类别。在本实施例中,通过判断用户的用电负荷数据与对应的初始聚类中心之间的距离与预设距离阈值之间的关系,最终确定最优的当前聚类类别,从而可以提高对配电网用户分类的准确性。
在一个具体的实施例中,根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果如图6所示。其中,横坐标表示时间,纵坐标表示用电负荷,a曲线表示第一聚类类别,该聚类类别中用电负荷的范围在200kW-450kW之间,b曲线表示第二聚类类别,该聚类类别中用电负荷的范围在120kW-250kW之间,c曲线表示第三聚类类别,该聚类类别中用电负荷的范围在70kW-130kW之间,d曲线表示第四聚类类别,该聚类类别中用电负荷的范围在30kW-80kW之间。每一聚类类别中的用电负荷的变化曲线基本相同。
请参见图7,在一个实施例中,步骤500“根据目标聚类个数对应的聚类结果,确定用户的聚类类别”的一种可能的实现方式包括:
步骤510、计算每个用户的用电负荷数据的特征值数据,得到多个特征值数据,其中,特征值数据包括平均用电负荷、负载率和用电负荷百分比。
平均用电负荷可以表示为:其中,Laverage为平均用电负荷,L为每个用户的用电负荷数据,n表示每个用户的用电负荷数据中用电负荷数据的数量。负载率可以表示为:/>其中,Lload_rate为负载率,S为配电变压器可以采用的用户的用电负荷的额定容量。用电负荷百分比是指特定数量的时间段用户的用电负荷数据的百分比。用电负荷百分比可以表示为:/>其中,Lpercentage为用电负荷百分比,∑L为一个用户的用电负荷数据中的用电负荷的总数量,∑1L为第一时间段的用电负荷数据中的用电负荷的数量,∑2L为第二时间段的用电负荷数据中的用电负荷的数量,∑3L为第三时间段的用电负荷数据中的用电负荷的数量。具体的,第一时间段为早上7点到10点,第二时间段为下午3点到6点,第三时间段为晚上9点到11点。每个用户的用电负荷数据的平均用电负荷、负载率和用电负荷百分比可以组成一个向量,将该向量称为特征值数据。计算机设备通过对每个用户的用电负荷数据的特征值数据进行计算,可以得到多个特征值数据。
步骤520、根据目标聚类个数对多个特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果。
计算机设备根据确定的目标聚类个数对多个特征值数据进行聚类分析,可以将多个特征值分配到不同的聚类类别中,得到目标聚类个数对应的特征值聚类结果。根据目标聚类个数对多个特征值数据进行聚类分析的过程的描述可以参考上述实施例中对多个用户的用电负荷数据进行聚类分析的过程的具体描述,在此不再赘述。
步骤530、根据特征值聚类结果,确定用户的聚类类别。
特征值聚类结果中包括多个聚类类别,每个聚类类别中均包括特征值数据。用户的聚类类别即为该用户的特征值数据所属于的聚类类别,这样根据特征值聚类结果可以将具有相似特性的用户分配到一个聚类类别中,从而可以实现对用户的分类。
在本实施例中,通过对用户的用电负荷数据的特征数据进行聚类分析,实现对用户的分类,可以对根据用户的用户负荷数据进行聚类分析得到的用户的分类进行验证,能够保证对配电网用户分类的准确性。
请参见图8,在一个实施例中,配电网聚类分类方法的具体步骤还包括:
步骤600、根据特征值聚类结果,获取第一聚类类别中的用户的总数,得到第一聚类数,其中,第一聚类类别为包括的用户个数最多的聚类类别。
计算机设备根据特征值聚类结果,可以了解特征值聚类结果中的每个聚类类别中的用户的数量,对每个聚类类别中的用户的数量进行统计,确定包括的用户个数最多的聚类类别,得到第一聚类类别。获取第一聚类类别中用户的总数,得到第一聚类数。第一聚类类别的数量可以是一个,也可以是两个或者两个以上。换句话说,包括的用户个数最多的聚类类别可以有多个。
步骤610、获取第二聚类类别中的用户的总数,得到第二聚类数,其中,第二聚类类别包括从特征值聚类结果中除去第一聚类类别后的所有聚类类别。
计算机设备在确定第一聚类类别后,获取特征值聚类结果中除去第一聚类类别后的剩余的所有聚类类别,得到第二聚类类别。获取第二聚类类别中所有用户的总数,得到第二聚类数。第二聚类类别的数量可以是一个,也可以是两个或者两个以上。例如:特征值聚类结果中包括5个聚类类别,其中3个聚类类别属于第一聚类类别,则剩余的2个聚类类别属于第二聚类类别,此时,第一聚类类别和第二聚类类别的个数均大于1个。
步骤620、根据第一聚类数和第二聚类数,确定准确性评价指标;
步骤630、根据准确性评价指标,确定特征值聚类结果的准确性。
计算机设备根据得到第一聚类数和第二聚类数,计算第一聚类数与第一聚类数和第二聚类数的和的比值,得到准确性评价指标。并根据该准确性评价指标确定特征值聚类结果的准确性。假设,准确性评价指标用C表示,第一聚类数用A表示,第一聚类数有B表示,则若准确性评价指标越大,说明特征值聚类结果越准确性,则使用该特征值聚类结果对用户的分类更加准确。
在本实施例中,使用准确性评价指标对特征值聚类结果的准确性进行判断,可以确定特征值聚类结果是否为最优的聚类结果,从而能够使用最优的聚类结果对用户进行准确的分类。也就是说,这样可以提供对用户分类的准确性。
请参见图9,在一个实施例中,配电网用户分类方法的具体步骤还包括:
步骤700、根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,负荷数据聚类结果是根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果。
计算机设备通过上述实施例中根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果,可以确定该聚类结果中每个初始聚类中对应的多个用户。换句话说,在负荷数据聚类结果中,一个初始聚类中心对应一个聚类类别,该聚类类别中包括多个用户,计算机设备获取每个初始聚类中心对应的每个聚类类别中的多个用户。
步骤710、根据特征值聚类结果,确定每个用户对应的聚类类别,构成多个聚类序列。
计算机设备通过上述实施例中确定的特征值聚类结果,确定每个用户对应的聚类类别。计算机设备可以先确定在负荷数据聚类结果中的一个初始聚类中心对应的多个用户,再在特征值聚类结果中确定每个用户对应的聚类类别,构成一个聚类序列。按照同样的方法,计算机设备可以得到多个聚类序列。聚类序列的个数与负荷数据聚类结果中的初始聚类中心的个数相同。例如:在负荷数据聚类结果中一个初始聚类中心的聚类类别为A,该聚类类别中包括用户a、用户b和用户c,该用户a在特征值聚类结果中的聚类类别为B,用户b在特征值聚类结果中的聚类类别为C,用户c在特征值聚类结果中的聚类类别为B,则可以构成序列(B,C,B)。
步骤720、根据多个聚类序列的熵的平均值,确定负荷数据聚类结果和特征值聚类结果的相似性。
计算机设备根据多聚类序列中的聚类类别,计算多个聚类序列的熵。可以采用如下公式计算初始聚类中心为i时聚类序列的熵。其中,Si表示第i个初始聚类中心的熵,k表示该聚类序列中出现的聚类类别的种类数,p(Cj)表示第i初始聚类中心对应的多个用户在特征值聚类结果中为第j中聚类类别的频率。计算机设备在计算出每个初始聚类中心的熵后,计算所有初始聚类中心的熵的平均值S。根据公式corr=1/(1+S)确定负荷数据聚类和特征值聚类结果的相似性,其中,corr表示相似性评价指标。在每个初始聚类中心的熵越小时,所有初始聚类中心的熵的平均值越小,相似性评价指标越大,则说明负荷聚类结果与特征值聚类结果的相似性越高。
在本实施例中,通过对负荷数据聚类结果和特征值聚类结果进行相似性进行判断,可以验证两种聚类结果的聚类效果,从而可以保证对用户的分类更加准确。
应该理解的是,虽然图中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,在大多数的情况下,不同季节的用户的用电负荷数据存在很大的差别,且对于部分用户的用电负荷数据而言,工作日与休息日的用电负荷数据也可能存在很大的差别。但是在对多个用户的用电负荷数据进行聚类分析时,这些不同特征的用电负荷数据已经被分为不同的聚类类别。此时可以根据对多个用户的用电负荷数据的聚类结果,确定工作日和非工作日对用电负荷数据的聚类类别的影响。具体步骤如下:
1.获取在n天内的多个用户的用电负荷数据,并对其根据上述实施例中的方法对多个用户在n天的用电负荷数据进行聚类分析;
2.获取多个负荷数据聚类结果,每个聚类结果为n*1维的向量,向量中数据表示该用户在每天所属的聚类类别;
3.将每个聚类结果按月份、工作日与非工作日进行划分为24组,构成一个12*2*m的三维数组。其中,第一维从0-11分别代表1月-12月;第二维中包括数字0和1,0代表工作日,1代表非工作日;第三维m为当月包含的工作日或非工作日的数目,m值不固定。三维数组中的每一个元素代表该用户所属的聚类类别。
4.在每一组数据中取众数作为代表数据,组成一个新的12*2的数组,其中,第一维从0-11分别代表1月-12月;第二维中0代表工作日,1代表非工作日。该数组中的每一个元素代表某个用户某月的工作日或非工作日的所属的聚类类别。
具体的,假设有198个用户,n=365,某一用户的在每个月的工作日或非工作日所属的聚类类别可以表示为下表:
月份 工作日的聚类类别 月份 非工作日的聚类类别型
1月 第三类 1月 第三类
2月 第三类 2月 第三类
3月 第三类 3月 第三类
4月 第三类 4月 第三类
5月 第二类 5月 第二类
6月 第二类 6月 第一类
7月 第二类 7月 第二类
8月 第二类 8月 第二类
9月 第二类 9月 第二类
10月 第二类 10月 第二类
11月 第三类 11月 第三类
12月 第三类 12月 第三类
由上表可以看出,6月份的用电负荷数据所属的聚类类别受工作日和非工作日的影响,其他月份不受影响。
在一个具体的实施例中,K个用户可以组成k*12*2维的数字,在第二维中加入用户的ID信息,可以输出维度为k*25的数组,其中第一维从0-(k-1)代表用户的序号;第二维从前到后分别代表用户的ID、1月-12月的工作日和1月-12月的非工作日。
在一个实施例中,在对多个用户的用电负荷数据进行聚类分析中,部分用户的用户的用电负荷数据在较长一段时间内都不会有明显的变化;但仍有部分用户在不同季节、工作日与非工作日的用电负荷数据存在较大差异,这些不同类型的用电负荷数据会被划分到不同的聚类类别中。为了量化表示用户这种用电负荷数据的波动性,提出了相应的实现方法,步骤如下:
1.获取k个用户在n天内的用电负荷数据,数据采集周期为15min,一天96个点,用电负荷数据的维度为k*n*96,对该用电负荷数据进行聚类分析;
2.得到对应的聚类结果,该聚类结果为k*n*1维的数组。该数组中每一个元素表示某一用户在某天的用电负荷数据所属的聚类类别;
3.引入一个变量:熵,其定义为:
其中,S为用户的熵,数组C代表该用户在某天的聚类结果,k为数组C中出现的聚类类别的种类数,即该用户此时段内所属的聚类类别,p(Ci)为第i类聚类类别出现的频率,熵值的取值范围为0~log2(n)。
具体的,假设有198个用户,n=365,聚类结果的维度为198*365*1。在此基础上,计算每个用户的熵,得到维度为198*1的数组,将该数组降序排列,可以绘制出表示用户序号与熵之间的关系的曲线图,如图10所示。图中横坐标为用户序号,纵坐标为用户对应的熵值,最低为0,最高约为1.95。从图中可以看出,在198个用户中,由大约21个用户的熵值为0,即,在一年内,这个一个用户均属于同一聚类类别,其他用户在一个内的聚类类别均有变化。
请参见图11,本申请一个实施例提供一种配电网用户分类装置10,该装置包括获取模块100、确定模块200和计算模块300。其中,
获取模块100用于获取预设聚类个数的最大值和最小值。
确定模块200用于从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果。
计算模块300用于根据每个聚类结果,计算每个聚类结果的聚类评价指标。
确定模块200还用于根据每个聚类结果的聚类评价指标确定目标聚类个数。
确定模块200还用于根据目标聚类个数对应的聚类结果,确定用户的聚类类别。
在一个实施例中,确定模块200具体用于将多个聚类评价指标降序排列,计算排列后的多个聚类评价指标下降的速度;将聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为目标聚类个数。
在一个实施例中,确定模块200具体还用于将最小值作为初始聚类个数;根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果;将初始聚类个数加1作为新的初始聚类个数,返回执行根据所述初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果的步骤,直至初始聚类个数与最大值相等为止。
在一个实施例中,确定模块200具体还用于根据初始聚类个数确定多个初始聚类中心,其中,初始聚类中心的个数与初始聚类个数相同;计算多个用户的用电负荷数据与每个初始聚类中心之间的距离;针对每个用户的用电负荷数据,将用户的用电负荷数据分配到距离最小的初始聚类中心对应的聚类类别中;若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,则将当前聚类类别确定为初始聚类个数的聚类结果;若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于预设距离阈值的距离,则返回执行根据初始聚类个数确定多个初始聚类中心的步骤。
在一个实施例中,确定模块200具体还用于计算每个用户的用电负荷数据的特征值数据,得到多个特征值数据,其中,特征值数据包括平均用电负荷、负载率和用电负荷百分比;根据目标聚类个数对多个特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果;根据特征值聚类结果,确定用户的聚类类别。
在一个实施例中,配电网用户分类装置10还包括第一聚类数获取模块、第二聚类数获取模块、准确性评价指标计算模块和准确性确定模块。其中,第一聚类数获取模块用于根据特征值聚类结果,获取第一聚类类别中的用户的总数,得到第一聚类数,其中,第一聚类类别为包括的用户个数最多的聚类类别。第二聚类数获取模块用于获取第二聚类类别中的用户的总数,得到第二聚类数,其中,第二聚类类别包括从特征值聚类结果中除去第一聚类类别后的所有聚类类别。准确性评价指标计算模块用于根据第一聚类数和第二聚类数,确定准确性评价指标。准确性确定模块用于根据准确性评价指标,确定特征值聚类结果的准确性。
在一个实施例中,配电网用户分类装置10还包括相似性确定模块,该相似性确定模块用于根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,负荷数据聚类结果是根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果;根据特征值聚类结果,确定每个用于对应的聚类类别,构成多个聚类序列;根据多个聚类序列的熵的平均值,确定第一聚类结果和第二聚类结果的相似性。
关于上述配电网用户分类装置10的具体限定可以参见上文中对于配电网用户分类方法的限定,在此不在赘述。配电网用户分类装置10中的各个模块可以全部或部分通过软件、硬件及其组合来实现。上述各装置、各模块或者各单元可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个装置或模块对应的操作。
请参见图12,在一个实施例中,提供了一种计算机设备,计算机设备可以是服务器,其内部结构图可以如图12所示。计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,计算机设备的处理器用于提供计算和控制能力。计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。计算机设备的数据库用于存储用户的用电负荷数据等。计算机设备的网络接口用于与外部的终端通过网络连接通信。计算机设备被处理器执行时以实现一种配电网用户分类方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请一个实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现如下步骤:
获取预设聚类个数的最大值和最小值;
从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;
根据每个聚类结果,计算每个聚类结果的聚类评价指标;
根据每个聚类结果的聚类评价指标确定目标聚类个数;
根据目标聚类个数对应的聚类结果,确定用户的聚类类别。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将多个聚类评价指标降序排列,计算排列后的多个聚类评价指标下降的速度;将聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为目标聚类个数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将最小值作为初始聚类个数;根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果;将初始聚类个数加1作为新的初始聚类个数,返回执行根据所述初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果的步骤,直至初始聚类个数与最大值相等为止。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据初始聚类个数确定多个初始聚类中心,其中,初始聚类中心的个数与初始聚类个数相同;计算多个用户的用电负荷数据与每个初始聚类中心之间的距离;针对每个用户的用电负荷数据,将用户的用电负荷数据分配到距离最小的初始聚类中心对应的聚类类别中;若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,则将当前聚类类别确定为初始聚类个数的聚类结果;若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于预设距离阈值的距离,则返回执行根据初始聚类个数确定多个初始聚类中心的步骤。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:计算每个用户的用电负荷数据的特征值数据,得到多个特征值数据,其中,特征值数据包括平均用电负荷、负载率和用电负荷百分比;根据目标聚类个数对多个特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果;根据特征值聚类结果,确定用户的聚类类别。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据特征值聚类结果,获取第一聚类类别中的用户的总数,得到第一聚类数,其中,第一聚类类别为包括的用户个数最多的聚类类别;获取第二聚类类别中的用户的总数,得到第二聚类数,其中,第二聚类类别包括从特征值聚类结果中除去第一聚类类别后的所有聚类类别;根据第一聚类和第二聚类数,确定准确性评价指标;根据准确性评价指标,确定特征值聚类结果的准确性。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,负荷数据聚类结果是根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果;根据特征值聚类结果,确定每个用户对应的聚类类别,构成多个聚类序列;根据多个聚类序列的熵的平均值,确定第一聚类结果和第二聚类结果的相似性。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取预设聚类个数的最大值和最小值;
从最小值开始,遍历最小值到最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;
根据每个聚类结果,计算每个聚类结果的聚类评价指标;
根据每个聚类结果的聚类评价指标确定目标聚类个数;
根据目标聚类个数对应的聚类结果,确定用户的聚类类别。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将多个聚类评价指标降序排列,计算排列后的多个聚类评价指标下降的速度;将聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为目标聚类个数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将最小值作为初始聚类个数;根据初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果;将初始聚类个数加1作为新的初始聚类个数,返回执行根据所述初始聚类个数对多个用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果的步骤,直至初始聚类个数与最大值相等为止。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据初始聚类个数确定多个初始聚类中心,其中,初始聚类中心的个数与初始聚类个数相同;计算多个用户的用电负荷数据与每个初始聚类中心之间的距离;针对每个用户的用电负荷数据,将用户的用电负荷数据分配到距离最小的初始聚类中心对应的聚类类别中;若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,则将当前聚类类别确定为初始聚类个数的聚类结果;若每个当前聚类类别中的用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于预设距离阈值的距离,则返回执行根据初始聚类个数确定多个初始聚类中心的步骤。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:计算每个用户的用电负荷数据的特征值数据,得到多个特征值数据,其中,特征值数据包括平均用电负荷、负载率和用电负荷百分比;根据目标聚类个数对多个特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果;根据特征值聚类结果,确定用户的聚类类别。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据特征值聚类结果,获取第一聚类类别中的用户的总数,得到第一聚类数,其中,第一聚类类别为包括的用户个数最多的聚类类别;获取第二聚类类别中的用户的总数,得到第二聚类数,其中,第二聚类类别包括从特征值聚类结果中除去第一聚类类别后的所有聚类类别;根据第一聚类和第二聚类数,确定准确性评价指标;根据准确性评价指标,确定特征值聚类结果的准确性。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,负荷数据聚类结果是根据目标聚类个数对多个用户的用电负荷数据进行聚类分析后的聚类结果;根据特征值聚类结果,确定每个用户对应的聚类类别,构成多个聚类序列;根据多个聚类序列的熵的平均值,确定第一聚类结果和第二聚类结果的相似性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种配电网用户分类方法,其特征在于,包括:
获取预设聚类个数的最大值和最小值;
从所述最小值开始,遍历所述最小值到所述最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;
根据每个聚类结果,计算所述每个聚类结果的聚类评价指标;
根据所述每个聚类结果的聚类评价指标确定目标聚类个数;
根据所述目标聚类个数对应的聚类结果,确定用户的聚类类别;
其中,所述根据所述每个聚类结果的聚类评价指标确定目标聚类个数,包括:
将多个所述聚类评价指标降序排列,计算排列后的多个所述聚类评价指标下降的速度;
将所述聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为所述目标聚类个数;
所述根据所述目标聚类个数对应的聚类结果,确定用户的聚类类别,包括:
计算每个所述用户的用电负荷数据的特征值数据,得到多个所述特征值数据,其中,所述特征值数据包括平均用电负荷、负载率和用电负荷百分比;所述平均用电负荷表示为,/>为所述平均用电负荷,/>为每个用户的用电负荷数据;为每个用户的用电负荷数据中用电负荷数据的数量;所述负载率表示为,/>为所述负载率,/>为配电变压器能采用的用户的用电负荷的额定容量;所述用电负荷百分比表示为/>为所述用电负荷百分比,/>为一个用户的用电负荷数据中的用电负荷的总数量,/>为第一时间段的用电负荷数据中的用电负荷的数量,/>为第二时间段的用电负荷数据中的用电负荷的数量,/>为第三时间段的用电负荷数据中的用电负荷的数量;
根据所述目标聚类个数对多个所述特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果;
根据所述特征值聚类结果,确定所述用户的聚类类别;
所述方法还包括:
根据所述特征值聚类结果,获取第一聚类类别中的所述用户的总数,得到第一聚类数,其中,所述第一聚类类别为包括的所述用户个数最多的聚类类别;
获取第二聚类类别中的所述用户的总数,得到第二聚类数,其中,所述第二聚类类别包括从所述特征值聚类结果中除去所述第一聚类类别后的所有聚类类别;
根据所述第一聚类数和所述第二聚类数,确定准确性评价指标;
根据所述准确性评价指标,确定所述特征值聚类结果的准确性;
所述方法还包括:
根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,所述负荷数据聚类结果是根据目标聚类个数对多个所述用户的用电负荷数据进行聚类分析后的聚类结果;所述负荷数据聚类结果中,每个所述初始聚类中心对应一个聚类类别,所述聚类类别包括多个用户;
根据所述特征值聚类结果,确定每个所述用户对应的聚类类别,构成多个聚类序列;
根据多个所述聚类序列的熵的平均值,确定所述负荷数据聚类结果和所述特征值聚类结果的相似性;所述聚类序列的熵表示为,/>为各所述聚类序列的熵,/>为所述聚类序列中出现的聚类类别的种类数,/>表示第i个初始聚类中心对应的多个用户在特征值聚类结果中为第j个中聚类类别的频率;所述负荷数据聚类结果和所述特征值聚类结果的相似性表示为corr=1/(1+S),corr为相似性评价指标,S为所述聚类序列的熵的平均值。
2.根据权利要求1所述的方法,其特征在于,所述从所述最小值开始,遍历所述最小值到所述最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果,包括:
将所述最小值作为初始聚类个数;
根据所述初始聚类个数对多个所述用户的用电负荷数据进行聚类分析,得到所述初始聚类个数的聚类结果;
将所述初始聚类个数加1作为新的初始聚类个数,返回执行所述根据所述初始聚类个数对多个所述用户的用电负荷数据进行聚类分析,得到初始聚类个数的聚类结果的步骤,直至所述初始聚类个数与最大值相等为止。
3.根据权利要求2所述的方法,其特征在于,所述根据所述初始聚类个数对多个所述用户的用电负荷数据进行聚类分析,得到所述初始聚类个数的聚类结果,包括:
根据所述初始聚类个数确定多个初始聚类中心,其中,所述初始聚类中心的个数与所述初始聚类个数相同;
计算多个所述用户的用电负荷数据与每个所述初始聚类中心之间的距离;
针对每个所述用户的用电负荷数据,将所述用户的用电负荷数据分配到距离最小的所述初始聚类中心对应的聚类类别中;
若每个当前聚类类别中的所述用户的用电负荷数据与对应的初始聚类中心之间的距离均小于预设距离阈值,则将所述当前聚类类别确定为所述初始聚类个数的聚类结果;
若每个所述当前聚类类别中的所述用户的用电负荷数据与对应的初始聚类中心之间的距离中存在大于或等于所述预设距离阈值的距离,则返回执行所述根据所述初始聚类个数确定多个初始聚类中心的步骤。
4.一种配电网用户分类装置,其特征在于,包括:
获取模块,用于获取预设聚类个数的最大值和最小值;
确定模块,用于从所述最小值开始,遍历所述最小值到所述最大值之间的每个聚类个数,对多个用户的用电负荷数据进行聚类分析,得到每个聚类个数的聚类结果;
计算模块,用于根据每个聚类结果,计算每个聚类结果的聚类评价指标;
确定模块,还用于根据所述每个聚类结果的聚类评价指标确定目标聚类个数;
确定模块,还用于根据所述目标聚类个数对应的聚类结果,确定用户的聚类类别;
其中,所述确定模块具体用于:
将多个所述聚类评价指标降序排列,计算排列后的多个所述聚类评价指标下降的速度;
将所述聚类评价指标下降速度小于预设阈值时对应的聚类个数确定为所述目标聚类个数;
所述确定模块还具体用于:
计算每个所述用户的用电负荷数据的特征值数据,得到多个所述特征值数据,其中,所述特征值数据包括平均用电负荷、负载率和用电负荷百分比;所述平均用电负荷表示为,/>为所述平均用电负荷,/>为每个用户的用电负荷数据;为每个用户的用电负荷数据中用电负荷数据的数量;所述负载率表示为,/>为所述负载率,/>为配电变压器能采用的用户的用电负荷的额定容量;所述用电负荷百分比表示为/>,/>为所述用电负荷百分比,/>为一个用户的用电负荷数据中的用电负荷的总数量,/>为第一时间段的用电负荷数据中的用电负荷的数量,/>为第二时间段的用电负荷数据中的用电负荷的数量,/>为第三时间段的用电负荷数据中的用电负荷的数量;
根据所述目标聚类个数对多个所述特征值数据进行聚类分析,得到目标聚类个数对应的特征值聚类结果;
根据所述特征值聚类结果,确定所述用户的聚类类别;
所述配电网用户分类装置还包括:
第一聚类数获取模块,用于根据所述特征值聚类结果,获取第一聚类类别中的所述用户的总数,得到第一聚类数,其中,所述第一聚类类别为包括的所述用户个数最多的聚类类别;
第二聚类数获取模块,用于获取第二聚类类别中的所述用户的总数,得到第二聚类数,其中,所述第二聚类类别包括从所述特征值聚类结果中除去所述第一聚类类别后的所有聚类类别;
准确性评价指标计算模块,用于根据所述第一聚类数和所述第二聚类数,确定准确性评价指标;
准确性确定模块,用于根据所述准确性评价指标,确定所述特征值聚类结果的准确性;
所述配电网用户分类装置还包括:
相似性确定模块,用于根据负荷数据聚类结果,确定每个初始聚类中心对应的多个用户,其中,所述负荷数据聚类结果是根据目标聚类个数对多个所述用户的用电负荷数据进行聚类分析后的聚类结果;所述负荷数据聚类结果中,每个所述初始聚类中心对应一个聚类类别,所述聚类类别包括多个用户;根据所述特征值聚类结果,确定每个所述用户对应的聚类类别,构成多个聚类序列;根据多个所述聚类序列的熵的平均值,确定所述负荷数据聚类结果和所述特征值聚类结果的相似性;所述聚类序列的熵表示为,/>为各所述聚类序列的熵,/>为所述聚类序列中出现的聚类类别的种类数,/>表示第i个初始聚类中心对应的多个用户在特征值聚类结果中为第j个中聚类类别的频率;所述负荷数据聚类结果和所述特征值聚类结果的相似性表示为corr=1/(1+S),corr为相似性评价指标,S为所述聚类序列的熵的平均值。
5.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述的方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
CN202011425469.1A 2020-12-08 2020-12-08 配电网用户分类方法、装置、计算机设备和存储介质 Active CN112464059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011425469.1A CN112464059B (zh) 2020-12-08 2020-12-08 配电网用户分类方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011425469.1A CN112464059B (zh) 2020-12-08 2020-12-08 配电网用户分类方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN112464059A CN112464059A (zh) 2021-03-09
CN112464059B true CN112464059B (zh) 2024-03-22

Family

ID=74800302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011425469.1A Active CN112464059B (zh) 2020-12-08 2020-12-08 配电网用户分类方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112464059B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837778A (zh) * 2021-10-28 2021-12-24 国网辽宁省电力有限公司阜新供电公司 基于改进狼群优化K-means的用户投诉聚类分析方法
CN115982633B (zh) * 2023-03-21 2023-06-20 北京百度网讯科技有限公司 目标对象分类方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548301A (zh) * 2016-11-30 2017-03-29 南方电网科学研究院有限责任公司 电力用户聚类方法及装置
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质
CN109918277A (zh) * 2019-01-23 2019-06-21 平安科技(深圳)有限公司 电子装置、系统日志聚类分析结果的评价方法及存储介质
CN110543889A (zh) * 2019-07-18 2019-12-06 广州供电局有限公司 电力负荷分层聚类方法、装置、计算机设备及存储介质
CN110544123A (zh) * 2019-08-29 2019-12-06 广州供电局有限公司 电力用户分类方法、装置、计算机设备和存储介质
CN110705616A (zh) * 2019-09-23 2020-01-17 广东电力交易中心有限责任公司 基于用电偏好进行用户负荷曲线聚类的方法及系统
CN111553390A (zh) * 2020-04-09 2020-08-18 深圳壹账通智能科技有限公司 用户分类方法、装置、计算机设备和存储介质
CN111768066A (zh) * 2020-05-09 2020-10-13 国网江苏省电力有限公司无锡供电分公司 基于融合特征的园区电热负荷耦合关系分析方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548301A (zh) * 2016-11-30 2017-03-29 南方电网科学研究院有限责任公司 电力用户聚类方法及装置
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质
CN109918277A (zh) * 2019-01-23 2019-06-21 平安科技(深圳)有限公司 电子装置、系统日志聚类分析结果的评价方法及存储介质
CN110543889A (zh) * 2019-07-18 2019-12-06 广州供电局有限公司 电力负荷分层聚类方法、装置、计算机设备及存储介质
CN110544123A (zh) * 2019-08-29 2019-12-06 广州供电局有限公司 电力用户分类方法、装置、计算机设备和存储介质
CN110705616A (zh) * 2019-09-23 2020-01-17 广东电力交易中心有限责任公司 基于用电偏好进行用户负荷曲线聚类的方法及系统
CN111553390A (zh) * 2020-04-09 2020-08-18 深圳壹账通智能科技有限公司 用户分类方法、装置、计算机设备和存储介质
CN111768066A (zh) * 2020-05-09 2020-10-13 国网江苏省电力有限公司无锡供电分公司 基于融合特征的园区电热负荷耦合关系分析方法及装置

Also Published As

Publication number Publication date
CN112464059A (zh) 2021-03-09

Similar Documents

Publication Publication Date Title
CN111144468B (zh) 电力用户信息标签化方法和装置、电子设备以及存储介质
CN109871860B (zh) 一种基于核主成分分析的日负荷曲线降维聚类方法
Rajabi et al. A pattern recognition methodology for analyzing residential customers load data and targeting demand response applications
CN112464059B (zh) 配电网用户分类方法、装置、计算机设备和存储介质
CN108596242B (zh) 基于小波神经网络和支持向量机的电网气象负荷预测方法
CN111612275B (zh) 一种预测区域用户负荷量的方法及装置
CN111222696B (zh) 电压暂降治理优化方法、装置、计算机设备和存储介质
Gao et al. Spectral clustering based demand-oriented representative days selection method for power system expansion planning
Feng et al. Saturated load forecasting based on clustering and logistic iterative regression
CN110390563A (zh) 用户价值的量化方法、装置、计算机设备和存储介质
CN111178957B (zh) 一种用电客户电量突增预警的方法
Zhu et al. Stochastic economic dispatching strategy of the active distribution network based on comprehensive typical scenario set
CN115329899A (zh) 一种聚类等效模型构建方法、系统、设备和存储介质
Guan et al. Customer load forecasting method based on the industry electricity consumption behavior portrait
CN113159106B (zh) 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN104850612B (zh) 一种基于增强凝聚层次聚类的配网用户负荷特征分类方法
CN113902181A (zh) 公变重过载的短期预测方法及设备
Chen et al. A power line loss analysis method based on boost clustering
CN116862137A (zh) 基于数据融合的充电桩负荷柔性调度方法及装置
CN114372835B (zh) 综合能源服务潜力客户识别方法、系统及计算机设备
CN114676931B (zh) 一种基于数据中台技术的电量预测系统
Li et al. Feature analysis of generalized load patterns considering active load response to real-time pricing
Dong et al. Image-based processing mechanism for peak load forecasting in smart grids
Dong et al. Image-based with peak load ensemble prediction system for demand response in smart grid
Maniar et al. Two-stage load profiling of hv feeders of a distribution system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant