CN111860634A - 基于OCHNN-Kmeans算法的负荷聚类方法 - Google Patents

基于OCHNN-Kmeans算法的负荷聚类方法 Download PDF

Info

Publication number
CN111860634A
CN111860634A CN202010678492.5A CN202010678492A CN111860634A CN 111860634 A CN111860634 A CN 111860634A CN 202010678492 A CN202010678492 A CN 202010678492A CN 111860634 A CN111860634 A CN 111860634A
Authority
CN
China
Prior art keywords
ochnn
load
neurons
clustering
neuron
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010678492.5A
Other languages
English (en)
Inventor
黄道姗
杜培
张慧瑜
刘智煖
林焱
蔡冰君
林芳
张伟骏
马铁丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd
State Grid Fujian Electric Power Co Ltd
Original Assignee
Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd
State Grid Fujian Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd, State Grid Fujian Electric Power Co Ltd filed Critical Electric Power Research Institute of State Grid Fujian Electric Power Co Ltd
Priority to CN202010678492.5A priority Critical patent/CN111860634A/zh
Publication of CN111860634A publication Critical patent/CN111860634A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于OCHNN‑Kmeans算法的负荷聚类方法,包括以下步骤:步骤S1:采集负荷数据,并进行预处理;步骤S2:采用Elbow Method和交叉验证获得最佳的聚类个数;步骤S3:通过OCHNN方法获得初始类中心C;步骤S4:将得到的初始类中心C作为K‑means的初始类中心,并利用K‑means聚类方法对预处理后的负荷数据进行划分,得到负荷曲线划分结构。本发明能够自适应调整聚类个数和聚类中心,类别划分更精确,适合大规模电力负荷数据划分。

Description

基于OCHNN-Kmeans算法的负荷聚类方法
技术领域
本发明涉及智能电网领域,一种基于OCHNN-Kmeans算法的负荷聚类方法。
背景技术
随着我国各方面的蓬勃发展,人们对电力系统的要求不仅仅只是一个可靠的能源系统,还要求其具有相当的智能水平。智能电表作为新一代电表,不仅可以实时提供海量的用户负荷数据,并且能为需求侧管理的实现提供物理基础。通过大数据技术对用户数据进行分析,可以得到相应的负荷模板,从而便于有针对性地制定需求侧响应策略,指导智能电网规划和运行,加强用户和电力市场的互动。而得到用户负荷模板的主要方式就是聚类分析,如何有效准确的对用户负荷进行聚类划分尤为重要。
同时,电力系统的结构变得越来越复杂,导致了电力负荷规模愈加庞大。如何提升电网的安全性、稳定性已成为电力企业关注的问题。在电力系统稳定性设计中,对电力系统负荷数据有效划分是重中之重的工作环节,也是基本工作环节之一。
发明内容
有鉴于此,本发明的目的在于提供一种基于OCHNN-Kmeans算法的负荷聚类方法,能够对电力系统负荷数据有效划分。
为实现上述目的,本发明采用如下技术方案:
一种基于OCHNN-Kmeans算法的负荷聚类方法,包括以下步骤:
步骤S1:采集负荷数据,并进行预处理;
步骤S2:采用Elbow Method和交叉验证获得最佳的聚类个数;
步骤S3:通过OCHNN方法获得初始类中心C;
步骤S4:将得到的初始类中心C作为K-means的初始类中心,并利用K-means聚类方法对预处理后的负荷数据进行划分,得到负荷曲线划分结构。
进一步的,所述步骤S2具体为:
步骤S21:Elbow Method通过遍历不同的k值而得到每个k值所对应的平均类内平方和;
步骤S22:根据得到的每个k值所对应的平均类内平方和,获取K-error曲线,得到最佳的聚类个数。
进一步的,所述步骤S3具体为:
步骤S31:设OCHNN由n个互不相连的神经元组组成,每个组里面包含m个神经元;第i个神经元在第x组的输出表示为vxi(t)∈{0,1},输入为uxi(t),偏差表示为θxi(x=1,...,n;i=1,...,m),其中t表示为离散的时间,神经元之间的连接权重表示ωxi,yj(x,y=1,...,n;i,j=1,...,m),并且有ωxi,yj=ωyj,xi
步骤S32:OCHNN的能量函数定义为:
Figure BDA0002584890660000021
步骤S33:通过改变能量函数,将OCHNN网络应用到聚类分割问题上,设定样本的个数为n,维度为d,目的是将样本聚为k类;
步骤S33:根据OCHNN的网络为n×k个神经元,其中n个样本点代表n个神经元组,每一组由k个神经元组成,每个神经元有一个输入值uik和输出值vik,其中vik表示为:
Figure BDA0002584890660000031
Figure BDA0002584890660000032
类中心表示为:
Figure BDA0002584890660000033
能量函数表示为:
Figure BDA0002584890660000034
神经元的输入更新过程表示为:
Figure BDA0002584890660000035
神经元的输出更新过程表示为:
Figure BDA0002584890660000036
进一步的,所述OCHNN网络中为了避免某一类的样本为0,引入一个爬山函数h(k),则得到神经元的输入更新过程表示为:
Figure BDA0002584890660000037
其中T是给定参数。
一种基于OCHNN-Kmeans算法的负荷聚类系统,包括存储器、处理器,所述存储器上存储有计算机程序,处理器在运行该计算机程序时,能够实现如上所述的方法步骤。
本发明与现有技术相比具有以下有益效果:
本发明能够自适应调整聚类个数和聚类中心,类别划分更精确,适合大规模电力负荷数据划分,对电力系统负荷数据有效划分。
附图说明
图1是本发明方法流程图;
图2是本发明一实施例中ElbowMethod图;
图3是本发明一实施例中OCHNN网络构建图;
图4是本发明一实施例中OCHNN分类机制;
图5是本发明一实施例中聚类个数的确定;
图6是本发明一实施例中第一类聚类结果;
图7是本发明一实施例中第二类聚类结果;
图8是本发明一实施例中第三类聚类结果;
图9是本发明一实施例中第四类聚类结果。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种基于OCHNN-Kmeans算法的负荷聚类方法,包括以下步骤:
步骤S1:采集负荷数据,并进行预处理;
步骤S2:采用Elbow Method和交叉验证获得最佳的聚类个数;
步骤S3:通过OCHNN方法获得初始类中心C;
步骤S4:将得到的初始类中心C作为K-means的初始类中心,并利用K-means聚类方法对预处理后的负荷数据进行划分,得到负荷曲线划分结构。
在本实施例中,参考图2,Elbow Method通过遍历不同的k值而得到每个k值所对应的平均类内平方和(error)。图2中k代表遍历的类个数,K_best为最佳的类个数。由类在欧氏空间中的性质可知,对于同一组数据,随着k值的增大,类内平方和一定会下降,即平均畸变程度会减小;这是因为每个类包含的样本数越少,样本点就会更接近其所在类的中心。但随着k值继续增大,平均畸变程度的改善效果会不断降低。在k值增大过程中,畸变程度的改善效果下降幅度最大的位置对应的K值就是肘部,所对应的值就是最佳的聚类个数。
在本实施例中,参考图3,OCHNN由n个互不相连的神经元组组成,每个组里面包含m个神经元。第i个神经元在第x组的输出表示为vxi(t)∈{0,1},输入为uxi(t),偏差表示为θxi(x=1,...,n;i=1,...,m),其中t表示为离散的时间,神经元之间的连接权重表示ωxi,yj(x,y=1,...,n;i,j=1,...,m),并且有ωxi,yj=ωyj,xi
OCHNN的能量函数定义为:
Figure BDA0002584890660000051
在OCHNN中,每一个神经元组中在t时刻仅仅有一个神经元被激活取值为1,其它的神经元取值为0,也就是说神经元在相同的组里面是同步更新的,在不同的组是依次更新的。一次更新状态意味着所有组均完成一次更新。
通过改变能量函数,将OCHNN网络应用到聚类分割问题上,其方式如图4所示。假定样本的个数为n,维度为d,目的是将样本聚为k类。则根据OCHNN的网络结构可理解为可为n×k个神经元,其中n个样本点代表n个神经元组,每一组由k个神经元组成。每个神经元有一个输入值uik和输出值vik,其中vik表示为:
Figure BDA0002584890660000052
Figure BDA0002584890660000053
类中心表示为:
Figure BDA0002584890660000061
能量函数表示为:
Figure BDA0002584890660000062
其中,xid表示第i个样本点(神经元组)在维度d的取值,ckd表示第k个类中心(神经元)在维度d的取值。
神经元的输入更新过程表示为:
Figure BDA0002584890660000063
需要注意的是,在聚类问题中神经元的自连接权重ωik,ik=0,同一组里的神经元之间的连接权重ωik,il=0,因此Kik,il=0。因此神经元输出更新方式为:
Figure BDA0002584890660000064
为了避免某一类的样本为0,引入一个爬山函数h(k)
Figure BDA0002584890660000065
这里T是一个较大的参数,能够保证神经元在某一类不为空类。T的取值一般为50。
在本实施例中,根据OCHNN的分类结果获得相应类中心,并将其带入K-means算法中作为初始类中心,这样就可以克服K-means初始类中心随机确定的缺点,同时获得稳定的聚类结果。OCHNN-Kmeans伪代码如表1所示。
表1 OCHNN-Kmeans算法伪代码
Figure BDA0002584890660000071
实施例1:
以我国南方某市为例进行应用验证,采用该市2016年3月14日到3月20日一周的用电客户数据。原始数据为电流数据,在等压情况下,日电流的变化可以反映出负荷的变化,进而以电流对负荷进行替代。为排除节假日对实证结果的影响,将3月17和3月18日的数据删除。数据颗粒度为每15分钟一个采样。对工作日每位用户的96个数据点重采样为每小时一个点共计24个数据点。通过缺失值、异常值处理后提取出8394个有效用电客户,对这些用电客户使用本发明方法进行聚类。
首先确定聚类的个数,使用Elbow Method方法得到类内平方和聚类个数的关系图,如图5所示;从图5可见,曲线在k=4时达到拐点,因此判定聚类个数为4。
在得到聚类个数以后,通过OCHNN-Kmeans算法得到聚类结果。为了容易观测聚类效果和负荷曲线的形态特征,我们从每一类结果中随机抽取若干用户绘制其负荷曲线图如图6-9所示。
第一类中一共包含3939个用户,第一类占了所有客户的47%。从负荷值的大小和曲线形态特征,得到这类用电客户是用电量较大的居民用户和机关、团体和企事业单位的办公电力用户。
第二类中一共包含3607个用户,第二类占了所有客户的43%。从图像可以看出,第二类的用户与第一类的用户用电习惯基本上是一致的,不同的是二者的用电量不相同,晚上高峰期降低的幅度比较小。得到这类用户是居民家庭用电。第三类中一共包含14个用户,占所有用电客户的比重较少。从图像可以看出,这类用户的用电量在各个时段分布比较平均,用电量比较大。根据上面的负荷形态曲线,得到这类用户为大工业用户。
第四类中一共包含834个电力用户,第四类占了所有客户的10%。从图像可以看出,这类用电客户的明显特征是在12点是用电量的尖峰时刻,在晚上19点到22:30用电量达到最高峰,而且在这段时间相对平稳。22:30之后用电量急剧下降。从上面的这些特征可以得出,得到这类用户为商业用户。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (5)

1.一种基于OCHNN-Kmeans算法的负荷聚类方法,其特征在于,包括以下步骤:
步骤S1:采集负荷数据,并进行预处理;
步骤S2:采用Elbow Method或交叉验证获得最佳的聚类个数;
步骤S3:通过OCHNN方法获得初始类中心C;
步骤S4:将得到的初始类中心C作为K-means的初始类中心,并利用K-means聚类方法对预处理后的负荷数据进行划分,得到负荷曲线划分结构。
2.根据权利要求1所述的基于OCHNN-Kmeans算法的负荷聚类方法,其特征在于,所述步骤S2具体为:
步骤S21:Elbow Method通过遍历不同的k值而得到每个k值所对应的平均类内平方和;
步骤S22:根据得到的每个k值所对应的平均类内平方和,获取K-error曲线,得到最佳的聚类个数。
3.根据权利要求1所述的基于OCHNN-Kmeans算法的负荷聚类方法,其特征在于,所述步骤S3具体为:
步骤S31:设OCHNN由n个互不相连的神经元组组成,每个组里面包含m个神经元;第i个神经元在第x组的输出表示为vxi(t)∈{0,1},输入为uxi(t),偏差表示为θxi(x=1,...,n;i=1,...,m),其中t表示为离散的时间,神经元之间的连接权重表示ωxi,yj(x,y=1,...,n;i,j=1,...,m),并且有ωxi,yj=ωyj,xi
步骤S32:OCHNN的能量函数定义为:
Figure FDA0002584890650000021
步骤S33:通过改变能量函数,将OCHNN网络应用到聚类分割问题上,设定样本的个数为n,维度为d,目的是将样本聚为k类;
步骤S33:根据OCHNN的网络为n×k个神经元,其中n个样本点代表n个神经元组,每一组由k个神经元组成,每个神经元有一个输入值uik和输出值vik,其中vik表示为:
Figure FDA0002584890650000022
Figure FDA0002584890650000023
类中心表示为:
Figure FDA0002584890650000024
能量函数表示为:
Figure FDA0002584890650000025
神经元的输入更新过程表示为:
Figure FDA0002584890650000026
神经元的输出更新过程表示为:
Figure FDA0002584890650000027
4.根据权利要求3所述的基于OCHNN-Kmeans算法的负荷聚类方法,其特征在于,所述OCHNN网络中为了避免某一类的样本为0,引入一个爬山函数h(k),则得到神经元的输入更新过程表示为:
Figure FDA0002584890650000028
其中T是给定参数。
5.一种基于OCHNN-Kmeans算法的负荷聚类系统,其特征在于,包括存储器、处理器,所述存储器上存储有计算机程序,处理器在运行该计算机程序时,能够实现如权利要求1-4任一项所述的方法步骤。
CN202010678492.5A 2020-07-15 2020-07-15 基于OCHNN-Kmeans算法的负荷聚类方法 Pending CN111860634A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010678492.5A CN111860634A (zh) 2020-07-15 2020-07-15 基于OCHNN-Kmeans算法的负荷聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010678492.5A CN111860634A (zh) 2020-07-15 2020-07-15 基于OCHNN-Kmeans算法的负荷聚类方法

Publications (1)

Publication Number Publication Date
CN111860634A true CN111860634A (zh) 2020-10-30

Family

ID=72983351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010678492.5A Pending CN111860634A (zh) 2020-07-15 2020-07-15 基于OCHNN-Kmeans算法的负荷聚类方法

Country Status (1)

Country Link
CN (1) CN111860634A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609555A (zh) * 2021-07-16 2021-11-05 黄河勘测规划设计研究院有限公司 一种基于大数据技术的水工金属结构设计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898154A (zh) * 2018-09-29 2018-11-27 华北电力大学 一种电力负荷som-fcm分层聚类方法
CN110781332A (zh) * 2019-10-16 2020-02-11 三峡大学 基于复合聚类算法的电力居民用户日负荷曲线聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898154A (zh) * 2018-09-29 2018-11-27 华北电力大学 一种电力负荷som-fcm分层聚类方法
CN110781332A (zh) * 2019-10-16 2020-02-11 三峡大学 基于复合聚类算法的电力居民用户日负荷曲线聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张建国: "基于OCHNN-Kmeans的电力客户分类与分时峰谷价格制定", 《万方学位论文》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609555A (zh) * 2021-07-16 2021-11-05 黄河勘测规划设计研究院有限公司 一种基于大数据技术的水工金属结构设计方法
CN113609555B (zh) * 2021-07-16 2023-10-20 黄河勘测规划设计研究院有限公司 一种基于大数据技术的水工金属结构设计方法

Similar Documents

Publication Publication Date Title
Chen et al. Short-term load forecasting with deep residual networks
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及系统
CN106446967A (zh) 一种新型电力系统负荷曲线聚类方法
CN107133652A (zh) 基于K‑means聚类算法的用电客户价值评估方法及系统
CN111415061B (zh) 一种可再生能源电力系统的综合评价方法及装置
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN109948909A (zh) 一种电网数据采集分析方法及系统
CN110188221A (zh) 一种基于形状距离的负荷曲线层次聚类方法
CN113869616A (zh) 一种自适应的居民用户负荷预测方法
CN113902304A (zh) 一种基于总负荷曲线相似性的可控负荷筛选方法
CN118411003B (zh) 多类别电力设备的负荷控制方法、系统、设备和存储介质
CN115758188A (zh) 一种非侵入式的负荷识别方法、装置、设备和介质
CN109146553A (zh) 基于多密度聚类与多核svm的实时电价预测系统及其方法
CN116826710A (zh) 基于负荷预测的削峰策略推荐方法、装置及存储介质
CN117113126A (zh) 一种基于改进聚类算法的行业用电特性分析方法
CN111914900A (zh) 一种用户用电模式分类方法
CN108898273A (zh) 一种基于形态分析的用户侧负荷特征聚类评价方法
Bashawyah et al. Machine learning based short-term load forecasting for smart meter energy consumption data in london households
CN111860634A (zh) 基于OCHNN-Kmeans算法的负荷聚类方法
Kumar et al. A deep clustering framework for load pattern segmentation
CN116467631A (zh) 电力指纹识别模型训练方法、电力指纹识别方法及装置
Du et al. Power customer classification based on OCHNN-Kmeans and price setting of TOU
CN111915116A (zh) 一种基于K-means聚类的电力居民用户分类方法
CN115622056A (zh) 一种基于线性加权和选解法的储能优化配置方法及系统
Wang et al. Greedy clustering-based monthly electricity consumption forecasting model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201030

RJ01 Rejection of invention patent application after publication