CN110503145A

CN110503145A - 一种基于k-shape聚类的典型负荷曲线获取方法

Info

Publication number: CN110503145A
Application number: CN201910774924.XA
Authority: CN
Inventors: 陈建福; 曹安瑛; 李建标; 甘德树; 裴星宇; 唐捷; 刘嘉宁; 刘仁亮; 陈勇; 陈海涵; 游雪峰; 王大鹏; 凌华明; 顾博川; 杨昆; 唐小川; 钱兴博; 温柏坚; 蔡徽; 萧展辉
Original assignee: Guangdong Power Grid Co Ltd; Zhuhai Power Supply Bureau of Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd; Zhuhai Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date: 2019-08-21
Filing date: 2019-08-21
Publication date: 2019-11-26

Abstract

本发明涉及一种基于k‑shape聚类的用户典型负荷曲线获取方法，属于电力系统需求侧响应领域。该方法包括：负荷曲线归一化、定义负荷曲线相似度、初始化聚类中心、负荷曲线归类、更新聚类中心、分类收敛。本方法基于k‑means聚类改良，用余弦距离代替欧氏距离作为衡量不同负荷曲线之间相似度的标准，能更好地分辨出负荷曲线的形状特点而不受到幅度波动的影响，有助于提取用户典型的负荷特征。此外，相较传统的聚类方法用同类型样本的算术平均作为聚类中心的做法，本方法通过求解一个最大化瑞利熵模型获得聚类中心，使得中心与同类型样本的总相似度最大，更能反映负荷曲线的典型特征，有助于对用户负荷进行准确分析。

Description

一种基于k-shape聚类的典型负荷曲线获取方法

技术领域

本发明涉及一种基于k-shape聚类的居民用户典型负荷曲线获取方法，属于电力系统需求侧响应领域。

背景技术

用户负荷作为电力系统运行的末端环节，是保证电网稳定高效运行的关键。近年来，随着电动汽车、分布式可再生能源的普及，用户负荷的波动性和不确定性有较大提高，更是对电网的稳定运行提出了新的挑战。为了对用户负荷进行更深入的研究，并有针对性地提出需求侧响应的策略，需要能够准确把握用户侧的用电特征。然而，当前对于电力系统的研究仍主要集中于配网甚至更高层，对于分散的用户负荷关注度不够，捕捉用户用电特征的方法不多。

因此，分析用户负荷曲线，提取其中的典型特征，对于研究需求侧响应技术，提高能源利用效率具有重要意义。

发明内容

本发明的目的是提出一种基于k-shape聚类的典型负荷曲线获取方法，对海量的用户负荷曲线进行分类，获得每个类别的典型负荷曲线，作为分析用户用电行为特征的基本对象。

本发明提出的基于k-shape聚类的典型负荷曲线获取方法包括以下步骤：

S1：用户负荷数据预处理，包括以下步骤：

S1-1：负荷序列向量化；

S1-2：负荷向量归一化；

S2：定义两条负荷曲线之间的余弦相似度；

S3：聚类中心初始化；

S4：负荷曲线归类；

S5：计算新的聚类中心；

S6：迭代收敛。

进一步，步骤S1-1进行负荷序列向量化的过程为：

将用户每日或者每周各时刻的负荷采样点(一般每15分钟一个采样点)排列成一维曲线，曲线长度由N个时刻的负荷采样点组成，记为：

x＝(l₁,l₂,...,l_N)^T

其中，l_N是第N个时刻的负荷值。

进一步，步骤S1-2进行负荷向量归一化的过程为：

将负荷曲线除以它的模，得到归一化曲线，如下：

其中，

进一步，步骤S2定义两条负荷曲线之间的余弦相似度的过程为：

由于对负荷曲线进行了归一化处理，因此不考虑其中的幅值信息，主要计算曲线之间形状的相似性，可以通过计算两条曲线间的余弦距离：

记负荷曲线x＝(l₁,l₂,...,l_N)和y＝(k₁,k₂,...,k_N)，则余弦相似度为：

由于在步骤S1中已经对负荷进行了归一化处理，故上式可以化简为：

d(x,y)＝x^T·y

考虑到负荷不可能为负，所以当d(x,y)＝1时，两条曲线之间的相似度最高，反之则最低。

进一步，步骤S3进行聚类中心初始化的过程为：

设现在要将M条负荷曲线分为k类，则首先从曲线集合中随机抽取k条曲线作为初次聚类中心即：

进一步，步骤S4进行负荷曲线归类的过程为：

对曲线集合中的每一条曲线，计算其与当前各中心之间的余弦相似度，将曲线归入与之相似度最高的中心所代表的类：

其中，C_j代表第j类曲线构成的集合，代表与当前曲线相似度最高的曲线集合。

进一步，步骤S5计算新的聚类中心的过程为：

对于曲线簇C_j＝{x_i}，其中心曲线μ_j应该满足和簇内各条曲线的相似度之和最大，即求解优化问题：

由于因此该问题等价于：

记其中，L是n×n的矩阵，则优化问题写为：

其中约束条件为易见该问题本质上是瑞利熵问题，用拉格朗日乘子法求解该优化问题：

显然极值在上式导数为0时取得，即：

此时的拉格朗日乘子λ即为矩阵L的特征值，故目标函数值为：

要使得目标函数最大，λ只需取矩阵L最大的特征值即可，此时的变量μ_j即为λ对应的特征向量：

按照此方法更新每个类的中心，得到新的k个聚类中心。

进一步，步骤S6进行迭代收敛的过程为：

将步骤S5得到的聚类中心与上一次迭代的聚类中心进行对比，若聚类中心发生变化，则执行步骤S4，若聚类中心保持不变，即认为迭代收敛，此时的聚类中心即为最终聚类中心，即为最终分类结果。

本发明的有益效果如下：

本方法基于k-means聚类改良，用余弦距离代替欧氏距离作为衡量不同负荷曲线之间相似度的标准，能更好地分辨出负荷曲线的形状特点而不受到幅度波动的影响，有助于提取用户典型的负荷特征。此外，相较传统的聚类方法用同类型样本的算术平均作为聚类中心的做法，本方法通过求解一个最大化瑞利熵模型获得聚类中心，使得中心与同类型样本的总相似度最大，更能反映负荷曲线的典型特征，有助于对用户负荷进行准确分析。

附图说明

图1是本发明的流程示意图。

具体实施方式

实施例1：

如图1所示，本发明提出的基于k-shape聚类的典型负荷曲线获取方法包括以下步骤：

S1：用户负荷数据预处理，包括以下步骤：

S1-1：负荷序列向量化：

x＝(l₁,l₂,...,l_N)^T

其中，l_N是第N个时刻的负荷值；

S1-2：负荷向量归一化：

将负荷曲线除以它的模，得到归一化曲线，如下：

其中，

S2：定义两条负荷曲线之间的余弦相似度：

d(x,y)＝x^T·y

考虑到负荷不可能为负，所以当d(x,y)＝1时，两条曲线之间的相似度最高，反之则最低；

S3：聚类中心初始化：

S4：负荷曲线归类：

其中，C_j代表第j类曲线构成的集合，代表与当前曲线相似度最高的曲线集合；

S5：计算新的聚类中心：

由于因此该问题等价于：

记其中，L是n×n的矩阵，则优化问题写为：

显然极值在上式导数为0时取得，即：

按照此方法更新每个类的中心，得到新的k个聚类中心；

S6：迭代收敛：

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，该方法包括以下步骤：

S1：用户负荷数据预处理，包括以下步骤：

S1-1：负荷序列向量化；

S1-2：负荷向量归一化；

S2：定义两条负荷曲线之间的余弦相似度；

S3：聚类中心初始化；

S4：负荷曲线归类；

S5：计算新的聚类中心；

S6：迭代收敛。

2.根据权利要求1所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S1-1进行负荷序列向量化的过程为：

将用户每日或者每周各时刻的负荷采样点排列成一维曲线，曲线长度由N个时刻的负荷采样点组成，记为：

x＝(l₁,l₂,...,l_N)^T

其中，l_N是第N个时刻的负荷值。

3.根据权利要求2所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S1-2进行负荷向量归一化的过程为：

将负荷曲线除以它的模，得到归一化曲线，如下：

其中，

4.根据权利要求3所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S2定义两条负荷曲线之间的余弦相似度的过程为：由于对负荷曲线进行了归一化处理，因此不考虑其中的幅值信息，主要计算曲线之间形状的相似性，可以通过计算两条曲线间的余弦距离：

d(x,y)＝x^T·y

5.根据权利要求4所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S3进行聚类中心初始化的过程为：

6.根据权利要求5所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S4进行负荷曲线归类的过程为：

7.根据权利要求6所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S5计算新的聚类中心的过程为：

对于曲线簇C_j＝{x_i}，其中心曲线μ_j满足和簇内各条曲线的相似度之和最大，即求解优化问题：

由于因此该问题等价于：

记其中，L是n×n的矩阵，则优化问题写为：

其中约束条件为用拉格朗日乘子法求解该优化问题：

显然极值在上式导数为0时取得，即：

要使得目标函数最大，λ需取矩阵L最大的特征值，此时的变量μ_j即为λ对应的特征向量：

按照此方法更新每个类的中心，得到新的k个聚类中心。

8.根据权利要求7所述的一种基于k-shape聚类的典型负荷曲线获取方法，其特征在于，步骤S6进行迭代收敛的过程为：