一种配电网负荷的纵横混合聚类多维度分析方法
技术领域
本发明属于配电网中负荷预测技术领域,具体涉及一种配电网负荷的纵横混合聚类多维度分析方法。
背景技术
随着我国电力企业对客户侧互动和服务的逐渐重视,电力用户逐渐积极参与到电网公司的各项业务中来,源-网-荷的互动调节也逐渐增多。其中用户负荷特性的多维度研究显得尤为重要。基于先进的通信、量测和数据管理技术,大量电力用户的数据被电网公司广泛采集,数据反映的用户行为特征也逐渐凸显,用户总体呈现用电行为复杂、多样的特点。
目前,许多科研人员对负荷特性的研究付出了巨大的心血。针对传统典型日负荷特性选取方法误差较大的问题,提出基于K-means的典型日负荷特性计算方法,所提方法能有效选取典型日负荷特性曲线。在负荷预测模型中引入用户用电特征,提出了簇负荷特性曲线的概念,进而提出了一种基于簇负荷特性曲线的“聚类-回归”电力大用户短期负荷预测方法。通过分析西北电网近10年的8760统调负荷数据,归纳出西北电网最新的年负荷特性及日负荷特性,同时总结历史负荷特性的变化规律,结合经济发展、产业结构、环保政策等因素,寻找负荷特性变化的内因与规律,预测出西北电网2025年负荷特性。
近年来,基于神经网络与深度学习的负荷聚类方法也得到了广泛应用。通过使用基于卷积神经网络支持向量机的聚类集成方法,有效提高了高维负荷数据的聚类效率;提出一种基于聚类和深度置信网络的居民用电负荷模式识别方法,该方法在分类识别的基础上为居民用电负荷提供了可靠的配电网维护;将大尺度信息作为SOM的输入,对不同特性数据进行聚类分析,得到了理想的聚类效果。
目前相关领域,只是测重负荷聚类算法的创新,忽略多角度分析负荷特性。再者传统负荷峰值预测,单一值预测负荷峰值,有失准度。
发明内容
本发明的目的是提供一种配电网负荷的纵横混合聚类多维度分析方法,通过两个维度聚类分析负荷特性,有助于提高负荷预测准确度。
本发明所采用的技术方案是,一种配电网负荷的纵横混合聚类多维度分析方法,具体按照以下步骤实施:
步骤1、提取待研究区域的年历史负荷数据,对年历史负荷数据进行预处理;
步骤2、对预处理后的年历史负荷数据分别设置不同的聚类数目进行日负荷聚类、年小时负荷聚类;
步骤3、根据日负荷聚类、年小时负荷聚类获得未来某类负荷某一时刻数值的取值范围;
根据日负荷聚类、年小时负荷聚类获得最大负荷数据群的双向选取模型。
步骤1研究区域的年历史负荷数据为某电网一年365天的负荷数据,数据采样周期为1小时,将采样数据输出为24*365的矩阵,将矩阵的行视为横向,列视为纵向。
步骤1对年历史负荷数据进行预处理是指识别整年历史负荷数据,并修其中的异常数据。
步骤1识别整年历史负荷数据过程为:筛选年历史负荷数据中数据幅值变化超过正负3倍的负荷标准差的数据,判断该数据是否在拉依达准则约束范围内,若在拉依达准则约束范围内,则该数据是正常数据,否则为异常数据。
拉依达准则为:
ximin若数据为负,ximin定义为当日的负荷实际最小值;
ximax为某日负荷最大值,ximin为某日负荷最小值,xie为某日负荷均值,为某日负荷标准差;
拉依达准则约束范围为(ximin,ximax)。
步骤2具体过程为:
步骤2.1、对预处理后的矩阵的横向数据和纵向数据分别选择不同聚类数目的负荷数据样本;
步骤2.2、对预处理后的横向数据和纵向数据分别计算每个负荷数据分别到负荷聚类中心的距离平方和,根据该距离平方和将预处理后的横向数据和纵向数据中各负荷数据样本划分到最近的初始聚类中心,得到横向数据负荷簇和纵向数据的负荷簇;
步骤2.3、判断距离平方和是否满足收敛条件,若满足则输出横向数据或纵向数据的负荷簇,否则,更新聚类中心,返回步骤2.2。
步骤2.2中每个用户的负荷数据分别到负荷聚类中心的距离平方和计算公式为:
式中,K表示纵向或横向的负荷聚类类别数目,umn取值0或1,umn=1表示第n个负荷样本数据属于m类,umn=0表示第n个负荷数据不属于m类,m表示聚类中心的编号,Cm为聚类中心,d(Cm,Xn)为第n个负荷到m类别的距离。
步骤3中未来某类负荷某一时刻数值的取值范围具体过程为:
假设未来j时刻的负荷属于纵向数据的负荷簇中的第i类,i为横向数据负荷簇个体数目,i=1,2,…k,k为横向数据负荷簇总数,j取值为1-24中的整数,则该未来负荷数值记为Pij,根据纵向数据的负荷簇确定第i类的取值范围[Pimin,Pimax],根据横向数据负荷簇确定第j类的取值范围[Pjmin,Pjmax],则预测未来j时刻的负荷Pij的取值范围为[Pijmin,Pijmax],其中,Pijmin=min{Pimin,Pjmin},Pijmax=max{Pimax,Pjmax}。
步骤3中获得最大负荷数据群的双向选取模型的具体过程为:
根据横向数据负荷簇负荷最大值出现时刻,并结合负荷簇序列的趋势性,预测最大负荷的范围分布在某时间段;
根据纵向数据的负荷簇中日负荷最大值的出现时间段,并结合负荷簇序列的趋势性,预测负荷最大值的范围分布日期
将预测最大负荷的范围分布在某时刻段与预测负荷最大值的范围分布日期结合作为最大负荷数据群的双向选取模型。
本发明有益效果是:
1)本发明一种配电网负荷的纵横混合聚类多维度分析方法,两次利用K-means算法对负荷分别进行日负荷聚类、年小时负荷进行聚类分析,可根据实际情况需要确定负荷聚类数目,对负荷进行精细化分类,有利于对于负荷特性进行精细化研究,进而提升负荷预测准度;其中,尤其是对负荷峰谷期持续时间的准确计算,解决以往由经验判定峰谷期的缺点,进而提升负荷预测准度;
2)本发明所用的算例数据是某电网一年365天的负荷数据,数据采样周期为1小时,将采样数据输出为24*365的矩阵,将矩阵的行视为横向,列视为纵向,本发明从纵向和横向这两个角度出发,并将两者结合起来,深层次地分析全年日负荷曲线的整体变化趋势,一方面,可以预测某时刻负荷的取值范围;另一方面,可以建立最大负荷数据群的双向选取模型,预测负荷峰值所出现的具体时间段,解决以往由单一点确定负荷峰值的缺点,进而提升负荷预测准度;
3)本发明从数理统计角度对大电力数据进行分析,对日负荷进行求解负荷数据的数理特性,得到负荷特性曲线相关变化趋势,为后续的负荷预测和新能源消纳问题提供一定的参考依据。
附图说明
图1是本发明一种配电网负荷的纵横混合聚类多维度分析方法中K-means算法流程图;
图2是本发明实施例中采集的某区域电网中原始历史负荷曲线变化图;
图3是本发明实施例中聚类数目为5时纵向数据负荷簇曲线变化图;
图4是本发明实施例中聚类数目为4时横向数据负荷簇曲线变化图;
图5是本发明实施例中极差与聚类中心关系变化曲线图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种配电网负荷的纵横混合聚类多维度分析方法,具体按照以下步骤实施:
步骤1、提取待研究区域的年历史负荷数据,对年历史负荷数据进行预处理;
研究区域的年历史负荷数据为某电网一年365天的负荷数据,数据采样周期为1小时,可视为24*365的矩阵,将矩阵的行视为横向,列视为纵向。
对年历史负荷数据进行预处理是指识别整年历史负荷数据,并修其中的异常数据。
识别整年历史负荷数据过程为:筛选年历史负荷数据中数据幅值变化超过正负3倍的负荷标准差的数据,判断该数据是否在拉依达准则约束范围内,若在拉依达准则约束范围内,则该数据是正常数据,否则为异常数据。
拉依达准则为:
ximin若数据为负,ximin定义为当日的负荷实际最小值;
ximax为某日负荷最大值,ximin为某日负荷最小值,xie为某日负荷均值,为某日负荷标准差;
拉依达准则约束范围为(ximin,ximax)。
异常数据的修正利用正常数据插补的方法来减小对其聚类结果的影响。
步骤2、对预处理后的年历史负荷数据分别设置不同的聚类数目进行日负荷聚类、年小时负荷聚类;
步骤2具体过程为:
步骤2.1、对预处理后的矩阵的横向数据和纵向数据分别选择不同聚类数目的负荷数据样本;
步骤2.2、对预处理后的横向数据和纵向数据分别计算每个负荷数据分别到负荷聚类中心的距离平方和,根据该距离平方和将预处理后的横向数据和纵向数据中各负荷数据样本划分到最近的初始聚类中心,得到横向数据负荷簇和纵向数据的负荷簇;
每个用户的负荷数据分别到负荷聚类中心的距离平方和计算公式为:
式中,K表示纵向或横向的负荷聚类数目,umn取值0或1,umn=1表示第n个负荷样本数据属于m类,umn=0表示第n个负荷数据不属于m类,m表示聚类中心的编号,Cm为聚类中心,d(Cm,Xn)为第n个负荷到m类别的距离。
步骤2.3、判断距离平方和是否满足收敛条件,若满足则输出横向数据或纵向数据的负荷簇,否则,更新聚类中心,返回步骤2.2。
步骤3、根据日负荷聚类、年小时负荷聚类获得未来某类负荷某一时刻数值的取值范围;
未来某类负荷某一时刻数值的取值范围具体过程为:
假设未来j时刻的负荷属于纵向数据的负荷簇中的第i类,i为横向数据负荷簇个体数目,i=1,2,…k,k为横向数据负荷簇总数,j取值为1-24中的整数,则该未来负荷数值记为Pij,根据纵向数据的负荷簇确定第i类的取值范围[Pimin,Pimax],根据横向数据负荷簇确定第j类的取值范围[Pjmin,Pjmax],则预测未来j时刻的负荷Pij的取值范围为[Pijmin,Pijmax],其中,Pijmin=min{Pimin,Pjmin},Pijmax=max{Pimax,Pjmax}。
根据日负荷聚类、年小时负荷聚类获得最大负荷数据群的双向选取模型,获得最大负荷数据群的双向选取模型的具体过程为:
根据横向数据负荷簇负荷最大值出现时刻,并结合负荷簇序列的趋势性,预测最大负荷的范围分布在某时间段;
根据纵向数据的负荷簇中日负荷最大值的出现时间段,并结合负荷簇序列的趋势性,预测负荷最大值的范围分布日期;
将预测最大负荷的范围分布在某时刻段与预测负荷最大值的范围分布日期结合作为最大负荷数据群的双向选取模型。
实施例
选取某地区电网实测全年的8760个负荷数据,如图1所示,对电网原始历史负荷曲线进行预处理,并对从纵向和横向两个方面出发,纵向为日负荷聚类,初始聚类数目为5个时,如图3所示,横向为年小时负荷曲线,初始聚类数目为4个时,如图4所示。
根据日负荷聚类结果曲线如图3可知,该曲线呈现“双峰”特点,即日负荷数据10:00-14:00和17:00-21:00之间较大,呈现峰谷现象,该两个时间段为用电高峰期,与实际物理意义相符。
将聚类中心日负荷曲线视为典型日负荷曲线,该曲线能够体现出该地区的负荷水平大小,可以对其分析,得到该地区的日负荷时间特性,为后续的负荷预测、电力电量平衡、新能源消纳、调峰分析、需求侧响应提供参考依据。
对日内时刻的负荷进行聚类,可以得知日内负荷变化具有一定的规律性。根据负荷的变化幅度和数值大小可以将其分为高峰负荷、次高峰负荷、次低谷负荷和低谷负荷四类负荷。负荷的精细化分类有助于负荷特性的精确化研究,进而有利于提高负荷预测精度。解决以往由经验对日负荷峰谷期继续时间进行分类的弊端。
年小时负荷聚类结果如表1所示:
表1
由表1及图4可知,时刻1-8的负荷聚为第一类,所占比例为33.33%,该类负荷数值最小,变化幅度最小,此类的负荷处于相对稳定时期,可以称为低谷负荷。时刻9、24的负荷聚为第二类,所占比例为8.33%,该类负荷数值较小,变化幅度较小,此类的负荷处于过渡时期,称为次低谷负荷。时刻15-16、21-23的负荷聚为第三类,所占比例为20.84%,该类负荷数值较大,变化幅度较大,此类的负荷处于过渡时期,称为次高峰负荷。时刻10-14、17-20的负荷聚为第四类负荷,所占比例为37.50%,该类负荷数值最大,变化幅度较小,此类的负荷处于相对稳定时期,称为高峰负荷。
结合负荷数据的物理特性对其深层次分析,挖掘其背后蕴藏的物理信息。得到如下结论:
从极差出发进行分析,极差的数学表达式为Δpi(t)=Pi(t)max-Pi(t)min,其中,Δpi(t)为极差,即某时刻负荷最大值与最小值的差值;Pi(t)max为某时刻负荷所出现过的最大值,Pi(t)min为某时刻负荷所出现过的最小值。
根据历史数据可以某时刻负荷大小应满足Pi(t)min≤Pi(t)≤Pi(t)max这样才能使系统稳定安全有效运行。
极差Δpi(t)体现某时刻的负荷变化幅值,负荷变化量应避开极差Δpi(t),为系统负荷运行方式的灵活调节提供参考依据。
根据下图5可知,t时刻负荷的变化区间为[Pi(t)min-Pi(t),Pi(t)max-Pi(t)],Pi(t)是指负荷某时刻数值大小。由此可以知道某时刻负荷的变化裕量,可将此负荷裕量视为可控负荷,对其进行合理调节,能够提高新能源消纳率。
通过上述方式,本发明一种配电网负荷的纵横混合聚类多维度分析方法,利用以k-means算法为计算工具,从矩阵的纵向和横向两个方面出发,将纵向聚类和横向聚类结合起来,并考虑负荷数据的数理特性,多维度深层次地挖掘电力大数据当中蕴含的实际物理意义,并对负荷数据进行聚类以此来分析负荷的特性,为后续的提升负荷预测准度相关工作提供参考依据。