CN112365164B - 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 - Google Patents
基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 Download PDFInfo
- Publication number
- CN112365164B CN112365164B CN202011267202.4A CN202011267202A CN112365164B CN 112365164 B CN112365164 B CN 112365164B CN 202011267202 A CN202011267202 A CN 202011267202A CN 112365164 B CN112365164 B CN 112365164B
- Authority
- CN
- China
- Prior art keywords
- load
- energy
- daily
- peak
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/82—Energy audits or management systems therefor
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,包括如下步骤:基于改进密度峰值快速搜索聚类算法,获取中大型能源用户的电、热、冷负荷日典型用能模式;基于能源用户典型用能模式,构建用户综合用能评价体系,指标体系包括用电特性,用热特性及用冷特性三项一级指标,一级指标又包括多项二级指标;将熵权法应用于二级指标权重计算,加权得到各一级指标的得分;将熵权法应用于一级指标权重计算,加权得到中大型能源用户的综合用能得分。本发明有助于电力公司把握能源用户的综合用能特性,挖掘用能规律,开展需求响应、节能减排等业务。
Description
技术领域
本发明属于智能配用电技术领域,尤其涉及基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法。
背景技术
在综合能源系统中,随着高级计量装置的不断发展,对于中大型能源用户也可获得其高细粒度的多元负荷数据,基于聚类算法对用户开展负荷特性分析与用户画像有助于电网公司更深入的了解用户用能特性,挖掘用能规律,开展需求响应、节能减排等业务。
传统的电力用户画像及评价方法往往只关注于电负荷,无法全面反映中大型能源用户的综合用能特性。
发明内容
本发明提出了一种基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,运用熵权法构建了中大型能源用户综合评价体系,涵盖用电、用热、用冷多元负荷,得到了中大型能源用户综合用能画像结果。
本发明解决其技术问题是采取以下技术方案实现的:
包括如下步骤:
S1、获取中大型能源用户一年的电、热、冷负荷数据,对三类负荷数据进行数据预处理;
S2、基于改进密度峰值快速搜索聚类算法,对三类负荷数据进行聚类分析,获取用户的电、热、冷负荷日典型用能模式;
S3、构建中大型能源用户综合用能评价体系,指标体系包括用电特性,用热特性及用冷特性三项一级指标,各一级指标又包括多项二级指标;
S4、计算各一级指标下的二级指标,并将熵权法应用于一级指标得分计算;
S5、基于步骤S4得到的三项一级指标得分,通过熵权法计算出评价指标权重,加权计算得到中大型能源用户的综合用能得分。
在步骤S1中,所述数据预处理包括缺失值填补和异常值检测与修复,其中:
所述缺失值填补选取前一天同一时刻的负荷值填补;
所述异常值检测采用均方差法进行检测;
异常值修复选取相邻两个时刻的平均负荷值代替。
步骤S2中的改进密度峰值快速搜索聚类算法,包括以下步骤:
1)离群点检测:
从一年的用电数据中提取用户每日的日平均负荷、日负荷率和日峰谷差三个特征量来表征用户用电模式,通过LOF算法计算得到用户每天的局部离群因子,计算公式如下式所示:
式中:LOFMinPts(p)和lrdMinPts(p)分别表示样本p的局部离群因子和局部可达密度,NMinPts(p)为评价样本p的MinPts距离邻域,lrdMinPts(o)表示样本p的临域点o的局部可达密度,r_dMinPts(p,o)为评价样本p关于o的可达距离;
2)局部密度计算:
重新定义了样本i的局部密度ρi计算公式如下:
其中:KNN(i)表示样本i的K个最近邻样本集合,dij为样本i和样本j之间的欧氏距离;
3)计算样本点的距离值:
样本点i的距离值δi定义为其他距离样本点i最近且局部密度高的样本到样本点i的距离,样本点i的距离值δi计算公式如下:
4)确定聚类中心:
基于计算所得的所有样本点的距离值δ和局部密度值ρ绘制ρ-δ决策图,选取样本的聚类中心;
5)划分策略:
在确认聚类中心后,将其余样本点分配给密度比它高的距离最近的样本点。
在步骤S2中,所述获取用户的电、热、冷负荷日典型用能模式为基于改进密度峰值快速搜索聚类算法的聚类结果,将一年中所占天数最多的某一类负荷曲线的平均值作为该年的典型用能模式,用于之后的二级指标计算。
在步骤S3中,所述用电特性一级指标包括日平均负荷、日负荷率、日负荷波动率,日峰谷差和峰时用能率五项二级指标,其中:
所述日平均负荷计算方法如下:
式中:P1表示日平均负荷,n为一天的采样次数,L(t)为t时刻的负荷值;
所述日负荷率为平均负荷与最大负荷的比值,计算公式如下:
P2=Lav/Lmax
式中:P2表示日负荷率,Lav和Lmax分别表示日负荷的平均值和最大值;
所述日负荷波动率是描述负荷波动性的指标,其值越大,表示负荷波动性越强,计算方法如下式所示:
式中:P3表示日负荷波动率,s表示某日负荷的标准差,表示当天的负荷均值;
所述日峰谷差定义为一天中最大负荷与最小负荷的差值,计算公式如下:
P4=Lmax-Lmin (10)
式中:P4表示日峰谷差,Lmax和Lmin分别一天中的最大负荷与最小负荷值;
所述峰时耗电率为描述用户在用电高峰时段的用能情况,计算公式如下:
P5=Lp/LZ (11)
式中:P5表示峰时耗电率,Lp和LZ分别表示用户峰时用电量和日总用电量。
在步骤S3中,所述用热特性一级指标包括日平均负荷、日负荷率,日负荷波动率,日峰谷差和峰时用能率。
在步骤S3中,所述用冷特性一级指标包括日平均负荷、日负荷率,日负荷波动率,日峰谷差和峰时用能率。
本发明的优点和积极效果是:
本发明基于改进密度峰值快速搜索聚类算法,有效获取能源用户的多元典型用能模式,基于多项二级指标构建综合用能评价体系,有助于电力公司把握能源用户的综合用能特性,挖掘用能规律,开展需求响应、节能减排等业务。
附图说明
以下将结合附图和实施例来对本发明的技术方案作进一步的详细描述,但是应当知道,这些附图仅是为解释目的而设计的,因此不作为本发明范围的限定。此外,除非特别指出,这些附图仅意在概念性地说明此处描述的结构构造,而不必要依比例进行绘制。
图1为本发明实施例提供的中大型能源用户用电日负荷曲线聚类结果;
图2为本发明实施例提供的中大型能源用户用热日负荷曲线聚类结果;
图3为本发明实施例提供的中大型能源用户用冷日负荷曲线聚类结果。
具体实施方式
首先,需要说明的是,以下将以示例方式来具体说明本发明的具体结构、特点和优点等,然而所有的描述仅是用来进行说明的,而不应将其理解为对本发明形成任何限制。此外,在本文所提及各实施例中予以描述或隐含的任意单个技术特征,仍然可在这些技术特征(或其等同物)之间继续进行任意组合或删减,从而获得可能未在本文中直接提及的本发明的更多其他实施例。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明包括如下步骤:
S1、获取中大型能源用户一年的电、热、冷负荷数据,对三类负荷数据进行数据预处理;
S2、基于改进密度峰值快速搜索聚类算法,对三类负荷数据进行聚类分析,获取用户的电、热、冷负荷日典型用能模式;
S3、基于能源用户多元负荷典型用能模式,构建中大型能源用户综合用能评价体系,指标体系包括用电特性,用热特性及用冷特性三项一级指标,一级指标又包括多项二级指标;
S4、基于能源用户多元负荷典型用能模式,计算各一级指标下的二级指标,并将熵权法应用于一级指标得分计算;
S5、基于步骤S4得到的三项一级指标得分,通过熵权法计算出评价指标权重,加权计算得到中大型能源用户的综合用能得分。
进一步的,在步骤S1中,所述数据预处理包括缺失值填补和异常值检测与修复,其中:
所述缺失值填补选取前一天同一时刻的负荷值填补;所述异常值检测采用均方差法进行检测;所述异常值修复选取相邻两个时刻的平均负荷值代替。
进一步的,步骤S2中的密度峰值快速搜索聚类算法(DPC),该算法相对其他传统的聚类算法有着无需提前输入类别数、无需迭代、能够高效快速挖掘出数据集的类别中心点并进行类别分配,适用于大规模数据的聚类分析,其常规过程如下:
1)计算样本点的局部密度
常用的样本点i局部密度ρi计算方法有基于截断核和基于高斯核的两种。
使用截断核计算局部密度ρi的公式如下:
式中:dij表示两个样本点之间的欧式距离,dc为截断距离,与样本点i距离小于dc的点越多,该样本的局部密度ρi就越大。
使用高斯核计算局部密度ρi的公式为:
式中:dij表示两个样本点之间的欧式距离,dc为截断距离即距离阈值,使用该高斯核计算方式得到的局部密度ρi同样符合距离样本点i小于dc的样本越多,其局部密度ρi就越大的特点;
2)计算样本点的距离值
样本点i的距离值δi定义为其他距离样本点i最近且局部密度高的样本到样本点i的距离,样本点i的距离值δi计算公式如下:
3)确定聚类中心
基于计算所得的所有样本点的距离值δ和局部密度值ρ绘制ρ-δ决策图,根据DPC算法的核心思想(样本集的聚类中心有着更大的局部密度值和距离值)来选取样本的聚类中心;
4)划分策略
DPC算法在确认聚类中心后,将其余样本点分配给密度比它高的距离最近的样本点。
进一步的,本发明中步骤S2中的改进密度峰值快速搜索聚类算法,其改进内容主要包括:
1)离群点检测
在运用DPC算法对中大型能源用户用能特性进行分析时,应更关注用户的典型用能模式,对于一些由于特殊原因造成的异常用能暂且不予考虑,因此,在对能源用户用能特性分析之前,采用局部异常因子(LOF)算法对用户进行异常用能检测与剔除,具体过程如下:
从一年的用电数据中提取用户每日的日平均负荷、日负荷率和日峰谷差三个特征量来表征用户用电模式,通过LOF算法计算得到用户每天的局部离群因子,计算公式如下式所示:
式中:LOFMinPts(p)和lrdMinPts(p)分别表示样本p的局部离群因子和局部可达密度,NMinPts(p)为评价样本p的MinPts距离邻域,lrdMinPts(o)表示样本p的临域点o的局部可达密度,r_dMinPts(p,o)为评价样本p关于o的可达距离。LOFMinPts(p)越大于1,表明p的密度小于其邻域点密度,则p可能是异常点。设定当LOFMinPts(p)大于某一阈值时,便将当天视为异常用电天,在随后的聚类分析时,便将其舍去。
离群点检测是在计算局部密度之前,将离群点剔除以后再进行聚类算法。
2)局部密度计算
为避免选取不同截断距离dc而带来的潜在影响,重新定义了样本i的局部密度ρi计算公式如下:
其中:KNN(i)表示样本i的K个最近邻样本集合,dij为样本i和样本j之间的欧氏距离。
进一步的,在步骤S2中,所述获取用户的电、热、冷负荷日典型用能模式,定义为基于改进密度峰值快速搜索聚类算法的聚类结果,将一年中所占天数最多的某一类负荷曲线的平均值作为该年的典型用能模式,用于之后的二级指标计算。
进一步的,在步骤S3中,所述用电特性一级指标包括日平均负荷、日负荷率、日负荷波动率,日峰谷差和峰时用能率五项二级指标,其中:
所述日平均负荷计算方法如下:
式中:P1表示日平均负荷,n为一天的采样次数,L(t)为t时刻的负荷值。
所述日负荷率为平均负荷与最大负荷的比值,计算公式如下:
P2=Lav/Lmax (8)
式中:P2表示日负荷率,Lav和Lmax分别表示日负荷的平均值和最大值。
所述日负荷波动率是描述负荷波动性的指标,其值越大,表示负荷波动性越强,计算方法如下式所示:
式中:P3表示日负荷波动率,s表示某日负荷的标准差,表示当天的负荷均值。
所述日峰谷差定义为一天中最大负荷与最小负荷的差值,计算公式如下:
P4=Lmax-Lmin (10)
式中:P4表示日峰谷差,Lmax和Lmin分别一天中的最大负荷与最小负荷值。
所述峰时耗电率为描述用户在用电高峰时段的用能情况,计算公式如下:
P5=Lp/LZ (11)
式中:P5表示峰时耗电率,Lp和LZ分别表示用户峰时用电量和日总用电量。
进一步的,在步骤S3中,所述用热特性一级指标包括日平均负荷、日负荷率,日负荷波动率,日峰谷差和峰时用能率,其计算公式分别参照式(7)、(8)、(9)、(10)、(11)。
进一步的,在步骤S3中,所述用冷特性一级指标包括日平均负荷、日负荷率,日负荷波动率,日峰谷差和峰时用能率,各指标计算公式与用热特性下二级指标计算方法相同。
进一步的,在步骤S4和S5中,所述熵权法是一种客观权重赋权法,它的基本思想是根据根据指标变异性的大小来量指标的客观权重。具体步骤如下:
1)指标标准化处理
设有m个评价对象,n项评价指标,根据各项指标对最终评分的影响分为正向指标和负向指标。
正向指标标准化方法如下:
负向指标标准化方法如下:
式中:i=1,2,…,m,j=1,2,…,n,aij表示第i个样本的第j项指标实际值,bij表示归一化后第i个样本第j项的指标值。
2)信息熵计算
具体公式如下所示:
式中:i=1,2,…,n,j=1,2,…,m,ej表示第j项指标的熵值。
3)指标权重计算
基于计算所得的各指标的熵值,计算出各项评价指标的权重,如下式所示:
式中:j=1,2,…,m,wj为第j项指标的权重。
下面就结合图1-3来具体说明本发明。
本实施例采用了美国亚利桑那州立大学Campus Metabolism项目平台的多元用能数据,利用本发明的中大型能源用户用能特性画像方法进行用户画像,包括以下步骤:
S1、获取中大型能源用户一年的冷、热、电负荷数据,对三类负荷数据进行数据预处理;
中大型能源用户区别于居民用户以及一些小型商业用户(例如一家店铺),中大型用户如一栋建筑或者一个购物中心、园区。
目前通过高采样频率智能电表采集传输回来的数据存在一些缺失值和异常值,因此在对负荷数据分析前就需要对缺失值进行填补以及对异常值进行检查并修复,即通过数据预处理完成。
其中,缺失值填补在应用中,一天的负荷数据比如一小时采集一个点,那么一天就有24个点,缺失值就是数据一天可能只有23点,缺失一个点,在进行日典型用能模式分析时,是对24小时的负荷数据进行分析,因此就需要完成对缺失值的填补才能进行分析;
异常值检测与修复在应用中,异常值比如采集的连续三个时刻的负荷数据,由于负荷不会发生剧烈的突变,当前后两个时刻都在很高的能耗值时,如果中间那个时刻的负荷值很低或者甚至为零,就可当作它为异常值,负荷曲线的形状就会出现深‘V ‘,干扰最后的分析结果,因此通过对异常值检测修复来尽量排除这种不利影响。
本实施例使用Campus Metabolism项目平台提供的Tempe校区Barrett HonorsCollege(BarC)、Bio Design Institute A(BioA)、Bio Design Institute B(BioB)、Engineering Research Ctr(EngC)、ISTB 4、Phys Sci A_B_C(Phy)六所建筑2018 年的冷、热、电负荷数据,采样周期为1小时。
S2、基于改进密度峰值快速搜索聚类算法,对三类负荷数据进行聚类分析,获取用户2018年的电、热、冷负荷日典型用能模式;
基于改进密度峰值快速搜索聚类算法,其聚类结果如图1、2、3所示,依次为电、热、冷负荷的类别中心,从图中可以看到电负荷可分为三类典型负荷曲线,热负荷为四类,冷负荷只有一类。
选取各用户一年中所占天数最多的典型负荷曲线类别的均值作为该用户的日典型用能模式,六所建筑三种负荷的类别分布情况如表1所示。
表1建筑用能类别分布表
S3、基于能源用户多元负荷典型用能模式,构建中大型能源用户综合用能评价体系,指标体系包括用电特性、用热特性及用冷特性三项一级指标,各一级指标又包括多项二级指标;
所构建的中大型能源用户用能特性综合评价体系具体框架如表2所示。
表2中大型能源用户用能特性综合评价体系
S4、基于能源用户多元负荷典型用能模式,计算各一级指标下的二级指标,并将熵权法应用于一级指标得分计算;
表3为基于BarC等六所建筑2018年日典型负荷曲线计算得的二级指标。
表3建筑用能特性二级评价指标
由表3可见,六所建筑在电负荷方面,ISTB能耗水平最高,BarC最低,六所建筑除BarC建筑外峰时用电占比都接近0.4,而在冷热负荷方面,同样也是ISTB的能耗水平最高。
基于计算所得的二级指标,运用熵权法得到各分项指标的权重分配情况如表4 所示。
表4二级评价指标权重分配情况
/>
计算所得的六所建筑三项一级指标得分表5所示。
表5一级指标得分情况
从表5可以看出,ISTB建筑在用电、用热、用冷特性方面都有着最高得分,这是因为其具有较高的能耗水平,从表3中的二级指标也可看出该建筑的能耗较高。
S5、基于步骤4得到的三项一级指标得分,通过熵权法计算出评价指标权重,加权计算得到中大型能源用户的综合用能得分;
各一级指标的权重分配情况如表6所示。
表6一级指标权重分配
基于该权重,计算出的六所建筑的综合用能得分情况如表7所示。
表7综合用能标得分情况
/>
从表7可以看出ISTB建筑的综合用能得分最高,这是由于ISTB在用电、用热、用冷特性一级指标上有着最高得分,EngC其综合用能得分仅次于ISTB建筑,位居第二;BioB建筑仅在热负荷特性指标上表现良好,其余指标得分均偏低,其最终的综合用能得分最低。
一种计算设备,包括:
一个或多个处理单元;
存储单元,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理单元执行,使得所述一个或多个处理单元执行上述的基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法;需要说明的是,计算设备可包括但不仅限于处理单元、存储单元;本领域技术人员可以理解,计算设备包括处理单元、存储单元并不构成对计算设备的限定,可以包括更多的部件,或者组合某些部件,或者不同的部件,例如计算设备还可以包括输入输出设备、网络接入设备、总线等。
一种具有处理器可执行的非易失的程序代码的计算机可读存储介质,所述计算机程序被处理器执行时实现上述的基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法的步骤;需要说明的是,可读存储介质例如可以是,但不限于,电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合;可读介质上包含的程序可以用任何适当的介质传输,包括,但不限于无线、有线、光缆, RF等等,或者上述的任意合适的组合。例如,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java,C++等,还包括常规的过程式程序设计语言,诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行,或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
以上实施例对本发明进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。
Claims (5)
1.基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,其特征在于:包括如下步骤:
S1、获取中大型能源用户一年的电、热、冷负荷数据,对三类负荷数据进行数据预处理;
S2、基于改进密度峰值快速搜索聚类算法,对三类负荷数据进行聚类分析,获取用户的电、热、冷负荷日典型用能模式;
步骤S2中的改进密度峰值快速搜索聚类算法,包括以下步骤:
1)离群点检测:
从一年的用电数据中提取用户每日的日平均负荷、日负荷率和日峰谷差三个特征量来表征用户用电模式,通过LOF算法计算得到用户每天的局部离群因子,计算公式如下式所示:
;
式中:LOF MinPts (p)和lrd MinPts (p)分别表示样本p的局部离群因子和局部可达密度,N MinPts (p)为评价样本p的Minpts距离邻域,lrd MinPts (o)表示样本p的临域点o的局部可达密度,r_d MinPts (p,o)为评价样本p关于o的可达距离;
2)局部密度计算:
重新定义了样本i的局部密度p i 计算公式如下:
;
其中:KNN(i)表示样本i的K个最近邻样本集合,d ij 为样本i和样本j之间的欧氏距离;
3)计算样本点的距离值:
样本点i的距离值δ i 定义为其他距离样本点i最近且局部密度高的样本到样本点i的距离,样本点i的距离值δ i 计算公式如下:
;
4)确定聚类中心:
基于计算所得的所有样本点的距离值δ和局部密度值p绘制p-δ决策图,选取样本的聚类中心;
5)划分策略:
在确认聚类中心后,将其余样本点分配给密度比它高的距离最近的样本点;
S3、构建中大型能源用户综合用能评价体系,指标体系包括用电特性,用热特性及用冷特性三项一级指标,各一级指标又包括多项二级指标;
在步骤S3中,所述用电特性一级指标包括日平均负荷、日负荷率、日负荷波动率,日峰谷差和峰时用能率五项二级指标,其中:
所述日平均负荷计算方法如下:
;
式中:P1表示日平均负荷,n为一天的采样次数,L(t)为t时刻的负荷值;
所述日负荷率为平均负荷与最大负荷的比值,计算公式如下:
P2=L
av
/L
max
式中:P2表示日负荷率,L av 和L max 分别表示日负荷的平均值和最大值;
所述日负荷波动率是描述负荷波动性的指标,其值越大,表示负荷波动性越强,计算方法如下式所示:
;
式中:P3表示日负荷波动率,s表示某日负荷的标准差,表示当天的负荷均值;
所述日峰谷差定义为一天中最大负荷与最小负荷的差值,计算公式如下:
P4=L
max
-L
min
式中:P4表示日峰谷差,L max 和L min 分别一天中的最大负荷与最小负荷值;
所述峰时耗电率为描述用户在用电高峰时段的用能情况,计算公式如下:
P5=L
p
/Lz
式中:P5表示峰时耗电率,L p 和Lz分别表示用户峰时用电量和日总用电量;
S4、计算各一级指标下的二级指标,并将熵权法应用于一级指标得分计算;
S5、基于步骤S4得到的三项一级指标得分,通过熵权法计算出评价指标权重,加权计算得到中大型能源用户的综合用能得分。
2.根据权利要求1所述的基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,其特征在于:
在步骤S1中,所述数据预处理包括缺失值填补和异常值检测与修复,其中:
所述缺失值填补选取前一天同一时刻的负荷值填补;
所述异常值检测采用均方差法进行检测;
异常值修复选取相邻两个时刻的平均负荷值代替。
3.根据权利要求1所述的基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,其特征在于:
在步骤S2中,所述获取用户的电、热、冷负荷日典型用能模式为基于改进密度峰值快速搜索聚类算法的聚类结果,将一年中所占天数最多的某一类负荷曲线的平均值作为该年的典型用能模式,用于之后的二级指标计算。
4.根据权利要求1所述的基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,其特征在于:
在步骤S3中,所述用热特性一级指标包括日平均负荷、日负荷率、日负荷波动率、日峰谷差和峰时用能率。
5.根据权利要求1所述的基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法,其特征在于:
在步骤S3中,所述用冷特性一级指标包括日平均负荷、日负荷率、日负荷波动率、日峰谷差和峰时用能率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011267202.4A CN112365164B (zh) | 2020-11-13 | 2020-11-13 | 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011267202.4A CN112365164B (zh) | 2020-11-13 | 2020-11-13 | 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112365164A CN112365164A (zh) | 2021-02-12 |
CN112365164B true CN112365164B (zh) | 2023-09-12 |
Family
ID=74514645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011267202.4A Active CN112365164B (zh) | 2020-11-13 | 2020-11-13 | 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112365164B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113095669A (zh) * | 2021-04-08 | 2021-07-09 | 国网山东省电力公司电力科学研究院 | 一种基于用能耦合协调性的综合能源调度方法及系统 |
CN113095566B (zh) * | 2021-04-08 | 2023-02-07 | 国网山东省电力公司电力科学研究院 | 一种基于用能行为层次化分析的多源协调供能方法及系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002122561A (ja) * | 2000-10-13 | 2002-04-26 | Toshiba Corp | ニッケル基合金の粒界腐食性診断方法およびシステム |
CN107326137A (zh) * | 2017-06-27 | 2017-11-07 | 中南大学 | 高炉热风炉烧炉过程操作参数分时段多级匹配寻优方法 |
CN108664990A (zh) * | 2018-03-29 | 2018-10-16 | 清华大学 | 综合熵方法和密度聚类方法的窃电检测方法及装置 |
CN109102028A (zh) * | 2018-08-20 | 2018-12-28 | 南京邮电大学 | 基于改进的快速密度峰值聚类和lof离群点检测算法 |
CN109146252A (zh) * | 2018-07-25 | 2019-01-04 | 国家电网有限公司 | 基于调节潜力指标的用户用电行为聚类分析方法和系统 |
CN109636146A (zh) * | 2018-11-28 | 2019-04-16 | 东南大学 | 一种用户需求响应潜力画像方法 |
CN109948724A (zh) * | 2019-03-28 | 2019-06-28 | 山东浪潮云信息技术有限公司 | 一种基于改进lof算法的电商刷单行为检测方法 |
CN110490402A (zh) * | 2019-05-20 | 2019-11-22 | 中国电力企业联合会电力建设技术经济咨询中心 | 一种基于地理分区的综合能源园区供能分区方法 |
CN110580585A (zh) * | 2019-09-11 | 2019-12-17 | 东南大学 | 一种基于负荷分解的电力用户聚类用电行为特性分析方法 |
WO2019237492A1 (zh) * | 2018-06-13 | 2019-12-19 | 山东科技大学 | 一种基于半监督学习的异常用电用户检测方法 |
WO2020014579A1 (en) * | 2018-07-12 | 2020-01-16 | Ribbon Communications | Telecommunication call emulation |
CN110942228A (zh) * | 2019-10-25 | 2020-03-31 | 万翼科技有限公司 | 能耗控制方法、装置、计算机设备与存储介质 |
CN111832796A (zh) * | 2020-02-29 | 2020-10-27 | 上海电力大学 | 一种针对居民用电负荷模式的精细分类及预测方法及系统 |
CN111861781A (zh) * | 2020-02-29 | 2020-10-30 | 上海电力大学 | 一种居民用电行为聚类中的特征优选方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10825113B2 (en) * | 2018-03-16 | 2020-11-03 | Dalian University Of Technology | Method for short-term generation scheduling of cascade hydropower plants coupling cluster analysis and decision tree |
-
2020
- 2020-11-13 CN CN202011267202.4A patent/CN112365164B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002122561A (ja) * | 2000-10-13 | 2002-04-26 | Toshiba Corp | ニッケル基合金の粒界腐食性診断方法およびシステム |
CN107326137A (zh) * | 2017-06-27 | 2017-11-07 | 中南大学 | 高炉热风炉烧炉过程操作参数分时段多级匹配寻优方法 |
CN108664990A (zh) * | 2018-03-29 | 2018-10-16 | 清华大学 | 综合熵方法和密度聚类方法的窃电检测方法及装置 |
WO2019237492A1 (zh) * | 2018-06-13 | 2019-12-19 | 山东科技大学 | 一种基于半监督学习的异常用电用户检测方法 |
WO2020014579A1 (en) * | 2018-07-12 | 2020-01-16 | Ribbon Communications | Telecommunication call emulation |
CN109146252A (zh) * | 2018-07-25 | 2019-01-04 | 国家电网有限公司 | 基于调节潜力指标的用户用电行为聚类分析方法和系统 |
CN109102028A (zh) * | 2018-08-20 | 2018-12-28 | 南京邮电大学 | 基于改进的快速密度峰值聚类和lof离群点检测算法 |
CN109636146A (zh) * | 2018-11-28 | 2019-04-16 | 东南大学 | 一种用户需求响应潜力画像方法 |
CN109948724A (zh) * | 2019-03-28 | 2019-06-28 | 山东浪潮云信息技术有限公司 | 一种基于改进lof算法的电商刷单行为检测方法 |
CN110490402A (zh) * | 2019-05-20 | 2019-11-22 | 中国电力企业联合会电力建设技术经济咨询中心 | 一种基于地理分区的综合能源园区供能分区方法 |
CN110580585A (zh) * | 2019-09-11 | 2019-12-17 | 东南大学 | 一种基于负荷分解的电力用户聚类用电行为特性分析方法 |
CN110942228A (zh) * | 2019-10-25 | 2020-03-31 | 万翼科技有限公司 | 能耗控制方法、装置、计算机设备与存储介质 |
CN111832796A (zh) * | 2020-02-29 | 2020-10-27 | 上海电力大学 | 一种针对居民用电负荷模式的精细分类及预测方法及系统 |
CN111861781A (zh) * | 2020-02-29 | 2020-10-30 | 上海电力大学 | 一种居民用电行为聚类中的特征优选方法及系统 |
Non-Patent Citations (1)
Title |
---|
一种基于核密度聚类的电力负荷模式精细化识别算法研究;张桐赫;杜欣慧;王帅;;数学的实践与认识(08);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112365164A (zh) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Electricity theft detection in power grids with deep learning and random forests | |
Sheng et al. | Short-term solar power forecasting based on weighted Gaussian process regression | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
Safta et al. | Efficient uncertainty quantification in stochastic economic dispatch | |
CN112365164B (zh) | 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 | |
CN108376262A (zh) | 一种风电出力典型特性的分析模型构建方法 | |
CN111080105A (zh) | 基于电压时序数据的台区户变关系识别方法及系统 | |
CN115660182A (zh) | 基于最大期望样本加权神经网络模型的光伏出力预测方法 | |
CN112508260B (zh) | 基于对比学习的配电变压器中长期负荷预测方法及装置 | |
CN117236022A (zh) | 互感器剩余寿命预测模型训练方法、应用方法及电子设备 | |
Afzalan et al. | Semantic search in household energy consumption segmentation through descriptive characterization | |
Eluri et al. | Islanding detection in photovoltaic based DC micro grid using adaptive variational mode decomposition and detrended fluctuation analysis | |
CN116142014A (zh) | 一种电动汽车智能充电方法、装置、设备及介质 | |
Prasanna et al. | Multi objective optimal allocation of a distributed generation unit in distribution network using PSO | |
CN115759395A (zh) | 光伏检测模型的训练、光伏发电的检测方法及相关装置 | |
CN112633631B (zh) | 多电源系统互补性的评价方法 | |
CN112711913B (zh) | 基于粒度支持向量机的冷热电短期负荷预测系统及方法 | |
CN114358207A (zh) | 一种改进的k-means异常负荷检测方法及系统 | |
Lu et al. | Time series power anomaly detection based on Light Gradient Boosting Machine | |
CN114118587A (zh) | 分布式光伏的电能质量评估方法及系统、设备、存储介质 | |
Alameady et al. | Energy theft detection with determine date theft period for state grid corporation of china dataset | |
CN112241922A (zh) | 基于改进朴素贝叶斯分类的电网资产综合价值评估方法 | |
CN111222688A (zh) | 一种商业楼宇的日负荷预测方法 | |
Zhao et al. | Analysis the Consumption Behavior Based on Weekly Load Correlation and K-means Clustering Algorithm | |
Liu et al. | Neyman-Pearson Umbrella Algorithm-Based Static Voltage Stability Assessment with Misclassification Restriction: An Integrated Data-Driven Scheme |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |