CN111898857A - 基于BEMD和kmeans电力用户特征分析方法及系统 - Google Patents
基于BEMD和kmeans电力用户特征分析方法及系统 Download PDFInfo
- Publication number
- CN111898857A CN111898857A CN202010571026.7A CN202010571026A CN111898857A CN 111898857 A CN111898857 A CN 111898857A CN 202010571026 A CN202010571026 A CN 202010571026A CN 111898857 A CN111898857 A CN 111898857A
- Authority
- CN
- China
- Prior art keywords
- data
- kmeans
- power
- user
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 83
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 39
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 31
- 230000005611 electricity Effects 0.000 claims abstract description 25
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 15
- 230000002354 daily effect Effects 0.000 claims description 11
- 238000012512 characterization method Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 7
- 230000003203 everyday effect Effects 0.000 claims description 7
- 230000001932 seasonal effect Effects 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 6
- 238000007873 sieving Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及电力系统的负荷预测领域,具体涉及基于BEMD和kmeans电力用户特征分析方法及系统。该方法先获取用户电力负荷数据,并存储为数据库;然后基于经验模态分解方法对电力负荷数据进行预处理;再将分层次的电力负荷数据进行kmeans算法聚类,并选取皮尔逊距离作为样本相似程度的评价指标;根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。本发明分析方法能够适应时间区间负荷数据,同样适用于波动性强、稳定性差的负荷,可实现对于电力用户用电特征的分层次聚类,兼顾了运算速度的前提下聚类效果稳定良好。
Description
技术领域
本发明涉及电力系统的负荷预测领域,具体涉及基于BEMD和kmeans电力用户特征分析方法及系统。
背景技术
用户用电行为分析建立在海量用电数据的基础上,考虑天气、地理信息等因素,利用数据挖掘技术,提取和分析不同用户用电特性。用户用电负荷具有较大的不确定性,日负荷曲线展现了用户一天中的用电行为,表现为负荷的横向特性:而一段时期(如一周或一个月)中不同的日负荷曲线也会存在差异,表现为负荷的纵向特性。不同用户的纵向差异程度具有明显的区别。但是目前这些研究还不深入,海量用电数据的价值还没有被充分的挖掘和应用,暂未完全达到负荷特征透明化。
近年来,社会已经意识到用户用电行为分析的重要性,相关学者已经开展了应用研究。当下已将聚类算法应用于用户分类,但是对用户典型负荷特性提取的研究有限,无法充分挖掘用户的负荷特性。而在分析不同居民用户的用电行为的基础上,再应用聚类算法对居民用户分类,其结果较好的反应了不同类别用户实际用电行为,但是对于用户需求侧响应方面没有继续深入研究。因此,需要一种高效、准确的聚类算法对用户进行细分,在能够较好地分析用户用电行为基础上,考虑传统kmeans算法初始聚类数及初始聚类中心的选择是准确挖掘出用户用电行为的基础。
智能电网是能源与电力行业发展的必然趋势。随着智能电网理论与实践的推进,电网建设正朝着数字化、互动化和分布化的方向发展。分布式可再生能源和电动汽车等多元化负荷的广泛接入,加大了负荷预测和需求侧管理等工作的难度,对电力用户进行精细化分类成为了负荷预测、需求侧管理、用电定价等方面的重要前提。对用户进行合理精细的分类,掌握用户的用电行为,对于各电力企业制定运维和营销策略具有重要意义。随着大数据时代的到来,在智能电网的大背景下,电网用电信息采集系统、客户服务信息系统积累了海量用电数据,这些数据隐藏了很多用电信息。而工商业负荷作为用电大户,如何能确保有序高效、节能环保的用电是重中之重。因此,未来的智能电网在保证安全、可靠用电的同时,应该面向不同的用户提供更加优质且具有针对性的服务及科学用电建议。因此提取和分析用户用电的规律及用电特性对用户本身及供电公司有着重要的意义。
发明内容
发明目的:
本发明针对传统聚类算法进行电力用户特征分析过程中,对于非线性非稳态信号无法提供局部时间上的频率特征,导致聚类准确性低、聚类效果差等问题,提出一种基于经验模态分解和kmeans结合的电力用户特征分析方法。
技术方案:
基于BEMD和kmeans电力用户特征分析方法,该方法包括:
步骤1,获取用户电力负荷数据,并存储为数据库;
步骤2,基于经验模态分解方法对电力负荷数据进行预处理;
步骤3,将分层次的电力负荷数据进行kmeans算法聚类,并选取皮尔逊距离作为样本相似程度的评价指标;
步骤4,根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。
进一步的,用电采集系统中的每个电力用户都有着庞大且复杂的负荷数据,内部数据获取采取开放式接口的方式进行,并存储为数据库,同时对数据进行行业分类处理,粗略剔除异常数据。
进一步的,步骤2中的对电力负荷数据的预处理,提出在分析过程中采取经验模态分解法;采用层次分离法改进BEMD,将用户用电数据图像提取不同层次的特征,尺度最小的细节部分被最先分离出来,以后分离出的图像尺度逐渐增大,最后剩余的部分是尺度最大的图像趋势信息。
进一步的,改进BEMD做如下假设:
1)二维数据平面至少包含一个极大值点和一个极小值点或整个二维平面没有极值点但在进行一阶或几阶求导运算后能够出现一个极大值点和一个极小值点;
2)特征尺度用极值点之间距离的尺度定义;
其分解筛选过程如下:
记I(x,y)为待处理的数字图像,其极小值包络曲面EMIN(x,y)和极大值包络曲面EMAX(x,y)的代数均值记为E1(x,y),
它与原图像数据I(x,y)的差值定义为D1(x,y),
D1(x,y)=I(x,y)-E1(x,y) (2)
D1(x,y)是I(x,y)的一个中间过程值,重复上述过程k次,直到Dk(x,y)是一个内禀模态函数,此时有
D1(k-1)(x,y)-E1k(x,y)=D1k(x,y) (3)
定义C1(x,y)=D1k(x,y),则C1(x,y)即为分离出的第一个IMF;
确定一个准则用于每层筛分过程的停止,由限制标准差的尺寸SD完成;判断第i层IMF筛分结束的标准差判别函数为:
取SD≤0.3;
然后把C1(x,y)从原数据中分离得到余项R1(x,y),
I(x,y)-C1(x,y)=R1(x,y) (5)
将R1(x,y)作为新的数据,重复上述过程n次,得到最终的表达式:
其中I(x,y)为原图像数据,C1(x,y)是分解后得到的较小尺度细节信息,Rn(x,y)是得到的最终大尺度趋势项。
进一步的,对用户电力负荷数据的聚类步骤如下:
S1从步骤2中预处理后的分层次的电力负荷数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类;
S2计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里,平均皮尔逊相关距离公式如下:
这里pi是第i个负载曲线的平均值,pj是第j个负载曲线的平均值;T表示选取样本的数据点总数,t表示时间点;
S3调整聚类中心,将聚类的中心移动到聚类的几何中心处,也就是kmeans中的mean的含义;
S4重复第2、3步直到聚类的中心不再移动,此时算法收敛。
进一步的,根据kmeans聚类结果以及实际数据来源确定电力负荷剖面特征,在特定月数的时间内,每天在24小时的基础上分别聚类,确保表征过程能够捕获用户用电的每日、每月和季节性组成部分,使分析结果更精确且更具代表性。
基于BEMD和kmeans电力用户特征分析系统,该系统包括用户电力负荷数据模块、预处理模块、kmeans算法聚类模块、特征分析模块;
用户电力负荷数据模块,用于获取用户电力负荷数据,并存储为数据库;
预处理模块,用于从经验模态分解方法对电力负荷数据进行预处理;
Kmeans算法聚类模块,用于分层次的电力负荷数据进行k-means算法聚类,其中取皮尔逊距离作为样本相似程度的评价指标;
特征分析模块,用于根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。
进一步的,用户电力负荷数据模块,由于用电采集系统中的每个电力用户都有着庞大且复杂的负荷数据,内部数据获取采取开放式接口的方式进行,并存储为数据库,同时对数据进行行业分类处理,粗略剔除异常数据;预处理模块,提出在分析过程中采取经验模态分解法;采用层次分离法改进BEMD,将用户用电数据图像提取不同层次的特征,尺度最小的细节部分被最先分离出来,以后分离出的图像尺度逐渐增大,最后剩余的部分是尺度最大的图像趋势信息;
改进BEMD做如下假设:
1)二维数据平面至少包含一个极大值点和一个极小值点或整个二维平面没有极值点但在进行一阶或几阶求导运算后能够出现一个极大值点和一个极小值点;
2)特征尺度用极值点之间距离的尺度定义;
其分解筛选过程如下:
记I(x,y)为待处理的数字图像,其极小值包络曲面EMIN(x,y)和极大值包络曲面EMAX(x,y)的代数均值记为E1(x,y),
它与原图像数据I(x,y)的差值定义为D1(x,y),
D1(x,y)=I(x,y)-E1(x,y) (2)
D1(x,y)是I(x,y)的一个中间过程值,重复上述过程k次,直到Dk(x,y)是一个内禀模态函数,此时有
D1(k-1)(x,y)-E1k(x,y)=D1k(x,y) (3)
定义C1(x,y)=D1k(x,y),则C1(x,y)即为分离出的第一个IMF;
确定一个准则用于每层筛分过程的停止,由限制标准差的尺寸SD完成;判断第i层IMF筛分结束的标准差判别函数为:
取SD≤0.3;
然后把C1(x,y)从原数据中分离得到余项R1(x,y),
I(x,y)-C1(x,y)=R1(x,y) (5)
将R1(x,y)作为新的数据,重复上述过程n次,得到最终的表达式:
其中I(x,y)为原图像数据,C1(x,y)是分解后得到的较小尺度细节信息,Rn(x,y)是得到的最终大尺度趋势项。
进一步的,kmeans算法聚类模块,具体包括:
S1从步骤2中预处理后的分层次的电力负荷数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类;
S2计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里,平均皮尔逊相关距离公式如下:
这里pi是第i个负载曲线的平均值,pj是第j个负载曲线的平均值;T表示选取样本的数据点总数,t表示时间点;
S3调整聚类中心,将聚类的中心移动到聚类的几何中心处,也就是kmeans中的mean的含义;
S4重复第2、3步直到聚类的中心不再移动,此时算法收敛。
进一步的,特征分析模块,根据kmeans聚类结果以及实际数据来源确定电力负荷剖面特征,在特定月数的时间内,每天在24小时的基础上分别聚类,确保表征过程能够捕获用户用电的每日、每月和季节性组成部分,使分析结果更精确且更具代表性。
优点及效果:
本发明具有以下优点和有益效果:
本发明分析方法能够适应时间区间负荷数据,同样适用于波动性强、稳定性差的负荷,可实现对于电力用户用电特征的分层次聚类,兼顾了运算速度的前提下聚类效果稳定良好。
1)采用二维经验模态分解算法对电力负荷数据进行预先处理,即先通过BEMD提取出序列的不同层次趋势特征,提高了聚类的准确性;
2)运用kmeans聚类算法对电力负荷数据进行聚类时采用平均皮尔逊相关距离作为样本相似程度的评价标准,此方法完美适应于经过BEMD处理的负荷序列,加快了聚类速度,是聚类结果更具可信度;
3)根据聚类结果以及实际数据来源确定电力负荷剖面特征,使分析结果更精确且更具代表性。
附图说明
图1是BEMD核心算法流程图;
图2是k-means聚类分析算法的流程图;
图3是输入图像循环流程图;
图4是通过聚类确定电力负荷剖面特征的方法中阶段1聚类;
图5是阶段2电力负荷PC特征;
图6是阶段3用户PC分类。
具体实施方式
下面结合附图对本发明做进一步的说明:
本发明针对传统聚类算法进行电力用户特征分析过程中,对于非线性非稳态信号无法提供局部时间上的频率特征,导致聚类准确性低、聚类效果差等问题,提出一种基于经验模态分解和kmeans结合的电力用户特征分析方法。本发明适用于任何非线性非稳态的电网负荷样本,扩大了数据的兼容性同时提高了聚类准确性。
基于BEMD和kmeans电力用户特征分析方法,该方法包括:
步骤1,获取用户电力负荷数据,并存储为数据库;
经过漫长的时间累积,用电采集系统中的每个电力用户都有着庞大且复杂的负荷数据,为保证取数速度快、稳定性高,内部数据获取采取开放式接口的方式进行,并存储为数据库,同时对数据进行行业分类处理,粗略剔除异常数据,使数据更准确、安全、便于使用和分析。
步骤2,基于经验模态分解方法对电力负荷数据进行预处理;
电力负荷数据往往具有波动频率高、波动幅度大的特点,所以要对获取的电力负荷数据进行去噪和降维等预处理,对于非线性、非平稳信号采用二维经验模态分解(Bidimensional Empirical Mode Decomposition,BEMD)方法将复杂的电力负荷信号进行分解而无须预先设定任何基函数,高效表示和处理图像信息特征的同时提升了图像融合质量,大大减轻预处理的复杂程度,所获得不同层次的用电特征更为清晰、便于聚类。
步骤2中的对电力负荷数据的预处理,提出在分析过程中采取经验模态分解法;该方法能过滤原始序列中的噪声,分解得到具有局部信号相关性特征的系数,产生的不同层次的趋势序列能准确反映原序列的趋势特征,使序列变得更加清晰,而信息量丢失相对较少,有利于对图像信息特征的高效表示和处理,从而达到提升图像融合质量的效果。如此,在简化数据预处理操作复杂程度的同时大大降低kmeans算法的空间复杂程度,便于聚类,加快了聚类速度,提高了聚类准确性。
步骤2采用层次分离法改进BEMD,将用户用电数据图像提取不同层次的特征,类似于将图像剖析切片,尺度最小的细节部分被最先分离出来,以后分离出的图像尺度逐渐增大,最后剩余的部分是尺度最大的图像趋势信息;此方法具有区别于传统EMD方法的优点:其一在于引入了局部尺度定义,即极值点之间的距离;其次在于只有达到某个满足条件时提取分量才停止,如此便得到一系列图像信息。该方法基本不需要人工干涉并且对不同图像的处理表现出极强的自适应性。
其中,改进BEMD做如下假设:
1)二维数据平面至少包含一个极大值点和一个极小值点或整个二维平面没有极值点但在进行一阶或几阶求导运算后能够出现一个极大值点和一个极小值点;
2)特征尺度用极值点之间距离的尺度定义;
其分解筛选过程如下:
记I(x,y)为待处理的数字图像,其极小值包络曲面EMIN(x,y)和极大值包络曲面EMAX(x,y)的代数均值记为E1(x,y),
它与原图像数据I(x,y)的差值定义为D1(x,y),
D1(x,y)=I(x,y)-E1(x,y) (2)
D1(x,y)是I(x,y)的一个中间过程值,重复上述过程k次,直到Dk(x,y)是一个内禀模态函数,此时有
D1(k-1)(x,y)-E1k(x,y)=D1k(x,y) (3)
定义C1(x,y)=D1k(x,y),则C1(x,y)即为分离出的第一个IMF;
确定一个准则用于每层筛分过程的停止,由限制标准差的尺寸SD完成;判断第i层IMF筛分结束的标准差判别函数为:
取SD≤0.3;
然后把C1(x,y)从原数据中分离得到余项R1(x,y),
I(x,y)-C1(x,y)=R1(x,y) (5)
将R1(x,y)作为新的数据,重复上述过程n次,得到最终的表达式:
其中I(x,y)为原图像数据,C1(x,y)是分解后得到的较小尺度细节信息,Rn(x,y)是得到的最终大尺度趋势项。
步骤3,将分层次的电力负荷数据进行k-means算法聚类,并选取皮尔逊距离作为样本相似程度的评价指标;
Kmeans聚类算法不仅算法简单且收敛速度相对较快,采用平均皮尔逊相关距离作为相似程度的评价指标,对经过BEMD处理而得到的电力负荷数据进行聚类,大大降低kmeans算法的空间复杂程度,提高聚类准确性;
步骤3中,本发明采用平均皮尔逊相关距离作为样本相似程度的评价指标。传统的kmeans聚类往往采用欧几里得距离作为2个样本相似程度的评价指标,但是欧氏距离度量是欧几里得空间中两点间“普通”(即直线)距离,其粗糙度相对较大,且容易受个别异常数据或噪声的影响,导致聚类速度慢、聚类结果不够精确等问题。而本方法采用皮尔逊相关系数作为相似程度的评价指标,可适用于任何维度数据,并且速度更快,解决了无法有效识别相似性、尖峰处聚类效果差的问题。
对用户电力负荷数据的聚类步骤如下:
S1从步骤2中预处理后的分层次的电力负荷数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类;
S2计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里,平均皮尔逊相关距离公式如下:
这里pi是第i个负载曲线的平均值,pj是第j个负载曲线的平均值;T表示选取样本的数据点总数,t表示时间点;
S3调整聚类中心,将聚类的中心移动到聚类的几何中心处,也就是kmeans中的mean的含义;
S4重复第2、3步直到聚类的中心不再移动,此时算法收敛。
步骤4,根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。
根据kmeans聚类结果以及实际数据来源确定电力负荷剖面特征,在特定月数的时间内,每天在24小时的基础上分别聚类,确保表征过程能够捕获用户用电的每日、每月和季节性组成部分,使分析结果更精确且更具代表性。
方便考虑到不同用户每天、每周、每月、每季度的不同用电行为,结合聚类结果进行准确划分,使分析结果更精确且更具代表性,方便电力公司有依据有规律的调配电能,差异化电价。
基于BEMD和kmeans电力用户特征分析系统,该系统包括用户电力负荷数据模块、预处理模块、kmeans算法聚类模块、特征分析模块;用户电力负荷数据模块,用于获取用户电力负荷数据,并存储为数据库;预处理模块,用于从经验模态分解方法对电力负荷数据进行预处理;kmeans算法聚类模块,用于分层次的电力负荷数据进行kmeans算法聚类,其中取皮尔逊距离作为样本相似程度的评价指标;特征分析模块,用于根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。
用户电力负荷数据模块,由于用电采集系统中的每个电力用户都有着庞大且复杂的负荷数据,内部数据获取采取开放式接口的方式进行,并存储为数据库,同时对数据进行行业分类处理,粗略剔除异常数据。
预处理模块,提出在分析过程中采取经验模态分解法;
采用层次分离法改进BEMD,将用户用电数据图像提取不同层次的特征,尺度最小的细节部分被最先分离出来,以后分离出的图像尺度逐渐增大,最后剩余的部分是尺度最大的图像趋势信息;
改进BEMD做如下假设:
1)二维数据平面至少包含一个极大值点和一个极小值点或整个二维平面没有极值点但在进行一阶或几阶求导运算后能够出现一个极大值点和一个极小值点;
2)特征尺度用极值点之间距离的尺度定义;
其分解筛选过程如下:
记I(x,y)为待处理的数字图像,其极小值包络曲面EMIN(x,y)和极大值包络曲面EMAX(x,y)的代数均值记为E1(x,y),
它与原图像数据I(x,y)的差值定义为D1(x,y),
D1(x,y)=I(x,y)-E1(x,y) (2)
D1(x,y)是I(x,y)的一个中间过程值,重复上述过程k次,直到Dk(x,y)是一个内禀模态函数,此时有
D1(k-1)(x,y)-E1k(x,y)=D1k(x,y) (3)
定义C1(x,y)=D1k(x,y),则C1(x,y)即为分离出的第一个IMF;
确定一个准则用于每层筛分过程的停止,由限制标准差的尺寸SD完成;判断第i层IMF筛分结束的标准差判别函数为:
取SD≤0.3;
然后把C1(x,y)从原数据中分离得到余项R1(x,y),
I(x,y)-C1(x,y)=R1(x,y) (5)
将R1(x,y)作为新的数据,重复上述过程n次,得到最终的表达式:
其中I(x,y)为原图像数据,C1(x,y)是分解后得到的较小尺度细节信息,Rn(x,y)是得到的最终大尺度趋势项。
Kmeans算法聚类模块,具体包括:
S1从步骤2中预处理后的分层次的电力负荷数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类;
S2计算数据中所有的点到这k个点的距离,将点归到离其最近的聚类里,计算公式如下:
这里pi是第i个负载曲线的平均值,pj是第j个负载曲线的平均值;T表示选取样本的数据点总数,t表示时间点;
S3调整聚类中心,将聚类的中心移动到聚类的几何中心处,也就是kmeans中的mean的含义;
S4重复第2、3步直到聚类的中心不再移动,此时算法收敛。
特征分析模块,根据kmeans聚类结果以及实际数据来源确定电力负荷剖面特征,在特定月数的时间内,每天在24小时的基础上分别聚类,确保表征过程能够捕获用户用电的每日、每月和季节性组成部分,使分析结果更精确且更具代表性。
如图1所示,二维BEMD分解的过程,对于图像Ori的分解处理步骤如下:
步骤1,输入待处理图像;
步骤2,将图像映射到平面,图像对应像素点的灰度值作为Z坐标;
步骤3,通过形态学方法识别出图像Ori的局部极大和极小值;
步骤4,对这些空间散乱极值点进行平面delaunay三角剖分,再插值平滑得到上下包络曲面和,并求其均值;
步骤5,从输入数据中减去均值;
步骤6,是否满足每层筛选结束条件?是则转步骤7,否则转步骤3重复过程;
步骤7,将结果作为分解得到的第层细节信息;
步骤8,是否满足图像分解结束条件?是则输出各层结果并结束,否则转步骤9;
步骤9,从待处理图像中减去此层信息,转步骤1。
二维BEMD重复上面的筛分过程,从原始图像中减去先前的内禀模态函数,得到图像的残余信息。重复执行这个过程直到不再有内禀模态函数,仅仅保留下图像残留。这个残留图像通常表示一个缓慢变化的趋势。
如图2所示,kmeans算法的基本思想是:对于给定的聚类数目k,首先随机创建一个初始划分,即随机选择某些数据代表点作为初始聚类中心,根据其余数据点到各聚类中心的距离将其分到各个类中,然后重新确定新的聚类中心,以此类推采用迭代方法将聚类中心不断移动来尝试进一步改进划分,直到聚类中心不再发生变化。
聚类步骤如下:
步骤1,输入负荷曲线、最大集群数和AED阈值;
步骤2,随机设置运行次数,初始化集群k=2;
步骤3,从数据中随机抽取n个点作为初始聚类的中心,由这个中心代表各个聚类;
步骤4,计算数据中所有的点到这n个点的距离;
步骤5,调整聚类中心,即将聚类的中心移动到聚类的几何中心(即平均值)处;
步骤6,计算平均AED,如果平均AED<AED阈值转步骤7,否则判断是否到达最大集群数,若已达到转步骤7,未达到则集群数量+1转步骤3;
步骤7,将集群结果存储在专用阵列中;
步骤8,判断运行次数是否用尽,是则输出最佳聚类结果,在文本文件中保存相关数据,否则转步骤3。
如图3所示,BEMD算法图像循环步骤如下:
步骤1,输入原始图像;
步骤2,Sift特征提取;
步骤3,又筛选参数SD来判断是否为IMF分量;
步骤4,获得IMF图像;
步骤5,原始图像减去IMF分量获得剩余图像;
步骤6,判断平面极值是否存在,若存在转步骤2,若不存在输出余项图像。
如图4、图5、图6所示,构建一系列家用电PC’s,它们反映了家庭中用电的多种方式。PC是基于将许多不同的用电模式聚合在一起得出的,以非常不同的方式使使用电力的单个家庭聚集在一起,导致形成高度聚集的负载曲线。其具体是将智能电表数据用于基于家庭使用群集的用电模式对客户进行细分,产生了一系列PC,并通过多项逻辑回归将其与住宅和家庭特征相关联,例如户主(HoH)年龄和家庭(HH)构成。所使用的方法可以分为三个不同的部分:
阶段一:集群
首先,评估每种聚类技术是否适合分割数据。其次,确定适当数量的聚类以分割数据。最后,一旦确定了合适的聚类方法和聚类数量,就可以在六个月的时间内,每天在24小时的基础上分别聚类。这确保了表征过程可以捕获家庭中用电的每日、每月和季节性组成部分。
阶段二:电力负载PC表征
对特定日期的单个集群的用电需求进行平均(因为它代表类似的用电量模式),以创建集群的每日用电负荷曲线。将尺寸较小且在用电量和用电时间方面稍有不同的群集组合在一起(从而减少了类似形状轮廓的数量),以生产出一系列PC。这导致每个类别的向量大小为48×184个数据点,分别代表六个月内每天平均半小时用电。图3显示了单个用户的示意图,以及使用PC表征家庭日常用电的方式。
阶段三:客户PC分类
每个客户在特定日期使用的PC记录在客户类别索引(CCI)中。由于客户倾向于每天使用不同的电力,因此客户通常会在一段时间内使用多台PC。因此,CCI指数的统计模式用于确定六个月内大部分时间每个客户使用的PC。这样做是为了使多项式逻辑回归可以用来确定使用特定PC的具有个性特征(例如,住宅类型、卧室数量等)的客户的可能性。
Claims (10)
1.基于BEMD和kmeans电力用户特征分析方法,其特征在于:该方法包括:
步骤1,获取用户电力负荷数据,并存储为数据库;
步骤2,基于经验模态分解方法对电力负荷数据进行预处理;
步骤3,将分层次的电力负荷数据进行kmeans算法聚类,并选取皮尔逊距离作为样本相似程度的评价指标;
步骤4,根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。
2.根据权利要求1所述的基于BEMD和kmeans电力用户特征分析方法,其特征在于:用电采集系统中的每个电力用户都有着庞大且复杂的负荷数据,内部数据获取采取开放式接口的方式进行,并存储为数据库,同时对数据进行行业分类处理,粗略剔除异常数据。
3.根据权利要求1所述的基于BEMD和kmeans电力用户特征分析方法,其特征在于:步骤2中的对电力负荷数据的预处理,提出在分析过程中采取经验模态分解法;
采用层次分离法改进BEMD,将用户用电数据图像提取不同层次的特征,尺度最小的细节部分被最先分离出来,以后分离出的图像尺度逐渐增大,最后剩余的部分是尺度最大的图像趋势信息。
4.根据权利要求3所述的基于BEMD和kmeans电力用户特征分析方法,其特征在于:改进BEMD做如下假设:
1)二维数据平面至少包含一个极大值点和一个极小值点或整个二维平面没有极值点但在进行一阶或几阶求导运算后能够出现一个极大值点和一个极小值点;
2)特征尺度用极值点之间距离的尺度定义;
其分解筛选过程如下:
记I(x,y)为待处理的数字图像,其极小值包络曲面EMIN(x,y)和极大值包络曲面EMAX(x,y)的代数均值记为E1(x,y),
它与原图像数据I(x,y)的差值定义为D1(x,y),
D1(x,y)=I(x,y)-E1(x,y) (2)
D1(x,y)是I(x,y)的一个中间过程值,重复上述过程k次,直到Dk(x,y)是一个内禀模态函数,此时有
D1(k-1)(x,y)-E1k(x,y)=D1k(x,y) (3)
定义C1(x,y)=D1k(x,y),则C1(x,y)即为分离出的第一个IMF;
确定一个准则用于每层筛分过程的停止,由限制标准差的尺寸SD完成;判断第i层IMF筛分结束的标准差判别函数为:
取SD≤0.3;
然后把C1(x,y)从原数据中分离得到余项R1(x,y),
I(x,y)-C1(x,y)=R1(x,y) (5)
将R1(x,y)作为新的数据,重复上述过程n次,得到最终的表达式:
其中I(x,y)为原图像数据,C1(x,y)是分解后得到的较小尺度细节信息,Rn(x,y)是得到的最终大尺度趋势项。
6.根据权利要求1所述的基于BEMD和kmeans电力用户特征分析方法,其特征在于:根据kmeans聚类结果以及实际数据来源确定电力负荷剖面特征,在特定月数的时间内,每天在24小时的基础上分别聚类,确保表征过程能够捕获用户用电的每日、每月和季节性组成部分,使分析结果更精确且更具代表性。
7.基于BEMD和kmeans电力用户特征分析系统,其特征在于:该系统包括用户电力负荷数据模块、预处理模块、kmeans算法聚类模块、特征分析模块;
用户电力负荷数据模块,用于获取用户电力负荷数据,并存储为数据库;
预处理模块,用于从经验模态分解方法对电力负荷数据进行预处理;
kmeans算法聚类模块,用于分层次的电力负荷数据进行kmeans算法聚类,其中取皮尔逊距离作为样本相似程度的评价指标;
特征分析模块,用于根据kmeans聚类结果和实际用户用电特点针对不同时间区间进行特征分析。
8.根据权利要求7所述的基于BEMD和kmeans电力用户特征分析系统,其特征在于:用户电力负荷数据模块,由于用电采集系统中的每个电力用户都有着庞大且复杂的负荷数据,内部数据获取采取开放式接口的方式进行,并存储为数据库,同时对数据进行行业分类处理,粗略剔除异常数据;
预处理模块,提出在分析过程中采取经验模态分解法;
采用层次分离法改进BEMD,将用户用电数据图像提取不同层次的特征,尺度最小的细节部分被最先分离出来,以后分离出的图像尺度逐渐增大,最后剩余的部分是尺度最大的图像趋势信息;
改进BEMD做如下假设:
1)二维数据平面至少包含一个极大值点和一个极小值点或整个二维平面没有极值点但在进行一阶或几阶求导运算后能够出现一个极大值点和一个极小值点;
2)特征尺度用极值点之间距离的尺度定义;
其分解筛选过程如下:
记I(x,y)为待处理的数字图像,其极小值包络曲面EMIN(x,y)和极大值包络曲面EMAX(x,y)的代数均值记为E1(x,y),
它与原图像数据I(x,y)的差值定义为D1(x,y),
D1(x,y)=I(x,y)-E1(x,y) (2)
D1(x,y)是I(x,y)的一个中间过程值,重复上述过程k次,直到Dk(x,y)是一个内禀模态函数,此时有
D1(k-1)(x,y)-E1k(x,y)=D1k(x,y) (3)
定义C1(x,y)=D1k(x,y),则C1(x,y)即为分离出的第一个IMF;
确定一个准则用于每层筛分过程的停止,由限制标准差的尺寸SD完成;判断第i层IMF筛分结束的标准差判别函数为:
取SD≤0.3;
然后把C1(x,y)从原数据中分离得到余项R1(x,y),
I(x,y)-C1(x,y)=R1(x,y) (5)
将R1(x,y)作为新的数据,重复上述过程n次,得到最终的表达式:
其中I(x,y)为原图像数据,C1(x,y)是分解后得到的较小尺度细节信息,Rn(x,y)是得到的最终大尺度趋势项。
10.根据权利要求7所述的基于BEMD和kmeans电力用户特征分析系统,其特征在于:特征分析模块,根据kmeans聚类结果以及实际数据来源确定电力负荷剖面特征,在特定月数的时间内,每天在24小时的基础上分别聚类,确保表征过程能够捕获用户用电的每日、每月和季节性组成部分,使分析结果更精确且更具代表性。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010266639 | 2020-04-07 | ||
CN202010266639X | 2020-04-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111898857A true CN111898857A (zh) | 2020-11-06 |
Family
ID=73206377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010571026.7A Pending CN111898857A (zh) | 2020-04-07 | 2020-06-22 | 基于BEMD和kmeans电力用户特征分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111898857A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948456A (zh) * | 2021-01-19 | 2021-06-11 | 宁夏大学 | 一种基于EMD和Pearson互相关系数的异常用电行为检测方法 |
CN113469917A (zh) * | 2021-07-14 | 2021-10-01 | 上海影卓信息科技有限公司 | 基于形态学清除图像噪声的方法、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839197A (zh) * | 2014-03-19 | 2014-06-04 | 国家电网公司 | 一种基于eemd方法的用户用电行为异常的判定方法 |
CN104766090A (zh) * | 2015-03-17 | 2015-07-08 | 山东工商学院 | 一种基于bemd和sofm的探地雷达数据可视化方法 |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN110069467A (zh) * | 2019-04-16 | 2019-07-30 | 沈阳工业大学 | 基于皮尔逊系数与MapReduce并行计算的电网尖峰负荷聚类提取法 |
CN110781332A (zh) * | 2019-10-16 | 2020-02-11 | 三峡大学 | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 |
-
2020
- 2020-06-22 CN CN202010571026.7A patent/CN111898857A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839197A (zh) * | 2014-03-19 | 2014-06-04 | 国家电网公司 | 一种基于eemd方法的用户用电行为异常的判定方法 |
CN104766090A (zh) * | 2015-03-17 | 2015-07-08 | 山东工商学院 | 一种基于bemd和sofm的探地雷达数据可视化方法 |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN110069467A (zh) * | 2019-04-16 | 2019-07-30 | 沈阳工业大学 | 基于皮尔逊系数与MapReduce并行计算的电网尖峰负荷聚类提取法 |
CN110781332A (zh) * | 2019-10-16 | 2020-02-11 | 三峡大学 | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 |
Non-Patent Citations (3)
Title |
---|
周欣: ""二维经验模式分解(BEMD)在图像处理中的应用"", 《中国优秀硕士学位论文全文数据库信息科技辑》, pages 138 - 828 * |
朱天博;傅军;杨一帆;孙志杰;周辛南;: "基于用电信息采集系统用户负荷特性聚类分析", 电测与仪表, no. 1 * |
陈文辉;李峰;蔡碧野;: "基于快速二维经验模态分解的纹理分割", 计算机工程与设计, no. 15 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112948456A (zh) * | 2021-01-19 | 2021-06-11 | 宁夏大学 | 一种基于EMD和Pearson互相关系数的异常用电行为检测方法 |
CN112948456B (zh) * | 2021-01-19 | 2022-03-11 | 宁夏大学 | 一种基于EMD和Pearson互相关系数的异常用电行为检测方法 |
CN113469917A (zh) * | 2021-07-14 | 2021-10-01 | 上海影卓信息科技有限公司 | 基于形态学清除图像噪声的方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610280B (zh) | 一种电力负荷短期预测方法、模型、装置及系统 | |
Si et al. | Electric load clustering in smart grid: Methodologies, applications, and future trends | |
Li et al. | Classification of energy consumption in buildings with outlier detection | |
Alzate et al. | Improved electricity load forecasting via kernel spectral clustering of smart meters | |
Räsänen et al. | Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
Rajabi et al. | A review on clustering of residential electricity customers and its applications | |
Khan et al. | Segmentation of factories on electricity consumption behaviors using load profile data | |
Ferraro et al. | Comparison and clustering analysis of the daily electrical load in eight European countries | |
CN110188221B (zh) | 一种基于形状距离的负荷曲线层次聚类方法 | |
CN111612228A (zh) | 一种基于用电信息的用户用电行为分析方法 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
Wang et al. | Short-term industrial load forecasting based on ensemble hidden Markov model | |
CN112819299A (zh) | 一种基于中心优化的差分K-means负荷聚类方法 | |
CN111898857A (zh) | 基于BEMD和kmeans电力用户特征分析方法及系统 | |
CN110866841A (zh) | 基于双聚类法的电力用户行业维度用电模式辨识分析方法及系统 | |
Shamim et al. | Multi-domain feature extraction for improved clustering of smart meter data | |
Cugliari et al. | Disaggregated electricity forecasting using wavelet-based clustering of individual consumers | |
Li et al. | A mixed-integer programming approach for industrial non-intrusive load monitoring | |
CN113094448B (zh) | 住宅空置状态的分析方法及分析装置、电子设备 | |
Arco et al. | Clustering methodology for smart metering data based on local and global features | |
CN114372835B (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
CN107704723A (zh) | 一种基于斜率关联度的显著变量选择方法 | |
CN109493249B (zh) | 一种用电数据在多时间尺度上的分析方法 | |
Ugarte et al. | Characterization of load curves in a real distribution system based on K-MEANS algorithm with time-series data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |