CN115221980A - 一种基于特征提取和改进K-means算法的负荷聚类方法 - Google Patents
一种基于特征提取和改进K-means算法的负荷聚类方法 Download PDFInfo
- Publication number
- CN115221980A CN115221980A CN202211127930.4A CN202211127930A CN115221980A CN 115221980 A CN115221980 A CN 115221980A CN 202211127930 A CN202211127930 A CN 202211127930A CN 115221980 A CN115221980 A CN 115221980A
- Authority
- CN
- China
- Prior art keywords
- load
- clustering
- data
- means algorithm
- feature extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000000605 extraction Methods 0.000 title claims abstract description 16
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000012512 characterization method Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000009191 jumping Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000005611 electricity Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于特征提取和改进K‑means算法的负荷聚类方法,涉及电力系统负荷聚类的技术领域,包含以下步骤:输入电力负荷数据,进行数据预处理,计算负荷特征指标,采用奇异值分解法对负荷数据降维,得到负荷特征指标表征权重,实用降维后的负荷数据,采用考虑密度的改进K‑means算法进行负荷聚类,本发明解决了目前负荷聚类方法存在的聚类结果不稳定、有丢失原始负荷重要特征的风险以及计算复杂度较高的问题,为下一步进行负荷预测、储能容量配置、需求侧管理等提供有效量化参考。
Description
技术领域
本发明涉及电力系统负荷聚类的技术领域,具体涉及一种基于特征提取和改进K-means算法的负荷聚类方法。
背景技术
智能电网拥有强大的信息捕捉能力,为电力资源的优化配置、电网安全稳定运行和清洁能源的高效利用提供数据支撑。其中,智能电表定期记录了大量用户负荷数据,这些负荷曲线有助于刻画用户行为画像,反映用户的用电特征。这些用电数据若能被合理提取和分类,可为电力用户和供电公司提供有效的负荷管理信息。对用户来说,了解自身用电特点后,可以根据市场电价适当调整自身用电习惯;对供电公司来说,对负荷进行聚类分析有利于实现资源的有效配置、电价的灵活调节和科学的需求侧管理。
目前的负荷聚类方法主要分为直接聚类和间接聚类。直接聚类相对简单,但是存在聚类对象过多,聚类结果不稳定的问题;间接聚类则先提取负荷数据特征后进行聚类,常用主成分分析法提取负荷特征,但是该方法需要先对原始负荷特征做零均值化处理,有丢失原始负荷重要特征的风险,此外,计算协方差矩阵的特征向量也使得该方法的复杂度较高,不利于计算的稳定性。
发明内容
针对现有技术的不足,本发明提供了一种基于特征提取和改进K-means算法的负荷聚类方法,解决了上述背景技术中提出的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种基于特征提取和改进K-means算法的负荷聚类方法,包含以下步骤:
S1:输入电力负荷数据,进行数据预处理,得到处理后的电力负荷数据;
S2:计算负荷特征指标;
S3:采用奇异值分解法对负荷数据降维,得到负荷特征指标表征权重;
S4:根据负荷特征指标表征权重,使用降维后的负荷数据,采用考虑密度的改进K-means算法进行负荷聚类。
作为优选,所述步骤S1中对数据的预处理包括以下步骤:
S1.1:输入原始负荷数据,判断每一个用户日负荷数据是否存在数据缺失,若存在数据缺失则进行步骤S1.2,否则进行步骤S1.3;
S1.2:计算该用户数据缺失率,并将所述数据缺失率与设定的阈值比较,若该用户数据缺失率大于等于所述阈值,则判断该样本数据无效,对该样本做删除处理;若该用户数据缺失率小于所述阈值,则采用相邻点的平均值替换法将缺失数据补齐;
S1.4:采用相邻点的平均值替换法对存在极端跳变情况的数据进行修正;
S1.5:采用max-min法对负荷数据做归一化处理。
作为优选,所述S1.2中设定的阈值为40%。
作为优选,所述步骤S2中的负荷特征指标包括日最大负荷、日最小负荷、日平均负荷、日负荷率、日峰谷差率、负荷变异系数、峰时负载率、平时负载率、谷时负载率。
作为优选,所述步骤S3中采用奇异值分解法对负荷数据降维,具体包括:
S3.1:输入m个负荷的s个特性,并用矩阵A表示;
S3.2:对矩阵A进行奇异值λ i 求解;
S3.3:将奇异值λ i 从大到小进行排序,取前l个对应特征值;
S3.4:采用max-min法对前l个对应特征值进行归一化处理,得到各特征指标表征权重。
作为优选,所述步骤S3.1中的m、s均为大于1的自然数。
作为优选,所述步骤S4中考虑密度的改进K-means算法,具体包括:
S4.1:输入m个用户l维特征负荷数据;
S4.2:计算聚类对象之间的距离;
S4.3:提取聚类对象中高密度的负荷数据点;
S4.4:比较各聚类对象的密度,以密度最高的点作为聚类初始中心。
S4.5:选取距离该初始聚类中心最远的点作为第二个聚类中心,并以此类推,形成聚类中心候选点;
S4.6:计算各聚类对象到初始聚类中心的距离,进行初始聚类;
S4.7:计算各聚类对象到聚类中心候选点的距离,若附近数据点数量达不到要求数量则重选中心;
S4.8:计算各聚类对象到聚类中心距离的和方差,若满足条件则停止,形成最终聚类方案;若不满足,则重复步骤S4.6和步骤S4.7。
本发明针对目前负荷聚类方法存在的聚类结果不稳定、有丢失原始负荷重要特征的风险以及计算复杂度较高等问题,提供一种基于特征提取和改进K-means算法的负荷聚类方法,通过输入电力负荷数据,进行数据预处理,计算负荷特征指标,采用奇异值分解法对负荷数据降维,得到负荷特征指标表征权重,实用降维后的负荷数据,最后采用考虑密度的改进K-means算法进行负荷聚类,聚类结果稳定,计算复杂度低,为下一步进行负荷预测、储能容量配置、需求侧管理等提供有效量化参考;本发明的方法可靠性高,容易操作,便于推广。
附图说明
图1为本发明的负荷聚类方法的流程图;
图2为本发明的负荷数据预处理的流程图;
图3为本发明的奇异值分解法对负荷数据降维的流程图;
图4为本发明的考虑密度的改进K-means算法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
如图1所示,本发明的一种基于特征提取和改进K-means算法的负荷聚类方法,包含以下步骤:
S1:输入电力负荷数据,进行数据预处理,得到处理后的电力负荷数据;
S2:计算负荷特征指标;
S3:采用奇异值分解法对负荷数据降维,得到负荷特征指标表征权重;
S4:根据负荷特征指标表征权重,使用降维后的负荷数据,采用考虑密度的改进K-means算法进行负荷聚类。
其中,步骤S1中对负荷数据的预处理方法如图2所示,包含以下步骤:
S1.1:输入原始负荷数据,判断每一个用户日负荷数据是否存在数据缺失,若存在数据缺失则进行步骤S1.2,否则进行步骤S1.3;
S1.2:计算该用户数据缺失率,判断数据缺失率是否≥40%,若≥40%则判断该样本数据无效,对该样本做删除处理;若该用户数据缺失率<40%,则采用相邻点的平均值替换法将缺失数据补齐;
所述相邻点的平均值替换法计算方式为
其中,p(t)、p(t-1) 、p(t+1) 分别表示缺失点负荷、缺失点前一采样点负荷和缺失点后一采样点负荷;
若存在极端跳变情况则进行步骤S1.4;否则进行步骤S1.5。
S1.4:采用相邻点的平均值替换法对存在极端跳变情况的数据进行修正;
S1.5:采用max-min法对负荷数据做归一化处理;
所述max-min法的计算方式为
其中,x*为该用户归一化后的负荷数据,x为该用户原始负荷数据,min(x)和max(x)分别为所有用户日负荷数据中的最小值和最大值。
所述步骤S2中计算的负荷特征指标包括日最大负荷、日最小负荷、日平均负荷、日负荷率、日峰谷差率、负荷变异系数、峰时负载率、平时负载率、谷时负载率。
各特征指标计算方式如下:
1)日最大负荷
2)日最小负荷
3)日平均负荷
4)日负荷率
5)日峰谷差率
6)负荷变异系数
7)峰时负载率
8)平时负载率
9)谷时负载率
其中,为最大负荷;为最小负荷;为平均负荷,n为采集点总数,为所有采集点所得负荷总量;为日负荷标准差;、和分别为峰时、平时、谷时的平均负荷;、分别为第i、k个采集点的负荷;、、分别为峰时、平时、谷时的采集点数量。
如图3所示,所述的步骤S3中采用奇异值分解法对负荷数据降维,具体如下:
S3.1:输入m个负荷的s个特性(m, s>1),用矩阵A表示,即
S3.2:对矩阵A进行奇异值λ i 求解,即
S3.3:将奇异值λ i 从大到小进行排序,取前l个对应特征值。
l的计算方式如下:
如图4所示,所述步骤S4中采用考虑密度的改进K-means算法进行负荷聚类,具体如下:
S4.1:输入m个用户l维特征负荷数据,每个聚类对象可表示为
S4.2:计算聚类对象之间的距离,计算方法为
其中,d(x i ,x j )表示聚类对象x i 和聚类对象x j 之间的各特征指标表征权重计算的加权距离;D(x i )为x i 与最近N个聚类对象的平均距离,可采用最小化和方差的方式对N进行参数调整。
所述和方差SSE的计算方式为
S4.3:提取聚类对象中高密度的负荷数据点,数据密度的计算方法为
其中,为聚类对象x i 的密度表示;X为全体负荷数据集合;d(x i ,p)表示x i 与周围点之间的距离;r为符合条件的半径。
S4.5:选取距离该初始聚类中心最远的点作为第二个聚类中心,并以此类推,形成聚类中心候选点。
S4.6:计算各聚类对象到初始聚类中心的距离,进行初始聚类。
S4.7:计算各聚类对象到聚类中心候选点的距离,若附近数据点数量达不到要求数量则重选中心。
S4.8:计算和方差,若满足条件则停止,形成最终聚类方案;若不满足,则重复步骤S4.6和步骤S4.7。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于,包含以下步骤:
S1:输入电力负荷数据,进行数据预处理,得到处理后的电力负荷数据;
S2:计算负荷特征指标;
S3:采用奇异值分解法对负荷数据降维,得到负荷特征指标表征权重;
S4:根据负荷特征指标表征权重,使用降维后的负荷数据,采用考虑密度的改进K-means算法进行负荷聚类。
2.根据权利要求1所述的一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于,所述步骤S1中对数据的预处理包括以下步骤:
S1.1:输入原始负荷数据,判断每一个用户日负荷数据是否存在数据缺失,若存在数据缺失则进行步骤S1.2,否则进行步骤S1.3;
S1.2:计算该用户数据缺失率,并将所述数据缺失率与设定的阈值比较,若该用户数据缺失率大于等于所述阈值,则判断该样本数据无效,对该样本做删除处理;若该用户数据缺失率小于所述阈值,则采用相邻点的平均值替换法将缺失数据补齐;
S1.4:采用相邻点的平均值替换法对存在极端跳变情况的数据进行修正;
S1.5:采用max-min法对负荷数据做归一化处理。
3.根据权利要求1所述的一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于:所述S1.2中设定的阈值为40%。
4.根据权利要求1所述的一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于:所述步骤S2中的负荷特征指标包括日最大负荷、日最小负荷、日平均负荷、日负荷率、日峰谷差率、负荷变异系数、峰时负载率、平时负载率、谷时负载率。
5.根据权利要求1所述的一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于,所述步骤S3中采用奇异值分解法对负荷数据降维,具体包括:
S3.1:输入m个负荷的s个特性,并用矩阵A表示;
S3.2:对矩阵A进行奇异值λ i 求解;
S3.3:将奇异值λ i 从大到小进行排序,取前l个对应特征值;
S3.4:采用max-min法对前l个对应特征值进行归一化处理,得到各特征指标表征权重。
6.根据权利要求5所述的一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于:所述步骤S3.1中的m、s均为大于1的自然数。
7.根据权利要求1所述的一种基于特征提取和改进K-means算法的负荷聚类方法,其特征在于,所述步骤S4中考虑密度的改进K-means算法,具体包括:
S4.1:输入m个用户l维特征负荷数据;
S4.2:计算聚类对象之间的距离;
S4.3:提取聚类对象中高密度的负荷数据点;
S4.4:比较各聚类对象的密度,以密度最高的点作为聚类初始中心;
S4.5:选取距离该初始聚类中心最远的点作为第二个聚类中心,并以此类推,形成聚类中心候选点;
S4.6:计算各聚类对象到初始聚类中心的距离,进行初始聚类;
S4.7:计算各聚类对象到聚类中心候选点的距离,若附近数据点数量达不到要求数量则重选中心;
S4.8:计算各聚类对象到聚类中心距离的和方差,若满足条件则停止,形成最终聚类方案;若不满足,则重复步骤S4.6和步骤S4.7。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211127930.4A CN115221980A (zh) | 2022-09-16 | 2022-09-16 | 一种基于特征提取和改进K-means算法的负荷聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211127930.4A CN115221980A (zh) | 2022-09-16 | 2022-09-16 | 一种基于特征提取和改进K-means算法的负荷聚类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115221980A true CN115221980A (zh) | 2022-10-21 |
Family
ID=83617577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211127930.4A Pending CN115221980A (zh) | 2022-09-16 | 2022-09-16 | 一种基于特征提取和改进K-means算法的负荷聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115221980A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及系统 |
CN109543046A (zh) * | 2018-11-16 | 2019-03-29 | 重庆邮电大学 | 一种基于深度学习的机器人数据互操作领域本体构建方法 |
CN110853655A (zh) * | 2018-08-20 | 2020-02-28 | 北京航天长峰科技工业集团有限公司 | 一种基于K-means算法的声纹模型初始方法 |
CN111126429A (zh) * | 2019-11-10 | 2020-05-08 | 国网浙江省电力有限公司 | 一种基于PCA降维和K-Means聚类的低压台区用户接入点识别方法 |
CN111123039A (zh) * | 2019-12-31 | 2020-05-08 | 国网北京市电力公司 | 基于同期特征与改进K-means聚类的配电网异常线损诊断方法 |
CN113159087A (zh) * | 2020-12-30 | 2021-07-23 | 国网河南省电力公司南阳供电公司 | 基于海量负荷数据的居民用电行为辨识分析和管理方法 |
CN114548711A (zh) * | 2022-02-09 | 2022-05-27 | 四川大学 | 基于模糊综合评价法的梯级水库水文生态调度效果评估方法 |
-
2022
- 2022-09-16 CN CN202211127930.4A patent/CN115221980A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108776939A (zh) * | 2018-06-07 | 2018-11-09 | 上海电气分布式能源科技有限公司 | 用户用电行为的分析方法及系统 |
CN110853655A (zh) * | 2018-08-20 | 2020-02-28 | 北京航天长峰科技工业集团有限公司 | 一种基于K-means算法的声纹模型初始方法 |
CN109543046A (zh) * | 2018-11-16 | 2019-03-29 | 重庆邮电大学 | 一种基于深度学习的机器人数据互操作领域本体构建方法 |
CN111126429A (zh) * | 2019-11-10 | 2020-05-08 | 国网浙江省电力有限公司 | 一种基于PCA降维和K-Means聚类的低压台区用户接入点识别方法 |
CN111123039A (zh) * | 2019-12-31 | 2020-05-08 | 国网北京市电力公司 | 基于同期特征与改进K-means聚类的配电网异常线损诊断方法 |
CN113159087A (zh) * | 2020-12-30 | 2021-07-23 | 国网河南省电力公司南阳供电公司 | 基于海量负荷数据的居民用电行为辨识分析和管理方法 |
CN114548711A (zh) * | 2022-02-09 | 2022-05-27 | 四川大学 | 基于模糊综合评价法的梯级水库水文生态调度效果评估方法 |
Non-Patent Citations (1)
Title |
---|
陈页: "考虑需求响应的微电网云储能优化配置研究_陈页 -20210815", 《CNKI》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109376772B (zh) | 一种基于神经网络模型的电力负荷组合预测方法 | |
CN111489188B (zh) | 一种居民可调负荷潜力挖掘方法及系统 | |
CN104063480A (zh) | 一种基于电力大数据的负荷曲线并行聚类方法 | |
CN110245783B (zh) | 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法 | |
CN110119948B (zh) | 基于时变权重动态组合的电力用户信用评价方法及系统 | |
CN111709554A (zh) | 一种配电网净负荷联合预测的方法及系统 | |
CN115423013A (zh) | 电力系统运行方式分类方法、装置、设备及介质 | |
CN107591803A (zh) | 一种基于需求响应的电力负荷行为预测方法 | |
CN103761568A (zh) | 基于som神经网络聚类算法的日负荷特征曲线提取方法 | |
CN111754091A (zh) | 一种电力用户需求侧调控系统 | |
CN114880939A (zh) | 一种动力电池寿命的智能预测方法及装置 | |
CN111553720A (zh) | 基于改进k-means算法的用户用电行为分析方法 | |
CN110503145A (zh) | 一种基于k-shape聚类的典型负荷曲线获取方法 | |
CN115221980A (zh) | 一种基于特征提取和改进K-means算法的负荷聚类方法 | |
CN111967919A (zh) | 一种基于自回归和自适应提升算法的居民用电行为分析的系统及方法 | |
CN112085290A (zh) | 一种区域配电网设备资产绩效水平优化方法 | |
CN116094050A (zh) | 基于边远区域负荷配电网电力电量优化方法、系统、应用 | |
CN111932138A (zh) | 一种基于高斯混合模型和期望极大算法的居民用电行为分析的系统及方法 | |
CN112711913B (zh) | 基于粒度支持向量机的冷热电短期负荷预测系统及方法 | |
CN114820047A (zh) | 基于电能质量监测数据的多元用户用电需求画像方法 | |
CN111915116A (zh) | 一种基于K-means聚类的电力居民用户分类方法 | |
CN113191630A (zh) | 基于大数据的费控策略推荐方法 | |
CN111967980A (zh) | 一种基于企业财报和能耗数据采用最大熵模型进行银行授信分析的系统及方法 | |
CN111539839B (zh) | 渔业电力用户用电精准化管理方法 | |
CN116109009B (zh) | 基于多特征量提取的光储型园区负荷曲线动态识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221021 |