CN107274025A - 一种实现用电模式智能识别与管理的系统和方法 - Google Patents
一种实现用电模式智能识别与管理的系统和方法 Download PDFInfo
- Publication number
- CN107274025A CN107274025A CN201710474710.1A CN201710474710A CN107274025A CN 107274025 A CN107274025 A CN 107274025A CN 201710474710 A CN201710474710 A CN 201710474710A CN 107274025 A CN107274025 A CN 107274025A
- Authority
- CN
- China
- Prior art keywords
- sample
- mrow
- client
- cluster
- power information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 32
- 238000003909 pattern recognition Methods 0.000 claims abstract description 13
- 239000000284 extract Substances 0.000 claims abstract description 5
- 230000005611 electricity Effects 0.000 claims description 110
- 238000000605 extraction Methods 0.000 claims description 57
- 238000007726 management method Methods 0.000 claims description 33
- 238000005201 scrubbing Methods 0.000 claims description 20
- 238000000265 homogenisation Methods 0.000 claims description 17
- 238000012216 screening Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 14
- 238000007689 inspection Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000001502 supplementing effect Effects 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 5
- 230000006855 networking Effects 0.000 claims description 3
- 230000005612 types of electricity Effects 0.000 abstract description 2
- 238000009826 distribution Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 241000854350 Enicospilus group Species 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供了一种实现用电模式智能识别与管理的系统和方法。本申请针对各行业各类型用电客户预先建立代表性客户样本群,并且针对该群建立和修正分类架构表;针对代表性客户样本群提取其特征属性代表值;进而,对于模式识别所针对的全体客户对象,可以利用各种聚类算法执行聚类,并且提取各个客户子群的特征属性值;利用针对代表性客户样本群提取其特征属性代表值为参照,对各种聚类算法所产生的客户子群的特征属性值进行置信验证;选取置信验证结果最好的客户子群作为用电管理的依据。
Description
技术领域
本发明涉及智能配电技术,更具体地,涉及一种实现用电模式智能识别与管理的系统和方法。
背景技术
随着配电网智能化程度的提升,联网电能表、专用用电数据采集终端等设备日益广泛普及,对用电负荷数据进行采集的硬件基础已经完善。因而,针对用电客户侧的用电模式实现识别也成为了一个新兴的技术手段,在配电的科学化、精确化管理当中,该技术可以发挥非常重要的作用。
用电负荷模式识别的主要目标是分析单一或者群组用电客户的用电规律,并基于该规律对客户用电实施可预测的、有针对性的调控管理。举例来说,可以基于一定区域内主要用电客户的用电模式对未来用电量进行短期预测,从而经济合理的安排发电机组的运转、调节蓄能指标、安排停机轮休计划、减少不必要的备用容量。在企业错峰用电计划制定过程中,通过参照企业用电模式的识别结论,使错峰用电安排与企业自身的用电习惯具有较高的一致性,降低给企业正常生产的干扰,使得错峰调控任务量与错峰企业实际发生用电总量相匹配。通过对用电客户的用电模式识别,还可以实现对用电客户的准确分类,将电价制定与用电习惯相联系,优化电价费率政策在指导节约用电方面的作用;发现超常规用电的异常行为,为打击非法用电提供辅助依据。
现有技术中对于客户用电模式的识别一般采用以聚类为核心的算法。聚类算法将具有用电模式共性的客户归为一类,再针对某一类客户研究其用电变化规律和适宜的管理策略。例如,公开号CN105184402的中国专利文献“一种基于决策树的个性化用户短期负荷预测算法”公开了以下步骤:1、对用户负荷进行波动分量辨识,判断其锯齿形波动是否显著;如果显著将进入波动分量提取环节,再得出用电模式数;如果不显著,则将直接得出用电模式数。针对用电模式数大于7种的用户采用最近日负荷预测法。针对用电模式数在2种~6种的用户采用基于用电模式挖掘的用户侧短期负荷预测法。针对用电模式数只有1种的用户采用聚类预测还原法。通过对用户历史负荷进行数据挖掘,从而提取出用户用电模式,根据模式数的多少,建立基于决策树的个性化用户短期负荷预测算法,实现精确的用户短期负荷预测。又例如,公开号CN106529707的中国专利文献“一种负荷用电模式识别方法”公开了以下步骤:以采样时间间隔T对用电负荷进行采集,得到L天时间内对应的L条日负荷曲线;对得到的日负荷曲线进行基于密度的空间聚类,得到典型负荷用电模式;提取描述用户在不同时间尺度下用电行为的特征;利用引力搜索算法对提取得到的用户用电特征进行聚类;重复聚类,利用聚类评价指标对聚类结果进行评价,并选出最优聚类结果即负荷用电模式的识别结果。
实践证明,在面向实际应用中,海量客户的用电模式差异是非常明显的。在现有技术中,对适当聚类算法的选取和对其模式识别结果的置信评估是用电模式识别技术的一个难点。首先,聚类算法有效的一个隐性前提在于被分类对象的宏观分布符合该聚类算法适用的规律,例如,KMEANS聚类算法对于球形分布的对象分类效果比较好,但是对于其他分布规律的对象就无法呈现出同等有效的计算结果。同样,高斯混合聚类算法也只对于呈现高斯正态分布的对象效果较好。不同季节、不同地域的用电模式数据分布规律变化很大,难以总是保证聚类算法与对象客户的用电模式具有良好的匹配。而且,不同类别的用电客户之间的数量差距很大,某一类用电客户有可能只有几家,而另一类用电客户可能就存在成百上千家,聚类算法对于这种类与类之间数量差别巨大的情形往往不能良好应对,分类混同的概率加大。聚类算法往往还要依赖预设的类总数量来实施分类,例如KMEANS算法要求输入最终分成几个类,再按照该输入的数量去进行分类,而某个地域的用电客户究竟有几个类型也是不容易确定的。聚类算法本身也不具备评估聚类结果的能力。再有就是,由于用电模式数据的多变性,聚类分析结论的稳定性不高,导致对客户用电模式的识别结论变动频繁,给基于识别结果的用电管理带来了困难。
发明内容
基于现有技术的以上需求及不足,本申请提出一种实现用电模式智能识别与管理的系统和方法。本申请针对各行业各类型用电客户预先建立代表性客户样本群,并且针对该群建立和修正分类架构表;针对代表性客户样本群提取其特征属性代表值;进而,对于模式识别所针对的全体客户对象,可以利用各种聚类算法执行聚类,并且提取各个客户子群的特征属性值;利用针对代表性客户样本群提取其特征属性代表值为参照,对各种聚类算法所产生的客户子群的特征属性值进行置信验证;选取置信验证结果最好的客户子群作为用电管理的依据。
本发明所述的用电模式智能识别与管理方法,其特征在于,包括以下步骤:
代表性客户样本群聚类及特征提取步骤:从用电客户中建立代表性客户样本群;实时联网采集代表性客户样本群当中每个用电客户代表在预定时间长度内的用电信息曲线样本;对用电信息曲线样本执行数据清理和量度均一化作业,提取用电信息曲线样本的特征属性;进而,对用电信息曲线样本基于所述特征属性以及初始的分类架构表进行初步聚类,将代表性客户样本群划分为若干个代表性客户样本子群;对代表性客户样本子群执行群一致性检验,若检验不通过则调整分类架构表后重新执行初步聚类,直至检验通过;若检验通过,则记录子群数,并进入精细化筛选步骤;对各个代表性客户样本子群进行精细化筛选,取得代表性客户特征提取目标群;针对代表性客户特征提取目标群,建立平均拟合用电信息曲线样本,从该平均拟合用电信息曲线样本当中提取各个代表性客户样本子群的特征属性代表值;
用电客户聚类及特征属性提取步骤,获得作为用电模式识别对象的全体用电客户的用电信息曲线;对用电信息曲线执行数据清理和量度均一化作业;按照代表性客户样本群聚类及特征提取步骤所确定的子群数,采用第一聚类算法对用电信息曲线执行聚类,将全体用电客户划分为若干个客户子群;根据每个客户子群下的用电客户的用电信息曲线,建立平均拟合用电信息曲线,从平均拟合用电信息曲线当中提取各个客户子群的特征属性值;
聚类置信度验证步骤:基于各个代表性客户样本子群的特征属性代表值与各个客户子群的特征属性值,执行聚类置信度的收敛性验证;若验证不通过,则返回用电客户聚类及特征属性提取步骤,更新为第二聚类算法对用电信息曲线重新执行聚类而划分若干个客户子群;若验证通过,则进入预测管理步骤;
群管理步骤,根据各个客户子群及其用电信息数据,制定面向该客户子群的用电管理方案。
优选的是,代表性客户样本群聚类及特征提取步骤当中,以预定时间长度上的各个采样时间点作为X坐标值,以各个采样时间点处的用电信息记录值作为Y坐标轴,为每个代表性客户样本群当中的每一个用电客户代表建立该预定时间长度内的用电信息曲线样本。
优选的是,代表性客户样本群聚类及特征提取步骤和用电客户聚类及特征属性提取步骤当中,执行的数据清理包括丢失数据补全;其中,如果第i个采样点处的用电负荷值Li丢失,则用以下内插公式计算该采样点i处的用电负荷值Li:
优选的是,代表性客户样本群聚类及特征提取步骤和用电客户聚类及特征属性提取步骤当中,执行的数据清理包括极端数据剔除;判断存在正、负尖峰极端数据的步骤为:判断是否存在以下关系
即采样点i处的用电负荷值Li相对于其前、后相邻采样点用电负荷值的变化量绝对值中的最大值大于该采样点i前、后一定数量的采样点处用电负荷值的均值与一个预定因数α的乘积。
优选的是,代表性客户样本群聚类及特征提取步骤和用电客户聚类及特征属性提取步骤当中,所述量度均一化作业包括:
把每个采样点处的用电信息记录值,均映射到一个统一的0-1的取值区间之中。具体来说,对于采样点i处的用电负荷值Li,映射后的取值Li’为:
其中K是用电信息曲线样本所含的全部采样点的总数。
优选的是,代表性客户样本群聚类及特征提取步骤当中,群一致性检验的方法是针对每一个代表性客户样本子群,计算聚类中心与该子群中用电信息曲线样本的距离的平均值;如果经群一致性检验任务该平均值大于一个否定阈值,则调整分类架构表,为该调整分类架构表增加一个最底层类目,从而聚类子群数也加1,然后重新执行初步聚类和群一致性检验,直至群一致性检验通过为止。
优选的是,代表性客户样本群聚类及特征提取步骤当中,精细化筛选的方法是,对于每个代表性客户样本子群,按照类型数为2的设定,进行精细化聚类,将每个子群分为2类,并且从中提取成员较多的一个类,将该类作为代表性客户特征提取目标群。
优选的是,聚类置信度验证步骤包括:判断代表性客户样本子群的特征属性代表值落入客户子群在每个采样点的用电负荷值的取值范围的比率,若80%或更多的采样点处落入,则进而判断各个客户子群的特征属性值与代表性客户样本子群的特征属性代表值之间的差值,若差值也小于预定的偏差阈值,则认为验证通过。
本发明还提供了一种用电模式智能识别系统,其特征在于,包括:
代表性客户样本群聚类及特征提取模块:用于从用电客户中建立代表性客户样本群;实时联网采集代表性客户样本群当中每个用电客户代表在预定时间长度内的用电信息曲线样本;对用电信息曲线样本执行数据清理和量度均一化作业,提取用电信息曲线样本的特征属性;进而,对用电信息曲线样本基于所述特征属性以及初始的分类架构表进行初步聚类,将代表性客户样本群划分为若干个代表性客户样本子群;对代表性客户样本子群执行群一致性检验,若检验不通过则调整分类架构表后重新执行初步聚类,直至检验通过;若检验通过,则记录子群数,并进入精细化筛选步骤;对各个代表性客户样本子群进行精细化筛选,取得代表性客户特征提取目标群;针对代表性客户特征提取目标群,建立平均拟合用电信息曲线样本,从该平均拟合用电信息曲线样本当中提取各个代表性客户样本子群的特征属性代表值;
用电客户聚类及特征属性提取模块,用于获得作为用电模式识别对象的全体用电客户的用电信息曲线;对用电信息曲线执行数据清理和量度均一化作业;按照代表性客户样本群聚类及特征提取步骤所确定的子群数,采用第一聚类算法对用电信息曲线执行聚类,将全体用电客户划分为若干个客户子群;根据每个客户子群下的用电客户的用电信息曲线,建立平均拟合用电信息曲线,从平均拟合用电信息曲线当中提取各个客户子群的特征属性值;
聚类置信度验证模块,用于基于各个代表性客户样本子群的特征属性代表值与各个客户子群的特征属性值,执行聚类置信度的收敛性验证;若验证不通过,则返回用电客户聚类及特征属性提取步骤,更新为第二聚类算法对用电信息曲线重新执行聚类而划分若干个客户子群。
本发明所述用电模式智能识别系统,其特征在于,进一步包括:
群管理模块,根据各个客户子群及其用电信息数据,制定面向该客户子群的用电管理方案。
可见,本发明提升了对用电模式给予智能识别,能够对聚类提供先验性的参考(例如决定聚类类目的数量),以及对各种聚类算法是否准确反映了每一类用电客户的客观规律实现了有根据的验证。本发明的计算量较小,可以适应用电模式识别当中聚类数量不均衡的实际特点,提升了聚类运算的可靠性。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明:
图1是本发明的用电模式智能识别与管理方法流程示意图;
图2是本发明所述的用电信息曲线样本示意图;
图3是本发明的用电模式智能识别与管理系统模块示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合实施例及实施例附图对本发明作进一步详细的说明。
图1是本发明的用电模式智能识别与管理方法流程示意图。该用电模式智能识别与管理方法包括以下步骤:代表性客户样本群聚类及特征提取步骤、用电客户聚类及特征属性提取步骤、聚类置信度验证步骤以及群管理步骤。
S1代表性客户样本群聚类及特征提取步骤
为了执行代表性客户样本群的聚类及特征提取,本方法从作为用电模式识别对象的全体用电客户—例如某一省份、城市、地区的全部用电客户当中,以初始的客户分类架构表作为基础,建立代表性客户样本群。举例来说,分类架构表如下表所示,是一个根据客户的行业、子行业多级细分的层级结构表格;为该分类架构表当中最底层层级的每个类目,选择一定数量的已知用电客户,从而将这些用电客户聚合为所述代表性客户样本群。
针对所建立的代表性客户样本群中,实时联网采集代表性客户样本群当中每个用电客户代表在预定时间长度内的用电信息曲线样本。联网电能表或者专用用电数据采集终端可以采集每一个用电单位的多种类型的用电参数,并且将用电参数实时联网发送到配电系统的用电历史数据库中进行存档。通过调取用电历史数据库中的档案,可以获得预定时间长度—例如24个小时—之内在每个采样时间点处的用电信息记录值,例如每个采样时间点上记录的用电负荷值,该用电负荷值表示为:
其中Li表示第i个采样点处的用电负荷值,PAi、PAi-1表示在第i个采样点以及前一个采样点处登记的有功功率值,PWi、PWi-1表示在第i个采样点以及前一个采样点处登记的无功功率值。以预定时间长度上的各个采样时间点作为X坐标值,以各个采样时间点处的用电信息记录值作为Y坐标轴,如图2所示,为每个代表性客户样本群当中的每一个用电客户代表建立了该预定时间长度内的用电信息曲线样本。
对用电信息曲线样本执行数据清理和量度均一化作业。针对每条用电信息曲线样本执行的数据清理包括:丢失数据补全、极端数据剔除。如果在采样时间点处应予以登记的用电信息记录值因种种原因实际上未登记,则理论上用电信息曲线样本在该采样点处需要进行丢失数据补全,但实际上,鉴于只有当超过一定数量的采样点处都存在丢失数据才会对聚类分析结论产生影响,因此,对于每条用电信息曲线样本,在预定时间长度上的全部采样点中25%以上的采样点存在丢失数据的情况,则进行丢失数据补全计算。丢失数据采样点处的用电信息记录值可采用内插法予以计算,例如,第i个采样点处的用电负荷值Li丢失,则用以下内插公式计算该采样点i处的用电负荷值Li:
正常的用电信息曲线样本中,各个采样时间点处的用电信息记录值会在有限范围内的正、负波动,但不会出现超出该范围的正、负尖峰。一旦某个采样时间点处的用电信息记录值呈现为正、负尖峰的状态,则需要将该点数值作为极端数据剔除;剔除之后,可以将该点的数值作为丢失数据处理,采用上述内插方法予以补全。确定正、负尖峰的方法为:
即采样点i处的用电负荷值Li相对于其前、后相邻采样点用电负荷值的变化量绝对值中的最大值大于该采样点i前、后一定数量(k+h+1,k和h的取值可根据实际状况选取)的采样点处用电负荷值的均值与一个预定因数α的乘积。
数据清理之后所得的由有效数据组成的用电信息曲线样本,进而执行量度均一化作业。量度均一化的目的是对于所选择的用电客户代表,消除他们在用电量大小上的基本差异,而关注于用电信息曲线样本在各个采样点处的变化趋势,并在后续的处理中通过该变化趋势而体现用户用电模式上的特征。量度均一化的基本思路是把每个采样点处的用电信息记录值,不论其原始数值范围如何,均映射到一个统一的0-1的取值区间之中。具体来说,对于采样点i处的用电负荷值Li,映射后的取值Li’为:
其中K是用电信息曲线样本所含的全部采样点的总数。
针对执行了数据清理和量度均一化作业之后的用电信息曲线样本,基于初始的分类架构表进行初步聚类。对于每一个用电信息曲线样本,基于其在K个采样点处经处理之后的采样值,将其表征为K维向量:
<L1,L2,...Li,...LK>
因此,对于代表性客户样本群中全部的用电信息曲线样本,将每个用电信息曲线样本表征为一个K维向量之后,可以选取适当的聚类算法执行初步聚类;在初步聚类中,将初始的分类架构表当中最底层类目的数量作为初始的聚类子群数,例如在上表中选择15作为最初的聚类子群数,从而,通过第一次的初步聚类,将代表性客户样本群划分为15个代表性客户样本子群。
对于经初次的初步聚类划分而来的每一个代表性客户样本子群,执行群一致性检验,若检验不通过则调整分类架构表后重新执行初步聚类,直至检验通过;若检验通过,则记录子群数,并进入精细化筛选步骤。执行群一致性检验的方法是针对每一个代表性客户样本子群,计算聚类中心与该子群中用电信息曲线样本的距离的平均值,该平均值越小则说明聚类形成的子群的一致性最好。相反,如果经群一致性检验任务该平均值大于一个否定阈值,则调整分类架构表,为该调整分类架构表增加一个最底层类目,从而聚类子群数也加1,然后重新执行初步聚类和群一致性检验,直至群一致性检验通过为止。
在群一致性校验通过之后的各个代表性客户样本子群,对各个代表性客户样本子群进行精细化筛选,取得代表性客户特征提取目标群。精细化筛选的方法是,对于每个代表性客户样本子群,按照类型数为2的设定,进行精细化聚类,将每个子群分为2类,并且从中提取成员较多的一个类,将该类作为代表性客户特征提取目标群。而另一个成员少的类则被从代表性客户特征提取目标群当中排除出去。
针对代表性客户特征提取目标群,将该群中每一个用电信息曲线样本对应的曲线表征在同一个X-Y坐标系中,然后对这些曲线样本进行中间拟合,建立平均拟合用电信息曲线样本。从该平均拟合用电信息曲线样本当中提取各个采样点处的用电负荷值,作为代表性客户样本子群的特征属性代表值。
S2用电客户聚类及特征属性提取步骤
获得作为用电模式识别对象的全体用电客户的用电信息曲线。对用电信息曲线执行数据清理和标准化作业,方法与步骤S1中的数据清理和标准化作业相同,在此不再赘述。按照代表性客户样本群聚类及特征提取步骤所确定的子群数,即群一致性检验通过时的代表性客户样本子群子群数,采用第一聚类算法对用电信息曲线执行聚类,将全体用电客户划分为若干个客户子群。根据每个客户子群下的用电客户的用电信息曲线,对这些曲线样本进行中间拟合,建立平均拟合用电信息曲线。从每个客户子群的用电信息曲线,提取在每个采样点的用电负荷值的取值范围;再从平均拟合用电信息曲线当中提取各个采样点处的用电负荷值,作为各个客户子群的特征属性值。
S3聚类置信度验证步骤
基于各个代表性客户样本子群的特征属性代表值与各个客户子群的特征属性值,执行聚类置信度的验证;聚类置信度验证包括两个方面:一是判断代表性客户样本子群的特征属性代表值(即各个采样点处的用电负荷值)落入客户子群在每个采样点的用电负荷值的取值范围的比率,若80%或更多的采样点处落入,则进而判断各个客户子群的特征属性值(即各个采样点处的用电负荷值)与代表性客户样本子群的特征属性代表值之间的差值,若差值也小于预定的偏差阈值,则认为验证通过。
若验证不通过,则返回用电客户聚类及特征属性提取步骤,更新为第二聚类算法对用电信息曲线重新执行聚类而划分若干个客户子群;若验证通过,则进入预测管理步骤。
S4群管理步骤
根据各个客户子群及其用电信息数据,制定面向该客户子群的用电管理方案。例如,可以根据各个客户子群在分类架构表中的类目,决定子群中客户的错峰用电时间。或者,针对每个客户的用电信息曲线,结合其所在子群的用电信息曲线,进行曲线比对以发现是否存在用电异常。
如图3所示,本发明还提供了一种用电模式智能识别系统,包括:
代表性客户样本群聚类及特征提取模块M1:用于从用电客户中建立代表性客户样本群;实时联网采集代表性客户样本群当中每个用电客户代表在预定时间长度内的用电信息曲线样本;对用电信息曲线样本执行数据清理和量度均一化作业,提取用电信息曲线样本的特征属性;进而,对用电信息曲线样本基于所述特征属性以及初始的分类架构表进行初步聚类,将代表性客户样本群划分为若干个代表性客户样本子群;对代表性客户样本子群执行群一致性检验,若检验不通过则调整分类架构表后重新执行初步聚类,直至检验通过;若检验通过,则记录子群数,并进入精细化筛选步骤;对各个代表性客户样本子群进行精细化筛选,取得代表性客户特征提取目标群;针对代表性客户特征提取目标群,建立平均拟合用电信息曲线样本,从该平均拟合用电信息曲线样本当中提取各个代表性客户样本子群的特征属性代表值;
用电客户聚类及特征属性提取模块M2,用于获得作为用电模式识别对象的全体用电客户的用电信息曲线;对用电信息曲线执行数据清理和量度均一化作业;按照代表性客户样本群聚类及特征提取步骤所确定的子群数,采用第一聚类算法对用电信息曲线执行聚类,将全体用电客户划分为若干个客户子群;根据每个客户子群下的用电客户的用电信息曲线,建立平均拟合用电信息曲线,从平均拟合用电信息曲线当中提取各个客户子群的特征属性值;
聚类置信度验证模块M3,用于基于各个代表性客户样本子群的特征属性代表值与各个客户子群的特征属性值,执行聚类置信度的收敛性验证;若验证不通过,则返回用电客户聚类及特征属性提取步骤,更新为第二聚类算法对用电信息曲线重新执行聚类而划分若干个客户子群。
群管理模块M4,根据各个客户子群及其用电信息数据,制定面向该客户子群的用电管理方案。
可见,本发明提升了对用电模式给予智能识别,能够对聚类提供先验性的参考(例如决定聚类类目的数量),以及对各种聚类算法是否准确反映了每一类用电客户的客观规律实现了有根据的验证。本发明的计算量较小,可以适应用电模式识别当中聚类数量不均衡的实际特点,提升了聚类运算的可靠性。
以上所述,仅为本发明的具体实施方式,本发明还可以应用在其它设备中;以上描述中的尺寸和数量均仅为参考性的,本领域技术人员可根据实际需要选择适当的应用尺寸,而不脱离本发明的范围。本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求所界定的保护范围为准。
Claims (10)
1.一种用电模式智能识别与管理方法,其特征在于,包括以下步骤:
代表性客户样本群聚类及特征提取步骤:从用电客户中建立代表性客户样本群;实时联网采集代表性客户样本群当中每个用电客户代表在预定时间长度内的用电信息曲线样本;对用电信息曲线样本执行数据清理和量度均一化作业,提取用电信息曲线样本的特征属性;进而,对用电信息曲线样本基于所述特征属性以及初始的分类架构表进行初步聚类,将代表性客户样本群划分为若干个代表性客户样本子群;对代表性客户样本子群执行群一致性检验,若检验不通过则调整分类架构表后重新执行初步聚类,直至检验通过;若检验通过,则记录子群数,并进入精细化筛选步骤;对各个代表性客户样本子群进行精细化筛选,取得代表性客户特征提取目标群;针对代表性客户特征提取目标群,建立平均拟合用电信息曲线样本,从该平均拟合用电信息曲线样本当中提取各个代表性客户样本子群的特征属性代表值;
用电客户聚类及特征属性提取步骤,获得作为用电模式识别对象的全体用电客户的用电信息曲线;对用电信息曲线执行数据清理和量度均一化作业;按照代表性客户样本群聚类及特征提取步骤所确定的子群数,采用第一聚类算法对用电信息曲线执行聚类,将全体用电客户划分为若干个客户子群;根据每个客户子群下的用电客户的用电信息曲线,建立平均拟合用电信息曲线,从平均拟合用电信息曲线当中提取各个客户子群的特征属性值;
聚类置信度验证步骤:基于各个代表性客户样本子群的特征属性代表值与各个客户子群的特征属性值,执行聚类置信度的收敛性验证;若验证不通过,则返回用电客户聚类及特征属性提取步骤,更新为第二聚类算法对用电信息曲线重新执行聚类而划分若干个客户子群;若验证通过,则进入预测管理步骤;
群管理步骤,根据各个客户子群及其用电信息数据,制定面向该客户子群的用电管理方案。
2.根据权利要求1所述的用电模式智能识别与管理方法,其特征在于,代表性客户样本群聚类及特征提取步骤当中,以预定时间长度上的各个采样时间点作为X坐标值,以各个采样时间点处的用电信息记录值作为Y坐标轴,为每个代表性客户样本群当中的每一个用电客户代表建立该预定时间长度内的用电信息曲线样本。
3.根据权利要求2所述的用电模式智能识别与管理方法,其特征在于,代表性客户样本群聚类及特征提取步骤和用电客户聚类及特征属性提取步骤当中,执行的数据清理包括丢失数据补全;其中,如果第i个采样点处的用电负荷值Li丢失,则用以下内插公式计算该采样点i处的用电负荷值Li:
<mrow>
<msub>
<mi>L</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mi>i</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mo>-</mo>
<mi>k</mi>
</mrow>
</munderover>
<msub>
<mi>L</mi>
<mi>l</mi>
</msub>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>m</mi>
<mo>=</mo>
<mi>i</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
<mrow>
<mi>i</mi>
<mo>+</mo>
<mi>h</mi>
</mrow>
</munderover>
<msub>
<mi>L</mi>
<mi>m</mi>
</msub>
</mrow>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mi>h</mi>
</mrow>
</mfrac>
<mo>.</mo>
</mrow>
4.根据权利要求3所述的用电模式智能识别与管理方法,其特征在于,代表性客户样本群聚类及特征提取步骤和用电客户聚类及特征属性提取步骤当中,执行的数据清理包括极端数据剔除;判断存在正、负尖峰极端数据的步骤为:判断是否存在以下关系
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>i</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>|</mo>
<mo>,</mo>
<mo>|</mo>
<msub>
<mi>L</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>L</mi>
<mrow>
<mi>i</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>|</mo>
<mo>)</mo>
</mrow>
<mo>></mo>
<mi>&alpha;</mi>
<mo>&CenterDot;</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mi>k</mi>
<mo>+</mo>
<mi>h</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mi>i</mi>
<mo>-</mo>
<mi>k</mi>
</mrow>
<mrow>
<mi>i</mi>
<mo>+</mo>
<mi>h</mi>
</mrow>
</munderover>
<msub>
<mi>L</mi>
<mi>l</mi>
</msub>
</mrow>
1
即采样点i处的用电负荷值Li相对于其前、后相邻采样点用电负荷值的变化量绝对值中的最大值大于该采样点i前、后一定数量的采样点处用电负荷值的均值与一个预定因数α的乘积。
5.根据权利要求4所述的用电模式智能识别与管理方法,其特征在于,代表性客户样本群聚类及特征提取步骤和用电客户聚类及特征属性提取步骤当中,所述量度均一化作业包括:
把每个采样点处的用电信息记录值,均映射到一个统一的0-1的取值区间之中。具体来说,对于采样点i处的用电负荷值Li,映射后的取值Li’为:
<mrow>
<msup>
<msub>
<mi>L</mi>
<mi>i</mi>
</msub>
<mo>,</mo>
</msup>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>L</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<msub>
<mi>L</mi>
<mi>l</mi>
</msub>
</mrow>
<msqrt>
<mrow>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<mrow>
<mo>(</mo>
<msub>
<mi>L</mi>
<mi>l</mi>
</msub>
<mo>-</mo>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>l</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<msub>
<mi>L</mi>
<mi>l</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</msqrt>
</mfrac>
</mrow>
其中K是用电信息曲线样本所含的全部采样点的总数。
6.根据权利要求5所述的用电模式智能识别与管理方法,其特征在于,代表性客户样本群聚类及特征提取步骤当中,群一致性检验的方法是针对每一个代表性客户样本子群,计算聚类中心与该子群中用电信息曲线样本的距离的平均值;如果经群一致性检验任务该平均值大于一个否定阈值,则调整分类架构表,为该调整分类架构表增加一个最底层类目,从而聚类子群数也加1,然后重新执行初步聚类和群一致性检验,直至群一致性检验通过为止。
7.根据权利要求6所述的用电模式智能识别与管理方法,其特征在于,代表性客户样本群聚类及特征提取步骤当中,精细化筛选的方法是,对于每个代表性客户样本子群,按照类型数为2的设定,进行精细化聚类,将每个子群分为2类,并且从中提取成员较多的一个类,将该类作为代表性客户特征提取目标群。
8.根据权利要求7所述的用电模式智能识别与管理方法,其特征在于,聚类置信度验证步骤包括:判断代表性客户样本子群的特征属性代表值落入客户子群在每个采样点的用电负荷值的取值范围的比率,若80%或更多的采样点处落入,则进而判断各个客户子群的特征属性值与代表性客户样本子群的特征属性代表值之间的差值,若差值也小于预定的偏差阈值,则认为验证通过。
9.一种用电模式智能识别系统,其特征在于,包括:
代表性客户样本群聚类及特征提取模块:用于从用电客户中建立代表性客户样本群;实时联网采集代表性客户样本群当中每个用电客户代表在预定时间长度内的用电信息曲线样本;对用电信息曲线样本执行数据清理和量度均一化作业,提取用电信息曲线样本的特征属性;进而,对用电信息曲线样本基于所述特征属性以及初始的分类架构表进行初步聚类,将代表性客户样本群划分为若干个代表性客户样本子群;对代表性客户样本子群执行群一致性检验,若检验不通过则调整分类架构表后重新执行初步聚类,直至检验通过;若检验通过,则记录子群数,并进入精细化筛选步骤;对各个代表性客户样本子群进行精细化筛选,取得代表性客户特征提取目标群;针对代表性客户特征提取目标群,建立平均拟合用电信息曲线样本,从该平均拟合用电信息曲线样本当中提取各个代表性客户样本子群的特征属性代表值;
用电客户聚类及特征属性提取模块,用于获得作为用电模式识别对象的全体用电客户的用电信息曲线;对用电信息曲线执行数据清理和量度均一化作业;按照代表性客户样本群聚类及特征提取步骤所确定的子群数,采用第一聚类算法对用电信息曲线执行聚类,将全体用电客户划分为若干个客户子群;根据每个客户子群下的用电客户的用电信息曲线,建立平均拟合用电信息曲线,从平均拟合用电信息曲线当中提取各个客户子群的特征属性值;
聚类置信度验证模块,用于基于各个代表性客户样本子群的特征属性代表值与各个客户子群的特征属性值,执行聚类置信度的收敛性验证;若验证不通过,则返回用电客户聚类及特征属性提取步骤,更新为第二聚类算法对用电信息曲线重新执行聚类而划分若干个客户子群。
10.根据权利要求9所述的用电模式智能识别系统,其特征在于,进一步包括:
群管理模块,根据各个客户子群及其用电信息数据,制定面向该客户子群的用电管理方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710474710.1A CN107274025B (zh) | 2017-06-21 | 2017-06-21 | 一种实现用电模式智能识别与管理的系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710474710.1A CN107274025B (zh) | 2017-06-21 | 2017-06-21 | 一种实现用电模式智能识别与管理的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107274025A true CN107274025A (zh) | 2017-10-20 |
CN107274025B CN107274025B (zh) | 2020-09-11 |
Family
ID=60068050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710474710.1A Expired - Fee Related CN107274025B (zh) | 2017-06-21 | 2017-06-21 | 一种实现用电模式智能识别与管理的系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107274025B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107958338A (zh) * | 2017-12-08 | 2018-04-24 | 合肥工业大学 | 用电策略推荐方法及装置、存储介质 |
CN108920790A (zh) * | 2018-06-20 | 2018-11-30 | 国网上海市电力公司 | 一种基于历史数据的公共建筑用电模式识别模型建立方法 |
CN113469500A (zh) * | 2021-06-07 | 2021-10-01 | 深圳供电局有限公司 | 一种行业用电大数据特征分析方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100121788A1 (en) * | 2008-11-12 | 2010-05-13 | Sun Microsystems, Inc. | Generating a utilization charge for a computer system |
CN102982489A (zh) * | 2012-11-23 | 2013-03-20 | 广东电网公司电力科学研究院 | 一种基于海量计量数据的电力客户在线分群方法 |
CN103218675A (zh) * | 2013-05-06 | 2013-07-24 | 国家电网公司 | 一种基于聚类和滑动窗口的短期负荷预测方法 |
CN103577883A (zh) * | 2013-11-18 | 2014-02-12 | 国家电网公司 | 一种网-荷智能互动方法及装置 |
CN104200275A (zh) * | 2014-06-24 | 2014-12-10 | 国家电网公司 | 基于用户行为特点的用电模式分类和控制方法 |
CN104680261A (zh) * | 2015-03-16 | 2015-06-03 | 朗新科技股份有限公司 | 基于重点大客户负荷曲线聚类的电力负荷运行控制方法 |
CN105989420A (zh) * | 2015-02-12 | 2016-10-05 | 西门子公司 | 确定用户用电行为特征的方法、用户用电负荷的预测方法和装置 |
CN106022959A (zh) * | 2016-05-19 | 2016-10-12 | 北京中电普华信息技术有限公司 | 一种面向削峰填谷的用电行为分析方法及系统 |
US20170011321A1 (en) * | 2012-10-11 | 2017-01-12 | American Express Travel Related Services Company, Inc. | Uplifting of computer resources |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN106779295A (zh) * | 2016-11-18 | 2017-05-31 | 南方电网科学研究院有限责任公司 | 供电方案生成方法和系统 |
CN106780121A (zh) * | 2016-12-06 | 2017-05-31 | 广州供电局有限公司 | 一种基于用电负荷模式分析的用电异常识别方法 |
-
2017
- 2017-06-21 CN CN201710474710.1A patent/CN107274025B/zh not_active Expired - Fee Related
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100121788A1 (en) * | 2008-11-12 | 2010-05-13 | Sun Microsystems, Inc. | Generating a utilization charge for a computer system |
US20170011321A1 (en) * | 2012-10-11 | 2017-01-12 | American Express Travel Related Services Company, Inc. | Uplifting of computer resources |
CN102982489A (zh) * | 2012-11-23 | 2013-03-20 | 广东电网公司电力科学研究院 | 一种基于海量计量数据的电力客户在线分群方法 |
CN103218675A (zh) * | 2013-05-06 | 2013-07-24 | 国家电网公司 | 一种基于聚类和滑动窗口的短期负荷预测方法 |
CN103577883A (zh) * | 2013-11-18 | 2014-02-12 | 国家电网公司 | 一种网-荷智能互动方法及装置 |
CN104200275A (zh) * | 2014-06-24 | 2014-12-10 | 国家电网公司 | 基于用户行为特点的用电模式分类和控制方法 |
CN105989420A (zh) * | 2015-02-12 | 2016-10-05 | 西门子公司 | 确定用户用电行为特征的方法、用户用电负荷的预测方法和装置 |
CN104680261A (zh) * | 2015-03-16 | 2015-06-03 | 朗新科技股份有限公司 | 基于重点大客户负荷曲线聚类的电力负荷运行控制方法 |
CN106022959A (zh) * | 2016-05-19 | 2016-10-12 | 北京中电普华信息技术有限公司 | 一种面向削峰填谷的用电行为分析方法及系统 |
CN106529707A (zh) * | 2016-11-01 | 2017-03-22 | 华北电力大学(保定) | 一种负荷用电模式识别方法 |
CN106779295A (zh) * | 2016-11-18 | 2017-05-31 | 南方电网科学研究院有限责任公司 | 供电方案生成方法和系统 |
CN106780121A (zh) * | 2016-12-06 | 2017-05-31 | 广州供电局有限公司 | 一种基于用电负荷模式分析的用电异常识别方法 |
Non-Patent Citations (1)
Title |
---|
彭显刚 等: ""基于聚类分析的客户用电模式智能识别方法"", 《电力系统保护与控制》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107958338A (zh) * | 2017-12-08 | 2018-04-24 | 合肥工业大学 | 用电策略推荐方法及装置、存储介质 |
CN108920790A (zh) * | 2018-06-20 | 2018-11-30 | 国网上海市电力公司 | 一种基于历史数据的公共建筑用电模式识别模型建立方法 |
CN113469500A (zh) * | 2021-06-07 | 2021-10-01 | 深圳供电局有限公司 | 一种行业用电大数据特征分析方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107274025B (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN106909933B (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
CN113267692B (zh) | 一种低压台区线损智能诊断分析方法和系统 | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN112149873B (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN107220732A (zh) | 一种基于梯度提升树的停电投诉风险预测方法 | |
CN108256691A (zh) | 还款概率预测模型构建方法及装置 | |
CN114519514B (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
Enke et al. | A hybrid neuro-fuzzy model to forecast inflation | |
CN108345908A (zh) | 电网数据的分类方法、分类设备及存储介质 | |
CN103514368B (zh) | 一种采用聚类技术的实时与阶段理论线损快速估算方法 | |
CN107274025A (zh) | 一种实现用电模式智能识别与管理的系统和方法 | |
CN106910017A (zh) | 一种基于用户行为数据挖掘的电能体验分析方法和系统 | |
CN110690701A (zh) | 一种异常线损影响因素的分析方法 | |
CN111723862A (zh) | 开关柜状态评估方法和装置 | |
CN110555619A (zh) | 一种基于智能配电网的供电能力评估方法 | |
CN104850612B (zh) | 一种基于增强凝聚层次聚类的配网用户负荷特征分类方法 | |
CN106651630B (zh) | 关键用电行业识别方法和系统 | |
CN113379116A (zh) | 基于聚类和卷积神经网络的台区线损预测方法 | |
CN116307844A (zh) | 一种低压台区线损评估分析方法 | |
CN113949079B (zh) | 基于深度学习的配电台区用户三相不平衡预测优化方法 | |
CN106384307A (zh) | 一种县域配电网规划差异化评估方法 | |
Wang et al. | Application of clustering technique to electricity customer classification for load forecasting | |
CN115563477A (zh) | 谐波数据识别方法、装置、计算机设备和存储介质 | |
CN109636101A (zh) | 基于大数据的开放售电环境下大用户用电行为分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200911 |
|
CF01 | Termination of patent right due to non-payment of annual fee |