CN117992856A - 用户用电行为分析方法、系统、设备、介质及程序产品 - Google Patents

用户用电行为分析方法、系统、设备、介质及程序产品 Download PDF

Info

Publication number
CN117992856A
CN117992856A CN202410396192.6A CN202410396192A CN117992856A CN 117992856 A CN117992856 A CN 117992856A CN 202410396192 A CN202410396192 A CN 202410396192A CN 117992856 A CN117992856 A CN 117992856A
Authority
CN
China
Prior art keywords
load
curve
electricity consumption
recursion
interpretation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410396192.6A
Other languages
English (en)
Other versions
CN117992856B (zh
Inventor
梁波
魏琳
张利
许明
来晓帅
李函奇
解磊
杨洋
郭珂
刘霄慧
张嘉璐
张嘉琪
张慧
曹胜楠
刘畅
王茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Original Assignee
Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Marketing Service Center of State Grid Shandong Electric Power Co Ltd filed Critical Marketing Service Center of State Grid Shandong Electric Power Co Ltd
Priority to CN202410396192.6A priority Critical patent/CN117992856B/zh
Publication of CN117992856A publication Critical patent/CN117992856A/zh
Application granted granted Critical
Publication of CN117992856B publication Critical patent/CN117992856B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种用户用电行为分析方法、系统、设备、介质及程序产品,涉及数据分析处理技术领域,包括:获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。采用递归特征形成用电行为非线性特征的解释向量,用于对用电行为的二次精细化分类,实现对用电行为的波动信息及非线性特征的有效挖掘。

Description

用户用电行为分析方法、系统、设备、介质及程序产品
技术领域
本发明涉及数据分析处理技术领域,特别是涉及一种用户用电行为分析方法、系统、设备、介质及程序产品。
背景技术
随着大量新能源接入电力系统,导致电力系统供需平衡的波动性进一步增强,需用户侧互动参与系统运行调控,可通过用户用电数据分析用电行为特征,同时通过用户用电特征的分析也有助于掌握用户用电偏好,以针对性制定调控措施。
在用户用电行为识别分类方法中,有时频域方法、聚类算法等,已应用在部分负荷分类应用中。但上述基于一维序列的方法大多只能提取到时间序列的浅层特征,表征能力有限,对于用户复杂用电行为较难取得很好的分类效果。
负荷曲线作为用户用电行为最直观的反映之一,常被用作用电行为特征分析的重要依据,通过无监督聚类算法、有监督分类及有监督与无监督相结合等可对负荷曲线的整体形态特征进行分析,并实现对用电用户群分类,从而有效得出各类典型用户的特征。但上述方法在对典型用户进行分析时,仅能考虑负荷序列的整体相关性,很难使用一般的随机性或确定性理论定义用户用电行为隐含的局部非线性信息。
再者,用户用电行为分析的思想大多基于负荷曲线形态上的相似性,以周期特征与随时间变化的趋势为依据对用户进行分类,主要利用的是负荷序列的整体动态相关性在负荷曲线上的特征表现。由于用户用电行为的复杂多样,进行用电行为分类时,仅考虑负荷曲线中的静态指标去识别各类典型用户用电行为,可能会存在用电变化规律未被全面捕捉的情况,致使用户用电的局部波动等非线性信息缺失,影响分类的精准度。
发明内容
为了解决上述问题,本发明提出了一种用户用电行为分析方法、系统、设备、介质及程序产品,通过定量递归分析方法,采用递归率、确定性、递归熵和层状度的递归特征,形成用电行为非线性特征的解释向量,用于对用电行为的二次精细化分类,实现对用户用电行为的波动信息及非线性特征的有效挖掘。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种用户用电行为分析方法,包括:
获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;
对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;
以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。
作为可选择的实施方式,在一次分类的聚类处理和设定解释向量分类数的过程中,以最小化样本与聚类中心的误差平方和为目标,通过不同聚类数量下的误差平方和值绘制SSE曲线,根据SSE曲线的变化趋势,以SSE曲线初始拐点对应的聚类数量为所设定的最佳聚类数。
作为可选择的实施方式,构建负荷递归图的具体过程包括:将负荷曲线转换为二维相空间轨迹,计算二维相空间轨迹中的每个向量与包括其自身的各向量的欧几里得范数,以i为行数,j为列数,组合为/>的递归矩阵,n为用电负荷数据的数量,将递归矩阵中每个元素乘以255,根据不同值映射为不同的RGB值,由此得到负荷递归图。
作为可选择的实施方式,所述递归特征包括递归率、确定性、递归熵和层状度。
作为可选择的实施方式,根据动态时间归整法确定每个解释向量与聚类中心曲线的相似度距离,并按照从大到小的顺序进行排序,将每个解释向量归类于相似度距离最小的类别。
作为可选择的实施方式,计算每个解释向量的第1个递归特征到第k个递归特征,与聚类中心曲线的第1个递归特征到第k个递归特征的DTW距离,利用动态时间归整法构造累计距离矩阵,即二者的相似度距离。
第二方面,本发明提供一种用户用电行为分析系统,包括:
一次分类模块,被配置为获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;
递归特征提取模块,被配置为对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;
二次分类模块,被配置为以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。
第三方面,本发明提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
第五方面,本发明提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现完成第一方面所述的方法。
与现有技术相比,本发明的有益效果为:
本发明对一次分类后得到的负荷曲线,通过定量递归分析方法,提取用户用电行为的递归特征,采用递归率、确定性、递归熵和层状度的递归特征,形成用电行为非线性特征的解释向量,用于对用电行为的二次精细化分类,实现对用户用电行为的波动信息及非线性特征的有效挖掘,有效聚焦不同类型的用电用户负荷曲线。不同于用电行为时域分析仅描述整体曲线形态特征,本发明还能够准确刻画用电数据内部动力学特征,通过对用电行为非线性特征的深入分析,提升用户用电行为分析的精细化水平。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的用户用电行为分析方法流程图;
图2为本发明实施例1提供的数据清洗流程图;
图3为本发明实施例1提供的一类负荷曲线;
图4为图3中负荷曲线的负荷递归图;
图5为本发明实施例1提供的另一类负荷曲线;
图6为图5中负荷曲线的负荷递归图;
图7为本发明实施例1提供的异距方块型的负荷递归图;
图8为本发明实施例1提供的异距方块型负荷递归图的一维负荷曲线;
图9为本发明实施例1提供的等距棋盘型的负荷递归图;
图10为本发明实施例1提供的等距棋盘型负荷递归图的一维负荷曲线;
图11为本发明实施例1提供的渐变明亮型的负荷递归图;
图12为本发明实施例1提供的渐变明亮型负荷递归图的一维负荷曲线;
图13为本发明实施例1提供的均匀灰暗型的负荷递归图;
图14为本发明实施例1提供的均匀灰暗型负荷递归图的一维负荷曲线;
图15为本发明实施例1提供的递归特征解释向量提取流程;
图16为本发明实施例1提供的用电负荷数据经聚类后Ⅰ类用户的典型曲线;
图17为本发明实施例1提供的Ⅰ类用户经递归特征细分后的第一类用电行为;
图18为本发明实施例1提供的Ⅰ类用户经递归特征细分后的第二类用电行为;
图19为本发明实施例1提供的Ⅰ类用户经递归特征细分后的第三类用电行为;
图20为本发明实施例1提供的用电负荷数据经聚类后Ⅳ类用户的典型曲线;
图21为本发明实施例1提供的Ⅳ类用户经递归特征细分后的第一类用电行为;
图22为本发明实施例1提供的Ⅳ类用户经递归特征细分后的第二类用电行为;
图23为本发明实施例1提供的Ⅳ类用户经递归特征细分后的第三类用电行为。
具体实施方式
下面结合附图与实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“包含”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1
递归图是分析相空间中时间序列递归特征的分析方法,与传统方法相比,克服时间序列长度与稳态性的严格要求,适应于非线性动力学系统的分析。在电抗器绕组振动信号分析中,有文献通过将采用定量递归分析(Recurrence Quantification Analysis,RQA)计算得到的非线性指标作为特征量建立局部压紧状态的指标,为电抗器故障诊断提供了更有效的理论依据。层状度(Laminarity,LAM)在有效判断桥梁碰撞前后的非平稳程度方面取得突破,并能良好地体现桥梁碰撞后的振动信号非平稳程度的变化。
递归图表现出的时间序列递归性作为非线性系统中的关键特性,常存在于不同时间系统内状态相似的情况下。针对该类性质的研究方法,即RQA,其对数据量要求较低同时对数据整体平稳度要求较低,并且对噪声敏感度也较低。借助RQA方法,特别是量化的递归率(Recurrence Rate,RR)、LAM、递归熵(Entropy,ENTR)、确定率(Deterministic,DET)等指标,可对用户用电行为的非线性数据特征进行分析。
由此,本实施例提出一种用户用电行为分析方法,基于非线性递归图面结构与整体形态特征实现,如图1所示,具体步骤包括:
获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;
对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;
以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。
由于计量装置故障导致数据收集错误或受到突发事件,如停电、切负荷等影响,造成数据异常或缺失。因此,在获取原始的用电负荷数据后,需要对含有大量噪声、质量较差的用电负荷数据进行有效清洗,提升用电负荷数据的质量,保障后续负荷递归特性等正确且有效的分析。
数据清洗流程如图2所示,具体包括:
分别统计每日用电负荷数据中的异常值和缺失值;
判断异常值或缺失值与当日总数据占比是否超过50%;
若是,则剔除该条数据;
否则,将异常值置为0,并统一视为缺失值处理,并采用插值法进行数据填补,作为有效样本。
在本实施例中,经数据清洗后,再进行用电负荷数据的归一化处理。从不同用户收集的用电负荷数据可能具有相似的形状,但幅度存在差异。因此,直接分类可能会导致缺乏客观准确性。本实施例采用最大最小归一化方法,实现对用电负荷数据的等比例缩放,保持各用户用电负荷数据的量纲一致,避免负荷数据量纲对后续递归特性分析等的影响。
(1);
其中,为归一化后的电力负荷数据,/>为数据清洗后的电力负荷数据,/>和/>为数据清洗后的电力负荷数据中的最大值与最小值。
在本实施例中,对经上述预处理后的用电负荷数据基于k-means算法进行聚类分析。
在提取用户用电典型负荷曲线的过程中,k-means算法的目标是最小化样本与聚类中心的误差平方和(Sum of Square Error,SSE);
(2)。
根据聚类评价指标SSE曲线的初始拐点,指定初始聚类数为kk个聚类簇为j=1,...,k,样本数量为N,每个样本记为/>,每个聚类簇的聚类中心为/>
(3)。
计算初始聚类中心到其余数据对象的欧式距离,根据欧氏距离衡量相似度,将与聚类中心相似度最高的目标数据分配到的聚类簇中,分配完毕后,将k个聚类簇中的数据对象求平均值,进而降低数据集的误差平方和,形成新一轮聚类中心,直至SSE收敛为止,此时输出用户用电行为一次分类结果。
本次聚类结果是在时序数列角度下,以SSE曲线的初始拐点定义聚类数k,形成各个聚类中心的负荷曲线,以各类负荷曲线的整体形态特征为主划分的一次用户用电行为类型;其中,SSE曲线是通过绘制不同聚类数量下的SSE值来获得,通过SSE曲线的变化趋势,确定最佳聚类数,使得聚类效果达到最优。
在本实施例中,经聚类输出各类典型的负荷曲线后,为了更精准地区分用户用电行为,进一步分析负荷递归图的内在规律性,引入递归率、确定性、递归熵和层状度四种普适性较强的递归指标,并通过分析这些指标对各类用电行为的稳定性、随机性、周期性的解释作用,建立各类用户用电行为精细化分析的支撑依据。
在本实施例中,构建负荷递归图的具体过程包括:
针对给定的用电负荷序列,通过式(4),将其转换为二维相空间轨迹S
(4);
其中,n为待转换一维用电负荷序列的数据个数;表示二维相空间轨迹S中起点为坐标原点,终点为/>的向量;/>为用电负荷序列中第i个数据,/>为用电负荷序列中第i+1个数据。
二维相空间轨迹S中的每个向量与包括其自身的各向量的欧几里得范数记为
(5);
其中,表示二维相空间轨迹S中起点为坐标原点,终点为/>的向量,以i为行数,j为列数,计算所有/>,组合成尺寸为/>的递归矩阵R,并使用最大最小归一化方法处理R中的每个元素,组合方式为式(6);
(6)。
将递归矩阵R中每个元素乘以255,根据不同值映射为不同RGB值,最终生成负荷递归图,负荷递归图保留了完整时间序列的特征信息,如图3-图4为一类负荷曲线及其负荷递归图,图5-图6为另一类负荷曲线及其负荷递归图。
本实施例利用定量递归分析RQA,对负荷递归图进行定量指标的分析计算,RQA是在递归图基础上的非线性指标量化方法,具体递归特征指标的物理含义与计算方法为:
(1)递归率(Recurrence Rate,RR),递归图中值为非0的点所占的比例,反映一个特定状态出现概率和收敛程度:
其中,为递归矩阵中的行数或列数,/>为递归矩阵中ij列的元素。
(2)确定性(Deterministic,DET),描述了对角线结构的递归点数与所有递归点数的比例,反映了系统的可预测性:
其中,l为线段长度,为线段长度为l的对角线结构相应的比例,/>为线段最小长度,对于随机信号,相邻递归点较少,因此,/>一般取为2;/>为线段最大长度。
(3)递归熵(Entropy,ENTR);基于对角线长度频率分布的香农熵,描述了平行于45°线段分布的非线性:
(4)层状度(Laminarity,LAM);指组成规则线段的递归点百分比,反映负荷序列变化相对快慢程度,同时也能说明负荷序列的稳定度:
其中,p(v)是递归图中长度为v的竖直线段或水平线段的概率分布;v min为竖直线段或水平线段的最小长度,一般为2。
本实施例给出四种典型用电行为的负荷递归图及其递归特征以及对应的一维负荷曲线。
(1)异距方块型,由于动力学系统中突然或急剧的变化引起,表现为大片块状区域,可直观体现用户用电行为的突变现象。负荷递归图及其一维负荷曲线如图7-图8所示。
(2)等距棋盘型,图形棋盘状结构较多,对角线间垂直距离为周期。负荷递归图及其一维负荷曲线如图9-图10所示。
(3)渐变明亮型,由于系统中缓慢变化的参数引起的,以主对角线为中心,向左上角与右下角渐变,颜色逐渐明亮,表现出稠密但不均匀的递归点,有一些近似周期的成分,并且存在短的线段。负荷递归图及其一维负荷曲线如图11-图12所示。
(4)均匀灰暗型,递归点分布均匀,孤立点较少,一般用电行为较为随机。负荷递归图及其一维负荷曲线如图13-图14所示。
递归图中递归点的分布情况与负荷序列的随机性、周期性、平稳性等存在对应关系。对各类负荷递归图的图面结构进行数值分析,即采用RQA计算递归图的特征指标,结果见表1,可见指标能在一定程度上反映用电行为的稳定性、随机性、周期性等。
表1 四类典型用电行为定量递归分析的指标结果
分析结果表明,等距棋盘型的负荷递归图的REC参数在四类递归图中最高,说明其相空间轨迹中互相接近的几率更大,连续五天中每天的用户用电行为相似性更高。另外,LAM表示竖直线段或水平线段的概率分布,在该类型中参数值最高,体现了该类用户用电行为的高稳定性。
与之相对,均匀灰暗型的递归点较分散,电量数据随机性更强,其DET参数在四类递归图中最低,反映了负荷周期递归的过程度最低,说明了均匀灰暗型负荷递归图对应的用电行为的随机性更大。同时,由于该类用户的强随机性用电行为特征,导致负荷序列的固有不稳定性,造成了LAM结果最低。
渐变明亮型的负荷递归图的ENTR参数在四类递归图中最高,直接说明了图面结构复杂度高,平行于对角线分布的线段非线性强,反映了用电行为随机性程度与确定性结构的结合,表现了一定的系统混沌性质。
异距方块型的负荷递归图由于急剧的用电量变化导致系统确定性、稳定性、周期性都受到影响,对应表征参数DET、LAM、REC降低。相比于渐变明亮型负荷递归图的图面结构呈对角线式逐渐曝光,均匀灰暗型负荷递归图的图面结构呈均匀且较少孤立点来说,异距方块型图面结构介于二者之间。针对等距棋盘型,带有周期性频繁波动的用电行为使得图面结构呈现较为复杂的状态,其ENTR参数的结果与图面结构复杂度一致。
综合上述分析,各类型递归图对应的用电行为具有各自的用电特征,可以通过判断图面结构初步判定用户用电行为的内含特征,并可以四种递归特征作为用户用电行为非线性信息的解释向量,应用于后续的用电行为精细分类中。
由此,本实施例将经过聚类后得到的各类整体形态特征相似的用户用电行为一次分类结果作为输入对象,基于各类负荷曲线分别构建负荷递归图,提取负荷递归图中的四种递归特征,提取用户用电行为的非线性信息,并将用电行为的四类递归特征作为解释向量,依据递归特征解释向量,使用DTW(Dynamic Time Warping,动态时间归整)对用户进行二次细分,以实现用电行为的精细化分析。
具体地,如图15所示;以用户用电行为的一次分类结果为输入,构建用户用电行为一次分类结果的负荷递归图,提取负荷递归图中的递归特征,包括递归率、确定性、递归熵和层状度,形成用电行为的解释向量,对解释向量进行DTW二次分类,得到用电行为最终分类结果。
针对上述DTW二次分类过程进行详细论述。
假设输入解释向量GHG={g 1,g 2,g 3,g 4}和H={h 1,h 2,h 3,h 4},其中,GH表示为经上一类聚类后得到的整体动态特征相似度一致的同一类内两条不同用电数据的解释向量,g 1g 2g 3g 4分别为G中的递归率、确定性、递归熵和层状度,h 1h 2h 3h 4分别为H中的递归率、确定性、递归熵和层状度,长度均为4,g kh k间的距离定义为,/>表示q范数。
在累计距离矩阵Dis中找到一条通过若干格点的路径,该路径代表解释向量GH上每个点的匹配关系,不同路径对应不同匹配关系。
DTW算法是找到一条弯曲路径,使路径上所有匹配点对的距离和最小,该最小距离和对应DTW距离,这条路径称为最优弯曲路径。
设弯曲路径为T raT ra是一个包含M个二元数组的有序集合;
(7)。
DTW距离的计算公式如式(8):
(8)。
其中,GH的DTW距离,/>g kh k间的距离,g kh k分别为解释向量G和解释向量H中的第k个递归特征。
根据约束条件,利用动态规划方法构造累计距离矩阵Dis,将式(8)转换为式(9)和式(10)的求解;
(9);
(10);
其中,为从G的第1个元素到第k个元素,与H的第1个元素到第k个元素的DTW距离,Dis(0,0)=0,Dis(i,0)=Dis(0,j)=∞,i=1,...,4,j=1,...,4,最终得到累计距离矩阵Dis,对应于递归特征解释向量GH的DTW距离,即二者的相似度距离。
然后,针对一次分类后的各类用户,提取其中每条用电数据样本的递归特征解释向量,并将其作为输入样本,仍按照SSE曲线的最初拐点判定各类用户基于递归特征解释向量的二次分类,同时形成每类解释向量的聚类中心曲线。
需要说明的是,第一聚类得到的用电行为一次分类的结果是直接以用户的用电负荷数据为样本,对用电曲线整体形态进行分类,得到了每类以整体曲线形态相似度划分的各个类别的用电用户;在此基础上加入递归特征,以递归特征作为样本进行第二次聚类,即,在曲线整体形态相似的基础上,加入了递归特征表征的非线性性质相似度的划分,从而实现了用电曲线的细分。
最后,根据每个递归特征解释向量关于每类聚类中心曲线的综合相似度,即DTW距离,按照从大到小的顺序进行排序,将每条递归特征解释向量归类于与之最相似(即Dis值最小)的类别,而后对应到原一维用电曲线上,得到二次分类后的细分类型用电曲线。
假设用电行为一次分类的各类负荷曲线组为K1、K2、K3,对每类负荷曲线组提取递归特征后,得到解释向量DK1、DK2、DK3,再以DK1、DK2、DK3为二次聚类样本进行递归特征的聚类,根据每个解释向量与各类聚类中心的相似度,得到最相似的类别,实现更为细致的分类后,对应到原一维的用电负荷数据中,得到如图9-图10所示的各类型用户用电曲线,使得每一类别的曲线整体形态与非线性动力学特性均相似。
至此,在全局动态特征相似的基础上,形成各类以递归特征解释向量相似度为分类依据的用电行为。本实施例将整体动态相似度与非线性动力学信息特征相互结合,经过两次相似度分类,在第一次基于整体形态分类的基础上,结合非线性信息进行用电行为更精细化的二次分类。
以某行业在某段时间内的用电负荷数据为输入样本,经过k-means聚类后形成八类用户用电行为一次分类结果,其中Ⅰ类(Type Ⅰ)与Ⅳ类(Type Ⅳ)经过k-means聚类后,仍存在明显的细节特征未能被有效区分的现象,因此将两类单独作为典型示例进行详细说明。
图16中的实线曲线为用电负荷数据经k-means初步聚类后,Type Ⅰ用户的典型曲线(所有该类用户用电负荷曲线的平均值),图20中的实线曲线为用电负荷数据经k-means初步聚类后,Type Ⅳ用户的典型曲线(所有该类用户用电负荷曲线的平均值),可表征所属类别下的所有虚线曲线的整体形态,但直观上,仍可以发现,典型曲线仍存在对于虚线曲线中的部分细节特征、波动信息未能全面表示的情况。
因此,通过四种递归特征组合为解释向量,揭示各个用电行为的随机性、波动性、稳定性等非线性信息,判断解释向量相似度是否同类,基于k-means聚类结果进行二次筛选,如图17-图19与图21-图23所示,如图17-图19为Type Ⅰ二次筛选后的Type Ⅰ-1、Type Ⅰ-2和Type Ⅰ-3三类用电行为,图21-图23为Type Ⅳ二次筛选后的Type Ⅳ-1、Type Ⅳ-2和Type Ⅳ-3三类用电行为,以实现用户用电行为的再度细分,以Type Ⅰ与Type Ⅳ曲线为典例,递归向量汇总如表2所示。
表2 两类用电行为的递归特征解释向量分类数据汇总
Type Ⅰ中,以REC弱特征为区分指标,表现为某特定状态的收敛程度较低,相空间轨迹中互相接近的几率更小,得到Type Ⅰ-1用电行为,在整体特征相似的情况下该类别用电行为的波动程度较为平缓;以REC强特征、DET强特征为区分指标,表现为某特定状态的出现概率较高,并且该类别可预测性较大,得到Type Ⅰ-2用电行为,该类用电行为波动幅度大且上下波动斜率多次变化;以LAM强特征为区分指标,表现为负荷序列的稳定度较强,得到Type Ⅰ-3用电行为,该类用电行为波动幅度虽大但波动变化率较为恒定。
Type Ⅳ中,Type Ⅳ-1以REC强特征为区分指标,Type Ⅳ-2以REC弱特征为区分指标,Type Ⅳ-3以LAM弱特征为区分指标,分析同理于上述,此处不再详细说明。
上述分析有效说明了递归特征针对用户用电行为的波动信息及非线性动力信息有效挖掘,将其利用至负荷分类后进行用电行为二次细分,有效聚焦不同类型用电用户负荷曲线,为后续基于精细化用户分类开展进一步工作提供了极为有利的支撑。
智能电网的广泛建设与高级量测体系的快速发展,使得电力企业侧存储了海量的原始用户用电数据,复杂且随机性强的多源电力数据背后隐含更为丰富且深层次的隐形信息,并通常从用户及变电站的日负荷曲线体现。分析用电用户的负荷曲线作为挖掘用电特征的关键步骤,本质上讲,在高级量测体系中收集上来的海量细颗粒度、高分辨率的用户用电曲线反映出的用电隐私偏好,同时体现出的各类典型用电行为有待使用有效方法深入挖掘。
典型用电行为的提取一般通过聚类算法,即通过相似度衡量手段对用电曲线进行深入研究,而上述主流相似度衡量一般从线性时域角度出发,只考虑日负荷曲线对应时间点的数值分布特征,对用电曲线的整体动态特征加以分类,而难以反映更深层次的用电行为内部隐含非线性信息,并无法对用电行为的随机性、不确定性等特性进行具体程度的量化。
随着非线性科学技术水平的不断深入,递归量化方法从二维空间角度对时间序列系统的随机性、周期性等进行直观判别分析,并同时揭示了非线性系统的内部结构,进而可以得出相关变化程度、信息量的先验知识,很好地解决了上述非线性特性无法具体量化的问题。
而海量用户用电数据内隐含的用电行为存在各类差异,分析用户用电规律时对电量数据进行聚类分析,使用递归量化方法进行相应用电行为的非线性特征精细化分析,从而清晰认识到不同用电用户的隐性用电习惯及用电行为特点,进而对用户进行合理分类。针对不同用电用户的各类用电需求差异与行为特征,电力企业实行需求侧管理措施差异化,引导用电用户选择合理的用电时间,改善用电模式,优化用电结构,有效缓解供电压力。此外,掌握用电用户的负荷曲线特征可辅助提升负荷管理的精细化程度。
实施例2
本实施例提供一种用户用电行为分析系统,包括:
一次分类模块,被配置为获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;
递归特征提取模块,被配置为对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;
二次分类模块,被配置为以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。
此处需要说明的是,上述模块对应于实施例1中所述的步骤,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1中所述的方法。
实施例1中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现完成实施例1中所述的方法。
本发明还提供有形地存储在非暂时性计算机可读存储介质上的至少一个计算机程序产品。该计算机程序产品包括计算机可执行指令,例如包括在程序模块中的指令,其在目标的真实或虚拟处理器上的设备中执行,以执行如上所述的过程/方法。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、库、对象、类、组件、数据结构等。在各种实施例中,可以根据需要在程序模块之间组合或分割程序模块的功能。用于程序模块的机器可执行指令可以在本地或分布式设备内执行。在分布式设备中,程序模块可以位于本地和远程存储介质中。
用于实现本发明的方法的计算机程序代码可以用一种或多种编程语言编写。这些计算机程序代码可以提供给通用计算机、专用计算机或其他可编程的数据处理装置的处理器,使得程序代码在被计算机或其他可编程的数据处理装置执行的时候,引起在流程图和/或框图中规定的功能/操作被实施。程序代码可以完全在计算机上、部分在计算机上、作为独立的软件包、部分在计算机上且部分在远程计算机上或完全在远程计算机或服务器上执行。
在本发明的上下文中,计算机程序代码或者相关数据可以由任意适当载体承载,以使得设备、装置或者处理器能够执行上文描述的各种处理和操作。载体的示例包括信号、计算机可读介质、等等。信号的示例可以包括电、光、无线电、声音或其它形式的传播信号,诸如载波、红外信号等。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种用户用电行为分析方法,其特征在于,包括:
获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;
对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;
以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。
2.如权利要求1所述的一种用户用电行为分析方法,其特征在于,在一次分类的聚类处理和设定解释向量分类数的过程中,以最小化样本与聚类中心的误差平方和为目标,通过不同聚类数量下的误差平方和值绘制SSE曲线,根据SSE曲线的变化趋势,以SSE曲线初始拐点对应的聚类数量为所设定的最佳聚类数。
3.如权利要求1所述的一种用户用电行为分析方法,其特征在于,构建负荷递归图的具体过程包括:将负荷曲线转换为二维相空间轨迹,计算二维相空间轨迹中的每个向量与包括其自身的各向量的欧几里得范数,以i为行数,j为列数,组合为/>的递归矩阵,n为用电负荷数据的数量,将递归矩阵中每个元素乘以255,根据不同值映射为不同的RGB值,由此得到负荷递归图。
4.如权利要求1所述的一种用户用电行为分析方法,其特征在于,所述递归特征包括递归率、确定性、递归熵和层状度。
5.如权利要求1所述的一种用户用电行为分析方法,其特征在于,根据动态时间归整法确定每个解释向量与聚类中心曲线的相似度距离,并按照从大到小的顺序进行排序,将每个解释向量归类于相似度距离最小的类别。
6.如权利要求5所述的一种用户用电行为分析方法,其特征在于,计算每个解释向量的第1个递归特征到第k个递归特征,与聚类中心曲线的第1个递归特征到第k个递归特征的DTW距离,利用动态时间归整法构造累计距离矩阵,即二者的相似度距离。
7.一种用户用电行为分析系统,其特征在于,包括:
一次分类模块,被配置为获取用电负荷数据,对其进行聚类处理后,得到对用电行为一次分类的各类负荷曲线组;
递归特征提取模块,被配置为对每类负荷曲线组中的各负荷曲线均分别构建负荷递归图,并提取负荷递归图中的递归特征,构成解释向量;
二次分类模块,被配置为以解释向量为二次聚类样本,设定解释向量分类数,确定每类解释向量的聚类中心曲线,根据每个解释向量与聚类中心曲线的相似度,将其归类于与之最相似的类别,由此得到每类负荷曲线组下的用电行为二次分类结果。
8.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-6任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现完成权利要求1-6任一项所述的方法。
CN202410396192.6A 2024-04-03 2024-04-03 用户用电行为分析方法、系统、设备、介质及程序产品 Active CN117992856B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410396192.6A CN117992856B (zh) 2024-04-03 2024-04-03 用户用电行为分析方法、系统、设备、介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410396192.6A CN117992856B (zh) 2024-04-03 2024-04-03 用户用电行为分析方法、系统、设备、介质及程序产品

Publications (2)

Publication Number Publication Date
CN117992856A true CN117992856A (zh) 2024-05-07
CN117992856B CN117992856B (zh) 2024-06-21

Family

ID=90889085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410396192.6A Active CN117992856B (zh) 2024-04-03 2024-04-03 用户用电行为分析方法、系统、设备、介质及程序产品

Country Status (1)

Country Link
CN (1) CN117992856B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110535118A (zh) * 2019-08-07 2019-12-03 上海电力大学 基于改进递归有序聚类的有源配电网多时段动态重构方法
CN110659699A (zh) * 2019-09-30 2020-01-07 重庆大学 一种基于特征指标降维的分布式双层聚类分析方法
US20200144816A1 (en) * 2018-11-07 2020-05-07 Yishen Wang Submodular Load Clustering with Robust Principal Component Analysis
CN111126499A (zh) * 2019-12-25 2020-05-08 国网河北省电力有限公司 一种基于二次聚类的用电行为模式分类方法
CN113159106A (zh) * 2021-02-26 2021-07-23 国网甘肃省电力公司 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN113947159A (zh) * 2021-10-26 2022-01-18 山东工商学院 一种用电负荷实时在线监测与识别方法
CN114139650A (zh) * 2021-12-09 2022-03-04 青海大学 一种用户负荷双层聚类方法
CN115564156A (zh) * 2022-10-21 2023-01-03 城云科技(中国)有限公司 基于机器学习的事务聚集发生预警方法及其应用
CN116562113A (zh) * 2022-11-22 2023-08-08 国网四川省电力公司营销服务中心 一种基于聚类算法的用电评估方法、系统及介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200144816A1 (en) * 2018-11-07 2020-05-07 Yishen Wang Submodular Load Clustering with Robust Principal Component Analysis
CN110535118A (zh) * 2019-08-07 2019-12-03 上海电力大学 基于改进递归有序聚类的有源配电网多时段动态重构方法
CN110659699A (zh) * 2019-09-30 2020-01-07 重庆大学 一种基于特征指标降维的分布式双层聚类分析方法
CN111126499A (zh) * 2019-12-25 2020-05-08 国网河北省电力有限公司 一种基于二次聚类的用电行为模式分类方法
CN113159106A (zh) * 2021-02-26 2021-07-23 国网甘肃省电力公司 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN113947159A (zh) * 2021-10-26 2022-01-18 山东工商学院 一种用电负荷实时在线监测与识别方法
CN114139650A (zh) * 2021-12-09 2022-03-04 青海大学 一种用户负荷双层聚类方法
CN115564156A (zh) * 2022-10-21 2023-01-03 城云科技(中国)有限公司 基于机器学习的事务聚集发生预警方法及其应用
CN116562113A (zh) * 2022-11-22 2023-08-08 国网四川省电力公司营销服务中心 一种基于聚类算法的用电评估方法、系统及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋鲁;: "基于FPGA的串行结构递归神经网络LS-SVM实现", 中国科技信息, no. 24, 15 December 2015 (2015-12-15), pages 1 - 4 *

Also Published As

Publication number Publication date
CN117992856B (zh) 2024-06-21

Similar Documents

Publication Publication Date Title
Himeur et al. Robust event-based non-intrusive appliance recognition using multi-scale wavelet packet tree and ensemble bagging tree
Jin et al. Comparison of clustering techniques for residential energy behavior using smart meter data
Martínez-Ballesteros et al. Enhancing the scalability of a genetic algorithm to discover quantitative association rules in large-scale datasets
Jain et al. Validating clustering frameworks for electric load demand profiles
CN110493221A (zh) 一种基于聚簇轮廓的网络异常检测方法
Cai et al. An efficient outlier detection approach on weighted data stream based on minimal rare pattern mining
CN111898637B (zh) 一种基于ReliefF-DDC特征选择算法
CN111626360A (zh) 用于检测锅炉故障类型的方法、装置、设备和存储介质
CN111340065A (zh) 一种基于复杂用户行为分析的用户负荷窃电模型挖掘系统及方法
Deshpande et al. Pareto front approximation using a hybrid approach
CN117971625B (zh) 基于计算机云平台的性能数据智能监测系统
CN118094354A (zh) 一种分层级联电力敏感数据分类模型构建方法及装置
Dong et al. Concept drift region identification via competence-based discrepancy distribution estimation
CN117992856B (zh) 用户用电行为分析方法、系统、设备、介质及程序产品
Haining Statistical tests and process generators for random field models
CN103927765B (zh) 用于定位图像中条码区域的方法和装置
CN109214468A (zh) 一种基于可拓距优化聚类中心的数据聚类方法
CN113705920B (zh) 火电厂用水数据样本集的生成方法和终端设备
Al-Khamees et al. Survey: Clustering techniques of data stream
Au et al. A framework of irregularity enlightenment for data pre-processing in data mining
Prasad et al. Assessment of clustering tendency through progressive random sampling and graph-based clustering results
CN113535527A (zh) 一种面向实时流数据预测性分析的降载方法及系统
Butunoi et al. Shapelet based classification of customer consumption patterns
CN111143436A (zh) 用于大数据的数据挖掘方法
CN106776598B (zh) 一种信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant