CN116995653A - 一种基于ddtw距离的低压台区相户拓扑识别方法 - Google Patents

一种基于ddtw距离的低压台区相户拓扑识别方法 Download PDF

Info

Publication number
CN116995653A
CN116995653A CN202310742095.3A CN202310742095A CN116995653A CN 116995653 A CN116995653 A CN 116995653A CN 202310742095 A CN202310742095 A CN 202310742095A CN 116995653 A CN116995653 A CN 116995653A
Authority
CN
China
Prior art keywords
voltage
user
distance
data
ddtw
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310742095.3A
Other languages
English (en)
Inventor
刘斌
谈竹奎
代湘蓉
谭驰
唐赛秋
徐玉韬
潘旭辉
丛中笑
王秀境
黄浩
冯起辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202310742095.3A priority Critical patent/CN116995653A/zh
Publication of CN116995653A publication Critical patent/CN116995653A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00001Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by the display of information or by user interaction, e.g. supervisory control and data acquisition systems [SCADA] or graphical user interfaces [GUI]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00002Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00032Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于DDTW距离的低压台区相户拓扑识别方法包括:基于计量系统采集的各用户时序电压序列构建锯齿矩阵形式的台区用户时序电压数据集;根据获取的锯齿矩阵形式的台区用户时序电压数据集U,判定单个用户电压中的异常值;根据预处理后的电压数据集U',估算导数值,并计算最优对齐路径,以DDTW距离作为相似性指标;计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,对计算结果进行聚类,并完成识别。本发明所提供的基于DDTW距离的低压台区相户拓扑识别方法基于时间柔性对齐的距离度量,能够处理时间间隔不同、存在数据残缺的电压时间序列,有效降低了算法对数据缺失的敏感性,实现了数据残缺场景下低压台区的变‑户拓扑识别。

Description

一种基于DDTW距离的低压台区相户拓扑识别方法
技术领域
本发明涉及低压配电台区拓扑识别技术领域,尤其涉及一种基于DDTW距离的低压台区相户拓扑识别方法。
背景技术
低压配电台区是指低压配电变压器供电区域,其主要由配变、配电装置、配电线路和用户四部分构成,是配电网的末端环节,其中存在着数量庞大、复杂多元、产权不一的低压设备和终端设备。低压台区拓扑识别指的是识别低压配电变压器和台区用户(以下简称变-户)的拓扑从属关系,包括变-户拓扑和相-户拓扑。目前电网管理人员主要通过用户档案、台账、工单信息等对低压台区拓扑信息进行记录,但在实际生产过程中,台区间交叉供电、负荷转移会导致用户所属台区改变,自动换向装置动作、工人乱接线会导致用户所属相序改变,这些台区拓扑的变化难以被及时发现和记录。依靠人工现场排查验证台区拓扑结构,成本巨大且无法保证实时性,针对自动化的拓扑识别问题,国内外专家学者提出了一些较好的解决思路,按照技术类型的不同可以将现有的方法分为两大类:分别是基于硬件装置检测和数据挖掘分析。
现有专利(CN116154964A)通过云端主站将组帧解帧策略以及采集逻辑发送至台区融合终端,终端利用台区拓扑识别设备进行数据透传,并得到透传回复,终端根据透传回复生成台区拓扑图。该方法属于基于硬件装置检测的方法,其优点是依据真实物理装置和拓扑,可信度较高,但装置安装维护成本高,且通信信道受电磁环境影响。
现有专利(CN115800287A)基于台区电压数据相关性量化值构建相关矩阵中,基于矩阵元素最大值、均值进行均值化处理得到均值矩阵,利用阈值对台区均值矩阵中的元素进行二值化得到台区邻接矩阵,通过分割台区邻接矩阵转换得到的图确定台区拓扑关系。该方法属于基于数据挖掘分析的方法,计算简单快速,但以均值作为数据划分的主要依据,丢失了数据的分布特征和动态特征,无法准确反映台区电压数据的特征,且基于阈值进行划分是一种有监督的方法,需要不同场景下的专家知识与大量实验,泛化性较差。
现有专利(CN115663802A)以三倍的目标数量为分簇数,基于标记电压采集设备采集的标记电压数据、单相电能表采集的电表电压数据进行层次聚类,得到单相电表与采集设备在相位类别上的连接关系。该方法属于基于数据挖掘分析的方法,且是一种无监督的聚类算法,不需要人工设置阈值,鲁棒性较高,但层次聚类算法只能对等长序列进行处理,无法应对数据缺失导致各单相电表的电压序列不等长的情况。如果通过插值方法进行补全,将存在数据残缺的不等长序列补全成等长的序列,可以一定程度上解决上述问题,但插值数据实际上是引入了对真实数据的预测和推测并不能完全表征真实数据,因此基于插值数据进行台区拓扑识别会受插值方法的影响,会导致识别准确率下降。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述存在的问题,提出了本发明。
因此,本发明解决的技术问题是:低压台区拓扑识别基于时间刚性对齐的距离度量,无法处理时间间隔不同、存在数据残缺的电压时间序列问题;并且解决了传统DTW算法存在的病态对齐问题。
为解决上述技术问题,本发明提供如下技术方案:一种基于DDTW距离的低压台区相户拓扑识别方法,包括:
基于计量系统采集的各用户时序电压序列构建锯齿矩阵形式的台区用户时序电压数据集;
根据获取的锯齿矩阵形式的台区用户时序电压数据集U,判定单个用户电压中的异常值;
根据预处理后的电压数据集U',估算导数值,并计算最优对齐路径,以DDTW距离作为相似性指标;
计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,对计算结果进行聚类,并完成识别。
作为本发明所述的基于DDTW距离的低压台区相户拓扑识别方法的一种优选方案,其中:所述构建台区用户时序电压数据集的构建过程包括,
用户侧的各入户智能电表以15分钟为间隔采集用户6点日电压数据;
通过物联网通信方式将数据上行至台区集抄终端;
通过云端通信方式将数据转发至电网计量数据管理平台主站前置机;
利用数据服务器对用户电压数据进行存储备用;
从计量数据管理平台的历史数据中获取待识别台区内所有用户的时序电压批数据,形成台区用户时序电压锯齿矩阵U,如下式所示:
其中,uUi,tj表示第i个用户电表在第j个时间节点tj测量到的瞬时电压有效值,1≤i≤M,M为台区用户电表总数,1≤i≤Ni,Ni为第i个用户在时段内采集的用户电压颗粒数,当采集的电压数据不存在缺失时,Ni是一个常数N,U为M×N矩阵,当数据存在随机缺失时,Ni为不是常数,U为锯齿矩阵。
作为本发明所述的基于DDTW距离的低压台区相户拓扑识别方法的一种优选方案,其中:所述判定单个用户电压中的异常值通过绝对中位差法来完成,判定过程为,
依据绝对偏差值的中位数来设定用户日电压曲线的合理范围,超出范围内的负荷电压数据可标识所述异常值点数值异常,对于台区内某用户的电压幅值时间序列表示为u={u1,u2,…,um};
计算u的中位数;
计算日电压幅值数据中每一个采样点和的绝对值偏差,E={E1,E2,…,Em};
计算E中数值的中位数并设定/>
最后设定阈值σ=1.5×MAD,给用户节点的电压幅值设定合理的上下区间,当某数据点i对应的Ei超过阈值σ,则将数据点标识为异常值,并进行插值处理代替异常值;接着进行数据归一化处理,消除数据各维数量级差异,使用Z-归一化对原始数据进行处理,将每维特征均值映射为0,方差映射为1,映射后的台区Z-归一化时序电压锯齿矩阵U',如下式所示:
其中,表示第i个用户在tj时刻的Z-归一化电压,表示第i个用户在采集时段内的电压序列,E(·)表示数学期望,σ(·)表示标准差,减去期望视作选择期望作为原点,并将整个数据集平移到这个新的原点位置;标准化后的时序电压锯齿矩阵U'与原始台区时序电压锯齿矩阵U维度保持一致,且数据服从标准正态分布。
作为本发明所述的基于DDTW距离的低压台区相户拓扑识别方法的一种优选方案,其中:所述估算导数值所采用的方法为斜率平均法,估算过程为,
取U'中任意2个电压序列分别记为A={a1,a2,…,am}和B={b1,b2,…,bn},对于序列A,估算其各数据点导数序列并记为A',如下式所示:
其中m为A中元素的数量,ai为A中第i个元素;
同理估算出B的导数序列,记为B';
根据计算的两个导数序列A'和B',计算两序列各元素间的欧氏距离,并构成导数距离矩阵,其中A'中任意元素ui和B'中任意元素uj的欧氏距离的计算方法如下式所示:
计算A'和B'所有元素间的欧氏距离,并构成导数距离矩阵D。
作为本发明所述的基于DDTW距离的低压台区相户拓扑识别方法的一种优选方案,其中:所述计算最优路径所采用的方法为动态规划算法,具体计算步骤为,
根据计算的导数距离矩阵D,通过动态规划算法计算累积距离矩阵并回溯最优对齐路径;
计算使累积距离最小化,且满足边界条件、单调条件和步长条件的规整路径,作为各序列间的最优对齐;优化目标是找出满足一定约束的总代价最小的路径W={w1,w2,…,wk,…,wK},其中k∈{1,2,…,K},约束条件如下:
边界条件,w1=(1,1)和wk=(Ni,Ni);
连续性,当wk=(a,b)且wk-1=(a',b'),则必须满足a'-a≤1且b'-b≤1;
单调性,当wk-1=(a',b'),且wk=(a,b),则必须满足a-a'≥0且b-b'≥0;
通过动态规划算法计算累积距离矩阵Ω,从(p,q)=(1,1)出发搜索,对每一个(p,q)都存储相应的距离,所述距离是当前格点的匹配距离与前一个累计距离最小的格点搜索到(p,q)时,只保留一条最佳路径;
将上述过程用数学模型表达如下式所示:
通过上式求解出的累积距离矩阵Ω对应的(p,q)轨迹即为最优对齐路径W,分别使用DTW算法和DDTW算法获得的最优对齐路径;
根据求解的累积距离矩阵Ω,Ω的最后一个元素为两条电压序列A和B在最优对齐路径W下的DDTW距离,将Ω的最后一个元素作为度量两条电压序列相似性的指标,如下式所示:
DDTW(A,B)=Ω(P,Q)
其中P,Q为格点(p,q)的集合。
作为本发明所述的基于DDTW距离的低压台区相户拓扑识别方法的一种优选方案,其中:所述DDTW距离的计算过程为,
计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,构成大小为M×M的台区用户时序电压DDTW距离方阵,并将其作为台区各用户时序电压序列间的相似性度量以及后续聚类的依据,如下式所示,
计算出的台区用户时序电压DDTW距离方阵,对其进行k=3的K-Medoids聚类,获得3个聚类中心、聚类簇,以及每个用户的类别标签;
根据聚类后获得的台区每个用户的类别标签,从3类用户中每类任选1个用户,将所选用户的电压时序序列与低压配变三相电压时序序列进行k=3的K-Medoids聚类,实现用户类别标签与低压配变三相相序的两两匹配;
根据获得的类别标签与低压配变三相相序的匹配关系,结合聚类后获得的台区每个用户的类别标签,得到每个用户与低压配变三相相序的匹配关系,进而完成低压台区相-户从属关系识别。
作为本发明所述的基于DDTW距离的低压台区相户拓扑识别方法的一种优选方案,其中:所述K-Medoids聚类算法处理过程为,
从待聚类的数据点集中随机选择k个点,作为初始中心点;
将待聚类的数据点集中的点,指派到最近的中心点;
进入迭代,对每一个中心点Ci和每一个非中心点Pi,交换点Ci和Pi,重新计算交换后的划分所生成的代价值,当本次交换造成代价增加,则取消交换;
当两次聚类的中心位置不再变化时,则判定为聚类最终收敛。
为解决上述技术问题,本发明还提供如下技术方案:一种基于DDTW距离的低压台区相户拓扑识别系统,包括:
数据采集模块,用于采集各用户时序电压序列数据,并构建锯齿矩阵形式的台区用户时序电压数据集U;
异常值检测模块,用于对单个用户电压中的异常值进行判定,识别可能存在的异常情况;
数据预处理模块,用于对台区用户时序电压数据集U进行预处理,得到预处理后的电压数据集U';
导数估算模块,用于估算导数值,得到每个数据点的导数序列;
最优对齐路径计算模块,用于计算最优对齐路径,基于DDTW距离作为相似性指标,确定两个序列之间的最优对齐方式;
聚类与识别模块,用于计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,对计算结果进行聚类分析,识别相似的拓扑结构,判断台区相户的相似性。
一种计算机设备,包括:存储器和处理器;所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现本发明中任一项所述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现本发明中所述的方法的步骤。
本发明的有益效果:本发明所提供的基于DDTW距离的低压台区相户拓扑识别方法基于时间柔性对齐的距离度量,能够处理时间间隔不同、存在数据残缺的电压时间序列,有效降低了算法对数据缺失的敏感性,并且解决了传统DTW算法存在的病态对齐问题,实现了数据残缺场景下低压台区的变-户拓扑识别。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例提供的一种基于DDTW距离的低压台区相户拓扑识别方法的整体流程图;
图2为本发明一个实施例提供的一种基于DDTW距离的低压台区相户拓扑识别方法的累积矩阵Ω及最优对齐路径W的示意图;
图3为本发明一个实施例提供的一种基于DDTW距离的低压台区相户拓扑识别方法的使用DTW算法获得的最优对齐路径对应的两条用户时序电压序列间点数据点的对齐示意图;
图4为本发明一个实施例提供的一种基于DDTW距离的低压台区相户拓扑识别方法的使用DDTW算法获得的最优对齐路径对应的两条用户时序电压序列间点数据点的对齐示意图;
图5为本发明一个实施例提供的一种基于DDTW距离的低压台区相户拓扑识别方法的DDTW距离方阵的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1,为本发明的一个实施例,提供了一种基于DDTW距离的低压台区相户拓扑识别方法,包括:
S1:基于计量系统采集的各用户时序电压序列构建锯齿矩阵形式的台区用户时序电压数据集;
更进一步的,用户侧的各入户智能电表以15分钟为间隔采集用户96点日电压数据,通过物联网通信方式将数据上行至台区集抄终端,再通过云端通信方式将数据转发至电网计量数据管理平台主站前置机,然后利用数据服务器对用户电压数据进行存储备用。从计量数据管理平台的历史数据中获取待识别台区内所有用户的时序电压批数据,形成台区用户时序电压锯齿矩阵U,如下式所示:
其中,uUi,tj表示第i个用户电表在第j个时间节点tj测量到的瞬时电压有效值,1≤i≤M,M为台区用户电表总数,1≤i≤Ni,Ni为第i个用户在时段内采集的用户电压颗粒数,当采集的电压数据不存在缺失时,Ni是一个常数N,U为M×N矩阵,当数据存在随机缺失时,Ni为不是常数,U为锯齿矩阵。
S2:根据获取的锯齿矩阵形式的台区用户时序电压数据集U,使用绝对中位差法来判定单个用户电压中的异常值。
更进一步的,绝对中位差实际求法是用原数据减去中位数后得到的新数据的绝对值的中位数。依据绝对偏差值的中位数来设定用户日电压曲线的合理范围。超出范围内的负荷电压数据可标识该点数值异常。对于台区内某用户的电压幅值时间序列表示为u={u1,u2,…,um}。首先计算u的中位数;然后计算日电压幅值数据中每一个采样点和的绝对值偏差,E={E1,E2,…,Em};接着计算E中数值的中位数并设定/>最后设定阈值σ=1.5×MAD,从而给用户节点的电压幅值设定合理的上下区间,当某数据点i对应的Ei超过阈值σ,将该数据点标识为异常值,并进行插值处理代替异常值。接着进行数据归一化处理,即通过线性变换将数据映射成[0,1]区间内的无量纲形式,消除数据各维数量级差异,防止小数据被吞噬,增强数据的可比性。国标规定220V电压的波动范围为-10%~+7%,因此不同用户、同一用户不同时间断面的电压有效值均存在差异,使用Z-归一化对原始数据进行处理,将每维特征均值映射为0,方差映射为1,映射后的台区Z-归一化时序电压锯齿矩阵U',如下式所示:
其中,表示第i个用户在tj时刻的Z-归一化电压,表示第i个用户在采集时段内的电压序列,E(·)表示数学期望,σ(·)表示标准差,减去期望视作选择期望作为原点,并将整个数据集平移到这个新的原点位置,等效于偏置无关操作;除以标准差视作在坐标轴方向上对特征进行缩放,以降低特征尺度的影响,等效于尺度无关操作。标准化后的时序电压锯齿矩阵U'与原始台区时序电压锯齿矩阵U维度保持一致,且数据服从标准正态分布。
S3:根据预处理后的电压数据集,估算导数值,并计算最优对齐路径,以DDTW距离作为相似性指标;
更进一步的,根据数据预处理后的台区用户时序电压数据集U',估算台区用户时序电压数据集中各数据点的导数值,并构成导数矩阵。
应说明的是,用斜率平均法估算导数值:穿过该点和它左边邻点的直线的斜率和穿过该点左右邻点的直线的斜率的均值。只考虑待测点之外的两个点,这种导数估算方法的鲁棒性最强。取U'中任意2个电压序列分别记为A={a1,a2,…,am}和B={b1,b2,…,bn},对于序列A,估算其各数据点导数序列并记为A',如下式所示:
其中m为A中元素的数量,ai为A中第i个元素,i∈[1,m]。
同理可估算出B的导数序列,记为B'。
根据计算的两个导数序列A'和B',计算两序列各元素间的欧氏距离,并构成导数距离矩阵,其中A'中任意元素ui和B'中任意元素uj的欧氏距离的计算方法如下式所示:
计算A'和B'所有元素间的欧氏距离,并构成导数距离矩阵D。
更进一步的,根据计算的导数距离矩阵D,通过动态规划算法计算累积距离矩阵并回溯最优对齐路径。
应说明的是,该步骤本质是最优化问题,计算使累积距离最小化,且满足边界条件、单调条件和步长条件的规整路径,作为各序列间的最优对齐。其优化目标是找出满足一定约束的总代价最小的路径W={w1,w2,…,wk,…,wK},其中k∈{1,2,…,K},约束条件如下:
(1)边界条件:w1=(1,1)和wk=(Ni,Ni);
(2)连续性:当wk=(a,b)且wk-1=(a',b')时,则必须满足a'-a≤1且b'-b≤1;
(3)单调性:当wk-1=(a',b'),且wk=(a,b)时,则必须满足a-a'≥0且b-b'≥0。
通过动态规划(DynamicProgramming,DP)算法计算累积距离矩阵Ω,从(p,q)=(1,1)出发搜索,对每一个(p,q)都存储相应的距离,这个距离是当前格点的匹配距离与前一个累计距离最小的格点(按照设定的斜率在三个格点中进行比较)搜索到(p,q)时,只保留一条最佳路径。将上述过程用数学模型表达如下式所示:
通过上式求解出的累积距离矩阵Ω对应的(p,q)轨迹即为最优对齐路径W。累积矩阵Ω及最优对齐路径W的示意图如图2所示,三维柱状图反映了累积矩阵Ω每个元素值的分布,黑色曲线为最优对齐路径W,如果将累积矩阵Ω对应的柱状图类比作山峰,最优对齐路径W即为从山脚走到山顶的最短路径。分别使用DTW算法和DDTW算法获得的最优对齐路径,对应的两条用户时序电压序列间点数据点的对齐示意图如图3和图4所示。“正确”的对齐应该为直观明显的“特征到特征”的对齐,如波峰对应波峰,波谷对应波谷,从图3可以看出DTW算法存在一些病态对齐部分,这是因为在时间序列中,x轴表示观察时间,y轴表示观察值。DTW算法假设观察值中的所有变量都是由时间失真引起的。因此,DTW算法往往通过扭曲x轴来解释y轴上的所有波动,如果两个时间序列在y轴上也存在局部差异,就可能导致病态结果。而本发明所使用的DDTW算法不考虑数据点的y值,而是考虑“形状”这一更高级别的特征,并上述估算过程中的序列一阶导数来获得关于序列形状的信息,从而避免了DTW算法的病态对齐结果,如图3所示。
更进一步的,根据求解的累积距离矩阵Ω,Ω的最后一个元素即为两条电压序列A和B在最优对齐路径W下的DDTW距离,将它作为度量两条电压序列相似性的指标,如下式所示:
DDTW(A,B)=Ω(P,Q)
其中P,Q为格点(p,q)的集合。
S4:计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,对计算结果进行聚类,并完成识别。
更进一步的,计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,构成大小为M×M的台区用户时序电压DDTW距离方阵,如下式所示,并将其作为台区各用户时序电压序列间的相似性度量以及后续聚类的依据。
DDTW距离方阵的示意图如图5所示,色块红色程度越高代表横纵坐标对应的两用户时序电压序列间相似性越高,色块蓝色程度越高代表相似性越低。
更进一步的,计算出的台区用户时序电压DDTW距离方阵,对其进行k=3的K-Medoids聚类,获得3个聚类中心、聚类簇,以及每个用户的类别标签。K-Medoids聚类算法是一种划分式聚类算法,每次迭代选取新的聚类中心时,采用簇中位置最中心的对象,即中心点(medoids)作为参照点,因此相比于经典的K-Means聚类算法,当被聚类数据中存在噪声点或孤立点时,K-Medoids聚类算法更加健壮。K-Medoids聚类算法处理过程具体如下:
(1)从待聚类的数据点集中随机选择k个点,作为初始中心点;
(2)将待聚类的数据点集中的点,指派到最近的中心点;
(3)进入迭代,对每一个中心点Ci和每一个非中心点Pi,交换点Ci和Pi,重新计算交换后的该划分所生成的代价值,如果本次交换造成代价增加,则取消交换。
(4)当两次聚类的中心位置不再变化时,则判定为聚类最终收敛。
更进一步的,根据聚类后获得的台区每个用户的类别标签(由于聚类簇为3,因此标签取范围为[1,3]),从3类用户中每类任选1个用户,将其电压时序序列与低压配变三相电压时序序列进行k=3的K-Medoids聚类,即将不同类别标签用户的3条电压时序序列与低压配变三相的3条电压时序序列进行k=3的K-Medoids聚类,实现用户类别标签与低压配变三相相序的两两匹配。
更进一步的,根据获得的类别标签与低压配变三相相序的匹配关系,结合聚类后获得的台区每个用户的类别标签,可以得到每个用户与低压配变三相相序的匹配关系,进而完成低压台区相-户从属关系识别。
本实施例还提供一种计算设备,包括,存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出的实现一种基于DDTW距离的低压台区相户拓扑识别方法。
本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的一种基于DDTW距离的低压台区相户拓扑识别方法。
本实施例提出的存储介质与上述实施例提出的一种基于DDTW距离的低压台区相户拓扑识别方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器、磁变存储器、铁电存储器、相变存储器、石墨烯存储器等。易失性存储器可包括随机存取存储器或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器或动态随机存取存储器等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
实施例2
下面为本发明的一个实施例,提供了一种基于DDTW距离的低压台区相户拓扑识别方法,为了验证本发明的有益效果,可以通过仿真实验进行科学论证。
传统技术:
方法:基于阈值的异常值检测方法
阈值:3个标准差
聚类算法:K-means聚类算法
聚类数目:3
基于DDTW距离的方法:
DDTW距离阈值:5
模拟实验数据:
在这个模拟数据中,我们将使用基于DDTW距离的方法与传统技术方案进行对比。传统技术方案中使用基于阈值的异常值检测方法和K-means聚类算法。
实验步骤:
使用传统技术中的异常值检测方法,根据阈值(3个标准差),判定是否存在异常值;
根据异常值判定的结果,将异常值标记或移除,得到预处理后的电压数据集U';
使用传统技术中的K-means聚类算法,将预处理后的电压数据集U'进行聚类,聚类数目为3;
使用基于DDTW距离的方法,计算U'中每两个序列之间的DDTW距离;
根据DDTW距离阈值(5),判定是否存在异常相户;
对于未被判定为异常相户的序列,使用K-means聚类算法进行聚类,聚类数目为3;
通过比较基于DDTW距离的方法和传统技术方案在异常值检测和聚类识别方面的性能表现,可以评估基于DDTW距离的方法的优势,得出基于DDTW距离的方法能够更准确地检测出异常值,并提供更精确的聚类结果。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种基于DDTW距离的低压台区相户拓扑识别方法,其特征在于,包括:
基于计量系统采集的各用户时序电压序列构建锯齿矩阵形式的台区用户时序电压数据集;
根据获取的锯齿矩阵形式的台区用户时序电压数据集U,判定单个用户电压中的异常值;
根据预处理后的电压数据集U',估算导数值,并计算最优对齐路径,以DDTW距离作为相似性指标;
计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,对计算结果进行聚类,并完成识别。
2.如权利要求1所述的基于DDTW距离的低压台区相户拓扑识别方法,其特征在于:所述构建台区用户时序电压数据集的构建过程包括,
用户侧的各入户智能电表以15分钟为间隔采集用户6点日电压数据;
通过物联网通信方式将数据上行至台区集抄终端;
通过云端通信方式将数据转发至电网计量数据管理平台主站前置机;
利用数据服务器对用户电压数据进行存储备用;
从计量数据管理平台的历史数据中获取待识别台区内所有用户的时序电压批数据,形成台区用户时序电压锯齿矩阵U,如下式所示:
其中,表示第i个用户电表在第j个时间节点tj测量到的瞬时电压有效值,1≤i≤M,M为台区用户电表总数,1≤i≤Ni,Ni为第i个用户在时段内采集的用户电压颗粒数,当采集的电压数据不存在缺失时,Ni是一个常数N,U为M×N矩阵,当数据存在随机缺失时,Ni为不是常数,U为锯齿矩阵。
3.如权利要求1所述的基于DDTW距离的低压台区相户拓扑识别方法,其特征在于:所述判定单个用户电压中的异常值通过绝对中位差法来完成,判定过程为,
依据绝对偏差值的中位数来设定用户日电压曲线的合理范围,超出范围内的负荷电压数据可标识所述异常值点数值异常,对于台区内某用户的电压幅值时间序列表示为u={u1,u2,…,um};
计算u的中位数;
计算日电压幅值数据中每一个采样点和的绝对值偏差,E={E1,E2,…,Em};
计算E中数值的中位数并设定/>
最后设定阈值σ=1.5×MAD,给用户节点的电压幅值设定合理的上下区间,当某数据点i对应的Ei超过阈值σ,则将数据点标识为异常值,并进行插值处理代替异常值;接着进行数据归一化处理,消除数据各维数量级差异,使用Z-归一化对原始数据进行处理,将每维特征均值映射为0,方差映射为1,映射后的台区Z-归一化时序电压锯齿矩阵U',如下式所示:
其中,表示第i个用户在tj时刻的Z-归一化电压,表示第i个用户在采集时段内的电压序列,E(·)表示数学期望,σ(·)表示标准差,减去期望视作选择期望作为原点,并将整个数据集平移到这个新的原点位置;标准化后的时序电压锯齿矩阵U'与原始台区时序电压锯齿矩阵U维度保持一致,且数据服从标准正态分布。
4.如权利要求1所述的基于DDTW距离的低压台区相户拓扑识别方法,其特征在于:所述估算导数值所采用的方法为斜率平均法,估算过程为,
取U'中任意2个电压序列分别记为A={a1,a2,…,am}和B={b1,b2,…,bn},对于序列A,估算其各数据点导数序列并记为A',如下式所示:
其中m为A中元素的数量,ai为A中第i个元素;
同理估算出B的导数序列,记为B';
根据计算的两个导数序列A'和B',计算两序列各元素间的欧氏距离,并构成导数距离矩阵,其中A'中任意元素ui和B'中任意元素uj的欧氏距离的计算方法如下式所示:
计算A'和B'所有元素间的欧氏距离,并构成导数距离矩阵D。
5.如权利要求3所述的基于DDTW距离的低压台区相户拓扑识别方法,其特征在于:所述计算最优路径所采用的方法为动态规划算法,具体计算步骤为,
根据计算的导数距离矩阵D,通过动态规划算法计算累积距离矩阵并回溯最优对齐路径;
计算使累积距离最小化,且满足边界条件、单调条件和步长条件的规整路径,作为各序列间的最优对齐;优化目标是找出满足一定约束的总代价最小的路径W={w1,w2,…,wk,…,wK},其中k∈{1,2,…,K},约束条件如下:
边界条件,w1=(1,1)和wk=(Ni,Ni);
连续性,当wk=(a,b)且wk-1=(a',b'),则必须满足a'-a≤1且b'-b≤1;
单调性,当wk-1=(a',b'),且wk=(a,b),则必须满足a-a'≥0且b-b'≥0;
通过动态规划算法计算累积距离矩阵Ω,从(p,q)=(1,1)出发搜索,对每一个(p,q)都存储相应的距离,所述距离是当前格点的匹配距离与前一个累计距离最小的格点搜索到(p,q)时,只保留一条最佳路径;
将上述过程用数学模型表达如下式所示:
通过上式求解出的累积距离矩阵Ω对应的(p,q)轨迹即为最优对齐路径W,分别使用DTW算法和DDTW算法获得的最优对齐路径;
根据求解的累积距离矩阵Ω,Ω的最后一个元素为两条电压序列A和B在最优对齐路径W下的DDTW距离,将Ω的最后一个元素作为度量两条电压序列相似性的指标,如下式所示:
DDTW(A,B)=Ω(P,Q)
其中P,Q为格点(p,q)的集合。
6.如权利要求1所述的基于DDTW距离的低压台区相户拓扑识别方法,其特征在于:所述DDTW距离的计算过程为,
计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,构成大小为M×M的台区用户时序电压DDTW距离方阵,并将其作为台区各用户时序电压序列间的相似性度量以及后续聚类的依据,如下式所示,
计算出的台区用户时序电压DDTW距离方阵,对其进行k=3的K-Medoids聚类,获得3个聚类中心、聚类簇,以及每个用户的类别标签;
根据聚类后获得的台区每个用户的类别标签,从3类用户中每类任选1个用户,将所选用户的电压时序序列与低压配变三相电压时序序列进行k=3的K-Medoids聚类,实现用户类别标签与低压配变三相相序的两两匹配;
根据获得的类别标签与低压配变三相相序的匹配关系,结合聚类后获得的台区每个用户的类别标签,得到每个用户与低压配变三相相序的匹配关系,进而完成低压台区相-户从属关系识别。
7.如权利要求6所述的基于DDTW距离的低压台区相户拓扑识别方法,其特征在于:所述K-Medoids聚类算法处理过程为,
从待聚类的数据点集中随机选择k个点,作为初始中心点;
将待聚类的数据点集中的点,指派到最近的中心点;
进入迭代,对每一个中心点Ci和每一个非中心点Pi,交换点Ci和Pi,重新计算交换后的划分所生成的代价值,当本次交换造成代价增加,则取消交换;
当两次聚类的中心位置不再变化时,则判定为聚类最终收敛。
8.一种基于DDTW距离的低压台区相户拓扑识别系统,其特征在于,包括:
数据采集模块,用于采集各用户时序电压序列数据,并构建锯齿矩阵形式的台区用户时序电压数据集U;
异常值检测模块,用于对单个用户电压中的异常值进行判定,识别可能存在的异常情况;
数据预处理模块,用于对台区用户时序电压数据集U进行预处理,得到预处理后的电压数据集U';
导数估算模块,用于估算导数值,得到每个数据点的导数序列;
最优对齐路径计算模块,用于计算最优对齐路径,基于DDTW距离作为相似性指标,确定两个序列之间的最优对齐方式;
聚类与识别模块,用于计算台区用户时序电压数据集U'中每两个序列间的DDTW距离,对计算结果进行聚类分析,识别相似的拓扑结构,判断台区相户的相似性。
9.一种计算机设备,包括:存储器和处理器;所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202310742095.3A 2023-06-21 2023-06-21 一种基于ddtw距离的低压台区相户拓扑识别方法 Pending CN116995653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310742095.3A CN116995653A (zh) 2023-06-21 2023-06-21 一种基于ddtw距离的低压台区相户拓扑识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310742095.3A CN116995653A (zh) 2023-06-21 2023-06-21 一种基于ddtw距离的低压台区相户拓扑识别方法

Publications (1)

Publication Number Publication Date
CN116995653A true CN116995653A (zh) 2023-11-03

Family

ID=88531005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310742095.3A Pending CN116995653A (zh) 2023-06-21 2023-06-21 一种基于ddtw距离的低压台区相户拓扑识别方法

Country Status (1)

Country Link
CN (1) CN116995653A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574244A (zh) * 2024-01-15 2024-02-20 成都秦川物联网科技股份有限公司 基于物联网的超声波水表故障预测方法、装置及设备
CN117970182A (zh) * 2024-03-28 2024-05-03 国网山东省电力公司曲阜市供电公司 一种基于dtw算法的漏电预警方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574244A (zh) * 2024-01-15 2024-02-20 成都秦川物联网科技股份有限公司 基于物联网的超声波水表故障预测方法、装置及设备
CN117574244B (zh) * 2024-01-15 2024-04-02 成都秦川物联网科技股份有限公司 基于物联网的超声波水表故障预测方法、装置及设备
CN117970182A (zh) * 2024-03-28 2024-05-03 国网山东省电力公司曲阜市供电公司 一种基于dtw算法的漏电预警方法及系统

Similar Documents

Publication Publication Date Title
Rajabi et al. A comparative study of clustering techniques for electrical load pattern segmentation
CN116995653A (zh) 一种基于ddtw距离的低压台区相户拓扑识别方法
CN111061821B (zh) 基于改进k值聚类算法的低压配电网拓扑校验方法及系统
Si et al. Electric load clustering in smart grid: Methodologies, applications, and future trends
CN110231528B (zh) 基于负荷特征模型库的变压器户变异常识别方法及装置
CN110659693B (zh) 基于k近邻分类的配电网快速拓扑识别方法、系统及介质
CN113673580A (zh) 基于大数据建模的窃电嫌疑判断方法
CN116148753A (zh) 一种智能电能表运行误差监测系统
Bidoki et al. Comparison of several clustering methods in the case of electrical load curves classification
CN113805138A (zh) 一种基于参数有向遍历的智能电表误差估计方法及装置
CN110555619A (zh) 一种基于智能配电网的供电能力评估方法
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN112766590B (zh) 一种居民典型电力消费模式的提取方法与系统
CN117154716B (zh) 一种分布式电源接入配电网的规划方法及系统
CN110298765A (zh) 一种基于客观关联因素的配电网用电功率异常检测方法
Akperi et al. Analysis of clustering techniques on load profiles for electrical distribution
Jin et al. Power load curve clustering algorithm using fast dynamic time warping and affinity propagation
CN116937559A (zh) 基于循环神经网络和张量分解的电力系统负荷预测系统和方法
CN115912359B (zh) 基于大数据的数字化安全隐患识别排查治理方法
Azizi et al. Application of comparative strainer clustering as a novel method of high volume of data clustering to optimal power flow problem
CN116845971A (zh) 一种光伏并网低压台区拓扑结构自动识别方法
CN113191656B (zh) 一种基于数据关联分析的低压配电网设备负荷与拓扑联动方法
Tito et al. Image segmentation-based event detection for non-intrusive load monitoring using Gramian Angular Summation Field
CN113961869A (zh) 基于bdq-owd算法的低压配电网户变拓扑识别方法
CN114168662A (zh) 一种基于多数据源的配电网问题梳理分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination