CN116010893A - 一种基于用户电压数据的户变关系异常分析方法及系统 - Google Patents

一种基于用户电压数据的户变关系异常分析方法及系统 Download PDF

Info

Publication number
CN116010893A
CN116010893A CN202211739334.1A CN202211739334A CN116010893A CN 116010893 A CN116010893 A CN 116010893A CN 202211739334 A CN202211739334 A CN 202211739334A CN 116010893 A CN116010893 A CN 116010893A
Authority
CN
China
Prior art keywords
data
user
clustering
power
clustering center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211739334.1A
Other languages
English (en)
Inventor
任建宇
杨晓华
赵永辉
茶建华
杨子阳
李家浩
杨茗
杨昊
刘兴龙
代盛国
张益鸣
艾渊
孙立元
慕磊
刘国杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Power Grid Co Ltd
Original Assignee
Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Power Grid Co Ltd filed Critical Yunnan Power Grid Co Ltd
Priority to CN202211739334.1A priority Critical patent/CN116010893A/zh
Publication of CN116010893A publication Critical patent/CN116010893A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户电压数据的户变关系异常分析方法及系统包括,获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。本发明基于随机森林算法的SOM聚类方法受初始化的影响更小,为我国部分地区的台区线损提供能够理论依据,以达到降低线损,各处有效节省电量,管理效率更高的目的。

Description

一种基于用户电压数据的户变关系异常分析方法及系统
技术领域
本发明涉户变关系异常分析技术领域,尤其涉及一种基于用户电压数据的户变关系异常分析方法及系统。
背景技术
户变关系是指用户电表与变压器(台区)的归属关系,准确的台区户变关系是线损得以精确分析调整的前提,错误的户变关系将会导致台区管理过程中无法准确计算线损。有效计算低压台区线损并制定相应的降损策略,对提高企业经营效益,提升电网运行效率具有重要价值。
目前,我国在电力系统中主要依靠人工巡检逐一调查及梳理户变关系,不仅耗时耗力,而且在面对交叉融合台区区域时还会对经济造成严重损失。因此,本文提出一种基于用户电压数据的户变关系异常分析方法,相比于传统的聚类算法,本文所提出的基于随机森林算法的SOM聚类方法受初始化的影响更小,拥有更好的可视化关系。能够有效寻找异常户变关系,达到降损节能的目的。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明提供了一种基于用户电压数据的户变关系异常分析方法及系统,能够解决背景技术中提到的问题。
为解决上述技术问题,本发明提供如下技术方案,一种基于用户电压数据的户变关系异常分析方法,包括:
获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
作为本发明所述的基于用户电压数据的户变关系异常分析方法的一种优选方案,其中:所述预处理包括对电力数据缺失值进行处理、异常值进行处理以及对数据归一化处理,
所述缺失值进行处理包括采用拉格朗日插值法处理缺失数据,所述异常值进行处理包括对于离群值进行剔除,并使用基本邻近有序法对重复数据进行筛选处理,将数据分为若干个以固定值为大小的窗口,对每个窗口内的数据进行相似度对比,根据样本分类,采用差值来判断数据的相似度,即使用第一行的m个数据与第二行的m个数据进行插值运算,若差值为0,则删除第一行的数据,下一行的m个数据进入窗口,重复上一步,即可消除相同的重复数据;
归一化处理公式如下:
Figure BDA0004031973870000021
Figure BDA0004031973870000022
其中,
Figure BDA0004031973870000023
表示归一化后的ti时刻电压值,
Figure BDA0004031973870000024
表示ti时刻电压值,
Figure BDA0004031973870000025
表示电压均值,
Figure BDA0004031973870000026
为最大值,
Figure BDA0004031973870000027
表示最小值,VN为归一化后的台区所有用户电压的数据集合。
作为本发明所述的基于用户电压数据的户变关系异常分析方法的一种优选方案,其中:所述随机森林算法包括,
通过训练子集Z{(x1,y1),,(xn,yn)}构建随机森林模型H={h1,h2,,hn},其中hi为决策树,设第i棵O数据集为
Figure BDA0004031973870000028
对应的O分类准确度为ACi
对于任意一个特征f,随机置换训练集中其值,然后得到新的训练集Zf,计算决策树hi的准确率
Figure BDA0004031973870000029
可知对于决策树hi来说,其原O数据集
Figure BDA00040319738700000210
与特征置换后的O数据集准确率之差为:
Figure BDA00040319738700000211
特征对于准确率的影响程度
Figure BDA0004031973870000031
ef的方差为:
Figure BDA0004031973870000032
基于上式的准确率之差及方差可得数据特征的重要性,即
Figure BDA0004031973870000033
作为本发明所述的基于用户电压数据的户变关系异常分析方法的一种优选方案,其中:所述SOM聚类算法包括,
对当前输入模式向量X、权向量Wj(j=1,2,,m),全部进行归一化处理得到
Figure BDA0004031973870000034
Figure BDA0004031973870000035
Figure BDA0004031973870000036
Figure BDA0004031973870000037
对竞争层中归一化后的输入向量
Figure BDA0004031973870000038
与神经元所对应的权向量Wj(j=1,2,,m)的相似性进行比较,最相似的神经元获胜;
按WTA学习法则,获胜神经元输出为“1”,其余的神经元均为0,得到如下公式:
Figure BDA0004031973870000039
获胜的神经元调整其权向量为Wj *
Figure BDA00040319738700000310
其中,α为学习效率,区间为[0,1];
权向量经过调整后得到新的向量,与之前的并不相同,因此要对该新向量重新归一化,直到学习率α衰减到0。
作为本发明所述的基于用户电压数据的户变关系异常分析方法的一种优选方案,其中:所述皮尔逊相关系数包括,
Figure BDA0004031973870000041
其中,xi为第i个待识别用户,yi为第i个聚类中心,n为待识别用户个数,与聚类中心个数相同,
Figure BDA0004031973870000042
Figure BDA0004031973870000043
分别表示变量xi和yi的平均值,p在区间[-1,1]内。
作为本发明所述的基于用户电压数据的户变关系异常分析方法的一种优选方案,其中:所述功率平衡度包括,
Figure BDA0004031973870000044
其中,pA,t、pB,t分别为配变低压侧A、B相有功读数,pi,t、p′j,t为用户在t时刻有功功率,P(x)为功率平衡度,P(x)∈[0,+∞),优化目标为minP(x)→0,即满足用户端有功功率之和与变压器端有功功率相同,A、B为对应A相与B相,A、B相用户数分别为a,b。
作为本发明所述的基于用户电压数据的户变关系异常分析方法的一种优选方案,其中:还包括,
输入获得的电压时序数据;
对所输入的电压时序数据进行数据预处理;
采用随机森林算法对数据进行降维处理;
使用SOM聚类算法,收缩邻域半径,确定聚类中心;
计算所有待识别用户与聚类中心的皮尔逊相关系数;
将相关系数为强相关或极强相关用户判定为同一台区下,更新聚类中心;
对于与聚类中心相关程度弱的数据构成新的训练集;
使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
计算台区权向量调整前后线损率变化及功率平衡度;
输出台区内异常的户变关系数据。
一种基于用户电压数据的户变关系异常分析系统,其特征在于:包括预处理模块、降维聚类模块、二次更新聚类模块以及关系数据计算模块,
预处理模块,所述预处理模块用于获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
降维聚类模块,所述降维聚类模块用于对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
二次更新聚类模块,所述二次更新聚类模块用于计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
关系数据计算模块,所述关系数据计算模块用于计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上所述的方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
本发明的有益效果:本发明提出一种基于用户电压数据的户变关系异常分析方法及系统,本发明针对户变关系异常分析方法进行研究,提出了一种基于用户电压数据的户变关系异常分析方法,本文所提出的基于随机森林算法的SOM聚类方法受初始化的影响更小,拥有更好的可视化关系。为我国部分地区的台区线损提供能够理论依据,以达到降低线损,各处有效节省电量,管理效率更高的目的。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例提供的一种基于用户电压数据的户变关系异常分析方法及系统的方法流程图;
图2为本发明一个实施例提供的一种基于用户电压数据的户变关系异常分析方法及系统的计算机设备的内部结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1-2,为本发明的第一个实施例,该实施例提供了一种基于用户电压数据的户变关系异常分析方法及系统,包括:
步骤102,获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
其中,所述预处理包括对电力数据缺失值进行处理、异常值进行处理以及对数据归一化处理,
更进一步的,所述缺失值进行处理包括采用拉格朗日插值法处理缺失数据,所述异常值进行处理包括对于离群值进行剔除,并使用基本邻近有序法对重复数据进行筛选处理,将数据分为若干个以固定值为大小的窗口,对每个窗口内的数据进行相似度对比,根据样本分类,采用差值来判断数据的相似度,即使用第一行的m个数据与第二行的m个数据进行插值运算,若差值为0,则删除第一行的数据,下一行的m个数据进入窗口,重复上一步,即可消除相同的重复数据;
更进一步的,归一化处理公式如下:
Figure BDA0004031973870000071
Figure BDA0004031973870000072
其中,
Figure BDA0004031973870000073
表示归一化后的ti时刻电压值,
Figure BDA0004031973870000074
表示ti时刻电压值,
Figure BDA0004031973870000075
表示电压均值,
Figure BDA0004031973870000076
为最大值,
Figure BDA0004031973870000077
表示最小值,VN为归一化后的台区所有用户电压的数据集合。
步骤104,对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
其中,所述随机森林算法包括,通过训练子集Z{(x1,y1),,(xn,yn)}构建随机森林模型H={h1,h2,,hn},其中hi为决策树,设第i棵O数据集为
Figure BDA0004031973870000078
对应的O分类准确度为ACi
更进一步的,对于任意一个特征f,随机置换训练集中其值,然后得到新的训练集Zf,计算决策树hi的准确率
Figure BDA0004031973870000079
可知对于决策树hi来说,其原O数据集
Figure BDA00040319738700000710
与特征置换后的O数据集准确率之差为:
Figure BDA00040319738700000711
更进一步的,特征对于准确率的影响程度
Figure BDA00040319738700000712
ef的方差为:
Figure BDA0004031973870000081
更进一步的,基于上式的准确率之差及方差可得数据特征的重要性,即
Figure BDA0004031973870000082
应说明的是,所述SOM聚类算法包括,对当前输入模式向量X、权向量Wj(j=1,2,,m),全部进行归一化处理得到
Figure BDA0004031973870000083
Figure BDA0004031973870000084
Figure BDA0004031973870000085
Figure BDA0004031973870000086
更进一步的,对竞争层中归一化后的输入向量
Figure BDA0004031973870000087
与神经元所对应的权向量Wj(j=1,2,,m)的相似性进行比较,最相似的神经元获胜;
应说明的是,按WTA学习法则,获胜神经元输出为“1”,其余的神经元均为0,得到如下公式:
Figure BDA0004031973870000088
更进一步的,获胜的神经元调整其权向量为Wj *
Figure BDA0004031973870000089
其中,α为学习效率,区间为[0,1];
应说明的是,权向量经过调整后得到新的向量,与之前的并不相同,因此要对该新向量重新归一化,直到学习率α衰减到0。
步骤106,计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
更进一步的,所述皮尔逊相关系数包括,
Figure BDA0004031973870000091
其中,xi为第i个待识别用户,yi为第i个聚类中心,n为待识别用户个数,与聚类中心个数相同,
Figure BDA0004031973870000092
Figure BDA0004031973870000093
分别表示变量xi和yi的平均值,p在区间[-1,1]内。
应说明的是,所述功率平衡度包括,
Figure BDA0004031973870000094
其中,pA,t、pB,t分别为配变低压侧A、B相有功读数,pi,t、p′j,t为用户在t时刻有功功率,P(x)为功率平衡度,P(x)∈[0,+∞),优化目标为minP(x)→0,即满足用户端有功功率之和与变压器端有功功率相同,A、B为对应A相与B相,A、B相用户数分别为a,b。
步骤108,计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
更进一步的,输入获得的电压时序数据;
更进一步的,对所输入的电压时序数据进行数据预处理;
更进一步的,采用随机森林算法对数据进行降维处理;
更进一步的,使用SOM聚类算法,收缩邻域半径,确定聚类中心;
更进一步的,计算所有待识别用户与聚类中心的皮尔逊相关系数;
更进一步的,将相关系数为强相关或极强相关用户判定为同一台区下,更新聚类中心;
更进一步的,对于与聚类中心相关程度弱的数据构成新的训练集;
更进一步的,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
更进一步的,计算台区权向量调整前后线损率变化及功率平衡度;
更进一步的,输出台区内异常的户变关系数据。
一种基于用户电压数据的户变关系异常分析系统,其特征在于:包括预处理模块、降维聚类模块、二次更新聚类模块以及关系数据计算模块,
预处理模块,所述预处理模块用于获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
降维聚类模块,所述降维聚类模块用于对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
二次更新聚类模块,所述二次更新聚类模块用于计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
关系数据计算模块,所述关系数据计算模块用于计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
上述各单元模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图2所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于用户电压数据的户变关系异常分析方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
实施例2
参照图1-2,为本发明的一个实施例,提供了一种基于用户电压数据的户变关系异常分析方法及系统,为了验证本发明的有益效果,通过对比实验进行科学论证。
表1不同待识别用户与不同聚类中心的皮尔逊相关系数
待识别用户标号 聚类中心 皮尔逊相关系数 是否作为新的训练集
1 0.15
2 0.64
3 0.78
4 0.89
5 0.23
6 0.87
7 0.93
8 0.34
本发明提出一种基于用户电压数据的户变关系异常分析方法及系统,本发明针对户变关系异常分析方法进行研究,提出了一种基于用户电压数据的户变关系异常分析方法,本文所提出的基于随机森林算法的SOM聚类方法受初始化的影响更小,拥有更好的可视化关系。为我国部分地区的台区线损提供能够理论依据,以达到降低线损,各处有效节省电量,管理效率更高的目的。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种基于用户电压数据的户变关系异常分析方法,其特征在于:包括,
获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
2.如权利要求1所述的基于用户电压数据的户变关系异常分析方法,其特征在于:所述预处理包括对电力数据缺失值进行处理、异常值进行处理以及对数据归一化处理,
所述缺失值进行处理包括采用拉格朗日插值法处理缺失数据,所述异常值进行处理包括对于离群值进行剔除,并使用基本邻近有序法对重复数据进行筛选处理,将数据分为若干个以固定值为大小的窗口,对每个窗口内的数据进行相似度对比,根据样本分类,采用差值来判断数据的相似度,即使用第一行的m个数据与第二行的m个数据进行插值运算,若差值为0,则删除第一行的数据,下一行的m个数据进入窗口,重复上一步,即可消除相同的重复数据;
归一化处理公式如下:
Figure FDA0004031973860000011
Figure FDA0004031973860000012
其中,
Figure FDA0004031973860000013
表示归一化后的ti时刻电压值,
Figure FDA0004031973860000014
表示ti时刻电压值,
Figure FDA0004031973860000015
表示电压均值,
Figure FDA0004031973860000016
为最大值,
Figure FDA0004031973860000017
表示最小值,VN为归一化后的台区所有用户电压的数据集合。
3.如权利要求2所述的基于用户电压数据的户变关系异常分析方法,其特征在于:所述随机森林算法包括,
通过训练子集Z{(x1,y1),…,(xn,yn)}构建随机森林模型H={h1,h2,…,hn},其中hi为决策树,设第i棵O数据集为
Figure FDA0004031973860000021
对应的O分类准确度为ACi
对于任意一个特征f,随机置换训练集中其值,然后得到新的训练集Zf,计算决策树hi的准确率
Figure FDA0004031973860000022
可知对于决策树hi来说,其原O数据集
Figure FDA0004031973860000023
与特征置换后的O数据集准确率之差为:
Figure FDA0004031973860000024
特征对于准确率的影响程度
Figure FDA0004031973860000025
ef的方差为:
Figure FDA0004031973860000026
基于上式的准确率之差及方差可得数据特征的重要性,即
Figure FDA0004031973860000027
4.如权利要求3所述的基于用户电压数据的户变关系异常分析方法,其特征在于:所述SOM聚类算法包括,
对当前输入模式向量X、权向量Wj(j=1,2,…,m),全部进行归一化处理得到
Figure FDA0004031973860000028
Figure FDA0004031973860000029
Figure FDA00040319738600000210
Figure FDA00040319738600000211
对竞争层中归一化后的输入向量
Figure FDA00040319738600000212
与神经元所对应的权向量Wj(j=1,2,…,m)的相似性进行比较,最相似的神经元获胜;
按WTA学习法则,获胜神经元输出为“1”,其余的神经元均为0,得到如下公式:
Figure FDA00040319738600000213
获胜的神经元调整其权向量为
Figure FDA00040319738600000214
Figure FDA00040319738600000215
其中,α为学习效率,区间为[0,1];
权向量经过调整后得到新的向量,与之前的并不相同,因此要对该新向量重新归一化,直到学习率α衰减到0。
5.如权利要求4所述的基于用户电压数据的户变关系异常分析方法,其特征在于:所述皮尔逊相关系数包括,
Figure FDA0004031973860000031
其中,xi为第i个待识别用户,yi为第i个聚类中心,n为待识别用户个数,与聚类中心个数相同,
Figure FDA0004031973860000032
Figure FDA0004031973860000033
分别表示变量xi和yi的平均值,p在区间[-1,1]内。
6.如权利要求5所述的基于用户电压数据的户变关系异常分析方法,其特征在于:所述功率平衡度包括,
Figure FDA0004031973860000034
其中,pA,t、pB,t分别为配变低压侧A、B相有功读数,pi,t、p′j,t为用户在t时刻有功功率,P(x)为功率平衡度,P(x)∈[0,+∞),优化目标为minP(x)→0,即满足用户端有功功率之和与变压器端有功功率相同,A、B为对应A相与B相,A、B相用户数分别为a,b。
7.如权利要求6所述的基于用户电压数据的户变关系异常分析方法,其特征在于:还包括,
输入获得的电压时序数据;
对所输入的电压时序数据进行数据预处理;
采用随机森林算法对数据进行降维处理;
使用SOM聚类算法,收缩邻域半径,确定聚类中心;
计算所有待识别用户与聚类中心的皮尔逊相关系数;
将相关系数为强相关或极强相关用户判定为同一台区下,更新聚类中心;
对于与聚类中心相关程度弱的数据构成新的训练集;
使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
计算台区权向量调整前后线损率变化及功率平衡度;
输出台区内异常的户变关系数据。
8.一种基于用户电压数据的户变关系异常分析系统,其特征在于:包括预处理模块、降维聚类模块、二次更新聚类模块以及关系数据计算模块,
预处理模块,所述预处理模块用于获取台区内用电采集系统正常工况时段的电力数据,并对电力数据进行预处理;
降维聚类模块,所述降维聚类模块用于对所述预处理后的电力数据采用随机森林算法进行降维,并采用SOM聚类算法,收缩邻域半径,确定聚类中心;
二次更新聚类模块,所述二次更新聚类模块用于计算所有待识别用户与聚类中心的皮尔逊相关系数,按照相关性更新聚类中心,形成新的训练集,使用SOM聚类算法在其邻近区域调整权向量使其靠拢;
关系数据计算模块,所述关系数据计算模块用于计算台区权向量调整前后线损率变化及功率平衡度,得到台区内异常的户变关系数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202211739334.1A 2022-12-30 2022-12-30 一种基于用户电压数据的户变关系异常分析方法及系统 Pending CN116010893A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211739334.1A CN116010893A (zh) 2022-12-30 2022-12-30 一种基于用户电压数据的户变关系异常分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211739334.1A CN116010893A (zh) 2022-12-30 2022-12-30 一种基于用户电压数据的户变关系异常分析方法及系统

Publications (1)

Publication Number Publication Date
CN116010893A true CN116010893A (zh) 2023-04-25

Family

ID=86035136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211739334.1A Pending CN116010893A (zh) 2022-12-30 2022-12-30 一种基于用户电压数据的户变关系异常分析方法及系统

Country Status (1)

Country Link
CN (1) CN116010893A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117129790A (zh) * 2023-10-26 2023-11-28 山西思极科技有限公司 一种电力系统故障诊断系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117129790A (zh) * 2023-10-26 2023-11-28 山西思极科技有限公司 一种电力系统故障诊断系统
CN117129790B (zh) * 2023-10-26 2024-01-23 山西思极科技有限公司 一种电力系统故障诊断系统

Similar Documents

Publication Publication Date Title
Ding et al. Analysis of feature matrix in machine learning algorithms to predict energy consumption of public buildings
CN110135635B (zh) 一种区域电力饱和负荷预测方法及系统
CN107169628A (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN106909933A (zh) 一种三阶段多视角特征融合的窃电分类预测方法
CN106022614A (zh) 一种基于最近邻聚类的神经网络数据挖掘方法
CN111931989A (zh) 基于深度学习神经网络的电力系统短期负荷预测方法
CN107909221A (zh) 基于组合神经网络的电力系统短期负荷预测方法
CN116010893A (zh) 一种基于用户电压数据的户变关系异常分析方法及系统
CN110991737A (zh) 一种基于深度置信网络的超短期风电功率预测方法
CN112819225A (zh) 基于bp神经网络和arima模型的碳市场价格预测方法
CN115660233A (zh) 光伏功率预测方法、装置、电子设备及存储介质
CN116169670A (zh) 一种基于改进神经网络的短期非居民负荷预测方法及系统
CN115358437A (zh) 基于卷积神经网络的供电负荷预测方法
CN113887794A (zh) 一种配电网无功优化的方法及装置
CN112508254A (zh) 变电站工程项目投资预测数据的确定方法
CN117277312A (zh) 一种基于灰色关联分析的电力负荷影响因素方法及设备
CN111080037A (zh) 一种基于深度神经网络的短期电力负荷预测方法及装置
CN116957131A (zh) 一种基于层次时序和Informer模型融合的发电功率预测方法
CN111027017B (zh) 一种配电网管理状态综合评价系统
CN114971053A (zh) 低压台区网络线损率在线预测模型的训练方法及装置
CN112070200B (zh) 一种谐波群优化方法及其应用
CN106570618A (zh) 一种基于聚类分析和神经网络的负荷同时系数预测方法
Liu et al. Intelligent voltage prediction of active distribution network with high proportion of distributed photovoltaics
CN116502030A (zh) 一种考虑电压序列演变规律的电压暂降源识别方法
CN117349717A (zh) 一种考虑填补顺序的线损异常辨识与修正方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination