CN116796213B - 一种基于聚类算法的配电网线变关系辨识方法 - Google Patents
一种基于聚类算法的配电网线变关系辨识方法 Download PDFInfo
- Publication number
- CN116796213B CN116796213B CN202310160804.7A CN202310160804A CN116796213B CN 116796213 B CN116796213 B CN 116796213B CN 202310160804 A CN202310160804 A CN 202310160804A CN 116796213 B CN116796213 B CN 116796213B
- Authority
- CN
- China
- Prior art keywords
- dimension reduction
- center
- clustering algorithm
- matrix
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000009466 transformation Effects 0.000 title claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 230000009467 reduction Effects 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 239000013598 vector Substances 0.000 claims description 27
- 230000008569 process Effects 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Landscapes
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明属于配电网线变关系辨识技术领域,公开了一种基于聚类算法的配电网线变关系辨识方法,提取配变的电压数据经过预处理后生成电压时间序列作为原始特征,并划分为多个电压时间子序列;使用PCA降维法对电压时间子序列组成的原始特征矩阵进行降维,获取降维后保留了最多原始特征的前k维特征矩阵;将获取的降维后的新特征和配变的相关性系数矩阵进行拼接得到全新的特征矩阵;输入到meanshift聚类算法中进行线变关系的辨识。本发明能够解决传统辨识方法中的单一特征辨识引起的误判率高的问题。
Description
技术领域
本发明属于配电网线变关系辨识技术领域,具体涉及一种基于聚类算法的配电网线变关系辨识方法。
背景技术
随着社会的发展,用户对供电可靠性的要求越来越高,为此电网公司在配电网中安装了大量的诸如断路器、环网柜、分段开关、联络开关等设备,以实现在故障时能够快速的改切线路以恢复供电,由于每次设备的动作没有及时更新到系统中,最终导致实际运行电网的线变关系和系统中的线变关系不一致。
传统上使用的人工巡线的方法,存在耗时耗力且不能实时辨识;基于硬件的方式需要加装大量的设备在配电网中,会造成巨大的财力消耗;基于数据驱动的方式存在校核阈值难以确定的难题。如何快速准确的辨识出配电网的线变关系是电网公司的难点,正确的配电网线变关系能够提升电网公司的管理及服务水平,例如使得停电发布更加合理、线损计算更加准确以及故障检修更加安全。
发明内容
为了快速准确的辨识出配电网的线变关系,本发明提供了一种基于聚类算法的配电网线变关系辨识方法,通过使用配变的每日96点电压采样数据做为原始特征,使用PCA降维法对电压时间子序列组成的原始特征矩阵进行降维,将降维后的新特征和配变的相关性系数矩阵进行拼接得到全新的特征矩阵;输入到meanshift聚类算法中进行线变关系的辨识。本发明采用的电压矩阵降维后与相关系数矩阵组合形成特征矩阵的方式,能够解决传统辨识方法中的单一特征辨识引起的误判率高的问题。
本发明通过以下技术方案来实现。一种基于聚类算法的配电网线变关系辨识方法,包括以下步骤:
步骤1:提取配变的电压数据经过预处理后生成电压时间序列作为原始特征,并划分为多个电压时间子序列;
步骤2:使用PCA降维法对电压时间子序列组成的原始特征矩阵进行降维,获取降维后保留了最多原始特征的前k维特征矩阵;
步骤3:将获取的降维后的新特征和配变的相关性系数矩阵进行拼接得到全新的特征矩阵;
步骤4:使用meanshift聚类算法对步骤3所得特征矩阵进行聚类;
步骤5:输出meanshift聚类结果,将远离聚类中心的配变判定为疑似线变关系错误,并进行人工核查。
进一步优选,步骤2具体过程如下:
步骤2.1:对原始特征矩阵的所有原始特征去中心化处理,具体为:求每一个原始特征的平均值,然后对于所有样本的原始特征,每一个原始特征都减去自身的平均值,得到去中心化特征;
式中,表示第i个原始特征的平均值,N表示样本数量,/>表示第i个原始特征的第j维;
步骤2.2:计算经过去中心化特征的协方差矩阵C;
式中,表示的第m个去中心化特征xcm与第n个去中心化特征xcn的方差;
其中:
式中,为第m个去中心化特征的第j维,/>第m个去中心化特征的平均值;
步骤2.3:根据计算协方差矩阵C的特征值/>和对应的特征向量u,
其中, v为特征矩阵,对于M维向量,对应有M个特征值,每一个特征值对应有u个特征向量;
计算主成分方差贡献率Vcr以及前l个主成分的累计方差贡献率Cvcr:
;/>
其中,为第i个特征值,M为特征值数量;
将特征值按照从小到大进行排序,选出累计贡献率达85%以上的特征值所对应的前k个,并将其相对应的k个特征向量拿出来作为新特征;
步骤2.4:将原始特征投影到选取的特征向量上,得到降维后的新k维特征;
选取最大的前k个特征值和相对应的特征向量,并进行投影的过程,就是降维的过程;对于原始特征,投影后的新特征的计算具体为:
表示投影后的第k个新特征的第j维,/>表示第k个特征向量的转置,/>表示第N个原始特征的第j维。
进一步优选,步骤4具体过程如下:
步骤4.1:在初始样本数据中确定一个中心点为Ce,计算在设置的半径为D的圆形空间内所有点与中心点的向量;
步骤4.2:计算整个圆形内所有向量的平均值得到一个偏移均值向量:
式中,Sh表示以Ce0为中心点,半径为h的高维球区域;p表示包含在Sh范围内点的个数;Cei表示包含在Sh范围内的点,则下次迭代的中心点为Ce;
步骤4.3:引入了核函数和样本权重对meanshift聚类算法进行改进,引入核函数的概念,使计算中距离中心的点具有更大的权值,反映距离越短,权值越大的特性,得到改进后的偏移均值向量:
式中,为改进后的偏移均值向量,/>是一个单位的核函数,/>为高维空间中的一个点,/>为为高维空间中的另一个点,H是一个正定的对称d*d矩阵,称为带宽矩阵,/>是每一个样本的权重;其中,/>;
步骤4.4:将中心点移动到偏移均值的位置从而实现中心更新,即将中心点朝向偏移均值的矢量方向移动:
式中,为t时刻下求得的偏移均值;/>为t时刻下的中心;/>为t+1时刻下的中心;
步骤4.5:重复移动,直到需要区分的配变区分开以后结束。
本发明的有益效果:本发明是一种数据驱动的配电网线变关系辨识的先进方法,能够采用配电网运行中的三相电压数据实现线变关系的快速辨识,且不需要耗费大量的人力物力财力,对电网公司的日常运行维护具有重要意义。具体来说,本发明仅仅采用电压数据便可实现线变关系的在线辨识,相较于其他方法有着极大的改进,是适用于当前电网运行模式下的优良技术方案。
本发明使用PCA降维的方式将电压时间序列进行处理以后保留了原有的最大特征,其次引入了聚类算法将属于同一条线路下的配变聚类到一起,错误配变将远离聚类中心,从而实现线变关系的准确辨识。
本发明采用Meanshift聚类算法的优点在于不需要提前进行聚类分类,这极大的满足了线变关系的辨识的需求,在线变关系辨识中,工作人员并不知道线路下到底有多少出错的配变,这些出错的配变是否属于同一线路也是不确定的,所以meanshift聚类算法的优点能解决这个难点,可以直接将线路下的所有的配变进行自分类后输出结果。
附图说明
图1是本发明的流程图。
图2是原始特征散点图。
图3是降维后的新k维特征散点图。
图4是meanshift聚类结果。
具体实施方式
下面结合附图和实施例对本发明进一步详细阐明。
参照图1,一种基于聚类算法的配电网线变关系辨识方法,包括以下步骤:
步骤1:提取配变的电压数据经过预处理后生成电压时间序列作为原始特征,并划分为多个电压时间子序列;
步骤1.1:从生产管理系统(PMS系统)、数据采集与监视控制系统(SCADA系统)中提取配变的每天96点电压采样数据进行处理,包括:异常值的替换(采用附近值的均值替代)、缺失值的填补(三项多项式插值法填补)等,最后将采集到的电压数据构造电压时间序列作为原始特征;
步骤1.2:由于在每天的不同时间段用户的用电量不同,所以将配变的每天96点电压时间序列划分为等长的24个电压时间子序列。
选取某省电力公司某日配变日96点的电压数据进行方法验证。提取配变的三相电压数据经过预处理后生成电压时间序列作为原始特征,并划分为多个电压时间子序列,表1为提取的电压数据。
表1 某线路配变三相电压采集值
步骤2:使用PCA降维法对电压时间子序列组成的原始特征矩阵进行降维,获取降维后保留了最多原始特征的前k维特征矩阵;
步骤2.1:对原始特征矩阵的所有原始特征去中心化处理,具体为:求每一个原始特征的平均值,然后对于所有样本的原始特征,每一个原始特征都减去自身的平均值,得到去中心化特征;
式中,表示第i个原始特征的平均值,N表示样本数量,/>表示第i个原始特征的第j维;
步骤2.2:计算经过去中心化特征的协方差矩阵C;
式中,表示的第m个去中心化特征xcm与第n个去中心化特征xcn的方差。
其中:
式中,为第m个去中心化特征的第j维,/>第m个去中心化特征的平均值;
步骤2.3:根据计算协方差矩阵C的特征值/>和对应的特征向量u,其中,v为特征矩阵,对于M维向量,对应有M个特征值,每一个特征值/>对应有u个特征向量。
计算主成分方差贡献率Vcr以及前l个主成分的累计方差贡献率Cvcr:
;/>
其中,为第i个特征值,M为特征值数量。
将特征值按照从小到大进行排序,选出累计贡献率达85%以上的特征值所对应的前k个,并将其相对应的k个特征向量拿出来作为新特征;
步骤2.4:将如图2所示的原始特征投影到选取的特征向量上,得到降维后的新k维特征(如图3所示的),在图2和图3中,横向距离和纵向距离构成特征的坐标,用于衡量特征之间的距离;
选取最大的前k个特征值和相对应的特征向量,并进行投影的过程,就是降维的过程。对于原始特征,投影后的新特征的计算具体为:
表示投影后的第k个新特征的第j维,/>表示第k个特征向量的转置,/>表示第N个原始特征的第j维;
步骤3:将获取的降维后的新特征和配变的相关性系数矩阵进行拼接得到全新的特征矩阵;
步骤4:使用meanshift聚类算法对步骤3所得特征矩阵进行聚类;
步骤4.1:在初始样本数据中确定一个中心点为Ce,计算在设置的半径为D的圆形空间内所有点与中心点的向量;
步骤4.2:计算整个圆形内所有向量的平均值得到一个偏移均值向量:
式中,Sh表示以Ce0为中心点,半径为h的高维球区域;p表示包含在Sh范围内点的个数;Cei表示包含在Sh范围内的点,则下次迭代的中心点为Ce;
步骤4.3:引入了核函数和样本权重对meanshift聚类算法进行改进,引入核函数的概念,使计算中距离中心的点具有更大的权值,反映距离越短,权值越大的特性,得到改进后的偏移均值向量:
式中,为改进后的偏移均值向量,/>是一个单位的核函数,/>为高维空间中的一个点,/>为为高维空间中的另一个点,H是一个正定的对称d*d矩阵,称为带宽矩阵,/>是每一个样本的权重;其中,/>;
步骤4.4:将中心点移动到偏移均值的位置从而实现中心更新,即将中心点朝向偏移均值的矢量方向移动:
式中,为t时刻下求得的偏移均值;/>为t时刻下的中心;/>为t+1时刻下的中心;
步骤4.5:重复移动,直到需要区分的配变(90%以上)区分开以后结束。
步骤5:输出meanshift聚类结果(如图4所示),将远离聚类中心的配变判定为疑似线变关系错误,并进行人工核查。在图4中,三个圆的圆心是区分开的聚类中心点,对meanshift聚类结果进行分析,将与聚类中心的横向距离差值达到5以上,或者与聚类中心的纵向距离差值达到3以上的配变便将其判定为线变关系错误的点,并进一步进行人工核查。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (2)
1.一种基于聚类算法的配电网线变关系辨识方法,其特征是,包括以下步骤:
步骤1:提取配变的电压数据经过预处理后生成电压时间序列作为原始特征,并划分为多个电压时间子序列;
步骤2:使用PCA降维法对电压时间子序列组成的原始特征矩阵进行降维,获取降维后保留了最多原始特征的前k维特征矩阵;
步骤3:将获取的降维后的新特征和配变的相关性系数矩阵进行拼接得到全新的特征矩阵;
步骤4:使用meanshift聚类算法对步骤3所得特征矩阵进行聚类;
步骤5:输出meanshift聚类结果,将远离聚类中心的配变判定为疑似线变关系错误,并进行人工核查。
2.根据权利要求1所述基于聚类算法的配电网线变关系辨识方法,其特征是,步骤4具体过程如下:
步骤4.1:在初始样本数据中确定一个中心点为Ce,计算在设置的半径为D的圆形空间内所有点与中心点的向量;
步骤4.2:计算整个圆形内所有向量的平均值得到一个偏移均值向量:
;
式中,Sh表示以C e0为中心点,半径为h的高维球区域;p表示包含在Sh范围内点的个数;C ei 表示包含在Sh范围内的点,则下次迭代的中心点为C e;
步骤4.3:引入了核函数和样本权重对meanshift聚类算法进行改进,引入核函数的概念,使计算中距离中心的点具有更大的权值,反映距离越短,权值越大的特性,得到改进后的偏移均值向量:
;
式中,为改进后的偏移均值向量,/>是一个单位的核函数,/>为高维空间中的一个点,/>为为高维空间中的另一个点,H是一个正定的对称d*d矩阵,称为带宽矩阵,/>是每一个样本的权重;其中,;
步骤4.4:将中心点移动到偏移均值的位置从而实现中心更新,即将中心点朝向偏移均值的矢量方向移动:
;
式中,为t时刻下求得的偏移均值;/>为t时刻下的中心;/>为t+1时刻下的中心;
步骤4.5:重复移动,直到需要区分的配变区分开以后结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310160804.7A CN116796213B (zh) | 2023-02-24 | 2023-02-24 | 一种基于聚类算法的配电网线变关系辨识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310160804.7A CN116796213B (zh) | 2023-02-24 | 2023-02-24 | 一种基于聚类算法的配电网线变关系辨识方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116796213A CN116796213A (zh) | 2023-09-22 |
CN116796213B true CN116796213B (zh) | 2023-11-21 |
Family
ID=88044475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310160804.7A Active CN116796213B (zh) | 2023-02-24 | 2023-02-24 | 一种基于聚类算法的配电网线变关系辨识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116796213B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112817296A (zh) * | 2020-12-30 | 2021-05-18 | 中国人民解放军空军预警学院 | 一种基于飞行数据与深度学习的飞行故障预测方法及系统 |
CN113595071A (zh) * | 2021-07-30 | 2021-11-02 | 广东电网有限责任公司广州供电局 | 台区用户辨识与电压影响评估方法 |
CN113824684A (zh) * | 2021-08-20 | 2021-12-21 | 北京工业大学 | 一种基于迁移学习的车载网络入侵检测方法及系统 |
CN115687952A (zh) * | 2023-01-03 | 2023-02-03 | 南昌工程学院 | 一种基于黎曼流形聚类的配电网线变关系辨识方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022186235A (ja) * | 2021-06-04 | 2022-12-15 | 富士通株式会社 | データクラスタリングプログラム、データクラスタリング方法および情報処理装置 |
-
2023
- 2023-02-24 CN CN202310160804.7A patent/CN116796213B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112817296A (zh) * | 2020-12-30 | 2021-05-18 | 中国人民解放军空军预警学院 | 一种基于飞行数据与深度学习的飞行故障预测方法及系统 |
CN113595071A (zh) * | 2021-07-30 | 2021-11-02 | 广东电网有限责任公司广州供电局 | 台区用户辨识与电压影响评估方法 |
CN113824684A (zh) * | 2021-08-20 | 2021-12-21 | 北京工业大学 | 一种基于迁移学习的车载网络入侵检测方法及系统 |
CN115687952A (zh) * | 2023-01-03 | 2023-02-03 | 南昌工程学院 | 一种基于黎曼流形聚类的配电网线变关系辨识方法及装置 |
Non-Patent Citations (2)
Title |
---|
基于主成分分析的单变量时间序列聚类方法;苏木亚;郭崇慧;;运筹与管理(06);全文 * |
基于多维尺度分析和改进K-means的台户关系辨识方法;王家驹;万忠兵;何仲潇;汪佳;谢智;王枭;;电气自动化(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116796213A (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699913A (zh) | 一种台区户变关系异常诊断方法及装置 | |
CN111598166B (zh) | 基于主分量分析和Softmax函数的单相接地故障分类方法和系统 | |
CN111080105A (zh) | 基于电压时序数据的台区户变关系识别方法及系统 | |
CN117421687B (zh) | 一种数字化电力环网柜运行状态监测方法 | |
CN111126429A (zh) | 一种基于PCA降维和K-Means聚类的低压台区用户接入点识别方法 | |
CN109829497A (zh) | 一种基于监督学习的台区用户识别及判别方法 | |
CN111738348B (zh) | 一种电力数据异常检测方法和装置 | |
CN113189418A (zh) | 一种基于电压数据的拓扑关系识别方法 | |
CN113435492A (zh) | 一种基于主动学习的电力系统主导失稳模式判别方法 | |
CN114386537A (zh) | 基于CatBoost的锂电池故障诊断方法、装置及电子设备 | |
CN115081933B (zh) | 一种基于改进谱聚类的低压用户拓扑构建方法和系统 | |
AU2021335237A1 (en) | Method for detecting abnormality of automatic verification system of smart watt-hour meter based on transductive support vector machine (TSVM) model | |
CN115954879A (zh) | 基于ao算法优化pnn的配电网线变关系精准辨识方法 | |
CN116845971A (zh) | 一种光伏并网低压台区拓扑结构自动识别方法 | |
CN117110798A (zh) | 智能配电网的故障检测方法和系统 | |
CN113536944A (zh) | 基于图像识别的配电线路巡检数据识别及分析方法 | |
CN111391694B (zh) | 一种充电站运行维护的多层次快速数据监测方法和系统 | |
CN116796213B (zh) | 一种基于聚类算法的配电网线变关系辨识方法 | |
CN116247668A (zh) | 一种基于量测大数据分析的配电网运行方式识别方法 | |
CN117113243A (zh) | 一种光伏设备异常检测方法 | |
CN112215482A (zh) | 一种户变关系识别方法和装置 | |
CN114838923B (zh) | 有载分接开关的故障诊断模型建立方法及故障诊断方法 | |
CN115856611A (zh) | 一种基于深度学习的高压断路器故障诊断方法 | |
CN113255775B (zh) | 一种电力系统异常数据的识别方法、装置和智能芯片 | |
CN114065129A (zh) | 一种基于谱聚类方法的线变关系检测方法及检测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |