CN105717420B - 电力电缆的合成聚类方法 - Google Patents
电力电缆的合成聚类方法 Download PDFInfo
- Publication number
- CN105717420B CN105717420B CN201610251196.0A CN201610251196A CN105717420B CN 105717420 B CN105717420 B CN 105717420B CN 201610251196 A CN201610251196 A CN 201610251196A CN 105717420 B CN105717420 B CN 105717420B
- Authority
- CN
- China
- Prior art keywords
- cable
- power cables
- matrix
- calculating
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000015572 biosynthetic process Effects 0.000 title abstract 4
- 238000003786 synthesis reaction Methods 0.000 title abstract 4
- 239000011159 matrix material Substances 0.000 claims abstract description 64
- 238000004458 analytical method Methods 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 6
- 238000010224 classification analysis Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000007418 data mining Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/081—Locating faults in cables, transmission lines, or networks according to type of conductors
- G01R31/083—Locating faults in cables, transmission lines, or networks according to type of conductors in cables, e.g. underground
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Z—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
- G16Z99/00—Subject matter not provided for in other main groups of this subclass
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及一种电力电缆的合成聚类方法,包括如下步骤:步骤(1):列写电缆的指标矩阵:步骤(2):计算电缆的历史运行状况得分:步骤(3):合成聚类:HC1:计算初始相异矩阵分数,从而获得相异矩阵;HC2:将差异最小的两个初始相异矩阵分数所对应的集合中的电力电缆合并至同一集合中;HC3:计算相异矩阵分数,从而更新相异矩阵,并返回HC2,直至仅获得一个集合为止;HC4:根据最后返回的一个集合计算R2指数。本发明的方法将不同型号电缆的结构特性作为分类变量,通过计算每种类型电缆的运行状况的得分,将具有相近分数的电缆类型归为一类,通过合成聚类的方法对电缆类型进行分组,便于按组别对电缆的故障行为进行研究。
Description
技术领域
本发明涉及对电缆群中的多根电力电缆进行分类,以便于按组别对电缆的鼓掌行为进行研究的合成聚类方法。
背景技术
随着数字化技术在电力系统中的广泛应用,电力系统运行数据快速增长。电缆通常埋于地下,具有可靠性高、安全系数高、节省空间等优点,随着电力、能源行业的发展,各种电缆越来越多地应用到生产生活的各个领域。电缆的故障行为与电缆的电缆类型有关,寻找电缆故障与其类型之间的关系十分重要,建立故障与类型之间的相关关系,可大大提高研究者对故障行为的研究效率。电缆结构特点可以按多个一级变量进行分类,如:电力电缆电压等级、电缆芯线截面积、电缆长度等,而每一个变量又包含有多个种类(分类变量),以电压芯线截面积为例,有1.5mm2、16mm2、35mm2等,电缆类型的分类涉及到结构特性的分类变量,这增加了数据集的维度,高维数据可以利用数据挖掘技术来简化数据分析。
数据挖掘技术是近年来应运而生的一门新兴技术,它能够利用现有的计算机技术和各个相关领域的知识,将其组织成适合决策分析需要的分析型数据,来提高整个管理系统的决策分析能力。聚类是常用的数据挖掘技术之一,它可以将相似的目标组合在一起,聚类方法已经在故障模式检测和故障模式识别上使用。与电缆结构特性相关的变量多种多样,而每种变量又有多种分类变量,考虑到电缆种类数相当庞大,亟需有效的分类方法。
发明内容
本发明的目的是提供一种能够将具有相似运行状况的电缆类型进行归类,便于电缆故障分析的电力电缆的合成聚类方法。
为达到上述目的,本发明采用的技术方案是:
一种电力电缆的合成聚类方法,用于对电缆群中的电力电缆进行分类分析,所述电力电缆的合成聚类方法包括如下步骤:
步骤(1):列写电缆的指标矩阵:
将所述电缆群中的各个所述电力电缆的分类变量组织在一个I×P的指标矩阵Z中,所述指标矩阵Z的行对应各个所述电力电缆,I为所述电缆群中电力电缆的数量,所述指标矩阵Z的列对应所述电力电缆的各项分类变量,P为所述分类变量的总数,所述指标矩阵Z中的元素Zi,p采用二进制表示所述电力电缆是否具有所述分类变量的特性;所述电缆群中包含T种不同型号的所述电力电缆;
步骤(2):计算电缆的历史运行状况得分:
基于所述指标矩阵Z对T种不同型号的所述电力电缆分别计算其历史运行状况得分;
步骤(3):合成聚类:
HC1:将T种不同型号的所述电力电缆分别对应于不同集合中,根据T种不同型号的所述电力电缆的历史运行状况得分计算表征不同集合中所述电力电缆之间差异的初始相异矩阵分数,从而获得相异矩阵;
HC2:将差异最小的两个所述初始相异矩阵分数所对应的集合中的所述电力电缆合并至同一集合中;
HC3:计算表征不同集合中所述电力电缆之间差异的相异矩阵分数,从而更新所述相异矩阵,并返回HC2,直至仅获得一个集合为止;
HC4:根据最后返回的一个集合计算R2指数。
所述步骤(1)中,首先将将所述电缆群中的各个所述电力电缆的一级变量组织在一个I×J的原始矩阵中,所述原始矩阵的行对应各个所述电力电缆,所述原始矩阵的列对应所述电力电缆的各项一级变量,J为所述一级变量的总数;将所述原始矩阵转化而得到所述指标矩阵Z。
所述步骤(2)中,以多重对应分析方法中的马氏距离作为评分标准而计算所述历史运行状况得分。
所述步骤(3)的HC1中,利用计算所述初始相异矩阵分数,其中sct、sct'为任意两种所述电力电缆的历史运行状况得分。
所述步骤(3)的HC3中,利用Ward聚类方法中的兰斯威廉公式计算所述相异矩阵分数。
所述步骤(3)的HC4中,根据计算所述R2指数,其中,TSS为所述集合的平方总和,SSE为所述集合的类内平方和。
由于上述技术方案运用,本发明与现有技术相比具有下列优点:本发明的方法将不同型号电缆的结构特性作为分类变量,通过计算每种类型电缆的运行状况的得分,将具有相近分数的电缆类型归为一类,通过合成聚类的方法对电缆类型进行分组,便于按组别对电缆的故障行为进行研究。
附图说明
附图1为本发明的方法的流程示意图。
附图2为本发明的方法中指标矩阵分类变量示意图。
附图3为本发明的方法中不同类型电缆分数计算示意图。
附图4为本发明的方法中合成聚类的流程示意图。
具体实施方式
下面结合实施例对本发明作进一步描述。
实施例一:
一种用于对电缆群中的电力电缆进行分类分析的电力电缆的合成聚类方法,如附图1所示,包括如下步骤:
步骤(1):列写电缆的指标矩阵:
首先将将电缆群中的各个电力电缆的一级变量组织在一个I×J的原始矩阵中,原始矩阵的行对应各个电力电缆,原始矩阵的列对应电力电缆的各项一级变量,I为电缆群中电力电缆的数量,行数i=1~I,J为一级变量的总数,列数j=1~J。用Pj表示某一个一级变量中包含的分类变量的种类数目,那么原始矩阵中包含的分类变量的总数将上述原始矩阵转化而得到指标矩阵Z,即将电缆群中的各个电力电缆的分类变量组织在一个I×P的指标矩阵Z中,指标矩阵Z的行对应各个电力电缆,I为电缆群中电力电缆的数量,指标矩阵Z的列对应电力电缆的各项分类变量,P为分类变量的总数。该指标矩阵Z中的元素Zi,p采用二进制(0-1)表示电力电缆是否具有分类变量的特性,如果电缆i具有某一个分类变量p的特征,则Zi,p的值为1,否则为0。电缆群中包含T种不同型号的电力电缆,t=1~T,每种型号的电力电缆具有Q种一级变量,即一级变量q=1~Q,每种一级变量q有pq个分类变量,如附图2所示。
步骤(2):计算电缆的历史运行状况得分:
基于指标矩阵Z对T种不同型号的电力电缆分别计算其历史运行状况得分。可以通过多重对应分析方法中的马氏距离(MD)作为评分标准而计算历史运行状况得分,从而得到一系列电力电缆的历史运行状况得分SC={sc1,…,sct,…,scT},t=1~T,即分别从每一个变量q的pq个分类变量中选取一个,组合成具有这些分类变量的电缆型号,如附图3所示。
步骤(3):合成聚类:
为便于描述,首先假设共有属于集合SC的三组分数和分别处于A、B、C三个独立的集合中。如附图4所示,合成聚类分析方法包含以下四个步骤:
HC1:将T种不同型号的电力电缆分别对应于不同集合中,根据T种不同型号的电力电缆的历史运行状况得分计算表征不同集合中电力电缆之间差异的初始相异矩阵分数,从而获得相异矩阵。这里利用
计算初始相异矩阵分数,其中sct、sct'为任意两种电力电缆的历史运行状况得分。从而三组分数可以获得如下相异矩阵:
其中,表示由和计算得出的初始相异矩阵分数;表示由和计算得出的初始相异矩阵分数;表示由和计算得出的初始相异矩阵分数。
HC2:将差异最小的两个初始相异矩阵分数所对应的集合中的电力电缆合并至同一集合中。假设上述相异矩阵中,那么则将分别具有分数和的电缆集合A和电缆集合B合并在一个电缆集合AB中。
HC3:计算表征不同集合中电力电缆之间差异的相异矩阵分数。这里利用Ward聚类方法中的兰斯威廉公式
计算相异矩阵分数。在式(2)中,A、B和C分别是集合A、B和C中分数的个数。
重新计算相异矩阵分数后,更新相异矩阵,并返回HC2,直至仅获得一个返回的集合为止。
HC4:适当数量的集合可以由R2指数来决定,R2指数可当做用于回归分析的确定系数。R2指数为“类间平方和”与“平方总和”的比,可以基于最后返回的一个集合利用下列计算公式得到计算R2指数。
式(3)中,TSS为集合的平方总和,SSE为集合的类内平方和。平方总和等于类内平方和与类间平方和的总和(TSS=SSE+SSW)。
上述方法将不同型号电缆的结构特性作为分类变量,通过计算每种类型电缆在过去运行状况的得分,将具有相近分数的电缆类型归为一类。通过合成聚类的方法对电缆类型进行分组,便于按组别对电缆的故障行为进行研究。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。
Claims (6)
1.一种电力电缆的合成聚类方法,用于对电缆群中的电力电缆进行分类分析,其特征在于:所述电力电缆的合成聚类方法包括如下步骤:
步骤(1):列写电缆的指标矩阵:
将所述电缆群中的各个所述电力电缆的分类变量组织在一个I×P的指标矩阵Z中,所述指标矩阵Z的行对应各个所述电力电缆,I为所述电缆群中电力电缆的数量,所述指标矩阵Z的列对应所述电力电缆的各项分类变量,P为所述分类变量的总数,所述指标矩阵Z中的元素Zi,p采用二进制表示所述电力电缆是否具有所述分类变量的特性;所述电缆群中包含T种不同型号的所述电力电缆;
步骤(2):计算电缆的历史运行状况得分:
基于所述指标矩阵Z对T种不同型号的所述电力电缆分别计算其历史运行状况得分;
步骤(3):合成聚类:
HC1:将T种不同型号的所述电力电缆分别对应于不同集合中,根据T种不同型号的所述电力电缆的历史运行状况得分计算表征不同集合中所述电力电缆之间差异的初始相异矩阵分数,从而获得相异矩阵;
HC2:将差异最小的两个所述初始相异矩阵分数所对应的集合中的所述电力电缆合并至同一集合中;
HC3:计算表征不同集合中所述电力电缆之间差异的相异矩阵分数,从而更新所述相异矩阵,并返回HC2,直至仅获得一个集合为止;
HC4:根据最后返回的一个集合计算R2指数。
2.根据权利要求1所述的电力电缆的合成聚类方法,其特征在于:所述步骤(1)中,首先将所述电缆群中的各个所述电力电缆的一级变量组织在一个I×J的原始矩阵中,所述原始矩阵的行对应各个所述电力电缆,所述原始矩阵的列对应所述电力电缆的各项一级变量,J为所述一级变量的总数;将所述原始矩阵转化而得到所述指标矩阵Z。
3.根据权利要求1所述的电力电缆的合成聚类方法,其特征在于:所述步骤(2)中,以多重对应分析方法中的马氏距离作为评分标准而计算所述历史运行状况得分。
4.根据权利要求1所述的电力电缆的合成聚类方法,其特征在于:所述步骤(3)的HC1中,利用计算所述初始相异矩阵分数,其中sct、sct'为任意两种所述电力电缆的历史运行状况得分。
5.根据权利要求1所述的电力电缆的合成聚类方法,其特征在于:所述步骤(3)的HC3中,利用Ward聚类方法中的兰斯威廉公式计算所述相异矩阵分数。
6.根据权利要求1所述的电力电缆的合成聚类方法,其特征在于:所述步骤(3)的HC4中,根据计算所述R2指数,其中,TSS为所述集合的平方总和,SSE为所述集合的类内平方和,所述平方总和等于类内平方和与类间平方和的总和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610251196.0A CN105717420B (zh) | 2016-04-21 | 2016-04-21 | 电力电缆的合成聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610251196.0A CN105717420B (zh) | 2016-04-21 | 2016-04-21 | 电力电缆的合成聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105717420A CN105717420A (zh) | 2016-06-29 |
CN105717420B true CN105717420B (zh) | 2019-03-08 |
Family
ID=56160396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610251196.0A Active CN105717420B (zh) | 2016-04-21 | 2016-04-21 | 电力电缆的合成聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105717420B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827311B (zh) * | 2019-11-05 | 2023-07-21 | 中铁十一局集团电务工程有限公司 | 一种基于成像法的电缆导体截面积测量方法及系统 |
CN114236303A (zh) * | 2020-09-09 | 2022-03-25 | 上海电缆研究所有限公司 | 大容量电缆网络状态的快速测试方法及测试系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59131176A (ja) * | 1983-01-17 | 1984-07-27 | Mitsubishi Electric Corp | 送電線故障位置検出装置 |
CN102831295B (zh) * | 2012-07-19 | 2015-12-16 | 华北电力大学 | 基于纹理聚类的电力塔杆图像描述方法 |
CN103279893B (zh) * | 2013-04-19 | 2016-01-13 | 华北电力大学 | 一种架空输电线路常见灾害区划图谱绘制方法 |
CN103413133B (zh) * | 2013-06-28 | 2014-10-22 | 广东电网公司电力科学研究院 | 无序激光点云数据中自动提取电力线方法 |
CN103558534B (zh) * | 2013-11-20 | 2016-01-20 | 国家电网公司 | 高压电缆放电信号的二维威布尔参数谱聚类分析方法 |
CN104699959B (zh) * | 2015-02-13 | 2017-10-24 | 国家电网公司 | 一种基于k‑means算法的线损同类划分方法 |
CN104657914B (zh) * | 2015-03-09 | 2018-02-27 | 云南电网公司昆明供电局 | 架空输电线路的运行状态评估的数学模型的建立方法 |
CN105044540B (zh) * | 2015-06-30 | 2018-12-14 | 昆明理工大学 | 一种在双回输电线路中利用瞬时功率进行主成分聚类分析的行波方向保护方法 |
-
2016
- 2016-04-21 CN CN201610251196.0A patent/CN105717420B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105717420A (zh) | 2016-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nawrin et al. | Exploreing k-means with internal validity indexes for data clustering in traffic management system | |
Jing et al. | Subspace clustering of text documents with feature weighting k-means algorithm | |
CN104169948A (zh) | 用于文本语义处理的方法、装置及产品 | |
CN102663447B (zh) | 基于判别相关分析的跨媒体检索方法 | |
CN104077311B (zh) | 车辆位置索引方法及装置 | |
CN103577839B (zh) | 一种邻域保持判别嵌入人脸识别方法及系统 | |
CN112905583A (zh) | 一种高维大数据离群点检测方法 | |
CN107291895A (zh) | 一种快速的层次化文档查询方法 | |
CN105717420B (zh) | 电力电缆的合成聚类方法 | |
Yang et al. | Based on k-means and fuzzy k-means algorithm classification of Precipitation | |
Saravanan et al. | Video image retrieval using data mining techniques | |
Li et al. | Fine-grained visual classification via multilayer bilinear pooling with object localization | |
Suguna | Ensemble fuzzy clustering for mixed numeric and categorical data | |
De Francesca et al. | Distance-based clustering of xml documents | |
Shah et al. | Software clustering using automated feature subset selection | |
US11048730B2 (en) | Data clustering apparatus and method based on range query using CF tree | |
CN117312885A (zh) | 工作面瓦斯涌出的动态阈值划分及多因素预警算法模型 | |
CN102902896A (zh) | 基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法 | |
Tian et al. | RSG-search: semantic traffic scene retrieval using graph-based scene representation | |
Chen et al. | Research on optimized R-tree high-dimensional indexing method based on video features | |
Xylogiannopoulos | From data points to data curves: A new approach on big data curves clustering | |
Hui et al. | Application of improved SAX algorithm to QAR flight data | |
Németh et al. | Preparation and cluster analysis of data from the industrial production process for failure prediction | |
Chen et al. | Efficient EMD-Based Similarity Search via Batch Pruning and Incremental Computation | |
Shahcheraghi et al. | Matrix Profile Index Approximation for Streaming Time Series |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |