CN115169424A - 一种基于Bagging-异质k近邻提升学习的电缆故障分类方法 - Google Patents
一种基于Bagging-异质k近邻提升学习的电缆故障分类方法 Download PDFInfo
- Publication number
- CN115169424A CN115169424A CN202110288608.9A CN202110288608A CN115169424A CN 115169424 A CN115169424 A CN 115169424A CN 202110288608 A CN202110288608 A CN 202110288608A CN 115169424 A CN115169424 A CN 115169424A
- Authority
- CN
- China
- Prior art keywords
- fault
- value
- heterogeneous
- bagging
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims abstract description 42
- 230000005540 biological transmission Effects 0.000 claims abstract description 19
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 4
- 239000010410 layer Substances 0.000 claims description 3
- 239000011241 protective layer Substances 0.000 claims description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 9
- 101100499229 Mus musculus Dhrsx gene Proteins 0.000 abstract description 4
- 238000007477 logistic regression Methods 0.000 abstract description 2
- 238000012706 support-vector machine Methods 0.000 description 4
- 229920003020 cross-linked polyethylene Polymers 0.000 description 2
- 239000004703 cross-linked polyethylene Substances 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000001012 protector Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Testing Of Short-Circuits, Discontinuities, Leakage, Or Incorrect Line Connections (AREA)
Abstract
本发明公开了一种基于异质提升学习的交叉互联电缆故障分类方法。首先,通过PSCAD/EMTDC模拟接头故障、交叉互联箱故障、接地系统异常等各类故障得到主芯及护层电流、电压、接地电阻值等相关电气参数,并通过参数归一化,构建电气参数特征矩阵。然后基于k近邻算法采用不同k值及不同距离度量作为个体学习器并构建高差子学习器,通过引入Bagging算法提高异质学习器的整体学习效率,可以实现针对不同类型、不同区域交叉互联输电电缆故障的区分。该方法相对于传统SVM、k‑近邻及逻辑回归等分类方法,降低了多分类误差率及空间复杂度并提高了模型泛化能力,具有较大的工程运用潜力。
Description
技术领域
本发明涉及电力系统输配电技术领域,尤其涉及一种基于Bagging-异质k 近邻提升学习的交叉互联电缆故障分类方法。
背景技术
随着我国社会经济的不断发展及电力市场需求的不断增加,高电压、长距离、大容量的输电技术也得到了稳定发展。电力电缆因其占地小、受环境因素影响小、输电性能稳定等优点逐渐代替架空输电线路被大量运用在输配电线路中,尤其是以交联聚乙烯(XLPE)绝缘电缆为代表的电缆线路更是在输配电系统中被大量应用。
输配电电缆故障时往往伴随着金属护层感应电压及感应电流的增大、故障及接头处温度上升和产生局部放电信号。每类故障分别具有不同的故障特征信号,因此可以通过采集交叉互联箱、保护接地箱内等护层电流、感应电压、接地电阻等相关参数经过一定的处理后,即可用于区分电缆故障类型,进一步地判断电缆运行状态,从而实现电缆故障诊断。
目前,在电缆故障分类运用中,常使用SVM、k近邻、决策树、神经网络等算法对各类数据、图片进行分类与识别,但这些算法对原始数据依赖度较高,学习精度较低。在简单SVM中,通过构建最大化间隔实现对超平面的分离,但对于较大数据,其处理性能较弱且仅适用于二分类模型,不利于多分类;k近邻算法可实现大样本多分类问题,但其泛化能力及近似误差对k值依赖度过高,需权衡好k值,否则其误分类率较大。其他算法也有类似问题,改进后的分类算法综合性能有一定的提升,但其运用场景比较单一。
发明内容
针对目前关于目前输配电交叉互联电缆线路故障分类不全、误分类错误率高等问题,本文提出一种基于Bagging-异质k近邻提升学习的交叉互联电缆故障分类方法。首先,通过PSCAD/EMTDC模拟接头故障、交叉互联箱故障、接地系统异常等各类故障得出主芯及护层电流、电压、接地电阻值等相关电气参数,并通过参数归一化,构建电气参数特征矩阵。然后基于k近邻算法采用不同k值及不同距离度量作为个体学习器并构建高差子学习器,通过引入Bagging算法提高异质学习器的整体学习效率。相对于传统SVM、k-近邻及逻辑回归等分类方法,本方法降低了多分类误差率及空间复杂度并提高了模型泛化能力,提出的改进方法具有更快的速度及更高的准确率,具有较大的工程运用潜力。
一种基于Bagging-异质k近邻提升学习的交叉互联电缆故障分类方法包括以下步骤:
步骤一:获取交叉互联电缆输电线路主芯电流、护层电流及接地电阻值;
所述步骤一可依托PSCAD/EMTDC模拟输配电线路正常及故障时相关参数;
进一步的,利用电流表、电压表获取电缆首末端主芯电流、电压、首末端接地电流及交叉互联处护层电流、电压值,得到初始参数矩阵D,归一化矩阵得到 D*;
进一步的,将上述参数特征电气处理,得到特征参数矩阵X;
进一步的,求得样本归一参数矩阵T,此时T为包含各类故障样本数据的特殊矩阵。
步骤二:构建故障标签
对于步骤一得到的故障样本数据的特殊矩阵,分别可表示电缆主芯故障、护层故障、接地系统故障等,其故障类型由归一数=化参数矩阵中元素决定;
进一步的,分类处各类故障对应的特征参数矩阵X,即电缆具体故障与矩阵 X对应;此时可以将故障分为N类,对应T矩阵中的γ;
步骤三:基于样本矩阵T构建基于Bagging-异质k近邻提升学习模型;所述步骤三首先构造基础k-NN模型,通过样本矩阵,构建k近邻模型,以做后期基础模型及对照组;
进一步的,通过Bagging方法,对原始样本进一步处理,得到一个新样本T', 其中,当通过Bagging法进行S次时,可以得到S+1个与原样本T矩阵同等样本量的训练矩阵;
进一步的,以单个样矩阵T为例、依次对异质k-NN模型进行训练;
进一步的,通过评估样本正确率、查全率,求出个异质k-NN对应权值;
进一步的,得到故障类型分类及预测函数。
有益效果:本发明首先通过构建参数样本矩阵,再基于Bagging-异质k近邻提升学习方法,对样本数据进行处理,实现对110kV交叉互联线路故障分类。极大的改进了传统故障检测方法精度低、复杂度高等问题。同时本方法泛化能力强,通过适当修改可运用在其他等级和结构的输电线路中。
附图说明
图1交叉互联电缆护层连接图
图2基于Bagging-异质k近邻提升学习方法
图3基于Bagging-异质k近邻提升学习故障分类流程图
图4各类故障仿真对比图
具体实施方式
以下具体展开本方法说明:
如图1所示,一种基于Bagging-异质k近邻提升学习的交叉互联电缆故障分类方法,包括以下步骤:
步骤一:获取交叉互联电缆输电线路主芯电流、护层电流及接地电阻值,记为矩阵D=[UCX UPX ICX IPX RE]T 5×5(X=A、B、C),其中UCX和ICX为首末端X相主芯电压及电流,UPX和IPX为护层感应电压及护层电流,RE为接地电阻值(其中采用的线路为首末单端接地形式,中间交叉互联接地,当线路结构改变时,只需改变相应矩阵D的结构即可,后文不再特殊说明)。
所述步骤一中矩阵D参数可以依托PSCAD/EMTDC模拟输配电线路正常及故障时实现,即分别模拟主芯故障(单芯断线及接地)、中间接头故障、护层损坏、互联箱故障(接线错误、进水、保护器损坏等)、接地系统故障(多点接地、悬浮接地等),通过模拟这些故障,得出相应参数矩阵;
进一步的,将矩阵D归一化处理,主芯电流、电压以额定电流、电压折算成其标幺值;接地电阻以4欧姆为基准值(GB 50169-2006)折算成标幺值;护层感应电压以50V为基准电压折算成表标幺值(GB 50127-2007)、护层电流以额定电流12%为基准值折算成相应的标幺值,组合上述参数重新构建归一化矩阵,有
步骤二:通过参数矩阵判断故障类型
1、当特征矩阵中发生变化时,即为主芯故障。主芯故障又可分为几类,当中间接头击穿或单相金属性接地时,该值为无穷大;但非金属性接地时,该值为一定值;当两线短路时,为另一定值等,对应不同主芯故障,定值也不同。即可通过值判断主芯故障类型;
步骤三:基于样本矩阵T构建基于Bagging-异质k近邻提升学习模型,所述步骤二仅可确定故障基础类型,进一步的可通过机器学习方法确定各类故障定值。首先需构建基础k-NN模型,该模型中距离度量用传统欧氏距离,即决策规则采用多数表决法,即由k个近邻的大部分类决定该故障样本数据点的类;k值先取通值3,再逐步改进,直至取到该模型最优值k1,得出在k值为3的故障分类模型,以作为后期Bagging-异质k近邻对照组。
进一步的,通过Bagging方法,对进一步处理,得到一个新样本T',该样本取样方法通过自助法,即从包含N个样本矩阵T中抽取,每次抽取一个,抽取 N次,即可获得新样本矩阵T',T'={(x'1,γ'1),(x'2,γ'2),...,(x'N,γ'N)},通过Bagging法可以获得更多新样本矩阵,本文取S=3,即共有4个样本矩阵。由于Bagging法特殊性,此时应有约36.8%的样本不在新构建样本中,此时可将这些样本作为新模型泛化能力“包外估计”;
进一步的,构造异质k-NN模型,该异质k-NN模型即为不同k值及不同种类距离度量下的k-NN集成学习器。该k-NN集成学习器即为基于Bagging-异质k 近邻将“弱学习器”构造成“强学习器”。此时距离度量可采用“曼哈顿距离”或“马氏距离”等,本文采用两组欧氏距离、两组马氏距离以作为距离度量,
进一步的,求取最优k值,此时k值先取通值3,经过一轮训练后,求取分类错误率F。当样本为故障样本且该模型分类正确时,记为TP;分类错误记为FP;当样本为非故障样本且该模型分类正确时,记为FN,分类错误记为TN。可得:
此时,为提高故障分类正确率,应提高对错误分类样本的关注,同时再次修改k值,记每类故障正确率为η,则其正率为η=[η1 η2 ... ηK],求出最大诊断正确率即ηmax,求出此时对应的k值,即为最优k值。
分别求出该k-NN最优质的kO=[kO1 kO2],对于马氏距离组,需另求最优值 kM=[kM1kM2]。
进一步的,求出马氏距离组与欧氏距离组在不同故障中分类特性,对于马氏距离组分类正确而欧氏距离组分类错误的k-NN组,需提高该马氏组模型的权值,进一步的,对于训练出的异质k-NN,进一步的,得到故障判断模型:
式中为每类分类器预测的故障值,ωi为每类分类器的权值。此时,只要输入对应电气值xi,便可得出该数据的是否为故障数据,且由H(X)值便可确定故障类型,该方法运用在其他等级输电线路同样适用,只需将归一化矩阵基准值改变即可。
最后说明,以上方法仅以一110kV交叉互联线路故障为例说明一种基于 Bagging-异质k近邻提升学习的交叉互联电缆故障分类方法,但本方法不局限于此案例,凡涉及类似电气特征参数提取、归一化及数据处理方法应视为本发明的精神与原则,对该方法做出的部分修改、替换及改进,均应包含在本发明的权利要求当中,应受本发明的保护。
Claims (6)
1.一种基于Bagging-异质k近邻提升学习的交叉互联电缆故障分类方法,其特征在与通过检测110kV交叉互联线路(或其他等级高压电缆输电线路)主芯首末端电压、电流及交叉互联段护层电压、电流值和各段接地电阻值,即可判断电缆运行状况。
3.根据权利要求2所述,当电缆输电线路发生故障时,特征矩阵水发生一定的变化,此时只要确定目标线路的故障特征值即可确定故障类型。
4.根据群里要求1所述,此时基于Bagging-异质k近邻提升学习即可求的故障特征值,即通过构建样本归一化参数矩阵T,对各类样本备注故障标签,此时可以将故障分为N类,对应T矩阵中的γ。
5.根据权利要求4,此时样本归一化参数矩阵T作为训练集与测试集,选取欧氏距离为距离度量,初始k值设为通用值3,开始训练kNN模型。并通过Bagging方法,处理原始样本得到新样本T',进一步构造异质k-NN模型,此时kNN模型中k值与距离度量发生改变,求取该异质k近邻提升学习方法故障分类正确率,求出最大正确率ηmax,求出此时对应的k值,即为最优k值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110288608.9A CN115169424A (zh) | 2021-03-17 | 2021-03-17 | 一种基于Bagging-异质k近邻提升学习的电缆故障分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110288608.9A CN115169424A (zh) | 2021-03-17 | 2021-03-17 | 一种基于Bagging-异质k近邻提升学习的电缆故障分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115169424A true CN115169424A (zh) | 2022-10-11 |
Family
ID=83476141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110288608.9A Pending CN115169424A (zh) | 2021-03-17 | 2021-03-17 | 一种基于Bagging-异质k近邻提升学习的电缆故障分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115169424A (zh) |
-
2021
- 2021-03-17 CN CN202110288608.9A patent/CN115169424A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110082640B (zh) | 一种基于长短时记忆网络的配网单相接地故障辨识方法 | |
Tong et al. | Detection and classification of transmission line transient faults based on graph convolutional neural network | |
CN114414942B (zh) | 基于暂态波形图像识别的输电线路故障辨识分类器、辨识方法及系统 | |
CN114167180B (zh) | 一种基于图注意力神经网络的充油电气设备故障诊断方法 | |
CN110542819A (zh) | 一种基于半监督dbnc的变压器故障类型诊断方法 | |
CN110609200A (zh) | 一种基于模糊度量融合判据的配电网接地故障保护方法 | |
JP3058564B2 (ja) | 送電線故障区間及び故障様相の評定方法 | |
CN110794254B (zh) | 一种基于强化学习的配电网故障预测方法及系统 | |
CN112327189A (zh) | 一种基于knn算法的储能电池健康状态综合判断方法 | |
CN115017828A (zh) | 基于双向长短时记忆网络的电力电缆故障识别方法及系统 | |
Maruf et al. | Locating faults in distribution systems in the presence of distributed generation using machine learning techniques | |
CN115712871A (zh) | 一种结合重采样和集成学习的电力电子系统故障诊断方法 | |
CN115409317A (zh) | 基于特征选择和机器学习的台区线损检测方法及装置 | |
CN105699806A (zh) | 一种多源谐波责任划分方法 | |
Wang et al. | The Cable Fault Diagnosis for XLPE Cable Based on 1DCNNs‐BiLSTM Network | |
CN111062569A (zh) | 一种基于bp神经网络的小电流故障判别方法 | |
CN113610119A (zh) | 基于卷积神经网络识别输电线路发展性故障的方法 | |
CN111896890B (zh) | 基于希尔伯特-黄变换的微电网线路故障诊断方法及系统 | |
CN113406437A (zh) | 一种基于辅助分类生成对抗网络的输电线路故障检测方法 | |
CN113376480A (zh) | 配电网接地故障选线方法 | |
CN115169424A (zh) | 一种基于Bagging-异质k近邻提升学习的电缆故障分类方法 | |
CN111898446A (zh) | 基于多算法归一化分析的单相接地故障研判方法 | |
CN112285482A (zh) | 一种有源配电网故障确定方法和系统 | |
Dehghani et al. | Distribution feeder classification based on self organized maps (case study: Lorestan province, Iran) | |
CN115184728A (zh) | 一种交直流混合配电网的故障识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |