CN111210075B - 一种基于组合分类器的雷击输电线路故障概率分析方法 - Google Patents

一种基于组合分类器的雷击输电线路故障概率分析方法 Download PDF

Info

Publication number
CN111210075B
CN111210075B CN202010011919.6A CN202010011919A CN111210075B CN 111210075 B CN111210075 B CN 111210075B CN 202010011919 A CN202010011919 A CN 202010011919A CN 111210075 B CN111210075 B CN 111210075B
Authority
CN
China
Prior art keywords
sample
lightning
transmission line
classification
lightning stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010011919.6A
Other languages
English (en)
Other versions
CN111210075A (zh
Inventor
杜荣宇
徐箭
徐静
王俊
王力
曹文斌
刘朝阳
曹志鹏
张卫军
张智博
隋俊鹏
崔照鑫
常旭东
姚良忠
黎雄
廖思阳
张明一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd
State Grid Corp of China SGCC
Wuhan University WHU
Original Assignee
Chaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd
State Grid Corp of China SGCC
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd, State Grid Corp of China SGCC, Wuhan University WHU filed Critical Chaoyang Power Supply Co Of State Grid Liaoning Electric Power Supply Co ltd
Priority to CN202010011919.6A priority Critical patent/CN111210075B/zh
Publication of CN111210075A publication Critical patent/CN111210075A/zh
Application granted granted Critical
Publication of CN111210075B publication Critical patent/CN111210075B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)

Abstract

本发明提供了一种基于组合分类器的雷击输电线路故障概率分析方法,首先对含雷区等级、海拔高度、地面倾角、高程差和局部高程差的雷击运行数据进行离散化和标准化处理;利用这些雷击运行数据建立了支持向量机训练所需的数据集;接着利用支持向量机算法对这些雷击运行记录的子集进行了学习,并根据每个子集所得到的训练模型的分类结果分别计算分类准确率(Accuracy)、查全率(Recall)和查准率(Precision),从中选取综合性能最好的模型对整个样本集进行分类预测;最后,建立基于多支持向量机组合分类器的输电线路雷击风险评估模型,综合多个支持向量机分类器的输出结果对输电线路杆塔的雷击故障概率进行分析。

Description

一种基于组合分类器的雷击输电线路故障概率分析方法
技术领域
本发明涉及输电线路雷击风险评估领域,特别是涉及一种基于多支持向量机组合分类器的雷击输电线路故障概率分析方法。
背景技术
近年来,随着电网的快速发展和强对流天气的增加,雷害故障频繁发生。由于有效的侵入波和直击雷防护装置,变电站的雷击风险大大降低。目前,电网中雷击损害的风险主要集中在输电线路上,雷击导致传输线的两相闪络,同一塔的双回线路同时闪络,并且诸如同一传输信道上的多条线路的连续跳闸之类的严重故障显着增加。高电压,长距离,大容量输电线路的防雷工作面临新的挑战。
运行统计数据表明,雷击已经成为造成输电线路跳闸的主要原因。尽管目前已经采取了各种各样的防雷措施,但是雷击跳闸率仍然居高不下。线路避雷器等防雷措施的使用能够有效地降低雷击跳闸率,但是由于造价十分昂贵,不可能在输电线路上大规模使用。现有研究表明,不同地区、不同雷区等级、不同杆塔结构输电线路的防雷性能是存在差异的,因此如何更加有效地对输电线路杆塔雷击风险进行评估,从而针对风险等级最高的杆塔安装有效防雷措施将会极大降低输电线路的雷击跳闸率,同时也具有最好的经济性。
然而现有的防雷评估技术在实际的推广应用中还有以下问题尚需研究:
一是线路杆塔雷击风险受到雷电活动、地形、杆塔结构的众多因素的影响,且各个因素之间也存在着相互联系,因此雷击机理非常复杂,需要进一步研究输电线路杆塔在不同运行环境条件下的雷击风险,完善输电线路杆塔雷击风险评估方法;
二是传统防雷改造措施研究较少涉及防雷措施的有效性及其适用范围的研究。实际运行中,由于缺乏有效方法对防雷措施的有效性进行定量分析评价,造成不同防雷措施的有效性评估主观差异性较大,不同运行单位、不同运维人员针对同一种防雷措施可能给出完全相悖的有效性评价结果,不利于防雷改造措施的选择与防治效果的后评估,因此需要研究不同防雷措施的有效性定量评价方法及其适用范围,使得防雷措施的选择更加科学有效;
三是传统输电线路防雷性能评估技术所需参数较多,步骤复杂,且主要依靠人工录入和计算,对运维人员的专业水平和工作时间要求较高,不利于差异化防雷技术的推广应用,因此需要研究集合杆塔信息录入、雷电参数统计、雷击跳闸率计算和防治措施生成等功能于一体的专业防雷分析系统,具有操作简单,易用性强,便于线路运维人员掌握,开展输电线路差异化防雷评估与治理工作。
因此,可针对差异化防雷技术推广应用过程中存在的不足,研究雷击运行经验的量化分析方法,并深入挖掘历史雷击故障与杆塔运行环境特征参数的关联关系,从而建立基于历史雷击故障特征的输电线路雷击风险评估技术,考虑输电线路杆塔运行环境特征对雷击跳闸风险的影响,用以指导输电线路防雷改造具有十分重要的意义。
发明内容
为了解决背景技术中的技术问题,本发明的目的是提供一种输电线路雷击故障的概率分析方法。建立了一种基于多支持向量机组合分类器的雷击故障特征分类模型,从雷击运行经验角度出发,研究杆塔雷击故障与所处地区落雷密度、海拔、坡度、高程差和相对高程差之间的关联关系;针对支持向量机参数寻优的问题,提出了一种自适应的遗传算法,有效地改善了常规遗传算法由于得到的惩罚参数C值过大而导致模型分类准确率较低的问题。
为了达到上述目的,本发明采用以下技术方案实现:
一种基于组合分类器的雷击输电线路故障概率分析方法,包括步骤:
步骤1:导入测试数据集(包括数据的特征属性和分类类别),随机生成模型的训练数据集和验证数据集;对训练的数据进行预处理,包括离散化处理和归一化处理等,归一化处理如式x→x'=(x-xmin)/(xmax-xmin),其中,xmax,xmin分别表示此列特征属性中的最大值和最小值,x'表示归一化后的特征属性;
步骤2:针对样本的不平衡分布进行处理。在分类问题中,训练数据不平衡指的是不同类别下的样本数量相差太大,实际上,训练数据不平衡在分类问题中是十分常见且合理的情况,当数据样本分布不平衡时,容易导致训练得到的模型的泛化能力较差。
步骤3:采用kmeans聚类分析划分训练子集数,优化各个子支持向量机的参数,分别对各个子训练模型的惩罚参数C和核函数参数g进行寻优,本步骤进一步包括子步骤:
3.1设置网格搜索法中C和g的搜索范围和搜索步距。其中,C的初始范围设为[2-5,25],g的初始范围设为[2-10,210],搜索步长设为2,相较传统网格搜索法中将搜索步距设为0.1的做法,大大节省了算法搜索的时间;
3.2利用步骤3.1中网格搜索法搜索出参数组(C,g)的初步最佳值,即(bestC,bestg),将该组参数值作为后续遗传算法的基准值;
3.3设定遗传算法中参数寻优的范围。其中,C的范围设为(0.5bestC,2bestC),g的范围设定为(0.5bestg,2bestg);
步骤4:对各个子模型的分类结果采用如下的评价指标进行比较;
Figure BDA0002357445450000031
Figure BDA0002357445450000032
Figure BDA0002357445450000033
步骤5:建立雷击故障概率预测模型,通过选取分类性能靠前的支持向量机分类器构建多支持向量机的组合分类器,综合不同参数训练下的支持向量机的输出,得到输电线路杆塔的雷击故障概率。
与现有技术相比,本发明的有益效果是:
本发明建立了一种基于多支持向量机组合分类器的雷击故障特征分类模型,从雷击运行经验角度出发,研究杆塔雷击故障与所处地区落雷密度、海拔、坡度、高程差和相对高程差之间的关联关系;针对支持向量机参数寻优的问题,提出了一种自适应的遗传算法,有效地改善了常规遗传算法由于得到的惩罚参数C值过大而导致模型分类准确率较低的问题。
附图说明
图1是自适应遗传算法流程图;
图2是多支持向量机组合分类器的建立示意图;
图3是多支持向量机组合分类器的建立流程图。
具体实施方式
以下结合附图对本发明提供的具体实施方式进行详细说明。
如图1-3所示,本发明输电线路雷击故障概率分析方法的具体步骤如下:
步骤1:在收集到模型训练需要的数据特征集合时,先对数据进行提取、过滤,去掉不真实或者不需要的数据,并根据训练算法的需要对数据进行预处理,如数据的归一化处理、连续特征属性的离散化处理等。对于输电线路杆塔雷击运行数据的特征属性,选取落雷密度、杆塔海拔、坡度、高程差和相对高程差这些特征。设特征为Xi的所有样本数据的标准差为σ,均值为μ,则原始样本数据xij(特征为Xi的第j个样本)经过标准差标准化后得到的新数据为
Figure BDA0002357445450000041
步骤2:对数据样本的不平衡分布进行处理。采用数据集划分的方式设计相应的大样本类别(称为MA类别)和小样本类别(称为MI类别)的比例,假设原始数据集中各类别的样本比例为MA:MI=p:q(p>>q),样本总数为m,则MA类别的样本数为mp/(p+q),MI类别的样本数为mq/(p+q),假若希望子集中的MA类别样本数和MI类别样本数的比为s:t,则mp/(p+q)个MA类样本应该被划分为pt/qs个子集,该划分的子集数即为kmeans聚类分析的聚类群数k;
步骤3:进行训练子集的划分,先对未曾发生过雷击跳闸故障的输电线路杆塔进行k-means聚类分析得到k个子集,再将发生过雷击跳闸故障的杆塔样本加入到上述k个子集中得到k个训练子集。优化支持向量机的参数,分别对k个训练模型的惩罚参数C和核函数参数g进行寻优,并对各个模型的分类结果进行比较。
其中,参数C和g采用如下方法进行寻优。首先,设置网格搜索法中C和g的搜索范围和搜索步距。其中,C的初始范围设为[2-5,25],g的初始范围设为[2-10,210],搜索步长设为2;其次,利用上述网格搜索法搜索出参数组(C,g)的初步最佳值,即(bestC,bestg),将该组参数值作为后续遗传算法的基准值;最后,设定遗传算法中参数寻优的范围,其中,C的范围设为(0.5bestC,2bestC),g的范围设定为(0.5bestg,2bestg),算法实现的流程见图1。
步骤4:采用分类准确率(Accuracy)、查全率(Recall)和查准率(Precision)对各子模型的分类结果进行评价,从中选取综合性能最好的模型对整个杆塔样本集进行分类预测。分类准确率、查全率和查准率的计算公式如下:
Figure BDA0002357445450000042
Figure BDA0002357445450000051
Figure BDA0002357445450000052
步骤5:通过建立多SVM组合分类器对整个样本集进行分类预测,根据每个SVM模型中各个杆塔样本分别到相应分类超平面的距离得到每株杆塔归属类别的概率,建立基于多SVM组合分类器的杆塔的雷击风险评估方法。
其中,各个杆塔样本所属类别的概率计算采用如下的方法。
Figure BDA0002357445450000053
Figure BDA0002357445450000054
Figure BDA0002357445450000055
式中,g(x)的大小表示待分类的样本到分类超平面的距离,其正负表示该样本与分类超平面的相对位置的方向;P(C1|x)和P(C0|x)分别表示待分类的样本被分类为1和0的概率,易知P(C1|x)+P(C0|x)=1。
SVM输出的概率反映了待分类样本属于不同类别的可能性,能够有效地针对待分类样本与最优分类超平面的距离进行归一化处理,从而针对输出结果进行可信度评价:
R=max{P(C1|x),P(C0|x)}  (4)
对于二分类问题,可信度R在50%—100%之间。
利用多个SVM训练得到的模型组合成一个多SVM分类器的过程见图2。
图2中,xi(i=1,2,...,N)为输电线路杆塔的特征输入量;yi(i=1,2,...,M)(yi=1表示输电线路雷击风险为“1”,yi=0表示输电线路雷击风险为“0”)为利用不同参数进行SVM训练后分别得到的对于输电线路雷击风险的预测值;Z表示多SVM分类器的输出结果。
Figure BDA0002357445450000056
即当且仅当多个SVM的输出结果均为1时,多SVM分类器对于输电线路杆塔雷击风险的评估结果才为“1”,此时,需要针对该杆塔安装有效的防雷措施;否则,多SVM分类器的输出结果为0,表示输电线路杆塔的雷击风险为“0”。
实施例
基于多支持向量机组合分类器的雷击输电线路故障概率分析方法的有效性校验
数据:湖北省实际的500kV架空输电线路杆塔雷击运行数据
对于输电线路杆塔雷击运行数据的特征属性,选取落雷密度、杆塔海拔、坡度、高程差和相对高程差这些特征,由于这些特征属性的数值较多,需要先进行离散化处理。以落雷密度的离散化处理结果为例,根据对湖北省500kV输电线路雷击运行情况中落雷密度的分析,可将输电线路周围的雷区等级划分为少雷区(A级),中雷区(B1和B2级),多雷区(C1和C2级)和强雷区(D1和D2级),特征离散化后的标记情况见表1。
表1落雷密度的离散化
Figure BDA0002357445450000061
从湖北省500kV杆塔雷击运行数据来看,曾发生过雷击跳闸故障的杆塔样本和未曾发生过雷击跳闸故障的样本存在严重的分布不平衡性,其中未曾发生过雷击跳闸故障的杆塔数(称为MA类别)和发生过雷击跳闸故障的杆塔数(称为MI类别)的比例约为256:1,因此必须对数据的不平衡分布进行处理。根据发明内容中步骤6介绍的对样本不平衡分布的处理方式,采用数据集划分的方式设计相应的MA和MI类别的比例。在本例中,样本总数m=22108,原始数据集中各类别样本比例为MA:MI≈250:1,假设期望的子集样本分布为s:t≈10:1,则22022个MA样本应该被划分为(250×1)/(10×1)=25个子集,该划分的子集数就是k-means的聚类群数k。
表2训练样本25个子集的分布
Figure BDA0002357445450000071
当MA类别样本划分子集数确定后,即需要将原始数据集中未曾发生过雷击跳闸故障的杆塔样本划分成25个子集,子集的划分采用k-means聚类分析技术,将22022个未曾发生过雷击跳闸故障的样本根据聚类中心划分成相应的子集。MA类别的样本子集划分完成后,将MI类别的样本(即曾经发生过雷击跳闸故障的杆塔样本)分别加到上述各个子集中形成25个训练子集,具体的样本分布见表2。
在对各个训练子集得到的模型进行测试时,采用从另外24个子集中随机选取一个子集作为测试样本集的方法对模型的分类性能进行测试。利用libsvm软件包构造分类器,从而得到各个子集上训练模型的最佳参数组(C,g)和模型的分类性能。通过选择分类性能最好的模型对整个杆塔样本集进行分类训练,得到在整个杆塔样本集上的分类结果见表3。
根据图2的多SVM组合分类器的构建流程,得到多SVM组合分类器的分类性能见表4。
对比分析表3和表4可知,采用多SVM分类器可以在保证整个模型的分类准确率和查全率不降低的情况下,将分类的查准率由68.80%提高到78.18%,提高了输电线路雷击风险评估的可靠性和经济性。
表3单一SVM在整个样本集上的分类性能
Figure BDA0002357445450000081
表4多SVM组合分类器的分类性能
Figure BDA0002357445450000082
上述分析实例验证了基于多支持向量机组合分类器的雷击输电线路故障概率分析方法的有效性,通过对输电线路杆塔的特征属性数据进行离散化和标准化处理,利用k-means聚类分析划分样本集的方法,从而建立基于多SVM组合分类器的输电线路雷击风险评估模型,从而提高对输电线路雷击风险评估的可靠性和经济性。
以上实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于上述的实施例。上述实施例中所用方法如无特别说明均为常规方法。

Claims (1)

1.一种基于组合分类器的雷击输电线路故障概率分析方法,其特征在于,包括如下步骤:
步骤1:导入测试数据集:包括数据的特征属性和分类类别,随机生成模型的训练数据集和验证数据集;对训练的数据进行预处理,包括离散化处理和归一化处理,归一化处理如式x→x'=(x-xmin)/(xmax-xmin),其中,xmax,xmin分别表示此列特征属性中的最大值和最小值,x'表示归一化后的特征属性;
步骤2:针对样本的不平衡分布进行处理;在分类问题中,训练数据不平衡指的是不同类别下的样本数量相差太大,采用数据集划分的方式设计相应的大样本类别和小样本类别的比例,大样本类别称为MA类别,小样本类别称为MI类别;设原始数据集中各类别的样本比例为MA:MI=p:q(p>>q),样本总数为m,则MA类别的样本数为mp/(p+q),MI类别的样本数为mq/(p+q),若希望子集中的MA类别样本数和MI类别样本数的比为s:t,则mp/(p+q)个MA类样本被划分为pt/qs个子集,该划分的子集数即为kmeans聚类分析的聚类群数k;
步骤3:采用kmeans聚类分析划分训练子集数,进行训练子集的划分,先对未曾发生过雷击跳闸故障的输电线路杆塔进行k-means聚类分析得到k个子集,再将发生过雷击跳闸故障的杆塔样本加入到上述k个子集中得到k个训练子集;优化支持向量机的参数,分别对k个训练模型的惩罚参数C和核函数参数g进行寻优,并对各个模型的分类结果进行比较;
本步骤进一步包括子步骤:
3.1设置网格搜索法中C和g的搜索范围和搜索步距;其中,C的初始范围设为[2-5,25],g的初始范围设为[2-10,210],搜索步长设为2;
3.2利用步骤3.1中网格搜索法搜索出参数组(C,g)的初步最佳值,即(bestC,bestg),将该组参数值作为后续遗传算法的基准值;
3.3设定遗传算法中参数寻优的范围;其中,C的范围设为(0.5bestC,2bestC),g的范围设定为(0.5bestg,2bestg);
步骤4:对各个子模型的分类结果采用如下的评价指标进行比较;
步骤5:建立雷击故障概率预测模型,通过选取分类性能靠前的支持向量机分类器构建多支持向量机的组合分类器,综合不同参数训练下的支持向量机的输出,得到输电线路杆塔的雷击故障概率;具体包括如下:
通过建立多SVM组合分类器对整个样本集进行分类预测,根据每个SVM模型中各个杆塔样本分别到相应分类超平面的距离得到每株杆塔归属类别的概率,建立基于多SVM组合分类器的杆塔的雷击风险评估方法;
其中,各个杆塔样本所属类别的概率计算采用如下的方法:
式中,g(x)的大小表示待分类的样本到分类超平面的距离,其正负表示该样本与分类超平面的相对位置的方向;P(C1|x)和P(C0|x)分别表示待分类的样本被分类为1和0的概率,易知P(C1|x)+P(C0|x)=1;
SVM输出的概率反映了待分类样本属于不同类别的可能性,能够有效地针对待分类样本与最优分类超平面的距离进行归一化处理,从而针对输出结果进行可信度评价:
R=max{P(C1|x),P(C0|x)}                            (4)
对于二分类问题,可信度R在50%—100%之间;
xi(i=1,2,...,N)为输电线路杆塔的特征输入量;yi(i=1,2,...,M)为利用不同参数进行SVM训练后分别得到的对于输电线路雷击风险的预测值;yi=1表示输电线路雷击风险为“1”,yi=0表示输电线路雷击风险为“0”,Z表示多SVM分类器的输出结果;
即当且仅当多个SVM的输出结果均为1时,多SVM分类器对于输电线路杆塔雷击风险的评估结果才为“1”,此时,需要针对该杆塔安装有效的防雷措施;否则,多SVM分类器的输出结果为0,表示输电线路杆塔的雷击风险为“0”。
CN202010011919.6A 2020-01-07 2020-01-07 一种基于组合分类器的雷击输电线路故障概率分析方法 Active CN111210075B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010011919.6A CN111210075B (zh) 2020-01-07 2020-01-07 一种基于组合分类器的雷击输电线路故障概率分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010011919.6A CN111210075B (zh) 2020-01-07 2020-01-07 一种基于组合分类器的雷击输电线路故障概率分析方法

Publications (2)

Publication Number Publication Date
CN111210075A CN111210075A (zh) 2020-05-29
CN111210075B true CN111210075B (zh) 2023-05-12

Family

ID=70785593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010011919.6A Active CN111210075B (zh) 2020-01-07 2020-01-07 一种基于组合分类器的雷击输电线路故障概率分析方法

Country Status (1)

Country Link
CN (1) CN111210075B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101800A (zh) * 2020-09-18 2020-12-18 广东电网有限责任公司广州供电局 闪电数据的分析方法、装置、计算机设备和存储介质
CN112736503B (zh) * 2020-12-18 2022-10-18 中国人民解放军陆军工程大学 一种自适应多种地理环境下移动接地装置及其使用方法
CN113010559A (zh) * 2021-03-26 2021-06-22 云南电网有限责任公司电力科学研究院 一种输电走廊区域微地形与雷害特征参量的关联挖掘方法
CN113109651B (zh) * 2021-04-15 2022-11-04 云南电网有限责任公司电力科学研究院 一种适用于不同微地形对雷电活动的定量分析方法
CN113823396A (zh) * 2021-09-16 2021-12-21 武汉联影医疗科技有限公司 医疗设备管理方法、装置、计算机设备和存储介质
CN115099531B (zh) * 2022-08-19 2023-01-31 国网江苏省电力有限公司苏州供电分公司 一种基于支持向量机的输电线路雷击预警方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009192312A (ja) * 2008-02-13 2009-08-27 Nippon Telegr & Teleph Corp <Ntt> 発雷予測装置およびその方法、プログラム
CN102854415A (zh) * 2012-08-06 2013-01-02 广东电网公司东莞供电局 一种区域电网线路雷击闪络风险评估方法
CN104463700A (zh) * 2014-12-05 2015-03-25 国家电网公司 一种基于数据挖掘技术的输电线路杆塔雷击风险评估方法
CN106682682A (zh) * 2016-10-20 2017-05-17 北京工业大学 一种基于粒子群优化算法对支持向量机的优化方法
CN107563435A (zh) * 2017-08-30 2018-01-09 哈尔滨工业大学深圳研究生院 基于svm的高维不平衡数据分类方法
CN107832875A (zh) * 2017-10-27 2018-03-23 云南电网有限责任公司电力科学研究院 一种改进遗传算法优化支持向量机的输电线路雷击缺陷预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009192312A (ja) * 2008-02-13 2009-08-27 Nippon Telegr & Teleph Corp <Ntt> 発雷予測装置およびその方法、プログラム
CN102854415A (zh) * 2012-08-06 2013-01-02 广东电网公司东莞供电局 一种区域电网线路雷击闪络风险评估方法
CN104463700A (zh) * 2014-12-05 2015-03-25 国家电网公司 一种基于数据挖掘技术的输电线路杆塔雷击风险评估方法
CN106682682A (zh) * 2016-10-20 2017-05-17 北京工业大学 一种基于粒子群优化算法对支持向量机的优化方法
CN107563435A (zh) * 2017-08-30 2018-01-09 哈尔滨工业大学深圳研究生院 基于svm的高维不平衡数据分类方法
CN107832875A (zh) * 2017-10-27 2018-03-23 云南电网有限责任公司电力科学研究院 一种改进遗传算法优化支持向量机的输电线路雷击缺陷预测方法

Also Published As

Publication number Publication date
CN111210075A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN111210075B (zh) 一种基于组合分类器的雷击输电线路故障概率分析方法
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN110994604B (zh) 基于lstm-dnn模型的电力系统暂态稳定评估方法
CN113570200B (zh) 一种基于多维信息的电网运行状态监测方法及系统
CN109064057B (zh) 一种配网线路雷电参数相对值的风险评估方法
CN111125895B (zh) 一种风力发电机整机服役功率特性在线评估方法
CN112785117B (zh) 一种输电线路全线雷电绕击跳闸风险多维分析方法
CN111680875B (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN106875037A (zh) 风力预测方法及装置
CN110378549B (zh) 一种基于fahp-熵权法的输电杆塔鸟害等级评估方法
CN110738232A (zh) 一种基于数据挖掘技术的电网电压越限成因诊断方法
CN109359882B (zh) 一种台风灾害下输电线路跳闸风险评估方法
CN104750976A (zh) 一种输电线路状态评价参数体系的构建方法
CN108614192B (zh) 一种配电网雷电监测装置布点决策方法
CN110348683A (zh) 电能质量扰动事件主成因分析方法、装置设备及存储介质
CN111461921A (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN107515339A (zh) 一种基于直流电流分布情况的风险识别方法及系统
CN105930900A (zh) 一种混合风力发电的预测方法及系统
CN116050599A (zh) 一种线路覆冰故障预测方法、系统、存储介质及设备
CN113205125A (zh) 一种基于XGBoost的特高压换流阀运行状态评估方法
CN115526258A (zh) 基于Spearman相关系数特征提取的电力系统暂稳评估方法
CN115600088A (zh) 一种基于振动信号的配电变压器故障诊断方法
CN108760268B (zh) 一种基于信息熵的立磨运行数据阶跃故障诊断方法
CN113030633B (zh) 基于ga-bp神经网络的配电网故障大数据分析方法和系统
CN114548498A (zh) 一种架空输电线路局部区域的风速预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant