CN113011084B - 基于相关向量机的输电线路故障原因智能辨识方法 - Google Patents
基于相关向量机的输电线路故障原因智能辨识方法 Download PDFInfo
- Publication number
- CN113011084B CN113011084B CN202110218066.8A CN202110218066A CN113011084B CN 113011084 B CN113011084 B CN 113011084B CN 202110218066 A CN202110218066 A CN 202110218066A CN 113011084 B CN113011084 B CN 113011084B
- Authority
- CN
- China
- Prior art keywords
- fault
- sample
- subset
- sample set
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 123
- 230000005540 biological transmission Effects 0.000 title claims abstract description 107
- 239000013598 vector Substances 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 58
- 238000012952 Resampling Methods 0.000 claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000001052 transient effect Effects 0.000 claims description 24
- 239000002245 particle Substances 0.000 claims description 20
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000001932 seasonal effect Effects 0.000 claims description 7
- 238000005192 partition Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 16
- 208000025274 Lightning injury Diseases 0.000 description 15
- 230000009467 reduction Effects 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 6
- 238000010187 selection method Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000007637 random forest analysis Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000005770 birds nest Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013506 data mapping Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010539 reproductive behavior Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
- 235000005765 wild carrot Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Geometry (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Remote Monitoring And Control Of Power-Distribution Networks (AREA)
- Locating Faults (AREA)
Abstract
本发明涉及一种基于相关向量机的输电线路故障原因智能辨识方法,属于电力故障分析领域,该方法包括:确定输电线路故障原因类型、基于输电线路历史故障录波数据构建故障样本集、重采样得到扩容样本集、获得样本本征维数、对扩容样本集划分子集、获取特征子集和新样本集、划分训练样本集和测试样本集、构建和训练故障原因识别模块、由故障原因识别模块对未明故障原因的单次故障进行识别。本发明公开的方法能够有效提取和筛选输电线路典型故障特征,克服各故障原因类型样本数量不均衡的问题,可为工程技术人员提供输电线路故障原因智能辨别结论及结论的准确率,相较其它现有技术具有更高的故障原因识别准确率。
Description
技术领域
本发明属于电力故障分析领域,尤其涉及一种基于相关向量机的输电线路故障原因智能辨识方法。
背景技术
输电线路作为承担电网间互联互通、电能传输任务的基础性设施,是我国2035远景目标中“优化电力生产和输送通道布局”的重要组成部分。我国输电线路通道长度及跨越区域正不断延伸与扩大使其覆盖范围广,运行环境复杂的特点不断加深。据国家电网公司统计,2012年至2016年间,直流输电线路故障共造成42次强迫停运,占总停运规模的36.8%。由于我国正朝着“坚强电网”大步迈进,2018年我国220kV以上交流一次设备分别发生2360次故障,而这对于区域性电网故障原因辨识而言无法实现“海量数据映射故障模式”,使得现有方法辨识泛化能力不强。
从数据整体看,各类输电线路故障原因分布并不平衡,雷击、外力破坏发生频次高,鸟害、山火等类型故障发生概率相对较低。对于发生概率较小的故障原因类型,仅用少量的运行数据现有技术难以准确判别相应的输电线路故障原因类型,因此亟待解决输电线路故障录波数据的小样本问题。
此外,不同原因类型的故障过程存在相似性,找出哪些特征量在全过程中占主要影响并形成统一的特征识别依据,以此构成输电线路故障原因评价子集,是工程实践中的痛点。
发明内容
鉴于以上现有技术的不足,本发明旨在提出一种基于相关向量机的输电线路故障原因智能辨识方法,以解决现有故障原因识别技术无法克服样本数据量不均衡、缺少特征评价标准、人工辨别故障成本高昂以及结论可靠性受多因素干扰的缺陷。
一种基于相关向量机的输电线路故障原因智能辨识方法,包括以下步骤:
对故障样本集重采样得到含有虚拟样本的扩容样本集;其中,所述故障样本集包括输电线路故障原因类型及每一故障原因类型对应的故障样本数据;
基于所述扩容样本集的样本本征维数和对所述扩容样本集划分子集,对所述扩容样本集进行特征选择,获取特征子集和基于所述特征子集的新样本集;
基于所述新样本集,划分训练样本集和测试样本集,对构建的基于相关向量机单元的故障原因识别模块进行训练和测试,得到训练后的故障原因识别模块及其故障原因辨识准确率;
利用所述训练后的故障原因识别模块对未明故障原因的单次故障样本数据进行识别,得到故障原因的辨识结果。
进一步地,所述故障样本数据表示为x(i),包含153维特征向量:
其中,
i为样本编号;
x1为发生故障时的季节特征值,取值范围为1、2、3、4;
x2至x145为输电线路电流和电压信号的144个暂态特征值,包括:对8路原波信号波段分别进行6层小波分解,对每层的小波细节系数提取的3个信号暂态特征;
所述8路原波信号波段包括:故障前后,输电线路的三相线路及零序线路的电压信号波段UA、UB、UC和U0,及电流信号波段IA、IB、IC和I0;
所述信号暂态特征包括能量指标均值、方差和熵;
x146至x149为所述电压信号波段UA、UB、UC和U0分别在故障前后的电压幅值比值;
x150至x153为所述电流信号波段IA、IB、IC和I0分别在故障前后的电流幅值比值。
进一步地,所述对故障样本集重采样得到含有虚拟样本的扩容样本集,包括:
比较所述故障样本集中各种故障原因类型所含的样本数量是否相等,如果不相等,则需要在样本数量少的故障原因类型中,对该类型故障样本进行重采样得到虚拟样本,最终使各故障原因类型达到相同的样本数量,得到所述扩容样本集;
所述进行重采样得到虚拟样本的方法为:在需重采样的故障原因类型中随机找一个故障样本数据x(h)作为源点,计算获得虚拟样本z:
z=x(h)+rand(0,1)×Dh
式中,z为虚拟样本,与其源点x(h)的故障原因类型相同;Dh为基于欧式距离算法获得的x(h)与其它真实样本点的最小欧式距离。
进一步地,所述样本本征维数为L:
其中,y为扩容样本集的样本数量;li为序号为i的样本的局部本征维数的估计值:
式中,K为所述输电线路故障原因类型数量;d(K,i)与d(h,i)为按照与样本i之间的欧式距离远近,以由近到远的顺序对其余的样本进行排序,排在第K位的样本和排在第h位的样本分别与样本i之间的欧式距离。
进一步地,得到所述扩容样本集划分的子集,包括:
从扩容样本集中随机选取K个样本作为质点,基于子集阈值对样本进行子集分配和子集复核,当各个子集中没有样本与质点之间的欧式距离大于所述子集阈值时,为每个子集设置一个集合序号作为该子集中所含样本的集合序号;
其中,
所述子集分配为:对于除所述质点外的每一个样本,分别计算该样本点与每个所述质点的欧氏距离,若该样本点距离某质点的欧氏距离最小,就与该质点分配到同一个子集,直至所有的样本点都被划分完毕,共得到K个子集;
所述子集复核为:若该子集中有样本点与该子集质点之间的欧式距离大于设定的子集阈值,则把该样本点设为新质点,重新执行一轮所述子集分配。
进一步地,所述对所述扩容样本集进行特征选择,获取特征子集和基于所述特征子集的新样本集,包括:
S6-1.设置特征子集W为空集,启动样本特征搜索;
S6-2.在未加入特征子集W的样本特征x1至xj中,按照样本特征搜索顺序,滑动选择1个特征xg,g为特征序号,将xg加入W,将样本数据从包含j维特征值的向量删减为只含特征子集W的向量,进而形成新的样本集;
S6-3.获取当前W下的子集划分正确率然后将xg从W中删除;
其中,其中,获得所述正确归位样本点的总数包括,对步骤S6-2获得的新的样本集进行子集划分,获得每个样本的新的集合序号,若该样本新的集合序号与该样本原集合序号相同,则该样本点为正确归位样本点,统计得到所述正确归位样本点的总数;
S6-4.重复S6-1至S6-3步骤,直至获得xg=xj时的子集划分正确率;经比较得出本轮搜索获得的子集划分最大正确率
S6-5.选取本轮搜索获得的子集划分最大正确率所对应的xg,将该xg加入W作为本轮搜索获得的特征子集W;
S6-6.在特征子集W中滑动选择一个特征xg’,使得只含特征子集(W-xg’)的新样本集在状态空间中达到子集划分最大正确率若 从W中剔除该xg’,作为本轮特征删除获得的特征子集W;
S6-7.若W所含维度未达到所述本征维数L,则重复步骤S6-2至S6-6,直至所述特征子集W所含特征数量等于所述本征维数。
基于所述特征子集对所述扩容样本集的样本数据进行特征数据提取,获得基于所述特征子集的新样本集。
进一步地,所述划分训练样本集和测试样本集为:
从所述新样本集中,每种故障原因类型样本中随机取出三分之二作为训练样本,对K种故障原因类型的训练样本进行两两组合,构成个所述训练样本集;
所述新样本集每种故障原因类型样本中剩余的三分之一样本作为所述测试样本集,构成K个所述测试样本集;
进一步地,所述故障原因识别模块为:
由个相关向量机单元并联而成,每个相关向量机单元负责两种故障原因类型样本的识别。
进一步地,所述故障原因识别模块进行训练,包括:
S9-1.对所述故障原因识别模块内每个所述相关向量机单元,由该单元负责区分的故障原因类型的训练样本集进行独立训练;其中,基于负责训练RVM(b1,b2)单元的训练样本集Vb1,b2(Y),构建该训练样本集的核函数矩阵C:
其中,RVM(b1,b2)为所述相关向量机单元之一,b1和b2为RVM(b1,b2)单元负责区分的两种故障原因类型的编号;Y为所述训练样本集Vb1,b2(Y)中两种故障原因类型训练样本的总数;C为Y×Y的矩阵;h和i为所述训练样本集的第h个和第i个样本;
S9-2.基于所述核函数矩阵C,迭代更新所述RVM(b1,b2)单元的参数tn和超参数αn+1和βn+1,直至达到最大迭代次数或满足收敛条件为止;
其中,tn取服从均值为方差为1的高斯分布的随机值;
S9-3.所述RVM(b1,b2)单元的权重设置为Qb1,b2:
进一步地,所述故障原因识别模块进行测试,包括:
S10-1.对于输入样本x*,由各个所述相关向量机单元独立决策所述输入样本x*的故障原因类型;其中,所述RVM(b1,b2)单元对所述输入样本x*的故障原因辨识结果由分类决策函数fb1,b2(x)确定:
式中,C*为将所述输入样本x*加入所述RVM(b1,b2)单元的训练样本集Vb1,b2(Y)后获得的新训练样本集Vb1,b2(Y+1)的核函数矩阵;
当f(x*)=1时,在b1故障原因的票数统计上加1票;当f(x*)=-1时,在b2故障原因的票数统计上加1票;
重复上述过程,直至所有相关向量机单元均输出样本x*的故障原因辨识结果;
S10-2.获得故障原因识别模块的辨识结果,包括:
统计各类型故障原因的票数,拥有最多票数的故障原因即为所述故障原因识别模块对所述输入样本x*的故障原因辨识结果;若在两类故障原因间出现平票现象,则以专门负责这两类故障原因的相关向量机单元的故障原因辨识结果作为所述故障原因识别模块的辨识结果;
S10-3.将所述测试样本集中各个样本经所述故障原因识别模块进行辨识后获得的辨识结果与该样本的故障原因类型标签进行比对和统计,得到故障原因识别模块对各故障原因的辨识准确率。
进一步地,所述故障原因识别模块对未明故障原因的单次故障样本数据进行识别,包括:
提取所述单次故障在故障发生前后的输电线故障录波数据的特征值;构建一个只含所述特征子集的未明故障原因样本数据,将所述未明故障原因样本数据输入所述故障原因识别模块,得到所述未明故障原因的输电线路故障录波数据的故障原因辨识结果。
与现有技术相比,本发明至少具有下述之一的有益效果:
1、本发明所述方法,对输电线路故障录波数据提取的特征包括了信号内部特征及信号本身不能提供的外界环境特征,如故障过程的电压降幅、电流降幅、暂态过程的各特征和季节信息等特征,具有较宽的特征覆盖范围,提高了故障原因辨识准确率。
2、输电线路故障暂态过程具有显著的不稳定性,其涵盖的频谱范围广,如雷击故障过程蕴含的大量高频分量和山火高阻故障的高频扰动,仅从单一时域或频域刻画变化特征存在一定局限性;本发明所述的信号特征提取方法,能从信号中提取出丰富的信息,突出局部特征,有着较强的样本优势。
3、本发明针对各类原因输电线路故障样本数量的不平衡性,高质量地对少数类样本进行样本重采样,有效提升了少数类样本规模,避免发生频次较低的故障因数据规模不占优无法使故障原因识别模块得到充分训练的缺陷,进而提高了输电线路小样本故障原因的识别准确率的问题。
4、针对输电线路故障过程的共性特征,本发明所述方法采用数理方式评估数据间的强弱耦合关系,找到数据本征维度并寻获唯一的输电线路故障原因评价特征子集,从而获得高维特征的低维表达方式,克服了传统方法缺少故障特征筛选标准的缺陷,进而各信号特征的原始物理含义得以保留,使得典型特征和辨识过程有据可考。
5、利用基于相关向量机原理构建的故障原因识别模块智能识别输电线路故障原因,大大简化了研究人员的工作量,并且能够全面、高效、准确的辨识输电线路故障原因,能够满足实际工程中对输电线路故障原因辨识在精度、可解释性方面的需求。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于相关向量机的输电线路故障原因智能辨识方法流程图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于描述本发明的原理,但是应该理解,这些描述只是示例性的,并非用于限定本发明的范围。显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明保护的范围。
此外,在以下说明中,省略了对公知方法和技术的描述,以避免不必要地混淆本发明公开的概念。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合和/或调换相对顺序关系。
方法实施例
本发明公开一种基于相关向量机的输电线路故障原因智能辨识方法,该方法是涉及输电线路运行数据特征提取、状态评估、样本重采样、本征维数计算、特征选择和原因智能辨识的综合技术方法。
一种基于相关向量机的输电线路故障原因智能辨识方法,结合实施例图1所示的方法流程图,具体包括以下步骤。
一:对故障样本集重采样得到含有虚拟样本的扩容样本集;其中,所述故障样本集包括输电线路故障原因类型及每一故障原因类型对应的故障样本数据。具体的,包括步骤S1至S3。
步骤S1:确定输电线路故障原因类型。
为识别输电线路故障原因,需要根据输电线路所处地区的实际情况,以及输电线路历史故障数据的故障原因类型,将故障原因类型分为K类。
所述K类故障,分别是b1、b2……至bK类故障。其中,b1=1,b2=2,……,bK=K。
引起直流输电线路发生跳闸的故障原因主要包括雷击、冰害、山火、鸟害、外力破坏等。此外,由于各区域气候、地形条件因素存在差异,风力也可被纳入当地预防输电线路故障的考量因素中。
示例性地,当输电线路故障原因包括雷击故障、风偏故障、山火故障、鸟害故障和异物故障时,K为5。其中,
雷击故障:在夏季和秋季,雷电作为高发的天气现象,易导致输电线路发生跳闸故障;
风偏故障:风偏与风速及风力等级有关,台风等一些空气强对流过程引起的大风,使得输电线路发生舞动导致发生风偏故障;
山火故障:通常在空气湿度较低、环境干燥的春季、秋季,山林发生火灾或人为燃烧作物导致发生山火故障;
鸟害故障:鸟类的活动较多的地区,春季鸟类繁殖性行为易导致鸟巢类故障;秋季粮食作物成熟则易引发鸟类泄粪类故障;冬季鸟类迁徙易引发杆塔落鸟类故障;
异物故障:异物与施工因素相关,直接原因包含施工过程碰线、电力设施被破坏等因素,这一过程的间接因素包含接触物的材质、吊车本身的状况、以及与输电线路接触的位置。
步骤S2:基于输电线路故障原因类型构建故障样本集。
对真实发生的单次输电线路故障,利用该故障发生前后的故障录波器记录的输电线路故障录波数据,提取至少2个特征值作为特征向量,构建一个真实故障样本数据;对已发生的多次输电线路故障监测数据一一构建故障样本数据,得到故障样本集;所述电线路故障检测数据均应属于步骤S1中的故障原因类型。
具体地,对序号为i单次输电线路故障,提取该故障发生前后的故障录波器记录的输电线监测数据,构建一个包含j维特征向量x1至xj的故障样本数据x(i)。
对已发生的q次输电线路故障数据一一构建故障样本数据,得到真实故障样本数据x(1)至x(q)。用故障样本集X(q)表示x(1)至x(q)的集合。
其中,X(q)为q×j矩阵;所述q次输电线路故障均应有明确的故障原因,且涵盖步骤S1中的K个故障原因类型。
较佳地,所述j维特征向量包括季节特征值、暂态特征值和电压电流特征值。
较佳地,当j=153时:
其中,x(i)包含153维特征向量;x1为发生故障时的季节特征值,取值范围为1、2、3、4;x2至x145为输电线路电流和电压信号的暂态特征值,包括能量指标均值、方差和熵;x146至x149为故障前后电压幅值比值,x150至x153为故障前后电流幅值比值。
具体地:
所述季节特征值,表征输电线路故障发生的季节因素。由于我国地处北半球,根据故障发生的季节将季节特征值取值范围定为1、2、3、4,其中,1对应春季(3月至5月)、2对应夏季(6月至8月)、3对应秋季(9月至11月)、4对应冬季(12月至次年2月)。
所述信号的暂态特征值,表征故障前后输电线路故障过程中各路电压和电流信号在各频段上的表现。
故障前后,输电线路的三相线路及零序线路的电压信号波段分别为UA、UB、UC和U0,电流信号波段分别为IA、IB、IC和I0,共8路原波信号波段。
对这8路原波信号波段进行小波变换,其中,小波变换的分解层数为R层,每分解一层就得到一个小波细节系数,对每个小波细节系数提取m个信号暂态特征,因此暂态特征值的提取量为8路×R层×m个。
较佳地,信号暂态特征值包括能量指标的均值、方差、和熵,因此m为3。其中,均值表征信号的平均能量水平;方差表征信号在该频段的能量波动程度;熵表征信号在概率空间内分布复杂程度。
进一步地,小波变换的分解层数R为:
式中,p为采样频率,即输电线路故障发生时采样的中心频率。
较佳地,p为工频50hz,由上式得到小波分解层数R=6。
因此本实施例中一次故障的暂态特征值的提取量为8路×6层×3个,共提取144个暂态特征值,分别为x2至x145。
所述电压幅值比值和电流幅值比值,是利用输电线路二次设备侧在正常状态下和故障状态下的电压或电流的周波有效值的比值表示信号变化程度的两种特征值:
其中,△U为电压的幅值变化比值;△I为电流的幅值变化比值;U故障后第1周波为故障时刻后第一个电压周波的二次有效值;U故障前第1周波为故障时刻前第一个电压周波的二次有效值;I故障后第1周波为故障时刻后第一个电流周波二次有效值;I额定电流为输电线路额定电流值。
具体地,外界原因导致输电线路发生故障直接表现为三相线路及零序线路中的电压和电流的变化。例如发生山火放电故障时,零序电压波形幅值随故障演化有增大趋势;雷击、风偏、鸟害、异物故障时,零序电压将迅速攀升,待故障切除后恢复正常水平等趋势。
因此电压、电流的幅值较佳地作为特征值。用x146至x149向量记录一次故障事件每条线路的电压幅值变化比值;用x150至x153向量记录一次故障事件每路线路的电流幅值变化比值。
步骤S3:基于所述故障数据样本集,经重采样得到含有虚拟样本的扩容样本集。
基于故障数据样本集,比较故障样本集中各种故障原因类型所含的样本数量是否相等,如果不相等,则需要在样本数量少的故障原因类型中,对该类型真实故障原因样本进行重采样得到虚拟样本,最终使各故障原因类型达到相同的样本数量,得到扩容样本集。
具体地,将虚拟样本插入到原故障数据样本集X(q)中得到扩容样本集X(y),其中,X(y)是行列为y×j的矩阵,y为虚拟样本和真实故障样本的总数。
更进一步地,所述样本重采样指的是对样本数量进行扩充,以满足后续步骤对此原因类型样本数量的要求。
所述样本重采样的方法为利用下述公式计算出与x(h)具有相同故障原因类型的虚拟样本z:
z=x(h)+rand(0,1)×Dh
式中,z为虚拟样本向量,与其源点x(h)的故障原因类型相同;源点x(h)为需重采样的故障原因类型中随机的一个真实故障样本数据;Dh为基于欧式距离算法获得的样本点x(h)与其它真实样本点的最小欧式距离:
Dh=min d(i,h)i=1:q
式中,d(i,h)为序号为i和h的样本点之间的欧式距离:
二:基于所述扩容样本集的样本本征维数和对所述扩容样本集划分子集,对所述扩容样本集进行特征选择,获取特征子集和基于所述特征子集的新样本集。具体的,包括步骤S4至S6。
步骤S4:基于扩容样本集,获得样本本征维数。
对扩容样本矩阵X(y)求本征维数,获得能够不失真地表现输电线路信号特征的最少特征维数值。
本征维数是能够描绘原始数据且不发生信息丢失的最少特征数量,是数据的固有属性,由数据在状态空间中的分布决定。本征维数估计是指对数据在状态空间内的分布由最少的变量描绘且不发生信息丢失的逼近可信取值的过程。通过极大似然估计中的泊松分布对空间内各样本点的欧氏距离进行求解的方法,利用样本在特征空间内的近邻距离构建似然函数,进而得到输电线路扩容样本矩阵的本征维数L:
其中,li为样本i的局部本征维数的估计值:
式中,d(K,i)与d(h,i)为扩容样本空间中按照与样本点i之间的欧式距离远近,以由近到远的顺序对其余的样本点进行排序,排在第K位和第h位的样本点与样本点i之间的欧式距离。
步骤S5:对扩容样本集划分子集。
基于所述扩容样本集,将扩容样本划分入K个子集中,获得每个样本的集合序号。
具体地划分方法为:
将扩容样本数据x(1)至x(q)分布到向量状态空间中,每个样本在状态空间中投影成一个点,代表一个故障样本点。在状态空间中,用不同的颜色或图标代表不同故障原因类型的故障样本点。因此同样颜色或图标的点即为相同故障原因类型的样本点。
首先从分布于向量状态空间中的样本点中,随机选取K个点作为质点。
开始一轮样本点分配动作:对于除质点外的每一个样本点,分别计算该样本点与每个质点的欧氏距离,若该样本点距离某质点的欧氏距离最小,就与该质点分配到同一个子集,直至所有的样本点都被划分完毕,共得到K个子集,完成一轮分配动作。
对每个子集进行分析:若该子集中有样本点与质点之间的欧式距离大于设定的子集阈值,则把该样本点设为新质点,重新执行一轮上述样本点分配动作。
较佳地,子集阈值范围为0.0005至0.5。
当各个子集中没有样本点与质点之间的欧式距离大于设定的子集阈值时,故障样本点的划分结束,为每个子集设置一个集合序号。
进一步地,为每个样本x(i)附加一个集合序号J(i),J(i)的值为该样本所属的子集的集合序号。
步骤S6:基于最少特征维数进行特征选择,获取特征子集和基于所述特征子集的新样本集。
获得扩容样本集的本征维数L后,需要经过特征选择将故障数据样本从j维特征向量筛选缩减至L维特征向量,由所述L维特征向量组成特征子集W。
基于特征子集W对扩容样本矩阵X(y)进行特征数据提取后,扩容样本矩阵变为行列为y×L的新样本矩阵X’(y),其中第i个样本数据为x(i)=[x1(i)…xL(i)]。
具体地,所述特征选择是指从全部特征中剔除冗余的特征向量,留取一个特征子集,使构造出来的模型更优化。特征选择过程是一个在不降低故障样本分类精度的条件下精选特征维度的过程。
所述特征选择的过程为:
步骤S6-1:设置特征子集W为空集
设置特征子集W为空集,启动样本特征搜索。
步骤S6-2:确定xg和新的样本集
在未加入特征子集W的样本特征x1至xj中,按照样本特征搜索顺序,滑动选择1个特征xg,g为特征序号,将xg加入W,将X(y)从包含j维特征的矩阵删减为只含特征子集W的矩阵,进而形成新的样本集。
步骤S6-3:获取当前W下的子集划分正确率
获取当前W下的子集划分正确率然后将xg从W中删除。
其中,正确归位样本点的总数,为对步骤S6-2获得的新的样本集按步骤S5的方法进行子集划分,获得每个样本的新的集合序号J’(i),若J’(i)与该点原有的J(i)值相同,则该样本点为正确归位样本点,统计得到被正确归位的样本点的总数。
步骤S6-4:获取子集划分最大正确率
重复S6-1至S6-3步骤,直至获得xg=xj时的子集划分正确率,经比较得出本轮搜索获得的子集划分最大正确率
步骤S6-5:确定本轮特征搜索结果
选取本轮搜索获得的子集划分最大正确率所对应的xg,将该xg加入W作为本轮搜索获得的特征子集W。
步骤S6-6:对特征子集W进行一轮特征删除
在特征子集W中滑动选择一个特征xg’,使得只含特征子集(W-xg’)的新样本集在状态空间中达到子集划分最大正确率
若代表删除该特征xg’后维度精简效果更好,则从W中剔除该xg’,作为本轮特征删除获得的特征子集W。
步骤S6-7:确定维数为L的特征子集W
经过步骤S6-6后若W所含维度未达到本征维数L,则重复步骤S6-2至S6-6,直至W所含特征数量达到本征维数。
三:基于所述新样本集,划分训练样本集和测试样本集,对构建的基于相关向量机单元的故障原因识别模块进行训练和测试,得到训练后的故障原因识别模块及其故障原因辨识准确率。具体的,包括步骤S7至S10。
步骤S7:基于新样本集,划分训练样本集和测试样本集。
从新样本矩阵X’(y)的样本中:
从每种故障原因类型样本中随机取出三分之二作为训练样本,对K种故障原因类型的训练样本进行两两组合,构成个训练样本集;
每种故障原因类型样本中剩余的三分之一样本作为故障原因识别模块的测试样本集,构成K个测试样本集。
示例性地,从新样本矩阵X’(y)的样本中,某两种故障原因类型b1和b2的样本中各取出三分之二作为训练样本集Vb1,b2(Y),其中,Y为取出的b1和b2两种故障原因类型训练样本的总数。
步骤S8:构建基于相关向量机单元的故障原因识别模块。
构建故障原因识别模块,用于对输电线路故障原因进行辨识。
具体地,所述故障原因识别模块,是由基于相关向量机RVM(Relevance VectorMachine)原理构建的个RVM单元并联而成,每个RVM单元负责两种故障原因类型样本的识别。
示例性地,K为5时,需构建10个RVM单元,分别为RVM(1,2)、RVM(1,3)、RVM(1,4)、RVM(1,5)、RVM(2,3)、RVM(2,4)、RVM(2,5)、RVM(3,4)、RVM(3,5)和RVM(4,5)。
示例性地,以RVM(1,2)和RVM(4,5)为例,RVM(1,2)单元负责区分b1和b2这两种故障原因类型的样本,RVM(4,5)单元负责区分b4和b5这两种故障原因类型的样本。
步骤S9:利用所述训练样本集训练每个RVM单元,得到各个单元的权重。
对各个RVM单元,由该单元负责区分的故障原因类型的训练样本进行训练。
示例性地,用b1和b2这2种故障原因类型的训练样本集Vb1,b2(Y)对RVM(b1,b2)单元进行训练。
训练方法为:
步骤S9-1:构建核函数矩阵
构建训练样本集V b1,b2(Y)的核函数矩阵C:
其中,C为Y×Y的矩阵,h和i为训练样本集V b1,b2(Y)的第h个和第i个样本,x(h)=[x1(h)…xL(h)],x(i)=[x1(i)…xL(i)]。
步骤S9-2:训练超参数
利用以下公式迭代更新RVM(b1,b2)单元的超参数αn和βn:
其中,n=0时超参数初始值α0和β0为元素为1的Y×Y对角元矩阵;tn为服从均值为方差为1的高斯分布的随机值。
判断是否满足|αn+1-βn+1|≤1.0×e-5的收敛条件,若不满足且尚未达到最大迭代次数,则继续迭代更新超参数αn和βn,直至达到最大迭代次数或满足收敛条件为止。
示例性地,所述最大迭代次数设置为500次。
步骤S9-3:设置RVM单元权重
满足收敛条件后,RVM(b1,b2)单元的权重Qb1,b2设置为:
综上,所有RVM单元的进行独立训练,得到各个单元的权重。
步骤S10:由所述故障原因识别模块辨识样本的故障原因类型,利用所述测试样本集获得故障原因识别模块的辨识准确率。
利用各个故障原因类型的测试样本集,由故障原因识别模块辨识每个测试样本集中每个样本的故障原因类型,进而获得所述故障原因识别模块对各故障原因类型样本的辨识准确率。
其中,故障原因识别模块对样本x*的故障原因类型的辨识过程为步骤S10-1至S10-2,获得辨识准确率的过程为步骤S10-3。
步骤S10-1:各个RVM单元独立决策样本的故障原因
对于样本x*,由每个已训练好的RVM单元独立决策其故障原因归属。
示例性地,对于RVM(b1,b2)单元,根据RVM(b1,b2)单元的分类决策函数fb1,b2(x)决策样本x*的故障原因归属。
决策过程为:
将x*输入该单元的分类决策函数fb1,b2(x)中:
其中,C*为将样本x*加入训练样本集Vb1,b2(Y)后获得的新训练样本集Vb1,b2(Y+1)的核函数矩阵,由步骤S9中的核函数矩阵公式确定;
当fb1,b2(x*)=1时,决策故障原因辨识结果为b1,则在b1故障原因的票数统计上加1票;当fb1,b2(x*)=-1时,决策故障原因辨识结果为b2,则在b2故障原因的票数统计上加1票。
重复上述过程,直至所有RVM单元均输出样本x*的输电线路故障原因辨识结果。
步骤S10-2:获得故障原因识别模块的辨识结果
所有RVM单元均输出样本x*的输电线路故障原因辨识结果后,统计各类故障原因的票数,拥有最多票数的故障原因即为样本x*的故障辨识结果,将其作为所述故障原因识别模块的辨识结果输出。
其中,倘若统计结果在某两类故障原因间出现平票现象,则以专门负责这两类故障原因的RVM单元的决策结果为所述故障原因识别模块的辨识结果。
步骤S10-3:获得故障原因辨识准确率
将测试样本集中各个样本经所述故障原因识别模块进行辨识后获得的辨识结果与该样本的故障原因类型标签进行比对和统计,得到故障原因识别模块对各故障原因的辨识准确率。
四:利用所述训练后的故障原因识别模块对未明故障原因的单次故障样本数据进行识别,得到故障原因的辨识结果。具体的,包括步骤S11。
步骤S11:由所述故障原因识别模块对未明故障原因的单次故障进行识别,得到辨识结果。
对未明故障原因的单次故障,基于步骤S6中特征子集W,按照步骤S2的方法对故障前后的输电线路故障录波数据提取特征值,构建一个只含有所述特征子集的未明故障原因样本r,其中r=[r1…rL];
将未明故障原因样本r,输入所述故障原因识别模块,经过步骤S10-1至S10-2所述的方法过程,得到样本r的故障原因辨识结果。
测试效果实施例
为了验证以上基于相关向量机的输电线路故障原因智能辨识方法的先进性,现结合国内某一实际工程,来进一步说明本发明的方法及其有效性。
对于该工程原始数据规模为159组输电线路故障数据,其中风偏14组(8.81%),鸟害23组(14.47%),山火15组(9.43%),异物59组(37.11%),雷击48组(30.19%)。
从数据样本规模来看,样本整体规模较小,各类故障原因占比严重不均衡,雷击、异物故障占比较高,无法作为普通辨识方法的训练数据使用。
步骤T1:将样本故障原因类型分为5类,构建故障样本集。
按照步骤S2所述方法,对输电线路进行季节、暂态特征、电压电流降幅特征提取后得到初始故障样本集X(159),其中第1维特征为故障发生季节信息,第2至145维特征为暂态信息经小波分解后的能量指标,第146至第149维为输电线路三相及零序电压特征值,第150至153维为输电线路三相及零序电流特征值。
步骤T2:对故障样本进行重采样。
基于故障样本集X(159),经S3步骤后数据样本由159个扩容到472个,得到的扩容样本集X(472)以及每个样本的集合序号。
为了对本实施例所述方法的效果进行评价,将本实施例步骤S3所述的重采样方法与其它3种不用的重采样方法进行对比,分别对故障样本集X(159)进行重采样处理,对得到的4种不同的扩容样本集经本实施例所述故障原因智能辨识方法进行处理和识别,得到这4种重采样方法识别效果的对比结果,如表1所示。
表1 4种不同的样本重采样方法对识别效果的影响
如表1所示,合成少数类过采样技术能够将输电线路故障原因识别率整体提升至较高的水平,但对于发生频次较高的雷击、异物故障,其识别准确率(62.96%、58.06%)不高。
边界合成过采样方法对于雷击故障的辨识并没有显著效果,原因在于雷击属于多数类样本,边界合成过采样方法的样本重采样过程增加样本间混叠的可能性,进而削弱雷击在特征空间中显著的分布趋势。
自适应合成抽样方法对于发生频次较高的雷击的识别准确率(64.66%)不高。自适应合成抽样方法能够根据多数类与少数类间的样本规模自动决定少数类样本需要重采样的数量,但易受离群点的影响。
本实施例使用的重采样方法获得的平均辨识率最高,分类效果最优。主要是由于本实施例步骤S3所述的重采样方法对于少数类样本的类内分布进行分析,有选择的对样本规模进行重采样,有效提升少数类样本规模,使得输电线路故障录波数据的小样本、不平衡问题得以解决。
步骤T3:确定本征维度。
基于步骤S4所述的方法,对X(472)进行本征维数估计,得到输电线路故障样本数据的本征维数L为17。
步骤T4:特征筛选。
依据步骤S5至S6所述方法,从原始特征构成的153维特征值中选取最能表征输电线路故障的17维特征,即特征子集W的维度为17。
17个特征子集的筛选过程如表2所示:
表2特征子集筛选过程
如表2所示,各个特征对故障辨识的贡献程度由大到小按照序号顺序被加入维度子集W中,其中每行中加粗的数字为新加入子集的维度。
由特征筛选过程可见:第149维度的零序电压的幅值变化比值和第153维度的零序电流的幅值变化比值在故障辨识中起着极为重要的作用;第1维度的输电线路发生故障的季节信息;第x2至x145维度之间的输电线路故障暂态过程经小波分解后的某些能量指标也是特征子集的构成元素之一。其中,特征子集W中各能量指标在小波分解树中的分布如表3所示。
表3暂态能量特征组成来源
分解尺度 | 第1层 | 第2层 | 第3层 | 第4层 | 第5层 | 第6层 |
UA | 熵 | |||||
UB | 方差 | |||||
UC | 方差 | |||||
U0 | 均值 | 均值 | 均值、熵 | 熵 | ||
IA | ||||||
IB | 方差 | |||||
IC | ||||||
I0 | 均值 | 均值 | 均值 | 熵 | 熵 |
由表3可见,输电线路故障暂态特征在第2-6层的区别最为明显,其中,第2-4层频段的零序电压U0、电流I0的细节系数均值与故障原因类型有关,可利用不同故障在数值上的差异作为故障辨识的依据。此外,第4-6层频段的暂态信号的波动程度有所差异,原因在于雷击故障过程的高频分量较多,与鸟害等故障存在显著区别。因此,方差、熵作为表征暂态信号复杂程度以及波动性的特征可用于区分输电线路故障原因。从暂态能量特征在各相的分布来看,输电线路发生故障时,零序电压、电流蕴藏着更多信息。
为了对本实施例所述方法的效果进行评价,利用另外两种常用的特征值筛选方法——线性降维方法和随机森林方法,与步骤S6所述的特征选择方法的效果进行对比,经本实施例所述智能辨识方法的处理和识别,识别效果见表4所示:
表4不同特征筛选效果对比
经识别效果对比,步骤S6所述的特征选择方法、线性降维方法和随机森林方法都能准确提取映射风偏故障的特征组合。然而,线性降维方法确定的输入集在鸟害故障的辨识率表现仅为49.66%,提取的特征对发生频次较高的雷击故障映射准确率为73.29%;随机森林方法作为决策树的一种,降维后的输入集对鸟害的故障辨识率为22.13%,远低于工程实际需求。对于发生概率最高的雷击故障,步骤S6所述的特征选择方法和随机森林方法可将该故障识别率稳定在90%,但随机森林方法的提取结果对某些故障原因识别效果偏低,不具有普适性。综上,三种方法在平均辨识率表现存在差异,本实施例步骤S6所述的特征选择方法表现最优。
步骤T5:划分训练样本集和测试样本集。
经步骤S6所述的特征选择方法进行特征选择后,扩容样本集变为行列为472×17的新样本集X’(472)。为保证输电线路故障原因辨识模型训练与测试效果的平衡,依据步骤S7所述方法,各原因类型故障数据按2:1的比例划分并两两组合形成10个训练样本集和5个测试样本集。
步骤T6:构建故障原因识别模块,获得故障原因识别模块的识别准确率。
故障原因识别模块由10个相关向量机单元并联而成,10个相关向量机单元分别为RVM(1,2)、RVM(1,3)、RVM(1,4)、RVM(1,5)、RVM(2,3)、RVM(2,4)、RVM(2,5)、RVM(3,4)、RVM(3,5)和RVM(4,5)。
依照步骤S9所述的方法,由训练样本集对各个RVM单元进行训练,获得各个单元的权重:Q1,2、Q1,3、Q1,4、Q1,5、Q2,3、Q2,4、Q2,5、Q3,4、Q3,5和Q4,5。
依照步骤S10所述的方法,利用5个测试样本集,由本实施例所述故障原因识别模块辨识每个样本的故障原因类型,进而获得所述故障原因识别模块对5种故障原因类型样本的辨识准确率,见表5所示。
为了对本实施例所述方法的效果进行评价,用支持向量机方法(SVM)和前馈神经网络方法(BPNN)作为对照组,对这5种输电线路的故障原因分别进行辨识,准确率结果如表5所示。
表5几种故障辨识方法的准确率对比
由表5可见,本实施例所述故障原因识别方法对各类故障原因的识别准确率始终保持90%以上的水平。
三种方法在风偏故障的辨识上均达到90%,表明经步骤S6所述的特征选择方法选择的特征能够良好的反映风偏过程的关键特征。
本实施例所述故障原因识别方法与支持向量机方法作为基于核的具有稀疏解的算法,在识别鸟害、异物方面均有着出色的表现。然而支持向量机方法在辨识山火故障方面略逊色于前馈神经网络方法。在区别雷击故障方面,本实施例所述故障原因识别方法能够使雷击的辨识率达到92.31%。
综合而言,本实施例所述故障原因识别方法的平均辨识率(96.23%)远高于支持向量机方法(83.93%)及前馈神经网络方法(74.3%)。
测试结果表明,本发明公开的方法能够有效识提取和筛选输电线路典型故障特征,解决各故障原因类型样本数量不均衡的问题,相较其它现有技术,本发明公开的方法具有更高的故障类型识别准确率。
本发明所述方法从工程实际需求出发,提供了一种具有较高故障原因辨识精度的方法,解决了由输电线路故障样本数量不足导致的无法正确判断输电线路故障原因的困难,可以为工程技术人员提供人工智能辨别参考结论及结论的准确率,具有较高的工程应用价值。
最后应说明的是,以上实施例仅用以说明本发明实施例的技术方案,而非对其限制,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,任何熟悉本技术领域的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,包括以下步骤:
对故障样本集重采样得到含有虚拟样本的扩容样本集;其中,所述故障样本集包括输电线路故障原因类型及每一故障原因类型对应的故障样本数据;
基于所述扩容样本集的样本本征维数和对所述扩容样本集划分子集,对所述扩容样本集进行特征选择,获取特征子集和基于所述特征子集的新样本集;
基于所述新样本集,划分训练样本集和测试样本集,对构建的基于相关向量机单元的故障原因识别模块进行训练和测试,得到训练后的故障原因识别模块及其故障原因辨识准确率;
利用所述训练后的故障原因识别模块对未明故障原因的单次故障样本数据进行识别,得到故障原因的辨识结果;
所述对所述扩容样本集进行特征选择,获取特征子集和基于所述特征子集的新样本集,包括:
S6-1.设置特征子集W为空集,启动样本特征搜索;
S6-2.在未加入特征子集W的样本特征x1至xj中,按照样本特征搜索顺序,滑动选择1个特征xg,g为特征序号,将xg加入W,将样本数据从包含j维特征值的向量删减为只含特征子集W的向量,进而形成新的样本集;
S6-3.获取当前W下的子集划分正确率然后将xg从W中删除;
其中,=正确归位样本点的总数÷样本总量;其中,获得所述正确归位样本点的总数包括,对步骤S6-2获得的新的样本集进行子集划分,获得每个样本的新的集合序号,若该样本新的集合序号与该样本原集合序号相同,则该样本点为正确归位样本点,统计得到所述正确归位样本点的总数;
S6-4.重复S6-1至S6-3步骤,直至获得xg=xj时的子集划分正确率;经比较得出本轮搜索获得的子集划分最大正确率
S6-5.选取本轮搜索获得的子集划分最大正确率所对应的xg,将该xg加入W作为本轮搜索获得的特征子集W;
S6-6.在特征子集W中滑动选择一个特征xg’,使得只含特征子集(W-xg’)的新样本集在状态空间中达到子集划分最大正确率若 从W中剔除该xg’,作为本轮特征删除获得的特征子集W;
S6-7.若W所含维度未达到所述本征维数L,则重复步骤S6-2至S6-6,直至所述特征子集W所含特征数量等于所述本征维数;
基于所述特征子集对所述扩容样本集的样本数据进行特征数据提取,获得基于所述特征子集的新样本集。
2.根据权利要求1所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,所述故障样本数据表示为x(i),包含153维特征向量:
其中,
i为样本编号;
x1为发生故障时的季节特征值,取值范围为1、2、3、4;
x2至x145为输电线路电流和电压信号的144个暂态特征值,包括:对8路原波信号波段分别进行6层小波分解,对每层的小波细节系数提取的3个信号暂态特征;
所述8路原波信号波段包括:故障前后,输电线路的三相线路及零序线路的电压信号波段UA、UB、UC和U0,及电流信号波段IA、IB、IC和I0;
所述信号暂态特征包括能量指标均值、方差和熵;
x146至x149为所述电压信号波段UA、UB、UC和U0分别在故障前后的电压幅值比值;
x150至x153为所述电流信号波段IA、IB、IC和I0分别在故障前后的电流幅值比值。
3.根据权利要求2所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,所述对故障样本集重采样得到含有虚拟样本的扩容样本集,包括:
比较所述故障样本集中各种故障原因类型所含的样本数量是否相等,如果不相等,则需要在样本数量少的故障原因类型中,对该类型故障样本进行重采样得到虚拟样本,最终使各故障原因类型达到相同的样本数量,得到所述扩容样本集;
所述进行重采样得到虚拟样本的方法为:在需重采样的故障原因类型中随机找一个故障样本数据x(h)作为源点,计算获得虚拟样本z:
z=x(h)+rand(0,1)×Dh
式中,z为虚拟样本,与其源点x(h)的故障原因类型相同;Dh为基于欧式距离算法获得的x(h)与其它真实样本点的最小欧式距离。
4.根据权利要求1-3任一项所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,所述样本本征维数为L:
其中,y为扩容样本集的样本数量;li为序号为i的样本的局部本征维数的估计值:
式中,K为所述输电线路故障原因类型数量;d(K,i)与d(h,i)为按照与样本i之间的欧式距离远近,以由近到远的顺序对其余的样本进行排序,排在第K位的样本和排在第h位的样本分别与样本i之间的欧式距离。
5.根据权利要求4所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,得到所述扩容样本集划分的子集,包括:
从扩容样本集中随机选取K个样本作为质点,基于子集阈值对样本进行子集分配和子集复核,当各个子集中没有样本与质点之间的欧式距离大于所述子集阈值时,为每个子集设置一个集合序号作为该子集中所含样本的集合序号;
其中,所述子集分配为:对于除所述质点外的每一个样本,分别计算该样本点与每个所述质点的欧氏距离,若该样本点距离某质点的欧氏距离最小,就与该质点分配到同一个子集,直至所有的样本点都被划分完毕,共得到K个子集;
所述子集复核为:若该子集中有样本点与该子集质点之间的欧式距离大于设定的子集阈值,则把该样本点设为新质点,重新执行一轮所述子集分配。
6.根据权利要求1所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,
所述划分训练样本集和测试样本集为:
从所述新样本集中,每种故障原因类型样本中随机取出三分之二作为训练样本,对K种故障原因类型的训练样本进行两两组合,构成个所述训练样本集;
所述新样本集每种故障原因类型样本中剩余的三分之一样本作为所述测试样本集,构成K个所述测试样本集;
所述故障原因识别模块为:
由个相关向量机单元并联而成,每个相关向量机单元负责两种故障原因类型样本的识别。
7.根据权利要求6所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,所述故障原因识别模块进行训练,包括:
S9-1.对所述故障原因识别模块内每个所述相关向量机单元,由该单元负责区分的故障原因类型的训练样本集进行独立训练;其中,基于负责训练RVM(b1,b2)单元的训练样本集Vb1,b2(Y),构建该训练样本集的核函数矩阵C:
其中,RVM(b1,b2)为所述相关向量机单元之一,b1和b2为RVM(b1,b2)单元负责区分的两种故障原因类型的编号;Y为所述训练样本集Vb1,b2(Y)中两种故障原因类型训练样本的总数;C为Y×Y的矩阵;h和i为所述训练样本集的第h个和第i个样本;
S9-2.基于所述核函数矩阵C,迭代更新所述RVM(b1,b2)单元的参数tn和超参数αn+1和βn+1,直至达到最大迭代次数或满足收敛条件为止;
其中,tn取服从均值为方差为1的高斯分布的随机值;
S9-3.所述RVM(b1,b2)单元的权重设置为Qb1,b2:
8.根据权利要求7所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,所述故障原因识别模块进行测试,包括:
S10-1.对于输入样本x*,由各个所述相关向量机单元独立决策所述输入样本x*的故障原因类型;其中,所述RVM(b1,b2)单元对所述输入样本x*的故障原因辨识结果由分类决策函数f b1,b2(x)确定:
式中,C*为将所述输入样本x*加入所述RVM(b1,b2)单元的训练样本集Vb1,b2(Y)后获得的新训练样本集Vb1,b2(Y+1)的核函数矩阵;
当f(x*)=1时,在b1故障原因的票数统计上加1票;当f(x*)=-1时,在b2故障原因的票数统计上加1票;
重复上述过程,直至所有相关向量机单元均输出样本x*的故障原因辨识结果;
S10-2.获得故障原因识别模块的辨识结果,包括:
统计各类型故障原因的票数,拥有最多票数的故障原因即为所述故障原因识别模块对所述输入样本x*的故障原因辨识结果;若在两类故障原因间出现平票现象,则以专门负责这两类故障原因的相关向量机单元的故障原因辨识结果作为所述故障识别原因模块的辨识结果;
S10-3.将所述测试样本集中各个样本经所述故障原因识别模块进行辨识后获得的辨识结果与该样本的故障原因类型标签进行比对和统计,得到故障原因识别模块对各故障原因的辨识准确率。
9.根据权利要求8所述的基于相关向量机的输电线路故障原因智能辨识方法,其特征在于,所述故障原因识别模块对未明故障原因的单次故障样本数据进行识别,包括:
提取所述单次故障在故障发生前后的输电线路故障录波数据的特征值;构建一个只含所述特征子集的未明故障原因样本数据,将所述未明故障原因样本数据输入所述故障原因识别模块,得到所述未明故障原因的输电线路故障录波数据的故障原因辨识结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110218066.8A CN113011084B (zh) | 2021-02-26 | 2021-02-26 | 基于相关向量机的输电线路故障原因智能辨识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110218066.8A CN113011084B (zh) | 2021-02-26 | 2021-02-26 | 基于相关向量机的输电线路故障原因智能辨识方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011084A CN113011084A (zh) | 2021-06-22 |
CN113011084B true CN113011084B (zh) | 2023-08-11 |
Family
ID=76386730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110218066.8A Active CN113011084B (zh) | 2021-02-26 | 2021-02-26 | 基于相关向量机的输电线路故障原因智能辨识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011084B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113050015B (zh) * | 2021-03-26 | 2023-01-17 | 联想(北京)有限公司 | 一种数据处理方法及电子装置 |
CN114358092B (zh) * | 2022-03-10 | 2022-05-27 | 武汉格蓝若智能技术有限公司 | 一种电容式电压互感器内绝缘性能在线诊断方法及系统 |
CN115932484B (zh) * | 2023-02-15 | 2023-07-18 | 重庆大学 | 输电线路故障辨识与故障测距方法、装置和电子设备 |
CN118362820B (zh) * | 2024-06-20 | 2024-08-23 | 国网甘肃省电力公司电力科学研究院 | 一种储能设备故障状态智能诊断方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102736027A (zh) * | 2012-07-18 | 2012-10-17 | 南京因泰莱配电自动化设备有限公司 | 一种基于断路器动特性测试仪的断路器故障诊断方法 |
CN105093066A (zh) * | 2015-08-12 | 2015-11-25 | 华北电力大学 | 基于小波分析与支持向量机的线路故障判断方法 |
CN107505133A (zh) * | 2017-08-10 | 2017-12-22 | 滁州学院 | 基于自适应mrvm的滚动轴承故障概率性智能诊断方法 |
CN111611867A (zh) * | 2020-04-24 | 2020-09-01 | 滁州学院 | 基于多分类模糊相关向量机的滚动轴承智能故障诊断方法 |
CN112287889A (zh) * | 2020-11-22 | 2021-01-29 | 西北工业大学 | 一种基于压缩感知和相关向量机的轴承故障智能诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107894564B (zh) * | 2017-11-09 | 2020-02-18 | 合肥工业大学 | 一种基于交叉小波特征的模拟电路故障诊断方法 |
-
2021
- 2021-02-26 CN CN202110218066.8A patent/CN113011084B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102736027A (zh) * | 2012-07-18 | 2012-10-17 | 南京因泰莱配电自动化设备有限公司 | 一种基于断路器动特性测试仪的断路器故障诊断方法 |
CN105093066A (zh) * | 2015-08-12 | 2015-11-25 | 华北电力大学 | 基于小波分析与支持向量机的线路故障判断方法 |
CN107505133A (zh) * | 2017-08-10 | 2017-12-22 | 滁州学院 | 基于自适应mrvm的滚动轴承故障概率性智能诊断方法 |
CN111611867A (zh) * | 2020-04-24 | 2020-09-01 | 滁州学院 | 基于多分类模糊相关向量机的滚动轴承智能故障诊断方法 |
CN112287889A (zh) * | 2020-11-22 | 2021-01-29 | 西北工业大学 | 一种基于压缩感知和相关向量机的轴承故障智能诊断方法 |
Non-Patent Citations (1)
Title |
---|
基于模糊支持向量机的输电线路故障模糊分类方法及其降维显示;童晓阳;《高电压技术》;第41卷(第7期);第2276-2282页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113011084A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113011084B (zh) | 基于相关向量机的输电线路故障原因智能辨识方法 | |
CN107516170B (zh) | 一种基于设备故障概率和电网运行风险的差异自愈控制方法 | |
CN107340456B (zh) | 基于多特征分析的配电网工况智能识别方法 | |
CN110458230A (zh) | 一种基于多判据融合的配变用采数据异常甄别方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN104809658B (zh) | 一种低压配网台区线损的快速分析方法 | |
CN111722046B (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
CN110569867A (zh) | 基于决策树算法的输电线路故障原因判别方法、介质及设备 | |
CN109165604A (zh) | 基于协同训练的非侵入式负荷识别方法及其测试系统 | |
CN113379116A (zh) | 基于聚类和卷积神经网络的台区线损预测方法 | |
CN112149873A (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN110705859A (zh) | 基于pca-自组织神经网络的中低压配电网运行状态评估方法 | |
CN114169249B (zh) | 一种配电网高阻接地故障人工智能识别方法 | |
CN112787591A (zh) | 基于微调密集连接卷积神经网络的光伏阵列故障诊断方法 | |
CN115494349B (zh) | 有源配电网单相接地故障区段定位方法 | |
CN113627674A (zh) | 一种分布式光伏电站出力预测方法、装置及存储介质 | |
CN114386024A (zh) | 基于集成学习的电力内网终端设备异常攻击检测方法 | |
CN114330486A (zh) | 基于改进Wasserstein GAN的电力系统不良数据辨识方法 | |
CN115756919A (zh) | 一种面向多维数据的根因定位方法及系统 | |
CN118130968A (zh) | 一种基于深度学习的数据驱动的非侵入式反孤岛检测方法 | |
CN113469252A (zh) | 一种考虑不平衡样本的特高压换流阀运行状态评估方法 | |
CN116502149A (zh) | 基于电流特征传导的低压配电网户变关系识别方法及系统 | |
CN117150220A (zh) | 一种基于机器学习的光伏阵列故障诊断方法 | |
Solankee et al. | An intelligent fault diagnosis scheme for PV array using machine learning techniques | |
Dehghani et al. | Distribution feeder classification based on self organized maps (case study: Lorestan province, Iran) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |