CN114239639A - 特征选择方法、装置、计算机设备和存储介质 - Google Patents
特征选择方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114239639A CN114239639A CN202111312440.7A CN202111312440A CN114239639A CN 114239639 A CN114239639 A CN 114239639A CN 202111312440 A CN202111312440 A CN 202111312440A CN 114239639 A CN114239639 A CN 114239639A
- Authority
- CN
- China
- Prior art keywords
- arc
- features
- signal
- accuracy
- feature combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010187 selection method Methods 0.000 title abstract description 38
- 238000000034 method Methods 0.000 claims abstract description 51
- 238000012163 sequencing technique Methods 0.000 claims abstract description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 148
- 238000001514 detection method Methods 0.000 claims description 81
- 238000004590 computer program Methods 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 description 120
- 238000010586 diagram Methods 0.000 description 19
- 238000004422 calculation algorithm Methods 0.000 description 18
- 238000003062 neural network model Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000009413 insulation Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000010891 electric arc Methods 0.000 description 2
- 230000005670 electromagnetic radiation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 101150065184 sym-2 gene Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000254 damaging effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000011265 semifinished product Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种特征选择方法、装置、计算机设备和存储介质,通过获取目标电弧信号的初始特征,按照初始特征的重要性分数排序,从初始特征中确定至少一种候选特征组合;将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率,最后根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。该方法能够快速且准确地筛选出合适的特征,该筛选出的合适的特征可以实现以最少的特征确定出准确率最高的电弧故障辨别结果。
Description
技术领域
本申请涉及数据特征处理技术领域,特别涉及一种特征选择方法、装置、计算机设备和存储介质。
背景技术
在数据挖掘、机器学习、模式识别等诸多领域中,特征选择占据越来越重要的地位。通过特征选择可以降低各领域研究问题的复杂程度,提高学习算法的预测精度、鲁棒性和可解释性。
特征选择是从原始的特征集中选择某种评估标准最优的特征子集。在特征选择时,选择少的特征会导致建模效果不佳、可解释性不强;选择多的特征会导致运行速度较慢。
因此,如何快速且准确地筛选出合适的特征成为亟待解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种特征选择方法、装置、计算机设备和存储介质,能够快速且准确地筛选出合适的特征,该筛选出的合适的特征可以实现以最少的特征确定出准确率最高的电弧故障辨别结果。
第一方面,本申请实施例提供一种特征选择方法,该方法包括:
获取目标电弧信号的初始特征;初始特征包括多种类型的特征;
按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合;
将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率;
根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
在其中一个实施例中,获取目标电弧信号的初始特征,包括:
通过至少一种信号分解方式,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量;
通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率;
根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征。
在其中一个实施例中,信号分解方式为小波基分解,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量,包括:
根据各信号分解方式对目标电弧信号进行多层分辨率分解,得到各信号分解方式对应的候选电弧信号;
将预设采样点作为一个时间窗,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量;
根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量。
在其中一个实施例中,按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合,包括:
获取多种类型的特征的重要性分数;
以多种类型的特征的重要性分数从大到小的顺序,以多种类型的特征中第一个特征作为一个候选特征组合,并在第一个特征基础上依次加入后一个相邻的特征,得到各候选特征组合;其中,每加入一次后一个相邻的特征对应一个候选特征组合。
在其中一个实施例中,该方法还包括:
根据多种类型的特征的重要性分数,剔除多种类型的特征的重要性分数中不符合预设的组合条件的特征。
在其中一个实施例中,准确率预测模型的构建过程包括:
获取多个历史电弧信号特征;
将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到准确率预测模型。
在其中一个实施例中,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合,包括:
根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间;
将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合。
第二方面,本申请实施例提供一种特征选择装置,该装置包括:
获取模块,用于获取目标电弧信号的初始特征;初始特征包括多种类型的特征;
选择模块,用于按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合;
输入模块,用于将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率;
确定模块,用于根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时实现上述第一方面中任一实施例提供的方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一实施例提供的方法的步骤。
本申请实施例提供的一种特征选择方法、装置、计算机设备和存储介质,通过获取目标电弧信号的初始特征,按照初始特征的重要性分数排序,从初始特征中确定至少一种候选特征组合;将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率,最后根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。该方法中,因初始特征包括多种类型的特征,所以初始特征可以充分体现数据的特性,根据将初始特征按照重要性分数排序,确定候选特征组合,重要性分数是衡量特征在数据中的重要程度,因此,可以更加准确地确定候选特征组合,将候选特征组合输入至预设的准确率预测模型中,得到各候选组合的第一故障辨别准确率,根据得到的第一故障辨别准确率可以确定目标特征组合,因为候选特征组合是根据特征的重要性分数确定的,并得到各候选组合的准确率,根据准确率的对比可以得到目标特征组合,因此,该方法能够快速且准确地筛选出合适的特征,该筛选出的合适的特征可以实现以最少的特征确定出准确率最高的电弧故障辨别结果。
附图说明
图1为一个实施例中的特征选择方法的应用环境图;
图2为一个实施例中的特征选择方法的流程示意图;
图3为另一个实施例中的特征选择方法的流程示意图;
图4为一个实施例中的特征选择方法的结果示意图;
图5a为另一个实施例中的特征选择方法的结果示意图;
图5b为另一个实施例中的特征选择方法的结果示意图;
图6为另一个实施例中的特征选择方法的流程示意图;
图7为另一个实施例中的特征选择方法的结果示意图;
图8为另一个实施例中的特征选择方法的流程示意图;
图9为另一个实施例中的特征选择方法的结果示意图;
图10为另一个实施例中的特征选择方法的流程示意图;
图11为另一个实施例中的特征选择方法的流程示意图;
图12为另一个实施例中的特征选择方法的结果示意图;
图13为另一个实施例中的特征选择方法的流程示意图;
图14为一个实施例中的特征选择装置的结构框图;
图15为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的特征选择方法,可以应用于计算机设备中,该计算机设备可以是任何领域的设备,例如,电力设备,或者是各种个人计算机、笔记本电脑、平板电脑、可穿戴设备等等,本申请实施例对计算机设备的类型不作限定。如图1所示,提供一种计算机设备的内部结构示意图,图1中的处理器用于提供计算和控制能力。存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。数据库用于存储特征选择过程的相关数据。该网络接口用于与外部的其他设备通过网络连接通信。该计算机程序被处理器执行时以实现一种特征选择方法。
研究问题可以获得尽可能多的特征,因为仅根据三两个特征建模效果不佳,可解释性不强,而特征多则可以提供更多信息用于准确描述问题,研究结果也将更加充满说服力。但是,随着基因工程,文本分类,图形检索等大规模处理数据的问题不断出现,大规模数据特征选择对现有特征选择算法提出了严峻的挑战,特征选择也引起了机器学习领域学者的广泛兴趣。
特征选择通常选择与类别相关性强、且特征彼此间相关性弱的特征子集,具体的相关性选择算法通过定义合适的子集评价函数来体现这一点。
作为一个预处理过程,特征选择在数据挖掘、模式识别以及机器学习中都具有非常重要的地位,通过特征选择可以降低问题的复杂程度,提高学习算法的预测精度、鲁棒性和可解释性。现如今,特征选择领域的研究已经取得了很大进展,由于特征选择是一个非常复杂的问题,所以仍需要大量的研究。
一种方式中,对Filter(过滤式)算法进行特征选择算法的研究,Filter算法运行速度快但准确率较低。
另一种方式中,对Wrapper(包裹式)算法进行特征选择方法的研究,Wrapper算法效率低但准确率高。
基于此,本申请实施例提供一种特征选择方法、装置、计算机设备和存储介质,能够快速且准确地筛选出合适的特征,从而能够达到用最少的特征实现最高的准确率。
下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。需要说明的是,本申请提供的一种特征选择方法,各实施例的执行主体可以为计算机设备,其中,其执行主体还可以是特征选择装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为处理器的部分或者全部。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
在一个实施例中,如图2所示,提供了一种特征选择方法,本实施例涉及的是根据多种类型的特征的重要性分数排序,确定至少一种候选特征组合,得到各候选特征组合的第一故障辨别准确率,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合的具体过程。该实施例包括以下步骤:
S201,获取目标电弧信号的初始特征;初始特征包括多种类型的特征。
电弧是一种气体放电现象,电流通过某些绝缘介质(例如空气)所产生的瞬间火花,电弧是高温高导电的游离气体,它不仅对触头有很大的破坏作用,而且使断开电路的时间延长。因此,如果长时间的过负荷运行,或者电气接触不良,就会很容易出现输电线路绝缘皮老化的现象,降低绝缘效果,或者出现绝缘皮破损的情况,这样就会产生故障电弧,所以及时检测电弧状态是很有必要的。
一种实施例,获取电弧信号的方式,可以是在可能会发生电弧的部分安装一些参数检测的传感器,利用传感器得到电弧信号。
另一种实施例,获取电弧信号的方式,还可以是基于电弧放电时候的电磁辐射、光、声音以及热等方面出现的现象,利用红外线接收器对电弧放电时候的电磁辐射、热量以及噪声进行监测,从而获得电弧信号。
可选地,目标电弧信号就是本申请实施例中需要用到的一些电弧信号,可以从历史数据库中直接获取得到。
电弧信号的特征可以从两个方面考虑:电弧的时域特性和电弧的频域特性。电弧的时域特性可以采用电弧信号的均方根、平均值、峰值、标准差等参数作为电弧信号的特征;电弧的频域特征可以通过傅里叶变换,检测电弧发生前后的频谱变化情况,根据频谱变化,确定电弧特征频段以及频域特征量。因此,可选地,目标电弧信号的初始特征可以是均方根、平均值、峰值、标准差和频域特征量。
一种实施例,获取目标电弧信号的初始特征的方式可以是,通过预先训练好的神经网络模型,将目标电弧信号作为神经网络模型的输入,通过神经网络模型的训练,最终输出目标电弧信号的初始特征。
另一种实施例,获取目标电弧信号的初始特征的方式也可以是,根据获取的目标电弧信号,通过预设的计算方式,将目标电弧信号直接带入计算公式中,直接得到目标电弧信号的初始特征。
还有一种实施例,获取目标电弧信号的初始特征的方式还可以是,通过预先存储有电弧信号的特征的数据库中,直接向该数据库直接获得目标电弧信号的初始特征。
S202,按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合。
重要性分数衡量了特征在数据中价值,重要性分数越高,说明这个特征与数据整体的相关性越高。
通过特征的重要性分数,确定特征组合,具体地,将多种类型的特征的重要性分数排序,然后从多种类型的特征中确定特征组合,将确定的特征组合作为候选特征组合;其中,候选特征组合至少有一种。
一种实施例,对多种类型的特征的重要性分数进行排序,其排序的方式可以是将多种类型的特征的重要性分数按照从大到小的方式进行排序。
另一种实施例,对多种类型的特征的重要性分数进行排序,其排序的方式也可以是将多种类型的特征的重要性分数按照从小到大的方式进行排序。
还有一种实施例,对多种类型的特征的重要性分数进行排序,其排序的方式还可以是根据预设的神经网络模型,通过将多种类型的特征的重要性分数作为预设的神经网络模型的输入,将预设的神经网络模型进行训练,最终输出排序后重要性分数以及对应的特征。
一种实施例,确定至少一种候选特征组合的方式,可以是根据预设的特征组合算法,具体地,将排序后的多种类型的特征的重要性分数作为预设的特征组合算法的输入,通过运行算法,直接输出至少一种候选特征组合。
S203,将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率。
预设的准确率预测模型是一种通过训练集数据训练得到的一种预测模型,通过该预设的准确率预测模型,可以预测现有数据的准确率,其中,训练集数据可以是多种数据集合,必须无偏、全面、均衡。
故障辨别准确率就是各候选组合通过预设的准确率预测模型训练得到的准确率。
一种实施例,预设的准确率预测模型可以通过机器学习算法得到,通过将训练集通过该机器学习算法进行训练,最终得到预设的准确率预测模型。
另一种实施例,预设的准确率预测模型也可以通过神经网络算法得到,首先选择inceptionV4网络和优化器,然后对训练集进行迭代训练,最终得到预设的准确率预测模型。
一种实施例,将上述实施例得到的各候选特征组合作为预设的准确率预测模型的输入,然后训练该预设的准确率预测模型,得到各候选特征组合的第一故障辨别准确率。
另一种实施例,首先训练一个状态预测模型,将上述实施例得到的各候选特征组合作为状态预测模型的输入,得到各候选特征组合对应的预测状态,基于得到的预测状态,进一步得到各候选特征组合的第一故障辨别准确率。
S204,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
目标特征组合是在多种特征中得到的最佳的一种特征子集,该目标特征组合可以达到使用最少的特征却可以实现最高的准确率的一种组合方式。
一种实施例,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合,其中确定的方式可以是,通过预先训练好的神经网络模型,将各候选特征组合的第一故障辨别准确率作为该神经网络模型的输入,通过训练该神经网络模型,可以输出目标特征组合。
另一种实施例,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合,其中确定的方式也可以是,根据各候选特征组合的第一故障准确率,通过对比,得到准确率最高对应的候选特征组合,将准确率最高对应的候选特征组合确定为目标特征组合。
还有一种实施例,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合,其中确定的方式还可以是,根据各候选特征组合的第一故障准确率,通过对比,得到准确率最小对应的候选特征组合,将准确率最小对应的候选特征组合确定为目标特征组合。
本申请实施例提供的特征选择方法,通过获取目标电弧信号的初始特征,按照初始特征的重要性分数排序,从初始特征中确定至少一种候选特征组合;将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率,最后根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。该方法中,因初始特征包括多种类型的特征,所以初始特征可以充分体现数据的特性,根据将初始特征按照重要性分数排序,确定候选特征组合,重要性分数是衡量特征在数据中的重要程度,因此,可以更加准确地确定候选特征组合,将候选特征组合输入至预设的准确率预测模型中,得到各候选组合的第一故障辨别准确率,根据得到的第一故障辨别准确率可以确定目标特征组合,因为候选特征组合是根据特征的重要性分数确定的,并得到各候选组合的准确率,根据准确率的对比可以得到目标特征组合,因此,该方法能够快速且准确地筛选出合适的特征,该筛选出的合适的特征可以实现以最少的特征确定出准确率最高的电弧故障辨别结果。
基于前面的实施例,在一个实施例中,如图3所示,获取目标电弧信号的初始特征,包括以下步骤:
S301,通过至少一种信号分解方式,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量。
为了便于分析复杂的信号,可以将信号进行分解,例如,将一个平均值不为零的信号分解为直流分量和交流分量;或者,把任意信号分解为偶分量和奇分量。
信号分解方式包括傅里叶变换和小波变换。其中,傅里叶变换是将负无穷的时域信号变换到频域中进行分析,它反映的是原始信号在整体时间的频谱;小波变换是将基本小波或者称为目小波函数,经过时移因子,并且在不同尺度因子的条件下,与给定的平方可积的时域原始信号作内积,小波变换在时频域都具有反映信号局部特征的能力并且具有多分辨率分析的特点。
可选地,目标电弧信号可以采用500kHz的电弧信号。
一种实施例,通过信号分解方式,对目标电弧信号进行信号分解,具体地,可以采用傅里叶变换的方式对目标电弧信号进行信号分解。
另一种实施例,通过信号分解方式,对目标电弧信号进行信号分解,具体地,也可以采用小波变换的方式对目标电弧信号进行信号分解。
可选地,得到各信号分解方式对应的电弧检测特征量,得到的方式可以是提取经过信号分解后的目标电弧信号的平均值和峰值,根据平均值和峰值,计算经过信号分解后的目标电弧信号的时域特征量,从而得到各信号分解方式对应的电弧检测特征量;得到的方式还可以是根据信号分解后的目标电弧信号的小波系数,从得到的小波系数中提取特征量作为频域特征量,即各信号分解方式对应的电弧检测特征量。
S302,通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率。
一种实施例,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率的方式可以是,根据准确率预测模型,将各信号分解方式对应的电弧检测特征量作为该准确率预测模型的输入,通过运行该准确率预测模型,最终直接输出各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率。
一种实施例,如图4所示,图4是通过选取小波分解的不同小波基的信号分解方式,对目标电弧信号进行信号分解得到的各信号分解方式对应的电弧检测特征量,进而根据准确率预测模型和各信号分解方式对应的电弧检测特征量,得到各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率,图4就是根据不同的小波基得到的对应的第二故障辨别准确率,根据不同的小波基计算第二故障辨别准确率,可以得到不同小波基特征对最终检测准确率影影响的重要程度。如图5a所示,为电弧检测特征量的实际电弧状态,数字1表示故障电弧状态,数字0表示正常电弧状态,其利用Rbio3.1小波基的信号分解方式对应的电弧检测特征量对应的预测结果如图5b所示,根据实际电弧状态与对应的预测结果得到第二故障辨别准确率。
S303,根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征。
在图4中,Rbio3.1小波基的第二故障辨别准确率为0.947,其他小波基构建得到的特征检测对应第二故障辨别准确率均为0.869,因此Rbio3.1小波基更适用于故障电弧检测特征的构建。根据图4可知,基于Rbio3.1小波基构建得到的检测特征可以较为准确地检测故障电弧地发生,特征重要程度与最终的算法检测准确率呈现正相关关系,特征重要程度越高,其对应的准确率亦越高。因此利用选用Rbio3.1小波基最为合适。
可选地,根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征,如图4所示,最大的第二故障辨别准确率对应的信号分解方式是采用Rbio3.1小波基进行6层小波分解,因此将目标电弧信号采用Rbio3.1小波基进行6层小波分解,选取23.4-31.25kHz频段的分解后的目标电弧信号,然后计算每8000个采样点构成的时间窗内的小波系数的平均值、最大值、最小值和鞘度,将每个时间窗的平均值、最大值、最小值和鞘度作为目标电弧信号的初始特征。
其中,计算目标电弧信号的初始特征的方式可以是根据预设的神经网络模型,将最大的第二故障辨别准确率对应的信号分解方式和目标电弧信号作为神经网络模型的输入,通过神经网络模型的训练,最终直接输出目标电弧信号的初始特征。
本申请实施例提供的特征选择方法,首先通过至少一种信号分解方式,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量,然后通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率,最后根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征。该方法中,根据不同的信号分解方式得到各信号分解方式对应的电弧检测特征量,然后根据特征量计算对应的第二故障辨别准确率,从而得到目标电弧信号的初始特征,因此,提高了故障检测的准确率,为快速且准确地筛选出合适的特征组合提供了基础。
对于前面实施例中对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量,下面对此进行详细说明,在一个实施例中,如图6所示,信号分解方式为小波基分解,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量,包括以下步骤:
S601,根据各信号分解方式对目标电弧信号进行多层分辨率分解,得到各信号分解方式对应的候选电弧信号。
一种实施例,信号分解方式可以采用小波分解的方式,小波变换中,可以选用不同的小波基,因此,可以采用不同的小波基函数对目标电弧信号进行分解,小波基函数可以包括:Rbio3.1、Rbio1.1、Rbio4.4、Rbio3.5、Bior1.1、Bior3.3、Db1、DB2、Sym2等。
一种实施例,对目标电弧信号进行多层分辨率分解,可以将Rbio3.1作为小波基,将目标电弧信号进行6层小波分解,得到分解后的目标电弧信号,然后可以在分解后的目标电弧信号中选取23.4-31.25kHz频段的信号作为候选电弧信号;其中,在实际应用中,选取多少频段的信号,本申请实施例也不做任何限定。
另一种实施例,对目标电弧信号进行多层分辨率分解,也可以将Bior3.1作为小波基,将电流信号进行5层小波分解,得到分解后的目标电弧信号,然后可以将分解后的目标电弧信号中直接作为候选电弧信号。
可选地,对目标电弧信号进行多层分辨率分解,在具体实际应用中,具体选取几层分辨率分解,本申请实施例对此不做限定。
S602,将预设采样点作为一个时间窗,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量。
电弧检测特征量是根据目标电弧信号经过信号分解,通过计算得到的目标电弧的特征量,可以表示目标电弧信号的状态。
一种实施例,将上述实施例得到的候选电弧信号,根据预设的采样点构成一个分析时间窗,然后对每个时间窗内的信号求特征量,根据候选电弧信号中每个时间窗对应的特征量就是信号分解方式对应的电弧检测特征量;其中每个时间窗内的信号求特征量的方式可以是将每个时间窗内的采样点求平方,然后每个平方项求和就是每个时间窗对应的特征量。
可选地,预设的采样点可以是8000采样点,但是在实际应用中,本申请实施例对此不作限定。
一种实施例,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量的方式,可以通过预先配置好的程序得到,具体地,将各信号分解方式对应的候选电弧信号中每一个时间窗作为输入,通过调用该预先配置好的程序,最终得到各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量。
S603,根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量。
一种实施例,根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量,确定的方式可以是将各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量直接确定为各信号分解方式对应的电弧检测特征量;例如,如果一种信号分解方式下对应的候选电弧信号有3个时间窗,每一个时间窗的电弧检测特征量分别是a、b和c,那么该信号分解方式下对应的的电弧检测特征量就是a、b和c。
另一种方式,根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量,确定的方式也可以是通过一个计算函数计算得到,具体地,将各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量代入该计算函数,最后得到的函数结果就是各信号分解方式对应的电弧检测特征量;例如,如果一种信号分解方式下对应的候选电弧信号有3个时间窗,每一个时间窗的电弧检测特征量分别是a、b和c,分别将每一个时间窗的电弧检测特征量代入该计算函数,得到的结果分别是d、e和f,那么该信号分解方式下对应的的电弧检测特征量就是d、e和f。
一种实施例,根据Rbio.3小波基对目标电弧信号进行6层小波分解,并选取23.4-31.25kHz的分解后的目标电弧信号,并将每8000各采样点看做是一个分析时间窗,计算时间窗内每个采样点的平方项,并将每个采样点的平方项相加之和看作是每个时间窗的电弧检测特征量,如图7所示,图7为根据目标电弧信号得到的电弧检测特征量。
本申请实施例提供的特征选择方法,根据各信号分解方式对目标电弧信号进行多层分辨率分解,得到各信号分解方式对应的候选电弧信号,将预设采样点作为一个时间窗,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量。该方法中,能够快速且准确地筛选出合适的特征,该筛选出的特征组合可以达到用最少的特征实现最高的准确率的电弧故障辨别结果。
基于前面的实施例,在一个实施例中,如图8所示,按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合,包括以下步骤:
S801,获取多种类型的特征的重要性分数。
一种实施例,获取多种类型的特征的重要性分数,其获取的方式可以是根据随机森林的方式计算多种类型的特征的重要性分数,具体地,根据多种类型的特征,通过基尼指数计算多种类型的特征的纯度衡量特征的重要性,从而得到多种类型的特征的重要性分数。
另一种实施例,获取多种类型的特征的重要性分数,其获取的方式还可以是根据极值梯度提升算法(eXtreme Gradient Boosting,XGBoost)计算多种类型的特征的重要性分数,具体地,根据多种类型的特征,设置决策树,通过决策树计算多种类型的特征的重要性分数。
S802,以多种类型的特征的重要性分数从大到小的顺序,以多种类型的特征中第一个特征作为一个候选特征组合,并在第一个特征基础上依次加入后一个相邻的特征,得到各候选特征组合。
其中,每加入一次后一个相邻的特征对应一个候选特征组合。
候选特征组合是根据多种类型的特征进行相互组合得到的。
一种实施例,将多种类型的特征的重要性分数从大到小的顺序排列,以多种类型的特征中的第一个特征作为一个候选特征组合,并在第一个候选组合的基础上依次加入后一个相邻的特征,得到各候选特征组合;例如,多种类型的特征为:熵、方差、标准差、均方差、偏度、平均值、最大值、最小值和鞘度,将多种类型的特征的重要性分数从小到大的顺序排序为:方差、最小值、最大值、平均值、偏度、鞘度、均方差、标准差和熵,如图9所示,图9为多种类型的特征的重要性分数从大到小的顺序排序,将方差作为第一个候选特征,然后依次加入最小值的特征,将方差和最小值作为第2个候选特征组合,依次,方差、最小值和最大值为第3个候选特征组合,方差、最小值、最大值和平均值作为第4个候选特征组合,方差、最小值、最大值、平均值和偏度作为第5个候选特征组合,方差、最小值、最大值、平均值、偏度和鞘度作为第6个候选特征组合,方差、最小值、最大值、平均值、偏度、鞘度和均方差作为第7个候选特征组合,方差、最小值、最大值、平均值、偏度、鞘度、均方差和标准差作为第8个候选特征组合,方差、最小值、最大值、平均值、偏度、鞘度、均方差、标准差和熵作为第9个候选特征组合,以此得到了各候选特征组合。
本申请实施例提供的特征选择方法,通过获取多种类型的特征的重要性分数,以多种类型的特征的重要性分数从大到小的顺序,以多种类型的特征中第一个特征作为一个候选特征组合,并在第一个特征基础上依次加入后一个相邻的特征,得到各候选特征组合;其中,每加入一次后一个相邻的特征对应一个候选特征组合。该方法中,首先获取多种类型的特征的重要性分数,然后根据重要性分数从大到小的排名,依次生成候选特征组合,由于重要性分数与数据整体具有很大的相关性,因此该方法能够快速且准确地筛选出合适的特征,达到了用最少的特征实现最高的准确率的电弧故障辨别结果。
前面针对获取多种类型的特征的重要性分数后,将多种类型的特征的重要性分数从大到小进行排序,然后以此得到各候选特征组合,但是,在得到各候选特征组合之前,还存在将重要性分数较低的特征进行剔除的操作,针对此情况,下面通过一个实施例进行说明,该实施例包括:根据多种类型的特征的重要性分数,剔除多种类型的特征的重要性分数中不符合预设的组合条件的特征。
一种实施例,预设的组合条件,可以是设定一个固定的数值,将多种类型的特征的重要性分数与预设的数值进行对比,将小于预设的数值的重要性分数对应的特征进行剔除,例如,多种类型的特征包括最大值、最小值、平均值和偏度,最大值、最小值、平均值和偏度对应的重要性分数分别是200,400,300和350,预设的组合条件是大于280,因此就会将重要性分数为200对应的最大值特征进行剔除。
另一种实施例,预设的组合条件,也可以是设定一个比例,将多种类型的特征的重要性分数进行排序后,然后剔除预设比例的特征,剔除特征时,是从小到大剔除的,先将重要性分数低的特征进行剔除,例如,多种类型的特征包括最大值、最小值、平均值和偏度,最大值、最小值、平均值和偏度对应的重要性分数分别是200,400,300和350,预设的组合条件是预设比例是25%,那么就会在4个特征中剔除1个,最大值对应的重要性分数最小,那么就将最大值特征剔除。
基于前面实施例中将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率和通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率,下面通过一个实施例对准确率模型的构建过程进行详细说明,在一个实施例中,如图10所示,准确率预测模型的构建过程包括以下步骤:
S1001,获取多个历史电弧信号特征。
历史电弧信号特征包括电弧信号的多种特征表现形式,包括将电弧信号从时域和频域两个方面得到的电弧信号特征;电弧信号特征的电弧状态包括两种:故障和正常,所以,历史电弧信号特征包括故障的历史电弧信号特征和正常的历史电弧信号特征。
一种实施例,获取多个历史电弧信号特征的方式可以是,向历史数据库发送数据请求消息,然后从历史数据库中直接获取历史电弧信号特征。
还有一种实施例,获取多个历史电弧信号特征的方式也可以是,从数据采集仪器中获取,具体地,数据采集仪器对电弧数据进行采集后,生成的一个数据文件,其中数据文件中包括电弧信号特征,获取多个历史电弧信号特征就是从数据采集仪器中的数据文件中获取。
S1002,将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到准确率预测模型。
初始准确率预测模型是一个初始的准确率预测模型,可以看作是一个半成品的准确率预测模型。
将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率的测试值,将故障辨别准确率的测试值与预设的故障辨别准确率的标准值进行对比,判断是否满足迭代条件,如果不满足迭代条件,那么继续对准确率预测模型进行迭代,如果满足预设的迭代条件,那么得到准确率预测模型。
一种实施例,将多个历史电弧信号特征,输入至XGBoost算法中进行训练,得到故障辨别准确率的测试值,将故障辨别准确率的测试值与预设的故障辨别准确率的标准值进行对比,如果满足迭代条件,就得到准确率预测模型,否则,继续迭代直至满足预设的迭代条件。
其中,可选地,预设的迭代条件可以是故障辨别准确率的测试值与预设的故障辨别准确率的标准值是一致的;预设的迭代条件也可以是故障辨别准确率的测试值与预设的故障辨别准确率的标准值有很小的区间误差。
本申请实施例提供的特征选择方法,通过获取多个历史电弧信号特征,将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到准确率预测模型。该方法中,通过将多个历史电弧信号特征进行训练,得到准确率预测模型,该准确率预测模型可以准确地预测电弧信号特征的故障准确率,因此,利用该模型能够快速且准确地筛选出合适的特征,达到了用最少的特征实现最高的准确率的电弧故障辨别结果。
基于前面的实施例,在一个实施例中,如图11所示,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合,包括以下步骤:
S1101,根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间。
一种实施例,获取各候选特征组合的第一故障辨别准确率的稳定区间的方法可以是,通过神经网络模型方式获取的,将各候选特征组合的第一故障辨别准确率作为神经网络模型的输入,通过神经网络模型的训练,最终神经网络模型会直接输出第一故障辨别准确率稳定区间对应的候选特征组合。
各候选特征组合的第一故障辨别准确率的稳定区间表示各候选特征组合的第一故障辨别准确率不再改变,趋于稳定的候选特征组合区间。例如,如图12所示,图12是各候选特征组合得到的第一故障辨别准确率,其中表示的是,方差的第一故障辨别准确率是0.9965,方差和最小值的第一故障辨别准确率是0.997,方差、最小值和最大值的第一故障辨别准确率是0.9986,方差、最小值、最大值和平均值的第一故障辨别准确率是0.9989,方差、最小值、最大值、平均值和偏度的第一故障辨别准确率是0.9992,方差、最小值、最大值、平均值、偏度和鞘度的第一故障辨别准确率是0.9992,方差、最小值、最大值、平均值、偏度、鞘度和均方差的第一故障辨别准确率是0.9992,方差、最小值、最大值、平均值、偏度、鞘度、均方差和标准差的第一故障辨别准确率是0.9992,方差、最小值、最大值、平均值、偏度、鞘度、均方差、标准差和熵的第一故障辨别准确率是0.9992;由此可知,第一故障辨别准确率的稳定区间对应的候选特征组合有:方差、最小值、最大值、平均值和偏度,方差、最小值、最大值、平均值、偏度和鞘度,方差、最小值、最大值、平均值、偏度、鞘度和均方差,方差、最小值、最大值、平均值、偏度、鞘度、均方差和标准差,方差、最小值、最大值、平均值、偏度、鞘度、均方差、标准差和熵。
S1102,将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合。
请继续参见图12,图12中可以看出,稳定区间中首个第一故障辨别准确率对应的候选特征组合是方差、最小值、最大值、平均值和偏度,因此可以将方差、最小值、最大值、平均值和偏度确定为目标特征组合。
本申请实施例提供了一种特征选择方法,根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间,将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合。该方法中,将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合,能够快速且准确地筛选出合适的特征组合,实现了用最少的特征实现最高的准确率的电弧故障辨别结果。
如图13所示,在一个实施例中,还包括一种特征选择方法,该实施例包括:
S1301,根据原始电弧特征与电弧状态,利用XGBoost算法得到电弧数据的状态分类标准。
S1302,获取直流故障电弧信号与对应的状态,分别选取不同小波基,分别对直流故障电弧信号进行6层小波分解,然后选取23.4-31.25kHz的电流信号m1;
其中,小波基包括:Rbio3.1、Rbio1.1、Rbio4.4、Rbio3.5、Bior1.1、Bior3.3、Db1、DB2、Sym2。
S1303,分别将m1中的每8000个采样点看作一个分析时间窗,对每个时间窗内的采样点求平方,然后将平方相加之和看作每个分析时间窗的故障电弧检测特征量,得到各小波基下的m1的特征量池。
S1304,根据特征量池,通过电弧数据的状态分类标准进行预测,得到各小波基下的各特征对应的预测状态。
S1305,根据各小波基下的各特征对应的预测状态与各小波基下的各特征对应的实际状态,得到各小波基下的检测准确率。
S1306,将最大检测准确率对应的小波基作为构建故障电弧检测特征的小波基,对直流故障电弧信号进行6层小波分解,然后选取23.4-31.25kHz的电流信号,将8000各采样点作为一个时间窗,计算每个时间窗中的小波系数对应的特征量,得到特征量池;
其中,特征量包括:熵、方差、标准差、均方差、偏度、平均值、最大值、最小值和鞘度。S1307,根据特征量池,利用XGBoost算法,计算各特征对应的重要性分数。
S1307,对各特征对应的重要性分数进行从大到小的排序,剔除10%重要性分数最小的特征。
S1308,以最大的重要性分数对应的特征为基本特征,逐个累计加入其他特征分别计算故障识别的准确率。
S1309,当逐个加入特征时,准确率不再增加,将准确率不再增加之后增加的特征作为冗余特征,将准确率不再增加之前的特征确定最终的特征组合。
本实施例提供的特征选择方法中各步骤,其实现原理和技术效果与前面各特征选择方法实施例中类似,在此不再赘述。
值得注意的是,本申请实施例提供的特征选择方法可以应用于各种各样的数据,具有一定意义上的普遍性与可移植性。
应该理解的是,虽然上述实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述实施例中的流程图至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
另外,本申请实施例还提供了一种特征选择装置,如图14所示,在一个实施例中,该特征选择装置1400包括:获取模块1401、选择模块1402、输入模块1403和确定模块1404,其中:
第一获取模块1401,用于获取目标电弧信号的初始特征;初始特征包括多种类型的特征;
选择模块1402,用于按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合;
输入模块1403,用于将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率;
确定模块1404,用于根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
在其中一个实施例中,第一获取模块1401包括:
分解单元,用于通过至少一种信号分解方式,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量;
第一获取单元,用于通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率;
第二获取单元,用于根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征。
在其中一个实施例中,分解单元包括:
分解子单元,用于根据各信号分解方式对目标电弧信号进行多层分辨率分解,得到各信号分解方式对应的候选电弧信号;
计算子单元,用于将预设采样点作为一个时间窗,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量;
确定子单元,用于根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量。
在其中一个实施例中,选择模块1402包括:
第三获取单元,用于获取多种类型的特征的重要性分数;
组合单元,用于以多种类型的特征的重要性分数从大到小的顺序,以多种类型的特征中第一个特征作为一个候选特征组合,并在第一个特征基础上依次加入后一个相邻的特征,得到各候选特征组合;其中,每加入一次后一个相邻的特征对应一个候选特征组合。
在其中一个实施例中,该装置还包括:
剔除模块,用于根据多种类型的特征的重要性分数,剔除多种类型的特征的重要性分数中不符合预设的组合条件的特征。
在其中一个实施例中,还提供了一个特征选择装置,该装置包括:
第二获取模块,用于获取多个历史电弧信号特征;
训练模块,用于将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到准确率预测模型。
在其中一个实施例中,确定模块1404包括:
第四获取单元,用于根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间;
确定单元,用于将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合。
关于特征选择装置的具体限定可以参见上文中对于特征选择方法的限定,在此不再赘述。上述特征选择装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图15所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种特征选择方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取目标电弧信号的初始特征;初始特征包括多种类型的特征;
按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合;
将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率;
根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
在一个实施例中,该处理器执行计算机程序时实现以下步骤:
通过至少一种信号分解方式,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量;
通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率;
根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征。
在一个实施例中,该处理器执行计算机程序时实现以下步骤:
根据各信号分解方式对目标电弧信号进行多层分辨率分解,得到各信号分解方式对应的候选电弧信号;
将预设采样点作为一个时间窗,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量;
根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量。
在一个实施例中,该处理器执行计算机程序时实现以下步骤:
获取多种类型的特征的重要性分数;
以多种类型的特征的重要性分数从大到小的顺序,以多种类型的特征中第一个特征作为一个候选特征组合,并在第一个特征基础上依次加入后一个相邻的特征,得到各候选特征组合;其中,每加入一次后一个相邻的特征对应一个候选特征组合。
在一个实施例中,该处理器执行计算机程序时实现以下步骤:
根据多种类型的特征的重要性分数,剔除多种类型的特征的重要性分数中不符合预设的组合条件的特征。
在一个实施例中,该处理器执行计算机程序时实现以下步骤:
获取多个历史电弧信号特征与对应标准电弧状态;
将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到准确率预测模型。
在一个实施例中,该处理器执行计算机程序时实现以下步骤:
根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间;
将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合。
上述实施例提供的一种计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取目标电弧信号的初始特征;初始特征包括多种类型的特征;
按照多种类型的特征的重要性分数排序,从多种类型的特征中确定至少一种候选特征组合;
将各候选特征组合输入至预设的准确率预测模型中,得到各候选特征组合的第一故障辨别准确率;
根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
在一个实施例中,该计算机程序被处理器执行时实现以下步骤:
通过至少一种信号分解方式,对目标电弧信号进行信号分解,得到各信号分解方式对应的电弧检测特征量;
通过准确率预测模型,获取各信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率;
根据最大的第二故障辨别准确率对应的信号分解方式,获取目标电弧信号的初始特征。
在一个实施例中,该计算机程序被处理器执行时实现以下步骤:
根据各信号分解方式对目标电弧信号进行多层分辨率分解,得到各信号分解方式对应的候选电弧信号;
将预设采样点作为一个时间窗,计算各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量;
根据各信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各信号分解方式对应的电弧检测特征量。
在一个实施例中,该计算机程序被处理器执行时实现以下步骤:
获取多种类型的特征的重要性分数;
以多种类型的特征的重要性分数从大到小的顺序,以多种类型的特征中第一个特征作为一个候选特征组合,并在第一个特征基础上依次加入后一个相邻的特征,得到各候选特征组合;其中,每加入一次后一个相邻的特征对应一个候选特征组合。
在一个实施例中,该计算机程序被处理器执行时实现以下步骤:
根据多种类型的特征的重要性分数,剔除多种类型的特征的重要性分数中不符合预设的组合条件的特征。
在一个实施例中,该计算机程序被处理器执行时实现以下步骤:
获取多个历史电弧信号特征与对应标准电弧状态;
将多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到准确率预测模型。
在一个实施例中,该计算机程序被处理器执行时实现以下步骤:
根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间;
将稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为目标特征组合。
上述实施例提供的一种计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种特征选择方法,其特征在于,所述方法包括:
获取目标电弧信号的初始特征;所述初始特征包括多种类型的特征;
按照所述多种类型的特征的重要性分数排序,从所述多种类型的特征中确定至少一种候选特征组合;
将各所述候选特征组合输入至预设的准确率预测模型中,得到各所述候选特征组合的第一故障辨别准确率;
根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
2.根据权利要求1所述的方法,其特征在于,所述获取目标电弧信号的初始特征,包括:
通过至少一种信号分解方式,对所述目标电弧信号进行信号分解,得到各所述信号分解方式对应的电弧检测特征量;
通过所述准确率预测模型,获取各所述信号分解方式对应的电弧检测特征量对应的第二故障辨别准确率;
根据最大的第二故障辨别准确率对应的信号分解方式,获取所述目标电弧信号的初始特征。
3.根据权利要求2所述的方法,其特征在于,所述信号分解方式为小波基分解,所述对所述目标电弧信号进行信号分解,得到各所述信号分解方式对应的电弧检测特征量,包括:
根据各所述信号分解方式对所述目标电弧信号进行多层分辨率分解,得到各所述信号分解方式对应的候选电弧信号;
将预设采样点作为一个时间窗,计算各所述信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量;
根据各所述信号分解方式对应的候选电弧信号中每一个时间窗的电弧检测特征量,确定各所述信号分解方式对应的电弧检测特征量。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述按照所述多种类型的特征的重要性分数排序,从所述多种类型的特征中确定至少一种候选特征组合,包括:
获取所述多种类型的特征的重要性分数;
以所述多种类型的特征的重要性分数从大到小的顺序,以所述多种类型的特征中第一个特征作为一个候选特征组合,并在所述第一个特征基础上依次加入后一个相邻的特征,得到各所述候选特征组合;其中,每加入一次后一个相邻的特征对应一个候选特征组合。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述多种类型的特征的重要性分数,剔除所述多种类型的特征的重要性分数中不符合预设的组合条件的特征。
6.引1-3任一项,所述准确率预测模型的构建过程包括:
获取多个历史电弧信号特征;
将所述多个历史电弧信号特征输入至初始准确率预测模型中,得到故障辨别准确率测试值,直至所述故障辨别准确率测试值与预设的故障辨别准确率标准值满足预设迭代收敛条件,得到所述准确率预测模型。
7.根据权利要求1-3任一项所述的方法,其特征在于,根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合,包括:
根据各候选特征组合的第一故障辨别准确率,获取各候选特征组合的第一故障辨别准确率的稳定区间;
将所述稳定区间中首个第一故障辨别准确率对应的候选特征组合,确定为所述目标特征组合。
8.一种特征选择装置,其特征在于,所述装置包括:
获取模块,用于获取目标电弧信号的初始特征;所述初始特征包括多种类型的特征;
选择模块,用于按照所述多种类型的特征的重要性分数排序,从所述多种类型的特征中确定至少一种候选特征组合;
得到模块,用于将各所述候选特征组合输入至预设的准确率预测模型中,得到各所述候选特征组合的第一故障辨别准确率;
确定模块,用于根据各候选特征组合的第一故障辨别准确率,确定出目标特征组合。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111312440.7A CN114239639A (zh) | 2021-11-08 | 2021-11-08 | 特征选择方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111312440.7A CN114239639A (zh) | 2021-11-08 | 2021-11-08 | 特征选择方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114239639A true CN114239639A (zh) | 2022-03-25 |
Family
ID=80748587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111312440.7A Pending CN114239639A (zh) | 2021-11-08 | 2021-11-08 | 特征选择方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114239639A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114662702A (zh) * | 2022-03-31 | 2022-06-24 | 北京百度网讯科技有限公司 | 故障检测方法、装置、电子设备和介质 |
-
2021
- 2021-11-08 CN CN202111312440.7A patent/CN114239639A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114662702A (zh) * | 2022-03-31 | 2022-06-24 | 北京百度网讯科技有限公司 | 故障检测方法、装置、电子设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113792453B (zh) | 基于数字孪生的局部放电监测系统、方法和装置 | |
JP7000468B2 (ja) | 重複ビデオの判定方法及び装置 | |
WO2019129060A1 (zh) | 自动生成机器学习样本的特征的方法及系统 | |
CN107766573B (zh) | 基于数据处理的商品推荐方法、装置、设备和存储介质 | |
CN112037223B (zh) | 图像缺陷检测方法、装置及电子设备 | |
CN115577259A (zh) | 高压直流输电系统故障选极方法、装置和计算机设备 | |
JP7423998B2 (ja) | 二部ネットワーク内のミッシングリンクを理解するための視覚分析フレームワーク、方法、プログラム、装置、およびシステム | |
CN114239639A (zh) | 特征选择方法、装置、计算机设备和存储介质 | |
CN116611003A (zh) | 一种变压器故障诊断方法、装置、介质 | |
WO2020053277A1 (en) | Computer-implemented method and electronic device for detecting influential components in a netlist representing an electrical circuit | |
CN113052060B (zh) | 基于数据增强的轴承剩余寿命预测方法、装置及电子设备 | |
CN115169155A (zh) | 发动机故障预测方法、装置、计算机设备和存储介质 | |
CN114065814A (zh) | Gil局部放电的缺陷类型识别方法、装置 | |
CN115248816A (zh) | 一种深度学习模型检测方法、装置、设备及存储介质 | |
CN118432952B (zh) | 一种零信任环境下的异常检测方法、电子设备及存储介质 | |
CN115357461B (zh) | 异常检测的方法、装置、电子设备及计算机可读存储介质 | |
CN112308170B (zh) | 建模方法、装置及电子设备 | |
CN117517856A (zh) | 电压暂降原因识别方法、装置、计算机设备和存储介质 | |
CN117275516A (zh) | 音频指纹识别模型训练方法、音频识别方法、设备和介质 | |
CN117349098A (zh) | 图形处理器性能测试方法、装置、计算机设备和存储介质 | |
CN118259111A (zh) | 配电网故障选线方法、装置、计算机设备和存储介质 | |
CN116884442A (zh) | 情绪识别方法、装置、计算机设备和存储介质 | |
CN117278381A (zh) | 服务器告警数据的处理方法、装置、计算机设备和介质 | |
Hadi et al. | Implementation of Convolutional Neural Network with EfficientNet-B0 Architecture for Brain Tumor Classification | |
Mahajan | GT-DTW: Bridging Graph Theory and Dynamic Time Warping for Complex Time Series Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |