CN113947011A - 一种低压直流接触器状态评估方法及装置 - Google Patents
一种低压直流接触器状态评估方法及装置 Download PDFInfo
- Publication number
- CN113947011A CN113947011A CN202111045923.5A CN202111045923A CN113947011A CN 113947011 A CN113947011 A CN 113947011A CN 202111045923 A CN202111045923 A CN 202111045923A CN 113947011 A CN113947011 A CN 113947011A
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- algorithm
- state
- importance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000001914 filtration Methods 0.000 claims abstract description 33
- 230000009467 reduction Effects 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 90
- 230000006870 function Effects 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 35
- 241000245665 Taraxacum Species 0.000 claims description 33
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 28
- 238000012360 testing method Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 20
- 238000000354 decomposition reaction Methods 0.000 claims description 16
- 230000003044 adaptive effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 11
- 238000005259 measurement Methods 0.000 claims description 10
- 239000003102 growth factor Substances 0.000 claims description 8
- 230000005284 excitation Effects 0.000 claims description 7
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 20
- 238000010899 nucleation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000009331 sowing Methods 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000003750 conditioning effect Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 206010063385 Intellectualisation Diseases 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Neurology (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种低压直流接触器状态评估方法及装置,采集表征低压直流接触器状态的数据,然后采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据,采用主成分分析方法对该数据进行降维处理;采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;最后采用优化的极限学习机对该直流接触器进行状态评估。本发明通过采用基于机器学习的XGBoost算法对该数据的重要性进行计算并采用优化的极限学习机对该直流接触器进行状态评估,能够实现对低压直流接触器状态进行准确地评估。
Description
技术领域
本发明涉及低压直流接触器状态监测技术领域,尤其涉及一种低压直流接触器状态评估方法及装置。
背景技术
开关电器在自动控制、通信和电力保护等系统中被广泛应用,扮演着控制、保护、检测和调节的角色。低压电器作为控制回路关合的重要装置广泛的被应用在低压直流生态供电系统中。
如今电器设备智能化被提出了更高要求,工业自动化和智能制造越来越受到重视。智能电器一方面能以数字化方式监测和采集电器设备运行中的各项现场参数,后台系统分析处理数据并做出智能化判断,并制定相应的电器设备检修策略,大大减少检修的人力物力;另一方面智能电器可以实现自身监测、诊断和保护功能,通过对其进行寿命状态评估,获得电力设备实时运行状态参数,自动按照制定的策略动作。
目前,工业自动化和电器智能化正在不断发展和完善,智能电网正有条不紊的建设,接触器的智能化发展是必然趋势。直流接触器作为控制电器中使用十分广泛的电器开关产品,其工作状态直接影响电力系统运行的安全性和可靠性。对直流接触器进行状态评估可反映其运行的真实状态,为制定设备的检修决策提供科学依据,实现以最小代价进行设备检修,所以对直流接触器运行状态评估的研究具有重要意义和实际价值。
发明内容
基于现有技术的上述情况,本发明的目的在于提供一种低压直流接触器状态评估方法及装置,通过采用基于机器学习的XGBoost算法对该数据的重要性进行计算并采用优化的极限学习机对该直流接触器进行状态评估,能够实现对低压直流接触器状态进行准确地评估。
为达到上述目的,根据本发明的一个方面,提供了一种低压直流接触器状态评估方法,包括步骤:
S1、采集表征低压直流接触器状态的数据;
S2、采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据;
S3、采用主成分分析方法对该数据进行降维处理;
S4、采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;
S5、根据所提取的特征信息选择数据参数,并利用该数据参数采用优化的极限学习机对该直流接触器进行状态评估。
进一步的,所述新息自适应卡尔曼滤波算法包括采用不固定值的协方差矩阵和噪声矩阵进行滤波;
k时刻新息测量噪声协方差矩阵R(k)为:
k+1时刻噪声矩阵Q(k+1)为:
Q(k+1)=K(k)C(k)H(k)K′(k)
其中,C(k)为k时刻的新息协方差,H(k)为k时刻的观测矩阵,P(k)为k时刻的预测状态的协方差矩阵,K(k)为k时刻滤波器的增益。
所述采用主成分分析方法对该数据进行降维处理包括:
使用奇异值分解方法计算所述数据组成的矩阵的协方差矩阵A的特征值和特征向量:
(ATA)vi=λivi
(AAT)ui=λiui
其中,vi为右奇异向量,ui为左奇异向量;
采用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,以实现降维。
进一步的,所述采用基于机器学习的XGBoost算法对该数据的重要性进行计算包括:
根据以下公式计算所述数据的重要性得分,以判断在状态评估中各参数的重要性:
进一步的,所述采用优化的极限学习机对该直流接触器进行状态评估包括:
S51、确定模型的训练样本和测试样本,并对样本数据预处理;
S52、根据样本数据初始化极限学习机网络结构,设置输入层、隐含层和输出层神经元个数,激励函数;
S53、初始化蒲公英算法参数,包含种群数、最大迭代次数、生长因子和枯萎因子;
S54、设定训练样本的均方根误差作为蒲公英算法的适应度函数,使用蒲公英算法寻找最优解;
S55、确定是否达到最大迭代次数,是则进行步骤S56,否则返回步骤S54;
S56、根据适应度最优个体包含的初始权值和阈值对极限学习机进行赋值;
S57、极限学习机在最优初始权值和阈值设定下基于训练数据进行训练;
S58、极限学习机基于测试数据进行预测输出。
根据本发明的另一个方面,提供了一种低压直流接触器状态评估装置,包括数据采集模块、数据预处理模块、降维处理模块、重要性计算模块、以及状态评估模块;其中,
所述数据采集模块用于采集表征低压直流接触器状态的数据;
所述数据预处理模块采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据;
所述降维处理模块采用主成分分析方法对该数据进行降维处理;
所述重要性计算模块采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;
所述状态评估模块根据所提取的特征信息选择数据参数,并利用该数据参数采用优化的极限学习机对该直流接触器进行状态评估。
进一步的,所述数据预处理模块采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理包括:
采用不固定值的协方差矩阵和噪声矩阵进行滤波;
k时刻新息测量噪声协方差矩阵R(k)为:
k+1时刻噪声矩阵Q(k+1)为:
Q(k+1)=K(k)C(k)H(k)K′(k)
其中,C(k)为k时刻的新息协方差,H(k)为k时刻的观测矩阵,P(k)为k时刻的预测状态的协方差矩阵,K(k)为k时刻滤波器的增益。
进一步的,所述降维处理模块采用主成分分析方法对该数据进行降维处理包括:
使用奇异值分解方法计算所述数据组成的矩阵的协方差矩阵A的特征值和特征向量:
(ATA)vi=λivi
(AAT)ui=λiui
其中,vi为右奇异向量,ui为左奇异向量;
采用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,以实现降维。
进一步的,所述重要性计算模块采用基于机器学习的XGBoost算法对该数据的重要性进行计算包括:
根据以下公式计算所述数据的重要性得分,以判断在状态评估中各参数的重要性:
进一步的,所述状态评估模块采用优化的极限学习机对该直流接触器进行状态评估包括:
S51、确定模型的训练样本和测试样本,并对样本数据预处理;
S52、根据样本数据初始化极限学习机网络结构,设置输入层、隐含层和输出层神经元个数,激励函数;
S53、初始化蒲公英算法参数,包含种群数、最大迭代次数、生长因子和枯萎因子;
S54、设定训练样本的均方根误差作为蒲公英算法的适应度函数,使用蒲公英算法寻找最优解;
S55、确定是否达到最大迭代次数,是则进行步骤S56,否则返回步骤S54;
S56、根据适应度最优个体包含的初始权值和阈值对极限学习机进行赋值;
S57、极限学习机在最优初始权值和阈值设定下基于训练数据进行训练;
S58、极限学习机基于测试数据进行预测输出。
综上所述,本发明提供了一种低压直流接触器状态评估方法及装置,采集表征低压直流接触器状态的数据,然后采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据,采用主成分分析方法对该数据进行降维处理;采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;最后采用优化的极限学习机对该直流接触器进行状态评估。本发明通过采用基于机器学习的XGBoost算法对该数据的重要性进行计算并采用优化的极限学习机对该直流接触器进行状态评估,能够实现对低压直流接触器状态进行准确地评估。
附图说明
图1是本发明低压直流接触器状态评估方法的流程图;
图2是直流接触器性能退化评估测试系统的构成框图;
图3是电压调理电路的电路图;
图4是LabVIEW控制NI数据采集卡采集数据的流程图;
图5是新息自适应卡尔曼滤波算法的流程图;
图6是XGBoost算法流程图;
图7是蒲公英算法优化的极限学习机算法(DA-ELM)流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
下面对结合附图对本发明的技术方案进行详细说明。根据本发明的一个实施例,提供了一种低压直流接触器状态评估方法,该方法的流程图如图1所示,包括如下步骤:
S1、采集表征低压直流接触器状态的数据。本实施例中例如可以采用直流接触器性能退化评估测试系统来实现该评估方法,图2中示出了直流接触器性能退化评估测试系统的构成框图,系统的硬件部分围绕其功能进行设计,主要分为以下几个模块:线圈电压电流采样电路,用于对接触器线圈的电压和电流进行采样;触点电压电流采样电路,用于对接触器的主触头电压电流进行采样;NI数据采集卡,用于对电压电流进行数据采集;此外,还可以包括电源电路模块和串行通信模块。
该系统的采集模块例如可以采用美国NI公司的X系列USB6356同步数据采集卡。该采集卡是一种多功能数据采集卡,它具有16位分辨率、8路DI、8路DO、24路数字I/O、32位计数器、支持数字和模拟触发等特点。数据采集前需要对采集的信号进行转换使采集设备的量程范围与实际信号相匹配,图3中示出了对所采集信号进行转换的电压调理电路的电路图,图3中,输入端接传感器电路,输出端接NI采集卡电路。同时需要将主回路与计算机测控电路进行隔离,在继电器控制电路中,通过控制三极管的通断来控制继电器线圈,由单片机发出高电平信号使三极管导通,继而继电器线圈得电,使继电器触点闭合,当需要断开继电器时,发出低电平信号,使三极管截止,继电器线圈失电,通过D9续流二极管释放线圈的电感能量,确保试验安全稳定运作。本试验采用的电压传感器不仅可以保证数据高精度转换,其本身自带光电隔离模块最大程度的保证了数据采集设备的安全性,基于霍尔型电流互感器响应灵敏、线性度好,可以满足试验标准中规定的数据精度要求。单片机的I/O口与固态继电器组成直流接触器线圈驱动电路。线圈电压电流、触头电压电流信号经传感器采集,输出电流信号经采样电阻采样再通过调理电路进入到数据采集卡中。当LabVIEW向单片机发送相应指令,单片机就会通过控制继电器,继而控制线圈回路的通断,从而实现对直流接触器通断的控制。LabVIEW程序运行后,控制NI数据采集卡采集数据,随后通过与单片机通信,接触器线圈回路通电,接触器闭合,延时,控制线圈回路断电,接触器触头分离,延时,停止数据采集及保存显示采集到的电压电流波形。至此,一个完整的数据采集控制程序运行完毕。图4中示出了LabVIEW控制NI数据采集卡采集数据的流程图。
S2、采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据。包括采用不固定值的协方差矩阵和噪声矩阵进行滤波;
k时刻新息测量噪声协方差矩阵R(k)为:
k+1时刻噪声矩阵Q(k+1)为:
Q(k+1)=K(k)C(k)H(k)K′(k)
其中,C(k)为k时刻的新息协方差,H(k)为k时刻的观测矩阵,P(k)为k时刻的预测状态的协方差矩阵,K(k)为k时刻滤波器的增益。
具体来说,本实施例提供的方法将对接触器每个特征参数进行可视化,可以发现其特征参数都有特定的变化规律,而其中大部分参数存在着噪声信息,所以为提高参数选取的精度,需要使用改进的卡尔曼滤波算法对其进行降噪处理。卡尔曼滤波算法是一种基于最小方差的最优估计方法。在系统模型、过程噪声和测量噪声的统计特性都已知的条件下,输入观测量、输出估计值,并且观测更新与时间变化具有一定联系,通过这一联系卡尔曼滤波可以不断地进行递推和对估计进行修正。主要算法设计如下:
首先状态估计的第k+1步预测方程为:
第k+1步预测状态的协方差为:
P(k+1|k)=f(k)P(k|k)f′(k)+G(k)Q(k)G′(k)
第k+1步观测矩阵的协方差为:
观测向量的预测误差协方差为:
S(k+1)=H(k+1)P(k+1|k)H′(k+1)+R(k+1)
新息测量残差为:
滤波器增益为:
K(k+1)=P(k+1|k)H′(k+1)S-1(k+1)
通过上述公式可得出卡尔曼滤波算法的状态更新方程为:
其中滤波误差协方差的更新方程为:
P(k+1|k+1)=[1-K(k+1)H(k+1)]P(k+1|k)
通过不断重复以上步骤来不断更新滤波的误差协方差矩阵,获得更精确的滤波效果,但卡尔曼滤波算法主要滤波对象为理想状态下的噪声,在现实环境下几乎无法实现,因此针对这一问题提出信息自适应信息卡尔曼滤波算法。通过上式可得:k时刻的新息I(k)为:
k时刻的新息协方差C(k)为:
则噪声矩阵Q(k+1)为:
Q(k+1)=K(k)C(k)H(k)K′(k)
最后变换可得到新息测量噪声协方差矩阵R(k)为:
通过以上的公式变换可将标准的卡尔曼滤波算法改写成新息自适应卡尔曼滤波算法,其中新息自适应卡尔曼滤波算法最大的特点在于,新息自适应卡尔曼滤波算法表达式中的噪声协方差R不再是固定值,而是针对现实环境下噪声进行实时的动态估计,从而使用更加精确的噪声协方差R和噪声矩阵Q来提高滤波的精度。图5中示出了新息自适应卡尔曼滤波算法的流程图。
S3、采用主成分分析方法对该数据进行降维处理,包括:使用奇异值分解方法计算所述数据组成的矩阵的协方差矩阵A的特征值和特征向量:
(ATA)vi=λivi
(AAT)ui=λiui
其中,vi为右奇异向量,ui为左奇异向量;
采用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,以实现降维。
针对低压直流接触器数据中参数的数量较多且维度较高,同时部分参数性质也较为相似,使数据的复杂度和输入预测模型的训练难度大大增加这些问题,使用基于无监督学习的主成分分析法(PCA)对数据进行降维和参数筛选。
PCA是一种无监督学习算法,主要的作用是对高维数据进行降维处理,主要思想是对数据的维度进行变换。假设数据的维度是n维,将数据输入进PCA算法后,算法会按一定的顺序寻找原始数据的坐标轴,并计算坐标轴的方差,然后按方差的大小对坐标轴进行排序,保留方差较大的坐标轴,删除方差较小或为零的坐标轴,最后算法输出一个k的正交矩阵,其就被称作主成分。其中计算方差的主要原理为首先通过使用奇异值分解(SVD)的方法来计算数据矩阵的协方差矩阵的特征值和特征向量,选择特征值最大的k个特征所对应的特征向量组成新的矩阵。奇异值分解在机器学习理论中是一种常见的矩阵分解方法。其主要目的是为了提取出一个矩阵最重要的特征。其主要优点在于对于任意矩阵都可以使用奇异值分解法来对其进行矩阵分解,对于任意矩阵A总存在一个奇异值分解如式:
A=UΣVT
其中A为m×n的矩阵,分解得到的U为m×m的方阵,且方阵U的正交向量被称为左奇异向量。∑是一个除对角线其它元素都为0的m×n的矩阵,其对角线上的元素称为奇异值且按从大到小的顺序排列。VT是V的转置矩阵,其维度是n×n,VT中的正交向量被称为右奇异值向量。
然后将矩阵A的转置乘以A的输出为一个方阵,用这样的方阵进行特征分解,得到的特征值和特征向量满足等式:
(ATA)vi=λivi
式中vi为右奇异向量。
最后将A和AT做矩阵的乘法,得到一个方阵,用这样的方阵进行特征分解,得到的特征和特征向量满足等式:
(AAT)ui=λiui
其中ui为左奇异向量。
通过奇异值分解的公式可以看出,原来矩阵A的特征为n维。经过SVD分解后,可以用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,最后对矩阵A进行降维。
S4、采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息:根据以下公式计算所述数据的重要性得分,以判断在状态评估中各参数的重要性:
XGBoost算法是对普通机器学习Boosting算法的一种优化,其本质为集成一系列弱分类器组合为一个强分类器。主要原理是通过不断的迭代生成一棵新分类树来拟合前一棵树的残差,随着迭代次数的增多使算法精度不断提高。XGBoost算法是由k个基模型组成的一个加法运算式,其公式为:
其中n为样本数量。由模型的预测精度由模型的偏差和方差共同决定,并且损失函数代表了模型的偏差,所以若想降低方差则需要使用简单的模型,所以目标函数由模型的损失函数L与抑制模型复杂度的正则项Ω共同组成,如下式:
其中n为模型的正则项。
由于Boosting模型是前向加法,以第t步的模型为例,模型对第i个样本的预测为:
将函数f(x+Δx)在点x处使用泰勒公式进行二阶展开,可得到等式:
其中gi为损失函数的一阶导,hi为损失函数的二阶导。
由于前一步的y(t-1)己知,所以损失函数的一阶导数和二阶导数的值都为常数,只需要求出损失函数的一阶导数和二阶导数的值再将目标函数进行最优化,就可以得到每一步的f(x),最后将模型相加得到一个整体模型。由于算法的基分类器为决策树,其生长过程中非常关键的问题就是如何找到叶子的节点的最优切分点,所以XGBoost算法使用精确贪心算法为分裂节点的方法对节点进行切分。
精确贪心算法的主要流程为将所有的可用特征输入到组为基分类的决策树中,然后决策树的每个叶子节点进行枚举,并把属于该叶子节点的特征根据该特征值的大小进行升序排列,然后通过线性扫描的方式来决定该特征的最佳分裂点,根据特征的分裂增益值来选择增益值最大的特征作为分裂特征,并用该特征的最佳分裂点作为分裂位置,接着分裂出左右两个新叶子节点,最后回到步骤一递归执行到满足特定条件为止。
假设在某一节点完成特征分裂,则分裂前的目标函数可写为:
分裂后的目标函数为:
则对于目标函数来说,分裂后的增益为:
基于贪心算法的决策树生成策略,即重要性的计算具体分为4个步骤来实现:
(1)算法起始于根节点,并视为当前节点。
(2)对当前节点枚举所有特征,把属于当前节点的样本按照特征值升序排列,通过线性分析来决定该特征的最佳分裂点。计算采用该最佳分裂点时该特征的收益,具体即为当前节点目标函数值减去左右两个子节点目标函数值之和,具体公式如下所示:
其中IL与IR分别为左右两个子节点对应的样本集。
(3)选择收益最大的特征作为分裂特征,用该特征的最佳分裂点作为分裂位置,生成左右两个子节点,并为每个子节点关联对应的样本集。
(4)依次将子节点设为当前节点,回到第2步,递归直到满足终止条件。
特征增益Gain可以衡量决策树结构好坏的指标,一般是越小越好。通过特征增益Gain可以表征出接触器特征参数的重要性,从而判断在状态评估中各参数的重要性,最终对参数进行选取。图6中示出了XGBoost算法流程图。
S5、采用优化的极限学习机对该直流接触器进行状态评估。该步骤中,通过上一步骤计算所得的各特征参数的特征增益,特征增益越小,重要性越高,排序选出重要性较大的2~3个数据参数,然后将选出的数据参数均归一化到[0,1]后,随机分配70%作为训练数据,30%作为测试数据。具体可以包括以下步骤:
S51、确定模型的训练样本和测试样本,并对样本数据预处理;
S52、根据样本数据初始化极限学习机网络结构,设置输入层、隐含层和输出层神经元个数,激励函数;
S53、初始化DA参数,包含种群数、最大迭代次数、生长因子和枯萎因子;
S54、设定训练样本的均方根误差作为DA的适应度函数,使用DA寻找最优解;
S55、确定是否达到最大迭代次数,是则进行步骤S56,否则返回步骤S54;
S56、根据适应度最优个体包含的初始权值和阈值对极限学习机进行赋值;
S57、极限学习机在最优初始权值和阈值设定下基于训练数据进行训练;
S58、极限学习机基于测试数据进行预测输出。
具体来说,该评估步骤对参数进行归一化处理,划分良好、正常、注意、异常和故障5个状态区间,利用蒲公英算法优化的极限学习机对直流接触器进行状态评估,通过以上步骤实现了利用蒲公英算法优化的极限学习机对直流接触器进行状态评估,详细说明了蒲公英算法的自学习播种和选择策略,如何设置极限学习机的输入层、隐含层和输出层神经元个数,激励函数等,设定训练样本的均方根误差(RMSE)作为DA的适应度函数,使用DA寻找最优解。ELM在最优初始权值和阈值设定下基于训练数据进行训练,然后基于测试数据进行预测输出。为了便于评估接触器状态,根据实际运行情况,将其划分为5个等级,如表1所示。
表1 直流接触器状态等级划分
由于反映接触器状态的指标具有不同的标度和量纲,为了方便各指标的比较与计算,防止某些参数数值过大而影响其他参数所占影响力,保证模型的训练精度,需要首先对数据进行归一化处理,而后再进行算法的训练与测试。选用最值归一化法处理所用数据。对原始数据进行线性变换后,把数值映射到区间[0,1]。
转换原理公式如下:
式中:x为原数据值;x′为归一化后的数值;xmin为原数据样本最小值;xmax为原数据样本最大值。
归一化之后的数据训练和测试完成后,所得预测结果反归一化处理后,可得到实际预测值,反归一化公式如下所示:
将试验数据归一化到[0,1]后随机分配70%训练数据与30%测试数据进行实验。
图7示出了蒲公英算法优化的极限学习机算法(DA-ELM)流程图。
(1)蒲公英算法具体原理如下所述:
蒲公英播种过程中会产生一定量的种子进行搜索,其播种半径会根据环境的适应度而变化。在蒲公英算法中,设定只有一个母体蒲公英进行播种,且蒲公英个体可从种子的搜索过程中获取有用信息。蒲公英算法主要包含播种、自学习播种和选择策略三部分。
a.蒲公英播种
母体蒲公英(MD)的播种半径是基于上一代的播种情况动态调整的,其计算公式如下:
其中,t为迭代次数,RMD(t)是第t次迭代中MD的播种半径,算法初始时其值设定为搜索空间的直径;r是枯萎因子,e是生长因子,g反映增长趋势,其计算公式如下:
其中,ε为极小值,避免分母为0;当g=1时,表示DA在此代迭代中解决方案不优于上一代,因此减小播种半径寻求更优解,枯萎因子r用于表征此情况,r取值范围为[0.9,1];当g≠1时,表示DA当前一代最优解优于上一代,则扩大播种范围,生长因子e应增大,e的取值范围为[1,1.1]。
b.自学习播种
为了引导蒲公英找到最优解,设定蒲公英具有自学习能力,可从种子中获取有用信息,此种播种行为定义为自学习播种,可有效避免陷入局部最优解,其原理如下:
X′MD=XMD+(mean(S)+XMD)
其中,S为母体蒲公英产生的一组种子,mean()为计算其均值。
c.选择策略:
DA在每次迭代中只有一株蒲公英,且需要保留最优的蒲公英进行下一次迭代,所以最优蒲公英的选择策略是保留每代中的最优适应度的种子生长的蒲公英。
(2)极限学习机算法原理如下:
对于一个单层ELM神经网络而言,输入层有n个神经元,隐含层有L个神经元,输出层有m个神经元。假设有样本数为N的训练数据{(xi,yi)},其中xi=[xi1,xi2,…,xin]T∈Rn为输入数据,yi=[yi1,yi2,…,yin]T∈Rm为输出数据,样本数为Q,其中i=1,2,…,L,j=1,2,…,Q。
设置激活函数为g(x),则极限学习机的网络模型可以表示为:
其中,ωi=[ωi1,ωi2,…,ωin]为输入权重,bi是第i个隐含层神经元的偏置,xj=[x1j,x2j,…,xnj]T,βi=[βi1,βi2,…,βim]是输出权重,uj=[u1j,u2j,…,umj]T是模型的输出值。
网络模型可以简化为矩阵表示:
Hβ=U′
其中U=[u1,u2,…,uQ],U′是矩阵U的转置,β=[β1,β2,…,βL]T,H被称为隐含层输出矩阵,具体表示如下:
极限学习机的训练目标是误差最小化,即实现训练输出值与实际值相等。当激活函数g(x)无限可微,且神经网络的输入权重和阈值可以随机选择时,ELM的训练就等价于通过求解以下方程的最小二乘解获得输出权重β:
方程解为
其中H+是H的穆尔-彭罗斯(Moore-Penrose)的广义逆。
根据本发明的另一个实施例,提供了一种低压直流接触器状态评估装置,包括数据采集模块、数据预处理模块、降维处理模块、重要性计算模块、以及状态评估模块;其中,
所述数据采集模块用于采集表征低压直流接触器状态的数据。
所述数据预处理模块采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据,包括:
采用不固定值的协方差矩阵和噪声矩阵进行滤波;
k时刻新息测量噪声协方差矩阵R(k)为:
k+1时刻噪声矩阵Q(k+1)为:
Q(k+1)=K(k)C(k)H(k)K′(k)
其中,C(k)为k时刻的新息协方差,H(k)为k时刻的观测矩阵,P(k)为k时刻的预测状态的协方差矩阵,K(k)为k时刻滤波器的增益。
所述降维处理模块采用主成分分析方法对该数据进行降维处理,包括:使用奇异值分解方法计算所述数据组成的矩阵的协方差矩阵A的特征值和特征向量:
(ATA)vi=λivi
(AAT)ui=λiui
其中,vi为右奇异向量,ui为左奇异向量;
采用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,以实现降维。
所述重要性计算模块采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息包括:
根据以下公式计算所述数据的重要性得分,以判断在状态评估中各参数的重要性:
所述状态评估模块采用优化的极限学习机对该直流接触器进行状态评估包括:
S51、确定模型的训练样本和测试样本,并对样本数据预处理;
S52、根据样本数据初始化极限学习机网络结构,设置输入层、隐含层和输出层神经元个数,激励函数;
S53、初始化DA参数,包含种群数、最大迭代次数、生长因子和枯萎因子;
S54、设定训练样本的均方根误差作为DA的适应度函数,使用DA寻找最优解;
S55、确定是否达到最大迭代次数,是则进行步骤S56,否则返回步骤S54;
S56、根据适应度最优个体包含的初始权值和阈值对极限学习机进行赋值;
S57、极限学习机在最优初始权值和阈值设定下基于训练数据进行训练;
S58、极限学习机基于测试数据进行预测输出。
该装置中各个模块进行计算以及预测的具体步骤与本发明第一个实施例中提供的方法相同,在此不再赘述。
综上所述,本发明涉及一种低压直流接触器状态评估方法及装置,采集表征低压直流接触器状态的数据,然后采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据,采用主成分分析方法对该数据进行降维处理;采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;最后采用优化的极限学习机对该直流接触器进行状态评估。本发明通过采用基于机器学习的XGBoost算法对该数据的重要性进行计算并采用优化的极限学习机对该直流接触器进行状态评估,能够实现对低压直流接触器状态进行准确地评估。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种低压直流接触器状态评估方法,其特征在于,包括步骤:
S1、采集表征低压直流接触器状态的数据;
S2、采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据;
S3、采用主成分分析方法对该数据进行降维处理;
S4、采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;
S5、根据所提取的特征信息选择数据参数,并利用该数据参数采用优化的极限学习机对该直流接触器进行状态评估。
3.根据权利要求2所述的方法,其特征在于,所述采用主成分分析方法对该数据进行降维处理包括:
使用奇异值分解方法计算所述数据组成的矩阵的协方差矩阵A的特征值和特征向量:
(ATA)νi=λiνi
(AAT)ui=λiui
其中,νi为右奇异向量,ui为左奇异向量;
采用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,以实现降维。
5.根据权利要求4所述的方法,其特征在于,所述采用优化的极限学习机对该直流接触器进行状态评估包括:
S51、确定模型的训练样本和测试样本,并对样本数据预处理;
S52、根据样本数据初始化极限学习机网络结构,设置输入层、隐含层和输出层神经元个数,激励函数;
S53、初始化蒲公英算法参数,包含种群数、最大迭代次数、生长因子和枯萎因子;
S54、设定训练样本的均方根误差作为蒲公英算法的适应度函数,使用蒲公英算法寻找最优解;
S55、确定是否达到最大迭代次数,是则进行步骤S56,否则返回步骤S54;
S56、根据适应度最优个体包含的初始权值和阈值对极限学习机进行赋值;
S57、极限学习机在最优初始权值和阈值设定下基于训练数据进行训练;
S58、极限学习机基于测试数据进行预测输出。
6.一种低压直流接触器状态评估装置,其特征在于,包括数据采集模块、数据预处理模块、降维处理模块、重要性计算模块、以及状态评估模块;其中,
所述数据采集模块用于采集表征低压直流接触器状态的数据;
所述数据预处理模块采用新息自适应卡尔曼滤波算法对所采集的数据进行预处理,得到剔除干扰后的数据;
所述降维处理模块采用主成分分析方法对该数据进行降维处理;
所述重要性计算模块采用基于机器学习的XGBoost算法对该数据的重要性进行计算,以提取特征信息;
所述状态评估模块根据所提取的特征信息选择数据参数,并利用该数据参数采用优化的极限学习机对该直流接触器进行状态评估。
8.根据权利要求7所述的装置,其特征在于,所述降维处理模块采用主成分分析方法对该数据进行降维处理包括:
使用奇异值分解方法计算所述数据组成的矩阵的协方差矩阵A的特征值和特征向量:
(ATA)νi=λiνi
(AAT)ui=λiui
其中,νi为右奇异向量,ui为左奇异向量;
采用前r个非零奇异值对应的奇异向量表示矩阵A的主要特征,以实现降维。
10.根据权利要求9所述的装置,其特征在于,所述状态评估模块采用优化的极限学习机对该直流接触器进行状态评估包括:
S51、确定模型的训练样本和测试样本,并对样本数据预处理;
S52、根据样本数据初始化极限学习机网络结构,设置输入层、隐含层和输出层神经元个数,激励函数;
S53、初始化蒲公英算法参数,包含种群数、最大迭代次数、生长因子和枯萎因子;
S54、设定训练样本的均方根误差作为蒲公英算法的适应度函数,使用蒲公英算法寻找最优解;
S55、确定是否达到最大迭代次数,是则进行步骤S56,否则返回步骤S54;
S56、根据适应度最优个体包含的初始权值和阈值对极限学习机进行赋值;
S57、极限学习机在最优初始权值和阈值设定下基于训练数据进行训练;
S58、极限学习机基于测试数据进行预测输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111045923.5A CN113947011A (zh) | 2021-09-07 | 2021-09-07 | 一种低压直流接触器状态评估方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111045923.5A CN113947011A (zh) | 2021-09-07 | 2021-09-07 | 一种低压直流接触器状态评估方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113947011A true CN113947011A (zh) | 2022-01-18 |
Family
ID=79328144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111045923.5A Pending CN113947011A (zh) | 2021-09-07 | 2021-09-07 | 一种低压直流接触器状态评估方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113947011A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114897111A (zh) * | 2022-07-15 | 2022-08-12 | 深圳市协和传动器材有限公司 | 一种用于监控间歇式凸轮分割器运行状况的方法 |
CN115795276A (zh) * | 2022-11-22 | 2023-03-14 | 南京电力设计研究院有限公司 | 一种基于小波分析与机器学习二次回路压板状态评估方法 |
CN117034111A (zh) * | 2023-08-09 | 2023-11-10 | 广东工业大学 | 一种牵引传动系统中交流接触器开关状态估计方法 |
-
2021
- 2021-09-07 CN CN202111045923.5A patent/CN113947011A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114897111A (zh) * | 2022-07-15 | 2022-08-12 | 深圳市协和传动器材有限公司 | 一种用于监控间歇式凸轮分割器运行状况的方法 |
CN115795276A (zh) * | 2022-11-22 | 2023-03-14 | 南京电力设计研究院有限公司 | 一种基于小波分析与机器学习二次回路压板状态评估方法 |
CN115795276B (zh) * | 2022-11-22 | 2024-04-26 | 南京电力设计研究院有限公司 | 一种基于小波分析与机器学习二次回路压板状态评估方法 |
CN117034111A (zh) * | 2023-08-09 | 2023-11-10 | 广东工业大学 | 一种牵引传动系统中交流接触器开关状态估计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113947011A (zh) | 一种低压直流接触器状态评估方法及装置 | |
CN106600059B (zh) | 基于改进rbf神经网络的智能电网短期负荷预测方法 | |
CN110070102B (zh) | 用于电能质量扰动类型识别的序列对序列模型建立方法 | |
CN110702966B (zh) | 一种基于概率神经网络的故障电弧检测方法、装置及系统 | |
CN113569742A (zh) | 一种基于卷积神经网络的宽频带电磁干扰源识别方法 | |
CN110781595A (zh) | 能源使用效率pue的预测方法、装置、终端及介质 | |
Rehman et al. | Comparative evaluation of machine learning models and input feature space for non-intrusive load monitoring | |
CN113536662B (zh) | 基于萤火虫优化LightGBM算法的电子式互感器误差状态预测方法 | |
CN110929835B (zh) | 一种新型碳化硅基航空功率变换器故障诊断方法及系统 | |
CN114397043A (zh) | 多点温度智能检测系统 | |
CN115423175A (zh) | 一种风电功率预测误差分解方法 | |
CN111579978A (zh) | 一种基于人工智能技术实现继电器故障识别的系统及方法 | |
CN115841278A (zh) | 电能计量装置运行误差状态评价方法、系统、设备及介质 | |
CN115130764A (zh) | 基于状态评估的配电网态势预测方法及系统 | |
CN114062812B (zh) | 一种计量柜故障诊断方法及系统 | |
CN117040048A (zh) | 风光发电储能管理方法及系统 | |
CN112329370A (zh) | 一种基于极限学习机的SiC功率管在线故障诊断方法 | |
CN116646929A (zh) | 一种基于pso-cnn-bilstm的短期风电功率预测方法 | |
CN113496255B (zh) | 基于深度学习与决策树驱动的配电网混合观测布点方法 | |
CN114372418A (zh) | 一种风电功率时空态势描述模型建立方法 | |
CN112163613A (zh) | 一种电能质量扰动的快速识别方法 | |
Yan et al. | OLTC Fault Diagnosis Method Based on Time Domain Analysis and Kernel Extreme Learning Machine | |
CN110322063A (zh) | 一种耗电功率仿真预测方法及存储介质 | |
CN114297928B (zh) | 一种宽禁带航空功率变换器在线故障诊断方法 | |
Liu et al. | Research on Non-inttusive Load Monitoring Algorithm Based on Filtering and CRF |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |