CN116484299A - 基于梯度提升树与多层感知机融合的充电桩故障诊断方法 - Google Patents
基于梯度提升树与多层感知机融合的充电桩故障诊断方法 Download PDFInfo
- Publication number
- CN116484299A CN116484299A CN202310240498.8A CN202310240498A CN116484299A CN 116484299 A CN116484299 A CN 116484299A CN 202310240498 A CN202310240498 A CN 202310240498A CN 116484299 A CN116484299 A CN 116484299A
- Authority
- CN
- China
- Prior art keywords
- layer
- charging pile
- model
- fault
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000010354 integration Effects 0.000 title description 7
- 230000004927 fusion Effects 0.000 claims abstract description 52
- 239000013598 vector Substances 0.000 claims description 30
- 210000002569 neuron Anatomy 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 230000005764 inhibitory process Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 7
- 238000010801 machine learning Methods 0.000 abstract description 7
- 238000012549 training Methods 0.000 description 28
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000007547 defect Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000002679 ablation Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/60—Other road transportation technologies with climate change mitigation effect
- Y02T10/70—Energy storage systems for electromobility, e.g. batteries
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于梯度提升树与多层感知机融合的充电桩故障诊断方法,涉及充电桩故障诊断技术领域。为解决充电桩故障诊断中普遍存在的特征提取难题以及复杂的人工智能模型容易产生过拟合问题,本发明提出基于梯度提升树GBDT与多层感知机MLP融合的新方法,根据集成学习理论,建立多个独立的梯度提升树GBDT模型,组建多个全连接的GBDT层,最后连接一个多层感知机MLP模型,进行特征学习与分类。该融合方案避免了手动提取特征的困难,在降低对单个模型性能和复杂度依赖的同时,其融合性能得到提升而且更加稳定。在公开数据集上的实验结果表明,本发明提出的方案优于典型的独立机器学习方案。
Description
技术领域
本发明涉及充电桩故障诊断技术领域,尤其涉及基于梯度提升树与多层感知机融合的充电桩故障诊断方法。
背景技术
当今世界人类正面临日益严重的能源危机和环境危机。发展电动汽车,不仅可以有效缓解传统化石能源不可再生的问题,同时还是治理环境的有效手段。作为能量补给源的充电站是电动汽车的重要配套设施,而充电桩是电动汽车充电站和充电服务网络的核心设备。预计到2030年,我国的电动汽车市场规模将达到1500万辆,届时对充电桩的需求将大大增加。充电桩长期曝露在自然环境中,风吹日晒雨淋,引起充电桩部件逐渐老化,最终导致充电桩故障发生,给电动汽车充电带来极大的不便。实现充电桩故障的智能检测,对于及时发现有故障的充电桩,以便维护,保持充电桩的可靠运行具有重要意义。
黄彩娟的“电动汽车交流充电桩的故障诊断与排除”和李苗的“电动汽车充电桩故障诊断与检测”讨论了充电桩的常见故障类型与应对方案;
林越等的“基于AP-HMM混合模型的充电桩故障诊断”采集充电桩的电压数据,结合确定性的相似性传播(AP)聚类方法快速、准确提取故障的特征,和统计性的隐马尔可夫模型(HMM)强大的故障分类能力,构建AP-HMM混合充电桩故障诊断模型,实现了充电桩继电器失效故障诊断;林越等的“基于隐生灭过程模型的充电桩故障诊断研究”提出针对充电桩继电器失效故障建立隐生灭过程模型实现故障诊断;
李亦非等的“有监督机器学习算法在充电设施状态评估中的应用”在分析充电桩故障原因的基础上,以遥信数据、充电电量、充电时长、平均功率等信息为输入量,构建决策树诊断模型,可以识别从正常到异常的5种充电桩健康状态;
蔡松桓的“充电桩数据挖掘与充电量预测算法研究”尝试使用多种基于树的分类器实现充电桩故障诊断,例如随机森林,XGBoost等;
赵翔等的“一种基于深度神经网络的直流充电桩故障诊断方法”以充电桩的运行电压数据为输入提出了基于深度学习的故障诊断方案,实现了直流充电桩故障状态的自动诊断;
王群飞等的“基于随机森林算法的V2G充电桩故障诊断研究”使用小波包分析提取故障电流信号中的特征信息,使用随机森林构造适用于直流充电桩开关模块的故障诊断器;
周睿等的“汽车充电桩运行状态及故障诊断系统的设计”和高德欣等的“电动汽车充电桩移动监控与故障诊断系统设计”提出了充电桩故障诊断系统的软硬件设计与开发方案。
为描述充电桩故障检测问题,本发明使用向量表示从充电桩上采集的一组物理量,例如电压的总谐波失真、电流的总谐波失真、电子锁驱动信号等。任务是根据向量x将充电桩分成两类:正常和有故障,其类别标签可由变量y∈{0,1}表示。因此,充电桩故障诊断模型可以表示为
y=Det(x) (1)
其中,映射Det(·)是未知的,将通过数据驱动的方式获得。
为了构建映射Det(·),通常可以测得一组充电桩数据以此为基础,针对该分类问题可以采用一般机器学习的处理模式,即特征提取和组建分类器。然而,每个输入量xi可能都是不同充电桩的数据,因此,难以建立统计量观测不同时间同一个充电桩状态的变化情况。同时,正常的充电桩和故障的充电桩数据差距甚微,各自的数据统计分布交叠严重,难以区分。而且,输入量xi的行数L通常很小,难以通过降维的方式提取特征。另外,映射Det(·)是非线性的。这些方面显著增加了问题的难度,使得传统解决方案的性能并不理想。
传统机器学习方案的性能很大程度上依赖于特征提取,手动提取特征一直是其难点,该问题对充电桩故障诊断尤其突出。为了避免该问题,可以考虑设计深度神经网络。神经网络可以自动提取特征,通过堆叠带有非线性处理器的神经网络层学习深层的特征表达,可以在一个端到端的框架里对特征提取和分类器联合进行优化。神经网络可视为一个完全自动的优化工具,在大规模数据集获得良好的性能。然而,神经网络因其参数众多,优化困难,容易陷入局部最优和引起过拟合。同时,对于表格数据,因其不具有旋转不变性,会显著降低神经网络的性能。该问题对充电桩故障诊断尤其突出。
对于表格数据,基于树的分类器相比深度神经网络更有优势,而且,也能用于构建非线性模型。但是,基于树的分类器一般需要手动提取特征,随着树深度增加,容易引起过拟合,计算复杂度也会随之增加。
基于以上分析,由于充电桩数据的特点,用于故障诊断的手动特征提取相对困难,复杂的人工智能模型容易产生过拟合问题,完全自动化的方案,例如神经网络,容易陷入局部最优,训练困难。因此,针对充电桩故障诊断中普遍存在的特征提取难题以及复杂的人工智能模型容易产生过拟合问题的研究十分必要。
发明内容
针对现有技术存在的缺陷,本发明提出基于梯度提升树与多层感知机融合的充电桩故障诊断方法,采集待测充电桩数据集,构造成特征向量,并将所述特征向量输入融合模型,输出充电桩故障诊断结果,
所述融合模型包括N层学习器,其中N≥2,
前N-1层学习器均由多个独立的梯度提升树GBDT模型构成,前一层学习器的输出作为后一层学习器的输入,第一层学习器中的梯度提升树GBDT模型以充电桩的特征向量为输入,输出充电桩故障预测,后一层的梯度提升树GBDT模型通过集成前一层的梯度提升树GBDT模型的输出,输出新的充电桩故障预测,
第N层学习器为一个含有两个隐含层的多层感知机MLP模型,用于接收成前一层学习器中梯度提升树GBDT模型的输出,输出充电桩故障诊断结果。
进一步的,所述充电桩数据集包括充电桩的K1K2驱动信号、电子锁驱动信号、充电桩急停信号、充电桩门禁信号以及充电桩电压和电流的总谐波失真。
进一步的,所述融合模型可以由三层学习器构成,第一层学习器包括5个梯度提升树GBDT模型,第二层学习器包括3个梯度提升树GBDT模型,第三层学习器包括一个含有两个隐含层的多层感知机MLP模型。
进一步的,所述融合模型中,对特征向量进行多次采样,为第一层学习器中每个梯度提升树GBDT模型提供不同的输入数据,对前一层学习器中所有梯度提升树GBDT模型输出的充电桩故障预测值进行Stacking处理,为后一层学习器中每个梯度提升树GBDT模型提供不同的输入数据。
进一步的,同一层学习器中的每个梯度提升树GBDT模型超参数设置不同。
进一步的,所述融合模型中每个梯度提升树GBDT模型均使用基于Softmax目标函数和精确贪婪算法进行训练。
进一步的,第N层学习器中多层感知机MLP模型输入层神经元的数量与第N-1层学习器中梯度提升树GBDT模型的数量相等,多层感知机MLP模型输入层的一个神经元接收第N-1层学习器中一个梯度提升树GBDT模型输出的充电桩故障预测值。
进一步的,第N层学习器中多层感知机MLP模型输出层含有两个神经元,分别对应充电桩正常和故障状态。
进一步的,在第N层学习器中多层感知机MLP模型后连接一个Softmax层,输出故障的置信度得分。
与现有技术相比较,本发明的有益效果在于:
其一,根据集成学习理论,建立多个独立的梯度提升树GBDT模型,组建多个全连接的GBDT层,最后连接一个多层感知机MLP模型,进行特征学习与分类,该融合方案避免了手动提取特征的困难,在降低对单个模型性能和复杂度依赖的同时,其融合性能得到提升而且更加稳定,预测结果准确度更高;
其二,参与融合的每个基学习器性能都较高,各个算法满足多样性要求,多源信息融合能够充分发挥不同模型对特征的关注信息,充分利用特征信息提升融合性;
其三,本发明通过设置合理的采样数据基数,降低了单个模型的复杂度,大大节省了计算资源;
其四,与传统的充电桩故障诊断方法相比,本发明采用的梯度提升树GBDT和多层感知机MLP融合模型可适用于其他电力电子领域的诊断与评估。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为梯度提升树GBDT和多层感知机MLP融合诊断模型。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本领域技术人员应当知晓,下述具体实施例或具体实施方式,是本发明为进一步解释具体的发明内容而列举的一系列优化的设置方式,而该些设置方式之间均是可以相互结合或者相互关联使用的,除非在本发明明确提出了其中某些或某一具体实施例或实施方式无法与其他的实施例或实施方式进行关联设置或共同使用。同时,下述的具体实施例或实施方式仅作为最优化的设置方式,而不作为限定本发明的保护范围的理解。
下面结合附图(表)对本发明的具体实施方式做出说明。
考虑到传统机器学习方案解决充电桩状态检测问题的困难,本发明提出梯度提升树与多层感知机的融合分类模型。
本发明提出了一种梯度提升树(gradient boosting decision tree,GBDT)和多层感知机(multi-layer perceptron,MLP)融合的新方法,用于解决充电桩故障诊断问题。该方案以集成学习理论为基础,组建多个全连接的GBDT层,并与MLP相连,进行特征学习与分类。梯度提升树GBDT和多层感知机MLP融合可以有效的避免他们的不足,联合他们的优势,提升充电桩故障诊断的精度。而且,该方案避免了手动提取特征的困难,降低了网络过拟合几率,确保了故障诊断性能得到提升而且更加稳定。在公开数据集上的实验结果表明,本发明提出的方案优于典型的独立机器学习方案。
图1为梯度提升树GBDT和多层感知机MLP融合诊断模型。
本发明提出基于梯度提升树与多层感知机融合的充电桩故障诊断方法,具体为:采集待测充电桩数据集,构造成特征向量,并将所述特征向量输入融合模型,输出充电桩故障诊断结果,
所述融合模型包括N层学习器,其中N≥2,
前N-1层学习器均由多个独立的梯度提升树GBDT模型构成,前一层学习器的输出作为后一层学习器的输入,第一层学习器中的梯度提升树GBDT模型以充电桩的特征向量为输入,输出充电桩故障预测,后一层的梯度提升树GBDT模型通过集成前一层的梯度提升树GBDT模型的输出,输出新的充电桩故障预测,
第N层学习器为一个含有两个隐含层的多层感知机MLP模型,用于接收成前一层学习器中梯度提升树GBDT模型的输出,输出充电桩故障诊断结果。
梯度提升树GBDT模型是一种多项式回归或分类模型,为实现模型拟合,建立多棵分类回归树(classification and regression tree,CART),并通过最小化损失函数优化每个CART的参数。梯度提升树GBDT模型的优势在于能够识别非线性可分的数据,灵活的处理复杂的表格数据。多层感知机MLP模型是一种全连接的神经网络,它将神经元按层进行组织,网络层之间以单向无循环的全连接方式进行连接,通过最小化损失函数优化网络权重参数,具有很强的特征学习能力,并且能结合支持向量机(support vector machine,SVM)实现分类,但是它也有神经网络的共有问题。本发明在集成学习的框架下,将二者结合起来,可以有效的避免二者的不足,联合二者的优势,更好地实现充电桩的故障诊断。
具体的,根据集成学习的Stacking框架与理论,建立多个独立的梯度提升树GBDT模型。然后,将接收相同输入量的GBDT模型放在同一层,形成多个GBDT层,前一层GBDT的输出作为后一层GBDT层的输入,如同全连接的神经网络。第一层GBDT以充电桩数据向量为输入给出充电桩的故障预测,其他层的GBDT通过集成前一层GBDT的输出,获得新的预测。在若干层GBDT之后,接一个多层感知机MLP模型,用于接收成前一层GBDT的输出,进行特征学习与分类。
集成学习理论指出,为了获得更好的融合模型,每个基学习器应该不同,能提供独立的分类错误,而且各个性能出色。为了获得多样性的基学习器,同一层GBDT的超参数设置不同,而且,使用bootstrap采样为每个GBDT模型生成不同的训练集。前一层GBDT比后一层GBDT模型设计更复杂,以确保获得较高分类性能的同时,降低过拟合的概率。
在最后一层GBDT后接MLP,MLP与GBDT的原理完全不同,可以确保基学习器的多样性,而且,借助MLP的融合能力可以有效集成GBDT层的输出推动整个模型获得更优的性能。MLP的隐层数量和每个隐层的神经元数量可以根据模型的性能进行调整,但是MLP的输出层必须含有两个神经元,其输出分别描述正常和故障类型的得分。为了给出故障的置信度得分,在MLP后面再接一个Softmax层,实现输出数据的归一化。
对于提出的融合模型,可以看出通过多层级的GBDT全连接,前一层GBDT的输出作为后一层GBDT的输入特征,避免了手动提取特征的困难,并可以逐渐推高分类模型的性能。模型融合利用了Stacking集成框架和bootstrap采样,在获得多样性GBDT模型的同时进行优势集成,充分发挥每个模型的性能优势。使用GBDT的集成,也弱化了每个GBDT超参数优化的困难。最后,利用MLP对最后一层GBDT的输出进行集成,由于MLP的表达能力,比传统的集成方案,例如加权求和、投票等,具有更好集成效果。
本方案中每一层学习器中梯度提升树GBDT模型的数量及多层感知机MLP模型的隐层数量和每个隐层的神经元数量可以根据模型的性能进行调整,但是多层感知机MLP模型输入层神经元的数量与第二层学习器中梯度提升树GBDT模型的数量相等,多层感知机MLP模型输入层的每个神经元接收第二层学习器中一个梯度提升树GBDT模型输出的充电桩故障预测值;多层感知机MLP模型的输出层必须含有两个神经元,输出0和1,分别对应充电桩正常和故障状态;为了给出故障的置信度得分,在MLP后面再接一个Softmax层,实现输出数据的归一化。
本实施例中,融合模型由三层学习器构成,第一层学习器包括5个梯度提升树GBDT模型,第二层学习器包括3个梯度提升树GBDT模型,第三层学习器包括一个含有两个隐含层的多层感知机MLP模型。充电桩数据向量输入第一个GBDT层,该层由5个GBDT模型构成。第二个GBDT层由3个GBDT模型构成,将第一层GBDT输出的5个预测值以Stacking方式构成特征向量作为其输入。GBDT的超参数包括:子树个数、树的最大深度、拆分内部节点所需的最小损失减少量,以及子树所需的最小样本数,他们分别由表1中给出的变量进行控制,表1也显示了每个GBDT的超参数设置。
MLP是一个具有2个隐层的全连接神经网络。输入层有3个神经元,接收最后一层GBDT的输出。第一个隐层由6个含有ReLU(the rectified linear unit)非线性激活操作的神经元构成,第二个隐层含16个带有ReLU激活操作的神经元,输出层由一个全连接层和一个Softmax层构成,全连接层含2个神经元,不带激活操作。表1总结了MLP的超参数设置。
表1超参数配置
其中:n_estimators为子树的数量,max_depth为树的最大深度,min_sam_split为拆分内部节点所需的最小损失减少量,min_sam_leaf为子树所需的最小样本数。
根据图1为本发明GBDT与MLP的融合诊断模型,融合模型是一个含有三阶段学习器的网络,融合模型通过以下方法训练:
步骤S1:获取充电桩数据集,包括特征向量和标签,划分为训练集和测试集,充电桩特征向量由充电桩的K1K2驱动信号、电子锁驱动信号、充电桩急停信号、充电桩门禁信号以及充电桩电压和电流的总谐波失真构成;
步骤S2:训练第一层梯度提升树GBDT模型:用步骤S1得到的训练集训练第一层的每个梯度提升树GBDT模型;
步骤S3:训练第二层梯度提升树GBDT模型:将第一层的每个梯度提升树GBDT模型给出的预测值组成一个新的特征向量,构造一个新的训练集,与相应的样本标签一起,训练第二层的每个梯度提升树GBDT模型;
步骤S4:训练多层感知机MLP模型:将第二层的梯度提升树GBDT模型给出的预测值组成新的特征向量,训练多层感知机MLP模型;
步骤S5:模型评估:将测试集输入融合模型,对融合模型进行评估。
所述融合模型中,对特征向量进行多次采样,为第一层学习器中每个梯度提升树GBDT模型提供不同的输入数据,对前一层学习器中所有梯度提升树GBDT模型输出的充电桩故障预测值进行Stacking处理,为后一层学习器中每个梯度提升树GBDT模型提供不同的输入数据。
多层感知机MLP模型输入层神经元的数量与第二层学习器中梯度提升树GBDT模型的数量相等,多层感知机MLP模型输入层的一个神经元接收第二层学习器中一个梯度提升树GBDT模型输出的充电桩故障预测值。
具体的,首先,为充电桩故障评估建立训练和测试数据集。在此步骤中,收集所需的电压、电流数据等相关数据,构成充电桩输入向量和相应的标签。所有数据按一定比例分为两组,作为训练和测试数据集。
然后,训练第一层的5个梯度提升树GBDT模型。以Bagging集成学习方案中的bootstrap采样对训练集采样构造5个不同的训练集,分别用于训练5个梯度提升树GBDT模型,优化模型参数,使其输出结果逼近真实样本标签。因此,第一个GBDT层也称为Bagging层。第一层和第二层中每个梯度提升树GBDT模型训练使用基于Softmax目标函数和精确贪婪算法,同一层GBDT的超参数设置不同。
接着,按照堆叠框架训练第二层的3个梯度提升树GBDT模型。对于原训练集中每个充电桩输入向量,第一层的5个梯度提升树GBDT模型会给出5个预测值,将其组成一个新的特征向量,联合样本标签,构造一个新的训练集。以交叉验证训练第二层的3个梯度提升树GBDT模型。因此,第二个GBDT层也称为堆叠层。
最后,按照堆叠框架训练第三级学习器MLP。将原训练集中每个充电桩向量输入两级GBDT网络,输出3个预测值堆叠成新的特征向量,将其与相应的样本标签一起输入MLP。训练MLP使用了二元交叉熵损失,随机梯度下降优化器。
为了验证本发明的性能,在一个公开充电桩数据集上对提出的方案进行了训练和测试,并和典型的机器学习算法进行了比较。
1、充电桩数据集
本发明使用百度点石新能源汽充电桩数据集。每个充电桩数据包含一个特征向量与故障标签。充电桩特征向量由充电桩的K1K2驱动信号、电子锁驱动信号、充电桩急停信号、充电桩门禁信号以及充电桩电压和电流的总谐波失真构成。通过在若干充电站部署网关或集中器设备,对充电站内的充电桩数据进行融合和采集汇总,并将数据采用并行通信的方式传入后台数据服务器,共得到122144个数据。将该数据集按照7:3的比例分成训练集与测试集,可得85500个训练数据和36644个测试数据。
2、模型实现与训练
利用Python的Scikit-learn包在配置AMD Ryzen 9 5950X 16核CPU和32GB内存的计算机上编程实现提出的模型。模型训练前采用z-score对充电桩故障数据进行标准化处理。接着,将训练集的特征和标签按照bagging采样的方式输入到第一层GBDT模型中。第一层中每个GBDT的采样为10000个样本,约为数据集的1/7。第二层的GBDT使用5折交叉验证训练GBDT。训练数据集被划分为五个大小相同的组。四组用于模型训练,其余一组用于模型评估。为训练第三层学习器MLP,采用带有正则项的二元交叉熵损失,正则项系数设置为0.08。随机梯度下降优化器的动量值固定为0.9,批次大小设置为200。学习率初始化为0.01,并且在训练过程中按参数为0.5的逆比例学习率进行衰减(幂指数衰减率)。
检测方案的性能通过多个客观指标进行衡量:准确度、召回率、准确度及F1得分,并与传统GBDT和MLP进行比较,以显示本发明的性能。
3、结果对比及分析
在充电桩故障检测测试集上,对所提出的方法进行了测试。表2列出了本发明的准确度、召回率、精度和F1得分,也列出了传统GBDT和MLP的结果,以供比较。对比实验中MLP的隐层层数为6层,每个隐层神经元的个数均为100个,GBDT中子树的个数为150,树的最大深度为8。可见这两个对比模型参数复杂度要远大于本发明所搭建模型中用到的参数量。
表2显示,传统MLP虽然模型复杂,但是只能获得89%的F1得分,而单独使用较高深度,较大容量的GBDT也只能达到近似98%的精度。本发明模型的四个指标都达到了接近99%,优于前两个单一模型,说明文本方法在各项指标上均达到了很高的精度,能够有效检测充电桩的故障,保证充电桩稳定安全运行。这种高精度的融合方式是由两个方面共同作用产生。首先,参与融合的每个基学习器性能都较高。其次,参与融合的各个算法满足多样性要求,多源信息融合能够充分发挥不同模型对特征的关注信息,从而可以充分利用特征信息提升融合性能。另外,本发明在复杂度上做了很多优化,例如,在训练模型的第一层GBDT时,采样仅用10000条数据,大大节省了计算资源。
表2不同模型在测试集上的量化性能
进一步进行消融实验,以便分析本发明模型结构中每一层的作用。为此,我们实现了完整模型的如下变形:1)Bagging层模型:5个应用了bootstrap采样的GBDT模型;2)Bagging层+堆叠层模型:在Bagging层模型的基础上以全连接的形式加入三个GBDT;3)完整模型:Bagging层+堆叠层模型后再接MLP。
可以看出,在这几个变形中,Bagging层模型的性能最差。虽然,随着GBDT模型复杂度的增加,F1得分随之增加,但是,他们的性能都低于98%。当逐个加入第二层的三个GBDT时,性能得到了改善,可以分别获得97.68%,98.92%和98.99%的F1得分。在使用所有组件时,完整模型表现出最佳性能,其F1得分达到了99.3%。也就是说,通过增加MLP,我们的完整模型就F1分数而言可以超过使用GBDT进行融合的最高性能。这些结果表明,所有的组件都提供了性能增益,并为获得整体性能做出了贡献。
表3融合模型的多个变体的F1得分
本发明提出了一种GBDT与MLP融合的新方法,用于解决充电桩故障诊断问题。该方案以集成学习理论为基础,组建多个全连接的GBDT层,并与MLP相连,进行特征学习与分类。GBDT与MLP融合可以有效的避免他们的不足,联合他们的优势,提升充电桩故障诊断的精度。而且,该方案避免了手动提取特征的困难,降低了网络过拟合几率,确保了故障诊断性能得到提升而且更加稳定。在公开数据集上的实验结果表明,本发明提出的方案优于典型的独立机器学习方案。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,采集待测充电桩数据集,构造成特征向量,并将所述特征向量输入融合模型,输出充电桩故障诊断结果,
所述融合模型包括N层学习器,其中N≥2,
前N-1层学习器均由多个独立的梯度提升树GBDT模型构成,第N层学习器为一个含有多个隐含层的多层感知机MLP模型。
2.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,所述充电桩数据集包括充电桩的K1K2驱动信号、电子锁驱动信号、充电桩急停信号、充电桩门禁信号以及充电桩电压和电流的总谐波失真。
3.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,前一层学习器的输出作为后一层学习器的输入,第一层学习器的梯度提升树GBDT模型以充电桩的特征向量为输入,输出充电桩故障预测,后一层的梯度提升树GBDT模型通过集成前一层的梯度提升树GBDT模型的输出,输出新的充电桩故障预测,第N层学习器的多层感知机MLP模型接收成第N-1层学习器的梯度提升树GBDT模型的输出,输出充电桩故障诊断结果。
4.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,所述融合模型可以由三层学习器构成,第一层学习器包括5个梯度提升树GBDT模型,第二层学习器包括3个梯度提升树GBDT模型,第三层学习器包括一个含有两个隐含层的多层感知机MLP模型。
5.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,所述融合模型中,对特征向量进行多次采样,为第一层学习器中每个梯度提升树GBDT模型提供不同的输入数据,对前一层学习器中所有梯度提升树GBDT模型输出的充电桩故障预测值进行Stacking处理,为后一层学习器中每个梯度提升树GBDT模型提供不同的输入数据。
6.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,同一层学习器中的每个梯度提升树GBDT模型超参数设置不同。
7.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,所述融合模型中每个梯度提升树GBDT模型均使用基于Softmax目标函数和精确贪婪算法进行训练。
8.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,第N层学习器中多层感知机MLP模型输入层神经元的数量与第N-1层学习器中梯度提升树GBDT模型的数量相等,多层感知机MLP模型输入层的一个神经元接收第N-1层学习器中一个梯度提升树GBDT模型输出的充电桩故障预测值。
9.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,第N层学习器中多层感知机MLP模型输出层含有两个神经元,分别对应充电桩正常和故障状态。
10.根据权利要求1所述的基于梯度提升树与多层感知机融合的充电桩故障诊断方法,其特征在于,在第N层学习器的多层感知机MLP模型后连接一个Softmax层,输出故障的置信度得分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310240498.8A CN116484299A (zh) | 2023-03-14 | 2023-03-14 | 基于梯度提升树与多层感知机融合的充电桩故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310240498.8A CN116484299A (zh) | 2023-03-14 | 2023-03-14 | 基于梯度提升树与多层感知机融合的充电桩故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116484299A true CN116484299A (zh) | 2023-07-25 |
Family
ID=87218469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310240498.8A Pending CN116484299A (zh) | 2023-03-14 | 2023-03-14 | 基于梯度提升树与多层感知机融合的充电桩故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484299A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251814A (zh) * | 2023-09-28 | 2023-12-19 | 广东省交通开发有限公司 | 一种高速公路充电桩电量损耗异常的分析方法 |
CN117894481A (zh) * | 2024-03-15 | 2024-04-16 | 长春大学 | 基于贝叶斯超参数优化梯度提升树心脏病预测方法及装置 |
-
2023
- 2023-03-14 CN CN202310240498.8A patent/CN116484299A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117251814A (zh) * | 2023-09-28 | 2023-12-19 | 广东省交通开发有限公司 | 一种高速公路充电桩电量损耗异常的分析方法 |
CN117894481A (zh) * | 2024-03-15 | 2024-04-16 | 长春大学 | 基于贝叶斯超参数优化梯度提升树心脏病预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635928B (zh) | 基于深度学习模型融合的电压暂降原因识别方法 | |
US10234495B2 (en) | Decision tree SVM fault diagnosis method of photovoltaic diode-clamped three-level inverter | |
CN116484299A (zh) | 基于梯度提升树与多层感知机融合的充电桩故障诊断方法 | |
CN110579709B (zh) | 一种有轨电车用质子交换膜燃料电池故障诊断方法 | |
CN106628097A (zh) | 一种基于改进径向基神经网络的船舶设备故障诊断方法 | |
CN110879373B (zh) | 一种神经网络和决策融合的油浸式变压器故障诊断方法 | |
CN110689069A (zh) | 一种基于半监督bp网络的变压器故障类型诊断方法 | |
CN107153845A (zh) | 一种基于机器学习的自适应并网光伏系统的孤岛检测法 | |
CN113962259A (zh) | 一种燃料电池系统多模式双层故障诊断方法 | |
CN114676742A (zh) | 一种基于注意力机制和残差网络的电网异常用电检测方法 | |
CN113591728A (zh) | 基于集成深度学习的电能质量扰动分类方法 | |
CN111398811A (zh) | 基于终端电流代价敏感学习的pmsm退磁故障诊断方法 | |
CN111091141B (zh) | 一种基于分层Softmax的光伏背板故障诊断方法 | |
CN116562114A (zh) | 一种基于图卷积神经网络的电力变压器故障诊断方法 | |
Xin et al. | A deep learning and softmax regression fault diagnosis method for multi-level converter | |
CN115469184A (zh) | 基于卷积网络的新能源输电线路故障识别方法 | |
CN113033678A (zh) | 一种基于自适应对抗网络的锂电池组故障诊断方法 | |
CN117272230A (zh) | 一种基于多任务学习模型的非侵入式负荷监测方法和系统 | |
CN117491872A (zh) | 一种可重构电池模组故障多级诊断方法 | |
CN116317937A (zh) | 一种分布式光伏电站运行故障诊断方法 | |
CN110348489A (zh) | 一种基于自编码网络的变压器局部放电模式识别方法 | |
CN115659258A (zh) | 一种基于多尺度图卷积孪生网络的配电网故障检测方法 | |
CN115146739A (zh) | 基于堆叠时间序列网络的电力变压器故障诊断方法 | |
CN114841266A (zh) | 一种小样本下基于三元组原型网络的电压暂降识别方法 | |
Wang et al. | Turn-to-turn short circuit of motor stator fault diagnosis using dropout rate improved deep sparse autoencoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |