CN116432543B - 功率半导体模块剩余寿命预测方法、终端设备及存储介质 - Google Patents
功率半导体模块剩余寿命预测方法、终端设备及存储介质 Download PDFInfo
- Publication number
- CN116432543B CN116432543B CN202310693256.4A CN202310693256A CN116432543B CN 116432543 B CN116432543 B CN 116432543B CN 202310693256 A CN202310693256 A CN 202310693256A CN 116432543 B CN116432543 B CN 116432543B
- Authority
- CN
- China
- Prior art keywords
- data
- training
- time
- precursor
- power semiconductor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 239000004065 semiconductor Substances 0.000 title claims abstract description 50
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 123
- 238000012360 testing method Methods 0.000 claims abstract description 75
- 239000002243 precursor Substances 0.000 claims abstract description 63
- 230000006870 function Effects 0.000 claims abstract description 36
- 230000032683 aging Effects 0.000 claims abstract description 32
- 230000006978 adaptation Effects 0.000 claims abstract description 23
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000011176 pooling Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 8
- 238000013508 migration Methods 0.000 claims description 7
- 230000005012 migration Effects 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 abstract description 15
- 238000013526 transfer learning Methods 0.000 abstract description 8
- 230000000875 corresponding effect Effects 0.000 description 19
- 210000002569 neuron Anatomy 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/26—Testing of individual semiconductor devices
- G01R31/2642—Testing semiconductor operation lifetime or reliability, e.g. by accelerated life tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/04—Ageing analysis or optimisation against ageing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Geometry (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Testing Or Measuring Of Semiconductors Or The Like (AREA)
Abstract
本发明公开了一种功率半导体模块剩余寿命预测方法、终端设备及存储介质,确定在加速老化测试过程中表征功率半导体模块老化过程的前驱参数;获取两组同类功率半导体模块在整个加速老化测试中前驱参数随时间变化的数据;对前驱参数随时间变化的数据进行相关处理,推导出所需要的训练数据和测试数据;选择用于训练的前驱参数随时间变化的数据和用于测试的前驱参数随时间变化的数据的部分数据;利用训练数据产生训练损失,利用选择的部分数据执行最大平均差异法完成迁移学习域适应,产生差异损失;设置综合损失函数对卷积神经网络进行迭代训练,得到训练完成的剩余寿命预测模型。本发明有效地解决了前驱参数数据“分布来源”不一致的问题。
Description
技术领域
本发明涉及功率半导体模块(如IGBT、SiC、MOSFET)的剩余寿命预测领域,特别是一种功率半导体模块剩余寿命预测方法、终端设备及存储介质。
背景技术
现有的功率半导体模块剩余寿命预测方法可分为基于模型驱动的方法和基于数据驱动的方法。对于基于模型驱动的剩余寿命预测方法,通常需要总结大量的实验数据来拟合相应的解析预测模型。这类方法只能针对一种功率半导体模块实现剩余寿命预测,当预测对象改变时,就需要重新拟合解析预测模型,这使得此类方法不具有通用性且费时费力。此外,基于模型驱动的方法,无法将影响功率半导体模块的所有因素纳入模型中去,且当纳入因素增加时,将极大的增加拟合难度,使得工作量增加。随着数据分析和机器学习技术的发展,数据驱动的方法在最近几年得到了很大的研究关注。基于数据驱动的剩余寿命预测方法不需要先验知识,能够在没有已知模型的条件下建立输入和输出之间的映射关系,并且通用性强,部署速度快,准确率高。
另外,对于基于数据驱动的剩余寿命预测方法,现有的研究可分为基于传统的机器学习方法和基于深度学习的方法。基于传统的机器学习方法,如人工神经网络、支持向量机、极限学习机等存在网络结构浅、特征提取能力差、难以深入挖掘数据信息的缺点,并且需要手动提取特征,需要长时间的数据处理和分析。而卷积神经网络(CNN)具有深度学习的能力,能够深入挖掘隐藏在数据中的信息,并且具有自动提取特征信息的功能。不仅如此,卷积神经网络还具有局部连接、权值共享、下采样的特点,使得卷积神经网络训练参数量减少,提高训练效率。尽管如此,卷积神经网络仍然存在一些所有的机器学习算法共同的缺点。一是需要用大量数据训练模型才能达到令人满意的精度,二是假定训练集和测试集取自同一类分布。而在功率半导体模块的剩余寿命预测工作中,由于功率半导体的失效周期都比较长,因此很难获得大量的老化数据来完成模型的训练。另外,在实际的加速老化过程中,由于不同功率半导体之间的初始制造差异、实验环境的不同、测量手段的不同等问题,使得不同功率半导体经历加速老化测试之后产生的老化数据很难服从相同的“分布来源”。而迁移学习技术能够从训练集中转移所学习到的知识,然后利用少量新生成的测试数据重建预测模型,这使得新生成的测试数据集不必从与训练集相同的分布中获得的,消除了传统机器学习带来的数据限制。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种功率半导体模块剩余寿命预测方法、终端设备及存储介质,提高功率半导体模块剩余寿命预测精度。
为解决上述技术问题,本发明所采用的技术方案是:一种功率半导体模块剩余寿命预测方法,包括以下步骤:
S1、获取两组同类功率半导体模块在整个加速老化测试中前驱参数随时间变化的数据;所述前驱参数用于在加速老化测试过程中表征功率半导体模块老化过程;前驱参数随时间变化的数据包括用于训练的前驱参数随时间变化的数据和用于测试的前驱参数变化数据;
S2、对所述前驱参数随时间变化的数据进行相关处理,推导出所需要的训练数据和测试数据;
S3、选择用于训练的前驱参数随时间变化的数据的部分数据和用于测试的前驱参数随时间变化的数据的部分数据;
S4、利用步骤S2推导出的训练数据产生训练损失函数LMSE,利用步骤S3选择的部分数据执行最大平均差异法完成迁移学习域适应,实现训练数据与测试数据之间的特征差异最小化,产生差异损失函数LMMD;
S5、设置综合损失函数Lsum=LMSE+λLMMD,对卷积神经网络进行模型迭代训练,直到卷积神经网络模型收敛,得到训练完成的剩余寿命预测模型;λ是平衡系数。
本发明利用迁移学习技术和卷积神经网络开发了一个更加通用、省时、高精度的剩余寿命预测模型。利用迁移学习中的域适应技术即最大平均差异法,解决了由于测试数据和训练数据取自不同的“分布来源”所导致的预测精度低的问题。
其中,对所述前驱参数随时间变化的数据进行相关处理的具体实现过程包括:
对于用于训练的前驱参数随时间变化的数据:
将所述用于训练的前驱参数随时间变化的数据划分为多段,其中第一段数据为从0时刻到时间点A处的数据,第二段数据为从0时刻到数据点2A处的数据,第三段数据为从0时刻到数据点3A处的数据,依此类推,第N段数据为从0时刻到时间点NA处的数据;
对于第j段数据,按照时间顺序,将每j个点的数据取平均值,得到更新后的第j段数据;其中,2≤j≤N;
对于第一段数据和更新后的第2~第N段数据,在每一段数据的最后增加该段数据对应的功率半导体模块的剩余使用寿命值数据,得到训练数据;
对于用于测试的前驱参数变化数据:
选择用于测试的前驱参数变化数据的B个功率周期处的点作为被预测模块目前的功率循环周期数;
每(B/A)个点取平均值得到一个新的点,以此获得测试数据。
本发明通过对用于训练的前驱参数数据进行分段均值化处理,使得训练数据能够充分表征功率半导体的整个老化过程。本发明通过对用于测试的前驱参数数据进行均值化处理,使得测试数据与训练数据具有相同的维度,从而对不同的功率半导体模块进行剩余寿命预测成为可能。因此本申请提高了功率半导体模块剩余寿命预测精度,提高了预测模型的通用性,减少了预测时长。
本申请中,综合考虑在线测量难易程度、通用性、校准难度、准确性和灵敏度几个方面的因素,将所述前驱参数选定为功率半导体模块的集电极-发射极饱和压降Vce。
步骤S2中,第p段数据对应的功率半导体模块的剩余使用寿命值数据表示为:Nf -pA,其中,1≤p≤N。功率半导体模块的剩余使用寿命是指功率半导体模块运行到某个时刻点,距离失效之前还剩多少可运行时间。因此,第一组训练数据所对应的剩余使用寿命为Nf -A,第二组训练数据所对应的剩余使用寿命为Nf -2A,第三组训练数据所对应的剩余使用寿命为Nf -3A,第N组训练数据所对应的剩余使用寿命为Nf -NA。其中,Nf为功率半导体模块达到失效标准时的周期数。
步骤S3中,选择用于训练的前驱参数随时间变化的数据和用于测试的前驱参数随时间变化的数据的部分数据的具体实现过程包括:选择用于训练的前驱参数随时间变化的数据的后四分之一段数据,对于选择的数据,每(S1/A)个点的数据取平均值得到一个新的数据序列xi,i=1,2,……,A,将新的数据序列xi记为;其中,S1为用于训练的前驱参数随时间变化的数据的后四分之一段数据的长度;
选择用于测试的前驱参数随时间变化的数据的后四分之一段数据,对于选择的数据,每(S2/A)个点的数据取平均值得到一个新的数据序列yj,j=1,2,……,A,将新的数据序列yj记为;其中,S2为用于测试的前驱参数随时间变化的数据的后四分之一段数据的长度。
本申请不仅使得新的点数据序列与训练数据拥有相同的数据维度,还能够使得新的点数据序列蕴含着丰富的功率半导体模块的老化信息,进一步提高剩余寿命预测精度。
步骤S4中,利用步骤S2推导出的训练数据产生训练损失,同时利用步骤S3选择的部分数据执行最大平均差异法完成迁移学习域适应,实现训练数据与测试数据之间的特征差异最小化,产生差异损失函数的具体实现过程包括:利用步骤S2推导出的训练数据产生训练损失函数LMSE:
;
其中,分别为第m组训练数据样本的剩余寿命的预测值和实际值;M为训练数据样本数;
利用步骤S3选择的部分数据执行最大平均差异法完成迁移学习域适应,实现训练数据与测试数据之间的特征差异最小化,产生差异损失函数LMMD:
;
其中,核函数;映射函数/>表示将xi、yj从原始空间映射到再生希尔伯特空间RKHS。
步骤S5中,所述卷积神经网络模型包括:
特征提取模块,用于对输入特征依次进行卷积操作和池化操作;所述输入特征包括经步骤S2推导出的训练数据和步骤S3中选择的部分数据;
展平单元,用于对池化操作后的特征进行展平操作;
全连接单元,用于获取展平单元的对应输出,以及用于获得训练损失函数和差异损失函数;
所述特征提取模块包括依次连接的卷积层、线性整流单元和池化层;所述线性整流单元为ReLU激活函数。
所述全连接单元包括依次连接的输入侧、隐含层和输出层。
本发明采用的卷积神经网络结构具有参数少、结构简单、便于调整和易于观察的优势。
所述综合损失函数为:
;
其中,λ是平衡系数。
本发明提出的综合损失函数,在迭代过程中既让模型拥有更高的预测精度,还能模型更能够减小训练数据与测试数据之间的差异。
作为一个发明构思,本发明还提供了一种终端设备,其包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明上述方法的步骤。
作为一个发明构思,本发明还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现本发明上述方法的步骤。
与现有技术相比,本发明所具有的有益效果为:
(1)本发明避免了复杂的手工特征提取过程;
(2)本发明将分类任务中常用的MMD扩展到预测任务,有效的解决了前驱参数数据“分布来源”不一致的问题;
(3)在预测对象层面,本发明首次提出了针对功率循环级别下的加速老化测试过程中的功率半导体模块进行剩余寿命预测。
附图说明
图1是本发明实施例提出的基于人工智能的功率半导体模块的剩余寿命预测方法的实现流程图;
图2是本发明实施例训练数据源Vce-1与测试数据源Vce-2在整个加速老化过程中随时间的变化曲线;
图3是本发明实施例所设计的剩余寿命预测方法的整体框架。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本发明实施例提出的基于人工智能的功率半导体模块的剩余寿命预测方法主要过程包括卷积神经网络框架的搭建与迁移学习域适应模块的搭建。本实施例主要实施步骤包括(以IGBT模块为例):
S1:确定在加速老化测试过程中能够充分表征IGBT模块老化过程的前驱参数。
具体的确定过程如下:
S101:在IGBT模块的加速老测试化过程中,常用的前驱参数有集电极-发射极饱和压降Vce、负载电流Ic、栅极-发射极压降Vge和最高结温Tjmax。虽然最高结温Tjmax是对老化过程最有影响的参数,但直接测量Tjmax是侵入性的,因此是不实际的。与Ic、Vge相比,Vce显示出对老化过程更敏感,并且Vce随着老化而明显变化,在达到初始值的3%后会有规律地增加,而Ic和Vge变化不大。此外,Vce显示出比其他参数更好的在线测量能力和准确性。因此,考虑到在线测量难易程度、通用性、准确性、灵敏度等方面,本实施例认为Vce是最适合的表征IGBT模块老化过程的前驱参数。
S2:搜集不同的IGBT模块在整个加速老化测试中Vce随时间变化的值。搜集两组Vce数据即可,以便有一组Vce-1数据可用于推导出训练数据,而另外一组Vce-2数据可用于推导出测试数据。为了便于理解,请参阅图2。
S3:对两组Vce数据进行相关处理以推导出所需要的训练数据和测试数据;
为了使剩余寿命预测模型更好地适应功率半导体模块的老化过程,在预测之前,需要对前驱参数随时间变化的数据进行相关处理。首先,需要将用于训练的前驱参数随时间变化的数据分为多段。分段的方法为“递增分段法”。即第一段数据为从0到某个时间点A处,作为第一组训练数据;第二段数据为从0到时间点2A处,作为第二组训练数据;第三段数据为从0到时间点3A处,作为第三组训练数据;依次类推第N段数据为从0到时间点NA处,作为第N组训练数据。其次,为了使每一组训练数据的长度相同。我们进入如下操作:第一组数据保持不变;第二组训练数据中,由于第二组训练数据长度是第一组训练数据的两倍,因此我们每两个点取平均值,得到一个新的点;第三组训练数据中,由于第三组训练数据长度是第一组训练数据的三倍,因此我们每三个点取平均值,得到一个新的点;以此类推,第N组训练数据中,由于第N组训练数据长度是第一组训练数据的N倍,因此我们每N个点取平均值,得到一个新的点。这样我们便得到了一系列新的训练数据。再次,功率半导体模块的剩余使用寿命是指功率半导体模块运行到某个时刻点,距离失效之前还剩多少可运行时间。因此,第一组训练数据所对应的剩余使用寿命为Nf -A,第二组训练数据所对应的剩余使用寿命为Nf -2A,第三组训练数据所对应的剩余使用寿命为Nf -3A,第N组训练数据所对应的剩余使用寿命为Nf -NA。其中,Nf为功率半导体模块达到失效标准时的周期数。最后,对于测试数据,我们从用于测试的前驱参数变化数据中选择某一个点作为被预测模块目前的功率循环周期数。同样的,为了使得测试数据能够与训练数据拥有相同的长度,我们需要进行如下操作:假设选定的点为B个功率周期处,而训练数据的长度为A,因此我们应该每(B/A)个点取平均值得到一个新的点。这样便得到了与训练数据相同长度的测试数据。在本实施例中设置A=500。
S301:每个IGBT模块的寿命是不同的,换言之,IGBT模块从健康到故障所经历的功率循环次数是不同的。在本发明实施例中,作为训练数据源的Vce-1的变化周期为0-50000,即作为训练模块的IGBT-1模块的失效周期Nf-1=50000。作为测试数据源的Vce-2的变化周期为0-43000,失效周期为Nf-2。在本实施例中,我们选择测试数据源Vce-2的0-12000周期段作为测试模块IGBT-2目前的功率循环状态,即测试模块IGBT-2目前的功率循环次数为12000。
为了产生所需要的训练数据和测试数据,在预测之前,将训练数据源Vce-1和测试数据源Vce-2做如下处理:
;
其中,traink代表第k(k=1,2,……,100)组训练数据;testdata表示一组测试数据;为训练数据源Vce-1中第p(p=1,2,……,Nf-1)个功率循环周期处的Vce值;/>为测试数据源Vce-2中第t(t=1,2,……,Nf-2)个功率循环周期处的Vce值;NRUL表示testdata这一组测试数据输入到剩余寿命预测模型所得到的剩余寿命预测值;每一组数据的最后一个值代表剩余寿命,每一组数据的第一个值到倒数第二个值代表一组输入参数。
S4:选择用于域适应的Vce数据并进行相关处理。
用于域适应的数据应该能够充分反应IGBT模块的老化趋势,即应该包含丰富的IGBT模块的老化信息。
用作迁移学习域适应的数据应该能够充分反应功率半导体模块的老化状态,即应该蕴含丰富的老化信息。在本发明实施例中,我们选择每组前驱参数曲线的后四分之一段作为迁移学习域适应所需要的数据,即包括训练前驱参数曲线的后四分之一段数据和测试前驱参数曲线的后四分之一段数据。另外,为了使得两组数据能够与训练数据拥有相同的长度,需要进行相关数据处理,数据处理的方式可以阐述如下:
由于每一组训练数据的长度为A,因此,用于迁移学习域适应的数据的长度也应为N。假设训练前驱参数曲线的后四分之一段数据和测试前驱参数曲线的后四分之一段数据的长度分为了S1和S2。因此,对于训练前驱参数曲线的后四分之一段数据,我们应该每(S1/A)个点取平均值得到一个新的数据序列xi,i=1,2,……,A;对于测试前驱参数曲线的后四分之一段数据,我们应该每(S2/A)个点取平均值得到一个新的数据序列yj,j=1,2,……,A。这样便得到了与训练数据相同长度的用于迁移学习域适应的数据。在本实施例中设置A=500。
在本实施例中,选择Vce曲线的后四分之一段作为所需要的用于域适应的Vce数据,即选择Vce-1曲线第37501-50000个周期处的数据与Vce-2曲线第9001-12000个周期处的数据作为用于域适应的数据:
;
其中,trainMMD为代表训练数据分布的域适应数据;testMMD为代表测试数据分布的域适应数据。
S5:搭建所提出的剩余寿命预测方法的整体框架。为了更加直观的理解本实施例,请参阅图3。
S501:搭建卷积神经网络的框架,包括:一个特征提取阶段和一个全连接神经网络模块。
特征提取阶段
1)卷积过程:卷积层通过几个卷积核执行从输入参数中提取信息的任务。卷积计算的过程:卷积核上的每个值都要乘以它所滑动到的相应位置的值,然后将这些值相加,得到输出特征图中相应位置的值。卷积计算的数学表达式可以描述如下:
;
其中,其中y是卷积核和输入特征图卷积计算后的输出特征图;WC是卷积核的权重矩阵;x是输入特征图;rowWC和colWC分别是权重矩阵WC的行数和列数;i代表输出特征图y的第i行,j代表输出特征图y的第j列。
正确设置核的大小、输出通道的数量是提高剩余寿命预测模型预测精度的有效保证。我们定义width、height、depth、OC分别为卷积核的宽度、卷积核的高度、卷积核的深度和输出通道的数量(核的数量)。首先,由于我们的输入特征图是一个一维向量,我们设定width=1,depth =1。我们建议使用试错法来确定核的高度height和输出通道的数量OC。在平衡性能和计算成本,以及不引入噪声的前提下,在本实施例中最终选择height=101,OC=40作为最佳选择。
数据激活:数据激活是把卷积过程的输出结果做非线性映射。应该注意的是,通常在每个卷积层之后立即应用一个激活函数。在本实施例中,使用了线性整流单元(ReLU)作为激活函数。因为它能更有效地减少CNN的梯度消失和过度拟合。ReLU的数学表达式可以描述如下:
;
其中,y1是ReLU函数的输出结果。
池化:有必要在每个卷积层后面增加一个池化层,以减少CNN的可训练参数的维度和数量,保留重要的信息,舍弃不相关的细节。在本实施例中,我们选择平均池化作为CNN的池化操作。其中,池化核的大小被设置为2×1,跨度被设置为2。平均池化的数学表达式可以描述如下:
;
其中,y2是卷积层的输出结果;i代表y2矩阵的第i行,j代表y2矩阵的第j列。
全连接神经网络模块
在池化层的下一层,需要全连接(FC)层来学习提取的特征的非线性组合。仔细选择全连接层的数量以及各层神经元数量在设计CNN时起着至关重要的作用,以便获得更好的预测性能。在本实施例中,我们将全连接层的数量设定为3,包括一个输入层、一个隐含层(FC-1)和一个输出层(FC-2)。其中,输入层的神经元的数量与展平层包含的元素的个数相一致;FC-1层神经元的数量为580,FC-2层神经元的数量为1。
进一步地,FC-1层用于输出训练数据和测试数据之间的差异,并跟随一个ReLU激活函数;
进一步地,FC-2层用于输出剩余寿命的预测结果,并跟随一个Sigmoid激活函数。
S502:搭建迁移学习域适应模块。
训练数据和测试数据之间存在数据分布差异的问题,为了使训练数据和测试数据的数据分布尽可能接近,在本实施例中,选择最大平均差异法(MMD)作为所需要的域适应方法。
假设满足边际分布P(X);同样的,假设满足边际分布,并且有P(X)≠Q(Y)。
由于剩余寿命预测的实时性,本发明中没有考虑条件分布,即忽略了条件分布的差异。在再现核希尔伯特空间(RKHS)中计算P(X)和Q(Y)之间的距离,可以表示为:
;
其中,映射函数表示从原始空间到RKHS的映射。
因此,两个边缘分布的距离可以通过它们在RKHS中的距离来估计。那么训练数据和测试数据之间的MMD距离被改进为以下方程:
;
通过核技巧,即,则上述公式可改写为:
;
其中,在本发明实施例中使用的核是具有超参数的高斯核,表达式为:
;
在本实施例中,设置超参数。
S403:损失函数与优化器的选取。
损失函数和权重优化器的正确选择是提高剩余寿命预测模型预测精度的两个关键点。
损失函数
损失函数的作用是在误差反向传播过程中反映模型的预测值和真实值之间的不一致程度。在本实施例中,我们采用了一种基于MMD的域适应方法进行转移训练。因此,最终损失函数Lsum是使用训练数据得到的CNN训练损失(均方根误差(RMSE)损失)和两组域适应数据之间的MMD损失的组合。数学表达式可以描述如下:
;
其中,其中,分别为剩余寿命的预测值、实际值;λ是CNN训练损失和MMD损失之间的平衡;M为训练数据样本数。在本实施例中,设置λ=0.35。
优化器
在剩余寿命预测模型训练过程中,有很多优化器可以用来更新网络权重和偏置参数,如Adagrad、Adadelta、RMSProp和Adam优化器。其中,Adagrad优化器适用于处理稀疏数据;Adadelta优化器有从根本上降低学习率的风险;RMSProp优化器将引入新的超参数,导致计算成本增加。而Adam优化器的优点是学习率可以自动调整,训练精度提高较快,而且不会引入新的超参数。因此,在本实施例中,我们使用Adam优化器作为剩余寿命预测模型的所需要的优化器。权值更新公式为:
;
其中,α是学习率;β1、β2分别为一阶矩估计的指数衰减率和二阶矩估计的指数衰减率;gen是更新的步数;Vgen、Sgen分别为梯度dw的一阶矩估计和二阶矩估计;分别为偏差修正的一阶矩估计和二阶矩估计;ε是计算稳定性参数,为了防止分母为零。
在本实施例中,设置:α=0.01,β1=0.935,β2=0.999,ε=10-8。
综上所述,本发明实施例提出的剩余寿命预测方法的超参数和详细的架构如下表1。
S6:根据所选择的权值优化算法和损失函数进行剩余寿命预测模型的训练。
进一步地,模型训练的具体过程为:
S601:初始化网络权值,初始化梯度dw的一阶矩估计和二阶矩估计;
初始化网络权值需要对卷积核权值矩阵WC、全连接神经网络输入层与FC-1层之间的权值矩阵W1和FC-1层与FC-2层之间的权值矩阵W2初始化。在本实施例中,WC设置为40×1×80的标准正态分布的矩阵;W1与W2的初始化是基于均匀分布的Xavier初始化,从中随机选取,有:
;
其中,nin-1、nout-1分别为全连接输入层的神经元个数和FC-1层的神经元个数;nin-2、nout-2分别为FC-1层的神经元个数和FC-2层的神经元个数。
梯度dw的一阶矩估计和二阶矩估计,全部设置为相应维度的零矩阵即可。
S602:首先,设置训练次数,在本实施例中设置训练次数epoch=20。其次,利用train1-train100这100组训练数据训练CNN模型产生训练损失,同时利用trainMMD和testMMD这两组数据完成迁移学习域适应产生MMD损失,重复训练20次,直到模型收敛。
S7:进行模型的测试和测试结果的评估。
S701:利用testdata这一组测试数据对训练完成的剩余寿命预测模型进行测试。通过本实施例给出的剩余寿命预测模型可以得到testdata这一组测试数据对应的剩余寿命为30582次功率循环。
S702:在本实施例中,采用相对误差来对预测效果进行评估,相对误差的表达式分别为:
;
其中,分别为testdata这一组测试数据对应的剩余寿命的预测值、实际值。
本次测试结果的相关系数err=1.35%。说明本发明实施例提出的方法具有相当好的预测效果。
另外需要说明的是,本发明实施例提出的方法具有通用性,即模型训练好之后可以实现对任意同类功率半导体模块进行加速老化过程中的剩余寿命预测。当需要对其他同类的功率半导体模块进行加速老化过程中的剩余寿命预测时,只需要测量并收集被预测模块前驱参数随时间变化的值,然后输入到训练好的剩余寿命预测模型中去即可。
实施例2
本发明实施例2提供一种对应上述实施例1的终端设备,终端设备可以是用于客户端的处理设备,例如手机、笔记本电脑、平板电脑、台式机电脑等,以执行上述实施例的方法。
本实施例的终端设备包括存储器、处理器及存储在存储器上的计算机程序;处理器执行存储器上的计算机程序,以实现上述实施例1方法的步骤。
在一些实现中,存储器可以是高速随机存取存储器(RAM:Random AccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
在另一些实现中,处理器可以为中央处理器(CPU)、数字信号处理器(DSP)等各种类型通用处理器,在此不做限定。
实施例3
本发明实施例3提供了一种对应上述实施例1的计算机可读存储介质,其上存储有计算机程序/指令。计算机程序/指令被处理器执行时,实现上述实施例1方法的步骤。
计算机可读存储介质可以是保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意组合。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (9)
1.一种功率半导体模块剩余寿命预测方法,其特征在于,包括以下步骤:
S1、获取两组同类功率半导体模块在整个加速老化测试中前驱参数随时间变化的数据;所述前驱参数用于在加速老化测试过程中表征功率半导体模块老化过程;前驱参数随时间变化的数据包括用于训练的前驱参数随时间变化的数据和用于测试的前驱参数变化数据;
S2、对所述前驱参数随时间变化的数据进行相关处理,推导出所需要的训练数据和测试数据;
S3、选择用于训练的前驱参数随时间变化的数据的部分数据和用于测试的前驱参数随时间变化的数据的部分数据;
S4、利用步骤S2推导出的训练数据产生训练损失函数LMSE,利用步骤S3选择的部分数据执行最大平均差异法完成迁移学习域适应,实现训练数据与测试数据之间的特征差异最小化,产生差异损失函数LMMD;
S5、设置综合损失函数Lsum=LMSE+λLMMD,对卷积神经网络进行模型迭代训练,直到卷积神经网络模型收敛,得到训练完成的剩余寿命预测模型;λ是平衡系数;
步骤S2中,对所述前驱参数随时间变化的数据进行相关处理的具体实现过程包括:
对于用于训练的前驱参数随时间变化的数据:
将所述用于训练的前驱参数随时间变化的数据划分为多段,其中第一段数据为从0时刻到时间点A处的数据,第二段数据为从0时刻到时间点2A处的数据,第三段数据为从0时刻到时间点3A处的数据,依此类推,最后一段数据,即第K段数据为从0时刻到时间点KA处的数据;
对于第j段数据,按照时间顺序,将每j个点的数据取平均值,得到更新后的第j段数据;其中,2≤j≤K;
对于第一段数据和更新后的第2~第K段数据,在每一段数据的最后增加该段数据对应的功率半导体模块的剩余使用寿命值数据,得到训练数据;其中,第p段数据对应的功率半导体模块的剩余使用寿命值数据表示为:Nf -pA,1≤p≤K;Nf为功率半导体模块达到失效标准时的周期数;
对于用于测试的前驱参数变化数据:
选择用于测试的前驱参数变化数据的B个功率周期处的点作为被预测模块目前的功率循环周期数;
每(B/A)个点取平均值得到一个新的点,以此获得测试数据。
2.根据权利要求1所述的功率半导体模块剩余寿命预测方法,其特征在于,步骤S1中,所述前驱参数为功率半导体模块的集电极-发射极饱和压降Vce。
3.根据权利要求1所述的功率半导体模块剩余寿命预测方法,其特征在于,步骤S3中,选择用于训练的前驱参数随时间变化的数据的部分数据和用于测试的前驱参数随时间变化的数据的部分数据的具体实现过程包括:
选择用于训练的前驱参数随时间变化的数据的后四分之一段数据,对于选择的数据,每(S1/A)个点的数据取平均值得到一个新的数据序列xi,i=1,2,……,A,将新的数据序列xi记为;其中,S1为用于训练的前驱参数随时间变化的数据的后四分之一段数据的长度;
选择用于测试的前驱参数随时间变化的数据的后四分之一段数据,对于选择的数据,每(S2/A)个点的数据取平均值得到一个新的数据序列yj,j=1,2,……,A,将新的数据序列yj记为;其中,S2为用于测试的前驱参数随时间变化的数据的后四分之一段数据的长度。
4.根据权利要求1所述的功率半导体模块剩余寿命预测方法,其特征在于,步骤S4中,产生训练损失函数和差异损失函数的具体实现过程包括:
利用步骤S2推导出的训练数据产生训练损失函数LMSE:
;
其中, 分别为第m组训练数据样本的剩余寿命的预测值和实际值;M为训练数据样本数;
利用步骤S3选择的部分数据执行最大平均差异法完成迁移学习域适应,实现训练数据与测试数据之间的特征差异最小化,产生差异损失函数LMMD:
;
其中,核函数;映射函数/>表示将xi、yj从原始空间映射到再生希尔伯特空间,/>为训练数据和测试数据之间的MMD距离。
5.根据权利要求4所述的功率半导体模块剩余寿命预测方法,其特征在于,步骤S5中,所述卷积神经网络模型包括:
特征提取模块,用于对输入特征依次进行卷积操作和池化操作;所述输入特征包括经步骤S2推导出的训练数据和步骤S3中选择的部分数据;
展平单元,用于对池化操作后的特征进行展平操作;
全连接单元,用于获取展平单元的对应输出,以及用于获得训练损失函数和差异损失函数。
6.根据权利要求5所述的功率半导体模块剩余寿命预测方法,其特征在于,所述特征提取模块包括依次连接的卷积层、线性整流单元和池化层;所述线性整流单元为ReLU激活函数。
7.根据权利要求5所述的功率半导体模块剩余寿命预测方法,其特征在于,所述全连接单元包括依次连接的输入层、隐含层和输出层。
8.一种终端设备,其特征在于,包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1~7任一项所述方法的步骤。
9.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310693256.4A CN116432543B (zh) | 2023-06-13 | 2023-06-13 | 功率半导体模块剩余寿命预测方法、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310693256.4A CN116432543B (zh) | 2023-06-13 | 2023-06-13 | 功率半导体模块剩余寿命预测方法、终端设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116432543A CN116432543A (zh) | 2023-07-14 |
CN116432543B true CN116432543B (zh) | 2023-09-05 |
Family
ID=87091098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310693256.4A Active CN116432543B (zh) | 2023-06-13 | 2023-06-13 | 功率半导体模块剩余寿命预测方法、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116432543B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116738804B (zh) * | 2023-08-16 | 2023-11-03 | 湖南大学 | 一种基于失效物理的功率模块寿命预测方法 |
CN116754920B (zh) * | 2023-08-21 | 2023-10-27 | 北京智芯微电子科技有限公司 | 半导体寿命测试方法、装置、存储介质及终端设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017062908A1 (en) * | 2015-10-08 | 2017-04-13 | Johnson Controls Technology Company | Photovoltaic energy system with solar intensity prediction |
CN110059377A (zh) * | 2019-04-02 | 2019-07-26 | 西南交通大学 | 一种基于深度卷积神经网络的燃料电池寿命预测方法 |
CN110580699A (zh) * | 2019-05-15 | 2019-12-17 | 徐州医科大学 | 基于改进Faster RCNN算法的病理图像细胞核检测方法 |
CN112101220A (zh) * | 2020-09-15 | 2020-12-18 | 哈尔滨理工大学 | 一种无监督模型参数迁移的滚动轴承寿命预测方法 |
WO2021042935A1 (zh) * | 2019-09-05 | 2021-03-11 | 苏州大学 | 基于隐马尔科夫模型和迁移学习的轴承寿命预测方法 |
CN115758556A (zh) * | 2021-09-01 | 2023-03-07 | 福特全球技术公司 | 用于车辆的异常检测的方法和系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200097810A1 (en) * | 2018-09-25 | 2020-03-26 | Oracle International Corporation | Automated window based feature generation for time-series forecasting and anomaly detection |
-
2023
- 2023-06-13 CN CN202310693256.4A patent/CN116432543B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017062908A1 (en) * | 2015-10-08 | 2017-04-13 | Johnson Controls Technology Company | Photovoltaic energy system with solar intensity prediction |
CN110059377A (zh) * | 2019-04-02 | 2019-07-26 | 西南交通大学 | 一种基于深度卷积神经网络的燃料电池寿命预测方法 |
CN110580699A (zh) * | 2019-05-15 | 2019-12-17 | 徐州医科大学 | 基于改进Faster RCNN算法的病理图像细胞核检测方法 |
WO2021042935A1 (zh) * | 2019-09-05 | 2021-03-11 | 苏州大学 | 基于隐马尔科夫模型和迁移学习的轴承寿命预测方法 |
CN112101220A (zh) * | 2020-09-15 | 2020-12-18 | 哈尔滨理工大学 | 一种无监督模型参数迁移的滚动轴承寿命预测方法 |
CN115758556A (zh) * | 2021-09-01 | 2023-03-07 | 福特全球技术公司 | 用于车辆的异常检测的方法和系统 |
Non-Patent Citations (1)
Title |
---|
一种结合注意力机制的IGBT失效预测方法研究;蒋闯;《重庆理工大学学报(自然科学)》;第37卷(第2期);第197-205页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116432543A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116432543B (zh) | 功率半导体模块剩余寿命预测方法、终端设备及存储介质 | |
CN111130839B (zh) | 一种流量需求矩阵预测方法及其系统 | |
Mattey et al. | A novel sequential method to train physics informed neural networks for Allen Cahn and Cahn Hilliard equations | |
CN110909926A (zh) | 基于tcn-lstm的太阳能光伏发电预测方法 | |
WO2021007812A1 (zh) | 一种深度神经网络超参数优化方法、电子设备及存储介质 | |
CN110427654B (zh) | 一种基于敏感状态的滑坡预测模型构建方法及系统 | |
CN106022521B (zh) | 基于Hadoop架构的分布式BP神经网络的短期负荷预测方法 | |
CN107463993B (zh) | 基于互信息-核主成分分析-Elman网络的中长期径流预报方法 | |
CN111047094A (zh) | 一种基于深度学习算法的抄表数据异常分析方法 | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
CN112418482A (zh) | 一种基于时间序列聚类的云计算能耗预测方法 | |
Suresh Kumar et al. | A pragmatic ensemble learning approach for effective software effort estimation | |
CN111931983B (zh) | 一种降水量预测方法及系统 | |
CN112213771A (zh) | 地震波阻抗反演方法及装置 | |
US20140279771A1 (en) | Novel Quadratic Regularization For Neural Network With Skip-Layer Connections | |
CN115935834A (zh) | 一种基于深度自回归网络和持续学习策略的历史拟合方法 | |
CN114912578A (zh) | 结构响应预测模型的训练方法、装置和计算机设备 | |
KR20220048941A (ko) | 인공 신경망을 이용한 트랜지스터 컴팩트 모델링 시스템, 방법 및 컴퓨터 프로그램 제품 | |
CN109540089B (zh) | 一种基于贝叶斯-克里金模型的桥面高程拟合方法 | |
Wang et al. | Adaptive echo state network with a recursive inverse-free weight update algorithm | |
CN112580288B (zh) | 基于多梯度神经网络的半导体器件特性建模方法和系统 | |
CN117076887A (zh) | 一种泵站机组运行状态预测和健康评估方法及系统 | |
CN114970341B (zh) | 基于机器学习的低轨卫星轨道预报精度提升模型建立方法 | |
CN117250914A (zh) | 制造过程捕获的测量数据训练机器学习模型的方法和系统 | |
CN116865251A (zh) | 一种短期负荷概率预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |