CN118057185A - 半导体工艺设备的故障诊断方法及系统 - Google Patents

半导体工艺设备的故障诊断方法及系统 Download PDF

Info

Publication number
CN118057185A
CN118057185A CN202211446654.8A CN202211446654A CN118057185A CN 118057185 A CN118057185 A CN 118057185A CN 202211446654 A CN202211446654 A CN 202211446654A CN 118057185 A CN118057185 A CN 118057185A
Authority
CN
China
Prior art keywords
fault
real
operation data
time operation
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211446654.8A
Other languages
English (en)
Inventor
李浩瀚
徐妍妍
王凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Naura Microelectronics Equipment Co Ltd
Original Assignee
Beijing Naura Microelectronics Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Naura Microelectronics Equipment Co Ltd filed Critical Beijing Naura Microelectronics Equipment Co Ltd
Priority to CN202211446654.8A priority Critical patent/CN118057185A/zh
Publication of CN118057185A publication Critical patent/CN118057185A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供了一种半导体工艺设备的故障诊断方法及系统,涉及故障诊断技术领域,该半导体工艺设备的故障诊断方法包括:获取目标设备的实时运行数据;对实时运行数据进行故障模式分析,以判断实时运行数据对应的第一故障类型;其中,第一故障类型包括单一故障和复合故障;若第一故障类型为复合故障,对实时运行数据进行关联性分析,以判断实时运行数据对应的第二故障类型;其中,第二故障类型包括并发性复合故障和时序性复合故障;基于实时运行数据的故障类型对实时运行数据进行特征提取得到待识别特征;基于待识别特征进行故障识别,得到故障诊断结果。本发明能够对设备的复合故障进行诊断,提升了机组的故障检测准确率。

Description

半导体工艺设备的故障诊断方法及系统
技术领域
本发明涉及故障诊断技术领域,尤其是涉及一种半导体工艺设备的故障诊断方法及系统。
背景技术
在工业生产中,生产机组通常存在运行环境恶劣导致容易出现各类故障的情况,诸如,在半导体装备制造领域,由于内部存在高温高压的工作环境和腐蚀性气体,立式炉机组运行过程中不可避免会出现各种故障,机组的故障形式主要包括单一故障和复合故障,复合故障又分为时序性复合故障和并发性复合故障两种,复合故障皆由不同形式的单一故障组成。
相关的机组故障诊断技术,通常对关键参数进行状态监测,检测出其超出阈值后报警,容易出现诊断错误导致的误报警情况,且无法诊断机组的复合故障。因此,相关故障诊断技术在处理机组的复合故障时还存在故障检测准确率较低的问题。
发明内容
有鉴于此,本发明的目的在于提供一种半导体工艺设备的故障诊断方法及系统,能够对机组的复合故障进行诊断,通过基于对机组的实时运行数据提取出的特征进行故障诊断,能够快速识别出机组的故障诊断结果,避免诊断错误导致的误报警情况,提升了机组的故障检测准确率。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种半导体工艺设备的故障诊断方法,包括:获取目标设备的实时运行数据;对所述实时运行数据进行故障模式分析,以判断所述实时运行数据对应的第一故障类型;其中,所述第一故障类型包括单一故障和复合故障;若所述第一故障类型为所述复合故障,对所述实时运行数据进行关联性分析,以判断所述实时运行数据对应的第二故障类型;其中,所述第二故障类型包括并发性复合故障和时序性复合故障;基于所述实时运行数据的故障类型对所述实时运行数据进行特征提取得到待识别特征;基于所述待识别特征进行故障识别,得到故障诊断结果;其中,所述故障诊断结果包括故障名称和/或故障编号。
进一步,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述基于所述实时运行数据的故障类型对所述实时运行数据进行特征提取得到待识别特征,包括:若所述实时运行数据的故障类型为所述单一故障或所述并发性复合故障,对所述实时运行数据小波变换得到的各小波分量进行特征提取,得到待识别特征;若所述实时运行数据的故障类型为所述时序性复合故障,对所述实时运行数据进行数据段划分,直至划分得到的各所述数据段对应的第二故障类型不包括所述时序性复合故障,对各所述数据段进行形态小波变换及特征提取,得到待识别特征。
进一步,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述对所述实时运行数据进行数据段划分,直至划分得到的各所述数据段对应的所述第二故障类型不包括所述时序性复合故障,包括:基于所述实时运行数据的时序关联系数将所述实时运行数据划分为预设比例的两段数据段;分别计算每个数据段的时序关联系数,当存在任意数据段的时序关联系数大于预设阈值时,对所述时序关联系数大于预设阈值的数据段再次基于所述时序关联系数进行数据段划分,直至划分得到的各所述数据段的时序关联系数均小于所述预设阈值。
进一步,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述对所述实时运行数据进行故障模式分析,以判断所述实时运行数据对应的第一故障类型,包括:对所述实时运行数据进行形态小波变换,得到多个小波分量,计算各所述小波分量对应的模态混叠系数和归一化后的平均值;当存在任一所述小波分量的所述模态混叠系数小于所述归一化后的平均值时,确定所述第一故障类型为复合故障,否则确定所述第一故障类型为单一故障。
进一步,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述计算各所述小波分量对应的模态混叠系数和归一化后的平均值,包括:基于各所述小波分量中的数据数量、中位数和相邻数据之间的差值及和值得到各所述小波分量对应的模态混叠系数;基于各所述小波分量中的最小值、最大值及数据数量得到各所述小波分量对应的归一化后的平均值。
进一步,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述对所述实时运行数据进行关联性分析,以判断所述实时运行数据对应的第二故障类型,包括:计算所述实时运行数据的时序关联系数;当所述时序关联系数小于预设阈值时,确定所述第二故障类型为所述并发性复合故障;当所述时序关联系数大于等于所述预设阈值时,确定所述第二故障类型为时序性复合故障。
进一步,本发明实施例提供了第一方面的第六种可能的实施方式,其中,所述计算所述实时运行数据的时序关联系数,包括:基于所述实时运行数据、所述实时运行数据的转置、所述实时运行数据的时序差分序列、所述实时运行数据的采样步长及所述实时运行数据中的均值、最大值和最小值得到所述实时运行数据的时序关联系数。
进一步,本发明实施例提供了第一方面的第七种可能的实施方式,其中,所述基于所述待识别特征进行故障识别,得到故障诊断结果,包括:将所述待识别特征输入预先训练得到的故障诊断模型中,得到所述故障诊断结果;其中,所述故障诊断结果包括故障编号和/或故障名称,所述故障诊断模型基于标注有故障编号和/或故障名称的历史运行数据训练得到。
第二方面,本发明实施例提供了一种半导体工艺设备的故障诊断系统,包括:控制器,所述控制器用于执行如第一方面任一项所述的方法。
第三方面,本发明实施例提供了一种半导体工艺设备,包括:立式炉机组和第二方面所述的故障诊断系统,所述故障诊断系统用于对所述立式炉机组进行故障诊断。
本发明实施例提供了一种半导体工艺设备的故障诊断方法及系统,该半导体工艺设备的故障诊断方法包括:获取目标设备的实时运行数据;对实时运行数据进行故障模式分析,以判断实时运行数据对应的第一故障类型;其中,第一故障类型包括单一故障和复合故障;若第一故障类型为复合故障,对实时运行数据进行关联性分析,以判断实时运行数据对应的第二故障类型;其中,第二故障类型包括并发性复合故障和时序性复合故障;基于实时运行数据的故障类型对实时运行数据进行特征提取得到待识别特征;基于待识别特征进行故障识别,得到故障诊断结果;其中,故障诊断结果包括故障名称和/或故障编号。本发明通过依次判断机组的实时运行数据对应的第一故障类型和第二故障类型,对机组进行了分层故障判断,能够对设备的复合故障类型进行诊断;由于现有故障诊断技术通过判断关键参数是否超出阈值进行故障诊断,而机组参数容易因工作环境影响产生脉冲式突变,进而容易导致出现误诊断现象,本实施例通过基于对机组的实时运行数据提取出的特征进行故障诊断,不会受到机组工作环境的影响,能够避免出现故障误诊断现象,同时能够快速识别出机组的故障名称和/或故障编号,实现了对故障位置的快速锁定,在保证故障诊断效率的基础上,提升了设备的故障检测准确率。
本发明实施例的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本发明实施例的上述技术即可得知。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了一种立式炉机组的相关故障诊断方法流程图;
图2示出了本发明实施例所提供的一种故障诊断方法流程图;
图3示出了本发明实施例所提供的一种故障诊断模型建立流程图;
图4示出了本发明实施例所提供的一种立式炉机组在线故障诊断流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
在半导体装备制造领域的相关技术中,半导体工艺设备的在线故障诊断方法通常为阈值判断法,参见如图1所示的立式炉机组的相关故障诊断方法流程图,针对立式炉机组的各关键参数设置不同的阈值范围,读取机组实时运行数据,判断实时运行数据是否超出阈值,如果是,发出故障警报并保护停机,如果否,返回执行读取机组实时运行数据的步骤。现有的故障诊断方式主要存在以下缺点:
1、受设备工作环境的影响较大,诸如立式炉机组的信号采集装置存在一定的误差,若机组工作于振动的环境中会导致处于正常状态下的相关参数产生脉冲式突变,进而出现误报或漏报等错误诊断现象,降低了故障诊断准确率;
2、现有的故障诊断方式无法处理设备的复合故障,由于复合故障的时序性和并发性会掩盖故障信息,数据变化趋势并未改变,很少引起关键参数突变,因此,现有的故障诊断方式无法判断其是否超出阈值,也无法诊断出复合故障类型;
3、现有的故障诊断方式没有充分利用数据知识库,即便一个故障多次发生,每次只能简单诊断出机组存在故障,无法第一时间锁定故障部位,延误了后续的维修和容错控制等措施。
为改善上述问题,本发明实施例提供了一种半导体工艺设备的故障诊断方法及系统,以下对本发明实施例进行详细介绍。
本实施例提供了一种故障诊断方法,该方法可以应用于半导体工艺设备,参见图2所示的故障诊断方法流程图,该方法主要包括以下步骤:
步骤S202,获取目标设备的实时运行数据。
基于预设的采样间隔采集目标设备的实时运行数据。上述目标设备可以是任意需要进行故障诊断的设备,诸如可以是半导体工艺设备。上述实时运行数据的数据类型可以包括可编程逻辑控制器(Programmable Logic Controller,PLC)运行数据、温度数据、压力数据、流量传感器运行数据、火焰探测器运行数据和执行器运行数据中的任意一种或多种。
步骤S204,对实时运行数据进行故障模式分析,以判断实时运行数据对应的第一故障类型。
上述第一故障类型包括单一故障和复合故障。基于变换分析算法(诸如可以是小波变换算法)对实时运行数据进行故障模式分析,判断实时运行数据的数据之间的相关性,根据数据之间的相关性判断实时运行数据对应的故障类型为单一故障(该单一故障包括机组不存在故障时的正常状态)还是复合故障,当数据之间的相关性较大时,存在复合故障的可能性较大,当数据之间的相关性较小时,存在单一故障的可能性较大。
在一种具体的实施方式中,可以对实时运行数据进行形态小波变换,得到多个小波分量,基于得到的多个小波分量判断该实时运行数据对应的故障类型为单一故障还是复合故障。
步骤S206,若第一故障类型为复合故障,对实时运行数据进行关联性分析,以判断实时运行数据对应的第二故障类型。
上述第二故障类型(即复合故障的故障类型)包括并发性复合故障和时序性复合故障,若第一故障类型为复合故障,进一步判断复合故障的故障类型,可以采用时序卷积检验对实时运行数据进行时序关联性分析,或者采用穷举法对实时运行数据进行因果关联性分析,以判断实时运行数据的第二故障类型是并发性复合故障还是时序性复合故障。
在一种实施方式中,可以对实时运行数据进行时序卷积检验计算实时运行数据的时序关联系数,当该时序关联系数较小时,表明数据之间不存在因果关系,判定实时运行数据对应的复合故障的故障类型为并发性复合故障;当该时序关联系数较大时,表明数据之间存在因果关系,判定实时运行数据对应的复合故障的故障类型为时序性复合故障。
在另一种实施方式中,可以采用穷举法进行复合故障判断,对复合故障发生之后出现的两处明显故障进行因果关联性分析,查找是否存在与其中一种明显故障的因果关联性较大,能够导致该明显故障发生的故障,若存在即确定复合故障类型为时序性复合故障,若不存在则该两处明显故障为并发性复合故障。
步骤S208,基于实时运行数据的故障类型对实时运行数据进行特征提取得到待识别特征。
当判断得到的实时运行数据的故障类型不同时,对应的特征提取方式也不相同,若实时运行数据对应的故障类型为单一故障或并发性复合故障,由于该故障包括单一故障或多个不相关的单一故障,可直接对实时运行数据变换分析得到的分量进行特征提取;若实时运行数据对应的故障类型为时序性复合故障,由于该故障包括多个相互关联的单一故障,需要先将实时运行数据分解为多个单一故障对应的数据段,再对各数据段进行特征提取,将提取到的特征记为待识别特征,待识别特征为单一故障对应的特征或多个不相关的单一故障对应的特征。
步骤S210,基于待识别特征进行故障识别,得到故障诊断结果。
基于预设的分类算法对待识别特征进行故障识别分类,或者基于历史数据库中预先提取到的已知故障的特征对待识别特征进行故障识别,得到目标设备的故障诊断结果,该诊断结果包括故障名称和/或故障编号,故障名称和/或故障编号能够体现出机组的具体故障位置及具体故障信息,诸如当上述目标设备为立式炉机组时,得到的故障诊断结果可以包括炉膛温度异常、机械手卡滞、晶圆磨损、加热带折断、气路截止阀卡死、管道内部泄露、软件通讯故障、电源供压不足及射频源失效等故障。上述预设的分类算法可以包括朴素贝叶斯、逻辑回归、决策树、随机森林和支持向量机中的任意一种。
本实施例提供的上述半导体工艺设备的故障诊断方法,通过依次判断机组的实时运行数据对应的第一故障类型和第二故障类型,对机组进行了分层故障判断,能够对机组的复合故障进行诊断,通过基于对机组的实时运行数据提取出的特征进行故障诊断,实现了对实时运行数据的整体性分析,使实时运行数据中的部分脉冲式突变点难以对故障识别结果产生影响,避免了诊断错误导致的误报警情况,提升了机组的故障检测准确率,且根据故障诊断结果中的故障名称和/或故障编号可以快速排查故障位置,提升了故障诊断效率,能够避免延误后续的维修和容错控制等措施。
在一个实施例中,为了提升第一故障类型判断的准确性,本实施例提供了对所述实时运行数据进行故障模式分析判断所述实时运行数据对应的第一故障类型的实施方式,具体可参照如下步骤(1)~步骤(2)执行:
步骤(1):对实时运行数据进行形态小波变换,得到多个小波分量,计算各小波分量对应的模态混叠系数和归一化后的平均值。
以PLC为例,设目标设备的实时运行数据为X=[x1,x2,……,xn],n为运行数据个数,对实时运行数据X进行形态小波变换,得到m个小波分量[Q1,Q2,……,Qm],其中,Qi=[qi1,qi2,……,qin],i={1,2,……,m},计算每个小波分量的模态混叠系数和归一化后的平均值。
在一种具体的实施方式中,基于各小波分量中的数据数量、中位数和相邻数据之间的差值及和值得到各小波分量对应的模态混叠系数;具体地,第i个小波分量Qi的模态混叠系数的计算算式可以为:
基于各小波分量中的最小值、最大值及数据数量得到各小波分量对应的归一化后的平均值,具体地,归一化后的平均值的计算算式可以为:
其中,αi为第i个小波分量Qi的模态混叠系数,为归一化后的平均值,Qi为第i个小波分量,Qi=[qi1,qi2,……,qin],i={1,2,……,m},j={1,2,……,n},q′i为第i个小波分量Qi的中位数,max(Qi)为Qi中的最大值,min(Qi)为Qi中的最小值。
步骤(2):当存在任一小波分量的模态混叠系数小于归一化后的平均值时,确定第一故障类型为复合故障,否则确定第一故障类型为单一故障。
若存在表明存在小波分量的模态混叠系数小于归一化后的平均值,模态混叠系数较小,数据之间的相关性较大,数据彼此之间接近,确定实时运行数据的第一故障类型为复合故障,需要进一步判断复合故障的故障类型;若不存在/>表明数据之间的相关性较小,数据彼此之间差距较大,不存在混叠现象,确定实时运行数据的第一故障类型为单一故障。
由于相关的故障诊断方法是通过判断关键参数是否超出阈值进行故障诊断的,而复合故障的时序性和并发性会掩盖故障信息,运行数据变化趋势并未改变,很少引起关键运行参数产生突变,相关的故障诊断方法无法判断运行数据是否超出阈值,进而无法对复合故障进行故障诊断。
为了准确诊断出设备的复合故障类型,本实施例提供了对实时运行数据进行时序关联性分析判断实时运行数据对应的第二故障类型的实施方式,具体可参照如下步骤1)~步骤3)执行:
步骤1):计算实时运行数据的时序关联系数。
计算实时运行数据的时序相关性,时序相关性越大,数据之间的因果关联性越大,第二故障类型为时序性复合故障的可能性越大。
在一种具体的实施方式中,基于实时运行数据、实时运行数据的转置、实时运行数据的时序差分序列、实时运行数据的采样步长及实时运行数据中的均值、最大值和最小值得到实时运行数据的时序关联系数,具体地,上述时序关联系数的计算算式可以为:
其中,β为时序关联系数,X为实时运行数据,X=[x1,x2,……,xn],XT为X的转置,ΔX为X的时序差分序列,E(ΔX)为序列ΔX的数学期望值,xmean为X的均值,max(X)为X中的最大值,min(X)为X中的最小值,d为实时运行数据的采样步长(即采样间隔)。
步骤2):当时序关联系数小于预设阈值时,确定第二故障类型为并发性复合故障。
上述时序关联系数的取值范围为[0,1],上述预设阈值的取值可以是0.5。当实时运行数据的时序关联系数较小时,表明数据之间没有因果关系,确定实时运行数据的复合故障类型为并发性复合故障。
步骤3):当时序关联系数大于等于预设阈值时,确定第二故障类型为时序性复合故障。
当实时运行数据的时序关联系数较大时,表明数据之间具有因果关系,确定实时运行数据的复合故障类型为时序性复合故障。通过根据实时运行数据的时序关联系数判断第二故障类型,可以诊断出机组的复合故障类型,提升了故障诊断的精确度。
目前,应用于立式炉机组的相关故障诊断技术大多以基于阈值判断的运行状态监测为主,受机组工作环境影响较大,且由于机组的信号采集装置存在一定的误差,振动的工作环境会导致机组在正常状态下的相关参数产生脉冲式突变,进而出现误报、漏报等错误诊断现象。
本实施例提供了基于实时运行数据的故障类型对实时运行数据进行特征提取得到待识别特征的实施方式,具体可参照如下步骤a~步骤b执行:
步骤a,若实时运行数据的故障类型为单一故障或并发性复合故障,对实时运行数据小波变换得到的各小波分量进行特征提取,得到待识别特征。
若实时运行数据的故障类型为单一故障,对上述步骤(2)中实时运行数据经过形态小波变换得到的各小波分量进行特征提取,得到待识别特征。
若实时运行数据的故障类型为并发性复合故障,对实时运行数据进行形态经验小波变换得到多个小波分量,对各小波分量进行特征提取,得到待识别特征。
步骤b,若实时运行数据的故障类型为时序性复合故障,对实时运行数据进行数据段划分,直至划分得到的各数据段对应的第二故障类型不包括时序性复合故障,对各数据段进行形态小波变换及特征提取,得到待识别特征。
将实时运行数据划分为预设比例的两段数据段,对每段数据分别进行时序卷积检验判断对应的故障类型是否为时序性复合故障,如果存在数据段的故障类型为时序性复合故障,继续对故障类型为时序性复合故障的数据段进行数据段划分,直至划分得到的数据段对应的故障类型均为单一故障,对各数据段进行形态小波变换,得到多个小波分量,对各小波分量进行特征提取,将提取到的特征记为待识别特征。
在一种具体的实施方式中,基于实时运行数据的时序关联系数将实时运行数据划分为预设比例的两段数据段;分别计算每个数据段的时序关联系数,当存在任意数据段的时序关联系数大于预设阈值时,对时序关联系数大于预设阈值的数据段再次基于时序关联系数进行数据段划分,直至划分得到的各数据段的时序关联系数均小于预设阈值。
上述时序关联系数为β时,预设比例可以是β:(1-β),按照β:(1-β)的比例将实时运行数据划分为两个数据段,分别计算每个数据段的时序关联系数βk,若存在任意一个数据段的时序关联系数βk>0.5,对βk>0.5的数据段继续按照βk:(1-βk)的比例划分为两个数据段,直至每个数据段的时序关联系数均小于预设阈值,即每个数据段对应的故障类型均为单一故障。
对最终划分得到的每个数据段分别进行形态小波变换,再对得到的小波分量进行特征提取,将提取到的特征记为待识别特征。
在一种具体的实施方式中,上述从各小波分量中提取到的待识别特征可以包括模糊熵、交叉熵、信息熵、奇异值熵和2-范数五个特征。
本实施例通过对实时运行数据进行模态混叠及时序关联等整体性分析,使所采集的运行数据中存在的部分脉冲式突变点难以对故障诊断结果产生较大影响,一定程度上不受设备工作环境的影响,降低了误报率和漏报率的现象。
此外,相关故障诊断方法中没有充分利用数据知识库,即便一个故障多次发生,每次仅能简单诊断出机组存在故障,无法第一时间锁定故障部位,从而延误了后续的维修工作,影响了设备生产进度。
在一个实施例中,为了提升故障诊断效率,本实施例提供了基于待识别特征进行故障识别,得到故障诊断结果的具体实施方式:将待识别特征输入预先训练得到的故障诊断模型中,得到故障诊断结果;其中,故障诊断结果包括故障编号和/或故障名称,故障诊断模型基于标注有故障编号和/或故障名称的历史运行数据训练得到。
上述历史运行数据包括预先从目标设备上采集到的正常状态下以及各单一故障状态下的运行数据,该历史运行数据的采样间隔与在线故障诊断时实时运行数据的采样间隔相等。基于加权孪生支持向量机(Weighted Twin Support Vector Machine,WTWSVM)离线建立故障诊断模型,对上述历史运行数据进行形态小波变换得到若干小波分量,再对各小波分量进行特征提取,将提取的特征划分为训练集和测试集,设置最大训练次数和分类误差上限,将训练集输入故障诊断模型中进行模型训练,每次训练中先进行前向传播更新模型参数,训练误差再进行反向传播,直至达到最大训练次数,再基于测试集测试训练结果,当测试得到的分类误差小于分类误差上限时,得到训练后的故障诊断模型。
将提取到的待识别特征输入预先训练得到的故障诊断模型中进行故障决策分类,得到故障诊断结果。上述故障诊断模型是基于单一故障的运行数据训练得到,故障诊断模型可以识别出各待识别特征对应的单一故障名称,由于并发性复合故障和时序性复合故障包括多个单一故障,因此,当上述实时运行数据对应的故障类型为并发性复合故障或时序性复合故障时,上述故障诊断结果包括多个故障编号和/或故障名称。
在另一种实施方式中,可以为两两单一故障组合设置对应的故障编号,使上述故障诊断结果包括一个故障编号(该故障编号对应多个单一故障的编号)和/或多个故障名称。
本实施例通过利用设备的历史运行数据训练故障诊断模型,使故障诊断模型能够明确输出实时运行数据对应的故障名称和/或故障编号,提升了故障诊断效率,从而可以快速排查故障位置,方便进行后续的故障维修以及容错控制等措施,避免影响设备生产进度。
示例性的,本实施例提供了应用上述故障诊断方法对立式炉机组进行故障诊断的案例:
建立故障诊断模型的案例:参见如下表一所示的故障名称与故障编号对应关系表,在立式炉机组的运行数据库中获取9种单一故障和正常状态下的历史运行数据各100组,针对每组运行数据都进行形态小波变换,再进行特征提取,则每组数据均包含5个数据点(即模糊熵、交叉熵、信息熵、奇异值熵和2-范数五个特征),按照7:3的比例划分训练集和测试集,训练集包括700组(每种单一故障和正常状态各70组),测试集包括300组(每种单一故障和正常状态各30组)。训练集用于建模过程中故障诊断模型的模型训练,测试集则用于测试故障诊断模型是否满足分类误差要求。
表一故障名称与故障编号对应关系表
立式炉机组在线诊断的案例:
参见如下表二所示的在线诊断故障案例表,分别提供了单一故障、并发性复合故障和时序性复合故障的故障诊断案例,如下表二所示,时序性复合故障为机械手卡滞F2及晶圆磨损F3时,对应的故障编号即可以是F2+F3,也可以是机械手卡滞及晶圆磨损两个单一故障组合为时序性复合故障时对应的新的故障编号TF1;并发性复合故障为加热带折断F4及气路截止阀卡死F5时,对应的故障编号即可以是F4+F5,也可以是加热带折断及气路截止阀卡死两个单一故障组合为并发性复合故障时对应的新的故障编号MF1。
表二在线诊断故障案例表
故障名称 故障类型 故障编号
炉膛温度异常 单一故障 F1
机械手卡滞及晶圆磨损 时序性复合故障 F2+F3或TF1
加热带折断及气路截止阀卡死 并发性复合故障 F4+F5或MF1
第1种情况,立式炉机组发生了单一故障,以F1故障为例,在线诊断流程:采集立式炉机组当前的实时运行数据,对实时运行数据进行故障模式分析判断故障类型为单一故障还是复合故障,若得到机组发生了单一故障,对实时运行数据形态小波变换得到的小波分量进行特征提取,将提取到的待识别特征输入训练后的故障诊断模型中进行故障决策分类,得到故障诊断结果(正确诊断结果为炉膛温度异常和/或F1,其余皆为错误诊断结果)。
第2种情况,立式炉机组发生了时序性复合故障,以TF1故障为例,在线诊断流程:采集立式炉机组当前的实时运行数据,对实时运行数据进行故障模式分析判断故障类型为单一故障还是复合故障,若得到机组发生了复合故障,对实时运行数据进行时序卷积检验判断故障类型为并发性复合故障还是时序性复合故障,若判定机组发生了时序性复合故障,基于时序关联系数对实时运行数据进行数据段划分,直至各数据段的时序关联系数均小于预设阈值,对划分得到的各数据段都进行形态小波变换,再进行特征提取,将每个数据段提取到的特征依次输入训练后的故障诊断模型中进行故障决策分类,得到故障诊断结果(正确诊断结果为机械手卡滞及晶圆磨损和/或TF1(或F2+F3),TF1包括机械手卡滞和晶圆磨损两种单一故障,其余皆为错误诊断结果)。
第3种情况,立式炉机组发生了并发性复合故障,以MF1故障为例,在线诊断流程:采集立式炉机组当前的实时运行数据,对实时运行数据进行故障模式分析判断故障类型为单一故障还是复合故障,若得到机组发生了复合故障,对实时运行数据进行时序卷积检验判断故障类型为并发性复合故障还是时序性复合故障,若判定机组发生了并发性复合故障,对实时运行数据进行形态经验小波变换,再进行特征提取,将提取到的特征输入训练后的故障诊断模型中进行故障决策分类,得到故障诊断结果(正确诊断结果为加热带折断及气路截止阀卡死和/或MF1(或F4+F5),MF1包括加热带诊断和气路截止阀卡死两种单一故障,其余皆为错误诊断结果)。
在前述实施例的基础上,本实施例提供了一种应用前述故障诊断方法对立式炉机组进行在线故障诊断的示例,具体可参照如下步骤一~步骤二执行:
步骤一,离线建立故障诊断模型。
参见如图3所示的故障诊断模型建立流程图,故障诊断模型的建立可参照如下步骤301~步骤307执行:
步骤301,对历史运行数据进行形态小波变换(Morphological WaveletTransform,MWT),得到若干小波分量,再对各小波分量进行特征提取。
所提取的特征包括:模糊熵、交叉熵、信息熵、奇异值熵和2-范数五个特征。
步骤302,将提取到的特征划分为训练集和测试集。
上述训练集和测试集的划分比例可以是7:3。
步骤303,设定最大训练次数和分类误差上限ES,初始化模型参数。
为保证故障诊断模型的精度,上述最大训练次数可以设置为1000~4000,分类误差上限低于0.01。
步骤304,将训练集输入故障诊断模型,自适应分配权重,先前向传播,更新模型参数,训练误差再反向传播。
步骤305,判断是否达到最大训练次数,如果是,执行步骤306,如果否,返回执行步骤304。
步骤306,使用测试集测试当前训练结果,记分类误差为ED
步骤307,判断分类误差为ED是否满足ED<ES,若ED<ES,输出当前训练结果为故障诊断模型,否则返回执行步骤303,直到满足误差要求。
步骤二,在线故障诊断。
为应对单一故障和不同形式的复合故障,本实施例提供的在线故障诊断方法基于层次分析的思想,针对机组的实时运行数据进行参数计算及信号变换等操作,确定当前故障类型之后,再结合故障诊断模型得到明确的诊断结果。参见如图4所示的立式炉机组在线故障诊断流程图,在线诊断的详细流程可参照如下步骤执行:
步骤401,按照设定的采样间隔采集立式炉机组的实时运行数据,对实时运行数据进行形态小波变换,计算各小波分量的模态混叠系数αi及各小波分量归一化后的平均值
上述实时运行数据的采样间隔与离线建模时历史运行数据的采样间隔保持一致。
步骤402,判断是否存在如果是,执行步骤403,如果否,执行步骤404。/>
步骤403,判定故障类型为复合故障,进行时序卷积检验,计算实时运行数据的时序关联系数β。
步骤404,判定故障类型为单一故障,对各小波分量进行特征提取,然后执行步骤410。
所提取的特征有:模糊熵、交叉熵、信息熵、奇异值熵和2-范数。
步骤405,判断是否满足β<0.5,如果是,执行步骤406,如果否,执行步骤407。
步骤406,判定故障类型为并发性复合故障,对实时运行数据进行形态经验小波变换,对各小波分量进行特征提取,然后执行步骤410。
步骤407,判定故障类型为时序性复合故障,按照β:(1-β)的比例将实时运行数据划分为两个数据段,分别计算每个数据段的时序关联系数βk
步骤408,若存在任意一个数据段的时序关联系数βk>0.5,对βk>0.5的数据段继续进行数据段划分,直至每个数据段的时序关联系数均小于0.5。
步骤409,对划分后的每个数据段都进行形态小波变换,再对小波分量进行特征提取。
步骤410,将提取到的特征输入离线建立的故障诊断模型中进行故障决策分量,得到故障诊断结果。
对应于前述实施例所提供的方法,本发明实施例还提供了一种半导体工艺设备的故障诊断系统,该系统包括:控制器,该控制器用于执行上述实施例提供的半导体工艺设备的故障诊断方法。上述半导体工艺设备诸如可以包括立式炉机组。
对应于前述实施例所提供的系统,本发明实施例还提供了一种半导体工艺设备,包括:立式炉机组和上述实施例提供的故障诊断系统,该故障诊断系统用于对立式炉机组进行故障诊断。
本发明实施例提供了一种计算机可读介质,其中,所述计算机可读介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使所述处理器实现上述实施例所述的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。
本发明实施例所提供的半导体工艺设备的故障诊断方法及系统的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种半导体工艺设备的故障诊断方法,其特征在于,包括:
获取目标设备的实时运行数据;
对所述实时运行数据进行故障模式分析,以判断所述实时运行数据对应的第一故障类型;其中,所述第一故障类型包括单一故障和复合故障;
若所述第一故障类型为所述复合故障,对所述实时运行数据进行关联性分析,以判断所述实时运行数据对应的第二故障类型;其中,所述第二故障类型包括并发性复合故障和时序性复合故障;
基于所述实时运行数据的故障类型对所述实时运行数据进行特征提取得到待识别特征;
基于所述待识别特征进行故障识别,得到故障诊断结果;其中,所述故障诊断结果包括故障名称和/或故障编号。
2.根据权利要求1所述的方法,其特征在于,所述基于所述实时运行数据的故障类型对所述实时运行数据进行特征提取得到待识别特征,包括:
若所述实时运行数据的故障类型为所述单一故障或所述并发性复合故障,对所述实时运行数据小波变换得到的各小波分量进行特征提取,得到待识别特征;
若所述实时运行数据的故障类型为所述时序性复合故障,对所述实时运行数据进行数据段划分,直至划分得到的各所述数据段对应的第二故障类型不包括所述时序性复合故障,对各所述数据段进行形态小波变换及特征提取,得到待识别特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述实时运行数据进行数据段划分,直至划分得到的各所述数据段对应的所述第二故障类型不包括所述时序性复合故障,包括:
基于所述实时运行数据的时序关联系数将所述实时运行数据划分为预设比例的两段数据段;
分别计算每个数据段的时序关联系数,当存在任意数据段的时序关联系数大于预设阈值时,对所述时序关联系数大于预设阈值的数据段再次基于所述时序关联系数进行数据段划分,直至划分得到的各所述数据段的时序关联系数均小于所述预设阈值。
4.根据权利要求1所述的方法,其特征在于,所述对所述实时运行数据进行故障模式分析,以判断所述实时运行数据对应的第一故障类型,包括:
对所述实时运行数据进行形态小波变换,得到多个小波分量,计算各所述小波分量对应的模态混叠系数和归一化后的平均值;
当存在任一所述小波分量的所述模态混叠系数小于所述归一化后的平均值时,确定所述第一故障类型为复合故障,否则确定所述第一故障类型为单一故障。
5.根据权利要求4所述的方法,其特征在于,所述计算各所述小波分量对应的模态混叠系数和归一化后的平均值,包括:
基于各所述小波分量中的数据数量、中位数和相邻数据之间的差值及和值得到各所述小波分量对应的模态混叠系数;
基于各所述小波分量中的最小值、最大值及数据数量得到各所述小波分量对应的归一化后的平均值。
6.根据权利要求1所述的方法,其特征在于,所述对所述实时运行数据进行关联性分析,以判断所述实时运行数据对应的第二故障类型,包括:
计算所述实时运行数据的时序关联系数;
当所述时序关联系数小于预设阈值时,确定所述第二故障类型为所述并发性复合故障;
当所述时序关联系数大于等于所述预设阈值时,确定所述第二故障类型为时序性复合故障。
7.根据权利要求6所述的方法,其特征在于,所述计算所述实时运行数据的时序关联系数,包括:
基于所述实时运行数据、所述实时运行数据的转置、所述实时运行数据的时序差分序列、所述实时运行数据的采样步长及所述实时运行数据中的均值、最大值和最小值得到所述实时运行数据的时序关联系数。
8.根据权利要求1所述的方法,其特征在于,所述基于所述待识别特征进行故障识别,得到故障诊断结果,包括:
将所述待识别特征输入预先训练得到的故障诊断模型中,得到所述故障诊断结果;其中,所述故障诊断结果包括故障编号和/或故障名称,所述故障诊断模型基于标注有故障编号和/或故障名称的历史运行数据训练得到。
9.一种半导体工艺设备的故障诊断系统,其特征在于,包括:控制器;
所述控制器,用于执行如权利要求1至8任一项所述的方法。
10.一种半导体工艺设备,其特征在于,包括:立式炉机组和权利要求9所述的故障诊断系统;
所述故障诊断系统用于对所述立式炉机组进行故障诊断。
CN202211446654.8A 2022-11-18 2022-11-18 半导体工艺设备的故障诊断方法及系统 Pending CN118057185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211446654.8A CN118057185A (zh) 2022-11-18 2022-11-18 半导体工艺设备的故障诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211446654.8A CN118057185A (zh) 2022-11-18 2022-11-18 半导体工艺设备的故障诊断方法及系统

Publications (1)

Publication Number Publication Date
CN118057185A true CN118057185A (zh) 2024-05-21

Family

ID=91068688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211446654.8A Pending CN118057185A (zh) 2022-11-18 2022-11-18 半导体工艺设备的故障诊断方法及系统

Country Status (1)

Country Link
CN (1) CN118057185A (zh)

Similar Documents

Publication Publication Date Title
Fan et al. Data-driven approach for fault detection and diagnostic in semiconductor manufacturing
CN107111311B (zh) 利用稀疏编码方法的燃气涡轮机传感器故障检测
Yang et al. Bayesian Belief Network-based approach for diagnostics and prognostics of semiconductor manufacturing systems
CN115034248A (zh) 用于设备的自动诊断方法、系统和存储介质
CN112629585A (zh) 基于多维参数估计的设备在线监测方法及装置
Li et al. A novel diagnostic and prognostic framework for incipient fault detection and remaining service life prediction with application to industrial rotating machines
CN107562696B (zh) 轮胎产品质量在线检测与控制方法
CN109073508B (zh) 测试涡轮单元期间的故障诊断
WO2006110246A2 (en) Diagnostic and prognostic method and system
WO2016040085A1 (en) Gas turbine failure prediction utilizing supervised learning methodologies
KR20100054816A (ko) 결함 패턴 매칭을 위한 퍼지 분류 접근
EP3105644A1 (en) Method of identifying anomalies
CN110083593B (zh) 电站运行参数清洗及修复方法、修复系统
KR102174223B1 (ko) 시스템에서의 하나 이상의 결함을 특징화하는 방법
CN112000081B (zh) 基于多块信息提取和马氏距离的故障监测方法及系统
WO2020166236A1 (ja) 作業効率評価方法、作業効率評価装置、及びプログラム
CN111275136B (zh) 基于小样本下的故障预测系统及其预警方法
KR102366922B1 (ko) 시계열적 절연 진단 정보 기반의 중전기기 열화 예측 시스템 및 그 방법
Jiang et al. Partial cross mapping based on sparse variable selection for direct fault root cause diagnosis for industrial processes
CN117278591A (zh) 基于云平台的园区异常报警系统
CN113313365A (zh) 一种一次风机的劣化预警方法及设备
Zhang et al. Distributed quality-related process monitoring framework using parallel DVIB-VAE-mRMR for large-scale processes
CN118057185A (zh) 半导体工艺设备的故障诊断方法及系统
Yu et al. Using minimum quantization error chart for the monitoring of process states in multivariate manufacturing processes
Shen et al. Fault root cause diagnosis method based on recurrent neural network and Granger causality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination