CN117033912A - 一种设备故障预测方法、装置、可读存储介质及电子设备 - Google Patents

一种设备故障预测方法、装置、可读存储介质及电子设备 Download PDF

Info

Publication number
CN117033912A
CN117033912A CN202311282404.XA CN202311282404A CN117033912A CN 117033912 A CN117033912 A CN 117033912A CN 202311282404 A CN202311282404 A CN 202311282404A CN 117033912 A CN117033912 A CN 117033912A
Authority
CN
China
Prior art keywords
feature
extracting
characteristic
fault
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311282404.XA
Other languages
English (en)
Other versions
CN117033912B (zh
Inventor
徐永刚
孙成思
何瀚
王灿
谭尚庚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Statan Testing Technology Co ltd
Original Assignee
Chengdu Statan Testing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Statan Testing Technology Co ltd filed Critical Chengdu Statan Testing Technology Co ltd
Priority to CN202311282404.XA priority Critical patent/CN117033912B/zh
Publication of CN117033912A publication Critical patent/CN117033912A/zh
Application granted granted Critical
Publication of CN117033912B publication Critical patent/CN117033912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种设备故障预测方法、装置、可读存储介质及电子设备,通过抽取设备的特征信号后,根据特征信号中的特征类型选择不同的特征提取方法,并基于不同的特征提取方法提取特征信号中的不同特征,即能够针对不同故障特征使用与故障特征相适应的特征提取方法进行提取,实现对故障特征的二次处理,从而提取出特征高度集合的训练样本,再通过将训练样本输入机器学习分类算法中进行数据挖掘,建立具有精确输入和输出关系的故障预测模型,从而通过建立的故障预测模型结合待预测的设备特征信号实现对设备故障精确预测的目的。

Description

一种设备故障预测方法、装置、可读存储介质及电子设备
技术领域
本发明涉及设备故障预测技术领域,特别是涉及一种设备故障预测方法、装置、可读存储介质及电子设备。
背景技术
随着人工智能产业的快速发展,半导体的需求量也逐渐增加。在半导体生产过程中需要通过多种设备配合进行生产。如其中包括用于从治具中吸取芯片的吸取设备。而在生产过程中,由于人为因素或环境因素的影响,吸取设备不可避免地将发生不同类型的故障。其中,典型的故障类型包括:吸嘴磨损、吸嘴堵塞、吸杆松动和真空发生器损坏四种故障。故障发生后可能导致流程中断,甚至破坏整个生产链。因此,故障的提前预测和分类对于工业安全具有重要意义。
目前,现有的故障预测技术通常是利用机器学习对采集到的故障特征值进行分类训练。如通过支持向量机对有故障或没有故障两种类型进行分类,而对于多故障类型的分类,则支持向量机的求解需要多个两类支持向量机的组合完成,导致计算量复杂化。并且,现有的机器学习泛化能力弱,无法对新添加的数据集做出合理的响应和处理,导致计算增大影响故障的预测速度与精准度。同时,针对不同的故障类型无法从中提取出有效的特征值进行分类训练,进一步导致分类训练结果不佳,无法实现精确的故障识别与预测效果。
发明内容
本发明所要解决的技术问题是:提供一种设备故障预测方法、装置、可读存储介质及电子设备,提高对设备故障预测的准确度。
为了解决上述技术问题,本发明采用的技术方案为:
一种设备故障预测方法,包括步骤:
抽取预设个数时间节点,并提取所述时间节点上设备对应的特征信号;
根据所述特征信号中的特征类型选择至少一种特征提取方法;
通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;
将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;
获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
为了解决上述技术问题,本发明采用的另一技术方案为:
一种设备故障预测装置,包括:
抽取模块,用于抽取预设个数时间节点,并提取所述时间节点设备对应的特征信号;
选取模块,用于根据所述特征信号中的特征类型选择至少一种特征提取方法;
提取模块,用于通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;
训练模块,将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;
预测模块,用于获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
为了解决上述技术问题,本发明采用的另一技术方案为:
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种设备故障预测方法各个步骤。
为了解决上述技术问题,本发明采用的另一技术方案为:
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种设备故障预测方法中的各个步骤。
本发明的有益效果在于:通过抽取设备的特征信号后,根据特征信号中的特征类型选择不同的特征提取方法,并基于不同的特征提取方法提取特征信号中的不同特征,即能够针对不同故障特征使用与故障特征相适应的特征提取方法进行提取,实现对故障特征的二次处理,从而提取出特征高度集合的训练样本,再通过将训练样本输入机器学习分类算法中进行数据挖掘,建立具有精确输入和输出关系的故障预测模型,从而通过建立的故障预测模型结合待预测的设备特征信号实现对设备故障精确预测的目的。
附图说明
图1为本发明实施例中的一种设备故障预测方法的步骤流程图;
图2为本发明实施例中的一种设备故障预测方法的另一步骤流程图;
图3为本发明实施例中的一种设备故障预测方法中不同K值对应特征值的偏差图;
图4为本发明实施例中的一种设备故障预测方法中频段分层结构示意图;
图5为本发明实施例中的一种设备故障预测方法中底层节点各个频段能量占比图;
图6为本发明实施例中的一种设备故障预测方法中递归树结构示意图;
图7为本发明实施例中的一种设备故障预测方法中故障分析的线性函数计算结果图;
图8为本发明实施例中的一种设备故障预测装置的结构示意图;
图9为本发明实施例中的一种电子设备的结构示意图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种设备故障预测方法,包括步骤:
抽取预设个数时间节点,并提取所述时间节点设备对应的特征信号;
通过不同的特征提取方法提取所述特征信号中的不同特征,得到训练样本;
将所述训练样本输入机器学习分类模型进行训练,得到特征值以及特征值与故障的映射关系;
根据回归算法对所述特征值以及特征值与故障的映射关系进行拟合,得到故障预测模型;
获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
由上述描述可知,本发明的有益效果在于:通过抽取设备的特征信号后,根据特征信号中的特征类型选择不同的特征提取方法,并基于不同的特征提取方法提取特征信号中的不同特征,即能够针对不同故障特征使用与故障特征相适应的特征提取方法进行提取,实现对故障特征的二次处理,从而提取出特征高度集合的训练样本,再通过将训练样本输入机器学习分类算法中进行数据挖掘,建立具有精确输入和输出关系的故障预测模型,从而通过建立的故障预测模型结合待预测的设备特征信号实现对设备故障精确预测的目的。
进一步地,所述通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本包括:
通过主成分分析法提取所述特征信号中的时域特征,得到时域训练集,以及通过小波包变化法提取所述特征信号中的频域特征,得到频域训练集;
根据所述时域训练集以及所述频域训练集得到所述训练样本。
由上述描述可知,针对时域特征使用主成分分析法,将大量的时域特征特征数据降维成适合的维度大小,即减小的计算难度也保证了数据的有效性;而针对频率特征使用小波包变化法,利用了其局部频率特征分析的优势,实现同时对低频部分信号以及高频部分信号进行分解,能够进行更好的时频局部化分析,从而基于主成分分析法以及小波包变化法能够提取出特征高度集合的训练样本。
由上述描述可知,通过采取有放回地方式分别从时域训练集以及频域训练集中抽取预设个数的特征,使得抽取后的时域训练集以及频域训练集中的特征总数不变,从而能够执行多次抽取并基于多次抽取的训练样本进行模型训练,再从多次训练结果中选出最佳的预测模型,提高对设备故障的预测效果。
进一步地,所述通过主成分分析法提取所述特征信号中的时域特征,得到时域训练集包括:
将所述时域特征内的原始数据组成预设行列大小的原始矩阵;
对所述原始矩阵进行零均值化,得到零均值化矩阵;
计算所述零均值化矩阵对应的协方差矩阵;
计算所述协方差矩阵的特征值以及特征值对应的特征向量;
根据所述特征值的大小获取前预设个数的所述特征向量按行组成特征矩阵;
根据所述特征矩阵对所述原始矩阵进行降维,得到降维矩阵;
将所述降维矩阵作为所述时域训练集。
由上述描述可知,将时域特征内的原始数据组成预设行列大小的原始矩阵并对其进行零均值化后,依次计算得到零均值化后矩阵对应的协方差矩阵、协方差矩阵的特征值以及特征值对应的特征向量,再根据特征值的大小获取前预设个的所述特征向量按行组成特征矩阵,从而实现对特征的筛选以及冗余处理,保证数据的主要内容不会丢失的同时,降低了原始数据的数据量,提高特征提取的效率。
进一步地,所述通过小波包变化法提取所述特征信号中的频域特征,得到频域训练集包括:
获取数据采样频率、数据类型以及小波包变化法处理层数;
根据所述小波包变化法处理层数对所述数据采样频率进行处理,得到预设个数的子频率段;
提取各个所述子频率段对应的能量特征,并得到各个所述子频率段对应的能量占比;
根据所述数据类型选取能量占比最高的所述子频率段组合为所述频域训练集。
由上述描述可知,通过对数据采样频率进行预设层数的小波包变换法处理,将采样频率划分为多个子频率段,并分别对各个子频率段进行能量特征提取,得到各个子频率段的能量占比,再根据数据类型选取能量占比最高的子频率段组合为频域训练集,从而能够挑选出与故障最相关的子频率段,得到特征高度集合的训练样本,提高模型训练效果并提高预测精度。
进一步地,所述根据所述时域训练集以及所述频域训练集得到所述训练样本包括:
采取有放回地方式分别从所述时域训练集以及所述频域训练集中抽取预设个数的特征,组合得到训练样本。
进一步地,所述将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型包括:
通过决策树算法、支持向量机算法或随机森林算法对所述训练样本进行特征分类,得到特征值以及特征值与故障的映射关系;
根据回归算法对所述特征值以及特征值与故障的映射关系进行拟合,得到故障预测模型。
由上述描述可知,采用决策树算法、支持向量机算法或随机森林算法对训练样本进行特征分类,提供运行时间最短、预测精度最高等不同效果的分类模型,从而满足不同的应用场景下的不同需求,提高方法的实用性。
进一步地,所述根据回归算法对所述特征值以及特征值与故障的映射关系进行拟合,得到故障预测模型包括:
建立故障预测函数,将所述特征值作为函数自变量;
通过最小二乘法或梯度下降法计算所述特征值与故障的映射关系得到自变量变量系数;
根据所述自变量和所述自变量变量系数进行回归拟合,得到所述故障预测模型。
由上述描述可知,在得到特征值以及设备的各种故障与特征值之间的映射关系后,通过最小二乘法或梯度下降法计算特征值与故障的映射关系得到自变量变量系数,从而能够拟合出故障与特征之间的函数关系,起到根据输入的设备物理量数据精确预测设备故障的效果。
本发明另一实施例提供了一种设备故障预测装置,包括:
抽取模块,用于抽取预设个数时间节点,并提取所述时间节点设备对应的特征信号;
选取模块,用于根据所述特征信号中的特征类型选择至少一种特征提取方法;
提取模块,用于通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;
训练模块,将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;
预测模块,用于获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
本发明另一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的一种设备故障预测方法各个步骤。
本发明另一实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的一种设备故障预测方法中的各个步骤。
本发明上述设备故障预测方法、装置、计算机可读存储介质及电子设备能够适用于各种类型设备的故障预测,例如应用于对芯片吸取设备的故障预测,以下通过具体实施方式进行说明:
实施例一
请参照图1和图2,一种设备故障预测方法,包括步骤:
S1、抽取预设个数时间节点,并提取所述时间节点上设备对应的特征信号;具体的,在设备运行中以及设备报修后的时间段中随机抽取数个时间节点,并提取上下料机的特征信号以及相应时段设备对应的有无故障和故障种类标识;其中,样本数量抽取比例根据器学习精度要求和运算时间要求具体调整配置,如样本数量为抽样时间节点的10%;并且,样本数量可以根据机器学习精度要求调整配置,则将1600个时间节点作为机器学习输入,将其中的400组数据作为验证集;
S2、根据所述特征信号中的特征类型选择至少一种特征提取方法;其中,所述特征信号包括但不限于设备温度、压力、真空发生器的真空流量、空气消耗量、吸入口处压力、吸着响应时间、电机的电流和电压等参数;
在一可选的实施方式中,如针对有吸入口压力、空气消耗量、吸杆处摩擦力和真空流量四组数据的幅度的均值、方差、偏度、峰值、峰峰值等特征,则采用时域特征的提取方法;如针对有吸入口压力、空气消耗量、吸杆处摩擦力和真空流量四组数据的不同频率范围内的功率如低频范围10-20Hz的功率、中频范围40-60Hz的功率、高频范围内>100Hz的功率和光谱峰态峰值的频率等特征,则采用频域特征的提取方法;
S3、通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;在一可选的实施方式中,如需要同时提取时域特征以及频域特征,则分别通过主成分分析法提取所述特征信号中的时域特征,得到时域训练集,得到有吸入口压力、空气消耗量、吸杆处摩擦力和真空流量四组数据,每一组数据对应14种特性共计56组特性,共1600个时间节点数据作为学习集输入,并将其中的400组数据作为验证集;
以及通过小波包变化法提取所述特征信号中的频域特征,得到频域训练集;得到有吸入口压力、空气消耗量、吸杆处摩擦力和真空流量四组数据,每一组数据对应4种特性共计16组特性,共1600个时间节点数据作为学习集输入,将其中的400组数据作为验证集。
S4、将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;具体的,如针对吸取设备的故障进行故障检测,则构建吸取设备故障分类模型;其中,吸取设备通常包括吸嘴磨损、吸嘴堵塞、吸杆松动和真空发生器损坏四种故障;如为其他设备,则故障种类可根据设备关键部位或易出故障部位进行调研确定易发生故障种类;以吸取设备的故障类别为例,对故障进行阈值分割确定故障判定条件如下:
若吸嘴吸入口处压力小于0.08Mpa则视为吸嘴磨损,需要进行更换吸嘴;
若吸入口压力为0且空气消耗量为0则视为吸嘴堵塞,需要进行维护维修;
若吸杆处摩擦力小于0.02N,则视为吸杆松动;
若真空流量小于1e^-4m^3/s则视为真空发生器损坏,需要进行更换或维修;其中,各参数可根据不同设备在不同方面故障的具体表现设定阈值;
根据上述的故障判定条件对故障信号进行标识;首先,包括有故障以及无故障两种情况,即为故障有无的二分类模型;标签设置为0表示无故障,标签设置为1表示有故障,通过标识和特征的交叉验证,可以判断系统是否存在缺陷;
其次,为了完成对具体故障类型的判断,需要针对不同的情况设置标志;将上述四种故障单独发生的情况分别设置为2、3、4、5;将两种故障同时发生设置为6、7、8、9、10、11;将三种故障同时发生设置为12、13、14、15;将四种故障同时发生设置为16,得到十六分类模型,如下表所示;
表1.故障信号标识
将步骤S3中的测试集输入构建的二分、十六分模型机器学习分类模型进行训练,得到用于预测故障的回归模型,并根据验证集对构建的回归模型进行验证,最终得到故障预测模型。
S5、获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
实施例二
本实施例与实施例一的不同在于,具体限定了提取特征信号中的时域特征以及频域特征,并得到时域训练集以及频域特征集的方法;
针对时域特征,由于将1600个时间节点数据作为学习集输入时,数据学习集的维度较大,导致机器学习的精度和效率降低,因此需要进行特征选择,剔除或处理冗余的数据,使用主成分分析法对时域特征进行处理,具体的:
T1、将所述时域特征内的原始数据组成预设行列大小的原始矩阵,如将原始数据按列组成n行m列原始矩阵X ;
T2、对所述原始矩阵进行零均值化,得到零均值化矩阵;将所述原始矩阵X的每一行进行零均值化,即减去这一行的均值;其中,所述原始矩阵X的每一行代表一个属性字段;
T3、计算所述零均值化矩阵对应的协方差矩阵;根据公式:
计算得到协方差矩阵,其中,C为p*p维对称矩阵;
T4、计算所述协方差矩阵的特征值以及特征值对应的特征向量;如得到所述协方差矩阵的特征值为λ1、λ2…λp,以及特征值λ1、λ2…λp对应的特征向量;
T5、根据所述特征值的大小获取前预设个数的所述特征向量按行组成特征矩阵;在一可选的实施方式中,将特征向量按照特征由大至小并且从上到下按行排列成矩阵,并且取前k行组成特征矩阵P;
T6、根据所述特征矩阵对所述原始矩阵进行降维,得到降维矩阵;设置Y为降维后的数据,则Y=PX即为降维到k维后的数据;其中,对原始矩阵进行降维时,若下降维度太低,则容易导致数据的主要内容丢失,因此,需要选择合适的k值以保证数据的主要内容不会丢失;请参照图3,为一次主成分分析所得到特征值的分布,从图中可以看出当特征值处于2-0.25之间时特征值较大但衰减速度很快,当特征值小于0.25时特征值较小但衰减速度较慢,因此选择拐点来作为k=3值,能够确保数据的主要内容不会丢失;
T7、将所述降维矩阵作为所述时域训练集。
针对频域特征,使用小波包变换法进行处理,具体的:
F1、获取数据采样频率、数据类型以及小波包变化法处理层数;本实施例中使用的数据是256Hz的采样频率;其中,采样频率可根据应用至分类的精度要求和运算时间要求具体调整配置;根据采样定理得到奈奎斯特采样频率是128Hz;设置小波包变化法处理层数为3层;
F2、根据所述小波包变化法处理层数对所述数据采样频率进行处理,得到预设个数的子频率段;
请参照图4,将奈奎斯特采样频率依次进行三次二等分,第一次二等分将采样频率128Hz进行二等分,得到0-64Hz频段以及64-128Hz频段;第二次二等分将0-64Hz频段以及64-128Hz频段进行二等分,分别得到四组频段;第三次次二等分将四组频段进行二等分,分别得到八组频段;同时,为每一节点的频段进行命名:(0,0)表示原始信号,每一层节点由低频至高频依次命名,从(1,0)开始,为1号,(1,1)是2号,依此类推,最后一层中(3,0)是7号,(3,7)是14号;
F3、提取各个所述子频率段对应的能量特征,并得到各个所述子频率段对应的能量占比;对底层节点(3,0)-(3,7)进行小波变换,即同时处理低频和高频信号,进行能量特征提取,得到第三层节点(3,0)-(3,7)频段能量所占的比例;
F4、根据所述数据类型选取能量占比最高的所述子频率段组合为所述频域训练集;请参照图4,从图5中可知,节点(3,0)即0-16Hz频段能量占比最高,因此,选取子频段节点(3,0)即0-16Hz频段组合为所述频域训练集。
实施例三
本实施例与实施例一或二的不同在于,具体限定了通过算法对训练样本进行学习的过程;
具体的:分别通过决策树算法、支持向量机算法或随机森林算法对所述训练样本进行特征分类,得到特征值以及特征值与故障的映射关系;并根据回归算法对所述特征值以及特征值与故障的映射关系进行拟合,得到故障预测模型;
本实施例中以随机森林算法为例进行说明:
在一可选的实施方式中,采取有放回地方式分别从所述时域训练集以及所述频域训练集中抽取预设个数的特征,组合得到训练样本;通过所述训练样本,进行决策树训练得到M个决策树子模型;其中,决策树子模型的数量根据分类精度以及运算时间确定,本实施例中的决策树子模型5个决策树;采用投票的方法,将得票最多决策树子模型的分类类别为最终的类别;
单个决策树训练原理如下:
请参照图6,将所述训练样本作为特征子集输入决策树算法中进行特征分类,得到分类后的特征子集,以各种特征作为输入,故障标记作为输出,决策树以自顶向下的递归树结构的形式构建分类;在递归树结构中,每个内部节点(图中表示为三角形)表示为形式的逻辑判断,如x1>= a,其中x1是一个属性,a是属性x1的某个属性值;叶节点(图中表示为圆形)表示一个类;树的边缘是逻辑判断的分支结果,分支表示导致这些类的特征的连接,最顶端的节点是根节点,决策树是一个逐步将数据分割成子集的过程,同时逐步扩展决策树的分支,其具体包括如下步骤:
步骤一:将所述训练样本确定为根节点;
步骤二:根据不同的选择标准遍历所述特征子集中的每一特征,并选择最佳阈值作为分割点;如根据实施例一中的故障判定条件作为阈值分割点;其中,不同的选择标准包括顺序选择或随机选择;在一种可选的实施方式中,计算以某特征划分数据集前后的熵的差值;通过熵表示样本集合的不确定性,若熵越大,则样本的不确定性就越大;因此,可以使用划分前后集合熵的差值来衡量使用当前特征对于训练样本划分效果的好坏;
步骤三:分割点分割数据,并创建子节点;
步骤四:判断子节点是否仅有一个类别,或所述子节点中的记录数是否小于第一预设值且当前迭代次数达到第二预设值,若满足其一,则停止分割,若均不满足,则将所述子节点确定为叶节点,并将所述叶节点的输出确定为分类类别中类别数量最多的目标类别;
步骤五:完成所述节点的构建。
为了从故障特征中提取故障状态信息,需要建立一个回归模型;回归模型可以通过将输入中的每个值设置为变量,然后计算变量的每个系数来产生模型的输入和输出之间的关系,使得在设置输入值之后,能够输出对应的预测结果,具体的:
通过分类模型对所述训练样本完成分类后,包括步骤:
A1、建立故障预测函数,将所述特征值作为函数自变量;采用最小二乘法或梯度下降法进行计算时都需要先建立一个输入输出函数;其中,最小二乘法将训练样本的所有输入作为输入矩阵,将所有输出作为输出矩阵,再通过矩阵计算得到每个输入的系数;而梯度下降法方法,是进一步制定了实际价值和预测价值之间的差额的成本函数,并通过最小化成本函数,得到最适合的系数;
A2、通过最小二乘法或梯度下降法计算所述特征值与故障的映射关系得到自变量变量系数;即使用最小二乘法或梯度下降法计算得到变量的系数;
A3、根据所述自变量和所述自变量变量系数进行回归拟合,得到所述故障预测模型;所述故障预测模型提取故障标识,即有无故障以及故障具体种类,作为模型的输出,将采集的特征作为模型的输入。
通过将采集待的预测上下料机的特征数据输入所述故障预测模型,即能够输出对应的故障预测结果。
实施例四
为验证上述故障模型预测的准确性,本实例提供具体的实验案例进行说明;
本实施例中通过两种特征提取方法:主成分分析法(PCA)和小波包变换(WPT),以及三种分类方法:随机森林(Random forest)、支持向量机(SVM)和决策树(DT),建立了用于比较的分类模型;针对故障预测的二元问题,建立了相应的模型。最初,采用随机森林、支持向量机和决策树分类器使用原始数据集(即72个特征)进行分类器构造,然后使用PCA和WPT算法对所有72个特征进行过滤,再利用滤波后的最佳特征集进行分类器测试。
根据表2和表3可知,使用PCA+WPT构建的分类模型的准确性与原始数据集相比都有显著改善,将其应用于特征选择数据集的分类器总体上比直接应用原始数据的分类器具有更高的准确性。并且,表2的结果还表明,随机森林模型能够在二元分类问题中获得最高达98.7%的最佳正确分类率,即能够准确的预测设备对应的故障。
表2.二分类模型的准确性
表3.二分类模型的运行时间性
对于故障类别确定问题即十六分类问题,所有模型的正确分类率如下表所示。请参照表4,基于决策树和随机森林模型均能更有效地对单故障或多故障进行分类,模型的平均准确率在95%左右;然而,从结果可以看出,SVM并不适用于这种多分类问题,分类准确率只有64% 左右;其原因可能是噪声,追求完全拟合会导致过拟合,即对训练数据的完全拟合并不具有良好的预测性能。
表4.十六分类模型的准确性
即PCA+WPT+随机森林模型是最有效的模型;请参照图7,为吸嘴磨损故障分析的线性函数计算结果,可以明显发现几乎所有的样本都沿着这个函数计算,且误差较小。并且,通过交叉验证实验,可以很好地预测出故障发生与否及故障的具体种类,R2(拟合优度,越接近1,拟合精度越高;(R^2==∑(y预测-)^2/==∑(y实际-/>)^2))为“0.966”,说明这两个模型具有较高的精度。
实施例五
请参照图8,一种设备故障预测装置,包括:
抽取模块,用于抽取预设个数时间节点,并提取所述时间节点设备对应的特征信号;
选取模块,用于根据所述特征信号中的特征类型选择至少一种特征提取方法;
提取模块,用于通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;
训练模块,将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;
预测模块,用于获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
实施例六
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一、二和三所述的一种设备故障预测方法各个步骤。
实施例七
请参照图9,一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如实施例一、二和三所述的一种设备故障预测方法中的各个步骤。
综上所述,本发明提供的一种设备故障预测方法、装置、可读存储介质及电子设备,通过抽取设备的特征信号后,根据特征信号中的特征类型选择不同的特征提取方法,并基于不同的特征提取方法提取特征信号中的不同特征,即能够针对不同故障特征使用与故障特征相适应的特征提取方法进行提取,实现对故障特征的二次处理,从而提取出特征高度集合的训练样本,再通过将训练样本输入机器学习分类算法中进行数据挖掘,建立具有精确输入和输出关系的故障预测模型,从而通过建立的故障预测模型结合待预测的设备特征信号实现对设备故障精确预测的目的。
在本申请所提供的上述实施例中,应该理解到,所揭露的方法、装置、计算机可读存储介质以及电子设备,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个组件或模块可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或组件或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的组件可以是或者也可以不是物理上分开的,作为组件显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部组件来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个组件单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种设备故障预测方法,其特征在于,包括步骤:
抽取预设个数时间节点,并提取所述时间节点上设备对应的特征信号;
根据所述特征信号中的特征类型选择至少一种特征提取方法;
通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;
将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;
获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
2.根据权利要求1所述的一种设备故障预测方法,其特征在于,所述通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本包括:
通过主成分分析法提取所述特征信号中的时域特征,得到时域训练集,以及通过小波包变化法提取所述特征信号中的频域特征,得到频域训练集;
根据所述时域训练集以及所述频域训练集得到所述训练样本。
3.根据权利要求2所述的一种设备故障预测方法,其特征在于,所述通过主成分分析法提取所述特征信号中的时域特征,得到时域训练集包括:
将所述时域特征内的原始数据组成预设行列大小的原始矩阵;
对所述原始矩阵进行零均值化,得到零均值化矩阵;
计算所述零均值化矩阵对应的协方差矩阵;
计算所述协方差矩阵的特征值以及特征值对应的特征向量;
根据所述特征值的大小获取前预设个数的所述特征向量按行组成特征矩阵;
根据所述特征矩阵对所述原始矩阵进行降维,得到降维矩阵;
将所述降维矩阵作为所述时域训练集。
4.根据权利要求2所述的一种设备故障预测方法,其特征在于,所述通过小波包变化法提取所述特征信号中的频域特征,得到频域训练集包括:
获取数据采样频率、数据类型以及小波包变化法处理层数;
根据所述小波包变化法处理层数对所述数据采样频率进行处理,得到预设个数的子频率段;
提取各个所述子频率段对应的能量特征,并得到各个所述子频率段对应的能量占比;
根据所述数据类型选取能量占比最高的所述子频率段组合为所述频域训练集。
5.根据权利要求3或4所述的一种设备故障预测方法,其特征在于,所述根据所述时域训练集以及所述频域训练集得到所述训练样本包括:
采取有放回地方式分别从所述时域训练集以及所述频域训练集中抽取预设个数的特征,组合得到训练样本。
6.根据权利要求1所述的一种设备故障预测方法,其特征在于,所述将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型包括:
通过决策树算法、支持向量机算法或随机森林算法对所述训练样本进行特征分类,得到特征值以及特征值与故障的映射关系;
根据回归算法对所述特征值以及特征值与故障的映射关系进行拟合,得到故障预测模型。
7.根据权利要求6所述的一种设备故障预测方法,其特征在于,所述根据回归算法对所述特征值以及特征值与故障的映射关系进行拟合,得到故障预测模型包括:
建立故障预测函数,将所述特征值作为函数自变量;
通过最小二乘法或梯度下降法计算所述特征值与故障的映射关系得到自变量变量系数;
根据所述自变量和所述自变量变量系数进行回归拟合,得到所述故障预测模型。
8.一种设备故障预测装置,其特征在于,包括:
抽取模块,用于抽取预设个数时间节点,并提取所述时间节点设备对应的特征信号;
选取模块,用于根据所述特征信号中的特征类型选择至少一种特征提取方法;
提取模块,用于通过至少一种所述特征提取方法提取所述特征信号中的特征,得到训练样本;
训练模块,将所述训练样本输入机器学习分类模型进行训练,得到故障预测模型;
预测模块,用于获取待预测的设备特征信号,将所述待预测的设备特征信号输入所述故障预测模型,得到故障预测结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的一种设备故障预测方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的一种设备故障预测方法。
CN202311282404.XA 2023-10-07 2023-10-07 一种设备故障预测方法、装置、可读存储介质及电子设备 Active CN117033912B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311282404.XA CN117033912B (zh) 2023-10-07 2023-10-07 一种设备故障预测方法、装置、可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311282404.XA CN117033912B (zh) 2023-10-07 2023-10-07 一种设备故障预测方法、装置、可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN117033912A true CN117033912A (zh) 2023-11-10
CN117033912B CN117033912B (zh) 2024-02-13

Family

ID=88632159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311282404.XA Active CN117033912B (zh) 2023-10-07 2023-10-07 一种设备故障预测方法、装置、可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117033912B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117250942A (zh) * 2023-11-15 2023-12-19 成都态坦测试科技有限公司 故障预测方法、模型的确定方法、装置、设备及存储介质
CN117782198A (zh) * 2023-12-01 2024-03-29 湖南省衡永高速公路建设开发有限公司 一种基于云边端架构的公路机电设备运行监测方法及系统

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100023307A1 (en) * 2008-07-24 2010-01-28 University Of Cincinnati Methods for prognosing mechanical systems
JP2010177549A (ja) * 2009-01-30 2010-08-12 Taiheiyo Cement Corp チップマウンタ
CN103592070A (zh) * 2013-11-20 2014-02-19 太仓思比科微电子技术有限公司 一种可视化芯片挑晶机气压检测方法
CN104454785A (zh) * 2014-09-25 2015-03-25 中南大学 一种工程机械液压缸故障诊断系统及与之适用的故障样本信号采集方法
CN112101142A (zh) * 2020-08-27 2020-12-18 深圳市行健自动化股份有限公司 泥浆泵运行状态评估方法、监控终端和计算机可读存储介质
CN114261760A (zh) * 2021-12-22 2022-04-01 苏州精濑光电有限公司 一种可切换吸取机构
CN115599579A (zh) * 2022-10-09 2023-01-13 阿里云计算有限公司(Cn) 基于加权损失的系统故障预测方法、装置、设备及介质
CN115617554A (zh) * 2022-10-09 2023-01-17 阿里云计算有限公司 基于时间感知的系统故障预测方法、装置、设备及介质
DE102021133575B3 (de) * 2021-12-17 2023-05-04 J.Schmalz Gmbh Verfahren zur Überwachung eines Betriebszustands einer Unterdruckvorrichtung
CN116070527A (zh) * 2023-03-07 2023-05-05 南京航空航天大学 基于退化模型的铣削刀具剩余寿命预测方法
CN116226646A (zh) * 2023-05-05 2023-06-06 国家石油天然气管网集团有限公司 轴承健康状态及剩余寿命的预测方法、系统、设备及介质
CN116399588A (zh) * 2023-03-06 2023-07-07 太原理工大学 一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法
CN116578843A (zh) * 2023-05-22 2023-08-11 合肥工业大学 离心泵诊断模型训练方法、诊断方法、系统、装置及介质
CN116662800A (zh) * 2023-04-25 2023-08-29 盐城工学院 一种基于自适应注意力机制的滚动轴承故障诊断方法
CN116822383A (zh) * 2023-08-31 2023-09-29 成都态坦测试科技有限公司 设备寿命预测模型构建方法、装置、可读存储介质及设备

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100023307A1 (en) * 2008-07-24 2010-01-28 University Of Cincinnati Methods for prognosing mechanical systems
JP2010177549A (ja) * 2009-01-30 2010-08-12 Taiheiyo Cement Corp チップマウンタ
CN103592070A (zh) * 2013-11-20 2014-02-19 太仓思比科微电子技术有限公司 一种可视化芯片挑晶机气压检测方法
CN104454785A (zh) * 2014-09-25 2015-03-25 中南大学 一种工程机械液压缸故障诊断系统及与之适用的故障样本信号采集方法
CN112101142A (zh) * 2020-08-27 2020-12-18 深圳市行健自动化股份有限公司 泥浆泵运行状态评估方法、监控终端和计算机可读存储介质
DE102021133575B3 (de) * 2021-12-17 2023-05-04 J.Schmalz Gmbh Verfahren zur Überwachung eines Betriebszustands einer Unterdruckvorrichtung
CN114261760A (zh) * 2021-12-22 2022-04-01 苏州精濑光电有限公司 一种可切换吸取机构
CN115599579A (zh) * 2022-10-09 2023-01-13 阿里云计算有限公司(Cn) 基于加权损失的系统故障预测方法、装置、设备及介质
CN115617554A (zh) * 2022-10-09 2023-01-17 阿里云计算有限公司 基于时间感知的系统故障预测方法、装置、设备及介质
CN116399588A (zh) * 2023-03-06 2023-07-07 太原理工大学 一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法
CN116070527A (zh) * 2023-03-07 2023-05-05 南京航空航天大学 基于退化模型的铣削刀具剩余寿命预测方法
CN116662800A (zh) * 2023-04-25 2023-08-29 盐城工学院 一种基于自适应注意力机制的滚动轴承故障诊断方法
CN116226646A (zh) * 2023-05-05 2023-06-06 国家石油天然气管网集团有限公司 轴承健康状态及剩余寿命的预测方法、系统、设备及介质
CN116578843A (zh) * 2023-05-22 2023-08-11 合肥工业大学 离心泵诊断模型训练方法、诊断方法、系统、装置及介质
CN116822383A (zh) * 2023-08-31 2023-09-29 成都态坦测试科技有限公司 设备寿命预测模型构建方法、装置、可读存储介质及设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
R. K. PATEL 等: "Induction Motor Bearing Fault Classification Using PCA and ANN", 《COMPUTING ALGORITHMS WITH APPLICATIONS IN ENGINEERING:PROCEEDINGS OF ICCAEEE 2019》, pages 269 - 284 *
唐松林 等: "一种基于PCA与SVM的往复压缩机典型故障诊断方法", 《压缩机技术》, no. 03, pages 23 - 28 *
朱文军: "重力式编带机多杆取料机构的设计与研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 2020, pages 135 - 424 *
邓森 等: "基于测试性的电子系统综合诊断与故障预测方法综述", 《控制与决策》, no. 05, pages 641 - 649 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117250942A (zh) * 2023-11-15 2023-12-19 成都态坦测试科技有限公司 故障预测方法、模型的确定方法、装置、设备及存储介质
CN117250942B (zh) * 2023-11-15 2024-02-27 成都态坦测试科技有限公司 故障预测方法、模型的确定方法、装置、设备及存储介质
CN117782198A (zh) * 2023-12-01 2024-03-29 湖南省衡永高速公路建设开发有限公司 一种基于云边端架构的公路机电设备运行监测方法及系统

Also Published As

Publication number Publication date
CN117033912B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN117033912B (zh) 一种设备故障预测方法、装置、可读存储介质及电子设备
CN110132598B (zh) 旋转设备滚动轴承故障噪声诊断算法
Yu et al. Wafer defect pattern recognition and analysis based on convolutional neural network
CN106570178B (zh) 一种基于图聚类的高维文本数据特征选择方法
CN108319987B (zh) 一种基于支持向量机的过滤-封装式组合流量特征选择方法
Arbin et al. Comparative analysis between k-means and k-medoids for statistical clustering
CN107292350A (zh) 大规模数据的异常检测方法
Liao et al. Similarity searching for defective wafer bin maps in semiconductor manufacturing
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
Yu et al. Multiple granularities generative adversarial network for recognition of wafer map defects
CN109886284B (zh) 基于层次化聚类的欺诈检测方法及系统
Chu et al. Strip steel surface defect classification method based on enhanced twin support vector machine
CN115343676B (zh) 密封电子设备内部多余物定位技术的特征优化方法
CN112836735B (zh) 一种优化的随机森林处理不平衡数据集的方法
Kong et al. Recognition and location of mixed-type patterns in wafer bin maps
CN110751101A (zh) 基于无监督极限学习机多重聚类算法的疲劳驾驶判断方法
Kim et al. Fault detection prediction using a deep belief network-based multi-classifier in the semiconductor manufacturing process
Chu et al. Recognition of unknown wafer defect via optimal bin embedding technique
Dubey et al. Hybrid classification model of correlation-based feature selection and support vector machine
Park et al. Data mining approaches for packaging yield prediction in the post-fabrication process
US20060179021A1 (en) Using supervised classifiers with unsupervised data
CN110941542A (zh) 基于弹性网络的序列集成高维数据异常检测系统及方法
CN116150687A (zh) 一种基于多分类g-wlstsvm模型的流体管道泄漏识别方法
CN102122349B (zh) 应用于伺服电机系统的基于巴氏距离和有向无环图构建多分类支持向量机分类器的方法
CN112306731B (zh) 基于Spacy词向量的两阶段判别缺陷报告严重程度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant