CN117763432A - 通讯故障预测方法、装置、设备及存储介质 - Google Patents
通讯故障预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117763432A CN117763432A CN202311526428.5A CN202311526428A CN117763432A CN 117763432 A CN117763432 A CN 117763432A CN 202311526428 A CN202311526428 A CN 202311526428A CN 117763432 A CN117763432 A CN 117763432A
- Authority
- CN
- China
- Prior art keywords
- communication
- fault
- equipment
- feature
- characteristic data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 152
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 238000010276 construction Methods 0.000 claims abstract description 16
- 238000007418 data mining Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 27
- 238000012706 support-vector machine Methods 0.000 claims description 21
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 238000000513 principal component analysis Methods 0.000 claims description 10
- 238000012847 principal component analysis method Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 9
- 230000008439 repair process Effects 0.000 claims description 8
- 238000011478 gradient descent method Methods 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 abstract description 15
- 238000012549 training Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 17
- 238000012423 maintenance Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 9
- 230000005856 abnormality Effects 0.000 description 8
- 238000013145 classification model Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本申请提供一种通讯故障预测方法、装置、设备及存储介质,涉及机器学习技术领域,该方法包括:采集待预测设备运行时间段产生的通讯特征数据;将通讯特征数据输入构建的故障预测模型进行预测,以获得待预测设备的通讯故障类型;其中,故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。通过将采集到的故障特征值进行特征提取之后加以机器学习分类训练构建故障预测模型,并采集待预测设备运行不同时段的通讯特征数据输入到构建的故障预测模型中进行故障预测,能够达到根据设备运行不同时段获取的物理量数据预测通讯设备通讯故障的目的,填补了现有技术通讯故障预测的空白,提高了故障预测的准确性。
Description
技术领域
本申请涉及机器学习技术领域,具体而言,涉及一种通讯故障预测方法、装置、设备及存储介质。
背景技术
工业生产中一些通讯设备(例如ATE自动化测试设备)的各个组件不可避免地会发生许多故障。例如:人为故障,电机的电气故障、控制故障和机械故障等由于时间、温度等原因造成的故障,这些故障都可能导致流程中断,甚至影响整个生产测试流程。因此,故障的提前预测和分类对于工业安全具有重要意义。
目前,现在的通讯故障检测还未涉及到预测领域,而通过对设备进行连续在线的状态监测及数据分析,诊断并预测设备故障的发展趋势,可以提前制定预测性维护计划并实施检维修行为,有效地避免“过剩维修”,防止因不必要的解体拆卸、更换零部件等;也可以有效减少设备停机维修时间,尽早发现故障隐患,避免故障恶化,同时合理预估机械部件的剩余寿命,使设备在保证安全的情况下合理超期服役。所以综上所述,可以说实施预测性维护是提高设备管理水平的必经之路,也是必然趋势。
发明内容
有鉴于此,本申请实施例的目的在于提供一种通讯故障预测方法、装置、设备及存储介质,通过采集待预测设备的通讯特征数据输入到构建模型中进行故障预测,构建模型的过程可以是:将采集到的故障特征值首先进行特征提取之后加以机器学习分类(例如:支持向量机)训练;在特征提取部分,使用主成分分析法进行特征提取,提取出的前面若干个主成分,其携带了原始数据的大部分信息,消除相互叠加部分的信息,在总的信息量维持不变的前提下重新分配原变量的变化信息;在特征分类部分,使用支持向量机进行学习分类,针对提取后的特征定位具体故障,同时输入回归算法进行预测;能够达到根据设备运行不同时段获取的物理量数据预测通讯设备通讯故障的目的,填补现有技术故障预测空白,从而解决上述技术问题。
第一方面,本申请实施例提供一种通讯故障预测方法,所述方法包括:采集待预测设备运行时间段产生的通讯特征数据;将所述通讯特征数据输入构建的故障预测模型进行预测,以获得所述待预测设备的通讯故障类型;其中,所述故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。
在上述实现过程中,通过将采集到的故障特征值进行特征提取之后加以机器学习分类训练构建故障预测模型,并采集待预测设备运行不同时段的通讯特征数据输入到构建的故障预测模型中进行故障预测,能够达到根据设备运行不同时段获取的物理量数据预测通讯设备通讯故障的目的,填补了现有技术通讯故障预测的空白,提高了故障预测的准确性。
可选地,所述故障预测模型的构建方式,包括:获取待预测设备在运行时间段和报修时间段的通讯故障特征数据;对所述通讯故障特征数据进行特征提取,获得目标特征子集;其中,所述特征子集中的特征与通讯故障类型强相关,且特征之间互不相关;对所述目标特征子集进行分类;对分类后的目标特征子集进行回归拟合,获得故障预测模型。
在上述实现过程中,通过对待预测设备已产生故障的通讯特征数据进行特征提取、分类学习、回归拟合构建故障预测模型,相比直接应用原始数据的分类器构建模型,基于特征选择数据集的分类器构建模型总体上提高了准确性。
可选地,所述对所述通讯故障特征数据进行特征提取,获得目标特征子集,包括:对所述通讯故障特征数据进行初提取,获得待预测设备的通讯特征;对所述通讯特征进行二次提取,获得特定信号特征集;其中,所述特定信号特征与通讯故障类型相关;采用主成分分析法对所述特定信号特征集进行终提取,获得目标特征子集。
在上述实现过程中,通过对通讯故障特征数据进行初提取、二次提取、终提取,将特征从与通讯故障类型相关逐步筛选到强相关,提高了特征提取的针对性、故障预测的准确率。
可选地,所述采用主成分分析法对所述特定信号特征集进行终提取,获得目标特征子集,包括:基于特定信号特征集,构建特征矩阵;其中,所述特定信号特征集包括:N组时域的信号特征和频域的信号特征,N为正整数;将所述特征矩阵的每一行进行零均值化,获得协方差矩阵;根据所述协方差矩阵的特征值的大小,对所述协方差矩阵的特征向量进行排序;取排列靠前的特征向量所组成的降维矩阵与所述特征矩阵的乘积,作为目标特征子集。
在上述实现过程中,通过采用主成分分析法进行特征提取和筛选,获得特征与通讯故障类型强相关的目标特征子集,提高了特征提取的针对性、故障预测的准确率。
可选地,所述对所述目标特征子集进行分类,包括:采用支持向量机算法求解所述目标特征子集的最优分类面;基于所述最优分类面作为分类条件,将所述目标特征子集输入至支持向量机分类器进行学习。
在上述实现过程中,通过采用支持向量机算法进行分类学习,提升了分类精度和运行速度。
可选地,所述对分类后的目标特征子集进行回归拟合,获得故障预测模型,包括:将分类后的特征子集确定为输入变量;使用最小二乘法或梯度下降法计算所述输入变量的输出系数;根据所述输入变量和所述输出系数进行回归拟合,获得故障预测模型。
在上述实现过程中,通过对分类后的特征子集进行回归拟合,得到故障预测模型,提升了模型预测性能。
可选地,所述待预测设备包括:ATE自动化测试设备;所述通讯故障类型包括:上位机通讯链路异常、资源板异常、测试机通讯异常和信息交互错误。
在上述实现过程中,通过选择ATE自动化测试设备和四种常见的故障类型进行故障预测,缩短了人工定位问题的耗时,定位手段更加精准和快速,有效地提高了ATE设备的安全性和可靠性。
第二方面,本申请实施例提供了一种通讯故障预测装置,所述装置包括:采集特征模块,用于采集待预测设备运行时间段产生的通讯特征数据;故障预测模块,用于将所述通讯特征数据输入构建的故障预测模型进行预测,以获得所述待预测设备的通讯故障类型;其中,所述故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行上述的方法的步骤。
第四方面,本申请实施例提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种通讯故障预测方法的流程图;
图2为本申请实施例提供的一种故障预测模型构建示例图;
图3为本申请实施例提供的一种主成分分析特征值分布示例图;
图4为本申请实施例提供的一种回归拟合示例图;
图5为本申请实施例提供的一种通讯故障预测装置的模块示意图;
图6为本申请实施例提供通讯故障预测装置的电子设备的方框示意图。
图标:210-采集特征模块;220-故障预测模块;300-电子设备;311-存储器;312-存储控制器;313-处理器;314-外设接口;315-输入输出单元;316-显示单元。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请发明人注意到,对于ATE自动化测试设备,通讯故障是可能发生的故障之中尤为重要的一类,选取了四种典型的通讯故障类型:上位机PC与测试仪之间的通讯链路异常、资源板本身异常、ATE测试机与分选机之间的通讯链路异常、分选机与上位机信息交互错误。在已知可能会发生哪些故障的情况下,判断故障的类型和严重程度可能是简单的,但这也将耗费大量的人力和物力。因此,有必要根据工业生产过程中监测到的数据预判故障的发生,并对故障进行评估。同时,监测故障的严重程度,以确定是否需要进行维修。在目前的工业自动化中,很容易获得上位机、测试机和分选机在某个时间节点内的相关数据与状态(正常工作状态/故障报修状态),包括设备温度、压力、通讯板卡数据交换状态、测试机软件运行状态、分选机硬件BIN进度、联机线传输速率等数据。通过这些数据还可以获得更多的指标,如幅度和功率谱等。但是,如何从堆积如山的数据中选择与故障预测相关的性能指标是关键。
机器学习是将人类对问题的理解、学习与经验总结过程应用到机器上,以突破人类学习和记忆能力的限制。所以,换句话说,机器学习是指使用特定的算法指导计算机使用已知的数据得到一个合适的模型,并使用这个模型来对新的情况作出判断的过程。将机器学习应用于工业故障预测中,即利用机器学习对工业生产中获得的数据进行处理,筛选出可用于预测故障并达到预测目的的数据是高效率的。然而,现在的ATE设备故障检测还没有涉及到预测领域,而通过对设备进行连续在线的状态监测及数据分析,诊断并预测设备故障的发展趋势,可以提前制定预测性维护计划并实施检维修行为。有鉴于此,本申请实施例提供了如下介绍的一种通讯故障预测方法及装置。
请参阅图1,图1为本申请实施例提供的一种通讯故障预测方法的流程图。下面对本申请实施例进行详细阐释。该方法包括:步骤100和步骤120。
步骤100:采集待预测设备运行时间段产生的通讯特征数据;
步骤120:将通讯特征数据输入构建的故障预测模型进行预测,以获得待预测设备的通讯故障类型;其中,故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。
示例性地,待预测设备可以是:ATE自动化测试设备、或者ATE自动化测试设备类似的通讯设备,通过收集设备的通讯特征数据,进而根据这些通讯特征数据进行通讯故障的预测;其中,ATE自动化测试设备可以根据客户的测试要求、图纸及参考方案,采用MCU、PLC、PC基于VB、VC开发平台,利用TestStand&LabVIEW和JTAG/Boundary Scan等技术开发、设计各类自动化测试设备。故障预测模型可以是:对提取到的待预测通讯设备的通讯故障特征进行特征处理,使用特征提取算法(例如:主成分分析法)估计和排序特征的价值,最终提取出一个特征高度相关的特征子集(与通讯故障强相关,但彼此互不相关的特征集合)输入进分类算法(例如:支持向量机算法)中进行数据挖掘,得出该设备的通讯各种故障与提取的特征值之间的映射关系,通过回归算法拟合出因变量与自变量之间的关系,计算变量的每个系数,进而产生模型的输入和输出之间的关系,构建得到该模型。
可选地,以下实施例中的待预测设备以ATE自动化测试设备为例进行介绍,对提取到的ATE自动化测试设备的温度、压力、通讯板卡数据交换状态、测试机软件运行状态、分选机硬件BIN进度、联机线传输速率等通讯故障特征进行特征处理,使用特征提取算法估计和排序特征的价值,最终提取出一个特征高度强相关集合的特征子集;再输入进分类算法中进行数据挖掘,得出ATE自动化测试设备的通讯各种故障与提取的特征值之间的映射关系,并通过回归算法拟合出因变量与自变量之间的关系,计算触变量的每个系数,进而产生模型的输入和输出之间的关系,从而构建出一个完整的故障预测模型。采集待预测ATE设备通讯故障相关的特征数据,并将该特征数据输入上述构建的故障预测模型,输出故障预测结果,实现达到根据设备运行不同时段获取的物理量数据预测ATE设备通讯故障的目的。
特别地,一方面:针对ATE设备通讯故障进行精准的诊断和预测,首先针对故障类型的具体诊断,不仅大大缩短了人工定位问题的耗时,而且定位手段更加精准和快速,可以有效地提高ATE设备的安全性和可靠性,减少灾难性事故的发生。另一方面:聚焦于故障预测领域,通过对设备进行连续在线的状态监测及数据分析,诊断并预测设备故障的发展趋势,可以提前制定预测性维护计划并实施检维修行为,有效地避免了“过剩维修”,防止因不必要的解体拆卸、更换零部件等麻烦;也可以有效减少设备停机维修时间,尽早发现故障隐患,避免故障恶化的问题;同时合理预估机械部件的剩余寿命,使设备在保证安全的情况下合理超期服役。
通过将采集到的故障特征值首先进行特征提取之后加以机器学习分类训练构建故障预测模型,并采集待预测设备运行不同时段的通讯特征数据输入到构建的故障预测模型中进行故障预测,能够达到根据设备运行不同时段获取的物理量数据预测通讯设备通讯故障的目的,填补了现有技术通讯故障预测的空白,提高了故障预测的准确性。
在一个实施例中,所述故障预测模型的构建方式,包括:步骤121、步骤122、步骤123和步骤124。
步骤121:获取待预测设备在运行时间段和报修时间段的通讯故障特征数据;
步骤122:对通讯故障特征数据进行特征提取,获得目标特征子集;其中,特征子集中的特征与通讯故障类型强相关,且特征之间互不相关;
步骤123:对目标特征子集进行分类;
步骤124:对分类后的目标特征子集进行回归拟合,获得故障预测模型。
示例性地,强相关可以是:对提取的通讯故障特征数据进一步特征提取和处理得到的强相关特征数据。例如:使用主成分分析法提取出通讯故障特征数据前面若干个主成分,其携带了原始数据的大部分信息,消除相互叠加部分的信息,在总的信息量维持不变的前提下重新分配原变量的变化信息;这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。
可选地,如图2所示,在运行中与报修后的时间段中随机抽取数个时间节点提取ATE设备已经产生故障信号的特征数据,包括相应时段ATE设备对应的有无故障、故障种类标识等数据,抽取的方式可以为完全随机,样本数量采样比例可以为抽样时间节点的20%。可以将1500个时间节点的特征数据作为机器学习输入,300组数据作为验证集,实际操作中,样本数量非固定,可以根据机器学习精度要求调整配置,自由更改训练测试集与验证集的比例。对故障信号可进行标识,通讯故障有无预测:有故障\无故障,即为二分类模型,标签可设置0表示无故障和1表示有故障。对故障特征数据进行强相关特征提取后,一部分数据进行分类学习,构建二分类模型,进一步进行回归拟合,构建回归模型;另一部分数据作为验证集分类学习构建验证二分类模型,最终形成验证回归模型,即故障预测模型。
通过对待预测设备已产生故障的通讯特征数据进行特征提取、分类学习、回归拟合构建故障预测模型,相比直接应用原始数据的分类器构建模型,基于特征选择数据集的分类器构建模型总体上提高了准确性。
在一个实施例中,步骤122可以包括:步骤1221、步骤1222和步骤1223。
步骤1221:对通讯故障特征数据进行初提取,获得待预测设备的通讯特征;
步骤1222:对通讯特征进行二次提取,获得特定信号特征集;其中,特定信号特征与通讯故障类型相关;
步骤1223:采用主成分分析法对特定信号特征集进行终提取,获得目标特征子集。
示例性地,主成分分析法可以是:一种降维算法,可将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。本申请实施例中的问题涉及到多变量且变量之间存在很强的相关性时,可考虑使用主成分分析的方法来对数据进行简化。一般思路为:根据p个特征的线性组合,得到一个新的特征z,使得该特征的方差最大,该特征即为主成分;再次寻找p个特征的线性组合,得到新的特征,该特征与之前得到的主成分线性无关,且方差最大。
在运行中与报修后的时间段中随机抽取数个时间节点提取ATE设备的特征信号,并初次提取ATE设备通讯相关特征,包括但不限于设备温度、压力、通讯板卡数据交换状态、测试机软件运行状态、分选机硬件BIN进度、联机线传输速率等通讯特征数据。将传感器获取的ATE设备通讯信号特征进行二次处理:从时域和频域中提取一些特定的信号特征,例如在时域中,测量幅度的均值、方差和偏度、峰值、峰峰值等特征;针对频域,计算不同频率范围内的功率如低频范围10-20Hz的功率、中频范围40-60Hz的功率、高频范围内>100Hz的功率和光谱峰态峰值的频率等特征;基于以上步骤的信号特征提取,可以得到与最终故障类别相关的特征参数,进一步计算可得到时域和频域的12组特性,其中,12组特征非固定,可以根据机器学习精度要求调整,本申请实施例中根据提取的特征数量进行二次处理得出。采用主成分分析法对时域和频域共计12组特性进行特征选择和剔除,获得强相关的目标特征子集。
通过对通讯故障特征数据进行初提取、二次提取、终提取,将特征从与通讯故障类型相关逐步筛选到强相关,提高了特征提取的针对性、故障预测的准确率。
在一个实施例中,步骤1223可以包括:步骤1223a、步骤1223b、步骤1223c和步骤1223d。
步骤1223a:基于特定信号特征集,构建特征矩阵;其中,特定信号特征集包括:N组时域的信号特征和频域的信号特征,N为正整数;
步骤1223b:将特征矩阵的每一行进行零均值化,获得协方差矩阵;
步骤1223c:根据协方差矩阵的特征值的大小,对协方差矩阵的特征向量进行排序;
步骤1223d:取排列靠前的特征向量所组成的降维矩阵与特征矩阵的乘积,作为目标特征子集。
示例性地,通过步骤1222的二次提取,可得到时域和频域共计12组特性,此时N取值为12,其中,N的取值不定,可以根据机器学习精度要求调整。将12组特性共1500个时间节点数据作为学习集输入,对于机器学习,这个维度相当之大所以需要进行特征选择剔除或处理冗余的数据,将原始数据按列组成n行m列矩阵X(特征矩阵),将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值,求出协方差矩阵C=1/m XX^T,其中,C为p×p维对称矩阵,之后求出协方差矩阵的特征值λ1、λ2…λp及对应的特征向量,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行强相关特征向量组成矩阵P(降维矩阵),则Y=PX即为降维到k维后的数据。其中k为了保证数据的主要内容不会丢失,又不可降到太低的维度,如图3所示,为一次主成分分析所得到特征值的分布,可以看到前面几个特征值较大但衰减速度很快,而到后面的特征值基本都很小,衰减也很慢,因此,可选择拐点作为k值,比如下图中选择k=3。通过采用主成分分析法进行特征提取和筛选,获得特征与通讯故障类型强相关的目标特征子集,提高了特征提取的针对性、故障预测的准确率。
在一个实施例中,步骤123可以包括:步骤1231和步骤1232。
步骤1231:采用支持向量机算法求解目标特征子集的最优分类面;
步骤1232:基于最优分类面作为分类条件,将目标特征子集输入至支持向量机分类器进行学习。
示例性地,基于特征子集使用支持向量机算法进行分类,求解出最优分类面。最优分类面可以是指:有一个分类面,两个点集与这个平面的最小距离最大,两个点集的边缘点离这个平面的距离最大。请继续参看图2,数据集按随机定义可分为训练集和测试集,交叉验证用于验证统计模型,训练用于提取训练指标,测试用于提取测试指标进行交叉验证。通过选择达到最佳控制结果的折叠数,可以直观地得出支持向量机算法的最佳分类面,即为支持向量机分类器的最终分类条件。将特征子集输入进分类器中进行学习,最终与标定的故障有无flag标记进行比对。
基于主成分分析法(PCA)的特征提取方法和支持向量机(SVM)的分类方法建立了用于比较的分类模型。针对故障预测的二元问题,建立了相应的模型。最初,支持向量机分类器使用原始数据集(即12个特征)进行分类器构造;然后,使用PCA算法对所有12个特征进行过滤;接着,利用滤波后的最佳特征集进行分类器测试,这里使用同一平台同一标准对特征集进行测试,结果可如表1和表2所示,比较了原始数据集和筛选后的数据集的运行时间和分类精度。可以看出,使用PCA构建的分类模型的准确性与原始数据集相比有显著改善(6%左右),并且运行速度也提升了50%以上。应用特征选择数据集的分类器总体上比直接应用原始数据的分类器具有更高的准确性。
表1二分类模型的准确性
分类精度 | 支持向量机 |
原始数据集 | 91.2% |
PCA | 97.6% |
表2二分类模型的运行时间性
运行时间 | 支持向量机 |
原始数据集 | 1.558s |
PCA | 0.862s |
通过采用支持向量机算法进行分类学习,提升了分类精度和运行速度。
在一个实施例中,步骤124可以包括:步骤1241、步骤1242和步骤1243。
步骤1241:将分类后的特征子集确定为输入变量;
步骤1242:使用最小二乘法或梯度下降法计算输入变量的输出系数;
步骤1243:根据输入变量和输出系数进行回归拟合,获得故障预测模型。
示例性地,最小二乘法和梯度下降法都需要先建立一个输入输出函数得到变量的输出系数,最小二乘法:将训练样本的所有输入作为输入矩阵,将所有输出作为输出矩阵,再通过矩阵计算得到每个输入的系数;梯度下降法:制定了实际价值和预测价值之间的差额的成本函数,并通过最小化成本函数,得到最适合的系数。
将分类后的特征子集输入回归算法中进行回归拟合,可得到故障预测模型。其实施过程可以是:为了从故障特征中提取故障状态信息,需要建立一个回归模型,回归模型可以通过将输入中的每个值设置为变量,然后计算变量的每个系数来产生模型的输入和输出之间的关系,这样,在设置输入值之后,模型就可以将每个变量与其计算的系数相乘,从而获得输出。具体包括:将分类后的特征子集确定为变量;使用最小二乘法或梯度下降法计算变量的系数;根据该变量和系数进行回归拟合,得到故障预测模型。该故障预测模型提取故障标识,即有无故障作为模型的输出,将采集的通讯特征数据作为模型的输入。
如图4所示,基于步骤122-步骤123得到的PCA-SVM模型是很有效的模型,对于回归拟合后的回归模型可进一步分析如下。以图4中ATE设备通讯故障,选取资源板异常故障进行试验分析的线性函数计算结果为例,可以明显发现几乎所有的样本都沿着这个拟合函数计算,且误差较小。通过交叉验证实验,可以很好地预测出故障发生与否以及具体的故障种类,具有很高的精度。其中,计算得到0.966,其越接近1,表示拟合精度越高,也说明这两个模型具有较高的精度。通过对分类后的特征子集进行回归拟合,得到故障预测模型,提升了模型预测性能。
在一个实施例中,该待预测设备包括:ATE自动化测试设备;该通讯故障类型包括:上位机通讯链路异常、资源板异常、测试机通讯异常和信息交互错误。
示例性地,待预测设备可以优选ATE自动化测试设备,通讯故障类型则可以包括四种故障:上位机PC与测试仪之间的通讯链路异常(可简称:PC通讯异常)、资源板异常、ATE测试机与分选机之间的通讯链路异常(可简称:测试机通讯异常)和分选机与上位机信息交互错误(可简称:信息交互错误);故障种类非固定,具体可根据设备关键部位或易出故障部位进行调研确定易发生故障种类,进行阈值分割,确定故障判定条件。例如:如果上位机PC与测试仪之间的数据交换量小于2bit/s则视为PC通讯异常,需要进行上电通讯自检和线缆检查;如果资源板的数据交换量小于4bit/s则视为资源板异常,需要进行维护维修;如果ATE测试机与分选机之间的数据交换量小于5bit/s,则视为测试机通讯异常;如果测试机软件BIN与分选机硬件BIN的匹配度下降则视为信息交互错误,需要进行更换或维修。各参数均可自由设计,根据不同设备在不同方面故障的具体表现设定对应阈值。
通过选择ATE自动化测试设备和四种常见的故障类型进行故障预测,缩短了人工定位问题的耗时,定位手段更加精准和快速,有效地提高了ATE设备的安全性和可靠性。
请参阅图5,图5为本申请实施例提供的一种通讯故障预测装置的模块示意图。该装置包括:采集特征模块210和故障预测模块220。
采集特征模块210,用于采集待预测设备运行时间段产生的通讯特征数据;
故障预测模块220,用于将所述通讯特征数据输入构建的故障预测模型进行预测,以获得所述待预测设备的通讯故障类型;其中,所述故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。
其中,所述故障预测模型的构建方式,包括:
获取待预测设备在运行时间段和报修时间段的通讯故障特征数据;
对所述通讯故障特征数据进行特征提取,获得目标特征子集;其中,所述特征子集中的特征与通讯故障类型强相关,且特征之间互不相关;
对所述目标特征子集进行分类;
对分类后的目标特征子集进行回归拟合,获得故障预测模型。
可选地,所述对所述通讯故障特征数据进行特征提取,获得目标特征子集,包括:
对所述通讯故障特征数据进行初提取,获得待预测设备的通讯特征;
对所述通讯特征进行二次提取,获得特定信号特征集;其中,所述特定信号特征与通讯故障类型相关;
采用主成分分析法对所述特定信号特征集进行终提取,获得目标特征子集。
可选地,所述采用主成分分析法对所述特定信号特征集进行终提取,获得目标特征子集,包括:
基于特定信号特征集,构建特征矩阵;其中,所述特定信号特征集包括:N组时域的信号特征和频域的信号特征,N为正整数;
将所述特征矩阵的每一行进行零均值化,获得协方差矩阵;
根据所述协方差矩阵的特征值的大小,对所述协方差矩阵的特征向量进行排序;
取排列靠前的特征向量所组成的降维矩阵与所述特征矩阵的乘积,作为目标特征子集。
可选地,所述对所述目标特征子集进行分类,包括:
采用支持向量机算法求解所述目标特征子集的最优分类面;
基于所述最优分类面作为分类条件,将所述目标特征子集输入至支持向量机分类器进行学习。
可选地,所述对分类后的目标特征子集进行回归拟合,获得故障预测模型,包括:
将分类后的特征子集确定为输入变量;
使用最小二乘法或梯度下降法计算所述输入变量的输出系数;
根据所述输入变量和所述输出系数进行回归拟合,获得故障预测模型。
可选地,所述待预测设备包括:ATE自动化测试设备;所述通讯故障类型包括:上位机通讯链路异常、资源板异常、测试机通讯异常和信息交互错误。
请参阅图6,图6是电子设备的方框示意图。电子设备300可以包括存储器311、存储控制器312、处理器313、外设接口314、输入输出单元315、显示单元316。本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对电子设备300的结构造成限定。例如,电子设备300还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
上述的存储器311、存储控制器312、处理器313、外设接口314、输入输出单元315、显示单元316各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。上述的处理器313用于执行存储器中存储的可执行模块。
其中,存储器311可以是,但不限于,随机存取存储器(Random Access Memory,简称RAM),只读存储器(Read Only Memory,简称ROM),可编程只读存储器(ProgrammableRead-Only Memory,简称PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,简称EEPROM)等。其中,存储器311用于存储程序,所述处理器313在接收到执行指令后,执行所述程序,本申请实施例任一实施例揭示的过程定义的电子设备300所执行的方法可以应用于处理器313中,或者由处理器313实现。
上述的处理器313可能是一种集成电路芯片,具有信号的处理能力。上述的处理器313可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(digital signalprocessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述的外设接口314将各种输入/输出装置耦合至处理器313以及存储器311。在一些实施例中,外设接口314,处理器313以及存储控制器312可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
上述的输入输出单元315用于提供给用户输入数据。所述输入输出单元315可以是,但不限于,鼠标和键盘等。
上述的显示单元316在电子设备300与用户之间提供一个交互界面(例如用户操作界面)给用户参考。在本实施例中,所述显示单元316可以是液晶显示器或触控显示器。液晶显示器或触控显示器可以对处理器执行所述程序的过程进行显示。
本实施例中的电子设备300可以用于执行本申请实施例提供的各个方法中的各个步骤。
此外,本申请实施例还提供一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中的步骤。
本申请实施例所提供的上述方法的计算机程序产品,包括存储了程序代码的存储介质,所述程序代码包括的指令可用于执行上述方法实施例中的步骤,具体可参见上述方法实施例,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。在本申请实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
需要说明的是,功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种通讯故障预测方法,其特征在于,所述方法包括:
采集待预测设备运行时间段产生的通讯特征数据;
将所述通讯特征数据输入构建的故障预测模型进行预测,以获得所述待预测设备的通讯故障类型;其中,所述故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。
2.根据权利要求1所述的方法,其特征在于,所述故障预测模型的构建方式,包括:
获取待预测设备在运行时间段和报修时间段的通讯故障特征数据;
对所述通讯故障特征数据进行特征提取,获得目标特征子集;其中,所述特征子集中的特征与通讯故障类型强相关,且特征之间互不相关;
对所述目标特征子集进行分类;
对分类后的目标特征子集进行回归拟合,获得故障预测模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述通讯故障特征数据进行特征提取,获得目标特征子集,包括:
对所述通讯故障特征数据进行初提取,获得待预测设备的通讯特征;
对所述通讯特征进行二次提取,获得特定信号特征集;其中,所述特定信号特征与通讯故障类型相关;
采用主成分分析法对所述特定信号特征集进行终提取,获得目标特征子集。
4.根据权利要求3所述的方法,其特征在于,所述采用主成分分析法对所述特定信号特征集进行终提取,获得目标特征子集,包括:
基于特定信号特征集,构建特征矩阵;其中,所述特定信号特征集包括:N组时域的信号特征和频域的信号特征,N为正整数;
将所述特征矩阵的每一行进行零均值化,获得协方差矩阵;
根据所述协方差矩阵的特征值的大小,对所述协方差矩阵的特征向量进行排序;
取排列靠前的特征向量所组成的降维矩阵与所述特征矩阵的乘积,作为目标特征子集。
5.根据权利要求2所述的方法,其特征在于,所述对所述目标特征子集进行分类,包括:
采用支持向量机算法求解所述目标特征子集的最优分类面;
基于所述最优分类面作为分类条件,将所述目标特征子集输入至支持向量机分类器进行学习。
6.根据权利要求2所述的方法,其特征在于,所述对分类后的目标特征子集进行回归拟合,获得故障预测模型,包括:
将分类后的特征子集确定为输入变量;
使用最小二乘法或梯度下降法计算所述输入变量的输出系数;
根据所述输入变量和所述输出系数进行回归拟合,获得故障预测模型。
7.根据权利要求1-6任一所述的方法,其特征在于,所述待预测设备包括:ATE自动化测试设备;所述通讯故障类型包括:上位机通讯链路异常、资源板异常、测试机通讯异常和信息交互错误。
8.一种通讯故障预测装置,其特征在于,所述装置包括:
采集特征模块,用于采集待预测设备运行时间段产生的通讯特征数据;
故障预测模块,用于将所述通讯特征数据输入构建的故障预测模型进行预测,以获得所述待预测设备的通讯故障类型;其中,所述故障预测模型通过对通讯故障特征数据特征提取后,进行数据挖掘构建模型获得。
9.一种电子设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311526428.5A CN117763432A (zh) | 2023-11-15 | 2023-11-15 | 通讯故障预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311526428.5A CN117763432A (zh) | 2023-11-15 | 2023-11-15 | 通讯故障预测方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117763432A true CN117763432A (zh) | 2024-03-26 |
Family
ID=90324535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311526428.5A Pending CN117763432A (zh) | 2023-11-15 | 2023-11-15 | 通讯故障预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117763432A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118174788A (zh) * | 2024-05-13 | 2024-06-11 | 深圳华建信通科技有限公司 | 一种光纤配线柜的故障检测方法、装置、设备及存储介质 |
-
2023
- 2023-11-15 CN CN202311526428.5A patent/CN117763432A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118174788A (zh) * | 2024-05-13 | 2024-06-11 | 深圳华建信通科技有限公司 | 一种光纤配线柜的故障检测方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Coble et al. | Identifying optimal prognostic parameters from data: a genetic algorithms approach | |
CN111459700B (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
US7275018B2 (en) | Method of condition monitoring | |
US8682616B2 (en) | Identifying failures in an aeroengine | |
US10901401B2 (en) | Plan generation apparatus, method and computer readable medium for multi-process production of intermediate product | |
CN116450399B (zh) | 微服务系统故障诊断及根因定位方法 | |
US10430269B2 (en) | Methods and systems for root cause analysis for assembly lines using path tracking | |
CN117763432A (zh) | 通讯故障预测方法、装置、设备及存储介质 | |
CN115729761B (zh) | 一种硬盘故障预测方法、系统、设备及介质 | |
CN115698882A (zh) | 异常调制原因确定装置、异常调制原因确定方法以及异常调制原因确定程序 | |
CN117571742B (zh) | 基于人工智能实现芯片质检的方法及装置 | |
WO2014199177A1 (en) | Early warning and prevention system | |
CN111931334A (zh) | 一种用于评估电缆设备运行可靠性的方法及系统 | |
CN108121656A (zh) | 一种软件评估方法和装置 | |
CN103077441A (zh) | 自识别电子产品的预测健康管理方法 | |
CN116453437B (zh) | 显示屏模组的测试方法、装置、设备及存储介质 | |
CN114577470A (zh) | 用于风机主轴承的故障诊断方法及系统 | |
CN111400920A (zh) | 一种产品关键故障模式识别方法 | |
KR102136863B1 (ko) | S 파라미터 패턴의 기계학습을 이용한 회로 결함분석 방법 | |
CN108446213A (zh) | 一种静态代码质量分析方法和装置 | |
CN116204825A (zh) | 一种基于数据驱动的生产线设备故障检测方法 | |
KR102649453B1 (ko) | 회전기계의 결함을 진단하는 방법 및 시스템 | |
KR20240015457A (ko) | 반도체 제품의 이상 탐지를 위한 적응형 분리 필터 모델 생성방법, 반도체 제품의 이상 탐지 방법, 이의 기록매체 및 시스템 | |
Ye et al. | Information-theoretic syndrome and root-cause analysis for guiding board-level fault diagnosis | |
CN116802471A (zh) | 综合诊断旋转机械的缺陷的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |