CN116956745A

CN116956745A - 密封电子设备多余物定位确信可靠性分析方法

Info

Publication number: CN116956745A
Application number: CN202311022152.7A
Authority: CN
Inventors: 孙志刚; 翟国富; 王国涛; 张敏; 梁琪
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2023-08-14
Filing date: 2023-08-14
Publication date: 2023-10-27
Anticipated expiration: 2043-08-14
Also published as: CN116956745B

Abstract

密封电子设备多余物定位确信可靠性分析方法，属于密封电子设备多余物定位检测技术领域。为了目前还没有一种密封电子设备多余物定位确信可靠性分析方法的问题，本发明提基于多余物定位性能分析，构建关键性能参数与其泛化性能退化机制、确信性能阈值的因果关系；量化脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练及参数优化对定位模型分类性能的不确定性影响，构建确信可靠性模型，在确定确定确信性能阈值之后，根据七个参数指标各自对应的裕量和分类精度提升幅度作为密封电子设备多余物定位确信可靠性分析指标进行可靠性分析。

Description

密封电子设备多余物定位确信可靠性分析方法

技术领域

本发明属于密封电子设备多余物定位检测技术领域，具体涉及一种密封电子设备多余物定位确信可靠性分析方法。

背景技术

密封电子设备是指航天电源、火箭发动机和航天电子单机这些具有电磁屏蔽和密封防水等功能的封闭式构造的电子设备或控制系统，或大型设备与大型系统内部的重要组件，用来完成通信、导航和飞行控制等任务。受生产工艺的限制，在密封电子设备的制造过程中，会产生金属碎屑、点焊飞溅、导线皮等颗粒。这些由外部进入或内部生成的破坏系统内部原有稳定物理结构的颗粒称为多余物。密封电子设备通常运行在超失重和剧烈冲击环境下，内部多余物被激活后处于随机运动状态，会碰撞损坏器件、组件，或附着在电路表面引起短路、断路，或卡在活动部位使部分功能失效等。这些都对密封电子设备的正常运行产生重要威胁，影响航天发射任务的成败，甚至引发重大航天事故和人员伤亡。

颗粒碰撞噪声检测(Particle Impact Noise Detection，PIND)是最常用的多余物检测方法，其基本原理如图1所示。将被测试件固定在声发射传感器平台上，由振动台产生正弦冲击，激活被测试件内部可能存在的多余物，使其处于振动或滑动状态，产生振动信号或滑动信号，称为多余物信号。PIND检测电路捕获可能产生的多余物信号进行处理，并将信号输出至扬声器或示波器。检测人员通过观察扬声器是否有声音产生或示波器是否有波形显示，判断被测试件内部是否存在多余物。在很长一段时间里，许多学者将获取有效的多余物信号作为研究重心，分别从振动台的试验条件设置、声发射传感器平台的构造、检测电路的设计、多余物信号与组件信号的识别等角度出发进行考虑，取得了稳定良好的多余物检测效果，但未对多余物信号自身进行深入研究。

实际上，多余物信号中蕴藏着能够反馈多余物自身属性的信息，如多余物的位置、材质、重量等。这些信息能够反向指导多余物清理与控制工作，如，材质信息可以帮助检测人员追溯多余物的生产环节，制定更为严格的工艺标准来控制多余物的产生。在大型被测试件中，如密封电子设备，其内部结构复杂，位置信息可以帮助检测人员有针对性的开展多余物清理工作，多余物定位研究越来越受到关注。现有多余物定位研究全部集中在国内，并且主要基于传统的声发射源定位方法。如孙永玲等、杨京等基于时差定位法构建了声发射传感器阵列方程，计算多余物的三维坐标；丁丹丹等、戚乐基于区域定位法获取最有效的声发射传感器节点，推断多余物的区域位置。这些方法受被测试件内部结构和组成材质的影响，定位精度较低、定位结果不稳定，参考价值较低。除此之外，郭亮、郜雷阵初步探索了机器学习方法，分别从不同位置产生的多余物信号中提取混沌特性参数或时频特性参数，构建了包含多个标签(对应多个位置)的数据集，训练了性能良好的分类器实现数据分类。这些方法确定了基于机器学习方法的多余物定位研究的基本思路，取得了较为优异和稳定的数据分类结果，证明了基于机器学习方法的多余物定位研究的可行性与优越性，但是并未给出体系化的研究成果。在此基础上，孙志刚深入开展了基于机器学习方法的多余物定位研究，搭建了多余物定位试验系统，给出了多余物定位方法的具体实施步骤，对信号采集、脉冲预处理、特征工程、模型训练等环节进行深入研究，分别得出最优的处理方法，训练了分类性能最优的分类器，较郭亮、郜雷阵训练的分类器，分类性能明显提升。

但是目前针对于采用机器学习方式进行的方案都是侧重于如何提高机器学习模型本身的性能，很少有从对信号本身及进一步处理等不同环节进行全面考虑的分析方法，更没有针对全面环节的可靠性分析方法，也就没有对信号整个判识过程对应的机器学习方案有效性和可靠性的分析手段，因此也就不能很好地指导针对密封电子设备多余物定位确信而设计的机器学习模型进行设计，从而使得设计的机器学习模型及对应的处理过程并不一定能够对“密封电子设备多余物”进行定位有效且优秀的处理方案，也不能为多余物定位方法提出改进意见。

发明内容

为了解决上述问题，本发明提出了一种密封电子设备多余物定位确信可靠性分析方法。

密封电子设备多余物定位确信可靠性分析方法，所述方法针对采用机器学习方式对密封电子设备多余物进行定位的方法进行可靠性分析，对密封电子设备多余物进行定位的过程中，利用N”个声发射传感器采集多余物信号；采用机器学习方式对密封电子设备多余物进行定位的方法包括针对密封电子设备对应多余物信号的预处理过程，对预处理后信号进行特征处理的特征工程，以及机器学习模型训练的过程，所述预处理过程包括脉冲提取、脉冲匹配的步骤，特征工程包括特征提取、特征处理、特征选择的步骤，机器学习模型训练的过程包括分类器训练和参数优化的步骤，将脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练和参数优化的七个步骤的称为七个参数指标；其中，

脉冲提取：针对多余物信号，采用三门限脉冲提取算法提取有用脉冲；

脉冲匹配：基于不同声发射传感器对应提取到的有用脉冲，以多余物信号到达不同声发射传感器的时间为参考，距离最远的声发射传感器接收到多余物信号为基准，采用补零时间差脉冲匹配算法对不同声发射传感器对应提取到的有用脉冲进行脉冲匹配；

特征提取：针对经过脉冲匹配后的每路声发射传感器对应的有用脉冲，从时域和频域中提取多个信号特征；

特征处理：首先对缺失值与异常值进行处理，然后对数据集进行标准化处理；

特征选择：将任意一声发射传感器对应每个特征记为一列特征，将对应一列特征的多个声发射传感器的特征数据的组合视为特征选择的基本单位，基于特征选择的基本单位对特征进行筛选，得到筛选后的特征；

分类器训练：在数据集上进行训练，得到所需的定位模型；将采用机器学习方式对密封电子设备多余物进行定位的方法使用的机器学习模型记为定位模型；

参数优化：对定位模型进行参数优化；

所述方法包括以下步骤：

步骤101、确定确信性能阈值：

设备模型的内部空间分隔为多个密闭空间，基于对密封电子设备多余物进行定位的方法，依次将多余物放置到不同编号的密闭空间内，分别得到多与密闭空间对应的条标签的数据，建立代表多余物被放置在不同密闭空间的初步数据集，然后采用特征工程对初步数据集进行特征处理，并训练分类器，对分类器的内部参数进行优化，得到分类性能最优的分类器，记为最优基准定位模型，并记录最优基准定位模型取得的最高分类精度K0；

将定位模型的分类性能量化为正确预测标签的数据个数占总数据个数的比例；

将最优基准定位模型在多个待测数据集上取得的分类精度均分布区间，根据分类精度均分布区间的最低精度K1和最高精度K2，然后采用K0与K1的差值作为分类精度最大衰减幅度，然后基于分类精度最大衰减幅度和安全裕量确定分类精度衰减幅度的上限值并作为平均退化数值为α，进而得到确信性能阈值q＝α+0.5；

步骤102、基于外界条件的五个参数指标对应的分类性能进行渐进式分析，具体过程包括以下步骤：

首先基于获取的多路声发射传感器对应的原始多余物信号，得到一个初步数据集，针对初步数据集进行特征提取，设特征的类型数量为J个，进而得到一个初步特征数据集，在初步特征数据集上同时训练M”个分类器，每个分类器得到1个分类精度，将此时的分类精度视为初始分类精度，作为用于后续比较的基础；

然后控制每次使用一个参数指标对源头多余物信号进行处理，在处理后的多余物信号上重新建立数据集，并分别训练相同的M”个分类器，分别得到对应的新的分类精度，具体如下：

(1)基于初步数据集，对多路声发射传感器对应的多余物信号分别进行脉冲提取得到有用脉冲，然后进行特征提取，基于有用脉冲对应的特征重新构建一个新的数据集；在此基础上，同样训练M”个分类器，并计算各自对应的分类精度；分别计算不同的分类器分类精度与确信性能阈值q进行比较，将分类精度与确信性能阈值q的差值作为脉冲提取指标裕量；同时分别计算不同的分类器分类精度与各自对应的初始分类精度之差作为精度提升幅度指标；

(2)基于脉冲提取的数据，对多路声发射传感器对应的多余物信号进行脉冲匹配，将经过脉冲匹配的有用脉冲进行特征提取，基于脉冲匹配后有用脉冲对应的特征重新构建新的数据集；在此基础上，同样训练M”个分类器，并计算各自对应的分类精度；分别计算不同的分类器分类精度与确信性能阈值q进行比较，将分类精度与确信性能阈值q的差值作为脉冲匹配指标裕量；同时分别计算不同的分类器分类精度与各自对应的初始分类精度之差作为精度提升幅度指标；

(3)将经过脉冲匹配的有用脉冲进行多通道特征提取：N”个声发射传感器经过脉冲匹配后的有用脉冲是对应的，一组有用脉冲含有N”个对应的有用脉冲，N”个对应的有用脉冲对应于N”个声发射传感器，将一组有用脉冲进行特征提取，将一组有用脉冲对应的N”×J个特征作为一个特征向量；在以特征向量形式构成的数据集上，同样训练M”个分类器，并计算各自对应的分类精度；分别计算不同的分类器分类精度与确信性能阈值q进行比较，将分类精度与确信性能阈值q的差值作为多通道特征提取指标裕量；同时分别计算不同的分类器分类精度与各自对应的初始分类精度之差作为精度提升幅度指标；

(4)基于进行了多通道特征提取的以特征向量形式构成的数据集，进行特征处理，得到经过特征处理的以特征向量形式构成的数据集；在此基础上，同样训练M”个分类器，并计算各自对应的分类精度；分别计算不同的分类器分类精度与确信性能阈值q进行比较，将分类精度与确信性能阈值q的差值作为特征处理指标裕量；同时分别计算不同的分类器分类精度与各自对应的初始分类精度之差作为精度提升幅度指标；

(5)基于经过特征处理的以特征向量形式构成的数据集，进行特征选择，得到经过特征选择之后的以特征向量形式构成的数据集；在此基础上，同样训练M”个分类器，并计算各自对应的分类精度；分别计算不同的分类器分类精度与确信性能阈值q进行比较，将分类精度与确信性能阈值q的差值作为特征选择指标裕量；同时分别计算不同的分类器分类精度与各自对应的初始分类精度之差作为精度提升幅度指标；

步骤103、基于内在属性的两个参数指标对应的分类性能进行渐进式分析，具体过程包括以下步骤：

(a)基于前五个参数指标得出分类器训练对定位模型分类性能的作用效果：

基于前五个参数指标的参数指标裕量和分类精度的提升幅度，将分类性能作用效果最优的分类器作为最优定位模型；取最优定位模型与其他分类器的最优分类精度的差值的均值作为分类精度的提升幅度；

(b)对最优定位模型的内部参数进行参数优化，得到参数优化后的最优定位模型，并计算分类精度，并与确信性能阈值q进行比较，将分类精度与确信性能阈值q的差值作为参数优化指标裕量；同时计算分类精度与初始分类精度之差作为精度提升幅度指标；

步骤104、根据七个参数指标各自对应的裕量和分类精度提升幅度作为密封电子设备多余物定位确信可靠性分析指标进行可靠性分析。

进一步地，所述的密封电子设备多余物定位确信可靠性分析方法还包括以下步骤：

联合七个参数指标同时进行作用，训练最优定位模型，得到最高分类精度；在此基础上，顺序单次调整一个参数指标退出处理流程，重新得到在当前情况下定位模型取得的新的分类精度，通过对比每次重新获取的分类精度与最高分类精度之间的差，间接量化脉冲提取、脉冲匹配、联合特征提取、特征处理、特征选择五个参数指标对最优定位模型的分类性能的影响，进一步进行可靠性分析。

进一步地，采用机器学习方式对密封电子设备多余物进行定位的方法，具体包括以下步骤：

步骤一：根据待测密封电子设备的形状、体积和材质，设计等比例的设备模型；参考密封电子设备的内部空间构造，使用相同材质的薄板将设备模型的内部空间分隔为多个密闭空间，并对每个密闭空间进行编号；打开设备模型，在编号为1的密闭空间内放置多余物，封装设备模型；

步骤二：通过驱动振动台对设备模型施加力学激励，使设备模型内部的多余物处于随机运动状态，生成多余物信号；放置在设备模型表面的四个声发射传感器捕获多余物信号；

步骤三：对多余物信号进行脉冲预处理，然后利用特征工程从预处理后的多余物信号中提取常用时域和频域中的信号特征，并根据步骤一中放置多余物的密闭空间的编号，将这些数据的标签设置为对应的编号；

步骤四：调整步骤一中放置多余物的密闭空间，依次将多余物放置到编号为2、3、…、n的密闭空间内，并重复步骤二至步骤三的操作，分别得到多条标签为“2”、“3”、…、“n”的数据，建立代表多余物被放置在不同密闭空间的数据集；

采用特征工程对数据集进行特征处理；

步骤五：在数据集上训练分类器，并对分类器的内部参数进行优化，得到分类性能最优的分类器；

步骤六：针对待测密封电子，通过驱动振动台对密封电子设备施加力学激励，使密封电子设备内部未知位置的多余物处于随机运动状态，生成多余物信号；重复步骤三与步骤四中脉冲预处理、特征工程的相关程序，得到多条不带标签的数据，构建待测数据集；应用步骤五中的分类器对待测数据集进行预测，得到预测结果。

进一步地，采用三门限脉冲提取算法提取有用脉冲的过程包括以下步骤：

S1211：计算整段多余物信号的平均能量，表示为E_mean；在此基础上，确定尖峰检测阈值E_peak与端点检测阈值E_hs的数值；

S1212：对多余物信号进行第一次分帧处理，设置每个帧信号的时长为Δt₁，计算每个帧信号的能量；

S1213：从第一个帧信号开始，依次将每个帧信号的能量与尖峰检测阈值E_peak对比；当某个帧信号的能量大于尖峰检测阈值E_peak时，从这个帧信号出发，继续依次将之后的每个帧信号的能量与尖峰检测阈值E_peak对比，直至某个帧信号的能量小于尖峰检测阈值E_peak；从这些帧信号中找到能量最大的一个帧信号，获取其对应的时间，即当前有用脉冲的尖峰时刻，表示为t_mmax；

S1214：对多余物信号进行第二次分帧处理，设置每个帧信号的时长Δt₂，Δt₂＜Δt₁，并重新计算每个帧信号的能量；

S1215：以当前有用脉冲的尖峰时刻t_mmax为起点，分别向前和向后将每个帧信号的能量与端点检测阈值E_hs进行对比，直至在两个方向上分别发现某个帧信号的能量小于端点检测阈值E_hs；认定这两个帧信号的前一个帧信号为当前有用脉冲的起始帧信号和终止帧信号；它们对应的时间分别代表当前有用脉冲的起始时刻与终止时刻，分别表示为t_begin与t_end；

S1216：重新以当前搜索到的有用脉冲的终止时刻t_end的下一个帧信号为起点，重复步骤三至步骤五，提取第二个有用脉冲；以此类推，提取整段多余物信号中所有的有用脉冲。

进一步地，所述尖峰检测阈值E_peak＝3E_mean，所述端点检测阈值E_hs＝1.1E_mean。

进一步地，Δt₂＝Δt₁/2。

进一步地，采用补零时间差脉冲匹配算法对不同声发射传感器对应提取到的有用脉冲进行脉冲匹配的过程包括以下步骤：

S1221：使用三门限脉冲提取算法对四通道多余物信号分别进行处理，分别获取第一个有用脉冲的尖峰；在此基础上，获取四个尖峰对应的时间，分别表示为T₁、T₂、T₃和T₄；

S1222：计算得到T₄-T₁、T₄-T₂和T₄-T₃，分别代表多余物信号到达距离最近、第二近、第三近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟；

S1223：在距离最近、第二近、第三近的声发射传感器接收到多余物信号开始时刻前补充时长分别为T₄-T₁、T₄-T₂和T₄-T₃的零信号；

S1224：将四个新的多余物信号的起始时刻对齐，以距离最远的声发射传感器接收到的多余物信号的长度为参考，分别从其他三个多余物信号中截取从起始时刻开始相同长度的信号保留，舍弃后面多余的信号。

进一步地，所述的信号特征包括时间延迟、脉冲上升时间、脉冲对称度、脉冲振幅、脉冲能量、均方根电压、脉冲过零率、频谱质心、频谱均方差、均方根概率、频率标准差。

进一步地，基于特征选择的基本单位对特征进行筛选的过程包括以下步骤：

S1251：计算数据集中通道i中序号为j的特征数据与标签之间的皮尔逊相关系数的绝对值r_ij，i＝1,2，......，I代表列特征数据所属的通道，j＝1,2，...，J代表列特征数据的序号；

S1252：以通道为划分单位，即以r_ij中i为划分单位，将属于同一通道的J列特征数据与标签之间的皮尔逊相关系数的绝对值r_ij累加，得到对应I个通道的求和结果，表示为R_i；计算公式如下：

S1253：基于计算R_i占R_all的比重W_i ^p，作为通道加权系数：

s1254：将r_ij乘以对应的通道加权系数W_i ^p得到

S1255：基于计算I个求和结果

S1256：将进行降序排列，得到对应的排序编号N_j；

S1257：将排序编号N_j中排名前5至前11的组合分别进行保留，构建7个保留不同特征数据的新数据集；应用分类器分别在7个新数据集上进行十折交叉验证，得到7个平均分类精度；比较得到分类器在哪个新数据集上取得最高的平均分类精度，则构建该新数据集的特征数据的组合是最优的，由此得到特征选择结果。

进一步地，对定位模型进行参数优化的过程中采用网格搜索法进行参数优化。

有益效果：

本发明以提升分类器的分类性能或定位性能的裕量为核心，提出了一种多余物定位确信可靠性分析方法，其根据基于机器学习方法的多余物定位研究的主要定位原理与关键性能参数，从声学特性-多分类耦合作用机理出发，综合考虑密封电子设备多余物定位方法的内在属性、外界条件及不确定性的影响，来建立密封电子设备多余物定位确信可靠性模型。在该模型中，将对分类器的分类性能或定位性能产生影响的几个关键性能参数总结为内在属性和外界条件，并通过具体实验案例来分析它们对密封电子设备多余物定位确信可靠性模型的影响，能够有效为多余物定位方法提出设计改进意见。

附图说明

图1为PIND法的检测原理示意图。图2为多余物定位试验系统示意图。图3为密封电子设备多余物定位确信可靠性建模框架图。图4为七个参数指标的位置分布与相互联逻辑图。图5为三门限脉冲提取示意图。图6为补零时间差脉冲匹配的示意图。图7为多余物定位试验实物图。图8为最优定位模型取得的分类精度。图9为分类器在不同方法处理后的数据集上取得的分类精度。图10为七个参数指标对定位模型分类性能的作用效果。

具体实施方式

具体实施方式一：本实施方式为密封电子设备多余物定位确信可靠性分析方法，在图1所示PIND法检测原理的基础上，结合DZJC-III型微粒碰撞噪声多余物自动检测系统(简称为多余物自动检测系统)，搭建了多余物定位试验系统，如图2所示。它包括三部分：

第一部分为硬件平台(左边部分)，包括被测试件、隔声材料、夹具、振动台和振动台驱动装置等。硬件平台用于激励待测物体，使内部多余物处于随机运动状态，生成多余物信号。第二部分为多余物自动检测系统(中间部分)，多余物自动检测系统提供的四个声发射传感器放置在被测试件表面，捕获多余物信号并送入系统内部进行信号处理，保存为数字式信号文件。第三部分为在上位机完成的算法处理(右边部分)，算法处理包括脉冲预处理、特征工程和模型训练等步骤，最终训练性能良好的分类器。

多余物定位方法的核心思想在于研究对象的两次迁移。由于技术手段和保密管理等因素的限制，无法获得授权直接拆解密封电子设备来开展研究。因此，根据密封电子设备的形状、体积和材质，本发明设计了等比例的密封电子设备模型(简称为设备模型)。这样，先以设备模型为研究对象，通过信号采集、脉冲预处理、特征工程、模型训练等步骤，训练一个性能良好的分类器。然后，再以密封电子设备为研究对象，通过信号采集、脉冲预处理、特征工程等步骤，构建待测数据集，利用分类器给出待测数据集的预测结果。参考机器学习的通道学习流程，设计了多余物定位方法的具体实施步骤，如下：

步骤一：根据待测密封电子设备的形状、体积和材质，设计等比例的设备模型。需要说明的是，设备模型的材质与密封电子设备内侧壁的材质相同，以此来保证应力产生的多余物信号的一致性。参考密封电子设备的内部空间构造，使用相同材质的薄板将设备模型的内部空间分隔为多个密闭空间，并对每个密闭空间进行编号。打开设备模型，在编号为1的密闭空间内放置多余物，封装设备模型。

步骤二：将设备模型固定到多余物定位试验系统的硬件平台上。通过驱动振动台对设备模型施加力学激励，使设备模型内部的多余物处于随机运动状态，生成多余物信号。放置在设备模型表面的四个声发射传感器捕获多余物信号，经传输线发送至多余物自动检测系统内部，进行信号放大、信号滤波和同步采集等处理。

步骤三：对多余物信号进行脉冲预处理。使用两级双门限脉冲提取算法进行脉冲提取，使用补零时间差脉冲匹配算法进行脉冲匹配。从处理后的多余物信号中提取常用时域和频域中的信号特征，构建大量特征向量，得到多条数据；并根据步骤一中放置多余物的密闭空间的编号，将这些数据的标签设置为对应的编号。

步骤四：调整步骤一中放置多余物的密闭空间，依次将多余物放置到编号为2、3、…、n的密闭空间内，并重复步骤二至步骤三的操作，分别得到多条标签为“2”、“3”、…、“n”的数据，建立代表多余物被放置在不同密闭空间的数据集。对数据集进行特征优化处理，包括缺失值处理、标准化处理和特征选择，得到高质量的数据集。

步骤五：在数据集上训练合适的分类器，并对分类器的内部参数进行优化，使其分类性能达到最优。

步骤六：将待测密封电子设备固定到多余物定位试验系统的硬件平台上。通过驱动振动台对密封电子设备施加力学激励，使密封电子设备内部未知位置的多余物处于随机运动状态，生成多余物信号。重复步骤三与步骤四中脉冲预处理、特征工程的相关程序，得到多条不带标签的数据，构建待测数据集。应用步骤五中的分类器对待测数据集进行预测，得到预测结果。

以上述过程采集的信号和预测结果为基础，展开本本实施方式所述的密封电子设备多余物定位确信可靠性分析方法，具体过程如下：

为了综合考虑密封电子设备多余物定位方法的内在属性、外界条件及不确定性的影响，精确量化其可靠性，基于确信可靠性理论的三个基本原理，构建了密封电子设备多余物定位确信可靠性模型，建模框架如图3所示。

首先，在密封电子设备多余物定位性能及主要定位原理分析的基础上，围绕声学特性-多分类耦合作用，提取关键性能参数表征定位模型的分类性能。其次，基于退化永恒原理，建立定位模型分类性能退化模型。然后，基于裕量可靠原理，结合确信性能阈值建立定位模型分类性能裕量模型。分类性能退化模型与分类性能裕量模型结合，建立裕量退化模型。最后，对于裕量退化模型，从内在属性和外界条件两个角度展开不确定性分析，并基于不确定理论量化不确定性，构建密封电子设备多余物定位确信可靠性模型。更具体地，

S11、密封电子设备多余物定位性能分析

主要定位原理：基于机器学习方法的多余物定位研究的创新之处在于将多余物定位问题转化成机器学习的多分类问题。对于待测密封电子设备，前述内容设计了属性尽可能一致的设备模型，根据待测密封电子设备的内部空间构造，使用材质一致的薄板将设备模型的内部空间划分为多个密闭空间。需要说明的是，密封电子设备内部由线路电缆、电路板、功能模块等组件组成，这些组件将密封电子设备的内部空间分隔为多个空间。由于组件分布的密集性，这些空间被各种组件环绕，近似密闭，多余物在这些空间做随机运动不会越界。因此可以将它们视为近似密闭的空间，这也是利用薄板将设备模型内部空间划分为多个密闭空间的依据。实际上，划分的密闭空间的数量就是需要进行分类的类别的数量。这是因为，在控制其他变量恒定的情况下，在不同密闭空间内生成的多余物信号的声学特性存在差异。在特征提取阶段，从这些多余物信号上提取多域信号特征实际上就是量化声学特性差异的过程，最终表现为得到的数据之间的分布差异。这样，在由不同分布的数据组成的数据集上可以训练分类器，分类器能够主动识别数据的分布差异，主动划定超平面来隔离不同分布的数据，实现数据分类。总结来说，密封电子设备的内部空间就是定位的总区间，不同密闭空间就是定位的基本区间，即最小单位。在N个密闭空间内生成的多余物信号的声学特性差异可以量化为N种不同分布的数据，通过分别设置标签可以建立包含N种类别的数据集，由此训练合适的分类器实现N种类别的数据分类。这就是基于机器学习方法的多余物定位研究的主要定位原理。

由上述分析可以看出，密封电子设备多余物定位方法的主要定位原理在于声学特性-多分类耦合作用，关键在于分类器，即定位模型的分类性能。训练分类性能最优的定位模型(简称为最优定位模型)是最终目的，也能实现裕量最大化。由于定位模型是在数据集上训练的，这是源头。从这个源头到最后的最优定位模型之间经过分类器训练和参数优化的过程。因此，从最优定位模型往前推一步是得到合适的分类器和该分类器内部参数的最优值组合，这是模型训练部分处理的结果，也是跟定位模型自身相关的性能参数，即内在属性。再往前，定位模型是在数据集上训练的，此时，数据集会直接对定位模型的分类性能产生影响，属于外界条件。

在机器学习中，质量更高的数据集训练的分类器的分类性能越好，而对数据集进行系列化优化处理的过程称为特征工程，包括特征提取、特征处理与特征选择，分别用于将非数据格式的其他文件转化为多维特征向量、处理数据集中的不完备数据与非标准数据、筛选对分类器的分类性能贡献大的特征数据。因此，从默认参数配置的定位模型往前推一步是得到高质量的数据集，这是特征工程部分的处理结果，是跟定位模型自身不相关的性能参数，即第一个外界条件。再往前，数据集是在多余物信号的基础上通过特征提取构建的，此时，多余物信号会直接对数据集产生影响，间接对定位模型的分类性能产生影响，同样属于外界条件。

在机器学习中，质量越高的信号构建的数据集的质量越好，而对多余物信号进行系列化处理的过程称为脉冲预处理，包括脉冲提取与脉冲匹配，分别用于提取多余物信号中的有用脉冲、匹配四通道多余物信号中在时间刻度上对应相关的有用脉冲，后续的特征提取就是在有用脉冲上进行特征计算实现的。因此，有用脉冲提取和匹配的越准确，特征计算的结果越可靠，得到的特征向量，即数据，的质量越好。从高质量的数据集往前推一步是得到高质量的多余物信号，即高质量的有用脉冲，这是脉冲预处理部分的处理结果，是跟定位模型自身不相关的性能参数，即第二个外界条件。再往前，多余物信号是由多余物自动检测系统输出的，在输出之前进行的信号处理均是在多余物自动检测系统内部自动化完成的。此时，无法再往前得到更为源头的资源，也即，多余物自动检测系统输出的多余物信号就是对定位模型的分类性能产生影响的源头环节。

综上所述，影响定位模型分类性能的关键性能参数包括脉冲预处理、特征工程与模型训练三部分，具体来说，包括脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练和参数优化共七个环节，称为七个参数指标。其中，脉冲提取、脉冲匹配、特征提取、特征处理与特征选择属于外界条件，分类器训练与参数优化属于内在属性。图4给出了七个参数指标的位置分布与相互联系。

S12、构建裕量退化模型：

S121、搭建分类性能退化模型：

对定位模型来说，其分类性能可以量化为在数据集上取得的分类精度，具体来说，是在由n条数据组成的数据集上取得的分类精度。根据机器学习中分类精度的定义可以进一步得到，定位模型的分类性能可以量化为正确预测标签的数据个数占总数据个数的比例。对于能够取得分类精度为a(0＜a≤1)的定位模型来说，它能够正确预测由n条数据组成的数据集中a×n条数据的标签。因此，参考多余物定位方法的具体实施步骤，对于待测密封电子设备，通过一系列处理，在某个未知位置(密闭空间)生成的多余物信号，最终可以得到多条不带标签的数据，组建待测数据集。需要说明的是，因为生成多余物信号的位置是确定且唯一的，所以待测数据集中所有数据的标签应该也是确定且唯一的，即这些数据的标签应该是相同的。

假设待测数据集中包含m条不带标签的数据，根据上述分析，定位模型能够正确预测其中a×m条数据的标签，并且这些标签是相同的。从多数表决的角度来说，当这a×m条数据占据很大的表决权时，才能在多数表决中胜出，这样，这a×m条数据的标签才能被确定为待测数据集中所有数据的标签，称为待测数据集的共同标签。因为这a×m条数据的标签是正确的，所以待测数据集的共同标签是正确的，它对应的密闭空间的编号才是正确的定位结果，待测密封电子设备内部多余物能够被正确定位。当对“占据很大的表决权”进行量化时，可以发现，这进一步缩小了a的取值范围，即要求a＞0.5。总结来说，当0.5<a≤1时，a×m条数据能够在多数表决中获胜，它们正确的标签能够被确定为共同标签，待测密封电子设备内部多余物能够被正确定位。往前推，这要求定位模型在待测数据集上取得的分类精度稳定大于50％。因此，0.5被视为分类性能的阈值(简称为性能阈值)，同样称为基础性能阈值。定位模型在待测数据集上取得的分类精度高于基础性能阈值，才能保证最终的定位结果是确信可靠的。

然而，在机器学习中，分类器往往能够在训练集上取得较高的分类精度，但很少能在验证集或测试集上取得同样高的分类精度，这就是分类器泛化性能的降低。在本发明中，参考多余物定位方法的具体实施步骤，最优定位模型能够在数据集上取得最高的分类精度，但在待测数据集上取得的分类精度一定会有所下降，即分类性能的退化。假设定位模型在待测数据集上取得分类精度的平均退化数值为α，则在模型训练阶段需要保证定位模型取得的分类精度q-α＞0.5。参考图4所示的七个参数指标的位置分布与相互关系，以及定位模型的分类性能退化规律，可以得到分类性能退化模型，即：最优定位模型取得的分类精度q＞α+0.5。

S122、搭建分类性能裕量模型：

从多余物自动检测系统输出的多余物信号开始至得到最优定位模型，脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练和参数优化是影响定位模型分类性能的七个参数指标，也是训练定位模型的必要环节。对这七个环节的构建完整的分类性能裕量模型。

(1)脉冲提取

多余物自动检测系统输出的多余物信号中通常会包含一些电磁干扰和微弱的背景噪声。并且，分类器不能直接输入信号进行分类，需要将信号转化为数据再输入。而数据是在多余物信号中有用脉冲上进行特征计算得到的。考虑到多余物信号是由连续振荡的有用脉冲组成，而瞬时电磁干扰或背景噪声只是一个短时振荡的脉冲。根据该信号特性，采用三门限脉冲提取算法，其原理如图5所示，其实现步骤如下：

S1211：计算整段多余物信号的平均能量，表示为E_mean。在此基础上，确定尖峰检测阈值E_peak与端点检测阈值E_hs的数值。

根据经验，一些实施例中设置尖峰检测阈值E_peak＝3E_mean，端点检测阈值E_hs＝1.1E_mean。

S1212：对多余物信号进行第一次分帧处理，设置每个帧信号的时长Δt₁为100μs，计算每个帧信号的能量。

S1213：从第一个帧信号开始，依次将每个帧信号的能量与尖峰检测阈值E_peak对比。当某个帧信号的能量大于尖峰检测阈值E_peak时，从这个帧信号出发，继续依次将之后的每个帧信号的能量与尖峰检测阈值E_peak对比，直至某个帧信号的能量小于尖峰检测阈值E_peak。从这些帧信号中找到能量最大的一个帧信号，获取其对应的时间，即当前有用脉冲的尖峰时刻，表示为t_mmax。

S1214：对多余物信号进行第二次分帧处理，设置每个帧信号的时长Δt₂为50μs，并重新计算每个帧信号的能量。

S1215：以当前有用脉冲的尖峰时刻t_mmax为起点，分别向前和向后将每个帧信号的能量与端点检测阈值E_hs进行对比，直至在两个方向上分别发现某个帧信号的能量小于端点检测阈值E_hs。认定这两个帧信号的前一个帧信号为当前有用脉冲的起始帧信号和终止帧信号。它们对应的时间分别代表当前有用脉冲的起始时刻与终止时刻，分别表示为t_begin与t_end。

S1216：重新以当前搜索到的有用脉冲的终止时刻t_end的下一个帧信号为起点，重复步骤三至步骤五，提取第二个有用脉冲。以此类推，提取整段多余物信号中所有的有用脉冲。

(2)脉冲匹配

多余物信号到达不同声发射传感器的时间不同，会带来四通道采集的多余物信号中有用脉冲信号的起始时刻的不同步(不匹配)的问题。如图6左半部分所示，由上至下的四幅信号图分别代表距离多余物由近及远的四个声发射传感器在相同时间内接收到的多余物信号。可以看出，当距离最远的声发射传感器开始接收多余物信号时，其他三个声发射传感器已经采集一段信号了。因此，在相同时间内，距离最远的声发射传感器采集的多余物信号最少。在特征提取环节，需要从时间上对应的四通道多余物信号上提取信号特征，构建数据集，有用脉冲不同步的问题会对此产生影响。因此，以距离最远的声发射传感器接收到多余物信号为参考，采用补零时间差脉冲匹配算法进行处理，其实现步骤如下：

S1221：使用三门限脉冲提取算法对四通道多余物信号分别进行处理，分别获取第一个有用脉冲的尖峰。在此基础上，获取四个尖峰对应的时间，分别表示为T₁、T₂、T₃和T₄。

S1222：计算得到T₄-T₁、T₄-T₂和T₄-T₃，分别代表多余物信号到达距离最近、第二近、第三近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟。

S1223：在距离最近、第二近、第三近的声发射传感器接收到多余物信号开始时刻前补充时长分别为T₄-T₁、T₄-T₂和T₄-T₃的零信号。

(3)特征提取

分类器不能直接输入信号进行分类，需要将信号转化为数据再输入，从时域和频域中共提取了11个信号特征，如表1所示。在此基础上，分别在四通道多余物信号中每个有用帧信号上进行特征计算，融合四通道的特征计算结果构建多条数据。

表1 11个信号特征的具体描述

(4)特征处理

在多余物信号的采集过程中，如果距离多余物最远的声发射传感器采集的多余物信号的能量较小，会导致特征计算的结果中出现缺失值。同时，多余物信号中不可避免的强干扰背景噪声会导致特征计算的结果中出现异常值。当数据集中存在缺失值和异常值时，会对分类器训练产生较大影响。因此，需要对缺失值与异常值进行处理。针对基于机器学习方法的多余物定位研究中建立的数据集，建立一个不完备数据处理模型，并得到其对于缺失值与异常值的处理规则。当数据集中异常值的占比小于或等于2％，采用直接丢弃法进行处理。如果异常值的占比介于2％和23％之间，直接将异常值处理缺失值统一处理。当数据集中缺失值的占比小于或等于3％，采用直接丢弃法进行处理。如果缺失值的占比介于3％至7％之间，采用统计法填充进行处理。如果缺失值的占比介于7％至67％之间，采用kNN预测模型进行处理。

此外，在数据集中，不同信号特征对应特征数据的数值分布存在差异性。如，频谱质心和频谱均方差对应特征数据的数值分布在0.9至1的区间内，而上升时间和时间延迟对应特征数据的数值分布在0.0001以内，两者之间数值分布相差9000倍以上。因此，需要对数据集进行标准化处理，以期将不同信号特征对应特征数据的数值分布调整到统一尺度内，确保受到分类器的平等对待。通常情况下，标准化处理方法包括z分数标准化方法、min-max标准化方法和行归一化方法。其中，z分数标准化方法与min-max标准化方法是以列特征数据为研究对象，行归一化是行特征数据为研究对象。

(5)特征选择

在机器学习中，数据集中的一些特征数据对提升分类器的分类性能的作用不大，甚至可能会起反作用。这样，分类器在包含所有特征数据的数据集上取得的分类精度反而低于在仅包含有效特征数据的数据集上取得的分类精度。特征选择就是从数据集中筛选出那些对分类器的分类性能贡献大的特征(特征数据)的过程。需要说明的是，在本发明中，不能直接将每列特征数据看作独立的个体，而应该将对应同一信号特征的四个声发射传感器对应的特征数据的组合视为特征选择的基本单位。这实际上考虑了多余物信号的四通道特性，即单次生成的多余物信号是同时被四个声发射传感器采集。因此，使用新设计的基于通道加权的特征选择方法进行处理，其实现步骤如下：

S1251：利用公式(1)计算数据集中通道i中序号为j的特征数据与标签之间的皮尔逊相关系数的绝对值，表示为r_ij，r_ij代表通道i的第j个特征。i＝1,2,3,4代表列特征数据所属的通道，j＝1,2，...，11代表列特征数据的序号(每个特征对应一个列特征，每个通道有11列特征数据)。

其中，I表示通道i的第j个特征所对应数值的序号，n表示通道i的第j个特征所对应数值的数量；及σX分别表示列特征数据X_I的标准分数、均值和标准差，(及σY分别表示标签Y_I的标准分数、均值和标准差。

S1252：以通道为划分单位，即以r_ij中i为划分单位，将属于同一通道的11列特征数据与标签之间的皮尔逊相关系数的绝对值r_ij累加，得到对应四个通道的四个求和结果，表示为R_i(i＝1,2,3,4)。计算公式如下：

S1253：计算44列特征数据(四个通道共计44列特征数据)与标签之间的皮尔逊相关系数的绝对值的和，表示为R_all。计算R_i(i＝1,2,3,4)占R_all的比重，称为通道加权系数，表示为W_i ^p(i＝1,2,3,4)，计算公式如下：

其中，R_i表示通道i中11列特征数据与标签之间的皮尔逊相关系数的绝对值的和。

S1254：根据r_ij(i＝1,2,3,4，j＝1,2，...，11)中的i，即表征其所属的通道，将其乘以对应的通道加权系数W_i ^p(i＝1,2,3,4)。举例来说，r_1j(j＝1,2，...，11)是属于通道一的11列特征数据，将它们乘以通道一的通道加权系数W₁ ^p。这样，得到44个经过加权的新数值，表示为计算公式如下：

其中，W_i ^p表示通道i对应的通道加权系数。

S1255：以对应同一信号特征为划分依据，将44列特征数据划分为11个组合。在此基础上，累加同一组合内四列特征数据的新值得到11个组合的新值和，表示为计算公式如下：

S1256：将进行降序排列，得到对应的排序编号N_j(j＝1,2，...，11)。

S1257：将排序编号N_j中排名前5至前11的组合分别进行保留，构建7个保留不同特征数据(即分别保留5、6、7、8、9、10和11个特征)的新数据集。应用分类器分别在7个新数据集上进行十折交叉验证，得到7个平均分类精度。比较得到分类器在哪个新数据集上取得最高的平均分类精度，则构建该新数据集的特征数据的组合是最优的，由此得到特征选择结果。

(6)分类器训练

在机器学习中，分类器主要包括线性分类器与非线性分类器两部分。其中，线性分类器适用于中低等维度的二分类问题，非线性分类器适用于高纬度的多分类问题。考虑到建立的数据集包含44列特征数据，是高等维度，并且包含两种以上的标签，是多分类问题。因此，本发明选择非线性分类器，具体包括：朴素贝叶斯、k近邻、决策树、基于径向基核函数的支持向量机(简称为RBF-SVM)、随机森林等。由它们在数据集上进行训练，得到所需的定位模型，并开展后续的参数优化。

(7)参数优化

在训练分类器时，如果采用默认参数配置，往往在通用数据集中能够取得较好的分类性能。对于特殊结构或专属领域内的数据集，需要对分类器的内部参数进行优化设计，来进一步提高其分类性能。在机器学习中，网格搜索法是常用的工具，它通过设定参数寻优对象，具体参数内容，参数数值范围和步长，通过融合式遍历搜索的方式，输出设定参数寻优对象各内部参数的最优取值，以及此时的分类精度。同时，一些优化算法，如模拟退火、粒子群优化等，常被用来减少寻优时间。

S123、搭建不确定性量化模型

如前所述，影响定位模型的分类性能的七个参数指标包括脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练和参数优化，并且这七个参数指标依次对应多余物定位方法的七个处理环节。因此，出于多余物定位方法处理流程的考虑，在不确定性量化部分，先对外界条件进行分析，再对内在属性进行分析。

(A)外界条件：

根据前面的分析，多余物自动检测系统输出的多余物信号是整个多余物定位方法处理流程的源头环节，后续相继开展的脉冲提取与脉冲匹配研究是信号质量层面的，通常情况下是使用信号检测指标进行评估，无法直接与分类器的分类性能建立联系。同样的，特征提取、特征处理与特征选择研究是数据集质量层面的，通常情况下是使用数据处理指标进行评估，也无法直接与分类器的分类性能建立联系。因此，这五个参数指标对定位模型的分类性能的影响无法直接进行评估，具有多源不确定性。

在本发明中，使用了两套方案来量化上述参数指标对定位模型的分类性能的不确定性影响。

一方面，对源头环节的多余物信号进行简单处理，避开中间涉及的五个处理环节，即五个参数指标的作用，建立一个初步的数据集，并结合控制变量法，在初步的数据集上同时训练前面提及的五个非线性分类器(朴素贝叶斯、k近邻、决策树、RBF-SVM、随机森林)，分别得到五个分类精度。这五个分类精度视为初始阶段，即用于后续比较的基础。这样，控制每次使用一个参数指标对源头多余物信号进行处理，在处理后的多余物信号上重新建立数据集，并训练同样的五个分类器，得到五个新的分类精度。通过比较顺序单次使用的参数指标对五个分类器的分类精度的提升幅度，可以间接量化五个参数指标对定位模型的分类性能的影响。

另一方面，开展完整的多余物定位方法处理流程，即联合所有参数指标同时进行作用，训练最优定位模型，得到最高分类精度。在此基础上，顺序单次调整一个参数指标退出处理流程，重新得到在当前情况下定位模型取得的新的分类精度。通过对比每次重新获取的分类精度与最高分类精度之间的差，间接量化五个参数指标对定位模型的分类性能的影响。

(B)内在属性：

不同于外界条件的五个参数指标，分类器训练与参数优化均是直接对定位模型的分类性能产生影响，但分类器训练产生的不确定性影响同样不能直接进行评估。参考多余物定位方法的处理流程，实际上，在分类器训练环节，是以固定的数据集为基础，训练不同分类器来比较它们之间分类性能的差异，获取最优的分类器，进而构建定位模型。然而，当采用搭建不确定性量化模型的外界条件中的两套方案来量化参数指标的不确定性影响时，尽管分别训练了五个分类器，但五个分类器都各自拥有一套独立的处理流程，且每个流程中都具体使用了一个的分类器，无法直接进行横向对比。同时在机器学习中，不存在一个标准分类器可以作为基础，与其他分类器进行对比。因此，在本发明中，对于分类器训练的作用效果，取该环节最优分类器取得的最高分类精度与其他四个分类器取得的分类精度之间差值的均值，来评估该参数指标对定位模型的分类性能的影响。

经过分类器训练的作用，可以得到一个最优分类器，其余四个分类器及对应的处理流程结束。参数优化产生的不确定性影响可以参考上述的两套方案：一方面，对最优分类器的内部参数进行优化，得到参数优化的分类器，即最优定位模型取得的新的分类精度。比较该分类精度与分类器训练阶段得到的分类精度之间的提升幅度，间接量化参数优化对定位模型的分类性能的影响。另一方面，在开展完整的多余物定位方法处理流程的基础上，调整参数优化退出处理流程，重新得到定位模型取得的新的分类精度。通过对比当前分类精度与最高分类精度之间的差，间接量化参数优化对定位模型的分类性能的影响。

实施例

基于具体实施方式提出的确信可靠性分析方法，以某型号的航天电子单机设备为案例对象，分析并建立了分类性能退化模型与分类性能裕量模型，最终构建了适用的多余物定位确信可靠性模型。值得说明的是，在分类性能裕量模型建立部分，从两个方面进行方案设计，一种是全体参数指标渐进式分析方案，另一种是个体参数指标模块化分析方案，分别用于评估定位模型在不同阶段取得的分类性能与性能阈值之间的裕量关系，以及渐进式的增长趋势，以及用于评估各参数指标对定位模型分类性能的不确定性影响，以及模块化的贡献程度。

A1分析对象

以某型号的航天电子单机设备为研究对象，其尺寸为80cm×80cm×80cm。参考具体实施方式的步骤，设计等比例的设备模型，并将其固定到多余物定位试验系统的硬件平台上，如图7所示。考虑到该型号航天电子单机设备内部被各种组件分隔为八个比较大的近似密闭的空间，并且这八个空间分布在八个顶角周围，因此使用相互正交的三块薄板将设备模型的内部空间划分为八个近似相等的密闭空间。划分八个密闭空间意味着后续建立的数据集中包含八种标签的数据。依次将多余物放置到八个密闭空间内，通过一系列处理，得到多段由多余物自动检测系统输出的在不同密闭空间生成的多余物信号，这是建立密封电子设备多余物定位确信可靠性模型的源头环节。

A2分类性能退化模型构建

定位模型的基础性能阈值为a＝0.5，且定位模型在待测数据集上取得分类精度的平均退化数值为α，因此定位模型的确信性能阈值为q＝α+0.5。需要确定α的取值，就能确定确信性能阈值q的取值。值得说明的是，按照多余物定位方法的具体实施步骤，需要在得到最优定位模型的基础上，将其应用于待测密封电子设备构建的待测数据集上进行预测，才能确定其在陌生数据集上分类性能的衰减程度，量化为分类精度的减少幅度。在具有代表性的足够数量的测试范围内，可以拟合其分类性能的平均衰减程度，近似得到α的取值。但本发明的研究重心在于对定位模型的可靠性进行评估，最终要建立密封电子设备多余物定位确信可靠性模型，需要先确定定位模型的平均衰减程度，由此确定定位模型的确信性能阈值，并由此开展对各参数指标的分析。因此，先借用由A1分析对象得出的部分结论。

针对某型号的待测航天电子单机设备，参考多余物定位方法具体实施步骤的步骤一至步骤五，得到最优定位模型，其取得的最高分类精度为96.92％。参考步骤六，在多个相同型号的待测航天电子单机设备的基础上，构建了多个待测数据集，并应用最优定位模型进行预测，对各待测数据集的预测结果进行多数表决处理，分别得到各自的共同标签。同时，在此过程中，计算各待测数据集中，标签与共同标签相同的数据的数量占数据总数量的比例，得到最优定位模型分别在多个待测数据集上取得的分类精度。图8示出了最优定位模型在随机选择的20个待测数据集上取得的分类精度。

从图中可以看出，最优定位模型在20个待测数据集上取得的分类精度均分布在89％至92％的区间，取得的最低分类精度为89.89％，最高分类精度为91.07％。相较于最优定位模型取得的96.92％，分类精度最大衰减幅度为7.03％。经过计算，最优定位模型在20个待测数据集上取得的平均分类精度为90.42％，相较于96.92％，降低了6.50％。从图中折线的变化趋势来看，上述最优定位模型分类性能的衰减程度是具有广泛代表性的。出于保留安全裕量的考虑，将分类精度衰减幅度的上限设置为8％，这既向下兼容了现有的7.03％，也预留了一定的弹性空间来避免极端情况的发生。总结来说，平均退化数值α被设置为0.08，确信性能阈值q被设置为0.58。

A3全体参数指标渐进式分析

基于A1得到的多段由多余物自动检测系统输出的多余物信号进行如下过程。实际上，影响定位模型分类性能的七个参数指标都是在多余物信号的基础上往前推进的一个处理环节，且每个处理环节都会直接提升信号或数据集的质量，进而提高定位模型的分类性能。为了评估定位模型在不同参数指标作用下取得的分类性能与确信性能阈值之间的裕量关系，首先将多余物信号转化成了数据集，训练分类器，将取得的分类精度作为起始点。在此基础上，依次使用七个参数指标分别进行处理，得到新的分类精度及其增长趋势，给出裕量关系分析结果。如果不进行特征提取则无法采用机器学习的方式对多余物信号进行有效处理，因此在依次使用七个参数指标分别进行处理时，都是基于信号提取如表1所示的11个信号特征进行识别，同时又要对特征提取的影响以及对其进行可靠性分析，所以在脉冲提取、脉冲匹配和特征提取时将四个声发射传感器的四通道数据按照如下方式进行处理并进行可靠性分析。

A3.1外界条件

从多余物信号上提取表1所示的11个信号特征，添加标签并构建初步的数据集。需要说明的是，为了凸显特征提取对定位模型分类性能的作用效果，并未考虑多余物信号的四通道特性，而是将每个多余物信号视为独立的个体进行处理，最终得到的每条数据是1×12维的，分别包含1个标签和11个特征数值。在初步的数据集上，训练了基于朴素贝叶斯、k近邻、决策树、RBF-SVM与随机森林的分类器，取得的分类精度分别为45.48％、50.41％、48.10％、50.77％与51.74％。对比确信性能阈值58％，五个分类器均未达到裕量要求。

(1)脉冲提取

使用三门限脉冲提取算法对多段多余物信号分别进行处理，并在处理后的信号上重新提取11个信号特征来构建新的数据集。在此基础上，同样训练了基于朴素贝叶斯、k近邻、决策树、RBF-SVM与随机森林的分类器，取得的分类精度分别为48.04％、53.81％、49.66％、53.70％与54.42％。对比确信性能阈值58％，在脉冲提取的作用下，五个分类器分类性能的裕量分别为-9.96％、-4.19％、-8.34％、-4.30％与-3.58％。相比起始阶段，五个分类器取得的分类精度均有明显提升，提升幅度分别为2.56％、3.40％、1.56％、2.93％与2.68％，平均提升幅度为2.63％，这显示了脉冲提取积极的作用效果。其中，随机森林取得了最高的分类精度为54.54％，已经开始接近确信性能阈值。

(2)脉冲匹配

使用补零时间差脉冲匹配算法对多段多余物信号分别进行处理，并在处理后的信号上重新提取11个信号特征来构建新的数据集。在此基础上，同样训练了基于朴素贝叶斯、k近邻、决策树、RBF-SVM与随机森林的分类器，取得的分类精度分别为47.95％、53.84％、49.64％、53.83％与54.61％。显然，在脉冲匹配的作用下，相较于在脉冲提取的作用下，五个分类器取得的分类精度并无明显提升。经过计算，五个分类器取得分类精度的提升幅度分别为-0.09％、0.03％、-0.02％、0.13％与0.19％，平均提升幅度为0.05％。这显示了脉冲匹配较为一般的作用效果。其中，同样是随机森林取得了最高的分类精度，并且逐步逼近确信性能阈值。同时，计算得到五个分类器分类性能的裕量分别为-10.05％、-4.16％、-8.36％、-4.17％与-3.39％。

需要说明的是，在此处脉冲匹配并未发挥积极明显的作用，这是因为在构建数据集时未考虑多余物信号的四通道特性，没有将在同一时刻采集的四段多余物信号上计算的特征数值融合到一起。但这个环节是必不可少的，它为特征提取奠定重要基础。

(3)特征提取

对于同一时刻采集的四段多余物信号，获得它们各自的第一个有用脉冲，分别计算表1所示11个信号特征的数值，分别得到四通道各自11个特征数值。在外界条件相关的处理中，分别将每个通道的11个特征数值构建特征向量，并分别添加标签，共得到四个特征向量。考虑到多余物信号的四通道特性，即同时捕获的四段多余物信号之间是存在相互联系的、不能将它们作为独立个体，将四通道共44个特征数值构建特征向量，只添加一个标签，得到一个特征向量。通过相同的处理步骤，依次对四段多余物信号中第二个至最后一个有用脉冲进行处理，得到多个特征向量。值得说明的是，此时构建的特征向量的数量与每段多余物信号中有用脉冲的数量一致，而不是四段多余物信号中有用脉冲的总数量。此时可以看出，正是因为脉冲匹配的处理，才能保证四段多余物信号中序号相同的有用脉冲在时间上是对应相关的。

参考上述处理流程，在经过脉冲匹配处理的多段多余物信号上重新进行特征提取，构建了新的数据集。在此基础上，训练了基于朴素贝叶斯、k近邻、决策树、RBF-SVM与随机森林的分类器，取得的分类精度分别为72.74％、79.76％、79.65％、81.96％与84.08％。对比确信性能阈值58％，在特征提取的作用下，五个分类器均达到甚至远超裕量要求。经过计算，五个分类器取得分类精度的提升幅度分别为24.79％、25.92％、30.01％、28.13％与29.47％，平均提升幅度为27.66％。这充分显示了特征提取积极的作用效果。计算五个分类器分类性能的裕量分别为14.74％、21.76％、21.65％、23.96％与26.08％。同样的，随机森林取得了最高的分类精度为84.08％，并且逐渐拉开与其他四个分类器之间的差距。

(4)特征处理

对数据集进行异常值与缺失值检测，统计数据集中异常值或缺失值所在数据的数量，计算得到异常值与缺失值的占比，分别为0.13％与0.08％。对于占比几乎可以忽略不计的含有异常值与缺失值的数据，直接丢弃它们得到完备的数据集。对于特征数据之间存在的分布差异，采用前面提到的z分数标准化方法、min-max标准化方法和行归一化方法，利用它们分别对数据集进行处理，在此基础上训练了基于朴素贝叶斯、k近邻、决策树、RBF-SVM与随机森林的分类器，取得的分类精度如图9所示，图9中每个分类器从左到右依次分别为z分数标准化方法、min-max标准化方法和行归一化方法，以及处理之前的数据对应的分类精度。

图9中可以看出，五个分类器均在z分数标准化处理方法处理后的数据集上取得相对更高的分类精度，其中随机森林取得最高的分类精度为94.85％。五个分类器均在行归一化方法处理后的数据集上取得较为一般的分类精度，其中朴素贝叶斯、k近邻取得的分类精度低于处理前，其他三个分类器取得分类精度的提升幅度均很小。由此可以看出，对于包含多维特征数据的数据集，行归一化方法可能会降低特征效率或破坏多维特征数据的空间定位。总结来说，在特征处理的作用下，五个分类器取得的最佳分类精度分别为78.18％、89.62％、88.91％、90.54％与94.85％，提升幅度分别为5.44％、9.86％、9.26％、8.58％与10.77％，平均提升幅度为8.78％。同时，计算五个分类器分类性能的裕量分别为20.18％、31.62％、30.91％、32.54％与36.85％。

(5)特征选择

使用具体实施方式一的特征选择中提到的基于通道加权的特征选择方法对特征处理作用后的数据集进行处理，经过统计，除了脉冲上升时间和过零率，其余9个信号特征被保留，对应36列特征数据被保留，由此构建新的数据集。在此基础上，训练了基于朴素贝叶斯、k近邻、决策树、RBF-SVM与随机森林的分类器，取得的分类精度分别为78.86％、90.65％、89.10％、91.73％与95.59％，提升幅度分别为0.68％、1.03％、0.19％、1.19％与0.74％，平均提升幅度为0.77％，分类性能的裕量分别为20.86％、32.65％、31.10％、33.73％与37.59％。

至此，外界条件包含的五个参数指标对定位模型分类性能的作用结束。表2给出了五个分类器分别在不同参数指标作用下取得的分类性能的提升幅度和裕量。从表中可以看出，五个分类器均是在特征提取的作用下，取得分类精度的提升幅度最大，并且裕量均达到甚至远超确信性能阈值。这说明在外界条件的五个参数指标中，特征提取对定位模型分类性能的作用效果最大，其对裕量的也最重要。从表中还可以看出，特征处理也取得了不错的作用效果。综合来看，相较于脉冲预处理(包括脉冲提取与脉冲匹配)，特征工程(包括特征提取、特征处理与特征选择)在多余物定位方法中发挥更大的作用，需要在未来研究中被重点关注。同时，从表中还可以看出，在不同参数指标的作用下，随机森林始终取得最高的分类精度和裕量，表明其较于其他分类器更好的分类性能。

表2五个分类器在不同参数指标作用下的表现(单位：％)

A3.2内在属性

(1)分类器训练

在评估外界条件的五个参数指标的作用效果时，需要进行变量控制，即只保持使用的参数指标是可变的。然而实际情况是，定位模型具体是基于哪个分类器同样是无法确定的。因此，选择了五种分类器来充分考虑该因素的影响，间接达到控制变量的目的。

常规思路下，应当基于同一数据集，训练不同的分类器来评估分类器训练的作用效果。考虑到A3.1中已经得到五个分类器分别在五个参数指标作用下取得的分类性能的提升幅度和裕量，并且这些作用效果是五个分类器在经过相同方法处理过的数据集上取得的，所以此处可以直接在表2的基础上得出分类器训练对定位模型分类性能的作用效果。

不同于A3.1中评估外界条件的五个参数指标的作用效果，在分类器训练环节，没有一个标准的分类器作为基础与其他五个分类器进行分类性能上的比较。因此，参考表2，得出随机森林是分类器训练环节对定位模型分类性能作用效果最明显的分类器，即最优定位模型。取其较于其他四个分类器剩余分类精度的均值作为分类精度的提升幅度，为8.01％。从多余物定位方法的实施步骤来看，需要先确定使用的分类器，才能基于这个分类器取得的分类精度来评估各参数指标的作用效果，因此，分类器训练环节的作用效果无法直观体现在实施步骤的过程中，也无法给出确定的分类精度的提升幅度和裕量的量化结果。但选择合适的分类器确实对定位模型分类性能的作用很大，出于上述原因的考虑，对于最优定位模型，采用虚化的8.01％作为分类精度的提升幅度，而认定分类性能的裕量为0。

(2)参数优化

在分类器训练环节，通过对比得到随机森林取得的全局分类性能最佳，由此确定使用它作为定位模型，由此确定了多余物定位方法的具体处理环节：脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练(随机森林)、参数优化。因此，对随机森林的内部参数进行优化，来得到最优定位模型。机器学习中常对随机森林的三个参数进行优化设计，包括：n_estimators、max_depth和max_features。其中，n_estimators表示决策树的个数，max_depth表示决策树的最大深度，max_features表示决策树的最大特征数量。其他参数保持默认配置。结合测试经验，将n_estimators的寻优范围设置为10至150，步长为10；将max_depth的寻优范围设置为1至20，步长为2；将max_features的寻优范围设置为1至12，步长为1。借助于网格搜索法，得到适用当前数据集的上述三个参数的最优取值，训练最优定位模型。在此基础上，计算得到最优定位模型取得的分类精度为96.92％，提升幅度为1.33％，分类性能的裕量为38.92％。

至此，内在属性包含的两个参数指标对最优定位模型分类性能的作用结束。可以看出，相较于参数优化，分类器训练对定位模型分类性能的影响更大。实际上，在目前主流的机器学习应用中，根据需要解决问题的特点和构建数据集的特性，选择或设计合适的分类器是至关重要的，在此基础上开展的参数优化反而对分类器分类性能的提升比较有限。

综上所述，基于全体参数指标渐进式分析研究可以得出，特征提取是七个参数指标中对定位模型分类性能作用最显著、分类精度提升最明显的一个参数指标，并且在特征提取的作用下，定位模型的分类性能的同样大幅度提升，首次达到甚至远超确信性能阈值。这表明，在七个参数指标中，特征提取的重要性最大，在未来多余物定位方法的研究中，应该重点关注该部分，或者说，在极端条件下，需要优先考虑特征提取环节的处理，或者说，在定位模型可靠性下降查找问题时，需要首先排查特征提取环节的作用效果。这为基于机器学习方法的多余物定位研究在真实应用场景下的可靠性应用提供重要参考。此外，特征处理、分类器训练、脉冲提取、参数优化、特征选择与脉冲匹配对定位模型分类性能的不确定性影响依次降低，这同样为未来研究、极端考虑与问题排查提供参考。

A4个体参数指标模块化分析

参考A3得出随机森林是最优随机森林，确定其为定位模型，得出多余物定位方法的具体处理环节为：脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练(随机森林)与参数优化，以及各环节使用的处理方法。最优定位模型取得的最高分类精度为96.92％，分类性能的裕量为38.92％。参考图4中七个参数指标的位置分布，分别单次调整一个参数指标退出现有完整的多余物定位方法处理流程，得到定位模型取得的新的分类精度，与最高分类精度对比得到分类性能的降低幅度，作为其对定位模型分类性能的作用效果。需要说明的是，分类器训练环节是不可退出也是不可评估的，因此同样采用A3.2中认定的8.01％作为其对定位模型分类性能的作用效果。图10给出了七个参数指标对定位模型分类性能的作用效果。

从图中可以看出，依然是特征提取环节对定位模型分类性能的作用效果最显著，其余六个对定位模型分类性能作用效果明显的参数指标依次为：特征处理、分类器训练、脉冲提取、参数优化、特征选择与脉冲匹配，这与A3中全体参数指标渐进式分析结果一致。这说明，不管是评估定位模型在不同阶段取得的分类性能与性能阈值之间的裕量关系，还是评估各参数指标对定位模型分类性能的不确定性影响，得到的两个评估结果是具有高度相关性和一致性的，表明各参数指标的稳定作用。

A3与A4的联合分析结果表明，在多余物定位方法处理流程中，每个环节(参数指标)均对定位模型分类性能起到积极作用，这从侧面说明了基于机器学习方法的多余物定位研究的可行性和设置的各环节的必要性。从机器学习角度来看，特征提取、特征处理与特征选择所属的特征工程在多余物定位方法处理流程中起到关键作用，这也是目前机器学习领域中热门和被重点关注的方向。从基于机器学习方法的多余物定位研究角度出发，特征工程是完成多余物信号向数据集转化的承前启后的重要手段，其转化效果直接影响数据集的质量，间接影响定位模型的分类性能。因此，在密封电子设备多余物定位确信可靠性模型中，特征工程包含的三个参数指标对分类性能的裕量贡献最大，在未来优化多余物定位方法的研究中，可以重点考虑特征工程，尤其是特征提取部分的研究，包括多余物四通道特性的深入研究与利用，多域中新的信号特征的提取、特征优化与选择方法的设计等，以期进一步提升定位模型的分类性能，及密封电子设备多余物定位确信可靠性模型的可靠度。

本发明基于可靠性科学原理对密封电子设备多余物定位方法的可靠性进行研究，针对定位模型在陌生密封电子设备上定位性能退化的现象，提出了一种可靠性建模方法，并通过案例应用验证了所提方法及模型的实用性，可以得到以下结论：

(1)基于确信可靠性理论及多余物定位原理，确定了多余物定位方法的关键性能参数为定位模型的分类性能，通过考虑分类性能与确信性能阈值之间的距离，建立了分类性能裕量模型，并考虑定位模型泛化性能退化机制，建立分类性能退化模型，联合构建了裕量退化模型。

(2)基于不确定原理对分类性能裕量模型中的七个参数指标对定位模型分类性能的作用分别进行整体或单独的分析与量化，包括：脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练和参数优化。通过度量分类性能大于确信性能阈值，即裕量大于0的程度，构建密封电子设备多余物定位确信可靠性模型。

(3)通过某型号航天电子单机设备的案例验证了所提方法的可行性。基于全体参数指标渐进式分析与个体参数指标模块化分析表明，所提方法可以为提高多余物定位方法的可靠性提供指导，如重点关注特征提取、特征处理、特征选择等环节或开展未来研究，可以确保定位模型分类性能的稳定性。

本发明所提的密封电子设备多余物定位确信可靠性建模方法能够从定位原理出发辨识处理流程中的七个参数指标及其不确定性对可靠性的影响，并指导开展多余物定位方法研究，对现有多余物材质识别及重量估计研究的确信可靠性分析有重要的参考借鉴意义，具有理论研究价值。

本发明的上述算例仅为详细地说明本发明的计算模型和计算流程，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims

1.密封电子设备多余物定位确信可靠性分析方法，所述方法针对采用机器学习方式对密封电子设备多余物进行定位的方法进行可靠性分析，对密封电子设备多余物进行定位的过程中，利用N”个声发射传感器采集多余物信号；采用机器学习方式对密封电子设备多余物进行定位的方法包括针对密封电子设备对应多余物信号的预处理过程，对预处理后信号进行特征处理的特征工程，以及机器学习模型训练的过程，所述预处理过程包括脉冲提取、脉冲匹配的步骤，特征工程包括特征提取、特征处理、特征选择的步骤，机器学习模型训练的过程包括分类器训练和参数优化的步骤，将脉冲提取、脉冲匹配、特征提取、特征处理、特征选择、分类器训练和参数优化的七个步骤的称为七个参数指标；其中，

参数优化：对定位模型进行参数优化；

其特征在于，所述方法包括以下步骤：

步骤101、确定确信性能阈值：

2.根据权利要求1所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，还包括以下步骤：

3.根据权利要求1或2所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，采用机器学习方式对密封电子设备多余物进行定位的方法，具体包括以下步骤：

采用特征工程对数据集进行特征处理；

4.根据权利要求3所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，采用三门限脉冲提取算法提取有用脉冲的过程包括以下步骤：

S1213：从第一个帧信号开始，依次将每个帧信号的能量与尖峰检测阈值E_peak对比；当某个帧信号的能量大于尖峰检测阈值E_peak时，从这个帧信号出发，继续依次将之后的每个帧信号的能量与尖峰检测阈值E_peak对比，直至某个帧信号的能量小于尖峰检测阈值E_peak；从这些帧信号中找到能量最大的一个帧信号，获取其对应的时间，即当前有用脉冲的尖峰时刻，表示为t_max；

S1215：以当前有用脉冲的尖峰时刻t_max为起点，分别向前和向后将每个帧信号的能量与端点检测阈值E_hs进行对比，直至在两个方向上分别发现某个帧信号的能量小于端点检测阈值E_bs；认定这两个帧信号的前一个帧信号为当前有用脉冲的起始帧信号和终止帧信号；它们对应的时间分别代表当前有用脉冲的起始时刻与终止时刻，分别表示为t_begin与t_end；

5.根据权利要求4所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，所述尖峰检测阈值E_peak＝3E_mean，所述端点检测阈值E_hs＝1.1E_mean。

6.根据权利要求5所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，Δt₂＝Δt₁/2。

7.根据权利要求6所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，采用补零时间差脉冲匹配算法对不同声发射传感器对应提取到的有用脉冲进行脉冲匹配的过程包括以下步骤：

8.根据权利要求7所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，所述的信号特征包括时间延迟、脉冲上升时间、脉冲对称度、脉冲振幅、脉冲能量、均方根电压、脉冲过零率、频谱质心、频谱均方差、均方根概率、频率标准差。

9.根据权利要求8所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，基于特征选择的基本单位对特征进行筛选的过程包括以下步骤：

S1252：以通道为划分单位，即以r_ij中i为划分单位，将属于同一通道的J列特征数据与标签之间的皮尔逊相关系数的绝对值r_ij累加，得到对应1个通道的求和结果，表示为R_i；计算公式如下：

S1253：基于计算R_i占R_all的比重W_i ^p，作为通道加权系数：

S1254：将r_ij乘以对应的通道加权系数W_i ^p得到

S1255：基于计算I个求和结果

S1256：将进行降序排列，得到对应的排序编号N_j；

10.根据权利要求9所述的密封电子设备多余物定位确信可靠性分析方法，其特征在于，对定位模型进行参数优化的过程中采用网格搜索法进行参数优化。