CN115685072B

CN115685072B - 基于多分类模型的密闭腔体内部不稳定声发射源定位方法

Info

Publication number: CN115685072B
Application number: CN202211192815.5A
Authority: CN
Inventors: 翟国富; 孙志刚; 王国涛; 李鹏飞; 张敏
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2022-09-28
Filing date: 2022-09-28
Publication date: 2023-07-07
Anticipated expiration: 2042-09-28
Also published as: CN115685072A

Abstract

本发明公开了一种基于多分类模型的密闭腔体内部不稳定声发射源定位方法，所述方法从时域和频域两个方面对声发射信号进行综合评估，将信号中提取多个可以全面描述上述信号特性的信号特征，由此构建特征向量，形成信号数据。通过给这些信号数据设置不同的标签，并将这些信号数据进行汇总，最终可以构建信号数据集。在此基础上，在信号数据集上训练基于不同机器学习分类算法的分类器，比较得出最优的分类器并对其内部参数进行优化。至此，可以得到最优的分类器，用于实物测试。本发明所提不稳定声发射源定位方法为声发射源定位研究提供了新的思路，对相关领域内撞击源或故障源诊断方法的应用与发展提供了理论基础，具有重要的理论意义和实用价值。

Description

基于多分类模型的密闭腔体内部不稳定声发射源定位方法

技术领域

本发明涉及一种声发射源定位方法，具体涉及一种基于多分类模型的密闭腔体内部不稳定声发射源定位方法。

背景技术

在材料内部产生、或外部施加机械应力或热应力的情况下，材料的内部结构发生变化，且以瞬态弹性波的形式向外界释放能量。其中，引起能量释放的变化称为声发射源。

声发射源定位研究是声发射检测领域的研究热点之一，常用的方法包括区域定位法和时差定位法。区域定位法利用声发射信号在材料传播过程中的衰减现象，通过分析声发射信号到达各个区域内放置的声发射传感器的先后顺序和信号强弱，粗略判断声发射源所在的区域。时差定位法根据声发射传感器的阵列布局(空间布局)建立几何坐标方程，通过研究声发射信号到达各声发射传感器的时间差和信号的传播速度，得出声发射源的坐标位置。许多研究学者在此基础上对声发射源展开研究，例如，Kosel等提出用独立分量分析的方法来估计声发射信号到达声发射传感器的时间差，进而判断声发射源的位置。AlainLe Duff等提出通过计算声发射信号的短时互相关函数来估计声发射信号到达声发射传感器的时间差，有效提升了声发射源定位效果。Omologo等运用互功率谱方法计算声发射信号到达声发射传感器的时间差。他们在不同实验条件下开展三维空间内声发射源定位的研究，取得较好的定位效果。Bhardwaj等提出了基于最大似然估计的多通道的声发射信号到达声发射传感器的时间差估计方法，为阵列布局(空间布局)的时差测量提供了一个较好的方法。E.Lympertos等提出同样利用声发射传感器的阵列布局(空间布局)来估计声发射信号在不同频率下的到达时间。这样，声发射源定位问题就被巧妙的转化为平方误差最小化问题，通过解决声发射源到声发射传感器的距离问题，可以推断出声发射源的位置。

密闭腔体指的是直接包容密封腔的静止壳体。从广义角度来说，具有密闭式结构的机械设备均可称为密闭腔体。在机械设备的研究中，故障源诊断是其中重要的一部分。并且在很多情况下，故障源诊断的研究可以参考声发射源定位研究的成果，尤其是密闭腔体内部声发射源定位的研究，许多学者取得了较好的定位成效。如，在二维结构的密闭腔体内部声发射源定位研究中，Ziola等运用互相关函数法计算声发射信号到达声发射传感器的时间差。该方法在铝板上取得了较好的定位效果。El yamine DRIS等通过比较阈值交叉法和连续小波变换法对声发射信号的处理性能，验证了连续小波变换法在板状结构的密闭腔体中能够取得更好的声发射源定位效果。在三维结构的密闭腔体内部声发射源定位研究中，M.F.Shehadeh等结合时域(基于能量)和频域(基于时间)的信号处理方法，分别对钢管中产生的连续和突发的声发射信号进行分析，最终判断钢管中声发射源的位置。EhsanDehghan Niri等为了确定圆柱形容器内声发射源的区域位置，提出了一种基于无味变换的声发射源定位方法。该方法综合考虑了声发射信号的到达时间差和传播速度，并增加了对不同区域位置估计的置信度的定量度量。Nivesrangsan等基于声发射信号的速度和能量提出了一种密闭式发动机内部故障源定位技术，通过比较声发射信号(故障源信号)到达各声发射传感器的时间差和自身的信噪比，识别出故障源的位置。在航空航天领域，结合声发射源定位方法和微粒碰撞噪声检测法，相关学者对密闭式的航天设备内部多余物的定位方法进行了研究。如，孙永玲等基于区域定位法提出了一种导弹内部多余物定位的方法，并取得了初步成效，对声发射源定位研究具有一定的参考价值。杨京等研究了基于时差定位法的火箭密封舱内多余物定位的方法，通过构建声发射传感器阵列的几何方程和计算声发射信号到达声发射传感器的时间差，求解声发射源的空间坐标，进而获取多余物的位置。丁丹丹等构建声发射传感器阵列来采集声发射信号在传播过程中的衰减特征，通过信号能量累加的方法，粗略判断声发射源的位置，进而确定导弹内部多余物的位置。

综上所述，尽管上述两种定位方法在某些应用场景下取得了一定的声发射源定位效果，但不可避免的是，区域定位法只能确定声发射源的区域位置，且能够较为准确定位的区域位置的范围较大。同时，应用区域定位法取得的定位结果具有不确定性。它适用于具有简单结构和材质均匀的密闭腔体内部声发射源定位研究。同样的，决定基于时差定位法的声发射源定位方法取得的定位精度的关键在于对声发射信号的到达时间差和传播速度的精确测量。在结构复杂和材质不均匀的物体中，上述两个关键因素都很难准确测量。因此，应用时差定位法取得的定位精度及其应用范围同样有限。从另一个角度来看，在内部结构复杂和组成材质不均匀的密闭腔体中，即使是连续规则的声发射信号也会突变为不稳定信号，这是导致时差定位法和区域定位法难以取得稳定的定位结果的根本原因。因此，对基于上述两种定位方法的密闭腔体内部不稳定声发射源定位取得的定位效果并不理想。

近年来，随着机器学习的热门与发展，越来越多的学者开始研究基于机器学习的声发射源定位方法。这类方法主要是通过应用机器学习的相关算法来完成对目标源的定位。如，G.Yang等基于BP神经网络设计了机器人的声发射源定位系统，通过获取各通道声发射信号的强度和相位特征来构建数据集，并训练神经网络模型。该方法在初期取得了良好的声发射源定位效果，但该方法提取的信号特征的数量较少，且缺少对信号特征的分析比较。H.Chen等提出基于最小二乘支持向量机的声发射源定位方法，该方法以声发射信号到达各麦克风之间的时间延迟为特征构建数据集。在此基础上，训练基于最小二乘支持向量机的分类模型来预测声发射源的位置。通过与传统时差定位法的比较得出该方法在一些场合下能够取得更高的定位精度。但该方法提取的信号特征的数量同样较少，且应用场景有限。C.Beck等利用脉冲神经网络实现声发射源定位，并且取得的非常高的定位精度。但该方法缺少对神经网络不同时间参数的优化和比较，来进一步提高现有的定位精度。MinuA.Pillai等提出基于随机森林回归器的声发射源定位方法，该方法使用八个麦克风的线性阵列来捕获声发射信号，通过分析麦克风在三维空间中的朝向来从声发射信号中提取角度特征来构建数据集，并进行回归器模型的训练。回归器模型在独立的测试集上取得了较好的定位效果。但该方法的应用场景受限于空旷的室内。Y.Yang等利用相位变换加权的广义互相关法从声发射信号中提取信号特征并构建定位数据集。在此基础上，他们研究与分析了基于集成学习思想的声发射源定位方法。该方法取得的定位效果较单一分类器或分类模型有了很大程度的提升。遗憾的是，该方法提取的信号特征数量有限，并且未对机器学习层面的分类精度与应用场景下的定位精度进行深入研究与说明，其实用性能还有待提升。值得说明的是，在航天航空领域，也有学者开展了基于机器学习的航天设备内部多余物或撞击源的定位研究。如，郭亮在戚乐的研究基础上引入了BP神经网络，在航天发动机管道上取得了较好的定位效果。李卓深入研究了机器学习分类算法的可行性，包括kNN、k均值聚类等，在此基础上设计了载人密封舱内部撞击源的定位方法。相较于区域定位法，该方法取得的定位精度上有了明显提升。但该方法缺少对相关算法内部参数的优化分析，未能进一步提高现有的定位精度。

发明内容

针对传统的时差定位法与区域定位法，以及基于机器学习的声发射源定位方法中存在的不足，本发明认真考虑了声发射源定位的本质，巧妙的将其转化成机器学习的多分类问题，并由此提出了一种基于多分类模型的密闭腔体内部不稳定声发射源定位方法。

本发明的目的是通过以下技术方案实现的：

一种基于多分类模型的密闭腔体内部不稳定声发射源定位方法，包括如下步骤：

步骤一：寻找与待测密闭腔体相同型号或相同结构(尺寸)的空的密闭腔体，将其内部空间划分为多个近似相等的密闭空间，并对它们进行编号，分别命名为：NO.1密闭空间、NO.2密闭空间、……、NO.n密闭空间；根据事先确定的固定布局规则，在密闭腔体表面的不同位置放置声发射传感器；

步骤二：在NO.1密闭空间放置或生成不稳定声发射源，产生不稳定的声发射信号，保证不稳定的声发射信号到达各声发射传感器的信号幅度不为零；利用布置在密闭腔体表面的多个声发射传感器捕获生成的声发射信号；经过信号放大、信号滤波、信号采集，将多个声发射信号转换成多个信号文件，并保存在电脑上；

步骤三：对多个信号文件进行脉冲提取与脉冲匹配，从一段声发射信号中提取有用脉冲信号，摒弃其中的零脉冲信号，匹配多通道采集的声发射信号之间的时间延迟，使多通道采集的多个声发射信号在时间刻度上对齐，使经过脉冲提取与脉冲匹配的多通道声发射信号中包含尽可能多有用帧信号，且多通道内的每个帧信号在时间刻度上对齐，具体步骤如下：

步骤三一：对多通道采集的多个声发射信号分别进行脉冲提取处理，并分别获取多个声发射信号中第一个有用脉冲的最高点，在此基础上，获取多个最高点(帧信号)对应的时间，即多个声发射信号中第一个有用脉冲的尖峰时刻，分别表示为T₁、T₂、…、T_n；

步骤三二：分别计算得到T_n-T₁、T_n-T₂、…、T_n-T_n-1的数值，它们分别代表声发射信号到达距离最近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟，声发射信号到达距离第二近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟，以此类推，直到代表声发射信号到达距离倒数第二远的声发射传感器与到达距离最远的声发射传感器之间的时间延迟；

步骤三三：分别在距离最近、距离第二近、…、距离第二远的声发射传感器接收到声发射信号开始时刻前补充时长分别为T_n-T₁、T_n-T₂、…、T_n-T_n-1的零脉冲；

步骤三四：将多个新的声发射信号的起始时刻对齐，以距离最远的声发射传感器接收到的声发射信号的长度为参考，分别截取其他多个声发射信号中从起始时刻开始相同长度的信号进行保留，舍弃后面多余的信号；

步骤四：对经过脉冲提取与脉冲匹配处理后的各信号文件进行分帧处理，得到多个帧信号；从时域和频域两个方面从每个帧信号中提取多个信号特征，构建多个特征向量，由此得到多条一维的信号数据；通过判断不稳定声发射源被放置在哪个密闭空间或在哪个密闭空间生成，给得到的多条信号数据设置对应的标签，如在初始阶段，声发射源被放置在NO.1密闭空间或在NO.1密闭空间生成，则由此得到的多条信号数据的标签被设置为“1”；

步骤五：调整步骤二中放置或生成不稳定声发射源的空间，即按照顺序将不稳定声发射源分别放置或生成在NO.2密闭空间，NO.3密闭空间，…，NO.n密闭空间内，并分别重复步骤二至步骤四的过程，得到多条标签分别为“2”，“3”，…，“n”的信号数据；将“按顺序将声发射源分别放置或生成在NO.1密闭空间，NO.2密闭空间，…，NO.n密闭空间及对应生成信号数据”的步骤视为一个闭环实验过程，则通过多次重复该闭环实验过程，得到大量信号数据，这些信号数据被组合用来构建信号数据集；

步骤六：在信号数据集上训练基于不同机器学习分类算法的多分类模型，通过比较得出分类性能最优的多分类模型，并对其内部参数进行优化，使其性能达到最优，称为最优的多分类模型；

步骤七：参考步骤一中使用的固定布局规则，在待测的密闭腔体的表面的不同位置放置声发射传感器；多个声发射传感器捕获位于密闭腔体内部某个密闭空间的声发射源发出的声发射信号，经过信号放大、信号滤波、信号采集步骤，得到多个信号文件；对信号文件进行脉冲预处理；

步骤八：对各信号文件进行分帧处理，得到多个帧信号；从时域和频域两个方面从每个帧信号中提取多个信号特征，构建多个特征向量，由此得到多条一维的信号数据；

步骤九：应用步骤六中得到的最优多分类模型预测步骤八得到的信号数据的标签，对预测的标签进行多数表决处理，得票最高的某个标签为共同标签，共同标签对应编号的密闭空间就是预测的声发射源所在密闭腔体内部的位置。

相比于现有技术，本发明具有如下优点：

1、本发明从另一个角度分析声发射源定位的本质，并巧妙的将声发射源定位问题转化成机器学习的多分类问题。具体的，对于待测的密闭腔体，将其内部空间视为多个密闭空间的组合。通过事先轮流在各密闭空间放置不稳定声发射源，利用声发射传感器捕获声发射信号，并从声发射信号中提取时域特征与频域特征，构建定位数据集。在此基础上，训练基于机器学习分类算法的多分类模型，得出最优者对其进行参数优化，进而得到最优多分类模型。这样，可以应用最优多分类模型来预测待测密闭腔体内部声发射源的位置。实际上，最优多分类模型给出的位置是组成密闭腔体内部空间的多个密闭空间中可能性最大的一个密闭空间。因此，从另一角度来看，本发明提出的声发射源定位方法可以视为一种基于机器学习的空间区域定位方法。

2、本发明所提的声发射源定位方法，有效解决了传统的时差定位法与区域定位法，以及基于机器学习的声发射源定位方法的不足，尤其对于不稳定声发射源。详细来说，针对时差定位法与区域定位法受密闭腔体内部结构和组成材质的影响导致定位结果不稳定的问题，本发明所提方法不限于对声发射信号在传播过程中的某个属性进行研究，而且从时域、频域提取多个信号特征来对声发射信号进行整体描述。这种描述更加具体和完备，即使受不稳定声发射源影响导致其中某个信号特征不稳定，但剩余的多个信号特征依然能够清晰地描述不同位置发出的声发射信号之间的差别。因此，本发明所提的不稳定声发射源定位方法取得的定位结果更加稳定和可信。针对基于机器学习的声发射源定位方法中存在的信号特征数量较少及未对工程应用场景下的定位精度进行深入描述的不足，本发明所提方法提取多个时域特征与频域特征，力求完备的描述声发射信号的特性。

3、本发明结合多分类模型的预测结果和多数表决规则，给出了满足工程应用需求的声发射源定位精度的定义。

4、本发明所提不稳定声发射源定位方法为声发射源定位研究提供了新的思路，对相关领域内撞击源或故障源诊断方法的应用与发展提供了理论基础，具有重要的理论意义和实用价值。

附图说明

图1为声发射源定位方法的通用流程图；

图2为密闭腔体结构图；

图3为密闭腔体内部密闭空间的划分；

图4为谐振式声发射传感器的结构图；

图5为PXR04型谐振式声发射传感器的频响曲线图；

图6为采用短时能量作为门限判断进行脉冲提取的流程；

图7为补零时间差脉冲匹配算法的示意图；

图8为四通道声发射信号的时频图(局部放大)；

图9为特征分析结果图；

图10为平面与空间多分类模型在各标签的信号数据上取得的分类精度。

具体实施方式

下面结合附图对本发明的技术方案作进一步的说明，但并不局限于此，凡是对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的保护范围中。

本发明提供了一种基于多分类模型的密闭腔体内部不稳定声发射源定位方法，所述方法的核心在于将声发射源定位问题转化成机器学习的多分类问题，最终构建一个适用的声发射定位模型(下文简称AE定位模型)。本发明从时域和频域两个方面对声发射信号进行综合评估，将信号中提取多个可以全面描述上述信号特性的信号特征，由此构建特征向量，形成信号数据。这样，从密闭腔体内部不同位置发出的声发射信号中提取的信号特征也有所差异，对应形成的信号数据的数值大小和数值分布也有所差异。通过给这些信号数据设置不同的标签，并将这些信号数据进行汇总，最终可以构建信号数据集。这也是将信号转换为数据的过程，是顺利开展本发明的关键一步。在此基础上，在信号数据集上训练基于不同机器学习分类算法的分类器，比较得出最优的分类器并对其内部参数进行优化。至此，可以得到最优的分类器，也即本发明中所需的最优的AE定位模型，可以用于实物测试。如图1所示，具体实施步骤如下：

步骤一：根据待测密闭腔体的内部空间结构，将其内部空间划分为多个近似相等的密闭空间，并对它们进行编号，分别命名为：NO.1密闭空间、NO.2密闭空间、……、NO.n密闭空间。根据事先确定的固定布局规则，在密闭腔体表面的不同位置放置声发射传感器。

需要说明的是，划分的密闭空间实际上就是AE定位模型给出的声发射源的定位结果，也即预测的声发射源所在的最小区域。密闭空间的编号与信号数据集中信号数据的标签是对应的。即：信号数据集中标签为“1”的信号数据是由在NO.1密闭空间内发出的声发射信号的基础上得到的。本发明要求划分的密闭空间是近似相等的，是为了保证声发射源在各密闭空间拥有近似相等的发声范围，进而保证生成的对应标签的信号数据的数值分布范围近似相等。另外，声发射传感器的固定布局规则是不确定的，可根据实际情况进行调整。通常情况下，密闭腔体是三维的，推荐使用四个声发射传感器的空间布局，具体的布局规则可以根据不同密闭腔体的内部空间结构及其质心确定。

步骤二：在NO.1密闭空间放置或生成不稳定声发射源，产生不稳定的声发射信号；利用布置在密闭腔体表面的多个声发射传感器捕获生成的声发射信号；经过信号放大、信号滤波、信号采集等步骤，多个声发射信号转换成多个信号文件，并保存在电脑上。

需要说明的是，本发明不对放置或生成的不稳定声发射源做过多的限制，只要保证它发出的不稳定的声发射信号到达各声发射传感器的信号幅度不为零。另外，信号放大与信号滤波的过程属于对原始声发射信号进行调理的过程，不限制具体的处理方法，可根据实际接触的声发射信号的相关参数进行设计。信号采集属于将模拟的声发射信号转换成数字的声发射信号的过程，从而能够将其保存在电脑上。同样的，不对信号采集的具体处理方法进行限制。

步骤三：对多个信号文件进行脉冲预处理，包括脉冲提取与脉冲匹配。通过脉冲提取，实现从声发射信号中提取有用脉冲信号、摒弃零脉冲的目的。通过脉冲匹配，解决因声发射信号到达不同声发射传感器存在的时间差带来的信号文件中脉冲信号在时间刻度上不同步匹配的问题。

需要说明的是，经过脉冲提取，可以摒弃声发射信号中的零脉冲，保证剩余的都是有用的脉冲信号。实际上，如果保留零脉冲，那么在信号特征提取阶段，从零脉冲中得到的信号数据的数值取值都是“0”，它不具有任何参考价值，且会对其他非零的信号数据产生影响。此外，不管在何种布局规则下，声发射信号到达不同距离的声发射传感器一定存在时间差的。这就导致不同声发射传感器对应的信号文件中同一脉冲信号的起始时间不一样，即存在脉冲不同步的问题。这对信号特征提取阶段的特征向量的构建产生影响。同样的，不对具体使用的脉冲提取算法和脉冲匹配算法进行限制，可根据实际需求进行设计。在本发明中，根据实际需求，使用了传统的三门限脉冲提取算法，新设计了补零时间差脉冲匹配算法。

步骤四：对各信号文件进行分帧处理，得到多个帧信号。从时域和频域两个方面从每个帧信号中提取多个信号特征，构建多个特征向量，由此得到多条一维的信号数据。通过判断步骤二中不稳定声发射源被放置在哪个密闭空间或在哪个密闭空间生成，给得到的多条信号数据设置对应的标签。如在初始阶段，声发射源被放置NO.1密闭空间或在NO.1密闭空间生成，则由此得到的多条信号数据的标签被设置为“1”。

需要说明的是，这里提到的时域和频域两个方面的信号特征有很多，包括：时间延迟、脉冲对称度、频谱质心等。因此，不对具体使用的信号特征进行限制，可根据实际接触的声发射信号的相关参数选择适用的信号特征。

步骤五：调整步骤二中放置或生成不稳定声发射源的空间，即按照顺序将不稳定声发射源分别放置或生成在NO.2密闭空间，NO.3密闭空间，…，NO.n密闭空间内，并分别重复步骤二至步骤四的过程，得到多条标签分别为“2”，“3”，…，“n”的信号数据。将“按顺序将声发射源分别放置或生成在NO.1密闭空间，NO.2密闭空间，…，NO.n密闭空间及对应生成信号数据”的几个步骤视为一个闭环实验过程，则通过多次重复该闭环实验过程，得到大量信号数据，且其中每个标签对应的信号数据的数量近似相等。这些信号数据被组合用来构建信号数据集。

步骤六：在信号数据集上训练基于不同机器学习分类算法的多分类模型。通过比较得出分类性能最优的多分类模型，并对其内部参数进行优化，使其性能达到最优，称为最优的多分类模型。

需要说明的是，到步骤六结束，本发明所需的适用的多分类模型构建完成，可以用于实际测试。即：对于内部某个空间放置或生成不稳定声发射源的待测的密闭腔体(位置未知)，可以通过步骤一至步骤五的闭环试验过程，得到多条标签未知的信号数据。最优的多分类模型对这些信号数据进行预测，给出它们的预测标签，并通过多数表决处理得到共同标签，由此可以判断待测的密闭腔体内部的不稳定声发射源位于什么位置，完成声发射源的定位。该部分详细的实物测试过程如步骤七至步骤九所示。

步骤七：参考步骤一中使用的固定布局规则，在待测的密闭腔体的表面的不同位置放置声发射传感器；多个声发射传感器捕获位于密闭腔体内部某个密闭空间的声发射源发出的声发射信号，经过信号放大、信号滤波、信号采集步骤，得到多个信号文件；对信号文件进行脉冲预处理，包括脉冲匹配与脉冲提取。

步骤八：对各信号文件进行分帧处理，得到多个帧信号。从时域和频域两个方面从每个帧信号中提取多个信号特征，构建多个特征向量，由此得到多条一维的信号数据。

需要说明的是，此时因为待测的密闭腔体内部声发射源的位置是未知的，所以这些信号数据的标签是未知的，是需要利用多分类模型预测的。

步骤九：应用步骤六中得到的最优多分类模型来预测这些信号数据的标签。对预测的标签进行多数表决处理，得票最高的某个标签为共同标签。共同标签对应编号的密闭空间也就是预测的声发射源所在密闭腔体内部的位置。

至此，本发明提出的基于多分类模型的密闭腔体内部声发射源定位方法的具体实施步骤描述结束。从上述步骤中可以看出，整个方法实际上可以视为由两个阶段构成，分别是训练阶段与测试阶段，这与机器学习分类器的训练过程极其相似。步骤一至步骤六属于训练阶段，目的是训练一个适用当前待测的密闭腔体的最优的多分类模型。步骤七至步骤九属于测试阶段，目的是将训练得到的多分类模型用于实物测试，给出未知的信号数据的预测标签。通过多数表决处理，给出该类型或该结构(尺寸)的密闭腔体在一般场景下的声发射源定位结果。

需要说明的是，本发明将多分类模型与多数表决处理的组合称为AE定位模型。本发明所提方法的适用场景可以缩小至同一类型或同种结构(尺寸)的密闭腔体。本发明提出的定位方法在同种或相近类型或结构(尺寸)的密闭腔体上能够取得较为理想的定位效果。

实施例：

本实施例分别选择了平面结构和立体结构的密闭腔体为例，对本发明提出的基于多分类模型的密闭腔体内部不稳定声发射源定位方法进行验证。

1、准备工作

1.1密闭腔体

通常情况下，密闭腔体主要是三维结构的，包括规则的立方体、圆柱体、椎体、球体等，以及一些不规则的复杂结构的密闭腔体。实际上，在一定情况下，对于一些高度可忽略的三维结构的密闭腔体，如板状的密闭腔体，或者在某些情况下不要求得到高度所在维度的定位信息的密闭腔体，如某些密闭腔体的内部空间在高度所在维度上是贯通的，可以将其视为二维结构的密闭腔体。举例来说，如果某个立方体结构的密闭腔体的高度相对它的长度和宽度太小，可以将其视为二维平面上的矩形。

需要说明的是，对三维结构和近似二维结构的密闭腔体进行说明，是为了同时验证本发明所提不稳定声发射源定位方法在平面定位和空间定位中的可行性。从定位原理上来说，同等情况下，在二维结构的密闭腔体上取得的声发射源定位精度要高于在三维结构的密闭腔体上取得的。因此，在高度可忽略不计或对高度所在维度要求不高的场景下开展的声发射源定位研究，可以以密闭腔体的底面为参考重新构建二维的密闭腔体，以获得更高的声发射源定位精度。为了便于本发明的开展，选择了一个内部结构简单且高度可忽略不计的正方形板状的密闭腔体和一个内部结构复杂的正方体的密闭腔体，分别用于平面定位与空间定位的研究。本发明将它们分别称为平面密闭腔体与空间密闭腔体。

图2给出了平面密闭腔体与空间密闭腔体的结构图。如图2(a)所示，平面密闭腔体的实际尺寸为60cm×60cm×2cm，内部空间是连贯的。如图2(b)所示，空间密闭腔体的实际尺寸为40cm×40cm×40cm，内部空间被两块相关正交的薄板划分为八个相等的密闭空间，即：空间密闭腔体的内部空间是不连贯的。用笔将平面密闭腔体的上表面划分为十六个相等的正方形区域，每个区域的尺寸为15cm×15cm。如果将划分规则应用到平面密闭腔体上，则它被划分为十六个相等的密闭空间，每个密闭空间的尺寸为15cm×15cm×2cm。对每个密闭空间进行编号，并将四个声发射传感器放置在上表面的四个直角处，如图3(a)所示。根据空间密闭腔体的现有的内部空间构造，分别对八个相等的密闭空间进行编号，每个密闭空间的尺寸为20cm×20cm×20cm。按照事先确定的固定布局规则，将四个声发射传感器放置在空间密闭腔体表面的不同位置，如图3(b)所示。

1.2不稳定声发射源

在本发明中，选择同一个主动发声的不稳定声发射源，分别用于放置平面密闭腔体与空间密闭腔体内部不同密闭空间中，并由声发射传感器采集声发射信号用于后续研究中。不稳定声发射源的发射频率为20～100kHz。它能够随时随机生成一段0时长为0.1ms的未知频率的声发射信号，每段声发射信号之间的间隔时长也不稳定，最少情况下无时间间隔，最长情况下间隔0.5ms。不稳定声发射源初始时刻发射的声发射信号的振幅为50mV。经过多次测试，可以确定，无论将声发射源放置在平面密闭腔体或空间密闭腔体的哪个密闭空间中，四个声发射传感器都能捕获到有效的声发射信号，且捕获到的声发射信号的最小振幅为20mV。

1.3声发射传感器

选择PXR04型号的谐振式声发射传感器，其结构如图4所示。图5是PXR04型号的谐振式声发射传感器的频响曲线。从图中可以看出，它的谐振频率为40kHz。并且，它在灵敏度为60dB处的频率带宽为15～165kHz，满足本发明对声发射传感器的要求。

对声发射源定位研究来说，单一声发射传感器无法获取足够多的信号成分来反馈声发射源的位置信息，所以使用多个声发射传感器对密闭腔体内部不稳定声发射源定位方法的研究是非常重要的。通常，在一维线性定位中，利用两个声发射传感器可以获取声发射源的位置。在二维平面定位中，利用三个声发射传感器可以获取声发射源的位置。因此，在三维空间定位中，需要使用四个声发射传感器来获取声发射源的位置。如图3所示，使用四个一致性良好的PXR04型谐振式声发射传感器，合理地布置在平面密闭腔体与空间密闭腔体表面的不同位置，同步采集声发射信号。可以看出，多传感器的空间布局不仅要考虑声发射传感器的有效检测距离，避免检测盲区的存在，还要考虑位于不同位置的声发射源发射的声发射信号到达不同声发射传感器的差异性，保证各声发射传感器捕获的声发射信号中包含声发射源的位置信息。多路(通道)捕获的声发射信号同样会增加定位数据的维度，得到关于声发射源位置的特征向量。这是开展基于多分类模型的密闭腔体内部不稳定声发射源定位方法研究的基础。在本发明中，根据平面密闭腔体与空间密闭腔体的质心位置设置了对应的布局规则。

2、信号处理与脉冲预处理

2.1四通道信号同步采集设备

在本发明中，四个PXR04型谐振式声发射传感器连接至四通道信号同步采集设备(下文简称信号采集设备)，并将获取的声发射信号传输过去。信号采集设备对声发射信号进行处理，完成声发射信号从模拟状态到数字状态的转换，并保存信号文件。与信号采集设备连接四个声发射传感器放置在密闭腔体表面的不同位置，捕获声发射信号转换成电信号(模拟信号)，送入信号采集设备内部进行处理。本发明直接利用现有的信号采集设备来处理声发射信号，且本发明的研究重心在于信号文件的算法处理，所以这里不对信号采集设备的硬件设计原理进行详细描述。

2.2三门限脉冲提取算法

通常情况下，声发射信号，尤其是不稳定声发射信号是一种连续振荡的脉冲信号，而背景噪声或瞬间冲击是一种短时振荡的脉冲信号。根据该特点，结合语音识别领域的端点检测算法，采用短时能量作为门限判断的依据，使用三门限脉冲提取算法来提取声发射信号中的有用脉冲，屏蔽其他干扰信号，尤其是背景噪声，保证脉冲提取的准确性。采用短时能量作为门限判断进行脉冲提取的流程如图6所示。在此基础上，三门限脉冲提取算法的具体实现步骤如下：

步骤一：计算声发射信号的平均能量，表示为E_mean。在此基础上，确定尖峰阈值E_peak与端点阈值E_hs的取值。

需要说明的是，这就是三门限脉冲提取算法中需要确定的三个门限阈值。第一个门限阈值是E_mean，也被称为基准阈值。将那些自身能量大于基准阈值的帧信号称为有用的帧信号，反之则被称为无用的帧信号(无效帧)。第二个门限阈值是尖峰阈值E_peak。在那些自身能量大于尖峰阈值的帧信号中寻找脉冲信号的最高点，即能量最大的帧信号。第三个门限阈值是端点阈值E_hs。在那些自身能量靠近端点阈值的帧信号中寻找脉冲信号的起始点。基准阈值是根据声发射信号的能量来确定，尖峰阈值和端点阈值的数值则是根据基准阈值来设定。通常情况下，设置尖峰阈值E_peak＝3E_mean，端点阈值E_hs＝1.1E_mean，也可以根据需求动态调整尖峰阈值与端点阈值的设置。

步骤二：对声发射信号进行第一次分帧处理，每个帧信号的时长Δt₁为100μs，并计算每个帧信号的能量。实际上，每个帧信号的能量也就是前述的作为门限判断的短时能量。

需要说明的是，在一般情况下，脉冲信号最短的持续时间为100～200μs。因此，在进行分帧时需要控制每个帧信号的时长最大为100μs。这里将每个帧信号的时长设置为最大的100μs，是为了快速的找到能量较大的帧信号。

步骤三：从第一个帧信号开始，依次将每个帧信号的能量与尖峰阈值E_peak进行对比。当某个帧信号的能量大于尖峰阈值E_peak，代表在它的附近会出现脉冲信号的最高点，也即能量最大的帧信号。从这个帧信号出发，继续依次将之后的每个帧信号的能量与尖峰阈值E_peak进行对比，直至某个帧信号的能量小于尖峰阈值E_peak。从这些帧信号中找到能量最大的一个帧信号，它被认定为当前脉冲信号的最高点。获取这个帧信号对应的时间，即当前脉冲信号的尖峰时刻，表示为t_max。

步骤四：对声发射信号进行第二次分帧处理，每个帧信号的时长Δt₂为50μs，并重新计算每个帧信号的能量。

需要说明的是，这里将每个帧信号的时长设置为最大的50μs，是为了精确的查找每个脉冲信号的起始位置。

步骤五：以当前脉冲信号的尖峰时刻t_max为起点，分别向前和向后将每个帧信号的能量与端点阈值E_hs进行对比，直至在两个方向上分别发现某个帧信号的能量小于端点阈值E_hs。这两个帧信号的前一个帧信号被分别认定为当前脉冲信号的起始帧信号和终止帧信号。它们对应的时间分别代表当前脉冲信号的起始时刻与终止时刻，分别表示为t_begin与t_end。

步骤六：重新以当前搜索到的脉冲信号的终止时刻t_end的下一个帧信号为起点，重复步骤三至步骤五的过程，提取第二个有用的脉冲信号。以此类推，直至搜索到整个声发射信号的最后一个帧信号。至此，对于声发射信号的脉冲提取过程结束。

需要说明的是，对于由信号采集设备保存的声发射信号(信号文件)，使用三门限脉冲提取算法对其进行处理。这样，新的声发射信号中包含的都是有用脉冲信号，有效的摒弃了噪声干扰，为后续建立高质量的信号数据集提供重要保障。

2.3补零时间差脉冲匹配算法

由于声发射传感器的空间布局，会导致密闭腔体内部声发射源发出的声发射信号到达不同声发射传感器的时间不同。这就带来对应的信号文件中有用脉冲信号的起始时刻的不同，带来四通道有用脉冲信号在时间刻度上不同步(不匹配)的问题。如图7中左半部分所示，从上到下列出的四个信号图分别代表距离声发射源由近到远的声发射传感器在相同时间段内接收到的声发射信号。图中可以看出，当距离最近的声发射传感器开始接收到声发射信号时，其他三个声发射传感器还在等待。当距离最远的声发射传感器开始接收到声发射信号时，其他三个声发射传感器已经工作一段时间了。最终的结果是，在相同的采集时间内，距离最远的声发射传感器捕获的声发射信号的最少。在特征提取阶段，需要从时间上对应的四通道声发射信号上提取信号特征，构建信号数据集。因此，脉冲不同步(不匹配)的问题会对信号特征的提取工作产生影响。对此，以距离最远的声发射传感器接收到声发射信号为参考，我们提出了补零时间差脉冲匹配算法。其具体实施实现步骤如下：

步骤一：使用三门限脉冲提取算法对四通道声发射信号分别进行处理，并分别获取四个声发射信号中第一个有用脉冲的最高点。在此基础上，获取四个最高点(帧信号)对应的时间，即四个声发射信号中第一个有用脉冲的尖峰时刻，分别表示为T₁、T₂、T₃和T₄。该过程如图7右半部分所示。

步骤二：计算得到T₄-T₁、T₄-T₂和T₄-T₃的数值，它们分别代表声发射信号到达距离最近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟，声发射信号到达距离第二近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟，声发射信号到达距离第三近的声发射传感器与到达距离最远的声发射传感器之间的时间延迟。

步骤三：分别在距离最近、距离第二近、距离第三近的声发射传感器接收到声发射信号开始时刻前补充时长分别为T₄-T₁、T₄-T₂和T₄-T₃的零脉冲。需要说明的是，此时，除了距离最远的声发射传感器接收到的声发射信号，其他三个声发射传感器接收到的声发射信号的长度和起始时刻都发生了变化。

步骤四：将四个新的声发射信号的起始时刻对齐，以距离最远的声发射传感器接收到的声发射信号的长度为参考，分别截取其他三个声发射信号中从起始时刻开始相同长度的信号进行保留，舍弃后面多余的信号。至此，本发明提出的补零时间差脉冲匹配算法完成。

需要说明的是，经过补零时间差脉冲匹配算法处理后的四通道声发射信号，它们的长度、内部脉冲信号的个数和振幅的变化趋势是一致的。并且，四通道的声发射信号中的每一个帧信号都在时间上对应。区别在于，由于声发射信号到达不同声发射传感器的距离不同，会带来声发射传感器接收到的声发射信号的强度不同。因此，四个声发射信号内部脉冲信号的振幅是不同的。

3、特征工程

在传播过程中，声发射信号在时域和频域上表现出来的衰减特性可以作为表征声发射源位置的信号特征。在本小节，对声发射信号进行详细分析，验证利用声发射信号在时频和频域上衰减特性来表征声发射源位置的可行性。在此基础上，从经过脉冲提取与脉冲匹配处理后的四通道声发射信号中提取多个能够反映声发射源所在位置的时域和频域特征。使用信息增益和分类精度这两个评估指标对提取的信号特征进行分析和选择，保留性能良好的多个信号特征的构建特征向量，最终建立信号数据集。

3.1声发射信号分析

图8是在一次实验过程中，使用四个声发射传感器采集的密闭腔体内部发出的声发射信号(局部放大)。需要说明的是，此处的声发射信号已经经过脉冲提取与脉冲匹配处理。

从图8(a)所示的时域图中可以看出，四通道声发射信号之间最明显的差别是振幅。在此基础上，可以判断：通道3的声发射传感器距离声发射源最近，通道2的声发射传感器距离声发射源最远。剩余两个通道则难以分析出来。因此，可以得到：包括振幅在内的时域特征能够反映出声发射源的位置信息。从图8(b)所示的频域图中可以看出：采集的声发射信号的频率主要集中在20～120kHz之间。并且，距离声发射源越近的声发射传感器，其对应通道的声发射信号在高频点处的能量就越大，声发射信号的功率谱密度也越大。即：声发射信号的频率特性会随着传播距离的不同而存在差异。通道1和通道4的声发射信号在时域上难以进行明显区分，但从频域上却能很好的分辨。因此，频域特征同样能够用于反馈声发射源的位置信息。

3.2特征提取

在本发明中，主要从时间特征、能量特征和脉冲过零率三个方面考虑从声发射信号中提取时域特征。

首先是时间特征。声发射信号在介质中传播不同的距离需要耗费不同的时间，因此，时间特征是表征声发射源位置最重要的特征。在本发明中，选择的时间特征包括时间延迟、脉冲上升时间和脉冲对称度。

其次是能量特征。随着声发射信号在介质中传播距离的增大，它的能量会减小，它的最大振幅也会减小。当声发射信号遇到两种介质的交界面时，它的能量损失会更大。在本发明中，选择的能量特征包括振幅和能量。

最后是脉冲过零率。过零率是累加声发射信号穿越零电平的次数。过零率的大小和声发射信号的频率有着很大关系。声发射信号在传播过程中，不同频率的声发射信号的衰减速率不同。这带来不同通道对应的声发射传感器采集的声发射信号的过零率也会有所差异。因此，同样选择过零率作为重要的时域特征。

在频域特征提取部分，选择了频谱质心、频谱均方差、均方根概率和频率标准差共4个频域特征。表1给出了上述11个时域特征和频域特征的具体描述。

表1时域特征和频域特征的具体描述

/>

3.3特征分析

使用信息增益和分类精度两个指标对提取的11个时域特征与频域特征进行分析。

信息增益指在得到特征X的信息后，能使类别Y的信息不确定性减少程度的度量。特征X对数据集D的信息增益g(D,X)可表示为：数据集D的经验熵H(D)减去特征X给定条件下D的经验条件熵H(D|X)，其计算公式为：

g(D,X)＝H(D)-H(D|X) (1)。

在本发明中，使用信息增益来分析声发射信号的时域特征和频域特征，并计算得到每个信号特征的重要度。图9(a)是计算的各个信号特征的重要度。其中，横坐标每四个数值为一组，一组代表一个信号特征，一组里面的四个数值代表每个信号特征分别在四通道声发射信号上计算的数值。从图9(a)中可以看出，上升时间的重要度最大，过零率的重要度最小。均方根频率和均方根电压的数值组合中，显示某个通道声发射信号上计算的数值的重要度很低，其他三个通道声发射信号上计算的数值的重要度较高。总体来说，提取的11个信号特征具有区分声发射源所在位置的能力。

信息增益是考虑特征和特征、特征和类别之间的关系，没有考虑由特征构建的特征向量来训练得到的分类器的性能表现。通过构建基于单个信号特征以及所有特征的信号数据集来训练12个分类器，并得到12个分类器取得的分类精度。通过衡量各分类器取得的分类精度的大小，可以直观比较各信号特征的性能和对分类器的分类性能的贡献。图9(b)给出了上述12个分类器取得的分类精度的对比。其中，“All”表示分类器在由所有信号特征构建的信号数据集上取得的分类精度。从分类精度的柱状图上可以看出，当使用单个信号特征来构建信号数据集并进行分类器训练时，分类器在由上升时间构建的信号数据集上取得的分类精度最高，在由过零率构建的信号数据集上取得的分类精度最低。这与使用信息增益来评估各信号特征的结果一致。从图9中还可以看出，时域特征比频域特征更能反馈声发射源的位置信息，这可能是因为声发射信号的衰减主要体现在能量的减少。总体来说，分类器在使用所有信号特征构建的信号数据集上取得的分类精度最高。因此，经过分析，决定使用全部信号特征来构建信号数据集。

3.4信号数据集构建

本发明通过使用三门限脉冲提取算法可以从声发射信号中提取有用的脉冲信号。在此之前，需要对声发射信号进行分帧，得到多个帧信号。这样，经过脉冲提取的声发射信号中实际上包含的是多个有用的帧信号。通过使用补零时间差脉冲提取算法，可以匹配四通道声发射信号中的帧信号，使它们在时间上对应。这个过程就是将四通道声发射信号还原成在同一时刻被四个声发射传感器接收到，避免存在四通道声发射信号中的脉冲信号在时间上不同步的问题。如前所述，经过脉冲匹配处理的四通道声发射信号内包含的帧信号的个数是相等的。

当从声发射信号中提取信号特征构建信号数据时，实际上是利用帧信号计算各信号特征的数值来构建特征向量，进而形成一条信号数据。如果该数据的标签已知，添加标签后重新形成的信号数据可以称为训练数据。如果该数据的标签未知，则缺少标签的信号数据可以称为测试数据。这样，当分别从四个通道的第一个帧信号开始，依次利用帧信号来计算11个信号特征的数值，每次可以得到4×11＝44个数值。用这44个数值来构建一个一维向量。此时，根据本发明提出的声发射源定位方法的步骤四和步骤八，如果此时在训练阶段，根据不稳定声发射源所在的密闭空间的编号来给一维向量添加标签，由此得到一条信号数据。如果此时在测试阶段，则直接由这一维向量得到一条信号数据，且数据的标签是待预测的。从上述描述过程可以看出，每次同时计算四个通道内在时间上对应的四个帧信号的数值，并整合到一起形成一条信号数据。这从侧面表明了进行四通道脉冲匹配的必要性。

举例来说，在某次声发射信号的采集过程中，得到四通道声发射信号。分别对四通道声发射信号进行脉冲提取与脉冲匹配，最终得到四通道声发射信号中各包含107个在时间上对应的帧信号。经过特征提取，可以得到107条信号数据。此时，如果处于训练阶段，根据当前放置或生成声发射源的密闭空间的编号，如在3号密闭空间，则将这107条信号数据的标签设置为“3”。如果处于测试阶段，直接将这107条数据代入多分类模型中进行预测，得到107个预测的标签。

经过大量且均衡的实验，最终构建分别代表在平面密闭腔体和空间密闭腔体内部不同密闭空间放置或生成不稳定声发射源的信号数据集，将其分别命名为平面定位数据集和空间定位数据集。表2和表3分别给出了两个定位数据集的具体描述。需要说明的是，把平面定位数据集与空间定位数据集按3:1的比例划分为平面定位训练集和平面定位测试集，空间定位训练集与空间定位测试集。其中，两个定位训练集分别用于训练多分类模型和对多分类模型进行参数优化，两个定位测试集分别用于检验最优多分类模型的分类性能。

表2平面定位数据集的具体描述

表3空间定位数据集的具体描述

4、多分类模型的选择与优化

分别训练基于不同机器学习分类算法的多分类模型，并比较得出分类性能最优的多分类模型。借助网格搜索法和交叉验证法，对分类性能最优的多分类模型的内部参数进行参数优化，最终得到本发明所需的最优的多分类模型，可以用于实物测试。

4.1多分类模型的训练与比较

机器学习中适用于声发射源定位研究的分类算法包括k近邻、朴素贝叶斯、支持向量机、单一决策树、提升决策树和随机森林等。分别在平面定位训练集和空间定位训练集上训练基于上述六种分类算法的多分类模型，并分别在平面定位测试集和空间定位测试集上评估这些多分类模型的分类性能。需要说明的是，为了区分在平面定位数据集和空间定位数据集上训练的多分类模型，将在平面定位数据集上训练的多分类模型称为平面多分类模型，将在空间定位数据集上训练的多分类模型称为空间多分类模型。表4列出了基于六种分类算法的多分类模型取得的分类效果。

表4基于六种分类算法的多分类模型取得的分类效果

从分类效果上可以看出，基于随机森林的平面多分类模型与空间多分类模型均取得最高的分类精度，并且它们在训练时间上同样具有较大的优势。同时，基于不同分类算法的多分类模型取得的分类效果之间差别很大。其中，基于朴素贝叶斯的平面与空间多分类模型取得的分类精度均是最低的。朴素贝叶斯的基础是贝叶斯理论和特征条件相互独立的假设，它在进行多分类模型训练时，是假设数据集中的所有特征相互独立。而本发明的声发射信号的信号特征之间不可能完全相互独立，如时域特征之间存在一定的关联。但也正因为朴素贝叶斯是基于概率计算的结果，所以多分类模型的训练时间极短。基于k近邻和单一决策树的平面与空间多分类模型取得的分类精度相当，但基于单一决策树的两个多分类模型的训练时间稍短。提升决策树是基于Boosting的一种集成学习算法，由此训练的多分类模型取得的分类精度同样较高，但是它们的训练时间过长。基于支持向量机的多分类模型取得的分类效果表现良好。但随着训练数据的增加，训练多分类模型所需的时间急剧增加。综合来看，本发明更倾向于选择综合性能更优的随机森林来训练多分类模型，它的基分类器为决策树，取得的分类效果同样优于单一决策树和提升决策树。

分别对基于六种分类算法的平面与空间多分类模型的内部参数进行参数优化，以提升各自的分类精度和训练时间。优化结果表明，基于朴素贝叶斯和单一决策树的多分类模型的分类精度和训练时间提升有限。基于k近邻和支持向量机的多分类模型的分类精度提升较为明显，但训练时间提升有限，甚至出现训练时间增加的情况。基于提升决策树的多分类模型的分类精度提升有限，训练时间提升较为明显。相比较其他更优的分类算法，它的训练时间还是较长。在平面与空间多分类模型中，综合表现最优的依然是基于随机森林的多分类模型，它们在分类精度和训练时间上都有明显的提升。

4.2参数优化

在Scikit-Learn中，随机森林的分类函数是RandomForestClassifier()，其参数包括两部分。第一部分是Bagging框架的参数，第二部分是基分类器决策树的参数。其中，在本发明中，进行参数优化的主要参数包括：最大决策树个数n_estimators、决策树最大深度max_depth、最大特征数max_features、内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf。设定上述参数的取值范围，并使用网格搜索法和交叉验证法来寻找它们的最优取值组合。表5给出了本发明中随机森林的最优参数组合。需要说明的是，表中列出的最优参数组合是同时适用于基于随机森林的平面与空间多分类模型的。

表5随机森林的最优参数组合

将经过参数优化的最优平面与空间多分类模型分别代入平面定位测试集与空间定位测试集中进行验证，得到多个评估结果。图10给出了平面与空间多分类模型在各标签的信号数据上取得的分类精度的柱状图。换句话说，这也反映了平面与空间多分类模型分别在平面密闭腔体与空间密闭腔体内部不同密闭空间(不同位置)取得的分类精度。从图中可以看出，平面多分类模型在各标签的信号数据上取得的分类精度几乎全部达到90％，空间多分类模型在各标签的信号数据上取得的分类精度几乎全部达到80％，在某些标签的信号数据上取得的分类精度甚至达到90％。

表6给出了参数优化前后的平面与空间多分类模型分别在平面定位测试集与空间定位测试集上取得的分类精度。经过计算可以得出，参数优化前后的平面多分类模型在平面定位测试集上取得的分类精度提升了2.16％，参数优化前后的空间多分类模型在空间定位测试集上取得的分类精度提升了0.72％。同时也发现，参数优化前后的平面多分类模型的分类性能均优于参数优化前后的空间多分类模型的分类性能。这与实际情况中二维平面定位比三位空间定位更加准确的事实相一致。

表6参数优化前后的平面与空间多分类模型取得的分类精度

参数优化后的平面与空间多分类模型均取得了较为理想的分类性能，但它们给出的分类结果是停留在数据集层面的，距离真实场景下的定位结果还缺少一个数据处理的步骤。需要说明的是，最优的平面与空间多分类模型是后续取得理想定位精度的重要保障。

5、多数表决处理

在本发明中，平面定位数据集与空间定位数据集都是一批数据的集合，多分类模型能够做到的仅仅是预测这两个集合中每条数据的标签。如前所述，因为平面定位数据集与空间定位数据集内每条数据的真实标签是已知的，所以通过比较每条数据的预测标签与真实标签，可以得到对应的分类精度。遵循不稳定声发射源定位方法的步骤七至步骤九，对于待测的密闭腔体内部未知位置放置或生成的声发射源，通过采集和保存四通道声发射信号，并进行信号处理和脉冲预处理，得到高质量的四通道声发射信号。通过分帧处理和特征提取，可以得到多条不带标签的信号数据，这就是上述的一批数据(不带标签)。这时，应用最优的多分类模型可以预测这些信号数据的标签，得到多个预测标签，即多个分类结果。这些预测标签(分类结果)仅仅是针对数据集的，并不是需要的针对声发射源的预测位置(定位结果)。需要在此基础上增加多数表决的过程。具体的，对这多条信号数据的预测标签进行多数表决处理，得出得票最高的一个标签，它被设置为这批数据的共同标签。

举例来说，在某次声发射源定位测试中，得到高质量的四通道声发射信号，并最终得到107条不带标签的信号数据。应用最优的多分类模型预测这107条信号数据中有96条信号数据的标签为“3”，其他9条信号数据的标签被预测为了其他数值。此时，“3”被设置为这107条信号数据的共同标签。如果将多分类模型与多数表决处理的组合称为AE定位模型，则AE定位模型给出的定位结果是：该声发射源位于密闭腔体内部的3号密闭空间内。

6、验证与分析

寻找两个相同类型或相同结构(尺寸)的平面密闭腔体与空间密闭腔体，并分别随机在两个密闭腔体内部某个密闭空间内放置或生成一个不稳定声发射源。遵循不稳定声发射源定位方法的步骤七至步骤九，按照图3所示的固定布局规则在两个密闭腔体表面放置声发射传感器来采集一次四通道声发射信号。经过信号处理与脉冲预处理、特征提取等步骤，分别得到两个不带标签的信号数据的集合，分别称为平面验证数据集和空间验证数据集。其中，平面验证数据集包含112条信号数据，空间验证数据集包含99条信号数据。应用最优的平面多分类模型与空间多分类模型来分别预测两个集合内部多条信号数据的标签。表7和表8分别给出了平面验证数据集和空间验证数据集的预测结果。

表7平面验证数据集的预测结果

表8空间验证数据集的预测结果

对平面验证数据集与空间验证数据集的预测结果分别进行多数表决处理，得到平面验证数据集的共同标签为“11”，空间验证数据集的共同标签为“4”。这代表AE定位模型给出的平面密闭腔体的定位结果为：声发射源位于编号为11的密闭空间内，给出的空间密闭腔体的定位结果为：声发射源位于编号为4的密闭空间内。对比两个声发射源分别位于两个密闭腔体内部密闭空间的编号，发现AE定位模型给出的定位结果全部正确。

更进一步的，再次寻找十个相同类型或相同结构(尺寸)的平面密闭腔体与空间密闭腔体，并重复上述验证步骤，得到十个新的平面验证数据集和十个新的空间验证数据集。应用最优的平面与空间多分类模型分别来预测这些验证数据集，并对它们进行多数表决处理，得到共同标签。表9和表10分别示出了AE定位模型给出的十个平面验证数据集和十个空间验证数据集的定位结果。

表9十个平面验证数据集的定位结果

表10十个空间验证数据集的定位结果

从表9和表10中可以看出，AE定位模型给出的十个平面验证数据集与十个空间验证数据集的定位结果均与真实结果(实际位置)相一致，这有力证明了AE定位模型和多分类模型的实用性和可靠性，从而有力证明了本发明提出的不稳定声发射源定位方法的可行性。

7、性能评估指标

在开展密闭腔体内部不稳定声发射源定位方法的研究过程中，需要确定性能评估指标对各个阶段的实验结果进行评估。在本发明中，使用的性能评估指标主要包含两部分。第一部分是现有的机器学习指标，主要包括分类精度、precision、recall和F1-score，用于评估多分类模型对数据的标签的预测性能。第二部分是新定义的定位精度，是在对多分类模型给出的分类结果进行多数表决处理的基础上得到的，更能够满足实际工程应用的需求。

7.1机器学习指标

为了评估多分类模型对数据的标签的预测性能，主要选取了分类精度、precision、recall和F1-score作为评估指标。具体的，假设待预测数据集为D＝{(x₁,y₁),(x₂,y₂),...(x_i,y_i),...(x_m,y_m)}，其中y_i是数据x_i对应的真实标签，f(x_i)是多分类模型f给出的预测标签。分类精度可表示为标签预测正确的数据个数占总数据个数的比例，即：

式中，I是指示函数，当f(x_i)＝y_i时，I(f(x_i)＝y_i)＝1。

前文所述，可以知道声发射源定位问题本质上属于机器学习的多分类问题，是多个二分类问题的组合。在二分类问题中，precision、recall和F1-score能体现分类器对某个类别的预测能力。其中，precision表示预测为正类的样本有多少比例是真正的正类。recall表示样本中的正类有多少比例被预测正确。F1-score是对两者的有机结合。表11给出了二分类结果混淆矩阵，则precision、recall和F1-score的定义分别为：

表11分类结果混淆矩阵

7.2定位精度

如前所述，对多分类模型的性能评估都是使用的是分类精度，这实际上是机器学习中评估分类器预测性能的指标，与实际工程应用中所需的声发射源的定位精度有所不同。查找了大量的文献、专利、标准等，并未查找到密闭腔体内部声发射源定位精度的定义和描述。因此，本发明尝试给出了密闭腔体内部声发射源定位精度的定义。

假设声发射源定位测试事件S中包含t个定位任务，表示为S＝{E₁,E₂,...,E_j,...,E_t}。定位任务E_j中，对多分类模型给出的预测结果进行多数表决处理，得出预测的密闭空间的编号(预测位置)为f(E_j)。与此同时，通过物理方式打开密闭腔体，查找声发射源所在密闭空间的编号(真实位置)为N_j。如果f(E_j)与N_j一致，则认定此次定位任务成功。密闭腔体内部声发射源定位精度可表示为在声发射源定位测试事件S中，定位任务成功的数量占总定位任务数量的比例，即：

式中，I是指示函数，当f(E_j)＝N_j时，I(f(E_j)＝N_j)＝1。

在此基础上，可以计算AE定位模型在平面密闭腔体与空间密闭腔体上取得的定位精度均为100％。如果把AE定位模型在平面密闭腔体上取得的定位精度称为平面定位精度，在空间密闭腔体上取得的定位精度称为空间定位精度，则AE定位模型取得的平面定位精度与空间定位精度均为100％。

8、总结

应用本发明提出的不稳定声发射源定位方法在多个待测平面与空间密闭腔体上进行定位测试。测试结果表明，最优的平面多分类模型在平面定位数据集上取得的分类精度由87.42％提升至89.58％，最优的空间多分类模型在空间定位数据集上取得的分类精度由83.53％提升至84.25％。由多分类模型与多数表决处理的组合组成的AE定位模型，在多个平面与空间密闭腔体上取得的平面定位精度与空间定位精度均为100％。这充分证明了实验测试中构建的平面与空间多分类模型的分类与泛化性能良好。同时，实验测试结果也充分证明本发明提出的基于多分类模型的密闭腔体内部不稳定声发射源定位方法的可行性与实用性。它能够满足真实场景下密闭腔体内部声发射源的定位精度要求，与传统声发射源定位方法相比具有明显的定位优势。理论上，该方法可以推广应用于其他相近领域内声源或故障源定位的研究中。

Claims

1.一种基于多分类模型的密闭腔体内部不稳定声发射源定位方法，其特征在于所述方法包括如下步骤：

步骤一：寻找与待测密闭腔体相同型号或相同结构的空的密闭腔体，将其内部空间划分为多个近似相等的密闭空间，并对它们进行编号，分别命名为：NO.1密闭空间、NO.2密闭空间、……、NO.n密闭空间；根据事先确定的固定布局规则，在密闭腔体表面的不同位置放置声发射传感器；

步骤三：对多个信号文件进行脉冲提取与脉冲匹配，从一段声发射信号中提取有用脉冲信号，摒弃其中的零脉冲信号，匹配多通道采集的声发射信号之间的时间延迟，使多通道采集的多个声发射信号在时间刻度上对齐；

步骤五：调整步骤二中放置或生成不稳定声发射源的空间，即按照顺序将不稳定声发射源分别放置或生成在NO.2密闭空间，NO.3密闭空间，…，NO.n密闭空间内，并分别重复步骤二至步骤四的过程，得到多条标签分别为“2”，“3”，…，“n”的信号数据；将“按照顺序将不稳定声发射源分别放置或生成在NO.2密闭空间，NO.3密闭空间，…，NO.n密闭空间内，并分别重复步骤二至步骤四的过程，得到多条标签分别为“2”，“3”，…，“n”的信号数据”的步骤视为一个闭环实验过程，则通过多次重复该闭环实验过程，得到大量信号数据，这些信号数据被组合用来构建信号数据集；

2.根据权利要求1所述的基于多分类模型的密闭腔体内部不稳定声发射源定位方法，其特征在于所述步骤一中，根据不同密闭腔体的内部空间结构及其质心确定声发射传感器的固定布局规则。

3.根据权利要求1或2所述的基于多分类模型的密闭腔体内部不稳定声发射源定位方法，其特征在于所述声发射传感器为谐振式声发射传感器。

4.根据权利要求1所述的基于多分类模型的密闭腔体内部不稳定声发射源定位方法，其特征在于所述步骤二中，不稳定声发射源的发射频率为20～100kHz。

5.根据权利要求1所述的基于多分类模型的密闭腔体内部不稳定声发射源定位方法，其特征在于所述步骤三的具体步骤如下：

步骤三一：对多通道采集的多个声发射信号分别进行脉冲提取处理，并分别获取多个声发射信号中第一个有用脉冲的最高点，在此基础上，获取多个最高点对应的时间，即多个声发射信号中第一个有用脉冲的尖峰时刻，分别表示为T₁、T₂、…、T_n；

步骤三四：将多个新的声发射信号的起始时刻对齐，以距离最远的声发射传感器接收到的声发射信号的长度为参考，分别截取其他多个声发射信号中从起始时刻开始相同长度的信号进行保留，舍弃后面多余的信号。

6.根据权利要求1所述的基于多分类模型的密闭腔体内部不稳定声发射源定位方法，其特征在于所述步骤六中，基于不同机器学习分类算法的多分类模型为基于k近邻的多分类模型、基于朴素贝叶斯多的分类模型、基于支持向量机的多分类模型、基于单一决策树的多分类模型、基于提升决策树的多分类模型和基于随机森林的多分类模型，分类性能最优的多分类模型为基于随机森林的多分类模型，进行优化的内部参数包括：最大决策树个数n_estimators、决策树最大深度max_depth、最大特征数max_features、内部节点再划分所需最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf。