CN111816205B

CN111816205B - 一种基于飞机音频的机型智能识别方法

Info

Publication number: CN111816205B
Application number: CN202010657182.5A
Authority: CN
Inventors: 王卫杰; 叶瑞达; 任元; 何亮; 余昊元; 樊亚洪; 张克明; 张贤炜
Original assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Current assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Priority date: 2020-07-09
Filing date: 2020-07-09
Publication date: 2023-06-20
Anticipated expiration: 2040-07-09
Also published as: CN111816205A

Abstract

一种基于飞机音频的机型智能识别方法。所述识别方法流程包括：采集不同型号飞机的音频，将音频进行预处理，提取音频的梅尔倒谱系数特征，训练残差自注意力模型；将目标飞机音频信号输入到训练好的模型中，得到目标飞机的型号。本发明的残差自注意力模型训练网络包括：嵌入层、位置编码器、残差自注意力模块、池化层和全连接层；嵌入层将特征进行降维，位置编码器对特征进行位置编码，残差自注意力模块进行特征学习，池化层主要防止网络发生过拟合现象，全连接层表示飞机型号的类别。本发明为飞机型号识别提供了一种高效准确识别方法，可以有效地提高飞机型号识别的准确性和鲁棒性。

Description

一种基于飞机音频的机型智能识别方法

技术领域

本发明涉及目标识别领域，特别涉及一种通过飞机音频识别机型的智能方法。

背景技术

随着航空技术的发展，飞机的种类和数量越来越多，飞行速度也越来越快。因此，情报侦察系统需要处理的信息量大大增加，信息处理的速度和精度也越来越高，从而对目标识别的精度和处理时间提出了更高的要求。飞机类型识别是现代化空战的重中之重。精确的飞机型号识别在指挥自动化系统的后期信息处理中起着至关重要的作用，有利于准确分析战场态势，从而提供更合理的战场决策。

目前机型识别主要依靠人工经验，耗费了大量的人力物力，智能识别尚处于研究阶段，现有的智能识别方法主要基于图像完成。然而图像识别机型有一定的局限性，如在拍摄过程中存在着成像分辨率、运动模糊和自然因素的影响，使得基于图像的智能机型识别不能达到战场需求。基于飞机音频特征的机型识别能够有效解决图像识别存在的问题。

申请号为CN201911264985.8的公开发明专利公开了“一种飞机机型识别方法、装置及存储介质”，通过探测设备得到飞机视频信息，提取待识别飞机样本图片，通过二分类器模型识别飞机型号，此方法使用视频识别机型，具有一定的局限性。专利号为CN201410377473.3的公开发明专利公开了“一种基于视觉图像的飞机机型识别方法”，使用帧差法提取目标轮廓信息，计算飞机各部位的长度比值，此方法使用图片识别机型，不仅具有局限性而且在飞机飞行姿势不同时，识别精度会下降。

发明内容

(一)发明目的

本发明的目的是提供通过一种基于飞机音频的机型智能识别方法。本发明飞机机型识别精确度高，并能克服飞机运动模糊、成像分辨率和自然因素带来的影响，适用于实际工程项目。

(二)技术方案

本发明的技术解决方案，一种基于飞机音频的机型智能识别方法，其特征在于，包括：采集不同型号飞机的音频，将音频进行预处理，提取音频的梅尔倒谱系数特征，训练残差自注意力模型；将目标飞机音频信号输入到训练好的模型中，得到目标飞机的型号，该方法的由如下步骤构成。

采集不同型号飞机的音频，飞机起飞降落时，通过机场噪音监测系统采集不同型号飞机的噪声；飞机空中飞行时，通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声；通过不同方法采集的飞机音频可以提高识别模型的鲁棒性；

飞机音频的预处理，飞机空中飞行时的噪声可能存在人声，剔除人声部分；同一机型的飞机记录标签，将所有音频切割为5s的音频片段；对不同类型的飞机音频进行等数量随机选取，并按照7:2:1的比例随机分为训练集，验证集和测试集；

提取音频的梅尔倒谱系数特征，将音频信号频率转化为梅尔频率：

其中f_mel是梅尔频率，f是音频信号频率；梅尔频率取对数得到对数梅尔声谱，进行离散余弦变化，保留第2个到第13个系数，得到12维的梅尔倒谱系数特征；

训练残差自注意力模型，将梅尔倒谱系数特征输入至嵌入层进行降维，位置编码器对特征进行位置编码得到特征X₁，特征X₁与三个权重矩阵相乘得到Q,K,V：

W^q、W^k、W^v分别由由查询向量q(query)、键向量k(key)、值向量v(value)组成的权重矩阵；计算自注意力值：

得到特征X₂，与特征X₁特征相加得到特征X，使用残差网络结构可以减轻网络的退化程度；将特征X输入到池化层，减少网络参数，防止过拟合；最后通过全连接层，得到识别模型，全连接层中神经元的个数等于飞机型号类别总数；

将飞机训练集和验证集输入到残差自注意力模型中，网络学习率learning_rate设置为0.0001，选用交叉熵损失函数，利用梯度下降法迭代训练网络，直至损失函数收敛，得到基于飞机音频的机型智能识别模型；

识别目标机型，将飞机音频的测试集，提取梅尔倒谱系数特征，将特征输入到机型智能识别模型中，得到目标机型的识别结果，并通过与正确标签对比，计算型智能识别模型的精确度。

本发明实现了基于飞机音频的机型智能识别。本发明可以克服飞机运动模糊、成像分辨率和自然因素带来的影响，高精度识别多种机型的型号。

(三)有益效果

本发明的上述技术方案具有如下有益的技术效果：本发明被用来识别飞机的型号，可以克服飞机运动模糊、成像分辨率和自然因素带来的影响，实验结果如图4所示，其机型识别结果达到98.7％，结果证明了一种基于飞机音频的机型智能识别方法可以应用于飞机机型识别。

附图说明

图1是本发明的流程框架图；

图2是本发明实施例识别模型训练时的精确度函数图；

图3是本发明实施例识别模型训练时的损失函数图；

图4是本发明实施例基于飞机音频的飞机型号识别结果混淆图。

具体实施方式

为使本发明的技术方案、优点和目的更加清楚明了，结合具体实例说明了方法流程并参照附图，对本发明的技术方案进一步说明。

本发明实施例1，一种基于飞机音频的机型智能识别方法，参见图1，按下述步骤进行：

采集9种不同型号飞机的音频，型号分别是：a330、a340、a350、a350、a380、b737、b747、b757、b777。飞机起飞降落时，通过机场噪音监测系统采集这9种型号飞机的噪声；飞机空中飞行时，通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声。

飞机音频的预处理，飞机空中飞行时的噪声可能存在人声，剔除人声部分；同一机型的飞机记录标签，将所有音频切割为5s的音频片段，共计9900条音频样本；对不同类型的飞机音频进行等数量随机选取，并按照7:2:1的比例随机分为训练集，验证集和测试集；

得到特征X₂，与特征X₁特征相加得到特征X，使用残差网络结构可以减轻网络的退化程度；将特征X输入至池化层，减少网络参数，防止过拟合；最后通过全连接层，得到识别模型，全连接层中神经元的个数等于飞机型号类别总数，此处设置为9；

将飞机训练集和验证集输入到残差自注意力模型中，网络学习率learning_rate设置为0.0001，选用交叉熵损失函数，利用梯度下降法迭代训练网络，迭代50次，得到基于飞机音频的机型智能识别模型；在训练过程中，测试集和验证集的训练过程如图2和图3所示，损失函数变化如图2所示，精确度变化如图3所示。

识别目标机型，将飞机音频的测试集，提取梅尔倒谱系数特征，将特征输入到机型智能识别模型中，得到目标机型的识别结果，并通过与正确标签对比，其识别正确率到达98.7％；其结果如图4所示，横坐标表示模型识别型号，纵坐标表示飞机真实型号。

本发明说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims

1.一种基于飞机音频的机型智能识别方法，其特征在于，包括：采集不同型号飞机的音频，将音频进行预处理，提取音频的梅尔倒谱系数特征，训练残差自注意力模型；将目标飞机音频信号输入到训练好的模型中，得到目标飞机的型号，该方法的步骤包括如下；

(1)采集不同型号飞机的音频及预处理：

飞机起飞降落时，通过机场噪音监测系统采集不同型号飞机的噪声；飞机空中飞行时，通过安装在飞机录音设备采集与飞机起飞降落时相同机型飞机的噪声；通过不同方法采集的飞机音频提高识别模型的鲁棒性；飞机音频的预处理，飞机空中飞行时的噪声可能存在人声，剔除人声；同一机型的飞机记录标签，将所有音频切割为5s的音频片段；对不同类型的飞机音频进行等数量随机选取，并按照7:2:1的比例随机分为训练集，验证集和测试集；

(2)提取音频的梅尔倒谱系数特征；

将音频信号频率转化为梅尔频率：

(3)训练残差自注意力模型：

(3a)训练流程：

将梅尔倒谱系数特征输入至嵌入层进行降维，位置编码器对特征进行位置编码得到特征X₁，特征X₁与三个权重矩阵相乘得到Q,K,V：

W^q、W^k、W^v分别由查询向量q、键向量k、值向量v组成的权重矩阵；Q,K,V进行两步计算，算法1：

算法2：

X₂＝Matmul·V (4)

得到特征X₂，与特征X₁特征相加得到特征X，使用残差网络结构减轻网络的退化程度；将特征X输入池化层，减少网络参数，防止过拟合；最后通过全连接层输出，得到识别模型，全连接层中神经元的个数等于飞机型号类别总数；

(3b)参数设置：

(4)识别目标机型：

将飞机音频的测试集，按照上述步骤(1)-(3)操作得到音频的梅尔倒谱系数特征，将特征输入到机型智能识别模型中，得到目标机型的识别结果，并通过与正确标签对比，计算型智能识别模型的精确度。