CN114927141B

CN114927141B - 异常水声信号的检测方法及系统

Info

Publication number: CN114927141B
Application number: CN202210846309.7A
Authority: CN
Inventors: 刘立国; 郭勇; 高玉帅; 高强; 张云雷; 樊诚
Original assignee: Naval University of Engineering PLA
Current assignee: Naval University of Engineering PLA
Priority date: 2022-07-19
Filing date: 2022-07-19
Publication date: 2022-10-25
Anticipated expiration: 2042-07-19
Also published as: CN114927141A

Abstract

本发明公开了一种异常水声信号的检测方法及系统，通过获取背景信号集合、正常信号集合和异常信号集合，对其进行分析和处理生成多路水听器音频文件；对多路水听器音频文件进行下采样，选取音频特征进行特征提取，生成特征图；采用线性回归方法对所述特征图进行分析，识别其中的异常信号，并对所述多路水听器音频文件进行标注，生成异常索引文件；将所述异常索引文件与异常信号音频序列真值进行对比，生成异常信号的召回率Recall，当召回率小于设定值时，调整提取音频特征、正常阈值θp和置信度阈值θa，直至召回率Recall不小于设定值；最后将待检测异常水声信号的多路水听器音频文件执行上述步骤得到检测结果。可靠性高，适用性广，无需依赖训练集和测试集。

Description

异常水声信号的检测方法及系统

技术领域

本发明涉及信号检测技术领域，具体涉及一种异常水声信号的检测方法及系统。

背景技术

异常水声信号的检测目的是识别水声音频信号中，目标音频事件是否出现和出现的时间。

现有技术中，通常使用端到端的检测方案，先使用特征提取工具将一维的音频信号转化为二维特征图，然后利用卷积神经网络CNN等深度学习技术对该特征进行目标检测。

上述技术方案，由于音频测试数据中包含较短长度，并且水下音频信号模式差异较大，导致其技术效果严重依赖于训练数据，导致对于不同的待测水域，其技术方案难以进行迁移测试。因此亟需一种能处理任意长度音频信号、少量类型的异常信号，并且可以进行多场景适配的异常水声信号的检测方法。

发明内容

本发明的目的在于，提供一种能处理较短长度的音频信号和少量类型的异常信号，并且可以进行多场景适配的异常水声信号的检测方法。

为解决上述技术问题，本发明提出了一种异常水声信号的检测方法，包括以下步骤：

步骤S1：通过对网络公开的数据集和船只音频数据进行分析和处理，得到背景信号集合、正常信号集合和异常信号集合；

步骤S2：在待检测的海洋范围内，对所述背景信号集合、正常信号集合和异常信号集合进行处理，生成模拟数据，所述模拟数据包括：水听器阵列坐标、水听器信道的背景信号、正常船只的运动轨迹坐标序列、正常船只运动中的原始声音信号、异常船只的运动轨迹坐标序列、异常船只运动中的原始声音信号；

步骤S3：对所述模拟数据进行分析，通过所述异常船只的运动轨迹和水听器阵列坐标，计算所述异常船只运动中的原始声音信号达到每个水听器的时间，对所述水听器信道的背景信号进行异常信号标注，生成异常信号音频序列真值；

步骤S4：将所述模拟数据中正常船只、异常船只运动中的原始声音信号进行衰减处理，与所述水听器信道的背景信号进行叠加，生成多路水听器音频文件；

步骤S5：对所述多路水听器音频文件进行下采样，选取音频特征进行特征提取，并生成特征图；

步骤S6：采用线性回归方法对所述特征图进行分析，通过设定正常阈值θ_p和置信度阈值θ_a识别其中的异常信号，并对所述多路水听器音频文件进行标注，生成异常索引文件；

步骤S7：将所述异常索引文件与异常信号音频序列真值进行对比，计算异常信号的召回率Recall，当召回率小于设定值时，调整步骤S5中提取的所述音频特征和步骤S6中的正常阈值θ_p和置信度阈值θ_a，重新执行步骤S7直至所述召回率Recall不小于设定值；

S8：将待检测异常水声信号的多路水听器音频文件执行步骤S5～S6，得到检测结果。

优选地，步骤S1中的所述背景信号集合包括海洋常规白噪声和生物声音；所述正常信号集合包括水面船只声音；所述异常信号包括水下船只声音和其它无人潜航器。

优选地，步骤S2具体为：在待检测的海洋范围内，随机生成指定数量的水听器坐标，构建水听器阵列坐标；从所述背景信号集合中随机生成指定数量的背景信号并添加随机噪声，生成水听器信道的背景信号；在待检测的海洋范围内，随机生成正常船只的运动轨迹，构建正常船只的运动轨迹坐标序列；从所述正常信号集合中随机抽取指定数量的正常船只信号并添加随机噪声，生成正常船只在运动中的原始声音信号；在待检测的海洋范围内，随机生成指定数量的异常船只的运动轨迹，构成异常船只的运动轨迹坐标序列；从所述异常信号集合中随机抽取指定数量的异常船只信号并添加随机噪声，生成异常船只在运动中的原始声音信号。

优选地，步骤S3具体为：计算所述异常船只与每个水听器的距离L，通过距离L和水下声速V，计算所述异常船只的声音信号达到每个水听器的时间，通过所述时间对水听器信道的背景信号进行标注，生成异常信号音频序列真值。

优选地，步骤S4包括以下步骤：

步骤S41：通过步骤S3的方法计算所述正常船只和异常船只运动中的原始声音信号到达每个水听器的时间；

步骤S42：通过水下声强计算公式和声强还原振幅Griffin-Lim方法计算到达每个所述水听器的衰减后的声音信号；

步骤S43：将所述衰减后的声音信号和水听器信道的背景信号进行叠加，生成多路水听器音频文件。

优选地，步骤S42具体为：

通过以下公式计算所述原始声音信号的衰减系数α：

式中，f表示所述原始声音信号的频率；

通过以下公式计算所述原始声音信号衰减后的声强I(L)：

式中，L表示所述原始声音信号与水听器的距离；

并通过声强计算公式

计算出衰减后的振幅A(L)：

式中，ω表示声波的角频率，ρ表示传播介质的密度，v表示水下声速；

最后，采用声强还原振幅Griffin-Lim方法将衰减后的振幅A(L)重建为声音信号。

优选地，步骤S6包括以下步骤：

步骤S61：采用线性回归方法，在所述特征图中每一频率下，固定窗口宽度窗口帧的振幅能量值A进行预测，生成相邻的下一窗口帧的振幅能量值

步骤S62：设定正常阈值θ_p，判断所述多路水听器音频文件在当前频率下的振幅能量真实值

是否在正常阈值区间

中，如果不处于所述正常阈值区间，则判断在所述频率和窗口帧下出现了异常信号；

步骤S63：计算每一个所述窗口帧在所有频率下的异常信号出现次数与频率数量的比值，所述比值为异常置信度c，并设定置信度阈值θ_a，当所述异常置信度c超过置信度阈值θ_a，则判断所述窗口帧为异常窗口帧；

步骤S64：通过所述异常窗口帧，对所述多路水听器音频文件进行标注，生成异常索引文件。

优选地，步骤S7具体为：通过所述异常索引文件中标注的异常信号与异常信号音频序列真值进行比对，计算所述异常索引文件中将异常信号标注为异常的数量TP和将异常信号标注为正常的数量FN，并通过以下公式计算召回率Recall：

Recall＝TP/(TP+FN)。

本发明还提出了一种异常水声信号的检测系统，包括信号生成模块、位置生成模块、信号衰减模块、信号叠加模块、特征提取模块、目标检测模块和验证模块；

所述信号生成模块，用于生成水听器背景信号、正常船只声音信号和异常船只声音信号；

所述位置生成模块，用于生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列；

所述信号衰减模块，用于将所述生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列和生成水听器背景信号、正常船只声音信号和异常船只声音信号进行处理，生成所述正常船只的异常船只的经过衰减后到达所述水听器阵列的声音信号，输入所述信号叠加模块，并生成异常信号音频序列真值；

所述信号叠加模块，用于将所述衰减后的声音信号与信号生成模块生成的水听器背景信号进行叠加，生成多路水听器音频文件，并输所述特征提取模块；

所述特征提取模块，用于对所述多路水听器音频文件进行下采样，并选取音频特征进行特征提取，生成特征图输入所述目标检测模块；

所述目标检测模块，采用线性回归方法对所述特征图进行分析，通过设定正常阈值θ_p和置信度阈值θ_a识别其中的异常信号并标注，生成异常索引文件并输入所述验证模块；

所述验证模块，将所述异常索引文件与异常信号音频序列真值进行对比，生成异常信号的召回率Recall，当召回率小于设定值时，调整所述特征提取模块的音频特征和目标检测模块的正常阈值θ_p和置信度阈值θ_a，重新进行特征提取和异常信号识别，直至所述异常信号的召回率不小于设定值。

优选地，所述目标检测模块具体方法为：采用线性回归方法，在所述特征图中每一频率下，对特征图中固定窗口宽度窗口帧的振幅能量值A进行预测，生成相邻的下一窗口帧的振幅能量值

设定正常阈值θ_p，判断所述多路水听器音频文件在当前频率下的振幅能量真实值

是否在正常阈值区间

中，如果不处于所述正常阈值区间，则判断在所述频率和窗口帧下出现了异常信号；计算每一个所述窗口帧在所有频率下的异常信号出现次数与频率数量的比值，所述比值为异常置信度c，并设定置信度阈值θ_a，当所述异常置信度c超过置信度阈值θ_a，则判断所述窗口帧为异常窗口帧；通过所述异常窗口帧，对所述多路水听器音频文件进行标注，生成异常索引文件。

本发明的优点在于：本发明通过下采样的方式，可以读取任意长度和任意采样率的多路音频文件；对于缺少大量真实数据的场景，本发明采用生成的模拟信号构建检测方法并进行调整，可以准确的完成检测工作，适配不同的场景。并且可以根据实际任务需求对模拟信号的输出数量进行调整，达成不同的任务目标。其次，本发明采用线性回归的学习方法，对特征进行处理，对于训练数据的依赖性较低，面向未知场景的迁移性较强。

附图说明

图1为本发明方法流程图示意图；

图2为本发明实施例中STFT时频图和Mel频谱图；

图3.1为本发明实施例Mel频谱图；

图3.2为本发明实施例Mel频谱图的三维可视化结果；

图3.3为Mel频谱图抽取指定频率的能量-时间图；

图3.4为图3.3中方框区域的放大图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明的保护范围。

如图1所示，本发明实施例提供了一种异常水声信号的检测方法，包括以下步骤：

具体地，通过对原始数据来源为DeepShip公开数据集和网络公开船只音频数据，经过手工筛选和裁剪，得到包括海洋常规白噪声和生物声音的背景信号集合、包括水面船只声音的正常信号集合和包括水下船只和其它无人潜航器声音异常信号集合。

步骤S2：在待检测的海洋范围内，对背景信号集合、正常信号集合和异常信号集合进行处理，生成模拟数据，模拟数据包括：水听器阵列坐标、水听器信道的背景信号、正常船只的运动轨迹坐标序列、正常船只运动中的原始声音信号、异常船只的运动轨迹坐标序列、异常船只运动中的原始声音信号；

具体地，在待检测的海洋范围内，随机生成指定数量的水听器坐标，构建水听器阵列坐标；从背景信号集合中随机生成指定数量的背景信号并添加随机噪声，生成水听器信道的背景信号；在待检测的海洋范围内，随机生成正常船只的运动轨迹，构建正常船只的运动轨迹坐标序列；从正常信号集合中随机抽取指定数量的正常船只信号并添加随机噪声，生成正常船只在运动中的原始声音信号；在待检测的海洋范围内，随机生成指定数量的异常船只的运动轨迹，构成异常船只的运动轨迹坐标序列；从异常信号集合中随机抽取指定数量的异常船只信号并添加随机噪声，生成异常船只在运动中的原始声音信号。

本发明实施例中，水听器的指定数量范围为1-16，一般是从4，8，16中选择数值，正常船只的指定数量范围为0-10，一般是0，2，4，6，8中选择数值，异常船只的指定数量范围为0-4，一般是选择2。

步骤S3：对模拟数据进行分析，通过异常船只的运动轨迹和水听器阵列坐标，计算异常船只运动中的原始声音信号达到每个水听器的时间，对水听器信道的背景信号进行异常信号标注，生成异常信号音频序列真值；

本发明实施例中，以一秒为时间间隔进行正常船只和异常船只位置的采样，计算每隔一秒各个船只与每个水听器的距离L，通过距离L和水下声音传播速度V，得到异常船只声音船舶到每个水听器的时间序列，通过时间序列，对水听器信道的背景信号进行标注，表明水听器在此时刻所接受到的信号中存在异常水声信号。

步骤S4：将模拟信号中正常船只、异常船只的原始声音信号进行衰减处理，与水听器信道的背景信号进行叠加，生成多路水听器音频文件；

具体地，通过上述方法计算正常船只和异常船只运动中的原始声音信号到达每个水听器的时间；

通过以下公式计算所述原始声音信号的衰减系数α：

式中，f表示所述原始声音信号的频率；

通过以下公式计算所述原始声音信号衰减后的声强I(L)：

式中，L表示所述原始声音信号与水听器的距离；

并通过声强计算公式

计算出衰减后的振幅A(L)：

最后，采用声强还原振幅Griffin-Lim方法将衰减后的振幅A(L)重建为声音信号，并将衰减后的声音信号和水听器信道的背景信号进行叠加，生成多路水听器音频文件。

步骤S5：对多路水听器音频文件进行下采样至22050HZ，降低处理过程中的内存占用，选取音频特征进行特征提取，并生成特征图，本发明实施例中特征图采用numpy数组进行存储，使得读取更为方便；

本发明实施例中，由于在水下环境中，高频的声音信号会衰减的非常快，因此水听器接收到的音频信号中，低频区间会包含更多的远处声音信号，因此本实施例选用梅尔频谱图Mel作为音频特征进行特征提取，如图2所示，在STFT时频图中，纵轴呈0-10000均匀排布，而梅尔频谱图Mel中，将纵轴取对数，放大了低频区间的信号值，使低频区间的信号变化更加显著。

需要说明的是，根据水下环境、检测范围和应用场景的不同，音频特征还可以选用短时傅里叶变换频谱图STFT、梅尔频率倒谱系数MFCC、色度频率Chroma_STFT、过零率ZeroCrossing Rate、频谱质心Spectral Centroid和频谱滚降系数Spectral Roll-off。

步骤S6：采用线性回归方法对特征图进行分析，通过设定正常阈值θ_p和置信度阈值θ_a识别其中的异常信号并标注，生成异常索引文件；

具体的，使用线性回归Linear Regression的方法对特征图的每一频率f在[t，t+p]窗口帧的振幅能量值A的变化进行预测，生成接下来第t+p+1窗口帧在同一频率下的振幅能量值

如图3.1所示的Mel频谱图和图3.2所示的Mel频谱图三维可视化结果，t是指图3.1中时间轴上的某一时刻，p是指一个用户指定的窗口宽度。在指定的某一频率f下，如图3.3所示，表示从Mel频谱图中抽取该频率的能量随时间变化曲线，[t，t+p]表示图3.3中圈出的区间，放大后就是图3.4的曲线图。本发明通过线性回归算法，将圈出的区间进行线性回归，拟合一条回归曲线，进行下一帧[t+p+1]值的预测。

设定正常阈值θ_p，判断多路水听器音频文件在某一频率第t+p+1窗口帧的振幅能量真实值

是否在预测值

的正常阈值区间

中，如果在正常阈值区间中，则判定该真实值为正常信号，否则判定在该频率与窗口帧(f，t+p+1)下出现了异常信号。

计算每一个窗口帧在所有频率下的异常信号出现次数与频率数量的比值，比值为异常置信度c，并设定置信度阈值θ_a，当异常置信度c超过置信度阈值θ_a，则判断窗口帧为异常窗口帧。

将异常窗口帧与多路水听器音频文件在默认采样率下进行对齐，并按照异常窗口帧的出现时间，对多路水听器音频文件进行标注，将其划分为正常信号和异常信号，并根据正常信号和异常信号，将多路水听器音频文件进行分割，保存为异常信号的音频片段，以扩充训练集和数据集。

本发明实施例中，正常阈值θ_p是根据当前测试环境中声音的信噪比进行设定，如果噪声很大，则阈值调高，如果噪声较小，则阈值调低，阈值的区间为[0.0-0.99]。置信度阈值θ_a设定为0.6，当一个音频片段中筛查出的异常窗口帧过多，则可以适当提高阈值；当一个音频片段中筛查出的异常窗口帧过少，则可以适当降低阈值。

步骤S7：将异常索引文件与异常信号音频序列真值进行对比，生成异常信号的召回率Recall，当召回率小于设定值时，调整步骤S5中的音频特征和步骤S6中的正常阈值θ_p和置信度阈值θ_a，重新执行步骤S7直至召回率Recall不小于设定值。

通过异常索引文件中标注的异常信号与异常信号音频序列真值进行比对，计算所述异常索引文件中将异常信号标注为异常的数量TP和将异常信号标注为正常的数量FN，并通过以下公式计算召回率Recall：

Recall＝TP/(TP+FN)。

步骤S8：将待检测异常水声信号的多路水听器音频文件执行步骤S5～S6，得到检测结果。

在本发明实施例中，将召回率Recall的阈值设定为0.8，当高于0.8时，表示提取的音频特征和设定正常阈值θ_p和置信度阈值θ_a，满足检测的海洋范围的异常水声信号的检测需求。当召回率小于0.8时，则判定当前的配置不满足预期目标，需要进行调整，具体的调整包括以下方面：

1、减小正常阈值θ_P，一般不低于0.2。

2、减小置信度阈值θ_a，一般不低于0.5。

3、选取不同的音频特征进行提取，例如短时傅里叶变换频谱图STFT、梅尔频率倒谱系数MFCC、色度频率Chroma_STFT等。

本发明还提出了一种异常水声信号的检测系统，其特征在于：包括信号生成模块、位置生成模块、信号衰减模块、信号叠加模块、特征提取模块、目标检测模块和验证模块；

信号生成模块，用于生成水听器背景信号、正常船只声音信号和异常船只声音信号；

位置生成模块，用于生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列；

信号衰减模块，用于将生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列和生成水听器背景信号、正常船只声音信号和异常船只声音信号进行处理，生成正常船只的异常船只的经过衰减后到达水听器阵列的声音信号，输入信号叠加模块，并生成异常信号音频序列真值；

信号叠加模块，用于将衰减后的声音信号与信号生成模块生成的水听器背景信号进行叠加，生成多路水听器音频文件，并输特征提取模块；

特征提取模块，用于对多路水听器音频文件进行下采样至22050HZ，并选取音频特征进行特征提取，生成特征图输入目标检测模块；

目标检测模块，采用线性回归方法对特征图进行分析，通过设定正常阈值θ_p和置信度阈值θ_a识别其中的异常信号并标注，并输入验证模块；

验证模块，将异常索引文件与异常信号音频序列真值进行对比，生成异常信号的召回率Recall，当Recall小于0.8时，调整特征提取模块的音频特征和目标检测模块的正常阈值θ_p和置信度阈值θ_a，重新进行特征提取和异常信号识别，直至异常信号的召回率Recall不小于0.8。

进一步地，目标检测模块具体方法为：采用线性回归方法，在特征图中每一频率下，对特征图中固定窗口宽度窗口帧的振幅能量值A进行预测，生成相邻的下一窗口帧的振幅能量值

设定正常阈值θ_p，判断多路水听器音频文件在当前频率下的振幅能量真实值

是否在正常阈值区间

中，如果不处于正常阈值区间，则判断在频率和窗口帧下出现了异常信号；计算每一个窗口帧在所有频率下的异常信号出现次数与频率数量的比值，比值为异常置信度c，并设定置信度阈值θ_p，当异常置信度c超过置信度阈值θ_a，则判断窗口帧为异常窗口帧；通过异常窗口帧，对多路水听器音频文件进行标注，生成异常索引文件。

以上仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等等，均应包含在本发明的保护范围之内。

Claims

1.一种异常水声信号的检测方法，其特征在于：包括以下步骤：

步骤S7：将所述异常索引文件与异常信号音频序列真值进行对比，生成异常信号的召回率Recall，当召回率小于设定值时，调整步骤S5中提取的所述音频特征和步骤S6中的正常阈值θ_p和置信度阈值θ_a，重新执行步骤S7直至所述召回率Recall不小于设定值；

2.根据权利要求1所述的一种异常水声信号的检测方法，其特征在于：步骤S1中的所述背景信号集合包括海洋常规白噪声和生物声音信号；所述正常信号集合包括水面船只声音信号；所述异常信号包括水下船只声音信号和其它无人潜航器。

3.根据权利要求1所述的一种异常水声信号的检测方法，其特征在于：步骤S2具体为：在待检测的海洋范围内，随机生成指定数量的水听器坐标，构建水听器阵列坐标；从所述背景信号集合中随机生成指定数量的背景信号并添加随机噪声，生成水听器信道的背景信号；在待检测的海洋范围内，随机生成正常船只的运动轨迹，构建正常船只的运动轨迹坐标序列；从所述正常信号集合中随机抽取指定数量的正常船只信号并添加随机噪声，生成正常船只在运动中的原始声音信号；在待检测的海洋范围内，随机生成指定数量的异常船只的运动轨迹，构成异常船只的运动轨迹坐标序列；从所述异常信号集合中随机抽取指定数量的异常船只信号并添加随机噪声，生成异常船只在运动中的原始声音信号。

4.根据权利要求1所述的一种异常水声信号的检测方法，其特征在于：步骤S3具体为：计算所述异常船只与每个水听器的距离L，通过距离L和水下声速V，计算所述异常船只的声音信号达到每个水听器的时间，通过所述时间对水听器信道的背景信号进行标注，生成异常信号音频序列真值。

5.根据权利要求4所述的一种异常水声信号的检测方法，其特征在于：步骤S4包括以下步骤：

6.根据权利要求5所述的一种异常水声信号的检测方法，其特征在于：步骤S42具体为：

通过以下公式计算所述原始声音信号的衰减系数α：