CN114927141B - 异常水声信号的检测方法及系统 - Google Patents

异常水声信号的检测方法及系统 Download PDF

Info

Publication number
CN114927141B
CN114927141B CN202210846309.7A CN202210846309A CN114927141B CN 114927141 B CN114927141 B CN 114927141B CN 202210846309 A CN202210846309 A CN 202210846309A CN 114927141 B CN114927141 B CN 114927141B
Authority
CN
China
Prior art keywords
abnormal
signal
hydrophone
ship
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210846309.7A
Other languages
English (en)
Other versions
CN114927141A (zh
Inventor
刘立国
郭勇
高玉帅
高强
张云雷
樊诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval University of Engineering PLA
Original Assignee
Naval University of Engineering PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval University of Engineering PLA filed Critical Naval University of Engineering PLA
Priority to CN202210846309.7A priority Critical patent/CN114927141B/zh
Publication of CN114927141A publication Critical patent/CN114927141A/zh
Application granted granted Critical
Publication of CN114927141B publication Critical patent/CN114927141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/44Special adaptations for subaqueous use, e.g. for hydrophone
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种异常水声信号的检测方法及系统,通过获取背景信号集合、正常信号集合和异常信号集合,对其进行分析和处理生成多路水听器音频文件;对多路水听器音频文件进行下采样,选取音频特征进行特征提取,生成特征图;采用线性回归方法对所述特征图进行分析,识别其中的异常信号,并对所述多路水听器音频文件进行标注,生成异常索引文件;将所述异常索引文件与异常信号音频序列真值进行对比,生成异常信号的召回率Recall,当召回率小于设定值时,调整提取音频特征、正常阈值θp和置信度阈值θa,直至召回率Recall不小于设定值;最后将待检测异常水声信号的多路水听器音频文件执行上述步骤得到检测结果。可靠性高,适用性广,无需依赖训练集和测试集。

Description

异常水声信号的检测方法及系统
技术领域
本发明涉及信号检测技术领域,具体涉及一种异常水声信号的检测方法及系统。
背景技术
异常水声信号的检测目的是识别水声音频信号中,目标音频事件是否出现和出现的时间。
现有技术中,通常使用端到端的检测方案,先使用特征提取工具将一维的音频信号转化为二维特征图,然后利用卷积神经网络CNN等深度学习技术对该特征进行目标检测。
上述技术方案,由于音频测试数据中包含较短长度,并且水下音频信号模式差异较大,导致其技术效果严重依赖于训练数据,导致对于不同的待测水域,其技术方案难以进行迁移测试。因此亟需一种能处理任意长度音频信号、少量类型的异常信号,并且可以进行多场景适配的异常水声信号的检测方法。
发明内容
本发明的目的在于,提供一种能处理较短长度的音频信号和少量类型的异常信号,并且可以进行多场景适配的异常水声信号的检测方法。
为解决上述技术问题,本发明提出了一种异常水声信号的检测方法,包括以下步骤:
步骤S1:通过对网络公开的数据集和船只音频数据进行分析和处理,得到背景信号集合、正常信号集合和异常信号集合;
步骤S2:在待检测的海洋范围内,对所述背景信号集合、正常信号集合和异常信号集合进行处理,生成模拟数据,所述模拟数据包括:水听器阵列坐标、水听器信道的背景信号、正常船只的运动轨迹坐标序列、正常船只运动中的原始声音信号、异常船只的运动轨迹坐标序列、异常船只运动中的原始声音信号;
步骤S3:对所述模拟数据进行分析,通过所述异常船只的运动轨迹和水听器阵列坐标,计算所述异常船只运动中的原始声音信号达到每个水听器的时间,对所述水听器信道的背景信号进行异常信号标注,生成异常信号音频序列真值;
步骤S4:将所述模拟数据中正常船只、异常船只运动中的原始声音信号进行衰减处理,与所述水听器信道的背景信号进行叠加,生成多路水听器音频文件;
步骤S5:对所述多路水听器音频文件进行下采样,选取音频特征进行特征提取,并生成特征图;
步骤S6:采用线性回归方法对所述特征图进行分析,通过设定正常阈值θp和置信度阈值θa识别其中的异常信号,并对所述多路水听器音频文件进行标注,生成异常索引文件;
步骤S7:将所述异常索引文件与异常信号音频序列真值进行对比,计算异常信号的召回率Recall,当召回率小于设定值时,调整步骤S5中提取的所述音频特征和步骤S6中的正常阈值θp和置信度阈值θa,重新执行步骤S7直至所述召回率Recall不小于设定值;
S8:将待检测异常水声信号的多路水听器音频文件执行步骤S5~S6,得到检测结果。
优选地,步骤S1中的所述背景信号集合包括海洋常规白噪声和生物声音;所述正常信号集合包括水面船只声音;所述异常信号包括水下船只声音和其它无人潜航器。
优选地,步骤S2具体为:在待检测的海洋范围内,随机生成指定数量的水听器坐标,构建水听器阵列坐标;从所述背景信号集合中随机生成指定数量的背景信号并添加随机噪声,生成水听器信道的背景信号;在待检测的海洋范围内,随机生成正常船只的运动轨迹,构建正常船只的运动轨迹坐标序列;从所述正常信号集合中随机抽取指定数量的正常船只信号并添加随机噪声,生成正常船只在运动中的原始声音信号;在待检测的海洋范围内,随机生成指定数量的异常船只的运动轨迹,构成异常船只的运动轨迹坐标序列;从所述异常信号集合中随机抽取指定数量的异常船只信号并添加随机噪声,生成异常船只在运动中的原始声音信号。
优选地,步骤S3具体为:计算所述异常船只与每个水听器的距离L,通过距离L和水下声速V,计算所述异常船只的声音信号达到每个水听器的时间,通过所述时间对水听器信道的背景信号进行标注,生成异常信号音频序列真值。
优选地,步骤S4包括以下步骤:
步骤S41:通过步骤S3的方法计算所述正常船只和异常船只运动中的原始声音信号到达每个水听器的时间;
步骤S42:通过水下声强计算公式和声强还原振幅Griffin-Lim方法计算到达每个所述水听器的衰减后的声音信号;
步骤S43:将所述衰减后的声音信号和水听器信道的背景信号进行叠加,生成多路水听器音频文件。
优选地,步骤S42具体为:
通过以下公式计算所述原始声音信号的衰减系数α:
Figure GDA0003834683330000041
式中,f表示所述原始声音信号的频率;
通过以下公式计算所述原始声音信号衰减后的声强I(L):
Figure GDA0003834683330000042
式中,L表示所述原始声音信号与水听器的距离;
并通过声强计算公式
Figure GDA0003834683330000043
计算出衰减后的振幅A(L):
Figure GDA0003834683330000044
式中,ω表示声波的角频率,ρ表示传播介质的密度,v表示水下声速;
最后,采用声强还原振幅Griffin-Lim方法将衰减后的振幅A(L)重建为声音信号。
优选地,步骤S6包括以下步骤:
步骤S61:采用线性回归方法,在所述特征图中每一频率下,固定窗口宽度窗口帧的振幅能量值A进行预测,生成相邻的下一窗口帧的振幅能量值
Figure GDA0003834683330000051
步骤S62:设定正常阈值θp,判断所述多路水听器音频文件在当前频率下的振幅能量真实值
Figure GDA0003834683330000052
是否在正常阈值区间
Figure GDA0003834683330000053
中,如果不处于所述正常阈值区间,则判断在所述频率和窗口帧下出现了异常信号;
步骤S63:计算每一个所述窗口帧在所有频率下的异常信号出现次数与频率数量的比值,所述比值为异常置信度c,并设定置信度阈值θa,当所述异常置信度c超过置信度阈值θa,则判断所述窗口帧为异常窗口帧;
步骤S64:通过所述异常窗口帧,对所述多路水听器音频文件进行标注,生成异常索引文件。
优选地,步骤S7具体为:通过所述异常索引文件中标注的异常信号与异常信号音频序列真值进行比对,计算所述异常索引文件中将异常信号标注为异常的数量TP和将异常信号标注为正常的数量FN,并通过以下公式计算召回率Recall:
Recall=TP/(TP+FN)。
本发明还提出了一种异常水声信号的检测系统,包括信号生成模块、位置生成模块、信号衰减模块、信号叠加模块、特征提取模块、目标检测模块和验证模块;
所述信号生成模块,用于生成水听器背景信号、正常船只声音信号和异常船只声音信号;
所述位置生成模块,用于生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列;
所述信号衰减模块,用于将所述生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列和生成水听器背景信号、正常船只声音信号和异常船只声音信号进行处理,生成所述正常船只的异常船只的经过衰减后到达所述水听器阵列的声音信号,输入所述信号叠加模块,并生成异常信号音频序列真值;
所述信号叠加模块,用于将所述衰减后的声音信号与信号生成模块生成的水听器背景信号进行叠加,生成多路水听器音频文件,并输所述特征提取模块;
所述特征提取模块,用于对所述多路水听器音频文件进行下采样,并选取音频特征进行特征提取,生成特征图输入所述目标检测模块;
所述目标检测模块,采用线性回归方法对所述特征图进行分析,通过设定正常阈值θp和置信度阈值θa识别其中的异常信号并标注,生成异常索引文件并输入所述验证模块;
所述验证模块,将所述异常索引文件与异常信号音频序列真值进行对比,生成异常信号的召回率Recall,当召回率小于设定值时,调整所述特征提取模块的音频特征和目标检测模块的正常阈值θp和置信度阈值θa,重新进行特征提取和异常信号识别,直至所述异常信号的召回率不小于设定值。
优选地,所述目标检测模块具体方法为:采用线性回归方法,在所述特征图中每一频率下,对特征图中固定窗口宽度窗口帧的振幅能量值A进行预测,生成相邻的下一窗口帧的振幅能量值
Figure GDA0003834683330000071
设定正常阈值θp,判断所述多路水听器音频文件在当前频率下的振幅能量真实值
Figure GDA0003834683330000072
是否在正常阈值区间
Figure GDA0003834683330000073
中,如果不处于所述正常阈值区间,则判断在所述频率和窗口帧下出现了异常信号;计算每一个所述窗口帧在所有频率下的异常信号出现次数与频率数量的比值,所述比值为异常置信度c,并设定置信度阈值θa,当所述异常置信度c超过置信度阈值θa,则判断所述窗口帧为异常窗口帧;通过所述异常窗口帧,对所述多路水听器音频文件进行标注,生成异常索引文件。
本发明的优点在于:本发明通过下采样的方式,可以读取任意长度和任意采样率的多路音频文件;对于缺少大量真实数据的场景,本发明采用生成的模拟信号构建检测方法并进行调整,可以准确的完成检测工作,适配不同的场景。并且可以根据实际任务需求对模拟信号的输出数量进行调整,达成不同的任务目标。其次,本发明采用线性回归的学习方法,对特征进行处理,对于训练数据的依赖性较低,面向未知场景的迁移性较强。
附图说明
图1为本发明方法流程图示意图;
图2为本发明实施例中STFT时频图和Mel频谱图;
图3.1为本发明实施例Mel频谱图;
图3.2为本发明实施例Mel频谱图的三维可视化结果;
图3.3为Mel频谱图抽取指定频率的能量-时间图;
图3.4为图3.3中方框区域的放大图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示,本发明实施例提供了一种异常水声信号的检测方法,包括以下步骤:
步骤S1:通过对网络公开的数据集和船只音频数据进行分析和处理,得到背景信号集合、正常信号集合和异常信号集合;
具体地,通过对原始数据来源为DeepShip公开数据集和网络公开船只音频数据,经过手工筛选和裁剪,得到包括海洋常规白噪声和生物声音的背景信号集合、包括水面船只声音的正常信号集合和包括水下船只和其它无人潜航器声音异常信号集合。
步骤S2:在待检测的海洋范围内,对背景信号集合、正常信号集合和异常信号集合进行处理,生成模拟数据,模拟数据包括:水听器阵列坐标、水听器信道的背景信号、正常船只的运动轨迹坐标序列、正常船只运动中的原始声音信号、异常船只的运动轨迹坐标序列、异常船只运动中的原始声音信号;
具体地,在待检测的海洋范围内,随机生成指定数量的水听器坐标,构建水听器阵列坐标;从背景信号集合中随机生成指定数量的背景信号并添加随机噪声,生成水听器信道的背景信号;在待检测的海洋范围内,随机生成正常船只的运动轨迹,构建正常船只的运动轨迹坐标序列;从正常信号集合中随机抽取指定数量的正常船只信号并添加随机噪声,生成正常船只在运动中的原始声音信号;在待检测的海洋范围内,随机生成指定数量的异常船只的运动轨迹,构成异常船只的运动轨迹坐标序列;从异常信号集合中随机抽取指定数量的异常船只信号并添加随机噪声,生成异常船只在运动中的原始声音信号。
本发明实施例中,水听器的指定数量范围为1-16,一般是从4,8,16中选择数值,正常船只的指定数量范围为0-10,一般是0,2,4,6,8中选择数值,异常船只的指定数量范围为0-4,一般是选择2。
步骤S3:对模拟数据进行分析,通过异常船只的运动轨迹和水听器阵列坐标,计算异常船只运动中的原始声音信号达到每个水听器的时间,对水听器信道的背景信号进行异常信号标注,生成异常信号音频序列真值;
本发明实施例中,以一秒为时间间隔进行正常船只和异常船只位置的采样,计算每隔一秒各个船只与每个水听器的距离L,通过距离L和水下声音传播速度V,得到异常船只声音船舶到每个水听器的时间序列,通过时间序列,对水听器信道的背景信号进行标注,表明水听器在此时刻所接受到的信号中存在异常水声信号。
步骤S4:将模拟信号中正常船只、异常船只的原始声音信号进行衰减处理,与水听器信道的背景信号进行叠加,生成多路水听器音频文件;
具体地,通过上述方法计算正常船只和异常船只运动中的原始声音信号到达每个水听器的时间;
通过以下公式计算所述原始声音信号的衰减系数α:
Figure GDA0003834683330000101
式中,f表示所述原始声音信号的频率;
通过以下公式计算所述原始声音信号衰减后的声强I(L):
Figure GDA0003834683330000102
式中,L表示所述原始声音信号与水听器的距离;
并通过声强计算公式
Figure GDA0003834683330000103
计算出衰减后的振幅A(L):
Figure GDA0003834683330000104
式中,ω表示声波的角频率,ρ表示传播介质的密度,v表示水下声速;
最后,采用声强还原振幅Griffin-Lim方法将衰减后的振幅A(L)重建为声音信号,并将衰减后的声音信号和水听器信道的背景信号进行叠加,生成多路水听器音频文件。
步骤S5:对多路水听器音频文件进行下采样至22050HZ,降低处理过程中的内存占用,选取音频特征进行特征提取,并生成特征图,本发明实施例中特征图采用numpy数组进行存储,使得读取更为方便;
本发明实施例中,由于在水下环境中,高频的声音信号会衰减的非常快,因此水听器接收到的音频信号中,低频区间会包含更多的远处声音信号,因此本实施例选用梅尔频谱图Mel作为音频特征进行特征提取,如图2所示,在STFT时频图中,纵轴呈0-10000均匀排布,而梅尔频谱图Mel中,将纵轴取对数,放大了低频区间的信号值,使低频区间的信号变化更加显著。
需要说明的是,根据水下环境、检测范围和应用场景的不同,音频特征还可以选用短时傅里叶变换频谱图STFT、梅尔频率倒谱系数MFCC、色度频率Chroma_STFT、过零率ZeroCrossing Rate、频谱质心Spectral Centroid和频谱滚降系数Spectral Roll-off。
步骤S6:采用线性回归方法对特征图进行分析,通过设定正常阈值θp和置信度阈值θa识别其中的异常信号并标注,生成异常索引文件;
具体的,使用线性回归Linear Regression的方法对特征图的每一频率f在[t,t+p]窗口帧的振幅能量值A的变化进行预测,生成接下来第t+p+1窗口帧在同一频率下的振幅能量值
Figure GDA0003834683330000111
如图3.1所示的Mel频谱图和图3.2所示的Mel频谱图三维可视化结果,t是指图3.1中时间轴上的某一时刻,p是指一个用户指定的窗口宽度。在指定的某一频率f下,如图3.3所示,表示从Mel频谱图中抽取该频率的能量随时间变化曲线,[t,t+p]表示图3.3中圈出的区间,放大后就是图3.4的曲线图。本发明通过线性回归算法,将圈出的区间进行线性回归,拟合一条回归曲线,进行下一帧[t+p+1]值的预测。
设定正常阈值θp,判断多路水听器音频文件在某一频率第t+p+1窗口帧的振幅能量真实值
Figure GDA0003834683330000121
是否在预测值
Figure GDA0003834683330000122
的正常阈值区间
Figure GDA0003834683330000123
中,如果在正常阈值区间中,则判定该真实值为正常信号,否则判定在该频率与窗口帧(f,t+p+1)下出现了异常信号。
计算每一个窗口帧在所有频率下的异常信号出现次数与频率数量的比值,比值为异常置信度c,并设定置信度阈值θa,当异常置信度c超过置信度阈值θa,则判断窗口帧为异常窗口帧。
将异常窗口帧与多路水听器音频文件在默认采样率下进行对齐,并按照异常窗口帧的出现时间,对多路水听器音频文件进行标注,将其划分为正常信号和异常信号,并根据正常信号和异常信号,将多路水听器音频文件进行分割,保存为异常信号的音频片段,以扩充训练集和数据集。
本发明实施例中,正常阈值θp是根据当前测试环境中声音的信噪比进行设定,如果噪声很大,则阈值调高,如果噪声较小,则阈值调低,阈值的区间为[0.0-0.99]。置信度阈值θa设定为0.6,当一个音频片段中筛查出的异常窗口帧过多,则可以适当提高阈值;当一个音频片段中筛查出的异常窗口帧过少,则可以适当降低阈值。
步骤S7:将异常索引文件与异常信号音频序列真值进行对比,生成异常信号的召回率Recall,当召回率小于设定值时,调整步骤S5中的音频特征和步骤S6中的正常阈值θp和置信度阈值θa,重新执行步骤S7直至召回率Recall不小于设定值。
通过异常索引文件中标注的异常信号与异常信号音频序列真值进行比对,计算所述异常索引文件中将异常信号标注为异常的数量TP和将异常信号标注为正常的数量FN,并通过以下公式计算召回率Recall:
Recall=TP/(TP+FN)。
步骤S8:将待检测异常水声信号的多路水听器音频文件执行步骤S5~S6,得到检测结果。
在本发明实施例中,将召回率Recall的阈值设定为0.8,当高于0.8时,表示提取的音频特征和设定正常阈值θp和置信度阈值θa,满足检测的海洋范围的异常水声信号的检测需求。当召回率小于0.8时,则判定当前的配置不满足预期目标,需要进行调整,具体的调整包括以下方面:
1、减小正常阈值θP,一般不低于0.2。
2、减小置信度阈值θa,一般不低于0.5。
3、选取不同的音频特征进行提取,例如短时傅里叶变换频谱图STFT、梅尔频率倒谱系数MFCC、色度频率Chroma_STFT等。
本发明还提出了一种异常水声信号的检测系统,其特征在于:包括信号生成模块、位置生成模块、信号衰减模块、信号叠加模块、特征提取模块、目标检测模块和验证模块;
信号生成模块,用于生成水听器背景信号、正常船只声音信号和异常船只声音信号;
位置生成模块,用于生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列;
信号衰减模块,用于将生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列和生成水听器背景信号、正常船只声音信号和异常船只声音信号进行处理,生成正常船只的异常船只的经过衰减后到达水听器阵列的声音信号,输入信号叠加模块,并生成异常信号音频序列真值;
信号叠加模块,用于将衰减后的声音信号与信号生成模块生成的水听器背景信号进行叠加,生成多路水听器音频文件,并输特征提取模块;
特征提取模块,用于对多路水听器音频文件进行下采样至22050HZ,并选取音频特征进行特征提取,生成特征图输入目标检测模块;
目标检测模块,采用线性回归方法对特征图进行分析,通过设定正常阈值θp和置信度阈值θa识别其中的异常信号并标注,并输入验证模块;
验证模块,将异常索引文件与异常信号音频序列真值进行对比,生成异常信号的召回率Recall,当Recall小于0.8时,调整特征提取模块的音频特征和目标检测模块的正常阈值θp和置信度阈值θa,重新进行特征提取和异常信号识别,直至异常信号的召回率Recall不小于0.8。
进一步地,目标检测模块具体方法为:采用线性回归方法,在特征图中每一频率下,对特征图中固定窗口宽度窗口帧的振幅能量值A进行预测,生成相邻的下一窗口帧的振幅能量值
Figure GDA0003834683330000151
设定正常阈值θp,判断多路水听器音频文件在当前频率下的振幅能量真实值
Figure GDA0003834683330000152
是否在正常阈值区间
Figure GDA0003834683330000153
中,如果不处于正常阈值区间,则判断在频率和窗口帧下出现了异常信号;计算每一个窗口帧在所有频率下的异常信号出现次数与频率数量的比值,比值为异常置信度c,并设定置信度阈值θp,当异常置信度c超过置信度阈值θa,则判断窗口帧为异常窗口帧;通过异常窗口帧,对多路水听器音频文件进行标注,生成异常索引文件。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种异常水声信号的检测方法,其特征在于:包括以下步骤:
步骤S1:通过对网络公开的数据集和船只音频数据进行分析和处理,得到背景信号集合、正常信号集合和异常信号集合;
步骤S2:在待检测的海洋范围内,对所述背景信号集合、正常信号集合和异常信号集合进行处理,生成模拟数据,所述模拟数据包括:水听器阵列坐标、水听器信道的背景信号、正常船只的运动轨迹坐标序列、正常船只运动中的原始声音信号、异常船只的运动轨迹坐标序列、异常船只运动中的原始声音信号;
步骤S3:对所述模拟数据进行分析,通过所述异常船只的运动轨迹和水听器阵列坐标,计算所述异常船只运动中的原始声音信号达到每个水听器的时间,对所述水听器信道的背景信号进行异常信号标注,生成异常信号音频序列真值;
步骤S4:将所述模拟数据中正常船只、异常船只运动中的原始声音信号进行衰减处理,与所述水听器信道的背景信号进行叠加,生成多路水听器音频文件;
步骤S5:对所述多路水听器音频文件进行下采样,选取音频特征进行特征提取,并生成特征图;
步骤S6:采用线性回归方法对所述特征图进行分析,通过设定正常阈值θp和置信度阈值θa识别其中的异常信号,并对所述多路水听器音频文件进行标注,生成异常索引文件;
步骤S7:将所述异常索引文件与异常信号音频序列真值进行对比,生成异常信号的召回率Recall,当召回率小于设定值时,调整步骤S5中提取的所述音频特征和步骤S6中的正常阈值θp和置信度阈值θa,重新执行步骤S7直至所述召回率Recall不小于设定值;
步骤S8:将待检测异常水声信号的多路水听器音频文件执行步骤S5~S6,得到检测结果。
2.根据权利要求1所述的一种异常水声信号的检测方法,其特征在于:步骤S1中的所述背景信号集合包括海洋常规白噪声和生物声音信号;所述正常信号集合包括水面船只声音信号;所述异常信号包括水下船只声音信号和其它无人潜航器。
3.根据权利要求1所述的一种异常水声信号的检测方法,其特征在于:步骤S2具体为:在待检测的海洋范围内,随机生成指定数量的水听器坐标,构建水听器阵列坐标;从所述背景信号集合中随机生成指定数量的背景信号并添加随机噪声,生成水听器信道的背景信号;在待检测的海洋范围内,随机生成正常船只的运动轨迹,构建正常船只的运动轨迹坐标序列;从所述正常信号集合中随机抽取指定数量的正常船只信号并添加随机噪声,生成正常船只在运动中的原始声音信号;在待检测的海洋范围内,随机生成指定数量的异常船只的运动轨迹,构成异常船只的运动轨迹坐标序列;从所述异常信号集合中随机抽取指定数量的异常船只信号并添加随机噪声,生成异常船只在运动中的原始声音信号。
4.根据权利要求1所述的一种异常水声信号的检测方法,其特征在于:步骤S3具体为:计算所述异常船只与每个水听器的距离L,通过距离L和水下声速V,计算所述异常船只的声音信号达到每个水听器的时间,通过所述时间对水听器信道的背景信号进行标注,生成异常信号音频序列真值。
5.根据权利要求4所述的一种异常水声信号的检测方法,其特征在于:步骤S4包括以下步骤:
步骤S41:通过步骤S3的方法计算所述正常船只和异常船只运动中的原始声音信号到达每个水听器的时间;
步骤S42:通过水下声强计算公式和声强还原振幅Griffin-Lim方法计算到达每个所述水听器的衰减后的声音信号;
步骤S43:将所述衰减后的声音信号和水听器信道的背景信号进行叠加,生成多路水听器音频文件。
6.根据权利要求5所述的一种异常水声信号的检测方法,其特征在于:步骤S42具体为:
通过以下公式计算所述原始声音信号的衰减系数α:
Figure FDA0003834683320000031
式中,f表示所述原始声音信号的频率;
通过以下公式计算所述原始声音信号衰减后的声强I(L):
Figure FDA0003834683320000032
式中,L表示所述原始声音信号与水听器的距离;
并通过声强计算公式
Figure FDA0003834683320000033
计算出衰减后的振幅A(L):
Figure FDA0003834683320000034
式中,ω表示声波的角频率,ρ表示传播介质的密度,v表示水下声速;
最后,采用声强还原振幅Griffin-Lim方法将衰减后的振幅A(L)重建为声音信号。
7.根据权利要求1所述的一种异常水声信号的检测方法,其特征在于:步骤S6包括以下步骤:
步骤S61:采用线性回归方法,对所述特征图中每一频率下,固定窗口宽度窗口帧的振幅能量值A进行预测,生成相邻的下一窗口帧的振幅能量值
Figure FDA0003834683320000041
步骤S62:设定正常阈值θp,判断所述多路水听器音频文件在当前频率下的振幅能量真实值
Figure FDA0003834683320000042
是否在正常阈值区间
Figure FDA0003834683320000043
中,如果不处于所述正常阈值区间,则判断在所述频率和窗口帧下出现了异常信号;
步骤S63:计算每一个所述窗口帧在所有频率下的异常信号出现次数与频率数量的比值,所述比值为异常置信度c,并设定置信度阈值θa,当所述异常置信度c超过置信度阈值θa,则判断所述窗口帧为异常窗口帧;
步骤S64:基于所述异常窗口帧,对所述多路水听器音频文件进行标注,生成异常索引文件。
8.根据权利要求1所述的一种异常水声信号的检测方法,其特征在于:步骤S7具体为:通过所述异常索引文件中标注的异常信号与异常信号音频序列真值进行比对,计算所述异常索引文件中将异常信号标注为异常的数量TP和将异常信号标注为正常的数量FN,并通过以下公式计算召回率Recall:
Recall=TP/(TP+FN)。
9.一种异常水声信号的检测系统,其特征在于:包括信号生成模块、位置生成模块、信号衰减模块、信号叠加模块、特征提取模块、目标检测模块和验证模块;
所述信号生成模块,用于生成水听器背景信号、正常船只声音信号和异常船只声音信号;
所述位置生成模块,用于生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列;
所述信号衰减模块,用于将所述生成水听器阵列坐标、正常船只轨迹坐标序列和异常船只轨迹坐标序列和生成水听器背景信号、正常船只声音信号和异常船只声音信号进行处理,生成所述正常船只的异常船只的经过衰减后到达所述水听器阵列的声音信号,输入所述信号叠加模块,并生成异常信号音频序列真值;
所述信号叠加模块,用于将所述衰减后的声音信号与信号生成模块生成的水听器背景信号进行叠加,生成多路水听器音频文件,并输所述特征提取模块;
所述特征提取模块,用于对所述多路水听器音频文件进行下采样,并选取音频特征进行特征提取,生成特征图输入所述目标检测模块;
所述目标检测模块,采用线性回归方法对所述特征图进行分析,通过设定正常阈值θp和置信度阈值θa识别其中的异常信号并标注,生成异常索引文件并输入所述验证模块;
所述验证模块,将所述异常索引文件与异常信号音频序列真值进行对比,生成异常信号的召回率Recall,当召回率小于设定值时,调整所述特征提取模块的音频特征和目标检测模块的正常阈值θp和置信度阈值θa,重新进行特征提取和异常信号识别,直至所述异常信号的召回率Recall不小于设定值。
10.根据权利要求9所述的一种异常水声信号的检测系统,其特征在于:所述目标检测模块具体方法为:采用线性回归方法,在所述特征图中每一频率下,对特征图中固定窗口宽度窗口帧的振幅能量值A进行预测,生成相邻的下一窗口帧的振幅能量值
Figure FDA0003834683320000061
设定正常阈值θp,判断所述多路水听器音频文件在当前频率下的振幅能量真实值
Figure FDA0003834683320000062
是否在正常阈值区间
Figure FDA0003834683320000063
中,如果不处于所述正常阈值区间,则判断在所述频率和窗口帧下出现了异常信号;计算每一个所述窗口帧在所有频率下的异常信号出现次数与频率数量的比值,所述比值为异常置信度c,并设定置信度阈值θa,当所述异常置信度c超过置信度阈值θa,则判断所述窗口帧为异常窗口帧;通过所述异常窗口帧,对所述多路水听器音频文件进行标注,生成异常索引文件。
CN202210846309.7A 2022-07-19 2022-07-19 异常水声信号的检测方法及系统 Active CN114927141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210846309.7A CN114927141B (zh) 2022-07-19 2022-07-19 异常水声信号的检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210846309.7A CN114927141B (zh) 2022-07-19 2022-07-19 异常水声信号的检测方法及系统

Publications (2)

Publication Number Publication Date
CN114927141A CN114927141A (zh) 2022-08-19
CN114927141B true CN114927141B (zh) 2022-10-25

Family

ID=82815875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210846309.7A Active CN114927141B (zh) 2022-07-19 2022-07-19 异常水声信号的检测方法及系统

Country Status (1)

Country Link
CN (1) CN114927141B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115390037A (zh) * 2022-09-06 2022-11-25 中国人民解放军海军工程大学 多类别、未知雷达辐射源脉冲信号分选系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030053659A1 (en) * 2001-06-29 2003-03-20 Honeywell International Inc. Moving object assessment system and method
JP4364288B1 (ja) * 2008-07-03 2009-11-11 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム
JP6151883B2 (ja) * 2011-12-15 2017-06-21 富士通株式会社 音検出装置、音検出方法および音検出プログラム
JP6943120B2 (ja) * 2017-09-28 2021-09-29 沖電気工業株式会社 収音装置、プログラム及び方法
CN108182949A (zh) * 2017-12-11 2018-06-19 华南理工大学 一种基于深度变换特征的高速公路异常音频事件分类方法
JP6624256B1 (ja) * 2018-08-29 2019-12-25 沖電気工業株式会社 収音装置、プログラム及び方法
JP7385381B2 (ja) * 2019-06-21 2023-11-22 株式会社日立製作所 異常音検知システム、擬似音生成システム、および擬似音生成方法
CN111048114A (zh) * 2019-12-30 2020-04-21 深圳江行联加智能科技有限公司 一种设备异常声音检测的设备及方法
CN111640456B (zh) * 2020-06-04 2023-08-22 合肥讯飞数码科技有限公司 叠音检测方法、装置和设备
CN113985156A (zh) * 2021-09-07 2022-01-28 绍兴电力局柯桥供电分局 一种基于变压器声纹大数据的智能故障识别方法
CN114155879B (zh) * 2021-12-06 2022-07-01 哈尔滨工程大学 一种利用时频融合补偿异常感知及稳定性的异音检测方法

Also Published As

Publication number Publication date
CN114927141A (zh) 2022-08-19

Similar Documents

Publication Publication Date Title
US8271200B2 (en) System and method for acoustic signature extraction, detection, discrimination, and localization
Roch et al. Automated extraction of odontocete whistle contours
WO1984002992A1 (en) Signal processing and synthesizing method and apparatus
Venter et al. Automatic detection of African elephant (Loxodonta africana) infrasonic vocalisations from recordings
Avanzato et al. A convolutional neural networks approach to audio classification for rainfall estimation
Dranka et al. Robust maximum likelihood acoustic energy based source localization in correlated noisy sensing environments
CN113567969B (zh) 一种基于水下声信号的非法采砂船自动监控方法及系统
CN114927141B (zh) 异常水声信号的检测方法及系统
CN113314127B (zh) 基于空间方位的鸟鸣识别方法、系统、计算机设备与介质
CN114830686A (zh) 声源的改进定位
Hafez et al. Earthquake onset detection using spectro-ratio on multi-threshold time–frequency sub-band
JP2023550434A (ja) 改良型音響源測位法
CN110444225B (zh) 基于特征融合网络的声源目标识别方法
CN110580915B (zh) 基于可穿戴式设备的声源目标识别系统
Feroze et al. Classification of underwater acoustic signals using multi-classifiers
Dreier et al. Sound source modelling by nonnegative matrix factorization for virtual reality applications
Chen et al. Speech detection using microphone array
Firoozabadi et al. Combination of nested microphone array and subband processing for multiple simultaneous speaker localization
CN114420155A (zh) 基于多模态融合的水声目标识别方法
Tesei et al. Signal detection in non-Gaussian noise by a kurtosis based probability density function model
Nguyen et al. Location Estimation of Receivers in an Audio Room using Deep Learning with a Convolution Neural Network.
Roch et al. Detection, classification, and localization of cetaceans by groups at the scripps institution of oceanography and San Diego state university (2003-2013)
Li et al. A fast vehicle horn sound location method with improved SRP-PHAT
Salvati et al. Improvement of acoustic localization using a short time spectral attenuation with a novel suppression rule
CN115424639B (zh) 一种基于时频特征的环境噪声下海豚声音端点检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant