CN110211596B - 一种基于Mel子带谱熵鲸目动物哨声信号检测方法 - Google Patents

一种基于Mel子带谱熵鲸目动物哨声信号检测方法 Download PDF

Info

Publication number
CN110211596B
CN110211596B CN201910455250.7A CN201910455250A CN110211596B CN 110211596 B CN110211596 B CN 110211596B CN 201910455250 A CN201910455250 A CN 201910455250A CN 110211596 B CN110211596 B CN 110211596B
Authority
CN
China
Prior art keywords
mel
signal
frame
whistle
spectral entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910455250.7A
Other languages
English (en)
Other versions
CN110211596A (zh
Inventor
乔钢
马天龙
刘凇佐
马璐
聂东虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910455250.7A priority Critical patent/CN110211596B/zh
Publication of CN110211596A publication Critical patent/CN110211596A/zh
Application granted granted Critical
Publication of CN110211596B publication Critical patent/CN110211596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Auxiliary Devices For Music (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明提供的是一种基于Mel子带谱熵鲸目动物哨声信号检测方法。本发明从谱熵的角度出发,结合Mel滤波器,通过计算Mel子带谱熵来实现海豚哨声信号的检测,并通过时长门限进一步降低虚警概率,提高检测的精度。本发明的方法简单易行,可实现哨声信号自动检测与提取,减少了人为提取的工作量。海豚哨声信号对于仿生伪装水声通信、海豚种群分类识别等研究具有重要的价值,因此,本发明的方法可助力于仿生伪装水声通信、海洋生物学等相关研究。

Description

一种基于Mel子带谱熵鲸目动物哨声信号检测方法
技术领域
本发明涉及的是一种水声通信方法,具体地说是一种动物哨声信号检测方法。
背景技术
海豚哨声信号是海豚进行交流时最主要的信号,对于海豚被动声学检测具有重要意义。但是实际采集到的一段声音信号中,有可能只包含几个哨声信号,且哨声信号出现的位置随机,因此如何检测声音信号中是否存在哨声信号并确定哨声信号位置,对海豚哨声信号的提取与研究十分重要。
公开号为CN104217722B的专利文件中公开了一种海豚哨声信号时频谱轮廓提取方法,该方法通过短时傅里叶变换提取海豚哨声时频谱轮廓曲线,然而该方法是基于已知的海豚哨声信号片段进行的,并未介绍如何从采集到的信号中检测并提取哨声信号片段;公开号为CN107527625A的专利文件中公开了一种基于仿生听觉系统中耳蜗模型的海豚哨声信号听觉特征提取方法,该方法基于Gammatone滤波器和Meddis内毛细胞模型,获得海豚哨声信号听觉特征,但是该方法也是基于已知的海豚哨声信号片段进行的,并未介绍海豚哨声信号检测与提取方法;公开号为CN208257816U的专利文件中公开了基于鲸类叫声脉冲时间长度的通信装置,该装置利用鲸类叫声短时能量谱计算鲸类叫声脉冲时间长度,但是该装置主要用于通信,且短时能量谱容易受到噪声的影响而产生虚警,而该装置并未利用时长门限进一步降低虚警概率。
发明内容
本发明的目的在于提供一种检测精度高的基于Mel子带谱熵鲸目动物哨声信号检测方法。
本发明的目的是这样实现的:
步骤1:对采集到的观测信号进行滤波降噪处理,得到降噪后的观测信号s(n),并对降噪后的观测信号进行分帧,设帧长为N个采样点,相邻帧的步进长度为L个采样点,采样率为fs;
步骤2:每第i帧信号表示为si(n),n=1,2,3,...,N,其傅里叶变换结果表示为Xi(k),k=1,2,3,...,N;
步骤3:根据Xi(k),计算第i帧信号的能量谱Ei(k)=|Xi(k)|2,k=1,2,3,...,N/2;
步骤4:根据能量谱Ei(k)的频率范围和Mel滤波器个数M,设计M个Mel滤波器,其中第m个滤波器的频率响应为Hm(k),k=1,2,3,...,N/2;
步骤5:将步骤3获得的能量谱Ei(k)通过步骤4设计的Mel滤波器,在频域中把能量谱Ei(k)与Mel滤波器的频率响应相乘并相加,得到第i帧信号所对应的Mel子带能量
Figure BDA0002076412570000021
步骤6:基于Mel子带能量和给定的偏移系数K,计算每个子带的归一化谱概率密度pi(m):
Figure BDA0002076412570000022
步骤7:基于归一化谱概率密度pi(m),计算第i帧信号的Mel子带谱熵HMel(i):
Figure BDA0002076412570000023
步骤8:判断HMel(i)与谱熵门限值thH的大小,若HMel(i)≥thH,则进入步骤9,若HMel(i)<thH,则进入步骤11;
步骤9:HMel(i)≥thH,则判定第i帧信号可能存在哨声信号,令哨声帧标志Iframe加1,即
Figure BDA0002076412570000024
通过比较
Figure BDA0002076412570000025
与哨声时长门限thT所对应的帧数大小,进行进一步判决:若
Figure BDA0002076412570000026
则进行步骤10,否则
Figure BDA0002076412570000027
令i=i+1,重复步骤2-8,判断下一帧信号;
步骤10:若第i帧信号同时满足HMel(i)≥thH
Figure BDA0002076412570000028
这两个条件,则判定观测信号存在哨声,且哨声信号至少从第i-Iframe+1帧就存在,然后重复步骤2-8,判断下一帧信号;
步骤11:HMel(i)<thH,则判定第i帧信号不包含哨声信号,若哨声帧标志Iframe≥thT×fs/L,则判定哨声信号在第i-1帧结束,令Iframe=0,然后进行步骤12,若Iframe<thT×fs/L,则直接进入步骤12;
步骤12:判定第i帧信号不包含哨声信号时,将HMel(i)的值到噪声谱熵向量Hnoise中,并对门限thH进行更新,公式为
Figure BDA0002076412570000031
式中,
Figure BDA0002076412570000032
为新门限值,α和β为给定的调节系数,D[Hnoise]是噪声谱熵向量Hnoise的方差,然后重复步骤2-8,判断下一帧信号;
步骤13:判定完所有信号帧后,哨声信号检测结束。
本发明还可以包括:
1.步骤4中的Mel滤波器个数M默认值为24个。
2.步骤6中的偏移系数K根据检测结果进行设定。
3.步骤8中的谱熵门限thH初始值为
Figure BDA0002076412570000033
其中,
Figure BDA0002076412570000034
为噪声信号帧谱熵均值。
4.步骤9中的哨声时长门限thT默认值为50ms。
为实现海豚哨声信号的检测,本发明从谱熵的角度出发,结合Mel滤波器,通过计算Mel子带谱熵来实现海豚哨声信号的检测,并通过时长门限进一步降低虚警概率,提高检测的精度。
本发明的基于Mel子带谱熵鲸目动物哨声信号检测方法,可从长时间的观测信号中检测哨声信号并确定哨声信号位置,进而可以提取出哨声信号。该方法简单易行,可实现哨声信号自动检测与提取,减少了人为提取的工作量。海豚哨声信号对于仿生伪装水声通信、海豚种群分类识别等研究具有重要的价值,因此,本方法可助力于仿生伪装水声通信、海洋生物学等相关研究。
附图说明
图1为基于Mel子带谱熵鲸目动物哨声信号检测原理图。
具体实施方式
下面举例对本发明做更详细的描述。
鲸目动物哨声信号是鲸目动物(海豚、鲸鱼)进行通信交流时的主要信号,其时长从几十毫秒到几秒不等,且频率随时间连续变化,是一种调频信号。不同种类鲸目动物的哨声信号时频特性不同,同种动物不同个体间哨声信号也存在差异,因此哨声信号是鲸目动物被动声学观测的重要参考信号。此外,由于鲸目动物哨声信号频率范围与通信声呐信号十分接近,因此鲸目动物哨声信号也是仿生伪装水声通信中主要的伪装声源。
但是由于实际采集到鲸目动物哨声观测信号中并不是每一时刻都含有哨声,因此需要一个合适的哨声信号检测方法,从观测信号中检测并确定哨声信号位置。检测过程如下:
步骤1:对采集到的可能含鲸目动物哨声的观测信号进行滤波降噪处理,得到降噪后的观测信号s(n),并对降噪后的观测信号进行分帧,设帧长为N个采样点,相邻帧的步进长度为L个采样点,采样率为fs;
由于进行信号采集时,采集到的哨声信号信噪比往往比较低,且包含能量很强的低频噪声,因此在进行哨声信号检测前,应对观测信号进行滤波降噪处理,例如可以用一个高通滤波器消除低频强噪声,然后采用小波降噪方法降低其他频段的背景噪声干扰。
此外,实际采集到的观测信号往往时间长达几十分钟甚至几小时,而哨声信号可能只在某些时间段出现,因此需要对观测信号进行分帧,对每一帧信号进行检测。分帧不仅可以有助于确定哨声信号出现的时间段,也可减少计算复杂度,提高算法性能。
步骤2:若第i帧信号可表示为si(n)(n=1,2,3,...,N),则其傅里叶变换结果可表示为Xi(k)(k=1,2,3,...,N);
分帧后的第i帧信号si(n)为
si(n)=s((i-1)×L+n)×g(n)n=1,2,3,...,N (1)
其中,g(n)为窗函数。第i帧信号si(n)的傅里叶变换结果Xi(k)为:
Figure BDA0002076412570000041
步骤3:根据Xi(k),计算第i帧信号的能量谱Ei(k)=|Xi(k)|2(k=1,2,3,...,N/2);
步骤4:根据能量谱Ei(k)的频率范围和Mel滤波器个数M,设计M个Mel滤波器,其中第m个滤波器的频率响应为Hm(k)(k=1,2,3,...,N/2);
Mel频率是一种以美尔(Mel)为单位的感知频率,Mel频率FMel与线性频率f(单位:Hz)的关系为
Fmel=1125ln(1+f/700) (3)
Mel滤波器是一种在Mel频率范围内等带宽的带通滤波器,第m个Mel滤波器的频率响应Hm(k)为
Figure BDA0002076412570000051
而中心频率fm定义为:
Figure BDA0002076412570000052
式中,fl为滤波器Hm(k)下限频率,fh为滤波器Hm(k)的上限频率,Fmel的逆函数
Figure BDA0002076412570000053
表示将Mel频率映射回实际频率,
Figure BDA0002076412570000054
步骤5:将步骤3获得的能量谱Ei(k)通过步骤4设计的Mel滤波器,即在频域中把能量谱Ei(k)与Mel滤波器的频率响应相乘并相加,得到第i帧信号所对应的Mel子带能量
Figure BDA0002076412570000055
步骤6:基于Mel子带能量和给定的偏移系数K,计算每个子带的归一化谱概率密度pi(m):
Figure BDA0002076412570000056
其中,K是偏移系数,需根据检测结果进行人为设定,偏移系数K越大,抗噪声性能越好。
步骤7:基于归一化谱概率密度pi(m),计算第i帧信号的Mel子带谱熵HMel(i):
Figure BDA0002076412570000057
其中,wi(m)为第i帧信号第m个Mel谱概率密度pi(m)的权值,计算过程如下:
Figure BDA0002076412570000058
其中,D[·]表示计算方差,令
Figure BDA0002076412570000059
表示第i帧信号Mel谱概率密度pi(m)的最小值,则
Figure BDA00020764125700000510
Figure BDA00020764125700000511
的计算过程如下:
Figure BDA0002076412570000061
步骤8:判断HMel(i)与谱熵门限值thH的大小,若HMel(i)≥thH,则进入步骤9,反之,若HMel(i)<thH,则进入步骤11;
其中,谱熵门限thH初始值需要根据噪声信号谱熵均值来进行设定。通常会选若干帧不含哨声的噪声信号,计算这些噪声帧信号的谱熵
Figure BDA0002076412570000062
求出其谱熵均值
Figure BDA0002076412570000063
然后设置谱熵门限的初始值
Figure BDA0002076412570000064
步骤9:HMel(i)≥thH,则判定第i帧信号可能存在哨声信号,此时,令哨声帧标志Iframe加1,即
Figure BDA0002076412570000065
通过比较
Figure BDA0002076412570000066
与哨声时长门限thT所对应的帧数大小,进行进一步判决:若
Figure BDA0002076412570000067
则进行步骤10,否则
Figure BDA0002076412570000068
令i=i+1,重复步骤2-8,判断下一帧信号;
由于一些突发噪声,例如较强的脉冲噪声,也会令某一帧信号的Mel子带谱熵HMel(i)变大超过门限,因此当第i帧信号满足HMel(i)≥thH时,不一定是哨声信号导致,需要结合前后若干帧的判决结果进行综合考虑。通过设置一个哨声时长门限thT和一个哨声帧标志Iframe,可以解决这个问题。根据实际经验,哨声时长门限thT默认为50ms,在实际检测时也可根据目标哨声信号时长人为设置为其他值。Iframe用来标记满足HMel(i)≥thH的帧的个数,通过判断Iframe与哨声时长门限thT所对应的帧数大小,确定是否存在哨声。
步骤10:若第i帧信号同时满足HMel(i)≥thH
Figure BDA0002076412570000069
这两个条件,则判定观测信号存在哨声,且哨声信号至少从第i-Iframe+1帧就存在,然后重复步骤2-8,判断下一帧信号;
由于当Iframe满足Iframe≥thT×fs/L时,前面的Iframe已经满足了HMel(i)≥thH,因此哨声信号的起始点需要往前计算Iframe帧。
步骤11:HMel(i)<thH,则判定第i帧信号不包含哨声信号,此时,若哨声帧标志Iframe≥thT×fs/L,则判定哨声信号在第i-1帧结束,令Iframe=0,然后进行步骤13,反之,若Iframe<thT×fs/L,则直接进入步骤12;
步骤12:判定第i帧信号不包含哨声信号时,需要将HMel(i)的值保存到噪声谱熵向量Hnoise中,并对门限thH进行更新,公式为
Figure BDA0002076412570000071
式中,
Figure BDA0002076412570000072
为新门限值,α和β为给定的调节系数,然后重复步骤2-8,判断下一帧信号。
当第i帧信号判定为噪声时,需要对普熵门限thH进行更新,以更好的适应谱熵的变化,提高哨声信号的检测效果。其中,噪声谱熵向量Hnoise(j)(j=1,2,3...,Nnoise)是用于保存噪声谱熵的向量,每当一帧信号判定为不包含哨声时,都需要将该帧信号的谱熵值HMel(i)保存到Hnoise中,使Hnoise向量增加一个元素。而门限更新公式中的α和β则决定谱熵门限thH更新的速度:α越大,门限更新速度越快,β越大,则门限值越大。在进行哨声信号检测时,需根据噪声变化情况和哨声信噪比,对α和β进行设定。
步骤13:判定完所有信号帧后,哨声信号检测结束。
上述一种基于Mel子带谱熵鲸目动物哨声信号检测方法,步骤4中的Mel滤波器个数M默认为24个,也可根据需要人为设置;步骤6中的偏移系数K需根据检测结果进行人为设定,偏移系数K越大,抗噪声性能越好;步骤8中的谱熵门限thH初始值需要根据噪声信号谱熵均值来进行设定,通常设为
Figure BDA0002076412570000073
而所需噪声信号帧可根据需要进行人为设置;步骤9中的哨声时长门限thT默认为50ms,是一个经验值,在实际检测时也可根据目标哨声信号时长进行人为设置;步骤12中的α和β决定了谱熵门限thH更新的速度,需根据检测结果进行人为设定。
本发明所述的鲸目动物哨声信号检测方法,通过对观测信号进行分帧,然后对每一帧信号进行判决,不仅可以有效减少计算复杂度,还可以检测并确定哨声信号位置,有助于下一步哨声信号提取和处理。该方法可为鲸目动物哨声信号研究、仿生伪装水声通信技术以及海洋生物观测提供帮助。

Claims (9)

1.一种基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:
步骤1:对采集到的观测信号进行滤波降噪处理,得到降噪后的观测信号s(n),并对降噪后的观测信号进行分帧,设帧长为N个采样点,相邻帧的步进长度为L个采样点,采样率为fs;
步骤2:每第i帧信号表示为si(n),n=1,2,3,...,N,其傅里叶变换结果表示为Xi(k),k=1,2,3,...,N;
步骤3:根据Xi(k),计算第i帧信号的能量谱Ei(k)=|Xi(k)|2,k=1,2,3,...,N/2;
步骤4:根据能量谱Ei(k)的频率范围和Mel滤波器个数M,设计M个Mel滤波器,其中第m个滤波器的频率响应为Hm(k),k=1,2,3,...,N/2,
Figure FDA0002887808140000011
而中心频率fm为:
Figure FDA0002887808140000012
式中,fl为滤波器Hm(k)下限频率,fh为滤波器Hm(k)的上限频率,Fmel的逆函数
Figure FDA0002887808140000013
表示将Mel频率映射回实际频率,
Figure FDA0002887808140000014
步骤5:将步骤3获得的能量谱Ei(k)通过步骤4设计的Mel滤波器,在频域中把能量谱Ei(k)与Mel滤波器的频率响应相乘并相加,得到第i帧信号所对应的Mel子带能量
Figure FDA0002887808140000015
步骤6:基于Mel子带能量和给定的偏移系数K,计算每个子带的归一化谱概率密度pi(m):
Figure FDA0002887808140000021
步骤7:基于归一化谱概率密度pi(m),计算第i帧信号的Mel子带谱熵HMel(i):
Figure FDA0002887808140000022
其中,wi(m)为第i帧信号第m个Mel谱概率密度pi(m)的权值,计算过程如下:
Figure FDA0002887808140000023
其中,D[·]表示计算方差,令
Figure FDA0002887808140000024
表示第i帧信号Mel谱概率密度pi(m)的最小值,则
Figure FDA0002887808140000025
Figure FDA0002887808140000026
的计算过程如下:
Figure FDA0002887808140000027
步骤8:判断HMel(i)与谱熵门限值thH的大小,若HMel(i)≥thH,则进入步骤9,若HMel(i)<thH,则进入步骤11;
步骤9:HMel(i)≥thH,则判定第i帧信号可能存在哨声信号,令哨声帧标志Iframe加1,即
Figure FDA0002887808140000028
通过比较
Figure FDA0002887808140000029
与哨声时长门限thT所对应的帧数大小,进行进一步判决:若
Figure FDA00028878081400000210
则进行步骤10,否则
Figure FDA00028878081400000211
令i=i+1,重复步骤2-8,判断下一帧信号;
步骤10:若第i帧信号同时满足HMel(i)≥thH
Figure FDA00028878081400000212
这两个条件,则判定观测信号存在哨声,且哨声信号至少从第i-Iframe+1帧就存在,然后重复步骤2-8,判断下一帧信号;
步骤11:HMel(i)<thH,则判定第i帧信号不包含哨声信号,若哨声帧标志Iframe≥thT×fs/L,则判定哨声信号在第i-1帧结束,令Iframe=0,然后进行步骤12,若Iframe<thT×fs/L,则直接进入步骤12;
步骤12:判定第i帧信号不包含哨声信号时,将HMel(i)的值到噪声谱熵向量Hnoise中,并对门限thH进行更新,公式为
Figure FDA0002887808140000031
式中,
Figure FDA0002887808140000032
为新门限值,α和β为给定的调节系数,D[Hnoise]是噪声谱熵向量Hnoise的方差,然后重复步骤2-8,判断下一帧信号;
步骤13:判定完所有信号帧后,哨声信号检测结束。
2.根据权利要求1所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤4中的Mel滤波器个数M默认值为24个。
3.根据权利要求1或2所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤6中的偏移系数K根据检测结果进行设定。
4.根据权利要求1或2所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤8中的谱熵门限thH初始值为
Figure FDA0002887808140000033
其中,
Figure FDA0002887808140000034
为噪声信号帧谱熵均值。
5.根据权利要求3所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤8中的谱熵门限thH初始值为
Figure FDA0002887808140000035
其中,
Figure FDA0002887808140000036
为噪声信号帧谱熵均值。
6.根据权利要求1或2所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
7.根据权利要求3所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
8.根据权利要求4所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
9.根据权利要求5所述的基于Mel子带谱熵鲸目动物哨声信号检测方法,其特征是:步骤9中的哨声时长门限thT默认值为50ms。
CN201910455250.7A 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法 Active CN110211596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910455250.7A CN110211596B (zh) 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910455250.7A CN110211596B (zh) 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法

Publications (2)

Publication Number Publication Date
CN110211596A CN110211596A (zh) 2019-09-06
CN110211596B true CN110211596B (zh) 2021-04-06

Family

ID=67789249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910455250.7A Active CN110211596B (zh) 2019-05-29 2019-05-29 一种基于Mel子带谱熵鲸目动物哨声信号检测方法

Country Status (1)

Country Link
CN (1) CN110211596B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111414832B (zh) * 2020-03-16 2021-06-25 中国科学院水生生物研究所 一种基于鲸豚类低频水声信号的实时在线识别分类系统
CN112669875B (zh) * 2020-12-18 2022-06-21 天津大学 一种基于FSK调制的仿鲸目whistle叫声的伪装通信信号识别方法
CN115050386B (zh) * 2022-05-17 2024-05-28 哈尔滨工程大学 一种中华白海豚哨叫声信号自动检测和提取方法
CN116132234B (zh) * 2023-01-09 2024-03-12 天津大学 利用鲸目动物哨声相位编码的水下隐蔽通信方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105516876A (zh) * 2015-12-09 2016-04-20 天津大学 一种基于谱熵的啸叫检测方法
CN105825871A (zh) * 2016-03-16 2016-08-03 大连理工大学 一种无前导静音段语音的端点检测方法
CN109545188A (zh) * 2018-12-07 2019-03-29 深圳市友杰智新科技有限公司 一种实时语音端点检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100937101B1 (ko) * 2008-05-20 2010-01-15 성균관대학교산학협력단 음성 신호의 스펙트럴 엔트로피를 이용한 감정 인식 방법및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105516876A (zh) * 2015-12-09 2016-04-20 天津大学 一种基于谱熵的啸叫检测方法
CN105825871A (zh) * 2016-03-16 2016-08-03 大连理工大学 一种无前导静音段语音的端点检测方法
CN109545188A (zh) * 2018-12-07 2019-03-29 深圳市友杰智新科技有限公司 一种实时语音端点检测方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《Robust Endpoint Detection Algorithm Based on the Adaptive Band-Partitioning Spectral Entropy in Adverse Environments》;Bing-Fei Wu et al.;《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》;20050930;第13卷(第5期);第762-775页 *
《一种改进的小波能量熵语音端点检测算法》;李乐等;《计算机工程》;20170531;第43卷(第5期);第268-274页 *
《基于谱熵梅尔积的语音端点检测方法》;吴新忠等;《北京邮电大学学报》;20190430;第42卷(第2期);第83-89页 *
《复杂环境下的海豚whistle信号检测与特征分析》;孙金涛;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190115(第01期);全文 *

Also Published As

Publication number Publication date
CN110211596A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110211596B (zh) 一种基于Mel子带谱熵鲸目动物哨声信号检测方法
WO2020177371A1 (zh) 一种用于数字助听器的环境自适应神经网络降噪方法、系统及存储介质
CN101593522B (zh) 一种全频域数字助听方法和设备
CN106340292B (zh) 一种基于连续噪声估计的语音增强方法
EP3696814A1 (en) Speech enhancement method and apparatus, device and storage medium
CN103531204B (zh) 语音增强方法
Lin et al. Adaptive noise estimation algorithm for speech enhancement
CN110111769B (zh) 一种电子耳蜗控制方法、装置、可读存储介质及电子耳蜗
CN103778920A (zh) 数字助听器中语音增强和频响补偿相融合方法
CN104157295A (zh) 用于检测及抑制瞬态噪声的方法
CN104810024A (zh) 一种双路麦克风语音降噪处理方法及系统
CN104835503A (zh) 一种改进gsc自适应语音增强方法
CN110189746B (zh) 一种应用于地空通信的话音识别方法
CN110503967B (zh) 一种语音增强方法、装置、介质和设备
CN109328380A (zh) 具有噪声模型适配的递归噪声功率估计
CN103544961A (zh) 语音信号处理方法及装置
CN109741759A (zh) 一种面向特定鸟类物种的声学自动检测方法
Wang et al. Joint noise and mask aware training for DNN-based speech enhancement with sub-band features
Prodeus Performance measures of noise reduction algorithms in voice control channels of UAVs
CN111028852A (zh) 一种基于cnn的智能呼叫系统中的噪声去除方法
CN110933235B (zh) 一种基于机器学习的智能呼叫系统中的噪声识别方法
Sun et al. An RNN-based speech enhancement method for a binaural hearing aid system
CN118173106B (zh) 一种野外鸟类鸣声音频数据增强方法
Odugu et al. New speech enhancement using Gamma tone filters and Perceptual Wiener filtering based on sub banding
Rohith et al. Comparitive Analysis of Speech Enhancement Techniques: A Review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant