CN108269566B - 一种基于多尺度子带能量集特征的膛口波识别方法 - Google Patents
一种基于多尺度子带能量集特征的膛口波识别方法 Download PDFInfo
- Publication number
- CN108269566B CN108269566B CN201810043796.7A CN201810043796A CN108269566B CN 108269566 B CN108269566 B CN 108269566B CN 201810043796 A CN201810043796 A CN 201810043796A CN 108269566 B CN108269566 B CN 108269566B
- Authority
- CN
- China
- Prior art keywords
- band
- sub
- energy
- segment
- rifling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000009432 framing Methods 0.000 claims abstract description 13
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 239000012634 fragment Substances 0.000 claims description 24
- 239000000203 mixture Substances 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000013467 fragmentation Methods 0.000 claims description 3
- 238000006062 fragmentation reaction Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 238000012544 monitoring process Methods 0.000 abstract description 3
- 230000002159 abnormal effect Effects 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 10
- 238000011156 evaluation Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于多尺度子带能量集特征的膛口波识别方法。该方法针对复杂环境下的枪声识别问题,首先利用基于GMM的自动分段算法从连续音频样本中截取出有声片段;接着对有声片段采用多尺度子带滤波器组滤波处理;然后对滤波后的样本进行起点校准和变尺度分帧,并对各个子带输出提取短时能量和能量比特征,得到能够充分表征膛口波和非膛口波时频域差异的能量集特征;最后利用SVM进行分类识别。本发明实现简单,对户外连续音频监控数据中突发枪击等异常声事件的检测与标识有重要意义。
Description
技术领域
本发明涉及一种基于多尺度子带能量集特征的膛口波识别方法,属于安全监测及声信号识别技术领域。
背景技术
声探测技术作为一种重要的检测手段,广泛应用于生产生活的各个方面,包括地震波检测、海洋生物探测、危险声音识别等。其中有关危险声音的识别系统,随着近年来音频信号处理和模式识别技术的蓬勃发展,逐步成为新的研究热点之一,在公共安全、野外生态保护、法医鉴定以及军事国防等领域具有重要意义。
其中,利用声学信号分析手段识别复杂环境下的枪声,是后续进一步开展射手定位和枪型识别等的基础。近年来已有学者提出一种利用模板匹配和动态时间归整算法(Dynamic Time Warping,DTW)对枪声进行多级检测的方法(申请号201210574003.7,专利名称为用于枪声的多级筛选检测识别方法),但是该方法采用的模板匹配和DTW方法受环境因素影响较大,在外场地形、环境噪声、地表及建筑物反射产生的多径以及气候等诸多因素的干扰下识别检测能力明显不佳,此外枪声可细分为膛口波和弹头波,而相比之膛口波,弹头波的存在与否同枪支类型,声探测系统位置等有关,很多情况下可能根本捕获不到,将弹头波纳入检测目标的范围内,在匹配时会出现较大误差。
由此可知,现有技术存在未考虑环境影响和检测对象不够准确存在的技术缺陷,鉴于以上情况,本文提出一种基于多尺度子带能量集特征的膛口波识别方法,该方法通过识别枪声中的膛口波有效检测枪声信号,且充分考虑环境因素对分类结果的影响,对受距离、方向和多径影响的膛口波信号识别具有稳健性。
发明内容
本发明的目的在于提供一种基于多尺度子带能量集特征的膛口波识别方法。
实现本发明目的的技术解决方案为:一种基于多尺度子带能量集特征的膛口波识别方法,具体步骤为:
步骤1、对连续音频数据进行基于高斯混合模型的分段,截取全频带有声片段;
步骤2、将步骤1得到的全频带有声片段通过多尺度子带滤波器组进行滤波处理得到子带有声片段;
步骤3、对步骤1截取的全频带有声片段和步骤2中滤波后的子带有声片段进行起点对齐;
步骤4、将步骤3经过起点对齐的有声片段进行变尺度分帧和特征提取;
步骤5、根据步骤4提取出的多尺度子带能量集特征进行膛口波分类,得到最好的识别结果。
本发明与现有技术相比,其显著优点为:1)本发明使用的特征和数据处理方法充分考虑环境因素对分类结果的影响。2)本发明采用的模式识别方法SVM具有较好的泛化特点,使得识别结果具有鲁棒性;3)本发明的方法计算复杂度较低,易于实施,操作简单。
下面结合附图对本发明作进一步详细描述。
附图说明
图1是本发明基于多尺度子带能量集特征的膛口波识别方法的流程图。
图2是本发明实施例采用的实测数据的时域波形图。
具体实施方式
结合图1,本发明的一种基于多尺度子带能量集特征的膛口波识别方法,具体步骤为:
步骤1、对连续音频数据进行基于高斯混合模型的分段,截取全频带有声片段,具体步骤为:
步骤1-1、对户外连续音频数据进行分片、加窗及短时傅里叶变换得到特征样本;
步骤1-2、利用含有两个高斯分量的高斯混合模型对特征样本中的短时对数能量分布进行建模来表征有声片段和环境噪声片段,完成全频带有声片段的截取。
步骤2、将步骤1得到的全频带有声片段通过多尺度子带滤波器组进行滤波处理得到子带有声片段,对得到的全频带有声片段进行子带滤波处理得到子带有声片段的具体方法为:
将全频带有声片段分别通过中心频率为300Hz、900Hz、1.4kHz、1.8kHz的子带滤波器,获得相应的子带有声片段。
步骤3、对步骤1截取的全频带有声片段和步骤2中滤波后的子带有声片段进行起点对齐,具体步骤为:
步骤3-1、将步骤2-1中得到的中心频率为300Hz的滤波器滤波后的子带有声片段进行等间距分帧,进一步的实施例中,每帧帧长为0.5ms,帧间重叠50%。
步骤3-3、根据步骤3-2得到的能量最大值max(En)和能量最小值min(En)设定自适应阈值,当连续3段信号能量超过阈值Threshold,将这3段中的第一段标记为起始段,其中,阈值计算公式如下:
Threshold=min(En)+τ×(max(En)-min(En))
式中,τ为常数;实验设定τ=0.016。
步骤3-4、将步骤1-2中得到的全频带有声片段和步骤2-1中滤波后的4个子带有声片段从起始段位置向前移动三段的长度进行幅值谱峰搜索,找到第一个波峰位置,并将该波峰位置记为起始点;
步骤3-5、根据4个子带滤波器在各自中心频率的群延迟特性,分别延迟偏移量以对齐有声片段的时间起点。
步骤4、将步骤3经过起点对齐的有声片段进行变尺度分帧和特征提取,具体步骤为:
步骤4-1、将经过步骤3对齐后的有声片段进行变尺度分帧,提取对齐的时间起点开始之前5帧,进一步的实施例中,5帧的长度分别为:0.125ms,0.375ms,0.875ms,1.875ms以及3.875ms。
步骤4-2、对上述5帧分别提取短时能量作为特征,记第m个子带片段第n帧的短时能量为:
步骤4-3、提取短时能量比特征,短时能量比具体为子带滤波器组输出子带有声片段的短时能量与全频带有声片段短时能量之比:
其中,m′=1,2,3,4,为子带片段的序号;n=1,2,3,4,5,为对应每帧的序号,则4组子带有声片段与全频带有声片段的短时能量比特征向量为:
步骤4-4、将得到的短时能量特征和短时能量比特征重新拼接,得到能量集特征,每个有声片段的多尺度子带能量集特征MS表示为:
步骤5、根据步骤4提取出的多尺度子带能量集特征进行膛口波分类,具体为:利用机器学习中的SVM分类器完成膛口波和非膛口波片段的识别。
下面结合实施例对本发明做进一步解释。
实施例1
本实施例针对复杂环境下的枪声识别问题,提出了一种基于多尺度子带能量集特征的膛口波识别方法。该方法适用于户外环境下的膛口波识别问题。具体过程为利用基于高斯混合模型的自动分段算法从连续音频样本中截取有声片段,接着对有声片段采用多尺度子带滤波器组滤波处理,然后对滤波后的样本进行起点校准和变尺度分帧,并对各个子带输出提取短时能量和能量比特征,得到能够充分表征膛口波和非膛口波时频域差异的参数化特征,最后利用SVM进行分类识别。
结合图1和图2,本实施例中基于多尺度子带能量集特征的膛口波识别方法,具体步骤为:
步骤1、对连续音频数据进行基于高斯混合模型的分段,截取全频带有声片段。本实施例外场录制的典型枪声信号如图2所示,枪支射击后首先采集到马赫波,由地形因素产生的若干反射波紧随其后,最后采集到的膛口波已经几乎被淹没在多个反射波之中,且能量受距离限制弱于马赫波反射信号,波形也由于多径传播影响易发生畸变。首先将外场实录的连续音频数据进行分片、加窗及短时傅里叶变换,随后基于高斯混合模型的自动分段算法,利用含有两个高斯分量的高斯混合模型对样本中的片段对数能量分布进行建模,分别表征有声片段和环境噪声片段,从而完成对音频数据的截取。数据中包含若干膛口波、马赫波、地面反射以及非枪声,如说话声、风声和警报声等。通过基于GMM的自动分段算法后,可获得膛口波有效片段373个,马赫波有效片段31个,非枪声有效片段468个。考虑到本实施例的研究目的是识别枪声中的膛口波,可将上述所有片段划分为膛口波片段和非膛口波片段两类,其中膛口波片段373个,非膛口波片段499个,共872个片段。
步骤2、将自动分段后得到的有声片段通过多尺度子带滤波器组进行滤波处理,将全频带有声片段X0分别通过中心频率为300Hz、900Hz、1.4kHz、1.8kHz的子带滤波器FB1,FB2,FB3,FB4,获得相应的子带有声片段X1,X2,X3,X4。
步骤3、对步骤1截取的全频带有声片段和步骤2中滤波后的子带有声片段进行起点对齐;考虑到滤波器的群延迟特性,基于传统语音端点检测方法(VAD),对步骤1截取的有声片段和步骤2中滤波后的片段进行能量检测和幅度谱峰搜索,通过能量阈值确定起始点搜索范围,通过幅度阈值确定起始点具体位置,从而实现膛口波对齐,具体内容为:
步骤3-1、将步骤2-1中得到的FB1滤波后的子带有声片段X1进行等间距分段,每段长为0.5ms,重叠50%;
步骤3-3、根据步骤3-2得到的能量最大值max(En)和能量最小值min(En)设定自适应阈值,当连续3段信号能量超过阈值Threshold,将这3段中的第一段标记为起始段,其中,阈值计算公式如下:
Threshold=min(En)+τ×(max(En)-min(En))
式中,τ为常数,本实施例中τ=0.016;
步骤3-4、将步骤1-2中得到的全频带有声片段和步骤2-1中滤波后的4个子带有声片段从起始段位置向前移动三段的长度进行幅值谱峰搜索,找到第一个波峰位置,并将该波峰位置记为起始点;
步骤3-5、根据4个子带滤波器在各自中心频率的群延迟特性,分别延迟偏移量,对齐有声片段的时间起点。
步骤4、将步骤3经过起点对齐的5组有声片段进行变尺度分帧和特征提取。对子带滤波器组的输出片段起点对齐后采用了变尺度分帧方法,提取对齐的时间起点开始之前5帧,然后针对5帧分别提取能够充分表征膛口波和非膛口波时频域差异的短时能量特征和短时能量比特征。具体内容为:
将经过步骤3对齐后的有声片段进行变尺度分帧,提取对齐的时间起点开始之前5帧,5帧的长度分别为:0.125ms,0.375ms,0.875ms,1.875ms以及3.875ms。
步骤4-2、对上述5帧分别提取短时能量作为特征,记第m个子带片段第n帧的短时能量为:
步骤4-3、提取短时能量比特征,具体而言,短时能量比定义为子带滤波器组输出片段X1,X2,X3,X4的短时能量与原始有声片段X0短时能量之比:
其中,m′=1,2,3,4,为子带片段的序号;n=1,2,3,4,5,为对应每帧的序号。经过上式得到的4组子带滤波后片段与原始片段的短时能量比特征向量为:
步骤4-4、将得到的短时能量特征和能量比特征重新拼接,得到能够充分表征膛口波和非膛口波时频域差异的能量集特征,每个有声片段的多尺度子带能量集特征向量MS示为:
其中,向量维度为9×5=45。
针对包括373个膛口波片段和499个非膛口波片段的有声片段依据上述步骤提取多尺度子带能量集特征,构成872×45维特征矩阵。
步骤5、根据步骤4提取出的多尺度子带能量集特征进行膛口波分类,本实施例中利用C++中的libsvm库建模SVM,选用径向基核函数(Radial Basis Function,RBF),并采用默认方式设置惩罚因子c和核参数g。并采用查准率(precision)、查全率(recall)、F1度量和AUC(Area Under ROC Curve)等评价指标进行性能评估,定义分别如下:
AUC=ΔSROC
其中TP为真正例,即正样本被正确分类的个数,FP和FN分别为假正例和假反例,分别表示正样本和负样本被错误分类的个数。F1是基于Precision和Recall的加权调和平均。AUC定义为ROC曲线的线下面积。
本实施例进行了100次物种分类实验,每次实验采用无放回方式从每类物种中随机抽取60%样本(实验中每个片段对应特征向量称为一个样本)作为总体训练集,余下每类40%样本共同组成总体测试集,并对测试集的分类结果进行性能评估。表1给出了100次膛口波识别实验的各类平均查准率、查全率F1度量以及AUC结果,由表中结果可知,膛口波识别的各类平均查准率、查全率以及F1度量均不低于94%,说明本发明方法性能良好,适用于复杂环境下的枪声识别问题。
表1
本实施例以外场实测数据为基础,采用基于高斯混合模型的自动分段算法从连续音频样本中截取有声片段,并对有声片段采用多尺度子带滤波器组滤波处理,然后对滤波后的样本进行起点校准和变尺度分帧,并对各个子带输出提取短时能量和能量比特征,得到能够充分表征膛口波和非膛口波时频域差异的参数化特征,最后基于机器学习的方法进行膛口波的分类识别。通过本发明的方法,可以有效识别复杂环境下的枪声。因此,本发明可用于危险声音的自动监控或者作为距离定位、来向估计和口径识别等后续工作的基础,在公共安全、野外生态保护、法医鉴定等领域具有重要意义。
Claims (5)
1.一种基于多尺度子带能量集特征的膛口波识别方法,其特征在于,具体步骤为:
步骤1、对连续音频数据进行基于高斯混合模型的分段,截取全频带有声片段;
步骤2、将步骤1得到的全频带有声片段通过多尺度子带滤波器组进行滤波处理得到子带有声片段,具体为:将全频带有声片段分别通过中心频率为300Hz、900Hz、1.4kHz、1.8kHz的子带滤波器,获得相应的子带有声片段;
步骤3、对步骤1截取的全频带有声片段和步骤2中滤波后的子带有声片段进行起点对齐,具体为:
步骤3-1、将步骤2中得到的中心频率为300Hz的滤波器滤波后的子带有声片段进行等间距分帧;
步骤3-3、根据步骤3-2得到的能量最大值max(En)和能量最小值min(En)设定自适应阈值,当连续3段信号能量超过阈值Threshold,将这3段中的第一段标记为起始段,其中,阈值计算公式如下:
Threshold=min(En)+τ×(max(En)-min(En))
式中,τ为常数;
步骤3-4、将步骤1中得到的全频带有声片段和步骤2中滤波后的4个子带有声片段从起始段位置向前移动三段的长度进行幅值谱峰搜索,找到第一个波峰位置,并将该波峰位置记为起始点;
步骤3-5、根据4个子带滤波器在各自中心频率的群延迟特性,分别延迟偏移量以对齐有声片段的时间起点;
步骤4、将步骤3经过起点对齐的有声片段进行变尺度分帧和特征提取,具体步骤为:
步骤4-1、将经过步骤3对齐后的有声片段进行变尺度分帧,提取对齐的时间起点开始之前的5帧;
步骤4-2、对上述5帧分别提取短时能量作为特征,记第m个子带片段第n帧的短时能量为:
步骤4-3、提取短时能量比特征,短时能量比具体为子带滤波器组输出子带有声片段的短时能量与全频带有声片段短时能量之比:
其中,m′=1,2,3,4,为子带片段的序号;n=1,2,3,4,5,为对应每帧的序号,则4组子带有声片段与全频带有声片段的短时能量比特征向量为:
步骤4-4、将得到的短时能量特征和短时能量比特征重新拼接,得到能量集特征,每个有声片段的多尺度子带能量集特征MS表示为:
步骤5、根据步骤4提取出的多尺度子带能量集特征进行膛口波分类,得到最好的识别结果。
2.根据权利要求1所述的基于多尺度子带能量集特征的膛口波识别方法,其特征在于,步骤1对户外连续音频数据进行基于高斯混合模型的自动分段具体包括以下步骤:
步骤1-1、对户外连续音频数据进行分片、加窗及短时傅里叶变换得到特征样本;
步骤1-2、利用含有两个高斯分量的高斯混合模型对特征样本中的短时对数能量分布进行建模来表征有声片段和环境噪声片段,完成全频带有声片段的截取。
3.根据权利要求1所述的基于多尺度子带能量集特征的膛口波识别方法,其特征在于,步骤3-1中对子带有声片段进行等间距分帧,每帧帧长为0.5ms,帧间重叠50%。
4.根据权利要求3所述的基于多尺度子带能量集特征的膛口波识别方法,其特征在于,步骤4-1中提取的对齐的时间起点开始之前的5帧的长度分别为:0.125ms,0.375ms,0.875ms,1.875ms以及3.875ms。
5.根据权利要求1所述的基于多尺度子带能量集特征的膛口波识别方法,其特征在于,步骤5进行膛口波识别具体为:利用机器学习中的SVM分类器完成膛口波和非膛口波片段的识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810043796.7A CN108269566B (zh) | 2018-01-17 | 2018-01-17 | 一种基于多尺度子带能量集特征的膛口波识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810043796.7A CN108269566B (zh) | 2018-01-17 | 2018-01-17 | 一种基于多尺度子带能量集特征的膛口波识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108269566A CN108269566A (zh) | 2018-07-10 |
CN108269566B true CN108269566B (zh) | 2020-08-25 |
Family
ID=62775756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810043796.7A Active CN108269566B (zh) | 2018-01-17 | 2018-01-17 | 一种基于多尺度子带能量集特征的膛口波识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108269566B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109473112B (zh) * | 2018-10-16 | 2021-10-26 | 中国电子科技集团公司第三研究所 | 一种脉冲声纹识别方法、装置、电子设备及存储介质 |
CN117727331B (zh) * | 2024-02-18 | 2024-04-19 | 百鸟数据科技(北京)有限责任公司 | 基于语音分析的森林枪声定位方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7454342B2 (en) * | 2003-03-19 | 2008-11-18 | Intel Corporation | Coupled hidden Markov model (CHMM) for continuous audiovisual speech recognition |
SG141457A1 (en) * | 2004-08-24 | 2008-04-28 | Bbn Technologies Corp | Systems and methods for disambiguating shooter locations |
CN103646649B (zh) * | 2013-12-30 | 2016-04-13 | 中国科学院自动化研究所 | 一种高效的语音检测方法 |
CN103885032A (zh) * | 2014-04-14 | 2014-06-25 | 易美泰克影像技术(北京)有限公司 | 一种声源智能联合分布定位定向方法 |
JP6363987B2 (ja) * | 2015-12-24 | 2018-07-25 | 日本電信電話株式会社 | 音声処理システム、音声処理装置および音声処理プログラム |
CN106821337B (zh) * | 2017-04-13 | 2020-01-03 | 南京理工大学 | 一种有监督的鼾声来源识别方法 |
CN107146615A (zh) * | 2017-05-16 | 2017-09-08 | 南京理工大学 | 基于匹配模型二次识别的语音识别方法及系统 |
CN107527611A (zh) * | 2017-08-23 | 2017-12-29 | 武汉斗鱼网络科技有限公司 | Mfcc语音识别方法、存储介质、电子设备及系统 |
-
2018
- 2018-01-17 CN CN201810043796.7A patent/CN108269566B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108269566A (zh) | 2018-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106023996B (zh) | 基于十字形声阵列宽带波束形成的声识别方法 | |
EP3016314B1 (en) | A system and a method for detecting recorded biometric information | |
CN112257521B (zh) | 基于数据增强和时频分离的cnn水声信号目标识别方法 | |
CN109767776B (zh) | 一种基于密集神经网络的欺骗语音检测方法 | |
CN111239680B (zh) | 一种基于差分阵列的波达方向估计方法 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN110120230B (zh) | 一种声学事件检测方法及装置 | |
CN109977724B (zh) | 一种水下目标分类方法 | |
CN108269566B (zh) | 一种基于多尺度子带能量集特征的膛口波识别方法 | |
Jaafar et al. | Automatic syllables segmentation for frog identification system | |
CN105825857A (zh) | 基于声纹识别帮助失聪患者判断声音类别的方法 | |
Zhao et al. | Using supervised machine learning to distinguish microseismic from noise events | |
CN108919241B (zh) | 一种基于恒虚警检测的水下信号时频端点参数估计方法 | |
Tong et al. | Classification and recognition of underwater target based on MFCC feature extraction | |
CN115510909A (zh) | 一种dbscan进行异常声音特征的无监督算法 | |
CN109920447B (zh) | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 | |
Chen et al. | Masking speech feature to detect adversarial examples for speaker verification | |
Svatos et al. | Impulse acoustic event detection, classification, and localization system | |
CN113345443A (zh) | 基于梅尔频率倒谱系数的海洋哺乳动物发声检测识别方法 | |
Shearme et al. | Some experiments with a simple word recognition system | |
CN108564962A (zh) | 基于四面体麦克风阵列的无人机声音信号增强方法 | |
CN111968671B (zh) | 基于多维特征空间的低空声目标综合识别方法及装置 | |
Arslan | A new approach to real time impulsive sound detection for surveillance applications | |
CN109473112B (zh) | 一种脉冲声纹识别方法、装置、电子设备及存储介质 | |
Tahliramani et al. | Performance analysis of speaker identification system with and without spoofing attack of voice conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Xu Zhiyong Inventor after: Zhao Zhao Inventor after: Li Yang Inventor after: Xie Mengrui Inventor before: Li Yang Inventor before: Xie Mengrui Inventor before: Xu Zhiyong Inventor before: Zhao Zhao |
|
GR01 | Patent grant | ||
GR01 | Patent grant |