CN101980336A - 一种基于隐马尔可夫模型的汽车声音识别方法 - Google Patents

一种基于隐马尔可夫模型的汽车声音识别方法 Download PDF

Info

Publication number
CN101980336A
CN101980336A CN2010105104282A CN201010510428A CN101980336A CN 101980336 A CN101980336 A CN 101980336A CN 2010105104282 A CN2010105104282 A CN 2010105104282A CN 201010510428 A CN201010510428 A CN 201010510428A CN 101980336 A CN101980336 A CN 101980336A
Authority
CN
China
Prior art keywords
coefficient
frame
sound
parameter
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105104282A
Other languages
English (en)
Other versions
CN101980336B (zh
Inventor
王子亮
陈铮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Star Net eVideo Information Systems Co Ltd
Original Assignee
FUZHOU STARNET EVIDEO INFORMATION SYSTEM Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FUZHOU STARNET EVIDEO INFORMATION SYSTEM Co Ltd filed Critical FUZHOU STARNET EVIDEO INFORMATION SYSTEM Co Ltd
Priority to CN2010105104282A priority Critical patent/CN101980336B/zh
Publication of CN101980336A publication Critical patent/CN101980336A/zh
Application granted granted Critical
Publication of CN101980336B publication Critical patent/CN101980336B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明提供一种基于隐马尔可夫模型的汽车声音识别方法,先对车辆声音数据进行归一化、分帧、加窗、去噪等预处理,然后利用美尔倒谱(MFCC)算法提取车辆声音的特征参数;再利用隐马尔科夫模型算法(HMM)对每一部车辆声音样本进行训练,并建立相应的模型,加入模板库;将待识别车辆声音经预处理、求取MFCC特征系数后,与模板库中的所有样本一一匹配,得到最佳匹配值所对应的样本即为识别结果。本发明通过车辆声音识别方法准确识别不同车辆,便于车辆管理,可应用于小区或单位的门禁系统等场景,具有极好的应用前景。

Description

一种基于隐马尔可夫模型的汽车声音识别方法
【技术领域】
本发明涉及一种音频处理和模式识别技术领域,尤其涉及一种基于隐马尔可夫模型的汽车声音识别方法。
【背景技术】
HMM(隐马尔可夫模型)是马尔可夫链的一种,它的状态不能直接观察到,但能通过观测向量序列观察到,每个观测向量都是通过某些概率密度分布表现为各种状态,每一个观测向量是由一个具有响应概率密度分布的状态序列产生。所以,隐马尔可夫模型是一个双重随机过程----具有一定状态数的隐马尔可夫链和显示随机函数集。自20世纪80年代以来,HMM被应用于语音识别,取得重大成功。到了90年代,HMM还被引入计算机文字识别和移动通信核心技术“多用户的检测”。近年来,HMM在生物信息科学、故障诊断等领域也开始得到应用。
随着人们生活水平的不断提高,车辆在不断的增多,很多小区和单位对车辆的管理都不是很有条理,现有技术一般都是人为的对车辆进行管理,在此提出利用识别车辆声音的方法来更好的管理车辆,该方法嵌入到门禁系统中,可以统计识别不同车辆进出数据。车辆音频信号与语音信号一样都是随时间变化的,即使是同一辆车在不同时刻不同地点产生的音频信号都是不同的,这表明车辆音频信号的不确定性,它只具有统计的确定性,为描述这种音频信号随时间变化的特性,采用状态的概念是比较恰当的,音频信号特征的变化表现为从一个状态到另一个状态的转移,特征从一个状态到另一个状态只是以一定的概率转移。因此,用隐马尔可夫模型可以很好的表示这一转移过程。车辆声音识别的过程首先用美尔倒谱(MFCC)算法提取车辆声音的特征参数,其中MFCC是在Mel度频率域提取出来的倒谱参数。Mel标度描述了人耳对频率感知的非线性特征,它与频率的关系可近似表示为Mel(f)=2595*log(1+f/700)其中f为频率,单位是Hz。同时MFCC分析着眼于人耳的听觉机理,依据听觉实验的结果来分析声音的频谱,获得了较高的识别率和较好的噪声鲁棒性。MFCC的计算是:先把信号变换到频域得到线性频谱,再经过一组的Mel滤波器组,得到能够模拟人耳听觉特性的非线性频谱,然后取对数变换,压缩音谱的动态范围,最后作DCT变换。
【发明内容】
本发明要解决的技术问题,在于提供一种基于隐马尔可夫模型的汽车声音识别方法,通过车辆声音识别方法准确识别不同车辆,便于车辆管理,可应用于小区或单位的门禁系统等场景,具有极好的应用前景。
本发明是这样实现的:一种基于隐马尔可夫模型的汽车声音识别方法,其特征在于:包括以下步骤:
步骤10、基本预处理:将采集的车辆音频信号进行归一化,再将音频信号中的数据划分成N个帧,并对每个帧进行加海明窗滤波;
步骤20、去噪处理:将音频信号在频域中根据公式
| S ^ w ( ω ) | = [ | Y w ( ω ) | a - b | N ^ w ( ω ) | a ] 1 a
算出纯净信号的功率谱,其中Yw(ω)表示带噪信号功率,
Figure BDA0000028643570000022
表示噪声功率,
Figure BDA0000028643570000023
表示纯净信号的功率谱,其中w是下标表示经过加窗处理后的信号,a为谱减功率修正系数,b为谱减噪声系数,获得纯净信号的功率谱
Figure BDA0000028643570000024
通过相位恢复后再采用逆傅里叶变换来恢复时域信号;
步骤30、对每个帧计算MFCC系数,获得车辆声音12维特征参数,再根据公式
d ( n ) = 1 Σ i = - k k i 2 Σ i = - k k i · c ( n + i ) , ( n = 3,4 , . . . T - 2 )
计算帧间差分系数,其中c和d都表示一帧声音参数,T表示总帧数;k为常数,将差分系数追加至原12维的MFCC系数末尾,并去除所有帧的首两帧和末两帧系数,得到24维的车辆声音特征参数;
步骤40、用HMM模型对所有的汽车声音样本一一进行建模,将HMM模型参数(N,π,A,B)初始化,其中状态数N取整数1到4,初始概率π为[1 0 0 0],状态转移概率A取为
0.5 0.5 0 0 0 0.5 0.5 0 0 0 0.5 0.5 0 0 0 1
根据混合高斯函数:
求出参数B,B是状态输出观测值的概率,其中N是高斯概率密度函数,O是声音的特征系数帧即观察序列,μ、U、c、分别是均值、方差、以及权重系数,M是每个状态包含的高斯混元个数,先对观察序列的参数分成N段,然后用K均值聚类算法初始化各状态的混合高斯概率密度函数中的均值、方差和权系数;
步骤50、初始化模型参数后,并设置迭代次数,用Viterbi算法计算HMM输出所有训练声音观测序列的概率P(O/λ),并累加得到∑1中,再用Baum-Welch算法对模型参数进行重估,得到
Figure BDA0000028643570000033
再用Viterbi算法计算HMM输出所有训练声音观测序列的概率
Figure BDA0000028643570000034
并累加得到∑2,将∑1和∑2结果进行比较,判断差值是否小于预设阈值?是,则无需进行重估计算,将
Figure BDA0000028643570000035
作为计算结果输出,否则将
Figure BDA0000028643570000036
作为新的初值代入P(O/λ)中的λ做新一轮运算,将所有汽车声音的样本进行如上处理后导入到参考模板库中;
步骤60、进行识别:先对待测车辆音频信号进行预处理,求出24维MFCC特征参数,即所述的观察值序列,然后利用viterbi算法求参考模板库中各个HMM模型输出该观测序列的概率P(O/λ),其中P(O/λ)最大的HMM模型所对应的汽车声音样本即为识别结果。
本发明具有如下优点:对车辆声音数据进行归一化、分帧、加窗、去噪等预处理,然后利用美尔倒谱(MFCC)算法提取车辆声音的特征参数;再利用隐马尔科夫模型算法(HMM)对每一部车辆声音样本进行训练,并建立相应的模型,加入模板库;将待识别车辆声音经预处理、求取MFCC特征系数后,与模板库中的所有样本一一匹配,得到最佳匹配值所对应的样本即为识别结果。本发明通过车辆声音识别方法准确识别不同车辆,便于车辆管理,可应用于小区或单位的门禁系统等场景,具有极好的应用前景。
【附图说明】
图1为本发明车辆音频信号的学习过程。
图2为本发明HMM模型训练流程。
图3为本发明车辆音频信号的识别过程。
【具体实施方式】
下面参照图1至图3结合实施例对本发明作进一步的说明:
一种基于隐马尔可夫模型的汽车声音识别方法(其步骤10到步骤50是车辆音频信号的学习过程见图1所示),包括以下步骤:
步骤10、先是基本预处理:将采集的车辆音频信号进行归一化(归一化就是找出信号绝对值的最大值,将原信号除以该值,使信号的的正负幅值限制在-1和+1之间),再将音频信号中的数据划分成N个帧,一般每个帧包含1024个声音采样点,并且相邻帧之间有512个采样点的重合,再将每个帧进行加海明窗滤波以减少后续变换到频域后造成的频谱泄露。
步骤20:进行去噪处理,通常采集发动机声音时会混入环境噪声,如雨声等,影响后续识别率,因此必须去除,将音频信号在频域中根据公式
| S ^ w ( ω ) | = [ | Y w ( ω ) | a - b | N ^ w ( ω ) | a ] 1 a
算出纯净信号的功率谱,其中Yw(ω)表示带噪信号功率,表示噪声功率,
Figure BDA0000028643570000043
表示纯净信号的功率谱,其中w是下标表示经过加窗处理后的信号,a为谱减功率修正系数,b为谱减噪声系数,获得纯净信号的功率谱
Figure BDA0000028643570000044
通过相位恢复后再采用逆傅里叶变换来恢复时域信号。
步骤30、对每个帧计算MFCC系数,获得车辆声音12维特征参数,再根据公式
d ( n ) = 1 Σ i = - k k i 2 Σ i = - k k i · c ( n + i ) , ( n = 3,4 , . . . T - 2 )
计算帧间差分系数,其中c和d都表示一帧声音参数,k为常数(通常取为2),此时差分系数表示当前帧的前两帧和后两帧参数的线性组合,将差分系数追加至原12维的MFCC系数末尾,并去除所有帧的首两帧和末两帧系数,得到24维的车辆声音特征参数。
步骤40、用HMM模型对所有汽车的声音样本一一进行建模,将HMM模型参数(N,π,A,B)初始化,其中状态数N是整数1到4,初始概率为[1 0 0 0],状态转移概率A为
0.5 0.5 0 0 0 0.5 0.5 0 0 0 0.5 0.5 0 0 0 1
根据混合高斯函数:
求出参数B,B是状态输出观测值的概率,其中N是高斯概率密度函数,O是声音的特征系数帧即观察序列,μ、U、c、分别是均值、方差、以及权重系数,M是每个状态包含的高斯混元个数。其中各状态的混合高斯概率密度函数中的均值、方差和权系数的初始化采用K均值聚类算法,首先要把观察序列的参数分成N段,其分段方法包括如下步骤:
步骤401、根据公式
d t = Σ n = 1 p n 2 ( C t + 1 ( n ) - C t ( n ) ) 2 , ( t = 1,2 , . . . , T - 1 )
计算观察序列相邻两帧之间的距离dt,其中C表示特征参数,p为MFCC特征参数的阶数,T为观察序列的帧数。
步骤402、从数组dt中找出N-1个极大值。
步骤403、采用N-1个极大值为分割点将观察序列O分成N段,每一段对应一个状态。
步骤404、分段后将所有所述的观察序列中属于同一个段的参数组成一个大的矩阵,再用K均值聚类算法把该矩阵中的所有训练帧分成M类(M取值视情况而定),然后对同一类中各声音系数帧矢量求均值及方差,作为该类所对应的高斯混元的均值μ和方差U,用每一类中包含的声音系数帧数除以该状态的声音系数帧总数,即得到各类所对应的高斯混元的权重系数c。
步骤50、初始化模型参数后,并设置迭代次数,见图2进行HMM模型训练流程,用Viterbi算法计算HMM输出所有训练声音观测序列的概率P(O/λ),并累加得到∑1中,再用Baum-Welch算法对模型参数进行重估,得到
Figure BDA0000028643570000061
再用Viterbi算法计算HMM输出所有训练声音观测序列的概率
Figure BDA0000028643570000062
并累加得到∑2,将∑1和∑2结果进行比较,判断差值是否小于预设阈值?是,则无需进行重估计算,将
Figure BDA0000028643570000063
作为计算结果输出,否则将
Figure BDA0000028643570000064
作为新的初值代入P(O/λ)中的λ做新一轮运算。将所有汽车声音的样本进行如上处理后导入到参考模板库中。
步骤60、进行识别(见图3所示):先对待测车辆音频信号进行预处理,求出24维MFCC特征参数,即所述的观察值序列,然后利用viterbi算法求参考模板库中各个HMM模型输出该观测序列的概率P(O/λ),其中P(O/λ)最大的HMM模型所对应的汽车声音样本即为识别结果。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (2)

1.一种基于隐马尔可夫模型的汽车声音识别方法,其特征在于:包括以下步骤:
步骤10、基本预处理:将采集的车辆音频信号进行归一化,再将音频信号中的数据划分成N个帧,并对每个帧进行加海明窗滤波;
步骤20、去噪处理:将音频信号在频域中根据公式
| S ^ w ( ω ) | = [ | Y w ( ω ) | a - b | N ^ w ( ω ) | a ] 1 a
算出纯净信号的功率谱,其中Yw(ω)表示带噪信号功率,
Figure FDA0000028643560000012
表示噪声功率,
Figure FDA0000028643560000013
表示纯净信号的功率谱,其中w是下标表示经过加窗处理后的信号,a为谱减功率修正系数,b为谱减噪声系数,获得纯净信号的功率谱
Figure FDA0000028643560000014
通过相位恢复后再采用逆傅里叶变换来恢复时域信号;
步骤30、对每个帧计算MFCC系数,获得车辆声音12维特征参数,再根据公式
d ( n ) = 1 Σ i = - k k i 2 Σ i = - k k i · c ( n + i ) , ( n = 3,4 , . . . T - 2 )
计算帧间差分系数,其中c和d都表示一帧声音参数,T表示总帧数;k为常数,将差分系数追加至原12维的MFCC系数末尾,并去除所有帧的首两帧和末两帧系数,得到24维的车辆声音特征参数;
步骤40、用HMM模型对所有的汽车声音样本一一进行建模,将HMM模型参数(N,π,A,B)初始化,其中状态数N取整数1到4,初始概率π为[1 0 0 0],状态转移概率A取为
Figure FDA0000028643560000016
根据混合高斯函数:
Figure FDA0000028643560000017
求出参数B,B是状态输出观测值的概率,其中N是高斯概率密度函数,O是声音的特征系数帧即观察序列,μ、U、c、分别是均值、方差、以及权重系数,M是每个状态包含的高斯混元个数,先对观察序列的参数分成N段,然后用K均值聚类算法初始化各状态的混合高斯概率密度函数中的均值、方差和权系数;
步骤50、初始化模型参数后,并设置迭代次数,用Viterbi算法计算HMM输出所有训练声音观测序列的概率P(O/λ),并累加得到∑1中,再用Baum-Welch算法对模型参数进行重估,得到再用Viterbi算法计算HMM输出所有训练声音观测序列的概率并累加得到∑2,将∑1和∑2结果进行比较,判断差值是否小于预设阈值?是,则无需进行重估计算,将
Figure FDA0000028643560000023
作为计算结果输出,否则将
Figure FDA0000028643560000024
作为新的初值代入P(O/λ)中的λ做新一轮运算,将所有汽车声音的样本进行如上处理后导入到参考模板库中;
步骤60、进行识别:先对待测车辆音频信号进行预处理,求出24维MFCC特征参数,即所述的观察值序列,然后利用viterbi算法求参考模板库中各个HMM模型输出该观测序列的概率P(O/λ),其中P(O/λ)最大的HMM模型所对应的汽车声音样本即为识别结果。
2.根据权利要求1所述的一种基于隐马尔可夫模型的汽车声音识别方法,其特征在于:所述的步骤40中分段,其分段方法包括如下步骤:
步骤401、根据公式
d t = Σ n = 1 p n 2 ( C t + 1 ( n ) - C t ( n ) ) 2 , ( t = 1,2 , . . . , T - 1 )
计算所述的观察序列相邻两帧之间的距离dt,其中C表示特征参数,p为MFCC特征参数的阶数,T为观察序列的帧数;
步骤402、从数组dt中找出N-1个极大值;
步骤403、采用N-1个极大值为分割点将观察序列O分成N段,每一段对应一个状态;
步骤404、分段后将所有所述的观察序列中属于同一个段的参数组成一个大的矩阵,再用K均值聚类算法把该矩阵中的所有训练帧分成M类,然后对同一类中各声音系数帧矢量求均值及方差,作为该类所对应的高斯混元的均值μ和方差U,用每一类中包含的声音系数帧数除以该状态的声音系数帧总数,即得到各类所对应的高斯混元的权重系数c。
CN2010105104282A 2010-10-18 2010-10-18 一种基于隐马尔可夫模型的汽车声音识别方法 Expired - Fee Related CN101980336B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105104282A CN101980336B (zh) 2010-10-18 2010-10-18 一种基于隐马尔可夫模型的汽车声音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105104282A CN101980336B (zh) 2010-10-18 2010-10-18 一种基于隐马尔可夫模型的汽车声音识别方法

Publications (2)

Publication Number Publication Date
CN101980336A true CN101980336A (zh) 2011-02-23
CN101980336B CN101980336B (zh) 2012-01-11

Family

ID=43600837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105104282A Expired - Fee Related CN101980336B (zh) 2010-10-18 2010-10-18 一种基于隐马尔可夫模型的汽车声音识别方法

Country Status (1)

Country Link
CN (1) CN101980336B (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682765A (zh) * 2012-04-27 2012-09-19 中咨泰克交通工程集团有限公司 高速公路音频车辆检测装置及其方法
CN102982802A (zh) * 2012-12-06 2013-03-20 四川大学 一种基于实时编码的车辆特征识别算法
CN103065627A (zh) * 2012-12-17 2013-04-24 中南大学 基于dtw与hmm证据融合的特种车鸣笛声识别方法
CN103337248A (zh) * 2013-05-17 2013-10-02 南京航空航天大学 一种基于时间序列核聚类的机场噪声事件识别方法
WO2013177981A1 (zh) * 2012-05-28 2013-12-05 中兴通讯股份有限公司 一种基于环境声音的场景识别方法、装置及移动终端
CN103811008A (zh) * 2012-11-08 2014-05-21 中国移动通信集团上海有限公司 一种音频内容识别方法和装置
CN104157294A (zh) * 2014-08-27 2014-11-19 中国农业科学院农业信息研究所 一种农产品市场要素信息采集的鲁棒性语音识别方法
CN104183245A (zh) * 2014-09-04 2014-12-03 福建星网视易信息系统有限公司 一种演唱者音色相似的歌星推荐方法与装置
CN104810023A (zh) * 2015-05-25 2015-07-29 河北工业大学 一种用于语音信号增强的谱减法
CN104952449A (zh) * 2015-01-09 2015-09-30 珠海高凌技术有限公司 环境噪声声源识别方法及装置
CN105139852A (zh) * 2015-07-30 2015-12-09 浙江图维电力科技有限公司 一种基于改进的mfcc声音特征的工程机械识别方法及识别装置
CN105244038A (zh) * 2015-09-30 2016-01-13 金陵科技学院 一种基于hmm的选矿设备故障异常音频分析与识别方法
CN105516860A (zh) * 2016-01-19 2016-04-20 青岛海信电器股份有限公司 虚拟低音生成方法、装置和终端
CN105810212A (zh) * 2016-03-07 2016-07-27 合肥工业大学 一种复杂噪声环境下的列车鸣笛识别方法
CN106205624A (zh) * 2016-07-15 2016-12-07 河海大学 一种基于dbscan算法的声纹识别方法
CN103634245B (zh) * 2013-12-05 2017-01-25 北京邮电大学 一种信号带宽估计方法及装置
CN106782510A (zh) * 2016-12-19 2017-05-31 苏州金峰物联网技术有限公司 基于连续混合高斯hmm模型的地名语音信号识别方法
CN107680679A (zh) * 2017-08-22 2018-02-09 浙江工业大学 大数据驱动的学生有氧能力分群方法
CN107767859A (zh) * 2017-11-10 2018-03-06 吉林大学 噪声环境下人工耳蜗信号的说话人可懂性检测方法
CN108234756A (zh) * 2017-12-25 2018-06-29 北京松果电子有限公司 通话控制方法、装置及计算机可读存储介质
CN109192200A (zh) * 2018-05-25 2019-01-11 华侨大学 一种语音识别方法
CN110120218A (zh) * 2019-04-29 2019-08-13 东北大学 基于gmm-hmm的高速公路大型车辆识别方法
CN110176248A (zh) * 2019-05-23 2019-08-27 广西交通科学研究院有限公司 道路声音识别方法、系统、计算机设备及可读存储介质
CN110503970A (zh) * 2018-11-23 2019-11-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
CN111460373A (zh) * 2020-03-31 2020-07-28 Oppo广东移动通信有限公司 一种到站提醒方法、装置、存储介质和终端设备
CN112541533A (zh) * 2020-12-07 2021-03-23 阜阳师范大学 一种基于神经网络与特征融合的改装车识别方法
CN113571092A (zh) * 2021-07-14 2021-10-29 东软集团股份有限公司 一种发动机异响识别方法及其相关设备
CN113780408A (zh) * 2021-09-09 2021-12-10 安徽农业大学 一种基于音频特征的生猪状态识别方法
CN114841193A (zh) * 2022-03-21 2022-08-02 河北工业大学 一种改进mfcc算法的风机叶片故障诊断方法
CN115578678A (zh) * 2022-11-08 2023-01-06 中国农业大学 一种鱼类摄食强度分类方法及系统
CN118692478A (zh) * 2024-08-22 2024-09-24 深圳同创音频技术有限公司 基于动态门限的混音方法、设备、系统和存储介质
CN114841193B (zh) * 2022-03-21 2024-10-29 河北工业大学 一种改进mfcc算法的风机叶片故障诊断方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106057196B (zh) * 2016-07-08 2019-06-11 成都之达科技有限公司 车载语音数据解析识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118745A (zh) * 2006-08-04 2008-02-06 中国科学院声学研究所 语音识别系统中的置信度快速求取方法
CN101504834A (zh) * 2009-03-25 2009-08-12 深圳大学 一种基于隐马尔可夫模型的哼唱式旋律识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118745A (zh) * 2006-08-04 2008-02-06 中国科学院声学研究所 语音识别系统中的置信度快速求取方法
CN101504834A (zh) * 2009-03-25 2009-08-12 深圳大学 一种基于隐马尔可夫模型的哼唱式旋律识别方法

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682765A (zh) * 2012-04-27 2012-09-19 中咨泰克交通工程集团有限公司 高速公路音频车辆检测装置及其方法
US9542938B2 (en) 2012-05-28 2017-01-10 Zte Corporation Scene recognition method, device and mobile terminal based on ambient sound
CN103456301B (zh) * 2012-05-28 2019-02-12 中兴通讯股份有限公司 一种基于环境声音的场景识别方法及装置及移动终端
WO2013177981A1 (zh) * 2012-05-28 2013-12-05 中兴通讯股份有限公司 一种基于环境声音的场景识别方法、装置及移动终端
CN103456301A (zh) * 2012-05-28 2013-12-18 中兴通讯股份有限公司 一种基于环境声音的场景识别方法及装置及移动终端
CN103811008A (zh) * 2012-11-08 2014-05-21 中国移动通信集团上海有限公司 一种音频内容识别方法和装置
CN102982802A (zh) * 2012-12-06 2013-03-20 四川大学 一种基于实时编码的车辆特征识别算法
CN103065627B (zh) * 2012-12-17 2015-07-29 中南大学 基于dtw与hmm证据融合的特种车鸣笛声识别方法
CN103065627A (zh) * 2012-12-17 2013-04-24 中南大学 基于dtw与hmm证据融合的特种车鸣笛声识别方法
CN103337248A (zh) * 2013-05-17 2013-10-02 南京航空航天大学 一种基于时间序列核聚类的机场噪声事件识别方法
CN103337248B (zh) * 2013-05-17 2015-07-29 南京航空航天大学 一种基于时间序列核聚类的机场噪声事件识别方法
CN103634245B (zh) * 2013-12-05 2017-01-25 北京邮电大学 一种信号带宽估计方法及装置
CN104157294A (zh) * 2014-08-27 2014-11-19 中国农业科学院农业信息研究所 一种农产品市场要素信息采集的鲁棒性语音识别方法
CN104183245A (zh) * 2014-09-04 2014-12-03 福建星网视易信息系统有限公司 一种演唱者音色相似的歌星推荐方法与装置
CN104952449A (zh) * 2015-01-09 2015-09-30 珠海高凌技术有限公司 环境噪声声源识别方法及装置
CN104810023B (zh) * 2015-05-25 2018-06-19 河北工业大学 一种用于语音信号增强的谱减法
CN104810023A (zh) * 2015-05-25 2015-07-29 河北工业大学 一种用于语音信号增强的谱减法
CN105139852A (zh) * 2015-07-30 2015-12-09 浙江图维电力科技有限公司 一种基于改进的mfcc声音特征的工程机械识别方法及识别装置
CN105244038A (zh) * 2015-09-30 2016-01-13 金陵科技学院 一种基于hmm的选矿设备故障异常音频分析与识别方法
CN105516860A (zh) * 2016-01-19 2016-04-20 青岛海信电器股份有限公司 虚拟低音生成方法、装置和终端
CN105516860B (zh) * 2016-01-19 2019-02-19 青岛海信电器股份有限公司 虚拟低音生成方法、装置和终端
CN105810212A (zh) * 2016-03-07 2016-07-27 合肥工业大学 一种复杂噪声环境下的列车鸣笛识别方法
CN106205624A (zh) * 2016-07-15 2016-12-07 河海大学 一种基于dbscan算法的声纹识别方法
CN106205624B (zh) * 2016-07-15 2019-10-15 河海大学 一种基于dbscan算法的声纹识别方法
CN106782510A (zh) * 2016-12-19 2017-05-31 苏州金峰物联网技术有限公司 基于连续混合高斯hmm模型的地名语音信号识别方法
CN106782510B (zh) * 2016-12-19 2020-06-02 苏州金峰物联网技术有限公司 基于连续混合高斯hmm模型的地名语音信号识别方法
CN107680679A (zh) * 2017-08-22 2018-02-09 浙江工业大学 大数据驱动的学生有氧能力分群方法
CN107680679B (zh) * 2017-08-22 2021-05-04 浙江工业大学 大数据驱动的学生有氧能力分群方法
CN107767859A (zh) * 2017-11-10 2018-03-06 吉林大学 噪声环境下人工耳蜗信号的说话人可懂性检测方法
CN107767859B (zh) * 2017-11-10 2020-10-20 吉林大学 噪声环境下人工耳蜗信号的说话人可懂性检测方法
CN108234756A (zh) * 2017-12-25 2018-06-29 北京松果电子有限公司 通话控制方法、装置及计算机可读存储介质
CN109192200B (zh) * 2018-05-25 2023-06-13 华侨大学 一种语音识别方法
CN109192200A (zh) * 2018-05-25 2019-01-11 华侨大学 一种语音识别方法
CN110503970A (zh) * 2018-11-23 2019-11-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
WO2020220440A1 (zh) * 2019-04-29 2020-11-05 东北大学 基于gmm-hmm的高速公路大型车辆识别方法
CN110120218B (zh) * 2019-04-29 2021-06-22 东北大学 基于gmm-hmm的高速公路大型车辆识别方法
CN110120218A (zh) * 2019-04-29 2019-08-13 东北大学 基于gmm-hmm的高速公路大型车辆识别方法
CN110176248A (zh) * 2019-05-23 2019-08-27 广西交通科学研究院有限公司 道路声音识别方法、系统、计算机设备及可读存储介质
CN111460373A (zh) * 2020-03-31 2020-07-28 Oppo广东移动通信有限公司 一种到站提醒方法、装置、存储介质和终端设备
CN112541533A (zh) * 2020-12-07 2021-03-23 阜阳师范大学 一种基于神经网络与特征融合的改装车识别方法
CN113571092B (zh) * 2021-07-14 2024-05-17 东软集团股份有限公司 一种发动机异响识别方法及其相关设备
CN113571092A (zh) * 2021-07-14 2021-10-29 东软集团股份有限公司 一种发动机异响识别方法及其相关设备
CN113780408A (zh) * 2021-09-09 2021-12-10 安徽农业大学 一种基于音频特征的生猪状态识别方法
CN114841193A (zh) * 2022-03-21 2022-08-02 河北工业大学 一种改进mfcc算法的风机叶片故障诊断方法
CN114841193B (zh) * 2022-03-21 2024-10-29 河北工业大学 一种改进mfcc算法的风机叶片故障诊断方法
CN115578678A (zh) * 2022-11-08 2023-01-06 中国农业大学 一种鱼类摄食强度分类方法及系统
CN118692478A (zh) * 2024-08-22 2024-09-24 深圳同创音频技术有限公司 基于动态门限的混音方法、设备、系统和存储介质
CN118692478B (zh) * 2024-08-22 2024-10-29 深圳同创音频技术有限公司 基于动态门限的混音方法、设备、系统和存储介质

Also Published As

Publication number Publication date
CN101980336B (zh) 2012-01-11

Similar Documents

Publication Publication Date Title
CN101980336B (zh) 一种基于隐马尔可夫模型的汽车声音识别方法
CN103236260B (zh) 语音识别系统
CN103065627B (zh) 基于dtw与hmm证据融合的特种车鸣笛声识别方法
CN103280220B (zh) 一种实时的婴儿啼哭声识别方法
CN104835498A (zh) 基于多类型组合特征参数的声纹识别方法
CN108597505B (zh) 语音识别方法、装置及终端设备
CN103310789B (zh) 一种基于改进的并行模型组合的声音事件识别方法
CN109192200B (zh) 一种语音识别方法
CN110197670A (zh) 音频降噪方法、装置及电子设备
CN107886943A (zh) 一种声纹识别方法及装置
CN102664010B (zh) 一种基于多因素频率位移不变特征的鲁棒说话人辨别方法
CN102789779A (zh) 一种语音识别系统及其识别方法
WO2012075641A1 (en) Device and method for pass-phrase modeling for speaker verification, and verification system
CN104900235A (zh) 基于基音周期混合特征参数的声纹识别方法
CN104978507A (zh) 一种基于声纹识别的智能测井评价专家系统身份认证方法
CN103824557A (zh) 一种具有自定义功能的音频检测分类方法
CN110176250B (zh) 一种基于局部学习的鲁棒声学场景识别方法
CN113823293B (zh) 一种基于语音增强的说话人识别方法及系统
CN105679312A (zh) 一种噪声环境下声纹识别的语音特征处理方法
CN104732972A (zh) 一种基于分组统计的hmm声纹识别签到方法及系统
CN107103913B (zh) 一种基于功率谱Gabor特征序列递归模型的语音识别方法
CN115841821A (zh) 一种基于人类语音结构的语音干扰噪声设计方法
CN110718229A (zh) 录音回放攻击的检测方法及对应检测模型的训练方法
CN118098247A (zh) 一种基于并行特征提取模型的声纹识别方法和系统
Kamble et al. Teager energy subband filtered features for near and far-field automatic speech recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: FUJIAN STARNET E-VIDEO INFORMATION SYSTEM CO., LTD

Free format text: FORMER NAME: FUZHOU STARNET EVIDEO INFORMATION SYSTEM CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Cangshan District of Fuzhou City, Fujian province 350000 to build a new town, Jinshan Road No. 618, juyuanzhou Industrial Park No. 19 building one or two layer

Patentee after: Fujian Starnet e-Video Information System Co., Ltd.

Address before: Cangshan District of Fuzhou City, Fujian province 350000 to build a new town, Jinshan Road No. 618, juyuanzhou Industrial Park No. 19 building one or two layer

Patentee before: Fuzhou Starnet Evideo Information System Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120111

Termination date: 20201018

CF01 Termination of patent right due to non-payment of annual fee