CN101404160A - 一种基于音频识别的语音降噪方法 - Google Patents

一种基于音频识别的语音降噪方法 Download PDF

Info

Publication number
CN101404160A
CN101404160A CNA2008102269515A CN200810226951A CN101404160A CN 101404160 A CN101404160 A CN 101404160A CN A2008102269515 A CNA2008102269515 A CN A2008102269515A CN 200810226951 A CN200810226951 A CN 200810226951A CN 101404160 A CN101404160 A CN 101404160A
Authority
CN
China
Prior art keywords
noise
signal
speech
voice
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008102269515A
Other languages
English (en)
Other versions
CN101404160B (zh
Inventor
郝红卫
高玉峰
温博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN2008102269515A priority Critical patent/CN101404160B/zh
Publication of CN101404160A publication Critical patent/CN101404160A/zh
Application granted granted Critical
Publication of CN101404160B publication Critical patent/CN101404160B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提出了一种基于音频识别的语音降噪方法,针对复杂噪声环境下的语音通信在接收端进行降噪处理,属于计算机科学技术领域。现有降噪方法多数只适用于噪声平稳环境,对于复杂的噪声环境,特别是突变性噪声频繁等情况难以有效去除。本方法将模式识别思想引入通信语音降噪,把音频信号分成语音和非语音,通过提取语音特征和设计分类器模型,对输入信号进行自动识别,判断音频类型,如果是噪音则去除,如果是语音则予以保留并进一步处理。该方法在取得较好降噪效果的同时满足了实时性要求,可以适用于载人航天试验语音通信、施工现场、战场等其它通信环境复杂的情况,为信号降噪提供了一种思路和方法。

Description

一种基于音频识别的语音降噪方法
技术领域
本发明提出了一种语音降噪方法——基于音频识别的语音降噪,针对复杂噪声环境下的语音通信在接收端进行降噪处理。本方法将模式识别思想引入通信语音降噪,能有效去处混杂在语音信号间歇的不规则突发性噪声,对复杂环境具有较好的适应能力,可以应用于载人航天试验语音通信、施工现场、战场等其它突发性噪声频繁、环境复杂、通信信道干扰较大的情况,为信号降噪提供了一种思路和方法。
背景技术
无线语音降噪技术是指当无线语音信号在传输的过程中被各种各样的噪声干扰后,从噪声背景中提取、增强有用的语音信号,降低噪声干扰的技术,是无线语音通信中确保语音质量的重要技术手段。信号接收端的通信语音降噪主要是指在时域、频域和其他变换域进行信号分析,通过找出语音和噪音的不同之处进行降噪。经常使用的方法主要有设计带通滤波器、噪声补偿算法等,这类方法对于噪声平稳环境效果较好。对于有色噪声,即在某个频带上的信号能量突然变大,通过设置上下门限滤波可以达到去除噪声的目的。然而在许多实际情况中,噪声并不是单一的,往往是多种噪声混杂在一起,这些噪音具有频繁突发性和不确定性的特点。很多噪音能量较大,已经部分或完全覆盖语音信号,即具有噪音的特点,又具有语音的特点,在时域分布上与语音信号能量相当,在频域分布上和语音信号基本一致。例如载人航天试验通信语音中,由于宇宙空间和地球大气层环境的复杂,噪声来源广泛、除背景噪音外,在通话的句与句、字与字之间也含有大量不规则噪音,严重干扰了正常的语音通信。对于这类噪声,设计单一的滤波器显然不能满足降噪要求,如果针对每一种可能的噪声都设计相应的滤波器,不仅使系统复杂性大大提高,而且无法保障滤波器之间的协调互补。因此针对噪声突发性频繁的非平稳噪声环境,传统降噪方法已经不能满足要求,需要研究新的降噪方法。
发明内容
针对实际环境中噪声复杂多变、通话间歇噪声能量强、在时域与频域都与语音信号十分相似的特点,本发明将模式识别中音频识别的思想引入通信语音降噪,提出一种噪音去除方法——基于音频识别的语音降噪方法。其核心思想是把音频信号分成语音和非语音,把可分辨语音内容的信号看作是语音,其余看作是非语音,通过提取音频特征和设计分类器模型,对输入信号进行自动识别,判断音频类型,如果是噪音则去除,如果是语音则予以保留并进一步处理。该方法的主要步骤包括:信号输入及预处理、特征提取、音频信号分类、信号去噪是其中的核心部分,下面详细介绍基于音频识别的语音降噪方法,具体如下:
步骤一.信号输入及预处理:获取原始输入信号,对原始信号进行分帧、加窗处理。
步骤二.特征提取:有效的音频信号特征是识别语音和噪音的关键,提取有效的语音特征可以对复杂的音频信号具有很好的鲁棒性。除了单一特征参数的区分能力外,更重要的是要它们的互补性。本方法主要采用以下特征:
(1)Mel倒谱系数(MFCC)及其一阶差分
人的听觉系统是一个特殊的非线性系统,它响应不同频率信号的灵敏度是不同的,MFCC对频率轴进行不均匀划分,是一种将人耳的听觉感知特性和语音的产生机制相结合的特征参数。标准的MFCC参数只反映了语音参数的静态特性,而人耳对语音的动态特征更为敏感,通常用差分倒谱参数来描述这种动态特性。
(2)子频带能量分布
在一帧音频信号之内,每个子频带的功率谱能量占该帧整个频带的功率普能量的比率是不同的,由此构成一种分布,称之为子频带能量分布。
步骤三.音频信号分类:设计合适的分类器有利于正确识别语音和噪声。设计分类器包括选择适当的分类器模型,根据所选定的特征设计分类器,使用大量的样本确定分类器的参数。分类器的设计必须满足以下条件:当噪声特征与人说话声特征相似度很高时,做最小损失处理(保证有效信息的完整性)。在分类器设计完成之后,就可将其应用于语音和噪声的分类。
根据信号降噪的实时性要求,这里选用K近邻(K-nearest neighbor,KNN)的分类方法。KNN分类法是典型的统计模式识别方法,即使样本是非正态分布,也可以取得较好的分类正确率。首先建立语音和噪音的训练样本库,训练样本用n维特征描述,每个样本代表n维空间的一个点。这样,所有的训练样本都存放在n维模式空间中,当给定一个未知样本时,KNN算法搜索模式空间,找出最接近该未知样本的K个训练样本,这K个训练样本就是未知样本的K个“最近邻”,通常这K个近邻会属于不同的类别,哪个类别中所含近邻数最多,就将未知样本判定为该类别,其中K的大小根据具体应用环境选择。由于此分类算法在训练阶段不需要首先建立模型,只是将训练数据存储进数据库中,几乎没有计算开销,因此时间开销相对来说比较小。
步骤四.信号去噪:根据分类的结果,对信号进行相应处理,保留语音,去除噪声,最终得到高质量的语音信号。
为了提高分类的准确程度,保留更多的语音信息,提出一种二次分类方法对上述语噪识别方法进行改进,当音频信号输入时,为输入设置一定的步长,只有当两次都分类为噪音时才去除重叠的部分。
语音信号特征提取对声音片段长度有一定的要求,过短的声音片段会由于数据量过小而不能充分反映语音特征本质,而过长的声音片段虽然会提高分类的准确率,然而却不能达到实时性的要求。语音信号处理中一般取20ms~30ms为一帧,本发明取10帧为输入单位,时长为0.2s~0.3s,这样即保证了有足够长的声音片断用于提取信号特征,又保证了实时性的要求。在绝大多数情况下,语音信号中一个字的长度要大于5帧,而短促的噪音则有可能小于或等于5帧,所以取5帧为降噪单位。
通过二次分类,能够提高分类准确率,有效去处更多短促的噪音,尽可能完整的保留更多的语音信息,提高了语音信息的完整性,同时在去除噪音和实时性要求方面又达到了较为理想的效果。
附图说明
图1:系统示意图:音频信号输入系统后,经过信号识别输出识别结果。若分类为语音,则经过信号增强后输出;若分类为噪音,则经过信号降噪后输出。
图2:分类器训练:依次读取语音和噪音的样本,提取音频信号特征参数,包括MFCC及其一阶差分、子频带能量等,进行数据归一化操作,分别保存语音、噪音特征向量参数,构成训练样本特征向量矩阵。
图3:系统流程图:首先读取训练样本特征向量矩阵,然后以5帧为步长,10帧为单位作为输入。通过K近邻分类器判断是语音还是噪音,若为噪音且上次分类也判断为噪音,则将两次都判断为噪音的5帧信号置零,其它情况则前进步长帧后重新输入。
图4:信号识别流程图:将音频信号输入后,首先进行预处理,包括分帧、加窗,然后计算其频谱能量并与阈值进行比较,若不超过则说明为静音帧,前进步长帧后重新输入,否则计算其特征参数,包括MFCC及其一阶差分、子频带能量,进行数据归一化后构成特征向量,分别计算与各类别训练样本特征向量的距离,取k个近邻投票分类,得出音频识别结果。
具体实施方式
按照上述发明内容所述方法,具体实施过程如下:
一.建立训练样本库,依次读取语音和噪音的样本,提取音频信号特征参数,构成训练样本特征向量矩阵。
二.获取输入信号后,以20ms为一帧,对原始信号进行分帧,然后加汉明窗处理。以10帧为单位进行第二步处理,每次步长为5帧。
三.特征提取:本方法主要采用Mel倒谱系数(MFCC)及其一阶差分、子频带能量分布,将计算得到的特征参数构成一维特征向量。具体提取过程如下:
(1)Mel倒谱系数(MFCC)及其一阶差分
①对输入的10帧信号进行离散FFT变换,求出频谱平方,即能量谱。
②设计一个有M个滤波器的滤波器组,M取值为(3*log(fs)),fs为采样频率,采用的滤波器为三角滤波器,中心频率为f(m)(m=1,2,…M),滤波器组中每个三角滤波器的跨度在Mel标度上是相等的,每个滤波器输出的对数能量为: S ( m ) = ln ( &Sigma; k = 0 N - 1 | X ( k ) | 2 ) H m ( k ) , 0 &le; m < M , 用这M个Mel带通滤波器对输入信号进行滤波。
③将每个滤波器的输出取对数,得到相应频带的对数功率谱,经离散余弦变换得到MFCC系数: C ( n ) = &Sigma; m = 0 M - 1 S ( m ) cos ( &pi;n ( m - 0.5 ) / M ) , 0 &le; n < M .
④差分参数的计算采用下面的公式: d ( n ) = 1 &Sigma; i = - k k i 2 &Sigma; i = - k k i &CenterDot; c ( n + i ) .
这里c和d都表示一帧语音参数,k为常数,通常取2,这时差分参数就称为当前帧的前两帧和后两帧的参数组合。由此式计算得到的差分参数为一阶MFCC参数。
(2)子频带能量分布
第n帧的整个频带的功率谱能量可以表示如下: E n = &Integral; 0 &omega; 0 | F ( &omega; ) | 2 d&omega; , 其中F(ω)是快速傅立叶变换函数,ω0是信号采样频率的一半。每个子频带的子频带能量分布用如下公式表示:
SED ( n ) = 1 E n &Integral; L j H j | F ( &omega; ) | 2 d&omega; .
四.音频信号分类:根据信号降噪的实时性要求,这里选用K近邻的分类方法。读取训练样本特征向量矩阵,分别计算上一步得到的特征向量与各类别训练样本特征向量的距离,取k个近邻(k取奇数)投票分类,得出音频识别结果。样本之间的距离采用欧几里德距离,即两个点di=(wi1,wi2,...,win)和di=(wj1,wj2,...,wjn)之间的欧几里德距离为:
sim ( d i , d j ) = &Sigma; k = 1 n ( w ik - w jk ) 2 .
若为噪音且上次分类也判断为噪音,则将两次都判断为噪音的5帧信号置零,其它情况则前进5帧后重新输入。
五.信号去噪:根据分类结果,将噪声帧时域能量置为零,将语音帧输出。

Claims (2)

1、一种基于音频识别的语音降噪方法,其特征在于:方法包括信号输入及预处理、特征提取、音频信号分类、信号去噪四步骤组成;
步骤一、信号输入及预处理:获取原始输入信号,对原始信号进行分帧、加窗处理;
步骤二、特征提取:采用Mel倒谱系数及其一阶差分、子频带能量分布对音频信号提取有效的语音特征;
步骤三、音频信号分类:选用K近邻分类方法对音频信号进行分类;
步骤四、信号去噪:采用二次分类对语噪识别方法进行改进,当音频信号输入时,为输入设置步长,当两次都分类为噪音时去除重叠的部分。
2、如权利要求1所述的基于音频识别的语音降噪方法,其特征在于所述的步骤四的步长取10帧为输入单位,时长为0.2s~0.3s,降噪单位为5帧。
CN2008102269515A 2008-11-21 2008-11-21 一种基于音频识别的语音降噪方法 Expired - Fee Related CN101404160B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102269515A CN101404160B (zh) 2008-11-21 2008-11-21 一种基于音频识别的语音降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102269515A CN101404160B (zh) 2008-11-21 2008-11-21 一种基于音频识别的语音降噪方法

Publications (2)

Publication Number Publication Date
CN101404160A true CN101404160A (zh) 2009-04-08
CN101404160B CN101404160B (zh) 2011-05-04

Family

ID=40538151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102269515A Expired - Fee Related CN101404160B (zh) 2008-11-21 2008-11-21 一种基于音频识别的语音降噪方法

Country Status (1)

Country Link
CN (1) CN101404160B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324229A (zh) * 2011-09-08 2012-01-18 中国科学院自动化研究所 语音输入设备使用异常的检测方法及系统
CN102483916A (zh) * 2009-08-28 2012-05-30 国际商业机器公司 声音特征量提取装置、声音特征量提取方法及声音特征量提取程序
CN103366758A (zh) * 2012-03-31 2013-10-23 多玩娱乐信息技术(北京)有限公司 一种移动通信设备的语音降噪方法和装置
CN103578470A (zh) * 2012-08-09 2014-02-12 安徽科大讯飞信息科技股份有限公司 一种电话录音数据的处理方法及系统
CN103745729A (zh) * 2013-12-16 2014-04-23 深圳百科信息技术有限公司 一种音频去噪方法和系统
CN104064197A (zh) * 2014-06-20 2014-09-24 哈尔滨工业大学深圳研究生院 一种基于语音帧间动态信息提高语音识别鲁棒性的方法
CN104766462A (zh) * 2014-12-29 2015-07-08 深圳市欧润特科技有限公司 一种声波遥控系统以及声波遥控方法
CN106340303A (zh) * 2016-09-20 2017-01-18 南京朗逸锐科电子科技有限公司 一种基于时间频率域的语音降噪方法
WO2017162017A1 (zh) * 2016-03-25 2017-09-28 腾讯科技(深圳)有限公司 语音数据处理方法、装置和存储介质
CN107452401A (zh) * 2017-05-27 2017-12-08 北京字节跳动网络技术有限公司 一种广告语音识别方法及装置
CN108022584A (zh) * 2017-11-29 2018-05-11 芜湖星途机器人科技有限公司 办公室语音识别优化方法
CN108133712A (zh) * 2016-11-30 2018-06-08 华为技术有限公司 一种处理音频数据的方法和装置
CN108172220A (zh) * 2018-02-22 2018-06-15 成都启英泰伦科技有限公司 一种新型语音除噪方法
CN108881652A (zh) * 2018-07-11 2018-11-23 北京大米科技有限公司 回音检测方法、存储介质和电子设备
CN108986830A (zh) * 2018-08-28 2018-12-11 安徽淘云科技有限公司 一种音频语料筛选方法及装置
CN109645957A (zh) * 2018-12-21 2019-04-19 南京理工大学 一种鼾声来源分类方法
CN110085251A (zh) * 2019-04-26 2019-08-02 腾讯音乐娱乐科技(深圳)有限公司 人声提取方法、人声提取装置及相关产品
CN110110038A (zh) * 2018-08-17 2019-08-09 平安科技(深圳)有限公司 话务预测方法、装置、服务器及存储介质
WO2019210605A1 (zh) * 2018-05-04 2019-11-07 歌尔科技有限公司 一种降噪处理方法、装置和耳机
CN110473566A (zh) * 2019-07-25 2019-11-19 深圳壹账通智能科技有限公司 音频分离方法、装置、电子设备及计算机可读存储介质
CN110634497A (zh) * 2019-10-28 2019-12-31 普联技术有限公司 降噪方法、装置、终端设备及存储介质
CN110910906A (zh) * 2019-11-12 2020-03-24 国网山东省电力公司临沂供电公司 基于电力内网的音频端点检测及降噪方法
CN110930987A (zh) * 2019-12-11 2020-03-27 腾讯科技(深圳)有限公司 音频处理方法、装置和存储介质
CN111354162A (zh) * 2020-03-07 2020-06-30 深圳市松恩电子科技有限公司 驾驶员健康疲劳与预防监测系统
CN111385688A (zh) * 2018-12-29 2020-07-07 安克创新科技股份有限公司 一种基于深度学习的主动降噪方法、装置及系统
CN111768801A (zh) * 2020-06-12 2020-10-13 瑞声科技(新加坡)有限公司 气流杂音消除方法、装置、计算机设备及存储介质
CN111933175A (zh) * 2020-08-06 2020-11-13 北京中电慧声科技有限公司 一种基于噪声场景识别的活动语音检测方法及系统
CN112382282A (zh) * 2020-11-06 2021-02-19 北京五八信息技术有限公司 一种语音去噪处理方法、装置、电子设备及存储介质
CN113870884A (zh) * 2021-12-01 2021-12-31 全时云商务服务股份有限公司 单麦克风噪声抑制方法和装置

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102483916A (zh) * 2009-08-28 2012-05-30 国际商业机器公司 声音特征量提取装置、声音特征量提取方法及声音特征量提取程序
CN102483916B (zh) * 2009-08-28 2014-08-06 国际商业机器公司 声音特征量提取装置和声音特征量提取方法
CN102324229B (zh) * 2011-09-08 2012-11-28 中国科学院自动化研究所 语音输入设备使用异常的检测方法及系统
CN102324229A (zh) * 2011-09-08 2012-01-18 中国科学院自动化研究所 语音输入设备使用异常的检测方法及系统
CN103366758B (zh) * 2012-03-31 2016-06-08 欢聚时代科技(北京)有限公司 一种移动通信设备的语音降噪方法和装置
CN103366758A (zh) * 2012-03-31 2013-10-23 多玩娱乐信息技术(北京)有限公司 一种移动通信设备的语音降噪方法和装置
CN103578470A (zh) * 2012-08-09 2014-02-12 安徽科大讯飞信息科技股份有限公司 一种电话录音数据的处理方法及系统
CN103578470B (zh) * 2012-08-09 2019-10-18 科大讯飞股份有限公司 一种电话录音数据的处理方法及系统
CN103745729B (zh) * 2013-12-16 2017-01-04 深圳百科信息技术有限公司 一种音频去噪方法和系统
CN103745729A (zh) * 2013-12-16 2014-04-23 深圳百科信息技术有限公司 一种音频去噪方法和系统
CN104064197A (zh) * 2014-06-20 2014-09-24 哈尔滨工业大学深圳研究生院 一种基于语音帧间动态信息提高语音识别鲁棒性的方法
CN104064197B (zh) * 2014-06-20 2017-05-17 哈尔滨工业大学深圳研究生院 一种基于语音帧间动态信息提高语音识别鲁棒性的方法
CN104766462A (zh) * 2014-12-29 2015-07-08 深圳市欧润特科技有限公司 一种声波遥控系统以及声波遥控方法
US10692503B2 (en) 2016-03-25 2020-06-23 Tencent Technology (Shenzhen) Company Limited Voice data processing method, apparatus and storage medium
WO2017162017A1 (zh) * 2016-03-25 2017-09-28 腾讯科技(深圳)有限公司 语音数据处理方法、装置和存储介质
CN106340303A (zh) * 2016-09-20 2017-01-18 南京朗逸锐科电子科技有限公司 一种基于时间频率域的语音降噪方法
CN108133712A (zh) * 2016-11-30 2018-06-08 华为技术有限公司 一种处理音频数据的方法和装置
CN107452401A (zh) * 2017-05-27 2017-12-08 北京字节跳动网络技术有限公司 一种广告语音识别方法及装置
CN108022584A (zh) * 2017-11-29 2018-05-11 芜湖星途机器人科技有限公司 办公室语音识别优化方法
CN108172220A (zh) * 2018-02-22 2018-06-15 成都启英泰伦科技有限公司 一种新型语音除噪方法
US11328705B2 (en) 2018-05-04 2022-05-10 Goertek Technology Co., Ltd. Noise-reduction processing method and device, and earphones
WO2019210605A1 (zh) * 2018-05-04 2019-11-07 歌尔科技有限公司 一种降噪处理方法、装置和耳机
CN108881652A (zh) * 2018-07-11 2018-11-23 北京大米科技有限公司 回音检测方法、存储介质和电子设备
CN110110038A (zh) * 2018-08-17 2019-08-09 平安科技(深圳)有限公司 话务预测方法、装置、服务器及存储介质
CN108986830A (zh) * 2018-08-28 2018-12-11 安徽淘云科技有限公司 一种音频语料筛选方法及装置
CN109645957A (zh) * 2018-12-21 2019-04-19 南京理工大学 一种鼾声来源分类方法
CN111385688A (zh) * 2018-12-29 2020-07-07 安克创新科技股份有限公司 一种基于深度学习的主动降噪方法、装置及系统
CN110085251A (zh) * 2019-04-26 2019-08-02 腾讯音乐娱乐科技(深圳)有限公司 人声提取方法、人声提取装置及相关产品
CN110085251B (zh) * 2019-04-26 2021-06-25 腾讯音乐娱乐科技(深圳)有限公司 人声提取方法、人声提取装置及相关产品
CN110473566A (zh) * 2019-07-25 2019-11-19 深圳壹账通智能科技有限公司 音频分离方法、装置、电子设备及计算机可读存储介质
CN110634497B (zh) * 2019-10-28 2022-02-18 普联技术有限公司 降噪方法、装置、终端设备及存储介质
CN110634497A (zh) * 2019-10-28 2019-12-31 普联技术有限公司 降噪方法、装置、终端设备及存储介质
CN110910906A (zh) * 2019-11-12 2020-03-24 国网山东省电力公司临沂供电公司 基于电力内网的音频端点检测及降噪方法
US11948597B2 (en) 2019-12-11 2024-04-02 Tencent Technology (Shenzhen) Company Limited Audio processing method and apparatus, electronic device, and storage medium
CN110930987B (zh) * 2019-12-11 2021-01-08 腾讯科技(深圳)有限公司 音频处理方法、装置和存储介质
CN110930987A (zh) * 2019-12-11 2020-03-27 腾讯科技(深圳)有限公司 音频处理方法、装置和存储介质
CN111354162A (zh) * 2020-03-07 2020-06-30 深圳市松恩电子科技有限公司 驾驶员健康疲劳与预防监测系统
WO2021248523A1 (zh) * 2020-06-12 2021-12-16 瑞声声学科技(深圳)有限公司 气流杂音消除方法、装置、计算机设备及存储介质
CN111768801A (zh) * 2020-06-12 2020-10-13 瑞声科技(新加坡)有限公司 气流杂音消除方法、装置、计算机设备及存储介质
CN111933175A (zh) * 2020-08-06 2020-11-13 北京中电慧声科技有限公司 一种基于噪声场景识别的活动语音检测方法及系统
CN111933175B (zh) * 2020-08-06 2023-10-24 北京中电慧声科技有限公司 一种基于噪声场景识别的活动语音检测方法及系统
CN112382282A (zh) * 2020-11-06 2021-02-19 北京五八信息技术有限公司 一种语音去噪处理方法、装置、电子设备及存储介质
CN113870884A (zh) * 2021-12-01 2021-12-31 全时云商务服务股份有限公司 单麦克风噪声抑制方法和装置
CN113870884B (zh) * 2021-12-01 2022-03-08 全时云商务服务股份有限公司 单麦克风噪声抑制方法和装置

Also Published As

Publication number Publication date
CN101404160B (zh) 2011-05-04

Similar Documents

Publication Publication Date Title
CN101404160B (zh) 一种基于音频识别的语音降噪方法
CN107680582B (zh) 声学模型训练方法、语音识别方法、装置、设备及介质
CN109637545B (zh) 基于一维卷积非对称双向长短时记忆网络的声纹识别方法
CN103559879B (zh) 语种识别系统中声学特征提取方法及装置
DE112017003563T5 (de) Verfahren und system einer automatischen spracherkennung unter verwendung a-posteriori-vertrauenspunktzahlen
CN110782872A (zh) 基于深度卷积循环神经网络的语种识别方法及装置
CN104200804A (zh) 一种面向人机交互的多类信息耦合的情感识别方法
CN103065629A (zh) 一种仿人机器人的语音识别系统
CN109522392A (zh) 基于语音的检索方法、服务器及计算机可读存储介质
DE102020202489A1 (de) Verfahren und system zur sehr genauen schlüsselausdruckserkennung für vorrichtung mit geringen ressourcen
CN111243602A (zh) 基于性别、国籍和情感信息的声纹识别方法
CN101710490A (zh) 语音评测的噪声补偿方法及装置
CN110019741B (zh) 问答系统答案匹配方法、装置、设备及可读存储介质
CN111724770B (zh) 一种基于深度卷积生成对抗网络的音频关键词识别方法
CN105374352A (zh) 一种语音激活方法及系统
CN109243497A (zh) 语音唤醒的控制方法及装置
CN102810311A (zh) 说话人估计方法和说话人估计设备
CN111986661A (zh) 复杂环境下基于语音增强的深度神经网络语音识别方法
CN116110405B (zh) 一种基于半监督学习的陆空通话说话人识别方法及设备
CN106033669A (zh) 语音识别方法及装置
CN112183582A (zh) 一种多特征融合的水下目标识别方法
CN112562725A (zh) 基于语谱图和胶囊网络的混合语音情感分类方法
CN108806725A (zh) 语音区分方法、装置、计算机设备及存储介质
CN115132196A (zh) 语音指令识别的方法、装置、电子设备及存储介质
CN110390929A (zh) 基于cdnn-hmm的中英文民航陆空通话声学模型构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110504

Termination date: 20131121