CN101587712A - 一种基于小型麦克风阵列的定向语音增强方法 - Google Patents

一种基于小型麦克风阵列的定向语音增强方法 Download PDF

Info

Publication number
CN101587712A
CN101587712A CNA2008101121953A CN200810112195A CN101587712A CN 101587712 A CN101587712 A CN 101587712A CN A2008101121953 A CNA2008101121953 A CN A2008101121953A CN 200810112195 A CN200810112195 A CN 200810112195A CN 101587712 A CN101587712 A CN 101587712A
Authority
CN
China
Prior art keywords
signal
omega
enhancement method
utilize
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101121953A
Other languages
English (en)
Other versions
CN101587712B (zh
Inventor
颜永红
付强
张恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Beijing Kexin Technology Co Ltd
Original Assignee
Institute of Acoustics CAS
Beijing Kexin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Beijing Kexin Technology Co Ltd filed Critical Institute of Acoustics CAS
Priority to CN2008101121953A priority Critical patent/CN101587712B/zh
Publication of CN101587712A publication Critical patent/CN101587712A/zh
Application granted granted Critical
Publication of CN101587712B publication Critical patent/CN101587712B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤:1)利用两个全指向性麦克风采集声音信号;2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);3)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω);4)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);5)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω),,其中Gm为预设的增益最小值;6)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。本发明能够在很小的体积内,实现定向语音增强算法;并且能够获得更大程度的抑制噪声,提高信噪比。

Description

一种基于小型麦克风阵列的定向语音增强方法
技术领域
本发明涉及语音处理技术领域,具体的说,本发明特别涉及一种基于麦克风阵列的定向语音增强方法。
背景技术
语音信号的增强和噪声的消除问题,一直以来都是研究的热点。针对这一问题,已经存在很多基于麦克风阵列的算法,实现加强语音信号,同时抑制干扰(包括各类噪声和其他语音)的效果。麦克风阵列一般体积较大,难以用于在便携式设备(如手机等)。Elko和Luo等人提出和发展了自适应谷点形成算法(Elko and Nguyen,A steerable and variable first-orderdifferential microphone array,ICASSP,1997;Luo,et al.Adaptivenull-forming scheme in digital hearing aids,IEEE Trans.Signal Processing,2002),可以在小尺度阵列上实现定向语音增强,但去噪程度有限。另外,后滤波算法在大尺度阵列上已经得到广泛运用,效果显著。但由于小阵列的麦克风间距有限,噪声相关性较大,基于相关函数的后滤波难以得到运用。
发明内容
本发明的目的在于克服已有的定向语音增强方法的不足,将自适应谷点形成算法与概率控制的后滤波算法相结合,提出一种适于便携设备的定向语音增强方法,该方法能否在很小的尺度下实现较强的消噪能力,克服了基于相关函数的后滤波器在较小阵列中难以得到应用的缺点。
为实现上述发明目的,本发明提供的基于小型麦克风阵列的定向语音增强方法,包括如下步骤:
1)利用两个全指向性麦克风采集声音信号;
2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω);
3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);
4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω), G ( ω ) = ( G ′ ( ω ) ) P ( ω ) G m 1 - P ( ω ) , 其中Gm为预设的增益最小值;
5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。
上述技术方案中,所述步骤2)包括如下子步骤:
21)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
22)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)。
上述技术方案中,所述步骤1)中,所述两个麦克风且呈端射式排布,所采集声音信号包括fore(t)和back(t)信号,fore(t)为离说话人较近的麦克风收到的信号,back(t)为离说话人较远的麦克风收到的信号。
上述技术方案中,所述两个麦克风间距d为2cm-5cm。
上述技术方案中,所述步骤21)中,对fore(t)和back(t)进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
x(t)=fore(t)-back(t-d/c)
y(t)=fore(t-d/c)-back(t)
式中,c为声波的传输速度;
z(t)是以y(t)做为参考信号,对x(t)进行自适应滤波后得到的信号。
上述技术方案中,所述步骤3)中,所述单通道语音增强方法可采用谱减法,维纳滤波法或EM方法。
上述技术方案中,所述步骤4)中,还包括对G(ω)进行分区间地进一步修正;
G ( ω ) = G m , G ′ ( ω ) ≤ G m G ′ ( ω ) , G ′ ( ω ) > G m andP ( ω ) > P 1 ( G ′ ( ω ) ) P ( ω ) G m 1 - P ( ω ) , otherwise .
式中,Gm为预设的增益最小值,P1是目标信号存在概率的门限值。
上述技术方案中,所述增益最小值Gm取值在0.01-0.1之间,所述目标信号存在概率的门限值P1的取值在0.85-0.95之间。
本发明的技术效果包括:将自适应谷点形成和概率控制后滤波算法的相结合,在很小的体积内,实现了定向语音增强算法;并且能够获得更大程度的抑制噪声,提高信噪比。概率控制的后滤波算法的主旨是估算出目标信号在各个频率点上是否存在及存在的可能性有多大,藉以决定算法在该频率点上的降噪策略,这种降噪策略特别适合于小尺度的情况。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1是本发明中麦克风摆放和自适应谷点形成示意图;
图2是本发明中的概率控制后滤波算法示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步地描述。
如图1所示,双麦克风接收到的立体声信号先经过延迟相减,将其结果x(t)和y(t)每32ms作为一帧,计算自适应滤波器系数w(n),其中n为帧序号。如果一帧信号包含的采样点数为L,则自适应滤波器系数可由下式求得:
w ( n ) = αw ( n - 1 ) + ( 1 - α ) Σ t = 0 L - 1 x ( nL - L + t ) y ( nL - L + t ) Σ t = 0 L - 1 y ( nL - L + t ) 2
式中α=0.9。
第n帧的滤波结果可计算为:
z(nL-L+t)=x(nL-L+t)-W(n)y(nL-L+t)  t=0,1,...,L-1
将z(t)和y(t)重新组帧,帧长为32ms,相邻帧重叠50%帧长,第n帧信号分别记作zn(t)和yn(t),对其加窗并进行快速傅立叶变换(即短时傅立叶分析),得第n帧语谱,如图2所示。
STFT[zn(t)]=Zn(ω)
STFT[yn(t)]=Yn(ω)
用IMCRA方法(Cohen,Noise spectrum estimation in adverseenvironments:improved minima controlled recursive averaging,IEEETrans.Speech and Audio processing)计算出Zn(ω)和Yn(ω)中的噪声分量Nn Z(ω)和Nn Y(ω)。随后通过分析Zn(ω)、Yn(ω)、Nn Z(ω)和Nn Y(ω),计算出初步增益G′n(ω)和目标语音存在概率Pn(ω)(Cohen and Berdugo,Two-channel signaldetection and speech enhancement based on the transientbeam-to-reference ratio,ICASSP 2003)。其中,初步增益G′n(ω)可由各种单通道语音增强方法(如谱减法,维纳滤波法,EM方法等)得到,本实施例中采用EM方法计算初步增益G′n(ω)。目标语音存在概率Pn(ω)表征的是各频点上目标语音成份存在的可能性。本发明中利用该目标语音存在概率Pn(ω)对初步增益G′n(ω)进行修正,从而得出用于增强的最终增益。修正方法如下式所示:
G n ( ω ) = G m , G n ′ ( ω ) ≤ G m G n ′ ( ω ) , G n ′ ( ω ) > G m and P n ( ω ) > P 1 ( G n ′ ( ω ) ) P ( ω ) G m 1 - P ( ω ) , otherwise .
上式中,Gm为增益的最小值,取值在0.01-0.1之间,P1是存在概率的门限值,取值在0.85-0.95之间。对Gn(ω)的分段处理可以使其取值在合理的区间范围内,减少算法对语音信号产生的失真。
得到最终增益Gn(ω)后,即可对Zn(ω)进行增强,如下式所示:
Rn(ω)=Gn(ω)·Zn(ω)
对Rn(ω)做逆傅立叶变换(IFFT),得到该帧的时域信号rn(t)。对照相邻帧的重叠量,进行帧间叠接相加,最终得到增强后的语音信号r(t)。
本发明在很小的体积内,实现了定向语音增强算法,很大程度地抑制了噪声,提高了信噪比和听觉舒适度。
为证明本方法的有效性,对同一组带噪语音(两个干扰源,其一为干扰说话人,另一个为音乐,信噪比由-10dB到10dB)进行处理,噪声去除量(NoiseReduction)如下表(单位:dB):
去噪能力提升均在16dB以上。

Claims (8)

1.一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤:
1)利用两个全指向性麦克风采集声音信号;
2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω);
3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);
4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω), G ( ω ) = ( G ′ ( ω ) ) P ( ω ) G m 1 - P ( ω ) , 其中Gm为预设的增益最小值;
5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。
2.根据权利要求1所述的定向语音增强方法,其特征在于,所述步骤2)包括如下子步骤:
21)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
22)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)。
3.根据权利要求2所述的定向语音增强方法,其特征在于,所述步骤1)中,所述两个麦克风且呈端射式排布,所采集声音信号包括fore(t)和back(t)信号,fore(t)为离说话人较近的麦克风收到的信号,back(t)为离说话人较远的麦克风收到的信号。
4.根据权利要求3所述的定向语音增强方法,其特征在于,所述两个麦克风间距d为2cm-5cm。
5.根据权利要求3所述的定向语音增强方法,其特征在于,所述步骤21)中,对fore(t)和back(t)进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
x(t)=fore(t)-back(t-d/c)
y(t)=fore(t-d/c)-back(t)
式中,c为声波的传输速度;
z(t)是以y(t)做为参考信号,对x(t)进行自适应滤波后得到的信号。
6.根据权利要求1所述的定向语音增强方法,其特征在于,所述步骤3)中,所述单通道语音增强方法可采用谱减法,维纳滤波法或EM方法。
7.根据权利要求1所述的定向语音增强方法,其特征在于,所述步骤4)中,还包括对G(ω)进行分区间地进一步修正;
G ( ω ) = G m , G ′ ( ω ) ≤ G m G ′ ( ω ) , G ′ ( ω ) > G m and P ( ω ) > P 1 ( G ′ ( ω ) ) P ( ω ) G m 1 - P ( ω ) , otherwise .
式中,Gm为预设的增益最小值,P1是目标信号存在概率的门限值。
8.根据权利要求7所述的定向语音增强方法,其特征在于,所述增益最小值Gm取值在0.01-0.1之间,所述目标信号存在概率的门限值P1的取值在0.85-0.95之间。
CN2008101121953A 2008-05-21 2008-05-21 一种基于小型麦克风阵列的定向语音增强方法 Expired - Fee Related CN101587712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101121953A CN101587712B (zh) 2008-05-21 2008-05-21 一种基于小型麦克风阵列的定向语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101121953A CN101587712B (zh) 2008-05-21 2008-05-21 一种基于小型麦克风阵列的定向语音增强方法

Publications (2)

Publication Number Publication Date
CN101587712A true CN101587712A (zh) 2009-11-25
CN101587712B CN101587712B (zh) 2011-09-14

Family

ID=41371930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101121953A Expired - Fee Related CN101587712B (zh) 2008-05-21 2008-05-21 一种基于小型麦克风阵列的定向语音增强方法

Country Status (1)

Country Link
CN (1) CN101587712B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807404A (zh) * 2010-03-04 2010-08-18 清华大学 一种电子耳蜗前端指向性语音增强的预处理系统
CN101959099A (zh) * 2010-04-12 2011-01-26 瑞声声学科技(深圳)有限公司 指向性麦克风装置
WO2011079716A1 (zh) * 2009-12-28 2011-07-07 歌尔声学股份有限公司 一种使用麦克风阵列的降噪控制方法和装置
CN104754465A (zh) * 2013-12-31 2015-07-01 展讯通信(上海)有限公司 一种自适应信号增强方法和系统
CN105206281A (zh) * 2015-09-14 2015-12-30 胡旻波 基于分布式麦克风阵列网络的语音增强方法
CN107004424A (zh) * 2014-11-06 2017-08-01 沃寇族姆系统有限公司 噪声降低和语音增强的方法、设备和系统
CN109753264A (zh) * 2017-11-08 2019-05-14 阿里巴巴集团控股有限公司 一种任务处理方法和设备
CN112509593A (zh) * 2020-11-17 2021-03-16 北京清微智能科技有限公司 一种语音增强网络模型、单通道的语音增强方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100304666B1 (ko) * 1999-08-28 2001-11-01 윤종용 음성 향상 방법
CN1295678C (zh) * 2004-05-18 2007-01-17 中国科学院声学研究所 子带自适应谷点降噪系统和方法
CN100535992C (zh) * 2005-11-14 2009-09-02 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法
CN100419854C (zh) * 2005-11-23 2008-09-17 北京中星微电子有限公司 一种语音增益因子估计装置和方法
CN100578622C (zh) * 2006-05-30 2010-01-06 北京中星微电子有限公司 一种自适应麦克阵列系统及其语音信号处理方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011079716A1 (zh) * 2009-12-28 2011-07-07 歌尔声学股份有限公司 一种使用麦克风阵列的降噪控制方法和装置
US8942976B2 (en) 2009-12-28 2015-01-27 Goertek Inc. Method and device for noise reduction control using microphone array
CN101807404A (zh) * 2010-03-04 2010-08-18 清华大学 一种电子耳蜗前端指向性语音增强的预处理系统
CN101807404B (zh) * 2010-03-04 2012-02-08 清华大学 一种电子耳蜗前端指向性语音增强的预处理系统
CN101959099A (zh) * 2010-04-12 2011-01-26 瑞声声学科技(深圳)有限公司 指向性麦克风装置
CN101959099B (zh) * 2010-04-12 2013-12-25 瑞声声学科技(深圳)有限公司 指向性麦克风装置
CN104754465A (zh) * 2013-12-31 2015-07-01 展讯通信(上海)有限公司 一种自适应信号增强方法和系统
CN104754465B (zh) * 2013-12-31 2018-06-05 展讯通信(上海)有限公司 一种自适应信号增强方法和系统
CN107004424A (zh) * 2014-11-06 2017-08-01 沃寇族姆系统有限公司 噪声降低和语音增强的方法、设备和系统
CN105206281A (zh) * 2015-09-14 2015-12-30 胡旻波 基于分布式麦克风阵列网络的语音增强方法
CN105206281B (zh) * 2015-09-14 2019-02-15 胡旻波 基于分布式麦克风阵列网络的语音增强方法
CN109753264A (zh) * 2017-11-08 2019-05-14 阿里巴巴集团控股有限公司 一种任务处理方法和设备
CN112509593A (zh) * 2020-11-17 2021-03-16 北京清微智能科技有限公司 一种语音增强网络模型、单通道的语音增强方法及系统
CN112509593B (zh) * 2020-11-17 2024-03-08 北京清微智能科技有限公司 一种语音增强网络模型、单通道的语音增强方法及系统

Also Published As

Publication number Publication date
CN101587712B (zh) 2011-09-14

Similar Documents

Publication Publication Date Title
CN101587712B (zh) 一种基于小型麦克风阵列的定向语音增强方法
CN101510426B (zh) 一种噪声消除方法及系统
JP4671303B2 (ja) マイクロホンアレイ用ポストフィルタ
US8010355B2 (en) Low complexity noise reduction method
US20240079021A1 (en) Voice enhancement method, apparatus and system, and computer-readable storage medium
JP5573517B2 (ja) 雑音除去装置および雑音除去方法
CN101976565A (zh) 基于双麦克风语音增强装置及方法
WO2015196729A1 (zh) 一种麦克风阵列语音增强方法及装置
EP2701145A1 (en) Noise estimation for use with noise reduction and echo cancellation in personal communication
US9532149B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
CN102347028A (zh) 双麦克风语音增强装置及方法
CN1953059A (zh) 一种噪声消除装置和方法
CN111081267B (zh) 一种多通道远场语音增强方法
CN102402987A (zh) 噪声抑制装置、噪声抑制方法和程序
US20140307886A1 (en) Method And A System For Noise Suppressing An Audio Signal
US9330677B2 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
JP6083872B2 (ja) マイクロフォン装置から受信した信号において不要な音を減少させるシステムおよび方法
Li et al. A noise reduction system based on hybrid noise estimation technique and post-filtering in arbitrary noise environments
CN111445916B (zh) 一种会议系统中音频去混响方法、装置及存储介质
CN104867498A (zh) 一种移动通讯终端及其语音增强方法和模块
CN110310650A (zh) 一种基于二阶微分麦克风阵列的语音增强算法
JP2012049715A (ja) 音源分離装置、音源分離方法、及び、プログラム
CN111210836A (zh) 一种麦克风阵列波束形成动态调整方法
Esch et al. Combined reduction of time varying harmonic and stationary noise using frequency warping
CN116320947B (zh) 一种应用于助听器的频域双通道语音增强方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110914

CF01 Termination of patent right due to non-payment of annual fee