CN101587712B - 一种基于小型麦克风阵列的定向语音增强方法 - Google Patents
一种基于小型麦克风阵列的定向语音增强方法 Download PDFInfo
- Publication number
- CN101587712B CN101587712B CN2008101121953A CN200810112195A CN101587712B CN 101587712 B CN101587712 B CN 101587712B CN 2008101121953 A CN2008101121953 A CN 2008101121953A CN 200810112195 A CN200810112195 A CN 200810112195A CN 101587712 B CN101587712 B CN 101587712B
- Authority
- CN
- China
- Prior art keywords
- signal
- enhancement method
- omega
- gain
- speech enhancement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000001914 filtration Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 11
- 238000001228 spectrum Methods 0.000 claims abstract description 7
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 5
- 230000005236 sound signal Effects 0.000 claims abstract description 5
- 230000002708 enhancing effect Effects 0.000 claims abstract description 4
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 abstract description 3
- 230000005764 inhibitory process Effects 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明提供一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤:1)利用两个全指向性麦克风采集声音信号;2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);3)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω);4)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);5)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω),其中Gm为预设的增益最小值;6)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。本发明能够在很小的体积内,实现定向语音增强算法;并且能够获得更大程度的抑制噪声,提高信噪比。
Description
技术领域
本发明涉及语音处理技术领域,具体的说,本发明特别涉及一种基于麦克风阵列的定向语音增强方法。
背景技术
语音信号的增强和噪声的消除问题,一直以来都是研究的热点。针对这一问题,已经存在很多基于麦克风阵列的算法,实现加强语音信号,同时抑制干扰(包括各类噪声和其他语音)的效果。麦克风阵列一般体积较大,难以用于在便携式设备(如手机等)。Elko和Luo等人提出和发展了自适应谷点形成算法(Elko and Nguyen,A steerable and variable first-orderdifferential microphone array,ICASSP,1997;Luo,et al.Adaptivenull-forming scheme in digital hearing aids,IEEE Trans.Signal Processing,2002),可以在小尺度阵列上实现定向语音增强,但去噪程度有限。另外,后滤波算法在大尺度阵列上已经得到广泛运用,效果显著。但由于小阵列的麦克风间距有限,噪声相关性较大,基于相关函数的后滤波难以得到运用。
发明内容
本发明的目的在于克服已有的定向语音增强方法的不足,将自适应谷点形成算法与概率控制的后滤波算法相结合,提出一种适于便携设备的定向语音增强方法,该方法能否在很小的尺度下实现较强的消噪能力,克服了基于相关函数的后滤波器在较小阵列中难以得到应用的缺点。
为实现上述发明目的,本发明提供的基于小型麦克风阵列的定向语音增强方法,包括如下步骤:
1)利用两个全指向性麦克风采集声音信号;
2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω);
3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);
4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω), 其中Gm为预设的增益最小值;
5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t)。
上述技术方案中,所述步骤2)包括如下子步骤:
21)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
22)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)。
上述技术方案中,所述步骤1)中,所述两个麦克风且呈端射式排布,所采集声音信号包括fore(t)和back(t)信号,fore(t)为离说话人较近的麦克风收到的信号,back(t)为离说话人较远的麦克风收到的信号。
上述技术方案中,所述两个麦克风间距d为2cm-5cm。
上述技术方案中,所述步骤21)中,对fore(t)和back(t)进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
x(t)=fore(t)-back(t-d/c)
y(t)=fore(t-d/c)-back(t)
式中,c为声波的传输速度;
z(t)是以y(t)做为参考信号,对x(t)进行自适应滤波后得到的信号。
上述技术方案中,所述步骤3)中,所述单通道语音增强方法可采用谱减法,维纳滤波法或EM方法。
上述技术方案中,所述步骤4)中,还包括对G(ω)进行分区间地进一步修正;
式中,Gm为预设的增益最小值,P1是目标信号存在概率的门限值。
上述技术方案中,所述增益最小值Gm取值在0.01-0.1之间,所述目标信号存在概率的门限值P1的取值在0.85-0.95之间。
本发明的技术效果包括:将自适应谷点形成和概率控制后滤波算法的相结合,在很小的体积内,实现了定向语音增强算法;并且能够获得更大程度的抑制噪声,提高信噪比。概率控制的后滤波算法的主旨是估算出目标信号在各个频率点上是否存在及存在的可能性有多大,藉以决定算法在该频率点上的降噪策略,这种降噪策略特别适合于小尺度的情况。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1是本发明中麦克风摆放和自适应谷点形成示意图;
图2是本发明中的概率控制后滤波算法示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步地描述。
如图1所示,双麦克风接收到的立体声信号先经过延迟相减,将其结果x(t)和y(t)每32ms作为一帧,计算自适应滤波器系数w(n),其中n为帧序号。如果一帧信号包含的采样点数为L,则自适应滤波器系数可由下式求得:
式中α=0.9。
第n帧的滤波结果可计算为:
z(nL-L+t)=x(nL-L+t)-W(n)y(nL-L+t) t=0,1,…,L-1
将z(t)和y(t)重新组帧,帧长为32ms,相邻帧重叠50%帧长,第n帧信号分别记作zn(t)和yn(t),对其加窗并进行快速傅立叶变换(即短时傅立叶分析),得第n帧语谱,如图2所示。
STFT[zn(t)]=Zn(ω)
STFT[yn(t)]=Yn(ω)
用IMCRA方法(Cohen,Noise spectrum estimation in adverseenvironments:improved minima controlled recursive averaging,IEEETrans.Speech and Audio processing)计算出Zn(ω)和Yn(ω)中的噪声分量Nn Z(ω)和Nn Y(ω)。随后通过分析Zn(ω)、Yn(ω)、Nn Z(ω)和Nn Y(ω),计算出初步增益Gn′(ω)和目标语音存在概率Pn(ω)(Cohen and Berdugo,Two-channel signaldetection and speech enhancement based on the transientbeam-to-reference ratio,ICASSP 2003)。其中,初步增益Gn′(ω)可由各种单通道语音增强方法(如谱减法,维纳滤波法,EM方法等)得到,本实施例中采用EM方法计算初步增益Gn′(ω)。目标语音存在概率Pn(ω)表征的是各频点上目标语音成份存在的可能性。本发明中利用该目标语音存在概率Pn(ω)对初步增益Gn′(ω)进行修正,从而得出用于增强的最终增益。修正方法如下式所示:
上式中,Gm为增益的最小值,取值在0.01-0.1之间,P1是存在概率的门限值,取值在0.85-0.95之间。对Gn(ω)的分段处理可以使其取值在合理的区间范围内,减少算法对语音信号产生的失真。
得到最终增益Gn(ω)后,即可对Zn(ω)进行增强,如下式所示:
Rn(ω)=Gn(ω)·Zn(ω)
对Rn(ω)做逆傅立叶变换(IFFT),得到该帧的时域信号rn(t)。对照相邻帧的重叠量,进行帧间叠接相加,最终得到增强后的语音信号r(t)。
本发明在很小的体积内,实现了定向语音增强算法,很大程度地抑制了噪声,提高了信噪比和听觉舒适度。
为证明本方法的有效性,对同一组带噪语音(两个干扰源,其一为干扰说话人,另一个为音乐,信噪比由-10dB到10dB)进行处理,噪声去除量(NoiseReduction)如下表(单位:dB):
去噪能力提升均在16dB以上。
Claims (7)
1.一种基于小型麦克风阵列的定向语音增强方法,包括如下步骤:
1)利用两个全指向性麦克风采集声音信号;
2)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号的语谱X(ω)和自适应滤波后信号的语谱Z(ω);
3)根据X(ω)和Z(ω),利用单通道语音增强方法计算出初步增益G′(ω);根据X(ω)和Z(ω),计算出目标信号存在概率P(ω);
4)利用所述目标信号存在概率P(ω),对初步增益G′(ω)进行修正,得出最终增益G(ω);
5)利用最终增益G(ω),对自适应滤波后的信号z(t)进行增强,得到最终的增强语音信号r(t);
所述步骤4)中,
式中,Gm为预设的增益最小值,P1是目标信号存在概率的门限值。
2.根据权利要求1所述的定向语音增强方法,其特征在于,所述步骤2)包括如下子步骤:
21)利用自适应谷点形成算法,对所采集到声音信号进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
22)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)。
3.根据权利要求2所述的定向语音增强方法,其特征在于,所述步骤1)中,所述两个麦克风且呈端射式排布,所采集声音信号包括fore(t)和back(t)信号,fore(t)为离说话人较近的麦克风收到的信号,back(t)为离说话人较远的麦克风收到的信号。
4.根据权利要求3所述的定向语音增强方法,其特征在于,所述两个麦克风间距d为2cm-5cm。
5.根据权利要求3所述的定向语音增强方法,其特征在于,所述步骤21)中,对fore(t)和back(t)进行数据处理,得到延迟相减信号x(t)和自适应滤波后的信号z(t);
x(t)=fore(t)-back(t-d/c)
y(t)=fore(t-d/c)-back(t)
式中,c为声波的传输速度;d为所述两个麦克风间距;
z(t)是以y(t)做为参考信号,对x(t)进行自适应滤波后得到的信号。
6.根据权利要求1所述的定向语音增强方法,其特征在于,所述步骤3)中,所述单通道语音增强方法可采用谱减法,维纳滤波法或EM方法。
7.根据权利要求1所述的定向语音增强方法,其特征在于,所述增益最小值Gm取值在0.01-0.1之间,所述目标信号存在概率的门限值P1的取值在0.85-0.95之间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101121953A CN101587712B (zh) | 2008-05-21 | 2008-05-21 | 一种基于小型麦克风阵列的定向语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101121953A CN101587712B (zh) | 2008-05-21 | 2008-05-21 | 一种基于小型麦克风阵列的定向语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101587712A CN101587712A (zh) | 2009-11-25 |
CN101587712B true CN101587712B (zh) | 2011-09-14 |
Family
ID=41371930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101121953A Expired - Fee Related CN101587712B (zh) | 2008-05-21 | 2008-05-21 | 一种基于小型麦克风阵列的定向语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101587712B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102111697B (zh) * | 2009-12-28 | 2015-03-25 | 歌尔声学股份有限公司 | 一种麦克风阵列降噪控制方法及装置 |
CN101807404B (zh) * | 2010-03-04 | 2012-02-08 | 清华大学 | 一种电子耳蜗前端指向性语音增强的预处理系统 |
CN101959099B (zh) * | 2010-04-12 | 2013-12-25 | 瑞声声学科技(深圳)有限公司 | 指向性麦克风装置 |
CN104754465B (zh) * | 2013-12-31 | 2018-06-05 | 展讯通信(上海)有限公司 | 一种自适应信号增强方法和系统 |
US9311928B1 (en) * | 2014-11-06 | 2016-04-12 | Vocalzoom Systems Ltd. | Method and system for noise reduction and speech enhancement |
CN105206281B (zh) * | 2015-09-14 | 2019-02-15 | 胡旻波 | 基于分布式麦克风阵列网络的语音增强方法 |
CN109753264A (zh) * | 2017-11-08 | 2019-05-14 | 阿里巴巴集团控股有限公司 | 一种任务处理方法和设备 |
CN112509593B (zh) * | 2020-11-17 | 2024-03-08 | 北京清微智能科技有限公司 | 一种语音增强网络模型、单通道的语音增强方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6778954B1 (en) * | 1999-08-28 | 2004-08-17 | Samsung Electronics Co., Ltd. | Speech enhancement method |
CN1700305A (zh) * | 2004-05-18 | 2005-11-23 | 中国科学院声学研究所 | 子带自适应谷点降噪系统和方法 |
CN1763846A (zh) * | 2005-11-23 | 2006-04-26 | 北京中星微电子有限公司 | 一种语音增益因子估计装置和方法 |
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
CN1967658A (zh) * | 2005-11-14 | 2007-05-23 | 北京大学科技开发部 | 小尺度麦克风阵列语音增强系统和方法 |
-
2008
- 2008-05-21 CN CN2008101121953A patent/CN101587712B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6778954B1 (en) * | 1999-08-28 | 2004-08-17 | Samsung Electronics Co., Ltd. | Speech enhancement method |
CN1700305A (zh) * | 2004-05-18 | 2005-11-23 | 中国科学院声学研究所 | 子带自适应谷点降噪系统和方法 |
CN1967658A (zh) * | 2005-11-14 | 2007-05-23 | 北京大学科技开发部 | 小尺度麦克风阵列语音增强系统和方法 |
CN1763846A (zh) * | 2005-11-23 | 2006-04-26 | 北京中星微电子有限公司 | 一种语音增益因子估计装置和方法 |
CN1851806A (zh) * | 2006-05-30 | 2006-10-25 | 北京中星微电子有限公司 | 一种自适应麦克阵列系统及其语音信号处理方法 |
Non-Patent Citations (2)
Title |
---|
Israel Cohen et.al.TOW-CHANNEL SIGNAL DETECTION AND SPEECH ENHANCEMENT BASED ON THE TRANSIENT BEAM-TO-REFERENCE RATIO.《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》.2003,第5卷第233-236页. * |
张恒等.基于听觉感知子带的自适应谷点形成算法.《电声技术》.2007,第31卷(第7期),第53-55页. * |
Also Published As
Publication number | Publication date |
---|---|
CN101587712A (zh) | 2009-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101587712B (zh) | 一种基于小型麦克风阵列的定向语音增强方法 | |
CN101593522B (zh) | 一种全频域数字助听方法和设备 | |
JP4671303B2 (ja) | マイクロホンアレイ用ポストフィルタ | |
CN110085248B (zh) | 个人通信中降噪和回波消除时的噪声估计 | |
US20240079021A1 (en) | Voice enhancement method, apparatus and system, and computer-readable storage medium | |
US8010355B2 (en) | Low complexity noise reduction method | |
CN105869651B (zh) | 基于噪声混合相干性的双通道波束形成语音增强方法 | |
CN102074246B (zh) | 基于双麦克风语音增强装置及方法 | |
JP5573517B2 (ja) | 雑音除去装置および雑音除去方法 | |
WO2015196729A1 (zh) | 一种麦克风阵列语音增强方法及装置 | |
US9532149B2 (en) | Method of signal processing in a hearing aid system and a hearing aid system | |
CN101976565A (zh) | 基于双麦克风语音增强装置及方法 | |
CN111081267B (zh) | 一种多通道远场语音增强方法 | |
US9467775B2 (en) | Method and a system for noise suppressing an audio signal | |
CN102347028A (zh) | 双麦克风语音增强装置及方法 | |
CN102456351A (zh) | 一种语音增强的系统 | |
US9414157B2 (en) | Method and device for reducing voice reverberation based on double microphones | |
JP6083872B2 (ja) | マイクロフォン装置から受信した信号において不要な音を減少させるシステムおよび方法 | |
CN110310650A (zh) | 一种基于二阶微分麦克风阵列的语音增强算法 | |
Li et al. | A noise reduction system based on hybrid noise estimation technique and post-filtering in arbitrary noise environments | |
Pfeifenberger et al. | Blind source extraction based on a direction-dependent a-priori SNR. | |
JP2012049715A (ja) | 音源分離装置、音源分離方法、及び、プログラム | |
CN111210836A (zh) | 一种麦克风阵列波束形成动态调整方法 | |
Esch et al. | Combined reduction of time varying harmonic and stationary noise using frequency warping | |
Martın-Donas et al. | A postfiltering approach for dual-microphone smartphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110914 |