CN111210836A - 一种麦克风阵列波束形成动态调整方法 - Google Patents
一种麦克风阵列波束形成动态调整方法 Download PDFInfo
- Publication number
- CN111210836A CN111210836A CN202010157395.1A CN202010157395A CN111210836A CN 111210836 A CN111210836 A CN 111210836A CN 202010157395 A CN202010157395 A CN 202010157395A CN 111210836 A CN111210836 A CN 111210836A
- Authority
- CN
- China
- Prior art keywords
- noise ratio
- algorithm
- threshold value
- input signal
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Abstract
一种麦克风阵列波束形成动态调整方法,包括如下步骤:S1.计算出麦克风阵列采集得到的输入信噪比;S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。
Description
技术领域
本发明属于语音识别技术领域,具体涉及一种麦克风阵列波束形成动态调整方法。
背景技术
为提高语音识别率,在进行语音处理时通常有两种途径:增强目标语音信号或抑制噪音信号。对于麦克风阵列,通常会用到波束形成技术,实现的方法又包括广义旁瓣噪声消除器(Generalized Sidelobe Canceller,GSC)、延时-相加处理(delay-sum)、超指向等,而不同的方法效果也各不一样;对麦克风阵列语音信号调整的目的在于获得尽可能清晰的目标声源信息,而抑制除目标声源信息之外的其他噪音信息。
发明内容
为提高波束形成的稳健性,从而提高语音识别率,本发明公开了一种麦克风阵列波束形成动态调整方法。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。
具体的,所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法。
优选的,所述步骤S1中输入信噪比的计算过程如下:。
S11.计算任意一个选定麦克风与其他麦克风信号的互相关相关系数
其中,y(l,k)为傅里叶变换系数,y的下标1表示选定麦克风,E()代表期望运算,上标“*”代表共轭运算;
S12.计算期望方向语音的相关系数:
下标S代表语音,d表示选定麦克风和第m个麦克风之间距离;
S13.计算散射噪声的相关系数:
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比 ;
得到的均值信噪比为所述输入信噪比。
采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。
附图说明
图1为本发明所述麦克风阵列波束形成动态调整方法的一种具体实施方式流程示意图
图2为本发明所述方法的一个应用环境示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法:
包含多个麦克风y1, y2... ym,的语音装置在接收多路采样信号后,根据所述多路采样信号得到输入的信噪比,如图2所示。
假设共有M(M大于1)个麦克风,
选定第一个麦克风作为选定麦克风,则信噪比计算过程如下:
S11.计算第一个麦克风与第m=2,...,M个麦克风信号的互相关相关系数
其中,E()代表期望运算,上标“*”代表共轭运算。
S12.计算期望方向语音的相关系数:
下标S代表语音。
S13.计算散射噪声的相关系数:
下标v代表噪音。
S14.计算基于第1个和第m个麦克风的信噪比,估计信噪比
下标y代表麦克风信号。
S15.再通过对全部麦克风求和取平均值的均值信噪比
当实时环境中得到的均值信噪比λ(l,k)大于高门限值N时,则认为环境相对安静,则波束形成选用波束增强比较大的方法;如GSC算法中目标波束方向滤波,不做旁瓣方向的抑制滤波。
当实时环境中得到的均值信噪比λ(l,k)小于低门限值M时,则认为环境噪音相对较大,则波束形成选用对目标方向波束增强比较大的办法,同时对其他方向做一定波束抑制。比如GSC算法中做目标方向的波束增强,同时也可以做陷波方向的抑制,或者采用delay-sum算法。
当实时环境中得到的信噪比λ(l,k)介于高门限值N和低门限值M之间时,则维持该时刻之前波束形成的方法;例如:如果在10点的时候信噪比大于N,就选用波束增强比较大的方法,如果在10点半的时候信噪比介于N和M之间,则维持之前的波束增强比较大的方法。
如果初始的信噪比λ0介于高门限值N和低门限值M之间,则默认为采用delay-sum方法。因为delay-sum算法在一定环境下能够较好抑制噪音,但又不损伤目标语音。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (3)
1.一种麦克风阵列波束形成动态调整方法,其特征在于,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。
2.如权利要求1所述的麦克风阵列波束形成动态调整方法,其特征在于,所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法。
3.如权利要求1所述的麦克风阵列波束形成动态调整方法,其特征在于,所述步骤S1中输入信噪比的计算过程如下:
S11.计算任意一个选定麦克风与其他麦克风信号的互相关相关系数
其中,y(l,k)为傅里叶变换系数,y的下标1表示选定麦克风,E()代表期望运算,上标“*”代表共轭运算;
S12.计算期望方向语音的相关系数:
下标S代表语音,d表示选定麦克风和第m个麦克风之间距离;
S13.计算散射噪声的相关系数:
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比 ;
得到的均值信噪比为所述输入信噪比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010157395.1A CN111210836B (zh) | 2020-03-09 | 2020-03-09 | 一种麦克风阵列波束形成动态调整方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010157395.1A CN111210836B (zh) | 2020-03-09 | 2020-03-09 | 一种麦克风阵列波束形成动态调整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111210836A true CN111210836A (zh) | 2020-05-29 |
CN111210836B CN111210836B (zh) | 2023-04-25 |
Family
ID=70790062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010157395.1A Active CN111210836B (zh) | 2020-03-09 | 2020-03-09 | 一种麦克风阵列波束形成动态调整方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111210836B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798869A (zh) * | 2020-09-10 | 2020-10-20 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的声源定位方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010044727A1 (en) * | 1997-10-03 | 2001-11-22 | Yoshihisa Nakatoh | Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus |
US20050069162A1 (en) * | 2003-09-23 | 2005-03-31 | Simon Haykin | Binaural adaptive hearing aid |
CN101088307A (zh) * | 2003-12-24 | 2007-12-12 | 诺基亚公司 | 用于为广义边带抵消生成噪声参考的方法 |
US20090225980A1 (en) * | 2007-10-08 | 2009-09-10 | Gerhard Uwe Schmidt | Gain and spectral shape adjustment in audio signal processing |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
US20180047390A1 (en) * | 2016-08-12 | 2018-02-15 | Samsung Electronics Co., Ltd. | Method and display device for recognizing voice |
US9980042B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US10079026B1 (en) * | 2017-08-23 | 2018-09-18 | Cirrus Logic, Inc. | Spatially-controlled noise reduction for headsets with variable microphone array orientation |
CN110782912A (zh) * | 2019-10-10 | 2020-02-11 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备 |
CN110827847A (zh) * | 2019-11-27 | 2020-02-21 | 高小翎 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
-
2020
- 2020-03-09 CN CN202010157395.1A patent/CN111210836B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010044727A1 (en) * | 1997-10-03 | 2001-11-22 | Yoshihisa Nakatoh | Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus |
US20050069162A1 (en) * | 2003-09-23 | 2005-03-31 | Simon Haykin | Binaural adaptive hearing aid |
CN101088307A (zh) * | 2003-12-24 | 2007-12-12 | 诺基亚公司 | 用于为广义边带抵消生成噪声参考的方法 |
US20090225980A1 (en) * | 2007-10-08 | 2009-09-10 | Gerhard Uwe Schmidt | Gain and spectral shape adjustment in audio signal processing |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
US20180047390A1 (en) * | 2016-08-12 | 2018-02-15 | Samsung Electronics Co., Ltd. | Method and display device for recognizing voice |
US9980042B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US10079026B1 (en) * | 2017-08-23 | 2018-09-18 | Cirrus Logic, Inc. | Spatially-controlled noise reduction for headsets with variable microphone array orientation |
CN110782912A (zh) * | 2019-10-10 | 2020-02-11 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备 |
CN110827847A (zh) * | 2019-11-27 | 2020-02-21 | 高小翎 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798869A (zh) * | 2020-09-10 | 2020-10-20 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的声源定位方法 |
CN111798869B (zh) * | 2020-09-10 | 2020-11-17 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的声源定位方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111210836B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108172235B (zh) | 基于维纳后置滤波的ls波束形成混响抑制方法 | |
JP5007442B2 (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
KR101597752B1 (ko) | 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치 | |
Meyer et al. | Multi-channel speech enhancement in a car environment using Wiener filtering and spectral subtraction | |
CN110085248B (zh) | 个人通信中降噪和回波消除时的噪声估计 | |
JP5573517B2 (ja) | 雑音除去装置および雑音除去方法 | |
JP4671303B2 (ja) | マイクロホンアレイ用ポストフィルタ | |
US8370140B2 (en) | Method of filtering non-steady lateral noise for a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle | |
US20140025374A1 (en) | Speech enhancement to improve speech intelligibility and automatic speech recognition | |
JP7041156B6 (ja) | ビームフォーミングを使用するオーディオキャプチャのための方法及び装置 | |
US20050074129A1 (en) | Cardioid beam with a desired null based acoustic devices, systems and methods | |
US9232309B2 (en) | Microphone array processing system | |
CN108447496B (zh) | 一种基于麦克风阵列的语音增强方法及装置 | |
GB2398913A (en) | Noise estimation in speech recognition | |
EP2441273A1 (en) | Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal | |
Kolossa et al. | Nonlinear postprocessing for blind speech separation | |
US20180308503A1 (en) | Real-time single-channel speech enhancement in noisy and time-varying environments | |
US20200286501A1 (en) | Apparatus and a method for signal enhancement | |
CN116569564A (zh) | 骨传导耳机语音增强系统和方法 | |
CN112530451A (zh) | 基于去噪自编码器的语音增强方法 | |
CN101587712A (zh) | 一种基于小型麦克风阵列的定向语音增强方法 | |
CN111210836A (zh) | 一种麦克风阵列波束形成动态调整方法 | |
CN109901114B (zh) | 一种适用于声源定位的时延估计方法 | |
Xu et al. | Adaptive speech enhancement algorithm based on first-order differential microphone array | |
CN113362846B (zh) | 一种基于广义旁瓣相消结构的语音增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |