CN111210836B - 一种麦克风阵列波束形成动态调整方法 - Google Patents
一种麦克风阵列波束形成动态调整方法 Download PDFInfo
- Publication number
- CN111210836B CN111210836B CN202010157395.1A CN202010157395A CN111210836B CN 111210836 B CN111210836 B CN 111210836B CN 202010157395 A CN202010157395 A CN 202010157395A CN 111210836 B CN111210836 B CN 111210836B
- Authority
- CN
- China
- Prior art keywords
- noise ratio
- algorithm
- threshold value
- microphone
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000000694 effects Effects 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 230000001629 suppression Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000007613 environmental effect Effects 0.000 abstract description 2
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
一种麦克风阵列波束形成动态调整方法,包括如下步骤:S1.计算出麦克风阵列采集得到的输入信噪比;S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。
Description
技术领域
本发明属于语音识别技术领域,具体涉及一种麦克风阵列波束形成动态调整方法。
背景技术
为提高语音识别率,在进行语音处理时通常有两种途径:增强目标语音信号或抑制噪音信号。对于麦克风阵列,通常会用到波束形成技术,实现的方法又包括广义旁瓣噪声消除器(Generalized Sidelobe Canceller,GSC)、延时-相加处理(delay-sum)、超指向等,而不同的方法效果也各不一样;对麦克风阵列语音信号调整的目的在于获得尽可能清晰的目标声源信息,而抑制除目标声源信息之外的其他噪音信息。
发明内容
为提高波束形成的稳健性,从而提高语音识别率,本发明公开了一种麦克风阵列波束形成动态调整方法。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。
具体的,所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法。
优选的,所述步骤S1中输入信噪比的计算过程如下:
S11.计算第一个麦克风与其他麦克风信号的互相关系
其中,y(l,k)为傅里叶变换系数,y的下标1表示第1个麦克风,E()代表期望运算,上标“*”代表共轭运算;m表示第m个麦克风,l表示第l时间帧,k表示第k个频带;
S12.计算期望方向语音的相关系数:
S13.计算散射噪声的相关系数:
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比;
得到的均值信噪比为所述输入信噪比。
采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。
附图说明
图1为本发明所述麦克风阵列波束形成动态调整方法的一种具体实施方式流程示意图
图2为本发明所述方法的一个应用环境示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法:
包含多个麦克风y1,y2...ym,的语音装置在接收多路采样信号后,根据所述多路采样信号得到输入的信噪比,如图2所示。
假设共有M(M大于1)个麦克风,
ym(l,k),m=1,2,...,M代表第m个麦克风在第l时间帧,第k个频带的傅里叶变换系数,共K个频带。
选定第一个麦克风作为选定麦克风,则信噪比计算过程如下:
S11.计算第一个麦克风与第m=2,...,M个麦克风信号的互相关系数
其中,E()代表期望运算,上标“*”代表共轭运算。
S12.计算期望方向语音的相关系数:
下标S代表语音。
S13.计算散射噪声的相关系数:
下标v代表噪音。
S14.计算基于第1个和第m个麦克风的信噪比,估计信噪比
下标y代表麦克风信号。
S15.再通过对全部麦克风求和取平均值的均值信噪比
当实时环境中得到的均值信噪比λ(l,k)大于高门限值N时,则认为环境相对安静,则波束形成选用波束增强比较大的方法;如GSC算法中目标波束方向滤波,不做旁瓣方向的抑制滤波。
当实时环境中得到的均值信噪比λ(l,k)小于低门限值M时,则认为环境噪音相对较大,则波束形成选用对目标方向波束增强比较大的办法,同时对其他方向做一定波束抑制。比如GSC算法中做目标方向的波束增强,同时也可以做陷波方向的抑制,或者采用delay-sum算法。
当实时环境中得到的信噪比λ(l,k)介于高门限值N和低门限值M之间时,则维持该时刻之前波束形成的方法;例如:如果在10点的时候信噪比大于N,就选用波束增强比较大的方法,如果在10点半的时候信噪比介于N和M之间,则维持之前的波束增强比较大的方法。
如果初始的信噪比λ0介于高门限值N和低门限值M之间,则默认为采用delay-sum方法。因为delay-sum算法在一定环境下能够较好抑制噪音,但又不损伤目标语音。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (1)
1.一种麦克风阵列波束形成动态调整方法,其特征在于,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法;
所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法;
所述步骤S1中输入信噪比的计算过程如下:
S11.计算第一个麦克风与其他麦克风信号的互相关系
其中,y(l,k)为傅里叶变换系数,y的下标1表示第1个麦克风,E()代表期望运算,上标“*”代表共轭运算;m表示第m个麦克风,l表示第l时间帧,k表示第k个频带;
S12.计算期望方向语音的相关系数:
S13.计算散射噪声的相关系数:
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比;
得到的均值信噪比为所述输入信噪比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010157395.1A CN111210836B (zh) | 2020-03-09 | 2020-03-09 | 一种麦克风阵列波束形成动态调整方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010157395.1A CN111210836B (zh) | 2020-03-09 | 2020-03-09 | 一种麦克风阵列波束形成动态调整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111210836A CN111210836A (zh) | 2020-05-29 |
CN111210836B true CN111210836B (zh) | 2023-04-25 |
Family
ID=70790062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010157395.1A Active CN111210836B (zh) | 2020-03-09 | 2020-03-09 | 一种麦克风阵列波束形成动态调整方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111210836B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798869B (zh) * | 2020-09-10 | 2020-11-17 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的声源定位方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101088307A (zh) * | 2003-12-24 | 2007-12-12 | 诺基亚公司 | 用于为广义边带抵消生成噪声参考的方法 |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
US9980042B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US10079026B1 (en) * | 2017-08-23 | 2018-09-18 | Cirrus Logic, Inc. | Spatially-controlled noise reduction for headsets with variable microphone array orientation |
CN110782912A (zh) * | 2019-10-10 | 2020-02-11 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备 |
CN110827847A (zh) * | 2019-11-27 | 2020-02-21 | 高小翎 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0907258B1 (en) * | 1997-10-03 | 2007-01-03 | Matsushita Electric Industrial Co., Ltd. | Audio signal compression, speech signal compression and speech recognition |
CA2452945C (en) * | 2003-09-23 | 2016-05-10 | Mcmaster University | Binaural adaptive hearing system |
EP2048659B1 (en) * | 2007-10-08 | 2011-08-17 | Harman Becker Automotive Systems GmbH | Gain and spectral shape adjustment in audio signal processing |
KR102505719B1 (ko) * | 2016-08-12 | 2023-03-03 | 삼성전자주식회사 | 음성 인식이 가능한 디스플레이 장치 및 방법 |
-
2020
- 2020-03-09 CN CN202010157395.1A patent/CN111210836B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101088307A (zh) * | 2003-12-24 | 2007-12-12 | 诺基亚公司 | 用于为广义边带抵消生成噪声参考的方法 |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
US9980042B1 (en) * | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
US10079026B1 (en) * | 2017-08-23 | 2018-09-18 | Cirrus Logic, Inc. | Spatially-controlled noise reduction for headsets with variable microphone array orientation |
CN110782912A (zh) * | 2019-10-10 | 2020-02-11 | 安克创新科技股份有限公司 | 音源的控制方法以及扬声设备 |
CN110827847A (zh) * | 2019-11-27 | 2020-02-21 | 高小翎 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111210836A (zh) | 2020-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108172235B (zh) | 基于维纳后置滤波的ls波束形成混响抑制方法 | |
US9984702B2 (en) | Extraction of reverberant sound using microphone arrays | |
CN101510426B (zh) | 一种噪声消除方法及系统 | |
CN105590631B (zh) | 信号处理的方法及装置 | |
CN107018470B (zh) | 一种基于环形麦克风阵列的语音记录方法及系统 | |
US9838782B2 (en) | Adaptive mixing of sub-band signals | |
CN108447496B (zh) | 一种基于麦克风阵列的语音增强方法及装置 | |
US20140025374A1 (en) | Speech enhancement to improve speech intelligibility and automatic speech recognition | |
US9232309B2 (en) | Microphone array processing system | |
JP2009522942A (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
CN101447190A (zh) | 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法 | |
CN103827967B (zh) | 语音信号复原装置以及语音信号复原方法 | |
CN101587712B (zh) | 一种基于小型麦克风阵列的定向语音增强方法 | |
CN111210836B (zh) | 一种麦克风阵列波束形成动态调整方法 | |
CN113903353A (zh) | 一种基于空间区分性检测的定向噪声消除方法及装置 | |
CN112530451A (zh) | 基于去噪自编码器的语音增强方法 | |
CN116312602B (zh) | 基于干扰噪声空间谱矩阵的语音信号波束成形方法 | |
Kumatani et al. | Microphone array post-filter based on spatially-correlated noise measurements for distant speech recognition | |
CN109901114B (zh) | 一种适用于声源定位的时延估计方法 | |
Guo et al. | Underwater target detection and localization with feature map and CNN-based classification | |
Xu et al. | Adaptive speech enhancement algorithm based on first-order differential microphone array | |
CN110310650A (zh) | 一种基于二阶微分麦克风阵列的语音增强算法 | |
CN111933169B (zh) | 一种二次利用语音存在概率的语音降噪方法 | |
CN114639398B (zh) | 一种基于麦克风阵列的宽带doa估计方法 | |
Stolbov et al. | Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |