CN111210836A - 一种麦克风阵列波束形成动态调整方法 - Google Patents

一种麦克风阵列波束形成动态调整方法 Download PDF

Info

Publication number
CN111210836A
CN111210836A CN202010157395.1A CN202010157395A CN111210836A CN 111210836 A CN111210836 A CN 111210836A CN 202010157395 A CN202010157395 A CN 202010157395A CN 111210836 A CN111210836 A CN 111210836A
Authority
CN
China
Prior art keywords
noise ratio
algorithm
threshold value
input signal
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010157395.1A
Other languages
English (en)
Other versions
CN111210836B (zh
Inventor
许兵
何云鹏
高君效
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipintelli Technology Co Ltd
Original Assignee
Chipintelli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipintelli Technology Co Ltd filed Critical Chipintelli Technology Co Ltd
Priority to CN202010157395.1A priority Critical patent/CN111210836B/zh
Publication of CN111210836A publication Critical patent/CN111210836A/zh
Application granted granted Critical
Publication of CN111210836B publication Critical patent/CN111210836B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

一种麦克风阵列波束形成动态调整方法,包括如下步骤:S1.计算出麦克风阵列采集得到的输入信噪比;S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。

Description

一种麦克风阵列波束形成动态调整方法
技术领域
本发明属于语音识别技术领域,具体涉及一种麦克风阵列波束形成动态调整方法。
背景技术
为提高语音识别率,在进行语音处理时通常有两种途径:增强目标语音信号或抑制噪音信号。对于麦克风阵列,通常会用到波束形成技术,实现的方法又包括广义旁瓣噪声消除器(Generalized Sidelobe Canceller,GSC)、延时-相加处理(delay-sum)、超指向等,而不同的方法效果也各不一样;对麦克风阵列语音信号调整的目的在于获得尽可能清晰的目标声源信息,而抑制除目标声源信息之外的其他噪音信息。
发明内容
为提高波束形成的稳健性,从而提高语音识别率,本发明公开了一种麦克风阵列波束形成动态调整方法。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。
具体的,所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法。
优选的,所述步骤S1中输入信噪比的计算过程如下:。
S11.计算任意一个选定麦克风与其他麦克风信号的互相关相关系数
Figure 65225DEST_PATH_IMAGE001
其中,y(l,k)为傅里叶变换系数,y的下标1表示选定麦克风,E()代表期望运算,上标“*”代表共轭运算;
S12.计算期望方向语音的相关系数:
Figure 505433DEST_PATH_IMAGE002
下标S代表语音,d表示选定麦克风和第m个麦克风之间距离;
S13.计算散射噪声的相关系数:
Figure 496392DEST_PATH_IMAGE003
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
Figure 959734DEST_PATH_IMAGE004
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比 ;
Figure 835286DEST_PATH_IMAGE005
得到的均值信噪比为所述输入信噪比。
采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。
附图说明
图1为本发明所述麦克风阵列波束形成动态调整方法的一种具体实施方式流程示意图
图2为本发明所述方法的一个应用环境示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法:
包含多个麦克风y1, y2... ym,的语音装置在接收多路采样信号后,根据所述多路采样信号得到输入的信噪比,如图2所示。
假设共有M(M大于1)个麦克风,
Figure 67685DEST_PATH_IMAGE006
代表第m个麦克风在第l时间帧,第k个频带的傅里叶变换系数,共K个频带。
Figure 511435DEST_PATH_IMAGE007
代表声速,
Figure 196495DEST_PATH_IMAGE008
代表采样率,
Figure 875738DEST_PATH_IMAGE009
代表第m个麦克风与第n个麦克风的间距,
Figure 962642DEST_PATH_IMAGE010
为目标声源方向,
Figure 62448DEST_PATH_IMAGE011
,K为频带数量。
选定第一个麦克风作为选定麦克风,则信噪比计算过程如下:
S11.计算第一个麦克风与第m=2,...,M个麦克风信号的互相关相关系数
Figure 297120DEST_PATH_IMAGE001
其中,E()代表期望运算,上标“*”代表共轭运算。
S12.计算期望方向语音的相关系数:
Figure 452158DEST_PATH_IMAGE002
下标S代表语音。
S13.计算散射噪声的相关系数:
Figure 596831DEST_PATH_IMAGE003
,
下标v代表噪音。
S14.计算基于第1个和第m个麦克风的信噪比,估计信噪比
Figure 444702DEST_PATH_IMAGE004
下标y代表麦克风信号。
S15.再通过对全部麦克风求和取平均值的均值信噪比
Figure 166670DEST_PATH_IMAGE005
当实时环境中得到的均值信噪比λ(l,k)大于高门限值N时,则认为环境相对安静,则波束形成选用波束增强比较大的方法;如GSC算法中目标波束方向滤波,不做旁瓣方向的抑制滤波。
当实时环境中得到的均值信噪比λ(l,k)小于低门限值M时,则认为环境噪音相对较大,则波束形成选用对目标方向波束增强比较大的办法,同时对其他方向做一定波束抑制。比如GSC算法中做目标方向的波束增强,同时也可以做陷波方向的抑制,或者采用delay-sum算法。
当实时环境中得到的信噪比λ(l,k)介于高门限值N和低门限值M之间时,则维持该时刻之前波束形成的方法;例如:如果在10点的时候信噪比大于N,就选用波束增强比较大的方法,如果在10点半的时候信噪比介于N和M之间,则维持之前的波束增强比较大的方法。
如果初始的信噪比λ0介于高门限值N和低门限值M之间,则默认为采用delay-sum方法。因为delay-sum算法在一定环境下能够较好抑制噪音,但又不损伤目标语音。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (3)

1.一种麦克风阵列波束形成动态调整方法,其特征在于,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。
2.如权利要求1所述的麦克风阵列波束形成动态调整方法,其特征在于,所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法。
3.如权利要求1所述的麦克风阵列波束形成动态调整方法,其特征在于,所述步骤S1中输入信噪比的计算过程如下:
S11.计算任意一个选定麦克风与其他麦克风信号的互相关相关系数
Figure 311832DEST_PATH_IMAGE001
其中,y(l,k)为傅里叶变换系数,y的下标1表示选定麦克风,E()代表期望运算,上标“*”代表共轭运算;
S12.计算期望方向语音的相关系数:
Figure 783265DEST_PATH_IMAGE002
下标S代表语音,d表示选定麦克风和第m个麦克风之间距离;
S13.计算散射噪声的相关系数:
Figure 775492DEST_PATH_IMAGE003
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
Figure 64391DEST_PATH_IMAGE004
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比 ;
Figure 774858DEST_PATH_IMAGE005
得到的均值信噪比为所述输入信噪比。
CN202010157395.1A 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法 Active CN111210836B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010157395.1A CN111210836B (zh) 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010157395.1A CN111210836B (zh) 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法

Publications (2)

Publication Number Publication Date
CN111210836A true CN111210836A (zh) 2020-05-29
CN111210836B CN111210836B (zh) 2023-04-25

Family

ID=70790062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010157395.1A Active CN111210836B (zh) 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法

Country Status (1)

Country Link
CN (1) CN111210836B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798869A (zh) * 2020-09-10 2020-10-20 成都启英泰伦科技有限公司 一种基于双麦克风阵列的声源定位方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010044727A1 (en) * 1997-10-03 2001-11-22 Yoshihisa Nakatoh Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
US20050069162A1 (en) * 2003-09-23 2005-03-31 Simon Haykin Binaural adaptive hearing aid
CN101088307A (zh) * 2003-12-24 2007-12-12 诺基亚公司 用于为广义边带抵消生成噪声参考的方法
US20090225980A1 (en) * 2007-10-08 2009-09-10 Gerhard Uwe Schmidt Gain and spectral shape adjustment in audio signal processing
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
US20180047390A1 (en) * 2016-08-12 2018-02-15 Samsung Electronics Co., Ltd. Method and display device for recognizing voice
US9980042B1 (en) * 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US10079026B1 (en) * 2017-08-23 2018-09-18 Cirrus Logic, Inc. Spatially-controlled noise reduction for headsets with variable microphone array orientation
CN110782912A (zh) * 2019-10-10 2020-02-11 安克创新科技股份有限公司 音源的控制方法以及扬声设备
CN110827847A (zh) * 2019-11-27 2020-02-21 高小翎 低信噪比见长的麦克风阵列语音去噪增强方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010044727A1 (en) * 1997-10-03 2001-11-22 Yoshihisa Nakatoh Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
US20050069162A1 (en) * 2003-09-23 2005-03-31 Simon Haykin Binaural adaptive hearing aid
CN101088307A (zh) * 2003-12-24 2007-12-12 诺基亚公司 用于为广义边带抵消生成噪声参考的方法
US20090225980A1 (en) * 2007-10-08 2009-09-10 Gerhard Uwe Schmidt Gain and spectral shape adjustment in audio signal processing
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
US20180047390A1 (en) * 2016-08-12 2018-02-15 Samsung Electronics Co., Ltd. Method and display device for recognizing voice
US9980042B1 (en) * 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US10079026B1 (en) * 2017-08-23 2018-09-18 Cirrus Logic, Inc. Spatially-controlled noise reduction for headsets with variable microphone array orientation
CN110782912A (zh) * 2019-10-10 2020-02-11 安克创新科技股份有限公司 音源的控制方法以及扬声设备
CN110827847A (zh) * 2019-11-27 2020-02-21 高小翎 低信噪比见长的麦克风阵列语音去噪增强方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798869A (zh) * 2020-09-10 2020-10-20 成都启英泰伦科技有限公司 一种基于双麦克风阵列的声源定位方法
CN111798869B (zh) * 2020-09-10 2020-11-17 成都启英泰伦科技有限公司 一种基于双麦克风阵列的声源定位方法

Also Published As

Publication number Publication date
CN111210836B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN108172235B (zh) 基于维纳后置滤波的ls波束形成混响抑制方法
JP5007442B2 (ja) 発話改善のためにマイク間レベル差を用いるシステム及び方法
KR101597752B1 (ko) 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
Meyer et al. Multi-channel speech enhancement in a car environment using Wiener filtering and spectral subtraction
CN110085248B (zh) 个人通信中降噪和回波消除时的噪声估计
JP5573517B2 (ja) 雑音除去装置および雑音除去方法
JP4671303B2 (ja) マイクロホンアレイ用ポストフィルタ
US8370140B2 (en) Method of filtering non-steady lateral noise for a multi-microphone audio device, in particular a “hands-free” telephone device for a motor vehicle
US20140025374A1 (en) Speech enhancement to improve speech intelligibility and automatic speech recognition
JP7041156B6 (ja) ビームフォーミングを使用するオーディオキャプチャのための方法及び装置
US20050074129A1 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
US9232309B2 (en) Microphone array processing system
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
GB2398913A (en) Noise estimation in speech recognition
EP2441273A1 (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
Kolossa et al. Nonlinear postprocessing for blind speech separation
US20180308503A1 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
US20200286501A1 (en) Apparatus and a method for signal enhancement
CN116569564A (zh) 骨传导耳机语音增强系统和方法
CN112530451A (zh) 基于去噪自编码器的语音增强方法
CN101587712A (zh) 一种基于小型麦克风阵列的定向语音增强方法
CN111210836A (zh) 一种麦克风阵列波束形成动态调整方法
CN109901114B (zh) 一种适用于声源定位的时延估计方法
Xu et al. Adaptive speech enhancement algorithm based on first-order differential microphone array
CN113362846B (zh) 一种基于广义旁瓣相消结构的语音增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant