CN111210836B - 一种麦克风阵列波束形成动态调整方法 - Google Patents

一种麦克风阵列波束形成动态调整方法 Download PDF

Info

Publication number
CN111210836B
CN111210836B CN202010157395.1A CN202010157395A CN111210836B CN 111210836 B CN111210836 B CN 111210836B CN 202010157395 A CN202010157395 A CN 202010157395A CN 111210836 B CN111210836 B CN 111210836B
Authority
CN
China
Prior art keywords
noise ratio
algorithm
threshold value
microphone
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010157395.1A
Other languages
English (en)
Other versions
CN111210836A (zh
Inventor
许兵
何云鹏
高君效
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipintelli Technology Co Ltd
Original Assignee
Chipintelli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipintelli Technology Co Ltd filed Critical Chipintelli Technology Co Ltd
Priority to CN202010157395.1A priority Critical patent/CN111210836B/zh
Publication of CN111210836A publication Critical patent/CN111210836A/zh
Application granted granted Critical
Publication of CN111210836B publication Critical patent/CN111210836B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种麦克风阵列波束形成动态调整方法,包括如下步骤:S1.计算出麦克风阵列采集得到的输入信噪比;S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。

Description

一种麦克风阵列波束形成动态调整方法
技术领域
本发明属于语音识别技术领域,具体涉及一种麦克风阵列波束形成动态调整方法。
背景技术
为提高语音识别率,在进行语音处理时通常有两种途径:增强目标语音信号或抑制噪音信号。对于麦克风阵列,通常会用到波束形成技术,实现的方法又包括广义旁瓣噪声消除器(Generalized Sidelobe Canceller,GSC)、延时-相加处理(delay-sum)、超指向等,而不同的方法效果也各不一样;对麦克风阵列语音信号调整的目的在于获得尽可能清晰的目标声源信息,而抑制除目标声源信息之外的其他噪音信息。
发明内容
为提高波束形成的稳健性,从而提高语音识别率,本发明公开了一种麦克风阵列波束形成动态调整方法。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法。
具体的,所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法。
优选的,所述步骤S1中输入信噪比的计算过程如下:
S11.计算第一个麦克风与其他麦克风信号的互相关系
Figure GDA0004091716630000011
其中,y(l,k)为傅里叶变换系数,y的下标1表示第1个麦克风,E()代表期望运算,上标“*”代表共轭运算;m表示第m个麦克风,l表示第l时间帧,k表示第k个频带;
S12.计算期望方向语音的相关系数:
Figure GDA0004091716630000012
θ为目标声源方向,
Figure GDA0004091716630000021
K为频带数量,fs代表采样率;下标S代表语音,d1,m表示第1个麦克风和第m个麦克风之间的距离;
S13.计算散射噪声的相关系数:
Figure GDA0004091716630000022
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
Figure GDA0004091716630000023
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比;
Figure GDA0004091716630000024
M为麦克风总数;
得到的均值信噪比为所述输入信噪比。
采用本发明所述麦克风阵列波束形成动态调整方法,通过计算环境中的信噪比(SNR,信号与噪声的比例)来动态调整波束形成的方法,降低环境变化对语音信号接收的影响,提高波束形成的稳健性,从而提高了语音识别率。
附图说明
图1为本发明所述麦克风阵列波束形成动态调整方法的一种具体实施方式流程示意图
图2为本发明所述方法的一个应用环境示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述麦克风阵列波束形成动态调整方法,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法:
包含多个麦克风y1,y2...ym,的语音装置在接收多路采样信号后,根据所述多路采样信号得到输入的信噪比,如图2所示。
假设共有M(M大于1)个麦克风,
ym(l,k),m=1,2,...,M代表第m个麦克风在第l时间帧,第k个频带的傅里叶变换系数,共K个频带。
c=340m/s代表声速,fs代表采样率,dm,n代表第m个麦克风与第n个麦克风的间距,θ为目标声源方向,
Figure GDA0004091716630000031
K为频带数量。
选定第一个麦克风作为选定麦克风,则信噪比计算过程如下:
S11.计算第一个麦克风与第m=2,...,M个麦克风信号的互相关系数
Figure GDA0004091716630000032
其中,E()代表期望运算,上标“*”代表共轭运算。
S12.计算期望方向语音的相关系数:
Figure GDA0004091716630000033
下标S代表语音。
S13.计算散射噪声的相关系数:
Figure GDA0004091716630000034
下标v代表噪音。
S14.计算基于第1个和第m个麦克风的信噪比,估计信噪比
Figure GDA0004091716630000035
下标y代表麦克风信号。
S15.再通过对全部麦克风求和取平均值的均值信噪比
Figure GDA0004091716630000036
当实时环境中得到的均值信噪比λ(l,k)大于高门限值N时,则认为环境相对安静,则波束形成选用波束增强比较大的方法;如GSC算法中目标波束方向滤波,不做旁瓣方向的抑制滤波。
当实时环境中得到的均值信噪比λ(l,k)小于低门限值M时,则认为环境噪音相对较大,则波束形成选用对目标方向波束增强比较大的办法,同时对其他方向做一定波束抑制。比如GSC算法中做目标方向的波束增强,同时也可以做陷波方向的抑制,或者采用delay-sum算法。
当实时环境中得到的信噪比λ(l,k)介于高门限值N和低门限值M之间时,则维持该时刻之前波束形成的方法;例如:如果在10点的时候信噪比大于N,就选用波束增强比较大的方法,如果在10点半的时候信噪比介于N和M之间,则维持之前的波束增强比较大的方法。
如果初始的信噪比λ0介于高门限值N和低门限值M之间,则默认为采用delay-sum方法。因为delay-sum算法在一定环境下能够较好抑制噪音,但又不损伤目标语音。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (1)

1.一种麦克风阵列波束形成动态调整方法,其特征在于,包括如下步骤:
S1.计算出麦克风阵列采集得到的输入信噪比;
S2.如果得到的输入信噪比大于高门限值,则采用第一算法处理;如果得到的输入信噪比低于低门限值,则采用第二算法处理;如果得到的输入信噪比介于高门限值和低门限值,则维持波束形成方法;
所述高门限值和低门限值为预先设定的高低不同的门限值,所述第一算法的波束增强效果优于第二算法;
所述第一算法为GSC算法中目标波束方向滤波,第二算法为GSC算法中的目标方向波束增强及陷波方向抑制,或者delay-sum算法;
所述步骤S1中输入信噪比的计算过程如下:
S11.计算第一个麦克风与其他麦克风信号的互相关系
Figure FDA0004091716620000011
其中,y(l,k)为傅里叶变换系数,y的下标1表示第1个麦克风,E()代表期望运算,上标“*”代表共轭运算;m表示第m个麦克风,l表示第l时间帧,k表示第k个频带;
S12.计算期望方向语音的相关系数:
Figure FDA0004091716620000012
θ为目标声源方向,
Figure FDA0004091716620000013
K为频带数量,fs代表采样率;下标S代表语音,d1,m表示第1个麦克风和第m个麦克风之间的距离;
S13.计算散射噪声的相关系数:
Figure FDA0004091716620000021
下标v代表噪音;
S14.计算基于选定麦克风和其他麦克风的信噪比,估计信噪比
Figure FDA0004091716620000022
下标y代表麦克风信号;
S15.再通过对全部麦克风求和取平均值的均值信噪比;
Figure FDA0004091716620000023
M为麦克风总数;
得到的均值信噪比为所述输入信噪比。
CN202010157395.1A 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法 Active CN111210836B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010157395.1A CN111210836B (zh) 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010157395.1A CN111210836B (zh) 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法

Publications (2)

Publication Number Publication Date
CN111210836A CN111210836A (zh) 2020-05-29
CN111210836B true CN111210836B (zh) 2023-04-25

Family

ID=70790062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010157395.1A Active CN111210836B (zh) 2020-03-09 2020-03-09 一种麦克风阵列波束形成动态调整方法

Country Status (1)

Country Link
CN (1) CN111210836B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798869B (zh) * 2020-09-10 2020-11-17 成都启英泰伦科技有限公司 一种基于双麦克风阵列的声源定位方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101088307A (zh) * 2003-12-24 2007-12-12 诺基亚公司 用于为广义边带抵消生成噪声参考的方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
US9980042B1 (en) * 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US10079026B1 (en) * 2017-08-23 2018-09-18 Cirrus Logic, Inc. Spatially-controlled noise reduction for headsets with variable microphone array orientation
CN110782912A (zh) * 2019-10-10 2020-02-11 安克创新科技股份有限公司 音源的控制方法以及扬声设备
CN110827847A (zh) * 2019-11-27 2020-02-21 高小翎 低信噪比见长的麦克风阵列语音去噪增强方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0907258B1 (en) * 1997-10-03 2007-01-03 Matsushita Electric Industrial Co., Ltd. Audio signal compression, speech signal compression and speech recognition
CA2452945C (en) * 2003-09-23 2016-05-10 Mcmaster University Binaural adaptive hearing system
EP2048659B1 (en) * 2007-10-08 2011-08-17 Harman Becker Automotive Systems GmbH Gain and spectral shape adjustment in audio signal processing
KR102505719B1 (ko) * 2016-08-12 2023-03-03 삼성전자주식회사 음성 인식이 가능한 디스플레이 장치 및 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101088307A (zh) * 2003-12-24 2007-12-12 诺基亚公司 用于为广义边带抵消生成噪声参考的方法
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
US9980042B1 (en) * 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US10079026B1 (en) * 2017-08-23 2018-09-18 Cirrus Logic, Inc. Spatially-controlled noise reduction for headsets with variable microphone array orientation
CN110782912A (zh) * 2019-10-10 2020-02-11 安克创新科技股份有限公司 音源的控制方法以及扬声设备
CN110827847A (zh) * 2019-11-27 2020-02-21 高小翎 低信噪比见长的麦克风阵列语音去噪增强方法

Also Published As

Publication number Publication date
CN111210836A (zh) 2020-05-29

Similar Documents

Publication Publication Date Title
CN108172235B (zh) 基于维纳后置滤波的ls波束形成混响抑制方法
US9984702B2 (en) Extraction of reverberant sound using microphone arrays
CN101510426B (zh) 一种噪声消除方法及系统
CN105590631B (zh) 信号处理的方法及装置
CN107018470B (zh) 一种基于环形麦克风阵列的语音记录方法及系统
US9838782B2 (en) Adaptive mixing of sub-band signals
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
US20140025374A1 (en) Speech enhancement to improve speech intelligibility and automatic speech recognition
US9232309B2 (en) Microphone array processing system
JP2009522942A (ja) 発話改善のためにマイク間レベル差を用いるシステム及び方法
CN101447190A (zh) 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法
CN103827967B (zh) 语音信号复原装置以及语音信号复原方法
CN101587712B (zh) 一种基于小型麦克风阵列的定向语音增强方法
CN111210836B (zh) 一种麦克风阵列波束形成动态调整方法
CN113903353A (zh) 一种基于空间区分性检测的定向噪声消除方法及装置
CN112530451A (zh) 基于去噪自编码器的语音增强方法
CN116312602B (zh) 基于干扰噪声空间谱矩阵的语音信号波束成形方法
Kumatani et al. Microphone array post-filter based on spatially-correlated noise measurements for distant speech recognition
CN109901114B (zh) 一种适用于声源定位的时延估计方法
Guo et al. Underwater target detection and localization with feature map and CNN-based classification
Xu et al. Adaptive speech enhancement algorithm based on first-order differential microphone array
CN110310650A (zh) 一种基于二阶微分麦克风阵列的语音增强算法
CN111933169B (zh) 一种二次利用语音存在概率的语音降噪方法
CN114639398B (zh) 一种基于麦克风阵列的宽带doa估计方法
Stolbov et al. Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant