CN112216299A - 双麦克风阵列波束形成方法、装置及设备 - Google Patents

双麦克风阵列波束形成方法、装置及设备 Download PDF

Info

Publication number
CN112216299A
CN112216299A CN201910629128.7A CN201910629128A CN112216299A CN 112216299 A CN112216299 A CN 112216299A CN 201910629128 A CN201910629128 A CN 201910629128A CN 112216299 A CN112216299 A CN 112216299A
Authority
CN
China
Prior art keywords
beam forming
preset target
fixed beam
preset
noise reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910629128.7A
Other languages
English (en)
Other versions
CN112216299B (zh
Inventor
杨晓霞
刘溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Original Assignee
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen Mobvoi Beijing Information Technology Co Ltd filed Critical Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority to CN201910629128.7A priority Critical patent/CN112216299B/zh
Publication of CN112216299A publication Critical patent/CN112216299A/zh
Application granted granted Critical
Publication of CN112216299B publication Critical patent/CN112216299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种双麦克风阵列波束形成方法、装置及设备。该方法包括:根据两个预设目标方位、双麦克风阵列的导向矢量和所述导向矢量与预设固定波束形成参数的预设关系,确定两个所述预设固定波束形成参数;其中,两个所述预设固定波束形成参数与两个所述预设目标方位一一对应;根据所述预设固定波束形成参数与麦克风原始数据,确定分别对应两个所述预设目标方位的初级固定波束形成结果;根据两个所述初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。本发明实施例的技术方案,实现不增加成本和麦克风阵列线路布置难度的情况下,减少目标方向语音失真,获得较为干净的语音信号,提高语音识别率。

Description

双麦克风阵列波束形成方法、装置及设备
技术领域
本发明实施例涉及语音信号处理技术,尤其涉及一种双麦克风阵列波束形成方法、装置及设备。
背景技术
基于麦克风阵列的语音增强技术己经广泛应用于通信、人机交互、语音识别系统等方面。
语音增强技术在某些使用场景下,语音的来源方向相对固定,如此情况下,需要对预设目标方位的语音进行增强,降低噪声干扰。例如,在车载语音交互场景中,驾驶席和副驾驶席是主要的语音信息来源,那么,要实现驾驶员和车机的语音交互,需要对来自副驾方向的声音进行抑制。针对这种需求,一般需要基于麦克风阵列,并采用波束形成(beamforming,BF)技术来实现对目标方向的定向拾音。
汽车厂商在设计麦克风阵列摆放时,往往考虑摆放位置及线路布放等因素,多数情况下倾向将麦克风布置在车内前排阅读灯处,而且由于空间狭小,仅能摆放两个麦克风。而从技术实现角度拉看,双麦波束形成较为困难,对干扰方向的抑制效果也不近理想。但增加麦克风阵列中麦克风的数量,会导致成本的增加和麦克风阵列线路布置的难度。
发明内容
本发明实施例提供一种双麦克风阵列波束形成方法、装置及设备,以实现不增加成本和麦克风阵列线路布置难度的情况下,减少目标方向语音失真,获得较为干净的语音信号,提高语音识别率。
第一方面,本发明实施例提供了一种双麦克风阵列波束形成方法,包括:
根据两个预设目标方位、双麦克风阵列的导向矢量和所述导向矢量与预设固定波束形成参数的预设关系,确定两个所述预设固定波束形成参数;其中,两个所述预设固定波束形成参数与两个所述预设目标方位一一对应;
根据所述预设固定波束形成参数与麦克风原始数据,确定分别对应两个所述预设目标方位的初级固定波束形成结果;
根据两个所述初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。
第二方面,本发明实施例还提供了一种双麦克风阵列波束形成装置,包括:
预设固定波束形成参数确定模块,用于根据两个预设目标方位、双麦克风阵列的导向矢量和所述导向矢量与预设固定波束形成参数的预设关系,确定两个所述预设固定波束形成参数;其中,两个所述预设固定波束形成参数与两个所述预设目标方位一一对应;
初级固定波束形成结果确定模块,用于根据所述预设固定波束形成参数与麦克风原始数据,确定分别对应两个所述预设目标方位的初级固定波束形成结果;
固定波束形成结果得到模块,用于根据两个所述初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
双麦克风阵列,用于获取音频数据;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的双麦克风阵列波束形成方法。
本发明实施例通过非线性降噪处理,抑制干扰方向声音,解决双麦波束形成较为困难,对干扰方向的抑制效果不近理想的问题,实现不增加成本和麦克风阵列线路布置难度的情况下,减少目标方向语音失真,获得较为干净的语音信号,提高语音识别率的效果。
附图说明
图1是本发明实施例一中的一种双麦克风阵列波束形成方法的流程图;
图2是本发明实施例一中的双麦克风阵列所在坐标系示意图;
图3是本发明实施例二中的一种双麦克风阵列波束形成方法的流程图;
图4是本发明实施例三中的一种双麦克风阵列波束形成装置的结构示意图;
图5是本发明实施例四中的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种双麦克风阵列波束形成方法的流程图,本实施例可适用于采用双麦克风阵列,对预设方向的干扰语音信号进行抑制,增强预设目标方向的语音信号的情况,例如车载环境的语音识别,该方法可以由双麦克风阵列波束形成装置来执行,该装置可以由硬件和/或软件来实现,具体包括如下步骤:
步骤110、根据两个预设目标方位、双麦克风阵列的导向矢量和导向矢量与预设固定波束形成参数的预设关系,确定两个预设固定波束形成参数;
其中,两个预设固定波束形成参数与两个预设目标方位一一对应。预设目标方位是相对于双麦克风阵列所处位置需要进行增强的方向,对于车载人机交互系统,麦克风阵列多布置在前排阅读灯位置,两个麦克风处于同一水平高度,左右横向布置。在这种车内环境下,预设目标方位就是指向主驾驶席和副驾驶席。预设坐标系可以为空间坐标系,并可以按照如下方式建立,以两个麦克风的连线中点为原点,x轴正向指向车尾方向,且x轴穿过主驾驶席头枕和副驾驶席头枕连线的中点,y轴穿过两个麦克风,y轴正向指向车辆向前行驶时的右方。示例的,如图2所示,在预设坐标系下,主驾驶员和副驾驶员所在位置对应的预设目标方位分别为-45°和45°。在预先确定了预设目标方位之后,计算分别指向这两个预设目标方位的预设固定波束形成参数。可选的,根据两个预设目标方位、双麦克风阵列的导向矢量和导向矢量与预设固定波束形成参数的预设关系,确定两个预设固定波束形成参数,包括:在预设坐标系下,根据双麦克风阵列和预设目标方位,确定预设目标方位对应的目标方位角;根据第一表达式
Figure BDA0002128161980000051
通过凸优化方法得到ω(θ0,f)的最优解,其中,目标方位角为θ0,波束宽度为θd,双麦克风阵列的导向矢量为α(θ,f),其中θ,f分别为方位角和频点,预设固定波束形成参数为ω(θ0,f)。
步骤120、根据预设固定波束形成参数与麦克风原始数据,确定分别对应两个预设目标方位的初级固定波束形成结果;
其中,麦克风原始数据是双麦克风阵列中每个麦克风拾取声波而输出的数字信号。在得到预设固定波束形成参数之后,利用该参数对每个传感器信号进行时移,并进行求和,得到指向第一预设目标方位拾音的波束形成之后的信号和指向第二预设目标方位拾音的波束形成之后的信号,作为初级固定波束形成结果,初级固定波束形成结果是采用权值固定不变的滤波器进行处理后的结果。初级固定波束形成结果还是会包含环境噪声,因此,需要进行降噪处理,以获得较为干净的语音信号。可选的,根据预设固定波束形成参数与麦克风原始数据,确定分别对应两个预设目标方位的初级固定波束形成结果,包括:将获得的预设固定波束形成参数ω(θ0,f)与两路麦克风原始数据分别相乘之后,进行相加,得到增强第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果
Figure BDA0002128161980000052
和增强第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果
Figure BDA0002128161980000053
步骤130、根据两个初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。
其中,对于两个初级固定波束形成结果进行非线性降噪处理,可以减少语音信号中的干扰,将其中一个预设目标方位作为目标方向数据,另一个预设目标方位作为干扰方向数据,分别对两个初级固定波束形成结果进行降噪处理。可以利用类似维纳滤波降噪的方法来得到非线性降噪处理的增益参数,然后根据增益参数,对初级固定波束形成结果进行处理,得到固定波束形成结果。
本实施例的技术方案,通过非线性降噪处理,抑制干扰方向声音,解决双麦波束形成较为困难,对干扰方向的抑制效果不近理想的问题,实现不增加成本和麦克风阵列线路布置难度的情况下,减少目标方向语音失真,获得较为干净的语音信号,提高语音识别率的效果。
实施例二
图3为本发明实施例二提供的一种双麦克风阵列波束形成方法的流程图,本实施例的技术方案在上述技术方案的基础上进一步细化,该方法包括:
步骤310、根据两个预设目标方位、双麦克风阵列的导向矢量和导向矢量与预设固定波束形成参数的预设关系,确定两个预设固定波束形成参数;
步骤320、根据预设固定波束形成参数与麦克风原始数据,确定分别对应两个预设目标方位的初级固定波束形成结果;
步骤330、根据两个初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果。
其中,通过至少两级非线性降噪处理,可以更好地实现目标方向语音增强,干扰方向语音抑制。每级非线性降噪处理的方式是相同的,后一级的处理在前一级处理结果的基础上进行。可选的,根据两个初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果,包括:
以第一预设目标方位为目标方向,第二预设目标方位为干扰方向,根据第二表达式
Figure BDA0002128161980000071
得到第一级非线性降噪处理第n帧频点f处的第一增益参数
Figure BDA0002128161980000072
其中,
Figure BDA0002128161980000073
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure BDA0002128161980000074
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果。
可选的,所述根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果,包括:
根据第三表达式
Figure BDA0002128161980000078
得到第一级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的所述第一预设目标方位一级降噪固定波束形成结果。
可选的,在所述根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果之后,还包括:
以所述第一预设目标方位作为目标方向,所述第二预设目标方位为干扰方向,根据第四表达式
Figure BDA0002128161980000075
得到第二级非线性降噪处理第n帧频点f处的第二增益参数
Figure BDA0002128161980000076
其中,200Hz≤f≤2500Hz;
根据第五表达式
Figure BDA0002128161980000079
得到第二级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的第一预设目标方位二级降噪固定波束形成结果,并作为指向所述第一预设目标方位的所述固定波束形成结果。
可选的,所述根据两个所述初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果,包括:
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第六表达式
Figure BDA0002128161980000081
得到第一级非线性降噪处理第n帧频点f处的第三增益参数
Figure BDA0002128161980000082
其中,
Figure BDA0002128161980000083
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure BDA0002128161980000084
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据第七表达式
Figure BDA0002128161980000089
得到第一级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位一级降噪固定波束形成结果;
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第八表达式
Figure BDA0002128161980000086
得到第二级非线性降噪处理第n帧频点f处的第四增益参数
Figure BDA0002128161980000087
其中,200Hz≤f≤2500Hz;
根据第九表达式
Figure BDA0002128161980000088
得到第二级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位二级降噪固定波束形成结果,并作为指向所述第二预设目标方位的所述固定波束形成结果。固定波束形成结果包括指向第一预设目标方位的固定波束形成结果和指向第二预设目标方位的固定波束形成结果。
本实施例的技术方案,采用至少两级非线性降噪处理,提高对干扰方向的抑制效果,增强目标方向语音,从而得到较为干净的语音信号。
实施例三
图4为本发明实施例三提供的一种双麦克风阵列波束形成装置的结构示意图,该装置包括:
预设固定波束形成参数确定模块410,用于根据两个预设目标方位、双麦克风阵列的导向矢量和导向矢量与预设固定波束形成参数的预设关系,确定两个预设固定波束形成参数;其中,两个预设固定波束形成参数与两个预设目标方位一一对应;
初级固定波束形成结果确定模块420,用于根据预设固定波束形成参数与麦克风原始数据,确定分别对应两个预设目标方位的初级固定波束形成结果;
固定波束形成结果得到模块430,用于根据两个初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。
本实施例的技术方案,通过非线性降噪处理,抑制干扰方向声音,解决双麦波束形成较为困难,对干扰方向的抑制效果不近理想的问题,实现不增加成本和麦克风阵列线路布置难度的情况下,减少目标方向语音失真,获得较为干净的语音信号,提高语音识别率的效果。
可选的,预设固定波束形成参数确定模块410,包括:
目标方位角确定单元,用于在预设坐标系下,根据双麦克风阵列和预设目标方位,确定预设目标方位对应的目标方位角;
预设固定波束形成参数计算单元,用于根据第一表达式
Figure BDA0002128161980000091
通过凸优化方法得到ω(θ0,f)的最优解,其中,目标方位角为θ0,波束宽度为θd,双麦克风阵列的导向矢量为α(θ,f),其中θ,f分别为方位角和频点,预设固定波束形成参数为ω(θ0,f)。
可选的,初级固定波束形成结果确定模块420,具体用于:
将获得的预设固定波束形成参数ω(θ0,f)与两路麦克风原始数据分别相乘之后,进行相加,得到增强第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果
Figure BDA0002128161980000101
和增强第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果
Figure BDA0002128161980000102
可选的,固定波束形成结果得到模块430,包括:
固定波束形成结果得到单元,用于根据两个初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果。
可选的,固定波束形成结果得到单元,具体用于:
以第一预设目标方位为目标方向,第二预设目标方位为干扰方向,根据第二表达式
Figure BDA0002128161980000103
得到第一级非线性降噪处理第n帧频点f处的第一增益参数
Figure BDA0002128161980000104
其中,
Figure BDA0002128161980000105
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure BDA0002128161980000106
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果。
可选的,固定波束形成结果得到单元,具体用于:
根据第三表达式
Figure BDA0002128161980000107
得到第一级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的所述第一预设目标方位一级降噪固定波束形成结果。
可选的,固定波束形成结果得到单元,还具体用于:
在所述根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果之后,以所述第一预设目标方位作为目标方向,所述第二预设目标方位为干扰方向,根据第四表达式
Figure BDA0002128161980000111
得到第二级非线性降噪处理第n帧频点f处的第二增益参数
Figure BDA0002128161980000112
其中,200Hz≤f≤2500Hz;
根据第五表达式
Figure BDA0002128161980000113
得到第二级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的第一预设目标方位二级降噪固定波束形成结果,并作为指向所述第一预设目标方位的所述固定波束形成结果。
可选的,固定波束形成结果得到单元,具体用于:
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第六表达式
Figure BDA0002128161980000114
得到第一级非线性降噪处理第n帧频点f处的第三增益参数
Figure BDA0002128161980000115
其中,
Figure BDA0002128161980000116
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure BDA0002128161980000117
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据第七表达式
Figure BDA0002128161980000118
得到第一级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位一级降噪固定波束形成结果;
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第八表达式
Figure BDA0002128161980000119
得到第二级非线性降噪处理第n帧频点f处的第四增益参数
Figure BDA0002128161980000121
其中,200Hz≤f≤2500Hz;
根据第九表达式
Figure BDA0002128161980000122
得到第二级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位二级降噪固定波束形成结果,并作为指向所述第二预设目标方位的所述固定波束形成结果。
本发明实施例所提供的双麦克风阵列波束形成装置可执行本发明任意实施例所提供的双麦克风阵列波束形成方法,具备执行方法相应的功能模块和有益效果。
实施例四
图5为本发明实施例四提供的一种设备的结构示意图,如图5所示,该设备包括处理器510、存储器520和双麦克风阵列530;设备中处理器510的数量可以是一个或多个,图5中以一个处理器510为例;设备中的处理器510、存储器520和双麦克风阵列530可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器520作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的双麦克风阵列波束形成方法对应的程序指令/模块(例如,双麦克风阵列波束形成装置中的预设固定波束形成参数确定模块410、初级固定波束形成结果确定模块420和固定波束形成结果得到模块430)。处理器510通过运行存储在存储器520中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的双麦克风阵列波束形成方法。
存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器520可进一步包括相对于处理器510远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
双麦克风阵列530用于获取音频数据,该音频数据中包括指向预设目标方位的语音信息。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (17)

1.一种双麦克风阵列波束形成方法,其特征在于,包括:
根据两个预设目标方位、双麦克风阵列的导向矢量和所述导向矢量与预设固定波束形成参数的预设关系,确定两个所述预设固定波束形成参数;其中,两个所述预设固定波束形成参数与两个所述预设目标方位一一对应;
根据所述预设固定波束形成参数与麦克风原始数据,确定分别对应两个所述预设目标方位的初级固定波束形成结果;
根据两个所述初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。
2.根据权利要求1所述的双麦克风阵列波束形成方法,其特征在于,所述根据两个预设目标方位、双麦克风阵列的导向矢量和所述导向矢量与预设固定波束形成参数的预设关系,确定两个所述预设固定波束形成参数,包括:
在预设坐标系下,根据所述双麦克风阵列和所述预设目标方位,确定所述预设目标方位对应的目标方位角;
根据第一表达式
Figure FDA0002128161970000011
通过凸优化方法得到ω(θ0,f)的最优解,其中,所述目标方位角为θ0,波束宽度为θd,所述双麦克风阵列的导向矢量为α(θ,f),其中θ,f分别为方位角和频点,所述预设固定波束形成参数为ω(θ0,f)。
3.根据权利要求2所述的双麦克风阵列波束形成方法,其特征在于,所述根据所述预设固定波束形成参数与麦克风原始数据,确定分别对应两个所述预设目标方位的初级固定波束形成结果,包括:
将获得的所述预设固定波束形成参数ω(θ0,f)与两路麦克风原始数据分别相乘之后,进行相加,得到增强第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果
Figure FDA0002128161970000021
和增强第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果
Figure FDA0002128161970000022
4.根据权利要求1所述的双麦克风阵列波束形成方法,其特征在于,所述根据两个所述初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果,包括:
根据两个所述初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果。
5.根据权利要求4所述的双麦克风阵列波束形成方法,其特征在于,所述根据两个所述初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果,包括:
以第一预设目标方位为目标方向,第二预设目标方位为干扰方向,根据第二表达式
Figure FDA0002128161970000023
得到第一级非线性降噪处理第n帧频点f处的第一增益参数
Figure FDA0002128161970000024
其中,
Figure FDA0002128161970000025
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure FDA0002128161970000026
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果。
6.根据权利要求5所述的双麦克风阵列波束形成方法,其特征在于,所述根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果,包括:
根据第三表达式
Figure FDA0002128161970000031
得到第一级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的所述第一预设目标方位一级降噪固定波束形成结果。
7.根据权利要求5或6所述的双麦克风阵列波束形成方法,其特征在于,在所述根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果之后,还包括:
以所述第一预设目标方位作为目标方向,所述第二预设目标方位为干扰方向,根据第四表达式
Figure FDA0002128161970000032
得到第二级非线性降噪处理第n帧频点f处的第二增益参数
Figure FDA0002128161970000033
其中,200Hz≤f≤2500Hz;
根据第五表达式
Figure FDA0002128161970000034
得到第二级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的第一预设目标方位二级降噪固定波束形成结果,并作为指向所述第一预设目标方位的所述固定波束形成结果。
8.根据权利要求4所述的双麦克风阵列波束形成方法,其特征在于,所述根据两个所述初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果,包括:
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第六表达式
Figure FDA0002128161970000035
得到第一级非线性降噪处理第n帧频点f处的第三增益参数
Figure FDA0002128161970000036
其中,
Figure FDA0002128161970000037
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure FDA0002128161970000038
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据第七表达式
Figure FDA0002128161970000041
得到第一级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位一级降噪固定波束形成结果;
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第八表达式
Figure FDA0002128161970000042
得到第二级非线性降噪处理第n帧频点f处的第四增益参数
Figure FDA0002128161970000043
其中,200Hz≤f≤2500Hz;
根据第九表达式
Figure FDA0002128161970000044
得到第二级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位二级降噪固定波束形成结果,并作为指向所述第二预设目标方位的所述固定波束形成结果。
9.一种双麦克风阵列波束形成装置,其特征在于,包括:
预设固定波束形成参数确定模块,用于根据两个预设目标方位、双麦克风阵列的导向矢量和所述导向矢量与预设固定波束形成参数的预设关系,确定两个所述预设固定波束形成参数;其中,两个所述预设固定波束形成参数与两个所述预设目标方位一一对应;
初级固定波束形成结果确定模块,用于根据所述预设固定波束形成参数与麦克风原始数据,确定分别对应两个所述预设目标方位的初级固定波束形成结果;
固定波束形成结果得到模块,用于根据两个所述初级固定波束形成结果,进行非线性降噪处理,得到固定波束形成结果。
10.根据权利要求9所述的双麦克风阵列波束形成装置,其特征在于,所述预设固定波束形成参数确定模块,包括:
目标方位角确定单元,用于在预设坐标系下,根据所述双麦克风阵列和所述预设目标方位,确定所述预设目标方位对应的目标方位角;
预设固定波束形成参数计算单元,用于根据第一表达式
Figure FDA0002128161970000051
通过凸优化方法得到ω(θ0,f)的最优解,其中,所述目标方位角为θ0,波束宽度为θd,所述双麦克风阵列的导向矢量为α(θ,f),其中θ,f分别为方位角和频点,所述预设固定波束形成参数为ω(θ0,f)。
11.根据权利要求10所述的双麦克风阵列波束形成装置,其特征在于,所述初级固定波束形成结果确定模块,具体用于:
将获得的所述预设固定波束形成参数ω(θ0,f)与两路麦克风原始数据分别相乘之后,进行相加,得到增强第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果
Figure FDA0002128161970000052
和增强第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果
Figure FDA0002128161970000053
12.根据权利要求9所述的双麦克风阵列波束形成装置,其特征在于,所述固定波束形成结果得到模块,包括:
固定波束形成结果得到单元,用于根据两个所述初级固定波束形成结果,进行至少两级非线性降噪处理,得到固定波束形成结果。
13.根据权利要求12所述的双麦克风阵列波束形成装置,其特征在于,所述固定波束形成结果得到单元,具体用于:
以第一预设目标方位为目标方向,第二预设目标方位为干扰方向,根据第二表达式
Figure FDA0002128161970000061
得到第一级非线性降噪处理第n帧频点f处的第一增益参数
Figure FDA0002128161970000062
其中,
Figure FDA0002128161970000063
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure FDA0002128161970000064
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果。
14.根据权利要求13所述的双麦克风阵列波束形成装置,其特征在于,所述固定波束形成结果得到单元,具体用于:
根据第三表达式
Figure FDA0002128161970000065
得到第一级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的所述第一预设目标方位一级降噪固定波束形成结果。
15.根据权利要求13或14所述的双麦克风阵列波束形成装置,其特征在于,所述固定波束形成结果得到单元,还具体用于:
在所述根据所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果和所述第一增益参数,确定指向所述第一预设目标方位第n帧频点f处的第一预设目标方位一级降噪固定波束形成结果之后,
以所述第一预设目标方位作为目标方向,所述第二预设目标方位为干扰方向,根据第四表达式
Figure FDA0002128161970000066
得到第二级非线性降噪处理第n帧频点f处的第二增益参数
Figure FDA0002128161970000067
其中,200Hz≤f≤2500Hz;
根据第五表达式
Figure FDA0002128161970000068
得到第二级非线性降噪处理指向所述第一预设目标方位第n帧频点f处的第一预设目标方位二级降噪固定波束形成结果,并作为指向所述第一预设目标方位的所述固定波束形成结果。
16.根据权利要求12所述的双麦克风阵列波束形成装置,其特征在于,所述固定波束形成结果得到单元,具体用于:
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第六表达式
Figure FDA0002128161970000071
得到第一级非线性降噪处理第n帧频点f处的第三增益参数
Figure FDA0002128161970000072
其中,
Figure FDA0002128161970000073
为增强所述第一预设目标方位的第n帧频点f处的第一初级固定波束形成结果,
Figure FDA0002128161970000074
为增强所述第二预设目标方位的第n帧频点f处的第二初级固定波束形成结果;
根据第七表达式
Figure FDA0002128161970000075
得到第一级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位一级降噪固定波束形成结果;
以所述第二预设目标方位为目标方向,所述第一预设目标方位为干扰方向,根据第八表达式
Figure FDA0002128161970000076
得到第二级非线性降噪处理第n帧频点f处的第四增益参数
Figure FDA0002128161970000077
其中,200Hz≤f≤2500Hz;
根据第九表达式
Figure FDA0002128161970000078
得到第二级非线性降噪处理指向所述第二预设目标方位的第n帧频点f处的第二预设目标方位二级降噪固定波束形成结果,并作为指向所述第二预设目标方位的所述固定波束形成结果。
17.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
双麦克风阵列,用于获取音频数据;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的双麦克风阵列波束形成方法。
CN201910629128.7A 2019-07-12 2019-07-12 双麦克风阵列波束形成方法、装置及设备 Active CN112216299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910629128.7A CN112216299B (zh) 2019-07-12 2019-07-12 双麦克风阵列波束形成方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910629128.7A CN112216299B (zh) 2019-07-12 2019-07-12 双麦克风阵列波束形成方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112216299A true CN112216299A (zh) 2021-01-12
CN112216299B CN112216299B (zh) 2024-02-20

Family

ID=74047809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910629128.7A Active CN112216299B (zh) 2019-07-12 2019-07-12 双麦克风阵列波束形成方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112216299B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175006A1 (en) * 2003-03-06 2004-09-09 Samsung Electronics Co., Ltd. Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same
CN102474680A (zh) * 2009-07-24 2012-05-23 皇家飞利浦电子股份有限公司 音频波束形成
US20130216064A1 (en) * 2010-10-29 2013-08-22 Mightyworks Co., Ltd. Multi-beam sound system
JP2013201525A (ja) * 2012-03-23 2013-10-03 Mitsubishi Electric Corp ビームフォーミング処理装置
CN104936091A (zh) * 2015-05-14 2015-09-23 科大讯飞股份有限公司 基于圆形麦克风阵列的智能交互方法及系统
US9966059B1 (en) * 2017-09-06 2018-05-08 Amazon Technologies, Inc. Reconfigurale fixed beam former using given microphone array
CN108717495A (zh) * 2018-05-22 2018-10-30 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备
CN108831498A (zh) * 2018-05-22 2018-11-16 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备
CN108831495A (zh) * 2018-06-04 2018-11-16 桂林电子科技大学 一种应用于噪声环境下语音识别的语音增强方法
CN109102822A (zh) * 2018-07-25 2018-12-28 出门问问信息科技有限公司 一种基于固定波束形成的滤波方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175006A1 (en) * 2003-03-06 2004-09-09 Samsung Electronics Co., Ltd. Microphone array, method and apparatus for forming constant directivity beams using the same, and method and apparatus for estimating acoustic source direction using the same
CN102474680A (zh) * 2009-07-24 2012-05-23 皇家飞利浦电子股份有限公司 音频波束形成
US20130216064A1 (en) * 2010-10-29 2013-08-22 Mightyworks Co., Ltd. Multi-beam sound system
JP2013201525A (ja) * 2012-03-23 2013-10-03 Mitsubishi Electric Corp ビームフォーミング処理装置
CN104936091A (zh) * 2015-05-14 2015-09-23 科大讯飞股份有限公司 基于圆形麦克风阵列的智能交互方法及系统
US9966059B1 (en) * 2017-09-06 2018-05-08 Amazon Technologies, Inc. Reconfigurale fixed beam former using given microphone array
CN108717495A (zh) * 2018-05-22 2018-10-30 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备
CN108831498A (zh) * 2018-05-22 2018-11-16 出门问问信息科技有限公司 多波束波束成形的方法、装置及电子设备
CN108831495A (zh) * 2018-06-04 2018-11-16 桂林电子科技大学 一种应用于噪声环境下语音识别的语音增强方法
CN109102822A (zh) * 2018-07-25 2018-12-28 出门问问信息科技有限公司 一种基于固定波束形成的滤波方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
余洋: "基于麦克风阵列的近场环境下语音增强算法研究", 中国优秀硕士论文全文数据库·信息科技辑 *

Also Published As

Publication number Publication date
CN112216299B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
US9922663B2 (en) Voice signal processing method and apparatus
CN109102822B (zh) 一种基于固定波束形成的滤波方法及装置
US9171551B2 (en) Unified microphone pre-processing system and method
EP2222091B1 (en) Method for determining a set of filter coefficients for an acoustic echo compensation means
US9002027B2 (en) Space-time noise reduction system for use in a vehicle and method of forming same
US20160150315A1 (en) System and method for echo cancellation
JP5913340B2 (ja) マルチビーム音響システム
CN108831498B (zh) 多波束波束成形的方法、装置及电子设备
CN111435598B (zh) 语音信号处理方法、装置、计算机可读介质及电子设备
CN109285557B (zh) 一种定向拾音方法、装置及电子设备
KR20120123566A (ko) 음원 분리 장치, 음원 분리 방법, 및 프로그램
US9990939B2 (en) Methods and apparatus for broadened beamwidth beamforming and postfiltering
CN111599357A (zh) 一种车内多音区拾音方法、装置、电子设备及存储介质
EP3852105A3 (en) Noise reduction method and apparatus for on-board environment, electronic device and storage medium
CN113050035B (zh) 一种二维定向拾音方法及装置
CN112216298B (zh) 双麦克风阵列声源定向方法、装置及设备
CN112151058B (zh) 一种声音信号的处理方法、装置及设备
CN112216299A (zh) 双麦克风阵列波束形成方法、装置及设备
CN116110419A (zh) 一种自适应波束整形的智能会议音频处理方法及系统
CN114937460A (zh) 一种主动降噪方法、系统及相关装置
US10264383B1 (en) Multi-listener stereo image array
Ayllón et al. An evolutionary algorithm to optimize the microphone array configuration for speech acquisition in vehicles
US11508348B2 (en) Directional noise suppression
CN112466305B (zh) 饮水机的语音控制方法及装置
WO2020186434A1 (en) Flexible differential microphone arrays with fractional order

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant