CN110010147A

CN110010147A - 一种麦克风阵列语音增强的方法和系统

Info

Publication number: CN110010147A
Application number: CN201910199908.2A
Authority: CN
Inventors: 王宇芳; 童峰; 黄惠详; 郭秋涵
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2019-07-12
Anticipated expiration: 2039-03-15
Also published as: CN110010147B

Abstract

公开了一种麦克风阵列语音增强的方法和系统，其包括利用麦克风阵列进行多通道的语音信号的采集，接收能量收集器获得的语音能量，获取声源方位信息，利用声源方位信息的几何关系计算麦克风阵列信号各通道的时延补偿值，根据麦克风阵列信号各通道的时延补偿值进行波束成形处理，实现语音信息的增强。本发明充分利用圆锥结构本身的信号反射聚焦特性进行对应角度范围内的语音能量收集，可实时获取方位信息，无需采用复杂的方位估计算法，系统实现简单方便。

Description

一种麦克风阵列语音增强的方法和系统

技术领域

本发明涉及麦克风阵列语音信号处理，尤其是涉及一种麦克风阵列语音增强的方法和系统。

背景技术

随着多媒体技术的发展，各类学校课堂教学中已普遍采用麦克风提高教师授课效果，特别是在高校公共课、通识课、讲座课等大课教学中通过麦克风采集语音后多媒体系统放大可有效保证大空间内的授课效果。但是，由于受到混响和背景噪声干扰，麦克风接收到的信号通常为带噪语音，将影响语音的可懂度，目前常用的讲台固定麦克风获教师可随身携带的无线麦克风均存在这个问题，从而影响课堂教学的的整体效果，因此需要对麦克风采集的带噪语音进行增强处理以保证课题教学效果。

从语音信号处理的角度，在噪声、混响等较为复杂的声学环境下，单麦克风语音增强已无法满足需求。麦克风阵列可对不同方向上的信号形成不同响应，也即阵列的空间指向特性。当语音和周围环境信息被多个麦克风聚集时，麦克风阵列可以在期望的方向上有效地形成一个波束去拾取波束内的信号，并消除波束外的噪声，从而达到同时提取声源和抑制噪声的目的。当前，在语音识别、声纹识别、视频会议、智能家居等领域麦克风阵列技术已经得到广泛应用。

利用麦克风阵列进行语音增强，是通过阵列在期望声源方向形成波束来实现的，因此，获取声源的位置或者方位是麦克风阵列语音增强技术的前提条件。基于麦克风阵列的声源定位和语音增强技术是密切相关的，位置估计是进行波束形成的依据，是麦克风阵列语音增强的基础，也直接影响其语音增强性能。

常用的麦克风阵列定位技术在实际应用中存在种种问题，严重制约麦克风阵列语音增强算法的性能。如到达时间差定位技术在室内严重混响条件下精度严重下降；基于高分辨率谱估计的定位方法由于需要在全空间进行解搜索运算量极大，且其处理语音这类宽带信号时效果无法保证。

同时，由于需要先进行声源定位运算，然后再进行麦克风阵列语音增强处理，而课堂教学中教师在授课、板书、提问等教学环节中往往处于运动状态时，采用传统声源定位算法进行麦克风阵列语音增强的传统处理方法将导致声源定位滞后，从而造成语音增强效果不理想。

如参考文献1中发明专利(专利号：ZL 2010105911582)提出一种视频定位的长距离拾音装置，该方法提供一种可以有效增强视频监控画面指定目标音源品质，抑制近场音源干扰与噪音的视频定位长距离拾音装置，通过对视频监控画面进行目标定位辅助指向性麦克风对准目标增强语音，提高长距离拾音效果。但该方法一方面需要借助视频摄像头设备，系统安装、使用比较复杂；另一方面目标定位选取仍需人工操作，无法实现自动对准。

参考文献2中发明专利(专利号ZL200410002739.2)提出一种结合定位技术的麦克风阵列收音方法及其系统，通过结合麦克风阵列获取的声波信号和数码摄像机获取的目标声源画面来技术声源方位，由于还需借助图像搜索算法判断数码摄像机获得画面中目标音源的大小及方位来计算，系统定位处理的运算量大且性能将受光照条件等的影响。

参考文献3中发明专利申请(申请号：201110142759.X)提出一种麦克风阵列语音波束形成方法、语音信号处理装置及系统，采用先将各通道语音信号转换到频域，然后进行广义相关分析获取各通道相对时延，并据此进行各通道时延补偿、加权叠加。由于采用的仍然是各通道语音信号间的频域相关，在存在严重混响等条件时时延估计精度将显著下降，从而影响了时延补偿加权叠加语音增强的性能。

发明内容

本发明提出了一种麦克风阵列语音增强的方法和系统。

在一个方面，本发明提出了一种麦克风阵列语音增强的方法，该方法包括以下步骤：

S1：利用麦克风阵列进行多通道的语音信号的采集；

S2：接收能量收集器获得的语音能量，获取声源方位信息；

S3：利用声源方位信息的几何关系计算麦克风阵列中各个麦克风阵列信号各通道的时延补偿值；

S4：根据麦克风阵列信号各通道的时延补偿值进行波束成形处理。通过麦克风阵列和能量收集器获得声源可能方向的语音能量，据此计算声源方位；在获得声源方位信息后可换算出每个通道的时延补偿指并据此进行声源方向的时延补偿叠加波束成形，实现波束指向声源的麦克风阵列语音增强。

在一些具体实施例中，能量收集器包括多个圆锥形反射器件，多个圆锥形反射器件相互贴紧且顶部相交于一点，多个圆锥形反射器件的中心线在同一平面上，多个圆锥形反射器件的开口部构成的收集范围覆盖声源的活动区域，圆锥形反射器件顶点设置有第一麦克风。利用圆锥结构本身的信号反射聚焦特性进行对应角度范围内的语音能量收集，使系统实现更加简单方便。

在一些具体实施例中，步骤S2中声源方位信息的获取和步骤S3中时延补偿值的计算同时进行。声源方位估计和语音增强算法同时进行，可以实现声源方位的实时获取，具有一定范围内的声源跟踪能力。

在一些具体实施例中，步骤S2中声源方位信息的计算公式为：其中，j为能量收集器的通道编号，energy(j)为能量收集器获得的语音能量，θ_Δ为圆锥结构通过语音信号能量收集器5个圆锥形反射器件的相邻角度，也即圆锥形反射器件的开角。

在一些具体的实施例中，麦克风阵列包括5个等间距排列的第二麦克风组成的5元麦克风线阵，5元麦克风线阵包括第二麦克风、前置放大电路和处理器。5元麦克风线阵具有体积小、结构简单、电声性能好的特点。

在一些具体的实施例中，第一麦克风和第二麦克风通过处理器进行切换。

在一些具体实施例中，步骤S3中所述麦克风阵列中各个通道麦克风接收的语音信号s_i(k)的时延补偿值的计算公式为：

s′_i(k)＝s_i(k′)

其中i为麦克风阵列中麦克风阵元编号，d为线阵麦克风阵元间距，C为空气中声速，f_s为麦克风阵列语音信号的采样频率，round[]代表取整运算。

根据本发明的另一方面，提出了一种麦克风阵列语音增强系统，该系统包括：

5元麦克风线阵：用于进行多通道的语音信号的采集；

能量收集装置：用于接收能量收集器获得的语音能量；

方位计算装置：用于利用语音能量，计算声源方位信息；

加权叠加装置：用于利用声源方位信息的几何关系计算麦克风阵列信号各通道的时延补偿值，进行波束成形处理，增强语音信号。

在一些具体的实施例中，5元麦克风阵列的输出端与加权叠加装置的第一输入端连接，能量收集装置的输出端与方位计算装置的输入端连接，方位计算装置的输出端与加权叠加装置的第二输入端连接。

本发明提出一种麦克风阵列语音增强的方法和系统，利用麦克风阵列进行多通道的语音信号的采集，接收能量收集器获得的语音能量，获取声源方位信息，利用声源方位信息的几何关系计算麦克风阵列信号各通道的时延补偿值，根据麦克风阵列信号各通道的时延补偿值进行波束成形处理，实现语音信息的增强。本发明充分利用能量收集器的圆锥结构本身的信号反射聚焦特性进行对应角度范围内的语音能量收集，可实时获取方位信息，无需采用复杂的方位估计算法，系统实现简单方便。

附图说明

包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点，因为通过引用以下详细描述，它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是根据本发明的一个实施例的麦克风阵列语音增强的方法流程图；

图2是根据本发明的一个实施例的信号处理的原理图；

图3是根据本发明的一个实施例的能量收集器方位计算、通道时延补偿值计算原理图；

图4是根据本发明的一个实施例的麦克风阵列语音增强系统的结构图。

图5是根据本发明的一个实施例的MAX9814音频放大电路图；

图6是根据本发明的一个实施例的4052通道选择器引脚图；

图7是根据本发明的一个实施例的STM32F407微处理器接口示意图；

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

根据本发明的一个实施例的麦克风阵列语音增强的方法，图1示出了根据本发明的实施例的麦克风阵列语音增强的方法流程图。如图1所示，该方法包括以下步骤：

S1：利用麦克风阵列进行多通道的语音信号的采集。麦克风阵列为5元麦克风线阵，由5个等间距排列的麦克风(m0，m2，…m4))组成线阵，阵列中各麦克风分别进行语音信号采集工作，5元麦克风线阵由压强式驻极体第二麦克风mic0,…,mic4，前置放大电路以及处理器构成。

在具体的实施例中，前置放大电路为MAX9814音频放大器芯片构成的前置放大电路，处理器为STM32F407嵌入式处理器，麦克风阵列在进行语音信号采集的过程中，扫描的采样频率为fs＝16000Hz，且麦克风的间距为d＝0.15m。

S2：接收能量收集器获得的语音能量，获取声源方位信息。能量收集器包括多个圆锥形反射器件，多个圆锥形反射器件相互贴紧且顶部相交于一点，多个圆锥形反射器件的中心线在同一平面上，多个圆锥形反射器件的开口部构成的收集范围覆盖声源的活动区域，圆锥形反射器件顶点设置有第一麦克风。充分利用圆锥结构本身的信号反射聚焦特性进行对应角度范围内的语音能量收集，系统实现简单方便，无需采用复杂的方位估计算法。

在具体的实施例中，如图2所示，第一麦克风选用同样的压强式驻极体麦克风emic0,…,emic4，能量收集器的5个第一麦克风与麦克风阵列的5个第二麦克风共用MAX9814音频放大电路及STM32F407嵌入式处理器，并通过STM32F407嵌入式处理器输出控制信号进行麦克风阵列的5个第二麦克风与能量收集器的5个第一麦克风之间的切换。

如图3所示，以5元麦克风线阵所在的水平线为X轴，以线阵中间的麦克风m2位置为坐标原点建立定位坐标系。利用5个圆锥结构组合而成的反射能量收集器可对其后方间隔36°的5个声源可能的方向通过对应角度的圆锥结构通过语音信号反射获得语音能量：

语音能量j＝1,2,3,4,5

声源方向角

其中，j为能量收集器的通道编号，x_j(k)为能量收集器第j通道的接收信号，W为能量收集器语音能量计算窗长(本实施例中W＝128)，θ_Δ为能量收集器5个圆锥反射器件的相邻角度，也即圆锥反射器件的开角(本实施例中θ_Δ＝36度)，α为估计获得的声源方向。

S3：利用声源方位信息的几何关系计算麦克风阵列中各个麦克风阵列信号各通道的时延补偿值。

本发明的一个重要的发明点是利用能量收集器获取声源方位从而计算麦克风阵列各通道的时延补偿值。在步骤S2获得声源方位信息α后，以线阵的中心阵元麦克风m2作为基准，即对m2接收的语音信号不作时延补偿，对线阵中各个通道麦克风接收的语音信号Si(k)可根据方位角进行如下时延补偿计算：

s′_i(k)＝s_i(k′)

其中i为线阵麦克风阵元编号，d为线阵阵元间距(本实施例中取d＝15cm)，C为空气中声速(本实施例中取340m/s),fs为麦克风阵列语音信号的采样频率(在本实施例中为16ksps)，round[]代表取整运算。

S4：根据麦克风阵列信号各通道的时延补偿值进行波束成形处理。在通过能量采集器与方位估计模块获得声源方位后，模数转换后的多通道语音信号在STM32F407微处理器中送入加权叠加模块进行波束形成处理语音增强。

根据本发明的实施例的语音增强方法可在很多应用场景中使用，例如在课堂教学中，将5元麦克风线阵安装于讲台上进行年信号多通道采集，麦克风阵列采集的语音信号进行前置放大、模数转换，能量收集器为圆锥形构成的声反射器件，且安装在讲台上面对教师的方向，分别进行5个可能方向的语音能量收集，5个圆锥形反射器件分别对准讲台后5个教师的可能角度，每个圆锥形反射器件的开角为36°，构成覆盖面对讲台180°范围的收集区域，能量收集器接收到的5个可能方向教室的语音信号进过前置放大、模数转换后进行方位计算，根据5个可能方向语音计算每个方向语音能量信息，获得教师的方位信息，根据教师的方位信息计算各通道时延补偿值，据此对麦克风阵列各通道进行时延补偿、叠加以增强教师语音信号。利用结构简单的圆锥形构成的声反射器件组成对准几个可能方向获得对应语音能能量进行对比，从而根据获得的教师方位信息，并用于麦克风阵列语音增强算法实现语音增强，教师方位估计和语音增强算法可同时进行，从而可实现教师方位的实时获取，使得课堂教学过程中一定范围内移动的教师也具有跟踪能力，可保证麦克风阵列波束对准教师拾取语音信号，同时依托的能量收集器、麦克风阵列等设备均安装于讲台上，教师身上无需携带麦克风设备，使教师上课的过程更加方便。

如图4所示，示出了根据本发明的一种麦克风阵列语音增强系统，该系统包括麦克风阵列1、能量收集器2、方位计算装置3、加权叠加装置4。麦克风阵列1的输出端与加权叠加装置4的第一输入端连接，能量收集器2的输出端与方位计算装置3的输入端连接，方位计算装置3的输出端与加权叠加装置4的第二输入端连接。

在具体的实施例中，麦克风阵列1为5元麦克风线阵，包括5个压强式驻极体第二麦克风11(mic0,…,mic4)，前置放大电路12和模数转换器13，能量收集器2包括第一麦克风21、通道选择器5和处理器6，通道选择器5采用4052通道选择器，处理器6采用STM32F407微处理器。第一麦克风21与第二麦克风11共用前置放大电路12和STM32F407微处理器，并通过4052通道选择器与STM32F407微处理器连接，通过STM32F407微处理器控制第二麦克风11和第一麦克风21之间的切换。

麦克风阵列语音增强系统中麦克风阵列1中第二麦克风11和能量收集器2第一麦克风21通过3片4052通道选择器与前置放大电路12连接，并由STM32F407微处理器的2条IO控制线控制4052通道选择器在麦克风阵列1以及能量收集器2的麦克风之间进行切换，从而与STM32F407微处理器的ADCIN端连接(如图5、图6、图7所示)，在STM32F407微处理器进行16ksp采样率的模数转换后实现方位估计、波束形成过程。

在具体的实施例中，方位计算装置3借助能量收集器2获得的5个不同方向语音能量进行数字信号处理，采用处理器6进行软件编程实现；获得声源方位信息后由STM32F407微处理器控制切换为麦克风阵列对准模式，同样在STM32F407微处理器中进行波束成形。

综上，本发明的麦克风阵列语音增强的方法和系统，通过能量收集器获得可能方向语音进行比较从而获得声源方位，根据几何关系计算麦克风阵列信号各通道的时延补偿值，利用各通道时延补偿值对各通道进行时延补偿后进行波束形成处理从而增强语音，采用圆锥反射器件组成的能量收集器进行方向估计运算复杂度低，可以与麦克风阵列波束形成方便的进行交替运算，实现方向估计、波形成形的同步处理，无需采用复杂的方位估计算法，方位估计过程与语音算法可同时进行，实现声源方位的实时获取，保证麦克风阵列波束对准声源拾取语音信号。

显然，本领域技术人员在不偏离本发明的精神和范围的情况下可以作出对本发明的实施例的各种修改和改变。以该方式，如果这些修改和改变处于本发明的权利要求及其等同形式的范围内，则本发明还旨在涵盖这些修改和改变。词语“包括”不排除未在权利要求中列出的其它元件或步骤的存在。某些措施记载在相互不同的从属权利要求中的简单事实不表明这些措施的组合不能被用于获利。权利要求中的任何附图标记不应当被认为限制范围。

Claims

1.一种麦克风阵列语音增强的方法，其特征在于，包括以下步骤：

S1：利用麦克风阵列进行多通道的语音信号的采集；

S2：接收能量收集器获得的语音能量，获取声源方位信息；

S3：利用所述声源方位信息的几何关系计算所述麦克风阵列中各个麦克风阵列信号各通道的时延补偿值；

S4：根据所述麦克风阵列信号各通道的时延补偿值进行波束成形处理。

2.根据权利要求1所述的一种麦克风阵列语音增强的方法，其特征在于，所述能量收集器包括多个圆锥形反射器件，所述多个圆锥形反射器件相互贴紧且顶部相交于一点，所述多个圆锥形反射器件的中心线在同一平面上，所述多个圆锥形反射器件的开口部构成的收集范围覆盖所述声源的活动区域，所述圆锥形反射器件顶点设置有第一麦克风。

3.根据权利要求1所述的一种麦克风阵列语音增强的方法，其特征在于，所述步骤S2中所述声源方位信息的获取和所述步骤S3中所述时延补偿值的计算同时进行。

4.根据权利要求2所述的一种麦克风阵列语音增强的方法，其特征在于，所述步骤S2中所述声源方位信息的计算公式为：其中，j为所述能量收集器的通道编号，energy(j)为接收所述能量收集器获得的语音能量，θ_Δ为所述圆锥形反射器件的相邻角度。

5.根据权利要求2所述的一种麦克风阵列语音增强的方法，其特征在于，所述麦克风阵列包括5个等间距排列的第二麦克风组成的5元麦克风线阵，所述5元麦克风阵列包括所述第二麦克风、前置放大电路和处理器。

6.根据权利要求5所述的一种麦克风阵列语音增强的方法，其特征在于，所述第一麦克风和所述第二麦克风共用所述前置放大电路和所述处理器，所述第一麦克风和所述第二麦克风通过所述处理器进行切换。

7.根据权利要求1所述的一种麦克风阵列语音增强的方法，其特征在于，所述步骤S3中所述麦克风阵列中各个通道麦克风接收的语音信号s_i(k)的时延补偿值的计算公式为：

s′_i(k)＝s_i(k′)

其中i为所述麦克风阵列中麦克风阵元编号，d为所述麦克风阵元间距，C为空气中声速，f_s为所述麦克风阵列语音信号的采样频率，round[]代表取整运算。

8.一种麦克风阵列语音增强系统，其特征在于，包括：

5元麦克风线阵：用于进行多通道的语音信号的采集；

能量收集装置：用于接收能量收集器获得的语音能量；

方位计算装置：用于利用所述语音能量，计算声源方位信息；

加权叠加装置：用于利用所述声源方位信息的几何关系计算麦克风阵列信号各通道的时延补偿值，进行波束成形处理，增强语音信号。

9.根据权利要求8所述的一种麦克风阵列语音增强系统，其特征在于，能量收集器包括多个圆锥形反射器件，所述多个圆锥形反射器件相互贴紧且顶部相交于一点，所述多个圆锥形反射器件的中心线在同一平面上，所述圆锥形反射器件顶点设置有第一麦克风，所述圆锥形反射器件的开口部覆盖声源的主要活动范围。

10.根据权利要求8所述的一种麦克风阵列语音增强系统，其特征在于，所述5元麦克风阵列的输出端与所述加权叠加装置的第一输入端连接，所述能量收集装置的输出端与所述方位计算装置的输入端连接，所述方位计算装置的输出端与所述加权叠加装置的第二输入端连接。