CN209880151U

CN209880151U - 一种麦克风阵列语音增强装置

Info

Publication number: CN209880151U
Application number: CN201920332391.5U
Authority: CN
Inventors: 王宇芳; 童峰; 黄惠详; 郭秋涵
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2019-12-31
Anticipated expiration: 2029-03-15

Abstract

公开了一种麦克风阵列语音增强装置，其包括麦克风阵列、语音波束扫描装置、波束质量评估装置、波束对准增强装置，麦克风阵列的输出端与语音波束扫描装置的输入端连接，语音波束扫描装置的输出端与波束质量评估装置的输入端连接，波束质量评估的输出端与波束对准增强装置的输入端连接。据此对麦克风阵列各通道接收信号进行时延补偿波束对准增强，并输出增强语音信号，从而实现会议室结构环境下的说话人自对准语音增强。

Description

一种麦克风阵列语音增强装置

技术领域

本实用新型涉及麦克风阵列语音信号处理，尤其是涉及一种麦克风阵列语音增强装置。

背景技术

麦克风已经成为各类会议室的必备设备，为了保证会议效果往往在每个会议座位均配备麦克风，会议发言人通过按下麦克风按钮启动对应的麦克风发言，形成会议麦克风装置。但是，在实际会议使用环境中，考虑到会议多人发言、讨论等具体情况，采用这种方式往往无法保证根据会议情况灵活切换；另一方面，当会议参会人数多于麦克风数时会导致使用上的不便。同时，由于麦克风可以拾取拾音范围内的任何声音，因此不可避免地引入背景噪音，从而影响会议效果。

利用多个麦克风组成阵列结合处理而达到智能的语音信号处理可大大提高语音质量。例如可通过传统时延差算法或超分辨方位估计算法获取语音声源方位之后，利用波束形成技术形成一个指向目标说话人的波束来增强该方向的接收信号。因此，麦克风阵列技术可广泛利用于具有嘈杂背景的语音处理场合，例如智能家居、多媒体教室、车载免提电话和助听器等。

需要指出，获得声源方位是麦克风阵列语音增强技术的前提条件。因此，对于会议场景，如何在存在可能的多说话人的情况下实时获得说话人方位信息实现麦克风阵列对准提高语音质量是一个关键问题。

麦克风阵列声源定位技术主要可分为三类：一是基于最大输出功率的可控波束形成的声源定位技术，该方法通过控制波束扫描并选取其中最大能量方法作为声源方向；二是基于高分辨率谱估计的声源定位技术，此方法主要适用于窄带信号，对于语音信号这样的宽带信号，会导致算法运算量增加；三是基于互相关时延估计的声源定位技术，该算法计算量较小、易实现，但是在存在多个说话人的场景效果急剧下降。因此，在人机交互、视频会议等场合波束扫描方法仍然得到较为广泛的应用。

考虑到会议室等相对空间尺寸有限的应用场景，由于会议室墙壁、天花板、桌面等结构反射，往往导致波束扫描方法可以通过扫描获得多个具有较高能量的语音波束。传统的声源处理方法是选择多个波束中能量最大的作为声源方向，进行对准增强，而实际上考虑到室内结构混响的复杂性，特别是在靠近墙壁、桌面或结构拐角处等反射结构处常存在能量较高的强混响语音，因此单纯考虑能量选取的语音波束从语音质量而言往往并非最优，如：从说话人到麦克风阵列的直达语音能量有可能弱于结构反射导致的混响语音，从而影响了对准增强后麦克风阵列输出语音的效果。

实用新型内容

针对传统的声源处理方法是选择多个波束中能量最大的作为声源方向，进行对准增强，而实际上考虑到室内结构混响的复杂性，特别是在靠近墙壁、桌面或结构拐角处等反射结构处常存在能量较高的强混响语音，影响了对准增强后麦克风阵列输出语音的效果。本实用新型提出了一种麦克风阵列语音增强装置，利用语音波束质量评估装置和波束对准增强装置，提高在会议室等有限尺寸的结构空间内的麦克风阵列语音增强性能。

为实现上述目的，本实用新型提出了一种麦克风阵列语音增强装置，该装置麦克风阵列、语音波束信息扫描装置、语音波束信息综合质量评估装置和波束对准增强装置，语音波束信息扫描装置用于接收麦克风阵列采集的语音信号生成语音波束信息并获取语音信号的声源方向，语音波束信息综合质量评估装置包括波束能量检测装置和波束尖锐程度检测装置，波束能量检测装置用于检测语音波束信息的波束能量，波束尖锐程度检测装置用于根据波束能量计算语音波束信息的尖锐程度并获得语音波束信息的综合质量信息，波束对准增强装置用于选择综合质量信息最优的语音波束进行时延补偿进而输出增强语音信号，麦克风阵列的输出端与语音波束信息扫描装置的输入端连接，波束能量检测装置的输入端与语音波束信息扫描装置的输出端连接，波束能量检测装置的输出端与波束尖锐程度检测装置的输入端连接，波束尖锐程度检测装置的输出端与波束对准增强装置的输入端连接。通过麦克风阵列、语音波束信息扫描装置、语音波束信息综合质量评估装置、波束对准增强装置之间的相互连接配合，实现低运算复杂度的同时具备抑制混响影响的能力，极大的提高了室内结构环境下的麦克风阵列语音增强性能。

在一些具体的实施例中，语音波束信息扫描装置、语音波束信息综合质量评估装置和波束对准增强装置都采用DSP数字信号处理芯片。

在一些具体的实施例中，麦克风阵列包括5个等间距排列的麦克风组成的5元麦克风线阵。5元麦克风线阵具有体积小、结构简单、电声性能好的优点。

在一些具体的实施例中，5元麦克风线阵中各麦克风的间距d＝0.1m。

在一些具体的实施例中，5元麦克风线阵包括麦克风、前置放大电路和模数转换器。

在一些具体的实施例中，麦克风的输出端与前置放大电路的输入端连接，前置放大电路的输出端与模数转换器的输入端连接。

在一些具体的实施例中，麦克风为压强式驻极体麦克风，前置放大电路为NJM2100运算放大器芯片构成的前置放大电路，模数转换器采用MAX118模数转换器。

在一些具体的实施例中，麦克风阵列的采样频率为16000Hz。

在一些具体的实施例中，麦克风语音增强装置还包括处理器，处理器的IO接口与模数转换芯片的输入端连接。

在一些具体的实施例中，处理器采用ARM9S3C2440微处理器。

本实用新型提出一种麦克风阵列语音增强装置，利用麦克风阵列、语音波束信息扫描装置、语音波束信息综合质量评估装置、波束对准增强装置依次连接，麦克风阵列可对准选定的波束较窄直达语音方向进行增强，即麦克风阵列各通道信号按照波束质量对准而非波束能量对准的说话人方向进行时延补偿增强，波束质量评估装置，从而有利于输出音质较好的增强语音。

附图说明

在以下详细描述中，参考附图，该附图形成详细描述的一部分，并且通过其中可实践本实用新型的说明性具体实施例来示出。对此，参考描述的图的取向来使用方向术语，例如“顶”、“底”、“左”、“右”、“上”、“下”等。因为实施例的部件可被定位于若干不同取向中，为了图示的目的使用方向术语并且方向术语绝非限制。应当理解的是，可以利用其他实施例或可以做出逻辑改变，而不背离本实用新型的范围。因此以下详细描述不应当在限制的意义上被采用，并且本实用新型的范围由所附权利要求来限定。

图1是根据本实用新型的一个实施例的麦克风阵列语音增强装置的结构图；

图2是根据本实用新型的一个实施例的5元麦克风线阵与处理器的连接电路图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关实用新型，而非对该实用新型的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关实用新型相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

如图1所示，示出了根据本实用新型的一种麦克风阵列语音增强装置，该装置包括麦克风阵列1、语音波束信息扫描装置2、语音波束信息综合质量评估装置3和波束对准增强装置4。麦克风阵列1的输出端与语音波束信息扫描装置2的输入端连接，语音波束信息扫描装置2的输出端与语音波束信息综合质量评估装置3的输入端连接，语音波束信息综合质量评估装置3的输出端与波束对准增强装置4的输入端连接。利用麦克风阵列1和语音波束扫描装置2的连接配合进行语音波束信息的扫描，获得的语音波数信息通过语音波束信息综合质量评估装置3进行语音波束信息的质量评估分析，将评估分析所获取的语音波束信息的综合质量选择说话人方向的利用波束对准增强装置4进行波束增强的输出，达到语音增强输出的效果。

在具体的实施例中，语音波束信息扫描装置用于接收麦克风阵列采集的语音信号生成语音波束信息并获取语音信号的声源方向，语音波束信息综合质量评估装置包括波束能量检测装置和波束尖锐程度检测装置，波束能量检测装置用于检测语音波束信息的波束能量，波束尖锐程度检测装置用于根据波束能量计算语音波束信息的尖锐程度并获得语音波束信息的综合质量信息，波束对准增强装置用于选择综合质量信息最优的语音波束进行时延补偿进而输出增强语音信号。

在具体的实施例中，麦克风阵列1为5元麦克风线阵，5元麦克风线阵包括麦克风11、放大电路和模数转换器。麦克风11为压强式驻极体麦克风，放大电路为NJM2100运算放大器芯片构成的前置放大电路，模数转换器12采用MAX118模数转换器，在本实施例中麦克风的间距d＝0.1m。该麦克风具有体积小、结构简单、电声性能好的优点，可以更好配合语音波束扫描装置2进行语音信号的扫描，使用MAX118模数转换器12可以提高转换速度和精度，降低功耗，且更方便进行接口的升级。

在具体的实施例中，麦克风阵列1在进行语音信号采样的时候，对麦克风阵列1前方180度的范围进行波束的扫描。

在具体的实施例中，语音波束信息扫描装置2、语音波束信息综合质量评估装置3和波束对准增强装置4均采用DSP数字信号处理芯片，可采用本领域通用的处理器来实现语音增强的效果。

该装置还包括处理器5，处理器5采用ARM9S3C2440微处理器，ARM9S3C2440微处理器分别与麦克风阵列1、语音波束信息扫描装置2、语音波束信息综合质量评估装置3、波束对准增强装置4连接，通过ARM9S3C2440微处理器对各装置进行数据传输和转换的控制和输出。ARM9S3C2440微处理器与麦克风阵列中的放大电路连接，如图2所示，该麦克风阵列语音增强装置中5元麦克风线阵与处理器5的连接方式为：5元麦克风线阵中5个麦克风输出信号经过运算放大器构成的2级前置放大电路放大后与多通道MAX118模数转换器12的输入端IN1至IN5连接，其中，5元麦克风线阵中的mic0麦克风经放大电路放大后与多通道MAX118模数转换器12的输入端IN1端口连接，mic1麦克风经放大电路放大后与多通道MAX118模数转换器12的输入端IN2端口连接，mic2、3、4麦克风经放大电路放大后分别与多通道MAX118模数转换器12的输入端IN3、4、5端口连接。ARM处理器具有低功耗、高性能等特点，可以广泛适用于便携式电子产品中，本实施例所使用的S3C2440微处理器是多用途的通用芯片，具有低功耗高性能和低成本的特点。

在具体的实施例中，S3C2440微处理器通过输入/输出IO接口的GPB2、GPB3、GPB4端口分别与MAX118的输入通道端A2、A1、A0端口连接，通过定时器输出脚TOUT0连接MAX118的读出端口WR，定时器输出脚TOUT1连接MAX118的写入端口RD，以此进行采样模数的转换。

优选地，采样频率为16ksps，通过MAX118模数转换器12数据线D0至D7与ARM9S3C2440微处理器5上的数据接收端口DATA0至DATA7的依此连接，进行8bit模数转换结果到S3C2440微处理器5的传送。

在具体的实施例中，扫描后经过模数转换的语音波束信息输入语音波束信息综合质量评估装置3，语音波束信息综合质量评估装置3包括波束能量检测装置31和波束尖锐程度检测装置32，语音波束信息扫描装置的输出端与波束能量检测装置31的输入端连接，波束能量检测装置31的输出端与波束尖锐程度检测装置32输入端连接，波束尖锐程度检测装置32的输出端与波束对准增强装置4的输入端连接。扫描后经过模数转换的语音波束信息经过波束能量检测装置31后筛选出最高的3个能量的语音波束信息，传递至波束尖锐程度检测装置32，通过波束尖锐程度检测装置32输出最优波束方向作为声源的方向数据，波束对准增强装置4接收最优波束方向的数据，根据麦克风阵列1各通道接收信号的时延补偿进行波束的对准增强，输出增强语音信号。针对会议室等室内混响环境，利用波束能量检测装置31和波束尖锐程度检测装置32的筛选和计算，使波束对准增强装置更有效的输出语音波束信息，可以抑制墙壁、桌面等强室内混响所造成的影响，提高语音增强性能。

综上所述，本实用新型的麦克风阵列语音增强装置利用麦克风阵列、语音波束扫描装置、波束质量评估装置、波束对准增强装置依次连接，麦克风阵列和语音波束扫描装置获取语音的声源方向信息并将波束信息输入波束质量评估装置；波束质量评估装置对语音波束进行能量、混响程度的综合评估，并选择最优波束方向作为声源方向，波束对准增强装置根据声源方向信息计算各通道时延补偿值，并据此对麦克风阵列各通道接收信号进行时延补偿波束对准增强，并输出增强语音信号，从而实现会议室结构环境下的说话人自对准语音增强。

显然，本领域技术人员在不偏离本实用新型的精神和范围的情况下可以作出对本实用新型的实施例的各种修改和改变。以该方式，如果这些修改和改变处于本实用新型的权利要求及其等同形式的范围内，则本实用新型还旨在涵盖这些修改和改变。词语“包括”不排除未在权利要求中列出的其它元件或步骤的存在。某些措施记载在相互不同的从属权利要求中的简单事实不表明这些措施的组合不能被用于获利。权利要求中的任何附图标记不应当被认为限制范围。

Claims

1.一种麦克风阵列语音增强装置，其特征在于，包括麦克风阵列、语音波束信息扫描装置、语音波束信息综合质量评估装置和波束对准增强装置；所述语音波束信息扫描装置用于接收所述麦克风阵列采集的语音信号生成语音波束信息并获取所述语音信号的声源方向；所述语音波束信息综合质量评估装置包括波束能量检测装置和波束尖锐程度检测装置，所述波束能量检测装置用于检测所述语音波束信息的波束能量，所述波束尖锐程度检测装置用于根据所述波束能量计算所述语音波束信息的尖锐程度并获得所述语音波束信息的综合质量信息；所述波束对准增强装置用于选择所述综合质量信息最优的所述语音波束进行时延补偿进而输出增强语音信号；其中所述麦克风阵列的输出端与所述语音波束信息扫描装置的输入端连接，所述波束能量检测装置的输入端与所述语音波束信息扫描装置的输出端连接，所述波束能量检测装置的输出端与所述波束尖锐程度检测装置的输入端连接，所述波束尖锐程度检测装置的输出端与所述波束对准增强装置的输入端连接。

2.根据权利要求1所述的一种麦克风阵列语音增强装置，其特征在于，所述语音波束信息扫描装置、所述语音波束信息综合质量评估装置和所述波束对准增强装置都采用DSP数字信号处理芯片。

3.根据权利要求1所述的一种麦克风阵列语音增强装置，其特征在于，所述麦克风阵列包括5个等间距排列的麦克风组成的5元麦克风线阵。

4.根据权利要求3所述的一种麦克风阵列语音增强装置，其特征在于，所述5元麦克风线阵中各麦克风的间距d＝0.1m。

5.根据权利要求3所述的一种麦克风阵列语音增强装置，其特征在于，所述5元麦克风线阵包括麦克风、前置放大电路和模数转换器。

6.根据权利要求5所述的一种麦克风阵列语音增强装置，其特征在于，所述麦克风的输出端与所述前置放大电路的输入端连接，所述前置放大电路的输出端与所述模数转换器的输入端连接。

7.根据权利要求5所述的一种麦克风阵列语音增强装置，其特征在于，所述麦克风为压强式驻极体麦克风，所述前置放大电路为NJM2100运算放大器芯片构成的前置放大电路，所述模数转换器采用MAX118模数转换器。

8.根据权利要求3所述的一种麦克风阵列语音增强装置，其特征在于，所述麦克风线阵的采样频率为16000Hz。

9.根据权利要求5所述的一种麦克风阵列语音增强装置，其特征在于，所述麦克风语音增强装置还包括处理器，所述处理器的IO接口与所述模数转换芯片的输入端连接。

10.根据权利要求9所述的一种麦克风阵列语音增强装置，其特征在于，所述处理器采用ARM9S3C2440微处理器。