CN102421050A

CN102421050A - 使用麦克风的非均匀布局来增强音频质量的设备和方法

Info

Publication number: CN102421050A
Application number: CN2011102886776A
Authority: CN
Inventors: 吴光哲; 金正寿; 郑宰熏; 郑韶永
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2010-09-17
Filing date: 2011-09-19
Publication date: 2012-04-18
Anticipated expiration: 2031-09-19
Also published as: KR101782050B1; EP2431973A1; US8965002B2; EP2431973B1; KR20120029839A; US20120070015A1; CN102421050B

Abstract

提供了一种使用麦克风的非均匀布局来增强音频质量的设备和方法。因此，即使当麦克风阵列相对较小时，也在包括较高频带和较低频带的宽频率范围中获得期望的方向的波束图。音频质量增强设备包括：至少三个麦克风，以非均匀布局被布置；频率变换单元，被配置为将从所述至少三个麦克风输入的声学信号变换为频域的声学信号；频带划分与合并单元，被配置为基于所述至少三个麦克风之间的间隔将变换的声学信号的频率划分为频带，并基于划分的频带将频域中的声学信号合并为两个声道的信号；双声道波束成形单元，被配置为通过对两个声道的信号执行波束成形来降低包括来自目标声音的方向以外的方向的输入的信号的噪声，并输出噪声降低的信号。

Description

使用麦克风的非均匀布局来增强音频质量的设备和方法

本申请要求于2010年9月17日提交的第10-2010-0091920号韩国专利申请的权益，该申请的公开通过引用全部包含于此，以用于各种目的。

技术领域

以下描述涉及声学信号处理，更具体地讲，涉及通过使用麦克风的非均匀布局减轻噪声以增强音频质量的设备和方法。

背景技术

随着包括高科技医疗设备(诸如高精度助听器)、移动电话、超级移动个人计算机(UMPC)、摄录机等的移动汇聚终端(mobile convergence terminal)现今变得越来越普遍，对使用麦克风阵列的产品的需求已增加。麦克风阵列包括多个麦克风，其中，所述多个麦克风被布置为用于获得声音和声音的补充特征(诸如方向性(例如，声音的方向或声源的位置))。方向性可被用于通过使用声源信号在组成麦克风阵列的多个麦克风中的每一个麦克风处的到达时间之间的差来提高对从位于预定方向的音源所发出的信号的灵敏度。通过使用麦克风阵列的方向性的原理来获得音源信号，从预定方向输入的声源信号可被增强或抑制。

最近的研究集中于：通过定向噪声消除来提高语音呼叫质量和记录质量的方法；能够自动估计和追踪发言人的位置的电话会议系统和智能会议记录系统；用于追踪目标声音的机器人技术。

基于波束成形算法的噪声消除是一种应用于大多数麦克风阵列算法的技术。作为波束成形噪声消除方法的示例，固定波束成形技术被用于不受输入信号的特性影响的波束成形。根据固定波束成形技术，波束图依据麦克风阵列的大小以及包括在所述麦克风阵列中的元件或麦克风的数量而变化。可使用较大的麦克风阵列来获得期望的较低频带的波束图，但是当使用较小的麦克风阵列时，波束图变为全方向的。然而，当使用较大的麦克风阵列时，伴随较高频带而出现旁瓣或栅瓣。结果，不需要的方向上的声音被获得。

传统的麦克风阵列使用至少十个麦克风来形成期望的波束图。然而，这增加了制造麦克风阵列的成本以及麦克风阵列的声学信号处理的应用。

发明内容

在一个方面，提供了一种用于增强具有非均匀布局的麦克风阵列的音频质量的设备和方法，因此即使当麦克风阵列较小时，也可在包括较高频带和较低频带的宽频率范围中获得期望的方向的波束图。

在一个总体方面，一种用于增强音频质量的设备包括：至少三个麦克风、频率变换单元、频带划分与合并单元以及双声道波束成形单元。所述至少三个麦克风以非均匀布局被布置。所述频率变换单元被配置为将从所述至少三个麦克风输入的声学信号变换为频域的声学信号。所述频带划分与合并单元被配置为基于所述至少三个麦克风之间的间隔将变换的声学信号的频率划分为频带，以及基于划分的频带将频域中的声学信号合并为两个声道的信号。所述双声道波束成形单元被配置为通过对所述两个声道的信号执行波束成形来降低包括来自目标声音的方向以外的方向的输入的信号的噪声，并输出噪声降低的信号。

可根据最小冗余线性阵列布局来布置所述至少三个麦克风，其中，所述最小冗余线性阵列布局使针对所述至少三个麦克风之间的间隔的冗余分量最小化。

频带划分与合并单元可基于所述至少三个麦克风的各个间隔，针对变换后的声学信号将频率划分为频带。可使用对于所述至少三个麦克风的每个对应间隔不引起空间假频(spatial aliasing)的最大频率值来分配所述频带。

频带划分与合并单元可将频带的最大频率值(f₀)确定为小于通过将声速(c)除以对应麦克风之间的间隔(d)的两倍而获得的值。

由频带划分与合并单元配置的频带的数量可被确定为与所述至少三个麦克风的各成对麦克风的间隔的数量对应。

频带划分与合并单元还被配置为对于所述至少三个麦克风的间隔的所有集合提取每个频带的频域中的声学信号并将提取的声学信号合并为两个声道的声学信号，其中，所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入。

所述设备还可包括频率反变换单元，其中，所述频率反变换单元被配置为将输出的噪声降低的信号变换为时域的声学信号。

在另一总体方面，一种用于增强音频质量的设备包括：至少三个麦克风、滤波单元、频率变换单元、双声道波束成形单元、合并单元以及频率反变换单元。所述至少三个麦克风以非均匀布局被布置。滤波单元包括多个带通滤波器，其中，所述多个带通滤波器被配置为允许从所述至少三个麦克风输入的声学信号通过所述多个带通滤波器的各个频带，其中，基于所述至少三个麦克风之间的间隔确定对应于每个带通滤波器的频率范围。频率变换单元被配置为将已通过滤波单元的声学信号变换为频域的声学信号。双声道波束成形单元被配置为针对每个频带，降低从两个声道的声学信号的目标声音的方向以外的方向输入的噪声，其中，所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器。合并单元被配置为合并针对每个频带输出的噪声降低的声学信号。频率反变换单元被配置为将合并的信号变换为时域的声学信号。

可根据最小冗余线性阵列来配置所述至少三个麦克风，以使针对所述至少三个麦克风的间隔的冗余分量最小化。

可通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值，确定与包括在滤波单元中的每个带通滤波器对应的频率范围。

在又一总体方面，一种增强声学阵列的音频质量的方法包括：将从以非均匀布局布置的至少三个麦克风输入的声学信号变换为频域的声学信号；基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带；基于所述频带将频域的声学信号合并为双声道信号；通过使用所述双声道信号，降低从目标声音的方向以外的方向输入的声学信号的噪声；以及输出噪声降低的信号。

变换从以非均匀布局布置的至少三个麦克风输入的声学信号的步骤可包括：根据最小冗余线性阵列布局来布置所述至少三个麦克风，以使针对所述麦克风之间的间隔的冗余分量最小化。

基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤还可包括：通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值，确定所述频带。

通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值来确定所述频带的步骤可包括：将频带的最大频率值(f₀)确定为小于通过将声速(c)除以麦克风的对应间隔(d)的两倍而获得的值。

基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤可包括：将频率的频率范围划分为与麦克风的间隔的数量对应的频带。

将频域的声学信号合并为双声道信号的步骤可包括：对于至少三个麦克风的间隔的所有集合，提取每个频带的频域中的声学信号并将提取的声学信号合并为两个声道的声学信号，其中，所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入。

所述方法还可包括：将输出的噪声降低的信号变换为时域的声学信号。

在又一总体方面，一种增强包括以非均匀布局布置的至少三个麦克风的声学阵列的音频质量的方法包括：允许从所述至少三个麦克风输入的声学信号通过多个带通滤波器的各个频带，其中，基于所述至少三个麦克风之间的间隔来确定对应于每个带通滤波器的频率范围；将所述声学信号变换为频域的声学信号；针对每个频带，降低从两个声道的声学信号的目标声音的方向以外的方向输入的噪声，其中，所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器；合并针对每个频带输出的噪声降低的声学信号；以及将合并的噪声降低的声学信号变换为时域的声学信号。

允许声学信号通过各个频带的步骤可包括：使所述声学信号通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值而确定的各个频带。

通过以下结合附图公开本发明的示例性实施例的详细描述，其他特征对于本领域技术人员而言将变得清楚。

附图说明

图1示出用于增强音频质量的设备的配置的示例

图2示出最小冗余阵列布局的示例。

图3示出在没有空间假频(spatial aliasing)的情况下为麦克风间隔分配的频率区域的示例。

图4示出图1的用于增强音频质量的设备的频带划分与合并单元的操作的示例。

图5示出用于增强音频质量的另一设备的示例。

图6示出增强音频质量的方法的示例。

图7示出增强音频质量的另一方法的示例。

图8示出根据增强音频质量的设备和方法产生的波束图的示例。

贯穿附图和详细描述，相同的元件、特征和结构由相同的标号指示，并且为了清楚和方便，在附图中一些元件的大小和比例可被夸大。

具体实施方式

提供以下详细描述以帮助读者全面理解在此描述的方法、设备和/或系统。在此描述的系统、设备和/或方法的各种改变、修改和等同物将被建议给本领域的普通技术人员。公知功能和结构的描述被省略以提高清楚性和简洁性。

在下文中，将参照附图详细描述示例。

图1是示出用于增强音频质量的设备的配置的示例的示图。

音频质量增强设备100包括：麦克风阵列101、频率变换单元110、频带划分与合并单元120、双声道波束成形单元130以及频率反变换单元140，其中，所述麦克风阵列101包括多个麦克风10、20、30和40。可使用各种类型的电子设备(诸如作为示例的个人计算机、服务器计算机、手持或膝上型装置、移动或智能电话、多处理器系统、微处理器系统或机顶盒)来实现音频质量增强设备100。

可使用至少三个麦克风来实现麦克风阵列101。每个麦克风可包括用于放大声学信号的声音放大器以及用于将输入的声学信号转换为电信号的模拟/数字转换器。图1中示出的音频质量增强设备100的示例包括四个麦克风，但是麦克风的数量不限于此；然而，音频质量增强设备100应该包括至少三个麦克风。

以非均匀布局来布置麦克风10、20、30和40。另外，可根据最小冗余线性阵列布局来布置麦克风10、20、30和40，以使针对麦克风10、20、30和40的间隔的冗余分量最小化。麦克风阵列的非均匀布局可被用于避免由于与较高频率区域相关的栅瓣引起的空间假频的缺点。另一方面，当麦克风之间的间隔减小并且麦克风阵列的大小较小时，波形图通常丧失了与较低频率区域相关的单向特性。然而，还可根据在此提供的详细描述来避免这样的缺点。以下参照图2描述最小冗余线性阵列布局的进一步的细节。

麦克风10、20、30和40可被布置在音频质量增强设备100的相同平面上。例如，所有的麦克风10、20、30和40可被布置在音频质量增强设备100的正面平面或侧面平面上。

频率变换单元110从各个麦克风10、20、30和40接收时域的声学信号并将接收的时域的声学信号变换为频域的声学信号。例如，频率变换单元110可通过使用离散傅里叶变换(DFT)或快速傅里叶变换(FFT)将时域的声学信号变换为频域的声学信号。

频率变换单元110可将声学信号组合成帧，并将以帧为单位的声学信号变换为频域的声学信号。成帧的单位可依据可变因素(诸如采样频率和应用的类型)而变化。

频带划分与合并单元120基于麦克风10、20、30和40的间隔将变换的声学信号的频率范围划分为频带，并基于变换的声学信号落入所划分的频带内的何处，将变换的声学信号合并为双声道信号。当基于麦克风的各个间隔针对变换后的声学信号划分频带时，频带划分与合并单元120可基于对于麦克风的每个间隔不引起空间假频的最大频率值来将所述频率范围划分为频带。

频带划分与合并单元120将范围的最大频率值(f₀)确定为小于通过将声速(c)除以麦克风之间的间隔(d)的两倍而确定的值另外，当基于麦克风的各个间隔将变换的声学信号的频率划分为频带时，频带划分与合并单元120可分配所述频带以与麦克风的间隔的数量一致。在麦克风的间隔的所有组合中，频带划分与合并单元120根据依据麦克风的对应间隔而分配的频带，从形成阵列的间隔的两个麦克风的频域输入提取声学信号。然后，频带划分与合并单元120将提取的声学信号合并为双声道信号以下参照图3和图4更详细地描述频带划分与合并单元120的操作的细节。

双声道波束成形单元130通过使用双声道波束成形，在不抑制来自目标声源的方向的声音的情况下减轻来自不需要的方向的输入噪声，来输出噪声降低的信号。通过使用从频带划分与合并单元120合并和输入的双声道信号来执行双声道波束成形。双声道波束成形单元130可通过使用双声道信号之间的相差来形成波束图。

当双声道声学信号包括第一信号x₁(t，r)和第二信号x₂(t，r)时，第一信号x₁(t，r)和第二信号x₂(t，r)之间的相差(ΔP)可表示为如等式1所示。

【等式1】

ΔP = &angle; x_{1} (t, r) - &angle; x_{2} (t, r)

= \frac{2 π}{λ} d \cos θ_{t} = \frac{2 πf}{c} d \cos θ_{t}

这里，c是声波的速度(330m/s)，f是声波的频率，d是所述阵列的两个麦克风之间的距离，θ_t是声源的方向角。

假设声源的方向角θ_t与目标声音的方向角θ_t对应，并且目标声音的方向角θ_t已知，则针对每个频率的相差(phase difference)可被预测。从具有方向角θ_t的预定位置引入的声学信号的相差(ΔP)可依据每个频率而变化。

同时，可考虑噪声的影响来设置包括目标声音的方向角θ_t的目标声音的允许角度范围θ_Δ(或允许目标声音的方向角)。例如，如果目标声音的方向角θ_t是π/2，则考虑噪声的影响将目标声音的允许角度范围θ设置为约5π/12至7π/12。如果目标声音的方向角θ_t已知且目标声音的允许角度范围θ_Δ被确定，则使用等式1计算目标声音的允许相差范围。

目标声音的允许相差范围的下限阈值Th_L(m)和上限阈值Th_H(m)分别如等式2和等式3中所定义。

【等式2】

T h_{H} (m) = \frac{2 πf}{c} d \cos (θ_{t} - \frac{θ_{Δ}}{2})

【等式3】

{Th}_{L} (m) = \frac{2 πf}{c} d \cos (θ_{t} + \frac{θ_{Δ}}{2})

这里，m表示频率索引，d表示麦克风之间的间隔。因此，目标声音的允许相差范围的下限阈值Th_L(m)和上限阈值Th_H(m)可依据频率(f)，麦克风之间的间隔(d)以及目标声音的允许角度范围θ而变化。

目标声音的方向角θ_t可被从外部调整(诸如使用用户通过用户接口装置输入的信号来从外部调整目标声音的方向角θ_t)。另外，包括目标声音的方向角的目标声音的允许角度范围也可被调整。

考虑到目标声音的允许角度范围与目标声音的允许相差范围之间的关系，如果在输入的声学信号的预定频率的相差ΔP存在于目标声音的允许相差范围内，则确定目标声音存在于所述预定频率。如果在当前输入的声学信号的预定频率的相差ΔP不存在于目标声音的允许相差范围内，则确定目标声音不存在于所述预定频率。

双声道波束成形单元130可提取表示在确定频率分量的相差包括在目标声音的允许相差范围中的程度的特征值。可通过使用针对目标声音的允许相差范围内的频率分量的相差的数量来计算所述特征值。例如，所述特征值表示为平均有效频率分量数量，其中，通过将针对每个频率分量在目标声音的允许相差范围内的频率分量的数量之和除以频率分量的总数量(M)来确定所述平均有效频率分量数量。

如上所述，如果目标声音的方向角θ_t和目标声音的允许角度范围θ_Δ被输入，则在双声道波束成形单元130中计算目标声音的允许相差范围。可选地，双声道波束成形单元130设置有预定的存储空间，以存储表示目标声音的每个允许角度以及针对目标声音的每个方向角度的目标声音的允许相差范围的一些信息。

如果确定在将被处理的帧中，目标声音存在于预定频率，则双声道波束成形单元130放大并输出对应的频率分量。如果确定在将被处理的帧中，目标声音不存在于预定频率，则双声道波束成形单元130衰减并输出对应的频率分量。例如，双声道波束成形单元130针对将被分析的帧的每个频率分量估计目标声音的幅度。针对每个频率分量估计的目标声音的幅度与特征值相乘。所述特征值表示每个确定频率分量的相差存在于目标声音的允许相差范围内的程度。从针对确定频率分量的目标声音的估计幅度衰减掉确定为不包括目标声音的频率分量。结果，噪声被减轻或消除。可选地，双声道波束成形单元130可通过经由本领域通常公知的其他各种类型的方法执行双声道波束成形来减轻噪声。

频率反变换单元140将双声道波束成形单元130的输出信号变换为时域的声学信号。变换的信号可被存储在存储介质(未示出)中或通过扬声器(未示出)被输出。

尽管该示例可避免由于较高频率区域处的栅瓣引起的空间假频的缺点，但是当麦克风之间的间隔减小且麦克风阵列的大小较小时，用于较低频率区域的波束图丧失了单向特性。然而，如果麦克风的数量增加，则与波束成形的数据处理相关的成本增加。因此，即使麦克风的数量增加，上述双声道波束成形也提供了性价比高的波束成形。根据上述的频带划分与合并，输入到非均匀布局的麦克风的至少三个声学信号被有效地变换为用于双声道波束成形的两个声学信号，同时仍避免了由于与较高频率区域相关的栅瓣引起的空间假频。

图2是示出最小冗余阵列布局的示例的示图。

最小冗余线性阵列是源于雷达天线的结构的技术。最小冗余线性阵列表示元件按照使针对阵列元件之间的间隔的冗余分量最小化的方式被布置的非均匀布局的阵列结构。例如，当阵列结构包括四个阵列元件时，获得六个空间灵敏度。

图2示出当麦克风阵列101包括四个麦克风10、20、30和40时获得的最小冗余阵列布局。如图2中所示，麦克风10和麦克风20彼此相隔最小间隔。所述最小间隔可被称为基本间隔。在该示例中，如图2中所示，麦克风30与麦克风40之间的间隔是基本间隔的两倍，麦克风20与麦克风30之间的间隔是基本间隔的三倍，麦克风10与麦克风30之间的间隔是基本间隔的四倍，麦克风20与麦克风40之间的间隔是基本间隔的五倍，麦克风10与麦克风40之间的间隔是基本间隔的六倍。结果，图2中示出的麦克风阵列的麦克风10、20、30和40之间的间隔可在基本间隔的一倍到六倍范围内变化。

如上所述，尽管避免了由于较高频率区域处的栅瓣引起的空间假频，但是当麦克风之间的间隔减小并且麦克风阵列的大小较小时，使用固定的波束成形，用于较低频率区域的波束图丧失了单向特性。然而，最小冗余线性阵列的最小间隔可被用于避免与较高频带相关的空间假频的缺点，并且对于最小冗余线性阵列，容易获得能够在较低频带进行无失真波束成形的最大间隔。因此，如以下更详细地解释的，依据麦克风的数量和排列，最小冗余线性阵列可以按各种布局来构造。

图3是示出在不引起空间假频的情况下针对麦克风间隔而分配的频率区域的示例的示图。

对于从麦克风10、20、30和40输入的声学信号，频带划分与合并单元120将频带分配给麦克风10、20、30和40之间的每个间隔，使得它们不引起空间假频。当麦克风之间的预定间隔是d时，如等式4所示，最大频率值(f₀)被确定为小于通过将声速(c)除以麦克风之间的预定间隔(d)的两倍而获得的值。

【等式4】

f_{0} < \frac{c}{2 \times d}

例如，如果麦克风间隔(d)是10cm且声速(c)是340m/s，则在具有1700Hz或更小的频率(f₀)的信号不会出现假频。根据图2中示出的间隔，最大间隔(例如，两个最外侧的麦克风之间的间隔)适合于较低频率，麦克风之间的最小间隔适合于较高频率。因此，频带划分与合并单元120按照通过形成最大间隔的麦克风获得的声学信号被分配最低频率区域，通过形成第二大间隔的麦克风获得的声学信号被分配第二低频率区域等诸如此类的方式来分配频带。当麦克风之间的最小间隔是2cm且麦克风的数量是四个时，如图3所示分配频带。

例如，根据图2和图3，形成最大间隔的麦克风10和40被配置为与具有1400Hz或更低的频率的信号对应。形成第二大间隔的麦克风20和40被配置为与具有频率1417Hz至1700Hz的信号对应。形成第三大间隔的麦克风10和30被配置为与具有1700Hz至2125Hz的频率的信号对应。形成第四大间隔的麦克风20和30被配置为与具有2125Hz至2833Hz的频率的信号对应。形成第五大间隔的麦克风30和40被配置为与具有2833Hz至4250Hz的频率的信号对应。形成最小间隔的麦克风10和20被配置为与具有4250Hz至8500Hz的频率的信号对应。

当然，当麦克风的基本间隔改变时，分配给每个间隔的频带将被改变。如上所述，最大频率值被确定为不引起空间假频的最大值，因此形成每个间隔的麦克风可被分配小于确定的最大频率的频率。例如，具有最大间隔的两个最外侧的麦克风10和40可被配置为与0Hz至1000Hz而非0Hz至1400Hz对应，具有第二大间隔的两个麦克风20和40可被配置为与1000Hz至1690Hz而非1407Hz至1700Hz对应，等等。按这种方式，频带划分与合并单元120(见图1)为麦克风阵列的麦克风的各个间隔分配频带。

图4是示出与图1的用于增强音频质量的设备的频带划分与合并单元相关的数据流的示例的示图。

在图4中，如图1和图2中所示，四个麦克风10、20、30和40以最小冗余线性阵列布局被布置。

通过将从四个麦克风10、20、30和40中的各个麦克风获得的频域的四个声学信号(例如，Ch1、Ch2、Ch3和Ch4)映射到图4的右部分中示出的两个声学信号(例如，Ch11和Ch12)，来合并所述四个声学信号。频域的两个声学信号Ch11和Ch12是输入到双声道波束成形单元130的信号。

当以最小冗余线性阵列布局来布置四个麦克风10、20、30和40时，基于麦克风10、20、30和40的间隔将频率划分为六个频带。针对如图4的左部分中所示的四个声学信号Ch1、Ch2、Ch3和Ch4中的每一个以及如图4的右部分中所示的两个声学信号Ch11和Ch12中的每一个来表示所述六个频带。

根据麦克风10和麦克风20之间的基本间隔，4220Hz到8500Hz的频带被分配给基本间隔。2810Hz至4220Hz的频带与是基本间隔的两倍的麦克风间隔对应。2090Hz至2810Hz的频带与是基本间隔的三倍的麦克风间隔对应。1690Hz至2090Hz的频带与是基本间隔的四倍的麦克风间隔对应。1400Hz至1690Hz的频带与是基本间隔的五倍的麦克风间隔对应。0Hz至1400Hz的频带与是基本间隔的六倍的麦克风间隔对应。

图5是示出用于增强音频质量的设备的另一示例的示图。

音频质量增强设备500包括：包括多个麦克风10、20、30和40的麦克风阵列、滤波单元510、频率变换单元520、双声道波束成形单元530、合并单元540以及频率反变换单元550。与图1中示出的对频域中的声学信号执行频带划分与合并操作的音频质量增强设备100不同，图5的音频质量增强设备500对时域中的声学信号执行频带划分操作，并且对频域中的声学信号执行频带合并操作。

与图1中示出的麦克风阵列相似，音频质量增强设备500的麦克风阵列501包括至少三个麦克风。在该示例中，以非均匀布局来布置四个麦克风10、20、30和40。所述至少三个麦克风可按照使针对麦克风10、20、30和40之间的间隔的冗余分量最小化的方式被布置。

滤波单元510包括允许从麦克风10、20、30和40输入的声学信号通过基于麦克风10、20、30和40的间隔而划分的各个频带的多个带通滤波器。包括在滤波单元510中的带通滤波器被配置为使按照最大频率值所确定划分的各个频带的声学信号通过，其中，所述最大频率值对于麦克风10、20、30和40之间的每个间隔不引起空间假频。

如果音频质量增强设备500的四个麦克风10、20、30和40以最小冗余线性阵列布局被布置，则滤波单元510可包括六个带通滤波器BPF1、BPF2、BPF3、BPF4、BPF5和BPF6。

所述六个带通滤波器BPF1、BPF2、BPF3、BPF4、BPF5和BPF6被配置为允许信号通过基于麦克风10、20、30和40之间的间隔而划分的六个频带中的每一个。详细地讲，带通滤波器BPF1可被配置为允许4220Hz至8500Hz频带中的从麦克风10输入的第一声学信号以及从麦克风20输入的第二声学信号通过。带通滤波器BPF2可被配置为允许2810Hz至4220Hz频带中的从麦克风30输入的第三声学信号以及从麦克风40输入的第四声学信号通过。带通滤波器BPF3可被配置为允许2090Hz至2810Hz频带中的第二声学信号以及第三声学信号通过。带通滤波器BPF4可被配置为允许1690z至2090Hz频带中的第一声学信号以及第三声学信号通过。带通滤波器BPF5可被配置为允许1400z至1690Hz频带中的第二声学信号以及第四声学信号通过。带通滤波器BPF6可被配置为允许0Hz至1400Hz频带中的第一声学信号以及第四声学信号通过。

频率变换单元520将通过滤波单元510的声学信号变换为频域的声学信号。当处理从四个麦克风10、20、30和40输入的声学信号时，频率变换单元520从滤波单元510接收十二个声学信号，并将接收的十二个声学信号变换为频域的声学信号。例如，成对的声学信号被提供给六个快速傅里叶变换器(例如，FFT1、FFT2、FFT3、FFT4、FFT5、FFT6)，以使用快速傅里叶变换将成对的声学信号变换到频域。

双声道波束成形单元530对每个频带的两个声学信号执行双声道波束成形。所述两个声学信号均通过多个带通滤波器中的相同带通滤波器，从而对于每个频带，来自所述两个信号的从不需要的方向(即，目标声音的方向以外的方向)输入的噪声被减轻，由此输出噪声降低的信号。双声道波束成形单元530可包括六个波束成形器BF1、BF2、BF3、BF4、BF5和BF6。

波束成形器BF1可使用来自4220Hz至8500Hz频带的第一声学信号和第二声学信号执行双声道波束成形。波束成形器BF2可使用来自2810Hz至4220Hz频带的第三声学信号和第四声学信号执行双声道波束成形。波束成形器BF3可使用来自2090Hz至2810Hz频带的第二声学信号和第三声学信号执行双声道波束成形。波束成形器BF4可使用来自1690Hz至2090Hz频带的第一声学信号和第三声学信号执行双声道波束成形。波束成形器BF5可使用来自1400Hz至1690Hz频带的第二声学信号和第四声学信号执行双声道波束成形。波束成形器BF6可使用来自0Hz至1400Hz频带的第一声学信号和第四声学信号执行双声道波束成形。

合并单元540合并所产生的与每个频带的声学信号对应的噪声降低的信号中的每一个。根据该示例，合并单元540合并从波束成形单元530输出的六个声学信号(已针对每个频带对其执行了双声道波束成形)以获得针对0Hz至8500Hz的所有频率的声学信号。

频率反变换单元550将合并的信号变换为时域的声学信号。

图6是示出增强音频质量的方法的示例的流程图。

如图1和图6中所示，音频质量增强设备100将从以非均匀布局布置的至少三个麦克风输入的声学信号变换为频域的声学信号(610)。所述至少三个麦克风可被布置以使针对麦克风的间隔的冗余分量最小化。

音频质量增强设备100基于麦克风之间的间隔，针对变换后声学信号将频率划分为频带(620)。音频质量增强设备100可通过使用对于麦克风的每个间隔不引起空间假频的最大频率值来将频率划分为频带。音频质量增强设备100将所述最大频率值(f₀)确定为小于通过将声速(c)除以两个麦克风之间的间隔(d)的两倍而确定的值。另外，音频质量增强设备100将频带的数量确定为与麦克风的间隔的数量对应。

音频质量增强设备100基于划分的频带将频域的声学信号合并为双声道信号(630)。对于麦克风之间的间隔的所有集合，音频质量增强设备100提取从形成间隔的两个麦克风输入的每个频带的声学信号，并将提取的声学信号合并为两个声道的声学信号。

音频质量增强设备100使用所述两个声道的信号来执行双声道波束成形，以衰减从不需要的方向(即，目标声音的方向以外的方向)输入的噪声，从而输出噪声降低的信号(640)。

图7是示出增强音频质量的方法的另一示例的流程图

如图5和图7中所示，音频质量增强设备500允许从以非均匀布局布置的至少三个麦克风输入的声学信号通过基于麦克风之间的间隔而分配的各个频带(710)。音频质量增强设备500使声学信号通过各个频带。通过使用对于非均匀布局的麦克风之间的每个分别的间隔不引起空间假频的最大频率值来确定所述频带。

音频质量增强设备500将通过每个频带的声学信号变换为频域的声学信号(720)。

音频质量增强设备500通过对每个频带的声学信号执行双声道波束成形来输出噪声降低的信号。在操作710，声学信号通过相同的带通滤波器。从以非均匀布局布置的至少三个麦克风输入的声学信号通过基于麦克风的间隔而划分的各个频带。针对每个频带的声学信号的双声道波束成形减轻从不需要的方向(即，目标声音的方向以外的方向)输入的噪声(730)。

音频质量增强设备500将对应于每个频带的声学信号而产生的噪声降低的信号合并(740)。

音频质量增强设备500将合并的声学信号变换为时域的声学信号(750)。

图8是示出根据增强音频质量的设备和方法而产生的波束图的示例的示图。

如图8中所示，根据用于增强音频质量的设备和方法的示例，在避免较低频带处的全向特性或由于较高频带处的空间假频引起的栅瓣的同时，在宽频区域(诸如1200Hz至2000Hz、3000Hz至4000Hz以及6200Hz至7200Hz的频带)平均地形成波束图。如上所述，通过使用以非均匀布局布置的麦克风阵列，即使提供大小较小的麦克风阵列，也可在包括较高频带和较低频带的宽频率范围获得具有期望的方向的波束图。

在此描述的单元可使用硬件组件和软件组件来实现。例如，麦克风、放大器、带通滤波器、模拟至数字转换器以及处理装置。可使用一个或多个通用或专用计算机(诸如作为示例的处理器、控制器和运算逻辑单元、数字信号处理器、微计算机、现场可编程阵列、可编程逻辑单元、微处理器或能够以限定的方式响应于指令并执行指令的任何其他装置)来实现处理装置。处理装置可运行操作系统(OS)以及在OS上运行的一个或多个软件应用，所述处理装置还可响应于软件的执行来访问、存储、操纵、处理和创建数据。为了简洁的目的，按照单数来使用对处理装置的描述；然而，本领域技术人员将理解，所述处理装置可包括多个处理元件以及多种类型的处理元件。例如，处理装置可包括多个处理器或一处理器和一控制器。另外，不同的处理配置是可行的，诸如并行处理器。如在此所使用的，被配置为实现功能A的处理装置包括被编程以运行特定软件的处理器。另外，被配置为实现功能A、功能B和功能C的处理装置可包括以下配置，诸如作为示例的被配置为实现全部的功能A、功能B和功能C的处理器；被配置为实现功能A的第一处理器以及被配置为实现功能B和功能C的第二处理器；用于实现功能A的第一处理器、被配置为实现功能B的第二处理器以及被配置为实现功能C的第三处理器；被配置为实现功能A的第一处理器以及被配置为实现功能B和功能C的第二处理器；被配置为实现功能A、功能B、功能C的第一处理器和被配置为实现功能A、功能B和功能C的第二处理器等等。

所述软件可包括计算机程序、代码段、指令或计算机程序、代码段、指令的一些组合，以独立地或共同地指示或配置处理装置来如期望的进行操作。软件和数据可永久地或临时地包含在在任何类型的机器、组件、物理或虚拟设备、计算机存储介质或装置，或包含在能够提供指令或数据的或能够被处理装置解释的传播信号波中。所述软件还可分布于联网的计算机系统上，从而所述软件以分布形式被存储和执行。具体地，可由一个或多个计算机可读记录介质来存储所述软件和数据。计算机可读记录介质可包括可存储其后可由计算机系统或处理装置读出的数据的任何数据存储装置。计算机可读记录介质的示例包括：只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光数据存储装置。

此外，本发明所属领域的编程人员基于并使用在此提供的附图的流程图和框图及其对应的描述，可容易地理解用于完成本发明的功能程序、代码、代码段。以上已描述了多个示例性实施例。然而，将理解的是，可做出各种修改。例如，如果以不同的顺序执行描述的技术和/或如果描述的系统、架构、装置或电路中的组件以不同的方式组合和/或被其他组件或其等同物所替代或补充，则也可实现合适的结果。因此，其他实施方案在权利要求的范围内。

Claims

1.一种用于增强音频质量的设备，所述设备包括：

至少三个麦克风，以非均匀布局被布置；

频率变换单元，被配置为将从所述至少三个麦克风输入的声学信号变换为频域的声学信号；

频带划分与合并单元，被配置为基于所述至少三个麦克风之间的间隔将变换的声学信号的频率划分为频带，以及基于划分的频带将频域中的声学信号合并为两个声道的信号；以及

双声道波束成形单元，被配置为通过对所述两个声道的信号执行波束成形来降低包括来自目标声音的方向以外的方向的输入的信号的噪声，并输出噪声降低的信号。

2.如权利要求1所述的设备，其中，所述至少三个麦克风根据最小冗余线性阵列布局被布置，其中，所述最小冗余线性阵列布局使针对所述至少三个麦克风之间的间隔的冗余分量最小化。

3.如权利要求1所述的设备，其中，当频带划分与合并单元基于所述至少三个麦克风的各个间隔针对变换后声学信号将频率划分为频带时，使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值来分配所述频带。

4.如权利要求3所述的设备，其中，频带划分与合并单元将频带的最大频率值(f₀)确定为小于通过将声速(c)除以对应麦克风之间的间隔(d)的两倍而获得的值。

5.如权利要求1所述的设备，其中，由频带划分与合并单元配置的频带的数量被确定为与所述至少三个麦克风的各成对麦克风的间隔的数量对应。

6.如权利要求1所述的设备，其中，频带划分与合并单元还被配置为对于所述至少三个麦克风的间隔的所有集合，提取每个频带的频域中的声学信号，并将提取的声学信号合并为两个声道的声学信号，其中，所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入。

7.如权利要求1所述的设备，还包括：频率反变换单元，被配置为将输出的噪声降低的信号变换为时域的声学信号。

8.一种用于增强音频质量的设备，所述设备包括：

至少三个麦克风，以非均匀布局被布置；

滤波单元，包括多个带通滤波器，其中，所述多个带通滤波器被配置为允许从所述至少三个麦克风输入的声学信号通过所述多个带通滤波器的各个频带，其中，基于所述至少三个麦克风之间的间隔来确定对应于每个带通滤波器的频率范围；

频率变换单元，被配置为将已通过滤波单元的声学信号变换为频域的声学信号；

双声道波束成形单元，被配置为针对每个频带，降低从两个声道的声学信号的目标声音的方向以外的方向的输入的噪声，其中，所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器；

合并单元，被配置为合并针对每个频带输出的噪声降低的声学信号；以及

频率反变换单元，被配置为将合并的信号变换为时域的声学信号。

9.如权利要求8所述的设备，其中，所述至少三个麦克风根据最小冗余线性阵列被配置，以使针对所述至少三个麦克风的间隔的冗余分量最小化。

10.如权利要求8所述的设备，其中，通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值，确定与包括在滤波单元中的每个带通滤波器对应的频率范围。

11.一种增强声学阵列的音频质量的方法，所述方法包括：

将从以非均匀布局布置的至少三个麦克风输入的声学信号变换为频域的声学信号；

基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带；

基于所述频带将频域的声学信号合并为双声道信号；

通过使用所述双声道信号，降低从目标声音的方向以外的方向输入的声学信号的噪声；以及

输出噪声降低的信号。

12.如权利要求11所述的方法，其中，变换从以非均匀布局布置的至少三个麦克风输入的声学信号的步骤包括：根据最小冗余线性阵列布局来布置所述至少三个麦克风，以使针对所述麦克风之间的间隔的冗余分量最小化，其中，基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤还包括：通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值来确定所述频带，其中，通过使用对于所述麦克风的每个对应间隔不引起空间假频的最大频率值来确定所述频带的步骤包括：将频带的最大频率值(f₀)确定为小于通过将声速(c)除以麦克风的对应间隔(d)的两倍而获得的值。

13.如权利要求11所述的方法，其中，基于所述麦克风之间的间隔将频域的声学信号的频率范围划分为频带的步骤包括：将频率的频率范围划分为与所述麦克风的间隔的数量对应的频带，其中，将频域的声学信号合并为双声道信号的步骤包括：

对于所述至少三个麦克风的间隔的所有集合，提取每个频带的频域中的声学信号，其中，所述频域中的声学信号从形成间隔的所述至少三个麦克风中的两个麦克风的集合输入；以及

将提取的声学信号合并为两个声道的声学信号。

14.一种增强包括以非均匀布局布置的至少三个麦克风的声学阵列的音频质量的方法，所述方法包括：

允许从所述至少三个麦克风输入的声学信号通过多个带通滤波器的各个频带，其中，基于所述至少三个麦克风之间的间隔确定对应于每个带通滤波器的频率范围；

将所述声学信号变换为频域的声学信号；

针对每个频带，降低从两个声道的声学信号的目标声音的方向以外的方向输入的噪声，其中，所述声学信号已通过所述多个带通滤波器之中的相同带通滤波器；

合并针对每个频带输出的噪声降低的声学信号；以及

将合并的噪声降低的声学信号变换为时域的声学信号。

15.如权利要求14所述的方法，其中，所述至少三个麦克风根据最小冗余线性阵列被配置，以使针对所述至少三个麦克风的间隔的冗余分量最小化，以及其中，允许声学信号通过各个频带的步骤包括：

使所述声学信号通过使用对于所述至少三个麦克风的每个对应间隔不引起空间假频的最大频率值而确定的各个频带。