CN113299307B - 麦克风阵列信号处理方法、系统、计算机设备及存储介质 - Google Patents

麦克风阵列信号处理方法、系统、计算机设备及存储介质 Download PDF

Info

Publication number
CN113299307B
CN113299307B CN202110558347.8A CN202110558347A CN113299307B CN 113299307 B CN113299307 B CN 113299307B CN 202110558347 A CN202110558347 A CN 202110558347A CN 113299307 B CN113299307 B CN 113299307B
Authority
CN
China
Prior art keywords
microphone array
audio data
target
angular frequency
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110558347.8A
Other languages
English (en)
Other versions
CN113299307A (zh
Inventor
邓刚
赵宏亮
郑能恒
陈绍林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Changfeng Imaging Equipment Co ltd
Original Assignee
Shenzhen Changfeng Imaging Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Changfeng Imaging Equipment Co ltd filed Critical Shenzhen Changfeng Imaging Equipment Co ltd
Priority to CN202110558347.8A priority Critical patent/CN113299307B/zh
Publication of CN113299307A publication Critical patent/CN113299307A/zh
Application granted granted Critical
Publication of CN113299307B publication Critical patent/CN113299307B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种麦克风阵列信号处理方法、系统、计算机设备及存储介质。该方法包括:采集待处理的音频数据;构造全频带的最小范数滤波器,并确定最小范数滤波器在预设方向上的波束模式;根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带;将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据。本发明实施例所提供的麦克风阵列信号处理方法,通过子带合成的技术解决了最小范数滤波器算法所形成的波束模式在高频部分不稳定的问题,从而提高了麦克风阵列的指向性和空间滤波能力。

Description

麦克风阵列信号处理方法、系统、计算机设备及存储介质
技术领域
本发明实施例涉及音频信号处理技术领域,尤其涉及一种麦克风阵列信号处理方法、系统、计算机设备及存储介质。
背景技术
麦克风阵列广泛应用于需要远场拾音的场景中,应用于麦克风阵列信号处理的波束形成算法通过构造一个空间滤波器,形成特定的空间指向性,使得麦克风阵列只接受来自期望方向的声音信号,而抑制其他方向的信号,从而提升拾音质量。
常见的麦克风阵列波束形成算法主要可以分为加性麦克风阵列波束形成算法和差分麦克风阵列波束形成算法两类。其中,加性麦克风阵列波束形成算法的处理思想是将各麦克风阵元采集到的音频数据先分别进行延时或滤波处理后再加权相加。该类算法的特点是算法通常较简单,阵元个数越多,麦克风阵列输出的信噪比越高。但同时,加性麦克风阵列波束形成算法也存在波束模式对信号频率变化敏感,对低频信号的波束形成效果不好,要实现较好的滤波效果所需的麦克风阵列体积较大等问题。差分麦克风阵列波束形成算法由于具有容易构造频率不变的波束模式、阵元间距小的特点,近年来受到了更多的关注。然而,经典的差分麦克风阵列波束形成算法也存在对白噪声的鲁棒性低的问题,如果拾音环境中出现白噪声,那么白噪声的低频部分会被放大,严重影响语音质量。最小范数滤波器算法通过融合差分阵列算法与加性阵列算法中的LCMV滤波器的设计思想,增加麦克风阵列中的阵元个数来达到一定程度上抑制白噪声低频放大的效果,但同时又使得高频部分的波束模式不稳定。
发明内容
本发明实施例提供一种麦克风阵列信号处理方法、系统、计算机设备及存储介质,以解决最小范数滤波器在高频部分对频率变化敏感,波束模式不稳定的问题。
第一方面,本发明实施例提供了一种麦克风阵列信号处理方法,该方法包括:
采集待处理的音频数据;
构造全频带的最小范数滤波器,并确定所述最小范数滤波器在预设方向上的波束模式;
根据所述波束模式以及所使用的麦克风阵列参数对所述音频数据在频域上划分子带;
将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;
使用所述目标滤波器对所述音频数据进行分子带处理,以得到处理后的目标音频数据。
第二方面,本发明实施例还提供了一种麦克风阵列信号处理系统,该系统包括:
数据采集模块,用于采集待处理的音频数据;
滤波器构造模块,用于构造全频带的最小范数滤波器,并确定所述最小范数滤波器在预设方向上的波束模式;
子带划分模块,用于根据所述波束模式以及所使用的麦克风阵列参数对所述音频数据在频域上划分子带;
目标滤波器获得模块,用于将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;
数据处理模块,用于使用所述目标滤波器对所述音频数据进行分子带处理,以得到处理后的目标音频数据。
第三方面,本发明实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的麦克风阵列信号处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的麦克风阵列信号处理方法。
本发明实施例提供了一种麦克风阵列信号处理方法,首先采集待处理的音频数据,然后构造全频带的最小范数滤波器,并确定该最小范数滤波器在预设方向上的波束模式,再根据该波束模式以及所使用的麦克风阵列参数对采集的音频数据在频域上划分子带,接着将划分得到的各个子带对应的子阵滤波器按频率进行合成以得到目标滤波器,从而使用目标滤波器对采集的音频数据进行分子带处理,以得到处理后的目标音频数据。本发明实施例所提供的麦克风阵列信号处理方法,通过子带合成的技术解决了最小范数滤波器算法所形成的波束模式在高频部分不稳定的问题,从而提高了麦克风阵列的指向性和空间滤波能力。
附图说明
图1为本发明实施例一提供的麦克风阵列信号处理方法的流程图;
图2为本发明实施例二提供的麦克风阵列信号处理系统的结构示意图;
图3为本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的麦克风阵列信号处理方法的流程图。本实施例可适用于均匀线性麦克风阵列进行远场拾音并提升拾音质量的情况,该方法可以由本发明实施例所提供的麦克风阵列信号处理系统来执行,该系统可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中。如图1所示,具体包括如下步骤:
S11、采集待处理的音频数据。
具体的,可以通过麦克风阵列对待处理的音频数据进行采集,对于具体的采集过程,本实施例不作限定。
S12、构造全频带的最小范数滤波器,并确定最小范数滤波器在预设方向上的波束模式。
具体的,该最小范数滤波器的频率响应公式为:
HM,d(ω,α)=DH(ω,α)[D(ω,α)DH(ω,α)]-1β
其中,
是大小为(N+1)×M的约束矩阵,N表示麦克风阵列的阶数,M表示麦克风阵列中麦克风阵元的个数,
是长度为M的导向向量,
α=[1 αN,1 … αN,N]T
β=[1 βN,1 … βN,N]T
是长度为N+1的向量,其中分别包含波束模式的设计参数αN,n和对应的方向响应βN,n,并有αN,n=cosθn,而βN,n决定了最小范数滤波器在θn方向上的响应。另有,HM,d(ω,α)表示对于麦克风阵元数量为M且阵元间距为d的麦克风阵列的最小范数滤波器的频率响应,ω表示角频率,[]H表示矩阵的转置共轭,[]-1表示矩阵的逆,[]T表示矩阵的转置,e表示自然常数,表示复数的虚部单位,τ0=d/c表示麦克风阵列中两个连续阵元之间的延时,d表示麦克风阵列中的阵元间距,c表示声速,取340米/秒。
可选的,使用一阶差分算法构造最小范数滤波器,从而更好的解决差分麦克风阵列滤波器低频白噪声放大的问题,则上述的约束矩阵具体可以是:
上述的导向向量具体可以是:
其中,α=[1 α1]T中包含了波束模式的设计参数α1=cosθ,θ为波束模式的零点方向,β=[1 0]T是α对应的方向响应。
示例性的,如构造一阶心型波束模式,可以设置α=[1 cos180°]=[1 -1],β=[10],即最小范数滤波器在0度方向上的响应为1,在180度方向上的响应为0,同时通过改变α即可改变波束模式的零点方向。即根据上述公式可构造任意阶数和任意麦克风阵元数量的差分麦克风阵列滤波器。
在上述公式的基础上,将最小范数滤波器的频率响应与任意角频率ω和方向对应的导向向量相乘即可得到滤波器在该频率和方向上的响应,即为波束模式,具体公式如下:
在本实施例中,可以首先确定最小范数滤波器在预设方向上的波束模式,即固定公式中导向向量的方向为预设方向/>而ω可以仍为一变量,以便后续利用最小范数滤波器在预设方向/>上各角频率的波束模式的最大值计算各子带的临界频率。可选的,预设方向为90度方向,以适应不同的麦克风阵列和采样率等。
S13、根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带。
具体的,在确定了最小范数滤波器在预设方向上的波束模式之后,即可根据该波束模式以及所使用的麦克风阵列参数对采集的音频数据在频域上划分子带,以便麦克风阵列子阵分别处理不同频带上的信号,从而更利于解决高频部分不稳定的问题。
可选的,麦克风阵列参数包括麦克风阵元数量、阵元间距和采样率;相应的,根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带,包括:将所有麦克风阵元确定为第一子阵,确定第一子阵对应的波束模式在各个角频率下的第一最大值,并将第一最大值对应的角频率确定为第一目标角频率,以根据第一目标角频率确定第一子阵处理的第一角频率范围;将麦克风阵元数量减一个麦克风阵元确定为第二子阵,确定第二子阵对应的波束模式在各个角频率下的第二最大值,并将第二最大值对应的角频率确定为第二目标角频率,以根据第一目标角频率和第二目标角频率确定第二子阵处理的第二角频率范围;依次减少一个麦克风阵元以确定后续子阵,并迭代确定对应的角频率范围,直至完成零到采样率一半的频率范围内的子带划分。
具体的,麦克风阵列参数可以包括麦克风阵列中的麦克风阵元数量和阵元间距d,从而可以将麦克风阵元数量和阵元间距代入上述公式中以求得具体的值。首先可以将所有麦克风阵元(即使用麦克风阵元数量M个麦克风阵元)确定为第一子阵,通过上述公式求得第一子阵对应的波束模式在各个角频率下的第一最大值B[H11,α),90°]=max{B[H1(ω,α),90°]},该波束模式即可以是最小范数滤波器在90度方向上的波束模式,从而将第一最大值对应的角频率ω1确定为第一目标角频率,进而可以根据第一目标角频率确定第一子阵处理的第一角频率范围,具体可以将0~ω1范围内的频域信号使用第一子阵处理。则第一个子阵滤波器为:
之后开始构建第二子阵,第二子阵可以使用麦克风阵元数量减一个(M-1个)麦克风阵元,同时保持阵元间距d不变。构建完成后即可用同样的方法计算第二子阵对应的波束模式在各个角频率下的第二最大值B[H22,α),90°]=max{B[H2(ω,α),90°]},该波束模式同可以为最小范数滤波器在90度方向上的波束模式,从而将第二最大值对应的角频率ω2确定为第二目标角频率,进而可以根据第一目标角频率和第二目标角频率确定第二子阵处理的第二角频率范围,具体可以将ω1~ω2范围内的频域信号使用第二子阵处理。则第二个子阵滤波器为:
之后可以依次构建第三子阵及第四子阵等,并将每次子阵所使用的麦克风阵元数量减一,即第三子阵可以使用M-2个麦克风阵元,第四子阵可以使用M-3个麦克风阵元等等,在每次构建新的子阵之后,可以用同样的方法以迭代的方式确定各个子阵对应的角频率范围,从而使得各个子阵处理各自对应的角频率范围内的频域信号,直至完成了零到采样率fs一半的频率范围内(0~fs/2)的子带划分。则可得到各个子阵滤波器的通式为:
B[Hnn,α),90°]=max{B[Hn(ω,α),90°]}
其中,n表示子阵下标,ω0=0。
S14、将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器。
具体的,在完成了子带划分之后,可以使用每个子阵对应的子阵滤波器处理各自对应的角频率范围内的频域信号,从而可以将各个子带对应的子阵滤波器按照频率顺序进行合成,以得到一个整体的滤波器,即目标滤波器,进而可以使用目标滤波器实现对信号的分子带处理。合成的过程可以采用如下公式:
Hsub,d(ω,α)=H1(ω,α)+H2(ω,α)+…+Hn(ω,α)
其中,Hsub,d(ω,α)表示目标滤波器,Hn(ω,α)表示第n个子阵滤波器。通过使用子阵滤波器频率响应相加的方法将多个子阵滤波器合并为一个麦克风阵列滤波器,即目标滤波器,使得在滤波阶段仅需使用一次矩阵乘法即可完成滤波处理,从而提高了处理速度。
S15、使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据。
具体的,在获得了目标滤波器之后,即可使用目标滤波器对采集的音频数据进行分子带处理,从而得到处理后的目标音频数据。
在上述技术方案的基础上,可选的,在根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带之前,还包括:对音频数据进行预处理,以将音频数据从时域转换到频域;相应的,在使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据之后,还包括:对目标音频数据进行后处理,以将目标音频数据从频域转换到时域。通过首先将音频数据转换到频域,可以方便后续的滤波算法进行处理,并在处理完成后转换回时域,以得到所需的目标音频数据。
进一步可选的,对音频数据进行预处理,以将音频数据从时域转换到频域,包括:对音频数据进行短时帧级处理;对短时帧级处理所得的每帧信号进行sin窗加权及重叠处理,并对处理后的每帧信号进行傅里叶变换。其中,可选的,每一帧之间的重叠部分可以是50%,对音频数据进行短时帧级处理,包括:根据预设帧长对音频数据进行短时帧级处理,应用预设帧长使得经过傅里叶变换后的信号频谱的频率分辨率在100-250赫兹之间,同时应用该频率分辨率指标还可以更加适当的选取傅里叶变换点数等。具体的,在完成音频数据的采集之后,可以将音频数据中每N个样本为一帧,经过实验研究发现,时域音频信号经过傅里叶变换后得到的频谱的频率分辨率处于100-250赫兹的区间内时,可以在保证阵列收声极性实现的同时,更有效的抑制低频部分的白噪声放大。频率分辨率的计算公式为其中,fS表示麦克风阵列的采样率,N表示帧长,也可表示傅里叶变换的点数,取2的幂次,T表示帧长度,单位为秒。示例性的,在16千赫兹的采样下,可得则64≤N≤160,0.001≤T≤0.01,可取N为64或128。可见,重叠程度以及预设帧长等参数的设置将对滤波算法的性能产生影响,通过上述合理的参数设置,可以进一步改善差分麦克风阵列的低频白噪声放大的问题。相应的,对目标音频数据进行后处理可以包括对处理后的目标音频数据进行傅里叶逆变换,以及将分帧的信号加sin窗,并重叠50%,最后合成完整的信号后输出。
进一步可选的,使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据,包括:将预处理所得的每帧信号分别与目标滤波器的频率响应相乘,以得到目标音频数据。具体的,在完成了子带的划分并设置了对应的子阵之后,在滤波阶段的工作则可以是将预处理后所得的每帧信号分别与目标滤波器的频率响应相乘,从而得到目标滤波器的输出信号,即目标音频数据。通过对音频数据的分帧,可以很方便的实现滤波过程。
本发明实施例所提供的技术方案,首先采集待处理的音频数据,然后构造全频带的最小范数滤波器,并确定该最小范数滤波器在预设方向上的波束模式,再根据该波束模式以及所使用的麦克风阵列参数对采集的音频数据在频域上划分子带,接着将划分得到的各个子带对应的子阵滤波器按频率进行合成以得到目标滤波器,从而使用目标滤波器对采集的音频数据进行分子带处理,以得到处理后的目标音频数据。通过子带合成的技术解决了最小范数滤波器算法所形成的波束模式在高频部分不稳定的问题,从而提高了麦克风阵列的指向性和空间滤波能力。
实施例二
图2为本发明实施例二提供的麦克风阵列信号处理系统的结构示意图,该系统可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中,用于执行本发明任意实施例所提供的麦克风阵列信号处理方法。如图2所示,该系统包括:
数据采集模块21,用于采集待处理的音频数据;
滤波器构造模块22,用于构造全频带的最小范数滤波器,并确定最小范数滤波器在预设方向上的波束模式;
子带划分模块23,用于根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带;
目标滤波器获得模块24,用于将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;
数据处理模块25,用于使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据。
本发明实施例所提供的技术方案,首先采集待处理的音频数据,然后构造全频带的最小范数滤波器,并确定该最小范数滤波器在预设方向上的波束模式,再根据该波束模式以及所使用的麦克风阵列参数对采集的音频数据在频域上划分子带,接着将划分得到的各个子带对应的子阵滤波器按频率进行合成以得到目标滤波器,从而使用目标滤波器对采集的音频数据进行分子带处理,以得到处理后的目标音频数据。通过子带合成的技术解决了最小范数滤波器算法所形成的波束模式在高频部分不稳定的问题,从而提高了麦克风阵列的指向性和空间滤波能力。
在上述技术方案的基础上,可选的,麦克风阵列参数包括麦克风阵元数量、阵元间距和采样率;
相应的,子带划分模块23具体用于:
将所有麦克风阵元确定为第一子阵,确定第一子阵对应的波束模式在各个角频率下的第一最大值,并将第一最大值对应的角频率确定为第一目标角频率,以根据第一目标角频率确定第一子阵处理的第一角频率范围;
将麦克风阵元数量减一个麦克风阵元确定为第二子阵,确定第二子阵对应的波束模式在各个角频率下的第二最大值,并将第二最大值对应的角频率确定为第二目标角频率,以根据第一目标角频率和第二目标角频率确定第二子阵处理的第二角频率范围;
依次减少一个麦克风阵元以确定后续子阵,并迭代确定对应的角频率范围,直至完成零到采样率一半的频率范围内的子带划分。
在上述技术方案的基础上,可选的,该麦克风阵列信号处理系统,还包括:
预处理模块,用于在根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带之前,对音频数据进行预处理,以将音频数据从时域转换到频域;
相应的,该麦克风阵列信号处理系统,还包括:
后处理模块,用于在使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据之后,对目标音频数据进行后处理,以将目标音频数据从频域转换到时域。
在上述技术方案的基础上,可选的,预处理模块具体用于:
对音频数据进行短时帧级处理;
对短时帧级处理所得的每帧信号进行sin窗加权及重叠处理,并对处理后的每帧信号进行傅里叶变换。
在上述技术方案的基础上,可选的,预处理模块具体用于:
根据预设帧长对音频数据进行短时帧级处理,应用预设帧长使得经过傅里叶变换后的信号频谱的频率分辨率在100-250赫兹之间。
在上述技术方案的基础上,可选的,数据处理模块25具体用于:
将预处理后所得的每帧信号分别与目标滤波器的频率响应相乘,以得到目标音频数据。
在上述技术方案的基础上,可选的,预设方向为90度方向。
本发明实施例所提供的麦克风阵列信号处理系统可执行本发明任意实施例所提供的麦克风阵列信号处理方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,在上述麦克风阵列信号处理系统的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例三
图3为本发明实施例三提供的计算机设备的结构示意图,示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图3显示的计算机设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图3所示,该计算机设备包括处理器31、存储器32、输入装置33及输出装置34;计算机设备中处理器31的数量可以是一个或多个,图3中以一个处理器31为例,计算机设备中的处理器31、存储器32、输入装置33及输出装置34可以通过总线或其他方式连接,图3中以通过总线连接为例。
存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的麦克风阵列信号处理方法对应的程序指令/模块(例如,麦克风阵列信号处理系统中的数据采集模块21、滤波器构造模块22、子带划分模块23、目标滤波器获得模块24及数据处理模块25)。处理器31通过运行存储在存储器32中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的麦克风阵列信号处理方法。
存储器32可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器32可进一步包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置33可用于采集待处理的音频数据以及产生与计算机设备的用户设置和功能控制有关的键信号输入等。输出装置34可用于输出处理后的目标音频数据等。
实施例四
本发明实施例四还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行一种麦克风阵列信号处理方法,该方法包括:
采集待处理的音频数据;
构造全频带的最小范数滤波器,并确定最小范数滤波器在预设方向上的波束模式;
根据波束模式以及所使用的麦克风阵列参数对音频数据在频域上划分子带;
将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;
使用目标滤波器对音频数据进行分子带处理,以得到处理后的目标音频数据。
存储介质可以是任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM、兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的麦克风阵列信号处理方法中的相关操作。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种麦克风阵列信号处理方法,其特征在于,包括:
采集待处理的音频数据;
构造全频带的最小范数滤波器,并确定所述最小范数滤波器在预设方向上的波束模式;
根据所述波束模式以及所使用的麦克风阵列参数对所述音频数据在频域上划分子带;
将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;
使用所述目标滤波器对所述音频数据进行分子带处理,以得到处理后的目标音频数据;
所述麦克风阵列参数包括麦克风阵元数量、阵元间距和采样率;
相应的,所述根据所述波束模式以及所使用的麦克风阵列参数对所述音频数据在频域上划分子带,包括:
将所有麦克风阵元确定为第一子阵,确定所述第一子阵对应的所述波束模式在各个角频率下的第一最大值,并将所述第一最大值对应的角频率确定为第一目标角频率,以根据所述第一目标角频率确定所述第一子阵处理的第一角频率范围;
将所述麦克风阵元数量减一个麦克风阵元确定为第二子阵,确定所述第二子阵对应的所述波束模式在各个角频率下的第二最大值,并将所述第二最大值对应的角频率确定为第二目标角频率,以根据所述第一目标角频率和所述第二目标角频率确定所述第二子阵处理的第二角频率范围;
依次减少一个麦克风阵元以确定后续子阵,并迭代确定对应的角频率范围,直至完成零到所述采样率一半的频率范围内的子带划分。
2.根据权利要求1所述的麦克风阵列信号处理方法,其特征在于,在所述根据所述波束模式以及所使用的麦克风阵列参数对所述音频数据在频域上划分子带之前,还包括:
对所述音频数据进行预处理,以将所述音频数据从时域转换到频域;
相应的,在所述使用所述目标滤波器对所述音频数据进行分子带处理,以得到处理后的目标音频数据之后,还包括:
对所述目标音频数据进行后处理,以将所述目标音频数据从频域转换到时域。
3.根据权利要求2所述的麦克风阵列信号处理方法,其特征在于,所述对所述音频数据进行预处理,以将所述音频数据从时域转换到频域,包括:
对所述音频数据进行短时帧级处理;
对短时帧级处理所得的每帧信号进行sin窗加权及重叠处理,并对处理后的每帧信号进行傅里叶变换。
4.根据权利要求3所述的麦克风阵列信号处理方法,其特征在于,所述对所述音频数据进行短时帧级处理,包括:
根据预设帧长对所述音频数据进行短时帧级处理,应用所述预设帧长使得经过傅里叶变换后的信号频谱的频率分辨率在100-250赫兹之间。
5.根据权利要求3所述的麦克风阵列信号处理方法,其特征在于,所述使用所述目标滤波器对所述音频数据进行分子带处理,以得到处理后的目标音频数据,包括:
将预处理后所得的每帧信号分别与所述目标滤波器的频率响应相乘,以得到所述目标音频数据。
6.根据权利要求1所述的麦克风阵列信号处理方法,其特征在于,所述预设方向为90度方向。
7.一种麦克风阵列信号处理系统,其特征在于,包括:
数据采集模块,用于采集待处理的音频数据;
滤波器构造模块,用于构造全频带的最小范数滤波器,并确定所述最小范数滤波器在预设方向上的波束模式;
子带划分模块,用于根据所述波束模式以及所使用的麦克风阵列参数对所述音频数据在频域上划分子带;
目标滤波器获得模块,用于将划分得到的各个子带对应的子阵滤波器按频率进行合成,以得到目标滤波器;
数据处理模块,用于使用所述目标滤波器对所述音频数据进行分子带处理,以得到处理后的目标音频数据;
所述麦克风阵列参数包括麦克风阵元数量、阵元间距和采样率;
相应的,所述子带划分模块具体用于:
将所有麦克风阵元确定为第一子阵,确定所述第一子阵对应的所述波束模式在各个角频率下的第一最大值,并将所述第一最大值对应的角频率确定为第一目标角频率,以根据所述第一目标角频率确定所述第一子阵处理的第一角频率范围;
将所述麦克风阵元数量减一个麦克风阵元确定为第二子阵,确定所述第二子阵对应的所述波束模式在各个角频率下的第二最大值,并将所述第二最大值对应的角频率确定为第二目标角频率,以根据所述第一目标角频率和所述第二目标角频率确定所述第二子阵处理的第二角频率范围;
依次减少一个麦克风阵元以确定后续子阵,并迭代确定对应的角频率范围,直至完成零到所述采样率一半的频率范围内的子带划分。
8.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的麦克风阵列信号处理方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的麦克风阵列信号处理方法。
CN202110558347.8A 2021-05-21 2021-05-21 麦克风阵列信号处理方法、系统、计算机设备及存储介质 Active CN113299307B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110558347.8A CN113299307B (zh) 2021-05-21 2021-05-21 麦克风阵列信号处理方法、系统、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110558347.8A CN113299307B (zh) 2021-05-21 2021-05-21 麦克风阵列信号处理方法、系统、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113299307A CN113299307A (zh) 2021-08-24
CN113299307B true CN113299307B (zh) 2024-02-06

Family

ID=77323690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110558347.8A Active CN113299307B (zh) 2021-05-21 2021-05-21 麦克风阵列信号处理方法、系统、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113299307B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114305485A (zh) * 2021-12-31 2022-04-12 科大讯飞股份有限公司 心跳监测方法以及心跳监测装置、计算机可读存储介质
CN114636971B (zh) * 2022-04-26 2022-08-16 海南浙江大学研究院 一种水听器阵列数据远场信号分离方法及装置
CN114944154B (zh) * 2022-07-26 2022-11-15 深圳市长丰影像器材有限公司 音频调整方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856866A (zh) * 2012-12-04 2014-06-11 西北工业大学 低噪微分麦克风阵列
US10327221B1 (en) * 2018-05-25 2019-06-18 Apple Inc. Super-resolution technique for time-of-arrival estimation
CN110164446A (zh) * 2018-06-28 2019-08-23 腾讯科技(深圳)有限公司 语音信号识别方法和装置、计算机设备和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103856866A (zh) * 2012-12-04 2014-06-11 西北工业大学 低噪微分麦克风阵列
US10327221B1 (en) * 2018-05-25 2019-06-18 Apple Inc. Super-resolution technique for time-of-arrival estimation
CN110164446A (zh) * 2018-06-28 2019-08-23 腾讯科技(深圳)有限公司 语音信号识别方法和装置、计算机设备和电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Design of Optimal Linear Differential Microphone Arrays Based Array Geometry Optimization;Jilu Jin et al.;ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP);第5741-5745页 *
Nonuniform Subband Method for Wideband Beamforming of Nested Array;Yaqing Chen et al.;2009 2nd International Congress on Image and Signal Processing;第1-4页 *

Also Published As

Publication number Publication date
CN113299307A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN113299307B (zh) 麦克风阵列信号处理方法、系统、计算机设备及存储介质
CN109102822B (zh) 一种基于固定波束形成的滤波方法及装置
Teutsch et al. Acoustic source detection and localization based on wavefield decomposition using circular microphone arrays
CN100524465C (zh) 一种噪声消除装置和方法
CN105792074B (zh) 一种语音信号处理方法和装置
US9129587B2 (en) Method, device and system for eliminating noises with multi-microphone array
WO2015196729A1 (zh) 一种麦克风阵列语音增强方法及装置
CN104699445A (zh) 一种音频信息处理方法及装置
CN103856866B (zh) 低噪微分麦克风阵列
EP3576426B1 (en) Low complexity multi-channel smart loudspeaker with voice control
US9628905B2 (en) Adaptive beamforming for eigenbeamforming microphone arrays
Crocco et al. Stochastic and analytic optimization of sparse aperiodic arrays and broadband beamformers with robust superdirective patterns
CN102421050A (zh) 使用麦克风的非均匀布局来增强音频质量的设备和方法
US20150163577A1 (en) Low noise differential microphone arrays
CN106233382B (zh) 一种对若干个输入音频信号进行去混响的信号处理装置
CN105590631A (zh) 信号处理的方法及装置
CN1565144A (zh) 使用过采样滤波器组的定向音频信号处理
CN104041073A (zh) 近场零位与波束成形
CN108717495A (zh) 多波束波束成形的方法、装置及电子设备
JPH11146494A (ja) アンテナ
EP1986464A1 (en) Highly directive endfire loudspeaker array
Frank et al. Constant-beamwidth kronecker product beamforming with nonuniform planar arrays
JP2014165901A (ja) 音場収音再生装置、方法及びプログラム
WO2022000174A1 (zh) 音频处理方法、音频处理装置、电子设备
CN115866483A (zh) 一种音频信号的波束形成方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant