CN108447499A - 一种双层圆环麦克风阵列语音增强方法 - Google Patents
一种双层圆环麦克风阵列语音增强方法 Download PDFInfo
- Publication number
- CN108447499A CN108447499A CN201810346345.0A CN201810346345A CN108447499A CN 108447499 A CN108447499 A CN 108447499A CN 201810346345 A CN201810346345 A CN 201810346345A CN 108447499 A CN108447499 A CN 108447499A
- Authority
- CN
- China
- Prior art keywords
- microphone array
- signal
- double
- microphone
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 239000013598 vector Substances 0.000 claims description 44
- 230000001427 coherent effect Effects 0.000 claims description 13
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 241000209140 Triticum Species 0.000 claims description 2
- 235000021307 Triticum Nutrition 0.000 claims description 2
- 238000005303 weighing Methods 0.000 claims 1
- 239000004568 cement Substances 0.000 abstract description 3
- 125000002619 bicyclic group Chemical group 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
本发明公开了一种双层圆环麦克风阵列语音增强方法,根据声场环境的不同采用不同的波束形成方法,提高了麦克风阵列的对噪声的鲁棒性,其中当声场环境为散射噪声场时,在不同频段分别采用一阶和二阶差分波束形成器项组合的方法进行语音增强,可以在不牺牲白噪声增益的情况下获得较高的方向性因数。
Description
技术领域
本发明涉及信号处理技术领域,特别是一种双层圆环麦克风阵列语音增强方法。
背景技术
麦克风阵列是由多个麦克风组成的具有特定拓扑结构的声音处理系统,其采集到的信号与噪声的相关信息要远大于单个麦克风,因此可以解决多种单麦克风无法处理的实际的声学问题。
环境中存在多种类型的噪声,不同的语音增强算法适用于不同的噪声场,因此,能否适应不同类型的噪声场,是评价麦克风阵列性能的重要指标,为了研究方便,抽象出了三种类型的噪声场:相干噪声场,非相干噪声场,散射噪声场;在相干噪声场中,麦克风阵列中的各阵元接收到的噪声信号具有强相关性;非相干噪声场指在给定空间位置的噪声信号与该空间中所有其他位置的噪声信号都不相关,这是一种理想环境,在实际中并不存在,但在麦克风阵列信号处理领域,通常将阵列自身的电学噪声视为非相干噪声进行处理;而当空间中相干噪声与非相干噪声同时存在时,将这种声场称为散射噪声场,许多实际噪声环境都可以被看作散射噪声,如会议室、汽车噪声等,而任何一个噪声场都会影响到麦克风阵列的语音质量,因此,如何去除噪声以及干扰是语音增强的主要目标之一。
麦克风阵列的性能通过信噪比增益来度量,其定义为输出信噪比与输入信噪比的比值,信噪比增益反映了信号通过阵列前后信噪比的改善程度,差分麦克风阵列中常用白噪声增益和方向性因数2个指标,白噪声增益表示当声场为非相干噪声时的阵增益;方向性因数表示当声场为散射噪声时的阵增益,而在差分麦克风阵列中提高方向性因数需要以牺牲白噪声增益为代价,二者不能同时提高。
发明内容
为解决上述问题,本发明的目的在于提供一种双层圆环麦克风阵列语音增强方法,在不同的声场环境下采用不同的波束形成方法,可以提高麦克风阵列对噪声的鲁棒性,同时可以在不牺牲白噪声增益的情况下获得较高的方向性因数。
本发明解决其问题所采用的技术方案是:
一种双层圆环麦克风阵列语音增强方法,包括以下步骤:
A、采集通道的时域信号;
B、对采集到的通道的时域信号进行分帧、加窗后得到通道的接收信号的频域表示;
C、对通道的接收信号的频域表示进行短时傅里叶变换,得到整个麦克风阵列接收的信号的频率子带;
D、根据静音段不同通道间的相干函数对声场环境进行判定;
E、当声场环境为非相关噪声场时,在子带上采用一阶差分波束形成器进行波束形成得到权向量;当声场环境为散射噪声场时,在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量,在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量;
F、根据权向量计算得到输出信号;
G、将输出信号进行变换后得到增强后的语音信号。
进一步,所述步骤A采集通道的时域信号中,由麦克风阵列对通道的时域信号进行采集,采集到的时域信号为:
yp,m(k)=xp,m(k)+vp,m(k);
其中xp,m(k)为期望信号,vp,m(k)为噪声,yp,m(k)为第p个环上第m个麦克风采集的时域信号,k为采样后的时间序列索引。
进一步,所述步骤B中通道的接收信号的频域表示为:
其中rp为双层圆环麦克风的内外圆半径,p=1或p=2,p=1时r1为内圆半径,p=2时r2为外圆半径,ψp,m为内圆或外圆上第m个麦克风的方位角,其中M为内圆以及外圆上分别设置的麦克风数量。
进一步,所述步骤C中整个麦克风阵列接收的信号的频率子带为:
其中,
将yp(ω)=dp(ω,θ)X(ω)+Vp(ω)代入到频率子带y(ω)的计算公式中得到y(ω)=d(ω,θ)X(ω)+V(ω);
其中,p=1,2,p表示双层麦克风阵列的内外圆,p=1为内圆麦克风阵列,p=2为外圆麦克风阵列,Yp,1(ω)表示内圆或外圆上第一个麦克风的接收信号的频域表示,M为麦克风的内圆或外圆上麦克风的数量,d(ω,θ)为导向向量,其中 Vp(ω)为单环麦克风所接收的噪声,V(ω)为整个麦克风阵列所接收的噪声。
进一步,所述步骤D根据静音段不同通道间的相干函数对声场环境进行判定中,相干函数的表达式为:
其中φmn、φmm为任取阵列中的两路信号的互功率谱和自功率谱,在得到相干函数后,令rmn=‖Re(Γmn)‖2,并遍历所有的通道组合,得到所有的rmn,若所有的rmn都小于H1,则判定为非相关噪声场;若所有的rmn都大于H2,则判定为相关噪声场;若所有的rmn大于位于H1、H2之间,则判定为散射噪声场,其中H1、H2为预设的阈值。
进一步,所述步骤E当声场环境为非相关噪声场时,在子带上采用一阶差分波束形成器进行波束形成得到权向量;当声场环境为散射噪声场时,在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量,在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量中,构建权向量的表达式:
h(ω)=Ψ H(ω)[Ψ(ω)Ψ H(ω)]-1bN+1;
其中,bN,n为预设的参数,用于构建理想的N阶差分阵列波束,N=1或2,当声场环境为非相关噪声场时,N取1;当声场环境为散射噪声场时,N取1和2两个值并分别得到不同的权向量;Ψ(ω)为导向矩阵,且Ψ(ω)=[Ψ1(ω)Ψ2(ω)]T,其中Ψp(ω)的表达式为:
其中,Jn()为第一类n阶贝塞尔函数,p=1,2。
进一步,所述步骤F根据权向量计算得到输出信号中,输出信号的表达式为:
Z(ω)=h H(ω)d(ω,θ)X(ω)+h H(ω)V(ω);
其中,Z(ω)为输出信号,h(ω)为权向量,d(ω,θ)为导向向量,X(ω)为期望信号,V(ω)为整个麦克风阵列的噪声。
进一步,所述步骤G将输出信号进行变换后得到增强后的语音信号中,对输出信号进行逆傅里叶变换后采用重叠相加法得到增强后的语音信号。
本发明的有益效果是:本发明采用的一种双层圆环麦克风阵列语音增强方法,根据声场环境的不同采用不同的波束形成方法,提高了麦克风阵列的对噪声的鲁棒性,其中当声场环境为散射噪声场时,在不同频段分别采用一阶和二阶差分波束形成器项组合的方法进行语音增强,可以在不牺牲白噪声增益的情况下获得较高的方向性因数。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是双层圆环麦克风阵列的结构示意图;
图2是本发明一种双层圆环麦克风阵列语音增强方法的流程图。
具体实施方式
本发明所选用的麦克风阵列为双层圆环麦克风阵列,传统的麦克风阵列一般为线性结构或单环结构,相对于线性麦克风阵列,圆环形麦克风阵列的波束可以偏转到多个方向上,同时具有很好的频率一致性,而单环麦克风阵列在麦克风数量增加时会存在严重的空间混叠,采用双圆环结构就可以避免这一问题。
本发明由于存在内外两个圆,为了方便区分,以下涉及到的公式中,字母下方有下划线的表示双环麦克风,没有下划线的为表示单环麦克风,例如d(ω,θ)表示双环麦克风的导向向量,而dp(ω,θ)表示单环麦克风的导向向量。
参照图1所示的双层圆环麦克风阵列,其由两个同心圆组成,内外圆的半径为rp(p=1,2),p=1表示内圆,r1为内圆半径,p=2表示外圆,r2为外圆半径,内外圆上都均匀分布着M(M为偶数)个麦克风,则第p个环上第m个麦克风的坐标为rp,m=(rpcosψp,m,rpsinψp,m),其中为该麦克风的方位角,根据所有麦克风的方位角可以构造出内圆以及外圆的导向向量,单环导向向量由单环导向向量dp(ω,θ)可以得到整个双层圆环麦克风阵列的导向向量其中c为声速。
每一个麦克风为一个通道,即本发明有2M个通道,对应的在采集通道时域信号时,有2M个通道的时域信号。
参照图2,本发明的一种双层圆环麦克风阵列语音增强方法,包括以下步骤:
A、采集通道的时域信号;
由麦克风阵列对通道的时域信号进行采集,采集到的时域信号为:
yp,m(k)=xp,m(k)+vp,m(k);
其中xp,m(k)为期望信号,vp,m(k)为噪声,yp,m(k)为第p个环上第m个麦克风采集的时域信号,k为采样后的时间序列索引。
B、对采集到的通道时域信号进行分帧、加窗后得到通道的接收信号的频域表示为:
X(ω)为整个麦克风阵列的期望信号,Vp,m(ω)第p个环上第m个麦克风噪声的频域表示;
C、对通道的接收信号的频域表示进行短时傅里叶变换,得到整个麦克风阵列接收的信号的频率子带:
其中,
将yp(ω)=dp(ω,θ)X(ω)+Vp(ω)代入到频率子带y(ω)的计算公式中得到y(ω)=d(ω,θ)X(ω)+V(ω);
其中,Vp(ω)为单环麦克风所接收的噪声,V(ω)为整个麦克风阵列所接收的噪声。
D、根据静音段不同通道间的相干函数对声场环境进行判定,室内环境中,在一段固定时间内声场的性质保持不变,通常带噪语音的前100ms为静音段,可以通过对静音段进行相关性检测来对声场进行分类,方法如下:任取阵列中的两路信号作为一个组合构建相干函数,其中相干函数的表达式为:
φmn、φmm为任取阵列中的两路信号的互功率谱和自功率谱,在得到相干函数后,令rmn=‖Re(Γmn)‖2,并遍历所有的通道组合,得到所有的rmn,若所有的rmn都小于H1,则判定为非相关噪声场;若所有的rmn都大于H2,则判定为相关噪声场;若所有的rmn大于位于H1、H2之间,则判定为散射噪声场,其中H1、H2为预设的阈值。
E、当声场环境为非相关噪声场时,在子带上采用一阶差分波束形成器进行波束形成得到权向量;当声场环境为散射噪声场时,在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量,在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量;
F、根据权向量计算得到输出信号;
G、将输出信号进行变换后得到增强后的语音信号。
y(ω)会根据声场的不同通过不同的波束形成器,然后可以得到整个双层圆环麦克风阵列的输出为:其中Yp,m(ω)为单通道接收信号的频域表示,而可以根据以下公式进行转换:
首先设置权向量其中h1(ω)为内圆的权向量,h2(ω)为外圆的权向量,对于单环的权向量hp(ω)而言,其表达式为其中H′p,m(ω)与Hp,M(ω)的转换通过以下公式实现:
时的权向量根据差分阵列的对称性约束得到:
Hp,m+1(ω)=Hp,M-m+1(ω)
根据以上所述的h(ω)、hp(ω)、H′p,m(ω)、Hp,M(ω)四者之间的关系,可以对整个双层圆环麦克风阵列的输出Z(ω)的表达式进行扩展,即:
Z(ω)=h H(ω)y(ω);
而由之前的步骤已经得到y(ω)=d(ω,θ)X(ω)+V(ω),所以可以得到Z(ω)=h H(ω)d(ω,θ)X(ω)+h H(ω)V(ω),所以对于Z(ω)的求解就转换成为对权向量h(ω)的求解。
而权向量h(ω)是通过波束形成器对信号进行波束形成而得到的,首先理想的N阶差分阵列波束图的表达式为: 表示θ不同的时候阵列对入射信号的敏感度例如0度为人说话,90度为干扰,设计一个波束图使得BN(0)=1,BN(90)=0,就可以抑制干扰,其中bN,n这个参数是预先指定的,bN,n的值不同,设计出来的波束图形状也不一样;
构造公式Ψ(ω)h(ω)=bN+1,其中N=1或2,当声场环境为非相关噪声场时,N取1;当声场环境为散射噪声场时,N取1和2两个值并分别得到不同的权向量;Ψ(ω)为导向矩阵,且Ψ(ω)=[Ψ1(ω)Ψ2(ω)]T,其中Ψp(ω)的表达式为:
其中,Jn()为第一类n阶贝塞尔函数,p=1,2。
根据Ψ(ω)以及bN+1可以得到权向量h(ω)的表达式为:
h(ω)=Ψ H(ω)[Ψ(ω)Ψ H(ω)]-1bN+1
在得到h(ω)之后,将h(ω)带入到Z(ω)的表达式中,即可得到输出信号,然后对输出信号进行逆傅里叶变换后采用重叠相加法可以得到增强后的语音信号。
本发明根据声场环境的不同,采用不同的波束形成方法,提高了麦克风阵列对噪声的鲁棒性,当声场环境为散射噪声场时,在低频段(例如0-4kHz)的子带上,采用一阶差分波束形成器进行波束形成,在高频段(例如4-8kHz)的子带上,采用二阶差分波束形成器进行波束形成,可以在不牺牲白噪声增益的情况下获得较高的方向性因数。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。
Claims (8)
1.一种双层圆环麦克风阵列语音增强方法,其特征在于:包括以下步骤:
A、采集通道的时域信号;
B、对采集到的通道的时域信号进行分帧、加窗后得到通道的接收信号的频域表示;
C、对通道的接收信号的频域表示进行短时傅里叶变换,得到整个麦克风阵列接收的信号的频率子带;
D、根据静音段不同通道间的相干函数对声场环境进行判定;
E、当声场环境为非相关噪声场时,在子带上采用一阶差分波束形成器进行波束形成得到权向量;当声场环境为散射噪声场时,在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量,在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量;
F、根据权向量计算得到输出信号;
G、将输出信号进行变换后得到增强后的语音信号。
2.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤A采集通道的时域信号中,由麦克风阵列对通道的时域信号进行采集,采集到的时域信号为:
yp,m(k)=xp,m(k)+vp,m(k);
其中xp,m(k)为期望信号,vp,m(k)为噪声,yp,m(k)为第p个环上第m个麦克风采集的时域信号,k为采样后的时间序列索引。
3.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤B中通道的接收信号的频域表示为:
其中rp为双层圆环麦克风的内外圆半径,p=1或p=2,p=1时r1为内圆半径,p=2时r2为外圆半径,ψp,m为内圆或外圆上第m个麦克风的方位角,其中M为内圆以及外圆上分别设置的麦克风数量。
4.根据权利要求3所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤C中整个麦克风阵列接收的信号的频率子带为:
其中,
将yp(ω)=dp(ω,θ)X(ω)+Vp(ω)代入到频率子带y(ω)的计算公式中得到y(ω)=d(ω,θ)X(ω)+V(ω);
其中,p=1,2,p表示双层麦克风阵列的内外圆,p=1为内圆麦克风阵列,p=2为外圆麦克风阵列,Yp,1(ω)表示内圆或外圆上第一个麦克风的接收信号的频域表示,M为麦克风的内圆或外圆上麦克风的数量,d(ω,θ)为导向向量,其中
Vp(ω)为单环麦克风所接收的噪声,V(ω)为整个麦克风阵列所接收的噪声。
5.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤D根据静音段不同通道间的相干函数对声场环境进行判定中,相干函数的表达式为:
其中φmn、φmm为任取阵列中的两路信号的互功率谱和自功率谱,在得到相干函数后,令rmn=‖Re(Γmn)‖2,并遍历所有的通道组合,得到所有的rmn,若所有的rmn都小于H1,则判定为非相关噪声场;若所有的rmn都大于H2,则判定为相关噪声场;若所有的rmn大于位于H1、H2之间,则判定为散射噪声场,其中H1、H2为预设的阈值。
6.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤E当声场环境为非相关噪声场时,在子带上采用一阶差分波束形成器进行波束形成得到权向量;当声场环境为散射噪声场时,在低频段的子带上采用一阶差分波束形成器进行波束形成得到权向量,在高频段的子带上采用二阶差分波束形成器进行波束形成得到权向量中,构建权向量的表达式:
h(ω)=Ψ H(ω)[Ψ(ω)Ψ H(ω)]-1bN+1;
其中,bN,n为预设的参数,用于构建理想的N阶差分阵列波束,N=1或2,当声场环境为非相关噪声场时,N取1;当声场环境为散射噪声场时,N取1和2两个值并分别得到不同的权向量;Ψ(ω)为导向矩阵,且Ψ(ω)=[Ψ1(ω)Ψ2(ω)]T,其中Ψp(ω)的表达式为:
其中,Jn()为第一类n阶贝塞尔函数,p=1,2。
7.根据权利要求6所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤F根据权向量计算得到输出信号中,输出信号的表达式为:
Z(ω)=h H(ω)d(ω,θ)X(ω)+h H(ω)V(ω);
其中,Z(ω)为输出信号,h(ω)为权向量,d(ω,θ)为导向向量,X(ω)为期望信号,V(ω)为整个麦克风阵列的噪声。
8.根据权利要求1所述的一种双层圆环麦克风阵列语音增强方法,其特征在于:所述步骤G将输出信号进行变换后得到增强后的语音信号中,对输出信号进行逆傅里叶变换后采用重叠相加法得到增强后的语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810346345.0A CN108447499B (zh) | 2018-04-18 | 2018-04-18 | 一种双层圆环麦克风阵列语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810346345.0A CN108447499B (zh) | 2018-04-18 | 2018-04-18 | 一种双层圆环麦克风阵列语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108447499A true CN108447499A (zh) | 2018-08-24 |
CN108447499B CN108447499B (zh) | 2020-08-04 |
Family
ID=63200180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810346345.0A Active CN108447499B (zh) | 2018-04-18 | 2018-04-18 | 一种双层圆环麦克风阵列语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108447499B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109714689A (zh) * | 2018-12-21 | 2019-05-03 | 南京理工大学 | 一种基于差分麦克风线阵的方向性声学指数获取方法 |
CN110211600A (zh) * | 2019-05-17 | 2019-09-06 | 北京华控创为南京信息技术有限公司 | 用于定向监听通信的智能麦克风阵列模块 |
CN110211601A (zh) * | 2019-05-21 | 2019-09-06 | 出门问问信息科技有限公司 | 一种空域滤波器参数矩阵的获取方法、装置及系统 |
CN111755021A (zh) * | 2019-04-01 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 基于二元麦克风阵列的语音增强方法和装置 |
CN113371365A (zh) * | 2021-05-18 | 2021-09-10 | 中国地质大学(武汉) | 一种智能垃圾箱及其控制方法 |
CN115515038A (zh) * | 2022-08-18 | 2022-12-23 | 钉钉(中国)信息技术有限公司 | 波束形成方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1866356A (zh) * | 2005-08-15 | 2006-11-22 | 华为技术有限公司 | 一种宽带波束形成方法和装置 |
CN104768100A (zh) * | 2014-01-02 | 2015-07-08 | 中国科学院声学研究所 | 用于环形阵的时域宽带谐波域波束形成器及波束形成方法 |
CN105355210A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 用于远场语音识别的预处理方法和装置 |
CN206282609U (zh) * | 2016-12-05 | 2017-06-27 | 上海木爷机器人技术有限公司 | 音频信号处理系统 |
CN107018470A (zh) * | 2016-01-28 | 2017-08-04 | 讯飞智元信息科技有限公司 | 一种基于环形麦克风阵列的语音记录方法及系统 |
-
2018
- 2018-04-18 CN CN201810346345.0A patent/CN108447499B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1866356A (zh) * | 2005-08-15 | 2006-11-22 | 华为技术有限公司 | 一种宽带波束形成方法和装置 |
CN104768100A (zh) * | 2014-01-02 | 2015-07-08 | 中国科学院声学研究所 | 用于环形阵的时域宽带谐波域波束形成器及波束形成方法 |
CN105355210A (zh) * | 2015-10-30 | 2016-02-24 | 百度在线网络技术(北京)有限公司 | 用于远场语音识别的预处理方法和装置 |
CN107018470A (zh) * | 2016-01-28 | 2017-08-04 | 讯飞智元信息科技有限公司 | 一种基于环形麦克风阵列的语音记录方法及系统 |
CN206282609U (zh) * | 2016-12-05 | 2017-06-27 | 上海木爷机器人技术有限公司 | 音频信号处理系统 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109714689A (zh) * | 2018-12-21 | 2019-05-03 | 南京理工大学 | 一种基于差分麦克风线阵的方向性声学指数获取方法 |
CN111755021A (zh) * | 2019-04-01 | 2020-10-09 | 北京京东尚科信息技术有限公司 | 基于二元麦克风阵列的语音增强方法和装置 |
CN111755021B (zh) * | 2019-04-01 | 2023-09-01 | 北京京东尚科信息技术有限公司 | 基于二元麦克风阵列的语音增强方法和装置 |
CN110211600A (zh) * | 2019-05-17 | 2019-09-06 | 北京华控创为南京信息技术有限公司 | 用于定向监听通信的智能麦克风阵列模块 |
CN110211600B (zh) * | 2019-05-17 | 2021-08-03 | 北京华控创为南京信息技术有限公司 | 用于定向监听通信的智能麦克风阵列模块 |
CN110211601A (zh) * | 2019-05-21 | 2019-09-06 | 出门问问信息科技有限公司 | 一种空域滤波器参数矩阵的获取方法、装置及系统 |
CN113371365A (zh) * | 2021-05-18 | 2021-09-10 | 中国地质大学(武汉) | 一种智能垃圾箱及其控制方法 |
CN113371365B (zh) * | 2021-05-18 | 2022-11-04 | 中国地质大学(武汉) | 一种智能垃圾箱及其控制方法 |
CN115515038A (zh) * | 2022-08-18 | 2022-12-23 | 钉钉(中国)信息技术有限公司 | 波束形成方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108447499B (zh) | 2020-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108447499A (zh) | 一种双层圆环麦克风阵列语音增强方法 | |
CN106448722B (zh) | 录音方法、装置和系统 | |
CN107976651B (zh) | 一种基于麦克风阵列的声源定位方法及装置 | |
CN104936091B (zh) | 基于圆形麦克风阵列的智能交互方法及系统 | |
CN103308889B (zh) | 复杂环境下被动声源二维doa估计方法 | |
CN106782590A (zh) | 基于混响环境下麦克风阵列波束形成方法 | |
CN100466061C (zh) | 一种宽带波束形成方法和装置 | |
CN101447190A (zh) | 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法 | |
CN112904279B (zh) | 基于卷积神经网络和子带srp-phat空间谱的声源定位方法 | |
JP6329296B2 (ja) | 収音装置 | |
CN107167770B (zh) | 一种混响条件下的麦克风阵列声源定位装置 | |
CN111044973A (zh) | 一种用于麦克风方阵的mvdr目标声源定向拾音方法 | |
CN111798869B (zh) | 一种基于双麦克风阵列的声源定位方法 | |
US20220060818A1 (en) | Microphone arrays | |
Tager | Near field superdirectivity (NFSD) | |
CN104768099B (zh) | 用于圆环形阵的模态波束形成器及频域宽带实现方法 | |
Niwa et al. | Optimal microphone array observation for clear recording of distant sound sources | |
CN109493844A (zh) | 基于fir滤波器的恒定束宽波束形成方法 | |
TW201323838A (zh) | 迴響環境之聲源能量分佈可視化的方法 | |
Mizumachi | Neural network-based broadband beamformer with less distortion | |
CN115866483A (zh) | 一种音频信号的波束形成方法及设备 | |
CN107393553A (zh) | 用于语音活动检测的听觉特征提取方法 | |
Shen et al. | A modified cross power-spectrum phase method based on microphone array for acoustic source localization | |
KR20130120651A (ko) | 영역 개념을 이용한 음파 입사 방향 추정 방법 | |
Chen et al. | Performance evaluation of adaptive dual microphone systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |