CN106024001A - 一种提高麦克风阵列语音增强性能的方法 - Google Patents
一种提高麦克风阵列语音增强性能的方法 Download PDFInfo
- Publication number
- CN106024001A CN106024001A CN201610283434.6A CN201610283434A CN106024001A CN 106024001 A CN106024001 A CN 106024001A CN 201610283434 A CN201610283434 A CN 201610283434A CN 106024001 A CN106024001 A CN 106024001A
- Authority
- CN
- China
- Prior art keywords
- signal
- wave filter
- filter
- noise
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 claims description 8
- 230000009977 dual effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 7
- 238000001914 filtration Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 14
- 230000008859 change Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 8
- 230000035939 shock Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- 239000004568 cement Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
本发明提出了一种提高麦克风阵列语音增强算法性能的方法。本发明的方案为:通过语音检测器检测主通道当前是语音时期HSP还是无语音时期NSP;在NSP时,第一滤波器基于输入信号,通过自适应调整第一滤波器的系数,使得第一滤波器的输出信号的能量最小;在HSP时,将第一滤波器的系数锁定,不作调整,直接基于NSP时设置的滤波器系数对输入信号进行滤波处理;将第一滤波器的当前输出信号作为第二滤波器的输入,对主通道信号进行自适应性滤波处理,通过调整自适应第二滤波器的系数,使得第二滤波器的输出信号的能量最小,得到抗串扰且噪声消除的语音输出。本发明的实施,可以在一定程度上提高语音增强效果。
Description
技术领域
本发明属于语音处理技术,具体涉及一种提高麦克风阵列语音增强性能的方法。
背景技术
声学环境很复杂,麦克风在拾取语音信号的同时,也会接收到各种噪声:建筑物的混响,干扰声源,电噪声等。传统的语音拾取工具难以提供好的抗噪声的能力,人们提出了麦克风列语音增强的技术。利用麦克风阵列的空间选择性,聚焦到一个或者多个感兴趣的声源上去。麦克风阵列具有灵敏的波束指向性,优秀的空间滤波性。
在众多的语音增强的算法中,自适应噪声消除(adaptive noise cancellation,ANC)是重要组成部分。它的计算复杂度不高,可以用来处理各种噪声,在实际的实时环境中应用比较多,它需要的麦克风数量不也多。
由于语音信号传播路径的复杂性,在两个通道的ANC系统中,参考通道和与主通道之间的噪声不是完全相关的。所以两个通道的ANC系统中语音增强的效果会受到限制。为了获得更好的性能,我们需要采用更多的麦克风。
在传统ANC算法中,参考通道理想的状态是只包含噪声信号。否则在主通道中的语音信号在噪声消除的时候会被部分抵消掉。参考通道里面的语音信号越多,噪声消除的时候,损失的语音信号也越多,增强的结果也就越差。然而在实际的环境中,让参考通道只包含噪声信号这是不可能的。尤其是在小麦克风阵列中。
发明内容
本发明的发明目的在于:针对上述存在的问题,提供一种能消除串扰的麦克风阵列语音增强性能的方法。
本发明一种提高麦克风阵列语音增强性能的方法,包括下列步骤:
通过语音检测器检测主通道当前是语音时期HSP还是无语音时期NSP;
在NSP时,将噪声信号作为第一滤波器的输入,通过自适应调整第一滤波器的系数,使得第一滤波器的输出信号的能量最小;其中,对于主通道和一个参考通道的双通道模式,噪声信号对应主通道信号和参考通道信号(即比较参考通道中的噪声信号和主通道中的噪声信号之间的关系,也是就所谓的传输函数。自适应调整第一滤波器的系数的过程就是获取这种关系的过程。以便在HSP时,可以利用所获得的传输函数和参考通道中的噪声信号来消除主通道中的噪声信号);对于多通道模式,噪声信号对应所有参考通道信号;在HSP时,将第一滤波器的系数锁定,不作调整,直接基于NSP时设置的第一滤波器的系数对输入信号进行滤波处理;
将第一滤波器的当前输出信号作为第二滤波器的输入,对主通道信号进行自适应性滤波处理,通过自适应第二滤波器的系数,使得第二滤波器的输出信号的能量最小,得到抗串扰且噪声消除的语音输出。
即本发明在HSP和NSP均通过第二滤波器对主通道信号进行自适应性滤波处理,仅在NSP自适应调整第一滤波器的系数。
综上所述,由于采用了上述技术方案,本发明的有益效果是:在去除噪声的同时抗串扰,且计算复杂度低,对不同噪声的去噪处理的适用性强。
附图说明
图1是双通道自适应噪声消除示意图;
图2是双通道串扰模型;
图3是双通道抗串扰自信应噪声消除示意图;
图4是多通道串扰模型;
图5是多通道抗串扰自适应噪声消除算法示意图;
图6中,(a)为语音信号波形图,(b)为噪声信号波形图,(c)为主通道信号波形图,(d)为参考通道信号波形图;
图7中,(a)为纯净的语音信号波形图,(b)为带噪声的语音信号波形图,(c)为双通道自适应噪声消除后的语音信号波形图,(d)为抗串扰的双通道自适应噪声消除后的语音信号波形图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本发明作进一步地详细描述。
如图1所示,假设噪声信号是n(t)。它从噪声源传到麦克风阵M0和M1,然后噪声信号被分别拾取为n0(t)和n1(t)。假设语音信号是s(t)。被麦克风M0拾取为s0(t)。进一步假设语音信号s(t)没有进入参考信道M1。所以最终被麦克风拾取的信号的形式是这样的:
x0(t)=s0(t)+n0(t) (1)
x1(t)=n1(t) (2)
所述x0(t)、x1(t)分别对应麦克风M0、M1拾取的信道信号,其中:
ni(t)=hni(t)*n(t) i=0,1 (3)
s0(t)=hs0(t)*s(t) (4)
上式中,*是卷积符号(下同),hn0(t)和hn1(t)分别是噪声源到麦克风M0和M1之间冲击响应,即主通道冲击响应,参考通道冲击响应。
在离散时域中t=kT,其中k是时域中的序号,T是采样的周期。简单来说就是用k来代替t。连续信号是x(t),离散信号是x(k)。
在噪声环境中只能获取到信号x0(k)和x1(k),在基于所获取的两个信号恢复语音信号s0(k)时,如果噪声信号和语音信号是不相关的,则可以通过ANC算法实现,参见图1,其ANC系统的输出信号e(k)=x0(k)-y(k)=s0(k)+n0(k)-y(k),对其两边同时平方可得:
s0(k)和n0(k),y(k)是不相关的,求期望的:以调整自适应滤波器A的系数,使得输出能量E[e2(k)]最小。即:
从公式(5)可以看出最小化E[e2(k)]和最小化E[n0(k)-y(k)]2是等价的。所以滤波器A在均方误差最小准则(MMSE)下的输出y(k)是对主通道中噪声信号的估计。整个系统的输出信号e(k)是对信号s0(k)在最小均方差准则下的估计。
从公式(5)可以知道,要取得最小值E[e2(k)]=E[s0 2(k)],当且仅当E[n0(k)-y(k)]2=0。也就是说y(k)=n0(k),e(k)=s0(k),即当前系统的输出为无噪声的信号。
在ANC系统中,滤波器A可以有很多种形式。然而通常来说使用的是自适应的FIR滤波器,其形式为其中W是滤波器的系数向量,N1(k)=[n1(k+L1),...,n1(k+1),n1(k),...n1(k-L2)]T,其中L1表示主通道延时,L2表示参考通道延时。
对于自适应滤波器A的系数的调整,可以采用常用的技术,比如最小均方差法(LMS),递归最小二乘法(RLS)等。在这些方法中LMS算法是最简单,被广泛使用的方法。也有很多改进的LMS算法。本具体实施方式中采用LMS算法。
在传统的噪声消除处理中,通常假定参考通道中没有语音信号。否则主通道中的信号会被部分或者完全地消除掉。然而在实际的环境中,语音信号会不可避免的传入到参考通道中去,导致参考通道中含有语音信号,尤其是在阵列孔径比较小的时候。对于参考通道和主通道中均含有语音信号和噪声信号的情况,将其称之为串扰。
本发明针对麦克风阵列的串扰技术问题,公开了一种抗串扰的自适应噪声消除方法,其适用于双通道乃至多通道的串扰情况。
针对如图2所示的双通道的串扰,本发明包括两个滤波器(滤波器A和B)和一个语言探测器,其实现结构示意图如图3所示。首先,假设信号s(k)传播到麦克风M0和M1的传输函数是Hs0(z)和Hs1(z),转换后得到的信号分别是s0(k)和s1(k)。其中噪声信号n(k)传播到麦克风M0和M1的传输函数是Hn0(z)和Hn1(z),转换到麦克风M0和M1上的信号就是n0(k)和n1(k)。然后两个麦克风实际的信号获取情况是:
x0(k)=s0(k)+n0(k)
x1(k)=s1(k)+n1(k)
其中x0(k)和x1(k)包含了语音信号和噪声信号。
对于图2所示的模型有:
s0(z)=Hs0(z)s(z)
s1(z)=Hs1(z)s(z)
n0(z)=Hn0(z)n(z)
n1(z)=Hn1(z)n(z)
其中,s(z)对应信号s(k)的z变换,s0(z)表示s0(k)的z变换,定义s0(k)到s1(k)的传输函数是Hs0s1(z),n1(k)到n0(k)的传输函数是Hn1n0(z)。即:
s1(z)=Hs0s1(z)s0(z)
n0(z)=Hn1n0(z)n1(z)
将上式转换为:
本发明通过噪声消除来实现语音增强,而噪声消除的处理为:
首先,因语音信号是间歇性的,因此将信号分为有语音时期(Having SpeechPeriod,HSP)和无语音时期(Non Speech Period,NSP);
在NSP时,麦克风M0和M1拾取的是纯净的噪声信号:n0(k)和n1(k)。将主通道信号n0(k),参考通道的信号n1(k)作为滤波器A的输入。其目的是为了估计通道间噪声信号的传输函数Hn1n0(z)。通过自适应的调整滤波器A的系数,使得e1(k)的输出能量最小,从而估算得到Hn1n0(z)。
在HSP时,因当前噪声环境和NSP相比的变化很少,可以假设噪声环境无变化,即噪声源的位置和麦克风阵列的位置无变化或者变化可以忽略不计,即:
Y1(z)=Hn1n0(z)X1(z)=Hn1n0(z)[S1(z)+N1(z)];
E1(z)=X0(z)-Y1(z)
=S0(z)+N0(z)-Hn1n0(z)S1(z)-Hn1n0(z)N1(z)
=S0(z)-Hn1n0(z)S1(z)
=[1-Hn1n0(z)Hs0s1]S0(z)
其中,Y1(z)表示y1(k)的z变换,y1(k)表示滤波器A的输出信号,X1(z)表示x1(k)的z变换。
滤波器B的系统函数是[1-Hn1n0(z)Hs0s1]-1,则基于上式可得:
Y2(z)=[1-Hn1n0(z)Hs0s1(z)]-1E1(z)=S0(z)
E2(z)=X0(z)-Y2(z)
=[S0(z)+N0(z)]-S0(z)=N0(z)
有上式可知,混合在信号x0(k)中的语音信号s0(k)和噪声信号n0(k)被分离了。所以滤波器B的输出就是目标信号s0(k)。接下来,为了得到滤波器B的系统函数[1-Hn1n0(z)Hs0s1]-1,则通过自适应调整B的系数使得输出功率E[e2 2(k)]最小即可。这是因为:
||e2(k)||2=||x0(k)-y2(k)||2
=||s0(k)+n0(k)-y2(k)||2
=||n0(k)||2+||s0(k)-y2(k)||2+2n0(k)[s0(k)-y2(k)]
上式中,y2(k)表示滤波器B的输出信号,对等式左右两边同时取期望。考虑到n0(k)和s0(k)是不相关的,因此所以e2(k)功率的最小值,意味着最小的E{[s0(k)-y2(k)]2}。考虑到滤波器B的输入信号e1(k)和s0(k)是相关。作为滤波器B的输出信号y2(k)就是在最小均方误差准则下对信号s0(k)的估计。
相邻的HSP和NSP时期,残留在增强后信号中的噪声水平是不一样的。因为在每一个时刻噪声环境都在有变化。所以残留噪声的水平会随着时间波动。为了克服这一点。可以在所有时期都动态的调整滤波器B的滤波系数来克服上述波动。
总而言之,如图3所示,NSP时期,在使得e1(k)输出能量最小的准则下,动态的调整A的滤波系数;对于滤波器B,在使得e2(k)的输出能量最小的准则下动态调整B的滤波系数。然后B的输出y2(k)就是我们增强后的信号。这是对于双通道的抗串扰算法。
滤波器A和滤波器B的系统函数分别为Hn1n0(z)和[1-Hn1n0(z)Hs0s1]-1。Hn1n0(z)是滤波器A在NSP得到。[1-Hn1n0(z)Hs0s1]-1是滤波器B在HSP的时候得到的。如果在下一个阶段,NSP中的噪声环境没有发生变化吗,则滤波器A的系统函数也不会变化;如果在下一个HSP中的语音信号的环境没有发生变化(麦克风和声源位置不变,介质也没有发生变化或者其发变化可以忽略不计),滤波器B的系统函数也不会变化。否则两个滤波器的系数需要自适应调整。本发明中,通过语音探测器来判断是否触发对滤波器A的系数的更新,即当语言探测器的检测结果为无语音信号时,对滤波器A的系数进行更新;否则滤波器A的系数被锁定。
本发明的语音增强方式不仅可以用于双声道的抗串扰噪声消除,还可以用于多声道的抗串扰的噪声消除,其具体处理为:
在多通道麦克风阵列中,假设输入信号是s(k),噪声信号是n(k),且两者不相干。信号s(k)、n(k)到达麦克风Mi通过了多种路径转换成了si(k)和ni(k)。传输媒介对语音信号和噪声信号的冲击响应是hsi(k)和hni(k)。麦克风Mi获取的信号可以表示为:
xi(k)=si(k)+ni(k) i=0,1,...,N
N+1是麦克风阵列中的麦克风数目;k表示的是离散时刻的序号。既有噪声又有语音信号,这个时候就会发生串扰。
从图4可知:
si(k)=hsi(k)*s(k) i=0,1,...,N
ni(k)=hni(k)*n(k) i=0,1,...,N
定义两个麦克风语音信号si(k)和sj(k)之间的冲击响应为hsisj(k)。同样的定义噪声ni(k)和nj(k)之间的冲击响应是hninj(k)。
sj(k)=hsisj(k)*si(k) j,i=0,1,...,N
nj(k)=hninj(k)*ni(k) j,i=0,1,...,N
根据这两个式子可以得出:
其中,Hsj(z)、Hsi(z)、Hnj(z)、Hni(z)分别为冲击响应hsi(k)、hsj(k)、hni(k)、hnj(k)的z变换,Hsisj(z)表示si(k)和sj(k)之间的传输函数,Hninj(z)表示ni(k)和nj(k)之间的传输函数,即冲击响应hsisj(k)、hninj(k)的z变换。
假设x0(k)就是麦克风阵列中的主通道M0所捕获的信号,xi(k)(i=1,..,N)是其他N个参考通道中捕获的信号。在通常情况下(阵列元间隔比较近),主通道和参考通道的信号是相关的。参考通道里既包含了语音信号又包含了噪声信号,通常的多声道噪声消除方法不能得到比较好的噪声消除效果。这是因为串扰的存在,主通道中的语音信号会被部分的消除掉。
多通道抗串扰噪声消除处理实现示意图参见图5,其包括一个语音检测器和两个自适应的滤波器A、B。
在NSP时,麦克风M0,M1..,MN获取的只是噪声信号n0(k),n1(k),...,nN(k)。n0(k)为主通道中的噪声,n1(k),...,nN(k)是参考通道获取的噪声。
首先,将所有的参考声道的噪声(n1(k),...,nN(k))输入到滤波器A;
然后采用FIR滤波器的形式来设计自适应滤波器A:
n0(k)=WiNi(k)+ei1(k)
Wi=(wi0,wi1,...,wiL)
Ni(k)=[ni(k),ni(k-1),...,ni(k-L)]T
其中Wi是滤波器A的系数,L+1是滤波器A的长度。ei1(k)是用ni(k)来预测n0(k)的误差。ei1(k)与最终的能量大小和最终的增强效果有着密切的联系。参考通道中的噪声信号和主通道中的噪声信号相关度并不是很高。基于实际的噪声环境,麦克风隔得越远,噪声的相关性就会越小。所以误差功率p[ei1(k)]就越大。
如果多个参考通道n1(k),...,nN(k)都输入到滤波器A来消除n0(k)中的噪声,则:
n0(k)=WN(k)+e1(k)
W=(W1,W2,...,WN)
Wi=(wi0,wi1,...,wiL)
其中W是滤波器A的系数,它是一个N(L+1)行向量。
N(k)=[N1(k),N2(k),...,NN(k)]T
Ni(k)=[ni(k),ni(k-1),...,ni(k-L)]
所述N(k)是一个N(L+1)的列向量,e1(k)是预期的误差。假设W=(0,...,0,Wi,0,...,0)。则有:
e1(k)=n0(k)-WN(k)
=n0(k)-WiNi(k)
=ei1(k)
所以在理想情况下取到W和Wi,它们对应的最小误差的功率最好满足下面这个不等式。
p[ei(k)]<p[ei1(k)]
通常情况下p[ei(k)]会远远小于p[ei1(k)],尤其是当有多个噪声源,并且噪声的传播路径不止一个的时候。这就意味着通过利用N个参考通道中的噪声信号,可以使残留在主通道中的噪声变得小,即可以通过增加麦克风的数目来增加主通道噪声和参考通道中噪声的相关性。但是如果N越大的话意味着需要采用更多的麦克风,L越大在实际的应用中则更加困难。因此麦克风的数目和滤波选取的采样点数可以通过调试进行设置:
将输出最小误差e1(k)的滤波器A的系数写成下面这个形式:
对应的最小误差功率是为了取到对应的到W*,通过调整滤波器A的系数使得误差功率最小即可。
在HSP时。设置噪声的冲击响应为hnin0(k)(假设当前噪声环境不变或变化缓慢),因此有:
其中,S(k)为:
S(k)=[S1(k),S2(k),...,SN(k)]T
Si(k)=[si(k),s(k-1),...,si(k-L)]
因此可得:
其中:
p(k)=s0(k)-W*S(k)
对上面的式子做z变换。
其中:
由上式可知,p(k)会使得语音信号发生失真的,并且它和S0(k)是相关的。此外p(k)的功率其实往往不会像的功率那样小。这就意味着带噪声的语音信号不会像噪声信号那样被严重削减。这是因为噪声信号和语音信号有着不同的传播方式。噪声源,目标声源,麦克风的位置通常是影响这个的因素。e1(k)的信噪比通常比带噪信号x0(k)有很大的提升。其中语音信号是p(k)而噪声信号的是然而,信号e1(k)中的p(k)不是s0(k)信号的近似,而是失真后的s0(k)。当麦克风的数量增加的时候这种失真会变得更加的大。因此,本发明的滤波器B的作用就是从失真的p(k)中获取语音信号s0(k)。通过调整滤波器B的系数即可实现滤波器B的该作用。从而使得e2(k)的输出功率最小。
与双声道相同的处理方式,为了防止波动增强后语音信号中的噪声残留水平的波动。最好的办法就是滤波器B一直工作,一直保证e2(k)最小,而滤波器A只有在没有语音信号的时候才调整系数。然后滤波器B的输出y2(k)就是在最小均方误差准则下系统S0(k)的估计。
因此:
实施例
提取一段语言信号和音乐,将音乐作为噪声信号。语音信号和噪声信号的采样率都是16kHz。为了仿真,将语音信号到主通道和参考通道的传输函数分别设置为:、
Hs0(z)=[0.0408,0.0817,0.1633,0.1225,0.0408,0.2048,0.2450.0.0817]z
Hs1(z)=[0.1293,0.1293,0.0970,0.2587,0.0647,0.0323,0.0970,0.1617]z
噪声信号到主通道和参考通道的传输函数分别设置为:
Hn0(z)=[0.1187,0.2960,0.1781,0.0594,0.0000,0.0000,0.2375,0.0594]z
Hn1(z)=[0.1309,0.2182,0.2618,0.000,0.0873,0.0000,0.0436,0.2182]z
其中,z=[1,z-1,z-2,z-3,z-4,z-5,z-6,z-7]T。
根据s0(k)=hs0(k)*s(k)可得到主通道中语音信号s0(k),根据n0(k)=hn0(k)*n(k)可得到主通道中噪声信号n0(k);同理可得参考通道中语音信号s1(k)、噪声信号n1(k)。
s0(k)、n0(k)的波形图分别如图6(a)、(b)、所示,而主通道和参考通道中的信号x0(k)=s0(k)+n0(k),x1(k)=s1(k)+n1(k)分别如图6(c)、(d)所示。
基于本发明的抗串扰方式,实现对语言信号的增强性处理,其输出结果如图7所示,其中图7(a)、(b)分别是本实施例纯净的语音信号s0(k)和带噪声的语音信号x0(k),图7(c)是传统的双通道自适应噪声消除后的语音信号,图7(d)是抗串扰的双通道自适应噪声消除后的语音信号。从图7可知,本发明的处理效果良更优。
Claims (1)
1.一种提高麦克风阵列语音增强性能的方法,其特征在于,包括下列步骤:
通过语音检测器检测主通道当前是语音时期HSP还是无语音时期NSP;
在NSP时,第一滤波器基于输入信号,通过自适应调整第一滤波器的系数,使得第一滤波器的输出信号的能量最小;其中,对于主通道和一个参考通道的双通道模式,第一滤波器的输入信号为主通道信号和参考通道信号;对于主通道和一个以上参考通道的多通道模式,第一滤波器的输入信号为所有参考通道信号;在HSP时,将第一滤波器的系数锁定,不作调整,直接基于NSP时设置的第一滤波器的系数对输入信号进行滤波处理;
将第一滤波器的当前输出信号作为第二滤波器的输入,对主通道信号进行自适应性滤波处理,通过调整自适应第二滤波器的系数,使得第二滤波器的输出信号的能量最小,得到抗串扰且噪声消除的语音输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610283434.6A CN106024001A (zh) | 2016-05-03 | 2016-05-03 | 一种提高麦克风阵列语音增强性能的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610283434.6A CN106024001A (zh) | 2016-05-03 | 2016-05-03 | 一种提高麦克风阵列语音增强性能的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106024001A true CN106024001A (zh) | 2016-10-12 |
Family
ID=57082130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610283434.6A Pending CN106024001A (zh) | 2016-05-03 | 2016-05-03 | 一种提高麦克风阵列语音增强性能的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106024001A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106973353A (zh) * | 2017-03-27 | 2017-07-21 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于Volterra滤波器的麦克风阵列通道不匹配校准方法 |
CN109243482A (zh) * | 2018-10-30 | 2019-01-18 | 深圳市昂思科技有限公司 | 改进acranc与波束形成的微型阵列语音降噪方法 |
CN111653272A (zh) * | 2020-06-01 | 2020-09-11 | 重庆科技学院 | 一种基于深度信念网络的车载语音增强算法 |
CN113823311A (zh) * | 2021-08-19 | 2021-12-21 | 安徽创变信息科技有限公司 | 基于音频增强的语音识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6700976B2 (en) * | 2000-05-05 | 2004-03-02 | Nanyang Technological University | Noise canceler system with adaptive cross-talk filters |
KR20080038714A (ko) * | 2006-10-31 | 2008-05-07 | 한국전력공사 | 크로스토크를 제거하기 위한 후처리 방법 |
CN101263734A (zh) * | 2005-09-02 | 2008-09-10 | 丰田自动车株式会社 | 麦克风阵列用后置滤波器 |
CN102859590A (zh) * | 2010-02-24 | 2013-01-02 | 弗劳恩霍夫应用研究促进协会 | 产生增强下混频信号的装置、产生增强下混频信号的方法以及计算机程序 |
-
2016
- 2016-05-03 CN CN201610283434.6A patent/CN106024001A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6700976B2 (en) * | 2000-05-05 | 2004-03-02 | Nanyang Technological University | Noise canceler system with adaptive cross-talk filters |
CN101263734A (zh) * | 2005-09-02 | 2008-09-10 | 丰田自动车株式会社 | 麦克风阵列用后置滤波器 |
KR20080038714A (ko) * | 2006-10-31 | 2008-05-07 | 한국전력공사 | 크로스토크를 제거하기 위한 후처리 방법 |
CN102859590A (zh) * | 2010-02-24 | 2013-01-02 | 弗劳恩霍夫应用研究促进协会 | 产生增强下混频信号的装置、产生增强下混频信号的方法以及计算机程序 |
Non-Patent Citations (2)
Title |
---|
孙科伟等: "基于锥形麦克风阵列的语音增强技术研究", 《压电与声光》 * |
曾庆宁等: "基于阵列抗串扰自适应噪声抵消的语音增强", 《电子学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106973353A (zh) * | 2017-03-27 | 2017-07-21 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于Volterra滤波器的麦克风阵列通道不匹配校准方法 |
CN109243482A (zh) * | 2018-10-30 | 2019-01-18 | 深圳市昂思科技有限公司 | 改进acranc与波束形成的微型阵列语音降噪方法 |
CN109243482B (zh) * | 2018-10-30 | 2022-03-18 | 深圳市昂思科技有限公司 | 改进acranc与波束形成的微型阵列语音降噪方法 |
CN111653272A (zh) * | 2020-06-01 | 2020-09-11 | 重庆科技学院 | 一种基于深度信念网络的车载语音增强算法 |
CN113823311A (zh) * | 2021-08-19 | 2021-12-21 | 安徽创变信息科技有限公司 | 基于音频增强的语音识别方法及装置 |
CN113823311B (zh) * | 2021-08-19 | 2023-11-21 | 广州市盛为电子有限公司 | 基于音频增强的语音识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727604B (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
CN103632675B (zh) | 个人通信中降噪和回波消除时的噪声估计 | |
US8374358B2 (en) | Method for determining a noise reference signal for noise compensation and/or noise reduction | |
CN101510426B (zh) | 一种噪声消除方法及系统 | |
EP2237271B1 (en) | Method for determining a signal component for reducing noise in an input signal | |
CN111161751A (zh) | 复杂场景下的分布式麦克风拾音系统及方法 | |
CN106710601A (zh) | 一种语音信号降噪拾音处理方法和装置及冰箱 | |
CN108122563A (zh) | 提高语音唤醒率及修正doa的方法 | |
EP1848243A1 (en) | Multi-channel echo compensation system and method | |
CN106024001A (zh) | 一种提高麦克风阵列语音增强性能的方法 | |
CN107316648A (zh) | 一种基于有色噪声的语音增强方法 | |
CN107393550A (zh) | 语音处理方法及装置 | |
JP2007010897A (ja) | 音響信号処理方法、装置及びプログラム | |
CN102164328A (zh) | 一种用于家庭环境的基于传声器阵列的音频输入系统 | |
Mosayyebpour et al. | Single-microphone LP residual skewness-based inverse filtering of the room impulse response | |
CN109979476A (zh) | 一种语音去混响的方法及装置 | |
KR20210153677A (ko) | 심층 필터를 결정하기 위한 방법 및 장치 | |
CN106161820B (zh) | 一种用于立体声声学回声抵消的通道间去相关方法 | |
CN107360497A (zh) | 估算混响分量的计算方法及装置 | |
Haque et al. | Robust speech dereverberation based on blind adaptive estimation of acoustic channels | |
Seltzer | Bridging the gap: Towards a unified framework for hands-free speech recognition using microphone arrays | |
Cao et al. | Multichannel speech separation by eigendecomposition and its application to co-talker interference removal | |
CN115424627A (zh) | 基于卷积循环网络和wpe算法的语音增强混合处理方法 | |
Triki et al. | Delay and predict equalization for blind speech dereverberation | |
CN105957536A (zh) | 基于通道聚合度频域回声消除方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161012 |