WO2014089914A1

WO2014089914A1 - 一种基于双麦克的语音混响消减方法和装置

Info

Publication number: WO2014089914A1
Application number: PCT/CN2013/001557
Authority: WO
Inventors: 楼厦厦; 李波; 黄秋晨
Original assignee: 歌尔声学股份有限公司
Priority date: 2012-12-12
Filing date: 2013-12-12
Publication date: 2014-06-19
Also published as: DK2858379T3; EP2858379A4; KR101502297B1; CN103067821B; EP2858379B1; EP2858379A1; JP5785674B2; US20150189431A1; CN103067821A; KR20150008925A; JP2015523609A; US9414157B2

Abstract

本发明公开了一种基于双麦克的语音混响消减方法和装置。该方法中，根据主麦克的输入信号ϰ₂（t）和辅麦克的输入信号ϰ₁（t）计算辅麦克到主麦克的传递函数h（t），取h（t）的拖尾部分h _r（t），根据h（t）判断混响的强弱，计算出增益函数的调节因子β；ϰ₁（t）与h _r（t）作卷积，得到ϰ₂（t）的后期混响估计信号r̂（t），并根据ϰ₂（t）的频谱、β以及r̂（t）的频谱计算增益函数，用ϰ₂（t）的频谱乘以增益函数得到ϰ₂（t）去混响后的频谱，频时转换得到ϰ₂（t）去后期混响后的时域信号。这样能从主麦克输入信号中消除后期混响，而保留早期混响，不会使处理后的声音变得单薄，提高了语音的质量。同时根据混响强弱调节谱减力度，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音。并且不需要准确估计直达声波达方向，因而不要求麦克风具有很高一致性。

Description

一种基于双麦克的语音混响消减方法和装置技术领域本发明涉及语音增强技术领域，特别涉及一种基于双麦克的语音混响消减方法和装置。发明背景声音信号在室内的传播过程中，由于墙壁、地面等硬质界面对声音的反射，到达传声器的声音除了直接从声源传来的直达声外，还有经过一次或多次反射传来的声音信号，这些非直达声构成了混响信号。经过一次或少量的几次反射的声音信号称为早期反射信号，早期反射信号构成了早期混响信号，早期混响信号能够对语音起到增强作用。经过多次反射的声音信号称为后期反射信号，后期反射信号构成了后期混响信号，后期混响较强则会降低语音的清晰度。

在一些免提语音通讯中，通话者距离麦克风较远，语音清晰度会因房间混响而下降，导致通话质量下降。因此需要一些技术消减混响，提升语音清晰度。麦克风接收信号包括直达声信号和混响信号，而由前述可知混响又可以分为早期混响和后期混响。其中降低语音清晰度的主要是后期混响，而早期混响一般对语音有增强作用。因此提升清晰度的关键是降低后期混响信号。

在各种混响消减技术中，基于双麦克的谱减去混响方法受到较多关注。现有的一种基于双麦克风谱减的去混响方法中，釆用自适应波束形成（GSC ) 的结构得到两路信号，第一路信号是延时 -求和波束形成器的输出；第二路信号是阻塞矩阵的输出。两路信号的能量包络通过一个自适应滤波器估计出第一路信号的混响，再利用谱减法去除混响。这种方法有几个缺点：

1 )会去除早期混响，使处理后的声音变得单薄。

2 )对混响强弱没有判断，在不同混响情况下都沿用一样的谱减处理，这样在混响弱、语音清晰度原本比较高时可能损伤语音质量。

3 )需要准确估计直达声波达方向，分离直达声，因而要求麦克风具有很高一致性，对声学设计也有严格的限制。发明内容鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于双麦克的语音混响消减方法和装置。

依据本发明的一个方面，提供了一种基于双麦克的语音混响消减方法，该方法包括：

接收主麦克输入信号和辅麦克输入信号，逐帧做如下处理：

根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数 h(t) ；

获取传递函数 /?(t)的拖尾部分/？），并根据传递函数 /?(t)判断混响的强弱，计算出增益函数的调节因子^ ;

用辅麦克输入信号与作卷积，得到主麦克输入信号的后期混响估计信号；

对主麦克输入信号的后期混响估计信号进行时域到频域的转换得到主麦克输入信号的后期混响谱；对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱；

根据主麦克输入信号的频谱、增益函数的调节因子以及主麦克输入信号的后期混响谱计算增益函数；

用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱；

对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号；

将主麦克输入信号去混响后的时域信号逐帧叠接相加后，输出主麦克输入信号去混响后的连续信号。

依据本发明的另一方面，提供了一种基于双麦克的语音混响消减装置，对主麦克和辅麦克接收到的信号逐帧进行处理；该装置包括：混响谱估计单元和谱减单元，其中：

混响谱估计单元，用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数 wo , 获取传递函数的拖尾部分/？），并根据传递函数 wt)判断混响的强弱，计算出增益函数的调节因子输出给语减单元，用辅麦克输入信号与 (t)作卷积，得到主麦克输入信号的后期混响估计信号，对主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响语后输出给语减单元；

谱减单元，用于接收主麦克输入信号和混响谱估计单元输出的增益函数的调节因子以及主麦克输入信号的后期混响谱，对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱，根据主麦克输入信号的频谱、增益函数的调节因子以及主麦克输入信号的后期混响谱计算增益函数，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号，将主麦克输入信号去混响后的时域信号逐帧叠接相加后，输出主麦克输入信号去混响后的连续信号。

由上述可见，本发明通过根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数取传递函数 wt)的拖尾部分/ 并且根据传递函数 wt)判断混响的强弱，计算出增益函数的调节因子；然后根据辅麦克输入信号与 ut)作卷积，得到主麦克输入信号的后期混响估计信号，并根据主麦克输入信号的频谱、增益函数的调节因子以及主麦克输入信号的后期混响谱计算增益函数，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，即通过谱减法从主麦克输入信号的频谱中减去主麦克输入信号的后期混响估计谱，因此能从主麦克的输入信号中有效地消除其后期混响，而保留其早期混响，不会使处理后的声音变得单薄，提高了语音的质量。同时在估计后期混响中根据混响强弱调节谱减力度，在混响弱的时候少做甚至不做谱减，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音，保护语音质量。并且这种方案中不需要准确估计直达声波达方向，因而不要求麦克风具有很高一致性，对声学设计也没有严格的限制。附图简要说明图 1是本发明实施例中给出的激励信号到麦克输入信号的传递函数示意图；图 2是本发明实施例中给出的辅麦克到主麦克的传递函数的示意图；图 3 是本发明一个实施例中的一种基于双麦克的语音混响消减方法的流程示意图；

图 4是本发明又一个实施例中的基于双麦克的语音混响消减方法的整体流程示意图；

图 5a是本发明实施例中的声源到主麦克距离为 0.5m时辅麦克到主麦克的传递函数的示意图；

图 5b是本发明实施例中的声源到主麦克距离为 lm时辅麦克到主麦克的传递函数的示意图；

图 5c是本发明实施例中的声源到主麦克距离为 2m时辅麦克到主麦克的传递函数的示意图；

图 5d是本发明实施例中的声源到主麦克距离为 4m时辅麦克到主麦克的传递函数的示意图；

图 6a是本发明实施例中的主辅麦克之间的间距为 6cm时的频率补偿滤波器的幅频特性示意图；

图 6b是本发明实施例中的主辅麦克之间的间距为 18cm时的频率补偿滤波器的幅频特性示意图；

图 7a是本发明实施例中的主麦克输入信号的时域图；

图 7b是本发明实施例中的主麦克去混响后的时域图；

图 7c是本发明实施例中的主麦克输入信号的语谱图；

图 7d是本发明实施例中的主麦克去混响后的语谱图；

图 8是本发明实施例中的一种基于双麦克的语音混响消减装置的组成结构图；

图 9是本发明的一个较佳实施例中的基于双麦克的语音混响消减装置的详细组成结构及其输入输出示意图。实施本发明的方式首先需要声明的是：为使申请文件简要，在本申请文件中将"麦克风 "简称为"麦克"。

根据对现有技术的分析，为了更好的混响消减需要在去除后期混响的同时保护直达声和早期混响，因而需要准确稳定的后期混响估计和混响强弱判断。

本发明提出了基于双麦克的去混响方案，充分的利用了混响和双麦克空间传递函数之间的近似关系，利用双麦克空间传递函数估计后期混响并判断混响强弱，与谱减模块配合在各种混响环境下都可以在满足清晰度的同时得到接近最优的语音质量。另外本发明中的方案不需要分离直达声也不用做波达方向估计，因而不要求麦克风一致性，放宽了对声学设计的要求。

本发明的基本原理是：通过双麦克之间传递函数的尾部估计后期混响，因此谱减中可以艮好的保留直达声和早期混响。并且在估计后期混响中进一步利用双麦克传递函数的头部和尾部能量差异估计房间混响的程度，调节谱减力度，在混响弱的时候少做甚至不做语减 , 保护语音质量。

为使本发明的技术方案清楚，下面对本发明的技术原理进行分析说明。早期混响信号能够对语音起到增强作用，后期混响则会降低语音的清晰度。图 1 是本发明实施例中给出激励信号到麦克输入信号的传递函数示意图。参见图 1 , 在激励信号到麦克输入信号的传递函数上，峰值最大的地方对应直达声，通常将距离最大峰的某个点作为早期反射和后期反射的分界点，最大峰到分界点的部分对应早期混响，分界点后的部分对应后期混响。在图 1 中，该分界点为 50ms。

将激励信号记为 s(f) , 麦克输入信号记为 x(t) , 激励信号到麦克输入信号的传递函数记为 t/(t) ,对应直达声和早期混响部分的传递函数记为 tf人 t、 ,对应后期混响部分的传递函数记为 (0。那么，麦克输入信号可以表示为激励信号与传递函数的卷积 x(t) = 0*? 0 ,麦克输入信号的直达声和早期混响成分可以表示为 x_d (t) = s(t) * tf_d (t) , 麦克输入信号的后期混响成分可以表示为 x (t) = s(t) * tf_r it)。则麦克输入信号也可以表示为 x(t) = s{t) * tf{t) = s{t) * (tf_d (t) + tf_r (t)) = x_d (t) + x_r (t)。

语音的清晰度可以用 c₅。来表示，其计算公式为：

J w²(t)dt

C₅₀ = lOlog^ dB ( 1 )

J w²(t)dt vv(t)是激励信号到麦克输入信号的传递函数。 0〜50ms对应直达声和早期混响部分， 50ms以后对应后期混响部分。混响越强， C₅。的值越小。去混响前后 C₅。的提升可以反映去混响的效果，因此， C₅。可以作为一个去混响的客观评测指标。

本发明中基于双麦克（主麦克和辅麦克）的混响估计原理如下：主麦克的输入信号记为 x₂ (t) , 辅麦克的输入信号记为 χ ），辅麦克到主麦克的传递函数记为 h(f) , 如图 2所示。图 2是本发明实施例中给出的辅麦克到主麦克的传递函数 /<0的示意图。

主麦克的输入信号 (0等于辅麦克的输入信号 (t)与传递函数/ 的卷积： x₂(t) = x_l(t)*h(t) (2)

）可以分为头尾两部分：

h(t) = h_d(t) + h_r(t) (3) 其中， (t)表示/ /(t)的头部， // ）表示/ /(t)的尾部。

h(t)的拖尾部分/^ (t)反映了信号在空间的多次反射，因此的拖尾部分 h_r(t)和辅麦克输入信号 χ ）的卷积信号）与主麦克的后期混响成分相近，可以作为主麦克后期混响成分的估计信号。在 /<0上选取一点作为 (t)和/ ut)的分界点，将/ 在分界点以前的值置 0, 可以得到/ t)。分界点到 Kt)最大峰的距离范围可以设置为 30ms〜80ms (经验值）。根据经验，若分界点到/ <t)的最大峰大于等于 50ms,则主麦克的后期混响估计信号中完全没有直达声和早期反射成分的残留，可以减少对语音的损伤，因此在本发明的实施例中以分界点取 50ms为例进行说明。

为使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明实施方式作进一步地详细描述。

图 3 是本发明一个实施例中的一种基于双麦克的语音混响消减方法的流程示意图。如图 3 所示，该方法主要包括混响估计部分和谱减部分，具体是逐帧 #支如下处理：

1.1, 接收主麦克输入信号 x₂(t)和辅麦克输入信号 (t) , 根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数/ Kt);

1.2, 获取传递函数 /?(t)的拖尾部分 (t)；

1.3,并且根据传递函数/ <t)判断混响的强弱，计算出增益函数的调节因子；

1.4, 用辅麦克输入信号与作卷积，得到主麦克输入信号的后期混响估计信号 )；

1.5 ,对主麦克输入信号的后期混响估计信号进行时域到频域的转换得到主麦克输入信号的后期混响谱；

2.1, 对主麦克输入信号 (0进行时域到频域的转换得到主麦克输入信号的频谱 r₂;

2.2, 根据主麦克输入信号的频谱 ₂、增益函数的调节因子以及主麦克输入信号的后期混响谱计算增益函数 G；

2.3, 用主麦克输入信号的频谱 Τ₂乘以增益函数 G得到主麦克输入信号去混响后的频谱 );

2.4, 对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号 c ■

2.5, 将主麦克输入信号去混响后的时域信号逐帧叠接相加后，输出主麦克输入信号去混响后的连续信号_¾(0。

在图 3所示的方法中，由于通过辅麦克输入信号与 (0作卷积，得到主麦克输入信号的后期混响估计信号，然后通过谱减法从主麦克输入信号的频谱中减去主麦克输入信号的后期混响估计谱，因此能从主麦克的输入信号中有效地消除其后期混响，而保留其早期混响，提高了语音的质量。同时，图 3所示方案，在估计后期混响中根据混响强弱调节谱减力度, 在混响弱的时候少做甚至不做谱减，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音质量，保护语音质量。并且这种方案中不需要准确估计直达声波达方向，因而不要求麦克风具有 4艮高一致性，对声学设计也没有严格的限制。

在本发明的一个实施例中，在图 3 所示方案的基础上，还进一步考虑主麦克输入信号的后期混响估计信号与主麦克输入信号的真实后期混响成分相比，后期混响估计信号在低频部分估计不足的问题，根据不同的麦克间距设计低通滤波器对后期混响估计信号进行相应的频率补偿。具体参见图 4所示的实施例。

图 4是本发明又一个实施例中的基于双麦克的语音混响消减方法的整体流程示意图。如图 4所示，整个系统的输入是辅麦克输入信号 (t)和主麦克输入信号 x₂ (t) , 输出是去混响后的信号 X ）。包括两大部分：混响语估计过程和谱减过程。图 4与图 3所示的方法流程相比增加了对后期混响估计信号进行频率补偿的步骤（在图 4 中对后期混响估计信号进行频率补偿的步骤为步骤 1.45 , 时频域转换的步骤仍标记为步骤 1.5 )。以下参照图 4, 对该方法进行详细说明：

1.混响谱估计

输入：辅麦克的输入信号 (t)、主麦克的输入信号 x₂ (t) ;

输出：增益函数的调节因子 (作为谱减过程的一个输入）、主麦克输入信号的后期混响谱 (作为谱减过程的一个输入）；

混响谱估计包括 1.1、 1.2、 1.3、 1.4、 1.45、 1.5六个步骤。

2.谱减

输入：主麦克输入信号 (0、增益函数的调节因子 (混响语估计过程的输出）、主麦克的后期混响谱（混响谱估计过程的输出）；

输出：主麦克输入信号去混响后的信号 ¾ (t) (也是整个系统的输出）；谱减过程包括 2.1、 2.2、 2.3、 2.4、 2.5五个步骤。

下面详细介绍混响谱估计过程和谱减过程中的各个步骤以及各步骤之间的关系。

1.混响语估计过程：

1.1计算辅麦克到主麦克的传递函数。

1.1的输入：辅麦克的输入信号 (t)和主麦克的输入信号 x₂ (t)。

1.1的输出：辅麦克到主麦克的传递函数 /Kt) (作为 1.2的输入）。

在本发明的一个实施例中，用辅麦克输入信号 (t)和主麦克输入信号 x₂ (t)的互功率谱 ^以及辅麦克输入信号 (t)的功率谱 ^来计算传递函数 H : 将频域的传递函数 H作逆傅里叶变换，得到时域的传递函数 / t)。在本发明的其他实施例中，的计算可以釆用不同的方法，如自适应滤波的方法等，这里不再详述。

1.2求取传递函数 wt)的拖尾部分 w。

1.2的输入：辅麦克到主麦克的传递函数 /<t) ( 1.1的输出）。

1.2的输出：辅麦克到主麦克的传递函数的拖尾部分 (t) (作为 1.4的输入）。

在本发明的实施例中，在传递函数的时间轴上取早期混响和后期混响的分界点，将传递函数 Kt)的该分界点之前的值置 0, 即得到传递函数的拖尾部分 (0。在本发明的一个较佳实施例中，在/ 上选取一点，令该点到的最大峰的距离为 50ms, 将/ <t)在该点以前的值置为 0, 记为 h人 ή。

1.3根据辅麦克到主麦克的传递函数/ 判断混响强弱，求出增益函数的调节因子。

1.3的输入：辅麦克到主麦克的传递函数 /<t) ( 1.1的输出）。

1.3的输出：增益函数的调节因子 (作为谱减过程的一个输入）。为了减少弱混响时去混响对语音的损伤，本步骤 1.3中通过判断混响强弱来计算增益函数的调节因子。在本发明的实施例中，辅麦克到主麦克的传递函数的头部能量与拖尾部分的能量的比值取对数记为 p：

其中， Wt)为辅麦克到主麦克的传递函数， Τ为 /<t)的时间轴上的指定分界点。该分界点 T不一定是早期混响和后期混响的分界点，但该分界点 T之前一定包括直达声，还可已包括部分或全部早期混响。

图 5a是本发明实施例中的声源到主麦克距离为 0.5m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离 L=0.5m, T的取值范围是 20ms~50ms, 这里 T取 50ms (即分界点 T为距离 /<0的最大峰 50ms的时间点）时，语音的清晰度指标 C₅。=12.3dB, p =9.4dB。

图 5b是本发明实施例中的声源到主麦克距离为 lm时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离 L=lm, T的取值范围是 20ms~50ms, 这里 T取 50ms (即分界点 T为距离 /<0的最大峰 50ms的时间点）时，语音的清晰度指标<^₅。=8.1(18, p =6.0dB。

图 5c是本发明实施例中的声源到主麦克距离为 2m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离 L=2m, T的取值范围是 20ms~50ms, 这里 T取 50ms (即分界点 T为距离 /<t)的最大峰 50ms的时间点）时，语音的清晰度指标<^₅。=5.4(18, p =3.7dB。

图 5d是本发明实施例中的声源到主麦克距离为 4m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离 L=4m, T的取值范围是 20ms~50ms, 这里 T取 50ms (即分界点 T为距离 /<t)的最大峰 50ms的时间点）时，语音的清晰度指标<^₅。=4.5(18, p =2.2dB。

声源距麦克越远，混响就越强。从图 5a至图 5d可知，随着混响增强，辅麦克到主麦克的传递函数的头部能量变低，拖尾部分的能量变高，二者比值取的对数 p可以反映混响强弱。随着混响变强， p的值逐渐变小。因此可以根据 p 的值来判断混响强弱，并由此求出增益函数调节因子。

可以有多种计算方式，公式（6 )是本发明实施例中的一种计算的经验公式：

和取设定值，是一种经验值，在本发明的实施例中， p 9dB, ?₂取 2dB (麦克间距为 6cm )。

1.4用辅麦克的输入信号 t)与辅麦克到主麦克的传递函数的拖尾部分 Wt) 作卷积，得到主麦克输入信号的后期混响估计信号 (t)。

1.4 的输入：辅麦克的输入信号 (0、辅麦克到主麦克的传递函数的拖尾部分 Wt) ( 1.2的输出 )。

1.4的输出：主麦克输入信号的后期混响估计信号 (作为 1.45的输入）。

具体如下公式：

( 7 )

1.45对主麦克输入信号的后期混响估计信号进行频率补偿，得到补偿后的信号 _ Eg(t)。

1.45的输入：主麦克输入信号的后期混响估计信号 r'(t) ( 1.4的输出）。 1.45 的输出：经过频率补偿的主麦克输入信号的后期混响估计信号 r _ EQ{t) (作为 1.5的输入）。

主麦克输入信号的后期混响估计信号 )与主麦克输入信号的真实后期混响成分相比，后期混响估计信号 (t)在低频部分估计不足。因此，在本发明中对主麦克输入信号的后期混响估计信号 )进行频率补偿。主辅麦克之间的间距会对后期混响估计信号产生影响，因此本发明的实施例中根据不同的麦克间距设计低通滤波器对后期混响估计信号进行相应的频率补偿，得到补偿后的后期混响估计信号 _ EQ{t)。

图 6a是本发明实施例中的主辅助麦克之间的间距为 6cm时的频率补偿滤波器的幅频特性示意图。图 6b是本发明实施例中的主辅助麦克之间的间距为 18cm 时的频率补偿滤波器的幅频特性示意图。可以看出，在本发明的实施例中，主麦克与辅麦克之间的距离越大，对主麦克输入信号的后期混响估计信号的低频部分进行频率补偿的程度越小。

1.5将经过频率补偿的主麦克输入信号的后期混响估计信号 ¾(t)由时域转换到频域，得到主麦克输入信号的后期混响谱

1.5 的输入：经过频率补偿的主麦克输入信号的后期混响估计信号 f _ EQ(t) ( 1.45的输出）。

1.5 的输出：主麦克输入信号的后期混响谱（作为谱减过程的一个输入）。

将经过频率补偿的主麦克的后期混响估计信号变换到频域，就可以得到主麦克输入信号的后期混响谱^：

2.谱减过程

2.1将主麦克的输入信号 χ₂(0由时域变换到频域，记为 ₂。

2.1的输入：主麦克的输入信号 x₂ (t)。

2.1的输出：主麦克输入信号的频谱 Τ₂ (作为 2.2的输入）。具体公式如下：

2.2 由主麦克输入信号的频谱 ₂以及估计出的主麦克的后期混响谱计算增益函数 G , 并根据调节因子来调节增益函数。

2.2的输入：主麦克输入信号的频谱 Τ₂ ( 2.1 的输出）、主麦克的后期混响谱（混响谱估计过程中的 1.5的输出）、增益函数调节因子（混响谱估计过程中的 1.3的输出）。

2.2输出：增益函数 G (作为 2.3的一个输入）。

本发明的一个实施例中，釆用功率谱减法，根据如下公式计算增益函数 G(l, k)：

其中， /为帧号，为频点号，为增益函数的调节因子，为主麦克输入信号的后期混响频谱，为主麦克输入信号的频谱。

根据公式（10 ) 可以看出，通过增益函数的调节因子可以调节增益函数 G(J, k)的大小。这样在混响弱的时候可以少做甚至不做谱减，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音，保护语音质量。

2.3用主麦克输入信号的幅度语 | ₂ |乘以增益函数 G , 并结合主麦克输入信号的相位，得到主麦克输入信号去混响后的频谱 D。 2.3的输入：主麦克输入信号的频谱 Τ₂ ( 2.1的输出）、增益函数 G ( 2.2 的输出）。

2.3的输出：主麦克输入信号去混响后的频谱 (作为 2.4的输入）。具体为根据如下公式计算主麦克输入信号去混响后的频谱 )( ) :

D(l, k) = G(l, k) -

- exp(j · phaseij, k)) ( 11 ) 其中， /为帧号，为频点号， | ₂(/, )|为主麦克输入信号的幅度语，为增益函数， phased, ^)为主麦克输入信号的相位。

2.4将主麦克输入信号去混响后的频谱转换到时域，记为 )。

2.4的输入：主麦克输入信号去混响后的频谱 ) ( 2.3的输出）。

2.4的输出：主麦克输入信号去混响后的时域信号 i (t) (作为 2.5的输入）。

2.5将主麦克输入信号去混响后的时域信号逐帧叠接相加，得到主麦克输入信号去混响后的连续信号 (t)。

2.5的输入：主麦克输入信号去混响后的时域信号 i (t) ( 2.4的输出）。 2.5的输出：主麦克输入信号去混响后的连续信号¾(0 (整个系统的输出）。

图 7a是本发明实施例中的主麦克输入信号的时域图；图 7b是本发明实施例中的主麦克去混响后的时域图；图 7c是本发明实施例中的主麦克输入信号的语谱图；图 7d是本发明实施例中的主麦克去混响后的语谱图。

参见图 7a-7d, 在本实施例中，主辅麦克正对声源，声源到双麦克的垂直距离是 2m, 主辅麦克间距为 18cm时，主麦克输入信号去混响前的 C_5Q为 6.8dB, 釆用图 4所示方案去混响后的 C_5Q为 10.5dB,可见釆用本发明的方案后 C_5Q提高了 3.7dB。

图 8是本发明实施例中的一种基于双麦克的语音混响消减装置的组成结构图。该装置对主麦克和辅麦克接收到的信号逐帧进行处理，参见图 8, 该装置包括：混响语估计单元 700和语减单元 800, 其中：

混响谱估计单元 700, 用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数/ Kt) , 获取传递函数 Wt)的拖尾部分/ t) , 并根据传递函数 Wt)判断混响的强弱，计算出增益函数的调节因子输出给语减单元 800, 用辅麦克输入信号与 (t)作卷积，得到主麦克输入信号的后期混响估计信号，对主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响谱后输出给谱减单元 800。

谱减单元 800,用于接收主麦克输入信号和混响语估计单元 700输出的增益函数的调节因子以及主麦克输入信号的后期混响谱，对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱，根据主麦克输入信号的频谱、增益函数的调节因子以及主麦克输入信号的后期混响谱计算增益函数，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号，将主麦克输入信号去混响后的时域信号逐帧叠接相加后，输出主麦克输入信号去混响后的连续信号。

在本发明的一个实施例中 ,混响语估计单元 700用辅麦克输入信号与 (t)作卷积，得到主麦克输入信号的后期混响估计信号后，先对主麦克输入信号的后期混响估计信号进行频率补偿，然后对频率补偿后的信号进行时域到频域的转换得到主麦克输入信号的后期混响语后输出给语减单元 800。

图 9是本发明的一个较佳实施例中的基于双麦克的语音混响消减装置的详细组成结构及其输入输出示意图。参见图 9, 该基于双麦克的语音混响消减装置包括：混响语估计单元 91和语减单元 92。其中：混响估计单元 91包括：传递函数计算单元 911、传递函数拖尾计算单元 912、混响强弱判断单元 913、后期混响估计单元 914、频率补偿单元 915和第一时频转换单元 916。语减单元 92 包括：第二时频转换单元 921、增益函数计算单元 922、去混响单元 923和频时转换单元 924和叠接相加单元 925。

传递函数计算单元 911 , 用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数 , 并将传递函数 /<0输出给传递函数拖尾计算单元 912和混响强弱判断单元 913。

传递函数拖尾计算单元 912, 用于求取传递函数 /?(t)的拖尾部分/？），并输出给后期混响估计单元 914。传递函数拖尾计算单元 912具体在传递函数 Wt)的时间轴上取早期混响和后期混响的分界点，将传递函数 /<t)的该分界点之前的值置 0, 得到传递函数 /<t)的拖尾部分 (t)。

混响强弱判断单元 913 , 用于根据传递函数/ Kt)判断混响的强弱，并计算出增益函数的调节因子输出给增益函数计算单元。具体地，混响强弱判断单元 913根据前算表示混响强弱的参数 p。

, 其中， /?(t)为辅麦克到主麦克的传递函数， Τ为/? (t)

的时间轴上的指定分界点。

然后，混响强弱判断单元 913根据前述的公式（6 )计算增益函数的调节因子。

0 p > _Pl

即^ 2(p_l - p)/(p_l - p₂) p₂ < p < _Pl , 其中， A和 ¾取设定值。如， ?₁取9(18,

2 P < P₂

p₂取 2dB (麦克间距为 6cm )。

后期混响估计单元 914, 用于接收辅麦克输入信号，用辅麦克输入信号与 h_r(t)作卷积，得到主麦克输入信号的后期混响估计信号并输出给频率补偿单元

915。

频率补偿单元 915 ,用于对主麦克输入信号的后期混响估计信号进行频率补偿，将进行频率补偿后的信号输出给第一时频转换单元 916。在主麦克与辅麦克之间的距离越大时，频率补偿单元 915对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小。

第一时频转换单元 916 ,用于对经过频率补偿后的主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响谱后输出给增益函数计算单元 922。

第二时频转换单元 921 , 用于接收主麦克输入信号，进行时域到频域的转换得到主麦克输入信号的频谱并输出给增益函数计算单元 922和去混响单元 923。

增益函数计算单元 922 ,用于根据第二时频转换单元 921输出的主麦克输入信号的频谱、混响强弱判断单元 913输出的增益函数的调节因子以及第一时频转换单元 916输出的主麦克输入信号的后期混响谱计算出增益函数，并将增益函数输出给去混响单元 923。增益函数计算单元 922可以根据前述的公式（ 10 ) 计算增益函数。即 G(l, k) 其中， /为帧号，为频点号，为增益函数

的调节因子， ^为主麦克输入信号的后期混响频谱， ^₂为主麦克输入信号的频谱。

去混响单元 923 ,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，并输出给频时转换单元 924。在本实施例中，去混响单元 923根据前述公式（ 1 1 )计算主麦克输入信号去混响后的频谱

D(l, k) = G(l, k) -

- exp(j - phased k)) . 其中， /为帧号， A为频点号， | ₂( )|为主麦克输入信号的幅度， G(/, ）为增益函数， ½« /, ）为主麦克输入信号的相位。

频时转换单元 924 ,用于对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号并输出给叠接相加单元 925。

叠接相加单元 925 ,用于将频时转换单元 924输出的时域信号逐帧叠接相加得到主麦克输入信号去混响后的连续信号。

综上所述，本发明实施例这种基于双麦克的语音混响消减装置对主麦克和辅麦克接收到的信号逐帧进行处理。该装置中的混响谱估计单元，用于接收主麦克的输入信号 x₂ (t)和辅麦克输入信号 χ ），艮据 x₂ (t)和 χ )计算辅麦克到主麦克的传递函数 Wt) , 获取/ <t)的拖尾部分/？），并根据 Wt)判断混响的强弱，计算出增益函数的调节因子输出给该装置中的谱减单元，用 (t)与/ ^t)作卷积，得到 x₂ (t)的后期混响估计信号 (ή ,对进行时域到频域的转换，得到 x₂ (t)的后期混响谱后输出给该装置中谱减单元。该装置中的谱减单元，用于对 x₂ (t)进行时域到频域的转换得到 x₂ (t)的频谱，根据 x₂ (t)的频谱、以及计算增益函数，用 x₂ (t)的频谱乘以增益函数得到 x₂ (t)去混响后的频谱，进行频域到时域的转换，得到 x₂ (t)去混响后的时域信号。本发明的这种方案中，由于通过辅麦克输入 x )信号与/ Ut)作卷积，得到主麦克输入信号 x₂ (t)的后期混响估计信号 r'(t) , 然后通过谱减法从主麦克输入信号 x₂ (t)的频谱中减去主麦克输入信号的后期混响估计谱 R , 因此能从主麦克的输入信号 x₂ (t)中有效地消除其后期混响，而保留其早期混响，提高了语音的质量。同时，本发明在估计后期混响中根据混响强弱调节谱减力度，在混响弱的时候少做甚至不做谱减，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音，保护语音质量。并且这种方案中不需要准确估计直达声波达方向，因而不要求麦克风具有很高一致性，对声学设计也没有严格的限制。

可见本发明的技术方案，在去除混响的同时有效保护语音，自动估计房间混响的强弱程度，在各种环境下都选择合适的处理，达到接近最优的语音质量。且对麦克风的一致性和声学设计没有严格限制，应用更灵活便捷。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

权利要求书

1、一种基于双麦克的语音混响消减方法，其特征在于，该方法包括：接收主麦克输入信号和辅麦克输入信号，逐帧做如下处理：

根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数获取传递函数的拖尾部分 h_r (t) , 并根据传递函数判断混响的强弱，计算出增益函数的调节因子^ ;

2、根据权利要求 1所述的方法，其特征在于，在所述得到主麦克输入信号的后期混响估计信号之后，并在进行时域到频域的转换之前，该方法进一步包括：

对主麦克输入信号的后期混响估计信号进行频率补偿，并且，主麦克与辅麦克之间的距离越大，对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小；

对进行频率补偿后的信号进行时域到频域的转换得到主麦克输入信号的后期混响谱。

3、根据权利要求 1 所述的方法，其特征在于，所述根据传递函数 Wt)判断混响的强弱具体为根据如下公式计算表示混响强弱的参数 ρ：

其中， Wt)为辅麦克到主麦克的传递函数， Τ为 Wt)的时间轴上的指定分界点；

所述计算出增益函数的调节因子具体为根据如下公式计算：

其中， ^和取设定值。

4、根据权利要求 1所述的方法，其特征在于，所述根据主麦克输入信号的频谱、增益函数的调节因子以及主麦克输入信号的后期混响谱计算增益函数，具体为根据如下公式计算增益函数 G( )：

5、根据权利要求 1 所述的方法，其特征在于，所述获取传递函数 Wt)的拖尾部分包括：

在传递函数 Wt)的时间轴上取早期混响和后期混响的分界点，将传递函数 h(t)的该分界点之前的值置 0, 得到传递函数 /<t)的拖尾部分/ ^(t)。

6、一种基于双麦克的语音混响消减装置，其特征在于，该装置对主麦克和辅麦克接收到的信号逐帧进行处理，该装置包括：混响语估计单元和谱减单元，其巾：

混响谱估计单元，用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数 /<0 , 获取传递函数 Wt)的拖尾部分/？），并根据传递函数 Wt)判断混响的强弱，计算出增益函数的调节因子输出给语减单元，用辅麦克输入信号与 (t)作卷积，得到主麦克输入信号的后期混响估计信号，对主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响语后输出给语减单元；

7、根据权利要求 6所述的装置，其特征在于，所述混响估计单元包括：传递函数计算单元、传递函数拖尾计算单元、混响强弱判断单元、后期混响估计单元和第一时频转换单元；此外所述混响估计单元还包括频率补偿单元；所述谱减单元包括：第二时频转换单元、增益函数计算单元、去混响单元、频时转换单元和叠接相加单元；其中：传递函数计算单元，用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数 , 并将传递函数输出给传递函数拖尾计算单元和混响强弱判断单元；

传递函数拖尾计算单元，用于求取传递函数 wt)的拖尾部分/？），并输出给后期混响估计单元；

混响强弱判断单元，用于根据传递函数 wt)判断混响的强弱，计算出增益函数的调节因子输出给增益函数计算单元；

后期混响估计单元，用于接收辅麦克输入信号，用辅麦克输入信号与 (t)作卷积，得到主麦克输入信号的后期混响估计信号并输出给频率补偿单元；

频率补偿单元，用于对主麦克输入信号的后期混响估计信号进行频率补偿并输出给第一时频转换单元，其中，在主麦克与辅麦克之间的距离越大时，对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小；

第一时频转换单元，用于对频率补偿后的主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响谱后输出给增益函数计算单元；

第二时频转换单元，用于接收主麦克输入信号，进行时域到频域的转换得到主麦克输入信号的频谱并输出给增益函数计算单元；

增益函数计算单元，用于根据第二时频转换单元输出的主麦克输入信号的频谱、混响强弱判断单元输出的增益函数的调节因子以及第一时频转换单元输出的主麦克输入信号的后期混响谱计算增益函数并输出给去混响单元；

去混响单元，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，并输出给频时转换单元；

频时转换单元，用于对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号并输出给叠接相加单元；

叠接相加单元，用于将主麦克输入信号去混响后的时域信号逐帧叠接相加后，输出主麦克输入信号去混响后的连续信号。

8、根据权利要求 7所述的装置，其特征在于，

所述混响强弱判断单元，用于根据如下公式计算表示混响强弱的参数 P： h {t)dt