CN103067821A - 一种基于双麦克的语音混响消减方法和装置 - Google Patents

一种基于双麦克的语音混响消减方法和装置 Download PDF

Info

Publication number
CN103067821A
CN103067821A CN201210536578XA CN201210536578A CN103067821A CN 103067821 A CN103067821 A CN 103067821A CN 201210536578X A CN201210536578X A CN 201210536578XA CN 201210536578 A CN201210536578 A CN 201210536578A CN 103067821 A CN103067821 A CN 103067821A
Authority
CN
China
Prior art keywords
input signal
mike
reverberation
main mike
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210536578XA
Other languages
English (en)
Other versions
CN103067821B (zh
Inventor
楼厦厦
李波
黄秋晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Microelectronics Inc
Original Assignee
Goertek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Inc filed Critical Goertek Inc
Priority to CN201210536578.XA priority Critical patent/CN103067821B/zh
Publication of CN103067821A publication Critical patent/CN103067821A/zh
Priority to EP13863250.0A priority patent/EP2858379B1/en
Priority to JP2015524601A priority patent/JP5785674B2/ja
Priority to DK13863250.0T priority patent/DK2858379T3/en
Priority to US14/411,651 priority patent/US9414157B2/en
Priority to PCT/CN2013/001557 priority patent/WO2014089914A1/zh
Priority to KR1020147036443A priority patent/KR101502297B1/ko
Application granted granted Critical
Publication of CN103067821B publication Critical patent/CN103067821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2225/00Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
    • H04R2225/43Signal processing in hearing aids to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/009Signal processing in [PA] systems to enhance the speech intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

本发明公开了一种基于双麦克的语音混响消减方法和装置。该方法中,根据主麦克的输入信号x2(t)和辅麦克的输入信号x1(t)计算辅麦克到主麦克的传递函数h(t),取h(t)的拖尾部分hr(t),根据h(t)判断混响的强弱,计算出增益函数的调节因子β;x1(t)与hr(t)作卷积,得到x2(t)的后期混响估计信号
Figure DDA00002572837900011
并根据x2(t)的频谱、β以及
Figure DDA00002572837900012
的频谱计算增益函数,用x2(t)的频谱乘以增益函数得到x2(t)去混响后的频谱,频时转换得到x2(t)去后期混响后的时域信号。这样能从主麦克输入信号中消除后期混响,而保留早期混响,不会使处理后的声音变得单薄,提高了语音的质量。同时根据混响强弱调节谱减力度,保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音。并且不需要准确估计直达声波达方向,因而不要求麦克风具有很高一致性。

Description

一种基于双麦克的语音混响消减方法和装置
技术领域
本发明涉及语音增强技术领域,特别涉及一种基于双麦克的语音混响消减方法和装置。
背景技术
声音信号在室内的传播过程中,由于墙壁、地面等硬质界面对声音的反射,到达传声器的声音除了直接从声源传来的直达声外,还有经过一次或多次反射传来的声音信号,这些非直达声构成了混响信号。经过一次或少量的几次反射的声音信号称为早期反射信号,早期反射信号构成了早期混响信号,早期混响信号能够对语音起到增强作用。经过多次反射的声音信号称为后期反射信号,后期反射信号构成了后期混响信号,后期混响较强则会降低语音的清晰度。
在一些免提语音通讯中,通话者距离麦克风较远,语音清晰度会因房间混响而下降,导致通话质量下降。因此需要一些技术消减混响,提升语音清晰度。麦克风接收信号包括直达声信号和混响信号,而由前述可知混响又可以分为早期混响和后期混响。其中降低语音清晰度的主要是后期混响,而早期混响一般对语音有增强作用。因此提升清晰度的关键是降低后期混响信号。
在各种混响消减技术中,基于双麦克的谱减去混响方法受到较多关注。现有的一种基于双麦克风谱减的去混响方法中,采用自适应波束形成(GSC)的结构得到两路信号,第一路信号是延时-求和波束形成器的输出;第二路信号是阻塞矩阵的输出。两路信号的能量包络通过一个自适应滤波器估计出第一路信号的混响,再利用谱减法去除混响。这种方法有几个缺点:
1)会去除早期混响,使处理后的声音变得单薄。
2)对混响强弱没有判断,在不同混响情况下都沿用一样的谱减处理,这样在混响弱、语音清晰度原本比较高时可能损伤语音质量。
3)需要准确估计直达声波达方向,分离直达声,因而要求麦克风具有很高一致性,对声学设计也有严格的限制。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题的基于双麦克的语音混响消减方法和装置。
依据本发明的一个方面,提供了一种基于双麦克的语音混响消减方法,该方法包括:
接收主麦克输入信号和辅麦克输入信号,逐帧做如下处理:
根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t);
获取传递函数h(t)的拖尾部分hr(t),并根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β;
用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号;
对主麦克输入信号的后期混响估计信号进行时域到频域的转换得到主麦克输入信号的后期混响谱;对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱;
根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数;
用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱;
对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号;
将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号。
依据本发明的另一方面,提供了一种基于双麦克的语音混响消减装置,对主麦克和辅麦克接收到的信号逐帧进行处理;该装置包括:混响谱估计单元和谱减单元,其中:
混响谱估计单元,用于接收主麦克输入信号和辅麦克输入信号,根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t),获取传递函数h(t)的拖尾部分hr(t),并根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β输出给谱减单元,用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号,对主麦克输入信号的后期混响估计信号进行时域到频域的转换,得到主麦克输入信号的后期混响谱后输出给谱减单元;
谱减单元,用于接收主麦克输入信号和混响谱估计单元输出的增益函数的调节因子以及主麦克输入信号的后期混响谱,对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱,根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱,对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号,将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号。
由上述可见,本发明通过根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t),取传递函数h(t)的拖尾部分hr(t),并且根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β;然后根据辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号,并根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱,即通过谱减法从主麦克输入信号的频谱中减去主麦克输入信号的后期混响估计谱,因此能从主麦克的输入信号中有效地消除其后期混响,而保留其早期混响,不会使处理后的声音变得单薄,提高了语音的质量。同时在估计后期混响中根据混响强弱调节谱减力度,在混响弱的时候少做甚至不做谱减,保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音,保护语音质量。并且这种方案中不需要准确估计直达声波达方向,因而不要求麦克风具有很高一致性,对声学设计也没有严格的限制。
附图说明
图1是本发明实施例中给出的激励信号到麦克输入信号的传递函数示意图;
图2是本发明实施例中给出的辅麦克到主麦克的传递函数h(t)的示意图;
图3是本发明一个实施例中的一种基于双麦克的语音混响消减方法的流程示意图;
图4是本发明又一个实施例中的基于双麦克的语音混响消减方法的整体流程示意图。
图5a是本发明实施例中的声源到主麦克距离为0.5m时辅麦克到主麦克的传递函数的示意图;
图5b是本发明实施例中的声源到主麦克距离为1m时辅麦克到主麦克的传递函数的示意图;
图5c是本发明实施例中的声源到主麦克距离为2m时辅麦克到主麦克的传递函数的示意图;
图5d是本发明实施例中的声源到主麦克距离为4m时辅麦克到主麦克的传递函数的示意图;
图6a是本发明实施例中的主辅麦克之间的间距为6cm时的频率补偿滤波器的幅频特性示意图;
图6b是本发明实施例中的主辅麦克之间的间距为18cm时的频率补偿滤波器的幅频特性示意图;
图7a是本发明实施例中的主麦克输入信号的时域图;
图7b是本发明实施例中的主麦克去混响后的时域图;
图7c是本发明实施例中的主麦克输入信号的语谱图;
图7d是本发明实施例中的主麦克去混响后的语谱图;
图8是本发明实施例中的一种基于双麦克的语音混响消减装置的组成结构图;
图9是本发明的一个较佳实施例中的基于双麦克的语音混响消减装置的详细组成结构及其输入输出示意图。
具体实施方式
首先需要声明的是:为使申请文件简要,在本申请文件中将“麦克风”简称为“麦克”。
根据对现有技术的分析,为了更好的混响消减需要在去除后期混响的同时保护直达声和早期混响,因而需要准确稳定的后期混响估计和混响强弱判断。
本发明提出了基于双麦克的去混响方案,充分的利用了混响和双麦克空间传递函数之间的近似关系,利用双麦克空间传递函数估计后期混响并判断混响强弱,与谱减模块配合在各种混响环境下都可以在满足清晰度的同时得到接近最优的语音质量。另外发明中的方案不需要分离直达声也不用做波达方向估计,因而不要求麦克风一致性,放宽了对声学设计的要求。
本发明的基本原理是:通过双麦克之间传递函数的尾部估计后期混响,因此谱减中可以很好的保留直达声和早期混响。并且在估计后期混响中进一步利用双麦克传递函数的头部和尾部能量差异估计房间混响的程度,调节谱减力度,在混响弱的时候少做甚至不做谱减,保护语音质量。
为使本发明的技术方案清楚,下面对本发明的技术原理进行分析说明。
早期混响信号能够对语音起到增强作用,后期混响则会降低语音的清晰度。图1是本发明实施例中给出激励信号到麦克输入信号的传递函数示意图。参见图1,在激励信号到麦克输入信号的传递函数上,峰值最大的地方对应直达声,通常将距离最大峰的某个点作为早期反射和后期反射的分界点,最大峰到分界点的部分对应早期混响,分界点后的部分对应后期混响。在图1中,该分界点为50ms。
将激励信号记为s(t),麦克输入信号记为x(t),激励信号到麦克输入信号的传递函数记为tf(t),对应直达声和早期混响部分的传递函数记为tfd(t),对应后期混响部分的传递函数记为tfr(t)。那么,麦克输入信号可以表示为激励信号与传递函数的卷积x(t)=s(t)*tf(t),麦克输入信号的直达声和早期混响成分可以表示为xd(t)=s(t)*tfd(t),麦克输入信号的后期混响成分可以表示为xr(t)=s(t)*tfr(t)。则麦克输入信号也可以表示为x(t)=s(t)*tf(t)=s(t)*(tfd(t)+tfr(t))=xd(t)+xr(t)。
语音的清晰度可以用C50来表示,其计算公式为:
C 50 = 10 log ∫ 0 50 ms w 2 ( t ) dt ∫ 50 ms ∞ w 2 ( t ) dt dB - - - ( 1 )
w(t)是激励信号到麦克输入信号的传递函数。0~50ms对应直达声和早期混响部分,50ms以后对应后期混响部分。混响越强,C50的值越小。去混响前后C50的提升可以反映去混响的效果,因此,C50可以作为一个去混响的客观评测指标。
本发明中基于双麦克(主麦克和辅麦克)的混响估计原理如下:主麦克的输入信号记为x2(t),辅麦克的输入信号记为x1(t),辅麦克到主麦克的传递函数记为h(t),如图2所示。图2是本发明实施例中给出的辅麦克到主麦克的传递函数h(t)的示意图。
主麦克的输入信号x2(t)等于辅麦克的输入信号x1(t)与传递函数h(t)的卷积:
x2(t)=x1(t)*h(t)                        (2)
h(t)可以分为头尾两部分:
h(t)=hd(t)+hr(t)                        (3)
其中,hd(t)表示h(t)的头部,hr(t)表示h(t)的尾部。
h(t)的拖尾部分hr(t)反映了信号在空间的多次反射,因此h(t)的拖尾部分hr(t)和辅麦克输入信号x1(t)的卷积信号
Figure BDA00002572837700062
与主麦克的后期混响成分相近,可以作为主麦克后期混响成分的估计信号。在h(t)上选取一点作为hd(t)和hr(t)的分界点,将h(t)在分界点以前的值置0,可以得到hr(t)。分界点到h(t)最大峰的距离范围可以设置为30ms~80ms(经验值)。根据经验,若分界点到h(t)的最大峰大于等于50ms,则主麦克的后期混响估计信号
Figure BDA00002572837700063
中完全没有直达声和早期反射成分的残留,可以减少对语音的损伤,因此在本发明的实施例中以分界点取50ms为例进行说明。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明实施方式作进一步地详细描述。
图3是本发明一个实施例中的一种基于双麦克的语音混响消减方法的流程示意图。如图3所示,该方法主要包括混响估计部分和谱减部分,具体是逐帧做如下处理:
1.1,接收主麦克输入信号x2(t)和辅麦克输入信号x1(t),根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t);
1.2,获取传递函数h(t)的拖尾部分hr(t);
1.3,并且根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β;
1.4,用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号
Figure BDA00002572837700071
1.5,对主麦克输入信号的后期混响估计信号
Figure BDA00002572837700072
进行时域到频域的转换得到主麦克输入信号的后期混响谱
Figure BDA00002572837700073
2.1,对主麦克输入信号x2(t)进行时域到频域的转换得到主麦克输入信号的频谱X2
2.2,根据主麦克输入信号的频谱X2、增益函数的调节因子β以及主麦克输入信号的后期混响谱
Figure BDA00002572837700074
计算增益函数G;
2.3,用主麦克输入信号的频谱X2乘以增益函数G得到主麦克输入信号去混响后的频谱D;
2.4,对主麦克输入信号去混响后的频谱D进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号d(t);
2.5,将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号xd(t)。
在图3所示的方法中,由于通过辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号,然后通过谱减法从主麦克输入信号的频谱中减去主麦克输入信号的后期混响估计谱,因此能从主麦克的输入信号中有效地消除其后期混响,而保留其早期混响,提高了语音的质量。同时,图3所示方案,在估计后期混响中根据混响强弱调节谱减力度,在混响弱的时候少做甚至不做谱减,保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音质量,保护语音质量。并且这种方案中不需要准确估计直达声波达方向,因而不要求麦克风具有很高一致性,对声学设计也没有严格的限制。
在本发明的一个实施例中,在图3所示方案的基础上,还进一步考虑主麦克输入信号的后期混响估计信号与主麦克输入信号的真实后期混响成分相比,后期混响估计信号在低频部分估计不足的问题,根据不同的麦克间距设计低通滤波器对后期混响估计信号进行相应的频率补偿。具体参见图4所示的实施例。
图4是本发明又一个实施例中的基于双麦克的语音混响消减方法的整体流程示意图。如图4所示,整个系统的输入是辅麦克输入信号x1(t)和主麦克输入信号x2(t),输出是去混响后的信号xd(t)。包括两大部分:混响谱估计过程和谱减过程。图4与图3所示的方法流程相比增加了对后期混响估计信号进行频率补偿的步骤(在图4中对后期混响估计信号进行频率补偿的步骤为步骤1.45,时频域转换的步骤仍标记为步骤1.5)。以下参照图4,对该方法进行详细说明:
1.混响谱估计
输入:辅麦克的输入信号x1(t)、主麦克的输入信号x2(t);
输出:增益函数的调节因子β(作为谱减过程的一个输入)、主麦克输入信号的后期混响谱
Figure BDA00002572837700081
(作为谱减过程的一个输入);
混响谱估计包括1.1、1.2、1.3、1.4、1.45、1.5六个步骤。
2.谱减
输入:主麦克输入信号x2(t)、增益函数的调节因子β(混响谱估计过程的输出)、主麦克的后期混响谱
Figure BDA00002572837700082
(混响谱估计过程的输出);
输出:主麦克输入信号去混响后的信号xd(t)(也是整个系统的输出);
谱减过程包括2.1、2.2、2.3、2.4、2.5五个步骤。
下面详细介绍混响谱估计过程和谱减过程中的各个步骤以及各步骤之间的关系。
1.混响谱估计过程:
1.1计算辅麦克到主麦克的传递函数h(t)。
1.1的输入:辅麦克的输入信号耳x1(t)和主麦克的输入信号x2(t)。
1.1的输出:辅麦克到主麦克的传递函数h(t)(作为1.2的输入)。
在本发明的一个实施例中,用辅麦克输入信号x1(t)和主麦克输入信号x2(t)的互功率谱
Figure BDA00002572837700091
以及辅麦克输入信号x1(t)的功率谱来计算传递函数H:
H = P x 2 x 1 P x 1 x 1 - - - ( 4 )
将频域的传递函数H作逆傅里叶变换,得到时域的传递函数h(t)。
在本发明的其他实施例中,h(t)的计算可以采用不同的方法,如自适应滤波的方法等,这里不再详述。
1.2求取传递函数h(t)的拖尾部分hr(t)。
1.2的输入:辅麦克到主麦克的传递函数h(t)(1.1的输出)。
1.2的输出:辅麦克到主麦克的传递函数的拖尾部分hr(t)(作为1.4的输入)。
在本发明的实施例中,在传递函数h(t)的时间轴上取早期混响和后期混响的分界点,将传递函数h(t)的该分界点之前的值置0,即得到传递函数h(t)的拖尾部分hr(t)。在本发明的一个较佳实施例中,在h(t)上选取一点,令该点到h(t)的最大峰的距离为50ms,将h(t)在该点以前的值置为0,记为hr(t)。
1.3根据辅麦克到主麦克的传递函数h(t)判断混响强弱,求出增益函数的调节因子β。
1.3的输入:辅麦克到主麦克的传递函数h(t)(1.1的输出)。
1.3的输出:增益函数的调节因子β(作为谱减过程的一个输入)。
为了减少弱混响时去混响对语音的损伤,本步骤1.3中通过判断混响强弱来计算增益函数的调节因子β。在本发明的实施例中,辅麦克到主麦克的传递函数的头部能量与拖尾部分的能量的比值取对数记为ρ:
ρ = 10 log ∫ 0 T h 2 ( t ) dt ∫ T ∞ h 2 ( t ) dt dB - - - ( 5 )
其中,h(t)为辅麦克到主麦克的传递函数,T为h(t)的时间轴上的指定分界点。该分界点T不一定是早期混响和后期混响的分界点,但该分界点T之前一定包括直达声,还可已包括部分或全部早期混响。
图5a是本发明实施例中的声源到主麦克距离为0.5m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离L=0.5m,T的取值范围是20ms~50ms,这里T取50ms(即分界点T为距离h(t)的最大峰50ms的时间点)时,语音的清晰度指标C50=12.3dB,ρ=9.4dB。
图5b是本发明实施例中的声源到主麦克距离为1m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离L=1m,T的取值范围是20ms~50ms,这里T取50ms(即分界点T为距离h(t)的最大峰50ms的时间点)时,语音的清晰度指标C50=8.1dB,ρ=6.0dB。
图5c是本发明实施例中的声源到主麦克距离为2m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离L=2m,T的取值范围是20ms~50ms,这里T取50ms(即分界点T为距离h(t)的最大峰50ms的时间点)时,语音的清晰度指标C50=5.4dB,ρ=3.7dB。
图5d是本发明实施例中的声源到主麦克距离为4m时辅麦克到主麦克的传递函数的示意图。当声源到主麦克距离L=4m,T的取值范围是20ms~50ms,这里T取50ms(即分界点T为距离h(t)的最大峰50ms的时间点)时,语音的清晰度指标C50=4.5dB,ρ=2.2dB。
声源距麦克越远,混响就越强。从图5a至图5d可知,随着混响增强,辅麦克到主麦克的传递函数的头部能量变低,拖尾部分的能量变高,二者比值取的对数ρ可以反映混响强弱。随着混响变强,ρ的值逐渐变小。因此可以根据ρ的值来判断混响强弱,并由此求出增益函数调节因子β。
β可以有多种计算方式,公式(6)是本发明实施例中的一种计算β的经验公式:
&beta; = 0 &rho; > &rho; 1 2 ( &rho; 1 - &rho; ) / ( &rho; 1 - &rho; 2 ) &rho; 2 < &rho; < &rho; 1 2 &rho; < &rho; 2 - - - ( 6 )
ρ1和ρ2取设定值,是一种经验值,在本发明的实施例中,ρ1取9dB,ρ2取2dB(麦克间距为6cm)。
1.4用辅麦克的输入信号x1(t)与辅麦克到主麦克的传递函数的拖尾部分hr(t)作卷积,得到主麦克输入信号的后期混响估计信号
Figure BDA00002572837700112
1.4的输入:辅麦克的输入信号x1(t)、辅麦克到主麦克的传递函数的拖尾部分hr(t)(1.2的输出)。
1.4的输出:主麦克输入信号的后期混响估计信号(作为1.45的输入)。
具体如下公式: r ^ ( t ) = x 1 ( t ) * h r ( t ) - - - ( 7 )
1.45对主麦克输入信号的后期混响估计信号
Figure BDA00002572837700115
进行频率补偿,得到补偿后的信号
Figure BDA00002572837700116
1.45的输入:主麦克输入信号的后期混响估计信号(1.4的输出)。
1.45的输出:经过频率补偿的主麦克输入信号的后期混响估计信号
Figure BDA00002572837700118
(作为1.5的输入)。
主麦克输入信号的后期混响估计信号
Figure BDA00002572837700119
与主麦克输入信号的真实后期混响成分相比,后期混响估计信号
Figure BDA000025728377001110
在低频部分估计不足。因此,在本发明中对主麦克输入信号的后期混响估计信号
Figure BDA000025728377001111
进行频率补偿。主辅麦克之间的间距会对后期混响估计信号
Figure BDA000025728377001112
产生影响,因此本发明的实施例中根据不同的麦克间距设计低通滤波器对后期混响估计信号进行相应的频率补偿,得到补偿后的后期混响估计信号
图6a是本发明实施例中的主辅助麦克之间的间距为6cm时的频率补偿滤波器的幅频特性示意图。图6b是本发明实施例中的主辅助麦克之间的间距为18cm时的频率补偿滤波器的幅频特性示意图。可以看出,在本发明的实施例中,主麦克与辅麦克之间的距离越大,对主麦克输入信号的后期混响估计信号的低频部分进行频率补偿的程度越小。
1.5将经过频率补偿的主麦克输入信号的后期混响估计信号
Figure BDA00002572837700122
由时域转换到频域,得到主麦克输入信号的后期混响谱
Figure BDA00002572837700123
1.5的输入:经过频率补偿的主麦克输入信号的后期混响估计信号
Figure BDA00002572837700124
(1.45的输出)。
1.5的输出:主麦克输入信号的后期混响谱
Figure BDA00002572837700125
(作为谱减过程的一个输入)。
将经过频率补偿的主麦克的后期混响估计信号
Figure BDA00002572837700126
变换到频域,就可以得到主麦克输入信号的后期混响谱
R ^ = fft ( r ^ _ EQ ( t ) ) - - - ( 8 )
2.谱减过程
2.1将主麦克的输入信号x2(t)由时域变换到频域,记为X2
2.1的输入:主麦克的输入信号x2(t)。
2.1的输出:主麦克输入信号的频谱X2(作为2.2的输入)。
具体公式如下:
X2=fft(x2(t))                        (9)
2.2由主麦克输入信号的频谱X2以及估计出的主麦克的后期混响谱
Figure BDA00002572837700129
计算增益函数G,并根据调节因子β来调节增益函数。
2.2的输入:主麦克输入信号的频谱X2(2.1的输出)、主麦克的后期混响谱
Figure BDA000025728377001210
(混响谱估计过程中的1.5的输出)、增益函数调节因子β(混响谱估计过程中的1.3的输出)。
2.2输出:增益函数G(作为2.3的一个输入)。
本发明的一个实施例中,采用功率谱减法,根据如下公式计算增益函数G(l,k):
G ( l , k ) = | X 2 ( l , k ) | 2 - &beta; | R ^ ( l , k ) | 2 | X 2 ( l , k ) | 2 - - - ( 10 )
其中,l为帧号,k为频点号,β为增益函数的调节因子,
Figure BDA00002572837700132
为主麦克输入信号的后期混响频谱,X2为主麦克输入信号的频谱。
根据公式(10)可以看出,通过增益函数的调节因子β可以调节增益函数G(l,k)的大小。这样在混响弱的时候可以少做甚至不做谱减,保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音,保护语音质量。
2.3用主麦克输入信号的幅度谱|X2|乘以增益函数G,并结合主麦克输入信号的相位,得到主麦克输入信号去混响后的频谱D。
2.3的输入:主麦克输入信号的频谱X2(2.1的输出)、增益函数G(2.2的输出)。
2.3的输出:主麦克输入信号去混响后的频谱D(作为2.4的输入)。
具体为根据如下公式计算主麦克输入信号去混响后的频谱D(l,k):
D(l,k)=G(l,k)·|X2(l,k)|·exp(j·phase(l,k))            (11)
其中,l为帧号,k为频点号,|X2(l,k)|为主麦克输入信号的幅度谱,G(l,k)为增益函数,phase(l,k)为主麦克输入信号的相位。
2.4将主麦克输入信号去混响后的频谱D转换到时域,记为d(t)。
2.4的输入:主麦克输入信号去混响后的频谱D(2.3的输出)。
2.4的输出:主麦克输入信号去混响后的时域信号d(t)(作为2.5的输入)。
d(t)=ifft(D)                                (12)
2.5将主麦克输入信号去混响后的时域信号逐帧叠接相加,得到主麦克输入信号去混响后的连续信号xd(t)。
2.5的输入:主麦克输入信号去混响后的时域信号d(t)(2.4的输出)。
2.5的输出:主麦克输入信号去混响后的连续信号xd(t)(整个系统的输出)。
图7a是本发明实施例中的主麦克输入信号的时域图;图7b是本发明实施例中的主麦克去混响后的时域图;图7c是本发明实施例中的主麦克输入信号的语谱图;图7d是本发明实施例中的主麦克去混响后的语谱图。
参见图7a-7d,在本实施例中,主辅麦克正对声源,声源到双麦克的垂直距离是2m,主辅麦克间距为18cm时,主麦克输入信号去混响前的C50为6.8dB,采用图4所示方案去混响后的C50为10.5dB,可见采用本发明的方案后C50提高了3.7dB。
图8是本发明实施例中的一种基于双麦克的语音混响消减装置的组成结构图。该装置对主麦克和辅麦克接收到的信号逐帧进行处理,参见图8,该装置包括:混响谱估计单元700和谱减单元800,其中:
混响谱估计单元700,用于接收主麦克输入信号和辅麦克输入信号,根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t),获取传递函数h(t)的拖尾部分hr(t),并根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β输出给谱减单元800,用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号,对主麦克输入信号的后期混响估计信号进行时域到频域的转换,得到主麦克输入信号的后期混响谱后输出给谱减单元800。
谱减单元800,用于接收主麦克输入信号和混响谱估计单元700输出的增益函数的调节因子以及主麦克输入信号的后期混响谱,对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱,根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱,对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号,将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号。
在本发明的一个实施例中,混响谱估计单元700用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号后,先对主麦克输入信号的后期混响估计信号进行频率补偿,然后对频率补偿后的信号进行时域到频域的转换得到主麦克输入信号的后期混响谱后输出给谱减单元800。
图9是本发明的一个较佳实施例中的基于双麦克的语音混响消减装置的详细组成结构及其输入输出示意图。参见图9,该基于双麦克的语音混响消减装置包括:混响谱估计单元91和谱减单元92。其中:混响估计单元91包括:传递函数计算单元911、传递函数拖尾计算单元912、混响强弱判断单元913、后期混响估计单元914、频率补偿单元915和第一时频转换单元916。谱减单元92包括:第二时频转换单元921、增益函数计算单元922、去混响单元923和频时转换单元924和叠接相加单元925。
传递函数计算单元911,用于接收主麦克输入信号和辅麦克输入信号,根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t),并将传递函数h(t)输出给传递函数拖尾计算单元912和混响强弱判断单元913。
传递函数拖尾计算单元912,用于求取传递函数h(t)的拖尾部分hr(t),并输出给后期混响估计单元914。传递函数拖尾计算单元912具体在传递函数h(t)的时间轴上取早期混响和后期混响的分界点,将传递函数h(t)的该分界点之前的值置0,得到传递函数h(t)的拖尾部分hr(t)。
混响强弱判断单元913,用于根据传递函数h(t)判断混响的强弱,并计算出增益函数的调节因子β输出给增益函数计算单元。具体地,混响强弱判断单元913根据前述的公式(5)计算表示混响强弱的参数ρ。
其中,h(t)为辅麦克到主麦克的传递函数,T为h(t)的时间轴上的指定分界点。
然后,混响强弱判断单元913根据前述的公式(6)计算增益函数的调节因子β。
&beta; = 0 &rho; > &rho; 1 2 ( &rho; 1 - &rho; ) / ( &rho; 1 - &rho; 2 ) &rho; 2 < &rho; < &rho; 1 2 &rho; < &rho; 2 , 其中,ρ1和ρ2取设定值。如,ρ1取9dB,ρ2取2dB(麦克间距为6cm)。
后期混响估计单元914,用于接收辅麦克输入信号,用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号并输出给频率补偿单元915。
频率补偿单元915,用于对主麦克输入信号的后期混响估计信号进行频率补偿,将进行频率补偿后的信号输出给第一时频转换单元916。在主麦克与辅麦克之间的距离越大时,频率补偿单元915对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小。
第一时频转换单元916,用于对经过频率补偿后的主麦克输入信号的后期混响估计信号进行时域到频域的转换,得到主麦克输入信号的后期混响谱后输出给增益函数计算单元922。
第二时频转换单元921,用于接收主麦克输入信号,进行时域到频域的转换得到主麦克输入信号的频谱并输出给增益函数计算单元922和去混响单元923。
增益函数计算单元922,用于根据第二时频转换单元921输出的主麦克输入信号的频谱、混响强弱判断单元913输出的增益函数的调节因子β以及第一时频转换单元916输出的主麦克输入信号的后期混响谱计算出增益函数,并将增益函数输出给去混响单元923。增益函数计算单元922可以根据前述的公式(10)计算增益函数G(l,k)。
G ( l , k ) = | X 2 ( l , k ) | 2 - &beta; | R ^ ( l , k ) | 2 | X 2 ( l , k ) | 2 , 其中,l为帧号,k为频点号,β为增益函数的调节因子,
Figure BDA00002572837700163
为主麦克输入信号的后期混响频谱,X2为主麦克输入信号的频谱。
去混响单元923,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱,并输出给频时转换单元924。在本实施例中,去混响单元923根据前述公式(11)计算主麦克输入信号去混响后的频谱D(l,k)。
即D(l,k)=G(l,k)·|X2(l,k)|·exp(j·phase(l,k)),其中,l为帧号,k为频点号,|X2(l,k)|为主麦克输入信号的幅度,G(l,k)为增益函数,phase(l,k)为主麦克输入信号的相位。
频时转换单元924,用于对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号并输出给叠接相加单元925。
叠接相加单元925,用于将频时转换单元924输出的时域信号逐帧叠接相加得到主麦克输入信号去混响后的连续信号。
综上所述,本发明实施例这种基于双麦克的语音混响消减装置对主麦克和辅麦克接收到的信号逐帧进行处理。该装置中的混响谱估计单元,用于接收主麦克的输入信号x2(t)和辅麦克输入信号x1(t),根据x2(t)和x1(t)计算辅麦克到主麦克的传递函数h(t),获取h(t)的拖尾部分hr(t),并根据h(t)判断混响的强弱,计算出增益函数的调节因子β输出给该装置中的谱减单元,用x1(t)与hr(t)作卷积,得到x2(t)的后期混响估计信号
Figure BDA00002572837700171
Figure BDA00002572837700172
进行时域到频域的转换,得到x2(t)的后期混响谱后输出给该装置中谱减单元。该装置中的谱减单元,用于对x2(t)进行时域到频域的转换得到x2(t)的频谱,根据x2(t)的频谱、β以及
Figure BDA00002572837700174
计算增益函数,用x2(t)的频谱乘以增益函数得到x2(t)去混响后的频谱,进行频域到时域的转换,得到x2(t)去混响后的时域信号。本发明的这种方案中,由于通过辅麦克输入x1(t)信号与hr(t)作卷积,得到主麦克输入信号x2(t)的后期混响估计信号
Figure BDA00002572837700175
然后通过谱减法从主麦克输入信号x2(t)的频谱中减去主麦克输入信号的后期混响估计谱
Figure BDA00002572837700176
因此能从主麦克的输入信号x2(t)中有效地消除其后期混响,而保留其早期混响,提高了语音的质量。同时,本发明在估计后期混响中根据混响强弱调节谱减力度,在混响弱的时候少做甚至不做谱减,保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音,保护语音质量。并且这种方案中不需要准确估计直达声波达方向,因而不要求麦克风具有很高一致性,对声学设计也没有严格的限制。
可见本发明的技术方案,在去除混响的同时有效保护语音,自动估计房间混响的强弱程度,在各种环境下都选择合适的处理,达到接近最优的语音质量。且对麦克风的一致性和声学设计没有严格限制,应用更灵活便捷。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种基于双麦克的语音混响消减方法,其特征在于,该方法包括:
接收主麦克输入信号和辅麦克输入信号,逐帧做如下处理:
根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t);
获取传递函数h(t)的拖尾部分hr(t),并根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β;
用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号;
对主麦克输入信号的后期混响估计信号进行时域到频域的转换得到主麦克输入信号的后期混响谱;对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱;
根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数;
用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱;
对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号;
将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号。
2.根据权利要求1所述的方法,其特征在于,在所述得到主麦克输入信号的后期混响估计信号之后,并在进行时域到频域的转换之前,该方法进一步包括:
对主麦克输入信号的后期混响估计信号进行频率补偿,并且,主麦克与辅麦克之间的距离越大,对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小;
对进行频率补偿后的信号进行时域到频域的转换得到主麦克输入信号的后期混响谱。
3.根据权利要求1所述的方法,其特征在于,所述根据传递函数h(t)判断混响的强弱具体为根据如下公式计算表示混响强弱的参数ρ:
&rho; = 10 log &Integral; 0 T h 2 ( t ) dt &Integral; T &infin; h 2 ( t ) dt dB
其中,h(t)为辅麦克到主麦克的传递函数,T为h(t)的时间轴上的指定分界点;
所述计算出增益函数的调节因子β具体为根据如下公式计算:
&beta; = 0 &rho; > &rho; 1 2 ( &rho; 1 - &rho; ) / ( &rho; 1 - &rho; 2 ) &rho; 2 < &rho; < &rho; 1 2 &rho; < &rho; 2
其中,ρ1和ρ2取设定值。
4.根据权利要求1所述的方法,其特征在于,所述根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数,具体为根据如下公式计算增益函数G(l,k):
G ( l , k ) = | X 2 ( l , k ) | 2 - &beta; | R ^ ( l , k ) | 2 | X 2 ( l , k ) | 2
其中,l为帧号,k为频点号,β为增益函数的调节因子,
Figure FDA00002572837600024
为主麦克输入信号的后期混响频谱,X2为主麦克输入信号的频谱。
5.根据权利要求1所述的方法,其特征在于,所述获取传递函数h(t)的拖尾部分hr(t)包括:
在传递函数h(t)的时间轴上取早期混响和后期混响的分界点,将传递函数h(t)的该分界点之前的值置0,得到传递函数h(t)的拖尾部分hr(t)。
6.一种基于双麦克的语音混响消减装置,其特征在于,该装置对主麦克和辅麦克接收到的信号逐帧进行处理,该装置包括:混响谱估计单元和谱减单元,其中:
混响谱估计单元,用于接收主麦克输入信号和辅麦克输入信号,根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t),获取传递函数h(t)的拖尾部分hr(t),并根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β输出给谱减单元,用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号,对主麦克输入信号的后期混响估计信号进行时域到频域的转换,得到主麦克输入信号的后期混响谱后输出给谱减单元;
谱减单元,用于接收主麦克输入信号和混响谱估计单元输出的增益函数的调节因子以及主麦克输入信号的后期混响谱,对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱,根据主麦克输入信号的频谱、增益函数的调节因子β以及主麦克输入信号的后期混响谱计算增益函数,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱,对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号,将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号。
7.根据权利要求6所述的装置,其特征在于,所述混响估计单元包括:传递函数计算单元、传递函数拖尾计算单元、混响强弱判断单元、后期混响估计单元和第一时频转换单元;此外所述混响估计单元还包括频率补偿单元;所述谱减单元包括:第二时频转换单元、增益函数计算单元、去混响单元、频时转换单元和叠接相加单元;其中:
传递函数计算单元,用于接收主麦克输入信号和辅麦克输入信号,根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t),并将传递函数h(t)输出给传递函数拖尾计算单元和混响强弱判断单元;
传递函数拖尾计算单元,用于求取传递函数h(t)的拖尾部分hr(t),并输出给后期混响估计单元;
混响强弱判断单元,用于根据传递函数h(t)判断混响的强弱,计算出增益函数的调节因子β输出给增益函数计算单元;
后期混响估计单元,用于接收辅麦克输入信号,用辅麦克输入信号与hr(t)作卷积,得到主麦克输入信号的后期混响估计信号并输出给频率补偿单元;
频率补偿单元,用于对主麦克输入信号的后期混响估计信号进行频率补偿并输出给第一时频转换单元,其中,在主麦克与辅麦克之间的距离越大时,对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小;
第一时频转换单元,用于对频率补偿后的主麦克输入信号的后期混响估计信号进行时域到频域的转换,得到主麦克输入信号的后期混响谱后输出给增益函数计算单元;
第二时频转换单元,用于接收主麦克输入信号,进行时域到频域的转换得到主麦克输入信号的频谱并输出给增益函数计算单元;
增益函数计算单元,用于根据第二时频转换单元输出的主麦克输入信号的频谱、混响强弱判断单元输出的增益函数的调节因子β以及第一时频转换单元输出的主麦克输入信号的后期混响谱计算增益函数并输出给去混响单元;
去混响单元,用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱,并输出给频时转换单元;
频时转换单元,用于对主麦克输入信号去混响后的频谱进行频域到时域的转换,得到主麦克输入信号去混响后的时域信号并输出给叠接相加单元;
叠接相加单元,用于将主麦克输入信号去混响后的时域信号逐帧叠接相加后,输出主麦克输入信号去混响后的连续信号。
8.根据权利要求7所述的装置,其特征在于,
所述混响强弱判断单元,用于根据如下公式计算表示混响强弱的参数ρ:
&rho; = 10 log &Integral; 0 T h 2 ( t ) dt &Integral; T &infin; h 2 ( t ) dt dB
其中,h(t)为辅麦克到主麦克的传递函数,T为h(t)的时间轴上的指定分界点;
然后根据如下公式计算增益函数的调节因子β:
&beta; = 0 &rho; > &rho; 1 2 ( &rho; 1 - &rho; ) / ( &rho; 1 - &rho; 2 ) &rho; 2 < &rho; < &rho; 1 2 &rho; < &rho; 2
其中,ρ1和ρ2取设定值。
9.根据权利要求7所述的装置,其特征在于,
所述增益函数计算单元,用于根据如下公式计算增益函数G(l,k):
G ( l , k ) = | X 2 ( l , k ) | 2 - &beta; | R ^ ( l , k ) | 2 | X 2 ( l , k ) | 2
其中,l为帧号,k为频点号,β为增益函数的调节因子,
Figure FDA00002572837600052
为主麦克输入信号的后期混响频谱,X2为主麦克输入信号的频谱。
10.根据权利要求7所述的装置,其特征在于,
所述传递函数拖尾计算单元,具体用于在传递函数h(t)的时间轴上取早期混响和后期混响的分界点,将传递函数h(t)的该分界点之前的值置0,得到传递函数h(t)的拖尾部分hr(t)。
CN201210536578.XA 2012-12-12 2012-12-12 一种基于双麦克的语音混响消减方法和装置 Active CN103067821B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201210536578.XA CN103067821B (zh) 2012-12-12 2012-12-12 一种基于双麦克的语音混响消减方法和装置
EP13863250.0A EP2858379B1 (en) 2012-12-12 2013-12-12 Voice reverberation reduction method and device based on dual microphones
JP2015524601A JP5785674B2 (ja) 2012-12-12 2013-12-12 デュアルマイクに基づく音声残響低減方法及びその装置
DK13863250.0T DK2858379T3 (en) 2012-12-12 2013-12-12 Method and device for reducing voice echo based on dual microphones
US14/411,651 US9414157B2 (en) 2012-12-12 2013-12-12 Method and device for reducing voice reverberation based on double microphones
PCT/CN2013/001557 WO2014089914A1 (zh) 2012-12-12 2013-12-12 一种基于双麦克的语音混响消减方法和装置
KR1020147036443A KR101502297B1 (ko) 2012-12-12 2013-12-12 이중 마이크로폰에 기초해서 음성 잔향을 저감하기 위한 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210536578.XA CN103067821B (zh) 2012-12-12 2012-12-12 一种基于双麦克的语音混响消减方法和装置

Publications (2)

Publication Number Publication Date
CN103067821A true CN103067821A (zh) 2013-04-24
CN103067821B CN103067821B (zh) 2015-03-11

Family

ID=48110252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210536578.XA Active CN103067821B (zh) 2012-12-12 2012-12-12 一种基于双麦克的语音混响消减方法和装置

Country Status (7)

Country Link
US (1) US9414157B2 (zh)
EP (1) EP2858379B1 (zh)
JP (1) JP5785674B2 (zh)
KR (1) KR101502297B1 (zh)
CN (1) CN103067821B (zh)
DK (1) DK2858379T3 (zh)
WO (1) WO2014089914A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014089914A1 (zh) * 2012-12-12 2014-06-19 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
CN104156553A (zh) * 2014-05-09 2014-11-19 哈尔滨工业大学深圳研究生院 无需信源数估计的相干信号波达方向估计方法及系统
CN105848052A (zh) * 2015-01-16 2016-08-10 宇龙计算机通信科技(深圳)有限公司 一种麦克切换方法及终端
CN110660404A (zh) * 2019-09-19 2020-01-07 北京声加科技有限公司 基于零陷滤波预处理的语音通信和交互应用系统、方法
CN111179958A (zh) * 2020-01-08 2020-05-19 厦门亿联网络技术股份有限公司 一种语音晚期混响抑制方法及系统
CN113542980A (zh) * 2021-07-21 2021-10-22 深圳市悦尔声学有限公司 一种抑制扬声器串扰的方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2549103B (en) * 2016-04-04 2021-05-05 Toshiba Res Europe Limited A speech processing system and speech processing method
EP3809726A1 (en) * 2019-10-17 2021-04-21 Bang & Olufsen A/S Echo based room estimation
CN112053698A (zh) * 2020-07-31 2020-12-08 出门问问信息科技有限公司 语音转换方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102037739A (zh) * 2008-05-20 2011-04-27 株式会社船井电机新应用技术研究所 声音输入装置及其制造方法、以及信息处理系统
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
US20120051548A1 (en) * 2010-02-18 2012-03-01 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
US20120162471A1 (en) * 2010-12-28 2012-06-28 Toshiyuki Sekiya Audio signal processing device, audio signal processing method, and program
CN203243506U (zh) * 2012-12-12 2013-10-16 歌尔声学股份有限公司 一种基于双麦克的语音混响消减装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3649847B2 (ja) * 1996-03-25 2005-05-18 日本電信電話株式会社 残響除去方法及び装置
DE69738288T2 (de) * 1996-05-31 2008-09-25 Koninklijke Philips Electronics N.V. Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
EP1879181B1 (en) * 2006-07-11 2014-05-21 Nuance Communications, Inc. Method for compensation audio signal components in a vehicle communication system and system therefor
EP2211564B1 (en) * 2009-01-23 2014-09-10 Harman Becker Automotive Systems GmbH Passenger compartment communication system
US8233352B2 (en) * 2009-08-17 2012-07-31 Broadcom Corporation Audio source localization system and method
CN101976565A (zh) 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
JP2012048133A (ja) 2010-08-30 2012-03-08 Nippon Telegr & Teleph Corp <Ntt> 残響除去方法とその装置とプログラム
CN103067821B (zh) * 2012-12-12 2015-03-11 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
CN103087821B (zh) 2013-01-15 2016-09-07 武汉工业学院 一种保留谷维素的米糠油精炼方法
US9100762B2 (en) * 2013-05-22 2015-08-04 Gn Resound A/S Hearing aid with improved localization

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102037739A (zh) * 2008-05-20 2011-04-27 株式会社船井电机新应用技术研究所 声音输入装置及其制造方法、以及信息处理系统
US20120051548A1 (en) * 2010-02-18 2012-03-01 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
US20120162471A1 (en) * 2010-12-28 2012-06-28 Toshiyuki Sekiya Audio signal processing device, audio signal processing method, and program
CN102347028A (zh) * 2011-07-14 2012-02-08 瑞声声学科技(深圳)有限公司 双麦克风语音增强装置及方法
CN203243506U (zh) * 2012-12-12 2013-10-16 歌尔声学股份有限公司 一种基于双麦克的语音混响消减装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014089914A1 (zh) * 2012-12-12 2014-06-19 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
CN104156553A (zh) * 2014-05-09 2014-11-19 哈尔滨工业大学深圳研究生院 无需信源数估计的相干信号波达方向估计方法及系统
CN104156553B (zh) * 2014-05-09 2018-08-17 哈尔滨工业大学深圳研究生院 无需信源数估计的相干信号波达方向估计方法及系统
CN105848052A (zh) * 2015-01-16 2016-08-10 宇龙计算机通信科技(深圳)有限公司 一种麦克切换方法及终端
CN105848052B (zh) * 2015-01-16 2019-10-11 宇龙计算机通信科技(深圳)有限公司 一种麦克切换方法及终端
CN110660404A (zh) * 2019-09-19 2020-01-07 北京声加科技有限公司 基于零陷滤波预处理的语音通信和交互应用系统、方法
CN110660404B (zh) * 2019-09-19 2021-12-07 北京声加科技有限公司 基于零陷滤波预处理的语音通信和交互应用系统、方法
CN111179958A (zh) * 2020-01-08 2020-05-19 厦门亿联网络技术股份有限公司 一种语音晚期混响抑制方法及系统
CN113542980A (zh) * 2021-07-21 2021-10-22 深圳市悦尔声学有限公司 一种抑制扬声器串扰的方法

Also Published As

Publication number Publication date
KR20150008925A (ko) 2015-01-23
EP2858379B1 (en) 2018-10-31
JP2015523609A (ja) 2015-08-13
WO2014089914A1 (zh) 2014-06-19
CN103067821B (zh) 2015-03-11
JP5785674B2 (ja) 2015-09-30
US20150189431A1 (en) 2015-07-02
EP2858379A1 (en) 2015-04-08
KR101502297B1 (ko) 2015-03-12
EP2858379A4 (en) 2015-11-11
US9414157B2 (en) 2016-08-09
DK2858379T3 (en) 2019-01-21

Similar Documents

Publication Publication Date Title
CN103067821B (zh) 一种基于双麦克的语音混响消减方法和装置
US9697846B2 (en) Method and apparatus for reducing echo
CN102387273B (zh) 一种抑制残留回声的方法和装置
US8942976B2 (en) Method and device for noise reduction control using microphone array
CN106782590B (zh) 基于混响环境下麦克风阵列波束形成方法
CN102306496B (zh) 一种多麦克风阵列噪声消除方法、装置及系统
US20240079021A1 (en) Voice enhancement method, apparatus and system, and computer-readable storage medium
EP2048659A1 (en) Gain and spectral shape adjustment in audio signal processing
US9532149B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
CN101901602B (zh) 一种利用受损听力的听阈进行降噪的方法
EP2858338B1 (en) Echo cancellation device and method for small-scale hands-free voice communication system
CN101894561A (zh) 一种基于小波变换和变步长最小均方算法的语音降噪方法
CN203243506U (zh) 一种基于双麦克的语音混响消减装置
CN101964934A (zh) 二元麦克风微阵列语音波束形成方法
EP2752848B1 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
CN103067629A (zh) 回声消除装置
CN101034878B (zh) 增益调整方法和增益调整装置
CN202197344U (zh) 送话器阵列回声消除系统
US9749475B2 (en) Method and apparatus for reducing distortion echo
CN114724574A (zh) 一种期望声源方向可调的双麦克风降噪方法
CN114822575A (zh) 一种双麦克风阵列回声消除方法、装置及电子设备
CN101286763B (zh) 一种有效的回波抑制器
CN113329288A (zh) 一种基于陷波技术的蓝牙耳机降噪方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 261031 Dongfang Road, Weifang high tech Industrial Development Zone, Shandong, China, No. 268

Patentee after: Goertek Inc.

Address before: 261031 Dongfang Road, Weifang high tech Industrial Development Zone, Shandong, China, No. 268

Patentee before: Goertek Inc.

TR01 Transfer of patent right

Effective date of registration: 20200731

Address after: 266104 room 103, 396 Songling Road, Laoshan District, Qingdao, Shandong Province

Patentee after: Goer Microelectronics Co.,Ltd.

Address before: 261031 Dongfang Road, Weifang high tech Industrial Development Zone, Shandong, China, No. 268

Patentee before: GOERTEK Inc.

TR01 Transfer of patent right