CN107749303A - 一种声学回声抵消器输出语音信号的后处理方法及装置 - Google Patents
一种声学回声抵消器输出语音信号的后处理方法及装置 Download PDFInfo
- Publication number
- CN107749303A CN107749303A CN201710640371.XA CN201710640371A CN107749303A CN 107749303 A CN107749303 A CN 107749303A CN 201710640371 A CN201710640371 A CN 201710640371A CN 107749303 A CN107749303 A CN 107749303A
- Authority
- CN
- China
- Prior art keywords
- aec
- signal
- subband
- power spectrum
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012805 post-processing Methods 0.000 title claims abstract description 53
- 238000001228 spectrum Methods 0.000 claims abstract description 509
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000001629 suppression Effects 0.000 claims description 80
- 238000012417 linear regression Methods 0.000 claims description 53
- 238000005311 autocorrelation function Methods 0.000 claims description 52
- 238000005314 correlation function Methods 0.000 claims description 52
- 238000004590 computer program Methods 0.000 claims description 45
- 238000009499 grossing Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 36
- 239000000126 substance Substances 0.000 claims description 30
- 230000003044 adaptive effect Effects 0.000 claims description 27
- 230000005251 gamma ray Effects 0.000 claims description 8
- 230000005764 inhibitory process Effects 0.000 claims description 8
- 238000002592 echocardiography Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 16
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 101100001672 Emericella variicolor andG gene Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
本发明提供了一种声学回声抵消器输出语音信号的后处理方法及装置,涉及信号处理技术领域。该声学回声抵消器AEC输出语音信号的后处理方法,包括:获取预设的AEC输出信号子带谱;依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;输出所述近端语音信号子带谱的线性估计值。上述方案,通过将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下以使近端语音信号子带谱估计的失真误差最小化,有效抑制了残留回声,保证了语音通信系统的全双工特性的稳定性。
Description
技术领域
本发明涉及信号处理技术领域,特别涉及一种声学回声抵消器输出语音信号的后处理方法及装置。
背景技术
声学回声抵消器(AEC)是全双工语音通信系统中一个关键部件,其主要作用是移去由扬声器耦合到麦克风远端信号的回声信号,同时不退化近端语音信号。尽管线性自适应滤波器构成的传统AEC在高品质硬件条件可达满意效果,但它在诸如通常的电话器件和笔记本等低廉的设备中应用时,由于低品质扬声器、过载功放和设计欠缺的外壳等引入了非线性失真,使得其性能在实际应用中十分受限,此时AEC的输出通常存在明显的非线性残留回声。
为此,人们提出了许多相应技术来克服或减少这种非线性残留回声。这些技术可归纳为2类,其中一类是采用非线性AEC模型,包括自适应Voltera滤波器、自适应正交幂乘方滤波器(orthogonalized power filters)、基于饱和曲线的预失真器以及神经网络技术;尽管采用非线性AEC模型在某些应用场景可以达到预定的效果,但其计算复杂度巨大,难以在实际产品或系统中实现。另一类则是采用残留回声抑制(RES)模型,包括中心削波(center clipping)技术、线性RES算法、谐波失真的非线性RES算法和基于回声路径频域幂乘方滤波器模型的非线性RES算法。这类技术均把传统的AEC输出用作RES算法的输入,并从中估计出残留回声的功率谱,然后用Weiner滤波或谱减法来进一步抑制该残留回声。该类技术虽可实际实现,但在双讲模式情形下,会严重地损伤近端语音信号。
发明内容
本发明实施例提供一种声学回声抵消器输出语音信号的后处理方法及装置,以改善和解决现有的线性自适应滤波器构成的传统AEC在实际应用中的性能十分有限,其输出通常存在显著的非线性残留回声,严重影响语音通信系统的全双工特性的问题。
为了解决上述技术问题,本发明实施例提供一种声学回声抵消器AEC输出语音信号的后处理方法,包括:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
进一步地,所述对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值的步骤,包括:
获取残留回声子带域抑制因子;
根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
进一步地,所述获取残留回声子带域抑制因子的步骤,包括:
分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
进一步地,所述AEC估计的回声信号子带功率谱的获取方式为:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述AEC输出信号与麦克风接收信号之间的子带互功率谱的获取方式为:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述残留回声子带域抑制因子的调节参数的获取方式为:
获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
进一步地,所述AEC估计的回声信号的零均值子带功率谱的获取方式为:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述AEC输出信号的零均值子带功率谱的获取方式为:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数的步骤,包括:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
进一步地,所述AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数的获取方式为:
根据公式:
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述AEC估计的回声信号的零均值子带功率谱的自相关函数的获取方式为:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述自适应平滑系数参数的获取方式为:
根据公式:
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
进一步地,所述AEC输出信号的子带功率谱的获取方式为:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述根据所述互相关函数以及所述自相关函数,获取线性回归系数的步骤,包括:
根据公式:
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;|·|为复数的取模运算符;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数的步骤,包括:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述根据所述AEC估计的回声信号的子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子的步骤,包括:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值的步骤,包括:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
本发明实施例还提供一种AEC输出语音信号的后处理装置,包括:
获取模块,用于获取预设的AEC输出信号子带谱;
处理模块,用于依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出模块,用于输出所述近端语音信号子带谱的线性估计值。
进一步地,所述处理模块,包括:
获取子模块,用于获取残留回声子带域抑制因子;
处理子模块,用于根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
进一步地,所述获取子模块,包括:
第一获取单元,用于分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
第二获取单元,用于根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
进一步地,在获取所述AEC估计的回声信号子带功率谱时,所述第一获取单元用于:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,在获取所述AEC输出信号与麦克风接收信号之间的子带互功率谱时,所述第一获取单元用于:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,在获取所述残留回声子带域抑制因子的调节参数时,所述第一获取单元,包括:
第一获取子单元,用于获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
第二获取子单元,用于根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
第三获取子单元,用于根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
进一步地,在获取所述AEC估计的回声信号的零均值子带功率谱时,所述第一获取子单元用于:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,在获取所述AEC输出信号的零均值子带功率谱时,所述第一获取子单元用于:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述第二获取子单元用于:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
进一步地,所述AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数的获取方式为:
根据公式:
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述AEC估计的回声信号的零均值子带功率谱的自相关函数的获取方式为:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述自适应平滑系数参数的获取方式为:
根据公式:
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
进一步地,所述AEC输出信号的子带功率谱的获取方式为:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述根据所述互相关函数以及所述自相关函数,获取线性回归系数的方式为:
根据公式:
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;|·|为复数的取模运算符;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述第三获取子单元用于:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述第二获取单元用于:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理子模块用于:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
本发明实施例还提供一种AEC输出语音信号的后处理装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其中,所述处理器执行所述程序时实现以下步骤:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
本发明的有益效果是:
上述方案,通过将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下以使近端语音信号子带谱估计的失真误差最小化,有效抑制了残留回声,保证了语音通信系统的全双工特性的稳定性。
附图说明
图1表示本发明实施例的AEC输出语音信号的后处理方法的流程示意图;
图2表示子带域中RES与传统AEC级联关系示意图;
图3表示本发明实施例的AEC输出语音信号的后处理装置的模块示意图;
图4表示本发明实施例的AEC输出语音信号的后处理装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
本发明针对现有的线性自适应滤波器构成的传统AEC在实际应用中的性能十分有限,其输出通常存在显著的非线性残留回声,严重影响语音通信系统的全双工特性的问题,提供一种声学回声抵消器AEC输出语音信号的后处理方法及装置。
如图1所示,本发明一实施例的AEC输出语音信号的后处理方法,包括:
步骤11,获取预设的AEC输出信号子带谱;
需要说明的是,预设AEC输出信号子带谱即传统的AEC输出信号的子带谱。
步骤12,依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
步骤13,输出所述近端语音信号子带谱的线性估计值。
需要说明的是,本发明实施例提出了一种用于子带域的RES算法,该RES算法构造一子带域滤波器对子带域AEC的输出信号进行后滤波(post-filtering)处理(即对AEC输出信号子带谱进行加权处理),以实现对残留回声的抑制。该AEC输出信号子带谱是执行RES算法的输入参数,近端语音信号子带谱的线性估计值是运用RES算法后的输出量。
如图2所示,为子带域中RES与传统AEC级联关系示意图,其中,k为子带索引变量,k=0,1,2,…,K-1(其中,K为总子带数);t为信号帧时间索引变量,t=0,1,2,…;S(k,t)为近端语音信号子带谱,D(k,t)为实际回声子带谱,为传统的AEC估计的回声信号子带谱,E(k,t)为子带k中AEC输出信号子带谱。参考图2,E(k,t)可表达为:
公式一:
其中,为子带k中的残留回声分量(即:残留回声信号子带谱)。设为近端语音信号子带谱(S(k,t))的线性估计值,这里GRES(k,t)是实数子带域加权函数;那么相应的估计误差为:
公式二:
鉴于S(k,t)和R(k,t)不相关,则子带k上估计误差信号ε(k,t)的功率Gεε(k,t)用公式三表示为:
公式三:
其中,GRR(k,t)=E{|R(k,t)|2}为子带k上残留回声分量的功率,GSS(k,t)=E{|S(k,t)|2}为子带k上近端信号的功率,E{·}为统计平均运算符;分别记[1-GRES(k,t)]2GSS(k,t)为JS(k,t)和GRR(k,t)为JR(k,t),为了使近端语音的估计信号失真最小,同时可将残留回声抑制到预定电平β(0<β<1),那么近端语音信号的线性最优估计问题则可用下述带约束条件的最优化问题(即公式四)来表述。
公式四:
公式四定义的最优估计器可应用不等式约束条件下Karush-Kuhn-Tucker必要条件来求解。构造下述的拉格朗日函数:
公式五:
L{GRES(k,t),β}=JS(k,t)+γ[JR(k,t)-βGRR(k,t)];
其中γ为拉格朗日乘数,它且满足:
公式六:
γ[JR(k,t)-βGRR(k,t)]=0forγ≥0;
根据这里为F(x)对变量x的梯度,得出公式七:
[GRES(k,t)-1]GSS(k,t)+γGRES(k,t)GRR(k,t)=0;
根据公式七,从而得到公式八:
进一步地,考虑到:
公式九:
既然最优化函数及其约束条件均是凸函数,那么公式八所确定的滤波器是总体最优解。
应用公式八来求解最优估计时,需要首先估计GSS(k,t)和GRR(k,t),而在实际中它们却无法直接地获取,因此必须寻找使公式八可实际实现的工程方案。
注意到R(k,t)与S(k,t)不相关,那么有:
公式十:
GES(k,t)=E{E(k,t)·S*(k,t)}=GSS(k,t);
公式十一:
GES(k,t)=E{E(k,t)·S*(k,t)}=E{E(k,t)·[Y(k,t)-D(k,t)]*}
=GEY(k,t)-GED(k,t);
其中GES(k,t)、GEY(k,t)和GED(k,t)分别是E(k,t)和S(k,t)之间、E(k,t)和Y(k,t)之间及E(k,t)和D(k,t)之间的子带互功率谱,上标的符号“*”表示复共轭运算符。
对于在稳态下的AEC,本领域技术人员已证明GED(k,t)≈0,故可以得到下述公式十二:
GSS(k,t)=GES(k,t)≈GEY(k,t);
另一方面,注意到相关实验研究表明残留回声子带谱的幅度|R(k,t)|与AEC估计的回声信号子带谱的幅度呈现显著的线性回归关系,那么用一个比例因子η(k,t)乘以来估算GRR(k,t),便是一种合理的工程近似,即可得到下述公式十三:
由此可知,要想获得只需求得GEY(k,t)和即可。
由上述推导可知,本发明实施例的步骤12在具体实现时,包括:
步骤121,获取残留回声子带域抑制因子;
需要说明的是,该残留回声子带域抑制因子即上文中所提到的
步骤122,根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
进一步地,步骤121的具体实现方式包括:
分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
具体地,所述AEC估计的回声信号子带功率谱的获取方式为:
根据公式十四:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述AEC输出信号与麦克风接收信号之间的子带互功率谱的获取方式为:
根据公式十五:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱。
具体地,所述残留回声子带域抑制因子的调节参数的获取方式为:
获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
可选地,所述AEC估计的回声信号的零均值子带功率谱的获取方式为:
根据公式十六:
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;λ1为预设平滑系数参数,且0<λ1<1。
可选地,所述AEC输出信号的零均值子带功率谱的获取方式为:
根据公式十七:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;λ1为预设平滑系数参数,且0<λ1<1。
可选地,所述根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数的步骤,包括:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
具体地,所述AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数的获取方式为:
根据公式十八:
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数。
具体地,所述AEC估计的回声信号的零均值子带功率谱的自相关函数的获取方式为:
根据公式十九:
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数。
可选地,所述自适应平滑系数参数的获取方式为:
根据公式二十:
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
需要说明的是,采用公式二十来定义λ2(k,t)具有如下优点:
1)在无回声信号出现情况下,λ2(k,t)≈0阻止了相应的估计作自适应地更新;
2)在有近端语音信号出现(即“双讲”模式发生)或回声路径改变时,由于此时使得λ2(k,t)≈0,同样也阻止了相应的估计作自适应地更新,从而使相应的估计对回声抵消中的“双讲”模式和回声路径的改变具有良好的鲁棒特性。
具体地,所述AEC输出信号的子带功率谱的获取方式为:
根据公式二十一:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱。
具体的,所述根据所述互相关函数以及所述自相关函数,获取线性回归系数的步骤,包括:
根据公式二十二:
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;δ为预设的正则化因子常数,且δ>0,需要说明的是,设置δ是为了避免公式二十二中分母出现为零的情况。
进一步地,所述根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数的步骤,包括:
根据公式二十三:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0。
需要说明的是,采用公式二十三的ρ(k,t)的获取方式所能达到的优点为:在RES算法运行的前期阶段,由于η(k,t)在其学习过程收敛之前的值通常较小,可能使得直接应用此时的η(k,t)来计算残留回声的功率存在欠估计问题,从而不能有效地抑制该阶段的残留回声;为避免该问题的出现,我们可预置一个合适的参数ρ0,使得在RES算法运行的前期阶段应用预置参数ρ0来避免欠估计问题,从而可有效地抑制残留回声。
在通过上述公式十四至公式二十三的运算后,利用公式二十四便可得到残留回声子带域抑制因子,具体为:
公式二十四:
获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;δ为预设的正则化因子常数,且δ>0,需要说明的是,设置δ是为了避免公式二十四中分母出现为零的情况。
需要说明的是,为了进一步改善RES的性能,和GEE(k,t)的估计必须能及时地跟踪其实际信号的动态特性,为此,本发明中采用公式十四和公式二十一定义“快升/慢落”(fast attack/slow decay)的双边单极点递归方式(即一阶非线性递归模型)对和GEE(k,t)进行实时在线地估计。
具体地,步骤122的实现方式为:
根据公式二十五:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值。
通过上述公式,便实现了对AEC输出信号子带谱的处理,得到近端语音信号子带谱的线性估计值,具体的算法实现流程为:
Step-0:t=0,算法开始运行
0-1).输入参数δ、γ0、ρ0、λ0、λ1、λattack和λdecay;
0-2).初始化下述变量:
for k=0to K-1,do:
end do;
Step-1:t=t+1,
for k=0to K-1,do:
1-1).按公式十四、二十一和十五在线计算GEE(k,t)和GEY(k,t);
1-2).按公式十六和十七在线计算和PE(k,t);
1-3).按公式十八和十九在线计算和
1-4).按公式二十二在线计算η(k,t);
1-5).按公式二十三和二十四在线计算
1-6).按公式二十五在线估计
1-7).输出
end do;
Step-2:算法运行需要结束否?
如果“是”,则转至Step-3;
否则,则跳转至Step-1;
Step-3:结束。
需要说明的是,本发明实施例具有如下优点:
1)本发明实施例的RES算法在有效地抑制残留回声的同时,对近端语音的损伤可达最小化;
2)本发明实施例的RES算法对回声抵消中“双讲”模式具有良好的鲁棒性;
3)本发明实施例的RES算法对回声抵消中回声路径的变化具有良好的鲁棒性;
4)由于本发明实施例的该RES算法计算复杂度低,且在子带域运行,故易于实际中并行实时实现。
如图3所示,本发明实施例还提供一种AEC输出语音信号的后处理装置30,包括:
获取模块31,用于获取预设的AEC输出信号子带谱;
处理模块32,用于依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出模块33,用于输出所述近端语音信号子带谱的线性估计值。
具体地,所述处理模块32,包括:
获取子模块,用于获取残留回声子带域抑制因子;
处理子模块,用于根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
可选地,所述获取子模块,包括:
第一获取单元,用于分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
第二获取单元,用于根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
具体地,在获取所述AEC估计的回声信号子带功率谱时,所述第一获取单元用于:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,在获取所述AEC输出信号与麦克风接收信号之间的子带互功率谱时,所述第一获取单元用于:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,在获取所述残留回声子带域抑制因子的调节参数时,所述第一获取单元,包括:
第一获取子单元,用于获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
第二获取子单元,用于根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
第三获取子单元,用于根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
具体地,在获取所述AEC估计的回声信号的零均值子带功率谱时,所述第一获取子单元用于:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,在获取所述AEC输出信号的零均值子带功率谱时,所述第一获取子单元用于:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述第二获取子单元用于:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
具体地,所述AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数的获取方式为:
根据公式:
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述AEC估计的回声信号的零均值子带功率谱的自相关函数的获取方式为:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述自适应平滑系数参数的获取方式为:
根据公式:
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
具体地,所述AEC输出信号的子带功率谱的获取方式为:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述根据所述互相关函数以及所述自相关函数,获取线性回归系数的方式为:
根据公式:
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;|·|为复数的取模运算符;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述第三获取子单元用于:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述第二获取单元用于:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
具体地,所述处理子模块用于:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
需要说明的是,该装置的实施例是与上述方法实施例一一对应的装置,上述方法实施例中所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
如图4所示,本发明实施例还提供一种AEC输出语音信号的后处理装置,包括存储器41、处理器42及存储在所述存储器41上并可在所述处理器上运行的计算机程序,且所述存储器41通过总线接口43与所述处理器42连接;其中,所述处理器42执行所述计算机程序时实现以下步骤:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
进一步地,所述处理器42执行所述计算机程序时还实现:
获取残留回声子带域抑制因子;
根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
进一步地,所述处理器42执行所述计算机程序时还实现:
分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;|·|为复数的取模运算符;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述处理器42执行所述计算机程序时还实现:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
本领域技术人员可以理解,实现上述实施例的全部或者部分步骤可以通过硬件来完成,也可以通过计算机程序来指示相关的硬件来完成,所述计算机程序包括执行上述方法的部分或者全部步骤的指令;且该计算机程序可以存储于一可读存储介质中,存储介质可以是任何形式的存储介质。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
进一步地,所述计算机程序被处理器执行时还实现:
获取残留回声子带域抑制因子;
根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
进一步地,所述计算机程序被处理器执行时还实现:
分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;|·|为复数的取模运算符;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
进一步地,所述计算机程序被处理器执行时还实现:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。
Claims (36)
1.一种声学回声抵消器AEC输出语音信号的后处理方法,其特征在于,包括:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
2.根据权利要求1所述的AEC输出语音信号的后处理方法,其特征在于,所述对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值的步骤,包括:
获取残留回声子带域抑制因子;
根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
3.根据权利要求2所述的AEC输出语音信号的后处理方法,其特征在于,所述获取残留回声子带域抑制因子的步骤,包括:
分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
4.根据权利要求3所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC估计的回声信号子带功率谱的获取方式为:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
5.根据权利要求3所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC输出信号与麦克风接收信号之间的子带互功率谱的获取方式为:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
6.根据权利要求3所述的AEC输出语音信号的后处理方法,其特征在于,所述残留回声子带域抑制因子的调节参数的获取方式为:
获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
7.根据权利要求6所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC估计的回声信号的零均值子带功率谱的获取方式为:
根据公式:
<mrow>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<msup>
<mrow>
<mo>|</mo>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mrow>
<mo>(</mo>
<mrow>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>|</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>-</mo>
<msup>
<mrow>
<mo>|</mo>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mrow>
<mo>(</mo>
<mrow>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>|</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>)</mo>
</mrow>
</mrow>
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;|·|为复数的取模运算符;为AEC估计的回声信号子带谱;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
8.根据权利要求6所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC输出信号的零均值子带功率谱的获取方式为:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
9.根据权利要求6所述的AEC输出语音信号的后处理方法,其特征在于,所述根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数的步骤,包括:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
10.根据权利要求9所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数的获取方式为:
根据公式:
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mi>E</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>&CenterDot;</mo>
<msub>
<mi>R</mi>
<mrow>
<mi>E</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mi>E</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
11.根据权利要求9所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC估计的回声信号的零均值子带功率谱的自相关函数的获取方式为:
根据公式:
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>&CenterDot;</mo>
<msub>
<mi>R</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
12.根据权利要求10或11所述的AEC输出语音信号的后处理方法,其特征在于,所述自适应平滑系数参数的获取方式为:
根据公式:
<mrow>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>&lambda;</mi>
<mn>0</mn>
</msub>
<mo>&CenterDot;</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mo>{</mo>
<mfrac>
<mrow>
<msub>
<mi>G</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>G</mi>
<mrow>
<mi>E</mi>
<mi>E</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
<mn>1</mn>
<mo>}</mo>
</mrow>
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
13.根据权利要求12所述的AEC输出语音信号的后处理方法,其特征在于,所述AEC输出信号的子带功率谱的获取方式为:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
14.根据权利要求9所述的AEC输出语音信号的后处理方法,其特征在于,所述根据所述互相关函数以及所述自相关函数,获取线性回归系数的步骤,包括:
根据公式:
<mrow>
<mi>&eta;</mi>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>|</mo>
<mfrac>
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mi>E</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&delta;</mi>
</mrow>
</mfrac>
<mo>|</mo>
</mrow>
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;|·|为复数的取模运算符;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
15.根据权利要求6所述的AEC输出语音信号的后处理方法,其特征在于,所述根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数的步骤,包括:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
16.根据权利要求3所述的AEC输出语音信号的后处理方法,其特征在于,所述根据所述AEC估计的回声信号的子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子的步骤,包括:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
17.根据权利要求2所述的AEC输出语音信号的后处理方法,其特征在于,所述根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值的步骤,包括:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
18.一种AEC输出语音信号的后处理装置,其特征在于,包括:
获取模块,用于获取预设的AEC输出信号子带谱;
处理模块,用于依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出模块,用于输出所述近端语音信号子带谱的线性估计值。
19.根据权利要求18所述的AEC输出语音信号的后处理装置,其特征在于,所述处理模块,包括:
获取子模块,用于获取残留回声子带域抑制因子;
处理子模块,用于根据所述残留回声子带域抑制因子对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值。
20.根据权利要求19所述的AEC输出语音信号的后处理装置,其特征在于,所述获取子模块,包括:
第一获取单元,用于分别获取AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱以及残留回声子带域抑制因子的调节参数;
第二获取单元,用于根据所述AEC估计的回声信号子带功率谱、AEC输出信号与麦克风接收信号之间的子带互功率谱和所述调节参数,获取残留回声子带域抑制因子。
21.根据权利要求20所述的AEC输出语音信号的后处理装置,其特征在于,在获取所述AEC估计的回声信号子带功率谱时,所述第一获取单元用于:
根据公式:
得到AEC估计的回声子带谱的功率;
其中,为AEC估计的回声信号子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;为AEC估计的回声信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
22.根据权利要求20所述的AEC输出语音信号的后处理装置,其特征在于,在获取所述AEC输出信号与麦克风接收信号之间的子带互功率谱时,所述第一获取单元用于:
根据公式:
GEY(k,t)=λdecay·GEY(k,t-1)+(1-λdecay)·E(k,t)Y*(k,t)
得到AEC输出信号与麦克风接收信号之间的子带互功率谱;
其中,GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;λdecay为递归常数,且0<λdecay<1;E(k,t)为AEC输出信号子带谱;Y*(k,t)为Y(k,t)的复共轭,且Y(k,t)为麦克风接收信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
23.根据权利要求20所述的AEC输出语音信号的后处理装置,其特征在于,在获取所述残留回声子带域抑制因子的调节参数时,所述第一获取单元,包括:
第一获取子单元,用于获取AEC估计的回声信号的零均值子带功率谱和AEC输出信号的零均值子带功率谱;
第二获取子单元,用于根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,获取线性回归系数;
第三获取子单元,用于根据所述线性回归系数,获取残留回声子带域抑制因子的调节参数。
24.根据权利要求23所述的AEC输出语音信号的后处理装置,其特征在于,在获取所述AEC估计的回声信号的零均值子带功率谱时,所述第一获取子单元用于:
根据公式:
<mrow>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<msup>
<mrow>
<mo>|</mo>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mrow>
<mo>(</mo>
<mrow>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>|</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>-</mo>
<msup>
<mrow>
<mo>|</mo>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mrow>
<mo>(</mo>
<mrow>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>|</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>)</mo>
</mrow>
</mrow>
获取AEC估计的回声信号的零均值子带功率谱;
其中,为AEC估计的回声信号的零均值子带功率谱;为AEC估计的回声信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
25.根据权利要求23所述的AEC输出语音信号的后处理装置,其特征在于,在获取所述AEC输出信号的零均值子带功率谱时,所述第一获取子单元用于:
根据公式:
PE(k,t)=λ1PE(k,t-1)+(1-λ1)(|E(k,t)|2-|E(k,t-1)|2)
获取AEC输出信号的零均值子带功率谱;
其中,PE(k,t)为AEC输出信号的零均值子带功率谱,E(k,t)为AEC输出信号子带谱;|·|为复数的取模运算符;λ1为预设平滑系数参数,且0<λ1<1;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
26.根据权利要求23所述的AEC输出语音信号的后处理装置,其特征在于,所述第二获取子单元用于:
根据所述AEC估计的回声信号的零均值子带功率谱和所述AEC输出信号的零均值子带功率谱,分别获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数以及AEC估计的回声信号的零均值子带功率谱的自相关函数;
根据所述互相关函数以及所述自相关函数,获取线性回归系数。
27.根据权利要求26所述的AEC输出语音信号的后处理装置,其特征在于,所述AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数的获取方式为:
根据公式:
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mi>E</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>&CenterDot;</mo>
<msub>
<mi>R</mi>
<mrow>
<mi>E</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mi>E</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
获取AEC输出信号的零均值子带功率谱与AEC估计的回声信号的零均值子带功率谱之间的互相关函数;
其中,为互相关函数;为AEC估计的回声信号的零均值子带功率谱;PE(k,t)为AEC输出信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
28.根据权利要求26所述的AEC输出语音信号的后处理装置,其特征在于,所述AEC估计的回声信号的零均值子带功率谱的自相关函数的获取方式为:
根据公式:
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>&lsqb;</mo>
<mn>1</mn>
<mo>-</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>&CenterDot;</mo>
<msub>
<mi>R</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>-</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<msub>
<mi>P</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
获取AEC估计的回声信号的零均值子带功率谱的自相关函数;
其中,为自相关函数;为AEC估计的回声信号的零均值子带功率谱;λ2(k,t)为自适应平滑系数参数;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
29.根据权利要求27或28所述的AEC输出语音信号的后处理装置,其特征在于,所述自适应平滑系数参数的获取方式为:
根据公式:
<mrow>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msub>
<mi>&lambda;</mi>
<mn>0</mn>
</msub>
<mo>&CenterDot;</mo>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mo>{</mo>
<mfrac>
<mrow>
<msub>
<mi>G</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>G</mi>
<mrow>
<mi>E</mi>
<mi>E</mi>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
<mn>1</mn>
<mo>}</mo>
</mrow>
得到自适应平滑系数参数;
其中,λ0为预设参数,且0<λ0≤1;为AEC估计的回声信号的子带功率谱;GEE(k,t)为AEC输出信号的子带功率谱。
30.根据权利要求29所述的AEC输出语音信号的后处理装置,其特征在于,所述AEC输出信号的子带功率谱的获取方式为:
根据公式:
得到AEC输出信号的子带功率谱;
其中,GEE(k,t)为AEC输出信号的子带功率谱;|·|为复数的取模运算符;λattack和λdecay为递归常数,且0≤λattack<λdecay<1;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
31.根据权利要求26所述的AEC输出语音信号的后处理装置,其特征在于,所述根据所述互相关函数以及所述自相关函数,获取线性回归系数的方式为:
根据公式:
<mrow>
<mi>&eta;</mi>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>|</mo>
<mfrac>
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mi>E</mi>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>R</mi>
<mrow>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
<mover>
<mi>D</mi>
<mo>^</mo>
</mover>
</mrow>
</msub>
<mrow>
<mo>(</mo>
<mi>k</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>&delta;</mi>
</mrow>
</mfrac>
<mo>|</mo>
</mrow>
得到线性回归系数;
其中,η(k,t)为线性回归系数;为互相关函数;为自相关函数;|·|为复数的取模运算符;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
32.根据权利要求23所述的AEC输出语音信号的后处理装置,其特征在于,所述第三获取子单元用于:
根据公式:ρ(k,t)=max{γ0·η(k,t),ρ0}得到残留回声子带域抑制因子的调节参数;
其中,ρ(k,t)为调节参数;γ0和ρ0为预设可调参数,且γ0≥0,ρ0>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
33.根据权利要求20所述的AEC输出语音信号的后处理装置,其特征在于,所述第二获取单元用于:
根据公式:获取残留回声子带域抑制因子;
其中,为残留回声子带域抑制因子;GEY(k,t)为AEC输出信号与麦克风接收信号之间的子带互功率谱;为AEC估计的回声信号的子带功率谱;|·|为复数的取模运算符;ρ(k,t)为调节参数;δ为预设的正则化因子常数,且δ>0;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
34.根据权利要求19所述的AEC输出语音信号的后处理装置,其特征在于,所述处理子模块用于:
根据公式:获取近端语音信号子带谱的线性估计值;
其中,为近端语音信号子带谱的线性估计值;为残留回声子带域抑制因子;E(k,t)为AEC输出信号子带谱;k为子带索引变量,k=0,1,2,…,K-1,且K为总子带数;t为信号帧时间索引变量。
35.一种AEC输出语音信号的后处理装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
36.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现以下步骤:
获取预设的AEC输出信号子带谱;
依据将所述AEC输出信号子带谱中残留回声分量抑制到预设电平的条件下使近端语音信号子带谱估计的失真误差最小化的处理准则,对所述AEC输出信号子带谱进行加权处理,获取近端语音信号子带谱的线性估计值;
输出所述近端语音信号子带谱的线性估计值。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640371.XA CN107749303B (zh) | 2017-07-31 | 2017-07-31 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
PCT/CN2018/092157 WO2019024621A1 (zh) | 2017-07-31 | 2018-06-21 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710640371.XA CN107749303B (zh) | 2017-07-31 | 2017-07-31 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107749303A true CN107749303A (zh) | 2018-03-02 |
CN107749303B CN107749303B (zh) | 2020-03-31 |
Family
ID=61254575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710640371.XA Active CN107749303B (zh) | 2017-07-31 | 2017-07-31 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107749303B (zh) |
WO (1) | WO2019024621A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087665A (zh) * | 2018-07-06 | 2018-12-25 | 南京时保联信息科技有限公司 | 一种非线性回声抑制方法 |
WO2019024621A1 (zh) * | 2017-07-31 | 2019-02-07 | 电信科学技术研究院有限公司 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
CN109348072A (zh) * | 2018-08-30 | 2019-02-15 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN112820311A (zh) * | 2021-04-16 | 2021-05-18 | 成都启英泰伦科技有限公司 | 一种基于空间预测的回声消除方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1736039A (zh) * | 2003-11-11 | 2006-02-15 | 三菱电机株式会社 | 回波抑制装置 |
CN101562669A (zh) * | 2009-03-11 | 2009-10-21 | 屈国良 | 自适应全双工全频段回声消除的方法 |
CN101778183A (zh) * | 2009-01-13 | 2010-07-14 | 华为终端有限公司 | 一种残留回声抑制方法及设备 |
CN102387272A (zh) * | 2011-09-09 | 2012-03-21 | 南京大学 | 一种回声抵消系统中残留回声的抑制方法 |
CN105338450A (zh) * | 2015-09-23 | 2016-02-17 | 苏州科达科技股份有限公司 | 一种残留回波抑制方法及装置 |
CN106878575A (zh) * | 2017-02-24 | 2017-06-20 | 成都喜元网络科技有限公司 | 残留回声的估计方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107749303B (zh) * | 2017-07-31 | 2020-03-31 | 电信科学技术研究院 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
-
2017
- 2017-07-31 CN CN201710640371.XA patent/CN107749303B/zh active Active
-
2018
- 2018-06-21 WO PCT/CN2018/092157 patent/WO2019024621A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1736039A (zh) * | 2003-11-11 | 2006-02-15 | 三菱电机株式会社 | 回波抑制装置 |
CN101778183A (zh) * | 2009-01-13 | 2010-07-14 | 华为终端有限公司 | 一种残留回声抑制方法及设备 |
CN101562669A (zh) * | 2009-03-11 | 2009-10-21 | 屈国良 | 自适应全双工全频段回声消除的方法 |
CN102387272A (zh) * | 2011-09-09 | 2012-03-21 | 南京大学 | 一种回声抵消系统中残留回声的抑制方法 |
CN105338450A (zh) * | 2015-09-23 | 2016-02-17 | 苏州科达科技股份有限公司 | 一种残留回波抑制方法及装置 |
CN106878575A (zh) * | 2017-02-24 | 2017-06-20 | 成都喜元网络科技有限公司 | 残留回声的估计方法及装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019024621A1 (zh) * | 2017-07-31 | 2019-02-07 | 电信科学技术研究院有限公司 | 一种声学回声抵消器输出语音信号的后处理方法及装置 |
CN109087665A (zh) * | 2018-07-06 | 2018-12-25 | 南京时保联信息科技有限公司 | 一种非线性回声抑制方法 |
CN109087665B (zh) * | 2018-07-06 | 2022-11-11 | 南京时保联信息科技有限公司 | 一种非线性回声抑制方法 |
CN109348072A (zh) * | 2018-08-30 | 2019-02-15 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN109348072B (zh) * | 2018-08-30 | 2021-03-02 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN112820311A (zh) * | 2021-04-16 | 2021-05-18 | 成都启英泰伦科技有限公司 | 一种基于空间预测的回声消除方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107749303B (zh) | 2020-03-31 |
WO2019024621A1 (zh) | 2019-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107749303B (zh) | 一种声学回声抵消器输出语音信号的后处理方法及装置 | |
CN109727604B (zh) | 用于语音识别前端的频域回声消除方法及计算机储存介质 | |
Douglas | Introduction to adaptive filters | |
TWI458332B (zh) | 用於回音消除及回音抑制之系統及方法 | |
TWI692754B (zh) | 有限衝激回應濾波器係數向量的可持續更新方法及裝置 | |
JP5049277B2 (ja) | クリアな信号の取得のための方法及びシステム | |
JP5284475B2 (ja) | 前白色化を伴うlmsアルゴリズムによって適応させられる適応フィルタの更新済みフィルタ係数を決定する方法 | |
WO2022012367A1 (zh) | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 | |
CN101964670B (zh) | 回声抑制方法及回声抑制设备 | |
EP1978649A2 (en) | Spectral Domain, Non-Linear Echo Cancellation Method in a Hands-Free Device | |
JP4638039B2 (ja) | 周波数ドメインの非線形プロセッシングを使用したエコー・サプレッションを提供するための方法および装置 | |
CN102739886B (zh) | 基于回声频谱估计和语音存在概率的立体声回声抵消方法 | |
CN110634500B (zh) | 一种先验信噪比的计算方法、电子设备及存储介质 | |
CN109273019B (zh) | 用于回声抑制的双重通话检测的方法及回声抑制 | |
WO2012153452A1 (ja) | エコー消去装置およびエコー検出装置 | |
CN106657507A (zh) | 一种声学回声消除方法及装置 | |
JP2003503871A (ja) | 音響エコー及びノイズ除去 | |
CN110335618A (zh) | 一种改善非线性抑制的方法及计算机设备 | |
CN109754813A (zh) | 基于快速收敛特性的变步长回声消除方法 | |
WO2011133075A1 (en) | An echo canceller and a method thereof | |
CN111755020B (zh) | 一种立体声回声消除方法 | |
WO2020124325A1 (zh) | 一种回声消除中的自适应滤波方法、装置、设备及存储介质 | |
CN106412352B (zh) | 一种时频记忆子带比例自适应回声消除方法 | |
CN105721729A (zh) | 基于块稀疏成比例重用权系数仿射投影的回声消除方法 | |
US6957240B2 (en) | Method and apparatus for providing an error characterization estimate of an impulse response derived using least squares |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |