CN106448695B - 一种双端通话鲁棒的变阶变步长仿射投影方法 - Google Patents

一种双端通话鲁棒的变阶变步长仿射投影方法 Download PDF

Info

Publication number
CN106448695B
CN106448695B CN201610858354.9A CN201610858354A CN106448695B CN 106448695 B CN106448695 B CN 106448695B CN 201610858354 A CN201610858354 A CN 201610858354A CN 106448695 B CN106448695 B CN 106448695B
Authority
CN
China
Prior art keywords
power estimation
signal power
matrix
affine projection
current time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610858354.9A
Other languages
English (en)
Other versions
CN106448695A (zh
Inventor
张涛
焦海泉
任相赢
安鑫祺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Langfang Rongcheng Technology Service Co ltd
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610858354.9A priority Critical patent/CN106448695B/zh
Publication of CN106448695A publication Critical patent/CN106448695A/zh
Application granted granted Critical
Publication of CN106448695B publication Critical patent/CN106448695B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

一种双端通话鲁棒的变阶变步长仿射投影方法,包括:初始化滤波器的参数;更新输入信号与麦克风信号;计算先验信息;计算当前时刻的麦克风信号功率估计、回声信号功率估计和误差信号功率估计;计算步长;长自信息及其相关计算;确定仿射投影阶数;更新滤波器系数。本发明用于声学回声消除器,能够使声学回声消除器在双端讲话时选择较小的仿射投影阶数,而在收敛时选择较大的仿射投影阶数。因此本方法提出的方法,可以有效解决收敛速度与双端讲话鲁棒性之间的矛盾,从而获得更好的性能。本方法的鲁棒性更强且没有降低其它性能。

Description

一种双端通话鲁棒的变阶变步长仿射投影方法
技术领域
本发明涉及一种仿射投影方法。特别是涉及一种针对于声学回声消除中双端通话问题自适应滤波的双端通话鲁棒的变阶变步长仿射投影方法。
背景技术
声学回声主要是指从扬声器发出的声音被麦克风重新拾取后再次发送到远端形成的回声。声学回声消除器(Acoustic Echo Cancellation,AEC)广泛应用于各种嵌入式设备和各种VoIP应用中,包括各种电信网络设备和终端设备、丰富的软件视频会议和VoIP软件电话等。一般的声学回声消除器至少包含双端通话检测模块(Double Talk Detector,DTD)、线性回声消除两个部分。图1是一个典型的声学回声消除器。麦克风在时刻n接收的信号为:
d(n)=y(n)+v(n)+w(n) 1.1
式中:d(n)代表麦克风信号,y(n)代表输入信号x(n)经过扬声器播放后产生的回声信号,v(n)代表近端语音信号,w(n)代表近端噪声信号。输入信号x(n)经过系统传递函数h滤波后形成回声
y(n)=x(n)T*h 1.2
其中,
h=[h0(n),h1(n),...,hN(n)]T 1.3
x(n)=[x(n),x(n-1),...,x(n-N+1)]T 1.4
x(n)是输入信号向量,N为回声路径长度,T代表矩阵的转置。
回声消除的目标就是设计一个自适应有限冲击响应滤波器估计出介于麦克风与扬声器之间的回声路径然后根据这一估计路径得到回声估计值将其从d(n)中消除,从而保留v(n)。
e(n)代表线性回声滤波器消除后得到的误差信号,其中,
L为自适应滤波器长度,实际中一般L<N。一般认为,声学回声消除器处理的场景分为三种情况:远端情况,只存在回声信号而不存在近端语音信号;近端情况,不存在回声,只存在近端语音信号;双端通话情况,回声信号与近端语音信号同时存在。
线性回声消除器主要依靠自适应算法来估计回声路径,由于仿射投影算法(Affine Projection Algorithm,APA)能够在收敛速度和计算复杂度之间取得较好折衷而被广泛应用,其更新方程是
其中μ为自适应滤波器的步长,为单位矩阵,Kmax为投影阶数最大值,为输入信号矩阵,δ为以常数称为正则化因子,为前验误差信号向量,计算方法是
其中d(n)=[d(n),...,d(n-Kmax+1)]T
近几年,有人考虑了近端信号的变化,提出将步长μ替换为对角矩阵μ(n),表示为:
其更新方程是
其中
l=0,1,...,Kmax-1,λ=1-1/(6*N)。代表麦克风信号功率估计,代表回声信号功率估计,代表误差信号功率估计。
该算法虽然对于近端信号有一定的鲁棒性,但是随着仿射投影阶数的增大,该方法的收敛速度将提升,而鲁棒性会变差。
发明内容
本发明所要解决的技术问题是,提供一种在声学回声消除中自适应地调整仿射投影阶数,使之既能取得较快的收敛速度,又能取得较好的双端通话鲁棒性的双端通话鲁棒的变阶变步长仿射投影方法。
本发明所采用的技术方案是:一种双端通话鲁棒的变阶变步长仿射投影方法,包括如下步骤:
1)初始化滤波器的参数:
将滤波器系数麦克风信号功率估计回声信号功率估计误差信号功率估计均初始化为0,对步长μ、正则化因子δ、双端讲话状态仿射投影阶数Ks和最大仿射投影阶数Kmax进行初始化;
2)更新输入信号与麦克风信号:
获取当前时刻麦克风信号d(n)和输入信号x(n),并更新至麦克风信号向量d(n)和输入信号向量x(n)中,其中,所述的麦克风信号向量d(n)表示为d(n)=[d(n),...,d(n-Kmax+1)]T,所述的输入信号向量x(n)表示为x(n)=[x(n),x(n-1),...,x(n-N+1)]T,N为回声路径长度,T代表矩阵的转置;
3)计算先验信息:
根据前一时刻估计的滤波器系数计算出先验误差信号矩阵和回声信号所述的先验误差信号矩阵其中,是输入信号矩阵,所述的回声信号
计算当前时刻的麦克风信号功率估计回声信号功率估计和误差信号功率估计
4)计算步长:
根据当前时刻的麦克风信号功率估计回声信号功率估计和误差信号功率估计获得当前时刻的步长矩阵μ(n)如下:
其中,
式中,l=0,1,...,Kmax-1;
5)长自信息及其相关计算:
利用步骤4)得到的当前时刻的步长矩阵μ(n),计算步长自信息量I(μl(n)),
l=0,1,...,Kmax-1,然后求出第一个步长自信息量在整个步长矩阵中所占比例prop0(n),
6)确定仿射投影阶数:
若第一个步长自信息量所占比例prop0(n)小于1/Kmax-ε,则认为自适应滤波器处于双端讲话状态,令仿射投影阶数Kn=Ks,其中ε为常数称为约束因子;
7)更新滤波器系数:
根据仿射投影阶数Kn,选择对应长度的输入信号矩阵先验误差信号矩阵和步长矩阵代入下式进行滤波器的更新:
步骤3)所述的计算当前时刻的麦克风信号功率估计公式如下:
所述的计算当前时刻的回声信号功率估计公式如下:
所述的计算当前时刻的误差信号功率估计公式如下:
其中,l=0,1,...,Kmax-1,λ=1-1/(6*N)。
本发明的一种双端通话鲁棒的变阶变步长仿射投影方法,用于声学回声消除器,能够使声学回声消除器在双端讲话时选择较小的仿射投影阶数,而在收敛时选择较大的仿射投影阶数。因此本方法提出的方法,可以有效解决收敛速度与双端讲话鲁棒性之间的矛盾,从而获得更好的性能。本方法的鲁棒性更强且没有降低其它性能。
附图说明
图1是典型的声学回声消除系统;
图2是本发吸的方法与其它方法的性能对比;
图3是本发吸的方法与其它方法的性能对比。
具体实施方式
下面结合实施例和附图对本发明的一种双端通话鲁棒的变阶变步长仿射投影方法做出详细说明。
本发明的一种双端通话鲁棒的变阶变步长仿射投影方法,主要解决在声学回声消除中滤波器受双端讲话影响而发散问题。本发明通过定义的步长自信息量自适应地调整仿射投影阶数,使之能够在双端讲话时维持较小的仿射投影阶数,获得较好的鲁棒性。而在收敛时使用较大的仿射投影阶数,获得较快的收敛速度。
本发明的一种双端通话鲁棒的变阶变步长仿射投影方法,包括如下步骤:
1)初始化滤波器的参数:
将滤波器系数麦克风信号功率估计回声信号功率估计误差信号功率估计均初始化为0,对步长μ、正则化因子δ、双端讲话状态仿射投影阶数Ks和最大仿射投影阶数Kmax进行初始化;
本发明实施例设定对数:滤波器系数近端信号功率估计回声信号功率估计误差信号功率估计双端讲话仿射投影阶数Ks=2,约束因子ε=1/(5Kmax),最大仿射投影阶数Kmax=8,滤波器长度N=1024,正则化因子其中λ=1-1/(6N)。近端信号中加入信噪比20dB的独立平稳高斯白噪声。
2)更新输入信号与麦克风信号:
获取当前时刻麦克风信号d(n)和输入信号x(n),并更新至麦克风信号向量d(n)和输入信号向量x(n)中,其中,所述的麦克风信号向量d(n)表示为d(n)=[d(n),...,d(n-Kmax+1)]T,所述的输入信号向量x(n)表示为x(n)=[x(n),x(n-1),...,x(n-N+1)]T,N为回声路径长度,T代表矩阵的转置;
3)计算先验信息:
根据前一时刻估计的滤波器系数计算出先验误差信号矩阵和回声信号所述的先验误差信号矩阵其中,是输入信号矩阵,所述的回声信号
计算当前时刻的麦克风信号功率估计回声信号功率估计和误差信号功率估计其中
所述的计算当前时刻的麦克风信号功率估计公式如下:
所述的计算当前时刻的回声信号功率估计公式如下:
所述的计算当前时刻的误差信号功率估计公式如下:
其中,l=0,1,...,Kmax-1,λ=1-1/(6*N)。
4)计算步长:
根据当前时刻的麦克风信号功率估计回声信号功率估计和误差信号功率估计获得当前时刻的步长矩阵μ(n)如下:
其中,
式中,l=0,1,...,Kmax-1;
5)长自信息及其相关计算:
利用步骤4)得到的当前时刻的步长矩阵μ(n),计算步长自信息量I(μl(n)),
l=0,1,...,Kmax-1,然后求出第一个步长自信息量在整个步长矩阵中所占比例prop0(n),
6)确定仿射投影阶数:
若第一个步长自信息量所占比例prop0(n)小于1/Kmax-ε,则认为自适应滤波器处于双端讲话状态,令仿射投影阶数Kn=Ks,其中ε为常数称为约束因子;
7)更新滤波器系数:
根据仿射投影阶数Kn,选择对应长度的输入信号矩阵先验误差信号矩阵和步长矩阵代入下式进行滤波器的更新:
如图2、图3所示,图中黑色实线代表本方法的失调曲线。可以明显看出,本方法的鲁棒性更强且没有降低其它性能。

Claims (2)

1.一种双端通话鲁棒的变阶变步长仿射投影方法,其特征在于,包括如下步骤:
1)初始化滤波器的参数:
将滤波器系数麦克风信号功率估计回声信号功率估计误差信号功率估计均初始化为0,对步长μ、正则化因子δ、双端讲话状态仿射投影阶数Ks和最大仿射投影阶数Kmax进行初始化;
2)更新输入信号与麦克风信号:
获取当前时刻麦克风信号d(n)和输入信号x(n),并更新至麦克风信号向量d(n)和输入信号向量x(n)中,其中,所述的麦克风信号向量d(n)表示为d(n)=[d(n),...,d(n-Kmax+1)]T,所述的输入信号向量x(n)表示为x(n)=[x(n),x(n-1),...,x(n-N+1)]T,N为回声路径长度,T代表矩阵的转置;
3)计算先验信息:
根据前一时刻估计的滤波器系数计算出先验误差信号矩阵和回声信号所述的先验误差信号矩阵其中,是输入信号矩阵,所述的回声信号
计算当前时刻的麦克风信号功率估计回声信号功率估计和误差信号功率估计
4)计算步长:
根据当前时刻的麦克风信号功率估计回声信号功率估计和误差信号功率估计获得当前时刻的步长矩阵μ(n)如下:
其中,
式中,l=0,1,...,Kmax-1;
5)步长自信息量及其相关计算:
利用步骤4)得到的当前时刻的步长矩阵μ(n),计算步长自信息量I(μl(n)),
l=0,1,...,Kmax-1,然后求出第一个步长自信息量在整个步长矩阵中所占比例prop0(n),
6)确定仿射投影阶数:
若第一个步长自信息量所占比例prop0(n)小于1/Kmax-ε,则认为自适应滤波器处于双端讲话状态,令仿射投影阶数Kn=Ks,其中ε为常数称为约束因子;
7)更新滤波器系数:
根据仿射投影阶数Kn,选择对应长度的输入信号矩阵先验误差信号矩阵和步长矩阵代入下式进行滤波器的更新:
2.根据权利要求1所述的一种双端通话鲁棒的变阶变步长仿射投影方法,其特征在于,步骤3)所述的计算当前时刻的麦克风信号功率估计公式如下:
所述的计算当前时刻的回声信号功率估计公式如下:
所述的计算当前时刻的误差信号功率估计公式如下:
其中,l=0,1,...,Kmax-1,λ=1-1/(6*N)。
CN201610858354.9A 2016-09-28 2016-09-28 一种双端通话鲁棒的变阶变步长仿射投影方法 Expired - Fee Related CN106448695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610858354.9A CN106448695B (zh) 2016-09-28 2016-09-28 一种双端通话鲁棒的变阶变步长仿射投影方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610858354.9A CN106448695B (zh) 2016-09-28 2016-09-28 一种双端通话鲁棒的变阶变步长仿射投影方法

Publications (2)

Publication Number Publication Date
CN106448695A CN106448695A (zh) 2017-02-22
CN106448695B true CN106448695B (zh) 2019-09-03

Family

ID=58171013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610858354.9A Expired - Fee Related CN106448695B (zh) 2016-09-28 2016-09-28 一种双端通话鲁棒的变阶变步长仿射投影方法

Country Status (1)

Country Link
CN (1) CN106448695B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107105111B (zh) * 2017-03-15 2019-08-02 西南交通大学 一种组合步长成比例仿射投影回声消除方法
CN107452393B (zh) * 2017-07-27 2020-09-11 桂林电子科技大学 一种回声消除系统及方法
CN107749304B (zh) * 2017-09-07 2021-04-06 电信科学技术研究院 有限冲激响应滤波器系数矢量的可持续更新方法及装置
CN109040497B (zh) * 2018-07-24 2020-12-25 西南交通大学 一种基于m估计的成比例类仿射投影自适应回声消除方法
CN109754813B (zh) * 2019-03-26 2020-08-25 南京时保联信息科技有限公司 基于快速收敛特性的变步长回声消除方法
CN111508464B (zh) * 2020-04-14 2023-07-14 深圳市友杰智新科技有限公司 滤波参数自更新方法、滤波器、设备和存储介质
CN112886947B (zh) * 2021-01-26 2024-03-22 苏州大学 一种变步长鲁棒仿射投影自适应滤波器

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1521240A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Speech coding method applying echo cancellation by modifying the codebook gain
CN101866652A (zh) * 2010-05-11 2010-10-20 天津大学 一种语音降噪方法
CN101901601A (zh) * 2010-05-17 2010-12-01 天津大学 一种车内降噪语音通讯的方法与系统
CN105788605B (zh) * 2016-04-26 2019-03-22 西南交通大学 一种基于正交变换的仿射投影符号回声消除方法

Also Published As

Publication number Publication date
CN106448695A (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
CN106448695B (zh) 一种双端通话鲁棒的变阶变步长仿射投影方法
CN105577961B (zh) 增益控制器的自动调谐
CN109754813B (zh) 基于快速收敛特性的变步长回声消除方法
US8842851B2 (en) Audio source localization system and method
US8098812B2 (en) Method of controlling an adaptation of a filter
US6928160B2 (en) Estimating bulk delay in a telephone system
CN110197669B (zh) 一种语音信号处理方法及装置
CN106713570B (zh) 一种回声消除方法和装置
CN106657507B (zh) 一种声学回声消除方法及装置
CN102160296B (zh) 双端通话检测方法及装置
US8073132B2 (en) Echo canceler and echo canceling program
EP2936693A1 (en) Method for controlling acoustic echo cancellation and audio processing apparatus
WO2005125168A1 (en) Echo canceling apparatus, telephone set using the same, and echo canceling method
US9246545B1 (en) Adaptive estimation of delay in audio systems
KR20160016880A (ko) 에코 제거
CN111742541B (zh) 声学回波抵消方法、装置、存储介质
CN110956975B (zh) 回声消除方法及装置
CN110992923B (zh) 回声消除方法、电子设备以及存储装置
CN108877824B (zh) 一种跟踪性能高的组合步长回声消除方法
US8983057B1 (en) Step size control for acoustic echo cancellation
CN111355855B (zh) 回声处理方法、装置、设备及存储介质
CN108540680B (zh) 讲话状态的切换方法及装置、通话系统
CN106409307B (zh) 一种具有选择进化仿射投影阶数的仿射投影方法
CN106060295B (zh) 一种凸组合系数差的成比例仿射投影回声消除方法
US10498389B2 (en) Echo canceller device and voice telecommunications device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210302

Address after: 075300 No.1 Huayuan Road, Xiahuayuan District, Zhangjiakou City, Hebei Province

Patentee after: Zhangjiakou Yibi Yike Technology Service Co.,Ltd.

Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92

Patentee before: Tianjin University

TR01 Transfer of patent right
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221014

Address after: 075300 No. 208, building 2, No. 1, Huayuan Road, Xiahuayuan District, Zhangjiakou City, Hebei Province

Patentee after: Zhangjiakou Yiyan Yixing Technology Co.,Ltd.

Address before: 075300 No.1 Huayuan Road, Xiahuayuan District, Zhangjiakou City, Hebei Province

Patentee before: Zhangjiakou Yibi Yike Technology Service Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230901

Address after: 065000 Teacher Apartment 21-1-401, Dongfang University City, Economic and Technological Development Zone, Langfang City, Hebei Province

Patentee after: Langfang Rongcheng Technology Service Co.,Ltd.

Address before: 075300 No. 208, building 2, No. 1, Huayuan Road, Xiahuayuan District, Zhangjiakou City, Hebei Province

Patentee before: Zhangjiakou Yiyan Yixing Technology Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190903