CN112700788A - 回声消除中回声路径的建模方法、装置、设备及存储介质 - Google Patents
回声消除中回声路径的建模方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112700788A CN112700788A CN202011544179.9A CN202011544179A CN112700788A CN 112700788 A CN112700788 A CN 112700788A CN 202011544179 A CN202011544179 A CN 202011544179A CN 112700788 A CN112700788 A CN 112700788A
- Authority
- CN
- China
- Prior art keywords
- echo path
- audio signal
- current
- audio
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000006870 function Effects 0.000 claims abstract description 161
- 230000005236 sound signal Effects 0.000 claims abstract description 119
- 230000008859 change Effects 0.000 claims abstract description 45
- 238000012937 correction Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 20
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种回声消除中回声路径的建模方法、装置、设备及存储介质,所述方法包括:在第一预设增益范围内播放第一音频信号,在第二预设增益范围内对第一音频信号进行接收,得到第二音频信号;根据第一音频信号和第二音频信号计算得到接收端在不同增益组合下对应的回声路径固定函数;获取当前增益组合,根据当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;在当前增益组合下播放第三音频信号,在当前增益组合下对第三音频信号进行接收,得到第四音频信号,并计算得到当前回声路径变化函数;根据当前回声路径固定函数和当前回声路径变化函数计算得到当前回声路径误差函数。本发明能够有效提高自适应滤波器的回声消除效果。
Description
技术领域
本发明涉及语音处理技术领域,尤其涉及一种回声消除中回声路径的建模方法、装置、设备及存储介质。
背景技术
自适应滤波器是回声消除模块中的重要模块。自适应滤波器最重要的作用是对回声路径进行建模,即“模仿”出一个尽可能像的回声路径w(n),参见图1,是自适应滤波器对回声路径进行建模的过程示意图。通信过程中真实的回声路径主要包括三个部分(即主要有三个步骤会使原始信号x(n)发生改变):扬声器播放音频、音频在空气声学环境中的传播和麦克风接收音频,令这三个部分的系统函数分别为ws(n)、wa(n)和wm(n),则w(n)=ws(n)*wa(n)*wm(n),其中“*”代表信号与系统中的卷积运算,而经过回声路径w(n)后,输出y(n)=x(n)*w(n)。在三个系统响应ws(n)、wa(n)和wm(n)中,ws(n)和wm(n)是由扬声器和麦克风自身硬件特性决定的,而wa(n)受声学环境影响较大。
本申请的发明人在实施本发明的过程中发现,现有技术存在如下问题:
在自适应滤波器刚开始工作,或滤波器重置后,存在6~7秒以上的学习时间,即在学习期间,自适应滤波器的回声消除效果较差;并且,如果声学环境较为复杂,自适应滤波器会出现无法收敛到一个较优值的情况。
发明内容
本发明实施例提供一种回声消除中回声路径的建模方法、装置、设备及存储介质,能够有效提高自适应滤波器的回声消除效果。
为实现上述目的,本发明实施例提供了一种回声消除中回声路径的建模方法,包括:
控制接收端的音频输出单元在第一预设增益范围内播放第一音频信号,以及控制所述接收端的音频输入单元在第二预设增益范围内对所述第一音频信号进行接收,得到第二音频信号;
根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数;
获取所述接收端的音频输出单元和音频输入单元的当前增益组合;
根据所述当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;
控制所述接收端的音频输出单元在所述当前增益组合下播放第三音频信号,以及控制所述接收端的音频输入单元在所述当前增益组合下对所述第三音频信号进行接收,得到第四音频信号;
根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数;
根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数。
优选地,所述根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数,具体包括:
根据如下公式更新得到所述回声路径固定函数:
et(n)=dt(n)-xt T(n)wt *(n);
wt(n+1)=wt(n)+2μtxt(n)/(xt H(n)xt(n))et *(n);
其中,dt(n)表示第n个时刻的第二音频信号,xt(n)表示第n个时刻的第一音频信号,xt T(n)表示xt(n)的转置,xt H(n)表示为xt(n)的共轭转置,wt(n)表示第n个时刻的回声固定路径固定函数,wt *(n)表示wt(n)的共轭,et(n)表示第一误差信号,et *(n)表示et(n)的共轭,μt为常数。
优选地,所述根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数,具体包括:
根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号;
根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数。
优选地,所述根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号,具体包括:
根据如下公式计算得到所述第三音频校正信号:
xc(n)=x0(n)*wt0(n);
其中,x0(n)表示第n个时刻的第三音频信号,wt0(n)表示第n个时刻的当前回声路径固定函数,xc(n)表示第n个时刻的第三音频校正信号。
优选地,所述根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数,具体包括:
根据如下公式更新得到所述当前回声路径变化函数:
ec(n)=dc(n)-xc T(n)wc *(n);
wc(n+1)=wc(n)+2μcxc(n)/(xc H(n)xc(n))ec *(n);
其中,dc(n)表示第n个时刻的第四音频信号,xc T(n)表示xc(n)的转置,xc H(n)表示xc(n)的共轭转置,wc(n)表示第n个时刻的当前回声路径变化函数,wc *(n)表示wc(n)的共轭,ec(n)表示第二误差信号,ec *(n)表示ec(n)的共轭,μc为常数。
优选地,所述根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数,具体包括:
将所述当前回声路径固定函数与所述当前回声路径变化函数做卷积运算,得到所述当前回声路径误差函数。
本发明实施例还提供一种回声消除中回声路径的建模装置,包括:
第一信号生成模块,用于控制接收端的音频输出单元在第一预设增益范围内播放第一音频信号,以及控制所述接收端的音频输入单元在第二预设增益范围内对所述第一音频信号进行接收,得到第二音频信号;
回声路径固定函数生成模块,用于根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数;
增益组合获取模块,用于获取所述接收端的音频输出单元和音频输入单元的当前增益组合;
回声路径固定函数获取模块,用于根据所述当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;
第二信号生成模块,用于控制所述接收端的音频输出单元在所述当前增益组合下播放第三音频信号,以及控制所述接收端的音频输入单元在所述当前增益组合下对所述第三音频信号进行接收,得到第四音频信号;
回声路径变化函数生成模块,用于根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数;
回声路径误差函数生成模块,用于根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数。
本发明另一实施例对应提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述的回声消除中回声路径的建模方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任一项所述的回声消除中回声路径的建模方法。
与现有技术相比,本发明实施例提供的一种回声消除中回声路径的建模方法、装置、设备及存储介质,能够在回声路径变化函数的学习期间也能保证一定的回声消除效果,并且减小回声路径变化函数的动态环境建模压力,有效提高自适应滤波器的回声消除效果和稳定性。
附图说明
图1是自适应滤波器对回声路径进行建模的过程示意图;
图2是本发明提供的回声消除中回声路径的建模方法的一个实施例的流程示意图;
图3是本发明提供的回声消除中回声路径的建模装置的一个实施例的结构示意图;
图4是本发明提供的终端设备的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图2,是本发明提供的回声消除中回声路径的建模方法的一个实施例的流程示意图,方法包括步骤S11至步骤S17:
S11、控制接收端的音频输出单元在第一预设增益范围内播放第一音频信号,以及控制所述接收端的音频输入单元在第二预设增益范围内对所述第一音频信号进行接收,得到第二音频信号;
具体地,通过在第一预设增益范围内播放第一音频信号以及在第二预设增益范围内对第一音频信号进行接收,得到第二音频信号,能够获得真实的传播路径。
S12、根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数;
进一步地,根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数,具体包括:
根据如下公式更新得到所述回声路径固定函数:
et(n)=dt(n)-xt T(n)wt *(n);
wt(n+1)=wt(n)+2μtxt(n)/(xt H(n)xt(n))et *(n);
其中,dt(n)表示第n个时刻的第二音频信号,xt(n)表示第n个时刻的第一音频信号,xt T(n)表示xt(n)的转置,xt H(n)表示为xt(n)的共轭转置,wt(n)表示第n个时刻的回声固定路径固定函数,wt *(n)表示wt(n)的共轭,et(n)表示第一误差信号,et *(n)表示et(n)的共轭,μt为常数。
具体地,迭代时wt(n)的初始值为0,μt的取值范围0~1,一般可取0.2。
具体地,通过公式et(n)=dt(n)-xt T(n)wt *(n)估算出第一误差信号et(n),并更新回声路径固定函数wt(n)。当wt(n)满足一定的收敛条件时,认为此时自适应滤波器已收敛,并记录下此时的回声路径固定函数wt(n),在具体的实施方式中,收敛条件可以为第一误差信号较小或两次更新间回声路径固定函数差异不大等。
具体地,通过真实的传播路径得到符合真实回声路径的固定成分,即回声路径固定函数。
S13、获取所述接收端的音频输出单元和音频输入单元的当前增益组合;
具体地,音频输出单元可以为扬声器,音频输入单元可以为麦克风,则(扬声器,麦克风)即为一个增益组合。对每一种(扬声器,麦克风)增益组合,不断在扬声器端播出任意音频,并由麦克风采集到对应输出音频。
具体地,假设扬声器及麦克风的可调增益范围为0~100,共有10000种组合情况,在具体的实施方式中可选定增益间隔为10,可得到100种组合,假设回声路径固定函数wt(n)的阶数为M,M的阶数可以由具体实施过程确定出一个较优的解,阶数一旦确定,后续都不再改变。
S14、根据所述当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;
在具体的实施方式中,从上层获取到当前扬声器与麦克风实际增益值,如果之前实验时增益有取样间隔(例如上文所举例的间隔10),则采取向下取整的方式避免“过削”,例如,采样增益间隔为10,实际中用户配置的是(72,85),则加载(70,80)对应的回声路径固定函数wt(n)作为当前回声路径固定函数。
S15、控制所述接收端的音频输出单元在所述当前增益组合下播放第三音频信号,以及控制所述接收端的音频输入单元在所述当前增益组合下对所述第三音频信号进行接收,得到第四音频信号;
S16、根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数;
进一步地,根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数,具体包括:
根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号;
根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数。
进一步地,根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号,具体包括:
根据如下公式计算得到所述第三音频校正信号:
xc(n)=x0(n)*wt0(n);
其中,x0(n)表示第n个时刻的第三音频信号,wt0(n)表示第n个时刻的当前回声路径固定函数,xc(n)表示第n个时刻的第三音频校正信号。
进一步地,根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数,具体包括:
根据如下公式更新得到所述当前回声路径变化函数:
ec(n)=dc(n)-xc T(n)wc *(n);
wc(n+1)=wc(n)+2μcxc(n)/(xc H(n)xc(n))ec *(n);
其中,dc(n)表示第n个时刻的第四音频信号,xc T(n)表示xc(n)的转置,xc H(n)表示xc(n)的共轭转置,wc(n)表示第n个时刻的当前回声路径变化函数,wc *(n)表示wc(n)的共轭,ec(n)表示第二误差信号,ec *(n)表示ec(n)的共轭,μc为常数。
具体地,迭代时wc(n)的初始值为0,μc的取值范围0~1,一般可取0.2。
S17、根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数。
进一步地,根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数,具体包括:
将所述当前回声路径固定函数与所述当前回声路径变化函数做卷积运算,得到所述当前回声路径误差函数。
参见图3,是本发明提供的回声消除中回声路径的建模装置的一个实施例的结构示意图,装置包括:
第一信号生成模块21,用于控制接收端的音频输出单元在第一预设增益范围内播放第一音频信号,以及控制所述接收端的音频输入单元在第二预设增益范围内对所述第一音频信号进行接收,得到第二音频信号;
回声路径固定函数生成模块22,用于根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数;
增益组合获取模块23,用于获取所述接收端的音频输出单元和音频输入单元的当前增益组合;
回声路径固定函数获取模块24,用于根据所述当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;
第二信号生成模块25,用于控制所述接收端的音频输出单元在所述当前增益组合下播放第三音频信号,以及控制所述接收端的音频输入单元在所述当前增益组合下对所述第三音频信号进行接收,得到第四音频信号;
回声路径变化函数生成模块26,用于根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数;
回声路径误差函数生成模块27,用于根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数。
进一步地,所述回声路径固定函数生成模块22具体用于:
根据如下公式更新得到所述回声路径固定函数:
et(n)=dt(n)-xt T(n)wt *(n);
wt(n+1)=wt(n)+2μtxt(n)/(xt H(n)xt(n))et *(n);
其中,dt(n)表示第n个时刻的第二音频信号,xt(n)表示第n个时刻的第一音频信号,xt T(n)表示xt(n)的转置,xt H(n)表示为xt(n)的共轭转置,wt(n)表示第n个时刻的回声固定路径固定函数,wt *(n)表示wt(n)的共轭,et(n)表示第一误差信号,et *(n)表示et(n)的共轭,μt为常数。
进一步地,所述回声路径变化函数生成模块26具体包括:
校正单元261,用于根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号;
生成单元262,用于根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数。
进一步地,所述校正单元261具体用于:
根据如下公式计算得到所述第三音频校正信号:
xc(n)=x0(n)*wt0(n);
其中,x0(n)表示第n个时刻的第三音频信号,wt0(n)表示第n个时刻的当前回声路径固定函数,xc(n)表示第n个时刻的第三音频校正信号。
进一步地,所述生成单元262具体用于:
根据如下公式更新得到所述当前回声路径变化函数:
ec(n)=dc(n)-xc T(n)wc *(n);
wc(n+1)=wc(n)+2μcxc(n)/(xc H(n)xc(n))ec *(n);
其中,dc(n)表示第n个时刻的第四音频信号,xc T(n)表示xc(n)的转置,xc H(n)表示xc(n)的共轭转置,wc(n)表示第n个时刻的当前回声路径变化函数,wc *(n)表示wc(n)的共轭,ec(n)表示第二误差信号,ec *(n)表示ec(n)的共轭,μc为常数。
进一步地,所述回声路径误差函数生成模块27具体用于:
将所述当前回声路径固定函数与所述当前回声路径变化函数做卷积运算,得到所述当前回声路径误差函数。
本发明实施例所提供的一种回声消除中回声路径的建模装置能够实现上述任一实施例的回声消除中回声路径的建模方法的所有流程,装置中的各个模块、单元的作用以及实现的技术效果分别与上述实施例的回声消除中回声路径的建模方法的作用以及实现的技术效果对应相同,这里不再赘述。
参见图4,是本发明提供的终端设备的一个实施例的结构示意图,所述终端设备包括处理器41、存储器42以及存储在存储器42中且被配置为由处理器41执行的计算机程序,所述处理器41执行所述计算机程序时实现上述任一实施例的回声消除中回声路径的建模方法。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器42中,并由处理器41执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在所述终端设备中的执行过程。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,示意图4仅是一种终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备还可以包括输入输出设备、网络接入设备、总线等。
处理器41可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者处理器41也可以是任何常规的处理器等,处理器41是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。
存储器42可用于存储所述计算机程序和/或模块,处理器41通过运行或执行存储在存储器42内的计算机程序和/或模块,以及调用存储在存储器42内的数据,实现所述终端设备的各种功能。存储器42可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器42可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述终端设备集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述任一实施例所述的回声消除中回声路径的建模方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述任一实施例所述的回声消除中回声路径的建模方法的步骤。其中,上述计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
综上,本发明实施例所提供的一种回声消除中回声路径的建模方法、装置、设备及存储介质,通过在第一预设增益范围内播放第一音频信号以及在第二预设增益范围内对对第一音频信号进行接收,得到第二音频信号,获得真实的传播路径,并从而获得不同增益组合下对应的回声路径固定函数,实现了回声路径中固定成分的模拟;通过获取接收端的音频输出单元和音频输入单元的当前增益组合,获取了对应的回声路径固定函数,能够得到更符合实际组合情况的回声路径固定函数,能够在回声路径变化函数的学习期间也能保证一定的回声消除效果,并且减小回声路径变化函数的动态环境建模压力;通过当前回声路径固定函数和第三音频信号得到第三音频校正信号,从而根据第三音频校正信号和第四音频信号计算得到当前回声路径变化函数和第四音频信号计算得到当前回声路径变化函数,并根据当前回声路径固定函数和当前回声路径变化函数计算得到当前回声路径误差函数,有效提高了本申请实施例提供的一种回声消除中回声路径的建模方法下回声的消除效果和稳定性。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (9)
1.一种回声消除中回声路径的建模方法,其特征在于,包括:
控制接收端的音频输出单元在第一预设增益范围内播放第一音频信号,以及控制所述接收端的音频输入单元在第二预设增益范围内对所述第一音频信号进行接收,得到第二音频信号;
根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数;
获取所述接收端的音频输出单元和音频输入单元的当前增益组合;
根据所述当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;
控制所述接收端的音频输出单元在所述当前增益组合下播放第三音频信号,以及控制所述接收端的音频输入单元在所述当前增益组合下对所述第三音频信号进行接收,得到第四音频信号;
根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数;
根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数。
2.根据权利要求1所述的回声消除中回声路径的建模方法,其特征在于,所述根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数,具体包括:
根据如下公式更新得到所述回声路径固定函数:
et(n)=dt(n)-xt T(n)wt *(n);
wt(n+1)=wt(n)+2μtxt(n)/(xt H(n)xt(n))et *(n);
其中,dt(n)表示第n个时刻的第二音频信号,xt(n)表示第n个时刻的第一音频信号,xt T(n)表示xt(n)的转置,xt H(n)表示为xt(n)的共轭转置,wt(n)表示第n个时刻的回声固定路径固定函数,wt *(n)表示wt(n)的共轭,et(n)表示第一误差信号,et *(n)表示et(n)的共轭,μt为常数。
3.根据权利要求1所述的回声消除中回声路径的建模方法,其特征在于,所述根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数,具体包括:
根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号;
根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数。
4.根据权利要求3所述的回声消除中回声路径的建模方法,其特征在于,所述根据所述当前回声路径固定函数和所述第三音频信号计算得到第三音频校正信号,具体包括:
根据如下公式计算得到所述第三音频校正信号:
xc(n)=x0(n)*wt0(n);
其中,x0(n)表示第n个时刻的第三音频信号,wt0(n)表示第n个时刻的当前回声路径固定函数,xc(n)表示第n个时刻的第三音频校正信号。
5.根据权利要求4所述的回声消除中回声路径的建模方法,其特征在于,所述根据所述第三音频校正信号和所述第四音频信号计算得到所述当前回声路径变化函数,具体包括:
根据如下公式更新得到所述当前回声路径变化函数:
ec(n)=dc(n)-xc T(n)wc *(n);
wc(n+1)=wc(n)+2μcxc(n)/(xc H(n)xc(n))ec *(n);
其中,dc(n)表示第n个时刻的第四音频信号,xc T(n)表示xc(n)的转置,xc H(n)表示xc(n)的共轭转置,wc(n)表示第n个时刻的当前回声路径变化函数,wc *(n)表示wc(n)的共轭,ec(n)表示第二误差信号,ec *(n)表示ec(n)的共轭,μc为常数。
6.根据权利要求1所述的回声消除中回声路径的建模方法,其特征在于,所述根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数,具体包括:
将所述当前回声路径固定函数与所述当前回声路径变化函数做卷积运算,得到所述当前回声路径误差函数。
7.一种回声消除中回声路径的建模装置,其特征在于,包括:
第一信号生成模块,用于控制接收端的音频输出单元在第一预设增益范围内播放第一音频信号,以及控制所述接收端的音频输入单元在第二预设增益范围内对所述第一音频信号进行接收,得到第二音频信号;
回声路径固定函数生成模块,用于根据所述第一音频信号和所述第二音频信号计算得到所述接收端在不同增益组合下对应的回声路径固定函数;
增益组合获取模块,用于获取所述接收端的音频输出单元和音频输入单元的当前增益组合;
回声路径固定函数获取模块,用于根据所述当前增益组合获取对应的回声路径固定函数,得到当前回声路径固定函数;
第二信号生成模块,用于控制所述接收端的音频输出单元在所述当前增益组合下播放第三音频信号,以及控制所述接收端的音频输入单元在所述当前增益组合下对所述第三音频信号进行接收,得到第四音频信号;
回声路径变化函数生成模块,用于根据所述当前回声路径固定函数、所述第三音频信号和所述第四音频信号计算得到当前回声路径变化函数;
回声路径误差函数生成模块,用于根据所述当前回声路径固定函数和所述当前回声路径变化函数计算得到当前回声路径误差函数。
8.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的回声消除中回声路径的建模方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至6中任意一项所述的回声消除中回声路径的建模方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011544179.9A CN112700788B (zh) | 2020-12-23 | 2020-12-23 | 回声消除中回声路径的建模方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011544179.9A CN112700788B (zh) | 2020-12-23 | 2020-12-23 | 回声消除中回声路径的建模方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112700788A true CN112700788A (zh) | 2021-04-23 |
CN112700788B CN112700788B (zh) | 2024-05-03 |
Family
ID=75509477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011544179.9A Active CN112700788B (zh) | 2020-12-23 | 2020-12-23 | 回声消除中回声路径的建模方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112700788B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113311391A (zh) * | 2021-04-25 | 2021-08-27 | 普联国际有限公司 | 基于麦克风阵列的声源定位方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101087320A (zh) * | 2006-06-07 | 2007-12-12 | 米特尔网络公司 | 声学回波消除器中检测回波路径变化的改进方法和装置 |
US7660425B1 (en) * | 1999-05-25 | 2010-02-09 | British Telecommunications Plc | Acoustic echo cancellation |
US20160019909A1 (en) * | 2013-03-15 | 2016-01-21 | Dolby Laboratories Licensing Corporation | Acoustic echo mitigation apparatus and method, audio processing apparatus and voice communication terminal |
CN108140380A (zh) * | 2015-08-20 | 2018-06-08 | 思睿逻辑国际半导体有限公司 | 具有部分地由固定响应滤波器提供的反馈响应的自适应消噪反馈控制器及方法 |
CN110310654A (zh) * | 2019-07-26 | 2019-10-08 | 歌尔科技有限公司 | 回声消除方法及装置、电子设备、可读存储介质 |
CN110956973A (zh) * | 2018-09-27 | 2020-04-03 | 深圳市冠旭电子股份有限公司 | 一种回声消除方法、装置及智能终端 |
CN111798862A (zh) * | 2020-06-16 | 2020-10-20 | 普联技术有限公司 | 音频降噪方法、系统、设备及存储介质 |
-
2020
- 2020-12-23 CN CN202011544179.9A patent/CN112700788B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7660425B1 (en) * | 1999-05-25 | 2010-02-09 | British Telecommunications Plc | Acoustic echo cancellation |
CN101087320A (zh) * | 2006-06-07 | 2007-12-12 | 米特尔网络公司 | 声学回波消除器中检测回波路径变化的改进方法和装置 |
US20160019909A1 (en) * | 2013-03-15 | 2016-01-21 | Dolby Laboratories Licensing Corporation | Acoustic echo mitigation apparatus and method, audio processing apparatus and voice communication terminal |
CN108140380A (zh) * | 2015-08-20 | 2018-06-08 | 思睿逻辑国际半导体有限公司 | 具有部分地由固定响应滤波器提供的反馈响应的自适应消噪反馈控制器及方法 |
CN110956973A (zh) * | 2018-09-27 | 2020-04-03 | 深圳市冠旭电子股份有限公司 | 一种回声消除方法、装置及智能终端 |
CN110310654A (zh) * | 2019-07-26 | 2019-10-08 | 歌尔科技有限公司 | 回声消除方法及装置、电子设备、可读存储介质 |
CN111798862A (zh) * | 2020-06-16 | 2020-10-20 | 普联技术有限公司 | 音频降噪方法、系统、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
MASAHIRO FUKUI,ET AL.: "Acoustic echo canceller software for voip hands-free application on smartphone and tablet devices", 《IEEE TRANSACTIONS ON CONSUMER ELECTRONICS》, vol. 60, no. 3, 31 August 2014 (2014-08-31), XP011563082, DOI: 10.1109/TCE.2014.6937331 * |
陈林: "会议电话中的实时回声消除算法研究与实现", 《中国优秀硕士学位论文全文库(信息科技辑)》, no. 6, 15 June 2020 (2020-06-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113311391A (zh) * | 2021-04-25 | 2021-08-27 | 普联国际有限公司 | 基于麦克风阵列的声源定位方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112700788B (zh) | 2024-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11276414B2 (en) | Method and device for processing audio signal using audio filter having non-linear characteristics to prevent receipt of echo signal | |
Comminiello et al. | Nonlinear acoustic echo cancellation based on sparse functional link representations | |
Nercessian et al. | Lightweight and interpretable neural modeling of an audio distortion effect using hyperconditioned differentiable biquads | |
CN111951819A (zh) | 回声消除方法、装置及存储介质 | |
CN103229237B (zh) | 信号处理设备、信号处理方法 | |
CN113436643A (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
CN109285554A (zh) | 一种回声消除方法、服务器、终端及系统 | |
CN112201273B (zh) | 一种噪声功率谱密度计算方法、系统、设备及介质 | |
CN112837670B (zh) | 语音合成方法、装置及电子设备 | |
Huemmer et al. | Estimating parameters of nonlinear systems using the elitist particle filter based on evolutionary strategies | |
Van Vaerenbergh et al. | A split kernel adaptive filtering architecture for nonlinear acoustic echo cancellation | |
CN112700788A (zh) | 回声消除中回声路径的建模方法、装置、设备及存储介质 | |
CN110429921B (zh) | 一种变步长lms自适应滤波方法及其存储介质 | |
CN115083431A (zh) | 回声的消除方法、装置、电子设备及计算机可读介质 | |
CN112837695A (zh) | 一种滤波方法、装置、终端及存储介质 | |
CN112201272B (zh) | 音频数据降噪的方法、装置、设备及存储介质 | |
CN111370016B (zh) | 一种回声消除方法及电子设备 | |
CN111968620A (zh) | 算法的测试方法、装置、电子设备及存储介质 | |
CN113393857B (zh) | 一种音乐信号的人声消除方法、设备及介质 | |
CN105957534B (zh) | 自适应滤波方法和自适应滤波器 | |
CN111798862A (zh) | 音频降噪方法、系统、设备及存储介质 | |
CN113299302A (zh) | 音频降噪方法、装置及电子设备 | |
WO2019208137A1 (ja) | 音源分離装置、その方法、およびプログラム | |
CN115762552B (zh) | 训练回声消除模型的方法、回声消除方法及对应装置 | |
CN113689869B (zh) | 语音增强方法、电子设备以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |