CN111654585A - 回声声场状态确定方法及装置、存储介质、终端 - Google Patents
回声声场状态确定方法及装置、存储介质、终端 Download PDFInfo
- Publication number
- CN111654585A CN111654585A CN202010223647.6A CN202010223647A CN111654585A CN 111654585 A CN111654585 A CN 111654585A CN 202010223647 A CN202010223647 A CN 202010223647A CN 111654585 A CN111654585 A CN 111654585A
- Authority
- CN
- China
- Prior art keywords
- signal
- determined
- sound field
- echo
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000008859 change Effects 0.000 claims abstract description 75
- 238000001514 detection method Methods 0.000 claims abstract description 37
- 230000001629 suppression Effects 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 41
- 230000004913 activation Effects 0.000 claims description 32
- 230000003044 adaptive effect Effects 0.000 claims description 10
- 238000012805 post-processing Methods 0.000 claims description 10
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 230000001965 increasing effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 230000002829 reductive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008054 signal transmission Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M7/00—Arrangements for interconnection between switching centres
- H04M7/006—Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
一种回声声场状态确定方法及装置、存储介质、终端,所述方法包括:获取待确定信号;确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k);至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate;至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。本发明可以有效提高对回声路径变化状态判断的准确性,并且有机会采用更多参数对更多回声声场状态进行判断,更有效地实现多特征检测,提高对回声声场状态判断的完整性。
Description
技术领域
本发明涉及声学回声消除技术领域,尤其涉及一种回声声场状态确定方法及装置、存储介质、终端。
背景技术
在实时语音通信与基于IP的语音传输(Voice over Internet Protocol,VOIP)过程中,通信终端扬声器发出的声音,总会被该终端的麦克风拾取到,若是不处理就发送出去,对方总能听到自己说话的声音,体验不佳。在人机交互领域,由于交互终端发出的声音又被麦克风拾取回去,同时拾取了控制者的说话声,若在麦克风拾取信号中不消除交互终端发出的声音,那么交互终端在识别控制者说话声音时将引入很强的干扰,降低了识别的成功率,最终造成交互困难。采用回声消除(Acoustic Echo Canceler,AEC)对回声进行消除是公知的方法,通常的AEC系统包括针对线性回声处理的自适应滤波AF以及针对残留回声处理的非线性部分。
由于回声声场状态的多样性与多变性特点,使得AEC相应技术的鲁棒性与稳定性受到很大的挑战。例如自适应滤波的更新在双讲与无语音场景下若不加以控制,则会面临发散与失调的风险,同时当回声路径发生改变时,若不提高更新速度则会导致收敛速度过慢,造成回声的残留;同样的,在非线性或残留回声处理中,若不对单讲与双进状态加以区分,则往往会导致有效语音的损伤, 使得双讲性能下降。
回声声场状态中双讲状态(Double Talk State,DTS)的检测显得尤为重要,常规的双讲检测(Double Talk Detection,DTD)方法大致分为三类:基于能量的检测、基于相关性的检测以及基于回声路径的检测。其中基于能量的检测最为简单,极度依赖于回声信号强度、近端语音信号强度与背景噪声强度的稳定性,误判率非常高;基于相关性的检测受限于器件的特性,当扬声器非线性失真较大时,该方法的性能急剧下降;基于回声路径的检测,如估计喇叭冲激响应、可变冲击响应等,当回声路径变化时性能变差。
然而,在现有技术中,回声声场状态确定的准确性较低,进而影响回声消除效果。
发明内容
本发明解决的技术问题是提供一种回声声场状态确定方法及装置、存储介质、终端,可以有效提高对回声路径变化状态判断的准确性。
为解决上述技术问题,本发明实施例提供一种回声声场状态确定方法,包括以下步骤:获取待确定信号;确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k);至少根据所述远端信号Xn(k)、近端信号 Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate;至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
可选的,所述的回声声场状态确定方法还包括:至少根据所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为远端单讲状态。
可选的,至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数 Wn(k),确定滤波器更新度Cefupdate包括:根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定残差信号En(k);根据所述残差信号En(k),确定更新后的滤波器系数Wn+1(k);根据所述滤波器系数Wn(k)以及更新后的滤波器系数 Wn+1(k),确定所述滤波器更新度Cefupdate。
可选的,满足以下一项或多项:采用下述公式,确定残差信号En(k):
采用下述公式,确定更新后的滤波器系数Wn+1(k),其中,更新步长μn(k)用于指示所述滤波器系数Wn(k)更新的步长:
采用下述公式,确定滤波器更新度Cefupdate:
可选的,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还包括:对所述近端信号Dn(k)进行语音激活检测,以得到近端语音激活标志DVflag;如果所述近端语音激活标志 DVflag不等于1,则判断所述待确定信号的回声声场状态为空闲状态。
可选的,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还包括:对所述远端信号Xn(k)进行语音激活检测,以得到远端语音激活标志XVflag;如果所述远端语音激活标志 XVflag不等于1,则判断所述待确定信号的回声声场状态为近端单讲状态。
可选的,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还包括:确定所述待确定信号的回波抑制比Err;如果所述回波抑制比Err大于预设回波阈值Thrderr,则判断所述待确定信号的回声声场状态为远端单讲状态。
可选的,确定所述待确定信号的回波抑制比Err包括:根据所述远端信号 Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定残差信号En(k);根据所述近端信号Dn(k)与残差信号En(k),确定信号的回波抑制比Err。
可选的,满足以下一项或多项:采用下述公式,确定残差信号En(k):
采用下述公式,确定信号的回波抑制比Err:
可选的,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还包括:确定归一化互相关值CYE与CDE;如果CDE大于第一预设互相关阈值Thrd1coh,且CYE小于第二预设互相关阈值 Thrd2coh,则判断所述待确定信号的回声声场状态为双讲状态;其中,所述第一预设互相关阈值Thrd1coh大于等于所述第二预设互相关阈值Thrd2coh。
可选的,还包括以下一项或多项:如果滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,则确定所述待确定信号的回声声场状态为回声路径变化状态;如果所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,则确定所述待确定信号的回声声场状态为远端单讲状态。
可选的,采用下述公式,确定归一化互相关值CYE与CDE:
其中,M与L为所述待确定信号的频段索引。
可选的,所述归一化互相关值CYE与CDE为线性区归一化互相关值;其中, M与L为线性区的频段索引。
可选的,所述的回声声场状态确定方法还包括:根据所述待确定信号的回声声场状态,调整所述待确定信号的更新步长μn(k);其中,更新步长μn(k)用于指示所述滤波器系数Wn(k)更新的步长。
可选的,调整更新步长μn(k)包括以下一项或多项:如果确定所述待确定信号的回声声场状态为回声路径变化状态,则增加更新步长μn(k);如果确定所述待确定信号的回声声场状态为双讲状态,则调整μn(k)放慢更新;如果确定所述待确定信号的回声声场状态为空闲状态或近端单讲状态,则调整μn(k)=0。
可选的,采用回声自适应滤波器调整所述待确定信号的更新步长μn(k)。
可选的,所述的回声声场状态确定方法还包括:根据所述待确定信号的回声声场状态,确定是否对所述待确定信号进行非线性处理。
可选的,确定是否对所述待确定信号进行非线性处理包括以下一项或多项:如果确定所述待确定信号的回声声场状态为双讲状态,则减少非线性处理程度;如果确定所述待确定信号的回声声场状态为回声路径变化状态,则增强对所述待确定信号的非线性处理;如果确定所述待确定信号的回声声场状态为近端单讲状态,则停止对所述待确定信号的非线性处理;如果确定所述待确定信号的回声声场状态为空闲状态,则停止对所述待确定信号的非线性处理。
可选的,采用后处理非线性处理单元对所述待确定信号进行非线性处理。
可选的,所述的回声声场状态确定方法还包括:根据所述待确定信号的回声声场状态,确定降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。
可选的,确定降低噪声更新速度或者提高非平稳噪声抑制能力包括以下一项或多项:如果确定所述待确定信号的回声声场状态为近端单讲状态,则降低所述待确定信号的噪声更新速度;如果确定所述待确定信号的回声声场状态为双讲状态,则降低所述待确定信号的噪声更新速度;如果确定所述待确定信号的回声声场状态为远端单讲状态,则提高所述待确定信号的非平稳噪声抑制能力;如果确定所述待确定信号的回声声场状态为回声路径变化状态,则提高所述待确定信号的非平稳噪声抑制能力。
可选的,采用后处理噪声抑制单元降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。
可选的,所述的回声声场状态确定方法还包括:确定所述待确定信号的临时声场状态;根据所述待确定信号的回声声场状态以及临时声场状态,确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出。
可选的,确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出包括以下一项或多项:如果所述待确定信号的回声声场状态为双讲状态,所述临时声场状态为远端单讲状态,则通过保持时间对所述待确定信号保持双讲状态输出;如果所述待确定信号的回声声场状态为双讲状态,所述临时声场状态为回声路径变化状态,则通过开始时间对所述待确定信号暂缓回声路径改变的输出。
为解决上述技术问题,本发明实施例提供一种回声声场状态确定装置,包括:获取模块,用于获取待确定信号;信号确定模块,用于确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k);更新度确定模块,用于至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate;状态确定模块,用于至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
为解决上述技术问题,本发明实施例提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述回声声场状态确定方法的步骤。
为解决上述技术问题,本发明实施例提供一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述回声声场状态确定方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
在本发明实施例中,通过设置至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态,可以设置适当的参数,对所述待确定信号实际上为回声路径变化状态的情况进行准确判断,相比于现有技术中只是将回声声场状态简单的划分为单讲状态与双讲状态加以检测,容易将回声路径变化状态误判为双讲状态,采用本发明实施例的方案,可以有效提高对回声路径变化状态判断的准确性,并且在后续步骤中,有机会采用更多参数对更多回声声场状态进行判断,更有效地实现多特征检测,提高对回声声场状态判断的完整性。
进一步,至少根据所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态为远端单讲状态,相比于现有技术中容易将回声路径变化状态误判为双讲状态,采用本发明实施例的方案,可以进一步有效提高对回声路径变化状态判断的准确性。
进一步,通过判断近端语音激活标志DVflag不等于1时,所述待确定信号的回声声场状态为空闲状态,可以在近端语音激活标志DVflag不为1时,认为近端无语音,否则说明近端存在语音,需要对所述待确定信号进一步进行判断。
进一步,通过判断远端语音激活标志XVflag不等于1时,所述待确定信号的回声声场状态为近端单讲状态,可以在远端语音激活标志XVflag不为1 时,认为远端无信号,近端信号中无回声信号,当前状态为近端单讲状态,否则说明近端信号中有回声的存在,需要对所述待确定信号进一步进行判断。
进一步,通过判断回波抑制比Err大于预设回波阈值Thrderr,说明残差信号相对幅度很小,近端信号成分中大部分确定为回声信号,已被自适应滤波器AF消除,当前状态为远端单讲状态,否则说明残差信号相对幅度仍较高且近端信号中成分不确定,需要对所述待确定信号进一步进行判断。
进一步,通过归一化互相关值对近端信号与残差信号成分做进一步确定,在滤波器收敛情况下,残差数据En(k)相当于已与回声信号去相关,此时若CDE大于门限Thrd1coh,说明近端信号中含有很多与回声不相关的成分,但若滤波器未收敛,则残差信号中还会含有大量回声成分,该结论则不成立;故采用CYE做进一步确认,若CYE小于门限Thrd2coh说明残差信号中回声成分已很少,结合 CDE大于门限Thrd1coh的条件可确认近端信号中含有与回声不相关的成分,此时当前状态为双讲状态,否则说明信号成分无法确定,需要对所述待确定信号进一步进行判断。
进一步,在判断并排除双讲状态之后,根据滤波器收敛度Cefupdate大于门限Thrdupdate,判断为回声路径改变状态,根据滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,判断为远端单讲状态,可以说明滤波器处于快速更新状态,由于之前判决已排除确定性双讲状态,近端语音信号对滤波器的干扰已不会太高,此时快速更新只能是未收敛或回声路径改变造成,当前状态为回声路径改变状态,否则当前特征暂无明显区分度,视为不确定状态,在本发明实施例中,确定为远端单讲状态。
进一步,所述归一化互相关值CYE与CDE为线性区归一化互相关值;其中,M与L为线性区的频段索引,通过在线性区取值,可以提高判断的准确性。
进一步,可以在所述待确定信号为回声路径改变状态时,增加更新步长μn(k)取值,加快更新,快速收敛;在所述待确定信号为双讲状态DTS时,调整μn(k)放慢更新,保证滤波器的稳健性;在所述待确定信号为远端单讲状态 FSTS时,μn(k)取正常值,不做特殊调整;在所述待确定信号为空闲状态IDS 或近端单讲状态NSTS时,μn(k)取0,停止更新,防止发散,从而提高信号传输质量。
进一步,可以在所述待确定信号为双讲状态时减少非线性处理程度,使有效语音不受损伤,保证双讲性能;在所述待确定信号为回声路径改变状态 PCS时增强非线性处理程度,防止残留回声的泄漏;在所述待确定信号为近端单讲NSTS与空闲状态IDS时,停止非线性处理,避免引起近端语音与环境音的失真;在所述待确定信号为远端单讲状态FSTS时不做特殊处理,正常抑制残留回声,从而提高信号传输质量。
进一步,可以在所述待确定信号为近端单讲状态与双讲状态时,放慢噪声更新速度,保证有效语音的可懂度;在所述待确定信号为远端单讲与回声路径改变时,提高非平稳噪声抑制能力,起到对残留回声的抑制作用;在所述待确定信号为空闲状态,即背景噪声IDS状态时,不做特殊处理,正常跟踪背景噪声,从而提高信号传输质量。
附图说明
图1是现有技术中一种AEC系统的结构示意图;
图2是本发明实施例中一种回声声场状态确定方法的流程图;
图3是本发明实施例中另一种回声声场状态确定方法的流程图;
图4是本发明实施例中一种AEC系统的结构示意图;
图5是本发明实施例中一种回声声场状态确定装置的结构示意图。
具体实施方式
如前所述,在实时语音通信与基于IP的语音传输过程中,通信终端扬声器发出的声音,总会被该终端的麦克风拾取到,若是不处理就发送出去,对方总能听到自己说话的声音,体验不佳。采用回声消除对回声进行消除是公知的方法,通常的AEC系统包括针对线性回声处理的自适应滤波AF以及针对残留回声处理的非线性部分。
参照图1,图1是现有技术中一种AEC系统的结构示意图。
如图1所示,信号x(n)经过扬声器(statisticalprocess control,SPK)之后得到信号h(n),该信号具有回声(echo),与语音信号(voice)以及噪声信号(noise)经由麦克风(MIC)之后输出信号d(n)。
对所述信号d(n)以及信号x(n)分别进行短时傅里叶变换(short-time Fouriertransform,或short-term Fouriertransform,STFT)得到近端信号Dn(k)以及远端信号Xn(k),自适应滤波器(Adaptive Filters,AF)可以根据远端信号Xn(k)与滤波器系数Wn(k)计算出回声估计信号Yn(k),并与近端信号Dn(k)相减得到残差信号En(k)。
在具体实施中,可以根据滤波器系数Wn(k)进行滤波器系数更新,得到 Wn+1(k)。
进而可以将残差信号En(k)输入后处理非线性处理单元(Non-linearprogramming,NLP)以及后处理噪声抑制单元(Noise suppression,NS)。
回声声场状态中双讲状态的检测显得尤为重要,常规的双讲检测方法大致分为三类:基于能量的检测、基于相关性的检测以及基于回声路径的检测。其中基于能量的检测最为简单,极度依赖于回声信号强度、近端语音信号强度与背景噪声强度的稳定性,误判率非常高;基于相关性的检测受限于器件的特性,当扬声器非线性失真较大时,该方法的性能急剧下降;基于回声路径的检测,如估计喇叭冲激响应、可变冲击响应等,当回声路径变化时性能变差。然而,在现有技术中,回声声场状态确定的准确性较低,进而影响回声消除效果。
本发明的发明人经过研究发现,现有的回声声场状态的确定方法都只是将回声声场状态简单的划分为单讲状态(Single Talk State,STS)与双讲状态(Double TalkState,DTS)加以检测,但在实际情况中用于表示回声路径的变化的回声路径变化状态(Path Change State,PCS)却缺乏有效的检测方法,往往被误判为DTS,使得最需要处理的回声反而被最大限度的保留了下来,导致回声声场状态确定有误,进而影响回声消除效果。
在本发明实施例中,通过设置至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态,可以设置适当的参数,对所述待确定信号实际上为回声路径变化状态的情况进行准确判断,相比于现有技术中只是将回声声场状态简单的划分为单讲状态与双讲状态加以检测,容易将回声路径变化状态误判为双讲状态,采用本发明实施例的方案,可以有效提高对回声路径变化状态判断的准确性。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参照图2,图2是本发明实施例中一种回声声场状态确定方法的流程图。实施回声声场状态确定方法包括步骤S21至步骤S24:
步骤S21:获取待确定信号;
步骤S22:确定所述待确定信号的远端信号、近端信号以及滤波器系数;
步骤S23:至少根据所述远端信号、近端信号以及滤波器系数,确定滤波器更新度;
步骤S24:至少根据滤波器更新度大于预设更新度阈值,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
在步骤S21的具体实施中,具有不同的回声声场状态的待确定信号可以包含不同的信号,例如可以包含通信终端扬声器发出的声音被该终端的麦克风拾取后得到的信号,还可以仅包含远端信号。在本发明实施例中,通过准确确定待确定信号的回声声场状态,可以更有效地实现对回声的消除。
在步骤S22的具体实施中,确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k)。
具体地,可以采用常规的技术,确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k)。例如对图1示出的信号d(n)以及信号x(n)分别进行短时傅里叶变换,以得到近端信号Dn(k)以及远端信号Xn(k),还可以采用适当的方法,确定滤波器系数Wn(k)。
在步骤S23的具体实施中,确定滤波器更新度Cefupdate。
进一步地,至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数 Wn(k),确定滤波器更新度Cefupdate的步骤可以包括:根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定残差信号En(k);根据所述残差信号 En(k),确定更新后的滤波器系数Wn+1(k);根据所述滤波器系数Wn(k)以及更新后的滤波器系数Wn+1(k),确定所述滤波器更新度Cefupdate。
更进一步地,可以采用下述公式确定残差信号En(k):
更进一步地,可以采用下述公式确定更新后的滤波器系数Wn+1(k),其中,更新步长μn(k)用于指示所述滤波器系数Wn(k)更新的步长:
更进一步地,可以采用下述公式确定滤波器更新度Cefupdate:
需要指出的是,在本发明实施例中,还可以采用其他适当的方法确定上述参数,本发明实施例对此不做限制。
在步骤S24的具体实施中,可以至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
进一步地,在本发明实施例的一种具体实施方式中,如果滤波器更新度 Cefupdate大于预设更新度阈值Thrdupdate,则可以判断为所述待确定信号的回声声场状态为回声路径变化状态。
在本发明实施例中,通过设置至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态,可以设置适当的参数,对所述待确定信号实际上为回声路径变化状态的情况进行准确判断,相比于现有技术中只是将回声声场状态简单的划分为单讲状态与双讲状态加以检测,容易将回声路径变化状态误判为双讲状态,采用本发明实施例的方案,可以有效提高对回声路径变化状态判断的准确性。
进一步地,所述的回声声场状态确定方法还可以包括:至少根据所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为远端单讲状态。
在本发明实施例的一种具体实施方式中,如果滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,则可以判断为所述待确定信号的回声声场状态为远端单讲状态。
在本发明实施例中,至少根据所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态为远端单讲状态,相比于现有技术中容易将回声路径变化状态误判为双讲状态,采用本发明实施例的方案,可以进一步有效提高对回声路径变化状态判断的准确性。
进一步地,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还可以包括:对所述近端信号Dn(k)进行语音激活检测,以得到近端语音激活标志DVflag;如果所述近端语音激活标志DVflag不等于1,则判断所述待确定信号的回声声场状态为空闲状态。
需要指出的是,在本发明实施例中,对所述近端信号Dn(k)进行语音激活检测,并根据所述近端语音激活标志DVflag判断所述待确定信号的回声声场状态为空闲状态的步骤还可以设置在步骤S24之后执行。本发明实施例对于判断近端语音激活标志DVflag的步骤与步骤S24的先后顺序不做限制。
在本发明实施例中,通过判断近端语音激活标志DVflag不等于1时,所述待确定信号的回声声场状态为空闲状态,可以在近端语音激活标志DVflag 不为1时,认为近端无语音,否则说明近端存在语音,需要对所述待确定信号进一步进行判断。
进一步地,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还可以包括:对所述远端信号Xn(k)进行语音激活检测,以得到远端语音激活标志XVflag;如果所述远端语音激活标志XVflag不等于1,则判断所述待确定信号的回声声场状态为近端单讲状态。
需要指出的是,在本发明实施例中,对所述远端信号Xn(k)进行语音激活检测,并根据所述远端语音激活标志XVflag判断所述待确定信号的回声声场状态为近端单讲状态的步骤还可以设置在步骤S24之后执行。本发明实施例对于判断远端语音激活标志XVflag的步骤与步骤S24的先后顺序不做限制。
需要指出的是,语音激活检测技术可以采用公知技术,常见有能量检测、过零率检测、谱熵检测与基音检测等等,本发明实施例对此不做具体限制。
在本发明实施例中,通过判断远端语音激活标志XVflag不等于1时,所述待确定信号的回声声场状态为近端单讲状态,可以在远端语音激活标志 XVflag不为1时,认为远端无信号,近端信号中无回声信号,当前状态为近端单讲状态,否则说明近端信号中有回声的存在,需要对所述待确定信号进一步进行判断。
进一步地,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还可以包括:确定所述待确定信号的回波抑制比Err;如果所述回波抑制比Err大于预设回波阈值Thrderr,则判断所述待确定信号的回声声场状态为远端单讲状态。
需要指出的是,在本发明实施例中,确定所述待确定信号的回波抑制比 Err,并判断所述待确定信号的回声声场状态为远端单讲状态的步骤还可以设置在步骤S24之后执行。本发明实施例对于判断待确定信号的回波抑制比Err 的步骤与步骤S24的先后顺序不做限制。
更进一步地,确定所述待确定信号的回波抑制比Err的步骤可以包括:根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定残差信号 En(k);根据所述近端信号Dn(k)与残差信号En(k),确定信号的回波抑制比Err。
更进一步地,可以采用下述公式,确定残差信号En(k):
更进一步地,可以采用下述公式,确定信号的回波抑制比Err:
其中,k为所述待确定信号的频率索引。
在本发明实施例中,通过判断回波抑制比Err大于预设回波阈值Thrderr,说明残差信号相对幅度很小,近端信号成分中大部分确定为回声信号,已被自适应滤波器AF消除,当前状态为远端单讲状态,否则说明残差信号相对幅度仍较高且近端信号中成分不确定,需要对所述待确定信号进一步进行判断。
作为一个非限制性的例子,门限值Thrderr参考值可以为12至20dB。
进一步,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,所述的回声声场状态确定方法还可以包括:确定归一化互相关值CYE与 CDE;如果CDE大于第一预设互相关阈值Thrd1coh,且CYE小于第二预设互相关阈值Thrd2coh,则判断所述待确定信号的回声声场状态为双讲状态;其中,所述第一预设互相关阈值Thrd1coh大于等于所述第二预设互相关阈值Thrd2coh。
更进一步地,可以采用下述公式,确定归一化互相关值CYE与CDE:
其中,M与L为所述待确定信号的频段索引。
在本发明实施例中,通过归一化互相关值对近端信号与残差信号成分做进一步确定,在滤波器收敛情况下,残差数据En(k)相当于已与回声信号去相关,此时若CDE大于门限Thrd1coh,说明近端信号中含有很多与回声不相关的成分,但若滤波器未收敛,则残差信号中还会含有大量回声成分,该结论则不成立;故采用CYE做进一步确认,若CYE小于门限Thrd2coh说明残差信号中回声成分已很少,结合CDE大于门限Thrd1coh的条件可确认近端信号中含有与回声不相关的成分,此时当前状态为双讲状态,否则说明信号成分无法确定,需要对所述待确定信号进一步进行判断。
更进一步地,所述归一化互相关值CYE与CDE为线性区归一化互相关值;其中,M与L为线性区的频段索引。
在本发明实施例中,所述归一化互相关值CYE与CDE为线性区归一化互相关值;其中,M与L为线性区的频段索引,通过在线性区取值,可以提高判断的准确性。
需要指出的是,通过设置M与L为线性区对应的频段索引,由于器件非线性失真具有谐波特征,常分布在中高频,故本发明给出参考频率范围,M 对应低频段在100~300Hz区间,L对应高频段在2500~3000Hz区间,该范围仅为参考值,实际使用不受此限制。
更进一步地,如果滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,则确定所述待确定信号的回声声场状态为回声路径变化状态;如果所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,则确定所述待确定信号的回声声场状态为远端单讲状态。
也即在本发明实施例中,可以设置判断滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate的步骤在判断双讲状态之后。
需要指出的是,回波抑制比Err为回声信号相对消除量,避免了回声信号强度的影响;归一化互相关量CYE与CDE,采用了归一化处理,与远近端信号强度无关,同时采用线性区计算减少了器件失真的影响;滤波器更新度Cefupdate利用AF本身一定程度的稳健性,反映了回声路径的变化强度。所以这些特征的综合使用能有效解决回声信号强度变化、远近端信号强度变化、器件失真以及回声路径变化等不确定因素对检测准确度的影响。
在本发明实施例中,在判断并排除双讲状态之后,根据滤波器收敛度 Cefupdate大于门限Thrdupdate,判断为回声路径改变状态,根据滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,判断为远端单讲状态,可以说明滤波器处于快速更新状态,由于之前判决已排除确定性双讲状态,近端语音信号对滤波器的干扰已不会太高,此时快速更新只能是未收敛或回声路径改变造成,当前状态为回声路径改变状态,否则当前特征暂无明显区分度,视为不确定状态,在本发明实施例中,可以确定为远端单讲状态。
需要指出的是,在滤波器更新度Cefupdate小于等于所述预设更新度阈值 Thrdupdate时,当前特征暂无明显区分度,可以视为不确定状态,本发明的发明人经过研究和实践,选择以远端单讲状态FSTS处理。
作为一个非限制性的例子,Thrd1coh参考取值可以为0.3至0.5,Thrd2coh参考取值可以为0.1至0.3。
参照图3,图3是本发明实施例中另一种回声声场状态确定方法的流程图。所述另一种回声声场状态确定方法可以包括步骤S301至步骤S311,以下对各个步骤进行说明。
在步骤S301中,判断DVflag是否等于1;当判断结果为是时,可以执行步骤S302;反之,则可以执行步骤S303。
在步骤S302中,判断XVflag是否等于1;当判断结果为是时,可以执行步骤S304;反之,则可以执行步骤S305。
在步骤S303中,判断回声声场状态为空闲状态(IDS)。
在步骤S304中,判断Err是否大于Thrderr;当判断结果为是时,可以执行步骤S306;反之,则可以执行步骤S307。
在步骤S305中,判断回声声场状态为近端单讲状态(NSTS)。
在步骤S306中,判断回声声场状态为远端单讲状态(FSTS)。
在步骤S307中,判断CDE是否大于Thrd1coh,且CYE小于Thrd2coh;当判断结果为是时,可以执行步骤S308;反之,则可以执行步骤S309。
在步骤S308中,判断回声声场状态为双讲状态(DTS)。
在步骤S309中,判断Cefupdate大于Thrdupdate;当判断结果为是时,可以执行步骤S310;反之,则可以执行步骤S311。
在步骤S310中,判断回声声场状态为回声路径变化状态(PCS)。
在步骤S311中,判断回声声场状态为远端单讲状态(FSTS)。
需要指出的是,本实施例中各个步骤的序号并不代表对各个步骤的执行顺序的限定。例如,不限制步骤S301、S302、S304、S307、S309之间的步骤顺序。
在本发明实施例的一种具体实施方式中,步骤S309可以设置在S307之后,以提高对回声路径变化状态进行判断的准确性。
在本发明实施例中,选用的特征与判决方法对信号强度变化(远近端、回声信号)、器件失真与回声路径改变等不确定因素具有很强的鲁棒性,且多种特征的联合运用使得检测精度更高,性能更可靠。
进一步地,所述的回声声场状态确定方法还可以包括根据所述待确定信号的回声声场状态,调整所述待确定信号的更新步长μn(k);其中,更新步长μn(k)用于指示所述滤波器系数Wn(k)更新的步长。
更进一步地,调整更新步长μn(k)包括以下一项或多项:如果确定所述待确定信号的回声声场状态为回声路径变化状态,则增加更新步长μn(k);如果确定所述待确定信号的回声声场状态为双讲状态,则调整μn(k)放慢更新;如果确定所述待确定信号的回声声场状态为空闲状态或近端单讲状态,则调整μn(k)=0。
更进一步地,可以采用回声自适应滤波器调整所述待确定信号的更新步长μn(k)。
在本发明实施例中,可以在所述待确定信号为回声路径改变状态时,增加更新步长μn(k)取值,加快更新,快速收敛;在所述待确定信号为双讲状态 DTS时,调整μn(k)放慢更新,保证滤波器的稳健性;在所述待确定信号为远端单讲状态FSTS时,μn(k)取正常值,不做特殊调整;在所述待确定信号为空闲状态IDS或近端单讲状态NSTS时,μn(k)取0,停止更新,防止发散,从而提高信号传输质量。
进一步地,所述的回声声场状态确定方法还可以包括:根据所述待确定信号的回声声场状态,确定是否对所述待确定信号进行非线性处理。
更进一步地,确定是否对所述待确定信号进行非线性处理的步骤可以包括以下一项或多项:如果确定所述待确定信号的回声声场状态为双讲状态,则减少非线性处理程度;如果确定所述待确定信号的回声声场状态为回声路径变化状态,则增强对所述待确定信号的非线性处理;如果确定所述待确定信号的回声声场状态为近端单讲状态,则停止对所述待确定信号的非线性处理;如果确定所述待确定信号的回声声场状态为空闲状态,则停止对所述待确定信号的非线性处理。
更进一步地,可以采用后处理非线性处理单元对所述待确定信号进行非线性处理。
在本发明实施例中,可以在所述待确定信号为双讲状态时减少非线性处理程度,使有效语音不受损伤,保证双讲性能;在所述待确定信号为回声路径改变状态PCS时增强非线性处理程度,防止残留回声的泄漏;在所述待确定信号为近端单讲NSTS与空闲状态IDS时,停止非线性处理,避免引起近端语音与环境音的失真;在所述待确定信号为远端单讲状态FSTS时不做特殊处理,正常抑制残留回声,从而提高信号传输质量。
进一步地,所述的回声声场状态确定方法还可以包括:根据所述待确定信号的回声声场状态,确定降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。
更进一步地,确定降低噪声更新速度或者提高非平稳噪声抑制能力的步骤可以包括以下一项或多项:如果确定所述待确定信号的回声声场状态为近端单讲状态,则降低所述待确定信号的噪声更新速度;如果确定所述待确定信号的回声声场状态为双讲状态,则降低所述待确定信号的噪声更新速度;如果确定所述待确定信号的回声声场状态为远端单讲状态,则提高所述待确定信号的非平稳噪声抑制能力;如果确定所述待确定信号的回声声场状态为回声路径变化状态,则提高所述待确定信号的非平稳噪声抑制能力。
更进一步地,采用后处理噪声抑制单元降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。
在本发明实施例中,可以在所述待确定信号为近端单讲状态与双讲状态时,放慢噪声更新速度,保证有效语音的可懂度;在所述待确定信号为远端单讲与回声路径改变时,提高非平稳噪声抑制能力,起到对残留回声的抑制作用;在所述待确定信号为空闲状态,即背景噪声IDS状态时,不做特殊处理,正常跟踪背景噪声,从而提高信号传输质量。
参照图4,图4是本发明实施例中一种AEC系统的结构示意图。
如图4所示,信号x(n)经过扬声器(SPK)之后得到信号h(n),该信号具有回声(echo),与语音信号(voice)以及噪声信号(noise)经由麦克风(MIC)之后输出信号d(n)。
对所述信号d(n)以及信号x(n)分别进行短时傅里叶变换(STFT)得到近端信号Dn(k)以及远端信号Xn(k),自适应滤波器(AF)可以根据远端信号Xn(k)与滤波器系数Wn(k)计算出回声估计信号Yn(k),并与近端信号Dn(k)相减得到残差信号En(k)。
在具体实施中,可以根据滤波器系数Wn(k)进行滤波器系数更新,得到 Wn+1(k)。
进而可以将远端信号Xn(k)、近端信号Dn(k)、回声估计信号Yn(k)、残差信号En(k)与滤波器系数Wn(k)输入回声声场状态检测单元ESD,以进行信号特征计算,并根据计算结果做回声声场状态判决,得到具体的回声声场状态。
如前所述,在本发明实施例中,可以将回声声状态细分为五种声场状态:远端单讲状态FSTS,近端单讲状态NSTS,双讲状态DTS,回声路径改变状态PCS以及空闲状态IDS(即为背景噪声)。
进而可以设置自适应滤波器AF与后处理非线性处理单元(NLP)以及后处理噪声抑制单元(NS)通过ESD获取具体的声场状态,并做相应的处理。
进一步地,所述的回声声场状态确定方法还可以包括:确定所述待确定信号的临时声场状态;根据所述待确定信号的回声声场状态以及临时声场状态,确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出。
在本发明实施例中,若历史状态为双讲DTS,EStemp为远端单讲FSTS 则通过保持时间Thold保持DTS输出,最大程度的保护近端语音。
更进一步地,确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出包括以下一项或多项:如果所述待确定信号的回声声场状态为双讲状态,所述临时声场状态为远端单讲状态,则通过保持时间对所述待确定信号保持双讲状态输出;如果所述待确定信号的回声声场状态为双讲状态,所述临时声场状态为回声路径变化状态,则通过开始时间对所述待确定信号暂缓回声路径改变的输出。
在本发明实施例中,若历史状态为双讲DTS,EStemp为回声路径改变PCS 则通过开始时间Tstart暂缓PCS的输出,此时强制状态输出为远端单讲FSTS,起到减少滤波器发散风险与抑制回声残留的折中效果。
作为一个非限制性的例子,Thold与Tstart的取值,可以设置在20至100ms 之间。
参照图5,图5是本发明实施例中一种回声声场状态确定装置的结构示意图。所述回声声场状态确定装置可以包括:
获取模块51,用于获取待确定信号;
信号确定模块52,用于确定所述待确定信号的远端信号Xn(k)、近端信号 Dn(k)以及滤波器系数Wn(k);
更新度确定模块53,用于至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate;
状态确定模块54,用于至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
关于该回声声场状态确定装置的原理、具体实现和有益效果请参照前文及图2至图4示出的关于回声声场状态确定方法的相关描述,此处不再赘述。
本发明实施例还提供了一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述方法的步骤。所述存储介质可以是计算机可读存储介质,例如可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器,还可以包括光盘、机械硬盘、固态硬盘等。
本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (27)
1.一种回声声场状态确定方法,其特征在于,包括以下步骤:
获取待确定信号;
确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k);
至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate;
至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
2.根据权利要求1所述的回声声场状态确定方法,其特征在于,还包括:
至少根据所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为远端单讲状态。
3.根据权利要求1所述的回声声场状态确定方法,其特征在于,至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate包括:
根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定残差信号En(k);
根据所述残差信号En(k),确定更新后的滤波器系数Wn+1(k);
根据所述滤波器系数Wn(k)以及更新后的滤波器系数Wn+1(k),确定所述滤波器更新度Cefupdate。
5.根据权利要求1所述的回声声场状态确定方法,其特征在于,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,还包括:
对所述近端信号Dn(k)进行语音激活检测,以得到近端语音激活标志DVflag;
如果所述近端语音激活标志DVflag不等于1,则判断所述待确定信号的回声声场状态为空闲状态。
6.根据权利要求1所述的回声声场状态确定方法,其特征在于,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,还包括:
对所述远端信号Xn(k)进行语音激活检测,以得到远端语音激活标志XVflag;
如果所述远端语音激活标志XVflag不等于1,则判断所述待确定信号的回声声场状态为近端单讲状态。
7.根据权利要求1所述的回声声场状态确定方法,其特征在于,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,还包括:
确定所述待确定信号的回波抑制比Err;
如果所述回波抑制比Err大于预设回波阈值Thrderr,则判断所述待确定信号的回声声场状态为远端单讲状态。
8.根据权利要求7所述的回声声场状态确定方法,其特征在于,确定所述待确定信号的回波抑制比Err包括:
根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定残差信号En(k);
根据所述近端信号Dn(k)与残差信号En(k),确定信号的回波抑制比Err。
10.根据权利要求1所述的回声声场状态确定方法,其特征在于,在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前,还包括:
确定归一化互相关值CYE与CDE;
如果CDE大于第一预设互相关阈值Thrd1coh,且CYE小于第二预设互相关阈值Thrd2coh,则判断所述待确定信号的回声声场状态为双讲状态;
其中,所述第一预设互相关阈值Thrd1coh大于等于所述第二预设互相关阈值Thrd2coh。
11.根据权利要求10所述的回声声场状态确定方法,其特征在于,还包括以下一项或多项:
如果滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,则确定所述待确定信号的回声声场状态为回声路径变化状态;
如果所述滤波器更新度Cefupdate小于等于所述预设更新度阈值Thrdupdate,则确定所述待确定信号的回声声场状态为远端单讲状态。
13.根据权利要求12所述的回声声场状态确定方法,其特征在于,
所述归一化互相关值CYE与CDE为线性区归一化互相关值;
其中,M与L为线性区的频段索引。
14.根据权利要求1所述的回声声场状态确定方法,其特征在于,还包括:
根据所述待确定信号的回声声场状态,调整所述待确定信号的更新步长μn(k);
其中,更新步长μn(k)用于指示所述滤波器系数Wn(k)更新的步长。
15.根据权利要求14所述的回声声场状态确定方法,其特征在于,调整更新步长μn(k)包括以下一项或多项:
如果确定所述待确定信号的回声声场状态为回声路径变化状态,则增加更新步长μn(k);
如果确定所述待确定信号的回声声场状态为双讲状态,则调整μn(k)放慢更新;
如果确定所述待确定信号的回声声场状态为空闲状态或近端单讲状态,则调整μn(k)=0。
16.根据权利要求14所述的回声声场状态确定方法,其特征在于,采用回声自适应滤波器调整所述待确定信号的更新步长μn(k)。
17.根据权利要求1所述的回声声场状态确定方法,其特征在于,还包括:
根据所述待确定信号的回声声场状态,确定是否对所述待确定信号进行非线性处理。
18.根据权利要求17所述的回声声场状态确定方法,其特征在于,确定是否对所述待确定信号进行非线性处理包括以下一项或多项:
如果确定所述待确定信号的回声声场状态为双讲状态,则减少非线性处理程度;
如果确定所述待确定信号的回声声场状态为回声路径变化状态,则增强对所述待确定信号的非线性处理;
如果确定所述待确定信号的回声声场状态为近端单讲状态,则停止对所述待确定信号的非线性处理;
如果确定所述待确定信号的回声声场状态为空闲状态,则停止对所述待确定信号的非线性处理。
19.根据权利要求17所述的回声声场状态确定方法,其特征在于,采用后处理非线性处理单元对所述待确定信号进行非线性处理。
20.根据权利要求1所述的回声声场状态确定方法,其特征在于,还包括:
根据所述待确定信号的回声声场状态,确定降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。
21.根据权利要求20所述的回声声场状态确定方法,其特征在于,确定降低噪声更新速度或者提高非平稳噪声抑制能力包括以下一项或多项:
如果确定所述待确定信号的回声声场状态为近端单讲状态,则降低所述待确定信号的噪声更新速度;
如果确定所述待确定信号的回声声场状态为双讲状态,则降低所述待确定信号的噪声更新速度;
如果确定所述待确定信号的回声声场状态为远端单讲状态,则提高所述待确定信号的非平稳噪声抑制能力;
如果确定所述待确定信号的回声声场状态为回声路径变化状态,则提高所述待确定信号的非平稳噪声抑制能力。
22.根据权利要求20所述的回声声场状态确定方法,其特征在于,采用后处理噪声抑制单元降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。
23.根据权利要求1所述的回声声场状态确定方法,其特征在于,还包括:
确定所述待确定信号的临时声场状态;
根据所述待确定信号的回声声场状态以及临时声场状态,确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出。
24.根据权利要求23所述的回声声场状态确定方法,其特征在于,确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出包括以下一项或多项:
如果所述待确定信号的回声声场状态为双讲状态,所述临时声场状态为远端单讲状态,则通过保持时间对所述待确定信号保持双讲状态输出;
如果所述待确定信号的回声声场状态为双讲状态,所述临时声场状态为回声路径变化状态,则通过开始时间对所述待确定信号暂缓回声路径改变的输出。
25.一种回声声场状态确定装置,其特征在于,包括:
获取模块,用于获取待确定信号;
信号确定模块,用于确定所述待确定信号的远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k);
更新度确定模块,用于至少根据所述远端信号Xn(k)、近端信号Dn(k)以及滤波器系数Wn(k),确定滤波器更新度Cefupdate;
状态确定模块,用于至少根据滤波器更新度Cefupdate大于预设更新度阈值Thrdupdate,确定所述待确定信号的回声声场状态是否为回声路径变化状态。
26.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至24任一项所述回声声场状态确定方法的步骤。
27.一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至24任一项所述回声声场状态确定方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010223647.6A CN111654585B (zh) | 2020-03-26 | 2020-03-26 | 回声声场状态确定方法及装置、存储介质、终端 |
PCT/CN2021/079181 WO2021190274A1 (zh) | 2020-03-26 | 2021-03-05 | 回声声场状态确定方法及装置、存储介质、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010223647.6A CN111654585B (zh) | 2020-03-26 | 2020-03-26 | 回声声场状态确定方法及装置、存储介质、终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111654585A true CN111654585A (zh) | 2020-09-11 |
CN111654585B CN111654585B (zh) | 2021-08-03 |
Family
ID=72346411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010223647.6A Active CN111654585B (zh) | 2020-03-26 | 2020-03-26 | 回声声场状态确定方法及装置、存储介质、终端 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111654585B (zh) |
WO (1) | WO2021190274A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021190274A1 (zh) * | 2020-03-26 | 2021-09-30 | 紫光展锐(重庆)科技有限公司 | 回声声场状态确定方法及装置、存储介质、终端 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1251959A (zh) * | 1998-08-04 | 2000-05-03 | 摩托罗拉公司 | 用于检测近端话音的方法和器件 |
US20020076037A1 (en) * | 2000-12-15 | 2002-06-20 | Eiichi Nishimura | Echo canceler with automatic gain control of echo cancellation signal |
US6434110B1 (en) * | 1998-03-20 | 2002-08-13 | Cirrus Logic, Inc. | Full-duplex speakerphone circuit including a double-talk detector |
US20030174661A1 (en) * | 1997-11-26 | 2003-09-18 | Way-Shing Lee | Acoustic echo canceller |
JP2005057413A (ja) * | 2003-08-01 | 2005-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体 |
CN101136973A (zh) * | 2006-08-31 | 2008-03-05 | 雅马哈株式会社 | 通话判定系统 |
CN102739286A (zh) * | 2011-04-01 | 2012-10-17 | 中国科学院声学研究所 | 一种用于通信系统中的回声抵消方法 |
US20140064476A1 (en) * | 2012-09-06 | 2014-03-06 | Hellosoft, Inc. | Systems and methods of echo & noise cancellation in voice communication |
US20170041458A1 (en) * | 2013-12-09 | 2017-02-09 | Captioncall, Llc | Echo cancellation for a communication device |
CN107332591A (zh) * | 2016-04-29 | 2017-11-07 | 北京展讯高科通信技术有限公司 | 中继器及其回波干扰消除方法、装置 |
CN108630219A (zh) * | 2018-05-08 | 2018-10-09 | 北京小鱼在家科技有限公司 | 一种音频处理系统、方法、装置、设备及存储介质 |
CN108986837A (zh) * | 2018-09-05 | 2018-12-11 | 科大讯飞股份有限公司 | 一种滤波器更新方法及装置 |
CN109348072A (zh) * | 2018-08-30 | 2019-02-15 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN109524018A (zh) * | 2017-09-19 | 2019-03-26 | 华为技术有限公司 | 一种回声处理方法及设备 |
CN110634496A (zh) * | 2019-10-22 | 2019-12-31 | 广州视源电子科技股份有限公司 | 一种双讲检测方法、装置、计算机设备和存储介质 |
CN110838300A (zh) * | 2019-11-18 | 2020-02-25 | 紫光展锐(重庆)科技有限公司 | 回声消除的处理方法及处理系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9344579B2 (en) * | 2014-07-02 | 2016-05-17 | Microsoft Technology Licensing, Llc | Variable step size echo cancellation with accounting for instantaneous interference |
CN109712636B (zh) * | 2019-03-07 | 2020-06-09 | 出门问问信息科技有限公司 | 一种回声消除过程中的近端语音修复方法及系统 |
CN111654585B (zh) * | 2020-03-26 | 2021-08-03 | 紫光展锐(重庆)科技有限公司 | 回声声场状态确定方法及装置、存储介质、终端 |
-
2020
- 2020-03-26 CN CN202010223647.6A patent/CN111654585B/zh active Active
-
2021
- 2021-03-05 WO PCT/CN2021/079181 patent/WO2021190274A1/zh active Application Filing
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030174661A1 (en) * | 1997-11-26 | 2003-09-18 | Way-Shing Lee | Acoustic echo canceller |
US6434110B1 (en) * | 1998-03-20 | 2002-08-13 | Cirrus Logic, Inc. | Full-duplex speakerphone circuit including a double-talk detector |
CN1251959A (zh) * | 1998-08-04 | 2000-05-03 | 摩托罗拉公司 | 用于检测近端话音的方法和器件 |
US20020076037A1 (en) * | 2000-12-15 | 2002-06-20 | Eiichi Nishimura | Echo canceler with automatic gain control of echo cancellation signal |
JP2005057413A (ja) * | 2003-08-01 | 2005-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体 |
CN101136973A (zh) * | 2006-08-31 | 2008-03-05 | 雅马哈株式会社 | 通话判定系统 |
CN102739286A (zh) * | 2011-04-01 | 2012-10-17 | 中国科学院声学研究所 | 一种用于通信系统中的回声抵消方法 |
US20140064476A1 (en) * | 2012-09-06 | 2014-03-06 | Hellosoft, Inc. | Systems and methods of echo & noise cancellation in voice communication |
US20170041458A1 (en) * | 2013-12-09 | 2017-02-09 | Captioncall, Llc | Echo cancellation for a communication device |
CN107332591A (zh) * | 2016-04-29 | 2017-11-07 | 北京展讯高科通信技术有限公司 | 中继器及其回波干扰消除方法、装置 |
CN109524018A (zh) * | 2017-09-19 | 2019-03-26 | 华为技术有限公司 | 一种回声处理方法及设备 |
CN108630219A (zh) * | 2018-05-08 | 2018-10-09 | 北京小鱼在家科技有限公司 | 一种音频处理系统、方法、装置、设备及存储介质 |
CN109348072A (zh) * | 2018-08-30 | 2019-02-15 | 湖北工业大学 | 一种应用于回声抵消系统的双端通话检测方法 |
CN108986837A (zh) * | 2018-09-05 | 2018-12-11 | 科大讯飞股份有限公司 | 一种滤波器更新方法及装置 |
CN110634496A (zh) * | 2019-10-22 | 2019-12-31 | 广州视源电子科技股份有限公司 | 一种双讲检测方法、装置、计算机设备和存储介质 |
CN110838300A (zh) * | 2019-11-18 | 2020-02-25 | 紫光展锐(重庆)科技有限公司 | 回声消除的处理方法及处理系统 |
Non-Patent Citations (1)
Title |
---|
SIHO KIM ET AL.: "《Applying an auxiliary filter in the adaptive echo canceller for performance improvement of double-talk detection》", 《PROCEEDINGS OF 2002 IEEE 10TH DIGITAL SIGNAL PROCESSING WORKSHOP, 2002 AND THE 2ND SIGNAL PROCESSING EDUCATION WORKSHOP》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021190274A1 (zh) * | 2020-03-26 | 2021-09-30 | 紫光展锐(重庆)科技有限公司 | 回声声场状态确定方法及装置、存储介质、终端 |
Also Published As
Publication number | Publication date |
---|---|
WO2021190274A1 (zh) | 2021-09-30 |
CN111654585B (zh) | 2021-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111768796B (zh) | 一种声学回波消除与去混响方法及装置 | |
CN109716743B (zh) | 全双工语音通信系统和方法 | |
JP4282260B2 (ja) | エコーキャンセラ | |
TWI392322B (zh) | 基於頻譜聲學特性之雙邊發話檢測方法 | |
CN110838300A (zh) | 回声消除的处理方法及处理系统 | |
CN111199748B (zh) | 回声消除方法、装置、设备以及存储介质 | |
US20220301577A1 (en) | Echo cancellation method and apparatus | |
CN109273019B (zh) | 用于回声抑制的双重通话检测的方法及回声抑制 | |
CN111742541B (zh) | 声学回波抵消方法、装置、存储介质 | |
CN110995951B (zh) | 基于双端发声检测的回声消除方法、装置及系统 | |
CN110211602B (zh) | 智能语音增强通信方法及装置 | |
US8831210B2 (en) | Method and system for detection of onset of near-end signal in an echo cancellation system | |
CN111524532B (zh) | 回声抑制方法、装置、设备及存储介质 | |
CN111654585B (zh) | 回声声场状态确定方法及装置、存储介质、终端 | |
CN111355855B (zh) | 回声处理方法、装置、设备及存储介质 | |
CN111756906B (zh) | 一种语音信号的回声抑制方法、装置和计算机可读介质 | |
CN115834778A (zh) | 一种回声消除方法、装置、电子设备及存储介质 | |
CN115620737A (zh) | 语音信号处理装置、方法、电子设备和扩音系统 | |
WO2024009892A1 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム | |
TWI579833B (zh) | 信號處理裝置與信號處理方法 | |
CN105323395B (zh) | 一种回波消除器及回波消除方法 | |
CN111970410B (zh) | 回声消除方法及装置、存储介质、终端 | |
US20230344941A1 (en) | Method for echo cancellation, echo cancellation device and electronic equipment | |
CN115641864A (zh) | 回声处理方法及装置、计算机可读存储介质 | |
CN113921029A (zh) | 一种应用于回声消除的双端发声检测的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |