CN110992975B - 一种语音信号处理方法、装置及终端 - Google Patents

一种语音信号处理方法、装置及终端 Download PDF

Info

Publication number
CN110992975B
CN110992975B CN201911349457.2A CN201911349457A CN110992975B CN 110992975 B CN110992975 B CN 110992975B CN 201911349457 A CN201911349457 A CN 201911349457A CN 110992975 B CN110992975 B CN 110992975B
Authority
CN
China
Prior art keywords
cross
correlation
spectrum
processed
reference signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911349457.2A
Other languages
English (en)
Other versions
CN110992975A (zh
Inventor
杨晓霞
刘溪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Original Assignee
Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen Mobvoi Beijing Information Technology Co Ltd filed Critical Volkswagen Mobvoi Beijing Information Technology Co Ltd
Priority to CN201911349457.2A priority Critical patent/CN110992975B/zh
Publication of CN110992975A publication Critical patent/CN110992975A/zh
Application granted granted Critical
Publication of CN110992975B publication Critical patent/CN110992975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例公开了一种语音信号处理方法、装置及终端。该方法包括:获取待处理语音信号与至少两个参考信号;计算所述待处理语音信号与至少两个所述参考信号的互相关参数;根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。使用本发明的技术方案,可以简化回声消除算法中过载值的计算方式,并有效抑制回声。

Description

一种语音信号处理方法、装置及终端
技术领域
本发明实施例涉及语音处理技术领域,尤其涉及一种语音信号处理方法、装置及终端。
背景技术
在语音信号处理流程中,回声消除是一种常用的语音信号处理算法。在有些场景下,由于回声信号能量较大,AEC(Adaptive Echo Cancellation,自适应线性回声消除)算法不能够有效消除回声,因此需要采用ES(Echo Suppression,非线性的残余回声抑制)算法进一步去除回声。
现有的ES算法通常是根据待处理语音信号与参考信号之间的互相关性,并加入过载值等措施得到非线性回声消除的抑制参数。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:现有的ES算法中过载值的计算较复杂,而且需要调节的参数较多,实现较为复杂。
发明内容
本发明实施例提供一种语音信号处理方法、装置及终端,以简化回声消除算法中过载值的计算方式,并有效抑制回声。
第一方面,本发明实施例提供了一种语音信号处理方法,该方法包括:
获取待处理语音信号与至少两个参考信号;
计算所述待处理语音信号与至少两个所述参考信号的互相关参数;
根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;
根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
第二方面,本发明实施例还提供了一种语音信号处理装置,该装置包括:
信号获取模块,用于获取待处理语音信号与至少两个参考信号;
互相关参数计算模块,用于计算所述待处理语音信号与至少两个所述参考信号的互相关参数;
抑制因子初始值确定模块,用于根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;
抑制因子确定模块,用于根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
第三方面,本发明实施例还提供了一种终端,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的语音信号处理方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的语音信号处理方法。
本发明实施例通过计算待处理语音信号与至少两个参考信号的互相关参数,并根据互相关参数计算抑制因子初始值,以根据抑制因子初始值和过载值确定抑制因子,解决了现有回声消除算法中过载值的实现方式较为复杂的问题,从而简化回声消除算法中过载值的计算方式,并有效抑制回声。
附图说明
图1是本发明实施例一提供的一种语音信号处理方法的流程图;
图2是本发明实施例二提供的一种语音信号处理方法的流程图;
图3a是本发明实施例三提供的一种语音信号处理方法的流程图;
图3b是本发明实施例三提供的一种语音信号处理方法的流程图;
图3c是本发明实施例三提供的过载值与抑制因子之间的关系示意图;
图4是本发明实施例四提供的一种语音信号处理装置的结构示意图;
图5为本发明实施例五提供的一种终端的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一提供的一种语音信号处理方法的流程图,本实施例可适用于简化地确定ES算法中的抑制因子,以对待处理语音信号进行回声消除的情况,该方法可以由语音信号处理装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在终端(典型的,各类车载设备或智能终端设备等终端)中。相应的,如图1所示,该方法包括如下操作:
S110、获取待处理语音信号与至少两个参考信号。
其中,待处理语音信号可以是需要进行回声消除的语音信号。示例性的,车载终端通过麦克风设备获取的用户输入的语音指令信号(也即麦克风信号)或其他智能终端采集的语音指令信号均可以作为待处理语音信号。待处理语音信号可以包括但不限于目标语音信号、噪音信号、回声信号或残留回声信号等。其中,残留回声信号即为对待处理语音信号进行回声消除后残留的回声信号。目标语音信号即为用户所发出的语音指令信号。参考信号可以用于辅助计算待处理语音信号中是否包括目标语音信号。可选的,参考信号可以包括第一参考信号和第二参考信号。其中,第一参考信号可以为系统音频信号;第二参考信号可以为待处理语音信号经过AEC(Adaptive Echo Cancellation,自适应线性回声消除)处理得到的信号。
在本发明实施例中,终端可以通过麦克风等语音采集设备采集的麦克风信号作为待处理语音信号。为了更加简单有效地确定抑制因子,可以采用至少两个参考信号进行辅助计算。可选的,参考信号可以包括第一参考信号和第二参考信号。其中,第一参考信号可以为系统音频信号,如终端播放的wav格式的音频信号等。相应的,回声信号即为语音采集设备(如麦克风)采集到的终端播放的音频信号。第二参考信号可以为待处理语音信号经过AEC处理得到的信号。
S120、计算所述待处理语音信号与至少两个所述参考信号的互相关参数。
可选的,互相关参数可以为互相关谱;
相应的,终端获取到待处理语音信号与至少两个参考信号后,可以计算待处理语音信号与至少两个参考信号的互相关谱作为互相关参数。
S130、根据所述互相关参数确定抑制因子的初始值。
其中,所述抑制因子为非线性回声消除算法中的抑制参数,用于对所述待处理语音信号进行回声消除。
相应的,可以根据互相关参数确定抑制因子的初始值,也即,根据互相关谱确定抑制因子的初始值。
S140、根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
其中,所述过载值可以用于调节回声消除算法中的抑制因子。
在本发明实施例中,可以根据残留回声信号抑制程度随残留回声信号存在概率成正比的准则采用非线性映射的方式来设计过载值。具体可以根据如下准则来确定过载值:抑制因子初始值越接近1,可以确定在待处理语音信号中存在残留回声信号的概率越低,需要过载值接近0才能保证待处理语音信号的非线性失真越小。抑制因子初始值越接近0,可以确定在待处理语音信号中存在残留回声信号的概率越高,需要较大的过载值才能保证有效消除待处理语音信号中的残留回声信号。也即,残留回声信号存在的概率越高,越需要较大的过载值来消除残留回声信号,残留回声信号存在的概率越低,则越需要较小的过载值保证待处理语音信号的非线性失真较小。这样设置的好处在于,使过载值的计算更为简单,并且能够保证待处理语音信号失真较小的同时,有效消除残留回声信号,达到有效抑制回声的目的。
需要说明的是,也可以采用指数函数的方式计算过载值,本实施例对计算过载值的具体方式不进行限制。
本发明实施例通过计算待处理语音信号与至少两个参考信号的互相关参数,并根据互相关参数计算抑制因子初始值,以根据抑制因子初始值和过载值确定抑制因子,解决了现有回声消除算法中过载值的实现方式较为复杂的问题,从而简化回声消除算法中过载值的计算方式,并有效抑制回声。
实施例二
图2是本发明实施例二提供的一种语音信号处理方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,对计算所述待处理语音信号与至少两个所述参考信号的互相关参数,以及根据所述互相关参数确定抑制因子的初始值进行了进一步的具体化。
相应的,如图2所示,本实施例的方法可以包括:
S210、获取待处理语音信号与至少两个参考信号。
可选的,所述参考信号包括第一参考信号和第二参考信号;所述第一参考信号为系统音频信号;所述第二参考信号为所述待处理语音信号经过AEC处理得到的信号;所述互相关参数为互相关谱。
S220、计算所述待处理语音信号与至少两个所述参考信号的互相关参数。
相应的,S220具体可以包括:
S221、计算所述待处理语音信号与所述第一参考信号的第一互相关谱。
其中,第一互相关谱即为待处理语音信号与第一参考信号的互相关谱。
在本发明实施例中,如果采用两种参考信号,则计算待处理语音信号与两个参考信号的互相关参数时,可以分别计算待处理语音信号与参考信号之间的互相关谱。
在本发明的一个可选实施例中,计算所述待处理语音信号与所述第一参考信号的第一互相关谱,可以包括:
基于如下公式计算所述待处理语音信号与所述第一参考信号的功率谱:
Figure BDA0002334298080000071
Figure BDA0002334298080000072
其中,Sd(i,j)表示所述待处理语音信号第i帧第j个频点的功率谱,Sd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点的功率谱,β表示平滑系数,可选的,β可取值0.85,di,j表示所述待处理语音信号第i帧第j个频点的频谱,
Figure BDA0002334298080000073
表示所述待处理语音信号第i帧第j个频点的频谱的共轭复数,Sx(i,j)表示所述第一参考信号第i帧第j个频点的功率谱;Sx(i-1,j)表示所述第一参考信号第i-1帧第j个频点的功率谱,xi,j表示所述第一参考信号第i帧第j个频点的频谱,
Figure BDA0002334298080000074
表示所述第一参考信号第i帧第j个频点的频谱的共轭复数。
基于如下公式计算所述待处理语音信号与所述第一参考信号的第一互相关谱:
Figure BDA0002334298080000075
其中,Sxd(i,j)所述待处理语音信号第i帧第j个频点与所述第一参考信号第i帧第j个频点的第一互相关谱,Sxd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第一参考信号第i-1帧第j个频点的第一互相关谱。
S222、计算所述待处理语音信号与所述第二参考信号的第二互相关谱。
其中,第二互相关谱即为待处理语音信号与第二参考信号的互相关谱。
在本发明的一个可选实施例中,计算所述待处理语音信号与所述第二参考信号的第二互相关谱,可以包括:
基于如下公式计算所述第二参考信号的功率谱:
Figure BDA0002334298080000081
其中,Se(i,j)表示所述第二参考信号第i帧第j个频点的功率谱,Se(i-1,j)表示所述第二参考信号第i-1帧第j个频点的功率谱,ei,j表示所述第二参考信号第i帧第j个频点的频谱,
Figure BDA0002334298080000082
表示所述第二参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第二参考信号的第二互相关谱:
Figure BDA0002334298080000083
其中,Sde(i,j)表示所述待处理语音信号第i帧第j个频点与所述第二参考信号第i帧第j个频点的第一互相关谱,Sde(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第二参考信号第i-1帧第j个频点的第一互相关谱。
S230、根据所述第一互相关谱计算第一互相关系数。
在本发明的一个可选实施例中,可以基于如下公式计算所述第一互相关谱对应的互相关系数:
Figure BDA0002334298080000084
其中,Cxd(i,j)表示所述第一互相关谱对应的互相关系数,
Figure BDA0002334298080000085
表示所述第一互相关谱的共轭复数。
S240、根据所述第二互相关谱计算第二互相关系数。
在本发明的一个可选实施例中,可以基于如下公式计算所述第二互相关谱对应的互相关系数:
Figure BDA0002334298080000091
其中,Cde(i,j)表示所述第二互相关谱对应的互相关系数,
Figure BDA0002334298080000092
表示所述第二互相关谱的共轭复数。
S250、根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值。
可选的,可以基于如下公式根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值:
g1(i,j)=min[Cde(i,j),1-Cxd(i,j)]
其中,g1(i,j)表示所述抑制因子的初始值。
其中,Cde(i,j)越大,表明待处理语音信号中存在目标语音信号的概率越大。Cxd(i,j)越大,说明待处理语音信号中存在残留回声信号的概率越大。因此,1-Cxd(i,j)可以用来近似代表待处理语音信号中存在目标语音信号的概率。可以选择Cde(i,j)与1-Cxd(i,j)之间的最小值作为抑制因子的初始值。
S260、根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
需要说明的是,图2仅是一种实现方式的示意图,步骤S221和步骤S222之间并没有先后顺序关系,可以先实施步骤S221,再实施步骤S222,也可以先实施步骤S222,再实施步骤S221,还可以两者并行实施。同理,步骤S230和步骤S240之间也没有先后顺序关系,可以先实施步骤S230,再实施步骤S240,也可以先实施步骤S240,再实施步骤S230,还可以两者并行实施。
本实施例的技术方案,通过计算待处理语音信号与至少两个参考信号的互相关谱,根据互相关谱计算待处理语音信号与至少两个参考信号的互相关系数,并根据互相关系数计算抑制因子初始值,根据抑制因子初始值和过载值确定抑制因子,解决了现有回声消除算法中过载值的实现方式较为复杂的问题,从而简化回声消除算法中过载值的计算方式,并有效抑制回声。
实施例三
图3a是本发明实施例三提供的一种语音信号处理方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,对根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子的操作过程进行了进一步的具体化。
相应的,如图3a所示,本实施例的方法可以包括:
S310、获取待处理语音信号与至少两个参考信号。
可选的,所述参考信号包括第一参考信号和第二参考信号;所述互相关参数为互相关谱;所述第一参考信号为系统音频信号;所述第二参考信号为所述待处理语音信号经过AEC处理得到的信号。
S320、计算所述待处理语音信号与所述第一参考信号的第一互相关谱。
S330、计算所述待处理语音信号与所述第二参考信号的第二互相关谱。
S340、根据所述第一互相关谱计算第一互相关系数。
S350、根据所述第二互相关谱计算第二互相关系数。
S360、根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值。
S370、判断所述抑制因子的初始值是否小于所述预设分隔点,若是,则执行S380,否则执行S390。
其中,所述预设分隔点可以用于对抑制因子的初始值进行分界。相应的,在抑制因子的初始值大于预设分隔点和小于预设分隔点时,可以采取不同的计算过载值的方式。
可选的,可以将预设分隔点设置为大于等于0.8,本发明实施例对预设分隔点的具体数值不进行限制。
S380、基于如下公式计算所述过载值:
Figure BDA0002334298080000111
其中,γ(i,j)表示所述过载值,γmax表示最大过载量,t表示所述预设分隔点。可选的,γmax大于1,t大于等于0.8。这样设置可以有效消除残留回声信号,并且降低待处理语音信号的非线性失真。
S390、将所述过载值设置为预设过载值,且保持所述过载值不变。
其中,预设过载值可以为抑制因子的初始值大于等于预设分隔点时,对过载值赋予的一个定值。可选的,预设过载值可以为1。相应的,当抑制因子的初始值大于等于预设分隔点t时,过载值取1。
S3100、根据所述抑制因子的过载值更新所述抑制因子的初始值,得到所述抑制因子。
可选的,可以基于如下公式根据所述抑制因子的过载值更新所述抑制因子的初始值:
g(i,j)=g1(i,j)γ(i,j)
其中,g(i,j)表示所述抑制因子,γ(i,j)表示所述过载值。
图3b是本发明实施例三提供的一种语音信号处理方法的流程图。在一个具体的例子中,如图3b所示,将获取的麦克风信号作为待处理语音信号,参考信号(系统音频信号)作为第一参考信号,将麦克风信号经过AEC之后的信号作为第二参考信号。获取到上述三种输入信号后,通过互相关计算模块,分别计算麦克风信号与参考信号之间的互相关参数以及麦克风信号与经过AEC之后的信号之间的互相关参数。根据计算得到的互相关参数计算ES抑制因子的初始值,根据计算得到的ES抑制因子的初始值,通过非线性映射,计算过载值。然后,即可根据ES抑制因子的初始值和过载值计算ES抑制因子。其中,根据ES抑制因子的初始值,通过非线性映射计算过载值,可以通过图3c中提供的过载值与抑制因子之间的关系示意图来实现。
图3c是本发明实施例三提供的过载值与抑制因子之间的关系示意图。如图3c所示,当抑制因子的初始值大于等于t并且小于1时,过载值取1,t的取值可以为大于等于0.8且小于1。当抑制因子的初始值小于t时,可以根据公式
Figure BDA0002334298080000121
计算过载值。其中,γ(i,j)表示过载值,γmax表示最大过载量,γmax大于1。
需要说明的是,S370-S390仅为根据抑制因子的初始值计算过载值的一种实现方式,当抑制因子的初始值小于预设分隔点时,还可以通过指数函数等其他类型的函数来计算过载值,本发明实施例并不对抑制因子的初始值小于预设分隔点时过载值的计算方式进行限制。
另外还需说明的是,图3a仅是一种实现方式的示意图,步骤S320和步骤S330之间并没有先后顺序关系,可以先实施步骤S320,再实施步骤S330,也可以先实施步骤S330,再实施步骤S320,还可以两者并行实施。同理,步骤S340和步骤S350之间也没有先后顺序关系,可以先实施步骤S340,再实施步骤S350,也可以先实施步骤S350,再实施步骤S340,还可以两者并行实施。
本实施例的技术方案,通过计算待处理语音信号与至少两个参考信号的互相关谱,根据互相关谱计算待处理语音信号与至少两个参考信号的互相关系数,并根据互相关系数计算抑制因子初始值,根据抑制因子的初始值和预设分隔点之间的关系采取不同的过载值确定方式,根据抑制因子初始值和过载值确定抑制因子,解决了现有回声消除算法中过载值的实现方式较为复杂的问题,从而简化回声消除算法中过载值的计算方式,并有效抑制回声。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
实施例四
图4是本发明实施例四提供的一种语音信号处理装置的示意图,如图4所示,所述装置包括:信号获取模块410、互相关参数计算模块420、抑制因子初始值确定模块430以及抑制因子确定模块440,其中:
信号获取模块410,用于获取待处理语音信号与至少两个参考信号;
互相关参数计算模块420,用于计算所述待处理语音信号与至少两个所述参考信号的互相关参数;
抑制因子初始值确定模块430,用于根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;
抑制因子确定模块440,用于根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
本实施例的技术方案,通过计算待处理语音信号与至少两个参考信号的互相关参数,并根据互相关参数计算抑制因子初始值,根据抑制因子初始值和过载值确定抑制因子,解决了现有回声消除算法中过载值的实现方式较为复杂的问题,从而简化回声消除算法中过载值的计算方式,并有效抑制回声。
在上述实施例的基础上,所述抑制因子确定模块440,包括:
抑制因子过载值确定单元,用于根据所述抑制因子的初始值确定所述抑制因子的过载值;
抑制因子更新单元,用于根据所述抑制因子的过载值更新所述抑制因子的初始值,得到所述抑制因子。
在上述实施例的基础上,所述参考信号包括第一参考信号和第二参考信号;所述第一参考信号为系统音频信号;所述第二参考信号为所述待处理语音信号经过自适应线性回声消除AEC处理得到的信号;所述互相关参数为互相关谱;
所述互相关参数计算模块420,包括:
第一互相关谱计算单元,用于计算所述待处理语音信号与所述第一参考信号的第一互相关谱;
第二互相关谱计算单元,用于计算所述待处理语音信号与所述第二参考信号的第二互相关谱。
在上述实施例的基础上,所述抑制因子初始值确定模块430,包括:
第一互相关系数计算单元,用于根据所述第一互相关谱计算第一互相关系数;
第二互相关系数计算单元,用于根据所述第二互相关谱计算第二互相关系数;
抑制因子初始值计算单元,用于根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值。
在上述实施例的基础上,所述第一互相关谱计算单元,用于:
基于如下公式计算所述待处理语音信号与所述第一参考信号的功率谱:
Figure BDA0002334298080000151
Figure BDA0002334298080000152
其中,Sd(i,j)表示所述待处理语音信号第i帧第j个频点的功率谱,Sd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点的功率谱,β表示平滑系数,di,j表示所述待处理语音信号第i帧第j个频点的频谱,
Figure BDA0002334298080000153
表示所述待处理语音信号第i帧第j个频点的频谱的共轭复数,Sx(i,j)表示所述第一参考信号第i帧第j个频点的功率谱;Sx(i-1,j)表示所述第一参考信号第i-1帧第j个频点的功率谱,xi,j表示所述第一参考信号第i帧第j个频点的频谱,
Figure BDA0002334298080000154
表示所述第一参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第一参考信号的第一互相关谱:
Figure BDA0002334298080000155
其中,Sxd(i,j)所述待处理语音信号第i帧第j个频点与所述第一参考信号第i帧第j个频点的第一互相关谱,Sxd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第一参考信号第i-1帧第j个频点的第一互相关谱;
所述第二互相关谱计算单元,用于:
基于如下公式计算所述第二参考信号的功率谱:
Figure BDA0002334298080000161
其中,Se(i,j)表示所述第二参考信号第i帧第j个频点的功率谱,Se(i-1,j)表示所述第二参考信号第i-1帧第j个频点的功率谱,ei,j表示所述第二参考信号第i帧第j个频点的频谱,
Figure BDA0002334298080000162
表示所述第二参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第二参考信号的第二互相关谱:
Figure BDA0002334298080000163
其中,Sde(i,j)表示所述待处理语音信号第i帧第j个频点与所述第二参考信号第i帧第j个频点的第一互相关谱,Sde(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第二参考信号第i-1帧第j个频点的第一互相关谱。
在上述实施例的基础上,所述第一互相关系数计算单元,用于:
基于如下公式计算所述第一互相关谱对应的互相关系数:
Figure BDA0002334298080000164
其中,Cxd(i,j)表示所述第一互相关谱对应的互相关系数,
Figure BDA0002334298080000165
表示所述第一互相关谱的共轭复数;
所述第二互相关系数计算单元,用于:
基于如下公式计算所述第二互相关谱对应的互相关系数:
Figure BDA0002334298080000166
其中,Cde(i,j)表示所述第二互相关谱对应的互相关系数,
Figure BDA0002334298080000167
表示所述第二互相关谱的共轭复数;
所述抑制因子初始值计算单元,用于:
基于如下公式根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值:
g1(i,j)=min[Cde(i,j),1-Cxd(i,j)]
其中,g1(i,j)表示所述抑制因子的初始值。
在上述实施例的基础上,所述抑制因子过载值确定单元,用于:
当所述抑制因子的初始值大于或等于预设分隔点时,将所述过载值设置为预设过载值,且保持所述过载值不变;
当所述抑制因子的初始值小于所述预设分隔点时,基于如下公式计算所述过载值:
Figure BDA0002334298080000171
其中,γ(i,j)表示所述过载值,γmax表示最大过载量,t表示所述预设分隔点;
所述抑制因子更新单元,用于:
基于如下公式根据所述抑制因子的过载值更新所述抑制因子的初始值:
g(i,j)=g1(i,j)γ(i,j)
其中,g(i,j)表示所述抑制因子。
上述语音信号处理装置可执行本发明任意实施例所提供的语音信号处理方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的语音信号处理方法。
由于上述所介绍的语音信号处理装置为可以执行本发明实施例中的语音信号处理方法的装置,故而基于本发明实施例中所介绍的语音信号处理方法,本领域所属技术人员能够了解本实施例的语音信号处理装置的具体实施方式以及其各种变化形式,所以在此对于该语音信号处理装置如何实现本发明实施例中的语音信号处理方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中语音信号处理方法所采用的装置,都属于本申请所欲保护的范围。
实施例五
图5为本发明实施例五提供的一种终端的结构示意图。图5示出了适于用来实现本发明实施方式的终端512的框图。图5显示的终端512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,终端512以通用计算设备的形式表现。终端512的组件可以包括但不限于:一个或者多个处理器516,存储装置528,连接不同系统组件(包括存储装置528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
终端512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被终端512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)530和/或高速缓存存储器532。终端512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储装置528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块526的程序536,可以存储在例如存储装置528中,这样的程序模块526包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块526通常执行本发明所描述的实施例中的功能和/或方法。
终端512也可以与一个或多个外部设备514(例如键盘、指向设备、摄像头、显示器524等)通信,还可与一个或者多个使得用户能与该终端512交互的设备通信,和/或与使得该终端512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口522进行。并且,终端512还可以通过网络适配器520与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与终端512的其它模块通信。应当明白,尽管图中未示出,可以结合终端512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器516通过运行存储在存储装置528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的语音信号处理方法。
也即,所述处理单元执行所述程序时实现:获取待处理语音信号与至少两个参考信号;计算所述待处理语音信号与至少两个所述参考信号的互相关参数;根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
实施例六
本发明实施例六还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的语音信号处理方法:获取待处理语音信号与至少两个参考信号;计算所述待处理语音信号与至少两个所述参考信号的互相关参数;根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable ReadOnly Memory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种语音信号处理方法,其特征在于,包括:
获取待处理语音信号与至少两个参考信号;
计算所述待处理语音信号与至少两个所述参考信号的互相关参数;
根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;
根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子,包括:
根据所述抑制因子的初始值确定所述抑制因子的过载值,包括:
当所述抑制因子的初始值大于或等于预设分隔点时,将所述过载值设置为预设过载值,且保持所述过载值不变;
当所述抑制因子的初始值小于所述预设分隔点时,基于如下公式计算所述过载值:
Figure FDA0003619291100000011
其中,γ(i,j)表示所述过载值,γmax表示最大过载量,t表示所述预设分隔点,g1(i,j)表示抑制因子的初始值;
根据所述抑制因子的过载值更新所述抑制因子的初始值,得到所述抑制因子,包括:
基于如下公式根据所述抑制因子的过载值更新所述抑制因子的初始值:
g(i,j)=g1(i,j)γ(i,j)
其中,g(i,j)表示所述抑制因子。
2.根据权利要求1所述的方法,其特征在于,所述参考信号包括第一参考信号和第二参考信号;所述第一参考信号为系统音频信号;所述第二参考信号为所述待处理语音信号经过自适应线性回声消除AEC处理得到的信号;所述互相关参数为互相关谱;
计算所述待处理语音信号与至少两个所述参考信号的互相关参数,包括:
计算所述待处理语音信号与所述第一参考信号的第一互相关谱;
计算所述待处理语音信号与所述第二参考信号的第二互相关谱。
3.根据权利要求2所述的方法,其特征在于,根据所述互相关参数确定抑制因子的初始值,包括:
根据所述第一互相关谱计算第一互相关系数;
根据所述第二互相关谱计算第二互相关系数;
根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值。
4.根据权利要求3所述的方法,计算所述待处理语音信号与所述第一参考信号的第一互相关谱,包括:
基于如下公式计算所述待处理语音信号与所述第一参考信号的功率谱:
Figure FDA0003619291100000021
Figure FDA0003619291100000022
其中,Sd(i,j)表示所述待处理语音信号第i帧第j个频点的功率谱,Sd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点的功率谱,β表示平滑系数,di,j表示所述待处理语音信号第i帧第j个频点的频谱,
Figure FDA0003619291100000023
表示所述待处理语音信号第i帧第j个频点的频谱的共轭复数,Sx(i,j)表示所述第一参考信号第i帧第j个频点的功率谱;Sx(i-1,j)表示所述第一参考信号第i-1帧第j个频点的功率谱,xi,j表示所述第一参考信号第i帧第j个频点的频谱,
Figure FDA0003619291100000024
表示所述第一参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第一参考信号的第一互相关谱:
Figure FDA0003619291100000031
其中,Sxd(i,j)所述待处理语音信号第i帧第j个频点与所述第一参考信号第i帧第j个频点的第一互相关谱,Sxd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第一参考信号第i-1帧第j个频点的第一互相关谱;
计算所述待处理语音信号与所述第二参考信号的第二互相关谱,包括:
基于如下公式计算所述第二参考信号的功率谱:
Figure FDA0003619291100000032
其中,Se(i,j)表示所述第二参考信号第i帧第j个频点的功率谱,Se(i-1,j)表示所述第二参考信号第i-1帧第j个频点的功率谱,ei,j表示所述第二参考信号第i帧第j个频点的频谱,
Figure FDA0003619291100000033
表示所述第二参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第二参考信号的第二互相关谱:
Figure FDA0003619291100000034
其中,Sde(i,j)表示所述待处理语音信号第i帧第j个频点与所述第二参考信号第i帧第j个频点的第一互相关谱,Sde(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第二参考信号第i-1帧第j个频点的第一互相关谱。
5.根据权利要求4所述的方法,其特征在于,根据所述第一互相关谱计算第一互相关系数,包括:
基于如下公式计算所述第一互相关谱对应的互相关系数:
Figure FDA0003619291100000041
其中,Cxd(i,j)表示所述第一互相关谱对应的互相关系数,
Figure FDA0003619291100000042
表示所述第一互相关谱的共轭复数;
根据所述第二互相关谱计算第二互相关系数,包括:
基于如下公式计算所述第二互相关谱对应的互相关系数:
Figure FDA0003619291100000043
其中,Cde(i,j)表示所述第二互相关谱对应的互相关系数,
Figure FDA0003619291100000044
表示所述第二互相关谱的共轭复数;
根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值,包括:
基于如下公式根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值:
g1(i,j)=min[Cde(i,j),1-Cxd(i,j)]
其中,g1(i,j)表示所述抑制因子的初始值。
6.一种语音信号处理装置,其特征在于,包括:
信号获取模块,用于获取待处理语音信号与至少两个参考信号;
互相关参数计算模块,用于计算所述待处理语音信号与至少两个所述参考信号的互相关参数;
抑制因子初始值确定模块,用于根据所述互相关参数确定抑制因子的初始值;所述抑制因子用于对所述待处理语音信号进行回声消除;
抑制因子确定模块,用于根据所述抑制因子的初始值和所述抑制因子的过载值确定所述抑制因子;
所述抑制因子确定模块,包括:
抑制因子过载值确定单元,用于根据所述抑制因子的初始值确定所述抑制因子的过载值;
所述抑制因子过载值确定单元,具体用于:
当所述抑制因子的初始值大于或等于预设分隔点时,将所述过载值设置为预设过载值,且保持所述过载值不变;
当所述抑制因子的初始值小于所述预设分隔点时,基于如下公式计算所述过载值:
Figure FDA0003619291100000051
其中,γ(i,j)表示所述过载值,γmax表示最大过载量,t表示所述预设分隔点,g1(i,j)表示抑制因子的初始值;
抑制因子更新单元,用于根据所述抑制因子的过载值更新所述抑制因子的初始值,得到所述抑制因子;
所述抑制因子更新单元,具体用于:
基于如下公式根据所述抑制因子的过载值更新所述抑制因子的初始值:
g(i,j)=g1(i,j)γ(i,j)
其中,g(i,j)表示所述抑制因子。
7.根据权利要求6所述的装置,其特征在于,所述参考信号包括第一参考信号和第二参考信号;所述第一参考信号为系统音频信号;所述第二参考信号为所述待处理语音信号经过自适应线性回声消除AEC处理得到的信号;所述互相关参数为互相关谱;
所述互相关参数计算模块,包括:
第一互相关谱计算单元,用于计算所述待处理语音信号与所述第一参考信号的第一互相关谱;
第二互相关谱计算单元,用于计算所述待处理语音信号与所述第二参考信号的第二互相关谱。
8.根据权利要求7所述的装置,其特征在于,所述抑制因子初始值确定模块,包括:
第一互相关系数计算单元,用于根据所述第一互相关谱计算第一互相关系数;
第二互相关系数计算单元,用于根据所述第二互相关谱计算第二互相关系数;
抑制因子初始值计算单元,用于根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值。
9.根据权利要求8所述的装置,其特征在于,所述第一互相关谱计算单元,用于:
基于如下公式计算所述待处理语音信号与所述第一参考信号的功率谱:
Figure FDA0003619291100000061
Figure FDA0003619291100000062
其中,Sd(i,j)表示所述待处理语音信号第i帧第j个频点的功率谱,Sd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点的功率谱,β表示平滑系数,di,j表示所述待处理语音信号第i帧第j个频点的频谱,
Figure FDA0003619291100000063
表示所述待处理语音信号第i帧第j个频点的频谱的共轭复数,Sx(i,j)表示所述第一参考信号第i帧第j个频点的功率谱;Sx(i-1,j)表示所述第一参考信号第i-1帧第j个频点的功率谱,xi,j表示所述第一参考信号第i帧第j个频点的频谱,
Figure FDA0003619291100000071
表示所述第一参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第一参考信号的第一互相关谱:
Figure FDA0003619291100000072
其中,Sxd(i,j)所述待处理语音信号第i帧第j个频点与所述第一参考信号第i帧第j个频点的第一互相关谱,Sxd(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第一参考信号第i-1帧第j个频点的第一互相关谱;
所述第二互相关谱计算单元,用于:
基于如下公式计算所述第二参考信号的功率谱:
Figure FDA0003619291100000073
其中,Se(i,j)表示所述第二参考信号第i帧第j个频点的功率谱,Se(i-1,j)表示所述第二参考信号第i-1帧第j个频点的功率谱,ei,j表示所述第二参考信号第i帧第j个频点的频谱,
Figure FDA0003619291100000074
表示所述第二参考信号第i帧第j个频点的频谱的共轭复数;
基于如下公式计算所述待处理语音信号与所述第二参考信号的第二互相关谱:
Figure FDA0003619291100000075
其中,Sde(i,j)表示所述待处理语音信号第i帧第j个频点与所述第二参考信号第i帧第j个频点的第一互相关谱,Sde(i-1,j)表示所述待处理语音信号第i-1帧第j个频点与所述第二参考信号第i-1帧第j个频点的第一互相关谱。
10.根据权利要求9所述的装置,其特征在于,所述第一互相关系数计算单元,用于:
基于如下公式计算所述第一互相关谱对应的互相关系数:
Figure FDA0003619291100000081
其中,Cxd(i,j)表示所述第一互相关谱对应的互相关系数,
Figure FDA0003619291100000082
表示所述第一互相关谱的共轭复数;
所述第二互相关系数计算单元,用于:
基于如下公式计算所述第二互相关谱对应的互相关系数:
Figure FDA0003619291100000083
其中,Cde(i,j)表示所述第二互相关谱对应的互相关系数,
Figure FDA0003619291100000084
表示所述第二互相关谱的共轭复数;
所述抑制因子初始值计算单元,用于:
基于如下公式根据所述第一互相关系数和所述第二互相关系数计算抑制因子的初始值:
g1(i,j)=min[Cde(i,j),1-Cxd(i,j)]
其中,g1(i,j)表示所述抑制因子的初始值。
11.一种终端,其特征在于,所述终端包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的语音信号处理方法。
CN201911349457.2A 2019-12-24 2019-12-24 一种语音信号处理方法、装置及终端 Active CN110992975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911349457.2A CN110992975B (zh) 2019-12-24 2019-12-24 一种语音信号处理方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911349457.2A CN110992975B (zh) 2019-12-24 2019-12-24 一种语音信号处理方法、装置及终端

Publications (2)

Publication Number Publication Date
CN110992975A CN110992975A (zh) 2020-04-10
CN110992975B true CN110992975B (zh) 2022-07-12

Family

ID=70076354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911349457.2A Active CN110992975B (zh) 2019-12-24 2019-12-24 一种语音信号处理方法、装置及终端

Country Status (1)

Country Link
CN (1) CN110992975B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111048118B (zh) * 2019-12-24 2022-07-26 大众问问(北京)信息科技有限公司 一种语音信号处理方法、装置及终端
CN111048096B (zh) * 2019-12-24 2022-07-26 大众问问(北京)信息科技有限公司 一种语音信号处理方法、装置及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103688522A (zh) * 2011-05-18 2014-03-26 谷歌公司 时钟漂移补偿方法和装置
CN110431624A (zh) * 2019-06-17 2019-11-08 深圳市汇顶科技股份有限公司 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备
CN113763975A (zh) * 2020-06-05 2021-12-07 大众问问(北京)信息科技有限公司 一种语音信号处理方法、装置及终端

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7643630B2 (en) * 2004-06-25 2010-01-05 Texas Instruments Incorporated Echo suppression with increment/decrement, quick, and time-delay counter updating
CN102065190B (zh) * 2010-12-31 2013-08-28 杭州华三通信技术有限公司 一种回声消除方法及其装置
WO2012158163A1 (en) * 2011-05-17 2012-11-22 Google Inc. Non-linear post-processing for acoustic echo cancellation
US9123324B2 (en) * 2013-02-28 2015-09-01 Google Inc. Non-linear post-processing control in stereo acoustic echo cancellation
CN104754157B (zh) * 2013-12-26 2017-06-16 联芯科技有限公司 一种残留回声抑制方法和系统
CN109087665B (zh) * 2018-07-06 2022-11-11 南京时保联信息科技有限公司 一种非线性回声抑制方法
CN110335618B (zh) * 2019-06-06 2021-07-30 福建星网智慧软件有限公司 一种改善非线性回声抑制的方法及计算机设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103688522A (zh) * 2011-05-18 2014-03-26 谷歌公司 时钟漂移补偿方法和装置
CN110431624A (zh) * 2019-06-17 2019-11-08 深圳市汇顶科技股份有限公司 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备
CN113763975A (zh) * 2020-06-05 2021-12-07 大众问问(北京)信息科技有限公司 一种语音信号处理方法、装置及终端

Also Published As

Publication number Publication date
CN110992975A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN108615535B (zh) 语音增强方法、装置、智能语音设备和计算机设备
CN111341336B (zh) 一种回声消除方法、装置、终端设备及介质
CN108696648B (zh) 一种短时语音信号处理的方法、装置、设备及存储介质
CN110992975B (zh) 一种语音信号处理方法、装置及终端
CN107240396B (zh) 说话人自适应方法、装置、设备及存储介质
EP3276621A1 (en) Noise suppression device and noise suppressing method
JP6151236B2 (ja) 雑音抑圧装置、その方法及びプログラム
CN111048118B (zh) 一种语音信号处理方法、装置及终端
CN110556125A (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
CN109215672B (zh) 一种声音信息的处理方法、装置及设备
CN113241089A (zh) 语音信号增强方法、装置及电子设备
CN112997249B (zh) 语音处理方法、装置、存储介质及电子设备
WO2024041512A1 (zh) 音频降噪方法、装置、电子设备及可读存储介质
CN111048096B (zh) 一种语音信号处理方法、装置及终端
CN113205824A (zh) 声音信号处理方法、装置、存储介质、芯片及相关设备
US10650839B2 (en) Infinite impulse response acoustic echo cancellation in the frequency domain
CN113763975B (zh) 一种语音信号处理方法、装置及终端
CN112669869B (zh) 噪声抑制方法、设备、装置及存储介质
CN112489669B (zh) 一种音频信号处理方法、装置、设备和介质
CN110827845B (zh) 录音方法、装置、设备及存储介质
CN113824843A (zh) 语音通话质量检测方法、装置、设备及存储介质
CN110661510A (zh) 波束形成器形成方法、波束形成方法、装置及电子设备
CN114387983A (zh) 一种噪声抑制参数处理方法、装置及计算机设备
CN112735458B (zh) 噪声估计方法、降噪方法及电子设备
CN114387982A (zh) 一种语音信号处理方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant