CN1210608A - 一种有噪语音参数增强的方法和装置 - Google Patents

一种有噪语音参数增强的方法和装置 Download PDF

Info

Publication number
CN1210608A
CN1210608A CN97191991A CN97191991A CN1210608A CN 1210608 A CN1210608 A CN 1210608A CN 97191991 A CN97191991 A CN 97191991A CN 97191991 A CN97191991 A CN 97191991A CN 1210608 A CN1210608 A CN 1210608A
Authority
CN
China
Prior art keywords
mentioned
uproar
making
parameter
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN97191991A
Other languages
English (en)
Inventor
P·亨德尔
P·泽奎斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN1210608A publication Critical patent/CN1210608A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Abstract

通过确定(22,26)一个背景噪声的PSD估计,确定(18)有噪语音的参数,从语音参数中确定(20)有噪语音的一个PSD估计,从有噪语音的PSD估计中减去一个背景噪声的PSD估计,并从增强的语音PSD估计中估计增强的语音参数,来达到增强有噪语音的参数的目的。

Description

一种有噪语音参数增强的方法和装置
                           技术领域
本发明涉及一种对有噪语音进行参数增强的方法和装置,它们可被用于例如电话系统中的噪声抑制装置中。
                           发明背景
信号处理中的一种常见的问题是从有噪声的测量值中对信号进行增强。例如,这种情况可以是在单麦克风电话系统,既可以是传统的电话也可以是蜂窝电话,增强语音的质量,其中的语音被有色噪声所削弱,比如在蜂窝电话系统中的汽车噪声。
一种常见的噪声抑制方法是基于卡尔曼滤波的,因为这种方法可以处理有色噪声,并具有较好的数值复杂性。基于卡尔曼滤波的噪声抑制方法的主要参考文献是[1]。但是,卡尔曼滤波是一种基于模型的自适应方法,例如其中对语音和噪声都是按自回归(AR)过程来建立模型的。这样,卡尔曼滤波中的一个主要问题是滤波算法依赖于一套必须被估计出来的未知参数集。关于估计所包含参数的最重要的两个问题是(ⅰ)语音的自回归参数是从削弱的语音数据中估计出来的,(ⅱ)语音数据是非平稳的。这样,为了获得具有高听觉质量的卡尔曼滤波的输出,被估计参数的准确性和精确度就是至关重要的。
                           发明概要
本发明的一个目标是提供一种改进的方法和装置,用于有噪语音参数的估计。这些增强了的语音参数可被用于对有噪语音进行卡尔曼滤波以抑制噪声。另外,增强了的语音也可被直接用于语音编码中的语音参数。
上述目标是通过按照权利要求1的方法与按照权利要求11的装置来完成的。
                           附图简述
本发明,通过结合附图一起参考下文描述,它与其他目标和优点可以在更大程度上被理解,其中:
图1是按照本发明的装置的方框图。
图2是用于图1所示装置中的一种语音活动检测器(VAD)的状态图。
图3是按照本发明方法的流程图。
图4说明了有噪语音的功率谱密度(PSD)的基本特征。
图5说明了背景噪声的一种简单的功率谱密度PSD。
图6说明了从图4中的PSD减去图5所示的PSD后所导致的PSD。
图7以一个损耗函数形式说明了通过本发明获得的改进。
图8以一个损耗比率形式说明了通过本发明获得的改进。
优选实施方案详述
在语音信号处理中,输入语音经常被背景噪声所污染。例如,在免提汽车电话中,语音对背景噪声的比率可能低至0分贝,甚至更低。这么高的噪声电平严重地降低了通话的质量,不但由于高噪声电平本身,也由于当对有噪语音编码并通过一个数字通讯信道传送时产生的听觉赝象。为了减少这种听觉赝象,有时需要通过某种噪声抑制的方法,例如通过卡尔曼滤波[1]来对有噪的输入语音进行预处理。
在某些噪声抑制方法中(例如卡尔曼滤波)自回归参数(AR)是非常有趣的。因此,对于这些方法,为了产生具有高听觉质量的增强语音输出,从有噪语音数据中精确地估计自回归参数是必须的。现在,将参考图1至6来描述这样一个有噪语音参数增强方法。
图1中,从麦克风10得到一个连续模拟信号x(t)。信号x(t)被送入一个A/D转换器12。这个A/D转换器(并具有适当的数据缓冲)产生声音数据帧{x(k)}(包括语音,或包括背景噪声,也可以两者都包括)。一个声音帧在8000Hz的采样率下,通常包含100-300音频采样点。为了简化下面的讨论,假设一帧长度为N=250个采样点。声音帧{x(k)}被送入一个声音活动检测器(VAD)14,该检测器控制着一个开关16,其用途是根据VAD14的状态把声音帧{x(k)}送入装置中的不同模块。
VAD14可以按照[2]中所讨论的原理来设计,通常是以状态机的形式被实现的。图2说明了这样一个状态机的可能状态。在状态0,VAD14是空闲的或“非活性的”,它说明声音帧{x(k)}未被进一步处理。状态20表示一个噪声电平,并且没有语音。状态21表示一个噪声电平和一个低语音/噪声比。在语音活动与噪声的转移期间,这个状态被激活。最后,状态22表示一个噪声电平和高语音/噪声比。
一个声音帧{x(k)}含有声音采样点,可被表示为:
        x(k)=s(k)+v(k)    k=1,…,N    (1)
其中x(k)代表有噪语音的采样值,s(k)代表语音的采样值,而v(k)代表外加的有色背景噪声。假设有噪语音信号在一帧之间是平稳的。而且语音信号s(k)可用一个r阶自回归(AR)模型来描述: s ( k ) = - Σ i = 1 I c i s ( k - i ) + w s ( k ) - - - ( 2 )
其中Ws(k)的方差已知是σs 2。类似地,V(k)可通过一个q阶AR模型来描述 v ( k ) = - Σ i = 1 q b i v ( k - i ) + w v ( k ) - - - ( 3 )
其中Wv(k)的方差已知是σv 2。r和q都远小于帧长度N。一般,r的取值最好在10左右,而q最好在0-7之间取值,例如4(q=0对应于一个恒定的功率谱密度,即白噪声)。关于语音AR建模的更多的信息可从[3]中找到。
而且,有噪语音的功率谱密度Φx(w)可被分为语音的功率谱密度Φs(w)与背景噪声的功率谱密度Φv(w)之和,也就是
        Φx(ω)=Φs(ω)+Φv(ω)    (4)按照(2),它满足 φ x ( ω ) = σ s 2 | l + Σ m = 1 I c m e - iωm | 2 - - - ( 5 ) 类似地,按照(3),它满足 φ v ( ω ) = σ v 2 | l + Σ m = 1 q b m e - iωm | 2 - - - ( 6 )
根据(2)-(3),x(k)等于一个具有功率谱密度Φx(w)的自相关移动平均模型(ARMA)。Φx(w)的一个估计(在这里和以后估计值用一个“^”来表示)可以通过一个自回归模型(AR)得到,也就是 φ x ( ω ) = σ x 2 ^ | l + Σ m = 1 p a m ^ e - iωm | 2 - - - ( 7 ) 其中{l})和 是AR模型中的被估计出的参数。 ( k ) = - Σ i = 1 p a i x ( k - i ) + w x ( k ) - - - ( 8 ) 其中Wx(k)的方差已知是σx 2,并且r≤p≤N。应当注意,在(7)中
Figure A9719199100084
不是Φx(w)在统计上的一致估计量。但在语音信号处理中,这并不是一个严重的问题,因为事实上X(k)根本不是平稳过程。
在图1中,当VAD 14把语音(图2中的状态21和22)信号X(k)送入一个有噪语音AR估计器18时,估计器18就估计方程(8)中的参数σx 2,{a5}。这个估计可以按[3]来进行(在图3所示的流程图中,这对应于步骤120)。被估计出来的参数被送入模块20,其作用是按方程(7)(图3中的步骤130)来计算输入信号X(k)的功率谱密度的一个估计。
本发明的一个基本特征是,背景噪声是按长时平稳来对待的,也就是在几帧信号中时平稳的。因为当在没有S(k)的周期中,语音的强度通常足够低以至于足以估计噪声模型,所以长时平稳特征可以被用于在有噪语音帧的功率谱密度中减去噪声的功率谱密度,这是通过在噪声帧期间存储噪声模型参数而在有噪语音帧使用这些参数来实现的。因此,当VAD 14表现为背景噪声状态(图2中的状态20)时,该帧数据被送入一个噪声AR参数估计器22,它估计这一帧噪声的参数σv 2,和{bj}(这对应于图3所示的流程图中的步骤140)。如上所述,估计出的参数存储于缓冲区24,以备在以后有噪语音帧(图3中的步骤150)中使用。当需要使用这些参数时(在一个有噪语音帧期间),它们将从缓冲区24中被取出来。这些参数同时也被送入模块26用于背景噪声的功率谱密度估计,或者在噪声帧期间(图3中的步骤160),这意味着所得到的估计值必须被缓冲存储以备后用,或者在下一语音帧期间,这意味着必须被存储的只有参数。因此,对于只含背景再生的帧数据,所估计出的参数并不实际用于增强的目的。而是把噪声信号送入衰减器28中,该衰减器以例如10分贝来衰减噪声的强度(图3中的步骤170)。在方程(7)中定义的功率谱密度(PSD)的估计量
Figure A9719199100091
,还有通过一个类似于(6)的方程定义的,但在AR参数和σv 2上有“^”符号的PSD估计量 ,都是频率ω的函数。下一个步骤是执行实际的PSD相减,这一步是在模块30中完成的(图3中的步骤180)。按本发明,语音信号的功率谱密度是按照下式估计的 φ s ( ω ) = φ x ( ω ) - δ φ v ( ω ) - - - ( 9 )
其中δ是一个标量的构造变量,通常在间隔0<δ<4中取值。一般情况下,δ具有一个在1附近的值(δ=1对应于方程(4))。
本发明的一个基本特点是为了获得增强的PSD的准确图样,增强的PSD
Figure A9719199100094
是在频率域ω上以一个充分大的数目进行采样的。事实上,PSD是在一组离散频率集上来被计算的。 ω = 2 πm M m = 1 , . . . , M - - - ( 10 ) 参看[3],它给出了PSD估计的一个离散序列。 { φ x ( 1 ) , φ s ( 2 ) , . . . , φ s ( M ) } = { φ s ( m ) } m = 1 . . . M - - - ( 11 ) 这个特征还可通过图4-6来进一步说明。图4说明了有噪语音的一个典型的PSD估计 。图5说明了背景噪声的一个典型的PSD估计
Figure A9719199100098
。在这种情况下,图4和图5中所示信号之间的信噪比是0分贝。图6说明了按照方程(9),在减去噪声之后增强的PSD估计
Figure A9719199100099
,这里δ=1。因为PSD估计
Figure A97191991000910
的形状对于增强的语音参数的估计是至关重要的,所以使增强的PSD估计 以一个充分大的频率数来被采样以给出函数形状的真实图样(尤其是峰),正是本发明的一个基本特点。
实际上, 是按照公式(6)和(7)来被采样的。例如,在公式(7)中, 可以通过快速傅立叶变换(FFT)来被采样。因此,1,a1,a2,…,ap可被看作是一个序列,这个序列的FFT将被计算出来。因为采样数M必须大于P(P大约是10-20),所以有必要对序列补0。对于M,适合的值是2的幂,例如64,128,256。但是通常选择采样数M小于帧长256(在这个例子中N=256)。而且,由于
Figure A97191991000914
是功率的谱密度,是一个非负实数,在增强的语音参数从采样的增强PSD估计
Figure A9719199100101
中计算出来之前,
Figure A9719199100102
的采样值必须被限制为非负值。
在模块30执行PSD相减之后,采样值集合
Figure A9719199100103
被送入模块32以便从PSD估计(图3中的步骤190)中计算增强的语音参数。这个操作是模块20和26的逆操作,模块20和26是从AR参数来计算PSD估计。因为直接从PSD估计中显式地提取这些参数是不可能的,所以必须使用迭代算法。可以使用系统辨识的一个通用算法,例如在[4]中所提出的算法。
在附录中,也描述了一个用于计算参数的优选过程。
增强的参数或者可直接用于例如语音编码方面,或者可用于控制一个滤波器,例如图1所示噪声抑制器中的卡尔曼滤波器34(图3中的步骤200)。卡尔曼滤波器34也受到所估计出的噪声AR参数的控制,这两个参数集按照[1]中描述的原理控制卡尔曼滤波器,使之对含有有噪语音的帧数据{X(k)}进行滤波。
如果在一个应用中只需要增强的语音参数,那么实际地估计噪声AR参数就不是必须的(在图1中的噪声抑制器中,噪声AR参数必须被估计出来,因为它们控制着卡尔曼滤波器34)。而背景噪声的长时平稳被用于估计Φv(ω)。例如,可能用到 φ v ( ω ) ( m ) = ρ φ v ( ω ) ( m - 1 ) + ( 1 - ρ ) φ v ‾ ( ω ) - - - ( 12 )
其中 是基于一直到并包括帧数m的数据的(持续的)平均PSD估计, 是基于当前帧的估计
Figure A9719199100107
可以通过周期图(FFT)从输入数据直接被估计出来)。因子ρ∈(0,1)相对于假设的V(k)的平稳性而被调节。在τ帧内的平均近似地对应于ρ,由 τ = 2 1 - ρ - - - ( 13 ) 隐式地确定。例如,参数ρ可以具有一个0.95附近的值。
在一个优选实施方案中,按照(12)的平均同时也作用于按照(6)的参数PSD估计。这个平均过程可以是图1中模块26的一部分,同时也可作为图3中的步骤160来执行。
在图1所示实施方案的修改版中,衰减器28可以被省去。而卡尔曼滤波器34可被用作信号X(k)的一个衰减器。在这种情况下,背景噪声AR模型的参数被送入卡尔曼滤波器34的所有两个控制输入端,但以一个具有较低方差的参数(对应于所需要的衰减)送入在语音帧期间接受增强语音参数的控制输入端。
而且,如果由计算增强的语音参数所引起的延时被认为过长,按照本发明的一个修改实施方案,使用当前语音帧的增强语音参数来对下一语音帧进行滤波是可能的(在这个实施方案中,语音被看作在两帧之内是平稳的)。在这个修改的实施方案中,一个语音帧的增强语音参数可以的计算与下述过程,即用先前的语音帧的增强参数对该帧进行的滤波同时进行。
按本发明的方法的基本算法现在可以总结如下:
在语音休止期,做下列工作
-对于M个序列的集合,估计背景噪声的PSD
Figure A9719199100111
。这里任何类型的PSD都可能用到,例如参数的或非参数的(周期图)估计。按(12)用长时平均减小PSD估计的误差的方差。
对于语音的活动期:在每一帧中,做下列工作
-基于{X(k)}估计AR参数{ai}以及有噪语音的残差方差σx 2
-基于这些有噪语音参数,对于M个序列的集合计算有噪语音的PSD估计
Figure A9719199100112
-基于
Figure A9719199100114
,用(9)计算语音PSD
Figure A9719199100115
的一个估计。因子δ是一个近似为1的构造变量。
-基于增强的PSD ,计算增强的AR参数以及对应的残差。
图1所示装置中的大多数模块最好都以一个或几个微/信号处理器的组合来实现(例如模块14,18,20,22,26,30,32以及34)。
为了说明按本发明的这个方法的性能,做了几个仿真实验。为了衡量增强参数对原始参数的改善,对于200个不同的仿真情况,计算了如下的测度: v = 1 200 Σ m = 1 200 ( Σ k = 1 M [ log ( φ ( k ) ) - log ( φ s ( k ) ) ] 2 Σ k = 1 M log ( φ s ( k ) ) 2 ) ( m ) - - - ( 14 ) 对于有噪的和增强的参数都要计算这个测度(泄漏函数),也就是说,
Figure A9719199100121
或者代表
Figure A9719199100122
或者代表
Figure A9719199100123
。在(14)中,(·)(m)代表仿真数目m的结果。这两个测度在图7中得到说明。图8说明了这两个测度之间的比率。从图中可见,对于低信噪比(SNR<15db)增强参数的工作性能比有噪参数要好,而对于高信噪比,两种参数集合的性能几乎是一样的。在低信噪比值的情况下,对于给定的测度V的值,在增强参数和有噪参数之间的SNR的改善是以7dB为数量级的。
精通技术的人都可以理解,对于本发明,在不偏离由附带的权利要求所定义的精神和范围的条件下,可以作很多改进和变化。
                              附录
为了增加增强参数的估计的数值鲁棒性,式(11)中所估计的增强PSD数据将按照下面的非线性变换作变换 T ^ = ( γ ^ ( 1 ) , γ ^ ( 2 ) , . . . , γ ^ ( M ) ) T - - - ( 15 ) 其中
而ε是一个用户选定或依赖于数据的阈值,它确保
Figure A9719199100126
是一个实数。使用某些粗略的近似(基于傅立叶级数展开,采样数较大的假定,以及较高的模型阶数),在有兴趣的频率间隔,得到
Figure A9719199100127
方程(17)给出
Figure A9719199100128
在(18)中,表达式γ(k)被定义为 γ ( k ) = E [ γ ^ ( k ) ] = - log ( σ s 2 ) + log ( | 1 + Σ m = 1 I c m e - i 2 πk M m | 2 ) - - - ( 19 )
假设有统计意义上有效的估计 ,以及对应的协方差矩阵
Figure A9719199100133
的估计,向量
        x=(σs 2,c1,c2…,cr)T    (20)以及它的协方差矩阵Px可以以初始的估计值
Figure A9719199100134
Figure A9719199100135
Figure A9719199100136
按下式计算 G ( k ) = [ ∂ Γ ( x ) ∂ x | x = x ^ ( k ) ] T P x ^ ( k ) = [ G ( k ) P ^ Γ - 1 G T ( k ) ] - 1 x ^ ( k + 1 ) = x ^ ( k ) + P ^ x ( k ) P ^ Γ - 1 [ Γ - Γ ( x ( k ) ^ ) ] - - - ( 21 ) 在上述算法中,r(x)和x之间的关系由下式给定
      Γ(x)=(γ(1),γ(2),…,γ(M))T    (22)其中γ(k)由(19)给定。对于
Figure A97191991001310
由于Γ(x)对x的梯度由下式给定 [ ∂ Γ ( x ) ∂ x ] T = ( ψ 1 , ψ 2 , . . . , ψ M ) - - - ( 24 )
所以上述算法(21)包括对估计
Figure A97191991001312
的许多计算。这些计算的主要部分来自于与(M×M)矩阵 的相乘及其转置。但是,
Figure A97191991001314
接近于对角矩阵(参看方程(18))并可近似为 P ^ Γ = 2 r N I = const • I - - - ( 25 )
其中I代表(M×M)的单位矩阵。因此,根据优选实施方案,可以以初始估计值
Figure A9719199100142
Figure A9719199100143
,用下列次优算法 G ( k ) = [ ∂ Γ ( x ) ∂ x | x = x ^ ( k ) ] T x ^ ( k + 1 ) = x ^ ( k ) + [ G ( k ) G T ( k ) ] - 1 G ( k ) [ Γ - Γ ( x ^ ( k ) ) ] - - - ( 26 ) 在(26)中,G(k)的维数为((r+1)×M)。
                           参考文献[1]J.D.Gibson,B.Koo和S.D.Gray,“语音增强和编码用的有色
噪声滤波”,IEEE声学、语音和信号处理文集,第39卷,8期第
1732~1742页,1991年8月。[2]D.K.Freeman,G.Cosier,C.B.Southcott和I.Boyd,“泛欧数
字蜂窝移动电话服务用话音活动检测器”1989 IEEE声学、语音和
信号处理国际会议,1989年第489-502页。[3]J.S.Lim和A.V.Oppenheim,“弱化语音的全极点建模,”IEEE
声学、语音和信号处理文集,第ASSP-26卷3期,1978年6月第
228-231。
[4]T.Soderstrom,P.stoica,和B.Friedlander,“系统识别的间接预测误差方法。”Automatica,27卷,1期第183-188页1991年。

Claims (17)

1.一种有噪语音参数增强的方法,其特点是
从背景噪声采样值的第一个集合开始,以M个频率确定背景噪声的一个功率谱密度的估计,其中M是一个预先确定的正整数。
从背景噪声采样值的第二个集合估计P个自回归参数,以及第一个残余方差,其中P是一个预先确定的正整数且远小于M。
以上述的M个频率,从上述的P个自回归参数以及第一个残余方差中,确定有噪语音的一个功率谱密度的估计。
通过从上述有噪语音功率谱密度的估计中减去上述背景噪声的谱密度估计乘以一个预先确定正比例因子的乘积,确定增强的语音的一个功率谱密度的估计。
从上述增强的语音功率谱密度估计中,确定r个增强的自回归参数和一个增强的残余方差,其中r是一个预先确定的正整数。
2.权利要求1中的方法,其特点是,限制上述增强的语音功率谱密度的估计为非负值。
3.权利要求2中的方法,其特点是,上述预先确定的正比例因子在0-4的范围内取值。
4.权利要求3中的方法,其特点是,上述预先确定的正比例因子近似等于1。
5.权利要求4中的方法,其特点是,上述预先确定的整数r等于上述预先确定的整数P。
6.权利要求5中的方法,其特点是,
从背景噪声采样值的第一个集合估计q个自回归参数,以及第二个残余方差,其中q是一个预先确定的正整数且远小于p。
以上述的M个频率,从上述的q个自回归参数以及第二个残差方差中,确定背景噪声的功率谱密度的估计。
7.权利要求1或6中的方法,其特点是,在一个预先确定的背景噪声采样值的集合数上,对上述背景噪声功率谱密度的估计做平均。
8.前面任何一个权利要求中的方法,其特点是,使用上述增强的自回归参数和上述增强的残余方差来调整一个滤波器,目的是对有噪语音采样值的第三个集合进行滤波。
9.权利要求8中的方法,其特点是,上述有噪语音采样值的第二个和第三个集合是同一个集合。
10.权利要求8或9中的方法,其特点是,用卡尔曼滤波的方法对上述有噪语音采样值的第三个集合进行滤波。
11.一个有噪语音参数增强装置,其特点是,
装置(22,26)用于从背景噪声采样值的第一个集合以M个频率确定背景噪声的功率谱密度的一个估计,其中M是一个预先确定的正整数。
装置(18)用于从背景噪声采样值的第二个集合估计P个自回归参数,以及第一个残余方差,其中P是一个预先确定的正整数且远小于M。
装置(20)用于以上述的M个频率,从上述的P个自回归参数以及第一个残余方差中,确定有噪语音的一个功率谱密度的估计。
装置(30)用于通过从上述有噪语音功率谱密度的估计中减去上述背景噪声的谱密度估计乘以一个预先确定正比例因子的乘积,确定增强的语音的一个功率谱密度的估计。
装置(32)用于从上述增强的语音功率谱密度估计中,确定r个增强的自回归参数和一个增强的残余方差,其中r是一个预先确定的正整数。
12.权利要求11中的装置,其特点是,装置(30)限制上述增强的语音功率谱密度的估计为非负值。
13.权利要求12中的装置,其特点是,
装置(22)用于从背景噪声采样值的第一个集合估计q个自回归参数,以及第二个残余方差,其中q是一个预先确定的正整数且远小于p。
装置(26)用于以上述的M个频率,从上述的q个自回归参数以及第二个残余方差中,确定背景噪声的功率谱密度的估计。
14.权利要求11或13中的装置,其特点是,装置(26)在一个预先确定的背景噪声采样值的集合数上,对上述背景噪声功率谱密度的估计做平均。
15.前面任何一个权利要求中的装置,其特点是,装置(34)使用上述增强的自回归参数和上述增强的残余方差来调整一个滤波器,目的是对有噪语音采样值的第三个集合进行滤波。
16.权利要求15中的装置,其特点是,卡尔曼滤波器(34)对上述有噪语音采样值的第三个集合进行滤波。
17.权利要求15中的装置,其特点是,卡尔曼滤波器(34)对上述有噪语音采样值的第三个集合进行滤波,上述有噪语音采样值的第二个和第三个集合是同一个集合。
CN97191991A 1996-02-01 1997-01-27 一种有噪语音参数增强的方法和装置 Pending CN1210608A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE96003637 1996-02-01
SE9600363A SE506034C2 (sv) 1996-02-01 1996-02-01 Förfarande och anordning för förbättring av parametrar representerande brusigt tal

Publications (1)

Publication Number Publication Date
CN1210608A true CN1210608A (zh) 1999-03-10

Family

ID=20401227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN97191991A Pending CN1210608A (zh) 1996-02-01 1997-01-27 一种有噪语音参数增强的方法和装置

Country Status (10)

Country Link
US (1) US6324502B1 (zh)
EP (1) EP0897574B1 (zh)
JP (1) JP2000504434A (zh)
KR (1) KR100310030B1 (zh)
CN (1) CN1210608A (zh)
AU (1) AU711749B2 (zh)
CA (1) CA2243631A1 (zh)
DE (1) DE69714431T2 (zh)
SE (1) SE506034C2 (zh)
WO (1) WO1997028527A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100336307C (zh) * 2005-04-28 2007-09-05 北京航空航天大学 接收机射频系统电路内部噪声的分配方法
CN102124518A (zh) * 2008-08-05 2011-07-13 弗朗霍夫应用科学研究促进协会 采用特征提取处理音频信号用于语音增强的方法和装置
CN102637438A (zh) * 2012-03-23 2012-08-15 同济大学 一种语音滤波方法
CN107197090A (zh) * 2017-05-18 2017-09-22 维沃移动通信有限公司 一种语音信号的接收方法及移动终端
CN107481733A (zh) * 2016-06-08 2017-12-15 福特全球技术公司 声信号的选择性放大
CN110931007A (zh) * 2019-12-04 2020-03-27 苏州思必驰信息科技有限公司 语音识别方法及系统

Families Citing this family (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
FR2799601B1 (fr) * 1999-10-08 2002-08-02 Schlumberger Systems & Service Dispositif et procede d'annulation de bruit
US6980950B1 (en) * 1999-10-22 2005-12-27 Texas Instruments Incorporated Automatic utterance detector with high noise immunity
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6983242B1 (en) * 2000-08-21 2006-01-03 Mindspeed Technologies, Inc. Method for robust classification in speech coding
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
DE10124189A1 (de) * 2001-05-17 2002-11-21 Siemens Ag Verfahren zum Signalempfang
GB2380644A (en) * 2001-06-07 2003-04-09 Canon Kk Speech detection
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
US20090163168A1 (en) * 2005-04-26 2009-06-25 Aalborg Universitet Efficient initialization of iterative parameter estimation
JP4690912B2 (ja) * 2005-07-06 2011-06-01 日本電信電話株式会社 目的信号区間推定装置、目的信号区間推定方法、プログラム及び記録媒体
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7844453B2 (en) * 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
EP2115742B1 (en) * 2007-03-02 2012-09-12 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements in a telecommunications network
ES2570961T3 (es) * 2007-03-19 2016-05-23 Dolby Laboratories Licensing Corp Estimación de varianza de ruido para mejorar la calidad de voz
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8392181B2 (en) * 2008-09-10 2013-03-05 Texas Instruments Incorporated Subtraction of a shaped component of a noise reduction spectrum from a combined signal
US8244523B1 (en) * 2009-04-08 2012-08-14 Rockwell Collins, Inc. Systems and methods for noise reduction
US8548802B2 (en) * 2009-05-22 2013-10-01 Honda Motor Co., Ltd. Acoustic data processor and acoustic data processing method for reduction of noise based on motion status
US10706373B2 (en) 2011-06-03 2020-07-07 Apple Inc. Performing actions associated with task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9324337B2 (en) * 2009-11-17 2016-04-26 Dolby Laboratories Licensing Corporation Method and system for dialog enhancement
US8600743B2 (en) * 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
JP5834449B2 (ja) * 2010-04-22 2015-12-24 富士通株式会社 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法
CN101930746B (zh) * 2010-06-29 2012-05-02 上海大学 一种mp3压缩域音频自适应降噪方法
US8892436B2 (en) * 2010-10-19 2014-11-18 Samsung Electronics Co., Ltd. Front-end processor for speech recognition, and speech recognizing apparatus and method using the same
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
CN103187068B (zh) * 2011-12-30 2015-05-06 联芯科技有限公司 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN102890935B (zh) * 2012-10-22 2014-02-26 北京工业大学 一种基于快速卡尔曼滤波的鲁棒语音增强方法
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
CN105023580B (zh) * 2015-06-25 2018-11-13 中国人民解放军理工大学 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
CN105788606A (zh) * 2016-04-03 2016-07-20 武汉市康利得科技有限公司 一种用于拾音器的基于递归最小追踪的噪声估计方法
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11373667B2 (en) * 2017-04-19 2022-06-28 Synaptics Incorporated Real-time single-channel speech enhancement in noisy and time-varying environments
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
EP3460795A1 (en) 2017-09-21 2019-03-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal processor and method for providing a processed audio signal reducing noise and reverberation
US10481831B2 (en) * 2017-10-02 2019-11-19 Nuance Communications, Inc. System and method for combined non-linear and late echo suppression

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE15415T1 (de) * 1981-09-24 1985-09-15 Gretag Ag Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung.
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
JP2642694B2 (ja) * 1988-09-30 1997-08-20 三洋電機株式会社 雑音除去方法
KR950013551B1 (ko) * 1990-05-28 1995-11-08 마쯔시다덴기산교 가부시기가이샤 잡음신호예측장치
US5319703A (en) * 1992-05-26 1994-06-07 Vmx, Inc. Apparatus and method for identifying speech and call-progression signals
SE501981C2 (sv) 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
UA41913C2 (uk) 1993-11-30 2001-10-15 Ейті Енд Ті Корп. Спосіб шумозаглушення у системах зв'язку

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100336307C (zh) * 2005-04-28 2007-09-05 北京航空航天大学 接收机射频系统电路内部噪声的分配方法
CN102124518A (zh) * 2008-08-05 2011-07-13 弗朗霍夫应用科学研究促进协会 采用特征提取处理音频信号用于语音增强的方法和装置
CN102124518B (zh) * 2008-08-05 2013-11-06 弗朗霍夫应用科学研究促进协会 采用特征提取处理音频信号用于语音增强的方法和装置
US9064498B2 (en) 2008-08-05 2015-06-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal for speech enhancement using a feature extraction
CN102637438A (zh) * 2012-03-23 2012-08-15 同济大学 一种语音滤波方法
CN102637438B (zh) * 2012-03-23 2013-07-17 同济大学 一种语音滤波方法
CN107481733A (zh) * 2016-06-08 2017-12-15 福特全球技术公司 声信号的选择性放大
CN107197090A (zh) * 2017-05-18 2017-09-22 维沃移动通信有限公司 一种语音信号的接收方法及移动终端
CN110931007A (zh) * 2019-12-04 2020-03-27 苏州思必驰信息科技有限公司 语音识别方法及系统

Also Published As

Publication number Publication date
SE506034C2 (sv) 1997-11-03
AU711749B2 (en) 1999-10-21
US6324502B1 (en) 2001-11-27
DE69714431D1 (de) 2002-09-05
EP0897574B1 (en) 2002-07-31
WO1997028527A1 (en) 1997-08-07
EP0897574A1 (en) 1999-02-24
AU1679097A (en) 1997-08-22
KR100310030B1 (ko) 2001-11-15
DE69714431T2 (de) 2003-02-20
JP2000504434A (ja) 2000-04-11
SE9600363D0 (sv) 1996-02-01
CA2243631A1 (en) 1997-08-07
SE9600363L (sv) 1997-08-02
KR19990081995A (ko) 1999-11-15

Similar Documents

Publication Publication Date Title
CN1210608A (zh) 一种有噪语音参数增强的方法和装置
CN1122970C (zh) 由时域频谱减法减少信号噪声的降噪处理器、方法和电话
CN1727860B (zh) 语音噪音抑制方法和语音噪音抑制器
CN109643554B (zh) 自适应语音增强方法和电子设备
CN102959625B9 (zh) 自适应地检测输入音频信号中的话音活动的方法和设备
CN101080766A (zh) 使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
CN111429932A (zh) 语音降噪方法、装置、设备及介质
JPH08506427A (ja) 雑音減少
CN1650349A (zh) 用于抗噪声语音识别的在线参数直方图正态化
CN113539285B (zh) 音频信号降噪方法、电子装置和存储介质
CA2192397C (en) Method and system for performing speech recognition
CN110556125B (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
CN110111811B (zh) 音频信号检测方法、装置和存储介质
CN112602150A (zh) 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备
CN112599148A (zh) 一种语音识别方法及装置
JP4965891B2 (ja) 信号処理装置およびその方法
CN1134768C (zh) 由时域频谱相减进行信号噪声减小的电话机、处理器及方法
WO2007041789A1 (en) Front-end processing of speech signals
JP3786038B2 (ja) 入力信号処理方法および入力信号処理装置
CN112165558B (zh) 一种双讲状态检测方法、装置、存储介质及终端设备
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
CN114360572A (zh) 语音去噪方法、装置、电子设备及存储介质
CN113066483B (zh) 一种基于稀疏连续约束的生成对抗网络语音增强方法
CN1902684A (zh) 为鲁棒语音识别对语音信号进行处理的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
C20 Patent right or utility model deemed to be abandoned or is abandoned