CN1210608A - 一种有噪语音参数增强的方法和装置 - Google Patents
一种有噪语音参数增强的方法和装置 Download PDFInfo
- Publication number
- CN1210608A CN1210608A CN97191991A CN97191991A CN1210608A CN 1210608 A CN1210608 A CN 1210608A CN 97191991 A CN97191991 A CN 97191991A CN 97191991 A CN97191991 A CN 97191991A CN 1210608 A CN1210608 A CN 1210608A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- uproar
- making
- parameter
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 34
- 206010038743 Restlessness Diseases 0.000 claims description 24
- 238000001228 spectrum Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 19
- 230000002708 enhancing effect Effects 0.000 claims description 18
- 230000003595 spectral effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000005654 stationary process Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Mobile Radio Communication Systems (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
通过确定(22,26)一个背景噪声的PSD估计,确定(18)有噪语音的参数,从语音参数中确定(20)有噪语音的一个PSD估计,从有噪语音的PSD估计中减去一个背景噪声的PSD估计,并从增强的语音PSD估计中估计增强的语音参数,来达到增强有噪语音的参数的目的。
Description
技术领域
本发明涉及一种对有噪语音进行参数增强的方法和装置,它们可被用于例如电话系统中的噪声抑制装置中。
发明背景
信号处理中的一种常见的问题是从有噪声的测量值中对信号进行增强。例如,这种情况可以是在单麦克风电话系统,既可以是传统的电话也可以是蜂窝电话,增强语音的质量,其中的语音被有色噪声所削弱,比如在蜂窝电话系统中的汽车噪声。
一种常见的噪声抑制方法是基于卡尔曼滤波的,因为这种方法可以处理有色噪声,并具有较好的数值复杂性。基于卡尔曼滤波的噪声抑制方法的主要参考文献是[1]。但是,卡尔曼滤波是一种基于模型的自适应方法,例如其中对语音和噪声都是按自回归(AR)过程来建立模型的。这样,卡尔曼滤波中的一个主要问题是滤波算法依赖于一套必须被估计出来的未知参数集。关于估计所包含参数的最重要的两个问题是(ⅰ)语音的自回归参数是从削弱的语音数据中估计出来的,(ⅱ)语音数据是非平稳的。这样,为了获得具有高听觉质量的卡尔曼滤波的输出,被估计参数的准确性和精确度就是至关重要的。
发明概要
本发明的一个目标是提供一种改进的方法和装置,用于有噪语音参数的估计。这些增强了的语音参数可被用于对有噪语音进行卡尔曼滤波以抑制噪声。另外,增强了的语音也可被直接用于语音编码中的语音参数。
上述目标是通过按照权利要求1的方法与按照权利要求11的装置来完成的。
附图简述
本发明,通过结合附图一起参考下文描述,它与其他目标和优点可以在更大程度上被理解,其中:
图1是按照本发明的装置的方框图。
图2是用于图1所示装置中的一种语音活动检测器(VAD)的状态图。
图3是按照本发明方法的流程图。
图4说明了有噪语音的功率谱密度(PSD)的基本特征。
图5说明了背景噪声的一种简单的功率谱密度PSD。
图6说明了从图4中的PSD减去图5所示的PSD后所导致的PSD。
图7以一个损耗函数形式说明了通过本发明获得的改进。
图8以一个损耗比率形式说明了通过本发明获得的改进。
优选实施方案详述
在语音信号处理中,输入语音经常被背景噪声所污染。例如,在免提汽车电话中,语音对背景噪声的比率可能低至0分贝,甚至更低。这么高的噪声电平严重地降低了通话的质量,不但由于高噪声电平本身,也由于当对有噪语音编码并通过一个数字通讯信道传送时产生的听觉赝象。为了减少这种听觉赝象,有时需要通过某种噪声抑制的方法,例如通过卡尔曼滤波[1]来对有噪的输入语音进行预处理。
在某些噪声抑制方法中(例如卡尔曼滤波)自回归参数(AR)是非常有趣的。因此,对于这些方法,为了产生具有高听觉质量的增强语音输出,从有噪语音数据中精确地估计自回归参数是必须的。现在,将参考图1至6来描述这样一个有噪语音参数增强方法。
图1中,从麦克风10得到一个连续模拟信号x(t)。信号x(t)被送入一个A/D转换器12。这个A/D转换器(并具有适当的数据缓冲)产生声音数据帧{x(k)}(包括语音,或包括背景噪声,也可以两者都包括)。一个声音帧在8000Hz的采样率下,通常包含100-300音频采样点。为了简化下面的讨论,假设一帧长度为N=250个采样点。声音帧{x(k)}被送入一个声音活动检测器(VAD)14,该检测器控制着一个开关16,其用途是根据VAD14的状态把声音帧{x(k)}送入装置中的不同模块。
VAD14可以按照[2]中所讨论的原理来设计,通常是以状态机的形式被实现的。图2说明了这样一个状态机的可能状态。在状态0,VAD14是空闲的或“非活性的”,它说明声音帧{x(k)}未被进一步处理。状态20表示一个噪声电平,并且没有语音。状态21表示一个噪声电平和一个低语音/噪声比。在语音活动与噪声的转移期间,这个状态被激活。最后,状态22表示一个噪声电平和高语音/噪声比。
一个声音帧{x(k)}含有声音采样点,可被表示为:
x(k)=s(k)+v(k) k=1,…,N (1)
其中x(k)代表有噪语音的采样值,s(k)代表语音的采样值,而v(k)代表外加的有色背景噪声。假设有噪语音信号在一帧之间是平稳的。而且语音信号s(k)可用一个r阶自回归(AR)模型来描述:
其中Ws(k)的方差已知是σs 2。类似地,V(k)可通过一个q阶AR模型来描述
其中Wv(k)的方差已知是σv 2。r和q都远小于帧长度N。一般,r的取值最好在10左右,而q最好在0-7之间取值,例如4(q=0对应于一个恒定的功率谱密度,即白噪声)。关于语音AR建模的更多的信息可从[3]中找到。
而且,有噪语音的功率谱密度Φx(w)可被分为语音的功率谱密度Φs(w)与背景噪声的功率谱密度Φv(w)之和,也就是
Φx(ω)=Φs(ω)+Φv(ω) (4)按照(2),它满足 类似地,按照(3),它满足
根据(2)-(3),x(k)等于一个具有功率谱密度Φx(w)的自相关移动平均模型(ARMA)。Φx(w)的一个估计(在这里和以后估计值用一个“^”来表示)可以通过一个自回归模型(AR)得到,也就是 其中{l})和
是AR模型中的被估计出的参数。 其中Wx(k)的方差已知是σx 2,并且r≤p≤N。应当注意,在(7)中
不是Φx(w)在统计上的一致估计量。但在语音信号处理中,这并不是一个严重的问题,因为事实上X(k)根本不是平稳过程。
在图1中,当VAD 14把语音(图2中的状态21和22)信号X(k)送入一个有噪语音AR估计器18时,估计器18就估计方程(8)中的参数σx 2,{a5}。这个估计可以按[3]来进行(在图3所示的流程图中,这对应于步骤120)。被估计出来的参数被送入模块20,其作用是按方程(7)(图3中的步骤130)来计算输入信号X(k)的功率谱密度的一个估计。
本发明的一个基本特征是,背景噪声是按长时平稳来对待的,也就是在几帧信号中时平稳的。因为当在没有S(k)的周期中,语音的强度通常足够低以至于足以估计噪声模型,所以长时平稳特征可以被用于在有噪语音帧的功率谱密度中减去噪声的功率谱密度,这是通过在噪声帧期间存储噪声模型参数而在有噪语音帧使用这些参数来实现的。因此,当VAD 14表现为背景噪声状态(图2中的状态20)时,该帧数据被送入一个噪声AR参数估计器22,它估计这一帧噪声的参数σv 2,和{bj}(这对应于图3所示的流程图中的步骤140)。如上所述,估计出的参数存储于缓冲区24,以备在以后有噪语音帧(图3中的步骤150)中使用。当需要使用这些参数时(在一个有噪语音帧期间),它们将从缓冲区24中被取出来。这些参数同时也被送入模块26用于背景噪声的功率谱密度估计,或者在噪声帧期间(图3中的步骤160),这意味着所得到的估计值必须被缓冲存储以备后用,或者在下一语音帧期间,这意味着必须被存储的只有参数。因此,对于只含背景再生的帧数据,所估计出的参数并不实际用于增强的目的。而是把噪声信号送入衰减器28中,该衰减器以例如10分贝来衰减噪声的强度(图3中的步骤170)。在方程(7)中定义的功率谱密度(PSD)的估计量
,还有通过一个类似于(6)的方程定义的,但在AR参数和σv 2上有“^”符号的PSD估计量
,都是频率ω的函数。下一个步骤是执行实际的PSD相减,这一步是在模块30中完成的(图3中的步骤180)。按本发明,语音信号的功率谱密度是按照下式估计的
其中δ是一个标量的构造变量,通常在间隔0<δ<4中取值。一般情况下,δ具有一个在1附近的值(δ=1对应于方程(4))。
本发明的一个基本特点是为了获得增强的PSD的准确图样,增强的PSD
是在频率域ω上以一个充分大的数目进行采样的。事实上,PSD是在一组离散频率集上来被计算的。 参看[3],它给出了PSD估计的一个离散序列。 这个特征还可通过图4-6来进一步说明。图4说明了有噪语音的一个典型的PSD估计
。图5说明了背景噪声的一个典型的PSD估计
。在这种情况下,图4和图5中所示信号之间的信噪比是0分贝。图6说明了按照方程(9),在减去噪声之后增强的PSD估计,这里δ=1。因为PSD估计
的形状对于增强的语音参数的估计是至关重要的,所以使增强的PSD估计
以一个充分大的频率数来被采样以给出函数形状的真实图样(尤其是峰),正是本发明的一个基本特点。
实际上,
是按照公式(6)和(7)来被采样的。例如,在公式(7)中,
可以通过快速傅立叶变换(FFT)来被采样。因此,1,a1,a2,…,ap可被看作是一个序列,这个序列的FFT将被计算出来。因为采样数M必须大于P(P大约是10-20),所以有必要对序列补0。对于M,适合的值是2的幂,例如64,128,256。但是通常选择采样数M小于帧长256(在这个例子中N=256)。而且,由于是功率的谱密度,是一个非负实数,在增强的语音参数从采样的增强PSD估计
中计算出来之前,
的采样值必须被限制为非负值。
在模块30执行PSD相减之后,采样值集合
被送入模块32以便从PSD估计(图3中的步骤190)中计算增强的语音参数。这个操作是模块20和26的逆操作,模块20和26是从AR参数来计算PSD估计。因为直接从PSD估计中显式地提取这些参数是不可能的,所以必须使用迭代算法。可以使用系统辨识的一个通用算法,例如在[4]中所提出的算法。
在附录中,也描述了一个用于计算参数的优选过程。
增强的参数或者可直接用于例如语音编码方面,或者可用于控制一个滤波器,例如图1所示噪声抑制器中的卡尔曼滤波器34(图3中的步骤200)。卡尔曼滤波器34也受到所估计出的噪声AR参数的控制,这两个参数集按照[1]中描述的原理控制卡尔曼滤波器,使之对含有有噪语音的帧数据{X(k)}进行滤波。
如果在一个应用中只需要增强的语音参数,那么实际地估计噪声AR参数就不是必须的(在图1中的噪声抑制器中,噪声AR参数必须被估计出来,因为它们控制着卡尔曼滤波器34)。而背景噪声的长时平稳被用于估计Φv(ω)。例如,可能用到
其中
是基于一直到并包括帧数m的数据的(持续的)平均PSD估计,
是基于当前帧的估计
可以通过周期图(FFT)从输入数据直接被估计出来)。因子ρ∈(0,1)相对于假设的V(k)的平稳性而被调节。在τ帧内的平均近似地对应于ρ,由 隐式地确定。例如,参数ρ可以具有一个0.95附近的值。
在一个优选实施方案中,按照(12)的平均同时也作用于按照(6)的参数PSD估计。这个平均过程可以是图1中模块26的一部分,同时也可作为图3中的步骤160来执行。
在图1所示实施方案的修改版中,衰减器28可以被省去。而卡尔曼滤波器34可被用作信号X(k)的一个衰减器。在这种情况下,背景噪声AR模型的参数被送入卡尔曼滤波器34的所有两个控制输入端,但以一个具有较低方差的参数(对应于所需要的衰减)送入在语音帧期间接受增强语音参数的控制输入端。
而且,如果由计算增强的语音参数所引起的延时被认为过长,按照本发明的一个修改实施方案,使用当前语音帧的增强语音参数来对下一语音帧进行滤波是可能的(在这个实施方案中,语音被看作在两帧之内是平稳的)。在这个修改的实施方案中,一个语音帧的增强语音参数可以的计算与下述过程,即用先前的语音帧的增强参数对该帧进行的滤波同时进行。
按本发明的方法的基本算法现在可以总结如下:
在语音休止期,做下列工作
对于语音的活动期:在每一帧中,做下列工作
-基于{X(k)}估计AR参数{ai}以及有噪语音的残差方差σx 2。
-基于增强的PSD
,计算增强的AR参数以及对应的残差。
图1所示装置中的大多数模块最好都以一个或几个微/信号处理器的组合来实现(例如模块14,18,20,22,26,30,32以及34)。
为了说明按本发明的这个方法的性能,做了几个仿真实验。为了衡量增强参数对原始参数的改善,对于200个不同的仿真情况,计算了如下的测度: 对于有噪的和增强的参数都要计算这个测度(泄漏函数),也就是说,
或者代表
或者代表
。在(14)中,(·)(m)代表仿真数目m的结果。这两个测度在图7中得到说明。图8说明了这两个测度之间的比率。从图中可见,对于低信噪比(SNR<15db)增强参数的工作性能比有噪参数要好,而对于高信噪比,两种参数集合的性能几乎是一样的。在低信噪比值的情况下,对于给定的测度V的值,在增强参数和有噪参数之间的SNR的改善是以7dB为数量级的。
精通技术的人都可以理解,对于本发明,在不偏离由附带的权利要求所定义的精神和范围的条件下,可以作很多改进和变化。
附录
为了增加增强参数的估计的数值鲁棒性,式(11)中所估计的增强PSD数据将按照下面的非线性变换作变换 其中
而ε是一个用户选定或依赖于数据的阈值,它确保
是一个实数。使用某些粗略的近似(基于傅立叶级数展开,采样数较大的假定,以及较高的模型阶数),在有兴趣的频率间隔,得到方程(17)给出在(18)中,表达式γ(k)被定义为
参考文献[1]J.D.Gibson,B.Koo和S.D.Gray,“语音增强和编码用的有色
噪声滤波”,IEEE声学、语音和信号处理文集,第39卷,8期第
1732~1742页,1991年8月。[2]D.K.Freeman,G.Cosier,C.B.Southcott和I.Boyd,“泛欧数
字蜂窝移动电话服务用话音活动检测器”1989 IEEE声学、语音和
信号处理国际会议,1989年第489-502页。[3]J.S.Lim和A.V.Oppenheim,“弱化语音的全极点建模,”IEEE
声学、语音和信号处理文集,第ASSP-26卷3期,1978年6月第
228-231。
[4]T.Soderstrom,P.stoica,和B.Friedlander,“系统识别的间接预测误差方法。”Automatica,27卷,1期第183-188页1991年。
Claims (17)
1.一种有噪语音参数增强的方法,其特点是
从背景噪声采样值的第一个集合开始,以M个频率确定背景噪声的一个功率谱密度的估计,其中M是一个预先确定的正整数。
从背景噪声采样值的第二个集合估计P个自回归参数,以及第一个残余方差,其中P是一个预先确定的正整数且远小于M。
以上述的M个频率,从上述的P个自回归参数以及第一个残余方差中,确定有噪语音的一个功率谱密度的估计。
通过从上述有噪语音功率谱密度的估计中减去上述背景噪声的谱密度估计乘以一个预先确定正比例因子的乘积,确定增强的语音的一个功率谱密度的估计。
从上述增强的语音功率谱密度估计中,确定r个增强的自回归参数和一个增强的残余方差,其中r是一个预先确定的正整数。
2.权利要求1中的方法,其特点是,限制上述增强的语音功率谱密度的估计为非负值。
3.权利要求2中的方法,其特点是,上述预先确定的正比例因子在0-4的范围内取值。
4.权利要求3中的方法,其特点是,上述预先确定的正比例因子近似等于1。
5.权利要求4中的方法,其特点是,上述预先确定的整数r等于上述预先确定的整数P。
6.权利要求5中的方法,其特点是,
从背景噪声采样值的第一个集合估计q个自回归参数,以及第二个残余方差,其中q是一个预先确定的正整数且远小于p。
以上述的M个频率,从上述的q个自回归参数以及第二个残差方差中,确定背景噪声的功率谱密度的估计。
7.权利要求1或6中的方法,其特点是,在一个预先确定的背景噪声采样值的集合数上,对上述背景噪声功率谱密度的估计做平均。
8.前面任何一个权利要求中的方法,其特点是,使用上述增强的自回归参数和上述增强的残余方差来调整一个滤波器,目的是对有噪语音采样值的第三个集合进行滤波。
9.权利要求8中的方法,其特点是,上述有噪语音采样值的第二个和第三个集合是同一个集合。
10.权利要求8或9中的方法,其特点是,用卡尔曼滤波的方法对上述有噪语音采样值的第三个集合进行滤波。
11.一个有噪语音参数增强装置,其特点是,
装置(22,26)用于从背景噪声采样值的第一个集合以M个频率确定背景噪声的功率谱密度的一个估计,其中M是一个预先确定的正整数。
装置(18)用于从背景噪声采样值的第二个集合估计P个自回归参数,以及第一个残余方差,其中P是一个预先确定的正整数且远小于M。
装置(20)用于以上述的M个频率,从上述的P个自回归参数以及第一个残余方差中,确定有噪语音的一个功率谱密度的估计。
装置(30)用于通过从上述有噪语音功率谱密度的估计中减去上述背景噪声的谱密度估计乘以一个预先确定正比例因子的乘积,确定增强的语音的一个功率谱密度的估计。
装置(32)用于从上述增强的语音功率谱密度估计中,确定r个增强的自回归参数和一个增强的残余方差,其中r是一个预先确定的正整数。
12.权利要求11中的装置,其特点是,装置(30)限制上述增强的语音功率谱密度的估计为非负值。
13.权利要求12中的装置,其特点是,
装置(22)用于从背景噪声采样值的第一个集合估计q个自回归参数,以及第二个残余方差,其中q是一个预先确定的正整数且远小于p。
装置(26)用于以上述的M个频率,从上述的q个自回归参数以及第二个残余方差中,确定背景噪声的功率谱密度的估计。
14.权利要求11或13中的装置,其特点是,装置(26)在一个预先确定的背景噪声采样值的集合数上,对上述背景噪声功率谱密度的估计做平均。
15.前面任何一个权利要求中的装置,其特点是,装置(34)使用上述增强的自回归参数和上述增强的残余方差来调整一个滤波器,目的是对有噪语音采样值的第三个集合进行滤波。
16.权利要求15中的装置,其特点是,卡尔曼滤波器(34)对上述有噪语音采样值的第三个集合进行滤波。
17.权利要求15中的装置,其特点是,卡尔曼滤波器(34)对上述有噪语音采样值的第三个集合进行滤波,上述有噪语音采样值的第二个和第三个集合是同一个集合。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE96003637 | 1996-02-01 | ||
SE9600363A SE506034C2 (sv) | 1996-02-01 | 1996-02-01 | Förfarande och anordning för förbättring av parametrar representerande brusigt tal |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1210608A true CN1210608A (zh) | 1999-03-10 |
Family
ID=20401227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97191991A Pending CN1210608A (zh) | 1996-02-01 | 1997-01-27 | 一种有噪语音参数增强的方法和装置 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6324502B1 (zh) |
EP (1) | EP0897574B1 (zh) |
JP (1) | JP2000504434A (zh) |
KR (1) | KR100310030B1 (zh) |
CN (1) | CN1210608A (zh) |
AU (1) | AU711749B2 (zh) |
CA (1) | CA2243631A1 (zh) |
DE (1) | DE69714431T2 (zh) |
SE (1) | SE506034C2 (zh) |
WO (1) | WO1997028527A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100336307C (zh) * | 2005-04-28 | 2007-09-05 | 北京航空航天大学 | 接收机射频系统电路内部噪声的分配方法 |
CN102124518A (zh) * | 2008-08-05 | 2011-07-13 | 弗朗霍夫应用科学研究促进协会 | 采用特征提取处理音频信号用于语音增强的方法和装置 |
CN102637438A (zh) * | 2012-03-23 | 2012-08-15 | 同济大学 | 一种语音滤波方法 |
CN107197090A (zh) * | 2017-05-18 | 2017-09-22 | 维沃移动通信有限公司 | 一种语音信号的接收方法及移动终端 |
CN107481733A (zh) * | 2016-06-08 | 2017-12-15 | 福特全球技术公司 | 声信号的选择性放大 |
CN110931007A (zh) * | 2019-12-04 | 2020-03-27 | 苏州思必驰信息科技有限公司 | 语音识别方法及系统 |
Families Citing this family (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
FR2799601B1 (fr) * | 1999-10-08 | 2002-08-02 | Schlumberger Systems & Service | Dispositif et procede d'annulation de bruit |
US6980950B1 (en) * | 1999-10-22 | 2005-12-27 | Texas Instruments Incorporated | Automatic utterance detector with high noise immunity |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7010483B2 (en) * | 2000-06-02 | 2006-03-07 | Canon Kabushiki Kaisha | Speech processing system |
US20020026253A1 (en) * | 2000-06-02 | 2002-02-28 | Rajan Jebu Jacob | Speech processing apparatus |
US7035790B2 (en) * | 2000-06-02 | 2006-04-25 | Canon Kabushiki Kaisha | Speech processing system |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US6983242B1 (en) * | 2000-08-21 | 2006-01-03 | Mindspeed Technologies, Inc. | Method for robust classification in speech coding |
US6463408B1 (en) * | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
DE10124189A1 (de) * | 2001-05-17 | 2002-11-21 | Siemens Ag | Verfahren zum Signalempfang |
GB2380644A (en) * | 2001-06-07 | 2003-04-09 | Canon Kk | Speech detection |
US7133825B2 (en) * | 2003-11-28 | 2006-11-07 | Skyworks Solutions, Inc. | Computationally efficient background noise suppressor for speech coding and speech recognition |
US20090163168A1 (en) * | 2005-04-26 | 2009-06-25 | Aalborg Universitet | Efficient initialization of iterative parameter estimation |
JP4690912B2 (ja) * | 2005-07-06 | 2011-06-01 | 日本電信電話株式会社 | 目的信号区間推定装置、目的信号区間推定方法、プログラム及び記録媒体 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7844453B2 (en) * | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
EP2115742B1 (en) * | 2007-03-02 | 2012-09-12 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements in a telecommunications network |
ES2570961T3 (es) * | 2007-03-19 | 2016-05-23 | Dolby Laboratories Licensing Corp | Estimación de varianza de ruido para mejorar la calidad de voz |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8392181B2 (en) * | 2008-09-10 | 2013-03-05 | Texas Instruments Incorporated | Subtraction of a shaped component of a noise reduction spectrum from a combined signal |
US8244523B1 (en) * | 2009-04-08 | 2012-08-14 | Rockwell Collins, Inc. | Systems and methods for noise reduction |
US8548802B2 (en) * | 2009-05-22 | 2013-10-01 | Honda Motor Co., Ltd. | Acoustic data processor and acoustic data processing method for reduction of noise based on motion status |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9324337B2 (en) * | 2009-11-17 | 2016-04-26 | Dolby Laboratories Licensing Corporation | Method and system for dialog enhancement |
US8600743B2 (en) * | 2010-01-06 | 2013-12-03 | Apple Inc. | Noise profile determination for voice-related feature |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
JP5834449B2 (ja) * | 2010-04-22 | 2015-12-24 | 富士通株式会社 | 発話状態検出装置、発話状態検出プログラムおよび発話状態検出方法 |
CN101930746B (zh) * | 2010-06-29 | 2012-05-02 | 上海大学 | 一种mp3压缩域音频自适应降噪方法 |
US8892436B2 (en) * | 2010-10-19 | 2014-11-18 | Samsung Electronics Co., Ltd. | Front-end processor for speech recognition, and speech recognizing apparatus and method using the same |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
CN103187068B (zh) * | 2011-12-30 | 2015-05-06 | 联芯科技有限公司 | 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法 |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
CN102890935B (zh) * | 2012-10-22 | 2014-02-26 | 北京工业大学 | 一种基于快速卡尔曼滤波的鲁棒语音增强方法 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
EP3008641A1 (en) | 2013-06-09 | 2016-04-20 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
TWI566107B (zh) | 2014-05-30 | 2017-01-11 | 蘋果公司 | 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置 |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
CN105023580B (zh) * | 2015-06-25 | 2018-11-13 | 中国人民解放军理工大学 | 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法 |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
CN105788606A (zh) * | 2016-04-03 | 2016-07-20 | 武汉市康利得科技有限公司 | 一种用于拾音器的基于递归最小追踪的噪声估计方法 |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11373667B2 (en) * | 2017-04-19 | 2022-06-28 | Synaptics Incorporated | Real-time single-channel speech enhancement in noisy and time-varying environments |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
EP3460795A1 (en) | 2017-09-21 | 2019-03-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal processor and method for providing a processed audio signal reducing noise and reverberation |
US10481831B2 (en) * | 2017-10-02 | 2019-11-19 | Nuance Communications, Inc. | System and method for combined non-linear and late echo suppression |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE15415T1 (de) * | 1981-09-24 | 1985-09-15 | Gretag Ag | Verfahren und vorrichtung zur redundanzvermindernden digitalen sprachverarbeitung. |
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
JP2642694B2 (ja) * | 1988-09-30 | 1997-08-20 | 三洋電機株式会社 | 雑音除去方法 |
KR950013551B1 (ko) * | 1990-05-28 | 1995-11-08 | 마쯔시다덴기산교 가부시기가이샤 | 잡음신호예측장치 |
US5319703A (en) * | 1992-05-26 | 1994-06-07 | Vmx, Inc. | Apparatus and method for identifying speech and call-progression signals |
SE501981C2 (sv) | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
UA41913C2 (uk) | 1993-11-30 | 2001-10-15 | Ейті Енд Ті Корп. | Спосіб шумозаглушення у системах зв'язку |
-
1996
- 1996-02-01 SE SE9600363A patent/SE506034C2/sv not_active IP Right Cessation
-
1997
- 1997-01-09 US US08/781,515 patent/US6324502B1/en not_active Expired - Lifetime
- 1997-01-27 AU AU16790/97A patent/AU711749B2/en not_active Ceased
- 1997-01-27 EP EP97902783A patent/EP0897574B1/en not_active Expired - Lifetime
- 1997-01-27 DE DE69714431T patent/DE69714431T2/de not_active Expired - Lifetime
- 1997-01-27 KR KR1019980705713A patent/KR100310030B1/ko not_active IP Right Cessation
- 1997-01-27 JP JP9527551A patent/JP2000504434A/ja active Pending
- 1997-01-27 CN CN97191991A patent/CN1210608A/zh active Pending
- 1997-01-27 CA CA002243631A patent/CA2243631A1/en not_active Abandoned
- 1997-01-27 WO PCT/SE1997/000124 patent/WO1997028527A1/en active IP Right Grant
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100336307C (zh) * | 2005-04-28 | 2007-09-05 | 北京航空航天大学 | 接收机射频系统电路内部噪声的分配方法 |
CN102124518A (zh) * | 2008-08-05 | 2011-07-13 | 弗朗霍夫应用科学研究促进协会 | 采用特征提取处理音频信号用于语音增强的方法和装置 |
CN102124518B (zh) * | 2008-08-05 | 2013-11-06 | 弗朗霍夫应用科学研究促进协会 | 采用特征提取处理音频信号用于语音增强的方法和装置 |
US9064498B2 (en) | 2008-08-05 | 2015-06-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction |
CN102637438A (zh) * | 2012-03-23 | 2012-08-15 | 同济大学 | 一种语音滤波方法 |
CN102637438B (zh) * | 2012-03-23 | 2013-07-17 | 同济大学 | 一种语音滤波方法 |
CN107481733A (zh) * | 2016-06-08 | 2017-12-15 | 福特全球技术公司 | 声信号的选择性放大 |
CN107197090A (zh) * | 2017-05-18 | 2017-09-22 | 维沃移动通信有限公司 | 一种语音信号的接收方法及移动终端 |
CN110931007A (zh) * | 2019-12-04 | 2020-03-27 | 苏州思必驰信息科技有限公司 | 语音识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
SE506034C2 (sv) | 1997-11-03 |
AU711749B2 (en) | 1999-10-21 |
US6324502B1 (en) | 2001-11-27 |
DE69714431D1 (de) | 2002-09-05 |
EP0897574B1 (en) | 2002-07-31 |
WO1997028527A1 (en) | 1997-08-07 |
EP0897574A1 (en) | 1999-02-24 |
AU1679097A (en) | 1997-08-22 |
KR100310030B1 (ko) | 2001-11-15 |
DE69714431T2 (de) | 2003-02-20 |
JP2000504434A (ja) | 2000-04-11 |
SE9600363D0 (sv) | 1996-02-01 |
CA2243631A1 (en) | 1997-08-07 |
SE9600363L (sv) | 1997-08-02 |
KR19990081995A (ko) | 1999-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1210608A (zh) | 一种有噪语音参数增强的方法和装置 | |
CN1122970C (zh) | 由时域频谱减法减少信号噪声的降噪处理器、方法和电话 | |
CN1727860B (zh) | 语音噪音抑制方法和语音噪音抑制器 | |
CN109643554B (zh) | 自适应语音增强方法和电子设备 | |
CN102959625B9 (zh) | 自适应地检测输入音频信号中的话音活动的方法和设备 | |
CN101080766A (zh) | 使用bark频带weiner滤波器和线性衰减的噪声降低和舒适噪声增益控制 | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
CN111429932A (zh) | 语音降噪方法、装置、设备及介质 | |
JPH08506427A (ja) | 雑音減少 | |
CN1650349A (zh) | 用于抗噪声语音识别的在线参数直方图正态化 | |
CN113539285B (zh) | 音频信号降噪方法、电子装置和存储介质 | |
CA2192397C (en) | Method and system for performing speech recognition | |
CN110556125B (zh) | 基于语音信号的特征提取方法、设备及计算机存储介质 | |
CN110111811B (zh) | 音频信号检测方法、装置和存储介质 | |
CN112602150A (zh) | 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备 | |
CN112599148A (zh) | 一种语音识别方法及装置 | |
JP4965891B2 (ja) | 信号処理装置およびその方法 | |
CN1134768C (zh) | 由时域频谱相减进行信号噪声减小的电话机、处理器及方法 | |
WO2007041789A1 (en) | Front-end processing of speech signals | |
JP3786038B2 (ja) | 入力信号処理方法および入力信号処理装置 | |
CN112165558B (zh) | 一种双讲状态检测方法、装置、存储介质及终端设备 | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
CN114360572A (zh) | 语音去噪方法、装置、电子设备及存储介质 | |
CN113066483B (zh) | 一种基于稀疏连续约束的生成对抗网络语音增强方法 | |
CN1902684A (zh) | 为鲁棒语音识别对语音信号进行处理的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
C20 | Patent right or utility model deemed to be abandoned or is abandoned |