CN1828722B - 用于音频信号的改进的语音/噪音分类的复合信号激活探测 - Google Patents

用于音频信号的改进的语音/噪音分类的复合信号激活探测 Download PDF

Info

Publication number
CN1828722B
CN1828722B CN2006100733243A CN200610073324A CN1828722B CN 1828722 B CN1828722 B CN 1828722B CN 2006100733243 A CN2006100733243 A CN 2006100733243A CN 200610073324 A CN200610073324 A CN 200610073324A CN 1828722 B CN1828722 B CN 1828722B
Authority
CN
China
Prior art keywords
correlation
signal
sound signal
noise
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2006100733243A
Other languages
English (en)
Other versions
CN1828722A (zh
Inventor
J·斯维德伯格
E·伊库登
A·乌利登
I·约翰森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26807081&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1828722(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN1828722A publication Critical patent/CN1828722A/zh
Application granted granted Critical
Publication of CN1828722B publication Critical patent/CN1828722B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

通过确认音频信号是否包括非语音信息(122、124、125)可在对音频信号进行编码期间保留可感知相关非语音信息。如果这样,对音频信号的语音/噪音分类进行忽略(43),从而防止将音频信号误分类为噪音。

Description

用于音频信号的改进的语音/噪音分类的复合信号激活探测
本申请是申请日为1999年11月12日、申请号为99813625.5并且发明名称为“用于音频信号的改进的语音/噪音分类的复合信号激活探测”的申请的分案申请。本申请根据35USC119(e)(1)要求申请日为1998年11月23日的US60/109556号未决临时申请的优先权。
技术领域
本发明涉及声频信号压缩,特别涉及在对声频信号进行压缩时语音/噪音的分类。
背景技术
语音编码器和译码器通常分别设置在无线电发射机和无线电接收机中,并且它们可以同时工作,从而可在给定的发射机和接收机之间沿着无线电通信线路进行语音(话音)通信。语音编码器和语音译码器的结合经常称之为语音编码译码器。移动无线电话(如蜂窝式移动电话)就是常规通信设备的一个例子,这种常规通信设备通常包括一个具有一语音编码器的无线电发射机和一个具有一语音译码器的无线电接收机。
在常规的基于信息组的语音编码器中,引入的语音信号被分成若干块并将这种块称为帧。用于普通的4kHz电话带宽范围的帧长通常为20ms或160次采样.可将上述帧进一步分成一些子帧,其长度通常为5ms或40次采样。
在对引入的音频信号进行压缩的过程中,语音编码器通常使用先进的有损压缩技术.通过一个信道如一条无线电通信线路将压缩的(或编码的)信号信息传送给译码器。然后译码器试图从引入的压缩信号信息中复制出输入音频信号。如果引入的音频信号的某些特征是公知的,则在信道中可保持尽可能低的位速率。如果音频信号包含与收听者相关的信息,则该信息会被保留下来。然而如果音频信号仅包含非相关信息(如背景噪音),则可以通过仅发射有限的关于信号的信息量来节省带宽。对于仅包含非相关信息的许多信号,非常低的位速率经常可达到高性能压缩。在极端的情况中,可在译码器中通过上述信道对输入信号进行合成而不进行任何信息的更新,直到重新确定输入的声频信号包括相关的信息为止。
可以方便地利用非常低的位速率十分精确地复制出的典型信号包括恒定噪音、汽车噪音,在某种程度上还包括一些多路重合噪音.对于更复杂的非语音信号像音乐或语音和音乐的合成,要求通过译码器利用更高的位速率对其进行准确复制。
对于许多通常类型的背景噪音,需要更低的语音位速率,以得到足够好的信号模型.目前的移动系统利用了在背景噪音持续的过程中下调发射的位速率这一事实.例如在使用连续发射技术的常规系统中,可变速率(VR)语音编码器可使用其最低的位速率。
在常规的非连续发射(DTX)方案中,当讲演者停顿时发射机就停止发送编码的语音帧。在规则或不规则间隔内(例如每100ms到500ms),发射机发送适合于在译码器中产生常规的柔和噪音的语音参数。这些适合产生柔和噪音(CNG)的参数通常被编码成有时称之为静寂描述符(SID)帧的信号.在接收机处,译码器利用在SID帧中接收到的柔和噪音参数并通过常规柔和噪音注入(CNI)算法来合成仿真噪音。
在常规的DTX系统中的译码器内产生柔和噪音时,通常可以感觉到这种噪音变化非常小,并与在有源模式(非DTX)下产生的背景噪音有很大的不同.产生这种感觉的原因是DTX SID帧并没有像正常的语音帧那样经常地向接收机发送。在具有DTX模式的常规线性预测合成分析(LPAS)编码译码器中,常需在数帧范围内对背景噪音的频谱和能量进行估算(例如平均值),然后将估算的参数在SID帧内量化并将其通过信道传送给译码器。
发送具有较低更新率的SID帧而不发送规则语音帧的好处有两方面。例如由于更低的能量消耗而使移动式无线电收发信机中的电池寿命得以延长,而且由发射机引起的干扰下降从而提高了系统的容量。
如果利用一种相当简单的压缩模式对复合信号如音乐进行压缩,并且相应的位速率也相当低,则在译码器中复制出的信号与使用较好(较高质量)压缩技术而获得的结果有很大的不同。通过对复合信号误分类噪音可使用相当简单的压缩方案.当出现这种误分类时,不仅译码器输出拙劣的复制信号,而且不利的是误分类本身导致从较高质量的压缩方案转换到较低质量的压缩方案。为了修正上述误分类,需要再转回到较高质量方案的。如果在压缩方案之间的这种转换经常发生,则收听者通常能听得见并感到很刺耳.
从前述可知,在适当的情况下,如在演讲者停顿期间对背景噪音进行压缩,仍保持低位速率(高压缩率)时,需要减少主观上相关信号误分类。可利用非常强的压缩技术从而使得收听者不会感到刺耳.在DTX系统中使用如上所述的柔和噪音参数就是强压缩技术的一个例子,就象利用随机激励方法的常规低速率线性预测编码(LPC)那样.利用强压缩技术的编码技术通常只可以精确地复制出可感知的简单噪音类型如稳定的汽车噪音、街道噪音、餐馆噪音(混串音)和其它类似的信号。
用于确定输入声频信号是否包含相关信息的常规分类技术主要基于输入声频信号的较简单的稳态分析。如果确定输入信号为稳定的,则假定其为类似噪音的信号。然而,单单是这种常规稳态分析会引起复合信号,上述复合信号相当稳定,但实际上包含被误分类为噪音的可感知的相关信息。不利的是这种误分类可引起如上所述的问题。
发明内容
因此需要一种分类技术,这种分类技术能可靠地检测到上述类型的复合信号内的可感知相关信息的存在。
本发明提供了复合信号激活检测,其能可靠地检测到复合非语音信号,这些非语音信号包括对收听者感知重要的相关信息。能被可靠地检测到的复合非语音信号的例子包括音乐、曲维持乐〔musie on-hold〕、语音与音乐的组合、背景中的音乐以及其它音调或泛音声音。
附图说明
图1示意性地展示了根据本发明的一个示范性语音编码设备的相关部分;
图2展示了图1中的复合信号激活检测器的示范性实施例;
图3展示了图1中的语音激活检测器的示范性实施例;
图4展示了图1中的释放延迟逻辑块的示范性实施例;
图5展示了图2中的参数发生器的示范性操作流程;
图6展示了图2中的计数器控制器的示范性操作流程;
图7展示了图2中的一个部分的示范性操作流程;
图8展示了图2中的另一部分的示范性操作流程;
图9展示了图3中的一个部分的示范性操作流程;
图10展示了图3中的计数器控制器的示范性操作流程;
图11展示了图3中的另一部分的示范性操作流程;
图12展示了可由图1~11中的实施例完成的示范性操作流程;
图13展示了图2中的复合信号激活检测器的另一个实施例。
具体实施方式
图1为示意性地展示了根据本发明的一个示范性语音编码设备的相关部分.这种语音编码设备例如可以安装在通过无线电通信信道进行声频信息传递的无线电接收机中.这种无线电接收机的一个例子是移动无线电话,如蜂窝式移动电话.
在图1中,将输入声频信号输入到复合信号激活检测器(CAD)以及话音激活检测器(VAD)中.复合信号激活检测器CAD响应声频输入信号并进行相关性分析,从而确定输入信号是否包括收听者感知的相关信息,然后向VAD输出一组信号相关参数.VAD利用这些信号相关参数连同接收到的声频输入信号进行确定输入声频信号是语音还是噪音.VAD作为一个语音/噪音分类器;语音/噪音显示作为输出。CAD接收到语音/噪音显示并作为其输入.CAD响应语音/噪音显示和输入声频信号,产生一组输出到释放延迟逻辑块的复合信号标识,该释放延迟逻辑块也接收由VAD产生的语音/噪音显示作为其输入。
释放延迟逻辑块响应复合信号标识和语音/噪音显示,并产生输出,该输出能指示出输入声频信号是否包括收听者能感觉到的相关信息,收听者将在信道的另一端听到在接收机中的译码设备输出的复制声频信号.例如释放延迟逻辑块的输出可适当地用于控制DTX的操作(在DTX系统中)或位速率(在可变速率VR编码器中).如果释放延迟逻辑块的输出表明输入声频信号不包含相关的信息,即可产生柔和噪声(在DTX系统中)或者降低位速率(在VR编码器)。
在CAD中通过提取出与特定频带中相关信号的每一帧信息对输入信号(可进行预处理)进行分析。可通过使用一个合适的滤波器进行信号初次滤波来完成上述操作,上述滤波器可以为带通滤波器或高通滤波器。该滤波器对包含分析中感兴趣的最大限度能量的频带进行评估。为了降低如汽车噪音的强低频率含量,通常应滤除低频区。滤波后的信号被送往开环长期预测(LTP)相关分析。LTP分析提供的结果为相关值矢量或归一化增益值;每相关移位的一个值。例如在常规的LTP分析中,移位范围可以为[20,147].获取所需的相关性检测的另一种方法〔低复杂性〕是在相关计算中使用未滤波的信号以及通过如下详细描述的算法相似“滤波”过程对相关值进行修改.
对于每一个分析帧,选择并缓冲具有最大幅度的标准相关值(增益值)。不使用移位(相应于选择的相关值的LTP滞后)。对该值作进一步分析从而得出信号相关性参数矢量,该信号相关性参数矢量被输送到VAD中用于背景噪音评估过程。对缓冲的相关值进行处理并用来得出最后的结论:信号是否相关(即具有感知重要性)以及VAD的结论是否可靠.产生一组标识:VAD_fail_long和VAD_fail_short并用来指示感知相关信息何时存在时,何时VAD可能要执行严格的误分类,即噪音分类.
在CAD相关性分析中进行计算的信号相关性参数用于提高VAD方案的性能.VAD方案试图确定信号是一个语音信号(可能被环境噪音所降级)还是一个噪音信号。为了辨别出噪音中的语音+噪音信号,VAD通常估计上述噪音.VAD必须更新其背景噪音的评估值从而能在语音+噪音信号分类中得出更好的判断.来自VAD的相关性参数用于确定VAD背景噪音和活动信号评估值更新到何种程度。
如果VAD被认为是可靠的,则释放延迟逻辑块可调整信号的最终判断,该最终判断利用了关于信号和在前VAD结论的相关性的先前信息。释放延迟逻辑块的输出是最终判断,从而能确定信号是相关还是不相关。在不相关的情况下,可使用低位速率来进行编码。在DTX系统中,该相关/非相关信息用来确定当前的帧是应该以正常的方式(相关)进行编码还是用舒适噪音参数(非相关)进行编码.
在一个示范性的实施例中,在语音编码器中设有实现高效低复合性的CAD,该语音编码器使用了线性预测合成分析(LPAS)结构。输入到语音编码器中的信号通过常规的装置(高通滤波的、缩放的等)进行调节。然后通过LPAS编码器使用的常规自适应噪音加权重滤波器对调节的信号s(n)进行滤波。然后将加权语音信号sw(n)传送到开环LTP分析中.LTP分析对在范围[Lmin,Lmax]内的每一个移位的相关值进行计算并存储,其中该范围的端值例如可以为:Lmin=18,Lmax=147。对于在上述范围内每一个滞后值(移位)L,滞后值1的相关值Rxx(k,1)范围可通过如下公式计算:
Rxx ( k = 0 , l ) = Σ n = 0 sw ( n - k ) sw ( n - l ) 方程1
其中k为分析帧的长度.如果将k值设定为0,则上述函数仅仅随滞后值1进行变化:
Rxx ( l ) = Σ n = 0 sw ( n ) sw ( n - l ) 方程2
也可定义为
Exx(L)=Rxx(L,L)方程3
该过程通常作为在LPAS编码器中的自适应编码薄搜索的预搜索,因此没有增加额外的计算成本.
通过将下列方程中的失真D最小化而得到单抽头预测器(singletap predictor)的最佳增益系数g_opt:
D ( l ) = Σ n = 0 n = N - 1 ( sw ( n ) - g · sw ( n - l ) ) 2 方程4
通过下列方程得出的最佳增益系数g_opt(实际的标准相关值)是方程4中最小化D的g值:
g _ opt = Rxx ( L ) Exx ( L )
其中L是最小化失真D(方程4)的滞后值,Exx(L)是能量.复合信号检测器计算出加权信号sw的高通滤波模型(high passfiltered version)的最佳增益系数(g_opt)。例如高通滤波器可为一个具有滤波系数[h0,h1]的简单第一级滤波器.在一个实施例中,在相关值计算之前不采用高通滤波加权信号,而采用简化的公式来最小化使用滤波信号sw_f(n)的D值.
利用如下公式来确定高通滤波信号sw_f(n):
sw_f(n)=h0·sw(n)+h1·sw(n-1)方程7
在此情况下,可通过如下公式得到g_max(滤波信号的g_opt):
g _ max = Rxx ( L ) ( h 0 2 + h 1 2 ) + Rxx ( L - 1 ) h 0 h 1 + Rxx ( L + 1 ) h 0 h 1 Exx ( L ) ( h 0 2 + h 1 2 ) + Rxx ( L , L + 1 ) h 0 h 1 + Rxx ( L , L - 1 ) h 0 h 1 方程8
这样可根据方程8使用在前已经由未滤波信号sw得到的Rxx和Exx值来计算参数g_max,而不用计算滤波信号sw_f的新的Rxx值。
如果将滤波系数[h0,h1]选择为[1,-1]并且将分母标准滞后值Lden设为0,则g_max计算可简化为:
g _ max = 2 Rxx ( L ) - ( Rxx ( L - 1 ) + Rxx ( L + 1 ) ) 2 Exx ( Lden ) - 2 Rxx ( Lden + 1 ) 方程9
将方程8中的分母Lden设为(Lmin+1)(非最优值L_opt,即方程4中的最优滞后值),并将最大值L限制为Lmax-1,在最大搜索中的最小值Lmin限制为(Lmin+1),可以对上述方程作进一步简化。在此情况下,除了从开环LTP分析中已经得到的Rxx(1)外,不需要额外进行相关性计算.
对于每一帧,存储了具有最大幅度的增益值g-max.根据g-f(i)=b0·g_max(i)-a1·g_f(i-1)并通过得到每一帧的滤波g_max值,可得到平滑模型g_f(i).在一些实施例中,滤波系数b0和a1可以是时间变量,也可以为状态和输入相关的以避免状态饱和问题.例如b0和a1可以表达为相应的时间:g_max(i)和g_f(i-1)的函数。即b0=fb(t,g_max(i),g_f(i-1))和a1=fa(t,g_max(i),g_f(i-1))。
信号g_f(i)是CAD相关性分析的一个初级结果.通过分析g_f(i)的状态和随时间变化的曲线,VAD自适应可配有辅助设备,而释放延迟逻辑块配有操作显示.
图2展示了上面已描述的图1中的复合信号激活检测器CAD的示范性实施例.预处理部分21对输入信号进行预处理,从而产生了前述的加权信号sw(n)。将信号sw(n)输出到一个常规的相关性分析器23中,该相关性分析器23例如可以为开环长期预测(LTP)相关分析器.相关性分析器23的输出22通常作为一个自适应编码薄搜索24的输入。如上所述,根据本发明在常规相关性分析器23中使用的Rxx和Exx值用于计算g_f(i).
Rxx和Exx值在25处输入到最大归一化增益计算器20中,该计算器20如上所述可计算出g_max值。通过计算器20对每一帧的最大幅度g_max值进行选择并将其存储在缓冲器26中.缓冲后的值输出到如上所述的平滑滤波器27中.平滑滤波器27的输出是g_f(i)。
信号g_f(i)被输入到参数发生器28中.参数发生器28对输入信号g_f(i)进行响应,并产生一对复合_高(complex-high)输出和复合_低(complex-low)输出,上述输出作为信号相关性参数输送给VAD(参看附图1)。参数发生器28还产生一个复合(complex-timer)一输出,该输出作为控制计数器201的计数器控制器29的输入.计数器201的输出复合悬搁_计数.(complex_hang_count)作为一个信号相关性参数输送给VAD,同时也输送给比较器203,比较器203的输出VAD_失效_长(VAD_fail_long)是输出给释放延迟逻辑块的复合信号标识(参看图1).信号g_f(i)同时也被输送给另一个比较器205,该比较器205的输出208与“与”门207的输入相耦合。
图2中的复合信号激活检测器也从VAD中接收语音/噪音显示(参看图1),即信号sp_vad_prim(例如该显示等于0时为噪音,该显示等于1时为语音).将上述信号输入缓冲器202中,该缓冲器202的输出被耦合到比较器204.比较器204的输出206被耦合到“与”门207的另一输入.“与”门207的输出为一个复合信号标识_VAD_失效_短(VAD_fail_short),该标识输入给图1中的释放延迟逻辑块。
图13展示了图2中设备的另一示例,其中来自sw(n)的高通滤波模型(filtered version),即高通滤波器131的输出sw_f(n)通过相关性分析器23计算出方程5的g_opt值.然后每一帧的最大幅度g_opt值取代g_max在图2的缓冲器26中进行缓冲.如图2所示相关性分析器23还接受信号sw_(n)并产生常规输出22.
图3展示了图1中的VAD的示范性实施例的相关部分.如上描述的图2所示,VAD接受了来自CAD的信号相关性参数:复合_高(complex_high)、复合_低(complex_low)、复合_悬搁_计数(complex_hang_count).复合_高(complex_high)和复合_低(complex_low)被分别输入到相应的缓冲器30和31中,上述缓冲器的输出被分别输入到比较器32和33中.对比较器32和33的输出进行耦合并作为“或”门34的相应输入,该“或”门34向计数器控制器35输出复合_报警(complex_warning)信号.计数器控制器35对复合_报警(complex_warning)信号进行响应,从而可以控制计数器36.
声频输入信号被耦合到噪音评估器38的一个输入上,同时也被耦合到语音/噪音确定器39的一个输入上.如通常所示,语音/噪音确定器39也接受来自噪音评估器38的背景噪音的评估信息303.语音/噪音确定器通常对输入声频信号和噪音评估信息303进行响应,并产生语音/噪音显示sp_vad_prim,该显示输出给图1中的释放延迟逻辑块和CAD.
信号复合_悬搁_计数(complex_hang_count)输入到比较器37中,该比较器37的输出被耦合到噪音评估器38的一个向下(DOWN)输入中。当向下(DOWN)输入被激活时,噪音评估器38仅允许向下更新其评估值或不改变其评估值,即噪音的任何新的评估值必须表明小于或等于在前的评估值.在其它实施例中,激活向下(DOWN)输入可允许噪音评估器向上更新其评估值从而表明具有更强的噪音,但是要求更新的速度(强度)应显著减小.
噪音评估器38还有一个延迟(DELAY)输入,该输入与计数器36产生的一个称为静态_计数(stat_count)的输出信号相耦合.在常规的VAD中噪音评估器接收到一个显示信号表明输入信号例如为非稳定的、或音调或音色信号之后就延迟一段时间.在此延迟时间内,噪音评估值不能被更新为更高的值.这样有助于防止对隐藏在噪音或语音稳定信号内的非噪音信号作出错误反应.当延迟时间结束时,即使暂时显示具有语音信号,噪音评估器也可以向上更新其噪音评估值。如果噪音水平突然增加,将使整个VAD算法不会锁定到激活显示。
根据本发明,当信号显得相当相关而允许噪音评估值“快速”增长时,静态_计数(stat_count)驱动延迟(DELAY)输入,并设定噪音评估器的前述的延迟时间的下限(即需要一段与常规要求相比为较长的延迟时间)。如果CAD检测到在一个相当长的时间内(如2秒)具有非常高的相关性,静态_计数(stat_count)信号可以使噪音评估值的增加延迟相当长的一段时间(如5秒).在一个实施例中,静态_计数(stat_count)信号用于减小噪音评估值更新的速度(强度),在这种情况下通过CAD显示出较高的相关性.
语音/噪音确定器39具有一个耦合到计数器控制器35的输入的输出301,同时该输出也耦合为噪音评估器38的输入,后者的耦合是通常使用的.当语音/噪音确定器判断出声频输入信号的一个给定帧例如是音调信号或音色信号或非稳定信号时,输出301显示将该信号输出给计数器控制器35,然后依次将计数器36的输出静态_计数(stat_count)设定为一个期望值.如果输出301显示为稳定信号时,控制器35可以使计数器36递减.
图4展示了图1中的释放延迟逻辑块的示范性实施例.在图4中,复合信号标识短_失效_VAD(VAD_fail_short)和VAD_失效_长(VAD_fail_long)被输入到”或”门41中,该“或”门41的输出作为另一个“或”门43的一个输入.来自VAD的语音/噪音显示sp_vad_prim被输入到常规的VAD释放延迟逻辑块45中。VAD释放延迟逻辑块的输出作为“或”门43的第二个输入.如果复合信号标识VAD_失效_短(VAD_fail_short)或VAD_失效_长(VAD_fail_long)之一处于激活状态,则“或”门41的输出可引起“或”门43显示出该输入信号是相关的.
如果复合信号标识都不处于激活状态,则VAD释放延迟逻辑块45的语音/噪音判断,即信号sp_vad,将构成相关/非相关显示.如果sp_vad处于激活状态,则表示为语音,然后“或”门43的输出显示信号是相关的.否则如果sp_vad处于非激活状态,则表明为噪音,然后“或”门43的输出显示信号是非相关的.例如来自“或”门43的相关/非相关显示可以被输出给一个DTX系统的DTX控制部分或者VR系统的位速率控制部分.
图5展示了图2中的参数发生器28的示范性操作流程,该操作流程可产生信号复合_高(complex_high)、复合_低(complex_low)、复合时标(complex_timer).图5(以及图6~11)中的位标i表示声频输入信号的当前帧(current frame).如图5所示,如果信号g_f(i)不大于其相应的阈值,即在步骤51和52中对于高_复合(complex_high)信号为THh、在步骤54和55中对于复合_低(complex_low)信号为TH1、在步骤57和58中对于复合_时标(complex_timer)信号为THt,则前面提及的每一个信号的值都设为零。如果在步骤51中信号g_f(i)大于阈值THh,则在步骤53中将信号高_复合(complex_high)设为1;如果在步骤54中信号g_f(i)大于阈值TH1,则在步骤56中将信号复合_低(complex_low)设为1。如果在步骤57中信号g_f(i)大于阈值THt,则在步骤59中将信号复合_时标(complex_timer)的值增加1.在图5中的示范性阈值包括:THh=0.6,TH1=0.5,THt=0.7。由图5中可以看到复合_时标(complex_timer)代表了连续帧的数目,在上述数目内g_f(i)大于阈值THt
图6展示了图2中的计数器控制器29和计数器201的示范性操作流程.如果在步骤61中复合_时标(complex_timer)大于阈值THct,则在步骤62中计数器控制器29将计数器201的输出信号复合_悬搁_计数(complex_hang_count)的值设为H.如果在步骤61中复合_时标(complex_timer)不大于阈值THct,但在步骤63中大于0,则在步骤64中计数器控制器29将计数器201的输出信号复合_悬搁_计数(complex_hang_count)的值减1.图6中的示范性值包括:THct=100(相应于在一个实施例中的2秒),H=250(相应于在一个实施例中的5秒)。
图7展示了图2中的比较器203的示范性操作流程。如果在步骤71中复合_悬搁_计数(complex_hang_count)大于THhc,则在步骤72中将VAD_失效_长(VAD_fail_long)设为1.否则在步骤73中将VAD_失效_长(VAD_fail_long)设为0。在一个实施例中THhc=0。
图8展示了图2中的缓冲器202、比较器204和205以及“与”门207的示范性操作流程。如图8所示,如果在步骤81紧接当前的(第i点)的sp_vad_prim值之前的最近的sp_vad_prim的P值都等于0以及如果在步骤82中信号g_f(i)大于阈值THfs,则在步骤83中将VAD_失效_短(VAD_fail_short)设为1.否则在步骤84中将VAD_失效_短(VAD_fail_short)设为0.图8中的示范性值包括:THfs=0.55,p=10.
图9展示了图3中的缓冲器30和31、比较器32和33以及“或”门34的示范性操作流程.如果在步骤91中当前的(第i点)的复合_高(complex_high)值之前的上一次第m点的复合_高(complex_high)值都等于0,或者如果在步骤92中当前的(第i点)的复合_低(complex_low)值之前的上一次第n点的复合_低(complex_low)值都等于0,则在步骤93中将复合_报警(complex_warning)设为1。否则在步骤94中将复合_报警(complex_warning)设为0.在图9中的示范性值包括:m=8,n=15。
图10展示了图3中的计数器控制器35和计数器36的示范性操作流程.如果在步骤100中(参看图3中的301)表明声频信号是稳定的,则在步骤104中将静态_计数(stat_count)减小。然后如果在步骤101中复合_报警(complex_warning)=1以及在步骤102中静态计数(stat_count)小于值MIN,则在步骤103中将静态_计数(stat_count)的值设为MIN.如果在步骤100中声频信号是非稳定的,则在步骤105中将静态_计数(stat_count)的值设为A。在一个实施例中,MIN和A的示范性值分别是5和20,它们可以分别引起噪音评估器38(图3)的下限延迟值为100ms和400ms。
图11展示了图3中的比较器37和噪音评估器38的示范性操作流程.如果在步骤111中复合_悬搁_计数(complex_hang_count)大于阈值THhc,则在步骤112中比较器37激活噪音评估器38的向下输入,这样噪音评估器38仅允许向下更新其噪音评估值(或者不改变噪音评估值).如果在步骤111中复合_悬搁_计数(complex_hang_count)不大于阈值THhc1,则噪音评估器38的向下输入处于非激活状态,这样在步骤113中噪音评估器38允许向下或向上更新其噪音评估值.在一个例子中,THhc1=0.
如前所述,如果CAD确定输入声频信号是一个包括收听者能感觉到的相关信息的复合信号,则由CAD产生的复合信号标识允许通过VAD进行“噪音”分类有选择地超载.当通过VAD被分类为噪音的连续帧的某一预定数之后确定g_f(i)大于某一预定值时,VAD_fail_short标识可在释放延迟逻辑块的输出处触发“相关”显示。
而且在g_f(i)大于连续帧某一预定数的预定值之后,VAD_fail_long标识可在释放延迟逻辑块的输出处激发“相关”显示,并将该显示保持一段较长的保持时间.保持的时间周期可包含一系列分离的连续帧序列,其中g_f(i)大于前述的预定值,但每一个相分离的连续帧序列包括小于前述的帧的预定数.
在一个实施例中,信号相关性参数复合_悬搁_计数(complex_hang_count)可以在与复合信号标识VAD_fail_long相同的条件下使噪音评估器38的向下输入起作用。如果g_f(i)大于连续帧的第一个数的第一预定阈值或大于连续帧的第二个数的第二预定阈值,则信号相关性参数复合_高(complex_high)和复合_低(complex_low)可以这样运作,于是,即使已将多个连续帧确定(通过语音/噪音确定器39)为稳定的,噪音评估器38的延迟输入可以被提升(如需要)到一个下限值.
图12展示了可由图1~11中的语音编码器实施例完成的示范性操作流程.在步骤121中计算当前帧的具有最大幅度的归一化增益。在步骤122中对上述增益进行分析,从而产生相关性参数和复合信号标识。在步骤123中,将上述相关性参数用于在VAD中对背景噪音的评估。在步骤124中,复合信号标识用于在释放延迟逻辑块中得出相关性结论.如果在步骤125中确定声频信号不包含能感知的相关信息,则在步骤126中降低例如VR系统中的位速率或例如在DTX系统中对柔和噪声参数进行编码.
由前述可知,对于本领域的技术人员而言,可通过在常规的语音编码设备上对软件、硬件或者两者的适当修改而很方便地实现图1~13中的实施例。
虽然在前文已对本发明的示范性实施例进行了详细描述,但它并不是对本发明范围的限定,可通过多种方式实现本发明的构思.

Claims (23)

1.一种在对音频信号进行编码期间将可感知相关非语音信息保留在音频信号中的方法,包括:
作出关于所述音频信号是否被认为包括语音或噪音信息的第一判断;
作出关于所述音频信号是否包括对收听者可感知相关的非语音信息的第二判断;以及
对指示可感知相关的非语音信息的所述第二判断作出响应,有选择地忽略指示噪音信息的所述第一判断,
其中所述第二判断包括将从开环长期预测相关性分析得出的相关值与预定值相比较。
2.如权利要求1所述的方法,其中所述有选择地忽略步骤包括:对所述相关值大于预定值作出响应而忽略所述第一判断。
3.如权利要求1所述的方法,其中所述有选择地忽略步骤包括:对在给定的时间周期内相关值的预定数大于预定值作出响应而忽略所述第一判断,所述音频信号被分割成的每个相应帧对应一个相关值。
4.如权利要求3所述的方法,其中所述有选择地忽略步骤包括:对连续相关值的预定数大于预定值作出响应而忽略所述第一判断,所述音频信号被分割成的每个相应帧对应一个相关值。
5.如权利要求1所述的方法,其中所述相关值是音频信号的高通滤波模型的最高标准相关值。
6.如权利要求1所述的方法,其中所述相关值是最大幅度标准相关值。
7.如权利要求1所述的方法,其中所述相关值是通过对最大幅度相关值滤波而得到的平滑相关值。
8.如权利要求1所述的方法,还包括以下步骤:
产生一组信号相关性参数;以及
在关于所述音频信号是否被认为包括语音或噪音信息的所述第一判断中使用所述一组信号相关性参数。
9.如权利要求8所述的方法,其中所述一组信号相关性参数中的每个相应的相关参数是通过比较相关值与对所述相应的相关参数适用的阈值来产生的。
10.一种将可感知相关信息保留在音频信号中的方法,包括:
作出关于所述音频信号是否被认为包括语音或噪音信息的第一判断;
通过使用开环长期预测相关性分析探测所述音频信号的高通滤波模型的最高标准相关值;
确定表示最高标准相关值的值;
将所确定的表示最高标准相关值的值与至少一个阈值相比较,从而得到音频信号是否包含可感知相关信息的指示;以及
响应所述音频信号是否包含可感知相关信息的指示,调整关于所述音频信号是否被认为包括语音或噪音信息的第一判断。
11.如权利要求10所述的方法,其中所述探测步骤包括将所述相关性分析应用到音频信号中而不产生音频信号的高通滤波模型。
12.如权利要求10所述的方法,其中所述探测步骤包括对音频信号进行高通滤波,然后对高通滤波后的音频信号进行所述相关性分析。
13.如权利要求10所述的方法,其中所述探测步骤包括确定最大幅度标准相关值。
14.如权利要求13所述的方法,其中所述所确定的表示最高标准相关值的值是通过对所述最大幅度标准相关值滤波而得到的。
15.如权利要求10所述的方法,还包括以下步骤:
产生一组信号相关性参数;以及
在关于所述音频信号是否被认为包括语音或噪音信息的所述第一判断中使用所述一组信号相关性参数。
16.如权利要求15所述的方法,其中所述一组信号相关性参数中的每个相应的相关参数是通过比较所述所确定的表示最高标准相关值的值与对所述相应的相关参数适用的相应的阈值来产生的。
17.一种用于在音频信号编码器中保留包含在音频信号内的可感知相关非语音信息的设备,包括:
话音激活检测器,用于接收音频信号,并作出所述音频信号是否被认为包括语音或噪音信息的第一判断;
信号激活检测器,用于接收音频信号,并作出音频信号是否包括对收听者可感知相关的非语音信息的第二判断;
与所述话音激活检测器和所述信号激活检测器相耦合的逻辑块,所述逻辑块具有一个能指示音频信号是否包括可感知相关信息的输出,所述逻辑块可操作地用于可选择地在所述输出处提供表明指示噪音信息的所述第一判断的信息,并且还可操作地用于响应指示可感知相关的非语音信息的所述第二判断而有选择地忽略指示噪音信息的所述第一判断,
其中所述话音激活检测器可操作地用于将从开环长期预测分析得到的相关值与预定值进行比较。
18.如权利要求17所述的设备,其中所述逻辑块可操作地用于对所述相关值大于预定值作出响应而忽略所述第一判断。
19.如权利要求17所述的设备,其中所述逻辑块可操作地用于对在给定的时间周期内所述相关值的预定数大于预定值作出响应而忽略所述第一判断,所述音频信号被分割成的每个相应帧对应一个相关值。
20.如权利要求19所述的设备,其中所述逻辑块可操作地用于对连续相关值的预定数大于预定值作出响应而忽略所述第一判断,所述音频信号被分割成的每个相应帧对应一个相关值。
21.如权利要求17所述的设备,其中所述话音激活检测器可操作地用于通过探测音频信号的高通滤波模型的最高标准相关值得出所述相关值。
22.如权利要求21所述的设备,其中所述最高标准相关值表示在帧内的最大幅度标准相关值。
23.如权利要求22所述的设备,其中所述相关值是通过对所述最大幅度标准相关值滤波而得到的平滑相关值。
CN2006100733243A 1998-11-23 1999-11-12 用于音频信号的改进的语音/噪音分类的复合信号激活探测 Expired - Lifetime CN1828722B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US10955698P 1998-11-23 1998-11-23
US60/109556 1998-11-23
US09/434,787 US6424938B1 (en) 1998-11-23 1999-11-05 Complex signal activity detection for improved speech/noise classification of an audio signal
US09/434787 1999-11-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB998136255A Division CN1257486C (zh) 1998-11-23 1999-11-12 用于将可感知相关信息保留在音频信号中的方法和设备

Publications (2)

Publication Number Publication Date
CN1828722A CN1828722A (zh) 2006-09-06
CN1828722B true CN1828722B (zh) 2010-05-26

Family

ID=26807081

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2006100733243A Expired - Lifetime CN1828722B (zh) 1998-11-23 1999-11-12 用于音频信号的改进的语音/噪音分类的复合信号激活探测
CNB998136255A Expired - Lifetime CN1257486C (zh) 1998-11-23 1999-11-12 用于将可感知相关信息保留在音频信号中的方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB998136255A Expired - Lifetime CN1257486C (zh) 1998-11-23 1999-11-12 用于将可感知相关信息保留在音频信号中的方法和设备

Country Status (15)

Country Link
US (1) US6424938B1 (zh)
EP (1) EP1224659B1 (zh)
JP (1) JP4025018B2 (zh)
KR (1) KR100667008B1 (zh)
CN (2) CN1828722B (zh)
AR (1) AR030386A1 (zh)
AU (1) AU763409B2 (zh)
BR (1) BR9915576B1 (zh)
CA (1) CA2348913C (zh)
DE (1) DE69925168T2 (zh)
HK (1) HK1097080A1 (zh)
MY (1) MY124630A (zh)
RU (1) RU2251750C2 (zh)
WO (1) WO2000031720A2 (zh)
ZA (1) ZA200103150B (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US6694012B1 (en) * 1999-08-30 2004-02-17 Lucent Technologies Inc. System and method to provide control of music on hold to the hold party
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
EP1569200A1 (en) * 2004-02-26 2005-08-31 Sony International (Europe) GmbH Identification of the presence of speech in digital audio data
US7983906B2 (en) * 2005-03-24 2011-07-19 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
CA2612903C (en) * 2005-06-20 2015-04-21 Telecom Italia S.P.A. Method and apparatus for transmitting speech data to a remote device in a distributed speech recognition system
KR100785471B1 (ko) * 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
CA2690433C (en) 2007-06-22 2016-01-19 Voiceage Corporation Method and device for sound activity detection and sound signal classification
EP2235924A1 (en) * 2007-12-07 2010-10-06 Agere Systems, Inc. End user control of music on hold
US20090154718A1 (en) * 2007-12-14 2009-06-18 Page Steven R Method and apparatus for suppressor backfill
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
CA2716817C (en) * 2008-03-03 2014-04-22 Lg Electronics Inc. Method and apparatus for processing audio signal
WO2009110751A2 (ko) * 2008-03-04 2009-09-11 Lg Electronics Inc. 오디오 신호 처리 방법 및 장치
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2410521B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for generating an audio signal and computer program
KR101251045B1 (ko) * 2009-07-28 2013-04-04 한국전자통신연구원 오디오 판별 장치 및 그 방법
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102044243B (zh) * 2009-10-15 2012-08-29 华为技术有限公司 语音激活检测方法与装置、编码器
AU2010308597B2 (en) * 2009-10-19 2015-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
EP2491549A4 (en) 2009-10-19 2013-10-30 Ericsson Telefon Ab L M DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY
US20110178800A1 (en) * 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102237085B (zh) * 2010-04-26 2013-08-14 华为技术有限公司 音频信号的分类方法及装置
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
ES2489472T3 (es) 2010-12-24 2014-09-02 Huawei Technologies Co., Ltd. Método y aparato para una detección adaptativa de la actividad vocal en una señal de audio de entrada
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
US20140006019A1 (en) * 2011-03-18 2014-01-02 Nokia Corporation Apparatus for audio signal processing
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
US9208798B2 (en) 2012-04-09 2015-12-08 Board Of Regents, The University Of Texas System Dynamic control of voice codec data rate
EP3301676A1 (en) 2012-08-31 2018-04-04 Telefonaktiebolaget LM Ericsson (publ) Method and device for voice activity detection
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
KR101690899B1 (ko) 2012-12-21 2016-12-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성
CA2948015C (en) 2012-12-21 2018-03-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
RU2675777C2 (ru) 2013-06-21 2018-12-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ улучшенного плавного изменения сигнала в различных областях во время маскирования ошибок
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
ES2941782T3 (es) 2013-12-19 2023-05-25 Ericsson Telefon Ab L M Estimación de ruido de fondo en señales de audio
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
KR102299330B1 (ko) * 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
CN113345446B (zh) * 2021-06-01 2024-02-27 广州虎牙科技有限公司 音频处理方法、装置、电子设备和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720862A (en) * 1982-02-19 1988-01-19 Hitachi, Ltd. Method and apparatus for speech signal detection and classification of the detected signal into a voiced sound, an unvoiced sound and silence
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
CN1257486C (zh) * 1998-11-23 2006-05-24 艾利森电话股份有限公司 用于将可感知相关信息保留在音频信号中的方法和设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
AU671952B2 (en) * 1991-06-11 1996-09-19 Qualcomm Incorporated Variable rate vocoder
US5930749A (en) * 1996-02-02 1999-07-27 International Business Machines Corporation Monitoring, identification, and selection of audio signal poles with characteristic behaviors, for separation and synthesis of signal contributions
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US6097772A (en) * 1997-11-24 2000-08-01 Ericsson Inc. System and method for detecting speech transmissions in the presence of control signaling
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720862A (en) * 1982-02-19 1988-01-19 Hitachi, Ltd. Method and apparatus for speech signal detection and classification of the detected signal into a voiced sound, an unvoiced sound and silence
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
CN1257486C (zh) * 1998-11-23 2006-05-24 艾利森电话股份有限公司 用于将可感知相关信息保留在音频信号中的方法和设备

Also Published As

Publication number Publication date
KR100667008B1 (ko) 2007-01-10
CN1828722A (zh) 2006-09-06
CA2348913C (en) 2009-09-15
US6424938B1 (en) 2002-07-23
EP1224659A2 (en) 2002-07-24
MY124630A (en) 2006-06-30
ZA200103150B (en) 2002-06-26
DE69925168D1 (de) 2005-06-09
KR20010078401A (ko) 2001-08-20
JP2002540441A (ja) 2002-11-26
BR9915576A (pt) 2001-08-14
CN1419687A (zh) 2003-05-21
BR9915576B1 (pt) 2013-04-16
CN1257486C (zh) 2006-05-24
RU2251750C2 (ru) 2005-05-10
HK1097080A1 (en) 2007-06-15
EP1224659B1 (en) 2005-05-04
AR030386A1 (es) 2003-08-20
AU1593800A (en) 2000-06-13
AU763409B2 (en) 2003-07-24
CA2348913A1 (en) 2000-06-02
JP4025018B2 (ja) 2007-12-19
WO2000031720A2 (en) 2000-06-02
WO2000031720A3 (en) 2002-03-21
DE69925168T2 (de) 2006-02-16

Similar Documents

Publication Publication Date Title
CN1828722B (zh) 用于音频信号的改进的语音/噪音分类的复合信号激活探测
CN100508028C (zh) 将释放延迟帧添加到由声码器编码的多个帧的方法和装置
CN101320563B (zh) 一种背景噪声编码/解码装置、方法和通信设备
CN101197130B (zh) 声音活动检测方法和声音活动检测器
US6484138B2 (en) Method and apparatus for performing speech frame encoding mode selection in a variable rate encoding system
US7124079B1 (en) Speech coding with comfort noise variability feature for increased fidelity
EP1747442B1 (en) Selection of coding models for encoding an audio signal
EP1747555B1 (en) Audio encoding with different coding models
US5579435A (en) Discriminating between stationary and non-stationary signals
JPH09152894A (ja) 有音無音判別器
US6424942B1 (en) Methods and arrangements in a telecommunications system
CN1244090C (zh) 具备背景噪声再现的语音编码
CN102760441B (zh) 一种背景噪声编码/解码装置、方法和通信设备
KR20070017379A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CI02 Correction of invention patent application

Correction item: Priority

Correct: 1999.11.05 US 09/434787

False: Lack of priority second

Number: 36

Page: The title page

Volume: 22

COR Change of bibliographic data

Free format text: CORRECT: PRIORITY; FROM: MISSING THE SECOND ARTICLE OF PRIORITY TO: 1999.11.5 US 09/434787

REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1097080

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1097080

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20100526

CX01 Expiry of patent term