CN100393085C - 数字网络中的音频信号质量增强 - Google Patents

数字网络中的音频信号质量增强 Download PDF

Info

Publication number
CN100393085C
CN100393085C CNB008201188A CN00820118A CN100393085C CN 100393085 C CN100393085 C CN 100393085C CN B008201188 A CNB008201188 A CN B008201188A CN 00820118 A CN00820118 A CN 00820118A CN 100393085 C CN100393085 C CN 100393085C
Authority
CN
China
Prior art keywords
analog signal
signal
processing unit
digitalized analog
encode digitalized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB008201188A
Other languages
English (en)
Other versions
CN1504042A (zh
Inventor
托米·科伊斯蒂宁
奥利·克拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN1504042A publication Critical patent/CN1504042A/zh
Application granted granted Critical
Publication of CN100393085C publication Critical patent/CN100393085C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及用于提高通过数字网络以参数化编码形式传送的数字化模拟信号的质量的网络部件(1)和方法。为了能够提高在网络侧上的数字化模拟信号的质量,该网络部件包括用于从网络中提取信号并且将信号插入到该网络中的装置(20,21)、用于利用适用于提高数字化模拟信号的质量的功能来在参数域中处理所提取的参数的第一处理装置(24)以及用于利用适用于提高这些数字化模拟信号的质量的功能来在线性域中处理所提取的参数的第二处理装置(26)。而且还包括分析和选择装置(23,27),用来确定在不同处理域中的所期望的质量改善并且将经过处理的信号相应回插到该网络中。所提出的方法包括相应的步骤。

Description

数字网络中的音频信号质量增强
技术领域
本发明涉及用于增强以参数化编码形式通过数字网络传送的数字化模拟信号的质量的网络部件和方法。
背景技术
数字网络例如基于分组的IP(因特网协议)网络或基于TDM(时分复用)的网络用来不仅传送信号业务而且还传送数字化模拟信号,尤其是音频信号例如语音和视频。
在可以通过数字网络传送数字化模拟信号之前,必须对该信号进行模拟-数字转换。另外,通常以8∶1或4∶1的压缩比对该信号进行压缩,以使得能够实现以低比特率接入核心网络,并且节约核心网络自身内的容量。
例如当在两个IP终端之间传送话音时,通过在源终端(sourceterminal)中的编码器对语音进行转换和压缩以形成参数化编码数字化模拟信号,并且通过在目的地终端中的解码器进行解压缩和重新转换,反之亦然。
在相应源终端处提供给终端用户的语音质量取决于各种因素。
第一组因素与网络有关,包括在传送路径上的延迟、丢失分组等。
第二组因素是与终端有关,包括麦克风、扬声器、A/D转换器、自动电平控制、回波消除器、噪声抑制器等的质量。另一个与终端相关的因素是终端的周围环境例如环境噪声。除了所采用的语音增强特性或服务的质量不同之外,一些终端可能甚至完全缺乏某些可以用来提高终端用户的满意程度的语音增强特性或服务。
第三组因素在一次传送中涉及几个网络时出现,例如在IP终端与PSTN(公用交换电话网)或移动接入网进行互配时。在这种情况中,由于来自PSTN混合网络的回波或由于来自移动终端等的噪声,所以会导致额外的降级。IP-PSTN网关用来使得IP网络和PSTN或移动接入网之间能够进行互配。这些网关可以包括用来增强由它们传送的语音的质量的特性。但是,一些网关一直缺乏重要的语音增强特性。
在数字网络中,通常不用对在网络侧上的终端或网络转换特定因数进行补偿。
对于GSM(全球数字电话移动系统)网络而言,ETSI(欧洲电信标准学会)TFO(级联式自由操作)规定了可以怎样避免尤其在网关和交换机处的多次编码和解码。当遵照TFO模型时,所传送的TFO流包括在语音参数域中端到端传送的参数化编码语音。端点可以是通过网关连接的两个移动电话或一个移动电话和一个IP终端。只是通过IP网络互连的两个IP终端本来就涉及TFO。相同的原理也适用于其中语音可以始终停留在该分组网络中的GPRS(通用分组无线电服务)和第三代网络。后者的示例性路由为:MS-BS-RNC-SGSN-GGSN-IP终端或MS-BS-PCU-SGSN-GGSN-IP终端(MS:移动站;BS:基站;RNC:无线电网络控制器;SGSN:服务GPRS支持节点;GGSN:网关GPRS支持节点;PCU:分组控制器)。但是,直到在所有网络中都实现了端到端连接,影响所传送的数字化模拟信号的质量的转换因数仍然必须得到考虑,并且终端特定的因数无论任何都不会受到TFO方法的影响。
总之,如果数字网络提供用来增强数字化模拟信号的质量的装置,则是有利的。但是由于质量原因应该避免进行多次编码和解码。
对于基于分组的网络而言,ITU-T技术规范H.323(07/2000)介绍了一种用于电话会议的多点处理器(MP)。该多点处理器通过切换和/或混合从M个音频输入信号中制作出N个音频输出信号。为了进行混合,将输入音频信号解码成在其上进行线性合并的线性信号。将所得到的信号再次编码成适当的音频格式。而且有人提出,多点处理器消除或衰减了一些输入信号以便减小噪声和其它不期望有的信号。
但是,这意味着还要进行额外的解码和编码步骤,但是由于如上所述的音频信号质量和小处理延迟的缘故,应该避免这些步骤。
发明内容
本发明的一个目的在于提供能够令人满意地增强在网络侧上由数字网络传送的数字化模拟信号质量的网络部件和方法。
一方面,该目的是通过一种用来提高至少以参数化编码形式由网络部件可访问的数字网络传送的数字化模拟信号的质量的网络部件来实现的,该网络部件包括:有效负载提取部件(20,30,40),用来从数字网络中提取编码数字化模拟信号,这些编码数字化模拟信号至少部分包括参数化编码数字化模拟信号;第一处理装置,用于利用适用于增强数字化模拟信号的质量的功能来在参数域中处理所提取的参数化编码数字化模拟信号;第二处理装置,用来利用适用于增强数字化模拟信号的质量的功能来在线性域中处理所提取的编码数字化模拟信号的至少一部分;有效负载插入部件,用来将经处理的编码数字化模拟信号插入到所述数字网络中;以及分析和选择装置,用于确定由在参数域中对所提取的编码数字化模拟信号进行处理以及由在线性域中对所提取的编码数字化模拟信号进行处理所得到的数字化模拟信号的质量改善,并且用来使得至少是经过所述第一或第二处理装置处理的导致更好改善的编码数字化模拟信号通过有效负载插入部件回插到数字网络中;其中有效负载提取部件的输出与第一处理装置和第二处理装置的输入直接或间接相连,其中第一处理装置和第二处理装置的输出直接或间接与有效负载插入部件的输入相连,并且其中分析和选择装置安排在有效负载提取部件与第一处理装置和第二处理装置中的至少一个之间和/或安排在一方面是第一处理装置和第二处理装置中的至少一个与另一方面是有效负载插入部件之间。
另一方面,该目的是通过一种用于提高至少以参数化编码形式由数字网络传送的数字化模拟信号的质量的方法来实现的,该方法包括:从数字网络中提取编码数字化模拟信号,这些编码数字化模拟信号至少部分包括参数化编码数字化模拟信号;确定通过在参数域中对所提取的编码数字化模拟信号进行处理以及通过在线性域中对所提取的编码数字化模拟信号进行处理所期望的对所提取的编码数字化模拟信号的质量改善;至少在认为通过在参数域中进行处理能够获得更大的质量改善的情况下,利用适用于提高数字化模拟信号的质量的功能,在参数域中处理所提取的参数化编码数字化模拟信号;并且至少在认为通过在线性域中进行处理能够获得更大的质量改善的情况下,利用适用于提高数字化模拟信号的质量的功能,在线性域中处理至少部分所提取的参数化编码数字化模拟信号;并且至少将那些经过处理的编码数字化模拟信号插入到在该数字网络中,这些信号在该域中经过被认为导致更大的质量改善的处理。
通过包括不仅在线性域中而且在参数域中能够对所传送的编码数字化模拟信号进行处理的能力,本发明的网络部件和方法能够对网络侧上的数字化模拟信号的质量进行优化增强。
本发明的网络的分析和选择装置通过分析是线性域处理还是参数域处理能导致数字化模拟信号得到更好的质量改善来确定应当使用线性域处理和/或参数域处理。在本发明的方法中提供相应的步骤。例如,如果参数域处理对于信号质量的增强在技术上是不可行的,则期望线性处理会导致更好的质量增强。如果可以在参数域中处理,则针对这两种处理来确定所期望的质量增强,并且根据对所期望的增强进行比较来进行选择。
在认为在参数域中对所提取的信号进行处理会导致数字化模拟信号得到更好的质量增强的情况中,再次将至少在参数域中处理的信号插入到网络中。在认为在线性域中对所提取的信号进行处理会导致数字化模拟信号得到更好的质量增强时,再次只将在线性域中处理的信号插入到网络中。
在认为在参数域中进行处理会导致更好的结果时,如果在线性域中的处理因为在处理之前和处理之后必须的时间消耗而导致更大的处理延迟,则应当只是除了在参数域中处理的信号之外,将在线性域中处理的信号插入到网络中。这样,可以免去在线性域中处理参数化编码的数字化模拟信号之前所必须的对所提取的信号进行额外的解码和编码的这一缺点。不对信号进行额外的解码和编码意味着数字化模拟信号的质量更好以及同时处理延迟较小。例如,通过基于分组的网络传送的参数化编码数字化模拟信号,以及在基于TDM的网络中TFO流中传送的编码数字化模拟信号都需要在线性域中在处理之前解码和在处理之后编码,而在基于TDM的网络中PCM流中传送的编码数字化模拟信号只需要a-律或μ-律来进行线性转换,对线性处理而言反之亦然。
在根据所期望的质量改善选择再次插入到网络中的信号的同时,如果要对所处理的信号进行评估以确定哪种处理会期望导致更好的结果,则在任何情况下都可执行在两个域中的处理。当只有在参数域中处理的信号要再次插入到网络中时,可以在线性域中的处理完成之前进行该插入。然后一旦在线性域中处理的信号准备好用于确定线性处理的未来期望的质量改善,就立刻使用这些信号。
在从属权利要求中可以清楚地了解本发明的优选实施方案。
本发明网络的分析和选择装置可以根据输入参数域数据、例如用于增益的参数的分析来确定要在参数域中还是在线性域中进行处理。或者或此外,可以根据在解码之后在线性域中进行的测量例如话音电平、信噪比和回波的存在来进行确定。优选的是,在线性域和在参数域中处理输入数据之前和之后进行测量和选择。然后通过将测量结果与建议了采用线性域或者参数域处理的固定阈值进行比较来选择处理域。可以通过例如改变在两个域中处理和估定的测试输入数据来进行真听测试而导出阈值的数值。
由于几个因素会影响处理域的选择,所以可能难以用公式表明会在所有呼叫情况下导致最佳选择的阈值模式。因此,在进一步优选的实施方案中,采用基于神经网络的方法来选择能期望带来更好结果的处理域。解码之后来自测量结果的输入参数域数据和结果可以作为N个神经元的神经网络的输入。可以通过利用适当的测试数据和来自真听测试的输出来训练(training)网络来导出神经元的权重或系数。
用于在参数域中进行处理的处理装置和用于在线性域中进行处理的处理装置可以包括各种功能。对于在参数域和在线性域的处理中,回波消除、降噪和电平控制功能都是可以的。另外,作为会议桥分器的变码和语音混合至少是在参数域的处理中可能的功能。
例如,对于参数域中的增益控制,所提取的参数化编码数字化模拟信号的增益参数可以与用于形成相应新增益参数的所需增益进行比较。所期望的增益参数可以是预设的,通过使用者输入的或者是由所接收的增益参数计算出的。然后将新增益参数插入到所提取的参数化编码数字化模拟信号中,由此代替了原始增益参数。
为了通过在参数域中处理而实现噪声控制,在时域中进行处理或者在频率域中进行处理,优选是在两个域中都进行处理。在时域中,所提取的参数化编码数字化模拟信号的噪声部分和低电平信号部分被衰减,将相应的增益参数插入到所提取的参数化编码数字化模拟信号中,由此替换了原始增益参数。在频率域中,在所提取的参数化编码数字化模拟信号中与噪声估计值具有大致相同能量的噪声频率部分被衰减。然后将相应的线性预测参数插入到所提取的参数化编码数字化模拟信号中,由此替换了原始线性预测参数。
对于在参数域中的回波抑制,从两个传送方向提取参数化编码数字化模拟信号。然后可以对信号进行比较,以检测在第一参数化编码数字化模拟信号中的回波。如果在第一参数化编码数字化模拟信号部分中确定有回波,则将第一参数化编码数字化模拟信号的部分用舒适(comfort)噪声部分替换。也可以首先衰减回波信号,然后抑制残余回波信号。如果在相反方向没有信号活动或者在相反方向所提取的参数化编码数字化模拟信号的信号电平低于阈值,则建议可以旁路第一参数化编码数字化模拟信号而不进行回波补偿。
在本发明的优选实施方案中,在网络部件中包括坏帧处理器部件。该部件可以和有效负载提取部件以及处理装置一起工作,用于例如从RTP(实时协议)号数中检测缺失帧,用于例如通过使用内插法或者复制前帧来再生缺失的块,以及用于在缓冲窗口中对无序帧进行重新排序。坏帧处理器部件的适当位置紧接着在有效负载提取部件之后。
在本发明另一个优选实施方案中,网络部件包括分析装置,用于确定是否对所提取的参数化编码数字化模拟信号采用任何处理,并用于选择在参数域和/或线性域中对所提取的编码数字化模拟信号要采用的功能。那些功能可以包括在用于确定在参数域中的处理和/或线性域中的处理所期望的质量改善的分析和选择装置中。
在认为不必要进行任何处理的情况下,编码数字化模拟信号可以简单地通过一个或者两个处理装置,而不进行任何处理。
通过分析所接收的编码数字化模拟信号并且还可能通过分析已经经过处理的信号,可以通过分析装置来自主地进行选择。或者或此外,该选择可以依赖于外部控制信号。即使采用外部控制信号并且没有请求进行任何处理,分析装置也可以估计所接收的参数化编码数字化模拟信号例如关于语音电平、回波的存在、信噪比的质量,并选择一个或几个处理功能。外部控制信号可以通过在网络部件中的控制部件进入网络部件,该控制部件符合规定的H.248协议,并表示例如连接上已经有回波消除器,因此可以通过处理装置在没有消除回波的情况下发送所接收的参数化编码数字化模拟信号。控制部件可以直接接入到处理装置,用于选择由其执行的处理功能。
对要采用的最适合的功能的选择也是本发明方法的优选特征。
所涉及的数字网络可以是基于分组的例如IP-、UDP-(用户数据报协议)、或者RTP-(实时协议)网络,或者基于TDM的网络。也可以接入任何其他传送参数化编码数字化模拟信号的数字网络。当在本说明书中称之为IP网络时,它包括任何IP-、UDP-、或者RTP-网络。
在基于分组的网络中,数字化模拟信号仅作为参数化编码数字化模拟信号传送。在例如针对GSM而采用的基于TDM的网络中,数字化模拟信号可以作为参数化编码的数字化模拟信号在TFO流中并且同时在PCM(脉冲编码调制)流中按照编码G.711PCM抽样的a律或μ律来传送。
因此,在一个优选的替换实施方案中,有效负载提取部件适合于从基于分组的网络的IP存储栈(IP stack)中提取参数化编码数字化模拟信号,有效负载插入部件适合于将参数化编码数字化模拟信号插入到基于分组的网络的所述IP存储栈中。
在另一个优选的替换实施方案,有效负载提取部件适合于从TDM网络的时隙中提取TFO流,必要时,还提取PCM流。在后者的情况下,在有效负载提取框中使这两个流分开以便进行进一步处理,有效负载插入部件适合于将所提供的TFO流和所提供的PCM流再次合并,并将合并的流插入到所述基于TDM的网络中。但是如果该有效负载插入装置只提供有PCM流,它可以再次只将该PCM流回插到所述TDM网络中。
在GSM-PCM中,有效负载提取部件可以只采用TFO流作为输入,或者采用TFO流和PCM流作为输入,然后在有效负载提取部件中将这两个流分开。
再次插入到数字网络中的所提取的TFO流已经通过在线性处理之前解码并且在线性处理之后编码而在参数域中或者在线性域中受到了处理。插入哪一种TFO流应当取决于对所包括的数字化模拟信号所实现的或者可以实现的质量改善。另外,在线性域中在解码之后处理的TFO流应当在没有进行在先编码的情况下而被转换为PCM流,该PCM流与所选择的编码TFO流合并以便插入到数字网络中。但是,在不能在有效负载提取装置处获得TFO流或者在TFO流停止的情况下,可以在线性域中提取和处理PCM流,并通过有效负载插入装置自身输出到数字网络中。
或者,可以在参数域中对TFO流进行处理,同时可以在线性域中对不必为线性处理而解码的PCM流进行处理。在只有在认为对TFO流进行处理能够导致比对PCM流进行处理更好的结果而对TFO流进行处理的情况中,当没有进行处理时,TFO流就不一定包含在再次插入到网络中的数据中。
本发明的网络部件可以任意地设置在任何其他网络部件的旁边或者内部。在基于分组的网络中,本发明的网络部件优选与宽带IP节点共处一地,这样会导致最小的处理延迟。
本发明的网络部件和方法可以用于增强以参数化编码形式由数字网络传送的任何数字化模拟信号的质量。特别适合于传送语音,但是也例如用于视频。
附图说明
在下面,将参照附图对本发明进行更详细地说明,其中
图1显示出本发明网络部件在IP网络中的结合;
图2显示出本发明网络部件的第一实施方案;
图3显示出本发明网络部件的第二实施方案;
图4显示出本发明网络部件的第三实施方案;
图5显示出参数域增益控制的实施方案的方框图;
图6显示出参数域噪声抑制的实施方案的方框图;
图7显示出参数域回波抑制的实施方案的方框图;并且
图8显示出参数域回波消除的实施方案的方框图。
具体实施方案
图1显示出根据本发明的网络部件1的环境。
第一终端2通过IP网络与第二终端3连接。这两个终端2、3可以是IP电话。在IP网络中的一些位置处,具有形成宽带IP节点4的IP路由器。根据本发明的网络部件1与该网络节点4共处一地并且与之连接。
网络部件1在语音参数域中操作并且能够对参数化编码语音执行信号处理功能。可行的功能有回波消除、降噪、增益控制、会议桥分和坏帧处理。下面将参照图5至8对用于实现这些功能的一些的可能方案进行说明。
参数化编码语音从第一终端2通向网络节点4。它们从网络节点4中被转发给网络部件1,该网络部件1在语音参数域中执行适当的功能。然后,将经处理的参数化编码语音发回给网络节点4,该网络节点将它们转发给它们的目的地即第二终端3。
图2显示出在图1的网络部件的实施方案中所包含的不同元件。
有效负载提取部件20和有效负载插入部件21一起形成网络部件1与网络节点4的接口。在网络部件1内,有效负载部件20通过坏帧处理器部件22与分析器和选择器部件23连接。分析器和选择器部件23的两个输出端一方面与第一处理装置24连接,而另一方面通过语音解码部件25与第二处理装置26连接。处理装置24、26中的每一个都包括回波消除、降噪和电平控制的功能。第一处理装置24的输出端与选择器27的输入端连接。第二处理装置26的输出端同样与选择器27的输入端连接,但是通过语音编码部件28连接。选择器27的输出信号被输入给有效负载插入部件21。最后,具有一控制部件29,例如H.248协议控制部件,该控制部件接收在网络部件1外面产生出的控制信号作为输入,并且其输出与分析器和选择器部件23连接。
网络部件1其作用如下:
有效负载提取部件20从图1的网络节点4的IP存储栈中提取有效负载即参数化编码语音。通过坏帧处理器部件22来检测这些语音参数。这里,通过采用内插法技术来探测和再生缺失帧。而且,在缓冲窗口内使无序帧重新排序。然后将经过处理的信号转发给分析器和选择器部件23。
分析器和选择器部件23对这些语音参数进行分析并且确定在线性域中的处理还是在参数域中的处理能够导致更好的结果并且应该应用这些可用功能中的哪一种。如果参数域处理在技术上对于语音增强而言不是可行的,则选择线性处理。分析器和选择器部件23还可以确定根本不需要进行任何处理。分析器和选择器部件23通过控制部件29接收其它的外部信息,例如表示在连接部分上是否已经有回波消除器,从而不必另外进行回波消除。
如果选择在参数域中不进行任何处理或进行处理,则分析器和选择器部件23向第一处理装置24输出编码语音,这在参数域中将所有选择的功能应用在参数化编码语音上。
如果认为必须在线性域中进行处理,则分析器和选择器部件23向语音解码部件25输出参数化编码语音。该语音解码部件25将编码语音(这可能适用于GSM FR(全速率))解码以形成线性信号。然后将线性语音信号输入给第二处理装置26,该装置在线性域中将所有选定的功能应用在线性语音信号上。在处理之后,将线性语音信号输入给语音编码部件28,该部件对线性语音信号进行编码以再次形成适用于GSM FR的参数化编码语音。
选择器27接收语音编码部件28和第一处理装置24的输出信号,而且受到分析器和选择器部件23的控制。因此,选择器27能够确定来自第一处理装置24的信号或来自语音编码部件28的信号是否构成经处理的编码语音,并且能够将相应的信号转发给有效负载插入部件21。而且选择器27可以通过提供关于经处理信号的信息来支持分析器和选择器部件23的工作。
在有效负载插入部件中,将参数化编码语音作为有效负载回插到网络节点4的IP存储栈,从那里将它转发给其目的地3。
总之,可以实现语音质量的增强,同时只在必要时进行附加的解码和编码。因此避免了语音质量的过度下降,并且通过在参数域中的处理使处理延迟保持较小。由于网络部件1与宽带IP节点共处一地,所以可以使处理延迟降到最小。
图3示意性地显示出本发明的网络部件的另一个实施方案。该实施方案类似于网络部件的第一实施方案,但是本实施方案用来对从在基于TDM的网络中的节点接收到的用于GSM TFO的编码语音参数进行处理。
与图2的网络部件一样,图3的网络部件包括一有效负载提取部件30、一坏帧处理器32、一分析器和选择器部件33、一解码部件35、第一和第二处理装置34、36、一编码部件38、一有效负载插入部件31以及一H.248控制部件39。这两个处理装置34、36还用来进行回波消除、降噪和电平控制。这些元件以与在图2中相同的方式相互连接。但是,与图2的网络部件不同的是,代替选择器部件27,将一第二分析器和选择器部件37结合在编码部件38和有效负载插入部件31之间。而且,第二处理装置36的输出端不仅与编码部件38连接,而且还与有效负载插入部件31直接连接。
该第二实施方案的网络部件其作用如下:
从网络节点进入有效负载提取部件30的信号在其最高有效位中包含48或56kbps的G.711PCM流,并且在最低有效位中包含16或8kbps的GSM TFO编码语音参数。在有效负载提取部件30中,将TFO流与PCM流分开。只将TFO流发送给坏帧处理器部件32,在那里如针对在图2的实施方案中对参数化编码语音进行的处理所述的一样对它进行处理。
在坏帧处理之后,将TFO输入给分析器和选择器部件33。该分析器和选择器部件33一方面将TFO流发送给第一处理装置34,在那里在参数域中对该TFO流进行处理。另一方面,该分析器和选择器部件33将TFO流发送给解码装置35,在那里进行语音解码,例如还是GMS FR进行线性解码。然后将被解码的TFO流输入给第二处理装置36,在那里在线性域中对它进行处理。对于这两个处理装置34、36而言,根据通过控制部件39进入网络部件的外部控制信号来在第一分析器和选择器装置33选择所要应用的功能。
第一处理装置34的输出信号被输送给分析器和选择器部件37。第二处理装置36的输出信号在解码装置中再次被语音编码,例如线性GSM FR编码,并且同样被输送给第二分析器和选择器部件37。
第一分析器和选择器部件33和第二分析器和选择器部件37一起作用以便确定那种处理即在参数域中的处理或在线性域中的处理导致更好的音质。
在确定TFO流的参数处理导致比解码TFO流的线性处理更好的音质的情况下,通过第二分析器和选择器部件37只是将来自第一处理装置34的TFO流发送给有效负载插入装置31。在确定解码TFO流的线性处理导致比TFO流的参数处理更好的音质的情况下,通过第二分析器和选择器部件37只是将来自编码部件38的TFO流发送给有效负载插入装置31。
这两种途径可以一直进行工作,从而可以在解码装置25和编码装置28中的内部状态中无间断地进行在不同模式即纯线性处理和平行处理之间的变化。
另外在没有任何编码的情况下将第二处理装置36的输出直接发送给有效负载插入装置31。在有效负载插入装置31中,PCM流由经过解码和线性处理的TFO流形成。然后将该PCM流和选择编码的TFO流合并并且回插到基于TDM的网络以便进行进一步的传送。
因此,通过线性处理改善了在输出PCM流中的数字化模拟信号的语音质量,并且根据哪种处理能够导致更好的结果来通过在参数域中或在线性域中的处理改善了在输出TFO流中的数字化模拟信号的语音质量。
如果在由有效负载提取装置30提取的信号中没有任何可用的TFO流的话,或者如果TFO流停止的话,则提供一种方案来通过用来进行与帧相关的处理的坏帧处理器32并且通过在线性域中进行处理的第二处理装置36来引导PCM流。通过解码部件不是必要的,因为PCM流不包含参数数据。但是,应该注意的是,对G.711PCM流进行的线性处理需要a律或μ律来进行线性转换并且反之亦然。然后通过有效负载插入装置31将经处理的PCM流再次插入到数字网络中。
图4示意性地显示出本发明的网络部件的第三实施方案,它构成用于增强在供GSM TFO使用的基于TDM的网络中的语音质量的第二可选方案。
在该实施例中,有效负载提取部件40通过坏帧处理器部件42与第一和第二处理装置44、46直接连接。这两个处理装置44、46也包括回波消除、降噪和电平控制的功能。还有,第一和第二处理装置44、46的输出端只是直接与有效负载插入部件41的输入端连接。也设有H.248协议控制部件49。
该第三实施方案的网络部件其作用如下:
从网络节点进入有效负载提取部件40的PCM流和TFO流如在图3的实施方案一样由有效负载提取部件40分开。但是,在该实施方案中,TFO流和PCM流两个都被发送给坏帧处理器部件42并且在那里如参照图2所述一样进行处理。
在坏帧处理之后,将TFO发送给第一处理装置44,在那里在参数域中对它进行处理。同时,将PCM抽样发送给第二处理装置46。由于在该实施方案中,只有PCM抽样受到在线性域中工作的处理装置46的处理,所以就不需要解码部件;如针对图3的实施方案所述一样PCM流不包含参数化的数据。在这两个处理装置44、46中,通过网络部件的控制部件49来根据外部控制信号选择所要应用的功能。
因此,同时对TFO流和PCM流单独地进行语音增强。在任何情况中,在TFO流中的编码语音没有被解码以再次进行处理和编码。
离开处理装置44、46的TFO流和PCM流在有效负载插入部件41中合并并且被回插到基于TDM的网络中以便进行进一步的传送。可以确定在该网络的一些其它位置处应该使用这些流中的哪一个来获得最佳的音质。
根据本发明的网络部件的三个实施方案中的每一个能够用最小的处理延迟来提高在网络侧上的参数化语音或视频的质量。可以任意地将它们设置在任何现有的网络部件之外或之内。
现在将参照图5至8对在图2至4中任一幅的第一处理装置24,34,44中的参数域中的处理的不同可能方案进行说明。
图5显示出可以结合在根据本发明的网络部件的第一处理装置中以便在参数域中进行增益控制的增益控制装置的方框图。输入线在一方面与解码器50的输入端连接,而另一方面与增益参数重新量化部件53的第一输入端连接。解码器50还直接并通过语音电平估计部件51与线性-参数域映射部件52连接。线性-参数域映射部件52的输出端与增益参数重新量化部件53的第二输入端连接,该第二输入端另外还与输出线连接。
将输入的编码语音帧发送给解码器50,在那里编码语音在被输送给语音电平估计部件51之前被线性化。该语音电平估计部件51包括一内部话音活动探测器(VAD),用来指示电平估计是否已经得到更新,因为要求在语音电平估计中只估计语音电平。
在语音电平估计部件51中,根据估计语音电平和预定的所期望的目标语音电平来计算出所期望的增益数值。将所期望的增益输送给线性-参数域映射部件52的第一输入端。
只是对于自动电平控制需要语音估计部件51。在要使用固定的增益控制的情况中,可能是用户可设置的增强,可以去掉解码器50和语音估计部件51。
另外,还将例如20ms的当前语音帧或例如5ms的子帧的解码增益参数输送给线性-参数域映射部件52,这些解码增益参数直接来自解码器50。这些解码增益参数通常是码激励线性预测(CELP)语音编码器的激励增益参数。这些增益参数通常由自适应和固定密本(codebook)增益构成,这些增益受到矢量量化以便进行传送。可以从解码器50的内部中间数值来获得这些参数的标量数值。
在线性-参数域映射部件52中,将线性所期望的增益数值转换成语音编码器的适当的新增益参数。基于密本的映射用来确定当前帧或子帧的这些新增益参数以便实现所要求的增益。密本是一种三维表格,其中自适应密本增益、固定密本增益和线性增益数值形成每一维。一旦得知该帧或子帧的所有输入数值,就可以从该表格中读出新增益参数数值。以这样的方式预先对该表格进行训练,从而减小了在新增益参数数值和每个所期望的线性增益数值的增益定标编码帧的增益参数数值之间的误差。或者,可以通过减小解码重新量化语音帧和解码增益定标语音帧之间的误差来训练该映射表。该训练需要几个测试序列以便全面训练在该映射表内的所有元素。
在实际应用中,可以通过利用在数据中的冗余、通过限制线性增益数值或通过增加输入数值的步长来抑制该表格的尺寸。另一个选择是找出一种数学函数,该函数以其性能在主观上是可接受的方式来近似该映射函数。
最后,对这些新的增益数值重新进行量化以便进行传送,并且在增益参数重新量化部件53中用新的数值来代替原始的增益数值。
图6显示出噪声抑制装置的方框图,该装置可以结合在本发明网络部件的第一处理装置中以便在参数域中进行噪声抑制。
输入线一方面也与解码器60的输入端连接,并且另一方面与增益参数重新量化部件63的第一输入端连接。解码器60的第一输出端通过语音电平估计部件61、VAD66、噪声电平和频谱估计部件64和短期信号电平和频谱计算部件65与用于确定噪声衰减参数的部件67连接。而且VAD66的输出端与语音电平估计部件61的输入端以及噪声电平和频谱估计部件64的输入端连接。
用于确定噪声衰减参数的部件67的第一输出端与频谱-LP(线性预测)映射部件68的第一输入端连接,并且其第二输出端与线性-参数域映射部件62的第一输入端连接。
解码器60的第二输出端与噪声电平和频谱估计部件64的另一个输入端连接,并且另外还与频谱-LP映射部件68的第二输入端连接。解码器60的第三输出端与线性-参数域映射部件62的第二输入端连接。
线性-参数域映射部件62的输出端与增益参数重新量化部件63的第二输入端连接,其输出端又与LP参数重新量化部件69的第一输入端连接。该部件69的第二输入端与频谱-LP映射部件68的输出端连接。
最后,LP参数重新量化部件69的输出端与输出线连接。
解码器60、语音电平估计部件61、线性-参数域增益映射部件62和增益参数重新量化部件63可以与图5的实施例的相应部件50-53相同或相当类似。
在图6的实施例中,可以通过时域或频域参数处理来实现噪声抑制。显然,通过结合这两种方法可以实现最优的性能。
时域处理是基于一种动态处理,其中利用与图5的部件50-53相对应的部件60-63通过增益控制功能来使噪声部分和电平非常低的语音部分稍稍衰减。因此如上所述一样进行增益控制,只使用那个部件67来将由部件61接收到的语音电平估计发送给线性-参数域映射部件62。这可以被理解作为在参数域中的扩展功能。
在频率域噪声抑制中,使其能量大于语音的频率部分衰减。按照惯例,首先通过利用傅立叶变换或滤波器组将线性时域信号转换至频域。然后,可以将频谱减法应用在频域信号上。减去的量取决于噪声估计、信噪比和可能的其它参数。最后,将降噪的信号转换回时域。但是在该实施例中,通过将语音帧的线性预测(LP)频谱包迹重新整形来进行频域处理。以下将对此进行更详细地解释。
为了实现高质量的噪声抑制,必须模拟准确的噪声估计。为了区分语音和语音暂停,采用话音活动检测器66,该检测器在检测到语音的时候输出语音标志“真实”,在检测到语音暂停时输出语音标志“虚假”。话音活动检测器66应当是高质量的,以即使在低信噪比条件下也能获得准确的VAD决定,否则语音和噪声估计将会相互分离。基本上,当语音标志是真实的时候,在语音电平估计部件61中更新语音电平估计,当语音标志是虚假的时候,在噪声电平和频谱估计部件64中更新噪声电平和频谱估计。
在部件64中,估计长期噪声电平和频谱。对于长期噪声频谱估计而言,需要在解码器60中从所接收的语音帧中将线性预测系数(LPC)解码。LP系数通常由为编码所采用的编码器转化为线性谱对(LSP)。在那种情况下,可以从解码器60的内部中间值获得LPC值。因为LP系数仅限定了频谱包迹,需要噪声电平估计值来定标LP谱包迹,以形成噪声的功率谱估计。或者,可以通过利用所接收的帧的激励增益参数来定标LP频谱包迹。如前面所述的,仅在VAD标志虚假时更新噪声估计。
以与前述方式相同的方式在短期信号电平和谱计算部件65中计算出所接收的帧的短期信号电平和频谱,但是对电平计算不采用前帧的平均或快速平均。通常,不采用VAD决定。
该算法的主要智能在于用于确定噪声衰减参数的部件67。在该部件67中,根据部件64所接收的长期噪声频谱估计和由部件65所接收的短期信号频谱来选择频域噪声衰减参数(即所需的频谱整形)。相应的,所需的时域增益基于长期语音和噪声以及短期信号电平。另外,采用由VAD66接收到的VAD信息以及由从部件61和部件64接收的语音和噪声电平估计值中计算出的长期信噪比作为部件67的算法的额外信息,以便确定出噪声衰减参数。
在部件67中的频谱整形中,将长期噪声谱估计值与短期信号频谱进行比较。按照使非常接近于长期频谱的短期频谱部分轻微衰减的方式来对目标帧频谱进行整形。另一方面,那些明显高于长期频谱的部分保持不变,因为那些部分很可能含有语音信息。另外,在频率整形中可以利用人听觉系统的频率和暂时屏蔽。这意味着如果频谱的某些部分处于听觉频率屏蔽曲线之内,对那些部分不需要频率整形。如果一个或多个前帧已经含有会为当前帧的较低电平信号引入暂时屏蔽效果的较高的语音电平,则在暂时屏蔽中,对于当前帧不需要频率整形(或者时域处理)。利用这些规则,会给处理的语音导致较少的畸变,因为所进行的整形较少。
另外,可以通过VAD标志按照如下方式来控制频谱的整形,即如果检测到语音暂停,就采用较少的频谱整形。然后主要通过在语音暂停过程中由部件60-63进行增益处理而实现噪声衰减。另外,短期信号电平也可以控制整形量。即,由于噪声衰减部分利用增益处理来操纵,所以在低电平帧的情况中整形较少。最后,频谱整形的量可以按照如下方式取决于长期信噪比(SNR),即在高SNR时采用较少的整形,以在无噪语音条件下保持高质量。
一旦计算出当前帧的所需频谱整形,原始的LP系数必须根据所需的频谱进行转换。这些在频谱-LP映射部件68中进行。通过利用原始LPC和所需的频谱作为输入参数,可以以密本映射的方式再次实现映射。或者,可以通过将该谱转换为LP谱包迹并由此将其转换为LP系数从所需的频谱中直接计算出新的LP系数。
最后,在LP参数重新量化部件69中,新LPC参数被量化或转化为LSP参数,并且在编码帧中用新的参数替换旧的参数。
如前所述,信号动态扩展功能可以与频谱整形一同使用,或者甚至是单独使用。如果单独使用,只允许稍稍扩展,因为它可能导致噪声调制效果。一般在扩展中,信号电平越低,则采用越多的衰减。通过噪声电平估计按照如下方式控制扩展阈值,即不衰减超过噪声电平估计值的帧或者子帧。另外,VAD66可以按照只要当前帧是语音帧就采用略少的扩展的方式来控制扩展。由此,可以减少低电平语音衰减现象。
一旦发现了当前帧或者子帧的所期望线性增益,可以如参考增益控制所描述的一样在部件62和63中进行线性-参数域映射和增益参数重新量化。结果,改进的增益和LPC参数与其他的语音参数一同在传送媒介上传送。
图7表示可以结合在本发明网络部件的第一处理装置中的回波抑制装置的方框图,用于在参数域中进行回波抑制。
第一输入线连接至第一解码器70,第二输入线连接至第二解码器71,这两个解码器70,71连接至回波分析部件72。第一解码器70的输出端通过噪声估计部件73、舒适噪声产生部件74和编码器75连接至转换器76的一个接头。转换器76可以在编码器75和输出线之间形成连接,或者在第一输入线和输出线之间形成连接。回波分析部件72具有一个通向该转换器76的控制通路。
为了确定从近端向远端传送的信号是否包括回波并能够抑制或者消除该回波,必须分析来自两个传送方向的信号。因此,采用两个解码器70,71将来自近端(回波反射回来的点)的作为“送入”信号的信号和来自远端的作为“接收”信号的信号分别线性化。在线性域中进行回波分析是更容易和更准确的。在回波分析部件72中,估计两个线性化信号的信号电平。如果近端和远端信号的电平比例低于阈值,则近端信号被认为是回波,并将舒适噪声插入到要传送到远端作为“送出”信号的信号中。如果有声音回波,可以对远端信号估计采用特殊的过滤,以改善回波抑制的通话重叠(double talk)性能,例如如WO9749196所述。为了从信号比较中获得正确的结果,必须知道回波路径延迟。如果该延迟是可变的,可能需要延迟估计以限定正确延迟值。对于延迟估计可以采用互相关。
在噪声估计部件73中,形成从第一解码器70接收到的线性化近端信号的正确噪声估计。优选的是,在电平域和在频域中进行背景噪声估计。估计方法可以与噪声抑制中描述的方法相同。同样,可以使用其他方法,例如基于滤波器组或者傅立叶变换的方法。
然后在舒适噪声产生部件74中通过利用从噪声估计部件73中接收的噪声估计值来生成舒适噪声。为了产生舒适噪声,通过实际上具有与噪声估计部件73等同的包迹(envelope)频谱的合成滤波器输送电平定标的白噪声。因此合成滤波器可以是LP滤波器或者滤波器组。
最后,所产生的舒适噪声由编码器75编码,以形成包含编码舒适噪声参数的帧或者子帧。
如果对于当前送入帧或子帧通过回波分析部件72来显示回波,则通过回波分析部件72将转换器76切换成使编码器75和输出线连接,并且用所产生的编码舒适噪声参数替换当前帧或子帧。如果没有显示回波,转换器76保持连接,或者由回波分析部件72切换成使第一输入线与输出线连接,从而将原始帧或者子帧发送给输出线而没有被替换。
通过使用上述方法,在语音和舒适噪声帧中可以避免级联式(tandem)语音编码,从而可以提供高质量语音。
或者,并且为了节约处理和存储器资源,可以通过直接在参数域中产生舒适噪声来省略语音编码器。在参数域舒适噪声产生中,如参考图6所述的一样使背景噪声的长期LP频谱包迹平均化。另外,利用与LP频谱包迹更新同样的更新原理,也就是如果VAD标志是假的就进行更新的原理,对长期激励增益参数进行平均。通常只有固定的密本增益值需要平均,因为如果没有噪声类型的信号,自适应的密本增益值接近于0。因为需要将舒适噪声帧或子帧传送至远端,所以用经过平均化的LPC和增益参数来替换原始的LPC和激励增益参数。另外,用代表参数域中白噪声的随机脉冲来替换帧内的原始激励脉冲。如果在送入方向采用不连续传送(DTX),则不必传送激励脉冲。相反,在为大多数语音编解码(codecs)而标准化的无声描述帧(silence description frame)(SID)中只传送经过平均化的LPC和增益参数。在不连续传送中,在解码器端产生随机激励脉冲。
图8显示出可以结合在本发明网络部件的第一处理装置中用来在参数域中进行回波消除的回波消除装置的方框图。
第一输入线直接连接至第一解码器80,第二输入线通过FIFO(先进先出)帧存储器87连接至第二解码器81,这两个解码器80,81连接至自适应滤波器82。自适应滤波器82连接至NLP和舒适噪声产生部件84,第一解码器80通过噪声估计部件83连接至该部件84的第二输入端。NLP和舒适噪声产生部件84的输出端通过编码器85连接至转换器86。转换器86可以在编码器85和输出线之间形成连接,或者在第一输入线和输出线之间形成连接。第一解码器80、第二解码器81和自适应的滤波器82的输出另外连接至控制逻辑88的输入端。控制逻辑88具有通向自适应滤波器82、NLP和舒适噪声产生部件84以及转换器86的控制通路。
所提出的回波消除十分类似于上述回波抑制。包括自适应滤波器82和控制逻辑88,用来在由非线性处理器(NLP)84应用残余回波抑制功能之前降低回波信号。对于线性自适应滤波而言,必须由本地解码器80,81对来自两个方向的信号进行线性化。因为对于返回回波信号来说有两个语音编码,累积的非线性畸变明显降低了线性自适应滤波效率。因此,理想的是,在回波消除中包括非线性回波模拟,例如如WO9960720中所述一样。另外,通过语音编码、传送或者其他信号处理而引入到回波路径中的延迟可以由FIFO帧存储部件87来补偿。因此可以减少自适应滤波器82的抽头量,并且需要更少的处理容量。
噪声估计部件83以及NLP和舒适噪声产生部件84的功能可以与上述噪声抑制相类似,当然NLP84的控制可以是不同的,因为在NLP决定中可以采用更多的参数,例如回波路径模型、所实现的回波衰减、送入、接收和残余回波信号。这在控制逻辑部件88中进行处理。NLP和舒适噪声产生部件84的输出由编码器85来编码。
转换器86设置用来在送入端口处所接收的语音帧和NLP/舒适噪声部件的编码输出之间进行切换,也就是说,送出端口的输出是旁路的送入帧(或子帧)或者回波消除帧(或子帧)。选择的标准如下。
如果没有语音活动或者远端的信号电平足够低,则送入帧被旁路。否则选择NLP/舒适噪声部件84的输出作为在由编码器85进行编码之后的输出。因此,如果只有近端通话或者如果在两个方向是无声的,则使TFO保持不动。如果只有远端通话,则插入编码舒适噪声。如果有重叠通话状况,则选择舒适噪声或者自适应的滤波器82的输出作为送出信号。这取决于NLP84的状态,并且通常在通话重叠过程中是变化的。这种方法的好处在于,对于近端信号多数情况下会有级联式自由操作。在级联编码帧送至远端方向的时刻瞬间,利用NLP部件84的通话重叠是非活动的。但是,与传统回波消除相比,这在主观上并不是更令人烦恼的,因为NLP切换已经在近端语音上引入了一些人为因素(artefact),并且因为直接声音遮蔽(masking)和远端的侧音降低了在通话重叠过程中NLP人为因素的可听度。
或者,为了节省处理和存储器资源,通过如参考图7所述的直接在参数域中产生舒适噪声,这样可以省去编码器。

Claims (43)

1.网络部件(1),用于增强至少以参数化编码形式通过网络部件(1)可访问的数字网络传送的数字化模拟信号的质量,该网络部件包括:
有效负载提取部件(20,30,40),用来从数字网络中提取编码数字化模拟信号,这些编码数字化模拟信号至少部分包括参数化编码数字化模拟信号;
第一处理装置(24,34,44),用于利用适用于增强数字化模拟信号的质量的功能来在参数域中处理所提取的参数化编码数字化模拟信号;
第二处理装置(26,36,46),用来利用适用于增强数字化模拟信号的质量的功能来在线性域中处理所提取的编码数字化模拟信号的至少一部分;
有效负载插入部件(21,31,41),用来将经处理的编码数字化模拟信号插入到所述数字网络中;以及
分析和选择装置(23,27,33,37),用于确定由在参数域中对所提取的编码数字化模拟信号进行处理以及由在线性域中对所提取的编码数字化模拟信号进行处理所得到的数字化模拟信号的质量改善,并且用来使得至少是经过所述第一或第二处理装置(24,26,34,36)处理的导致更好改善的编码数字化模拟信号通过有效负载插入部件(21,31,41)回插到数字网络中;
其中有效负载提取部件的输出与第一处理装置和第二处理装置的输入直接或间接相连,其中第一处理装置和第二处理装置的输出直接或间接与有效负载插入部件的输入相连,并且其中分析和选择装置安排在有效负载提取部件与第一处理装置和第二处理装置中的至少一个之间和/或安排在一方面是第一处理装置和第二处理装置中的至少一个与另一方面是有效负载插入部件之间。
2.如权利要求1所述的网络部件(1),其中用于通过第一处理装置(24,34,44)处理参数化编码数字化模拟信号的功能包括回波消除、降噪和/或电平控制。
3.如前面权利要求中任一项所述的网络部件(1),其中用于通过第二处理装置(26,36,46)处理编码数字化模拟信号的功能包括回波消除、降噪、电平控制、转码和/或语音混合。
4.如权利要求1所述的网络部件(1),其中所述分析和选择装置适用于在通过第一和第二处理装置进行处理之前和之后对数字化模拟信号进行分析以确定更好的质量改善。
5.如权利要求1所述的网络部件(1),其中所述分析和选择装置包括用于确定更好质量改善的神经网络。
6.如权利要求1所述的网络部件(1),其特征在于一种坏帧处理器(22,32,42),用来在所提取的编码数字化模拟信号中探测缺失帧和/或无序帧,并且用于在所提取的信号中重新产生缺失帧和/或使无序帧重新排序,其中坏帧处理器安排在一方面是有效负载提取部件和另一方面是第一和第二处理装置之间。
7.如权利要求1所述的网络部件(1),其特征在于分析和选择装置(23,33)被配置为确定是否要对所提取的参数化编码数字化模拟信号进行处理,并且根据所提取的信号和/或外部控制信号来选择将要通过第一处理装置(24,34)和/或第二处理装置(26,36)应用在所提取的编码数字化模拟信号上的功能。
8.如权利要求1所述的网络部件(1),其特征在于一种控制部件(29,39,49),用来接收外部控制信号,并且用来直接或通过分析和选择装置(23,33,37)来控制对应用在所提取的编码信号上的处理的选择。
9.如权利要求1所述的网络部件(1),其中所述有效负载提取部件(20)适用于从基于分组的网络的因特网协议存储栈中提取参数化编码数字化模拟信号,并且其中所述有效负载插入部件(21)适用于将参数化编码数字化模拟信号插入到所述基于分组的网络的因特网协议存储栈中。
10.如权利要求9所述的网络部件(1),其中所述网络部件(1)还包括:
解码装置(25),用来对所述参数化编码数字化模拟信号进行解码,并且用来将解码信号转发给第二处理装置(26);和
编码装置(28),用来对由所述第二处理装置(26)处理和输出的信号进行编码;和
其中所述分析和选择装置包括:
第一选择装置(23),用来接收从有效负载提取部件(20)提取的编码数字化模拟信号,并且用来通过解码装置(25)将所提取的编码数字化模拟信号转发给第一处理装置(24)或第二处理装置(26);
第二选择装置(27),用来接收第一处理装置(24)和第二处理装置(26)的输出作为输入,并且用来选择将哪一个输出转发给插入有效负载部件(26);以及
分析装置(23),用来确定是要通过第一处理装置(24)还是第二处理装置(26)来对所提取的编码数字化模拟信号进行处理,并且用来相应地控制所述第一选择装置(23)和第二选择装置(27);
其中第一选择装置和分析装置安排在一方面是有效负载提取装置与另一方面是第一和第二处理装置之间,其中解码装置进一步安排在第一和第二处理装置之间,其中第二选择装置安排在一方面是第一处理装置和第二处理装置以及另一方面是有效负载插入部件之间,并且其中编码装置进一步安排在第二处理装置和第二选择装置之间。
11.如权利要求1所述的网络部件,其中所述有效负载提取部件(30,40)适用于从基于时分复用的网络中提取级联式自由操作流和脉冲编码调制流,用来使所述级联式自由操作流与所述脉冲编码调制流分开,并且用来将级联式自由操作流提供作为参数化编码数字化模拟信号,并且其中所述有效负载插入部件(31,41)适用于将级联式自由操作流与脉冲编码调制流合并,并且用来将合并流或者在没有向有效负载插入部件(31,41)提供任何级联式自由操作流的情况只是将脉冲编码调制流插入到基于时分复用的网络中。
12.如权利要求11所述的网络部件,其中所述网络部件还包括:
解码装置(35),用来将所述级联式自由操作流解码,并且用来将所述解码信号转发给第二处理装置(36);
编码装置(38),用来对由所述第二处理装置(36)处理和输出的信号进行编码;
用来接收来自有效负载提取部件(30)的级联式自由操作流,并且用来将级联式自由操作流转发给第一处理装置(34)以及通过解码装置(35)将它转发给所述第二处理装置(36)的装置;
用来从第二处理装置(36)的输出中形成脉冲编码调制流,并且用来将所述脉冲编码调制流转发给有效负载插入部件(31)的装置;
其中所述分析和选择装置包括:
选择装置(37),用来接收第一处理装置(34)和编码装置(38)的输出作为输入,并且用来将对数字化模拟信号进行更好的质量改善的输出转发给插入有效负载部件(31);
分析装置(33),用来确定是在第一处理装置(34)中的处理还是在第二处理装置(36)中的处理导致了数字化模拟信号的更好质量改善,并且用来相应地控制选择装置(37);
其中用于接收来自有效负载提取部件的级联式自由操作流的装置安排在有效负载提取部件与第一和第二处理装置之间,其中解码装置进一步安排在用于接收来自有效负载提取部件的级联式自由操作流的装置和第二处理装置之间,其中选择装置安排在一方面是第一和第二处理装置与另一方面是有效负载插入部件之间,其中编码装置进一步安排在第二处理装置和选择装置之间,其中用于形成脉冲编码调制流的装置安排在第二处理装置和有效负载插入部件之间,并且其中分析装置安排在有效负载提取部件和用于接收级联式自由操作流的装置之间和/或安排在一方面是编码装置和第一处理装置与另一方面是选择装置之间。
13.如权利要求12所述的网络部件,其中所述有效负载提取部件(30,40)适用于另外提供所述脉冲编码调制流作为非参数化编码数字化模拟信号,还包括用于在没有任何级联式自由操作流用来进行处理的情况下,将所提取的脉冲编码调制流转发给所述第二处理装置(36)并且用来将第二处理装置(36)的输出转发给有效负载插入部件(31)的装置(33)。
14.如权利要求11所述的网络部件,其中所述有效负载提取部件(30,40)用于另外提供所述脉冲编码调制流作为非参数化编码数字化模拟信号,其中在第一处理装置(44)中在参数域中对级联式自由操作流进行处理,而在第二处理装置(46)中在线性域中对脉冲编码调制流进行处理,并且其中至少将所处理的脉冲编码调制流转发给有效负载插入部件(41)。
15.如权利要求1所述的网络部件(1),其中所述第一处理装置(24,34,44)适用于将所提取的参数化编码数字化模拟信号的增益参数与所要求的增益进行比较,用来形成相应的新增益参数并且用来在所提取的参数化编码数字化模拟信号中用新增益参数来替换原始增益参数。
16.如权利要求15所述的网络部件(1),其中所述第一处理装置(24,34,44)包括:
解码装置(50),用来使所提取的参数化编码数字化模拟信号线性化,并且用来提供所述数字化模拟信号的解码增益参数;
用来估计线性化编码数字化模拟信号的电平并且用来根据数字化模拟信号的估计电平和该数字化模拟信号的所期望的目标电平来确定所要求的增益数值的装置(51);
用来通过线性-参数域映射来从编码数字化模拟信号的解码增益参数和所期望的增益数值来确定出适用于实现所要求的增益的新增益参数的装置(52);以及
用于重新量化所述新增益参数,并且用来在所述参数化编码数字化模拟信号中用新的增益参数来代替原始增益参数的装置(53);
其中第一处理装置的输入通过解码装置、用来估计线性化编码数字化模拟信号的电平的装置、用来确定新增益参数的装置以及用来重新量化所述新增益参数的装置连接到第一处理装置的输出,并且其中解码装置进一步连接到用于确定新增益参数的装置。
17.如权利要求16所述的网络部件(1),其中用来估计所述数字化模拟信号的电平的装置(51)包括用来确保在信号电平估计中只估计语音电平的话音活动检测器。
18.如权利要求1所述的网络部件(1),其中所述第一处理装置(24,34,44)适用于在时域中使所提取的参数化编码数字化模拟信号的噪声部分和低电平信号部分衰减,并且用来相应地替换在所提取的参数化编码数字化模拟信号中的增益参数。
19.如权利要求1所述的网络部件(1),其中所述第一处理装置(24,34,44)适用于使在所提取的参数化编码数字化模拟信号中具有与噪声估计大致相同的能量的噪声的频率部分衰减,并且用来相应地替换在所提取的参数化编码数字化模拟信号中的线性预测参数。
20.如权利要求19所述的网络部件(1),其中所述第一处理装置(24,34,44)包括:
解码器(60),用来将来自所提取的编码数字化模拟信号的线性预测系数解码;
用来估计所述数字化模拟信号的噪声的长期功率谱的装置(64);
用来估计所述数字化模拟信号的噪声的短期功率谱的装置(65);
用来根据在长期谱和短期谱之间的差异来确定所要求的谱的装置(67);
用来根据所要求的谱来确定新的线性预测系数的装置(68);
用来使所述新线性预测系数参数量化,或者用来将它们转换成线性谱对参数,并且用它们来替换在所提取的参数化编码数字化模拟信号中的旧参数的装置(69);
其中所述解码器(60)一方面通过所述用来估计长期功率谱的装置(64)、另一方面通过用来估计短期功率谱的装置(65)与用来确定所要求的谱的装置(67)链接,并且其中所述用来确定所要求的谱的装置(67)进一步通过所述用来确定新的线性预测系数的装置(68)链接到用来使所述新线性预测系数参数量化或者用来将它们转换成线性谱对参数的装置(69)。
21.如权利要求1所述的网络部件(1),其中所述有效负载提取部件(20,30,40)适用于从数字网络中另外提取沿着与所提取的编码数字化模拟信号相反的方向传送的其它编码数字化模拟信号,这些其它编码数字化模拟信号至少部分包括参数化编码数字化模拟信号;并且其中所述第一处理装置(24,34,44)适用于将所述第一和其它参数化编码数字化模拟信号进行比较以便探测出在第一参数化编码数字化模拟信号中的回波,并且用来在所述第一参数化编码数字化模拟信号的部分中确定有回波的情况下,将第一参数化编码部分数字化模拟信号的这些部分替换成舒适噪声部分。
22.如权利要求21所述的网络部件(1),其中所述第一处理装置(24,34,44)包括:
第一解码器(70),用来使从第一方向提取的编码数字化模拟信号线性化;
第二解码器(71),用来使从相反方向提取的其它编码数字化模拟信号线性化;
回波分析部件(72),用来检测在第一提取信号的一部分中的回波;以及
用来产生舒适噪声,并且用来在探测到回波的情况下用相应的舒适噪声参数来代替所述第一提取信号的原始部分的装置(73-76);
其中所述第一解码器(70)链接到所述回波分析部件(72)和用来产生舒适噪声的装置(73-76),其中所述第二解码器(71)链接到所述回波分析部件(72),并且其中所述回波分析部件(72)进一步链接到用来产生舒适噪声的装置(73-76)。
23.如权利要求1所述的网络部件(1),其中所述有效负载提取部件(20,30,40)适用于从数字网络中另外提取沿着与所提取的编码数字化模拟信号相反的方向传送的其它编码数字化模拟信号,这些其它编码数字化模拟信号至少部分包括参数化编码数字化模拟信号;并且其中所述第一处理装置(24,34,44)适用于利用所述其它参数化编码数字化模拟信号来使在所述第一参数化编码数字化模拟信号中的回波信号衰减,并且用来抑制残余的回波信号。
24.如权利要求23所述的网络部件,其中所述第一处理装置(24,34,44)包括:
第一解码器(80),用来使从第一方向提取的编码数字化模拟信号线性化;
第二解码器(81),用来使从相反方向提取的其它编码数字化模拟信号线性化;
自适应滤波器(82)和控制逻辑(88),它们接收来自第一和第二解码器(80,81)的线性化信号,以便使在从第一解码器(80)中接收的线性化信号中的回波信号衰减;
非线性处理器(84),用于根据从自适应滤波器(82)接收到的残余回波信号并且根据来自第一方向的线性化信号的噪声估计来进行残余回波抑制;以及
用来根据残余回波抑制来产生舒适噪声,并且用来在探测到回波的情况下用相应的舒适噪声参数来代替所述第一提取信号的原始部分的装置(83,85,86,88);
其中第一处理装置的第一输入通过第一解码器、自适应滤波器、非线性处理器以及用于产生舒适噪声的装置连接到第一处理装置的输出,并且其中第一处理装置的第二输入通过第二解码器、自适应滤波器、非线性处理器以及用于产生舒适噪声的装置连接到第二处理装置的输出。
25.如权利要求21所述的网络部件,其中所述第一处理装置(24,34,44)适用于在沿着相反方向没有任何信号活动的情况下,或者在所提取的参数化编码数字化模拟信号的信号电平低于沿着相反方向的阈值电平的情况下,使第一参数化编码数字化模拟信号旁路而不进行处理。
26.如权利要求1所述的网络部件,其中所提取的编码数字化模拟信号是编码语音或编码视频。
27.用于增强通过数字网络至少以参数化编码形式传送的数字化模拟信号的质量的方法,该方法包括:
从数字网络中提取编码数字化模拟信号,这些编码数字化模拟信号至少部分包括参数化编码数字化模拟信号;
确定通过在参数域中对所提取的编码数字化模拟信号进行处理以及通过在线性域中对所提取的编码数字化模拟信号进行处理所期望的对数字化模拟信号的质量改善;
至少在认为通过在参数域中进行处理能够获得更大的质量改善的情况下,利用适用于增强数字化模拟信号的质量的功能,在参数域中处理所提取的参数化编码数字化模拟信号;并且
至少在认为通过在线性域中进行处理能够获得更大的质量改善的情况下,利用适用于增强数字化模拟信号的质量的功能,在线性域中处理所提取的编码数字化模拟信号的至少一部分;并且
至少将那些经过处理的编码数字化模拟信号插入到该数字网络中,这些信号在该域中经过被认为导致更大的质量改善的处理。
28.如权利要求27所述的方法,还包括:
将所提取的参数化编码数字化模拟信号解码以便在线性域中进行处理;并且
在线性域中进行处理之后将经过处理的解码信号编码以再次形成参数化编码数字化模拟信号。
29.如权利要求28所述的方法,还包括:
对经过处理的解码信号进行变换以形成非参数化编码数字化模拟信号;并且
将非参数化编码数字化模拟信号插入到数字网络中。
30.如权利要求27所述的方法,其中所提取的编码数字化模拟信号的一部分是与所提取的参数化编码数字化模拟信号相对应的非参数化编码数字化模拟信号,其中如果认为通过在参数域中进行处理能够得到更大的质量改善,则在参数域中对参数化编码数字化模拟信号进行处理,其中在线性域中对非参数化编码数字化模拟信号进行处理,其中将经过处理的非参数化编码数字化模拟信号再次插入到数字网络中,并且其中如果认为在参数域中进行处理能够得到更大的质量改善,则再次将经过处理的参数化编码数字化模拟信号插入到数字网络中。
31.如权利要求27所述的方法,其中通过在线性域中以及在参数域中进行处理之前和之后对数字化模拟信号进行分析来确定在线性域中和在参数域中的处理的质量改善。
32.如权利要求27所述的方法,其中通过采用神经网络来确定在线性域中和在参数域中的处理的质量改善。
33.如权利要求27所述的方法,还包括:
选择适用于增强所关心的数字化模拟信号的质量的那些处理功能,并且只执行那些处理功能。
34.如权利要求27所述的方法,其中在参数域中的处理包括将所提取的参数化编码数字化模拟信号的增益参数与所要求的增益进行比较以进行增益控制,以便形成相应的新增益参数,并且在所提取的参数化编码数字化模拟信号中用新的增益参数来代替原始增益参数。
35.如权利要求34所述的方法,包括:
使所提取的参数化编码数字化模拟信号线性化,并且提供所述数字化模拟信号的解码增益参数;
估计经过线性化的编码数字化模拟信号的电平,并且根据估计信号电平和所要求的目标信号电平来确定所要求的增益数值;
通过线性-参数域映射,从编码数字化模拟信号的解码增益参数和所要求的增益数值中确定出适用于实现所要求的增益的新增益参数;并且
重新量化这些新增益参数,并且在编码数字化模拟信号中用这些新增益参数来代替原始增益参数。
36.如权利要求27所述的方法,其中在参数域中的处理包括:在时域中使所提取的参数化编码数字化模拟信号中的噪声部分和低电平信号部分衰减以便进行噪声抑制,并且相应地替换在所提取的参数化编码数字化模拟信号中的增益参数。
37.如权利要求27所述的方法,其中在参数域中的处理包括使在所提取的参数化编码数字化模拟信号中具有与噪声估计大致相同的能量的噪声的频率部分衰减以便进行噪声抑制,并且相应地替换在所提取的参数化编码数字化模拟信号中的线性预测参数。
38.如权利要求37所述的方法,包括:
将来自所提取的编码数字化模拟信号中的线性预测系数解码;
估计出这些数字化模拟信号的噪声的长期功率谱;
估计出这些数字化模拟信号的噪声的短期功率谱;
根据在长期谱和短期谱之间的差异来确定出所要求的谱;
根据所要求的谱来确定出新的线性预测系数;并且
量化这些新的线性预测系数参数或者将它们转换成线性谱对参数,并且用它们替换在参数化编码数字化模拟信号中的旧参数。
39.如权利要求27所述的方法,其中在参数域中的处理包括另外提取沿着相反方向传送的其它参数化编码数字化模拟信号以便进行回波抑制,将第一和其它参数化编码数字化模拟信号进行比较以便探测出在第一参数化编码数字化模拟信号中的回波,并且如果确定在第一参数化编码数字化模拟信号的一部分中有回波的话,则用所产生出的具有舒适噪声参数的部分来代替第一参数化编码数字化模拟信号的那些部分。
40.如权利要求39所述的方法,包括在比较之前将来自第一和相反方向的所提取的编码数字化模拟信号线性化。
41.如权利要求27所述的方法,包括另外从数字网络中提取沿着与所提取的编码数字化模拟信号相反的方向传送的其它编码数字化模拟信号,这些其它编码数字化模拟信号至少部分包括参数化编码数字化模拟信号,利用这些其它参数化编码数字化模拟信号使在第一参数化编码数字化模拟信号中的回波信号衰减,并且抑制残余回波信号。
42.如权利要求41所述的方法,包括在使回波信号衰减之前使来自两个方向的所提取的编码数字化模拟信号线性化,根据抑制的结果和在第一数字化模拟信号中的估计噪声来产生舒适噪声,并且用包括相应的舒适噪声参数的部分来代替其中探测到回波的一部分原始第一提取信号。
43.如权利要求39所述的方法,其中在参数域中的处理包括在沿着相反方向没有任何信号活动的情况下或者在所提取的参数化编码数字化模拟信号的信号电平低于沿着相反方向的阈值电平的情况下,使第一参数化编码数字化模拟信号旁路而不进行回波探测。
CNB008201188A 2000-12-29 2000-12-29 数字网络中的音频信号质量增强 Expired - Fee Related CN100393085C (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2000/013320 WO2002054744A1 (en) 2000-12-29 2000-12-29 Audio signal quality enhancement in a digital network

Publications (2)

Publication Number Publication Date
CN1504042A CN1504042A (zh) 2004-06-09
CN100393085C true CN100393085C (zh) 2008-06-04

Family

ID=8164235

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB008201188A Expired - Fee Related CN100393085C (zh) 2000-12-29 2000-12-29 数字网络中的音频信号质量增强

Country Status (5)

Country Link
US (1) US7539615B2 (zh)
EP (1) EP1346553B1 (zh)
CN (1) CN100393085C (zh)
DE (1) DE60029147T2 (zh)
WO (1) WO2002054744A1 (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7428223B2 (en) * 2001-09-26 2008-09-23 Siemens Corporation Method for background noise reduction and performance improvement in voice conferencing over packetized networks
KR100421152B1 (ko) * 2002-01-21 2004-03-04 삼성전자주식회사 문자 입출력 서비스를 위한 통신시스템의 음향 반향 제거방법 및 장치
EP1432222A1 (de) * 2002-12-20 2004-06-23 Siemens Aktiengesellschaft Echounterdrückung für komprimierte Spache
US7420937B2 (en) * 2002-12-23 2008-09-02 Broadcom Corporation Selectively adaptable far-end echo cancellation in a packet voice system
US20040243404A1 (en) * 2003-05-30 2004-12-02 Juergen Cezanne Method and apparatus for improving voice quality of encoded speech signals in a network
EP1521241A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Transmission of speech coding parameters with echo cancellation
US7876745B1 (en) * 2003-10-23 2011-01-25 Nortel Networks Limited Tandem free operation over packet networks
JP4587160B2 (ja) * 2004-03-26 2010-11-24 キヤノン株式会社 信号処理装置および方法
US7945006B2 (en) * 2004-06-24 2011-05-17 Alcatel-Lucent Usa Inc. Data-driven method and apparatus for real-time mixing of multichannel signals in a media server
US20060215683A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for voice quality enhancement
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US20060217983A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for injecting comfort noise in a communications system
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
US8874437B2 (en) * 2005-03-28 2014-10-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal for voice quality enhancement
US20060217970A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for noise reduction
US20060217988A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for adaptive level control
US20060217969A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for echo suppression
US20060217971A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US7852999B2 (en) * 2005-04-27 2010-12-14 Cisco Technology, Inc. Classifying signals at a conference bridge
WO2006136901A2 (en) * 2005-06-18 2006-12-28 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
CN1917039B (zh) * 2005-08-19 2010-09-15 华为技术有限公司 一种语音质量增强方法和系统
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US7852792B2 (en) * 2006-09-19 2010-12-14 Alcatel-Lucent Usa Inc. Packet based echo cancellation and suppression
JP4130846B2 (ja) * 2006-11-15 2008-08-06 松下電器産業株式会社 操作支援装置および操作支援方法
WO2008083517A1 (fr) * 2007-01-10 2008-07-17 Zte Corporation Procédé et système permettant de réaliser une compensation vocale dans un réseau de communication mobile
EP1944761A1 (en) * 2007-01-15 2008-07-16 Siemens Networks GmbH & Co. KG Disturbance reduction in digital signal processing
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
US8032365B2 (en) * 2007-08-31 2011-10-04 Tellabs Operations, Inc. Method and apparatus for controlling echo in the coded domain
US20090168673A1 (en) * 2007-12-31 2009-07-02 Lampros Kalampoukas Method and apparatus for detecting and suppressing echo in packet networks
US8554551B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8238548B2 (en) * 2008-02-08 2012-08-07 Cisco Technology, Inc. Controlling echo during double-talk in a voice conference
US8559438B2 (en) * 2008-04-11 2013-10-15 Mobitv, Inc. Modification of live streams
WO2012094827A1 (en) 2011-01-14 2012-07-19 Huawei Technologies Co., Ltd. A method and an apparatus for voice quality enhancement
CN102655005B (zh) * 2011-03-01 2014-05-07 华为技术有限公司 一种语音增强处理方法和装置
US9537460B2 (en) * 2011-07-22 2017-01-03 Continental Automotive Systems, Inc. Apparatus and method for automatic gain control
WO2012106926A1 (zh) 2011-07-25 2012-08-16 华为技术有限公司 一种参数域回声控制装置和方法
US9025779B2 (en) 2011-08-08 2015-05-05 Cisco Technology, Inc. System and method for using endpoints to provide sound monitoring
US9065895B2 (en) * 2012-02-22 2015-06-23 Broadcom Corporation Non-linear echo cancellation
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
CN103379231B (zh) * 2012-04-17 2016-02-10 中兴通讯股份有限公司 一种无线会议电话及其进行语音信号传递的方法
JP6335190B2 (ja) * 2012-12-21 2018-05-30 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
CN104021796B (zh) * 2013-02-28 2017-06-20 华为技术有限公司 语音增强处理方法和装置
US9484043B1 (en) * 2014-03-05 2016-11-01 QoSound, Inc. Noise suppressor
CN105096960A (zh) * 2014-05-12 2015-11-25 阿尔卡特朗讯 实现宽带分组语音的基于分组的声学回声消除方法与设备
US9536537B2 (en) 2015-02-27 2017-01-03 Qualcomm Incorporated Systems and methods for speech restoration
KR101780444B1 (ko) * 2015-10-29 2017-09-21 삼성에스디에스 주식회사 영상 신호의 노이즈 제거 방법
CN107045872B (zh) * 2016-02-05 2020-09-01 中国电信股份有限公司 通话回声的识别方法和装置
CN113766073B (zh) * 2017-09-29 2024-04-16 杜比实验室特许公司 会议系统中的啸叫检测

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0910200A1 (en) * 1997-09-30 1999-04-21 Lucent Technologies Inc. A device and method for controlling the quality of service in data networks
CN1235434A (zh) * 1998-02-13 1999-11-17 索尼公司 接收设备和收发系统
US6119083A (en) * 1996-02-29 2000-09-12 British Telecommunications Public Limited Company Training process for the classification of a perceptual signal

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2720666C2 (de) * 1977-05-07 1987-01-29 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und Anordnung zur Geräuschanalyse
WO1989012292A1 (en) * 1988-06-08 1989-12-14 Fujitsu Limited Encoder/decoder apparatus
JPH0398318A (ja) * 1989-09-11 1991-04-23 Fujitsu Ltd 音声符号化方式
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
WO1995015550A1 (en) * 1993-11-30 1995-06-08 At & T Corp. Transmitted noise reduction in communications systems
JPH09149133A (ja) * 1995-11-22 1997-06-06 Fujitsu Ltd テレビ会議システムのための音声入力端末および音声合成端末
US5917835A (en) * 1996-04-12 1999-06-29 Progressive Networks, Inc. Error mitigation and correction in the delivery of on demand audio
FI106489B (fi) 1996-06-19 2001-02-15 Nokia Networks Oy Kaikusalpa ja kaiunpoistajan epälineaarinen prosessori
JP3878254B2 (ja) * 1996-06-21 2007-02-07 株式会社リコー 音声圧縮符号化方法および音声圧縮符号化装置
US5835486A (en) * 1996-07-11 1998-11-10 Dsc/Celcore, Inc. Multi-channel transcoder rate adapter having low delay and integral echo cancellation
US6011846A (en) * 1996-12-19 2000-01-04 Nortel Networks Corporation Methods and apparatus for echo suppression
US6119084A (en) * 1997-12-29 2000-09-12 Nortel Networks Corporation Adaptive speaker verification apparatus and method including alternative access control
DE19804581C2 (de) * 1998-02-05 2000-08-17 Siemens Ag Verfahren und Funk-Kommunikationssystem zur Übertragung von Sprachinformation
FI981091A (fi) 1998-05-15 1999-11-16 Nokia Networks Oy Menetelmä ja laitteisto kaiun poistamiseksi digitaalisessa matkaviestinjärjestelmässä
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6678267B1 (en) * 1999-08-10 2004-01-13 Texas Instruments Incorporated Wireless telephone with excitation reconstruction of lost packet
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7158572B2 (en) * 2002-02-14 2007-01-02 Tellabs Operations, Inc. Audio enhancement communication techniques
US20040083110A1 (en) * 2002-10-23 2004-04-29 Nokia Corporation Packet loss recovery based on music signal classification and mixing
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
US20060215683A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for voice quality enhancement

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119083A (en) * 1996-02-29 2000-09-12 British Telecommunications Public Limited Company Training process for the classification of a perceptual signal
EP0910200A1 (en) * 1997-09-30 1999-04-21 Lucent Technologies Inc. A device and method for controlling the quality of service in data networks
CN1235434A (zh) * 1998-02-13 1999-11-17 索尼公司 接收设备和收发系统

Also Published As

Publication number Publication date
US7539615B2 (en) 2009-05-26
DE60029147D1 (de) 2006-08-10
WO2002054744A1 (en) 2002-07-11
EP1346553A1 (en) 2003-09-24
DE60029147T2 (de) 2007-05-31
EP1346553B1 (en) 2006-06-28
US20040076271A1 (en) 2004-04-22
CN1504042A (zh) 2004-06-09

Similar Documents

Publication Publication Date Title
CN100393085C (zh) 数字网络中的音频信号质量增强
JP3542610B2 (ja) オーディオ信号処理装置およびオーディオ情報データ・フレーム処理方法
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
US20060215683A1 (en) Method and apparatus for voice quality enhancement
US20070160154A1 (en) Method and apparatus for injecting comfort noise in a communications signal
EP2518986B1 (en) A device and method for controlling echo in parameter domain
US20060217972A1 (en) Method and apparatus for modifying an encoded signal
US20060217969A1 (en) Method and apparatus for echo suppression
US8874437B2 (en) Method and apparatus for modifying an encoded signal for voice quality enhancement
ZA200302465B (en) Method and system for estimating artificial high band signal in speech codec.
EP0929891A1 (en) Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
US20060217970A1 (en) Method and apparatus for noise reduction
US20060217988A1 (en) Method and apparatus for adaptive level control
US20060217983A1 (en) Method and apparatus for injecting comfort noise in a communications system
US20040243404A1 (en) Method and apparatus for improving voice quality of encoded speech signals in a network
US20060217971A1 (en) Method and apparatus for modifying an encoded signal
US20030065507A1 (en) Network unit and a method for modifying a digital signal in the coded domain
KR20090129450A (ko) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
AU6203300A (en) Coded domain echo control
JP2003533902A5 (zh)
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
US20050071154A1 (en) Method and apparatus for estimating noise in speech signals
Hiwasaki et al. A G. 711 embedded wideband speech coding for VoIP conferences
US6141639A (en) Method and apparatus for coding of signals containing speech and background noise
Bhatt Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NOKIA AND SIEMENS NETWORKS CO., LTD.

Free format text: FORMER OWNER: NOKIA NETWORKS OY

Effective date: 20080718

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20080718

Address after: Espoo, Finland

Patentee after: Nokia Siemens Network Co., Ltd.

Address before: Espoo, Finland

Patentee before: Nokia Oyj

EE01 Entry into force of recordation of patent licensing contract

Assignee: Nokia Siemens Networks Network Technology Services Ltd.

Assignor: Nokia Siemens Network Co., Ltd.

Contract fulfillment period: 2008.10.15 to 2018.10.14

Contract record no.: 2009990001119

Denomination of invention: Audio signal quality enhancement in a digital network

Granted publication date: 20080604

License type: Exclusive license

Record date: 20091009

LIC Patent licence contract for exploitation submitted for record

Free format text: EXCLUSIVE LICENSE; TIME LIMIT OF IMPLEMENTING CONTACT: 2008.10.15 TO 2018.10.14; CHANGE OF CONTRACT

Name of requester: NOKIA SIEMENS COMMUNICATION NETWORK SCIENCE AND TE

Effective date: 20091009

C56 Change in the name or address of the patentee

Owner name: NOKIA SIEMENS NETWORKS OY

Free format text: FORMER NAME: NOKIA SIEMENS NETWORK CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Espoo, Finland

Patentee after: Nokia Siemens Networks OY

Address before: Espoo, Finland

Patentee before: Nokia Siemens Network Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080604

Termination date: 20191229