CN101147190B - 语音通信中的帧擦除隐蔽 - Google Patents

语音通信中的帧擦除隐蔽 Download PDF

Info

Publication number
CN101147190B
CN101147190B CN2006800089998A CN200680008999A CN101147190B CN 101147190 B CN101147190 B CN 101147190B CN 2006800089998 A CN2006800089998 A CN 2006800089998A CN 200680008999 A CN200680008999 A CN 200680008999A CN 101147190 B CN101147190 B CN 101147190B
Authority
CN
China
Prior art keywords
frame
delay
erasing
speech parameter
subsequent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006800089998A
Other languages
English (en)
Other versions
CN101147190A (zh
Inventor
塞拉芬·迪亚兹·斯平多拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101147190A publication Critical patent/CN101147190A/zh
Application granted granted Critical
Publication of CN101147190B publication Critical patent/CN101147190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种语音解码器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数。所述语音解码器包含言语产生器,其根据所述语音参数产生言语。帧擦除隐蔽模块经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中的帧擦除的语音参数。

Description

语音通信中的帧擦除隐蔽
技术领域
本揭示案大体上涉及语音通信,且更明确地说,涉及用于语音通信的帧擦除隐蔽技术。
背景技术
传统上,已经通过电路交换网络执行数字语音通信。电路交换网络是一种在呼叫的持续时间内在两个终端之间建立物理路径的网络。在电路交换应用中,发射终端将含有语音信息的包序列经由所述物理路径发送到接收终端。接收终端使用包中含有的语音信息来合成言语。如果在传输中丢失了包,那么接收终端可尝试隐蔽丢失的信息。这可通过根据先前接收的包中的信息重构丢失的包中所含有的语音信息来实现。
当前的技术发展已经为经由包交换网络进行数字语音通信铺平了道路。包交换网络是一种基于目的地地址通过网络路由包的网络。通过包交换通信,路由器个别地为每个包确定路径,沿着任何可用的路径发送包从而到达其目的地。由此,包并不是同时或者以相同次序到达接收终端。在接收终端中可使用抖动缓冲器以将包放回原来的次序并以连续循序方式播放出来。
发明内容
抖动缓冲器的存在提出了改进丢失包的重构语音信息的质量的独特机会。由于抖动缓冲器在播放由接收终端接收的包之前对其进行存储,因此可根据播放序列中在丢失包之前和之后的包中的信息为丢失包重构语音信息。
本发明揭示一种语音解码器。所述语音解码器包含言语产生器,其经配置以接收帧序列,其中每一所述帧均具有语音参数,且所述言语产生器还经配置以根据所述语音参数产生言语。所述语音解码器还包含帧擦除隐蔽模块,其经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中帧擦除的语音参数。
本发明揭示一种解码语音的方法。所述方法包含:接收帧序列,每一所述帧均具有语音参数;根据先前帧中一者的语音参数和后续帧中一者的语音参数重构用于所述帧序列中帧擦除的语音参数;以及根据所述帧序列中的语音参数产生言语。
本发明揭示一种语音解码器,其经配置以接收帧序列。每一所述帧均包含语音参数。所述语音解码器包含:用于根据所述语音参数产生言语的装置;以及用于根据先前帧中一者的语音参数和后续帧中一者的语音参数重构用于所述帧序列中帧擦除的语音参数的装置。
本发明还揭示一种通信终端。所述通信终端包含接收器以及语音解码器,所述语音解码器经配置以从所述接收器接收帧序列,每一所述帧均具有语音参数。所述语音解码器包含:言语产生器,其经配置以根据所述语音参数产生言语;以及帧擦除隐蔽模块,其经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中帧擦除的语音参数。
应了解,所属领域的技术人员从以下具体实施方式将容易了解本发明的其它实施例,其中以说明方式展示和描述本发明的各种实施例。将意识到,本发明能够具有其它和不同的实施例,且其若干细节能够在各种其它方面中进行修改,所有这些都不脱离本发明的精神和范围。因此,将附图和具体实施方式视为本质上是说明性的而不是限制性的。
附图说明
附图中以实例方式而并非以限制方式来说明本发明的各方面,其中:
图1是说明经由传输媒体的发射终端和接收终端的实例的概念方框图;
图2是说明发射终端中的语音编码器的实例的概念方框图;
图3是图1所示的接收终端的更详细的概念方框图;以及
图4是说明语音解码器中的帧擦除隐蔽模块的功能性的流程图。
具体实施方式
下文结合附图陈述的具体实施方式希望作为对本发明各种实施例的描述,且不希望代表可实践本发明的仅有实施例。所述具体实施方式出于提供对本发明的详尽理解的目的而包含特定细节。然而,所属领域的技术人员将易于了解,可在没有这些特定细节的情况下实践本发明。在某些情况下,以方框图形式展示众所周知的结构和组件,以便避免混淆本发明的概念。
图1是说明经由传输媒体的发射终端102和接收终端104的实例的概念方框图。发射终端102和接收终端104可以是能够支持语音通信的任何装置,包含电话、计算机、音频广播和接收设备、视频会议设备等。在一个实施例中,发射终端102和接收终端104经实施为具有无线码分多址(CDMA)能力,但实际上可用任何多址技术来实施。CDMA是此项技术中众所周知的基于展频通信的调制和多址方案。
发射终端102经展示为具有语音编码器106,且接收终端104经展示为具有语音解码器108。语音编码器106可用于通过基于人类言语产生模型提取参数来压缩来自用户接口110的言语。发射器112可用于将含有这些参数的包传输穿过传输媒体114。传输媒体114可以是基于包的网络(例如因特网或公司内网),或任何其它传输媒体。传输媒体112的另一端处的接收器116可用于接收包。语音解码器108使用包中的参数来合成言语。接着可将合成的言语提供到接收终端104上的用户接口118。尽管未图示,但在发射器112和接收器116两者中可执行各种信号处理功能,例如包含循环冗余检查(CRC)功能的卷积编码、交错、数字调制和展频处理。
在大多数应用中,通信的每一方进行发射以及接收。因此,每一终端将需要语音编码器和解码器。语音编码器和解码器可以是单独的装置或集成为称作“声码器”的单一装置。在以下具体实施方式中,将把终端102、104描述为在传输媒体114的一端处具有语音编码器106且在另一端处具有语音解码器108。所属领域的技术人员将容易认识到如何将本文描述的概念扩展到双向通信。
在发射终端102的至少一个实施例中,言语可以成帧地从用户接口110输入到语音编码器106,其中每一帧进一步分割为多个子帧。这些任意的帧边界通常用在执行某个区块处理的地方,此处通常就是这样的情况。然而,如果实施连续处理而不是区块处理,那么就不需要将言语样本分割为帧(和子帧)。所属领域的技术人员将容易认识到可如何将下文描述的区块技术扩展到连续处理。在所描述的实施例中,取决于特定应用和总体设计约束,传输穿过传输媒体114的每个包可含有一个或一个以上帧。
语音编码器106可以是可变速率或固定速率编码器。取决于言语含量,可变速率编码器逐帧地在多种编码器模式之间动态切换。语音解码器108也逐帧地在相应的解码器模式之间动态切换。针对每一帧选择特定模式,以实现可用的最低位速率,且同时在接收终端104处维持可接受的信号再现。举例来说,可以全速率或半速率来编码主动言语。通常以八分之一速率来编码背景噪音。可变速率和固定速率编码器都是此项技术中众所周知的。
语音编码器106和解码器108可使用线性预测编码(LPC)。支持LPC编码的基本想法是,可通过以其强度和音高为特征的言语源(声带)对言语建立模型。来自声带的言语行进通过以其共振(称为“共振峰”)为特征的声道(喉咙和嘴)。LPC语音编码器106通过估计共振峰、从言语中移除其影响并估计剩余言语的强度和音高来分析言语。接收端处的LPC语音解码器108通过反转所述过程来合成言语。明确地说,LPC语音解码器108使用剩余言语来产生言语源,使用共振峰来产生滤波器(其代表声道),并使言语源穿过滤波器以合成言语。
图2是说明LPC语音编码器106的实例的概念方框图。LPC语音编码器106包含LPC模块202,其从言语中估计共振峰。基本解决方案是差分等式,其将帧中的每一言语样本表达为先前言语样本的线性组合(言语样本的短期相关性)。差分等式的系数表现共振峰的特征,且用于计算这些系数的各种方法在此项技术中是众所周知的。LPC系数可应用于反向滤波器206,其从言语中移除共振峰的影响。可经由传输媒体传输剩余言语连同LPC系数,使得可在接收端处重构言语。在LPC语音编码器106的至少一个实施例中,将LPC系数转变204为线谱对(LSP)以获得较好的传输和数学变换效率。
其它压缩技术可用于通过消除冗余材料来显著减少表达言语所需的信息。这可通过利用存在某些由人类声带的周期性振动导致的基本频率的事实来实现。这些基本频率通常称为“音高”。可通过“自适应码本参数”来量化音高,所述参数包含(1)言语样本的数目中使言语片断的自相关函数最大化的“延迟”和(2)“自适应码本增益”。自适应码本增益基于子帧来测量言语的长期周期性如何强大。这些长期周期性可在传输到接收终端之前从剩余言语中减去210。
可以任意多种方法来进一步编码来自减法器210的剩余言语。较常用方法中的一种是使用由系统设计者创建的码本212。码本212是向大多数典型言语剩余信号指派参数的表。在操作中,将来自减法器210的剩余言语与码本212中的所有条目进行比较。选择具有最接近匹配的条目的参数。固定码本参数包含“固定码本系数”和“固定码本增益”。固定码本系数含有用于帧的新信息(能量)。其基本上是帧之间差异的编码表示。固定码本增益表示接收终端104中的语音解码器108为将新信息(固定码本系数)应用于言语的当前子帧而应使用的增益。
音高估计器208也可用于产生称为“Δ延迟”或“D延迟”的额外自适应码本参数。D延迟是当前帧与先前帧之间测得的延迟的差异。然而,其具有有限的范围,且可在所述两个帧之间的延迟差异溢出时被设定为零。接收终端104中的语音解码器108不使用此参数来合成言语。而是,所述参数用于为丢失或损坏的帧计算言语样本的音高。
图3是图1所示的接收终端104的更详细的概念方框图。在此配置中,语音解码器108包含抖动缓冲器302、帧错误检测器304、帧擦除隐蔽模块306和言语产生器308。语音解码器108可实施为作为独立实体的声码器的一部分,或分布在接收终端104内的一个或一个以上实体上。语音解码器108可实施为硬件、固件、软件或其任意组合。举例来说,语音解码器108可实施为具有微处理器、数字信号处理器(DSP)、可编程逻辑、专用硬件或任何其它基于硬件和/或软件的处理实体。以下将根据其功能性来描述语音解码器108。其实施的方式将取决于特定应用和施加在总体系统上的设计约束。所属领域的技术人员将认识到,在这些环境下的硬件、固件和软件配置的可互换性,以及如何针对每一特定应用最好地实施所描述的功能性。
抖动缓冲器302可定位在语音解码器108的前端处。抖动缓冲器302是硬件装置或软件过程,其消除由于网络拥塞、计时漂移和路径改变而引起的包到达时间变化所导致的抖动。抖动缓冲器302延迟到达的包,使得所有包可以正确次序连续提供到言语产生器308,从而产生具有极少音频失真的清楚连接。抖动缓冲器302可为固定的或自适应的。固定抖动缓冲器对包引入固定延迟。另一方面,自适应抖动缓冲器适应于网络延迟的改变。固定和自适应抖动缓冲器两者均在此项技术中是众所周知的。
如早先结合图1论述,发射终端102可执行各种信号处理功能,例如包含CRC功能的卷积编码、交错、数字调制和展频处理。帧错误检测器304可用于执行CRC检查功能。或者或另外,可使用其它帧错误检测技术,包含检查和以及奇偶位,仅举几个例子。在任何情况下,帧错误检测器304确定是否已发生帧擦除。“帧擦除”意味着帧丢失或损坏。如果帧错误检测器304确定当前帧没有被擦除,那么帧擦除隐蔽模块306将用于所述帧的语音参数从抖动缓冲器302释放到言语产生器308。另一方面,如果帧错误检测器304确定当前帧已被擦除,那么其将向帧擦除隐蔽模块306提供“帧擦除旗标”。以稍后将更详细描述的方式,帧擦除隐蔽模块306可用于重构用于经擦除帧的语音参数。
无论是从抖动缓冲器302释放还是由帧擦除隐蔽模块306重构,语音参数都被提供到言语产生器308。具体地说,反转码本312用于将固定码本系数转换为剩余言语并将固定码本增益应用于所述剩余言语。接下来,将音高信息添加318回到剩余言语中。由音高解码器314从“延迟”中计算音高信息。音高解码器314本质上是产生言语样本的先前帧的信息的存储器。在添加318到剩余言语之前由音高解码器314将自适应码本增益应用于每一子帧中的存储器信息。接着使用来自反转变换322的LPC系数将剩余言语穿过滤波器320以将共振峰添加到所述言语。接着可将原始合成言语从言语产生器308提供到后置滤波器324。后置滤波器324是音频带中的数字滤波器,其倾向于使言语平滑并减少频带外分量。
帧擦除隐蔽过程的质量随着重构语音参数的精度而改进。当帧的言语含量较高时可实现重构的言语参数的较高精度。这意味着当语音编码器和解码器以全速率(最大言语含量)操作时获得通过帧擦除隐蔽技术的大多数语音质量增益。使用半速率帧来重构帧擦除的语音参数提供一些语音质量增益,但增益有限。一般来说,八分之一速率帧不含有任何言语含量,且因此可能不提供任何语音质量增益。因此,在语音解码器108的至少一个实施例中,仅当帧速率足够高以实现语音质量增益时可使用未来帧的语音参数。举例来说,如果先前帧和未来帧均以全速率或半速率编码,那么语音解码器108可使用先前帧和未来帧两者的语音参数来重构经擦除帧的语音参数。否则,仅根据先前帧重构经擦除帧的语音参数。此方法在存在语音质量增益的较低可能性时降低了帧擦除隐蔽过程的复杂性。来自帧错误检测器304的“速率确定”可用于指示用于帧擦除的先前帧和未来帧的编码模式。
图4是说明帧擦除隐蔽模块306的操作的流程图。在步骤402中,帧擦除隐蔽模块306开始操作。操作通常作为网络上两个终端之间的呼叫设置程序的一部分而被起始。一旦操作,帧擦除隐蔽模块306便在步骤404中保持闲置,直到言语片断的第一帧从抖动缓冲器302释放为止。当第一帧被释放时,在步骤406中帧擦除隐蔽模块306监视来自帧错误检测器304的“帧擦除旗标”。如果“帧擦除旗标”被清除,那么在步骤408中帧擦除隐蔽模块306等待下一帧,且接着重复所述过程。另一方面,如果在步骤406中设定了“帧擦除旗标”,那么帧擦除隐蔽模块306将重构用于所述帧的言语参数。
帧擦除隐蔽模块306通过首先确定来自未来帧的信息在抖动缓冲器302中是否可用来重构用于所述帧的言语参数。在步骤410中,帧擦除隐蔽模块306通过监视由帧错误检测器304产生的“未来帧可用旗标”来做出此确定。如果“未来帧可用旗标”被清除,那么在步骤412中帧擦除隐蔽模块306必须根据先前帧重构言语参数,而不利用未来帧中的信息。另一方面,如果“未来帧可用旗标”被设定,那么帧擦除隐蔽模块306可通过使用来自先前和未来帧两者的信息来提供增强的隐蔽。然而,仅在帧速率足够高以实现语音质量增益时才执行此过程。在步骤413中,帧擦除隐蔽模块306做出此确定。不管怎样,一旦帧擦除隐蔽模块306重构用于当前帧的言语参数,其便在步骤408中等待下一帧,且接着重复所述过程。
在步骤412中,帧擦除隐蔽模块306使用来自先前帧的信息重构用于经擦除帧的言语参数。对于丢失帧序列中的第一帧擦除,帧擦除隐蔽模块306从最后接收的帧复制LSP和“延迟”,将自适应码本增益设定为最后接收的帧的子帧的平均增益,并将固定码本增益设定为零。自适应码本增益也减弱,且如果功率(自适应码本增益)较低,那么随机性要素是LSP和“延迟”。
如上文指示,当来自未来帧的信息可用且帧速率较高时可实现改进的错误隐蔽。在步骤414中,可从先前帧和未来帧线性内插用于帧擦除序列的LSP。在步骤416中,可使用来自未来帧的D延迟计算延迟,且如果D延迟为零,那么可从先前帧和未来帧线性内插延迟。在步骤418中,可计算自适应码本增益。可使用至少两种不同方法。第一种方法以类似于LSP和“延迟”的方式计算自适应码本增益。也就是说,从先前帧和未来帧线性内插自适应码本增益。第二种方法在“延迟”已知时,即未来帧的D延迟不为零且当前帧的延迟是准确的而并非估计的时,将自适应码本增益设定为高值。可通过将自适应码本增益设定为一来使用一种非常积极的方法。或者,可将自适应码本增益设定在一与介于先前帧与未来帧之间的内插值之间的某处。不管怎样,不存在当来自未来帧的信息不可用时可能经历的自适应码本增益的减弱。这仅仅是可能的,因为具有来自未来的信息告知帧擦除隐蔽模块306经擦除的帧是否具有任何言语含量(用户可能恰在经擦除的帧传输之前停止说话)。最后,在步骤420中,将固定码本增益设定为零。
可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑组件、离散门或晶体管逻辑、离散硬件组件或经设计以执行本文描述的功能的其任何组合来实施或执行结合本文揭示的实施例描述的各种说明性逻辑块、模块、电路、元件和/或组件。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器也可实施为计算组件的组合,例如DSP和微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此种配置。
可以硬件、以由处理器执行的软件模块或以两者的组合来直接实施结合本文揭示的实施例描述的方法或算法。软件模块可驻留在随机存取存储器(RAM)快闪存储器、只读存储器(ROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可移除磁盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息和向存储媒体写入信息。在替代方案中,存储媒体可与处理器为整体式的。
提供对所揭示实施例的先前描述以使得所属领域的任何技术人员均能够制作或使用本发明。所属领域的技术人员将容易了解对这些实施例的各种修改,且在不脱离本发明精神或范围的情况下可将本文定义的一般原理应用于其它实施例。因此,不希望本发明限于本文所示的实施例,而是希望其符合与本文揭示的原理和新颖特征一致的最广泛范围。

Claims (33)

1.一种语音解码器,其包括:
言语产生器,其经配置以接收帧序列,所述帧序列中的每一帧均具有语音参数,且所述言语产生器经配置以根据所述语音参数产生言语;以及
帧擦除隐蔽模块,其经配置以根据在所述帧序列中的帧擦除之前的一个或多个先前帧中的语音参数和跟随所述帧序列中的所述帧擦除的一个或多个后续帧中的语音参数,响应于确定来自所述一个或多个先前帧和所述一个或多个后续帧的帧速率均高于阈值,而重构用于所述帧序列中的所述帧擦除的语音参数。
2.根据权利要求1所述的语音解码器,
其中所述一个或多个先前帧包含多于一个先前帧;
其中所述一个或多个后续帧包含多于一个后续帧;以及
其中所述帧擦除隐蔽模块进一步经配置以根据所述多于一个先前帧中的语音参数和来自所述多于一个后续帧的语音参数来重构用于所述帧擦除的语音参数。
3.根据权利要求1所述的语音解码器,其进一步包括抖动缓冲器。
4.根据权利要求3所述的语音解码器,其中所述抖动缓冲器进一步经配置以将来自所述一个或多个先前帧的语音参数和来自所述一个或多个后续帧的语音参数提供到所述帧擦除隐蔽模块以重构用于所述帧擦除的语音参数。
5.根据权利要求1所述的语音解码器,其进一步包括帧错误检测器,所述帧错误检测器经配置以检测所述帧擦除。
6.根据权利要求1所述的语音解码器,
其中所述帧序列中每一帧中的语音参数均包含线谱对,且
其中所述帧擦除隐蔽模块进一步经配置以通过在所述一个或多个先前帧中至少一者中的线谱对与所述一个或多个后续帧中至少一者中的线谱对之间进行内插来重构用于所述帧擦除的线谱对。
7.根据权利要求1所述的语音解码器,
其中所述帧序列的帧中的每一者中的语音参数均包含延迟和差值,所述差值指示所述帧序列中的当前一者的延迟与与该当前一者相邻的先前帧的延迟之间的差,且
其中所述帧擦除隐蔽模块进一步经配置以在所述一个或多个后续帧中的一者是跟随所述帧擦除后的下一帧且所述帧擦除隐蔽模块确定所述一个或多个后续帧中 
所述一者中的差值在某一范围内时,根据所述一个或多个后续帧中所述一者中的差值来重构用于所述帧擦除的延迟。
8.根据权利要求7所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以在所述一个或多个后续帧中的所述一者不是所述下一帧时,通过在所述一个或多个先前帧中一者中的延迟与所述一个或多个后续帧中所述一者中的延迟之间进行内插来重构用于所述帧擦除的延迟。
9.根据权利要求7所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以在所述帧擦除隐蔽模块确定所述一个或多个后续帧中所述一者中的延迟值在所述范围外时,通过在所述一个或多个先前帧中一者中的延迟与所述一个或多个后续帧中所述一者中的延迟之间进行内插来重构用于所述帧擦除的延迟。
10.根据权利要求1所述的语音解码器,
其中所述帧序列的帧中的每一者中的语音参数均包含自适应码本增益,且
其中所述帧擦除隐蔽模块进一步经配置以通过在所述一个或多个先前帧中一者中的自适应码本增益与所述一个或多个后续帧中一者中的自适应码本增益之间进行内插来重构用于所述帧擦除的自适应码本增益。
11.根据权利要求1所述的语音解码器,
其中所述帧序列的帧的中每一者中的语音参数均包含自适应码本增益、延迟和差值,所述差值指示所述帧序列中的当前一者的延迟与与该当前一者相邻的先前帧的延迟之间的差,且
其中所述帧擦除隐蔽模块进一步经配置以在根据所述一个或多个后续帧中至少一者中的差值确定所述帧擦除的延迟时通过将用于所述帧擦除的自适应码本增益设定为某一值来重构用于所述帧擦除的所述自适应码本增益,所述值大于所述一个或多个先前帧中的至少一者与所述一个或多个后续帧中的所述至少一者之间的内插自适应码本增益。
12.根据权利要求1所述的语音解码器,
其中所述帧序列的帧中的每一者中的语音参数均包含固定码本增益,且
其中所述帧擦除隐蔽模块进一步经配置以通过将用于所述帧擦除的固定码本增益设定为零来重构用于所述帧擦除的语音参数。
13.一种解码语音的方法,其包括:
接收帧序列,所述帧序列中的每一帧均具有语音参数; 
确定来自在所述帧序列中的帧擦除之前的一个或多个先前帧和跟随所述帧序列中的所述帧擦除的一个或多个后续帧的帧速率均高于阈值;
响应于上述确定,根据来自所述一个或多个先前帧的语音参数和来自所述一个或多个后续帧的语音参数重构用于所述帧序列中的所述帧擦除的语音参数;以及
基于所重构的语音参数产生言语。
14.根据权利要求13所述的方法,其中根据多于一个所述先前帧中的语音参数和多于一个所述后续帧中的语音参数来重构用于所述帧擦除的语音参数。
15.根据权利要求13所述的方法,其进一步包括对所述帧重新排序以使得以正确的顺序安排所述帧。
16.根据权利要求13所述的方法,其进一步包括检测所述帧擦除。
17.根据权利要求13所述的方法,其中所述帧序列中每一帧中的语音参数均包含线谱对,且其中通过在所述一个或多个先前帧中的线谱对与所述一个或多个后续帧中的线谱对之间进行内插来重构用于所述帧擦除的线谱对。
18.根据权利要求13所述的方法,
其中所述一个或多个后续帧中的一者是跟随所述帧擦除的下一帧,且其中所述帧序列中的每一帧中的语音参数均包含延迟和差值,所述差值指示所述帧序列中的当前一者的延迟与与该当前一者相邻的先前帧的延迟之间的差,且
其中响应于确定所述一个或多个后续帧中所述一者中的差值在某一范围内而根据所述一个或多个后续帧中所述一者中的差值重构用于所述帧擦除的延迟。
19.根据权利要求13所述的方法,
其中所述一个或多个后续帧中的一者不是跟随所述帧擦除的下一帧,且其中所述帧序列中的每一帧中的语音参数包含延迟,且
其中通过在所述一个或多个先前帧中一者中的延迟与所述一个或多个后续帧中一者中的延迟之间进行内插来重构用于所述帧擦除的延迟。
20.根据权利要求13所述的方法,其中所述帧序列中每一帧中的语音参数均包含自适应码本增益,且其中通过在所述一个或多个先前帧中一者中的自适应码本增益与所述一个或多个后续帧中一者中的自适应码本增益之间进行内插来重构用于所述帧擦除的自适应码本增益。
21.根据权利要求13所述的方法,
其中所述帧序列中每一帧中的语音参数均包含自适应码本增益、延迟、差值,所 述差值指示所述帧序列中的当前一者的延迟与与该当前一者相邻的先前帧的延迟之间的差,且
其中在可根据所述一个或多个后续帧中一者中的差值确定用于所述帧擦除的延迟时通过将所述自适应码本增益设定为某一值来重构用于所述帧擦除的自适应码本增益,所述值大于所述一个或多个先前帧中的一者与所述一个或多个后续帧中的一者之间的内插自适应码本增益。
22.根据权利要求13所述的方法,其中所述帧序列中每一帧中的语音参数均包含固定码本增益,且其中通过将用于所述帧擦除的固定码本增益设定为零来重构用于所述帧擦除的语音参数。
23.一种通信终端,其包括如权利要求1所述的语音解码器。
24.根据权利要求23所述的通信终端,其中所述语音解码器进一步包括抖动缓冲器。
25.根据权利要求24所述的通信终端,其中所述抖动缓冲器进一步经配置以将来自所述一个或多个先前帧的语音参数和来自所述一个或多个后续帧的语音参数提供到所述帧擦除隐蔽模块以重构用于所述帧擦除的语音参数。
26.根据权利要求23所述的通信终端,其中所述语音解码器进一步包括帧错误检测器,所述帧错误检测器经配置以检测所述帧擦除。
27.根据权利要求23所述的通信终端,其中所述帧序列中的每一帧中的语音参数均包含线谱对,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述一个或多个先前帧中的线谱对与所述一个或多个后续帧中的线谱对之间进行内插来重构用于所述帧擦除的线谱对。
28.根据权利要求23所述的通信终端,
其中所述帧序列中的每一帧中的语音参数均包含延迟和差值,所述差值指示所述帧序列中的当前一者的延迟与与该当前一者相邻的先前帧的延迟之间的差,且
其中所述帧擦除隐蔽模块进一步经配置以在所述一个或多个后续帧中的一者是下一帧且所述帧擦除隐蔽模块确定所述一个或多个后续帧中所述一者中的差值在某一范围内时,根据所述一个或多个后续帧中所述一者中的所述差值重构用于所述帧擦除的延迟。
29.根据权利要求28所述的通信终端,其中所述帧擦除隐蔽模块进一步经配置以在所述一个或多个后续帧中的所述一者不是所述下一帧时,通过在所述一个或多个先前帧中一者中的延迟与所述一个或多个后续帧中所述一者中的延迟之间进行内插来 重构用于所述帧擦除的延迟。
30.根据权利要求28所述的通信终端,其中所述帧擦除隐蔽模块进一步经配置以在所述帧擦除隐蔽模块确定所述一个或多个后续帧中所述一者中的延迟值在所述范围外时,通过在所述一个或多个先前帧中一者中的延迟与所述一个或多个后续帧中所述一者中的延迟之间进行内插来重构用于所述帧擦除的延迟。
31.根据权利要求23所述的通信终端,
其中所述帧序列中的每一帧中的语音参数均包含自适应码本增益,且
其中所述帧擦除隐蔽模块进一步经配置以通过在所述一个或多个先前帧中一者中的自适应码本增益与所述一个或多个后续帧中一者中的自适应码本增益之间进行内插来重构用于所述帧擦除的自适应码本增益。
32.根据权利要求23所述的通信终端,
其中所述帧序列中的每一帧中的语音参数均包含自适应码本增益、延迟、差值,所述差值指示所述帧序列中的当前一者的延迟与与该当前一者相邻的先前帧的延迟之间的差,且
其中所述帧擦除隐蔽模块进一步经配置以在可根据所述一个或多个后续帧中一者中的差值确定用于所述帧擦除的延迟时通过将自适应码本增益设定为某一值来重构用于所述帧擦除的所述自适应码本增益,所述值大于所述一个或多个先前帧中的一者与所述一个或多个后续帧中的一者之间的内插自适应码本增益。
33.根据权利要求23所述的通信终端,其中所述帧序列中的每一帧中的语音参数均包含固定码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过将用于所述帧擦除的固定码本增益设定为零来重构用于所述帧擦除的语音参数。 
CN2006800089998A 2005-01-31 2006-01-30 语音通信中的帧擦除隐蔽 Active CN101147190B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/047,884 US7519535B2 (en) 2005-01-31 2005-01-31 Frame erasure concealment in voice communications
US11/047,884 2005-01-31
PCT/US2006/003343 WO2006083826A1 (en) 2005-01-31 2006-01-30 Frame erasure concealment in voice communications

Publications (2)

Publication Number Publication Date
CN101147190A CN101147190A (zh) 2008-03-19
CN101147190B true CN101147190B (zh) 2012-02-29

Family

ID=36217009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800089998A Active CN101147190B (zh) 2005-01-31 2006-01-30 语音通信中的帧擦除隐蔽

Country Status (8)

Country Link
US (1) US7519535B2 (zh)
EP (1) EP1859440A1 (zh)
JP (2) JP2008529423A (zh)
KR (1) KR100956522B1 (zh)
CN (1) CN101147190B (zh)
MY (1) MY144724A (zh)
TW (1) TW200703234A (zh)
WO (1) WO2006083826A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
US7395202B2 (en) * 2005-06-09 2008-07-01 Motorola, Inc. Method and apparatus to facilitate vocoder erasure processing
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
CN101207468B (zh) * 2006-12-19 2010-07-21 华为技术有限公司 丢帧隐藏方法、系统和装置
JP5302190B2 (ja) * 2007-05-24 2013-10-02 パナソニック株式会社 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
CN101321033B (zh) * 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及系统
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR100899810B1 (ko) * 2007-12-17 2009-05-27 한국전자통신연구원 가변대역 멀티코덱을 위한 고정 지연 발생 장치 및 그 방법
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
CN102648493B (zh) * 2009-11-24 2016-01-20 Lg电子株式会社 音频信号处理方法和设备
US8428959B2 (en) * 2010-01-29 2013-04-23 Polycom, Inc. Audio packet loss concealment by transform interpolation
ES2458436T3 (es) 2011-02-14 2014-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Representación de señal de información utilizando transformada superpuesta
CA2920964C (en) 2011-02-14 2017-08-29 Christian Helmrich Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
MX2013009344A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral.
AR085361A1 (es) 2011-02-14 2013-09-25 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
KR101698905B1 (ko) 2011-02-14 2017-01-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
US9026434B2 (en) * 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
EP2902784B1 (en) * 2012-09-28 2018-10-24 National Institute of Advanced Industrial Science and Technology Assay device using porous medium
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
US9672833B2 (en) * 2014-02-28 2017-06-06 Google Inc. Sinusoidal interpolation across missing data
WO2015134579A1 (en) * 2014-03-04 2015-09-11 Interactive Intelligence Group, Inc. System and method to correct for packet loss in asr systems
EP2922054A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN107369455B (zh) 2014-03-21 2020-12-15 华为技术有限公司 语音频码流的解码方法及装置
US10217466B2 (en) * 2017-04-26 2019-02-26 Cisco Technology, Inc. Voice data compensation with machine learning
CN109496333A (zh) * 2017-06-26 2019-03-19 华为技术有限公司 一种丢帧补偿方法及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
CN1364289A (zh) * 2000-03-06 2002-08-14 扎林克半导体公司 在话音ip网络中用于包丢失补偿的子包插入
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
CN1432175A (zh) * 2000-04-24 2003-07-23 高通股份有限公司 可变速率语音编码器中的帧擦除补偿方法
CN1441950A (zh) * 2000-07-14 2003-09-10 康奈克森特系统公司 处理丢失帧的语音通信系统及方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01248200A (ja) * 1988-03-30 1989-10-03 Toshiba Corp 音声復号化装置
JPH02282299A (ja) * 1989-04-24 1990-11-19 Matsushita Electric Ind Co Ltd 音声復号化装置
JPH04149600A (ja) * 1990-10-12 1992-05-22 Fujitsu Ltd 音声復号化方式
JP2904427B2 (ja) * 1991-09-26 1999-06-14 ケイディディ株式会社 欠落音声補間装置
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
CA2142391C (en) * 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
US5550543A (en) * 1994-10-14 1996-08-27 Lucent Technologies Inc. Frame erasure or packet loss compensation method
US6205130B1 (en) * 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
JPH10336147A (ja) * 1997-06-03 1998-12-18 Oki Electric Ind Co Ltd Cdma送受信装置および送信レート可変方法
JP2000081898A (ja) * 1998-09-03 2000-03-21 Denso Corp ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
WO2000063885A1 (en) 1999-04-19 2000-10-26 At & T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US7027989B1 (en) * 1999-12-17 2006-04-11 Nortel Networks Limited Method and apparatus for transmitting real-time data in multi-access systems
JP2002162998A (ja) * 2000-11-28 2002-06-07 Fujitsu Ltd パケット修復処理を伴なう音声符号化方法
JP2004536176A (ja) 2001-06-29 2004-12-02 エクソンモービル アップストリーム リサーチ カンパニー メタン豊富な加圧液体混合物からエタン及びより重い炭化水素を回収する方法
EP1433164B1 (en) 2001-08-17 2007-11-14 Broadcom Corporation Improved frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
JP3722366B2 (ja) * 2002-02-22 2005-11-30 日本電信電話株式会社 パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
JP2005077889A (ja) * 2003-09-02 2005-03-24 Kazuhiro Kondo 音声パケット欠落補間方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
CN1364289A (zh) * 2000-03-06 2002-08-14 扎林克半导体公司 在话音ip网络中用于包丢失补偿的子包插入
CN1432175A (zh) * 2000-04-24 2003-07-23 高通股份有限公司 可变速率语音编码器中的帧擦除补偿方法
CN1441950A (zh) * 2000-07-14 2003-09-10 康奈克森特系统公司 处理丢失帧的语音通信系统及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
David E.Ray et.al.REED-SOLOMON CODING FOR CELP EDAC IN LAND MOBILE RADIO.《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》.1994,第285-288页. *
Jian Wang et.al.PARAMETER INTERPOLATION TO ENHANCE THE FRAME ERASURE ROBUSTNESS OF CELP CODERS IN PACKET NETWORKS.《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》.2001,第2卷第745-748页. *
Juan Carlos De Martin et.al.IMPROVED FRAME ERASURE CONCEALMENT FOR CELP-BASED CODERS.《IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING》.2000,第3卷第1483-1486页. *
Mikko Tammi et.al.SIGNAL MODIFICATION FOR VOICED WIDEBAND SPEECH CODING AND ITS APPLICATION FOR IS-95 SYSTEM.《IEEE WORKSHOP PROCEEDINGS ON SPEECH CODING》.2002,第35-37页. *

Also Published As

Publication number Publication date
US7519535B2 (en) 2009-04-14
JP5362808B2 (ja) 2013-12-11
WO2006083826A1 (en) 2006-08-10
JP2008529423A (ja) 2008-07-31
EP1859440A1 (en) 2007-11-28
TW200703234A (en) 2007-01-16
KR20070099055A (ko) 2007-10-08
CN101147190A (zh) 2008-03-19
JP2012098740A (ja) 2012-05-24
US20060173687A1 (en) 2006-08-03
KR100956522B1 (ko) 2010-05-07
MY144724A (en) 2011-10-31

Similar Documents

Publication Publication Date Title
CN101147190B (zh) 语音通信中的帧擦除隐蔽
US7016831B2 (en) Voice code conversion apparatus
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
US6389006B1 (en) Systems and methods for encoding and decoding speech for lossy transmission networks
CN102449690B (zh) 用于重建被擦除语音帧的系统与方法
US20070160154A1 (en) Method and apparatus for injecting comfort noise in a communications signal
KR20120125513A (ko) 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더
JPH11514168A (ja) 不連続送信における音声デコーダのハングオーバー期間を評価する方法および音声エンコーダおよびトランシーバ
JP2004522178A (ja) 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替
JP4287637B2 (ja) 音声符号化装置、音声符号化方法及びプログラム
US8874437B2 (en) Method and apparatus for modifying an encoded signal for voice quality enhancement
WO2014051964A1 (en) Apparatus and method for audio frame loss recovery
JP4215448B2 (ja) 音声復号装置及び音声復号方法
JP4558734B2 (ja) 信号復号化装置
JP3722366B2 (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP4414705B2 (ja) 音源信号符号化装置、及び音源信号符号化方法
EP1391880B1 (en) Coding device decoding device and methods thereof
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
US7693151B2 (en) Method and devices for providing protection in packet switched communications networks
CN100349395C (zh) 用于语音帧误差降低的语音通信单元和方法
US20040138878A1 (en) Method for estimating a codec parameter
Mertz et al. Voicing controlled frame loss concealment for adaptive multi-rate (AMR) speech frames in voice-over-IP.
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2004020675A (ja) 音声符号化/復号化方法及び音声符号化/復号化装置
JPWO2003021573A1 (ja) コーデック

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1112097

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1112097

Country of ref document: HK