CN101147190A - 语音通信中的帧擦除隐蔽 - Google Patents

语音通信中的帧擦除隐蔽 Download PDF

Info

Publication number
CN101147190A
CN101147190A CNA2006800089998A CN200680008999A CN101147190A CN 101147190 A CN101147190 A CN 101147190A CN A2006800089998 A CNA2006800089998 A CN A2006800089998A CN 200680008999 A CN200680008999 A CN 200680008999A CN 101147190 A CN101147190 A CN 101147190A
Authority
CN
China
Prior art keywords
frame
speech parameter
speech
delay
reconstruct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800089998A
Other languages
English (en)
Other versions
CN101147190B (zh
Inventor
塞拉芬·迪亚兹·斯平多拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101147190A publication Critical patent/CN101147190A/zh
Application granted granted Critical
Publication of CN101147190B publication Critical patent/CN101147190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种语音解码器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数。所述语音解码器包含言语产生器,其根据所述语音参数产生言语。帧擦除隐蔽模块经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中的帧擦除的语音参数。

Description

语音通信中的帧擦除隐蔽
技术领域
本揭示案大体上涉及语音通信,且更明确地说,涉及用于语音通信的帧擦除隐蔽技术。
背景技术
传统上,已经通过电路交换网络执行数字语音通信。电路交换网络是一种在呼叫的持续时间内在两个终端之间建立物理路径的网络。在电路交换应用中,发射终端将含有语音信息的包序列经由所述物理路径发送到接收终端。接收终端使用包中含有的语音信息来合成言语。如果在传输中丢失了包,那么接收终端可尝试隐蔽丢失的信息。这可通过根据先前接收的包中的信息重构丢失的包中所含有的语音信息来实现。
当前的技术发展已经为经由包交换网络进行数字语音通信铺平了道路。包交换网络是一种基于目的地地址通过网络路由包的网络。通过包交换通信,路由器个别地为每个包确定路径,沿着任何可用的路径发送包从而到达其目的地。由此,包并不是同时或者以相同次序到达接收终端。在接收终端中可使用抖动缓冲器以将包放回原来的次序并以连续循序方式播放出来。
发明内容
抖动缓冲器的存在提出了改进丢失包的重构语音信息的质量的独特机会。由于抖动缓冲器在播放由接收终端接收的包之前对其进行存储,因此可根据播放序列中在丢失包之前和之后的包中的信息为丢失包重构语音信息。
本发明揭示一种语音解码器。所述语音解码器包含言语产生器,其经配置以接收帧序列,其中每一所述帧均具有语音参数,且所述言语产生器还经配置以根据所述语音参数产生言语。所述语音解码器还包含帧擦除隐蔽模块,其经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中帧擦除的语音参数。
本发明揭示一种解码语音的方法。所述方法包含:接收帧序列,每一所述帧均具有语音参数;根据先前帧中一者的语音参数和后续帧中一者的语音参数重构用于所述帧序列中帧擦除的语音参数;以及根据所述帧序列中的语音参数产生言语。
本发明揭示一种语音解码器,其经配置以接收帧序列。每一所述帧均包含语音参数。所述语音解码器包含:用于根据所述语音参数产生言语的装置;以及用于根据先前帧中一者的语音参数和后续帧中一者的语音参数重构用于所述帧序列中帧擦除的语音参数的装置。
本发明还揭示一种通信终端。所述通信终端包含接收器以及语音解码器,所述语音解码器经配置以从所述接收器接收帧序列,每一所述帧均具有语音参数。所述语音解码器包含:言语产生器,其经配置以根据所述语音参数产生言语;以及帧擦除隐蔽模块,其经配置以根据先前帧中一者的语音参数和后续帧中一者的语音参数来重构用于所述帧序列中帧擦除的语音参数。
应了解,所属领域的技术人员从以下具体实施方式将容易了解本发明的其它实施例,其中以说明方式展示和描述本发明的各种实施例。将意识到,本发明能够具有其它和不同的实施例,且其若干细节能够在各种其它方面中进行修改,所有这些都不脱离本发明的精神和范围。因此,将附图和具体实施方式视为本质上是说明性的而不是限制性的。
附图说明
附图中以实例方式而并非以限制方式来说明本发明的各方面,其中:
图1是说明经由传输媒体的发射终端和接收终端的实例的概念方框图;
图2是说明发射终端中的语音编码器的实例的概念方框图;
图3是图1所示的接收终端的更详细的概念方框图;以及
图4是说明语音解码器中的帧擦除隐蔽模块的功能性的流程图。
具体实施方式
下文结合附图陈述的具体实施方式希望作为对本发明各种实施例的描述,且不希望代表可实践本发明的仅有实施例。所述具体实施方式出于提供对本发明的详尽理解的目的而包含特定细节。然而,所属领域的技术人员将易于了解,可在没有这些特定细节的情况下实践本发明。在某些情况下,以方框图形式展示众所周知的结构和组件,以便避免混淆本发明的概念。
图1是说明经由传输媒体的发射终端102和接收终端104的实例的概念方框图。发射终端102和接收终端104可以是能够支持语音通信的任何装置,包含电话、计算机、音频广播和接收设备、视频会议设备等。在一个实施例中,发射终端102和接收终端104经实施为具有无线码分多址(CDMA)能力,但实际上可用任何多址技术来实施。CDMA是此项技术中众所周知的基于展频通信的调制和多址方案。
发射终端102经展示为具有语音编码器106,且接收终端104经展示为具有语音解码器108。语音编码器106可用于通过基于人类言语产生模型提取参数来压缩来自用户接口110的言语。发射器112可用于将含有这些参数的包传输穿过传输媒体114。传输媒体114可以是基于包的网络(例如因特网或公司内网),或任何其它传输媒体。传输媒体112的另一端处的接收器116可用于接收包。语音解码器108使用包中的参数来合成言语。接着可将合成的言语提供到接收终端104上的用户接口118。尽管未图示,但在发射器112和接收器116两者中可执行各种信号处理功能,例如包含循环冗余检查(CRC)功能的卷积编码、交错、数字调制和展频处理。
在大多数应用中,通信的每一方进行发射以及接收。因此,每一终端将需要语音编码器和解码器。语音编码器和解码器可以是单独的装置或集成为称作“声码器”的单一装置。在以下具体实施方式中,将把终端102、104描述为在传输媒体114的一端处具有语音编码器106且在另一端处具有语音解码器108。所属领域的技术人员将容易认识到如何将本文描述的概念扩展到双向通信。
在发射终端102的至少一个实施例中,言语可以成帧地从用户接口110输入到语音编码器106,其中每一帧进一步分割为多个子帧。这些任意的帧边界通常用在执行某个区块处理的地方,此处通常就是这样的情况。然而,如果实施连续处理而不是区块处理,那么就不需要将言语样本分割为帧(和子帧)。所属领域的技术人员将容易认识到可如何将下文描述的区块技术扩展到连续处理。在所描述的实施例中,取决于特定应用和总体设计约束,传输穿过传输媒体114的每个包可含有一个或一个以上帧。
语音编码器106可以是可变速率或固定速率编码器。取决于言语含量,可变速率编码器逐帧地在多种编码器模式之间动态切换。语音解码器108也逐帧地在相应的解码器模式之间动态切换。针对每一帧选择特定模式,以实现可用的最低位速率,且同时在接收终端104处维持可接受的信号再现。举例来说,可以全速率或半速率来编码主动言语。通常以八分之一速率来编码背景噪音。可变速率和固定速率编码器都是此项技术中众所周知的。
语音编码器106和解码器108可使用线性预测编码(LPC)。支持LPC编码的基本想法是,可通过以其强度和音高为特征的言语源(声带)对言语建立模型。来自声带的言语行进通过以其共振(称为“共振峰”)为特征的声道(喉咙和嘴)。LPC语音编码器106通过估计共振峰、从言语中移除其影响并估计剩余言语的强度和音高来分析言语。接收端处的LPC语音解码器108通过反转所述过程来合成言语。明确地说,LPC语音解码器108使用剩余言语来产生言语源,使用共振峰来产生滤波器(其代表声道),并使言语源穿过滤波器以合成言语。
图2是说明LPC语音编码器106的实例的概念方框图。LPC语音编码器106包含LPC模块202,其从言语中估计共振峰。基本解决方案是差分等式,其将帧中的每一言语样本表达为先前言语样本的线性组合(言语样本的短期相关性)。差分等式的系数表现共振峰的特征,且用于计算这些系数的各种方法在此项技术中是众所周知的。LPC系数可应用于反向滤波器206,其从言语中移除共振峰的影响。可经由传输媒体传输剩余言语连同LPC系数,使得可在接收端处重构言语。在LPC语音编码器106的至少一个实施例中,将LPC系数转变204为线谱对(LSP)以获得较好的传输和数学变换效率。
其它压缩技术可用于通过消除冗余材料来显著减少表达言语所需的信息。这可通过利用存在某些由人类声带的周期性振动导致的基本频率的事实来实现。这些基本频率通常称为“音高”。可通过“自适应码本参数”来量化音高,所述参数包含(1)言语样本的数目中使言语片断的自相关函数最大化的“延迟”和(2)“自适应码本增益”。自适应码本增益基于子帧来测量言语的长期周期性如何强大。这些长期周期性可在传输到接收终端之前从剩余言语中减去210。
可以任意多种方法来进一步编码来自减法器210的剩余言语。较常用方法中的一种是使用由系统设计者创建的码本212。码本212是向大多数典型言语剩余信号指派参数的表。在操作中,将来自减法器210的剩余言语与码本212中的所有条目进行比较。选择具有最接近匹配的条目的参数。固定码本参数包含“固定码本系数”和“固定码本增益”。固定码本系数含有用于帧的新信息(能量)。其基本上是帧之间差异的编码表示。固定码本增益表示接收终端104中的语音解码器108为将新信息(固定码本系数)应用于言语的当前子帧而应使用的增益。
音高估计器208也可用于产生称为“Δ延迟”或“D延迟”的额外自适应码本参数。D延迟是当前帧与先前帧之间测得的延迟的差异。然而,其具有有限的范围,且可在所述两个帧之间的延迟差异溢出时被设定为零。接收终端104中的语音解码器108不使用此参数来合成言语。而是,所述参数用于为丢失或损坏的帧计算言语样本的音高。
图3是图1所示的接收终端104的更详细的概念方框图。在此配置中,语音解码器108包含抖动缓冲器302、帧错误检测器304、帧擦除隐蔽模块306和言语产生器308。语音解码器108可实施为作为独立实体的声码器的一部分,或分布在接收终端104内的一个或一个以上实体上。语音解码器108可实施为硬件、固件、软件或其任意组合。举例来说,语音解码器108可实施为具有微处理器、数字信号处理器(DSP)、可编程逻辑、专用硬件或任何其它基于硬件和/或软件的处理实体。以下将根据其功能性来描述语音解码器108。其实施的方式将取决于特定应用和施加在总体系统上的设计约束。所属领域的技术人员将认识到,在这些环境下的硬件、固件和软件配置的可互换性,以及如何针对每一特定应用最好地实施所描述的功能性。
抖动缓冲器302可定位在语音解码器108的前端处。抖动缓冲器302是硬件装置或软件过程,其消除由于网络拥塞、计时漂移和路径改变而引起的包到达时间变化所导致的抖动。抖动缓冲器302延迟到达的包,使得所有包可以正确次序连续提供到言语产生器308,从而产生具有极少音频失真的清楚连接。抖动缓冲器302可为固定的或自适应的。固定抖动缓冲器对包引入固定延迟。另一方面,自适应抖动缓冲器适应于网络延迟的改变。固定和自适应抖动缓冲器两者均在此项技术中是众所周知的。
如早先结合图1论述,发射终端102可执行各种信号处理功能,例如包含CRC功能的卷积编码、交错、数字调制和展频处理。帧错误检测器304可用于执行CRC检查功能。或者或另外,可使用其它帧错误检测技术,包含检查和以及奇偶位,仅举几个例子。在任何情况下,帧错误检测器304确定是否已发生帧擦除。“帧擦除”意味着帧丢失或损坏。如果帧错误检测器304确定当前帧没有被擦除,那么帧擦除隐蔽模块306将用于所述帧的语音参数从抖动缓冲器302释放到言语产生器308。另一方面,如果帧错误检测器304确定当前帧已被擦除,那么其将向帧擦除隐蔽模块306提供“帧擦除旗标”。以稍后将更详细描述的方式,帧擦除隐蔽模块306可用于重构用于经擦除帧的语音参数。
无论是从抖动缓冲器302释放还是由帧擦除隐蔽模块306重构,语音参数都被提供到言语产生器308。具体地说,反转码本312用于将固定码本系数转换为剩余言语并将固定码本增益应用于所述剩余言语。接下来,将音高信息添加318回到剩余言语中。由音高解码器314从“延迟”中计算音高信息。音高解码器314本质上是产生言语样本的先前帧的信息的存储器。在添加318到剩余言语之前由音高解码器314将自适应码本增益应用于每一子帧中的存储器信息。接着使用来自反转变换322的LPC系数将剩余言语穿过滤波器320以将共振峰添加到所述言语。接着可将原始合成言语从言语产生器308提供到后置滤波器324。后置滤波器324是音频带中的数字滤波器,其倾向于使言语平滑并减少频带外分量。
帧擦除隐蔽过程的质量随着重构语音参数的精度而改进。当帧的言语含量较高时可实现重构的言语参数的较高精度。这意味着当语音编码器和解码器以全速率(最大言语含量)操作时获得通过帧擦除隐蔽技术的大多数语音质量增益。使用半速率帧来重构帧擦除的语音参数提供一些语音质量增益,但增益有限。一般来说,八分之一速率帧不含有任何言语含量,且因此可能不提供任何语音质量增益。因此,在语音解码器108的至少一个实施例中,仅当帧速率足够高以实现语音质量增益时可使用未来帧的语音参数。举例来说,如果先前帧和未来帧均以全速率或半速率编码,那么语音解码器108可使用先前帧和未来帧两者的语音参数来重构经擦除帧的语音参数。否则,仅根据先前帧重构经擦除帧的语音参数。此方法在存在语音质量增益的较低可能性时降低了帧擦除隐蔽过程的复杂性。来自帧错误检测器304的“速率确定”可用于指示用于帧擦除的先前帧和未来帧的编码模式。
图4是说明帧擦除隐蔽模块306的操作的流程图。在步骤402中,帧擦除隐蔽模块306开始操作。操作通常作为网络上两个终端之间的呼叫设置程序的一部分而被起始。一旦操作,帧擦除隐蔽模块306便在步骤404中保持闲置,直到言语片断的第一帧从抖动缓冲器302释放为止。当第一帧被释放时,在步骤406中帧擦除隐蔽模块306监视来自帧错误检测器304的“帧擦除旗标”。如果“帧擦除旗标”被清除,那么在步骤408中帧擦除隐蔽模块306等待下一帧,且接着重复所述过程。另一方面,如果在步骤406中设定了“帧擦除旗标”,那么帧擦除隐蔽模块306将重构用于所述帧的言语参数。
帧擦除隐蔽模块306通过首先确定来自未来帧的信息在抖动缓冲器302中是否可用来重构用于所述帧的言语参数。在步骤410中,帧擦除隐蔽模块306通过监视由帧错误检测器304产生的“未来帧可用旗标”来做出此确定。如果“未来帧可用旗标”被清除,那么在步骤412中帧擦除隐蔽模块306必须根据先前帧重构言语参数,而不利用未来帧中的信息。另一方面,如果“未来帧可用旗标”被设定,那么帧擦除隐蔽模块306可通过使用来自先前和未来帧两者的信息来提供增强的隐蔽。然而,仅在帧速率足够高以实现语音质量增益时才执行此过程。在步骤413中,帧擦除隐蔽模块306做出此确定。不管怎样,一旦帧擦除隐蔽模块306重构用于当前帧的言语参数,其便在步骤408中等待下一帧,且接着重复所述过程。
在步骤412中,帧擦除隐蔽模块306使用来自先前帧的信息重构用于经擦除帧的言语参数。对于丢失帧序列中的第一帧擦除,帧擦除隐蔽模块306从最后接收的帧复制LSP和“延迟”,将自适应码本增益设定为最后接收的帧的子帧的平均增益,并将固定码本增益设定为零。自适应码本增益也减弱,且如果功率(自适应码本增益)较低,那么随机性要素是LSP和“延迟”。
如上文指示,当来自未来帧的信息可用且帧速率较高时可实现改进的错误隐蔽。在步骤414中,可从先前帧和未来帧线性内插用于帧擦除序列的LSP。在步骤416中,可使用来自未来帧的D延迟计算延迟,且如果D延迟为零,那么可从先前帧和未来帧线性内插延迟。在步骤418中,可计算自适应码本增益。可使用至少两种不同方法。第一种方法以类似于LSP和“延迟”的方式计算自适应码本增益。也就是说,从先前帧和未来帧线性内插自适应码本增益。第二种方法在“延迟”已知时,即未来帧的D延迟不为零且当前帧的延迟是准确的而并非估计的时,将自适应码本增益设定为高值。可通过将自适应码本增益设定为一来使用一种非常积极的方法。或者,可将自适应码本增益设定在一与介于先前帧与未来帧之间的内插值之间的某处。不管怎样,不存在当来自未来帧的信息不可用时可能经历的自适应码本增益的减弱。这仅仅是可能的,因为具有来自未来的信息告知帧擦除隐蔽模块306经擦除的帧是否具有任何言语含量(用户可能恰在经擦除的帧传输之前停止说话)。最后,在步骤420中,将固定码本增益设定为零。
可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑组件、离散门或晶体管逻辑、离散硬件组件或经设计以执行本文描述的功能的其任何组合来实施或执行结合本文揭示的实施例描述的各种说明性逻辑块、模块、电路、元件和/或组件。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器也可实施为计算组件的组合,例如DSP和微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此种配置。
可以硬件、以由处理器执行的软件模块或以两者的组合来直接实施结合本文揭示的实施例描述的方法或算法。软件模块可驻留在随机存取存储器(RAM)快闪存储器、只读存储器(ROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可移除磁盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息和向存储媒体写入信息。在替代方案中,存储媒体可与处理器为整体式的。
提供对所揭示实施例的先前描述以使得所属领域的任何技术人员均能够制作或使用本发明。所属领域的技术人员将容易了解对这些实施例的各种修改,且在不脱离本发明精神或范围的情况下可将本文定义的一般原理应用于其它实施例。因此,不希望本发明限于本文所示的实施例,而是希望其符合与本文揭示的原理和新颖特征一致的最广泛范围。

Claims (38)

1.一种语音解码器,其包括:
言语产生器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数,且所述言语产生器经配置以根据所述语音参数产生言语;以及
帧擦除隐蔽模块,其经配置以根据一个或一个以上先前帧中的语音参数和一个或一个以上后续帧中的语音参数来重构用于所述帧序列中的帧擦除的语音参数。
2.根据权利要求1所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以根据包含所述先前帧中所述一者的多个所述先前帧中的语音参数和包含所述后续帧中所述一者的多个所述后续帧中的语音参数来重构用于所述帧擦除的语音参数。
3.根据权利要求1所述的语音解码器,其中所述帧擦除隐蔽模块经配置以响应于确定来自所述先前帧中的所述一者和未来帧中的所述一者的帧速率均高于阈值而根据所述先前帧中所述一者中的语音参数和所述后续帧中所述一者中的语音参数重构用于所述帧序列中的帧擦除的语音参数。
4.根据权利要求1所述的语音解码器,其进一步包括抖动缓冲器,所述抖动缓冲器经配置以将所述帧以正确的顺序提供到所述言语产生器。
5.根据权利要求4所述的语音解码器,其中所述抖动缓冲器进一步经配置以将来自所述先前帧中所述一者或一者以上的语音参数和来自所述后续帧中所述一者或一者以上的语音参数提供到所述帧擦除隐蔽模块以重构用于所述帧擦除的语音参数。
6.根据权利要求1所述的语音解码器,其进一步包括帧错误检测器,所述帧错误检测器经配置以检测所述帧擦除。
7.根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含线谱对,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述先前帧中所述一者中的线谱对与所述后续帧中所述一者中的线谱对之间进行内插来重构用于所述经擦除帧的线谱对。
8.根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含延迟和差值,所述差值指示所述延迟与最近先前帧的延迟之间的差,且其中所述帧擦除隐蔽模块进一步经配置以在所述后续帧中的所述一者是下一帧且所述帧擦除隐蔽模块确定所述后续帧中所述一者中的差值在某一范围内时,根据所述后续帧中所述一者中的差值来重构用于所述经擦除帧的延迟。
9.根据权利要求8所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以在所述后续帧中的所述一者不是下一帧时,通过在所述先前帧中所述一者中的延迟与所述后续帧中所述一者中的延迟之间进行内插来重构用于所述经擦除帧的延迟。
10.根据权利要求8所述的语音解码器,其中所述帧擦除隐蔽模块进一步经配置以在所述帧擦除隐蔽模块确定所述后续帧中所述一者中的延迟值在所述范围外时,通过在所述先前帧中所述一者中的延迟与所述后续帧中所述一者中的延迟之间进行内插来重构用于所述经擦除帧的延迟。
11.根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含自适应码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述先前帧中所述一者中的自适应码本增益与所述后续帧中所述一者中的自适应码本增益之间进行内插来重构用于所述经擦除帧的自适应码本增益。
12.根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含自适应码本增益、延迟和差值,所述差值指示所述延迟与所述最近先前帧的延迟之间的差,且帧擦除隐蔽模块进一步经配置以在可根据所述后续帧中所述一者中的差值确定所述经擦除帧的延迟时通过将所述自适应码本增益设定为某一值来重构用于所述经擦除帧的自适应码本增益,所述值大于所述先前帧中的所述一者与所述后续帧中的所述一者之间的内插自适应码本增益。
13.根据权利要求1所述的语音解码器,其中所述帧中每一者中的语音参数均包含固定码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过将用于所述经擦除帧的固定码本增益设定为零来重构用于所述经擦除帧的语音参数。
14.一种解码语音的方法,其包括:
接收帧序列,所述帧中的每一者均具有语音参数;
根据至少一个先前帧中的语音参数和来自至少一个后续帧的语音参数重构用于
所述帧序列中的帧擦除的语音参数;以及
根据所述帧序列中的语音参数产生言语。
15.根据权利要求14所述的方法,其中根据包含所述先前帧中所述一者的多个所述先前帧中的语音参数和包含所述后续帧中所述一者的多个所述后续帧中的语音参数来重构用于所述帧擦除的语音参数。
16.根据权利要求14所述的方法,其进一步包括确定来自所述先前帧中的所述一者和未来帧中的所述一者的帧速率均高于阈值,以及响应于所述确定而根据来自所述先前帧中所述一者的语音参数和来自所述后续帧中所述一者的语音参数重构用于所述帧序列中的帧擦除的语音参数。
17.根据权利要求14所述的方法,其进一步包括对所述帧重新排序以使得以正确的顺序接收所述帧。
18.根据权利要求14所述的方法,其进一步包括检测所述帧擦除。
19.根据权利要求14所述的方法,其中所述帧中每一者中的语音参数均包含线谱对,且其中通过在所述先前帧中所述一者中的线谱对与所述后续帧中所述一者中的线谱对之间进行内插来重构用于所述经擦除帧的线谱对。
20.根据权利要求14所述的方法,其中所述后续帧中的所述一者是跟随所述经擦除帧的下一帧,且其中所述帧中每一者中的语音参数均包含延迟和差值,所述差值指示所述延迟与最近先前帧的延迟之间的差,且其中响应于确定所述后续帧中所述一者中的差值在某一范围内而根据所述后续帧中所述一者中的差值重构用于所述经擦除帧的延迟。
21.根据权利要求14所述的方法,其中所述后续帧中的所述一者不是跟随所述经擦除帧的下一帧,且其中所述帧中每一者中的语音参数包含延迟,且其中通过在所述先前帧中所述一者中的延迟与所述后续帧中所述一者中的延迟之间进行内插来重构用于所述经擦除帧的延迟。
22.根据权利要求14所述的方法,其中所述帧中每一者中的语音参数均包含自适应码本增益,且其中通过在所述先前帧中所述一者中的自适应码本增益与所述后续帧中所述一者中的自适应码本增益之间进行内插来重构用于所述经擦除帧的自适应码本增益。
23.根据权利要求14所述的方法,其中所述帧中每一者中的语音参数均包含自适应码本增益、延迟、差值,所述差值指示所述延迟与所述最近先前帧的延迟之间的差,且其中在可根据所述后续帧中所述一者中的差值确定用于所述经擦除帧的延迟时通过将所述自适应码本增益设定为某一值来重构用于所述经擦除帧的自适应码本增益,所述值大于所述先前帧中的所述一者与所述后续帧中的所述一者之间的内插自适应码本增益。
24.根据权利要求14所述的方法,其中所述帧中每一者中的语音参数均包含固定码本增益,且其中通过将用于所述经擦除帧的固定码本增益设定为零来重构用于所述经擦除帧的语音参数。
25.一种语音解码器,其经配置以接收帧序列,所述帧中的每一者均具有语音参数,所述语音解码器包括:
用于根据所述语音参数产生言语的装置;以及
用于根据至少一个先前帧中的语音参数和至少一个后续帧中的语音参数来重构
用于所述帧序列中的帧擦除的语音参数的装置。
26.根据权利要求25所述的语音解码器,其进一步包括用于将所述帧以正确的顺序提供到所述言语产生装置的装置。
27.一种通信终端,其包括:
接收器;以及
语音解码器,其经配置以从所述接收器接收帧序列,所述帧中的每一者均具有语音参数,所述语音解码器包括:言语产生器,其经配置以根据所述语音参数产生言语;以及帧擦除隐蔽模块,其经配置以根据一个或一个以上先前帧中的语音参数和一个或一个以上后续帧中的语音参数来重构用于所述帧序列中的帧擦除的语音参数。
28.根据权利要求27所述的通信终端,其中所述帧擦除隐蔽模块经配置以响应于确定来自所述先前帧的所述一者和未来帧的所述一者的帧速率均高于阈值而根据所述先前帧中所述一者中的语音参数和所述后续帧中所述一者中的语音参数重构用于所述帧序列中的帧擦除的语音参数。
29.根据权利要求27所述的通信终端,其中所述语音解码器进一步包括抖动缓冲器,所述抖动缓冲器经配置以将来自所述接收器的所述帧以正确的顺序提供到所述言语产生器。
30.根据权利要求29所述的通信终端,其中所述抖动缓冲器进一步经配置以将所述先前帧中所述一者中的语音参数和所述后续帧中所述一者中的语音参数提供到所述帧擦除隐蔽模块以重构用于所述帧擦除的语音参数。
31.根据权利要求27所述的通信终端,其中所述语音解码器进一步包括帧错误检测器,所述帧错误检测器经配置以检测所述帧擦除。
32.根据权利要求27所述的通信终端,其中所述帧中每一者中的语音参数均包含线谱对,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述先前帧中所述一者中的线谱对与所述后续帧中所述一者中的线谱对之间进行内插来重构用于所述经擦除帧的线谱对。
33.根据权利要求27所述的通信终端,其中所述帧中每一者中的语音参数均包含延迟和差值,所述差值指示所述延迟与最近先前帧的延迟之间的差,且其中所述帧擦除隐蔽模块进一步经配置以在所述后续帧中的所述一者是下一帧且所述帧擦除隐蔽模块确定所述后续帧中所述一者中的差值在某一范围内时,根据所述后续帧中所述一者中的所述差值重构用于所述经擦除帧的延迟。
34.根据权利要求33所述的通信终端,其中所述帧擦除隐蔽模块进一步经配置以在所述后续帧中的所述一者不是下一帧时,通过在所述先前帧中所述一者中的延迟与所述后续帧中所述一者中的延迟之间进行内插来重构用于所述经擦除帧的延迟。
35.根据权利要求33所述的通信终端,其中所述帧擦除隐蔽模块进一步经配置以在所述帧擦除隐蔽模块确定所述后续帧中所述一者中的延迟值在所述范围外时,通过在所述先前帧中所述一者中的延迟与所述后续帧中所述一者中的延迟之间进行内插来重构用于所述经擦除帧的延迟。
36.根据权利要求27所述的通信终端,其中所述帧中每一者中的语音参数均包含自适应码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过在所述先前帧中所述一者中的自适应码本增益与所述后续帧中所述一者中的自适应码本增益之间进行内插来重构用于所述经擦除帧的自适应码本增益。
37.根据权利要求27所述的通信终端,其中所述帧中每一者中的语音参数均包含自适应码本增益、延迟、差值,所述差值指示所述延迟与最近先前帧的延迟之间的差,且其中所述帧擦除隐蔽模块进一步经配置以在可根据所述后续帧中所述一者中的差值确定用于所述经擦除帧的延迟时通过将所述自适应码本增益设定为某一值来重构用于所述经擦除帧的自适应码本增益,所述值大于所述先前帧中的所述一者与所述后续帧中的所述一者之间的内插自适应码本增益。
38.根据权利要求27所述的通信终端,其中所述帧中每一者中的语音参数均包含固定码本增益,且其中所述帧擦除隐蔽模块进一步经配置以通过将用于所述经擦除帧的固定码本增益设定为零来重构用于所述经擦除帧的语音参数。
CN2006800089998A 2005-01-31 2006-01-30 语音通信中的帧擦除隐蔽 Active CN101147190B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/047,884 US7519535B2 (en) 2005-01-31 2005-01-31 Frame erasure concealment in voice communications
US11/047,884 2005-01-31
PCT/US2006/003343 WO2006083826A1 (en) 2005-01-31 2006-01-30 Frame erasure concealment in voice communications

Publications (2)

Publication Number Publication Date
CN101147190A true CN101147190A (zh) 2008-03-19
CN101147190B CN101147190B (zh) 2012-02-29

Family

ID=36217009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800089998A Active CN101147190B (zh) 2005-01-31 2006-01-30 语音通信中的帧擦除隐蔽

Country Status (8)

Country Link
US (1) US7519535B2 (zh)
EP (1) EP1859440A1 (zh)
JP (2) JP2008529423A (zh)
KR (1) KR100956522B1 (zh)
CN (1) CN101147190B (zh)
MY (1) MY144724A (zh)
TW (1) TW200703234A (zh)
WO (1) WO2006083826A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648493A (zh) * 2009-11-24 2012-08-22 Lg电子株式会社 音频信号处理方法和设备
CN105895107A (zh) * 2010-01-29 2016-08-24 宝利通公司 通过变换插值进行音频分组丢失隐藏
WO2019000178A1 (zh) * 2017-06-26 2019-01-03 华为技术有限公司 一种丢帧补偿方法及设备

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
US7395202B2 (en) * 2005-06-09 2008-07-01 Motorola, Inc. Method and apparatus to facilitate vocoder erasure processing
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
JP2008076847A (ja) * 2006-09-22 2008-04-03 Matsushita Electric Ind Co Ltd 復号器及び信号処理システム
CN101207468B (zh) * 2006-12-19 2010-07-21 华为技术有限公司 丢帧隐藏方法、系统和装置
WO2008146466A1 (ja) * 2007-05-24 2008-12-04 Panasonic Corporation オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
CN101321033B (zh) * 2007-06-10 2011-08-10 华为技术有限公司 帧补偿方法及系统
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR100899810B1 (ko) 2007-12-17 2009-05-27 한국전자통신연구원 가변대역 멀티코덱을 위한 고정 지연 발생 장치 및 그 방법
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
KR101424372B1 (ko) 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
US9026434B2 (en) * 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
WO2014051033A1 (ja) * 2012-09-28 2014-04-03 独立行政法人産業技術総合研究所 多孔質媒体を利用したアッセイ装置
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
US9672833B2 (en) * 2014-02-28 2017-06-06 Google Inc. Sinusoidal interpolation across missing data
US10157620B2 (en) * 2014-03-04 2018-12-18 Interactive Intelligence Group, Inc. System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation
EP2922054A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN107369454B (zh) 2014-03-21 2020-10-27 华为技术有限公司 语音频码流的解码方法及装置
US10217466B2 (en) * 2017-04-26 2019-02-26 Cisco Technology, Inc. Voice data compensation with machine learning

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01248200A (ja) * 1988-03-30 1989-10-03 Toshiba Corp 音声復号化装置
JPH02282299A (ja) * 1989-04-24 1990-11-19 Matsushita Electric Ind Co Ltd 音声復号化装置
JPH04149600A (ja) * 1990-10-12 1992-05-22 Fujitsu Ltd 音声復号化方式
JP2904427B2 (ja) * 1991-09-26 1999-06-14 ケイディディ株式会社 欠落音声補間装置
CA2142391C (en) * 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5550543A (en) * 1994-10-14 1996-08-27 Lucent Technologies Inc. Frame erasure or packet loss compensation method
US5699478A (en) * 1995-03-10 1997-12-16 Lucent Technologies Inc. Frame erasure compensation technique
US6205130B1 (en) * 1996-09-25 2001-03-20 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
JPH10336147A (ja) * 1997-06-03 1998-12-18 Oki Electric Ind Co Ltd Cdma送受信装置および送信レート可変方法
JP2000081898A (ja) * 1998-09-03 2000-03-21 Denso Corp ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
WO2000063883A1 (en) 1999-04-19 2000-10-26 At & T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US7027989B1 (en) * 1999-12-17 2006-04-11 Nortel Networks Limited Method and apparatus for transmitting real-time data in multi-access systems
GB2360178B (en) * 2000-03-06 2004-04-14 Mitel Corp Sub-packet insertion for packet loss compensation in Voice Over IP networks
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
JP2002162998A (ja) * 2000-11-28 2002-06-07 Fujitsu Ltd パケット修復処理を伴なう音声符号化方法
BR0210218A (pt) 2001-06-29 2004-06-08 Exxonmobil Upstream Res Co Método de absorção para recuperar e método para separar componentes de c2+ de uma mistura lìquida pressurizada contendo c1 e c2+
WO2003023763A1 (en) 2001-08-17 2003-03-20 Broadcom Corporation Improved frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
JP3722366B2 (ja) * 2002-02-22 2005-11-30 日本電信電話株式会社 パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP4331928B2 (ja) * 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
JP2005077889A (ja) * 2003-09-02 2005-03-24 Kazuhiro Kondo 音声パケット欠落補間方式

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648493A (zh) * 2009-11-24 2012-08-22 Lg电子株式会社 音频信号处理方法和设备
CN102648493B (zh) * 2009-11-24 2016-01-20 Lg电子株式会社 音频信号处理方法和设备
CN105895107A (zh) * 2010-01-29 2016-08-24 宝利通公司 通过变换插值进行音频分组丢失隐藏
WO2019000178A1 (zh) * 2017-06-26 2019-01-03 华为技术有限公司 一种丢帧补偿方法及设备
CN109496333A (zh) * 2017-06-26 2019-03-19 华为技术有限公司 一种丢帧补偿方法及设备

Also Published As

Publication number Publication date
JP2008529423A (ja) 2008-07-31
US20060173687A1 (en) 2006-08-03
MY144724A (en) 2011-10-31
KR20070099055A (ko) 2007-10-08
KR100956522B1 (ko) 2010-05-07
JP5362808B2 (ja) 2013-12-11
US7519535B2 (en) 2009-04-14
CN101147190B (zh) 2012-02-29
WO2006083826A1 (en) 2006-08-10
JP2012098740A (ja) 2012-05-24
EP1859440A1 (en) 2007-11-28
TW200703234A (en) 2007-01-16

Similar Documents

Publication Publication Date Title
CN101147190B (zh) 语音通信中的帧擦除隐蔽
CN102449690B (zh) 用于重建被擦除语音帧的系统与方法
TWI464734B (zh) 用於在一語音訊框內避免資訊流失的系統與方法
ES2343862T3 (es) Metodos y disposiciones para un emisor y receptor de conversacion/audio.
JPH11514168A (ja) 不連続送信における音声デコーダのハングオーバー期間を評価する方法および音声エンコーダおよびトランシーバ
US20070160154A1 (en) Method and apparatus for injecting comfort noise in a communications signal
JP2004522178A (ja) 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替
KR20120125513A (ko) 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더
WO2007143953A1 (fr) Dispositif et procédé pour dissimulation de trames perdues
JP4287637B2 (ja) 音声符号化装置、音声符号化方法及びプログラム
JP4215448B2 (ja) 音声復号装置及び音声復号方法
US20100054454A1 (en) Method and apparatus for the detection and suppression of echo in packet based communication networks using frame energy estimation
JP2002221994A (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
EP1391880B1 (en) Coding device decoding device and methods thereof
JP4414705B2 (ja) 音源信号符号化装置、及び音源信号符号化方法
US20100185441A1 (en) Error Concealment
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
CN100349395C (zh) 用于语音帧误差降低的语音通信单元和方法
JP2005309096A (ja) 音声復号化装置および音声復号化方法
JPH09134198A (ja) 音声復号化装置
CA2584686A1 (en) Methods and devices for providing protection in packet switched communication networks
Mertz et al. Voicing controlled frame loss concealment for adaptive multi-rate (AMR) speech frames in voice-over-IP.
JPWO2003021573A1 (ja) コーデック
JPH10161696A (ja) 音声符号化装置および音声復号化装置
JPH08274726A (ja) 音響信号符号化復号化方法及びその装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1112097

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1112097

Country of ref document: HK