CN102449690A - 用于重建被擦除语音帧的系统与方法 - Google Patents
用于重建被擦除语音帧的系统与方法 Download PDFInfo
- Publication number
- CN102449690A CN102449690A CN2010800232653A CN201080023265A CN102449690A CN 102449690 A CN102449690 A CN 102449690A CN 2010800232653 A CN2010800232653 A CN 2010800232653A CN 201080023265 A CN201080023265 A CN 201080023265A CN 102449690 A CN102449690 A CN 102449690A
- Authority
- CN
- China
- Prior art keywords
- frame
- speech frame
- speech
- wiped free
- index position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 121
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000001228 spectrum Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 6
- 238000013213 extrapolation Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims 1
- 239000000872 buffer Substances 0.000 abstract description 30
- 238000010586 diagram Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000002708 enhancing effect Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 5
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 206010038743 Restlessness Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003733 optic disk Anatomy 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M13/00—Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明描述一种用于重建被擦除语音帧的方法。从缓冲器接收第二语音帧。所述第二语音帧的索引位置大于所述被擦除语音帧的索引位置。基于所述第二语音帧及第三语音帧中的一者或其两者而确定使用的包丢失隐蔽PLC方法的类型。所述第三语音帧的索引位置小于所述被擦除语音帧的所述索引位置。从所述第二语音帧及所述第三语音帧中的一者或其两者重建所述被擦除语音帧。
Description
技术领域
本发明的系统及方法涉及通信及无线相关技术。特定来说,本发明的系统及方法涉及用于重建被擦除语音帧的系统及方法。
背景技术
数字话音通信已在电路交换式网络上执行。电路交换式网络是其中物理路径在呼叫的持续期间建立于两个终端之间的网络。在电路交换式应用中,发射终端在所述物理路径上将含有话音信息的包的序列发送到接收终端。所述接收终端使用所述包中所含的话音信息来合成语音。
数字话音通信已开始在包交换式网络上执行。包交换式网络是其中基于目的地地址而经由所述网络来路由包的网络。关于包交换式通信,路由器个别地确定用于每一包的路径,从而沿着任何可用路径向下发送包以达到其目的地。结果,所述包并不在相同时间或以相同次序到达所述接收终端。去抖动缓冲器可用于所述接收终端中以按次序放回所述包且使所述包以连续顺序方式播出。
在一些情况下,包在从发射终端到接收终端的运输中丢失。丢失的包可使所合成语音的质量降级。因而,可通过提供用于重建丢失包的系统及方法来实现益处。
发明内容
附图说明
图1为说明在一传输媒体上的发射终端及接收终端的实例的框图;
图2为说明所述接收终端的另一配置的框图;
图3为说明具有增强型包丢失隐蔽(PLC)模块的接收终端的一个配置的框图;
图4为说明用于使用未来帧重建语音帧的方法的一个实例的流程图;
图5说明对应于图4中所展示的方法的手段加功能块;
图6为说明用于隐蔽语音帧的丢失的方法的另一配置的流程图;
图7为说明用于隐蔽语音帧的丢失的方法的另一实例的流程图;及
图8说明可用于无线装置中的各种组件。
具体实施方式
话音应用可在包交换式网络中实施。具有话音信息的包可在所述网络上从第一装置发射到第二装置。然而,所述包中的一些可能在所述包的发射期间丢失。在一个配置中,话音信息(即,语音)可以语音帧来组织。包可包括一个或一个以上语音帧。每一语音帧可进一步分割成若干子帧。可在某一块处理执行之处使用这些任意的帧边界。然而,如果实施的是连续处理而非块处理,则不可将所述语音样本分割成帧(及子帧)。多个语音帧的丢失(有时称为突发性丢失)可能是在接收装置处感知到的语音质量降级的原因。在所描述实例中,从第一装置发射到第二装置的每一包可取决于特定应用及总设计约束而包括一个或一个以上帧。
数据应用可在电路交换式网络中实施,且具有数据的包可在所述网络上从第一装置发射到第二装置。数据包也可能在数据的发射期间丢失。用以在电路交换式系统中隐蔽数据包中的帧的丢失的常规方式是经由从具有某一衰减的先前帧进行外插来重建所述丢失包的参数。常规系统所使用的包(或帧)丢失隐蔽方案可称为常规包丢失隐蔽(PLC)。外插可包括使用所述先前帧的帧参数或基音波形以重建所述丢失帧。虽然对在包交换式网络中的话音通信的使用(即,因特网协议话音(VoIP))在不断增加,但用于电路交换式网络中的常规PLC也用以在包交换式网络中实施包丢失隐蔽方案。
虽然常规PLC当在稳定有声区域中存在单一帧丢失时相当适用,但其可能不适合于隐蔽转变帧的丢失。另外,常规PLC也可能不适用于突发性帧丢失。然而,在包交换式网络中,归因于如高链路负载及高抖动的各种原因,包丢失可为突发性的。举例来说,三个或三个以上连续包可在包交换式网络中丢失。在此情况下,常规PLC方法可能不够稳健以将相当良好的感知质量提供给用户。
为了在包交换式网络中提供经改善感知质量,可使用增强型包丢失隐蔽方案。此隐蔽方案可称为利用未来帧的增强型PLC算法。所述增强型PLC算法可利用未来帧(存储于去抖动缓冲器中)来内插丢失包的参数中的一些或全部。在一个实例中,所述增强型PLC算法可改善感知到的语音质量而不影响系统容量。下文所描述的本发明的系统及方法可供众多类型的语音编解码器使用。
揭示一种用于重建被擦除语音帧的方法。所述方法可包括从缓冲器接收第二语音帧。所述第二语音帧的索引位置可大于所述被擦除语音帧的索引位置。所述方法也可包括基于所述第二语音帧及一第三语音帧中的一者或其两者而确定使用哪一类型的包丢失隐蔽(PLC)方法。所述第三语音帧的索引位置可小于所述被擦除语音帧的所述索引位置。所述方法也可包括从所述第二语音帧及第三语音帧中的一者或其两者重建所述被擦除语音帧。
揭示一种用于重建被擦除语音帧的无线装置。所述无线装置可包括缓冲器,其经配置以接收语音帧序列。所述无线装置也可包括话音解码器,其经配置以解码所述语音帧序列。所述话音解码器可包括帧擦除隐蔽模块,其经配置以从一个或一个以上帧重建所述被擦除语音帧,所述一个或一个以上帧为以下类型中的一者:后续帧及先前帧。所述后续帧可包括大于所述缓冲器中的所述被擦除语音帧的索引位置的索引位置。所述先前帧可包括小于所述缓冲器中的所述被擦除语音帧的索引位置的索引位置。
揭示一种用于重建被擦除语音帧的设备。所述设备可包括用于从缓冲器接收第二语音帧的装置。所述第二语音帧的索引位置可大于所述被擦除语音帧的索引位置。所述设备也可包括用于基于所述第二语音帧及一第三语音帧中的一者或其两者而确定使用哪一类型的包丢失隐蔽(PLC)方法的装置。所述第三语音帧的索引位置可小于所述被擦除语音帧的所述索引位置。所述设备还可包括用于从所述第二语音帧及所述第三语音帧中的一者或其两者重建所述被擦除语音帧的装置。
揭示一种用于重建被擦除语音帧的计算机程序产品。所述计算机程序产品可包括其上具有指令的计算机可读媒体。所述指令可包括用于从缓冲器接收第二语音帧的代码。所述第二语音帧的索引位置可大于所述被擦除语音帧的索引位置。所述指令也可包括用于基于所述第二语音帧及一第三语音帧中的一者或其两者而确定使用哪一类型的包丢失隐蔽(PLC)方法的代码。所述第三语音帧的索引位置可小于所述被擦除语音帧的所述索引位置。所述指令还可包括用于从所述第二语音帧及所述第三语音帧中的一者或其两者重建所述被擦除语音帧的代码。
图1为说明在一传输媒体上的发射终端102及接收终端104的实例的框图100。发射终端102及接收终端104可为能够支持话音通信的任何装置,包括电话、计算机、音频广播及接收设备、视频会议设备或其类似者。在一个配置中,发射终端102及接收终端104可利用例如码分多址(CDMA)能力等无线多址技术来实施。CDMA是基于展频通信的调制及多址方案。
发射终端102可包括话音编码器106且接收终端104可包括话音解码器108。话音编码器106可用以通过基于人类语音产生模型提取参数来压缩来自第一用户接口110的语音。发射器112可用以跨越传输媒体114发射包括这些参数的包。传输媒体114可为基于包的网络(例如,因特网或企业内部网络)或任何其它传输媒体。位于传输媒体112的另一端处的接收器116可用以接收所述包。话音解码器108可使用所述包中的所述参数合成语音。所述合成语音可提供到接收终端104上的第二用户接口118。尽管未图示,但可在发射器112及接收器116两者中执行各种信号处理功能,例如包括循环冗余检查(CRC)功能的卷积编码、交错、数字调制、展频处理、抖动缓冲等。
通信的每一方可进行发射以及接收。每一终端可包括话音编码器及解码器。所述话音编码器及解码器可为单独装置或可整合到称为“声码器”的单一装置中。在以下详细描述中,将描述终端102、104,其在传输媒体114的一端具有话音编码器106且在另一端具有话音解码器108。
在发射终端102的至少一个配置中,语音可以帧形式从第一用户接口110输入到话音解码器106,其中每一帧经进一步分割成子帧。可在某一块处理执行之处使用这些任意的帧边界。然而,如果实施的是连续处理而非块处理,则不可将所述语音样本分割成帧(及子帧)。在所描述实例中,跨越传输媒体114发射的每一包可取决于特定应用及总设计约束而包括一个或一个以上帧。
话音编码器106可为可变速率或固定速率编码器。可变速率编码器可取决于语音内容而在帧间在多个编码器模式之间动态地切换。话音解码器108也可在帧间在对应解码器模式之间动态地切换。可为每一帧选择一特定模式以实现在维持接收终端104处的可接受信号重现的同时可获得的最低位速率。以实例说明,作用中语音可使用用于作用中语音帧的编码模式来编码。背景噪声可使用用于静寂帧的编码模式来编码。
话音编码器106及解码器108可使用线性预测编码(LPC)。在LPC编码的情况下,语音可通过语音源(声带)来模型化,所述语音源的特征在于其强度及基音。来自声带的语音穿过声道(喉咙及嘴),声道的特征在于其共振,其被称为“共振峰(formant)”。所述LPC话音编码器可通过估计共振峰、从语音移除其效应以及估计残余语音的强度及基音来分析语音。接收端处的LPC话音解码器可通过逆转所述过程来合成语音。特定来说,所述LPC话音解码器可使用残余语音建立语音源、使用共振峰建立滤波器(其表示声道)且使所述语音源穿过所述滤波器以合成所述语音。
图2为接收终端204的框图。在此配置中,VoIP客户端230包括去抖动缓冲器202,将在下文中较全面地论述所述去抖动缓冲器。接收终端204还包括一个或一个以上话音解码器208。在一个实例中,接收终端204可包括基于LPC的解码器及两个其它类型的编解码器(例如,有声语音编码方案及无声语音编码方案)。解码器208可包括帧错误检测器226、帧擦除隐蔽模块206及语音产生器232。话音解码器208可实施为声码器的部分、独立实体,或跨越接收终端204内的一个或一个以上实体而分布。话音解码器208可实施为硬件、固件、软件或其任何组合。以实例说明,话音解码器208可用微处理器、数字信号处理器(DSP)、可编程逻辑、专用硬件或任何其它基于硬件及/或软件的处理实体来实施。将就话音解码器208的功能性在下文对其加以描述。话音解码器的实施方式可视特定应用及强加于整个系统的设计约束而定。
去抖动缓冲器202可为消除由包到达时间的变化所造成的抖动的硬件装置或软件过程,包到达时间的变化是归因于网络拥塞、时序漂移及路由路径改变。去抖动缓冲器202可接收话音包中的语音帧242。另外,去抖动缓冲器202可延迟新到达的包,使得最近到达的包可以正确次序连续地提供到语音产生器232,从而形成几乎没有音频失真的顺畅连接。去抖动缓冲器202可为固定或适应性的。固定去抖动缓冲器可将固定延迟引入到所述包。另一方面,适应性去抖动缓冲器可适应网络延迟的改变。去抖动缓冲器202可将帧信息240提供到帧擦除隐蔽模块206,如下文将论述。
如先前所提及,可通过发射终端102执行各种信号处理功能,例如包括循环冗余检查(CRC)功能的卷积编码、交错、数字调制及展频处理。帧错误检测器226可用以执行所述CRC检查功能。或者或除此之外,可使用其它帧错误检测技术,包括校验和及奇偶位。在一个实例中,帧错误检测器226可确定帧擦除是否已发生。“帧擦除”可意味着所述帧已丢失或恶化。如果帧错误检测器226确定当前帧尚未被擦除,则帧擦除隐蔽模块206可释放过去存储于去抖动缓冲器202中的语音帧242。语音帧242的参数可为传递到帧擦除隐蔽模块206的帧信息240。帧信息240可传达到语音产生器232且由所述语音产生器232加以处理。
另一方面,如果帧错误检测器226确定所述当前帧已被擦除,则所述帧错误检测器可将“帧擦除旗标”提供到帧擦除隐蔽模块206。以稍后将予以较详细描述的方式,帧擦除隐蔽模块206可用以重建所述被擦除帧的话音参数。
可将所述话音参数(从去抖动缓冲器202释放或通过帧擦除隐蔽模块206重建)提供到语音产生器232以产生合成语音244。语音产生器232可包括若干功能以便产生合成语音244。在一个实例中,反向码簿(inverse codebook)212可使用固定码簿参数238。举例来说,反向码簿212可用以将固定码簿索引转换成残余语音且将固定码簿增益应用到所述残余语音。可将基音信息添加(218)回到所述残余语音中。所述基音信息可由基音解码器214根据“延迟”来计算。基音解码器214可为产生语音样本的先前帧的信息的存储器。例如适应性码簿增益的适应性码簿参数236可在被添加(218)到所述残余语音之前由基音解码器214应用到每一子帧中的存储器信息。所述残余语音可使用线频谱对234(例如,来自反变换222的LPC系数)通过滤波器220,以将共振峰添加到所述语音。可接着将原合成语音从滤波器220提供到后滤波器224。后滤波器224可为音频频带中的数字滤波器,其可平滑所述语音且减少带外分量。在另一配置中,有声语音编码方案(例如,PPP)及无声语音编码方案(例如,NELP)可由帧擦除隐蔽模块206实施。
所述帧擦除隐蔽过程的质量随着重建话音参数时的准确度而改善。可在所述帧的语音内容较高时实现所述重建的语音参数的较大准确度。在一个实例中,静寂帧可能不包括语音内容,且因此可能不提供任何话音质量增益。因此,在话音解码器208的至少一个配置中,可在帧速率足够高时使用未来帧中的话音参数以实现话音质量增益。以实例说明,如果先前帧及未来帧是以不同于静寂编码模式的模式编码,则话音解码器208可使用先前帧及未来帧两者中的话音参数来重建被擦除帧中的话音参数。换句话说,将在先前帧及未来帧均以作用中语音编码模式编码时使用增强型包丢失隐蔽。否则,可从先前帧重建被擦除帧中的话音参数。当话音质量增益的可能性低时,此方法降低所述帧擦除隐蔽过程的复杂性。来自帧错误检测器226的“速率决策”(将在下文中较全面地论述)可用以指示帧擦除的先前帧及未来帧的编码模式。在另一配置中,两个或两个以上未来帧可存在于缓冲器中。当两个或两个以上未来帧存在于缓冲器中时,可选择较高速率帧,即使所述较高速率帧距所述被擦除帧比较低速率帧远也是如此。
图3为说明根据本发明的系统及方法的具有增强型包丢失隐蔽(PLC)模块306的接收终端304的一个配置的框图。接收终端304可包括VoIP客户端330及解码器308。VoIP客户端330可包括去抖动缓冲器302,且解码器308可包括增强型PLC模块306。去抖动缓冲器302可缓冲由VoIP客户端330接收到的一个或一个以上语音帧。
在一个实例中,VoIP客户端330接收实时协议(RTP)包。实时协议(RTP)定义用于递送一网络(例如,因特网)的音频及视频的标准化包格式。在一个配置中,VoIP客户端330可将所接收到的RTP包解囊封为语音帧。另外,VoIP客户端330可将去抖动缓冲器302中的语音帧重新排序。此外,VoIP客户端330可将适当语音帧供应到解码器308。在一个配置中,解码器308将对特定语音帧的请求提供到VoIP客户端330。VoIP客户端330也可从解码器308接收许多经解码的脉冲编码调制(PCM)样本312。在一个实例中,VoIP客户端330可使用由所述PCM样本312提供的信息来调整去抖动缓冲器302的行为。
在一个配置中,去抖动缓冲器302存储语音帧。缓冲器302可存储先前语音帧321、当前语音帧322及一个或一个以上未来语音帧310。如先前所提及,VoIP客户端330可无序地接收包。去抖动缓冲器302可用以存储所述包的语音帧且将所述语音帧重新排序成正确次序。如果一语音帧被擦除(例如,帧擦除),则去抖动缓冲器302可包括一个或一个以上未来帧(即,在所述被擦除帧之后出现的帧)。帧可具有与所述帧相关联的索引位置。举例来说,未来帧310可具有比当前帧322高的索引位置。同样地,当前帧322可具有比先前帧321高的索引位置。
如上所提及,解码器308可包括增强型PLC模块306。在一个配置中,解码器308可为非宽带语音编解码器或宽带语音编解码器的解码器。当帧擦除发生且至少一个未来帧310可用时,增强型PLC模块306可使用基于内插的包丢失隐蔽技术重建被擦除帧。如果存在一个以上可用的未来帧310,则可选择较准确的未来帧。在一个配置中,未来帧的较高准确度可由较高位速率来指示。或者,未来帧的较高准确度可由所述帧的时间紧密度来指示。在一个实例中,在一语音帧被擦除后,所述帧可不包括有意义数据。举例来说,当前帧322可表示被擦除语音帧。可将帧322视为被擦除帧,因为帧322可不包括使解码器308能够正确解码帧322的数据。当帧擦除发生且缓冲器302中至少一个未来帧310可用时,VoIP客户端330可将未来帧310及任何相关信息发送到解码器308。所述相关信息可为包括无意义数据的当前帧322。所述相关信息也可包括当前被擦除帧与可用未来帧之间的相对间隙。在一个实例中,增强型PLC模块306可使用未来帧310来重建当前帧322。可将语音帧作为PCM数据320传达到音频接口318。
在不具有增强型PLC能力的系统中,VoIP客户端330可通过发送当前帧322、当前帧322的速率及其它相关信息(例如,是否进行相位匹配及是否及如何进行时间扭曲)而与语音解码器308介接。当擦除发生时,在将当前帧322发送到解码器308时,可将当前帧322的速率设定为一特定值,例如帧擦除。在具备增强型PLC功能性能力的情况下,VoIP客户端330也可将未来帧310、未来帧310的速率及间隙指示符(在下文中进一步描述)发送到解码器308。
图4为说明用于使用未来帧重建语音帧的方法400的一个实例的流程图。方法400可由增强型PLC模块206实施。在一个配置中,可接收指示符(402)。所述指示符可指示第一帧的索引位置与第二帧的索引位置之间的差。举例来说,所述第一帧可具有索引位置“4”,且所述第二帧可具有索引位置“7”。根据此实例,所述指示符可为“3”。
在一个实例中,可接收所述第二帧(404)。所述第二帧可具有大于所述第一帧的索引位置。换句话说,所述第二帧可在所述第一帧的重放之后的时间重放。另外,可接收所述第二帧的帧速率(406)。所述帧速率可指示编码器用以编码所述第二帧的速率。关于所述帧速率的更多细节将在下文中论述。
在一个配置中,可内插所述第一帧的参数(408)。可使用所述第二帧的参数及第三帧的参数来内插所述参数。所述第三帧可包括小于所述第一帧及所述第二帧的索引位置。换句话说,因为所述第三帧是在所述当前帧及未来帧的重放之前重放,所以可将所述第三帧视为“先前帧”。
上文所描述的图4的方法可由对应于图5中所说明的手段加功能块的各种硬件及/或软件组件及/或模块来执行。换句话说,图4中所说明的块402到408对应于图5中所说明的手段加功能块502到508。
图6为说明用于隐蔽包内的语音帧的丢失的方法600的另一配置的流程图。所述方法可由接收终端104的解码器608内的增强型PLC模块606实施。当前帧速率612可由解码器608接收。可关于当前帧速率612是否包括一特定值进行确定602,所述特定值指示当前帧620被擦除。在一个实例中,可关于当前帧速率612是否等于帧擦除值而进行确定602。如果确定(602)当前帧速率612不等于帧擦除,则将当前帧620传达到解码模块618。解码模块618可解码当前帧620。
然而,如果当前帧速率612表明当前帧被擦除,则将间隙指示符622传达到解码器608。间隙指示符622可为指示未来帧610及当前帧620(即,所述被擦除帧)的帧索引之间的差的变量。举例来说,如果当前被擦除帧620是包中的第100个帧且未来帧610是所述包中的第103个帧,则间隙指示符622可等于3。可关于间隙指示符622是否大于一特定阈值进行确定604。如果间隙指示符622不大于所述特定阈值,则这可暗示去抖动缓冲器202中无未来帧可用。常规PLC模块614可用以使用上文所提及的技术来重建当前帧620。
在一个实例中,如果间隙指示符622大于零,则这可暗示去抖动缓冲器202中有未来帧610可用。如先前所提及,未来帧610可用以重建当前帧620的被擦除参数。未来帧610可从去抖动缓冲器202(未图示)传递到增强型PLC模块606。另外,与未来帧610相关联的未来帧速率616也可传递到增强型PLC模块606。未来帧速率616可指示未来帧610的速率或帧类型。举例来说,未来帧速率616可指示所述未来帧是使用用于作用中语音帧的编码模式加以编码。增强型PLC模块606可使用未来帧610及先前帧来重建当前帧620的被擦除参数。一帧可为先前帧,因为索引位置可小于当前帧620的索引位置。换句话说,先前帧是在当前帧620之前从去抖动缓冲器202释放。
图7为说明用于隐蔽包内的语音帧的丢失的方法700的另一实例的流程图。在一个实例中,当前被擦除帧可为包内的第n个帧。未来帧710可为第(n+m)个帧。指示当前被擦除帧及未来帧710的索引位置之间的差的间隙指示符708可为m。在一个配置中,可在先前帧(第(n-1)个帧)与未来帧710(即,第(n+m)个帧)之间执行用以重建所述被擦除的第n个帧的内插。
在一个实例中,关于未来帧710是否包括“不良速率”进行确定702。可对未来帧710执行不良速率检测以避免发射期间的数据恶化。如果确定未来帧710未通过不良速率检测确定702,则可使用常规PLC模块714重建被擦除帧的参数。常规PLC模块714可实施先前所描述的现有技术以重建被擦除帧。
如果未来帧710通过不良速率检测确定702,则可通过解量化模块706来解量化未来帧中的参数。在一个配置中,未由增强型PLC模块使用以重建被擦除帧的参数可能未被解量化。举例来说,如果未来帧710是码激励线性预测(CELP)帧,则固定码簿索引可能未被增强型PLC模块使用。因而,所述固定码簿索引可能未被解量化。
对于包括增强型PLC模块306的解码器108,可能存在可在帧擦除发生时实施的不同类型的包丢失隐蔽方法。这些不同方法的实例可包括:1)常规PLC方法;2)用以确定频谱包络参数的方法,例如线频谱对(LSP)增强的PLC方法、线性预测系数(LPC)方法、导抗谱频率(ISF)方法等;3)CELP增强的PLC方法以及4)用于有声编码模式的增强型PLC方法。
在一个实例中,所述频谱包络参数增强的PLC方法包括内插被擦除帧的频谱包络参数。其它参数可通过外插来估计,如通过常规PLC方法所执行。在CELP增强的PLC方法中,遗漏帧的激励相关参数中的一些或全部也可使用内插算法而估计为CELP帧。类似地,在有声语音编码方案增强的PLC方法中,被擦除帧的激励相关参数中的一些或全部也可使用内插算法估计为有声语音编码方案帧。在一个配置中,CELP增强的PLC方法及有声语音编码方案增强的PLC方法可称为“多个参数增强的PLC方法”。通常,所述多个参数增强的PLC方法包括内插激励相关参数及/或频谱包络参数中的一些或全部。
在解量化未来帧710的参数之后,可关于是否实施多个参数增强的PLC方法进行确定732。确定732用以避免令人困扰的假象。可基于先前帧及未来帧两者的类型及速率进行确定732。也可基于先前帧与未来帧之间的相似性进行确定732。可基于帧的频谱包络参数、其基音延滞或波形来计算相似性指示符。
多个参数增强的PLC方法的可靠性可视短语音片段在帧之间的稳定性而定。举例来说,未来帧710及先前帧720应足够类似以经由多个参数增强的PLC方法提供可靠的重建帧。未来帧710的LPC增益与先前帧720的LPC增益之比可为对所述两个帧之间的相似性的良好度量。如果所述LPC增益比过小或过大,则使用多个参数增强的PLC方法可导致重建帧具有假象。
在一个实例中,帧中的无声区域本质上倾向于为随机的。因而,基于增强型PLC的方法可导致产生嗡嗡声的重建帧。因此,在先前帧720为无声帧的状况下,不可使用多个参数增强的PLC方法(CELP增强的PLC及有声语音编码方案增强的PLC)。在一个配置中,一些准则可用以决定帧的特性,即,帧是有声帧还是无声帧。用以对帧进行分类的准则包括帧类型、帧速率、第一反射系数、过零率等。
当先前帧720及未来帧710不够类似,或先前帧720为无声帧时,不可使用多个参数增强的PLC方法。在这些状况下,可使用常规PLC方法或频谱包络参数增强的PLC方法。这些方法可(分别)由常规PLC模块714及频谱包络参数增强的PLC模块(例如,LSP增强的PLC模块704)实施。当未来帧的LPC增益与先前帧的LPC增益之比非常小时,可选择频谱包络参数增强的PLC方法。在这些情况下使用常规PLC方法可在被擦除帧与随后的良好帧的边界处产生弹跳的假象。
如果确定(732)多个参数增强的PLC方法可用以重建被擦除帧的参数,则可关于应使用哪一类型的增强型PLC方法(CELP增强的PLC或有声语音编码方案增强的PLC)进行确定722。对于常规PLC方法及频谱包络参数增强的PLC方法,重建帧的帧类型与所述重建帧之前的先前帧相同。然而,对于多个参数增强的PLC方法,情况并不总是这样。在先前系统中,用于隐蔽当前被擦除帧的编码模式与先前帧的编码模式相同。然而,在当前系统及方法中,用于被擦除帧的编码模式/类型可不同于先前帧及未来帧的编码模式/类型。
当未来帧710不准确(即,低速率编码模式)时,未来帧710可能不提供有用信息以实现增强型PLC方法。因此,当未来帧710为低准确度帧时,不可使用增强型PLC。实际上,可使用常规PLC技术来隐蔽帧擦除。
当当前被擦除帧之前的先前帧720为稳定的有声帧时,这可意味着先前帧720位于稳定话音区中。因此,常规PLC算法可积极地尝试重建遗漏帧。常规PLC可产生嗡嗡声的假象。因此,当先前帧720为稳定的有声帧且未来帧710为CELP帧或无声语音编码帧时,可将增强型PLC算法用于帧擦除。接着,可使用CELP增强的PLC算法以避免嗡嗡声的假象。CELP增强的PLC算法可由CELP增强的PLC模块724实施。
当未来帧710是作用中语音原型基音周期(FPPP)帧时,可使用有声语音编码方案增强的PLC算法。有声语音编码方案增强的PLC算法可由有声语音编码方案增强的PLC模块726(例如,原型基音周期(PPP)增强的PLC模块)实施。
在一个配置中,未来帧可用以进行反向外插。举例来说,如果擦除在无声语音编码帧之前发生,则可从未来无声语音编码帧估计参数。这不同于从当前被擦除帧之前的帧估计所述参数的常规PLC。
CELP增强的PLC模块724可将遗漏帧视为CELP帧。在CELP增强的PLC方法中,可通过在先前帧(帧(n-1))与未来帧(帧(n+m))之间内插来估计当前被擦除帧(帧n)的频谱包络参数、延迟、适应性码簿(ACB)增益及固定码簿(FCB)增益。固定码簿索引可随机地产生,接着,可基于这些估计值重建当前被擦除帧。
当未来帧710是作用中语音码激励线性预测(FCELP)帧时,未来帧710可包括差量延迟(delta-delay)字段,可从所述字段确定未来帧710之前的帧(即,帧(n+m-1))的基音延滞。可通过在第(n-1)个帧及第(n+m-1)个帧的延迟值之间内插来估计当前被擦除帧的延迟。可检测到基音倍增/增到三倍且可在延迟值的内插之前加以处置。
当先前帧720/未来帧710为有声语音编码帧或无声语音编码帧时,例如适应性码簿增益及固定码簿增益等参数可不呈现。在这些状况下,可产生这些参数的一些人为值。对于无声语音编码帧,可将ACB增益及FCB增益设定为零。对于有声语音编码帧,可将FCB增益设定为零,且可基于先前帧之前的帧与先前帧之间的残值域中的基音循环波形能量之比来确定ACB增益。举例来说,如果先前帧并非CELP帧,但使用CELP模式隐蔽当前被擦除帧,则即使所述先前帧并非CELP帧,也可使用一模块从所述先前帧的参数来估计acb_gain。
对于任何编码方法,为了进行增强型PLC,可基于先前帧及未来帧来内插参数。可计算相似性指示符以表示先前帧与未来帧之间的相似性。如果所述指示符低于某一阈值(即,并不非常类似),则一些参数不可根据增强型PLC来估计。实际上,可使用常规PLC。
当CELP帧与无声语音编码帧之间存在一个或一个以上擦除时,归因于CELP擦除处理期间的衰减,最后被隐蔽的帧的能量可能非常低。这可导致最后被隐蔽的帧与随后的良好无声语音编码帧之间的能量不连续性。如先前所提及,无声语音解码方案可用以隐蔽此最后被擦除帧。
在一个配置中,可将被擦除帧视为无声语音编码帧。可从未来无声语音编码帧复制参数。除了对重建的残余信号进行平滑操作外,解码可与常规无声语音解码相同。所述平滑是基于先前CELP帧中的残余信号的能量及当前帧中的残余信号的能量来完成,以实现能量连续性。
在一个配置中,可将间隙指示符708提供到内插因子(IF)计算器730。IF 729可计算为:
被擦除帧n的参数可从先前帧(n-1)及未来帧710(n+m)的参数内插。被擦除参数P可内插为:
Pn=(1-IF)*Pn-1+IF*Pn+m 等式2
实施宽带语音编解码器中的增强型PLC方法可为实施非宽带语音编解码器中的增强型PLC方法的扩展。宽带语音编解码器的低频带中的增强型PLC处理可与非宽带语音编解码器中的增强型PLC处理相同。对于宽带语音编解码器中的高频带参数,可应用以下原则:当低频带参数是通过多个参数增强的PLC方法(即,CELP增强的PLC或有声语音编码方案增强的PLC)估计时,可通过内插来估计高频带参数。
当帧擦除发生且缓冲器202中存在至少一个未来帧时,去抖动缓冲器202可负责决定是否发送未来帧。在一个配置中,当缓冲器中的第一未来帧并非静寂帧时且当间隙指示符708小于或等于一特定值时,去抖动缓冲器202会将第一未来帧发送到解码器108。举例来说,所述特定值可为“4”。然而,在先前帧720是通过常规PLC方法重建且先前帧720为一行中的第二常规PLC帧的情况下,去抖动缓冲器202可在间隙指示符小于或等于一特定值的情况下发送未来帧710。举例来说,所述特定值可为“2”。另外,在先前帧720是通过常规PLC方法重建且先前帧720为一行中的至少第三常规PLC帧的情况下,缓冲器202可不将未来帧710供应到解码器。
在一个实例中,如果缓冲器202中存在一个以上帧,则可将第一未来帧发送到解码器108以供在增强型PLC方法期间使用。当两个或两个以上未来帧存在于所述缓冲器中时,可选择较高速率帧,即使所述较高速率帧距被擦除帧比较低速率帧远也是如此。或者,当两个或两个以上未来帧存在于缓冲器中时,可将时间上最接近被擦除帧的帧发送到解码器108而不管时间上最接近的帧是否是速率比另一未来帧低的帧。
图8说明可用于无线装置802中的各种组件。无线装置802是可经配置以实施本文中所描述的各种方法的装置的实例。无线装置802可为远程台。
无线装置802可包括处理器804,所述处理器控制无线装置802的操作。处理器804也可称为中央处理单元(CPU)。可包括只读存储器(ROM)及随机存取存储器(RAM)两者的存储器806将指令及数据提供到处理器804。存储器806的一部分也可包括非易失性随机存取存储器(NVRAM)。处理器804通常基于存储于存储器806内的程序指令而执行逻辑及算术运算。存储器806中的指令可执行以实施本文中所描述的方法。
无线装置802还可包括外壳808,所述外壳可包括发射器810及接收器812以允许数据在无线装置802与远程位置之间的发射及接收。发射器810与接收器812可组合成收发器814。天线816可附接到外壳808且电耦合到收发器814。无线装置802还可包括(未图示)多个发射器、多个接收器、多个收发器及/或多个天线。
无线装置802还可包括信号检测器818,所述信号检测器可用以检测并量化由收发器814接收的信号的电平。信号检测器818可将这些信号检测为总能量、每伪噪声(PN)码片的导频能量、功率谱密度及其它信号。无线装置802还可包括数字信号处理器(DSP)820以用于处理信号。
无线装置802的各种组件可通过总线系统822耦合在一起,除数据总线外,总线系统822还可包括功率总线、控制信号总线及状态信号总线。然而,为清楚起见,在图8中将各种总线说明为总线系统822。
如本文中使用,术语“确定”涵盖广泛多种动作,且因此,“确定”可包括推算、计算、处理、导出、调查、查找(例如,在表中、数据库中或另一数据结构中查找)、确认及类似动作。又,“确定”可包括接收(例如,接收信息)、存取(例如,存取存储器中的数据)及类似动作。又,“确定”可包括解析、选择、选取、建立及类似动作。
除非另外明确规定,否则短语“基于”不意味着“仅基于”。换句话说,短语“基于”描述“仅基于”及“至少基于”两者。
结合本发明描述的各种说明性逻辑块、模块及电路可通过下列各者实施或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列信号(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件,或其经设计以执行本文中所描述的功能的任何组合。通用处理器可为微处理器,但在替代例中,处理器可为任何市售的处理器、控制器、微控制器或状态机。处理器也可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器,或任何其它此配置。
结合本发明描述的方法或算法的步骤可直接体现于硬件中、由处理器执行的软件模块中或硬件与软件模块的组合中。软件模块可驻留于此项技术中已知的任何形式的存储媒体中。可使用的存储媒体的一些实例包括RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸式盘、CD-ROM等。软件模块可包含单一指令或许多指令,且可分布于若干不同码段上、分布于不同程序中及跨越多个存储媒体而分布。存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息及将信息写入到存储媒体。在替代例中,存储媒体可与处理器成一体式。
本文中所揭示的方法包含用于实现所描述方法的一个或一个以上步骤或动作。所述方法步骤及/或动作可彼此互换而不脱离权利要求书的范围。换句话说,除非指定步骤或动作的特定次序,否则可修改特定步骤及/或动作的次序及/或使用而不脱离权利要求书的范围。
所描述功能可以硬件、软件、固件或其任何组合实施。如果以软件实施,则所述功能可作为一个或一个以上指令而存储于计算机可读媒体上。计算机可读媒体可为可由计算机存取的任何可用媒体。作为实例而非限制,计算机可读媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以载运或存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。如本文中使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字通用光盘(DVD)、软性磁盘及Blu-ray光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。
软件或指令也可经由传输媒体传输。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波的无线技术而从网站、服务器或其它远程源传输软件,则同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波的无线技术包括于传输媒体的定义中。
另外,应了解,用于执行本文中所描述的方法及技术(例如,通过图4到图7所说明的方法及技术)的模块及/或其它适当装置可在适用时由移动装置及/或基站下载及/或以其它方式获得。举例来说,此装置可耦合到服务器以促进用于执行本文中所描述的方法的装置的转移。或者,本文中所描述的各种方法可经由存储装置(例如,随机存取存储器(RAM)、只读存储器(ROM)、例如压缩光盘(CD)或软性磁盘的物理存储媒体等)提供,以使得移动装置及/或基站可在将存储装置耦合或提供到所述装置时获得各种方法。此外,可利用用于将本文中所描述的方法及技术提供到装置的任何其它合适技术。
应理解,权利要求书不限于上文所说明的精确配置及组件。可对本文中所描述的系统、方法及设备的布置、操作及细节方面做出各种修改、改变及变化而不脱离权利要求书的范围。
Claims (34)
1.一种用于重建被擦除语音帧的方法,其包含:
从缓冲器接收第二语音帧,其中所述第二语音帧的索引位置大于所述被擦除语音帧的索引位置;
基于所述第二语音帧及第三语音帧中的一者或其两者而确定使用哪一类型的包丢失隐蔽PLC方法,其中所述第三语音帧的索引位置小于所述被擦除语音帧的所述索引位置;及
从所述第二语音帧及所述第三语音帧中的一者或其两者重建所述被擦除语音帧。
2.根据权利要求1所述的方法,其进一步包含接收指示符,其中所述指示符指示所述被擦除语音帧的所述索引位置与所述第二语音帧的所述索引位置之间的差。
3.根据权利要求1所述的方法,其进一步包含接收与所述第二语音帧相关联的帧速率及帧类型。
4.根据权利要求1所述的方法,其进一步包含使用所述第二语音帧的参数及所述第三语音帧的参数来内插所述被擦除语音帧的参数。
5.根据权利要求1所述的方法,其进一步包含检测所述被擦除语音帧。
6.根据权利要求2所述的方法,其进一步包含比较所述指示符与阈值。
7.根据权利要求2所述的方法,其进一步包含根据所述指示符计算内插因子。
9.根据权利要求1所述的方法,其进一步包含选择多种技术中的一者来重建所述被擦除语音帧。
10.根据权利要求9所述的方法,其中所述被擦除语音帧为码激励线性预测CELP帧。
11.根据权利要求9所述的方法,其中所述被擦除语音帧为原型基音周期PPP帧。
12.根据权利要求1所述的方法,其中所述缓冲器包含一个以上语音帧,其中所述语音帧中的一些语音帧的所述索引位置大于所述被擦除语音帧的所述索引位置且其它语音帧的所述索引位置小于所述被擦除语音帧的所述索引位置。
13.根据权利要求12所述的方法,其进一步包含选择所述缓冲器内的所述语音帧中的一者,其中基于所述语音帧的编码速率、编码类型或时间紧密性而选择所述语音帧。
14.根据权利要求12所述的方法,其进一步包含选择所述缓冲器内的所述语音帧中的一者,其中基于所述缓冲器中的所述帧的大小而选择所述语音帧。
15.根据权利要求1所述的方法,其进一步包含应用不良速率检查以验证所述第二语音帧的完整性。
16.根据权利要求1所述的方法,其中所述第三语音帧的帧类型不同于所述第二语音帧的帧类型。
17.根据权利要求1所述的方法,其进一步包含确定是实施增强型包丢失隐蔽算法还是实施常规包丢失隐蔽算法。
18.根据权利要求17所述的方法,其中实施增强型包丢失隐蔽算法,且所述方法进一步包含确定是否从所述增强型包丢失隐蔽算法产生假象。
19.根据权利要求17所述的方法,其中所述确定是基于所述第二语音帧及所述第三语音帧中的一者或其两者的帧速率及帧类型。
20.根据权利要求17所述的方法,其中所述确定是基于所述第二语音帧与所述第三语音帧的相似性。
21.根据权利要求20所述的方法,其进一步包含基于频谱包络估计或基音波形来计算所述相似性。
22.根据权利要求1所述的方法,其进一步包含基于所述第二语音帧及所述第三语音帧的特性来选择内插因子。
23.根据权利要求1所述的方法,其进一步包含使用反向外插来估计所述被擦除语音帧的参数。
24.根据权利要求23所述的方法,其进一步包含基于所述第二语音帧及所述第三语音帧的帧类型及特性来确定是否使用反向外插。
25.根据权利要求1所述的方法,其进一步包含内插所述第二帧的所述参数的一部分以重建所述被擦除语音帧。
26.一种用于重建被擦除语音帧的无线装置,其包含:
缓冲器,其经配置以接收语音帧序列;
话音解码器,其经配置以解码所述语音帧序列,其中所述话音解码器包含:
帧擦除隐蔽模块,其经配置以从一个或一个以上帧重建所述被擦除语音帧,所述一个或一个以上帧为以下类型中的一者:后续帧及先前帧,其中所述后续帧包含大于所述缓冲器中的所述被擦除语音帧的索引位置的索引位置,且所述先前帧包含小于所述缓冲器中的所述被擦除语音帧的所述索引位置的索引位置。
27.根据权利要求26所述的无线装置,其中所述帧擦除隐蔽模块经进一步配置以使用所述一个或一个以上后续帧的参数及所述一个或一个以上先前帧的参数来内插所述被擦除语音帧的参数。
28.根据权利要求26所述的无线装置,其中所述话音解码器经进一步配置以检测所述被擦除语音帧。
29.根据权利要求26所述的无线装置,其中所述帧擦除隐蔽模块经进一步配置以接收指示符,其中所述指示符指示所述缓冲器内的所述被擦除语音帧的所述索引位置与第二语音帧的所述索引位置之间的差。
30.根据权利要求29所述的无线装置,其中所述帧擦除隐蔽模块经进一步配置以确定所述指示符是否超过阈值。
31.根据权利要求29所述的无线装置,其中所述帧擦除隐蔽模块经进一步配置以根据所述指示符计算内插因子。
32.根据权利要求26所述的无线装置,其中所述无线装置为手持机。
33.一种用于重建被擦除语音帧的设备,其包含:
用于从缓冲器接收第二语音帧的装置,其中所述第二语音帧的索引位置大于所述被擦除语音帧的索引位置;
用于基于所述第二语音帧及第三语音帧中的一者或其两者而确定使用哪一类型的包丢失隐蔽PLC方法的装置,其中所述第三语音帧的索引位置小于所述被擦除语音帧的所述索引位置;及
用于从所述第二语音帧及所述第三语音帧中的一者或其两者重建所述被擦除语音帧的装置。
34.一种用于重建被擦除语音帧的计算机程序产品,所述计算机程序产品包含其上具有指令的计算机可读媒体,所述指令包含:
用于从缓冲器接收第二语音帧的代码,其中所述第二语音帧的索引位置大于所述被擦除语音帧的索引位置;
用于基于所述第二语音帧及第三语音帧中的一者或其两者而确定使用哪一类型的包丢失隐蔽PLC方法的代码,其中所述第三语音帧的索引位置小于所述被擦除语音帧的所述索引位置;及
用于从所述第二语音帧及所述第三语音帧中的一者或其两者重建所述被擦除语音帧的代码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/478,460 US8428938B2 (en) | 2009-06-04 | 2009-06-04 | Systems and methods for reconstructing an erased speech frame |
US12/478,460 | 2009-06-04 | ||
PCT/US2010/037302 WO2010141755A1 (en) | 2009-06-04 | 2010-06-03 | Systems and methods for reconstructing an erased speech frame |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102449690A true CN102449690A (zh) | 2012-05-09 |
CN102449690B CN102449690B (zh) | 2014-05-07 |
Family
ID=42558205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080023265.3A Active CN102449690B (zh) | 2009-06-04 | 2010-06-03 | 用于重建被擦除语音帧的系统与方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8428938B2 (zh) |
EP (1) | EP2438592B1 (zh) |
JP (1) | JP5405659B2 (zh) |
KR (1) | KR101290425B1 (zh) |
CN (1) | CN102449690B (zh) |
ES (1) | ES2401171T3 (zh) |
TW (1) | TWI436349B (zh) |
WO (1) | WO2010141755A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105431898A (zh) * | 2013-06-21 | 2016-03-23 | 弗朗霍夫应用科学研究促进协会 | 具有带有能量调整模块的频宽扩展模块的音频解码器 |
CN105453173A (zh) * | 2013-06-21 | 2016-03-30 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
CN105594148A (zh) * | 2013-10-11 | 2016-05-18 | 高通股份有限公司 | 传送冗余帧信息的系统和方法 |
CN107818789A (zh) * | 2013-07-16 | 2018-03-20 | 华为技术有限公司 | 解码方法和解码装置 |
WO2019000178A1 (zh) * | 2017-06-26 | 2019-01-03 | 华为技术有限公司 | 一种丢帧补偿方法及设备 |
US10381011B2 (en) | 2013-06-21 | 2019-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved concealment of the adaptive codebook in a CELP-like concealment employing improved pitch lag estimation |
CN112216288A (zh) * | 2014-07-28 | 2021-01-12 | 三星电子株式会社 | 用于音频信号的时域数据包丢失隐藏的方法 |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20120032444A (ko) * | 2010-09-28 | 2012-04-05 | 한국전자통신연구원 | 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치 |
US9026434B2 (en) * | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
CN103886863A (zh) | 2012-12-20 | 2014-06-25 | 杜比实验室特许公司 | 音频处理设备及音频处理方法 |
US9336789B2 (en) * | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
FR3004876A1 (fr) * | 2013-04-18 | 2014-10-24 | France Telecom | Correction de perte de trame par injection de bruit pondere. |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
RU2643646C2 (ru) | 2013-11-13 | 2018-02-02 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодер для кодирования аудиосигнала, система передачи аудио и способ определения значений коррекции |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US10157620B2 (en) * | 2014-03-04 | 2018-12-18 | Interactive Intelligence Group, Inc. | System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation |
CN107369453B (zh) * | 2014-03-21 | 2021-04-20 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN106683681B (zh) * | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9680507B2 (en) | 2014-07-22 | 2017-06-13 | Qualcomm Incorporated | Offset selection for error correction data |
CN108011686B (zh) * | 2016-10-31 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 信息编码帧丢失恢复方法和装置 |
US10217466B2 (en) * | 2017-04-26 | 2019-02-26 | Cisco Technology, Inc. | Voice data compensation with machine learning |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3948856A4 (en) * | 2019-03-25 | 2022-03-30 | Razer (Asia-Pacific) Pte. Ltd. | METHOD AND APPARATUS FOR USING AN INCREMENTAL SEARCH SEQUENCE IN AUDIO ERROR HIDING |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060173687A1 (en) * | 2005-01-31 | 2006-08-03 | Spindola Serafin D | Frame erasure concealment in voice communications |
EP1746580A1 (en) * | 2004-05-10 | 2007-01-24 | Nippon Telegraph and Telephone Corporation | Acoustic signal packet communication method, transmission method, reception method, and device and program thereof |
CN101000768A (zh) * | 2006-06-21 | 2007-07-18 | 北京工业大学 | 嵌入式语音编解码的方法及编解码器 |
CN101155140A (zh) * | 2006-10-01 | 2008-04-02 | 华为技术有限公司 | 音频流错误隐藏的方法、装置和系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
WO2008056775A1 (fr) * | 2006-11-10 | 2008-05-15 | Panasonic Corporation | Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre |
US8000961B2 (en) * | 2006-12-26 | 2011-08-16 | Yang Gao | Gain quantization system for speech coding to improve packet loss concealment |
-
2009
- 2009-06-04 US US12/478,460 patent/US8428938B2/en active Active
-
2010
- 2010-06-03 JP JP2012514141A patent/JP5405659B2/ja active Active
- 2010-06-03 ES ES10723888T patent/ES2401171T3/es active Active
- 2010-06-03 KR KR1020127000187A patent/KR101290425B1/ko active IP Right Grant
- 2010-06-03 EP EP10723888A patent/EP2438592B1/en active Active
- 2010-06-03 CN CN201080023265.3A patent/CN102449690B/zh active Active
- 2010-06-03 WO PCT/US2010/037302 patent/WO2010141755A1/en active Application Filing
- 2010-06-04 TW TW099118249A patent/TWI436349B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1746580A1 (en) * | 2004-05-10 | 2007-01-24 | Nippon Telegraph and Telephone Corporation | Acoustic signal packet communication method, transmission method, reception method, and device and program thereof |
US20060173687A1 (en) * | 2005-01-31 | 2006-08-03 | Spindola Serafin D | Frame erasure concealment in voice communications |
CN101000768A (zh) * | 2006-06-21 | 2007-07-18 | 北京工业大学 | 嵌入式语音编解码的方法及编解码器 |
CN101155140A (zh) * | 2006-10-01 | 2008-04-02 | 华为技术有限公司 | 音频流错误隐藏的方法、装置和系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10643624B2 (en) | 2013-06-21 | 2020-05-05 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
CN105431898B (zh) * | 2013-06-21 | 2019-09-06 | 弗朗霍夫应用科学研究促进协会 | 具有带有能量调整模块的频宽扩展模块的音频解码器 |
US11410663B2 (en) | 2013-06-21 | 2022-08-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation |
US10381011B2 (en) | 2013-06-21 | 2019-08-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improved concealment of the adaptive codebook in a CELP-like concealment employing improved pitch lag estimation |
CN105431898A (zh) * | 2013-06-21 | 2016-03-23 | 弗朗霍夫应用科学研究促进协会 | 具有带有能量调整模块的频宽扩展模块的音频解码器 |
CN105453173B (zh) * | 2013-06-21 | 2019-08-06 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
CN105453173A (zh) * | 2013-06-21 | 2016-03-30 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
US10741186B2 (en) | 2013-07-16 | 2020-08-11 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
CN107818789A (zh) * | 2013-07-16 | 2018-03-20 | 华为技术有限公司 | 解码方法和解码装置 |
CN107818789B (zh) * | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
CN105594148A (zh) * | 2013-10-11 | 2016-05-18 | 高通股份有限公司 | 传送冗余帧信息的系统和方法 |
CN112216288A (zh) * | 2014-07-28 | 2021-01-12 | 三星电子株式会社 | 用于音频信号的时域数据包丢失隐藏的方法 |
CN109496333A (zh) * | 2017-06-26 | 2019-03-19 | 华为技术有限公司 | 一种丢帧补偿方法及设备 |
WO2019000178A1 (zh) * | 2017-06-26 | 2019-01-03 | 华为技术有限公司 | 一种丢帧补偿方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
US20100312553A1 (en) | 2010-12-09 |
EP2438592B1 (en) | 2013-02-13 |
KR20120019503A (ko) | 2012-03-06 |
JP5405659B2 (ja) | 2014-02-05 |
EP2438592A1 (en) | 2012-04-11 |
TW201126510A (en) | 2011-08-01 |
US8428938B2 (en) | 2013-04-23 |
ES2401171T3 (es) | 2013-04-17 |
TWI436349B (zh) | 2014-05-01 |
KR101290425B1 (ko) | 2013-07-29 |
CN102449690B (zh) | 2014-05-07 |
WO2010141755A1 (en) | 2010-12-09 |
JP2012529082A (ja) | 2012-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102449690B (zh) | 用于重建被擦除语音帧的系统与方法 | |
JP5587405B2 (ja) | スピーチフレーム内の情報のロスを防ぐためのシステムおよび方法 | |
AU2006252972B2 (en) | Robust decoder | |
CA2658560C (en) | Systems and methods for modifying a window with a frame associated with an audio signal | |
EP2026330B1 (en) | Device and method for lost frame concealment | |
US7711554B2 (en) | Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded | |
JP3722366B2 (ja) | パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム | |
Gueham et al. | Packet loss concealment method based on interpolation in packet voice coding | |
US20120087231A1 (en) | Packet Loss Recovery Method and Device for Voice Over Internet Protocol | |
Li et al. | Comparison and optimization of packet loss recovery methods based on AMR-WB for VoIP | |
Tosun et al. | Dynamically adding redundancy for improved error concealment in packet voice coding | |
LECOMTE et al. | Packet loss and concealment | |
Serizawa et al. | A packet loss recovery method using packets arrived behind the playout time for CELP decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |