TWI436349B - 用於重建一被抹除語音訊框之系統與方法 - Google Patents

用於重建一被抹除語音訊框之系統與方法 Download PDF

Info

Publication number
TWI436349B
TWI436349B TW099118249A TW99118249A TWI436349B TW I436349 B TWI436349 B TW I436349B TW 099118249 A TW099118249 A TW 099118249A TW 99118249 A TW99118249 A TW 99118249A TW I436349 B TWI436349 B TW I436349B
Authority
TW
Taiwan
Prior art keywords
frame
voice
erased
voice frame
index position
Prior art date
Application number
TW099118249A
Other languages
English (en)
Other versions
TW201126510A (en
Inventor
Zheng Fang
Daniel J Sinder
Ananthapadmanabhan Arasanipalai Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201126510A publication Critical patent/TW201126510A/zh
Application granted granted Critical
Publication of TWI436349B publication Critical patent/TWI436349B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)

Description

用於重建一被抹除語音訊框之系統與方法
本發明之系統及方法係關於通信及無線相關技術。詳言之,本發明之系統及方法係關於用於重建一被抹除語音訊框之系統及方法。
數位話音通信已在電路交換式網路上執行。電路交換式網路為一實體路徑係在一呼叫之持續期間建立於兩個終端機之間的網路。在電路交換式應用中,一傳輸終端機在該實體路徑上將含有話音資訊之封包之一序列發送至接收終端機。該接收終端機使用該等封包中所含之該話音資訊來合成語音。
數位話音通信已開始在封包交換式網路上執行。封包交換式網路為封包係基於一目的地位址而經由該網路來投送的網路。關於封包交換式通信,路由器個別地判定用於每一封包之一路徑,從而沿著任何可用路徑向下發送封包以達到其目的地。結果,該等封包並不在相同時間或以相同次序到達該接收終端機。一去抖動緩衝器可用於該接收終端機中以按次序放回該等封包且使該等封包以一連續順序方式播出。
在一些情況下,封包在自該傳輸終端機至該接收終端機之轉變中丟失。丟失的封包可使該合成語音之品質降級。因而,可藉由提供用於重建一丟失封包之系統及方法來實現益處。
話音應用可在一封包交換式網路中實施。具有話音資訊之封包可在該網路上自一第一器件傳輸至一第二器件。然而,該等封包中之一些可能在該等封包之傳輸期間丟失。在一組態中,話音資訊(亦即,語音)可以語音訊框來組織。一封包可包括一或多個語音訊框。每一語音訊框可進一步分割成子訊框。可在某一區塊處理執行之處使用此等任意訊框邊界。然而,若實施的是連續處理而非區塊處理,則可能不將該等語音樣本分割成訊框(及子訊框)。多個語音訊框之丟失(有時稱為叢發性丟失)可能為在一接收器件處感知到之語音品質降級的原因。在所描述實例中,自該第一器件傳輸至該第二器件之每一封包可視特定應用及總設計約束而包括一或多個訊框。
資料應用可在一電路交換式網路中實施,且具有資料之封包可在該網路上自一第一器件傳輸至一第二器件。資料封包亦可能在資料之傳輸期間丟失。用以在一電路交換式系統中隱蔽一資料封包中之一訊框之丟失的習知方式為經由自具有某一衰減之先前訊框外插來重建該丟失封包之參數。習知系統所使用之封包(或訊框)丟失隱蔽方案可稱為習知封包丟失隱蔽(PLC)。外插可包括使用該先前訊框之訊框參數或基頻波形以重建該丟失訊框。雖然對在封包交換式網路中之話音通信之使用(亦即,網路電話(VoIP))在不斷增加,但用於電路交換式網路中之習知PLC亦用以在封包交換式網路中實施封包丟失隱蔽方案。
雖然習知PLC在一穩定有聲區域中存在一單一訊框丟失時相當適用;但其可能不適合於隱蔽一轉變訊框之丟失。另外,習知PLC亦可能不適用於叢發性訊框丟失。然而,在封包交換式網路中,歸因於如高鏈路負載及高抖動之各種原因,封包丟失可為叢發性的。舉例而言,三個或三個以上連續封包可在封包交換式網路中丟失。在此情況下,習知PLC方法可能不夠穩健以將一相當良好的感知品質提供給使用者。
為了在封包交換式網路中提供一經改良感知品質,可使用一增強型封包丟失隱蔽方案。此隱蔽方案可稱為利用未來訊框之增強型PLC演算法。該增強型PLC演算法可利用一未來訊框(儲存於一去抖動緩衝器中)來內插丟失封包之參數中之一些或全部。在一實例中,該增強型PLC演算法可改良感知到的語音品質而不影響系統容量。下文所描述的本發明之系統及方法可供眾多類型之語音編解碼器使用。
揭示一種用於重建一被抹除語音訊框之方法。該方法可包括自一緩衝器接收一第二語音訊框。該第二語音訊框之索引位置可大於該被抹除語音訊框之索引位置。該方法亦可包括基於該第二語音訊框及一第三語音訊框中之一者或其兩者判定使用哪一類型之封包丟失隱蔽(PLC)方法。該第三語音訊框之索引位置可小於該被抹除語音訊框之該索引位置。該方法亦可包括自該第二語音訊框及該第三語音訊框中之一者或其兩者重建該被抹除語音訊框。
揭示一種用於重建一被抹除語音訊框之無線器件。該無線器件可包括一緩衝器,其經組態以接收語音訊框之一序列。該無線器件亦可包括一話音解碼器,其經組態以解碼語音訊框之該序列。該話音解碼器可包括一訊框抹除隱蔽模組,其經組態以自一或多個訊框重建該被抹除語音訊框,該一或多個訊框為以下類型中之一者:後續訊框及先前訊框。該等後續訊框可包括大於該緩衝器中之該被抹除語音訊框之索引位置的一索引位置。該等先前訊框可包括一小於該緩衝器中之該被抹除語音訊框之索引位置的索引位置。
揭示一種用於重建一被抹除語音訊框之裝置。該裝置可包括用於自一緩衝器接收一第二語音訊框的構件。該第二語音訊框之索引位置可大於該被抹除語音訊框之索引位置。該裝置亦可包括用於基於該第二語音訊框及一第三語音訊框中之一者或其兩者判定使用哪一類型之封包丟失隱蔽(PLC)方法的構件。該第三語音訊框之索引位置可小於該被抹除語音訊框之該索引位置。該裝置亦可包括用於自該第二語音訊框及該第三語音訊框中之一者或其兩者重建該被抹除語音訊框的構件。
揭示一種用於重建一被抹除語音訊框之電腦程式產品。該電腦程式產品可包括一具有指令之電腦可讀媒體。該等指令可包括用於自一緩衝器接收一第二語音訊框的程式碼。該第二語音訊框之索引位置可大於該被抹除語音訊框之索引位置。該等指令亦可包括用於基於該第二語音訊框 及一第三語音訊框中之一者或其兩者判定使用哪一類型之封包丟失隱蔽(PLC)方法的程式碼。該第三語音訊框之索引位置可小於該被抹除語音訊框之該索引位置。該等指令亦可包括用於自該第二語音訊框及該第三語音訊框中之一者或其兩者重建該被抹除語音訊框的程式碼。
圖1為說明在一傳輸媒體上的一傳輸終端機102及一接收終端機104之一實例的方塊圖100。傳輸終端機102及接收終端機104可為能夠支援話音通信之任何器件,包括電話、電腦、音訊廣播及接收設備、視訊會議設備或其類似者。在一組態中,傳輸終端機102及接收終端機104可利用諸如分碼多重存取(CDMA)能力之無線多重存取技術來實施。CDMA為一基於展頻通信之調變及多重存取方案。
傳輸終端機102可包括一話音編碼器106且接收終端機104可包括一話音解碼器108。話音編碼器106可用以藉由基於一人類語音產生模型提取參數來壓縮來自一第一使用者介面110之語音。一傳輸器112可用以跨越傳輸媒體114傳輸包括此等參數之封包。傳輸媒體114可為一基於封包之網路(諸如,網際網路或一企業內部網路)或任何其他傳輸媒體。位於傳輸媒體112之另一端處的一接收器116可用以接收該等封包。話音解碼器108可使用該等封包中之該等參數合成語音。該合成語音可提供至接收終端機104上之一第二使用者介面118。儘管未圖示,但可在傳輸器112及接收器116兩者中執行各種信號處理功能,諸如包括循環冗餘檢查(CRC)功能之迴旋編碼、交錯、數位調變、展 頻處理、抖動緩衝等。
通信之每一方可進行傳輸以及接收。每一終端機可包括一話音編碼器及解碼器。該話音編碼器及解碼器可為獨立器件或可整合至一稱為「聲碼器」之單一器件中。在以下詳細描述中,將描述終端機102、104,其在傳輸媒體114之一端具有一話音編碼器106且在另一端具有一話音解碼器108。
在傳輸終端機102之至少一組態中,語音可以訊框形式自第一使用者介面110輸入至話音解碼器106,且每一訊框經進一步分割成子訊框。可在某一區塊處理執行之處使用此等任意訊框邊界。然而,若實施的是連續處理而非區塊處理,則可能不將該等語音樣本分割成訊框(及子訊框)。在所描述實例中,跨越傳輸媒體114傳輸之每一封包可視特定應用及總設計約束而包括一或多個訊框。
話音編碼器106可為一可變速率或固定速率編碼器。可變速率編碼器可視語音內容而在訊框間於多個編碼器模式之間動態地切換。話音解碼器108亦可在訊框間於相應解碼器模式之間動態地切換。可為每一訊框選擇一特定模式以達成在維持接收終端機104處之可接收信號重現時可獲得之最低位元率。以實例說明,有作用語音可使用用於有作用語音訊框之編碼模式來編碼。背景雜訊可使用用於靜寂訊框之編碼模式來編碼。
話音編碼器106及解碼器108可使用線性預測編碼(LPC)。在LPC編碼之情況下,語音可藉由一語音源(聲帶)模型化,該語音源之特徵在於其強度及基頻。來自聲帶之語音穿過聲道(喉嚨及嘴),聲道之特徵在於其共振,其被稱為「共振峰(formant)」。該LPC話音編碼器可藉由估計共振峰、自語音移除其效應及估計殘餘語音之強度及基頻來分析語音。接收端處之LPC話音解碼器可藉由逆轉該過程來合成語音。詳言之,該LPC話音解碼器可使用殘餘語音建立語音源、使用共振峰建立一濾波器(其表示聲道)且使該語音源穿過該濾波器以合成該語音。
圖2為一接收終端機204之方塊圖。在此組態中,一VoIP用戶端230包括一去抖動緩衝器202,將在下文中較全面地論述該去抖動緩衝器。接收終端機204亦包括一或多個話音解碼器208。在一實例中,接收終端機204可包括一基於LPC之解碼器及兩個其他類型之編解碼器(例如,有聲語音編碼方案及無聲語音編碼方案)。解碼器208可包括一訊框錯誤偵測器226、一訊框抹除隱蔽模組206及一語音產生器232。話音解碼器208可實施為一聲碼器之部分、一獨立實體,或跨越接收終端機204內之一或多個實體而分散。話音解碼器208可實施為硬體、韌體、軟體或其任何組合。以實例說明,話音解碼器208可用一微處理器、數位信號處理器(DSP)、可程式化邏輯、專用硬體或任何其他基於硬體及/或軟體之處理實體來實施。將就話音解碼器208之功能性於下文對其加以描述。話音解碼器之實施方式可視特定應用及強加於整個系統之設計約束而定。
去抖動緩衝器202可為消除由封包到達時間之變化所造成之抖動的硬體器件或軟體處理程序,封包到達時間之變化係歸因於網路壅塞、時序漂移及投送路徑改變。去抖動緩衝器202可接收話音封包中之語音訊框242。另外,去抖動緩衝器202可延遲新到達之封包,使得最近到達之封包可以正確次序連續地提供至語音產生器232,從而形成一幾乎沒有音訊失真之順暢連接。去抖動緩衝器202可為固定或適應性的。一固定去抖動緩衝器可將一固定延遲引入至該等封包。另一方面,一適應性去抖動緩衝器可適應網路延遲之改變。去抖動緩衝器202可將訊框資訊240提供至訊框抹除隱蔽模組206,如下文將論述的。
如先前所提及,可藉由傳輸終端機102執行各種信號處理功能,諸如包括循環冗餘檢查(CRC)功能之迴旋編碼、交錯、數位調變及展頻處理。訊框錯誤偵測器226可用以執行該CRC檢查功能。或者或除此之外,可使用其他訊框錯誤偵測技術,包括總和檢查碼及同位位元。在一實例中,訊框錯誤偵測器226可判定一訊框抹除是否已發生。「訊框抹除」可意謂著該訊框已丟失或惡化。若訊框錯誤偵測器226判定當前訊框尚未被抹除,則訊框抹除隱蔽模組206可釋放過去儲存於去抖動緩衝器202中之語音訊框242。語音訊框242之參數可為傳遞至訊框抹除隱蔽模組206之訊框資訊240。訊框資訊240可傳達至語音產生器232且由該語音產生器加以處理。
另一方面,若訊框錯誤偵測器226判定該當前訊框已被抹除,則該訊框錯誤偵測器可將一「訊框抹除旗標」提供至訊框抹除隱蔽模組206。以一稍後將予以較詳細描述之方式,訊框抹除隱蔽模組206可用以重建該被抹除訊框之該等話音參數。
可將該等話音參數(自去抖動緩衝器202釋放或藉由訊框抹除隱蔽模組206重建)提供至語音產生器232以產生合成語音244。語音產生器232可包括若干功能以便產生合成語音244。在一實例中,一反向碼簿(inverse codebook)212可使用固定碼簿參數238。舉例而言,反向碼簿212可用以將固定碼簿索引轉換成殘餘語音且將一固定碼簿增益應用至彼殘餘語音。可將基頻資訊添加(218)回至該殘餘語音中。該基頻資訊可藉由一基頻解碼器214自「延遲」計算。基頻解碼器214可為產生語音樣本之先前訊框的資訊之一記憶體。諸如適應性碼簿增益之適應性碼簿參數236可在被添加(218)至該殘餘語音之前藉由基頻解碼器214應用至每一子訊框中之記憶體資訊。該殘餘語音可使用線頻譜對234(諸如,來自一反變換222之LPC係數)通過一濾波器220,以將該等共振峰添加至該語音。可接著將原合成語音自濾波器220提供至一後濾波器224。後濾波器224可為音訊頻帶中之一數位濾波器,其可平滑該語音且減少頻帶外分量。在另一組態中,有聲語音編碼方案(諸如,PPP)及無聲語音編碼方案(諸如,NELP)可藉由訊框抹除隱蔽模組206實施。
該訊框抹除隱蔽過程之品質由重建該等話音參數時的準確度改良。可在該等訊框之語音內容較高時達成該等重建之語音參數之較大準確度。在一實例中,靜寂訊框可能不包括語音內容,且因此可能不提供任何話音品質增益。因此,在話音解碼器208之至少一組態中,可在訊框速率足夠高時使用一未來訊框中之該等話音參數以達成話音品質增益。以實例說明,若先前訊框及未來訊框係以不同於靜寂編碼模式之模式編碼,則話音解碼器208可使用先前訊框及未來訊框兩者中之話音參數來重建一被抹除訊框中之話音參數。換言之,增強型封包丟失隱蔽將在先前訊框及未來訊框均以一有作用語音編碼模式編碼時使用。否則,可自先前訊框重建被抹除訊框中之該等話音參數。當話音品質增益之可能性低時,此方法降低該訊框抹除隱蔽過程之複雜性。來自訊框錯誤偵測器226之一「速率決策」(將在下文中較全面地論述)可用以指示一訊框抹除之先前訊框及未來訊框之編碼模式。在另一組態中,兩個或兩個以上未來訊框可存在於該緩衝器中。當兩個或兩個以上未來訊框存在於該緩衝器中時,可選擇一較高速率訊框,即使該較高速率訊框距離該被抹除訊框比一較低速率訊框遠。
圖3為說明根據本發明之系統及方法的具有一增強型封包丟失隱蔽(PLC)模組306之接收終端機304之一組態的方塊圖。接收終端機304可包括一VoIP用戶端330及一解碼器308。VoIP用戶端330可包括一去抖動緩衝器302,且解碼器308可包括增強型PLC模組306。去抖動緩衝器302可緩衝由VoIP用戶端330接收到的一或多個語音訊框。
在一實例中,VoIP用戶端330接收即時協定(RTP)封包。即時協定(RTP)定義用於遞送一網路(諸如,網際網路)之音訊及視訊之標準化封包格式。在一組態中,VoIP用戶端330可將該等接收到RTP封包解囊封為語音封包。另外,VoIP用戶端330可將去抖動緩衝器302中之該等語音訊框重新排序。此外,VoIP用戶端330可將適當語音訊框供應至解碼器308。在一組態中,解碼器308將一對一特定語音訊框之請求提供至VoIP用戶端330。VoIP用戶端330亦可自解碼器308接收許多經解碼的脈衝編碼調變(PCM)樣本312。在一實例中,VoIP用戶端330可使用由該等PCM樣本312提供之資訊來調整去抖動緩衝器302之行為。
在一組態中,去抖動緩衝器302儲存語音訊框。緩衝器302可儲存一先前語音訊框321、一當前語音訊框322及一或多個未來語音訊框310。如先前所提及,VoIP用戶端330可無序地接收封包。去抖動緩衝器302可用以儲存該等封包之該等語音訊框且將該等語音訊框重新排序成正確次序。若一語音訊框被抹除(例如,訊框抹除),則去抖動緩衝器302可包括一或多個未來訊框(亦即,在該被抹除訊框之後出現的訊框)。一訊框可具有一與該訊框相關聯之索引位置。舉例而言,一未來訊框310可具有一比當前訊框322高的索引位置。同樣地,當前訊框322可具有一比一先前訊框321高的索引位置。
如上所提及,解碼器308可包括增強型PLC模組306。在一組態中,解碼器308可為一非寬頻語音編解碼器或寬頻語音編解碼器之解碼器。當一訊框抹除發生且至少一未來訊框310可用時,增強型PLC模組306可使用基於內插的封包丟失隱蔽技術重建一被抹除訊框。若存在一個以上可用的未來訊框310,則可選擇較準確之未來訊框。在一組態中,一未來訊框之較高準確度可藉由一較高位元率來指示。或者,一未來訊框之較高準確度可藉由該訊框之時間緊密度來指示。在一實例中,在一語音訊框被抹除後,該訊框可不包括有意義資料。舉例而言,一當前訊框322可表示一被抹除語音訊框。可將訊框322視為一被抹除訊框,因為訊框322可不包括使解碼器308能夠正確解碼訊框322之資料。當訊框抹除發生且緩衝器302中至少一未來訊框310可用時,VoIP用戶端330可將未來訊框310及任何相關資訊發送至解碼器308。該相關資訊可為包括無意義資料之當前訊框322。該相關資訊亦可包括該當前被抹除訊框與該可用未來訊框之間的相對間隙。在一實例中,增強型PLC模組306可使用未來訊框310來重建當前訊框322。可將語音訊框作為PCM資料320傳達至一音訊介面318。
在一不具有增強型PLC能力之系統中,VoIP用戶端330可藉由發送當前訊框322、當前訊框322之速率及其他相關資訊(諸如,是否進行相位匹配及是否及如何進行時間扭曲)而與語音解碼器308介接。當一抹除發生時,在將當前訊框322發送至解碼器308時,可將當前訊框322之速率設定為一特定值,諸如訊框抹除。在具備增強型PLC功能性能力之情況下,VoIP用戶端330亦可將未來訊框310、未來訊框310之速率及一間隙指示符(在下文中進一步描述)發送至解碼器308。
圖4為說明用於使用一未來訊框重建一語音訊框之方法400之一實例的流程圖。方法400可藉由增強型PLC模組206實施。在一組態中,可接收一指示符(402)。該指示符可指示一第一訊框之索引位置與一第二訊框之索引位置之間的差。舉例而言,該第一訊框可具有一索引位置「4」,且該第二訊框可具有一索引位置「7」。根據此實例,該指示符可為「3」。
在一實例中,可接收該第二訊框(404)。該第二訊框可具有一大於該第一訊框之索引位置。換言之,該第二訊框可在該第一訊框之播放之後的一時間播放。另外,可接收該第二訊框之一訊框速率(406)。該訊框速率可指示一編碼器用以編碼該第二訊框之速率。關於該訊框速率之更多細節將在下文中論述。
在一組態中,可內插該第一訊框之一參數(408)。該參數可使用該第二訊框之一參數及一第三訊框之一參數來內插。該第三訊框可包括一小於該第一訊框及該第二訊框之索引位置。換言之,因為該第三訊框係在該當前訊框及該未來訊框之播放之前播放,所以可將該第三訊框視為一「先前訊框」。
上文所描述的圖4之方法可藉由對應於圖5中所說明的手段附加功能區塊之各種硬體及/或軟體組件及/或模組來執行。換言之,圖4中所說明的區塊402至408對應於圖5中所說明的手段附加功能區塊502至508。
圖6為說明一用於隱蔽一封包內之一語音訊框之丟失的方法600之另一組態的流程圖。該方法可藉由一接收終端機104之一解碼器608內的一增強型PLC模組606實施。一當前訊框速率612可藉由解碼器608接收。可關於當前訊框速率612是否包括一特定值進行一判定602,該特定值指示一當前訊框620被抹除。在一實例中,可關於當前訊框速率612是否等於一訊框抹除值進行一判定602。若判定(602)當前訊框速率612不等於訊框抹除值,則將當前訊框620傳達至一解碼模組618。解碼模組618可解碼當前訊框620。
然而,若當前訊框速率612表明該當前訊框被抹除,則將一間隙指示符622傳達至解碼器608。間隙指示符622可為一指示一未來訊框610及一當前訊框620(亦即,該被抹除訊框)之訊框索引之間的差之變數。舉例而言,若當前被抹除訊框620為一封包中之第100個訊框且未來訊框610為該封包中之第103個訊框,則間隙指示符622可等於3。可關於間隙指示符622是否大於一特定臨限值進行一判定604。若間隙指示符622不大於該特定臨限值,則此可暗示去抖動緩衝器202中無未來訊框可用。一習知PLC模組614可用以使用上文所提及之技術來重建當前訊框620。
在一實例中,若間隙指示符622大於零,則此可暗示去抖動緩衝器202中有一未來訊框610可用。如先前所提及,未來訊框610可用以重建當前訊框620之被抹除參數。未來訊框610可自去抖動緩衝器202(未圖示)傳遞至增強型PLC模組606。另外,一與未來訊框610相關聯之未來訊框速率616亦可傳遞至增強型PLC模組606。未來訊框速率616可指示未來訊框610之速率或訊框類型。舉例而言,未來訊框速率616可指示該未來訊框係使用一用於有作用語音訊框之編碼模式加以編碼。增強型PLC模組606可使用未來訊框610及一先前訊框來重建當前訊框620之被抹除參數。一訊框可為一先前訊框,因為索引位置可小於當前訊框620之索引位置。換言之,該先前訊框係在當前訊框620之前自去抖動緩衝器202釋放。
圖7為說明一用於隱蔽一封包內之一語音訊框之丟失的方法700之另一實例的流程圖。在一實例中,一當前被抹除訊框可為一封包內之第n個訊框。一未來訊框710可為第(n+m)個訊框。一指示該當前被抹除訊框及未來訊框710之索引位置之間的差的間隙指示符708可為m。在一組態中,可在一先前訊框(第(n-1)個訊框)與未來訊框710(亦即,該第(n+m))個訊框之間執行用以重建該被抹除的第n個訊框之內插。
在一實例中,關於未來訊框710是否包括一「不良速率」進行一判定702。可對未來訊框710執行不良速率偵測以避免傳輸期間之資料惡化。若判定未來訊框710未通過不良速率偵測判定702,則可使用一習知PLC模組714重建該被抹除訊框之參數。習知PLC模組714可實施先前所描述之先前技術以重建該被抹除訊框。
若未來訊框710通過不良速率偵測判定702,則可藉由一解量化模組706來解量化該未來訊框中之參數。在一組態中,未由該增強型PLC模組使用以重建該被抹除訊框之參數可能未被解量化。舉例而言,若未來訊框710為一碼激勵線性預測(CELP)訊框,則一固定碼簿索引可能未被該增強型PLC模組使用。因而,該固定碼簿索引可能未被解量化。
對於一包括一增強型PLC模組306之解碼器108,可能存在可在訊框抹除發生時實施的不同類型之封包丟失隱蔽方法。此等不同方法之實例可包括:1)習知PLC方法;2)一用以判定頻譜包絡參數之方法,諸如線頻譜對(LSP)增強之PLC方法、線性預測係數(LPC)方法、導抗譜頻率(ISF)方法等;3)CELP增強之PLC方法及4)用於有聲編碼模式之增強型PLC方法。
在一實例中,該頻譜包絡參數增強之PLC方法包括內插該被抹除訊框之該等頻譜包絡參數。其他參數可藉由外插估計,如藉由該習知PLC方法執行。在該CELP增強之PLC方法中,該遺漏訊框之激勵相關參數中之一些或全部亦可使用一內插演算法估計為一CELP訊框。類似地,在該有聲語音編碼方案增強之PLC方法中,該被抹除訊框之激勵相關參數中之一些或全部亦可使用一內插演算法估計為一有聲語音編碼方案訊框。在一組態中,該CELP增強之PLC方法及該有聲語音編碼方案增強之PLC方法可稱為「多個參數增強之PLC方法」。通常,該等多個參數增強之PLC方法包括內插激勵相關參數及/或頻譜包絡參數中之一些或全部。
在解量化未來訊框710之參數之後,可關於是否實施多個參數增強之PLC方法進行一判定732。判定732用以避免令人困擾的偽訊。可基於先前訊框及未來訊框兩者之類型及速率進行判定732。亦可基於先前訊框與未來訊框之間的相似性進行判定732。可基於訊框之頻譜包絡參數、其基頻延滯或波形來計算該相似性指示符。
多個參數增強之PLC方法之可靠性可視短語音片段在訊框之間的穩定性而定。舉例而言,未來訊框710及先前訊框720應足夠類似以經由多個參數增強之PLC方法提供一可靠的重建訊框。未來訊框710之LPC增益與先前訊框720之LPC增益之比可為對該兩個訊框之間的相似性之一良好度量。若該LPC增益比過小或過大,則使用多個參數增強之PLC方法可導致重建訊框具有偽訊。
在一實例中,一訊框中之無聲區域本質上傾向於為隨機的。因而,基於增強型PLC之方法可導致一產生嗡嗡聲之重建訊框。因此,在先前訊框720為一無聲訊框的狀況下,不可使用多個參數增強之PLC方法(CELP增強之PLC及有聲語音編碼方案增強之PLC)。在一組態中,一些準則可用以決定一訊框之特性,亦即,一訊框是一有聲訊框抑或一無聲訊框。用以對一訊框進行分類之該等準則包括訊框類型、訊框速率、第一反射係數、過零率等。
當先前訊框720及未來訊框710不夠類似,或先前訊框720為一無聲訊框時,不可使用多個參數增強之PLC方法。在此等狀況下,可使用習知PLC方法或頻譜包絡參數增強之PLC方法。此等方法可(分別)藉由一習知PLC模組714及一頻譜包絡參數增強之PLC模組(諸如,LSP增強之PLC模組704)實施。當未來訊框之LPC增益與先前訊框之LPC增益之比非常小時,可選擇頻譜包絡參數增強之PLC方法。在此等情況下使用習知PLC方法可在被抹除訊框與隨後的良好訊框之邊界處產生噗噗聲之偽訊。
若判定(732)多個參數增強之PLC方法可用以重建一被抹除訊框之參數,則可關於應使用哪一類型之增強型PLC方法(CELP增強之PLC或有聲語音編碼方案增強之PLC)進行一判定722。對於習知PLC方法及頻譜包絡參數增強之PLC方法,重建訊框之訊框類型與該重建訊框之前的先前訊框相同。然而,對於多個參數增強之PLC方法,情況並不總是這樣。在先前系統中,用於隱蔽當前被抹除訊框之編碼模式與先前訊框之編碼模式相同。然而,在當前系統及方法中,用於被抹除訊框之編碼模式/類型可不同於先前訊框及未來訊框之編碼模式/類型。
當未來訊框710不準確(亦即,一低速率編碼模式)時,未來訊框710可能不提供有用資訊以實現一增強型PLC方法。因此,當未來訊框710為一低準確度訊框時,不可使用增強型PLC。實情為,可使用習知PLC技術來隱蔽該訊框抹除。
當該當前被抹除訊框之前的先前訊框720為一穩定的有聲訊框時,此可意謂著先前訊框720位於一穩定話音區域中。因此,習知PLC演算法可積極地嘗試重建遺漏訊框。習知PLC可產生一嗡嗡聲之偽訊。因此,當先前訊框720為一穩定的有聲訊框且未來訊框710為一CELP訊框或一無聲語音編碼訊框時,可將增強型PLC演算法用於訊框抹除。接著,可使用該CELP增強之PLC演算法以避免嗡嗡聲之偽訊。該CELP增強之PLC演算法可藉由一CELP增強之PLC模組724實施。
當未來訊框710為一有作用語音原型基頻週期(FPPP)訊框時,可使用該有聲語音編碼方案增強之PLC演算法。該有聲語音編碼方案增強之PLC演算法可藉由一有聲語音編碼方案增強之PLC模組726(諸如,一原型基頻週期(PPP)增強之PLC模組)實施。
在一組態中,一未來訊框可用以進行反向外插。舉例而言,若一抹除在一無聲語音編碼訊框之前發生,則可自該未來無聲語音編碼訊框估計該等參數。此不同於自當前被抹除訊框之前的訊框估計該等參數之習知PLC。
CELP增強之PLC模組724可將遺漏訊框視為CELP訊框。在CELP增強之PLC方法中,可藉由在先前訊框(訊框(n-1))與未來訊框(訊框(n+m))之間內插來估計當前被抹除訊框(訊框n)之頻譜包絡參數、延遲、適應性碼簿(ACB)增益及固定碼簿(FCB)增益。該固定碼簿索引可隨機地產生,接著,可基於此等估計值重建該當前被抹除訊框。
當未來訊框710為一有作用語音碼激勵線性預測(FCELP)訊框時,未來訊框710可包括一差量延遲(delta-delay)欄位,可自該欄位判定未來訊框710之前的訊框(亦即,訊框(n+m-1))之基頻延滯。可藉由在第(n-1)個訊框及第(n+m-1)個訊框之延遲值之間內插來估計該當前被抹除訊框之延遲。可偵測到基頻倍增/增至三倍且可在延遲值之內插之前加以處置。
當先前訊框720/未來訊框710為有聲語音編碼訊框或無聲語音編碼訊框時,諸如適應性碼簿增益及固定碼簿增益之參數可不呈現。在此等狀況下,可產生此等參數之一些人為值。對於無聲語音編碼訊框,可將ACB增益及FCB增益設定為零。對於有聲語音編碼訊框,可將FCB增益設定為零,且可基於先前訊框之前的訊框與先前訊框之間的殘值域中之基頻循環波形能量之比來判定ACB增益。舉例而言,若該先前訊框並非一CELP訊框,但使用CELP模式隱蔽該當前被抹除訊框,則即使該先前訊框並非一CELP訊框,亦可使用一模組自該先前訊框之參數估計acb_gain。
對於任何編碼方法,為了進行增強型PLC,可基於該先前訊框及該等未來訊框內插參數。可計算一相似性指示符以表示先前訊框與未來訊框之間的相似性。若該指示符低於某一臨限值(亦即,並不非常類似),則一些參數不可根據增強型PLC來估計。實情為,可使用習知PLC。
當一CELP訊框與一無聲語音編碼訊框之間存在一或多個抹除時,歸因於CELP抹除處理期間之衰減,最後被隱蔽的訊框之能量可能非常低。此可導致最後被隱蔽的訊框與隨後的良好無聲語音編碼訊框之間的能量不連續性。如先前所提及,無聲語音解碼方案可用以隱蔽此最後被抹除訊框。
在一組態中,可將該被抹除訊框視為一無聲語音編碼訊框。參數可自一未來無聲語音編碼訊框複製。除了對重建之殘餘信號質進行一平滑操作之外,該解碼可與常規無聲語音解碼相同。該平滑係基於先前CELP訊框中之殘餘信號之能量及當前訊框中之殘餘信號之能量來進行,以達成能量連續性。
在一組態中,可將間隙指示符708提供至一內插因數(IF)計算器730。IF 729可計算為:
被抹除訊框n之一參數可自先前訊框(n-1)及未來訊框710(n+m)之參數內插。一被抹除參數P可內插為:
P n =(1-IF )*P n -1 +IF *P n + m  等式2
實施寬頻語音編解碼器中之增強型PLC方法可為實施非寬頻語音編解碼器中之增強型PLC方法之一擴展。寬頻語音編解碼器之低頻帶中之增強型PLC處理可與非寬頻語音編解碼器中之增強型PLC處理相同。對於寬頻語音編解碼器中之高頻帶參數,可應用以下原則:當該等低頻帶參數係藉由多個參數增強之PLC方法(亦即,CELP增強之PLC或有聲語音編碼方案增強之PLC)估計時,可藉由內插來估計該等高頻帶參數。
當一訊框抹除發生且緩衝器202中存在至少一未來訊框時,去抖動緩衝器202可負責決定是否發送一未來訊框。
在一組態中,當該緩衝器中之第一未來訊框並非一靜寂訊框時且當間隙指示符708小於或等於一特定值時,去抖動緩衝器202會將該第一未來訊框發送至解碼器108。舉例而言,該特定值可為「4」。然而,在先前訊框720係藉由習知PLC方法重建且先前訊框720為一列中之第二習知PLC訊框的情況下,去抖動緩衝器202可在該間隙指示符小於或等於一特定值的情況下發送未來訊框710。舉例而言,該特定值可為「2」。另外,在先前訊框720係藉由習知PLC方法重建且先前訊框720為一列中之至少第三習知PLC訊框的情況下,緩衝器202可不將一未來訊框710供應至該解碼器。
在一實例中,若緩衝器202中存在一個以上訊框,則可將該第一未來訊框發送至解碼器108以供在增強型PLC方法期間使用。當兩個或兩個以上未來訊框存在於該緩衝器中時,可選擇一較高速率訊框,即使該較高速率訊框距離該被抹除訊框比一較低速率訊框遠。或者,當兩個或兩個以上未來訊框存在於該緩衝器中時,可將時間上最接近該被抹除訊框的訊框發送至解碼器108而不管時間最接近訊框是否為速率比另一未來訊框低的訊框。
圖8說明可用於一無線器件802中之各種組件。無線器件802為一可經組態以實施本文中所描述之各種方法之器件之一實例。無線器件802可為一遠端台。
無線器件802可包括一處理器804,該處理器控制無線器件802之操作。處理器804亦可稱為中央處理單元(CPU)。可包括唯讀記憶體(ROM)及隨機存取記憶體(RAM)兩者的記憶體806將指令及資料提供至處理器804。記憶體806之一部分亦可包括非揮發性隨機存取記憶體(NVRAM)。處理器804通常基於儲存於記憶體806內之程式指令執行邏輯及算術運算。記憶體806中之該等指令可執行以實施本文中所描述之方法。
無線器件802亦可包括一外殼808,該外殼可包括一傳輸器810及一接收器812以允許資料在無線器件802與一遠端位置之間的傳輸及接收。傳輸器810與接收器812可組合成一收發器814。一天線816可附接至外殼808且電耦接至收發器814。無線器件802亦可包括(未圖示)多個傳輸器、多個接收器、多個收發器及/或多個天線。
無線器件802亦可包括一信號偵測器818,該信號偵測器可用以偵測並量化由收發器814接收的信號之位準。信號偵測器818可將此等信號偵測為總能量、每偽雜訊(PN)碼片之導頻能量、功率譜密度及其他信號。無線器件802亦可包括一數位信號處理器(DSP)820以用於處理信號。
無線器件802之各種組件可藉由一匯流排系統822耦接在一起,除資料匯流排外,匯流排系統822還可包括功率匯流排、控制信號匯流排及狀態信號匯流排。然而,為清楚起見,在圖8中將各種匯流排說明為匯流排系統822。
於本文中使用時,術語「判定」涵蓋廣泛多種動作,且因此,「判定」可包括推算、計算、處理、導出、調查、查找(例如,在表中、資料庫中或另一資料結構中查找)、確定及類似動作。又,「判定」可包括接收(例如,接收資訊)、存取(例如,存取記憶體中之資料)及類似動作。又,「判定」可包括解析、選擇、選取、建立及類似動作。
除非另外明確規定,否則短語「基於」不意謂「僅基於」。換言之,短語「基於」描述「僅基於」及「至少基於」兩者。
結合本發明描述的各種說明性邏輯區塊、模組及電路可藉由下列各者實施或執行:通用處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列信號(FPGA)或其他可程式化邏輯器件、離散閘或電晶體邏輯、離散硬體組件,或其經設計以執行本文中所描述之功能的任何組合。通用處理器可為微處理器,但在替代例中,處理器可為任何市售之處理器、控制器、微控制器或狀態機。處理器亦可實施為計算器件之組合,例如,DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器,或任何其他此組態。
結合本發明描述之方法或演算法之步驟可直接體現於硬體中、由處理器執行之軟體模組中或硬體與軟體模組之組合中。軟體模組可駐留於此項技術中已知的任何形式之儲存媒體中。可使用的儲存媒體之一些實例包括RAM記憶體、快閃記憶體、ROM記憶體、EPROM記憶體、EEPROM記憶體、暫存器、硬碟、抽取式碟片、CD-ROM等。軟體模組可包含單一指令或許多指令,且可分散於若干不同碼段上、分散於不同程式中及跨越多個儲存媒體而分散。儲存媒體可耦接至處理器,使得該處理器可自儲存媒體讀取資訊及將資訊寫入至儲存媒體。在替代例中,儲存媒體可與處理器成一體式。
本文中所揭示之方法包含用於達成所描述方法之一或多個步驟或動作。該等方法步驟及/或動作可彼此互換而不脫離申請專利範圍之範疇。換言之,除非指定步驟或動作之特定次序,否則可修改特定步驟及/或動作之次序及/或使用而不脫離申請專利範圍之範疇。
所描述功能可以硬體、軟體、韌體或其任何組合實施。若以軟體實施,則該等功能可作為一或多個指令而儲存於電腦可讀媒體上。電腦可讀媒體可為可由電腦存取之任何可用媒體。作為實例而非限制,電腦可讀媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件,或可用以載運或儲存呈指令或資料結構形式的所要程式碼且可由電腦存取之任何其他媒體。於本文中使用時,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及Blu-ray光碟,其中磁碟通常以磁性方式再現資料,而光碟用雷射以光學方式再現資料。
軟體或指令亦可經由傳輸媒體傳輸。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸軟體,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於傳輸媒體之定義中。
另外,應瞭解,用於執行本文中所描述之方法及技術(諸如,藉由圖4至圖7所說明之方法及技術)的模組及/或其他適當構件可在適用時由行動器件及/或基地台下載及/或以其他方式獲得。舉例而言,此器件可耦接至一伺服器以促進用於執行本文中所描述之方法之構件的轉移。或者,本文中所描述之各種方法可經由儲存構件(例如,隨機存取記憶體(RAM)、唯讀記憶體(ROM)、諸如緊密光碟(CD)或軟性磁碟之實體儲存媒體等)提供,以使得行動器件及/或基地台可在將儲存構件耦接或提供至該器件時獲得各種方法。此外,可利用用於將本文中所描述之方法及技術提供至一器件的任何其他合適技術。
應理解,申請專利範圍不限於上文所說明之精確組態及組件。可對本文中所描述之系統、方法及裝置之配置、操作及細節方面做出各種修改、改變及變化而不脫離申請專利範圍之範疇。
102...傳輸終端機
104...接收終端機
106...話音編碼器
108...話音解碼器
110...第一使用者介面
112...傳輸器
114...傳輸媒體
116...接收器
118...第二使用者介面
202...去抖動緩衝器
204...接收終端機
206...訊框抹除隱蔽模組
208...話音解碼器
212...反向碼簿
214...基頻解碼器
220...濾波器
222...反變換
224...後濾波器
226...訊框錯誤偵測器
230...VoIP用戶端
232...語音產生器
234...線頻譜對
236...適應性碼簿參數
238...固定碼簿參數
240...訊框資訊
242...語音訊框
244...合成語音
302...去抖動緩衝器
304...接收終端機
306...增強型封包丟失隱蔽(PLC)模組
308...解碼器
310...未來語音訊框
312...脈衝編碼調變(PCM)樣本
318...音訊介面
320...PCM資料
321...先前語音訊框
322...當前語音訊框
330...VoIP用戶端
400...方法
502...用於接收一指示符的構件,該指示符與一第一訊框之索引與一第二訊框之索引之間的差有關
504...用於接收該第二訊框的構件,該第二訊框具有一大於該第一訊框之索引
506...用於接收該第二訊框的一訊框速率的構件
508...用於自該第二訊框之一參數及一第三訊框之一參數內插該第一訊框之一參數的構件
600...方法
606...增強型PLC模組
608...解碼器
610...未來訊框
612...當前訊框速率
614...習知PLC模組
616...未來訊框速率
618...解碼模組
620...當前訊框
622...間隙指示符
700...方法
704...LSP增強之PLC模組
706...解量化模組
708...間隙指示符
710...未來訊框
714...習知PLC模組
720...先前訊框
724...CELP增強之PLC模組
726...有聲語音編碼方案增強之PLC模組
729...內插因數(IF)
730...內插因數(IF)計算器
802...無線器件
804...處理器
806...記憶體
808...外殼
810...傳輸器
812...接收器
814...收發器
816...天線
818...信號偵測器
820...數位信號處理器(DSP)
822...匯流排系統
圖1為說明在一傳輸媒體上的一傳輸終端機及一接收終端機之一實例的方塊圖;
圖2為說明該接收終端機之另一組態的方塊圖;
圖3為說明具有一增強型封包丟失隱蔽(PLC)模組之接收終端機之一組態的方塊圖;
圖4為說明一用於使用一未來訊框重建一語音訊框之方法之一實例的流程圖;
圖5說明對應於圖4中所展示之方法的手段附加功能區塊;
圖6為說明一用於隱蔽一語音訊框之丟失的方法之另一組態的流程圖;
圖7為說明一用於隱蔽一語音訊框之丟失的方法之另一實例的流程圖;及
圖8說明可用於一無線器件中之各種組件。
302...去抖動緩衝器
304...接收終端機
306...增強型封包丟失隱蔽(PLC)模組
308...解碼器
310...未來語音訊框
312...脈衝編碼調變(PCM)樣本
318...音訊介面
320...PCM資料
321...先前語音訊框
322...當前語音訊框
330...VoIP用戶端

Claims (34)

  1. 一種用於重建一被抹除語音訊框之方法,其包含:自一緩衝器接收一第二語音訊框,其中該第二語音訊框之索引位置大於該被抹除語音訊框之索引位置;基於該第二語音訊框及一第三語音訊框中之一者或其兩者判定使用哪一類型之封包丟失隱蔽(PLC)方法,其中該第三語音訊框之索引位置小於該被抹除語音訊框之該索引位置;及自該第二語音訊框及該第三語音訊框中之一者或其兩者重建該被抹除語音訊框。
  2. 如請求項1之方法,其進一步包含接收一指示符,其中該指示符指示該被抹除語音訊框之該索引位置與該第二語音訊框之該索引位置之間的差。
  3. 如請求項1之方法,其進一步包含接收與該第二語音訊框相關聯之一訊框速率及一訊框類型。
  4. 如請求項1之方法,其進一步包含使用該第二語音訊框之一參數及該第三語音訊框之一參數內插該被抹除語音訊框之一參數。
  5. 如請求項1之方法,其進一步包含偵測該被抹除語音訊框。
  6. 如請求項2之方法,其進一步包含比較該指示符與一臨限值。
  7. 如請求項2之方法,其進一步包含自該指示符計算一內插因數。
  8. 如請求項7之方法,其中該內插因數經計算為IF =,其中IF為該內插因數且m為該指示符。
  9. 如請求項1之方法,其進一步包含選擇複數種技術中之一者以重建該被抹除語音訊框。
  10. 如請求項9之方法,其中該被抹除語音訊框為一碼激勵線性預測(CELP)訊框。
  11. 如請求項9之方法,其中該被抹除語音訊框為一原型基頻週期(PPP)訊框。
  12. 如請求項1之方法,其中該緩衝器包含一個以上語音訊框,其中該等語音訊框中之一些語音訊框的該等索引位置大於該被抹除語音訊框之該索引位置且其他語音訊框的該等索引位置小於該被抹除語音訊框之該索引位置。
  13. 如請求項12之方法,其進一步包含選擇該緩衝器內之該等語音訊框中之一者,其中該語音訊框係基於該語音訊框之編碼速率、編碼類型或時間緊密性而選擇。
  14. 如請求項12之方法,其進一步包含選擇該緩衝器內之該等語音訊框中之一者,其中該語音訊框係基於該緩衝器中之該訊框之大小而選擇。
  15. 如請求項1之方法,其進一步包含應用一不良速率檢查以驗證該第二語音訊框之完整性。
  16. 如請求項1之方法,其中該第三語音訊框之訊框類型不同於該第二語音訊框之訊框類型。
  17. 如請求項1之方法,其進一步包含判定是實施一增強型封包丟失隱蔽演算法抑或實施一習知封包丟失隱蔽演算法。
  18. 如請求項17之方法,其中一增強型封包丟失隱蔽演算法經實施,且該方法進一步包含判定是否自該增強型封包丟失隱蔽演算法產生偽訊。
  19. 如請求項17之方法,其中該判定基於該第二語音訊框及該第三語音訊框中之一者或其兩者之訊框速率及訊框類型。
  20. 如請求項17之方法,其中該判定基於該第二語音訊框與該第三語音訊框之相似性。
  21. 如請求項20之方法,其進一步包含基於頻譜包絡估計或基頻波形來計算該等相似性。
  22. 如請求項1之方法,其進一步包含基於該第二語音訊框及該第三語音訊框之特性來選擇一內插因數。
  23. 如請求項1之方法,其進一步包含使用反向外插來估計該被抹除語音訊框之參數。
  24. 如請求項23之方法,其進一步包含基於該第二語音訊框及該第三語音訊框之訊框類型及特性來判定是否使用反向外插。
  25. 如請求項1之方法,其進一步包含內插該第二訊框之參數之一部分以重建該被抹除語音訊框。
  26. 一種用於重建一被抹除語音訊框之無線器件,其包含:一緩衝器,其經組態以接收語音訊框之一序列;一話音解碼器,其經組態以解碼語音訊框之該序列,其中該話音解碼器包含:一訊框抹除隱蔽模組,其經組態以自一或多個訊框重建該被抹除語音訊框,該一或多個訊框為以下類型中之一者:後續訊框及先前訊框,其中該等後續訊框包含大於該緩衝器中之該被抹除語音訊框之索引位置的一索引位置且該等先前訊框包含小於該緩衝器中之該被抹除語音訊框之索引位置的一索引位置。
  27. 如請求項26之無線器件,其中該訊框抹除隱蔽模組經進一步組態以使用該一或多個後續訊框之一參數及該一或多個先前訊框之一參數來內插該被抹除語音訊框之一參數。
  28. 如請求項26之無線器件,其中該話音解碼器經進一步組態以偵測該被抹除語音訊框。
  29. 如請求項26之無線器件,其中該訊框抹除隱蔽模組經進一步組態以接收一指示符,其中該指示符指示該緩衝器內之該被抹除語音訊框之該索引位置與一第二語音訊框之該索引位置之間的一差。
  30. 如請求項29之無線器件,其中該訊框抹除隱蔽模組經進一步組態以判定該指示符是否超過一臨限值。
  31. 如請求項29之無線器件,其中該訊框抹除隱蔽模組經進一步組態以自該指示符計算一內插因數。
  32. 如請求項26之無線器件,其中該無線器件為一手機。
  33. 一種用於重建一被抹除語音訊框之裝置,其包含:用於自一緩衝器接收一第二語音訊框的構件,其中該第二語音訊框之索引位置大於該被抹除語音訊框之索引位置;用於基於該第二語音訊框及一第三語音訊框中之一者或其兩者判定使用哪一類型之封包丟失隱蔽(PLC)方法的構件,其中該第三語音訊框之索引位置小於該被抹除語音訊框之該索引位置;及用於自該第二語音訊框及該第三語音訊框中之一者或其兩者重建該被抹除語音訊框的構件。
  34. 一種用於重建一被抹除語音訊框之電腦程式產品,該電腦程式產品包含一具有指令之電腦可讀媒體,該等指令包含:用於自一緩衝器接收一第二語音訊框的程式碼,其中該第二語音訊框之索引位置大於該被抹除語音訊框之索引位置;用於基於該第二語音訊框及一第三語音訊框中之一者或其兩者判定使用哪一類型之封包丟失隱蔽(PLC)方法的程式碼,其中該第三語音訊框之索引位置小於該被抹除語音訊框之該索引位置;及用於自該第二語音訊框及該第三語音訊框中之一者或其兩者重建該被抹除語音訊框的程式碼。
TW099118249A 2009-06-04 2010-06-04 用於重建一被抹除語音訊框之系統與方法 TWI436349B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/478,460 US8428938B2 (en) 2009-06-04 2009-06-04 Systems and methods for reconstructing an erased speech frame

Publications (2)

Publication Number Publication Date
TW201126510A TW201126510A (en) 2011-08-01
TWI436349B true TWI436349B (zh) 2014-05-01

Family

ID=42558205

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099118249A TWI436349B (zh) 2009-06-04 2010-06-04 用於重建一被抹除語音訊框之系統與方法

Country Status (8)

Country Link
US (1) US8428938B2 (zh)
EP (1) EP2438592B1 (zh)
JP (1) JP5405659B2 (zh)
KR (1) KR101290425B1 (zh)
CN (1) CN102449690B (zh)
ES (1) ES2401171T3 (zh)
TW (1) TWI436349B (zh)
WO (1) WO2010141755A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120032444A (ko) * 2010-09-28 2012-04-05 한국전자통신연구원 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
US9026434B2 (en) * 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
CN103886863A (zh) 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
FR3004876A1 (fr) * 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
MX371425B (es) 2013-06-21 2020-01-29 Fraunhofer Ges Forschung Aparato y metodo para la ocultacion mejorada del libro de codigo adaptativo en la ocultacion similar a acelp mediante la utilizacion de una estimacion mejorada del retardo de tono.
PT3011560T (pt) * 2013-06-21 2018-11-09 Fraunhofer Ges Forschung Descodificador de áudio contendo um módulo de extensão de largura de banda com um módulo de ajustamento de energia
PL3011555T3 (pl) * 2013-06-21 2018-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja ramki sygnału mowy
CN107818789B (zh) * 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
AU2014350366B2 (en) 2013-11-13 2017-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
CN104751849B (zh) 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
WO2015134579A1 (en) 2014-03-04 2015-09-11 Interactive Intelligence Group, Inc. System and method to correct for packet loss in asr systems
CN104934035B (zh) * 2014-03-21 2017-09-26 华为技术有限公司 语音频码流的解码方法及装置
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9680507B2 (en) 2014-07-22 2017-06-13 Qualcomm Incorporated Offset selection for error correction data
CN107112022B (zh) * 2014-07-28 2020-11-10 三星电子株式会社 用于时域数据包丢失隐藏的方法
CN108011686B (zh) * 2016-10-31 2020-07-14 腾讯科技(深圳)有限公司 信息编码帧丢失恢复方法和装置
US10217466B2 (en) * 2017-04-26 2019-02-26 Cisco Technology, Inc. Voice data compensation with machine learning
CN109496333A (zh) * 2017-06-26 2019-03-19 华为技术有限公司 一种丢帧补偿方法及设备
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
AU2019437394A1 (en) * 2019-03-25 2021-10-21 Razer (Asia-Pacific) Pte. Ltd. Method and apparatus for using incremental search sequence in audio error concealment
CN114078479A (zh) * 2020-08-18 2022-02-22 北京有限元科技有限公司 语音传输和语音传输数据准确性判定的方法和装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
WO2005109401A1 (ja) 2004-05-10 2005-11-17 Nippon Telegraph And Telephone Corporation 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
US8355907B2 (en) 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
CN101000768B (zh) 2006-06-21 2010-12-08 北京工业大学 嵌入式语音编解码的方法及编解码器
US8239190B2 (en) 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
CN101155140A (zh) 2006-10-01 2008-04-02 华为技术有限公司 音频流错误隐藏的方法、装置和系统
AU2007318506B2 (en) 2006-11-10 2012-03-08 Iii Holdings 12, Llc Parameter decoding device, parameter encoding device, and parameter decoding method
US8000961B2 (en) * 2006-12-26 2011-08-16 Yang Gao Gain quantization system for speech coding to improve packet loss concealment

Also Published As

Publication number Publication date
TW201126510A (en) 2011-08-01
KR101290425B1 (ko) 2013-07-29
US20100312553A1 (en) 2010-12-09
JP2012529082A (ja) 2012-11-15
KR20120019503A (ko) 2012-03-06
EP2438592A1 (en) 2012-04-11
JP5405659B2 (ja) 2014-02-05
EP2438592B1 (en) 2013-02-13
US8428938B2 (en) 2013-04-23
WO2010141755A1 (en) 2010-12-09
CN102449690A (zh) 2012-05-09
CN102449690B (zh) 2014-05-07
ES2401171T3 (es) 2013-04-17

Similar Documents

Publication Publication Date Title
TWI436349B (zh) 用於重建一被抹除語音訊框之系統與方法
TWI464734B (zh) 用於在一語音訊框內避免資訊流失的系統與方法
AU2017265060B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
JP6306177B2 (ja) 時間ドメイン励振信号を修正するエラーコンシールメントを用いて、復号化されたオーディオ情報を提供する、オーディオデコーダおよび復号化されたオーディオ情報を提供する方法
RU2419167C2 (ru) Система, способы и устройство для восстановления при стирании кадра
CA2658560C (en) Systems and methods for modifying a window with a frame associated with an audio signal
TWI484479B (zh) 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
KR20070099055A (ko) 음성 통신에서의 프레임 소거 은닉