TWI464734B - 用於在一語音訊框內避免資訊流失的系統與方法 - Google Patents

用於在一語音訊框內避免資訊流失的系統與方法 Download PDF

Info

Publication number
TWI464734B
TWI464734B TW099118250A TW99118250A TWI464734B TW I464734 B TWI464734 B TW I464734B TW 099118250 A TW099118250 A TW 099118250A TW 99118250 A TW99118250 A TW 99118250A TW I464734 B TWI464734 B TW I464734B
Authority
TW
Taiwan
Prior art keywords
voice frame
voice
frame
mode
data rate
Prior art date
Application number
TW099118250A
Other languages
English (en)
Other versions
TW201131550A (en
Inventor
Zheng Fang
Daniel J Sinder
Ananthapadmanabhan Arasanipalai Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201131550A publication Critical patent/TW201131550A/zh
Application granted granted Critical
Publication of TWI464734B publication Critical patent/TWI464734B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes
    • H03M13/47Error detection, forward error correction or error protection, not provided for in groups H03M13/01 - H03M13/37
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0083Formatting with frames or packets; Protocol or part of protocol for error control

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Description

用於在一語音訊框內避免資訊流失的系統與方法
本發明之系統及方法係關於通信及無線相關技術。詳言之,本發明之系統及方法係關於用於在一語音訊框內避免資訊流失的系統及方法。
數位話音通信已在電路交換式網路上執行。電路交換式網路為一實體路徑係在一呼叫之持續期間建立於兩個終端機之間的網路。在電路交換式應用中,一傳輸終端機在該實體路徑上將含有話音資訊之封包之一序列發送至接收終端機。該接收終端機使用該等封包中所含之該話音資訊來合成語音。
數位話音通信已開始在封包交換式網路上執行。封包交換式網路為封包係基於一目的地位址而經由該網路來投送的網路。關於封包交換式通信,路由器個別地判定用於每一封包之一路徑,從而沿著任何可用路徑向下發送封包以達到其目的地。結果,該等封包並不在相同時間或以相同次序到達該接收終端機。一去抖動緩衝器可用於該接收終端機中以按次序放回該等封包且使該等封包以一連續順序方式播出。
在一些情況下,封包在自該傳輸終端機至該接收終端機之轉變中流失。流失的封包可使該合成語音之品質降級。因而,可藉由提供用於在一語音訊框內避免資訊流失的系統及方法來實現益處。
話音應用可在一封包交換式網路中實施。舉例而言,話音應用可在一網路電話(VoIP)網路中實施。具有話音資訊之封包可在該網路上自一第一器件傳輸至一第二器件。然而,該等封包中之一些可能在該等封包之傳輸期間流失。舉例而言,多個封包之流失(有時稱為叢發性封包流失)可能為一接收器件處之所感知語音品質降級的原因。在一組態中,一封包可包括一或多個訊框。
為了減輕一VoIP網路中之封包流失所造成的所感知語音品質之降級,存在兩種類型之解決方法。第一種解決方法可為一基於接收器之封包流失隱蔽(PLC)方法。PLC方法可為一用以遮蔽封包流失在VoIP通信中之效應的技術。舉例而言,可實施PLC方法以產生一代替在傳輸期間流失的封包之替代封包。PLC方法可嘗試產生一儘可能類似於該流失封包之封包。基於接收器之PLC可不需要任何額外資訊或來自發送器之幫助來產生該替代封包。然而,當重要語音訊框流失時,PLC方法不能有效地遮蔽封包流失之效應。
第二種解決方法可為一基於發送器之封包流失恢復(packet loss resilient)方案。此方案之一實例可為一前向錯誤校正(FEC)方法。該FEC方法可包括隨每一封包發送某一額外資料。該額外資料可用以復原資料在傳輸期間流失所造成的錯誤。舉例而言,FEC方案可傳輸冗餘語音訊框。換言之,藉由發送器傳輸一語音訊框之一個以上複本 (通常為兩個)。此等兩個訊框可被稱為主複本及冗餘複本。
儘管基於發送器之封包流失恢復方案可改良經解碼語音之所感知品質,但此等方案亦可使在語音之傳輸期間所使用的頻寬增加。傳統FEC方案亦可使端對端延遲增加,此係即時會話無法容忍的。舉例而言,習知的基於發送器之方案在兩個不同時間段將相同的語音訊框發送兩次。此至少可使資料速率倍增。一些習知方案可將一低位元率編解碼器用於冗餘複本,以降低資料速率。然而,低位元率編解碼器之使用可使編碼器處之複雜性增加。另外,一些習知方案可將相同之低位元率編解碼器用於訊框之主複本及訊框之冗餘複本兩者。雖然此可降低編碼器處之複雜性且降低資料速率,但基線語音品質(亦即,無訊框流失時的語音品質)被極大地降低。此外,習知的基於發送器之方案在假定至少一訊框間隔之額外延遲的情況下操作。
本發明之系統及方法提供一源及頻道控制的FEC方案以獲得語音品質、延遲及資料速率之間的最佳取捨。在一組態中,此FEC方案中未引入額外延遲。可達成語音品質在中等資料速率增加下的高品質改良。下文所描述之FEC方案亦可在任何目標資料速率下操作。在一實例中,可基於一傳輸頻道之條件以及外部控制來適應性地調整該FEC方案及一目標資料速率。所建議之FEC方案亦可與舊式通信器件(例如,舊式手機)相容。
揭示一種用於在一語音信號內避免資訊流失之方法。該 方法可包括選擇一待編碼之第一語音訊框。該方法亦可包括基於一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框。該方法亦可包括在該第二語音訊框為一關鍵語音訊框的情況下產生該第二語音訊框之一經編碼版本之一至少一部分。該方法亦可包括傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分。
揭示一種用於在一語音信號內避免資訊流失之無線器件。該無線器件可包括一關鍵訊框識別模組,其經組態以使用一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框。該無線器件亦可包括一前向錯誤校正(FEC)模組,其經組態以在該第二語音訊框為一關鍵語音訊框的情況下根據一選定前向錯誤校正模式來產生該第二語音訊框之一經編碼版本之至少一部分。該無線器件亦可包括一傳輸器,其經組態以傳輸第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分。
揭示一種用於在一語音信號內避免資訊流失之裝置。該裝置可包括用於選擇一待編碼之第一語音訊框的構件。該裝置亦可包括用於基於一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框的構件。該裝置亦可包括用於在該第二語音訊框為一關鍵語音訊框的情況下根據一選定前向錯誤校正模式來產生該第二語音訊框之一經編碼版本之至少一部分的構件。 該裝置可進一步包括用於傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分的構件。
揭示一種用於在一語音信號內避免資訊流失之電腦程式產品。該電腦程式產品可包括一具有指令之電腦可讀媒體。該等指令可包括用於選擇一待編碼之第一語音訊框的程式碼。該等指令亦可包括用於基於一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框的程式碼。該等指令可進一步包括用於在該第二語音訊框為一關鍵語音訊框的情況下根據一選定前向錯誤校正模式來產生該第二語音訊框之一經編碼版本之至少一部分的程式碼。該等指令亦可包括用於傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分的程式碼。
圖1為說明在一傳輸媒體114上的一傳輸終端機102及一接收終端機104之一實例的方塊圖100。傳輸終端機102及接收終端機104可為能夠支援話音通信之任何器件,包括電話、電腦、音訊廣播及接收設備、視訊會議設備或其類似者。在一組態中,傳輸終端機102及接收終端機104可利用諸如分碼多重存取(CDMA)能力之無線多重存取技術來實施。CDMA為一基於展頻通信之調變及多重存取方案。
傳輸終端機102可包括一話音編碼器106且接收終端機104可包括一話音解碼器108。話音編碼器106可用以藉由基於一人類語音產生模型提取參數來壓縮來自一第一使用者介面110之語音。一傳輸器112可用以跨越傳輸媒體114 傳輸包括此等參數之封包。傳輸媒體114可為一基於封包之網路(諸如,網際網路或一企業內部網路)或任何其他傳輸媒體。位於傳輸媒體114之另一端處的一接收器116可用以接收該等封包。話音解碼器108可使用該等封包中之該等參數合成語音。該合成語音可提供至接收終端機104上之一第二使用者介面118。儘管未圖示,但可在傳輸器112及接收器116兩者中執行各種信號處理功能,諸如包括循環冗餘檢查(CRC)功能之迴旋編碼、交錯、數位調變、展頻處理等。
通信之每一方可進行傳輸以及接收。每一終端機可包括一話音編碼器及解碼器。該話音編碼器及解碼器可為獨立器件或可整合至一稱為「聲碼器」之單一器件中。在以下詳細描述中,將描述終端機102、104,其在傳輸媒體114之一端具有一話音編碼器106且在另一端具有一話音解碼器108。
在傳輸終端機102之至少一組態中,語音可以訊框形式自第一使用者介面110輸入至話音解碼器106,且每一訊框經進一步分割成子訊框。可在某一區塊處理執行之處使用此等任意訊框邊界。然而,若實施的是連續處理而非區塊處理,則可能不將該等語音樣本分割成訊框(及子訊框)。在所描述實例中,跨越傳輸媒體114傳輸之每一封包可視特定應用及總設計約束而包括一或多個訊框。
話音編碼器106可為一可變速率或固定速率編碼器。可變速率編碼器可視語音內容而在訊框間於多個編碼器模式之間動態地切換。話音解碼器108亦可在訊框間於相應解碼器模式之間動態地切換。可為每一訊框選擇一特定模式以達成在維持接收終端機104處之可接收信號重現時可獲得之最低位元率。
在一組態中,接收器終端機104亦可將頻道狀態資訊120回饋至傳輸終端機102。在一實例中,接收終端機104收集來自傳輸終端機102之與用以傳輸封包之頻道之品質有關的資訊。接收終端機104可使用該收集到的資訊估計該頻道之品質。此估計可接著作為頻道狀態資訊120回饋至傳輸終端機102。傳輸終端機102可使用頻道狀態資訊120調適與基於發送器之封包流失恢復方案(亦即,FEC方案)相關聯之一或多個功能。關於基於接收到的頻道狀態資訊120調適FEC方案的細節將在下文中予以較全面描述。
話音編碼器106及解碼器108可使用線性預測編碼(LPC)。在LPC編碼之情況下,語音可藉由一語音源(聲帶)模型化,該語音源之特徵在於其強度及基頻。來自聲帶之語音穿過聲道(喉嚨及嘴),聲道之特徵在於其共振,其被稱為「共振峰(formant)」。該LPC話音編碼器可藉由估計共振峰、自語音移除其效應及估計殘餘語音之強度及基頻來分析語音。接收端處之LPC話音解碼器可藉由逆轉該過程來合成語音。詳言之,該LPC話音解碼器可使用殘餘語音建立語音源、使用共振峰建立一濾波器(其表示聲道)且使該語音源穿過該濾波器以合成該語音。
圖2為說明一LPC話音編碼器206之一實例的方塊圖。LPC話音編碼器206可包括一LPC模組202,其估計來自一當前或第N個語音訊框216中之語音的共振峰。基本解決方法可為一差分方程式,其將一訊框中之每一語音樣本表示為先前語音樣本之一線性組合(語音樣本之短期聯繫)。該差分方程式之係數表示該等共振峰之特性。可將該等LPC係數222應用至一反向濾波器214,該反向濾波器可自語音移除共振峰之效應。殘餘語音可與該等LPC係數一起經由該傳輸媒體傳輸,使得可在接收端處重建該語音。在LPC話音編碼器206之至少一組態中,藉由一變換模組204將該等LPC係數變換成線頻譜對(LSP)。變換該等係數以達成較好之傳輸及數學調處(mathematical manipulation)效率。
其他壓縮技術可用以藉由消除冗餘材料而使表示語音所需之資訊動態地減少。此可藉由利用存在藉由人的聲帶之週期振動產生的特定基本頻率之事實達成。此等基本頻率常常被稱為「基頻(pitch)」。基頻可藉由「適應性碼簿參數」量化,該等適應性碼簿參數包括(1)以語音樣本為單位之「延遲」,其最大化語音片段之自相關函數及(2)「適應性碼簿增益」218。適應性碼簿增益可在子訊框基礎上量測(218)語音之長期週期性的強壯程度。可在殘餘語音經傳輸至該接收終端機之前自殘餘語音減去(210)此等長期週期性。
來自減法器210之殘餘語音可以任何數目種方式經進一步編碼。舉例而言,可使用一碼簿212,其為一將參數指派給最典型語音殘餘信號之表。在操作中,比較來自減法器210之殘餘語音與碼簿212中之所有條目。選擇最緊密匹配的條目之參數。固定碼簿參數包括「固定碼簿索引」及「固定碼簿增益」。固定碼簿係數含有一訊框之新資訊(能量)。該新資訊基本上為訊框之間的差之一經編碼表示。該固定碼簿增益表示接收終端機104中之話音解碼器108在將該新資訊(固定碼簿係數)應用於語音之當前子訊框時應使用的增益。
一基頻估計器208亦可用以產生一稱作「差量延遲」或「D延遲」之額外適應性碼簿參數。D延遲為當前訊框與先前訊框之間的量測到的延遲之差。然而,D延遲具有一有限範圍且可在該兩個訊框之間的延遲之差溢出的情況下將其設定為零。此參數不可供接收終端機104中之話音解碼器108用以合成語音。實情為,將該參數用於計算流失或惡化的訊框之語音樣本之基頻。
在一組態中,編碼器206亦可包括一FEC模組220。FEC模組220可接收第K個語音訊框215,其中K小於或等於N。若出現在第K個語音訊框215之前的一或多個經編碼訊框217及/或出現在第K個語音訊框215之後的一或多個經編碼訊框217在FEC模組220分析第K個語音訊框215時存在,則FEC模組220亦可接收此等經編碼訊框217。
FEC模組220可分析第K個語音訊框215。FEC模組220可判定第K個語音訊框215是否為一關鍵訊框。基於包括於由FEC模組220接收之第K個語音訊框215及在第K個語音訊框215之前及/或之後出現的一或多個經編碼訊框217中之資訊,可將經分析之第K個語音訊框215視為一關鍵訊框。若判定第K個語音訊框215為一關鍵訊框,則FEC模組220亦可判定將實施之「保護」第K個語音訊框215之過程。
用以保護一關鍵訊框之過程可包括產生該關鍵訊框之一冗餘複本。該關鍵訊框之該冗餘複本可包括該關鍵訊框之該等參數中之一些或全部。FEC模組220可在第K個語音訊框215為一關鍵訊框且可能在傳輸至接收終端機104期間流失的情況下判定保護第K個語音訊框215。關於FEC模組220的更多細節將在下文加以描述。
圖3為說明一FEC模組320之一組態的方塊圖。FEC模組320可包括一或多個額外模組,其用以分析一語音訊框、判定該語音訊框是否為一關鍵訊框且藉由產生該語音訊框之一冗餘複本來保護該語音訊框。該待複製之訊框在本文中可稱為主訊框。該冗餘複本可藉由重複該主訊框之該等參數中之一些或全部而產生,或可藉由使用一不同於用以編碼該主訊框之編碼方法的編碼方法來編碼該主訊框而產生。通常,此編碼方法具有一低於該主訊框之速率。
在一實例中,FEC模組320包括一關鍵訊框識別(ID)模組302(關於圖4加以論述)、一部分訊框保護模組304(關於圖5加以論述)、一全訊框保護模組306(關於圖5加以論述)、一FEC模式選擇演算法308(關於圖5加以論述)、一頻道狀態回饋模組310(關於圖6加以論述)及一動態速率控制模組312(關於圖7加以論述)。關鍵訊框ID模組302可判定一語音訊框是否為一關鍵訊框。在一組態中,此模組302可用以在封包流失條件下識別最重要訊框。
圖4為說明一關鍵訊框識別模組402之一組態的方塊圖。模組402可藉由分析一訊框之性質430以及鄰近訊框性質432來判定一訊框是否為一關鍵訊框。該關鍵訊框可為在流失後可造成一顯著品質降級之訊框。舉例而言,若一些重要參數在先前訊框與當前訊框之間極大地變化(大於某一預定臨限值),則當前訊框可為一關鍵訊框,此係由於當前訊框可能不易自先前訊框預測。另外,關鍵訊框ID模組402可基於該訊框及該等鄰近訊框之一語音模式434來判定一語音訊框是否為一關鍵訊框。該關鍵訊框判定亦可基於該訊框及該等鄰近訊框之編碼類型435。舉例而言,語音模式434可指示每一個訊框之特性。該語音訊框編碼類型可指示用以編碼當前訊框之編碼過程。語音訊框編碼類型之實例可包含碼激勵線性預測(CELP)、雜訊激勵線性預測(NELP)、原型基頻週期(PPP)等。語音模式之實例可包括有聲、無聲、靜寂、暫時、有聲起始等。舉例而言,一關鍵CELP訊框可比一關鍵NELP訊框更為關鍵,而一話音起始訊框可比一穩定有聲訊框更為關鍵。在一組態中,關鍵訊框識別模組402可能不需要任何額外編碼延遲來判定一語音訊框是否為一關鍵訊框。
該關鍵訊框識別模組不僅可判定一訊框是否為一關鍵訊框,而且可判定一訊框之關鍵性等級。此判定可基於一語音訊框及其鄰近訊框之參數、特性、編碼類型及模式。不同的關鍵訊框可具有不同的關鍵性等級。舉例而言,對於兩個關鍵訊框A及B,若緊跟在A之後的訊框可自A高度地預測且緊跟在B之後的訊框並不十分依賴於B,則A可比B更為關鍵,因為流失A可導致一個以上訊框之品質降級。
返回圖3,FEC模組320亦可包括一FEC模式選擇演算法308。選擇演算法308可選擇將在判定一訊框為一關鍵訊框時實施的保護模式。該保護模式可指示一關鍵訊框之將被複製至該關鍵訊框之一冗餘複本中的參數的數量。保護模式之實例可包括一完全保護模式及一或多個部分保護模式。舉例而言,一部分保護模式可保護僅一個參數集合或多個參數集合。
在一實例中,該完全保護模式可藉由一全訊框保護模組306實施。該完全保護模式可指示複製一關鍵訊框中之每一個參數且將其包括於該訊框之一冗餘複本中。在一組態中,一部分保護模式可藉由一部分訊框保護模組304實施。該部分保護模式可指示僅複製一關鍵訊框之該等參數之一部分且將其包括於該關鍵訊框之該冗餘複本中。該部分保護模式亦可指示該訊框正藉由一低速率編碼方法編碼。
如圖5中所說明,一FEC模式選擇演算法508可選擇一部分訊框保護模組504或一完全訊框保全模組506來實施該選定保護模式。該完全保護模式及該等部分保護模式可有效地利用該可用頻寬,且提供與舊式通信器件之回溯相容性。在一組態中,當選擇了該完全保護模式時,可停用該部分保護模式。FEC模式選擇演算法508可基於傳輸頻道之實體性質來選擇實施哪一保護模式,該傳輸頻道用以將封包自傳輸終端機102傳輸至接收終端機104。選擇使用哪一模式亦可基於一訊框之特性。若僅參數之一子集在先前訊框與當前訊框之間極大地改變,則僅參數之此子集必須受到保護。在此狀況下,若一訊框流失發生,則可自先前訊框預測未受保護之其他參數。另外,FEC模式選擇演算法508可基於傳輸終端機102所支援的保護模式來選擇保護模式。
返回圖3,FEC模組320亦可包括一頻道狀態回饋模組310。如圖6中所展示,一頻道狀態回饋模組610可接收頻道狀態資訊620。如先前所描述,可在接收終端機104處收集並估計頻道狀態資訊620。可將頻道狀態資訊620傳輸回至傳輸終端機102。在一組態中,頻道狀態回饋模組620分析接收到的頻道狀態資訊620。資訊620可指示用於傳輸終端機102與接收終端機104之間的傳輸之頻道之品質。回饋模組610可分析該頻道之品質且將結果提供至FEC模式選擇演算法308。
基於該頻道之品質(由頻道狀態回饋模組610提供),選擇演算法308可適應性地改變該選定保護模式。換言之,當該頻道之品質退化時,FEC模式選擇演算法308可選擇該部分保護模式,以便降低將該關鍵訊框之該冗餘複本發送至接收終端機104所需之資料速率。隨著該頻道之品質增加,FEC模式選擇演算法308可調適並選擇該完全保護模式。在該完全保護模式之情況下,複製該關鍵訊框之每一參數且將其包括於該訊框之該冗餘複本中。該頻道品質之增加可指示可達成一較高資料速率。
在一組態中,頻道狀態回饋模組610亦可包括一偏移計算器622。在一實例中,該偏移計算器622判定一FEC偏移之值。該偏移可為一訊框之主複本的傳輸時間與該訊框之冗餘複本的傳輸時間之間的間隔。換言之,偏移計算器622可判定何時將一關鍵訊框之冗餘複本傳輸至一接收終端機104。通常,一封包交換式網路中之封包流失為叢發性的,且叢發長度在不同網路條件下可為不同的。因此,使用一動態調整之偏移可得到較佳的錯誤保護效能。最佳偏移可使用由該接收器所發送之頻道狀態資訊來估計。
返回圖3,FEC模組320可進一步包括一動態速率控制模組312。該速率控制模組312可決定用於每一訊框之最終保護模式以便滿足一目標資料速率。如圖7中所說明,動態速率控制模組712可基於自頻道狀態回饋模組710接收之頻道狀態資訊120及一指定目標資料速率734來決定該最終保護模式。
為了判定該最終保護模式,速率控制模組712可實施兩個步驟以接近一預定目標速率。在第一步驟中,可判定兩個鄰近操作點。操作點可為資料速率。可選擇此等兩個鄰近操作點,使得目標資料速率734之值介於該兩個操作點之值之間。在一組態中,一操作點可為基於語音訊框錯誤恢復性質之預定義保護決策。若第一操作點具有高於一第二操作點之資料速率,則與該第一操作點相關聯之保護決策之效能在封包流失條件下可優於與該第二操作點相關聯之保護決策。
在第二步驟中,在藉由第一步驟中之該兩個鄰近操作點界定的保護決策之範圍內,動態速率控制模組712可適應性地調整該保護決策以滿足目標資料速率734。在一組態中,可提供兩個動態控制演算法,例如,一隨機速率控制演算法730及一確定性速率控制演算法732。該隨機速率控制演算法730可使用一隨機演算法決定每一訊框之保護決策。可組態該隨機演算法,使得平均資料速率接近目標資料速率734。或者,該確定性速率控制演算法可經由一確定性方式決定每一訊框之保護決策。可計算每一個訊框之平均速率。若平均速率大於該目標速率,則可將一較低資料速率保護或非保護用於當前訊框;否則,可將一較高資料速率保護用於當前訊框。當前訊框之保護決策亦可由第一步驟中之該兩個鄰近操作點所界定的保護決策之範圍所限制。目標資料速率734可基於容量需求在外部指定。或者,目標資料速率734可基於頻道狀態資訊120之回饋在內部指定。
圖8為一接收終端機804之方塊圖。在此組態中,一VoIP用戶端830包括一去抖動緩衝器802。接收終端機804亦可包括一話音解碼器808。解碼器808可包括一語音產生器832。話音解碼器808可實施為一聲碼器之部分、一獨立實體,或跨越接收終端機804內之一或多個實體而分散。話音解碼器808可實施為硬體、韌體、軟體或其任何組合。以實例說明,話音解碼器808可用一微處理器、數位信號處理器(DSP)、可程式化邏輯、專用硬體或任何其他基於硬體及/或軟體之處理實體來實施。將就話音解碼器808之功能性於下文對其加以描述。話音解碼器之實施方式可視特定應用及強加於整個系統之設計約束而定。
去抖動緩衝器802可為消除由封包到達時間之變化所造成之抖動的硬體器件或軟體處理程序,封包到達時間之變化係歸因於網路壅塞、時序漂移及投送路徑改變。去抖動緩衝器802可接收話音封包中之語音訊框842。另外,去抖動緩衝器802可延遲新到達之封包,使得先前到達之封包可以正確次序連續地提供至語音產生器832,從而形成一幾乎沒有音訊失真之順暢連接。去抖動緩衝器802可為固定或適應性的。一固定去抖動緩衝器可將一固定延遲引入至該等封包。另一方面,一適應性去抖動緩衝器可適應網路延遲之改變。去抖動緩衝器802可將語音訊框提供至解碼器808。
若該去抖動緩衝器未接收到一訊框之一主複本,則在未使用FEC的情況下可造成一訊框流失。當使用FEC且當前待播放訊框之主複本流失時,該去抖動緩衝器可檢查該緩衝器中是否存在該訊框之一冗餘複本。若存在當前訊框之一冗餘複本,則可解碼該冗餘複本以產生語音樣本。該冗餘複本可為一全訊框或一部分訊框。
另外,去抖動緩衝器802可經修改而以不同方式處理一主訊框(亦即,原始關鍵訊框)及一冗餘訊框(亦即,原始關鍵訊框中之一些或全部之一複本)。緩衝器802可以不同方式處理此等兩個訊框,使得與實施FEC模組220之功能相關聯之平均延遲不大於不實施FEC模組220之功能時的平均延遲。可將訊框之冗餘複本自去抖動緩衝器802傳遞至一部分訊框解碼模組850,該冗餘複本包括主複本之參數中之一些(亦即,部分)。
如先前所提及,可藉由傳輸終端機102執行各種信號處理功能,諸如包括循環冗餘檢查(CRC)功能之迴旋編碼、交錯、數位調變及展頻處理。
可將自去抖動緩衝器802釋放之語音訊框842提供至語音產生器832,以產生合成語音844。語音產生器832可包括若干功能以便產生合成語音844。可使用此項技術中已知的將語音解碼為合成語音之任何方法。在所展示之實施例中,該語音產生器可使用一CELP解碼方法,其中一反向碼簿(inverse codebook)812可使用固定碼簿參數838。舉例而言,反向碼簿812可用以將固定碼簿係數轉換成殘餘語音,且將一固定碼簿增益應用至彼殘餘語音。可將基頻資訊添加(818)回至該殘餘語音中。該基頻資訊可藉由一基頻解碼器814自「延遲」計算。基頻解碼器814可為產生語音樣本之先前訊框的資訊之一記憶體。諸如適應性碼簿增益之適應性碼簿參數836可在被添加(818)至該殘餘語音之前藉由基頻解碼器814應用至每一子訊框中之記憶體資訊。該殘餘語音可使用線頻譜對834(諸如,來自一反變換822之LPC係數)通過一濾波器820,以將該等共振峰添加至該語音。可接著將原合成語音自濾波器820提供至一後濾波器824。後濾波器824可為音訊頻帶中之一數位濾波器,其可平滑該語音且減少頻帶外分量。或者且非限制地,語音產生器832可使用NELP或PPP全訊框解碼方法。
圖9為說明用於VoIP之前向錯誤校正(FEC)的方法900之一實例的流程圖。方法900可藉由傳輸終端機102實施。在於傳輸終端機102與接收終端機104之間建立VoIP呼叫期間,可選擇一適當FEC模式(例如,完全保護模式或部分保護模式)902。可基於實體傳輸頻道及對傳輸終端機102及接收終端機104之支援來選擇模式。亦可判定一目標資料速率。在一實例中,根據容量需求判定一目標資料速率904。亦可判定一FEC偏移值。在一實例中,該FEC偏移值為預定的。在另一實例中,可基於頻道條件適應性地調整該FEC偏移值。
可選擇一待編碼之語音訊框訊框N 906。接著可分析第K個語音訊框(KN)906且可進行關於該第K個語音訊框是否為一關鍵訊框之判定908。選擇哪一訊框加以分析906可取決於該FEC偏移。舉例而言,若該FEC偏移為2,則可分析第N-2個訊框。在一組態中,在VoIP呼叫期間,對於每一個經編碼訊框,傳輸終端機102內之編碼器106可決定該第K個語音訊框是否應受到保護(亦即,該第K個語音訊框是否為一關鍵訊框)。編碼器106亦可基於該目標資料速率、該判定908之結果及該選定FEC模式來判定保護該第K個語音訊框之方式。在一組態中,可基於自接收終端機104回饋之頻道狀態資訊120在執行時間期間調整該目標資料速率及該FEC偏移值。
若該第K個語音訊框並非一關鍵訊框,則僅將該經編碼語音訊框N傳輸至該接收終端機914。若判定908該第K個語音訊框為一關鍵訊框,則可產生該第K語音訊框之一冗餘複本910。該第K個語音訊框之該冗餘複本之產生可基於該選定FEC模式。舉例而言,該冗餘複本可視該選定FEC模式是完全保護模式抑或部分保護模式而用包括於該關鍵之第K個語音訊框中之該等參數中的一些或全部來產生。或者,該冗餘複本可使用另一編碼方法產生,該另一編碼方法可具有一比用於主複本之編碼方法低的速率。
在一組態中,可將主複本(亦即,當前語音訊框N)及該關鍵之第K個語音訊框之冗餘複本封裝成即時協定(RTP)封包,且傳輸912、914至接收終端機104。在另一組態中,雖然同時產生一訊框之主複本及該第K個語音訊框之冗餘複本,但可將該等複本個別地分封成兩個不同的RTP封包且傳輸至接收終端機。使用哪種格式之決策可基於兩個終端機之能力。若每一終端機皆支援兩種格式,則使用引起較低資料速率之格式。在接收器側處,該等語音訊框可儲存於適應性去抖動緩衝器802中。如先前所提及,可設計去抖動緩衝器802,使得語音訊框之平均延遲不大於未利用FEC技術之平均延遲。可以適當次序將該等訊框自去抖動緩衝器802發送至解碼器108。若語音訊框為具有主複本之參數中之一些的冗餘複本,則使用部分訊框解碼模組850。
上文所描述的源及頻道控制之FEC方案可減少僅引起資料速率之中等增加時的封包流失之數目及流失之叢發性。關鍵訊框識別及部分訊框保護模式可確保語音感知品質與資料速率之間的一良好取捨。對該去抖動緩衝器之修改可不引入額外的端對端延遲。動態速率控制模組312可允許上文所描述之FEC方案以任何指定資料速率進行,使得操作者可基於容量需求來決定資料速率。最後,藉由FEC模式選擇演算法308進行之FEC模式選擇可基於實體頻道性質及手機(例如,傳輸終端機102及接收終端機104)之能力來決定是否使用該部分訊框保護模式。上文所描述之FEC方案可不浪費可用頻寬且可與舊式通信器件回溯相容。
若一具有FEC功能性之終端機與一舊式終端機(其僅可解碼全訊框)通信,則可停用該部分訊框保護,使得舊式手機可受益於FEC冗餘。若將一部分訊框發送至一舊式終端機,則該舊式終端機可由於不能理解該部分訊框之格式而忽略該部分訊框,從而潛在地造成可用頻寬之浪費。
上文所描述之圖9之方法可藉由對應於圖10中所說明的手段附加功能區塊之各種硬體及/或軟體組件及/或模組來執行。換言之,圖9中所說明的區塊902至914對應於圖10中所說明的手段附加功能區塊1002至1014。
圖11說明可用於一無線器件1102中之各種組件。無線器件1102為一可經組態以實施本文中所描述之各種方法之器件的一實例。無線器件1102可為一遠端台、存取終端機、手機、個人數位助理(PDA)、蜂巢式電話等。
無線器件1102可包括一處理器1104,該處理器控制無線器件1102之操作。處理器1104亦可稱為中央處理單元(CPU)。可包括唯讀記憶體(ROM)及隨機存取記憶體(RAM)兩者的記憶體1106將指令及資料提供至處理器1104。記憶體1106之一部分亦可包括非揮發性隨機存取記憶體(NVRAM)。處理器1104通常基於儲存於記憶體1106內之程式指令來執行邏輯及算術運算。記憶體1106中之該等指令可執行以實施本文中所描述之方法。
無線器件1102亦可包括一外殼1108,該外殼可包括一傳輸器1110及一接收器1112以允許資料在無線器件1102與一遠端位置之間的傳輸及接收。傳輸器1110與接收器1112可組合成一收發器1114。一天線1116可附接至外殼1108且電耦接至收發器1114。無線器件1102亦可包括(未圖示)多個傳輸器、多個接收器、多個收發器及/或多個天線。
無線器件1102亦可包括一信號偵測器1118,該信號偵測器可用以偵測並量化由收發器1114接收的信號之位準。信號偵測器1118可將此等信號偵測為總能量、每偽雜訊(PN)碼片之導頻能量、功率譜密度及其他信號。無線器件1102亦可包括一數位信號處理器(DSP)1120以用於處理信號。
無線器件1102之各種組件可藉由一匯流排系統1122耦接在一起,除資料匯流排外,匯流排系統1122還可包括功率匯流排、控制信號匯流排及狀態信號匯流排。然而,為清楚起見,在圖11中將各種匯流排說明為匯流排系統1122。
圖12為根據所揭示系統及方法之一實例之基地台1208的方塊圖。基地台1208之不同實施之實例包括(但不限於)一演進型節點B(eNB)、一基地台控制器、一基地台收發器、一存取路由器等。基地台1208包括一收發器1220,該收發器1220包括一傳輸器1210及一接收器1212。收發器1220可耦接至一天線1218。基地台1208進一步包括一數位信號處理器(DSP)1214、一通用處理器1202、記憶體1204及一通信介面1206。基地台1208之各種組件可包括於一外殼1222內。
處理器1202可控制基地台1208之操作。處理器1202亦可稱為CPU。可包括唯讀記憶體(ROM)及隨機存取記憶體(RAM)兩者的記憶體1204將指令及資料提供至處理器1202。記憶體1204之一部分亦可包括非揮發性隨機存取記憶體(NVRAM)。記憶體1204可包括能夠儲存電子資訊之任何電子組件,且可體現化為ROM、RAM、磁碟儲存媒體、光學儲存媒體、快閃記憶體、處理器1202所包括之機載記憶體、EPROM記憶體、EEPROM記憶體、暫存器、硬碟、抽取式碟片、CD-ROM等。記憶體1204可儲存程式指令及其他類型之資料。該等程式指令可由處理器1202執行以實施本文中所揭示的該等方法中之一些或全部。
根據所揭示之系統及方法,天線1218可接收已自一附近通信器件1102傳輸之反向鏈路信號。天線1218將此等接收到的信號提供至將該等信號濾波且放大該等信號之收發器1220。該等信號係自收發器1220提供至DSP 1214及通用處理器1202以進行解調變、解碼、進一步濾波等。
基地台1208之各種組件係藉由一匯流排系統1226耦接在一起,除資料匯流排外,匯流排系統1226還可包括功率匯流排、控制信號匯流排及狀態信號匯流排。然而,為清楚起見,在圖12中將各種匯流排說明為匯流排系統1226。
於本文中使用時,術語「判定」涵蓋廣泛多種動作,且因此,「判定」可包括推算、計算、處理、導出、調查、查找(例如,在表中、資料庫中或另一資料結構中查找)、確定及類似動作。又,「判定」可包括接收(例如,接收資訊)、存取(例如,存取記憶體中之資料)及類似動作。又,「判定」可包括解析、選擇、選取、建立及類似動作。
除非另外明確規定,否則短語「基於」不意謂「僅基於」。換言之,短語「基於」描述「僅基於」及「至少基於」兩者。
結合本發明描述的各種說明性邏輯區塊、模組及電路可藉由下列各者實施或執行:通用處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列信號(FPGA)或其他可程式化邏輯器件、離散閘或電晶體邏輯、離散硬體組件,或其經設計以執行本文中所描述之功能的任何組合。通用處理器可為微處理器,但在替代例中,處理器可為任何市售之處理器、控制器、微控制器或狀態機。處理器亦可實施為計算器件之組合,例如,DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器,或任何其他此組態。
結合本發明描述之方法或演算法之步驟可直接體現於硬體中、由處理器執行之軟體模組中或硬體與軟體模組之組合中。軟體模組可駐留於此項技術中已知的任何形式之儲存媒體中。可使用的儲存媒體之一些實例包括RAM記憶體、快閃記憶體、ROM記憶體、EPROM記憶體、EEPROM記憶體、暫存器、硬碟、抽取式碟片、CD-ROM等。軟體模組可包含單一指令或許多指令,且可分散於若干不同碼段上、分散於不同程式中及跨越多個儲存媒體而分散。儲存媒體可耦接至處理器,使得該處理器可自儲存媒體讀取資訊及將資訊寫入至儲存媒體。在替代例中,儲存媒體可與處理器成一體式。
本文中所揭示之方法包含用於達成所描述方法之一或多個步驟或動作。該等方法步驟及/或動作可彼此互換而不脫離申請專利範圍之範疇。換言之,除非指定步驟或動作之特定次序,否則可修改特定步驟及/或動作之次序及/或使用而不脫離申請專利範圍之範疇。
所描述功能可以硬體、軟體、韌體或其任何組合實施。若以軟體實施,則該等功能可作為一或多個指令而儲存於電腦可讀媒體上。電腦可讀媒體可為可由電腦存取之任何可用媒體。作為實例而非限制,電腦可讀媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件,或可用以載運或儲存呈指令或資料結構形式的所要程式碼且可由電腦存取之任何其他媒體。於本文中使用時,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位影音光碟(DVD)、軟性磁碟及Blu-光碟,其中磁碟通常以磁性方式再現資料,而光碟用雷射以光學方式再現資料。
軟體或指令亦可經由傳輸媒體傳輸。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸軟體,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於傳輸媒體之定義中。
另外,應瞭解,用於執行本文中所描述之方法及技術(諸如,藉由圖9至圖10所說明之方法及技術)的模組及/或其他適當構件可在適用時由行動器件及/或基地台下載及/或以其他方式獲得。舉例而言,此器件可耦接至一伺服器以促進用於執行本文中所描述之方法之構件的轉移。或者,本文中所描述之各種方法可經由儲存構件(例如,隨機存取記憶體(RAM)、唯讀記憶體(ROM)、諸如緊密光碟(CD)或軟性磁碟之實體儲存媒體等)提供,以使得行動器件及/或基地台可在將儲存構件耦接或提供至該器件時獲得各種方法。此外,可利用用於將本文中所描述之方法及技術提供至一器件的任何其他合適技術。
應理解,申請專利範圍不限於上文所說明之精確組態及組件。可對本文中所描述之系統、方法及裝置之配置、操作及細節方面做出各種修改、改變及變化而不脫離申請專利範圍之範疇。
102...傳輸終端機
104...接收終端機
106...話音編碼器
108...話音解碼器
110...第一使用者介面
112...傳輸器
114...傳輸媒體
116...接收器
118...第二使用者介面
120...頻道狀態資訊
202...LPC模組
204...變換模組
206...LPC話音編碼器
208...基頻估計器
210...減法器
212...碼簿
214...反向濾波器
215...第K個語音訊框
216...當前或第N個語音訊框
217...出現在第K個語音訊框之前的一或多個經編碼訊框及/或出現在第K個語音訊框之後的一或多個經編碼訊框
218...適應性碼簿增益
220...FEC模組
222...LPC係數
302...關鍵訊框識別(ID)模組
304...部分訊框保護模組
306...全訊框保護模組
308...FEC模式選擇演算法
310...頻道狀態回饋模組
312...動態速率控制模組
320...FEC模組
402...關鍵訊框識別模組
430...當前訊框性質
432...鄰近訊框性質
434...語音模式
435...語音訊框編碼類型
504...部分訊框保護模組
506...全訊框保護模組
508...FEC模式選擇演算法
610...頻道狀態回饋模組
620...頻道狀態資訊
622...偏移計算器
710...頻道狀態回饋模組
712...動態速率控制模組
730...隨機速率控制演算法
732...確定性速率控制演算法
734...目標資料速率
802...去抖動緩衝器
804...接收終端機
808...話音解碼器
812...反向碼簿
814...基頻解碼器
820...濾波器
822...反變換
824...後濾波器
830...VoIP用戶端
832...語音產生器
834...線頻譜對(LSP)
836...適應性碼簿參數
838...固定碼簿參數
842...語音訊框
844...合成語音
850...部分訊框解碼模組
900...方法
1002...用於選擇一前向錯誤校正模式的構件
1004...用於判定一目標資料速率的構件
1006...用於選擇待編碼之訊框N且分析第K個訊框(KN)的構件
1010...用於根據該選定前向錯誤校正模式來產生該第K個語音訊框之一冗餘複本的構件
1012...用於傳輸該第K個語音訊框之該冗餘複本的構件
1014...用於傳輸該經編碼語音訊框的構件
1102...無線器件
1104...處理器
1106...記憶體
1108...外殼
1110...傳輸器
1112...接收器
1114...收發器
1116...天線
1118...信號偵測器
1120...數位信號處理器(DSP)
1122...匯流排系統
1202...通用處理器
1204...記憶體
1206...通信介面
1208...基地台
1210...傳輸器
1212...接收器
1214...數位信號處理器(DSP)
1218...天線
1220...收發器
1222...外殼
1226...匯流排系統
圖1為說明在一傳輸媒體上的一傳輸終端機及一接收終端機之一實例的方塊圖;
圖2為說明該傳輸終端機之另一組態的方塊圖;
圖3為說明一前向錯誤校正(FEC)模組之一組態的方塊圖;
圖4為說明一關鍵訊框識別模組之一組態的方塊圖;
圖5為說明一FEC模式選擇演算法之一實例的方塊圖;
圖6為說明一頻道狀態回饋模組之一組態的方塊圖;
圖7為說明一動態速率控制模組之一實例的方塊圖;
圖8為說明接收終端機之一組態的方塊圖;
圖9為說明一用於網路電話(VoIP)之前向錯誤校正(FEC)的方法之一實例的流程圖;
圖10說明對應於圖9中所展示之方法的手段附加功能區塊;
圖11說明可用於一無線通信器件中之各種組件;及
圖12為根據所揭示系統及方法之一實例之基地台的方塊圖。
900...方法

Claims (55)

  1. 一種用於在一語音信號內避免資訊流失之方法,其包含:選擇一待編碼之第一語音訊框;基於一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框;在該第二語音訊框為一關鍵語音訊框的情況下產生該第二語音訊框之一經編碼版本之至少一部分;及傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分。
  2. 如請求項1之方法,其進一步包含:判定一目標資料速率;及根據該判定之目標資料速率來選擇一前向錯誤校正(FEC)模式。
  3. 如請求項1之方法,其中該第二語音訊框之該經編碼版本之該至少一部分等同於該第二語音訊框。
  4. 如請求項2之方法,其中該前向錯誤校正(FEC)模式包含一完全保護模式。
  5. 如請求項2之方法,其中該前向錯誤校正(FEC)模式包含複數個部分保護模式中之一者。
  6. 如請求項1之方法,其中該第二語音訊框之該經編碼版本之該至少一部分包括該第二語音訊框內之該資訊之一子集。
  7. 如請求項6之方法,其中該第二語音訊框之該經編碼版 本之該至少一部分係使用位元率低於用以編碼該第二語音訊框之位元率的一編碼類型來建構。
  8. 如請求項1之方法,其進一步包含判定一偏移值,該偏移值指示何時傳輸該第二語音訊框之該經編碼版本之該至少一部分。
  9. 如請求項1之方法,其中判定該第二語音訊框是否為一關鍵訊框進一步包含分析該第二語音訊框及該一或多個鄰近語音訊框之性質。
  10. 如請求項1之方法,其中判定該第二語音訊框是否為一關鍵語音訊框進一步基於一用以編碼該第二語音訊框之語音模式。
  11. 如請求項10之方法,其中該第二語音訊框之該語音模式為有聲、無聲、短暫、穩定有聲或有聲起始。
  12. 如請求項1之方法,其中判定該第二語音訊框是否為一關鍵語音訊框進一步基於一用以編碼該第二語音訊框之語音編碼類型。
  13. 如請求項12之方法,其中該語音編碼類型包含碼激勵線性預測(CELP)、雜訊激勵線性預測(NELP)或原型基頻週期(PPP)。
  14. 如請求項5之方法,其進一步包含在選擇一完全保護模式的情況下停用該等部分保護模式。
  15. 如請求項2之方法,其進一步包含基於一頻道之頻道狀態資訊來調整該目標資料速率,該頻道用以傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一 部分。
  16. 如請求項1之方法,其中在該第二語音訊框的一傳輸時間與該第二語音訊框之該經編碼版本之該至少一部分的一傳輸時間之間存在一量測到的偏移。
  17. 如請求項16之方法,其中該偏移係使用用以傳輸語音訊框之一頻道之頻道狀態資訊來估計,且其中該偏移可動態地加以調整。
  18. 如請求項2之方法,其中該判定一目標資料速率係基於容量需求。
  19. 如請求項2之方法,其中該判定一目標資料速率係基於頻道狀態資訊之回饋。
  20. 如請求項2之方法,其中該選擇一前向錯誤校正(FEC)模式包含:判定該第二語音訊框之一關鍵性等級;判定一高於該目標資料速率之第一操作資料速率;判定一低於該目標資料速率之第二操作資料速率;及選擇一FEC模式以滿足該目標資料速率。
  21. 如請求項2之方法,其中該前向錯誤校正(FEC)模式係隨機地經選擇,以使得實施該模式之語音訊框之資料速率的平均值接近該目標資料速率。
  22. 如請求項2之方法,其中該前向錯誤校正(FEC)模式經選擇以使得實施該模式的該語音訊框之資料速率接近該目標資料速率。
  23. 如請求項1之方法,其中判定該第二語音訊框是否關鍵 包含計算該第二語音訊框與該一或多個鄰近語音訊框之間的差,其中該第二語音訊框在該差大於一預定臨限值的情況下為關鍵的。
  24. 如請求項10之方法,其中判定該第二語音訊框是否關鍵係基於該第二語音訊框之該語音模式。
  25. 如請求項1之方法,其中一關鍵語音訊框之關鍵性係基於該關鍵之第二語音訊框及該等鄰近語音訊框之參數、特性、編碼類型及模式來判定。
  26. 如請求項1之方法,其進一步包含將該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分分封成一或多個即時協定(RTP)封包。
  27. 如請求項26之方法,其中該一或多個RTP封包之格式基於一傳輸終端機及一接收終端機之能力。
  28. 如請求項5之方法,其中該對部分保護模式之選擇係基於頻寬可用性、該目標資料速率以及該第一語音訊框、該第二語音訊框及該等鄰近語音訊框之特性。
  29. 一種用於在一語音信號內避免資訊流失之無線器件,其包含:一關鍵訊框識別模組,其經組態以使用一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框;一前向錯誤校正(FEC)模組,其經組態以在該第二語音訊框為一關鍵語音訊框的情況下根據一選定前向錯誤校正模式來產生該第二語音訊框之一經編碼版本之至少 一部分;及一傳輸器,其經組態以傳輸第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分。
  30. 如請求項29之無線器件,其進一步包含:一目標資料速率;及一速率控制模組,其經組態以根據該目標資料速率來選擇該前向錯誤校正模式。
  31. 如請求項30之無線器件,其中該前向錯誤校正(FEC)模組經組態以根據該選定前向錯誤校正模式來產生該第二語音訊框之該經編碼版本之該至少一部分。
  32. 如請求項30之無線器件,其中該前向錯誤校正(FEC)模式包含一完全保護模式。
  33. 如請求項29之無線器件,其中該第二語音訊框之該經編碼版本之該至少一部分等同於該第二語音訊框。
  34. 如請求項30之無線器件,其中該前向錯誤校正(FEC)模式包含複數個部分保護模式中之一者。
  35. 如請求項29之無線器件,其中該第二語音訊框之該經編碼版本之該至少一部分包括該第二語音訊框內之該資訊之一子集。
  36. 如請求項29之無線器件,其中該第二語音訊框之該經編碼版本之該至少一部分係使用位元率低於用於編碼該第二語音訊框之位元率的一編碼類型來建構。
  37. 如請求項29之無線器件,其中該無線器件為一手機。
  38. 如請求項29之無線器件,其中該無線器件為一基地台。
  39. 如請求項29之無線器件,其中在該第二語音訊框的一傳輸時間與該第二語音訊框之該經編碼版本之該至少一部分的一傳輸時間之間存在一量測到的偏移。
  40. 如請求項39之無線器件,其中該偏移係使用用以傳輸語音訊框之一頻道之頻道狀態資訊來估計,且其中該偏移可動態地加以調整。
  41. 如請求項30之無線器件,其中該目標資料速率係基於容量需求來判定。
  42. 如請求項30之無線器件,其中該目標資料速率係基於頻道狀態資訊之回饋來判定。
  43. 如請求項30之無線器件,其中該速率控制模組經進一步組態以:判定該第二語音訊框之一關鍵性等級;判定一高於該目標資料速率之第一操作資料速率;判定一低於該目標資料速率之第二操作資料速率;且選擇一前向錯誤校正(FEC)模式以滿足該目標資料速率。
  44. 如請求項30之無線器件,其中該前向錯誤校正(FEC)模式係隨機地經選擇,以使得實施該模式之語音訊框之資料速率的平均值接近該目標資料速率。
  45. 如請求項30之無線器件,其中該前向錯誤校正(FEC)模式經選擇以使得實施該模式的該語音訊框之資料速率接近該目標資料速率。
  46. 如請求項29之無線器件,其中判定該第二語音訊框是否 關鍵包含計算該第二語音訊框與該一或多個鄰近語音訊框之間的差,其中該第二語音訊框在該差大於一預定臨限值的情況下為關鍵的。
  47. 如請求項29之無線器件,其中判定該第二語音訊框是否關鍵係基於該第二語音訊框之語音模式。
  48. 如請求項47之無線器件,其中該第二語音訊框之該語音模式為有聲、無聲、短暫、穩定有聲或有聲起始。
  49. 如請求項29之無線器件,其中一關鍵之第二語音訊框之關鍵性係基於該關鍵之第二語音訊框及該等鄰近語音訊框之參數、特性、編碼類型及模式來判定。
  50. 如請求項29之無線器件,其中該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分經分封成一或多個即時協定(RTP)封包。
  51. 如請求項50之無線器件,其中該一或多個RTP封包之格式基於一傳輸終端機及一接收終端機之能力。
  52. 如請求項34之無線器件,其中該對部分保護模式之選擇係基於頻寬可用性、該目標資料速率及該第一語音訊框、該第二語音訊框及該等鄰近語音訊框之特性。
  53. 如請求項29之無線器件,其進一步包含一去抖動緩衝器,該去抖動緩衝器經修改而以不同方式處理一語音訊框及該語音訊框之一些或全部之一複本。
  54. 一種用於在一語音信號內避免資訊流失之裝置,其包含:用於選擇一待編碼之第一語音訊框的構件; 用於基於一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框的構件;用於在該第二語音訊框為一關鍵語音訊框的情況下根據一選定前向錯誤校正(FEC)模式來產生該第二語音訊框之一經編碼版本之至少一部分的構件;及用於傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分的構件。
  55. 一種用於在一語音信號內避免資訊流失之電腦程式產品,該電腦程式產品包含一具有指令之電腦可讀媒體,該等指令包含:用於選擇一待編碼之第一語音訊框的程式碼;用於基於一第二語音訊框及一或多個鄰近語音訊框內之資訊來判定該第二語音訊框是否為一關鍵語音訊框的程式碼;用於在該第二語音訊框為一關鍵語音訊框的情況下根據一選定前向錯誤校正(FEC)模式來產生該第二語音訊框之一經編碼版本之至少一部分的程式碼;及用於傳輸該第一語音訊框及該第二語音訊框之該經編碼版本之該至少一部分的程式碼。
TW099118250A 2009-06-04 2010-06-04 用於在一語音訊框內避免資訊流失的系統與方法 TWI464734B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12/478,492 US8352252B2 (en) 2009-06-04 2009-06-04 Systems and methods for preventing the loss of information within a speech frame

Publications (2)

Publication Number Publication Date
TW201131550A TW201131550A (en) 2011-09-16
TWI464734B true TWI464734B (zh) 2014-12-11

Family

ID=42340364

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099118250A TWI464734B (zh) 2009-06-04 2010-06-04 用於在一語音訊框內避免資訊流失的系統與方法

Country Status (8)

Country Link
US (1) US8352252B2 (zh)
EP (1) EP2438701B1 (zh)
JP (1) JP5587405B2 (zh)
KR (1) KR101301843B1 (zh)
CN (1) CN102461040B (zh)
BR (1) BRPI1011637B1 (zh)
TW (1) TWI464734B (zh)
WO (1) WO2010141762A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411723A (zh) * 2021-01-13 2021-09-17 神盾股份有限公司 语音助理系统

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9026434B2 (en) * 2011-04-11 2015-05-05 Samsung Electronic Co., Ltd. Frame erasure concealment for a multi rate speech and audio codec
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control
US9275644B2 (en) 2012-01-20 2016-03-01 Qualcomm Incorporated Devices for redundant frame coding and decoding
US9236053B2 (en) * 2012-07-05 2016-01-12 Panasonic Intellectual Property Management Co., Ltd. Encoding and decoding system, decoding apparatus, encoding apparatus, encoding and decoding method
IN2015DN00468A (zh) 2012-07-09 2015-06-26 Ericsson Telefon Ab L M
CN103796345B (zh) * 2012-10-30 2018-01-05 中兴通讯股份有限公司 一种提升tfo的语音质量的方法及装置
CN103812824A (zh) * 2012-11-07 2014-05-21 中兴通讯股份有限公司 音频多编码传输方法及相应装置
US9263054B2 (en) * 2013-02-21 2016-02-16 Qualcomm Incorporated Systems and methods for controlling an average encoding rate for speech signal encoding
WO2014180795A1 (en) 2013-05-05 2014-11-13 Lantiq Deutschland Gmbh Timesharing for low power modes
CN103280222B (zh) * 2013-06-03 2014-08-06 腾讯科技(深圳)有限公司 音频编码、解码方法及其系统
GB201316575D0 (en) 2013-09-18 2013-10-30 Hellosoft Inc Voice data transmission with adaptive redundancy
US9209929B2 (en) 2013-09-19 2015-12-08 International Business Machines Corporation Managing quality of service for communication sessions
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
JP6433146B2 (ja) * 2014-04-22 2018-12-05 キヤノン株式会社 情報処理装置、システム、情報処理方法、コンピュータプログラム
GB2527365B (en) * 2014-06-20 2018-09-12 Starleaf Ltd A telecommunication end-point device data transmission controller
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9680507B2 (en) 2014-07-22 2017-06-13 Qualcomm Incorporated Offset selection for error correction data
US9762355B2 (en) * 2014-07-31 2017-09-12 Qualcomm Incorporated System and method of redundancy based packet transmission error recovery
US9510236B2 (en) 2015-02-02 2016-11-29 Accelerated Media Technologies, Inc. Systems and methods for electronic news gathering
US9948578B2 (en) * 2015-04-14 2018-04-17 Qualcomm Incorporated De-jitter buffer update
IL239333B (en) * 2015-06-10 2020-06-30 Elta Systems Ltd A system for creating, transmitting and receiving additional signals and the useful methods by the way
JP2017009663A (ja) * 2015-06-17 2017-01-12 ソニー株式会社 録音装置、録音システム、および、録音方法
US10313685B2 (en) 2015-09-08 2019-06-04 Microsoft Technology Licensing, Llc Video coding
US10595025B2 (en) * 2015-09-08 2020-03-17 Microsoft Technology Licensing, Llc Video coding
US20170084280A1 (en) * 2015-09-22 2017-03-23 Microsoft Technology Licensing, Llc Speech Encoding
US10142049B2 (en) 2015-10-10 2018-11-27 Dolby Laboratories Licensing Corporation Near optimal forward error correction system and method
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
US10049682B2 (en) * 2015-10-29 2018-08-14 Qualcomm Incorporated Packet bearing signaling information indicative of whether to decode a primary coding or a redundant coding of the packet
US20170187635A1 (en) * 2015-12-28 2017-06-29 Qualcomm Incorporated System and method of jitter buffer management
US10447430B2 (en) * 2016-08-01 2019-10-15 Sony Interactive Entertainment LLC Forward error correction for streaming data
CN107241166A (zh) * 2017-06-12 2017-10-10 京信通信系统(中国)有限公司 一种长期演进上的语音Volte数据保障方法和设备
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
RU2674316C1 (ru) * 2017-12-29 2018-12-06 Общество с ограниченной ответственностью "Радио Гигабит" Способ реализации гибридного автоматического запроса на передачу при использовании многоуровневого кодирования данных
US11271685B2 (en) 2017-12-29 2022-03-08 Limited Liability Company “Radio Gigabit” Method of hybrid automatic repeat request implementation for data transmission with multilevel coding
CN110890945B (zh) * 2019-11-20 2022-02-22 腾讯科技(深圳)有限公司 数据传输方法、装置、终端及存储介质
CN110838894B (zh) * 2019-11-27 2023-09-26 腾讯科技(深圳)有限公司 语音处理方法、装置、计算机可读存储介质和计算机设备
CN112820306B (zh) * 2020-02-20 2023-08-15 腾讯科技(深圳)有限公司 语音传输方法、系统、装置、计算机可读存储介质和设备
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质
CN112767955B (zh) * 2020-07-22 2024-01-23 腾讯科技(深圳)有限公司 音频编码方法及装置、存储介质、电子设备
CN116959458A (zh) * 2022-04-18 2023-10-27 腾讯科技(深圳)有限公司 音频传输方法、装置、终端、存储介质及程序产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141353A (en) * 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
TW548929B (en) * 1999-09-28 2003-08-21 Qualcomm Inc Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
US6611804B1 (en) * 1999-06-15 2003-08-26 Telefonaktiebolaget Lm Ericsson (Publ) Universal TTY/TDD devices for robust text and data transmission via PSTN and cellular phone networks
TW580691B (en) * 2001-01-31 2004-03-21 Qualcomm Inc Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
TW200627381A (en) * 2004-11-03 2006-08-01 Nokia Corp Method and device for low bit rate speech coding
US7155538B1 (en) * 2002-08-27 2006-12-26 Mindspeed Technologies, Inc. Adaptive forward error correction for optimizing communications over packet networks
TWI297987B (en) * 2004-11-23 2008-06-11 Miracom Technology Co Ltd The apparatus for providing data service between mobile and mobile in wireless communication system

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331069A (ja) * 1998-02-24 1999-11-30 Lucent Technol Inc ディジタルコ―ドレス電話機のベ―スバンドプロセッサ
US6445686B1 (en) * 1998-09-03 2002-09-03 Lucent Technologies Inc. Method and apparatus for improving the quality of speech signals transmitted over wireless communication facilities
JP2005507612A (ja) * 2001-10-29 2005-03-17 エムピーネット・インターナショナル・インコーポレイテッド マルチメディア通信のための方法、システム及びデータ構造
DE60327020D1 (de) * 2002-05-27 2009-05-20 Pioneer Corp Vorrichtung, Verfahren und computerlesbares Aufzeichnungsmedium zur Erkennung von Schlüsselwörtern in spontaner Sprache
CN101432991B (zh) * 2006-04-29 2013-01-30 汤姆森特许公司 基于互连网协议的无线网络中利用错位播放的多播会话的无缝切换
CN101098173A (zh) * 2006-06-30 2008-01-02 华为技术有限公司 动态调整无线网络中传输的业务服务质量的方法
CN101573951B (zh) * 2006-12-07 2012-12-12 适应性频谱和信号校正股份有限公司 Dsl响铃信号兼容

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141353A (en) * 1994-09-15 2000-10-31 Oki Telecom, Inc. Subsequent frame variable data rate indication method for various variable data rate systems
US6611804B1 (en) * 1999-06-15 2003-08-26 Telefonaktiebolaget Lm Ericsson (Publ) Universal TTY/TDD devices for robust text and data transmission via PSTN and cellular phone networks
TW548929B (en) * 1999-09-28 2003-08-21 Qualcomm Inc Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
TW580691B (en) * 2001-01-31 2004-03-21 Qualcomm Inc Method and apparatus for interoperability between voice transmission systems during speech inactivity
US7155538B1 (en) * 2002-08-27 2006-12-26 Mindspeed Technologies, Inc. Adaptive forward error correction for optimizing communications over packet networks
US6985856B2 (en) * 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
TW200627381A (en) * 2004-11-03 2006-08-01 Nokia Corp Method and device for low bit rate speech coding
TWI297987B (en) * 2004-11-23 2008-06-11 Miracom Technology Co Ltd The apparatus for providing data service between mobile and mobile in wireless communication system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113411723A (zh) * 2021-01-13 2021-09-17 神盾股份有限公司 语音助理系统
TWI790647B (zh) * 2021-01-13 2023-01-21 神盾股份有限公司 語音助理系統

Also Published As

Publication number Publication date
EP2438701A1 (en) 2012-04-11
CN102461040A (zh) 2012-05-16
US20100312552A1 (en) 2010-12-09
US8352252B2 (en) 2013-01-08
KR20120024934A (ko) 2012-03-14
EP2438701B1 (en) 2014-07-30
BRPI1011637A2 (pt) 2018-02-27
JP2012529243A (ja) 2012-11-15
JP5587405B2 (ja) 2014-09-10
BRPI1011637B1 (pt) 2021-01-19
KR101301843B1 (ko) 2013-08-30
WO2010141762A1 (en) 2010-12-09
CN102461040B (zh) 2014-10-22
TW201131550A (en) 2011-09-16

Similar Documents

Publication Publication Date Title
TWI464734B (zh) 用於在一語音訊框內避免資訊流失的系統與方法
US10424306B2 (en) Frame erasure concealment for a multi-rate speech and audio codec
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
KR100956522B1 (ko) 음성 통신에서의 프레임 소거 은닉
US20130185062A1 (en) Systems, methods, apparatus, and computer-readable media for criticality threshold control
Li et al. Comparison and optimization of packet loss recovery methods based on AMR-WB for VoIP