TW201338468A - 用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體 - Google Patents

用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體 Download PDF

Info

Publication number
TW201338468A
TW201338468A TW101148840A TW101148840A TW201338468A TW 201338468 A TW201338468 A TW 201338468A TW 101148840 A TW101148840 A TW 101148840A TW 101148840 A TW101148840 A TW 101148840A TW 201338468 A TW201338468 A TW 201338468A
Authority
TW
Taiwan
Prior art keywords
frame
threshold
information
calculated
encoded
Prior art date
Application number
TW101148840A
Other languages
English (en)
Other versions
TWI499247B (zh
Inventor
Venkatesh Krishnan
Daniel J Sinder
Vivek Rajendran
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201338468A publication Critical patent/TW201338468A/zh
Application granted granted Critical
Publication of TWI499247B publication Critical patent/TWI499247B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/08Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Traffic Control Systems (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Radio Relay Systems (AREA)
  • Telephone Function (AREA)

Abstract

可實施如本文中揭示之系統、方法及裝置以基於頻道條件調整話語訊框之關鍵性臨限。此臨限可用以回應於頻道狀態之改變而控制重傳輸頻率。

Description

用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體
本發明係關於音訊通信。
本專利申請案主張2012年1月12日申請且已讓與給本受讓人之題為「SYSTEMS,METHODS,APPARATUS,AND COMPUTER-READABLE MEDIA FOR BIT ALLOCATION FOR REDUNDANT TRANSMISSION」的臨時申請案第61/586,007號之優先權。本專利申請案亦主張2012年1月17日申請且已讓與給本受讓人之題為「SYSTEMS,METHODS,APPARATUS,AND COMPUTER-READABLE MEDIA FOR CRITICALITY THRESHOLD CONTROL」的臨時申請案第61/587,507號之優先權。本專利申請案亦主張2012年5月1日申請且已讓與給本受讓人之題為「SYSTEMS,METHODS,APPARATUS,AND COMPUTER-READABLE MEDIA FOR BIT ALLOCATION FOR REDUNDANT TRANSMISSION」的臨時申請案第61/641,093號之優先權。
已在電路交換式網路上執行數位音訊電信。電路交換式網路為在通話之持續時間中在兩個終端機之間建立實體路徑的網路。在電路交換式應用中,傳輸終端機在實體路徑上將一連串含有音訊(例如,語音)資訊之封包發送至接收終端機。接收終端機使用封包中含有之音訊資訊(例如,語音資訊)合成對應的音訊信號(例如,話語信號)。
已開始在封包交換式網路上執行數位音訊電信。封包交換式網路為基於目的地位址而經由網路投送封包之網路。在封包交換式通信之情況下,路由器個別地判定用於每一封包之路徑,將封包沿著任一可利用之路徑發送以到達其目的地。結果,封包可能不能同時或按相同次序到達接收終端機。去抖動緩衝器可在接收終端機中用以使封包按次序排列,且按連續依序方式播放。
有時,在自傳輸終端機中轉至接收終端機時,封包被丟失。丟失之封包可使合成之音訊信號的品質降級。因而,可藉由提供用以解決訊框內(例如,話語訊框內)的資訊丟失之系統及方法來實現益處。
一種根據一般組態的音訊信號處理之方法包括計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計。此方法亦包括基於與一傳輸頻道之一狀態有關的資訊計算一臨限值。此方法亦包括將該計算得的估計與該計算得的臨限值比較;及基於該比較之一結果,決定傳輸該第一訊框之一冗餘複本。亦揭示具有有形特徵之電腦可讀儲存媒體(例如,非暫時性媒體),該等有形特徵使讀取該等特徵之機器執行此方法。
一種用於根據一般組態的音訊信號處理之裝置包括用於計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計之構件。此裝 置亦包括用於基於與一傳輸頻道之一狀態有關的資訊計算一臨限值之構件;用於將該計算得的估計與該計算得的臨限值比較之構件;及用於基於該比較之一結果決定傳輸該第一訊框之一冗餘複本之構件。
一種用於根據另一一般組態的音訊信號處理之裝置包括一第一計算器,其經組態以計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計。此裝置亦包括一第二計算器,其經組態以基於與一傳輸頻道之一狀態有關的資訊計算一臨限值。此裝置亦包括一模式選擇器,其經組態以(A)將該計算得的估計與該計算得的臨限值比較,及(B)基於該比較之一結果決定傳輸該第一訊框之一冗餘複本。
如本文中揭示之系統、方法及裝置可經實施以針對使用臨限值控制話語訊框之重傳輸頻率之話語寫碼應用,基於頻道條件調整一或多個關鍵性臨限值。
除非明確地受到其上下文限制,否則術語「信號」在本文中用以指示其普通意義中之任一者,包括如在電線、匯流排或其他傳輸媒體上表達之一記憶體位置(或記憶體位置之集合)的狀態。除非明確地受到其上下文限制,否則術語「產生」在本文中用以指示其普通意義中之任一者,諸如,計算或以其他方式產生。除非明確地受到其上下文限制,否則術語「計算」在本文中用以指示其普通意義中之任一者,諸如,計算、評估、平滑化及/或自複數個值 選擇。除非明確地受到其上下文限制,否則術語「獲得」用以指示其普通意義中之任一者,諸如,計算、導出、接收(例如,自外部器件)及/或擷取(例如,自儲存元件陣列)。除非明確地受到其上下文限制,否則術語「選擇」用以指示其普通意義中之任一者,諸如,識別、指示、應用及/或使用兩者或兩者以上之一集合中的至少一者及少於全部者。在術語「包含」用於本發明描述及申請專利範圍中時,其並不排除其他元件或操作。術語「基於」(如在「A係基於B」中)用以指示其普通意義中之任一者,包括以下情況:(i)「自......導出」(例如,「B為A之前驅體」),(ii)「基於至少」(例如,「A係基於至少B」),及若在特定上下文中適當,(iii)「等於」(例如,「A等於B」)。類似地,術語「回應於」用以指示其普通意義中之任一者,包括「回應於至少」。除非另有指示,否則術語「A、B及C中之至少一者」及「A、B及C中之一或多者」指示「A及/或B及/或C」。
除非另有指示,否則術語「系列」用以指示一連串的兩個或兩個以上項。術語「對數」用以指示基數為十的對數,但將此運算擴展至其他基數在本發明之範疇內。術語「頻率分量」用以指示信號之一組頻率或頻帶中之一者,諸如,信號之頻域表示之樣本(例如,如由快速傅立葉變換或MDCT產生)或信號之次頻帶(例如,巴克尺度(Bark scale)或梅爾尺度(mel scale)次頻帶)。
除非另有指示,否則對具有特定特徵的裝置之操作之任 何揭示亦明確地意欲揭示具有相似特徵之方法(且反之亦然),且對根據一特定組態的裝置之操作之任何揭示亦明確地意欲揭示根據相似組態之方法(且反之亦然)。可關於如由其特定上下文指示之方法、裝置及/或系統來使用術語「組態」。按一般意義且可互換地使用術語「方法」、「處理程序」、「程序」及「技術」,除非特定上下文另有指示。具有多個子任務之「任務」亦為方法。亦按一般意義且可互換地使用術語「裝置」及「器件」,除非特定上下文另有指示。術語「元件」及「模組」通常用以指示較大組態之一部分。除非受其上下文明確地限制,否則術語「系統」在本文中用以指示其普通意義中之任一者,包括「相互作用以服務於一共同目的之一群元件」。術語「複數個」意謂「兩個或兩個以上」。藉由引用文件之一部分的任何併入亦應理解為併有在該部分內引用之術語或變數的定義,其中此等定義在文件中之別處出現,以及在所併入之部分中引用之任何圖。
除非另有指示,否則術語「編碼解碼器」、「聲碼器」、「音訊寫碼器」及「話語寫碼器」指音訊編碼器與對應的音訊解碼器之組合。除非另有指示,否則術語「寫碼」指示經由編碼解碼器轉變音訊信號,包括編碼及隨後的解碼。除非另有指示,否則術語「傳輸」指示傳播(例如,信號)至傳輸頻道內。
如本文中描述之寫碼方案可適用於寫碼任何音訊信號(例如,包括非話語音訊)。或者,可能需要將此寫碼方案 僅用於話語。在此情況下,寫碼方案可與分類方案一起使用以判定音訊信號之每一訊框的內容之類型且選擇一合適的寫碼方案。
如本文中使用之寫碼方案可用作主要編碼解碼器,或用作多層或多級編碼解碼器中之一層或一級。在一個此實例中,此寫碼方案用以寫碼音訊信號之頻率內容之一部分(例如,低頻帶或高頻帶),且另一寫碼方案用以寫碼信號之頻率內容之另一部分。在另一此實例中,此寫碼方案用以寫碼為另一寫碼層之殘餘(亦即,原始信號與經編碼信號之間的誤差)(諸如,線性預測寫碼(LPC)分析運算之殘餘)之音訊信號。
如本文中描述之方法、系統及裝置可經組態以將音訊信號作為一系列區段處理。典型的區段長度範圍自約五毫秒或十毫秒至約四十毫秒或五十毫秒,且區段可重疊(例如,其中鄰近區段重疊25%或50%)或不重疊。在一特定實例中,將音訊信號分割成一系列不重疊區段或「訊框」,每一者具有十毫秒之長度。在另一特定實例中,每一訊框具有二十毫秒之長度。音訊信號的取樣速率之實例包括(但不限於)8千赫、12千赫、16千赫、32千赫、44.1千赫、48千赫及192千赫。
音訊電信應用可實施於封包交換式網路中。舉例而言,音訊電信應用可實施於網際網路語音通訊協定(VoIP)網路中。封包可包括經編碼之音訊信號之一或多個訊框,且具有音訊(例如,語音)資訊之封包可在網路上自第一器件傳 輸至第二器件。然而,在封包之傳輸期間,該等封包中之一些可能丟失。舉例而言,多個封包之丟失(有時被稱作叢發封包丟失)可能為在接收器件處察覺之話語品質之降級的原因。
為了緩解由VoIP網路中的封包丟失造成的察覺之話語品質之降級,存在兩個類型之解決方案。第一解決方案為基於接收器之封包丟失隱藏(PLC)方法。可使用PLC方法遮蔽VoIP通信中的封包丟失之效應。舉例而言,PLC方法可經實施以建立取代封包,代替在傳輸期間丟失之封包。此PLC方法可試圖建立與丟失之封包儘可能類似的封包。基於接收器之PLC方法可能不需要來自發送者之任何額外資源或幫助以便建立取代封包。然而,當丟失了重要的話語訊框時,PLC方法在遮蔽封包丟失之效應方面可能無效。
第二解決方案為基於發送者之封包丟失復原方法。此方法包括前向錯誤校正(FEC)方法,其可包括與每一封包一起發送一些額外資料。可使用額外資料恢復由在傳輸期間的資料丟失造成之錯誤。舉例而言,FEC方案可傳輸冗餘音訊訊框。換言之,由發送者傳輸音訊訊框之一個以上複本(典型地,兩個)。此等兩個訊框可被稱作主要複本及冗餘複本。
雖然基於發送者之封包丟失復原方案可改良經解碼之話語的感知品質,但此等方案亦可增加在話語之傳輸期間使用的頻寬。傳統的FEC方案亦可增加端對端延遲,此對於即時對話而言可能不能容忍。舉例而言,習知基於發送者 之方案在兩個不同時段發送同一話語訊框兩次。此方法可至少使資料速率加倍。一些習知方案可將低位元速率編碼解碼器用於冗餘複本,以便減小資料速率。然而,低位元速率編碼解碼器之使用可增加編碼器處之複雜性。此外,一些習知方案可將同一低位元速率編碼解碼器用於訊框之主要複本及訊框之冗餘複本兩者。雖然此方法可減少編碼器處之複雜性以及減小資料速率,但基線話語品質(亦即,當無訊框丟失時之話語品質)可能大大地降低。另外,習知基於發送者之方案通常在假定有至少一個訊框時間間隔之額外延遲的情況下操作。
如本文中描述之系統、方法及裝置可經實施以提供源控制及頻道控制之FEC方案,以便獲得話語品質、延遲與資料速率之間的最佳取捨。FEC方案可經組態,使得不引入額外延遲。可在適度資料速率增加的情況下達成話語品質之高品質改良。如本文中描述之FEC方案亦可在任一目標資料速率下操作。在一實例中,可基於傳輸頻道之條件以及外部控制適應性地調整FEC方案及目標資料速率。提議之FEC方案亦可經實施以與舊版通信器件(例如,舊版手機)相容。
對於用於音訊(例如,語音)通信之一些編碼解碼器,用以編碼每一訊框的位元之總數為預定常數。此等編碼解碼器之實例包括適應性多速率(AMR)話語編碼解碼器(例如,如在可自歐洲電信標準學會(ETSI)www-dot-etsi-dot-org(法國Sophia Antipolis)獲得之3GPP技術規範(TS)26.071版本 11.0.0(2012年9月)中所描述)及AMR寬頻帶話語編碼解碼器(例如,如在ITU-T推薦G.722.2(2003年7月,國際電信聯合會www-dot-itu-dot-int)及/或可自ETSI獲得之3GPP技術規範26.190 v11.0.0(2012年9月)中所描述),其中位元之數目由被選擇用於訊框的寫碼模式判定。在此等情況下,傳輸過去訊框之冗餘複本可能要求可用於在當前訊框中寫碼信號資訊的位元數目之對應減少。此減少可對經解碼話語之感知品質具有負面影響。
可能需要實施僅針對關鍵訊框傳輸冗餘複本之靈活方法。「關鍵訊框」為預期其丟失會對經解碼信號之感知品質具有顯著影響的訊框。此外,僅若預期附送冗餘複本對目前訊框之影響最小時,才可能需要傳輸此冗餘複本。對於固定位元速率系統,可能需要判定待用於寫碼當前訊框的位元之數目,使得用於寫碼當前訊框的位元之數目與用於寫碼過去訊框之冗餘複本(例如,部分複本)的位元之數目之總數符合目標固定位元速率T。
圖1為說明經由傳輸頻道TC10及RC10在網路NW10上通信的傳輸終端機102及接收終端機104之一實例之方塊圖。終端機102及104中之每一者可經實施以執行如本文中描述之方法及/或包括如本文中描述之裝置。傳輸終端機102及接收終端機104可為能夠支援語音通信之任何器件,包括電話(例如,智慧型手機)、電腦、音訊廣播及接收設備、視訊會議設備或類似者。可(例如)藉由諸如分碼多重存取(CDMA)能力之無線多重存取技術實施傳輸終端機102及接 收終端機104。CDMA為基於展頻通信之調變及多重存取方案。
傳輸終端機102包括一音訊編碼器AE10,且接收終端機104包括一音訊解碼器AD10。音訊編碼器AE10可用以藉由根據人類話語產生之模型提取參數之值而壓縮來自第一使用者介面UI10(例如,麥克風及音訊前端)之音訊資訊(例如,話語)。頻道編碼器CE10將參數值組譯至封包內,且傳輸器TX10經由傳輸頻道TC10在網路NW10(其可包括基於封包之網路,諸如,網際網路或企業內部網路)上傳輸包括此等參數值之封包。傳輸頻道TC10可為有線及/或無線傳輸頻道,且視判定頻道品質之方式及地方而定,傳輸頻道TC10可被視為延伸至網路NW10之入口點(例如,基地台控制器)、至網路NW10內之另一實體(例如,頻道品質分析器)及/或至接收終端機104之接收器RX10。
接收終端機104之接收器RX10用以經由傳輸頻道自網路NW10接收封包。頻道解碼器CD10解碼封包以獲得參數值,且音訊解碼器AD10使用來自封包之參數值合成音訊資訊。將合成之音訊(例如,話語)提供至在接收終端機104上之第二使用者介面UI20(例如,音訊輸出級及揚聲器)。雖未展示,但各種信號處理功能可在頻道編碼器CE10及頻道解碼器CD10中執行(例如,迴旋寫碼,包括循環冗餘檢查(CRC)功能、交錯)及在傳輸器TX10及接收器RX10中執行(例如,數位調變及對應的解調變、展頻處理、類比/數位及數位/類比轉換)。
通信之每一方可傳輸以及接收,且每一終端機可包括音訊編碼器AE10及解碼器AD10之執行個體。音訊編碼器與解碼器可為分開的器件或整合至被稱作「語音寫碼器」或「聲碼器」之單一器件內。如圖1中所示,描述終端機102、104在網路NW10之一終端機處具有音訊編碼器AE10且在另一終端機處具有音訊解碼器AD10。
在傳輸終端機102之至少一組態中,可在訊框中將音訊信號(例如,話語)自第一使用者介面UI10輸入至音訊編碼器AE10,其中每一訊框被進一步分割成子訊框。在執行某一區塊處理之情況下,可使用此等任意訊框邊界。然而,若實施連續處理而非區塊處理,則可省略音訊樣本至訊框(及子訊框)之此分割。在描述之實例中,視特定應用及總體設計約束而定,在網路NW10上傳輸之每一封包可包括一或多個訊框。
音訊編碼器AE10可為可變速率或單一固定速率編碼器。視音訊內容而定(例如,視是否存在話語及/或存在何類型之話語而定),可變速率編碼器可在不同訊框間在多個編碼器模式(例如,不同固定速率)間動態切換。音訊解碼器AD10亦可按對應的方式在不同訊框間在對應的解碼器模式之間動態切換。可針對每一訊框選擇一特定模式,以在接收終端機104處維持可接受之信號再生品質的同時達成可利用的最低位元速率。
接收終端機104亦可將頻道狀態資訊120回饋至傳輸終端機102。在一個此實例中,接收終端機104經組態以收集與 載運來自傳輸終端機102之封包的傳輸頻道之品質有關的資訊。接收終端機104可使用收集之資訊估計頻道之品質。接著可將收集之資訊及/或頻道品質估計回饋至傳輸終端機102作為頻道狀態資訊120。舉例而言,如在圖1中所示,頻道編碼器CE10之一執行個體CE11可將收集之資訊及/或品質估計(例如,來自音訊解碼器AD10)組譯至封包內,以用於經由傳輸器TX10之執行個體TX11及傳輸頻道RC10傳輸回至傳輸終端機102,在傳輸終端機102處,封包由接收器RX10之執行個體RX11接收且由頻道解碼器CD10之執行個體CD11解組譯,且將資訊及/或估計提供至音訊編碼器AE10。傳輸終端機102(例如,音訊編碼器AE10)可使用頻道狀態資訊120來調適與如本文中描述之基於發送者之封包丟失復原方案相關聯的一或多個功能(例如,關鍵性臨限)。
圖2A展示包括基地收發器台BTS1-BTS3的網路NW10之實施NW20之一實例,基地收發器台BTS1-BTS3與行動台在無線電上行鏈路及下行鏈路傳輸頻道上通信。網路NW20亦包括核心網路CNW1(其連接至公眾交換電話網路PSTN及網際網路INT)及核心網路CNW2(其亦連接至網際網路INT)。網路NW20亦包括使收發器台與核心網路介面連接之基地台控制器BSC1-BSC3。網路NW20可經實施以提供終端機器件之間的封包交換式通信。核心網路CNW1亦可經由基地收發器台BTS1、BTS2提供終端機器件MS1與MS2之間的電路交換式通信,及/或提供此終端機器件與 在PSTN上之終端機器件之間的電路交換式通信。
圖2A亦展示可經由網路NW20相互通信(例如,在封包交換式通信鏈路上)的不同終端機器件之實例:行動台MS1-MS3;網際網路語音通訊協定(VoIP)電話VP;及電腦CP,其經組態以執行電信程式(例如,來自Microsoft Skype Division,LU之Skype軟體)。終端機器件MS1-MS3、VP及CP中之任一者可經實施以包括傳輸終端機102之一執行個體及接收終端機104之一執行個體。行動器件MS1-MS3經由無線無線電上行鏈路及下行鏈路傳輸頻道與網路通信。終端機VP及CP經由有線傳輸頻道(例如,乙太網路纜線)及/或無線傳輸頻道(例如,IEEE 802.11或「WiFi」鏈路)與網路通信。網路NW20亦可包括中間實體,諸如,閘道器及/或TRAU(代碼轉換器及速率配接器單元)。
音訊編碼器AE10通常按時間或「訊框」將輸入信號作為一系列不重疊區段進行處理,其中針對每一訊框計算新的編碼訊框。訊框週期通常為可預期信號局部穩定之週期;普通實例包括二十毫秒(等效於按16 kHz之取樣速率320個樣本、按12.8 kHz之取樣速率256個樣本或按8 kHz之取樣速率160個樣本)及十毫秒。亦可能實施音訊編碼器AE10而將輸入信號作為一系列重疊訊框進行處理。
圖2B展示包括一訊框編碼器FE10的音訊編碼器AE10之一實施AE20之方塊圖。訊框編碼器FE10經組態以編碼輸入信號之一連串訊框CF(「核心音訊訊框」)中的每一者以產生一連串經編碼音訊訊框EF中的對應者。音訊編碼器 AE10亦可經實施以執行額外任務,諸如,將輸入信號分成訊框及選擇一用於訊框編碼器FE10的寫碼模式(例如,選擇初始位元分配之重新分配,如本文中參考任務T400描述)。選擇一寫碼模式(例如,速率控制)可包括執行語音活動偵測(VAD)及/或另外分類訊框之音訊內容。在此實例中,音訊編碼器AE20亦包括一語音活動偵測器VAD10,其經組態以處理核心音訊訊框CF以產生語音活動偵測信號VS(例如,如在可在ETSI獲得的3GPP TS 26.194 v11.0.0(2012年9月)中所描述)。
通常根據源濾波器模型來實施訊框編碼器FE10,該源濾波器模型將輸入音訊信號之每一訊框編碼為:(A)描述濾波器之一組參數,及(B)將在解碼器處用以驅動所描述之濾波器產生音訊訊框之經合成再生之激勵信號。話語信號之頻譜包絡通常由表示聲道(例如,咽喉及嘴)之共振且稱為共振峰之峰值表徵。多數話語寫碼器至少將此粗略頻譜結構編碼為諸如濾波器係數之一組參數。剩餘殘餘信號可模型化為一驅動濾波器產生話語信號且通常由其強度及音調表徵之源(例如,如由聲帶產生)。
訊框編碼器FE10通常經實施以執行基於碼簿之方案(例如,碼簿激勵線性預測或CELP)及/或原型波形內插(PWI)方案(例如,原型音調週期或PPP),但訊框編碼器FE10亦可經實施以執行其他方案(例如,正弦話語寫碼及/或基於變換之寫碼)。可由訊框編碼器FE10用以產生經編碼訊框EF的編碼方案之特定實例包括(但不限於)G.726、G.728、 G.729A、AMR、AMR-WB、AMR-WB+(例如,如在2012年9月之3GPP TS 26.290 v11.0.0(可自ETSI獲得)中所描述)、VMR-WB(例如,如在2005年4月之第三代合作夥伴計劃2(3GPP2)文件C.S0052-A v1.0(可在線上於www-dot-3gpp2-dot-org處獲得)中所描述)、增強型可變速率編碼解碼器(EVRC,如在2011年12月之3GPP2文件C.S0014-E v1.0(可在線上於www-dot-3gpp2-dot-org處獲得)中所描述)、可選擇模式聲碼器話語編碼解碼器(如在2004年1月之3GPP2文件C.S0030-0,v3.0(可在線上於www-dot-3gpp2-dot-org處獲得)中所描述)及增強型語音服務編碼解碼器(EVS,例如,如在可自ETSI獲得之3GPP TR 22.813 v10.0.0(2010年3月)中所描述)。
圖3展示訊框編碼器FE10之一基本實施FE20之方塊圖,其包括一預處理模組PP10、一線性預測寫碼(LPC)分析模組LA10、一開放迴路音調搜尋模組OL10、一適應性碼簿(ACB)搜尋模組AS10、一固定碼簿(FCB)搜尋模組FS10及一增益向量量化(VQ)模組GV10。可實施預處理模組PP10,例如,如在3GPP TS 26.190 v11.0.0之第5.1章中所描述。在一個此實例中,預處理模組PP10經實施以執行核心音訊訊框之降頻取樣(例如,自16 kHz至12.8 kHz)、降頻取樣之訊框的高通濾波(例如,藉由50 Hz之截止頻率)及經濾波之訊框的預強調(例如,使用一階高通濾波器)。
線性預測寫碼(LPC)分析模組LA10將每一核心音訊訊框之頻譜包絡編碼為一組線性預測(LP)係數(例如,全極濾波 器之係數1/A(z))。在一實例中,LPC分析模組LA10經組態以計算十六個LP濾波器係數之一集合以表徵每一20毫秒訊框之共振峰結構。可實施分析模組LA10,例如,如在3GPP TS 26.190 v11.0.0之第5.2章中所描述。
分析模組LA10可經組態以直接分析每一訊框之樣本,或可首先根據開窗函數(例如,漢明(Hamming)窗)將該等樣本加權。亦可在大於訊框之窗(諸如,30 msec窗)上執行分析。此窗可對稱(例如,5-20-5,使得其包括緊接在20毫秒訊框前及後的5毫秒)或不對稱(例如,10-20,使得其包括先前訊框之最後10毫秒)。LPC分析模組通常經組態以使用Levinson-Durbin遞迴或Leroux-Gueguen演算法計算LP濾波器係數。雖然LPC編碼非常適合於話語,但其亦可用以編碼一般的音訊信號(例如,包括非話語,諸如,音樂)。在另一實施中,分析模組可經組態以計算每一訊框之一組倒頻譜係數,而非一組LP濾波器係數。
線性預測濾波器係數通常難以有效率地量化,且通常映射成用於量化及/或熵編碼之另一表示,諸如,線頻譜對(LSP)或線譜頻率(LSF),或導抗頻譜對(ISP)或導抗譜頻率(ISF)。在一實例中,分析模組LA10將該組LP濾波器係數變換成一組對應的ISF。LP濾波器係數之其他一對一表示包括部分自相關係數及對數面積比值。通常,一組LP濾波器係數與一組對應的LSF、LSP、ISF或ISP之間的變換為可逆的,但實施例亦包括變換在無錯誤時不可逆的分析模組LA10之實施。
分析模組LA10經組態以量化該組ISF(或LSF或其他係數表示),且訊框編碼器FE20經組態以將此量化之結果作為LPC索引XL輸出。此量化器通常包括向量量化器,其將輸入向量編碼為至表或碼簿中之對應的向量輸入項之索引。
訊框編碼器FE20亦包括一可選開放迴路音調搜尋模組OL10,其可用以簡化音調分析及減小適應性碼簿搜尋模組AS10中的閉合迴路音調搜尋之範疇。模組OL10可經實施以經由基於未量化之LP濾波器係數之加權濾波器濾波輸入信號、二中選一地抽取經加權之信號及每訊框產生音調估計一次或兩次(視當前速率而定)。可實施模組OL10,例如,如在3GPP TS 26.190 v11.0.0之第5.4章中所描述。
適應性碼簿(ACB)搜尋模組AS10經組態以搜尋適應性碼簿(基於過去激勵且亦稱作「音調碼簿」)以產生音調濾波器之延遲及增益。模組AS10可經實施以對目標信號(如(例如)藉由經由基於經量化及未量化之LP濾波器係數的加權之合成濾波器濾波LP殘餘來獲得)基於子訊框而圍繞開放迴路音調估計執行閉合迴路音調搜尋,且接著藉由在指示之分數音調延滯處內插過去激勵來計算適應性碼向量且計算ACB增益。模組AS10亦可經實施以使用LP殘餘來擴展過去激勵緩衝器以簡化閉合迴路音調搜尋(尤其對於少於64個樣本之子訊框大小的延遲)。模組AS10可經實施以產生ACB增益(例如,對於每一子訊框)及一經量化之索引,該經量化之索引指示第一子訊框之音調延遲(或第一及第三子訊框之音調延遲,視當前速率而定)及其他子訊框之 相對音調延遲。可實施模組AS10,例如,如在3GPP TS 26.190 v11.0.0之第5.7章中所描述。
固定碼簿(FCB)搜尋模組FS10經組態以產生指示固定碼簿(亦稱作「創新碼簿」、「創新性碼簿」、「隨機碼簿」或「代數碼簿」)之向量的索引,該向量表示激勵之未由適應性碼向量模型化的部分。模組FS10可經實施以產生碼簿索引作為含有再生FCB向量所需要的所有資訊之碼字(例如,表示脈衝位置及正負號),使得不需要碼簿。可實施模組FS10,例如,如在3GPP TS 26.190 v11.0.0之第5.8章中所描述。
增益向量量化模組GV10經組態以量化FCB及ACB增益,其可包括每一子訊框之增益。可實施模組GV10,例如,如在3GPP TS 26.190 v11.0.0之第5.9章中所描述。
作為對基於碼簿之方法的替代,可使用基於變換之方法來編碼LPC殘餘信號。舉例而言,可使用修改之離散餘弦變換(MDCT)來將殘餘編碼成包括一組MDCT係數之參數,如在Calliope超寬頻編碼解碼器(QUALCOMM Inc.,San Diego,CA)及AMR-WB+編碼解碼器之TCX選項中。在另一實例中,使用基於變換之方法來編碼音訊信號,而不執行LPC分析。
可能需要在一或多個封包交換式網路上執行終端機A(例如,傳輸使用者設備或UE,諸如,終端機102)與終端機B(例如,接收UE,諸如,終端機104)之間的即時語音通信。諸如AMR及AMR-WB之先前解決方案藉由減小位元速 率而適宜於不良頻道條件(亦稱作「速率調適」)。對於用於在VoIP(網際網路語音通訊協定)中使用之下一代編碼解碼器,位元速率之減小可能不會幫助顯著減少網路中之堵塞(例如,歸因於RTP附加項,其中RTP為即時輸送協定,如在(例如)RFC 3550,標準64(2003年7月),網際網路工程工作小組(IETF)中所描述)。如本文中揭示之方法可對聲碼器賦予較大穩固性及/或解決歸因於頻道缺陷之編碼解碼器效能問題。
自傳輸終端機A至接收終端機B的傳輸頻道之品質可由網路中之一或多個實體(例如,由在上行鏈路無線電頻道之網路端處的基地收發器台、由核心網路中之訊務分析器等)估計及/或由接收終端機B估計(例如,藉由分析封包丟失率)。可能需要使接收終端機B及/或一或多個此等實體使用帶內訊息傳遞經由控制信號(例如,使用RTP控制協定(RTCP)之控制封包,如在(例如)RFC 1889(1996年1月,IETF)中所描述)及/或經由另一服務品質(QoS)回饋機制將此頻道狀態資訊120傳遞回至傳輸UE。可實施傳輸終端機A以藉由切換至對於在有缺陷頻道下實現良好效能最佳化之操作模式(亦即,「頻道感知」模式)來應用此資訊。又,傳輸UE可經組態以若可預期不良頻道條件(例如,難管理之網路),則在呼叫設置時間選擇頻道感知操作模式。
可實施聲碼器以回應於不良頻道條件之指示(例如,封包錯誤、高抖動等)而切換至「頻道缺陷穩固模式」。在「頻道缺陷穩固模式」下,話語編碼解碼器可選擇部分或 全部地重傳輸輸入信號之某些關鍵訊框。舉例而言,在「頻道缺陷穩固模式」下操作之話語寫碼器可經組態以在訊框之關鍵性超過某一預定臨限的情況下傳輸訊框之冗餘複本。可隨一特定訊框之丟失對經解碼之話語的感知影響(如在編碼器處估計)而變來判定彼訊框之關鍵性。頻道感知編碼解碼器可經組態以回應於頻道狀態之指示而在頻道缺陷穩固模式與正常操作模式(亦即,其中不發送冗餘複本)之間切換。
如本文中揭示之系統、方法及裝置可經實施以隨頻道品質估計而變地設定用於重傳輸決策之臨限。此臨限可用以(例如)判定一訊框對於音訊信號之隨後訊框之寫碼而言是否關鍵。對於非常好的頻道,可將臨限設定得非常高。隨著頻道品質降級,可降低臨限,使得將更多的訊框視為關鍵的。
圖4A展示根據一般組態的處理音訊信號之方法M100之流程圖,其包括任務T100、T200、T300及T350。任務T100計算音訊信號之第二訊框(「相依」訊框)對在音訊信號中在第二訊框前之第一訊框(「模型」訊框,可能為「關鍵」訊框)的寫碼相依性之估計。任務T200基於與一傳輸頻道之一狀態有關的資訊計算一臨限值。任務T300將計算得的估計與計算得的臨限值比較。基於任務T300中的比較之結果,任務T350決定傳輸第一訊框之冗餘複本。決定傳輸冗餘複本可包括指示第一訊框為關鍵訊框。在一些情況下,方法M100可經實施使得不需要額外編碼延遲來 判定是否要重傳輸一訊框。
可能需要減少相依訊框亦將為關鍵訊框(亦即,對在其後之另一訊框而言關鍵)之可能性。通常,此可能性對於緊接在模型訊框後之訊框最高,且接著針對隨後訊框迅速降低。對於有聲話語,典型地,話音突峰中之開始訊框為關鍵的,且緊接在其後之訊框亦為關鍵的(例如,為了涵蓋開始訊框丟失時之情況)。然而,話音突峰中之另一訊框亦可能為關鍵的(例如,對於音調延滯發生漂移之情況)。
訊框偏移k可用以指示模型訊框與相依訊框之間的距離。在一個此實例中,訊框偏移k之值為模型訊框n與相依訊框(n+k)之間的訊框號之差(例如,比介入訊框之數目多1)。圖5C展示一典型實例,其中k之值為三。在另一實例中,k之值為四。其他可能值包括一、二、三、五及大於五之整數。
方法M100可經實施使得偏移k固定(例如,在系統實施期間或在呼叫設置期間)。可根據原始時域信號中的訊框之長度(例如,單位:毫秒)及最大容許延遲來選擇k之值。舉例而言,k之值可受到最大容許值約束(例如,以限制訊框延遲)。可能需要最大容許延遲具有八十或一百毫秒之值。在此情況下,對於使用二十毫秒訊框之方案,k可具有四或五之最大值,或對於使用十毫秒訊框之方案,可具有八、九或十之最大值。
亦可根據頻道條件(例如,如由來自接收器之回饋指示) 在呼叫期間選擇及/或更新偏移k之值。舉例而言,在正引起連續訊框之頻繁丟失(例如,歸因於長的衰落)之環境下,可能需要使用較高k值。
任務T100可經實施以基於範圍自模型及/或相依訊框之一般表徵至特定丟失影響評價的一或多個準則來計算相依訊框對模型訊框之寫碼相依性的估計(亦稱作「關鍵性量測」)。此估計可基於模型及/或相依訊框內之資訊,且亦可基於來自輸入信號中之鄰近模型訊框的一或多個訊框之資訊。
關鍵訊框可為當丟失時可造成顯著的品質降級之訊框。不同模型訊框可具有不同級別之關鍵性。舉例而言,對於兩個模型訊框n1及n2,若非常容易自訊框n1預測訊框(n1+1)(亦即,訊框n1旁之訊框)而訊框(n2+1)(亦即,訊框n2旁之訊框)並不非常依賴於訊框n2,則訊框n1可比訊框n2關鍵,此係因為丟失訊框n1可造成一個以上訊框中之品質降級。
任務T100可經實施以基於模型訊框及(可能地)相依訊框及/或鄰近模型訊框的一或多個訊框中之每一者之寫碼類型(亦即,待用以編碼訊框之寫碼處理程序)之指示計算寫碼相依性之估計。此寫碼類型之實例可包括碼激勵線性預測(CELP)、雜訊激勵線性預測(NELP)、原型波形內插(PWI)或原型音調週期(PPP)等。舉例而言,依據此準則,可將CELP模型訊框視為比NELP模型訊框關鍵。
額外或替代性地,任務T100可經實施以基於模型訊框及 (可能地)相依訊框及/或鄰近模型訊框的一或多個訊框中之每一者之話語模式(亦即,訊框之話語內容的分類)計算寫碼相依性之估計。話語模式之實例可包括有聲、無聲、靜默及瞬態。「有聲」之分類可進一步分成開始及穩定。瞬態之分類可進一步分成在瞬態中及不在瞬態中。舉例而言,依據此準則,語音開始訊框(話音突峰中之初始訊框)可比穩定有聲訊框關鍵,此係因為話音突峰中的隨後訊框之編碼可大量依賴於開始訊框中之資訊。在一實例中,任務T100經實施以回應於模型訊框為話語開始訊框及相依訊框為穩定有聲訊框的指示計算寫碼相依性之估計以指示高的相依性程度。
額外或替代性地,任務T100可經組態以基於模型訊框(及可能地相依訊框及/或鄰近模型訊框的一或多個訊框中之每一者)之一或多個其他性質計算寫碼相依性之估計。舉例而言,若一模型訊框的一些重要參數之值與先前訊框之對應值顯著不同(例如,大於某一預定臨限),則模型訊框可為關鍵訊框,此係由於可能不易於自在模型訊框前面之訊框預測該模型訊框,且模型訊框之丟失可不利地影響更類似於模型訊框而非先前訊框之隨後訊框。
此類性質之一實例為適應性碼簿(ACB)增益。模型訊框之低ACB增益值可指示該訊框與在其前面之訊框顯著不同,而相依訊框之高ACB增益值可指示該訊框非常依賴於模型訊框。圖4B展示包括任務T50及T60的方法M100之一實施M110之流程圖。任務T50使用來自模型訊框之資訊(例 如,激勵信號)產生用於相依訊框之適應性碼向量,且任務T60計算相依訊框的經編碼型式之ACB增益值。在此實例中,任務T100經實施以至少基於計算得的ACB增益值計算寫碼相依性之估計。
此類性質之另一實例為感知加權SNR(信雜比),在此情況下其可表達為
其中L以樣本計之訊框長度,c為藉由用感知加權濾波器W(z)濾波模型訊框n的經解碼型式而獲得的感知加權信號,且e為感知加權誤差。舉例而言,可將誤差e計算為(A)模型訊框n的W(z)濾波之經解碼型式與(B)模型訊框n的W(z)濾波之消除誤差型式(亦即,假設該訊框在解碼器處不可用)之間的差。可根據訊框消除誤差演算法基於來自先前訊框之資訊計算消除誤差之型式。舉例而言,可根據在3GPP TS 26.091,v.11.0.0(2012年9月,「Error concealment of lost frames」,可自ETSI獲得)中描述之程序計算消除誤差型式。在一實例中,W(z)=A(z/γ)H(z),其中 a1至ap為模型訊框n之LPC濾波器係數,γ=0.92,且H(z)=1/(1-0.68z-1)。在一替代實例中,藉由將濾波器W(z)應用至經解碼型式與消除誤差型式之間的差來計算誤差e。
額外或替代性地,任務T100可經組態以將寫碼相依性之 估計作為模型訊框之丟失對一或多個隨後訊框(例如,相依訊框)之寫碼品質的影響之估計加以計算。舉例而言,關鍵性量測可基於來自相依訊框及(可能地)在模型訊框後之一或多個其他訊框的經編碼型式的資訊(例如,模型訊框及/或隨後訊框中之一或多者的適應性碼簿增益)。額外或替代性地,此量測可基於相依訊框及(可能地)在模型訊框後的一或多個其他訊框中之每一者的經解碼型式之資訊(例如,經解碼型式的感知加權SNR),其中在不使用模型訊框之資訊的情況下編碼相依及/或其他隨後訊框。
可將相依訊框(n+k)相對於模型訊框n的此量測之一實例表達為 其中L為以樣本計之訊框長度,c為藉由用感知加權濾波器W(z)濾波相依訊框(n+k)的經解碼型式而獲得的感知加權信號,且e為感知加權誤差。在此情況下可將誤差e(例如)作為(A)無模型訊框n之丟失時相依訊框(n+k)之W(z)濾波的經解碼型式與(B)假定模型訊框n之消除誤差型式時訊框(n+k)之W(z)濾波的經解碼型式之間的差加以計算。可如上所述使用相依訊框(n+k)之LPC濾波器係數計算濾波器W(z)。在一替代實例中,藉由將濾波器W(z)應用至相依訊框(n+k)的正常解碼型式與假定有丟失的解碼型式之間的差來計算誤差e。
任務T200用以計算臨限之資訊可包括下列量測中之一或 多者,可針對一系列時間間隔中之每一者更新該等量測:封包丟失率、封包丟失分率、預期的封包數目、每秒之丟失率、接收之封包計數、丟失估計有效性(例如,基於樣本大小(諸如,針對間隔所預期的封包數目)之量測的加權量測)、表觀輸貫量及抖動。如上指出,網路中(例如,沿著傳輸頻道)之接收器及/或其他實體可經組態以使用帶內訊息傳遞經由控制信號(RTCP訊息傳遞為一種此控制傳訊方法之實例)及/或經由另一服務品質(QoS)回饋機制將此頻道狀態資訊120傳遞回至傳輸UE。可經由RTCP訊息傳遞(即時輸送控制協定,如在(例如)IETF規範RFC 3550中定義)提供的資訊之實例包括傳輸之八位元組計數、傳輸之封包計數、預期之封包計數、丟失的封包之計數及/或分率、抖動(例如,延遲之變化)及往返延遲。圖6A展示包括任務T70的方法M100之一實施M120之流程圖,任務T70接收頻道狀態資訊,如在本文中所描述。
任務T200亦可經組態以基於與傳輸頻道之狀態有關的資訊120計算一個以上臨限。在此情況下,決策任務T300可經組態以使用來自訊框(及/或一或多個鄰近訊框)之資訊選擇適當的經更新臨限。舉例而言,可能需要使用一關鍵性臨限判定是否要重傳輸經判定含有話語之訊框,及使用另一關鍵性臨限判定是否要重傳輸經判定含有雜訊之訊框。在另一實例中,將不同臨限用於過渡(例如,開始)及穩定話語訊框,及/或將不同臨限用於有聲話語及無聲話語訊框。對於使用一個以上關鍵性臨限之情況,任務T200可經 組態以自兩個或兩個以上關鍵性臨限中選擇對應於待用於模型訊框之臨限的一關鍵性量測。
T300經組態以將計算得的估計與計算得的臨限值比較。任務T350基於比較之結果決定是否傳輸模型訊框之冗餘複本。舉例而言,任務T300可經實施以當計算得的估計超過(或者,不小於)計算得的臨限值時決定重傳輸。
可實施方法M100使得僅當相依訊框為作用中之話語訊框時才執行任務T350(及(可能地)任務T100及/或T200)。或者,可實施方法M100以將非話語訊框視為潛在關鍵訊框。通常,在雙向對話中,每一方在一些時間中說話(在此期間,通信系統傳輸該方之話語)(例如,少於一半之時間)及在其他時間暫停(在此期間,通信系統傳輸靜默或背景雜訊)。在靜默(或背景雜訊)週期期間的不經常傳輸或不連續傳輸(DTX)對對話之感知品質具有極少影響,但提供減少相互干擾/小區間干擾(因此潛在增大系統容量)且節省用於對話的行動單元之電池電力的益處。
典型的DTX方案由使用語音活動偵測(VAD)之話語編碼器實現。透過使用VAD,編碼器可將作用中話語與背景雜訊區分開來。編碼器用供傳輸的目標位元速率封包編碼每一作用中話語區段(通常,20 ms長),且用相對小的封包表示關鍵背景雜訊區段(再一次,通常20 ms長)。此小的封包可為指示靜默之靜默描述符(SID)。關鍵背景雜訊區段可能為緊接在話音突峰後之背景雜訊區段,或與其先前雜訊區段具有顯著不同特性之背景雜訊區段。其他類型之背景 雜訊區段(或非關鍵背景雜訊區段)可用零位元來表示,或被遮沒,或不被傳輸,或受抑制而不傳輸。當輸出封包之此型樣(即,一或多個作用中區段,接著為一或多個關鍵背景雜訊區段,接著為一或多個非關鍵背景雜訊區段)純粹視話語編碼器之輸入或來源而定時,此DTX方案稱作源控制之DTX方案。
圖5A及圖5B展示頻道狀態資訊、基於彼資訊的關鍵性臨限值與所得的將作出重傳輸之決策的可能性之間的關係之實例。在圖5B之實例中,頻道之所報告品質低於圖5A中的頻道之所報告品質。因此,圖5B中之關鍵性臨限值不如圖5A中之關鍵性臨限值挑剔,且所得的作出重傳輸之決策的可能性較高。若頻道之所報告品質變得過低,則所得的作出重傳輸之決策的可能性可變得過高。
可能需要實施方法M100以限制可被重傳輸的訊框之數目或比例。舉例而言,可能需要平衡改良在不良頻道條件下之效能與保持原生話語寫碼品質及/或阻止歸因於重傳輸(其可歸因於過度包括性的關鍵性判定而被觸發)的容量丟失。
限制重傳輸頻率之一方法為實施任務T200,使得臨限值受限於下限值(亦即,下邊界值或底值),下限值限制了可重傳輸的訊框之數目。舉例而言,可實施任務T200以強制計算得的臨限值具有一最小值。圖6B展示任務T200之包括子任務T210a、T210b及T210c的此實施T210之流程圖。任務T210a如本文中所描述(亦即,基於頻道狀態資訊)計算 候選臨限值。任務T210b將計算得的候選臨限值與邊界值(例如,下限值)比較。基於比較之結果,任務T210c在以下各者中選擇一者,使得任務T210產生選定值作為計算得的臨限值:(A)計算得的候選臨限值,及(B)邊界值。舉例而言,任務T210c可經實施以在計算得的候選值大於(或者,不小於)邊界值的情況下選擇計算得的候選值,否則,選擇邊界值。以此方式,任務T210可經組態以使計算得的臨限值截割至極限值。任務T210亦可經組態使得當比較結果為否時(例如,當截割發生時),任務T210向另一模組指示此條件(例如,用於記錄該條件、向基地台報告該條件及/或執行另一補救動作)。
當然,亦可能替代地實施任務T100使得關鍵性量測之計算得的值與關鍵性成反比例。在此情況下,任務T350可經組態以當關鍵性量測低於(或者,未超過)計算得的臨限值時決定重傳輸訊框,且任務T210可經組態以將計算得的臨限值與上限值(亦即,上邊界值或頂值)比較(及可能地將計算得的臨限值截割至上限值)。
圖7A展示方法M100之包括任務T400的一實施M200之流程圖。任務T400產生模型訊框之冗餘複本。冗餘複本通常具有比經編碼信號中的模型訊框之主要複本(亦即,正常編碼時的模型訊框之複本)少的位元,且可由解碼器用以執行前向錯誤校正(FEC)操作以校正由主要複本之部分或全部丟失導致的錯誤。可實施任務T400以在決策任務T350前,或者回應於任務T350的傳輸冗餘複本之決策產生冗餘 複本。
通常,需要冗餘複本提供可用於解碼隨後訊框之良好參考(例如,良好的適應性碼簿)。模型訊框之冗餘複本可包括模型訊框之主要複本的參數中之一些或全部。可實施任務T400以產生冗餘複本,作為模型訊框之主要複本的減少之型式。舉例而言,主要複本可為模型訊框的經編碼型式,其包括諸如頻率包絡資訊(例如,LPC或MDCT係數)及/或時間包絡資訊(例如,用於CELP編碼解碼器之固定碼簿索引、固定碼簿增益、適應性碼簿增益、音調延滯及/或音調增益;用於PWI或PPP編碼解碼器之原型參數及/或音調資訊)之分量。可實施任務T400以產生冗餘複本以包括一或多個此等分量中之每一者的部分或全部之複本。舉例而言,可實施任務T400以產生冗餘複本以包括一或多個碼簿索引,該一或多個碼簿索引識別量化之LPC濾波器參數及/或量化之時間包絡(例如,激勵信號)參數。
在此等情況下,可實施任務T400以使用(例如,複製及/或聚合)模型訊框之主要複本的已經計算之分量來組譯冗餘複本。可實施任務T400以按滿足位元約束或遵照與速率約束相關聯之結構的方式產生冗餘複本。此結構可包括用於訊框或用於訊框之一或多個子訊框中的每一者、用於諸如以上提到的參數(亦即,LPC濾波器資訊、音調延遲、固定/適應性碼簿索引/增益等)之複數個參數中之每一者的指定數目個位元。
額外或替代性地,可實施任務T400以藉由使用與用以產 生模型訊框之主要複本的寫碼方法不同的寫碼方法編碼模型訊框來產生冗餘複本之部分或全部。在此情況下,此不同寫碼方法將通常具有比用以產生模型訊框之主要複本的方法低的速率(例如,使用較低階LPC分析、使用窄頻帶編碼解碼器而非寬頻帶編碼解碼器等)。此不同寫碼方法可為不同的位元速率及/或不同的寫碼方案(例如,對於主要複本為CELP,而對於冗餘複本為PPP或PWI)。在一實例中,任務T400經實施以將模型訊框及所指示之分配Nm(例如,作為位元之數目或作為位元速率)提供至訊框編碼器(例如,訊框編碼器FE20)。
可將冗餘複本之大小指示為位元之數目或位元速率,且冗餘複本之大小可為固定的或可調整的。在一實例中,作為在音訊信號中在模型訊框後且在其上附送冗餘複本之訊框(「載波」訊框)的初始位元分配T之重新分佈的部分來指示冗餘複本之大小。載波訊框可與相依訊框相同,或可實施方法M200使得相依訊框與載波訊框可不同。T值之特定實例包括253個位元(其對應於(例如)12.65 kbps(每秒千位元)之位元速率及二十毫秒之訊框長度)及192個位元(其對應於(例如)9.6 kbps之位元速率及二十毫秒之訊框長度)。
在一個此情況下,選定重新分配分佈Nm指示將針對載波訊框的初始位元分配T分裂成將Nm個位元分配至模型訊框之冗餘複本且將(T-Nm)個位元分配至載波訊框之複本。對T個位元之分配的一組分佈中的一者的選擇可實施為選定 載波訊框之位元速率的改變及用以編碼模型訊框之冗餘複本的低位元速率方案之選擇。舉例而言,可藉由將載波訊框之位元速率自12.65 kbps之開始位元速率改變至9.6 kbps之減小的位元速率、根據現有9.6 kbps方案編碼載波訊框及使用3.05 kbps方案編碼模型訊框之冗餘複本來(例如,在AMR編碼解碼器內)實施將T個位元之分配分佈為大小為Nm個位元之一部分以載運模型訊框之冗餘複本及大小為(T-Nm)個位元之一部分以載運載波訊框之主要複本(其中T=253且Nm=61)。
可能需要針對冗餘編碼實施若干個此等低位元速率方案,每一者對應於該組分佈中之一不同者。其他開始位元速率之實例包括8.85 kbps、8.55 kbps、6.6 kbps、6.2 kbps、4 kbps、2.7 kbps及2 kbps,其分別對應於177、171、132、124、80、54及40之T值(例如,對於二十毫秒之訊框長度)。其他開始位元速率之另外實例包括23.85 kbps、23.05 kbps、19.85 kbps、18.25 kbps、15.85 kbps、14.25 kbps及12.65 kbps,其分別對應於477、461、397、365、317、285及253之T值(例如,對於二十毫秒之訊框長度)。可根據如(例如)本文中引用的AMR-WB編碼解碼器之版本10(例如,使用CELP寫碼模型)中所描述之此速率編碼訊框。
任務T400可經實施以根據載波訊框之可壓縮性的量測之值選擇冗餘複本之大小(例如,以選擇T的特定重新分配)。舉例而言,此任務可經組態以回應於指示高可壓縮 性之值選擇冗餘複本之較大大小(例如,以選擇對應的重新分配),及回應於指示低可壓縮性之值選擇冗餘複本之較小大小(例如,以選擇對應的重新分配)。可壓縮性之靜態量測之一實例為可作為載波訊框之子訊框相互間的相關性(例如,在子訊框之所有可能延滯值及所有對(或所有鄰近對)上的最大相關性,或在子訊框之每一對(或每一鄰近對)之所有可能延滯值上的最大相關性之平均值)計算之開放迴路量度。可壓縮性之動態量測之一實例為閉合迴路量度,其針對複數個冗餘複本大小候選者及/或載波訊框候選者中之每一者指示載波訊框之感知品質的相關聯改變(例如,減少)之量測。舉例而言,可將此量度作為以下者之差(例如,絕對差)或比率而計算:(A)使用全部初始位元分配T進行編碼時載波訊框之感知品質之量測,及(B)僅使用初始位元分配之在應用了冗餘複本大小候選者後剩餘的部分進行編碼時載波訊框之感知品質之量測。
任務T400可包括:根據選定的重新分配候選者將用於隨後訊框之初始位元分配T重新分配成第一部分及第二部分,將載波訊框之複本編碼成第一部分,及將模型訊框之冗餘複本編碼成第二部分。可實施任務T400以在選擇重新分配候選者(例如,作為對重新分配決策量度計算之輸入參數)前或回應於對重新分配候選者之選擇而產生載波訊框之複本。
雖然以上提及將本文中描述的原理應用於固定位元速率方案(例如,其中每一訊框接收相同初始位元分配T),但 亦可能將此等原理應用於T個位元之總訊框分配可在訊框間改變之方案。舉例而言,可用以編碼載波訊框的位元之數目T可根據載波訊框含有話語或是雜訊,或根據載波訊框含有有聲話語或是無聲話語等而變化。
在重新分配位元以編碼冗餘複本以外或作為其替代,在不良頻道條件下,可能需要增加用以編碼關鍵訊框之冗餘複本的位元之數目。舉例而言,回應於關於頻道條件之輸入(例如,如本文中參考任務T70描述之頻道狀態資訊),方法M200可經實施以調整可在有缺陷頻道上傳輸的冗餘之程度及頻率。在任務T400中用以編碼冗餘複本的位元之數目可受限於一上限,該上限反映在改良不良頻道條件下的效能與保持原生話語寫碼品質及/或減少歸因於重傳輸之容量丟失之間的平衡。在此等情況下,用以編碼冗餘複本的位元之數目可為相對於主要訊框而言額外的,而非自隨後訊框(亦即,自載波訊框)重新分配。舉例而言,用於冗餘複本的位元之數目可獨立於用於主要訊框的位元之數目,且可參考諸如頻道容量及/或網路狀態(例如,堵塞)的所接收(例如,經由傳輸頻道)資訊來判定。
方法M200亦包括任務T500,其產生包括模型訊框之冗餘複本的經編碼信號。舉例而言,可實施任務T500以將冗餘複本附送於如上所述之一或多個載波訊框(例如,經編碼信號中的對應於在原始信號中在模型訊框後的訊框之訊框)上。在一個此實例中,冗餘複本被包括於指派至在輸入音訊信號中在模型訊框後之載波訊框的封包中。在此情 況下,任務T500可包括判定載波偏移p之值,其藉由指示原始信號中模型訊框與載波訊框之間的訊框數目來識別將要載運冗餘複本的隨後訊框。替代性或額外地,任務T400可包括選擇將若干位元自編碼隨後訊框重新分配至編碼冗餘複本,該選擇可基於解碼時所得隨後訊框之感知品質之量測。亦可能需要實施任務T500以在經編碼信號內包括指示偏移之值及/或重新分配之位元之數目的資訊。或者,可由解碼器自經編碼信號中的其他資訊導出此資訊。
載波偏移p之值指示模型訊框n與載波訊框(n+p)之間的距離。偏移p之值可與偏移k之值相同(亦即,使得相依訊框為載波訊框),或方法M200可經實施以允許相依偏移k具有與載波偏移p不同的值。方法M200可經實施使得模型訊框與載波訊框之間的偏移p(例如,訊框號的差之指示,或比介入訊框之數目多1)為固定的。在一典型實例中,p之值為三。在另一實例中,p之值為四。其他可能值包括一、二、三、五及大於五之整數。
圖7B展示包括任務T500之一實施T510的方法M200之一實施M210之流程圖。任務T510包括子任務T510a,其產生含有模型訊框n之主要複本的第一封包。任務T510亦包括子任務T510b,其產生含有載波訊框(n+p)之複本及如由任務T400產生的模型訊框n之冗餘複本的第二封包。可能需要實施任務T510b以產生第二封包以包括指示其載運模型訊框之冗餘複本,指示偏移p之值及/或指示重新分配之位元數目Nm的資訊。或者,此資訊可由解碼器自經編碼信號 中的其他資訊導出。任務T510可經實施以回應於重傳輸決策T350而執行任務T510b。圖8展示方法M110、M120及M210之一實施M300之流程圖。
可實施任務T500以基於載波訊框(例如,訊框(n+p))亦將為關鍵訊框的估計之可能性選擇載波訊框(例如,選擇載波偏移p之值),此係因為可能需要避免將另一關鍵訊框之主要複本的位元重新分配。通常,此可能性對於緊接在關鍵訊框後之訊框(亦即,訊框(n+1))最高,且隨著p增大而迅速降低。對於有聲話語,開始訊框及緊接在其後之訊框(例如,為了涵蓋當開始訊框丟失時之情況)通常關鍵。然而,另一隨後訊框亦可能為關鍵的(例如,對於音調延滯發生漂移之情況)。
額外或替代性地,可實施任務T500以根據原始時域信號中的訊框之長度(例如,單位:毫秒)及最大容許延遲選擇載波訊框(例如,以選擇載波偏移p之值)。舉例而言,p之值可受到最大容許值約束(例如,以限制訊框延遲)。可能需要最大容許延遲具有八十或一百毫秒之值。在此情況下,對於使用二十毫秒訊框之方案,p可具有四或五之最大值,或對於使用十毫秒訊框之方案,p可具有八、九或十之最大值。
額外或替代性地,可實施任務T500以根據頻道條件(例如,如由來自接收器之回饋及/或如本文中描述之其他頻道狀態資訊指示)選擇載波訊框(例如,以選擇載波偏移p之值)。舉例而言,載波偏移p之值指示訊框之主要複本之傳 輸時間與該訊框之冗餘複本之傳輸時間之間的間隔之長度,且在正造成連續訊框之頻繁丟失(例如,歸因於長的衰落)的環境下,可能需要使用較高p值。通常,封包交換式網路中之封包丟失為叢發性的,且叢發長度可在不同網路條件下不同。因此,使用動態調整之載波偏移值可導致較好的錯誤保護效能。可使用頻道狀態資訊(例如,如由接收器及/或另一實體發送)估計最佳載波偏移值。舉例而言,可基於頻道條件適應性地調整(例如,在執行時間)載波偏移值。或者,載波偏移值可為預定的。
額外或替代性地,可實施任務T500以基於可壓縮性的相關聯之量測之值選擇載波訊框(例如,以選擇載波偏移p之值)。舉例而言,可實施任務T500以自在輸入音訊信號中在模型訊框後之複數P個訊框中選擇一載波訊框(例如,以選擇p之對應值,其中1<p<P)。在此情況下,可實施任務T500以選擇載波訊框作為P個候選訊框中的最可壓縮訊框,如由P個訊框中之每一者的可壓縮性量測之對應值指示。可用於此訊框選擇的可壓縮性量測之實例包括如上論述之靜態量測(例如,開放迴路量度)及動態量測(例如,閉合迴路量度)。
可實施方法M200以包括使用T個位元編碼複數P個載波訊框候選者中之至少一者(例如,非載波訊框)。此方法可甚至包括使用T個位元編碼複數P個候選訊框中的非載波訊框中之每一者。然而,信號亦可能包括兩個鄰近關鍵訊框或以其他方式相互靠近之兩個關鍵訊框,使得相對於一關 鍵訊框的P個載波訊框候選者之集合重疊相對於另一關鍵訊框的P個載波訊框候選者之集合(亦即,具有與相對於另一關鍵訊框的P個載波訊框候選者之集合共同的至少一訊框)。在此情況下,共同隨後訊框中之一者可經選擇以載運一關鍵訊框之冗餘複本,且共同隨後訊框中之另一者可經選擇以載運另一關鍵訊框之冗餘複本,使得使用少於T個位元編碼此等兩個隨後訊框中的每一者。選定隨後訊框自身亦可能為關鍵訊框。舉例而言,在一些情況下,可預期相對於一關鍵訊框的P個載波訊框候選者之集合在約百分之二十之時間可包括至少一其他關鍵訊框。
一封包可包括一或多個訊框。可能需要將封包長度限制為20毫秒(例如,以減小延滯)。圖9A展示使用用於VoIP通信之典型協定堆疊(其包括網際網路協定版本4(IPv4)、使用者資料報協定(UDP)及RTP)編碼的封包之附加項之一實例。圖9B展示IP版本6(IPv6)封包之一類似實例。有效負載大小之實例包括用於G.711編碼解碼器之160個位元組、用於G.729編碼解碼器之20個位元組及用於G.723.1編碼解碼器之24個位元組。可與如本文中描述的適應性關鍵性指示之方法一起使用的其他編碼解碼器包括(但不限於)如上列舉之G.726、G.728、G.729A、AMR、AMR-WB、AMR-WB+、VMR-WB、EVRC、SMV及EVS。
圖10展示載運模型訊框之冗餘複本及在模型訊框後的訊框之複本的RTP封包之有效負載之一實例。在AMR-WB 8.85 kbps模式下編碼冗餘複本(位元r(0)至r(176)),如由對 應的訊框類型指示符FT之值1指示,且在AMR-WB 6.6 kbps模式下編碼載波訊框之複本(位元p(0)至p(131)),如由對應的訊框類型指示符FT之值0指示。在此實例中,編碼解碼器模式請求指示符CMR請求接收終端機處之編碼器採用8.85 kbps模式,且有效負載以三個填充位元P結束以填滿最後的八位元。在另一實例中,有效負載可含有兩個以上經編碼訊框,及/或冗餘複本可具有比載波訊框之複本少的位元(亦即,可按較低速率編碼),及/或冗餘複本之位元可在封包中的載波訊框之複本之位元前(其中複本之對應的目錄輸入項之次序相應地被切換)。
可能需要實施任務T510以使用標頭壓縮:例如,以將RTP標頭自十二個位元組壓縮減至四個位元組。RTP標頭包括一時戳,其可用以計算傳輸時間;且包括序號,序號可用以正確呈現無序地接收之封包及/或偵測封包丟失。穩固標頭壓縮(ROHC;如在IETF RFC 3095、RFC 3843及/或RFC 4815中所描述)可用以支援較大壓縮率(例如,將一或多個且可能全部封包標頭壓縮減至一至四個位元組)。
在一組態中,任務T510b經實施以將載波訊框(亦即,當前話語訊框(n+p))之複本及模型話語訊框n之冗餘複本封包化成即時協定(RTP)封包以用於傳輸至接收終端機。在任務T510b之另一組態中,隨後訊框(n+p)之複本及模型話語訊框n之冗餘複本雖然被同時產生,但仍被封裝至不同的對應RTP封包且傳輸至接收終端機。使用哪一格式之決策可基於兩個終端機之能力。若在每一終端機中支援兩個格 式,則可使用引起較低資料速率之格式。
圖11為音訊解碼器AD10之一實施AD20之方塊圖。音訊解碼器AD20可實施為聲碼器之部分,或實施為獨立實體,或分佈於接收終端機104內之一或多個實體上。音訊解碼器AD20亦可實施為VoIP用戶端之部分。
音訊解碼器AD20將在以下就其功能性來予以描述。音訊解碼器AD20可實施為硬體、韌體、軟體或其任何組合,且實施其之方式可視特定應用及強加於總體系統上之設計約束而定。以實例說明,音訊解碼器AD20可實施有微處理器、數位信號處理器(DSP)、可程式邏輯、專用硬體或任一其他基於硬體及/或軟體之處理實體。
在此實例中,音訊解碼器AD20包括一去抖動緩衝器DB10(亦稱作「抖動緩衝器」)。去抖動緩衝器DB10可為減少或消除由封包到達時間之變化(例如,歸因於網路堵塞、時序漂移及/或路由改變)造成的抖動之硬體器件或軟體處理程序。去抖動緩衝器DB10可以封包為單位接收音訊訊框。去抖動緩衝器DB10可經實施以延遲新到達之封包,使得可按正確次序(例如,如由封包之時戳指示)將先前到達之封包中的訊框連續提供至訊框解碼器FD20,從而導致清晰的連線而具有極少音訊失真。去抖動緩衝器DB10可為固定的或適應性的。固定去抖動緩衝器可將固定延遲引入至封包。另一方面,適應性去抖動緩衝器可適應於網路延遲的改變。去抖動緩衝器DB10可按適當次序將經編碼音訊訊框(例如,包括索引XL、XF、XG及XP)提 供至訊框解碼器FD20。
若訊框之複本未由去抖動緩衝器接收到,則在未使用FEC之情況下可造成訊框丟失。當使用FEC且當前待播放之訊框的複本丟失時,去抖動緩衝器DB10可判定緩衝器中是否存在該訊框之冗餘複本。若當前訊框之冗餘複本可用時,可將冗餘複本提供至訊框解碼器FD20供解碼以產生音訊樣本。
此外,可修改去抖動緩衝器DB10以不同地處理主要訊框(亦即,原始關鍵訊框)及冗餘訊框(亦即,原始關鍵訊框中之一些或全部的複本)。緩衝器DB10可不同地處理此等兩個訊框,使得與實施如本文中描述之FEC操作相關聯的平均延遲不大於當不實施FEC操作時之平均延遲。舉例而言,可實施緩衝器DB10以偵測傳入之封包含有冗餘複本(例如,封包含有兩個訊框)及回應於此偵測而起始冗餘複本之解碼。
自去抖動緩衝器DB10釋放之音訊訊框可被提供至訊框解碼器FD20以產生解碼之核心音訊訊框DF(例如,合成之話語)。一般而言,可實施訊框解碼器FD20以執行將話語解碼成此項技術中已知的合成話語之任一方法。在圖11之實例中,訊框解碼器FD20使用對應於如上文參看圖3描述之編碼方法的CELP解碼方法。在此實例中,固定碼向量產生器VG10解碼FCB索引XF及增益索引XG之對應部分以產生每一子訊框之固定碼向量,反量化器IA10及向量產生器A50解碼ACB索引XP及增益索引XG之對應部分以產生每 一子訊框之適應性碼向量,且加法器AD10組合對應的碼向量以產生激勵信號且更新記憶體ME10(例如,如在3GPP TS 26.190 v11.0.0之第6.1章之步驟1-8中所描述)。反量化器IL10及反變換模組IM10解碼LPC索引XL以產生LP濾波器係數向量,LP濾波器係數向量由合成濾波器SF10應用至激勵以產生合成信號(例如,如在3GPP TS 26.190 v11.0.0之初始段落及第6.1章之步驟4中所描述)。將原始合成信號提供至後濾波器PF10,後濾波器PF10可經實施以執行諸如高通濾波、增量及內插之操作(例如,如在3GPP TS 26.190 v11.0.0之第6.2章中所描述)以產生經解碼之核心音訊訊框DF。或者(且不受限制),訊框解碼器FD20可使用NELP或PPP全訊框解碼方法。
可將包括主要複本之參數值中之一些(亦即,一部分集合)的訊框之冗餘複本自去抖動緩衝器DB10傳遞至部分訊框解碼模組。舉例而言,可實施訊框解碼器FD20以在冗餘複本可利用之前產生對應於關鍵訊框之訊框(例如,根據如在如上文引用之3GPP TS 26.091,v.11.0.0中所描述之消除誤差程序)。在此情況下,訊框解碼器FD20可包括一部分訊框解碼模組,其經組態以在解碼載波訊框(n+p)之前更新記憶體ME10(例如,根據來自冗餘複本之固定及適應性碼簿索引及增益)。
在接收器側,可將話語訊框儲存於可為適應性的去抖動緩衝器DB10中。如先前提到,去抖動緩衝器DB10可經設計使得話語訊框之平均延遲不大於不使用FEC技術時之平 均延遲。可按適當次序將訊框自去抖動緩衝器DB10發送至訊框解碼器(例如,解碼器FD20)。若冗餘複本為主要複本之參數之一部分集合,則可使用部分訊框解碼模組。
如本文中描述之源控制及頻道控制之FEC方案可減少封包丟失之數目及丟失之叢發性,同時資料速率極少增加或不增加。關鍵訊框識別可幫助確保話語感知品質與資料速率之間的良好取捨。可實施此FEC方案以便有效率地使用可利用之頻寬且與舊版通信器件回溯相容。
可實施音訊編碼器AE10以包括一動態速率控制模組。此模組可實施兩個步驟以接近預定目標速率。在第一步驟中,判定兩個鄰近操作點。選擇此等兩個鄰近操作點(其可為資料速率)使得目標資料速率之值在兩個操作點之值之間。可基於容量需求在外部指定目標資料速率。或者,可基於(例如)頻道狀態資訊在內部指定目標資料速率。可實施此速率控制以允許按任何指定資料速率進行如本文中描述之FEC方案,使得業者可基於容量需求來決定資料速率。
圖12A展示根據一般組態的用於信號處理之裝置MF100之方塊圖。裝置MF100包括用於計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計(例如,如本文中參考任務T100所描述)之構件F100。裝置MF100亦包括用於基於與一傳輸頻道之一狀態有關的資訊計算一臨限值(例如,如本文中參考任務T200所描述)之構件F200。裝置MF100亦包括用於將該 計算得的估計與該計算得的臨限值比較(例如,如本文中參考任務T300所描述)之構件F300。裝置MF100亦包括用於基於該比較之一結果決定傳輸該第一訊框之一冗餘複本(例如,如本文中參考任務T350所描述)之構件F350。
圖12B展示裝置MF100之一實施MF110之方塊圖,其亦包括用於使用來自第一訊框之資訊產生用於第二訊框之適應性碼向量(例如,如本文中參考任務T50所描述)之構件F50及用於計算第二訊框之經編碼型式的ACB增益值(例如,如本文中參考任務T60所描述)之構件F60。在此情況下,構件F100經組態以基於適應性碼向量及ACB增益值計算計算得的估計。
圖13A展示裝置MF100之一實施MF120之方塊圖,其亦包括用於接收頻道狀態資訊(例如,如本文中參考任務T70所描述)之構件F70。圖13B展示裝置MF100之一實施MF200之方塊圖,其亦包括用於產生第一訊框之冗餘複本(例如,如本文中參考任務T400所描述)之構件F400及用於產生包括冗餘複本的經編碼信號(例如,如本文中參考任務T500所描述)之構件F500。
圖14A展示可視情況在如本文中描述之裝置MF100之任一實施中使用的構件F200之一實施之一實例F210之方塊圖。構件F210包括用於將基於與傳輸頻道之狀態有關的資訊之計算得的值與邊界值比較(例如,如本文中參考任務T210a所描述)之構件F210a,及用於回應於與邊界值的該比較之結果選擇邊界值作為計算得的臨限值(例如,如本 文中參考任務T210b及T210c所描述)之構件F210b。
圖14B展示包括構件F500之一實施F510的裝置MF200之一實施MF210之方塊圖。構件F510包括用於產生包括第一訊框之主要複本的第一封包(例如,如本文中參考任務T510a所描述)之構件F510a,及用於回應於該決定產生包括第一訊框之冗餘複本及第二訊框之一複本的第二封包(例如,如本文中參考任務T510b所描述)之構件F510b。圖15展示裝置MF110、MF120及MF210之一實施MF300之方塊圖。
圖16A展示根據一般組態的裝置AP100之方塊圖,其包括一第一計算器A100、一第二計算器A200及一模式選擇器A300。第一計算器A100經組態以計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計(例如,如本文中參考任務T100所描述)。第二計算器A200經組態以基於與一傳輸頻道之一狀態有關的資訊計算一臨限值(例如,如本文中參考任務T200所描述)。模式選擇器A300經組態以(A)將計算得的估計與計算得的臨限值比較,及(B)基於該比較之結果決定傳輸該第一訊框之一冗餘複本(例如,如本文中參考任務T300及T350所描述)。
圖16B展示裝置AP100之一實施AP110之方塊圖,該實施AP110亦包括:一向量產生器A50,其經組態以使用來自第一訊框之資訊產生用於第二訊框之適應性碼向量(例如,如本文中參考任務T50所描述);及一適應性碼簿增益 計算器A60,其經組態以計算第二訊框之經編碼型式的ACB增益值(例如,如本文中參考任務T60所描述)。在此情況下,第一計算器A100經組態以基於適應性碼向量及ACB增益值計算計算得的估計。
圖16C展示可視情況在如本文中描述之裝置AP100之任一實施中使用的第二計算器A200之一實施之一實例A210之方塊圖。計算器A210包括:一比較器A210a,其經組態以將基於與傳輸頻道之狀態有關的資訊之計算得的值與邊界值比較(例如,如本文中參考任務T210a所描述);及一選擇器A210b,其經組態以回應於與邊界值的該比較之結果選擇邊界值作為計算得的臨限值(例如,如本文中參考任務T210b及T210c所描述)。
圖16D展示裝置AP100之一實施AP120之方塊圖,其亦包括經組態以接收頻道狀態資訊(例如,如本文中參考任務T70所描述)之一頻道解碼器CD11。圖16E展示可視情況在如本文中描述之裝置AP100之任一實施中使用的第二計算器A200之一實施之一實例A220之方塊圖。第二計算器A220包括:一臨限值計算器A210c,其經組態以基於頻道狀態資訊計算第一臨限值及第二臨限值;及一臨限值選擇器A210d,其經組態以基於來自第一訊框及在音訊信號中鄰近第一訊框之一訊框中的至少一者之資訊自第一及第二臨限值中選擇計算得的臨限值(例如,如本文中參考任務T200所描述)。第二計算器A200可實施為計算器A210與A220兩者之一實施(例如,使得臨限值選擇器A210d將選定 值提供至比較器A210a作為計算得的值)。
圖17A展示裝置AP100之一實施AP200之方塊圖,該實施AP200亦包括:訊框編碼器FE10之(例如,訊框編碼器FE20之)一實施A400,其經組態以產生第一訊框之一冗餘複本(例如,如本文中參考任務T400所描述);及頻道編碼器CE10之一實施A500,其經組態以產生包括冗餘複本之經編碼信號(例如,如本文中參考任務T500所描述)。訊框編碼器A400可經組態以選擇冗餘複本之大小或自裝置AP200之經組態以執行此選擇的另一模組接收該大小之一指示(例如,如本文中參考任務T400所描述)。
圖17B展示包括頻道編碼器A500之一實施A510的裝置AP200之一實施AP210之方塊圖。頻道編碼器A510包括一封包組譯器A510a,其經組態以產生包括第一訊框之主要複本的第一封包(例如,如本文中參考任務T510a所描述),且回應於該決定產生包括第一訊框之冗餘複本及第二訊框之一複本的第二封包(例如,如本文中參考任務T510b所描述)。圖17C展示裝置AP210之一實施AP220之方塊圖,該實施AP220包括一偏移計算器A520,其經組態以判定指示第一訊框與第二訊框之間的音訊信號之訊框總數的偏移值(例如,如本文中參考任務T500所描述,諸如,基於頻道狀態資訊及/或第二訊框之可壓縮性)。
圖18A展示裝置AP110、AP120及AP210之一實施AP300之方塊圖。圖19展示裝置AP300之一實施AP400之方塊圖,該實施AP400包括第一使用者介面UI10之一執行個體 及音訊編碼器AE10之(例如,音訊編碼器AE20之)一實施AE30,該音訊編碼器AE30包括裝置AP110之一執行個體且經配置以壓縮來自介面UI10之音訊資訊。在此情況下,訊框編碼器A400可經組態以選擇冗餘複本之大小或自音訊編碼器AE30之經組態以執行此選擇的另一模組接收該大小之一指示(例如,如本文中參考任務T400所描述)。
圖9C展示包括一晶片或晶片組CS10(例如,行動台數據機(MSM)晶片組)的通信器件D10之方塊圖,該晶片或晶片組CS10可經實施以體現如本文中描述的裝置AP100(或MF100)之實施中的任何一或多者之元件。晶片/晶片組CS10可包括一或多個處理器,其可經組態以執行裝置A100或MF100之軟體及/或韌體部分(例如,作為指令)。可將傳輸終端機102實現為器件D10之一實施。
晶片/晶片組CS10包括:一無線電接收器(例如,RX10之一實施),其經組態以接收射頻(RF)通信信號且解碼及再生在RF信號內編碼之音訊信號(及頻道狀態資訊);及一無線電傳輸器(例如,TX10之一實施),其經組態以將基於經由麥克風MV10-1及/或MV10-3接收(例如,如本文中參考第一使用者介面UI10所描述)之音訊資訊的經編碼之音訊信號(例如,如由任務T500產生)作為描述經編碼音訊信號的RF通信信號傳輸至傳輸頻道內。此器件可經組態以經由本文中參考的編碼解碼器中之任何一或多者無線地傳輸及接收語音通信資料。
器件D10經組態以經由天線C30接收且傳輸RF通信信 號。在至天線C30之路徑中,器件D10亦可包括一雙工器及一或多個功率放大器。晶片/晶片組CS10亦經組態以經由小鍵盤C10接收使用者輸入且經由顯示器C20顯示資訊。在此實例中,器件D10亦包括一或多個天線C40以支援全球定位系統(GPS)位置服務及/或與諸如無線(例如,BluetoothTM)頭戴式耳機之外部器件的短程通信。在另一實例中,此通信器件自身為BluetoothTM頭戴式耳機且沒有小鍵盤C10、顯示器C20及天線C30。
通信器件D10可體現於包括智慧型手機及膝上型電腦及平板電腦的各種各樣之通信器件中。圖20展示一個此實例之前視圖、後視圖及側視圖:手機H100(例如,智慧型手機)具有配置於前面上之兩個語音麥克風MV10-1及MV10-3、配置於後面上之一語音麥克風MV10-2、位於前面之頂角中的另一麥克風ME10(例如,用於增強型方向選擇性及/或在使用者之耳朵處捕獲聲學誤差以用於輸入至主動雜訊消除操作)及位於後面上之另一麥克風MR10(例如,用於增強型方向選擇性及/或捕獲背景雜訊參考)。揚聲器LS10配置於前面之頂部中心、在誤差麥克風ME10附近,且亦提供兩個其他揚聲器LS20L、LS20R(例如,用於揚聲電話應用)。此手機之麥克風之間的最大距離通常為約十或十二公分。
圖18B展示無線器件1102之方塊圖,其可經實施以執行如本文中描述之方法(例如,方法M100、M110、M120、M200、M210及M300中之任何一或多者)。可將傳輸終端 機102實現為無線器件1102之一實施。無線器件1102可為遠端台、存取終端機、手機、個人數位助理(PDA)、蜂巢式電話等。
無線器件1102包括控制器件之操作的一處理器1104。處理器1104亦可被稱作中央處理單元(CPU)。可包括唯讀記憶體(ROM)及隨機存取記憶體(RAM)兩者之記憶體1106將指令及資料提供至處理器1104。記憶體1106之一部分亦可包括非揮發性隨機存取記憶體(NVRAM)。處理器1104通常基於儲存於記憶體1106內之程式指令執行邏輯及算術運算。可執行記憶體1106中之指令以實施如本文中描述之該或該等方法。
無線器件1102包括外殼1108,其可包括一傳輸器1110及一接收器1112以允許在無線器件1102與遠端位置之間的傳輸及接收資料。傳輸器1110與接收器1112可經組合為收發器1114。天線1116可附接至外殼1108或電耦接至收發器1114。無線器件1102亦可包括(未圖示)多個傳輸器、多個接收器、多個收發器及/或多個天線。
在此實例中,無線器件1102亦包括一信號偵測器1118,其可用以偵測及量化由收發器1114接收的信號之位準。信號偵測器1118可將此等信號偵測為總能量、每偽雜訊(PN)碼片之導頻能量、功能頻譜密度及其他信號。無線器件1102亦包括一數位信號處理器(DSP)1120以用於在處理信號時使用。
無線器件1102之各種組件由匯流排系統1122耦接在一 起,除了資料匯流排之外,匯流排系統1122亦可包括電力匯流排、控制信號匯流排及狀態信號匯流排。為了清晰起見,各種匯流排在圖18B中被說明為匯流排系統1122。
本文中揭示之方法及裝置可大體上應用於任何收發及/或音訊感測應用中,尤其是此等應用之行動或其他攜帶型實例。舉例而言,本文中揭示的組態之範圍包括駐留於經組態以使用分碼多重存取(CDMA)空中傳輸介面之無線電話通信系統中的通信器件。然而,熟習此項技術者應理解具有如本文中所描述之特徵的方法及裝置可駐留於使用熟習此項技術者已知之廣泛範圍之技術的各種通信系統中之任何者中,諸如在有線及/或無線(例如,CDMA、TDMA、FDMA及/或TD-SCDMA)傳輸頻道上使用網際網路語音通訊協定(VoIP)之系統。
明確地設想且特此揭示:本文中所揭示之通信器件可經調適用於在封包交換(例如,經配置以載運根據諸如VoIP之協定的音訊傳輸的有線及/或無線網路)及/或電路交換之網路中使用。亦明確地設想且特此揭示:本文中所揭示之通信器件可經調適用於在窄頻寫碼系統(例如,編碼約四或五千赫之音訊頻率範圍的系統)中使用,及/或用於在寬頻寫碼系統(例如,編碼大於五千赫之音訊頻率的系統)中使用,包括全頻帶寬頻寫碼系統及分割頻帶寬頻寫碼系統。
提供所描述組態之陳述以使任何熟習此項技術者能夠製造或使用本文中揭示之方法及其他結構。本文中所展示及 描述之流程圖、方塊圖及其他結構僅為實例,且此等結構之其他變型亦處於本發明之範疇內。對此等組態之各種修改為可能的,且本文中所呈現之一般原理亦可適用於其他組態。因此,本發明並不意欲限於以上所展示之組態,而應符合與本文中以任何方式揭示之包括於所申請之附加申請專利範圍中的原理及新穎特徵相一致之最廣泛範疇,該等申請專利範圍形成本原創發明之一部分。
熟習此項技術者將理解,可使用各種各樣的不同技術及技藝中之任一者來表示資訊及信號。舉例而言,貫穿以上描述可能提及的資料、指令、命令、資訊、信號、位元及符號可由電壓、電流、電磁波、磁場或磁粒子、光場或光粒子或者其任何組合來表示。
對於如本文中揭示的組態之實施而言重要的設計要求可包括使處理延遲及/或計算複雜性(通常按每秒百萬個指令或MIPS量測)最小化,對於計算密集式應用,諸如,壓縮之音訊或視聽資訊之播放(例如,根據一壓縮格式編碼的檔案或串流,諸如,本文中識別的實例中之一者),或用於寬頻通信之應用(例如,按諸如12 kHz、16 kHz、32 kHz、44.1 kHz、48 kHz或192 kHz的高於八千赫之取樣速率的語音通信)尤其如此。
如本文中揭示之裝置(例如,裝置MF100、MF110、MF120、MF200、MF210、MF300、AP100、AP110、AP120、AP200、AP210、AP300及AP400中之任何者)可按被視為適合於意欲之應用的硬體與軟體及/或與韌體之任 何組合實施。舉例而言,可將此裝置之元件製造為駐留於(例如)同一晶片上或晶片組中之兩個或兩個以上晶片上的電子及/或光學器件。此器件之一實例為固定或可程式化邏輯元件(諸如,電晶體或邏輯閘)之陣列,且此等元件之任一者可實施為一或多個此等陣列。此等元件之任兩者或兩個以上者或甚至所有者可實施於同一陣列或若干相同陣列內。此或此等陣列可實施於一或多個晶片內(例如,包括兩個或兩個以上晶片之晶片組內)。
本文中揭示之裝置(例如,裝置MF100、MF110、MF120、MF200、MF210、MF300、AP100、AP110、AP120、AP200、AP210、AP300及AP400中之任何者)之各種實施的一或多個元件亦可整個或部分地實施為一或多個指令集,該一或多個指令集經配置以執行於一或多個固定或可程式化邏輯元件陣列上,諸如,微處理器、嵌入式處理器、IP核心(智慧財產權核心)、數位信號處理器、FPGA(場可程式化閘陣列)、ASSP(特殊應用標準產品)及ASIC(特殊應用積體電路)。如本文中揭示的裝置之一實施之各種元件中的任一者亦可被體現為一或多個電腦(例如,包括經程式化以執行一或多個指令集或指令序列之一或多個陣列的機器,亦被稱為「處理器」),且此等元件中之任何兩者或兩個以上者或甚至所有者可實施於相同的此或此等電腦內。
用於如本文中揭示之處理的處理器或其他構件可製造為駐留於(例如)同一晶片上或晶片組中之兩個或兩個以上晶 片上的電子及/或光學器件。此器件之一實例為固定或可程式化邏輯元件(諸如,電晶體或邏輯閘)之陣列,且此等元件之任一者可實施為一或多個此等陣列。此或此等陣列可實施於一或多個晶片內(例如,包括兩個或兩個以上晶片之晶片組內)。此等陣列之實例包括邏輯元件之固定或可程式化陣列,諸如微處理器、嵌入式處理器、IP核心、DSP、FPGA、ASSP及ASIC。用於如本文中揭示之處理的處理器或其他構件亦可體現為一或多個電腦(例如,包括經程式化以執行一或多個指令集或序列之一或多個陣列的機器)或其他處理器。如本文中描述之處理器可能被用以執行不直接與方法M100之一實施程序有關的任務或其他指令集,諸如,與處理器嵌入於的器件或系統(例如,音訊感測器件)之另一操作有關的任務。如本文中揭示之方法之部分亦可能由音訊感測器件之處理器執行,且該方法之另一部分亦可能在一或多個其他處理器之控制下執行。
熟習此項技術者應瞭解,結合本文中所揭示之組態而描述的各種說明性模組、邏輯區塊、電路及測試及其他操作可被實施為電子硬體、電腦軟體或兩者之組合。可藉由通用處理器、數位信號處理器(DSP)、ASIC或ASSP、FPGA或其他可程式化邏輯器件、離散閘或電晶體邏輯、離散硬體組件或其經設計以產生如本文中所揭示之組態的任何組合來實施或執行此等模組、邏輯區塊、電路及操作。舉例而言,此組態可至少部分地實施為一硬佈線電路、實施為製造於特殊應用積體電路中之電路組態、或實施為載入至 非揮發性儲存器中之韌體程式或作為機器可讀碼(此碼為可由邏輯元件之陣列(諸如,通用處理器或其他數位信號處理單元)執行之指令)自一資料儲存媒體載入或載入至一資料儲存媒體中之軟體程式。通用處理器可為微處理器,但在替代方案中,處理器可為任一習知處理器、控制器、微控制器或狀態機。處理器亦可實施為計算器件之組合,例如,DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器,或任何其他此組態。軟體模組可駐留於諸如RAM(隨機存取記憶體)、ROM(唯讀記憶體)、諸如快閃RAM之非揮發性RAM(NVRAM)、可抹除可程式化ROM(EPROM)、電可抹除可程式化ROM(EEPROM)、暫存器、硬碟、抽取式碟片或CD-ROM之非暫時性儲存媒體中;或此項技術中已知之任何其他形式的儲存媒體中。將說明性儲存媒體耦接至處理器,使得處理器可自儲存媒體讀取資訊及將資訊寫入至儲存媒體。在替代方案中,儲存媒體可整合至處理器。處理器及儲存媒體可駐留於ASIC中。ASIC可駐留於使用者終端機中。在替代方案中,處理器及儲存媒體可作為離散組件駐留於使用者終端機中。
注意,本文中揭示之各種方法(例如,方法M100、M110、M120、M200、M210及M300中之任一者)可由諸如處理器的邏輯元件陣列執行,且如本文中描述的裝置之各種元件可實施為經設計以在此陣列上執行之模組。如本文中所使用,術語「模組」或「子模組」可指包括呈軟體、 硬體或韌體形式之電腦指令(例如,邏輯表達)的任何方法、裝置、器件、單元或電腦可讀資料儲存媒體。應理解,可將多個模組或系統組合至一模組或系統中且可將一模組或系統分離為多個模組或系統來執行同樣的功能。當以軟體或其他電腦可執行指令實施時,處理程序之元素基本上為執行相關任務之程式碼段,諸如,常式、程式、物件、組件、資料結構及其類似者。術語「軟體」應理解為包括原始程式碼、組合語言程式碼、機器碼、二元碼、韌體、巨集碼、微碼、可由邏輯元件陣列執行的任何一或多個指令集或指令序列,及此等實例之任何組合。程式或碼段可儲存於處理器可讀媒體中或在傳輸媒體或通信鏈路上藉由體現於載波中之電腦資料信號來傳輸。
本文中揭示之方法、方案及技術之實施亦可有形地體現(舉例而言,在如本文中列出之一或多個電腦可讀儲存媒體之有形電腦可讀特徵中)為可由包括邏輯元件陣列(例如,處理器、微處理器、微控制器或其他有限狀態機)之機器執行之一或多個指令集。術語「電腦可讀媒體」可包括可儲存或轉移資訊之任一媒體,包括揮發性、非揮發性、抽取式及非抽取式儲存媒體。電腦可讀媒體之實例包括電子電路、半導體記憶體器件、ROM、快閃記憶體、可抹除ROM(EROM)、軟碟或其他磁性儲存器、CD-ROM/DVD或其他光學儲存器、硬碟或可用以儲存所要的資訊之任何其他媒體、光纖媒體、射頻(RF)鏈路或可用以載運所要的資訊且可加以存取的任一其他媒體。電腦資料 信號可包括可在諸如電子網路頻道、光纖、空氣、電磁、RF鏈路等之傳輸媒體上傳播之任何信號。可經由諸如網際網路或企業內部網路之電腦網路下載程式碼段。在任一情況下,本發明之範疇不應被認作受到此等實施例限制。
本文中所描述之方法的任務中之每一者可直接體現於硬體中、由處理器執行之軟體模組中或兩者之組合中。在如本文中揭示的方法之實施的典型應用中,邏輯元件(例如,邏輯閘)之陣列經組態以執行方法之各種任務中的一者、一者以上或甚至所有任務。亦可將任務中之一或多者(可能所有者)實施為體現於電腦程式產品(例如,一或多個資料儲存媒體,諸如,碟片、快閃記憶卡或其他非揮發性記憶卡、半導體記憶體晶片等)中之程式碼(例如,一或多個指令集),該程式碼可由包括邏輯元件陣列(例如,處理器、微處理器、微控制器或其他有限狀態機)的機器(例如,電腦)讀取及/或執行。如本文中揭示的方法之一實施之任務亦可由一個以上此陣列或機器執行。在此等或其他實施中,該等任務可在用於無線通信之器件(諸如,蜂巢式電話或具有此通信能力之其他器件)內執行。此器件可經組態以與電路交換及/或封包交換式網路通信(例如,使用諸如VoIP之一或多個協定)。舉例而言,此器件可包括經組態以接收及/或傳輸經編碼訊框的RF電路。
明確地揭示,本文中揭示之各種方法可由諸如手機、頭戴式耳機或攜帶型數位助理(PDA)之攜帶型通信器件執行,且本文中描述之各種裝置可包括於此器件內。典型的 即時(例如,線上)應用為使用此行動器件進行之電話對話。
在一或多個例示性實施例中,本文中描述之操作可實施於硬體、軟體、韌體或其任何組合中。若實施於軟體中,則可將此等操作作為一或多個指令或程式碼而儲存於一電腦可讀媒體上或經由一電腦可讀媒體傳輸。術語「電腦可讀媒體」包括電腦可讀儲存媒體及通信(例如,傳輸)媒體兩者。以實例說明且不受限制,電腦可讀儲存媒體可包含儲存元件陣列,諸如,半導體記憶體(其可包括(但不限於)動態或靜態RAM、ROM、EEPROM及/或快閃RAM),或鐵電、磁阻、雙向、聚合或相變記憶體;CD-ROM或其他光碟儲存器;及/或磁碟儲存器或其他磁性儲存器件。此等儲存媒體可儲存呈可由電腦存取的指令或資料結構之形式之資訊。通信媒體可包含可用以載運呈指令或資料結構之形式之所要程式碼且可由電腦存取之任一媒體,包括有助於電腦程式自一處轉移至另一處的任一媒體。又,將任何連接恰當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如紅外線、無線電及/或微波)而自一網站、伺服器或其他遠端源傳輸軟體,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如紅外線、無線電及/或微波)包括於媒體之定義中。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位多功能光碟(DVD)、軟性磁碟及Blu-ray DiscTM(Blu-Ray Disc Association,Universal City,CA),其 中磁碟通常以磁性之方式再生資料,而光碟藉由雷射光學地再生資料。以上各物之組合亦應包括於電腦可讀媒體之範疇內。
如本文中描述之聲學信號處理裝置可被併入至接受話語輸入以便控制某些操作或可以其他方式受益於所要雜訊與背景雜訊之分離的電子器件(諸如,通信器件)中。許多應用可受益於增強清楚的所要聲音或將清楚的所要聲音與源自多個方向的背景聲音分離。此等應用可包括在併有諸如語音辨識及偵測、話語增強及分離、語音啟動控制及其類似者之能力的電子或計算器件中之人機介面。可能需要實施此聲學信號處理裝置以適用於僅提供有限的處理能力之器件中。
本文中描述之模組、元件及器件之各種實施的元件可製造為駐留於(例如)同一晶片上或晶片組中之兩個或兩個以上晶片上的電子及/或光學器件。此器件之一實例為固定或可程式化的邏輯元件(諸如,電晶體或閘)之陣列。本文中描述之裝置之各種實施的一或多個元件亦可整個或部分地實施為一或多個指令集,該一或多個指令集經配置以執行於一或多個固定或可程式化邏輯元件陣列上,諸如,微處理器、嵌入式處理器、IP核心、數位信號處理器、FPGA、ASSP及ASIC。
可能將如本文中描述之裝置之一實施的一或多個元件用以執行不直接與裝置之操作有關的任務或指令集,諸如,與該裝置嵌入於的器件或系統之另一操作有關之任務。此 裝置之一實施的一或多個元件亦可能具有共同結構(例如,用以執行在不同時間對應於不同元件之程式碼部分之處理器,經執行以執行在不同時間對應於不同元件之任務之指令集,或在不同時間執行不同元件之操作的電子及/或光學器件之配置)。
102‧‧‧傳輸終端機
104‧‧‧接收終端機
1102‧‧‧無線器件
1104‧‧‧處理器
1106‧‧‧記憶體
1108‧‧‧外殼
1110‧‧‧傳輸器
1112‧‧‧接收器
1114‧‧‧收發器
1116‧‧‧天線
1118‧‧‧信號偵測器
1120‧‧‧數位信號處理器(DSP)
1122‧‧‧匯流排系統
A50‧‧‧向量產生器
A60‧‧‧適應性碼簿增益計算器
A100‧‧‧第一計算器
A200‧‧‧第二計算器
A210‧‧‧第二計算器
A210a‧‧‧比較器
A210b‧‧‧選擇器
A210c‧‧‧臨限值計算器
A210d‧‧‧臨限值選擇器
A220‧‧‧第二計算器
A300‧‧‧模式選擇器
A400‧‧‧訊框編碼器
A500‧‧‧頻道編碼器
A510‧‧‧頻道編碼器
A510a‧‧‧封包組譯器
A520‧‧‧偏移計算器
AD10‧‧‧音訊解碼器
AD20‧‧‧音訊解碼器
AE10‧‧‧音訊編碼器
AE20‧‧‧音訊編碼器
AE30‧‧‧音訊編碼器
AP100‧‧‧裝置
AP110‧‧‧裝置
AP120‧‧‧裝置
AP200‧‧‧裝置
AP210‧‧‧裝置
AP220‧‧‧裝置
AP300‧‧‧裝置
AP400‧‧‧裝置
AS10‧‧‧適應性碼簿(ACB)搜尋模組
BSC1‧‧‧基地台控制器
BSC2‧‧‧基地台控制器
BSC3‧‧‧基地台控制器
BTS1‧‧‧基地收發器台
BTS2‧‧‧基地收發器台
BTS3‧‧‧基地收發器台
C10‧‧‧小鍵盤
C20‧‧‧顯示器
C30‧‧‧天線
C40‧‧‧天線
CD10‧‧‧頻道解碼器
CD11‧‧‧頻道解碼器
CE10‧‧‧頻道編碼器
CE11‧‧‧頻道編碼器
CF‧‧‧核心音訊訊框
CNW1‧‧‧核心網路
CNW2‧‧‧核心網路
CP‧‧‧電腦
CS10‧‧‧晶片/晶片組
D10‧‧‧通信器件
DB10‧‧‧去抖動緩衝器
EF‧‧‧經編碼之訊框
F50‧‧‧用於使用來自第一訊框之資訊產生用於第二訊框之適應性碼向量之構件
F60‧‧‧用於計算第二訊框之經編碼型式的ACB增益值之構件
F70‧‧‧用於接收頻道狀態資訊之構件
F100‧‧‧用於計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計之構件
F200‧‧‧用於基於與一傳輸頻道之一狀態有關的資訊計算一臨限值之構件
F210‧‧‧構件
F210a‧‧‧用於將基於與傳輸頻道之狀態有關的資訊之計算得的值與邊界值比較之構件
F210b‧‧‧用於回應於與邊界值比較之結果選擇邊界值作為計算得的臨限值之構件
F300‧‧‧用於將該計算得的估計與該計算得的臨限值比較之構件
F350‧‧‧用於基於該比較之一結果決定傳輸該第一訊框之一冗餘複本之構件
F400‧‧‧用於產生第一訊框之冗餘複本之構件
F500‧‧‧用於產生包括冗餘複本的經編碼信號之構件
F510‧‧‧構件
F510a‧‧‧用於產生包括第一訊框之主要複本的第一封包之構件
F510b‧‧‧用於回應於決定而產生包括第一訊框之冗餘複本及第二訊框之一複本的第二封包之構件
FD20‧‧‧訊框解碼器
FE10‧‧‧訊框編碼器
FE20‧‧‧訊框編碼器
FS10‧‧‧固定碼簿(FCB)搜尋模組
GV10‧‧‧增益向量量化(VQ)模組
H100‧‧‧手機
IA10‧‧‧反量化器
IL10‧‧‧反量化器
IM10‧‧‧反變換模組
INT‧‧‧網際網路
LA10‧‧‧線性預測寫碼(LPC)分析模組
LS10‧‧‧揚聲器
LS20L‧‧‧揚聲器
LS20R‧‧‧揚聲器
M100‧‧‧處理音訊信號之方法
M110‧‧‧方法
M120‧‧‧方法
M200‧‧‧方法
M210‧‧‧方法
M300‧‧‧方法
ME10‧‧‧記憶體/麥克風/誤差麥克風
MF100‧‧‧裝置
MF110‧‧‧裝置
MF120‧‧‧裝置
MF200‧‧‧裝置
MF210‧‧‧裝置
MF300‧‧‧裝置
MR10‧‧‧麥克風
MS1‧‧‧行動台/終端機器件
MS2‧‧‧行動台/終端機器件
MS3‧‧‧行動台/終端機器件
MV10-1‧‧‧麥克風/語音麥克風
MV10-2‧‧‧語音麥克風
MV10-3‧‧‧麥克風/語音麥克風
NW10‧‧‧網路
NW20‧‧‧網路
OL10‧‧‧開放迴路音調搜尋模組
PF10‧‧‧後濾波器
PP10‧‧‧預處理模組
PSTN‧‧‧公眾交換電話網路
RC10‧‧‧傳輸頻道
RX10‧‧‧無線電接收器
RX11‧‧‧接收器
SF10‧‧‧合成濾波器
T50‧‧‧任務
T60‧‧‧任務
T70‧‧‧任務
T100‧‧‧任務
T200‧‧‧任務
T210‧‧‧任務
T210a‧‧‧子任務
T210b‧‧‧子任務
T210c‧‧‧子任務
T300‧‧‧任務
T350‧‧‧任務
T400‧‧‧任務
T500‧‧‧任務
T510‧‧‧任務
T510a‧‧‧子任務
T510b‧‧‧子任務
TC10‧‧‧傳輸頻道
TX10‧‧‧傳輸器
TX11‧‧‧傳輸器
UI10‧‧‧第一使用者介面
UI20‧‧‧第二使用者介面
VAD10‧‧‧語音活動偵測器
VG10‧‧‧固定碼向量產生器
VP‧‧‧網際網路語音通訊協定(VoIP)電話
VS‧‧‧語音活動偵測信號
XF‧‧‧FCB索引
XG‧‧‧增益索引
XL‧‧‧LPC索引
XP‧‧‧ACB索引
圖1為說明經由網路NW10通信的傳輸終端機102及接收終端機104之一實例之方塊圖。
圖2A展示具有各種終端機裝置的網路NW10之一實施NW20之方塊圖。
圖2B展示音訊編碼器AE10之一實施AE20之方塊圖。
圖3為訊框編碼器FE10之一實施FE20之方塊圖。
圖4A展示根據一般組態的方法M100之流程圖。
圖4B展示方法M100之一實施M110之流程圖。
圖5A及圖5B展示如本文中描述的頻道狀態資訊與其他系統參數之間的關係之實例。
圖5C展示一音訊信號之一連串訊框之一實例。
圖6A展示方法M100之一實施M120之流程圖。
圖6B展示任務T200之一實施T210之流程圖。
圖7A展示方法M100之一實施M200之流程圖。
圖7B展示方法M200之一實施M210之流程圖。
圖8展示方法M110、M120及M210之一實施M300之流程圖。
圖9A為IPv4封包之圖。
圖9B為IPv6封包之圖。
圖9C展示一通信器件D10之方塊圖。
圖10展示RTP封包之有效負載之一實例。
圖11為音訊解碼器AD10之一實施AD20之方塊圖。
圖12A展示根據一般組態的裝置MF100之方塊圖。
圖12B展示裝置MF100之一實施MF110之方塊圖。
圖13A展示裝置MF100之一實施MF120之方塊圖。
圖13B展示裝置MF100之一實施MF200之方塊圖。
圖14A展示構件F200之一實施F210之方塊圖。
圖14B展示裝置MF100之一實施MF210之方塊圖。
圖15展示裝置MF110、MF120及MF210之一實施MF300之方塊圖。
圖16A展示根據一般組態的裝置AP100之方塊圖。
圖16B展示裝置AP100之一實施AP110之方塊圖。
圖16C展示第二計算器A200之一實施A210之方塊圖。
圖16D展示裝置AP100之一實施AP120之方塊圖。
圖16E展示第二計算器A200之一實施之一實例A220之方塊圖。
圖17A展示裝置AP100之一實施AP200之方塊圖。
圖17B展示裝置AP100之一實施AP210之方塊圖。
圖17C展示裝置AP210之一實施AP220之方塊圖。
圖18A展示裝置AP110、AP120及AP210之一實施AP300之方塊圖。
圖18B展示一無線器件1102之方塊圖。
圖19展示裝置AP300之一實施AP400之方塊圖。
圖20展示手機H100之前視圖、後視圖及側視圖。
M100‧‧‧處理音訊信號之方法
T100‧‧‧任務
T200‧‧‧任務
T300‧‧‧任務
T350‧‧‧任務

Claims (52)

  1. 一種音訊信號處理之方法,該方法包含:計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計;基於與一傳輸頻道之一狀態有關的資訊計算一臨限值;將該計算得的估計與該計算得的臨限值比較;及基於該比較之一結果,決定傳輸該第一訊框之一冗餘複本。
  2. 如請求項1之方法,其中該計算得的估計係基於來自該第一訊框之資訊。
  3. 如請求項2之方法,其中該方法包括使用來自該第一訊框之該資訊產生一適應性碼向量,且其中該計算得的估計係基於來自該適應性碼向量之資訊。
  4. 如請求項1之方法,其中該計算得的估計係基於來自該第二訊框之一經編碼型式的資訊。
  5. 如請求項1之方法,其中該計算得的估計係基於該第二訊框之一經編碼型式的一適應性碼簿增益值。
  6. 如請求項1之方法,其中該計算得的估計係基於來自該第二訊框之一第一經編碼型式的資訊及基於來自該第二訊框之一第二經編碼型式的資訊,其中該第一經編碼型式係使用來自該第一訊框之一經編碼型式的資訊而編碼,且 其中該第二經編碼型式係不使用來自該第一訊框之該經編碼型式的該資訊而編碼。
  7. 如請求項1之方法,其中與該傳輸頻道之該狀態有關的該資訊包括丟失的封包之一數目,且其中該計算得的臨限值係基於丟失的封包之該數目。
  8. 如請求項1之方法,其中與該傳輸頻道之該狀態有關的該資訊包括係基於接收之封包之中轉次數的一抖動值,且其中該計算得的臨限值係基於該抖動值。
  9. 如請求項1之方法,其中該方法包括經由一無線傳輸頻道接收與該傳輸頻道之該狀態有關的該資訊。
  10. 如請求項1之方法,其中該計算該臨限值包含強制該計算得的臨限值具有一最小值。
  11. 如請求項1之方法,其中該計算該臨限值包含:將基於與該傳輸頻道之該狀態有關的該資訊之一計算得的值與一邊界值比較;及回應於與該邊界值的該比較之一結果,選擇該邊界值作為該計算得的臨限值。
  12. 如請求項1之方法,其中該方法包含:編碼該第一訊框以產生該第一訊框之一主要複本;產生該第一訊框之該冗餘複本;及產生包括該主要複本及該冗餘複本的一經編碼信號。
  13. 如請求項12之方法,其中該第一訊框之該主要複本包括一第一碼字,該第一碼字指示長度為L之一第一代數碼 向量的總數P1個單位脈衝中之每一者之一位置,且其中該第一訊框之該冗餘複本包括一第二碼字,該第二碼字指示長度為L之一第二代數碼向量的總數P2個單位脈衝中之每一者之一位置,且其中P1大於P2。
  14. 如請求項12之方法,其中該產生該經編碼信號包含:產生包括該第一訊框之該主要複本的一第一封包;及回應於該決定,產生包括該第一訊框之該冗餘複本及該第二訊框之一複本的一第二封包,且其中該經編碼信號包括該第一封包及該第二封包。
  15. 如請求項12之方法,其中該方法包括將該經編碼信號傳輸至該傳輸頻道內。
  16. 如請求項1之方法,其中該方法包括判定一偏移之值,該值指示在該第一訊框與該第二訊框之間的該音訊信號之訊框之一總數。
  17. 如請求項1之方法,其中該計算該臨限值包含:基於與該傳輸頻道之該狀態有關的該資訊,計算一第一臨限值及一第二臨限值;及基於來自該第一訊框及在該音訊信號中鄰近該第一訊框之一訊框中的至少一者之資訊,自該第一臨限值及該第二臨限值中選擇該計算得的臨限值。
  18. 一種用於音訊信號處理之裝置,該裝置包含:用於計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計之 構件;用於基於與一傳輸頻道之一狀態有關的資訊計算一臨限值之構件;用於將該計算得的估計與該計算得的臨限值比較之構件;及用於基於該比較之一結果決定傳輸該第一訊框之一冗餘複本之構件。
  19. 如請求項18之裝置,其中該計算得的估計係基於來自該第一訊框之資訊。
  20. 如請求項19之裝置,其中該裝置包括用於使用來自該第一訊框之該資訊產生一適應性碼向量之構件,且其中該計算得的估計係基於來自該適應性碼向量之資訊。
  21. 如請求項18之裝置,其中該計算得的估計係基於來自該第二訊框之一經編碼型式的資訊。
  22. 如請求項18之裝置,其中該計算得的估計係基於該第二訊框之一經編碼型式的一適應性碼簿增益值。
  23. 如請求項18之裝置,其中該計算得的估計係基於來自該第二訊框之一第一經編碼型式的資訊及基於來自該第二訊框之一第二經編碼型式的資訊,其中該第一經編碼型式係使用來自該第一訊框之一經編碼型式的資訊而編碼,且其中該第二經編碼型式係不使用來自該第一訊框之該經編碼型式的該資訊而編碼。
  24. 如請求項18之裝置,其中與該傳輸頻道之該狀態有關的該資訊包括丟失的封包之一數目,且其中該計算得的臨限值係基於丟失的封包之該數目。
  25. 如請求項18之裝置,其中與該傳輸頻道之該狀態有關的該資訊包括係基於接收之封包之中轉次數的一抖動值,且其中該計算得的臨限值係基於該抖動值。
  26. 如請求項18之裝置,其中該裝置包括用於經由一無線傳輸頻道接收與該傳輸頻道之該狀態有關的該資訊之構件。
  27. 如請求項18之裝置,其中用於計算該臨限值之該構件經組態以強制該計算得的臨限值具有一最小值。
  28. 如請求項18之裝置,其中用於計算該臨限值之該構件包含:用於將基於與該傳輸頻道之該狀態有關的該資訊之一計算得的值與一邊界值比較之構件;及用於回應於與該邊界值的該比較之一結果選擇該邊界值作為該計算得的臨限值之構件。
  29. 如請求項18之裝置,其中該裝置包含:用於編碼該第一訊框以產生該第一訊框之一主要複本之構件;用於產生該第一訊框之該冗餘複本之構件;及用於產生包括該主要複本及該冗餘複本的一經編碼信號之構件。
  30. 如請求項29之裝置,其中該第一訊框之該主要複本包括一第一碼字,該第一碼字指示長度為L之一第一代數碼向量的總數P1個單位脈衝中之每一者之一位置,且其中該第一訊框之該冗餘複本包括一第二碼字,該第二碼字指示長度為L之一第二代數碼向量的總數P2個單位脈衝中之每一者之一位置,且其中P1大於P2。
  31. 如請求項29之裝置,其中用於產生該經編碼信號之該構件包含:用於產生包括該第一訊框之該主要複本的一第一封包之構件;及用於回應於該決定而產生包括該第一訊框之該冗餘複本及該第二訊框之一複本的一第二封包之構件,且其中該經編碼信號包括該第一封包及該第二封包。
  32. 如請求項29之裝置,其中該裝置包括用於將該經編碼信號傳輸至該傳輸頻道內之構件。
  33. 如請求項18之裝置,其中該裝置包括用於判定一偏移之值之構件,該值指示在該第一訊框與該第二訊框之間的該音訊信號之訊框之一總數。
  34. 如請求項18之裝置,其中用於計算該臨限值之該構件包含:用於基於與該傳輸頻道之該狀態有關的該資訊計算一第一臨限值及一第二臨限值之構件;及用於基於來自該第一訊框及在該音訊信號中鄰近該第 一訊框之一訊框中的至少一者之資訊自該第一臨限值及該第二臨限值中選擇該計算得的臨限值之構件。
  35. 一種用於音訊信號處理之裝置,該裝置包含:一第一計算器,其經組態以計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計;一第二計算器,其經組態以基於與一傳輸頻道之一狀態有關的資訊計算一臨限值;及一模式選擇器,其經組態以(A)將該計算得的估計與該計算得的臨限值比較,及(B)基於該比較之一結果決定傳輸該第一訊框之一冗餘複本。
  36. 如請求項35之裝置,其中該計算得的估計係基於來自該第一訊框之資訊。
  37. 如請求項36之裝置,其中來自該第一訊框之該資訊包括一激勵信號,且其中該裝置包括一向量產生器,其經組態以使用來自該激勵信號之資訊產生一適應性碼向量,且其中該計算得的估計係基於該適應性碼向量。
  38. 如請求項35之裝置,其中該計算得的估計係基於來自該第二訊框之一經編碼型式的資訊。
  39. 如請求項35之裝置,其中該計算得的估計係基於該第二訊框之一經編碼型式的一適應性碼簿增益值。
  40. 如請求項35之裝置,其中該計算得的估計係基於來自該第二訊框之一第一經編碼型式的資訊及基於來自該第二 訊框之一第二經編碼型式的資訊,其中該第一經編碼型式係使用來自該第一訊框之一經編碼型式的資訊而編碼,且其中該第二經編碼型式係不使用來自該第一訊框之該經編碼型式的該資訊而編碼。
  41. 如請求項35之裝置,其中與該傳輸頻道之該狀態有關的該資訊包括丟失的封包之一數目,且其中該計算得的臨限值係基於丟失的封包之該數目。
  42. 如請求項35之裝置,其中與該傳輸頻道之該狀態有關的該資訊包括係基於接收之封包之中轉次數的一抖動值,且其中該計算得的臨限值係基於該抖動值。
  43. 如請求項35之裝置,其中該裝置包括一頻道解碼器,其經組態以經由一無線傳輸頻道接收與該傳輸頻道之該狀態有關的該資訊。
  44. 如請求項35之裝置,其中該第二計算器經組態以強制該計算得的臨限值具有一最小值。
  45. 如請求項35之裝置,其中該第二計算器包含:一比較器,其經組態以將基於與該傳輸頻道之該狀態有關的該資訊之一計算得的值與一邊界值比較;及一選擇器,其經組態以回應於與該邊界值的該比較之一結果選擇該邊界值作為該計算得的臨限值。
  46. 如請求項35之裝置,其中該裝置包含:一訊框編碼器,其經組態以編碼該第一訊框以產生 (A)該第一訊框之一主要複本及(B)該第一訊框之該冗餘複本;及一頻道編碼器,其經組態以產生包括該主要複本及該冗餘複本的一經編碼信號。
  47. 如請求項46之裝置,其中該第一訊框之該主要複本包括一第一碼字,該第一碼字指示長度為L之一第一代數碼向量的總數P1個單位脈衝中之每一者之一位置,且其中該第一訊框之該冗餘複本包括一第二碼字,該第二碼字指示長度為L之一第二代數碼向量的總數P2個單位脈衝中之每一者之一位置,且其中P1大於P2。
  48. 如請求項46之裝置,其中該頻道編碼器包含一封包組譯器,該封包組譯器經組態以產生(A)包括該第一訊框之該主要複本的一第一封包,及(B)包括該第一訊框之該冗餘複本及該第二訊框之一複本的一第二封包,且其中該經編碼信號包括該第一封包及該第二封包。
  49. 如請求項46之裝置,其中該裝置包括一無線電傳輸器,其經組態以將該經編碼信號傳輸至該傳輸頻道內。
  50. 如請求項35之裝置,其中該裝置包括一偏移計算器,其經組態以判定一偏移之值,該值指示在該第一訊框與該第二訊框之間的該音訊信號之訊框之一總數。
  51. 如請求項35之裝置,其中該第二計算器包含:一臨限值計算器,其經組態以基於與該傳輸頻道之該狀態有關的該資訊計算一第一臨限值及一第二臨限 值;及一臨限值選擇器,其經組態以基於來自該第一訊框及在該音訊信號中鄰近該第一訊框之一訊框中的至少一者之資訊自該第一臨限值及該第二臨限值中選擇該計算得的臨限值。
  52. 一種具有有形特徵之非暫時性電腦可讀資料儲存媒體,該等有形特徵使讀取該等特徵之一機器:計算一音訊信號之一第二訊框對在該音訊信號中在該第二訊框前之一第一訊框的寫碼相依性之一估計;基於與一傳輸頻道之一狀態有關的資訊計算一臨限值;將該計算得的估計與該計算得的臨限值比較;及基於該比較之一結果決定傳輸該第一訊框之一冗餘複本。
TW101148840A 2012-01-12 2012-12-20 用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體 TWI499247B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261586007P 2012-01-12 2012-01-12
US201261587507P 2012-01-17 2012-01-17
US201261641093P 2012-05-01 2012-05-01
US13/718,797 US9047863B2 (en) 2012-01-12 2012-12-18 Systems, methods, apparatus, and computer-readable media for criticality threshold control

Publications (2)

Publication Number Publication Date
TW201338468A true TW201338468A (zh) 2013-09-16
TWI499247B TWI499247B (zh) 2015-09-01

Family

ID=48780607

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101148840A TWI499247B (zh) 2012-01-12 2012-12-20 用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體

Country Status (13)

Country Link
US (2) US9047863B2 (zh)
EP (2) EP2812895B1 (zh)
JP (3) JP2015510313A (zh)
KR (2) KR101570631B1 (zh)
CN (2) CN104040622B (zh)
BR (2) BR112014017120B1 (zh)
DK (2) DK2812895T3 (zh)
ES (2) ES2653949T3 (zh)
HU (2) HUE037362T2 (zh)
IN (1) IN2014CN04644A (zh)
SI (1) SI2803065T1 (zh)
TW (1) TWI499247B (zh)
WO (2) WO2013106181A1 (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control
US9178778B2 (en) 2012-03-23 2015-11-03 Avaya Inc. System and method for end-to-end RTCP
US9356917B2 (en) 2012-03-23 2016-05-31 Avaya Inc. System and method for end-to-end encryption and security indication at an endpoint
US9860296B2 (en) 2012-03-23 2018-01-02 Avaya Inc. System and method for end-to-end call quality indication
EP2950459B1 (en) * 2012-04-11 2019-10-02 Huawei Technologies Co., Ltd. Method and apparatus for configuring transmission mode
WO2014094204A1 (en) * 2012-12-17 2014-06-26 Intel Corporation Leveraging encoder hardware to pre-process video content
TWI528777B (zh) * 2012-12-28 2016-04-01 鴻海精密工業股份有限公司 音量調節方法與系統
US9831898B2 (en) * 2013-03-13 2017-11-28 Analog Devices Global Radio frequency transmitter noise cancellation
FR3007230B1 (fr) 2013-06-17 2015-07-31 Sdmo Ind Procede de communication dans un reseau interconnectant au moins deux groupes electrogenes, et dispositif d’interfacage correspondant.
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
NO2780522T3 (zh) * 2014-05-15 2018-06-09
GB2527365B (en) 2014-06-20 2018-09-12 Starleaf Ltd A telecommunication end-point device data transmission controller
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9680507B2 (en) * 2014-07-22 2017-06-13 Qualcomm Incorporated Offset selection for error correction data
US9712287B2 (en) 2014-07-31 2017-07-18 Qualcomm Incorporated System and method of redundancy based packet transmission error recovery
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
WO2016144246A1 (en) * 2015-03-12 2016-09-15 Telefonaktiebolaget Lm Ericsson (Publ) Rate control in circuit switched systems
US9948578B2 (en) * 2015-04-14 2018-04-17 Qualcomm Incorporated De-jitter buffer update
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
IL239333B (en) * 2015-06-10 2020-06-30 Elta Systems Ltd A system for creating, transmitting and receiving additional signals and the useful methods by the way
KR102420450B1 (ko) 2015-09-23 2022-07-14 삼성전자주식회사 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
US10049681B2 (en) * 2015-10-29 2018-08-14 Qualcomm Incorporated Packet bearing signaling information indicative of whether to decode a primary coding or a redundant coding of the packet
US10049682B2 (en) * 2015-10-29 2018-08-14 Qualcomm Incorporated Packet bearing signaling information indicative of whether to decode a primary coding or a redundant coding of the packet
EP3427258B1 (en) 2016-03-07 2021-03-31 Fraunhofer Gesellschaft zur Förderung der Angewand Error concealment unit, audio decoder, and related method and computer program using characteristics of a decoded representation of a properly decoded audio frame
CA3016949C (en) 2016-03-07 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
CN107528668B (zh) * 2016-06-21 2021-09-24 中兴通讯股份有限公司 一种数据传输方法及设备
CN107845385B (zh) * 2016-09-19 2021-07-13 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
KR102214440B1 (ko) * 2016-10-07 2021-02-09 삼성전자주식회사 통화 기능을 수행하는 단말 장치 및 방법
US11088941B2 (en) * 2017-03-23 2021-08-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method for transmitting data, terminal device, and network device
US10574830B2 (en) * 2017-06-05 2020-02-25 Qualcomm Incoporated Methods for increasing VoIP network coverage
US10645228B2 (en) * 2017-06-26 2020-05-05 Apple Inc. Adaptability in EVS codec to improve power efficiency
CN109286952B (zh) * 2017-07-19 2022-08-02 中兴通讯股份有限公司 数据传输方法、装置及存储介质
CN108764469A (zh) * 2018-05-17 2018-11-06 普强信息技术(北京)有限公司 一种降低神经网络所需功耗的方法和设备
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization
EP4035288A1 (en) 2019-09-25 2022-08-03 Mixhalo Corp. Packet payload mapping for robust transmission of data
CN110890945B (zh) * 2019-11-20 2022-02-22 腾讯科技(深圳)有限公司 数据传输方法、装置、终端及存储介质
CN112820306B (zh) * 2020-02-20 2023-08-15 腾讯科技(深圳)有限公司 语音传输方法、系统、装置、计算机可读存储介质和设备
CN112767955B (zh) * 2020-07-22 2024-01-23 腾讯科技(深圳)有限公司 音频编码方法及装置、存储介质、电子设备
JP2024022698A (ja) * 2020-10-30 2024-02-21 株式会社Preferred Networks 通信装置及び通信方法
US20230073839A1 (en) * 2021-09-09 2023-03-09 Toyota Motor North America, Inc. Hardware timer data expiration

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69528255T2 (de) 1994-04-08 2003-08-07 Echelon Corp Verfahren und gerät zur sicheren winkelmodulationsbasierten kommunikation
TW271524B (zh) * 1994-08-05 1996-03-01 Qualcomm Inc
US5732389A (en) 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JP3254126B2 (ja) * 1996-02-13 2002-02-04 株式会社日立国際電気 可変レート符号化方式
FI116181B (fi) * 1997-02-07 2005-09-30 Nokia Corp Virheenkorjausta ja virheentunnistusta hyödyntävä informaationkoodausm enetelmä ja laitteet
US6405338B1 (en) 1998-02-11 2002-06-11 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
US6445686B1 (en) * 1998-09-03 2002-09-03 Lucent Technologies Inc. Method and apparatus for improving the quality of speech signals transmitted over wireless communication facilities
US20010041981A1 (en) * 2000-02-22 2001-11-15 Erik Ekudden Partial redundancy encoding of speech
JP2002314597A (ja) * 2001-04-09 2002-10-25 Mitsubishi Electric Corp 音声パケット通信装置
JP4022427B2 (ja) * 2002-04-19 2007-12-19 独立行政法人科学技術振興機構 エラー隠蔽方法、エラー隠蔽プログラム、送信装置、受信装置及びエラー隠蔽装置
FI116016B (fi) 2002-12-20 2005-08-31 Oplayo Oy Puskurointijärjestely
WO2004095825A2 (en) * 2003-04-21 2004-11-04 Rgb Networks, Inc. Time-multiplexed multi-program encryption system
US7546508B2 (en) 2003-12-19 2009-06-09 Nokia Corporation Codec-assisted capacity enhancement of wireless VoIP
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
DE602004004376T2 (de) 2004-05-28 2007-05-24 Alcatel Anpassungsverfahren für ein Mehrraten-Sprach-Codec
CN101292459B (zh) 2005-10-17 2011-06-08 艾利森电话股份有限公司 用于估计语音质量的方法和设备
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US20080077410A1 (en) 2006-09-26 2008-03-27 Nokia Corporation System and method for providing redundancy management
TWI382657B (zh) 2007-03-01 2013-01-11 Princeton Technology Corp 音訊處理系統
WO2008119043A1 (en) 2007-03-27 2008-10-02 Armida Technologies Wireless integrated security controller
CN101072083A (zh) * 2007-06-04 2007-11-14 深圳市融合视讯科技有限公司 一种优化网络数据传输冗余纠错率的方法
US8352252B2 (en) 2009-06-04 2013-01-08 Qualcomm Incorporated Systems and methods for preventing the loss of information within a speech frame
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control

Also Published As

Publication number Publication date
US20130185062A1 (en) 2013-07-18
BR112014017119A2 (pt) 2017-06-13
US20130185084A1 (en) 2013-07-18
BR112014017120A8 (pt) 2017-07-04
WO2013106181A1 (en) 2013-07-18
EP2803065B1 (en) 2017-01-18
SI2803065T1 (sl) 2017-03-31
EP2812895B1 (en) 2017-11-01
US9047863B2 (en) 2015-06-02
KR101585367B1 (ko) 2016-01-13
CN104040622A (zh) 2014-09-10
KR20140111035A (ko) 2014-09-17
BR112014017120B1 (pt) 2021-06-15
HUE037362T2 (hu) 2018-08-28
JP5996670B2 (ja) 2016-09-21
ES2621417T3 (es) 2017-07-04
BR112014017119A8 (pt) 2017-07-04
DK2812895T3 (en) 2018-01-08
US9053702B2 (en) 2015-06-09
WO2013106187A1 (en) 2013-07-18
JP2015510313A (ja) 2015-04-02
HUE032016T2 (en) 2017-08-28
BR112014017119B1 (pt) 2020-12-22
CN104040621A (zh) 2014-09-10
JP2015507221A (ja) 2015-03-05
EP2812895A1 (en) 2014-12-17
CN104040622B (zh) 2017-08-11
TWI499247B (zh) 2015-09-01
BR112014017120A2 (pt) 2017-06-13
EP2803065A1 (en) 2014-11-19
CN104040621B (zh) 2017-06-30
JP6151405B2 (ja) 2017-06-21
IN2014CN04644A (zh) 2015-09-18
ES2653949T3 (es) 2018-02-09
KR20140119735A (ko) 2014-10-10
JP2016174383A (ja) 2016-09-29
KR101570631B1 (ko) 2015-11-19
DK2803065T3 (en) 2017-03-13

Similar Documents

Publication Publication Date Title
TWI499247B (zh) 用於關鍵性臨限控制之系統、方法、裝置及電腦可讀媒體
US10424306B2 (en) Frame erasure concealment for a multi-rate speech and audio codec