TWI362031B - Methods, apparatus and computer program product for obtaining frames of a decoded speech signal - Google Patents

Methods, apparatus and computer program product for obtaining frames of a decoded speech signal Download PDF

Info

Publication number
TWI362031B
TWI362031B TW096137743A TW96137743A TWI362031B TW I362031 B TWI362031 B TW I362031B TW 096137743 A TW096137743 A TW 096137743A TW 96137743 A TW96137743 A TW 96137743A TW I362031 B TWI362031 B TW I362031B
Authority
TW
Taiwan
Prior art keywords
frame
excitation signal
sequence
encoded
value
Prior art date
Application number
TW096137743A
Other languages
English (en)
Other versions
TW200832356A (en
Inventor
Venkatesh Krishnan
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200832356A publication Critical patent/TW200832356A/zh
Application granted granted Critical
Publication of TWI362031B publication Critical patent/TWI362031B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Television Systems (AREA)
  • Circuits Of Receivers In General (AREA)
  • Electrolytic Production Of Metals (AREA)
  • Manufacture, Treatment Of Glass Fibers (AREA)
  • Detergent Compositions (AREA)

Description

1362031 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於語音信號之處理。 【先前技術】 藉由數位技術來傳輸音訊(諸如,聲音及音樂)特別在長 途電話學 '諸如聲音IP(亦被稱為ν〇ΙΡ,其中Ip表示網際網 路協定)之封包交換式電話學及諸如蜂巢式電話學之數位 無線電電話學中已變得普遍。該擴散已產生對減少用以在 傳輸通道上轉移聲音通信之資訊量同時維持重建語音之察 覺品質的興趣。舉例而t,需要最佳地利用可用無線系統 頻寬…用以有效地使心統頻寬之方式為採用信號壓縮
技術。對於載運語音信號之無線系統而言,語音壓縮(或 ”語音編碼”)技術通常用於此目的。 〜經組態以藉由提取與人類語音產生模型有關之參數來壓 縮°二的叹備經常被稱為聲碼器、"音訊編碼器”或"語音 編碼器音訊編碼器通常包括編碼器及解碼器、編瑪器 傳入之°。曰仏冑(表不音訊資訊之數位信號)分割成 被稱為”訊框,,之日卑八— 寻間區奴、刀析母一訊框以提取某些相關 且將該等參數量化成經編碼訊框。經編碼訊框在傳 輸通道亦即,有線或無線料連接)上傳輸至包括解碼器 之接收器解碼器接收及處理經編碼訊框、將其解量化以 產生參數’且使用經解量化參數來重新產生語音訊框。 Η在ΐί交談中’每—發言者靜默持續約百分之六十之時 °"、扁碼H通常經組態以區別語音信號之含有語音之 125582.doc 1362031 訊框("活動訊框")與語音信號之僅含有靜默或背景雜訊之 訊框("不活動訊框”)。該編碼器可經組態以使用不同編碼 模式及/或速率來編碼活動訊框及不活動訊框。舉例而 言,語音編碼器通常經組態以與用以編碼活動訊框相比使 用較少的位元來編碼不活動訊框。語音編碼器可對於不活 動訊框使用較低位元速率以支援語音信號以較低平均位元 速率之轉移’其中很少有至沒有察覺品質損失。 用以編碼活動訊框之位元速率之實例包括171位元/訊 框、八十位元/訊框及四十位元/訊框。用以編碼不活動訊 框之位元速率之實例包括十六位元/訊框。在蜂巢式電話 學系統(尤其為符合如由VA2ArHngt〇n的電信工業協會所 頒布之過渡期標準(IS>95或類似工業標準的系統)的情形 下,此等四個位元速率亦分別被稱作"全速率"、"半速率"、 ”四分之一速率”及”八分之一速率"。 卜採用語音編碼器之許多通信系統(諸如,蜂巢式電話及 衛星通信系統)依靠無線通道來傳達f ^在傳達該資訊 間’無線傳輸通道可能遭受若干錯誤來源,諸如,多路 k衰退。傳輸錯誤可能導致訊框之不可恢復的惡化(亦被 稱為”訊框消除”)。在典型蜂巢式電話系統中,訊框消除以 百刀之一至百分之三之速率發生,且可能甚至達到或超過 百分之五。 採用音訊編碼配置f你,丨^ 铁Jr . 夏(例如,聲音網際網路協定或"v〇Ip”) ^交換式’周路巾之封包損失的問題非常類似於無線情 形下之訊框料。亦即,歸因於封包損失,音訊解碼器可 125582.doc 1362031 此未能接收到訊框或可能接收到具有大量位元錯誤之訊 2。在任一狀況下’音訊解碼器被呈現有相同問題儘管 子在壓縮語音資訊之損失,但仍需要產生 Γ;;出於此描述之目的,術語"訊框消除"可被視為包括 封包損失”。 訊框消除可在解碼器處根據檢查功能(諸如,使用(例如) 一,多個總和檢查媽及/或同位位元之CRC(循環冗餘檢幻 功能或其他錯誤伯測功能)之失效而得以償測。該 常由通道解碼器執行(例如,在多工子層中),該通道解碼 器亦可執行諸如回旋解碼及/或解交錯之任務。在典型解 碼器中,訊框錯誤谓測器在接收到訊框中之不可校正錯誤 之指不後即設定訊框消除旗標。解碼器可經植態以選擇訊 框消除恢復模組來處理設定訊框消除旗標所針對之訊框°。 【發明内容】 ° 一種根據-組態之語音解碼方法包括在—經編碼語音传 號令偵測一持續有聲區段之第二訊框的消除。該方法亦包 括基於持續有聲區段之第一訊框來計算第二訊框之替換訊 框。在此方法中,計算替換訊框包括獲得—高於第一訊框 之對應增益值的增益值。 -種根據另一組態之獲得一經解碼語音信號之訊框之方 法包括基於來自-經編碼語音信號之第一經編碼訊框的資 訊及第一激勵信號來計算經解碼語音信號之第一訊框。此 方法亦包括回應於該經編碼語音信號之一緊跟在該第一經 編碼訊框之後的訊框之消除之指示且基於第二激勵信號來 125582.doc 丄观031 増盈因數之值之間的關係來產生一基於(A)大於第一增益 因數之第二增益因數與(B)第二值序列之乘積的第二激勵 L號之構件。此裝置亦包括用於基於第二激勵信號來計算 一緊跟在經解碼語音信號之該第一訊框之後的第二訊框之 • 構件。此裝置亦包括用於基於第三激勵信號來計算一先於 . 鉍解碼语音信號之該第一訊框之第三訊框的構件。在此裝 置中,第一序列係基於來自第三激勵信號之資訊,且第二 φ 序列係基於來自第一激勵信號之資訊。 一種根據另一組態之電腦程式產品包括一電腦可讀媒 體’其包括用於使至少一電腦產生一基於第一增益因數與 第一值序列之乘積的第一激勵信號之程式碼。此媒體亦包 括用於使至少-電腦基於第一激勵信號及來自經編碼語音 * 信號之第一經編碼訊框的資訊來計算經解碼語音信號之第 • Λ框的私式碼。此媒體亦包括用於使至少一電腦回應於 Sx 呈編碼a彳5號之一緊跟在該第一經編碼訊框之後的訊 • 框之消除之指示且根據一臨限值與一基於第一增益因數之 值之間的關係來產生一基於(A)大於第一增益因數之第二 增益因數與(B)第二值序列之乘積的第二激勵信號之程式 . @ i此媒體亦包括用於使至少-電腦基於第二激勵信號來 . 言十算一緊跟在經解码言吾音信號之該第-訊框之後的第二訊 C之程式碼。此媒體亦包括用於使至少一電腦基於第三激 勵信號來計算-先於經解碼語音信號之該第一訊框之第三 訊框的程式碼。在此產品中,第一序列係基於來自第三激 勵信號之資訊,且第二序列係基於來自第一激勵信號之資 125582.doc -II - 1362031 訊0 【實施方式】 本文中所述之組態包括用於訊框消除恢復之系統、方法 及裝置’其可用以針對消除持續有聲區段之顯著訊框的狀 況提供改良之效能。或者’持續有聲區段之顯著訊框可被 表示為決定性訊框《明確地預期且特此揭示,該等組態可 適應於供封包交換式網路(例如,經配置以根據諸如ν〇ΙΡ 之協定來載運聲音傳輸的有線及/或無線網路)及/或電路交 換式網路使用。亦明確地預期且特此揭示,該等組態可適 應於供窄頻帶編碼系統(例如’編碼約四千赫或五千赫之 音訊頻率範圍的系統)以及包括全部頻帶編碼系統及分裂 頻帶編碼系統之寬頻帶編碼系統(例如,編碼大於五千赫 之音訊頻率的系統)使用。 除非受其情形明確地限制,否則術語·,產生"在本文中用 以指示其通常意義中之任一者,諸如,計算或另外產生。 除非受其情形明確地限制,否則術語"計算"在本文中用以 指不其通常意義中之任一者,諸如,計算、評估及/或自 值集合選擇。除非受其情形明確地限制,否則術語”獲得" 用以指不其通常意義中之任一者,諸如,計算、導出、接 收(例如,自外部設備)及/或擷取(例如,自儲存元件陣 列)°在本描述及申請專利範圍中使用術語”包含"之處,其 並不排除其他元件或操作。術語"基於,,(如在"A係基於B" 中)用以指示其通常意義中之任一者’包括以下狀況:⑴ ’·基於至少,,(例如,”A基於至少B");及若在特定情形下適 125582.doc 12· 1362031 當之’(ii)"等於"(例如,"A等於B")。 除非另有指示,否則具有特定特徵之語音解碼器之心 揭示亦明確地意欲揭示具有類似特徵之語音解碼方法(^ 反之亦然),且根據一特定組態之語音解碼器之任何揭 亦明確地意欲揭示根據一類似組態之語音解碼方法 之亦然)。 * (且反 出於語音編碼目的,語音信號通常經數位化(或量化)以 獲得樣本流。數位化過程可根據此項技術中已知之各種方 法(包括(例如)脈衝碼調變(PCM)、壓伸卜律1>(:]^及壓伸A· 律PCM)中的任一者而加以執行。窄頻帶語音編碼器通常 使用8 kHz之取樣速率,而寬頻帶語音編碼器通常使用較 高取樣速率(例如,12 kHz或16 kHz)。 數位化語音信號經處理為訊框系列。此系列通常被實施 為非重疊系列,但處理訊框或訊框之區段(亦被稱為子訊 框)的操作亦可包括其輸入中一或多個相鄰訊框之區段。 語音信號之訊框通常足夠短以致於可預期信號之頻譜包絡 在訊框内保持相對固定。一訊框通常對應於語音信號之介 於五毫秒與三十五毫秒之間(或約四十至2〇〇個樣本),其中 十毫秒、二十毫秒及三十毫秒為常見訊框大小。經編碼訊 框之實際大小可隨編碼位元速率而自一訊框至另一訊框改 變〇 二十毫秒之訊框長度對應於處於七千赫(kIiz)之取樣速 率的140個樣本、處於八kHz之取樣速率的160個樣本及處 於16 kHz之取樣速率的320個樣本,但可使用被視為適合 125582.doc 13 1362031 於特定應用之任何取樣速率。可 立 之另一實例為12.8kHz,u他實編碼之取樣速率 且’、他實例包括在自12 8 k 38.4 kHz之範圍内的其他速率。 至 通常,所有訊框具有相同長度,且在本文中所述之特定 實例中假定均一訊框長度。然 ' _ 万月確地預期且特此揭 不,可使用非均一訊框長度。舉 Α_Λ 举例而s ,方法Μ100及 實施例亦可用於對於活動訊框及不活動訊框及/或 對於有聲訊框及無聲訊框採用不同訊框長度的應用中。 經編碼訊框通常含有可重建語音信號之對應訊框所來自 =。舉例而言’經編碼訊框可包括訊框内之在頻譜内之 能量分布的描述。該能量分布亦被稱為訊框之π頻率包絡" 或"頻譜包絡經編碼訊框通常包括描述訊框之頻諸包絡 的有序值序列。在—些狀況下,有序序列之每一值指示信 號在對應頻率處或在對應頻譜區域内之振幅或量值。該描 述之一實例為有序傅立葉(Fourier)變換係數序列。 在其他狀況下,有序序列包括編碼模型之參數值。該有 序序列之一典型實例為線性預測編碼(LPC)分析之系數值 集合。此等係數編碼經編碼語音之共振(亦被稱為"共振峰") j可經組態作為濾波器係數或作為反射係數。最現代之語 θ編蝎器之編碼部分包括提取用於每一訊框之LPC系數值 ^ D的刀析濾波器。集合(其通常經配置為一或多個向量) 中之系數值之數目亦被稱為LPC分析之"次序"。如由通信 叹備(諸如’蜂巢式電話)之語音編碼器所執行的Lpc分析 /、型次序之實例包括四、六、八、十、12、μ、20、 125582.doc 24、28及 32。 頻譜包絡之描述通常以量 表或(例如,作為對應查找 ^ aa 飞夕個索引)而出現於經編碼訊框内。因 此,s慣使解碼器接收以對 數值隼a t ώ !化更有效之形式的LPC系 (LSF)值U _對(LSP)值集合、線頻譜頻率 ⑽)值隹:、導抗頻譜對(ISP)值集合、導抗頻譜頻率 ()值集合、倒頻譜系數值集合,或對數面積比值集合。 邊音解碼器通常經組態以將該集合轉換成對應Lpc系數值 集合》 圖1展不包括激勵纟成遽波器之語音解碼器的通用實 例。為了解碼經編碼訊框,使用經解量化Lpc系數值以在 解碼器處組態合成遽波器。經編碼訊框亦可包括時間資 訊’或描述訊框週期内隨時間之能量分布的資m。舉例而 言,時間資訊可描述用以激勵合成濾波器以再生語音信號 之激勵信號。 語音信號之活動訊框可經分類為兩個或兩個以上不同類 型中之一者,諸如,有聲(例如,表示母音聲)、無聲(例 如’表示摩擦音聲),或過渡(例如,表示字之開頭或結 尾)。有聲語音之訊框傾向於具有為長期(亦即,持續一個 以上訊框週期)且與音高(pitch)有關之週期結構,且通常更 有效的係使用編碼此長期頻譜特徵之描述的編碼模式來編 碼有聲訊框(或有聲訊框序列)。該等編碼模式之實例包括 碼激勵線性預測(CELP)、原型音高週期(ppp)及原型波形 内插(PWI)。另一方面,無聲訊框及不活動訊框通常缺乏 125582.doc -15- 丄观031 任何顯著長期頻譜特徵,且語音編碼器可經組態以使用並 不。式圖描述該特徵之編碼模式來編碼此等訊框。雜訊激勵 線性預測(NELP)為該編碼模式之一實例。 圖2展不有聲語音區段(諸如,母音)隨時間之振幅的一 ' 實例。對於有聲訊框而言,激勵信號通常類似在音高頻率 - 處為週期性之脈衝系列,而對於無聲訊框而言,激勵信號 通韦類似於白高斯(Gaussian)雜訊。CELp編碼器可利用為 φ 有聲語音區段之特性的較高週期性來達成更佳編碼效率。 CELP編碼器為使用一或多個碼簿來編碼激勵信號之合 成式分析(analysis-by-synthesis)語音編碼器。在編碼器 處,選擇一或多個碼薄項。解碼器接收此等項之碼薄索 引,以及增益因數之對應值(其亦可為一或多個增益碼薄 • 内之索引)。解碼器藉由增益因數來定標碼薄項(或基於其 之信號)以獲得激勵信號,該激勵信號用以激勵合成濾波 器且獲得經解碼語音信號。 φ 一些CELP系統使用音高預測濾波器來模型化週期性。 其他CELP系統使用適應性碼薄(或ACB,亦被稱為”音高碼 薄)來模型化激勵信號之週期分量或音高相關分量,其中 固定碼薄(亦被稱為"創新碼薄")通常用以將非週期分量模 ^ 型化為(例如)脈衝位置系列。-般而言,高有聲區段係最 為感知有關的。對於使用適應性CELp機制而編碼之高有 聲語音訊框而言,激勵信號之大部分由ACB模型化,其通 常為強週期性的,其中主頻率分量對應於音高滞後。 對激勵仏號之ACB貢獻表示當前訊框之殘餘物與來自一 125582.doc 16 1362031 或多個過去訊框之資訊之間的相關。acb通常被實施為儲 存過去語音信號之樣本或其導出物(諸如,語音殘餘或激 勵h號)的記憶體。舉例而言,ACB可含有被延遲不同量 之先前殘餘物之複本。在一實例中,ACB包括先前合成之 語音激勵波形之不同音高週期集合。 經適應性編碼之訊框之一參數為音高滞後(亦被稱為延 遲或音鬲延遲)。此參數通常經表達為語音樣本之最大化 訊框之自相關功能的數目且可包括分數分量。人類聲音之 音高頻率通常係在自40 Hz至500 Hz之範圍内,其對應於 約200至1 6個樣本。適應性CELp解碼器之一實例藉由音高 滯後來轉譯選定ACB項。解碼器亦可内插經轉譯項(例 如,使用有限脈衝回應或FIR濾波器)。在一些狀況下,音 冋坪後可充當ACB索引。適應性CELP解碼器之另一實例 經組態以根據音高滞後參數之對應連續但不同的值來使適 應性碼薄之區段平滑(或"時間扭曲"(time-warp))。 經適應性編碼之訊框之另一參數為ACB增益(或音高增 益),其指不長期週期性之強度且通常對於每一子訊框而 加以S平估°為了獲得對用於特定子訊框之激勵信號的ACB 貝獻’解碼器以對應ACB增益值乘内插信號(或其對應部 为)。圖3展不具有ACB之cELp解碼器之一實例的方塊圖, 其中gc及gP分別表示碼薄增益及音高增益。另一常見ACB ^數為差異(delta)延遲,其指示當前訊框與先前訊框之間 的延遲差且可用以計算消除訊框或惡化訊框之音高滯後。 熟知的時域語音編碼器為L.B· Rabiner & R.W. Schafer, 125582.doc -17- 1362031
Digital Processing of Speech Signals(^ 396-453 I (i978)) t 所述之碼激勵線性預測(CELP)編碼器。一例示性可變速率 CELP編碼器描述於美國專利第5,414,796號中,該專利被 讓渡給本發明之受讓人且以引用的方式全部併入本文中。 存在CELP之許多變體。代表性實例包括下列各項:amr 語音編解碼器(適應性多速率,第三代合作夥伴計割 (3GPP)技術規格(TS)26.090,第 4、5 及 6 章,2〇〇4 年 12
月);AMR-WB語音編解碼器(AMR·寬頻帶,國際電信聯盟 (ITU)-T 建議 G.722.2,第 5 及 6 章,2〇〇3 年 7 月);及 EVRC(增強型可變速率編解碼器,電子工業同盟組織 (EIA)/電信工業協會(TIA)過渡期標準Is_m,第4章及第$ 章,1997年1月)。
圖4說明解碼CELP訊框系列之過程中的資料相依性。經 編碼訊框B提供適應性增益因數B,且適應性碼薄提供基 於來自先前激勵信號A之資訊的序列A。解碼過程產生基 於適應性增益因數B及序列A之激勵信號B ,該激勵信號B 根據來自經編碼訊框B之頻譜資訊而經頻譜整形以產生經 解碼訊框B。解碼過程亦基於激勵信號b來更新適應性碼 薄。下一經編碼訊框C提供適應性增益因數C,且適應性 碼薄提供基於激勵信號B之序列B。解碼過程產生基於適 應性增益因數C及序列B之激勵信號C,該激勵信號c根據 來自經編碼訊框C之頻譜資訊而經頻譜整形以產生經解碼 訊框C °解碼過程亦基於激勵信號C來更新適應性碼薄, 等等’直至遇到以不同編碼模式(例如,NELP)而編碼之訊 125582.doc -18- 1362031 /或全速率PPP機制及四分之 率 〇 可能需要使用可變速率編碼機制(例如,以平衡網路需 求及容量)。亦可能需要使用多模式編碼機制,其中根據 基於(例如)週期性或發聲(V01cing)之分類而使用不同模 气來.扁碼訊框。舉例而s,可能需要使語音編碼器對於活 動訊框及不活動訊框使用不同編碼模式及/或位元速率。 亦可能需要使語音編碼器對於不同類型之活動訊框使用位 元速率與編碼模式(亦被稱為"編碼機制·')之不同組合。該 語音編碼器之—實例對於含有有聲語音之訊框及過渡訊框 使用全速率CELP機制、對於含有無聲語音之訊框使用半 速率NELP機制,且對於不活動訊框使用人分之一速率 NELP機制。該語音編碼^其他㈣支援詩—或多個 編碼機制(諸如,全速RELp_及半㈣CELp機制,及 -速率PPP機制)之多個編碼速
圖5展示接收封包及對應封包類型指 子層)之多模式可變速率解碼器之一 125582.doc 1362031 頻率及/或衰減頻譜谷)之後置濾波器(postfi丨ter)且亦可包 括適應性增益控制。 圖6說明解碼NELP訊框繼之以CELP訊框之過程中的資 料相依性。為了解碼經編碼NELP訊框N,解碼過程產生雜 訊信號作為激勵信號N,該激勵信號N根據來自經編碼訊 框N之頻譜資訊而經頻譜整形以產生經解碼訊框N。在此 實例中,解碼過程亦基於激勵信號Ν來更新適應性碼薄。 經編碼CELP訊框C提供適應性增益因數c,且適應性碼薄 提供基於激勵信號Ν之序列N。NELP訊框Ν之激勵信號與 CELP訊框C之激勵信號之間的相關可能非常低,使得序列 Ν與訊框C之激勵信號之間的相關亦可能非常低。因此, 適應性增益因數C可能具有接近於零之值。解碼過程產生 名義上基於適應性增益因數c及序列Ν但可能更大量地基 於來自經編碼訊框C之固定碼薄資訊的激勵信號c,且激 勵信號C根據來自經編碼訊框c之頻譜資訊而經頻譜整形 以產生經解碼訊框C^解碼過程亦基於激勵信號c來更新 適應性碼薄。 在一些CELP編碼器中,LPC係數係對於每一訊框而加以 更新,而諸如音高滞後及/或ACB增益之激勵參數係對於 每一子訊框而加以更新。在AMR_WB中,例如,諸如音高 滞後及ACB增益之CELP激勵參數係對於四個子訊框中之 每一者而被更新一次。在EVRC之CELP模式中,16〇樣本 訊框之三個子訊框(分別具有長度53、53及54個樣本)中之 每一者具有對應ACB增益值及FCB增益值以及對應FCB索 125582.doc -20- 1362031 引。單一編解碼器内之不同模式亦可不同地處理訊框。在 EVRC編解碼器中,例如,CELp模式根據具有三個子訊框 之訊框來處理激勵信號,而NELp模式根據具有四個子訊 框之訊框來處理激勵信號。亦存在根據具有兩個子訊框之 訊框來處理激勵信號的模式。
可變速率語音解碼器可經組態以自諸如訊框能量之一或 多個參數確定經編碼訊框之位元速率。在一肚 ^ 二艰用T,編 碼系統經組態以對於特定位元速率僅使用一編碼模式使 得經編碼訊框之位元速率亦指示編碼模式。在其他狀況 下,經編碼訊框可包括諸如一或多個位元之集合的資訊, 其識別編碼訊框所根據之編碼模式。該位元集合亦被稱為 :編碼索引”。在一些狀況下,編碼索引可明顯地指示編碼 模式。在其他狀況下,編碼索引可(例如)藉由指示對於另 一編碼模式將為無效之值來隱含地指示編碼模式。在此描
述及附加中請專利範圍中,術語”格式"或"訊框格式"用Z
指不可確定編碼模式所來自之經編碼訊框之一或多個態 樣’該等態樣可包括如以上所述之位元速率及/或編碼^ 引。 圖7說明處置在CELP訊框之後的訊框消除之過程中的資 料相依性。如在圖4中,經編碼訊框B提供適應性增益因數 B,且適應性碼薄提供基於來自先前激勵信號A之資訊的 序列A。解碼過程產生基於適應性增益因㈣及序列a之激 勵信號B,該激勵信號B根據來自經編碼訊框b之頻譜資訊 而、i頻》日整形以產生經解碼訊框B。解碼過程亦基於激勵 125582.doc 1362031 信號B來更新適應性碼薄。回應於下一經編碼訊框被消除 之指示’解碼過程繼續以先前編碼模式(亦即,CELP)而操 作’使得適應性碼薄提供基於激勵信號Β之序列β ^在此 狀況下,解碼過程產生基於適應性增益因數Β及序列8之 激勵信號X’該激勵信號X根據來自經編碼訊框Β之頻譜資 訊而經頻譜整形以產生經解碼訊框X。 圖8展示符合3GPP2標準C.S0014-A vl.0(EVRC服務選項 3)(第5章’ 2004年4月)之訊框消除恢復方法的流程圖。美 國專利申請公開案第2002/0 123887號(Unno)描述根據ITU- T建議G.729之類似過程。該方法可(例如)藉由如圖5所示之 訊框錯誤恢復模組而加以執行。該方法以偵測當前訊框為 不可用(例如’用於當前訊框之訊框消除旗標之值 [FER(m)]為真)而起始。任務111〇確定先前訊框是否亦為 不可用。在此實施例中,任務T11〇確定用於先前訊框之訊 框消除旗標之值[FER(m-l)]是否亦為真。 若未消除先前訊框,則任務丁12〇將用於當前訊框之平均 適應性碼簿增益之值[gpavg(m)]設定至用於先前訊框之平均 適應性碼薄增益之值。否則(亦即,若亦消除 先前訊框)’則任務T1 30將用於當前訊框之平均ACB增益 之值[gpavg(m)]設定至用於先前訊框之平均acb增益之衰減 版本[gpavg(m-l)]。在此實例中,任務τΐ3〇將平均ACB增益 設定至gpavg(m-l)值的〇.75倍。任務T140接著將用於當前訊 框之子訊框的ACB增益之值[gp(m.i),i = 〇,ι,2]設定至 gpavg(rn)值。通常’對於消除訊框而將FCB增益因數設定至 125582.doc •22· 1362031 零。3GPP2標準 C.S0014-C vl.〇之第 5.2 3 5 節對於EVRC服 務選項68而料此方法之變體,纟中若先前訊框被消除或 經處理為靜默訊框或NELP訊框,則將用於當前訊框之子 訊框的ACB增益之值i = 〇12]設定至零。 在訊框消除之後的訊框可僅在無記憶系統中或以編碼模 式被無錯誤地解碼。對於利用與一或多個過去訊框之相關 的模式,訊框消除可能使錯誤傳播至後續訊框中。舉例而 言,適應性解碼器之狀態變數可能需要一些時間以自訊框 消除中恢復。對於CELP編碼器而言,適應性碼薄引入強 訊框間相依性且通常為該錯誤傳播之主因。因此,典型的 係使用不高於先前平均值之ACB增益(如在任務τΐ2〇中), 或甚至使ACB增益衰減(如在任務τπ〇中卜然而在某些 狀況下,該實踐可能不利地影響後續訊框之再生。 圖9說明包括非有聲區段繼之以持續有聲區段之訊框序 列的實例。該持續有聲區段可出現在諸如"crazy"或” 之單詞中。如此圖中所指示,持續有聲區段之第一訊框對 過去具有低相依性。具體言<,若使用適應性碼薄來編碼 訊框,則用於訊框之適應性碼簿增益值將較低。對於持續 有聲區段中之其餘訊框而言,ACB增益值將由於鄰近訊框 之間的強相關而通常較高。 在該情況下,若消除持續有聲區段之第二訊框,則可能 出現問題。因為此訊框對先前訊框具有高相依性,故其適 應性碼薄增益值應較高,從而加強週期分量。然而,因為 訊框消除恢復將通常自先前訊框重建消除訊框,故恢復訊 125582.doc •23· 1362031 框將具有低適應性碼薄增益值,使得來自先前有聲訊框之 貢獻將不適當地低。此錯誤可傳播穿過隨後之若干訊框。 出於該等原因,持續有聲區段之第二訊框亦被稱為顯著訊 框。或者,持續有聲區段之第二訊框亦可被稱為決定性訊 框。 圖l〇a、圖l〇b、圖i〇c及圖10d展示根據本揭示案之各別 組態之方法M110、M120、M130及M140的流程圖。此等方 法中之第一任務(任務T11、丁12及丁13)偵測先於訊框消除 之兩個訊框中的一或多個特定模式序列或(任務T14)偵測 持續有聲區段之顯著訊框的消除。在任務T11、Tl2及τη 中,通常關於編碼彼等訊框所根據之模式來確定特定序 列。 在方法Μ110中,任務T11偵測序列(非有聲訊框、有聲訊 框、訊框消除)。"非有聲訊框"之類別可包括靜默訊框(亦 即’背景雜訊)以及諸如摩擦音之無聲訊框。舉例而言, 類別"無聲訊框"可經實施以包括以NELp模式或靜默模式 (其通吊亦為NELP模式)而編碼之訊框。如圖i〇b所示,"有 聲訊框'•之類別可在任務T12中限於使用CELP模式(例如, 在亦具有一或多個PPP模式之解碼器中)而編碼之訊框。此 類別亦可進一步限於使用具有適應性碼薄之CELp模式(例 如,在亦支援僅具有固定碼薄之CELP模式的解碼器中)而 編碼之訊框。 方法Μ13 0之任務T13按照用於訊框令之激勵信號來特性 化目標序列,其中第一訊框具有非週期激勵(例如,如 125582.doc -24- 1362031 NELP編碼或靜默編碼中所使用之隨機激勵),且第二訊框 具有適應性且週期激勵(例如,如具有適應性碼薄之CELp 模式中所使用)。在另一實例中,任務T13經實施以使得所 摘測序列亦包括不具有激勵信號之第一訊框。方法MU〇 之摘測持續有聲區段之顯著訊框之消除的任務Τ14可經實 施以偵測緊跟在序列(NELP訊框或靜默訊框、cElp訊框) 之後的訊框消除。 任務Τ20至少部分地基於消除之前的訊框來獲得增益 值。舉例而言,所獲得增益值可為對於消除訊框而預測 (例如,藉由訊框消除恢復模組)之增益值。在一特定實例 中,增益值為藉由訊框消除恢復模組而對於消除訊框所預 測之激勵增益值(諸如,ACB增益值)。圖8之任務Tll〇至 Τ140展示一實例’其中基於先於消除之訊框來預測若干 ACB 值。 若偵測到所指示序列(或所指示序列中之一者),則任務 Τ30將所獲得增益值與一臨限值比較。若所獲得增益值小 於(或者’不大於)該臨限值,則任務Τ40增加所獲得增益 值。舉例而言’任務Τ40可經組態以將一正值添加至所獲 得增益值,或以大於一之因數乘所獲得增益值。或者,任 務Τ40可經組態成以一或多個較高值來替換所獲得增益 值。 圖11展示方法Μ120之組態Μ180的流程圖。任務Τ110、 Τ120、Τ130及Τ140係如以上所述。在已設定§15"8(111)值(任 務Τ120或Τ130)之後,任務Ν210、Ν220及Ν230測試與當前 125582.doc •25· 1362031 訊框及近來歷史有關之某些條件。任務N210確定先前訊框 是否經編碼為CELP訊框。任務N22〇確定先前訊框之前的 訊框是否經編碼為非有聲訊框(例如’經編碼為NELp或靜 默)。任務N230確定gpavg(m)值是否小於一臨限 。 *** max 任務Ν210、Ν220及Ν230中之任一者的結果為否定,則如 以上所述來執行任務T14〇。否則’任務Ν24〇將新增益設 定檔(gain profile)指派至當前訊框。 在圖11所示之特定實例中’任務N240將值τΐ、T2及T3 刀別扣派至gp(m.i)值,i = 〇, 1,2。此等值可經配置以使得 T1 2 T2 > T3,從而導致為水平或減少之增益設定檔,其 中τι接近於(或等於)Tmax。 任務N240之其他實施例可經組態成以各別增益因數(至 少一增益因數大於一)或以共同增益因數乘一或多個 gp(m.i)值’或將一正偏移添加至一或多個gp(mi)值。在該 等狀況下,可能需要對每一 gp(m i)值強加一上限(例如, Tmax)。任務N2 10至N240可被實施為訊框消除恢復模組内 之硬體、韌體及/或軟體常用程式。 在一些技術中’消除訊框係自在一或多個先前訊框及 (可能)一或多個跟隨訊框期間所接收的資訊被外插。在一 些組態中,先前訊框與未來訊框中之語音參數用於重建消 除訊框。在此狀況下,任務T20可經組態以基於消除之前 的訊框與消除之後的訊框來計算所獲得增益值。另外或其 他’任務T40之一實施例(例如,任務N240)可使用來自未 來訊框之資訊來選擇增益設定檔(例如,經由内插增益 125582.doc •26- 1362031 值)。舉例而言,任務Τ4〇之該實施例可選擇水平或增加之 增益設定檔以代替減少之增益設定檔,或選擇增加之增益 設定檔以代替水平之增益設定檔。此種類之組態可使用抖 動緩衝器來指示未來訊框是否可用於該用途。 圖12展示根據一組態之包括訊框消除恢復模組1〇〇之語 音解碼器的方塊圖。該模組100可經組態以執行如本文中 所述之方法 M110、M120、M130 或 M180 » 圖13A展示根據一通用組態之獲得經解碼語音信號之訊 框之方法M200的流程圖,其包括任務T21〇、丁22〇、 任務丁210產生第一激勵信 Τ230、Τ240、Τ245 及 Τ250。 號。基於第一激勵信號,任務Τ22〇計算經解碼語音信號之 第一訊框。任務Τ230產生第二激勵信號。基於第二激勵信 號,任務Τ240計算緊跟在經解碼語音信號之第一訊框之後 的第二訊框。 定,任務Τ24 。任務Τ245產生第三激勵信號。視特定應用而
資料相依性。
CELP編碼模式)。對於在第一 號來解碼訊框(例如,使用 經編碼訊框之位元速率下僅 125582.doc •27- 1362031 使用-編碼模式之編碼系統而言位元速率之確定可足以 確疋為碼㈣,使得位元速率之指示亦可用來指示訊框格 式。
“對於在第1編碼訊框之位元速率下使用—個以上編碼 、式之、·扁碼系統而言,經編碼訊框可包括編碼索引,諸 如’識別編碼模式之—或多個位元之集合。在此狀況下, 格式指示可基於編碼索引之確定。在一些狀況下編碼索 引可明顯地指示編碼模式。在其他狀況下,編碼索引可 (例如)藉由指示對於另一編碼模式將為無效之值來隱含地 指不編碼模式。
回應於格式指示,任務T210產生基於第一值序列之第— 激勵信號。第一值序列係基於來自第三激勵信號之資訊, 諸如,第三激勵信號之區段。第—序列與第三激勵信號之 間的此關係由圖13 A中之虛線指示。在一典型實例中第 一序列係基於第三激勵信號之最後子訊框。任務Τ2ι〇可包 括自適應性碼薄擷取第一序列。 圖13Β展示根據一通用組態之用於獲得經解碼語音信號 之訊框之裝置F200的方塊圖。裝置F2〇〇包括用於執行圖 13A之方法M200之各種任務的構件。構件F21〇產生第一激 勵信號。基於第一激勵信號,構件F22〇計算經解碼語音俨 號之第一訊框。構件F23 0產生第二激勵信號。基於第二激 勵信號,構件F240計算緊跟在經解碼語音信號之第—訊框 之後的第二訊框。構件F245產生第三激勵信號。視特定應 用而定’構件F245可經組態以產生基於所產生雜訊信號及 125582.doc •28· 1362031 /或基於來自適應性碼薄之資訊(例如,基於來自一或多個 先刖激勵k遗之資訊)的第三激勵信號。基於第三激勵信 號’構件F250計算緊接在經解碼語音信號之第一訊框之前 的第三訊框。 圖14展示一實例,其中任務T210產生基於第一增益因數 及第一序列之第一激勵信號。在該狀況下,任務Τ21〇可經 組態以產生基於第一增益因數與第一序列之乘積的第一激 勵信號。第一增益因數可基於來自第一經編碼訊框之資 訊,諸如,適應性增益碼薄索引。任務Τ21〇可經組態以產 生基於來自第一經編碼訊框之其他資訊(諸如,指定對第 一激勵信號之固定碼薄貢獻的資訊(例如,一或多個碼薄 索引及對應增益因數值或碼薄索引的第一激勵信號。 基於第一激勵信號及來自第一經編碼訊框之資訊,任務 Τ220計算經解碼語音信號之第一訊框。通常,來自第一經 編碼訊框之資訊包括頻譜參數值集合(例如,一或多個[Μ 或LPC係數向量),使得任務T22〇經組態以根據該等頻譜參 數值來整形第一激勵信號之頻譜。任務Τ22〇亦可包括對第 一激勵信號、來自第一經編碼訊框之資訊及/或所計算第 一訊框執行_或多個其他處理操作(例如,濾波、平滑、 内插)。 任務Τ230回應於緊跟在經編碼語音信號中之第一經編碼 訊框之後的經編碼訊框之消除之指示而執行。消除之指示 可基於下列條件中之-❹者:⑴訊框含有待恢復之= 位元錯誤;(2)對於訊框而指示之位元速率為無效或無支援 125582.doc •29- 1362031 的;(3)訊框之所有位元皆為零 _ 、;了於訊框而才曰不之位 兀速率為八为之一速率,且 4Τ岌也二 所有位70皆為一,·(5)訊 框為工白的且最後有效位元速率不為八分之—速率。 任務Τ230亦根據一臨限值與一基於第-增益因數之值 (亦被稱為”基線增益因數值")之間的關係而執行。舉例而 厂任務Τ230可經組態以在基線增益因數值小於(或者, 不大於)臨限值時執行。尤其對於第一經編碼訊框僅包括 一適應性碼薄增益因數的應用而言,基線增ϋ因數值可僅 僅為第一增益因數之值。料^ 第一,.·圼編碼訊框包括若干適 應性㈣增益因數(例如,對於每一子訊框之不同因幻的 應用而言,基線增益因數值亦可基於其他適應性碼薄增益 因數中之一或多者。在該狀況下,例如,如在參看圖U而 論述之值gpavg(m)t,基線增益因數值可為第一經編碼訊 框之適應性碼薄增益因數的平均值。 任務T230亦可回應於第一經編碼訊框具有第一格式且先 於第-經編碼訊框之經編碼訊框(”先前訊框”)具有不同於 第-格式之第二格式的指示而執行。第二格式指示:將使 用基於雜訊信號之激勵信號來解碼訊框(例如,使用NELp 編碼模式)。對於在先前訊框之位元速率下僅使用一編碼 模式之編碼系統而言,位元速率之確定可足以確定編碼模 式,使付位7G速率之指示亦可用來指示訊框格式。或者, 先前訊框可包括指示編碼模式之編碼索引,使得格式指示 可基於編碼索引之確定。 任務T23 0產生基於大於第一增益因數之第二增益因數的 125582.doc -30. 1362031 第一激勵信號。第二增益因數亦可大於基線增益因數值。 舉例而言,第二增益因數可等於或甚至大於臨限值。對於 任務T230經組態以產生第二激勵信號作為子訊框激勵信號 系列的狀況而言,第二增益因數之一不同值可用於每一子 訊框激勵信號,其中該等值中之至少一者大於基線增益因 數值。在該狀況下’可能需要使第二增益因數之不同值經 配置以在訊框週期内上升或下降。 任務T23 0通常經組態以產生基於第二增益因數與第二值 序列之乘積的第一激勵k戒。如圖14所示,第二序列係基 於來自第一激勵信號之資訊,諸如,第一激勵信號之區 fee。在一典型實例中,第二序列係基於第一激勵信號之最 後子訊框。因此’任務T2 1 0可經組態以基於來自第一激勵 k號之資訊來更新適應性碼薄。對於方法M2〇〇至支援鬆 弛CELP(RCELP)編碼模式之編碼系統的應用而言,任務 T210之該實施例可經組態以根據音高滞後參數之對應值來 使區段進行時間扭曲。該扭曲操作之一實例描述於以上所 引用之3GPP2文件C.S0014-C vl.O之第5.2.2節(參看第 4.11.5卽)中。任務T2 30之其他實施例可包括如以上所述之 方法M110、M120、M130、河140及]^180中之一或多者。 基於第二激勵信號,任務T240計算緊跟在經解碼語音信 波之第一訊框之後的第二訊框。如圖14所示,任務丁24〇亦 可經組態以基於來自第一經編碼訊框之資訊(諸如,如以 上所述之頻譜參數值集合)來計算第二訊框。舉例而言, 任務T24〇可經組態以根據頻譜參數值集合來整形第二激勵 125582.doc -31 - 1362031 就之頻错。 或者,任務Τ240可經組態以根據基於頻譜參數值集入 第一頻譜參數值集合來整形第二激勵信號之頻譜。舉例 3,任務Τ240可經組態以將第二頻譜參數值集合計算為 自第-經編碼訊框之頻譜參數值集合與初始頻譜參數 合的平均值。作為加權平均值之該計算的—實例 上所引用之3GPP2文件C.S0014-C vl.O之第5.2.1節中 務T240亦可包括對第二激勵信號、來自第 '經編碼訊 資訊及所計算第^ Λ 第一訊框中之一或多者執行一或多個其他處 理操作(例如,據波、平滑、内插)。 他處 基於第錢勵錢,任務Τ25()計算先於轉碼 中訊樞的第三訊框。任務咖亦可包括藉由儲^ ^列來更新適應性碼薄,其中第—序㈣基於第三激勵 ° ,之至少一區段。對於方法M200至支援歡 CELP(RCELP)編碼模式之編碼㈣的應m任務咖 Z經組態以減音高滞後參數之對應值來使區段進行時間 扭曲。該扭曲操作之-實例描述於以上㈣用之3卿2文 件C.S〇〇14_Cvl.〇之第⑴節(參看第4$節忡。 經編碼訊框之至少—此灸叙-Γ a- 二 > 數了經配置以將對應經解碼訊 王之^態樣描述為子訊㈣列。舉心言,以㈣㈣ 編碼模式而格式化之經編喝訊框包括用於訊框之 隼:數值集合及用於子訊框中之每一者的獨立時間參數 如’碼薄索引及增益因數值)。對應解碼器可經組 -藉由子訊框來遞增地計算經解碼訊框。在該狀況下, 125582.doc •32- 1362031 任務T210可經組態以產生第一激勵信號作為子訊框激勵信 號系列’使得該等子訊框激勵信號中之每一者可基於不同 增益因數及/或序列《任務T2丨〇亦可經組態成以來自子訊 框激勵信號中之每一者的資訊來連續地更新適應性碼薄。 同樣地’任務T220可經組態以基於第一激勵信號之一不同 子訊框來計鼻第一經解碼訊框之每一子訊框。任務T22〇亦 可經組態以内插訊框之間在子訊框内之頻譜參數集合或另 外使其平滑。 圖1 5 Α展示解碼器可經組態以使用來自基於雜訊信號之 激勵信號(例如,回應於NELP格式之指示而產生的激勵信 號)的資訊來更新適應性碼薄。詳言之,圖15A展示方法 1^200(自圖13八及以上所論述)之該實施例]^2〇1的流程圖, 其包括任務T260及T270。任務T260產生雜訊信號(例如, 近似白高斯雜訊之偽隨機信號),且任務T27〇產生基於所 產生雜訊仏號之第三激勵信號。再次,第一序列與第三激 勵信號之間的關係由圖1 5 Α中之虛線指示能/系要使任 務T260使用基於來自對應經編碼訊_框^其他資訊(例如, 頻譜資訊)的種子值來產生雜訊信號,因為該技術可用以 支援用於編碼器處之相同雜訊信號的產生。方法M2〇 1亦 包括任務丁250(自圖13八及以上所論述)之一實施例丁252, 其基於第三激勵信號來計算第三訊框。任務T252亦經組態 以基於來自緊接在第一經編碼訊框之前("先前訊框")且具 有第二格式之經編碼訊框的資訊來計算第三訊框。在該等 狀況下’任務Τ230可基於(Α)先前訊框具有第二格式及(Β) 125582.doc •33 - 1362031 第一經編碼訊框具有第一格式之指示。 圖15B展示對應於以上關於圖ι5Α所論述之方法m2〇i之 裝置F201的方塊圖。裝置F2(H包括用於執行方法M2〇1之 各種任務的構件°各種元件可根據能夠執行該等任務之任 可、’。構(包括用於執行本文中所揭示之該等任務的結構中 之任者)而加以實施(例如,作為一或多個指令集合、一 或多個邏輯元件陣列’等等)。圖15B展示解碼器可經組態 以使用來自基於雜訊信號之激勵信號(例如,回應於NELp 格式之指示而產生的激勵信號)的資訊來更新適應性碼 薄。圖15B之裝置F2(n類似於圖nB之裝置F2〇〇,其中添 加了構件F260 ' F270及F252。構件F26〇產生雜訊信號(例 如,近似白高斯雜訊之偽隨機信號),且構件F27〇產生基 於所產生雜訊信號之第三激勵信號。再次,第一序列與第 三激勵信號之間的關係由所說明之虛線指示。可能需要使 構件F260使用基於來自對應經編碼訊框之其他資訊(例 如,頻譜資訊)的種子值來產生雜訊信號,因為該技術可 用以支援用於編碼器處之相同雜訊信號的產生。裝置ρ2〇ι 亦包括對應於構件F250(自圖13A及以上所論述)之構件 F252。構件F252基於第三激勵信號來計算第三訊框。構件 F252亦經組態以基於來自緊接在第一經編碼訊框之前("先 刖訊框)且具有第二格式之經編碼訊框的資訊來計算第二 訊框。在該等狀況下,構件F230可基於(A)先前訊框具有 第二格式及(B)第一經編碼訊框具有第一格式之指示。 圖16說明方法M201之一典型應用中的一些資料相依 125582.doc -34· 14在此應用中,緊接在第一經編碼訊框之前的經編碼訊 框(在此圖中被指不為"第二經編碼訊框具有第二格式(例 如NELP格式)。如圖16所示任務了252經組態以基於來 自第二經編碼訊框之資訊來計算第三訊框。舉例而言,任 務T252可經組態以根據基於來自第二經編碼訊框之資訊的 頻譜參數值集合來整形第三激勵信號之頻譜。任務T252亦 二括對第三激勵信號、來自第二經編碼訊框之資訊及所
計算第三訊框中之-或多者執行-或多個其他處理操作 (例如’濾、波、平滑 '内插)。任務T252亦可經組態以基於 來自第一激勵仏號之資訊(例如,第三激勵信號之區段)來 更新適應性碼薄。
者音信號通常包括發言者靜默期間之週期。可能需要使 編碼器在該週期期間對於少於所有不活動訊框傳輸經編碼 訊框。6亥操作亦被稱為不連續傳輸(DTX)。在一實例中, 語音編碼器藉由對於32個連續不活動訊框之每一串傳輸一 經編碼不活動訊框(亦被稱為"靜默描述符,,、”靜默描述”或 SID)來執仃DTX。在其他實例中,語音編碼器藉由對於不 同數目之連續不活動訊框(例如,8或16)之每一串傳輸一 SID及/或藉由在某其他事件(諸如’訊框能量改變或頻譜 傾斜)後即傳輸一 SID來執行DTX。對應解碼器對於未接收 到經編碼訊框時之後續訊框週期使用SID中之資訊 頻譜參數值及增益設定擋)來合成不活動訊框。 可能需要在亦支援DTX之編碼系統中使用方法M2〇〇。 圖〗7說明方法M20〗之該應用的一些資料相依性,其令第 125582.doc •35- 1362031 二經編碼訊框為SID訊框,且此訊框與第一經編碼訊框之 間的訊框被遮沒(此處被指示為"DTX時間間隔")。將第二 經編碼訊框連接至任務T252之線為虛線的’以指示來自第 二經編碼訊框之資訊(例如,頻譜參數值)用以計算經解碼 έ吾音信號之一個以上訊框。 如以上所述,任務Τ230可回應於先於第一經編碼訊框之 經編碼訊框具有第二格式的指示而執行。對於如圖丨了所示 之應用而言,第二格式之此指示可為緊接在第—經編碼訊 框之前的訊框對於DTX而加以遮沒的指示,或NELp編碼 模式用以計算經解碼語音信號之對應訊框的指示。或者, 第二格式之此指示可為第二經編碼訊框之格式的指示(亦 即,在第一經編碼訊框之前的最後SID訊框之格式的指 示)。 圖17展示一特定實例,其中第三訊框緊接在經解碼語音 信號中之第一訊框之前且對應於DTX時間間隔内之最後訊 框週期。在其他實例中,第三訊框對應sDTX時間間隔内 之另一訊框週期,使得一或多個訊框將經解碼語音信號中 之第三訊框與第一訊框分離。圖17亦展示一實例,其中在 DTX時間間隔期間不更新適應性碼薄。在其他實例中,在 DTX時間隔期間所產生之—或多個激勵信號用以更新適 應性碼薄。 對基於雜訊之激勵信號之記憶可能不可用於產生用於後 續汛框之激勵信號。因此,可能需要使解碼器不使用來自 基於雜訊之激勵彳s號的資訊來更新適應性碼薄。舉例而 125582.doc -36- 5 ’該解碼器可經組態以僅在解碼CELP訊框時或僅在解 碼CELP訊框、ppp訊框或pwi訊框時且不在解碼NELp訊框 時更新適應性碼薄。 圖18展示方*M2〇〇(圖13A)之該實施例方法M203的流程 圖,其包括任務T260、T280及T290。任務T280產生基於 由任務T260所產生之雜訊信號的第四激勵信號。在此特定 實例中’任務T210及T280經組態以根據第二經編碼訊框具 有第二格式的指示而執行’如實線所指示。基於第四激勵 信號’任務T290計算經解碼語音信號之緊接在第三訊框之 刖的第四訊框。方法M203亦包括任務Τ250(圖13A)之一實 施例Τ254 ’其基於來自任務Τ245之第三激勵信號來計算經 解碼語音信號之第三訊框。 任務Τ290基於來自先於第一經編碼訊框之第二經編碼訊 框的育訊(諸如,頻譜參數值集合)來計算第四訊框。舉例 而言,任務Τ290可經組態以根據頻譜參數值集合來整形第 四激勵信號之頻譜。任務Τ254基於來自先於第二經編碼訊 框之第二經編碼訊框的資訊(諸如,頻譜參數值集合)來計 算第二訊框。舉例而言,任務丁254可經組態以根據頻譜參 數值集合來整形第三激勵信號之頻譜。任務Τ254亦可經組 態以回應於第三經編碼訊框具有第一格式的指示而執行。 圖19說明方法Μ203(圖18)之一典型應用中的一些資料相 依性。在此應用中,第三經編碼訊框可藉由激勵信號不用 以更新適應性碼薄之一或多個經編碼訊框(例如,具有 NELP格式之經編碼訊框)而與第二經編碼訊框分離。在該 125582.doc •37- 1362031 狀況下,第三經解碼訊框與第四經解碼訊框將通常藉由分 離第二經編碼訊框與第三經編碼訊框之相同數目之訊框而 分離。 如以上所述,可能需要在亦支援DTX之編碼系統中使用 方法M2GG。圖2G說明方法胸3(圖18)之該應用的一些資 料相依性,其巾第二經編碼訊框為sm訊框,且此訊框與 第L編碼訊框之間的訊框被遮沒。將第二經編瑪訊框連 接至任務T29G之線為虛線的’以指示來自第二經編碼訊框 之寊訊(例如,頻譜參數值)用以計算經解碼語音信號之— 個以上訊框。 如以上所述,任務T23〇可回應於先於第一經編碼訊框之 ’扁碼訊框具有第一格式的指示而執行。對於如圖2 〇所示 之應用❿言,帛二格式之此指*可為緊接在第一經編碼訊 框之前的訊樞對於DTX而加以遮沒的指示,或NELp編碼 模式用以計算經解碼語音信號之對應訊框的指示。或者, 第一格式之此指示可為第二經編碼訊框之格式的指示(亦 即’在第一經編碼訊框之前的最後SID訊框之格式的指 示)〇 圖20展示一特定實例,其中第四訊框緊接在經解碼語音 信號中之第一訊框之前且對應於DTx時間間隔内之最後訊 框週期。在其他實例中’第四訊框對應於〇τχ時間間隔内 之另一訊框週期,使得一或多個訊框將經解碼語音信號中 之第四訊框與第一訊框分離。 在方法!^1200(圖13A)之一實施例的—典型應用中’一邏 125582.doc -38 - 铱 車幻(例如,邏輯閘)經組態以執行該方法之各種任 務中的一者、 〜分禋任 0 、—者以上或甚至全部。任務中之一或多者 (可能為全部)亦可被實施為體現於電腦程式產品(例如,一 或多個資枓儲存媒體, 揮發性… 或其他非 如,一 η :、半導體記憶晶片,等等)_之程式碼(例 ’或多個指令集合)’該程式碼係由包括邏輯元件陣 列(例如處理器、微處理器、微控制器,或其他有限狀 態機)之機器(例如,電腦)可讀及/或可執行。方法Μ200(圖 實知例之任務亦可藉由一個以上該陣列或機器而 力執在此等或其他實施例中,任務可在用於無線通 信之設備(諸如,蜂巢式電話)或具有該通信能力之其他設 備内加以執行。該設備可經組態以與電路交換式網路及/ ㈣包交換式網路通信(例如’使用諸如νοΙΡ之一或多個 協疋)舉例❿&,該設備可包括經組態以接收經編喝訊 框之RF電路。 圖2 1A展示根據一通用組態之用於獲得經解碼語音信號 之訊框之裝置A100的方塊圖。舉例而言,裝置A100可經 組態以執行包括如本文中所述之方法M2〇〇之—實 施例的語音解碼方法。圖21B說明裝置Al〇〇之一典型應 用,該裝置經組態以基於(A)經編碼語音信號之第一經編 碼訊框及(B)緊跟在經編碼語音信號中之第一經編碼訊框 之後的訊框之消除之指示來計算經解碼語音信號之連續第 一訊框及第二訊框。裝置A100包括:經配置以接收消除之 指示的邏輯模組110 ;經組態以產生如以上所述之第一激 125582.doc -39· 1362031 勵信號、第二激勵信號及第三激勵信號的激勵信號產生器 120;及經組態以計算經解碼語音信號之第—訊框及第二 訊框的頻譜整形器130。 包括裝置趨0之通信設備(諸如,蜂巢式電話)可經組態 以自有線、㈣或光學傳輸通道接收包括經編碼語音信號 之傳輸。該設備可經組態以解調變載波信號及/或對傳輸 執行預處理操作(諸如,解交錯及/或解碼錯誤校正碼)以獲 得經編碼語音信號。該設備亦可包括裝置幻⑽及用於料 以或傳輸雙工交談之另-語音信號之裝置(例如,如在收 發器中)中之兩者的實施例。 邏輯模組110經組態且經配置以使激勵信號產生器12〇輸 出第二激勵信號。第:激勵信號係基於大於基線增益因數 值之第二增益因數。舉例而言,邏輯模組110與激勵信號 產生器m之組合可經組態以如以上所述來執行任務 T230。 邏輯模組11〇可經組態以根據若干條件而自兩個或兩個 以上選項之中選擇第二增益因數。此等條件包括:(a)最 近之經編碼訊框具有第一格式(例如,CELp格式);(b)先 於最近之經編碼訊框的經編碼訊框具有第二格式(例如, NELP格式);(C)當前經編碼訊框被消除;及(1))臨限值與 基線增益因數值之間的關係具有特定狀態(例如,臨限值 大於基線增益因數值)。圖22展示描述使用and閘14〇及選 擇器150之邏輯模組110之該實施例112之操作的邏輯示意 圖。若所有條件為真,則邏輯模組丨12選擇第二增益因 125582.doc •40- 1362031 - 數。否則,邏輯模組112選擇基線增益因數值。 圖23展示邏輯模組11 〇之另一實施例114之一操作的流程 圖。在此實例中,邏輯模組114經組態以執行如圖8所示之 任務N210、N22〇及N230。邏輯模組II4之一實施例亦可經 • 組態以執行如圖8所示之任務T110至T140中的一或多者(可 能為全部)。 圖24展示邏輯模組11 〇之包括狀態機之另一實施例u 6之 ^ 操作的描述。對於每一經編碼訊框而言,狀態機根據當前 經編碼訊框之格式或消除的指示來更新其狀態(其中狀態1 為初始狀態)。若狀態機在其接收到當前訊框被消除之指 示時處於狀態3,則邏輯模組116確定基線增益因數值是否 小於(或者,不大於)臨限值。視此比較之結果而定,邏輯 . 模、’且116在基線增益因數值或第二增益因數之中進行選 擇。 激勵信號產生器120可經組態以產生第二激勵信號作為 φ 子訊框激勵信號系列。邏輯模組110之一對應實施例可經 ’’且態以選擇或另外為每一子訊框激勵信號產生第二增益因 “ 數之一不同值,其中該等值中之至少一者大於基線增益因 數值。舉例而言,圖25展示邏輯模組116之經組態以執行 - 如圖8所示之任務T140、T230及T240的該實施例118之操作 的描述。 邏輯模組120可經配置以自包括於裝置八1〇〇内或在裝置 ^1〇0外。卩(例如’在包括裝置A100之設備(諸如,蜂巢式電 § )之/肖除偵測器2 1 0接收消除指示。消除偵測器2丨〇可 125582.doc •41 - 經組態以在偵、节丨 在偵測到下列條件中之任何 於訊框之消降扣_ · , 4 y 4 1夂I座生對 ⑺對於替、曰”訊框含有待恢復之過多位元錯誤; V)對於訊框而指示 框之所有位元比^ 無效或無支援的;(3)訊 八 白為零;(4)對於訊框而指示之位元速率為八 :之速率,且訊框之所有位元皆為-;(5)訊框為空白 的’且最後有效位元速率不為八分之—速率。 €輯模”且I 10之其他實施例可經組態以執行諸如由如以 上所述0㈣除恢復餘⑽所執行m肖除處理 之額外先、樣。舉例而言’邏輯模組i 1〇之該實施例可經组 態以執行諸如計算基線增益因數值及/或計算用於對第二 激勵信號進㈣波之頻譜參數值#合的任務。對於第一經 編碼訊框僅包括-適應性碼薄增益因數的應用而言,基線 增益因數值可僅僅為第—增益因數之值。對於第_經編碼 訊框包括若干適應性碼薄增益因數(例如,對於每一子訊 框之不同因數)的應用而言,基線增益因數值亦可基於其 他適應性碼簿增益因數中之一或多者。在該狀況下,例 如,邏輯模組110可經組態以將基線增益因數值計算為第 一經編碼訊框之適應性碼薄增益因數的平均值。 邏輯模組110之實施例可根據其使激勵信號產生器12〇輸 出第二激勵信號的方式而加以分類。邏輯模組i丨〇之一類 別110 A包括經組態以將第二增益因數提供至激勵信號產生 器120的實施例。圖26八展示裝置八1〇〇之包括邏輯模組11〇 之該實施例及激勵信號產生器120之對應實施例120A的實 施例A100A之方塊圖。 125582.doc •42· 1362031 邏輯模組110之另一類別11 OB包括經組態以使激勵信號 產生器110自兩個或兩個以上選項之中選擇第二增益因數 (例如’作為輸入)的實施例。圖26B展示裝置A100之包括 邏輯模組110之該實施例及激勵信號產生器12〇之對應實施 例120B的實施例A100B之方塊圖。在此狀況下,在圖22中 展示於邏輯模組112内的選擇器150代替地位於激勵信號產 生器120B内。明確地預期且特此揭示,邏輯模組之實 施例112、114、116、118中的任一者可根據類別110A或類 別110B而經組態且經配置。 圖26C展示裝置A100之一實施例A100C的方塊圖。裝置 A1 00C包括邏輯模組11 〇之類別11 〇B的實施例,其經配置 以使激勵信號產生器120自兩個或兩個以上激勵信號之中 選擇第二激勵信號。激勵信號產生器12〇c包括激勵信號產 生器120之兩個子實施例120C1、120C2 : —者經組態以產 生基於第二增益因數之激勵信號,且另一者經組態以產生 基於另一增益因數值(例如,基線增益因數值)之激勵信 號。激勵信號產生器120C經組態以藉由選擇基於第二增益 因數之激勵信號而根據自邏輯模組110B至選擇器150之控 制信號來產生第二激勵信號^應注意,激勵信號產生器 120之類別120C之一組態與類別120A或120B之對應實施例 相比可耗用較多的處理循環、功率及/或儲存量。 激勵信號產生器120經組態以產生基於第一增益因數及 第一值序列之第一激勵信號。舉例而言,激勵信號產生器 120可經組態以執行如以上所述之任務T210。第一值序列 125582.doc -43 - 1362031 係基於來自第三激勵信號之資訊,諸如,第三激勵信號之 區段。在一典型實例中’第一序列係基於第三激勵信號之 最後子訊框。 激勵信號產生器120之一典型實施例包括經組態以接收 及儲存第一序列之記憶體(例如,適應性碼薄)。圖27A展 示激勵彳§號產生器120之包括該記憶體160之實施例122的 方塊圖。或者,適應性碼薄之至少一部分可位於裝置A1〇〇 内或裝置A100外部之別處的記憶體中,使得第一序列之一 部分(可能為全部)經提供作為至激勵信號產生器之輸 入0 如圖27A所示,激勵信號產生器ι2〇可包括經組態以計算 當前增益因數與序列之乘積的乘法器17〇。第一增益因數 可基於來自第一經編碼訊框之資訊,諸如,增益碼薄索 引。在該狀況下’激勵信號產生器12〇可包括增益碼薄以 及經組態以擷取第一增益因數作為對應於此索引之值的邏 輯。激勵信號產生器120亦可經組態以接收指示第一序列 在適應性碼簿内之位置的適應性碼薄索引。 激勵信號產生器120可經組態以產生基於來自第一經編 碼訊框之額外資訊的第一激勵信號。該資訊可包括指定對 第一激勵信號之固定碼薄貢獻的—或多個固定碼簿索引及 對應增益因數值或碼薄索引。圖27B展示激勵信號產生器 122之實施例1 24的方塊圖,該實施例包括經組態以儲存 所產生激勵信號可基於之其他資訊的碼簿18〇(例如,固定 碼薄)、經組態以計算固定碼薄序列與固定碼薄增益因數 125582.doc • 44 - 之乘積的乘法Is 190,及經組態以將激勵信號計算為固定 碼薄貝獻與適應性碼薄貢獻之和的加法器195。激勵信號 產生器124亦可包括經組態以根據對應索引而自各別碼薄 擷取序列及增益因數的邏輯。 激勵信號產生器120亦經組態以產生基於第二增益因數 及第二值序列之第二激勵信號。第二增益因數大於第一增 益因數且可大於基線增益因數值。第二增益因數亦可等於 或甚至大於臨限值。對於激勵信號產生器12〇經組態以產 生第二激勵信號作為子訊框激勵信號系列的狀況而言,第 二增益因數之一不同值可用於每一子訊框激勵信號,其中 該等值中之至少一者大於基線增益因數值。在該狀況下, 可此需要使第二增益因數之不同值經配置以在訊框週期内 上升或下降。 第二值序列係基於來自第一激勵信號之資訊,諸如,第 一激勵信號之區段。在一典型實例中,第二序列係基於第 一激勵信號之最後子訊框。因此,激勵信號產生器12〇可 經組態以基於來自第一激勵信號之資訊來更新適應性碼 薄。對於裝置A100至支援鬆弛CELP(RCELP)編碼模式之 編碼系統的應用而言,激勵信號產生器12〇之該實施例可 經組態以根據音高滯後參數之對應值來使區段進行時間扭 曲。該扭曲操作之一實例描述於以上所引用之3GPP2文件 (:.80014-(^1.0之第5.2.2節(參看第4.11.5節)中。 激勵信號產生器120亦經組態以產生第三激勵信號。在 一些應用中,激勵信號產生器120經組態以產生基於來自 125582.doc -45- 適應性碼薄(例如,記憶體160)之資訊的第三激勵信號。 激勵信號產生器120可經組態以產生基於雜訊信號之激 勵信號(例如’回應於NELP格式之指示而產生的激勵信 號)。在該等狀況下,激勵信號產生器12〇可經組態以包括 經組態以執行任務T260之雜訊信號產生器。可能需要使雜 訊產生器使用基於來自對應經編碼訊框之其他資訊(諸 如,頻譜資訊)的種子值,因為該技術可用以支援用於編 碼器處之相同雜訊信號的產生。或者,激勵信號產生器 1 20可經組態以接收所產生雜訊信號。視特定應用而定, 激勵信號產生器120可經組態以產生基於所產生雜訊信號 之第二激勵信號(例如,以執行任務T270)或產生基於所產 生雜訊L號之第四激勵信號(例如,以執行任務T2 8 〇)。 激勵信號產生器120可經組態以根據訊框格式之指示來 產生基於來自適應性碼薄之序列的激勵信號或產生基於所 產生雜訊信號之激勵信號。在該狀況下,激勵信號產生器 1 20通吊經組態以在當前訊框被消除的情況下根據最後有 效訊框之編碼模式來繼續操作。 激勵信號產生器122通常經實施以更新適應性碼簿,使 得儲存於記憶體160中之序列係基於用於先前訊框之激勵 k號。如以上所述,適應性碼薄之更新可包括根據音高滞 後參數之值來執行時間扭曲操作。激勵信號產生器122可 經組態以在每一訊框處(或甚至在每一子訊框處)更新記憶 體160。或者,激勵信號產生器122可經實施以僅在使用基 於來自記憶體之資訊之激勵信號而解碼的訊框處更新記憶 125582.doc -46- 1362031 體160。舉例而言,激勵信號產生器ι22可經實施以基於來 自用於CELP訊框之激勵信號的資訊而不基於來自用於 NELP訊框之激勵信號的資訊來更新記憶體16〇。對於不更 新3己憶體160時之訊框週期而言,記憶體160之内容可保持 不變或可甚至經重設至初始狀態(例如,設定至零)。 頻譜整形器130經組態以基於第一激勵信號及來自經編 碼語音信號之第一經編碼訊框的資訊來計算經解碼語音信 號之第一訊框。舉例而言,頻譜整形器丨3〇可經組態以執 行任務T220。頻譜整形器13〇亦經組態以基於第二激勵信 號來計算經解碼語音信號之緊跟在第一訊框之後的第二訊 框。舉例而言,頻譜整形器u〇可經組態以執行任務 T240。頻譜整形器13〇亦經組態以基於第三激勵信號來計 算經解碼語音信號之先於第一訊框的第三訊框。舉例而 言,頻譜整形器130可經組態以執行任務丁25〇。視應用而 定,頻譜整形器130亦可經組態以基於第四激勵信號來計 异經解碼語音信號之第四訊框(例如,以執行任務τ2%)。 頻譜整形器130之一典型實施例包括根據用於訊框之頻 譜參數值集合(諸如,LPC系數值集合)而經組態的合成濾 波器。頻譜整形器丨30可經配置以自如本文中所述之語= 參數計算器及/或自邏輯模組i 1G(例如,在訊框消除之狀況 下)接收頻譜參數值集合。頻譜整形器13〇亦可經組態以根 據激勵信號之不同子訊框系列及/或不同頻譜參數:集合 系列來計算經解碼餘。頻譜整形器⑽亦可經組態^ 激勵信號、對經整形激勵信號及/或對頻譜參數值執行一 125582.doc -47- 1362031 或多個其他處理操作(諸如,其他濾波操作)。
包括於裝置_内或在裝置A1〇〇外部(例如,在 置編之設備(諸如’蜂巢式電話)内)之格式谓測二二 經配置以將第一經編碼訊框及其他經編碼訊框之訊: 的指示提供至邏輯模組㈣、激勵信號產生器⑶及頻譜^ 形器m中之一或多者。格式偵測器22〇可含有消 21〇’或可獨立地實施此等兩個元件。在一些應用中,、編 碼系統經組態以對於特定位元速率僅使用—編碼模式。對 於此等狀況而言’經編碼訊框之位元速率(如(例如)自諸如 訊框能量之-或多個參㈣確定)亦指示訊框格式。對於 在經編碼訊框之位元速率下使用—個以上編補式之編碼 系統而言,格式錢器22()可經組態以自編碼索引(諸如, 經編碼訊框内之識別編碼模式之一或多個位元的集合)確 定格式。在此狀況下,格式指示可基於編碼索引之確定。 在一些狀況下,編碼索引可明顯地指示編碼模式。在其他 狀況下,編碼索引可(例如)藉由指示對於另一編碼模式將 為無效之值來隱含地指示編碼模式。 裝置A100可經配置以自包括於裝置AMO内或在裝置 A100外部(例如,在包括裝置八1〇〇之設備(諸如,蜂巢式電 話)内)之語音參數計算器230接收經編碼訊框之語音參數 (例如,頻譜參數值、適應性及/或固定碼薄索引、增益因 數值及/或碼薄索引)。圖28展示語音參數計算器23〇之包括 剖析器3 1〇(亦被稱為"解封包化器”)、解量化器32〇及33〇以 及轉換器340之實施例232的方塊圖》剖析器31〇經組態以 125582.doc -48· 1362031 根據經編碼訊框之格式來剖析經編碼贿。舉例而十,叫 析器31〇可經組態以根據各種類型之資訊在訊框内:位: 位置來區別訊框中的各種類型之資訊(如由格式所指示)。 旦解量化器320經組態以解量化頻譜資訊。舉例而曰言不,解 量化器320通常經組態以將自經編碼訊框所剖析之;譜資 訊作為索引應用至-或多個碼薄以獲得頻譜參數值集合。 解置化器330經組態以解量化時間資訊。舉例而言,解量 化器330亦通常經組態以將自經編碼訊框所剖析之時間資 訊作為索引應用至一或多個碼薄以獲得時間參數值(例 如,增益因數值)。或者,激勵信號產生器120可經組態以 執行些或所有時間資訊(例如,適應性媽薄索引及/或固 疋碼薄索引)之解量化。如圖28所示,解量化器32〇及33() 中之一或兩者可經組態以根據特定訊框格式來解量化對應 訊框資訊,因為不同編碼模式可使用不同量化表或機制。 如以上所述’ LPC系數值在量化之前通常經轉換至另一 形式(例如’ LSP值、LSF值、ISP值及/或ISF值)。轉換器 340經組態以將經解量化頻譜資訊轉換至LPC系數值。對 於消除訊框而言,語音參數計算器23〇之輸出可視特定設 計選擇而為空值、未界定或不變。圖29A展示包括消除偵 測器2 1 0、格式偵測器220、語音參數計算器230及裝置 A1 〇〇之實施例的系統之一實例的方塊圖。圖29b展示包括 亦執行消除偵測之格式偵測器220之一實施例222的類似系 統之方塊圖。 裝置A10 0之一實施例之各種元件(例如,邏輯模組11 〇、 125582.doc -49- 激勵信號產生器丨20及頻譜整形器13〇)可體現於被視為適 合於所欲應用之硬體、軟體及/或韌體的任何組合中。舉 例而言,該等元件可經製造為常駐於(例如)同一晶片上或 一晶片集中之兩個或兩個以上晶片之中的電子設備及/或 光學設備。該設備之一實例為諸如電晶體或邏輯閘之固定 或可程式化邏輯元件陣列,且此等元件中之任一者可被實 施為-或多個該料列。此等元件中之任何兩者或兩者以 上或甚至全部可被實施於相同陣列内。該或該等陣列可被 實施於一或多個晶片内(例如,實施於一包括兩個或兩個 以上晶片之晶片集内)。 如本文中所述之裝置A 1〇〇之各種實施例的—或多個元件 (例如,邏輯模組110、激勵信號產生器12〇及頻譜整形器 130)亦可被全部或部分地實施為經配置以在一或多個固定 或可程式化邏輯元件陣列(諸如,微處理器、嵌入式處理 器、IP核心、數位信號處理器、Fp(JA(場可程式化閘陣 列)、ASSP(特殊應用標準產品)及ASIC(特殊應用積體電 路))上執行之一或多個指令集合。裝置A100之一實施例之 各種兀件中的任一者亦可被體現為一或多個電腦(例如, 包括經程式化以執行—或多個指令集合或指令序列之一或 夕個陣列的機器’亦被稱為"處理器"),且此等元件中之任 何兩者或兩者以上或甚至全部可被實施於相同的該或該等 電腦内。 裝置A 1 〇〇之一實施例之各種元件可包括於用於無線通信 之叹備(諸如’蜂巢式電話)或具有該通信能力之其他設備 125582.doc 1362031 内。該設備可經組態以與電路交換式網路及/或封包交換 式網路通信(例如,使用諸如ν〇ΙΡ之一或多個協定)。該設 備可經組態以對載運經編碼訊框之信號執行操作,諸如, 解父錯 '解穿刺、解碼一或多個回旋碼、解碼一或多個錯 誤校正碼、解碼一或多個網路協定(例如,以太網路、曰 TCP/IP、cdma2000)層、射頻(RF)解調變及/或耵接收。 有可能使裝置A1 00之一實施例之一或多個元件用以執行 任務或執行不直接與裝置之操作有關的其他指令集合,Z 如,與嵌入有裝置之設備或系統之另一操作有關的任務。 亦有可能使裝置八100之一實施例之一或多個元件具有共同 之結構(例如,用以在不同時間執行程式碼之對應於不同 元件之部分的處理器、經執行以在不同時間執行對應於不 同元件之任務的指令集合,或在不同時間對於不同元件執 行操作之電子設備及/或光學設備的配置)。在一此實例 中,邏輯模組110、激勵信號產生器12〇及頻譜整形器13〇 被實施為經配置以在同一處理器上執行之指令集合。在另 一此實例中,此等元件以及消除偵測器21〇、格式偵測器 220及語音參數計算器23〇中之一或多者(可能為全部)被實 施為經配置以在同一處理器上執行之指令集合。在另一實 例中,激勵信號產生器120C1及120C2被實施為在不同時 間執行之相同指令集合。在另一實例中,解量化器及 330被實施為在不同時間執行之相同指令集合。 用於無線通信之設備(諸如,蜂巢式電話)或具有該通信 能力之其他設備可經組態以包括裝置八1〇〇及語音編碼器中 125582.doc 1362031 之兩者的實施例。在該狀況下’有可能使裝置A1〇〇與語音 編碼器具有共同之結構。在一此實例中,裝置A100及語音 編碼器經實施以包括經配置以在同一處理器上執行之指令 集合。 提供所述組態之前述呈現以使熟習此項技術者能夠製造 或使用本文中所揭示之方法及其他結構。本文中所展示及 描述之流程圖、方塊圖、狀態圖及其他結構僅為實例且 此等結構之其他變體亦在本揭示案之範疇内。對此等組態 之各種修改係可能的,且本文中所呈現之通用原理亦可應 用於其他組態。舉例而言,儘管實例主要描述對在 訊框之後的消除訊框之應用,但明確地預期且特此揭示, 該等方法、裝置及系統亦可應用於消除訊框在根據使用基 於對過去激勵資訊之記憶的激勵信號之另一編碼模式(諸 如,PPP編碼模式或其他PWI編碼模式)而編碼之訊框之後 的狀況。因此,本揭示案並不意欲限於以上所示之特定實 例或組態,而是應符合與本文中以任何方式(包括在如所 提出之形成原始揭示之一部分的附加申請專利範圍中)所 揭示之原理及新穎特徵一致的最廣範_。 可與如本文中所述之語音解碼器及/或語音解碼方法一 起使用或適應於供本文中所述之語音解碼器及/或語音解 碼方法使用的編解碼器之實例包括:如文件3GPP2 C.S0014-C 版本 1·〇 之"Enhanced Variable Rate c〇da,
Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems"(第 5章,2〇〇7年丨月)中所述之增 125582.doc -52- 1362031 強型可變速率編解碼器(EVRC);如文件ETSI Ts ΐ26 ο% V6.0.0(第6章,“叫年丨2月)中所述之適應性多速率 語音編解碼器;及如文件^81 TS 126 ι92 v6.〇 〇(第6章, 2004年12月)中所述之AMR寬頻帶語音編解碼器。
熟習此項技術者將理解,可使用多種不同玉#及技術中 之任-者來表示資訊及信號。舉例而言,可藉由電壓、電 流、電磁波、磁場或磁性粒子、光場或光學粒子或其任何 組合來表示貫穿以上描述可提及之資料指令命:、資 訊 '信號、位元及符號。儘管導出經編碼訊框所來自之信 號及如所解碼之信號被稱為,,語音信號·,,但亦明確地預期 且特此揭示,此等信號可在活動訊框期間載運音樂或其他 非語音資訊内容。 熟習此項技術者將進一步瞭解,結合本文中所揭示之紐 態而描述的各種說明性邏輯區塊、模組、電路及操作可被 實施為電子硬體、電腦軟體或兩者之組合。可以通用處理 盗、數位錢處理n(DSP)、ASIC、FPm_m 邏輯設備 '離散閘或電晶體邏輯、離散硬 計以執行本文中所述之功能的任何組合來實施 ΓΓ:替模組、電路及操作。通用處理器可二 =替代例中,處理器可為任何習知之處理器、控制 微控制11或狀態機。處理器亦可被㈣為計算設備之 例:DSP與微處理器之組合'複數個微處理器之 其:能=個微處理器結合—咖核心之組合,或任何 125582.doc -53- 1362031 本文中所述之方法及演算法之任務可直接體現於硬體 中、體現於由處理器所執行之軟體模組中,或體現於兩者 之組合中。軟體模組可常駐於RAM記憶體、快閃記憶體、 ROM記憶體、EPROM記憶體、EEPRC)M記憶體、暫存器、 硬碟、抽取式磁碟、CD-R〇_此項技術中已知的任何且 他形式之㈣媒體中。說明性儲存媒體麵接至處理器,如 此,處理益可自儲存媒體讀取資訊及將資訊寫入至儲存媒 體。在替代例中,儲存媒體可與處理器成一體式。處理器 及儲存媒體可常駐於ASIC中。八训可常駐於使用者終端 機中在替代例中’處理器及儲存媒體可作為離散組件而 常駐於使用者終端機中。 本文令所述之組態中之卷——p .. ,㈣㈣☆ 〜中之母者可被至少部分地實施為硬 連線電路、實施為被盤造 襄k至特殊應用積體電路中之電路組 〜、’或實施為作為機器可嘈 Φ ^ 凟耘式馬而被載入至非揮發性儲 存器中之韌體程式或自資料 存媒體中之b 仔錄體載入或載入至資料儲 數位信號虚程式’該程式碼為由諸如微處理器或其他 。,理早7L之邏輯元件陣列可 存媒體可為儲在分A姑, 丁町子日7。貝科儲 限制地包括動態或It ,半導體記憶體(其可無 讀記憶體M/心二機存取記憶體)、R0M(唯 體、雙向記愔體取人 己隐體、磁電阻記憶 體,諸如,磁燹冗隐體,或磁碟媒 铂碟或光碟。術語"軟體"應 碼、組合語言媽、機器碼、二進位碼解為包括原始 碼、由邏輯元#酷 1韌體、巨碼、微 件陣料執行之 A夕個指令集合或指 I25582.doc •54- 1362031 令序列,及該等實例之任何組合β 【圖式簡單說明】 圖1為基於激勵合成濾波器之通用語音解碼器的方 圖。 圖2為表示有聲語音區段隨時間之振幅的圖示。 圖3為具有固定及適應性碼薄之CELp解碼器的方塊圖。 圖4說明解碼以CELP格式而編碼之訊框系列之過程中的 資料相依性。 圖5展示多模式可變速率語音解碼器之一實例的方塊 圖。 圖ό說明解碼NELP訊框(例如’靜默或無聲語音訊框)繼 之以CELP訊框之序列之過程中的資料相依性。 圖7說明處置在以CELP格式而編碼之訊框之後的訊框消 除之過程中的資料相依性。 圖8展示符合EVRC服務選項3之訊框消除方法的流程 圖。 圖9展示包括持續有聲區段之開始的時間訊框序列。 圖10a、圖l〇b、圖l〇c及圖i〇d分別展示根據本揭示案之 組態之方法Ml 10、Ml 20、Μ130及Ml 40的流程圖。 圖11展示方法Μ12 0之一實施例Μ1 8 0的流程圖。 圖12展示根據一組態之語音解碼器之一實例的方塊圖。 圖1 3 Α展示根據一通用組態之獲得經解碼語音信號之訊 框之方法M200的流程圖。 圖13B展示根據一通用組態之用於獲得經解碼語音信號 125582.doc -55- 之訊框之裝置F200的方塊圖。 圖14說明方法M200之一實施例之應用中的資料相依 性。 圖15A展示方法M200之一實施例方法M201的流程圖。 圖15B展示對應於圖15A之方法M201之裝置F201的方塊 圖。 圖16說明方法M201之典型應用中的一些資料相依性。 圖17說明方法M201之一實施例之應用中的資料相依 性。 圖18展示方法M200之一實施例方法M203的流程圖。 圖19說明圖18之方法M2 0 3之典型應用中的一些資料相 依性。 圖20說明圖18之方法M203之應用的一些資料相依性。 圖2 1A展示根據一通用組態之用於獲得經解碼語音信號 之訊框之裝置A100的方塊圖。 圖21B說明裝置A100之典型應用。 圖22展示描述邏輯模組11 〇之一實施例112之操作的邏輯 不意圖。 圖23展示邏輯模組110之一實施例114之操作的流程圖。 圖24展示邏輯模組110之另一實施例116之操作的描述。 圖25展示邏輯模組116之一實施例11 8之操作的描述。 圖26A展示裝置A100之一實施例A100A的方塊圖。 圖26B展示裝置A100之一實施例A100B的方塊圖。 圖26C展示裝置A100之一實施例A100C的方塊圖。 125582.doc •56· 1362031 圖27 A展示激勵信號產生器i 2〇之一實施例122的方塊 圖。 圖27B展示激勵信號產生器122之一實施例124的方塊 圖。 圖28展示語音參數計算器230之一實施例232的方塊圖。 圖29A展示包括消除偵測器210、格式偵測器220、語音 參數計算器230及裝置A1 00之實施例之系統之一實例的方 塊圖。 圖29B展示包括格式偵測器220之一實施例222之系統的 方塊圖。 【主要元件符號說明】 100 訊框消除恢復模組 110 邏輯模組 110A 邏輯模組 110Β 邏輯模組 112 邏輯模組 114 邏輯模組 116 邏輯模組 118 邏輯模組 120 激勵信號產生器 120Α 激勵信號產生器 120Β 激勵信號產生器 120C 激勵信號產生器 120C1 激勵信號產生器 125582.doc -57- 1362031
120C2 激勵信號產生器 122 激勵信號產生器 124 激勵信號產生器 130 頻譜整形器 140 AND閘 150 選擇器 160 記憶體 170 乘法器 180 瑪薄 190 乘法器 195 加法器 210 消除偵測器 220 格式偵測器 222 格式偵測器 230 語音參數計算器 232 語音參數計算器 310 剖析器 320 解量化器 330 解量化器 340 轉換器 A100 裝置 A100A 裝置 A100B 裝置 A100C 裝置 125582.doc -58 - 1362031
F200 裝置 F201 裝置 F210 構件 F220 構件 F230 構件 F240 構件 F245 構件 F250 構件 F252 構件 F260 構件 F270 構件 M110 方法 M120 方法 M130 方法 M140 方法 M180 方法 M200 方法 M201 方法 M203 方法 125582.doc -59-

Claims (1)

1362031 (μ年k月β日修正本 第096137743號專利申請案 中文申請專利範圍替換本(1〇〇年12月) 十、申請專利範園: 1. -種處理-經編碼語音信號之方法,該方法包括: 在先於一訊框的消除之該經編碼語音信號之兩個訊框 中偵測模式之至少一特定序列; 在°玄'肖除之前至少部分地基於該經編碼語音信號之該 訊框以獲得一增益值; 回應於該偵測,將經獲得該增益值與一臨限值比較; 回應於該比較之—結果,增加經獲㈣增益值;及 基於經增加該增益值,產生用於經消除該訊框之一激 勵信號* 2. 如請求们之方法,其中該偵測包括在先於該訊框的消 除之忒二,扁碼浯音信號之該兩個訊框中,偵測該序列(非 有聲訊框,有聲訊框)。 3. 如請求項1之方法,纟中該積測包括在先於該訊框的消 除之該經編碼語音信號之該兩個訊框中,偵測該序列(具
測所編竭之訊框)。 5.如請求項1之方法, ’其中該偵測包括在先於該 除之該經編碼語音信號之該兩個訊框十, 默描述符,有聲訊框)。 於3亥訊框的消 偵測該序列(靜 J25582-10012l6.doc 1362031 6. 如請求項⑴之任一項之方法,其_經獲得該增益值係 -適應性碼薄增益值,其為對於_除該純而預測。 7. 如請求項⑴之任一項之方法,其十該計算一用於經消 除該訊框之激勵信號包括將經増加該增益録以_序列 之值’其係基於先於該訊框的消除之該經編碼語音信號 之該訊框。 ° ; 8. 9. -種包括若干指令之電腦可讀媒體,當該等指令由一邏 輯元件之陣舰行時,造成轉时施—如請求項⑴ 之任一項的方法。 一種處理一經編碼語音信號之裝置,該裝置包括: 用於在先於一訊框的消除之該經編碼語音信號之兩個 訊框中偵測模式之至少一特定序列之構件; 用於在該消除之前至少部分地基於該經編碼語音信號 之該訊框以獲得一增益值之構件; 用於將經獲得該增益值與一臨限值比較之構件,其回 應於藉由該用於偵測之構件的模式之該至4、一 /、 . 乂 一特定序列 用於增加經獲得該增益值之構件, x 丹四應於藉由矽用 於比較之構件的該比較之一結果;及 用於計算-用於經消除該訊框之激勵信號之史 基於經增加該增益值。 /、 1〇.如請求項9之裝置’其中該用於谓測之構件係經組離以 在先於該訊框的消除之該經編碼語音信號 〜 中,摘測該序列(非有聲訊框,有聲訊框&個訊框 J25582-I001216.doc -2 - 1362031 11. 如請求項9之裝置,其中該 乡土 # _ 構件係經組態以 在先於該訊框的消除之該經編碼 . 日1〇琥之該兩個訊框 偵測该序列(具有一非週期激勵 π双撕又訊框,具有一適 性與週期激勵之訊框)。 ”有週應 12. 如請求項9之裝置,其中該 各山 1貝而之構件係經組態以 ^先於該訊框㈣除之該經編碼語音錢之該兩個訊框 Μ貞測該序列(使用雜訊激勵線性預測所編碼之訊框, 使用碼激勵線性預測所編碼之訊框)。 13. 如請求項9之裝置,1中嗜用 ° ;谓測之構件係經組態以 在先於該訊框的消除之該經編 匈崎。°日偽號之該兩個訊框 中,制該序列(靜默描述符,有聲訊框)。 14. 如請求項9至13之任一項之奘番 廿山 項之裒置,其辛經獲得該增益值 係一適應性碼薄增益值,i Λ ,、馬對於經消除該訊框而預 測。 15_如請求項9至13之任-項之裝置,其中該用於計算一用 於經消除該訊框之激勵信號之構件係經組態以將經增加 3亥增益值乘以一序列之值,甘私.# J 其係基於先於該訊框的消除 之该經編碼語音信號之該訊框。 125582-1001216.doc 1362031 第096137743號專利申請案 - . 中文圖式替換頁(100年5月) 月^修正替換頁
(sm) 5 S (#本) i25582-fig-1000520.doc
TW096137743A 2006-10-06 2007-10-08 Methods, apparatus and computer program product for obtaining frames of a decoded speech signal TWI362031B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US82841406P 2006-10-06 2006-10-06
US11/868,351 US7877253B2 (en) 2006-10-06 2007-10-05 Systems, methods, and apparatus for frame erasure recovery

Publications (2)

Publication Number Publication Date
TW200832356A TW200832356A (en) 2008-08-01
TWI362031B true TWI362031B (en) 2012-04-11

Family

ID=39052629

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096137743A TWI362031B (en) 2006-10-06 2007-10-08 Methods, apparatus and computer program product for obtaining frames of a decoded speech signal

Country Status (11)

Country Link
US (2) US7877253B2 (zh)
EP (2) EP2423916B1 (zh)
JP (1) JP5265553B2 (zh)
KR (1) KR101092267B1 (zh)
CN (1) CN101523484B (zh)
AT (1) ATE548726T1 (zh)
BR (1) BRPI0717495B1 (zh)
CA (1) CA2663385C (zh)
RU (1) RU2419167C2 (zh)
TW (1) TWI362031B (zh)
WO (1) WO2008043095A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
US7877253B2 (en) * 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
WO2008103087A1 (en) * 2007-02-21 2008-08-28 Telefonaktiebolaget L M Ericsson (Publ) Double talk detector
ES2391360T3 (es) * 2007-09-21 2012-11-23 France Telecom Ocultación de error de transmisión en una señal digital con distribución de la complejidad
TWI350653B (en) * 2007-10-19 2011-10-11 Realtek Semiconductor Corp Automatic gain control device and method
CN101437009B (zh) * 2007-11-15 2011-02-02 华为技术有限公司 丢包隐藏的方法及其系统
KR100998396B1 (ko) * 2008-03-20 2010-12-03 광주과학기술원 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
US8706479B2 (en) * 2008-11-14 2014-04-22 Broadcom Corporation Packet loss concealment for sub-band codecs
US8238861B2 (en) * 2009-01-26 2012-08-07 Qualcomm Incorporated Automatic gain control in a wireless communication network
US8838819B2 (en) * 2009-04-17 2014-09-16 Empirix Inc. Method for embedding meta-commands in normal network packets
US8924207B2 (en) * 2009-07-23 2014-12-30 Texas Instruments Incorporated Method and apparatus for transcoding audio data
US8321216B2 (en) * 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
MX2013009345A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio.
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
PL2661745T3 (pl) * 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
MX2013009346A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral.
NO2669468T3 (zh) * 2011-05-11 2018-06-02
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
JP5805601B2 (ja) * 2011-09-30 2015-11-04 京セラ株式会社 装置、方法、及びプログラム
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9208775B2 (en) * 2013-02-21 2015-12-08 Qualcomm Incorporated Systems and methods for determining pitch pulse period signal boundaries
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
EP2976768A4 (en) * 2013-03-20 2016-11-09 Nokia Technologies Oy AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
ES2635027T3 (es) 2013-06-21 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para el desvanecimiento de señales mejorado para sistemas de codificación de audio cambiados durante el ocultamiento de errores
CN107818789B (zh) * 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US10157620B2 (en) * 2014-03-04 2018-12-18 Interactive Intelligence Group, Inc. System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation
KR20160145711A (ko) * 2014-04-17 2016-12-20 아우디맥스, 엘엘씨 정보 손실을 감소시킨 전자 통신들을 위한 시스템들, 방법들 및 디바이스들
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3194481B2 (ja) * 1991-10-22 2001-07-30 日本電信電話株式会社 音声符号化法
BR9206143A (pt) 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
SE501340C2 (sv) * 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
JP3199142B2 (ja) * 1993-09-22 2001-08-13 日本電信電話株式会社 音声の励振信号符号化方法および装置
US5502713A (en) 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
CN1100396C (zh) * 1995-05-22 2003-01-29 Ntt移动通信网株式会社 语音解码器
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
JP3095340B2 (ja) * 1995-10-04 2000-10-03 松下電器産業株式会社 音声復号化装置
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
US6014622A (en) 1996-09-26 2000-01-11 Rockwell Semiconductor Systems, Inc. Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
US6810377B1 (en) 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
DE60233283D1 (de) 2001-02-27 2009-09-24 Texas Instruments Inc Verschleierungsverfahren bei Verlust von Sprachrahmen und Dekoder dafer
JP3628268B2 (ja) * 2001-03-13 2005-03-09 日本電信電話株式会社 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
EP1425562B1 (en) * 2001-08-17 2007-01-10 Broadcom Corporation Improved bit error concealment methods for speech coding
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7379865B2 (en) * 2001-10-26 2008-05-27 At&T Corp. System and methods for concealing errors in data transmission
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
WO2005117366A1 (ja) * 2004-05-26 2005-12-08 Nippon Telegraph And Telephone Corporation 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
JP3936370B2 (ja) * 2005-05-09 2007-06-27 富士通株式会社 音声復号化装置及びその方法
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8165224B2 (en) * 2007-03-22 2012-04-24 Research In Motion Limited Device and method for improved lost frame concealment

Also Published As

Publication number Publication date
US20080086302A1 (en) 2008-04-10
TW200832356A (en) 2008-08-01
BRPI0717495B1 (pt) 2019-12-10
CA2663385A1 (en) 2008-04-10
JP2010506221A (ja) 2010-02-25
RU2009117181A (ru) 2010-11-20
EP2423916A3 (en) 2012-05-16
EP2070082B1 (en) 2012-03-07
WO2008043095A1 (en) 2008-04-10
RU2419167C2 (ru) 2011-05-20
BRPI0717495A2 (pt) 2014-04-22
EP2423916B1 (en) 2013-09-04
JP5265553B2 (ja) 2013-08-14
US20110082693A1 (en) 2011-04-07
ATE548726T1 (de) 2012-03-15
EP2423916A2 (en) 2012-02-29
EP2070082A1 (en) 2009-06-17
CN101523484B (zh) 2012-01-25
KR20090082383A (ko) 2009-07-30
US7877253B2 (en) 2011-01-25
CA2663385C (en) 2013-07-02
CN101523484A (zh) 2009-09-02
US8825477B2 (en) 2014-09-02
KR101092267B1 (ko) 2011-12-13

Similar Documents

Publication Publication Date Title
TWI362031B (en) Methods, apparatus and computer program product for obtaining frames of a decoded speech signal
US10885926B2 (en) Classification between time-domain coding and frequency domain coding for high bit rates
US10249313B2 (en) Adaptive bandwidth extension and apparatus for the same
JP5571235B2 (ja) ピッチ調整コーディング及び非ピッチ調整コーディングを使用する信号符号化
JP4166673B2 (ja) 相互使用可能なボコーダ
KR102007972B1 (ko) 스피치 처리를 위한 무성음/유성음 결정
KR20070118170A (ko) 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
KR101891388B1 (ko) 선형 예측 코딩에서 적응적 포먼트 선명화를 위한 시스템들, 방법들, 장치들, 및 컴퓨터 판독가능 매체들
CA2659197A1 (en) Time-warping frames of wideband vocoder
US9418671B2 (en) Adaptive high-pass post-filter
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
KR20230129581A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
Bhaskar et al. Low bit-rate voice compression based on frequency domain interpolative techniques

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees