TW201032219A - Coding scheme selection for low-bit-rate applications - Google Patents

Coding scheme selection for low-bit-rate applications Download PDF

Info

Publication number
TW201032219A
TW201032219A TW98137040A TW98137040A TW201032219A TW 201032219 A TW201032219 A TW 201032219A TW 98137040 A TW98137040 A TW 98137040A TW 98137040 A TW98137040 A TW 98137040A TW 201032219 A TW201032219 A TW 201032219A
Authority
TW
Taiwan
Prior art keywords
frame
pitch
task
pulse
value
Prior art date
Application number
TW98137040A
Other languages
English (en)
Inventor
Alok Kumar Gupta
Ananthapadmanabhan A Kandhadai
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US12/261,518 external-priority patent/US20090319263A1/en
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201032219A publication Critical patent/TW201032219A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/097Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

201032219 六、發明說明: 【發明所屬之技術領域】 本發明係關於語音信號之處理。
本專利申請案為2008年10月30曰申請的申請中且已讓與 給受讓人的名為「用於低位元率應用之轉換語音訊框的編 碼(CODING OF TRANSITIONAL SPEECH FRAMES FOR LOW-BIT-RATE APPLICATIONS)」之專利申請案第 12/261,815號(代理人檔案號碼071323)的部分接續申請案, 該專利申請案為2008年6月20日申請之名為「用於低位元率 應用之轉換語音訊框的編碼(CODING OF TRANSITIONAL SPEECH FRAMES FOR LOW-BIT-RATE APPLICATIONS)」之 專利申請案第12/143,719號(代理人檔案號碼071321)的部 分接續申請案。 【先前技術】 藉由數位技術來傳輸音訊信號(諸如,話音及音樂)尤其 在長途電話、諸如網路電話(亦稱為VoIP,其中IP表示網 際網路協定)之封包交換式電話及諸如蜂巢式電話之數位 無線電電話中已變得普遍。此激增已產生對減小用以經由 傳輸頻道傳送話音通信之資訊量同時維持經重建之語音之 感知品質的興趣。舉例而言,需要最佳地利用可用無線系 統頻寬。有效率地使用系統頻寬之一種方式為使用信號壓 縮技術。對於載運語音信號之無線系統而言,出於此目的 通常使用語音壓縮(或「語音編碼」)技術。 經組態以藉由提取與人類語音產生模型有關之參數來壓 144316.doc 201032219 縮语音的器件通常稱為聲碼器'「音訊編碼器」或「語音 編碼器」。(本文中互換地使用此三個術語。)語音編碼器通 常包括一編碼器及一解碼器。編碼器通常將傳入之語音信 號(表示音訊資訊之數位信號)劃分成稱為「訊框」之時間 區段,分析每一訊框以提取特定相關參數,且將該等參數 量化成經編碼之訊框。經編碼之訊框經由傳輸頻道(亦 即,有線或無線網路連接)傳輸至包括解碼器之接收器。 解碼器接收並處理經編碼之訊框、將其解量化以產生參 數,且使用經解量化之參數來重新建立語音訊框。 在典型通6舌中,每一說話者在約百分之六十的時間内靜 寂。語音編碼器通常經組態以區別語音信號之含有語音之 訊框(「有作用訊框」)與語音信號之僅含有靜默或背景雜 訊之訊框(「無作用訊框」)。此類編碼器可經組態以使用 不同編碼模式及/或速率來編碼有作用與無作用訊框。舉 例而言,語音編碼器通常經組態以與編碼有作用訊框相比 使用較少位元來編碼無作用訊框。語音編碼器可將較低位 元率用於無作用訊框以支援在少冑或甚i無感知到之品質 損失的情況下以較低平均位元率傳送語音信號。 用以編碼有作用訊框之位元率之實例包括每訊框i7i個 位元、每訊框80個位元及每訊框4〇個位元。用以編碼無作 用訊框之位元率之實例包括每訊框16個位元。在蜂巢式電 話系統(尤其依照如由電信工業協會(Arlingt〇n, VA)發布之 臨時標準(IS)-95或類似工業標準的系統)之情形下,此四 個位元率亦分別稱作「全速率」、「半速率」、「四分之一速 144316.doc 201032219 率」及「八分之一速率」。 【發明内容】
根據一組態之一種編碼一語音信號訊框之方法包括計算 該訊框之一殘差之一峰值能量及計算該殘差之一平均能 量。此方法包括基於該所計算之峰值能量與該所計算之平 均能量之間的一關係自一雜訊激勵編碼方案及⑺)一無 差別音調原型編碼方案之集合選擇一編碼方案,及根據該 選定之編碼方案編碼該訊框。在此方法中,根據該無差別 音調原型編碼方案編碼該訊框包括產生一包括該訊框之一 音調脈波之一時域形狀、該訊框之一音調脈波之一位置及 該訊框之一所估計之音調週期的表示的經編碼之訊框。 根據另一組態之一種編碼一語音信號訊框之方法包括估 計該訊框之一音調週期及計算(A) 一基於該所估計之音調 週期之第一值與(B) —基於該訊框之另一參數之第二值之 間的-關係之-值。此方法包括基於該所計算之值自⑷ 一雜訊激勵編碼方案及(B) 一無差別音調原型編碼方案之 集合選擇-料方案,及根據該敎之編碼方案編碼該訊 框。在此方法中,根據該以別音調原型編碼方案編碼該 訊框包括產生-包括該訊框之—音調脈波之—時域形狀、 該訊框之—音調脈波之—位置及該所估計之音㈣期Μ 示的經編碼之訊框。 本文中亦明確預期到並揭示經組態以執行此等方法之 置及其他構件以及具有在由處理器執行時使該處理器執行 此等方法之元素的指令之電腦可讀媒體。 144316.doc -5- 201032219 【實施方式】 如本文中所描述之系統、方法及裝置(例如,方法 M100、M200、M300、M400、M500、M550、M560、 M600、M650、M700、M800、M900及 / 或 M950)可用以支 援處於低恆定位元率或處於低最大位元率(諸如,每秒二 千位元)的語音編碼。此受約束位元率語音編碼之應用包 括經由衛星鏈路之話音電話之傳輸(亦稱為「衛星上話 音」)’其可用以支援缺少蜂巢式或有線電話之通信基礎 系構的偏遠地區的電話服務。衛星電話亦可用以支援用於 諸如車隊之行動接收器的連續廣域涵蓋,從而實現諸如即 按即說的服務。更一般而言,此受約束位元率語音編碼之 應用並不限於涉及衛星之應用,且可延伸至任何功率受限 頻道。 除非上下文明確地限制,否則術語「信號」在本文中用 以指示其普通意義中之任一者,包括如在導線、匯流排或 其他傳輸媒體上表達之記憶體位置(或記憶體位置之集合) 的狀態。除非受其上下文明確地限制,否則術語「產生」 在本文中用以指示其普通意義中之任一者,諸如,計算或 以其他方式生成。除非上下文明確地限制,否則術語「計 算」在本文中用以指示其普通意義中之任一者,諸如,計 算 '評估、產生及/或自一組值進行選擇。除非上下文明 確地限制,否則術語「獲得」用以指示其普通意義中之任 者諸如计算、導出、接收(例如,自外部器件)及/或棟 取(例如,自儲存元件之陣列p除非上下文明確地限制, 144316.doc 201032219 否則術語「估計」用以指示其普通意義中之任一者,諸 如,汁算及/或評估。在本說明書及申請專利範圍中使用 術語「包含」或「包括」時,其並不排除其他元件或操 作。術語「基於」(如在r A係基於B」中)用以指示其普通 意義中之任一者,其包括以下狀況:⑴「至少基於」(例 如 A係至少基於B」)及(在特定情形下適當時)(丨丨)「等 於」(例如’「A等於B」)。以引用方式對文獻之一部分之 任何併入亦應理解為併入在該部分内引用之術語或變數之 疋義,其中此等定義顯現於該文獻之其他地方。 除非另外指示’ Μ具有特定特徵之語音編碼器之任何 揭示内容亦明確地意欲揭示具有類似特徵之語音編碼方法 ^ 亦…:)且根據特定組態之語音編碼器之任何揭示 内今亦明確地意欲揭示根據類似組態之語音編碼方法(且 ❹ 反=«) 〇除非另外指示,否則用於對語音信號之訊框 執灯操作之裝置的任何揭示内容亦明杨意欲揭示用於對 語音信號之訊框執行操作的對應方法(且反之亦然小除非 =外心不’否則具有特定特徵之語音解碼器之任何揭示内 谷亦明確地意欲揭示具有類似特徵之語音解碼方法(且反 之亦然)’且根據特定㈣之語音解碼器之任何揭示内容 亦明確地意欲揭示根據類似組態之語音解碼方法(且反之 亦然)°可互換地使用術語「編碼器」、「編解碼器」及 二!:系統」以表示-系統’該系統包括經組態以接收語 之訊框(可能在諸如感知加權及/或其他濾、波操作之 或多個預處理操作之後)的至少一編碼器及一經組態以 144316.doc 201032219 產生訊框之經解碼之表示的對應解碼器。 出於語音編碼目的’語音信號通常經數位化(或量化)以 獲得樣本流。可根據此項技術中已知之各種方法中之任一 者(包括(例如)脈碼調變(PCM)、壓擴μ律PCM及壓擴a律 PCM)執行數位化程序。窄頻語音編碼器通常使用8 kHz之 取樣率,而寬頻語音編碼器通常使用較高取樣率(例如, 12 或 16 kHz)。 語音編碼器經組態以將經數位化之語音信號處理為一系 列訊框。雖然處理訊框或訊框之區段(亦稱為子訊框)的操 作亦可包括其輸入中之一或多個相鄰訊框的區段,但此系 列通常實施為非重疊系列。語音信號之訊框通常足夠短以 致可預期信號之頻譜波封在整個訊框期間保持相對固定。 訊框通常對應於5與35毫秒之間的語音信號(或約4〇至2〇〇 個樣本),其中1〇、20及30毫秒為常用訊框大小。經編碼 之忙之實際大小可隨編碼位元率而在訊框間改變。 2〇毫秒之訊框長度在7千赫兹(kHz)之取樣率下對應於 140個樣本,在8 kHz之取樣率下對應於16〇個樣本,且在 16 kHZ之取樣率下對應於320個樣本,但可使用被視為適 於特定應用之任何取樣率。可用於語音編碼之取樣率的另 一實例為12.8 kHz,且其他實例包括在12 8跑至38 4他 之範圍内的其他速率。 通常,所有訊框具有相同長度,且在本文中描述之特定 實例中假&均勾訊框長度。然而’亦明確預期到且藉此揭 示可使用非均句的訊框長度。舉例而t,本文中所描述之 144316.doc 201032219 各種裝置及方法的實施方案亦可用於將不同訊框長度用於 有作用訊框及無作用訊框及/或用於有聲訊框及無聲訊框 的應用中。 如上所注明,可能需要組態一語音編碼器以使用不同編 ' 碼模式及/或速率來編碼有作用訊框及無作用訊框。為了 ' 區分有作用訊框與無作用訊框,語音編碼器通常包括一語 s活動性偵測器(通常稱為話音活動性偵測器或vad),或 _ 以其他方式執行偵測語音活動性的方法。此類偵測器或方 法可經組態以基於一或多個因子(諸如,訊框能量、信雜 比週期性及零交越率)將訊框分類為有作用或無作用 的。此分類可包括:將此類因子之值或量值與臨限值比 較’及/或將此類因子之改變之量值與臨限值比較。 偵測語音活動性之語音活動性偵測器或方法亦可經組態 以將有作用訊框分類為兩個或兩個以上不同類型中之一 者,諸如,有聲(例如,表示母音聲)、無聲(例如,表示摩 φ 擦音聲)或轉換(例如,表示字之開始或結束)。此分類可基 於諸如以下各者之因子:語音及/或殘差之自相關零交 越率、第一反射係數及/或如(例如,關於編碼方案選擇器 C200及/或訊框重新分類器RC 1〇)在本文中更詳細描述的其 他特徵。對於語音編碼器而言,可能需要使用不同編碼模 式及/或位元率來編碼不同類型的有作用訊框。 有聲語音之訊框傾向於具有長期的(亦即,持續一個以 上訊框週期)且關於音調的週期性結構。使用一編碼此長 期頻譜特徵之描述的編碼模式來編碼有聲訊框(或有聲訊 1443l6.doc 201032219 框之序列)通常為較有效率的。此等編碼模式之實例包括 碼激勵線性預測(CELP)及諸如原型波形内插(pwi)的波形 内插技術。PWI編碼模式之一實例稱為原型音調週期 (PPP)m無聲訊框及無作用訊框通常缺少任何 顯者長期頻谱特徵,且語音編碼器可經組態以使用不試圖 描述此類特徵之編瑪模式來編碼此等訊框。雜訊激勵線性 預測(NELP)為此類編碼模式之一實例。 曰編碼H或*音編碼方法可經組態以在位元率及編碼 模式(亦稱為「編碼方案」)之*同組合_作出選擇。舉例 而言’語音編碼器可經組態以將全速率CELP方案用於含 有有聲語音之職及轉換訊框,將半速率祖P方案用於 含有無聲語音之訊框m之-速率祖P方案用於 …'作用讯框。此類語音編碼器之其他實例支援一或多個編 碼方案之多個編碼速率,諸如,全速率CELp方案及半速 率CELP方案及/或全速率PPP方案及四分之一速率PPP方 案。 如由Θ編碼器或語音編碼方法產生之經編碼之訊框通 常含有可藉以重建語音信號之對應訊框的值。舉例而言, 經編碼之訊框可包括訊框内之能量在頻譜上之分布的描 述。此類能量分布亦稱為訊框之「頻率波封」或「頻譜波 封」。經編碼之訊框通常包括描述訊框之頻譜波封的有序 值序列。在一些狀況下,有序序列之每一值指示在對應頻 率處或在對應頻譜區域上之信號振幅或量值。此類描述之 一實例為有序傅立葉(Fourier)變換係數序列。 144316.doc 201032219 在其他狀況下,有序序列包括編碼模型之參數值。此類 有序序列之一典型實例為線性預測編碼(LPC)分析之係數 值集合。此等LPC係數值編碼經編碼之語音之共振(亦被稱 為「共振峰」)’且可組態為濾波器係數或反射係數。多 數現代s吾音編碼器之編碼部分包括提取每一訊框之Lpc係 • 數值集合的分析濾波器。集合(其通常配置為一或多個向 量)中之係數值之數目亦稱為Lpc分析之「階數」。如由通 φ 彳5器件(諸如,蜂巢式電話)之語音編碼器執行的LPC分析 之典型階數之實例包括4、6、8、10、12、16、20、24、 28及 32。 語音編碼器通常組態成以經量化形式跨越傳輸頻道傳輸 頻譜波封的描述(例如,作為至對應查找表或「碼薄」中 的一或多個索引)。因此,對於語音編碼器而言,可能需 要以可經有效率地量化之形式計算LPc係數值之集合,諸 如線頻譜對(LSP)、線頻譜頻率(LSF)、導抗頻譜對(Isp)、 • 導抗頻譜頻率(ISF)、倒頻譜係數或對數面積比之值的集 合。語音編碼器亦可經組態以在轉換及/或量化之前對有 序值序列執行其他操作(諸如,感知加權)。 在一些狀況下,訊框之頻譜波封的描述亦包括訊框之時 間資訊的描述(例如,如在傅立葉變換係數之有序序列 中)。在其他狀況下,經編碼之訊框之語音參數集合亦可 包括訊框之時間資訊的描述。時間資訊之描述的形式可取 決於用以編碼訊框之特定編碼模式。對於一些編碼模式而 言(例如,對於CELP編碼模式而言),時間資訊之描述包括 144316.doc 201032219 LPC分析之殘差的描述(亦稱為激勵信號的描述)^對應語 音解碼器使用激勵信號來激勵LPC模型(例如,如由頻譜波 封之描述所疋義)。激勵信號之描述通常以經量化形式(例 如作為至對應碼薄中之一或多個索引)顯現於經編碼之 訊框中。 時間資訊之描述亦可包括與激勵信號之音調分量有關的 資λ對於ρρρ編碼模式而言,例如,經編碼之時間資訊 可包括待由語音解碼器使用以再生激勵信號之音調分量之 原型的描述。與音調分量有關之資訊的描述通常以經量化 形式(例如,作為至對應碼薄中的一或多個索引)顯現於經 編碼之訊框中。對於其他編碼模式而言(例如,對於NELP 編碼模式而言),時間資訊之描述可包括訊框之時間波封 (亦稱為訊框之「能量波封」或「增益波封」)的描述。
圖i展示有聲語音區段(諸如,母音)之隨時間而變之振 幅的一實例。對於有聲訊框而言,激勵信號通常類似在音 調頻率下的週期性之一系列脈波,而對於無聲訊框而言, 激勵信號通常類似於白高斯(Gaussian)雜訊。CELP或PWI 編碼器可㈣為有聲語音區段之特性的較高度週期性以達 成較好編碼效率。圖2A展示隨時間而變的自背景雜訊轉換 至有聲語音之語音區段的振幅之實例,且圖2B展示隨時間 而變的自背景雜訊轉換至有聲語音之語音區段之LPC殘差 的振幅之實例。因為LPC殘差之編瑪占用大量經編碼之信 號流’所以已開發各種方案以減小編碼殘差所需要之位元 率。此等方案包括:CELP、NELP、PWI及ppp。 144316.doc -12· 201032219 可能需要以提供長途語音品質之經解碼之信號的方式以 低位元率(例如’每秒2千位元)執行語音信號的受約束位元 率編碼。長途語音品質之特徵通常在於具有約2〇〇至32〇〇 Hz之頻寬及大於3〇 dB之信雜比(SNR)。在一些狀況下,長 途浯音品質之特徵亦在於具有小於2%或3%之諧波失真。 . 不幸地,以接近每秒2千位元之位元率編碼語音的現有技 術通常產生聽起來為人工(例如,機器人)、吵雜及/或過度 諧波(例如,嗡嗡聲)的合成語音。 諸如靜寂及無聲訊框的非有聲訊框之高品質編碼可通常 使用雜訊激勵線性預測(N E L P)編碼模式以低位元率來執 行。然而,可能較難以以低位元率執行有聲訊框的高品質 編碼。已藉由將較高位元率用於諸如包括自無聲語音至有 聲語音之轉換的訊框(亦稱為開始訊框或向上轉換訊框)之 困難訊框且將較低位元率用於後續有聲訊框以達成低平均 位元率而獲得良好結果。然而對於受約束位元率聲碼器而 〇 言,將較高位元率用於困難訊框的選項可能為不可用的。 諸如增強型可變速率編解碼器(EVRC)2現有可變速率 _碼Hit常使用諸如CELP之波形編碼模式以較高位元率 編碼此等困難訊框。可用於以低位元率儲存或傳輸有聲語 纟區段的其他編碼方案包括諸如PPP編碼方案的剛編碼 方案。此等PWI編碼方案在殘差信號中週期性地定位具有 -個音調週期之長度的原型波形。在解碼器處,該殘差信 號被内插在原型之間的音調週期上以獲得原始高度週期性 殘差信號的近似,編碼之一些應用使用混合位元率, 144316.doc -13- 201032219 以使得高位元率編碼之訊框為一或多個後續低位元率編碼 之訊框提供參考。在此狀況下,低位元率訊框中之資訊的 至少一些可被有差別地編碼。 可能需要以無差別方式來編碼轉換訊框(諸如,開始訊 框),該無差別方式為序列中之後續訊框的有差別PWI(例 如,PPP)編碼提供良好原型(亦即,良好音調脈波形狀參 考)及/或音調脈波相位參考。 可能需要在位元率受約束的編碼系統中提供用於開始訊 框及/或其他轉換訊框的編碼模式。舉例而言,可能需要 在受約束而具有低恆定位元率或低最大位元率的編碼系統 中提供此類編碼帛式。A類編碼系统之應用的典型實例為 衛星通信鍵路(例如,如本文巾參看圖14所描述 如上所論述,語音信號之訊框可分類為有聲、無聲或靜 寂有聲。fl框通常為高度週期性的,而無聲及靜寂訊框通 常為非週期性f其他可能訊框分類包括開始訊框、瞬變 向下瞬變訊框。(亦稱為向上瞬變訊框之)開始訊框 U、現於字之開始處。如在圖2B中之彻與600樣本之間 :區二中,開始訊框在訊框開始時可為非週期性的(例 睡㈣聲I且在訊框結束時變為週期性的(例如,有聲)。 變訊框顯現週期性之語音之訊框。瞬 =曰調之改變及/或減小的週期性,且通常在有 之:I 、结束處(例如,在語音信號之音調正改變 之處)出現。典刑闩 又雙 子之結束處出,見。開始訊框、瞬:聲…在 呷雯:框及向下瞬變訊框亦 144316.doc 201032219 可稱為「轉換」訊框。 對於語音編碼器而言,可能需要以無差別方式編碼脈波 之位置、振幅及形狀。舉例而言,可能需要編碼開始訊框 或一系列有聲訊框中之第一訊框,以使得經編碼之訊框為 . 後續經編碼之訊框之激勵信號提供良好參考原型。此類編 、 碼器可經組態以:定位訊框之最終音調脈波,定位相鄰於 最終音調脈波之音調脈波,根據該等音調脈波之峰值之間 Φ 的距離估計滯後值,且產生一指示最終音調脈波之位置及 所估計之滯後值的經編碼之訊框。此資訊在解碼已在無相 位貧訊之情況下編碼之後續訊框_可用作相位參考。編碼 器亦可經組態以產生包括音調脈波之形狀之指示的經編碼 之讯框,其在解碼已被有差別地編碼(例如,使用編 碼方案)之後續訊框中可用作參考。 在編碼轉換訊框(例如,開始訊框)中,向後續訊框提供 良好參考可能比達成訊框之準確再生重要。此類經編碼之 • 訊框可用以向使用ppp或其他編碼方案編碼之後續有聲訊 框提供良好參考。舉例而言,對於經編碼之訊框而言,可 能需要包括音調脈波之形狀之描述(例如,以提供良好形 狀參考)、音調滯後之指示(例如,以提供良好滯後參考)及 訊框之最終音調脈波之位置的指示(例如,以提供良好相 位參考),同時開始訊框之其他特徵可使用較少位元來編 碼或甚至被忽略。 圖3 A展不根據一组賤之·ί£_ ΛΛ -κ 4 I 曰編碼方法Μ100的流程圖, 5曰編碼方法M1〇〇包括編碼任務Εΐοο及E200。任務 144316.doc •15· 201032219 E100編碼語音信號之第一訊框,且任務£2〇〇編碼語音信號 第訊框其中第二訊框在第一訊框之後。任務E1〇〇可 實施為無差別地編碼第一訊框之參考編碼模式且任務 E2 0 0可實施為相對於第—訊㈣碼第二訊框的相對編碼模 式(例如,有差別編碼模式)。在一實例中,第一訊框為開 始訊框’且第二訊框為緊接在開始訊框之後的有聲訊框。 第二訊框亦可為緊接在開始訊框之後的—系料續有聲訊 框中的第一者。 編褐任務E1〇〇產生一包括激勵信號之描述的第一經編碼 訊忙此描述包括指示音調脈波在時域中之形狀(亦 即,音調原型)及音調脈波重複之處之位置的一組值。音 調脈波位置藉由編碼滞後值連同諸如訊框之終端音調脈波 之位置的參考點來指示。在此描述中,使用音調脈波峰值 之位置來指示音調脈波之位置,但是本發明之範相確地 包括音調脈波之位置等效地由脈波之另一特徵(諸如,其 第-或最後樣本)的位置來指示的情形。第—經編碼之訊 框亦可包括其他資訊之表示,諸如,訊框之頻譜波封的描 述(例如,一或多個LSP索引卜任務E1〇〇可經組態以按照 符合楔板之封包產生經編碼之訊框。舉例而言,任務ei〇〇 可包括如本文中所描述之封包產生任務E32〇、E34〇及/或 E440之執行個體。 任務E100包括基於來自第—訊框之至少一音調脈波之資 訊選擇-組時域音調脈波形狀中之一者之子任務Eu〇。任 務EU0可經組態以選擇與訊框中之具有最高峰值的音調脈 144316.doc • 16 - 201032219 波最緊密匹配(例如’在最小平方意義上)的形狀。或者’ 任務E11〇可經組態以選擇與訊框中之具有最高能量(例 如’平方樣本值之最高總和)的音調脈波最緊密匹配的形 狀。或者,任務E110可經組態以選擇與訊框之兩個或兩個 以上音調脈波(例如,具有最高峰值及/或能量之脈波)之平 均值最緊密匹配的形狀。任務EU〇可實施成包括經由音調 脈波开> 狀(亦稱為「形狀向量」)之碼薄(亦即,量化表)的 φ 搜尋。舉例而言,任務EU0可實施為如本文中所描述之脈 波形狀向量選擇任務冗的或以如之執行個體。 編瑪任務E1 00亦包括一計算訊框之終端音調脈波位置 (例如,訊框之初始音調峰值或訊框之最終音調峰值的位 置)之子任務E120。可相對於訊框之開始、相對於訊框之 釔束或相對於訊框内之另一參考位置來指示終端音調脈波 的位置。任務E120可經組態以藉由(例如,基於樣本之振 幅或能量與訊框平均值之間的關係,其中能量通常按照樣 φ 本值的平方計算)選擇接近訊框邊界的樣本並在接近此樣 本之區域内搜尋具有最大值的樣本而找到終端音調脈波峰 .值。舉例而言’可根據下文描述之终端音調峰值定位任務 L100之組態中的任一者來實施任務E12〇。 編碼任務E1 00亦包括一估計訊框之音調週期的子任務 E130。音調週期(亦稱為「音調滞後值」、「滯後值」、「音 調滯後」或簡稱為「滞後」)指示音調脈波之間的距離(亦 即,鄰近音調脈波之峰值之間的距離)。典型音調頻率範 圍為男性說話者的約70至1〇〇 Hz到女性說話者的約15〇至 144316.doc -17· 201032219 200 Hz。對於8 kHz之取樣率而言,此等音調頻率範圍對 應於典型女性說話者的約40至50個樣本的滯後範圍及典型 男性說話者的約90至1〇〇個樣本的滯後範圍。為了適應具 有在此等範圍外之音調頻率的說話者,可能需要支援約5〇 至60 Hz到約300至400 Hz之音調頻率範圍》對於8姐2之 取樣率而言,此頻率範圍對應於約2〇至25個樣本到約130 至160個樣本之滞後範圍。 音調週期估計任務E130可經實施以使用任何合適音調估 計程序(例如,作為如下文描述之滯後估計任務L2〇〇之實 施方案的執行個體)來估計音調週期。此類程序通常包括 找到鄰近於終端音調峰值之音調峰值(或以其他方式找到 至少兩個鄰近音調峰值)並按照峰值之間的距離計算滞 後。任務E130可經組態以基於樣本之能量之量度(例如, 樣本能量與訊框平均能量之間的比)及/或樣本之鄰域與經 確認之音調峰值之類似鄰域(例如,終端音調峰值)相關的 程度之量度而將樣本識別為音調峰值。 編碼任務E100產生一包括第一訊框之激勵信號之特徵的 表示(諸如,由任務E110選擇之時域音調脈波形狀、由任 務E120什算之終端音調脈波位置及由任務E丨3 〇估計之滞後 值)的第一經編碼之訊框。通常,任務E1〇〇將經組態以在 音調週期估計任務E130之前執行音調脈波位置計算任務 E120,且在音調脈波形狀選擇任務Ειι〇之前執行音調週期 估計任務E13 0。 第一經編碼之訊框可包括直接指示所估計之滯後值的 144316.doc •18· 201032219 值或者,對於經編碼之訊框而言,可能需要將滯後值指 厂、對於最小值的偏移。對於二十個樣本之最小滯後值 而5,例如,七位元數字可用以指示在二十至147(亦即, 20+0至20 + 127)個樣本之範圍内的任何可能整數滯後值。 ;個樣本之最小滯後值而言,七位元數字可用以指示 ' 在25至152(亦即,25 + 0至25 + 127)個樣本之範圍内的任何 可旎整數滯後值。以此方式’將滯後值編碼為相對於最小 ❹ i之偏移可用以最大化預期滯後值之範圍的涵蓋同時最小 化編碼值之該範圍所要求之位元的數目。其他實例可經組 〜、、支援非整數滯後值的編碼。對於第一經編碼之訊框而 言,亦有可能包括關於音調滯後的一個以上值,諸如,第 一印後值或以其他方式指示滯後值自訊框之一側(例如, 訊框之開始或結束)至另一側的改變之值。 很可能訊框之音調脈波之振幅將彼此不同。在開始.訊框 中,例如,能量可隨時間增加,以使得接近訊框之結束的 9 音調脈波與接近訊框之開始之音調脈波相比將具有較大振 中田至J在此類狀況下,對於第一經編碼之訊框而言,可 能需要包括訊框之平均能量隨時間發生的變化(亦稱為 「增益概況」)之描述,諸如,音調脈波之相對振幅的描 述。 圖3B展示編碼任務E100之實施方案£1〇2的流程圖該 實施方案E102包括子任務E140。任務以4〇按照對應於第 一訊框之不同音調脈波的一組增益值計算訊框之增益概 況。舉例而言,增益值中之每一者可對應於訊框的不同音 144316.doc •19- 201032219 參 調脈波。任務E140可包括··經由增益概況之碼薄(例如, 量化表)的搜尋及與訊框之增益概況最緊密地匹配(例如, 在最小平方意義上)之碼薄條目的選擇。編碼任務幻產 生一包括以下各者之表示的第一經編碼之訊框:由任務 E110選擇之時域音調脈波形狀、由任務Ei2〇計算之終端音 調脈波位置、由任務以3〇估計之滯後值及由任務E140計^ 的該組增益冑。圖4展示訊框中之此等特徵的示意性表 不’其中標記「1」指示終端音調脈波位置,標記「2」指 :所估計之滞後值’標記「3」指示選定之時域音調脈: H且標記「4」指示在增益概況中編碼之值(例如,音 調脈波的相對振幅)°通常,任務E1G2將經組態以在增益 十算任務E140之别執行音調週期估計任務Ei3〇,增益值 十算任務E140可與音調脈波形狀選擇任務亊行或並行 地執行。在—實例中(如圖%之表中所示),編碼任務㈣2 、刀之速率操作以產生四十位元之經編碼之訊框,其 包括指示參考脈波位置之七個位元、指示參考脈波形狀之 一扣不參考滯後值的七個位元、指示增益概況之 四個位元、栽運-或多個LSP索弓!之十三個位元及指示訊 =編碼模式的兩個位元(例如,「⑼」指示諸如NELP之 編,模式,「〇1」指示諸如Qppp之相對編碼模式,且 〇」指示參考編碼模式E102)。 值It#編碼之訊框可包括訊框中之音調脈波(或音調峰 峰值目的明確指示。或者,訊框中之音調脈波或音調 目可經隱含編碼。舉例而•,第一經編碼之訊框 144316.doc -20- 201032219 可僅使用音調滯後及終端音調脈波之位置(例如,終端音 調峰值的位置)來指不訊框中之所有音調脈波的位置。對 應解碼器可經組態以自滯後值及終端音調脈波之位置計算 音調脈波之潛在位置並自增益概況獲得每一潛在脈波位置 ' ㈣幅。對於訊框含有少於潛在脈波位置之脈波的狀況而 - 言,增益概況可針對潛在脈波位置中之一或多者指示增益 值零(或其他極小值)。 Φ 如本文中所註明,開始訊框可以無聲開始並以有聲結 束。對於對應經編碼之訊框而言,與支援整個開始訊框之 準確再生相比,可能較需要為後續訊框提供良好參考,且 可實施方法Ml00以僅提供對編碼此類開始訊框之初始無 聲部分的有限支援。舉例而言,任務E14〇可經組態以選擇 指示無聲部分内之任何音調脈波週期的增益值零(或接近 令)的增益概況。或者,任務E丨4〇可經組態以選擇指示無 聲部分内之音調週期的非零增益值之增益概況。在一此實 φ 例中,任務E140選擇以零或接近零開始並單調地上升至訊 框之有聲部分之第一音調脈波的增益位準之一般增益概 況。 任務E140可經組態以按照對一組增益向量量化(乂⑺表中 之一者的索引計算該組增益值,其中不同的増益VQ表用 於不同數目個脈波。該組表可經組態以使得每一增益 表含有相同數目個條目,且不同增益Vq表含有不同長度 的向量。在此類編碼系統中,任務E140基於終端音調脈波 之位置及音調滯後來計算音調脈波之所估計之數目,且此 144316.doc •21 · 201032219 所估計之數目用以選擇該組增益VQ表中的一者。在此狀 況下,亦可由解碼經編碼之訊框之對應方法執行類似操 ^。若音調脈波之所估計之數目大於訊框巾之音調脈波的 實際數目,則任務E140亦可藉由如上所描述將訊框中之每 一額外音調脈波週期之增益設定為小值或零而傳達此資 訊。 編碼任務E 2 0 0編碼語音信號之在第一訊框之後的第二訊 框。任務E200可實施為相對於第—訊框之對應特徵編碼第 一訊框之特徵的相對編碼模式(例如,有差別塢碼模式)。 任務E200包括一計算當前訊框之音調脈波形狀與先前訊框 之音調脈波形狀之間的音調脈波形狀差別之子任務E2i〇。 舉例而言,任務E210可經組態以自第二訊框提取音調原 型,並按照所提取之原型與第一訊框之音調原型(亦即, 選疋之音調脈波形狀)之間的差計算音調脈波形狀差別。 可藉由任務E210執行之原型提取操作之實例包括在2〇〇4年 6月22日頒布之美國專利第6,754,630號(Das等人)及2006年 11月14日頒布之美國專利第7,136,812號(Manjunath等人)中 描述的原型提取操作。 可此需要組態任務E210以按照在頻域中兩個原型之間的 差什算音調脈波形狀差別。圖5 A展示編碼任務E200之實 施方案E202的圖’該實施方案E2〇2包括音調脈波形狀差別 計算任務E210之實施方案E212。任務E212包括一計算當 月ϋ訊框之頻域音調原型的子任務E214。舉例而言,任務 Ε214可經組態以對經提取之原型執行快速傅立葉變換運 144316.doc -22- 201032219 算,或以其他方式將所提取之原型轉換至頻域。任務E2i2 之此類實施方案亦可經組態以藉由以下操作計算音調脈波 形狀差別:將頻域原型劃分為多個頻率區間(例如,一組 非重疊頻率區間)’計算元素為每一頻率區間中之平均量 -值的對應頻率量值向量,及按照原型之頻率量值向量與先 •前訊框之原型之頻率量值向量之間的向量差計算音調脈波 形狀差別在此狀況下,任務E212亦可經組態以向量量化 音調脈波形狀差別,以使得對應經編碼之訊框包括經量化 之差別。 編碼任務E200亦包括一計算當前訊框之音調週期與先前 訊框之音調週期之間的音調週期差別之子任務E22(^舉例 而言,任務E220可經組態以估計當前訊框之音調滞後並減 去先前訊框之音調滯後值以獲得音調週期差別。在一此實 例中,任務E220經組態以按照(當前滯後估計_先前滯後 估計+7)計算音調週期差別。為了估計音調滯後,任務 φ E220可經組態以使用任何合適音調估計技術,諸如,上文 描述之音調週期估計任務E130之執行個體、下文描述之滯 後估計任務L200之執行個體或如在以上參考之EVRC文獻 C.S0014-C之章節4.6.3(第4-44至4-49頁)中描述的程序,該 章節藉此作為一實例以引用方式併入。對於先前訊框之未 經1化之音調滯後值不同於先前訊框之經解量化之音調滞 後值的狀況而言’可能需要任務E220藉由自當前滯後估計 減去經解量化之值來計算音調週期差別。 可使用諸如四分之一速率PPP(QPPP)的具有受限時間同 144316.doc •23· 201032219 步性之編碼方案來實施編碼任務E2〇〇 ^ qppp之實施方案 在 2007 年 1 月之名為「Enhanced Variable Rate Codec,
Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems」之第三代合作夥伴計劃2 (3GPP2)的文獻 C.S0014-C版本 i.〇(^www.3gpp.〇rg可線上 獲得)之章節4.2.4(第4-10至4-17頁)及4.12·28(第4-132至4-138頁)中描述,該等章節藉此作為一實例以引用方式併 入。此編碼方案使用頻寬隨頻率增加之一組非均勻的二十 個頻率區間來计算原型的頻率量值向量。使用Qppp產 生之經編碼之訊框之四十個位元包括:載運一或多個Lsp 索引之十六個位元、載運德耳塔滯後值之四個位元、載運 訊框之振幅資訊的十八個位元、指示模式之一個位元及一 個保留位兀(如圖26之表中所示)。相對編碼方案之此實例 不包括用於脈波形狀之位元及用於相位資訊的位元。 如上所註明,任務E100中編碼之訊框可為開始訊框,且 任務E200中編碼之訊框可為緊接在開始訊框之後的一系列 連績有聲訊框中的第一者。圖5B展示方法厘1〇〇之實施方 案M110的流程圖,該實施方案MU〇包括子任務E3〇(^任 務E300編碼在第二訊框之後的第三訊框。舉例而言,第三 訊框可為緊接在開始訊框之後的一系列連續有聲訊框中的 第二者。編碼任務E300可實施為如本文中所描述之任務 E200之實施方案的執行個體(例如,實施為卩卯^編碼的執 行個體)。在一此實例中,任務E300包括:任務£21〇之(例 如,任務E212之)執行個體,其經組態以計算第三訊框之 144316.doc •24- 201032219 音調原型與第二訊框之音調原型之間的音調脈波形狀差 別;及任務E220之執行個體,其經組態以計算第三訊框之 音調週期與第二訊框之音調週期之間的音調週期差別。在 另一此實例中’任務E300包括:任務E210之(例如,任務 E212之)執行個體,其經組態以計算第三訊框之音調原型 與第一訊框之選定之音調脈波形狀之間的音調脈波形狀差 別;及任務E220之執行個體’其經組態以計算第三訊框之 音調週期與第一訊框之音調週期之間的音調週期差別。 圖5C展示方法M100之實施方案M120的流程圖,該實施 方案M120包括子任務T100。任務T100偵測一包括自非有 聲語音至有聲語音之轉換的訊框(亦稱為向上瞬變訊框或 開始訊框)。任務T100可經組態以根據下文描述(例如,關 於編碼方案選擇器C200)之EVRC分類方案執行訊框分類, 且亦可經組態以將訊框重新分類(例如,如下文參考訊框 重新分類器RC10所描述)。 圖6A展示經組態以編碼語音信號之訊框的裝置mf 1 〇〇之 方塊圖。裝置MF100包括用於編碼語音信號之第一訊框的 構件FE100及用於編碼語音信號之第二訊框的構件 FE200 ’其中第二訊框在第一訊框之後。構件FE1〇〇包括 用於基於來自第一訊框之至少一音調脈波之資訊來選擇一 組時域音調脈波形狀中之一者(例如,如上文參考任務 E110之各種實施方案所描述)的構件FE11〇。構件FEi〇〇亦 包括用於計算第一訊框之終端音調脈波之位置(例如,如 上文參考任務E120之各種實施方案所描述)的構件FE12〇。 144316.doc •25- 201032219 構件FE100亦包括用於估計第一訊框之音調週期(例如,如 上文參考任務E13 0之各種實施方案所描述)的構件fei 30。 圖6B展示構件FE100之實施方案FE102的方塊圖,該實施 方案FE102亦包括用於計算對應於第一訊框之不同音調脈 波的一組增益值(例如’如上文參考任務E14〇之各種實施 方案所描述)的構件FE140。 構件FE200包括用於計算第二訊框之音調脈波形狀與第 一訊框之音調脈波形狀之間的一音調脈波形狀差別(例 如’如上文參考任務E210之各種實施方案所描述)的構件 FE210。構件FE200亦包括用於計算第二訊框之音調週期 與第一訊框之音調週期之間的一音調週期差別(例如,如 上文參考任務E220之各種實施方案所描述)的構件FE220。 圖7A展示根據一般組態之解碼語音信號之激勵信號之方 法M200的流程圖。方法M200包括一解碼第一經編碼之訊 框之一部分以獲得第一激勵信號之任務D10〇,其中該部分 包括時域音調脈波形狀、音調脈波位置及音調週期的表 示。任務D100包括一根據音調脈波位置將時域音調脈波形 狀之第一複本配置於第一激勵信號内的子任務D11〇。任務 D100亦包括一根據音調脈波位置及音調週期將時域音調脈 波形狀之第二複本配置於第一激勵信號内的子任務D12〇。 在一實例中,任務D110及D120自碼薄獲得時域音調脈波 形狀(例如,根據來自第一經編碼之訊框之表示形狀的索 引)’並將其複製至激勵號緩衝器中。任務Di〇〇及/或方 法M200亦可實施成包括進行以下操作之任務:自第一經 144316.doc -26 - 201032219 編碼之訊框獲得一組LPC係數值(例如,藉由解量化來自第 一經編碼之訊框之一或多個經量化之LSP向量並對結果進 行逆變換)’根據該組LPC係數值組態合成濾波器,及向經 組態之合成濾波器施加第一激勵信號以獲得第一經解碼之 . 訊框。 圖7B展示解碼任務D100之實施方案D102的流程圖。在 此狀況下,第一經編碼之訊框之部分亦包括一組增益值之 ^ 表示。任務D1〇2包括一將該組增益值中的一者施加至時域 音調脈波形狀之第一複本之子任務D130。任務D102亦包 括一將該組增益值中的一不同者施加至時域音調脈波形狀 之第二複本之子任務D140。在一實例中,任務D130在任 務D110期間將其增益值施加至該形狀,且任務D14〇在任 務D120期間將其增益值施加至該形狀。在另一實例中,任 務D130在已執行任務D110之後將其增益值施加至激勵信 號緩衝器之對應部分’且任務D140在已執行任務D120之 φ 後將其增益值施加至激勵信號緩衝器的對應部分。包括任 務D1 02之方法M200之實施方案可組態成包括一向經組態 之合成濾波器施加所得的經增益調整之激勵信號以獲得第 一經解碼之訊框的任務。 方法M200亦包括一解碼第二經編碼之訊框之一部分以 獲得第二激勵信號之任務D200,其中該部分包括音調脈波 形狀差別及音調週期差別的表示。任務D2〇〇包括一基於時 域音調脈波形狀及音調脈波形狀差別來計算第二音調脈波 形狀的子任務D210。任務D200亦包括一基於音調週期及 144316.doc •27· 201032219 曰調週期差別來计算第二音調週期的子任務D22〇 ^任務 D200亦包括一根據音調脈波位置及第二音調週期將第二音 調脈波形狀之兩個或兩個以上複本配置於第二激勵信號内 的子任務D230。任務D230可包括按照相對於音調脈波位 置之對應偏移計算第二激勵信號内之複本中之每一者的位 置,其中每一偏移為第二音調週期的整數倍數。任務D2〇〇 及/或方法M200亦可實施成包括進行以下操作之任務:自 第二經編碼之訊框獲得一組LPC係數值(例如,藉由解量化 來自第二經編碼之訊框之一或多個經量化之Lsp向量並對❹ 結果進行逆變換)’根據該組LPC係數值組態合成濾波器, 及將第二激勵信號施加至經組態之合成濾波器以獲得第二 經解碼之訊框。 圖8A展示用於解碼語音信號之激勵信號的裝置“^⑼之 方塊圖。裝置MF200包括用於解碼第一經編碼之訊框之— 部分以獲得第一激勵信號的構,其中該部分包括 時域音調脈波形狀、音調脈波位置及音調週期的表示。構 件FD1 00包括用於根據音調脈波位置將時域音調脈波形狀© 之第一複本配置於第一激勵信號内的構件fdi ι〇。構件 FD100亦包括用於根據音調脈波位置及音調週期將時域音 調脈波形狀之第二複本配置㈣一㈣信冑内的才冓件 FDl2〇。在-實例中’構件削1〇及剛2〇經組態以自碼薄 獲得時域音調脈波形狀(例如’根據來自第—經編碼之訊 框之表示形狀的索引),並將其複製至激勵信號緩衝器 中。構件FD200及/或裝置MF2〇〇亦可實施成包括用於自第 144316.doc •28- 201032219 一經編碼之訊框獲得一組LPC係數值(例如,藉由解量化來 自第、’'呈編碼之訊框之一或多個經量化之LSP向量並對結 果進仃逆變換)的構件,用於根據該組Lpc係數值組態合成 滤波器的構件’及用於向經組態之合成濾波器施加第一激 勵k號以獲得第一經解碼之訊框的構件。 圖8B展示用於解碼的構件FD1〇〇之實施方案Fm〇2的流 程圖。在此狀況下,第一經編碼之訊框之部分亦包括一組 • 增益值之表示。構件FD102包括用於將該組增益值中的一 者施加至時域音調脈波形狀之第一複本的構件FD13(^構 件FD102亦包括用於將該組增益值中的一不同者施加至時 域音調脈波形狀之第二複本的構件FD14〇。在一實例中, 構件FD130將其增益值施加至構件fd110内之形狀,且構 件FD140將其增益值施加至構件fd12〇内的形狀。在另一 實例中’構件FD130將其增益值施加至構件FD110已配置 第一複本之激勵信號緩衝器的一部分,且構件FD14〇將其 • 增益值施加至構件FD120已配置第二複本之激勵信號緩衝 器的一部分。包括構件FD102之裝置MF200之實施方案可 組態成包括用於將所得經增益調整之激勵信號施加至經組 態之合成濾波器以獲得第一經解碼之訊框的構件。 裝置MF200亦包括用於解碼第二經編碼之訊框之一部分 以獲得第二激勵信號的構件FD200,其中該部分包括音調 脈波形狀差別及音調週期差別的表示。構件FD200包括用 於基於時域音調脈波形狀及音調脈波形狀差別來計算第二 音調脈波形狀的構件FD210。構件FD200亦包括用於基於 144316.doc •29· 201032219 音調週期及音調週期差別來計算第二音調週期的構件 FD220。構件FD200亦包括用於根據音調脈波位置及第二 音調週期將第二音調脈波形狀之兩個或兩個以上複本配置 於第二激勵信號内的構件FD230。構件FD230可經組態以 按照相對於音調脈波位置之對應偏移計算第二激勵信號内 之複本中之每一者的位置,其中每一偏移為第二音調週期 的整數倍數。構件FD200及/或裝置MF200亦可實施成包括 用於自第二經編碼之訊框獲得一組LPC係數值(例如,藉由 解量化來自第二經編碼之訊框之一或多個經量化之LSP向 量並對結果進行逆變換)的構件,用於根據該組LPC係數值 組態合成濾波器的構件,及用於將第二激勵信號施加至經 組態之合成濾波器以獲得第二經解碼之訊框的構件。 圖9A展示語音編碼器AE10,其經配置以接收經數位化 之語音信號S 1 00(例如,作為一系列訊框)並產生對應經編 碼之信號S200(例如,作為一系列對應經編碼之訊框)以供 在通信頻道C100(例如,有線、光學及/或無線通信鏈路)上 傳輸至語音解碼器AD10。語音解碼器AD10經配置以解碼 經編碼之語音信號S200的所接收之版本S300並合成對應輸 出語音信號S400。語音編碼器AE10可實施成包括裝置 MF100之執行個體及/或執行方法M100的實施方案。語音 解碼器AD10可實施成包括裝置MF200之執行個體及/或執 行方法M200的實施方案。 如上文所描述,語音信號S100表示已根據在此項技術中 已知之各種方法中的任一者(諸如,脈碼調變(PCM)、壓擴 144316.doc -30- 201032219 μ律或A律)數位化並量化的類比信號(例如,如由麥克風所 捕獲)。該信號亦可已在類比及/或數位域中經受其他預處 理操作’諸如,雜訊抑制、感知加權及/或其他遽波操 作。或者或另外,可在語音編碼器AE10内執行此等操 作°語音信號S100之執行個體亦可表示已數位化並量化之 -類比信號(例如,如由麥克風之陣列所捕獲)的組合。 圖9B展示語音編碼器AE10之第一執行個體AE10a,其經 籲 配置以接收經數位化之語音信號S 100之第一執行個體S11〇 並產生經編碼之信號S200之對應執行個體S210以供在通信 頻道C100之第一執行個體Clio上傳輸至語音解碼器ad 10 之第一執行個體ADlOa。語音解碼器ADlOa經配置以解碼 經編碼之語音信號S210的所接收之版本S310並合成輸出語 音信號S400的對應執行個體S410。 圖9B亦展示語音編碼器ae 10之第二執行個體AE 1 Ob,其 經配置以接收經數位化之語音信號s丨〇〇之第二執行個體 φ S120並產生經編碼之信號S200之對應執行個體S220以供在 通信頻道C100之第二執行個體^⑽上傳輸至語音解碼器 AD 1 0之第二執行個體AD丨〇b。語音解碼器AD丨〇b經配置以 解碼經編碼之語音信號S220的所接收之版本S320並合成輸 出語音信號S400的對應執行個體S42〇。 浯音編碼器AElOa及語音解碼器AD1〇b(類似地,語音編 碼器AElOb及語音解碼器AD1〇a)可在用於傳輸並接收語音 k號之任何通信器件(包括(例如)下文參考圖14所描述之使 用者終端機、地面台或閘道器)中一起使用。如本文中所 144316.doc 201032219 描述’語音編碼器AE10可以許多不同方式來實施,且語 曰編碼器AE10a及AE1 Ob可為s吾音編碼器ae 10之不同實施 方案的執行個體。同樣’語音解碼器AD10可以許多不同 方式來實施’且語音解碼器AD 10a及AD l〇b可為語音解碼 器AD10之不同實施方案的執行個體。 圖1 〇 A展示根據一般組態之用於編嗎語音信號之訊框的 裝置A100之方塊圖,該裝置包括:第一訊框編碼器1〇〇, 其經組態以編碼語音信號之第一訊框作為第一經編碼之訊 框,及第二訊框編碼器200,其經組態以編碼語音信號之 第二訊框作為第二經編碼之訊框,其中第二訊框在第一訊 框之後。語音編碼器AE10可實施成包括裝置A1〇〇之執行 個體。第一訊框編碼器100包括音調脈波形狀選擇器, 其經組態以基於來自第一訊框之至少一音調脈波之資訊選 擇一組時域音調脈波形狀中之一者(例如,如上文參考任 務E110之各種實施方案所描述卜編碼器1〇〇亦包括一音調 脈波位置計算器120 ’其經組態以計算第一訊框之終端音 調脈波的位置(例如,如上文參考任務E12〇之各種實施方 案所描述)。編碼器100亦包括一音調週期估計器13〇,其 經組態以估計第一訊框之音調週期(例如,如上文參考任 務E1 30之各種實施方案所描述)。編碼器_可經組態以按 照符合模板之封包產生經編碼之訊框。舉例而言,編碼器 100可包括如本文_所描述之封包產生器⑺及/或別之執 行個體。圖H)B展示編碼器1〇〇之實施方案1〇2的方塊圖, 該實施方案H)2亦包括—增益值計算器刚,其經組態以計 144316.doc 32- 201032219 算對應於第一訊框之不同音調脈波的一組增益值(例如, 如上文參考任務以切之各種實施方案所描述)。 第二訊框編碼器2〇〇包括一音調脈波形狀差別計算器 210,其經組態以計算第二訊框之音調脈波形狀與第一訊 框之音調脈波形狀之間的音調脈波形狀差別(例如,如上 文參考任務E210之各種實施方案所描述)。編碼器2〇〇亦包 括一音調脈波差別計算器22〇,其經組態以計算第二訊框 φ 之音調週期與第一訊框之音調週期之間的音調週期差別 (例如,如上文參考任務E22〇之各種實施方案所描述 圖11A展示根據一般組態之用於解碼語音信號之激勵信 號的裝置A200之方塊圖,該裝置A2〇〇包括一第一訊框解 碼器300及一第二訊框解碼器4〇〇的。解碼器3〇〇經組態以 解碼第-經編碼之訊框之一部分以獲得第一激勵信號其 中該部分包括時域音調脈波形狀、音調脈波位置及音調週 期的表示。解碼器300包括一第一激勵信號產生器31〇,其 ❿ 經組態以根據音調脈波位置將時域音調脈波形狀之第一複 本配置於第一激勵信號内。激勵產生器3 1〇亦經組態以根 據音調脈波位置及音調週期將時域音調脈波形狀之第二複 本配置於第一激勵信號内。舉例而言產生器3丨〇可經組 態以執行如本文中所描述之任務m 1〇及m2〇的實施方 案在此實例中’解碼器3〇〇亦包括一合成遽波器,其 根據由解碼器300自第-經編碼之訊框獲得之一組Lpc係 數值(例如,藉由解量化來自第—經編碼之訊框之一或多 個經量化LSP之向量並對結果進行逆變換)來組態,且經配 I44316.doc -33· 201032219 置以對激勵信號進行濾波從而獲得第一經解碼之訊框。 圖11B展示第一激勵信號產生器31〇之實施方案的方 塊圖,該實施方案312針對第一經編瑪之訊框之部分亦包 括一組增益值之表示的狀況包括第一乘法器33〇及第二乘 法器340。第一乘法器330經組態以將該組增益值中的一者 施加至時域音調脈波形狀之第一複本。舉例而言,第一乘 法器330可經組態以執行如本文中所描述之任務Di3〇的實 施方案。第二乘法器340經組態以將該組增益值中的一不 同者施加至時域音調脈波形狀之第二複本。舉例而言第 二乘法器340可經組態以執行如本文中所描述之任務di4〇 的實施方案。在包括產生器312之解碼器3〇〇之實施方案 中,合成濾波器320可經配置以對所得經增益調整之激勵 信號進行濾波從而獲得第一經解碼之訊框。可使用不同結 構或在不同時間使用同-結構來實施第—乘法器33〇及第 二乘法器340。 第二訊框解碼器4〇〇經組態以解碼第二經編碼之訊框之 -部分以獲得第二激勵信號,其中該部分包括音調脈波形 狀差別及音調週懸別的表示。解碼器彻包括—第二激 勵信號產生器440,該第二激勵信號產生器440包括一音調 脈波形狀計算器41G及—音調週期計算器。音調脈波形 狀計算基於時域音調脈波形狀及音調脈波 形狀差別來計算第二音調脈波形狀。舉例而言,音調脈波 形狀計算器410可經組態以執行如本文中所描述之任務 D21〇的實施方案。音調週期計算器㈣經組態以基於音調 144316.doc •34· 201032219 週期及音調週期差別來計算第二音調週期。舉例而言,音 調週期計算器420可經組態以執行如本文中所描述之任務 D220的實施方案。激勵產生器440經組態以根據音調脈波 位置及第二音調週期將第二音調脈波形狀之兩個或兩個以 •上複本配置於第二激勵信號内。舉例而言,產生器440可 - 經組態以執行本文中所描述之任務D230的實施方案。在此 實例中,解碼器400亦包括一合成濾波器430,其根據由解 碼器400自第一經編碼之訊框獲得之一組LPC係數值(例 ® 如,藉由解量化來自第一經編碼之訊框之一或多個經量化 之LSP向量並對結果進行逆變換)來組態,且經配置以對第 二激勵信號進行濾波從而獲得第二經解碼之訊框。可使用 不同結構或在不同時間使用同一結構來實施合成濾波器 320、合成濾波器430。語音解碼器AD10可實施成包括裝 置A200之執行個體。 圖12A展示語音編碼器AE10之多模式實施方案AE20的方 φ 塊圖。編碼器AE20包括··第一訊框編碼器100之實施方案 (例如,編碼器102)、第二訊框編碼器200之實施方案、無 聲訊框編碼器UE10(例如,QNELP編碼器)及編碼方案選擇 器C200。編碼方案選擇器C200經組態以分析語音信號 • S100之傳入訊框的特性(例如,根據如下文描述之經修改 之EVRC訊框分類方案),以經由選擇器50a、50b來選擇用 於每一訊框之編碼器100、200及UE10中的適當者。可能 需要實施第二訊框編碼器200以應用四分之一速率PPP (QPPP)編碼方案且實施無聲訊框編碼器UE10以應用四分 144316.doc -35- 201032219 之一速率NELP(QNELP)編碼方案。圖12B展示語音解碼器 AD10之類似多模式實施方案AD20的方塊圖,該多模式實 施方案AD20包括:第一訊框解碼器300之實施方案(例如, 解碼器302)、第二訊框解碼器400之實施方案、無聲訊框 解碼器UD10(例如,QNELP解碼器)及編碼方案偵測器 C3 00。編碼方案偵測器C300經組態以判定所接收之經編 碼之語音信號S300的經編碼之訊框的格式(例如,根據諸 如第一及/或最後位元的經編碼之訊框之一或多個模式位 元),以經由選擇器90a、90b選擇用於每一經編碼之訊框 之解碼器300、400及UD10中的適當對應解碼器。 圖13展示可包括於語音編碼器AE10之實施方案内之殘 差產生器R10的方塊圖。產生器R10包括一 LPC分析模組 R110,其經組態以基於語音信號S100之當前訊框計算一組 LPC係數值。變換區塊R120經組態以將該組LPC係數值轉 換為一組LSF,且量化器R130經組態以量化LSF(例如,作 為一或多個碼簿索引)以產生LPC參數SL 1 0。逆量化器 R140經組態以自經量化之LPC參數SL10獲得一組經解碼之 LSF,且逆變換區塊R150經組態以自該組經解碼之LSF獲 得一組經解碼之LPC係數值。根據該組經解碼之LPC係數 值組態之白化濾波器R160(亦稱為分析濾波器)處理語音信 號S100以產生LPC殘差SR10。殘差產生器R10亦可經實施 以根據被視為適合於特定應用之任何其他設計產生LPC殘 差。殘差產生器R10之執行個體可實施於訊框編碼器104、 204及UE10中之任何一或多者内及/或在訊框編碼器104、 144316.doc -36- 201032219 204及UEl 0中之任何一或多者間共用。 圖14展不用於衛星通信之系統之示意圖,該系統包括衛 星10、地面台20a、20b及使用者終端機3〇&、3〇b。衛星1〇 可經組態以可能經由一或多個其他衛星在地面台2〇a與2〇b 之間、使用者終端機30&與3〇13之間或地面台與使用者終端 _ 機之間的半雙工頻道或全雙工頻道上轉播話音通信。使用 者終,機3〇a、30b中之每一者可為用於無線衛星通信之攜 φ 器件’諸如,行動電話或裝備有無線數據機之揭帶型 電腦、安裝於陸地載具或太空載具内之通信單元或用於衛 星話音通信的另-器件。地面台2〇a、m中之每__者經組 態以將話音通信頻道投送至各別網路4〇&、4〇b,該網路 4〇a、40b可為類比或脈碼調變(pcM)網路(例如,公眾交換 電活網路或PSTN)及/或資料網路(例如,網際網路、區域 網路(LAN)、校園網路(CAN)、都會網路、廣域網 路(WAN)、環形網路、星形網路及/或符記環形網路卜地 • 面台施、島中之一者或兩者亦可包括-閘道器,其經組 態以將話音通信信號譯碼至另一形式(例如,類比、 顺、較高位元率編碼方案等)及/或自另_形式⑽如類 比、PCM、較高位元率編碼方案等)譯碼話音通信作號。 本文中所描述之方法中之一或多者可由圖14中所展示之器 件1〇、2〇a、20b、3〇a及遍中之任何一或多者來執行且 本文中所描述之裝置中之-或多者可包括於該等器件 任何一或多者中。 在:PWL編碼期間提取之原型的長度通常等於音調滞後之 144316.doc -37- 201032219 當前值’其在:訊框間可改變。量化原型以傳輸至解碼琴因 此呈現量化維度可變之向量的問題。在習知PWI及ppp編 碼方案中,通常藉由將時域向量轉換為複合值頻域向量 (例如,使用離散時間傅立葉變換(DTFT)運算)來執行可變 維度原型向量之量化❶上文參考音調脈波形狀差別計算任 務E210來描述此類運算。接著對此複合值可變維度向量之 振幅取樣以獲得固定維度的向量。振幅向量之取樣可能為 非均勻的。舉例而言,可能需要在低頻率下與在高頻率下 相比以較高解析度對向量進行取樣。 可能需要執行對在開始訊框之後的有聲訊框的有差別 PWI編碼。在全速率PPP編碼模式中,頻域向量之相位以 類似於振幅之方式取樣以獲得固定維度的向量。然而在 QPPP編碼模式中,無位元可用於將此相位資訊載運至解 碼器。在此狀況下,音調滯後經有差別編碼(例如,相對 於先前訊框之音調滞後),且必須亦基於來自一或多個先 前訊框之資訊來估計相位資訊。舉例而言,當轉換訊框編 碼模式(例如,任務E100)用以編碼開始訊框時,可自音調 滞後及脈波位置資訊導出後續訊框之相位資訊。 對於編碼開始訊框而言,可能需要執行一可預期偵測訊 杧内之所有音調脈波的程序。舉例而言,可預期使用強健 音調峰值偵測操作以提供後續訊框的較好滯後估計及/或 相位參考。可靠參考值對於後續訊框係使用諸如有差別編 碼方案之相對編碼方案(例如,任務£2〇〇)進行編碼之狀況 可為尤其重要的,此係因為此等方案對於誤差傳播通常為 1443l6.dc 201032219 敏感的。如上所註明,在此描述中,音調脈波之位置係由 其峰值之位置來㈣’但是在另―情料,音調脈波之位 置可等效地由脈波之另-特徵(諸如,其第—樣本或最後 樣本)的位置來指示。
圖15A展示根據-般組態之方法M则之流程圖,該方法 M300包括任務L100、L200及L3〇〇。任務u〇〇定位訊框之 一終端音調峰值。在一特定實施方案中,任務Ll〇〇經組態 以根據(A) —基於樣本振幅之量與(B)用於訊框之量之平均 值之間的關係選擇一樣本作為終端音調峰值。在一此實例 中,為樣本量值(亦即,絕對值),且在此狀況下,可 按照1厂計算訊框平均值,其中s表示樣本值(亦即,振 幅)’ N表示訊框中之樣本之數目,且i為樣本索引。在另 一此實例中,該量,樣本能量(亦即,振幅平方),且在此 狀況下,可按照1厂計算訊框平均值。在下文之描述中, 使用能量。 任務L100可經組態以按照訊框之初始音調峰值或按照訊 框之最終音調峰值定位終端音調峰值。為了定位初始音調 峰值,任務L100可經組態以在訊框之第一樣本開始且在時 間上向刖運作。為了定位最終音調峰值,任務L i⑼可經組 態以在訊框之最後樣本開始且在時間上向後運作。在下文 描述之特定實例中,任務Ll00經組態以按照訊框之最終音 調峰值定位終端音調峰值。 圖BB展示任務Ll〇〇之實施方案Ll〇2的方塊圖,該實施 144316.doc -39· 201032219 方案L102包括子任務L110、L120及L130。任務L110定位 訊框中之有資格成為終端音調峰值的最後樣本。在此實例 中,任務L110定位相對於訊框平均值之能量超出(或者, 不小於)對應臨限值TH1的最後樣本。在一實例中,TH1之 值為六。若在訊框中未發現此樣本,則方法M3 00終止且 另一編碼模式(例如,QPPP)用於訊框。否則,任務 L120(如圖16A中所示)在此樣本之前的窗口内進行搜尋以 找到具有最大振幅之樣本,且選擇此樣本作為臨時峰值候 選者。對於任務L120中之搜尋窗口而言,可能需要具有等 於最小容許滞後值的寬度WL1。在一實例中,WLi之值為 二十個樣本。對於搜尋窗口中之一個以上樣本具有最大振 幅之狀況而言,任務L120可經不同地組態以選擇第一此樣 本、最後此樣本或任何其他此樣本。 任務L130(如圖16B中所示)藉由在臨時峰值候選者之前 的窗口内找到具有最大振幅之樣本而驗證最終音調峰值選 擇。對於任務L130中之搜尋窗口而言,可能需要具有一在 初始滯後估計之50%與1〇〇%之間或5〇%與75%之間的寬度 WL2。初始滯後估計通常等於最新滞後估計(亦即,來自 先前訊框之滯後估計)。在一實例中,WL2之值等於初始 滯後估计的八分之五。若新樣本之振幅大於臨時峰值候選 者之振幅,則任務L130替代地選擇新樣本作為最終音調峰 值。在另一實施方案中,若新樣本之振幅大於臨時峰值候 選者的振幅,則任務L130選擇新樣本作為新臨時峰值候選 者,並重複在新臨時峰值候選者之前的寬度WL2之窗口内 144316.doc •40- 201032219 的搜尋,直至找不到此樣本為止。 任務L200计算机框之所估計之滞後值。任駐鳩通常經 組態以定位鄰近於終端音調峰值之音調脈波的峰值並按照 Λ兩個峰值之間的距離計算滯後估計q能需要組態任務 L20(m僅在訊框邊界内進行搜尋及/或要求終端音調峰值 與鄰近音調峰值之間的距離大於(或者,不小於)最小容許 滯後值(例如,二十個樣本)。 φ 可旎需要組態任務L200以使用初始滯後估計來找到鄰近 峰值。然而首先,對於任務L2〇〇而言,可能需要檢查初始 滯後估计以查看音調加倍誤差(其可包括音調三倍及/或音 調四倍誤差)。通常,將已使用基於相關之方法來判定初 始滯後估計。音調加倍誤差對於音調估計之基於相關之方 法為常見的,且通常為完全聽得到的。圖15C展示任務 L200之實施方案L2〇2的流程圖。任務L2〇2包括一檢查初 始邱·後估汁以查看音調加倍誤差之可選但推薦的子任務 • L21〇。任務L210經組態以在距終端音調峰值(例如)ι/2、ι/3 及%滯後的距離的窄窗口内搜尋音調峰值,且可如下所描 述反覆。 圖17A展示任務L210之實施方案[21〇&的流程圖,該實 施方案L210a包括子任務L212、L214&L21^對於待檢查 之最小音調分率(例如,滞後/4),任務L212在中心相對於 終端音調峰值偏移實質上等於音調分率(例如,在截斷或 捨入誤差内)之距離的小窗口(例如,五個樣本)内進行搜 尋,以找到具有(例如,在振幅、量值或能量方面的)最大 144316.doc -41 - 201032219 值之樣本。圖18A說明此類操作。 任務T214評估最大值樣本(亦即,「候選者」)之一戍多 個特徵’且比較此等值與各別臨限值。經評估之特徵可包 括候選者之樣本能量、候選者能量與平均訊框能量(例 如’峰值與RMS能量)之比及/或候選者能量與終端峰值能 量的比。任務L214可經組態以按任何次序執行此等評估, 且評估可彼此串行及/或並行地得以執行。 對於任務L214而言,亦可能需要使候選者之鄰域與終端 音調峰值之類似鄰域相關。對於此特徵評估而言,任務 ❺ L214通常經組態以使以候選者為中心之長度為N1個樣本 的區段與以終端音調峰值為中心之相等長度的區段相關。 在一實例中,N1之值等於十七個樣本。可能需要組態任務 L214以執行正規化相關(例如,具有在零至一之範圍内的 結果)。可能需要組態任務L2丨4以重複以(例如)候選者之前 及之後的一個樣本為中心之長度為N丨之區段的相關(例 如,以考量時序偏移及/或取樣誤差)並選擇最大相關結 果。對於相關窗口將延伸超出訊框邊界之狀況而言,可能 ® 需要移位或截斷相關窗口。(對於相關窗口經截斷之狀況 而吕’可能需要正規化相關結果,除非該相關結果已被正 規化。)在一實例中’若滿足展示為圖19Α中之諸欄的三組 . 條件中之任一者,則接受候選者作為鄰近音調峰值,其中 臨限值Τ可等於六。 右任務Τ214找到鄰近音調峰值,則任#L216按照終端音 調峰值與鄰近音調峰值之間的距離計算當前滯後估計。否 144316.doc -42- 201032219 則,任務L210a在終端峰值之另一側上反覆(如圖18B中所 示),接著對於待檢查之其他音調分率在終端峰值之兩側 之間自最小至最大交替,直至找到鄰近音調峰值為止(如 圖18C至圖18F中所示)。若在終端音調峰值與最接近之訊 框邊界之間找到鄰近音調峰值,則終端音調峰值被重新標 記為鄰近音調峰值,且新峰值被標記為終端音調峰值。在 替代實施方案中,任務L210經組態以在前側之前在終端音 調峰值之後侧(亦即,在任務L100中已搜尋之侧)上進行搜 尋。 若分率滯後測試任務L210並不定位音調峰值,則任務 L220根據初始滞後估計(例如,在相對於終端峰值位置偏 移初始滯後估計之窗口内)搜尋鄰近於終端音調峰值的音 調峰值。圖17B展示任務L220之實施方案L220a的流程 圖,該實施方案L220a包括子任務L222、L224、L226及 L228。任務L222在以距最終峰值之左側一滯後的距離為中 心之寬度為WL3之窗口内找到候選者(例如,具有在振幅 或量值方面之最大值的樣本)(如圖19B中所示,其中開圓 指示終端音調峰值)。在一實例中,WL3之值等於0.55倍初 始滯後估計。任務L224評估候選樣本之能量。舉例而言, 任務L224可經組態以判定候選者之能量之量度(例如,樣 本能量與訊框平均能量之比,諸如,峰值與RMS能量之 比)是否大於(或者,不小於)對應臨限值TH3。ΊΉ3之實例 值包括1、1.5、3及6。 任務L226使候選者之鄰域與終端音調峰值之類似鄰域相 144316.doc -43- 201032219 關。任務L226通常經組態以使以候選者為中心之長度為 N2個樣本的區段與以終端音調峰值為中心之相等長度的區 段相關。N2之值的實例包括十、十一及十七個樣本。可能 需要組態任務L226以執行正規化相關。可能需要組態任務 L226以重複以(例如)候選者之前及之後的一個樣本為中心 之區段的相關(例如,以考量時序偏移及/或取樣誤差)並選 擇最大相關結果。對於相關窗口將延伸超出訊框邊界之狀 況而言,可能需要移位或截斷相關窗口。(對於相關窗口 經截斷之狀況而言,可能需要正規化相關結果,除非該相 關結果已被正規化。)任務L226亦判定相關結果是否大於 (或者,不小於)對應臨限值TH4。TH4之實例值包括0.75、 0.65及0_45 〇可根據不同組之TH3及TH4值來組合任務L224 及L226之測試。在一此實例中,若以下若干組值中的任一 者產生正結果,則L224及L226之結果為正:TH3 = 1且 TH4 = 0.75 ; TH3 = 1.5 3. TH4=0.65 ; TH3=3 且 TH4=0.45 ; TH3 = 6 (在此狀況下,任務L226之結果被視為正)。 若任務L224及L226之結果為正,則候選者被接受作為鄰 近音調峰值,且任務L228按照此樣本與終端音調峰值之間 的距離計算當前滯後估計。任務L224及L226可依序及/或 彼此並行地得以執行。任務L220亦可實施成僅包括任務 L224及L226中之一者。若任務L220在未找到鄰近音調峰 值之情況下結束,則可能需要在終端音調峰值之後側上反 覆任務L220(如圖19C中所示,其中開圓指示終端音調峰 值)。 144316.doc •44· 201032219 若任務L210&L220中之任一者皆不定位音調峰值,則任 務L230在終端音調峰值之前側上執行對音調峰值的開放窗 口搜尋。圖17C展示任務L230之實施方案L23〇a的流程 圖,該實施方案L230a包括子任務L2;32、U34、。“及 . L238。開始於距終端音調峰值某一距離D1之樣本,任務 . L232找到相對於平均訊框能量之能量超出(或者,不小於) 臨限值(例如,TH1)的樣本。圖20A說明此類操作。在一實 φ 例中’,D1之值為最小容許滯後值(諸如’二十個樣本)。任 務L234在此樣本之寬度為WL4的窗口内找到候選者(例 如具有在振幅或量值方面之最大值的樣本)(如圖2〇b中 所示)。在一實例中,WL4之值等於二十個樣本。 任務L236使候選者之鄰域與終端音調峰值之類似鄰域相 關。任務L236通常經組態以使以候選者為中心之長度為 N3個樣本的區段與以終端音調峰值為中心之相等長度的區 段相關。在一實例中,N3之值等於十一個樣本。可能需要 # 組態任務1^236以執行正規化相關。可能需要組態任務L236 以重複以(例如)候選者之前及之後的一個樣本為中心之區 段的相關(例如,以考量時序偏移及/或取樣誤差)並選擇最 大相關結果。對於相關窗口將延伸超出訊框邊界之狀況而 言,可能需要移位或截斷相關窗口。(對於相關窗口經截 斷之狀況而言’可能需要正規化相關結果,除非該相關結 果已被正規化。)任務L236判定相關結果是否超出(或者, 不小於)臨限值TH5。在一實例中,TH5之值等於〇45。若 任務L236之結果為正,則候選者被接受作為鄰近音調峰 144316.doc •45- 201032219 值’且任務L238按照此樣本與終端音調峰值之間的距離計 算當前滯後估計。否則,任務L230a跨越訊框反覆(例如, 如圖20C中所示,開始於先前搜尋窗口的左側),直至找到 音調峰值或搜尋宄為止。 當滯後估計任務L200已結束時,任務L300執行以定位訊 框中之任何其他音調脈波。任務L3〇〇可經實施以使用相關 及當前滞後估計來定位更多脈波。舉例而言,任務L3〇〇可 經組態以使用諸如相關及樣本與RMS能量值之比之準則來 測試圍繞滯後估計之窄窗口内的最大值樣本。與滯後估計 任務L200相比’任務L300可經組態以使用較小搜尋窗口及/ 或寬鬆之準則(例如,較低臨限值),尤其係在已找到鄰近 於終端音調峰值之峰值的情況下。舉例而言,在開始或其 他轉換訊框中’脈波形狀可改變,以使得訊框内之一些脈 波可能並非強烈相關,且可能需要對於第二脈波之後的脈 波寬鬆或甚至忽略相關準則’只要脈波之振幅足夠高且位 置(例如’根據當前滯後值)為正確的便可。可能需要最小 化漏掉有效脈波的機率,且尤其對於大滞後值而言,訊框 之有聲部分可能並非非常有峰的。在一實例中,方法 M300實現每訊框最多八個音調脈波。 任務L3 00可經實施以計算下—音調峰值之兩個或兩個以 上不同候選者並根據此等候選者中之一者選擇音調峰值。 舉例而言,任務L3 00可經組態以基於樣本值來選擇候選樣 本並基於相關結果來計算候選距離。圖21展示任$L3〇〇之 實施方案L3〇2的流程圖,其包括子任務L3i〇、L320、 144316.doc -46 - 201032219 L330、L340及L350。任務L3 10初始化候選者搜尋的錯定 位置。舉例而言’任務L3 10可經組態以使用最新接受之音 調峰值的位置作為初始錨定位置。在任務L3 02之第一反覆 中’例如’錯定位置可為鄰近於終端音調聲值之音調峰值 的位置(若此類峰值由任務L200定位)或另外為終端音調峰 值的位置。對於任務L3 10而言,亦可能需要初始化滯後乘 數m(例如,初始化為值1)。
任務L320選擇候選樣本並計算候選距離。任務L32〇可經 組態以如圖22A中所示搜尋窗口内的此等候選者,其中大 的有界水平線指示當前訊框,左側大垂直線指示訊框開 始,右側大垂直線指示訊框結束,點指示錨定位置,且陰 黍框私示搜尋窗口。在此實例中,窗口以距錯定位置之距 離為當前滯後估計與滞後乘數m之乘積的樣本為中心,且 °亥窗口向左(亦即,在時間上向後)延伸WS個樣本且向右 (亦即,在時間上向前)延伸個樣本。 任務L320可經組態以將窗口大小參數ws初始化為當前 滯後估計之五分之—的值。對於窗α大小參而言, 可能需要至少具有最小值(諸如’十二個樣本)。或者,若 2找^鄰近於終端音調峰值之音調峰值,則對於任務 而Q,可能需要將窗口大小參數ws初始化為可能 大值(諸如,當前滯後估計之一半 值為了找到候選樣本,任務L320搜尋窗口以找到具有最大 在^樣^並記錄此樣本之位置及值。任務U2G可經組態以 尋固口内選擇值具有最高振幅的樣本。或者,任務 1443l6.d〇c -47· 201032219 L320可經組態以在搜尋窗口内選擇值具有最高量值或最高 能量的樣本。 候選距離對應於搜尋窗口内之與錨定位置之相關為最高 的樣本。為了找到此樣本,任務L320使窗口内之每一樣本 之鄰域與錨定位置之類似鄰域相關,且記錄最大相關結果 及對應距離。任務L320通常經組態以使以每一測試樣本為 中心之長度為N4個樣本的區段與以錨定位置為中心之相等 長度的區段相關。在一實例中,N4之值為十一個樣本。對 於任務L320而言,可能需要執行正規化相關。 如上所陳述,任務L320可經組態以使用同一搜尋窗口來 找到候選樣本及候選距離。然而,任務L320亦可經組態以 將不同搜尋窗口用於此兩個操作。圖22B展示任務L3 20在 具有大小參數WS1之窗口上執行對候選樣本之搜尋的實 例,且圖22C展示任務L320之同一執行個體在具有為不同 值之大小參數WS2之窗口上執行對候選距離之搜尋的實 例0 任務L302包括一選擇候選樣本及對應於候選距離之樣本 中之一者作為音調峰值的子任務L330。圖23展示任務L330 之實施方案L332的流程圖,該實施方案L332包括子任務 L334 、 L336及L338 。 任務L334測試候選距離。任務L334通常經組態以比較相 關結果與臨限值。對於任務L334而言,亦可能需要比較基 於對應樣本之能量的量度(例如,樣本能量與訊框平均能 量之比)與臨限值。對於已識別僅一個音調脈波之狀況而 144316.doc -48- 201032219 言,任務L334可經組態以驗證候選距離至少等於最小值 (例如,最小容許滯後值,諸如,二十個樣本卜圖24a之 表的諸欄展不基於此等參數之值的四組不同測試條件,該 等參數值可由任務L334之實施方案使用以判定是否接受對 _ 應於候選距離之樣本作為音調峰值。 . 對於任務1^334接受對應於候選距離之樣本作為音調峰值 之狀況而言,若此樣本具有較高振幅(或者,較高量值” φ 則可能需要向左或向右調整峰值位置(例如,一個樣本)β 或者或另外,對於任務L334而言,在此類狀況下可能需要 針對任務L300之其他反覆將窗口大小參數ws之值設定為 較小值(例如,十個樣本)(或將參數WS1及WS2中之一者或 兩者設定為此類值)。若新音調峰值僅為對於訊框確認之 第二者,則對於任務L334而言,亦可能需要按照錯定位置 與峰值位置之間的距離計算當前滯後估計。 任務L302包括一測試候選樣本之子任務I〗%。任務 • U36可經組態以判定樣本能量之量度(例如,樣本能量與 訊框平均能量之比)是否超出(或者,不小於)臨限值。可能 需要取決於對於訊框已確認多少個音調峰值而改變臨限 值。舉例而言,對於任務_而言,可能需要使用較低臨 值(例如T-3)(若對於訊框已確認僅一個音調峰值)且使 用較高臨限值(例如,Τ)(若對於訊框已仙-個以上音調 峰值)。 對於任駐336選擇候選樣本作為第二經確狀音調峰值 之狀況下,對於任務L336而言,亦可能需要基於與終端音 144316.doc -49· 201032219 調峰值之相關的結果而向左或向右調整峰值位置(例如, 一個樣本)^在此狀況下,任務L336可經組態以使以每一 此樣本為中心之長度為N5個樣本的區段與以終端音調峰值 為中心之相等長度的區段相關(在一實例中,N5之值為十 一個樣本)。或者或另外’對於任務L336而言,在此類狀 況下可能需要針對任務L300之其他反覆將窗口大小參數 ws之值設定為較小值(例如,十個樣本)(或將參數ws j及 WS2中之一者或兩者設定為此類值)。 對於測s式任務L3 34及L3 3 6中之兩者已失敗且對於訊框已 確認僅一個音調峰值之狀況而言,任務L3〇2可經組態以 (經由任務L350)使滯後估計乘數瓜之值遞增一,以m之新 值反覆任務L320從而選擇新候選樣本及新候選距離,且對 於新候選者重複任務L332。 如圖23中所示,任務L336可經配置以在候選距離測試任 務L334失敗之後執行。在任務L332之另一實施方案中,候 選樣本測試任務L336可經配置以首先執行,以使得候選距 離測試任務L334僅在任務L3 3 6失敗後執行。 任務L332亦包括一子任務L338。對於測試任務““及 L336中之兩者已失敗且對於訊框已確認一個以上音調峰值 之狀況而s,任務L338測試候選者中之一者或兩者與當前 滯後估計的一致性。 圖24B展示任務L338之實施方案!^338&的流程圖。任務 L338a包括一測試候選距離之子任$L362 ^若候選距離與 當前滞後估計之間的絕對差小於(或者,不大於)臨限值, 144316.doc •50· 201032219 則任務L362接受候選距離。在一實财,臨限值為三個樣 本。對於任務L362而言,亦可能需要驗證相關結果及/或 對應樣本之能量是否為可接受地高。在一此實例中若相 關結果不小於0.35且樣本能量與訊框平均能量之比不小於 ‘ 〇_5,貝,!任務L如接受小於(或者,不大於)臨限值的候選距 . 離。對於任務L362接受候選距離之狀況而言,若此樣本具 有較高振幅(或者,較高量值),則對於任務L362而言,亦 φ 可能需要向左或向右調整峰值位置(例如,_個樣本)。 任務L338a亦包括一測試候選樣本之滯後一致性的子任 務L364。若(A)候選樣本與最接近音調峰值之間的距離與 (B)當前滯後估計之間的絕對差小於(或者,不大於)臨限 值,則任務L364接受候選樣本。在一實例中,臨限值為低 值,諸如兩個樣本。對於任務L364而言,亦可能需要驗證 候選樣本之能量為可接受地高。在一此實例中,若候選樣 本通過滯後一致性測試且若樣本能量與訊框平均能量之比 φ 不小於(T·5) ’則任務L364接受該候選樣本。 展示於圖24Β中之任務L338a的實施方案亦包括另一子任 務L366 ,其對照比任務L364之低臨限值寬鬆之界限測試候 選樣本的滯後一致性。若(A)候選樣本與最接近經確認峰 值之間的距離與(B)當前滯後估計之間的絕對差小於(或 者,不大於)臨限值,則任務L366接受候選樣本。在一實 例中,臨限值為(0.175*滞後)。對於任務L366而言,亦可 能需要驗證候選樣本之能量為可接受地高。在一此實例 中,若樣本能量與訊框平均能量之比不小於(τ·3),則任務 I44316.doc 201032219 L366接受候選樣本。 若候選樣本及候選距離兩者皆未通過所有測試,則任務 L302(經由任務L350)使滯後估計乘數瓜遞增一,以m之新 值反覆任務L320從而選擇新候選樣本及新候選距離,並針 對新候選者重複任務L330直至到達訊框邊界為止。一旦已 „ 確認新音調峰值’便可能需要在同一方向搜尋另一峰值直 至到達訊框邊界為止。在此狀況下,任務L34〇將錨定位置 移動至新音調峰值’並將滯後估計乘數m之值重設為一。 當到達訊框邊界時,可能需要將錨定位置初始化至終端音 0 調峰值位置並在相反方向上重複任務L3〇〇。 滞後估計自一訊框至下一訊框之大減小可指示音調溢位 錯誤。此類錯誤由音調頻率之下降引起,以使得當前訊框 之滯後值超出最大容許滯後值。對於方法M3〇〇而言可 能需要將先前滯後估計與當前滯後估計之間的絕對或相對 差與臨限值(例如,在計算新滯後估計時或在方法結束時) 比較並在彳貞測到錯誤的情況下僅保持訊框的最大音調峰 值。在一實例中,臨限值等於先前滞後估計的5〇%。 © 對於具有兩個具大量值平方比之脈波的分類為瞬變之訊 框(例如,通常接近字之結束的具有大音調改變的訊框)而 . 5 ’可能需要在接受較小峰值作為音調峰值之前在整個當 前印後估計上而非僅在較小窗口上進行相關。此類狀況可 在男性話音中出現’該等男性話音通常具有可在小窗口上 與主峰值良好相關的次峰值。任務L200及L3 00中的一者或 兩者可實施成包括此類操作。 144316.doc •52· 201032219 應明確地注意到,方法M300之滯後估計任務L200可為 與方法M100之滞後估計任務E130相同的任務。應明確地 注意到,方法M300之終端音調峰值定位任務L100可為與 方法Ml00之終端音調峰值位置計算任務E120相同的任 務。對於執行方法Ml00及M300兩者的應用而言,可能需 , 要配置音調脈波形狀選擇任務E110以在結束方法M300後 執行。 圖27A展示經組態以偵測語音信號之訊框的音調峰值之 ^ 裝置MF300之方塊圖。裝置MF300包括用於定位訊框之一 終端音調峰值(例如,參考如上文參考任務L100之各種實 施方案所描述)的構件ML 100。裝置MF300包括用於估計訊 框之一音調滞後(例如,參考如上文參考任務L200之各種 實施方案所描述)的構件ML200。裝置MF300包括用於定位 訊框之額外音調峰值(例如,參考如上文參考任務L300之 各種實施方案所描述)的構件ML300。 φ 圖27B展示經組態以偵測語音信號之訊框的音調峰值之 裝置A300之方塊圖。裝置A300包括一終端音調峰值定位 器A3 10,其經組態以定位訊框之終端音調峰值(例如,參 考如上文參考任務L100之各種實施方案所描述)。裝置 A300包括一音調滯後估計器A320,其經組態以估計訊框 之音調滯後(例如,參考如上文參考任務L200之各種實施 方案所描述)。裝置A300包括一額外音調峰值定位器 A330,其經組態以定位訊框之額外音調峰值(例如,參考 如上文參考任務L300之各種實施方案所描述)。 144316.doc -53- 201032219 圖27C展示經組態以偵測語音信號之訊框的音調峰值之 裝置MF350之方塊圖。裝置MF350包括用於偵測訊框之一 音調峰值(例如,參考如上文參考任務L100之各種實施方 案所描述)的構件ML 150。裝置MF350包括用於選擇一候選 樣本(例如,參考如上文參考任務L320及L320b之各種實施 方案所描述)的構件ML250。裝置MF350包括用於選擇一候 選距離(例如,參考如上文參考任務L320及L320a之各種實 施方案所描述)的構件ML260。裝置MF350包括用於選擇候 選樣本與一對應於候選距離之樣本中之一者作為訊框之一 音調峰值(例如,參考如上文參考任務L330之各種實施方 案所描述)的構件ML350。 圖27D展示經組態以偵測語音信號之訊框的音調峰值之 裝置A350之方塊圖。裝置A350包括一峰值偵測器150,其 經組態以偵測訊框之音調峰值(例如,參考如上文參考任 務L100之各種實施方案所描述)。裝置A350包括一樣本選 擇器250,其經組態以選擇候選樣本(例如,參考如上文參 考任務1320及[32013之各種實施方案所描述)。裝置八3 50包 括一距離選擇器260,其經組態以選擇候選距離(例如,參 考如上文參考任務L320及L320a之各種實施方案所描述)。 裝置A350包括一峰值選擇器350,其經組態以選擇候選樣 本及對應於候選距離之樣本中的一者作為訊框之音調峰值 (例如,參考如上文參考任務L330之各種實施方案所描 述)。 可能需要實施語音編碼器AE10、任務E100、第一訊框 144316.doc -54- 201032219 編碼器議及/或構件FE100以產生一唯一地指示訊框之終 端音調脈波之位置的經編碼之訊框。終端音調脈波之位置 、組合滞後值為解碼可能缺乏該時間同步性資訊之後績訊框 (例如,使用一諸如QPPP之編碼方案編碼之訊框)提供重要 • @相位資訊。亦可能需要將傳達此位置資訊所需之位元之 .數目最小化。雖然通常將需要8個位元(一般而言為 個位兀)來表不16〇位元(一般而言為N位元)訊框中之一唯 • 一—位^,但可使用如本文中所描述之方法來僅以7個位元 (一般而言為Lk^iv」個位元)編碼終端音調脈波之位置。此 方法保留該等7位元值中之—者(例如,127(一般而言為 (2 1)))以用作音調脈波位置模式值。在此描述中,術 語「模式值」指示一參數(例如,音調脈波位置或所估計 之S調週期)的經指派以指示操作模式之改變而並非該參 數之實際值的可能值。 立對於相對於最後樣本(亦即,訊框之最終邊界)給出終端 Φ a調脈波之位置的情形,訊框將匹配以下三種狀況中之一 者: 狀况1 .相對於訊框之最後樣本的終端音調脈波之位置 J於(2 2例如’對於如圖29A中所展示之160位元訊 框,小於127),且訊框含有一個以上音調脈波。在此狀況 下將終端音調脈波之位置編碼成|_1〇g2iv」個位元(7個位 元且亦傳輸音調滯後(例如,以7個位元)。 狀况2 .相對於訊框之最後樣本的終端音調脈波之位置 小於(2LS2Wj_1)(例如,對於如圖29A中所展示之160位元訊 144316.doc -55- 201032219 框,小於127),且訊框僅含有一個音調脈波。在此狀況 下,將終端音調脈波之位置編碼成個位元(例如,7 個位元),且將音調滯後設定為滞後模式值(在此實例中, 為(少。0」_1)(例如,127))。
狀況3 :若相對於訊框之最後樣本的終端音調脈波之位 置大於(2化^」_2)(例如,對於如圖29B中所展示之16〇位元 訊框’大於126) ’則未必可能訊框含有一個以上音調脈 波。對於160位元訊框及8 kHz之取樣率,此將暗示訊框之 約第一個20%中的至少250 Hz之音調下的活動性,在訊框 之剩餘部分中無音調脈波。對於此類訊框而言,將未必可 能分類為一開始訊框。在此狀況下,代替實際脈波位置傳 輸音調脈波位置模式值(例如,如上文所註明之^化〃」-1咬 127),且使用滯後位元來載運關於訊框之第一樣本(亦即, 訊框之初始邊界)的終端音調脈波之位置。一對應解碼器 可經組態以測試經編碼之訊框之位置位元是否指示音調脈 波位置模式值(例如,脈波位置(一心))。若經編碼之訊 框之位置位元指示音調脈波位置模式值,則解碼器可接著 替代地自經編媽之訊框之滞後位元獲得關力訊框之第 本的終端音調脈波之位置。 在如應用於16〇位元訊框之狀況3之情況下,叫固 置係可能的(亦即’ 〇至32)。藉由將該等位置中之—者捨 至另一者(例如’藉由將位置159捨人至位置158 將位置丨27捨入至位置12 或藉 里^ ;』僅以5個位兀來傳輸實降 置,進而使經編碼之訊框之7個滯後位元中的兩者2 144316.doc •56· 201032219 閒以載運其他資訊。將音調脈波位置中之一或多者捨入至 其他音調脈波位置之此類方案亦可用於任何其他長度之訊 框以減少待編碼之唯一音調脈波位置之總數目,可能減少 二分之一(例如’藉由將每一對鄰近位置捨入至用於編碼 之單一位置)或甚至二分之一以上。 圖28展示根據一般組態之方法M500的流程圖,該方法 M500根據上述三種狀況操作。方法m5〇〇經組態以使用1>個 鲁位元編碼q位元訊框中之終端音調脈波之位置,其中^小於 log2 q。在一個如上文所論述之實例中,q等於16〇且^等於 7。可在語音編碼器AE1〇之實施方案内(例如,在任務ei〇〇 之實施方案、第一訊框編碼器1〇〇之實施方案及/或構件 FE100之實施方案内)執行方法M5〇〇。可大體針對^之大於^ 之任何整數值應用此類方法。對於語音應用而言,r通常 具有在6至9(對應於q之自65至1〇23之值)之範圍中之值。 方法M500包括任務T5l〇、丁52〇及153〇。任務Τ5ι〇判定 • 終端音調脈波位置(相對於訊框之最後樣本)是否大於(2r_ 2)(例如,大於〗26)。若結果為真,則訊框匹配上述狀況 3。在此狀況下,任務Τ52〇將終端音調脈波位置位元(例 如,載運經編碼t訊框之封包的終端音調脈波位置位元) •設定為音調脈波位置模式值(例如,如上文所註明之^“或 127)且設定滯後位元(例如,該封包之滯後位元)等於相對 於訊框之第一樣本的終端音調脈波之位置。 若任務T510之結果為假,則任務T53〇判定訊框是否僅含 有-個音調脈波。若任務了53()之結果為真1㈣匹配上 144316.doc •57- 201032219 述狀況2,且不需 將滯後位元(例如 (例如,2r-l)。 要傳輪滞後值。在此狀況下,任務T54〇 4封包之滯後位元)設定為滯後模式值 右任務Τ530之結杲Α 且相對於訊框y束^’則訊框含有—個以上音調脈波 (例如,不大於126)。端音調脈波之位置不大於(Μ T5 ' 類訊框匹配上述狀況1,且任務 對=元編碼該位置且將滞後值編碼成滞後位元。 波之位樣本(亦即,初始邊界)給出終端音調脈 及之位置的情形而古, 。讯框將匹配以下三種狀況甲之一 者: 狀况1相對於訊框之第—樣本的終端音調脈波之位置 (Ν_21。’(例如’對於如圖29C中所展示之160位元訊 杷大於32) ’且訊框含有一個以上音調脈波。在此狀況 下’將終端音調脈波之位置負(Ν. 編碼成位 疋(例如’ 7個位元),且亦傳輸音調滞後(例如,以 元)。 狀况2 .相對於訊框之第一樣本的終端音調脈波之位置 大於(Ν- 2LbgM)(例如,對於如圖29C中所展示之16〇位元訊 框,大於32),且訊框僅含有一個音調脈波。在此狀況 下,將終端音調脈波之位置負(N_ 2^〃」)編碼成Ll〇g2叫個位 凡(例如,7個位元),且將音調滯後設定為滞後模式值(在 此實例中,為2Ll°g2"」-l(例如,127))。 狀況3 :若終端音調脈波之位置不大於(N_ 2Lu>g2〃」)(例如, 對於如圖29D中所展示之160位元訊框,不大於32),則未 144316.doc -58· 201032219 =可能訊框含有-個以上音調脈波。對於胸立元訊框及8 取樣率,此將暗示訊框之約第-個2㈣的至少250 Hz之音調下的活動性,在訊 對於此類訊框而言,將未必可中無^調脈波。 月匕刀類為開始訊框。在此狀 I】代替實際脈波位置傳輸音調脈波位置模式值⑷ 2 ’ 2^或127)’且使特後位元來傳輸關於訊框之第 一樣本(亦即,初始邊界)的終料調脈波之位置…對應 解碼器可馳態以測試朗碼之肺之位置位元是否指示 音調脈波位置模式值(例如,脈波位置(2卜」-⑶。若唾編 碼之訊框之位置位元指示音調脈波位置模式值,則解碼写 可接著替代地自經編碼之訊框之滯後位元獲得關於訊框之 第一樣本的終端音調脈波之位置。 在如應用於16〇位元訊框之狀況3的情況下,Μ個此等位 置係可能的(0至32)。藉由將該等位置中之一者捨入至另一 者(例如,藉由將位置〇捨入至位置i5戈藉由將位置辦 入至位置31)’ ▼僅以5個位元來傳輸實際位置,進而使經 編碼之訊框之7個滞後位元中的兩者保持空閒以載運其他 資訊。將脈波位置中之一或多者捨入至其他脈波位置之此 類方案亦可用於任何其他長度之訊框以減少待編碼之唯— 位置之總數目,可能減少二分之一(例如,藉由將每一對 鄰近位置捨入至用於編碼之單一位置)或甚至二分之一以 上。熟習此項技術者將認識到,可針對相對於第一樣本給 出終端音調脈波之位置的情形修改方法M5〇〇。 圖30A展示根據一般組態的處理語音信號訊框之方法 1443I6.doc -59- 201032219 M400的流程圖’該方法M4〇〇包括任務趵1〇及£32〇。可在 語音編碼器AE10之實施方案内(例如,在任務£1〇〇之實施 方案、第一訊框編碼器1〇〇之實施方案及/或構件FE1〇〇2 實施方案内)執行方法M400。任務E3 10計算第一語音信號 訊框内之一位置(「第一位置」)。該第一位置為關於該訊 框之最後樣本(或者,關於該訊框之第一樣本)的該訊框之 終端音調脈波之位置。任務E310可實施為如本文中所描述 之脈波位置計算任務E120或L100之執行個體。任務E32〇 產生一載運第一語音信號訊框且包括第一位置之第一封 包。 方法M400亦包括任務£330及E340。任務E330計算第二 語音信號訊框内之一位置(「第二位置」)。該第二位置為 關於(A)該訊框之第一樣本及該訊框之最後樣本中的一 者的該訊框之終端音調脈波之位置。任務E33〇可實施為如 本文中所描述之脈波位置計算任務E12〇之執行個體。任務 E340產生載運第一語音信號訊框且包括訊框内之第三位 置之第一封包。該第三位置為關於訊框之第一樣本及訊框 之最後樣本中的另一者的終端音調脈波之位置。換言之, 若任務E330計算關於最後樣本之第二位置,則第三位置係 關於第一樣本,且若任務E33〇計算關於第一樣本之第二位 置,則第三位置係關於最後樣本。 在一特定實例中’第一位置為關於訊框之最終樣本的第 一語音信號訊框之最終音調脈波之位置,第二位置為關於 訊框之最終樣本的第二語音信號訊框之最終音調脈波之位 144316.doc 201032219 置,且第三位置為關於訊框之第—樣本的第二語音信號訊 框之最終音調脈波之位置。 由方法M400處理之語音信號訊框通常為—Lpc殘差信號 之訊框。第一及第二語音信號訊框可來自同一話音通信會 話或可來自不同話音通信會話。舉例而言,第一及第二語 音信號訊框可來自由一人說出之語音信號或可來自各自由° -不同的人說出之兩個不同語音信號。語音信號訊框可在
計算音調1波位置之前及/或之後經歷其他處理操作(例 如,感知加權)。 對於第-封包與第二封包兩者而言,可能需要符合指示 不同資訊項的在封包内之對應位置的封包描述(亦稱為封 包模板)產生封包之操作(例如,如由任務E320及E340 執行)可包括根據此類封包模板將不同資訊項寫入至一緩 衝器。可能需要根據此類模板產生一封包以促進封包之解 碼(例如,藉由根據由封包載運之值在封包内之位置使該 等值與對應參數相關聯)。 封包模板之長度可等於經編碼之訊框之長度(例如,對 於四分之一速率編碼方案,為4〇個位元)。在一此實例 中,封包模板包括一用以指示LSp值及編碼模式之17位元 區域、一用以指示終端音調脈波之位置之7位元區域、一 用以指示所估計之音調週期之7位元區域、一用於指示脈 波形狀之7位元區域及一用以指示增益概況之2位元區域。 其他實例包括用於LSP值之區域較小且用於增益概況之區 域對應地較大的模板。或者,封包模板可比經編碼之訊框 144316.doc -61 · 201032219 長(例如,對於封包載運―個以上經編碼之訊框之狀況)。 -封包產生操作或-經組態以執行此類操作之封包產生号 亦可經組“產生不同長度之封包(例如’對於某一訊框 資訊不如其他訊框資訊頻繁地編碼之狀況卜 在-通用狀況下’方法M400經實施以使用一包括第一 及第二組位元位置之封包模板。在此類狀況下,任務刪 可經組態以產生第—封包以使得第—位置占用第—組位元 位置,且任務E340可經組態以產生第二封包以使得第三位 置占用第二組位元位置。對於第—組位元位置與第二組位 元位置而言,可能需要不相交(亦即,以使得無封包之位 元在兩、且中)。圖31A展示包括不相交之第一組位元位置及 第二組位元位置之封包模板PT1〇的實例。在此實例中,第 一組及第二組中之每一者為一連續位元位置系列。然而, 大體而言,一組内之位元位置不需要鄰近於彼此。圖3ΐΒ 展示包括不相交之第一組位元位置及第二組位元位置之另 一封包模板ΡΤ20的實例。在此實例中,第一組包括彼此由 一或多個其他位元位置分離之兩個位元位置系列。封包模 板中之兩組不相交之位元位置甚至可至少部分地交錯,如 (例如)圖31C中所說明。 圖30Β展示方法Μ400之實施方案Μ410之流程圖。方法 Μ410包括比較第一位置與一臨限值之任務ε35〇。任務 Ε350產生一在第一位置小於該臨限值時具有第一狀態且在 第一位置大於該臨限值時具有第二狀態之結果。在此狀況 下’任務Ε320可經組態以回應於具有第一狀態之任務Ε35〇 144316.doc -62- 201032219 之結果產生第一封包。 在一實例中,任務E350之結果在第一位置小於臨限值時 具有第一狀態且在其他情況下(亦即,在第一位置不小於 臨限值時)具有第二狀態。在另一實例中,任務E35〇之結 果在第一位置不大於臨限值時具有第一狀態且在其他情況 下(亦即,在第一位置大於臨限值時)具有第二狀態。任務 E350可實施為如本文中所描述之任務T51〇之執行個體。 ⑩ 圖3〇C展示方法Μ410之實施方案Μ420之流程圖。方法 Μ420包括比較第二位置與臨限值之任務Ε36〇。任務Ε36〇 產生一在第二位置小於該臨限值時具有第一狀態且在第二 位置大於該臨限值時具有第二狀態之結果。在此狀況下, 任務Ε340可經組態以回應於具有第二狀態之任務Ε36〇之結 果產生第二封包。 在—實例中,任務Ε360之結果在第二位置小於臨限值時 具有第一狀態且在其他情況下(亦即,在第二位置不小於 • 臨限值時)具有第二狀態。在另一實例中,任務Ε360之結 果在第二位置不大於臨限值時具有第一狀態且在其他情況 下(亦即,在第二位置大於臨限值時)具有第二狀態。任務 Ε360可實施為如本文中所描述之任務Τ51〇之執行個體。 方法Μ400通常經組態以基於第二位置來獲得第三位 置。舉例而言,方法Μ400可包括一藉由自訊框長度減去 第二位置且遞減結果或藉由自一比訊框長度之值小一之值 減去第二位置或藉由執行基於第二位置及訊框長度之另一 操作4算第二位置的任務。然而,方法Μ4〇〇可以其他方 144316.doc -63 - 201032219 式組態以根據本文中所描述(例如,參考任務E120)之音調 脈波位置計算操作中之任一者獲得第三位置。 圖32A展示方法M400之實施方案M430之流程圖。方法 M430包括估計訊框之一音調週期之任務E370。任務E370 可實施為如本文中所描述之音調週期估計任務E130或L200 之執行個體。在此狀況下,封包產生任務E320經實施以使 得第一封包包括一指示所估計之音調週期的經編碼之音調 週期值。舉例而言,任務E320可經組態以使得經編碼之音 調週期值占用封包之第二組位元位置。方法M430可經組 態以計算經編碼之音調週期值(例如,在任務E370内)以使 得其將所估計之音調週期指示為一相對於最小音調週期值 (例如,20)之偏移。舉例而言,方法M43 0(例如,任務 E3 70)可經組態以藉由自所估計之音調週期減去最小音調 週期值計算經編碼之音調週期值。 圖32B展示方法M430之實施方案M440之流程圖,該實 施方案M440亦包括如本文中所描述之比較任務E350。圖 32C展示方法M440之實施方案M450之流程圖,該實施方 M450亦包括如本文中所描述之比較任務E360。 圖33 A展示經組態以處理語音信號訊框之裝置MF400的 方塊圖。裝置MF400包括用於計算第一位置(例如,如上文 參考任務E310、E120及/或L100之各種實施方案所描述)的 構件FE3 10及用於產生第一封包(例如,如上文參考任務 E3 20之各種實施方案所描述)的構件FE320。裝置MF400包 括用於計算第二位置(例如,如上文參考任務E330、E120 144316.doc -64 - 201032219 及/或L100之各種實施方案所描述)的構件FE330及用於產 生第二封包(例如,如上文參考任務E340之各種實施方案 所描述)的構件FE340。裝置MF400亦可包括用於計算第三 位置(例如,如上文參考方法M400所描述)的構件。 ; 圖33B展示裝置MF400之實施方案MF410的方塊圖,該 實施方案MF410亦包括用於比較第一位置與一臨限值(例 如,如上文參考任務E350之各種實施方案所描述)的構件 FE350。圖33C展示裝置MF410之實施方案MF420的方塊 φ 圖,該實施方案MF420亦包括用於比較第二位置與臨限值 (例如,如上文參考任務E360之各種實施方案所描述)的構 件FE360。 圖34A展示裝置MF400之實施方案MF430之方塊圖。裝 置MF430包括用於估計第一訊框之一音調週期(例如,如上 文參考任務E370、E130及/或L200之各種實施方案所描述) 的構件FE3 70。圖34B展示裝置MF430之實施方案MF440之 0 方塊圖,該實施方案MF440包括構件FE350。圖34C展示裝 置MF440之實施方案MF450之方塊圖,該實施方案MF450 包括構件FE360。 . 圖35A展示根據一般組態的用於處理語音信號訊框之裝 置(例如,訊框編碼器)A400的方塊圖,該裝置A400包括一 音調脈波位置計算器160及一封包產生器170。音調脈波位 置計算器160經組態以計算第一語音信號訊框内之第一位 置(例如,如上文參考任務E310、E120及/或L100所描述) 且計算第二語音信號訊框内之第二位置(例如,如上文參 144316.doc -65- 201032219 考任務E330、E120及/或Ll〇〇所描述)。舉例而言,音調脈 波位置計算器160可實施為如本文中所描述之音調脈波位 置計算器120或終端峰值定位器A3 1〇之執 生器⑺經組態以產生-表示第-語音信號訊框且^ 一位置之第一封包(例如,如上文參考任務E32〇所描述)且 產生一表示第二語音信號訊框且包括第二語音信號訊框内 之第三位置之第二封包(例如,如上文參考任務E34〇所描 述)。 封包產生器170可經組態以產生一包括指示經編碼之訊 框之其他參數值(諸如,編碼模式、脈波形狀、一或多個 LSP向量及/或增益概況)的資訊的封包。封包產生器17〇可 經組態以自裝置A400之其他元件及/或自一包括裝置A4〇〇 之器件之其他元件接收此資訊。舉例而言,裝置A400可經 組態以執行LPC分析(例如,以產生語音信號訊框)或自另 一兀件(諸如,殘差產生器R10之執行個體)接收LPC分析參 數(例如,一或多個LSP向量)。 圖35B展示裝置A400之實施方案A4〇2之方塊圖,該實施 方案A402亦包括一比較器18〇0比較器18〇經組態以比較第 一位置與一臨限值並產生一在第一位置小於該臨限值時具 有第一狀態且在第一位置大於該臨限值時具有第二狀態之 第一輸出(例如,如上文參考任務E35〇之各種實施方案所 描述)。在此狀況下’封包產生器1 7〇可經組態以回應於具 有第一狀態之第一輸出而產生第一封包。 比較器1 80亦可經組態以比較第二位置與臨限值並產生 144316.doc •66· 201032219 在第一位置小於該臨限值時具有第一狀態且在第二位置 大於該臨p艮值時具有第二狀態之第二輸出(例如,如上文 參考任務E360之各種實施方案所描述)。在此狀況下封 包產生器170可經組態以回應於具有第二狀態之第二輸出 而產生第二封包。
圖35(:展不裝置A400之實拖方案A4〇4之方塊圖,該實施 方案A404包括-經組態以估計第—語音信號訊框之一音調 週期(例如,如上文參考任務E37〇、E13〇及/或^⑼所描 述)之曰調週期估汁器190。舉例而言,音調週期估計器 19〇可實施為如本文中所描述之音調估計m戈音調 滯後估計器A320之執行個體。在此狀況下,封包產生器 170經組態以產生第一封包以使得指示所估計之音調週期 之一組位兀占用第二組位元位置。圖35D展示裝置八4〇2之 實施方案A406之方塊圖,該實施方案A4〇6包括音調週期 估計器190。 語音編碼器AE10可實施成包括裝置A4〇〇。舉例而言, 語音編碼器AE20之第一訊框編碼器1〇4可實施成包括裝置 A400之執行個體以使得音調脈波位置計算器12〇亦充當計 算器160(音調週期估計器13〇可能亦充當估計器19〇)。 圖36A展示根據一般組態的解碼經編碼之訊框(例如,封 包)之方法M550的流程圖。方法M55〇包括任務D3〇5、 D310、D320、D330、D340、D350,及〇360。任務 D3〇5 自經編碼之訊框提取值p及L。對於經編碼之訊框符合如本 文中所描述之封包模板的狀況而言,任務D3〇5可經組態以 1443I6.doc -67- 201032219 自經編碼之訊框之第一組位元位置提取p且自經編碼之訊 框之第二組位元位置提取L。任務D310比較p與—音調位 置模式值。若P等於該音調位置模式值,則任務〇32()自L 獲得一相對於經解碼之訊框的第一樣本及最後樣本中之一 者的脈波位置。任務D320亦將值1指派給訊框中之脈波之 數目N。若P不等於該音調位置模式值,則任務〇33〇自卩獲 得一相對於經解碼之訊框的第一樣本及最後樣本中之另一 者的脈波位置。任務D340比較L與一音調週期模式值。若 L等於該音調週期模式值,則任務〇35〇將值i指派給訊框 中之脈波之數目N。否則,任務£)360自1^獲得一音調週期 值。在一實例中,任務D360經組態以藉由將一最小音調週 期值與L相加來計算音調週期值。如本文中所描述之訊框 解碼器300或構件FD100可經組態以執行方法M55〇。 圖37展示根據一般組態之解碼封包之方法M56〇的流程 圖,該方法M560包括任務D4i〇、D42(^D43〇。任務D41〇 自第一封包(例如,如由方法M400之實施方案產生)提取第 一值。對於第一封包符合如本文中所描述之模板的狀況而 言,任務D410可經組態以自該封包之第一組位元位置提取 第一值。任務D420比較第一值與一音調脈波位置模式值。 任務D420可經組態以產生一在第一值等於該音調脈波位置 模式值時具有第一狀態且否則具有第二狀態之結果。任務 D430根據第一值將一音調脈波配置於第一激勵信號内。任 務D430可實施為如本文中所描述之任務DU〇之執行個體 且可經組態以回應於任務D42〇之結果具有第二狀態而執 144316.doc -68- 201032219 行。任務D430可經組態以將音調脈波配置於第一激勵信號 内以使得相對於第一樣本及最後樣本中之一者的音調脈波 之峰值之位置與第一值一致。 方法M560亦包括任務D440、D450、D460及D470。任務 D440自第二封包提取第二值。對於第二封包符合如本文中 所描述之模板的狀況而言,任務D440可經組態以自該封包 之第一組位元位置提取第二值。任務D47〇自第二封包提取 第二值。對於封包符合如本文中所描述之模板的狀況而 言,任務D470可經組態以自該封包之第二組位元位置提取 第二值。任務D450比較第二值與音調脈波位置模式值。任 務D450可經組態以產生一在第二值等於該音調脈波位置模 式值時具有第一狀態且否則具有第二狀態之結果。任務 D460根據第二值將一音調脈波配置於第二激勵信號内。任 務D460可實施為如本文中所描述之任務DU〇之另一執行 個體且可經組態以回應於任務D45〇之結果具有第一狀態而 執行。 任務D460可經組態以將音調脈波配置於第二激勵信號内 以使得相對於第一樣本及最後樣本中之另一者的音調脈波 之峰值之位置與第三值一致。舉例而言,若任務D43〇將一 音調脈波配置於第一激勵信號内以使得相對於第一激勵信 號之最後樣本的音調脈波之峰值之位置與第一值一致,則 任務D460可經組態以將一音調脈波配置於第二激勵信號内 以使彳于相對於第二激勵信號之第一樣本的音調脈波之峰值 之位置與第二值一致,且反之亦然。如本文中所描述之訊 144316.doc -69· 201032219 框解碼器300或構件FD100可經組態以執行方法M560。 圖38展示方法M560之實施方案M570之流程圖,該實施 方案M570包括任務D480及D490。任務D480自第一封包提 取第四值。對於第一封包符合如本文中所描述之模板的狀 況而言,任務D480可經組態以自該封包之第二組位元位置 提取第四值(例如,經編碼之音調週期值)。基於第四值, 任務D490將另一音調脈波(「第二音調脈波」)配置於第一 激勵信號内。任務D490亦可經組態以基於第一值將第二音 調脈波配置於第一激勵信號内。舉例而言,任務D490可經 組態以相對於第一經配置之音調脈波將第二音調脈波配置 於第一激勵信號内。任務D490可實施為如本文中所描述之 任務D120之執行個體。 任務D490可經組態以配置第二音調峰值以使得兩個音調 峰值之間的距離等於基於第四值之音調週期值。在此狀況 下,任務D480或任務D490可經組態以計算該音調週期 值。舉例而言,任務D480或任務D490可經組態以藉由將 最小音調週期值與第四值相加來計算音調週期值。 圖39展示用於解碼封包之裝置MF560的方塊圖。裝置 MF560包括用於自第一封包提取第一值(例如,如上文參考 任務D410之各種實施方案所描述)的構件FD410、用於比 較第一值與一音調脈波位置模式值(例如,如上文參考任 務D420之各種實施方案所描述)的構件FD420及用於根據 第一值將一音調脈波配置於第一激勵信號内(例如,如上 文參考任務D430之各種實施方案所描述)的構件FD430。 144316.doc •70- 201032219 構件FD430可實施為如本文中所描述的構件FD110之執行 個體。裝置MF560亦包括用於自第二封包提取第二值(例 如,如上文參考任務D440之各種實施方案所描述)的構件 FD440、用於自第二封包提取第三值(例如,如上文參考任 務D470之各種實施方案所描述)的構件FD470、用於比較 第二值與音調脈波位置模式值(例如,如上文參考任務 D450之各種實施方案所描述)的構件FD450及用於根據第 三值將一音調脈波配置於第二激勵信號内(例如,如上文 參考任務D460之各種實施方案所描述)的構件FD460。構 件FD460可實施為構件FD110之另一執行個體。 圖40展示裝置MF560之實施方案MF570之方塊圖。裝置 MF5 70包括用於自第一封包提取第四值(例如,如上文參考 任務D480之各種實施方案所描述)的構件FD480及用於基 於第四值將另一音調脈波配置於第一激勵信號内(例如, 如上文參考任務D490之各種實施方案所描述)的構件 FD490 〇構件FD490可實施為如本文中所描述的構件FD120 之執行個體。 圖36B展示用於解碼封包之裝置A560的方塊圖。裝置 A5 60包括一經組態以自第一封包提取第一值(例如,如上 文參考任務D410之各種實施方案所描述)之封包剖析器 510、一經組態以比較第一值與一音調脈波位置模式值(例 如,如上文參考任務D420之各種實施方案所描述)之比較 器520及一經組態以根據第一值將一音調脈波配置於第一 激勵信號内(例如,如上文參考任務D430之各種實施方案 144316.doc -71 - 201032219 所描述)之激勵信號產生器530 ^封包剖析器510亦經組態 以自第二封包提取第二值(例如’如上文參考任務D440之 各種實施方案所描述)且自第二封包提取第三值(例如,如 上文參考任務D470之各種實施方案所描述ρ比較器52〇亦 經組態以比較第二值與音調脈波位置模式值(例如,如上 . 文參考任務D450之各種實施方案所描述)。激勵信號產生 - 器53 0亦經組態以根據第三值將一音調脈波配置於第二激 勵信號内(例如’如上文參考任務〇46〇之各種實施方案所 描述)。激勵信號產生器530可實施為如本文中所描述之第 G 一激勵信號產生器310之執行個體。 在裝置A560之另一實施方案中,封包剖析器51〇亦經組 態以自第一封包提取第四值(例如’如上文參考任務D4 8 〇 之各種實施方案所描述),且激勵信號產生器53〇亦經組態 以基於第四值將另一音調脈波配置於第一激勵信號内(例 如,如上文參考任務D490之各種實施方案所描述)。 語音解碼器AD10可實施成包括裝置a560。舉例而言, 語音解碼器AD20之第一訊框解碼器3〇4可實施成包括裝置 © A560之執行個體以使得第一激勵信號產生器31〇亦充當激 勵信號產生器530。 . . 四分之一速率實現每訊框40個位元。在如由編碼任務 E100、編碼器1〇〇或構件FE1〇〇之實施方案應用之轉換訊框 編碼格式(例如,封包模板)的一實例中,一丨7位元區域用 以扣示LSP值及編碼模式,一 7位元區域用以指示終端音調 脈波之位置,一 7位元區域用以指示滞後,一 7位元區域用 144316.doc -72· 201032219 以指不脈波形狀,且一 2位元區域用以指示增益概況。其 他實例包括用於Lsp值之區域較小且用於增益概況之區域 對應地較大的格式。 . 一對應解喝器(例如,解碼器300或560或構件FD100或 MF56〇的實施方案或執行解碼方法M550或M560或解碼任 務D1 〇〇之實化方案之器件)可經組態以藉由將所指示之脈 波形狀向量複製至由終端音調脈波位置及滯後值指示之位 φ 置中之每者且根據增益VQ表輸出按比例調整所得信號 而自脈波形狀VQ表輸出建構一激勵信號。對於所指示之 脈波形狀向量比滞後值長之狀況而言,可藉由將每-對重 叠值平均、藉由選擇每一對中之一值(例如,最高值或最 低值,或屬於左側或右侧之脈波之值)或藉由簡單地廢除 超過滯後值之樣本來處置鄰近脈波之間的任何重疊。類似 地’當配置一激勵信號之第一音調脈波或最後音調脈波 (❹’根據一音調脈波峰值位置及/或-滯後估計)時,可 籲冑落在訊框邊界外部之任何樣本與鄰近訊框之對應樣本平 均或簡單地將其廢除。 —激勵信號之音調脈波並不簡單為脈衝或尖峰。實情 為,-音調脈波通常具有一取決於說話者的隨時間而變之 振幅概況或形狀,且保存此形狀對於說話者辨識可為重要 的。可能需要編碼音調脈波形狀之一良好表示以充冬用於 後續有聲訊框之參考(例如,原型)。 田、 :調脈波之形狀提供對於說話者識別及辨識而言感知上 重要之資訊。為了將此資訊提供至解碼器,一轉換訊框编 144316.doc •73- 201032219 碼模式(例如,如由任務E100、編碼器1〇〇或構件fei〇〇之 方案執行)可經組態以在經編碼之訊框中包括音調脈 波形狀資訊。編碼音調脈波形狀可呈現量化維度可變之向 量的問題。舉例而言,殘差中之音調週期之長度及因此的 音調脈波之長度可在—寬範圍上變化。在如上文所描述之 實例中,容許音調滞後值在20至146個樣本之範圍内。 可能需要編碼一音調脈波之形狀而並不將該脈波轉換成 頻域。圖41展示根據一般組態之編碼訊框之方法M6〇〇的 流程圖,該方法M600可在任務£1〇〇之實施方案内、由第 一訊框編碼器100之實施方案及/或由構件FE100之實施方 案執行。方法M600包括任務T61〇、T62〇、T63〇、T64〇及 Τ650。任務Τ610取決於訊框具有單一音調脈波或是多個音 調脈波而選擇兩個處理路徑中之一者。在執行任務τ6ι〇之 月'J,可能需要至少足夠地執行用於偵測音調脈波之方法 (例如,方法Μ300)以判定訊框具有單一音調脈波或是多個 音調脈波。 對於單脈波訊框而言,任務Τ62〇選擇一組不同單脈波向 量量化(VQ)表中之一者。在此實例中,任務Τ62〇經組態以 根據訊框内之音調脈波之位置(例如,如由任務£12〇或 L100、構件FE120或ML100、音調脈波位置計算器120或終 端峰值定位器Α310計算)選擇Vq表。任務Τ63〇接著藉由選 擇選定之VQ表之一向量(例如,藉由找到選定之表内之 最佳匹配且輸出對應索引)來量化脈波形狀。 任務Τ630可經組態以選擇能量最接近於待匹配之脈波形 144316.doc -74· 201032219 狀之能量的脈波形狀向量。待匹配之脈波形狀可為整個訊 才c或〇括峰值之訊框之某一較小部分(例如,峰值之苹一 距離(諸如,訊框長度之四分之一)内之區段)。在執行匹配 操作之如,可能需要將待匹配之脈波形狀之振幅正規化。 在一實例中,任務T630經組態以計算待匹配之脈波形狀 與選定之表之每一脈波形狀向量之間的差,且選擇具有最 小能量之對應於該差之脈波形狀向量。在另一實例中任 務T63 0經組態以選擇能量最接近於待匹配之脈波形狀之能 量的脈波形狀向量。在此等狀況下,可按照平方樣本之總 和计算一序列樣本(諸如,一音調脈波或其他向量)之能 量。任務T630可實施為如本文中所描述之脈波形狀選擇任 務E110之執行個體。 該、A單脈波VQ表中之每一表具有可與訊框之長度(例 如,160個樣本)一樣大之向量維度。對於每一表而言可 能需要具有與待與此表中之向量匹配之脈波形狀相同的向 量維度。在一特定實例中,該組單脈波VQ表包括三個 表,每一表具有高達128個條目,以使得脈波形狀可編碼 為7位元索引。 一對應解碼器(例如’解碼器3〇〇、MF560或A56〇或 FD1〇〇的實施方案或執行解碼任務D100或方法M560之實施 方案之器件)可經組態以在經編碼之訊框之脈波位置值(例 如’如由如本文中所描述之提取任務D3〇5或D44〇、構件 FD440或封包剖析器51〇判定)等於一音調脈波位置模式值 (例如,(2r-l)或127)時將一訊框識別為單脈波。此類決策 144316.doc -75· 201032219 可基於如本文中所描述之比較任務〇31〇或D45〇、構件 FD450或比較器520之一輸出。或者或另外,此類解碼器可 經組態以在滯後值等於一音調週期模式值(例如,(2、1}或 127)時將一訊框識別為單脈波。 任務T640自多脈波訊框提取待匹配之至少一音調脈波。 舉例而言,任務T640可經組態以提取具有最大增益之音調 脈波(例如,含有最高峰值之音調脈波)。對於所提取之音 調脈波之長度而言,可能需要等於所估計之音調週期(如 (例如)由任務E370、E130或L200計算)。當提取脈波時,鲁 可旎需要確保該峰值並非所提取之脈波之第一樣本或最後 樣本(此可導致一或多個重要樣本之不連續性及/或省略)。 在一狀況下,對於s吾音品質而言,峰值之後之資訊可能 比峰值之前之資訊重要,因此可能需要提取脈波以使得峰 值靠近開始。在一實例中,任務T64〇自於音調峰值之前的 兩個樣本開始的音調週期提取形狀。此類做法允許俘獲在 峰值之後出現且可能含有重要形狀資訊的樣本。在另一實
例中,可能需要俘獲峰值之前的亦可能含有重要資訊的更 G 多樣本。在另一實例中,任務丁640經組態以提取以該峰值 為中心之音調週期。對於任務Τ640而言’可能需要自訊框 : ^取個以上音調脈波(例如’提取具有最高峰值之兩個 . 音調脈波)且自所提取之音調脈波計算待匹配之平均脈波 形狀。對於任務Τ64〇及/或任務T66〇而言,可能需要在執 行脈波形狀向量選擇之前將待匹配之脈波形狀的振幅正規 化0 1443l6.doi -76 - 201032219 對於多脈波訊框而言,任務T650基於滞後值(或所提取 之原型之長度)選擇一脈波形狀乂卩表。可能需要提供一組9 個或10個脈波形狀VQ表以編碼多脈波訊框。該組VQ表中 之每一者具有一不同的向量維度且與一不同的滯後範圍或 「頻率區間」相關聯。在此狀況下,任務Τ650判定哪一頻 率區間含有當前所估計之音調週期(如(例如)由任務Ε370 ' Ε130或L200計算)且選擇對應於此頻率區間之vQ表。若當 前所估計之音調週期等於1〇5個樣本,貝彳(例如)任務τ65〇 可選擇—對應於—包括101至11G個樣本之滯後範圍之頻率 區間的VQ^ °在—實例中,多脈波脈波形狀VQ表中之每 一者具有高達128個條目,以使得脈波形狀可編碼為7位元 索引。it f ’ VQ表中之所有脈波形狀向量將具有相同向 量維度,而該等Vq表中之每一者通常將具有不同向量維 度(例如,等於對應頻率區間之滞後範圍中之最大值 任務T660藉由選擇選定之VQ表之一向量(例如,藉由尋 找選定之VQ表内之最佳匹配且輸出一對應索引)量化脈波 形狀。因為待量化之脈波形狀之長度可能不確切匹配表條 目之長度,所以任務Τ66〇可經组態以在自表選擇最佳匹配 之前對脈波形狀(例如,在結束處)填零以匹配對應表向量 大小或者或另外,任務Τ660可經組態以在自表選擇最佳 匹配之前將脈波形狀截斷以匹配對應表向量大小。 可以均勻方式或以非均勻方式將可能的(容許)滞後值之 範圍劃;9成頻率區間。在.如圖42Α中所說明之均勻劃分之 一實例中,將20至146個樣本之滯後範圍劃分成以下九個 144316.doc -77- 201032219 頻率區間:20-33、34-47、48-61、62-75、76-89、90-103、104-117、118-131 及 132-146個樣本。在此實例中, 所有頻率區間具有14個樣本之寬度(除了具有15個樣本之 寬度之最後頻率區間之外)。 如上文所闡述之均勻劃分可在高音調頻率下導致降低之 品質(與低音調頻率下之品質相比)。在上述實例中,任務 T660可經組態以在匹配之前使一具有2〇個樣本之長度之音 調脈波延伸(例如’填零)65%,而一具有132個樣本之長度 之音調脈波可能僅延伸(例如,填零)〗1%。使用非均勻劃 分之一潛在優點係使不同滞後頻率區間中等化最大的相對 延伸。在如圖42B中所說明之非均勻劃分之一實例中,將 20至146個樣本之滯後範圍劃分成以下九個頻率區間:2〇_ 23 、 24-29 、 30-37 、 38_47 、 48-60 、 61-76 、 77-96 、 97-120 及121-146個樣本。在此狀況下,任務T66〇可經組態以在 匹配之前使一具有20個樣本之長度之音調脈波延伸(例 如’填零)15%且使一具有121個樣本之長度之音調脈波延 伸(例如,填零)21%。在此劃分方案中,20-146個樣本之 範圍中的任何音調脈波之最大延伸僅為25%。 一對應解碼器(例如,解碼器300、MF 560或A5 60或構件 FD100的實施方案或執行解碼任務D1〇〇或方法M56〇之實施 方案之器件)可經組態以自經編碼之訊框獲得一滯後值及 一脈波形狀索引值’使用該滯後值選擇適當脈波形狀VQ 表’且使用該脈波形狀索引值自選定之脈波形狀VQ表選 擇所要之脈波形狀。 1443l6.doc • 78- 201032219 圖43 A展示根據一般組態的編碼音調脈波之形狀之方法 M650的流程圖,該方法M650包括任務E410、E420及
E430。任務E410估計一語音信號訊框(例如,一 Lpc殘差 之訊框)之一音調週期。任務E410可實施為如本文中所^ 述之音調週期估計任務E130、L200及/或E3 70之執行個 體。基於所估計之音調週期’任務E420選擇脈波形狀向量 之複數個表中之一者。任務E420可實施為如本文中所描述 之任務T650之執行個體。基於來自語音信號訊框之至少— 音調脈波之資訊’任務E430在脈波形狀向量之選定之表中 選擇一脈波形狀向量。任務E430可實施為如本文中所描述 之任務T660之執行個體。 表選擇任務E420可經組態以比較一基於所估計之音調週 期之值與複數個不同值_之每一者。為了判定如本文中所 描述之一組滯後範圍頻率區間中的哪一者包括所估計之音 調週期’(例如)任務E420可經組態以比較所估計之音調週 期與該組頻率區間中之兩個或兩個以上中之每一者的上限 (或下限)。 向量選擇任務E430可經組態以在脈波形狀向量之選定之 表中選擇能量最接近於待匹配之音調脈波之能量的脈波形 狀向量。在一實例中,任務E430經組態以計算待匹配之音 調脈波與選定之表之每一脈波形狀向量之間的差,且選擇 具有最小能量之對應於該差之脈波形狀向量。在另一實例 中’任務E43 0經組態以選擇能量最接近於待匹配之音調脈 波之能篁的脈波形狀向量。在此等狀況下,可按照平方樣 144316.doc -79- 201032219 本之總和計算一序列樣本(諸如,一音調脈波或其他向量) 之能量。 圖43B展示方法M650之實施方案M660之流程圖,該實 施方案M660包括任務E440。任務E440產生一包括(A)基於 所估計之音調週期之第一值及(B)識別選定之表中的選定 之脈波形狀向量之第二值(例如,表索引)的封包。第一值 可將所估計之音調週期指示為一相對於最小音調週期值 (例如,20)之偏移。舉例而言,方法M660(例如,任務 E41 0)可經組態以藉由自所估計之音調週期減去最小音調 週期值計算第一值。 任務E440可經組態以產生包括各別組不相交之位元位置 中之第一值及第二值的封包。舉例而言,任務E440可經組 態以根據如本文中所描述之具有第一組位元位置及第二組 位元位置之模板產生封包,該第一組位元位置與該第二組 位元位置不相交。在此狀況下,任務E440可實施為如本文 中所描述之封包產生任務E320之執行個體。任務E440之此 類實施方案可經組態以產生包括第一組位元位置中之一音 調脈波位置、第二組位元位置中之第一值及第三組位元位 置中之第二值的封包,該第三組與第一組及第二組不相 交。 圖43C展示方法M650之實施方案M670之流程圖,該實 施方案M670包括任務E450。任務E450自語音信號訊框之 複數個音調脈波中提取一音調脈波。任務E450可實施為如 本文中所描述之任務T640之執行個體。任務E450可經組態 144316.doc • 80 - 201032219 以基於一能量量度選擇音調脈波。舉例而言,任務E450可 經組態以選擇峰值具有最高能量之音調脈波,或具有最高 能量之音調脈波。在方法M670中,向量選擇任務E430可 經組態以選擇最佳地匹配所提取之音調脈波(或基於所提 取之音調脈波之脈波形狀,諸如所提取之音調脈波與另一 所提取之音調脈波之平均值)之脈波形狀向量。 圖46A展示方法M650之實施方案M680之流程圖,該實 施方案M680包括任務E460、E470及E480。任務E460計算 一第二語音信號訊框(例如,一LPC殘差之訊框)之一音調 脈波之位置。第一及第二語音信號訊框可來自同一話音通 信會話或可來自不同話音通信會話。舉例而言,第一及第 二語音信號訊框可來自由一人說出之語音信號或可來自各 自由一不同的人說出之兩個不同語音信號。語音信號訊框 可在計算音調脈波位置之前及/或之後經歷其他處理操作 (例如,感知加權)。 基於所計算之音調脈波位置,任務E470選擇脈波形狀向 量之複數個表中之一者。任務E470可實施為如本文中所描 述之任務T620之執行個體。可回應於第二語音信號訊框僅 含有一個音調脈波之判定(例如,藉由任務E460或另外藉 由方法M680進行)執行任務E470。基於來自第二語音信號 訊框之資訊,任務E480在脈波形狀向量之選定之表中選擇 一脈波形狀向量。任務E480可實施為如本文中所描述之任 務T630之執行個體。 圖44A展示用於編碼音調脈波之形狀之裝置MF650的方 144316.doc -81 - 201032219 塊圖。裝置MF650包括用於估計一語音信號訊框之一音調 週期(例如,如上文參考任務E410、E130、L200及/或E370 之各種實施方案所描述)的構件FE410、用於選擇脈波形狀 向量之一表(例如,如上文參考任務E420及/或T650之各種 實施方案所描述)的構件FE420及用於選擇選定之表中之一 脈波形狀向量(例如,如上文參考任務E430及/或T660之各 種實施方案所描述)的構件FE430。 圖44B展示裝置MF650之實施方案MF660之方塊圖。裝 置MF660包括用於產生一包括(A)基於所估計之音調週期 之第一值及(B)識別選定之表中的選定之脈波形狀向量之 第二值的封包(例如,如上文參考任務E440所描述)的構件 FE440。圖44C展示裝置MF650之實施方案MF670之方塊 圖,該實施方案MF670包括用於自語音信號訊框之複數個 音調脈波中提取一音調脈波(例如,如上文參考任務E450 所描述)的構件FE450。 圖46B展示裝置MF650之實施方案MF680之方塊圖。裝 置MF680包括用於計算一第二語音信號訊框之一音調脈波 之位置(例如,如上文參考任務E460所描述)的構件 FE460、用於基於所計算之音調脈波位置選擇脈波形狀向 量之複數個表中之一者(例如,如上文參考任務E470所描 述)的構件FE470及用於基於來自第二語音信號訊框之資訊 在脈波形狀向量之選定之表中選擇一脈波形狀向量(例 如,如上文參考任務E480所描述)的構件FE480。 圖45 A展示用於編碼音調脈波之形狀之裝置A650的方塊 144316.doc -82 - 201032219 圖。裝置A650包括一經組態以估計一語音信號訊框之一音 調週期(例如,如上文參考任務E410、E130、L200及/或 E370之各種實施方案所描述)之音調週期估計器540。舉例 而言,音調週期估計器540可實施為如本文中所描述之音 調週期估計器130、190或A320之執行個體。裝置A650亦 包括一經組態以基於所估計之音調週期來選擇脈波形狀向 量之一表(例如,如上文參考任務E420及/或T650之各種實 施方案所描述)的向量表選擇器550。裝置A650亦包括一經 組態以基於來自語音信號訊框之至少一音調脈波之資訊來 選擇選定之表中的一脈波形狀向量(例如,如上文參考任 務E43 0及/或T660之各種實施方案所描述)的脈波形狀向量 選擇器560。 圖45B展示裝置A650之實施方案A660之方塊圖,該實施 方案A660包括一經組態以產生一包括(A)基於所估計之音 調週期之第一值及(B)識別選定之表中的選定之脈波形狀 向量之第二值的封包(例如,如上文參考任務E440所描述) 的封包產生器570。封包產生器570可實施為如本文中所描 述之封包產生器170之執行個體。圖45C展示裝置A650之 實施方案A670之方塊圖,該實施方案A670包括一經組態 以自語音信號訊框之複數個音調脈波中提取一音調脈波 (例如,如上文參考任務E450所描述)的音調脈波提取器 580 ° 圖46C展示裝置A650之實施方案A680之方塊圖。裝置 A680包括一經組態以計算一第二語音信號訊框之一音調脈 144316.doc •83- 201032219 波之位置(例如,如上文參考任務E460所描述)的音調脈波 位置計算器590。舉例而言,音調脈波位置計算器590可實 施為如本文中所描述之音調脈波位置計算器120或160或終 端峰值定位器A3 10之執行個體。在此狀況下,向量表選擇 器5 50亦經組態以基於所計算之音調脈波位置選擇脈波形 狀向量之複數個表中之一者(例如,如上文參考任務E470 所描述),且脈波形狀向量選擇器560亦經組態以基於來自 第二語音信號訊框之資訊來選擇脈波形狀向量之選定之表 中的一脈波形狀向量(例如,如上文參考任務E480所描 述)。 語音編碼器AE10可實施成包括裝置A650。舉例而言, 語音編碼器AE20之第一訊框編碼器104可實施成包括裝置 A650之執行個體以使得音調週期估計器130亦充當估計器 540。第一訊框編碼器1 04之此類實施方案亦可包括裝置 A400之執行個體(例如,裝置A402之執行個體,以使得封 包產生器170亦充當封包產生器570)。 圖47A展示根據一般組態的解碼音調脈波之形狀之方法 M800的方塊圖。方法M800包括任務D510、D520、D530及 D540。任務D510自一經編碼之語音信號之一封包(例如, 如由方法M660之實施方案產生)提取一經編碼之音調週期 值。任務D5 10可實施為如本文中所描述之任務D480之執 行個體。基於該經編碼之音調週期值,任務D520選擇脈波 形狀向量之複數個表中之一者。任務D530自該封包提取一 索引。基於該索引,任務D540自該選定之表獲得一脈波形 144316.doc -84- 201032219 狀向量。 圖47B展示方法M800之實施方案M810之方塊圖,該實 施方案M810包括任務D550及D560。任務D550自該封包提 取一音調脈波位置指示符。任務D5 50可實施為如本文中所 描述之任務D410之執行個體。基於該音調脈波位置指示 符,任務D560將一基於該脈波形狀向量之音調脈波配置於 一激勵信號内。任務D560可實施為如本文中所描述之任務 D430之執行個體。 圖48A展示方法M800之實施方案M820之方塊圖,該實 施方案M820包括任務D570、D575、D580及D585。任務 D570自一第二封包提取一音調脈波位置指示符。該第二封 包可來自與第一封包相同之話音通信會話或可來自一不同 話音通信會話。任務D570可實施為如本文中所描述之任務 D410之執行個體。基於來自第二封包之音調脈波位置指示 符,任務D575選擇脈波形狀向量之第二複數個表中之一 者。任務D580自該第二封包提取一索引。基於來自第二封 包之索引,任務D585自該第二複數個表中之該選定者獲得 一脈波形狀向量。方法M820亦可經組態以基於所獲得的 脈波形狀向量產生一激勵信號。 圖48B展示用於解碼音調脈波之形狀之裝置MF800的方 塊圖。裝置MF800包括用於自一封包提取一經編碼之音調 週期值(例如,如本文中參考任務D5 10之各種實施方案所 描述)的構件FD510、用於選擇脈波形狀向量之複數個表中 之一者(例如,如本文中參考任務D520之各種實施方案所 144316.doc -85- 201032219 描述)的構件FD520、用於自該封包提取一索引(例如,如 本文中參考任務D530之各種實施方案所描述)的構件 FD53 0及用於自該選定之表獲得一脈波形狀向量(例如,如 本文中參考任務D540之各種實施方案所描述)的構件 FD540 ° 圖49A展示裝置MF800之實施方案MF810之方塊圖。裝 置MF81 0包括用於自封包提取一音調脈波位置指示符(例 如,如本文中參考任務D550之各種實施方案所描述)的構 件FD550及用於將一基於該脈波形狀向量之音調脈波配置 於一激勵信號内(例如,如本文中參考任務D560之各種實 施方案所描述)的構件FD560。 圖49B展示裝置MF800之實施方案MF820之方塊圖。裝 置MF820包括用於自第二封包提取一音調脈波位置指示符 (例如,如本文中參考任務D570之各種實施方案所描述)的 構件FD5 70及用於基於來自第二封包之位置指示符來選擇 脈波形狀向量之第二複數個表中之一者(例如,如本文中 參考任務D5 75之各種實施方案所描述)的構件FD575。裝 置MF820亦包括用於自第二封包提取一索引(例如,如本文 中參考任務D5 80之各種實施方案所描述)的構件FD580及 用於基於來自第二封包之索引自該第二複數個表中之該選 定者獲得一脈波形狀向量(例如,如本文中參考任務D585 之各種實施方案所描述)的構件FD585。 圖50A展示用於解碼音調脈波之形狀之裝置A800的方塊 圖。裝置A800包括一經組態以自一封包提取一經編碼之音 144316.doc -86 - 201032219 調週期值(例如’如本文 今乂〒參考任務d510之各種實施方案 所描述)且自該封包接 取 索引(例如,如本文中參考任務 D530之各種實施方宰. 所指迷)的封包剖析器610。封包剖析 器610可實施為如本文中所y、+、 • 甲所七田述之封包剖析器5 10之執行個 體。裝置A刚亦包括_經組態以選擇脈波形狀向量之複數 表中之者(例如’如本文中參考任務D52〇之各種實施 方案所描述)的向量表遗遮 表選擇器620及經組態以自該選定之表 獲得一脈波形狀向量(例 ❹ 列如如本文中參考任務D540之各 種實施方案所描述)之向量表讀取器630。 封包剖析器61 〇亦可姆έ日能,、,Α J J &組感以自一第二封包提取一脈波 位置指不符及一会3丨/ A | , ’、(例如’如本文中參考任務D570及 D580之各種實施方幸 系所拓述)。向量表選擇器620亦可經組 態以基於來自第二封包之 _ 了L之位置心不符來選擇脈波形狀向量 之複數個表中之一者f你丨‘ ,^ — (例如如本文中參考任務D575之各 種實施方案所描述)。向量表讀取器㈣亦可經組態以基於 籲 I自第一封包之索引自該第二複數個表中之該選定者獲得 一脈波形狀向量(例如’如本文中參考任務娜之各種實 施方案所描述)。圖5〇B展示裝置_之實施方案靡之 方塊圖,該實施方案A81G包括_經組態以將—基於該脈波 •形狀向量之音調脈波配置於_激勵信號内(例如,如本文 中參考任務D560之各種實施方案所描述)的激勵信號產生 器6二。激勵信號產生器64〇可實施為如本文中所描述之激 勵信號產生器310及/或530之執行個體。 語音編碼器AE10可實施纟包括裝置A_。舉例而言, 1443I6.doc -87- 201032219 語音編碼器AE20之第一訊框編碼器104可實施成包括裝置 A800之執行個體。第一訊框編碼器104之此類實施方案亦 可包括裝置A560之執行個體,在此狀況下,封包剖析器 5 10亦可充當封包剖析器620及/或激勵信號產生器530亦可 充當激勵信號產生器640。 一根據一組態(例如,根據語音編碼器AE20之實施方案) 之語音編碼器使用三個或四個編碼方案來編碼不同類別之 訊框:如上文所描述之四分之一速率NELP(QNELP)編碼方 案、四分之一速率PPP(QPPP)編碼方案及轉換訊框編碼方 案。QNELP編碼方案用以編碼無聲訊框及向下瞬變訊框。 QNELP編碼方案或八分之一速率NELP編碼方案可用以編 碼靜寂訊框(例如,背景雜訊)。QPPP編碼方案用以編碼有 聲訊框。轉換訊框編碼方案可用以編碼向上瞬變(亦即, 開始)訊框及瞬變訊框。圖26之表展示用於此四種編碼方 案中之每一者的位元分配之一實例。 現代聲碼器通常執行語音訊框之分類。舉例而言,此類 聲碼器可根據將訊框分類為上文所論述之六種不同類別 (靜寂、無聲、有聲、瞬變、向下瞬變及向上瞬變)中之一 者的方案操作。此等方案之實例描述於美國公開專利申請 案第2002/0111798號(Huang)中。此類分類方案之一實例亦 描述於3GPP2(第三代合作夥伴計劃2)文獻「Enhanced Variable Rate Codec, Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems」(3GPP2 C.S0014-C,2007年 1月,在www.3gpp2.org可線上獲得)章 144316.doc -88 - 201032219 節4.8(第4·57至4_71頁此方案使用圖51之表中所列之 特徵將訊框分類,且此4.8章節藉此以⑽的方式併入本 文中作為如本文中所描述之「EVRC分類 例。EVRC分類方案之—類似實例描述於圖55至圖Μ之程 式碼列表中。 在圖51之表中顯現之參數E'肛及印可如下計算(針對 160位元訊框): 159 J59 ❿ ,说=§办),册=|4⑻, 其中〜⑻及〜⑻分別為輪入語音信號之經低通濾波(使用12 階極零低通濾波器)及經高通濾波(使用12階極零高通濾波 器)版本。可用於EVRC分類方案中之其他特徵包括先前訊 框模式決策(「prev—mode」)、先前訊框中之固定有聲語音 之存在(「prev—voiced」)及針對當前訊框之話音活動性偵 測結果「curr_va」)。 參 一用於分類方案中之重要特徵係基於音調之正規化自相 關函數(NACF)。圖52展示用於計算基於音調之nacf之程 序的流程圖。首先,經由具有約10〇 Hz之3 dB截止頻率之 3階高通滤波器對當前訊框之LPC殘差及下一個訊框(亦稱 為預看訊框)之LPC殘差進行濾波。可能需要使用未經量化 之LPC係數值來計算此殘差。接著用長度為13之有限脈衝 回應(FIR)濾波器對經濾波之殘差進行低通濾波且抽選十 分之一(decimated by a factor of two)。由 Q ⑻表示經抽選 之信號。 144316.doc -89- 201032219 對於 k=l、2,按照nacf(k) = [40-1 γ 40-1 λ2 max (4〇众 + ”)Q(4〇A: + π -細⑻ + 〇] ^[rrf(40A: + n)rd{AQk + n~lag(k) + /)] _w=0_人 n=0_ (40-1 \f 40-1 、 艺[4(40 灸 + w)c(40A: + «)] ^krf(40A: + n-lag(k) + i)rd(40k + n- lag(k) + i)] w=0 J\ n=0 , 計算當前訊框之兩個子訊框之NACF,其中所有整數i上進 行最大化以使得 1 + max[6,min(0.2 x lag(k),16)] ^ .^.1 + max[6,min(0.2 x lag(k),16)] 2 2 其中lag(k)為如由音調估計常式(例如,基於相關之技術)估 計的子訊框k之滞後值。當前訊框之第一及第二子訊框之 此等值亦可分別以nacf_at_pitch[2](亦寫作「nacf_ap[2]」) 及nacf_ap[3]表示。根據用於先前訊框之第一及第二子訊 框之上述表述計算的NACF值可分別以nacf_ap[0]及 nacf_ap[ 1 ]表示。 按照 nacf(2)= '80-1 广80-1 sign\ Σ [rd (8〇 + n)rd (80 + n - 〇] ^ [rd (80 + n)rd (80 + n - /)] max- 、w=0 八w=0 ^80-1 80-1 Σ [rd (80 + n)rd (80 + n)] [rrf (80 + « - i)rd (80A: + n- 〇] .w=0 計算預看訊框之NACF,其中在所有整數i上進行最大化以 使得 20 . 120 —<ι<— 〇 2 2 此值亦可以nacf_ap[4]表示。 圖53為說明EVRC分類方案之高階流程圖。可將模式決 144316.doc -90- 201032219 策視為基於先前模式決策且基於諸如nacf之特徵之狀態 之間的轉換,其中該等狀態為不同訊框分類。圖54為說明 EVRC分類方案中之狀態之間的可能轉換的狀態圖,其中 標記S、UN、UP、TR、V及DOWN分別表示訊框分類:靜 ·· 寂、無聲、向上瞬變、瞬變、有聲及向下瞬變。 .· 可藉由取決於nacf_at_pitch[2](當前訊框之第二子訊框 NACF,亦寫作「nacf_ap[2]」)與臨限值VOICEDTH及 UNVOICEDTH之間的關係而選擇三種不同程序中之一者 ® 來實施EVRC分類方案。跨越圖55及圖56延伸之程式碼清 單描述可在nacf_ap[2]>VOICEDTH時使用之程序。跨越圖 57至圖59延伸之程式碼清單描述可在nacf_ap[2]<UNVOICEDTH 時使用之程序。跨越圖60至圖63延伸之程式碼清單描述可 在 nacf_ap[2]>=UNVOICEDTH 且 nacf—ap[2]<=VOICEDTH 時使用之程序。 可能需要根據特徵curr_ns_snr[0]之值來變化臨限值 赢 VOICEDTH、LOWVOICEDTH 及 UNVOICEDTH之值。舉例 而言,若curr_ns_snr[0]之值不小於SNR臨限值25 dB,則 乾淨語音之以下臨限值可適用:VOICEDTH=0.75、 LOWVOICEDTH=0.5、UNVOICEDTH=0.35 ;且若 curr一ns_snr[0] ·· 之值小於SNR臨限值25 dB,則吵雜語音之以下臨限值可 適用:VOICEDTH=0.65 、 LOWVOICEDTH=0.5 、 UNVOICEDTH=0.35。 訊框之準確分類對於確保低速率聲碼器中之良好品質可 能尤其重要。舉例而言,僅在開始訊框具有至少一相異峰 144316.doc -91 - 201032219 值或脈波時,可能需要使用如本文中所描述之轉換訊框編 碼模式。此類特徵對於可靠脈波偵測可為重要的,在無此 類特徵之情況下,轉換訊框編碼模式可產生-失真結果。 可能需要使用NELP編瑪方案而非ppp或轉換訊框編碼方案 來編碼缺乏至J 一相異蜂值或脈波之訊框。舉例而言,可 能需要將此類瞬變或向上瞬變訊框重新分類為一無聲訊 框。 此類重新分類可其# — -4*' ^ /re 顆J基於一或多個正規化自相關函數 (NACF)值及/或其他特徵。該重新分類亦可基於不用於 EVRC分類方案中之特徵,諸如,訊框之峰值與讀8能量 之比的值(「最大樣本/RMS能量」)及/或訊框中之音調脈 波之實際數目(「峰值計數」)。圖“之表中所展示之八個 條件中的任何-或多者及/或圖65之表中所展示之十個條 件中的任何-或多者可用於將一向上瞬變訊框重新分類為 -無聲訊框。圖66之表中所展示之十一個條件中的任何一 或多者及/或圖67之表中所展示之十—個條件中的任何一 或多者可用於將-瞬變訊框重新分類為—無聲訊框。圖⑺ 之表中所展示之四個條件中的任何一或多者可用於將一有 聲訊框重新分類為一無聲訊框。亦可能需要將此重新分類 限制於相對無低頻帶雜訊之訊框。舉例而言,僅在 ,及Snr[〇]之值不小於25㈣,方可能需要根據圖 65、圖67或圖68中之條件中之任_者或圖66之七個最右側 條件中之任一者將一訊框重新分類。 相反地’可能需要將—包括至少-相異峰值或脈波之無 144316.doc -92- 201032219 聲訊框重新分類為-向上瞬變或瞬變訊框。此類重新 可基於-或多個正規化自相關函數(nacf)值及/或其 徵。該重新分類亦可基於不用於EVRC分類方案令之特 徵,諸如,訊框之峰值與RMS能量之比的值及/或導值計 數。圖69之表中所展示之七個條件中的任何一或多者可用 於將-無聲訊框重新分類為_向上瞬變訊框。圖7〇之表中 所展示之九個條件中的任何一或多者可用於將一無聲訊框
重新分類為-瞬變訊框。圖71A之表中所展示之條件可用 於將一向下瞬變訊框重新分類為一有聲訊框。圖之表 中所展示之條件可用於將-向下瞬變訊框重新分類為 變訊框。 作為訊框重新分類之-替代,諸如EVRC分類方案之訊 框分類方法可經修改以產生—等於嫩〇分類方案與上文 所描述及/或®64至圖71B中所闡述之重新分類條件中之一 或多者的一組合的分類結果。 圖72展示語音編碼器AE2〇之實施方案ae3〇之方塊圖。 編碼方案選擇||C2G()可經組態以應用—諸如圖55至圖以 程式碼列表中所描述之EVRC分類方案的分類方案。語音 編碼器AE30包括一經組態以根據上文所描述及/或圖以至 圖7附所闡述之條件中之—或多者將訊框重新分類的訊 框重新分類器RC10。訊框重新分類器RCi〇可經組態以自 編碼方案選擇器C200接收一訊框分類及/或其他訊框特徵 之值。訊框重新分類器RC10亦可經組態以計算額外訊框 特徵(例如,峰值與RMS能量之比的值、峰值計數)之值。 144316.doc -93- 201032219 或者,語音編碼器AE30可實施成包括編碼方案選擇器 C200之實施方案,該實施方案產生一等於EVRC分類方案 與上文所描述及/或圖64至圖71B中所闡述之重新分類條件 中之一或多者的一組合的分類結果。 圖73A展示語音編碼器AE10之實施方案AE40之方塊圖。 語音編碼器AE40包括一經組態以編碼週期性訊框之週期 性訊框編碼器E70及一經組態以編碼非週期性訊框之非週 期性訊框編碼器E80。舉例而言,語音編碼器AE40可包括 編碼方案選擇器C200之實施方案,該實施經組態以指導選 擇器60a、60b針對分類為有聲、瞬變、向上瞬變或向下瞬 變之訊框選擇週期性訊框編碼器E70,且針對分類為無聲 或靜寂之訊框選擇非週期性訊框編碼器E80。語音編碼器 AE40之編碼方案選擇器C200可經實施以產生一等於EVRC 分類方案與上文所描述及/或圖64至圖71B中所闡述之重新 分類條件中之一或多者的一組合的分類結果。 圖73B展示週期性訊框編碼器E70之實施方案E72之方塊 圖。編碼器E72包括如本文中所描述之第一訊框編碼器100 及第二訊框編碼器200之實施方案。編碼器E72亦包括經組 態以根據來自編碼方案選擇器C200之分類結果針對當前訊 框選擇編碼器100及200中之一者的選擇器80a、80b。可能 需要組態週期性訊框編碼器E72以選擇第二訊框編碼器 200(例如,QPPP編碼器)作為用於週期性訊框之預設編碼 器。非週期性訊框編碼器E80可經類似地實施以選擇無聲 訊框編碼器(例如,QNELP編碼器)及靜寂訊框編碼器(例 144316.doc •94- 201032219 如,八分之一速率NELP編碼器)中之_者。或者,非週期 性訊框編碼器Ε80可實施為無聲訊框編碼器ue 1 〇之執行個 體。 圖74展示週期性訊框編碼器Ε72之實施方案Ε74之方塊 圖。編碼器Ε74包括訊框重新分類器rc 1〇之執行個體,古玄 執行個體經組態以根據上文所描述及/或圖64至圖71Β中所 闡述之條件中之一或多者將§代框重新分類且控制選擇器 80a、80b根據重新分類之結果針對當前訊框選擇編碼器 100及200中之一者。在另一實例中,編碼方案選擇器C2〇〇 可組態成包括訊框重新分類器RC10,或執行一等於EVRC 分類方案與上文所描述及/或圖64至圖71B中所闡述之重新 分類條件中之一或多者的一組合的分類方案,且選擇如由 此分類或重新分類指示之第一訊框編碼器丨〇〇。 可能需要使用如上文所描述之轉換訊框編碼模式來編碼 瞬變及/或向上瞬變訊框。圖75A至圖75D展示可能需要使 用如本文中所描述之轉換訊框編碼模式的一些典型訊框序 歹J在此等實例中,使用轉換訊框編碼模式通常將經指示 以用於以粗體概述之訊框。此類編碼模式通常對具有一相 對恆定之音調週期及尖脈波之完全或部分有聲訊框良好地 執行。然而,當訊框缺乏尖脈波時或當訊框先於發聲之實 際開始時,可能降低經解碼之語音之品質。在一些狀況 下,可能需要跳過或取消使用轉換訊框編碼模式,或以其 他方式延遲使用此編碼模式,直至一稍後訊框(例如,之 後的訊框)為止。 144316.doc -95- 201032219 脈波誤偵測可引起音誤差、遺漏之脈波及/或外來脈波 之插入。該等誤差可導致經解碼之語音中的諸如啪啪聲、 咔噠聲及/或其他不連續性之失真。因此,可能需要驗證 訊框適合轉換訊框編碼,且當訊框不適合時取消使用轉換 訊框編碼模式可幫助減少該等問題。 可判定一瞬變或向上瞬變訊框不適合轉換訊框編碼模 式。舉例而言,該訊框可能缺乏一相異、尖脈波。在此狀 況下’可能需要使用轉換訊框編碼模式來編碼在該不適合 訊框之後的第一適合之有聲訊框。舉例而言,若一開始訊 框缺乏一相異尖脈波’則可能需要對之後的第一適合之有 聲訊框執行轉換訊框編碼。此類技術可幫助確保一用於後 續有聲訊框之良好參考。 在一些狀況下,使用轉換訊框編碼模式可導致脈波增益 失配問題及/或脈波形狀失配問題。僅有限數目個位元可 用於編碼此等參數,且即使以其他方式指示轉換訊框編 碼,當前訊框亦可能不提供一良好參考。取消不必要地使 用轉換訊框編碼模式可幫助減少此等問題。因此,可能需 要驗證轉換訊框編碼模式比另一編碼模式適合於當前訊 框0 對於跳過或取消使用轉換訊框編碼之狀況而言可能需 要使用轉換訊框編碼模式來編碼之後的第一適合之訊框, 因為此動作可幫助為後續有聲訊框提供一良好參考。舉例 而言,若緊接著之訊框係至少部分有聲的,則可能需要對 緊接著之訊框強制使用轉換訊框編碼。 144316.doc •96· 201032219 對轉換訊框編碼之需要及/或訊框對於轉換訊框編碼之 適合性可基於諸如當前訊框分類、先前訊框分類、初始滞 後值(例如,如由諸如基於相關之技術之音調估計常式判 定,基於相關之技術之一實例描述於本文中所引用的 3GPP2文獻C.S0014-C之4.6.3章節中)、經修改之滯後值(例 如,如由諸如方法M300之脈波偵測操作判定)' 先前訊框 之滯後值及/或NACF值之準則來判定。 可能需要在靠近有聲區段之開始處使用轉換訊框編碼模 式,因為在無良好參考之情況下使用Qppp之結果可為不 可預測的。然而,在一些狀況下,可預期(^押提供比轉 換訊框編碼模式好之結果。舉例而言,在一些狀況下,可 預期使用轉換訊框編碼模式產生一不良參考或甚至引起— 比使用QPPP不適宜之結果。 若轉換訊框編碼對於當前訊框而言不必要,則可能需要 跳過轉換訊框編碼。在此狀況下,可能需要預設至一有聲 編碼模式’諸如QPPP(例如,以保存Qppp之連續性)。不 必要地使用轉換訊框編碼模式可導致稍後訊框中的脈波增 益及/或脈波开> 狀之失配的問題(例如,歸因於用於此等特 徵之有限位元預算)。具有有限時間同步之有聲編碼模式 (諸如,QPPP)可能對此等誤差尤其敏感。 在使用轉換訊框編碼方案編碼訊框之後,可能需要檢杳 經編碼之結果,且若經編碼之結果不良,則拒絕對訊框使 用轉換訊框編碼。對於大部分無聲且僅在靠近結束處變為 有聲之訊框而言,轉換編碼模式可經組態以在無脈波之情 144316.doc -97· 201032219 況下編碼無聲部分(g,作為零或錄),或轉換編瑪模 式可經組態以用脈波填充無聲部分之至少-部分。若無聲 部分係在無脈波之情況下經編碼,則隸可在畴碼之信 號中產生-聽得到的㈣聲或不連續性。在此狀況下,可 能需要替代地對訊框使用NELp編碼方案、然❿,可能需 要避免對有聲區段使_ELp(因為其可引起失真)。若對於 -訊框取消轉換編碼模式,則在大多數狀況下,可能需要 使用有聲編碼模式(例如,Qppp)而不是無聲編碼模式(例 如,QNELP)來編碼該訊框。如上文所描述,對使用轉換 編碼模式之選擇可實施為_編碼模式與有聲編碼模式之 間的一選擇。雖然在無良好參考之情況下使用Qppp之結 果可旎不可預測(例如,訊框之相位可自先前無聲訊框導 出),但不可能在經解碼之信號中產生一咔噠聲或不連續 性。在此狀況下,可延期使用轉換編碼模式,直至下一個 訊框為止。 當偵測到訊框之間的音調不連續性時,可能需要更動對 Λ框使用轉換編碼模式之決策。在一實例中,任務T71 〇檢 查以查看與先前訊框之音調連續性(例如,檢查以查看音 調加倍誤差)。若訊框分類為有聲或瞬變,且由脈波偵測 常式指示的用於當前訊框之滯後值遠小於由脈波偵測常式 指示的用於先前訊框之滯後值(例如,為其約%、1/3或Μ), 則該任務取消使用轉換編碼模式之決策。 在另一實例中,任務Τ720檢查以查看音調溢位(與先前 訊框相比較)。音調溢位在語音具有導致高於最大容許滯 144316.doc •98- 201032219 後之滯後值的極低音調頻率時出現。此類任務可經組態以 在用於先前訊框之滯後值大(例如,大於1〇〇個樣本)且由音 調估計及脈波偵測常式指示的用於當前訊框之滯後值均遠 小於先前音調(例如,小50%以上)時取消使用轉換編碼模 式之決策。在此狀況下,亦可能需要僅保持訊框之最大音 ‘· 料單—脈波。或者,可使用先前滯後估計及有聲及/ 或相對編碼模式(例如,任務E200、Qppp)來編碼訊框。 Φ 當偵測到來自兩個不同常式之結果中之不一致時,可能 需要更動對訊框使用轉換編碼模式之決策。在一實例中, 任務T730檢查以查看在存在強NACF之情況下來自音調估 十常式(例如,如(例如)在本文中所引用之文獻 C.S0014_C之4.6·3章節中所描述的基於相關之技術)之滞後 值與來自脈波谓測常式(例如,方法M3⑽)的所估計之音調 週期之間的一致。所偵測到的第二脈波之音調下之極高 NACF札不一良好音調估計,以使得將不預期兩個滯後估 籲彳之間的不-致。此類任務可經組態以在來自脈波偵測常 式之滯後估計與來自音調估計常式之滯後估計極不同(例 如,大於1.6倍或其160%)時取消使用轉換編碼模式之決 策。 、 在另一實例中,任務T74〇檢查以查看滯後值與終端脈波 之位置之間的一致性。當如使用滞後估計(其可為峰值之 間的距離之平均值)編瑪之舉值位置中之一或多者與對應 石實際峰值位置過於;^時,可能需要取消使用轉換訊框編 碼模式之決策。任務Τ74〇可經組態以使用終端脈波之位置 144316.doc •99· 201032219 及由脈波彳貞測常式计异之滞後值來計算經重建之音調脈波 位置,比較經重建之位置中之每一者與如由脈波偵測演算 法偵測之實際音調峰值位置,且在該等差中之任一者過大 (例如,大於8個樣本)時取消使用轉換訊框編碼之決策。 在另一實例中,任務T750檢查以查看滞後值與脈波位置 之間的一致性。此類任務可經組態以在最終音調峰值距最 終訊框邊界大於一個滯後週期時取消使用轉換訊框編碼之 決策。舉例而言’此類任務可經組態以在最終音調脈波之 位置與訊框之結束之間的距離大於最終滞後估計(例如, 由滯後估計任務L200及/或方法]VI300計算之滯後值)時取消 使用轉換訊框編碼之決策。此類條件可指示一脈波誤偵測 或一尚未穩定之滯後。 若當前訊框具有兩個脈波且分類為瞬變,且若該兩個脈 波之峰值之平方量值的比率大,則可能需要使該兩個脈波 在整個滯後值上相關且除非相關結果大於(或者,不小於) 一對應臨限值’否則拒絕較小峰值。若拒絕較小峰值,則 亦可能需要取消對訊框使用轉換訊框編碼之決策。
圖76展示用於可用以取消對訊框使用轉換訊框編碼之決 策的兩個常式之程式碼列表。在此列表中,m〇d」ag指示 來自脈波偵測常式之滯後值;〇rig」ag指示來自音調估計 常式之滯後值’ pdelay_transient_coding指示來自脈波彳貞測 常式之用於先前訊框之滯後值;pREV_TRANSIENT_FRAME_E 指示轉換編碼模式是否用於先前訊框;且1〇c[〇]指示訊框 之最終音調峰值之位置。 144316.doc •100- 201032219 圖77展示可用以取消使用轉換訊框編碼之決策之四個不 同條件。在此表中,curr_mode指示當前訊框分類; Prev-m〇de指示用於先前訊框之訊框分類;number_of_pulses 指示當前訊框中之脈波之數目;prev—n〇—〇f-Pulses指示先 刚訊框中之脈波之數目;pitch_doubling指示是否在當前訊 • 框中偵測到一音調加倍誤差;deltajag—iiitra指示來自音 調估計常式(例如,如(例如)在本文中所引用之3GPP2文獻 ❹ c.s〇〇i4-c之4.6·3章節中所描述的基於相關 之技術)與脈波 偵測常式(諸如,方法M300)之滞後值之間的差之絕對值 (例如’整數)(或’若偵測到音調加倍,則指示來自音調估 計常式之滯後值之一半與來自脈波偵測常式之滯後值之間 的差之絕對值);delta_lag_inter指示先前訊框之最終滯後 值與來自音調估計常式之滯後值之間的差之絕對值(例 如,浮點)(或,若偵測到音調加倍,則指示此滯後值之一 半),NEED_TRANS指示是否在先前訊框之編碼期間指示 φ 對當前訊框使用轉換訊框編碼模式;TRANS_USED指示轉 換編碼模式是否用以編碼先前訊框;且fully_v〇iced指示終 端音調脈波之位置與訊框之相對端(如由最終滯後值劃分) 之間的距離之整數部分是否等於nuinber_0f-pUises減一。 .臨限值之值之實例包括TiAm* (來自脈波偵測常式之滯 後值)+0.5]、Τ1Β = [〇.〇5* (來自脈波偵測常式之滯後 值)+0.5]、(先前訊框之最終滯後值)]及 T2B = [0.15* (先前訊框之最終滯後值)]。 訊框重新分類器RC10可實施成包括上文針對取消使用 144316.doc -101- 201032219 轉換編碼模式之決策所描述之規定中的一或多者,諸如任 務T710至T750、圖76中之程式碼列表及圖77中所展示之條 件°舉例而言’訊框重新分類器RCi〇可經實施以執行如 圖78中所展示之方法河7〇〇,且在測試任務T71〇至T75〇中 之任一者失敗時取消使用轉換編碼模式之決策。 圖79Α展不根據一般組態之編碼語音信號訊框之方法 Μ900的流程圖,該方法Μ900包括任務Ε510、Ε520、Ε530 及Ε540。任務Ε510計算訊框之一殘差(例如,lpc殘差)之 峰值能量。任務Ε5 1 0可經組態以藉由將具有最大振幅之樣 本(或者,具有最大量值之樣本)之值平方來計算峰值能 量。任務Ε520計算殘差之平均能量。任務Ε52〇可經組態以 藉由將樣本之平方值加總且將總和除以訊框中之樣本之數 目來計算平均能量。基於所計算之峰值能量與所計算之平 均能量之間的關係,任務Ε53〇選擇雜訊激勵編碼方案(例 如,如本文中所描述之NELP方案)或無差別音調原型編碼 方案(例如,如本文中參考任務Ε1〇〇所描述)。任務Ε54〇根 據由任務;Ε530選擇之編碼方案編碼訊框。若任務Ε53〇選擇 無差別音調原型編碼方案,則任務Ε54〇包括產生一包括訊 框之一音調脈波之時域形狀、訊框之一音調脈波之位置及 Λ框之一所估計之音調週期的表示的經編碼之訊框。舉例 而5,任務Ε5 40可實施成包括如本文中所描述之任務幻〇〇 之執行個體。 通常,任務Ε530所基於的所計算之峰值能量與所計算之 平均能量之間的關係為峰值與尺^^能量之比。此類比率可 1443l6.doc -102- 201032219 由任務E530或由方法M900之另一任務來計算。作為編碼 方案選擇決策之一部分,任務E530可經組態以比較此比率 與一臨限值,該臨限值可根據一或多個其他參數之當前值 而改變。舉例而言,圖64至圖67、圖69及圖70展示根據其 他參數之值而將不同值用於此臨限值(例如,14、16、 24、25、35、40或 60)之實例 ° 圖79B展示方法M900之實施方案M910之流程圖。在此 狀況下,任務E530經組態以基於峰值能量與平均能量之間 的關係且亦基於一或多個其他參數值選擇編碼方案。方法 M910包括計算諸如訊框中之音調峰值之數目(任務E550)及/ 或訊框之SNR(任務E560)的額外參數之值的一或多個任 務。作為編碼方案選擇決策之一部分,任務E530可經組態 以比較此類參數值與一臨限值,該臨限值可根據一或多個 其他參數之當前值而改變。圖65及圖66展示不同臨限值 (例如,4或5)用以評估如由任務E550計算的當前峰值計數 值之實例。任務E550可實施為如本文中所描述之方法 M300之執行個體。任務E560可經組態以計算訊框之SNR 或訊框之一部分之SNR,諸如一低頻帶或高頻帶部分(例 如,如圖 51 中所展示之 curr_ns_snr[0]或 curr_ns—snr[l])。 舉例而言,任務E560可經組態以計算curr_ns_snr[0](亦 即,0至2 kHz頻帶之SNR)。在一特定實例中,任務E530經 組態以根據圖65或圖67之條件中之任一者或圖66之七個最 右側條件中之任一者選擇雜訊激勵編碼方案,但僅在 curr_ns_snr[0]之值不小於一臨限值(例如,25 dB)時方為 144316.doc -103- 201032219 如此。 圖80A展示方法M900之實施方案M920之流程圖,該實 施方案M920包括任務E570及E580。任務E570判定語音信 號之下一個訊框(「第二訊框」)為有聲的(例如,為高度週 期性的)。舉例而言,任務E570可經組態以對第二訊框執 行如本文中所描述之EVRC分類之一版本。若任務E530針 對第一訊框(亦即,在任務E540中編碼之訊框)選擇雜訊激 勵編碼方案,則任務E580根據無差別音調原型編碼方案編 碼第二訊框。任務E5 80可實施為如本文中所描述之任務 E100之執行個體。 方法M920亦可實施成包括一對緊接第二訊框之後之第 三訊框執行一有差別編碼操作之任務。此類任務可包括產 生一包括(A)第三訊框之一音調脈波形狀與第二訊框之一 音調脈波形狀之間的差別及(B)第三訊框之一音調週期與 第二訊框之一音調週期之間的差別的表示的經編碼之訊 框。此類任務可實施為如本文中所描述之任務E200之執行 個體。 圖80B展示用於編碼語音信號訊框之裝置MF900之方塊 圖。裝置MF900包括用於計算峰值能量(例如,如上文參考 任務E510之各種實施方案所描述)的構件FE510、用於計算 平均能量(例如,如上文參考任務E520之各種實施方案所 描述)的構件FE520、用於選擇一編碼方案(例如,如上文 參考任務E53 0之各種實施方案所描述)的構件FE530及用於 編碼訊框(例如,如上文參考任務E540之各種實施方案所 144316.doc 201032219 描述)的構件FE540。圖81A展示裝置MF900之實施方案 MF910之方塊圖,該實施方案MF910包括一或多個額外構 件,諸如用於計算訊框之音調脈波峰值之數目(例如,如 上文參考任務E550之各種實施方案所描述)的構件FE550及/ 或用於計算訊框之SNR(例如,如上文參考任務E560之各 種實施方案所描述)的構件FE560。圖81B展示裝置MF900 之實施方案MF920之方塊圖,該實施方案MF920包括用於 指示語音信號之第二訊框為有聲(例如,如上文參考任務 E570之各種實施方案所描述)的構件FE570及用於編碼第二 訊框(例如,如上文參考任務E580之各種實施方案所描述) 的構件FE580。 圖82A展示根據一般組態的用於編碼語音信號訊框之裝 置A900的方塊圖。裝置A900包括一經組態以計算訊框之 峰值能量(例如,如上文參考任務E510所描述)之峰值能量 計算器710及一經組態以計算訊框之平均能量(例如,如上 文參考任務E520所描述)之平均能量計算器720。裝置A900 包括一可選擇地組態以根據雜訊激勵編碼方案(例如, NELP編碼方案)編碼訊框之第一訊框編碼器740。編碼器 740可實施為如本文中所描述之無聲訊框編碼器UE10或非 週期性訊框編碼器E80之執行個體。裝置A900亦包括一可 選擇地組態以根據無差別音調原型編碼方案編碼訊框之第 二訊框編碼器750。編碼器750經組態以產生一包括訊框之 一音調脈波之時域形狀、訊框之一音調脈波之位置及訊框 之一所估計之音調週期的表示的經編碼之訊框。編碼器 144316.doc -105- 201032219 750可實施為如本文中所描述之訊框編碼器100、裝置A400 或裝置A650之執行個體及/或可實施成包括計算器710及/ 或720。裝置A900亦包括經組態以可選擇地使訊框編碼器 740及750中之一者編碼訊框之編碼方案選擇器730,其中 該選擇係基於所計算之峰值能量與所計算之平均能量之間 的關係(例如,如上文參考任務E530之各種實施方案所描 述)。編碼方案選擇器730可實施為如本文中所描述之編碼 方案選擇器C200或C300之執行個體且可包括如本文中所 描述之訊框重新分類器RC10之執行個體。 語音編碼器AE10可實施成包括裝置A900。舉例而言, 語音編碼器AE20、AE3 0或AE40之編碼方案選擇器C200可 實施成包括如本文中所描述之編碼方案選擇器730之執行 個體。 圖82B展示裝置A900之實施方案A910之方塊圖。在此狀 況下,編碼方案選擇器730經組態以基於峰值能量與平均 能量之間的關係且亦基於一或多個其他參數值選擇編碼方 案(例如,如本文中參考如在方法M910中實施之任務E530 所描述)。裝置A9 10包括計算額外參數之值之一或多個元 件。舉例而言,裝置A9 1 0可包括一經組態以計算訊框中之 音調峰值之數目(例如,如上文參考任務E550或裝置A300 所描述)的音調脈波峰值計數器760。或者或另外,裝置 A91 0可包括一經組態以計算訊框之SNR(例如,如上文參 考任務E560所描述)之SNR計算器770。編碼方案選擇器 73 0可實施成包括計數器760及/或SNR計算器770。 144316.doc -106- 201032219 為了便利起見’現將上文參考裝置A鶴所論述之 號訊框稱作「第-訊框」,且將語音信號中在該第一訊框 之後之訊框稱作「第二訊框」。編碼方案選擇器7W且 態以對第二訊框執行訊框分類操作(例如,如本文中參考 如在方法㈣〇中實施之任務㈣所描述)。舉例而言,編 碼方案選擇H 730可經組態以回應於針對第—訊框選擇雜 訊激勵編碼方案且判定第二訊框為有聲的而使第二訊框編
碼器750編碼第二訊框(料’根據無差料調原型編碼方 案)。 圖83A展示裝置A900之實施方案A920之方塊圖,該實施 方案A920包括經組態以對訊框執行一有差別編碼操作 (例如,如本文中參考任務E2〇〇所描述)之第三訊框編碼器 78〇。換言之,編碼器78〇經組態以產生一包括(a)當前訊 框之音調脈波形狀與先前訊框之一音調脈波形狀之間的 差別及(B)當前訊框之一音調週期與先前訊框之一音調週 期之間的差別的表不的經編碼之訊框。裝置A92〇可經實施 以使得編碼器780對語音信號中緊接第二訊框之後之第三 訊框執行有差別編碼操作。 圖83B展示根據一般組態之編碼語音信號訊框之方法 M950的流程圖,該方法M95〇包括任務E6i〇、e62〇、E63〇 及E640。任務E61 〇估計訊框之一音調週期。任務E6丨〇可 實施為如本文中所描述之任務£13〇、L200、Ε3 70或Ε410 之執行個體。任務Ε620計算一第一值與一第二值之間的關 係之值’其中該第一值係基於所估計之音調週期且該第二 1443l6.doc -107- 201032219 值係基於訊框之另一參數。基於所計算之值,任務E63 0選 擇雜訊激勵編碼方案(例如,如本文中所描述之NELP方案) 或無差別音調原型編碼方案(例如,如本文中參考任務 Ε100所描述)。任務Ε640根據由任務Ε630選擇之編碼方案 編碼訊框。若任務Ε63 0選擇無差別音調原型編碼方案,則 任務Ε640包括產生一包括訊框之一音調脈波之時域形狀、 訊框之一音調脈波之位置及訊框之一所估計之音調週期的 表示的經編碼之訊框。舉例而言,任務Ε640可實施成包括 如本文中所描述之任務Ε100之執行個體。 圖84Α展示方法Μ950之實施方案Μ960之流程圖。方法 Μ960包括計算訊框之其他參數之一或多個任務。方法 Μ960可包括計算訊框之一終端音調脈波之位置的任務 Ε650。任務Ε650可實施為如本文中所描述之任務Ε120、 L100、Ε310或Ε460之執行個體。對於終端音調脈波為訊 框之最終音調脈波之狀況而言,任務Ε620可經組態以確認 終端音調脈波與訊框之最後樣本之間的距離不大於所估計 之音調週期。若任務Ε650計算相對於最後樣本之脈波位 置,則可藉由比較脈波位置與所估計之音調週期之值來執 行此確認。舉例而言,若自此類脈波位置減去所估計之音 調週期留下一至少等於零之結果,則確認該條件。對於終 端音調脈波為訊框之初始音調脈波之狀況而言,任務Ε620 可經組態以確認終端音調脈波與訊框之第一樣本之間的距 離不大於所估計之音調週期。在此等狀況中之任一者之情 況下,任務Ε630可經組態以在確認失敗時(例如,如本文 144316.doc -108- 201032219 中參考任務T750所描述)選擇雜訊激勵編碼方案。 除終端音調脈波位置計算任務E650之外,方法M960可 包括定位訊框之複數個其他音調脈波之任務E670。在此狀 況下,#務E650可經組態以基於所估計之音調週期及所計 算之音調脈波位置計算複數個音調脈波位置,且任務E620 可經組態以評估該等經定位之音調脈波之位置與所計算之 音調脈波位置一致的程度。舉例而言,任務E630可經組態 以在任務E620判定(A)—經定位之音調脈波之位置與(B)~~ 對應的所計算之音調脈波位置之間的差中之任一者大於一 臨限值(諸如,8個樣本)時(例如,如上文參考任務T740所 描述)選擇雜訊激勵編碼方案。 或者或另外,對於上述實例中之任一者,方法M960可 包括計算一最大化訊框之一殘差(例如,LPC殘差)之一自 相關值的滯後值的任務E660。此類滯後值(或「音調延 遲」)之計算描述於上文所引用之3GPP2文獻C.S0014-C之 4·6·3章節(第4_44至4-49頁)中,該章節藉此以引用之方式 併入本文中作為此計算之一實例。在此狀況下,任務Ε620 可經組態以確認所估計之音調週期不大於所計算之滯後值 之一指定比例(例如,160%)。任務Ε630可經組態以在確認 失敗時選擇雜訊激勵編碼方案。在方法Μ960之相關實施 方案中,任務Ε63 0可經組態以在確認失敗且用於當前訊框 之一或多個NACF值亦足夠高時(例如,如上文參考任務 Τ730所描述)選擇雜訊激勵編碼方案。 或者或另外,對於上述實例中之任一者,任務Ε620可經 144316.doc •109- 201032219 組態以比較一基於所估計之音調週期之值與語音信號之一 先前訊框(例如,當前訊框之前之最後訊框)之一音調週 期。在此狀況下,任務E630可經組態以在所估計之音調週 期遠小於先前訊框之音調週期(例如,約其二分之一、三 分之一或四分之一)時(例如,如上文參考任務T710所描述) 選擇雜訊激勵編碼方案。或者或另外,任務E630可經組態 以在先前音調週期大(例如,100個以上樣本)且所估計之音 調週期小於先前音調週期之二分之一時(例如,如上文參 考任務T720所描述)選擇雜訊激勵編碼方案。 圖84B展示方法M950之實施方案M970之流程圖,該實 施方案M970包括任務E680及E690。任務E680判定語音信 號之下一個訊框(「第二訊框」)為有聲的(例如,為高度週 期性的)。(在此狀況下,將在任務E640中編碼之訊框稱作 「第一訊框」。)舉例而言,任務E680可經組態以對第二訊 框執行如本文中所描述之EVRC分類之一版本。若任務 E630針對第一訊框選擇雜訊激勵編碼方案,則任務E690根 據無差別音調原型編碼方案編碼第二訊框。任務E690可實 施為如本文中所描述之任務E100之執行個體。 方法M970亦可實施成包括一對緊接第二訊框之後之第 三訊框執行一有差別編碼操作之任務。此類任務可包括產 生一包括(A)第三訊框之一音調脈波形狀與第二訊框之一 音調脈波形狀之間的差別及(B)第三訊框之一音調週期與 第二訊框之一音調週期之間的差別的表示的經編碼之訊 框。此類任務可實施為如本文中所描述之任務E200之執行 144316.doc •110- 201032219 個體。 圖85A展示用於編碼語音信號訊框之裝置MF950之方塊 圖。裝置MF950包括用於估計訊框之一音調週期(例如,如 上文參考任務E610之各種實施方案所描述)的構件FE610、 用於計算(A)—基於所估計之音調週期之第一值與(B)—基 於訊框之另一參數之第二值之間的關係之值(例如,如上 文參考任務E620之各種實施方案所描述)的構件FE620、用 於基於所計算之值選擇一編碼方案(例如,如上文參考任 務E63 0之各種實施方案所描述)的構件FE630及用於根據選 定之編碼方案編碼訊框(例如,如上文參考任務E640之各 種實施方案所描述)的構件FE640。 圖85B展示裝置MF950之實施方案MF960之方塊圖,該 實施方案MF960包括一或多個額外構件,諸如用於計算訊 框之一終端音調脈波之位置(例如,如上文參考任務E650 之各種實施方案所描述)的構件FE650、用於計算一最大化 訊框之一殘差之一自相關值的滯後值(例如,如上文參考 任務E660之各種實施方案所描述)的構件FE660及/或用於 定位訊框之複數個其他音調脈波(例如,如上文參考任務 E670之各種實施方案所描述)的構件FE670。圖86A展示裝 置MF950之實施方案MF970之方塊圖,該實施方案MF970 包括用於指示語音信號之第二訊框為有聲(例如,如上文 參考任務E680之各種實施方案所描述)的構件FE680及用於 編碼第二訊框(例如,如上文參考任務E690之各種實施方 案所描述)的構件FE690。 144316.doc -111- 201032219 圖86B展示根據一般組態的用於編碼語音信號訊框之裝 置A950的方塊圖。裝置A950包括經組態以估計訊框之一 音調週期之音調週期估計器810。估計器81〇可實施為如本 文中所描述之估計器13〇、190、幻2〇或54〇之執行個體。 裝置A950亦包括一經組態以計算(A) 一基於所估計之音調 週期之第一值與(B)—基於訊框之另一參數之第二值之間 · 的關係之值的計算器820。裝置A950包括一可選擇地組態 以根據雜訊激勵編碼方案(例如,>|]£1^編碼方案)編碼訊框 之第一訊框編碼器840。編碼器84〇可實施為如本文中所描 0 述之無聲訊框編碼器UE10或非週期性訊框編碼器E8〇之執 行個體。裝置A950亦包括一可選擇地組態以根據無差別音 調原型編碼方案編碼訊框之第二訊框編碼器85〇。編碼器 850經組態以產生一包括訊框之一音調脈波之時域形狀、 Λ框之s調脈波之位置及訊框之一所估計之音調週期的 表示的經編碼之訊框。編碼器850可實施為如本文中所描 述之訊框編碼器100、裝置A400或裝置A65〇之執行個體及/ 或可實施成包括估計器810及/或計算器82〇。裳置a95〇亦 © 包括一經組態以基於所計算之值可選擇地使訊框編碼器 840及85〇中之一者編碼訊框(例如’如上文參考任務E63〇 : 之各種實施方案所描述)的編碼方案選擇器83〇。編碼方案 選擇器830可實施為如本文中所描述之編碼方案選擇^ C200或C300之執行個體且可包括如本文中所描述之訊框 重新分類器RC10之執行個體。 語音編碼器AE10可實施成包括裝置a95〇。舉例而言, 144316.doc -112· 201032219 語音編碼器AE20、AE30或AE40之編碼方案選擇器C200可 實施成包括如本文中所描述之編碼方案選擇器830之執行 個體。 圖87A展示裝置A950之實施方案A960之方塊圖。裝置 A960包括計算訊框之其他參數之一或多個元件。裝置 • A960可包括一經組態以計算訊框之一終端音調脈波之位置 的音調脈波位置計算器860。音調脈波位置計算器860可實 0 施為如本文中所描述之計算器12〇、16〇或59〇或峰值偵測 器150之執行個體。對於終端音調脈波為訊框之最終音調 脈波之狀況而言,計算器82〇可經組態以確認終端音調脈 波與訊框之最後樣本之間的距離不大於所估計之音調週 期。若音調脈波位置計算器860計算相對於最後樣本之脈 波位置’則計算器820可藉由比較脈波位置與所估計之音 調週期之值來執行此確認。舉例而言,若自此類脈波位置 減去所估計之音調週期留下一至少等於零之結果,則確認 φ 该條件。對於終端音調脈波為訊框之初始音調脈波之狀況 而言’計算器820可經組態以確認終端音調脈波與訊框之 第一樣本之間的距離不大於所估計之音調週期。在此等狀 況中之任一者之情況下,編碼方案選擇器830可經組態以 - 在確認失敗時(例如,如本文中參考任務T75〇所描述)選擇 雜訊激勵編碼方案。 除終端音調脈波位置計算器860之外,裝置Α960可包括 一經組態以定位訊框之複數個其他音調脈波之音調脈波定 位器880。在此狀況下’裝置Α960可包括一經組態以基於 144316.doc -113- 201032219 所估計之音調週期及所計算之音調脈波位置計算複數個音 調脈波位置的第二音調脈波位置計算器885,且計算器MO 可經組態以評估該等經定位之音調脈波之位置與所計算之 音調脈波位置一致的程度。舉例而言,編碼方案選擇器 830可經組態以在計算器82〇判定(A)一經定位之音調脈波 之位置與(B)—對應的所計算之音調脈波位置之間的差中 之任一者大於一臨限值(諸如,8個樣本)時(例如,如上文 參考任務T740所描述)選擇雜訊激勵編碼方案。 或者或另外,對於上述實例中之任一者,裝置A96〇可包 殘差之一自相關值的 括一經組態以計算一最大化訊框之一 滯後值(例如,如上文參考任務E66〇所描述)的滯後值計算 器870。在此狀況下,計算器82〇可經組態以確認所估計之 音調週期不大於所計算之滞後值之一指定比例(例如, 160%)。編碼方案選擇器83〇可經組態以在確認失敗時選擇 雜訊激勵編碼方案。在裝置A960之相關實施方案中,編碼 方案選擇器830可經組態以在確認失敗且用於當前訊框之 一或多個NACF值亦足夠高時(例如,如上文參考任務τ73〇 所描述)選擇雜訊激勵編碼方案。 或者或另外,對於上述實例中之任一者’計算器82〇可 經組態以比較一基於所估計之音調週期之值與語音信號之 一先前訊框(例如,當前訊框之前之最後訊框)之一音調週 期。在此狀況下,編碼方案選擇器83〇可經組態以在所估 計之音調週期遠小於先前訊框之音調週期(例如,約其二 分之一、三分之一或四分之一)時(例如,如上文參考任務 144316.doc 114- 201032219 T710所描述)選擇雜訊激㈣碼方案。或者或另外,編 方案選擇器830可經組態以在先前音調週期大(例如, 個以上樣本)且所估計之音調週期小於先前音調週期之二 分之-時(例如,如上文參考任務T72〇所描述)選擇雜訊激 勵編碼方案。 為了便利起見’現將上文參考裝置Α9觸論述之語音信 號訊框稱作「第一訊框」,且將語音信號中在該第一訊框 之後之魏稱作「第三訊框」。編碼方案選擇器㈣可經組 態以對第二訊框執行訊框分類操作(例如,如本文中參考 如在方法Μ960中實施之任務刪所描述)。舉例而言,編 碼方案選擇器830可經組態以回應於針對第一訊框選擇雜 訊激勵編碼方案且判定篦_ 足第—訊框為有聲的而使第二訊框編 = 85G編碼第二訊框(亦即,根據無差料調原型編碼方 業)。
圖87B展示裝置A950之音故士也A 實施方案A970之方塊圖,該實施 (例如如=—經組態以對訊框執行m彳編碼操作 =如換如本文t參考任務E2_描述)之第三訊框 :換二之’編碼器890經組態以產生一咖^ ==日舰波形狀與先前赌之—音調脈 差別及(B)當前訊框之—立 〗97 9调週期與先前訊框之一音調週 期之間的差別的表示的敍總级^ ^ 以使得編碼器_對語訊框。裂置A970可經實施 中緊接第二訊框之後之第三 Λ框執仃有差別編碼操作。 在如本文中所描述之方法(例如,方法Μ100、Μ200、 144316.doc •115· 201032219 Μ則 ' M400、M5〇〇、M55〇、μ·、M_ =、_、咖或_,或另一常式或程式碼列表) 1施方案的典型應用中’一邏輯元件(例如,邏輯閘)陣 列經組態以執行該方法之各種任務中之一者、一 或甚至全部。該等任務中之以上者 X夕者("T能全部)亦可眚祐 為程式碼(例如’一或多個指令集),具體化於一可由一勺 括一邏輯元件(例如,處理器、微處理器、微 = 他有限狀態機;)陣列之機器“ 卫制或其 、)皁歹J之機器(例如,電腦)讀取及/或執行之 電腦程式產品(例如,諸如磁t㈣ 發性記憶卡、半導體心體或其他非揮 趙)中。此類ΛΛ Γ 或多個f料儲存媒 雜)^ &類方法之實施方案之任務亦可 列或機器來執行。在Λ卜笪+# & 個以上此陣 執订在此等或其他實施方案中,可 :”通信之15件(諸如’一行動使用者終端機或具有此,雨 仑能力之其他器件)内執行該等任務。此類^ 以盥雷政六姑a 此類器件可經組態 以與電路交換式及/或封包交換式網 如V,網路電話)之-或多個協定)。舉例;(:二使:諸 可包括經組態以傳輸一包括經編碼之 類:件 信號及/或接收此類信號之RF電路。 :如’封包)之 以在㈣輸之前對經編碼之訊框 t Μ㈣ 操作,諸*,交錯、穿刺、迴旋編碼執二或多個其他 或應用-或多層網路協^及/或在 正編碼及/ 作之補充。 收之後執行該等操 雖然亦預期無此限制之其他配置, 置(例如,裝置Α100、Α200、Α_、文中所描述之裝 Α4〇〇 、 Α5〇〇 、 144316.doc • 116- 201032219 ❿ ❿ A560、A600、Α65()、Α·、A_、A9⑼語音編碼器 AE20、語音解碼器細〇,或其元件)之實施方案的各種元 件可實施為駐留(例如)於同一晶片上或一晶片組中之兩個 或兩個以上晶片間的電子及/或光學器件。此類裝置之一 或多個元件可完全或部分地實施為經配置以在邏輯元件 (例如’ t晶體、閘)之一或多個固定的或可程式化陣列(諸 如,微處理器、嵌入式處理器、Ip核心、數位信號處理 器、fpGA(場可程式化_列)、Assp(特殊應用標準產品) 及ASIC(特殊應用積體電路))上執行的—或多個指令集。 此類裝置之實施方案之—或多個元件有可能用以執行任 務或執行不直接與該裝置之一操作有關的其他指令集,諸 如與被嵌人該裝置之器件或系統之另—操作有關的任務。 本文中所描述之襄置之實施方案的一或多個元件亦有可能 具有共同結構(例如,用以在不同時間執行對應於不同元 件之程式碼之部分的處理器、經執行以在不同時間執行對 應於不同元件之任務的指令集或在不同時間執行不同元件 之操作之電子及/或光學器件的配置)。 提供所描述之㈣之上輯述以使得任何熟習此項技術 者月b夠製造或使用本文中所揭示之方法及其他結構。本文 中所展示並描述之流程圖及其他結構僅為實例,且此等結 構之其他變體亦在本發明之料内。對於此等組態之各^ d文係可此的’且本文中所提出之一般原理同樣可適用於 其他組態。 ' 本文中所描述之組態中之每-者可部分地或完全地實施 1443l6.doc • 117· 201032219 、>·硬連線電路,實施為製造至一特殊應用積體電路中之電 路組態’或實施為載入至非揮發性儲存器中之勒體程式或 自貝料儲存媒體载人或載人至資料儲存媒鳢中之軟體程式 為機器可„賣程式瑪),該程式瑪為可由一諸如微處理器 或其他數位號處理單元之邏輯元件陣列執行之指令。資 料储存媒體可為—儲存元件陣列,諸如,半導體記憶體 (其可包括(不限_態或靜態罐(隨機存取記憶體)、 r〇m(唯讀記憶體)及/或快間ram),或鐵電、磁電阻、雙 °聚0或相變§己憶體;或諸如磁碟或光碟之碟片媒體。 應理解’術語「軟體」包括原始碼、組合語言程式碼、機 器碼、二進制碼、勒體、巨碼(咖。code)、微碼、可由一 =輯元件陣列執行之任何一或多個指令集或序列,及此等 實例之任何組合。 :中所揭不之方法中之每一者亦可有形地具體化(例 ,如上文所列之一或多個資料儲存媒體中)為可由一 包括一邏輯元件(例如,虛 理态微處理器、微控制器哎 f狀態機)障列之機器讀取及/或執行之-或多個指 二=發:不意欲限於上文所展示之組態,而應 、 (匕括形成原始揭示内容之-部分的所申往 之附加申請專利範圍中)以 徵-致的最寬範嘴。何方式揭…理及新賴特 【圖式簡單說明】 圖1展示語音信號之有聲區段之實例; 圖2A展示語音區段之隨時間而變之振幅的實例; 144316.doc 201032219 圖2B展示LPC殘差之隨時間而變之振幅的實例; 圖3 A展示根據一般組態之語音編碼方法Ml 00之流程 圖; 圖3B展示編碼任務E100之實施方案E102之流程圖; 圖4展示訊框中之特徵之示意性表示; ‘圖5A展示編碼任務E200之實施方案E202之圖; 圖5B展示方法M100之實施方案M110之流程圖; 圖5C展示方法M100之實施方案M120之流程圖; 圖6A展示根據一般組態之裝置MF100之方塊圖; 圖6B展示構件FE100之實施方案FE102之方塊圖; 圖7 A展示根據一般組態的解碼語音信號之激勵信號之方 法M200的流程圖; 圖7B展示解碼任務D100之實施方案D102之流程圖; 圖8A展示根據一般組態之裝置MF200之方塊圖; 圖8B展示用於解碼的構件FD100之實施方案FD102的流 φ 程圖; 圖9A展示語音編碼器AE10及對應語音解碼器AD10 ; 圖9B展示語音編碼器AE10之執行個體AElOa、AElOb及 ' 語音解碼器AD10之執行個體AD 10a、AD 10b ; 〜圖1 0 A展示根據一般組態的用於編碼語音信號之訊框之 裝置A100的方塊圖; 圖10B展示編碼器100之實施方案102之方塊圖; 圖11A展示根據一般組態的用於解碼語音信號之激勵信 號之裝置A200的方塊圖; 144316.doc -119- 201032219 圖11B展示第一訊框解碼器300之實施方案302之方塊 圖; 圖12A展示語音編碼器AE10之多模式實施方案AE20之方 塊圖; 圖12B展示語音解碼器AD10之多模式實施方案AD20之 方塊圖; 圖13展示殘差產生器R10之方塊圖; 圖14展示用於衛星通信之系統之示意圖; 圖15A展示根據一般組態之方法M300之流程圖; 圖15B展示任務L100之實施方案L102之方塊圖; 圖15C展示任務L200之實施方案L202之流程圖; 圖16A展示由任務L120進行之搜尋之實例; 圖16B展示由任務L130進行之搜尋之實例; 圖17A展示任務L210之實施方案L210a之流程圖; 圖17B展示任務L220之實施方案L220a之流程圖; 圖17C展示任務L230之實施方案L230a之流程圖; 圖18A至圖18F說明任務L212之反覆之搜尋操作; 圖19A展示用於任務L214之測試條件之表; 圖19B及圖19C說明任務L222之反覆之搜尋操作; 圖20A說明任務L232之搜尋操作; 圖20B說明任務L234之搜尋操作; 圖20C說明任務L232之反覆之搜尋操作; 圖21展示任務L300之實施方案L302之流程圖; 圖22A說明任務L320之搜尋操作; 144316.doc -120- 201032219 圖22B及圖22C說明任務L320之替代搜尋操作; 圖23展示任務L330之實施方案L332之流程圖; 圖24A展示可供任務L334之實施方案使用之四組不同測 試條件; 圖24B展示任務L338之實施方案L338a之流程圖; 圖25展示任務L300之實施方案L304之流程圖; 圖26展示用於語音編碼器AE10之實施方案之各種編碼 方案的位元分配之表; 圖27A展示根據一般組態之裝置MF300之方塊圖; 圖27B展示根據一般組態之裝置A300之方塊圖; 圖27C展示根據一般組態之裝置MF350之方塊圖; 圖27D展示根據一般組態之裝置A350之方塊圖; 圖28展示根據一般組態之方法M500之流程圖; 圖29A至圖29D展示160位元訊框之各種區域; 圖30A展示根據一般組態之方法M400之流程圖; 圖30B展示方法M400之實施方案M410之流程圖; 圖30C展示方法M400之實施方案M420之流程圖; 圖31A展示一封包模板PT10之一實例; 圖31B展示另一封包模板PT20之實例; 圖3 1C說明部分交錯之兩組不相交的位元位置; 圖32A展示方法M400之實施方案M430之流程圖; 圖32B展示方法M400之實施方案M440之流程圖; 圖32C展示方法M400之實施方案M450之流程圖; 圖33 A展示根據一般組態之裝置MF400之方塊圖; 144316.doc -121· 201032219 圖33B展示裝置MF400之實施方案MF410之方塊圖; 圖33C展示裝置MF400之實施方案MF420之方塊圖; 圖34A展示裝置MF400之實施方案MF430之方塊圖; 圖34B展示裝置MF400之實施方案MF440之方塊圖; 圖34C展示裝置MF400之實施方案MF450之方塊圖; 圖35A展示根據一般組態之裝置A400之方塊圖; 圖35B展示裝置A400之實施方案A402之方塊圖; 圖35C展示裝置A400之實施方案A404之方塊圖; 圖35D展示裝置A400之實施方案A406之方塊圖; 圖36A展示根據一般組態之方法M550之流程圖; 圖36B展示根據一般組態之裝置A560之方塊圖; 圖37展示根據一般組態之方法M560之流程圖; 圖3 8展示方法厘560之實施方案]^570之流程圖; 圖39展示根據一般組態之裝置MF560之方塊圖; 圖40展示裝置MF560之實施方案MF570之方塊圖; 圖41展示根據一般組態之方法M600之流程圖; 圖42A展示將滯後範圍均勻劃分成頻率區間之實例; 圖42B展示將滯後範圍非均勻劃分成頻率區間之實例 圖43 A展示根據一般組態之方法M650之流程圖; 圖43B展示方法M650之實施方案M660之流程圖; 圖43C展示方法M650之實施方案M670之流程圖; 圖44A展示根據一般組態之裝置MF650之方塊圖; 圖44B展示裝置MF650之實施方案MF660之方塊圖; 圖44C展示裝置MF650之實施方案MF670之方塊圖; 144316.doc -122- 201032219 圖45A展示根據一般組態之裝置A650之方塊圖; 圖45B展示裝置A650之實施方案A660之方塊圖; 圖45C展示裝置A650之實施方案A670之方塊圖; 圖46A展示方法M650之實施方案M680之流程圖; 圖46B展示裝置MF650之實施方案MF680之方塊圖; 圖46C展示裝置A650之實施方案A680之方塊圖; 圖47A展示根據一般組態之方法M800之流程圖; 圖47B展示方法M800之實施方案M810之流程圖; 圖48A展示方法M800之實施方案M820之流程圖; 圖48B展示根據一般組態之裝置MF800之方塊圖; 圖49A展示裝置MF800之實施方案MF810之方塊圖; 圖49B展示裝置MF800之實施方案MF820之方塊圖; 圖50A展示根據一般組態之裝置A800之方塊圖; 圖50B展示裝置A800之實施方案A810之方塊圖; 圖51展示用於訊框分類方案中之特徵清單; 圖52展示用於計算基於音調之正規化自相關函數之程序 的流程圖; 圖53為說明訊框分類方案之高階流程圖; 圖54為說明訊框分類方案中之狀態之間的可能轉換的狀 態圖; 圖55至圖56、圖57至圖5 9及圖60至圖63展示訊框分類方 案之三個不同程序之程式碼列表; 圖64至圖71B展示訊框重新分類之條件; 圖72展示語音編碼器AE20之實施方案AE30之方塊圖; 144316.doc •123· 201032219 圖73A展示語音編碼器AE10之實施方案AE40之方塊圖; 圖73B展示週期性訊框編碼器E70之實施方案E72之方塊 圖, 圖74展示週期性訊框編碼器E72之實施方案E74之方塊 IS · 圖, 圖75A至圖75D展示可能需要使用轉換訊框編碼模式之 的一些典型訊框序列; 圖76展示程式碼列表; 圖77展示用於取消使用轉換訊框編碼之決策之四個不同 條件; 圖78展示根據一般組態之方法M700之圖; 圖79A展示根據一般組態之方法M900之流程圖; 圖79B展示方法M900之實施方案M910之流程圖; 圖80A展示方法M900之實施方案M920之流程圖; 圖80B展示根據一般組態之裝置MF900之方塊圖; 圖81A展示裝置MF900之實施方案MF910之方塊圖; 圖81B展示裝置MF900之實施方案MF920之方塊圖; 圖82A展示根據一般組態之裝置A900之方塊圖; 圖82B展示裝置A900之實施方案A910之方塊圖; 圖83A展示裝置A900之實施方案A920之方塊圖; 圖83B展示根據一般組態之方法M950之流程圖; 圖84A展示方法M950之實施方案M960之流程圖; 圖84B展示方法M950之實施方案M970之流程圖; 圖85A展示根據一般組態之裝置MF950之方塊圖; 144316.doc •124· 201032219 圖85B展示裝置MF950之實施方案MF960之方塊圖; 圖86A展示裝置MF950之實施方案MF970之方塊圖; 圖86B展示根據一般組態之裝置A950之方塊圖; 圖87A展示裝置A950之實施方案A960之方塊圖;及 圖87B展示裝置A950之實施方案A970之方塊圖。 參考標記可能出現在一個以上圖中以指示相同結構 【主要元件符號說明】 10 衛星 • 20a 地面台 20b 地面台 30a 使用者終端機 30b 使用者終端機 40a 網路 40b 網路 50a 選擇器 φ 50b 選擇器 60a 選擇器 60b 選擇器 80a 選擇器 80b 選擇器 90a 選擇器 90b 選擇器 100 第一訊框編碼器 102 編碼器 144316.doc -125- 201032219 104 第一訊框編碼器 110 音調脈波形狀選擇器 120 音調脈波位置計算器 130 音調週期估計器 140 增益值計算器 150 峰值偵測器 160 音調脈波位置計算器 170 封包產生器 180 比較器 190 音調週期估計器 200 第二訊框編碼器 204 訊框編碼器 210 音調脈波形狀差別計算器 220 音調脈波差別計算器 250 樣本選擇器 260 距離選擇器 300 第一訊框解碼器 302 解碼器 304 第一訊框解碼器 310 第一激勵信號產生器 312 第一激勵信號產生器 320 合成濾波器 330 第一乘法器 340 第二乘法器 144316.doc -126- 201032219 350 峰值選擇器 400 第二訊框解碼器 410 音調脈波形狀計算器 420 音調週期計算器 430 合成濾波器 440 第二激勵信號產生器 510 封包剖析器 520 比較器
530 激勵信號產生器 540 音調週期估計器 550 向量表選擇器 560 脈波形狀向量選擇器 570 封包產生器 580 音調脈波提取器 590 音調脈波位置計算器 610 封包剖析器 620 向量表選擇器 630 向量表讀取器 640 激勵信號產生器 710 峰值能量計算器 720 平均能量計算器 730 編碼方案選擇器 740 第一訊框編碼器 750 第二訊框編碼器 144316.doc -127- 201032219 760 音調脈波峰值計數器 770 SNR計算器 780 第三訊框編碼器 810 音調週期估計器 820 計算器 830 編碼方案選擇器 840 第一訊框編碼器 850 第二訊框編碼 860 音調脈波位置計算器 870 滞後值計算器 880 音調脈波定位器 885 第二音調脈波位置計算器 890 第三訊框編碼器 A100 裝置 A200 裝置 A300 裝置 A310 終端音調蜂值定位器 A320 音調滞後估計器 A330 額外音調峰值定位器 A350 裝置 A400 裝置 A402 裝置 A404 裝置 A406 裝置 144316.doc -128- 201032219
A560 裝置 A650 裝置 A660 裝置 A670 裝置 A680 裝置 A800 裝置 A810 裝置 A900 裝置 A910 裝置 A920 裝置 A950 裝置 A960 裝置 A970 裝置 AD10 語音解碼器 ADlOa 語音解碼器 ADlOb 語音解碼器 AD20 語音解碼器 AE10 語音編碼器 AElOa 語音編碼器 AElOb 語音編碼器 AE20 語音編碼器 AE30 語音編碼 AE40 語音編碼器 C100 通信頻道 144316.doc -129- 201032219
Clio 通信頻道 C120 通信頻道 C200 編碼方案選擇器 C300 編碼方案偵測器 E70 週期性訊框編碼器 E72 週期性訊框編碼器 E74 週期性訊框編碼器 E80 非週期性訊框編碼器 FD100 用於解碼第一經編碼之訊框之一部分以獲得第 一激勵信號的構件 FD102 用於解碼的構件 FD110 用於根據音調脈波位置將時域音調脈波形狀之 第一複本配置於第一激勵信號内的構件 FD120 用於根據音調脈波位置及音調週期將時域音調 脈波形狀之第二複本配置於第一激勵信號内的 構件 FD130 用於將該組增益值中之一者施加i時域音調脈 波形狀之第一複本的構件 FD140 用於將該組增益值中之一不同者施加至時域音 調脈波形狀之第二複本的構件 FD200 用於解碼第二經編碼之訊框之一部分以獲得第 二激勵信號的構件 FD210 用於基於時域音調脈波形狀及音調脈波形狀差 別來計算第二音調脈波形狀的構件 144316.doc •130- 201032219 FD220 用於基於音調週期及音調週期差別來計算第二 音調週期的構件 FD230 用於根據音調脈波位置及第二音調週期將第二 音調脈波形狀之兩個或兩個以上複本配置於第 二激勵信號内的構件 FD410 用於自第一封包提取第一值的構件 FD420 用於比較第一值與一音調脈波位置模式值的構件 FD430 用於根據第一值將一音調脈波配置於第一激勵 信號内的構件 FD440 用於自第二封包提取第二值的構件 FD450 用於比較第二值與音調脈波位置模式值的構件 FD460 用於根據第三值將一音調脈波配置於第二激勵 信號内的構件 FD470 用於自第二封包提取第三值的構件 FD480 用於自第一封包提取第四值的構件 FD490 用於基於第四值將另一音調脈波配置於第一激 勵信號内的構件 FD510 用於自一封包提取一經編碼之音調週期值的構件 FD520 用於選擇脈波形狀向量之複數個表中之一者的 構件 FD530 用於自該封包提取一索引的構件 FD540 用於自該選定之表獲得一脈波形狀向量的構件 FD550 用於自封包提取一音調脈波位置指示符的構件 144316.doc -131 - 201032219 FD560 FD570 用於將一基於脈波形狀向量之音調脈波 一激勵信號内的構件 用於自第二封包提取一音調脈波位置指 構件 配置於 示符的 FD575 FD580 FD585 FE100 FE110 FE120 FE130 FE140 FE200 FE210 FE220 FE310 FE320 用於基於來自第二封包之位置指示符來選擇脈 波形狀向量之第二複數個表中之—者的構彳 用於自第二封包提取一索引的構件 用於基於來自第二封包之索引自該第二複數個 表中之該選定者獲得-脈波形狀向量的構# © 用於編碼語音信號之第一訊框的構件 用於基於來自第-訊框之至少一音調脈波之資訊 來選擇一組時域音調脈波形狀中之一 用於計算第-訊框之終端音調脈波之位置的構件 用於估計第一訊框之音調週期的構件 用於計算對應於第—訊框之不同音調脈波之一 組增益值的構件 用於編碼語音信號之第二訊框的構件 ❹ 用於5十算第二訊框之音調脈波形狀與第一訊框 之音調脈波形狀之間的—音調脈波形狀差別的. 構件 用於計算第二訊框之音調週期與第一訊框之音 調週期之間的一音調週期差別的構件 用於計算第一位置的構件 用於產生第一封包的構件 144316.doc •132- 201032219 FE330 用於計算第二位置的構件 FE340 用於產生第二封包的構件 FE350 用於比較第一位置與一臨限值的構件 FE360 用於比較第二位置與臨限值的構件 FE370 用於估計第一訊框之一音調週期的構件 FE410 用於估計一語音信號訊框之一音調週期的構件 FE420 用於選擇脈波形狀向量之一表的構件 FE430 • FE440 用於選擇選定之表中之一脈波形狀向量的構件 用於產生一包括(A)基於所估計之音調週期之 第一值及(B)識別選定之表中的選定之脈波形 狀向量之第二值的封包的構件 FE450 用於自語音信號訊框之複數個音調脈波中提取 一音調脈波的構件 FE460 用於計算一第二語音信號訊框之一音調脈波之 位置的構件 ^ FE470 用於基於所計算之音調脈波位置選擇脈波形狀 向量之複數個表中之一者的構件 FE480 用於基於來自第二語音信號訊框之資訊在脈波 形狀向量之選定之表中選擇一脈波形狀向量的 構件 FE510 用於計算峰值能量的構件 FE520 用於計算平均能量的構件 FE530 用於選擇一編碼方案的構件 FE540 用於編碼訊框的構件 144316.doc -133- 201032219 FE550 用於計算訊框之音調脈波峰值之數目的構件 FE560 用於計算訊框之SNR的構件 FE570 用於指示語音信號之第二訊框為有聲的構件 FE580 用於編碼第二訊框的構件 FE610 用於估計訊框之一音調週期的構件 FE620 用於計算(A)—基於所估計之音調週期之第一 值與(B) —基於訊框之另一參數之第二值之間 的關係之值的構件 FE630 用於基於所計算之值選擇一編碼方案的構件 FE640 用於根據選定之編碼方案編碼訊框的構件 FE650 用於計算訊框之一終端音調脈波之位置的構件 FE660 用於計算一最大化訊框之一殘差之一自相關值 的滯後值的構件 FE670 用於定位訊框之複數個其他音調脈波的構件 FE680 用於指示語音信號之第二訊框為有聲的構件 FE690 用於編碼第二訊框的構件 MF100 裝置 MF200 裝置 MF300 裝置 MF350 裝置 MF400 裝置 MF410 裝置 MF420 裝置 MF430 裝置 144316.doc 134· 201032219 MF440 裝置 MF450 裝置 MF560 裝置 MF570 裝置 MF650 裝置 MF660 裝置 MF670 裝置 MF680 裝置 ^ MF800 裝置 MF810 裝置 MF820 裝置 MF900 裝置 MF910 裝置 MF920 裝置 MF950 裝置 赢 MF960 裝置 MF970 裝置 ML100 用於定位訊框之一終端音調峰值的構件 ML150 用於偵測訊框之一音調峰值的構件 ML200 用於估計訊框之一音調滯後的構件 ML250 用於選擇一候選樣本的構件 ML260 用於選擇一候選距離的構件 ML300 用於定位訊框之額外音調峰值的構件 144316.doc -135- 201032219 ML350 用於選擇候選樣本與一對應於候選距離之樣本 中之一者作為訊框之一音調峰值的構件 PT10 封包模板 PT20 封包模板 RIO 殘差產生器 R110 LPC分析模組 R120 變換區塊 R130 量化器 R140 反量化器 R150 反變換區塊 R160 白化濾波器 RC10 訊框重新分類器 S100 經數位化之語音信號 S110 經數位化之語音信號 S120 經數位化之語音信號 S200 經編碼之信號 S210 經編碼之信號 S220 經編碼之信號 S300 所接收的經編碼之語音信號 S310 所接收的經編碼之語音信號 S320 所接收的經編碼之語音信號 S400 輸出語音信號 S410 輸出語音信號 S420 輸出語音信號 144316.doc -136- 201032219 SL10 SR10 UD10 UE10 LPC參數 LPC殘差 無聲訊框解碼器 無聲訊框編碼器 144316.doc -137-

Claims (1)

  1. 201032219 七、申請專利範圍: 一種編碼一語音信號訊框之方法,該方法包含: 計算該訊框之一殘差之一峰值能量; 計算該殘差之一平均能量;
    基於該所計算之峰值能量與該所計算之平均能量之間 的一關係,自(A) —雜訊激勵編碼方案及(B) 一無差別音 調原型編碼方案之集合選擇一編碼方案;及 根據該選定之編碼方案編碼該訊框, 其中根據該無差別音調原型編碼方案編碼該訊框包括 產生一包括該訊框之一音調脈波之一時域形狀、該訊框 之一音調脈波之一位置及該訊框之一所估計之音調週期 的表示的經編碼之訊框。 2. 如凊求項丨之方法,其中該雜訊激勵编碼方案為一雜訊 激勵線性預測(NELP)編碼方案。 3. 如请求項丨之方法,其中該方法包括計算該訊框中之立 調脈波峰值之數目,且 9 之音調脈波峰值的該所士十 其中該選擇係基於該訊框中 算之數目。 如叫求項3之方法,其中該方法包括比較該訊框中之之 調峰值的該所計算之數目與一臨限值,且 " 其中該選擇係基於該比較之一結果。 5.如請求項1之方法,其中該選擇係基於該訊框之至少〜 部分之—信雜比。 6·如凊求項5之方法,其中該選擇係基於該訊框之—低頻 144316.doc 201032219 帶部分之一信雜比。 7.如請求項1之方法,其中該方法包含: 判定該語音信號之一第二訊框為有聲的,該第二訊框 在該語音信號中緊接該訊框之後;及 、對於該選擇選擇無聲編碼方案之—狀況而言,且回應 於該判定,根據該無差別編碼模式編碼該第二訊框。 求項7之方法’其中該方法包括對該語音信號之一 第三訊框執行-有差職碼操作H訊框在該語音 信號中緊接該第二訊框之後,且 其中該對該第三訊框執行一有差別編碼操作包括產生 -包括⑷該第三訊框之—音調脈波形狀與該第二訊框之 一音調脈波形狀之㈣—差職⑻該第三訊框之一音調 週期與該第二訊框之-音調週期之間的_差別的表示的 經編碼之訊框。 9. 一種用於編碼—語音信號訊框之裝置,該裝置包含: 用於計算該訊框之一殘差之一峰值能量的構件: ❿ 用於計算該殘差之一平均能量的構件; 用於基於該所計算之♦值能量與該所計算之平均能量 2間的-關係自⑷-雜訊激勵編碼方案及(B)_益差別 音調原型編碼方案之集合選擇一編碼方案的構件·’及 用於根據該選定之編碼方案編碼該訊框的構件, 無差別音調原型編碼方案編碼該訊框包括 一一該訊框之—相脈波之-時域形狀、該訊框 之一音調脈波之一位置及# … 該訊框之—所估計之音調週期 144316.doc -2 - 201032219 的表示的經編碼之訊框。 10. 如”月求項9之裝置’ |中該雜訊激勵編碼方案為—雜訊 激勵線性預測(NELP)編碼方案。 ° 11. 如„月求項9之裝置’纟中該裝置包括用於計算該訊框中 之音調脈波峰值之數目的構件,且 其中用於選擇之該構件經組態以基於該訊框中之立調 脈波峰值的該所計算之數目自(A)一雜訊激勵編碼^及 W-無差別音調原型編碼方案之該集合選擇該編碼方 如…9之裝置,其中用於選擇之該構件經組態以基 =框之-低頻帶部分之一信雜比自(A) 一雜訊激勵編 -及(B)-無差別音調原型編瑪方案之該集合選擇該 編碼方案。 13.如請求項9之裝置,其中該裝置包含: 用於指示該語音作妹 曰藏之第一轉為有聲的構件,該 ❹ 第一訊框在該語音信號中緊接該訊框之後;及 ^於回應於(A)由用於選擇之該構件進行的無聲編碼 件進及(B)—由用於指示該第二訊框為有聲之該構 ㈣Γ 根據該無差別編碼模式編碼該第二訊框 的構件。 A 項U之裝置’其中該裝置包括料對該語音信號 第二讯框執行一有差別編碼操 框在該語音信號中緊接該第二訊框之後,1 第—訊 其中用於對該第三訊框執行一有差別編碼操作之該構 144316.doc 201032219 件b括產生包括(A)該第三訊框之一音調脈波形狀與該 第二訊框之一音調脈波形狀之間的一差別及(B)該第三訊 框之一音調週期與該第二訊框之一音調週期之間的一差 別的表示的經編碼之訊框。 15’種電腦可读媒體’其包含在由—處理器執行時使該處 理器進行以下動作之指令: 計算一語音信號之訊框之一殘差的一峰值能量; 計算該殘差之一平均能量; 基於該所計算之峰值能量與該所計算之平均能量之間 的一關係,自(A) —雜訊激勵編碼方案及(B) 一無差別音 調原型編碼方案之集合選擇一編碼方案;及 根據該選定之編碼方案編碼該訊框, 其中使該處理器根據該無差別音調原型編瑪方案編碼 該訊框之該等指令包括使該處理器產生-包括該訊框之 一音調脈波之一時域形狀、該訊框之一音調脈波之一位 置及該訊框之一所估計之音調週期的表示的經編碼之訊 框的指令。 16.如請求項15之電腦可讀媒體,其中該雜訊激勵編碼方案 為一雜訊激勵線性預測(NELp)編碼方案。 17·如請求項15之電腦可讀媒體,其中該媒體包括使該處理 器計算該訊框中之音調脈波峰值之數目的指令,且 其中使該處理器選擇之該等指令包括使該處理器基於 該訊框中之音調脈波峰值的該所計算之數目自(a)一雜訊 激勵編碼方案及(B) —無差別音調原型編碼方案之該集合 144316.doc -4^ 201032219 選擇該編碼方案的指令。 18.如請求項15之電腦可讀媒體,其中使該處理器選擇之該 等指令包括使該處理器基於該訊框之一低頻帶部分之一 信雜比自(A) —雜訊激勵編碼方案及(B) 一無差別音調原 型編碼方案之該集合選擇該編碼方案的指令。 19·如請求項15之電腦可讀媒體,其中該媒體包含在由一處 理器執行時使該處理器進行以下動作之指令: 指不該語音信號之一第二訊框為有聲的,該第二訊框 在該語音信號中緊接該訊框之後;及 回應於(A)由使該處理器選擇之該等指令進行的無聲 編碼方案之選擇及(B)—由使該處理器指示該第二訊框為 有聲之該等指令進行的指示而根據該無差別編碼模式編 碼該第二訊框。 20. 如請求項19之電腦可讀媒體,其中該媒體包括使該處理 器對該語音信號之一第三訊框執行一有差別編碼操作之 指令,該第三訊框在該語音信號中緊接該第二訊框之 後,且 其中使該處理器對該第三訊框執行一有差別編碼操作 之該等指令包括使該處理器產生一包括(A)該第三訊框之 一音調脈波形狀與該第二訊框之一音調脈波形狀之間的 一差別及(B)該第三訊框之一音調週期與該第二訊框之一 音調週期之間的一差別的表示的經編碼之訊框的指令。 21. —種用於編碼一語音信號訊框之裝置,該裝.置包含. 一峰值能量計算器,其經組態以計算該訊框之一殘差 144316.doc 201032219 之一峰值能量; 平均能量計算器,其經組態以計算該殘差之一平均 能量; 一第一訊框編碼器,其可選擇地組態以根據一雜訊激 勵編碼方案編碼該訊框; 一第二訊框編碼器’其可選擇地組態以根據一無差別 音調原型編碼方案編碼該訊框;及 一編碼方案選擇器,其經組態以基於該所計算之峰值 能置與該所計算之平均能量之間的一關係可選擇地使該⑮ 第一訊框編碼器及該第二訊框編碼器中之一者編碼該訊 框, 其中該第二訊框編碼器經組態以產生一包括該訊框之 一音調脈波之一時域形狀、該訊框之一音調脈波之一位 置及忒訊框之一所估計之音調週期的表示的經編碼之訊 框。 22. 如4求項21之裝置,其中該雜訊激勵編碼方案為—雜訊 激勵線性預測(NELP)編碼方案。 ⑩ 23. 如請求項21之裝置,其中該裝置包括一經組態以計算該 訊框中之音調脈波峰值之數目的音調脈波峰值計數器且 ·· 其中該編碼方案選擇器經組態以基於該訊框中之音調· 脈波峰值的該所計算之數目選擇該第—訊框編碼器及該 第二訊框編碼器中之該_者。 24. 如”月求項21之裝置,其中該編碼方案選擇器經組態以基 於該訊框《低頻帶部分之一信雜比選擇該第一訊框編 144316.doc -6 - 201032219 碼器及該第二訊框編碼器中之該一者。 25. 如請求項21之裝置,其中該編碼方案選擇器經組態以判 定該語音信號之一第二訊框為有聲的,該第二訊框在該 語音信號中緊接該訊框之後,且 其中該編碼方案選擇器經組態以回應於(A)可選擇地 使該第一訊框編碼器編碼該訊框及(B)該第二訊框為有聲 之該判定而使該第二訊框編碼器編碼該第二訊框。 26. 如請求項25之裝置,纟中該裝置包括一經組態以對該語 音信號之-第三訊框執行一有差別編碼操狀第三訊框 編碼器’該第三訊框在該語音信號中緊接該第二訊框之 後,且 其中該第三訊框編碼器經組態以產生一包括(A)該第 三訊框之一音調脈波形狀與該第二訊框之一音調脈波形 狀之間的-差別及⑻該第三訊框之—音調週期與該第二 訊框之-音調週期之間的—差別的表示的經編碼之訊 框。 27. —種編碼一語音信號訊框之方法,該方法包含: 估計該訊框之一音調週期; 汁算(A) 一基於該所佑計之音調週期之第一值盥(B) 一 基於該訊框之另—參數之第二值之間的-關係之1值; 基於該所計算之值,自(A) —雜訊激勵編碼方案及(B) -無差別音調原型編碼方案之集合選擇一編碼方案;及 根據該選定之編碼方案編碼該訊框, ’、中根據絲差別音調原型編碼方案編碼該訊框包括 144316.doc 201032219 產生一包括該訊框之一音調脈波之一時域形狀、該訊框 之一音調脈波之一位置及該所估計之音調週期的表示的 經編碼之訊框。 28. 如請求項27之方法’其中該雜訊激勵編碼方案為一雜訊 激勵線性預測(NELP)編碼方案。 29. 如請求項27之方法,其中該另一參數為該訊框之一終端 音調脈波之一位置,且 其中該計算包含比較該第一值與該第二值。 30. 如請求項27之方法,其中該另一參數為一最大化該訊框 ❹ 之一殘差之一自相關函數的滯後值,且 其中該计算包含比較該第一值與該第二值。 31. 如請求項27之方法’其中該方法包含: 计算該訊框之一終端音調脈波之一位置; 定位該訊框之複數個其他音調脈波;及 基於該所估計之音調週期及該終端音調脈波之該所計 算之位置,計算複數個音調脈波位置, 其中該計算-值包含比較⑷該等經定位之音調_ _ 之位置與(B)該等所計算之音調脈波位置。 32. 如請求項27之方法,其中該選擇係基於比較一基於讀 估計之音調週期之值與-先前訊框之一音調週期的^ 果。 、、,° 33. 如請求項27之方法’其中該方法包含: 判定該語音信號之一第二訊框為有聲的該第二令 在該語音信號中緊接該訊框之後;及 凡樞 144316.doc -8 - 201032219 對於該選擇選擇無聲編碼方案之一狀況而言,且回應 於該判定’根據該無差別編碼模式料該第二訊框。 34.如請求項33之方法,其中該方法包括對該語音信號之一 第二訊框執行m彳編碼操作,㈣三訊框在該語音 信號中緊接該第二訊框之後,且 —其中該對該第三訊框執行—有差別編碼操作包括產生 -包括⑷該第三訊框之—音調脈波形狀與該第二訊框之 ❿ :"音調脈波形狀之間的—差別及w該第三訊框之-音調 週期與該第二訊框之—音調週期之間的—差別的表示的 經編碼之訊框。 35·種用於編碼—語音信號訊框之裝置,該裝置包含: 用於估計該訊框之一音調週期的構件; 用一於計算⑷一基於該所估計之音調週期之第一值與 (B) 一基於該訊框之另一參數 、 值的構件; 參數之第一值之間的一關係之一 (B)- |基於該所计异之值自⑷―雜訊激勵編碼方案及 …、差別音㈣型編碼方案之集合卿—編瑪方案的 ,及 ;根據該選疋之編碼方案編碼該訊框的構件, ^根據該無差料調原型編碼㈣編碼該訊框包括 ^括該訊框之-音魏波之—時域形狀、該訊框 經編位置及該所估計之音調週期的表示的 36·如4項35之裝置,其中該雜訊激勵編碼方案為一雜訊 144316.doc 201032219 37. 38. 39. 40. 41. 激勵線性預測(NELP)編碼方案β 如吻求項35之裝置,其中該另一參數為該訊框之一終端 音調脈波之一位置,且 其中用於計算之該構件經組態以比較該第一值與該第 二值。 如清求項35之裝置’其中該另—參數為—最大化該訊框 之殘差之一自相關函數的滯後值,且其中用於計算之該構件經組態以比較該第一值與該第 二值。 如請求項35之裝置,其中該裝置包含: 用於计算該訊框之一終端音調脈波之一位置的構件; 用於疋位該訊框之複數個其他音調脈波的構件;及 用於基於該所估計之音調週期及該終端音調脈波之該 所计算之位置計算複數個音調脈波位置的構件, 其中用於计算一值之該構件經組態以比較該等經 定位之音調脈波之位置與(Β)該等所計算之音調脈波位 置。 如請求項35之裝置,其中用於選擇之該構件經組態以基 於比較-基於該所估計之音調週期之值與—先前訊框之 曰調週期的一結果自(Α)一雜訊激勵編碼方案及(Β) 一 無差別音調原型編碼方案之該集合選擇該編碼方案。 如請求項35之裝置,其中該裝置包含: 用於指不該語音信號之一第二訊框為有聲的構件,該 第一Λ框在該語音信號中緊接該訊框之後;及 144316.doc 201032219 2於回應於⑷由用於選擇之該構件進行的無聲編瑪 ”選擇及⑻-由用於指示該第二訊框為有聲之該構 件進行的指^根據該無差賴碼模式編㈣第二訊框 的構件。 .42.如請求項41之裝置,以該裝置包括用於對該語音信號 .之-第三訊框執行—有差別編碼操作的構件 框在該語音信號中緊接該第二訊框之後,i 一。 ❹ 其中用㈣該第三訊框執行-有差別編碼操作之該構 <包括產生-包括⑷該第三訊框之—音調脈波形狀與該 訊框之曰調脈波形狀之間的一差別及⑻該第三訊 框之一音調週期與該第二訊框之音調週期之間的一差 別的表示的經編碼之訊框。 43. 一種電腦可讀媒體,其包含在由-處理器執行時使該處 理器進行以下動作之指令: 估汁訊框之一音調週期; • 。十异⑷一基於該所估計之音調週期之第一值與⑻— 基於該訊框之另—參數之第二值之間的__關係之一值; 基於該所片算之值自(Α)一雜訊激勵編瑪方案及⑻一 無差別音調原型編碼方案之集合選擇-編碼方案;及 根據》亥選疋之編碼方案編碼該訊框, ▲其中使該處理器根據該無差別音調原型編碼方案 °亥°凡框之該等指令包括使該處理ϋ產生-包括該訊框之 a調脈波之_域形狀、該訊框之—音調脈波之—位 置及該所估β十之音調週期的表示的經編碼之訊框的於 144316.doc 201032219 令0 44. 如請求項43之電腦可讀媒體’其中該雜訊激勵編碼方案 為一雜訊激勵線性預測(NELP)編碼方案。 45. 如請求項43之電腦可讀媒體,其中該另一參數為該訊框 之一終端音調脈波之一位置,且 其中使該處理器計算之該等指令包括使該處理器比較 該第一值與該第二值之指令。 46. 如請求項43之電腦可讀媒體,其中該另一參數為一最大 化該訊框之一殘差之一自相關函數的滯後值,且 其中使該處理器計算之該等指令包括使該處理器比較 該第一值與該第二值之指令。 47. 如請求項43之電腦可讀媒體,其中該媒體包含在由一處 理器執行時使該處理器進行以下動作之指令: 計算該訊框之一終端音調脈波之一位置; 定位該訊框之複數個其他音調脈波;及 基於該所估計之音調週期及該終端音調脈波之該所計 算之位置計算複數個音調脈波位置, 其中使該處理器計算一值之該等指令包括使該處理器 比較(A)該等經定位之音調脈波之位置與(B)該等所計算 之音調脈波位置的指令。 48. 如請求項43之電腦可讀媒體,其中使該處理器選擇之哕 等指令包括使該處理器基於比較一基於該所估計之音調 週期之值與一先前訊框之一音調週期的一結果自(八)二雜 訊激勵編碼方案及(B) 一無差別音調原型編碼方案之嗲集 144316.doc -12· 201032219 合選擇該編碼方案的指令。 49.如請求項43之電腦可讀媒體,其中該媒體包含在由一處 理器執行時使該處理器進行以下動作之指令: 才曰示§#音彳§號之一第二訊框為有聲的,該第二訊框在 該語音信號中緊接該訊框之後;及 回應於(A)由使該處理器選擇之該等指令進行的無聲 編碼方案之選擇及(B)—由使該處理器指示該第二訊框為 有聲之該等指令進行的指示而根據該無差別編碼模式編 碼該第二訊框。 5〇_如請求項49之電腦可讀媒體,其中該媒體包括使該處理 器對該語音信號之一第三訊框執行一有差別編碼操作之 指令,該第二訊框在該語音信號中緊接該第二訊框之 後,且 其中使該處理器對該第三訊框執行一有差別編碼操作 之該等指令包括使該處理器產生一包括(A)該第三訊框之 一音調脈波形狀與該第二訊框之一音調脈波形狀之間的 一差別及(B)該第三訊框之一音調週期與該第二訊框之一 音調週期之間的一差別的表示的經編碼之訊框的指令。 51. —種用於編碼一語音信號訊框之裝置,該裝置包含: 一音調週期估計器’其經組態以估計該訊框之一音調 週期; 一計算器’其經組態以計算(A) —基於該所估計之音 調週期之第一值與(B)—基於該訊框之另一參數之第二值 之間的一關係之一值; 144316.doc -13· 201032219 一第一訊框編碼器,其可選擇地組態以根據一雜訊激 勵編碼方案編碼該訊框; 一第二訊框編碼器,其可選擇地組態以根據一無差別 曰調原型編碼方案編碼該訊框;及 一編碼方案選擇器,其經組態以基於該所計算之值可 選擇地使該第一訊框編碼器及該第二訊框編碼器中之一 者編碼該訊框, 其中該第二訊框編碼器經組態以產生一包括該訊框之 一音調脈波之一時域形狀、該訊框之一音調脈波之一位 置及該訊框之一所估計之音調週期的表示的經編碼之訊 框0 52. 如請求項51之裝置,其中該雜訊激勵編碼方案為一雜訊 激勵線性預測(NELP)編碼方案。 53. 如請求項51之裝置’其中該另—參數為該訊框之一終端 音調脈波之一位置,且 其中該計算器經組態以比較該第—值與該第二值。 另—參數為-最大化該訊框 之一殘差之一自相關函數的滯後值,且 其中該計算器經組態以比較該第一值與該第二值。 55.如請求項51之裝置’其中該裝置包含: 一第一音調脈波位置計算器,甘π A a τ异益其經組態以計算該訊框 之一終端音調脈波之一位置; 一音調脈波定位器,其經組離w y L U定位該訊框之複數個 其他音調脈波;及 144316.doc -14- 201032219 一第二音調脈波位置計算器,其經組態以基於該所估 。十之a調週期及该終端音調脈波之該所計算之位置計算 複數個音調脈波位置, 其中該計算器經組態以比較(A)該等經定位之音調脈 ·. 波之位置與(B)該等所計算之音調脈波位置。 • 56.如請求項51之裝置,其中該編碼方案選擇器經組態以基 於比較一基於該所估計之音調週期之值與一先前訊框之 φ 曰調週期的一結果自(A)一雜訊激勵編碼方案及(B)- 無差別音調原型編碼方案之集合選擇該編碼方案。 57. 2請求項51之裝置,其甲該編碼方案選擇器經組態以判 疋孩”D曰彳„號之一第二訊框為有聲的,該第二訊框在該 語音信號中緊接該訊框之後,且 其中該編碼方案選擇器經組態以回應於(A)可選擇地 使該第一訊框編碼器編碼該訊框及(B)該第二訊框為有聲 之該判定而使該第二訊框編碼器編碼該第二訊框。 籲58_如請求項57之裝置,其中該裝置包括一經組態以對該語 音信號之一第三訊框執行一有差別編碼操作之第三訊框 編碼器’該第三訊框在該語音信號中緊接該第二訊框之 後,且 其中該第三訊框編碼器經組態以產生一包括該第 三訊框之一音調脈波形狀與該第二訊框之一音調脈波形 狀之間的一差別及(B)該第三訊框之一音調週期與該第二 訊框之一音調週期之間的一差別的表示的經編碼之訊 框0 1443l6.doc •15-
TW98137040A 2008-10-30 2009-10-30 Coding scheme selection for low-bit-rate applications TW201032219A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/261,518 US20090319263A1 (en) 2008-06-20 2008-10-30 Coding of transitional speech frames for low-bit-rate applications
US12/261,750 US8768690B2 (en) 2008-06-20 2008-10-30 Coding scheme selection for low-bit-rate applications

Publications (1)

Publication Number Publication Date
TW201032219A true TW201032219A (en) 2010-09-01

Family

ID=41470988

Family Applications (1)

Application Number Title Priority Date Filing Date
TW98137040A TW201032219A (en) 2008-10-30 2009-10-30 Coding scheme selection for low-bit-rate applications

Country Status (7)

Country Link
US (1) US8768690B2 (zh)
EP (1) EP2362965B1 (zh)
JP (1) JP5248681B2 (zh)
KR (2) KR101378609B1 (zh)
CN (2) CN102881292B (zh)
TW (1) TW201032219A (zh)
WO (1) WO2010059374A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI451746B (zh) * 2011-11-04 2014-09-01 Quanta Comp Inc 視訊會議系統及視訊會議方法

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
US9767822B2 (en) * 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
PT2676270T (pt) * 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
KR101424372B1 (ko) 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
CN104025191A (zh) * 2011-10-18 2014-09-03 爱立信(中国)通信有限公司 用于自适应多速率编解码器的改进方法和设备
US9015039B2 (en) * 2011-12-21 2015-04-21 Huawei Technologies Co., Ltd. Adaptive encoding pitch lag for voiced speech
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
US20140343934A1 (en) * 2013-05-15 2014-11-20 Tencent Technology (Shenzhen) Company Limited Method, Apparatus, and Speech Synthesis System for Classifying Unvoiced and Voiced Sound
AU2014283389B2 (en) 2013-06-21 2017-10-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
KR102120073B1 (ko) 2013-06-21 2020-06-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 개선된 피치 래그 추정을 사용하여 acelpp-형 은폐 내에서 적응적 코드북의 개선된 은폐를 위한 장치 및 방법
US9959886B2 (en) * 2013-12-06 2018-05-01 Malaspina Labs (Barbados), Inc. Spectral comb voice activity detection
CN107293287B (zh) * 2014-03-12 2021-10-26 华为技术有限公司 检测音频信号的方法和装置
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US10812558B1 (en) * 2016-06-27 2020-10-20 Amazon Technologies, Inc. Controller to synchronize encoding of streaming content
US11869482B2 (en) * 2018-09-30 2024-01-09 Microsoft Technology Licensing, Llc Speech waveform generation
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8400552A (nl) 1984-02-22 1985-09-16 Philips Nv Systeem voor het analyseren van menselijke spraak.
JPH0197294A (ja) 1987-10-06 1989-04-14 Piran Mirton 木材パルプ等の精製機
JPH02123400A (ja) 1988-11-02 1990-05-10 Nec Corp 高能率音声符号化器
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
US5233660A (en) 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5884253A (en) 1992-04-09 1999-03-16 Lucent Technologies, Inc. Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter
JP3537008B2 (ja) 1995-07-17 2004-06-14 株式会社日立国際電気 音声符号化通信方式とその送受信装置
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
JPH09185397A (ja) 1995-12-28 1997-07-15 Olympus Optical Co Ltd 音声情報記録装置
TW419645B (en) 1996-05-24 2001-01-21 Koninkl Philips Electronics Nv A method for coding Human speech and an apparatus for reproducing human speech so coded
JP4134961B2 (ja) 1996-11-20 2008-08-20 ヤマハ株式会社 音信号分析装置及び方法
US6073092A (en) 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
WO1999010719A1 (en) 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP3579276B2 (ja) 1997-12-24 2004-10-20 株式会社東芝 音声符号化/復号化方法
US5963897A (en) 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6754630B2 (en) 1998-11-13 2004-06-22 Qualcomm, Inc. Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6311154B1 (en) 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
JP4008607B2 (ja) 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
US6324505B1 (en) 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6633841B1 (en) 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
CN1296888C (zh) 1999-08-23 2007-01-24 松下电器产业株式会社 音频编码装置以及音频编码方法
US6581032B1 (en) 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US7039581B1 (en) * 1999-09-22 2006-05-02 Texas Instruments Incorporated Hybrid speed coding and system
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
EP2040253B1 (en) 2000-04-24 2012-04-11 Qualcomm Incorporated Predictive dequantization of voiced speech
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US7363219B2 (en) 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
US7472059B2 (en) 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
JP2002198870A (ja) 2000-12-27 2002-07-12 Mitsubishi Electric Corp エコー処理装置
US6480821B2 (en) 2001-01-31 2002-11-12 Motorola, Inc. Methods and apparatus for reducing noise associated with an electrical speech signal
JP2003015699A (ja) 2001-06-27 2003-01-17 Matsushita Electric Ind Co Ltd 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置
KR100347188B1 (en) 2001-08-08 2002-08-03 Amusetec Method and apparatus for judging pitch according to frequency analysis
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US7236927B2 (en) 2002-02-06 2007-06-26 Broadcom Corporation Pitch extraction methods and systems for speech coding using interpolation techniques
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
AU2002307884A1 (en) 2002-04-22 2003-11-03 Nokia Corporation Method and device for obtaining parameters for parametric speech coding of frames
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP2004109803A (ja) 2002-09-20 2004-04-08 Hitachi Kokusai Electric Inc 音声符号化装置及び方法
CA2501368C (en) 2002-10-11 2013-06-25 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
WO2004084182A1 (en) 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Decomposition of voiced speech for celp speech coding
US7433815B2 (en) 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders
CN101167125B (zh) * 2005-03-11 2012-02-29 高通股份有限公司 用于对声码器内的帧进行相位匹配的方法及设备
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
JP4599558B2 (ja) 2005-04-22 2010-12-15 国立大学法人九州工業大学 ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US20070174047A1 (en) 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
US8812306B2 (en) 2006-07-12 2014-08-19 Panasonic Intellectual Property Corporation Of America Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8239190B2 (en) 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
PT2102619T (pt) 2006-10-24 2017-05-25 Voiceage Corp Método e dispositivo para codificação de tramas de transição em sinais de voz
US8249860B2 (en) 2006-12-15 2012-08-21 Panasonic Corporation Adaptive sound source vector quantization unit and adaptive sound source vector quantization method
US20090319261A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319263A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI451746B (zh) * 2011-11-04 2014-09-01 Quanta Comp Inc 視訊會議系統及視訊會議方法

Also Published As

Publication number Publication date
JP5248681B2 (ja) 2013-07-31
CN102881292B (zh) 2015-11-18
CN102881292A (zh) 2013-01-16
CN102203855A (zh) 2011-09-28
KR20130126750A (ko) 2013-11-20
KR20110090991A (ko) 2011-08-10
CN102203855B (zh) 2013-02-20
US20090319262A1 (en) 2009-12-24
EP2362965B1 (en) 2013-03-20
WO2010059374A1 (en) 2010-05-27
US8768690B2 (en) 2014-07-01
KR101378609B1 (ko) 2014-03-27
EP2362965A1 (en) 2011-09-07
JP2012507752A (ja) 2012-03-29
KR101369535B1 (ko) 2014-03-04

Similar Documents

Publication Publication Date Title
TW201032219A (en) Coding scheme selection for low-bit-rate applications
US8825477B2 (en) Systems, methods, and apparatus for frame erasure recovery
EP2176860B1 (en) Processing of frames of an audio signal
JP2012507751A (ja) 低ビットレート適用例のための遷移音声フレームのコーディング
US8219392B2 (en) Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
US20090319261A1 (en) Coding of transitional speech frames for low-bit-rate applications
JP2004515809A (ja) ロバストな音声分類のための方法および装置
WO2000038179A2 (en) Variable rate speech coding
KR100804888B1 (ko) 프레임 에러에 대한 민감도를 감소시키기 위하여 코딩 방식선택 패턴을 사용하는 예측 음성 코더
JP4874464B2 (ja) 遷移音声フレームのマルチパルス補間的符号化
JP2004061558A (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体