TWI430263B - 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 - Google Patents

音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 Download PDF

Info

Publication number
TWI430263B
TWI430263B TW099135560A TW99135560A TWI430263B TW I430263 B TWI430263 B TW I430263B TW 099135560 A TW099135560 A TW 099135560A TW 99135560 A TW99135560 A TW 99135560A TW I430263 B TWI430263 B TW I430263B
Authority
TW
Taiwan
Prior art keywords
domain
audio
linear prediction
representation
audio content
Prior art date
Application number
TW099135560A
Other languages
English (en)
Other versions
TW201129970A (en
Inventor
Bruno Bessette
Max Neuendorf
Ralf Geiger
Philippe Gournay
Roch Lefebvre
Bernhard Grill
Jeremie Lecomte
Stefan Bayer
Nikolaus Rettelbach
Lars Villemoes
Redwan Salami
Albertus C Den Brinker
Original Assignee
Fraunhofer Ges Forschung
Voiceage Corp
Koninkl Philips Electronics Nv
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Voiceage Corp, Koninkl Philips Electronics Nv, Dolby Int Ab filed Critical Fraunhofer Ges Forschung
Publication of TW201129970A publication Critical patent/TW201129970A/zh
Application granted granted Critical
Publication of TWI430263B publication Critical patent/TWI430263B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 發明領域
依據本發明之實施例提供一種用以基於一音訊內容之編碼表示型態而提供該音訊內容之解碼表示型態之音訊信號解碼器。
依據本發明之實施例提供一種用以基於一音訊內容之輸入表示型態而提供一音訊內容之編碼表示型態其包含一第一頻譜係數集合、混疊抵消刺激信號之一表示型態、及多數線性預測域參數之音訊信號編碼器。
依據本發明之實施例提供一種基於一音訊內容之編碼表示型態而提供該音訊內容之解碼表示型態之方法。
依據本發明之實施例提供一種基於一音訊內容之輸入表示型態而提供該音訊內容之編碼表示型態之方法。
依據本發明之實施例提供一種用以執行該等方法中之一者之電腦程式。
依據本發明之實施例提供一種用於統一語音及音訊編碼(也簡稱作USAC)開窗及訊框變遷之統一構想。
發明背景
後文將解說本發明之若干背景來有助於瞭解本發明及其優點。
過去十年間,大量努力致力於創出數位式儲存及配送音訊內容的可能。就此方面而言的一項重大成就為界定國際標準ISO/IEC 14496-3。此項標準的部分3係有關音訊內容的編解碼,及部分3之次部分4係有關一般音訊編碼。ISO/IEC 14496-3,部分3,次部分4界定一般音訊內容之編碼及解碼。此外,曾經提示進一步改良來改善品質及/或減低所需位元率。此外,發現基於頻域之音訊編碼器對包含語音的音訊內容的效能並非最佳。晚近,已經提出統一語音及音訊編解碼器,其可有效組合來自兩種字元亦即語音編碼及音訊編碼技術。有關其部分細節請參考M. Neuendorf等人之公開文獻「低位元率統一語音及音訊編碼之新穎方案-MPEG-RM0」(2009年5月7至10日第126屆音訊工程學會會議,德國慕尼黑)。
此種音訊編碼器中,有些音訊框係以頻域編碼,而有些音訊框係以線性預測域編碼。
但發現難以在不同域編碼的訊框間變遷而未犧牲相當量的位元率。
有鑑於此種情況,期望提出一種編碼及解碼包含語音及一般音訊二者的音訊內容之方法,其允許有效實現使用不同模式編碼部分間的變遷。
發明概要
依據本發明之實施例提供一種用以基於一音訊內容之一編碼表示型態來提供該音訊內容之一解碼表示型態之音訊信號解碼器。該音訊信號解碼器包含一變換域路徑(例如變換編碼激發線性預測域路徑)其係組配來基於頻譜係數之第一集合、混疊抵消刺激信號之表示型態、及多數線性預測域參數(例如線性預測編碼濾波係數),而獲得以變換域模式編碼的部分音訊內容之時域表示型態。該變換域路徑包含一頻譜處理器,其係組配來依據該等線性預測域參數之至少一個子集而施加頻譜成形至該頻譜係數之(第一)集合,而獲得該頻譜係數之第一集合之頻譜成形版本。該變換域路徑也包含一(第一)頻域至時域變換器,其係組配來基於該頻譜係數之第一集合的頻譜成形版本而獲得該音訊內容之一時域表示型態。該變換域路徑也包含一混疊抵消刺激濾波器,其係組配來依據該線性預測域參數之至少一個子集而濾波一混疊抵消刺激信號,來自該混疊抵消刺激濾波器導算出一混疊抵消合成信號。該變換域路徑也包含一組合器,其係組配來組合該音訊內容之時域表示型態與該混疊抵消合成信號或其後處理版本而獲得一混疊減少時域信號。
本發明之此一實施例係基於發現一種音訊解碼器其執行於頻域之第一頻譜係數集合之該等頻譜係數集合之頻譜成形,及其藉時域濾波一混疊抵消刺激信號而運算一混疊抵消合成信號,其中該等頻譜係數集合之頻譜成形及該混疊抵消刺激信號之時域濾波二者係依據線性預測域參數執行,該音訊解碼器極為適合用於自與至以不同雜訊成形編碼之該等音訊信號部分(例如訊框)的變遷,及也適用於自與至以不同域編碼之訊框的變遷。如此,以多模式音訊信號編碼之不同模式編碼的音訊信號之變遷(例如於重疊訊框或非重疊訊框間變遷)可藉該音訊信號解碼器以良好聽覺品質及於溫和額外管理資訊量位準呈現(be rendered)。
舉例言之,執行於頻域之第一頻譜係數集合的頻譜成形,允許在變換域使用不同雜訊成形構想編碼的音訊內容部分(例如訊框)間變遷,其中可以良好效率在使用不同雜訊成形方法(例如基於定標因數之雜訊成形及基於線性預測域參數之雜訊成形)編碼的不同音訊內容部分間獲得混疊抵消。此外,前述構想也允許以不同域(例如一者以變換域,而一者以代數碼激發線性預測域)編碼之音訊內容部分(例如訊框)間的混疊假影(aliasing artifacts)有效減少。使用混疊抵消刺激信號之時域濾波允許於自及至以代數碼激發線性預測模式編碼的音訊內容部分變遷時的混疊抵消,即便該音訊內容之目前部分(其例如可以變換碼激發線性預測域模式編碼)之雜訊成形係以頻域執行而非藉時域濾波執行亦如此。
綜上所述,依據本發明之實施例允許以三種不同模式(例如頻域模式、變換編碼激發線性預測域模式、及代數碼激發線性預測模式)編碼之音訊內容部分間變遷之要求的旁資訊與聽覺品質間之良好折衷。
於較佳實施例,該音訊信號解碼器為組配來在多個編碼模式間切換之多模式音訊信號解碼器。此種情況下,該變換域分支係組配來對接在不允許混疊抵消重疊及加法運算之該音訊內容之一先前部分之後的音訊內容之一部分,或對被不允許混疊抵消重疊及加法運算之該音訊內容之一隨後部分所跟隨的音訊內容之一部分,選擇性地獲得該混疊抵消合成信號。發現施用藉該第一頻譜係數集合之頻譜係數的頻譜成形執行的雜訊成形,允許以變換域路徑編碼的音訊內容部分之變遷,且使用不同雜訊成形構想(例如基於定標因數之雜訊成形構想,及基於線性預測域參數之雜訊成形構想)而未使用混疊抵消信號,原因在於頻譜成形後使用第一頻域至時域變換器允許以變換域編碼的隨後訊框間之混疊抵消,即便於隨後音訊框使用不同雜訊成形辦法亦如此。如此,經由只對自或至以非變換域(例如以代數碼激發線性預測模式)編碼的音訊內容部分變遷,仍可藉由選擇性地獲得混疊抵消合成信號而達成位元率效率。
於較佳實施例,該音訊信號解碼器係組配來介於使用變換編碼激發資訊及線性預測域參數資訊之一變換編碼激發線性預測域模式與使用頻譜係數資訊及定標因數資訊之一頻域模式間切換。此種情況下,該變換域路徑係組配來基於該變換編碼激發資訊而獲得該頻譜係數之第一集合,及基於該線性預測域參數資訊而獲得該等線性預測域參數。該音訊信號解碼器包含一頻域路徑,其係組配來基於由該頻譜係數資訊所描述之一頻域模式頻譜係數集合,及依據由該定標因數資訊所描述之一定標因數集合而獲得以該頻域模式編碼之該音訊內容之一時域表示型態。該頻域路徑包含一頻譜處理器,其係組配來依據該定標因數集合而施用頻譜成形至該頻域模式頻譜係數集合或其前處理版本,獲得該音訊內容之一頻譜成形的頻域模式頻譜係數集合。該頻域路徑也包含一頻域至時域變換器,其係組配來基於該頻譜成形的頻域模式頻譜係數集合而獲得該音訊內容之一時域表示型態。該音訊信號解碼器係組配來使得該音訊內容之二隨後部分(該音訊內容之二隨後部分中之一者係以變換編碼激發線性預測域模式編碼,而該音訊內容之二隨後部分中之一者係以頻域模式編碼),其時域表示型態包含時間重疊來抵消由該頻域至時域變換所導致之時域混疊。
如前文討論,依據本發明之實施例之構想極為適合用於以變換編碼激發線性預測域模式及以頻域模式編碼的音訊內容部分間之變遷。由於實際上該頻譜成形係以變換編碼激發線性預測域模式於頻域執行,故可獲得極佳品質的混疊抵消。
於較佳實施例,該音訊信號解碼器係組配來介於使用變換編碼激發資訊及線性預測域參數資訊的變換編碼激發線性預測域模式與使用代數碼激發資訊及線性預測域參數資訊的代數碼激發線性預測模式間切換。此種情況下,該變換域路徑係組配來基於該變換編碼激發資訊而獲得該第一頻譜係數集合,及基於該線性預測域參數資訊而獲得該等線性預測域參數。該音訊信號解碼器包含一代數碼激發線性預測路徑,其係組配來基於該代數碼激發資訊及該線性預測域參數資訊獲得以代數碼激發線性預測(後文也簡作ACELP)模式編碼之該音訊內容之一時域表示型態。此種情況下,該ACELP路徑包含一ACELP激發處理器,其係組配來基於該代數碼激發資訊提供一時域激發信號,及一合成濾波器,其係組配來執行該時域激發信號之時域濾波來基於該時域激發信號及依據基於該線性預測域參數資訊所得之線性預測域濾波係數而提供一重建信號。該變換域路徑係組配來對接在以ACELP模式編碼之該音訊內容部分後方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分,及對在以ACELP模式編碼之該音訊內容部分前方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分選擇性地提供該混疊抵消合成信號。業已發現混疊抵消合成信號極為適合用於以變換編碼激發線性預測域(後文也簡稱作TCX-LPD)模式及ACELP模式編碼的部分(例如訊框)間之變遷。
於較佳實施例,該混疊抵消刺激濾波器係組配來依據該等線性預測域濾波參數而濾波該混疊抵消刺激信號,其係與對接在以ACELP模式編碼之該音訊內容部分後方之以TCX-LPD模式編碼的該音訊內容之一部分的該第一頻域至時域變換器左側混疊摺疊點相對應。該混疊抵消刺激濾波器係組配來依據該等線性預測域濾波參數而濾波該混疊抵消刺激信號,其係與對在以ACELP模式編碼之該音訊內容部分前方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分的該第一頻域至時域變換器右側混疊摺疊點相對應。藉由施用與混疊摺疊點相對應的線性預測域濾波參數,可獲得極其有效的混疊抵消。又,與混疊摺疊點相對應的線性預測域濾波參數典型地容易獲得,原因在於混疊摺疊點經常係位在自一個訊框變遷至下一個訊框,使得無論如何皆要求傳輸該等線性預測域濾波參數。如此,可將額外管理資料量維持於最小量。
於又一實施例,該音訊信號解碼器係組配來將該混疊抵消刺激濾波器之記憶體值啟動歸零用以提供該混疊抵消合成信號,及將M個混疊抵消刺激信號樣本饋至該混疊抵消刺激濾波器,來獲得該混疊抵消合成信號之相對應非零輸入響應樣本,及來進一步獲得該混疊抵消合成信號之多數零輸入響應樣本。該組合器較佳係組配來組合該音訊內容之時域表示型態與該等非零輸入響應樣本及隨後的零輸入響應樣本而於自以ACELP模式編碼之該音訊內容部分變換至以ACELP模式編碼的該音訊內容部分後方之以TCX-LPD模式編碼的該音訊內容之一部分時,獲得一混疊減少時域信號。藉由探討該等非零輸入響應樣本及該等零輸入響應樣本二者,可對混疊抵消刺激濾波器獲得極佳利用。又,可獲得極為平滑的混疊抵消合成信號,同時將所需混疊抵消刺激信號樣本數目維持儘可能地低。此外,藉由使用前述構想,發現混疊抵消合成信號之形狀極為適合用於典型混疊假影。如此,可獲得編碼效率與混疊抵消間之極佳折衷。
於較佳實施例,該音訊信號解碼器係組配來組合使用ACELP模式所得之該時域表示型態之至少一部分之一開窗與摺疊版本與使用TCX-LPD模式所得之該音訊內容之一隨後部分的時域表示型態來至少部分抵消混疊。業已發現除了生成混疊抵消合成信號外,使用此種混疊抵消機制提供以位元率極為有效方式而獲得混疊抵消的可能性。更明確言之,若於混疊抵消,使用ACELP模式所得之該時域表示型態之至少一部分之開窗與摺疊版本支援該混疊抵消合成信號,則所需混疊抵消刺激信號可以高效率編碼。
於較佳實施例,該音訊信號解碼器係組配來組合該ACELP分支之合成濾波器之零脈衝響應之一開窗版本與使用TCX-LPD模式所得之該音訊內容之一隨後部分的時域表示型態來至少部分抵消混疊。業已發現使用此種零脈衝響應也可協助改良混疊抵消刺激信號的編碼效率,原因在於ACELP分支之合成濾波器之零脈衝響應典型地抵消於該TCX-LPD編碼音訊內容部分的至少部分混疊。如此,混疊抵消合成信號之能量減低,而其又導致混疊抵消刺激信號的能量減低。但具有較低能量的編碼信號典型地可能有較低位元率需求。
於較佳實施例,該音訊信號解碼器係組配來於其中使用加帽頻域至時域變換之TCX-LPD模式、其中使用分接頻域至時域變換之頻域模式、與代數碼激發線性預測模式間切換。此種情況下,該音訊信號解碼器係組配來藉由執行該音訊內容之隨後重疊部分之時域樣本間的重疊及加法運算,而在以TCX-LPD模式之該音訊內容部分與以頻域模式編碼的該音訊內容部分間變換時至少部分抵消混疊。又,該音訊信號解碼器係組配來使用該混疊抵消合成信號,在以TCX-LPD模式之該音訊內容部分與以ACELP模式編碼的該音訊內容部分間變換時至少部分抵消混疊。業已發現音訊信號解碼器極為適合用於不同運算模式間之切換,其中該混疊抵消極為有效。
於較佳實施例,該音訊信號解碼器係組配來施加一共用增益值用於藉該變換域路徑(例如TCX-LPD路徑)之該第一頻域至時域變換器所提供的時域表示型態之增益定標,及用於該混疊抵消刺激信號或該混疊抵消合成信號之增益定標。業已發現再度使用此一共用增益值用於由第一頻域至時域變換器所提供的時域表示型態的定標、及用於混疊抵消刺激信號或混疊抵消合成信號的定標二者,允許以不同模式編碼的音訊內容部分間變遷時要求的位元率減低。此點極為重要,原因在於在以不同模式編碼的音訊內容部分間變遷之環境下,藉混疊抵消刺激信號編碼要求的位元率增高。
於較佳實施例,該音訊信號解碼器係組配來除了依據至少該線性預測域參數子集執行的頻譜成形外,對該第一頻譜係數集合之至少一子集施用頻譜解成形。此種情況下,該音訊信號解碼器係組配來施用該頻譜解成形至混疊抵消頻譜係數之一集合之至少一子集而自其中導算出該混疊抵消刺激信號。施用該頻譜解成形至該第一頻譜係數集合、及至該混疊抵消頻譜係數而自其中導算出該混疊抵消刺激信號,確保該混疊抵消合成信號極為適合用於由該第一頻域至時域變換器所提供的「主」音訊內容信號。再度改良用於編碼混疊抵消刺激信號之編碼效率。
於較佳情況下,該音訊信號解碼器包含一第二頻域至時域變換器,其係組配來依據表示該混疊抵消刺激信號之一頻譜係數集合而獲得該混疊抵消刺激信號之一時域表示型態。此種情況下,該第一頻域至時域變換器係組配來執行重疊變換,其包含一時域混疊。該第二頻域至時域變換器係組配來執行非重疊變換。如此,藉由使用重疊變換於該「主」信號合成,可維持高編碼效率。雖言如此,使用非重疊的額外頻域至時域變換,可達成混疊抵消。但業已發現重疊的頻域至時域變換與非重疊的頻域至時域變換組合允許單一非重疊的頻域至時域變遷之更有效變遷。
依據本發明之實施例提供一種用以基於一音訊內容之輸入表示型態而提供一音訊內容之編碼表示型態其包含一第一頻譜係數集合、混疊抵消刺激信號之一表示型態、及多數線性預測域參數之音訊信號編碼器。該音訊信號編碼器包含一時域至頻域變換器,其係組配來處理該音訊內容之輸入表示型態而獲得該音訊內容之一頻域表示型態。該音訊信號編碼器也包含一頻譜處理器,其係組配來依據用於欲以線性預測域編碼之一音訊內容部分的一線性預測域參數集合,而施用頻譜成形至一頻譜係數集合或其前處理版本來獲得該音訊內容之一頻譜成形的該音訊內容之頻域表示型態。該音訊信號編碼器也包含一混疊抵消資訊提供器,其係組配來提供混疊抵消刺激信號之一表示型態,使得該混疊抵消刺激信號依據該等線性預測域參數之至少一子集濾波,導致一混疊抵消合成信號用以抵消一音訊信號解碼器的混疊假影。
此處討論之音訊信號編碼器極為適合用來與前述音訊信號編碼器協力合作。更明確言之,音訊信號編碼器係組配來提供音訊內容之一表示型態,其中以不同模式編碼的音訊內容各部分(例如訊框或子框)間變遷時混疊抵消所需位元率額外管理資料量維持合理低量。
依據本發明之其它實施例提供一種用以提供一音訊內容之解碼表示型態之方法及一種用以提供一音訊內容之編碼表示型態之方法。該等方法係基於與前文討論之裝置之相同構想。
依據本發明之實施例提供用以執行該等方法中之一者之電腦程式。該等電腦程式也係基於相同考量。
圖式簡單說明
後文將參考所附圖式描述依據本發明之實施例,附圖中:第1圖顯示依據本發明之實施例一種音訊信號編碼器之方塊示意圖;第2a及2b圖顯示依據本發明之實施例一種音訊信號解碼器之方塊示意圖;第3a圖顯示依據統一語音及音訊編碼(USAC)草擬標準的工作草稿4,一種參考音訊信號解碼器之方塊示意圖;第3b圖顯示依據本發明之另一實施例一種音訊信號解碼器之方塊示意圖;第4圖顯示依據USAC草擬標準的工作草稿4,一種參考窗變遷之線圖表示型態;第5圖顯示依據本發明之實施例用於音訊信號編碼之窗變遷的示意表示型態;第6圖顯示提供用於依據本發明之實施例之音訊信號編碼器,或依據本發明之實施例之音訊信號解碼器的全部窗型綜覽之示意表示型態;第7圖顯示提供用於依據本發明之實施例之音訊信號編碼器,或依據本發明之實施例之音訊信號解碼器的許可窗序列之表格表示型態;第8a-8d圖顯示依據本發明之實施例一種音訊信號編碼器之細部方塊示意圖;第9a-9d圖顯示依據本發明之實施例一種音訊信號解碼器之細部方塊示意圖;第10圖顯示自及至ACELP變遷之正向混疊抵消(FAC)解碼運算之示意表示型態;第11圖顯示於編碼器之FAC標靶運算之示意表示型態;第12圖顯示於頻域雜訊成形(FDNS)之上下文中FAC標靶量化之示意表示型態;第13圖顯示加權代數LPC反量化器之原理之示意表示型態;第14圖顯示頻域通道串流「fd_channel_stream()」之語法之表格表示型態;第15a及15b圖顯示線性預測域通道串流「lpd_channel_stream()」之語法之表格表示型態;及 第16圖顯示正向混疊抵消資料「fac_data()」之語法之表格表示型態。
較佳實施例之詳細說明
1.依據第1圖之音訊信號解碼器
第1圖顯示依據本發明之實施例一種音訊信號編碼器100之方塊示意圖。音訊信號編碼器100係組配來接收音訊內容之輸入表示型態110,及基於此而提供該音訊內容之編碼表示型態112。該音訊內容之編碼表示型態112包含第一頻譜係數集合112a、多數線性預測域參數112b、及混疊抵消刺激信號之表示型態112c。
音訊信號編碼器100包含一時域至頻域變換器120,其係組配來處理該音訊內容之輸入表示型態110(或相當地,其前處理版本110’)而獲得該音訊內容之一頻域表示型態122(其可呈一頻譜係數集合形式)。
音訊信號編碼器100也包含一頻譜處理器130,其係組配來依據用於欲以線性預測域編碼之一音訊內容部分的一線性預測域參數集合140,而施用頻譜成形至該音訊內容之頻域表示型態122或其前處理版本122’來獲得該音訊內容之一頻譜成形的該音訊內容之頻域表示型態132。該第一頻譜係數集合112a可等於頻譜成形的該音訊內容之頻域表示型態132,或可自頻譜成形的該音訊內容之頻域表示型態132導算出。
音訊信號編碼器100也包含一混疊抵消資訊提供器150,其係組配來提供混疊抵消刺激信號之一表示型態112c,使得該混疊抵消刺激信號依據該等線性預測域參數140之至少一子集濾波,導致一混疊抵消合成信號用以抵消一音訊信號解碼器的混疊假影。
也須注意線性預測域參數112b例如可等於線性預測域參數140。
音訊信號編碼器110提供極為適合用於音訊內容重建之資訊,即便該音訊內容之不同部分(例如訊框或子框)係以不同模式編碼亦如此。對以線性預測域編碼,例如以變換編碼激發線性預測域模式編碼之該音訊內容部分,頻譜成形帶來雜訊成形,因此允許在時域至頻域變換後執行有較低位元率的音訊內容之量化。帶有音訊內容之前一部分或後一部分係以頻域模式編碼之該以線性預測域編碼之該音訊內容部分的混疊抵消重疊及加法。藉由使用線性預測域參數140用於頻譜成形,該頻譜成形極為適合用於口語狀音訊內容,使得對口語狀音訊內容可獲得特佳編碼效率。此外,在來自或朝向以代數碼激發線性預測模式編碼的該音訊內容部分(例如訊框或子框)變遷處,該混疊抵消刺激信號之表示型態允許有效混疊抵消。經由依據線性預測域參數提供混疊抵消刺激信號之表示型態,獲得混疊抵消刺激信號之特別有效表示型態,將總之在解碼器為已知的線性預測域參數列入考量,該表示型態可於解碼器端解碼。
綜上所述,音訊信號編碼器100極為適合用於允許以不同編碼模式編碼的音訊內容部分的變遷,且可以特別壓縮形式提供混疊抵消資訊。
2.依據第2圖之音訊信號解碼器
第2圖顯示依據本發明之實施例一種音訊信號解碼器200之方塊示意圖。該音訊信號解碼器200係組配來接收該音訊內容之一編碼表示型態210,及基於此而提供該音訊內容之解碼表示型態212,例如呈混疊減少時域信號。
音訊信號解碼器200包含一變換域路徑(例如變換編碼激發線性預測域模式),其係組配來基於頻譜係數之(第一)集合220、混疊抵消刺激信號之表示型態224、及多數線性預測域參數222,而獲得以變換域模式編碼的部分音訊內容之時域表示型態212。該變換域路徑包含一頻譜處理器230,其係組配來依據該等線性預測域參數222之至少一個子集而施加頻譜成形至該頻譜係數之(第一)集合220,而獲得該頻譜係數之第一集合220之頻譜成形版本232。該變換域路徑也包含一(第一)域至時域變換器240,其係組配來基於該頻譜係數之(第一)集合220的頻譜成形版本232而獲得該音訊內容之一時域表示型態242。該變換域路徑也包含一混疊抵消刺激濾波器250,其係組配來依據該線性預測域參數222之至少一個子集而濾波一混疊抵消刺激信號(其係以元件符號224表示),來自該混疊抵消刺激濾波器導算出一混疊抵消合成信號252。該變換域路徑也包含一組合器260,其係組配來組合該音訊內容之時域表示型態242(或相當地,其後處理版本242’)與該混疊抵消合成信號252(或相當地,其後處理版本252’)而獲得一混疊減少時域信號212。
音訊信號解碼器200可包含一選擇性處理270,其係用以自該線性預測域參數之至少一個子集導算出頻譜處理器230之設定值,其例如執行定標及/或頻域雜訊成形。
音訊信號解碼器200也包含一選擇性處理280,其係用以自該線性預測域參數222之至少一個子集導算出混疊抵消刺激信號250之設定值,其例如可執行合成濾波用以合成混疊抵消合成信號252。
音訊信號解碼器200係組配來提供混疊減少時域信號212,其極為適合用來與下列二者組合:組合表示音訊內容且以頻域運算模式獲得的時域信號,及組合表示音訊內容且以ACELP運算模式獲得的時域信號。在使用頻域運算模式(使用第2圖未顯示之頻域路徑)解碼的音訊內容部分(例如訊框)與使用第2圖之變換域路徑解碼的音訊內容部分(例如訊框或子框)間存在有特佳重疊及加法特性,原因在於雜訊成形係於頻域亦即於頻域至時域變換240之前,藉頻譜處理器230施行。此外,在使用第2圖變換域路徑解碼的音訊內容部分(例如訊框或子框)與使用ACELP解碼路徑解碼的音訊內容部分(例如訊框或子框),原因在於混疊抵消合成信號252係依據線性預測域參數,基於混疊抵消刺激信號的濾波提供。藉此方式獲得的混疊抵消合成信號252典型地極為適合用於出現在以TCX-LPD模式編碼之音訊內容部分與以ACELP模式編碼的音訊內容部分間變遷時的混疊假影。有關音訊信號解碼運算之額外選擇性細節容後詳述。
3.依據第3a及3b圖之切換音訊解碼器
後文中,將參考第3a及3b圖簡短討論多模式音訊信號解碼器之構想。
3.1.依據第3a圖之音訊信號解碼器300
第3a圖顯示參考多模式音訊信號解碼器之方塊示意圖;及第3b圖顯示依據本發明之實施例多模式音訊信號解碼器之方塊示意圖。換言之,第3a圖顯示參考系統之基本解碼器信號流(例如依據USAC草擬模準工作草稿4),第3b圖顯示依據本發明之實施例所提示之系統之基本解碼器信號流。
首先將參考第3a圖描述音訊信號解碼器300。音訊信號解碼器300包含一位元多工器310,其係組配來接收輸入位元串流,及提供含括於該位元串流的資訊予該處理分支之適當處理單元。
音訊信號解碼器300包含一頻域模式路徑320,其係組配來接收定標因數資訊322及編碼頻譜係數資訊324,及基於此而提供以頻域模式編碼的音訊框之時域表示型態326。音訊信號解碼器300也包含變換編碼激發線性預測域路徑330,其係組配來接收編碼變換域激發資訊332及線性預測係數資訊334(也稱作為線性預測域資訊或稱作為線性預測編碼濾波資訊),及基於此而提供以變換編碼激發線性預測域(TCX-LPD)模式編碼的音訊框或音訊子框之時域表示型態。音訊信號解碼器300也包含代數碼激發線性預測(ACELP)路徑340,其係組配來接收編碼激發資訊342及線性預測編碼資訊344(也標示為線性預測係數資訊、或線性預測域資訊、或線性預測編碼濾波資訊),及基於此而提供時域線性預測編碼資訊來作為以ACELP模式編碼的音訊框或音訊子框之表示型態。音訊信號解碼器300也包含變遷開窗,其係組配來接收以不同模式編碼的音訊內容之訊框或子框之時域表示型態326、336、346,及使用變遷開窗組合該時域表示型態。
頻域路徑320包含一算術解碼器320a,其係組配來解碼該編碼頻譜表示型態324來獲得解碼頻譜表示型態320b;一反量化器320d,其係組配來基於該解碼頻譜表示型態320b提供反量化之頻譜表示型態320e;一定標320e其係組配來依據定標因數而定標反量化之頻譜表示型態320d,來獲得定標頻譜表示型態320f;及一(反)修正離散餘弦變換320g,用以基於定標頻譜表示型態320f而提供時域表示型態326。
TCX-LPD分支330包含一算術解碼器330a,其係組配來基於編碼之頻譜表示型態332而提供解碼之頻譜表示型態330b;一反量化器330c其係組配來基於解碼之頻譜表示型態330b而提供反量化之頻譜表示型態330d;一(反)修正離散餘弦變換330e用以基於反量化之頻譜表示型態330d提供一激發信號330f;及一線性預測編碼合成濾波器330g用以基於激發信號330f及線性預測編碼濾波係數334(偶爾也標示為線性預測域濾波係數)而提供時域表示型態336。
ACELP分支340包含一ACELP激發處理器340a,其係組配來基於編碼之激發信號342而提供ACELP激發信號340b;及一線性預測編碼合成濾波器340c用以基於ACELP激發信號340b及線性預測編碼濾波係數344而提供時域表示型態346。
3.2.依據第4圖之變遷開窗
現在參考第4圖,將描述變遷開窗350之進一步細節。首先,將敘述音訊信號解碼器300之一般訊框結構。但須注意極為類似的訊框結構而只有微小差異,或甚至相同的一般訊框結構將用於此處所述其它音訊信號編碼器或音訊信號解碼器。也須注意音訊框典型地包含N樣本長度,其中N可等於2048。該音訊內容之隨後訊框可重疊約50%,例如重疊N/2音訊樣本。一音訊框可以頻域編碼,使得一音訊框的N個時域樣本係藉例如N/2頻譜係數集合表示。另外,一音訊框之N個時域樣本也可藉例如多個集合,例如128頻譜係數之8個集合表示。如此,可獲得較高時間解析度。
若一音訊框的N個時域樣本係使用單一頻譜係數集合而以頻域模式編碼,則單一窗諸如所謂的「STOP_START」窗、所謂的「AAC長」窗、所謂的「AAC開始」窗、或所謂的「AAC停止」窗可施用來開窗由反修正離散餘弦變換320g所提供的時域樣本326。相反地,若一音訊框的N個時域樣本係使用單一頻譜係數集合編碼,則多數較短窗例如「AAC短」窗類型可施用來開窗使用不同頻譜係數集合所得的時域表示型態。舉例言之,分開短窗可施用至基於與單一音訊框相關聯之個別頻譜係數集合所得的時域表示型態。
以線性預測域模式編碼之一音訊框可再劃分成多個子框,其偶爾稱作為「訊框」。各個子框可以TCX-LPD模式或以ACELP模式編碼。據此,但於TCX-LPD模式,子框中之二者或甚至四者可使用描述變換編碼激發的單一頻譜係數集合而共同編碼。
以TCX-LPD模式編碼之子框(或一組2或4子框)可藉一頻譜係數集合及一個或多數線性預測編碼濾波係數集合表示。以ACELP模式編碼之音訊內容的一個子框可藉編碼之ACELP激發信號及一個或多數線性預測編碼濾波係數集合表示。
現在參考第4圖,將描述訊框或子框間之變遷實務。於第4圖之示意表示型態中,橫座標402a至402i描述以音訊樣本表示之時間,及縱座標404a至404i描述提供時域樣本之窗及/或時間區。
元件符號410顯示以頻域編碼之二重疊訊框間之變遷。元件符號420顯示自以ACELP模式編碼之一子框至以頻域模式編碼之一訊框之變遷。元件符號430顯示自以TCX-LPD模式(也標示為「wLPT」模式)編碼之一訊框(或一子框)至以頻域模式編碼之一訊框之變遷。元件符號440顯示以頻域模式編碼之一訊框與以ACELP模式編碼之一子框間之變遷。元件符號450顯示以ACELP模式編碼之子框間之變遷。元件符號460顯示自以TCX-LPD模式編碼之一子框至以ACELP模式編碼之一子框之變遷。元件符號470顯示自以頻域模式編碼之一訊框至以TCX-LPD模式編碼之一子框間之變遷。元件符號480顯示以ACELP模式編碼之一子框與以TCX-LPD模式編碼之一子框間之變遷。元件符號490顯示以該模式編碼之子框間之變遷。
令人關注地,元件符號430顯示的自TCX-LPD模式變遷至頻域模式略為無效,或甚至TCX-LPD極為無效,原因在於傳輸至解碼器的部分資訊被捨棄。同理,元件符號460及480顯示ACELP模式與TCX-LPD模式間之變遷實際無效,原因在於傳輸至解碼器的部分資訊被捨棄。
3.3.依據第3b圖之音訊信號解碼器360
後文中,將描述依據本發明之實施例之音訊信號解碼器360。
音訊信號解碼器360包含位元多工器或位元串流剖析器362,其係組配來接收音訊內容之位元串流表示型態361,及基於此而提供資訊元素至音訊信號解碼器360之不同分支。
音訊信號解碼器360包含頻域分支370,其係自位元串流多工器362接收已編碼之定標因數資訊372及已編碼之頻譜資訊374,及基於此而提供以頻域模式編碼之訊框的時域表示型態376。音訊信號解碼器360也包含TCX-LPD路徑380,其係組配來接收已編碼之頻譜表示型態382及已編碼之線性預測編碼濾波係數384,及基於此而提供以TCX-LPD模式編碼之音訊框或音訊子框之時域表示型態386。
音訊信號解碼器360包含一ACELP路徑390,其係組配來接收已編碼之ACELP激發392及已編碼之線性預測編碼濾波係數394,及基於此而提供以ACELP模式編碼之音訊子框之時域表示型態396。
音訊信號解碼器360也包含一變遷開窗398,其係組配來施用適當變遷開窗至以不同模式編碼的訊框及子框之時域表示型態376、386、396來導算出一連續音訊信號。
此處須注意頻域分支370之一般結構及功能可與頻域分支320相同,即便如此,頻域分支370可能有不同的或額外的混疊抵消機制。此外,ACELP分支390之一般結構及功能可與ACELP分支340相同,故也適用前文說明。
但TCX-LPD分支380與TCX-LPD分支330之差異在於於TCX-LPD分支380,雜訊成形係在修正離散餘弦反變換之前進行。又,TCX-LPD分支380包含額外混疊抵消功能。
TCX-LPD分支380包含一算術解碼器380a,其係組配來接收已編碼之頻譜表示型態382,及基於此而提供已解碼之頻譜表示型態380b。TCX-LPD分支380也包含一反量化器380c其係組配來接收該已解碼之頻譜表示型態380b,及基於此而提供反量化之頻譜表示型態380d。TCX-LPD分支380也包含一定標及/或頻域雜訊成形380e,其係組配來接收該反量化之頻譜表示型態380d及一頻譜成形資訊380f,及基於此而提供一頻譜成形頻譜表示型態380g予一修正離散餘弦反變換380h,其係基於頻譜成形頻譜表示型態380g而提供時域表示型態386。TCX-LPD分支380也包含一線性預測係數至頻域變換器380i,其係組配來基於該線性預測編碼濾波係數384提供頻譜定標資訊380f。
有關音訊信號解碼器360之功能,可謂頻域分支370及TCX-LPD分支380極為類似,在於其各自以相同處理順序包含一處理鏈,具有一算術解碼一反量化一頻譜定標、及一修正離散餘弦反變換。如此,頻域分支370及TCX-LPD分支380之輸出信號376、386極為類似,在於其皆為修正離散餘弦反變換之未經濾波的(變遷開窗為例外)輸出信號。據此,時域信號376、386極為適合用於重疊及加法運算,其中藉重疊及加法運算達成時域混疊抵消。如此,可藉單純重疊及加法運算有效執行介於以頻域模式編碼之一音訊框及以TCX-LPD模式編碼之一音訊框或一音訊子框間的變遷,而未要求任何額外混疊抵消資訊且未捨棄任何資訊。如此,最小量旁資訊即足。
此外,須注意依據定標因數資訊於頻域路徑370執行的反量化頻譜表示型態的定標可有效獲致藉編碼器端量化及解碼器端反量化320c所導入的量化雜訊之雜訊成形,該雜訊成形良好適合一般音訊信號諸如音樂信號。相反地,依據線性預測編碼濾波係數執行的定標及/或頻域雜訊成形380e,有效獲致由編碼器端量化及解碼器端反量化380c所造成的量化雜訊之雜訊成形,該雜訊成形良好適合口語狀音訊信號。據此,頻域分支370及TCX-LPD分支380之唯一差異在於頻域施用不同雜訊成形,使得使用頻域分支370時編碼效率(或音訊品質)對一般音訊信號為特佳,及使得使用TCX-LPD分支380時,編碼效率或音訊品質對口語狀音訊信號為特高。
須注意TCX-LPD分支380較佳包含額外混疊抵消機制用於以TCX-LPD模式及以ACELP模式編碼的音訊框或音訊子框間的變遷。
3.4.依據第5圖之變遷開窗
第5圖顯示本發明涵蓋之開窗方案實例之線圖表示型態,該方案可應用於音訊信號解碼器360或依據本發明之任何其它音訊信號編碼器及音訊信號解碼器。第5圖表示在不同節點的訊框或子框間可能的變遷開窗。橫座標502a至502i係以音訊樣本描述時間,及縱座標504a至504i描述窗或用以提供音訊內容之時域表示型態的子框。
元件符號510之線圖表示型態顯示以頻域模式編碼的隨後訊框間之變遷。由此可知,對一訊框之第一右半提供的時域樣本(例如藉修正離散餘弦反變換(MDCT)320g)係藉右半窗512開窗,窗可屬例如窗型「AAC長」或窗型「AAC停止」。同理,對一隨後第二訊框之左半提供的時域樣本(例如藉MDCT 320g)係使用左半窗514開窗,窗可屬例如窗型「AAC長」或窗型「AAC開始」。右半窗512例如可包含較長的右側變遷斜坡,而隨後窗的左半514可包含較長的左側變遷斜坡。第一音訊框之時域表示型態之開窗版本(使用右半窗512開窗)及隨後第二音訊框之時域表示型態之開窗版本(使用左半窗514開窗)可重疊且可相加。據此來自MDCT的混疊可有效抵消。
元件符號520之線圖表示型態顯示自以ACELP模式編碼的子框變遷至以頻域模式編碼的訊框。於此變遷,可施用正向混疊抵消來減少混疊假影。
元件符號530之線圖表示型態顯示自以TCX-LPD模式編碼的子框變遷至以頻域模式編碼的訊框。如此可知,一窗532係施用至藉TCX-LPD路徑之反MDCT 380h提供的時域樣本,該窗例如可屬窗型「TCX256」、「TCX512」、及「TCX1024」。窗532可包含長128時域樣本之右側變遷斜坡533。窗534係施用至對以頻域模式編碼的隨後音訊框藉頻域路徑370之MDCT所提供的時域樣本。窗534例如可屬窗型「停止開始」或「AAC停止」,且可包含例如具有128時域樣本長度之左側變遷斜坡535。藉右側變遷斜坡533開窗的TCX-LPD模式編碼之子框之時域樣本係與藉左側變遷斜坡535開窗的以頻域模式編碼之隨後音訊框之時域樣本重疊與相加。變遷斜坡533與535匹配,使得混疊抵消係於自TCX-LPD模式編碼子框及隨後的頻域模式編碼子框變遷時獲得。藉由於反MDCT 380h執行前,執行定標/頻域雜訊成形380e,讓混疊抵消變成可能。換言之,混疊抵消係藉下述事實造成,頻域路徑370之反MDCT 320g及TCX-LPD路徑380之反MDCT 380h二者被饋以已經施加雜訊成形的頻譜係數(例如呈定標因數相依性定標及LPC濾波係數相依性定標形式)。
元件符號540之線圖表示型態顯示自以頻域模式編碼之音訊框變遷至以ACELP模式編碼之子框。如圖可知,施用正向混疊抵消(FAC)來減少或甚至消除此變遷處的混疊假影。
元件符號550之線圖表示型態顯示自以ACELP模式編碼之音訊子框變遷至以ACELP模式編碼之另一個音訊子框。若干實施例中,此處無需特定混疊抵消處理。
元件符號560之線圖表示型態顯示自以TCX-LPD模式(也標示為wLPT模式)編碼之子框變遷至以ACELP模式編碼之音訊子框。如圖可知,藉TCX-LPD分支380之MDCT 380h所提供之時域樣本係使用窗562開窗,該窗例如可屬窗型「TCX256」、「TCX512」、或「TCX1024」。窗562包含較短的右側變遷斜坡563。對以ACELP模式編碼之隨後音訊子框所提供之時域樣本包含與藉窗532之右側變遷斜坡563開窗的先前以TCX-LPD模式編碼之音訊子框提供的時域樣本之部分時間重疊。對以ACELP模式編碼之音訊子框所提供之時域音訊樣本係以方塊,藉元件符號564表示。
如此可知,一正向混疊抵消信號566係加在示自以TCX-LPD模式編碼之音訊框變遷至以ACELP模式編碼之音訊框,來減少或甚至消除混疊假影。以下將敘述有關混疊抵消信號566之細節。
元件符號570之線圖表示型態顯示自以頻域模式編碼之一訊框變遷至以TCX-LPD模式編碼之一隨後訊框。藉頻域分支370之反MDCT 320g所提供之時域樣本可藉具有較短右側變遷斜坡573之窗572開窗,例如藉窗型「停止開始」或「AAC開始」開窗。藉TCX-LPD分支380之反MDCT 380h對隨後以TCX-LPD模式編碼之音訊子框提供的時域表示型態可藉包含較短的左側變遷斜坡575之窗574開窗,該窗574可屬窗型例如「TCX256」、「TCX512」、或「TCX1024」。藉右側變遷斜坡573開窗的之時域樣本係與藉左側變遷斜坡575開窗的時域樣本係藉變遷開窗398重疊與相加,使得混疊假影減少或甚至消除。據此,無需額外旁資訊來執行自以頻域模式編碼之音訊框變遷至以TCX-LPD模式編碼之音訊子框。
元件符號580之線圖表示型態顯示自以ACELP模式編碼之音訊框變遷至以TCX-LPD模式(也標示為wLPT模式)編碼之音訊框。藉ACELP分支提供的時域樣本之一時間區標示為582。窗584係施用至藉TCX-LPD分支380之反MDCT 380h所提供之時域樣本。該窗584例如可屬窗型「TCX256」、「TCX512」、或「TCX1024」,可包含較短的左側變遷斜坡585。窗584之左側變遷斜坡585部分重疊藉ACELP分支所提供之時域樣本,以方塊582表示。此外,提供混疊抵消信號586來減少或甚至消除出現在自以ACELP模式編碼之音訊子框變遷至以TCX-LPD模式編碼之音訊子框的混疊假影。有關混疊抵消信號586之細節容後詳述。
元件符號590之線圖表示型態顯示自以TCX-LPD模式編碼之一音訊子框變遷至以TCX-LPD模式編碼之另一音訊子框。藉TCX-LPD模式編碼之一第一音訊子框之時域樣本係使用窗592開窗,窗例如可屬窗型例如「TCX256」、「TCX512」、或「TCX1024」,其可包含較短的右側變遷斜坡593。藉TCX-LPD分支380之反MDCT 380h對隨後以TCX-LPD模式編碼之第二音訊子框提供的時域音訊樣本可使用包含較短的左側變遷斜坡595之窗594開窗,該窗594可屬窗型例如「TCX256」、「TCX512」、或「TCX1024」。使用右側變遷斜坡593開窗的之時域樣本係與藉左側變遷斜坡595開窗的時域樣本係藉變遷開窗398重疊與相加。如此,因反MDCT 380h所造成的混疊減少或甚至消除。
4.全部窗型之綜論
後文中,將提供全部窗型的綜論。為了達成此項目的,參考第6圖,顯示不同窗類型及其特性之線圖表示型態。第6圖之表中,欄610描述左側重疊長度,其可等於左側變遷斜坡之長度。欄612描述變換長度,亦即用以產生時域表示型態之頻譜係數數目,其係藉個別窗開窗。欄614描述右側重疊長度,其可等於右側變遷斜坡之長度。欄616描述窗型名稱。欄618顯示個別窗之線圖表示型態。
第一列630顯示「AAC短」型窗之特性。第二列632顯示「TCX256」型窗之特性。第三列634顯示「TCX512」型窗之特性。第四列636顯示「TCX1024」型窗之特性。第五列638顯示「AAC長」型窗之特性。第六列640顯示「AAC開始」型窗之特性。第七列642顯示「AAC停止」型窗之特性。
值得注意者,「TCX256」、「TCX512」、及「TCX1024」類型之窗的變遷斜坡係適用於「AAC開始」該型窗之右側變遷斜坡及適用於「AAC停止」該型窗之左側變遷斜坡,來藉使用不同型窗開窗的時域表示型態重疊及相加而允許時域混疊抵消。於較佳實施例,具有相同左側重疊長度的全部窗型之左側窗斜坡(變遷斜坡)可相同,而具有相同右側重疊長度的全部窗型之左側變遷斜坡可相同。又,具有相同重疊長度的左側變遷斜坡及右側變遷斜坡適用於允許混疊抵消,滿足MDCT混疊抵消狀況。
5.容許的窗順序
後文中,將參考第7圖說明容許的窗順序,該圖顯示此種容許的窗順序之表格表示型態。如第7圖之表可知,其時域樣本係使用「AAC停止」型窗開窗的以頻域模式編碼之音訊框,可被其時域樣本係使用「AAC長」型窗或「AAC開始」型窗開窗的以頻域模式編碼之音訊框所跟隨。
其時域樣本係使用「AAC停止」型窗開窗的以頻域模式編碼之音訊框,可被其時域樣本係使用「AAC長」或「AAC開始」型窗開窗的以頻域模式編碼之音訊框所跟隨。
其時域樣本係使用「AAC開始」型窗開窗的以線性預測域模式編碼之音訊框,可被其時域樣本係使用8個「AAC短」型窗,使用一個「AAC短」型窗或使用一個「AAC停止開始」型窗開窗的以頻域模式編碼之音訊框所跟隨。另外,其時域樣本係使用一個「AAC開始」型窗,使用8個「AAC短」型窗,或使用一個「AAC停止開始」型窗開窗的以頻域模式編碼之音訊框可被以TCX-LPD模式(也標示為LPD-TCX)編碼之音訊框或音訊子框,或以ACELP模式(也標示為LPC ACELP)編碼之音訊框或音訊子框所跟隨。
其時域樣本係使用8個「AAC短」型窗,使用一個「AAC停止」型窗,或使用一個「AAC停止開始」型窗開窗的以TCX-LPD模式編碼之音訊框可被以TCX-LPD模式編碼之音訊框或音訊子框,或被以ACELP模式編碼之音訊框或音訊子框所跟隨。
以ACELP模式編碼之音訊框可被其時域樣本係使用8個「AAC短」型窗,使用一個「AAC停止」型窗,或使用一個「AAC停止開始」型窗開窗的以頻域模式編碼之音訊框,被以TCX-LPD模式編碼之音訊框或音訊子框,或被以ACELP模式編碼之音訊框或音訊子框所跟隨。
為了自以ACELP模式編碼之音訊框變遷至以頻域模式編碼之音訊框,或變遷至以TCX-LPD模式編碼之音訊框,進行所謂的正向混疊抵消(FAC)。據此,混疊抵消合成信號係於此種訊框變遷時加至該時域表示型態,藉此減少或甚至消除混疊假影。同理,當自以頻域模式編碼之訊框或子框,或自以TCX-LPD模式編碼之訊框或子框切換至以ACELP模式編碼之訊框或子框時也執行正向混疊抵消(FAC)。
有關正向混疊抵消(FAC)之細節討論如下。
6.依據第8圖之音訊信號編碼器
後文中,將參考第8圖說明多模式音訊信號編碼器800。
音訊信號編碼器800係組配來接收一音訊內容之輸入表示型態810,且基於此而提供表示該音訊內容之位元串流812。音訊信號編碼器800係組配來以不同模式運算,換言之頻域模式、變換編碼激發線性預測域模式、及代數碼激發線性預測域模式。音訊信號編碼器800包含且編碼控制器814,其係組配來依據該音訊內容之輸入表示型態810特性及/或依據可達成的編碼效率或品質而選定音訊內容部分之編碼模式中之一者。
音訊信號編碼器800包含一頻域分支820,其係組配來基於該音訊內容之輸入表示型態810,而提供編碼頻譜係數822、編碼定標因數824、及選擇性地,編碼混疊抵消係數826。音訊信號編碼器800也包含一TCX-LPD分支850,其係組配來依據音訊內容之輸入表示型態810而提供編碼頻譜係數集合852、編碼線性預測域參數854、及編碼混疊抵消係數856。音訊信號編碼器800也包含一ACELP分支880,其係組配來依據該音訊內容之輸入表示型態810提供編碼ACELP激發882及編碼線性預測域參數884。
頻域分支820包含一時域至頻域變換830,其係組配來接收該音訊內容之輸入表示型態810或其前處理版本,且基於此而提供該音訊內容之頻域表示型態832。頻域分支820也包含一心理聲學分析834,其係組配來評估該音訊內容之頻率遮蔽效應及/或時間遮蔽效應,及基於此而提供描述定標因數之定標因數資訊836。頻域分支820也包含一頻譜處理器838,其係組配來接收該音訊內容之頻域表示型態832及定標因數資訊836,且依據該定標因數資訊836來施用頻率相依性及時間相依性定標至該頻域表示型態832之頻譜係數,而獲得該音訊內容之定標頻域表示型態840。頻域分支也包含一量化/編碼842,其係組配來定標頻域表示型態840,及基於該定標頻域表示型態840而執行量化及編碼來獲得編碼頻譜係數822。頻域分支也包含量化/編碼844,其係組配來接收該定標因數資訊836,及基於此而提供編碼定標因數資訊824。選擇性地,頻域分支820也包含混疊抵消係數計算846,其可組配來提供混疊抵消係數826。
TCX-LPD分支850包含一時域至頻域變換860,其可經組配來接收該音訊內容之輸入表示型態810,及基於此而提供該音訊內容之頻域表示型態861。TCX-LPD分支850也包含一線性預測域參數計算862,其係組配來接收該音訊內容之輸入表示型態810或其前處理版本,且自該音訊內容之輸入表示型態810而導算出一個或多數線性預測域參數(例如線性預測編碼濾波係數)863。TCX-LPD分支850也包含一線性預測域至頻域變換864,其係組配來接收該等線性預測域參數(例如線性預測編碼濾波係數)且基於此而提供頻譜域表示型態或頻域表示型態。該等線性預測域參數之頻譜域表示型態或頻域表示型態例如可表示藉線性預測域參數於頻域或頻譜域界定的一濾波器之濾波響應。TCX-LPD分支850也包含一頻譜處理器866,其係組配來接收該頻域表示型態861或其前處理版本861’,及該等線性預測域參數863之頻譜域表示型態或頻域表示型態。該頻譜處理器866係組配來執行該頻域表示型態861或其前處理版本861’之頻譜成形,其中該等線性預測域參數863之頻域表示型態或頻譜域表示型態865係用來調整該頻域表示型態861或其前處理版本861’之不同頻譜係數的定標。據此,該頻譜處理器866依據線性預測域參數863而提供該頻域表示型態861或其前處理版本861’之頻譜成形版本867。TCX-LPD分支850也包含一量化/編碼868,其係組配來接收頻譜成形頻域表示型態867,及基於此而提供編碼頻譜係數集合852。TCX-LPD分支850也包含另一量化/編碼869,其係組配來收該線性預測域參數863,及基於此而提供編碼線性預測域參數854。
TCX-LPD分支850進一步包含一混疊抵消係數提供,其係組配來提供已編碼之混疊抵消係數提供。該混疊抵消係數提供包含一誤差運算870,其係組配來依據編碼頻譜係數,及依據該音訊內容之輸入表示型態810,運算混疊誤差資訊871。誤差運算870可選擇性地將由其它機制所提供的有關額外混疊抵消組分的資訊872列入考慮。混疊抵消係數提供也包含一分析濾波運算873,其係組配來依據線性預測域參數863提供描述誤差濾波之資訊873a。混疊抵消係數提供也包含一誤差分析濾波874,其係組配來接收混疊誤差資訊871及分析濾波組態資訊873a,且施用依據分析濾波資訊873a而調整的誤差分析濾波至該混疊誤差資訊871而獲得一已濾波的混疊誤差資訊874a。混疊抵消係數提供也包含一時域至頻域變換875,其可具有IV型離散餘弦變換功能,及其係組配來接收該已濾波的混疊誤差資訊874a,及基於此而提供該已濾波的混疊誤差資訊874a之頻域表示型態875a。混疊抵消係數提供也包含一量化/編碼876,其係組配來接收該頻域表示型態875a,及基於此而提供已編碼混疊抵消係數856,使得該已編碼混疊抵消係數856編碼該頻域表示型態875a。
混疊抵消係數提供也包含一選擇性的ACELP對混疊抵消之運算877。運算877係組配來運算或估算對混疊抵消之貢獻,其係可自TCX-LPD模式編碼之音訊框前方之以ACELP模式編碼之音訊子框而導算出。ACELP對混疊抵消之貢獻的運算可包含後ACELP合成之運算、後ACELP合成之開窗、及已開窗的後ACELP合成之合成,來獲得有關額外混疊抵消組分之資訊872,其可自以ACELP模式編碼之前一個音訊子框導算出。此外或另外,運算877可包含藉以ACELP模式編碼之前一個音訊子框解碼所啟動的濾波器之零輸入響應運算,及該零輸入響應之開窗,來獲得有關額外混疊抵消組分之資訊872。
後文中,將簡短討論ACELP分支880。ACELP分支880包含一線性預測域參數資訊計算890,其係組配來基於該音訊內容之輸入表示型態810而運算線性預測域參數890a。ACELP分支880也包含一ACELP激發運算892,其係組配來依據該音訊內容之輸入表示型態810及該線性預測域參數890a而運算ACELP激發資訊892。ACELP分支880也包含一編碼894,其係組配來編碼ACELP激發資訊892而獲得已編碼ACELP激發882。此外,ACELP分支880也包含量化/編碼896,其係組配來接收該線性預測域參數890a,及基於此而提供已編碼線性預測域參數884。
音訊信號解碼器800也包含一位元串流格式化器898,其係組配來基於該等已編碼頻譜係數822、已編碼定標因數資訊824、混疊抵消係數826、已編碼頻譜係數852、已編碼線性預測域參數852、已編碼混疊抵消係數856、已編碼ACELP激發882、及已編碼線性預測域參數884而提供位元串流812。
有關已編碼線性預測域參數852之提供細節將敘述如下。
7.依據第9圖之音訊信號解碼器
後文中,將描述依據第9圖之音訊信號解碼器900。
依據第9圖之音訊信號解碼器900係類似於依據第2圖之音訊信號解碼器200及也類似於依據第3b圖之音訊信號解碼器360,因此仍然適用前文說明。
音訊信號解碼器900包含一位元多工器902,其係組配來接收一位元串流,及提供擷取自該位元串流之資訊予相對應處理路徑。
該音訊信號解碼器900包含一頻域分支910,其係組配來接收已編碼頻譜係數912及一已編碼定標因數資訊914。該頻域分支910係選擇性地組配來也接收混疊抵消係數,其例如介於以頻域模式編碼之音訊框與以ACELP模式編碼之音訊框間的變遷,允許所謂的正向混疊抵消。頻域分支910提供以頻域模式編碼之音訊框之音訊內容的時域表示型態918。
該音訊信號解碼器900包含一TCX-LPD分支930,其係組配來接收已編碼頻譜係數932、已編碼線性預測域參數934、及已編碼混疊抵消係數936,及基於此而提供以TCX-LPD模式編碼之音訊框或音訊子框。該音訊信號解碼器900也包含一ACELP分支980,其係組配來接收一已編碼ACELP激發982及已編碼線性預測域參數984,及基於此而提供以ACELP模式編碼之音訊框或音訊子框之時域表示型態986。
7.1.頻域路徑
後文中,將描述有關頻域路徑之細節。須注意該頻域路徑係類似於音訊解碼器300之頻域路徑320,故參考前文說明。頻域分支910包含一算術解碼920其接收已編碼頻譜係數912,及基於此而提供已解碼頻譜係數920a;及一反量化921其接收已解碼頻譜係數920a,及基於此而提供反量化頻譜係數921a。頻域分支910也包含一定標因數解碼922其接收已編碼定標因數資訊,及基於此而提供已解碼定標因數資訊922a。頻域分支包含一定標923,其接收反量化頻譜係數921a且依據定標因數922a而定標該反量化頻譜係數來獲得已定標頻譜係數923a。舉例言之,定標因數922a可提供予多數頻帶,其中頻譜係數數目921a之頻倉係與各個頻帶相關聯。據此,可執行頻譜係數921a之逐頻帶定標。如此,與一音訊框相關聯之定標因數數目典型地係小於與該音訊框相關聯之頻譜係數數目921a。頻域分支910也包含一反MDCT 924,其係組配來接收已定標頻譜係數923a,及/或該目前音訊框之音訊內容之時域表示型態924a。頻域分支910選擇性地也包含一組合925,其係組配來組合時域表示型態924a與混疊抵消合成信號929a而獲得時域表示型態918。但於若干其它實施例,組合925可被刪除,使得時域表示型態924a係提供作為該音訊內容之時域表示型態918。
為了提供該混疊抵消合成信號929a,該頻域路徑包含一解碼926a其係基於已編碼混疊抵消係數916而提供已解碼混疊抵消係數926b,及一混疊抵消係數的定標926c,其係基於該已解碼混疊抵消係數926b而提供已定標混疊抵消係數926d。該頻域路徑也包含一IV型反離散餘弦變換927,其係組配來接收已定標混疊抵消係數926d,及基於此而提供混疊抵消刺激信號927a其係輸入合成濾波927b。該合成濾波927b係組配來基於混疊抵消刺激信號927a而執行合成濾波運算,及依據由合成濾波運算927d所提供的合成濾波係數927c來獲得混疊抵消係數929a作為合成濾波結果。合成濾波運算927d係依據線性預測域參數而提供合成濾波係數927c,該等線性預測域參數例如可自對以TCX-LPD模式編碼之一訊框或對以ACELP模式編碼之一訊框的位元串流中所提供之線圖表示型態而導算出(或可等於此等線性預測域參數)。
據此,合成濾波運算927d可提供混疊抵消合成信號929a,該混疊抵消合成信號929a可相當於第5圖所示混疊抵消合成信號522或相當於第5圖所示混疊抵消合成信號542。
7.2. TCX-LPD路徑
後文中,將簡短討論音訊信號解碼器900之TCX-LPD。進一步細節提供如下。
TCX-LPD路徑930包含一主信號合成940,其係組配來基於已編碼頻譜係數932及已編碼線性預測域參數934而提供一音訊框或音訊子框之音訊內容的時域表示型態940a。TCX-LPD分支930也包含一混疊抵消處理,其將說明如下。
主信號合成940包含一頻譜係數之算術解碼941,其中該已解碼頻譜係數941a係基於已編碼頻譜係數932獲得。主信號合成940也包含一反量化942,其係組配來基於已解碼頻譜係數941a而提供。選擇性雜訊填補可施用至反量化頻譜係數942a來獲得已雜訊填補之頻譜係數。已反量化且已雜訊填補之頻譜係數943a也可標示以r[i]。已反量化且已雜訊填補之頻譜係數943a亦即r[i]可藉頻譜解成形944處理,來獲得頻譜解成形頻譜係數944a,其偶爾也可標示以r[i]。定標945可組配成頻域雜訊成形945。於該頻域雜訊成形945,獲得已頻譜成形之頻譜係數945a集合,其也可標示以rr[i]。於該頻域雜訊成形945,頻譜解成形頻譜係數944a對已頻譜成形之頻譜係數945a係藉頻域雜訊成形參數945b判定,頻域雜訊成形參數945b係藉頻域雜訊成形參數提供處理而提供,容後詳述。若對所考量的(頻譜係數集合944a中之)個別頻譜係數相關聯之頻率,藉線性預測域參數934所描述的線性預測濾波之頻域響應具有較小值,則利用頻域雜訊成形945,頻譜解成形頻譜係數944a集合之頻譜係數被給予較大權值。相對地,若對所考量的(集合944a中之)頻譜係數相關聯之頻率,藉線性預測域參數934所描述的線性預測濾波之頻域響應具有較小值,則當獲得頻譜成形頻譜係數945a集合之相對應頻譜係數時,頻譜係數集合944a之頻譜係數被給予較大權值。據此,當自頻譜解成形頻譜係數944a導算已頻譜成形之頻譜係數945a時,由線性預測域參數934所定義的頻譜成形係施用於頻域。
主信號合成940也包含一反MDCT 946,其接收該已頻譜成形之頻譜係數945a,及基於此而提供時域表示型態946a。增益定標947係施加至時域表示型態946a而自該時域表示型態946a導算出該音訊內容之時域表示型態940a。增益因數g係施加至增益定標947其較佳為頻率非相干性(非頻率選擇性)運算。
主信號合成也包含頻域雜訊成形參數945b的處理,容後詳述。為了提供頻域雜訊成形參數945b,主信號合成940包含解碼950,及基於已編碼線性預測域參數934提供已解碼線性預測域參數950a。已解碼線性預測域參數例如可呈第一已解碼線性預測域參數集合LPC1及第二已解碼線性預測域參數集合LPC2形式。第一已解碼線性預測域參數集合LPC1例如可與以TCX-LPD模式編碼之訊框或子框之左側變遷相關聯,及第二已解碼線性預測域參數集合LPC2例如可與以TCX-LPD模式編碼之訊框或子框之右側變遷相關聯。已解碼線性預測域參數係饋入頻譜運算951,其提供藉線性預測域參數950a界定的脈衝響應之頻域表示型態。舉例言之,對已解碼線性預測域參數950之第一集合LPC1及第二集合LPC2可提供分開的頻域係數X0 [k]集合。
增益運算952對頻譜值X0 [k]對映至增益值,其中增益值g1 [k]之第一集合係與頻譜係數之第一集合LPC1相關聯,及其中增益值g2 [k]之第二集合係與頻譜係數之第二集合LPC2相關聯。舉例言之,增益值可與相對應頻譜係數之幅度成反比。濾波參數運算953可接收增益值,及基於此而提供用於頻域成形945之濾波參數945b。舉例言之,可提供濾波參數a[i]及b[i]。濾波參數945b測定頻譜解成形頻譜係數944a對頻譜定標頻譜係數945a之貢獻。有關濾波參數之可能的運算細節將提供如下。
TCX-LPD分支930包含一正向混疊抵消合成信號運算,其包含二分支。(正向)混疊抵消合成信號生成之第一分支包含解碼960,其係組配來接收已編碼混疊抵消係數936,及基於此而提供已解碼混疊抵消係數960a,其係藉依據增益值g定標961而定標來獲得已定標混疊抵消係數961a。於若干實施例,相同增益值g可用於混疊抵消係數960a之定標960,及用於由反MDCT 946所提供之時域信號946a的增益定標947。混疊抵消合成信號生成也包含頻譜解成形962,其可組配來施用頻譜解成形至已定標混疊抵消係數961a來獲得已增益定標且已頻譜解成形之混疊抵消係數962a。頻譜解成形962可以類似頻譜解成形944之方式執行,容後詳述。已增益定標且已頻譜解成形之混疊抵消係數962a係輸入IV型離散餘弦反變換,其標示以元件符號963,及其提供混疊抵消刺激信號963a,作為基於已增益定標且已頻譜解成形之混疊抵消係數962a執行的離散餘弦反變換的結果。合成濾波964接收混疊抵消刺激信號963a,及藉由使用依據合成濾波係數965a組配的合成濾波器而合成濾波混疊抵消刺激信號963a而提供第一正向混疊抵消合成信號964a,該等合成濾波係數965a係依據線性預測域參數LPC1、LPC2藉合成濾波運算965而提供。有關合成濾波964及合成濾波係數965a之運算細節容後詳述。
結果第一混疊抵消合成信號964a係基於混疊抵消係數936及基於線性預測域參數。藉由於音訊內容之時域表示型態940a的提供及於混疊抵消合成信號964的提供施用相同定標因數g,以及藉由於音訊內容之時域表示型態940a的提供及於混疊抵消合成信號964的提供施用相似的或甚至相同的頻譜解成形944、962,而達成混疊抵消合成信號964a與音訊內容之時域表示型態940a間的良好一致性。
TCX-LPD分支930進一步包含依據前一個ACELP訊框或子框而提供額外混疊抵消合成信號973a、976a。ACELP對混疊抵消之貢獻的運算970係組配來接收ACELP資訊,諸如由ACELP分支980所提供的時域表示型態986及/或ACELP合成濾波器之內容。ACELP對混疊抵消之貢獻的運算970包含後ACELP合成971a之運算971、後ACELP合成971a之開窗972、及後ACELP合成972a之摺疊。據此已開窗且已摺疊之後ACELP合成973a係經由已開窗之後ACELP合成972a摺疊獲得。此外,ACELP對混疊抵消之貢獻的運算970也包含零輸入響應之運算,可對用來合成前一個ACELP子框之時域表示型態的合成濾波器運算,其中該合成濾波器之初始狀態可等於前一個ACELP子框結束時的合成濾波器狀態。據此,獲得零輸入響應975a,對其施用開窗976來獲得已開窗之零輸入響應976a。有關已開窗之零輸入響應976a的提供之進一步細節容後詳述。
最後,執行組合978來組合音訊內容之時域表示型態940a、第一正向混疊抵消合成信號964a、第二正向混疊抵消合成信號973a、及第三正向混疊抵消合成信號976a。據此,以TCX-LPD模式編碼之音訊框或音訊子框之時域表示型態938提供作為結合978結果,容後詳述。
7.3. ACELP路徑
後文中,將簡短說明音訊信號解碼器900之ACELP分支980。ACELP分支980包含已編碼ACELP激發982之解碼988來獲得已解碼之ACELP激發988a。隨後,激發之激發信號運算及後處理989係執行來獲得已後處理之激發信號989a。ACELP分支980包含線性預測域參數984之解碼990而獲得已解碼之線性預測域參數990a。已後處理之激發信號989a係經濾波,及依據線性預測域參數990a執行合成濾波991來獲得已合成之ACELP信號991a。然後使用後處理992處理已合成之ACELP信號991a而獲得以ACELP負載編碼之音訊子框之時域表示型態986。
7.4.組合
最後,執行組合996來獲得以頻域模式編碼之音訊框之時域表示型態918、以TCX-LPD模式編碼之音訊框之時域表示型態938、及以ACELP模式編碼之音訊框之時域表示型態986而獲得該音訊內容之一時域表示型態998。
進一步細節將敘述如下。
8.編碼器及解碼器細節 8.1. LPC濾波 8.1.1.工具描述
後文中,將敘述使用線性預測編碼濾波係數編碼及解碼之相關細節。
於ACELP模式,傳輸的參數包括LPC濾波器984、適應性及固定碼簿指標982、適應性及固定碼簿增益982。
於TCX模式,傳輸的參數包括LPC濾波器984、能量參數、及MDCT係數之量化指標932。本章節描述LPC濾波器例如LPC濾波器a1 至a16 ,950a、990a之解碼。
8.1.2.定義
後文中,將提出若干定義。
參數「nb_lpc」描述以位元串流解碼之LPC參數總數。
位元串流參數「mode_lpc」描述隨後LPC參數集合之編碼模式。
位元串流參數「lpc[k][x]」描述集合k之LPC參數數目x。
位元串流參數「qnk」描述與相對應之碼簿號碼nk 相關聯之二進制碼。
8.1.3. LPC濾波器數目
位元串流內部編碼的LPC濾波器「nb_lpc」之實際數目係取決於超訊框之ACELP/TCX模式組合,其中超訊框係與包含多個子框之一訊框相同。ACELP/TCX模式組合係擷取自欄「lpd_mode」,而其又對組合超訊框之4個訊框(也標示為子框)各自判定編碼模式「mod[k]」,k=0至3。ACELP之模式值為0,短TCX(256樣本)為1,中尺寸TCX(512樣本)為2,長TCX(1024樣本)為3。此處須注意可考慮為位元欄「mode」之位元串流參數「lpd_mode」對線性預測域參數之一個超訊框(其係與一個頻域模式音訊框諸如進階音訊編碼訊框或AAC訊框相對應)內部的四個訊框各自界定編碼模式。編碼模式儲存於一陣列「mod[]」且具有自0至3之值。自位元串流參數「LPD_mode」至陣列「mod[]」的對映可自表7測定。
有關陣列「mod[0...3]」,可謂陣列「mod[]」指示各個訊框之個別編碼模式。有關細節請參考表8,表8描述陣列「mod[]」指示之編碼模式。
除了超訊框之1至4個LPC濾波器外,對使用LPD核心編解碼器編碼的各段之第一超訊框傳輸選擇性LPC濾波器LPC0。係藉旗標「first_lpd_flag」設定為1而指示予LPC解碼程序。
通常出現於位元串流之LPC濾波器的順序為:LPC4、選擇性的LPC0、LPC2、LPC1、及LPC3。位元串流內部之給定LPC濾波器的存在狀況摘述於表1。
該位元串流經剖析來擷取與藉ACELP/TCX模式組合要求的各個LPC濾波器相對應之量化指標。後文將敘述解碼LPC濾波器中之一者所需運算。
8.1.4.反量化器之一般原理
以解碼950或以解碼990執行的LPC濾波器之反量化係如第13圖執行。LPC濾波器係使用線-頻譜-頻率(LSF)表示型態量化。首先如章節8.1.6所述運算第一階段估算。然後如章節8.1.7所述計算選擇性的代數向量量化(AVQ)精化細分1330。經由將第一階段估算與反加權AVQ貢獻1342相加1350而重建量化LSF向量。AVQ精化細分的存在係取決於LPC濾波器的實際量化模式,如章節8.1.5的解說。反量化LSF向量後來變換成LSP(線譜對)參數,然後再度內插及變換成LPC參數。
8.1.5. LPC量化模式之解碼
後文中,將說明LPC量化模式之解碼,其可為解碼950或解碼990之一部分。
LPC4經常性使用絕對量化辦法而量化。其它LPC濾波器可使用絕對量化辦法或數種相關量化辦法中之一者而量化。對此等LPC濾波器,擷取自該位元串流之第一資訊為量化模式。此一資訊標示為「mode_lpc」,且係使用如表2末欄指示的可變長度二進制碼而於該位元串流傳訊。
8.1.6.第一階段估算
對各個LPC濾波器,量化模式判定如何運算第13圖之第一階段估算。
對於絕對量化模式(mode_lpc=0),與隨機VQ量化第一階段估算相對應之8-位元指標係擷取自該位元串流。然後藉簡單查表運算第一階段估算1320。
對於相對量化模式,使用已反量化LPC濾波器運算第一階段估算,如表2第二欄指示。舉例言之,對於LPC0,只有一個相對量化模式,對該模式,該反量化LPC4濾波器組成第一階段估算。對於LPC1,有兩個可能的相對量化模式,對一個模式,反量化LPC2組成第一階段估算,而對另一模式,反量化LPC0濾波器與LPC2濾波器間之平均組成第一階段估算。至於與LPC量化相關的全部其它運算,第一階段估算係於線譜頻率(LSF)域進行。
8.1.7. AVQ精化細分 9.1.7.1.概論
擷取自該位元串流之下一個資訊係與建立反量化LSF向量所需AVQ精化細分有關。唯一例外為對LPC1:當此濾波器係相對於(LPC0+LPC2)/2編碼時,該位元串流未含AVQ精化細分。
AVQ係基於於AMR-WB+用來量化TCX模式之頻譜的8-維RE8 點陣向量量化器。解碼LPC濾波器涉及解碼已加權餘差LSF向量之兩個8-維子向量,k=1及2。
此二子向量之AVQ資訊係擷取自該位元串流。其包含兩個已編碼之碼簿號碼「qn1」及「qn2」及相對應的AVQ指標。此等參數解碼如下。
8.1.7.2.碼簿號碼之解碼
對前述兩個子向量中之各者,擷取自該位元串流來解碼AVQ精化細分之第一參數為該二碼簿號碼nk ,k=1及2。碼簿號碼之編碼方式係取決於LPC濾波器(LPC0至LPC4)及取決於其量化模式(絕對或相對)。如表3所示,有四種不同方式編碼nk 。用於nk 之碼細節說明如下。
nk 模式0及3:
碼簿號碼nk 係編碼為可變長度碼qnk 如下:
Q2 →nk 為00之碼
Q3 →nk 為01之碼
Q4 →nk 為10之碼
其它:nk 為11之碼後方接續:
Q5 →0
Q6 →10
Q0 →110
Q7 →1110
Q8 →11110
等。
nk 模式1:
碼簿號碼nk 係編碼為一元碼qnk 如下:
Q0 →nk 為0之一元碼
Q2 →nk 為10之一元碼
Q3 →nk 為110之一元碼
Q4 →nk 為1110之一元碼
等。
nk 模式2:
碼簿號碼nk 係編碼為可變長度碼qnk 如下:
Q2 →nk 為00之碼
Q3 →nk 為01之碼
Q4 →nk 為10之碼
其它:nk 為11之碼後方接續:
Q0 →0
Q5 →10
Q6 →110
等。
8.1.7.3.AVQ指標之解碼
LPC濾波器之解碼涉及描述該已加權餘差LSF向量之各個量化子向量。注意各個區塊B k 具有維度8。對各個區塊,解碼器接收三個二進制指標集合:
a) 碼簿號碼nk如前述使用熵碼「qnk 」傳輸;
b) 在所謂基本碼簿中選定的陣點(lattice point)z 之排序I k ,其指示須對特定先導者(leader)施加置換來獲得陣點z
c) 以及若量化區塊(陣點)不在碼簿,梵羅諾(Voronoi)延伸指標向量k 之8指標,則可自梵羅諾延伸指標運算延伸向量v 。於指標向量k 之各個組分的位元數目係以延伸順序r 給定,該延伸順序r 可得自指標n k 之碼值。梵羅諾延伸之定標因數M 係以M =2r 給定。
然後,自該定標因數M 、梵羅諾延伸向量v (RE 8 )之陣點)及基本碼簿之陣點z (也是RE 8 之陣點),可運算各個已量化已定標區塊為:
當無梵羅諾延伸時(亦即n k <5,M =1及z =0),基本碼簿為得自M. Xie及J.-P. Adoul,「嵌入式代數向量量化(EAVQ)應用至寬頻音訊編碼」,IEEE國際聲學、語音、及信號處理會議(ICASSP),美國喬治亞州亞特蘭大第1期第240-243頁1996年的碼簿Q 0Q 2Q 3 、或Q 4 時,則無需位元來傳輸向量k 。否則當因夠大而使用梵羅諾延伸,則只有得自前述參考文獻的Q 3 、或Q 4 用作為基本碼簿。Q 3 、或Q 4 的選用暗示於該碼簿碼值n k
8.1.7.4. LSF權值之運算
於該編碼器,在AVQ量化前施加至餘差LSF向量組分之權值為:
帶有:
d 0 =LSF 1st [0]
d 16 =SF /2-LSF 1st [15]
d i =LSF 1st [i ]-LSF 1st [i -1],i =1...15
此處LSF 1st 為第一階段LSF估算,及W 為取決於量化模式之定標因數(表4)。
相對應反加權1340係於解碼器施加來獲得該已量化餘差LSF向量。
8.1.7.5.反量化LSF向量之重建
反量化LSF向量之獲得方式係經由首先,鏈接(concatenate)如章節8.1.7.2及8.1.7.3解說而解碼的兩個AVQ精化細分子向量而形成一個單一已加權餘差LSF向量;然後,對此已加權餘差LSF向量施加如章節8.1.7.4解說運算之權值倒數而形成餘差LSF向量;及然後再度將此餘差LSF向量加至如章節8.1.6運算的第一階段估算。
8.1.8.已量化LSF之重排序
記錄已反量化LSF,及於使用前導入相鄰LSF間之最小距離50 Hz。
8.1.9.變換成LSP參數
至目前為止所述反量化程序導致於LSF域的LPC參數集合。然後,使用關係式q i =cos(ω i ),i =1,...,16而ω i 為線譜頻率(LSF),LSF變換至餘弦域(LSP)。
8.1.10. LSP參數之內插
對各個ACELP框(或子框),雖然只傳輸一個與訊框終點相對應的LPC濾波器,但使用線性內插來於各個子框(或子框之一部分)獲得不同的濾波器(每個ACELP框或子框4濾波器)。於前一個訊框(或子框)終點相對應的LPC濾波器與(目前)ACELP框終點相對應的LPC濾波器間執行內插。設LSP (new) 為新的可用LSP向量,而LSP (old) 為前一個可用LSP向量。對N sfr =4之內插LSP向量給定為
i =0,...,N sfr -1
內插LSP向量用來使用後述LSP至LP變換而運算於各個子框之不同LP濾波器。
8.1.11. LSP至LP變換
對各個子框,內插LSP係數被變換成LP濾波係數a k ,950a、990a,其係用於合成子框的重建信號。定義上,第16排序LP濾波器的LSP為兩個多項式之根
F 1 ' (z )=A (z )+z -17 A (z -1 )
其可表示為
F 1 ' (z )=(1+z -1 )F 1 (z )
具有
此處q i ,i=1,...,16為餘弦域的LSF,亦稱LSP。變換至LP域係如下進行。藉知曉已量化且已內插LSP,放大前述方程式而得知F 1 (z )及F 2 (z )之係數。使用下述遞歸關係式來運算F 1 (z ):
具有初值f 1 (0)=1及f 1 (-1)=0。同理,藉以q 2i 置換q 2i-1 而運算F 2 (z) 係數。
一旦得知F 1 (z)F 2 (z) 之係數,F 1 (z)F 2 (z) 分別乘以1+z-1 及1-z-1 來獲得F’ 1 (z)F, 2 (z) ;換言之
f 1 ' (i )=f 1 (i )+f 1 (i -1),i =1,...,8
(i )=f 2 (i )-f 2 (i -1),i =1,...,8
最後,藉下式而自f’ 1 (i )及f’ 2 (i )算出LP係數
此式係自方程式A(z) =(F 1 (z)F’ 2 (z))/2 直接導出,及考量F’ 1 (z)F’ 2 (z) 分別為對稱多項式及非對稱多項式的事實。
8.2. ACELP
後文中,將解說明關藉音訊信號解碼器900之ACELP分支980執行處理的若干細節來協助瞭解混疊抵消機制,容後詳述。
8.2.1.定義
後文中,將提供若干定義。
位元串流元素「mean_energy」描述每框的已量化平均激發能。位元串流元素「acb_index[sfr]」指示各個子框之適應性碼簿指標。
位元串流元素「ltp_filtering_flag[sfr]」為適應性碼簿激發濾波旗標。位元串流元素「lcb_index[sfr]」指示各個子框之原創性碼簿指標。位元串流元素「gains[sfr]」描述適應性碼簿及原創性碼簿對激發貢獻的已量化增益。
此外,有關位元串流元素「mean_energy」之編碼細節請參考表5。
8.2.2.使用過去FD合成及LPC0之ACELP激發緩衝器設定值
後文中,將敘述ACELP激發緩衝器之選擇性起動,其可藉處理方塊990b執行。
於自FD變遷至ACELP的情況下,過去激發緩衝器u(n) 及含有過去預強調合成的緩衝器(n )係於ACELP激發解碼前,使用過去FD合成(包括FAC)及LPC0(亦即濾波係數集合LPC0之LPC濾波係數)更新。為了達成此項目的,FD合成係藉施加預強調濾波器(1-0.68z -1 ),及結果拷貝至(n )。所得預強調濾波器然後使用LPC0藉分析濾波器(z )濾波而獲得激發信號u(n)
8.2.3. CELP激發之解碼
若於一訊框之模式為CELP模式,則激發包含已定標適應性碼簿向量及固定碼簿向量之加法。於各個子框,激發係藉重複下列步驟而建置:解碼CELP資訊所需資訊可視為已編碼ACELP激發982。也須注意CELP激發之解碼可藉ACELP分支980之處理方塊988、989執行。
8.2.3.1.依據位元串流元素「acb_index[]」,適應性碼簿激發的解碼
所接收的音高指標(適應性碼簿指標)係用來找出音高延遲的整數及分數部分。
藉由使用FIR內插濾波器,於音高延遲及相位(分量),內插過去激發u(n) 而得知初始適應性碼簿激發向量v(n)
對64樣本的子框大小運算適應性碼簿激發。然後所接收的適應性濾波指標(ltp_filtering_flag[])用來判定已濾波的適應性碼簿係為v (n )=v ’(n )或為v(n) =0.18v(n) +0.64v(n -1) +0.18v(n -2)
8.2.3.2.使用位元串流元素「icb_index[]」之原創性碼簿激發解碼
所接收的代數碼簿指標係用來擷取激發脈衝之位置及振幅(符號),及得知代數碼向量c(n) 。亦即
此處m i s i 為脈衝位置及符號,及M 為脈衝數。
一旦代數碼向量c(n) 被解碼,則執行音高銳利化程序。首先,c(n) 係藉如下定義的預強調濾波器濾波:
F emph (z )=1-0.3z -1
預強調濾波器扮演低頻時減少激發能的角色。其次,利用帶有傳遞函數定義如下的適應性前置濾波器進行週期性增強:
此處n 為子框指標(n =0,...,63),及此處為音高延遲之整數部分T 0 及分數部分T 0 , frac 之捨入版本,表示為:
於語音信號情況下,藉由對人類耳朵而言為惱人的諧波間頻率減幅,適應性前置濾波器F p (z) 潤色頻譜。
8.2.3.3.藉位元串流元素「gains[]」描述的適應性及原創性碼簿增益之解碼
所接收的每個子框7-位元指標直接提供適應性碼簿增益及固定碼簿增益校正因數。藉由增益校正因數乘以估算得之固定碼簿增益而求出固定碼簿增益。求出估算得之固定碼簿增益g’ c 如下。首先,藉下式求出平均原創能
然後以分貝表示的估算得之增益G’c 係藉下式求出
此處為已解碼每訊框之平均激發能。訊框中的平均原創激發能係以每框2位元(18、30、42或54分貝)編碼為「mean_energy」。
線性域之預測增益係如下表示
量化固定碼簿增益係如下表示
8.2.3.4.運算已重建的激發
下列步驟係用於n=0,...,63。總激發係如下組成:
此處c(n) 為經適應性前置濾波器F(z) 濾波後的得自固定碼簿之碼向量。激發信號u’(n) 係用來更新適應性碼簿內容。然後激發信號u’(n) 係如下節所述後處理,來獲得已後處理之激發信號u(n) ,而用於合成濾波器1/(z )之輸入信號。
8.3.激發後處理 8.3.1.概論
後文中,將敘述激發信號後處理,其可於處理方塊989執行。換言之,用於信號合成,激發元素之後處理執行如下。
8.3.2.用於雜訊增強之增益平滑化
非線性增益平滑化技術係施加至固定碼簿增益來增強雜訊的激發。基於口語節段之穩定及發聲,固定碼簿向量之增益被平滑化來於穩態信號之情況下減少激發能的起伏波動。如此改善涉及於穩態背景雜訊情況下的效能。發聲因數表示為
λ=0.5(1-r v )
帶有
r v =(E v -E c )/(E v +E c ),
此處E v E c 分別為定標音高碼向量及定標原創碼向量之能(r v 給定信號週期性之測量值)。注意由於r v 值係介於-1至1間,故λ值係介於0至1。注意因數λ係與非發聲量有關,純粹發聲節段具有0值,而1值用於純粹非發聲節段。
穩定因數θ係基於兩相鄰LP濾波器間之距離測量值計算。此處,因數θ係與ISF距離測量值有關。ISF距離測量值表示為
此處f i 為現在框的ISF,而為過去框的ISF。穩定因數θ表示為
θ=1.25-ISF dist /400000 限於0θI
ISF距離測量值於穩定信號情況下較小。
S m =λθ
對非發聲且穩定信號,S m 值趨近於1,此乃穩態背景雜訊信號情況。對純發聲信號或對不穩定信號,S m 值趨近於0。初修正增益g 0 之運算方式係比較固定碼簿增益與藉得自前一個子框的初修正增益g -1 所給定的臨界值。若係大於或等於g -1 ,則g 0 之運算方式係以減量1.5分貝,但限於g 0 g -1
最後,增益係以平滑化增益值更新如下
8.3.3.音高增強器
音高增強器方案藉由通過原創濾波器濾波該固定碼簿增益而修正總激發u’(n) ,該原創濾波器其頻率響應強調較高頻,而減低原創碼向量之低頻部分之能,及其係數係與信號的週期性有關。使用下述形式之濾波器
F inno (z )=-c pe z +1-c pe z -1
此處c pe =0.125(1+r v ),而r v 為如前述以r v =(E v -E c )/(E v +E c )給定之週期性因數。已濾波之固定碼簿碼向量係藉下式給定
c' (n )=c (n )-c pe (c (n +1)+c (n -1))
而已更新之後處理激發係藉下式給定
藉由更新激發989a,u(n) 如下而以一個步驟完成前述程序
8.4.合成與後處理
後文中,將敘述合成濾波991及後處理992。
8.4.1.概論
LP合成係通過LP合成濾波器1/(z )濾波已後處理之激發信號989a,u(n) 進行。LP合成濾波子框內的重建信號所使用的每個子框之內插LP濾波器係以下式給定
然後合成信號通過濾波器1/(1-0.68z-1 )(於編碼器輸入端施加的前置強調濾波器的倒數)濾波而解除強調。
8.4.2.合成信號之後處理
LP合成後,重建信號係使用低頻音高增強來後處理。使用二頻帶分解,及適應性濾波只施加至較低頻帶。如此導致總後處理,泰半係靶定在靠近已合成的口語信號之第一諧波的頻率。
信號係於二分支處理。於較高分支,解碼信號係藉高通濾波器濾波來產生較高頻帶信號s H 。於較低分支,解碼信號係首先通過適應性音高增強器處理,及然後通過低通濾波器濾波來獲得較低頻帶後處理信號s LEF 。將較低頻帶後處理信號與較高頻帶信號相加獲得已後處理之解碼信號。音高增強器之目的係減低解碼信號的諧波間雜訊,於此處係藉時變線性濾波器以傳遞函數達成
且係藉下式描述:
此處α為控制諧波間衰減的係數,T 為輸入信號(n )之音高週期,而s LE (n) 為音高增強器的輸出信號。參數T 及α隨時間而異,且係藉音高追蹤模組給定。具有α值等於0.5,於頻率1/(2T )、3/(2T )、5/(2T )等,亦即於諧波頻率1/T 、3/T 、5/T 等間之中點濾波器之增益恰為0。當α趨近於0時,藉濾波器所產生的諧波間之衰減減少。
為了將後處理侷限於低頻區,已增強信號s LE 經低通濾波來產生信號s LEF ,其係加至經高通濾波的信號s H 來獲得經後處理之合成信號s E
使用相當於前述之替代程序,免除高通濾波的需求。此點係藉將z域之後處理信號s E (n) 表示如下而達成
此處P LT (z) 為長期預測器濾波器之傳遞函數,藉下式給定
P LT (z )=1-0.5z T -0.5z - T
H LP (z) 為低通濾波器之傳遞函數。
如此,後處理係相當於自合成信號(n )中扣除已定標經低通濾波的長期誤差信號。
T 值係藉各個子框所接收的閉環音高延遲而給定(分數音高延遲係捨入至最近的整數)。執行簡單追蹤用以檢查音高加倍。若於延遲T/2之標準化音高相關性係大於0.95,則T/2值係用作為後處理的新穎音高延遲。
因數α係藉下式給定
α=0.5 限於0α0.5
此處為解碼音高增益。
注意於TCX模式及頻域編碼期間,α值係設定為零。使用有25係數之線性相位FIR低通濾波器,截止頻率係於5Fs/256kHz(濾波延遲為12樣本)。
8.5.基於MDCT之TCX
後文中,將說明基於MDCT之TCX之細節,其係藉TXC-LPD分支930之主信號合成940實施。
8.5.1.工具描述
當位元串流變數「core_mode」係等於1時其指示編碼係使用線性預測域參數進行,及當三個TCX模式中之一者或多者被選用作為「線性預測域」編碼時,亦即mod[]的4陣列登錄項目中之一者係大於零時,使用基於MDCT之TCX。基於MDCT之TCX自算術解碼器941接收已量化頻譜係數941a。該等已量化頻譜係數941a(或其反量化版本942a)首先係藉舒適雜訊(雜訊填補943)完成。然後施加基於LPC之頻域雜訊成形945至所得頻譜係數943a(或其頻譜解成形版本944a),及進行反MDCT變換946來獲得時域合成信號946a。
8.5.2.定義
後文中,將提供若干定義。變數「lg」描述藉算術解碼器輸出的已量化頻譜係數之數目。位元串流元素「noise_factor」描述雜訊位準量化指標。變數「雜訊位準」描述注入重建頻譜之雜訊位準。變數「noise[]」描述所產生的雜訊向量。位元串流元素「global_gain」描述重新定標增益量化指標。變數「g」描述重新定標之增益。變數「rms」描述合成時域信號x[]之均方根。變數「x[]」描述合成時域信號。
8.5.3.解碼程序
基於MDCT之TCX自算術解碼器941請求已量化頻譜係數之數目lg,其係藉mod[]值測定。此值(lg)也界定將施加於反MDCT的窗長度及形狀。反MDCT 946之中或之後所施加之窗係由三部分組成,亦即L樣本的左側重疊部、M樣本之一中部、及R樣本之右側重疊部。為了獲得長度2*lg之MDCT窗,ZL個零加至左側,而ZR個零加至右側。於變遷自或至SHORT_WINDOW之情況下,相對應重疊區L或R可能須減至128來調整適應SHORT_WINDOW之較短窗型。結果M區及相對應的零區ZL或ZR可能須各自放大64樣本。
反MDCT 946期間或反MDCT 946之後可施加的MDCT窗係藉下式給定
表6顯示頻譜係數之數目呈mod[]之函數。
由算術解碼器941所遞送之量化頻譜係數quant[] 941a或反量化頻譜係數942a係藉舒適雜訊(雜訊填補943)完成。注入的雜訊位準係藉解碼變數noise_factor測定如下:
noise_level=0.0625*(8-noise_factor)
然後雜訊向量noise[]係使用隨機函數random_sign()運算,隨機遞送值-1或+1。
noise[i]=random_sign()*noise_level;
quant[]及noise[]向量經組合而形成重建的頻譜係數向量r[] 942a,組合方式為quant[]中的一段連續8個零係藉noise[]組分置換。一段8個非零係根據下式檢測:
獲得已重建的頻譜943a如下:
頻譜解成形944係依據下列步驟,選擇性地施用至已重建頻譜943a:
1.對頻譜首四分之一的各個8維區塊,計算於指標m 之8維區塊能E m
2.運算比R m =sqrt(E m /E I ) ,此處I 為具有全部E m 中之最大值的區塊指標
3.若R m <0.1,則設定R m =0.1
4.若R m <R m-1 ,則設定R m =R m-1
屬於頻譜首四分之一的各個8維區塊然後乘以因數R m 。據此,獲得頻譜解成形頻譜係數944a。
在施加反MDCT 946之前,與MDCT區塊兩極端(亦即左及右摺疊點)相對應的兩個量化LPC濾波器LPC1、LPC2(各自以濾波係數a1 至a10 描述)係經獲取(方塊950),然後求出加權版本,及運算相對應十進制(64點,無論變換長度如何)頻譜951a(方塊951)。藉施加ODFT(奇離散富利葉變換)至LPC濾波器係數950a而求出此等加權LPC頻譜951a。運算ODFT前,複合調變施加至LPC係數,使得ODFT頻倉(用於頻譜運算951)完美排齊(反MDCT 946之)MDCT頻倉。舉例言之,給定LPC濾波器(z )(例如藉時域濾波係數a1 至a16 界定)之加權LPC合成頻譜951a運算如下:
此處[n ],n =0 ...lpc_order +1為加權LPC濾波器之(時域)係數,藉下式給定:
增益g[k] 952a可依據下式自LPC係數的頻譜表示型態X0 [k],951a求出:
此處M=64為其中施用計算得之增益之頻帶數目。
設g1[k]及g2[k],k=0,...,63分別為如前文解說而求出的左及右摺疊點相對應的十進制LPC頻譜。反FDNS運算945包含使用遞歸濾波器濾波重建頻譜r[i],944a:
rr[i]=a[i]‧r[i]+b[i]‧rr[i-1],i=0...1g,
此處a[i]及b[i],945b係使用下式而自左及右增益g1[k]g2[k],952a導算出:
a[i]=2‧g1[k]‧g2[k]/(g1[k]+g2[k]),
b[i]=(g2[k]-g1[k])/(g1[k]+g2[k]).
前文中,變數k係等於i/(lg/64),考慮LPC頻譜為十進制之事實。
重建頻譜rr[],945a係饋至反MDCT 946。非開窗輸出信號x[],946a係藉已解碼「global_gain」指標之反量化獲得的增益g重新定標:
此處rms 係計算為:
重新定標的已合成之時域信號940a係等於:
x w [i ]=x [i ]‧g
重新定標後,例如於方塊978施加開窗及重疊加法。
然後已重建TCX合成x(n)938選擇性地通過預強調濾波器(1-0.68z-1 )濾波。然後所得已預強調之合成係藉分析濾波器(z )濾波來獲得激發信號。求出的激發更新ACELP適應性碼簿,及允許以隨後訊框自TCX切換至ACELP。最後經由施加濾波器1/(1-0.68z-1 )解除預強調合成之強調而重建信號。注意分析濾波係數係以子框基準內插。
也須注意TCX合成長度係藉TCX訊框長度(無重疊)給定:對1、2或3之mod[]分別為256、512或1024樣本。
8.6 正向混疊抵銷(FAC)工具 8.6.1 正向混疊抵銷工具描述
後文描述於ACELP與變換編碼(TC)(以頻域模式或以TCX-LPD模式)間之變換期間進行正向混疊抵消(FAC)運算來獲得終合成信號。FAC之目的係抵消由TC所導入的時域混疊,及無法藉前一或後一ACELP框抵消。此處注意TC包括於長及短區塊(頻域模式)之MDCT以及基於MDCT之TCX(TCX-LPC模式)。
第10圖表示不同的中間信號,其係經運算來獲得TC框之終合成信號。所示實例中,TC框(例如以頻域模式或以TCX-LPD模式編碼之訊框1020)在前方及後方接有一ACELP框(框1010及1030)。其它情況下(ACELP框接續多於一個TC框,或多於一個TC框接續一個ACELP框),只運算所需信號。
現在參考第10圖,將提供正向混疊抵消之綜論,其中須注意將藉方塊960、961、962、963、964、965及970執行正向混疊抵消。
第10圖所示正向混疊抵消解碼運算之線圖表示型態中,橫座標1040a、1040b、1040c、1040d描述以音訊樣本表示之時間。縱座標1042a例如以振幅表示正向混疊抵消合成信號。縱座標1042b描述表示編碼音訊內容之信號,例如ACELP合成信號及變換編碼訊框輸出信號。縱座標1042c描述ACELP對正向混疊抵消之貢獻,諸如開窗ACELP零脈衝響應及開窗且重疊ACELP合成。縱座標1042d描述於原先域的合成信號。
如圖可知,正向混疊抵消合成信號1050係於自以ACELP模式編碼之音訊框1010變換至以TCX-LPD模式編碼之音訊框1020時提供。正向混疊抵消合成信號1050係藉施加合成濾波964及由IV型反DCT 963所提供之混疊抵消刺激信號963a而提供。合成濾波964係基於合成濾波係數965a,其係自線性預測域參數集合LPC1或LPC濾波器係數而導算出。如自第10圖可知,(第一)正向混疊抵消合成信號1050之第一部分1050a可為藉合成濾波964而對非零混疊抵消刺激信號963a提供的非零輸入響應。但正向混疊抵消合成信號1050也包含零輸入響應部分1050b,其可藉對混疊抵消刺激信號963b之零部分進行合成濾波964所提供。據此,正向混疊抵消合成信號1050可包含非零輸入響應部分1050a及零輸入響應部分1050b。須注意正向混疊抵消合成信號1050較佳可基於線性預測域參數集合LPC1而提供,後者係有關訊框或子框1010與訊框或子框1020間之變遷。此外,於自訊框或子框1020至訊框或子框1030間之變遷,提供另一個正向混疊抵消合成信號1054。正向混疊抵消合成信號1054可藉混疊抵消刺激信號963a之合成濾波964提供,而後者係基於混疊抵消係數藉反DCT IV,963提供。須注意正向混疊抵消合成信號1054可基於線性預測域參數集合LPC2,其係與訊框或子框1020至訊框或子框1030間之變遷相關聯。
此外,自ACELP訊框或子框1010至TCX-LPD訊框或子框1020變遷時將提供額外混疊抵消合成信號1060、1062。舉例言之,ACELP合成信號986、1056之開窗及摺疊版本973a、1060例如可由方塊971、972、973提供。又復,已開窗ACELP零輸入響應976a、1062將例如藉方塊975、976提供。例如,已開窗且已摺疊ACELP合成信號973a、1060可經由ACELP合成信號986、1056之開窗及藉開窗結果施加時間摺疊973獲得,容後詳述。已開窗ACELP零輸入響應976a、1062可經由提供零輸入予合成濾波器975,合成濾波器975係等於合成濾波器991,其係用來提供ACELP合成信號986、1056,其中該合成濾波器975之初態係等於框或子框1010的提供ACELP合成信號986、1056結束時等於合成濾波器981的狀態。如此,該已開窗且已摺疊ACELP合成信號1060可相當於正向混疊抵消合成信號973a,及已開窗ACELP零輸入響應1062可相當於正向混疊抵消合成信號976a。
最後,變換編碼框輸出信號1050a,當組合正向混疊抵消合成信號1052、1054及額外ACELP貢獻1060、1062予混疊抵消時,其可等於時域表示型態940a的開窗版本。
8.6.2.定義
後文中將提出若干定義。位元串流元素「fac_gain」描述7-位元增益指數。位元串流元素「nb[i]」描述碼簿號碼。語法元素「FAC[i]」描述正向混疊抵消資料。變數「fac_length」描述正向混疊抵消變換長度,其對變換自及至「EIGHT_SHORT_SEQUENCES」型窗,可等於64,否則等於128。變數「use_gain」指示外顯增益資訊的使用。
8.6.3.解碼程序
後文中,將敘述解碼程序。為了達成此項目的,將簡短摘述不同步驟。
1. 解碼AVQ參數(方塊960)
- FAC資訊係使用與用於LPC濾波器編碼之相同代數向量量化(AVQ)工具編碼(參考音節8.1)。
- 對i=0,...,FAC變換長度:
○ 碼簿號碼nq[i]係使用修正一進制碼編碼
○ 相對應FAC資料FAC[i]係使用4*nq[i]位元編碼
-因此對i=0,...fac_length之向量FAC[i]係擷取自位元串流
2. 施加增益因數g至FAC資料(方塊961)
- 用於帶有基於MDCT之TCX(wLPT)之變換,使用相對應的「fcx_coding」元素之增益
- 對其它變換,已經自該位元串流(使用7-位元定標器量化器編碼)取得增益資訊「fac _gain 」。增益g使用該增益資訊計算為g=10fac_gain/28
3. 於基於MDCT之TCX與ACELP間之變換之情況下,頻譜解成形962施加至FAC頻譜資料961a的首四分之一。解成形增益係對相對應基於MDCT之TCX(用於由頻譜解成形944使用)運算得,解說於章節8.5.3,使得FAC及基於MDCT之TCX之量化具有相同形狀。
4. 運算增益定標FAC資料之反DCT-IV(方塊963)。
- FAC變換長度fac_length藉內設等於128
- 用於短方塊的變換,此長度係減至64。
5. 藉加(方塊964)已加權合成濾波器1/(z )(例如合成濾波係數965a所述)來獲得FAC合成信號964a。所得信號表示於第10圖之列(a)。
- 已加權合成濾波器係基於LPC濾波器,其係與摺疊點相對應[第10圖中標示為自ACELP變換至TCX-LPD的LPC1,及自wLPD TC(TCX-LPD)變換至ACELP的LPC2,及自FD TC(頻碼變換編碼)變換至ACELP的LPC0]。
- 使用ACELP運算相同的LPC加權因數:(z )=A (z /γ 1 ),此處γ1 =0.92
- 為了運算FAC合成信號964a,加權合成濾波器964之初記憶設定為0
- 用於自ACELP變換,FAC合成信號1050係藉附接加權合成濾波器(128樣本)的零輸入響應(ZIR)1050b而進一步延伸。
6. 於自ACELP變換之情況下,運算已開窗過去ACELP合成972a,摺疊之(例如來獲得信號973a或信號1060),及將其加至已開窗ZIR信號(例如信號976a或信號1062)。ZIR響應係使用LPC1運算。施加至fac_length過去ACELP合成樣本之窗為:
sine[n+fac_length]*sine[fac_length-1-n], n=-fac_length...-1,
及施加至ZIR之窗為:
1-sine[n+fac_length]2, n=0...fac_length-1,
此處sine[n]為正弦週期的四分之一:
sine[n]=sin(n*π/(2*fac_length)), n=0...2*fac_length-1.
所得信號係表示於第10圖之列(c),及標示為ACELP貢獻(信號貢獻1060、1062)。
7. 將FAC合成964a、1050(及於自ACELP變換之情況下,ACELP貢獻973a、976a、1060、1062)加至TC框(表示於第10圖之列(b))(或加至時域表示型態940a之開窗版本)來獲得合成信號998(表示於第10圖之列(d))。
8.7.正向混疊抵消(FAC)編碼程序
後文中,將敘述有關正向混疊抵消所需資訊編碼的若干細節。特定言之,將說明混疊抵消係數936之運算及編碼。
第11圖顯示當以變換編碼(TC)編碼之一訊框1120係接在ACELP模式編碼之一訊框1110、1130前方及後方時,於編碼器之處理步驟。此處標示TC包括如同AAC中對長區塊及短區塊的MDCT,及基於MDCT之TCX(TCX-LPD)。第11圖顯示時域標記1140及訊框邊界1142、1144。垂直虛線顯示以TC編碼之訊框1120之起點1142及終點1144。LPC1及LPC2指示分析窗的中心來計算兩個LPC濾波器:LPC1係於以TC編碼之訊框1120之起點計算,而LPC2係於同一訊框1120之起點計算。「LPC1」標記左側的訊框1110假設已經以ACELP模式編碼。「LPC2」標記右側的訊框1130也假設已經以ACELP模式編碼。
第11圖共有4列1150、11601170、1180。各列表示於編碼器之FAC標靶計算的一個步驟。須瞭解各列的時間上係與上一列校準。
第11圖之列1(1150)表示原先音訊信號,如前述以訊框1110、1120、1130分節。中框1120假設使用FDNS係以MDCT域編碼,將被稱作TC框。前一框1110之信號假設已經以ACELP模式編碼。此編碼模式序列(ACELP,然後TC,然後ACELP)係選用來顯示FAC的全部處理,原因在於FAC係有關兩項變遷(ACELP至TC,及TC至ACELP)。
第11圖之列2(1160)係與各框之解碼(合成)信號相對應(可經由使用解碼演繹法則知識而藉編碼器判定)。自TC框起點延伸至終點的上曲線1162顯示開窗效應(中間平坦,但於起點及終點則否)。於該節段起點及終點的正曲線1164、1166則顯示摺疊效應(節段起點帶有「-」符號,而節段終點帶有「+」符號)。然後可使用FAC來校正此等效應。
第11圖之列3(1170)表示用在TC框起點來減少FAC編碼負擔的ACELP貢獻。此種ACELP貢獻係由二部分形成:1)自前一框終點之已開窗已摺疊ACELP合成877f、1170,及2)LPC1濾波器之已開窗零輸入響應877j、1172。
此處須注意已開窗已摺疊ACELP合成1110相當於已開窗已摺疊ACELP合成1060,及零輸入響應1172相當於已開窗ACELP零輸入響應1062。換言之,音訊信號編碼器可估算(或計算)合成結果1162、1164、1166、1170、1172,其將於音訊信號解碼器端獲得(方塊869a及877)。
然後於列4(1180)顯示的ACELP誤差係經由自列1(1150)扣除列2(1160)及列3(1170)獲得(方塊870)。時域之誤差信號871、1182之預期包封的近似視圖顯示於第11圖之列4(1180)。ACELP框之誤差(1120)預期於時域之振幅約略平坦。然後於TC框的誤差(標記LPC1與LPC2間)預期具有如第11圖列4(1180)於此節段1182所顯示的一般形狀(時域包封)。
為了有效補償於第10圖列4之TC框起點及終點的開窗及時域混疊效應,及假設TC框使用FDNS,依據第11圖施加FAC。須注意第11圖描述對TC框左部分(自ACELP變遷至TC)及右部分(自TC變遷至ACELP)之此項處理。
摘要言之,藉編碼混疊抵消係數856、936所表示的變換編碼訊框誤差信號871、1182係經由自原先域(亦即時域)信號1152扣除變換編碼訊框輸出信號1162、1164、1166(例如以信號869b描述)及ACELP貢獻1170、1172(例如藉信號872描述)二者獲得。據此,獲得變換編碼訊框誤差信號1182。
後文中將敘述變換編碼訊框誤差信號871、1182之編碼。
首先,自LPC1濾波器算出加權濾波器874、1210、W 1 (z )。於第11圖之列4(1180)之TC框1120起點的誤差信號871、1182(也稱作第11及12圖的FAC標靶)通過W 1 (z )濾波W 1 (z )。具有第11圖列4之於ACELP框1120的ACELP誤差871、1182作為初態或濾波記憶體。然後於第12圖頂的濾波器874、1210、W 1 (z )之輸出信號形成DCT-IV變換875、1220之輸入信號。然後得自DCT-IV 875、1220之變換係數875a、1222使用AVQ工具876(以Q ,1230表示)量化及編碼。此種AVQ工具係與用以量化LPC係數之工具相同。此等編碼係數傳輸至解碼器。然後AVQ 1230之輸入作為反DCT-IV 963、1240之輸入而形成時域信號963a、1242。然後此時域信號通過具有零記憶體(零初態)的反相濾波器964、1250、1/W 1 (z) 濾波。通過1/W 1 (z) 濾波延伸超過於延伸超過FAC標靶的樣本使用零輸入的FAC標靶長度。濾波器1250、1/W 1 (z) 之輸出信號964a、1252為FAC合成信號,其為現在可施加於TC框起點來補償開窗及時域混疊效應的校正信號(例如信號964a)。
現在,轉向參考TC框終點的開窗及時域混疊效應的校正廋理,發明人考慮第12圖底部分。第11圖列4之TC框1120終點的誤差信號871、1182b(FAC標靶)係通過濾波器874、1210、W 2 (z) 濾波,W 2 (z) 具有第11圖列4之於ACELP框1120的誤差作為初態或濾波記憶體。然後全部進一步處理步驟係與處理TC框起點的FAC標靶之第12圖之上部分相同,但ZIR於FAC合成延伸除外。
注意當施加於編碼器(來獲得局部FAC合成)時,第12圖之處理完全執行(自左至右),而於解碼器端,第12圖之處理只施加始於所接收的已解碼DCT-IV係數。
9.位元串流
後文中,將敘述有關位元串流之若干細節來協助瞭解本發明。此處須注意顯著量組配資訊可含括於該位元串流。
但基於頻域模式編碼之一訊框的音訊內容主要係藉稱作「fd_channel_stream()」之位元串流元素表示。此一位元串流元素「fd_channel_stream()」包含通用增益資訊「global_gain」、已編碼定標因數資料「scale_factor_data()」、及已算術編碼頻譜資料「ac_spectral_data」。此外,位元串流元素「fd_channel_stream()」選擇性地包含包括增益資訊的正向混疊抵消資料(也標示為「fac_data(1)」),若(且唯若)前一框(若干實施例也標示為「超框」)已經以線性預測域模式編碼,而前一框的最末子框已經以ACELP模式編碼。換言之,若前一框或子框已經以ACELP模式編碼,則包括增益資訊的正向混疊抵消資料係選擇性地提供用於頻域模式音訊框。此點為優異,原因在於藉由TCX-LPD模式編碼之前一音訊框或音訊子框與以頻域模式編碼的目前音訊框間之單純重疊及加法功能,即可執行混疊抵消,解說如前。
有關其細節,請參考第14圖,顯示位元串流元素「fd_channel_stream()」其包含通用增益資訊「global_gain」、已編碼定標因數資料「scale_factor_data()」、及已算術編碼頻譜資料「ac_spectral_data()」的語法表示型態。變數「core_mode_last」描述最末核心模式,及對基於定標因數的頻域編碼具有零值,及對基於線性預測域參數(TCX-LPD或ACELP)具有壹值。變數「last_lpd_mode」描述最末框或子框之LPD模式,及對ACELP模式編碼之編碼之一框或子框具有零值。
現在參考第15圖,將對位元串流元素「lpd_channel_stream()」其編碼以線性預測域模式編碼的音訊框(也標示為「超框」)資訊。以線性預測域模式編碼的音訊框(「超框」)可包含多數子框(偶爾也標示為「框」,例如與術語「超框」組合時)。子框(或「框」)可具有不同類型,使得部分子框可以TCX-LPD模式編碼,而其它子框可以ACELP模式編碼。
位元串流變數「acelp_core_mode」描述使用ACELP之情況下的位元配置方案。位元串流元素「lpd_mode」已經解說如前。變數「first_tcx_flag」於各個以LPD模式編碼之訊框起點設定為真。變數「first_lpd_flag」為旗標其指示目前框或超框是否為以線性預測域編碼的一序列框或超框中之第一者。變數「last_lpd」係經更新來描述最末子框(或框)之編碼模式(ACELP;TCX256;TCX512;TCX1024)。於元件符號1510可知,若最末子框係以ACELP模式編碼(last_lpd_mode==0),則對以TCX-LPD模式編碼之一子框(mod[k]>0)含括不含增益資訊的正向混疊抵消資料(「fac_data_(0)」);若前一子框係以TCX-LPD模式編碼(last_lpd_mode>0),則對以ACELP模式編碼之一子框(mod[k]==0)含括不含增益資訊的正向混疊抵消資料(「fac_data_(0)」)。
相反地,前一框係以頻域模式編碼(core_mode_last=0),及目前訊框的第一子框係以ACELP模式編碼(mod[0]==0),則包括增益資訊之正向混疊抵消資料(「fac_data(1)」)係包含於位元串流元素「lpd_channel_stream」。
摘要言之,若以頻域模式編碼之一框與以ACELP模式編碼之一框或子框間有直接變遷,則包括專用正向混疊抵消增益值的正向混疊抵消資料係含括於該位元串流。相反地,若以TCX-LPD模式編碼之一框或子框與以ACELP模式編碼之一框或子框間有變遷,則不含專用正向混疊抵消增益值的正向混疊抵消資訊係含括於該位元串流。
現在參考第16圖,將說明藉位元串流元素「fac_data()」描述之正向混疊抵消資料之語法。參數「useGain」指示是否有專用正向混疊抵消增益值位元串流元素「fac_gain」,如元件符號1610所示。此外,位元串流元素「fac_data」包含多數碼簿號碼位元串流元素「nq[i]」及「fac_data」位元串流元素之數目「fac[i]」。
該碼簿號碼及該正向混疊抵消資料之解碼已經說明如前。
10.實施替代例
雖然於裝置上下文已經說明若干構面,但顯然此等構面也表示相對應方法之描述,此處一方塊或一裝置係與一方法步驟或一方法步驟之一特徵相對應。同理,於一方法步驟上下文所描述之構面也表示相對應方塊或項目或相對應裝置之特徵的描述。部分或全部方法步驟可藉(或使用)硬體裝置,例如微處理器、可程式電腦或電子電路執行。若干實施例中,最重要方法步驟中之某一者或多者可藉此種裝置執行。
本發明之編碼音訊信號可儲存於數位儲存媒體或可透過傳輸媒體諸如無線傳輸媒體或有線傳輸媒體諸如網際網路傳輸。
依據某些實施要求,本發明之實施例可於硬體或於軟體實施。實施之執行可使用有可電子式讀取的控制信號儲存其上的數位儲存媒體例如軟碟、DVD、藍光碟、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該等媒體與可程式規劃電腦系統協力合作(或可協力合作)因而執行個別方法。因此,數位儲存媒體可為電腦可讀取式。
依據本發明之若干實施例包含具有可電子式讀取的控制信號於其上的資料載體,其與可程式規劃電腦系統可協力合作因而執行此處所述方法中之一者。
一般而言,本發明之實施例可實施為帶有程式碼的電腦程式產品,該程式碼可操作當該電腦程式產品於電腦上跑時用於執行該等方法中之一者。程式碼例如可儲存於機器可讀取載體上。
其它實施例包含用以執行此處所述方法中之一者之儲存在機器可讀取載體上的電腦程式。
換言之,因而本發明方法之實施例為一種具有程式碼之電腦程式,當該電腦程式產品於電腦上跑時用以執行此處所述方法中之一者。
因而本發明方法之又一實施例為一種資料載體(或數位儲存媒體,或電腦可讀取媒體)包含用以執行該等方法中之一者的電腦程式記錄於其上。該資料載體或數位儲存媒體或記錄媒體典型地為有實體及/或非暫態。
因此,本發明方法之又一實施例為一種資料串流或一序列信號表示用以執行此處所述方法中之一者之電腦程式。該資料串流或該序列信號例如可組配來透過資料通訊連結,例如透過網際網路傳輸。
又一實施例包含一種處理裝置,例如電腦或可程式邏輯裝置其係組配來或調整適應用於執行此處所述方法中之一者。
又一實施例包含一種電腦,其上安裝用以執行此處所述方法中之一者之電腦程式。
依據本發明之又一實施例包括一種裝置或一種系統,其係組配來傳輸(例如電子式或光學式)用以執行此處所述方法中之一者之電腦程式至接收器。接收器例如為電腦、行動元件、記憶體元件等。該裝置或系統例如可包含一種用以將該電腦程式傳輸至接收器之檔案伺服器。
於若干實施例,可程式邏輯裝置(例如場可程式閘極陣列)可用來執行此處所述方法之部分或全部函數。於若干實施例,場可程式閘極陣列可與微處理器協力合作來執行此處所述方法中之一者。大致上,該等方法較佳係藉硬體裝置執行。
前述實施例僅供舉例說明本發明之原理。須瞭解熟諳技藝人士顯然易知此處所述配置及細節之修正及變化。因此意圖本發明只受隨附之申請專利範圍之範圍所限,而非受藉由此處實施例之描述及解說所呈現的特定細節所限。
11.結論
後文中,將摘述用於統一語音及音訊編碼(USAC)開窗及框變的統一之本文提示。
首先,先作引言及描述若干背景資訊。USAC參考模型之目前設計(也標示為參考設計)係由(或包含)三個不同編碼模組所組成。對各個給定音訊信號區段(例如一框或子框),選用一個編碼模組(或編碼模式)來編碼/解碼該區段結果獲得不同的編碼模式。因此等模組之活性更迭,故自一個模式變遷至另一模式時須特別注意。過去已經提出多項修正貢獻於解決編碼模式間之變遷。
依據本發明之實施例提供一種有展望的總開窗及變遷方案。將描述朝向完成本方案之方式的進展,顯示用於品質及系統性結構改良之極具展望性的證據。
本文摘述所提示的對參考設計之變化(也標示為工作草稿4設計)來形成用於USAC之更具彈性的編碼結構,減少過度編碼,及減低編解碼器之變換編碼區段的複雜性。
為了達成避免昂貴的非臨界取樣(過度編碼)之開窗方案,導入兩個組分,於若干實施例其可視為必需組分:
1) 正向混疊抵消(FAC)窗;及
2) 頻域雜訊成形(FDNS)用於LPD核心編解碼器之變換編碼分支(TCX,亦稱TCX-LPD或wLPT)。
兩項技術的組合使其可能採用一項開窗方案,其允許以最低位元需求獲得變換長度的高度彈性切換。
後文中將敘述參考系統的挑戰來協助瞭解本發明之實施例所提供的優點。依據USAC草擬標準工作草稿4之參考構想包含由(或包含MPEG環繞)所組成的前處理/後處理階段結合工作的一切換核心編解碼器及一增強的SBR模組。切換核心之特徵結構包含一頻域(FD)編解碼器及一線性預測域(LPD)編解碼器。後者係採用一ACELP模組及一於加權域工作的變換編碼器(「加權線性預測變換」(wLPT)亦稱變換編碼激發(TCX))。發現由於基本上不同的編碼原理,模式間的變遷對處理上特別具挑戰性。業已發現須審慎注意各模式間的有效交混。
後文將敘述自時域變遷至頻域(ACELPwLPT,ACELPFD)之挑戰。業已發現自時域編碼變遷至變換域編碼棘手,特別因變換編碼器係基於MDCT之鄰近區塊的變換域混疊抵消(TDAC)性質。業已發現一頻域編碼區塊無法未使用來自其相鄰重疊區塊的額外資訊而全部解碼。
後文將敘述出現在自信號域變遷至線性預測域(FDACELP,FDwLPT)之挑戰。業已發現變遷至及自線性預測域暗示不同量化雜訊成形範例模式的變遷。業已發現該等範例模式利用不同方式來傳遞及施加心理聲學激勵雜訊成形資訊,其可能在編碼模式改變位置造成聽覺品質之非連續性。
後文將敘述有關依據USAC草擬標準工作草稿4之參考構想之細節。由於參照USAC參考模型的混成本質,有多重可能的窗變遷。第4圖之3x3表顯示依據USAC草擬標準工作草稿4之構想的此等變遷之綜論。
前文列舉的貢獻各自解決第4圖之表中所顯示的變遷中之一者或多者。值得注意者非均變遷(非在主對角線上)各自應用不同的特定處理步驟,其係由於嘗試達成臨界取樣、避免阻斷假影、找出一共用開窗方案,與允許編碼器閉環模式判定間折衷的結果。某些情況下,此項折衷犧牲掉捨棄編碼的傳輸樣本。
後文中將敘述若干提示的系統變化。換言之,將敘述依據USAC工作草稿4之參考構想的改良。為了解決所列舉的窗變遷之困難,依據本發明之實施例比較依據USAC草擬標準工作草稿4之參考構想,導入對既有系統的兩項修正。第一項修正藉由採用補充正向混疊抵消窗而針對通用改良自時域至頻域的變遷。第二項修正藉由導入LPC係數之變形步驟而類似信號域及線性預測域的處理,然後可應用於頻域。
後文中,將敘述頻域雜訊成形(FDNS)之構想,其允許將LPC應用於頻域。此一工具(FDNS)之目標係允許於不同域工作的MDCT編碼器之TDAC處理。雖然USAC頻域部分之MDCT係於信號域工作,但參考構想之wLPT(或TCX)係於加權濾波域工作。經由以頻域的相當處理步驟置換用於參考構想的加權LPC合成濾波器,兩個變換編碼器之MDCT可於同一域工作,可達成TDAC而未導入非連續性於量化雜訊成形。
換言之,加權LPC合成濾波器330g可由定標/頻域雜訊成形380e組合LPC至頻域變換380i置換。如此,頻域路徑之MDCT 320g及TCX-LPD分支之MDCT 380h係於相同域工作,因而達成變換域混疊抵消(TDAC)。
後文中,將敘述有關正向混疊抵消窗(FAC窗)之若干細節。已經介紹與說明正向混疊抵消窗(FAC窗)。此一補充窗補償遺漏的TDAC資訊,在連續行進中的變換碼,補償遺漏的TDAC資訊通常係藉後一窗或前一窗貢獻。因ACELP時域編碼器與相鄰訊框間無重疊,故FAC可補償此種遺漏重疊的缺失。
業已發現藉由施加LPC濾波器於頻域,LPC編碼路徑解除ACELP與wLPT(TCX-LPD)編碼節段間的內插LPC濾波之部分平滑化衝擊。但業已發現因FAC係設計來允許恰在此一位置的有利變遷,故也可補償此一效應。
由於導入FAC窗及FDNS的結果,可達成全部可能的變遷而無任何特有的過度編碼。
後文中,將敘述有關開窗方案之若干細節。
已經敘述FAC窗如何融合ACELP與wLPT間之變遷。有關進一步細節請參考下列文件:ISO/IEC JTC1/SC29/WG11,MPEG2009/M16688,2009年6-7月英國倫敦,「USAC開窗之替代之道」。
因FDNS將wLPT移位至信號域,故FAC窗現在施加至二者,恰以相同方式(或至少以類似方式)自/至ACELP變遷至/自wLPT,及亦自/至ACELP變遷至/自FD模式。
同理,先前在FD窗間或在wLPT窗間(亦即自/至FD變遷至/自FD;自/至wLPT變遷至/自wLPT)排它可能的基於TDAC之變換編碼器變遷,現在也可施加於自頻域跨至wLPT時,或反之亦然。如此,組合兩項技術允許ACELP框網64樣本朝右(朝向時間軸的「後期」)移位。藉此,不再需要64樣本於一端重疊加法,及另一端的額外長頻域變換窗。兩種情況下,比較參考構想,依據本發明之實施例可避免64樣本之過度編碼。最重要地,全部其它變遷維持原狀而不需要進一步修正。
後文將簡短討論新穎訊框變遷矩陣。新穎訊框變遷矩陣之實例提供於第5圖。主對角線上的變遷仍維持USAC草擬標準工作草稿4。全部其它變遷可藉信號域的FAC窗或直捷TDAC因應。若干實施例中,上述方案需要兩相鄰變換域窗間的兩個重疊長度,亦即1024樣本及128樣本,但其它重疊長度也可接受。
12.主觀評估
須注意已經進行兩項收聽測試來顯示於目前實施狀態,所提示的新穎技術不會有損品質。因在先前捨棄樣本位置的位元節省,依據本發明之實施例預期可提供品質的增高。至於另一項副效應,於編碼器的分類器控制可遠更具彈性,原因在於模式變遷不再影響非臨界取樣。
13.額外註釋
綜上所述,本文說明敘述比較用於USAC草擬標準工作草稿4的既有方案,用於USAC之預期開窗及變遷方案具有數項優點。本文提示的開窗及變遷方案維持全部變換編碼框的臨界取樣,避免兩項變換的無力需要,及妥善排齊全部變換編碼框。該提議係於兩個新工具。第一工具亦即正向混疊抵消(FAC)描述於參考文獻[M16688]。第二工具亦即頻域雜訊成形(FDNS)允許於頻域處理頻域框及wLPT框,而未導入量化雜訊成形的非連續性。如此,USAC的全部模式變遷可以此二基本工具處置,允許全部變換編碼模式之諧波開窗。也提供於本文說明的主觀測試結果,比較依據USAC草擬標準工作草稿4之參考構想,顯示所提示之本工具提供相等的或更佳的品質。
表1~8:
參考文獻
[M16688] ISO/IEC JTC1/SC29/WG11, MPEG2009/M16688, June-July 2009, London, United Kingdom, “Alternatives for windowing in USAC”
100‧‧‧音訊信號編碼器
110,110’‧‧‧音訊內容之輸入表示型態
112‧‧‧音訊內容之編碼表示型 態
112a‧‧‧頻譜係數集合
112b‧‧‧線性預測域參數
112c‧‧‧混疊抵消刺激信號
120‧‧‧時域至頻域變換器
122‧‧‧音訊內容之頻域表示型態
130‧‧‧頻譜處理器
132‧‧‧音訊內容之頻譜成形之頻域表示型態
140‧‧‧線性預測域參數
150‧‧‧混疊抵消資訊提供器
200‧‧‧音訊信號解碼器
210‧‧‧音訊內容之編碼表示型態
212‧‧‧音訊內容之解碼表示型態、混疊減少時域信號
220‧‧‧頻譜係數集合
222‧‧‧線性預測域參數
224‧‧‧混疊抵消刺激信號之表示型態
230‧‧‧頻譜處理器
232‧‧‧頻譜成形版本
240‧‧‧頻域至時域變換器
242‧‧‧音訊內容之時域表示型態
242’,252’‧‧‧後處理版本
250‧‧‧混疊抵消刺激濾波器
252‧‧‧混疊抵消合成信號
260‧‧‧組合器
270,280‧‧‧選擇性的處理器
300,360‧‧‧音訊信號解碼器
310,362‧‧‧位元多工器
320,370‧‧‧頻域模式路徑
320a,330a,380a‧‧‧算術解碼器
320b,330b,380b‧‧‧解碼頻譜表示型態
320c,330c,380c‧‧‧反量化器
320d,330d,380d‧‧‧反量化頻譜表示型態
320e‧‧‧定標
320f‧‧‧定標頻譜表示型態
320g,330e,380h‧‧‧修正離散餘弦反變換(MDCT)
322‧‧‧定標因數資訊
324,374‧‧‧編碼頻譜係數資訊
326,336,346,376,386,396‧‧‧時域表示型態
330,380‧‧‧變換編碼激發線性預測域模式、TCX-LPD模式、TCX-LPD分支
330f‧‧‧激發信號
330g,340c‧‧‧線性預測編碼合 成濾波器、LPC合成濾波器
332‧‧‧編碼變換編碼激發資訊
334‧‧‧線性預測係數資訊
340,390‧‧‧代數碼激發線性預測(ACELP)路徑、ACELP分支
340a‧‧‧ACELP激發處理器
340b‧‧‧ACELP激發信號
342,392‧‧‧編碼激發資訊
344‧‧‧線性預測編碼資訊
350,398‧‧‧變遷開窗
361‧‧‧位元串流表示型態
362‧‧‧位元多工器、位元串流剖析器
370‧‧‧頻域分支
372‧‧‧編碼定標因數資訊
374‧‧‧編碼頻譜資訊
380e‧‧‧定標/FDNS、定標及/或頻域雜訊成形
380f‧‧‧頻譜成形資訊
380g‧‧‧頻譜成形頻譜表示型態
380i‧‧‧LPC至頻域、線性預測係數至頻域變換器
382‧‧‧編碼之頻譜表示型態
384,394‧‧‧編碼之線性預測編碼濾波係數
392‧‧‧編碼ACELP激發
402a-402i‧‧‧橫座標
404a-404i‧‧‧縱座標
410-490‧‧‧窗變遷表示型態
402a-402i,502a-502i‧‧‧橫座標
404a-404i,504a-504i‧‧‧縱座標
410-490‧‧‧窗變遷表示型態
510-590‧‧‧變遷之線圖表示型態
512‧‧‧右半窗
514‧‧‧左半窗
532,534,562,572,574,584,592,594‧‧‧窗
533,563,573,593‧‧‧右側變遷斜坡
535,575,585,595‧‧‧左側變遷斜坡
564‧‧‧方塊、時域音訊樣本
566,586‧‧‧混疊抵消信號
582‧‧‧時間區、方塊
610,612,614,616,618‧‧‧欄
630,632,634,636,638,640,642‧‧‧列
800‧‧‧多模式音訊信號編碼器、音訊信號編碼器
810‧‧‧輸入表示型態
812‧‧‧位元串流
814‧‧‧控制器
820‧‧‧頻域分支
822,852‧‧‧已編碼頻譜係數
824‧‧‧已編碼定標因數
826,856‧‧‧已編碼混疊抵消係數
830,860,875‧‧‧時域至頻域變換
832,840,861‧‧‧頻域表示型態
834‧‧‧心理聲學分析
836‧‧‧定標因數資訊
838,866‧‧‧頻譜處理器
840‧‧‧已定標頻域表示型態
842,844,868,869,876,896‧‧‧量化/編碼
846‧‧‧混疊抵消係數計算
850‧‧‧TCX-LPD分支
854,884‧‧‧已編碼線性預測域參數
861’‧‧‧前處理版本
862,890‧‧‧線性預測域參數計算
863,890a‧‧‧線性預測域參數、線性預測編碼濾波係數
864‧‧‧線性預測域至頻域變換
865‧‧‧頻域表示型態或頻譜域表示型態
867‧‧‧頻譜成形版本
870‧‧‧誤差運算
871‧‧‧混疊誤差資訊
872‧‧‧額外混疊抵消組分資訊
873‧‧‧分析濾波運算
873a‧‧‧分析濾波資訊、資訊
874‧‧‧誤差分析濾波
874a‧‧‧已濾波混疊誤差資訊
877‧‧‧運算
880‧‧‧ACELP分支
882‧‧‧已編碼ACELP激發
892‧‧‧ACELP激發運算、ACELP激發資訊
894‧‧‧編碼
896‧‧‧量化/編碼
898‧‧‧位元串流格式化器
900‧‧‧音訊信號解碼器
902‧‧‧位元多工器
910‧‧‧頻域分支
912,932‧‧‧已編碼頻譜係數
914,932‧‧‧已編碼定標因數資訊
916,936‧‧‧已編碼混疊抵消係數
918,924a,940a,946a,986,998‧‧‧時域表示型態
920,941‧‧‧算術解碼
920a,941a‧‧‧已解碼頻譜係數
921,942‧‧‧反量化
921a,942a‧‧‧反量化頻譜係數
922‧‧‧定標因數解碼
922a‧‧‧已解碼定標因數資訊
923,926c‧‧‧定標
923a‧‧‧已定標頻譜係數
924,946‧‧‧IMDCT、反MDCT、修正離散餘弦反變換
925,978,996‧‧‧組合
926a‧‧‧解碼
926b‧‧‧已解碼混疊抵消係數
926d‧‧‧已定標混疊抵消係數
927,963‧‧‧IV型離散餘弦反變換
927a,963a‧‧‧混疊抵消刺激信號
927b,964,991‧‧‧合成濾波
927c,965a‧‧‧合成濾波係數
927d,965‧‧‧合成濾波運算
929a‧‧‧混疊抵消合成信號
930‧‧‧TCX-LPD分支
932‧‧‧MDCT係數之量化指標
934,984‧‧‧已編碼線性預測域參數、LPC濾波器
940‧‧‧主信號合成
943‧‧‧雜訊填補
943a‧‧‧已反量化且已雜訊填補之頻譜係數
944‧‧‧頻譜解成形
944a‧‧‧頻譜解成形頻譜係數
945‧‧‧頻域雜訊成形
945a‧‧‧頻譜成形頻譜係數
947‧‧‧增益定標
950‧‧‧線性預測域參數解碼
950a,990a‧‧‧已解碼線性預測域參數、LPC濾波係數
951‧‧‧頻譜運算
951a‧‧‧頻域表示型態
952‧‧‧增益運算
952a‧‧‧增益值
953‧‧‧濾波參數運算
960‧‧‧混疊抵消係數之解碼
961‧‧‧混疊抵消係數之定標
961a‧‧‧已定標之混疊抵消係數
962‧‧‧頻譜解成形
962a‧‧‧已增益定標且已頻譜解成形之混疊抵消係數
964a‧‧‧正向混疊抵消合成信號
970‧‧‧ACELP對混疊抵消之貢獻之運算
971‧‧‧後ACELP合成之運算
971a‧‧‧後ACELP合成
972,976‧‧‧開窗
972a‧‧‧已開窗後ACELP合成
973‧‧‧摺疊
973a‧‧‧已開窗且已摺疊後ACELP合成
975‧‧‧零輸入響應之運算
975a‧‧‧零輸入響應
976a‧‧‧已開窗之零輸入響應
980‧‧‧ACELP分支
982‧‧‧已編碼ACELP激發、適應性及已固定碼簿指標
986‧‧‧適應性及已固定碼簿增益
960a‧‧‧已解碼之混疊抵消係數
988‧‧‧已編碼ACELP激發之解碼
988a‧‧‧已解碼ACELP激發
989,992‧‧‧後處理
989a‧‧‧已後處理激發信號
990‧‧‧線性預測域參數解碼
991a‧‧‧已合成ACELP信號
1010,1020,1030‧‧‧訊框或子框、音訊框或音訊子框
1040a,1040b,1040c,1040d‧‧‧橫座標
1042a,1042b,1042c,1042d‧‧‧縱座標
1050,1054‧‧‧正向混疊抵消合成信號、FAC合成信號
1050a‧‧‧非零輸入響應部分
1050b‧‧‧零輸入響應
1056‧‧‧ACELP合信號
1058‧‧‧TC訊框輸出
1060,1062‧‧‧ACELP貢獻
1110,1120,1130‧‧‧框、訊框
1140‧‧‧時域標記
1142‧‧‧框邊界、起點
1144‧‧‧框邊界、終點
1150,1160,1170,1180‧‧‧列
1152‧‧‧原先域信號
1162‧‧‧上曲線
1164,1166‧‧‧下曲線
1172‧‧‧零輸入響應
1182,1182a,1182b‧‧‧誤差信號、變換編碼框誤差
1210-1250,1210’-1250’‧‧‧處理方塊
1222,1232,1242‧‧‧運算
1320‧‧‧第一階段估算
1322‧‧‧運算
1330‧‧‧代數向量量化(AVQ)精化細分
1340‧‧‧反加權
1342‧‧‧反加權AVQ貢獻
1350‧‧‧相加
1510,1610‧‧‧語法
第1圖顯示依據本發明之實施例一種音訊信號編碼器之方塊示意圖;第2a及2b圖顯示依據本發明之實施例一種音訊信號解碼器之方塊示意圖;第3a圖顯示依據統一語音及音訊編碼(USAC)草擬標準的工作草稿4,一種參考音訊信號解碼器之方塊示意圖;第3b圖顯示依據本發明之另一實施例一種音訊信號解碼器之方塊示意圖;第4圖顯示依據USAC草擬標準的工作草稿4,一種參考窗變遷之線圖表示型態;第5圖顯示依據本發明之實施例用於音訊信號編碼之窗變遷的示意表示型態;第6圖顯示提供用於依據本發明之實施例之音訊信號編碼器,或依據本發明之實施例之音訊信號解碼器的全部窗型綜覽之示意表示型態; 第7圖顯示提供用於依據本發明之實施例之音訊信號編碼器,或依據本發明之實施例之音訊信號解碼器的許可窗序列之表格表示型態;第8a-8d圖顯示依據本發明之實施例一種音訊信號編碼器之細部方塊示意圖;第9a-9d圖顯示依據本發明之實施例一種音訊信號解碼器之細部方塊示意圖;第10圖顯示自及至ACELP變遷之正向混疊抵消(FAC)解碼運算之示意表示型態;第11圖顯示於編碼器之FAC標靶運算之示意表示型態;第12圖顯示於頻域雜訊成形(FDNS)之上下文中FAC標靶量化之示意表示型態;第13圖顯示加權代數LPC反量化器之原理之示意表示型態;第14圖顯示頻域通道串流「fd_channel_stream()」之語法之表格表示型態;第15a及15b圖顯示線性預測域通道串流「lpd_channel_stream()」之語法之表格表示型態;及第16圖顯示正向混疊抵消資料「fac_data()」之語法之表格表示型態。
200...音訊信號解碼器
210...音訊內容之編碼表示型態
212...音訊內容之解碼表示型態
220...頻譜係數集合
222...線性預測域參數
224...混疊抵消刺激信號之表示型態
230...頻譜處理器
232...頻譜成形版本
240...頻域至時域變換器
242...音訊內容之時域表示型態
242’、252’...後處理版本
250...混疊抵消刺激濾波器
252...混疊抵消合成信號
260...組合器
270、280...選擇性的處理器

Claims (17)

  1. 一種用以基於一音訊內容之一編碼表示型態來提供該音訊內容之一解碼表示型態之音訊信號解碼器,該音訊信號解碼器包含:一變換域路徑,其係組配來基於頻譜係數之第一集合、混疊抵消刺激信號之表示型態、及多數線性預測域參數,而獲得以變換域模式編碼的音訊內容之一部分的時域表示型態,其中該變換域路徑包含一頻譜處理器,其係組配來取決於該等線性預測域參數之至少一個子集而施加頻譜成形至該頻譜係數之第一集合,而獲得該頻譜係數之第一集合之頻譜成形版本,其中該變換域路徑包含一第一頻域至時域變換器,其係組配來基於該頻譜係數之第一集合的頻譜成形版本而獲得該音訊內容之一時域表示型態;其中該變換域路徑包含一混疊抵消刺激濾波器,其係組配來取決於該等線性預測域參數之至少一個子集而過濾一混疊抵消刺激信號,以自該混疊抵消刺激信號導出一混疊抵消合成信號;及其中該變換域路徑也包含一組合器,其係組配來組合該音訊內容之時域表示型態與該混疊抵消合成信號或其等後處理版本而獲得一混疊減少時域信號。
  2. 如申請專利範圍第1項之音訊信號解碼器,其中該音訊信號解碼器為組配來介於多個編碼模式間切換之一多 模式音訊信號解碼器,及其中該變換域分支係組配來對接在不允許混疊抵消重疊及加法運算之該音訊內容之一先前部分後方的音訊內容之一部分,或對被不允許混疊抵消重疊及加法運算之該音訊內容之一隨後部分所跟隨的音訊內容之一部分,選擇性地獲得該混疊抵消合成信號。
  3. 如申請專利範圍第1或2項之音訊信號解碼器,其中該音訊信號解碼器係組配來介於使用變換編碼激發資訊及線性預測域參數資訊之一變換編碼激發線性預測域模式與使用頻譜係數資訊及定標因數資訊之一頻域模式間切換;其中該變換域路徑係組配來基於該變換編碼激發資訊而獲得該頻譜係數之第一集合,及基於該線性預測域參數資訊而獲得該等線性預測域參數;其中該音訊信號解碼器包含一頻域路徑,其係組配來基於由該頻譜係數資訊所描述之一頻域模式頻譜係數集合,及取決於由該定標因數資訊所描述之一定標因數集合而獲得以該頻域模式編碼之該音訊內容之一時域表示型態,其中該頻域路徑包含一頻譜處理器,其係組配來取決於該定標因數集合而施用頻譜成形至該頻域模式頻譜係數集合或其前處理版本,以獲得一頻譜成形的頻域模式頻譜係數集合,及其中該頻域路徑包含一頻域至時域變換器,其係組 配來基於該頻譜成形的頻域模式頻譜係數集合而獲得該音訊內容之一時域表示型態;其中該音訊信號解碼器係組配來使得該音訊內容之二隨後部分,該音訊內容之二隨後部分中之一者係以變換編碼激發線性預測域模式編碼,而該音訊內容之二隨後部分中之一者係以頻域模式編碼,其時域表示型態包含時間重疊來抵消由該頻域至時域轉換所導致之時域混疊。
  4. 如申請專利範圍第1項之音訊信號解碼器,其中該音訊信號解碼器係組配來介於使用變換編碼激發資訊及線性預測域參數資訊的變換編碼激發線性預測域模式與使用代數碼激發資訊及線性預測域參數資訊的代數碼激發線性預測(ACELP)模式間切換;其中該變換域路徑係組配來基於該變換編碼激發資訊而獲得該頻譜係數之第一集合,及基於該線性預測域參數資訊而獲得該等線性預測域參數;其中該音訊信號解碼器包含一代數碼激發線性預測路徑,其係組配來基於該代數碼激發資訊及該線性預測域參數資訊獲得以ACELP模式編碼之該音訊內容之一時域表示型態;其中該ACELP路徑包含一ACELP激發處理器,其係組配來基於該代數碼激發資訊提供一時域激發信號,及使用一組配來執行該時域激發信號之時域過濾的合成濾波器來基於該時域激發信號及取決於基於該線性預 測域參數資訊所得之線性預測域濾波係數而提供一重建信號;其中該變換域路徑係組配來針對接在以ACELP模式編碼之該音訊內容之一部分後方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分,及針對在以ACELP模式編碼之該音訊內容之一部分前方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分,選擇性地提供該混疊抵消合成信號。
  5. 如申請專利範圍第4項之音訊信號解碼器,其中該混疊抵消刺激濾波器係組配來針對接在以ACELP模式編碼之該音訊內容之一部分後方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分,取決於與該第一頻域至時域變換器左側混疊摺疊點相對應之該等線性預測域濾波參數,過濾該混疊抵消刺激信號,及其中該混疊抵消刺激濾波器係組配來針對在以ACELP模式編碼之該音訊內容之一部分前方之以變換編碼激發線性預測域模式編碼的該音訊內容之一部分,取決於與該第一頻域至時域變換器右側混疊摺疊點相對應之該等線性預測域濾波參數,過濾該混疊抵消刺激信號。
  6. 如申請專利範圍第4項之音訊信號解碼器,其中該音訊信號解碼器係組配來將該混疊抵消刺激濾波器之記憶體值啟動歸零用以提供該混疊抵消合成信號,來將M個混疊抵消刺激信號樣本饋至該混疊抵消刺激濾波器,來 獲得該混疊抵消合成信號之相對應非零輸入響應樣本,及來進一步獲得該混疊抵消合成信號之多數零輸入響應樣本;及其中該組合器係組配來組合該音訊內容之時域表示型態與該等非零輸入響應樣本及隨後的零輸入響應樣本,以在從以ACELP模式編碼之該音訊內容之一部分轉變至以變換編碼激發線性預測域模式編碼的該音訊內容之一隨後部分時,獲得一混疊減少時域信號。
  7. 如申請專利範圍第4項之音訊信號解碼器,其中該音訊信號解碼器係組配來組合一使用ACELP模式所得之該時域表示型態之至少一部分的開窗及摺疊版本與一使用變換編碼激發線性預測域模式所得之該音訊內容之一隨後部分的時域表示型態來至少部分抵消一混疊。
  8. 如申請專利範圍第4項之音訊信號解碼器,其中該音訊信號解碼器係組配來組合該ACELP分支之合成濾波器之零輸入響應之一開窗版本與一使用變換編碼激發線性預測域模式所得之該音訊內容之一隨後部分的時域表示型態,來至少部分抵消一混疊。
  9. 如申請專利範圍第4項之音訊信號解碼器,其中該音訊信號解碼器係組配來於一其中使用重疊頻域至時域變換之變換編碼激發線性預測域模式、一其中使用重疊頻域至時域變換之頻域模式、與一代數碼激發線性預測模式之間切換,其中該音訊信號解碼器係組配來藉由執行該音訊 內容之隨後重疊部分之時域樣本間的重疊及加法運算,而在以變換編碼激發線性預測域模式編碼之該音訊內容的一部分與以頻域模式編碼的該音訊內容的一部分之間轉變時,至少部分抵消混疊;及其中該音訊信號解碼器係組配來使用該混疊抵消合成信號,在以變換編碼激發線性預測域模式編碼之該音訊內容的一部分與以代數碼激發線性預測域模式編碼的該音訊內容的一部分之間轉變時至少部分抵消混疊。
  10. 如申請專利範圍第1項之音訊信號解碼器,其中該音訊信號解碼器係組配來針對藉該變換域路徑之該第一頻域至時域變換器所提供的時域表示型態之一增益定標、及針對該混疊抵消刺激信號或該混疊抵消合成信號之一增益定標,施用一共用增益值。
  11. 如申請專利範圍第1項之音訊信號解碼器,其中該音訊信號解碼器係組配來除了取決於至少該線性預測域參數子集所執行的頻譜成形外,對該頻譜係數的第一集合之至少一子集更施用頻譜解成形,及其中該音訊信號解碼器係組配來施用該頻譜解成形至混疊抵消頻譜係數之一集合之至少一子集而自其中導算出該混疊抵消刺激信號。
  12. 如申請專利範圍第1項之音訊信號解碼器,其中該音訊信號解碼器包含一第二頻域至時域變換器,其係組配來取決於表示該混疊抵消刺激信號之一頻譜係數集合而 獲得該混疊抵消刺激信號之一時域表示型態,其中該第一頻域至時域變換器係組配來執行重疊變換,其包含一時域混疊,及其中該第二頻域至時域變換器係組配來執行非重疊變換。
  13. 如申請專利範圍第1項之音訊信號解碼器,其中該音訊信號解碼器係組配來取決於用於調整該混疊抵消刺激信號之過濾的相同線性預測域參數而施用該頻譜成形至該頻譜係數的第一集合。
  14. 一種用以基於一音訊內容之輸入表示型態而提供該音訊內容之編碼表示型態的音訊信號編碼器,該音訊內容之編碼表示型態包含一第一頻譜係數集合、混疊抵消刺激信號之一表示型態、及多數線性預測域參數,該音訊信號編碼器包含:一時域至頻域變換器,其係組配來處理該音訊內容之輸入表示型態而獲得該音訊內容之一頻域表示型態;一頻譜處理器,其係組配來取決於針對欲以線性預測域編碼之音訊內容的一部分的一線性預測域參數集合,而施用頻譜成形至該音訊內容之頻域表示型態或其前處理版本,來獲得該音訊內容之一頻譜成形的頻域表示型態;及一混疊抵消資訊提供器,其係組配來提供混疊抵消刺激信號之一表示型態,使得該混疊抵消刺激信號取決於該等線性預測域參數之至少一子集的過濾,導致一混疊抵消合成信號用以抵消一音訊信號解碼器中的混疊 假影(aliasing artifacts)。
  15. 一種用以基於一音訊內容之一編碼表示型態來提供該音訊內容之一解碼表示型態之方法,該方法包含下列步驟:基於頻譜係數之第一集合、混疊抵消刺激信號之一表示型態、及多數線性預測域參數,而獲得以變換域模式編碼的音訊內容的一部分之時域表示型態,其中取決於該等線性預測域參數之至少一個子集而施加一頻譜成形至該頻譜係數之第一集合,而獲得該頻譜係數之第一集合之一頻譜成形版本,及其中基於該頻譜係數之第一集合的該頻譜成形版本施用一頻域至時域轉換來獲得該音訊內容之一時域表示型態,及其中取決於該等線性預測域參數之至少一個子集而過濾該混疊抵消刺激信號,以自該混疊抵消刺激信號導出一混疊抵消合成信號,及其中該音訊內容之時域表示型態係與該混疊抵消合成信號或其後處理版本組合而獲得一混疊減少時域信號。
  16. 一種用以基於一音訊內容之輸入表示型態而提供該音訊內容之編碼表示型態的方法,該音訊內容之編碼表示型態包含一第一頻譜係數集合、一混疊抵消刺激信號之一表示型態、及多數線性預測域參數,該方法包含下列步驟: 執行時域至頻域轉換來處理該音訊內容之輸入表示型態而獲得該音訊內容之一頻域表示型態;取決於針對欲以線性預測域編碼之一音訊內容之一部分的一線性預測域參數集合,而施用頻譜成形至該音訊內容之頻域表示型態或其前處理版本,來獲得該音訊內容之一頻譜成形頻域表示型態;及提供混疊抵消刺激信號之一表示型態,使得該混疊抵消刺激信號取決於該等線性預測域參數之至少一子集的過濾導致一混疊抵消合成信號用以抵消一音訊信號解碼器中的混疊假影。
  17. 一種電腦程式,其係用於當該電腦程式於電腦上運行時用以執行如申請專利範圍第15或16項之方法。
TW099135560A 2009-10-20 2010-10-19 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 TWI430263B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US25346809P 2009-10-20 2009-10-20

Publications (2)

Publication Number Publication Date
TW201129970A TW201129970A (en) 2011-09-01
TWI430263B true TWI430263B (zh) 2014-03-11

Family

ID=43447730

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099135560A TWI430263B (zh) 2009-10-20 2010-10-19 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法

Country Status (15)

Country Link
US (1) US8484038B2 (zh)
EP (3) EP4358082A1 (zh)
JP (1) JP5247937B2 (zh)
KR (1) KR101411759B1 (zh)
CN (1) CN102884574B (zh)
AR (1) AR078704A1 (zh)
AU (1) AU2010309838B2 (zh)
BR (1) BR112012009447B1 (zh)
CA (1) CA2778382C (zh)
MX (1) MX2012004648A (zh)
MY (1) MY166169A (zh)
RU (1) RU2591011C2 (zh)
TW (1) TWI430263B (zh)
WO (1) WO2011048117A1 (zh)
ZA (1) ZA201203608B (zh)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011000366A (es) * 2008-07-11 2011-04-28 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar muestras de audio.
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
EP2311034B1 (en) * 2008-07-11 2015-11-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP4977157B2 (ja) 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
EP3764356A1 (en) * 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
BR112012007803B1 (pt) * 2009-10-08 2022-03-15 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear
JP5345737B2 (ja) * 2009-10-21 2013-11-20 ドルビー インターナショナル アーベー 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング
WO2011085483A1 (en) 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering
CA2958360C (en) * 2010-07-02 2017-11-14 Dolby International Ab Audio decoder
JP6100164B2 (ja) * 2010-10-06 2017-03-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012110415A1 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
WO2012110478A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
BR112013020587B1 (pt) 2011-02-14 2021-03-09 Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral
EP2676270B1 (en) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
HUE030185T2 (en) 2011-03-28 2017-04-28 Dolby Laboratories Licensing Corp Reduced Transformation for Low Frequency Effect Channel
TWI470622B (zh) * 2012-03-19 2015-01-21 Dolby Lab Licensing Corp 用於低頻效應頻道降低複雜度之轉換
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
BR112015014217B1 (pt) * 2012-12-21 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
KR101877906B1 (ko) * 2013-01-29 2018-07-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 노이즈 채움 개념
AU2014211520B2 (en) 2013-01-29 2017-04-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-frequency emphasis for LPC-based coding in frequency domain
PT3121813T (pt) * 2013-01-29 2020-06-17 Fraunhofer Ges Forschung Preenchimento de ruído sem informação lateral para codificadores do tipo celp
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
SI3537437T1 (sl) * 2013-03-04 2021-08-31 Voiceage Evs Llc Naprava in postopek za zmanjšanje kvantizacijskega šuma v časovnem dekoderju
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP3011556B1 (en) * 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
RU2641253C2 (ru) 2013-08-23 2018-01-16 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
RU2643646C2 (ru) 2013-11-13 2018-02-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер для кодирования аудиосигнала, система передачи аудио и способ определения значений коррекции
EP2887350B1 (en) 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
PT3000110T (pt) * 2014-07-28 2017-02-15 Fraunhofer Ges Forschung Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos.
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980797A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
FR3024581A1 (fr) 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
EP2988300A1 (en) 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
DK3201918T3 (en) * 2014-10-02 2019-02-25 Dolby Int Ab DECODING PROCEDURE AND DECODS FOR DIALOGUE IMPROVEMENT
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
WO2017050398A1 (en) 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
WO2020164751A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
CN113574889B (zh) * 2019-03-14 2024-01-12 北京字节跳动网络技术有限公司 环路整形信息的信令和语法
CN110297357B (zh) 2019-06-27 2021-04-09 厦门天马微电子有限公司 一种曲面背光模组的制备方法、曲面背光模组及显示装置
US11488613B2 (en) * 2019-11-13 2022-11-01 Electronics And Telecommunications Research Institute Residual coding method of linear prediction coding coefficient based on collaborative quantization, and computing device for performing the method
KR20210158108A (ko) 2020-06-23 2021-12-30 한국전자통신연구원 양자화 잡음을 줄이는 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
KR20220117019A (ko) 2021-02-16 2022-08-23 한국전자통신연구원 학습 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 그 학습 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기
CN115050377A (zh) * 2021-02-26 2022-09-13 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
CN1820306B (zh) * 2003-05-01 2010-05-05 诺基亚有限公司 可变比特率宽带语音编码中增益量化的方法和装置
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP1873753A1 (en) * 2004-04-01 2008-01-02 Beijing Media Works Co., Ltd Enhanced audio encoding/decoding device and method
RU2500043C2 (ru) * 2004-11-05 2013-11-27 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
DE502006004136D1 (de) * 2005-04-28 2009-08-13 Siemens Ag Verfahren und vorrichtung zur geräuschunterdrückung
RU2351024C2 (ru) * 2005-04-28 2009-03-27 Сименс Акциенгезелльшафт Способ и устройство для подавления шумов
AU2007331763B2 (en) * 2006-12-12 2011-06-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
PT2165328T (pt) * 2007-06-11 2018-04-24 Fraunhofer Ges Forschung Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária
ES2401487T3 (es) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
EP3764356A1 (en) * 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain

Also Published As

Publication number Publication date
EP4358082A1 (en) 2024-04-24
EP2491556A1 (en) 2012-08-29
AU2010309838A1 (en) 2012-05-31
AU2010309838B2 (en) 2014-05-08
US20120271644A1 (en) 2012-10-25
JP2013508765A (ja) 2013-03-07
CA2778382A1 (en) 2011-04-28
EP4362014A1 (en) 2024-05-01
WO2011048117A1 (en) 2011-04-28
RU2591011C2 (ru) 2016-07-10
BR112012009447B1 (pt) 2021-10-13
CN102884574B (zh) 2015-10-14
EP2491556B1 (en) 2024-04-10
MY166169A (en) 2018-06-07
MX2012004648A (es) 2012-05-29
AR078704A1 (es) 2011-11-30
BR112012009447A2 (pt) 2020-12-01
KR20120128123A (ko) 2012-11-26
CN102884574A (zh) 2013-01-16
ZA201203608B (en) 2013-01-30
CA2778382C (en) 2016-01-05
JP5247937B2 (ja) 2013-07-24
RU2012119260A (ru) 2013-11-20
TW201129970A (en) 2011-09-01
KR101411759B1 (ko) 2014-06-25
US8484038B2 (en) 2013-07-09

Similar Documents

Publication Publication Date Title
TWI430263B (zh) 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法
JP5678071B2 (ja) 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム
JP5555707B2 (ja) マルチ分解能切替型のオーディオ符号化及び復号化スキーム
JP5243661B2 (ja) オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム
JP5600822B2 (ja) 正弦波置換を用いた音声符号化および復号化のための装置および方法
KR20120082435A (ko) 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩
WO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
JP5323144B2 (ja) 復号装置およびスペクトル整形方法
JP5127170B2 (ja) 復号装置およびスペクトル整形方法
JP5323145B2 (ja) 復号装置およびスペクトル整形方法
WO2012053149A1 (ja) 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法