TW201214415A - Low-delay unified speech and audio codec - Google Patents

Low-delay unified speech and audio codec Download PDF

Info

Publication number
TW201214415A
TW201214415A TW100118660A TW100118660A TW201214415A TW 201214415 A TW201214415 A TW 201214415A TW 100118660 A TW100118660 A TW 100118660A TW 100118660 A TW100118660 A TW 100118660A TW 201214415 A TW201214415 A TW 201214415A
Authority
TW
Taiwan
Prior art keywords
frame
celp
coding
transform
excitation
Prior art date
Application number
TW100118660A
Other languages
English (en)
Inventor
Ralf Geiger
Markus Schnell
Guillaume Fuchs
Emmanuel Ravelli
Tom Baeckstroem
Jeremie Lecomte
Konstantin Schmidt
Nikolaus Rettelbach
Manfred Lutzky
Bernhard Grill
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201214415A publication Critical patent/TW201214415A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

201214415 六、發明說明: c發明戶斤屬之技術領域;j 本發明係有關於一種統一語音及音訊解碼器,諸如由 s吾音及音樂或具有時間變化比在此等貢獻間之不同類型的 其它音訊貢獻組合所組成之編碼信號。特別地,本發a月係 有關於一種低延遲解決之道。 C先前技術】 發明背景 有利地混合不同編碼模來編碼表示不同型音訊作號諸 如語音、音樂等之混合型的一般音訊信號。個別編碼模可 調整適應特定音訊類型,如此,多模音訊編碼器可利用隨 著時間之經過,相對應的音訊内容類型改變而改變編碼 模。換言之,多模音訊編碼器例如可判定使用特別專用於 編碼語音之編碼模來編碼音訊信號中具有語音内容之部 分,及使用另一編碼模來編碼音訊信號中表示非語音内容 諸如音樂之不同部A。舉例言之,碼薄激勵線性預測編碼 模傾向於較為適合編碼語音内容,例如至於有關音樂之編 碼,變換編碼激勵線性預測編碼模傾向於表現優於碼薄激 勵線性預測編碼模。 目前已經有因應不同音訊類型並存在一個音訊信號内 部問題的解決之道。舉例言之,目前出現的仍从提示在頻 域編碼模間切換大為符合AAC鮮,又有兩個線性預測模 係類似AMR-WB+標準之子框模,亦即Tcx模及ACELp模。 某個框結構係用來在FD域與Lp域間切換。該amr wb+標 201214415 準使用其本身的框結構形成相對於USAC標準之子框結 構。AMR-WB+標準允許某些細分組配來細分AMR WB+框 成為更小型TCX框及/或ACELP框。同理,AAC標準係用作 為基礎框結構,但允許使用不同窗長度來變換編碼框内 容。舉例言之,可使用一長窗及相關聯之長型變換長度, 或可使用八短窗其具有相關聯之較短的長度變換。 另一方面,某些音訊編解碼器已經特別設計供低延遲 應用用途。例如,諸如透過電話等的雙向通訊需要低編碼 延遲來避免在通訊期間不愉快的等候時間。例如 特別係專用於此等應用類型。不幸地,aac_eld#純粹頻 域編碼模,如此,AAC-ELD並非最佳地設計用於混合型信 號亦即統一不同型音訊部分之音訊信號的編碼。 ϋ發明内容;3 發明概要 如此,本發明之一目的係提出—種統一語音及音訊解 碼器包含兩項能力’亦即因應在欲編碼音訊信號内部並存 語音部分及非語音部分,且保持低的編碼延遲。 此項目的係藉申請專利範圍獨立項之主旨予以滿足。 依據本發明之一個實施例,一種統一語音及音訊解碼 器包含一框緩衝器其係經組配來以框為單位,緩衝由接續 框所組成之-㈣串流之—子部分,使得該子部分連續地 包含至少一個框,各個框表示一音訊信號之接續部分中之 -個別部分之-編碼版本,及各個框包含—模式識別符, 其分配個郷給&含-碼冑激勵祕制(CELp)編碼模式 4 201214415 及一變換、編碼激勵線性預測編碼模式之多個編碼模式中之 個別-者。又,該統-語音及音訊解碼器包含一celp解碼 器其係經組配來解碼已經分配該CELP編碼模式之框,來重 建該個別部分;-變換編碼激麟性㈣解碼器其係經組 配來解碼已經分$變換編碼激勵線性預測編碼模式之 框’來重建該個別部分’其中該框緩衝器係經組配來在逐 框從該框緩衝ϋ移出侧框之下,分配料經緩衝之框給 該CELP解碼器及變換編碼激勵線性預測解碼器。 據此,本發明之實施例提出_種統一語音及音訊編碼 器包含-模切換器其係經組配來對—音訊信號之接續部分 各自分派包含-CELP編碼模及一變換編碼激勵線性預測 編碼模之多個編碼模中之⑽卜者;_CELp編碼器其係經 組配來編碼分派該CELP編碼模的該等部分來獲得cELp 框;及-變換編碼激勵線性預測編碼器其係經組配來編碼 分派該變換編碼激勵線性預測編碼模的該等部分來獲得變 換編碼框’其中該統一語音及音訊編碼器係經組配來使得 各個框包含-模識別符’其於個別框為cELp框之情況下係 識別該CELP編碼模,及於個別框為變換編碼框之情況下係 識別該變換編碼激勵線性預測編碼模。 *藉由對各個框提供以用以識別或指示分派給個別框的 模之模識财’將二祕預測編碼模與目前正在執行的 編碼模分祕合成為雜為單位而建構編解碼器,儘管一 方面有語音及非語音部分並存而另—方面為低延遲,允許 達成編碼效率間的優異折衷。 201214415 依據本發明之一個實施例,變換編碼框之長度係限於 CELP框之長度’亦即二框長度彼此相等。就音訊信號非屬 叩曰。卩刀且具向音調部分考慮,如此傾向於降低編碼效 率原因在於變換長度係以變換編石馬框之框長度標度。但 由此所造成的編碼效率損失比起因限制所導致的編碼延遲 減低之增益為可忽略不計。 圖式簡單說明 後文將參考附圖描述本發明之較佳實施例,附圖中: 第1圖顯不依據一實施例一種統一語音及音訊編碼器 之方塊圖;及 第2圖頁示依據一貫施例一種統一語音及音訊解碼器 之方塊圖。 C實施方式;3 第1圖顯示依據本發明之-實施例之統一語音及音訊 編碼器m統-語音及音訊編碼㈣包含—模切換器 12、一CELP編碼器μ及一變換編碼激勵線性預測(亦即TCX) 編碼器16。選擇性地,該編碼器可包含一帶寬延展模組丄8。 更明確言之,模切換器12具有一輸入端,其係連結至編碼 器10之輸入端22用來接收欲編碼之音訊信號24。當存在 時,帶宽延展模組18係連結在輸入端22與模切換器12之輸 入端間。模切換器12具有兩個輸出端,其分別係連結至 CELP編碼器14及TCX編碼器16之輸入端。CELp編碼器 14、TCX編碼器16、以及若存在時帶寬延展模組18係透過 多工器20而連結至編碼器1 〇之輸出端%。 201214415 第1圖之統-語音及音訊編碼器係用來以低編碼延遲 編碼在輸入端22載入的音訊信號24,且使得即便在輸入端 22載入的音訊信號從非語音音訊信號轉成語音音訊信號及 反之亦然,仍然維持高編碼效率。 為了達成此項目的,統一語音及音訊編碼器支援兩項 編碼模,亦即兩種LP-線性預測編碼模包括TCX(變換編碼 激勵)及CELP(碼薄激勵線性預測)編碼模。於Tcx及 編碼模中,音訊内容接受線性預測分析來獲得線性預測係 數,而此等線性預測係數係連同激勵信號而在位元串流内 發射,g使用在6玄位元串流内部的線性預測係數而以相對 應的線性預測合成濾波器濾波時,獲得該音訊内容之解碼 表示型態。如第1圖所示,CELP編碼器14及1(:又編碼器16 可共享一分析器28來達成此項目的,該lp分析器28係連 結至多工器20來前傳有關線性預測係數之資訊至解碼端, 容後詳述。 TCX編碼器16係負責TCX模。於TCX中,恰在前述的 激勵彳§號係變換編碼;而在CELP編碼器14所負責的CELP 編碼模之情況下,激勵信號係藉檢索(indexing)在碼簿内的 分錄而編碼,或否則合成式地建構欲以前述合成濾波器濾 波的樣本之碼薄向量而編碼。更明確言之,在編碼器14内 部可具體貫施CELP編碼之特定類型,諸如aceLP(代數碼 薄激勵線性預測)’據此該激勵係由適應性碼薄激勵及創新 碼薄激勵所組成。容後詳述,Tcx模可具體實施使得線性 預測係數係直接地在頻域,在解碼器端探討用以藉推論定 7 201214415 標因數來整形雜訊量化。於此種情況下,TCX係設定為移 轉LPC係數成為頻率整形資訊及直接將該係數施加至頻域 的激勵信號上,來從該資料串流回復變換域中的激勵信 號,而非先將激勵信號變換成時域,然後基於LPC濾波信 號而應用合成渡波器。但後述方法也可行。 除了至目前為止描述的主要編碼模之外,音訊編碼器 10可以切換開/關次編碼選項,諸如由帶寬延展模組18所支 援的帶寬延展選項。 已經連同所支援的編碼模之大致综論而相同概略地敘 述第1圖之編碼器10結構後,第1圖所示元件間之協作容後 詳述。 更明確言之’模切換器12係經組配來對音訊信號24之 接續部分30a、30b及30c各自分派前述編碼模亦即TCX模及 CELP編碼模中之個別—者。 如第1圖所示’以時間t測量或以樣本數目測量,各部 分30a、30b及30c可具有相等長度,而與分派給它的編碼模 無關。此外或另外,部分3〇a、3〇b ' 3〇c可以是不重疊,但 用來編碼TCX編碼部分之變換長度可延伸超過此等部分, 分別地延伸入先前部分及後續部分,容後詳述。至目前為 止,在部分30a-c間之TCX部分之長度可使用變換編碼其變 換窗長度減此等窗之混疊抵消部分長度除以2而定義。至於 CELP部分’其延展可測定來界定其編碼之信號%部分。 換έ之’音§fUf^;24可以某個取樣率取樣,及部分3〇a 至以相料間及相等樣本數目涵蓋音姉餅之緊鄰 8 201214415 接續部分。模浦胃12_她來例如基於隸財措施最 佳化而執行模的分派,成本措施例如組合編碼率及品質。 如此,編碼模切換器12係經組配來對兩個編碼模申之 任一者分派該音訊信號24之多個部分3〇a至3〇c。針對各個 框30a至30c,模切換器12可在二編碼模間自由選擇,而與 先前已經接受分派的先前部分之分派無關。模切換器以前 傳已經被分派CELP編碼模之部分給CELP編碼器14,及已 經被分派tcx編碼模之部分給TCX編碼器16。但須注意藉 模切換器12所執行的分派可能是編碼器丨4及i 6與模切換器 12間協力合作的結果。舉例言之,編碼器14及16可對各框 30a至30c執行試驗,使得試驗可藉模切換器12評估來決定 最終欲使用的編碼模。又,須注意在一個部分與緊接其後 部分間從一個編碼模變遷至另一個編碼模,可能導致模切 換器12則傳一部分至二編碼器14及16或其子部分來允許其 執行特別的混疊抵消措施。 CELP編碼器14係經組配來編碼已經被分派cELp編碼 模之該等部分來獲得CELP框。CELP編碼器14前傳CELP框 之潛在資訊給多工器20,其又轉而將該資訊插入在輸出端 26輸出的資料串流。同理,TCX編碼器16係經組配來編碼 已經被分派TCX模之該等部分來獲得TCx框,前傳該框之 潛在資訊給多工器20來將其插入資料串流32。編碼器14及 16皆係組配來使得資料串流32之各框34a、34b及34c包含指 示個別框之模的模識別符。如此,結果所得在輸出端26的 資料串流32包含音訊信號24的每一部分3〇a至3〇c有一個框 201214415 34a、34b及34c。如第1圖所示,例如以位元測量得之框34a 至34c其框長度無需彼此相專。反而,框34a至34c長度各異。 因編碼器14及16皆係屬線性預測型,對音訊信號24之 接續部分30a至30c連續執行線性預測分析。如前述,編碼 器14及16共同擁有的LP分析器28可負責執行線性預測分 析。LP分析器28可經組配來分析目前部分内部之音訊内容 來決定線性預測濾波係數。藉此方式,LP分析器28可針對 各個部分30a至30c產生線性預測濾波係數。然後線性預測 滤波係數由編碼器14及16用來執行個別編碼,容後詳述。 LP分析器28可對原先内容之預強調版本操作,而個別預強 調渡波器可以是高通,換言之,第η階乘高通濾波器諸如 Η(ζ)=1-αζ 1 ’ α係設定為例如0.68。LP分析器28可經組配來 藉使用例如自動相關性或協方差方法而測定輸入部分3〇a 至30c之線性預測係數。舉例言之,使用自動相關性方法, 可產生自動相關性矩陣,及使用李杜氏(Levins〇n_Durbin) 演繹法則而獲得LPC係數。LPC係數定義一合成濾波器,其 粗略地模型化人類聲道,而當受激勵信號驅動時,大致上 模型化流經聲帶的氣流。此一合成濾波器係使用藉Lp分析 器28之線性預測而予模型化。 聲道形狀的改變率受限制。如此,Lp分析器28可使用 LPC係數適應於限制之更新率,且與部分3加至3(^之框率不 同。為了發射LPC係數,所使用的LPC係數其上支援側邊資 訊可以比更新率之更低率透過多玉㈣而發射至解碼端。 舉例言之,發射率可等於部分30a至30(:之部分率。更明確 10 201214415 -之’更新率可大於部分率,及LPC側邊資訊之發射率可 介於更新率(含)與部分率(也含)間。藉由例如在資料争流内 例如每框/部分發射的LPC係數間内插而可達成大於框率/ 部分率的粒度或更新率。舉例言之,各部分可細分為4子 框使件於256樣本部分之情況下,各子框具有64樣本長 度如此,在支援LPC係數資訊間的時間性内插可用在編 碼端及解碼端來濾波支援時間之間之_。藉此方式,編 碼器及解碼器二者接取相同量化LPC係數。 士此由LP分析器28所執行的LP分析提供某些濾波器 之貝或界定某些m,諸如線性制分㈣波器或白 化濾波器A(z),具有H⑻=1/A⑴,及選擇性地使用的知覺 加權濾波器’諸如w(z)=A(zA),其中λ為加權因數。 如此,LP分析器28發射LPC係數資訊給多工器2〇用以 插入^料串流32。此項資訊可表示在適當域諸如頻譜對域 等的量化線性預測係數。即使線性預測係數之量化可於此 域執行。如前文已述,LP分析器28可以比較LPC係數在解 碼端實際發射與重構率更高的更新率來測定Lpc係數。後 述更新率例如可藉内插在L P C發射支援時間之間而達成, 且甚至係高於部分率。LPC發射支援時間可以部分率發 生。顯然只有解碼端接取量化LPC係數,如此,由相對應 的重構線性預測所界定之前述濾波器係標示為ft⑺、A⑴及 设⑴。 如前文摘述,LP分析器28分別界定LP合成濾波器H(z) 及HU),其當施加至個別激勵時,除了若干後處理外,回 201214415 復或重建原先音訊内容,但在此處為了方便解說不再詳加 考慮。CELP編碼器14及TCX編碼器16係用以界定或測定此 一激勵之估值,及分別地透過多工器20及資料串流32發射 其上個別資訊至解碼端。 至於TCX編碼器16,其可經組配來藉由使用基於窗之 時間至頻譜變換,諸如MDCT而產生目前TCX部分之頻譜 表示型態,依據目前部分之線性預測濾波係數來加權該頻 譜表示型態,及將已加權頻譜表示型態編碼成關聯該目前 部分之資料_流32之個別框。更精確言之,TCX編碼器16 可將已經被分派TCX模之在目前部分的輸入信號34、或其 預強調版本(例如藉使用前述預強調濾波器而預強調),使用 例如與先前部分及/或後續部分的若干重疊而接受MDCT變 換。更明確言之,在TCX編碼器16用以開窗且將目前部分 (例如30b)變換成頻譜域的窗50可重疊後續框(例如30c)&/ 或先前框(例如30a)。在實際變換之前用以開窗的窗函數5〇 可包含在其起點及終點的零部分52u,及在目前部分之前 緣及後緣的混疊抵消部分54!,2,因而重合先前或後續TCX 部分(例如30a、30c)的混藝抵消部分。窗函數5〇可定義為不 含零部分52,,2。但其它解譯亦屬可能。 界定變換長度56之整個窗50之所得頻譜表示型態亦即 變換之頻譜係數,諸如DCT,然後可使用接收自Lp分析器 28之LPC係數接受頻譜加權。LPC係數轉換成頻譜加權係 數,使得所得頻譜形成相對應的分析濾波轉換函數或知覺 加權分析濾波轉換函數,例如知覺加權係由前述知覺加權 12 201214415 渡波器執行。錄如此所得加軸譜表示型驗量化,且 使用例如頻譜-致量化步驟大小,藉tcx編瑪器關碼, 藉此(知覺地)形成量化雜訊。 如此’因窗函數50與先前部分及後續部分之知重 疊,TCX編碼1116造成微小延遲,但此項延遲可藉使用低 延遲窗函數衫減少,其係料前/後續部分重疊在只有 P刀長度的力量重疊非零部分52丨2。例如該分量可等 於或小於縣鳩長度的四分之_。财之,使㈣窗之非 零部分可延展至目前部分之先前及/或後續部分在短於或 等於目前㈣之TCX部分長度的四分之—長度。但另外, 也可使用窗函數間之5〇%重疊。 與TCX編碼器16相反,CELp編碼器14係經組配來科由 使用碼薄指數來編碼被分派C E L p編碼之目前部分之目前 激勵。更明確言之’ CELP編碼器14可經組配來以發射碼薄 指數,藉適應性碼薄激勵與創新碼薄激勵的組合來概算目 前激勵,通過多卫器2〇而對解碼端獲得此—概算。CELP編 碼器14係經組配來針對目前框建構適應性碼薄激勵,因而 例如由過絲勵界定,亦即祕先前編碼CELP部分之激勵 界定;及針對目前CELP部分之適應性碼薄參數,其以某種 方式修改過去激勵來㈣目前適雜觸激勵1應性碼 簿激勵可界定音調雜及職,描述如何修㈣去激勵。 CELP編碼器14藉將適應性碼薄參數前傳至多工器如而將 其編碼成資料串流32。又復,CELP編碼器m可建構 碼薄指數針對目前敎所界定的_簡激勵,及藉將創 13 201214415 新碼簿&數剛傳至多工器2〇,而將其編碼成資料串流μ用 以插入資料串流32及個別框34a至34e〇更明確言之,CELP 編碼器14可經組配來測定創新碼薄指數連同個別創新碼薄 增益,及將其前傳心插人㈣串流。實際上,適應性碼 薄參數及創新碼薄激勵二者及/或二者增益值可整合成一 個共通語法元素’且共通地編碼成資料串流32之個別框。 其共同地允許解碼器回復如此由CELp編碼器14所測定之 目前激勵之概算。換言之,適應性碼薄可藉音調滯後及增 益而在資料串流定義,而麟碼料透過有關該創新碼薄 之碼薄指數及增益的相關資訊而傳訊至解碼端,其中二增 益值可共通地編碼* 為了保證編碼器及解碼器内部狀態之同步化,cELp編 碼器14不僅決定語法元素來使得解竭^回復目前碼薄激 勵’同時也藉實際上產生語法元素來實際上更新其狀態, 而使用如此所得目前碼薄激勵’亦即實際目前激勵之概算 作為起點,亦即使用過去激勵用以編碼下一個(:^〇)部分。 更精確s之’ CELP編碼器14可經組g己來於建構適應性 碼薄激勵及顏碼薄激勵中,考慮所得激勵係在解碼端接 受LP合成滤波用以重建,相對於目前部分之音訊内容,最 小化知覺加縣真措施。實際上,簡指數可在編碼器及 解碼端檢索某些表來檢索或以其它方式測定作為Lp合成渡 波器之一激勵輸入的向量。與適應性碼薄激勵相反地,創 新碼薄激勵係與過去激勵獨立分開地測定。實際上,CELp 編碼器14可經組配來使用過去且重建的先前編碼CELp部 201214415 分激勵而測定針對目前CELP部分之適應性碼薄激勵,藉使 用某些延遲及增益值及預定(内插法)濾波而修改後者,使得 當藉合成濾波器濾波時,所得目前部分之適應性碼薄激勵 最小化差異至某個目標,用以讓適應性碼薄激勵回復原先 音訊内容。剛才述及的延遲、增益及濾波係藉適應性碼薄 參數指示。其餘的不一致係藉創新碼薄激勵補償。再度, CELP編碼器14適合設定創新碼薄指數來找到最佳創新碼 薄激勵’其當組合(諸如相加至)目前部分之適應性碼薄激勵 時’獲得針對目前目部之目前激勵,而後者用作為建構隨 後CELP部分之適應性碼薄激勵時的過去激勵。有關進一步 細節,可參考AMR-WB+標準之ACELP模。 如前文已述,編碼器1〇可選擇性地包含帶寬延展模 組。此—帶寬延展模組18可經組配來針對部分3〇a至30c產 生帶寬延展側邊資訊,及藉多工器20逐框將個別帶寬延展 資訊插入資料串流。如前述,帶寬延展模組18為選擇性, 如此可能不存在。另外,編碼器10可切換,因而切換帶寬 延展模組18的操作開關。若為操作,則帶寬延展模組18可 如下操作。首先,帶寬延展模組18可對原先音訊信號24操 作,及進一步前傳例如只有其帶寬限制部分給模切換器 12。舉例言之,帶寬延展模組18可對音訊信號24以全取樣 率操乍而模切換器只以一半取樣率或以相對於帶寬延展 模、’且18執行帶寬延展編碼的原先取樣率,具有另一適當分 量比的取樣率而触音訊錢24。帶寬延展模⑽例如可 藉使用例如分析慮波器排組而執行輸入音訊信號24之頻譜 15 201214415 分析。運用此一分析濾波器排組,帶寬延展模組18可在具 有時間性解析度高於部分3〇a至30c之部分率的頻譜/時間網 格獲得音訊信號24之時間/頻譜取樣。例如參考第1圖所示 虛線網格70作為分析濾波器網格實例。為了獲得音訊信號 24之此一空間/時間頻譜圖70,帶寬延展模組18可使用變換 窗及MDCT變換、依據HE-AAC如用於SBR之QMF濾波器排 組、或依據AAC-ELD如用於低延遲SBR之CLDFB(複合低延 遲濾波器排組)。然後,帶寬延展模組18分析在音訊信號24 之高頻部分72,亦即非前傳至模切換器12的音訊信號24之 頻谱組分内部的頻譜圖之頻譜波封。帶寬延展模組18可藉 測定在一頻譜/時間網格,該網格係比由前述分析濾波器排 組所提供的頻譜/時間網格更粗大的頻譜/時間拼貼塊⑴le) 之能而決定頻譜波封,諸如係藉加總此等拼貼塊内部的頻 譜係數76之平方。基於此種頻譜波封’帶寬延展模組18決 定SBR資料,其係透過多工器2〇發送至解碼端。在解碼端, 高頻部分可基於SBR資料而重建,而其方式係藉適當地複 製(或否則轉調)藉解碼由編瑪器14及16所輸出的celP框及 tcx框所得的重建音訊信號之低頻部分78來獲得精細變化 的尚頻預填補頻譜,及依據由SBR資料所界定的頻譜波封 而頻譜地成形後者。有關SBR之進一步細節請參考 AAC-ELD標準。 但另外,如從AMR-WB標準所已知的盲帶寬延展可用 來將從分別地藉CELP編碼器14&TCX編碼器16所輸出的 框可重建之帶寬延展至在解碼端的較高頻部分。 201214415 綜上所述,各框34a及34C可結合下列資訊: 1) 杈識別符指不目前框是否與分別地使用CELp模或 TCX模編碼的部分3〇a_g_ 3〇0相關聯; 2) LPC係數育料有關相關聯之部分3〇a至3〇c :如前 述’ LPC更新率可能甚至高於部分率,使得例如由Lpc係數 資料所界定的LPC係數可藉在編碼器及解碼器内插而在相 關聯之部分内部改變數次; 3) 比較分別地藉資訊内容3)及4)所得之帶寬78,帶寬 延展資料諸如SBR資料協助解碼器延展目前框之帶寬;更 明確s之,SBR資料可涵蓋與目前部分3〇a至3〇c相關聯之時 間區間’亦即包含該時間區間内部之高頻部分72的波封相 關資訊; 4) 於目刖框為TCX框之情況下,(如藉施加(經知覺加 權之)分析LPC濾波移轉函數至(預強調之)音訊信號所得的 激勵信號或殘差信號之)加權頻譜表示型態之一編碼表示 型態; 5) 於目前框為CELP框之情況下,除其它資料外,碼薄 指數(諸如創新碼薄指數)允許基於後去激勵信號諸如適應性 碼薄激勵及此或響度相關語法元素而重建目前激勵信號。 如此,藉限制有關主要/核心編碼模的決策至前文摘述 之TCX及CELP編碼模,編碼器可以良好編碼效率提供低 編碼延遲,即便於非特定音訊信號類型亦即語音或非語音 時亦如此。從後文可能的音訊解碼器之描述,低編碼延遲 將變得更為彰顯。 17 201214415 第2圖描述統一語音及音訊解碼器loo可解碼由第1圖 之編碼器所產生的資料串流而重建原先音訊信號。 解碼器100包含一框緩衝器102、一CELP解碼器1〇4及 一 TCX解碼器1 〇6。框緩衝器102係連結在解碼器丨00之輸入 知108與解碼器1〇4及106個別的輸入端間。解碼器1〇4及106 個別的輸出端係連結至個別重組器。選擇性地,解碼器1〇〇 包含一帶寬延展模組112,而重組器11〇係直接地或透過選 擇性帶寬延展模組112而連結至解碼器1〇〇之輸出端114。 解碼器100之操作模式如下述。如由第1圖之編碼器產 生的 > 料串流32輸入輸入端108。如前文已述,資料串流32 包含接續框34a至34c,如第1及2圖例示說明,框343至34() 可呈自谷式排列在資料串流32内部,或排列成資料串流之 連續部分。但資料串流32内部的其它配置亦屬可行。 總而言之,框緩衝器102係負貴針對分別地在模組 104 1〇6、110及112上細作而緩衝框34a至34c。框緩衝器 102係經組配來以此等框34&至34c為單位而緩衝資料串流 32,及在從緩衝器逐框地移出個別框之下,分配經緩衝的 框至CELP解碼器104及TCX解碼器1〇6。換言之,在框緩衝 器102内部占有的儲存空間分別地以框為單位增減,及可用 的儲存空間可經組配來例如保證容納至少一個框。易言 之,框緩衝器10 2可經組配來以框為單位緩衝資料串流之一 小部分,使得經緩衝之小部分連續地包含至少一個框亦 即目前欲解碼的一個框。當然,框緩衝器可具有可用的儲 存空間,一次容納多於一個框。 18 201214415 如上述,各框包含一模識別符其係分派個別框34a至 34c給包含CELP編碼模及變換編碼激勵lp編碼模之多個編 碼模中之個別一者。 CELP解碼器係經組配來分派CELP編碼模之框3如至 34c,重建原先音訊信號24之已編碼/可重建版本116之個別 部分30a至30c。同理,TCX解碼器106係經組配來解碼分派 TCX模之框34a至34c ’重建已重建版本116,亦即個別框表 示的已編碼版本之部分3〇a至30c。 更精確言之,框緩衝器從其内部儲存空間移出目前欲 解碼框,及分配其中所含資訊給個別接收器。無庸殆言, 此種解多工功能可藉額外解多工器執行,解多工器可定位 在一方面框緩衝器102與另一方面模組1〇4、106、11〇及112 間。舉例言之,若目前框為TCX框,則框緩衝器102將該框 前傳至TCX解碼器106。至少框緩衝器102對TCX解碼器1〇6 提供以前述激勵信號之加權頻譜表示型態。同理,框緩衝 器102前傳CELP框至CELP解碼器1〇4。至少碼薄指數係提 供給CELP解碼器1〇4。於施加帶寬延展之情況下,框緩衝 器102可前傳含在框内部的帶寬延展資料給帶寬延展模組 112。同理,位在TCx編碼模與⑶!^編碼模間變遷的框可 包含額外混疊抵消資訊,及框緩衝器1〇2可經組配來前傳此 種額外資訊至重組器110。最後,位元串流包含線性預測濾 波係數上之資訊,框緩衝器前傳此一資訊至CELp解碼器 104及TCX解碼器1〇6 ^因解碼器104及1〇6二者係屬線性預 測型,且仰賴線性預測係數,二解碼器皆可共享或聯合擁 19 201214415 有線性預測係數解碼器118。如前文已述,此一線性預測係 數資訊解碼器118針對各個框34a至34c,獲得相對應的線性 預測濾波係數。為了達成此項目的,解碼器118可自資料串 流32獲得支援線性預測係數,相對應於藉時間性内插法而 内插欲用於個別框34a至34c之線性預測係數的支援時間。 基於此種線性預測濾波係數資訊,Tcx解碼器1〇6及 CELP解碼益1〇4解碼所分派的框。 更明確s之,TCX解碼器1〇6可經組配來以下述方式解 碼目前欲解碼的且分派有TCX模之一框。首先,TCX解碼 器106可從目前框解碼加權頻譜表示型態。如此例如可包括 加權頻譜表示型態之頻譜係數之解量化及重新定標。然 後,TCX解碼器1〇6可使用藉解碼器所得針對目前框之線性 預測濾波係數而執行加權頻譜表示型態之重新加權。為了 達成此項目的,TCX解碼器106可依據由線性預測濾波係數 所界定的(選擇性地知覺加權)LPC合成濾波器相對應的轉 換函數,而將此等線性預測濾波係數轉成頻譜加權因數共 同界定一頻譜形成。如此,TCX解碼器1〇6頻譜形成如得自 資料串流32之加權頻譜表示型態來獲得重新加權之頻譜表 示型態。然後,重新加權之頻譜表示型態藉使用基於窗之 頻至時變換而重新變換成時域。設想例如部分3〇b為目前 TCX框。在執行基於窗之頻至時變換後,TCX解碼器1〇6獲 得與重疊部分30b的重建信號丨16之時間部分相關的時域信 號,其係與目前解碼框相關聯,但延伸超過該部分3〇b進入 後續部分30c及先前部分3〇p此一時間部分56可包含前述 20 201214415 混疊抵消部分54a及54b在目前框30b與緊鄰先前框及後續 框部分30a及30c間之邊界。如此,為了完成針對目前框3〇b 之基於窗之頻至時變換,重組器在混疊抵消部分54a及 54b内部重組,亦即重疊與相加針對接續TCX框,藉基於窗 之頻至時變換所得的時域信號來獲得此等部分之實際時域 重建版本。 CELP解碼器104係經組配來使用含在目前CELP框内 部的碼薄指數來建立目前框之激勵信號,及取決於該目前 框之線性預測濾波係數而施加合成濾波器至該激勵信號, 因而獲得目前CELP框之時域信號。如前述,CELP解碼器 104可使用ACELP,於此種情況下,CELP解碼器1〇4可從目 前框取回創新碼薄指數連同適應性碼薄參數。CELP解碼器 10 4使用該指數來分別地重建適應性碼薄激勵及創新碼薄 激勵。舉例言之,使用適應性碼簿參數,CELP解碼器1〇4 可依據適應性碼薄參數,藉修改/内插過去重建的激勵而建 構適應性碼薄激勵^ CELP解碼器104可組合此種適應性碼 薄激勵與創新碼薄激勵,來獲得目前激勵之重建版本。為 了獲得創新碼薄激勵’ CELP解碼器1〇4評估創新碼薄指 數。適應性碼薄激勵及創新碼薄激勵二者係藉一加權和而 彼此組合,而加權因數也係藉CELP解碼器1〇4透過適應性 碼薄參數及創新碼薄指數測定。如前文已述,目前激勵之 重建激勵構成&定隨後CELp框之適應性碼簿激勵的基 礎。重組器110將由CELP解碼器刚所輸出的接續CELp^ 之重建版本共同結合。 21 201214415 如前文已經簡單描述,重組器110可經組配來在TCX編 碼模與CELP編碼模間之變遷執行特定措施。更明確言之, 為了達成此項目的’重組器11〇可評估含在資料串流32的額 外資訊。在重組器110之輸出端,獲得原先音訊信號24之重 建版本116。 選擇性的帶寬延展模組112可延展如藉重組器ι1〇所得 重建信號116之帶寬進入例如高頻部分(參考第1圖之72)。舉 例言之,於SBR之情況下,帶寬延展模組丨12可藉運用例如 分析濾波器排組’諸如QMF或CLDFB濾波器排組對信號! 16 施加頻譜分析,因而以在低頻區78之頻/時解析度獲得其頻 譜圖,其時間成分超過部分30a至3〇(:之部分率。帶寬延展 模組112使用此-頻譜圖來諸如藉複製而預填補高頻部分 72 ’然後以網格解析度74,使用針對個別框3如至34c由框 緩衝器K)2所前傳的黯資料㈣譜形成預賴版本。使用 合成遽波器諸如qMfwldfb濾波器排組,帶寬延展模組 112然後重轉換在解料職72±錢伸的頻譜擴大 頻譜圖至時域來獲得音訊信號的重建。 $前文討論可知,參考第1及2圖及依據本發明之實施 例’前文討論之音訊編解碼器可提供高編碼效率,即便於 處里不同5L g礼戒諸如語音信號及非語音信號時亦復如 此。此外,編碼延遲低。 舉,之由則述實施例所提供之延遲減低可夠低使 其適合用於雙向通訊。儘管延遲限制,可獲得高音樂品質’ 以及語音品質可媲美特別專用語音編解碼器。 22 201214415 為了獲得特定實例’前述部分30a至30c也可具有各256 樣本長度。於12.8 kHz取樣率,如此導致2〇毫秒之框/部分 長度。右使用SBR作為帶寬延展,原先音訊信號可具有取 樣率,或帶寬延展模組18可對CELP及TCX編碼潛在的取樣 率之雙倍取樣率亦即25 6 kHz操作。當然,2 _·丄比率僅為一 個實例,而其它比例亦屬可行,諸如2 5 : i結果導致32]^^ 之取樣率,帶寬延展模組係基於此而操作。此外,12.8 kHz 以外之其它取樣率也可用在關聯CELP及TCX編碼模。 但於則述使用具有内取樣率12.8 kHz及外取樣率25.6 kHz之20毫秒框模,前文摘述實施例之所得延遲可能共# 毫秒。20毫秒係植基於框3知至34本身的框結構。另外加毫 秒可能植基於tcx編碼模之窗函數。換言之,變換長度56 分別可為4G毫秒或512樣本。2.5$秒可能來自涉及執行SBR 的π寬延展之分析m排組及合成濾波器排組之窗函 數最後’另外2·5毫秒可能來自前文並未詳加說明的額外 濾波及重新取樣措施。 運用低重疊或低延遲窗,來自重疊TCX窗函數間之重 疊所得2G毫#可縮減至例如5至7毫秒,此處,於窗%之實 際非零部分係小於變換長度56之延展。 藉此方式,可得一種超寬帶(SWB)模。 但若藉帶寬延展模組所得的頻譜延展並非如此地具有 關鍵性,亦即帶寬延展可較低,則可使用寬帶(WB)模,據 此,使用2G毫秒框結構組合12 8他内取樣率,但使用例如 從AMR-WB為已知的f帶寬延展替代SBR來將帶寬例如從 23 201214415 6.4 kHz(比較第1圖之78)延展至7 kHz(比較第1圖之78及 72)。結果導致的延遲總共縮減成43毫秒。再度’ 20毫秒植 基於框結構本身,而另外2〇毫秒植基於接續TCX窗間之重 疊,恰如前述,該時間延遲可縮減成5毫秒或7毫秒。最後, 另外3毫秒係植基於濾波與重新取樣。 最後,藉刪除任何帶寬延展可獲得窄帶(NB)模。於此 種情況下,可使用20毫秒框結構組合12.8 kHz内取樣率。從 8 kHz至12.8 kHz之重新取樣可用來使用WB模的相同編碼 核心。於此種情況下,結果導致之延遲再度共43毫秒,亦 即20毫秒植基於框結構,另外20毫秒植基於接續TCX窗間 之重疊,恰如前述,該時間延遲可縮減至5毫秒或7毫秒, 而另外3毫秒係植基於滤波與重新取樣。 雖然某些構面已經就裝置脈絡作說明,但顯然此等構 面也表示相對應的方法之描述,此處,方塊或裝置係相對 應於方法步驟或方法步驟之特徵。同理,方法步驟脈絡中 所描述的構面也表示相對應的方塊或相對應的裝置之項目 或特徵之描述。部分或全部方法步驟可藉(或使用)硬體裝置 執行,例如微處理器、可規劃電腦或電子電路。於若干實 施例中’最重要方法步驟中之若干一或多者可藉此種裝置 執行。 本發明編碼音訊信號可儲存在數位儲存媒體上,或可 在發射媒體諸如無線發射媒體或有線發射媒體諸如網際網 路上發射。 依據某些具體實施要求,本發明之實施例可於硬體或 24 201214415
軟體具體fμ I 只他。使用數位儲存媒體例如軟碟、DVD、藍 碟、CD、 M、PROM、EPROM、EEPROM、或快閃記憶 體其上儲存有電子可讀取控制信號,與可規t彳電腦系統協 力合作(或可協力合作)可具體實現,因而可執行個別方法。 因此數位儲存媒體可以是f腦可讀取。 依據本發明若干實施例包含資料載體,其具有電子可 喝取控制信號,其可與可規劃電腦系統協力合作因而可執 行此處所述方法。 一般而言,本發明之實施例可具體實施為具有程式碼 之電腦程式產品,當該電腦程式產品於電腦上跑時,該程 式碼可操作來執行該等方法中之一者。程式碼例如可儲存 在機器可讀取載體上》 其它實施例包含儲存在電腦可讀取載體上之電腦程式 用以執行此處所述方法中之一者。 換言之’因此本發明方法之實施例為具有程式碼之電 月每程式產品,當該電腦程式於電腦上跑時,該程式碼可操 作來執行此處所述該等方法中之一者。 因此本發明方法之又一實施例為一種資料載體(或數 位儲存媒體、或電腦可讀取媒體)包含記錄在其上之用以執 行此處所述該等方法中之—者之電腦程式。資料載體、數 位儲存媒體或記錄媒體典型地為具體有形及/或非暫態。 因此本發明方法之又—實施例為一種資料串流或表示 用以執行此處所述該等方法中之一者之電腦程式的—串列 信號。資料串流或信號串列例如可經組配來透過資料通訊 Η.< 25 201214415 連結,例如透過網際網路傳送。 又一實施例包含經組配來或適用於執行此處所述該等 方法中之一者之處理裝置,例如電腦或可規劃邏輯裝置。 又一實施例包含其上安裝有用以執行此處所述該等方 法中之一者之電腦程式的電腦。 依據本發明之又一貫施例包含一種裂置或系統其係經 組配來傳送(例如電子式或光學式)用以執行此處所述該等 方法中之一者之電腦程式給接收器。接收器例如可以是電 腦、行動裝置、記憶體裝置等。該裝置或系統例如可包含 用以傳送電腦程式給接收器之檔案伺服器。 於若干實施例中,可規劃邏輯裝置(例如場可規劃閘陣 列)可用來執行此處所述該等方法之部分或全部功能。於若 干實施例中’場可規劃閘陣列可與微處理器協作來執行此 處所述該等方法中之一者。大致上該等方法較佳係藉任何 硬體裝置執行。 。須瞭解此處 技藝人士為顯 前述實施例僅供舉例說明本發明之原理 所述配置之修改及變化及其細節對熟諳相關 然易知。因此意圖只受審查中之申請專利範圍所界定 非受藉此處實施例之描述及解說呈現之特定細節所限。 【圖式簡單説明】 訊編碼器 第1圖顯示依據一 之方塊圖;及 實施例一種統一語音及音 语音及音訊解碼器 第2圖顯示依據一實施例一種統一 之方塊圖。 26 201214415 【主要元件符號說明】 1 〇...統一語音及音訊編碼器 12.. .模切換器 14.. .碼薄激勵線性預測(CELP) 編碼 16.. .變換編碼激勵線性預測 (TCX)編碼器 18、112...帶寬延展模組 20.. .多工器 22、108...輸入端 24.. .音訊信號 26、114...輸出端 28.. .線性預測(LP)分析器 30a-c...接續部分 32.. .資料串流 34.. .輸入信號 34a-c...框 50.. .窗、窗函數 52μ2...零部分、非零部分 54^2、54a-b...混疊抵消部分 56、56K2...變換長度、時間部分 70.. .虛線網格、空間/時間頻譜圖 72.. .高頻部分 74.. .網格解析度 76.. .頻譜係數 78.. .低頻部分、頻寬 100.. .統一語音及音訊解碼器 102.. .框緩衝器 104.. .CELP 解碼器 106.. .TCX解碼器 108.. .輸入端 110.. .重組器 112.. .帶寬延展模組 114.. .輸出端 116.. .編碼/可重建版本 118…線性預測係數資訊解碼器 27

Claims (1)

  1. 201214415 七、申請專利範圍: 1. 一種統一語音及音訊解碼器,其係包含 一框緩衝器其係經組配來以框為單位,緩衝由接續 框所組成之-資㈣流之_子部分,使得該子部分連續 地包含至少-個框,各個框表示一音訊信號之接續部分 中之個別为之_編碼版本,及各個框包含一模式識 別符其;7派個別彳!給包含—碼射遣線性預測(CELp) 編碼模式及-變換編碼激勵線性酬(Lp)編碼模式之 多個編碼模式中之個別_者· CELP解碼器其係、經組配來解碼已經分派該 CELP編碼模式之框,來重相音減號之個別部分; -變換編碼激勵L p解碼m肋配來解碼已經 分派該變換編碼激勵LP編碼模式之框,來重建該音訊信 號之個別部分,及 卜丁、a ,且配來在逐框從該框緩衝器 移出個別框之下,分配該等經緩衝之框給該CELP解碼 盗及變換編碼激勵Lp解碼器。 申請專㈣圍第1項之統:語音及音簡碼器,其中該 ==噴彻碼,各她包括_帶寬延展資 邊音及音訊解碼器更進-步包含-帶寬延展 3. 1==;分對重建部分執行帶寬延展。 中竽μ a 142項之統—料料贿碼器,其 ㈣各《之㈣波係料訊;及該 解碼枝&紐配來解瑪已經指定CELP編碼模式 28 201214415 之該等框,其作用方式係藉由使用包含在該個別框内部 之一碼簿指數,針對個別框建立一激勵信號,及依據該 線性預測濾波係數,針對個別框施加一合成濾波器至該 激勵信號;及該變換編碼激勵LP解碼器係經組配來解碼 已經指定變換編碼激勵LP編碼模式之各個框,其作用方 式係藉由解碼得自該個別框之一加權頻譜表示型態,依 據針對個別框之該線性預測濾波係數,重新加權該加權 頻譜表示型態,及藉使用基於窗之頻譜至時間變換而重 新變換該重新加權頻譜表示型態。 4. 一種統一語音及音訊編碼器,其係包含 一模切換器其係經組配來對一音訊信號之接續部 分各自分派只由一CELP編碼模及一變換編碼激勵LP編 碼模所組成的多個編碼模中之個別一者; 一 CELP編碼器其係經組配來編碼分派該CELP編 碼模的該等部分來獲得CELP框;及 一變換編碼激勵LP編碼器其係經組配來編碼分派 該變換編碼激勵LP編碼模的該等部分來獲得變換編碼 框;及 其中該統一語音及音訊編碼器係經組配來使得各 個CELP框具有識別該CELP編碼模之一編碼模識別 符,及各個變換編碼框具有識別該變換編碼激勵LP編碼 模之一識別符。 5. 如申請專利範圍第4項之統一語音及音訊編碼器,其係 進一步包含一帶寬延展模組其係經組配來針對該等部 29 201214415 分產生帶寬延展資訊,及逐框將個別帶寬延展資訊插入 資料串流。 6. 如申請專利範圍第4或5項之統一語音及音訊編碼器,其 中該CELP編碼器及該變換編碼激勵Lp編碼器包含一 lp 分析器其係經組配來針對該等部分各自產生LP濾波係 數及編碼LP濾波係數上的資訊成為資料串流,其中該 CELP編碼器係經組配來基於Lp濾波係數,施加一分析 濾波器至分派該CELP編碼器的部分,來獲得一激勵信 就’使用一碼薄指數求取激勵信號之近似值,及將該碼 薄指數插入該資料串流之個別框;及該變換編碼激勵Lp 編碼器係經組配來藉由使用基於視窗之時間至頻譜變 換而而產生分派該變換編碼激勵LP編碼模的該部分之 頻s普表不型態’依據Lp濾波係數加權該頻譜表示型態, 及將该加權頻譜表示型態編碼成個別框。 7. —種統一語音及音訊解碼方法,其係包含 於一框緩衝器中以框為單位,緩衝由接續框所組成 之一資料串流之一子部分,使得該子部分連續地包含至 ;一個框,各個框表示一音訊信號之接續部分中之一個 別4分之一編碼版本,及各個框包含一模式識別符,其 分派個別框給包含—C E L p編碼模式及—變換編碼激勵 LP編碼模式之多個編碼模式中之個別—者; 於一CELP解碼器中解碼已經分派該cELp編碼模 式之框,來重建該音訊信號之個別部分; 於變換編碼激勵LP解碼器中解碼已經分派該變 30 201214415 建讀音訊信號之個別 換編碼激勵LP編碼模式之框,來重 部分,及 在逐框從該框緩衝器移出個別柄 之下,分配該等經 缓衝之框給該C E L P解碼器及變換飨M 、、兩碼敎勵LP解碼器。 8. 一種統一語音及音訊編碼方法,其係勺人 對一音訊信號之接續部分各自八 刀派只由一CELP編 碼模及一變換編碼激勵LP編碼模所纟、 中之個別一者; '夕、、 於- CELP編碼器中編碼分派該a”編碼模的該 等部分來獲得CELP框;及 於-變換編碼激勵LP編碼器中㈣分派該變換編 碼激勵LP編碼模的該等部分來獲得變換編碼框及 其中各個CELP框具有識別該CELp編碼模之_編 碼模識別符,及各個變換編碼框具有朗該變換編碼激 勵LP編碼模之一識別符。 9· 一種資料串流,其係包含 接續部分其各自已經分派只由_CELp編碼模及一 變換編碼激勵LP編碼模所組成的多個編碼模中之個別 一者,其中各個CELP框具有識別該CELp編碼模之—編 碼模識別符,及各個變換編碼框具有識別該變換編碼激 勵LP編碼模之一識別符。 10.種電腦可讀取數位儲存媒體,其具有儲存於其上之具 有一程式碼的一電腦程式,該程式碼係用以當該電腦程 式在一電腦上跑時執行如申請專利範圍第7或8項之方法。 31
TW100118660A 2010-05-28 2011-05-27 Low-delay unified speech and audio codec TW201214415A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US34935610P 2010-05-28 2010-05-28

Publications (1)

Publication Number Publication Date
TW201214415A true TW201214415A (en) 2012-04-01

Family

ID=44351512

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100118660A TW201214415A (en) 2010-05-28 2011-05-27 Low-delay unified speech and audio codec

Country Status (3)

Country Link
AR (1) AR081264A1 (zh)
TW (1) TW201214415A (zh)
WO (1) WO2011147950A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2560788C2 (ru) 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
JP5800915B2 (ja) 2011-02-14 2015-10-28 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号のトラックのパルス位置の符号化および復号化
SG185519A1 (en) 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
TWI480857B (zh) 2011-02-14 2015-04-11 Fraunhofer Ges Forschung 在不活動階段期間利用雜訊合成之音訊編解碼器
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
CN105304090B (zh) 2011-02-14 2019-04-09 弗劳恩霍夫应用研究促进协会 使用对齐的前瞻部分将音频信号编码及解码的装置与方法
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
US9769586B2 (en) 2013-05-29 2017-09-19 Qualcomm Incorporated Performing order reduction with respect to higher order ambisonic coefficients
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3640941A1 (en) * 2008-10-08 2020-04-22 Fraunhofer Gesellschaft zur Förderung der Angewand Multi-resolution switched audio encoding/decoding scheme
MY167980A (en) * 2009-10-20 2018-10-09 Fraunhofer Ges Forschung Multi- mode audio codec and celp coding adapted therefore

Also Published As

Publication number Publication date
AR081264A1 (es) 2012-07-18
WO2011147950A1 (en) 2011-12-01

Similar Documents

Publication Publication Date Title
US11741973B2 (en) Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
TW201214415A (en) Low-delay unified speech and audio codec
JP6941643B2 (ja) 全帯域ギャップ充填を備えた周波数ドメインプロセッサと時間ドメインプロセッサとを使用するオーディオ符号器及び復号器
JP6173288B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
AU2009267518B2 (en) Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
RU2584463C2 (ru) Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием
JP6126006B2 (ja) 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
CN103620679A (zh) 具有灵活配置功能的音频编码器和解码器
CN105913851A (zh) 对音频/语音信号进行编码和解码的方法和设备
EP2133872B1 (en) Encoding device and encoding method