TW201214415A

TW201214415A - Low-delay unified speech and audio codec

Info

Publication number: TW201214415A
Application number: TW100118660A
Authority: TW
Inventors: Ralf Geiger; Markus Schnell; Guillaume Fuchs; Emmanuel Ravelli; Tom Baeckstroem; Jeremie Lecomte; Konstantin Schmidt; Nikolaus Rettelbach; Manfred Lutzky; Bernhard Grill
Original assignee: Fraunhofer Ges Forschung
Priority date: 2010-05-28
Filing date: 2011-05-27
Publication date: 2012-04-01
Also published as: AR081264A1; WO2011147950A1

Description

201214415 六、發明說明： c發明戶斤屬之技術領域;j 本發明係有關於一種統一語音及音訊解碼器，諸如由 s吾音及音樂或具有時間變化比在此等貢獻間之不同類型的其它音訊貢獻組合所組成之編碼信號。特別地，本發a月係有關於一種低延遲解決之道。 C先前技術】發明背景有利地混合不同編碼模來編碼表示不同型音訊作號諸如語音、音樂等之混合型的一般音訊信號。個別編碼模可調整適應特定音訊類型，如此，多模音訊編碼器可利用隨著時間之經過，相對應的音訊内容類型改變而改變編碼模。換言之，多模音訊編碼器例如可判定使用特別專用於編碼語音之編碼模來編碼音訊信號中具有語音内容之部分，及使用另一編碼模來編碼音訊信號中表示非語音内容諸如音樂之不同部A。舉例言之，碼薄激勵線性預測編碼模傾向於較為適合編碼語音内容，例如至於有關音樂之編碼，變換編碼激勵線性預測編碼模傾向於表現優於碼薄激勵線性預測編碼模。目前已經有因應不同音訊類型並存在一個音訊信號内部問題的解決之道。舉例言之，目前出現的仍从提示在頻域編碼模間切換大為符合AAC鮮，又有兩個線性預測模係類似AMR-WB+標準之子框模，亦即Tcx模及ACELp模。某個框結構係用來在FD域與Lp域間切換。該amr wb+標 201214415 準使用其本身的框結構形成相對於USAC標準之子框結構。AMR-WB+標準允許某些細分組配來細分AMR WB+框成為更小型TCX框及/或ACELP框。同理，AAC標準係用作為基礎框結構，但允許使用不同窗長度來變換編碼框内容。舉例言之，可使用一長窗及相關聯之長型變換長度，或可使用八短窗其具有相關聯之較短的長度變換。另一方面，某些音訊編解碼器已經特別設計供低延遲應用用途。例如，諸如透過電話等的雙向通訊需要低編碼延遲來避免在通訊期間不愉快的等候時間。例如特別係專用於此等應用類型。不幸地，aac_eld#純粹頻域編碼模，如此，AAC-ELD並非最佳地設計用於混合型信號亦即統一不同型音訊部分之音訊信號的編碼。 ϋ發明内容;3 發明概要如此，本發明之一目的係提出—種統一語音及音訊解碼器包含兩項能力’亦即因應在欲編碼音訊信號内部並存語音部分及非語音部分，且保持低的編碼延遲。此項目的係藉申請專利範圍獨立項之主旨予以滿足。依據本發明之一個實施例，一種統一語音及音訊解碼器包含一框緩衝器其係經組配來以框為單位，緩衝由接續框所組成之-㈣串流之—子部分，使得該子部分連續地包含至少一個框，各個框表示一音訊信號之接續部分中之 -個別部分之-編碼版本，及各個框包含—模式識別符，其分配個郷給&含-碼冑激勵祕制(CELp)編碼模式 4 201214415 及一變換、編碼激勵線性預測編碼模式之多個編碼模式中之個別-者。又，該統-語音及音訊解碼器包含一celp解碼器其係經組配來解碼已經分配該CELP編碼模式之框，來重建該個別部分；-變換編碼激麟性㈣解碼器其係經組配來解碼已經分$變換編碼激勵線性預測編碼模式之框’來重建該個別部分’其中該框緩衝器係經組配來在逐框從該框緩衝ϋ移出侧框之下，分配料經緩衝之框給該CELP解碼器及變換編碼激勵線性預測解碼器。據此，本發明之實施例提出_種統一語音及音訊編碼器包含-模切換器其係經組配來對—音訊信號之接續部分各自分派包含-CELP編碼模及一變換編碼激勵線性預測編碼模之多個編碼模中之⑽卜者；_CELp編碼器其係經組配來編碼分派該CELP編碼模的該等部分來獲得cELp 框；及-變換編碼激勵線性預測編碼器其係經組配來編碼分派該變換編碼激勵線性預測編碼模的該等部分來獲得變換編碼框’其中該統一語音及音訊編碼器係經組配來使得各個框包含-模識別符’其於個別框為cELp框之情況下係識別該CELP編碼模，及於個別框為變換編碼框之情況下係識別該變換編碼激勵線性預測編碼模。 *藉由對各個框提供以用以識別或指示分派給個別框的模之模識财’將二祕預測編碼模與目前正在執行的編碼模分祕合成為雜為單位而建構編解碼器，儘管一方面有語音及非語音部分並存而另—方面為低延遲，允許達成編碼效率間的優異折衷。 201214415 依據本發明之一個實施例，變換編碼框之長度係限於 CELP框之長度’亦即二框長度彼此相等。就音訊信號非屬叩曰。卩刀且具向音調部分考慮，如此傾向於降低編碼效率原因在於變換長度係以變換編石馬框之框長度標度。但由此所造成的編碼效率損失比起因限制所導致的編碼延遲減低之增益為可忽略不計。圖式簡單說明後文將參考附圖描述本發明之較佳實施例，附圖中：第1圖顯不依據一實施例一種統一語音及音訊編碼器之方塊圖；及第2圖頁示依據一貫施例一種統一語音及音訊解碼器之方塊圖。 C實施方式;3 第1圖顯示依據本發明之-實施例之統一語音及音訊編碼器m統-語音及音訊編碼㈣包含—模切換器 12、一CELP編碼器μ及一變換編碼激勵線性預測（亦即TCX) 編碼器16。選擇性地，該編碼器可包含一帶寬延展模組丄8。更明確言之，模切換器12具有一輸入端，其係連結至編碼器10之輸入端22用來接收欲編碼之音訊信號24。當存在時，帶宽延展模組18係連結在輸入端22與模切換器12之輸入端間。模切換器12具有兩個輸出端，其分別係連結至 CELP編碼器14及TCX編碼器16之輸入端。CELp編碼器 14、TCX編碼器16、以及若存在時帶寬延展模組18係透過多工器20而連結至編碼器1 〇之輸出端％。 201214415 第1圖之統-語音及音訊編碼器係用來以低編碼延遲編碼在輸入端22載入的音訊信號24，且使得即便在輸入端 22載入的音訊信號從非語音音訊信號轉成語音音訊信號及反之亦然，仍然維持高編碼效率。為了達成此項目的，統一語音及音訊編碼器支援兩項編碼模，亦即兩種LP-線性預測編碼模包括TCX(變換編碼激勵）及CELP(碼薄激勵線性預測）編碼模。於Tcx及編碼模中，音訊内容接受線性預測分析來獲得線性預測係數，而此等線性預測係數係連同激勵信號而在位元串流内發射，g使用在6玄位元串流内部的線性預測係數而以相對應的線性預測合成濾波器濾波時，獲得該音訊内容之解碼表示型態。如第1圖所示，CELP編碼器14及1(：又編碼器16 可共享一分析器28來達成此項目的，該lp分析器28係連結至多工器20來前傳有關線性預測係數之資訊至解碼端，容後詳述。 TCX編碼器16係負責TCX模。於TCX中，恰在前述的激勵彳§號係變換編碼；而在CELP編碼器14所負責的CELP 編碼模之情況下，激勵信號係藉檢索(indexing)在碼簿内的分錄而編碼，或否則合成式地建構欲以前述合成濾波器濾波的樣本之碼薄向量而編碼。更明確言之，在編碼器14内部可具體貫施CELP編碼之特定類型，諸如aceLP(代數碼薄激勵線性預測）’據此該激勵係由適應性碼薄激勵及創新碼薄激勵所組成。容後詳述，Tcx模可具體實施使得線性預測係數係直接地在頻域，在解碼器端探討用以藉推論定 7 201214415 標因數來整形雜訊量化。於此種情況下，TCX係設定為移轉LPC係數成為頻率整形資訊及直接將該係數施加至頻域的激勵信號上，來從該資料串流回復變換域中的激勵信號，而非先將激勵信號變換成時域，然後基於LPC濾波信號而應用合成渡波器。但後述方法也可行。除了至目前為止描述的主要編碼模之外，音訊編碼器 10可以切換開/關次編碼選項，諸如由帶寬延展模組18所支援的帶寬延展選項。已經連同所支援的編碼模之大致综論而相同概略地敘述第1圖之編碼器10結構後，第1圖所示元件間之協作容後詳述。更明確言之’模切換器12係經組配來對音訊信號24之接續部分30a、30b及30c各自分派前述編碼模亦即TCX模及 CELP編碼模中之個別—者。如第1圖所示’以時間t測量或以樣本數目測量，各部分30a、30b及30c可具有相等長度，而與分派給它的編碼模無關。此外或另外，部分3〇a、3〇b ' 3〇c可以是不重疊，但用來編碼TCX編碼部分之變換長度可延伸超過此等部分，分別地延伸入先前部分及後續部分，容後詳述。至目前為止，在部分30a-c間之TCX部分之長度可使用變換編碼其變換窗長度減此等窗之混疊抵消部分長度除以2而定義。至於 CELP部分’其延展可測定來界定其編碼之信號％部分。換έ之’音§fUf^；24可以某個取樣率取樣，及部分3〇a 至以相料間及相等樣本數目涵蓋音姉餅之緊鄰 8 201214415 接續部分。模浦胃12_她來例如基於隸財措施最佳化而執行模的分派，成本措施例如組合編碼率及品質。如此，編碼模切換器12係經組配來對兩個編碼模申之任一者分派該音訊信號24之多個部分3〇a至3〇c。針對各個框30a至30c，模切換器12可在二編碼模間自由選擇，而與先前已經接受分派的先前部分之分派無關。模切換器以前傳已經被分派CELP編碼模之部分給CELP編碼器14，及已經被分派tcx編碼模之部分給TCX編碼器16。但須注意藉模切換器12所執行的分派可能是編碼器丨4及i 6與模切換器 12間協力合作的結果。舉例言之，編碼器14及16可對各框 30a至30c執行試驗，使得試驗可藉模切換器12評估來決定最終欲使用的編碼模。又，須注意在一個部分與緊接其後部分間從一個編碼模變遷至另一個編碼模，可能導致模切換器12則傳一部分至二編碼器14及16或其子部分來允許其執行特別的混疊抵消措施。 CELP編碼器14係經組配來編碼已經被分派cELp編碼模之該等部分來獲得CELP框。CELP編碼器14前傳CELP框之潛在資訊給多工器20，其又轉而將該資訊插入在輸出端 26輸出的資料串流。同理，TCX編碼器16係經組配來編碼已經被分派TCX模之該等部分來獲得TCx框，前傳該框之潛在資訊給多工器20來將其插入資料串流32。編碼器14及 16皆係組配來使得資料串流32之各框34a、34b及34c包含指示個別框之模的模識別符。如此，結果所得在輸出端26的資料串流32包含音訊信號24的每一部分3〇a至3〇c有一個框 201214415 34a、34b及34c。如第1圖所示，例如以位元測量得之框34a 至34c其框長度無需彼此相專。反而，框34a至34c長度各異。因編碼器14及16皆係屬線性預測型，對音訊信號24之接續部分30a至30c連續執行線性預測分析。如前述，編碼器14及16共同擁有的LP分析器28可負責執行線性預測分析。LP分析器28可經組配來分析目前部分内部之音訊内容來決定線性預測濾波係數。藉此方式，LP分析器28可針對各個部分30a至30c產生線性預測濾波係數。然後線性預測滤波係數由編碼器14及16用來執行個別編碼，容後詳述。 LP分析器28可對原先内容之預強調版本操作，而個別預強調渡波器可以是高通，換言之，第η階乘高通濾波器諸如 Η(ζ)=1-αζ 1 ’ α係設定為例如0.68。LP分析器28可經組配來藉使用例如自動相關性或協方差方法而測定輸入部分3〇a 至30c之線性預測係數。舉例言之，使用自動相關性方法，可產生自動相關性矩陣，及使用李杜氏(Levins〇n_Durbin) 演繹法則而獲得LPC係數。LPC係數定義一合成濾波器，其粗略地模型化人類聲道，而當受激勵信號驅動時，大致上模型化流經聲帶的氣流。此一合成濾波器係使用藉Lp分析器28之線性預測而予模型化。聲道形狀的改變率受限制。如此，Lp分析器28可使用 LPC係數適應於限制之更新率，且與部分3加至3(^之框率不同。為了發射LPC係數，所使用的LPC係數其上支援側邊資訊可以比更新率之更低率透過多玉㈣而發射至解碼端。舉例言之，發射率可等於部分30a至30(：之部分率。更明確 10 201214415 -之’更新率可大於部分率，及LPC側邊資訊之發射率可介於更新率(含)與部分率(也含）間。藉由例如在資料争流内例如每框/部分發射的LPC係數間内插而可達成大於框率/ 部分率的粒度或更新率。舉例言之，各部分可細分為4子框使件於256樣本部分之情況下，各子框具有64樣本長度如此，在支援LPC係數資訊間的時間性内插可用在編碼端及解碼端來濾波支援時間之間之_。藉此方式，編碼器及解碼器二者接取相同量化LPC係數。士此由LP分析器28所執行的LP分析提供某些濾波器之貝或界定某些m，諸如線性制分㈣波器或白化濾波器A(z)，具有H⑻=1/A⑴，及選擇性地使用的知覺加權濾波器’諸如w(z)=A(zA)，其中λ為加權因數。如此，LP分析器28發射LPC係數資訊給多工器2〇用以插入^料串流32。此項資訊可表示在適當域諸如頻譜對域等的量化線性預測係數。即使線性預測係數之量化可於此域執行。如前文已述，LP分析器28可以比較LPC係數在解碼端實際發射與重構率更高的更新率來測定Lpc係數。後述更新率例如可藉内插在L P C發射支援時間之間而達成，且甚至係高於部分率。LPC發射支援時間可以部分率發生。顯然只有解碼端接取量化LPC係數，如此，由相對應的重構線性預測所界定之前述濾波器係標示為ft⑺、A⑴及设⑴。如前文摘述，LP分析器28分別界定LP合成濾波器H(z) 及HU)，其當施加至個別激勵時，除了若干後處理外，回 201214415 復或重建原先音訊内容，但在此處為了方便解說不再詳加考慮。CELP編碼器14及TCX編碼器16係用以界定或測定此一激勵之估值，及分別地透過多工器20及資料串流32發射其上個別資訊至解碼端。至於TCX編碼器16，其可經組配來藉由使用基於窗之時間至頻譜變換，諸如MDCT而產生目前TCX部分之頻譜表示型態，依據目前部分之線性預測濾波係數來加權該頻譜表示型態，及將已加權頻譜表示型態編碼成關聯該目前部分之資料_流32之個別框。更精確言之，TCX編碼器16 可將已經被分派TCX模之在目前部分的輸入信號34、或其預強調版本(例如藉使用前述預強調濾波器而預強調），使用例如與先前部分及/或後續部分的若干重疊而接受MDCT變換。更明確言之，在TCX編碼器16用以開窗且將目前部分 (例如30b)變換成頻譜域的窗50可重疊後續框（例如30c)&/ 或先前框(例如30a)。在實際變換之前用以開窗的窗函數5〇可包含在其起點及終點的零部分52u，及在目前部分之前緣及後緣的混疊抵消部分54!,2，因而重合先前或後續TCX 部分(例如30a、30c)的混藝抵消部分。窗函數5〇可定義為不含零部分52,，2。但其它解譯亦屬可能。界定變換長度56之整個窗50之所得頻譜表示型態亦即變換之頻譜係數，諸如DCT，然後可使用接收自Lp分析器 28之LPC係數接受頻譜加權。LPC係數轉換成頻譜加權係數，使得所得頻譜形成相對應的分析濾波轉換函數或知覺加權分析濾波轉換函數，例如知覺加權係由前述知覺加權 12 201214415 渡波器執行。錄如此所得加軸譜表示型驗量化，且使用例如頻譜-致量化步驟大小，藉tcx編瑪器關碼，藉此(知覺地)形成量化雜訊。如此’因窗函數50與先前部分及後續部分之知重疊，TCX編碼1116造成微小延遲，但此項延遲可藉使用低延遲窗函數衫減少，其係料前/後續部分重疊在只有 P刀長度的力量重疊非零部分52丨2。例如該分量可等於或小於縣鳩長度的四分之_。财之，使㈣窗之非零部分可延展至目前部分之先前及/或後續部分在短於或等於目前㈣之TCX部分長度的四分之—長度。但另外，也可使用窗函數間之5〇%重疊。與TCX編碼器16相反，CELp編碼器14係經組配來科由使用碼薄指數來編碼被分派C E L p編碼之目前部分之目前激勵。更明確言之’ CELP編碼器14可經組配來以發射碼薄指數，藉適應性碼薄激勵與創新碼薄激勵的組合來概算目前激勵，通過多卫器2〇而對解碼端獲得此—概算。CELP編碼器14係經組配來針對目前框建構適應性碼薄激勵，因而例如由過絲勵界定，亦即祕先前編碼CELP部分之激勵界定；及針對目前CELP部分之適應性碼薄參數，其以某種方式修改過去激勵來㈣目前適雜觸激勵1應性碼簿激勵可界定音調雜及職，描述如何修㈣去激勵。 CELP編碼器14藉將適應性碼薄參數前傳至多工器如而將其編碼成資料串流32。又復，CELP編碼器m可建構碼薄指數針對目前敎所界定的_簡激勵，及藉將創 13 201214415 新碼簿&數剛傳至多工器2〇，而將其編碼成資料串流μ用以插入資料串流32及個別框34a至34e〇更明確言之，CELP 編碼器14可經組配來測定創新碼薄指數連同個別創新碼薄增益，及將其前傳心插人㈣串流。實際上，適應性碼薄參數及創新碼薄激勵二者及/或二者增益值可整合成一個共通語法元素’且共通地編碼成資料串流32之個別框。其共同地允許解碼器回復如此由CELp編碼器14所測定之目前激勵之概算。換言之，適應性碼薄可藉音調滯後及增益而在資料串流定義，而麟碼料透過有關該創新碼薄之碼薄指數及增益的相關資訊而傳訊至解碼端，其中二增益值可共通地編碼* 為了保證編碼器及解碼器内部狀態之同步化，cELp編碼器14不僅決定語法元素來使得解竭^回復目前碼薄激勵’同時也藉實際上產生語法元素來實際上更新其狀態，而使用如此所得目前碼薄激勵’亦即實際目前激勵之概算作為起點，亦即使用過去激勵用以編碼下一個(：^〇)部分。更精確s之’ CELP編碼器14可經組g己來於建構適應性碼薄激勵及顏碼薄激勵中，考慮所得激勵係在解碼端接受LP合成滤波用以重建，相對於目前部分之音訊内容，最小化知覺加縣真措施。實際上，簡指數可在編碼器及解碼端檢索某些表來檢索或以其它方式測定作為Lp合成渡波器之一激勵輸入的向量。與適應性碼薄激勵相反地，創新碼薄激勵係與過去激勵獨立分開地測定。實際上，CELp 編碼器14可經組配來使用過去且重建的先前編碼CELp部 201214415 分激勵而測定針對目前CELP部分之適應性碼薄激勵，藉使用某些延遲及增益值及預定（内插法)濾波而修改後者，使得當藉合成濾波器濾波時，所得目前部分之適應性碼薄激勵最小化差異至某個目標，用以讓適應性碼薄激勵回復原先音訊内容。剛才述及的延遲、增益及濾波係藉適應性碼薄參數指示。其餘的不一致係藉創新碼薄激勵補償。再度， CELP編碼器14適合設定創新碼薄指數來找到最佳創新碼薄激勵’其當組合(諸如相加至）目前部分之適應性碼薄激勵時’獲得針對目前目部之目前激勵，而後者用作為建構隨後CELP部分之適應性碼薄激勵時的過去激勵。有關進一步細節，可參考AMR-WB+標準之ACELP模。如前文已述，編碼器1〇可選擇性地包含帶寬延展模組。此—帶寬延展模組18可經組配來針對部分3〇a至30c產生帶寬延展側邊資訊，及藉多工器20逐框將個別帶寬延展資訊插入資料串流。如前述，帶寬延展模組18為選擇性，如此可能不存在。另外，編碼器10可切換，因而切換帶寬延展模組18的操作開關。若為操作，則帶寬延展模組18可如下操作。首先，帶寬延展模組18可對原先音訊信號24操作，及進一步前傳例如只有其帶寬限制部分給模切換器 12。舉例言之，帶寬延展模組18可對音訊信號24以全取樣率操乍而模切換器只以一半取樣率或以相對於帶寬延展模、’且18執行帶寬延展編碼的原先取樣率，具有另一適當分量比的取樣率而触音訊錢24。帶寬延展模⑽例如可藉使用例如分析慮波器排組而執行輸入音訊信號24之頻譜 15 201214415 分析。運用此一分析濾波器排組，帶寬延展模組18可在具有時間性解析度高於部分3〇a至30c之部分率的頻譜/時間網格獲得音訊信號24之時間/頻譜取樣。例如參考第1圖所示虛線網格70作為分析濾波器網格實例。為了獲得音訊信號 24之此一空間/時間頻譜圖70，帶寬延展模組18可使用變換窗及MDCT變換、依據HE-AAC如用於SBR之QMF濾波器排組、或依據AAC-ELD如用於低延遲SBR之CLDFB(複合低延遲濾波器排組）。然後，帶寬延展模組18分析在音訊信號24 之高頻部分72，亦即非前傳至模切換器12的音訊信號24之頻谱組分内部的頻譜圖之頻譜波封。帶寬延展模組18可藉測定在一頻譜/時間網格，該網格係比由前述分析濾波器排組所提供的頻譜/時間網格更粗大的頻譜/時間拼貼塊⑴le) 之能而決定頻譜波封，諸如係藉加總此等拼貼塊内部的頻譜係數76之平方。基於此種頻譜波封’帶寬延展模組18決定SBR資料，其係透過多工器2〇發送至解碼端。在解碼端，高頻部分可基於SBR資料而重建，而其方式係藉適當地複製（或否則轉調）藉解碼由編瑪器14及16所輸出的celP框及 tcx框所得的重建音訊信號之低頻部分78來獲得精細變化的尚頻預填補頻譜，及依據由SBR資料所界定的頻譜波封而頻譜地成形後者。有關SBR之進一步細節請參考 AAC-ELD標準。但另外，如從AMR-WB標準所已知的盲帶寬延展可用來將從分別地藉CELP編碼器14&TCX編碼器16所輸出的框可重建之帶寬延展至在解碼端的較高頻部分。 201214415 綜上所述，各框34a及34C可結合下列資訊： 1) 杈識別符指不目前框是否與分別地使用CELp模或 TCX模編碼的部分3〇a_g_ 3〇0相關聯； 2) LPC係數育料有關相關聯之部分3〇a至3〇c :如前述’ LPC更新率可能甚至高於部分率，使得例如由Lpc係數資料所界定的LPC係數可藉在編碼器及解碼器内插而在相關聯之部分内部改變數次； 3) 比較分別地藉資訊内容3)及4)所得之帶寬78，帶寬延展資料諸如SBR資料協助解碼器延展目前框之帶寬；更明確s之，SBR資料可涵蓋與目前部分3〇a至3〇c相關聯之時間區間’亦即包含該時間區間内部之高頻部分72的波封相關資訊； 4) 於目刖框為TCX框之情況下，（如藉施加（經知覺加權之）分析LPC濾波移轉函數至（預強調之）音訊信號所得的激勵信號或殘差信號之）加權頻譜表示型態之一編碼表示型態； 5) 於目前框為CELP框之情況下，除其它資料外，碼薄指數(諸如創新碼薄指數)允許基於後去激勵信號諸如適應性碼薄激勵及此或響度相關語法元素而重建目前激勵信號。如此，藉限制有關主要/核心編碼模的決策至前文摘述之TCX及CELP編碼模，編碼器可以良好編碼效率提供低編碼延遲，即便於非特定音訊信號類型亦即語音或非語音時亦如此。從後文可能的音訊解碼器之描述，低編碼延遲將變得更為彰顯。 17 201214415 第2圖描述統一語音及音訊解碼器loo可解碼由第1圖之編碼器所產生的資料串流而重建原先音訊信號。解碼器100包含一框緩衝器102、一CELP解碼器1〇4及一 TCX解碼器1 〇6。框緩衝器102係連結在解碼器丨00之輸入知108與解碼器1〇4及106個別的輸入端間。解碼器1〇4及106 個別的輸出端係連結至個別重組器。選擇性地，解碼器1〇〇包含一帶寬延展模組112，而重組器11〇係直接地或透過選擇性帶寬延展模組112而連結至解碼器1〇〇之輸出端114。解碼器100之操作模式如下述。如由第1圖之編碼器產生的 > 料串流32輸入輸入端108。如前文已述，資料串流32 包含接續框34a至34c，如第1及2圖例示說明，框343至34() 可呈自谷式排列在資料串流32内部，或排列成資料串流之連續部分。但資料串流32内部的其它配置亦屬可行。總而言之，框緩衝器102係負貴針對分別地在模組 104 1〇6、110及112上細作而緩衝框34a至34c。框緩衝器 102係經組配來以此等框34&至34c為單位而緩衝資料串流 32，及在從緩衝器逐框地移出個別框之下，分配經緩衝的框至CELP解碼器104及TCX解碼器1〇6。換言之，在框緩衝器102内部占有的儲存空間分別地以框為單位增減，及可用的儲存空間可經組配來例如保證容納至少一個框。易言之，框緩衝器10 2可經組配來以框為單位緩衝資料串流之一小部分，使得經緩衝之小部分連續地包含至少一個框亦即目前欲解碼的一個框。當然，框緩衝器可具有可用的儲存空間，一次容納多於一個框。 18 201214415 如上述，各框包含一模識別符其係分派個別框34a至 34c給包含CELP編碼模及變換編碼激勵lp編碼模之多個編碼模中之個別一者。 CELP解碼器係經組配來分派CELP編碼模之框3如至 34c，重建原先音訊信號24之已編碼/可重建版本116之個別部分30a至30c。同理，TCX解碼器106係經組配來解碼分派 TCX模之框34a至34c ’重建已重建版本116，亦即個別框表示的已編碼版本之部分3〇a至30c。更精確言之，框緩衝器從其内部儲存空間移出目前欲解碼框，及分配其中所含資訊給個別接收器。無庸殆言，此種解多工功能可藉額外解多工器執行，解多工器可定位在一方面框緩衝器102與另一方面模組1〇4、106、11〇及112 間。舉例言之，若目前框為TCX框，則框緩衝器102將該框前傳至TCX解碼器106。至少框緩衝器102對TCX解碼器1〇6 提供以前述激勵信號之加權頻譜表示型態。同理，框緩衝器102前傳CELP框至CELP解碼器1〇4。至少碼薄指數係提供給CELP解碼器1〇4。於施加帶寬延展之情況下，框緩衝器102可前傳含在框内部的帶寬延展資料給帶寬延展模組 112。同理，位在TCx編碼模與⑶!^編碼模間變遷的框可包含額外混疊抵消資訊，及框緩衝器1〇2可經組配來前傳此種額外資訊至重組器110。最後，位元串流包含線性預測濾波係數上之資訊，框緩衝器前傳此一資訊至CELp解碼器 104及TCX解碼器1〇6 ^因解碼器104及1〇6二者係屬線性預測型，且仰賴線性預測係數，二解碼器皆可共享或聯合擁 19 201214415 有線性預測係數解碼器118。如前文已述，此一線性預測係數資訊解碼器118針對各個框34a至34c，獲得相對應的線性預測濾波係數。為了達成此項目的，解碼器118可自資料串流32獲得支援線性預測係數，相對應於藉時間性内插法而内插欲用於個別框34a至34c之線性預測係數的支援時間。基於此種線性預測濾波係數資訊，Tcx解碼器1〇6及 CELP解碼益1〇4解碼所分派的框。更明確s之，TCX解碼器1〇6可經組配來以下述方式解碼目前欲解碼的且分派有TCX模之一框。首先，TCX解碼器106可從目前框解碼加權頻譜表示型態。如此例如可包括加權頻譜表示型態之頻譜係數之解量化及重新定標。然後，TCX解碼器1〇6可使用藉解碼器所得針對目前框之線性預測濾波係數而執行加權頻譜表示型態之重新加權。為了達成此項目的，TCX解碼器106可依據由線性預測濾波係數所界定的（選擇性地知覺加權）LPC合成濾波器相對應的轉換函數，而將此等線性預測濾波係數轉成頻譜加權因數共同界定一頻譜形成。如此，TCX解碼器1〇6頻譜形成如得自資料串流32之加權頻譜表示型態來獲得重新加權之頻譜表示型態。然後，重新加權之頻譜表示型態藉使用基於窗之頻至時變換而重新變換成時域。設想例如部分3〇b為目前 TCX框。在執行基於窗之頻至時變換後，TCX解碼器1〇6獲得與重疊部分30b的重建信號丨16之時間部分相關的時域信號，其係與目前解碼框相關聯，但延伸超過該部分3〇b進入後續部分30c及先前部分3〇p此一時間部分56可包含前述 20 201214415 混疊抵消部分54a及54b在目前框30b與緊鄰先前框及後續框部分30a及30c間之邊界。如此，為了完成針對目前框3〇b 之基於窗之頻至時變換，重組器在混疊抵消部分54a及 54b内部重組，亦即重疊與相加針對接續TCX框，藉基於窗之頻至時變換所得的時域信號來獲得此等部分之實際時域重建版本。 CELP解碼器104係經組配來使用含在目前CELP框内部的碼薄指數來建立目前框之激勵信號，及取決於該目前框之線性預測濾波係數而施加合成濾波器至該激勵信號，因而獲得目前CELP框之時域信號。如前述，CELP解碼器 104可使用ACELP，於此種情況下，CELP解碼器1〇4可從目前框取回創新碼薄指數連同適應性碼薄參數。CELP解碼器 10 4使用該指數來分別地重建適應性碼薄激勵及創新碼薄激勵。舉例言之，使用適應性碼簿參數，CELP解碼器1〇4 可依據適應性碼薄參數，藉修改/内插過去重建的激勵而建構適應性碼薄激勵^ CELP解碼器104可組合此種適應性碼薄激勵與創新碼薄激勵，來獲得目前激勵之重建版本。為了獲得創新碼薄激勵’ CELP解碼器1〇4評估創新碼薄指數。適應性碼薄激勵及創新碼薄激勵二者係藉一加權和而彼此組合，而加權因數也係藉CELP解碼器1〇4透過適應性碼薄參數及創新碼薄指數測定。如前文已述，目前激勵之重建激勵構成&定隨後CELp框之適應性碼簿激勵的基礎。重組器110將由CELP解碼器刚所輸出的接續CELp^ 之重建版本共同結合。 21 201214415 如前文已經簡單描述，重組器110可經組配來在TCX編碼模與CELP編碼模間之變遷執行特定措施。更明確言之，為了達成此項目的’重組器11〇可評估含在資料串流32的額外資訊。在重組器110之輸出端，獲得原先音訊信號24之重建版本116。選擇性的帶寬延展模組112可延展如藉重組器ι1〇所得重建信號116之帶寬進入例如高頻部分(參考第1圖之72)。舉例言之，於SBR之情況下，帶寬延展模組丨12可藉運用例如分析濾波器排組’諸如QMF或CLDFB濾波器排組對信號！ 16 施加頻譜分析，因而以在低頻區78之頻/時解析度獲得其頻譜圖，其時間成分超過部分30a至3〇(：之部分率。帶寬延展模組112使用此-頻譜圖來諸如藉複製而預填補高頻部分 72 ’然後以網格解析度74，使用針對個別框3如至34c由框緩衝器K)2所前傳的黯資料㈣譜形成預賴版本。使用合成遽波器諸如qMfwldfb濾波器排組，帶寬延展模組 112然後重轉換在解料職72±錢伸的頻譜擴大頻譜圖至時域來獲得音訊信號的重建。 $前文討論可知，參考第1及2圖及依據本發明之實施例’前文討論之音訊編解碼器可提供高編碼效率，即便於處里不同5L g礼戒諸如語音信號及非語音信號時亦復如此。此外，編碼延遲低。舉，之由則述實施例所提供之延遲減低可夠低使其適合用於雙向通訊。儘管延遲限制，可獲得高音樂品質’ 以及語音品質可媲美特別專用語音編解碼器。 22 201214415 為了獲得特定實例’前述部分30a至30c也可具有各256 樣本長度。於12.8 kHz取樣率，如此導致2〇毫秒之框/部分長度。右使用SBR作為帶寬延展，原先音訊信號可具有取樣率，或帶寬延展模組18可對CELP及TCX編碼潛在的取樣率之雙倍取樣率亦即25 6 kHz操作。當然，2 _·丄比率僅為一個實例，而其它比例亦屬可行，諸如2 5 : i結果導致32]^^ 之取樣率，帶寬延展模組係基於此而操作。此外，12.8 kHz 以外之其它取樣率也可用在關聯CELP及TCX編碼模。但於則述使用具有内取樣率12.8 kHz及外取樣率25.6 kHz之20毫秒框模，前文摘述實施例之所得延遲可能共# 毫秒。20毫秒係植基於框3知至34本身的框結構。另外加毫秒可能植基於tcx編碼模之窗函數。換言之，變換長度56 分別可為4G毫秒或512樣本。2.5$秒可能來自涉及執行SBR 的π寬延展之分析m排組及合成濾波器排組之窗函數最後’另外2·5毫秒可能來自前文並未詳加說明的額外濾波及重新取樣措施。運用低重疊或低延遲窗，來自重疊TCX窗函數間之重疊所得2G毫#可縮減至例如5至7毫秒，此處，於窗％之實際非零部分係小於變換長度56之延展。藉此方式，可得一種超寬帶(SWB)模。但若藉帶寬延展模組所得的頻譜延展並非如此地具有關鍵性，亦即帶寬延展可較低，則可使用寬帶(WB)模，據此，使用2G毫秒框結構組合12 8他内取樣率，但使用例如從AMR-WB為已知的f帶寬延展替代SBR來將帶寬例如從 23 201214415 6.4 kHz(比較第1圖之78)延展至7 kHz(比較第1圖之78及 72)。結果導致的延遲總共縮減成43毫秒。再度’ 20毫秒植基於框結構本身，而另外2〇毫秒植基於接續TCX窗間之重疊，恰如前述，該時間延遲可縮減成5毫秒或7毫秒。最後，另外3毫秒係植基於濾波與重新取樣。最後，藉刪除任何帶寬延展可獲得窄帶(NB)模。於此種情況下，可使用20毫秒框結構組合12.8 kHz内取樣率。從 8 kHz至12.8 kHz之重新取樣可用來使用WB模的相同編碼核心。於此種情況下，結果導致之延遲再度共43毫秒，亦即20毫秒植基於框結構，另外20毫秒植基於接續TCX窗間之重疊，恰如前述，該時間延遲可縮減至5毫秒或7毫秒，而另外3毫秒係植基於滤波與重新取樣。雖然某些構面已經就裝置脈絡作說明，但顯然此等構面也表示相對應的方法之描述，此處，方塊或裝置係相對應於方法步驟或方法步驟之特徵。同理，方法步驟脈絡中所描述的構面也表示相對應的方塊或相對應的裝置之項目或特徵之描述。部分或全部方法步驟可藉（或使用）硬體裝置執行，例如微處理器、可規劃電腦或電子電路。於若干實施例中’最重要方法步驟中之若干一或多者可藉此種裝置執行。本發明編碼音訊信號可儲存在數位儲存媒體上，或可在發射媒體諸如無線發射媒體或有線發射媒體諸如網際網路上發射。依據某些具體實施要求，本發明之實施例可於硬體或 24 201214415

軟體具體fμ I 只他。使用數位儲存媒體例如軟碟、DVD、藍碟、CD、 M、PROM、EPROM、EEPROM、或快閃記憶體其上儲存有電子可讀取控制信號，與可規t彳電腦系統協力合作（或可協力合作）可具體實現，因而可執行個別方法。因此數位儲存媒體可以是f腦可讀取。依據本發明若干實施例包含資料載體，其具有電子可喝取控制信號，其可與可規劃電腦系統協力合作因而可執行此處所述方法。一般而言，本發明之實施例可具體實施為具有程式碼之電腦程式產品，當該電腦程式產品於電腦上跑時，該程式碼可操作來執行該等方法中之一者。程式碼例如可儲存在機器可讀取載體上》其它實施例包含儲存在電腦可讀取載體上之電腦程式用以執行此處所述方法中之一者。換言之’因此本發明方法之實施例為具有程式碼之電月每程式產品，當該電腦程式於電腦上跑時，該程式碼可操作來執行此處所述該等方法中之一者。因此本發明方法之又一實施例為一種資料載體（或數位儲存媒體、或電腦可讀取媒體）包含記錄在其上之用以執行此處所述該等方法中之—者之電腦程式。資料載體、數位儲存媒體或記錄媒體典型地為具體有形及/或非暫態。因此本發明方法之又—實施例為一種資料串流或表示用以執行此處所述該等方法中之一者之電腦程式的—串列信號。資料串流或信號串列例如可經組配來透過資料通訊 Η.< 25 201214415 連結，例如透過網際網路傳送。又一實施例包含經組配來或適用於執行此處所述該等方法中之一者之處理裝置，例如電腦或可規劃邏輯裝置。又一實施例包含其上安裝有用以執行此處所述該等方法中之一者之電腦程式的電腦。依據本發明之又一貫施例包含一種裂置或系統其係經組配來傳送(例如電子式或光學式）用以執行此處所述該等方法中之一者之電腦程式給接收器。接收器例如可以是電腦、行動裝置、記憶體裝置等。該裝置或系統例如可包含用以傳送電腦程式給接收器之檔案伺服器。於若干實施例中，可規劃邏輯裝置(例如場可規劃閘陣列）可用來執行此處所述該等方法之部分或全部功能。於若干實施例中’場可規劃閘陣列可與微處理器協作來執行此處所述該等方法中之一者。大致上該等方法較佳係藉任何硬體裝置執行。。須瞭解此處技藝人士為顯前述實施例僅供舉例說明本發明之原理所述配置之修改及變化及其細節對熟諳相關然易知。因此意圖只受審查中之申請專利範圍所界定非受藉此處實施例之描述及解說呈現之特定細節所限。【圖式簡單説明】訊編碼器第1圖顯示依據一之方塊圖；及實施例一種統一語音及音语音及音訊解碼器第2圖顯示依據一實施例一種統一之方塊圖。 26 201214415 【主要元件符號說明】 1 〇...統一語音及音訊編碼器 12.. .模切換器 14.. .碼薄激勵線性預測(CELP) 編碼 16.. .變換編碼激勵線性預測 (TCX)編碼器 18、112...帶寬延展模組 20.. .多工器 22、108...輸入端 24.. .音訊信號 26、114...輸出端 28.. .線性預測(LP)分析器 30a-c...接續部分 32.. .資料串流 34.. .輸入信號 34a-c...框 50.. .窗、窗函數 52μ2...零部分、非零部分 54^2、54a-b...混疊抵消部分 56、56K2...變換長度、時間部分 70.. .虛線網格、空間/時間頻譜圖 72.. .高頻部分 74.. .網格解析度 76.. .頻譜係數 78.. .低頻部分、頻寬 100.. .統一語音及音訊解碼器 102.. .框緩衝器 104.. .CELP 解碼器 106.. .TCX解碼器 108.. .輸入端 110.. .重組器 112.. .帶寬延展模組 114.. .輸出端 116.. .編碼/可重建版本 118…線性預測係數資訊解碼器 27

Claims

201214415 七、申請專利範圍： 1. 一種統一語音及音訊解碼器，其係包含一框緩衝器其係經組配來以框為單位，緩衝由接續框所組成之-資㈣流之_子部分，使得該子部分連續地包含至少-個框，各個框表示一音訊信號之接續部分中之個別为之_編碼版本，及各個框包含一模式識別符其;7派個別彳！給包含—碼射遣線性預測(CELp) 編碼模式及-變換編碼激勵線性酬(Lp)編碼模式之多個編碼模式中之個別_者· CELP解碼器其係、經組配來解碼已經分派該 CELP編碼模式之框，來重相音減號之個別部分； -變換編碼激勵L p解碼m肋配來解碼已經分派該變換編碼激勵LP編碼模式之框，來重建該音訊信號之個別部分，及卜丁、a ,且配來在逐框從該框緩衝器移出個別框之下，分配該等經緩衝之框給該CELP解碼盗及變換編碼激勵Lp解碼器。申請專㈣圍第1項之統:語音及音簡碼器，其中該 ==噴彻碼，各她包括_帶寬延展資邊音及音訊解碼器更進-步包含-帶寬延展 3. 1==;分對重建部分執行帶寬延展。中竽μ a 142項之統—料料贿碼器，其㈣各《之㈣波係料訊；及該解碼枝&紐配來解瑪已經指定CELP編碼模式 28 201214415 之該等框，其作用方式係藉由使用包含在該個別框内部之一碼簿指數，針對個別框建立一激勵信號，及依據該線性預測濾波係數，針對個別框施加一合成濾波器至該激勵信號；及該變換編碼激勵LP解碼器係經組配來解碼已經指定變換編碼激勵LP編碼模式之各個框，其作用方式係藉由解碼得自該個別框之一加權頻譜表示型態，依據針對個別框之該線性預測濾波係數，重新加權該加權頻譜表示型態，及藉使用基於窗之頻譜至時間變換而重新變換該重新加權頻譜表示型態。 4. 一種統一語音及音訊編碼器，其係包含一模切換器其係經組配來對一音訊信號之接續部分各自分派只由一CELP編碼模及一變換編碼激勵LP編碼模所組成的多個編碼模中之個別一者；一 CELP編碼器其係經組配來編碼分派該CELP編碼模的該等部分來獲得CELP框；及一變換編碼激勵LP編碼器其係經組配來編碼分派該變換編碼激勵LP編碼模的該等部分來獲得變換編碼框；及其中該統一語音及音訊編碼器係經組配來使得各個CELP框具有識別該CELP編碼模之一編碼模識別符，及各個變換編碼框具有識別該變換編碼激勵LP編碼模之一識別符。 5. 如申請專利範圍第4項之統一語音及音訊編碼器，其係進一步包含一帶寬延展模組其係經組配來針對該等部 29 201214415 分產生帶寬延展資訊，及逐框將個別帶寬延展資訊插入資料串流。 6. 如申請專利範圍第4或5項之統一語音及音訊編碼器，其中該CELP編碼器及該變換編碼激勵Lp編碼器包含一 lp 分析器其係經組配來針對該等部分各自產生LP濾波係數及編碼LP濾波係數上的資訊成為資料串流，其中該 CELP編碼器係經組配來基於Lp濾波係數，施加一分析濾波器至分派該CELP編碼器的部分，來獲得一激勵信就’使用一碼薄指數求取激勵信號之近似值，及將該碼薄指數插入該資料串流之個別框；及該變換編碼激勵Lp 編碼器係經組配來藉由使用基於視窗之時間至頻譜變換而而產生分派該變換編碼激勵LP編碼模的該部分之頻s普表不型態’依據Lp濾波係數加權該頻譜表示型態，及將该加權頻譜表示型態編碼成個別框。 7. —種統一語音及音訊解碼方法，其係包含於一框緩衝器中以框為單位，緩衝由接續框所組成之一資料串流之一子部分，使得該子部分連續地包含至 ;一個框，各個框表示一音訊信號之接續部分中之一個別4分之一編碼版本，及各個框包含一模式識別符，其分派個別框給包含—C E L p編碼模式及—變換編碼激勵 LP編碼模式之多個編碼模式中之個別—者；於一CELP解碼器中解碼已經分派該cELp編碼模式之框，來重建該音訊信號之個別部分；於變換編碼激勵LP解碼器中解碼已經分派該變 30 201214415 建讀音訊信號之個別換編碼激勵LP編碼模式之框，來重部分，及在逐框從該框緩衝器移出個別柄之下，分配該等經缓衝之框給該C E L P解碼器及變換飨M 、、兩碼敎勵LP解碼器。 8. 一種統一語音及音訊編碼方法，其係勺人對一音訊信號之接續部分各自八刀派只由一CELP編碼模及一變換編碼激勵LP編碼模所纟、中之個別一者； '夕、、於- CELP編碼器中編碼分派該a”編碼模的該等部分來獲得CELP框；及於-變換編碼激勵LP編碼器中㈣分派該變換編碼激勵LP編碼模的該等部分來獲得變換編碼框及其中各個CELP框具有識別該CELp編碼模之_編碼模識別符，及各個變換編碼框具有朗該變換編碼激勵LP編碼模之一識別符。 9· 一種資料串流，其係包含接續部分其各自已經分派只由_CELp編碼模及一變換編碼激勵LP編碼模所組成的多個編碼模中之個別一者，其中各個CELP框具有識別該CELp編碼模之—編碼模識別符，及各個變換編碼框具有識別該變換編碼激勵LP編碼模之一識別符。 10.種電腦可讀取數位儲存媒體，其具有儲存於其上之具有一程式碼的一電腦程式，該程式碼係用以當該電腦程式在一電腦上跑時執行如申請專利範圍第7或8項之方法。 31