TW201222530A

TW201222530A - Apparatus and method for level estimation of coded audio frames in a bit stream domain

Info

Publication number: TW201222530A
Application number: TW100136485A
Authority: TW
Inventors: Manfred Lutzky; Ralf Geiger; Markus Schnell; Marco Diatschuk
Original assignee: Fraunhofer Ges Forschung
Priority date: 2010-10-07
Filing date: 2011-10-07
Publication date: 2012-06-01
Also published as: WO2012045816A1; CN103250206B; TWI489449B; EP2625687A1; RU2013120547A; BR112013008462A2; JP2013543146A; JP5792821B2; KR20130112893A; US11238873B2; AU2011311543B2; CA2813898C; HK1188327A1; CN103250206A; MX2013003803A; KR101412115B1; CA2813898A1; EP2625687B1; BR112013008462B1; AU2011311543A1

Description

201222530 六、發明說明：【發明所屬之技彳标領域】本發明係有關於音訊處理及更明確言之，係有關於編碼音ifUs號於位元串流定義域之位準估計之裝置及方法。 C先前椅；3 音訊處理就多方面而言已經進階且成為許多研究如何有效地編碼與解碼音訊資料信號的主題。有效編碼例如係由]\^^八八(：所提供(]^£0=動晝專家群；八八€=高階音訊編碼）。依據MPEG AAC，音訊信號的頻譜值係採用定標因數、量化及碼薄編碼，更特別係霍夫曼碼薄。在進行霍夫曼編碼前，編碼器將欲編碼至不同區段的多個頻譜係數集結成群。針對縣係數之各個區段，^ 器選擇霍夫曼碼_於霍夫曼編碼。MPEG aac提供_ 不同頻譜霍夫曼碼_以編侧譜㈣，從該等碼薄中，編碼㈣擇最適合絲編料區段的頻譜係數。編碼器提 =薄識別符，該碼薄識別符識別用來該區段的頻譜係數之霍夫曼編碼的碼薄作為側邊資訊。 ’、 "、听則上，解石馬 =個頻譜霍夫曼碼薄中的哪—個業已用來編碼決定 »a值解碼器基於有關採用來編碼欲藉解 °°頻段之頻譜係數之霍夫曼碼薄_«簡行的該區在霍夫曼解碼後，在解石馬器獲得多個又解码。碼器然後進行反量化來將已經藉編碼器進行的:::二: 3 201222530 反相。藉此方式，在解碼器獲得反量化頻譜值。但反量化頻譜值仍然可能未經定標。導出的未經定標頻譜值已經集結成定標因數帶，各個定標因數帶有個共^ 定標因數。針對各個定標因數帶的定標因數係可由解碼^ 利用作為編碼11所提供的側邊資訊。運用此項資訊，解碼器將定標因數帶的未經定標頻譜值乘以其定標因數。藉此方式獲得定標頻譜值。現在參考第7至1〇圖解說依據技藝界現況對頻譜值之編碼及解碼。第7圖例示說明依據技藝界現況之編碼器。該編碼器包含T/F濾波器排組71〇 ’該排組用以將應經編碼的音訊信號 AS從時域變換至頻域來獲得頻域音訊信號。頻域音訊信號饋入定標因數單元720用以決定定標因數。定標因數單元 720係適用於將頻域音訊信號的頻譜係數劃分成共享―個定標因數之數組頻譜係數，稱作定標因數帶。定標因數表示用來變更在個別定標因數帶中全部頻譜係數振幅之—增益值。此外，定標因數單元720適用於產生及輸出頻域音訊信號之未經定標頻譜係數。又復，第7圖之編碼器用來量化該頻域音訊信號之未經定標頻譜係數之量化器。量化器730可以是非一致量化号。量化後，經量化的音訊信號之未經定標頻譜係镇入霍夫曼編碼器740用以接受霍夫曼編碼。霍夫曼編碼係用來、咸少音訊信號之量化頻譜的冗餘。多個未經定標之量化頻谱係數集結成區段。雖然於MPEG-AAC提供11個可能的石馬 201222530 簿，但一個區段之全部頻譜係數係藉相同霍夫曼碼簿編碼。編碼器將選出11個可能霍夫曼碼簿中之一者，該碼薄係特別適合用來編碼該區段之頻譜係數。藉此方式，針對一特定區段編碼器之霍夫曼碼薄的選擇係取決於該特定區段之頻譜值。然後該霍夫曼編碼頻譜係數可連同側邊資訊發射至解碼器，該侧邊資訊例如包含曾經用來編碼一頻譜係數區段的霍夫曼碼薄、曾經用於特定定標因數帶之定標因數等的相關資訊。二或四個頻譜係數係藉採用來霍夫曼編碼該區段之頻譜係數的霍夫曼碼薄之一碼字組編碼。編碼器連同下列資訊發射表示該編碼頻譜係數之碼字組給解碼器，該等資訊包括包含'一區段長度之側邊貢訊，以及有關用以編碼該區段之頻譜係數的霍夫曼碼薄資訊。於MPEG AAC中，提供11個頻譜霍夫曼碼薄用來編碼該音訊信號之頻譜資料。不同頻譜霍夫曼碼薄可藉其碼薄指數（1至11間之值）加以識別。霍夫曼碼薄維度指示多少個頻譜係數係藉所考慮的霍夫曼碼薄之碼字組編碼。於Μ P E G AAC中，霍夫曼碼薄的大小為2或4，指示碼字組編碼二或四個音訊信號之頻譜值。但不同霍夫曼碼薄有關其它性質也有別。舉例言之，可由霍夫曼碼薄編碼之頻譜係數最大絕對值係依碼薄而異，且可以是例如1、2、4、7、12或以上。此外，所考慮的霍夫曼碼薄可適用來編碼有符號值與否。. 採用霍夫曼編碼，頻譜係數係藉不等長度的碼字組編 201222530 碼。MPEGAAC提供具有最大絕軸的兩個不同霍夫曼碼薄，具有最大絕對值2的兩個不同霍夫曼碼薄，具有最大絕對值4的兩個不同霍夫曼碼薄，具有最大絕對值7的兩個不同霍夫曼碼薄，及具有最大絕對值12的兩個不同霍夫曼碼薄，其中各個霍夫曼碼薄表示分開的機率分布函數。霍夫曼編碼器將經常性地選擇最佳匹配來編碼頻譜係數的霍夫曼碼薄。第8圖例示說明依據技藝界現況之解碼器。霍夫曼編碼頻譜值係由霍夫曼解碼器75G接收。霍夫曼解碼器75〇也接收針對各區段頻譜值，絲編碼頻譜值之有關霍夫曼碼薄資訊作為側邊資訊。然後霍夫曼解碼器75〇執行霍夫曼解碼來獲得未經定標的量化頻譜值。該未經定標的量化頻譜值係饋入反量化器760。該反量化器執行反量化來獲得經反量化之未經定標的頻譜值，該值饋入定標器77〇。定標器77〇也接收定標因數作為各個定標因數帶之側邊資訊。基於所接收的定標因數，定標器770將該未經定標的經反量化之頻谱值定標而獲得該經定標的經反量化之頻譜值。然後ργτ、虎波器排組780將該頻域音訊信號之經定標的經反量化頻级值從頻域變換至時域來獲得時域音訊信號之樣本值。第9圖例示說明依據技藝界現況之編碼器，該編碼器與第7圖編碼器之差異在於第9圖編碼器更進一步包含編碑器端TNS單元(TNS=時間性雜訊整形）。時間性雜訊整形可採用來就該音訊信號之頻譜資料部分進行濾波處理而控制量化雜訊之時間性形狀。編碼器端TNS單元715決定就欲編瑪 201222530 的頻域音訊信號之頻譜係數，進行線性預測編碼(LPC)計算。從LPC計算所得者包括反射係數，又稱PARCOR係數。若也藉LPC計算而導出的預測增益係不超過某個臨界值，則不使用時間性雜訊整形。但若預測增益係大於該臨界值’則使用時間性雜訊整形。編瑪器端TNS單元去除小於某個臨界值之全部反射係數。其餘反射係數係轉換成線性預測係數且係用在編碼器作為雜訊整形濾波係數。然後編碼器端TNS單元針對該等頻譜係數執行濾波操作，對此採用TNS來獲得音訊信號之經處理的頻譜係數。指示丁資★凡之側邊資訊例如反射係數(PARCOR係數)係發射至解碼器。第10圖例示說明依據技藝界現況之解碼器，該解碼器與第8圖例示說明之解碼器差異在於第10圖之解碼器額外包含解碼器端TNS單元775。解碼器端TNS單元接收音訊作號之反量化定標頻譜，及也接收TNS資訊，例如指示反射係數(PARCOR係數）的資訊。解碼器端TNS單元775處理音訊h號之反量化頻譜來獲得音訊信號之經處理的反量化頻譜。針對多項應用’要緊地須測定或估計編碼音訊信號之位準例如能、振幅、或響度。此點對電傳會議系統特別為真。由在不同位置所在的數個參與者所進行的電傳會儀（藉多點控制單元(MOJ)掌控。其目的係、為了混合多個輸^ 及輸出_流，此處該音訊資料係呈示於編碼格式。依據技藝界現況，全部輸入串流係在MCu解碼，然1 音訊資料進一步分析來識別混合至輸出串流的最主要串 201222530 流。如此表示依據技藝界現況，全部輸入串流係經霍夫曼解碼、反量化、及定標用於隨後進一步分析輸入串流而識別最主要串流，例如具最高位準例如具最大能的串流。估計一個定標因數帶之位準例如能的技藝界現況辦法係針對全部頻譜值進行霍夫曼解碼及反量化，及藉加總全部反量化頻譜值平方而計算能。【發明内容】本發明之目的係提供針對編碼音訊信號之位準估計提供改良構思。本發明之目的係係藉如申請專利範圍第1項之裝置、如申請專利範圍第12項之方法、如申請專利範圍第 14項之方法、及如申請專利範圍第15項之電腦程式解決。提出一種用於編碼音訊信號之位準估計之裝置。該裝置係包含碼薄決定器用以從多個碼薄中決定碼薄作為經識別碼簿，其中該音訊信號已經藉採用該經識別碼薄編碼。該裝置係更進一步包含估計單元係經組配來用以導算出與該經識別碼薄聯結之位準值作為導出位準值。又復，該估計單元係適用以使用該導出位準值估計該音訊信號之位準估值。於一實施例中，該導出位準值可以是導出能值，及該用於位準估計的裝置可適用於進行能估計作為位準估計。於另一實施例中，該導出位準值可以是導出振幅值，及該用於位準估計的裝置可適用於進行振幅估計作為位準估計。於又一實施例中，該導出位準值可以是導出響度值，及該用於位準估計的裝置可適用於進行響度估計作為位準 201222530 估計。本發明係植基於發現為了減低全部解碼步驟的複雜度，例如能、振幅或響度等位準可從位元串流參數直接估計用來識別最主要串流。位準估計例如能估計、振幅估計或響度估計可植基於位元串流資訊，例如位元串流成分例如霍夫曼碼薄、定標因數、及例如TNS濾波係數。此等位元串流成分可用來估計依據AAC-ELD串流之位準 (AAC-ELD ;高階音訊編碼-力口強低延遲）。如此，依據本發明並非必要完全解碼音訊位元串流，反而係藉基於決定已經採用來編碼音訊信號之碼簿而提供位準估計，係藉導出與該經識別之碼薄聯結之位準值，及藉使用該位準值估計該音訊信號之位準估值。於一實施例中，估計單元包含定標單元。該定標單元係適用於導算出與該編碼音訊信號或該編碼音訊信號之一部分有關的定標因數作為導出定標因數。該定標單元係適用於基於該定標因數及該導出位準值而獲得定標位準值，例如定標能、振幅、或響度值。此外，該估計單元係適用於使用該定標位準值而估計該音訊信號之位準估值。。依據此一實施例，該位準估值係基於有關已經用來編碼該音訊信號之資訊提供，亦即與該經識別之碼薄及定標因數聯結之位準值。於一實施例中，該導出位準值為能值，及該定標單元係適用於將該導出定標因數施加至該導出能值，而藉將該導出能值乘以該導出定標因數的平方而獲得定標位準值。 201222530 藉此方式’以定標因數施加至依據MPEG-2 AAC的解石馬器中未經定標經反量化頻譜係數的相似方式，導出的定標因數係施加在導出能上，但無需解碼頻譜係數。於另一實施例中，導出能值為振幅值，及該定標單元係適用於將該導出定標因數施加至該導出振幅值而藉將該導出振幅值乘以該導出定標因數來獲得定標位準值。〇於又一實施例中，該導出位準值為響度值，及該定標單元係適用於將該導出定標因數變換至導出響度值，藉將該導出響度值乘以導出定標因數之立方而獲得定標響声 ^。t在有替代之道㈣㈣度，諸如藉減％計算β Γ 域當導出位準值為響度值時，定標因數須變換為響於另一實施例中，估計單元係值作為導出位準值來估心〜 I使用特讀準該估計單日則§狀位準純。如此，位準估算_特別經組配來基於特賴別的位準值而進行導出能值，及該估計單元係經組於一實施例中，導出位準值為作為該音訊二=碼薄位準值作為碼薄能值而估計能估值碼薄的全部二碼簿能值係以該經識別均機率加權和奸-率力㈣能和值中之和。各個平和值對與該碼薄聯:趣識別碼薄之碼字組之機率加權能指示該經識別碼薄之個機率加權能和值該經識別巧笼一、碼字組之—能和值乘以與 4之㈣考慮的碼字組聯結之1率值之^ 10 201222530 積。各個能和值指示經識別碼薄的碼字組一序列能值之數值。各序列能值指示針對該碼薄之各個碼字組，針對一碼字組之一序列數值的一序列反量化數值中之各值之一平方值。各序列數值為藉該碼薄之一碼字組編碼的一序列數值。於又一實施例中，該估計單元進一步包含位準值導出器。該位準值導出器係適用於藉詢查在一記憶體中與該經識別之碼薄聯結的該位準值而導出該導出位準值。於又一實施例中，該位準值導出器係適用於從一本地資料庫請求與該經識別之碼薄聯結之該位準值。於又另一實施例中，該位準值導出器係適用於從一遠端電腦請求與該經識別之碼薄聯結之該位準值。於另一實施例中，該裝置進一步包含一記憶體或一資料庫，其中業已儲存多個碼薄位準記憶體值，該等值指示一位準值係與一碼薄聯結，其中該等多個碼薄各自具有與其聯結之一碼薄位準記憶體值儲存在該記憶體或資料庫。該位準值導出器係經組配來藉從該記憶體或從該資料庫導出與該經識別之碼薄聯結之一碼薄位準記憶體值而導出與該經識別之碼薄聯結之該位準值作為該位準值。於一實施例中，該記憶體或資料庫已經於其中儲存多個碼薄能記憶體值作為碼薄位準記憶體值，其中各個碼薄能記憶體值指示該經識別碼薄之全部碼字組的平均機率加權能和值的和。各個能和值指示該經識別碼薄之一碼字組的一序列能值數值。此外，各序列能值指示針對該碼薄之各個碼字組，一碼字組的一序列能值之一序列反量化數值 201222530 中各值的平方值。各序列此值為由該碼薄之一碼字組所儲存的一序列數值。本實施例提出記憶體或資料庫，已經於其中儲存聯結特定碼薄之多個碼薄能記憶體值，其中該所儲存的碼薄能記憶體值具有特別適合用於能估計之特殊性質。於另一實施例中，該記憶體或資料庫已經於其中儲存多個振幅值作為碼簿記憶體位準值。於又一實施例中，該記憶體或資料庫已經於其中儲存多個響度值作為瑪薄記憶體位準值》一於另-實施例中，該估計單元進一步包含預測渡波器調整器。該預職波器難器係適祕導出與該編碼音訊信號或該編碼音訊信號之—部分有關的—或多個預_波器係數作為導出預職波器係數。又復，耗職波器調整器係適用於基於該預職波器係數及料出位準值而獲得預測滤波||難位準值。此外，該料單元係適用於使用該預測it波H調整位準值而估計該音訊信號之位準估值。依據另一 ™，提出-種針對一電傳會議系統的多個參與者產生背向資料串流之裝置。該裝置包含用以接收多個參與者資料$流包含來自該等多個參與者之音訊信號的接收器介面。此外，制以產生背向資料串流之裝置包㈣财之-者—音訊«之位準估計的裝置。祕準估料置係配置用以針對各個串流進行位料㈣完全軸

12 201222530 以產生背向資料串流之裝置包含決定器，該決定器係用來基於該位準估計，判定參與者資料串流是否將含括於該背向資料串流。此外，該用以產生背向資料串流之裝置包含混合器，該混合器係用以只混合欲含括於該背向資料串流的該參與者資料串流及不含括決定為不含括的該參與者資料串流。該用以產生背向資料串流之裝置係經組配來不會完全解碼判定為不含括於該背向資料串流的參與者資料串流。於一實施例中，該決定器係適用於當所考慮參與者資料串流之位準估計係低於臨界值時，決定該所考慮參與者資料串流係不含括於該背向資料串流。於又一實施例中，該決定器係適用於決定唯有含括於該背向資料串流之資料串流為有關特定定標因數帶，具有全部參與者資料率流之位準估計中的最高位準估計之該資料串流。依據一實施例，提出一種產生聯結碼薄之位準值之方法。該方法包含：針對該碼薄之各個碼字組，決定與該碼薄之一碼字組聯結的一序列數值。針對該碼薄之各個碼字組，藉施加一反量化器至一碼字組的該序列數值之該等數值，而對該碼薄之各個碼字組決定一反量化數值序列。針對該碼薄之各個碼字組，藉求取一碼字組之反量化數值序列中之各值平方而對該碼簿之各個碼字組計算一序列位準值。藉針對該碼薄之各個碼字組加總該序列位準值，計算針對該碼薄之各個碼字組之一位準和值。針對該碼薄之各個碼字組，藉將一碼字組之該位準和值乘以與該碼字組聯結之一機率值而決定該碼薄之各個碼字組之一機率加權位 13 201222530 準和值。針對_薄之各個碼字組，藉將―碼字組之機率加權位準和值除以與該碼薄騎之—維度值而決定該碼薄之各個碼Μ之-平均機率加權位準和值，及藉加總全部碼字組之平均機率加權位準和值而計算該碼薄之位準值。圖式簡單說明參考附圖解釋較佳實施例，附圖令第1圖顯示依據一實施例用於位準估計之裝置，第2圖顯示依據一實施例之估計單元，第3圖顯示依據另一實施例之估計單元，第4a及4b圖顯示用以產生位準值之方法，第5圖顯示依據又一實施例之估計單元，包含預測濾波器調整器，第6圖顯示用以產生背向資料串流之裝置，第7圖顯示依據技藝界現況之編碼器，第8圖顯示依據技藝界現況之解碼器，第9圖顯示依據技藝界現況之另一編碼器，及第10圖顯示依據技藝界現況之又一解碼器。 C實施方式3 第1圖例示說明依據一實施例之裂置。該裝置包含碼薄決定器110及估計單元120。碼簿決定器no係適用於從多個碼薄中決定一個碼薄來作為經識別之碼薄，其中該音訊信號已經藉採用經識別之碼簿而編碼。估計單元120係適用於導出與該經識別之碼薄聯結之位準值諸如能值、振幅值或響度值作為導出位準值。此外，估計單元120係適用於使用 14 δ 201222530 所導出的位準值而估計音訊信號之位準估m，例如能估值、振幅估值或響度估值。舉例言之，碼薄決定器ιι〇可藉接收連同該編瑪音訊信號—起發射的側邊f訊而決定碼薄，該碼薄已經由編碼器用來編碼音訊信號。更明確言之，側邊資訊可包含用以編碼所考慮之該音訊信號區段的碼薄之識別育訊。此種資訊例如可從編碼器發射至解碼器作為識別用於編碼所考慮之該音訊信號區段的霍夫曼碼薄的數字。第2圖例示說明依據一實施例之估計單元。該估計單元包含位準值導出器210及定標單元22〇。該位準值導出器係適用於藉詢查於記㈣的位準值，藉從本地資料庫請求位準值，或藉從遠端電腦請求與該經識別之碼薄聯結之該位準值而導出與該經識別之碼薄聯結之位準值，亦即用來藉編碼器編碼頻譜資料之碼薄。於一實施例中，由位準值導出器詢查或請求的位準值可以是平均位準值，該平均位準值指示藉使用經識別之碼薄而編碼之經編碼未經定標頻譜值之平均位準。藉此方式，導出位準值係非從實際頻譜值求出，反而係使用只取決於所採用的碼薄之平均位準值。如前文解釋’編石馬器通常係適用於從多個碼簿中選出最佳匹配來編碼音汛信號之一區段的個別頻譜資料之該碼薄。例如就可編碼的最大絕對值而言，因碼薄不同，故藉霍夫曼碼薄所編碼的平均值因碼薄而異，及因此，藉特定碼薄編碍的編碼頻错係、數之平均位準值因碼薄而異。 15 201222530 如此，依據一實施例，採用特定霍夫曼碼薄用以編碼音訊信號之頻譜係數的平均位準值可針對各個霍夫曼碼簿決定，且例如可儲存在記憶體、資料庫或遠端電腦。然後位準值導出器單純只須詢查或請求已經採用來編碼頻譜資料的與該經識別之碼薄聯結之該位準值，來獲得與該經識別之碼薄聯結之該導出位準值。但須考慮霍夫曼碼薄經常運用來編碼未經定標的頻譜值，如同MPEG AAC之情況。但然後當進行位準估計時，須將定標列入考慮。因此，第2圖之估計單元也包含定標單元220。定標單元係適用於導算出與該編碼音訊信號或該編碼音訊信號之一部分有關的定標因數作為導出定標因數。舉例言之，至於解碼器，定標單元220將針對各個定標因數帶決定一定標因數。舉例言之，藉接收從編碼器發射至解碼器的側邊資訊，定標單元220可接收有關定標因數帶之定標因數的資訊。又復，定標單元220係適用於基於定標因數及導出位準值而決定定標位準值。於一實施例中，此處導出位準值為導出能值，定標單元係適用於施加定標因數於導出能值，藉將導出能值乘以導出定標因數之平方而獲得定標位準值。於另一實施例中，此處導出位準值為導出振幅值，定標單元係適用於施加定標因數於導出振幅值，藉將導出振幅值乘以導出定標因數而獲得定標位準值。於又一實施例中，此處導出位準值為導出響度值，定標單元(220)係適用於施加定標因數於導出響度值，藉將導

16 201222530

出響度值乘以導出定標因數的立方而獲得定襟位準值。存在有其它辦法來計算響度，諸如藉指數3/2。—加I 为又而言，當導出位準值為響度值時，定標因數必須變換至響度定義域。此等實施例考慮能值係基於音訊信號之頰譜係數的平方測定，振幅值係基於音訊信號之頻譜係數的絕對值測定，及響度值係基於已經變換至響度定義域的音訊俨號之頻譜係數測定。 °~ 口丨千几你題用於便用足標位準值來估計立1疒。虎之位準估值。於第2圖之實施例中’估計單元係適用於輸出°定標位準值作為位準估值。於此種情況下，未進行^^ 值之後處理。但如於第3圖之實施例中例示說 :沖一

墨 ^ ΊαΓ aT 也可係適用於進行後處理。因此，第3圖之 ^ 叶單元包含後處理器23G用以後處理_或多個定標位準值用來估值。藉測定多個定標位準值之平均 ' %叶早元之位準估值可藉後處理器230測定。此一平均值可由作為位準估值。 τ早兀鞠出與所呈示之實施例相反，估的技藝界現況_十對全部頻譜值：：：= 量化/藉加總全部反量化__平但於所提示之實施例中，此種計复卜值況處理程料由平均料純技藝# ^ 奐，5亥估值只取決於定 ‘因數及碼减用而不依實際量化值決定。本發明之實施例採用下述事來遵照專用統計學喊供最佳編碼鱗係經設計如此表示碼薄已經依 17 201222530 據資料之機率設計，例如AAC-ELD (AAC-ELD ;高階音訊編碼-加強低延遲）：頻譜線。此一處理程序可經顛倒來獲得依據該碼薄之資料機率。在碼薄内部之各個資料分錄(指數) 之機率係藉碼字組長度給定。舉例言之， p(指數)=2Λ-長度(碼字組）亦即 Ρ(指數)=2·*度(碼字組）其中Ρ(指數)為碼簿内部之資料分錄(指數)之機率。植基於此，預期位準可以下述方式預先計算及儲存：各個指數表示一序列整數值(X)，例如頻譜線，此處該序列長度係取決於碼薄維度，例如針對AAC-ELD為2或4。第4a及4b圖例示說明依據一實施例，一種用以產生與一碼薄聯結之位準值，例如能值、振幅值或響度值之方法。該方法包含：針對該碼薄之各個碼字組，決定與一碼薄之碼字組聯結的一序列數值（步驟410)。如前文已經解說，碼簿藉該碼薄之碼字組編碼一序列數值，例如2或4數值。該碼薄包含多個碼薄來編碼多序列數值。所決定之該序列數值為藉所考慮之該碼薄之碼字組編碼之該序列數值。步驟410係針對碼薄之各個碼字組進行。舉例言之，若碼薄包含81碼字組，則於步驟410決定81數值序列。於步驟420，針對該碼薄之各個碼字組，藉施加反量化器至該數值序列的數值而針對該碼薄之各個碼字組決定反量化數值序列。如前文已經解釋，當編碼音訊信號之頻譜

18 201222530 值時，編碼器通常採用量化，例如非線性量化。結果，此種量化須在解碼器反相。隨後，於步驟430，針對該碼薄之各個碼字組決定一序列位準值。若欲產生能值作為碼薄位準值，則針對各個碼字組決定一序列能值，及針對該碼簿之各個碼字組，計算反量化數值序列的各值平方。但若欲產生振幅值作為碼簿位準值，則針對各個碼字組決定一序列振幅值，及針對該碼薄之各個碼字組，計算反量化數值序列的各值絕對值。但若欲產生響度值作為碼薄位準值，則針對各個碼字組決定一序列響度值，及針對該碼薄之各個碼字組，計算反量化數值序列的各值立方。存在有替代之道來計算響度，諸如藉指數3/2計算。一般而言，當產生響度值作為碼薄位準值時，反量化數值序列之值須變換為響度定義域。隨後，於步驟440，針對該碼薄之各個碼字組，係藉加總該數值序列之各值而求出針對該碼薄之各個碼字組的位準和值。然後，於步驟450，針對該碼薄之各個碼字組，藉將一碼字組的位準和值乘以與該碼字組聯結之機率值，決定針對該碼薄之各個碼字組的機率加權位準和值。藉此方式，考慮該數值序列中之部分例如頻譜係數序列將不如其它頻譜係數序列般頻仍出現。與該碼字組聯結之機率值將此點列入考慮。當採用霍夫曼編碼時，此種機率值可從碼字組 19 201222530 長度導出，原因在於較可能出現的碼字組係藉使用具有較短長度的碼字組編碼，而其它較不可能出現的碼字組將藉使用具有較長長度的碼字組編碼。於步驟460’針對該碼薄之各個碼字組，藉將一碼字組的機率加權位準和值除以與該碼字組聯結之維度值，將決定針對該碼薄之各個碼字組的平均機率加權位準和值。維度值指不藉該碼薄之一碼字組編碼的頻譜值數字。藉此方式’決定平均_加權料和值’該值表示針對藉該碼字組編碼之頻譜係數的位準值（機率加權）。然後，於步驟470’藉加總全部碼字組的平均機率加權位準和值而求出該碼薄之位準值。須注意此種位準值的產生確實只須對碼薄進行一次。若決定簡之位準值，職值單純_查且例如依據前述實施例藉裝置用於位準估計。後文中，呈不依據-實施例用以產生與該碼薄聯結之此值之方法。為了估計以給定碼薄編碼之資料的預期能值，針對碼簿之各個指數，下列步驟只須進行一次： A)施加反量化器至該序列之整數值(例如aac eld : χΛ(4/3)) Β)藉計算Α)序列各值的平方求得能 C) 建立B)序列之和 D) C)乘以該指數之給定機率 E) 除以碼簿維度來獲得每一頻譜線之預期能最後’藉E)求出的全部值須經加總來獲得完整碼薄之

20 201222530 預期能。此等步驟之輸出儲存於表中後，單純基於碼薄指數，亦即取決於使用哪個碼薄，可詢查估計能值。針對此—估計，實際頻譜值無須為霍夫曼解碼。了估ΛΛ框的頻譜資料之總能，須考慮定標因數。科鮮量_度，定標隨可跡自位元串流。在β力至預期⑭之别，疋標因數可經修改，例如可算出所使用的定標隨平方。__能乘以所使用較標因數平方。依據則述實&例’可估計針對各個定標因數帶之頻譜位準而未解碼霍夫曼編賴譜值。該位準雜可用來識別 ”有低位準’例如具低功率之串流，其係與隨後混合程序無關。因此可避免此等串流的完整解碼。依據一貫施例，一種用於位準估計之裝置進一步包含記憶體或資料庫’其中儲存多個碼薄位準記顏值，指示與一碼薄聯結之位準值，其中多個碼料之各者具有聯結的碼薄位準記憶體值儲存在記憶體或資料庫。此外，位準值導出器係經組配來用以藉從記憶體或從資料庫導出與經識別之碼薄聯結之碼薄位準記憶體值而導出與經識別之碼薄聯結之位準值。若進一步處理步驟作為預測，諸如預測濾波係施加於編解碼器，例如用於AAC-ELD TNS(時間性雜訊整形）濾波’則可改變依據前述實施例估計之位準。此處，預測係數係在位元串流内部傳輸，例如針對TNS用作為parc〇r 21 201222530 係數。第5圖例示說明一實施例，其中該估計單元進一步包含預測濾波器調整器240。該預測濾波器調整器係適用於導出與編碼音訊信號或編碼音訊信號之一部分有關的一或多個預測濾波係數。該預測濾波器調整器係適用於基於預測遽波係數及導出位準值而獲得預測濾波器調整位準值。此外，估計單元係適用於使用該預測濾波器調整位準值而估計該音訊信號之位準估值。於一實施例中’TNS之PARCOR係數係用作為預測漶波器係數。濾波處理之預測增益可以極為有效方式而從該等係數決定。有關TNS，預測增益可依下式計算：增益 = l/prod(l-parcorA2)。舉例言之，若考慮三個PARCOR係數例如parcor,、 parcor2、及parcor3 ’增益係依下式計算：增益=γτ--!-rnr-Λ 1^1 - parcor, j (I - parcor22 J (l - parcor32 j 至於n個PARCOR係數例如parcori、parcor〗、…及 parcorn，適用下式：增益 ‘—— _】 ' , 曰 v * Parcor,2 j(l - parcor22)...(l - parcorn2) 如此表示可估計通過濾波的音訊信號的放大而未施加濾波操作本身。依據前述實施例中之一者，位準估計裝置可採用於電傳會議系統’例如用於多點控制單元(MCU)。

22 201222530 二示說明依據一實施例，用以針對電傳會議系統中的多個參與者產生背向資料串流之裝置。料置包含接收器介面6_以接收多個參與者資料串流心p2、卜參與者資料串流ρι、ρ2、·..ρη包含來自多個參L的Γ訊 Ϊ:=’用:產生背向資料串流之裝置包含依據前述貫域中之—者用於編碼音訊信號的位準估計之裝置 620’其巾祕位準輯u置咖係配置來對各個來轉資料串流進行位準估計，而未完全解碼㈣串^如第_ 例不㈣’用於位準估計之裝置接收音訊資料串流pl、 Ρ2、···Ρη’及針對包含音訊信號的所接收之音訊資料串流 Pi、Ρ2、...ρη各自進行位準估計。裳置62〇輸送串流 Pl、P2、...K___ee,、ee2、ee^3 630。決定器_係適用於基於各個參與者資料串流的位準估計，蚊參與者資料争流是否將含括於背向資料串流。依據特定資料串流ρΐ、ρ2、···ρη是否含括於背向決定器530然後遞送決定deCl、deC2、…^給各參與者^料串流之混合器64G。混合器64〇也係適用於接收參與者資料串流pi、p2、...pn。基於決定deCi、如2、』％，混合器 640只混合欲含括於背向資料串流的參與者資料串流，而不包括決定不含括的參與者資料串流。用以產生背向資料串流之裝置係經組配來不完整解碼不欲含括於背向資料串流的參與者資料串流。於一實施例中，決定器630係適用於當所考慮之參與者資料串流的位準估計係低於臨界值時，決定該所考慮之參 23 201222530 與者資料串流係不含括於背向資料串流。於一實施例中，用以產生背向資料串流之裝置係適用於以逐一訊框為基礎，決定參與者資料_流是否欲含括於背向資料_流，例如針對各個音訊訊框，決定該參與者資料串流的整個音訊訊框是否將含括於背向資料串流。於另一實施例中，用以產生背向資料串流之裝置係適用於以定標因數帶為基礎，決定參與者資料串流是否欲含括於背向資料申流，例如針對音訊訊框之不同定標因數帶，決定定標因數帶是否含括於背向資料串流的決策可以不同。於又一實施例中，決定器630係適用於決定唯有含括於該背向資料串流之資料串流為有關一特定定標因數帶，具有全部參與者資料串流之位準估計中的最高位準估計之該資料串流。於另一實施例中，決定器630係適用於決定含括於該背向資料串流之唯二資料串流為有關一特定定標因數帶，具有全部參與者資料串流之位準估計中的兩個最高位準估計之該資料串流。於又一實施例中，第6圖中用於位準估計之裝置620並非針對音訊信號各者估計位準估值的單一位準估計裝置，反而裝置620包含多數η個用於位準估計之裝置，各個用於位準估計之裝置針對η個音訊信號串流中之一者提供位準估值。用於位準估計之裝置也可應用於多個其它裝置。於一 24 201222530 實施例中，提供用於緩衝器管理之裝置。該用於緩衝器管理之裝置包含用以存取一緩衝器之緩衝器音訊資料作為存取緩衝器音訊資料之一緩衝器存取單元，其中該緩衝器音訊資料包含一編碼音訊信號。此外，該用於緩衝器管理之裝置包含依據前述實施例中之一者用於編碼音訊信號之位準估計之裝置。又復，該用於緩衝器管理之裝置包含一決定器用以基於該編碼音訊信號之位準估計，決定該存取緩衝器音訊資料係將從該緩衝器刪除與否。此種用於緩衝器管理之裝置係特別適合用於管理抖動緩衝器，例如採用於VoIP(透過網際網路協定之語音）者。依據一實施例，用於緩衝器管理之裝置係適用於將重要音訊訊框維持於緩衝器，及當緩衝器係在存在有緩衝器過度運轉狀態風險時，係適用於從該緩衝器刪除較不重要的訊框。舉例言之，緩衝器的整個音訊資料内容可經檢驗，及基於位準估計，用於緩衝器管理之裝置決定音訊資料内容 (緩衝器音訊資料）是否欲從該緩衝器删除。於一實施例中，用以儲存輸入資料之裝置係適用於以逐一訊框為基礎，決定音訊資料係將被儲存或捨棄，例如針對各個音訊訊框，決定整個音訊訊框係將被儲存或捨棄。雖然已經於裝置脈絡描述若干構面，但顯然此等構面也表示相對應方法之描述，此處區塊或裝置係相對應於方法步驟或方法步驟的特徵結構。同理，描述於方法步驟脈絡的構面也表示相對應裝置之相對應方塊或項目或特徵結構之描述。 25 201222530 取決於某些體現要求’本發明之實施例可在硬體或軟體中體現。體現可運用具有可電子式讀取控制信號儲存於其上且與可規劃電腦系統協作（或可協作）來執行個別方法的數位儲存媒體執行，例如軟碟、DVD、CD、ROM、PROM、 EPROM、EEPROM或快閃記憶體。依據本發明之若干實施例包含具有可電子式讀取控制信號之非暫時性資料載體，該載體可與可規劃電腦系統協作來執亍此處所述方法中之_者。一般而言’本發明之實施例可體現為一種具有程式代碼的電腦程式產品，當該電腦程式產品係在電腦上跑時， 5亥程式代碼可操作用以執行該等方法中之一者。程式代碼例如可儲存在機器可讀取載體上。其它實施例包含儲存在機器可讀取載體上用以執行此處所述方法中之一者的電腦裎式。換言之’因此本發明方法之實施例為具有程式代碼的電腦程式’當該電腦程式係在電腦上跑時該程式代碼可用以執行此處所述方法中之一者。因此本發明方法之又一實施例為資料載體（或數位儲存媒體’或電腦可讀取媒體）包含用以執行此處所述方法中之一者的電腦程式。因此本發明方法之又一實施例為資料串流或一序列信號’表示用以執行此處所述方法中之一者的電腦程式。該資料串流或信號序列例如可經組配來透過資料通訊連結，例如透過網際網路轉移。

26 201222530 又—實施例包含處理穿署置，其係經組配來或係適心執例如電腦或可規劃邏輯裝、執仃此處所述方法中之一者。二:施例包含電腦’該電腦上安裝有用以執行此處所述方法中之一者的電腦程式。陣列二干實知例巾可規劃邏輯裝置(例如可現場規劃閘實喊輯方料部料全部魏。於若干 ::二可T劃閘陣列可與微電腦協定來執行此處 2方法中之-者。通常該等方法較佳係藉任何硬體裝置 2實補僅供舉例制本發明之原理。須瞭解此處相置及細節的修改與變化為熟諳技藝人士顯秋易知。 :此意圖只受審查中之申請專利範圍之範圍所限:、而非受藉描述與解說此處實施制呈示㈣定細節所限。【圖式簡單說明】第1圖顯示依據一實施例用於位準估計之事置第2圖顯示依據一實施例之估計單元，第3圖顯示依據另一實施例之估計單元，第4a及4b圖顯示用以產生位準值之方法，第5圖顯雜據又-實施狀估計單元，包含預測渡波器調整器，第6圖顯示用以產生背向資料串流之裝置，第7圖顯示依據技藝界現況之編碼器，第8圖顯示依據技藝界現況之解碼器，第9圖顯示依據技藝界現況之另一編碼器，及 27 201222530 第ίο圖顯示依據技藝界現況之又一解碼器。【主要元件符號說明】 110...碼薄決定器 710...T/F濾波器排組 120...估計單元 715...編碼器端TNS單元 210...位準值導出器 720...定標因數單元 220...定標單元 730...量化器 230...後處理器 740...霍夫曼編碼器 240...預測濾波器調整器 750...霍夫曼解碼器 410-470...步驟 760...反量化器 610...接收器介面 770...定標器 620...位準估計裝置 775...解碼器端TNS單元 630.. .決定器 640.. .混合器 780...F/T濾波器排組 28

Claims

201222530 七、申請專利範圍： 1. 一種用於一編碼立外馬曰汛k说之位準估計之裝置，其係包含： ^ 定11 ’該碼薄決定器用以從多個碼薄中決定-碼薄作為—經朗碼薄，其中該音訊信號已經藉採用δ亥經識別碍薄編碼，及十單元，忒估計單元係經組配來用以導算出與該經識別碼_結之—位準值作為—導出位準值，及用以使用该導出位準值估計該音訊信號之一位準估值。士申叫專㈣圍第旧之裝置，其中該估計單元包含一定標單元， …其中該定標單元係適詩導算出與該編碼音訊信唬或4編碼音訊信號之一部分有關的-定標因數作為一導出定標因數，八中°亥疋標單元係適用於基於該定標因數及該導出位準值而獲得一定標位準值，及其中該估計單元係適用於使用該定標位準值而估汁該音訊信號之一位準估值。 3.如申請專利範圍第2項之裝置，一其中該導出位準值為一導出能值，及其中該定標單凡係適用於將該導出定標因數施加至該導出能值而藉將該導出能值乘以該導出定標因數的平方而獲得一定才示位準值，或其中该導出位準值為一導出振幅值，及其申該定標 29 201222530 2係適用於將該導出定標因數施加至該導出振幅值曰將料出_值細料以_ 標位準值，或 & 在.*、中轉出位準值為—導出響度值，及較標單元 :用於將料出定標因數㈣至響度定義域且施加定標因數至該導出響度㈣獲得-定標位準值0 4. ΐ前述巾料·财任—項之裝置，其中該估計 :⑽心配來❹—碼薄位準值估計該音訊信號之 —位準估值，該料位準㈣__ 碼字組之平均機率加權位準和值中之—和， 2中各解均機率加權位準和值指㈣經識別碼〉之一碼字組之一機率加權位準和值對與該碼薄聯結之—維度值之一比， —其中各個機率加權位準和值指示該經識別碼薄之 /考慮的碼子組之_位準和值乘以與該經識別碼薄之遠所考慮的碼字組聯結之—機率值之乘積，其中各個位準和值指示該經識別碼簿之一碼字组的一序列位準值之數值，、中田碼薄位準值為—能值時，針對該碼薄之各個碼字組，各序顺準值指讀對—碼字組之—序列數序舰量化數財之各值之—付值；或當該碼準值為'振幅值時，針對該碼薄之各個碼字組，各序列位準值^不針對1字組之-序列數值的—序列

30 201222530 反里化數值巾之各值之—絕對值；或*t該碼薄位準值為 i度值時’針_碼薄之各個碼字組，各序列位準值指示針對-碼字組之—序列數值的—序列反量化數值中之各值之一值被變換至一響度定義域及其中各序列數值為藉該碼薄之一碼字組所編碼之一序列數值。項之裝置，其中該估計 5.如前述申請專利範圍各項中任一單元進一步包含-位準值導出器其中該位準值導出中與該經識別之碼薄聯準值，器係適用於藉詢查在_ 結的該位準值而導出該記憶體導出位再史該位準值導出器係適用於從一本求與該經識別之碼薄聯結之該位準值，或4庫明血兮/中雜準值導出器係適料從—遠端電腦請求 ”該經識狀碼_結之該位準值。 “==第5項之裝置，進-步包含-_或等於一_、於其中错存多個碼薄位準記憶體值，該各自二:=與—碼薄聯結，其中該等多個碼薄憶體或資料庫，;碼薄位準記憶體值儲存在該記其中該位準值導出從該資料庫導出與該經記憶體值而導出與該經為該位準值。器係經組配來藉從該記憶體或識別之碼薄聯結之一碼薄位準識別之碼薄聯結之該位準值作 31 201222530 7.如申請專利範圍第6項之裝置，該記憶體或資料庫已經儲存多個碼薄位準記憶體值於其中，其中各個碼薄位準記憶體值指示一相聯結碼薄的全部碼字組之平均機率加權位準和值之一和，其中該相聯結碼薄係與該碼薄位準記憶體值聯結，其中各個平均機率加權位準和值指示該相聯結碼簿之一碼字組的機率加權位準和值對與該相聯結碼薄聯結之一維度值之一比，其中各個機率加權位準和值指示該相聯結碼薄之一所考慮的碼字組之一位準和值乘以與該相聯結碼薄之該所考慮的碼字組聯結之一機率值之乘積，其中各個位準和值指示該相聯結碼薄之一碼字組的一序列位準值之數值，其中當該碼簿位準記憶體值為一能值時，針對該相聯結碼薄之各個碼字組，各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一平方值；或當該碼簿位準記憶體值為一振幅值時，針對該相聯結碼薄之各個碼字組，各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一絕對值；或當該碼薄位準記憶體值為一響度值時，針對該相聯結碼薄之各個碼字組，各序列位準值指示針對一碼字組之一序列數值的一序列反量化數值中之各值之一值被變換至一響度定義域，及其中各序列數值為藉該相聯結碼薄之一碼字組所

32 201222530 編碼之一序列數值。 8·=述巾請專利範圍各射任—項之裝置，其中該估計單凡進一步包含一預測濾波器調整器，立）其中該預測遽波器調整器係適用於導出與該編碼音訊信號或該編碼音訊信號之一部分有關的一或多個預測據波器係數作為導出預測遽波器係數，。其中該預_，波器調整器係適用於基於該預測遽波器係數及該導出位準值而獲得一預測滤波器調整位準值，及其中違估δ十單7C係適用於使用該預測渡波器調整位準值而估計該音訊信號之一位準估值。 9‘ 一種用以從輸人資料產生—輸出資料串流之裝置，包含：〃 -接收器介面用以接收包含-編碼音訊信號之該輸入資料，立/:前述申請專利範圍各項中任一項之用於該編碼曰汛仏號之位準估計之一裝置，、定器用以基於針對該輪出資料_流部分的位準估計，決定該編碼音訊作唬之—部分是否將含括於該輸出資料串流與否。卬.如申請專利範圍第9項之裝一混合器，其中該裝置進-步包含裝置係適用於針對1傳會議系統的多個參與者產生一背向資料串流作為一輪出資料串流， 33 201222530 其中該接收器係適用於接收包含來自該等多個參與者之音訊信號之多個參與者資料串流，其中該決定器係適用於基於針對各個參與者資料串流的位準估計而決定一參與者資料串流是否係含括於該背向資料串流，及 ’ 一混合器用以只混合欲含括於該背向資料串流的該參與者資料申流及不含括決定為不含括的該參與者資料率流。 11. 如申請專利範圍第10項之裝置，其中該決定器係適用於當一所考慮參與者資料串流之位準估計係低於一臨界值時，決定該所考慮參與者資料串流係不含括於該背向資料串流。 12. 如申請專利範圍第10項之裝置，其中該決定器係適用於決定唯有含括於該背向資料串流之資料串流為有關一特定定標因數帶，具有全部參與者資料串流之位準估計中的最rlj位準估計之該資料串流。 13. —種用於緩衝器管理之裝置：用以存取一緩衝器之緩衝器音訊資料作為存取緩衝器音訊資料之一緩衝器存取單元，其中該緩衝器音訊資料包含一編碼音訊信號，如前述申請專利範圍各項中任一項之用於該編碼音訊信號之位準估計之一裝置，一決定器用以基於該編碼音訊信號之位準估計，決定該存取緩衝器音訊資料係將從該緩衝器刪除與否。

34 201222530 14. 一種用以產生與一碼薄聯結之一碼薄位準值之方法，該方法係包含：針對該碼薄之各個碼字組，決定與該碼薄之一碼字組聯結的一序列數值，針對該碼薄之各個碼字組，藉施加一反量化器至一碼字組的該序列數值之該等數值，而對該碼薄之各個碼字組決定一反量化數值序列，當一能值係產生作為碼薄位準值時，針對該碼薄之各個碼字組，藉決定一碼字組之反量化數值序列中之各值平方而對該碼薄之各個碼字組決定一序列位準值；或當一振幅值係產生作為碼薄位準值時，針對該碼薄之各個碼字組，藉決定一碼字組之反量化數值序列中之各值絕對值而對該碼薄之各個碼字組決定一序列位準值；或當一響度值欲決定作為碼薄位準值時，針對該碼薄之各個碼字組，藉將一碼字組之反量化數值序列中之各值變換至一響度定義域，針對該碼薄之各個碼字組，藉加總該序列位準值之數值而計算該碼薄之各個碼字組之一位準和值，針對該碼薄之各個碼字組，藉將一碼字組之該位準和值乘以與該碼字組聯結之一機率值而決定該碼薄之各個碼字組之一機率加權位準和值，針對該碼薄之各個碼字組，藉將一碼字組之機率加權位準和值除以與該碼薄聯結之一維度值而決定該碼薄之各個碼字組之一平均機率加權位準和值，及 35 201222530 藉加總全部碼字組之該等平均機率加權位準和值而計算該碼薄位準值。 15. 如申請專利範圍第14項之方法，其中與該碼字組聯結之機率值係依據下式計算： ^-(長度（碼字組））其中長度(碼字組)指示該碼字組長度。 16. —種用於一編碼音訊信號之位準估計之方法，該方法係包含：從多個碼簿決定一碼薄作為一經識別之碼薄，其中該音訊信號已經藉採用該經識別之碼薄加以編碼，導出與該經識別之碼簿聯結之一位準值，及使用該位準值，估計該音訊信號之一位準估值。 17. —種用於從輸入資料產生一輸出資料之方法，該方法係包含：接收包令—編碼音訊信號之該輸入資料，從多個碼簿決定一碼簿作為一經識別之碼薄，其中該音訊信號已經藉採用該經識別之碼薄加以編碼，導出與該經識別之碼簿聯結之一位準值，及使用該位準值，估計該音訊信號之一位準估值，基於針對該輸出資料串流該部分之位準估值，決定該編碼音訊信號之一部分是否係含括於該輸出資料串流。 18. —種用於儲存包含一編碼音訊信號之輸入資料於一緩衝器之方法，該方法係包含： 36 201222530 接收包含一編碼音訊信號之該輸入資料，從多個碼薄決定一碼簿作為一經識別之碼薄，其中該音訊信號已經精採用該經識別之碼薄加以編碼’ 導出與該經識別之碼簿聯結之一位準值，及使用該位準值，估計該音訊信號之一位準估值，基於針對該輸出資料串流該部分之位準估值，決定該編碼音訊信號之一部分是否係儲存於該緩衝器。 19. 一種當藉一電腦或一信號處理器執行時體現如申請專利範圍第14至18項中任一項之方法的電腦程式。 37