TWI334736B

TWI334736B - Apparatus and method for generating a level parameter, apparatus and method for generating a multi-channel representation and a storage media stored parameter representation

Info

Publication number: TWI334736B
Application number: TW094126936A
Authority: TW
Inventors: Heiko Purnhagen; Lars Villemoes; Jonas Engdegard; Jonas Roeden; Kristofer Kjoerling
Original assignee: Coding Tech Ab
Priority date: 2004-04-16
Filing date: 2005-08-09
Publication date: 2010-12-11
Also published as: US10440474B2; JP4603037B2; US11647333B2; US20170229131A1; US20070258607A1; US9621990B2; JP2011018060A; ATE373301T1; JP5185337B2; US10244321B2; EP1695338A1; CN1930608A; US8223976B2; US10250984B2; CN102157155A; US10499155B2; ES2293578T3; US9972328B2; PL1695338T3; US11184709B2

Description

1334736 九、發明說明：【發明所屬之技術領域】本發明係有關於使用空間參數對音頻信號的多聲道表示的編碼。本發明教示用以估計及界定可用以從—些聲道 (少於輸出聲道的數目）重建一多聲道信號之適當參數的新方法。特別地，著重在最小化該多聲道表示之位元率及提供該多聲道信號之一編碼表示，其能夠容易地針對所有可能聲道配置編碼及解碼該資料。 • 【先前技術】發明名稱爲「用於低位元率音頻編碼應用之有效及可調式參數立體聲編碼」之PCT/SE02/01 372已顯示可從一單聲道信號重建一非常相似於原始立體聲圖像之立體聲圖像（假設具有該立體聲圖像之非常緊密表示）。基本原理係將輸入信號分割成頻帶及時間區段，以及針對這些頻帶及時間區段估計聲道間強度差（IID)及聲道間同調性（ICC)。第一參數係在特定頻帶中之兩個聲道間的功率分佈之測量，以及第二參 # 數係該特定頻帶之兩個聲道間的相關性之估計。在解碼器側上，藉由依據該IID資料在兩個輸出聲道間分配該單聲道信號及藉由加入一解相關信號以便保持原始立體聲道之聲道相關性，以從該單聲道信號重建該立體聲圖像。對於一多聲道情況（在上下文中之多聲道表示兩個輸出聲道以上）而言，必須說明幾個額外問題。現在有幾個多聲道配置。最通常所知道的是5·1配置（中間聲道、前左/右聲道、環繞左/右聲道及LEE聲道）。然而’亦現在有許多其它 1334736 I > 配置。從完整的編碼器/解碼器系統觀點來說，期望具有一可針對所有聲道配置使用相同參數組（例如：IID及ICC)或其子組。ITU-R BS.775界定幾個下行混音架構（down-mix schemes)，以便能從一特定聲道配置獲得一包括較少聲道之聲道配置。取代經常必須解碼所有聲道及依據一下行混音，期望具有一多聲道表示，其能使一接收器在解碼該等聲道前擷取有關於手上聲道配置之參數。再者，從一可調式或內嵌式編碼觀點而言期望有一固有可調之參數組，在該觀點中例 • 如可將對應於該等環繞聲道之資料儲存在位元流之一加強層中。相反於以上所述，亦可期望能依據所處理之信號的特性來使用不同參數界定，以便在會對所處理之目前信號區段導致最低位元率負擔的參數化間做切換。使用一加總信號或下行混音信號及額外參數附加資訊之多聲道信號的另一表示係爲本技藝中所知之雙聲道信號編碼（Binaural Cue Coding，BCC)。此技術被描述於2003年修 11月第6期第11卷IEEE語音處理會刊之作者爲F. Baumgarte及C· Faller的「雙聲道信號編碼-第一篇：聽覺心理學基礎及設計原理」及2003年11月第6期第11卷IEEE 語音處理會刊之作者爲C. Fall er及F. Baum g arte的「雙聲道信號編碼-第二篇：架構及應用」中。通常，雙聲道信號編碼係一種依據一下行混音聲道及附加資訊的多聲道空間表示之方法。針對音頻重建或音頻提供以一 BCC編碼器所計算及以一BCC解碼器所使用之幾個參 -6- 1334736 數包括聲道間電平差、聲道.間時間差及聲道間同調參數。這 . 些聲道間信號係一空間圖像之感知的決定因數。這些參數係提供給該原始多聲道信號之時間樣本的區塊及亦提供有頻率選擇性，以便多聲道信號樣本之每一區塊對於數個頻帶而言具有數個信號。在c播放聲道之一般情況中，在複數對聲道間之每一子頻帶中（亦即，針對相對於一參考聲道之每一聲道）考量該等聲道電平差及該等聲道間時間差。將一聲道界定成對每一聲道間電平差之參考聲道。由於該等聲道間電 0 平差及該等聲道間時間差，因而可提供一音源至一所使用之播放裝設的複數對揚聲器中之一對揚聲器間的任何方向。爲了決定一已提供音源之擴散的寬度，考量所有音頻聲道之每一子頻帶的一參數係足夠的。此參數係該聲道間同調參數。該已提供音源之寬度係藉由修改該等子頻帶信號來控制，以便所有可能聲道對具有相同聲道間同調參數。在BCC編碼中，決定在該參考聲道1與任何其它聲道間之所有聲道間電平差。當例如決定該中央聲道爲該參考聲 ® 道時，計算在該左聲道與該中央聲道間之第一聲道間電平差、在該右左聲道與該中央聲道間之第二聲道間電平差、在該左環繞聲道與該中央聲道間之第三聲道間電平差及在該右環繞聲道與該中央聲道間之第四聲道間電平差。此情節描述一 5-聲道架構。當該5-聲道架構額外地包括一低頻增強型聲道（亦爲所知之「超低音喇叭（sub-woofer)」聲道）時，計算在該低頻增強型聲道與該中央聲道（該單一參考聲道）間之第五聲道間電平差。 1334736 當使用該單一下行混音聲道（亦稱爲「單」聲道）及傳輸 . 信號’例如：ICLD(聲道間電位差、ICTD(聲道間時間差）及 . ICC(聲道間同調））來重建該原始多聲道時，使用這些信號來修改該單信號之頻譜係數。使用一用以決定每一頻譜係數之電平修改的正實數以實施該電平修改。使用一複數之大小來決定每一頻譜係數的相位修改以產生該聲道間時間差。另一功能決定該同調影響。藉由先計算該參考聲道之因數以計算每一聲道之電平修改的因數。計算該參考聲道之因數，以便 • 對於每一頻率部分而言所有聲道之功率的總和相同於該合量信號之功率。然後，依據該參考聲道之電平修改因數，使用個別ICLD參數來計算其它聲道之電平修改因數。因此，爲了實施BCC合成，計算該參考聲道之電平修改因數。爲了此計算，需要一頻帶之所有ICLD參數。然後，依據該單聲道之電平修改，可計算其它聲道（亦即，非該參考聲道之聲道）之電平修改因數。此方法之缺點在於：對於一完整重建而言，需要每一聲 # 道間電平差。當出現一易出錯傳輸聲道時，此需求會造成更大問題。因爲需要每一聲道間電平差以計算每一多聲道輸出信號，所以在一傳送聲道間電平差內之每一錯誤將導致在該重建多聲道信號中之錯誤。在另一情況中，雖然一聲道間電平差僅是例如該左環繞聲道或右環繞聲道所需，但是當在傳輸期間遺失此聲道間電平差時，則無法實施重建，其中因爲重要資訊係包含在該前左聲道（下面稱爲左聲道）、該前石聲道（下面稱爲右聲道）及該中央聲道中，所以該左環繞聲道 1334736 > 及右環繞聲道對於多聲道重建並非是重要的。當在輸輸期間遺失該低頻增強型聲道之聲道間電甲差時，此情況變得更糟。在此情況中，雖然該低頻增強型聲道對收聽者之收聽舒適並非是決定性的，但是可能不會有多聲道重建或僅有一錯誤多聲道重建。因爲，將在單一聲道間電平差中之錯誤傳播至每一重建輸出聲道內之錯誤。參數多聲道表示之問題在於··通常提供聲道間電平差 (例如：在BCC編碼中之ICLD或在其它參數多聲道表示中 • 之平衡値）做爲相對値而非絕對値。在BCC中，一ICLD參數描述在一聲道與一參考聲道間之電平差。亦可提供平衡値以做爲在一聲道對中之兩個聲道間的比率。當重建該多聲道信號時，將此等電平差或平衡參數應用至一基本聲道，該基本聲道係可以是一單聲基本聲道或一具有兩個基本聲道之立體聲基本聲道信號。因此，在至少一基本聲道中所包含之能量係沿著5個或6個重建輸出聲道來分配。因此，在一重建輸出聲道中之絕對能量係由該聲道間電平差或該平衡參 ® 數及在該接收器輸入上之下行混音信號的能量來決定。當在該接收器輸入上之下行混音信號的能量相對於一編碼器所輸出之一下行混音信號變化的情況出現時，將發生電平變化。在此上下文中，強調當該等參數具有頻率選擇性時’依據所使用之參數化架構，此電平變化不僅導致所建立信號之一般音量變化，而且亦會導致大量的人工因素。當例如：在頻率範圍中相較於在另外位置之一頻帶而言較常操控該下行混音信號之某一頻帶時，因爲在該某一頻帶之輸出聲 1334736 道中的頻率成分具有一太低或太高之電平，所以此操控在該重建輸出信號中係明顯易見的。 _ 此外，適時改變電平操作亦將導致該重建輸出信號之總電平隨著時間變化及因此被認爲是一惱人的人工因素。雖然上述情況係集中在藉由編碼、傳輸及解碼一下行混音信號所造成之電平操作，但是亦會發生其它電平偏移。由於在要被下行混音成一個或兩個聲道之不同聲道間的相位相依性，因而會發生下列情況：該單聲信號具有一不等於在 • 該原始信號中之能量的總和。因爲通常例如藉由加入時間波形以取樣式（sample-wise)來實施該下行混音，所以雖然左信號與右信號當然具有某一信號能量，但是在該兩個信號間之例如180度的相位差將導致在該下行混音信號中之兩個聲道的完全抵消，進而導致零的能量。雖然在正常情況中，將非常不可能發生此種情形，但是因爲所有信號當然不是完全不相關的，所以仍然會發生能量變化。因爲該重建輸出信號之能量將不同於該原始多聲道信號之能量，所以此等變化亦會 0導致在該重建輸出信號中之音量變動及亦將導致人工因素。【發明內容】本發明之一目的在於提供一種可造成一具有改善輸出品質之多聲道重建的參數化觀念。此目的係藉由依據申請專利範圍第1項之一種用以產生電平參數之裝置、依據申請專利範圍第7項之一種用以產生一重建多聲道表示之裝置、依據申請專利範圍第9項之一種用以產生電平參數之方法、依據申請專利範圍第10項之一 -10- 1334736 種用以產生一重建多聲道表.示之方法、依據申請專利範圍第 .11項之一種電腦程式或依據申請專利範圍第12項之一種參，數表示來達成。本發明係依據下面之硏究結果：爲了高品質重建及有鑑於彈性編碼/傳輸及解碼架構，將一額外電平參數與一多聲道信號之下行混音信號或參數表示一起傳送，以致於一多聲道重建器可一起使用此電平參數與該等電平差參數及該下行混音信號，以便再生一多聲道輸出信號，而不會遭遇電平 #變化或頻率選擇性電平所引起之人工因素。依據本發明，計算該電平參數，以便以該電平參數加權 (例如：乘或除）之至少一下行混音聲道的能量等於該等原始聲道之能量的加總。在一實施例中，該電平參數係由在該（等）下行混音聲道之能量與該等原始聲道之能量的加總間之比率所獲得。在此實施例中，在該編碼器側上計算該（等）下行混音聲道與該原始多聲道信號間之任何電平差及將其輸入至該資料流以做 #爲一電平校正因數，該電平校正因數被視爲一額外參數，該額外參數亦可被提供給該（等）下行混音聲道之樣本的一區塊及被提供給某一頻帶》因此，針對每一區域及頻帶（存在有聲道間電平差或平衡參數），加入一新電平參數。因爲本發明允許傳送一多聲道信號之一不同於該等參數所根據之下行混音的下行混音，所以本發明亦提供彈性。當例如：一廣播站不希望播放一多聲道解碼器所產生之一下行混音信號，然而希望播放在一播音室由一音效工程師所產 -11- 1334736 生之一下行混音信號（係一依據人類之主行混音）時，會出現此等情況。不過，播送有關於此「主下行混音」之多聲道參數由該電平參數提供該參數組與該主下行湄情況中，該電平參數係在該主下行混音與之電平差，其中該參數組係根據該參數7 本發明之優點在於：因爲亦可使有關之參數組適應於另一下行混音，其中該另 • 參數計算期間所產生，所以該額外電平參品質及改善之彈性。爲了位元率之減少，最好應用該新電及量化及熵編碼。特別地，因爲頻帶間或將不會那麼高，以致於可獲得相對小的差編碼（例如：霍夫曼編碼器）之使用以允許能性，所以△-編碼將導致高編碼增益。在本發明之一較佳實施例中，使用一 ®平衡參數之多聲道信號參數表示，該至少表示兩個不同聲道對間之平衡。特別地，抗錯誤及甚至位元率率效率係下面事實之 (第一平衡參數之根據）係不同於第二聲3 之根據），其中形成這些聲道對之四個聲j 因此，本發明觀念不同於該單一參考多平衡或超平衡觀念，該多平衡或超平衡印象更直學及更自然。特別地，構成該第觀及創造印象之下放者可能亦希望傳。依據本發明，藉 :音間之適應，在此該參數下行混音間行混音。於一下行混音信號一下行混音並非在數提供改善之輸出平參數之△-編碼以時間區塊間之變化値，此連合隨後熵良好編碼增益之可包括至少兩個不同兩個不同平衡參數彈性、可調能力、 •結果：第一聲道對 I對（第二平衡參數箕皆彼此不同。聲道觀念及使用一觀念對人類之聲音一及第二平衡參數 -12- 1334736 之聲道對可包括原始聲道、.下行混音聲道或最好是輸入聲道間之某些組合。已發現到一從該中央聲道（做爲該第一聲道）所獲得之平衡參數以及該左原始聲道與該右原始聲道（做爲該聲道對之第二聲道）之加總對於在該中央聲道與該左及右聲道間提供一精確能量分佈是特別有用的。注意到在此上下文中這三個聲道通常包括聲場之大部分資訊，其中特別地該左·右立體聲局部化不僅受左與右間之平衡的影響，而且亦受中央與 Φ 左右之加總間的平衡之影響。依據本發明之一較佳實施例藉由使用此平衡參數來反映此觀察。最好，當傳送一單一單下行混音信號時，已發現到除該中央/左+右平衡參數之外，還有一左/右平衡參數、一後-左/ 後-右平衡參數及一前/後平衡參數係一位元率-有效參數表示之最佳解答，其係彈性、抗錯誤及可免於大程度人工因素。在接收器側上，相較於單獨藉由該已傳輸資訊來計算每 —聲道之BCC合成，本發明之多平衡表示額外地使用在用 ^ 以產生該下行混音聲道之下行混音架構上的資訊。因此，在該下行混音架構（未使用於習知技藝系統中）上之資料亦使用於除該平衡參數之外還有上行混音。因此，實施該上行混音操作，以便藉由該平衡參數來決定在一重建多聲道信號 (針對一平衡參數形成一聲道對）內之聲道間的平衡。此觀念（亦即，不同平衡參數具有不同聲道對）可產生一些聲道而不需知道每一傳輸平衡參數。特別地，可重建該左、右及中央聲道而不需知道任何後-左/後-右平衡或不需知 •13- 1334736 道前/後平衡。因爲從一位元流擷取一額外參數或傳送一額外平衡參數至一接收器因而允許一個或多個額外聲道之重建，所以此結果允許非常微調之可調能力》此與該習知技藝單一參考系統成對比，在該習知技藝單一參考系統中需要每一聲道間電平差以重建所有已重建輸出聲道之所有子群或只有一子群》因爲可使該等平衡參數之選擇適應於某一重建環境，所以本發明觀念亦是有彈性的。當例如：一 5 -聲道裝設形成該 φ 原始多聲道信號裝設時及當一 4-聲道裝設形成一重建多聲道裝設時，一前-後平衡參數允許計算該組合環繞聲道而不需要對該左環繞聲道及該左環繞聲道有任何了解，其中該重建多聲道裝設只具有一單一環繞揚聲器，而該單一環繞揚聲器例如是設置在收聽者之後面。此與一單一參考聲道系統成對比，在該單一參考聲道系統中必須從該資料流擷取該左環繞聲道之聲道間電平差及該右環繞聲道之聲道間電平差。然後，必須計算該左環繞聲道及該右環繞聲道。最後，必須加 # 入兩個聲道以針對一4-聲道重建裝設獲得該單一環繞揚聲器聲道。因爲由於該更直覺及更使用者導向之平衡參數表示並非受限於一單一參考聲道而亦可允許使用原始聲道之組合以做爲一平衡參數聲道對之一聲道因而可自動地發送該組合環繞聲道，所以不必在該平衡參數表示中實施所有這些步驟》本發明係有關於音頻信號之參數化多聲道表示的問題。本發明提供一有效方式以界定該多聲道表示之適當參數 -14- 1334736 及亦提供可擷取用以表示所期望聲道組態之參數的能力而不需解碼所有聲道。本發明進一步解決針對一特定信號區段以選擇最佳參數組態之問題，以便最小化要針對該特定信號區段編碼該空間參數所需之位元率。本發明亦槪述如何在一般多聲道環境中應用在先前只可應用於兩個聲道情況之解相關方法。在較佳實施例中，本發明包括下面特徵： -在該等編碼器側上將該多聲道信號下行混音成爲一個或 • 兩個聲道表示； -已知有該多聲道信號，界定用以表示該等多聲道信號之參數’以便在一彈性每幀基礎中最小化位元率或使該解碼器能擷取在一位元流位準上之聲道組態； -假設該聲道組態目前係由該解碼器來支援，在該解碼器側上擷取該相關參數組： -假設有該目前聲道組態，產生所需數目之相互解相關信

Ow^ · m， ® -假設該參數組係由該位元流資料及該等解相關信號所解碼，重建該等輸出信號； -界定該多聲道音頻信號之參數化，以便可使用相同參數或該等參數之一子組，而無關於該聲道組態； -界定該多聲道音頻信號之參數化，以便可在一可調式編碼架構中使用該等參數，在該架構處將該參數組之子組傳送於該可調式流之不同層中； -界定該多聲道音頻信號之參數化，以便來自該解碼器之輸 1334736 出信號的能量重建不會受下面音頻編解碼器所損害，該音頻編解碼器係用以編碼該下行混音信號； -該多聲道音頻信號之不同參數化間做切換，以便最小化用以編號該參數化之位元率負擔； -界定該多聲道音頻信號之參數化，其中包括一用以表示該下行混音信號之能量校正因數的參數； -使用數個相互解相關之解相關器，以重建該多聲道信號；以及 •-從一依據該傳送參數組所計算之上行混音矩陣重建該多聲道信號。現將藉由有關於所附圖式之說明範例來描述本發明，其中該等說明範例並非用以限定本發明之範圍或精神》 1：實施方式】下面描述之實施例僅用以說明本發明在音頻信號之多聲道表示的原理。可了解到在此所述之配置及細節的修改及變化對熟習該項技藝者而言係顯而易知的。因此，意思僅由· • 即將描述之申請專利範例所限定，而非由在此之實施例的描述及說明所呈現之特定細節來限定。在槪述如何參數化IID及ICC參數及如何應用這些參數以便重建音頻信號之多聲道表示的本發明之下面描述中，假設所有提及之信號係在一濾波器阻中之子頻帶信號或對應聲道之整個頻率範圍的一部分之一些其它頻率選擇性表示。因此，了解到本發明並非局限在一特定濾波器組，以及下面針對該信號之子頻帶表示的一頻帶來槪述本發明，以及 -16- 1334736 相同操作應用至所有子頻帶信號。雖然一平衡參數亦稱爲一「聲道間強度差（II D)」參數，但是強調在一聲道對間之一平衡參數沒有必要是在該聲道對之第一聲道中的能量或強度及在該聲道對中之第二聲道的能量或強度。通常，該平衡參數表示在該聲道對之兩個聲道間的一聲音源的局部化。雖然此局部化通常係由能量/電平/強度差所提供，但是可使用信號之其它特性（例如：兩個聲道之功率測量或該等聲道之時間或頻率包封等）。在第1圖中，顯現一5.1聲道組態之不同聲道，其中a(t) 101表示該左環繞聲道，b(t) 102表示該左前聲道，c(t) 103 表示該中央聲道，d(t) 104表示該右前聲道，e(t) 105表示該右環繞聲道，以及f(t) 106表示該LEF(低頻音效（l〇w frequency effect))聲道 ° 假設我們界定期望運算子爲： E\f{x)] = ^\f{x{t))dt Y 0 以及因此上面所槪述之聲道的能量可依據下面來界定 (在此以左環繞聲道做爲範例）： ^ = 。在該編碼器側上將5-聲道下行混音成爲一 2·聲道表示或一 1-聲道表示》此能夠以幾個方式來完成，以及一通常所使用之方式爲由下面所界定之ITU下行混音： 5.1至2-聲道下行混音： ld = ab(t) + Pa(t) + yc(t) + 8f (t) -17- 1334736 rd (t) = ad(t) + βε(ί) + yc(t) + 6f (t) 以及5.1至1-聲道下行混音： ^(0 = ^(/,(0 + ^(0) 常數<χ、β、γ及δ之通常所使用之値爲： a=1，月=y =晶，以及各=〇。將該IID參數界定成爲兩個任意選擇聲道或加權群之聲道的能量比。假如有上述針對該5. 1聲道組態之所槪述的聲道之能量，則可界定幾組之IID參數。第7圖表示一普通下行混音器7 00，其使用上述方程式，以便計算一單聲道m或兩個最佳立體聲道“及rd。通常，該下行混音器使用某些下行混音資訊。在一線性下行混音之較佳實施例中，此下行混音資訊包括加權因數α、β、γ 及δ。在本技藝中已知可使用更多或更少常數或非常數加權因數。在一ITU建議下行混音中，a係設定爲1，β及γ係設定爲等於〇·5之平方根，以及δ係設定爲0。通常，因素a可在 1.5與0.5之間變化。此外，因素β與γ係彼此不同的及在〇與1之間變化。該低頻增強型聲道f(t)具有相同之事實。此聲道之因數δ可在0與1之間變化。此外，該左-下行混音及該右-下行混音之因數不必彼此相等。當考量一例如藉由一音效工程師所實施之非自動下行混音時，此變得更清楚。進一步指導該音效工程實施一創造性下行混音而非—由任何數學定律所支配之下行混音。取而代之，該音效工程師係由 -18- 1334736 他本身自己的創造感覺來支.配。當某一參數組記錄此「創造性的」下行混音時，將依據本發明由第8圖所示之一發明上行混音器來使用該「創造性的」下行混音，此不僅由該等參數來支配，而且亦由該下行混音架構之額外資訊來支配。當如同在第7圖中已實施一線性下行混音時，該等加權參數係在該下行混音架構上要由該上行混音器所使用之最佳資訊。然而，當呈現在該下行混音架構中所使用之其它資訊時，一上行混音器亦可使用此其它資訊以做爲該下行混音 • 架構之資訊。此其它資訊例如亦可以是在一上行混音-矩陣之矩陣元素內之某些矩陣元素或某些因素或函數（例如：如第1 1圖所示）。假設有第1圖所槪述之5 · 1聲道組態及觀察其它聲道組態如何相關於該5 . 1聲道組態：對於不可獲得環繞聲道之3 -聲道情況而言，亦即可依據上述記號獲得B、C及D。對於 —4-聲道組態而言，可獲得B、C及D，然而亦可獲得用以表示該單環繞聲道或在此上下文中所一般表示之後聲道的 ® A與E之組合。本發明使用應用至所有這些聲道之IID參數，亦即，該 5.1聲道組態之4-聲道子組在描述該5.1聲道之IID參數組內具有一對應子組。下面IID參數組解決此問題：

_L _ a2B + fi2A + Y2C + S2F r]~ R~ a2D + fi2E + y2C + 52F

r y22C ~ a\B + D) -19- 1334736 β2{Α + Ε) r3 = a\B + D) + y22C · β2Λ_Α

___S22F

h = a\B-¥D) + fi\A^E) + Y22C 明顯可知h參數對應於該左下行混音聲道與該右下行混音聲道間之能量比。Γ2參數對應於中央聲道與該左及右前聲道間之能量比。r3參數對應於該三個前聲道與該兩個環繞 # 聲道間之能量比。r4參數對應於該兩個環繞聲道間之能量比。r5參數對應於該LFE聲道與所有其它聲道間之能量比。在第4圖中，描述上面所述之能量比。不同輸出聲道係由101至105所表示及相同於第1圖所示以及因而在此不做詳細陳述。將該揚聲器裝設分割成左及右半部，其中該中央聲道103係兩個半部之部分。該左半部平面與該右半部平面間之能量比正好是η參數。此係藉由第4圖中之η下方的實體線來表示。再者，在該中央聲道1〇3與該左前102及右 ® 前1 03聲道間之能量分佈係由！·2所表示。最後，在該整個前聲道裝設（102、103及104)與該後聲道（101及105)間之能量分佈係以r3參數由第4圖中之箭頭來描述。假設有上述參數化及該傳輸單下行混音聲道之能量： M =-(a\B + D) + β\Α + E) + 2r2C + 2S2F) 2 ，該等重建聲道之能量可表示成爲： F = 丄丄 2γ2 1 + r5

2M -20- 1334736 A = J__rj__rj__L. /?2 1 + r4 1 + r3 1 + r5

2M E = J__1__rA__1_ β2 \ + r4\ + r3\ + r5

2M c ~ J____1__1_ 2γ2 1 + r2 1 + r3 1 + r5

2M

\ M-P2A^y2C-S2F J if 1 、

D = -y 2——M~fi2E-v2C-S2F

a K 1 + /i J 因此，可將M信號之能量分配至該等重建聲道，導致重建聲道具有相同於該等原始聲道之能量。上述較佳上行混音架構係描述於第8圖中。從F、A、E、 C、B及D之方程式可清楚知道該下行混音架構之由該上行混音器所使用的資訊係該等加權因數α、β、γ及δ，在使此加權或未加權聲道一起加入或彼此扣減以便獲得某一數目之下行混音聲道前，使用該等加權因數以加權該等原始聲道， φ 其中下行混音聲道之數目小於原始聲道之數目。因此，從第 8圖可清楚知道依據本發明該等重建聲道之能量不僅由從一編碼側傳送至一解碼側之平衡參數所決定，而且可由該下行混音因數（X、β、γ及δ。當考量第8圖時，變成可清楚知道爲了計算該左及右能量Β及D，可在該方程式中使用已計算之聲道能量f、A、Ε 及C。然而’此沒有必要包含一連續上行混音架構。取而代之’爲了獲得一例如使用某一上行混音矩陣（具有某些上行混音矩陣元素）來實施之完全平行上行混音架構，將A、C、 -21- 1334736 E及F之方程式插入B及D·之方程式。因此，變得可清楚知道重建聲道能量僅由平衡參數、下行混音聲道及該下行混音架構之資訊（例如：該等下行混音因數）來決定。如從下面將可明顯知道，假設有上述IID參數，則明顯易知已解決用以界定一參數組之IID參數（可用於數個聲道組態）的問題。觀察該三個聲道組態（亦即，從一可獲得聲道重建三個前聲道）來做爲一個範例，可明顯易知因爲A、E及 F聲道不存在，所以r3、r4及r5參數係不顯著的。亦可明顯 • 易知因爲參數η描述該左與右前聲道間之能量比及參數r2 描述該中央聲道與該左及右前聲道間之能量比，所以參數η 及r2係足以從一下行混音單聲道重建該三個聲道。在更一般情況中，可容易地看到上述之IID參數（n... r5) 係應用至用以從m個聲道重建η個聲道之所有子組，其中 m<nS6。觀察第4圖，可以說： -對於一從1聲道重建2聲道之系統而言，從η參數獲得用以保持該等聲道間之正確能量比的充分資訊； ® -對於一從1聲道重建3聲道之系統而言，從η及〇參數獲得用以保持該等聲道間之正確能量比的充分資訊； -對於一從1聲道重建4聲道之系統而言，從n、r2及r3 參數獲得用以保持該等聲道間之正確能量比的充分資訊； -對於一從1聲道重建5聲道之系統而言，從ri、r2、r3及 h參數獲得用以保持該等聲道間之正確能量比的充分資訊； -對於一從1聲道重建5.1聲道之系統而言，從ri、r2、r3、 -22 - 1334736 Γ4及r5參數獲得用以保持該等聲道間之正確能量比的充分資訊； -對於一從2聲道重建5.1聲道之系統而言，從r2、r3、U 及r5參數獲得用以保持該等聲道間之正確能量比的充分資訊。上述可調能力特徵可藉由第圖中之列表來描述。第 l〇a圖中所述且在稍後所說明之可調位元流亦可適用於第 1 Ob圖中之列表，以便獲得比第1 0a圖所述者更細之可調能 _力。本發明之優點特別在於：可容易地從一單平衡參數r! 重建該左及右聲道，而無需知道或擷取任何其它平衡參數。爲此目的，在第8圖中之B、D的方程式中，將聲道A、C、 F及E簡單地設定成爲零。在另一情況中，當只考量該平衡參數^時，該等重建聲道係該中央聲道與該低頻聲道（此聲道未被設定成零）間之加總及該左與右聲道間之加總。因此，可只使用一單一參數 ® 來重建該中央聲道及該單音信號。此特徵對於一簡單3-聲道表示是有用的，其中例如藉由對分以從左及右之加總獲得該左及右信號，以及其中藉由該平衡參數r2正確地決定該中央與該左右之加總間的能量。在此上下文中’該等平衡參數1^或1"2係位於一較低調整層中。

至於第l〇b圖之列表中的第二項，表示如何只使用兩個平衡參數取代所有5個平衡參數來產生三個聲道b、D及C -23- 1334736 與F間之加總，相較位於該較低調整層中之參數η或〇 ’ 這些參數η及r2中之一可以已經在一較高調整層中。當考量第8圖中之方程式時，變得清楚知道：爲了計算 C，將未擷取參數r5及另一非擷取參數r3設定成零。在另— 情況中，亦將該等未使用聲道A、E及F亦設定成零’以便可計算該三個聲道B、D及該中央聲道與該低頻增強型聲道 F之組合。當使一4_聲道表示上行混音時，只從該參數資料流擷取 φ ri、r2及r3係足夠的。在此上下文中，相較於參數^或^， r3可以在一下一較高調整層中。因爲如同稍後有關於第6圖所述，已從該等前聲道與該等後聲道之組合獲得第三平衡參數Γ3，所以該4-聲道組態特別適合相關於本發明之超平衡參數表示。此乃是基於下面事實：該參數r3係一從該聲道對所獲得之前-後平衡參數，該聲道對具有該等後聲道A與E之組合（做爲第一聲道）及具有左聲道B、右聲道E及中央聲道 C之組合（做爲該等前聲道）。 # 因此’如同是在一單一參數聲道裝設中之情況，可自動地獲得兩個環繞聲道之組合聲道能量，而無需任何進一步分離計算及隨後組合。當必須從一單聲道重建五個聲道時，需要另一平衡參數 r4。此參數r4可再次位於一下一較高調整層中。當必須實施一 5.1重建時，需要每一平衡參數。因此，必須將一下一較高調整層（包括該下一平衡參數r5)傳送至一接收器及由該接收器來估計。 -24- 1334736 然而，使用依據聲道之擴充數目來擴充該IID參數的相同方法，可擴充上述IID參數以涵蓋具有比該5.1組態大之數目的聲道之聲道組態。因此，本發明並非局限於上面槪述之範例。現在觀察該聲道組態係一 5 · 1聲道組態之情況，此爲最通常使用情況中之一。再者，假設從兩個聲道重建該5.1聲道。對於此情況而言，可藉由以下面式子來取代該等參數Γ3 及N以界定一不同組之參數： Q4=~^d 該等參數q3及q4表示該前與後左聲道間之能量比及該前與後右聲道間之能量比。可想像幾個其它參數化》在第5圖中，可見到修改之參數化。取代具有一用以槪述該前與後聲道間之能量分佈的參數（如第4圖中之r3所槪述）及一用以描述該左環繞聲道與該右環繞聲道間之能量分佈（如第4圖中之r4所槪述），使用該等參數q3及q4以描述該左前102與左環繞101聲道間之能量比及該右前聲道1〇4 與該右環繞聲道1 05間之能量比。本發明教示可使用幾個參數組以表示該等多聲道信號。本發明之一額外特徵係可依據所使用之參數的量化之型態以選擇不同參數化。以一使用參數化之粗量化的系統做爲一個範例，由於高位元率限制，因而應該使用一在該上行混音程序中不會擴大 -25- 1334736 誤差之參數化》觀察在一用以從一聲道重建5.1聲道之系統中上述重建能量的兩個表示式： 1 ( r Λ

B = ^r 2-^—M-fi2A-Y2C~57F α V 1 + η )

\ M-0lE-r1C-51F ) 明顯可知由於該Μ ' A ' C及F參數之相當小量化效應， ^ 因而該等減算會產生該B及D能量之大變化^ 依據本發明，應該使用一幾乎對該等參數之量化不會有敏感之不同參數化。因此’如果使用粗量化，則上述所界定之η參數： _ L α2Β + β2Α+γ2€ + δ2Ρ

r'~~R~ a2D + /32E + r2C + S2F 可由依據下式之替代界定來取代：

B 此產生依據下式之重建能量的方程式： Β = ~~^——1——ί———2Μ a 1 + r, l + r2 l + r3 l + r5 D = ~———1——-———2M a 1 + r, 1 + r2 1 + r3 1 + r5 及A、E、C及F之重建能量的方程式保持與上述相同。明顯可知此參數從量化觀點來看表示一最佳狀態系統。在第6圖中，描述上述所說明之能量比。不同輸出聲道 -26- 1334736 以101至105來表示且相同.於第1圖以及因此在此不做進一步詳述。將該揚聲器裝設分割成前部及後部。藉由第6圖中由r3參數所表示之箭頭來描述該整個前聲道裝設（1〇2、103 及104)與該等後聲道（1〇1及1〇5)間之能量分佈。本發明之另一重要顯著特徵在於當觀察該參數化 r r22C ri~a\B + D)

B

r' = D 時，從量化觀點來看它不僅是一更佳狀態系統。上述參數化亦具有下列優點：可獲得用以重建三個前聲道之參數而不會對該等環繞聲道有任何影響。可相像一參數r2係描述該中央聲道與所有其它聲道間之關係。然而，此將具有下例缺點：該等環繞聲道將包含在該等前聲道所述之參數的估計中。記住在本發明中所描述之參數化亦可應用至聲道間之關聯或同調的測量，明顯可知在r2之計算中包含該等後聲道 φ 對精確地重建該等前聲道之成功有顯著的負面影響。可相像在所有前聲道中之相同信號及在該等後聲道中之完全無相關信號的情況，以做爲一個範例。此並非罕見的，假設經常使用該等後聲道以重建該原始聲音之周圍環境資訊。如果描述該中央聲道係有關於所有其它聲道，則因爲該等後聲道完全不相關，所以該中央與所有其它聲道之加總間之相關程度將相當低。對於一用以估計該前左/右聲道與該 -27 - 1334736 後左/右聲道間之相關性的參數具有相同之事實。因此’我們達成一可正確地重建該等能量之參數化，然而該參數化並沒有包括所有前聲道係相同（亦即，非常相關）的資訊。該參數化確實包括將該左及右前聲道解相關至該等後聲道及亦將該中央聲道解相關至該等後聲道之資訊。然而，所有前聲道係相同之事實係無法從此一參數化來推論。因爲該等後聲道未包含在該解碼器側上所使用之參數的估計中以重建該等前聲道，所以此可藉由使用下列本發明 # 所教示之式子來克服：

Y22C r2~ a2 (B + D)

B r'=~5 依據本發明藉由r2來表示該中央聲道103與該左前102 及右前103聲道間之能量分佈。藉由r4來描述該左環繞聲道 101與該右環繞聲道105間之能量分佈。最後，藉由Γι來提 φ供該左前聲道102與該右前聲道104間之能量分佈。明顯可知’除Π在此對應於該左前揚聲器與該右前揚聲器間之能量分佈（因相對於整個左側及整個右側）之外，所有參數相同於第4圖中所述。基於完整性，該參數Γ5亦提供用以槪述該中央聲道103與該LFE聲道106間之能量分佈。第6圖顯示本發明之較佳參數化實施例的槪要。該第一平衡參數η(由實線所表示）構成一前-左/前-右平衡參數。該第二平衡參數！>2係一中央左-右平衡參數。該第三平衡參數 Π構成一前/後平衡參數。該第四平衡參數r4構成一後-左/ -28 - 1334736 後-右平衡參數。最後，該第五參數r5構成—中央/LFE平衡參數。第4圖顯示一相關情況。該第一平衡參數ri(在一下行混音左/右平衡中藉由第4圖中之實線來描述）可由一在該等聲道B與D(下面聲道對）間所界定之原始前-左/前-右平衡參數來取代。此以第4圖中之虛線η來描述及對應於第5圖及第6圖中之實線Γι。在一雙聲道情況中，該等參數r3及r4(亦即，該前/後平 •衡參數及該後-左/右平衡參數）由兩個單側前/後參數所取代。該第一單側前/後參數q 3亦可被視爲該第一平衡參數，其中該第一平衡參數係從該左環繞聲道A及該左聲道b所構成之聲道對所獲得。該第二單側前/左平衡參數係該參數其可被視爲該第二參數，該第二參數係根據該右聲道D 及該右環繞聲道E所構成之第二聲道對。再者，兩個聲道對係彼此不相關的。該中央/左-右平衡參數1*2亦具有相同之事實，該中央/左-右平衡參數rz具有一中央聲道C以做爲一第 ® 一聲道及該左及右聲道B及D之加總以做爲一第二聲道。依據本發明界定另一參數化’該另一參數化針對一從— 個或兩個聲道重建5.1聲道之系統本身相當適合於粗量化。至於一個聲道至5.1聲道而言：

2B r2c 2d Μ Μ Μ ^ Μ 以及至於二個聲道至5.1聲道之情況： β2Α 2Β r2c

2D

L

R β2Ε -29- 9, % 1334736 明顯可知上述參數化包括比嚴格理論觀點所需要要多之參數，以正確地再分配該等傳輸信號之能量至該等重建之信號。然而，該參數化對量化誤差之敏感係非常遲鈍的。上述針對一 2-聲道裝設所提及之參數組使用幾個參考聲道。然而，相較於第6圖中之參數組態，第7圖中之參數組僅依據下行混音聲道而非原始聲道來做爲參考聲道。該等平衡參數q!、q3及q4係由完全不同聲道對所獲得。雖然已描述幾個本發明實施例，其中用以獲得平衡參數 # 之聲道對僅包括原始聲道（第4圖、第5圖及第6圖）或包括原始聲道及下行混音聲道（第4圖及第5圖）或僅依據該下行混音聲道以做爲在第7圖之底部所表示的參考聲道，但是最好在第2圖之環繞資料編碼器206內所包括之參數產生器係操作以僅使用原始聲道或原始聲道之組合而非在該等聲道對中之聲道的一基本聲道或基本聲道之組合，其中該等平衡參數係根據該等聲道對。此乃是由於無法完全保證該單一基本聲道或該兩個立體聲基本聲道不在會在從一環繞編碼器 ^傳輸至一環繞解碼器期間發生能量變化。可藉由一音頻編碼器2 05 (第2圖）或一音頻解碼器302(第3圖）在一低-位元率狀態下操作以造成該下行混音聲道或該單一下行混音聲道之能量變化。此情況會導致該單下行混音聲道或該等立體下行混音聲道之能量的操控，該操控在該左與右立體聲下行混音聲道間可以是不同的或甚至可以是頻率選擇性的或時間選擇性的。爲了完全安全地反對此能量變化，依據本發明針對每一 -30 - 1334736 下行混音聲道之每一區域及.頻帶傳送一額外電平參數。所以當該等平衡參數係根據該原始信號而非該下行混音信號時，因爲任何能量校正將不影響該等原始聲道間之平衡情況，所以一單一校正因數對每一頻帶係足夠的。甚至當沒有傳送額外電平參數時，任何下行混音聲道能量變化將不會在該音頻圖像中導致音源之失真局部化，然而將只會導致一般音量變化，該一般音量變化不會像藉由改變平衡狀態所造成之音源的遷移一樣惱人。重要的是要注意需要小心，以便（該等下行混音聲道之）能量Μ係上面所槪述之能量B、D、A、E、C及F之加總。由於在被下行混音至一個聲道之不同聲道間的相位相依性，所以不會經常是這種情況。可傳送該能量校正因數以做爲一額外參數rM，以及因此將在該解碼器側上所接收之下行混音信號界定成爲： rMM = Ua2(B + D) + fi\A + E) + 2y2C + 252F) ^ ο 在第9圖中，槪述依據本發明之額外參數ΓΜ的應用。在將該下行混音信號傳送至該上行混音模組70 1 -705前在 901中藉由該額外參數rM修改該下行混音信號。這些係相同於第7圖所述者及在此將不做進一步詳述。熟習該項技藝者明顯可知上面單聲道下行混音範例之參數rM可擴充至每一下行混音一個參數及因此並非局限於一單一下行混音聲道。第9a圖描述一發明電平參數計算器900，然而第9b圖表示一發明電平校正器902。第9a圖表示在該編碼器側上之 1334736 情況，以及第9b圖描述在該解碼器側上之對應情況。該電平參數或「額外」參數rM係一用以提供某一能量比之校正因數。假設下面示範性情節來做解釋。針對某一原始多聲道信號，一方面具有一「主下行混音」及另一方面具有一「參數下行混音」。已依據例如主觀品質印象由在一播音室中之音效工程師產生該主下行混音。此外，某一音頻儲存媒體亦包括該參數下行混音，該參數下行混音已藉由例如第2圖之環繞編碼器2 0 3來實施。該參數下行混音包括一基本聲道或 ^ 兩個基本聲道，上述基本聲道使用該原始多聲道信號之平衡參數組或任何其它參數表示來形成該多聲道重建之基礎。例如可以是下面情況：廣播員希望不要傳送該參數下行混音，然而希望將該主下行混音從一發送器傳送至接收器。此外，爲了將該主下行混音提升至多聲道表示，該廣播員亦傳送該原始多聲道信號之一參數表示。因爲（在一頻帶中及在一區塊中之）能量可（或通常將）在該主下行混音與該參數下行混音間做變化，所以在區塊900中產生一相對電平參數 ® rM及將其傳送至該接收器以做爲一額外參數。該電平參數係從該主下行混音及該參數下行混音所獲得及最好是在該主下行混音及該參數下行混音之一區塊及一頻帶內之能量的比率。通常，計算該電平參數以成爲該等原始聲道之能量 (E〇rig)的加總與該（等）下行混音聲道之能量間的比率，其中此（等）下行混音聲道可以是該參數下行混音（EPD)或該主下行混音（EMD)或任何其它下行混音信號。通常，使用從一編 -32- 1334736 碼器傳送至一解碼器之特定、下行混音信號的能量。第9b圖描述該電平參數使用之一解碼器側實施。將該電平參數及該下行混音信號輸入至該電平校正器區塊902 » 該電平校正器依據該電平參數校正該單一基本聲道或該幾個基本聲道。因爲該額外參數rM係一相對値，所以此相對値係藉由該對應基本聲道之能量來操控。雖然第9a及9b圖表示一對該下行混音聲道或該等下行混音聲道施加電平校正之情況，但是該亦可將該電平參數整 # 合至該上行混音矩陣中。爲此目的，在第8圖之方程式中的 m之每次出現係由「rMM」來取代》硏究當從2聲道重建5.1聲道之情況，可觀察下面描述。如果使用具有第2圖及第3圖所槪述之編解碼器205及 3 02的本發明，需要一些更多考量。觀察稍早所界定之IID 參數，其中依據下面式子來界定η:

L a2B + fi2A + Y2C + S2F r'~~R~ a2D + fi2E + r2C + S2F φ 因爲該系統從2聲道重建5.1聲道，其中假設該兩個傳輸聲道係該等環繞聲道之立體聲下行混音，所以此參數係暗示地可在該解碼器側上獲得。然而，在一位元率限制下操作之音頻編解碼器可以修改該頻譜分佈，以便在該解碼器側上所測量之L及R能量不同於在該編碼器側上之數値。依據本發亦可針對從兩個聲道重建5.1聲道時之情況藉由傳送下列參數以使對該重建聲道之能量分佈的影響消失： -33 - 1334736

B r\ =— D。如果提供發信手段’則該解碼器可使用不同參數組編碼目前信號區段及選擇用以對所要處理之特定信號區段提供最低負擔之IID參數。該右前與後聲道間之能量電平可能係相似的，以及該前與後左聲道間之能量電平可能係相似的，然而在該右前與後聲道中之電平係顯著不同的。假設有參數之差量編碼（delta coding)及隨後熵編碼（entropy coding)，則使用參數q3及q4以取代r3及r4係更有效的》對於另一具有不同特性之信號區段而言，一不同參數組可以提供一較低位元率負擔。本發明允許自由地在不同參數表示間做切換，以便最小化該目前已編碼信號區段之位元率負擔，其中該信號區段之特性係已知的。切換於該等IID參數之不同參數化間以便獲得最低可能位元率負擔及提供發信手段以表示目前使用什麼參數化的能力係本發明之基本特徵。再者，可在頻率方向或在時間方向完成該等參數之差量編碼，以及完成不同參數間之差量編碼。依據本發明，假設提供發信手段以表示所使用之特定差量編碼，則可對一參數相對於任何其它參數實施差量編碼。任何編碼架構之一重要特徵係實施可調編碼之能力。此意味著可將該已編碼位元流分割成幾個不同層。核心層可由本身來解碼，以及可解碼較高層以增強該已解碼核心層信號。對於不同情況而言，可獲得層之數目可以是變化的，然而只要該核心層係可獲得的，該解碼器可產生輸出樣本。使用該η至Γ5參數之上面所槪述的多聲道編碼之參數化本身 -34 - 1334736 « * 相當適合於可調式編碼。因此，可將例如該兩個環繞聲道（A 及E)之資料儲存在一增強層（亦即，該等參數r3及r4及在— 核心層中對應於該等前聲道之參數（由參數ri及r2所表示））中。在第10圖中，槪述依據本發明之可調位元流實施。該等位元流層係以1 〇〇 1及1 0 〇 2來描述，其中1 〇〇 !係該核心層，其持有該波形編碼下行混音信號及持有用以重建該等前聲道（102、103及104)之參數ri及r2。1002所描述之增強層 φ 持有用以重建該等後聲道（1〇1及105)之參數。本發明之另一動要觀點係在一多聲道組態中使用解相關器。在PCT/SE02/01 3 72專利文件中已針對一個或兩個聲道情況詳細一解相關器之使用的觀點。然而，當將此理論擴充至多於兩個聲道時，會產生本發明所要解決之數個問題。基本數學顯示：爲了從N個信號完成Μ個相互解相關信號’需要Μ-Ν個解相關器，其中所有不同解相關器用以從一共同輸入信號產生複數個相互正交輸出信號。假設一輸费入X⑴產生一輸出y(t)且ψ|2]=ψ|2]及幾乎使交互相關消失，則一解相關器通常是一全通或幾乎全通濾波器。另外的知覺準則可獲得一良好解相關器之設計，設計方法之一些範例在加入該原始信號至該解相關信號時亦可最小化梳形濾波器特性及最小化在暫態信號上之一有時太長之脈衝響應的效應。一些習知技藝解相關器使用一人造反射鏡來解相關。習知技藝亦可藉由例如修改複雜子頻帶樣本之相位以包括分數延遲，進而達到較高回聲密度及因而完成更長時間之 -35 - 1334736 擴散》本發明提出用以修改一以反射鏡爲主之解相關器以便達到多個可從一共同輸入信號產生複數個相互解相關輸出信號之解相關器的方法。如果兩個解相關器之輸出y1(t)及 yz(t)具有消失或幾乎消失之交互相關（假設有相同輸入），則使該兩個解相關器相互地解相關。假設該輸入係靜態白雜訊’則接著在消失或幾乎消失之感知中該等脈衝響h 及h2必須是正交的。複數組之成對相互解相關解相關器可以數個方式來建構。實施此修改之一有效方式係改變相位旋轉因數q(爲該分數延遲之部分）。本發明特定相位旋轉因數可以是在該等全通濾波器中之延遲線的部分或剛好是一總分數延遲。在該後者情況中，此方法並非局限於全通或反射鏡式濾波器，然而亦可應用至例如包括一分數延遲部之簡單延遲。可在一Z-域中將該解相關器中之一全通濾波器連結描述成爲： H{z) = φ 1-呼，其中q係複數相位旋轉因數（Μ = 1)，m係在樣本中之延遲線長度，以及a係濾波器係數。其於穩定理由，該濾波器係數之大小必須限制在|α| <1。然而，藉由使用替代瀘波器係數a’ = -a，以界定一新反射鏡，其具有相同反射延遲特性’ 然而具有一與該未修改反射鏡之輸出顯著不相關之輸出。再者，該相位旋轉因數q之修改可藉由例如加入一固定相位偏移q' = qejc來完成。該常數C可用以做爲一固定相位偏移或 -36 - 1334736 可以下列方式來調整：針對所有被施加有該常數c之頻帶而言，該常數c將對應於一固定時間偏移。該相位偏移常數c 亦可以是一隨機値’其對於所有頻帶而言係不同的β 依據本發明’藉由將一具有nx(m+p)大小之上行混音矩陣Η應用至一具有（m + p)xl大小之行向量信號，以實施從m 個聲道產生η個聲道。 m 少= s • 其中！!1係1«個已下行混音及編碼信號，以及使在S中之P信號兩者相互地解相關及與在m中之所有信號解相關。這些解相關信號係藉由解相關器由在m中之信號所產生。然後，使η個重建信號b'、…包含在該行向量中。 X , = Hy。藉由第11圖來描述上述情況，其中該等解相關信號係由該等解相關器1 102、1 103及1 104所產生。該上行混音矩陣Η係由1101所提供，用以對該向量y操作以提供該輸出 ®信號X ·。假設R = E [XX”爲該原始信號向量之相關矩陣，假設 R' = E[x'x〃]爲該重建信號之相關矩陣。在此及在下面中，對於一具有複數項之向量X的矩陣而言，χΦ表示伴隨矩陣---X 之複數共軛轉置。 R之對角線包含該等能量値A、B、C...及可由上面所界定之能量定額解碼成一總能量電平。因爲R/ = R，所以只有 n (n-1)/2個不同非對角線交互相關値，其包含將藉由調整該 -37- 1334736 上行混音矩陣Η來完全地或部分地重建之資訊。該完整相關結構之重建對應於該情況R’ = R。正確能量電平之重建僅對應於下列情況，其中R1及R在對角線上係相等的。在從m = l聲道成爲n聲道之情況中，藉由使用p = n-l 個相互解相關解相關器（一上行混音矩陣Η)達成該完整相關結構之重建，其中該上行混音矩陣Η滿足下列條件： HH' =—R Μ g 其中Μ係該單傳輸信號之能量。因爲R係正半定矩陣，所以已熟知現在一個解答。再者，針對Η之設計保留η(η·1)/2 自由度，其係使用於本發明中以獲得該上行混音矩陣之另外期望特性。一中心設計準則爲Η對該傳輸相關資料之相依性應該是平順的。參數化該上行混音矩陣之一傳統方式爲H = UDV，其中U 及V係正交矩陣以及D係一對角矩陣。可選擇D之絕對値的平方等於R/M之特徵値。刪去V及挑選該等特徵値以便 φ將最大値應用至第一座標將最小化在該輸出中之解相關信號的總能量。在實數情況中該正交矩陣U係藉由n(n-l)/2 旋轉角度來參數化。傳送在那些角度之形式中的相關資料及 D之η個對角値將立即提供Η之期望平順相依性。然而，因爲能量資料必須被變換成特徵値，所以此方法犧牲可調能力。本發明所教示之第二方法係藉由以R = GR〇G來界定一正規化相關矩陣R〇以使在R中之能量部與相關部分離，其中 G係一具有等於R之對角項的平方根之對角値（亦即，7^、 -38 - 1334736 #··.)的對角矩陣，R〇在對角線上具有相同對角値。假設HO 係一正交上行混行矩陣，其在同等能量之完全無關信號的情況中界定較佳正規化上行混音》此較佳上行混音矩陣之範例爲· Ί 1 1111 '1 -Γ 1 ，一 1 1 -72 1 » 一 11-1-1 1 1 2 >/2 — V2 0 2 1 一1 一1 1 1 _1 1 1 然後，以打=G57/。來界定上行混音，其中該矩陣S解暑出SS'Ro。選擇此解答對在R〇中之正規化交互相關値的相依性爲連續的，以便在R〇 = I之情況中S等於單位矩陣。將該η個聲道分割成較少聲道之群係一種重建部分交互相關結構之合宜方式。依據本發明，對於從1聲道重建5.1 聲道之情況而言，一特別有利編組爲{a，e}，{c}，{b，d}， {Π，其中沒有解相關應用至該等群{c}及{f}，以及該等群{a， e}及{b，d}係藉由相同下行混音/解相關對之上行混音所產生。對於這兩個子系統而言，選擇在完全未相關情況中之較 φ佳正規化上行混音分別成爲：丄「1 -Γ]丄「1 1 ' 1」，万l· -1」。因此，將只傳送及重建15個交互相關之總數中的兩個，亦即，在聲道{a，e}與{b，d}間之交互相關。在上述所使用之術語中，此對於n = 6、m=l及P=1之情況而言是設計上的一個範例。該上行混音矩陣Η係6x2之大小且在第3及第6列上的第2行中之對應於輸出c·及Γ的兩個項爲零。 -39- 1334736 本發明所教示之用以倂入解相關信號的第三方法係一較簡單觀點：每一輸出聲道具有一不同解相關器，以造成解相關信號Sa、Sb…。然後使該等重建信號成爲： a = 4 At M (/wcos% + sin%)， b = 4bTM (m cos % + sb sin ), 等等。該等參數cpa、（Pb…控制在輸出聲道a'、b'...中所呈現之解相關信號的數量。該相關資料係以這些角度之形式來傳送。可易於計算：在例如聲道a’與b·間之結果正規化交互相關係等於乘積COS(paCOSCpb »當成對交互相關之數目爲 n(n-1)/2及具有η個解相關器時，如果n>3，則通常不可能以此方法來匹配一特定相關結構，然而優點是一非常簡單且穩定解碼方法及對在每一輸出聲道中所呈現之解相關信號的所產生數量之直接控制。此能使解相關信號之混合係根據倂入有例如聲道對之能量電平差的感知準則。對於從m>l聲道重建n聲道之情況而言，不再將相關矩陣Ry = E[y〆]假設爲對角矩陣，以及必須考慮到R' = HRylT對該目標R之匹配。因爲Ry具有分塊矩陣結構

Rv = m y ί〇所以產生簡化，其中％ = £[111111*]及RS = E[SS·]。再者，假設爲相互解相關解相關器，該矩陣Rs爲對角矩陣。注意到此亦會影響有關於正確能量之重建的上行混音設計。解決方法係要在該解碼器中計算或從編碼器傳送有關於該等下 -40 - 1334736 行混音信號之相關結構11„1的資訊。對於從2聲道重建5.1聲道之情況，上行混音之較佳方法爲：〇 κ 0 κ 0 ' b· κ 0 心 0 C κ Κ 0 0 cf 0 Κ 0 Κ s\ e 0 κ 0 Κ -si. /. Λ Κι 0 0 _ 其中Si可從mpld之解相關來獲得及S2可從m2 = rd之解相關來獲得。在此’將該等群{a，b}及{d，e}視爲已考量成對交互相關之分離1^2聲道系統。對於聲道c及f而言，調整加權，以便冰31 泔1+、2 所2N=C， ψ61»ί 丨 +；762«72|2j=F。本發明可針對各種用於類比或數位信號之儲存或傳輸的使用任意編解碼器之系統實施在硬體晶片及DSP中。第2 圖及第3圖顯示本發明之可能實施。在此範例中，顯示一用以操作6個輸入信號之系統（一5 · 1聲道組態）。在顯示該編碼器側之第2圖中’將該等分離聲道之類比輸入信號轉換成爲數位信號201及使用每一聲道之濾波器組來分析202。將該濾波器組之輸出饋入該環繞編碼器203,該環繞編碼器203 包括一參數產生器，其實施一下行混音以產生由該音頻編碼器205所編碼之一個或二個聲道。再者，依據本發明擷取像 -41- 1334736 IID及ICC參數之環繞參數’以及依據本發明擷取用以槪述資料之時間頻率格（time frequency grid)及哪一個參數化被使用的控制資料204 »如本發明所教示，編碼該等擷取參數 2 06 ’以切換於不同參數化之間或以可調方式配置該等參數。將該等環繞參數207、控制信號及編號下行混音信號208 多工處理209成爲一串列位元流。在第3圖中，顯示一典型解碼器實施（亦即，一用以產生多聲道重建之裝置）》在此，假設該音頻解碼器以一頻域 Φ 表示法輸出一信號，例如：在QMF合成濾波器組前之MPEG-4 高效率AAC解碼器的輸出。對該串列位元流實施解多工處理301及將該編碼環繞資料饋入該環繞資料解碼器303及將該等下行混音編碼聲道饋入該音頻解碼器3 02(在此範例中爲MPEG-4高效率AAC解碼器）。該環繞資料解碼器解碼該環繞資料及將其饋入該環繞解碼器305，該環繞解碼器305 包括一上行混音器，其依據該解碼下行混音聲道及該環繞資料與該等控制信號以重建6個聲道。合成3 06該環繞解碼器 ® 之頻域輸出以成爲時域信號，接著將該等時域信號藉由DAC 307轉換成爲類比信號。雖然主要已描述有關於平衡參數之產生及使用的本發明’但是在此要強調用以獲得平衡參數之聲道對的相同編組最好亦是用以計算聲道間同調參數或這兩個聲道對間之「寬度」參數。此外，使用相同於該平衡參數計算所用之聲道對亦可獲得聲道間時間差或一種「相位信號」。在接收器側上，亦可使用除該等平衡參數之外或做爲該等平衡參數之替代 -42 - 1334736 的這些參數’以產生一多聲道重建。在另一情況中，除其它參考聲道所決定之其它聲道間電平差之外，還可使用該等聲道間同調參數或甚至該等聲道間時間差。然而，有鑑於如第 l〇a圖及第1 Ob圖所述之本發明的可調能力特徵，最好對所有參數使用相同聲道對，以便在一可調位元流中每一調整層包括用以重建該子群之輸出聲道的所有參數，其中該子群之輸出聲道可藉由在第l〇b圖之列表的倒數第二行中所槪述之個別調整層來產生。本發明在只計算在個別聲道對間之同調 ® 參數或時間差參數及將其傳送至一解碼器時係有用的。在此情況中’當實施一多聲道重建時，該等電平參數已存在於該解碼器以供使用。可依據本發明方法之某些實施需求，以硬體或軟體方式實施本發明方法。可使用一數位儲存媒體（特別是儲存有電子可讀取控制信號之磁碟或光碟）來實施，該等電子可讀取控制信號與一可程式電腦系統配合，以便實施本發明方法。因此’本發明通常係一具有儲存在一機械可讀取載體中之程 ®式碼的電腦程式產品’當該電腦程式產品在一電腦上執行時’該程式碼係操作用以實施本發明方法。因此，換句話說，本發明方法係~具有程式碼之電腦程式，該程式碼用以在該電腦程式在一電腦上執行時實施本發明方法中之至少一方法。【圖式簡單說明】第1圖描述在本發明中之一 5 · 1聲道組態所使用的學術用語； -43 - 1334736 第2圖描述本發明之一較佳實施例的一合適編碼器實施；第3圖描述本發明之一較佳實施例的一合適解碼器實施；第4圖描述依據本發明之多聲道信號的一較佳參數化；第5圖描述依據本發明之多聲道信號的一較佳參數化；第6圖描述依據本發明之多聲道信號的一較佳參數化；第7圖描述一用以產生一單一基本聲道或兩個基本聲道 •之下行混音架構的示意裝設；第8圖描述一上行混音架構之示意表示，該上行混音架構係依據本發明平衡參數及該下行混音架構之資訊；第9a圖剛要性地描述依據本發明在該編碼器側上之電平參數的決定；第9b圖剛要性地描述依據本發明在該解碼器側上之電平參數的使用；第10a圖描述一在位元流之不同層中具有該多聲道參數 Φ化之不同部分的可調式位元流；第10b圖描述一可調能力表，其表示使用哪些平衡參數來建構哪些聲道及不使用及計算哪些平衡參數及聲道；以及第11圖描述依據本發明之上行混音矩陣的應用。【主要元件符號說明】 101 左環繞聲道 102 左前聲道 103 中央聲道 -44- 右前聲道右環繞 LEF聲 ADC 分析濾環繞編控制信音頻編環繞資環繞參編號下多工器解多工音頻解環繞資控制信環繞解合成濾 D AC 下行混電平參電平校位元流位元流聲道道波器組碼器號碼器料編碼器數行混音信號器碼器料解碼器

Wi 碼器波器組音器數計算器正器層層 -45 - 1334736

1101 解相關器 1103 解相關器 1104 解相關器 Id, rd 最佳體聲道 m 3 1, n 單聲道 r l 參數 Γ2 參數 Γ3 參數 Γ4 參數 Γ5 參數 ΓΜ 額外參數 a 加權因數 β 加權因數 Ί 加權因數 δ 加權因數 A 聲道 B 聲道 C 聲道 D 聲道 E 聲道 E M D 主下行混音 E 〇 r i g 原始聲道之能量 E p D 參數下行混音 F 重建聲道之能里 -46 -

Claims

1334736 月修(更)正替換衷 ^______^ 第94126936號「用以產生電平參數之裝置及方法、用以產生多聲道表示之裝置及方法以及儲存參數表示之儲存媒體」專利案 (2010年6月25日修正）十、申請專利範圍：

1.—種用以在一多聲道信號之一參數表示內產生一電平參數之裝置，該多聲道信號具有數個原始聲道，該參數表示包括一參數組，該參數組在與至少一下行混音聲道一起使用時允許一多聲道重建，該裝置包括： —電平參數計算器（900) ’用以計算一電平參數（rM)，該電平參數被計算以便由該電平參數所加權之該至少一下行混音聲道的能量等於該等原始聲道之能量的加總；以及一輸出介面，用以產生輸出資料，該輸出資料包括該電平參數及該參數組或該電平參數及該至少一下行混音聲道0 2.如申請專利範圍第1項之裝置，其中該電平參數計算器係操作以計算該等原始聲道之能量的加總與該至少 ~下行混音聲道之能量間之比例的測量以做爲該電平參數。 3·如申請專利範圍前述項中任一項之裝置，其中該參數表示該至少一下行混音聲道之多個頻帶中的每一頻帶而言包括一參數組，以及其中該參數計算器（9 00)係操作以針對該等頻帶之每一頻帶計算一電平參數》 1334736 4 ·如申請專利範圍第i項之裝置其中該參數表示包括針對在該至少一下行混音聲道之一連續期間中之一期間的一參數組’以及其中該電平參數計算器（则）係操作以針對在該至少下行混音聲道之—連續期間中的每一期間，計算一電平參數。 5 ·如申J專利範圍第！項之裝置其中該輸出介面係操作以產生可調資料流’該可調資料流在—較低調整層中包括該參數組之第-子群的參數，該第—子群之參數允許第— 子群之輸出聲道的重建，該可調資料流在一較高調整層中包括該參數組之第二子群的參數，該第二子群與該第一子群一起允許第二子群之輸出聲道的重建，以及其中該輸出介面進一步操作使該電平參數進入至該較低調整層。 6.如申請專利範圍第1項之裝置，其中進—步包括一參數產生器’該參數產生器係形成用以產生一左/右平衡參數以做爲一第一平衡參數、一中央平衡參數做爲一第二平衡參數、一前/後平衡參數做爲一第三平衡參數、一後-左/右平衡參數做爲一第四平衡參數及一低頻增強平衡參數做爲一第五平衡參數。 7·—種使用一參數表示以產生一原始多聲道信號之一重建多聲道表示之裝置’該原始多聲道信號具有至少三個原始聲道’該參數表示具有一參數組，該參數組在與至少一下行混音聲道一起使用時允許一多聲道重建，該參數表示包 1334736 括一電平參數’該電平參數被計算，以便由該電平參數所加權之該至少一下行混音聲道的能量等於該等原始聲道之能量的加總，該裝置包括： —電平校正器（902) ’用以使用該電平參數以應用該至少 —下行混音聲道之電平校正’以便可藉由使用在該參數組中之參數實施上行混音以獲得一校正多聲道重建。

8. 如申請專利範圍第7項之裝置，其中該電平參數係在複數個聲道之能量間的比率，以及其中該電平校正器（902)係操作以使用該電平參數來加權該至少一下行混音聲道。 9. 一種在一多聲道信號之一參數表示內產生一電平參數的方法，該多聲道信號具有數個原始聲道，該參數表示包括一參數組，該參數組在與至少一下行混音聲道一起使用時允許一多聲道重建，該方法包括：

計算（900)—電平參數（rM)，該電平參數被計算，以便由該電平參數所加權之該至少一下行混音聲道的能量等於該等原始聲道之能量的加總；以及產生輸出資料，該輸出資料包括該電平參數及該參數組或該電平參數及該至少一下行混音聲道。 10.—種使用一參數表示以產生一原始多聲道信號之—重建多聲道表示的方法，該原始多聲道信號具有至少三個原始聲道，該參數表示具有一參數組，該參數組在與至少一下行混音聲道一起使用時允許一多聲道重建，該參數表示包括一電平參數，計算該電平參數，以便由該電平參數所加權之該至少一下行混音聲道的能量等於該等原始聲道之 1334736 能量的加總，該方法包括：使用該電平參數以實施（9〇2)該至少一下行混音聲道之電平校正’以便可藉由使用在該參數組中之參數實施上行混音以獲得一校正多聲道重建。 11. 一種具有機械可讀取指令之電腦程式的記錄媒體，可在一電腦上執行實施如申請專利範圍第9項或第10項所述之方法。 .

12.—種儲存一參數表示之儲存媒體，其中該參數表示具有一參數組，該參數組在與至少一下行混音聲道一起使用時允許一多聲道重建，該參數表示包括一電平參數，該電平參數被計算，以便由該電平參數所加權之該至少一下行混音聲道的能量等於該等原始聲道之能量的加總，其中該儲存媒體用以在輸入至如申請專利範圍第7項之裝置時控制一多聲道重建。