TW201517021A

TW201517021A - 演示器控制的空間升混合

Info

Publication number: TW201517021A
Application number: TW103124175A
Authority: TW
Inventors: Christian Ertel; Johannes Hilpert; Andreas Hoelzer; Achim Kuntz; Jan Plogsties; Michael Kratschmer
Original assignee: Fraunhofer Ges Forschung
Priority date: 2013-07-22
Filing date: 2014-07-14
Publication date: 2015-05-01
Also published as: ES2734378T3; EP3025521A2; US10085104B2; JP2016527804A; US20180124541A1; WO2015010937A2; SG11201600459VA; US11743668B2; AU2014295285B2; MX359379B; WO2015010937A3; EP2830336A2; BR112016001246A2; AU2014295285A1; CA2918641C; US10341801B2; US20220070603A1; JP6134867B2; US20190281401A1; AR096987A1

Abstract

本發明揭露一種音源解碼器裝置，用於解碼一壓縮輸入音源訊號，該音源解碼器裝置包含：至少一核心解碼器(6、24)，係具有至少一處理器(36、36’)用於根據一處理器輸入訊號(38、38’)產生一處理器輸出訊號(37)，其中處理器輸出訊號(37、37’)之複數個輸出聲道(37.1、37.2、37.1’、37.2’)之數量係高於該處理器輸入訊號(38、38’)之複數個輸入聲道(38.1、38.1’)之數量，每一處理器(36、36’)包含一解相關器(39、39’)以及一混合器(40、40’)，一核心解碼器輸出訊號(13)具有複數個聲道(13.1、13.2、13.3、13.4)且包含該處理器輸出訊號(37、37’)，以及其中該核心解碼器輸出訊號(13)係適用於一參考揚聲器方案(42)；至少一格式轉換器裝置(9、10)，係用以將核心解碼器輸出訊號(13)轉換成一輸出音源訊號(31)，其係適用於一目標揚聲器方案(45)；以及一控制裝置(46)，處理器(36、36’)之混合器(40、40’)獨立控制處理器(36、36’)之解相關器(39、39’)，控制裝置(46)係據此方式控制至少一處理器(36、36’)，其中控制裝置(46)係取決於目標揚聲器方案(45)來控制至少一處理器(36、36’)之複數個解相關器(39、39’)中的至少一個。

Description

演示器控制的空間升混合

本發明係關於一種音源訊號處理，特別是一種將格式轉換成多聲道的音源訊號處理。

格式轉換係描述一種轉換過程，其係利用一定數量的音訊聲道將一特定數量的音訊聲道映射成另一種可適用於播放的呈現。

一種常見的格式轉換的使用方案是將音訊聲道進行降混合。在參考文獻[1]中所給予的範例中指出，其中當無法獲得完整的"家庭劇院"5.1聲道音場系統時，降混合可允許終端使用者重新播放一種5.1來源素材的版本。設備設計用以接受的杜比數位材質，但其只能提供單聲道或立體聲輸出(如可攜式DVD播放器，機上盒等等)，綜合降混合至原始5.1聲道的標準一個或兩個輸出聲道。

另一方面，格式轉換能夠描述一種升混合處理，如升混合立體聲材質去形成一5.1兼容的版本。再者，雙聲道演示亦可視為一種格式轉換。

在下文中，將對壓縮音源訊號的解碼處理的格式轉換之影響進行討論。此處，音頻訊號(mp4檔案)的壓縮呈現係表示利用一種固定揚聲器方案來播放複數個音訊聲道。

音源解碼器以及隨後的格式轉換成所希望的播放格式之間的相互作用可分為三類：

1.此解碼處理無關於最後播放的場境，因此，完整的音源呈現係重新取得且後續應用轉換處理。

2.音源解碼處理侷限於其能力且僅輸出一種固定格式。舉例來說，單聲道收音機接收立體聲調頻節目，或者一單聲道HE-AAC v2解碼器接收一HE-AAC v2位元串流。

3.音源解碼處理了解其最後播放方案並相對應地調整其處理。舉例來說，如參考文獻[2]對MPEG環繞的定義為"針對降低揚聲器配置的擴展聲道解碼"，在這裡，此解碼器減少了輸出聲道的數量。

這些方法的缺點在於非必要的高複雜度以及由解碼素材後續處理的潛在加工品(梳子濾波(comb filtering)下混合之濾波，升混合之揭露)(1)且受限於有關輸出格式的彈性(2及3)。

本發明的目的是提供一種改進音源訊號處理的概念。本發明的目的係由申請專利範圍第1項所揭露的解碼器、申請專利範圍第14項的方法以及申請專利範圍第15項的一電腦程式而解決。

在實施例中，提供一種用於解碼壓縮過之輸入音源訊號之音源解碼器裝置，其包含有一或多個處理器的至少一核心解碼器，所述處理器可根據一處理器輸入訊號產生一處理器輸出訊號，其中所述處理器輸出訊號之複數個輸出聲道之數量係高於所述處理器輸入訊號之複數個輸入聲道之數量，其中每一所述至少一處理器包含一解相關器以及一混合器，其中一核心解碼器輸出訊號具有複數個聲道且包含所述處理器輸出訊號，以及其中所述核心解碼器輸出訊號係適用於一參考揚聲器方案；至少一格式轉換器係用以將核心解碼器輸出訊號轉換成一輸出音源訊號，所述輸出音源訊號適用於一目標揚聲器方案；以及一控制裝置，所述處理器之所述混合器獨立控制所述處理器之所述解相關器，而此控制裝置係依據此方式控制至少一處理器，其中所述控制裝置係取決於所述目標揚聲器方案來控制至少一處理器之複數個解相關器中的至少一個。

所述處理器的目的是建立具有多個非相干/非相干聲道且其數目比處理器輸入訊號的輸入聲道更多的一處理器輸出訊號。更具體地，每個處理器生成的一處理器輸出訊號具有複數個非相干/非相關輸出聲道，例如具有兩個輸出聲道，從具有較小數量輸入聲道的一處理器輸入訊號的正確空間線索，例如從一單聲道的輸入訊號。

此種處理器包含有一解相關器以及一混合器。所述解相關器用於從所述處理器輸入訊號的一聲道產生一解相關器訊號。典型的一解相關器(解相關濾波器)是由一個與頻率有關的預延遲及其後的全通(IIR)部分所組成。

所述解相關器的訊號和所述處理器的輸入訊號的各聲道之後被送入所述混合器。所述混合器利用混合所述解相關訊號及處理器輸入訊號的個別聲道以建立處理器輸出訊號，其中，輔助訊息用於為了合成正確的相干性/相關性以及所述處理器輸出訊號之輸出聲道的正確強度比。

如果所述處理器的輸出聲道被饋送到在不同位置的不同揚聲器上，則所述處理器輸出訊號之輸出聲道即為不相干/不相關的，使得所述處理器的輸出聲道將被認知為獨立音源。

所述格式轉換器可轉換所述核心解碼器輸出訊號以適合在一揚聲器方案的播放，此揚聲器方案可有別於參考的揚聲器方案。此方案稱之為目標揚聲器方案。

在一非相干/非相關形式裡的格式轉換器的特定目標揚聲器方案不需要一處理器的輸出聲道，正確的相關合成將變為毫無關聯。因此，針對這些處理器，所述解相關器可以被忽略。然而，當所述解相關器被關閉時，通常這些混合器仍然保持完全可操作，其結果是，即使在解相關器關閉時，仍可產生所述處理器輸出訊號的輸出聲道。

必須指出的地方在於，在這種情況下，處理器的輸出訊號的聲道是相干/相關但不相同的。這意味著，所述處理器的輸出訊號的聲道可進一步獨立地從所述處理器的每一個其他的下游進行處理，舉例來說，為了設置所述輸出音源訊號的聲道層級，強度比和/或其它的空間訊息可用於格式轉換器。

由於解相關濾波需要大量的計算複雜度，整體解碼的工作量可以由所提出的解碼器裝置大幅降低。

雖然解相關器，尤其是他們的全通濾波器被設計成在某種程度上可將主觀音質的影響降到最低，但它總無法避免能被聽見的加工品產生，例如由於相位失真所瞬變的噪音或某些頻率元件的“振鈴”。因此，因為避免解相關過程的副作用，所以可實現音源音質的改進。

值得注意的是，此處理應僅被應用於其中解相關所應用的頻帶。而殘餘編碼方式使用的頻帶將不會受到影響。

在較佳的實施例中，所述控制裝置係用以停用至少一處理器，使得所述處理器輸入訊號之複數個輸入聲道係以一未處理形式提供至所述處理器輸出訊號之複數個輸出聲道。透過此特徵，不同數量的聲道可以減少。而這可能是有益處的，即如果目標揚聲器方案包含複數個揚聲器，此所述複數個揚聲器之數據遠小於參考揚聲器方案的數目。

在較佳的實施例中，處理器可為一輸入兩輸出的解碼工具(OTT)，其中所述解相關器係從所述處理器輸入訊號的至少一聲道進行解相關而產生一解相關訊號，其中該混合器係根據一聲道位準差(CLD)訊號及/或聲道間相干(ICC)訊號混合所述處理器輸入訊號以及所述解相關訊號，使得所述處理器輸出訊號組成兩個不相干輸出聲道。這樣一個輸入到輸出解碼工具允許建立具有一對聲道的一處理器輸出訊號，所述對聲道在相對於彼此可簡單地具有正確的振幅和一致性。

在一些實施方案中，所述控制裝置係藉由設定所述解相關訊號至零或是避免所述混合器將所述解相關訊號混合至所述個別處理器之所述處理器輸出訊號以關閉所述複數個處理器之一的所述解相關器。此兩種方式均可輕易的關閉此解相關器。

在一較佳實施例中，所述核心解碼器係為一音樂以及語音的解碼器，例如一USAC解碼器，其中複數個處理器的至少一處理器之處理器輸入訊號包含一聲道對單元，例如USAC聲道對單元。在這種情況下，如果對於當前的目標揚聲器方案不是必須的，則聲道對單元的解碼將可能被省略。以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。

在一些實施方案中，核心解碼器係為參數化物件編碼器，例如一SAOC解碼器。以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有進一步地降低。

在一些實施方案中，一參考揚聲器方案之揚聲器數量係高於所述目標揚聲器方案之揚聲器數量。在這種情況下，格式轉換器可以降混合核心解碼器輸出訊號到一音源的輸出音源訊號，其中所述輸出聲道的數量係低於所述核心解碼輸出訊號之輸出聲道的數量。

因此，降混合描述了當所述參考揚聲器方案裡的揚聲器數目高於目標揚聲器方案之數目，在此情況下，一個或多個處理器的輸出聲道通常並不需要非相干訊號之形式。若此處理器的解相關器被關閉，則以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。

在一些實施方案中，所述控制裝置係針對所述處理器輸出訊號之所述複數個輸出聲道之至少一第一個以及所述處理器輸出訊號之所述複數個輸出聲道之第二個，來關閉所述解相關器，取決於所述目標揚聲器方案，如果所述複數個輸出聲道之所述第一個以及所述複數個輸出聲道之該第二個係混合成所述輸出音源訊號之共同聲道，則提供一第一比例因數及/或一第二比例因數，其中所述第一比例因數係使所述處理器輸出訊號的所述複數個輸出聲道的第一個混合至所述共同聲道，並使其能超過一第一門檻，所述第二比例因數係使所述處理器輸出訊號的所述複數個輸出聲道之第二個混合至所述共同聲道，並使其能超過一第二門檻。

如果將所述輸出聲道的第一個與所述輸出聲道的第二個混合到所述輸出音源訊號的一共同聲道，在所述核心解碼器所針對第一輸出聲道及第二輸出聲道的解相關也可以省略。以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。此方式可避免不需要的解相關處理。

在更進一步的實施例中，可預測用於混合所述處理器輸出訊號的所述輸出頻道的第一個之第一比例因素。同樣地，也可使用用於混合所述處理器輸出訊號的所述輸出頻道的第二個之第二比例因素。此處，比例因素是一個數值，其通常介於0和1之間，此比例因素描述了在原始聲道的訊號強度(所述處理器輸出訊號的輸出聲道)以及混合聲道裡的結果訊號的信號強度(所述輸出音源訊號的共同聲道)間的比率。此比例因素可包含一降混合矩陣。如果所述第一輸出聲道的至少一確定部份和/或所述第二輸出聲道的至少一確定部份係混合到所述共同聲道，藉由使用第一門檻，所述第一比例因素和/或藉由使用第二門檻的所述第二比例因素，可以確保所述解相關的第一輸出聲道和第二輸出聲道為被關閉。舉來來說，此門檻可以被設定為0。

在較佳實施方案中，所述控制裝置係從所述格式轉換器接收一規則組，取決於所述目標揚聲器方案，所述格式轉換器所述處理器輸出訊號之所述複數個聲道混合至所述輸出音源訊號之所述複數個聲道，其中所述控制裝置係根據所接收之規則組以控制處理器。本文處理器的控制可包含所述解相關器和/或所述混合器的控制。透過此特徵，可以確保所述控制裝置能以精確的方式控制處理器。

透過所述規則組，由一處理器的輸出聲道及之後的格式轉換步驟所結合的訊息可提供給控制裝置。由所述控制裝置接收到的規則通常為一降混合矩陣，此降混合矩陣表示了由所述格式轉換器所採用的每個解碼器輸出聲道至每個音源輸出聲道之比例因素。在下一步驟控制解相關的控制規則中，可以由控制裝置從所述降混合規則進行計算。這種控制規則可以被包含在所謂的混合矩陣，其可透過根據目標揚聲器方案而從控制裝置中產生。然後，所述控制規則可以被使用於控制所述解相關器及/或混合器。因此，所述控制裝置可被適用於不同的目標揚聲器方案且不須人工介入。

在較佳的實施方式中，在所述核心解碼器輸出訊號之非相干聲道之數量相同於所述目標揚聲器方案之揚聲器之數量的情況下，所述控制裝置係用以控制核心解碼器之解相關器。在這種情況下，計算的複雜度以及來自解相關處理及降混合處理所產生的加工品可以有顯著地降低。

在實施例中，格式轉換器包含一降混合器，用以降混合核心解碼器輸出訊號。所述降混合器使輸出立體聲訊號直接地被產生。然而，在一些實施例中，降混合器可以被連接至格式轉換器之另一元件，然後由所述格式轉換器產生輸出立體聲訊號。

在一些實施例中，格式轉換器包含一雙聲道轉譯器，其一般被用以將一多聲道訊號轉換成一立體聲訊號，並且適用於立體聲耳機的使用上。所述雙聲道轉譯器產生被饋入此雙聲道轉譯器之訊號之一雙聲道降混合，使得此訊號之每個頻道係由一個虛擬音源表示。此處理可以被進行語調逐訊框於一正交鏡像濾波器(QMF)域。所述雙聲道根據測量之雙聲道室進行脈衝響應以及引起極高的計算複雜度，此計算複雜度有關於被饋入雙聲道轉譯器之訊號之複數個非相干/非相關聲道。

在較佳的實施方式中，所述核心解碼器輸出訊號被饋入雙聲道轉譯器且作為一雙聲道轉譯器輸入訊號。在此情況下，所述控制裝置通常被用以控制核心解碼器之處理器，使用此方法將使核心解碼器輸出訊號之複數個聲道更適合作為耳機之複數個揚聲器。這可能是被需要的，像是例如為了產生一三維的音源效果，雙聲道轉譯器可以使用被包含於聲道之空間的聲音訊息以適合被饋入耳機之立體聲訊號之頻率特性。

在一些實施例中，所述降混合器之一降混合器輸出訊號被饋入雙聲道轉譯器且作為一雙聲道轉譯器輸入訊號。如果所述降混合器之輸出立體聲訊號被饋入雙聲道轉譯器，其輸入訊號之聲道數量係明顯的小於饋入雙聲道轉譯器之核心解碼器輸出訊號之聲道數量，藉此降低計算的複雜度。

此外，解碼一壓縮輸入音源訊號之方法係包含下列步驟：提供具有一或多個處理器之至少一個核心解碼器，其用以根據一處理器輸入訊號來產生一處理器輸出訊號，其中所述處理器輸出訊號之輸出聲道之數量高於處理器輸入訊號之輸入聲道之數量，其中每個一或多個處理器係包含一非相關器及一混合器，其中一核心解碼器輸出訊號具有複數個聲道係包含處理器輸出訊號，以及其中核心解碼器輸出訊號適合應用於一參考揚聲器方案；提供至少一格式轉換器用以將核心解碼器輸出訊號轉換成適合一目標揚聲器方案之一輸出音源訊號；以及提供一控制裝置用以控制至少一處理器，在此方法下，所述處理器之解相關器可以獨立於此處理器之混合器被控制，其中控制裝置根據提供的目標揚聲器方案用以控制一或多個處理器之至少一個解相關器。此外，當執行於所提供之一電腦或訊號處理器時，一電腦程式應用於實行上述提供之方法。

1‧‧‧音源解碼器、音源編解碼器系統

2‧‧‧音源解碼器、音源編解碼器系統、解碼器、音源解碼器裝置、解碼器裝置、多聲道解碼器

3‧‧‧編碼器、轉譯器/混合器

4‧‧‧通道訊號、聲道訊號、聲道物件輸入場景、聲道場景、揚聲器聲道訊號、訊號、輸入聲道、22.2聲道訊號、通道

5‧‧‧物件訊號、物件、聲道物件輸入場景、離散物件訊號、訊號、輸入聲道、音源物件、物件/頻道訊號、物件/聲道訊號、元件

6‧‧‧解碼器、核心解碼器、USAC解碼器

7‧‧‧輸出音源訊號、音源位元流、3D立體聲位元流

8‧‧‧轉譯器、混合器

9‧‧‧轉譯器、後處理模組、雙聲道轉譯器、雙聲道轉譯器模組、格式轉換器裝置、格式轉換器、控制裝置、格式轉換、格式轉換方案、格式轉換模組、格式轉換器處理區塊、立體聲演示器

10‧‧‧轉譯器、後處理模組、揚聲器轉譯器模組、揚聲器轉譯器、格式轉換器、格式轉換器裝置、控制裝置、降混合器、格式轉換、格式轉換方案、格式轉換模組、格式轉換器處理區塊、立體聲演示器

11‧‧‧物件、內容、波形、已預先轉譯的物件

12‧‧‧物件、物件波形、輸出聲道、轉譯的物件波形、已轉譯的物件

13‧‧‧聲道、產生波形、多聲道音源材料、輸入聲道、聲道配置、輸入格式、核心解碼器輸出訊號、雙聲道轉譯器輸入訊號、通道、混合器輸出訊號

13.1、13.2‧‧‧聲道、輸出聲道、解碼器輸出聲道、解相關聲道

13.3、13.4‧‧‧聲道、輸出聲道、解碼器輸出聲道

13.5、13.6‧‧‧聲道、輸出聲道

13.7、13.8‧‧‧輸出聲道、聲道

13.9、13.10‧‧‧輸出聲道

14‧‧‧物件元資料、物件降混合訊號、訊號、輸入聲道

15‧‧‧轉譯器/混合器

16‧‧‧聲道場景、聲道、預先轉譯的訊號、預先轉譯的物件

17‧‧‧SAOC資料、參數化物件波形、物件訊號、降混合聲道、SAOC傳輸聲道

18‧‧‧解碼的物件、物件

19‧‧‧壓縮的物件元資料訊息、物件元資料、壓縮物件元資料

20‧‧‧壓縮的物件元資料訊息、輔助訊息、物件元資料、已壓縮的OAM

21‧‧‧接收器/轉譯器、物件轉譯器、區塊

22‧‧‧SAOC參數、參數化訊息、參數化資料

23‧‧‧SAOC參數、壓縮的物件元資料訊息、參數化資料、參數化訊息

24‧‧‧SAOC轉譯器、解碼器、SAOC解碼器、參數化物件編碼器、SAOC解碼器、核心解碼器

25‧‧‧SAOC編碼器

26‧‧‧SAOC傳輸聲道

27‧‧‧輸出立體聲場景、物件、轉譯的物件波形、已轉譯的物件

28‧‧‧物件元資料編碼器

29‧‧‧OAM解碼器、物件元資料解碼器

30‧‧‧內容、波形

31‧‧‧播放格式、聲道、輸出聲道、輸出格式、輸出音源訊號、揚聲器訊號、音源輸出訊號

31.1‧‧‧聲道、輸出聲道、共同聲道、音源輸出聲道

31.2‧‧‧聲道、輸出聲道、共同聲道、音源輸出聲道

31.3‧‧‧聲道、輸出聲道、共同聲道、音源輸出聲道

31.4‧‧‧共同聲道

32‧‧‧降混合器、降混過程、在QMF域的DMX處理

33‧‧‧DMX配置器

34‧‧‧混合器輸出佈局

35‧‧‧撥放器佈局

36‧‧‧處理器、第一處理器、一輸入兩輸出的解碼的工具、輸入到輸出解碼工具、OTT解碼區塊、OTT之輸出聲道解碼區塊

36’‧‧‧處理器、第二處理器、解相關器

36”、36'''‧‧‧處理器

37、37’‧‧‧處理器輸出訊號、輸出訊號

37.1、37.2‧‧‧輸出聲道、聲道

37.1’‧‧‧輸出聲道、聲道、第一輸出聲道

37.2’‧‧‧輸出聲道、聲道、第二輸出聲道

38、38’‧‧‧輸入音源訊號、處理器輸入訊號、單聲道輸入訊號、處理器輸入訊號

38.1、38.1’‧‧‧輸入聲道、聲道

39、39’、39”、39'''‧‧‧解相關器

40、40’‧‧‧混合器、混合

42‧‧‧參考揚聲器方案、5.1參考揚聲器方案、9.1參考揚聲器方案

42’‧‧‧參考揚聲器方案

45‧‧‧目標揚聲器方案、揚聲器方案、5.1目標揚聲器方案、目標方案

46‧‧‧控制裝置、矩陣計算機、解相關訊號

47‧‧‧規則組

48‧‧‧解相關訊號、處理器輸入訊號、解相關音源訊號

49‧‧‧聲道位準差訊號

50‧‧‧聲道間相干訊號

C‧‧‧中心前方揚聲器聲道、聲道

CS‧‧‧中心環繞揚聲器、中心環繞揚聲器聲道

CS’、CS”‧‧‧中心環繞揚聲器聲道、聲道

L‧‧‧左前方揚聲器、左前方揚聲器聲道、聲道

L’‧‧‧聲道、立體聲聲道、左前方揚聲器聲道

L”‧‧‧左前方揚聲器通道

LB、RB‧‧‧雙聲道降混

LC‧‧‧左前方中心揚聲器

LFE‧‧‧低頻率增強揚聲器聲道

LS‧‧‧左環繞揚聲器、左環繞揚聲器聲道、聲道

LS’、LS”‧‧‧左環繞揚聲器聲道

LVR‧‧‧左環繞後方垂直高度

R‧‧‧右前方揚聲器、右前方揚聲器聲道、聲道

R’‧‧‧聲道、立體聲聲道、右前方揚聲器聲道

R”‧‧‧右前方揚聲器聲道

RC‧‧‧右前方中心揚聲器聲道

RS‧‧‧右環繞揚聲器、右環繞揚聲器聲道、聲道

RS’、RS”‧‧‧右環繞揚聲器聲道

RVR‧‧‧右環繞後方垂直高度聲道

圖1係顯示根據本發明之一解碼器之一較佳實施例之一方塊圖。

圖2係顯示根據本發明之一解碼器之一第二較佳實施例之一方塊圖。

圖3係顯示一概念上的處理器，其中解相關器被開啟。

圖4係顯示一概念上的處理器，其中解相關器被關閉。

圖5係顯示格式轉換器及解碼器之間的一交互作用。

圖6係顯示根據本發明之一解碼器之一實施例之一詳細方塊圖，其中係產生5.1聲道訊號。

圖7係顯示根據本發明之一解碼器之圖6之實施例之一詳細方塊圖，其中所述之5.1聲道被一2.0聲道訊號降混。

圖8係顯示根據本發明之一解碼器之圖6之所述實施例之一詳細方塊圖，其中所述之5.1聲道被降混成4.0聲道訊號。

圖9係顯示根據本發明之一解碼器之一實施例之一詳細方塊圖，其中係產生9.1聲道訊號。

圖10係顯示根據本發明之一解碼器之圖9之所述實施例之一詳細之一方塊圖，其中9.1聲道訊號被降混成4.0聲道訊號。

圖11係顯示一3D音源解碼器之一概念描述之一示意性方塊圖。

圖12係顯示一3D音源解碼器之一概念描述之一示意性方塊圖。

圖13係顯示一格式轉換器之一概念描述之一示意性方塊圖。

在描述本發明之實施例之前，提供更多本領域之編解碼器之系統之背景知識。

圖11係顯示一3D音源解碼器1之一概念描述之一示意性方塊圖，其中圖12係顯示一3D音源解碼器2之一概念描述之一示意性方塊圖。

所述3D音源編解碼器系統1及2可以根據一MPEG-D聯合語音及音源編碼(USAC)的編碼器3應用於聲道訊號4及物件訊號5之編碼，以及根據一MPEG-D聯合語音及音源編碼(USAC)的解碼器6應用於編碼器3之輸出音源訊號7之解碼。為了增加大量的物件5之編碼效率，採用空間音源物件編碼之技術。三種型態之轉譯器8、9及10係執行將物件11及12轉譯至聲道13以及將聲道13轉譯至耳機或一不同的揚聲器方案。

當物件訊號明確地被傳輸或使用SAOC參數化編碼，相對應的物件元資料(OAM)14訊息被壓縮且被多工處理成3D音源位元流7。

所述預先轉譯器/混合器15在編碼之前，係可以被選擇性使用於將一聲道物件輸入場景4及5轉換成一聲道場景4及16，其功能相同於下面所描述之物件轉譯器/混合器15。

物件5之預先轉譯係確認在編碼器3之輸入端的確定性訊號熵，所述編碼器3基本上獨立於複數個同步動態物件訊號5。物件訊號5具有預先轉譯，而不需要物件元資料14傳輸。

離散物件訊號5被轉譯至聲道佈局，所述編碼器3用以使用此聲道佈局。對於每個聲道16的物件5之權重係從相關聯的物件元資料14取得。

所述核心編解碼器可以根據MPEG-D USAC技術，應用於揚聲器聲道訊號4、離散物件訊號5、物件降混合訊號14及預先轉譯的訊號16。此MPEG-D USAC技術係根據輸入聲道及物件配置之幾何及語意訊息，產生聲道及其物件映射訊息，用以處理訊號4、5及14之多功能之編碼。所述映射訊息係描述輸入聲道4及物件5如何被映射至USAC聲道元件，也就是說被映射至雙聲道元件(CPEs)、單聲道元件(SCEs)、低頻率增強以及被傳輸至解碼器6之相對應的訊息。

所有額外的酬載像是SAOC資料17或物件元資料14可以被傳輸通過延伸元件，並且可以在編碼器3之速率控制被考慮。

物件5之編碼可以使用不同的方法，此方法取決於應用於轉譯器之速率/失真需求及交互作用的需求。下列物件編碼的變化是可能的：

預先轉譯的物件16：在編碼之前，物件訊號5被預先轉譯及混合至22.2聲道訊號4，例如預先轉譯及混合至22.2聲道訊號4。

離散物件波形：物件5作為單聲道之波形被供應至編碼器 3。除了聲道訊號4以外，所述編碼器3使用單聲道元件(SCEs)以傳輸物件5。解碼的物件18被轉譯及混合於接收端。壓縮的物件元資料訊息19及20被並排地傳輸至接收器/轉譯器21。

參數化物件波形17：使用SAOC參數22及23之裝置來描述物件屬性及其彼此之間的關係，所述物件訊號17之下降混合使用USAC來編碼，使參數化訊息22被並列地傳輸。根據複數個物件5及整體的資料速率，選擇複數個降混合聲道17，以傳輸壓縮的物件元資料訊息23至SAOC轉譯器24。

用於物件訊號5的SAOC編碼器25以及解碼器24係根據MPEG SAOC技術。根據較少量的傳輸聲道及額外的參數化資料22及23，所述系統能夠重新創建、修正及轉譯複數個音源物件5，例如物件位準差異性(OLD)、物件間的相關性(IOC)及降混合增益(DMG)。額外的參數化資料22及23係顯示一資料速率明顯低於所有物件5個別傳輸所需要的資料速率，這使得編碼效率非常高。

所述SAOC編碼器25輸入所述物件/頻道訊號5作為單聲道的波形，並且輸出所述參數化訊息22(其被填充至3D立體聲位元流7的)及SAOC傳輸聲道17(其被使用單聲道元件編碼並且被傳輸的)。所述SAOC解碼器24從已解碼的SAOC傳輸聲道26及參數化訊息23重建物件/聲道訊號5，並且根據撥放佈局產生所述輸出立體聲場景27及解壓縮的物件元資料訊息20，以及選擇性使用於使用者交互的訊息上。

對於每個元件5，所述相關聯的物件元資料14具體指定幾何位置以及在三維空間中的物體體積，藉由在時間及空間內的物件屬性之量化，一物件元資料編碼器28有效率地編碼所述物件元資料。壓縮的物件元資料(cOAM)19被傳輸至接收器作為輔助訊息(side information)20，所述輔助訊息可以使用一OAM解碼器29來解碼。

物件轉譯器21根據給予的播放格式，利用壓縮的物件元資料20來產生物件波形12。每個物件5根據其物件元資料19及20被轉譯至特定的輸出聲道12。區塊21之輸出從部分結果之總值所產生。如果根據內容11及30之兩個聲道以及離散的/參數化的物件12及27被解碼，在一混合器8輸出產生波形13之前(或在饋送產生的波形至一後處理模組9及10例如雙聲道轉譯器9或揚聲器轉譯器模組10之前)，兩個聲道以及轉譯的物件波形12及27根據波形11及30被混合。

所述雙聲道轉譯器模組9產生所述多聲道音源材料13之一雙聲道降混合，使得每個輸入聲道13係由一虛擬音源所表示。此處理被進行語調逐訊框於一正交鏡像濾波器(QMF)域。所述雙聲道係根據測量之雙聲室進行脈衝響應。圖13係顯示所述揚聲器轉譯器10，對於在傳輸的聲道配置13及所期望的播放格式31之間的轉換有更詳細的描述，在下文中因此將所述揚聲器轉譯器稱作“格式轉換器”10。所述格式轉換器10執行轉換以降低複數個輸出聲道31，亦即所述格式轉換器藉由一降混合器32產生降混。所述DMX配置器33自動地產生最佳化的降混矩陣，應用於給予的輸入格式13及輸出格式31之結合，並且在一降混過程32中採用所述降混矩陣，其中一混合器輸出佈局34及一撥放器佈局35被使用。所述格式轉換器10允許應用於標準揚聲器配置以及非標準揚聲器位置之隨機的配置。

圖1係根據本發明顯示一解碼器2之一最佳實施例之一方塊圖。

所述音源解碼器裝置2用以解碼一壓縮的輸入音源訊號38及38’，所述輸入音源訊號38及38’係包含至少一核心解碼器6其具有一或多個處理器36及36’，用以根據所述處理器輸入訊號38及38’產生一處理器輸出訊號37及37’，其中處理器輸出訊號37及37’之輸出聲道37.1、37.2、37.1’及37.2’之數量高於處理器輸入訊號38及38’之輸入聲道38.1及38.1’之數量，其中一或多個處理器36及36’的每一個包含一解相關器39及39’以及一混和器40及40’，其中一核心解碼器輸出訊號13具有複數個聲道13.1、13.2、13.3及13.4係包含處理器輸出訊號37及37’，且其中核心解碼器輸出訊號13適用於一參考揚聲器方案42。

更進一步，所述音源解碼器裝置2係包含至少一格式轉換器裝置9及10，用以將所述核心解碼器輸出訊號13轉換成一輸出音源訊號31，此輸出音源訊號適用於一目標揚聲器方案45。

此外，音源解碼器裝置2更包含一控制裝置46，用以控制至少一處理器36及36’，在這種方法下，所述處理器36及36’之所述解相關器39及39’可以從此處理器36及36’之混合器40及40’被獨立地控制，其中控制裝置46根據提供的所述目標揚聲器方案，用以控制一或多個處理器36及36’之至少一個解相關器39及39’。

所述處理器36及36’之目的係為產生一處理器輸出訊號37及37’其具有多個非相干/非相關的聲道37.1及37.2，所述37.1及37.2之聲道之數量高於處理器輸入訊號38之輸入聲道38.1及38.1’之數量。更特別的是，每個處理器36及36’可以產生處理器輸出訊號37其具有複數個非相干/非相關輸出聲道37.1及37.2，所述37.1及37.2具有來自一處理器輸入訊號38及38’之正確空間線索，所述38及38’具有較少的輸入聲道38.1及38.1’之數量。

在圖1之實施例中，一第一處理器36具有兩個輸出聲道37.1及37.2，一第二處理器36’具有兩個輸出聲道37.1’及37.2’，所述37.1及37.2從一單聲道輸入訊號38及一第二處理器36’產生，而所述37.1’及37.2’從一單聲道輸入訊號38’產生。

所述格式轉換器裝置9及10可轉換所述核心解碼器輸出訊號13以適合在一揚聲器方案45的播放，所述揚聲器方案有別於參考揚聲器方案42且被稱之為目標揚聲器方案。

在圖1之實施例中，所述參考揚聲器方案42係包含一左前方揚聲器(L)、一右前方揚聲器(R)、一左環繞揚聲器(LS)及一右環繞揚聲器(RS)。更進一步，目標揚聲器方案45係包含一左前方揚聲器(L)、一右前方揚聲器(R)及一中心環繞揚聲器(CS)。

在一非相干/非相關形式內之格式轉換器裝置9及10的特定目標揚聲器方案45不需要一處理器36及36’之輸出聲道37.1、37.2、37.1’及37.2’，正確的相關合成將變為毫無關聯。因此，針對這些處理器36及36’，所述解相關器39及39’可以被忽略。然而，當所述解相關器被關閉時，通常這些混合器40及40’仍然保持完全可操作地，即使在解相關器關閉時，所述處理器輸出訊號之輸出聲道37.1、37.2、37.1’及37.2’仍可被產生。

必須指出的地方在於，在這種情況下，處理器的輸出訊號 37及37’的聲道37.1、37.2、37.1’及37.2’係相干/相關但不相同的。這意味著，所述處理器36及36’的輸出訊號37及37’的聲道37.1、37.2、37.1’及37.2’可進一步獨立於處理器之每一個其它的下方來處理，舉例來說，強度比和/或其它的空間訊息可被用於格式轉換器，此格式轉換器裝置9及10係為了設定所述輸出音源訊號31的聲道31.1,31.2及31.3層級。

由於解相關濾波需要大量的計算複雜度，整體解碼的工作量可以被所提出的解碼器裝置2大幅降低。

雖然解相關器39及39’，尤其是他們的全通濾波器被設計成在某種程度上可將主觀音質的影響降到最低，但它總無法避免此發出聲音的加工品被製備，例如由於相位失真所瞬變的噪音或某些頻率元件的“振鈴”。因此，因為避免了解相關過程的副作用，所以可以實現音源音質的改進。

值得注意的是，此處理應僅被應用於其中解相關所應用的頻帶，且其中殘餘編碼方式使用的頻帶將不會受到影響。

在較佳的實施方式中，所述控制裝置46係用以停用至少一處理器36及36’，使得所述處理器輸入訊號之複數個輸入聲道38.1及38.1’係以一未處理形式饋入至所述處理器輸出訊號37及37’之複數個輸出聲道37.1、37.2、37.1’及37.2’。藉由此特徵，聲道的數目可以係不同的數量且可以被減少，這可能是有益處的，即如果目標揚聲器方案45包含複數個揚聲器，此所述複數個揚聲器之數據遠小於參考揚聲器方案42的數目。

在一較佳實施例中，所述核心解碼器6係為一音樂以及語音兩者的解碼器6，例如一USAC解碼器6，其中複數個處理器的至少一處理器之處理器輸入訊號38及38’包含一聲道對單元，例如USAC聲道對單元。在這種情況下，如果對於當前的目標揚聲器方案45不是必須的，則聲道對單元的解碼將可能被省略。以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。

在一些實施方案中，核心解碼器係為參數化物件編碼器24，例如一SAOC解碼器24。以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有進一步地降低。

在一些實施方案中，一參考揚聲器方案42之揚聲器數量係高於所述目標揚聲器方案45之揚聲器數量。在這種情況下，格式轉換器9及10可以降混合核心解碼器輸出訊號13到一音源的輸出音源訊號31，其中所述輸出聲道31.1、31.2及31.3的數量係低於所述核心解碼器輸出訊號13之輸出聲道13.1、13.2、13.3及13.4的數量。

因此，降混合描述了當所述參考揚聲器方案42裡的揚聲器數目高於目標揚聲器方案之數目，在此情況下，一個或多個處理器36及36’的輸出聲道37.1、37.2、37.1’及37.2’通常並不需要非相干訊號之形式。在圖1中，存在所述核心解碼器輸出訊號13之四個解碼器輸出聲道13.1、13.2、13.3及13.4，但只存在所述音源輸出訊號31之三個輸出聲道31.1、31.2及31.3。若此處理器36及36’的解相關器39及39’被關閉，則以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。

其原因解釋如下，在圖1中，所述解碼器輸出聲道13.3及13.4在非相干訊號之形成是不被需要的。因此，控制裝置46關閉解相關器39’，其中解相關器39及混和器40及40’被開啟。

在一些實施方案中，所述控制裝置46係針對所述處理器輸出訊號37及37’之所述複數個輸出聲道之至少一第一個37.1’以及所述處理器輸出訊號37及37’之所述複數個輸出聲道37.2及37.2’之第二個，來關閉所述解相關器39’。取決於所述目標揚聲器方案45，如果所述複數個輸出聲道之所述第一個37.1’以及所述複數個輸出聲道之所述第二個37.2係混合成所述輸出音源訊號31之一共同聲道31.3，則提供一第一比例因數及/或一第二比例因數，其中所述第一比例因數係使所述處理器輸出訊號37’的所述複數個輸出聲道的第一個37.1’混合至所述共同聲道31.3，並使其能超過一第一門檻，所述第二比例因數係使所述處理器輸出訊號37’的所述複數個輸出聲道之第二個37.2’混合至所述共同聲道31.3，並使其能超過一第二門檻。

在圖1中，所述解碼器輸出聲道13.3及13.4被混合於輸出音源訊號31之一共同聲道31.3。所述第一比例因數及第二比例因數可以是0.7071。作為本實施例之一第一門檻及一第二門檻被設定為0，其解相關器 39’被關閉。

如果將所述輸出聲道37.1’的第一個與所述輸出聲道的第二個37.2’混合到所述輸出音源訊號31的一共同聲道31.3，在所述核心解碼器6所針對第一輸出聲道37.1’及第二輸出聲道37.2’的解相關也可以省略。以這種方式計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。此方式可避免不需要的解相關處理。

在更進一步的實施例中，用於混合所述處理器輸出訊號37’的所述輸出頻道的第一個37.1’之第一比例因數可被預測到。同樣地，用於混合所述處理器輸出訊號37’的所述輸出頻道的第二個37.2之第二比例因數也會被使用到。此處，比例因數是一個數值，其通常介於0和1之間，此比例因數描述了在原始聲道的訊號強度(所述處理器輸出訊號37’的輸出聲道37.1’及37.2’)以及混合聲道裡的結果訊號的信號強度(所述輸出音源訊號31的共同聲道31.1)間的比率。此比例因數可包含一降混合矩陣。如果所述第一輸出聲道37.1’的至少一確定部份和/或所述第二輸出聲道37.2’的至少一確定部份係混合到所述共同聲道31.3，藉由使用第一門檻，所述第一比例因數和/或藉由使用第二門檻的所述第二比例因數，可以確保所述解相關的第一輸出聲道37.1’和第二輸出聲道37.2’為被關閉。舉例來說，此門檻可以被設定為0。

在圖1之實施例中，所述解碼器輸出聲道13.3及13.4被混合於所述輸出音源訊號31之一共同聲道31.3。所述第一比例因數及第二比例因數可以是0.7071。作為本實施例之一第一門檻及一第二門檻被設定為0，其解相關器39’被關閉。

在較佳實施方案中，所述控制裝置46係從所述格式轉換器9及10接收一規則組47，取決於所述目標揚聲器方案45，所述格式轉換器9及10所述處理器輸出訊號37及37’之所述複數個聲道37.1、37.2、37.1’及37.2’混合至所述輸出音源訊號31之所述複數個聲道31.1、31.2及31.3，其中所述控制裝置46係取決於所接收之規則組47以控制處理器36及36’。本文處理器36及36’的控制可包含所述解相關器39及39’和/或所述混合器40及40’的控制。藉由此特徵，可以確保所述控制裝置46能以精確的方式控制處理器36及36’。

藉由所述規則組47，由一處理器36,36’的輸出聲道及之後的格式轉換步驟所結合的訊息可提供給控制裝置9及10。由所述控制裝置46接收到的規則通常為一降混合矩陣，此降混合矩陣表示了由所述格式轉換器所採用的每個核心解碼器輸出聲道13.1、13.2、13.3及13.4至每個音源輸出聲道31.1、31.2及31.3之因素。在下一步驟控制解相關的控制規則中，可以由控制裝置9及10從所述降混合規則進行計算這種控制規則。所述控制規則可以被包含在所謂的混合矩陣，其可藉由根據目標揚聲器方案45而從控制裝置46中產生。所述控制規則接著可以被使用於控制解相關器39及39’及/或混合器40及40’。因此，控制裝置46可被適用於不同的目標揚聲器方案45且無需人力介入。

在圖1中，所述規則組47可以包含解碼器輸出聲道13.3及13.4被混合至所述輸出音源訊號31之一共同聲道31.3之訊息，此訊息可以被執行於圖1之實施例中，並且在所述參考揚聲器方案42中作為所述左環繞揚聲器及右環繞揚聲器，而在所述目標揚聲器方案45中作為一中心環繞揚聲器。

在較佳的實施方式中，在核心解碼器輸出訊號13之複數個非相干聲道相同於目標揚聲器方案45之複數個揚聲器的情況下，控制裝置46係用以控制核心解碼器6之解相關器39及39’。在這種情況下計算的複雜度、從解相關處理以及降混合處理所產生的加工品可以有顯著地降低。

舉例來說，在圖1中存在三個非相干聲道，所述第一非相干聲道係為解碼器輸出聲道13.1、所述第二非相干聲道係為解碼器輸出聲道13.2以及所述第三非相干聲道係為每一個解碼器輸出聲道13.3及13.4。忽略解相關器39’時，作為所述解碼器輸出聲道13.3及13.4係為相干聲道。

在實施例中，例如在圖1之實施例，所述格式轉換器裝置9及10係包含一降混合器10用於降混核心解碼器輸出訊號13。如圖1所示，所述降混合器10可以直接地產生輸出音源訊號31。然而，在一些實施例中，所述降混合器10可以被連接至所述格式轉換器10之另一元件，例如一雙聲道轉譯器9其接著產生輸出音源訊號31。

圖2係顯示根據本發明之一解碼器之一第二實施例之一方塊圖。在下文中僅針對不同於第一實施例的差異進行描述。在圖2中，格式轉換器9及10包含一雙聲道轉譯器9，其一般被用以將一多聲道訊號轉換成一立體聲訊號且適用於立體聲耳機的使用上。雙聲道轉譯器9產生被饋入此雙聲道轉譯器9之多聲道訊號之一雙聲道降混LB及RB，以使此訊號之每個聲道係由一個虛擬音源表示。所述多聲道訊號可能有多達32個頻道以上的聲道。然而，為了簡化起見，在圖2中係顯示一四聲道訊號，此處理或許會產生位於一正交鏡像濾波器(QMF)域之語調逐訊框。雙聲道立體聲根據測量之雙聲道室而脈衝響應以及產生極高計算的複雜度，並且有關於被饋入雙聲道轉譯器之訊號之複數個非相干/非相關聲道。為了降低計算的複雜度，可以關閉至少一解相關器39及39’。

在圖2的實施方式中，核心解碼器輸出訊號13被饋入雙聲道轉譯器9且作為一雙聲道轉譯器輸入訊號13。在此情況下，控制裝置46通常被用以控制核心解碼器6之處理器，使用此方法將使核心解碼器輸出訊號13之複數個聲道13.1、13.2、13.3及13.4更適合作為耳機之複數個揚聲器。這可能是被需要的，像是例如為了產生一三維的音源效果，雙聲道轉譯器9可以使用被包含於聲道之空間的聲音訊息以適合立體聲訊號之頻率特性，所述之立體聲訊號被饋入耳機。

在實施例中並未顯示所述之降混合器10之一降混合器輸出訊號被饋入雙聲道轉譯器9作為一雙聲道轉譯器9輸入訊號。如果所述降混合器10之輸出立體聲訊號饋入雙聲道轉譯器9，其輸入訊號之聲道數量係明顯的小於饋入雙聲道轉譯器9之核心解碼器輸出訊號13，這使得計算的複雜度降低。

如圖3及圖4所示，在最佳實施例中，所述處理器36係一輸入兩輸出的解碼的工具(OTT)36。

如圖3所示，所述處理器可為一個一輸入兩輸出的解碼工具(OTT)，其中所述解相關器39係從所述處理器輸入訊號38的至少一聲道38.1進行解相關而產生一解相關訊號48，其中該混合器40係根據一聲道位準差(CLD)訊號49及/或聲道間相干(ICC)訊號50混合所述處理器輸入訊號 48以及所述解相關訊號48，使得所述處理器輸出訊號37組成兩個不相干輸出聲道37.1及37.2。

這樣一個輸入到輸出解碼工具36允許建立具有一對聲道37.1及37.2的一處理器輸出訊號37，所述對聲道在相對於彼此可簡單地具有正確的振幅和一致性。典型的一解相關器(解相關濾波器)是由一個與頻率有關的預延遲及其後的全通(IIR)部分所組成。

在一些實施方案中，所述控制裝置係藉由設定所述解相關音源訊號48至零或是避免所述混合器將所述解相關訊號48混合至所述個別處理器36之所述處理器輸出訊號37以關閉所述複數個處理器之一的所述解相關器39。此兩種方式均可輕易的關閉此解相關器39。

根據“ISO/IEC IS 23003-3聯合語音及音源編碼”一些實施例可能被定義為一多聲道解碼器2。

對於多聲道編碼USAC係由不同聲道元件所組成。如下面所給予之5.1音源聲道之一示例。

簡單位元流酬載之示例

對於單聲道至立體聲，每個立體聲元件ID_USAC_CPE係可藉由一OTT 36來使用MPEG環繞進行升混合。正如下面所描述，藉由混合饋入一解相關器39之輸出之一單聲道輸入訊號[2][3]，每個元件產生具有正確空間線索之兩個輸出聲道37.1及37.2。

一重要建構區塊係解相關器39，其用以合成輸出聲道37.1及37.2之正確的非相干/非相關。典型的解相關濾波器由一個與頻率有關的預延遲及其後的全通(IIR)部分所組成。

如果一OTT解碼區塊36之所述輸出聲道37.1及37.2由一隨後的格式轉換方案降混合，正確的相關合成將變為毫無關聯。因此，可以省略那些升混合區塊之解相關器39。如下面所述這可以被實現。

如圖5所示，格式轉換9及10和解碼之間的一交互作用可被建立。如果一OTT之輸出聲道解碼區塊36係由一隨後的格式轉換方案9及10解碼，可以產生被包含在所謂的混合矩陣之訊息，此混合矩陣係由一矩陣計算機46產生並且傳輸至USAC解碼器6。所述矩陣計算機所處理之訊息通常係為由格式轉換模組9及10提供之所述降混合矩陣。

所述格式轉換器處理區塊9及10，將音源資料轉換成適合在一揚聲器方案45上撥放，所述揚聲器方案有別於參考揚聲器方案42並且被稱為目標揚聲器方案45。

降混合係描述使用參考揚聲器方案42之一揚聲器之數量少於使用目標揚聲器方案45之一揚聲器之數量的情況。

圖6中係顯示一核心解碼器6，其提供一核心解碼器輸出訊號係包含所述輸出聲道13.1至13.6且適用於一5.1參考揚聲器方案42係包含一左前方揚聲器聲道L、一右前方揚聲器聲道R、一左環繞揚聲器聲道LS、一右環繞揚聲器聲道RS、一中心前方揚聲器聲道C及一低頻率增強揚聲器聲道LFE。當所述處理器36之解相關器39被開啟時，所述輸出聲道13.1及13.2係由處理器36產生於被饋入處理器36之聲道對單元(ID_USAC_CPE)之基底上且作為解相關聲道13.1及13.2。

所述左前方揚聲器聲道L、右前方揚聲器聲道R、左環繞揚聲器聲道LS、右環繞揚聲器聲道RS及中心前方揚聲器聲道C係為主要聲道，然而所述低頻率增強揚聲器聲道LFE係為選擇性的。

在相同方法下，當所述處理器36’之解相關器39’被開啟時，所述輸出聲道13.3及13.4由所述處理器36’創建於被饋入處理器36’之聲道對單元(ID_USAC_CPE)之基底且作為解相關聲道13.1及13.2。

所述輸出聲道13.5以單聲道元件(ID_USAC_SCE)為基底，然而所述輸出聲道13.6以低頻增強元件ID_USAC_LFE為基底。

如果獲得六個適合的揚聲器，所述核心解碼器輸出訊號13可以被用於撥放且不需要任何的降混合。然而，如果只獲得一立體聲揚聲器方案，所述核心解碼器輸出訊號13可能被降混合。

典型地所述降混過程可以由一降混合矩陣描述，此降混合矩陣定義比例因數應用於每個訊號源聲道至每個目標聲道。例如，ITU BS775定義下面所述降混合矩陣應用於降混合5.1主要聲道至立體聲，並且映射所述聲道L、R、C、LS及RS至立體聲聲道L'及R'。

所述降混合矩陣具有維度m×n，此n係為訊號源聲道之數量且m係為終點聲道之數量。

從降混合矩陣M _DMX一所謂的混合矩陣M _Mix被推導出於所述矩陣計算機處理區塊，此矩陣計算機處理區塊係描述訊號源聲道正在被結合。此具有所述維度n×n。

請注意M _Mix係一對稱矩陣。

對於上述矩陣5聲道至立體聲混合矩陣M _Mix之示例，如下所述：

一方法用於取得由下面虛擬碼所給予之混合矩陣：一方法用於取得由下面虛擬碼所給予之混合矩陣：

舉例而言，門檻thr可以被設定成零。

每個OTT解碼區塊產生相對應於聲道號碼i及j之兩個輸出聲道。如果混合矩陣M _Mix(i,j)與此相同，針對此解碼器區塊關閉解相關。

對於省略所述解相關器39，元件q ^l,m係被設定成零。

另外所述解相關路徑可以被省略，如下所述。

此結果在所述升混合矩陣之元件及內，並且分別被設定成零或被省略。(詳細內容請見參考文獻[2]的"6.5.3.2 Derivation of arbitrary matrix element")

在另一個較佳實施例中，所述升混合矩陣之元件及應該藉由設定ICC ^l,m=1來計算。

圖7係顯示所述主要聲道L、R、LS、LR及C至立體聲聲道L’及R’之降混。當所述處理器36產生的聲道L及R沒有被混合於所述輸出音源訊號31之一共同聲道，所述處理器36之解相關器39保持開啟。在相同的方法下，當所述處理器36產生的聲道LS及RS沒有被混合於所述輸出音源訊號31之一共同聲道，所述處理器36之解相關器39保持開啟。所述低頻率增強揚聲器聲道LFE可以被選擇性的使用。

圖8係顯示在圖6中之5.1參考揚聲器方案42至一4.0目標揚聲器方案45之一降混。當所述處理器36產生的聲道L及R沒有被混合於所述輸出音源訊號31之一共同聲道，所述處理器36之解相關器39保持開啟。然而，所述處理器36產生的聲道13.3(在圖6中之LS)及13.4(在圖6中之RS)沒有被混合於所述輸出音源訊號31之一共同聲道，以形成一中心環繞揚聲器聲道CS。

因此，所述處理器36之解相關器39’關閉，使得所述聲道13.3係一中心環繞揚聲器聲道CS’以及聲道13.4係一中心環繞揚聲器聲道CS”。藉由過這樣做，一修改的參考揚聲器方案42’被產生。值得注意的是，所述聲道CS’及CS”係為相關但不相同的。

為了完整性，應當加入被混合至所述輸出音源訊號31之一共同聲道31.4之聲道13.5(C)及13.6(LFE)，以形成一中心前方揚聲器聲道C。

圖9係顯示一核心解碼器6，其提供一核心解碼器輸出訊號13係包含所述輸出聲道13.1至13.10且其適用於一9.1參考揚聲器方案42係包含一左前方揚聲器聲道L、一左前方中心揚聲器LC、一左環繞揚聲器聲道LS、一左環繞後方垂直高度LVR、一右前方揚聲器聲道R、一右環繞揚聲器聲道RS、一右前方中心揚聲器聲道RC、一右環繞揚聲器聲道RS、一右環繞後方垂直高度聲道RVR、一中心前方揚聲器聲道C及一低頻率增強揚聲器聲道LFE。

當所述處理器36之解相關器39被開啟時，所述處理器36產生輸出聲道13.1及13.2於被饋入處理器36之聲道對單元(ID_USAC_CPE)之基底並作為解相關的聲道13.1及13.2。

相似地，當所述處理器36’之解相關器39’被開啟時，所述處理器36’產生輸出聲道13.3及13.4於被饋入處理器36’之聲道對單元(ID_USAC_CPE)之基底並作為解相關的聲道13.3及13.4。

更進一步，當所述處理器36”之解相關器39”被開啟時，所述處理器36”產生輸出聲道13.5及13.6於被饋入處理器36”之聲道對單元(ID_USAC_CPE)之基底並作為解相關的聲道13.5及13.6。

此外，當所述處理器36'''之解相關器39'''被開啟時，所述處理器36'''產生輸出聲道13.7及13.8於被饋入處理器36'''之聲道對單元(ID_USAC_CPE)之基底並作為解相關的聲道13.7及13.8。

所述輸出聲道13.9以單聲道元件(ID_USAC_SCE)為基底，然而所述輸出聲道13.10以低頻增強元件ID_USAC_LFE為基底。

圖10係顯示在圖9中之9.1參考揚聲器方案42至一5.1目標揚聲器方案45之一降混。所述處理器36產生的聲道13.1及13.2沒有被混合於所述輸出音源訊號31之一共同聲道31.1，以形成一左前方揚聲器聲道L’，而所述處理器36之解相關器39被關閉，使得所述聲道13.1係為一左前方揚聲器聲道L’以及所述聲道13.2係一左前方揚聲器聲道L”。

更進一步，所述處理器36產生的聲道13.3及13.4沒有被混合於所述輸出音源訊號31之一共同聲道31.2，以形成一左環繞揚聲器聲道LS。因此，所述處理器36’之解相關器39’被關閉，使得所述聲道13.3係為一左環燒揚聲器聲道LS’以及所述聲道13.4係為一左環繞揚聲器聲道LS”。

所述處理器36”產生的聲道13.5及13.6沒有被混合於所述輸出音源訊號31之一共同聲道31.3，以形成一右前方揚聲器聲道R，而所述處理器36”之解相關器39”被關閉，使得所述聲道13.5係一右前方揚聲器聲道R’以及所述聲道13.2係一右前方揚聲器聲道R”。

此外，所述處理器36'''產生的聲道13.7及13.8沒有被混合於所述輸出音源訊號31之一共同聲道31.4，以形成一右環繞揚聲器聲道RS。因此，所述處理器36'''之解相關器39'''被關閉，使得所述聲道13.7係一右環繞揚聲器聲道RS’以及所述聲道13.8係一右環繞揚聲器聲道RS”。

藉由這樣做，一修改的參考揚聲器方案42’可被產生，其中所述核心解碼器輸出訊號13之非相干聲道之數量係相同於所述目標方案45之揚聲器聲道之數量。

應當注意的是，此處理應僅被應用於其中解相關所應用的頻帶，且其中殘餘編碼方式使用的頻帶將不會受到影響。

之前提到的，本發明係適用於雙聲道轉譯。雙聲道撥放通常發生在耳機及/或行道裝置上，而所述解碼器及轉譯複雜性可能會被限制。

減少/省略解相關器處理可能會被執行。如果所述音源訊號最終被用以處理雙聲道的撥放，則建議在所有或一些OTT解碼區塊省略或減少解相關。

這可以避免來自被解相關在所述解碼器之降混合的音源訊號的效應。

雙聲道轉譯之解碼的輸出聲道之數量可能被減少。除了省略解相關，可能需要解碼成數量較少之非相干輸出聲道，然後導致雙聲道轉譯之非相干輸入聲道數量較少。例如，如果解碼發生在一行動裝置上，最初的22.2聲道材料係解碼至5.1以及只有5個而不是22個聲道之雙聲道轉譯。

為了降低整體解碼器的複雜度，建議採用下列的處理：

A)定義一目標揚聲器方案，其具有比最初聲道配置較少的聲道數量。目標聲道之數量取決於品質及複雜度限制。

存在達到所述目標揚聲器方案之兩個可能性B1及B2，也可以結合此兩個可能性：

B1)解碼至一較少數量的聲道，即省略在所述解碼器之完整的OTT處理區塊。這需要所述雙聲道轉譯器之一訊息路徑轉入所述(USAC)核心解碼器，以控制所述解碼器處理。

B2)把所述最初的揚聲器聲道配置或一中間的聲道配置之一格式轉換(亦即降混合)方案應用於所述目標揚聲器方案。在所述(USAC)核心解碼器之後，這可能被完成在一後處理步驟，並且不需要一修改的解碼器處理。

最後步驟C)被執行：

C)執行一較少聲道數量之雙聲道轉譯。

SAOC解碼的應用

上面描述的方法也可以被應用於參數化物件編碼(SAOC)處理。

格式轉換可能會執行減少/省略解相關器處理。如果格式轉換被應用在SAOC解碼之後，則所述格式轉換器至所述SAOC解碼器之訊息被傳遞。具有此種訊息相關之所述SAOC解碼器係被控制用以減少人工解相關之訊號之數量。此訊息可以為所述整個降混合矩陣或導出的訊息。

更進一步，減少/省略解相關器處理之雙聲道轉換可能被執行。在參數化物件編碼(SAOC)之示例，解相關被應用於所述解碼之過程。如果雙聲道轉譯如下文，在所述SAOC解碼器內之所述解相關處理應該被省略或減少。

此外，具有減少之聲道數量之雙聲道轉譯可能被執行。如果雙聲道撥放被應用在SAOC解碼之後，使用根據所述格式轉換器之訊息建構之一降混合矩陣，此SAOC解碼器可用以轉譯成一較少數量之聲道。

由於解相關濾波需要大量的計算複雜度，整體解碼的工作量可以被所提出的方法大幅降低。

雖然所述全通濾波器被設計成在某種程度上可將主觀音質的影響降到最低，但它總無法避免此發出聲音的加工品被製備，例如由於相位失真所瞬變的污點或某些頻率元件的“振鈴”。因此，省略所述解相關濾波的過程的副作用，可以得到一改善的音源音質。除此之外，避免由隨後的降混合、升混合或雙聲道處理揭露任何由此類解相關加工品。

除此之外，上述內容已經討論降低雙聲道轉譯與一(USAC)核心解碼器或SAOC解碼器之結合之複雜度的方法。

關於所述解碼器及編碼器以及所描述實施例之方法在下文被提到：

雖然一些觀點在有關裝置之上下文內容已經被描述，但很顯然的這些觀點也代表所述相對應的方法之一描述，其中一區塊或裝置相對應於一方法步驟或一方法步驟之一特徵。相似地，被描述於一方法步驟之上下文之觀點也代表一相對應的區塊或項目之一描述，或是一相對應的裝置之特徵。

依據特定實施例要求，本發明之實施例可以被實施在硬體或軟體。本實施例可以使用一數位儲存媒體來執行，例如一軟碟機、一DVD、一Blu-Ray、一CD、一PROM、一EPROM或一FLASH memory，此數位儲存媒體具有電子可讀控制信號並且儲存於其內，所述之可讀控制信號配合一可編程計算機系統，以使相對應的方法被進行。

依據本發明之一些實施例係包含一資料載體，所述之資料載體具有一電子可讀控制信號，此電子可讀控制信號能夠結合一可編程計算機系統，以執行本文描述之方法。

一般情況下，本發明之實施例係可被實施並且作為具有一程式碼之一電腦程式產品，當電腦程式產品在一電腦上執行時，程式碼可操作用於執行上述多種方法中的其中一個，例如程式碼可被儲存於一機器可讀載體。

另一實施例，係包含電腦程式其用於執行被描述於實施例中之一方法，此方法係為將電腦程式儲存於一機器可讀載體或一非暫態電腦可讀媒體。

換句話說，本發明之一方法實施例，係當所述電腦程式執行於一電腦時，具有一程式碼之一電腦程式用於執行本文描述之方法之一。

本發明之另一方法實施例，係一資料載體(或一數位儲存媒體，或是一電腦可讀之媒體)其包含所述之電腦程式，此電腦程式被記錄在資料載體上且用於執行本文描述之多種方法之其中一個。

本發明之另一方法實施例，係一數據流或一序列訊號代表程式碼用以執行本文描述之多種方法之其中一個。所述之數據流或一序列訊號可以例如被配置為經由一資料通訊連接來傳輸，例如透過網際網路。

另一實施例係包含一處理裝置，例如一電腦或一可程式邏輯裝置，所述之處理裝置係用以或適用於執行本文描述之多種方法之其中一個。

另一實施例係包含一電腦其具有一安裝於其內之電腦程式，用以執行本文描述之多種方法之其中一個。

在一些實施例，一可程式邏輯裝置(例如一場式可程式閘陣列元件)可以被用於執行本文所描述之一些或全部的功能。在一些實施例中，場可程式閘陣列元件可以結合一微處理器，以執行本文描述之多種方法之其中一個。一般而言，所述之方法最佳地係由任何硬體裝置來執行。

雖然本發明描述了數個實施例，但對其進行變更、置換及等同均落入本發明的圍之內。還有應當注意的是，有很多替換本發明之實施方法及組成之方式。因此，下文所附的權利項應當被理解為包含所有此類的變更、置換及等同，這些均未脫離本創作之精神與範疇。

參考文獻：

[1] Surround Sound Explained - Part 5. Published in: soundonsound magazine, December 2001.

[2] ISO/IEC IS 23003-1, MPEG audio technologies - Part 1: MPEG Sur-round.

[3] ISO/IEC IS 23003-3, MPEG audio technologies - Part 3: Unified speech and audio coding.

2‧‧‧音源解碼器

6‧‧‧核心解碼器

10‧‧‧格式轉換器裝置

13‧‧‧核心解碼器輸出訊號

13.1、13.2、13.3、13.4‧‧‧通道

31‧‧‧輸出音源訊號

31.1、31.2、31.3‧‧‧通道層級

36、36’‧‧‧處理器

37、37’‧‧‧輸出訊號

37.1、37.1’、37.2、37.2’‧‧‧輸出通道

38、38’‧‧‧輸入訊號

38.1、38.1’‧‧‧輸入通道

39、39’‧‧‧解相關器

40、40’‧‧‧混合器

42‧‧‧參考揚聲器方案

45‧‧‧目標揚聲器方案

46‧‧‧控制裝置

47‧‧‧規則組

L‧‧‧左前方揚聲器

R‧‧‧右前方揚聲器

LS‧‧‧左環繞揚聲器

RS‧‧‧右環繞揚聲器

CS‧‧‧中心環繞揚聲器通道

Claims

一種音源解碼器裝置，用於解碼一壓縮輸入音源訊號，該音源解碼器裝置包含：至少一核心解碼器(6，24)，係具有至少一處理器(36，36’)用於根據一處理器輸入訊號(38，38’)產生一處理器輸出訊號(37)，其中該處理器輸出訊號(37，37’)之複數個輸出聲道(37.1，37.2，37.1’，37.2’)之數量係高於該處理器輸入訊號(38，38’)之複數個輸入聲道(38.1，38.1’)之數量，其中每一該至少一處理器(36，36’)包含一解相關器(39，39’)以及一混合器(40，40’)，其中一核心解碼器輸出訊號(13)，係具有複數個聲道(13.1，13.2，13.3，13.4)且包含該處理器輸出訊號(37，37’)，以及其中該核心解碼器輸出訊號(13)係適用於一參考揚聲器方案(42)；至少一格式轉換器裝置(9，10)，係用以將核心解碼器輸出訊號(13)轉換成一輸出音源訊號(31)，該輸出音源訊號(31)係適用於一目標揚聲器方案(45)；以及一控制裝置(46)，該處理器(36，36’)之該混合器(40，40’)獨立控制該處理器(36，36’)之該解相關器(39，39’)，該控制裝置(46)係據此方式控制至少一處理器(36，36’)，其中該控制裝置(46)係取決於該目標揚聲器方案(45)來控制至少一處理器(36，36’)之複數個解相關器(39，39’)中的至少一個。
如申請專利範圍第1項所述之解碼器裝置，其中該控制裝置(46)係用以停用至少一處理器(36，36’)使得該處理器輸入訊號(38，38’)之複數個輸入聲道(38.1，38.1’)係以一未處理形式提供至該處理器輸出訊號(37，37’)之複數個輸出聲道(37.1，37.2，37.1’，37.2’)。
如申請專利範圍第1項所述之解碼器裝置，其中該處理器(36，36’)係為一輸入二輸出的解碼工具，其中該解相關器(39，39’)係對該處理器輸入訊號(38，38’)之該複數個聲道(38.1，38.1’)進行解相關，以產生一解相關訊號(48)，其中該混合器(40，40’)係根據一聲道位準差訊號(49)及/或聲道間相干訊號(50)混合該處理器輸入訊號(38)以及該解相關訊號(46)聲道，使得該處理器輸出訊號(37，37’)組成兩個不相干輸出聲道(37.1，37.2，37.1’，37.2’)。
如申請專利範圍第3項所述之解碼器裝置，其中該控制裝置係藉由設定該解相關訊號(48)至零或是避免該混合器(40，40’)將該解相關訊號(46)混合至該個別處理器(36，36’)之該處理器輸出訊號(37)，以關閉該複數個處理器(36，36’)之一的該解相關器(36，36’)。
如申請專利範圍第1項所述之解碼器裝置，其中該核心解碼器(6)係為一音樂以及語音兩者的解碼器，例如一USAC解碼器(6)，其中該複數個處理器(36,36’)中的至少一個的該處理器輸入訊號(38)包含聲道對單元，例如USAC聲道對單元。
如申請專利範圍第1項所述之解碼器裝置，其中該核心解碼器(24)係為參數化物件編碼器，例如一SAOC解碼器(24)。
如申請專利範圍第1項所述之解碼器裝置，其中該參考揚聲器方案(42)之揚聲器數量係高於該目標揚聲器方案(45)之揚聲器數量。
如申請專利範圍第1項所述之解碼器裝置，其中該控制裝置(46)係針對該處理器輸出訊號(37’)之該複數個輸出聲道(37.1’)之至少一第一個以及該處理器輸出訊號(37’)之該複數個輸出聲道(37.2’)之一第二個，關閉該解相關器(36’)，取決於該目標揚聲器方案，如果該複數個輸出聲道(37.1’)之該第一個以及該複數個輸出聲道(37.2’)之該第二個係混合成該輸出音源訊號(31)之一共同聲道(31.2)，則提供一第一比例因數及/或一第二比例因數，其中該第一比例因數係使該複數個輸出聲道(37.1')之該第一個混合至該共同聲道(31.2)能超過一第一門檻，該第二比例因數係使該複數個輸出聲道(37.2’)之該第二個混合至該共同聲道(31.2)能超過一第二門檻。
如申請專利範圍第1項所述之解碼器裝置，其中該控制裝置(46)係從該格式轉換器裝置(9，10)接收一規則組(47)，取決於該目標揚聲器方案(45)，該格式轉換器裝置(9，10)係根據該規則組(47)將該核心解碼器輸出訊號(13)之該複數個聲道(13.1，13.2，13.3，13.4)混合至該輸出音源訊號(31)之該複數個聲道(31.1，31.2，31.3)，其中該控制裝置(46)係取決於所接收之規則組(47)之設定，控制該複數個處理器(36,36’)中的至少一個。
如申請專利範圍第1項所述之解碼器裝置，其中該控制裝置(46)係讓該核心解碼器輸出訊號(13)之複數個不相干聲道之數量等於該輸出音源訊號(31)之該複數個聲道(31.1，31.2，31.3)之數量，據此控制該複數個處理器(36,36’)之該解相關器(39，39’)。
如申請專利範圍第1項所述之解碼器裝置，其中該格式轉換器裝置(9，10)包含一降混合器(10)，該降混合器(10)係降混合該核心解碼器輸出訊號(13)。
如申請專利範圍第1項所述之解碼器裝置，其中該格式轉換器裝置(9，10)包含一立體聲演示器(10)。
如申請專利範圍第12項所述之解碼器裝置，其中該核心解碼器輸出訊號(13)係提供至該立體聲演示器(9)作為一立體聲演示器輸入訊號。
如申請專利範圍第11項所述之解碼器裝置，其中該降混合器(9)之一降混合器輸出訊號係提供至該立體聲演示器(10)作為一立體聲演示器輸入訊號。
一種解碼壓縮過之輸入音源訊號方法，該方法包含下列步驟：提供至少一核心解碼器(6，24)，該至少一核心解碼器(6，24)具有至少一處理器(36，36’)用於根據一處理器輸入訊號(38)產生一處理器輸出訊號(37)，其中該處理器輸出訊號(37，37’)之複數個輸出聲道(37.1，37.2，37.1’，37.2’)之數量係高於該處理器輸入訊號(38，38’)之複數個輸入聲道(38.1，38.1’)之數量，其中每一該至少一處理器(36，36’)包含一解相關器(39，39’)以及一混合器(40，40’)，其中一核心解碼器輸出訊號(13)具有複數個聲道(13.1，13.2，13.3，13，4)且包含該處理器輸出訊號(37，37’)，以及其中該核心解碼器輸出訊號(13)係適用於一參考揚聲器方案(42)；提供至少一格式轉換器裝置(9，10)將核心解碼器輸出訊號(13)轉換成一輸出音源訊號(31)，該輸出音源訊號(31)係適用於一目標揚聲器方案(45)；以及提供一控制裝置(46)，該處理器(36，36’)之該混合器(40，40’)獨立控制該處理器(36，36’)之該解相關器(39，39’)，該控制裝置(46)係據此方式控制至少一處理器(36，36’)，其中該控制裝置(46)係取決於該目標揚聲器方案(45)來控制至少一處理器(36，36’)之複數個解相關器(39，39’)中的至少一個。其中該控制裝置(46)係取決於該目標揚聲器方案(45)來控制至少一處理器(36，36’)之複數個解相關器(39，39’)中的至少一個。
一種電腦程式，當該電腦程式在一電腦或是訊號處理器上執行時係實現申請專利範圍第15項所述之方法。