TWI455614B

TWI455614B - 方法、器件、編碼器裝置、解碼器裝置及聲訊系統

Info

Publication number: TWI455614B
Application number: TW094110514A
Authority: TW
Inventors: Dirk Jeroen Breebaart; Gerard Herman Hotho; Loon Machiel Willem Van
Original assignee: Koninkl Philips Electronics Nv
Priority date: 2004-04-05
Filing date: 2005-04-01
Publication date: 2014-10-01
Also published as: EP1735779B1; JP5284638B2; RU2006139068A; BRPI0509110B1; CN1947172A; KR101183862B1; MXPA06011397A; TW200611588A; WO2005098826A1; PL1735779T3; EP1735779A1; US9992599B2; JP2007531916A; KR20070001205A; ES2426917T3; CN1947172B; US20070183601A1; BRPI0509110A; BRPI0509110A8; RU2396608C2

Description

方法、器件、編碼器裝置、解碼器裝置及聲訊系統

本發明係關於一種用以處理從一編碼器獲得的一立體聲信號之方法及器件，該編碼器將一N聲道聲訊信號編碼成左與右信號及空間參數。本發明還係關於一種包含此一編碼器與此一器件之編碼器裝置。

本發明還係關於一種藉由對用以處理從一編碼器獲得的一立體聲信號之一方法及器件而獲得之一立體聲信號進行處理之此一方法及器件。本發明還係關於一種包含用以處理一立體聲信號的此一器件之解碼器裝置。

本發明還係關於一種包含此一編碼器裝置與此一解碼器裝置之聲訊系統。

長久以來，音樂的立體聲重製(例如在家庭環境中)一直較普遍。在20世紀70年代，有些實驗係藉由家庭音樂設備的四聲道重製來進行。

在較大的廳堂裏，例如電影院，聲音的多聲道重製已存在一段較長時間。為在大廳裏提供真實而動人的聲音重製，而開發出Dolby Digital及其他系統。

此類多聲道系統已引入家庭影院並引起廣泛的關注。因此，具有五個全音域聲道及一個部分音域聲道或低頻效果(LFE)聲道之系統，即所謂的5.1系統，如今已普遍進入市場。還存在其他系統，例如2.1、4.1、7.1，甚至8.1。

藉由引入SACD及DVD，多聲道聲訊重製正引起人們更大的興趣。許多消費者已經可在家裏進行多聲道播放，而多聲道原始材料開始受到歡迎。

由於多聲道材料越來越受到人們歡迎，因此對多聲道材料進行有效的編碼正變得更加重要，此點已為標準機構(例如，MPEG)所認知。

先前已知的編碼器常常並不應用有效的方法來編碼多聲道聲訊。基本上可個別地編碼該等輸入聲道(可能在矩陣化後)，從而由於為數眾多的聲道而需要較高的位元率。

但是，一多聲道聲訊編碼器可產生一2聲道降頻混合，此一混合可與2聲道重製系統相容，同時仍使得在解碼器側能夠進行高品質的多聲道重建。藉由控制立體聲至多聲道升頻混合程序所傳送的參數P來控制該高品質重建。該些參數包含說明諸多方面之資訊，其中包括說明前方信號相對於在該2聲道降頻混合中存在的環繞聲信號之比率。使用此一方法，一解碼器能控制與在該升頻混合程序中的前方信號相對的環繞聲信號之數量。換言之，該等參數說明存在於原始多聲道信號中但因該降頻混合程序而在該立體聲混合中遺失的空間聲場之重要特性。

本發明係關於使用此參數化的空間資訊來對一2聲道降頻混合施加與參數相關而較佳係可逆的後處理，以增強該降頻混合(例如，該降頻混合之知覺品質或空間特性)之可能性。

本發明之一目的係使得依據在該多聲道編碼器中決定的參數可在編碼後對該降頻混合進行後處理，且仍然保持可進行多聲道解碼而不受該後處理之影響。

此目的係藉由一種用以處理從一編碼器獲得的一立體聲信號之方法及器件，該編碼器將一N聲道(N>2)信號編碼成左與右信號及空間參數。該方法包含對該等左與右聲道信號進行處理以便提供經處理的信號。對該處理之控制取決於該等空間參數。一般的理念係使用從一N聲道至立體聲編碼器獲得之空間參數來控制一特定的後處理演算法。以此方式，可處理從該編碼器獲得之立體聲信號，例如用以增強空間感。

在本發明之一項具體實施例中，藉由針對每一輸入聲道(例如針對該等左與右信號中的每一信號)之一第一參數來控制該處理，該第一參數係取決於該等空間參數。該第一參數可能係一時間及/或頻率函數。從而，該系統可能經歷可變數量之後處理，其中後處理的實際數量取決於該等空間參數。可在不同的頻帶中個別地執行該後處理。該編碼器輸送獨立的空間參數，該等參數說明針對一組頻帶之空間影像。在該情況下，該第一參數可能與頻率相關。

在本發明之另一項具體實施例中，該後處理包含添加一第一、第二及第三信號以便獲得該等經處理的聲道信號。該第一信號包括由一第一傳輸函數修改的第一輸入信號(即，該左或右信號)，該第二信號包括由一第二傳輸函數修改的第一輸入信號，而該第三信號包括由一第三傳輸函數修改的第二輸出信號(即，該右或左信號)。該第二傳輸函數可包含該第一參數與一第一濾波函數。該第一傳輸函數可能包含一第二參數，從而該第一參數與該第二參數之和可能係一和諧值。該第三傳輸函數可包含該第二輸入信號之該第一參數與一第二濾波函數。

該濾波函數可不隨時間變化。

在一項特定具體實施例中，可以下面的等式來說明該等信號：＝H 其中：H ＝其中，a係一常數。

使用此表示法，該等濾波函數H₁ 、H₂ 、H₃ 及H₄ 之濾波效果可因改變該等參數w_l 及w_r 而變化。若二參數之值皆等於零，則該等經後處理的信號L₀ _w 、R₀ _w 本質上等於立體聲輸入信號對L₀ 、R₀ 。另一方面，若該等參數為＋1，則經後處理的立體聲對L₀ _w 、R₀ _w 完全係藉由該等濾波函數H₁ 、H₂ 、H₃ 及H₄ 來處理。本發明使得可藉由該等空間參數P來控制濾波的實際數量，即該等參數w_l 及w_r 之值。

依據一項具體實施例，該等濾波函數及參數之選擇使得該傳輸函數矩陣可逆轉。此點使得可重建該原始立體聲信號。

在本發明之另一方面，其包含一種用以依據上面提到的方法來處理一立體聲信號之器件以及一種包含此一器件之編碼器裝置。

在本發明之另一方面，提供一種用以依據上面提到的方法來逆轉該處理之方法及器件以及一種包含此一逆向器件之解碼器裝置。

在本發明之另一方面，提供一種包含此一編碼器裝置與此一解碼器裝置之聲訊系統。

圖1係希望在其中使用本發明之一編碼器/解碼器系統之一方塊圖。在聲訊系統1中，將一N聲道聲訊信號提供給一編碼器2，而N係一大於2之整數。該編碼器2將該等N聲道聲訊信號轉換為信號L₀ 與R₀ 及參數解碼器資訊P，藉由此舉，一解碼器便能解碼該資訊並估計欲從該解碼器輸出之原始N聲道信號。該空間參數集合P較佳的係與時間及/或頻率相關。該等N聲道信號可能係針對一5.1系統之信號，該系統包含一中心聲道、二前方聲道、二環繞聲道及一LFE聲道。

以一合適的方式，例如，藉由CD、DVD、VHS Hi－Fi、廣播、雷射碟片、DBS、數位電纜、網際網路或任何其他傳輸或分配系統，將該等經編碼的立體聲信號對L₀ 與R₀ 及解碼器空間資訊P傳送給使用者，如圖1中的環形線4所示。由於傳送該等左及右信號，因此該系統可與眾多僅能重製立體聲信號的接收設備相容。若該接收設備包括一解碼器，則該解碼器可解碼該等N聲道信號並提供關於該等信號之一估計，此係依據該立體聲信號對L₀ 與R₀ 中的資訊以及該等解碼器空間資訊信號或空間參數P。

但是，由於播放信號數量減少，因此立體聲信號與該等N聲道信號相比缺少空間資訊或缺少對於特定情況而言可能需要的其他特性。因此，依據本發明，提供一種在傳輸/分配給該接收器之前處理該立體聲信號之後處理器5。該後處理可能係與位置相關而「添加」低音或混響，或移除合音(卡拉OK在中心聲道中有合音)。

後處理之其他範例係立體聲基線加寬，此舉係藉由利用關於原始環繞聲混合(例如，前方/後方)組成之知識來實行，因為個別輸入信號在其中所起之作用已知係來自該等解碼器資訊信號P。從原理上說，可能已經在該編碼器中施加立體聲加寬，但此處理一般不可逆轉，因為在該解碼器中僅有二信號可用而非N個信號，所以逆轉一般不可實現。但是除立體聲加寬外，還可就個別多聲道在其中所起的作用而採用其他後處理技術。

依據本發明，將該等經後處理的信號傳送給一接收器，如圖1中的環形線6所示。用以處理從一編碼器獲得的一立體聲信號之發明器件包含該後處理器5。依據本發明之編碼器裝置包含該編碼器2與該後處理器5。

可直接使用接收到的信號，例如在該接收器不包括一多聲道解碼器之情況下。此點可能係在透過該網際網路而接收該信號6之一電腦或在僅具有二揚聲器之一接收器的情況中。此類接收到的信號係感知為一高品質信號，因為其具有增強的空間感或具有如該信號之處理過程中由該編碼器及該後處理器決定的其他特徵。

若該信號應係用於在一傳統N聲道解碼器3中進行解碼，則必須首先藉由一逆向後處理器7來對該信號進行逆轉的後處理，以便重建該原始立體聲信號對L₀ 與R₀ ，該原始立體聲信號對L₀ 及R₀ 與該解碼器資訊或空間參數P一起產生一估計出的N聲道信號。依據本發明，此類重建可能屬於該多聲道混合，此重建幾乎不受該後處理之影響。同樣，可針對該立體聲播放而在該解碼器中進行後處理以作為可由使用者來選擇的特徵，而無需首先決定該多聲道信號。用以處理包含左與右信號之一立體聲信號之發明器件包含該逆向後處理器7。依據本發明之解碼器裝置包含該解碼器3與該逆向後處理器7。

若不進行後處理，則該降頻混合可與一標準的ITU降頻混合相容。但是，本發明之方法可明顯改善該降頻混合。

本發明方法能夠借助於在該編碼器中決定的空間參數P來決定該原始聲道的降頻混合在該多聲道混合中所起的作用。以此方式，可向該多聲道混合的特定聲道施加後處理，例如後方聲道之立體聲基線加寬，而不會影響其他聲道。若該後處理係可逆轉的，則該後處理不影響最終的多聲道重建。還可施加該後處理來改善立體聲播放，而無需首先重建該多聲道混合。

此方法與現有的後處理技術不同之處在於，其使用原始多聲道混合之知識，即決定出的空間參數P。

該編碼器2之操作方式如下：將一N聲道聲訊信號假定為該編碼器2之一輸入信號，其中z₁ [n]、z₂ [n]、...、z_N [n]說明該等N聲道之分離的時域波形。使用一般的分割方法(segmentation)來分割該些N個信號，較佳的係使用重疊分析視窗。隨後，可使用一複雜的轉換(例如，FFT)將每一區段轉換成該頻域。但是，複雜的濾波器組結構亦可適用於獲得時頻微磚。此程序使得已分割的子頻帶表示該等輸入信號，即，該等信號將會表示為Z₁ [k]、Z₂ [k]、Z_N [k]，而k表示頻率指數。

由該些N聲道產生2個降頻混合聲道，其分別係L₀ [k]與R₀ [k]。每一降頻混合聲道皆係該等N個輸入信號之一線性組合：

該等參數α_i 及β_i 係選擇成使得由L₀ [k]與R₀ [k]組成的立體聲信號具有一良好的立體聲影像。在由L_f 、R_f 、C、L_s 及R_s (分別針對左前方、右前方、中心、左環繞、右環繞聲道)組成的一5聲道輸入信號之情況下，可依據下式而獲得一合適的降頻混合：

可依據以下等式而獲得該等信號L及R：

此外，擷取空間參數P，使得能對來自L₀ 及R₀ 的信號L_f 、R_f 、C、L_s 及R_s 進行知覺重建。

在一項具體實施例中，該參數集合P包括在該等信號對(L_f 、L_s )與(R_f 、R_s )間的聲道間強度差(IID)且還可包括聲道間交互相關(ICC)值。依據以下等式而獲得該L_f 、L_s 對之間的IID及ICC：

此處，(^＊ )表示共軛複數。對於其他信號對，可使用類似的等式。因此，該參數IID_l 說明該等左前方與左環繞聲道之間的相對能量量，而參數ICC_l 說明該等左前方與左環繞聲道之間的交互相關量。該些參數本質上說明前方與環繞聲道之間的知覺相關參數。

可藉由估計二個預測參數c₁ 與c₂ 而實現存在於L₀ 、R₀ 中的中心信號數量之參數化。該些二預測參數定義一2×3矩陣，其控制從L₀ 、R₀ 至L、C及R的解碼器升頻混合處理：

該升頻混合矩陣M之實施如下式所給定：

對於上述範例，該參數集合P包括針對每一時頻微磚之{c₁ ,c₂ ,IID_l ,ICC_l ,IID_r ,ICC_r }。

針對所產生的立體聲信號對(L₀ 、R₀ )而施加後處理之方式可能令該後處理主要影響Z_i [k]在該立體聲混合所起之作用，例如該立體聲混合中的L_s 及R_s 。圖1中顯示此區塊在該編碼解碼器中的位置。

圖2係依據本發明之一項具體實施例的圖1的後處理器5之詳細視圖。經後處理的左信號L₀ _w 係三個信號之和，該等三個信號即，經一傳輸函數H_A 修改的左信號L₀ 、經一傳輸函數H_B 修改的左信號L₀ 及經一傳輸函數H_D 修改的右信號R₀ 。以相同方式，經後處理的右信號R₀ _w 係三個信號之和，該等三個信號即，經一傳輸函數H_F 修改的右信號R₀ 、經一傳輸函數H_E 修改的右信號R₀ 及經一傳輸函數H_C 修改的左信號L₀ 。該等傳輸函數H_A 至H_F 可能係實施為FIR或IIR型濾波器，或可能僅係與頻率相關的(複)比例因數。此外，該傳輸函數H_A 可能係與一第二參數(1－w_l )相乘，而傳輸函數H_B 可能包括一第一參數w_l ，從而此參數w_l 決定該立體聲信號的後處理數量。

圖3中顯示此點。該參數w_l 決定L₀ [k]之後處理數量及w_r 決定R₀ [k]之後處理數量。當w_l 等於0時，L₀ [k]不受影響，而當w_l 等於1時，L₀ [k]受到的影響最大。此情形亦適用於w_r 相對於R₀ [k]之處理中。

以下等式適用於該等後處理參數w_l 及w_r ：w_l ＝f₁ (IID_l ,ICC_l ,c₁ ,c₂ ) W_r ＝f_r (IID_r ,ICC_r ,c₁ ,c₂ )圖3中的區塊H₁ 、H₂ 、H₃ 及H₄ 係濾波函數，其可能係各類濾波器、例如立體聲加寬濾波器，如下面之顯示。

所產生的輸出係：＝H 其中：H ＝其中，a係一任意常數(例如，＋1)。

若該等濾波函數H₁ 、H₂ 、H₃ 及H₄ 之選擇適當，則可令該傳輸函數矩陣H逆轉。此外，為使得能在該解碼器側計算該逆向矩陣，該等濾波函數H₁ 、H₂ 、H₃ 及H₄ 及參數w_l 與w_r 在該解碼器處應係已知。此點係可做到的，因為可依據所傳送的參數而計算出w_l 及w_r 。從而，該原始立體聲信號L₀ 、R₀ 將再次可用，此對於解碼該多聲道混合係必需的。

可做到的另一點係，在該解碼器中傳送該原始立體聲信號並施加該後處理從而可進行改善的立體聲播放而無需首先決定該多聲道混合。

下面，詳細說明該後處理之一項具體實施例。但是，本發明不限於確切的細節而可在隨附申請專利範圍中定義的本發明之範疇內變化。

該等後處理參數或權重w_l 及w_r 係所傳送的空間參數之一函數：(w_l ,w_r )＝f(P)該函數f之設計方式使得在該信號L₀ 包含更多來自該左環繞聲信號的能量(與來自該等左前方或中心信號之能量相比)之情況下使w_l 增加。以一類似的方式，w_r 隨存在於R₀ 中的右環繞聲信號之相對能量之增加而增加。針對w_l 及w_r 之傳統的表達式係給定為下式：w_l ＝f₁ (c₁ )f₂ (IID_l ) w_r ＝f₁ (c₂ )f₂ (IID_r )而及

對於該等濾波函數H₁ 、H₂ 、H₃ 及H₄ ，接著會選擇以下範例性函數(在z域中)：H₁ (z)＝H₄ (z)＝0.8(1.0＋0.2z^－ ¹ ＋0.2z^－ ² ) H₂ (z)＝H₃ (z)＝0.8(－1.0z^－ ¹ －0.2z^－ ² )。

可將本發明整合於產生可與立體聲相容的降頻混合之一多聲道聲訊編碼器裝置中。藉由上述後處理方案而增強此一多聲道參數聲訊編碼器之一般方案可概述如下：－藉由分割並轉換或藉由施加一濾波器組，將該多聲道輸入信號轉換為該頻域；－擷取空間參數P並在該頻域中產生一降頻混合；－在該頻域中應用該後處理演算法；－將經後處理的信號轉換成該時域；－使用傳統的編碼技術(例如，MPEG中所定義之技術)來編碼該立體聲信號；－藉由經編碼的參數P來多工處理立體聲位元流，以形成一總輸出位元流。

一對應的多聲道解碼器裝置(即，具有整合的後處理版本之一解碼器)可概述如下：－解多工處理該參數位元流以擷取該等參數P及經編碼的立體聲信號；－解碼該立體聲信號；－將經解碼的立體聲信號轉換為該頻域；－依據該等參數P而施加該後處理版本；－依據該等參數P而從立體聲升頻混合為多聲道輸出；－將該多聲道輸出轉換為該時域。

由於該後處理及逆後處理係在該頻域中執行，因此較佳的係在該頻域中藉由可能與頻率相關的簡單(實數或複數)比例因數來轉換或約計該等濾波函數H₁ 至H₄ 。

熟習此項技術者可瞭解，如上面所概述之一或多個處理階段可組合為一單一處理階段。

本發明之另一應用係僅在該解碼器側對該立體聲信號施加該後處理(即，在該編碼器側不進行後處理)。使用此方法，該解碼器能從一未增強的立體信號產生一增強的立體聲信號。

在發出表示是否已進行該後處理以及是否已使用參數函數f₁ 、f₂ 及哪幾個濾波函數H₁ 、H₂ 、H₃ 及H₄ 之信號的位元流中，可提供額外的資訊，從而使得能進行逆後處理。

一濾波函數可能係說明為在該頻域中之一乘法。由於參數係存在用於個別頻帶，因此，本發明可能係實施為簡單、複數增益而非個別適用於不同頻帶中的濾波器。在此情況下，藉由一簡單的(2×2)矩陣乘法而從來自(L₀ 、R₀ )的對應頻帶獲得L₀ _w 、R₀ _w 之頻帶。藉由代表該等濾波函數H並因此由該等不隨時間變化之增益H與受一隨時間/頻率變化的參數控制之增益w_l 及w_r 組成之參數及頻域，來決定實際矩陣項。由於該濾波器對於每一頻帶皆係純量，因此可進行逆處理。

可藉由以下矩陣等式來說明該編碼器中的後處理：其中：

此矩陣等式適用於每一頻帶。該矩陣H包含所有純量。純量之使用使得相對較容易進行後處理及逆後處理。

該等參數w_l 及w_r 係純量並係該等參數集P之函數。該些二參數決定該等輸入聲道的後處理數量。

該等參數H₁ ...H₄ 係複合濾波函數。

此程序之逆轉亦可藉由逐一頻帶地執行一簡單矩陣乘法來實行。逐一頻帶適用以下等式：其中

該矩陣H^－ ¹ 僅包含純量。該等元素H^－ ¹ 、k₁ ......k₄ 亦係該參數集合P之函數。當在該解碼器中已知該矩陣H中的函數h₁ ₁ ......h₂ ₂ 及該等參數P時，則可將該後處理逆轉。

圖4說明執行此類逆後處理的一逆向後處理器3之一方塊圖。

當該矩陣H之行列式不等於零時，可進行此逆轉。H之行列式等於：det(H )＝h ₁ ₁ h ₂ ₂ －h ₁ ₂ h ₂ ₁ ＝(1－w _l )^a (1－w _r )^a ＋(1－w _l )^a w _r ^a H ₄ ＋(1－w _r )^a w _l ^a H ₁ ＋w _l ^a w _r ^a (H ₁ H ₄ －H ₂ H ₃ )當選擇合適的函數h₁ ₁ ......h₂ ₂ 時，det(H)將不等於零，因此該程序可逆轉。

在此特別提出，表達詞「包含」不排除其他元件或步驟，而「一」不排除複數個元件。此外，請求項中的參考標記不應解釋為限制該等請求項之範疇。

上文中，已參考特定具體實施例來說明本發明。但是，本發明不限於所說明的各種具體實施例，而閱讀本說明書的熟習此項技術者會明白，可以不同方式來修改並組合本發明。

1．．．聲訊系統

2．．．編碼器

3．．．N聲道解碼器

4．．．環形線

5．．．後處理器

6．．．環形線

7．．．逆向後處理器

H₁ ．．．濾波函數

H₂ ．．．濾波函數

H₃ ．．．濾波函數

H₄ ．．．濾波函數

H_A －H_F ．．．傳輸函數

L₀ ．．．左立體聲道信號

L₀ _w ．．．經處理的聲道信號

P．．．空間參數

R₀ ．．．右立體聲道信號

w_l ．．．第一參數

w_r ．．．另一聲道之第一參數

從上面參考本發明之具體實施例並參考隨附圖式而對本發明所作的詳細說明，將會明白本發明之其他目的、特徵及優點，在該等圖式中：圖1顯示依據本發明包括後處理與逆後處理一編碼器/解碼器聲訊系統之一示意性方塊圖。

圖2顯示用以對從一多聲道編碼器獲得的一立體聲信號進行後處理之一器件之一項具體實施例之一詳細方塊圖。

圖3顯示用以對從一多聲道解碼器獲得的一立體聲信號進行後處理之器件之另一項具體實施例之一方塊圖。

圖4顯示用以對一包含左與右信號的立體聲信號進行逆後處理之一項具體實施例之一方塊圖。