TW201729180A

TW201729180A - 使用一寬帶對準參數與複數窄帶對準參數編碼或解碼多通道信號之裝置及方法

Info

Publication number: TW201729180A
Application number: TW106102398A
Authority: TW
Inventors: 史蒂芬拜爾; 依萊尼弗托波勞; 馬庫斯穆爾特斯; 古拉米福契斯; 艾曼紐拉斐里; 馬可斯史奈爾; 史蒂芬多伊拉; 渥爾夫剛賈格斯; 馬汀迪茲; 葛倫馬可維希
Original assignee: 弗勞恩霍夫爾協會
Priority date: 2016-01-22
Filing date: 2017-01-23
Publication date: 2017-08-16
Also published as: PL3405951T3; CA3011915C; MY181992A; MY196436A; JP2019032543A; TWI628651B; CN117238300A; US10706861B2; EP3284087B1; RU2693648C2; ZA201804776B; US20180322883A1; JP6730438B2; JP2021103326A; ES2773794T3; RU2017145250A; JP2021101253A; AU2019213424A1; EP3284087A1; ZA201804910B

Abstract

用於編碼具有至少兩個聲道的一多聲道信號的該設備，包含：一參數決定器用於自該多聲道信號決定一寬帶對準參數及複數窄帶對準參數；一信號對準器用於使用該寬帶對準參數及該等複數窄帶對準參數對準該等至少兩個聲道以獲得已對準之聲道；一信號處理器用於使用該等已對準之聲道計算一中間信號及一側邊信號；一信號編碼器用於編碼該中間信號以獲得一經編碼之中間信號及用於編碼該側邊信號以獲得一經編碼之側邊信號；及一輸出介面用於產生一經編碼之多聲道信號包含該經編碼之中間信號、該經編碼之側邊信號、該寬帶對準參數上之資訊、及該等複數窄帶對準參數上之資訊。

Description

使用一寬帶對準參數與複數窄帶對準參數編碼或解碼多通道信號之裝置及方法

此申請案係有關於立體聲處理，或概略言之，多聲道處理，於該處一多聲道信號具有二聲道，諸如以立體聲信號為例，一左聲道及一右聲道，或多於兩個聲道，諸如三、四、五或任何其它聲道數目。

立體聲語音及特別對話立體聲語音比起立體聲樂音的儲存及廣播受到遠較少的科學關注。確實，於語音通訊中今日大半仍使用單聲道發射。然而，隨著網路頻寬及容量的增加，預期基於立體聲技術之通訊將變成更普及且帶來更佳的收聽經驗。

立體聲音訊材料的有效寫碼已經長期就樂音的感官音訊寫碼用於有效儲存或廣播進行研究。於高位元率，於該處波形保留為關鍵性，已經長期採用稱作中間/側邊(M/S)立體聲的和-差立體聲。至於低位元率，已經問市強度立體聲及更為晚近參數立體聲寫碼。最新技術被採用於不同標準為HeAACv2及Mpeg USAC。其產生二聲道信號及相關聯的精簡空間邊帶資訊的縮混。

聯合立體聲寫碼通常建立在高頻率解析度上，亦即低時間解析度，信號之時間-頻率變換與在大部分語音寫碼器中進行的低延遲及時域處理不相容。再者，產生的位元率通常為高。

另一方面，參數立體聲採用一額外濾波器排組位在編碼器前端作為前處理器及在解碼器後端作為後處理器。因此，參數立體聲可使用於習知語音寫碼器，例如ACELP，原因在於其以MPEG USAC進行。再者，聽覺場景的參數化可以最少量邊帶資訊達成，其係適合用於低位元率。但如同例如於MPEG USAC，參數立體聲未經特別設計用於低延遲且針對不同對話景況不會傳遞一致的品質。於空間場景的習知參數表示型態中，立體聲影像之寬度係藉施加於二合成聲道上的解相關器人工複製，及藉由編碼器計算及發射的聲道間同調(ICs)參數加以控制。至於大部分立體聲語音，此種加寬立體聲影像之方式不適合用於重新再現屬於相當直接聲音的語音之自然環境，原因在於其係由位在該空間內一特定位置的單一音源產生(偶爾有些來自室內的混響)。相反地，樂器具有比語音遠更自然的寬度，其可藉將該等聲道解相關而更佳地模擬。

當語音係以不重合麥克風紀錄時，類似於A-B組態中，當麥克風彼此距離遠或用於雙耳紀錄或渲染時也成問題。該等景況可預期用於擷取電話會議中的語音或在多點控制單元(MCU)中以遙遠揚聲器產生虛擬聽覺場景。不似在重合麥克風上紀錄，例如X-Y(強度紀錄)或M-S(中間-側邊紀錄)，信號的抵達時間因不同聲道而異。此等未經時間對準的二聲道之同調計算可能錯誤估計，使得人工環境合成失敗。

有關立體聲處理的先前技術參考文獻為US專利5,434,948或US專利8,811,621。

文件WO 2006/089570 A1揭示接近透明或透明多聲道編碼器/解碼器方案。多聲道編碼器/解碼器方案額外產生波形類型殘差信號。此殘差信號連同一或多個多聲道參數一起發射至解碼器。與純粹參數多聲道解碼器相反，因額外殘差信號故，加強式解碼器產生具有改良式輸出品質的多聲道輸出信號。在編碼器端上，左聲道及右聲道兩者皆藉分析濾波器排組濾波。然後，用於各個子頻帶信號，針對一子頻帶計算對準值及增益值。然後在進一步處理之前進行此種對準。在解碼器端上，進行解對準及增益處理，然後對應信號藉合成濾波器排組合成以便產生經解碼之左信號及經解碼之右信號。

發現此等先前技術程序未能給音訊信號提供優化，及特別針對有多於一個揚聲器的語音信號，亦即於會議景況或對話語音場景中尤為如此。

本發明之一目的係提出用於編碼或解碼多聲道信號的改良構想。

此目的係藉請求項1之用於編碼一多聲道信號的設備、請求項20之用於編碼一多聲道信號的方法、請求項21之用於解碼一經編碼之多聲道信號的設備、或請求項33之用於解碼一經編碼之多聲道信號的方法、或請求項34之電腦程式而予達成。

用於編碼具有至少兩個聲道的一多聲道信號的設備包含一參數決定器以決定一方面一寬帶對準參數及另一方面複數窄帶對準參數。此等參數由一信號對準器用來使用此等參數對準該等至少兩個聲道以獲得經對準的聲道。然後，一信號處理器使用該等經對準的聲道計算一中間信號及一側邊信號，該中間信號及該側邊信號隨後經編碼及前傳入一經編碼之輸出信號，其額外具有該寬帶對準參數及該等複數窄帶對準參數作為參數邊帶資訊。

在解碼器端上，一信號解碼器解碼經編碼之中間信號及經編碼之側邊信號以獲得經解碼之中間及側邊信號。然後此等信號藉一信號處理器處理用於計算一經解碼之第一聲道及一經解碼之第二聲道。然後此等經解碼之聲道使用涵括於經編碼之多聲道信號的寬帶對準參數上之資訊及複數窄帶對準參數上之資訊解對準而獲得經解碼之多聲道信號。

於一特定實施例中，寬帶對準參數為聲道間時間差參數及複數窄帶對準參數為聲道間相位差。

本發明係基於發現特別對有多於一個揚聲器的語音信號，但也對有數個音訊源的其它音訊信號，音訊源之不同位置皆對映入多聲道信號的兩個聲道，可考慮使用寬帶對準參數諸如聲道間時間差參數施加至一或二聲道之全頻譜。除了此寬帶對準參數之外，發現逐子頻帶不同的數個窄帶對準參數額外地導致於二聲道中信號的更佳對準。

因此，對應各子頻帶中相同時間延遲的寬帶對準連同針對不同子頻帶對應不同相位旋轉的相位對準，在此二聲道轉換成中間/側邊表示型態之前，導致二聲道的優化對準，該表示型態然後經進一步編碼。由於已獲得優化對準故，一方面中間信號之能儘可能地高，另一方面，側邊信號之能儘可能地小，因而可獲得針對某些位元率，具有最低可能位元率或最高可能音訊品質的優化寫碼結果。

特別針對對話語音材料，典型揚聲器在二不同位置為作用態。此外，情況為正常只有一個揚聲器自第一位置說話，及然後第二揚聲器自第二位置或地點說話。在二聲道諸如第一或左聲道及第二或右聲道上的不同位置之影響係藉不同的抵達時間反映，因此，因不同位置所致二聲道間之某個時間延遲，及此時間延遲因時間而異。通常，此影響係反映在二聲道信號當寬帶解對準時，其可藉寬帶對準參數解決。

另一方面，特別來自混響或進一步雜訊源的其它效應可藉用於個別頻帶的個別相位對準參數加以考慮，該等參數係疊加在寬帶不同抵達時間或二聲道之寬帶解對準上。

有鑑於此，兩者的使用，一寬帶對準參數及複數窄帶對準參數於該寬帶對準參數頂上導致編碼器端上之優化聲道對準用以獲得良好且極為精簡的中間/側邊表示型態，而另一方面，在解碼器端上在解碼之後的對應解對準導致用於某個位元率的良好音訊品質或用於某個要求的音訊品質之小位元率。

本發明之優點為其提出比較現有立體聲寫碼方案遠更適合用於立體聲語音對話的新穎立體聲寫碼方案。依據本發明，尤其於語音源之情況但也於其它音訊源的情況下，特別藉探勘於多聲道信號的聲道間出現的聲道間時間差而組合參數立體聲技術及聯合立體聲寫碼技術。

數個實施例提供有用的優點，容後詳述。

新穎方法為自習知M/S立體聲及參數立體聲的混成辦法混合元素。於習知M/S中，聲道被動地縮混而產生中間信號及側邊信號。該方法可進一步擴延在加總及微分聲道之前，使用卡羅變換(KLT)又稱主要組成分析(PCA)而旋轉聲道。中間信號係於主碼寫碼加以寫碼，而側邊信號傳遞至副寫碼器。演進M/S立體聲可藉於目前框或先前框中寫碼的中間聲道而進一步使用側邊信號的預測。旋轉及預測的主要目標係最大化中間信號之能，同時最小化側邊信號之能。M/S立體聲為波形保留，就此面向而言，對任何立體聲景況極為穩健，但就位元消耗而言可能極為昂貴。

為了於低位元率之最高效率，參數立體聲計算及寫碼參數，例如，聲道間位準差(ILD)、聲道間相位差(IPD)、聲道間時間差(ITD)及聲道間同調(IC)。其精簡地表示立體聲影像且為聽覺場景的線索(音源位置、汰選、立體聲寬度…)。目標係為了參數化立體聲場景及只寫碼可在解碼器的縮混信號，及借助於發射的立體聲線索再度被空間化。

本發明辦法混合兩種構想。首先，立體聲線索ITD及IPD經計算及施加至二聲道上。目標係表示出不同頻帶的寬帶的時間差及相位。然後二聲道於時間及相位對準，然後進行M/S寫碼。發現ITD及IPD用於模型化立體聲語音為有用的，且為於M/S中基於KLT旋轉的良好替代。不似純粹參數寫碼，周圍環境不再藉IC模型化，反而藉經寫碼的及/或預測的側邊信號直接模型化。發現尤其當處理語音信號時此種辦法更穩健。

ITD的計算及處理為本發明之關鍵部分。ITD已在先前技術雙耳線索寫碼(BCC)探勘，但一旦ITD隨時間改變時該技術無效。為了避免此項缺點，設計特定視窗化用於平滑化兩個不同ITD間之過渡，且能從一個揚聲器無縫切換至在不同位置的另一個揚聲器。

進一步實施例係有關下述程序，在編碼器端上，用來決定複數窄帶對準參數的參數決定係使用已經與稍早決定的寬帶對準參數對準的聲道進行。

對應地，在進行寬帶解對準之前，使用典型地單一寬帶對準參數進行在解碼器端上之窄帶解對準。

於進一步實施例中，較佳地，在編碼器端上但甚至更要緊地在解碼器端上，在全部對準之後，及尤其使用寬帶對準參數的時間對準之後，進行逐一區塊的某種視窗化及重疊加法操作或任一種交叉衰退。如此避免了當時間或寬帶對準參數逐一區塊改變時的任何可聽聞的假信號諸如卡嚓聲。

於其它實施例中，施加不同頻譜解析度。更明確言之，聲道信號接受具有高頻率解析度的時間-頻譜轉換，諸如DFT頻譜，而針對具有較低頻率解析度的參數頻帶決定參數諸如窄帶對準參數。典型地，參數頻帶具有比信號頻譜更多一個頻譜線，及典型地具有來自DFT頻譜的一組頻譜線。又復，參數頻帶自低頻增至高頻以便考慮聽覺心理學(音質)議題。

進一步實施例係有關於位準參數諸如位準間差或用於處理側邊信號的其它程序諸如立體聲填充參數等的額外使用。經編碼之側邊信號可藉實際側邊信號本身表示，或藉使用目前框或任何其它框進行的預測殘差信號表示，或於只有一子集之頻帶藉一側邊信號或一側邊預測殘差信號表示，及只針對其餘頻帶藉預測參數表示，或甚至針對沒有高頻解析度側邊信號資訊的全部頻帶藉預測參數表示。因此，於如上最末替代例中，針對各個參數頻帶或只有一子集之參數頻帶，經編碼之側邊信號只由一預測參數表示，使得針對其餘參數頻帶不存在有原先側邊信號上的任何資訊。

又復，較佳地有複數窄帶對準參數，並非用於反映寬帶信號之全頻寬的全部參數頻帶，反而只用於一集合之較低，諸如參數頻帶的較低50%。另一方面，立體聲填充參數不便用於數個較低頻帶，原因在於針對此等頻帶，發射側邊信號本身或預測殘差信號以便確保，至少針對較低頻帶，可得波形校正表示型態。另一方面，針對較高頻帶，側邊信號非以波形正確表示型態發射以便進一步減低位元率，反而側邊信號典型地係以立體聲填充參數表示。

又復，較佳地基於相同DFT頻譜在一個且同一個頻域內部進行整個參數分析及對準。為了達成該目的，進一步較佳地使用帶有相位變換的通用交叉關聯(GCC-PHAT)技術用於聲道間時間差決定用途。於本程序之一較佳實施例中，基於頻譜形狀資訊，該資訊較佳地為頻譜平坦度量，進行一相關頻譜的平滑化，以使得以雜訊狀信號為例平滑化將為弱，及以調性信號為例平滑化將變較強。

又復，較佳地，進行特定相位旋轉，於該處考慮聲道振幅。特別，相位旋轉係分布於二聲道間，用於編碼器上的對準目的，及當然，用於解碼器上的解對準目的，於該處具有較高振幅的聲道被考慮作為領先聲道且將較不受相位旋轉影響，亦即，將比具有較低振幅的聲道更少被旋轉。

又復，和-差計算係使用能定標進行，帶有定標因數自二聲道之能推衍，此外，受限於某個範圍，以便確保中間/側邊計算不會過度影響該能。然而，另一方面，注意為了本發明之目的，此種節能不如先前技術程序重要，因時間及相位事先對準故。因此，因自左及右的中間信號及側邊信號之計算(在編碼器端上)或因自中間及側邊的左及右信號之計算(在解碼器端上)所致之能起伏波動不如先前技術般顯著。

圖1例示用於編碼具有至少兩個聲道之多聲道信號的設備。多聲道信號10一方面輸入參數決定器100及另一方面輸入信號對準器200。一方面，參數決定器100決定寬帶對準參數，及另一方面，自多聲道信號決定複數窄帶對準參數。此等參數透過參數線路12輸出。又復，如圖例示，此等參數也透過又一參數線路14輸出至一輸出介面500。在參數線路14上，額外參數諸如位準參數自參數決定器100前傳至輸出介面500。信號對準器200係經組配，使用透過參數線路10接收的寬帶對準參數及複數窄帶對準參數，用於對準多聲道信號10之至少兩個聲道以在信號對準器200之輸出獲得已對準之聲道20。此等已對準之聲道20前傳至信號處理器300，其係經組配用於自透過線路接收的已對準之聲道20計算中間信號31及側邊信號32。用於編碼之設備包含用於自線路31編碼中間信號及自線路32編碼側邊信號的信號編碼器400以獲得於線路41上的編碼中間信號及於線路42上的編碼側邊信號。此等信號兩者前傳至輸出介面500用於在輸出線路50產生編碼多聲道信號。於輸出線路50的編碼信號包含得自線路41的編碼中間信號、得自線路42的編碼側邊信號、得自線路14的窄帶對準參數及寬帶對準參數、及選擇性地，得自線路14的位準參數，及此外選擇性地，由信號編碼器400產生的立體聲填充參數及透過參數線路43前傳至輸出介面500。

較佳地，信號對準器係經組配以，在參數決定器100實際上計算窄帶參數之前，使用寬帶對準參數而自多聲道信號對準聲道。因此，於此實施例中，信號對準器200透過連接線15將寬帶對準聲道發送回參數決定器100。然後，參數決定器100自相對於寬帶特性已對準的多聲道信號決定複數窄帶對準參數。然而，於其它實施例中，參數未使用此種特定程序順序決定。

圖4a例示一較佳實施例，於該處進行遭致連接線15的該特定步驟順序。於步驟16，寬帶對準參數係使用二聲道決定，獲得寬帶對準參數，諸如聲道間時差或ITD參數。然後，於步驟21，二聲道係藉圖1之信號對準器200使用寬帶對準參數加以對準。然後，於步驟17，窄帶參數係使用參數決定器100內部的已對準聲道決定，以決定複數窄帶對準參數，諸如用於多聲道信號之不同頻帶的多個聲道間相位差參數。然後，於步驟22，於各個參數頻帶中之頻譜值係使用針對此特定頻帶的對應窄帶對準參數加以對準。於步驟22，當針對各個聲道進行此程序時，對此有窄帶對準參數可用，然後藉圖1之信號處理器300用於進一步信號處理可用的第一及第二或左/右聲道。

圖4b例示圖1之多聲道編碼器的又一實施例，於該處於頻域進行數個程序。

更明確言之，多聲道編碼器進一步包含時間-頻譜轉換器150，其用於將時域多聲道信號轉換成頻域中之該等至少兩個聲道的頻譜表示型態。

又復，如於152例示，圖1中於100、200及300例示的參數決定器、信號對準器及信號處理器全部皆於頻域操作。

又復，多聲道編碼器及，特別地，信號處理器進一步包含一頻譜-時間轉換器154，用於至少產生中間信號的時域表示型態。

較佳地，頻譜-時間轉換器額外地也將藉由方塊152表示的程序所決定的側邊信號之頻譜表示型態轉換成時域表示型態，及然後，圖1之信號編碼器400經組配以，取決於圖1之信號編碼器400之特定實施例，進一步將中間信號及/或側邊信號編碼為時域信號。

較佳地，圖4b之時間-頻譜轉換器150係經組配以實施圖4c的步驟155、156及157。特別地，步驟155包含提供分析視窗在其一端具有至少一個零填補部，及特別地，例如，於後文中圖7例示的於初始視窗部的零填補部及於終結視窗部的零填補部。又復，分析視窗額外地具有於視窗的第一半部及於視窗的第二半部之重疊範圍或重疊部，及此外，較佳地，視情況而定，中間部分為非重疊範圍。

於步驟156，各個聲道使用具有重疊範圍之分析視窗加以視窗化。更明確言之，各個聲道使用分析視窗加以視窗化，使得獲得聲道之第一區塊。隨後，獲得該聲道之第二區塊，其具有與第一區塊的某個重疊範圍等等，使得例如接續於五次視窗化操作之後，可利用各個聲道之五個視窗化樣本區塊，然後如於圖4c中於157例示，個別被變換成頻譜表示型態。對其它聲道也進行相同程序，因而於步驟157結束時，一序列之頻譜值區塊及特別，可得複合頻譜值，諸如DFT頻譜值或複合子頻帶樣本。

於步驟158，其係藉圖1之參數決定器100進行，決定寬帶對準參數，及於步驟159，其係藉圖1之信號對準器200進行，使用寬帶對準參數進行圓形移位。於步驟160，再度藉圖1之參數決定器100進行，針對個別頻帶/子頻帶決定窄帶對準參數，及於步驟161，使用針對特定頻帶決定的對應窄帶對準參數而對各個頻帶旋轉已對準之頻譜值。

圖4d例示由信號處理器300進行的進一步程序。更明確言之，信號處理器300係經組配以計算中間信號及側邊信號，如於步驟301例示。於步驟302，可進行側邊信號之某種進一步處理，及然後於步驟303，各區塊的中間信號及側邊信號被變換回時域，及於步驟304，合成視窗施加至藉步驟303獲得的各個區塊，及於步驟305，一方面進行針對中間信號的重疊加法操作，及另一方面進行針對側邊信號的重疊加法操作，以最終進行時域中間/側邊信號。

更明確言之，步驟304及305之操作導致自一區塊的中間信號的一種交叉衰退，或進行下個區塊的中間信號及側邊信號中之側邊信號，使得即便當出現任何參數變化時，諸如出現聲道間時間差參數或聲道間相位差參數，雖言如此，此點將於圖4d中藉步驟305獲得的時域中間/側邊信號為無法稽核。

新穎低延遲立體聲寫碼為聯合中間/側邊(M/S)立體聲寫碼探勘有些空間線索，於該處中間聲道係藉主單聲道核心寫碼器寫碼，及側邊聲道係藉副核心寫碼器寫碼。編碼器及解碼器原理於圖6a、6b中描繪。

立體聲處理主要於頻域(FD)進行。選擇性地，在頻率分析之前，可於時域(TD)進行立體聲處理。此乃針對ITD計算的情況，其可在頻率分析之前計算及施加，用於在追求立體聲分析及處理之前的時間對準該等聲道。另外，ITD處理可於頻域直接進行。因尋常語音寫碼器例如ACELP不含任何內部時間-頻率分解，故立體聲寫碼在核心編碼器之前利用分析及合成濾波器排組增加額外複合經調變的濾波器排組及在核心解碼器之後增加分析-合成濾波器排組的另一階段。於較佳實施例中，採用具有低重疊區的過取樣DFT。然而，於其它實施例中，可使用具有相似的時間解析度的任何複合值時間-頻率分解。

立體聲處理包含計算空間線索：聲道間時間差(ITD)、聲道間相位差(IPD)、及聲道間位準差(ILD)。ITD及IPD使用在輸入立體聲信號上用於時間及相位上對準兩個聲道L及R。ITD係於寬帶或於時域計算，而IPD及ILD係針對參數頻帶中之各者或部分計算，其對應頻率空間的非一致分解。一旦兩個聲道對準，施加聯合M/S立體聲，於該處然後進一步自中間信號預測側邊信號。預測增益係自ILD推衍。

中間信號進一步藉主核心寫碼器寫碼。於較佳實施例中，主核心寫碼器為3GPP EVS標準，或自其推衍的寫碼可在語音寫碼模式ACELP與基於MDCT變換的樂音模式間切換。較佳地，ACELP及以MDCT為基礎的寫碼器係由時域頻寬擴延(TD-BWE)及或智能間隙填補(IGF)模組分別支援。

側邊信號首先係由中間聲道使用自ILD推衍的預測增益預測。殘差可進一步藉中間信號的延遲版本預測，或藉副核心寫碼器直接寫碼，於較佳實施例中，於MDCT域進行。在編碼器的立體聲處理可藉圖5摘述，容後詳述。

圖2例示用於解碼於輸入線路50接收的經編碼之多聲道信號之設備的一實施例的方塊圖。

更明確言之，信號由輸入介面600接收。連結至輸入介面600者為信號解碼器700及信號解對準器900。又復，信號處理器800一方面連結至信號解碼器700及另一方面連結至信號解對準器。

更明確言之，經編碼之多聲道信號包含經編碼之中間信號、經編碼之側邊信號、寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊。因此，線路50上的經編碼之多聲道信號可恰為與由圖1之輸出介面500所輸出的相同信號。

然而，要緊地，此處須注意，與圖1中例示者相反地，涵括於某種形式的經編碼信號中之寬帶對準參數及複數窄帶對準參數可恰為如於圖1中由信號對準器200使用的對準參數，但另外，也可以是其逆值，亦即，恰由信號對準器200進行的相同操作但具有逆值，使得獲得解對準的參數。

如此，對準參數上之資訊可以是如由圖1中之信號對準器200使用的對準參數，或可以是其逆值，亦即，實際「解對準參數」。此外，此等參數典型地以某種形式量化，容後參考圖8討論。

圖2之輸入介面600分開得自經編碼之中間/側邊信號的寬帶對準參數及複數窄帶參數上之資訊，及透過參數線路610前傳此資訊至信號解對準器900。另一方面，經編碼之中間信號透過線路601前傳至信號解碼器700，及經編碼之側邊信號透過信號線路602前傳至信號解碼器700。

信號解碼器係經組配以解碼經編碼之中間信號及解碼經編碼之側邊信號而在線路701上獲得經解碼之側邊信號及在線路702上獲得經解碼之中間信號。此等信號由信號處理器800使用於，自經解碼之中間信號及經解碼之側邊信號，計算經解碼之第一聲道信號或經解碼之左信號及計算經解碼之第二聲道或經解碼之右聲道信號，及經解碼之第一聲道信號及經解碼之第二聲道分別於線路801、802上輸出。信號解對準器900係經組配以使用寬帶對準參數上的資訊解對準在線路801上的經解碼之第一聲道及經解碼之右聲道802，及此外，使用複數窄帶對準參數上之資訊以獲得經解碼之多聲道信號，亦即，在線路901及902上具有至少兩個已解碼且已解對準之聲道的解碼信號。

圖9a例示藉得自圖2之信號解對準器900進行的較佳步驟順序。更明確言之，步驟910接收已對準的左及右聲道，如自圖2在線路801、802上可得。於步驟910，信號解對準器900使用窄帶對準參數上之資訊而解對準個別子頻帶，以便於911a及911b獲得相位經解對準的經解碼之第一及第二或左及右聲道，於步驟912，該等聲道使用寬帶對準參數解對準，因此於913a及913b獲得相位及時間經解對準的聲道。

於步驟914，進行任何進一步處理，包含使用視窗化或重疊加法操作，或通常使用任何交叉衰退操作，以便於915a及915b獲得假信號縮減的或無假信號的解碼信號，亦即，至沒有任何假信號的經解碼之聲道，但一方面針對寬帶及另一方面針對複數窄帶典型地曾有時變解對準參數。

圖9b例示圖2中例示的多聲道解碼器之一較佳實施例。

特別，圖2之信號處理器800包含時間-頻譜轉換器810。

又復，信號處理器包含中間/側邊至左/右轉換器820以便自中間信號M及側邊信號S計算左信號L及右信號R。

然而，要緊地為了於方塊820中藉中間/側邊至左/右轉換計算L及R，非必要使用側邊信號S。取而代之，容後詳述，左/右信號初步只使用自聲道間位準差參數ILD推衍得之增益參數計算。一般而言，預測增益也可被考慮為一種ILD的形式。增益可自ILD推衍，但也可直接計算。較佳不再計算ILD，但直接計算預測增益及發射之，且使用預測增益於解碼器而非使用ILD參數。

因此，於此實施例中，側邊信號S只使用於聲道更新器830，如由旁通線路821例示，其操作以便使用被發射的側邊信號提供較佳的左/右信號。

因此，轉換器820使用透過位準參數輸入822獲得的位準參數操作，而未實際上使用側邊信號S，但然後聲道更新器830使用側邊821，及取決於特定實施例使用透過線路831接收的立體聲填充參數操作。然後信號對準器900包含相位解對準器及能定標器910。能定標係藉由定標因數計算器940推衍的定標因數控制。定標因數計算器940係由聲道更新器830之輸出饋入。基於透過輸入911接收的窄帶對準參數，進行相位解對準，及於方塊920，基於透過線路921接收的寬帶對準參數，進行時間解對準。最後，進行頻譜-時間轉換930以便最終獲得解碼信號。

圖9c例示於一較佳實施例中，於圖9b之方塊920及930內部典型進行之又一步驟順序。

更明確言之，窄帶解對準聲道輸入功能對應圖9b之方塊920的寬帶解對準內。於方塊931進行DFT或任何其它變換。實際計算時域樣本之後，進行使用合成視窗的選擇性合成視窗化。合成視窗較佳地恰與分析視窗相同，或自分析視窗推衍得，例如，內插或降取樣，但以某種方式取決於分析視窗。相依性較佳地為使得針對重疊範圍中之各點由兩個重疊視窗界定的乘數因子加總至1。如此，於方塊932中之合成視窗之後，進行重疊操作及隨後加法操作。另外，替代合成視窗及重疊/加法操作，針對各聲道進行在接續方塊間之任何交叉衰退，以便如圖9a之脈絡中已經討論，獲得假信號縮減的解碼信號。

當考慮圖6b時，清楚可知針對中間信號的實際解碼操作，亦即一方面「EVS解碼器」，及針對側邊信號，反向量量化VQ^-1 及反MDCT操作(IMDCT)對應圖2之信號解碼器700。

又復，方塊810中之DFT操作對應圖9b中之元件810，及反信號處理器及反時移功能對應圖2之方塊800、900，及圖6b之反DFT操作930對應圖9b中之方塊930中之對應操作。

接著以進一步細節討論圖3。特別，圖3例示具有個別頻譜線的DFT頻譜。較佳地，DFT頻譜或圖3中例示的任何其它頻譜為複合頻譜，及各線為具有振幅及相位或具有真實部分及虛擬部分的複合頻譜線。

此外，頻譜也分割成不同參數頻帶。各個參數頻帶具有至少一個及較佳地多於一個頻譜線。此外，參數頻帶自低頻增至高頻。典型地，寬帶對準參數為用於整個頻譜，亦即，用於包含圖3中之具體實施例中之全部頻帶1至6的頻譜，的單一寬帶對準參數。

又復，提出複數窄帶對準參數，使得針對各個參數頻帶有單一對準參數。如此表示針對一頻帶的對準參數總是施加至對應頻帶內部的全部頻譜值。

又復，除了窄帶對準參數之外，位準參數也提供給各個參數頻帶。

與提供給頻帶1至頻帶6之各個及每個參數頻帶的位準參數相反地，較佳只提供複數窄帶對準參數給有限數目的較低頻帶，諸如頻帶1、2、3及4。

此外，立體聲填充參數提供給某個頻帶數目，較低頻帶除外，諸如於該具體實施例中頻帶4、5及6，但有用於較低參數頻帶1、2及3的側邊信號頻譜值，結果，針對此等較低頻帶不存在有立體聲填充參數，於該處使用側邊信號本身或表示側邊信號的預測殘差信號獲得波形匹配。

如已描述，諸如於圖3中之實施例中於較高頻帶存在有更多頻譜線，於參數頻帶6有七條頻譜線相較於參數頻帶2有三條頻譜線。然而，當然，參數頻帶數目、頻譜線數目、及一參數頻帶內部的頻譜線數目、及亦針對某些參數的不同極限將為不同。

雖言如此，圖8例示參數之分配及被提供參數的頻帶數目，於某個實施例中與圖3相反地，實際提供12頻帶。

如圖例示，提供位準參數ILD給12頻帶中之各者，且經量化至由每頻帶五位元表示的量化準確度。

又復，窄帶對準參數IPD只提供給較低頻帶至2.5 kHz的寬帶。此外，聲道間時間差或寬帶對準參數只提供為全頻譜的單一參數，但針對全頻帶由8位元表示有極高量化準確度。

又復，提出相當粗糙的量化立體聲填充參數，每頻帶由3位元表示，而非針對低於1 kHz的較低頻帶，原因在於針對較低頻帶涵括實際編碼側邊信號或側邊信號殘差頻譜值。

隨後，就圖5摘述在編碼器端上的較佳處理。於第一步驟中，進行左及右聲道的DFT分析。該程序對應圖4c之步驟155至157。於步驟158，計算寬帶對準參數，及特別較佳寬帶對準參數聲道間時間差(ITD)。如於170例示，進行頻域中L及R的時移。另外，也在時域進行此種時移。然後進行反DFT，於時域進行時移，及進行額外正DFT以便再度在使用寬帶對準參數對準之後具有頻譜表示型態。

ILD參數，亦即位準參數及相位參數(IPD參數)在經移位L及R表示型態上針對各個參數頻帶計算，如於步驟171例示。此步驟例如對應圖4c之步驟160。時移L及R表示型態以聲道間相位差參數之函數旋轉，如圖4c之步驟161或圖5例示。接著，如步驟301例示，計算中間及側邊信號，及較佳地，額外有能轉換操作，容後詳述。於接續步驟174中，使用M為ILD之函數及選擇性地使用過去M信號，亦即稍早時框的中間信號，進行S之預測。接著，進行中間信號及側邊信號的反DFT，其對應較佳實施例中圖4d的步驟303、304、305。

於最末步驟175，時域中間信號m及選擇性地，殘差信號係如於步驟175例示編碼。此程序對應由圖1中之信號編碼器400進行者。

於反立體聲處理中於解碼器，側邊信號係於DFT域產生，首先自中間信號預測為：於該處g為針對各個參數頻帶計算的增益且為發射的聲道間位準差(ILD)之函數。

然後，預測殘差可以兩個不同方式精製： -藉殘差信號之二次寫碼：於該處g_cod 為針對全頻譜發射的全域增益 -藉殘差預測，稱作立體聲填充，以得自前一DFT框的先前解碼中間信號頻譜預測殘差側邊頻譜：於該處g_pred 為針對各個參數頻帶發射的預測增益。

於相同DFT頻譜內可混合兩型寫碼精製。於較佳實施例中，殘差寫碼施加於較低參數頻帶上，而殘差預測施加至其餘頻帶上。於如圖1中描繪的較佳實施例中，殘差寫碼在時域合成殘差側邊信號及藉MDCT變換之後於MDCT域進行。不似DFT，MDCT係經臨界取樣且更適用於音訊寫碼。MDCT係數係藉晶格向量量化而直接地向量量化，但另可藉純量量化器接著熵寫碼器寫碼。另外，殘差側邊信號也於時域藉語音寫碼技術寫碼，或於DFT域直接寫碼。 1.時間-頻率分析：DFT

要緊地，自藉DFT進行的立體聲處理之額外時間-頻率分解允許良好聽覺場景分析，同時不會顯著增加寫碼系統的總延遲。藉由內設，使用10毫秒(核心寫碼器之20毫秒時框的兩倍)的時間解析度。分析及合成視窗為相同及對稱。視窗於圖7中以16 kHz的取樣率表示。可觀察得重疊區受限用以減少造成的延遲，及當施加ITD於頻域時，也加入零填補以逆平衡圓形移位，容後詳述。 2.立體聲參數

立體聲參數最大可以立體聲DFT的時間解析度發射。於最小值，可減少至核心寫碼器的時框解析度，亦即20毫秒。藉由內設，當未檢測得暫態時，歷2 DFT視窗每20毫秒計算參數。參數頻帶構成約略等效矩形頻寬(ERB)的兩倍或四倍之後的頻譜的非一致且非重疊分解。藉由內設，4售ERB尺規係使用於16 kHz頻帶寬度共12頻帶(32 kbps取樣率，超寬帶立體聲)。圖8摘述組態實例，對此立體聲邊帶資訊係以約5 kbps發射。 3.ITD之計算及聲道時間對準

ITD係使用帶有相位變換的通用交互關係(GCC-PHAT)藉估計到達時間延遲(TDOA)計算：於該處L及R分別為左及右聲道的頻譜。頻率分析可與使用於接續立體聲處理的DFT獨立進行或可分享。用於計算ITD的假碼如下：

圖4e例示用於實施稍早例示的假碼之流程圖，以便獲得聲道間時間差之穩健有效的計算作為寬帶對準參數之實例。

於方塊451，進行針對第一聲道(l)及第二聲道(r)的時域信號之DFT分析。此種DFT分析典型地將為例如於圖5或圖4c之步驟155至157之脈絡中已經討論者的相同DFT分析。

針對各個頻率倉進行交叉關聯，如方塊452例示。

如此，針對左及右聲道的全頻譜範圍獲得交叉關聯頻譜。

於步驟453，然後針對L及R之振幅頻譜計算頻譜平坦度量，及於步驟454，選取較大的頻譜平坦度量。然而，於步驟454的選擇並非必然需要選擇較大者，但自二聲道單一SFM的決定也可能是只有左聲道或只有右聲道的計算及選擇，或可以是二SFM值之加權平均的計算。

於步驟455，取決於頻譜平坦度量，然後交叉關聯頻譜隨著時間之推移而平滑化。

較佳地，頻譜平坦度量係由振幅頻譜之幾何平均除以振幅頻譜之算術平均計算。如此，SFM值限於0至1間。

於步驟456，然後平滑化的交叉關聯頻譜藉其振幅標準化，及於步驟457，計算已標準化之平滑化的交叉關聯頻譜的反DFT。於步驟458，較佳地進行某個時域濾波，但取決於實施例，此時域濾波也可不考慮但為較佳，容後詳述。

於步驟459，藉濾波通用交叉關係函數的峰值拾取及藉進行某個臨界化操作而進行ITD估計。

若未獲得某個臨界值，則IDT設定為零，及對此對應區塊未進行時間對準。

ITD計算也可摘述如下。取決於頻譜平坦度量，在被平滑化之前，於頻域計算交叉關聯。SFM限於0至1間。以類似雜訊信號為例，SFM將為高(亦即，約1)及平滑化將為弱。以類似調性信號為例，SFM將為低及平滑化將變強。然後，在變換回時域之前，平滑化的交叉關聯藉其幅值加以標準化。標準化對應交叉關聯的相位變換，且已知於低雜訊及相對高混響環境中，顯示比較正常交叉關聯更佳的效能。如此所得的時域功能首先經濾波用以達成更穩健的峰值拾取。對應最大幅值的指數對應左及右聲道間之時間差(ITD)估值。若最大幅值係低於給定臨界值，則ITD之估計不視為可靠且被設定為零。

若於時域施加時間對準，則於分開DFT分析計算ITD。移位進行如下：

要求於編碼器的額外延遲，其至多等於可處理的最大ITD絕對值。ITD隨時間之變化係藉DFT之分析視窗化加以平滑化。

另外，可於頻域施加時間對準。於此種情況下，ITD計算及圓形移位係在相同DFT域，與此種另一個立體聲處理分享的域。圓形移位係藉下式給定：

需要DFT視窗的零填補來以圓形移位模擬時移。零填補的大小對應可處理的ITD最大絕對值。於較佳實施例中，藉將3.125毫秒零加在兩端上，零填補一致分裂在分析視窗兩側上。可能ITD最大絕對值則為6.25毫秒。於A-B麥克風配置中，最惡劣情況係對應兩個麥克風間約2.15米之最大距離。ITD隨時間之變化係藉DFT之合成視窗化及重疊加法加以平滑化。

要緊地，時移之後接著已移位信號之視窗化。此乃與先前技術雙耳線索編碼(BCC)的主要區別，於該處時移施加至視窗化信號上，但於合成階段未進一步視窗化。結果，ITD隨時間之任何變化於解碼信號產生人造暫態/單擊。 4.IPD之計算及聲道旋轉

在時間對準二聲道之後，計算IPD及取決於立體聲組態，此點用於各個參數頻帶或至少高達給定ipd_max_band。然後，IPD施加至二聲道用以對準其相位：

於該處、、及b為屬於頻率指數k的參數頻帶指數。參數β負責二聲道間分配相位旋轉量同時使其相位對準。β取決於IPD但也取決於聲道之相對振幅位準ILD。若一聲道具有較高振幅，則將被視為領先聲道且比具有較低振幅的聲道將較不受相位旋轉的影響。 5.和-差及側邊信號寫碼

和差變換係在二聲道的時間及相位經對準的頻譜上進行，使得於中間信號節能。於該處限於1/1.2與1.2間，亦即-1.58至+1.58分貝。當調整M及S之能時，該項限制避免了假信號。值得注意者為當時間及相位經事先對準時，此種節能較不重要。另外，界限可予增減。

進一步以M預測側邊信號S：於該處，於該處。另外，藉由最小化殘差及由先前方程式推衍的ILD的均方差(MSE)可得最佳預測增益g。

殘差信號S’(f)可藉兩種手段模型化：或以M之延遲頻譜預測，或於MDCT域中直接於MDCT域寫碼。 6.立體聲解碼

中間信號X及側邊信號S首先轉換成左及右聲道L及R如下：於該處每個參數頻帶之增益g係自ILD參數推衍：。

針對低於cod_max_band的參數頻帶，該等二聲道係以經解碼的側邊信號更新：針對較高參數頻帶，側邊信號經預測及聲道更新為：最後，聲道乘以複合值，目標回復立體聲信號的原先能及聲道間相位：於該處於該處a係如前定義及如前定義畫界，及於該處，及於該處atan2(x,y)為x/y的四象限反正切。

最後，取決於被發射的ITD，聲道於時域或於頻域時移。時域聲道係藉反DFT及重疊加法合成。

本發明之特定特徵係與空間線索及和-差聯合立體聲寫碼之組合相關。更明確言之，空間線索IDT及IPD係經計算及施加於立體聲聲道(左及右)上。又復，和-差(M/S信號)經計算，及較佳地，以M施加S的預測。

於解碼器端上，寬帶及窄帶空間線索連同和-差聯合立體聲寫碼組合。更明確言之，使用至少一個空間線索諸如ILD預測側邊信號，及計算反和-差用以獲得左及右聲道，及此外，寬帶及窄帶空間線索施加於左及右聲道上。

較佳地，編碼器有一視窗及在使用ITD處理後，相對於時間對準聲道重疊-加法。又復，在施加聲道間時間差之後，解碼器額外有經移位的或經解對準的聲道版本之視窗化及重疊-加法操作。

使用GCC-Phat方法之聲道間時間差的計算乃特別穩健的方法。

新穎程序為優異的先前技術，原因在於以低延遲達成立體聲音訊或多聲道音訊的位元率寫碼。特別設計針對輸入信號之不同性質及多聲道或立體聲紀錄之不同配置為穩健。特別，本發明對位元率立體聲語音寫碼提供良好品質。

較佳程序可使用於全部類型立體聲音訊或多聲道音訊內部諸如語音及樂音的廣播分配在一給定低位元率具有恆定感官品質。此種應用區為數位無線電、網際網路串流、或音訊通訊應用。

發明編碼音訊信號可儲存於數位儲存媒體或非暫態儲存媒體上，或可在發射媒體諸如無線發射媒體或有線發射媒體諸如網際網路上。

雖然有些面向已經於設備之脈絡中描述，顯然此等面向也表示對應方法的描述，於該處一區塊或裝置對應方法步驟或方法步驟之特徵。類似地，於方法步驟之脈絡中描述的面向也表示對應區塊或對應設備之項目或特徵的描述。

取決於某些實施例要求，本發明之實施例可於硬體或軟體實施。實施例可使用數位儲存媒體進行，例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體，具有儲存其上之電子可讀取控制信號，其與可規劃電腦系統協力(或能協力)因而進行個別方法。

依據本發明之若干實施例包含一種具有電子可讀取控制信號的資料載體，其可與可規劃電腦系統協力，因而進行本文描述的方法中之一者。

概略言之，本發明之實施例可實施為帶程式碼的電腦程式產品，當電腦程式產品在電腦上跑時，程式碼係針對進行方法中之一者操作。程式碼例如可儲存於機器可讀取載體上。

其它實施例包含儲存於機器可讀取載體上或非暫態儲存媒體上用於進行本文描述的方法中之一者的電腦程式。

換言之，因此，本發明方法之實施例為當電腦程式產品在電腦上跑時，具有用於進行本文描述的方法中之一者的程式碼之電腦程式。

因此，本發明方法之進一步實施例為包含用於進行本文描述的方法中之一者的電腦程式紀錄於其上的資料載體(或數位儲存媒體，或電腦可讀取媒體)。

因此，本發明方法之進一步實施例為表示用於進行本文描述的方法中之一者的電腦程式之一資料串流或一串列之信號。該資料串流或該串列之信號例如可經組配以透過資料通訊連結，例如透過網際網路移轉。

又一實施例包含處理構件，例如電腦，或可程式化邏輯裝置，經組配以或適用以進行本文描述的方法中之一者。

又一實施例包含具有用於進行本文描述的方法中之一者的電腦程式安裝於其上的電腦。

於若干實施例中，可程式化邏輯裝置(例如，現場可程式閘陣列)可使用以進行本文描述的方法之部分或全部功能。於若干實施例中，現場可程式閘陣列可與微處理器協力以便進行本文描述的方法中之一者。通常，該等方法較佳地係藉任何硬體設備進行。

前述實施例僅為本發明之實施例的原理之例示。須瞭解本文描述的配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此意圖僅受隨附之申請專利範圍所限，而非藉由此處實施例之描述及解釋呈示的特定細節所限。

10‧‧‧多聲道信號 12、43、610‧‧‧參數線路 14‧‧‧又一參數線路 15‧‧‧連接線 16、17、21、22、155-161、171-175、301-305、451-459‧‧‧步驟 20‧‧‧已對準之聲道 31‧‧‧中間信號 32‧‧‧側邊信號 50‧‧‧輸出線路 100‧‧‧參數決定器 150、810‧‧‧時間-頻譜轉換器 152、451-459、820、920、931-933‧‧‧方塊 154、930‧‧‧頻譜-時間轉換器 200‧‧‧信號對準器 300、800‧‧‧信號處理器 400‧‧‧信號編碼器 500‧‧‧輸出介面 600‧‧‧輸入介面 601、701、702、801、802、901、902、911a-b、913a-b、915a-b、921‧‧‧線路 602‧‧‧信號線路 700‧‧‧信號解碼器 820‧‧‧中間/側邊至左/右轉換器 821‧‧‧旁通線路 822‧‧‧位準參數輸入 830‧‧‧聲道更新器 900‧‧‧信號解對準器 910‧‧‧相位解對準器及能定標器 911‧‧‧輸入 940‧‧‧定標因數計算器

隨後，參考附圖討論本發明之較佳實施例，附圖中：圖1為用於編碼多聲道信號之一設備的一較佳實施例之方塊圖；圖2為用於解碼一經編碼之多聲道信號之一設備的一較佳實施例；圖3為針對某些實施例不同頻率解析度及其它頻率相關面向之例示；圖4a為編碼設備用於對準聲道中進行的程序之流程圖；圖4b例示於頻域中進行的程序之一較佳實施例；圖4c例示使用具有零填補部及重疊範圍之一分析視窗，於編碼設備中進行的程序之一較佳實施例；圖4d例示於編碼設備中進行的程序之一流程圖；圖4e例示顯示聲道間時間差估計之一較佳實施例的一流程圖；圖5例示一流程圖其例示於編碼設備中進行的程序之又一實施例；圖6a例示編碼器之一實施例的方塊圖；圖6b例示解碼器之一對應實施例的流程圖；圖7例示具有低重疊正弦視窗的一較佳視窗情況，帶有零填補用於立體聲時間-頻率分析及合成；圖8例示顯示不同參數值之位元消耗的一表；圖9a例示於一較佳實施例中，藉用於解碼一經編碼之多聲道信號之一設備進行的程序；圖9b例示用於解碼一經編碼之多聲道信號之設備的一較佳實施例；及圖9c例示於一經編碼之多聲道信號的解碼情境中於寬帶解對準脈絡中進行的程序。

10‧‧‧多聲道信號

12、43‧‧‧參數線路

14‧‧‧又一參數線路

15‧‧‧連接線

20‧‧‧已對準之聲道

31‧‧‧中間信號

32‧‧‧側邊信號

41、42‧‧‧線路

50‧‧‧輸出線路

100‧‧‧參數決定器

200‧‧‧信號對準器

300‧‧‧信號處理器

400‧‧‧信號編碼器

500‧‧‧輸出介面

Claims

一種用於編碼具有至少兩個聲道的一多聲道信號的設備，其包含：一參數決定器用於自該多聲道信號決定一寬帶對準參數及複數窄帶對準參數；一信號對準器用於使用該寬帶對準參數及該等複數窄帶對準參數對準該等至少兩個聲道以獲得已對準之聲道；一信號處理器用於使用該等已對準之聲道計算一中間信號及一側邊信號；一信號編碼器用於編碼該中間信號以獲得一經編碼之中間信號及用於編碼該側邊信號以獲得一經編碼之側邊信號；及一輸出介面用於產生一經編碼之多聲道信號包含該經編碼之中間信號、該經編碼之側邊信號、該寬帶對準參數上之資訊、及該等複數窄帶對準參數上之資訊。
如請求項1之設備，其中該參數決定器係經組配以使用該等至少兩個聲道之一寬帶表示型態決定該寬帶對準參數，該寬帶表示型態包含該等至少兩個聲道中之各者的至少兩個子頻帶，及其中該信號對準器係經組配以進行該等至少兩個聲道之該寬帶表示型態的一寬帶對準以獲得該等至少兩個聲道之一經對準的寬帶表示型態。
如請求項1或2之設備，其中該參數決定器係經組配以針對該等至少兩個聲道之一經對準的寬帶表示型態的至少一個子頻帶決定一分開窄帶對準參數，及其中該信號對準器係經組配以使用針對一對應子頻帶的該窄帶參數個別地對準該經對準的寬帶表示型態的各個子頻帶以獲得包含針對該等至少兩個聲道中之各者的多個經對準的子頻帶之一經對準的窄帶表示型態。
如先前請求項中任一項之設備，其中該信號處理器係經組配以使用針對該等至少兩個聲道中之各者的多個經對準的子頻帶計算用於該中間信號的該等多個子頻帶及用於該側邊信號的多個子頻帶。
如先前請求項中任一項之設備，其中該參數決定器係經組配以計算針對該多聲道信號之多個子頻帶中之各者的一聲道間時間差參數作為該寬帶對準參數或一聲道間相位差作為該等複數窄帶對準參數。
如先前請求項中任一項之設備，其中該參數決定器係經組配以針對該多聲道信號之多個子頻帶中之各者計算一預測增益或一聲道間位準差，及其中該信號編碼器係經組配以使用一子頻帶中之該中間信號及使用該子頻帶之該聲道間位準差或該預測增益進行於該子頻帶中之該側邊信號的一預測。
如先前請求項中任一項之設備，其中該信號編碼器係經組配以計算及編碼自該側邊信號推衍的一預測殘差信號、該等至少兩個聲道間之一預測增益或一聲道間位準差、該中間信號及一經延遲的中間信號，或其中於一子頻帶中之該預測增益係使用於該子頻帶中之該等至少兩個聲道間之該聲道間位準差計算，或其中該信號編碼器係經組配以使用一語音寫碼器或一樂音/語音切換寫碼器或一時域頻寬擴延編碼器或一頻域間隙填充編碼器編碼該中間信號。
如先前請求項中任一項之設備，其進一步包含：一時間-頻譜轉換器用於產生於一頻譜域中該等至少兩個聲道之一頻譜表示型態，其中該參數決定器及該信號對準器及該信號處理器係經組配以於該頻譜域中操作，及其中該信號處理器更進一步包含用於產生該中間信號之一時域表示型態的一頻譜-時間轉換器，及其中該信號編碼器係經組配以編碼該中間信號之該時域表示型態。
如先前請求項中任一項之設備，其中該參數決定器係經組配以使用一頻譜表示型態計算該寬帶對準參數，其中該信號對準器係經組配以使用該寬帶對準參數將一圓形移位施加至該等至少兩個聲道之該頻譜表示型態以針對該等至少兩個聲道獲得寬帶經對準之頻譜值，或其中該參數決定器係經組配以自該等寬帶經對準之頻譜值計算該等複數窄帶對準參數，及其中該信號對準器係經組配以使用該等複數窄帶對準參數旋轉該等寬帶經對準之頻譜值。
如請求項8或9之設備，其中該時間-頻譜轉換器係經組配以將一分析視窗施加至該等至少兩個聲道中之各者，其中該分析視窗在其一左側或一右側上具有一零填補部，其中該零填補部決定該寬帶對準參數之一最大值或其中該分析視窗具有一初重疊區、一中非重疊區、及一尾重疊區或其中該時間-頻譜轉換器係經組配以施加一串列之重疊視窗，其中一視窗之一重疊部的一長度與該視窗之一非重疊部的一長度一起等於該信號編碼器之一時框化的一分量。
如請求項8至10中任一項之設備，其中該頻譜-時間轉換器係經組配以使用一合成視窗，該合成視窗係與由該時間-頻譜轉換器使用的該分析視窗相同或係自該分析視窗推衍。
如先前請求項中任一項之設備，其中該信號處理器係經組配以計算該中間信號或該側邊信號的一時域表示型態，其中計算該時域表示型態包含：視窗化該中間信號或該側邊信號的樣本之一目前區塊以獲得一視窗化目前區塊，視窗化該中間信號或該側邊信號的樣本之一隨後區塊以獲得一視窗化隨後區塊，及加總於一重疊範圍內該視窗化目前區塊之樣本及該視窗化隨後區塊之樣本以獲得針對該重疊範圍之該時域表示型態。
如先前請求項中任一項之設備，其中該信號編碼器係經組配以編碼該側邊信號或於一第一集合之子頻帶中推衍自該側邊信號及該中間信號的一預測殘差信號，及於與該第一集合之子頻帶不同的一第二集合之子頻帶中，編碼一增益參數推衍的側邊信號及於時間上稍早的一中間信號，其中針對該第二集合之子頻帶該側邊信號或一預測殘差信號係未經編碼。
如請求項13之設備，其中該第一集合之子頻帶具有於頻率上比於該第二集合之子頻帶中之頻率更低的子頻帶。
如先前請求項中任一項之設備，其中該信號編碼器係經組配以使用一MDCT變換及一量化諸如一向量或一純量或該側邊信號之MDCT係數之任何其它量化而編碼該側邊信號。
如先前請求項中任一項之設備，其中該參數決定器係經組配以針對具有頻寬之個別頻帶決定該等複數窄帶對準參數，其中具有一第一中心頻率的一第一頻帶之一第一頻寬係低於具有一第二中心頻率的一第二頻帶之一第二頻寬，其中該第二中心頻率係大於該第一中心頻率或其中該參數決定器係經組配以只針對高達一邊界頻率的頻帶決定該等窄帶對準參數，該邊界頻率係低於該中間信號或該側邊信號之一最大頻率，及其中該對準器係經組配以使用該寬帶對準參數只對準具有頻率高於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道及使用該寬帶對準參數及該等窄帶對準參數對準具有頻率低於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道。
如先前請求項中任一項之設備，其中該參數決定器係經組配以使用一通用交叉關聯使用估計一到達時間延遲計算該寬帶對準參數，及其中該信號對準器係經組配以使用一時移於一時域或使用一圓形移位於一頻域施加該寬帶對準參數，或其中該參數決定器係經組配以使用下列計算該寬帶參數：計算該第一聲道與該第二聲道間之一交叉關聯頻譜；針對該第一聲道或該第二聲道或二聲道計算一頻譜形狀上的一資訊；取決於該頻譜形狀上的該資訊平滑化該交叉關聯頻譜；選擇性地，標準化該經平滑化的交叉關聯頻譜；決定該經平滑化的及該選擇性地標準化的交叉關聯頻譜的一時域表示型態；及分析該時域表示型態以獲得該聲道間時間差作為該寬帶對準參數。
如先前請求項中任一項之設備，其中該信號處理器係經組配以使用一能定標因數計算該中間信號及該側邊信號及其中該能定標因數係受限於至多2與至少0.5間，或其中該參數決定器係經組配以藉決定於該頻帶內部之該等第一及第二聲道的頻譜值之積的一複合和的一角而針對一頻帶計算一標準化對準參數，或其中該信號對準器係經組配以進行該窄帶對準使得該等第一及第二聲道兩者接受一聲道旋轉，其中具有一較高振幅之一聲道的一聲道旋轉係被旋轉達比具有一較小振幅之一聲道一更小程度。
一種用於編碼具有至少兩個聲道的一多聲道信號的方法，其包含：自該多聲道信號決定一寬帶對準參數及複數窄帶對準參數；使用該寬帶對準參數及該等複數窄帶對準參數對準該等至少兩個聲道以獲得已對準之聲道；使用該等已對準之聲道計算一中間信號及一側邊信號；編碼該中間信號以獲得一經編碼之中間信號及編碼該側邊信號以獲得一經編碼之側邊信號；及產生一經編碼之多聲道信號包含該經編碼之中間信號、該經編碼之側邊信號、該寬帶對準參數上之資訊、及該等複數窄帶對準參數上之資訊。
一種經編碼之多聲道信號，其包含一經編碼之中間信號、一經編碼之側邊信號、一寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊。
一種用於解碼包含一經編碼之中間信號、一經編碼之側邊信號、一寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊的一經編碼之多聲道信號之設備，其包含：一信號解碼器用於解碼該經編碼之中間信號以獲得一經解碼之中間信號及用於解碼該經編碼之側邊信號以獲得一經解碼之側邊信號；一信號處理器用於自該經解碼之中間信號及該經解碼之側邊信號計算一經解碼之第一聲道及經解碼之第二聲道；及一信號解對準器用於使用該寬帶對準參數上之該資訊及該等複數窄帶對準參數上之該資訊解對準該經解碼之第一聲道及該經解碼之第二聲道以獲得一經解碼之多聲道信號。
如請求項21之設備，其中該信號解對準器係經組配以使用與該對應子頻帶相關聯的一窄帶對準參數解對準該等經解碼之第一及第二聲道之多個子頻帶中之各者以針對該第一及該第二聲道獲得一經解對準之子頻帶，及其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊解對準該等第一及第二解碼聲道之該等經解對準之子頻帶的一表示型態。
如請求項21或22之設備，其中該信號解對準器係經組配以使用下列計算該經解碼之第一聲道或該經解碼之第二聲道之一時域表示型態視窗化該左聲道或該右聲道的樣本之一目前區塊以獲得一視窗化目前區塊，視窗化該左聲道或該右聲道的樣本之一隨後區塊以獲得一視窗化隨後區塊，及加總於一重疊範圍內該視窗化目前區塊之樣本及該視窗化隨後區塊之樣本以獲得針對該重疊範圍之該時域表示型態。
如請求項21或23中任一項之設備，其中該信號解對準器係經組配以針對具有頻寬的個別子頻帶施加該等多個個別窄帶對準參數上之該資訊，其中具有一第一中心頻率的一第一頻帶之一第一頻寬係低於具有一第二中心頻率的一第二頻帶之一第二頻寬第二中心頻率，其中該第二中心頻率係大於該第一中心頻率，或其中該信號解對準器係經組配以只針對高達一邊界頻率的頻帶施加用於個別頻帶之該等多個個別窄帶對準參數上之該資訊，該邊界頻率係低於該第一經解碼聲道或該第二經解碼聲道之一最大頻率，及其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊只對準具有頻率高於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道及使用該寬帶對準參數上之該資訊及使用該等窄帶對準參數上之該資訊對準具有頻率低於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道。
如請求項21或24中任一項之設備，其中該信號處理器包含：一時間-頻譜轉換器用於計算及該經解碼之側邊信號的一頻域表示型態，其中該信號處理器係經組配以計算於該頻域中之該經解碼之第一聲道及該經解碼之第二聲道，及其中該信號解對準器包含一頻譜-時間轉換器用於將只使用該等複數窄帶對準參數上之該資訊或使用該等複數窄帶對準參數且使用該寬帶對準參數上之該資訊之經對準的信號轉換至一時域。
如請求項21或25中任一項之設備，其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊進行於一時域的一解對準及使用時間經對準的聲道之時間隨後區塊進行一視窗化操作或一重疊及加法操作，或其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊進行於一頻譜域的一解對準及使用該等經解對準聲道進行一頻譜-時間轉換及使用經解對準的聲道之時間隨後區塊進行一合成視窗化及一重疊及加法操作。
如先前請求項中任一項之設備，其中該信號解碼器係經組配以產生一時域中間信號及一時域側邊信號，其中該信號處理器係經組配以使用一分析視窗進行一視窗化來針對該中間信號或該側邊信號產生經視窗化樣本的隨後區塊，其中該信號處理器包含一時間-頻譜轉換器用於轉換該等時間-隨後區塊以獲得頻譜值之隨後區塊；及其中該信號解對準器係經組配以在頻譜值之該等區塊上使用該等窄帶對準參數上之該資訊及該寬帶對準參數上之該資訊進行該解對準。
如請求項21或27中任一項之設備，其中該經編碼之信號包含多個預測增益或位準參數，其中該信號處理器係經組配以使用該中間聲道之頻譜值及用於該等頻譜值相關聯的一頻帶的一預測增益或位準參數計算該左聲道及該右聲道之頻譜值，及藉使用該經解碼之側邊信號的頻譜值。
如請求項21或28中任一項之設備，其中該信號處理器係經組配以使用針對該等頻譜值相關聯的一頻帶的一立體聲填充參數計算該等左及右聲道之頻譜值。
如請求項21或29中任一項之設備，其中該信號解對準器或該信號處理器係經組配以使用一定標因數針對一頻帶進行一能定標，其中該定標因數取決於該經解碼之該中間信號及該經解碼之該側邊信號之能，及其中該定標因數係受限於至多2.0與至少0.5間。
如請求項28或30中任一項之設備，其中該信號處理器係經組配以使用自該位準參數推衍的一增益因數計算該左聲道及該右聲道之該等頻譜值，及其中該增益因數係使用一非線性函數自該位準參數推衍得。
如請求項21或31中任一項之設備，其中該信號解對準器係經組配以針對使用該第一及該第二聲道之頻譜值的一旋轉的該等聲道使用該窄帶對準參數上之該資訊而解對準該等經解碼之第一及第二聲道之一頻帶，其中具有一較高振幅之一個聲道的該頻譜值被旋轉比具有一較低振幅之另一個聲道的該頻帶之頻譜值更少。
一種用於解碼包含一經編碼之中間信號、一經編碼之側邊信號、一寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊的一經編碼之多聲道信號之方法，其包含：解碼該經編碼之中間信號以獲得一經解碼之中間信號及解碼該經編碼之側邊信號以獲得一經解碼之側邊信號；自該經解碼之中間信號及該經解碼之側邊信號計算一經解碼之第一聲道及經解碼之第二聲道；及使用該寬帶對準參數上之該資訊及該等複數窄帶對準參數上之該資訊解對準該經解碼之第一聲道及該經解碼之第二聲道以獲得一經解碼之多聲道信號。
一種電腦程式，用於當在一電腦或一處理器上跑時，進行如請求項19之方法或如請求項33之方法。