TW201407603A

TW201407603A - 運用針對參數音訊物件編碼之殘差槪念之編碼器、解碼器、系統及方法

Info

Publication number: TW201407603A
Application number: TW102113450A
Authority: TW
Inventors: Thorsten Kastner; Juergen Herre; Jouni Paulus; Leon Terentiv; Oliver Hellmuth
Original assignee: Fraunhofer Ges Forschung; Univ Friedrich Alexander Er
Priority date: 2012-08-10
Filing date: 2013-04-16
Publication date: 2014-02-16
Also published as: TWI517141B; AU2013301831A1; WO2014023443A1; RU2015107578A; US10818301B2; MY176406A; BR112015002793B1; SG11201500878PA; MX351193B; ES2638391T3; KR101903664B1; EP2883225B1; PT2883225T; AU2013301831B2; CA2881065C; PL2883225T3; MX2015001676A; HK1211734A1; AR090703A1; KR102050455B1

Abstract

提供一種解碼器。該解碼器包括一參數解碼單元(110)，該參數解碼單元(110)用於藉由升混三個或更多個縮混信號來產生多個第一估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中該參數解碼單元(110)經組配來取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊。此外，該解碼器包括一殘差處理單元(120)，該殘差處理單元(120)用於藉由修改該等第一估計音訊物件信號中的一或多個來產生多個第二估計音訊物件信號，其中該殘差處理單元(120)經組配來取決於一或多個殘差信號修改該等第一估計音訊物件信號中之該等一或多個。

Description

運用針對參數音訊物件編碼之殘差概念之編碼器、解碼器、系統及方法

發明領域

本發明係關於音訊信號編碼、解碼及處理，且詳言之，係關於運用針對參數音訊物件編碼之殘差概念之編碼器、解碼器及方法。

發明背景

近來，在音訊編碼(參見例如[BCC]、[JSC]、[SAOC]、[SAOC1]及[SAOC2])及通知來源分離(參見例如[ISS1]、[ISS2]、[ISS3]、[ISS4]、[ISS5]及[ISS6])的領域已提議用於包括多個音訊物件之音訊場景之位元速率高效傳輸/儲存的參數技術。此等技術旨在基於額外旁側資訊來重新建構所要的輸出音訊場景或所要的音訊來源物件，該額外旁側資訊描述所傳輸及/或儲存之音訊場景及/或該音訊場景中的音訊來源物件。

圖5描述SAOC(SAOC=空間音訊物件編碼)系統概述，其說明使用MPEG SAOC(MPEG=動畫專家組)之實例的此類參數系統之原理(參見例如[SAOC]、[SAOC1]及[SAOC2])。

一般處理係以時間/頻率選擇性方式進行且可被描述如下：SAOC編碼器510(詳言之，SAOC編碼器510之旁側資訊估計器530)擷取旁側資訊，該旁側資訊描述最多32個輸入音訊物件信號s₁...s₃₂之特性(以其最簡單形式，描述音訊物件信號之物件功率的關係)。SAOC編碼器510之混音器520使用縮混增益因數d_1,1...d_32,2來縮混該等音訊物件信號s₁...s₃₂以獲得單聲道或雙聲道信號混合物(即，一個或兩個縮混信號)。

傳輸或儲存該(等)縮混信號及旁側資訊。為此，可使用音訊編碼器540編碼該(等)縮混音訊信號。音訊編碼器540可為熟知的感知音訊編碼器，例如，MPEG-1層II或III(aka.mp3)音訊編碼器、MPEG進階音訊編碼(AAC)音訊編碼器等。

在接收器側，對應的音訊解碼器550(例如，感知音訊解碼器，諸如MPEG-1層II或III(aka.mp3)音訊解碼器、MPEG進階音訊編碼(AAC)音訊解碼器等)解碼已編碼之縮混音訊信號。

SAOC解碼器560概念上試圖使用所傳輸及/或儲存之旁側資訊，例如藉由使用虛擬物件分離器570，自一個或兩個縮混信號恢復原始(音訊)物件信號(「物件分離」)。然後藉由SAOC解碼器560之再現器580使用再現矩陣(由係數r_1,1...r_32,6描述)將此等估計的(音訊)物件信號s_1,est...s_32,est混音成由最多6個音訊輸出通道y_1,est...y_6,est表示的目標場景。輸出可為單聲道、雙聲道立體聲或5.1多聲道目標場景(例如，一個、兩個或六個音訊輸出信號)。

歸因於在解碼側對音訊物件之參數估計的潛在限制；在大多數情況下，不能完美地產生所要的目標輸出場景。在極端操作點(例如，一個音訊物件之單獨播放)，該處理常常不再能達成充分的主觀聲音。為此，已藉由引入增強式音訊物件(EAO)來擴展SAOC方案(參見例如[Dfx]，此外，參見例如[SAOC])。編碼為EAO之音訊物件展現出相比編碼於同一縮混信號中的其他(普通)非增強式音訊物件(非EAO)而言有所增加的分離能力，其代價為旁側資訊速率有所增加。EAO概念針對每一EAO考慮參數模式之預測誤差(殘差信號)。

圖6描述在編碼器側的殘差估計，其示意性地說明針對每一EAO之殘差信號的計算。在SAOC編碼器中，使用所擷取參數旁側資訊(PSI)及原始來源信號估計殘差信號(至多為4個EAO)，對該等殘差信號進行波形編碼且將其作為非參數殘差旁側資訊(RSI)包括於SAOC位元串流中。更詳細而言，用於EAO之PSI SAOC解碼器610自縮混X產生估計音訊物件信號。RSI產生單元620然後基於所產生的估計音訊物件信號s_est,EAO且基於原始EAO音訊物件信號s₁,...,s₄產生至多四個殘差信號s_{res,RSI,{1,...,4}}。

圖7描述具有EAO支援的SAOC解碼器之基本結構，其說明整合於SAOC解碼/轉碼鏈(轉碼=資料自一種編碼至另一種編碼的轉換)中的EAO處理方案之概念概述。

藉由CPC估計單元710自參數旁側資訊(PSI)導出縮混信號導向式參數(即，通道預測係數(CPC))。

將CPC與縮混信號一起饋入至2至N方框(TTN方框)720中。TTN方框720概念上試圖自所傳輸之縮混信號(X)估計EAO(s_est,EAO)並且提供估計的非EAO縮混(X_est,nonEAO)，其僅由非EAO組成。

RSI處理單元730使用所傳輸及/或儲存(且解碼)之殘差信號(s_res,RSI)來增強EAO(s_est,EAO)之估計以及僅非EAO物件之對應縮混(X_nonEAO)。

根據目前技術水平，在下一步驟中，RSI處理單元730將非EAO縮混信號(X_nonEAO)饋入至SAOC縮混處理器(PSI解碼單元)740中，來估計非EAO物件s_est,nonEAO。PSI解碼單元740將估計的非EAO音訊物件s_est,nonEAO傳遞至再現單元750。此外，RSI處理單元將增強的饋入至再現單元750中。再現單元750然後基於估計的非EAO音訊物件s_est,nonEAO且基於增強的產生單聲道或或立體聲輸出信號。

目前技術水平的系統有以下缺點：在應用殘差信號來在SAOC解碼器中計算EAO之前，必須自所傳輸/儲存之參數旁側資訊計算縮混導向式CPC。

所有縮混信號必須在SAOC殘差概念內予以處理，無論其對EAO處理是否有用。

歸因於TTN方框的限制，SAOC殘差概念僅可配合單聲道或雙聲道信號混合物來使用。EAO殘差概念無法結合多聲道混合物(例如，5.1多聲道混合物)來使用。

此外，歸因於其估計的對應計算複雜性，SAOC EAO對EAO的數目提出限制(即，至多4個)。

由於此等限制，SAOC EAO殘差處置概念無法應用於多聲道(例如5.1)縮混信號或用於超過4個EAO。

因此，提供針對音訊信號編碼、音訊信號解碼及音訊信號處理之改良概念將很受欣賞。

發明概要

本發明之一目標係提供針對音訊信號編碼、音訊信號解碼及音訊信號處理之改良概念。本發明之該目標係由以下各者來解決：如申請專利範圍第1項之解碼器、如申請專利範圍第11項之殘差信號產生器、如申請專利範圍第19項之編碼器、如申請專利範圍第21項之系統、如申請專利範圍第22項之已編碼信號、如申請專利範圍第23項之方法、如申請專利範圍第24項之方法及如申請專利範圍第25項之電腦程式。

提供一種解碼器。該解碼器包括一參數解碼單元，該參數解碼單元用於藉由升混三個或更多個縮混信號來產生多個第一估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中該參數解碼單元經組配來取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊。此外，該解碼器包括一殘差處理單元，該殘差處理單元用於藉由修改該等第一估計音訊物件信號中的一或多個來產生多個第二估計音訊物件信號，其中該殘差處理單元經組配來取決於一或多個殘差信號修改該等第一估計音訊物件信號中之該等一或多個。

實施例呈現物件導向式殘差概念，其改良EAO之感知品質。與目前技術水平的系統不同，所呈現的概念既不局限於縮混信號之數目也不局限於EAO之數目。呈現了兩種用來導出物件相關殘差信號的方法。一種串列概念，其中隨著EAO之數目增加，反覆地減少殘差信號之能量，其代價為計算複雜性較高；以及第二種概念，其計算複雜性較低，其中同時突擊所有殘差。

此外，實施例提供在解碼器側應用物件導向式殘差信號的改良概念以及針對以下情況所設計之複雜性有所減小的概念：其中在解碼器側僅調處EAO，或者非EAO之修改局限於增益縮放。

根據一實施例，殘差處理單元可經組配來取決於至少三個殘差信號來修改該等第一估計音訊物件信號中之該等一或多個。解碼器係經調適來基於該等多個第二估計音訊物件信號來產生至少三個音訊輸出通道。

根據一實施例，解碼器進一步可包括一縮混修改單元。殘差處理單元可判定該等多個第二估計音訊物件信號中的一或多個音訊物件信號。縮混修改單元可經調適來自該等三個或更多個縮混信號中移除該等經判定之一或多個第二估計音訊物件信號，以獲得三個或更多個經修改的縮混信號。參數解碼單元可經組配來基於該等三個或更多個經修改的縮混信號判定該等第一估計音訊物件信號中的一或多個音訊物件信號。

在一特定實施例中，縮混修改單元可例如經調適來應用公式。

此外，解碼器可經調適來進行兩個或更多個反覆步驟。針對每一反覆步驟，參數解碼單元可經調適來判定該等多個第一估計音訊物件信號中的確切一個音訊物件信號。此外，針對該反覆步驟，殘差處理單元可經調適來藉由修改該等多個第一估計音訊物件信號中的該音訊物件信號判定該等多個第二估計音訊物件信號中的確切一個音訊物件信號。此外，針對該反覆步驟，縮混修改單元可經調適來自該等三個或更多個縮混信號中移除該等多個第二估計音訊物件信號中的該音訊物件信號，以修改該等三個或更多個縮混信號。在該反覆步驟之後的下一反覆步驟中，參數解碼單元可經調適來基於已修改的該等三個或更多個縮混信號判定該等多個第一估計音訊物件信號中的確切一個音訊物件信號。

在一實施例中，一或多個殘差信號中每一者指示該等多個原始音訊物件信號中之一者與該等一或多個第一估計音訊物件信號中之一者之間的差。

根據一實施例，其中殘差處理單元可經調適來藉由修改該等第一估計音訊物件信號中的五個或更多個來產生多個第二估計音訊物件信號，其中殘差處理單元可經組配來取決於五個或更多個殘差信號來修改該等第一估計音訊物件信號中的該等五個或更多個。

在另一實施例中，解碼器可經組配來基於該等多個第二估計音訊物件信號來產生七個或更多個音訊輸出通道。

根據另一實施例，解碼器可經調適來不判定通道預測係數來判定該等多個第二估計音訊物件信號。實施例提供概念，以使得目前為止係在目前技術水平的SAOC中為解碼所必需的通道預測係數不再為解碼所必需的。

在另一實施例中，該解碼器可為SAOC解碼器。

提供一種殘差信號產生器。該殘差信號產生器包括一參數解碼單元，該參數解碼單元用於藉由升混三個或更多個縮混信號來產生多個估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中該參數解碼單元經組配來取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊。此外，殘差信號產生器包括一殘差估計單元，該殘差估計單元用於基於該等多個原始音訊物件信號且基於該等多個估計音訊物件信號來產生多個殘差信號，使得該等多個殘差信號中每一者係一差信號，該差信號指示該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。

在一實施例中，殘差估計單元可經調適來基於該等多個原始音訊物件信號中的至少五個原始音訊物件信號且基於該等多個估計音訊物件信號中的至少五個估計音訊物件信號來產生至少五個殘差信號。

在一實施例中，殘差信號產生器可進一步包括一縮混修改單元，該縮混修改單元經調適來修改該等三個或更多個縮混信號以獲得三個或更多個經修改的縮混信號。參數解碼單元可經組配來基於該等三個或更多個經修改的縮混信號判定該等第一估計音訊物件信號中的一或多個音訊物件信號。

在一實施例中，縮混修改單元可例如經組配來：藉由自該等三個或更多個原始縮混信號中移除該等多個原始音訊物件信號中的一或多個，來修改該等三個或更多個原始縮混信號以獲得該等三個或更多個經修改的縮混信號。

在另一實施例中，縮混修改單元可例如經組配來：藉由基於該等估計音訊物件信號中的一或多個且基於該等殘差信號中的一或多個來產生一或多個經修改的音訊物件信號，以及藉由自該等三個或更多個原始縮混信號中移除該等經修改的音訊物件信號，來修改該等三個或更多個原始縮混信號以獲得該等三個或更多個經修改的縮混信號。例如，該等一或多個經修改的音訊物件信號中每一者可藉由縮混修改單元，以修改該等估計音訊物件信號之一來產生，其中該縮混修改單元可經調適來取決於該等一或多個殘差信號之一而修改該估計音訊物件信號。

在上述兩個實施例中，縮混修改單元可例如經調適來應用公式，其中X係將要修改之縮混，其中D指示縮混資訊，其中S _eao包括將要移除的原始音訊物件信號或經修改的音訊物件信號，其中指示將要移除的信號之位置，且其中係經修改的縮混信號。例如，音訊物件信號之位置(所在)對應於其音訊物件在所有物件之清單中的位置(所在)。

根據一實施例，殘差信號產生器可經調適來進行兩個或更多個反覆步驟。針對每一反覆步驟，參數解碼單元可經調適來判定該等多個估計音訊物件信號中的確切一個音訊物件信號。此外，針對該反覆步驟，殘差估計單元可經調適來藉由修改該等多個估計音訊物件信號中的該音訊物件信號判定該等多個殘差信號中的確切一個殘差信號。此外，針對該反覆步驟，縮混修改單元可經調適來修改該等三個或更多個縮混信號。在該反覆步驟之後的下一反覆步驟中，參數解碼單元可經調適來基於已修改的該等三個或更多個縮混信號判定該等多個估計音訊物件信號中的確切一個音訊物件信號。

在一實施例中，提供一種編碼器，該編碼器用於藉由產生三個或更多個縮混信號，藉由產生參數旁側資訊以及藉由產生多個殘差信號來編碼多個原始音訊物件信號。該編碼器包括一縮混產生器，該縮混產生器用於提供指示該等多個原始音訊物件信號之一縮混的該等三個或更多個縮混信號。此外，該編碼器包括一參數旁側資訊估計器，該參數旁側資訊估計器用於產生指示關於多個原始音訊物件信號的資訊之該參數旁側資訊，以獲得該參數旁側資訊。此外，該編碼器包括根據上述實施例中之一者的殘差信號產生器。該殘差信號產生器之該參數解碼單元經調適來藉由升混由該縮混產生器提供的該等三個或更多個縮混信號來產生多個估計音訊物件信號，其中該縮混信號編碼該等多個原始音訊物件信號。該參數解碼單元經組配來取決於由該參數旁側資訊估計器產生之該參數旁側資訊來升混該等三個或更多個縮混信號。該殘差信號產生器之該殘差估計單元經調適來基於該等多個原始音訊物件信號且基於該等多個估計音訊物件信號來產生多個殘差信號，使得該等多個殘差信號中每一者指示在該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。

在一實施例中，編碼器可為SAOC編碼器。

此外，提供一種系統。該系統包括根據上述實施例中之一者的編碼器，該編碼器用於藉由產生三個或更多個縮混信號，藉由產生參數旁側資訊以及藉由產生多個殘差信號來編碼多個原始音訊物件信號。此外，該系統包括根據上述實施例中之一者的解碼器，其中該解碼器經組配來基於由該編碼器產生之該等三個或更多個縮混信號，基於由該編碼器產生之該參數旁側資訊且基於由該編碼器產生之該等多個殘差信號來產生多個音訊輸出通道。

此外，提供一種已編碼音訊信號。該已編碼音訊信號包括三個或更多個縮混信號、參數旁側資訊及多個殘差信號。該等三個或更多個縮混信號係多個原始音訊物件信號之一縮混。該參數旁側資訊包括指示關於多個原始音訊物件信號的旁側資訊之參數。該等多個殘差信號中每一者係一差信號，該差信號指示該等多個原始音訊信號中之一者與多個估計音訊物件信號中之一者之間的一差。

此外，提供一種方法。該方法包括：- 藉由升混三個或更多個縮混信號來產生多個第一估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中產生該等多個第一估計音訊物件信號包括取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊，以及- 藉由修改該等第一估計音訊物件信號中的一或多個來產生多個第二估計音訊物件信號，其中產生多個第二估計音訊物件信號包括取決於一或多個殘差信號來修改該等第一估計音訊物件信號中的該等一或多個。

此外，提供另一種方法。該方法包括：- 藉由升混三個或更多個縮混信號來產生多個估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中產生該等多個估計音訊物件信號包括取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊，以及- 基於該等多個原始音訊物件信號且基於該等多個估計音訊物件信號來產生多個殘差信號，使得該等多個殘差信號中每一者係一差信號，該差信號指示該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。

此外，提供一種電腦程式，該電腦程式用於當執行於一電腦或信號處理器上時實行上述方法中之一者。

1101、2301‧‧‧參數解碼子單元

110、230‧‧‧參數解碼單元

1201‧‧‧殘差處理子單元

120‧‧‧殘差處理單元

1251、1252‧‧‧殘差解碼子單元

130、750‧‧‧再現單元

1401、1402、2501、2502‧‧‧縮混修改子單元

140、250‧‧‧縮混修改單元

200‧‧‧殘差信號產生器

210‧‧‧縮混產生器

220‧‧‧參數旁側資訊估計器

2401‧‧‧殘差估計子單元

240‧‧‧殘差估計單元

2451、2452‧‧‧RSI產生子單元

245、620‧‧‧RSI產生單元

2461、2462‧‧‧箭頭

310‧‧‧編碼器

320‧‧‧解碼器

410‧‧‧縮混信號

420‧‧‧參數旁側資訊

430‧‧‧殘差信號

510‧‧‧SAOC編碼器

520‧‧‧混音器

530‧‧‧旁側資訊估計器

540‧‧‧音訊編碼器

550‧‧‧音訊解碼器

560‧‧‧SAOC解碼器

570‧‧‧虛擬物件分離器

580‧‧‧再現器

610‧‧‧PSI SAOC解碼器

710‧‧‧CPC估計單元

720‧‧‧TTN方框

730‧‧‧RSI處理單元

740‧‧‧PSI解碼單元

以下參考諸圖來更詳細地描述本發明之實施例，其中圖1a例示出根據一實施例之解碼器，圖1b例示出根據另一實施例之解碼器，其中該解碼器進一步包括再現器，圖2a例示出根據一實施例之殘差信號產生器，圖2b例示出根據一實施例之編碼器，圖3例示出根據一實施例之系統，圖4例示出根據一實施例之已編碼音訊信號，圖5描述SAOC系統概述，其說明使用MPEG SAOC的此類參數系統之原理，圖6描述在編碼器側的殘差估計，其示意性地說明針對每一EAO之殘差信號的計算，圖7描述具有EAO支援的SAOC解碼器之基本結構，其說明整合於SAOC解碼/轉碼鏈中的EAO處理方案之概念概述，圖8描述根據一實施例之所呈現之以參數及殘差為基礎的音訊物件編碼方案之概念概述，圖9描述根據一實施例之用於在編碼器側聯合估計針對每一EAO信號之殘差信號的概念，圖10例示出根據一實施例之在解碼器側的聯合殘差解碼之概念，圖11例示出根據一實施例之殘差信號產生器，其中該殘差信號產生器進一步包括縮混修改單元，圖12例示出根據一實施例之解碼器，其中該解碼器進一步包括縮混修改單元，圖13例示出根據一實施例之在編碼器側以串列方式計算殘差分量的概念，圖14例示出根據一實施例之在解碼器側結合串列殘差計算來使用的串列「RSI解碼」單元，圖15例示出根據一實施例之使用串列概念的殘差信號產生器，以及圖16例示出根據一實施例之使用串列概念的解碼器。

較佳實施例之詳細說明

圖2a例示出根據一實施例之殘差信號產生器200。

殘差信號產生器200包括參數解碼單元230，其用於藉由升混三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)來產生多個估計音訊物件信號(估計音訊物件信號#1，...估計音訊物件信號#M)。三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)編碼多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M)。參數解碼單元230經組配來取決於參數旁側資訊來升混三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)，該參數旁側資訊指示關於多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M)的資訊。

此外，殘差信號產生器200包括殘差估計單元240，其用於基於多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M)且基於多個估計音訊物件信號(估計音訊物件信號#1，...估計音訊物件信號#M)來產生多個殘差信號(殘差信號#1，...，殘差信號#M)，使得多個殘差信號(殘差信號#1，...，殘差信號#M)中每一者係一差信號，該差信號指示多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M)中之一者與多個估計音訊物件信號(估計音訊物件信號#1，...估計音訊物件信號#M)中之一者之間的一差。

根據上述實施例之編碼器克服了目前技術水平的SAOC局限(參見[SAOC])。

目前的SAOC系統藉由使用一或多個2至1方框或一或多個3至1方框來進行縮混。由於此等潛在的局限以及其它原因，目前的SAOC系統可將音訊物件信號縮混成至多兩個縮混通道/兩個縮混信號。

提供針對殘差信號產生器且針對編碼器之概念，其允許克服SAOC之局限，因此音訊物件編碼現在有利於使用超過兩個傳輸通道的傳輸系統。

在一實施例中，殘差估計單元240經調適來基於多個原始音訊物件信號中的至少五個原始音訊物件信號且基於多個估計音訊物件信號中的至少五個估計音訊物件信號來產生至少五個殘差信號。

圖2b例示出根據一實施例之編碼器。圖2b之編碼器包括殘差信號產生器200。

此外，該編碼器包括縮混產生器210，其用於提供指示多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M、另外的原始音訊物件信號)之一縮混的三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)。

關於原始音訊物件信號#1，...，原始音訊物件信號#M，殘差估計單元240產生殘差信號(殘差信號#1，...，殘差信號#M)。因此，原始音訊物件信號#1，...，原始音訊物件信號#M代表增強式音訊物件(EAO)。

然而，如圖2b中可看出，另外的原始音訊物件信號可任擇地存在，其可被縮混，但將不針對其產生殘差信號。此等另外的原始音訊物件信號因此代表非增強式音訊物件(非EAO)。

圖2b之編碼器進一步包括參數旁側資訊估計器220，其用於產生指示關於多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M、另外的原始音訊物件信號)的資訊之參數旁側資訊，以獲得該參數旁側資訊。在圖2b之實施例中，參數旁側資訊估計器亦考慮代表非EAO之原始音訊物件信號(另外的原始音訊物件信號)。

在一實施例中，原始音訊物件信號之數目可等於殘差信號之數目，例如，當原始音訊物件信號代表EAO時。

然而在其他實施例中，殘差信號之數目可不同於原始音訊物件信號之數目及/或可不同於估計音訊物件信號之數目，例如，當原始音訊物件信號代表非EAO時。

在一些實施例中，該編碼器係SAOC編碼器。

圖1a例示出根據一實施例之解碼器。

該解碼器包括參數解碼單元110，其用於藉由升混三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)來產生多個第一估計音訊物件信號(第一估計音訊物件信號#1，...第一估計音訊物件信號#M)，其中三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)編碼多個原始音訊物件信號，其中參數解碼單元110經組配來取決於參數旁側資訊來升混三個或更多個縮混信號(縮混信號#1、縮混信號#2、縮混信號#3，...，縮混信號#N)，該參數旁側資訊指示關於多個原始音訊物件信號的資訊。

此外，該解碼器包括殘差處理單元120，其用於藉由修改第一估計音訊物件信號(第一估計音訊物件信號#1，...第一估計音訊物件信號#M)中的一或多個來產生多個第二估計音訊物件信號(第二估計音訊物件信號#1，...第二估計音訊物件信號#M)，其中殘差處理單元120經組配來取決於一或多個殘差信號(殘差信號#1，...，殘差信號#M)來修改該等第一估計音訊物件信號(第一估計音訊物件信號#1，...第一估計音訊物件信號#M)中之該等一或多個。

根據上述實施例之解碼器克服了目前技術水平的SAOC局限(參見[SAOC])。

此外，目前的SAOC系統藉由使用一或多個1至2方框(OTT方框)或一或多個2至3方框(TTT方框)來進行升混。由於此等局限以及其它原因，藉由目前技術水平的SAOC解碼器無法升混由超過兩個縮混信號/縮混通道來編碼之音訊物件信號。

。提供針對解碼器之概念，其允許克服SAOC之局限，因此音訊物件編碼現在有利於使用超過兩個傳輸通道的傳輸系統。

圖1b例示出根據另一實施例之解碼器，其中該解碼器進一步包括再現單元130，其用於取決於再現資訊自第二估計音訊物件信號(第二估計音訊物件信號#1，...第二估計音訊物件信號#M)產生多個音訊輸出通道(音訊輸出通道#1，...，音訊輸出通道#R)。例如，再現資訊可為再現矩陣及/或再現矩陣之係數，且再現單元130可經組配來對第二估計音訊物件信號(第二估計音訊物件信號#1，...第二估計音訊物件信號#M)應用該再現矩陣以獲得多個音訊輸出通道(音訊輸出通道#1，...，音訊輸出通道#R)。

根據一實施例，殘差處理單元120經組配來取決於至少三個殘差信號來修改該等第一估計音訊物件信號中的該等一或多個。該解碼器經調適來基於該等多個第二估計音訊物件信號來產生至少三個音訊輸出通道。

在另一實施例中，該等一或多個殘差信號中每一者指示該等多個原始音訊物件信號中之一者與該等一或多個第一估計音訊物件信號中之一者之間的一差。

根據一實施例，殘差處理單元120經調適來藉由修改該等第一估計音訊物件信號中的五個或更多個來產生該等多個第二估計音訊物件信號。殘差處理單元120經調適來取決於五個或更多個殘差信號來修改該等第一估計音訊物件信號中的該等五個或更多個。

在另一實施例中，該解碼器經組配來基於多個第二估計音訊物件信號來產生七個或更多個音訊輸出通道。

根據另一實施例，該解碼器經調適來不判定通道預測係數來判定多個第二估計音訊物件信號。

在另一實施例中，該解碼器係SAOC解碼器。

圖3例示出根據一實施例之系統。該系統包括根據上述實施例中之一者的編碼器310，其用於藉由產生三個或更多個縮混信號，藉由產生參數旁側資訊以及藉由產生多個殘差信號來編碼多個原始音訊物件信號(原始音訊物件信號#1，...，原始音訊物件信號#M)。此外，該系統包括根據上述實施例中之一者的解碼器320，其經組配來基於由編碼器310產生的三個或更多個縮混信號，基於由編碼器310產生的參數旁側資訊且基於由編碼器310產生的多個殘差信號來產生多個第二估計音訊物件信號。

圖4例示出根據一實施例之已編碼音訊信號。該已編碼音訊信號包括三個或更多個縮混信號410、參數旁側資訊420以及多個殘差信號430。三個或更多個縮混信號410係多個原始音訊物件信號之縮混。參數旁側資訊420包括指示關於多個原始音訊物件信號的旁側資訊之參數。多個殘差信號430中每一者係一差信號，該差信號指示該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。

以下提供根據一實施例之概念概述。

圖8描述根據一實施例之所呈現之以參數及殘差為基礎的音訊物件編碼方案之概念概述，其中該編碼方案展現出進階的縮混信號及進階的EAO支援。

在編碼器側，參數旁側資訊估計器(「PSI產生單元」)220計算PSI，以用於在利用來源及縮混相關特性的解碼器處估計物件信號。RSI產生單元245藉由分析估計物件信號和與原始物件信號之間的差來針對將要增強之每一物件信號計算殘差資訊。RSI產生單元245可例如包括參數解碼單元230及殘差估計單元240。

在解碼器側，參數解碼單元(「PSI解碼」單元)110 使用給定之PSI自縮混信號估計物件信號。在第二步驟中，殘差處理單元(「RSI解碼」單元)120使用RSI來改良將要增強之估計物件信號的品質。可例如將所有物件信號(增強式及非增強式音訊物件)傳遞至再現單元130來產生目標輸出場景。

應注意，不必考慮所有縮混信號。若縮混信號對估計或/及估計並且增強物件信號的貢獻可被忽略，則可省略該等縮混信號。

為了容易理解，將圖8中之處理步驟及以下諸圖顯現為分開的處理單元。在實踐中，可將其有效地組合來減少計算複雜性。

以下提供聯合殘差編碼/解碼概念。

圖9描述根據一實施例之用於在編碼器側聯合估計針對每一EAO信號之殘差信號的概念。

參數解碼單元(「PSI解碼」單元)230在給定之估計PSI及縮混信號作為輸入的情況下產生音訊物件信號之估計(估計音訊物件信號s_{est,PSI,{1,...,M}})。在殘差估計單元(「RSI估計」單元)240中比較估計該等音訊物件信號s_{est,PSI,{1,...,M}}與原始未改變的來源信號s₁，...，s_M。殘差估計單元240提供針對將要增強之每一音訊物件的殘差/誤差信號項s_{res,RSI,{1,...,M}}。

圖10顯示在解碼器中結合聯合殘差計算來使用的「RSI解碼」單元。詳言之，圖10例示出根據一實施例之在解碼器側的聯合殘差解碼之概念。

來自參數解碼單元(「PSI解碼」單元)110之(第一)估計音訊物件信號s_{est,PSI,{1,...,M}}與殘差資訊(「殘差旁側資訊」)一起被饋入至殘差處理單元(「RSI解碼」)120中。殘差處理單元120自殘差(旁側)資訊及估計音訊物件信號s_{est,PSI,{1,...,M}}計算第二估計音訊物件信號s_{est,RSI,{1,...,M}}，例如，增強式及非增強式音訊物件信號，且產生第二估計音訊物件信號s_{est,RSI,{1,...,M}}，例如，增強式及非增強式音訊物件信號，來作為殘差處理單元120的輸出。

另外，可進行非EAO之重新估計(圖10中未例示出)。自信號混合物中移除EAO，且自此混合物重新估計剩餘的非EAO。此產生此等物件之改良估計(與自包括所有物件信號的信號混合物之估計相比)。若目標係僅調處混合物中的增強式物件信號，則可省略此重新估計。

圖11例示出根據一實施例之殘差信號產生器，其中。

在圖11中，殘差信號產生器200進一步包括縮混修改單元250，其經調適來修改三個或更多個縮混信號以獲得三個或更多個經修改的縮混信號。

參數解碼單元230經組配來基於三個或更多個經修改的縮混信號來判定第一估計音訊物件信號中的一或多個音訊物件信號。

然後，殘差估計單元240可例如基於該等第一估計音訊物件信號中的該等一或多個音訊物件信號來判定一或多個殘差信號。

在一實施例中，縮混修改單元250可例如經組配來：藉由自三個或更多個原始縮混信號中移除多個原始音訊物件信號中的一或多個，來修改該等三個或更多個原始縮混信號以獲得三個或更多個經修改的縮混信號。

在另一實施例中，縮混修改單元250可例如經組配來：藉由基於該等估計音訊物件信號中的一或多個且基於該等殘差信號中的一或多個來產生一或多個經修改的音訊物件信號，以及藉由自該等三個或更多個原始縮混信號中移除該等一或多個經修改的音訊物件信號，來修改該等三個或更多個原始縮混信號以獲得該等三個或更多個經修改的縮混信號。例如，可由縮混修改單元藉由修改該等估計音訊物件信號中之一者來產生一或多個經修改的音訊物件信號，其中縮混修改單元可經調適來取決於一或多個殘差信號來修改該估計音訊物件信號。

在上述兩個實施例中，縮混修改單元可例如經調適來應用公式其中X係將要修改之縮混，其中D指示相關縮混資訊，其中S _eao包括將要移除的原始音訊物件信號或將要移除的經修改的音訊物件信號，其中指示將要移除的信號之位置，以及其中X係經修改的縮混信號。

例如，音訊物件信號之位置(所在)對應於其音訊物件在所有物件之清單中的位置(所在)。

圖12例示出根據一實施例之解碼器。

在圖12之實施例中，該解碼器進一步包括縮混修改單元140。

殘差處理單元120判定多個第二估計音訊物件信號中的一或多個音訊物件信號。

縮混修改單元140經調適來自三個或更多個縮混信號中移除一或多個第二估計音訊物件信號，以獲得三個或更多個經修改的縮混信號。

參數解碼單元110經組配來基於三個或更多個經修改的縮混信號來判定第一估計音訊物件信號中的一或多個音訊物件信號。

殘差處理單元120可然後基於第一估計音訊物件信號中的經判定之一或多個音訊物件信號來判定一或多個另外的第二估計音訊物件信號。

在一特定實施例中，縮混修改單元130可例如經調適來應用公式：以自三個或更多個縮混信號中移除由殘差處理單元120判定之多個第二估計音訊物件信號中的一或多個音訊物件信號，以獲得三個或更多個經修改的縮混信號，其中X指示修改之前的三個或更多個縮混信號

指示三個或更多個經修改的縮混信號

D指示縮混矩陣

Z _eao指示表示EAO之位置(所在)的對映子矩陣

(關於此實施例之特定變型之更多細節，參見以下的描述)。

以下呈現串列殘差編碼/解碼概念。

圖13例示出根據一實施例之在編碼器側以串列方式計算殘差分量的概念。與聯合殘差計算概念相比，串列方法在每一反覆步驟中減少了殘差能量之能量，其代價為計算複雜性較高。在每一步驟中，在將信號混合物(縮混)傳遞至下一處理單元2452之前，自信號混合物(縮混)中移除增強式音訊物件之原始音訊物件信號中之一者(s_M)(或者，在替代性實施例中，估計音訊物件信號；參見虛線箭頭2461、2462)。以此方式，信號混合物(縮混)中的物件信號之數目隨著每一處理步驟減小。下一步驟中對增強式音訊物件信號(第二估計音訊物件信號)之估計因此改良，從而連續減少殘差信號之能量。

(應注意，在其中在每一反覆步驟中自信號混合物中移除估計物件信號的替代性實施例中，縮混修改子單元2501、2502不需要接收原始音訊物件信號s_M。

相反，在其中在每一反覆步驟中自信號混合物中移除原始音訊物件信號的實施例中，縮混修改子單元2501、2502不需要接收估計音訊物件信號。)

更詳細而言，圖13例示出多個RSI產生子單元2451、2452。該等多個RSI產生子單元2451、2452共同形成RSI產生單元。

該等多個RSI產生子單元2451、2452中每一者包括一參數解碼子單元2301。該等多個參數解碼子單元2301共同形成參數解碼單元。該等參數解碼子單元2301產生第一估計音訊物件信號s_{est,PSI,{1,...,M}}。

該等多個RSI產生子單元2451、2452中每一者包括一殘差估計子單元2401。該等多個殘差估計子單元2401共同形成殘差估計單元。該等殘差估計子單元2401產生第二估計音訊物件信號s_est,RSI,M、s_est,RSI,M-1。

此外，圖13例示出多個縮混修改子單元2501、2502。該等縮混修改子單元2501、2502中每一者共同形成縮混修改單元。

圖14顯示根據一實施例之在解碼器側結合串列殘差計算來使用的串列「RSI解碼」單元。

在每一步驟中，由參數解碼子單元(「PSI解碼」)1101估計將要增強之物件信號中之一者(以獲得第一估計音訊物件信號中之一者s_est,PSI,M)，且然後由殘差處理子單元(「RSI處理」)1201將第一估計音訊物件信號中之一者s_est,PSI,M與對應的殘差信號s_res,RSI,M一起處理，以產生物件信號(第二估計估計音訊物件信號中之一者)的增強式版本s_est,RSI,M。在將經修改的縮混信號饋入至下一殘差解碼子單元(「殘差解碼」1252)之前，由縮混修改子單元(「縮混修改」)1401自縮混信號刪除該增強式物件信號s_est,RSI,M。

與聯合殘差編碼/解碼概念相同，另外可重新估計非EAO。

更詳細而言，圖14例示出多個殘差解碼子單元1251、1252。該等多個殘差解碼子單元1251、1252共同形成殘差解碼單元。

該等多個殘差解碼子單元1251、1252中每一者包括一參數解碼子單元1101。該等多個參數解碼子單元1101共同形成參數解碼單元。該等參數解碼子單元1101產生第一估計音訊物件信號s_{est,PSI,{1,...,M}}。

該等多個殘差解碼子單元1251、1252中每一者包括一殘差處理子單元1201。該等多個殘差處理子單元1201共同形成殘差處理單元。該等殘差處理子單元1201產生第二估計音訊物件信號s_est,RSI,M、s_est,RSI,M-1。

此外，圖14例示出多個縮混修改子單元1401、1402。該等縮混修改子單元1401、1402中每一者共同形成縮混修改單元。

圖15例示出根據一實施例之使用串列概念的殘差信號產生器。

在圖15中，殘差信號產生器包括縮混修改單元250。

殘差信號產生器200經調適來進行兩個或更多個反覆步驟。

針對每一反覆步驟，參數解碼單元230經調適來判定該等多個估計音訊物件信號中的確切一個音訊物件信號。

此外，針對該反覆步驟，殘差估計單元240經調適來藉由修改該等多個估計音訊物件信號中的該音訊物件信號來判定該等多個殘差信號中的確切一個殘差信號。

此外，針對該反覆步驟，縮混修改單元250經調適來修改該等三個或更多個縮混信號。

在該反覆步驟之後的下一反覆步驟中，參數解碼單元230經調適來基於已修改之該等三個或更多個縮混信號來判定該等多個估計音訊物件信號中的確切一個音訊物件信號。

圖16例示出根據一實施例之使用串列概念的解碼器。在圖16中，該解碼器再次包括縮混修改單元140。

圖16之解碼器靜態時來進行兩個或更多個反覆步驟：針對每一反覆步驟，參數解碼單元110經調適來判定該等多個第一估計音訊物件信號中的確切一個音訊物件信號。

此外，針對該反覆步驟，殘差處理單元120經調適來藉由修改該等多個第一估計音訊物件信號中的該音訊物件信號來判定該等多個第二估計音訊物件信號中的確切一個音訊物件信號。

此外，針對該反覆步驟，縮混修改單元140經調適來自該等三個或更多個縮混信號中移除該等多個第二估計音訊物件信號中的該音訊物件信號，以修改該等三個或更多個縮混信號。

在該反覆步驟之後的下一反覆步驟中，參數解碼單元110經調適來基於已修改的該等三個或更多個縮混信號判定該等多個第一估計音訊物件信號中的確切一個音訊物件信號。

以下描述對聯合殘差編碼/解碼概念之實例的數學推導。

下文使用以下標記法：維度：N _Objects -音訊物件信號之數目

N _DmxCh -縮混信號之數目

N _UpmixCh-升混通道之數目

N _Samples-已處理資料之數目

N _EAO -EAO之數目

項目：Z ^* -星號運算子表示給定矩陣之共軛轉置

S -提供給編碼器之原始音訊物件信號(大小為N _Objects×N _Samples)

D -縮混矩陣(大小為N _DmxCh×N _Objects)

R -再現矩陣(大小為N _UpmixCh×N _Objects)

X -縮混音訊信號X=DS(大小為N _DmxCh×N _Samples)

Y -理想音訊輸出信號Y=RS(大小為N _UpmixCh×N _Samples)

S _est -經參數重新建構之物件信號估計S _est；S係定義為S _est=GX(大小為N _Objects×N _Samples)

-解碼器輸出，其包括所有非EAO(參數估計)及EAO(參數加殘差)信號估計，大小為N _Objects×N _Samples

-升混音訊輸出信號估計；Y係定義為(大小為N _UpmixCh×N _Samples)

Z _nonEao；Z _eao-表示非EAO及EAO在所有物件之清單中的位置之對映子矩陣。注意，(大小為 (N _Objects-N _EAO)×N _Objects；N _EAO×N _Objects)。非EAO的Z _nonEao及對應的Z _eao對映矩陣係定義為公式中翻譯：if object j is the i-th non-EAO若物件係第i個非EAO；otherwise否則

公式中翻譯：if object j is the i-th EAO若物件係第i個EAO；otherwise否則例如，針對N _Objects=5且物件編號2及4係EAO，此等矩陣為

D _nonEao -對應於非EAO之縮混子矩陣；定義為 (大小為N _DmxCh×(N _Objects-N _EAO))

D _eao -對應於EAO之縮混子矩陣；定義為(大小為N _DmxCh×N _EAO)

G -參數來源估計矩陣(大小為N _Objects×N _DmxCh)

E -物件協方差矩陣(大小為N _Objects×N _Objects)

E _nonEao -對應於非EAO之協方差子矩陣；定義為 (大小為(N _Objects-N _EAO)×(N _Objects-N _EAO))

S _eao-包括EAO之重新建構的EAO信號(大小為N _EAO×N _Samples)

S _nonEao -包括非EAO之重新建構的非EAO信號(大小為(N _Objects-N _EAO)×N _Samples)

S _res-針對EAO之殘差信號(大小為N _EAO×N _Samples)

-僅包括非EAO信號之經修改的縮混信號；計算為SAOC縮混與重新建構之EAO的縮混之間的差(大小為N _DmxCh×N _Samples)

所有所介紹的矩陣(一般而言)隨時間及頻率變化。

現在，考慮在解碼器側具有非EAO信號重新估計之一般方法：該一般方法可描述為兩步方法，其中首先自對應的縮混信號擷取所有EAO信號，且然後在考慮該等EAO的情況下重新建構所有非EAO信號。使用PSI(E,D)及併入之殘差信號(S _res)自縮混信號(X)恢復物件信號。

認為最終再現的輸出信號係給出為：

解碼器輸出物件信號可表示為以下總和：

藉助於參數EAO重新建構矩陣G _eao及對應的EAO殘差S _res，自縮混X將EAO信號S _eao計算為如下： S _eao=G _eao X+S _res。

藉助於參數非EAO重新建構矩陣，自經修改的縮混將非EAO信號S _nonEao計算為如下：

經修改的縮混信號係如下判定為縮混X與經重新建構之EAO之對應縮混之間的差，因此自縮混信號X刪除了EAO：

此處，使用PSI(E,D)將針對EAO之參數物件重新建構矩陣G _eao及非判定如下：

下文描述在解碼器側的沒有非EAO信號重新估計之簡化方法「A」：若僅調處信號混合物中的EAO，則可將目標場景理解為縮混信號與EAO信號之線性組合。因此可省略非EAO信號之額外重新估計。具有非EAO信號重新估計的一般方法可簡化成單步程序：

信號X _dif=f(S _res,D)包括EAO之所傳輸殘差信號及殘差補償項，因此以下定義成立：

此條件足以再現局限於僅調處EAO的任何聲響場景。

在且DS _est=X的情況下，必須滿足針對項目X _dif的以下約束：DX _dif=0。

項目X _dif由編碼器所判定(且所傳輸或儲存)之分量S _res及將要使用此等式來判定之分量X _nonEao組成。

使用縮混矩陣之定義(D=D _eao Z _eao+D _nonEao Z _nonEao)及補償項(X _dif=Z ^* _eao S _res+Z ^* _nonEao X _nonEao)，可導出以下等式：

在，且，的情況下，該等式可簡化為：D _eao S _res+D _nonEao X _nonEao=0。

對針對X _nonEao的線性等式求解，得出：

在對此線性等式系統求解後，所要的目標場景可計算為參數預測項及殘差增強項之以下總和：

下文提供在解碼器側的沒有非EAO信號重新估計之簡化方法「B」：針對參數信號預測S _est考慮如上補償項，且將其表示為殘差信號S _res之以下函數，從而得出：

替代性公式化包括三個以下部分，其包括縮混信號(H _dmx X)、增強式物件()與非增強式物件(H _est S _est)之適當的線性組合，因此得出：

矩陣的大小為H _dmx：N _Objects×N _DmxCh、H _enh：N _Objects×N _Objects、S _enh：N _Objects×N _Samples及H _est：N _Objects×N _Objects。

假設DS _est=X且定義，可將此寫成：

將此與經重新建構之信號之較早定義相比較，得出：

項H _est可導出為：H _est=I-H _ext D _ext。

當非增強式信號之貢獻減至最低時，最終重新建構中的誤差將減至最低。因此，H _est□0的目標允許自線性等式系統對項H _ext求解：H _ext=D _ext ^*(D _ext D _ext ^*)^-1，其中擴展的縮混矩陣D _ext及升混矩陣H _ext係定義為串連矩陣： H _ext=[H _dmx H _enh]及，且因此

在對此線性等式系統求解後，可獲得所要的校正項X _dif：從而得出最終輸出。

下文考慮簡化方法「C」：若以任意方式僅調處EAO，則可藉由縮混信號與EAO之線性組合來產生任何目標場景。注意，代替縮混，亦可使用刪除了EAO之縮混。若殘差處理完美地恢復EAO，則可完美地產生目標場景。可使用找到針對縮混及EAO重新建構之兩個分量再現矩陣R _D及R _eao來完成任何目標場景的再現。該等矩陣之大小為R _D：N _UpmixCh×N _DmxCh及R _eao：N _UpmixCh×N _EAO。目標再現矩陣可R表示為組合的再現矩陣與縮混矩陣的乘積

由此，可藉由以下對R_ext求解R _ext=RD _ext ^*(D _ext D _ext ^*)^-1

且可自該解提取子矩陣R _D及R _eao，其中

現在可將目標場景計算為：其中S _eao包括EAO之完全重新建構且定義為(如同先前)S _eao=G _eao X+S _res。

可公式化類似的等式，用來使用縮混來再現目標，其中藉由自縮混中減去D _eao S _eao而自混合物刪除了EAO。

下文描述另一數學推導及關於聯合殘差編碼/解碼概念之進一步細節，且提供一般方法與簡化「A」之間的一致性。

從現在開始，在描述中，以下標記法適用。若針對一些元素，以下標記法與以上提供的標記法不一致，則從現在開始，在描述中，僅以下標記法適用於此等元素。

定義：S係大小為N _Objects×N _Samples的物件信號

E=SS ^*係大小N _Objects×N _Objects為的物件協方差矩陣

D係大小為N _DmxCh×N _Objects的縮混矩陣

X=DS係大小為N _DmxCh×N _Samples的縮混信號

G=ED ^* J係大小為N _Objects×N _DmxCh的升混矩陣

M _ren係大小為N _UpmixCh×N _Objects的再現矩陣

X _res係大小為的N _EAO×N _Samples殘差信號

R _eao係大小為N _EAO×N _Objects的矩陣，其表示EAO之所在(位置)，其定義為

公式中翻譯：if object j is the i-th EAO若物件係第i個EAO；otherwise否則R _nonEao係大小為(N _Objects-N _EAO)×N _Objects的矩陣，其表示非EAO之所在(位置)，其定義為

公式中翻譯：if object j is the i-th non-EAO若物件係第i個非EAO；otherwise否則藉助於選擇矩陣R _nonEao，可將對應於非EAO之一些以上矩陣的子矩陣規定為：

下文提供對一般方法(在解碼器處有非EAO信號重新估計)之另一詳細屬性描述：使用旁側資訊及併入之殘差信號自縮混恢復物件信號。來自解碼器之輸出係產生為如下

在EAO的情況下，大小為N _EAO的EAO項X _eao係計算為如下X _eao=R _eao ED ^* JX+X _res，其中大小為N _EAO的殘差信號項X _res包括針對EAO之殘差信號。

包括非EAO之大小為N _Objects-N _EAO的非EAO項X _nonEao係計算為

其中僅包括非EAO信號之經修改的縮混信號係計算為SAOC縮混與重新建構的EAO之縮混之間的差

對應於非EAO之大小為(N _Objects-N _EAO)×(N _Objects-N _EAO)的協方差子矩陣E _nonEao係計算為

對應於非EAO之大小為N _DmxCh×(N _Objects-N _EAO)的縮混子矩陣D _nonEao係計算為

下文提供對簡化方法「A」(在解碼器處沒有非EAO信號重新估計)之另一詳細數學描述：使用旁側資訊及併入之殘差信號自縮混恢復物件信號。來自解碼器之最終輸出係產生為如下

大小為N _Objects的項X _dif併入針對EAO之N _EAO個殘差信號X _res及針對非EAO之預測項X _nonEao，如下

預測項X _nonEao係估計如下

對應於EAO之縮混子矩陣D _eao及對應於普通物件之D _nonEao係定義為D=D _eao R _eao+R _nonEao D _nonEao。

下文考慮再現矩陣之特殊情況1：考慮大小為N _DmxCh×N _Objects的縮混類似再現矩陣M _D之以下特殊情況，其中對EAO進行了任意修改且對非EAO僅進行了一致的縮放(與縮混相比較)

現在提供一般方法之詳細數學描述：

現在提供簡化方法「A」之詳細數學描述：

可看出，當再現矩陣之假設成立時，兩個結果相同。

現在考慮再現矩陣之特殊情況2：包括對大小為N _DmxCh×N _Objects的再現矩陣M _S之結構的額外約束：僅藉由共同縮放因數a來修改所有非EAO(與縮混相比較)，且亦僅藉由共同縮放因數b來修改所有EAO(與縮混相比較)。

從先前結果繼續，系統的輸出將為

雖然已在設備的情境中描述一些態樣，但顯然此等態樣亦表示對應的方法的描述，其中方塊或裝置對應於方法步驟或方法步驟之特徵。類似地，在方法步驟的情境中描述的態樣亦表示對應的方塊或項目對應的設備之特徵之描述。

本發明之已分解信號可儲存於數位儲存媒體上，或者可在諸如無線傳輸媒體或有線儲存媒體之傳輸媒體(諸如網際網路)上傳輸。

取決於某些實施方案需求，本發明之實施例可在硬體或軟體中實行。可使用數位儲存媒體(例如，軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體)來執行實行方案，該數位儲存媒體上儲存有電子可讀控制信號，該等信號與(或能夠與)可規劃電腦系統合作，以使得個別方法得以執行。

根據本發明之一些實施例包括非暫時性資料載體，其具有電子可讀控制信號，該等信號與(或能夠與)可規劃電腦系統合作，以使得本文中描述之該等方法中之一者得以執行。

通常可將本發明之實施例實行為具有程式碼之電腦程式產品，當該電腦程式產品在電腦上運行時，該程式碼可操作來執行該等方法中之一者。該程式碼可例如儲存於機器可讀載體上。

其他實施例包括用於執行本文中描述之該等方法中之一者的電腦程式，其儲存於機器可讀載體上。

換言之，本發明的方法之一實施例因此係具有程式碼之電腦程式，當該電腦程式在電腦上運行時，該電腦程式用於執行本文中描述之該等方法中之一者。

本發明的方法之另一實施例因此係資料載體(或數位儲存媒體，或電腦可讀媒體)，其包括記錄於其上的用於執行本文中描述之該等方法中之一者的電腦程式。

本發明的方法之另一實施例因此係資料串流或信號序列，其表示用於執行本文中描述之該等方法中之一者的電腦程式。資料串流或信號序列可例如經組配來經由資料通訊連接(例如，經由網際網路)來傳送。

另一實施例包括處理構件，例如電腦，或可規劃邏輯裝置，其經組配來或經調適來執行本文中描述之該等方法中之一者。

另一實施例中包括電腦，其上安裝有用於執行本文中描述之該等方法中之一者的電腦程式。

在一些實施例中，可規劃邏輯裝置(例如，場可規劃閘陣列)可用來執行本文中描述之該等方法之一些或所有功能。在一些實施例中，場可規劃閘陣列可與微處理器合作，以便執行本文中描述之該等方法中之一者。通常藉由任何硬體設備完美地執行該等方法。

上述實施例僅說明本發明之原理。應理解，其他熟習此項技術者將明白本文中描述之配置及細節的修改及變化。因此，本發明意欲僅受即將到來的申請專利範圍之範疇的限制，而不受藉由本文中對實施例之描述及闡述而呈現之特定細節的限制。

參考文獻

[BCC] C. Faller and F. Baumgarte, 「Binaural Cue Coding - Part II: Schemes and applications,」 IEEE Trans. on Speech and Audio Proc., vol. 11, no. 6, Nov. 2003

[JSC] C. Faller, 「Parametric Joint-Coding of Audio Sources」 , 120th AES Convention, Paris, 2006

[SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: 「From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio」 , 22nd Regional UK AES Conference, Cambridge, UK, April 2007

[SAOC2] J. Engdegård, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Hölzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers and W. Oomen: 「Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding」 , 124th AES Convention, Amsterdam 2008

[SAOC] ISO/IEC, 「MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC),」 ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2:2010.

[ISS1] M. Parvaix and L. Girin: 「Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding」 , IEEE ICASSP, 2010

[ISS2] M. Parvaix, L. Girin, J.-M. Brossier: 「A watermarking-based method for informed source separation of audio signals with a single sensor」 , IEEE Transactions on Audio, Speech and Language Processing, 2010

[ISS3] A. Liutkus and J. Pinel and R. Badeau and L. Girin and G. Richard: 「Informed source separation through spectrogram coding and data embedding」, Signal Processing Journal, 2011

[ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: 「Informed source separation: source coding meets source separation」 , IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011

[ISS5] Shuhua Zhang and Laurent Girin: 「An Informed Source Separation System for Speech Signals」 , INTERSPEECH, 2011

[ISS6] L. Girin and J. Pinel: 「Informed Audio Source Separation from Compressed Linear Stereo Mixtures」 , AES 42nd International Conference: Semantic Audio, 2011

[Dfx] C. Falch and L. Terentiev and J. Herre: 「Spatial Audio Object Coding with Enhanced Audio Object Separation」 , 10^th International Conference on Digital Audio Effects, 2010

110‧‧‧參數解碼單元

120‧‧‧殘差處理單元

Claims

一種解碼器，該解碼器包括：一參數解碼單元(110)，該參數解碼單元(110)用於藉由升混三個或更多個縮混信號來產生多個第一估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中該參數解碼單元(110)經組配來取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊。一殘差處理單元(120)，該殘差處理單元(120)用於藉由修改該等第一估計音訊物件信號中的一或多個來產生多個第二估計音訊物件信號，其中該殘差處理單元經組配來取決於一或多個殘差信號來修改該等第一估計音訊物件信號中之該等一或多個。
如申請專利範圍第1項之解碼器，其中該殘差處理單元(120)經組配來取決於至少三個殘差信號來修改該等第一估計音訊物件信號中的該等一或多個，以及其中該解碼器經調適來基於該等多個第二估計音訊物件信號產生至少三個音訊輸出通道。
如前述申請專利範圍中的一項之解碼器，其中該解碼器進一步包括一縮混修改單元(140)，該縮混修改單元經調適來自該等三個或更多個縮混信號中移除由該殘差處理單元(120)判定的該等多個第二估計音訊物件信號中的一或多個音訊物件信號，以獲得三個或更多個經修改的縮混信號，以及其中該參數解碼單元(110)經組配來基於該等三個或更多個經修改的縮混信號判定該等第一估計音訊物件信號中的一或多個音訊物件信號。
如申請專利範圍第3項之解碼器，其中該縮混修改單元(140)經調適來應用公式：以自該等三個或更多個縮混信號中移除由該殘差處理單元(120)判定的該等多個第二估計音訊物件信號中的該等一或多個音訊物件信號，以獲得三個或更多個經修改的縮混信號，其中X指示修改之前的該等三個或更多個縮混信號指示該等三個或更多個經修改的縮混信號D指示縮混資訊S _eao包括該等多個第二估計音訊物件信號中的該等一或多個音訊物件信號，以及指示該等多個第二估計音訊物件信號中的該等一或多個音訊物件信號之位置。
如申請專利範圍第3或4項之解碼器，其中，該解碼器經調適來實施兩個或更多個反覆步驟，其中，針對每一反覆步驟，該參數解碼單元(110)經調適來判定該等多個第一估計音訊物件信號中的確切一個音訊物件信號，其中針對該反覆步驟，該殘差處理單元(120)經調適來藉由修改該等多個第一估計音訊物件信號中的該音訊物件信號來判定該等多個第二估計音訊物件信號中的確切一個音訊物件信號，其中，針對該反覆步驟，該縮混修改單元(140)經調適來自該等三個或更多個縮混信號中移除該等多個第二估計音訊物件信號中的該音訊物件信號，以修改該等三個或更多個縮混信號，以及其中，針對在該反覆步驟之後的下一反覆步驟，該參數解碼單元(110)經調適來基於已修改之該等三個或更多個縮混信號來判定該等多個第一估計音訊物件信號中的確切一個音訊物件信號。
如前述申請專利範圍中的一項的解碼器，其中該等一或多個殘差信號中每一者指示該等多個原始音訊物件信號中之一者與該等一或多個第一估計音訊物件信號中之一者之間的一差。
如申請專利範圍第1或2項之解碼器，其中該殘差處理單元(120)經調適來藉由修改該等第一估計音訊物件信號中的五個或更多個來產生該等多個第二估計音訊物件信號，其中該殘差處理單元(120)經組配來取決於五個或更多個殘差信號來修改該等第一估計音訊物件信號中的該等五個或更多個。
如申請專利範圍第1或2項之解碼器，其中該解碼器經組配來基於該等多個第二估計音訊物件信號來產生七個或更多個音訊輸出通道。
如前述申請專利範圍中的一項的解碼器，其中該解碼器經調適來不判定通道預測係數來判定該等多個第二估計音訊物件信號。
如前述申請專利範圍中的一項的解碼器，其中該解碼器係一SAOC解碼器。
一種殘差信號產生器(200)，該殘差信號產生器(200)包括：一參數解碼單元(230)，該參數解碼單元用於藉由升混三個或更多個縮混信號來產生多個估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中該參數解碼單元(230)經組配來取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊，以及一殘差估計單元(240)，該殘差估計單元用於基於該等多個原始音訊物件信號且基於該等多個估計音訊物件信號來產生多個殘差信號，使得該等多個殘差信號中每一者係一差信號，該差信號指示該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。
如申請專利範圍第11項之殘差信號產生器(200)，其中該殘差信號產生器(200)進一步包括一縮混修改單元(250)，該縮混修改單元經調適來修改該等三個或更多個縮混信號以獲得三個或更多個經修改的縮混信號，以及其中該參數解碼單元(230)經組配來基於該等三個或更多個經修改的縮混信號來判定該等第一估計音訊物件信號中的一或多個音訊物件信號。
如申請專利範圍第12項之殘差信號產生器(200)，其中該縮混修改單元(250)經組配來：藉由自該等三個或更多個原始縮混信號中移除該等多個原始音訊物件信號中的一或多個，來修改該等三個或更多個原始縮混信號以獲得該等三個或更多個經修改的縮混信號。
如申請專利範圍第13項之殘差信號產生器，其中該縮混修改單元(250)經調適來應用公式：以自該等三個或更多個縮混信號中移除該等多個原始音訊物件信號中的該等一或多個，以獲得三個或更多個經修改的縮混信號，其中X指示修改之前的該等三個或更多個縮混信號指示該等三個或更多個經修改的縮混信號D指示縮混資訊 S _eao包括該等多個原始音訊物件信號中的該等一或多個，以及指示該等多個原始音訊物件信號中的該等一或多個之位置。
如申請專利範圍第12項之殘差信號產生器(200)，其中該縮混修改單元(250)經組配來：藉由基於該等估計音訊物件信號中的一或多個且基於該等殘差信號中的一或多個來產生一或多個經修改的音訊物件信號，以及藉由自該等三個或更多個原始縮混信號中移除該等一或多個經修改的音訊物件信號，來修改該等三個或更多個原始縮混信號以獲得該等三個或更多個經修改的縮混信號。
如申請專利範圍第15項之殘差信號產生器，其中該縮混修改單元(250)經調適來應用公式：以自該等三個或更多個縮混信號中移除該等一或多個經修改的音訊物件信號，以獲得三個或更多個經修改的縮混信號，其中X指示修改之前的該等三個或更多個縮混信號指示該等三個或更多個經修改的縮混信號D指示縮混資訊S _eao包括該等一或多個修改的音訊物件信號，以及指示該等一或多個修改的音訊物件信號之位置。
如申請專利範圍第12至16項中的一項之殘差信號產生器(200)，其中，該殘差信號產生器(200)經調適來實施兩個或更多個反覆步驟，其中，針對每一反覆步驟，該參數解碼單元(230)經調適來判定該等多個估計音訊物件信號中的確切一個音訊物件信號，其中針對該反覆步驟，該殘差估計單元(240)經調適來藉由修改該等多個估計音訊物件信號中的該音訊物件信號來判定該等多個殘差信號中的確切一個殘差信號，其中，針對該反覆步驟，該縮混修改單元(250)經調適來修改該等三個或更多個縮混信號，以及其中，針對在該反覆步驟之後的下一反覆步驟，該參數解碼單元(230)經調適來基於已修改之該等三個或更多個縮混信號來判定該等多個估計音訊物件信號中的確切一個音訊物件信號。
如申請專利範圍第11至17項中的一項之殘差信號產生器(200)，其中該殘差估計單元(240)經調適來基於該等多個原始音訊物件信號中的至少五個原始音訊物件信號且基於該等多個估計音訊物件信號中的至少五個估計音訊物件信號來產生至少五個殘差信號。
一種編碼器，該編碼器用於藉由產生三個或更多個縮混信號，藉由產生參數旁側資訊以及藉由產生多個殘差信號來編碼多個原始音訊物件信號，其中該編碼器包括：一縮混產生器(210)，該縮混產生器用於提供指示該等多個原始音訊物件信號之一縮混的該等三個或更多個縮混信號，一參數旁側資訊估計器(220)，該參數旁側資訊估計器用於產生指示關於多個原始音訊物件信號的資訊之該參數旁側資訊，以獲得該參數旁側資訊，以及如申請專利範圍第11至18項中的一項之殘差信號產生器(200)，其中該殘差信號產生器(200)之該參數解碼單元(230)經調適來藉由升混由該縮混產生器(210)提供的該等三個或更多個縮混信號來產生多個估計音訊物件信號，其中該縮混信號編碼該等多個原始音訊物件信號，其中該參數解碼單元(230)經組配來取決於由該參數旁側資訊估計器(220)產生之該參數旁側資訊來升混該等三個或更多個縮混信號，以及其中該殘差信號產生器(200)之該殘差估計單元(240)經調適來基於該等多個原始音訊物件信號且基於該等多個估計音訊物件信號來產生多個殘差信號，使得該等多個殘差信號中每一者指示在該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。
如申請專利範圍第19項之編碼器，其中該編碼器係一SAOC編碼器。
一種系統，該系統包括：如申請專利範圍第19或20項之編碼器(310)，該編碼器用於藉由產生三個或更多個縮混信號，藉由產生參數旁側資訊以及藉由產生多個殘差信號來編碼多個原始音訊物件信號，以及如申請專利範圍第1至10項中的一項之解碼器(320)，其中該解碼器(320)經組配來基於由該編碼器(310)產生之該等三個或更多個縮混信號，基於由該編碼器(310)產生之該參數旁側資訊且基於由該編碼器(310)產生之該等多個殘差信號來產生多個第二估計音訊物件信號。
一種已編碼音訊信號，其包括三個或更多個縮混信號(410)、參數旁側資訊(420)及多個殘差信號(430)，其中該等三個或更多個縮混信號(410)係多個原始音訊物件信號之一縮混，其中該參數旁側資訊(420)包括指示關於多個原始音訊物件信號的旁側資訊之參數，其中該等多個殘差信號(430)中每一者係一差信號，該差信號指示該等多個原始音訊信號中之一者與多個估計音訊物件信號中之一者之間的一差。
一種方法，該方法包括：藉由升混三個或更多個縮混信號來產生多個第一估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中產生該等多個第一估計音訊物件信號包括取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊，以及藉由修改該等第一估計音訊物件信號中的一或多個來產生多個第二估計音訊物件信號，其中產生多個第二估計音訊物件信號包括取決於一或多個殘差信號來修改該等第一估計音訊物件信號中的該等一或多個。
一種方法，該方法包括：藉由升混三個或更多個縮混信號來產生多個估計音訊物件信號，其中該等三個或更多個縮混信號編碼多個原始音訊物件信號，其中產生該等多個估計音訊物件信號包括取決於參數旁側資訊來升混該等三個或更多個縮混信號，該參數旁側資訊指示關於該等多個原始音訊物件信號的資訊，以及基於該等多個原始音訊物件信號且基於該等多個估計音訊物件信號來產生多個殘差信號，使得該等多個殘差信號中每一者係一差信號，該差信號指示該等多個原始音訊物件信號中之一者與該等多個估計音訊物件信號中之一者之間的一差。
一種電腦程式，該電腦程式用於當執行於一電腦或信號處理器上時實行如申請專利範圍第23或24項之方法。