TW201521013A

TW201521013A - 解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器

Info

Publication number: TW201521013A
Application number: TW103136287A
Authority: TW
Inventors: Florin Ghido; Achim Kuntz; Bernhard Grill
Original assignee: Fraunhofer Ges Forschung
Priority date: 2013-10-22
Filing date: 2014-10-21
Publication date: 2015-06-01
Also published as: US20230005489A1; ES2655046T3; TWI571866B; US20180197553A1; US20160232901A1; PL3061087T3; ZA201603298B; US11393481B2; WO2015058991A1; PT3061087T; EP2866227A1; BR112016008787B1; RU2016119546A; BR112016008787A2; US10468038B2; AR098152A1; JP2016538585A; EP3061087A1; CN105723453B; AU2014339167A1

Abstract

本文描述一種方法，其解碼一下混矩陣以用於將音訊內容之複數個輸入頻道映射至複數個輸出頻道，該等輸入及輸出頻道與在相對於一收聽者位置之預定位置處之各別揚聲器相關聯，其中藉由利用該複數個輸入頻道之揚聲器對的對稱性及該複數個輸出頻道之揚聲器對的對稱性來編碼該下混矩陣。表示該經編碼下混矩陣之經編碼資訊經接收及解碼以用於獲得該經解碼下混矩陣。

Description

解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器

發明領域

本發明係關於音訊編碼/解碼之領域，尤其係關於空間音訊寫碼及空間音訊目標寫碼，例如，係關於3D音訊編解碼器系統之領域。本發明之實施例係關於用於編碼及解碼下混矩陣以將音訊內容之複數個輸入頻道映射至複數個輸出頻道之方法、係關於用於呈現音訊內容之方法、係關於用於編碼下混矩陣之編碼器、係關於用於解碼下混矩陣之解碼器、係關於音訊編碼器且係關於音訊解碼器。

發明背景

空間音訊寫碼工具在此項技術中係已知的，且(例如)經在MPEG-Surround標準中標準化。空間音訊寫碼自複數個原始輸入頻道(例如，五個或七個輸入頻道)開始，該等輸入頻道由其在再現設置中之置放識別為(例如)左頻道、中心頻道、右頻道、左環繞頻道、右環繞頻道及低頻增強頻道。空間音訊編碼器可自原始頻道導出一或多個下混頻道，且另外可導出關於空間提示(諸如，頻道相干值中之頻道間等級差、頻道間相位差、頻道間時間差等)之參數資料。一或多個下混頻道與指示空間提示之參數旁側資訊一起傳輸至用於解碼下混頻道及相關聯之參數資料的空間音訊解碼器，以便最終獲得原始輸入頻道之近似型式的輸出頻道。頻道在輸出設置中之置放可為固定的，例如，5.1格式、7.1格式等等。

又，空間音訊目標寫碼工具在此項技術中係熟知的，且(例如)經在MPEG SAOC(SAOC=空間音訊目標寫碼)標準中標準化。與自原始頻道開始之空間音訊寫碼相反，空間音訊目標寫碼自音訊目標開始，該等音訊目標不自動專用於某一呈現再現設置。相反，音訊目標在再現場景中之置放為靈活的且可由使用者(例如)藉由將某些呈現資訊輸入至空間音訊目標寫碼解碼器中而設定。替代地或另外，呈現資訊可作為額外旁側資訊或後設資料傳輸，呈現資訊可包括某一音訊目標在再現設置中待置放至之位置(例如，附著時間過去)的資訊。為獲得某一資料壓縮，使用SAOC編碼器編碼大量音訊目標，該SAOC編碼器藉由根據某一下混資訊下混目標來自輸入目標計算一或多個輸送頻道。此外，SAOC編碼器計算表示目標間提示(諸如，目標等級差(OLD)、目標相干值等)之參數旁側資訊。如在SAC(SAC= 空間音訊寫碼)中，目標間參數資料經針對個別時間/頻率塊計算。對於音訊信號之某一訊框(例如，1024或2048個樣本)，考慮複數個頻帶(例如，24、32或64個頻帶)，以使得針對每一訊框及每一頻帶提供參數資料。舉例而言，當音訊片段具有20個訊框時且當每一訊框經細分成32個頻帶時，時間/頻率塊之數目為640。

在3D音訊系統中，可能需要使用喇叭(loudspeaker)或揚聲器(speaker)組配在接收器處提供音訊信號之空間印象，此係由於喇叭或揚聲器在接收器處可用，然而，該組配可不同於用於原始音訊信號之原始揚聲器組配。在此情形下，需要進行轉換，根據哪些輸入頻道根據音訊信號之原始揚聲器組配經映射至根據接收器之揚聲器組配界定之輸出頻道，該轉換亦被稱作「下混」。

發明概要

本發明之目標為提供用於對接收器提供下混矩陣之改良方法。

此目標由如請求項1、2及20之方法、如請求項24之編碼器、如請求項26之解碼器、如請求項28之音訊編碼器及如請求項29之音訊解碼器實現。

本發明係基於穩定下混矩陣之更有效率寫碼可藉由利用對稱性達成之發現，該等對稱性可在關於與各別頻道相關聯之揚聲器之置放之輸入頻道組配及輸出頻道組配中發現。本發明之發明者已發現，利用此對稱性允許將對稱配置之揚聲器(例如，具有關於收聽者位置之具有相同仰角及方位角之相同絕對值但具有不同正負號的位置之彼等揚聲器)組合至下混矩陣之共同列/行。此舉允許產生具有減小之大小的緊密下混矩陣，因此，當與原始下混矩陣相比時，該緊密下混矩陣可更容易且更有效率地編碼。

根據實施例，不僅界定對稱揚聲器群組，且實際上創造三類揚聲器群組，亦即，上述對稱揚聲器、中心揚聲器及不對稱揚聲器，該等揚聲器接著可用於產生緊密表示。該方法為有利的，此係因為其允許不同地處置來自各別類別之揚聲器且因此更有效率。

根據實施例，編碼緊密下混矩陣包含編碼與關於實際緊密下混矩陣之資訊分開的增益值。藉由建立緊密有效矩陣來編碼關於實際緊密下混矩陣之資訊，該緊密有效矩陣關於緊密輸入/輸出頻道組配藉由將輸入及輸出對稱揚聲器對中之每一者併入一個群組中來指示非零增益之存在。該方法為有利的，此係因為其允許基於延行長度方案有效率地編碼有效矩陣。

根據實施例，可提供模板矩陣，該模板矩陣類似於緊密下混矩陣，其中模板矩陣之矩陣元素中的條目實質上對應於緊密下混矩陣中之矩陣元素中的條目。大體而言，該等模板矩陣提供於編碼器及解碼器處，且與緊密下混矩陣不同之處僅在於減少數目個矩陣元素，使得藉由將逐個元素XOR應用至具有此模板矩陣之緊密有效矩陣將大幅減少矩陣元素的數目。該方法為有利的，此係因為其允許再次使用(例如)延行長度方案更進一步增大編碼有效矩陣之效率。

根據又一實施例，編碼係進一步基於正常揚聲器是否僅混合至正常揚聲器且LFE揚聲器僅混合至LFE揚聲器的指示。此舉為有利的，此係因為其進一步改良有效矩陣之寫碼。

根據又一實施例，關於延行長度寫碼應用至之一維向量，緊密有效矩陣或上述XOR運算之結果經提供以將其轉換至成串之零，其後為一個一，此係有利地，此係由於其提供寫碼資訊之極高效可能性。為達成更有效率編碼，根據實施例，將有限哥倫布-萊斯編碼應用於延行長度值。

根據針對每一輸出揚聲器群組之另外實施例，指示對稱性及可分離性之性質適用於產生該等性質之所有對應的輸入揚聲器群組。此舉為有利的，此係因為其指示在(例如)由左揚聲器及右揚聲器組成之揚聲器群組中，輸入頻道群組中之左揚聲器僅映射至對應的輸出揚聲器群組中的左頻道，輸入頻道群組中之右揚聲器僅經映射至輸出頻道群組中之右揚聲器，且自左頻道至右頻道不存在混合。此舉允許由單一增益值替換原始下混矩陣中之2×2子矩陣中的四個增益值，該單一增益值可引入至緊密矩陣中，或在緊密矩陣為有效矩陣的情況下可單獨寫碼。在任何情況下，待寫碼之增益值之總數減少。因此，對稱性及可分離性之傳訊之性質為有利的，此係因為其允許有效率地寫碼對應於每一輸入及輸出揚聲器群組對之子矩陣。

根據實施例，對於寫碼增益值，使用傳訊之最小及最大增益以及傳訊之所要精度以特定次序創造可能增益之清單。以常用增益在清單或表之開始處的此次序創造增益值。此舉為有利的，此係因為其允許藉由將最短碼字應用於最頻率使用之增益以編碼該等增益來有效率地編碼增益值。

根據一實施例，產生之增益值可提供於清單中，清單中之每一條目具有與其相關聯之索引。當寫碼增益值，而非寫碼實際值時，編碼增益之索引。此可(例如)藉由應用有限哥倫布-萊斯編碼方法進行。此增益值處置為有利的，此係因為其允許有效率地編碼該等增益值。

根據實施例，均衡器(EQ)參數可連同下混矩陣一起傳輸。

100‧‧‧音訊編碼器

102‧‧‧預呈現器/混合器電路

104、204‧‧‧頻道信號

106、120、208‧‧‧目標信號

108‧‧‧目標後設資料/目標後設資料資訊

110‧‧‧信號

112‧‧‧空間音訊目標寫碼(SAOC)編碼器

114‧‧‧SAOC輸送頻道

116‧‧‧統一語音及音訊寫碼(USAC)編碼器

118‧‧‧SAOC旁側資訊

122、206‧‧‧預呈現之目標信號

124‧‧‧目標相關後設資料(OAM)編碼器

126、212‧‧‧經壓縮目標後設資料資訊

128‧‧‧經編碼信號/3D音訊位元串流

200‧‧‧音訊解碼器

202‧‧‧USAC解碼器

210‧‧‧SAOC輸送頻道信號

214‧‧‧SAOC-SI

216‧‧‧目標呈現器

218、222‧‧‧呈現之目標信號

220‧‧‧SAOC解碼器

224‧‧‧OAM解碼器

226‧‧‧混合器

228‧‧‧頻道信號/傳輸之頻道組配

230、234、238‧‧‧參考符號

232‧‧‧格式轉換電路/喇叭呈現器模組

236‧‧‧立體聲呈現器/立體聲呈現器模組

250‧‧‧下混器

252‧‧‧中間下混信號

254‧‧‧實際立體聲轉換器

300‧‧‧右邊行/輸入頻道組配

302‧‧‧底部列/輸出頻道組配

304、314'、318、318'、320、 320'‧‧‧矩陣元素

306‧‧‧原始下混矩陣

308‧‧‧緊密下混矩陣

310‧‧‧緊密輸入組配/經轉換輸入頻道組配

310'‧‧‧輸入頻道組配

312‧‧‧緊密輸出頻帶組配/經轉換輸出頻帶組配

312'‧‧‧輸出頻道組配

314‧‧‧緊密下混矩陣元素/矩陣條目

316‧‧‧模板矩陣

將參看附隨圖式描述本發明之實施例，其中：圖1說明3D音訊系統之3D音訊編碼器的概述；圖2說明3D音訊系統之3D音訊解碼器的概述；圖3說明可在圖2之3D音訊解碼器中實施的立體聲呈現器之一實施例；圖4說明此項技術中已知之用於自22.2輸入組配映射至5.1輸出組配之一例示性下混矩陣；圖5示意性說明用於將圖4之原始下混矩陣轉換成緊密下混矩陣的本發明之一實施例；圖6說明根據本發明之一實施例的圖5之緊密下混矩陣，該緊密下混矩陣具有經轉換輸入及輸出頻道組配，其中矩陣條目表示有效值；圖7說明用於使用模板矩陣編碼圖5之緊密下混矩陣之結構的本發明之又一實施例；及圖8(a)至圖8(g)說明根據輸入及輸出揚聲器之不同組合的可自圖4中所展示之下混矩陣導出的可能子矩陣。

較佳實施例之詳細說明

將描述本發明方法之實施例。以下描述將以可實施本發明方法之3D音訊編解碼器系統的系統概述開始。

圖1及圖2展示根據實施例的3D音訊系統之演算法方塊。更具體言之，圖1展示3D音訊編碼器100之概述。音訊編碼器100在可視情況提供之預呈現器/混合器電路102處接收輸入信號，更具體言之，在提供至音訊編碼器100之複數個輸入頻道處接收複數個頻道信號104、複數個目標信號106及對應的目標後設資料108。由預呈現器/混合器102處理之目標信號106(參見信號110)可提供至SAOC編碼器112(SAOC=空間音訊目標寫碼)。SAOC編碼器112產生提供至USAC編碼器116(USAC=統一語音及音訊寫碼)之SAOC輸送頻道114。另外，信號SAOC-SI 118(SAOC-SI=SAOC旁側資訊)亦提供至USAC編碼器116。USAC編碼器116進一步直接自預呈現器/混合器接收目標信號120，以及頻道信號及預呈現之目標信號122。目標後設資料資訊108應用於用於將經壓縮目標後設資料資訊126 提供至USAC編碼器的OAM編碼器124(OAM=目標相關聯後設資料)。USAC編碼器116基於上述輸入信號產生如128處所展示之經壓縮輸出信號mp4。

圖2展示3D音訊系統之3D音訊解碼器200的概述。由圖1之音訊編碼器100產生之經編碼信號128(mp4)在音訊解碼器200處、更具體言之在USAC解碼器202處接收。USAC解碼器202將接收之信號128解碼成頻道信號204、預呈現之目標信號206、目標信號208及SAOC輸送頻道信號210。另外，經壓縮目標後設資料資訊212及信號SAOC-SI 214由USAC解碼器202輸出。目標信號208提供至輸出呈現之目標信號218之目標呈現器216。SAOC輸送頻道信號210供應至輸出呈現之目標信號222之SAOC解碼器220。經壓縮目標後設資料資訊212供應至OAM解碼器224，該OAM解碼器224將各別控制信號輸出至目標呈現器216及SAOC解碼器220以用於產生呈現之目標信號218及呈現之目標信號222。解碼器進一步包含接收(如圖2中所示)輸入信號204、206、218及222之一混合器226，以用於輸出頻道信號228。頻道信號可直接輸出至喇叭，例如，如230處所指示之32頻道喇叭。信號228可提供至格式轉換電路232，該格式轉換電路232接收指示待轉換頻道信號228之方式的再現佈局信號作為控制輸入。在圖2中描繪之實施例中，假設轉換係以信號可提供至如234處所示之5.1揚聲器系統的方式進行。又，頻道信號228可提供至產生(例如)用於如238處所指示之耳機的兩個輸出信號的立體聲呈現器236。

在本發明之一實施例中，圖1及圖2中所描繪之編碼/解碼系統係基於用於寫碼頻道信號及目標信號(參見信號104及106)之MPEG-D USAC編解碼器。為增加寫碼大量目標之效率，可使用MPEG SAOC技術。三種類型之呈現器可執行將目標呈現至頻道、將頻道呈現至耳機或將頻道呈現至不同揚聲器設置(參見圖2，參考符號230、234及238)之任務。當使用SAOC明確傳輸或參數編碼目標信號時，對應的目標後設資料資訊108經壓縮(參見信號126)且多工至3D音訊位元串流128。

以下將進一步詳細描述圖1及圖2中所展示之總體3D音訊系統的演算法方塊。

可視情況提供預呈現器/混合器102以在編碼前將頻道加目標輸入場景轉換成頻道場景。該預呈現器/混合器102在功能上與以下將描述之目標呈現器/混合器相同。可能需要預呈現目標以確保編碼器輸入端處之基本上獨立於許多同時作用中目標信號的決定性信號熵。在預呈現目標之情況下，不需要目標後設資料傳輸。離散目標信號經呈現至編碼器經組配以使用之頻道佈局。自相關聯之目標後設資料(OAM)獲得用於每一頻道的目標之權重。

USAC編碼器116為用於喇叭-頻道信號、離散目標信號、目標下混信號及預呈現信號的核心編解碼器。該USAC編碼器116係基於MPEG-D USAC技術。其藉由基於輸入頻道及目標指派之幾何及語義資訊創造頻道及目標映射資訊來處置以上信號之寫碼。此映射資訊描述輸入頻道及目標如何映射至USAC頻道元素，如頻道對元素(CPE)、單一頻道元素(SCE)、低頻效應(LFE)及四頻道元素(QCE)及CPE、SCE及LFE，且對應的資訊傳輸至解碼器。所有額外酬載(如SAOC資料114、118或目標後設資料126)視為在編碼器之速率控制下。取決於呈現器之速率/失真要求及互動性要求，以不同方式寫碼目標係可能的。根據實施例，以下目標寫碼變體係可能的：

●預呈現目標：目標信號在編碼前經預呈現且混合至22.2頻道信號。隨後寫碼鏈見到22.2頻道信號。

●離散目標波形：目標作為單音波形供應至編碼器。編碼器使用單一頻道元素(SCE)傳輸除頻道信號之外亦有的目標。經解碼目標在接收器側處呈現且混合。經壓縮目標後設資料資訊傳輸至接收器/呈現器。

●參數目標波形：目標性質及其彼此的關係藉由SAOC參數描述。目標信號之下混藉由USAC寫碼。參數資訊沿旁側傳輸。取決於目標之數目及總資料速率，選擇下混頻道之數目。經壓縮目標後設資料資訊傳輸至SAOC呈現器。

用於目標信號之SAOC編碼器112及SAOC解碼器220可基於MPEG SAOC技術。系統能夠基於較少數目個輸送頻道及額外參數資料(諸如，OLD、IOC(目標間相干性)、OMG(下混增益))再生、修改及呈現大量音訊目標。額外參數資料展現明顯低於個別地傳輸所有目標所需之資料速率，從而使寫碼非常有效率。SAOC編碼器112將作為單音波形之目標/頻道信號當作輸入，且輸出參數資訊(其經封裝至 3D音訊位元串流128內)及SAOC輸送頻道(其由使用單一頻道元素而編碼且經傳輸)。SAOC解碼器220自經解碼SAOC輸送頻道210及參數資訊214重建目標/頻道信號，且基於再現佈局、經解壓縮目標後設資料資訊且視情況基於使用者互動資訊產生輸出音訊場景。

提供目標後設資料編解碼器(參見OAM編碼器124及OAM解碼器224)，以使得對於每一目標，指定幾何位置及目標在3D空間中之體積的相關聯後設資料經藉由量化目標在時間及空間中之性質而有效率地寫碼。經壓縮目標後設資料cOAM 126作為旁側資料傳輸至接收器200。

目標呈現器216利用經壓縮目標後設資料根據給定再現格式產生目標波形。每一目標根據其後設資料呈現至某一輸出頻道。該區塊之輸出自部分結果之總和產生。若解碼基於頻道之內容以及離散/參數目標兩者，則基於頻道之波形及呈現之目標波形在輸出所得波形228前或在將其饋入至後處理器模組(如立體聲呈現器236或喇叭呈現器模組232)前由混合器226混合。

立體聲呈現器模組236產生多頻道音訊材料之立體聲下混，以使得每一輸入頻道由虛擬聲源表示。處理以逐個訊框在QMF(正交鏡像濾波器組)域中進行，且立體聲化係基於量測之立體聲房間脈衝回應。

喇叭呈現器232在傳輸之頻道組配228與所要的再現格式之間轉換。亦可稱為「格式轉換器」。格式轉換器執行至較低數目個輸出頻道之轉換，亦即，其創造下混。

圖3說明圖2之立體聲呈現器236之一實施例。立體聲呈現器模組可提供多頻道音訊材料之立體聲下混。立體聲化可基於量測之立體聲房間脈衝回應。房間脈衝回應可視為真實房間之聲學性質的「指紋」。房間脈衝回應經量測及儲存，且任意聲學信號可具備此「指紋」，藉此允許在收聽者處模擬與房間脈衝回應相關聯之房間的聲學性質。立體聲呈現器236可經規劃或組配以用於使用頭部有關轉移功能或立體聲房間脈衝回應(BRIR)將輸出頻道呈現至兩個立體聲頻道中。舉例而言，對於行動器件而言，需要立體聲呈現用於附接至該等行動器件之耳機或喇叭。在該等行動器件中，歸因於約束，可能有必要限制解碼器及呈現複雜性。除了省略在該等處理情形下之解相關之外，首先使用下混器250對中間下混信號252(亦即，對較低數目個輸出頻道)進行下混可能係較佳的，較低數目個輸出頻道導致用於實際立體聲轉換器254之較低數目個輸入頻道。舉例而言，22.2頻帶材料可由下混器250下混至5.1中間下混，或替代地，中間下混可由圖2中之SAOC解碼器220以一種「捷徑」之方式直接計算。接著，立體聲呈現必須應用十個HRTF(頭部相關轉移功能)或BRIR功能以在不同位置處呈現五個個別頻道，此與在22.2輸入頻道待直接呈現的情況下應用44個HRTF或BRIR功能形成對比。立體聲呈現所必要之卷積操作需要大量處理能力，且因此降低此處理能力同時仍獲得可接受之音訊品質對行動器件特別有用。立體聲呈現器236產生多頻道音訊材料228之立體聲下混238，以使得每一輸入頻道(不包括LFE頻道)由虛擬聲源表示。處理可按逐個訊框在QMF域中進行。立體聲化係基於量測之立體聲房間脈衝回應，且直達聲及早期回聲可在偽FFT域中經由卷積方法使用QMF域上之快速卷積壓印至音訊資料，而後期混響可分開來處理。

多頻道音訊格式當前存在於大量多種組配中，該等格式用於如其已在上文詳細描述之3D音訊系統中，3D音訊系統用於(例如)提供DVD及藍光光碟上提供之音訊資訊。一個重要問題為適應多頻道音訊之即時傳輸，同時維持與現有可用客戶實體揚聲器設置之相容性。解決方案為將音訊內容按(例如)生產中使用之原始格式編碼，該格式通常具有大量輸出頻道。另外，下混旁側資訊經提供以產生具有較少獨立頻道之其他格式。假設(例如)數目N個輸入頻道及數目M個輸出頻道，接收器處之下混程序可由具有大小為N×M之下混矩陣指定。如其可能在上述格式轉換器或立體聲呈現器之下混器中執行之此特定程序表示被動下混，其意謂無取決於實際音訊內容處理之適應性信號應用至輸入信號或經下混輸出信號。

下混矩陣試圖不僅匹配音訊資料之實體混合，且亦可傳達可使用其關於經傳輸之實際內容的知識之生產者之藝術意圖。因此，存在若干產生下混矩陣之方式，例如，藉由使用關於輸入及輸出揚聲器之作用及位置的通用聲學知識手動產生下混矩陣、藉由使用關於實際內容及藝術意圖之知識手動產生下混矩陣及例如藉由使用軟體工具自動產生下混矩陣，該軟體工具使用給定輸出揚聲器計算近似值。

存在用於提供該等下混矩陣之此項技術中許多已知的方法。然而，現有方案做了許多假設且硬式寫碼結構之重要部分及實際下混矩陣之內容。在先前技術參考[1]中，描述了使用特定下混程序，該等下混程序明確針對自5.1頻道組配(參見先前技術參考[2])下混至2.0頻道組配、自6.1或7.1前部或前高度或後部環繞變體下混至5.1或2.0頻道組配而定義。此等已知方法之缺點為在一些輸入頻道與預定義權重混合(例如，在將7.1後部環繞映射至5.1組配的情況下，L、R及C輸入頻道直接映射至對應的輸出頻道)及減少數目個增益值共用於一些其他輸入頻道(例如，在將7.1前置映射至5.1組配的情況下，L、R、Lc及Rc輸入頻道使用僅一個增益值映射至L及R輸出頻道)意義上，下混方案僅具有有限自由度。此外，增益僅具有有限範圍及精度，例如，自0dB至9dB，其中一共八個等級。明確描述用於每一輸入及輸出組配對之下混程序很費力且暗示以延遲之順應性為代價，依附於現有標準。先前技術參考[5]中描述另一建議。此方法使用表示靈活性之改良的明確下混矩陣，然而，該方案再次限制0dB至9dB(其中一共16個等級)之範圍及精度。此外，每一增益按4位元之固定精度編碼。

因此，鑒於已知先前技術，需要用於有效率地寫碼下混矩陣之改良方法，包括選擇合適表示域及量化方案以及無損寫碼量化值的態樣。

根據實施例，藉由允許按由生產者根據其需要指定之範圍及精度編碼任意下混矩陣來達成針對處置下混矩陣的不受限制之靈活性。又，本發明之實施例提供非常有效率之無損寫碼，所以典型矩陣使用少量位元，且脫離典型矩陣將僅逐漸降低效率。此意謂矩陣與典型矩陣愈類似，則根據本發明之實施例描述之寫碼將愈有效率。

根據實施例，所需精度可由生產者指定為1dB、0.5dB或0.25dB以用於均勻量化。應注意，根據其他實施例，亦可選擇用於精度之其他值。與此相反，現有方案僅允許1.5dB或0.5dB之精度用於約0dB之值，同時將較低精度用於其他值。使用較粗略量化用於一些值影響達成之最差情況容差且使經解碼矩陣之寫碼更加困難。在現有技術中，較低精度用於一些值，此為使用均勻寫碼減少所需位元之數目的簡單方式。然而，實務上，可在不犧牲精度的情況下藉由使用以下將進一步詳細描述之改良寫碼方案達成相同結果。

根據實施例，混合增益值可經指定在最大值(例如，+22dB)與最小值(例如，-47dB)之間。該等值亦可包括負無窮大值。矩陣中使用之有效值範圍在位元串流中指示為最大增益及最小增益，藉此不浪費實際上未使用但不限制所要的靈活性之值的任何位元。

根據實施例，假設下混矩陣待提供至之音訊內容之輸入頻道清單為可用的，以及指示輸出揚聲器組配之輸出頻道清單。此等清單提供關於輸入組配及輸出組配中之每一揚聲器的幾何資訊，諸如，方位角及仰角。視情況地，亦可提供揚聲器習知名稱。

圖4展示如此項技術中已知用於自22.2輸入組配映射至5.1輸出組配之一例示性下混矩陣。在矩陣之右邊行300中，根據22.2組配之各別輸入頻道由與各別頻道相關聯之揚聲器名稱指示。底部列302包括輸出頻道組配(5.1組配)之各別輸出頻道。再次，各別頻道由相關聯之揚聲器名稱指示。矩陣包括複數個矩陣元素304，每一矩陣元素304具有增益值，亦被稱作混合增益。混合增益指示當對各別輸出頻道302有影響時，如何調整給定輸入頻道(例如，輸入頻道300中之一者)之等級。舉例而言，左上方矩陣元素展示值「1」，意謂輸入頻道組配300之中心頻道C完全匹配輸出頻道組配302之中心頻道C。同樣，兩個組配中之各別左及右頻道(L/R頻道)經完全映射，亦即，輸入組配中之左/右頻道完全對輸出組配中之左/右頻道有影響。輸入組配中之其他頻道(例如，頻道Lc及Rc)以0.7之降低等級映射至輸出組配302之左及右頻道。如自圖4可見，亦存在許多不具有條目之矩陣元素，意謂與矩陣元素相關聯之各別頻道不彼此映射，或意謂經由不具有條目之矩陣元素與輸出頻道相關之輸入頻道不對各別輸出頻道有影響。舉例而言，左/右輸入頻道皆不映射至輸出頻道Ls/Ls，亦即，左及右輸入頻道不對輸出頻道Ls/Ls有影響。亦已指示零增益，而非在矩陣中提供空隙。

在下文中將描述若干技術，該等技術根據本發明之實施例應用以達成有效率地無損寫碼下混矩陣。在下列實施例中，將對圖4中所展示之下混矩陣之寫碼進行參考，然而，顯而易見的是，下文中描述之細節可應用於可提供之任何其他下混矩陣。根據實施例，提供用於解碼下混矩陣之方法，其中藉由利用複數個輸入頻道之揚聲器對之對稱性及複數個輸出頻道之揚聲器對之對稱性來編碼下混矩陣。下混矩陣在其傳輸至解碼器之後(例如)在音訊解碼器處經解碼，該音訊解碼器接收包括經編碼音訊內容之位元串流及亦表示下混矩陣之經編碼資訊或資料，從而允許在解碼器處建構對應於原始下混矩陣之下混矩陣。解碼下混矩陣包含接收表示下混矩陣之經編碼資訊及解碼經編碼資訊以用於獲得下混矩陣。根據其他實施例，提供用於編碼下混矩陣之方法，該方法包含利用複數個輸入頻道之揚聲器對之對稱性及複數個輸出頻道之揚聲器對之對稱性。

在本發明之實施例之以下描述中，將在編碼下混矩陣之情況下描述一些態樣，然而，對於熟習此項技術之讀者，很明顯，此等態樣亦表示用於解碼下混矩陣之對應的方法之描述。類似地，在解碼下混矩陣之情況下描述之態樣亦表示用於編碼下混矩陣之對應的方法之描述。

根據實施例，第一步驟為利用矩陣中之相當大的數目個零條目。在接著的步驟中，根據實施例，吾人利用全域規則性及亦精細等級規則性，該等規則性通常存在於下混矩陣中。第三步驟為利用非零增益值之典型分佈。

根據第一實施例，本發明方法自下混矩陣開始，此係由於其可由音訊內容之生產者提供。對於以下論述，為簡單起見，假設考慮之下混矩陣為圖4之下混矩陣。根據本發明方法，圖4之下混矩陣經轉換以用於提供當與原始矩陣相比時可更有效率地編碼之緊密下混矩陣。

圖5示意性表示剛提到之轉換步驟。在圖5之上部部分中，圖4之原始下混矩陣306經展示為以下文將進一步詳細描述之方式轉換成圖5之下部部分中所展示之緊密下混矩陣308。根據本發明方法，使用「對稱揚聲器對」之概念，該概念意謂相對於收聽者位置，一個揚聲器在左半平面中，而另一揚聲器在右半平面中。此對稱對組配對應於具有相同仰角同時具有用於方位角之相同絕對值但具有不同正負號之兩個揚聲器。

根據實施例，定義不同類別之揚聲器群組，主要為對稱揚聲器S、中心揚聲器C及不對稱揚聲器A。中心揚聲器為在改變揚聲器位置之方位角之正負號時位置不改變的彼等揚聲器。不對稱揚聲器為缺乏給定組配中之另一或對應的對稱揚聲器之彼等揚聲器，或在一些罕見組配中，另一側上之揚聲器可具有不同仰角或方位角，以使得在此情況下存在兩個單獨不對稱揚聲器，而非一對稱對。在圖5中所展示之下混矩陣306中，輸入頻道組配300包括圖5之上部部分中指示的九個對稱揚聲器對S₁至S₉。舉例而言，對稱揚聲器對S₁包括22.2輸入頻道組配300之揚聲器Lc及Rc。又，22.2輸入組配中之LFE揚聲器為對稱揚聲器，此係因為其關於收聽者位置具有相同仰角及相同絕對方位角但具有不同正負號。22.2輸入頻道組配300進一步包括六個中心揚聲器C₁至C₆，亦即，揚聲器C、Cs、Cv、Ts、Cvr及Cb。輸入頻道組配中不存在不對稱頻道。不同於輸入頻道組配，輸出頻道組配302僅包括兩個對稱揚聲器對S₁₀及S₁₁，及一個中心揚聲器C₇及一個不對稱揚聲器A₁。

根據所描述之實施例，藉由將形成對稱揚聲器對之輸入及輸出揚聲器分群在一起而將下混矩陣306轉換至緊密表示308。將各別揚聲器分群在一起產生包括與原始輸入組配300中相同之中心揚聲器C₁至C₆的緊密輸入組配310。然而，當與原始輸入組配300相比時，對稱揚聲器S₁至S₉分別分群在一起，以使得各別對現僅佔據單一列，如圖5之下部部分中所指示。以類似方式，原始輸出頻道組配302亦經轉換成亦包括原始中心及不對稱揚聲器(即，中心揚聲器C₇及不對稱揚聲器A₁)之緊密輸出頻道組配312。然而，各別揚聲器對S₁₀及S₁₁經組合至單一行中。因此，如自圖5可見，原始下混矩陣306之24×6的尺寸減小至緊密下混矩陣之15×4的尺寸。

在關於圖5所描述之實施例中，吾人可看到在原始下混矩陣306中，指示輸入頻道多強地對輸出頻道有影響的與各別對稱揚聲器對S₁至S₁₁相關聯之混合增益經針對輸入頻道中及輸出頻道中之對應的對稱揚聲器對對稱地排列。舉例而言，在查看對S₁及S₁₀時，各別左及右頻道經由增益0.7組合，而左/右頻道之組合與增益0組合。因此，當以如緊密下混矩陣308中所展示之方式將各別頻道分群在一起時，緊密下混矩陣元素314可包括亦關於原始矩陣306描述之各別混合增益。因此，根據上述實施例，藉由將對稱揚聲器對分群在一起來減小原始下混矩陣之大小，以使得「緊密」表示308可比原始下混矩陣有效率地加以編碼。

關於圖6，現將描述本發明之又一實施例。圖6再次展示具有已關於圖5展示及描述之經轉換輸入頻道組配310及輸出頻道組配312的緊密下混矩陣308。在圖6之實施例中，不同於圖5中之緊密下混矩陣之矩陣條目314不表示任何增益值，而表示所謂的「有效值」。有效值指示在各別矩陣元素314處與其相關聯之任何增益是否為零。展示值「1」之彼等矩陣元素314指示各別元素具有與其相關聯之增益值，而空隙矩陣元素指示無增益值或零增益與此元素相關聯。根據此實施例，當與圖5相比時，用有效值替代實際增益值允許更進一步有效率地編碼緊密下混矩陣，此係因為圖6之表示308可使用(例如)每條目一個位元(指示用於各別有效值之值1或值0)來簡單編碼。另外，除編碼有效值之外，亦將有必要編碼與矩陣元素相關聯之各別增益值，以使得解碼接收之資訊後，可重建構完整下混矩陣。

根據另一實施例，下混矩陣在其如圖6中所展示之緊密形式下的表示可使用延行長度方案來編碼。在此延行長度方案中，藉由將以列1開始且以列15結束之列串接在一起而將矩陣元素314變換成一維向量。此一維向量接著轉換成含有延行長度(例如，以1結束之連續零的數目)之清單。在圖6之實施例中，此舉產生以下清單：

其中(1)表示位元向量以0結束的情況下之虛擬終止。以上所展示之延行長度可使用適當寫碼方案(諸如，將可變長度前置碼指派至每一數目之有限哥倫布-萊斯寫碼)來寫碼，以使得使總位元長度最小化。哥倫布-萊斯寫碼方法用以使用非負整數參數p 0寫碼非負整數n 0如下：首先，使用一元寫碼來寫碼數目)，h一(1)位元後接著為終止零位元；接著使用p位元均勻寫碼數目l=n-h．2^p。

有限哥倫布-萊斯寫碼為提前已知n<N時使用的平凡變體。當寫碼h之最大可能值(h為))時，有限哥倫布-萊斯寫碼不包括終止零位元。更準確而言，為編碼h=h _max，在未終止零位元的情況下僅使用h一(1)位元，不需要該終止零位元，因為解碼器可暗中偵測此情況。

如上所提到，與各別元素314相關聯之增益需要經編碼以及傳輸，且以下將進一步詳細描述用於進行此舉之實施例。在詳細論述增益之編碼之前，現將描述用於編碼圖6中所展示之緊密下混矩陣之結構的另外實施例。

圖7描述用於藉由使用典型緊密矩陣具有某一有意義結構以使得其大體上類似於在音訊編碼器及音訊解碼器兩者處可用之模板矩陣的事實來編碼緊密下混矩陣之結構的又一實施例。圖7展示具有有效值之緊密下混矩陣308，如圖6中亦展示。另外，圖7展示具有相同輸入頻道組配310'及輸出頻道組配312'之可能模板矩陣316的一實例。模板矩陣(如緊密下混矩陣)包括各別模板矩陣元素314'中的有效值。有效值基本上以與在緊密下混矩陣中相同之方式分佈在元素314'中，惟如上所提到之僅「類似於」緊密下混矩陣之模板矩陣在一些元素314'中不同除外。模板矩陣316與緊密下混矩陣308不同之處在於，在緊密下混矩陣308中，矩陣元素318及320不包括任何增益值，而在對應的矩陣元素318'及320'中，模板矩陣316包括有效值。因此，關於突出顯示之條目318'及320'，模板矩陣316不同於需要編碼之緊密矩陣。為達成更進一步有效率地寫碼緊密下混矩陣，當與圖6比較，兩個矩陣308、316中之對應的矩陣元素314、314'經邏輯組合以按與關於圖6所描述類似之方式獲得可以與以上所描述類似之方式編碼的一維向量。矩陣元素314、314'中之每一者可經受XOR運算，更具體言之，使用緊密模板將逐個邏輯元素XOR運算應用於緊密矩陣，此舉產生轉換成含有以下延行長度之清單的一維向量：

此清單現可(例如)藉由亦使用有限哥倫布-萊斯寫碼來編碼。當與關於圖6描述之實施例相比時，可見此清單可甚至更有效率地編碼。在最好情況下，當緊密矩陣與模板矩陣相同時，整個向量僅由零組成，且僅需要編碼一個延行長度數目。

關於模板矩陣之使用，如參看圖7所描述，應注意，與由揚聲器之清單判定之輸入及輸出組配相反，編碼器及解碼器兩者需要具有一組預定義之該等緊密模板，該組由一組輸入及輸出揚聲器唯一地判定。此意謂著輸入及輸出揚聲器之次序對於判定模板矩陣不相關，相反，該次序可在用以匹配給定緊密矩陣之次序之前經排列。

在下文中，如上所提到，將描述關於原始下混矩陣中提供之混合增益之編碼的實施例，該等混合增益不再存在於緊密下混矩陣中且需要經編碼及傳輸。

圖8描述用於編碼混合增益之一實施例。該實施例根據輸入及輸出揚聲器群組(即，群組S(對稱的L及R)、群組C(中心)及群組A(不對稱))之不同組合使用對應於原始下混矩陣中的一或多個非零條目的子矩陣之性質。圖8描述可根據輸入及輸出揚聲器(即，對稱揚聲器L及R、中心揚聲器C及不對稱揚聲器A)之不同組合自圖4中所展示之下混矩陣導出的可能子矩陣。在圖8中，字母a、b、c及d表示任意增益值。

圖8(a)展示四個可能子矩陣，此係由於其可自圖4之矩陣導出。第一個為界定兩個中心頻道(例如，輸入組配300中之揚聲器C及輸出組配302中之揚聲器C)之映射的子矩陣，且增益值「a」為矩陣元素[1，1](圖4中之左上方元素)中指示之增益值。圖8(a)中之第二子矩陣表示(例如)將兩個對稱輸入頻道(例如，輸入頻道Lc及Rc)映射至輸出頻道組配中之中心揚聲器(諸如，揚聲器C)。增益值「a」及「b」為矩陣元素[1，2]及[1，3]中指示之增益值。圖8(a)中之第三子矩陣指將圖4之輸入組配300中之中心揚聲器C(諸如，揚聲器Cvr)映射至輸出組配302中之兩個對稱頻道(諸如，頻道Ls及Rs)。增益值「a」及「b」為矩陣元素[4，21]及[5，21]中指示之增益值。圖8(a)中之第四子矩陣表示映射兩個對稱頻道之情況，例如，輸入組配300中之頻道L、R經映射至輸出組配302中之頻道L、R。增益值「a」至「d」為矩陣元素[2，4]、[2，5]、[3，4]及[3，5]中指示之增益值。

圖8(b)展示映射不對稱揚聲器時之子矩陣。第一表示為藉由映射兩個不對稱揚聲器獲得之子矩陣(圖4中未給出該子矩陣之實例)。圖8(b)之第二子矩陣指兩個對稱輸入頻道至不對稱輸出頻道之映射，該映射在圖4之實施例中為(例如)兩個對稱輸入頻道LFE及LFE2至輸出頻道LFE之映射。增益值「a」及「b」為矩陣元素[6，11]及[6，12]中指示之增益值。圖8(b)中之第三子矩陣表示輸入不對稱揚聲器匹配對稱輸出揚聲器對的情況。在一實例情況下，不存在不對稱輸入揚聲器。

圖8(c)展示用於將中心揚聲器映射至不對稱揚聲器之兩個子矩陣。第一子矩陣將輸入中心揚聲器映射至不對稱輸出揚聲器(圖4中未給出該子矩陣之實例)，且第二子矩陣將不對稱輸入揚聲器映射至中心輸出揚聲器。

根據此實施例，對於每一輸出揚聲器群組，檢查對於所有條目，對應的行是否滿足對稱性及可分離性之性質，且使用兩個位元將此資訊作為旁側資訊傳輸。

將參看圖8(d)及圖8(e)描述對稱性性質，且意謂包含L及R揚聲器之S群組與至或來自中心揚聲器或不對稱揚聲器之相同增益混合，或S群組相等地混合至另一S群組或自另一S群組混合。混合S群組的剛提到之兩個可能性在圖8(d)中描繪，且兩個子矩陣對應於以上關於圖8(a)描述之第三子矩陣及第四子矩陣。應用剛提到之對稱性性質(即，混合使用相同增益)產生圖8(e)中所展示之第一子矩陣，其中輸入中心揚聲器C經使用相同增益值映射至對稱揚聲器群組S(例如，參見圖4中輸入揚聲器Cvr至輸出揚聲器Ls及Rs之映射)。此在相反方面亦適用，例如，在查看輸入揚聲器Lc、Rc至輸出頻道之中心揚聲器C之映射時；此處可發現相同對稱性性質。對稱性性質進一步導致圖8(e)中所展示之第二子矩陣，根據此，在對稱性揚聲器當中之混合為相等的，其意謂左揚聲器之映射與右揚聲器之映射使用相同增益因數，且左揚聲器至右揚聲器之映射與右揚聲器至左揚聲器之映射亦使用相同增益值來進行。此在圖4中(例如)關於輸入頻道L、R至輸出頻道L、R之映射來描繪，其中增益值「a」=1，且增益值「b」=0。

可分離性性質意謂對稱群組藉由保持自左側向左之所有信號及自右側向右之所有信號來混合至另一對稱群組或自另一對稱群組混合。此適用於圖8(f)中所展示之子矩陣，該子矩陣對應於上文關於圖8(a)所描述之四個子矩陣。應用剛提到之可分離性性質導致圖8(g)中所展示之子矩陣，根據此，左輸入頻道僅映射至左輸出頻道且右輸入頻道僅映射至右輸出頻道，且歸因於零增益因數，不存在「頻道間」映射。

使用在多數已知下混矩陣中遇到之以上提到的兩個性質允許進一步顯著減少需要寫碼之增益的實際數目，且亦直接消除在滿足可分離性性質的情況下對於大量零增益所需要之寫碼。舉例而言，當考慮包括有效值之圖6之緊密矩陣時且當將以上提及之性質應用於原始下混矩陣時，可見，足以(例如)以如圖5中在下部部分中所展示之方式定義用於各別有效值之單一增益值，此係由於歸因於可分離性及對稱性性質，已知與各別有效值相關聯之各別增益值需要在解碼後分佈在原始下混矩陣當中之方式。因此，當關於圖6中所展示之矩陣應用圖8之上述實施例時，足以僅提供需要與經編碼有效值一起編碼且傳輸之19個增益值，以用於允許解碼器重建構原始下混矩陣。

在下文中，將描述用於動態建立增益表之實施例，該表可用於(例如)由音訊內容之生產者定義原始下混矩陣中之原始增益值。根據此實施例，使用指定精度在最小增益值(minGain)與最大增益值(maxGain)之間動態地建立增益表。較佳地，該表經建立使得最頻繁使用之值及較多「捨入」之值比其他值(即，不常用之值或未如此捨入之值)靠近表或清單開頭排列。根據一實施例，使用maxGain、maxGain及精度等級之可能值之清單可如下建立：- 添加3dB之整數倍，自0dB降低至minGain；- 添加3dB之整數倍，自3dB上升至maxGain；- 添加1dB之剩餘整數倍，自0dB降低至minGain；- 添加1dB之剩餘整數倍，自1dB上升至maxGain；在精度等級為1dB時停止；- 添加0.5dB之剩餘整數倍，自0dB降低至minGain；- 添加0.5dB之剩餘整數倍，自0.5dB上升至maxGain；在精度等級為0.5dB時停止；- 添加0.25dB之剩餘整數倍，自0dB降低至minGain；及- 添加0.25dB之剩餘整數倍，自0.25dB上升至maxGain。

舉例而言，當maxGain為2dB且minGain為-6dB且精度為0.5dB時，建立以下清單：0、-3、-6、-1、-2、-4、-5、1、2、-0.5、-1.5、-2.5、-3.5、-4.5、-5.5、0.5、1.5。

關於以上實施例，應注意，本發明並不限於上文指示之值，相反，而是使用3dB之整數倍且自0dB開始，可選擇其他值，且亦可取決於情況選擇用於精度等級之其他值。

大體而言，增益值清單可如下建立：- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第一增益值的整數倍；- 在起始增益值(包括性)與最大增益(包括性)之間以遞增次序添加第一增益值的剩餘整數倍；- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第一精度等級的剩餘整數倍； - 在起始增益值(包括性)與最大增益(包括性)之間以遞減次序添加第一精度等級的剩餘整數倍；- 在精度等級為第一精度等級時停止；- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第二精度等級的剩餘整數倍；- 在起始增益值(包括性)與最大增益(包括性)之間以遞增次序添加第二精度等級的剩餘整數倍；- 在精度等級為第二精度等級時停止；- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第三精度等級的剩餘整數倍；及- 在起始增益值(包括性)與最大增益(包括性)之間以遞增次序添加第三精度等級的剩餘整數倍。

在以上實施例中，當起始增益值為零時，以遞增次序添加剩餘值且滿足相關聯之倍數性條件之部分將一開始添加第一增益值或第一或第二或第三精度等級。然而，在一般情況下，以遞增次序添加剩餘值之部分將一開始添加最小值，從而滿足起始增益值(包括性)與最大增益(包括性)之間的間隔中之相關聯之倍數性條件。對應地，以遞減次序添加剩餘值之部分將一開始添加最大值，從而滿足最小增益(包括性)與起始增益值(包括性)之間的間隔中之相關聯之倍數性條件。

考慮類似於以上實例但具有起始增益值=1dB之實例(第一增益值=3dB、maxGain=2dB、minGain=-6dB且精度等級=0.5dB)產生以下：下：0、-3、-6

上：[空]

下：1、-2、-4、-5

上：2

下：0.5、-0.5、-1.5、-2.5、-3.5、-4.5、-5.5

上：1.5

為編碼增益值，較佳地，在表中查找增益，且輸出其在表內部之位置。將始終找到所要增益，因為所有增益先前經量化至(例如)1dB、0.5dB或0.25dB之指定精度的最近整數倍。根據一較佳實施例，增益值之位置具有與其相關聯之索引，其指示表中之位置，且增益之索引可(例如)使用有限哥倫布-萊斯寫碼方法來編碼。此導致小索引比大索引使用較少數目個位元，且以此方式，頻繁使用之值或典型值(如0dB、-3dB或-6dB)將使用最少數目個位元，且較多「捨入」值(如-4dB)將比並非如此捨入之數(例如，-4.5dB)使用較少數目個位元。因此，藉由使用上述實施例，不僅音訊內容之生產者可產生所要的增益清單，且亦可非常有效率地編碼此等增益，以使得當根據又一實施例應用所有上述方法時，可達成下混矩陣的高度有效率之寫碼。

上述功能性可為音訊編碼器之一部分，此係因為其已在上文關於圖1描述，替代地，其可由單獨編碼器器件提供，該編碼器器件將下混矩陣之經編碼型式提供至待在位元串流中朝向接收器或解碼器傳輸之音訊編碼器。

在接收器側處接收到經編碼緊密下混矩陣後，根據實施例，提供解碼方法，該方法解碼經編碼緊密下混矩陣且將經分群之揚聲器取消分群(分離)成單一揚聲器，從而產生原始下混矩陣。當編碼矩陣包括編碼有效值及增益值時，在解碼步驟期間，此等值經解碼，以使得基於有效值及基於所要的輸入/輸出組配，下混矩陣可經重建構，且各別經解碼增益可與重建構下混矩陣之各別矩陣元素相關聯。此可由單獨解碼器執行，該解碼器產生至可將其用於格式轉換器中之音訊解碼器(例如，上文關於圖2、圖3及圖4描述之音訊解碼器)的完整下混矩陣。

因此，如上所定義之本發明方法亦提供用於將具有具體輸入頻道組配之音訊內容呈現至具有不同輸出頻道組配之接收系統的系統及方法，其中用於下混之額外資訊與來自編碼器側之經編碼位元串流一起傳輸至解碼器側，且根據本發明方法，歸因於下混矩陣的非常有效率之寫碼，故明顯降低耗用。

在下文中，描述實施有效率的靜態下混矩陣寫碼之又一實施例。更具體言之，將描述用於具有可選EQ寫碼之靜態下混矩陣的實施例。亦如較早先所提到，與多頻道音訊有關之一個問題為適應其即時傳輸，同時維持與所有現有可用消費者實體揚聲器設置之相容性。一個解決方案為在呈原始生產格式之音訊內容旁提供下混旁側資訊以產生具有較少獨立頻道之其他格式(若需要)。假設inputCount輸入頻道及outputCount輸出頻道，下混程序由大小為inputCount乘outputCount之下混矩陣指定。此特定程序表示被動下混，意謂無取決於實際音訊內容之適應性信號處理經應用至輸入信號或經下混輸出信號。根據現在描述之實施例，本發明方法描述用於下混矩陣之有效率的編碼之完整方案(包括關於選擇合適表示域之態樣)及亦關於無損寫碼經量化值之量化方案。每一矩陣元素表示調整給定輸入頻道對給定輸出頻道有影響的程度之混合增益。現在描述之實施例旨在藉由允許編碼具有可由生產者根據其需要指定之範圍及精度的任意下混矩陣來達成不受限制之靈活性。又，需要有效率之無損寫碼，以使得典型矩陣使用少量位元，且脫離典型矩陣將僅逐漸降低效率。此意謂矩陣愈類似於典型矩陣，則該矩陣之寫碼將愈有效率。根據實施例，所需之精度可由生產者指定為1dB、0.5dB或0.25dB以用於均勻量化。混合增益之值可指定在最大值+22dB至最小值-47dB(包括性)之間，且亦包括值-∞(線性域中之0)。下混矩陣中使用之有效值範圍在位元串流中指示為最大增益值maxGain及最小增益值minGain，因此不浪費實際上未使用之值的任何位元，同時不限制靈活性。

假設(例如)根據先前技術參考[6]或[7]，提供關於每一揚聲器之幾何資訊(諸如，方位角及仰角及視情況揚聲器習知名稱)之輸入頻道清單以及輸出頻道清單可用，根據實施例，用於編碼下混矩陣之演算法可如下表1中所展示：

根據實施例，用於解碼增益值之演算法可如下表2中所展示：

根據實施例，用於定義讀取範圍函式之演算法可如下表3中所展示：

根據實施例，用於定義均衡器組配之演算法可如下表4中所展示：

根據實施例，下混矩陣之元素可如下表5中所展示：

哥倫布-萊斯寫碼用以使用給定非負整數參數p 0寫碼任何非負整數n 0，如下：首先使用一元寫碼來寫碼數目)，由於h一位元之後為終止零位元；接著使用p位元均勻寫碼數目l=n-h．2^p。

有限哥倫布-萊斯寫碼為提前已知n<N(對於給定整數N 1)時使用的平凡變體。當寫碼最大可能值h(其h(h為))時，有限哥倫布-萊斯寫碼不包括終止零位元。更準確而言，為編碼h=h _max，吾人僅寫入h一位元，而非終止零位元，不需要該終止零位元，因為解碼器可暗中偵測此條件。

以下描述之函式ConvertToCompactConfig(paramConfig,paramCount)用以將由paramCount揚聲器組成之給定paramConfig組配轉換成由compactParamCount揚聲器群組組成之緊密compactParamConfig組配。compactParamConfig[i].pairType欄位可在群組表示一對對稱揚聲器時為SYMMETRIC(S)、在群組表示中心揚聲器時為CENTER(C)或在群組表示在無對稱對之揚聲器時為ASYMMETRIC(A)。

函式FindCompactTemplate(inputConfig,inputCount,outputConfig,outputCount)用以發現匹配由inputConfig及inputCount表示之輸入頻道組配及由outputConfig及outputCount表示之輸出頻道組配的緊密模板矩陣。

藉由在編碼器及解碼器兩者處可用之緊密模板矩陣之預定義清單中搜尋具有與inputConfig相同之輸入揚聲器組及與outputConfig相同之輸出揚聲器組的緊密模板矩陣而發現緊密模板矩陣，與不相關之實際揚聲器次序無關。在傳回經發現緊密模板矩陣之前，函式可需要重排序其列及行以匹配如自給定輸入組配導出之揚聲器群組的次序及如自給定輸出組配導出之揚聲器群組的次序。

若未發現匹配之緊密模板矩陣，則函式應傳回具有正確數目個列(其為輸入揚聲器群組之計算數目)及行(其為輸出揚聲器群組之計算數目)的矩陣，對於所有條目，該矩陣具有值一(1)。

函式SearchForSymmetricSpeaker(paramConfig,paramCount,i)用以在由paramConfig及paramCount表示之頻道組配中搜尋對應於揚聲器paramConfig[i]之對稱揚聲器。該對稱揚聲器paramConfig[j]應位於揚聲器paramConfig[i]之後，因此，j可在i+1至paramConfig-1(包括性)之範圍中。另外，其不應為揚聲器群組之一部分，意謂paramConfig[j].alreadyUsed必須為假(false)。

函式readRange()用以讀取0...alphabetSize-1(包括性)之範圍中的均勻分佈之整數，該整數具有一共alphabetSize個可能值。此可藉由讀取ceil(log2(alphabetSize))位元但不利用未使用之值而簡單地進行。舉例而言，當alphabetSize為3時，函式將僅使用一個位元用於整數0，及兩個位元用於整數1及2。

函式generateGainTable(maxGain,minGain,precisionLevel)用以動態產生增益表gainTable，該增益表gainTable含有具有精度precisionLevel之在minGain與maxGain之間的所有可能增益之清單。選擇值之次序，以使得最頻繁使用之值以及較多「捨入」值將通常更靠近清單之開頭。具有所有可能增益值之清單的增益表經如下產生：- 添加3dB之整數倍，自0dB降低至minGain；- 添加3dB之整數倍，自3dB上升至maxGain；- 添加1dB之剩餘整數倍，自0dB降低至minGain；- 添加1dB之剩餘整數倍，自1dB上升至maxGain；- 在precisionLevel為0(對應於1dB)時停止；- 添加0.5dB之剩餘整數倍，自0dB降低至minGain；- 添加0.5dB之剩餘整數倍，自0.5dB上升至maxGain；- 在precisionLevel為1(對應於0.5dB)時停止；- 添加0.25dB之剩餘整數倍，自0dB降低至minGain；- 添加0.25dB之剩餘整數倍，自0.25dB上升至maxGain。

舉例而言，當maxGain為2dB，及minGain為-6dB，且precisionLevel為0.5dB時，吾人建立以下清單：0、-3、-6、-1、-2、-4、-5、1、2、-0.5、-1.5、-2.5、-3.5、-4.5、-5.5、0.5、1.5。

根據實施例，用於均衡器組配之元素可如下表6 中所展示：

在下文中，將描述根據實施例的解碼過程之態樣，自下混矩陣之解碼開始。

語法元素DownmixMatrix()含有下混矩陣資訊。解碼首先讀取由語法元素EqualizerConfig()表示之均衡器資訊(若經啟用)。接著讀取欄位precisionLevel、maxGain及minGain。使用函式ConvertToCompactConfig()將輸入及輸出組配轉換至緊密組配。接著，讀取指示對於每一輸出揚聲器群組是否滿足可分離性及對稱性性質之旗標。

接著藉由a)每條目原始使用一個位元或b)使用延行長度之有限哥倫布萊斯寫碼，且接著將經解碼位元自flactCompactMatrix複製至compactDownmixMatrix且應用compactTemplate矩陣來讀取有效矩陣 compactDownmixMatrix。

最後，讀取非零增益。對於compactDownmixMatrix之每一非零條目，取決於對應的輸入群組之欄位pairType及對應的輸出群組之欄位pairType，必須重建構大小高達2乘2之子矩陣。使用可分離性及對稱性相關聯之性質，使用函式DecodeGainValue()讀取大量增益值。可藉由使用函式ReadRange()或使用增益在gainTable表中之索引之有限哥倫布-萊斯寫碼來均勻寫碼增益值，該gainTable表含有所有可能增益值。

現在將描述解碼均衡器組配之態樣。語法元素EqualizerConfig()含有待應用於輸入頻道之均衡器資訊。numEqualizers均衡器濾波器之數目首先經解碼且隨後使用eqIndex[i]針對具體輸入頻道選擇。欄位eqPrecisionLevel及eqExtendedRange指示縮放增益及峰值濾波器增益之量化精度及可用範圍。

每一均衡器濾波器為存在於峰值濾波器之大量numSections及一scalingGain中的串聯級聯。每一峰值濾波器完全由其centerFreq、qualityFactor及centerGain定義。

屬於給定均衡器濾波器之峰值濾波器的centerFreq參數必須以非遞減次序給出。參數限於10...24000Hz(包括性)，且其如下計算：centerFreq=centerFreqLd2×10^{centerFreqP10}

峰值濾波器之qualityFactor參數可表示具有0.05之精度的在0.05與1.0(包括性)之間的值及具有0.1之精度的自1.1 至11.3(包括性)之值，且如下計算：

介紹給出對應於給定eqPrecisionLevel之以dB為單位之精度的向量eqPrecisions，及給出對應於給定eqExtendedRange及eqPrecisionLevel之用於增益之以dB為單位的最小值及最大值的eqMinRanges矩陣及eqMaxRanges矩陣。

eqPrecisions[4]={1.0、0.5、0.25、0.1}；eqMinRanges[2][4]={{-8.0、-8.0、-8.0、-6.4}、{-16.0、-16.0、-16.0、-12.8}}；eqMaxRanges[2][4]={{7.0、7.5、7.75、6.3}、{15.0、15.5、15.75、12.7}}。

參數scalingGain使用精度等級min(eqPrecisionLevel+1,3)，該精度等級為下一個最佳精度等級(若尚不為最後一個精度等級)。欄位centerGainIndex及scalingGainIndex至增益參數centerGain及scalingGain之映射計算如下：centerGain=eqMinRanges[eqExtendedRange][eqPrecisionLevel]+eqPrecisions[eqPrecisionLevel]×centerGainIndex

scalingGain=eqMinRanges[eqExtendedRange][min(eqPrecisionLevel+1,3)]+eqPrecisions[min(eqPrecisionLevel+1,3)]×scalingGainIndex

雖然已在一裝置之情況下描述一些態樣，但很明顯，此等態樣亦表示對應的方法之描述，其中區塊或器件對應於方法步驟或方法步驟之特徵。類似地，在方法步驟之情況下描述之態樣亦表示對應的裝置之對應的區塊或項目或特徵的描述。一些或所有方法步驟可由(或使用)硬體裝置(如例如，微處理器、可規劃電腦或電子電路)執行。在一些實施例中，最重要的方法步驟中之一或多者可由該裝置執行。

取決於某些實施要求，本發明之實施例可以硬體或以軟體實施。實施可使用非暫時性儲存媒體(諸如，具有儲存於其上之電子可讀控制信號之數位儲存媒體(例如，軟碟、硬碟、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體))執行，該等信號與可規劃電腦系統合作(或能夠合作)，以使得執行各別方法。因此，數位儲存媒體可為電腦可讀的。

根據本發明之一些實施例包含具有電子可讀控制信號之資料載體，該等信號能夠與可規劃電腦系統合作，以使得執行本文中所描述之方法中之一者。

大體而言，本發明之實施例可作為具有程式碼之電腦程式產品實施，該程式碼可操作用於在電腦程式產品在電腦上執行時執行方法中之一者。程式碼可(例如)儲存於機器可讀載體上。

其他實施例包含用於執行本文中所描述之方法中之一者的儲存於機器可讀載體上之電腦程式。

換言之，因此，本發明之一實施例為具有程式碼之電腦程式，該程式碼用於當電腦程式在電腦上執行時執行本文中所描述之方法中的一者。

因此，本發明之又一實施例為資料載體(或數位儲存媒體，或電腦可讀媒體)，其包含記錄於其上用於執行本文中所描述之方法中之一者的電腦程式。資料載體、數位儲存媒體或記錄之媒體通常為有形的及/或非暫時性的。

因此，本發明之又一實施例為表示用於執行本文中所描述之方法中之一者的電腦程式之資料串流或一系列信號。資料串流或一系列信號可(例如)經組配以經由資料通訊連接(例如，經由網際網路)傳送。

又一實施例包含處理構件(例如，電腦或可規劃邏輯器件)，其經組配或經規劃以執行本文中所描述之方法中的一者。

又一實施例包含電腦，該電腦具有安裝於其上之用於執行本文中所描述之方法中的一者之電腦程式。

根據本發明之又一實施例包含裝置或系統，該裝置或系統經組配以將用於執行本文中所描述之方法中之一者的電腦程式傳送(例如，電子地或光學地)至接收器。接收器可(例如)為電腦、行動器件、記憶體器件或類似者。裝置或系統可(例如)包含用於將電腦程式傳送至接收器的檔案伺服器。

在一些實施例中，可規劃邏輯器件(例如，場可規劃閘陣列)可用以執行本文中所描述之方法的一些或所有功能性。在一些實施例中，場可程式閘陣列可與微處理器合作以便執行本文中所描述之方法中的一者。大體而言，方法較佳地由任一硬體裝置執行。

以上描述之實施例僅為說明本發明之原理。應理解，本文中所描述之配置及細節的修改及變化對熟習此項技術者而言將為顯而易見的，因此，意在僅由即將到來的專利申請專利範圍之範疇限制，而不受藉由本文中之實施例之描述及解釋提出的具體細節限制。

文獻

[1] Information technology - Coding of audio-visual objects - Part 3: Audio, AMENDMENT 4: New levels for AAC profiles, ISO/IEC 14496-3:2009/DAM 4, 2013.

[2] ITU-R BS.775-3, “Multichannel stereophonic sound system with and without accompanying picture,” Rec., International Telecommunications Union, Geneva, Switzerland, 2012.

[3] K. Hamasaki, T. Nishiguchi, R. Okumura, Y. Nakayama and A. Ando, “A 22.2 Multichannel Sound System for Ultrahigh-definition TV (UHDTV),” SMPTE Motion Imaging J., pp. 40-49, 2008.

[4] ITU-R Report BS.2159-4, “Multichannel sound technology in home and broadcasting applications”, 2012.

[5] Enhanced audio support and other improvements, ISO/IEC 14496-12:2012 PDAM 3, 2013.

[6] International Standard ISO/IEC 23003-3:2012, Information technology - MPEG audio technologies - Part 3: Unified Speech and Audio Coding, 2012.

[7] International Standard ISO/IEC 23001-8:2013, Information technology - MPEG systems technologies - Part 8: Coding-independent code points, 2013.