TW201830378A

TW201830378A - 用以降混至少兩聲道之降混器與方法及多聲道編碼器與多聲道解碼器

Info

Publication number: TW201830378A
Application number: TW106138444A
Authority: TW
Inventors: 克里斯汀包瑞斯; 伯納德艾德勒; 古拉米福契斯; 珍恩布特; 薩斯洽迪斯曲; 佛羅瑞吉西多; 史蒂芬拜爾; 馬庫斯穆爾特斯
Original assignee: 弗勞恩霍夫爾協會; 紐倫堡大學
Priority date: 2016-11-08
Filing date: 2017-11-07
Publication date: 2018-08-16
Also published as: JP2021060610A; CA3045847A1; PL3539127T3; JP6817433B2; AU2017357452B2; CN110419079B; ZA201903536B; MX2019005214A; JP2019537057A; US11183196B2; US20220068284A1; WO2018086946A1; US20190272833A1; JP7210530B2; US20200243096A1; TWI665660B; CA3045847C; US10665246B2; AU2017357452A1; CN110419079A

Abstract

一種用於降混具有兩個或大於兩個聲道之一多聲道信號之至少兩個聲道的降混器包含：一處理器，其用於自該至少兩個聲道計算一部分降混信號；一互補信號計算器，其用於自該多聲道信號計算一互補信號，該互補信號不同於該部分降混信號；及一加法器，其用於將該部分降混信號與該互補信號相加以獲得該多聲道信號的一降混信號。

Description

用以降混至少兩聲道之降混器與方法及多聲道編碼器與多聲道解碼器

發明領域本發明係關於音訊處理，且特定而言係關於處理包含兩個或大於兩個音訊聲道之多聲道音訊信號。

發明背景減少聲道之數目對於以低位元率達成多聲道寫碼為至關重要的。舉例而言，參數立體聲寫碼方案係基於來自左輸入聲道及右輸入聲道之適當單聲道降混。因此獲得之單聲道信號連同以參數形式描述聽覺場景之旁側資訊藉由單聲道編碼解碼器編碼並傳輸。旁側資訊通常由每頻率子頻帶若干個空間參數組成。其可包括(例如)： · 聲道間位準差(Inter-channel Level Difference；ILD)，其量測聲道之間的位準差(或平衡)。 · 聲道間時間差(Inter-channel Time Difference；ITD)或聲道間相位差(Inter-channel Phase Difference；IPD)，其分別描述聲道之間的時間差或相位差。

然而，降混處理歸因於聲道間相位未對準而易於產生信號抵消及染色，其產生非所要品質降級。作為一實例，若聲道為相干的且幾乎為異相的，則降混信號很可能展示可察覺之頻譜偏置，諸如梳狀濾波器之特性。

降混操作可如藉由下式所表達簡單地藉由左聲道及右聲道之總和來在時域中執行，其中及為左聲道及右聲道，n 為時間索引，且及為判定混合之權重。若權重隨時間恆定，則吾人說到被動降混。其具有不管輸入信號之缺點，且所獲得之降混信號的品質高度取決於輸入信號特性。隨時間調適權重可減小此問題達某程度。

然而，為了解決主要問題，主動降混通常使用例如短期傅里葉變換(Short-Term Fourier Transform；STFT)在頻域中執行。藉此可使得權重取決於頻率索引k及時間索引n，且權重可更好地適配於信號特性。降混信號接著表達為：其中M[k,n]、L[k,n]及R[k,n]分別為降混信號、左聲道及右聲道在頻率索引k及時間索引n下之STFT分量。權重及可在時間及頻率上進行適應性地調整。其旨在藉由使由梳狀濾波效應引起之頻譜偏置最小化而保持兩個輸入聲道的平均能量或振幅。

用於主動降混之最直接方法為使降混信號之能量相等以針對每一頻率區間或子頻帶產生兩個輸入聲道[1]的平均能量。降混信號如圖7b中所展示可接著用公式表示為：其中

此直接迅速解決方案具有若干缺點。首先，當兩個聲道具有具相等振幅之相位倒置時間頻率分量(ILD=0db及IPD=pi)時，降混信號未經界定。此奇異性在此狀況下由分母變成零來產生。簡單主動降混之輸出在此狀況下不可預測。此行為針對相位依據IPD繪製之各種聲道間位準差展示於圖7a中。

對於ILD=0dB，兩個聲道之總和在IPD=pi下為不連續的，從而導致pi弧度之步階。在其他條件下，相位以模2pi規律且連續地演進。

問題之第二本質來自用於達成此能量等化之正規化增益的重要變化。實際上，正規化增益可在訊框間且在鄰接頻率子頻帶間大幅度地波動。其導致降混信號之不自然染色且導致阻斷效應。用於STFT之合成窗口之使用及重迭相加方法導致經處理音訊訊框間的光滑化轉變。然而，正規化增益在依序訊框之間的大改變可仍導致可聽轉變人為假像。此外，此顯著等化歸因於來自區塊變換之分析窗口之頻率回應旁側裂片的混疊而亦導致可聽人為假像。

作為替代例，主動降混可藉由在計算和信號[2-4]之前執行兩個聲道之相位對準來達成。對新和信號完成能量等化接著受到限制，此係由於兩個聲道在對其進行總和之前已同相。在[2]中，左聲道之相位用作參考從而對準同相之兩個聲道。若左聲道之相位並不能良好調節(例如，零或低位準雜訊聲道)，則降混信號直接受到影響。在[3]中，此重要問題藉由在旋轉之前採用和信號之相位作為參考來解決。再者，奇異性問題在ILD=0dB及IPD=IPD=pi下並未處置。出於此原因，[4]藉由使用寬頻帶相位差參數來修正方法以便在此狀況下改良穩定性。但是，此等方法中之每一者皆不考慮與不穩定性相關之問題的第二本質。聲道之相位旋轉亦可導致輸入聲道之不自然混頻，且可產生嚴重不穩定性及區塊效應，尤其在大改變隨時間及頻率發生於處理中時。

最後，存在類似於[5]及[6]之演進程度更高之技術，該等技術係基於在降混期間之信號抵消僅關於時間頻率分量發生的觀測，該等時間頻率分量在兩個聲道之間為相干的。在[5]中，相干分量在對輸入聲道之不相干部份進行總和時被濾除。在[6]中，相位對準在對聲道進行總和之前僅針對相干組份來計算。此外，相位對準隨時間及頻率經規則化從而避免穩定性及不連續性問題。兩項技術計算上為苛刻的，此係由於在[5]中，濾波器係數需要在每一訊框處被識別，且在[6]中，必須計算聲道之間的共變數矩陣。

發明概要本發明之目標為提供一種用於降混或多聲道處理之改良概念。

此目標藉由以下各者來達成：技術方案1之降混器、技術方案13之降混方法、技術方案14之多聲道編碼器、技術方案15之多聲道編碼之方法、技術方案16之音訊處理系統、技術方案17之處理音訊信號的方法或技術方案18之電腦程式。

本發明係基於如下發現：一種用於降混具有兩個或大於兩個聲道之多聲道信號之至少兩個聲道的降混器不僅執行至少兩個聲道之一加法從而自至少兩個聲道計算一降混信號，而且該降混器另外包含用於自多聲道信號計算互補信號的互補信號計算器，其中互補信號不同於部分降混信號。此外，降混器包含一加法器，其用於將部分降混信號與互補信號相加以獲得多聲道信號之降混信號。此程序為有利的，此係由於不同於部分降混信號之互補信號填充降混信號內之任何時域或頻譜域孔洞，該等孔洞可歸因於至少兩個聲道之某些相位群集來發生。特定而言，當兩個聲道同相時，接著通常無問題應在執行兩個聲道之直接相加在一起時發生。然而，當兩個聲道異相時，則此等兩個聲道之相加在一起產生具有甚至逼近零能量之極低能量的信號。然而，歸因於互補信號現被相加至部分降混信號之事實，最終所獲得之降混信號仍具有顯著能量，或至少並不展示此類嚴重能量波動。

本發明係有利的，此係由於其引入旨在使在習知降混中觀測到之典型信號抵消及不穩定性最小化的用於降混兩個或大於兩個聲道之程序。

此外，實施例為有利的，此係由於其表示具有使來自多聲道降混之常見問題最小化之潛能的低複雜程序。

較佳實施例依賴於與互補信號混合之和信號之受控能量或振幅等化，該互補信號亦自輸入信號導出但不同於部分降混信號。和信號之能量等化經控制從而避免奇異點處之問題，而且使歸因於增益之大型波動之顯著信號減損最小化。較佳地，互補信號彼處補償剩餘能量損失或補償此剩餘能量損失的至少一部分。

在一實施例中，處理器經組配以計算部分降混信號，使得至少兩個聲道與部分降混聲道之間的預定義能量相關或振幅相關關係在至少兩個聲道同相時被滿足，且使得能量損失在至少兩個聲道異相時產生於部分降混信號中。在此實施例中，互補信號計算器經組配以計算互補信號，使得部分降混信號之能量損失藉由將部分降混信號與互補信號相加在一起而經部分或完全補償。

在一實施例中，該互補信號計算器經組配用於計算互補信號，使得互補信號關於部分降混信號具有0.7之相干性指標，其中相干性指標0.0展示一完全不相干性，且相干性指標1展示完全相干性。因此，確保一方面部分降混信號且另一方面互補信號充分不同於彼此。

較佳地，降混產生兩個聲道之和信號，諸如L+R，如同在習知被動方法或主動降混方法中所進行。隨後被稱作W ₁ 的應用至此和信號之增益旨在等化總和聲道之能量從而匹配輸入聲道的平均能量或平均振幅。然而，與習知主動降混方法相比，W ₁ 值限於避免不穩定性問題且避免能量關係基於減損和信號而復原。

第二混合藉由互補信號進行。互補信號經選擇，使得其能量在L 及R 異相時並不消失。加權因子W ₂ 歸因於引入至W ₁ 值中之限制而補償能量等化。

較佳實施例之詳細說明圖1說明用於降混具有兩個或大於兩個聲道之多聲道信號12之至少兩個聲道的降混器。特定言之，多聲道信號可僅為具有左聲道L及右聲道R之立體聲信號，或多聲道信號可具有三個或甚至大於三個聲道。聲道亦可包括音訊對象或由音訊對象組成。降混器包含處理器10，其用於自來自多聲道信號12之至少兩個聲道計算部分降混信號14。此外，降混器包含用於自多聲道信號12計算互補信號的互補信號計算器20，其中藉由區塊20輸出之互補信號22不同於藉由區塊10輸出的部分降混信號14。另外，降混器包含加法器30，其用於將部分降混信號與互補信號相加以獲得多聲道信號12之降混信號40。通常，降混信號40具有僅單一聲道或替代地具有大於一個聲道。然而，通常，降混信號具有少於包括於多聲道信號12中之聲道的聲道。因此，當多聲道信號具有例如五個聲道時，降混信號可具有四個聲道、三個聲道、兩個聲道或單一聲道。具有一個或兩個聲道之降混信號優於具有大於兩個聲道的降混信號。在兩聲道信號作為多聲道信號12之狀況下，降混信號40僅具有單一聲道。

在一實施例中，處理器10經組配以計算部分降混信號14，使得至少兩個聲道與部分降混信號之間的預定義能量相關或振幅相關關係在至少兩個聲道同相時被滿足，且使得關於至少兩個聲道之能量損失在至少兩個聲道異相時產生於部分降混信號中。針對預定義關係之實施例及實例為，降混信號之振幅與輸入信號之振幅係處於某關係，或例如降混信號之逐子頻帶能量與輸入信號之能量係處於預定義關係。一個特定關注關係為，降混信號在全頻寬上或子頻帶中之能量等於兩個降混信號或大於兩個降混信號的平均能量。因此，關係可係關於能量或關於振幅。此外，圖1之互補信號計算器20經組配以計算互補信號22，使得如圖1中說明於14處之部分降混信號的能量損失藉由在圖1之加法器30中將部分降混信號14與互補信號22相加以獲得降混信號來部分或完全補償。

通常，實施例係基於與亦自輸入聲道導出之互補信號混合的和信號之受控能量或振幅等化。

實施例係基於與亦自輸入聲道導出之互補信號混合的和信號之受控能量或振幅等化。和信號之能量等化經控制從而避免奇異點處之問題，而且顯著地使歸因於增益之大型波動之信號減損最小化。

互補信號彼處補償剩餘能量損失或能量損失的至少一部分。新降混之通式可表達為其中互補信號S [k ,n ]必須理想地儘可能多地正交於和信號，但可實際上經選擇為或或。

在所有狀況下，降混如其在習知被動及主動降混方法中進行一般首先產生和聲道L+R。增益旨在等化和聲道之能量從而匹配輸入聲道之平均能量或平均振幅。然而，不同於習知主動降混方法，限於米便不穩定性問題且避免能量關係基於減損和信號被恢復。

第二混合藉由互補信號進行。互補信號經選擇，使得其能量在及異相時並不消失。補償歸因於中引入之限制的能量等化。

如所說明，互補信號計算器20經組配以計算互補信號，使得互補信號不同於部分降混信號。數量上，較佳的是互補信號關於部分降混信號之相干性指標低於0.7。按此尺度，相干性指標0.0展示完全不相干性，且相干性指標1.0展示完全相干性。因此，低於0.7之相干性指標已證明為有用的，使得部分降混信號及互補信號充分不同於彼此。然而，低於0.5且甚至低於0.3之相干性指標甚至更佳。

圖2a說明藉由處理器執行之程序。特定而言，如圖2a之項目50中所說明，處理器藉由關於至少兩個聲道之能量損失計算部分降混信號，該至少兩個聲道表示至處理器中之輸入。此外，互補信號計算器52計算圖1之互補信號22以部分或完全地補償能量損失。

在說明於圖2b中之實施例中，互補信號計算器包含互補信號選擇器或互補信號判定器23、加權因子計算器24及加權器25以最終獲得互補信號22。特定言之，互補信號選擇器或互補信號判定器23經組配以使用由諸如L 之第一聲道、諸如R 之第二聲道、如在圖2b中指示為L -R 的第一聲道與第二聲道之間的差組成之群組中的一個信號來計算互補信號。替代地，差亦可為R -L 。由互補信號選擇器23使用之其他信號可為多聲道信號之其他聲道，亦即，並未由處理器選擇從而用於計算部分降混信號的聲道。舉例而言，此聲道可為中心聲道，或包含對象之周圍圍聲道或任何其他額外聲道。在其他實施例中，由互補信號選擇器使用之信號為去相關之第一聲道、去相關之第二聲道、去相關之其他聲道或甚至如由處理器14計算之去相關部分降混信號。然而，在較佳實施例中，諸如L 之第一聲道或諸如R 之第二聲道或甚至更佳地左聲道與右聲道之間的差或右聲道與左聲道之間的差較佳用於計算互補信號。

互補信號選擇器23之輸出輸入至加權因子計算器24。加權因子計算器另外通常接收藉由處理器10組合之兩個或大於兩個信號，且加權因子計算器如26所說明計算加權W ₂ 。彼等加權連同由互補信號選擇器23使用並判定之信號被輸入至加權器25中，且加權器接著使用來自區塊26之加權因子來對自區塊23輸出之對應信號進行加權以最終獲得互補信號22。

加權因子可僅為時間相依的，使得時間上對於某區塊或訊框，計算單一加權因子W ₂ 。然而，在其他實施例中，較佳的是使用時間及頻率相依加權因子W ₂ ，使得對於互補信號之某區塊或訊框，不僅針對此時間區塊之單一加權因子可用，而且針對由區塊23產生或選擇之信號之一組不同頻率值或頻譜範圍的一組加權因子W ₂ 可用。

不僅用於互補信號計算器20而且用於處理器10之針對時間及頻率相依加權因子的對應實施例說明於圖3中。

特定言之，圖3在一較佳實施例中說明降混器，該降混器包含用於將時域輸入信號轉換成頻域輸入聲道之時間頻譜轉換器60，其中每一頻域輸入聲道具有一頻譜序列。每一頻譜具有獨立時間索引n ，且在每一頻譜內，某頻率索引k 指與頻率索引唯一地相關聯的頻率分量。因此，在一實例中，當區塊具有512個頻譜值時，則頻率k 自0行進至511以便唯一地識別512個不同頻率索引中的每一者。

時間頻譜轉換器60經組配用於應用FFT且較佳地應用重疊FFT，使得藉由區塊60獲得的頻譜序列係關於輸入聲道之重疊區塊。然而，非重疊頻譜轉換演算法及諸如DCT或此類之除FFT外的其他轉換亦可予以使用。

特定言之，圖1之處理器10包含第一加權因子計算器15，其用於計算針對個別頻譜索引k 之權重W ₁ 或針對子頻帶b 之加權因子W ₁ ，其中子頻帶相對於頻率寬於頻譜值，且通常包含兩個或大於兩個頻譜值。

圖1之互補信號計算器20包含計算加權因子W ₂ 之第二加權因子計算器。因此，項目24可類似地構建為圖2b之項目24。

此外，計算部分降混信號的圖1之處理器10包含降混加權器16，其接收加權因子W ₁ 作為輸入且輸出轉遞至加法器30之部分降混信號14。此外，說明於圖3中之實施例另外包含已關於圖2b描述之加權器25，該加權器接收第二加權因子W ₂ 作為輸入。

加法器30輸出降混信號40。降混40可用於若干不同事件中。使用降混信號40之一種方式為將該降混信號輸入至說明於圖3中之頻域降混編碼器64中，該頻域降混編碼器輸出經編碼降混信號。替代性程序為將降混信號40之頻域表示插入至頻譜時間轉換器62中，以便在區塊62之輸出處獲得時域降混信號。其他實施例為將降混信號40饋入至其他降混處理器66中，該其他降混處理器產生某種類之處理降混聲道，諸如經傳輸之降混聲道、所儲存之降混聲道，或已執行某種類之等化、增益變化等的降混聲道。

在實施例中，處理器10經組配用於計算如藉由圖3中之區塊15所說明的時間或頻率相依加權因子W ₁ 從而根據至少兩個聲道與至少兩個聲道之和信號之間的預定義能量或振幅關係而對至少兩個聲道的總和進行加權。此外，在亦說明於圖4之項目70中的此程序之後，處理器經組配以針對某頻率索引k 及某時間索引n 或針對某頻譜子頻帶b 及某時間索引n 比較所計算之加權因子W ₁ 與如在圖4之區塊72處所指示的預定義臨限值。此比較較佳地針對每一頻譜索引k 或針對每一子頻帶索引b 或針對每一時間索引n 且較佳地針對一個頻譜索引k 或b 且針對每一時間索引n 執行。當所計算之加權因子與預定義臨限值係處於第一關係，諸如在73處所說明在臨限值之下時，則所計算之加權因子W ₁ 如圖4中之74處所指示來使用。然而，當所計算之加權因子與預定義臨限值處於不同於與預定義臨限值之第一關係的的第二關係，諸如如75處所指示高於臨限值時，使用預定義臨限值而非所計算之加權因子從而在例如圖3之區塊16中計算部分降混信號。此係對W ₁ 之「硬」限制。在其他實施例中，執行一種「軟限制」。在此實施例中，經修改之加權因子使用經修改函數來導出，其中修改函數使得經修改加權因子更接近於預定義臨限值，接著所計算之加權因子。

圖8a至圖8d中之實施例使用硬限制，而圖9a至圖9f中之實施例及圖10a至圖10e中之實施例使用軟限制，亦即，修改函數。

在其他實施例中，圖4中之程序關於區塊70且區塊76執行，但並不執行如關於區塊72所論述之與臨限值的比較。在區塊70中之計算之後，經修改之加權因子使用區塊76之以上描述內容的修改函數導出，其中修改函數使得經修改加權因子引起部分降混信號之能量小於預定義能量關係之能量。較佳地，在無特定比較情況下應用之修改函數使得其對於W ₁ 之高值將經操控或經修改加權因子限於某限值，或僅具有極小增大，諸如對數或ln函數；或使得僅不再具有極緩慢增大(儘管不限於某值)，使得如之前所論述之穩定性問題實質上被避免或至少被減小。

在說明於圖8a至圖8d中之較佳實施例中，降混藉由下式給出：其中

在以上等式中，A為較佳地等於2之平方根的實值常數，但A可同樣具有在0.5或5之間的不同值。取決於應用，甚至亦可使用不同於上述值的值。

假定，及始終為正，且限於，或例如為0.5。

混合增益可如先前方程式中所描述針對STFT之每一索引k 逐頻率組地計算，或可針對收集STFT之一組索引b 之每一非重疊子頻帶經逐頻帶地計算。增益基於以下等式來計算：

由於等化期間之能量保持並非硬約束條件，因此所得降混信號之能量相較於輸入聲道之平均能量發生變化。能量關係取決於如圖8a中所說明之ILD及IPD。

與保持輸出能量與輸入聲道之平均能量之間的恆定關係之簡單主動降混方法形成對比，新降混信號並不展示如圖8d中所說明之任何奇異性。實際上，在圖7a中，量值Pi之跳躍(180°)可在IP=Pi及ILD=0dB處觀測到，而在圖8d中，跳躍係對應於展開相疇中之連續改變的2 Pi(360°)。

收聽測試結果確認，新降混方法引起較大範圍之立體聲信號相較於習知主動降混顯著較低之不穩定性及減損。

在此上下文中，圖8a說明沿著x 軸以dB為單位的原始左聲道與原始右聲道之間的聲道間位準差。此外，降混能量沿著y 軸以在0與1.4之間的相對尺度指示，且參數為聲道間相位差IPD。特定言之，看起來所得降混信號之能量特別地取決於聲道之間的相位而發生變化，且針對Pi (180°)之相位亦即針對異相情形，能量變化至少對於正聲道間位準差呈良好形狀。圖8b說明用於計算降混信號M 之等式，且亦變得清楚的是，選擇左聲道作為互補信號。圖8c說明不僅針對個別頻譜索引而且針對子頻帶之加權因子W ₁ 及W ₂ ，其中來自STFT之一組索引亦即至少兩個頻譜值k 加在一起以獲得某子頻帶。

相較於說明於圖7a及圖7b中之先前技術，任一奇異性在圖8d與圖7a比較時不再被包括。

圖9a至圖9f說明另一實施例，其中降混使用左信號L 與右信號R 之間的差作為互補信號之基礎來計算。特定而言，在此實施例中，其中增益及之集合經計算，使得降混信號與輸入聲道之間的能量關係在每一條件下保持。

首先，計算增益用於等化化能量直至給定限值，其中A再次為等於之實值數值：

結果，和信號之增益如圖9a中所展示限於範圍[0, 1]。在針對x之等式中，替代性實施係使用分母而非平方根。

若兩個聲道具有大於pi/2之IPD，則可不再補償能量損失，且其將接著來自增益。經計算為以下二次等式之根中的一者：

等式之根藉由下式給出：, 其中

可接著選擇兩個根中之一者。對於兩個根，能量關係如圖9e中所展示針對所有條件經保持。

等式之根藉由下式給出：, 其中

可接著選擇兩個根中之一者。對於兩個根，能量關係如圖9f中所展示針對所有條件經保持。

較佳地，具有最小絕對值之根經適應性地選擇用於。此適應性選擇對於ILD=0dB將引起自一個根至另一根之切換，其再次可產生不連續性。

與先前技術相比較，此方法在不引入任何奇異性情況下解決降混及頻譜偏置的梳狀濾波效應。其在所有條件下維持能量關係，但相較於較佳實施例引入更多不穩定性。

因此，圖9a說明此實施例之部分降混信號之計算中藉由和信號之因子W ₁ 獲得之增益限制的比較。特定而言，直線為如之前關於圖4之區塊76論述的在值之正規化之前或修改之前的情形。且，其他線依據加權因子W ₁ 針對修改函數逼近為1之值。變得清楚的是，修改函數之影響發生於高於0.5之值處，但偏差僅對於約0.8且大於0.8之值W₁ 變得實際上可見。

圖9b說明此實施例之藉由圖1之方塊圖實施的等式。

此外，圖9c說明如何計算值W ₁ ，且因此，圖9a說明圖9c之功能情形。最終，圖9d說明W ₂ 之計算，亦即，由圖1之互補信號產生其20使用的加權因子之計算。

圖9e說明，降混能量對於第一聲道與第二聲道之間的所有相位差且針對第一聲道與第二聲道之間的所有位準差ALD始終相同且等於1。

然而，圖9f說明歸因於如下事實藉由針對圖9d之E_M 之等式的規則之計算引發之不連續性：存在可變成0的說明於圖9d之針對p 之等式中且針對q 之等式中的分母。

圖10a至圖10e說明可被視為兩個較早描述之替代例之間的折衷之其他實施例。

降混藉由下式給出；其中

在針對x之等式中，替代性實施係使用分母而非平方根。

在此狀況下，待解析之二次等式為：

此次，增益並非被準確地視為二次等式之根中的一者而是作為下式：其中

因此，能量關係如圖10a中所展示並非始終被保持。另一方面，增益在圖10e中並不展示任何不連續性，且相較於第二實施例不穩定性問題被減小。

因此，圖10a說明此實施例之藉由圖10a至圖10e說明的能量關係，其中再者降混能量說明於y 軸處，且聲道間位準差說明於x 軸處。圖10b說明藉由圖1應用之等式，且程序經執行用於如關於區塊76中所說明而計算第一加權因子W ₁ 。此外，圖10c說明關於圖9a至圖9f之實施例的W ₂ 的替代性計算。特定而言，p 經受絕對值函數，其在與圖10c比較時顯現為圖9d中之類似等式。

圖10d接著再次展示p 及q 之計算，且圖10d底部粗略地對應於圖10d中之等式。

圖10e說明根據說明於圖10a至圖10d中之實施例的此新降混之能量關係，且看起來增益W ₂ 僅逼近為0.5之最大值。

儘管前述描述內容及某些圖提供詳述等式，但應注意的是，優勢已被獲得，即使在等式並未準確地得以計算時而是在等式經計算但結果經修改時。特定而言，圖3之第一加權因子計算器15及第二加權因子計算器24之功能性經執行，使得第一加權因子或第二加權因子具有在基於以上給定之等式判定的值之±20%之一範圍內的值。在較佳實施例中，加權因子經判定為具有在藉由以上等式判定之值之±10%之範圍內的值。在甚至更佳實施例中，偏差為僅±1%，且在最佳實施例中，等式及結果被準確地獲得。但如所陳述，當應用自上述等式之±20%的偏差時，本發明之優勢仍被獲得。

圖5說明多聲道編碼器之實施例，其中可使用如之前關於圖1至圖4、圖8a至圖10e論述的本發明之降混器。特定言之，多聲道編碼器包含參數計算器82，其用於自具有兩個或大於兩個聲道之多聲道信號12之至少兩個聲道計算多聲道參數84。此外，多聲道編碼器包含降混器80，其可如之前所論述實施且提供一或多個降混聲道40。多聲道參數84及一或多個降混聲道40兩者被輸入至輸出介面86中從而輸出經編碼多聲道信號，該經編碼多聲道信號包含一或多個降混聲道及/或多聲道參數。替代地，輸出介面可經組配用於儲存或傳輸經編碼多聲道信號至例如說明於圖6中之多聲道解碼器。說明於圖6中之多聲道解碼器接收經編碼多聲道信號88作為輸入。此信號經輸入至輸入介面90中，且輸入介面90一方面輸出多聲道參數92且另一方面輸出一或多個降混聲道94。兩個資料項目(亦即，多聲道參數92及降混聲道94)被輸入至多聲道重建構器96中，該多聲道重建構器在其輸出處重建構原始輸入聲道之近似項且通常輸出如由參考數字98指示的輸出聲道，該等輸出聲道可包含輸出音訊對象或類似於輸出音訊對象的任何事項或由輸出音訊對象或類似於輸出音訊對象的任何事項組成。特定言之，圖5中之多聲道編碼器及圖6中之多聲道解碼器一起表示音訊處理系統，其中多聲道編碼器如關於圖5所論述操作，且其中多聲道解碼器(例如)如圖6中所說明而實施且通常經組配用於解碼經編碼多聲道信號以獲得在圖6中以98說明的經重建構音訊信號。因此，關於圖5及圖6說明之程序另外表示一種處理音訊信號之方法，該方法包含多聲道編碼方法及對應多聲道解碼方法。

本發明之經編碼音訊信號可儲存於數位儲存媒體或非暫時性儲存媒體上，或可在傳輸媒體(諸如無線傳輸媒體或有線傳輸媒體，諸如網際網路)上傳輸。

儘管已在設備之上下文中描述一些態樣，但清楚的是，此等態樣亦表示對應方法之描述，其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地，方法步驟之上下文中所描述之態樣亦表示對應區塊或項目或對應設備之特徵的描述。

取決於某些實施要求，本發明之實施例可以硬體或軟體實施。可使用上面儲存有電子可讀控制信號之數位儲存媒體來執行該實施，該媒體係例如軟性磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體，該等電子可讀控制信號與可規劃電腦系統協作(或能夠協作)以使得各別方法被執行。

根據本發明之一些實施例包含具有電子可讀控制信號之資料載體，其能夠與可程式化電腦系統協作，以使得本文中所描述方法中之一者被執行。

一般而言，本發明之實施例可實施為具有程式碼之電腦程式產品，當電腦程式產品在電腦上運行時，程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。

其他實施例包含用於執行本文中描述的方法中之一者之電腦程式，其儲存於機器可讀載體或非暫時性儲存媒體上。

換言之，因此，發明方法之實施例為具有程式碼之電腦程式，該程式碼在該電腦程式運行於電腦上時用於執行本文中所描述之方法中的一者。

因此，本發明方法之另一實施例為包含記錄於其上的電腦程式之資料載體(或數位儲存媒體，或電腦可讀媒體)，該電腦程式用於執行本文中所描述之方法中的一者。

因此，本發明方法之另一實施例為表示用於執行本文中所描述之方法中的一者之電腦程式之資料串流或信號序列。資料串流或信號序列可(例如)經組配以經由資料通信連接(例如，經由網際網路)而傳送。

另一實施例包含經組配以或適於執行本文中所描述之方法中之一者的處理構件(例如，電腦或可規劃邏輯裝置)。

另一實施例包含電腦，該電腦具有安裝於其上之用於執行本文中所描述之方法中的一者之電腦程式。

在一些實施例中，可規劃邏輯裝置(例如，場可規劃閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中，場可規劃閘陣列可與微處理器協作，以便執行本文中所描述之方法中之一者。一般而言，該等方法較佳地由任一硬體設備執行。

上述實施例僅說明本發明之原理。應理解，本文中所描述之配置及細節的修改及變化對於熟習此項技術者將顯而易見。因此，其僅意欲由接下來之申請專利範圍之範疇限制，而非由藉助於本文中之實施例之描述及解釋所呈現的特定細節限制。參考文獻

[1] US 7,343,281 B2, “PROCESSING OF MULTI-CHANNEL SIGNALS”, Koninklijke Philips Electronics N.V., Eindhoven (NL) [2] Samsudin, E. Kurniawati, Ng Boon Poh, F. Sattar, and S. George, “A Stereo to Mono Downmixing Scheme for MPEG-4 Parametric Stereo Encoder,” in IEEE International Conference on Acoustics, Speech and Signal Processing, vol. 5, 2006, pp. 529-532. [3] T. M. N. Hoang, S. Ragot, B. Kövesi, and P. Scalart, “Parametric Stereo Extension of ITU-T G. 722 Based on a New Downmixing Scheme,” IEEE International Workshop on Multimedia Signal Processing (MMSP) (2010). [4] W. Wu, L. Miao, Y. Lang, and D. Virette, “Parametric Stereo Coding Scheme with a New Downmix Method and Whole Band Inter Channel Time/Phase Differences,” in IEEE International Conference on Acoustics, Speech and Signal Processing, 2013, pp. 556-560. [5] Alexander Adami, Emanuël A.P. Habets, Jürgen Herre, “DOWN-MIXING USING COHERENCE SUPPRESSION”, 2014 IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP) [6] Vilkamo, Juha; Kuntz, Achim; Füg, Simone, “Reduction of Spectral Artifacts in Multichannel Downmixing with Adaptive Phase Alignment”, AES August 22, 2014

10‧‧‧處理器/區塊

12‧‧‧多聲道信號

14‧‧‧部分降混信號

15‧‧‧第一加權因子計算器/區塊

16‧‧‧降混加權器/區塊

20‧‧‧互補信號計算器/區塊/互補信號產生器

22‧‧‧互補信號

23‧‧‧互補信號選擇器或互補信號判定器/區塊

24‧‧‧第二加權因子計算器/項目

25‧‧‧加權器

26、72、76‧‧‧區塊

30‧‧‧加法器

40‧‧‧降混信號

50‧‧‧項目

52‧‧‧互補信號計算器

60‧‧‧時間頻譜轉換器/區塊

62‧‧‧頻譜時間轉換器/區塊

64‧‧‧頻域降混編碼器

66‧‧‧降混處理器

70‧‧‧項目/區塊

80‧‧‧降混器

82‧‧‧參數計算器

84、92‧‧‧多聲道參數

86‧‧‧輸出介面

88‧‧‧經編碼多聲道信號

90‧‧‧輸入介面

94‧‧‧降混聲道

96‧‧‧多聲道重建構器

98‧‧‧參考數字

L‧‧‧左聲道

L-R‧‧‧第一聲道與第二聲道之間的差

R‧‧‧右聲道

W₁‧‧‧增益/第一加權因子/時間或頻率相依加權因子/值/權重

W₂‧‧‧增益/第二加權因子/時間及頻率相依加權因子/時間或頻率相依互補加權因子/權重

隨後關於附圖論述較佳實施例，在附圖中：圖1為根據一實施例之降混器之方塊圖；圖2a為用於說明能量損失補償特徵之流程圖；圖2b為說明互補信號計算器之實施例的方塊圖；圖3為說明在頻譜域中操作且具有連接至不同替代元件或累積處理元件之加法器輸出的降混器之示意性方塊圖；圖4說明用於處理部分降混信號之藉由處理器實施的較佳程序；圖5說明一實施例中多聲道編碼器之方塊圖；圖6說明多聲道解碼器之方塊圖；圖7a說明根據先前技術之總和組件的奇異點；圖7b說明圖7a之先前技術實例中用於計算降混的等式；圖8a說明根據一實施例之降混的能量關係；圖8b說明針對圖8a之實施例的等式；圖8c說明具有加權因子之更粗略頻率解析度的替代性等式；圖8d說明針對圖8a之實施例的降混相位；圖9a說明另一實施例中針對和信號的增益限制圖；圖9b說明針對圖9a之實施例的用於計算降混信號M之等式；圖9c說明用於計算經操控加權因子從而計算圖9a之實施例之和信號的操控函數；圖9d說明針對圖9a至圖9c之實施例中用以計算互補信號之加權因子W ₂ 的計算；圖9e說明圖9a至圖9d之降混的能量關係；圖9f說明針對圖9a至圖9e之實施例的增益W ₂ ；圖10a說明另一實施例的降混能量；圖10b說明針對圖10a之實施例的用於計算降混信號及第一加權因子W ₁ 的等式；圖10c說明針對10a至圖10b之實施例的用於計算第二或互補信號加權因子的程序；圖10d說明針對圖10c之實施例的參數p 及q 之等式；圖10e說明依據關於說明於圖10a至圖10d中之實施例之降混之ILD及IPD的增益W ₂ 。

Claims

一種用於降混具有兩個或大於兩個聲道之一多聲道信號之至少兩個聲道的降混器，其包含：一處理器，其用於自該至少兩個聲道計算一部分降混信號；一互補信號計算器，其用於自該多聲道信號計算一互補信號，該互補信號不同於該部分降混信號；以及一加法器，其用於將該部分降混信號與該互補信號相加以獲得該多聲道信號之一降混信號。
如請求項1之降混器，其中該處理器經組配以計算該部分降混信號，使得該多聲道信號之該至少兩個聲道與該部分降混聲道之間的一預定義能量或振幅關係在該至少兩個聲道同相時被滿足，且使得關於該至少兩個聲道之一能量損失在該至少兩個聲道異相時產生於該部分降混信號中，且其中該互補信號計算器經組配以計算該互補信號，使得該部分降混信號之該能量或振幅損失藉由在該加法器中該部分降混信號與該互補信號之該相加來部分或完全補償。
如請求項1或2之降混器，其中該互補信號計算器經組配以計算該互補信號，使得該互補信號關於該部分降混信號具有低於0.7之一相干性指標，其中一相干性指標0.0展示一完全不相干性，且一相干性指標1.0展示一完全相干性。
如前述請求項中任一項之降混器，其中該互補信號計算器經組配以將包含以下各者之信號之以下群組的一個信號用於計算該互補信號：該至少兩個聲道中之一第一聲道、該至少兩個聲道中之一第二聲道、該第一聲道與該第二聲道之間的一差、該第二聲道與該第一聲道之間的一差、該多聲道信號的在該多聲道信號具有多於該至少兩個聲道之聲道時之另一聲道或一去相關之第一聲道、一去相關之第二聲道、另一去相關之聲道、涉及該第一聲道及該第二聲道之一去相關差，或一去相關之部分降混信號。
如前述請求項中任一項之降混器，其中該處理器經組配用於：計算時間或頻率相依加權因子從而根據該至少兩個聲道之間的一預定義能量或振幅關係及該至少兩個聲道之一和信號而對該至少兩個聲道之一總和進行加權；以及比較一所計算之加權因子與一預定義臨限值；以及當該所計算之加權因子與一預定義臨限值處於一第一關係時，將該所計算之加權因子用於計算該部分降混信號，或當該所計算之加權因子與該預定義臨限值處於不同於該第一關係的一第二關係時，將該預定義臨限值而非該所計算之加權因子用於計算該部分降混信號，或當該所計算之加權因子與該預定義臨限值處於不同於該第一關係的一第二關係時，使用一修改函數導出一經修改加權因子，其中該修改函數使得該經修改加權因子相較於該所計算之加權因子更接近於該預定義臨限值。
如前述請求項中任一項之降混器，其中該處理器經組配用於：計算頻率相依加權因子之時間從而根據該至少兩個聲道與該至少兩個聲道之一和信號之間的一預定義能量或振幅關係而對該至少兩個聲道之一總和進行加權；以及使用一修改函數導出一經修改加權因子，其中該修改函數使得一經修改加權因子引起該部分降混信號之一能量小於如藉由該預定義能量關係定義之一能量。
如前述請求項中任一項之降混器，其中該處理器經組配以使用時間或頻率相依加權因子加權為該至少兩個聲道之和信號，其中該等加權因子W ₁ 經計算，使得該等加權因子具有值，該等值係在針對一頻率區間k 及一時間索引n 基於以下等式判定之值的±20%之一範圍內：，或對於一子頻帶b 及一時間索引n ：，其中A為一實值常數，其中L 表示該多聲道信號之該至少兩個聲道中之一第一聲道，且R 表示該多聲道信號之該至少兩個聲道中之一第二聲道。
如前述請求項中任一項之降混器，其中該互補信號計算器經組配以使用該至少兩個聲道中之一個聲道且使用時間或頻率相依互補權重因子W ₂ 來對該所使用之聲道進行加權，其中該等互補加權因子W ₂ 經計算，使得該等互補加權因子具有值，該等值係在針對一頻率範圍k 及一時間索引n 基於以下等式判定之值的±20%之一範圍內：，或對於一子頻帶b 及一時間索引n ：，其中L 表示該多聲道信號之一第一聲道，且R 表示該多聲道信號之一第二聲道。
如請求項1至7中任一項之降混器，其中該互補信號產生器經組配以使用該多聲道信號之一第一聲道與該第二聲道之間的一差且使用時間及頻率相依互補權重因子來對該差信號進行加權，其中該等互補加權因子經計算，使得該等互補加權因子具有值，該等值係在基於以下等式判定之值的±20%之範圍內：其中其中L 為該多聲道信號之該第一聲道，且R 為該多聲道信號之該第二聲道。
如請求項1至7中任一項之降混器，其中該互補信號產生器經組配以使用該多聲道信號之一第一聲道與該第二聲道之間的一差且使用時間及頻率相依互補權重因子來對該差信號進行加權，其中該等互補加權因子經計算，使得該等互補加權因子具有值，該等值係在基於以下等式判定之值的±20%之範圍內：其中其中L 為該多聲道信號之該第一聲道，且R 為該多聲道信號之該第二聲道。
如前述請求項中任一項之降混器，其中該處理器經組配以：自該至少兩個聲道計算一和信號；計算加權因子從而根據該和信號與該至少兩個聲道之間的一預定關係來對該和信號進行加權；修改高於一預定義臨限值的所計算之加權因子，以及應用該等經修改加權因子從而對該和信號進行加權以獲得該部分降混信號。
如前述請求項中任一項之降混器，其中該處理器經組配以將該等計算加權因子修改為在該預定義臨限值之±20%的一範圍內，或修改該等所計算之加權因子，使得該等所計算之加權因子具有值，該等值係在基於以下等式計算之值之±20%的一範圍內：其中其中A為一實值常數，L 為該多聲道信號之一第一聲道，且R 為該多聲道信號之一第二聲道。
一種用於降混具有兩個或大於兩個聲道之一多聲道信號之至少兩個聲道的方法，其包含：自該至少兩個聲道計算一部分降混信號；自該多聲道信號計算一互補信號，該互補信號不同於該部分降混信號；以及將該部分降混信號與該互補信號相加以獲得該多聲道信號之一降混信號。
一種多聲道編碼器，其包含：一參數計算器，其用於自具有兩個或大於兩個聲道之一多聲道信號之至少兩個聲道計算多聲道參數，以及如請求項1至12中任一項之一降混器；以及一輸出介面，其用於輸出或儲存包含該一或多個降混聲道及/或該等多聲道參數的一經經編碼多聲道信號。
一種用於編碼一多聲道信號之方法，其包含：自具有兩個或大於兩個聲道之一多聲道信號之至少兩個聲道計算多聲道參數；以及根據如請求項13之方法進行降混；以及輸出或儲存包含該一或多個降混聲道及該等多聲道參數之一經編碼多聲道信號。
一種音訊處理系統，其包含：如請求項14之一多聲道編碼器，其用於產生一經編碼多聲道信號；以及一多聲道解碼器，其用於解碼該經編碼多聲道信號以獲得一經重建構音訊信號。
一種處理一音訊信號的方法，其包含：如請求項15的多聲道編碼；以及多聲道解碼一經編碼多聲道信號以獲得一經重建構音訊信號。
一種電腦程式，其用於在運行於一電腦或處理器上時執行如請求項13、15或17中任一項之方法。