TWI458364B

TWI458364B - 藉由導出具高階角度項之信號而用於多聲道音訊播放系統之音場改良空間解析度技術

Info

Publication number: TWI458364B
Application number: TW096135396A
Authority: TW
Inventors: David Stanley Mcgrath
Original assignee: Dolby Lab Licensing Corp
Priority date: 2006-09-25
Filing date: 2007-09-21
Publication date: 2014-10-21
Also published as: EP2070390A2; DE602007011955D1; TW200822781A; EP2070390B1; WO2008039339A3; CN101518101B; US20090316913A1; WO2008039339A2; US8103006B2; JP4949477B2; RU2420027C2; ES2359752T3; ATE495635T1; JP2010504717A; CN101518101A; RU2009115648A

Description

藉由導出具高階角度項之信號而用於多聲道音訊播放系統之音場改良空間解析度技術

發明領域

本發明一般是有關音訊，且尤其有關可被使用以藉由一多聲道音訊播放系統改良一低空間解析度音訊信號之一再現的感知空間解析度的裝置及技術。

發明背景

多聲道音訊播放系統藉由利用多台環繞一聽者的擴音器的能力，提供了準確地再生一聲音事件(諸如一音樂表演)或一體育事件的聽覺感知的可能性。理想地，該播放系統產生一多維聲場，其再生聲音之視(apparent)方向上的感知以及預期會伴隨這樣一聲音事件的擴散混響。

例如，在一體育事件中，一觀衆通常預期來自運動場上運動員們方向的聲音會被伴隨著來自其他觀衆的圍繞聲音。在此事件中的該等聽覺感知的一準確再生若沒有此圍繞聲音是無法得到的。相似的，在一室內音樂會的該等聽覺感知若沒有再生該音樂廳的混響效果也是不能被準確地再生的。

由一播放系統再生的感知的真實性受到再生信號空間解析度的影響。再生的準確性一般隨著該空間解析度的增強而增加。消費者及商業音訊播放系統經常使用大量擴音器，但不幸的是，他們播放的該等音訊信號可能具有一相對較低的空間解析度。許多廣播及錄音的音訊信號具有比所希望的要低的空間解析度。因此，由一播放系統可被實現的真實性可能被要播放的該音訊信號的該空間解析度所限制。這就需要增強音訊信號之該空間解析度的方法。

發明概要

本發明之一目標是提供用於增強表示一多維聲場的音訊信號的空間解析度。

此目標藉由此揭露中所描述的本發明實現。依據本發明之一個層面，該聲場中聲音能量的一個或多個角度方向的統計特徵藉由分析三個或更多輸入音訊信號得到，該等三個或更多輸入音訊信號以具有零階及第一階角度項的角度方向的一函數代表該聲場。兩個或更多已處理信號從該等三個或更多輸入音訊信號的加權組合得到。該等三個或更多輸入音訊信號依據統計特徵被加權組合。該等兩個或更多已處理信號以具有一階或大於一階的更多階角度項的角度方向的一函數代表該聲場。該等三個或更多輸入音訊信號及該等兩個或更多已處理信號以具有零階、一階或大於一階的角度項的角度方向的一函數代表該聲場。

藉由參考以下論述及在若干圖式中相同參考符號代表相同元件的附圖，本發明的各種特徵及其較佳實施例可更好地被理解。以下討論的內容及附圖僅以範例被陳述，且不應被理解為表示對本發明範圍的限制。

圖式簡單說明

第1圖是獲取自一麥克風系統且接著被一播放系統再生的一聲音事件之一示意圖。

第2圖說明一聽者及一聲音的視方位角。

第3圖說明分配信號給擴音器以再生一方向感知的一示範性播放系統的一部份。

第4圖是在一假設播放系統中兩個相鄰的擴音器的頻道的增益函數之一圖說明。

第5圖是顯示由一階信號的一混合導致的空間解析度的一降級的增益函數之一圖說明。

第6圖是包括第三階信號的增益函數之一圖說明。

第7A到7D圖是假設的範例播放系統之示意性方塊圖。

第8圖及第9圖是用於從三頻道(W，X，Y)B－格式信號獲得高階項的一方法之示意性方塊圖。

第10到12圖是可被用以獲得三頻道B－格式信號之統計特性的電路之示意性方塊圖。

第13圖說明可被用以從三頻道B－格式信號之統計特性產生第二階及第三階信號的電路之示意性方塊圖。

第14圖是併入本發明各種層面的一麥克風系統之一示意性方塊圖。

第15A及15B圖是一麥克風系統中的換能器的可選擇的排列之示意圖。

第16圖是一播放系統中的擴音器頻道的假設增益函數之一圖說明。

第17圖是可被使用以實施本發明各種層面的一裝置之一示意性方塊圖。

較佳實施例之詳細說明 A.介紹

第1圖提供一聲音事件10及併入本發明之層面的一解碼器17，該解碼器17接收由該麥克風系統15獲取的代表該聲音事件聲音的音訊信號18。該解碼器17處理該等所接收信號以產生具增強空間解析度的已處理信號。該等已處理信號由一系統播放，該系統包括被安排於接近一名或多名聽者12的一擴音器陣列19以提供在該聲音事件中經歷的聽覺感知的一準確再生。該麥克風系統15獲取直接聲波13及非直接聲波14，該非直傳聲波14是經過某聲音環境16(諸如一房間或一音樂廳)之一個或多個表面反射之後到達的。

在一實施中，該麥克風系統15提供音訊信號，該等音訊信號符合高傳真立體聲(Ambisonic)四聲道信號格式(W，X，Y，Z)，稱為B－格式(B－format)。可從英國韋克菲爾德(Wakefield)的SoundField公司得到的SPS422B麥克風系統及MKV麥克風系統是可被使用的兩個範例。使用SoundField麥克風系統的實施細節被討論於下文。在不脫離本發明範圍的情況下，若希望，其他麥克風系統及信號格式也可被使用。

該四聲道(W，X，Y，Z)B－格式信號可從四個一致(co－incident)聲音換能器(transducer)之一陣列獲得。概念上，一個換能器是全向的且三個換能器具有相互正交偶極形狀模式的方向靈敏度。許多B－格式麥克風系統是根據四方向聲音換能器的一四面體陣列及一信號處理器製造而成的，該信號處理器對該等四個換能器的輸出做出回應，產生該等四通道B－格式信號。該W－通道信號代表一全向聲波且該等X、Y及Z通道信號代表沿三個相互正交的坐標軸的聲波，其典型地被表達為具有第一階角度項θ 的角度方向的函數。該X軸關於一聽者從後向前水平對齊，該Y軸關於該聽者從右向左水平對齊，且該Z軸關於該聽者向上垂直對齊。該等X及Y軸被說明於第2圖。第2圖同樣說明一聲音的該視方位角θ ，可被表示為一向量(x，y)。藉由限制該向量以具有單位長度，它可被視為：x ² ＋y ² ＝1 (1) (x ,y )＝(cosθ ,sinθ ) (2)

該等四通道B－格式信號可表達關於一聲場的三維資訊。關於一聲場僅要求二維資訊的應用可使用一個三頻道(W，X，Y)B－格式信號，而忽略該Z通道。本發明之各種層面可被應用至二維及三維播放系統但餘下的揭露對二維應用做出更具體的說明。

B.信號平移(Panning)

第3圖說明具有八個環繞該聽者12之擴音器的一示範性播放系統的一部分。該圖說明一情形，在該情形中，該系統正在產生一聲場，回應於分別代表具有視方向P ’和Q ’的兩聲音的兩個輸入信號P 和Q 。該平移器(panner)元件33處理該等輸入信號P 和Q 以分配或平移該等擴音器頻道間的已處理信號，以再生該方向上的感知。該平移器元件33可使用一些過程。可使用的一個過程被稱為最近講者振幅平移(NSAP)。

該NSAP過程透過根據一聲音的視方向及該等擴音器的位置(相對於一聽者或聆聽區域)對每一擴音器頻道改變增益，來分配該等信號給該等擴音器頻道。例如，在一個二維系統中，該信號P的增益根據此信號代表的該聲音的該視方向的該方位角θ _P 及位於該視方向θ _P 兩邊的兩個擴音器SF及SE各自的方位角θ _F 及θ _E 的函數得到。在一個實施中，除這最近的兩個擴音器以外的所有擴音器頻道的增益被設定為零且該等兩個最近的擴音器頻道的增益依據以下等式計算：相似的計算被使用以得到其他信號的增益。該信號Q代表一特別情況，即其代表的該聲音的該視方向θ _Q 與一個擴音器SC 對齊。擴音器SB 或SD 可被選擇作為第二最接近擴音器。正如從等式1a及1b可見的，該擴音器SC 頻道的增益等於1且其他擴音器頻道的增益等於0。

該等擴音器通道的增益可以方位角的函數被作圖。顯示於第4圖的該圖形說明被顯示於第3圖中的該系統中的該等擴音器SE 及SF 頻道的增益函數，其中該等擴音器SE 及SF 彼此分開且與它們緊密相鄰的擴音器以一45度角分開。該方位角根據第2圖所顯示的該座標系統被表達。當諸如由該信號P 所代表的一聲音具有135度到180度之間的一視方向時，該等擴音器SE 及SF 頻道的增益將在0到1之間，且該系統中所有其他擴音器的增益被設定為0。

C.麥克風增益模式

系統可將該NSAP過程應用於代表具有離散方向之聲音的信號，用以產生可準確再生一原始聲音事件的聲音感知的聲場。可是，麥克風系統並不提供代表具有離散方向聲音的信號。

當一聲音事件10被該麥克風系統15獲得時，聲波13、14典型地從各個不同方向到達該麥克風系統。上文中提到的SoundField公司的該等麥克風系統產生符合該B－格式的信號。四通道(W，X，Y，Z)B－格式信號可被產生以表達一聲場的三維特徵，該聲場被表達為角度方向的函數。忽略該Z－頻道信號，三頻道(W，X，Y)B－格式信號可被得到，用以表示一聲場的二維特徵，該聲場同樣以角度方向的函數被表達。需要一方式處理此等信號，以使得聲音感知可被再生且具有一空間準確度，就像該NSAP過程被應用於代表具有離散方向聲音的信號所實現的空間準確度。實現此程度空間準確度的能力受到由該麥克風系統15所提供的該等信號的該空間解析度的限制。

從一麥克風系統所得到的一信號的該空間解析度取決於該麥克風系統之靈敏度的實際方向模式與一些理想模式的符合接近程度，即依次取決於該麥克風系統中的該等個別聲音換能器之靈敏度的該實際方向模式。實際換能器靈敏度的該方向模式可能明顯與一些理想模式有所偏差，但信號處理可補償此等與該等理想樣本的偏差。信號處理也可轉換換能器輸出信號到一想要的格式，諸如該B－格式。包括該換能器/處理器系統的該信號格式的該有效的方向模式是換能器方向靈敏度及信號處理的組合結果。上文中提到的SoundField公司的該等麥克風系統是此方法之範例。此實施細節對本發明並非關鍵所在，因為它對如何實現有效方向模式來講並不重要。在以下的討論中，像術語“方向模式”及“方向性”指的是被使用以獲得一聲場的該換能器或換能器/處理器組合的該有效的方向靈敏度。

一換能器靈敏度的一個二維方向模式可以一角度方向θ 的函數的增益模式被描述，可具有被表示為如下等式中的任何一個形式：Gain (a ,θ )＝(1－a )＋a ．cosθ (4a)Gain (a ,θ )＝(1－a )＋a ．sinθ (4b)其中a＝0用於一全向增益模式；a＝0.5用於一心形增益模式；及a＝1用於一8字形增益模式。此等模式被表示以具有第一階角度項θ的角度方向的函數且在此被稱為第一階增益模式。

在典型的實施中，該麥克風系統15使用三個或四個具有第一階增益模式的換能器以提供表示關於一聲場的二維或三維資訊的三頻道(W，X，Y)B－格式信號或四頻道(W，X，Y，Z)B－格式信號。參考等式4a及4b，用於每一個該等三個B－格式頻道(W，X，Y)的一增益模式可被表示為：Gain _w (θ )＝Gain (a ＝0,θ )＝1 (5a)Gain _x (θ )＝Gain (a ＝1,θ )＝cosθ ＝x (5b)Gain _Y (θ )＝Gain (a ＝1,θ )＝sinθ ＝y (5c)其中該W－頻道具有一全向零階增益模式，如a＝0所指示，且該X及Y－頻道具有一8字形第一階增益模式，如a＝1所指示。

D.播放系統解析度

一播放陣列中的擴音器的個數及位置可影響一再生聲場的該感知空間解析度。具有八個等分放置擴音器的一系統在此被討論且被說明，但此排列僅是一範例。再生環繞一聽者的一聲場需要至少三個擴音器，但五個或更多擴音器一般是較佳的。在一播放系統的較佳實施中，該解碼器17產生一輸出信號用於每一擴音器，該輸出信號儘量與其他輸出信號不相關。較高程度的不相關有助於在一較大的聆聽區域中穩定一聲場的該感知方向，避免習知的對於位於所謂最佳位置(sweet spot)以外的聽者的定點問題(localization problem)。

在依據本發明的一播放系統之一實施中，該解碼器17處理以僅具有零階及第一階角度項方向的函數表示一聲場的三頻道(W，X，Y)B－格式信號，以得到以具有更高階角度項方向的函數表示該聲場的已處理信號，該等已處理信號被分配給一個或更多擴音器。在傳統系統中，該解碼器17將來自該等三個B－格式頻道的每一個的信號混合成一分別已處理信號給該等擴音器的每一個，使用基於擴音器位置所選擇的增益因數。可是，這種類型的混合過程並不提供與在典型系統的該NSAP過程(如上文所描述的)中所使用的該增益函數一樣高的空間解析度。例如，說明於第5圖中的圖示顯示了由第一階B－格式信號的一線性混合導致的該等增益函數的空間解析度的一降級。

導致此空間解析度的一降級的原因可被解釋，藉由觀察具有振幅為R的一聲音P 的該精確的方位角θ _P 並不由該麥克風系統15量測。而是，該麥克風系統15記錄以具有零階及第一階角度項之方向的函數表示一聲場的三個信號W＝R 、X＝R ．cosθ _P 及Y＝R ．sinθ _P 。例如為擴音器SE生成的該已處理信號是由該W、X及Y－頻道信號的一線性組合構成的。

此混合過程的該增益曲線可被看作為對該所希望的NSAP增益函數的一低階傅利葉近似。例如，被顯示於第4圖的該SE 擴音器頻道的該NSAP增益函數可被一傅利葉級數表示Gain _SE (θ )＝a ₀ ＋a ₁ cosθ ＋b ₁ sin θ ＋a ₂ cos 2θ ＋b ₂ sin 2θ ＋a ₃ cos 3θ ＋b ₃ sin 3θ ＋...(6)但一典型的解碼器的該混合過程略去該第一階以上的項，即可被表示為：Gain _SE (θ )＝a ₀ ＋a ₁ cosθ ＋b ₁ sinθ (7)該解碼器17的該處理函數的該空間解析度可藉由包括以具有更高階項之方向的函數表示一聲場的信號來增加。例如，該SE 擴音器頻道的包括多到第三階項的一增益函數可被表示為：Gain _SE (θ )＝a ₀ ＋a ₁ cosθ ＋b ₁ sinθ ＋a ₂ cos 2θ ＋b ₂ sin 2θ ＋a ₃ cos 3θ ＋b ₃ sin 3θ (8)包括第三階項的一增益函數可提供對該所希望的NSAP增益曲線的一更接近的近似，正如第6圖中所說明的。

第二階及第三階角度項可藉由使用獲取第二階及第三階聲場成分的一麥克風系統得到，但這將需要具有第二階及第三階方向模式之靈敏度的聲音換能器。具有更高階方向靈敏度的換能器是非常難製造的。另外，此方法不能對使用具有第一階方向模式之靈敏度之換能器所記錄的信號的播放提供任何解決方案。

被顯示於第7A到7D圖的示意性方塊圖說明了可被使用以產生一多維聲場的不同的假設播放系統，對應於不同類型的輸入信號。第7A圖所說明的該播放系統驅動八個擴音器，對應於八個離散輸入信號。第7B及7C圖所說明的該等播放系統驅動八個擴音器，分別對應於第一階及第三階B－格式輸入信號，使用一解碼器17，該解碼器17執行合乎該輸入信號格式的一解碼過程。第7D圖所說明的該播放系統併入本發明之各種特徵，其中該解碼器17處理三頻道(W，X，Y)B－格式零階及第一階信號以得到已處理信號，該等已處理信號近似於可從使用具有第二階及第三階增益模式的換能器的麥克風系統得到的該等信號。以下討論描述可被使用以得到此等已處理信號的不同方法。

E.獲取更高階項

用於獲得等高階角度項的兩個基本方法被描述於下文。第一方法獲取該等角度項用於寬頻信號。第二方法是第一方法的一變化，獲取該等角度項用於頻率子頻帶。該等技術可被使用以產生具有更高階成分的信號。另外，這些技術可被應用於三維應用的該等四頻道B－格式信號。

1.寬頻方法第8圖是用於從三頻道(W，X，Y)B－格式信號獲得更高階項的一寬頻方法之一示意性方塊圖。四個統計特徵記作：C ₁ ＝cosθ (t )之一估計值；S ₁ ＝sinθ (t )之一估計值；C ₂ ＝cos2θ (t )之一估計值；及S ₂ ＝sin2θ (t)之一估計值得自對該等B－格式信號的一分析，且這些特徵被使用以產生對該等第二階及第三階項的估計，記作：X₂ ＝信號 cos2θ (t ) Y₂ ＝信號．sin2θ (t ) X₃ ＝信號．cos3θ (t ) Y₃ ＝信號．sin3θ (t )

用於得到該等四個統計特徵的一個技術假設在任一特定時刻t ，作用於該麥克風系統15的大部分聲音能量從一單一角度方向到達，使得方位角是時間的函數，可被記作θ (t )。因此，該等W、X及Y－頻道信號被假設以實質形式為：W＝信號 X＝信號．cosθ (t ) Y＝信號．sinθ (t )對該聲音能量的角度方向的該等四個統計特徵的估計可得自下文所示的等式9a到9d，其中記號Av (x )表示該信號x 的一平均值。此平均值可在與信號特徵發生明顯改變的時段相比相對短的一時間段被計算。

其他可被用以獲得該等四個統計特徵S ₁ 、C ₁ 、S ₂ 、C ₂ 的估計的技術被討論如下。

上文所提到的該等四個信號X₂ 、Y₂ 、X₃ 、Y₃ 可根據該等W、X及Y-頻道信號的加權組合而產生，使用該等四個統計特徵作為權重，採用藉由使用以下三角恒等式的若干方式中的任意一個：cos 2θ ≡cos² θ －sin² θ sin 2θ ≡2 cosθ ．sinθ cos 3θ ≡cosθ ．cos 2θ －sinθ ．sin 2θ sin 3θ ≡cosθ ．sin 2θ ＋sinθ ．cos 2θ 該X ₂ 信號可得自以下加權組合中的任意一個：X₂ ＝信號．cos2θ ＝W．C ₂ (10a) X₂ ＝信號．cos2θ ＝信號．(cos² θ －sin² θ )＝X．C ₁ －Y．S ₁ (10b) 在等式10c中所計算的值是前兩個表示式的一平均。該Y₂ 信號可得自以下加權組合中的任意一個：Y₂ ＝信號．sin2θ ＝W．S ₂ (11a)Y₂ ＝信號．sin2θ ＝信號．(2cosθ sinθ )＝X．S ₁ ＋Y．C ₁ (11b) 在等式11c中所計算的值是前兩個表示式的一平均。該等第三階信號可得自以下加權組合中的任意一個：X₃ ＝信號．cos3θ ＝X．C ₂ －Y．S ₂ (12) Y₃ ＝信號．cos3θ ＝X．S ₂ ＋Y．C ₂ (13)

其他加權組合也可被使用以計算該等四個信號X ₂ 、Y ₂ 、X ₃ 、Y ₃ 。以上所顯示的該等等式僅是可能被使用的計算範例。

其他技術也可被使用以獲得該等四個統計特徵。例如，若可得到足夠的處理資源，實際可根據以下等式獲得C₁ ：此等式藉由分析前K個取樣點的該等W、X及Y－頻道信號計算在取樣點n 的C ₁ 的值。

可被使用以得到C₁ 的另一技術是使用一第一階遞歸平滑濾波器代替等式14a中的有限和的計算，如以下等式所示：該平滑濾波器的時間常數取決於因數α。此計算可以如說明於第10圖中的方塊圖所示被執行。當等式14b中的表示式的分母等於零時將會發生的被零除的錯誤，可藉由增加一小數值ε到該分母被避免，如圖所示。這對該等式作輕微地修改如下

該被零除錯誤也可藉由使用一回授回路被避免，如第11圖所示。此技術使用前一估計C ₁ (n －1)來計算以下誤差函數：Err (n )＝2W(n )．X(n )－C ₁ (n －1)．(W(n )² ＋X(n )² ＋Y(n )² ＋ε ) (15)

若該誤差值函數的值大於0，對C ₁ 的該前一估計過小，signum(Err (n ))的值等於1，且該估計被增大一調整量等於α₁ 。若該誤差值函數的值小於0，對C ₁ 的該前一估計過大，該函數signum(Err (n ))的值等於－1，且該估計被減小一調整量等於α₁ 。若該誤差值函數的值等於0，對C ₁ 的該前一估計正確，該函數signum(Err (n ))的值等於0，且該估計不變。對C₁ 估計的一粗略版被產生於說明於第11圖中的方塊圖的左下部分所顯示的儲存或延遲元件，且此估計的一平滑化版被產生於該方塊圖右下部分的標示C ₁ 之輸出。該平滑濾波器的時間常數取決於因數α₂ 。該等四個統計特徵C ₁ 、S ₁ 、C ₂ 、S ₂ 可使用對應於第12圖所顯示的該等方塊圖的電路及過程被得到。具有更高階項的信號X₂ 、Y₂ 、X₃ 、Y₃ 可依據等式10c、11c、12及13，藉由使用對應於第13圖所顯示的該等方塊圖的電路及過程被得到。

在被使用以從該等W、X及Y－頻道輸入信號得到該等四個統計特徵的過程中，若該等過程使用時間平均技術，將引入一些延遲。在一即時系統中，增加一些延遲到該等輸入信號路徑(如第9圖所示)對補償該統計獲得中的該延遲可能是有益的。在許多實施中，統計分析延遲的一典型值是在10ms到50ms之間。插入到該輸入信號路徑的該延遲一般應小於或等於該統計分析延遲。在許多實施中，該信號路徑延遲可被忽略，而該系統的總體性能沒有明顯降級。

2.多頻帶方法以上所討論的該等技術獲取寬頻統計特徵，該寬頻統計特徵可以以隨時間但不隨頻率變化的純量值來表示。該等獲取技術可被擴展到獲取頻帶相依統計特徵，該等頻帶相依統計特徵可以以具有相對應於數個不同頻率或不同頻率子頻帶的元素的向量被表示。另外，每一該頻率相依統計特徵C ₁ 、S ₁ 、C ₂ 及S ₂ 可以以一脈衝回應被表示。

若每一該C₁ 、S₁ 、C₂ 及S₂ 向量中的該等元素都以頻率相依增益值被處理，可藉由應用一合適的濾波器於W、X及Y－頻道信號來產生該等X₂ 、Y₂ 、X₃ 及Y₃ 信號的加權組合，該等W、X及Y－頻道信號具有基於此等向量中的該等增益值的頻率回應。顯示於該等先前等式及圖中的該等乘法操作被一濾波操作(諸如卷積)所代替。

對該等W、X及Y－頻道信號的該統計分析可在頻域或時域中被執行。若該分析在頻域中被執行，則該等輸入信號可被變換到一短時間頻域，使用一區塊傅利葉變換或類似變換以產生頻域係數，且該等四個統計特徵可被計算，用於每一頻域係數或用於定義頻率子頻帶的頻域係數組。被使用以產生該等X₂ 、Y₂ 、X₃ 及Y₃ 信號的此過程可在逐個係數(coefficient－by－coefficient)的基礎上或逐個頻帶(band－by－band)的基礎上進行此處理。

F.在一麥克風系統中的實施

以上所討論的該等技術可被併入到一換能器/處理器配置中，以形成一可提供具有改良空間準確度的輸出信號的麥克風系統15。在示意性地顯示於第14圖中的一實施中，該麥克風系統15包含三個一致或幾乎一致的聲音換能器A、B、C，該等聲音換能器A、B、C具有心形方向模式靈敏度，它們被安排在一等邊三角形的頂點上，且每一換能器從三角形的中心面向外。該換能器方向增益模式可被表示為：

其中換能器A面向前沿該X軸，換能器B面向左後方，且與X軸有一120度的夾角，且換能器C面向右後，且與X軸有一120度的夾角。

此等換能器的該等輸出信號可被轉換到三頻道(W、X、Y)第一階B－格式信號，如下：

獲得該等三頻道B－格式信號最少需要三個換能器。實際上，當低成本換能器被使用時，可較佳地使用四個換能器。被顯示於第15A及15B圖中的示意圖說明了兩個可行的排列方案。一個三個換能器陣列可被排列使該等換能器面向不同角度，諸如60度、－60度及180度。一個四個換能器陣列可被排列於一所謂“T形”配置，即該等換能器面向0度、90度、－90度及180度方向，或被排列於一所謂“交叉”配置，即該等換能器面向45度、－45度、135度及－135度方向。該等交叉配置的增益模式為：其中該下標LF、RF、LB及RB代表面向左前、右前、左後及右後方向的該等換能器的增益。

該等交叉配置換能器的輸出信號可被轉換到該等三頻道(W、X、Y)第一階B－格式信號，如下：

在實際中，每一換能器的該等方向增益模式都偏離於該理想心形模式。上文所顯示的該等轉換等式可被調整以說明這些偏差。另外，該等換能器可能在較低頻率上具有較差的方向靈敏度；然而，在許多應用中此特性可被容忍，因為聽者一般來說對較低頻率上的方向錯誤是較不敏感的。

G.混合等式

七個第一、第二及第三階信號(W 、X 、Y 、X ₂ 、Y ₂ 、X ₃ 、Y ₃ )組可被一矩陣混合或組合，以驅動所欲個數的擴音器。以下混合等式組定義一7x5矩陣，該矩陣可被使用以驅動五個擴音器於一典型的包括左(L)、右(R)、中間(C)、左環繞(LS)及右環繞(RS)頻道的環繞聲配置：由這些混合等式提供的該等擴音器增益函數以圖示方式被說明於第16圖。這些增益函數假設該混合矩陣被提供一理想的輸入信號組。

H.實施

併入本發明之各種層面的裝置可被實施於各種各樣的方式，包括被一電腦或其他裝置執行的軟體，該其他裝置包括更專用的元件，諸如耦接於類似一通用電腦中供應的那些元件的數位信號處理器(DSP)電路。第17圖是一裝置70之一示意性方塊圖，該裝置70可被使用以實施本發明之層面。處理器72提供計算資源，RAM 73是被該處理器72使用的系統隨機存取記憶體(RAM)。ROM 74表示一些形式的持久記憶體，諸如唯讀記憶體(ROM)或快閃記憶體，用於儲存操作該裝置70所需程式及可能用於實現本發明各種層面。I/O控制75代表介面電路，用於以通訊通道76、77的方式接收及發送信號。在所顯示的該實施例中，所有主要系統元件連接到匯流排71，該匯流排71可代表多於一個的實體或邏輯匯流排；然而，實施本發明並不需要一匯流排結構。

儲存裝置78是可取捨的。實施本發明之各種層面的程式可被記錄在具有一儲存媒體(諸如磁帶或磁碟)或一光媒體的儲存裝置78中。該儲存媒體也可被使用以記錄用於作業系統、公用程式及應用程式的指令程式。

實現本發明之各種層面的所需的功能可由以許多各種各樣方式實施的元件執行，該等元件包括離散邏輯元件、積體電路、一個或更多ASIC及/或程式控制處理器。這些元件的實施方式對於本發明來說並不重要。

本發明之軟體實施可被各種各樣的機器可讀媒體傳遞，諸如基頻或調變通訊路徑遍及包括從超音速到紫外頻率的頻譜，或實質上使用任何記錄技術傳遞資訊的儲存媒體，包括磁帶、卡或磁碟、光卡或光碟，及包括紙的媒體上的可偵測的記號。

10．．．聲音事件

12．．．聽者

13．．．直接聲波

14．．．非直接聲波

15．．．麥克風系統

16．．．聲音環境

17．．．解碼器

18．．．音訊信號

19．．．擴音器陣列

33．．．平移器元件

70．．．裝置

71．．．匯流排

72．．．處理器

73．．．RAM(隨機存取記憶體)

74．．．ROM(唯讀記憶體)

75．．．I/O控制

76、77．．．通訊通道

78．．．儲存裝置

第2圖說明一聽者及一聲音的視方位角。

第6圖是包括第三階信號的增益函數之一圖說明。

第7A到7D圖是假設的範例播放系統之示意性方塊圖。

Claims

一種用以於增加表示一聲場之音訊信號的空間解析度之方法，該方法包含下列步驟：接收以具有零階及第一階角度項的角度方向之一函數表示該聲場的三個或更多輸入音訊信號；分析該等三個或更多輸入音訊信號以導得該聲場中聲音能量的一個或更多角度方向的統計特徵；從該等三個或更多輸入音訊信號的加權組合導得兩個或更多已處理信號，其中該等三個或更多輸入音訊信號依據該等統計特徵被加權，其中該等兩個或更多已處理信號以具有一階或大於一階的更多階角度項的角度方向之一函數表示該聲場；提供以具有零階、一階及大於一階角度項的角度方向之一函數表示該聲場的五個或更多輸出音訊信號，其中該等五個或更多輸出音訊信號包含該等三個或更多輸入音訊信號及該等兩個或更多已處理信號。
如申請專利範圍第1項所述之方法，其中該等三個或更多輸入音訊信號被接收自複數個聲音換能器，每一聲音換能器都具有角度項不大於第一階的方向靈敏度。
如申請專利範圍第1項或第2項所述之方法，其由該等統計特徵導得以具有第二階角度項的角度方向之一函數表示該聲場的兩個或更多信號。
如申請專利範圍第1項或第2項所述之方法，其由該等統計特徵導得以具有第二階及第三階角度項的角度方向之一函數表示該聲場的四個或更多已處理信號。
如申請專利範圍第1項或第2項所述之方法，其由該等統計特徵導得以具有二階或大於一階的更多階角度項的角度方向之一函數表示該聲場的四個或更多已處理信號。
如申請專利範圍第1項或第2項所述之方法，其中該等統計特徵至少部分地從該等三個或更多輸入音訊信號在時段上所計算出的平均值導得。
如申請專利範圍第1項或第2項所述之方法，其中該等輸入音訊信號的每一個被取樣點所表示，且該等統計特徵至少部分地從一分別的輸入音訊信號的複數個該等取樣點的一總和導得。
如申請專利範圍第1項或第2項所述之方法，其中該等統計特徵至少部分地藉由對獲得自該等三個或更多輸入音訊信號的值應用一平滑化濾波器導得。
如申請專利範圍第1項或第2項所述之方法，其中該等統計特徵表示該聲場的特徵，該聲場以一第一階項角度方向的一正弦函數或餘弦函數被表示。
如申請專利範圍第1項或第2項所述之方法，其可導得該等三個或更多輸入音訊信號的頻率相依統計特徵。
如申請專利範圍第10項所述之方法，包含下列步驟：對該等三個或更多輸入音訊信號應用一區塊變換以產生頻域係數；從個別的頻域係數或頻域係數組導得該頻域相依統計特徵；及基於該等頻率相依統計特徵，藉由對具有頻率響應的該等三個或更多輸入音訊信號應用濾波器，而導得該等兩個或更多已處理信號。
如申請專利範圍第10項所述之方法，包含基於該等頻率相依統計特徵，藉由對具有脈衝響應的該等三個或更多輸入音訊信號應用濾波器，而導得該等兩個或更多已處理信號。
一種用以增加表示一聲場之音訊信號的空間解析度之設備，該設備包含：用於接收以具有零階及第一階角度項的角度方向之一函數表示該聲場的三個或更多輸入音訊信號之裝置；用於分析該等三個或更多輸入音訊信號以導得該聲場中聲音能量的一個或更多角度方向的統計特徵之裝置；用於從該等三個或更多輸入音訊信號的加權組合導得兩個或更多已處理信號之裝置，其中該等三個或更多輸入音訊信號依據該等統計特徵被加權，其中該等兩個或更多已處理信號以具有一階或大於一階的更多階角度項的角度方向之一函數表示該聲場；用於提供以具有零階、一階及大於一階角度項的角度方向之一函數表示該聲場的五個或更多輸出音訊信號之裝置，其中該等五個或更多輸出音訊信號包含該等三個或更多輸入音訊信號及該等兩個或更多已處理信號。
如申請專利範圍第13項所述之設備，其中該等三個或更多輸入音訊信號被接收自複數個聲音換能器，每一聲音換能器都具有角度項不大於第一階的方向靈敏度。
如申請專利範圍第13項或第14項所述之設備，其由該等統計特徵導得以具有第二階角度項的角度方向之一函數表示該聲場的兩個或更多信號。
如申請專利範圍第13項或第14項所述之設備，其由該等統計特徵導得以具有第二階及第三階角度項的角度方向之一函數表示該聲場的四個或更多已處理信號。
如申請專利範圍第13項或第14項所述之設備，其由該等統計特徵導得以具有二階或大於一階的更多階角度項的角度方向之一函數表示該聲場的四個或更多已處理信號。
如申請專利範圍第13項或第14項所述之設備，其中該等統計特徵至少部分地從該等三個或更多輸入音訊信號在時段上所計算出的平均值導得。
如申請專利範圍第13項或第14項所述之設備，其中該等輸入音訊信號的每一個都被取樣點表示，且該等統計特徵至少部分地從一分別的輸入音訊信號的複數個該等取樣點的一總和導得。
如申請專利範圍第13項或第14項所述之設備，其中該等統計特徵至少部分地藉由對導得自該等三個或更多輸入音訊信號的值應用一平滑化濾波器導得。
如申請專利範圍第13項或第14項所述之設備，其中該等統計特徵表示該聲場的特徵，該聲場以一第一階項角度方向的一正弦函數或餘弦函數表示。
如申請專利範圍第13項或第14項所述之設備，其導得該等三個或更多輸入音訊信號的頻率相依統計特徵。
如申請專利範圍第22項所述之設備，包含：用於對該等三個或更多輸入音訊信號應用一區塊變換以產生頻域係數之裝置；用於從個別的頻域係數或頻域係數組導得該頻域相依統計特徵之裝置；及用於基於該等頻率相依統計特徵藉由對具有頻率響應的該等三個或更多輸入音訊信號應用濾波器導得該等兩個或更多已處理信號之裝置。
如申請專利範圍第22項所述之設備，包含用於基於該等頻率相依統計特徵藉由對具有脈衝響應的該等三個或更多輸入音訊信號應用濾波器導得該等兩個或更多已處理信號之裝置。
一種記錄藉由一裝置可執行的一指令程式之儲存媒體，其中該指令程式的執行引起該裝置施行如申請專利範圍第1項到第12項中的任意一項所述之方法。