TWI647961B

TWI647961B - 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置

Info

Publication number: TWI647961B
Application number: TW103104224A
Authority: TW
Inventors: 亞歷山大克魯格; 斯凡科登
Original assignee: 瑞典商杜比國際公司
Priority date: 2013-02-08
Filing date: 2014-02-10
Publication date: 2019-01-11
Also published as: JP6374882B2; WO2014122287A1; KR20150115779A; EP2954700A1; EP2954700B1; EP2765791A1; CN104995926B; JP2016509812A; US9622008B2; CN104995926A; TW201448616A; US20150373471A1; KR102220187B1

Abstract

高階保真立體音響(HOA)代表三維度聲音。HOA提供高度空間解像度，並便於分析關於優勢聲源之聲場。本發明旨在識別構成聲場的獨立優勢聲源，並追蹤其時間軌道。已知之應用是藉察看原先HOA表示法之方向性功率分配，為優勢聲源方向搜尋全部潛在候選，而在本發明中，與先前已知聲源訊號相關之全部組份均已除去。利用如此操作，在對聲場的分配在方向上大為分散情況下，可以避免誤測眾多而非唯一正確聲源之問題。

Description

聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置

本發明係關於在聲場之高階保真立體音響表示法中，決定不相關聲源方向之方法和裝置。

高階保真立體音響(Higher Order Ambisonics,HOA)貢獻一種可能性，在像波場合成(WFS)的其他技術，或像22.2的通道基礎之方略當中，代表三維度聲音。惟與通道基礎方法呈對比的是，HOA表示法貢獻的優點是，與特殊揚聲器設置無關。然而此項通融性是以解碼過程為代價，需在特定揚聲器設置上，回放HOA表示法。與WFS方略相較，所需揚聲器數量往往很大，HOA亦可描繪於只有少量揚聲器組成的裝置。HOA又一優點是亦可採用同樣表示法，對頭戴耳機之雙耳描繪不需任何修飾。

HOA是根據利用平截球諧函數(SH)展開的複合諧平面波振幅之空間密度表示法，各展開係數是角頻的函數，可同等利用時間域函數表示。因此，不失一般性，完整HOA聲場表示法實際上可假設包含O時間域函數，其中O指展開係數之數量。以下，此等時間域函數稱為HOA係數序列或HOA通道。

HOA有潛勢可提供高度空間解像度，改進展開之成長最高階N。此貢獻可能性，可以分析關於優勢聲源之聲場。

應用上是如何從HOA表示法去識別構成聲場的獨立優勢聲源，和如何追蹤其時間軌道。例如專利申請案EP 12305537.8所述，利用聲場分解成優勢方向性訊號和剩餘週遭組份，供HOA表示法之壓縮，就需要此等操作。此等方向追蹤法又一應用，是粗略的初步原始分離。對於HOA聲場記錄的後製作，亦可使用估計之方向軌道，以放大或減弱特殊聲源之訊號。

EP 12305537.8擬議接續進行下述三種操作：‧識別時幅(time frame)內現時存在的優勢聲源數量，並搜尋相對應方向。優勢聲源數量是由HOA通道交叉相關矩陣之本徵值決定。為搜尋優勢聲源方向，評估方向性功率分配，相當於固定大量預界定測試方向之HOA係數幅。在方向性功率分配尋找最大值，可得第一次方向估計。然後，順序重複下述二項操作，以找出剩餘之識別方向：從剩餘之測試方向集合，消除空間鄰區之測試方向，和所得集合用來搜尋方向性功率分配之最大值；‧把估計的方向指派給在最後時幅視為活性之聲源；‧在指派之後，進行方向估計之適當平滑，以獲得時間上平順之方向軌道。

然而，雖然以如此處理過程，藉計算指數式加權運動平均值，原則上可完成方向估計之時間平順，惟此項技術的缺點是，不能準確捕獲突然方向變化或開始出現新的優勢聲音。

為克服此問題，專利申請案EP 12306485.9倡議引進簡單的統計聲源運動預估模式，採用於以Bayesian學習原則實施之統計上動機平順法。惟EP 12306485.9和EP 12305537.8只從方向性功率分配對聲源方向計算可能函數。此項分配表示從單元球體上幾近均勻分配取樣點所特定方向之大量普通平面波功率。並未提供來自不同方向的普通平面波間彼此相關之任何資訊。

實務上，HOA表示法之N階往往有限，造成空間上頻帶受限之聲場。具體而言，此意味方向性聲場對方向性功率分配之貢獻，在鄰區方向之真正入射方向週圍變模糊。此模糊效應在數學上稱為「分散函數」，參見下述〈高階保真立體音響之空間解像度〉一節。其程度隨HOA表示法降階而成長。EP 12306485.9和EP 12305537.8方法追蹤法，某種程度考慮到此效應，把方向搜尋拘限在先前所發現方向之鄰區外側。然而，鄰區的規格假設全部聲源都是以HOA表示方法之全階N編碼。此項假設違反含以低於N階編碼的普通平面波之N階HOA表示法。此等低於N階的普通平面波會是藝術創作的結果，使聲源呈現更寬。然而亦發生在利用球形麥克風記錄之HOA聲場表示法。

EP 12306485.9和EP 12305537.8方向追蹤法會識別超過單一的聲源，若聲場是由較N低階的單一普通平面波組成，其性能不良。

本發明欲解決之問題是，改進HOA聲場內優勢聲源之決定，可追蹤其時間軌道。此問題是利用申請專利範圍第1、2和6項解決。利用申請專利範圍第6項方法之裝置，則列於申請專利範圍第7項。

本發明改進EP 12306485.9處理方式。本發明處理方式是尋找獨立之優勢聲源，並經時追蹤其方向。「獨立優勢聲源」表示個別聲源之訊號不相關。

雖然先前技術方法EP 12305537.8和EP 12306485.9係藉僅僅考察「原先」HOA表示法之方向性功率分配，為優勢聲源方向搜尋全部潛在候選，但本發明下述處理方式排除從原先HOA表示法搜尋各方向候選，因為全部組份均與原先發現的聲場之訊號相關。利用此項操作，在對聲場貢獻係高度方向性分散情況時，可避免誤檢測到眾多代替唯一正確聲源之問題。如前所述，如此效應會發生在含有以較N低階編碼的普通平面波之N階 HOA表示法。正如EP 12306485.9為優勢聲源方向找到的候選，再指派給先前發現的優勢聲源，最後按照統計聲源運動模式平順化。因此，和EP 12306485.9一樣，本發明處理方式提供時間上平順方向估計，且能夠捕獲突然方向變化，或開始發生新優勢聲音。

本發明處理方式對HOA表示法之接續時幅，按二順序處理方式，估計優勢聲源方向：從HOA表示法之現時時幅k，為優勢聲源方向接續搜尋候選或估計，並決定HOA表示法之組份，假設是由個別聲源所產生。在此搜尋過程之每次迭代中，從代表原先HOA表示法，除去與先前所發現聲源訊號相關的全部組份後，由剩餘HOA表示法計算各進一步之方向候選。在許多預界定測試方向選出現時方向候選，使剩餘HOA表示法之有關平面波功率，從選用方向碰撞到聆聽者位置，與全部其他測試方向相較為最大值。

其次，為現時時幅選擇的方向候選，指派給HOA係數先前時幅k-1中發現的優勢聲源。然後，藉進行Bayesian推理過程，計算最後方向估計，就所得時間軌道平順化，其中此Bayesian推理過程一方面開發統計上先驗聲源運動模式，另方面開始原先HOA表示法中優勢聲源組份之方向性功率分配。先驗聲源運動模式，可在先前時幅k-1和倒數第二時幅k-2間，從按先前時幅k-1的方向，以統計方式預估個別聲源的現時運動。

方向估計指派給HOA係數先前時幅(k-1)中發現的優勢聲源，係將方向估計和先前發現聲源方向成對間的角度聯合最小化，以及相對於方向估計和先前時幅內所見優勢聲源的成對方向性訊號間之相關係數絕對值最大化所完成。

原則上，本發明方法適於決定聲場的高階保真立體音響表示法(HOA)內不相關聲源之方向，該方法包括如下步驟：‧在HOA係數之現時時幅內，接續搜尋優勢聲源之初步方向估計，並計算由相對應優勢聲源產生的HOA聲場組份，又計算相對應方向性訊號；‧指派該計算的優勢聲源，給該HOA係數的先前時幅內活性的相對應聲源，係就該現時時幅之該初步方向估計，與該先前時幅內活性之聲源平順方向，進行比較，並令該現時時幅之該方向性訊號，與該先前時幅內活性之聲源方向性訊號相關，得指派函數；‧使用該指派函數，在該先前時幅內之該平順方向集合，該先前時幅內活性優勢聲源之指數集合，介於倒數第二時幅與該先前時幅間個別聲源運動角度集合，以及由相對應優勢聲源產生的該HOA聲場組份，計算平順化優勢聲源方向；‧使用該平順化優勢聲源方向，該先前時幅的活性優勢聲源方向之時幅延遲版本，以及該先前時幅的活性優勢聲源指數之時幅延遲版本，決定該現時時幅的活性優勢聲源之指數和方向；其中該先前時幅內活性聲源之方向性訊號，是使用模態匹配法，由該先前時幅的活性優勢聲源方向之該時幅延遲版本，和該先前時幅之HOA係數計算；又其中該倒數第二時幅和該先前時幅間之該聲源運動角度集合，是由該先前時幅的活性優勢聲源方向之該時幅延遲版本，及其進一步時幅延遲版本計算。

原則上，本發明裝置適於決定聲場的高階保真立體音響表示法(HOA)中不相關聲源之方向，該裝置包括：‧搜尋機構，適於在HOA係數之現時時幅內，接續搜尋優勢聲源之初步方向估計，並計算由相對應優勢聲源產生的HOA聲場組份，又計算相對應方向性訊號；‧指派機構，適於指派該計算的優勢聲源，給該HOA係數的先前時幅內活性的相對應聲源，係就該現時時幅之該初步方向估計，與該先前時幅內活性之聲源平順方向，進行比較，並令該現時時幅之該方向性訊號，與該先前時幅內活性之聲源方向性訊號相關，得指派函數；‧計算機構，適於使用該指派函數，在該先前時幅內之該平順方向集合，該先前時幅內活性優勢聲源之指數集合，介於倒數第二時幅與該先前時幅間個別聲源運動角度集合，以及由相對應優勢聲源產生的該HOA聲場組份，計算平順化優勢聲源方向；‧決定機構，適於使用該平順化優勢聲源方向，該先前時幅的活性優勢聲源方向之時幅延遲版本，以及該先前時幅的活性優勢聲源指數之時幅延遲版本，決定該現時時幅的活性優勢聲源之指數和方向；其中該先前時幅內活性聲源之方向性訊號，是使用模態匹配法，由該先前時幅的活性優勢聲源方向之該時幅延遲版本，和該先前時幅之HOA係數計算；又其中該倒數第二時幅和該先前時幅間之該聲源運動角度集合，是由該先前時幅的活性優勢聲源方向之該時幅延遲版本，及其進一步時幅延遲版本計算。

本發明有益之其他具體例，載於個別申請專利範圍附屬項內。

11‧‧‧初步搜尋優勢聲源方向和相關組份之HOA表示法

12‧‧‧計算先前活性優勢聲源之方向性訊號

13‧‧‧方向指派

14‧‧‧根據模式計算滑順優勢聲源方向

15‧‧‧決定現時活性優勢聲源之指數和方向

16‧‧‧聲源運動角度估計

171,172,173,174‧‧‧時幅延遲

21‧‧‧計算方向性功率分配

22‧‧‧分析優勢聲源存在

23‧‧‧搜尋優勢聲源方向

24‧‧‧計算優勢方向性訊號以及優勢聲源所產生聲場組份之HOA表示法

25‧‧‧計算剩餘HOA表示法

31‧‧‧在優勢聲源方向轉動均勻柵

32‧‧‧計算優勢聲源訊號和全部柵方向訊號

33‧‧‧從優勢聲源訊號進行預估柵方向訊號

34‧‧‧計算優勢聲源訊號之HOA表示法以及所預估組份

41‧‧‧為優勢聲源方向計算方向性可能函數

42‧‧‧為優勢聲源方向計算方向性先驗或然率函數

43‧‧‧為優勢聲源方向計算方向性後驗或然率函數

44‧‧‧決定平順化優勢聲源方向

第1圖為本發明處理方式方塊圖，用以估計高階保真立體音響訊號之優勢方向和不相關方向性訊號；第2圖為初步方向估計之細節；第3圖為計算優勢方向性訊號和優勢聲源產生的聲場之HOA表示法；第4圖為模式基礎計算平順化優勢聲源方向；第5圖為球形座標系統；第6圖為對不同保真立體音響階N和角度θ [0,π]之常態化分散函數ν _N (θ)。

茲參見附圖說明本發明具體例。

第1圖表示本發明方向追蹤處理方式之原理，說明如下。假設方向追蹤是基於HOA係數序列長度L的輸入時幅C(k)之接續處理方式，其中k為時幅指數。時幅就HOA係數序列界定，按「高階保真立體音響基本」節內方程式(45)特定為： fC(k)：=[c((kB+1)T _S )c((kB+2)T _S )...c((kB+L)T _S )], (1)

其中T _S指抽樣週期，而B L指示時幅移動。假設接續時幅有疊合，即B<L，合理但不必然。

在第一步驟或階段11，為優勢聲源初步分析，HOA表示法之第k個時幅C(k)。此項處理方式之詳細說明，見下述「初步方向搜尋」一節。特別是決定所檢測優勢方向性訊號數目，以及相對應初步方向估計。另外，計算(假設)由相對應個別優勢聲源產生的HOA聲場組份 , ，以及相對應瞬時方向性訊號 , (即普通平面波函數)。

個別初步方向估計和有關量值，按次序方式計算，即先d=1，其次d=2，依此類推。在第一步驟中，按EP 12305537.8所擬計算原先HOA表示法C(k)之方向性功率分配，並接續分析優勢聲源之存在。檢測優勢聲源情形時，計算個別初步方向估計。另外，估計相對應方向性訊號，連同假設由此聲源產生的現時時幅C(k)之組份。假設代表與方向性訊號相關之C(k)組份。最後，從C(k)減去 HOA組份，獲得剩餘HOA表示法。第d個(d 2)初步方向估計，按與第一個完全類比方式進行，只是C(k)改用剩餘HOA表示法。因而，明顯保證在進一行方向搜尋中，排除所發現第d個聲源產生之組份。

在方向指派步驟或階段13中，把步驟/階段11於第k個時幅所發現優勢聲源，指派給在第(k-1)時幅(假設)活性的相對應聲源。一方面，就現時時幅(k)之初步方向估計，與第(k-1)時幅內(假設)活性之平順化聲源方向(包含在集合 g _Ω,DOM,ACT (k-1)內，且其指數包含在集合 J _DOM,ACT (k-1)內)比較，完成指派。另方面，在時幅k開發指派所檢測優勢聲源的瞬時方向性訊號 , ，與第(k-1)時幅內(假設)活性的聲源方向性訊號 X _ACT (k-1)間之相關性。指派結果，以指派函數 f _A,k ：{1,..., }→{1,...,D}公式化，其中D指預期追蹤聲源之最大數，意即把第d個新發現聲源，指派給指數為 f _A,k (d)之先前活性聲源。

在以模式為基礎計算平順化優勢聲源方向步驟或階段14中，根據EP 12306485.9所擬統計學聲源運動模式，使用在時幅(k-1)的活性優勢聲源指數集合 J _DOM,ACT (k-1)，在時幅(k-1)的相對應優勢聲源檢測估計集合 g _Ω,DOM,ACT (k-1)，時幅(k-2)和(k-1)間個別聲源運動角度集合，假設是由所發現優勢聲源產生之HOA聲場組份 , ，以及指派函數 f _A,k，計算平順化優勢聲源方向 , 。此項模式為基礎的平順化製序詳細說明，見下述「模式為基礎以計算平順化優勢聲源方向」。

在最後步驟或階段15，使用由步驟/階段 14平順化優勢聲源方向 , ，以及含有假設在第時幅內活性的聲源平順化方向和個別指數之集合 g _Ω,DOM,ACT (k-1)和 J _DOM,ACT (k-1)，決定現時活性優勢聲源之指數和方向，假設分別包含在集合 J _DOM,ACT (k)和 g _Ω,DOM,ACT (k)內。此項運算之目的，不使為少數接續時幅尚未檢測的聲源假性失活。

步驟或階段12使用時幅k-1之HOA表示法C(k-1)，和假設在第(k-1)時幅內活性的平順化聲源方向集合 g _Ω,DOM,ACT (k-1)，進行計算假設在第(k-1)時幅內活性之聲源方向性訊號。計算是根據模態匹配原理，載於M.A.Poletti：〈根據球諧函數之三維度周圍聲音系統〉，J.Audio Eng.Soc.,vol.53(11)，第1004-1025頁，2005年。

在聲源運動角度估計步驟或階段16中，由假設分別在第(k-1)和第(k-2)時幅內活性的平順化聲源方向估計之二集合 g _Ω,DOM,ACT (k-1)和 g _Ω,DOM,ACT (k-2)，計算優勢活性聲源在時幅k-1之運動角度集合。已知運動是發生在時幅k-2和k-1之間。活性優勢聲源的運動角度，是在時幅k-2和時幅k-1的平順化方向估計間之弧度。備註：對於假設在時幅k-1活性的優勢聲源，若無法對時幅k-2做方向估計，個別運動角度可設定在π最大值。一般而言，若對第一時幅k和時幅k-1值尚未能啟動處理，則要在第1圖之諸步驟或階段輸入之相對應集合或數值，即分別為空白或設定於零。

此項運算造成此聲源次一方向之先驗或然率，即全部可能方向變成幾近均勻，參見下述「決定現時活性優勢聲源之指數和方向」一節。

時幅延遲171至174是把個別訊號延遲一個時幅。

以下詳述上述諸步驟和階段。

初步方向搜尋

在初步方向搜尋步驟/階段11，估計現有優勢聲源數(在時幅k內)，和個別方向 , 。另外，計算假設由個別聲源產生的 HOA聲場組份,，以及相對應方向性訊號 , (即普通平面波函數)。先就方向指數d=1計算全部先前列舉數量，再就d=2，依次直到。

單一方向d指數之計算程序如第2圖所示。第(d-1)方向估計後(相對於對第k時幅之第d方向估計)產生的剩餘HOA表示法，即輸入至此階段。因而可知在迴路開始時，相當於原先HOA時幅C(k)。在第一步驟或階段21中，為預定數Q的分立測試方向Ω _q,q=1,...,Q，計算剩餘HOA表現法之方向性功率分配p ^(d) (k)，幾近均勻分配於單位球體上。更具體而言，各測試方向Ω _q界定為向量，含傾角 θ _q [0,π]和方位角 [0,2π]，按照

其中(．) ^T指易位。方向性功率分配以向量表示：

其組份指對於第k時幅，有關方向Ω _q的表現法中剩下全部優勢聲源之聯合功率。從實際計算方向性功率分配 p ^(d) (k)，可按照EP 12305537.8所擬進行。

在步驟或階段22，為優勢聲場之存在，分析方向性功率分配 p ^(d) (k)。檢測優勢聲源之一種方式，載於下述「優勢聲源存在之分析」一節。若測知無優勢聲源存在，即停止方向搜尋，把發現優勢方向之總數設定於。否則，若檢測到優勢聲源，在步驟或階段23 計算其相對於座標原點的方向，詳見下述「搜尋優勢聲源方向」一節。

接著，在步驟或階段24計算個別方向性訊號，以及假設由第d優勢聲源產生的聲場組份之 HOA表示法，詳見下述「計算優勢方向性訊號以及由優勢聲源產生的聲場之HOA表示法」一節。

最後，在步驟或階段25，從減去，而得剩餘HOA表示法，用來搜尋次一(即第(d+1)個)方向性聲源。於是，明顯確定在進一步方向搜尋時，排除第d個聲源產生之聲場組份。

分析優勢聲源存在

為檢測以表示的聲場內有優勢聲源存在，考慮剩餘HOA表示法之方向性功率分配 p ⁽¹⁾ (k),...,p ^(d) (k)。一方面，已經實驗發現合理監驗變方比

可視為是剩餘HOA表示法表示之聲場，比初始HOA表示法C(k)所表示聲場重要的量度。小比表示HOA表示法表示之聲源無一被視為優勢。

另方面，亦合理關注常態化方向性功率分配和之變方比

常態化方向性功率分配

之諸元素 ,q=1,...,Q， 賴有 p ^(d) (k)界定如下：

變方可視方向性功率分配 p ^(d) (k)之均勻性量度。具體而言，變方愈小，分配於全部入射方向的功率愈均勻。在空間擴散雜訊的有限情況下，變方值應趨近零。基於此等考量，變方比表示HOA表示法分配是否比更均勻。

綜合上述考量，可假設在C(k)表示之聲場內，始終至少有單一優勢聲源存在，即 1。若變方比數值維持高於某一預定臨限值 ε _p <1，且變方比之數值小於一，則檢測進一步優勢聲源(對於d 2)，亦即若：

則檢測優勢聲源。

ε _p值係就「優勢」意義的解釋而設定。本發明人等已發現合理的選擇是ε _p=10^-3。

搜尋優勢聲源方向

俟檢測第d個聲源後，採用方向性功率分佈 p ^(d) (k)，搜尋其方向之初步預估。搜尋之完成是取得方向性功率最大的測試方向Ωq，即

計算優勢方向性訊號和優勢聲源產生的聲場之HOA表示法

隨即於決定優勢聲源方向之初步估計後，按照第3圖計算個別方向性訊號，以及假設由同一聲場產生的聲場組份之HOA表示法。在步驟或階段31，由O抽樣位置 Ω _INIT,o ,o=1,...,O 組成的固定預定球形柵 g _Ω,INIT，假設在單位球體上幾近均勻分配，轉動到由所轉動抽樣位置 ,o=1,...,O 組成的柵。進行轉動是使第一個轉動抽樣位置相當於初步方向估計。

在步驟或階段32，把HOA表示法轉換到所謂空間域，同樣以O平面波函數(亦稱為柵方向性訊號) ,o=1,...,O 表示，假設從轉動柵方向 ,o=1,...,O 碰撞到觀察者位置(即座標原點)。

為計算平面波函數 ,o=1,...,O ，要計算關於轉動柵方向之模態矩陣，如：

其中

假設各柵方向性訊號是由第k時幅的個別樣本組成的列向量，如：

其中L指所分析HOA表示法之(樣本中)長度，則全部柵方向性訊號之計算，是由球諧函數轉換式(詳見下述「球諧函數轉換式」說明)完成，如：

由於優勢聲場方向之初步估計，相當於轉動抽樣位置，則普通平面波函數可視為所需優勢方向性訊號，即

為決定由第d個聲源產生的組份，假設此組份同樣以平面波函數表示，可在步驟或階段33 由預估。因此，柵方向性訊號 ,o=2,...,O 嘗試從預估。所預估訊號以 ,o=2,...,O 標示。

完成此項預估之一方式是，假定預估訊號 ,o=2,...,O 要從產生，利用線性過濾，於此決定過濾器，使預估錯誤減到最少。若過濾器假設為期限很短(較之分析時幅)之有限脈衝回應(FIR)過濾器，則可用技術上已知之最小平方技術，達成預估錯誤最少。

最後，在步驟或階段34，利用反逆球諧函數轉換式(見下述「球諧函數轉換式」一節)，獲得優勢聲源訊號之HOA表示法，以及全部預估相關組份，如：

計算先前活性優勢聲源之方向性訊號

假設在第(k-1)時幅活性的聲源之方向性訊號，包含在方程式(20)之矩陣 X _ACT (k-1)內。此矩陣是使用模態匹配原理(見上述Poletti論文)，由下式計算： X _ACT (k-1)=(Ξ _ACT (k-1)) ^-1 C(k-1), (16)

其中C(k-1)指原先HOA聲場表示法之第(k-1)時幅，而 Ξ _ACT (k-1)指關於假設在第(k-1)時幅內活性的聲源方向 , d'=1,...,D _ACT (k-1)之模態矩陣。模態矩陣 Ξ _ACT (k-1)是利用下式計算：其中 S _ACT,d ,(k)：=

方向指派

如前所述，一方面，第1圖內步驟/階段13 的指派，是由初步方向估計與假設在第(k-1)時幅內活性之平順化聲源方向比較而完成，包含在下式集合內：

其中 i _ACT,k-1 (d')指假設第(k-1)時幅內活性之第d'個聲源指數。具體而言，假設初步方向估計與平順化方向成對間之角度

愈小，第d個新發現優勢聲源方向更輕易相當於指數 i _ACT,k-1 (d')之先前活性聲源。

另方面，為了指派，開發在時幅k所檢測優勢聲源的瞬時方向性訊號 , ，與假設在第(k-1)時幅內活性的聲源方向性訊號 X _ACT (k-1)間之相關性。於此假設時幅 X _ACT (k-1)是由假設在第(k-1)時幅內活性的聲源個別方向性訊號所組成，如：

使用此定義，可假定二訊號和間相關性係數之絕對值

愈高，第d個新發現優勢聲源方向會更輕易相當於指數 i _ACT,k-1 (d')的先前活性聲源。如此假定可由事實上，相關性係數提供二訊號間之線性依賴性證明正當。

基於此等考量，計算特定指派之指派函數： f _A,k ：{1,..., }→{1,...,D}

使下列成本函數(21)減到最小：

明顯假設對不屬於第(k-1)時幅內任何活性聲源之方向指數 d" {1,...,D}\J _DOM,ACT (k-1)角度

實際上設定在最小角度 Θ _MIN，例如 Θ _MIN =2π/N 。再者，對方向指數 d" {1,...,D}\J _DOM,ACT (k-1)而言，其相關係數

實際上設定於零。第一次運算的效應是，如果第d個新發現方向與全部先前活性優勢聲源方向間的角度，大於 Θ _MIN，則此新發現方向有益於屬於新聲源。

指派問題可使用公知匈牙利演算法解答，參見H.W.Kuhn〈指派問題之匈牙利方法〉，Naval研究邏輯學季刊，第2卷(1-2)，第83-97頁，1955年。

模式基礎計算平順化優勢聲源方向

此節旨在按照統計學聲源運動模式，在第1圖之步驟/階段14內計算平順化優勢聲源方向。此項計算之個別步驟如第4圖所示，詳後。

為優勢聲源方向計算方向性先驗或然率函數

在步驟或階段42為新發現優勢聲源方向，計算方向性先驗或然率函數，，使用：‧在時幅(k-1)的活性優勢聲源指數 i _ACT,k-1 (d'),d'=1,...,D _ACT (k-1)之集合 J _DOM,ACT (k-1)；‧在時幅(k-1)的相對應優勢聲源方向估計 ,d'=1,...,D _ACT (k-1)之集合； ‧介於時幅(k-2)和(k-1)間的個別聲源運動角度 ,d'=1,...,D _ACT (k-1)之集合；‧以及指派函數 f _A,k。

此項計算是根據EP 12306485.9所介紹簡單聲源運動預估模式。具體言之，假設對第d個新發現優勢聲源之方向性先驗或然率函數，是在三維度空間內單位球體上的分配之分立版本。

以下假設方向性先驗或然率函數，是由對個別測試方向 Ω _q ,q=1,...,Q 的或然率組成的向量所賦予，如：

要為個別測試方向Ω _q計算先驗或然率，需分辨二種情況：

(a)若指派給第d個新發現優勢聲源之聲源指數 f _A,k (d)，是包含在集合 J _DOM,ACT (k-1)內，則先驗或然率按下式計算：

其中 Θ _q,d (k)指估計方向與測試方向Ω _q間之角度：

又，κ _d (k)指濃度參數，是使用聲源運動角度估計計算，按照：

其中C _D可設定為

已知K _MAX和C _R的合理數值(見EP 12306485.9)為κ _MAX =8,C _R =0.5. (27)

此項計算背後的原理是，增加先驗或然率函數之濃度，事先運動的聲源較少。如果聲源事先運動很多，其接續方向之不確定性就高，因此濃度參數必須達成小數值。

(b)如果指派給第d個新發現優勢聲源的聲源指數 f _A,k (d)，不包含在集合 J _DOM,ACT (k-1)內，則個別聲源被視為事先尚不具活性。因此，實際上無此聲源方向之先驗知識。因此，假設先驗或然率函數，在單位球體上均勻，其中個別或然率對全部測試位置Ω _q均相等，即

為優勢聲源方向計算方向性可能函數

方向性可能函數 , ，是在步驟或階段41計算，使用HOA聲場組份 , (假設是由個別新檢測優勢聲源所產生)，以及指派函數 f _A,k。假設方向性可能函數是個別測試方向 Ω _q ,q=1,...,Q 的可能函數組成之向量，如：

計算之個別可能函數，如EP 12305537.8所述，是從測試方向Ω _q碰撞的普通平面波功率之近似值。具體而言，

其中 S _TEST,q ：=

指關於測試方向Ωq的模態向量(其中表示真值球諧函數，如下述「真值球諧函數定義」一節所界定)，又其中：

表示關於HOA表示法之HOA係數間相關性矩陣。

為優勢聲源方向計算方向性後驗或然率函數

方向性後驗或然率函數 , ，是在步驟或階段43計算，使用方向性先驗或然率函數 , ，和方向性可能函數 , 。於此再次假設方向性後驗或然率函數，是對個別測試方向 Ω _q ,q=1,...,Q 的後驗或然率組成之向量，即

個別後驗或然率是按照 Bayesian規則計算(見EP 12306485.9)，即：

假設固定方向指數d，方程式(34)的分母對各測試方向Ω _q均為常數。為下述方向搜尋之目的，其中只有後驗或然率函數最大值才有意義，如此全局標度則不相干。因此，須知方程式(34)分母之計算，可完全免除，以節省計算功率。

計算平順化優勢聲源方向

平順化優勢聲源方向 , ，是在步驟或階段44內計算，使用後驗或然率函數 , 。具體而言，為時幅k所發現第d 個聲源之平順化方向，是搜尋後驗或然率函數中之最大值而得，即：

決定現時活性優勢聲源之指數和方向

在第1圖的步驟或階段15，使用在時幅(k-1)的全部活性優勢聲源方向平順化估計 ,d'=1,...,D _ACT (k)之集合 g _Ω,DOM,ACT (k-1)，相對應指數 i _ACT,k-1 (d'),d'=1,...,D _ACT (k-1)之集合 J _DOM,ACT (k-1)，以及為時幅k所得平順化優勢聲源方向估計 , ，計算在時幅k的全部 D _ACT (k)活性優勢聲源指數 i _ACT,k (d'),d'=1,...,D _ACT (k)之集合 J _DOM,ACT (k)，以及在時幅k的相對應優勢聲源方向估計 ,d'=1,...,D _ACT (k-1)之集合 g _Ω,DOM,ACT (k)。此項運算之目的，在於對少數接續時幅未檢測到聲源不會有假性失活，原本對例如響板(產生脈衝般聲音，在個別脈衝間有短暫停頓)等聲源會發生。因此，可合理使假設在前一次(即第(k-1))時幅內活性的聲源失活，只要尚未檢測到預定數量 K _INACT的接續時幅。按照前述考量，第一步驟計算在時幅(k-1)的全部 D _ACT (k-1)活性優勢聲源的指數 i _ACT,k-1 (d'),d'=1,...,D _ACT (k-1)集合 J _DOM,ACT (k-1)，和全部新檢測聲源的指數集合

之聯合集合 J _JOINED (k)，即：puted：J _JOINED (k)：=J _NEW (k)U J _DOM,ACT (k-1). (37)

由此集合得所需集合 J _DOM,ACT (k)，即從 J _JOINED (k)除去尚未檢測到 K _INACT先前接續時幅數量的聲源指數。在時幅k的活性優勢聲源數 D _ACT (k)即設定於 J _DOM,ACT (k)的元素數。

最後，由下式

決定優勢聲源方向估計 ,d'=1,...,D _ACT (k)，其中 i _ACT,k (d')指示 J _DOM,ACT (k)元素。意即如果在時幅k未新檢測到個別聲源，先前活性優勢聲源之方向即保持固定。

高階保真立體音響之基礎

高階保真立體音響(HOA)係基於假設無聲源的有用精簡面積內之聲場說明。在此情況，在時間t和有用面積內位置x之聲壓p(t,x)之空間時間行為，實體上完全以均相波方程式決定，以下假設球形座標系統如第5 圖所示。在所用座標系統中，x軸指向前方位置，y軸指向左方，而z軸向指向頂部。空間內的位置 x=(r,θ, ) ^T，以半徑 r>0(即與座標原點之距離)，從極軸z測得之傾角 θ [0,π]，以及在x-y平面從x軸反時鐘方向測得之方位角 [0,2π]表示。(．) ^T指轉位。

然則，可見(參照E.G.Williams《傅立葉聲學》，應用數學科學第93卷，學術出版社，1999年)聲壓相對於時間的傅立葉轉換式，以 F _t (．)表示，即

(其中ω指角頻，i指虛單位)，可按照下式展開成一系列球諧函數

在方程式(40)中，c _s指聲速，k指角波數，與角頻ω的關係為指第一種球形Bessel函數，而指n階m度的真值球諧函數，在下述「真值球諧函數之定義」一節中界定。展開係數僅視角波數k而定。顯然假設聲壓在空間上受頻帶限制。因此，系列是就階指數n在上限N截頭，稱為HOA表現法之階。

若聲場以來自角維(θ,)所特定全部可能方向的不同角頻之無限數量諧和平面波疊合表示，即表示(參見B.Rafaely〈球體上的聲場利用球形迴旋之平面波分解〉，J.Acoust.Soc.Am.，第4卷(116)，第2149-2157頁，2004年)個別平面波複合振幅函數 C(ω,θ, )，即可以下式球諧函數展開式表示：

其中展開係數與展開係數之關係為：

假設個別係數為角頻ω之函數，應用反逆傅立葉轉換式(以 F ^-1 (．)表示)，對各n階m度提供時間域函數：

以逐一 c(t)集在單一向量內：

向量 c(t)內時間域函數之位置指數，為n(n+1)+1+m。向量 c(t)內元素總數為O=(N+1)²。

最後保真立體音響格式提供 c(t)之抽樣版本，使用抽樣頻率 f _S，即：

其中 T _S =1/f _S指抽樣期間。 c(lT _S )諸元素稱為保真立體音響係數。時間域訊號和因此保真立體音響係數均為真值。

真值球諧函數之定義

真值球諧函數以下式表示：其中

關聯之Legendre函數 P _n,m (x)界定如下：

具有Legendre多項式 P _n (x)，與上述E.G.Williams教科書不同，即無Condon-Shortley相項(-1) ^m。

高階保真立體音響之空間解析度

來自方向的普通平面波函數 x(t)，由下式以HOA表示：

平面波振幅 c(t,Ω)：=F _t ^-1 (C(ω,Ω))之相對應空間密度為：

從方程式(51)可見普通平面波函數 x(t)和空間分散函數 ν _N (Θ)之乘積，僅視Ω和Ω ₀間之角度θ而定，其性質為：

預料得到在無限階的限度內，即N→∞，空間分散函數轉成狄喇克δ函數δ(．)，即：

然而，以有限階N情況言，來自方向Ω ₀的普通平面波之貢獻，漸消到隔鄰方向，其模糊程度隨階增加而遞減。對N不同數值的常態化函數 ν _N (Θ)描圖，如第6圖所示。對任何方向Ω言，平面波振幅的空間密度之時間域行為，是其在任何其他方向的行為之倍數。尤其是對某些固定方向Ω ₁和Ω ₂之函數 c(t,Ω ₁ )和 c(t,Ω ₂ )，彼此關於時間t有高度相關。

球諧函數轉換式

若平面波振幅之空間密度，在許多O空間方向 Ω _o ,1 o O 分立化，幾近均勻分配於單位球體上，即得O方向性訊號 c(t,Ω _o )。把此等訊號集成向量：asc _SPAT (t)：=[c(t,Ω ₁ )...c(t,Ω _O )] ^T , (54)

使用方程式(50)可驗證，此向量可從方程式(44)界定的連續保真立體音響 d(t)，利用簡單矩陣乘法計算： c _SPAT (t)=Ψ ^H c(t), (55)

其中(．) ^H表示聯合換位和共軛，而 Ψ 指模態矩陣，界定為： Ψ：=[S ₁ ...S _O ](56)

其中

因為方向Ω ₀是幾近均勻分配於單位球體，故模態矩陣一般可顛倒。因此，連續保真立體音響表示法可從方向性訊號 c(t,Ω _o )，利用下式計算： c(t)=Ψ ^-H c _SPAT (t) (58)

二方程式構成保真立體音響表示法和「空間域」間之轉換式和逆轉換式。此等轉換式分別稱為球諧函數轉換式和反逆球諧函數轉換式。因為方向Ω ₀幾近均勻分配於單位球體，就有近似值：

判定使用 Ψ ^-1代替方程式(55)中之 Ψ ^H為正確。所有上述關係式對分立時間域也是有效。

本發明處理方式可利用單一處理器或電子電路，或利用數個處理器或電子電路進行，並行操作和/或在本發明處理方式之不同組件上操作均可。

Claims

一種聲場的高階保真立體音響(HOA)表示法中不相關聲源方向之決定方法，包含：在HOA係數的現前時幅中，搜尋優勢聲源的初步方向估計；並且根據對應優勢聲源決定HOA聲場組份，其中根據剩餘HOA表示法決定現前方向估計，該剩餘HOA表示法代表原始HOA表示法中與先前發現之聲源方向性訊號的全部組份已經移除者,其中根據從一方向碰撞到聆聽者位置的剩餘HOA表示法之普通平面波功率，相對於所有其他測試方向之個別功率，從由一組預定測試方向中選出該現前方向估計，並且其中HOA係數的該現前時幅之該現前方向估計，係指派給在HOA係數的先前時幅內的至少一優勢聲源，並且相對於時間軌道而平順化。
如申請專利範圍第1項之方法，其中該平順化係根據Bayesian推論過程進行，其利用統計先驗聲源移動模式，以及該原始HOA表示法的該優勢聲源組份之方向性功率分布。
如申請專利範圍第2項之方法，其中該統計先驗聲源移動模式是根據在該先前時幅內之方向，以及介於該先前時幅和倒數第二時幅之間的移動，以統計方式預估個別聲源之移動。
如申請專利範圍第2項之方法，其中該現前方向估計指派給HOA係數之先前時幅的優勢聲源係根據方向估計和先前發現聲源方向成對之間角度的聯合最小化，以及與方向估計有關的方向性訊號和HOA係數的該先前時幅中發現之優勢聲源有關的方向性訊號的成對之間的相關性係數絕對值最大化。
一種聲場的高階保真立體音響(HOA)表示法中不相關聲源方向之決定方法，包含步驟為：在HOA係數之現前時幅內，搜尋優勢聲源之初步方向估計，以及根據對應優勢聲源，決定HOA聲場組份，並決定對應方向信號；根據該現前時幅的初步方向估計，以及在該先前時幅中主動之聲源的平順化方向之比較，將該優勢聲源指派給在該HOA係數的先前時幅中主動的對應聲源，其中該指派係進一步根據該現前時幅的方向性信號，和在該先前時幅中主動的聲源之方向性信號之間的關係，產生指派函數；根據該指派函數，在該先前時幅中之平順化優勢聲源方向，在該先前時幅中主動優勢聲源之指數，該倒數第二時幅與該先前時幅之間的個別源移動角度，以及根據該對應優勢聲源的該HOA聲場組份，決定該平順化優勢聲源方向；根據該平順化優勢聲源方向，該先前時幅之該主動優勢聲源之方向的幅延遲版本，以及該先前時幅之該主動優勢聲源之指數的幅延遲版本，決定該現前時幅之該主動優勢聲源的指數與方向，其中在該先前時幅中主動的聲源之該方向性信號，是基於該先前時幅的該主動優勢聲源之方向的幅延遲版本，以及該先前時幅之HOA係數的模態匹配所決定，其中在該倒數第二時幅與該先前時幅之間的該源移動角度是基於該先前時幅之該主動優勢聲源的方向之幅延遲版本，以及其進一步的幅延遲版本所決定。
如申請專利範圍第5項之決定方法，其中進一步包含決定所檢測優勢方向性信號以及對應初步方向估計，進一步包含：從HOA係數之該現前時幅，減去由該對應優勢聲源，以獲得對應剩餘HOA表示法，其中該減法處理針對進一步之聲場組份，每次根據剩餘HOA表示法重複進行，其中該聲場組份在進一步方向搜尋中排除。
如申請專利範圍第6項之決定方法，進一步包含決定幾近均勻分布在單位球體上之預定數量的離散測試方向之表示法，其中針對優勢聲源之出現而分析方向性功率分布，並且根據確定偵測到優勢聲源消失，停止該方向搜尋，並根據確定偵測到優勢聲源，決定相對於座標原點之方向的初步估計。
如申請專利範圍第7項之決定方法，其中根據相同的該聲源之相對方向性信號，以及該聲場組份之該HOA表示法係根據下列步驟決定：轉動由抽樣位置組成之固定預定球形柵，其中該抽樣位置係均勻分配於該單位球體上，以決定轉動抽樣位置之柵，其中該轉動係實施使第一轉動抽樣位置對應於該初步方向估計；把該剩餘HOA表示法轉換到空間域，並決定優勢聲源訊號和柵方向訊號；從該優勢聲源訊號，實施預估該柵方向性訊號；並且根據反球狀諧波函數轉換，決定該預估柵方向性訊號之HOA表示法，其表示該優勢聲源對該剩餘HOA表示法所表示之聲場的貢獻。
如申請專利範圍第5項之方法，其中該平順化優勢聲源方向係由以下步驟決定：根據該指派函數，在該先前時幅內之該平順化優勢聲源方向，在該先前時幅內之主動優勢聲源的指數，以及該源移動角度決定優勢聲源方向之方向性先驗或然率函數；根據該指派函數和由優勢聲源所創建之該HOA聲場組份，決定優勢聲源方向的方向性可能函數；根據方向性可能函數以及方向性先驗或然率函數，決定優勢聲源方向之方向性後驗或然率函數；根據優勢聲源方向之該方向性後驗或然率函數，決定平順化優勢聲源方向。
一種決定在聲場的高階保真立體音響(HOA)表示法中不相關聲源方向之裝置，包含：處理器，其組構以在優勢聲源之HOA係數初步方向估計之現前時幅內搜尋，並基於對應優勢聲源決定HOA聲場組份，該處理器進一步組構以決定對應方向性信號；其中該處理器係進一步組構以根據該現前時幅之該初步方向估計與該先前時幅內主動之聲源平順化方向的比較，指派該優勢聲源至該HOA係數的先前時幅內主動的對應聲源，其中該指派係進一步根據該現前時幅之方向性信號與該先前時幅內主動之聲源的方向性信號之關聯，達到指派函數；其中該處理器進一步組構以根據該指派函數，在該先前時幅中之平順化優勢聲源方向，在該先前時幅中主動優勢聲源之指數，該倒數第二時幅與該先前時幅之間的個別源移動角度，以及根據該對應優勢聲源的該HOA聲場組份，決定該平順化優勢聲源方向，其中該處理器進一步組構以根據該平順化優勢聲源方向，該先前時幅之該主動優勢聲源之方向的幅延遲版本，以及該先前時幅之該主動優勢聲源之指數的幅延遲版本，決定該現前時幅之該主動優勢聲源的指數與方向，其中在該先前時幅中主動的聲源之該方向性信號，是基於該先前時幅的該主動優勢聲源之方向的幅延遲版本，以及該先前時幅之HOA係數的模態匹配所決定，並且其中在該倒數第二時幅與該先前時幅之間的該源移動角度是基於該先前時幅之該主動優勢聲源的方向之幅延遲版本，以及其進一步的幅延遲版本所決定。