TW201448616A - 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置 - Google Patents

聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置 Download PDF

Info

Publication number
TW201448616A
TW201448616A TW103104224A TW103104224A TW201448616A TW 201448616 A TW201448616 A TW 201448616A TW 103104224 A TW103104224 A TW 103104224A TW 103104224 A TW103104224 A TW 103104224A TW 201448616 A TW201448616 A TW 201448616A
Authority
TW
Taiwan
Prior art keywords
sound source
time frame
dominant
hoa
dominant sound
Prior art date
Application number
TW103104224A
Other languages
English (en)
Other versions
TWI647961B (zh
Inventor
Alexander Kruger
Sven Kordon
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of TW201448616A publication Critical patent/TW201448616A/zh
Application granted granted Critical
Publication of TWI647961B publication Critical patent/TWI647961B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Abstract

高階保真立體音響(HOA)代表三維度聲音。HOA提供高度空間解像度,並便於分析關於優勢聲源之聲場。本發明旨在識別構成聲場的獨立優勢聲源,並追蹤其時間軌道。已知之應用是藉察看原先HOA表示法之方向性功率分配,為優勢聲源方向搜尋全部潛在候選,而在本發明中,與先前已知聲源訊號相關之全部組份均已除去。利用如此操作,在對聲場的分配在方向上大為分散情況下,可以避免誤測眾多而非唯一正確聲源之問題。

Description

聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置
本發明係關於在聲場之高階保真立體音響表示法中,決定不相關聲源方向之方法和裝置。
高階保真立體音響(HOA)貢獻一種可能性,在像波場合成(WFS)的其他技術,或像22.2的通道基礎之方略當中,代表三維度聲音。惟與通道基礎方法呈對比的是,HOA表示法貢獻的優點是,與特殊揚聲器設置無關。然而此項通融性是以解碼過程為代價,需在特定揚聲器設置上,回放HOA表示法。與WFS方略相較,所需揚聲器數量往往很大,HOA亦可描繪於只有少量揚聲器組成的裝置。HOA又一優點是亦可採用同樣表示法,對頭戴耳機之雙耳描繪不需任何修飾。
HOA是根據利用平截球諧函數(SH)展開的複合諧平面波振幅之空間密度表示法,各展開係數是角頻的函數,可同等利用時間域函數表示。因此,不失一般性,完整HOA聲場表示法實際上可假設包含O時間域函數,其中O指展開係數之數量。以下,此等時間域函數稱為HOA係數序列或HOA通道。
HOA有潛勢可提供高度空間解像度,改進展開之成長最高階N。此貢獻可能性,可以分析關於優勢聲源之聲場。
應用上是如何從HOA表示法去識別構成聲場的獨立優勢聲源,和如何追蹤其時間軌道。例如專利申請案EP 12305537.8所述,利用聲場分解成優勢方向性訊號和剩餘週遭組份,供HOA表示法之壓縮,就需要 此等操作。此等方向追蹤法又一應用,是粗略的初步原始分離。對於HOA聲場記錄的後製作,亦可使用估計之方向軌道,以放大或減弱特殊聲源之訊號。
EP 12305537.8擬議接續進行下述三種操作:‧識別時幅內現時存在的優勢聲源數量,並搜尋相對應方向。優勢聲源數量是由HOA通道交叉相關矩陣之本徵值決定。為搜尋優勢聲源方向,評估方向性功率分配,相當於固定大量預界定測試方向之HOA係數幅。在方向性功率分配尋找最大值,可得第一次方向估計。然後,順序重複下述二項操作,以找出剩餘之識別方向:從剩餘之測試方向集合,消除空間鄰區之測試方向,和所得集合用來搜尋方向性功率分配之最大值;‧把估計的方向指派給在最後時幅視為活性之聲源;‧在指派之後,進行方向估計之適當平滑,以獲得時間上平順之方向軌道。
然而,雖然以如此處理過程,藉計算指數式加權運動平均值,原則上可完成方向估計之時間平順,惟此項技術的缺點是,不能準確捕獲突然方向變化或開始出現新的優勢聲音。
為克服此問題,專利申請案EP 12306485.9倡議引進簡單的統計聲源運動預估模式,採用於以Bayesian學習原則實施之統計上動機平順法。惟EP 12306485.9和EP 12305537.8只從方向性功率分配對聲源方向計算可能函數。此項分配表示從單元球體上幾近均勻分配取樣點所特定方向之大量普通平面波功率。並未提供來自不同方向的普通平面波間彼此相關之任何資訊。
實務上,HOA表示法之N階往往有限,造成空間上頻帶受限之聲場。具體而言,此意味方向性聲場對方向性功率分配之貢獻,在鄰區方向之真正入射方向週圍變模糊。此模糊效應在數學上稱為「分散函數」,參見下述〈高階保真立體音響之空間解像度〉一節。其程度隨HOA表示法降階而成長。EP 12306485.9和EP 12305537.8方法追蹤法,某種程度考慮到此效應,把方向搜尋拘限在先前所發現方向之鄰區外側。然而,鄰區的規格假設全部聲源都是以HOA表示方法之全階N編碼。此項假設違 反含以低於N階編碼的普通平面波之N階HOA表示法。此等低於N階的普通平面波會是藝術創作的結果,使聲源呈現更寬。然而亦發生在利用球形麥克風記錄之HOA聲場表示法。
EP 12306485.9和EP 12305537.8方向追蹤法會識別超過單一的聲源,若聲場是由較N低階的單一普通平面波組成,其性能不良。
本發明欲解決之問題是,改進HOA聲場內優勢聲源之決定,可追蹤其時間軌道。此問題是利用申請專利範圍第1、2和6項解決。利用申請專利範圍第6項方法之裝置,則列於申請專利範圍第7項。
本發明改進EP 12306485.9處理方式。本發明處理方式是尋找獨立之優勢聲源,並經時追蹤其方向。「獨立優勢聲源」表示個別聲源之訊號不相關。
雖然先前技術方法EP 12305537.8和EP 12306485.9係藉僅僅考察「原先」HOA表示法之方向性功率分配,為優勢聲源方向搜尋全部潛在候選,但本發明下述處理方式排除從原先HOA表示法搜尋各方向候選,因為全部組份均與原先發現的聲場之訊號相關。利用此項操作,在對聲場貢獻係高度方向性分散情況時,可避免誤檢測到眾多代替唯一正確聲源之問題。如前所述,如此效應會發生在含有以較N低階編碼的普通平面波之N階HOA表示法。正如EP 12306485.9為優勢聲源方向找到的候選,再指派給先前發現的優勢聲源,最後按照統計聲源運動模式平順化。因此,和EP 12306485.9一樣,本發明處理方式提供時間上平順方向估計,且能夠捕獲突然方向變化,或開始發生新優勢聲音。
本發明處理方式對HOA表示法之接續時幅,按二順序處理方式,估計優勢聲源方向:從HOA表示法之現時時幅k,為優勢聲源方向接續搜尋候選或估計,並決定HOA表示法之組份,假設是由個別聲源所產生。在此搜尋過程之每次迭代中,從代表原先HOA表示法,除去與先前所發現聲源訊號相關的全部組份後,由剩餘HOA表示法計算各進一步之方向候選。在許多預界定測試方向選出現時方向候選,使剩餘HOA表示法之有關平面波功率,從選用方向碰撞到聆聽者位置,與全部其他測試方向相較為最大值。
其次,為現時時幅選擇的方向候選,指派給HOA係數先前 時幅k-1中發現的優勢聲源。然後,藉進行Bayesian推理過程,計算最後方向估計,就所得時間軌道平順化,其中此Bayesian推理過程一方面開發統計上先驗聲源運動模式,另方面開始原先HOA表示法中優勢聲源組份之方向性功率分配。先驗聲源運動模式,可在先前時幅k-1和倒數第二時幅k-2間,從按先前時幅k-1的方向,以統計方式預估個別聲源的現時運動。
方向估計指派給HOA係數先前時幅(k-1)中發現的優勢聲源,係將方向估計和先前發現聲源方向成對間的角度聯合最小化,以及相對於方向估計和先前時幅內所見優勢聲源的成對方向性訊號間之相關係數絕對值最大化所完成。
原則上,本發明方法適於決定聲場的高階保真立體音響表示法(HOA)內不相關聲源之方向,該方法包括如下步驟:‧在HOA係數之現時時幅內,接續搜尋優勢聲源之初步方向估計,並計算由相對應優勢聲源產生的HOA聲場組份,又計算相對應方向性訊號;‧指派該計算的優勢聲源,給該HOA係數的先前時幅內活性的相對應聲源,係就該現時時幅之該初步方向估計,與該先前時幅內活性之聲源平順方向,進行比較,並令該現時時幅之該方向性訊號,與該先前時幅內活性之聲源方向性訊號相關,得指派函數;‧使用該指派函數,在該先前時幅內之該平順方向集合,該先前時幅內活性優勢聲源之指數集合,介於倒數第二時幅與該先前時幅間個別聲源運動角度集合,以及由相對應優勢聲源產生的該HOA聲場組份,計算平順化優勢聲源方向;‧使用該平順化優勢聲源方向,該先前時幅的活性優勢聲源方向之時幅延遲版本,以及該先前時幅的活性優勢聲源指數之時幅延遲版本,決定該現時時幅的活性優勢聲源之指數和方向;其中該先前時幅內活性聲源之方向性訊號,是使用模態匹配法,由該先前時幅的活性優勢聲源方向之該時幅延遲版本,和該先前時幅之HOA係數計算;又其中該倒數第二時幅和該先前時幅間之該聲源運動角度集合,是由該先前時幅的活性優勢聲源方向之該時幅延遲版本,及其進一步時幅延遲 版本計算。
原則上,本發明裝置適於決定聲場的高階保真立體音響表示法(HOA)中不相關聲源之方向,該裝置包括:‧搜尋機構,適於在HOA係數之現時時幅內,接續搜尋優勢聲源之初步方向估計,並計算由相對應優勢聲源產生的HOA聲場組份,又計算相對應方向性訊號;‧指派機構,適於指派該計算的優勢聲源,給該HOA係數的先前時幅內活性的相對應聲源,係就該現時時幅之該初步方向估計,與該先前時幅內活性之聲源平順方向,進行比較,並令該現時時幅之該方向性訊號,與該先前時幅內活性之聲源方向性訊號相關,得指派函數;‧計算機構,適於使用該指派函數,在該先前時幅內之該平順方向集合,該先前時幅內活性優勢聲源之指數集合,介於倒數第二時幅與該先前時幅間個別聲源運動角度集合,以及由相對應優勢聲源產生的該HOA聲場組份,計算平順化優勢聲源方向;‧決定機構,適於使用該平順化優勢聲源方向,該先前時幅的活性優勢聲源方向之時幅延遲版本,以及該先前時幅的活性優勢聲源指數之時幅延遲版本,決定該現時時幅的活性優勢聲源之指數和方向;其中該先前時幅內活性聲源之方向性訊號,是使用模態匹配法,由該先前時幅的活性優勢聲源方向之該時幅延遲版本,和該先前時幅之HOA係數計算;又其中該倒數第二時幅和該先前時幅間之該聲源運動角度集合,是由該先前時幅的活性優勢聲源方向之該時幅延遲版本,及其進一步時幅延遲版本計算。
本發明有益之其他具體例,載於個別申請專利範圍附屬項內。
11‧‧‧初步搜尋優勢聲源方向和相關組份之HOA表示法
12‧‧‧計算先前活性優勢聲源之方向性訊號
13‧‧‧方向指派
14‧‧‧根據模式計算滑順優勢聲源方向
15‧‧‧決定現時活性優勢聲源之指數和方向
16‧‧‧聲源運動角度估計
171,172,173,174‧‧‧時幅延遲
21‧‧‧計算方向性功率分配
22‧‧‧分析優勢聲源存在
23‧‧‧搜尋優勢聲源方向
24‧‧‧計算優勢方向性訊號以及優勢聲源所產生聲場組份之HOA表示法
25‧‧‧計算剩餘HOA表示法
31‧‧‧在優勢聲源方向轉動均勻柵
32‧‧‧計算優勢聲源訊號和全部柵方向訊號
33‧‧‧從優勢聲源訊號進行預估柵方向訊號
34‧‧‧計算優勢聲源訊號之HOA表示法以及所預估組份
41‧‧‧為優勢聲源方向計算方向性可能函數
42‧‧‧為優勢聲源方向計算方向性先驗或然率函數
43‧‧‧為優勢聲源方向計算方向性後驗或然率函數
44‧‧‧決定平順化優勢聲源方向
第1圖為本發明處理方式方塊圖,用以估計高階保真立體音響訊號之優勢方向和不相關方向性訊號;第2圖為初步方向估計之細節; 第3圖為計算優勢方向性訊號和優勢聲源產生的聲場之HOA表示法;第4圖為模式基礎計算平順化優勢聲源方向;第5圖為球形座標系統;第6圖為對不同保真立體音響階N和角度θ [0,π]之常態化分散函數v N (θ)
茲參見附圖說明本發明具體例。
第1圖表示本發明方向追蹤處理方式之原理,說明如下。假設方向追蹤是基於HOA係數序列長度L的輸入時幅C(k)之接續處理方式,其中k為時幅指數。時幅就HOA係數序列界定,按「高階保真立體音響基本」節內方程式(45)特定為:fC(k):=[c((kB+1)T S)c((kB+2)T S)...c((kB+L)T S)] (1)其中T S 指抽樣週期,而B L指示時幅移動。假設接續時幅有疊合,即B<L,合理但不必然。
在第一步驟或階段11,為優勢聲源初步分析,HOA表示法之第k個時幅C(k)。此項處理方式之詳細說明,見下述「初步方向搜尋」一節。特別是決定所檢測優勢方向性訊號數目,以及相對應初步方向估計。另外,計算(假設)由相對應個別優勢聲源產生的HOA聲場組份,以及相對應瞬時方向性訊號(即普通平面波函數)。
個別初步方向估計和有關量值,按次序方式計算,即先d=1,其次d=2,依此類推。在第一步驟中,按EP 12305537.8所擬計算原先HOA表示法C(k)之方向性功率分配,並接續分析優勢聲源之存在。檢測優勢聲源情形時,計算個別初步方向估計。另外,估計相對應方向性訊號,連同假設由此聲源產生的現時時幅C(k)之組份。假設代表與方向性訊號相關之C(k)組份。最後,從C(k)減去HOA組份,獲得剩餘HOA表示法。第d個(d 2)初步方向估計,按與第一個完全類比方式進行,只是C(k)改用剩餘HOA表示法。因而,明顯保證在進一行方向搜尋中,排除所發現第d個聲源產生之組份。
在方向指派步驟或階段13中,把步驟/階段11於第k個時幅所發現優勢聲源,指派給在第(k-1)時幅(假設)活性的相對應聲源。一方面,就現時時幅(k)之初步方向估計,與第(k-1)時幅內(假設)活性之平順化聲源方向(包含在集合內,且其指數包含在集合內)比較,完成指派。另方面,在時幅k開發指派所檢測優勢聲源的瞬時方向性訊號,與第(k-1)時幅內(假設)活性的聲源方向性訊號X ACT(k-1)間之相關性。指派結果,以指派函數公式化,其中D指預期追蹤聲源之最大數,意即把第d個新發現聲源,指派給指數為f A,k (d)之先前活性聲源。
在以模式為基礎計算平順化優勢聲源方向步驟或階段14中,根據EP 12306485.9所擬統計學聲源運動模式,使用在時幅(k-1)的活性優勢聲源指數集合,在時幅(k-1)的相對應優勢聲源檢測估計集合,時幅(k-2)和(k-1)間個別聲源運動角度集合,假設是由所發現優勢聲源產生之HOA聲場組份,以及指派函數f A,k ,計算平順化優勢聲源方向。此項模式為基礎的平順化製序詳細說明,見下述「模式為基礎以計算平順化優勢聲源方向」。
在最後步驟或階段15,使用由步驟/階段14平順化優勢聲源方向,以及含有假設在第時幅內活性的聲源平順化方向和個別指數之集合,決定現時活性優勢聲源之指數和方向,假設分別包含在集合內。此項運算之目的,不使為少數接續時幅尚未檢測的聲源假性失活。
步驟或階段12使用時幅k-1之HOA表示法C(k-1),和假設在第(k-1)時幅內活性的平順化聲源方向集合,進行計算假設在第(k-1)時幅內活性之聲源方向性訊號。計算是根據模態匹配原理,載於M.A.Poletti:〈根據球諧函數之三維度周圍聲音系統〉,J.Audio Eng.Soc.,vol.53(11),第1004-1025頁,2005年。
在聲源運動角度估計步驟或階段16中,由假設分別在第(k-1)和第(k-2)時幅內活性的平順化聲源方向估計之二集合,計算優勢活性聲源在時幅k-1之運動角度集 合。已知運動是發生在時幅k-2和k-1之間。活性優勢聲源的運動角度,是在時幅k-2和時幅k-1的平順化方向估計間之弧度。備註:對於假設在時幅k-1活性的優勢聲源,若無法對時幅k-2做方向估計,個別運動角度可設定在π最大值。一般而言,若對第一時幅k和時幅k-1值尚未能啟動處理,則要在第1圖之諸步驟或階段輸入之相對應集合或數值,即分別為空白或設定於零。
此項運算造成此聲源次一方向之先驗或然率,即全部可能方向變成幾近均勻,參見下述「決定現時活性優勢聲源之指數和方向」一節。
時幅延遲171至174是把個別訊號延遲一個時幅。
以下詳述上述諸步驟和階段。
初步方向搜尋
在初步方向搜尋步驟/階段11,估計現有優勢聲源數(在時幅k內),和個別方向。另外,計算假設由個別聲源產生的HOA聲場組份,以及相對應方向性訊號(即普通平面波函數)。先就方向指數d=1計算全部先前列舉數量,再就d=2,依次直到
單一方向d指數之計算程序如第2圖所示。第(d-1)方向估計後(相對於對第k時幅之第d方向估計)產生的剩餘HOA表示法,即輸入至此階段。因而可知在迴路開始時,相當於原先HOA時幅C(k)。在第一步驟或階段21中,為預定數Q的分立測試方向Ω q ,q=1,...,Q,計算剩餘HOA表現法之方向性功率分配p (d) (k),幾近均勻分配於單位球體上。更具體而言,各測試方向Ω q 界定為向量,含傾角θ q [0,π]和方位角[0,2π],按照 其中(.) T 指易位。方向性功率分配以向量表示: 其組份p (d) (k)指對於第k時幅,有關方向Ω q 的表現法中剩下全部優勢聲源之聯合功率。從實際計算方向性功率分配p (d) (k),可按照EP 12305537.8所擬進行。
在步驟或階段22,為優勢聲場之存在,分析方向性功率分 配p (d) (k)。檢測優勢聲源之一種方式,載於下述「優勢聲源存在之分析」一節。若測知無優勢聲源存在,即停止方向搜尋,把發現優勢方向之總數設定於。否則,若檢測到優勢聲源,在步驟或階段23計算其相對於座標原點的方向,詳見下述「搜尋優勢聲源方向」一節。
接著,在步驟或階段24計算個別方向性訊號,以及假設由第d優勢聲源產生的聲場組份之HOA表示法,詳見下述「計算優勢方向性訊號以及由優勢聲源產生的聲場之HOA表示法」一節。
最後,在步驟或階段25,從減去,而得剩餘HOA表示法,用來搜尋次一(即第(d+1)個)方向性聲源。於是,明顯確定在進一步方向搜尋時,排除第d個聲源產生之聲場組份。
分析優勢聲源存在
為檢測以表示的聲場內有優勢聲源存在,考慮剩餘HOA表示法之方向性功率分配p (1)(k),...,p (d)(k)。一方面,已經實驗發現合理監驗變方比 可視為是剩餘HOA表示法表示之聲場,比初始HOA表示法C(k)所表示聲場重要的量度。小比表示HOA表示法表示之聲源無一被視為優勢。
另方面,亦合理關注常態化方向性功率分配之變方比 常態化方向性功率分配 之諸元素賴有p (d)(k)界定如下:
變方可視方向性功率分配p (d)(k)之均勻性量度。具體而言,變方愈小,分配於全部入射方向的功率愈均勻。在空間擴 散雜訊的有限情況下,變方值應趨近零。基於此等考量,變方比表示HOA表示法分配是否比更均勻。
綜合上述考量,可假設在C(k)表示之聲場內,始終至少有單一優勢聲源存在,即。若變方比數值維持高於某一預定臨限值ε p <1,且變方比之數值小於一,則檢測進一步優勢聲源(對於d 2),亦即若: 則檢測優勢聲源。
ε p 值係就「優勢」意義的解釋而設定。本發明人等已發現合理的選擇是ε p =10-3
搜尋優勢聲源方向
俟檢測第d個聲源後,採用方向性功率分佈p (d)(k),搜尋其方向之初步預估。搜尋之完成是取得方向性功率最大的測試方向Ω q ,即
計算優勢方向性訊號和優勢聲源產生的聲場之HOA表示法
隨即於決定優勢聲源方向之初步估計後,按照第3圖計算個別方向性訊號,以及假設由同一聲場產生的聲場組份之HOA表示法。在步驟或階段31,由O抽樣位置Ω INIT,0 0=1,...,0組成的固定預定球形柵,假設在單位球體上幾近均勻分配,轉動到由所轉動抽樣位置組成的柵。進行轉動是使第一個轉動抽樣位置相當於初步方向估計
在步驟或階段32,把HOA表示法轉換到所謂空間域,同樣以O平面波函數(亦稱為柵方向性訊號)表示,假設從轉動柵方向碰撞到觀察者位置(即座標原點)。
為計算平面波函數,要計算關於轉動柵方向之模態矩陣,如: 其中:=
假設各柵方向性訊號是由第k時幅的個別樣本組成的列向量,如: 其中L指所分析HOA表示法之(樣本中)長度,則全部柵方向性訊號之計算,是由球諧函數轉換式(詳見下述「球諧函數轉換式」說明)完成,如:
由於優勢聲場方向之初步估計,相當於轉動抽樣位置,則普通平面波函數可視為所需優勢方向性訊號,即
為決定由第d個聲源產生的組份,假設此組份同樣以平面波函數表示,可在步驟或階段33由預估。因此,柵方向性訊號嘗試從預估。所預估訊號以0=2,...,0標示。
完成此項預估之一方式是,假定預估訊號要從產生,利用線性過濾,於此決定過濾器,使預估錯誤減到最少。若過濾器假設為期限很短(較之分析時幅)之有限脈衝回應(FIR)過濾器,則可用技術上已知之最小平方技術,達成預估錯誤最少。
最後,在步驟或階段34,利用反逆球諧函數轉換式(見下述「球諧函數轉換式」一節),獲得優勢聲源訊號之HOA表示法,以及全部預估相關組份,如:
計算先前活性優勢聲源之方向性訊號
假設在第(k-1)時幅活性的聲源之方向性訊號 (k-1),包含在方程式(20)之矩陣X ACT(k-1)內。此矩陣是使用模態匹配原理(見上述Poletti論文),由下式計算:X ACT(k-1)=(E ACT(k-1))-1 C(k-1) (16)其中C(k-1)指原先HOA聲場表示法之第(k-1)時幅,而E ACT(k-1)指關於假設在第(k-1)時幅內活性的聲源方向之模態矩陣。模態矩陣E ACT(k-1)是利用下式計算: 其中SACT,d' (k):=
方向指派
如前所述,一方面,第1圖內步驟/階段13的指派,是由初步方向估計與假設在第(k-1)時幅內活性之平順化聲源方向比較而完成,包含在下式集合內: 其中i ACT,k-1(d')指假設第(k-1)時幅內活性之第d'個聲源指數。具體而言,假設初步方向估與平順化方向成對間之角度 愈小,第d個新發現優勢聲源方向更輕易相當於指數i ACT,k-1(d')之先前活性聲源。
另方面,為了指派,開發在時幅k所檢測優勢聲源的瞬時方向性訊號,與假設在第(k-1)時幅內活性的聲源方向性訊號X ACT(k-1)間之相關性。於此假設時幅X ACT(k-1)是由假設在第(k-1)時幅內活性的聲源個別方向性訊號所組成,如:
使用此定義,可假定二訊號間相關性係數之絕對值 愈高,第d個新發現優勢聲源方向會更輕易相當於指數i ACT,k-1(d')的先前活性聲源。如此假定可由事實上,相關性係數提供二訊號間之線性依賴性證明正當。
基於此等考量,計算特定指派之指派函數: 使下列成本函數(21)減到最小:
明顯假設對不屬於第(k-1)時幅內任何活性聲源之方向指數角度 實際上設定在最小角度Θ MIN,例如Θ MIN=2π/N。再者,對方向指數而言,其相關係數 實際上設定於零。第一次運算的效應是,如果第d個新發現方向與全部先前活性優勢聲源方向間的角度,大於Θ MIN,則此新發現方向有益於屬於新聲源。
指派問題可使用公知匈牙利演算法解答,參見H.W.Kuhn〈指派問題之匈牙利方法〉,Naval研究邏輯學季刊,第2卷(1-2),第83-97頁,1955年。
模式基礎計算平順化優勢聲源方向
此節旨在按照統計學聲源運動模式,在第1圖之步驟/階段 14內計算平順化優勢聲源方向。此項計算之個別步驟如第4圖所示,詳後。
為優勢聲源方向計算方向性先驗或然率函數
在步驟或階段42為新發現優勢聲源方向,計算方向性先驗或然率函數,使用:‧在時幅(k-1)的活性優勢聲源指數i ACT,k-1(d'),d'=1,...,D ACT(k-1)之集合;‧在時幅(k-1)的相對應優勢聲源方向估計d'=1,...,D ACT(k-1)之集合;‧介於時幅(k-2)和(k-1)間的個別聲源運動角度d'=1,...,D ACT(k-1)之集合;‧以及指派函數f A,k
此項計算是根據EP 12306485.9所介紹簡單聲源運動預估模式。具體言之,假設對第d個新發現優勢聲源之方向性先驗或然率函數,是在三維度空間內單位球體上的分配之分立版本。
以下假設方向性先驗或然率函數,是由對個別測 試方向Ω q ,q=1,...,Q的或然率組成的向量所賦予,如:
要為個別測試方向Ω q 計算先驗或然率,需分辨二種情況: (a)若指派給第d個新發現優勢聲源之聲源指數f A,k (d),是包含在集合內,則先驗或然率按下式計算: 其中Θ q,d (k)指估計方向與測試方向Ω q 間之角度:
又,κ d (k)指濃度參數,是使用聲源運動角度估計(k-1)計算,按照: 其中C D可設定為
已知K MAXC R的合理數值(見EP 12306485.9)為κ MAX=8,C R=0.5 (27)
此項計算背後的原理是,增加先驗或然率函數之濃度,事先運動的聲源較少。如果聲源事先運動很多,其接續方向之不確定性就高,因此濃度參數必須達成小數值。
(b)如果指派給第d個新發現優勢聲源的聲源指數f A,k (d),不包含在集合內,則個別聲源被視為事先尚不具活性。因此,實際上無此聲源方向之先驗知識。因此,假設先驗或然率函數,在單位球體上均勻,其中個別或然率對全部測試位置Ω q 均相等,即
為優勢聲源方向計算方向性可能函數
方向性可能函數,是在步驟或階段41計算,使用HOA聲場組份(假設是由個別新檢測優勢聲源所產生),以及指派函數f A,k 。假設方向性可能函數是個別測試方向Ω q ,q=1,...,Q的可能函數組成之向量,如:
計算之個別可能函數,如EP 12305537.8所述,是從測試方向Ω q 碰撞的普通平面波功率之近似值。具體而言, 其中S TEST,q := 指關於測試方向Ω q 的模態向量(其中表示真值球諧函數,如下述「真值球諧函數定義」一節所界定),又其中: 表示關於HOA表示法之HOA係數間相關性矩陣。
為優勢聲源方向計算方向性後驗或然率函數
方向性後驗或然率函數,是在步驟 或階段43計算,使用方向性先驗或然率函數,和 方向性可能函數。於此再次假設方向性後驗或然率 函數,是對個別測試方向Ω q ,q=1,...,Q的後驗或然率(k,Ω q )組成之向量,即
個別後驗或然率是按照Bayesian規則計算(見EP 12306485.9),即:
假設固定方向指數d,方程式(34)的分母對各測試方向Ω q 均為常數。為下述方向搜尋之目的,其中只有後驗或然率函數最大值才有意義,如此全局標度則不相干。因此,須知方程式(34)分母之計算,可完全免除,以節省計算功率。
計算平順化優勢聲源方向
平順化優勢聲源方向,是在步驟或 階段44內計算,使用後驗或然率函數。具體而 言,為時幅k所發現第d個聲源之平順化方向,是搜尋後驗或 然率函數中之最大值而得,即:
決定現時活性優勢聲源之指數和方向
在第1圖的步驟或階段15,使用在時幅(k-1)的全部活性優 勢聲源方向平順化估計之集合 ,相對應指數之集合 ,以及為時幅k所得平順化優勢聲源方向估計,計算在時幅k的全部D ACT(k)活性優勢聲源指數i ACT,k (d'), d'=1,...,D ACT(k)之集合,以及在時幅k的相對應優勢聲源方向估 計之集合。此項運算之目的, 在於對少數接續時幅未檢測到聲源不會有假性失活,原本對例如響板(產生脈衝般聲音,在個別脈衝間有短暫停頓)等聲源會發生。因此,可合理使假設在前一次(即第(k-1))時幅內活性的聲源失活,只要尚未檢測到預定數量 KINACT的接續時幅。按照前述考量,第一步驟計算在時幅(k-1)的全部D ACT(k-1)活性優勢聲源的指數i ACT,k-1(d'),d'=1,...,D ACT(k-1)集合,和全部新檢測聲源的指數集合 之聯合集合,即:
由此集合得所需集合,即從除去尚未檢測到K INACT先前接續時幅數量的聲源指數。在時幅k的活性優勢聲源數D ACT(k)即設定於的元素數。
最後,由下式 決定優勢聲源方向估計,其中i ACT,k (d')指示元素。意即如果在時幅k未新檢測到個別聲源,先前活性優勢聲源之方向即保持固定。
高階保真立體音響之基礎
高階保真立體音響(HOA)係基於假設無聲源的有用精簡面積內之聲場說明。在此情況,在時間t和有用面積內位置x之聲壓p(t,x)之空間時間行為,實體上完全以均相波方程式決定,以下假設球形座標系統如第5圖所示。在所用座標系統中,x軸指向前方位置,y軸指向左方,而z軸向指向頂部。空間內的位置x=(r,θ,) T ,以半徑γ>0(即與座標原點之距離),從極軸z測得之傾角θ [0,π],以及在x-y平面從x軸反時鐘方向測得之方位角[0,2π]表示。(.) T 指轉位。
然則,可見(參照E.G.Williams《傅立葉聲學》,應用數學科學第93卷,學術出版社,1999年)聲壓相對於時間的傅立葉轉換式,以F t (.)表示,即 (其中ω指角頻,i指虛單位),可按照下式展開成一系列球諧函數
在方程式(40)中,c s 指聲速,k指角波數,與角頻ω的關係 為指第一種球形Bessel函數,而nm度的真值球諧函數,在下述「真值球諧函數之定義」一節中界定。展開係數僅視角波數k而定。顯然假設聲壓在空間上受頻帶限制。因此,系列是就階指數n在上限N截頭,稱為HOA表現法之階。
若聲場以來自角維(θ,)所特定全部可能方向的不同角頻之無限數量諧和平面波疊合表示,即表示(參見B.Rafaely〈球體上的聲場利用球形迴旋之平面波分解〉,J.Acoust.Soc.Am.,第4卷(116),第2149-2157頁,2004年)個別平面波複合振幅函數C(ω,θ,)即可以下式球諧函數展開式表示: 其中展開係數與展開係數之關係為:
假設個別係數為角頻ω之函數,應用反逆傅立葉轉換式(以F -1(.)表示),對各nm度提供時間域函數: 以逐一c(t)集在單一向量內:
向量c(t)內時間域函數之位置指數,為n(n+1)+1+m。向量c(t)內元素總數為O=(N+1)2
最後保真立體音響格式提供c(t)之抽樣版本,使用抽樣頻率f S,即: 其中T S=1/f S指抽樣期間。c(lT S)諸元素稱為保真立體音響係數。時間域訊號和因此保真立體音響係數均為真值。
真值球諧函數之定義
真值球諧函數以下式表示:
關聯之Legendre函數P n,m (x)界定如下: 具有Legendre多項式P n (x),與上述E.G. Williams教科書不同,即無Condon-Shortley相項(-1) m
高階保真立體音響之空間解析度
來自方向的普通平面波函數x(t),由下式以HOA表示: 平面波振幅c(t,Ω):=F t -1(C(ω,Ω))之相對應空間密度為:
從方程式(51)可見普通平面波函數x(t)和空間分散函數v N (Θ)之乘積,僅視ΩΩ 0間之角度θ而定,其性質為:
預料得到在無限階的限度內,即N→∞,空間分散函數轉成狄喇克δ函數δ(.),即:
然而,以有限階N情況言,來自方向Ω 0的普通平面波之貢獻,漸消到隔鄰方向,其模糊程度隨階增加而遞減。對N不同數值的常態化函數v N (θ)描圖,如第6圖所示。對任何方向Ω言,平面波振幅的空間密度之時間域行為,是其在任何其他方向的行為之倍數。尤其是對某些固定方向Ω 1Ω 2之函數c(t,Ω 1)和c(t,Ω 2)彼此關於時間t有高度相關。
球諧函數轉換式
若平面波振幅之空間密度,在許多O空間方向Ω 0,1 0 0分立化,幾近均勻分配於單位球體上,即得O方向性訊號c(t,Ω 0 )。把此等訊號集成向量:c SPAT(t):=[c(t,Ω 1)...c(t,Ω 0 )] T (54)使用方程式(50)可驗證,此向量可從方程式(44)界定的連續保真立體音響d(t),利用簡單矩陣乘法計算:c SPAT(t)=Ψ H c(t) (55)其中(.) H 表示聯合換位和共軛,而Ψ指模態矩陣,界定為:Ψ:=[S 1...S 0 ] (56)其中
因為方向Ω 0是幾近均勻分配於單位球體,故模態矩陣一般可顛倒。因此,連續保真立體音響表示法可從方向性訊號c(t,Ω 0 ),利用下式計算:c(t)=Ψ -H c SPAT(t) (58)
二方程式構成保真立體音響表示法和「空間域」間之轉換式和逆轉換式。此等轉換式分別稱為球諧函數轉換式和反逆球諧函數轉換式。因為方向Ω 0幾近均勻分配於單位球體,就有近似值: 判定使用Ψ -1代替方程式(55)中之Ψ H 為正確。所有上述關係式對分立時間域也是有效。
本發明處理方式可利用單一處理器或電子電路,或利用數個處理器或電子電路進行,並行操作和/或在本發明處理方式之不同組件上操作均可。
11‧‧‧初步搜尋優勢聲源方向和相關組份之HOA表示法
12‧‧‧計算先前活性優勢聲源之方向性訊號
13‧‧‧方向指派
14‧‧‧根據模式計算平順優勢聲源方向
15‧‧‧決定現時活性優勢聲源之指數和方向
16‧‧‧聲源運動角度估計
171,172,173,174‧‧‧時幅延遲

Claims (11)

  1. 一種聲場的高階保真立體音響表示法(HOA)中不相關聲源方向之決定方法,包含步驟為:在HOA係數(C(k))的現時時幅(k)中,街續搜尋(11)優勢聲源的初步方向估計,並計算(11)由相對應優勢聲源產生的HOA聲場組份,其中在該項搜尋每次迭代中,由代表從原先HOA表示法已除去與先前所發現聲源訊號相關的全部組份後剩餘之HOA表示法,計算各進一步方向估計;其中從許多預定測試方向選出現時方向估計,使由所選擇方向碰撞到聆聽者位置的剩餘HOA表示法之有關普通平面波功率,與所有其他方向相較為最大者。
  2. 如申請專利範圍第1項之方法,其中為HOA係數(C(k))的該現時時幅(k)之該選擇方向估計,指派(13)給在HOA係數(C(k-1))的先前時幅(k-1)內發現的優勢聲場,而最後方向估計係關於所得時間軌道平順化者。
  3. 如申請專利範圍第2項之方法,其中該平順化係藉實施Bayesian推論過程進行,其中此項Bayesian推論過程開發統計學先驗聲源運動模式,以及原先HOA表現法的優勢聲源組份之方向性功率分配者。
  4. 如申請專利範圍第3項之方法,其中該統計學先驗模式是從其在該先前時幅(k-1)內方向之知識,以及介於該先前時幅(k-1)和倒數第二時幅(k-2)間運動之知識,以統計方式預估個別聲源者。
  5. 如申請專利範圍第3或4項之方法,其中該項指派方向估計給在HOA係數的該先前時幅(k-1)內嶺現之優勢聲源,是由方向估計和先前發現聲源方向成對問角度之聯合最小化,以及與方向估計和HOA係數的該先前發現優勢聲源有關的成對方向性訊號間之相關性係數最大化所達成者。
  6. 一種聲場的高階保真立體音響表示法(HOA)中不相關聲源方向之決定方法,包含步驟為:‧在HOA係數(C(k))之現時時幅(k)內,接續搜尋(11)優勢聲源之初步方向估計,並計算(11)由相對應優勢聲源產生之HOA聲 場組份,和計算(11)相對應方向性訊號;‧指派(13)該計算的優勢聲源,給該HOA係數的先前時幅(k-1)內活 性的相對應聲源,係就該現時時幅(k)之該初步方向估計,與該先前時幅(k-1)內活性之聲源平順方向,進行比較,並令該現時時幅之該方向性訊號,與該先前時幅(k-1)內活性之聲源方向性訊號(X ACT(k-1))相關,得指派函數(f A,k );‧使用該指派函數(f A,k ),在該先前時幅內之該平順方向集合,該先前時幅(k-1)內活性優勢聲源之指數集合,介於倒數第二時幅(k-2)與該先前時幅(k-1)間個別聲源運動角度之集合,以及由相對應優勢聲源產生的該HOA聲場組份,計算(14)平順化優勢聲源方向 ;‧使用該平順化優勢聲源方向,該先前時幅(k-1)的活性優勢聲源方向之時幅延遲(174)版本,以及該先前時幅(k-1)的活性優勢聲源指數之時幅延遲(172)版本,決定(15)該現時時幅(k)的活性優勢聲源之指數和方向;其中該先前時幅(k-1)內活性聲源之方向性訊號(X ACT(k-1)),係由使用模態匹配法,由該先前時幅(k-1)的活性優勢聲源方向之該時幅延遲(174)版本,和該先前時幅之HOA係數(C(k-1))計算(12);且其中該倒數第二時幅(k-2)和該先前時幅(k-1)間之該聲源運動角度集合,是由該先前時幅(k-1)的活性優勢聲源方向之該時幅延遲(174)版本,及其進一步時幅延遲(173)版本計算者。
  7. 一種聲場的高階保真立體音響表示法(HOA)中不相關聲源方向之決定方法,包含步驟為:‧搜尋機構(11),適於在HOA係數(C(k))之現時時幅(k)內,接續搜尋優勢聲源之初步方向估計,並計算由相對應優勢聲源產生 之HOA聲場組份,和計算相對應方向性訊號 ;‧指派機構(13),適於指派該計算的優勢聲源,給該HOA係數的先前時幅(k-1)內活性的相對應聲源,係就該現時時幅(k)之該初步方 向估計,與該先前時幅(k-1)內活性之聲源平順方向,進行比較,並令該現時時幅之該方向性訊號,與該先前時幅(k-1)內活性之聲源方向性訊號(X ACT(k-1))相關,得指派函數(f A,k );‧計算機構(14),適於使用該指派函數(f A,k ),在該先前時幅內之該平順方向集合,該先前時幅(k-1)內活性優勢聲源之指數集合,介於倒數第二時幅(k-2)與該先前時幅(k-1)間個別聲源運動角度之集合,以及由相對應優勢聲源產生的該HOA聲場組份,計算平順化優勢聲源方向 ; ‧決定機構(15),適於使用該平順化優勢聲源方向,該先前時幅(k-1)的活性優勢聲源方向之時幅延遲(174)版本,以及該先前時幅(k-1)的活性優勢聲源指數之時幅延遲(172)版本,決定該現時時幅(k)的活性優勢聲源之指數和方向;其中該先前時幅(k-1)內活性聲源之方向性訊號(X ACT(k-1)),係由使用模態匹配法,由該先前時幅(k-1)的活性優勢聲源方向之該時幅延遲(174)版木,和該先前時幅之HOA係數(C(k-1))計算(12);且其中該倒數第二時幅(k-2)和該先前時幅(k-1)間之該聲源運動角度集合,是由該先前時幅(k-1)的活性優勢聲源方向之該時幅延遲(174)版本,及其進一步時幅延遲(173)版本計算者。
  8. 如申請專利範圍第6項之方法,或如申請專利範圍第7項之裝置,其 中在該決定所檢測優勢方向性訊號數和相對應初步方向估計 中,從HOA係數(C(k))之該現時時幅(k),減去由相對應優勢聲源產生之HOA 聲場組份,得相對應剩餘HOA表示法,而此項減法 處理方式對進一步此類聲場組份,每次根據剩餘HOA表示法重複進行,使得在進一步方向搜尋中,排除所發現聲場組份者。
  9. 如申請專利範圍第8項之方法,或如申請專利範圍第8項之裝置,其中為單一方向指數(d),對幾近均勻分配於單位球體上的預定數分立測試方向(Ω q),計算剩餘HOA表示法之方向性功率分配(p (d)(k)),並分析 該方向性功率分配是否有優勢聲源存在,若檢測到優勢聲源不存在,即停止方向搜尋,若檢測到優勢聲源,則計算初步估計其相對於座標原點之方向者。
  10. 如申請專利範圍第8和9項之方法,或如申請專利範圍第8和9項 之裝置,其中在決定優勢聲源方向之初步估計後,計算個別方向 性訊號和假設由同樣聲源產生的聲場組份之HOA表示法 ,如下述: ‧轉動(31)固定之預定球形柵,係由抽樣位置組成, 其目標在於均勻分配於單位球體上,以提供轉動抽樣位置之柵 ,其中進行該轉動,使首先轉動的抽樣位置相當於該初 步方向估計; ‧把該剩餘HOA表示法轉換(32)到空間域,同樣以假設從轉 動柵方向碰撞到座標原點的相對應平而波函數,並計算優勢聲源訊 號和柵方向訊號;‧從優勢聲源訊號,進行(33)預估該柵方向訊號;‧利用反逆球諧函數轉換式,計算(34)預估柵方向性訊號之HOA表 示法,表示優勢聲源對該剩餘HOA表示法所表示聲 場之貢獻者。
  11. 如申請專利範圍第6和8至10項之一項方法,或如申請專利範圍第 7至10項之一項裝置,其中該計算(14)平順化優勢聲源方向進 行如下:‧使用該指派函數(f A,k ),該先前時幅內平順化方向之該集合,該先時時幅內活性優勢聲源指數之該集合,以及聲源運動角度之該集合,為優勢聲 源方向計算(42)方向性先驗或然率函數; ‧使用該指派函數(f A,k ),並使用優勢聲源產生之該HOA聲場組份 ,為優勢聲源方向計算(41)方向性可能函數; ‧使用該方向性可能函數,並使用該方向性失驗或然率 函數,為優勢聲源方向計算(43)方向性後驗或然率函數 ; ‧使用為優勢聲源方向之該方向性後驗或然率函數,決 定(44)平順化優勢聲源方向者。
TW103104224A 2013-02-08 2014-02-10 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置 TWI647961B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP20130305156 EP2765791A1 (en) 2013-02-08 2013-02-08 Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
??13305156.5 2013-02-08

Publications (2)

Publication Number Publication Date
TW201448616A true TW201448616A (zh) 2014-12-16
TWI647961B TWI647961B (zh) 2019-01-11

Family

ID=47780000

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103104224A TWI647961B (zh) 2013-02-08 2014-02-10 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置

Country Status (7)

Country Link
US (1) US9622008B2 (zh)
EP (2) EP2765791A1 (zh)
JP (1) JP6374882B2 (zh)
KR (1) KR102220187B1 (zh)
CN (1) CN104995926B (zh)
TW (1) TWI647961B (zh)
WO (1) WO2014122287A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9502044B2 (en) 2013-05-29 2016-11-22 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
WO2017055485A1 (en) 2015-09-30 2017-04-06 Dolby International Ab Method and apparatus for generating 3d audio content from two-channel stereo content
CN105516875B (zh) * 2015-12-02 2020-03-06 上海航空电器有限公司 用于快速测量虚拟声音产生设备空间角度分辨率的装置
GR1008860B (el) * 2015-12-29 2016-09-27 Κωνσταντινος Δημητριου Σπυροπουλος Συστημα διαχωρισμου ομιλητων απο οπτικοακουστικα δεδομενα
US10089063B2 (en) 2016-08-10 2018-10-02 Qualcomm Incorporated Multimedia device for processing spatialized audio based on movement
JP6723120B2 (ja) * 2016-09-05 2020-07-15 本田技研工業株式会社 音響処理装置および音響処理方法
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
EP3622509B1 (en) 2017-05-09 2021-03-24 Dolby Laboratories Licensing Corporation Processing of a multi-channel spatial audio format input signal
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
FR3074584A1 (fr) * 2017-12-05 2019-06-07 Orange Traitement de donnees d'une sequence video pour un zoom sur un locuteur detecte dans la sequence
CN110751956B (zh) * 2019-09-17 2022-04-26 北京时代拓灵科技有限公司 一种沉浸式音频渲染方法及系统
CN112019971B (zh) * 2020-08-21 2022-03-22 安声(重庆)电子科技有限公司 声场构建方法、装置、电子设备及计算机可读存储介质
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9915398D0 (en) 1999-07-02 1999-09-01 Baker Matthew J Magnetic particles
FR2801108B1 (fr) 1999-11-16 2002-03-01 Maxmat S A Analyseur chimique ou biochimique a regulation de la temperature reactionnelle
FR2839565B1 (fr) * 2002-05-07 2004-11-19 Remy Henri Denis Bruno Procede et systeme de representation d'un champ acoustique
FR2858403B1 (fr) * 2003-07-31 2005-11-18 Remy Henri Denis Bruno Systeme et procede de determination d'une representation d'un champ acoustique
EP2297557B1 (en) * 2008-07-08 2013-10-30 Brüel & Kjaer Sound & Vibration Measurement A/S Reconstructing an acoustic field
EP2285139B1 (en) * 2009-06-25 2018-08-08 Harpex Ltd. Device and method for converting spatial audio signal
US9113281B2 (en) * 2009-10-07 2015-08-18 The University Of Sydney Reconstruction of a recorded sound field
AU2011231565B2 (en) * 2010-03-26 2014-08-28 Dolby International Ab Method and device for decoding an audio soundfield representation for audio playback
WO2012025580A1 (en) * 2010-08-27 2012-03-01 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2738962A1 (en) 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
US9913064B2 (en) * 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers

Also Published As

Publication number Publication date
CN104995926B (zh) 2017-12-26
EP2954700A1 (en) 2015-12-16
JP6374882B2 (ja) 2018-08-15
CN104995926A (zh) 2015-10-21
WO2014122287A1 (en) 2014-08-14
EP2954700B1 (en) 2018-03-07
US20150373471A1 (en) 2015-12-24
EP2765791A1 (en) 2014-08-13
TWI647961B (zh) 2019-01-11
KR20150115779A (ko) 2015-10-14
US9622008B2 (en) 2017-04-11
JP2016509812A (ja) 2016-03-31
KR102220187B1 (ko) 2021-02-25

Similar Documents

Publication Publication Date Title
TWI647961B (zh) 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置
JP7158806B2 (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
RU2511672C2 (ru) Оценка местоположения источника звука с использованием фильтрования частиц
US20080247274A1 (en) Sensor array post-filter for tracking spatial distributions of signals and noise
Salvati et al. A weighted MVDR beamformer based on SVM learning for sound source localization
Traa et al. Multichannel source separation and tracking with RANSAC and directional statistics
Yang et al. Srp-dnn: Learning direct-path phase difference for multiple moving sound source localization
EP2745293B1 (en) Signal noise attenuation
Hosseini et al. Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function
Zhang et al. Multi-Target Ensemble Learning for Monaural Speech Separation.
Pirhosseinloo et al. A new feature set for masking-based monaural speech separation
Wu et al. Sound source localization and tracking
Krause et al. Data diversity for improving DNN-based localization of concurrent sound events
Tourbabin et al. Direction of arrival estimation in highly reverberant environments using soft time-frequency mask
Dehghan Firoozabadi et al. A novel nested circular microphone array and subband processing-based system for counting and DOA estimation of multiple simultaneous speakers
Taseska et al. Minimum Bayes risk signal detection for speech enhancement based on a narrowband DOA model
Firoozabadi et al. Combination of nested microphone array and subband processing for multiple simultaneous speaker localization
Berkun et al. Microphone array power ratio for quality assessment of reverberated speech
Wu et al. Acoustic source tracking in reverberant environment using regional steered response power measurement
Toma et al. Efficient Detection and Localization of Acoustic Sources with a low complexity CNN network and the Diagonal Unloading Beamforming
Ji et al. Robust noise PSD estimation for binaural hearing aids in time-varying diffuse noise field
Gerlach et al. Joint estimation of pitch and direction of arrival: improving robustness and accuracy for multi-speaker scenarios
Yang et al. A stacked self-attention network for two-dimensional direction-of-arrival estimation in hands-free speech communication
Mosayyebpour et al. Time delay estimation via minimum-phase and all-pass component processing
Wei et al. Dynamic blind source separation based on source-direction prediction