TWI647961B - 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置 - Google Patents

聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置 Download PDF

Info

Publication number
TWI647961B
TWI647961B TW103104224A TW103104224A TWI647961B TW I647961 B TWI647961 B TW I647961B TW 103104224 A TW103104224 A TW 103104224A TW 103104224 A TW103104224 A TW 103104224A TW I647961 B TWI647961 B TW I647961B
Authority
TW
Taiwan
Prior art keywords
sound source
time frame
dominant
hoa
dominant sound
Prior art date
Application number
TW103104224A
Other languages
English (en)
Other versions
TW201448616A (zh
Inventor
亞歷山大 克魯格
斯凡 科登
Original Assignee
瑞典商杜比國際公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 瑞典商杜比國際公司 filed Critical 瑞典商杜比國際公司
Publication of TW201448616A publication Critical patent/TW201448616A/zh
Application granted granted Critical
Publication of TWI647961B publication Critical patent/TWI647961B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

高階保真立體音響(HOA)代表三維度聲音。HOA提供高度空間解像度,並便於分析關於優勢聲源之聲場。本發明旨在識別構成聲場的獨立優勢聲源,並追蹤其時間軌道。已知之應用是藉察看原先HOA表示法之方向性功率分配,為優勢聲源方向搜尋全部潛在候選,而在本發明中,與先前已知聲源訊號相關之全部組份均已除去。利用如此操作,在對聲場的分配在方向上大為分散情況下,可以避免誤測眾多而非唯一正確聲源之問題。

Description

聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置
本發明係關於在聲場之高階保真立體音響表示法中,決定不相關聲源方向之方法和裝置。
高階保真立體音響(Higher Order Ambisonics,HOA)貢獻一種可能性,在像波場合成(WFS)的其他技術,或像22.2的通道基礎之方略當中,代表三維度聲音。惟與通道基礎方法呈對比的是,HOA表示法貢獻的優點是,與特殊揚聲器設置無關。然而此項通融性是以解碼過程為代價,需在特定揚聲器設置上,回放HOA表示法。與WFS方略相較,所需揚聲器數量往往很大,HOA亦可描繪於只有少量揚聲器組成的裝置。HOA又一優點是亦可採用同樣表示法,對頭戴耳機之雙耳描繪不需任何修飾。
HOA是根據利用平截球諧函數(SH)展開的 複合諧平面波振幅之空間密度表示法,各展開係數是角頻的函數,可同等利用時間域函數表示。因此,不失一般性,完整HOA聲場表示法實際上可假設包含O時間域函數,其中O指展開係數之數量。以下,此等時間域函數稱為HOA係數序列或HOA通道。
HOA有潛勢可提供高度空間解像度,改進展開之成長最高階N。此貢獻可能性,可以分析關於優勢聲源之聲場。
應用上是如何從HOA表示法去識別構成聲場的獨立優勢聲源,和如何追蹤其時間軌道。例如專利申請案EP 12305537.8所述,利用聲場分解成優勢方向性訊號和剩餘週遭組份,供HOA表示法之壓縮,就需要此等操作。此等方向追蹤法又一應用,是粗略的初步原始分離。對於HOA聲場記錄的後製作,亦可使用估計之方向軌道,以放大或減弱特殊聲源之訊號。
EP 12305537.8擬議接續進行下述三種操作:‧識別時幅(time frame)內現時存在的優勢聲源數量,並搜尋相對應方向。優勢聲源數量是由HOA通道交叉相關矩陣之本徵值決定。為搜尋優勢聲源方向,評估方向性功率分配,相當於固定大量預界定測試方向之HOA係數幅。在方向性功率分配尋找最大值,可得第一次方向估計。然後,順序重複下述二項操 作,以找出剩餘之識別方向:從剩餘之測試方向集合,消除空間鄰區之測試方向,和所得集合用來搜尋方向性功率分配之最大值;‧把估計的方向指派給在最後時幅視為活性之聲源;‧在指派之後,進行方向估計之適當平滑,以獲得時間上平順之方向軌道。
然而,雖然以如此處理過程,藉計算指數式加權運動平均值,原則上可完成方向估計之時間平順,惟此項技術的缺點是,不能準確捕獲突然方向變化或開始出現新的優勢聲音。
為克服此問題,專利申請案EP 12306485.9倡議引進簡單的統計聲源運動預估模式,採用於以Bayesian學習原則實施之統計上動機平順法。惟EP 12306485.9和EP 12305537.8只從方向性功率分配對聲源方向計算可能函數。此項分配表示從單元球體上幾近均勻分配取樣點所特定方向之大量普通平面波功率。並未提供來自不同方向的普通平面波間彼此相關之任何資訊。
實務上,HOA表示法之N階往往有限,造成空間上頻帶受限之聲場。具體而言,此意味方向性聲場對方向性功率分配之貢獻,在鄰區方向之真正入射方向週圍變模糊。此模糊效應在數學上稱為「分散函數」,參見下述〈高階保真立體音響之空間解像度〉一節。其程度隨HOA表示法降階而成長。EP 12306485.9和EP 12305537.8方法追蹤法,某種程度考慮到此效應,把方向 搜尋拘限在先前所發現方向之鄰區外側。然而,鄰區的規格假設全部聲源都是以HOA表示方法之全階N編碼。此項假設違反含以低於N階編碼的普通平面波之N階HOA表示法。此等低於N階的普通平面波會是藝術創作的結果,使聲源呈現更寬。然而亦發生在利用球形麥克風記錄之HOA聲場表示法。
EP 12306485.9和EP 12305537.8方向追蹤法會識別超過單一的聲源,若聲場是由較N低階的單一普通平面波組成,其性能不良。
本發明欲解決之問題是,改進HOA聲場內優勢聲源之決定,可追蹤其時間軌道。此問題是利用申請專利範圍第1、2和6項解決。利用申請專利範圍第6項方法之裝置,則列於申請專利範圍第7項。
本發明改進EP 12306485.9處理方式。本發明處理方式是尋找獨立之優勢聲源,並經時追蹤其方向。「獨立優勢聲源」表示個別聲源之訊號不相關。
雖然先前技術方法EP 12305537.8和EP 12306485.9係藉僅僅考察「原先」HOA表示法之方向性功率分配,為優勢聲源方向搜尋全部潛在候選,但本發明下述處理方式排除從原先HOA表示法搜尋各方向候選,因為全部組份均與原先發現的聲場之訊號相關。利用此項操作,在對聲場貢獻係高度方向性分散情況時,可避免誤檢測到眾多代替唯一正確聲源之問題。如前所述,如此效應會發生在含有以較N低階編碼的普通平面波之N階 HOA表示法。正如EP 12306485.9為優勢聲源方向找到的候選,再指派給先前發現的優勢聲源,最後按照統計聲源運動模式平順化。因此,和EP 12306485.9一樣,本發明處理方式提供時間上平順方向估計,且能夠捕獲突然方向變化,或開始發生新優勢聲音。
本發明處理方式對HOA表示法之接續時幅,按二順序處理方式,估計優勢聲源方向:從HOA表示法之現時時幅k,為優勢聲源方向接續搜尋候選或估計,並決定HOA表示法之組份,假設是由個別聲源所產生。在此搜尋過程之每次迭代中,從代表原先HOA表示法,除去與先前所發現聲源訊號相關的全部組份後,由剩餘HOA表示法計算各進一步之方向候選。在許多預界定測試方向選出現時方向候選,使剩餘HOA表示法之有關平面波功率,從選用方向碰撞到聆聽者位置,與全部其他測試方向相較為最大值。
其次,為現時時幅選擇的方向候選,指派給HOA係數先前時幅k-1中發現的優勢聲源。然後,藉進行Bayesian推理過程,計算最後方向估計,就所得時間軌道平順化,其中此Bayesian推理過程一方面開發統計上先驗聲源運動模式,另方面開始原先HOA表示法中優勢聲源組份之方向性功率分配。先驗聲源運動模式,可在先前時幅k-1和倒數第二時幅k-2間,從按先前時幅k-1的方向,以統計方式預估個別聲源的現時運動。
方向估計指派給HOA係數先前時幅(k-1)中 發現的優勢聲源,係將方向估計和先前發現聲源方向成對間的角度聯合最小化,以及相對於方向估計和先前時幅內所見優勢聲源的成對方向性訊號間之相關係數絕對值最大化所完成。
原則上,本發明方法適於決定聲場的高階保真立體音響表示法(HOA)內不相關聲源之方向,該方法包括如下步驟:‧在HOA係數之現時時幅內,接續搜尋優勢聲源之初步方向估計,並計算由相對應優勢聲源產生的HOA聲場組份,又計算相對應方向性訊號;‧指派該計算的優勢聲源,給該HOA係數的先前時幅內活性的相對應聲源,係就該現時時幅之該初步方向估計,與該先前時幅內活性之聲源平順方向,進行比較,並令該現時時幅之該方向性訊號,與該先前時幅內活性之聲源方向性訊號相關,得指派函數;‧使用該指派函數,在該先前時幅內之該平順方向集合,該先前時幅內活性優勢聲源之指數集合,介於倒數第二時幅與該先前時幅間個別聲源運動角度集合,以及由相對應優勢聲源產生的該HOA聲場組份,計算平順化優勢聲源方向;‧使用該平順化優勢聲源方向,該先前時幅的活性優勢聲源方向之時幅延遲版本,以及該先前時幅的活性優勢聲源指數之時幅延遲版本,決定該現時時幅 的活性優勢聲源之指數和方向;其中該先前時幅內活性聲源之方向性訊號,是使用模態匹配法,由該先前時幅的活性優勢聲源方向之該時幅延遲版本,和該先前時幅之HOA係數計算;又其中該倒數第二時幅和該先前時幅間之該聲源運動角度集合,是由該先前時幅的活性優勢聲源方向之該時幅延遲版本,及其進一步時幅延遲版本計算。
原則上,本發明裝置適於決定聲場的高階保真立體音響表示法(HOA)中不相關聲源之方向,該裝置包括:‧搜尋機構,適於在HOA係數之現時時幅內,接續搜尋優勢聲源之初步方向估計,並計算由相對應優勢聲源產生的HOA聲場組份,又計算相對應方向性訊號;‧指派機構,適於指派該計算的優勢聲源,給該HOA係數的先前時幅內活性的相對應聲源,係就該現時時幅之該初步方向估計,與該先前時幅內活性之聲源平順方向,進行比較,並令該現時時幅之該方向性訊號,與該先前時幅內活性之聲源方向性訊號相關,得指派函數;‧計算機構,適於使用該指派函數,在該先前時幅內之該平順方向集合,該先前時幅內活性優勢聲源之指數集合,介於倒數第二時幅與該先前時幅間個別聲源運動角度集合,以及由相對應優勢聲源產生的 該HOA聲場組份,計算平順化優勢聲源方向;‧決定機構,適於使用該平順化優勢聲源方向,該先前時幅的活性優勢聲源方向之時幅延遲版本,以及該先前時幅的活性優勢聲源指數之時幅延遲版本,決定該現時時幅的活性優勢聲源之指數和方向;其中該先前時幅內活性聲源之方向性訊號,是使用模態匹配法,由該先前時幅的活性優勢聲源方向之該時幅延遲版本,和該先前時幅之HOA係數計算;又其中該倒數第二時幅和該先前時幅間之該聲源運動角度集合,是由該先前時幅的活性優勢聲源方向之該時幅延遲版本,及其進一步時幅延遲版本計算。
本發明有益之其他具體例,載於個別申請專利範圍附屬項內。
11‧‧‧初步搜尋優勢聲源方向和相關組份之HOA表示法
12‧‧‧計算先前活性優勢聲源之方向性訊號
13‧‧‧方向指派
14‧‧‧根據模式計算滑順優勢聲源方向
15‧‧‧決定現時活性優勢聲源之指數和方向
16‧‧‧聲源運動角度估計
171,172,173,174‧‧‧時幅延遲
21‧‧‧計算方向性功率分配
22‧‧‧分析優勢聲源存在
23‧‧‧搜尋優勢聲源方向
24‧‧‧計算優勢方向性訊號以及優勢聲源所產生聲場組份之HOA表示法
25‧‧‧計算剩餘HOA表示法
31‧‧‧在優勢聲源方向轉動均勻柵
32‧‧‧計算優勢聲源訊號和全部柵方向訊號
33‧‧‧從優勢聲源訊號進行預估柵方向訊號
34‧‧‧計算優勢聲源訊號之HOA表示法以及所預估組份
41‧‧‧為優勢聲源方向計算方向性可能函數
42‧‧‧為優勢聲源方向計算方向性先驗或然率函數
43‧‧‧為優勢聲源方向計算方向性後驗或然率函數
44‧‧‧決定平順化優勢聲源方向
第1圖為本發明處理方式方塊圖,用以估計高階保真立體音響訊號之優勢方向和不相關方向性訊號;第2圖為初步方向估計之細節;第3圖為計算優勢方向性訊號和優勢聲源產生的聲場之HOA表示法;第4圖為模式基礎計算平順化優勢聲源方向;第5圖為球形座標系統;第6圖為對不同保真立體音響階N和角度θ [0,π]之 常態化分散函數ν N (θ)
茲參見附圖說明本發明具體例。
第1圖表示本發明方向追蹤處理方式之原理,說明如下。假設方向追蹤是基於HOA係數序列長度L的輸入時幅C(k)之接續處理方式,其中k為時幅指數。時幅就HOA係數序列界定,按「高階保真立體音響基本」節內方程式(45)特定為: fC(k):=[c((kB+1)T S )c((kB+2)T S )...c((kB+L)T S )], (1)
其中T S 指抽樣週期,而B L指示時幅移動。假設接續時幅有疊合,即B<L,合理但不必然。
在第一步驟或階段11,為優勢聲源初步分析,HOA表示法之第k個時幅C(k)。此項處理方式之詳細說明,見下述「初步方向搜尋」一節。特別是決定所檢 測優勢方向性訊號數目,以及相對應初步方向估 計。另外,計算(假設)由相對應個別 優勢聲源產生的HOA聲場組份 , , 以及相對應瞬時方向性訊號 , (即普通平面波函數)。
個別初步方向估計和有關量值,按次序方式計算,即先d=1,其次d=2,依此類推。在第一步驟中,按EP 12305537.8所擬計算原先HOA表示法C(k)之 方向性功率分配,並接續分析優勢聲源之存在。檢測優勢聲源情形時,計算個別初步方向估計。另外,估 計相對應方向性訊號,連同假設由此聲源產生的 現時時幅C(k)之組份。假設代表與 方向性訊號相關之C(k)組份。最後,從C(k)減去 HOA組份,獲得剩餘HOA表示法。第d個(d 2)初步方向估計,按與第一個完全類比方式進 行,只是C(k)改用剩餘HOA表示法。因而,明顯保證在進一行方向搜尋中,排除所發現第d個聲源產生之組份。
在方向指派步驟或階段13中,把步驟/階段11於第k個時幅所發現優勢聲源,指派給在第(k-1)時幅(假設)活性的相對應聲源。一方面,就現時時幅(k)之 初步方向估計,與第(k-1)時幅內(假設)活性之平順化聲源方向(包含在集合 g Ω,DOM,ACT (k-1)內,且其指數包含在集合 J DOM,ACT (k-1)內)比較,完成指派。另方面,在時幅k開發指派所檢測優勢聲源的瞬時方 向性訊號 , ,與第(k-1)時幅內(假設)活性的聲源方向性訊號 X ACT (k-1)間之相關性。指派結果,以指派函數 f A,k :{1,..., }→{1,...,D}公式化,其中D指預期追蹤聲源之最大數,意即把第d個新發現聲源,指派給指數為 f A,k (d)之先前活性聲源。
在以模式為基礎計算平順化優勢聲源方向步驟或階段14中,根據EP 12306485.9所擬統計學聲源 運動模式,使用在時幅(k-1)的活性優勢聲源指數集合 J DOM,ACT (k-1),在時幅(k-1)的相對應優勢聲源檢測估計集合 g Ω,DOM,ACT (k-1),時幅(k-2)和(k-1)間個別聲源運動角度集合,假設是由所發現優勢聲源產 生之HOA聲場組份 , ,以及指派函 數 f A,k ,計算平順化優勢聲源方向 , 。此項模式為基礎的平順化製序詳細說明,見下述「模式為基礎以計算平順化優勢聲源方向」。
在最後步驟或階段15,使用由步驟/階段 14平順化優勢聲源方向 , ,以及含有假設在第時幅內活性的聲源平順化方向和個別指數之集合 g Ω,DOM,ACT (k-1) J DOM,ACT (k-1),決定現時活性優勢聲源之指數和方向,假設分別包含在集合 J DOM,ACT (k) g Ω,DOM,ACT (k)內。此項運算之目的,不使為少數接續時幅尚未檢測的聲源假性失活。
步驟或階段12使用時幅k-1之HOA表示法C(k-1),和假設在第(k-1)時幅內活性的平順化聲源方向集合 g Ω,DOM,ACT (k-1),進行計算假設在第(k-1)時幅內活性之聲源方向性訊號。計算是根據模態匹配原理,載於M.A.Poletti:〈根據球諧函數之三維度周圍聲音系統〉,J.Audio Eng.Soc.,vol.53(11),第1004-1025頁,2005年。
在聲源運動角度估計步驟或階段16中,由假設分別在第(k-1)和第(k-2)時幅內活性的平順化聲源方向估計之二集合 g Ω,DOM,ACT (k-1) g Ω,DOM,ACT (k-2),計算優勢活 性聲源在時幅k-1之運動角度集合。已知運動是發生在時幅k-2和k-1之間。活性優勢聲源的運動角度,是在時幅k-2和時幅k-1的平順化方向估計間之弧度。備註:對於假設在時幅k-1活性的優勢聲源,若無法對時幅k-2做方向估計,個別運動角度可設定在π最大值。一般而言,若對第一時幅k和時幅k-1值尚未能啟動處理,則要在第1圖之諸步驟或階段輸入之相對應集合或數值,即分別為空白或設定於零。
此項運算造成此聲源次一方向之先驗或然率,即全部可能方向變成幾近均勻,參見下述「決定現時活性優勢聲源之指數和方向」一節。
時幅延遲171至174是把個別訊號延遲一個時幅。
以下詳述上述諸步驟和階段。
初步方向搜尋
在初步方向搜尋步驟/階段11,估計現有優 勢聲源數(在時幅k內),和個別方向 , 。另外,計算假設由個別聲源產生的 HOA聲場組份,,以及相對應方向性 訊號 , (即普通平面波函數)。先就方向指數d=1計算全部先前列舉數量,再就d=2,依次直 到
單一方向d指數之計算程序如第2圖所示。第(d-1)方向估計後(相對於對第k時幅之第d方向估 計)產生的剩餘HOA表示法,即輸入至此階段。 因而可知在迴路開始時,相當於原先HOA時幅C(k)。在第一步驟或階段21中,為預定數Q的分立測試 方向Ω q ,q=1,...,Q,計算剩餘HOA表現法之方向性功率分配p (d) (k),幾近均勻分配於單位球體上。更具體而言,各測試方向Ω q 界定為向量,含傾角 θ q [0]和方位角 [0,2π],按照
其中(.) T 指易位。方向性功率分配以向量表示:
其組份指對於第k時幅,有關方向Ω q 的表現 法中剩下全部優勢聲源之聯合功率。從實際計算方向性功率分配 p (d) (k),可按照EP 12305537.8所擬進行。
在步驟或階段22,為優勢聲場之存在,分析方向性功率分配 p (d) (k)。檢測優勢聲源之一種方式,載於下述「優勢聲源存在之分析」一節。若測知無優勢聲源存在,即停止方向搜尋,把發現優勢方向之總數設定於 。否則,若檢測到優勢聲源,在步驟或階段23 計算其相對於座標原點的方向,詳見下述「搜尋優勢聲源方向」一節。
接著,在步驟或階段24計算個別方向性訊 號,以及假設由第d優勢聲源產生的聲場組份之 HOA表示法,詳見下述「計算優勢方向性訊號以及由優勢聲源產生的聲場之HOA表示法」一節。
最後,在步驟或階段25,從減去 ,而得剩餘HOA表示法,用來搜尋次 一(即第(d+1)個)方向性聲源。於是,明顯確定在進一步方向搜尋時,排除第d個聲源產生之聲場組份。
分析優勢聲源存在
為檢測以表示的聲場內有優勢聲源 存在,考慮剩餘HOA表示法之方向性功 率分配 p (1) (k),...,p (d) (k)。一方面,已經實驗發現合理監驗變方比
可視為是剩餘HOA表示法表示之聲場,比初 始HOA表示法C(k)所表示聲場重要的量度。小比 表示HOA表示法表示之聲源無一被視為優勢。
另方面,亦合理關注常態化方向性功率分 配之變方比
常態化方向性功率分配
之諸元素 ,q=1,...,Q, 賴有 p (d) (k)界定如下:
變方可視方向性功率分配 p (d) (k)之均勻性量度。具體而言,變方愈小,分配於全部入射方向的功率愈均勻。在空間擴散雜訊的有限情況 下,變方值應趨近零。基於此等考量,變方 比表示HOA表示法分配是否比更均勻。
綜合上述考量,可假設在C(k)表示之聲場 內,始終至少有單一優勢聲源存在,即 1。若變方 比數值維持高於某一預定臨限值 ε p <1,且變方比之數值小於一,則檢測進一步優勢聲源(對於d 2),亦即若:
則檢測優勢聲源。
ε p 值係就「優勢」意義的解釋而設定。本發明人等已發現合理的選擇是ε p =10-3
搜尋優勢聲源方向
俟檢測第d個聲源後,採用方向性功率分 佈 p (d) (k),搜尋其方向之初步預估。搜尋之完成是 取得方向性功率最大的測試方向Ωq,即
計算優勢方向性訊號和優勢聲源產生的聲場之HOA表示法
隨即於決定優勢聲源方向之初步估計 後,按照第3圖計算個別方向性訊號,以及假設由同一聲場產生的聲場組份之HOA表示法 。在步驟或階段31,由O抽樣位置 Ω INIT,o ,o=1,...,O 組成的固定預定球形柵 g Ω,INIT ,假設在單位球體上幾近均勻分配,轉動到由所轉動抽樣位置 ,o=1,...,O 組成的柵。進行轉動是使第一個 轉動抽樣位置相當於初步方向估計
在步驟或階段32,把HOA表示法 轉換到所謂空間域,同樣以O平面波函數(亦稱為柵方向 性訊號) ,o=1,...,O 表示,假設從轉動柵方向 ,o=1,...,O 碰撞到觀察者位置(即座標原點)。
為計算平面波函數 ,o=1,...,O ,要 計算關於轉動柵方向之模態矩陣,如:
其中
假設各柵方向性訊號是由第k時幅 的個別樣本組成的列向量,如:
其中L指所分析HOA表示法之(樣本中)長度,則全部柵方向性訊號之計算,是由球諧函數轉換式(詳見下述「球諧函數轉換式」說明)完成,如:
由於優勢聲場方向之初步估計,相 當於轉動抽樣位置,則普通平面波函數 可視為所需優勢方向性訊號,即
為決定由第d個聲源產生的組份, 假設此組份同樣以平面波函數表示,可在步驟或階段33 由預估。因此,柵方向性訊號 ,o=2,...,O 嘗 試從預估。所預估訊號以 ,o=2,...,O 標示。
完成此項預估之一方式是,假定預估訊號 ,o=2,...,O 要從產生,利用線性過濾,於此 決定過濾器,使預估錯誤減到最少。若過濾器假設為期限很短(較之分析時幅)之有限脈衝回應(FIR)過濾器,則可用技術上已知之最小平方技術,達成預估錯誤最少。
最後,在步驟或階段34,利用反逆球諧函數轉換式(見下述「球諧函數轉換式」一節),獲得優勢 聲源訊號之HOA表示法,以及全部預估相關組份,如:
計算先前活性優勢聲源之方向性訊號
假設在第(k-1)時幅活性的聲源之方向性訊 號,包含在方程式(20)之矩陣 X ACT (k-1)內。此矩陣是使用模態匹配原理(見上述Poletti論文),由下式計算: X ACT (k-1)=(Ξ ACT (k-1)) -1 C(k-1), (16)
其中C(k-1)指原先HOA聲場表示法之第(k-1)時幅,而 Ξ ACT (k-1)指關於假設在第(k-1)時幅內活性的聲源方向 , d'=1,...,D ACT (k-1)之模態矩陣。模態矩陣 Ξ ACT (k-1)是利用下式計算: 其中 S ACT,d ,(k):=
方向指派
如前所述,一方面,第1圖內步驟/階段13 的指派,是由初步方向估計與假設在第(k-1)時幅內活性之平順化聲源方向比較而完成,包含在下式集合內:
其中 i ACT,k-1 (d')指假設第(k-1)時幅內活性之第d'個聲 源指數。具體而言,假設初步方向估計與平順化 方向成對間之角度
愈小,第d個新發現優勢聲源方向更輕易相當於指數 i ACT,k-1 (d')之先前活性聲源。
另方面,為了指派,開發在時幅k所檢測 優勢聲源的瞬時方向性訊號 , ,與假設在第(k-1)時幅內活性的聲源方向性訊號 X ACT (k-1)間之相關性。於此假設時幅 X ACT (k-1)是由假設在第(k-1)時幅內 活性的聲源個別方向性訊號所組成,如:
使用此定義,可假定二訊號間相關性係數之絕對值
愈高,第d個新發現優勢聲源方向會更輕易相當於指數 i ACT,k-1 (d')的先前活性聲源。如此假定可由事實上,相關性係數提供二訊號間之線性依賴性證明正當。
基於此等考量,計算特定指派之指派函數: f A,k :{1,..., }→{1,...,D}
使下列成本函數(21)減到最小:
明顯假設對不屬於第(k-1)時幅內任何活性聲源之方向指數 d" {1,...,D}\J DOM,ACT (k-1)角度
實際上設定在最小角度 Θ MIN ,例如 Θ MIN =2π/N 。再者,對方向指數 d" {1,...,D}\J DOM,ACT (k-1)而言,其相關係數
實際上設定於零。第一次運算的效應是,如果第d個 新發現方向與全部先前活性優勢聲源方向間的角度,大於 Θ MIN ,則此新發現方向有益於屬於新聲源。
指派問題可使用公知匈牙利演算法解答,參見H.W.Kuhn〈指派問題之匈牙利方法〉,Naval研究邏輯學季刊,第2卷(1-2),第83-97頁,1955年。
模式基礎計算平順化優勢聲源方向
此節旨在按照統計學聲源運動模式,在第1圖之步驟/階段14內計算平順化優勢聲源方向。此項計算之個別步驟如第4圖所示,詳後。
為優勢聲源方向計算方向性先驗或然率函數
在步驟或階段42為新發現優勢聲源方向, 計算方向性先驗或然率函數,使 用:‧在時幅(k-1)的活性優勢聲源指數 i ACT,k-1 (d'),d'=1,...,D ACT (k-1)之集合 J DOM,ACT (k-1);‧在時幅(k-1)的相對應優勢聲源方向估計 ,d'=1,...,D ACT (k-1)之集合; ‧介於時幅(k-2)和(k-1)間的個別聲源運動角度 ,d'=1,...,D ACT (k-1)之集合;‧以及指派函數 f A,k
此項計算是根據EP 12306485.9所介紹簡單聲源運動預估模式。具體言之,假設對第d個新發現優 勢聲源之方向性先驗或然率函數,是在三維度空間內單位球體上的分配之分立版本。
以下假設方向性先驗或然率函數 ,是由對個別測試方向 Ω q ,q=1,...,Q 的或然率 組成的向量所賦予,如:
要為個別測試方向Ω q 計算先驗或然率,需分辨二種情況:
(a)若指派給第d個新發現優勢聲源之聲源指數 f A,k (d),是包含在集合 J DOM,ACT (k-1)內,則先驗或然率按下式計算:
其中 Θ q,d (k)指估計方向與測試方向Ω q 間 之角度:
又,κ d (k)指濃度參數,是使用聲源運動角度估計計算,按照:
其中C D可設定為
已知K MAXC R的合理數值(見EP 12306485.9)為κ MAX =8,C R =0.5. (27)
此項計算背後的原理是,增加先驗或然率函數之濃度,事先運動的聲源較少。如果聲源事先運動很多,其接續方向之不確定性就高,因此濃度參數必須達成小數值。
(b)如果指派給第d個新發現優勢聲源的聲源指數 f A,k (d),不包含在集合 J DOM,ACT (k-1)內,則個別聲源被視為事先尚不具活性。因此,實際上無此聲源方向之先 驗知識。因此,假設先驗或然率函數,在單位球體上均勻,其中個別或然率對全部測試位置Ω q 均相等,即
為優勢聲源方向計算方向性可能函數
方向性可能函數 , ,是在步驟或階段41計算,使用HOA聲場組份 , (假設是由個別新檢測優勢聲源所產生),以及指派函數 f A,k 。假設方向性可能函數是個別測試方向 Ω q ,q=1,...,Q 的可能函數組成之向量,如:
計算之個別可能函數,如EP 12305537.8所述,是從測試方向Ω q 碰撞的普通平面波功率之近似值。具體而言,
其中 S TEST,q :=
指關於測試方向Ωq的模態向量(其中 表示真值球諧函數,如下述「真值球諧函數定義」一節所界定),又其中:
表示關於HOA表示法之HOA係數間相關 性矩陣。
為優勢聲源方向計算方向性後驗或然率函數
方向性後驗或然率函數 , ,是在步驟或階段43計算,使用方向性先驗或然率函數 , ,和方向性可能函數 , 。於此再次假設方向性後驗或然率函數 ,是對個別測試方向 Ω q ,q=1,...,Q 的後驗或然率 組成之向量,即
個別後驗或然率是按照 Bayesian規則計算(見EP 12306485.9),即:
假設固定方向指數d,方程式(34)的分母對各測試方向Ω q 均為常數。為下述方向搜尋之目的,其中只有後驗或然率函數最大值才有意義,如此全局標度則不相干。因此,須知方程式(34)分母之計算,可完全免除,以節省計算功率。
計算平順化優勢聲源方向
平順化優勢聲源方向 , ,是在步驟或階段44內計算,使用後驗或然率函數 , 。具體而言,為時幅k所發現第d 個聲源之平順化方向,是搜尋後驗或然率函數 中之最大值而得,即:
決定現時活性優勢聲源之指數和方向
在第1圖的步驟或階段15,使用在時幅(k-1)的全部活性優勢聲源方向平順化估計 ,d'=1,...,D ACT (k)之集合 g Ω,DOM,ACT (k-1),相對應 指數 i ACT,k-1 (d'),d'=1,...,D ACT (k-1)之集合 J DOM,ACT (k-1),以及為時幅k所得平順化優勢聲源方向估計 , ,計算在時幅k的全部 D ACT (k)活性 優勢聲源指數 i ACT,k (d'),d'=1,...,D ACT (k)之集合 J DOM,ACT (k),以及在時幅k的相對應優勢聲源方向估計 ,d'=1,...,D ACT (k-1)之集合 g Ω,DOM,ACT (k)。此項運算之目的,在於對少數接續時幅未檢測到聲源不會有假性失活,原本對例如響板(產生脈衝般聲音,在個別脈衝間有短暫停頓)等聲源會發生。因此,可合理使假設在前一次(即第(k-1))時幅內活性的聲源失活,只要尚未檢測到預定數量 K INACT 的接續時幅。按照前述考量,第一步驟 計算在時幅(k-1)的全部 D ACT (k-1)活性優勢聲源的指數 i ACT,k-1 (d'),d'=1,...,D ACT (k-1)集合 J DOM,ACT (k-1),和全部新檢測聲源的指數集合
之聯合集合 J JOINED (k),即:puted:J JOINED (k):=J NEW (k)U J DOM,ACT (k-1). (37)
由此集合得所需集合 J DOM,ACT (k),即從 J JOINED (k)除去尚未檢測到 K INACT 先前接續時幅數量的聲源指數。在時幅k的活性優勢聲源數 D ACT (k)即設定於 J DOM,ACT (k)的元素數。
最後,由下式
決定優勢聲源方向估計 ,d'=1,...,D ACT (k),其 中 i ACT,k (d')指示 J DOM,ACT (k)元素。意即如果在時幅k未新檢測到個別聲源,先前活性優勢聲源之方向即保持固定。
高階保真立體音響之基礎
高階保真立體音響(HOA)係基於假設無聲源的有用精簡面積內之聲場說明。在此情況,在時間t和有用面積內位置x之聲壓p(t,x)之空間時間行為,實體上完全以均相波方程式決定,以下假設球形座標系統如第5 圖所示。在所用座標系統中,x軸指向前方位置,y軸指向左方,而z軸向指向頂部。空間內的位置 x=(r,θ, ) T ,以半徑 r>0(即與座標原點之距離),從極軸z測得之傾角 θ [0],以及在x-y平面從x軸反時鐘方向測得之方位角 [0,2π]表示。(.) T 指轉位。
然則,可見(參照E.G.Williams《傅立葉聲學》,應用數學科學第93卷,學術出版社,1999年)聲壓相對於時間的傅立葉轉換式,以 F t (.)表示,即
(其中ω指角頻,i指虛單位),可按照下式展開成一系列球諧函數
在方程式(40)中,c s指聲速,k指角波數, 與角頻ω的關係為指第一種球形Bessel函 數,而nm度的真值球諧函數,在下述「真 值球諧函數之定義」一節中界定。展開係數僅視角波數k而定。顯然假設聲壓在空間上受頻帶限制。因此,系列是就階指數n在上限N截頭,稱為HOA表現法之階。
若聲場以來自角維(θ,)所特定全部可能方向的不同角頻之無限數量諧和平面波疊合表示,即表示(參見B.Rafaely〈球體上的聲場利用球形迴旋之平面波 分解〉,J.Acoust.Soc.Am.,第4卷(116),第2149-2157頁,2004年)個別平面波複合振幅函數 C(ω,θ, ),即可以下式球諧函數展開式表示:
其中展開係數與展開係數之關係為:
假設個別係數為角頻ω之函 數,應用反逆傅立葉轉換式(以 F -1 (.)表示),對各nm度提供時間域函數:
以逐一 c(t)集在單一向量內:
向量 c(t)內時間域函數之位置指數, 為n(n+1)+1+m。向量 c(t)內元素總數為O=(N+1)2
最後保真立體音響格式提供 c(t)之抽樣版本,使用抽樣頻率 f S ,即:
其中 T S =1/f S 指抽樣期間。 c(lT S )諸元素稱為保真立體 音響係數。時間域訊號和因此保真立體音響係數均 為真值。
真值球諧函數之定義
真值球諧函數以下式表示: 其中
關聯之Legendre函數 P n,m (x)界定如下:
具有Legendre多項式 P n (x),與上述E.G.Williams教科書不同,即無Condon-Shortley相項(-1) m
高階保真立體音響之空間解析度
來自方向的普通平面波函數 x(t),由下式以HOA表示:
平面波振幅 c(t,Ω):=F t -1 (C(ω,Ω))之相對應空間密度為:
從方程式(51)可見普通平面波函數 x(t)和空間分散函數 ν N (Θ)之乘積,僅視ΩΩ 0間之角度θ而 定,其性質為:
預料得到在無限階的限度內,即N→∞,空間分散函數轉成狄喇克δ函數δ(.),即:
然而,以有限階N情況言,來自方向Ω 0的普通平面波之貢獻,漸消到隔鄰方向,其模糊程度隨階增加而遞減。對N不同數值的常態化函數 ν N (Θ)描圖,如第6圖所示。對任何方向Ω言,平面波振幅的空間密度之時間域行為,是其在任何其他方向的行為之倍數。尤其是對某些固定方向Ω 1Ω 2之函數 c(t,Ω 1 ) c(t,Ω 2 ),彼此關於時間t有高度相關。
球諧函數轉換式
若平面波振幅之空間密度,在許多O空間方向 Ω o ,1 o O 分立化,幾近均勻分配於單位球體上,即得O方向性訊號 c(t,Ω o )。把此等訊號集成向量:asc SPAT (t):=[c(t,Ω 1 )...c(t,Ω O )] T , (54)
使用方程式(50)可驗證,此向量可從方程式(44)界定的連續保真立體音響 d(t),利用簡單矩陣乘法計算: c SPAT (t)=Ψ H c(t), (55)
其中(.) H 表示聯合換位和共軛,而 Ψ 指模態矩陣,界 定為: Ψ:=[S 1 ...S O ](56)
其中
因為方向Ω 0是幾近均勻分配於單位球體,故模態矩陣一般可顛倒。因此,連續保真立體音響表示法可從方向性訊號 c(t,Ω o ),利用下式計算: c(t)=Ψ -H c SPAT (t) (58)
二方程式構成保真立體音響表示法和「空間域」間之轉換式和逆轉換式。此等轉換式分別稱為球諧函數轉換式和反逆球諧函數轉換式。因為方向Ω 0幾近均勻分配於單位球體,就有近似值:
判定使用 Ψ -1 代替方程式(55)中之 Ψ H 為正確。所有上述關係式對分立時間域也是有效。
本發明處理方式可利用單一處理器或電子電路,或利用數個處理器或電子電路進行,並行操作和/或在本發明處理方式之不同組件上操作均可。

Claims (10)

  1. 一種聲場的高階保真立體音響(HOA)表示法中不相關聲源方向之決定方法,包含:在HOA係數的現前時幅中,搜尋優勢聲源的初步方向估計;並且根據對應優勢聲源決定HOA聲場組份,其中根據剩餘HOA表示法決定現前方向估計,該剩餘HOA表示法代表原始HOA表示法中與先前發現之聲源方向性訊號的全部組份已經移除者,其中根據從一方向碰撞到聆聽者位置的剩餘HOA表示法之普通平面波功率,相對於所有其他測試方向之個別功率,從由一組預定測試方向中選出該現前方向估計,並且其中HOA係數的該現前時幅之該現前方向估計,係指派給在HOA係數的先前時幅內的至少一優勢聲源,並且相對於時間軌道而平順化。
  2. 如申請專利範圍第1項之方法,其中該平順化係根據Bayesian推論過程進行,其利用統計先驗聲源移動模式,以及該原始HOA表示法的該優勢聲源組份之方向性功率分布。
  3. 如申請專利範圍第2項之方法,其中該統計先驗聲源移動模式是根據在該先前時幅內之方向,以及介於該先前時幅和倒數第二時幅之間的移動,以統計方式預估個別聲源之移動。
  4. 如申請專利範圍第2項之方法,其中該現前方向估計指派給HOA係數之先前時幅的優勢聲源係根據方向估計和先前發現聲源方向成對之間角度的聯合最小化,以及與方向估計有關的方向性訊號和HOA係數的該先前時幅中發現之優勢聲源有關的方向性訊號的成對之間的相關性係數絕對值最大化。
  5. 一種聲場的高階保真立體音響(HOA)表示法中不相關聲源方向之決定方法,包含步驟為:在HOA係數之現前時幅內,搜尋優勢聲源之初步方向估計,以及根據對應優勢聲源,決定HOA聲場組份,並決定對應方向信號;根據該現前時幅的初步方向估計,以及在該先前時幅中主動之聲源的平順化方向之比較,將該優勢聲源指派給在該HOA係數的先前時幅中主動的對應聲源,其中該指派係進一步根據該現前時幅的方向性信號,和在該先前時幅中主動的聲源之方向性信號之間的關係,產生指派函數;根據該指派函數,在該先前時幅中之平順化優勢聲源方向,在該先前時幅中主動優勢聲源之指數,該倒數第二時幅與該先前時幅之間的個別源移動角度,以及根據該對應優勢聲源的該HOA聲場組份,決定該平順化優勢聲源方向;根據該平順化優勢聲源方向,該先前時幅之該主動優 勢聲源之方向的幅延遲版本,以及該先前時幅之該主動優勢聲源之指數的幅延遲版本,決定該現前時幅之該主動優勢聲源的指數與方向,其中在該先前時幅中主動的聲源之該方向性信號,是基於該先前時幅的該主動優勢聲源之方向的幅延遲版本,以及該先前時幅之HOA係數的模態匹配所決定,其中在該倒數第二時幅與該先前時幅之間的該源移動角度是基於該先前時幅之該主動優勢聲源的方向之幅延遲版本,以及其進一步的幅延遲版本所決定。
  6. 如申請專利範圍第5項之決定方法,其中進一步包含決定所檢測優勢方向性信號以及對應初步方向估計,進一步包含:從HOA係數之該現前時幅,減去由該對應優勢聲源,以獲得對應剩餘HOA表示法,其中該減法處理針對進一步之聲場組份,每次根據剩餘HOA表示法重複進行,其中該聲場組份在進一步方向搜尋中排除。
  7. 如申請專利範圍第6項之決定方法,進一步包含決定幾近均勻分布在單位球體上之預定數量的離散測試方向之表示法,其中針對優勢聲源之出現而分析方向性功率分布,並且根據確定偵測到優勢聲源消失,停止該方向搜尋,並根據確定偵測到優勢聲源,決定相對於座標原點之方向的初步估計。
  8. 如申請專利範圍第7項之決定方法,其中根據相 同的該聲源之相對方向性信號,以及該聲場組份之該HOA表示法係根據下列步驟決定:轉動由抽樣位置組成之固定預定球形柵,其中該抽樣位置係均勻分配於該單位球體上,以決定轉動抽樣位置之柵,其中該轉動係實施使第一轉動抽樣位置對應於該初步方向估計;把該剩餘HOA表示法轉換到空間域,並決定優勢聲源訊號和柵方向訊號;從該優勢聲源訊號,實施預估該柵方向性訊號;並且根據反球狀諧波函數轉換,決定該預估柵方向性訊號之HOA表示法,其表示該優勢聲源對該剩餘HOA表示法所表示之聲場的貢獻。
  9. 如申請專利範圍第5項之方法,其中該平順化優勢聲源方向係由以下步驟決定:根據該指派函數,在該先前時幅內之該平順化優勢聲源方向,在該先前時幅內之主動優勢聲源的指數,以及該源移動角度決定優勢聲源方向之方向性先驗或然率函數;根據該指派函數和由優勢聲源所創建之該HOA聲場組份,決定優勢聲源方向的方向性可能函數;根據方向性可能函數以及方向性先驗或然率函數,決定優勢聲源方向之方向性後驗或然率函數;根據優勢聲源方向之該方向性後驗或然率函數,決定平順化優勢聲源方向。
  10. 一種決定在聲場的高階保真立體音響(HOA)表示 法中不相關聲源方向之裝置,包含:處理器,其組構以在優勢聲源之HOA係數初步方向估計之現前時幅內搜尋,並基於對應優勢聲源決定HOA聲場組份,該處理器進一步組構以決定對應方向性信號;其中該處理器係進一步組構以根據該現前時幅之該初步方向估計與該先前時幅內主動之聲源平順化方向的比較,指派該優勢聲源至該HOA係數的先前時幅內主動的對應聲源,其中該指派係進一步根據該現前時幅之方向性信號與該先前時幅內主動之聲源的方向性信號之關聯,達到指派函數;其中該處理器進一步組構以根據該指派函數,在該先前時幅中之平順化優勢聲源方向,在該先前時幅中主動優勢聲源之指數,該倒數第二時幅與該先前時幅之間的個別源移動角度,以及根據該對應優勢聲源的該HOA聲場組份,決定該平順化優勢聲源方向,其中該處理器進一步組構以根據該平順化優勢聲源方向,該先前時幅之該主動優勢聲源之方向的幅延遲版本,以及該先前時幅之該主動優勢聲源之指數的幅延遲版本,決定該現前時幅之該主動優勢聲源的指數與方向,其中在該先前時幅中主動的聲源之該方向性信號,是基於該先前時幅的該主動優勢聲源之方向的幅延遲版本,以及該先前時幅之HOA係數的模態匹配所決定,並且其中在該倒數第二時幅與該先前時幅之間的該源移動角度是基於該先前時幅之該主動優勢聲源的方向之幅延遲 版本,以及其進一步的幅延遲版本所決定。
TW103104224A 2013-02-08 2014-02-10 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置 TWI647961B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
??13305156.5 2013-02-08
EP20130305156 EP2765791A1 (en) 2013-02-08 2013-02-08 Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field

Publications (2)

Publication Number Publication Date
TW201448616A TW201448616A (zh) 2014-12-16
TWI647961B true TWI647961B (zh) 2019-01-11

Family

ID=47780000

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103104224A TWI647961B (zh) 2013-02-08 2014-02-10 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置

Country Status (7)

Country Link
US (1) US9622008B2 (zh)
EP (2) EP2765791A1 (zh)
JP (1) JP6374882B2 (zh)
KR (1) KR102220187B1 (zh)
CN (1) CN104995926B (zh)
TW (1) TWI647961B (zh)
WO (1) WO2014122287A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
EP3357259B1 (en) 2015-09-30 2020-09-23 Dolby International AB Method and apparatus for generating 3d audio content from two-channel stereo content
CN105516875B (zh) * 2015-12-02 2020-03-06 上海航空电器有限公司 用于快速测量虚拟声音产生设备空间角度分辨率的装置
GR1008860B (el) * 2015-12-29 2016-09-27 Κωνσταντινος Δημητριου Σπυροπουλος Συστημα διαχωρισμου ομιλητων απο οπτικοακουστικα δεδομενα
US10089063B2 (en) 2016-08-10 2018-10-02 Qualcomm Incorporated Multimedia device for processing spatialized audio based on movement
JP6723120B2 (ja) * 2016-09-05 2020-07-15 本田技研工業株式会社 音響処理装置および音響処理方法
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
CN110800048B (zh) 2017-05-09 2023-07-28 杜比实验室特许公司 多通道空间音频格式输入信号的处理
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
FR3074584A1 (fr) * 2017-12-05 2019-06-07 Orange Traitement de donnees d'une sequence video pour un zoom sur un locuteur detecte dans la sequence
CN110751956B (zh) * 2019-09-17 2022-04-26 北京时代拓灵科技有限公司 一种沉浸式音频渲染方法及系统
CN111933182B (zh) * 2020-08-07 2024-04-19 抖音视界有限公司 声源跟踪方法、装置、设备和存储介质
CN112019971B (zh) * 2020-08-21 2022-03-22 安声(重庆)电子科技有限公司 声场构建方法、装置、电子设备及计算机可读存储介质
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329466A1 (en) * 2009-06-25 2010-12-30 Berges Allmenndigitale Radgivningstjeneste Device and method for converting spatial audio signal
WO2011041834A1 (en) * 2009-10-07 2011-04-14 The University Of Sydney Reconstruction of a recorded sound field
EP2469742A2 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9915398D0 (en) 1999-07-02 1999-09-01 Baker Matthew J Magnetic particles
FR2801108B1 (fr) 1999-11-16 2002-03-01 Maxmat S A Analyseur chimique ou biochimique a regulation de la temperature reactionnelle
FR2839565B1 (fr) 2002-05-07 2004-11-19 Remy Henri Denis Bruno Procede et systeme de representation d'un champ acoustique
FR2858403B1 (fr) 2003-07-31 2005-11-18 Remy Henri Denis Bruno Systeme et procede de determination d'une representation d'un champ acoustique
EP2297557B1 (en) 2008-07-08 2013-10-30 Brüel & Kjaer Sound & Vibration Measurement A/S Reconstructing an acoustic field
WO2011117399A1 (en) * 2010-03-26 2011-09-29 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
US9271081B2 (en) * 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2738962A1 (en) 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329466A1 (en) * 2009-06-25 2010-12-30 Berges Allmenndigitale Radgivningstjeneste Device and method for converting spatial audio signal
WO2011041834A1 (en) * 2009-10-07 2011-04-14 The University Of Sydney Reconstruction of a recorded sound field
EP2469742A2 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field

Also Published As

Publication number Publication date
JP6374882B2 (ja) 2018-08-15
WO2014122287A1 (en) 2014-08-14
KR20150115779A (ko) 2015-10-14
EP2954700A1 (en) 2015-12-16
EP2954700B1 (en) 2018-03-07
EP2765791A1 (en) 2014-08-13
CN104995926B (zh) 2017-12-26
JP2016509812A (ja) 2016-03-31
US9622008B2 (en) 2017-04-11
CN104995926A (zh) 2015-10-21
TW201448616A (zh) 2014-12-16
US20150373471A1 (en) 2015-12-24
KR102220187B1 (ko) 2021-02-25

Similar Documents

Publication Publication Date Title
TWI647961B (zh) 聲場的高階保真立體音響表示法中不相關聲源方向之決定方法及裝置
JP7158806B2 (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
US7039200B2 (en) System and process for time delay estimation in the presence of correlated noise and reverberation
CN111239687B (zh) 一种基于深度神经网络的声源定位方法及系统
EP2530484B1 (en) Sound source localization apparatus and method
KR20180069879A (ko) 음성 강화를 위해 전역적으로 최적화된 최소 제곱 포스트 필터링
Traa et al. Multichannel source separation and tracking with RANSAC and directional statistics
Hosseini et al. Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function
Yang et al. Srp-dnn: Learning direct-path phase difference for multiple moving sound source localization
US9659574B2 (en) Signal noise attenuation
Krause et al. Data diversity for improving DNN-based localization of concurrent sound events
Zhang et al. Multi-Target Ensemble Learning for Monaural Speech Separation.
Pirhosseinloo et al. A new feature set for masking-based monaural speech separation
Wu et al. Sound source localization and tracking
Tourbabin et al. Direction of arrival estimation in highly reverberant environments using soft time-frequency mask
Dehghan Firoozabadi et al. A novel nested circular microphone array and subband processing-based system for counting and DOA estimation of multiple simultaneous speakers
Firoozabadi et al. Combination of nested microphone array and subband processing for multiple simultaneous speaker localization
Wu et al. Acoustic source tracking in reverberant environment using regional steered response power measurement
Toma et al. Efficient Detection and Localization of Acoustic Sources with a low complexity CNN network and the Diagonal Unloading Beamforming
Sharma et al. Development of a speech separation system using frequency domain blind source separation technique
Yang et al. A stacked self-attention network for two-dimensional direction-of-arrival estimation in hands-free speech communication
Mosayyebpour et al. Time delay estimation via minimum-phase and all-pass component processing
Gong et al. Time delays of arrival estimation for sound source location based on coherence method in correlated noise environments
Cho et al. Underdetermined audio source separation from anechoic mixtures with long time delay
Mitchell et al. Improved direction of arrival estimations with a wearable microphone array for dynamic environments by reliability weighting