TW201807703A - 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 - Google Patents
用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 Download PDFInfo
- Publication number
- TW201807703A TW201807703A TW106137200A TW106137200A TW201807703A TW 201807703 A TW201807703 A TW 201807703A TW 106137200 A TW106137200 A TW 106137200A TW 106137200 A TW106137200 A TW 106137200A TW 201807703 A TW201807703 A TW 201807703A
- Authority
- TW
- Taiwan
- Prior art keywords
- hoa
- signal
- residual
- direction signal
- representation
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 39
- 238000007906 compression Methods 0.000 claims abstract description 23
- 230000006835 compression Effects 0.000 claims abstract description 20
- 230000005428 wave function Effects 0.000 claims abstract description 15
- 238000005070 sampling Methods 0.000 claims abstract description 13
- 230000006837 decompression Effects 0.000 claims description 23
- 230000008901 benefit Effects 0.000 claims description 20
- 238000009499 grossing Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000009467 reduction Effects 0.000 abstract description 10
- 230000000875 corresponding effect Effects 0.000 description 18
- 239000011159 matrix material Substances 0.000 description 14
- 230000007246 mechanism Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 101150078570 WIN1 gene Proteins 0.000 description 3
- 101150017489 WIN2 gene Proteins 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Percussion Or Vibration Massage (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本發明改善了高階保真立體音響(HOA)表示的壓縮。上述高階保真立體音響(HOA)表示係在優勢音源的存在下被分析且其方向均經估計。隨後,HOA表示係經分解為一些優勢方向訊號與一殘餘分量。為了於均勻取樣方向上得到一般平面波函數,此殘餘分量係經轉換為離散空間域,其係預測自優勢方向訊號。最終,預測誤差會被轉換回HOA域以及表示殘餘周圍HOA分量,其中係實施一位階降低,並緊接著進行優勢方向訊號與殘餘分量的感知編碼。
Description
本發明係關於一種用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置。
高階保真立體音響(以下稱HOA)提供一種表示三維聲音的方法。其他技術則為波場合成(Wave Field Synthesis,WFS)或以頻道為基礎的方法如22.2。相較於以頻道為基礎的方法,HOA表示的優點在於不需仰賴特殊揚聲器設置。然而,此項適用性是以解碼過程為代價,需在特別的揚聲器設置上回放HOA表示。相較於所需揚聲器之數量通常非常龐大的波場合成方法,HOA亦可被提供予僅由少數揚聲器組成之設置。HOA之另一優點在於相同的表示亦可在不作任何修改之下被應用於頭戴式耳機之雙耳演示技術(binaural rendering)。
HOA係基於複諧平面波振福(complex harmonic plane wave amplitudes)之空間密度之一表示而藉
由截頭球諧展開。每一展開係數係為角頻率之一函數,其係可等效地藉由一時域函數表示。因此,不失一般性,完整HOA音場表示實際上可被假設為由O時域函數所組成,在此處O代表展開係數值。這些時域函數在後述會被相同地稱作為HOA係數序列。
HOA表示的空間解析度係因展開之一最大位階N而改善。可惜,展開係數的數值O係以位階N而二次地成長,即O=(N+1)2。舉例來說,例如使用位階N=4之典型HOA表示,需O=25 HOA(展開)係數。根據上述考量,賦予所需採樣率fs和每樣本之位元數Nb,即可由O.fs.Nb決定HOA訊號表示傳輸之總位元率。而以採用每樣本Nb=16位元之採樣率fs=48kHz傳輸位階N=4的HOA訊號表示會產生一19.2Mbits/s之位元率,其對於許多實際的應用(例如:串流)來說是非常高的,因此HOA表示的壓縮是極度被需要的。
已知方法相當罕見以N>1壓縮HOA表示。其中之一採用感知進步聲訊編碼法(AAC)寫解碼器,進行直接編碼個別HOA係數序列,參見E.Hellerud,I.Burnett,A.Solvang,U.Peter Svensson合撰〈以AAC編碼高階保真立體音響〉,2008年阿姆斯特丹第124次AES會議。然而,具有如此措施之固有問題是,從未聽到訊號的感知編碼。重建之回放訊號,通常是由HOA係數序列加權合
計而得。這是解壓縮HOA表示描繪在特別揚聲器設置時,有揭露感知編碼雜訊高度或然之原因所在。以更技術性而言,感知編碼雜訊表露之主要問題是,個別HOA係數序列間之高度交叉相關性。因為個別HOA係數序列內所編碼雜訊訊號,通常彼此不相關,會發生感知編碼雜訊之構成性重疊,同時,無雜訊HOA係數序列在重疊時取消。又一問題是,上述交叉相關性導致感知編碼器效率降低。為了將此兩者效應減至最小,EP 2469742 A2擬議在感知編碼之前將HOA表示轉換成離離空間域內之等效表示。形式上,該等離散空間域係等同於複諧平面波震幅之空間密度的時域,其係於一些離散方向上取樣。該離散空間域訊號係因此以O習知時域訊號來表示,其可被解釋如來自取樣方向之一般平面波,且如果擴音器位在空間域轉換所假設之正確同樣方向,其亦相當於擴音器訊號。
轉換成離散空間域,會減少個別空間域訊號間的交叉相關性。然而,交叉相關性並未完全消除。較高交叉相關性之例為方向性訊號,其方向落在空間域訊號涵蓋的相鄰方向之中間。
上述方法之一主要缺點在於感知編碼訊號數為(N+1)2,且被壓縮HOA表示之資料率係以保真立體音響位階N呈二次方成長。
為了降低感知編碼訊號數,歐洲專利申請案EP 2665208 A1提出將HOA表示解壓縮為優勢方向訊號之一預定最大值以及一殘餘周圍分量。待感知編碼之訊號數
的減少可經由降低殘餘周圍分量的位階數來達成。此方法背後的基礎原理在於當藉由一較低位階的HOA表示表示具有足夠準確性的殘餘時,相對優勢方向訊號保留一高空間解析度。
只要滿足在音場上的假設,此方法便可運作的相當良好,即其係由少數優勢方向訊號(代表一般以完全位階N編碼的平面波函數)以及一不具方向性之殘餘周圍分量組成。然而,若接下來分解,該殘餘周圍分量仍包含一些優勢方向訊號,降階會導致誤差,其在表示接下來之解壓縮方面無疑地為可感知的。違反假設之HOA表示的典型例子就是以低於N的位階進行編碼之一般平面波。為了使音源表示更寬,此種位階低於N的一般平面波可由藝術創作artistic creation而產生,且易可藉由球形麥克風而與HOA音場表示的紀錄一併產生。在兩例子中,音場係以大量的高相關空間域訊號來表示(其解釋亦見「高階保真立體音響之空間解析度」一節)。
本發明欲解決之一問題在於消除歐洲專利申請案EP 2665208 A1中所述流程衍生的缺點,因此也避免了上述其他引用之習知文件中的缺點。此問題係藉由申請專利範圍第1與3項所揭露之方法來解決。使用這些方法之相對應裝置係揭露於申請專利範圍第2與4項中。
本發明改善了描述於歐洲專利申請案EP 2665208 A1中的HOA音場表示壓縮過程。首先,如同在EP 2665208 A1中,HOA表示係對於優勢音源之存在而被
分析,於其中該些方向係經估計的。以所知之優勢音源方向,HOA表示係被分解為一些代表一般平面波之優勢方向訊號以及一殘餘分量。然而,取代直接降低此殘餘HOA分量之位階,其係經轉換為離散空間域以於代表殘餘HOA分量之均勻取樣方向上得到一般平面波函數。之後,自優勢方向訊號預測這些平面波函數。此操作之理由是在於部份殘餘HOA分量係可能與優勢方向訊號高度相關。該預測可以為一簡單者以便於僅產生小量的輔助資訊。在最簡單的例子中,該預設係由一適當之比例調整與延遲所組成。最後,預測誤差係被轉換回HOA域並被視作為殘餘周圍HOA分量,其中係執行一位階降低。
有利的是,自該殘餘HOA分量中減去可預測之訊號的效果係用以降低其總功率以及優勢方向訊號的殘餘量,而且,在此方法中,亦降低了因位階降低而導致的分解誤差。
原則上,本發明之壓縮方法係適於壓縮用於一音場之一高階保真立體音響表示(以HOA來表示),該方法包含步驟:-自HOA係數之一目前時間框估計優勢音源方向;-基於該HOA係數以及基於該優勢音源方向分解該HOA表示為時域中之優勢方向訊號與一殘餘HOA分量,其中為了在代表該殘餘HOA分量之均勻採樣方向上得到平面波函數,將該殘餘HOA分量轉換為分離空間域,且其中該平面波函數係自該優勢方向訊號預測而得,因而提
供描述該預測之參數,而對應之預測誤差係被轉換回該HOA域;-降低該殘餘HOA分量之目前位階至一較低位階,產生一降階殘餘HOA分量;-解相關該降階殘餘HOA分量以得到對應之殘餘HOA分量時域訊號;-感知編碼該優勢方向訊號以及該殘餘HOA分量時域訊號以便提供壓縮之優勢方向訊號以及壓縮之殘餘HOA分量時域訊號。
原則上,本發明之壓縮裝置係適於壓縮用於一音場之一高階保真立體音響表示(以HOA來表示),該裝置包含:-用以自HOA係數之一目前時間訊框估計優勢音源方向之機構;-用以基於該HOA係數以及基於該優勢音源方向分解該HOA表示為時域中之優勢方向訊號與一殘餘HOA分量之機構,其中為了在代表該殘餘HOA分量之均勻採樣方向上得到平面波函數,將該殘餘HOA分量轉換為分離空間域,且其中該平面波函數係自該優勢方向訊號預測而得,因而提供描述該預測之參數,而對應之預測誤差係被轉換回該HOA域;-用以降低該殘餘HOA分量之目前位階至一較低位階,產生一降階殘餘HOA分量之機構;-用以解相關該降階殘餘HOA分量以得到對應之殘
餘HOA分量時域訊號之機構;-用以感知編碼該優勢方向訊號以及該殘餘HOA分量時域訊號以便提供壓縮之優勢方向訊號以及壓縮之殘餘HOA分量時域訊號之機構。
原則上,本發明之解壓縮方法係適於解壓縮根據上述壓縮方法所壓縮之一高階保真立體音響表示,該解壓縮方法包含步驟:-感知解碼該壓縮之優勢方向訊號以及該壓縮之殘餘分量訊號以便提供解壓縮之優勢方向訊號與於空間域中代表該殘餘HOA分量之解壓縮之時域訊號;-互相關該解壓縮之時域訊號以得到一對應之降階殘餘HOA分量;-延伸該降階殘餘HOA分量的位階至原位階以便提供一對應之解壓縮殘餘HOA分量;-使用該解壓縮之優勢方向訊號、該原位階解壓縮之殘餘HOA分量、該估計之優勢音源方向與描述該預測之該參數,組成HOA係數之一對應之壓縮與再組成框。
原則上,本發明之解壓縮裝置係適於解壓縮根據上述壓縮方法所壓縮之一高階保真立體音響表示,該解壓縮裝置包含:-用以感知解碼該壓縮之優勢方向訊號以及該壓縮之殘餘分量訊號以便提供解壓縮之優勢方向訊號與於空間域中代表該殘餘HOA分量之解壓縮之時域訊號之機構;-用以互相關該解壓縮之時域訊號以得到一對應之
降階殘餘HOA分量之機構;-用以延伸該降階殘餘HOA分量的位階至原位階以便提供一對應之解壓縮的殘餘HOA分量之機構;-用以使用該解壓縮之優勢方向訊號、該原位階解壓縮之殘餘HOA分量、該估計之優勢音源方向與描述該預測之該參數組成HOA係數之一對應的解壓縮與再組成框之機構。
本發明之其他有利實施例係個別揭露於附屬項中。
11‧‧‧優勢音源方向的估計
12‧‧‧HOA表示的分解
13‧‧‧位階降低
14‧‧‧解相關
15‧‧‧感知編碼
21‧‧‧感知解碼
22‧‧‧互相關
23‧‧‧位階延伸
24‧‧‧HOA表示的組成
30‧‧‧計算即時性方向訊號
31‧‧‧實施暫時性平滑化
32‧‧‧計算平滑化優勢方向訊號之HOA表示
33‧‧‧藉由均勻網格上之方向訊號表示殘餘HOA分量
34‧‧‧自優勢方向訊號預測均勻網格上之方向訊號
35‧‧‧計算均勻網格上之預測方向訊號之HOA表示
36‧‧‧實施暫時性平滑化
37‧‧‧計算殘餘周圍音場分量之HOA表示
381‧‧‧框延遲
382‧‧‧框延遲
383‧‧‧框延遲
41‧‧‧計算優勢方向訊號之HOA表示
42‧‧‧框延遲
43‧‧‧自優勢方向訊號預測均勻網格上之方向訊號
44‧‧‧計算均勻網格上之預測方向訊號之HOA表示
45‧‧‧實施暫時性平滑化
46‧‧‧組成總HOA音場表示
本發明之範例性實施例係參考附圖一併說明,該些附圖係繪示如:
第一A圖顯示壓縮步驟1:將HOA訊號轉為一些優勢方向訊號、一殘餘周圍HOA分量與輔助資訊之解壓縮;第一B圖顯示壓縮步驟2:對周圍HOA分量之位階降低與解相關以及兩分量的感知編碼;第二A圖顯示解壓縮步驟1:時域信號的感知解碼、代表殘餘周圍HOA分量之訊號的互相關與位階延伸;第二B圖顯示解壓縮步驟2:總HOA表示的組成;第三圖顯示高階保真立體音響解壓縮;第四圖顯示高階保真立體音響壓縮;以及第五圖顯示球面座標系統。
第六圖顯示對於不同位階值N之標準化函數ν N (θ)。
壓縮處理
根據本發明之壓縮處理包含分別描述於第一A圖與第一B圖中之兩個連續步驟。個別訊號的確切定義係描述於「保真立體音響(HOA)分解與再組成細說」一節中。使用一以訊框方式之流程,其係用於以長度B之HOA係數序列之非重疊輸入框D(k)的壓縮。其中k代表框指數。該些框係相對於具體說明於式(42)中之HOA係數序列而被定義為:D(k):=[d((kB+1)T S) d((kB+2)T S)...d((kB+B)T S)] (1)
其中,Ts代表取樣週期。
在第一A圖中,HOA係數序列之一訊框D(k)係經輸入至一優勢音源方向估計步驟或階段,其係於優勢方向訊號的存在下分析HOA表示,且其中該些方向係經估計的。上述方向估計可藉由例如歐洲專利申請案EP 2665208 A1所描述的流程來處理。所估計之方向可以,...,來表示,在此處,D代表方向估計的最大值。他們可經假設而被配置於一矩陣中為如:
暗自假設的是,該些方向估計可藉由將其分配至來自先前框之方向估計而被合適地安排。因此,一個別方向估計之暫時性序列係經假設為描述一優勢音源的方向軌道。具體地來說,若第d個優勢音源假定不為積極
者,則可能藉由分配一無效值給以將此指出。然後,使用在中之該些估計方向,HOA表示係於一分解步驟或階段12中分解為一些最大值D優勢方向訊號X DIR(k-1),一些描述自優勢方向訊號預測該殘餘HOA分量之該空間域訊號的參數ζ(k-1),以及一代表預測誤差之周圍HOA分量D A(k-2)。此分解之細述將提供於「HOA分解」一節中。
在第一B圖中,係顯示方向訊號X DIR(k-1)與殘餘周圍HOA分量D A(k-2)的感知編碼。方向訊號X DIR(k-1)係為常見之可單獨使用任何已知之感知壓縮技術來進行壓縮的時域訊號。殘餘HOA域分量D A(k-2)係經由兩連續步驟或階段來完成。在一位階降低步驟或階段13中,至保真立體音響位階N RED的降低係經完成,例如N RED=1,而產生周圍HOA分量D A,RED(k-2)。該等位階降低係藉由抑制D A(k-2)僅僅N RED HOA係數以及降低其他者來完成。在解碼器之一側,如下方解釋,對於省略值,相對應的零值係經附加上去。
必須注意的是,相較於歐洲專利申請案EP 2665208 A1中的方法,由於總功率以及殘餘周圍HOA分量之方向性的殘餘量較小,一般可挑選較小之降低位階N RED。因此,該位階降低相較於EP 2665208 A1造成較小的誤差。
在後續解相關步驟或階段14中,代表位階降低之周圍HOA分量D A,RED(k-2)的HOA係數序列係經解相關
以得到時域訊號W A,RED(k-2),其係輸入至(一排)平行之以任何已知的感知壓縮技術操作的感知編碼器或壓縮器15。上述解相關係經實施以於表示HOA表示緊接其解壓縮時避免感知編碼雜訊表露(其解釋請見歐洲專利申請案EP 12305860.4)。大抵之解相關可使用描述於EP 2469742 A2中之一球諧轉換將D A,RED(k-2)轉換為在空間域中之O RED等效訊號來達成。
另可選擇地,可使用如歐洲專利申請案EP 12305861.2所提出之一適合的球諧轉換,在此處,取樣方向之網格係被轉動以達到一最佳可能的解相關效果。。再一可選擇之解相關技術係為在歐洲專利申請案EP 12305860.4中所描述的Karhunen-Loève轉換(KLT)。值得注意的是,對於最後兩種型態的解相關,一些種類之輔助資訊(以α(k-2)表示)係為了於一HOA解壓縮階段使解相關的逆轉成為可行而被提供。
在一實施例中,為了改善編碼效率,所有時域訊號X DIR(k-1)與W A,RED(k-2)的感知壓縮係為共同實施的。
感知編碼的輸出係為壓縮之方向訊號以及壓縮之周圍時域訊號。
解壓縮處理
解壓縮處理係如第二A圖與第二B圖所示。與壓縮一樣,其係包含有兩連續步驟。在第二A圖中,在一感知解碼或解壓縮步驟或階段21中係實施方向訊號以及代表殘餘周圍HOA分量的時域訊號
之一感知解壓縮。為了提供位階N RED之殘餘分量HOA表示,所致之以感知方式解壓縮的時域訊號係於一互相關步驟或階段22中進行互相關。視情況地,該互相關係可如兩個在步驟/階段14描述之可選擇的流程所述以一相反的方式來完成,且其係使用基於已使用之解相關方法的傳送或儲存的參數α(k-2)。之後,於位階延伸步驟或階段23中,從,位階N之一適當的HOA表示係藉由位階延伸來估計。該位階延伸係藉附加對應”零”值列至來達成,因此假設該HOA係數相對於較高位階具有零值。
在第二B圖中,於一組成步驟或階段24中,總HOA表示不但從解壓縮之優勢方向訊號與對應之方向以及預測參數ζ(k-1),也從殘餘周圍HOA分量,再組成而產生解壓縮與再組成之HOA係數的訊框。
假設為了改善編碼效率而共同實施所有時域訊號X DIR(k-1)與W A,RED(k-2)的感知壓縮,壓縮之方向訊號以及壓縮之時域訊號is的感知解壓縮也會對應地共同實施。
上述再組成之細述將提供於「HOA再組成」一節中。
HOA分解
用以說明實施HOA分解之操作的一方塊圖係如第三圖所示。該操作係概述如下:首先,平滑化優勢方
向訊號X DIR(k-1)係經計算並輸出予感知壓縮。然後,介於優勢方向訊號之HOA表示D DIR(k-1)與原HOA表示間D(k-1)的殘餘係以一些O方向訊號來表示,其可被視作為來自均勻分散方向的一般平面波。這些方向訊號係自優勢方向訊號預測而得,在此處,該些預測參數ζ(k-1)係經輸出。最後,介於原HOA表示D(k-2)與HOA表示與優勢方向訊號之HOA表示D DIR(k-1)間的殘餘D A(k-2)以及來自均勻分散方向之預測方向訊號的HOA表示係經計算並輸出。
在進入細節前,要提到的是,連續框間之方向改變,會導致方向性訊號中斷。因此,對於重疊框之個別訊號的即時估計係優先計算,其具有一長度2B。接著,使用適當窗函數,連續重疊框之結果係使用適當窗函數進行平滑化。然而,每一次平滑化處理會導致一單框的潛侯期。
計算即時優勢方向訊號
在步驟或階段30中,自在中之估計音源方向,對於HOA表示序列之一目前訊框D(k),即時優勢方向訊號的計算係基於如M.Poletti於J.Audio Eng.Soc.,53(11),pages 1004-1025,2005發表之"基於球諧之三維環繞音響(Three-Dimensional Surround Sound Systems Based on Spherical Harmonics)"中的模態匹配。具體地來說,這些方向訊號係經調查哪一個HOA表示導致所給HOA訊號之最佳近似值。
再者,不失一般性地,一積極優勢音源之每一方向估計係經假設藉由包含有一傾斜角θ DOM,d(k)[0,π]與一方位角[0,2π](請見第五圖for illustration)之一向量根據
而可被明確地說明。
首先,基於積極優勢音源之方向估計的模態矩陣根據
與
來計算。
在式(4)中,D ACT(k)代表對於第k框之積極方向的數目,而d ACT,j (k)、1 j D ACT(k)表示其指數。代表實值球諧函數,其係於「實值球諧函數的定義」一節中說明。
其次,對於定義如下之第(k-1)框以及第k框,
與
計算包含所有優勢方向訊號之即時估計的矩陣,且此係經由兩個步驟來完成。在第一個步驟中,將對應消極方向之這些列中的方向訊號樣本被設置為
零,即:
在此處,M ACT(k)表示一組積極方向。在第二個步驟中,將對應積極方向的方向訊號樣本根據
之一矩陣配置而得。接著,此矩陣經計算以將誤差的歐幾裏德範數(Euclidean norm)減到最小
由下式得到答案:
瞬時平滑
對於步驟或階段31,因為其他類型的訊號可以一完全相似的方法來完成,故上述平滑係僅針對方向訊號進行解釋。該些方向訊號,1 d D的(其樣本係可根據式(6)包含於矩陣中)估計可藉由一適當窗函數w(l)開窗:
此窗函數必然滿足在重疊區域中使移動之窗(假設為B樣本之移動)合計等於1之條件:
窗函數之例,係使用下式界定之周期性Hamming窗賦予:
對於第(k-1)框之平滑化方向訊號係藉由開窗之即時估計的適當重疊根據下式計算而得:
對於第(k-1)框之所有平滑化方向訊號的樣本係以矩陣
與配置。
平滑化優勢方向訊號x DIR,d (l)係預期為一連續性訊號,其係可連續地被輸入至感知編碼器。
計算平滑化優勢方向訊號之HOA表示
自X DIR(k-1)與,為了照對於HOA組成實施之相同運算,平滑化優勢方向訊號之HOA表示係於步驟或階段32中依據該些連續性訊號x DIR,d (l)來計算。因為連續框之間方向估計的改變可導致一中斷,再一次計算長度2B之重疊框的即時HOA表示經計算並將連續重疊框的結果使用一適當的窗函數而平滑化處理。因此,HOA表示D DIR(k-1)可藉由下式而得D DIR(k-1)=Ξ ACT(k)X DIR,ACT,WIN1(k-1)+Ξ ACT(k-1)X DIR,ACT,WIN2(k-1) (18)
在此處,X DIR,ACT,WIN1(k-1):=
以及X DIR,ACT,WIN2(k-1):=
藉由均勻網格上之方向訊號表示殘餘HOA表示
自D DIR(k-1)與D(k-1)(即藉由延遲框381延遲之D(k)),藉由一均勻網格上之方向訊號的一殘餘HOA表示係於步驟或階段33中進行計算。此運算的目的係在於得到來自固定、近乎均勻分散之方向(亦稱作為網格方向)、1oO的方向訊號(即一般平面波函數)以表示該殘餘[D(k-2) D(k-1)]-[D DIR(k-2) D DIR(k-1)]。
首先,相對於網格方向,模態矩陣ΞGRID係計算如:
與
由於在整個壓縮過程中網格方向係固定的,網格方向Ξ GRID僅需計算一次即可。
個別網格上之方向訊號係可得到如:
自優勢方向訊號預測均勻網格上之方向訊號
自與X DIR(k-1),均勻網格上之方向訊號係於步驟或階段34中被預測。由來自方向訊號之網格方向、1 o O組成之均勻網格上之方向訊號的預測為了平滑化目的而係基於兩連續框,即(長度2B之)網格
訊號的延伸框係自平滑化優勢方向訊號的延伸框來預測
首先,包含在中之每一網格訊號、1 o O係分配給包含在中之一優勢方向訊號、1 d D。此分配係基於網格訊號與所有優勢方向訊號間標準化交叉相關函數的計算。具體地來說,該等優勢方向訊號係分配給網格訊號,其係提供標準化交叉相關函數的最高值。該分配的結果可藉由一分配函數f A,k-1:{1,...,O}→{1,...,D}分配第o個網格訊號給第f A,k-1(o)個優勢方向訊號而以公式表示。
其次,每一網格訊號係預測自經分配的優勢方向訊號。該預測網格訊號係藉由自經分配之優勢方向訊號
之延遲以及比例調整而計算如下
在此處,K o (k-1)代表比例因數而△ o (k-1)代表樣本延遲。這些參數係經選擇以降低預測誤差。
若預測誤差的功率大於該網格訊號本身之總功率,則該預測係被認為為失敗的。然後,個別預測參數可被設定為任何無效值。
值得注意的是,其他種型態的預測也是可能的。舉例來說,代替計算一全頻帶比例因數,亦可判斷感知位向之頻率頻帶的比例因數。然而,此種運算改善了在
輔助資訊之一增加量成本方面的預測。
所有預測參數可被配置於參數矩陣中如:
所有預測訊號、1 o O,係假設為配置於矩陣中。
計算均勻網格上之預測方向訊號的HOA表示
自根據
於步驟或階段35中計算預測網格訊號的HOA表示。
計算殘餘周圍音場分量的HOA表示
自(其係之一暫時性平滑化形式(在步驟/階段36))、自D(k-2)(其係D(k)之一雙框延遲形式(延遲381與383))、以及自D DIR(k-2)(其係D DIR(k-1)之一框延遲形式(延遲382)),殘餘周圍音場分量的HOA表示係藉由
於步驟或階段37中進行計算。
HOA再組成
在詳細描述第四圖中個別步驟或階段的詳細流程之前,先提供一總結。相對於均勻分散方向之方向訊號係使用預測參數而預測自解碼之優勢方向訊號。接著,總HOA表示係由優勢方向訊號之HOA表示、預測方向訊號之HOA表示
以及殘餘周圍HOA分量所組成。
計算優勢方向訊號之HOA表示
與係經輸入至一步驟或階段41中以判斷優勢方向訊號之一HOA表示。在自方向估計與計算模態矩陣Ξ ACT(k)與Ξ ACT(k-1)之後,基於對於第k框與第(k-1)框之積極音源的方向估計,優勢方向訊號之HOA表示係藉由下式而得:
在此處,X DIR,ACT,WIN1(k-1):=
以及X DIR,ACT,WIN2(k-1):=
自優勢方向訊號預測均勻網格上之方向訊號
與係經輸入至一步驟或階段43中以自優勢方向訊號預測均勻網格上之方向訊號。均勻網格上之預測方向訊號的延伸框係由元素根據
所組成,且其係藉由
預測自優勢方向訊號。
計算均勻網格上之預測方向訊號的HOA表示
在用以計算均勻網格上之預測方向訊號之HOA表示的一步驟或階段44中,該預測網格方向訊號之HOA表示係藉由下式而得:
在此處,Ξ GRID代表相對於該預測網格方向之模態矩陣(定義請見式(21))。
組成HOA音場表示
自(即藉由框延遲42延遲之,(其係步驟或階段45中之一暫時性平滑化形式)與,總HOA音場表示係最終於一步驟或階段46中組成如:
高階保真立體音響之基本原理
高階保真立體音響係基於在一緊密關注區域(compact area of interest,且其係經假設不具有音源)中一音場的描述。在該例中,音壓p(t,x)於時間t以及在關注區域中位置x的時空行為係實質上完全地藉由同質波動方程式(homogeneous wave equation)來偵測。後續係基於如第五圖所示之一球面座標系統。x軸係指向前方的位置,y軸指向左側,以及z軸指向頂端。在空間中之一位置係藉由一半徑γ>0來表示(即至座標原點的距離),一量測自極軸z之傾斜角θ [0,π]以及一自x軸在x-y平面
以逆時針方向量測之方位角[0,2π[。(.) T 代表轉移。
相對於以F t(.),代表之時間之音壓的傅里葉轉換(可見於由Earl G.Williams著教科書《傅里葉聲學》,列於應用算術科學第93卷,學術出版社,1999年),即以ω代表角頻率與i代表虛擬單位,可根據下式被展開成一系列球諧(Spherical Harmonics)
其中c s代表音速以及k代表角波數,其係藉由而與角頻率ω相關,j n (.)代表第一階之球貝塞爾(Bessel)函數,以及代表n皆與m度之實值球諧函數,其係定義於「實值球諧函數之定義」一節中。展開係數係僅基於角波數k。必須注意的是,其係經暗自假設該音壓為空間的有限頻寬。因此,該系列係於一較高的限度N相對於位階指數n而被截短,其係稱作為HOA表示的位階。
若該音場係藉由不同角頻率ω之諧平面波之一無限數值之一重疊來表示且係來自藉由角組合(angle tuple)之所有可能方向,其可知的是(請見B.Rafaely在〈聲場使用球形褶合在球體上之平面波分解〉所述,美國音響學會會刊第4卷第116期,2149-2157頁,2004年)平面波複振幅函數可藉由球諧展開來表示
其中,展開係數藉由係與展開係數by相關。
將個別係數假設為角頻率ω的函數,逆傅里葉轉換(以表示)的應用係提供如下時域函數
予於每一n階以及m度,其係可被收集於一單一向量中
在向量d(t)中之一時域函數的位置指數係經由n(n+1)+1+m而定。
最終保真立體音響格式使用一取樣頻率f S提供d(t)之樣本形式如
其中,T S=1/f S代表取樣週期。d(lT S)的元素亦稱作為保真立體音響係數。值得注意的是,時域訊號以及因此保真立體音響係數為實值。
實值球諧函數之定義
實值球諧函數係由下式而定
與而定。
相關連之勒讓德(Legendre)函數係以勒讓德多項式P n (x)而定義為
以及,不若在上述所指之E.G.Williams教科書,不具有Condon-Short-ley相位(-1) m 。
高階保真立體音響之空間解析度
來自一方向之一般平面波函數x(t)係藉由下式而表示於HOA中:
平面波振福之相對應的空間密度係given by
由式(48)可知,其係一般平面波函數x(t)與一空間分散函數ν N (θ)的產物,且可僅依據具有下述性質之介於Ω與Ω 0間的角度θ:
如預期,在一無限位階數的限度中,即N→∞,空間分散函數轉為一狄拉克δ(.),即。然而,在有限位階數N的例子中,來自方向Ω 0之一般平面波的貢獻係被模糊而至相鄰之方向,其中該模糊的程度會隨著一增加的位階而減少。對於不同位階值N之標準化函數ν N (θ)係繪示如第六圖。
必須指明的是,平面波振幅之空間密度之時域行為的任一方向Ω係為其於任何其他方向上之行為的倍數。具體的來說,對於一些固定方向Ω 1與Ω 2之函數d(t,Ω 1)與d(t,Ω 2)係相對於時間t而彼此高度相關。
離散空間領域
若平面波振福之空間密度係以一些O空間方向
Ω o、1 o O(其係近乎均勻地分散在單位球體上)離散,得到O方向訊號d(t,Ω o )。收集這些訊號為一向量:d SPAT(t):=[d(t,Ω 1)...d(t,Ω o )] T (51)
其可使用式(47)驗證此向量可藉由如d SPAT(t)=Ψ H d(t)(52)之一簡單矩陣乘法而自定義於式(41)中之連續保真立體音響表示來計算,在此處,(.) H 代表共同轉移與結合,而Ψ代表由Ψ:=[S 1...S O](53)與所定義之模態矩陣。
由於方向Ω o 係近乎均勻地分散於單位球體上,模態矩陣一般來說為可逆的。因此,該連續性保真立體音響表示係可藉由d(t)=Ψ -H d SPAT(t) (55)
而自方向訊號d(t,Ω o )來計算。
該些式均構成保真立體音響表示與空間域間之一轉換以及一逆轉換。在此應用中,這些轉換可稱作為球諧函數轉換以及逆球諧函數轉換。
由於方向Ω o 係近乎均勻地分散在單位球體上,,其證明了在式(52)中以Ψ -1代替Ψ H 的使用。
有利地,所有提及之關係亦對離散時間領域(discrete-time domain)有效。
在編碼之一側和在解碼之一側一樣,該些發明流程可藉由單一處理器或電路,或藉由數個並聯運作以及/或在發明流程之不同部份上運作之處理器或電路來完
成。
本發明可被應用於處理對應之聲音訊號,其係可於一家庭環境中之一喇叭設置上或於一劇院之一喇叭設置上表示或演示。
11‧‧‧優勢音源方向的估計
12‧‧‧HOA表示的分解
Claims (8)
- 一種用於音場之高階保真立體音響(HOA)表示的壓縮方法,該方法包含:從HOA係數之目前時間框,估計優勢音源方向;將該HOA表示分解為時域中之優勢方向訊號與殘餘HOA分量,其中為了在代表該殘餘HOA分量之均勻採樣方向上得到平面波函數,將該殘餘HOA分量轉換為離散空間域,以及其中該平面波函數係自該優勢方向訊號預測而得,因而提供描述該預測之參數;解相關該殘餘HOA分量,以得到對應的殘餘HOA分量時域訊號;感知地編碼該優勢方向訊號以及該殘餘HOA分量時域訊號,以判定壓縮的優勢方向訊號以及壓縮的殘餘HOA分量時域訊號。
- 如申請專利範圍第1項所述之方法,其中該分解包括:對於HOA係數優勢方向訊號之目前框,從該估計音源方向計算,暫時性的平滑化該優勢方向訊號,以判定平滑化優勢方向訊號;從該估計音源方向以及該平滑化優勢方向訊號,計算平滑化優勢方向訊號之HOA表示;藉由均勻網格上之方向訊號,代表相對應的殘餘HOA表示; 藉由方向訊號,從該平滑化優勢方向訊號和該殘餘HOA表示,預測均勻網格上之方向訊號,並基此計算均勻網格上預測方向訊號的HOA表示,接著進行暫時性平滑化處理;從均勻網格上之該平滑化預測方向訊號、從HOA係數之該目前框之雙框延遲形式以及從該平滑化優勢方向訊號之框延遲形式計算殘餘周圍音場分量的HOA表示。
- 一種用於壓縮音場之高階保真立體音響(HOA)表示的設備,該設備包含:估計器,其用以從HOA係數之目前時間框估計優勢音源方向;分解器,其用以將該HOA表示解壓縮為時域中之優勢方向訊號與殘餘HOA分量,其中為了在代表該殘餘HOA分量之均勻採樣方向上得到平面波函數將該殘餘HOA分量轉換為離散空間域,並且其中該平面波函數是從該優勢方向訊號預測而得因而提供描述該預測之參數;解相關器,其用以解相關該殘餘HOA分量以得到對應的殘餘HOA分量時域訊號;編碼器,其用以感知地編碼該優勢方向訊號以及該殘餘HOA分量時域訊號,以提供壓縮的優勢方向訊號以及壓縮的殘餘HOA分量時域訊號。
- 如申請專利範圍第3項所述之設備,其中該分解器更組態以:對於HOA係數優勢方向訊號之目前框,從該估計音 源方向計算,暫時性的平滑化該優勢方向訊號而導致平滑化優勢方向訊號;從該估計音源方向以及該平滑化優勢方向訊號計算平滑化優勢方向訊號之HOA表示;藉由均勻網格上之方向訊號代表相對應的殘餘HOA表示;藉由方向訊號從該平滑化優勢方向訊號和該殘餘HOA表示,預測均勻網格上之方向訊號,並基此計算均勻網格上預測方向訊號的HOA表示,接著進行暫時性平滑化處理;從均勻網格上之該平滑化預測方向訊號、從HOA係數之該目前框之雙框延遲形式以及從該平滑化優勢方向訊號之框延遲形式計算殘餘周圍音場分量的HOA表示。
- 一種用於壓縮的高階保真立體音響(HOA)表示的解壓縮方法,該方法包含:感知地解碼壓縮的優勢方向訊號以及壓縮的殘餘分量訊號,以提供解壓縮的優勢方向訊號與代表空間域中之該殘餘HOA分量之解壓縮的時域訊號;重新相關該解壓縮的時域訊號以得到對應的降階殘餘HOA分量;基於該對應的降階殘餘HOA分量判定解壓縮的殘餘HOA分量;基於至少一參數判定預測的方向訊號; 基於該解壓縮的優勢方向訊號、該預測的方向訊號以及該解壓縮殘餘HOA分量判定HOA音場表示。
- 一種用於解壓縮高階保真立體音響(HOA)表示的設備,該設備包含:解碼器,其用以感知地解碼壓縮的優勢方向訊號以及壓縮的殘餘分量訊號,以提供解壓縮的優勢方向訊號與代表空間域中之該殘餘HOA分量之解壓縮的時域訊號;重新相關器,其用以重新相關該解壓縮的時域訊號以得到對應的降階殘餘HOA分量;處理器,其組態以基於該對應的降階殘餘HOA分量而判定解壓縮的殘餘HOA分量,該處理器更組態以基於至少一參數判定預測的方向訊號;其中該處理器更組態以基於該解壓縮的優勢方向訊號、該預測的方向訊號以及該解壓縮殘餘HOA分量判定HOA音場表示。
- 一種非暫態電腦可讀取媒體,其含有根據申請專利範圍第1項所述之方法壓縮的數位音頻訊號。
- 一種非暫態電腦可讀取媒體,其含有根據申請專利範圍第5項所述之方法解壓縮的數位音頻訊號。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??12306569.0 | 2012-12-12 | ||
EP12306569.0A EP2743922A1 (en) | 2012-12-12 | 2012-12-12 | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201807703A true TW201807703A (zh) | 2018-03-01 |
TWI645397B TWI645397B (zh) | 2018-12-21 |
Family
ID=47715805
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106137200A TWI645397B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW107135270A TWI681386B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW111146080A TW202338788A (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW102144508A TWI611397B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW108142367A TWI729581B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW110115843A TWI788833B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107135270A TWI681386B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW111146080A TW202338788A (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW102144508A TWI611397B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW108142367A TWI729581B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
TW110115843A TWI788833B (zh) | 2012-12-12 | 2013-12-05 | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 |
Country Status (12)
Country | Link |
---|---|
US (7) | US9646618B2 (zh) |
EP (4) | EP2743922A1 (zh) |
JP (6) | JP6285458B2 (zh) |
KR (5) | KR102546541B1 (zh) |
CN (9) | CN109448743B (zh) |
CA (6) | CA3125228C (zh) |
HK (1) | HK1216356A1 (zh) |
MX (6) | MX344988B (zh) |
MY (2) | MY169354A (zh) |
RU (2) | RU2744489C2 (zh) |
TW (6) | TWI645397B (zh) |
WO (1) | WO2014090660A1 (zh) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9685163B2 (en) | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9980074B2 (en) | 2013-05-29 | 2018-05-22 | Qualcomm Incorporated | Quantization step sizes for compression of spatial components of a sound field |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
CN111179955B (zh) * | 2014-01-08 | 2024-04-09 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
CN106104681B (zh) | 2014-03-21 | 2020-02-11 | 杜比国际公司 | 对压缩的高阶高保真立体声(hoa)表示进行解码的方法及装置 |
EP2922057A1 (en) | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
KR102428794B1 (ko) | 2014-03-21 | 2022-08-04 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US10770087B2 (en) * | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
KR20230162157A (ko) * | 2014-06-27 | 2023-11-28 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 데이터 프레임들 중 특정 데이터 프레임들의 채널 신호들과 연관된 비차분 이득 값들을 포함하는 코딩된 hoa 데이터 프레임 표현 |
EP3860154B1 (en) | 2014-06-27 | 2024-02-21 | Dolby International AB | Method for decoding a compressed hoa dataframe representation of a sound field. |
CN113793618A (zh) * | 2014-06-27 | 2021-12-14 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
EP2963949A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
EP2963948A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
CN106463132B (zh) * | 2014-07-02 | 2021-02-02 | 杜比国际公司 | 对压缩的hoa表示编码和解码的方法和装置 |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
KR102460820B1 (ko) * | 2014-07-02 | 2022-10-31 | 돌비 인터네셔널 에이비 | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 |
KR102363275B1 (ko) * | 2014-07-02 | 2022-02-16 | 돌비 인터네셔널 에이비 | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 |
US9847088B2 (en) * | 2014-08-29 | 2017-12-19 | Qualcomm Incorporated | Intermediate compression for higher order ambisonic audio data |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
EP3007167A1 (en) * | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
US12087311B2 (en) | 2015-07-30 | 2024-09-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding an HOA representation |
EP3329486B1 (en) | 2015-07-30 | 2020-07-29 | Dolby International AB | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
US10257632B2 (en) | 2015-08-31 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Method for frame-wise combined decoding and rendering of a compressed HOA signal and apparatus for frame-wise combined decoding and rendering of a compressed HOA signal |
US10249312B2 (en) * | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
US9961467B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
US9961475B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
WO2017087650A1 (en) | 2015-11-17 | 2017-05-26 | Dolby Laboratories Licensing Corporation | Headtracking for parametric binaural output system and method |
US9881628B2 (en) * | 2016-01-05 | 2018-01-30 | Qualcomm Incorporated | Mixed domain coding of audio |
CN108476373B (zh) * | 2016-01-27 | 2020-11-17 | 华为技术有限公司 | 一种处理声场数据的方法和装置 |
WO2017157803A1 (en) | 2016-03-15 | 2017-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating a sound field description |
CN107945810B (zh) * | 2016-10-13 | 2021-12-14 | 杭州米谟科技有限公司 | 用于编码和解码hoa或多声道数据的方法和装置 |
US10332530B2 (en) * | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
US10777209B1 (en) * | 2017-05-01 | 2020-09-15 | Panasonic Intellectual Property Corporation Of America | Coding apparatus and coding method |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
US10264386B1 (en) * | 2018-02-09 | 2019-04-16 | Google Llc | Directional emphasis in ambisonics |
JP2019213109A (ja) * | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | 音場信号推定装置、音場信号推定方法、プログラム |
CN111193990B (zh) * | 2020-01-06 | 2021-01-19 | 北京大学 | 一种抗高频空间混叠的3d音频系统及实现方法 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG45281A1 (en) * | 1992-06-26 | 1998-01-16 | Discovision Ass | Method and arrangement for transformation of signals from a frequency to a time domain |
EP1230586B1 (en) | 1999-11-12 | 2011-10-12 | Jerry Moscovitch | Horizontal three screen lcd display system |
FR2801108B1 (fr) | 1999-11-16 | 2002-03-01 | Maxmat S A | Analyseur chimique ou biochimique a regulation de la temperature reactionnelle |
US8009966B2 (en) * | 2002-11-01 | 2011-08-30 | Synchro Arts Limited | Methods and apparatus for use in sound replacement with automatic synchronization to images |
KR100933548B1 (ko) * | 2005-04-15 | 2009-12-23 | 돌비 스웨덴 에이비 | 비상관 신호의 시간적 엔벨로프 정형화 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US8139685B2 (en) * | 2005-05-10 | 2012-03-20 | Qualcomm Incorporated | Systems, methods, and apparatus for frequency control |
JP4616074B2 (ja) * | 2005-05-16 | 2011-01-19 | 株式会社エヌ・ティ・ティ・ドコモ | アクセスルータ、サービス制御システム、サービス制御方法 |
TW200715145A (en) * | 2005-10-12 | 2007-04-16 | Lin Hui | File compression method of digital sound signals |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US8165124B2 (en) * | 2006-10-13 | 2012-04-24 | Qualcomm Incorporated | Message compression methods and apparatus |
WO2008096313A1 (en) * | 2007-02-06 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Low complexity parametric stereo decoder |
FR2916078A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
WO2009046223A2 (en) | 2007-10-03 | 2009-04-09 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
CN105225667B (zh) * | 2009-03-17 | 2019-04-05 | 杜比国际公司 | 编码器系统、解码器系统、编码方法和解码方法 |
US20100296579A1 (en) * | 2009-05-22 | 2010-11-25 | Qualcomm Incorporated | Adaptive picture type decision for video coding |
EP2268064A1 (en) * | 2009-06-25 | 2010-12-29 | Berges Allmenndigitale Rädgivningstjeneste | Device and method for converting spatial audio signal |
EP2285139B1 (en) * | 2009-06-25 | 2018-08-08 | Harpex Ltd. | Device and method for converting spatial audio signal |
AU2010305313B2 (en) * | 2009-10-07 | 2015-05-28 | The University Of Sydney | Reconstruction of a recorded sound field |
KR101717787B1 (ko) * | 2010-04-29 | 2017-03-17 | 엘지전자 주식회사 | 디스플레이장치 및 그의 음성신호 출력 방법 |
CN101977349A (zh) * | 2010-09-29 | 2011-02-16 | 华南理工大学 | Ambisonic声重发系统解码的优化改进方法 |
US8855341B2 (en) * | 2010-10-25 | 2014-10-07 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals |
EP2451196A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9190065B2 (en) * | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
EP2688066A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
KR102201713B1 (ko) * | 2012-07-19 | 2021-01-12 | 돌비 인터네셔널 에이비 | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
EP2800401A1 (en) * | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9980074B2 (en) * | 2013-05-29 | 2018-05-22 | Qualcomm Incorporated | Quantization step sizes for compression of spatial components of a sound field |
-
2012
- 2012-12-12 EP EP12306569.0A patent/EP2743922A1/en not_active Withdrawn
-
2013
- 2013-12-04 CA CA3125228A patent/CA3125228C/en active Active
- 2013-12-04 CA CA3168326A patent/CA3168326A1/en active Pending
- 2013-12-04 EP EP13801563.1A patent/EP2932502B1/en active Active
- 2013-12-04 US US14/651,313 patent/US9646618B2/en active Active
- 2013-12-04 CN CN201910024898.9A patent/CN109448743B/zh active Active
- 2013-12-04 KR KR1020227026512A patent/KR102546541B1/ko active IP Right Grant
- 2013-12-04 CN CN202311300470.5A patent/CN117392989A/zh active Pending
- 2013-12-04 CA CA2891636A patent/CA2891636C/en active Active
- 2013-12-04 CN CN201910024894.0A patent/CN109410965B/zh active Active
- 2013-12-04 CA CA3125248A patent/CA3125248C/en active Active
- 2013-12-04 CN CN201380064856.9A patent/CN104854655B/zh active Active
- 2013-12-04 JP JP2015546945A patent/JP6285458B2/ja active Active
- 2013-12-04 CN CN201910024906.XA patent/CN109545235B/zh active Active
- 2013-12-04 CN CN201910024905.5A patent/CN109616130B/zh active Active
- 2013-12-04 EP EP21209477.5A patent/EP3996090A1/en active Pending
- 2013-12-04 RU RU2017118830A patent/RU2744489C2/ru active
- 2013-12-04 MY MYPI2015001234A patent/MY169354A/en unknown
- 2013-12-04 RU RU2015128090A patent/RU2623886C2/ru active
- 2013-12-04 CA CA3168322A patent/CA3168322C/en active Active
- 2013-12-04 CN CN202310889802.1A patent/CN117037813A/zh active Pending
- 2013-12-04 MX MX2015007349A patent/MX344988B/es active IP Right Grant
- 2013-12-04 EP EP18196348.9A patent/EP3496096B1/en active Active
- 2013-12-04 KR KR1020247014936A patent/KR20240068780A/ko active Search and Examination
- 2013-12-04 CN CN201910024895.5A patent/CN109448742B/zh active Active
- 2013-12-04 CA CA3125246A patent/CA3125246C/en active Active
- 2013-12-04 CN CN202310889797.4A patent/CN117037812A/zh active Pending
- 2013-12-04 WO PCT/EP2013/075559 patent/WO2014090660A1/en active Application Filing
- 2013-12-04 KR KR1020157015332A patent/KR102202973B1/ko active IP Right Grant
- 2013-12-04 KR KR1020217000640A patent/KR102428842B1/ko active IP Right Grant
- 2013-12-04 KR KR1020237020580A patent/KR102664626B1/ko active IP Right Grant
- 2013-12-05 TW TW106137200A patent/TWI645397B/zh active
- 2013-12-05 TW TW107135270A patent/TWI681386B/zh active
- 2013-12-05 TW TW111146080A patent/TW202338788A/zh unknown
- 2013-12-05 TW TW102144508A patent/TWI611397B/zh active
- 2013-12-05 TW TW108142367A patent/TWI729581B/zh active
- 2013-12-05 TW TW110115843A patent/TWI788833B/zh active
-
2015
- 2015-06-10 MX MX2022008693A patent/MX2022008693A/es unknown
- 2015-06-10 MX MX2022008695A patent/MX2022008695A/es unknown
- 2015-06-10 MX MX2022008694A patent/MX2022008694A/es unknown
- 2015-06-10 MX MX2022008697A patent/MX2022008697A/es unknown
- 2015-06-10 MX MX2023008863A patent/MX2023008863A/es unknown
-
2016
- 2016-04-11 HK HK16104077.0A patent/HK1216356A1/zh unknown
-
2017
- 2017-02-16 US US15/435,175 patent/US10038965B2/en active Active
-
2018
- 2018-02-01 JP JP2018016193A patent/JP6640890B2/ja active Active
- 2018-06-26 US US16/019,256 patent/US10257635B2/en active Active
- 2018-11-07 MY MYPI2018704146A patent/MY191376A/en unknown
-
2019
- 2019-02-14 US US16/276,363 patent/US10609501B2/en active Active
- 2019-12-26 JP JP2019235978A patent/JP6869322B2/ja active Active
-
2020
- 2020-03-25 US US16/828,961 patent/US11184730B2/en active Active
-
2021
- 2021-04-13 JP JP2021067565A patent/JP7100172B2/ja active Active
- 2021-11-22 US US17/532,246 patent/US11546712B2/en active Active
-
2022
- 2022-06-30 JP JP2022105790A patent/JP7353427B2/ja active Active
- 2022-12-19 US US18/068,096 patent/US20230179940A1/en active Pending
-
2023
- 2023-09-19 JP JP2023151430A patent/JP2023169304A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI645397B (zh) | 用於音場之高階保真立體音響表示的壓縮與解壓縮方法及裝置 | |
JP2023093681A (ja) | 高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 | |
RU2823441C2 (ru) | Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля | |
RU2823441C9 (ru) | Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля |