TW201412145A - 多通道hoa聲訊訊號減少雜訊之編碼方法和裝置以及已減少雜訊的編碼多通道hoa聲訊訊號之解碼方法和裝置 - Google Patents

多通道hoa聲訊訊號減少雜訊之編碼方法和裝置以及已減少雜訊的編碼多通道hoa聲訊訊號之解碼方法和裝置 Download PDF

Info

Publication number
TW201412145A
TW201412145A TW102125017A TW102125017A TW201412145A TW 201412145 A TW201412145 A TW 201412145A TW 102125017 A TW102125017 A TW 102125017A TW 102125017 A TW102125017 A TW 102125017A TW 201412145 A TW201412145 A TW 201412145A
Authority
TW
Taiwan
Prior art keywords
dsht
channel
grid
spherical
sample
Prior art date
Application number
TW102125017A
Other languages
English (en)
Other versions
TWI602444B (zh
Inventor
約翰那斯 波漢
斯凡 柯登
亞歷山大 克魯格
彼德 賈克斯
Original Assignee
湯姆生特許公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 湯姆生特許公司 filed Critical 湯姆生特許公司
Publication of TW201412145A publication Critical patent/TW201412145A/zh
Application granted granted Critical
Publication of TWI602444B publication Critical patent/TWI602444B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一種多通道HOA聲訊訊號減少雜訊之編碼方法,包括步驟為,使用逆適應DSHT令諸通道解相關(31),逆適應DSHT包括旋轉操作(330)和逆DSHT(310),以旋轉操作旋轉iDSHT之空間抽樣柵格,以感知方式編碼(32)各解相關通道,編碼相關資訊(SI),相關資訊包括界定該旋轉操作之參數,以及傳送或儲存以感知方式編碼之聲訊通道和編碼之相關資訊。

Description

多通道HOA聲訊訊號減少雜訊之編碼方法和裝置以及已減少雜訊的編碼多通道HOA聲訊訊號之解碼方法和裝置
本發明係關於一種多通道高階保真立體音響(HOA)聲訊訊號減少雜訊之編碼方法和裝置,以及多通道HOA聲訊訊號減少雜訊之解碼方法和裝置。
HOA是一種多通道聲場表示法[附註4],而HOA訊號為多通道聲訊訊號。某些多通道訊號表示法,尤其是HOA表示法,在特殊擴音器設置上回放,需要特別描繪,往往包含矩陣化操作。解碼後,保真立體音響訊號「被矩陣化」,即映射到新聲訊訊號,相當於實際空間位置,例如擴音器。往往在單一通道之間有高度交相相關。
問題是在矩陣化操作後,會經驗到寫碼雜訊增加。在先前技術上,其原因未明。在以感知寫碼器壓縮之前,當HOA訊號例如利用分立球諧函數轉換法(DSHT),轉換到空間域時,也會發生此效應。
HOA聲訊訊號表示法之通常壓縮方法,是對個別保真立體音響係數通道[附註7],應用獨立感知寫碼器。詳言之,感知寫碼器只考慮到在各個別單通道訊號內發生的寫碼雜訊罩覆效果。然而,如此效果典型上為非線性。若將如此單通道矩陣化成新訊號,容易發生雜訊表露。在以感知寫碼器[附註8]壓縮之前,當HOA訊號利用分立球諧函數轉換法,轉換到空間域時,也會發生此效應。
此等多通道聲訊訊號表示法傳輸或儲存時,往往需要適當之多通道壓縮技術。通常進行通道獨立感知解碼,最後把I解碼訊號(l), i=1,...,I矩陣化成J新訊號(l),j=1,...,J。矩陣化(matrixing)意指以加權方式添加或混合解碼之訊號(l)。按照 把全部訊號(l),i=1,...,I,以及全部新訊號(l),j=1,...,J,以向量配置。「矩陣化」源自事實上(l)是以數學方式從(l)通過矩陣操作所得: 其中A指混合權值組成之混合矩陣。「混合」和「矩陣化」在此所用為同義字。使用混合/矩陣化之目的,是為任何特殊擴音器設置描繪聲訊訊號。矩陣所依賴的特殊個別擴音器設置,以及在描繪當中矩陣化所用矩陣,通常在感知寫碼階段尚未知。
本發明記載適應性分立球諧函數轉換法(aDSHT)技術,把雜訊表露效果(非所要)減到最小。又記載aDSHT如何整合到壓縮寫碼器結構內。所述技術至少對HOA訊號特別有益。本發明之一優點是,減少要傳送的副資訊量。
按照本發明一具體例,多通道HOA聲訊訊號減少雜訊之編碼方法,包括步驟為,使用逆適應DSHT令通道解相關,逆適應DSHT包括旋轉操作和逆DSHT(iDSHT),以旋轉操作旋轉iDSHT之空間抽樣柵格,以感知方式編碼各解相關通道,編碼相關資訊,相當資訊包括界定該旋轉操作之參數,並傳送或儲存以感知方式編碼之聲訊通道和編碼之相關資訊。相關資訊包括所用DSHT柵格之至少一識別符,而旋轉資訊界定DSHT柵格之適應旋轉。
按照本發明一具體例,寫碼多通道HOA聲訊訊號減少雜訊之解碼方法,包括步驟為,接收所編碼多通道HOA聲訊訊號和通道相關資訊,解壓縮所接收資料,使用DSHT以感知方式解碼各通道,把以感知方式解碼之通道相關化,其中按照該相關資訊進行DSHT之空間抽樣柵格旋轉,並把相關的感知方式解碼通道矩陣化,其中獲得映射於擴音器位置之可複製聲訊訊號。相關資訊包括所用DSHT柵格之至少一識別符,和界定DSHT柵格適應性旋轉之旋轉資訊。
多通道HOA聲訊訊號之編碼和解碼裝置,分別載於申請專利範圍第12和15項。
在一面向中,電腦可讀式媒體具有可執行指令,促成電腦進行包括上述步驟之編碼方法,或進行包括上述步驟之解碼方法。
本發明有利具體例,揭載於申請專利範圍附屬項、以下說明和附圖中。
31‧‧‧通道解相關步驟
32‧‧‧各解相關通道以感知方式編碼步驟
33‧‧‧接收資料解壓縮步驟
34‧‧‧各通道以感知方式解碼步驟
71‧‧‧緩衝器方塊
72‧‧‧pE方塊
73‧‧‧單編碼器方塊
74‧‧‧單解碼器方塊
75‧‧‧pD方塊
76‧‧‧緩衝器方塊
310‧‧‧逆DSHT
320‧‧‧找到最佳旋轉方塊
330‧‧‧旋轉操作方塊
340‧‧‧解碼器內之構成方塊DSHT
350‧‧‧pD之構成方塊Ψ f
第1圖表示M係數方塊壓縮率之已知編碼器和解碼器;第2圖表示使用習知DSHT(分立球諧函數轉換)和習知逆DSHT把HOA訊號轉換入空間域所用編碼器和解碼器;第3圖使用適應DSHT和適應逆DSHT把HOA訊號轉換入空間域用之編碼器和解碼器;第4圖表示測試訊號;第5圖表示編碼器和解碼器構成方塊內所用電碼簿之球面抽樣位置例;第6圖表示訊號適應DSHT構成方塊(pE和pD);第7圖為本發明第一具體例;第8圖為本發明第二具體例。
茲參見附圖說明本發明具體例。
第2圖表示已知系統,使用逆DSHT把HOA訊號轉換入空間域內。訊號經使用iDSHT 21、比率壓縮E1/解壓縮D1,進行轉換,並使用DSHT 24再轉換成係數域S24。與此不同的是,第3圖表示本發明系統:已知解決方法的DSHT處理方塊,以控制適應DSHT之處理方塊31,32取代。副資訊SI是在位元流bs內發送。
下述為數學模式,以界定和說明表露。假設指定分立時間多通道訊號,包含I通道x i (m),i=1,...,I,其中m指時間樣本索引。個別訊號可為即時或複數加值。把M樣本圖幅在時間樣本索引m START+1起頭,假設其中個別訊號為靜態。相對應樣本配置在矩陣,按照 X:=[x(m START+1),...,x(m START+M)] (1)
其中x(l):=[x 1(m),...,x I (m)] T (2)(.) T 指轉位。相對應實驗相關矩陣得自下式:Σ X :=X X H (3)其中(.) H 指聯合複數共軛和轉位。
新假設把多通道圖幅寫碼,因而在重建時引進寫碼錯誤雜訊。因此,重見圖幅樣本之矩陣以註明,是由真樣本矩陣X和寫碼雜訊組份E組成,如:
其中E:=[e(m START+1),...,e(m START+L)] (5)
e(m):=[e 1(m),...,e I (m)] T (6)
由於假設各通道已單獨寫碼,對i=1,...,I而言,可假設寫碼雜訊訊號e i (m)彼此獨立。利用此性能和假設,即雜訊訊號是零平均,雜訊訊號的實驗相關矩陣,如下式對角線矩陣所示: 其中diag(,...,)指在其對角線上有實驗雜訊訊號功率之對角線矩陣: 又一基本假設是,進行寫碼使對各通道滿足訊雜比(SNR)。不失一般通則,假設對各通道之預定SNR相等,即: 其中
茲考慮把重建訊號矩陣化成J新訊號y j (m),j=1,...,J。不引進任何寫碼錯誤,矩陣化訊號之樣本矩陣可如此表示:Y=AX (11)其中指混合矩陣,而其中Y:=[y(m START+1),...,y(m START+M)] (12)
y(m):=[y1(m),...,y J (m)] T (13)
然而由於寫碼雜訊,矩陣化訊號之樣本矩陣為: N係含矩陣化雜訊訊號的樣本之矩陣,可表達為:N=AE (15)
N=[n(m START+1)...n(m START+M)] (16)
其中n(m):=[n 1(m)...n j (m)] T (17)係時間樣本索引m時,全部矩陣化雜訊訊號之向量。
利用式(11),矩陣化無雜訊訊號之實驗相關矩陣,可以下式表示:Σ Y = X A H (18)
因此,第j個的矩陣化無雜訊訊號之實驗功率,即Σ Y 對角線上的第j個元件,可寫成: a j A H 的第j列,按照A H =[a 1...,a j ] (20)
同理,由式(15)可把矩陣化雜訊訊號之實驗相關矩陣改寫成:Σ X =A Σ E A H (21)
j個矩陣化雜訊訊號之實驗功率,即Σ X 對角線上之第j個元件,如下式:
因此,矩陣化訊號的實驗SNR可界定為: 使用式(19)和(22)可改寫成:
利用Σ X 分解成其對角線和非對角線組份,即:
並利用性質: 由假設(7)和(9),全部通道的SNR常數(SNR x )結果,最後為矩陣化訊號的實驗SNR得所需表現:
由此表現方式可見此SNR是由預定SNR,SNR x 乘以視訊號相關矩陣Σ X 之對角線和非對角線組份而定之項所得。具體而言,矩陣化訊號之實驗SNR等於訊號x i (m)彼此不相關時之預定SNR,使Σ X.NG變成零矩陣,即=SNR x 對全部j=1,...,J,若Σ X.NG=0 I×I (30)其中0 I×I 指零矩陣,有I行和列。意即若x i (m)相關,矩陣化訊號之實驗SNR令偏離預定SNR。在最壞情況,還低於SNR x 。此現象在此稱為矩陣化時雜訊表露。
下一段簡略介紹高階立體保真音響(HOA),並界定訊號待處理(資料率壓縮)。
HOA是根據精簡有利面積(假定無聲源)內聲場之說明。在此情況下,有利面積(在球面座標)內,於時間t和位置的聲壓p(t,x)之空間時間行為,在物理上完全由單相波方程式決定。可見聲壓相對於時間之傅里葉轉換式,即:P(ω,x)=F t {p(t,x)} (31)其中ω指角頻率(而F t { }相當於 p(t,x)e -ωt dt),可按照[附註10]展成球諧函數(SH)系列:
在方程式(32)內,c s 指聲速,而為角波數。又,j n (.)表示第一種球面Bessel函數,而階n(.)指階n和度m之球諧函數(SH)。關於聲場之完整資訊實際上含在聲場係數(k)內。
須知SH一般而言是複數加值函數。然而,利用其適當線性組合,可得即時加值函數,並相對於此等函數進行展開。
相對於方程式(32)內壓力聲場說明,聲場可界定為: 其中聲場或頻幅密度[附註9]D(k c s ,Ω)視角波數和角方向而定。源場可包含遠場/近場、分立/連續源[附註1]。聲場係數與聲場係數有關[附註1]: 其中是第二種球面Hankel函數,而r s 為與原點之源距離。(使用正頻率和第二種球面Hankel函數為入射波,關係到e-ikr。)
HOA界域內之訊號可在頻率域或時間域內,以聲場或聲場係數之逆傅里葉轉換式表示。以下說明假設使用聲場係數之時間域表示法為有限數: 式(33)內之有限序列在n=N截止。截止相當於空間帶寬限制。係數(或HOA通道)數為:O3D=(N+1)2對3D而言 (36)或O 2D =2N+1只為2D說明。對稍後以擴音器複製而言,係數包括一時間樣本m之聲訊資訊。可儲存或再傳送,因此為資料率壓縮之標的。係數之單一時間樣本可以有O 3D 元件之向量b(m)表示: M時間樣本以矩陣B表示: B :=[ b (m START+1), b (m START+2),.., b (m START+M)] (38)
聲場之二維度表示法可藉圓諧函數展開衍生。此可見於上述概述之特殊情況,使用固定傾角、係數之不同加值,和縮小設定於係數。因此,以下考慮全部可應用於2D表示法。則球體需以圓面取代。
以下說明從HOA係數域轉換至以通道為基本之空間域,或反之。方程式(33)可就單位球體,為l分立空間樣本位置,使用 時間域HOA係數改寫:
假設L Sd =(N+1)2球面樣本位置Ω i,可為HOA資料區塊B,以向量記號改寫: W =Ψ i B (40)其中 W :=[ w (m START+1), w (m START+2),.., w (m START+M)]而 代表L Sd 多通道訊號之單一時間樣本,而矩陣 其中向量。若很有規律選擇球面樣本位置,則矩陣Ψ f存在,而Ψ f Ψ i= I (41)其中IO 3D ×O 3D 識別矩陣。則相對應轉換成方程式(40),可界定為: B =Ψ f W (42)
方程式(42)把L sd 球面訊號轉換成係數域,可改寫成順向轉換: B =DSHT{ W } (43)其中DSHT{ }指分立球諧函數轉換。轉換O 3D 係數訊號相對應逆轉換為空間域,以形成L sd 通道為基本之訊號,而方程式(40)變成: W =iDSHT{ B } (44)
此項分立球諧函數轉換之定義,足夠在此考慮有關HOA資料之資料率壓縮,因為可以指定之係數B開始,且唯有 B =DSHT{iDSHT{ B }}的情況有益。分立球諧函數轉換更嚴格之定義可查[附註2]。為DSHT推衍此等位置之適當球面樣本位置和程序,可查[附註3,4,5,6]。抽樣柵格之實施例如第5圖所示。
具體而言,第5圖表示編碼器和解碼器構成方塊pE,pD所用電碼簿之球面抽樣位置例,即在第5a圖中L Sd =4,第5b圖中L Sd =9,第5c圖中L Sd =16,而在第5d圖,L Sd =25。
以下說明高階立體保真音響係數資料率壓縮和雜訊表露。首先,界定測試訊號以強調某些性能,用於下述。
位於方向之單一遠場源,以M分立時間樣本之向量 g =[g(m),...,g(M)] T 表示,可以HOA係數方塊代表,利用編碼: B g = yg T (45)其中矩陣 B g 類比方程式(38),且編碼向量 由在方向評估的共軛複合球諧函數組成(若使用即時加值SH,共軛沒有效果)。測試訊號 B g 可視為HOA訊號之最單純情況。更複雜訊號包含許多此等訊號疊置。
關於HOA通道直接壓縮,以下顯示當HOA係數通道被壓縮時,何以會發生雜訊表露。HOA資料B實際方塊的O3D係數通道之直接壓縮和解壓縮,會類比方程式(4)引進寫碼雜訊E:
假設常數一如方程式(9)。欲經擴音器重播此訊號,訊號需經描繪。此過程可由下式說明: 其中解碼矩陣(和 A H =[ a 1,..., a L ])而矩陣,保有L擴音器訊號之M時間樣本。此類比方程式(14)。應用上述所述考量,擴音器通道l之SNR可載明為(類比方程式(29)): 其中係第0個對角線元件,而Σ B .NG保持下式之非對角線元件:Σ B = B B H (49)
由於無法影響解碼矩陣A,因為希望能夠解碼至任意擴音器 佈置,矩陣Σ B 需變成對角線,以獲得。由方程式(45)和(49),( B = B g )Σ B = yg H g y H =c yy H 變成非對角線,有一定標量值c= g T g 。與 相較,在擴音器通道之訊雜比降低。但因在編碼階段,往往既不知源訊號g,又不知擴音器佈置,係數通道之直接損耗壓縮,會導致失控的表露效應,尤其是對低資料率。
以下說明使用DSHT後,當HOA係數在空間域內壓縮時,為何發生雜訊表露。
HOA係數資料B之現時方塊,如方程式(40)所示,於使用球諧函數轉換式壓縮之前,轉換成空間域: W Sd =Ψ i B (50)其中逆轉換矩陣Ψ i涉及L Sd O3D空間樣本位置,和空間訊號矩陣。此等經壓縮和解壓縮,並增加量化雜訊(類比方程式(4)): 其中寫碼雜訊組份E係按照方程式(5)。再假設SNR,則SNR Sd 是所有空間通道一定。訊號轉換為係數域方程式(42),使用轉換矩陣Ψ f,具有方程式(41)性能:Ψ f Ψ i= I 。係數之新方塊變成:
此訊號描繪至L擴音器訊號,應用解碼矩陣 A D 。此可用方程式(52)和 A = A D Ψ f改寫:
於此,A變成混合矩陣,其。方程式(53)應看做類比方程式(14)。再應用上述全部考量,擴音器通道l之SNR可類似方程式(29),由下式載明: 其中係第l個對角線元件,而保持非對角線元件,如下式:
因為無法影響 A D (如果能夠描繪於任何擴音器佈置),故對A無任何影響,需變成接近對角線,以保持所需SNR:使用方程式(45)之簡單測試訊號( B = B g ),則變成: 其中常數c=g T g。使用固定球諧函數轉換(Ψ i,Ψ ffixed),只有在很罕見甚至更壞情況成為對角線,已如上述,則此項視係數訊號空間性能而定。因此,HOA係數在球面域內之低率損耗壓縮,會導致SNR降低,以及失控之表露效果。
本發明基本概念是使用適應DSHT(aDSHT),係由DSHT空間抽樣柵格相對於HOA輸送訊號的空間性能之轉動所組成,和DSHT本身,把雜訊表露效果減到最小。
以下說明訊號適應DSHT(aDSHT),具有許多球面位置L Sd ,配合HOA係數O3D數量,見方程式(36)。首先選擇從缺值球面樣本柵格,一如習知非適應DSHT。對M時間樣本區塊而言,旋轉球面樣本柵格,使下式所示項之演算最少: 其中||是諸元件(矩陣行索引l和列索引j)之絕對值,而之對角線元件。此等於把方程式(54)之項最小化。選擇之從缺值球面抽樣柵格視HOA順序而定,即HOA係數O3D數量。所選擇型式之球面抽樣柵格隱然已知用於解碼,或可由所接收訊號推衍,例如從HOA順序或HOA係數之數量。
視覺上,此過程相當於DSHT球面抽樣柵格旋轉,其方式是單一空間樣本位置匹配最強源方向,如第4圖所示。使用方程式(45)之簡單測試訊號( B = B g ),可見方程式(55)之項 W Sd 變成向量,所有元件除了一個以外,都接近零。因此,變成接近對角線,可保持所需SNR
第4圖表示測試訊號 B g 轉換至空間域。在第4a圖內使用從缺值抽樣柵格,而在第4b圖內使用aDSHT之旋轉柵格。空間通道之相關值(以dB計),在相對應樣本位置周圍,以Voronoi分格之顏色/灰色變異表示。空間結構之各分格代表抽樣點,分格之明/暗代表訊號強度。由第4b圖可見,已發現最強源方向,並旋轉抽樣柵格,使其一側(即單一空間樣本位置)匹配最強源方向。此側以白色表示(相當於強源方向),而其他側均暗色(相當於低源方向)。在第4a圖,即旋轉之前,無側面匹配最強源方向,有若干側面多少呈灰色,意即在個別抽樣點接到相當可觀(但非最大)強度之聲訊訊號。
以下說明壓縮編碼器和解碼器內所用aDSHT之主要構成方塊。
編碼器和解碼器構成方塊pE和pD細節,如第6圖所示。二種方塊擁有DSHT基礎之球面抽樣位置柵格之同樣電碼簿。起先,按照 共同電碼簿,使用係數O3D數選擇模組pE內L Sd =O3D位置之基礎柵格。L Sd 必須傳送至方塊pD,以啟動選擇同樣基礎之抽樣位置柵格,如第3圖所示。基礎抽樣柵格以矩陣說明,其中界定在單元球體上之位置。如上所述,第5圖表示基礎柵格之實施例。
輸入到旋轉尋找方塊(構成方塊「找到最佳旋轉」)320的是係數矩陣B。構成方塊負責旋轉基礎抽樣柵格,使方程式(57)值最小。旋轉是以「軸角度」表示法表示,而壓縮軸ψ rot 和與此旋轉有關之旋轉角度ψ rot ,輸出至此構成方塊,做為副資訊SI。旋轉軸ψ ror 可由原點至單元球體上位置之單元向量說明。於球面座標內,可由兩個角度聯結,隱含不需傳送之一角度的相關半徑。三個角度θ axis , rot 經量化,並以特殊逃逸圖型訊號加以熵寫碼,再用先前值創造SI。
構成方塊'Build Ψ i' 330解碼旋轉軸和角度至,並應用此旋轉於基礎抽樣柵格,以推衍旋轉柵格。輸出iDSHT矩陣,係由向量推衍。
在構成方塊'iDSHT' 310內,HOA係數資料B之實際方塊,利用 W Sd =Ψ i B 轉換入空間域。
pD之構成方塊'Build Ψ f' 350解碼旋轉軸和角度至,並應用此旋轉於基礎抽樣柵格,以推衍旋轉柵格 iDSHT矩陣是以向量 推衍,而DSHT矩陣Ψ f=Ψ i -1是在解碼側計算。
在解碼器34之構成方塊'DSHT' 340內,空間域資料之實際方塊轉換回到係數域資料方塊
以下說明諸有益具體例,含有壓縮寫解碼器之總體構造。第一具體例可用單一aDSHT。第二具體例使用複數aDSHT於頻帶內。
第7圖表示編碼器和解碼器二者之第一(基礎)具體例。具有O3D係數通道b(m)的索引m之HOA時間樣本,先儲存於緩衝器71內,形成M樣本和時間索引μ之方塊。 B (μ)轉換成空間域,是使用構成方塊pE72內之適應iDSHT,已如上述。空間訊號方塊 W Sd (μ)輸入至L Sd 聲訊壓縮 單編碼器73,像AAC或MPEG-1層3(mp3)編碼器,或單一AAC多通道編碼器(L Sd 通道)。位元流S73由複數編碼器位元流圖幅之多工化圖幅組成,具有整合副資訊SI,或整合副資訊SI之單一多通道位元流,以輔助資料為佳。
亦第7圖所示之各壓縮解碼器構成區塊,在一具體例中,把位元流解多工化,成為L Sd 位元流加副資訊SI,把位元流饋送至L Sd 單解碼器,解碼至具有M樣本之L Sd 空間聲訊通道,形成方塊(μ)(在第7圖的方塊74內兼含在L Sd 單解碼器內之解多工化和解碼),並把(μ)和副資訊SI饋送至訊號適應DSHT解碼構成方塊pD。
在另一具體例中,各壓縮解碼器構成方塊包括,例如從儲存器接收位元流,加以解碼成L Sd 多通道訊號(μ),把副資訊SI解封裝,饋送多通道訊號(μ)和副資訊SI至訊號適應DSHT解碼構成方塊pD。在此具體例中,副資訊之解封裝和在L Sd 單解碼器內解碼,包含在第7圖之方塊74內。
在訊號適應DSHT解碼構成方塊pD內,(μ)使用具有副資訊SI的適應DSHT,轉換至係數域,形成HOA訊號 B (μ)方塊,儲存於緩衝器內,有待解幅以形成係數之時間訊號b(m)
(μ)在pD內使用具有SI之適應DSHT轉換至係數域,形成HOA訊號 B (μ)之方塊,儲存於緩衝器內以待解幅。經解幅後,形成係數之時間訊號b(m)
上述第一具體例在某些條件,會有二缺點:第一,由於空間訊號分佈變更,從方塊μ至μ+1會有分塊人為誤差。第二,同時會有超過一個強訊號,故aDSHT之解相關效果相當小。二缺點均在頻率域內操作的第二具體例內定址和改進。aDSHT應用於標度因數頻帶資料,兼併複數頻帶資料。利用時間頻率轉換(TFT)之疊合方塊,以覆層添加(OLA)處理,避免分塊人為誤差。使用本發明在J譜帶內,可達成改進解相關,代價是傳送SIj資料率增加常務。
第二具體例有些細節如第8圖所示,說明如下:訊號b(m)之各係數通道,經時間頻率轉換(TFT)。廣用TFT之一例為改質餘弦轉換(MDCT)。在TFT成幅中,構成50%疊合方塊(方塊索引μ),而TFT指方 塊轉換。在譜帶化中,TFT頻率帶組合形成J新譜帶和有關訊號,其中K J 指帶j內頻率係數之數量。對各譜帶有一處理方塊 pE j ,製作訊號和副資訊SIj。譜帶可匹配損耗聲訊壓縮法之譜帶(像AAC/mp3標度因數帶),或具有較粗之顆粒性。在後一情況,「無TFT之通道獨立損耗聲訊壓縮」方塊,需把譜帶化重新配置。處理方塊作用像頻率域內之多通道聲訊編碼器,把一定位元率分配到各聲訊通道。位元流在位元流封裝中格式化。
解碼器接收並儲存部份位元流,解封裝並饋送聲訊資料至多通道聲訊解碼器(「無TFT之通道獨立聲訊解碼」),以及副資訊SijpD j 。聲訊解碼器(「無TFT之通道獨立聲訊解碼」)解碼聲訊資訊,格式化J譜 帶訊號(μ),輸入至pD j ,此等訊號在此轉換至HOA係數域,形成(μ)。在「譜解帶化」中,J譜帶重新組群,以匹配TFT之帶化。即轉換在iTFT& OLA內,以方塊疊合覆層添加處理,轉換至時間域。輸出經解幅,製作訊號(m)。
本發明係基於發現通道間之交叉相關結果,SNR提高。感知寫碼器只會考慮寫碼雜訊表露效果,發生在各個別單通道訊號內。然而,此等效果典型上非線性。因此,當此等單通道矩陣化成為新訊號,即容易發生雜訊表露。此即矩陣化操作後,何以寫碼雜訊會增加之故。
本發明擬議諸通道解相關,利用適應分立球諧函數轉換(aDSHT),把不良的雜訊表露效果減到最少。aDSHT係整合在壓縮式寫碼器和解碼器構造內。
其適應因包含旋轉操作,把DSHT之空間抽樣柵格調節至HOA輸入訊號之空間性能。aDSHT包括適應旋轉和實際習知DSHT。實際習知DSHT是一種矩陣,可按先前技術構成。適應旋轉應用於矩陣,導致通道間相關之最小化,所以矩陣化後之SNR增加最少。在一具體例中,旋轉軸和角度係由自動化搜尋操作找出。在另一具體例中,旋轉軸和角度是以分析方式找出。旋轉軸和角度經編碼和傳送,致能於解碼後和矩陣化之前,使用逆適應DSHT(iaDSHT)再相關。
適應DSHT與其他轉換相較,尤其與Karhunen-Loève轉換(KLT)相較,有其特別優點。aDSHT之一特點是,旋轉aDSHT之空間抽樣 柵格。為正確解碼,需旋轉資訊,包括旋轉軸和旋轉角度。旋轉軸和旋轉角度做為副資訊SI傳送。旋轉軸亦可以藉二角度表達。諸如KLT等其他轉換,適於旋轉和鏡映座標系統,但不能運動抽樣點。又,諸如KLT等其他轉換,需要轉換矩陣供正確解碼,故轉換矩陣之係數需當做副資訊SI傳送。因此,由於此等轉換矩陣之係數,資料遠較aDSHT的旋轉軸和旋轉角度為多,使用aDSHT之一優良效果是,減少待傳送的副資訊SI量。aDSHT之另一優點是由於空間適應性,提供在聲訊訊號內之改進連續性。諸如KLT等其他轉換,容易導致訊號不連續,為通常妨礙其用途之問題所在。此問題也是用aDSHT解決。
在一具體例中,進行時間頻率轉換(TFT)和譜帶化,而aDSHT/iaDSHT單獨應用於各譜帶。
在一具體例中,一種多通道HOA聲訊訊號減少雜訊之編碼方法包括步驟為:使用逆適應DSHT令通道解相關(31),逆適應DSHT包括旋轉操作(330)和逆DSHT(310),以旋轉操作旋轉iDSHT之空間抽樣柵格;以感知方式編碼(32)各解相關通道;編碼旋轉資訊(SI),旋轉資訊包括界定該旋轉操作之參數;以及傳送或儲存以感知方式編碼之聲訊通道和編碼之旋轉資訊。
一具體例另外包括,也傳送或儲存所用球面DSHT柵格索引(即DSHT抽樣柵格型式,例如其順序)。
在一具體例中,逆適應DSHT包括步驟為,選擇起初從缺值球面樣本柵格;測定最強源方向;為M時間樣本方塊,旋轉球面樣本柵格,使單一空間樣本位置匹配最強源方向。
在一具體例中,旋轉球面樣本柵格,使此項 之演算法減到最少,其中||是諸元件(具有矩陣行索引l和列 索引j)之絕對值,而之對角線元件。如上所述,是按照計算,其中 W Sd =Ψ i B 是旋轉抽樣柵格的逆轉換矩陣Ψ i和輸入訊號方塊B之乘積,而是其聯合複合共軛。
在一具體例中,一種寫碼多通道HOA聲訊訊號減少雜訊之解碼方法包括步驟為,接收所編碼多通道HOA聲訊訊號、球面DSHT柵格索引和通道旋轉資訊(SI);把所接收資料解壓縮(33);使用適應DSHT以感知方式解碼(34);把以感知方式解碼之通道相關化,其中按照該旋轉資訊(SI)進行適應DSHT的空間抽樣柵格之旋轉;以及把相關的感知方式解碼之通道矩陣化,其中獲得映射於擴音器位置之可複製聲訊訊號。球面DSHT柵格索引是抽樣柵格之獨特識別符,故容許解碼器在旋轉之前,重建抽樣柵格。柵格本身(即柵格點之座標)不需傳送、儲存或接收。
在一具體例中,適應DSHT包括步驟為,為適應DSHT選擇起初從缺值樣本柵格;為M時間樣本方塊,按照該相關資訊旋轉球面樣本柵格。
在一具體例中,相關資訊係具有二或三組份之空間向量ψ rot
在一具體例中,相關資訊係包括二角度之空間向量()。
在一具體例中,角度經量化,並以特殊逃逸圖型進行熵寫碼,發訊再用先前數值,以製作副資訊(SI)。
在一具體例中,一種多通道HOA聲訊訊號減少雜訊之編碼裝置,包括解相關器,使用逆適應DSHT把諸通道解相關,逆適應DSHT包括旋轉操作和逆DSHT(iDSHT),以旋轉操作旋轉iDSHT之空間抽樣柵格;感知編碼器(E),以感知方式編碼各解相關通道;副資訊編碼器,供編碼旋轉資訊,旋轉資訊包括界定該旋轉操作之參數;和界面,供傳送或儲存以感知方式編碼之聲訊通道和所編碼旋轉資訊。
在一具體例中,編碼裝置包括轉換機構,供進行逆適應DSHT,轉換機構具有處理器,以選擇初步從缺值球面樣本柵格,決定最強源方向,並為M時間樣本方塊,旋轉球面樣本柵格,使單一空間樣本位置匹配最強源方向。
在一具體例中,一種多媒體HOA聲訊訊號減少雜訊之解碼裝置包括界面機構,供接收所編碼多通道HOA聲訊訊號、球面DSHT柵格索引和通道旋轉資訊;解壓縮模組,把所接收資料解壓縮;感知解碼器, 使用DSHT以感知方式解碼各通道;相關器,使感知方式解碼之通道相關化,其中按照該旋轉資訊,進行旋轉DSHT之空間抽樣柵格;以及混合器,把已相關的感知方式解碼之通道矩陣化,其中獲得映射在擴音器位置之可複製聲訊訊號。
在一具體例中,解碼裝置包括處理器,為適應DSHT選擇初步從缺值球面樣本柵格,並為M時間樣本之方塊,按照該相關資訊,旋轉球面樣本柵格。
在全部具體例中,減少雜訊至少關係到避免寫碼雜訊表露效果。
聲訊訊號之感知寫碼,意指適於人員感知聲訊之寫碼。須知以感知方式寫碼聲訊訊號時,量化通常不是對寬頻聲訊訊號樣本,而是與人員感知有關之個別頻帶進行。因此,訊號功率與量化雜訊之比,可在個別頻帶之間變化。
上述技術可看做是對使用Karhunen-Loève轉換(KLT)解相關之改進替項。
本發明已就較佳具體例圖示、說明,並舉出基本新穎特點,須知技術專家均可就所述裝置和方法、所揭示機件形式和細節及其操作,進行各種省略、置換、變更,不違本發明之精神。凡以實質上同樣方式,進行實質上同樣功用,以達成同樣結果的此等元件之組合,均在本發明範圍內。由一具體例之元件置換另一件,亦完全在意圖和設想之內。
須知本發明純就實施例加以說明,可進行細部修飾,不違本發明範圍。
說明書和(適當時)申請專利範圍及附圖之各特點,可單獨或以任何適當組合方式提供。諸特點可視適當情形在硬體、軟體,或二者組合方式實施。連接可視應用情形,實施無線連接或有線連接,不一定直接或專用。申請專利範圍內出現之參考數字只供說明,對申請專利範圍無限制效用。
附註文獻
[1] T.D. Abhayapala. Generalized framework for spherical microphone arrays: Spatial and frequency decomposition. In Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), (accepted) Vol. X, pp., April 2008, Las Vegas, USA.
[2] James R. Driscoll and Dennis M. Healy Jr. Computing fourier transforms and convolutions on the 2-sphere. Advances in Applied Mathematics, 15:202-250, 1994.
[3] JörgFliege. Integration nodes for the sphere,http://www.personal.soton.ac.uk/jflw07/nodes/nodes.html
[4] JörgFliege and Ulrike Maier. A two-stage approach for computing cubature formulae for the sphere. Technical Report, Fachbereich Mathematik, Universität Dortmund, 1999.
[5] R. H. Hardinand N. J. A. Sloane. Webpage: Spherical designs, spherical t-designs. http://www2.research.att.com/~njas/sphdesigns
[6] R. H. Hardin and N. J. A. Sloane. Mclaren’s improved snub cube and other new spherical designs in three dimensions. Discrete and Computational Geometry, 15:429-441, 1996.
[7] Erik Hellerud, Ian Burnett, Audun Solvang, and U. Peter Svensson. Encoding higher order Ambisonics with AAC. In 124th AES Convention, Amsterdam, May 2008.
[8] Peter Jax, Jan-Mark Batke, Johannes Boehm, and Sven Kordon. Perceptual coding of HOA signals in spatial domain. European patent application EP2469741A1 (PD100051).
[9] Boaz Rafaely. Plane-wave decomposition of the sound field on a sphere by spherical convolution. J. Acoust. Soc. Am., 4(116):2149-2157, October 2004.
[10] Earl G. Williams. Fourier Acoustics, volume 93 of Applied Mathematical Sciences. Academic Press, 1999.
31‧‧‧通道解相關步驟
32‧‧‧各解相關通道以感知方式編碼步驟
33‧‧‧接收資料解壓縮步驟
34‧‧‧各通道以感知方式解碼步驟
310‧‧‧逆DSHT
340‧‧‧解碼器內之構成方塊DSHT

Claims (19)

  1. 一種多通道HOA聲訊訊號減少雜訊之編碼方法,包括步驟為:使用逆適應DSHT令諸通道解相關(31),逆適應DSHT包括旋轉操作(330)和逆DSHT(310),以旋轉操作旋轉iDSHT之空間抽樣柵格;以感知方式編碼(32)各解相關通道;編碼旋轉資訊(SI),旋轉資訊包括界定該旋轉操作之參數;傳送或儲存以感知方式編碼之聲訊通道、球面DSHT柵格索引和所編碼旋轉資訊者。
  2. 如申請專利範圍第1項之方法,其中逆適應DSHT包括步驟為:選擇起初從缺值球面樣本柵格;決定最強源方向;為M時間樣本方塊,旋轉球面樣本柵格,使單一空間樣本位置匹配最強源方向者。
  3. 如申請專利範圍第1或2項之方法,其中旋轉球面樣本柵格,使下式所示項之演算減到最少: 其中||係(具有矩陣行索引l和列索引j)諸元件之絕對值,之對角線元件,且其中,其 W Sd =Ψ i B 係轉抽樣柵格的逆轉換矩陣Ψ i和輸入訊號方塊B的乘積,而係其聯合複雜共軛者。
  4. 如申請專利範圍第1至3項之任一項方法,其中相關資訊係具有二或三組份之空間向量ψ rot 者。
  5. 如申請專利範圍第4項之方法,其中相關資訊係包括二角度之空間向量()者。
  6. 一種已減少雜訊的編碼多通道HOA聲訊訊號之解碼方法,包括步驟為:接收編碼之多通道HOA聲訊訊號、球面DSHT柵格索引和通道旋轉資訊(SI); 把所接收資料解壓縮(33);使用適應DSHT,以感知方式解碼(34)各通道;令以感知方式解碼之通道相關,其中按照該旋轉資訊(SI),進行旋轉適應DSHT之空間抽樣柵格;把相關以感知方式編碼之通道矩陣化,其中獲得映射於擴音器位置之可複製聲訊訊號者。
  7. 如申請專利範圍第6項之方法,其中適應DSHT包括步驟為:為適應DSHT,選擇起初從缺值球面樣本柵格;為M時間樣本方塊,按照該相關資訊,旋轉球面樣本柵格者。
  8. 如申請專利範圍第6或7項之方法,其中相關資訊係具有二或三組份之空間向量ψ rot 者。
  9. 如申請專利範圍第8項之方法,其中相關資訊係包括二角度之空間向量()者。
  10. 如申請專利範圍第9項之方法,其中角度經量化,以特殊逃逸圖型加以熵寫碼,發訊再用先前數值,以製作副資訊(SI)者。
  11. 如申請專利範圍第6至10項之任一項方法,其中適應DSHT在頻率域內操作,並應用於標度因數帶資料,組合複數頻率帶資料者。
  12. 一種多通道HOA聲訊訊號減少雜訊之編碼裝置,包括:解相關器,使用逆適應DSHT,令諸通道解相關,逆適應DSHT包括旋轉操作和逆DSHT(iDSHT),以旋轉操作旋轉iDSHT之空間抽樣柵格;感知編碼器(E),以感知方式編碼各解相關之通道;副資訊編碼器,供編碼旋轉資訊,旋轉資訊包括界定該旋轉操作之參數;界面,供傳送或儲存以感知方式編碼之聲訊通道、球面DSHT柵格索引和所編碼旋轉資訊者。
  13. 如申請專利範圍第12項之裝置,其中解相關器包括:轉換機構,以進行逆適應DSHT,轉換機構具有處理器,供:選擇起初從缺值球面樣本柵格;決定最強源方向; 為M時間樣本,旋轉球面樣本柵格,使單一空間樣本位置匹配最強源方向者。
  14. 如申請專利範圍第12或13項之裝置,其中旋轉球面樣本柵格,使下式所示項之演算減到最少: 其中||係(具有矩陣行索引l和列索引j)諸元件之絕對值,而 的對角線元件,而其中,其 W Sd =Ψ i B 係轉抽樣柵格的逆轉換矩陣Ψ i和輸入訊號方塊B的乘積,而係其聯合複雜共軛者。
  15. 一種多通道HOA聲訊訊號減少雜訊之解碼裝置,包括:界面機構,接收已編碼多通道HOA聲訊訊號、球面DSHT柵格索引和通道旋轉資訊;解壓縮模組,把所接收資料解壓縮;感知解碼器,使用DSHT,以感知方式解碼各通道;相關器,令以感知方式解碼之諸通道相關化,其中按照該旋轉資訊,進行DSHT空間抽樣柵格之旋轉;混合器,把已相關以感知方式解碼之通道矩陣化,其中獲得映射於擴音器位置之可複製聲訊訊號者。
  16. 如申請專利範圍第15項之裝置,其中適應DSHT包括處理器:為適應DSHT,選擇起初從缺值球面樣本柵格;為M時間樣本方塊,按照該相關資訊,旋轉球面樣本柵格者。
  17. 如申請專利範圍第15或16項之裝置,其中相關資訊係具有二或三組份之空間向量ψ rot 者。
  18. 如申請專利範圍第17項之裝置,其中相關資訊係包括二角度之空間向量()者。
  19. 一種電腦可讀式機構,具有所儲存可執行指令,在電腦上執行時,促成電腦進行申請專利範圍第1項之編碼方法者。
TW102125017A 2012-07-16 2013-07-12 編碼多通道hoa聲訊訊號以減少雜訊之方法和裝置以及對已減少雜訊的編碼多通道hoa聲訊訊號解碼之方法和裝置 TWI602444B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP12305861.2A EP2688066A1 (en) 2012-07-16 2012-07-16 Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction

Publications (2)

Publication Number Publication Date
TW201412145A true TW201412145A (zh) 2014-03-16
TWI602444B TWI602444B (zh) 2017-10-11

Family

ID=48874263

Family Applications (4)

Application Number Title Priority Date Filing Date
TW102125017A TWI602444B (zh) 2012-07-16 2013-07-12 編碼多通道hoa聲訊訊號以減少雜訊之方法和裝置以及對已減少雜訊的編碼多通道hoa聲訊訊號解碼之方法和裝置
TW108124752A TWI691214B (zh) 2012-07-16 2013-07-12 解碼高階立體音響(hoa)聲訊訊號之方法和設備及其電腦可讀取媒體
TW106123691A TWI674009B (zh) 2012-07-16 2013-07-12 解碼已編碼高階立體音響(hoa)聲訊訊號之方法和裝置
TW109108444A TWI723805B (zh) 2012-07-16 2013-07-12 解碼高階立體音響(hoa)聲訊訊號之方法和設備及其電腦可讀取媒體

Family Applications After (3)

Application Number Title Priority Date Filing Date
TW108124752A TWI691214B (zh) 2012-07-16 2013-07-12 解碼高階立體音響(hoa)聲訊訊號之方法和設備及其電腦可讀取媒體
TW106123691A TWI674009B (zh) 2012-07-16 2013-07-12 解碼已編碼高階立體音響(hoa)聲訊訊號之方法和裝置
TW109108444A TWI723805B (zh) 2012-07-16 2013-07-12 解碼高階立體音響(hoa)聲訊訊號之方法和設備及其電腦可讀取媒體

Country Status (7)

Country Link
US (4) US9460728B2 (zh)
EP (4) EP2688066A1 (zh)
JP (4) JP6205416B2 (zh)
KR (4) KR102126449B1 (zh)
CN (6) CN107403626B (zh)
TW (4) TWI602444B (zh)
WO (1) WO2014012944A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10089992B2 (en) 2014-03-21 2018-10-02 Dolby Laboratories Licensing Corporation Methods and apparatus for decompressing a compressed HOA signal
US10127914B2 (en) 2014-03-21 2018-11-13 Dolby Laboratories Licensing Corporation Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
TWI648729B (zh) * 2014-03-21 2019-01-21 瑞典商杜比國際公司 將高階保真立體音響信號壓縮之方法,將已壓縮高階保真立體音響信號解壓縮之方法,將高階保真立體音響信號壓縮之裝置,以及將已壓縮高階保真立體音響信號解壓縮之裝置
CN110556120A (zh) * 2014-06-27 2019-12-10 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
TWI749471B (zh) * 2014-06-27 2021-12-11 瑞典商杜比國際公司 用以判定用於描述將振幅變化對應為2之指數之非差分增益值之表示之最低整數位元數以用於hoa資料框表示壓縮之方法及裝置以及用於執行其的電腦程式產品、編碼之hoa資料框表示以及用於儲存其的儲存媒體,以及解碼聲音或聲場之壓縮高階保真立體音響(hoa)聲音表示之方法及裝置
TWI774807B (zh) * 2017-10-06 2022-08-21 美商波音公司 用於自位元混合器建構安全雜湊函數之系統和方法

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
WO2014013070A1 (en) 2012-07-19 2014-01-23 Thomson Licensing Method and device for improving the rendering of multi-channel audio signals
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9716959B2 (en) 2013-05-29 2017-07-25 Qualcomm Incorporated Compensating for error in decomposed representations of sound fields
US20150127354A1 (en) * 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) * 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
KR102479741B1 (ko) * 2014-03-24 2022-12-22 돌비 인터네셔널 에이비 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스
EP2934025A1 (en) * 2014-04-15 2015-10-21 Thomson Licensing Method and device for applying dynamic range compression to a higher order ambisonics signal
CN103888889B (zh) * 2014-04-07 2016-01-13 北京工业大学 一种基于球谐展开的多声道转换方法
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) * 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
EP3162087B1 (en) 2014-06-27 2021-03-17 Dolby International AB Coded hoa data frame representation that includes non-differential gain values associated with channel signals of specific ones of the data frames of an hoa data frame representation
US9922657B2 (en) * 2014-06-27 2018-03-20 Dolby Laboratories Licensing Corporation Method for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US9536531B2 (en) 2014-08-01 2017-01-03 Qualcomm Incorporated Editing of higher-order ambisonic audio data
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10140996B2 (en) * 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
US9984693B2 (en) * 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
EP3007167A1 (en) * 2014-10-10 2016-04-13 Thomson Licensing Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field
WO2016162165A1 (en) * 2015-04-10 2016-10-13 Thomson Licensing Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation
WO2017085140A1 (en) * 2015-11-17 2017-05-26 Dolby International Ab Method and apparatus for converting a channel-based 3d audio signal to an hoa audio signal
HK1221372A2 (zh) * 2016-03-29 2017-05-26 萬維數碼有限公司 種獲得空間音頻定向向量的方法、裝置及設備
EP3469590B1 (en) * 2016-06-30 2020-06-24 Huawei Technologies Duesseldorf GmbH Apparatuses and methods for encoding and decoding a multichannel audio signal
GB2554446A (en) 2016-09-28 2018-04-04 Nokia Technologies Oy Spatial audio signal format generation from a microphone array using adaptive capture
EP3616196A4 (en) 2017-04-28 2021-01-20 DTS, Inc. AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS
US11252524B2 (en) * 2017-07-05 2022-02-15 Sony Corporation Synthesizing a headphone signal using a rotating head-related transfer function
US10714098B2 (en) * 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
CN111210831B (zh) * 2018-11-22 2024-06-04 广州广晟数码技术有限公司 基于频谱拉伸的带宽扩展音频编解码方法及装置
AU2020210549B2 (en) * 2019-01-21 2023-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding a spatial audio representation or apparatus and method for decoding an encoded audio signal using transport metadata and related computer programs
US11388416B2 (en) 2019-03-21 2022-07-12 Qualcomm Incorporated Video compression using deep generative models
US11729406B2 (en) * 2019-03-21 2023-08-15 Qualcomm Incorporated Video compression using deep generative models
CN114127843B (zh) 2019-07-02 2023-08-11 杜比国际公司 用于离散指向性数据的表示、编码和解码的方法、设备和系统
CN110544484B (zh) * 2019-09-23 2021-12-21 中科超影(北京)传媒科技有限公司 高阶Ambisonic音频编解码方法及装置
CN110970048B (zh) * 2019-12-03 2023-01-17 腾讯科技(深圳)有限公司 音频数据的处理方法及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001275197A (ja) * 2000-03-23 2001-10-05 Seiko Epson Corp 音源選択方法および音源選択装置並びに音源選択制御プログラムを記録した記録媒体
GB2379147B (en) * 2001-04-18 2003-10-22 Univ York Sound processing
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
KR20080094710A (ko) * 2005-10-26 2008-10-23 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
JP5166292B2 (ja) * 2006-03-15 2013-03-21 フランス・テレコム 主成分分析によりマルチチャネルオーディオ信号を符号化するための装置および方法
DE602007011955D1 (de) * 2006-09-25 2011-02-24 Dolby Lab Licensing Corp Ür mehrkanal-tonwiedergabesysteme mittels ableitung von signalen mit winkelgrössen hoher ordnung
US20080232601A1 (en) * 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
FR2916078A1 (fr) * 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
FR2916079A1 (fr) * 2007-05-10 2008-11-14 France Telecom Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes
WO2009081406A2 (en) * 2007-12-26 2009-07-02 Yissum, Research Development Company Of The Hebrew University Of Jerusalem Method and apparatus for monitoring processes in living cells
EP2094032A1 (en) * 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
GB2467534B (en) * 2009-02-04 2014-12-24 Richard Furse Sound system
FR2943867A1 (fr) * 2009-03-31 2010-10-01 France Telecom Traitement d'egalisation de composantes spatiales d'un signal audio 3d
US9020152B2 (en) * 2010-03-05 2015-04-28 Stmicroelectronics Asia Pacific Pte. Ltd. Enabling 3D sound reproduction using a 2D speaker arrangement
KR101890229B1 (ko) * 2010-03-26 2018-08-21 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
NZ587483A (en) * 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
ES2922639T3 (es) * 2010-08-27 2022-09-19 Sennheiser Electronic Gmbh & Co Kg Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
CN103165136A (zh) * 2011-12-15 2013-06-19 杜比实验室特许公司 音频处理方法及音频处理设备
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10779104B2 (en) 2014-03-21 2020-09-15 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal
US10089992B2 (en) 2014-03-21 2018-10-02 Dolby Laboratories Licensing Corporation Methods and apparatus for decompressing a compressed HOA signal
TWI648729B (zh) * 2014-03-21 2019-01-21 瑞典商杜比國際公司 將高階保真立體音響信號壓縮之方法,將已壓縮高階保真立體音響信號解壓縮之方法,將高階保真立體音響信號壓縮之裝置,以及將已壓縮高階保真立體音響信號解壓縮之裝置
US10192559B2 (en) 2014-03-21 2019-01-29 Dolby Laboratories Licensing Corporation Methods and apparatus for decompressing a compressed HOA signal
US10334382B2 (en) 2014-03-21 2019-06-25 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal
US10388292B2 (en) 2014-03-21 2019-08-20 Dolby Laboratories Licensing Corporation Methods and apparatus for decompressing a compressed HOA signal
US10629212B2 (en) 2014-03-21 2020-04-21 Dolby Laboratories Licensing Corporation Methods and apparatus for decompressing a compressed HOA signal
US11462222B2 (en) 2014-03-21 2022-10-04 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding a compressed HOA signal
US11830504B2 (en) 2014-03-21 2023-11-28 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding a compressed HOA signal
US10127914B2 (en) 2014-03-21 2018-11-13 Dolby Laboratories Licensing Corporation Method for compressing a higher order ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
US10542364B2 (en) 2014-03-21 2020-01-21 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal
US10679634B2 (en) 2014-03-21 2020-06-09 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding a compressed HOA signal
US11395084B2 (en) 2014-03-21 2022-07-19 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for decompressing a higher order ambisonics (HOA) signal
US11722830B2 (en) 2014-03-21 2023-08-08 Dolby Laboratories Licensing Corporation Methods, apparatus and systems for decompressing a Higher Order Ambisonics (HOA) signal
TWI820530B (zh) * 2014-06-27 2023-11-01 瑞典商杜比國際公司 用以判定用於描述將振幅變化對應為2之指數之非差分增益值之表示之最低整數位元數以用於hoa資料框表示壓縮之方法及裝置以及用於執行其的電腦程式產品、編碼之hoa資料框表示以及用於儲存其的儲存媒體,以及解碼聲音或聲場之壓縮高階保真立體音響(hoa)聲音表示之方法及裝置
CN110556120B (zh) * 2014-06-27 2023-02-28 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
TWI749471B (zh) * 2014-06-27 2021-12-11 瑞典商杜比國際公司 用以判定用於描述將振幅變化對應為2之指數之非差分增益值之表示之最低整數位元數以用於hoa資料框表示壓縮之方法及裝置以及用於執行其的電腦程式產品、編碼之hoa資料框表示以及用於儲存其的儲存媒體,以及解碼聲音或聲場之壓縮高階保真立體音響(hoa)聲音表示之方法及裝置
US11875803B2 (en) 2014-06-27 2024-01-16 Dolby Laboratories Licensing Corporation Methods and apparatus for determining for decoding a compressed HOA sound representation
CN110556120A (zh) * 2014-06-27 2019-12-10 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
TWI774807B (zh) * 2017-10-06 2022-08-21 美商波音公司 用於自位元混合器建構安全雜湊函數之系統和方法

Also Published As

Publication number Publication date
US10614821B2 (en) 2020-04-07
TWI691214B (zh) 2020-04-11
US20150154971A1 (en) 2015-06-04
CN107591159B (zh) 2020-12-01
CN107403625A (zh) 2017-11-28
JP6866519B2 (ja) 2021-04-28
EP2688066A1 (en) 2014-01-22
JP2019040218A (ja) 2019-03-14
TWI602444B (zh) 2017-10-11
KR20210156311A (ko) 2021-12-24
US20190318751A1 (en) 2019-10-17
US9837087B2 (en) 2017-12-05
CN107591160A (zh) 2018-01-16
CN107403625B (zh) 2021-06-04
CN107424618B (zh) 2021-01-08
JP6453961B2 (ja) 2019-01-16
CN107403626A (zh) 2017-11-28
CN104428833A (zh) 2015-03-18
WO2014012944A1 (en) 2014-01-23
TW202103503A (zh) 2021-01-16
EP3327721B1 (en) 2020-11-25
EP2873071B1 (en) 2017-12-13
EP3327721A1 (en) 2018-05-30
TW202013993A (zh) 2020-04-01
CN104428833B (zh) 2017-09-15
KR20150032704A (ko) 2015-03-27
JP6205416B2 (ja) 2017-09-27
EP3813063A1 (en) 2021-04-28
KR102126449B1 (ko) 2020-06-24
KR102340930B1 (ko) 2021-12-20
EP2873071A1 (en) 2015-05-20
US10304469B2 (en) 2019-05-28
CN107591160B (zh) 2021-03-19
KR102187936B1 (ko) 2020-12-07
TWI723805B (zh) 2021-04-01
JP2020091500A (ja) 2020-06-11
CN107591159A (zh) 2018-01-16
JP2017207789A (ja) 2017-11-24
KR20200077601A (ko) 2020-06-30
JP2015526759A (ja) 2015-09-10
CN107403626B (zh) 2021-01-08
TWI674009B (zh) 2019-10-01
US20170352355A1 (en) 2017-12-07
JP6676138B2 (ja) 2020-04-08
TW201739272A (zh) 2017-11-01
KR20200138440A (ko) 2020-12-09
US20170061974A1 (en) 2017-03-02
CN107424618A (zh) 2017-12-01
US9460728B2 (en) 2016-10-04

Similar Documents

Publication Publication Date Title
TWI602444B (zh) 編碼多通道hoa聲訊訊號以減少雜訊之方法和裝置以及對已減少雜訊的編碼多通道hoa聲訊訊號解碼之方法和裝置
AU2005328264B2 (en) Near-transparent or transparent multi-channel encoder/decoder scheme
US20160155448A1 (en) Enhanced sound field coding using parametric component generation
JP2023549038A (ja) パラメータ変換を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム
JP2023548650A (ja) 帯域幅拡張を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム
KR20240091351A (ko) 잡음 감소를 위한 다채널 hoa 오디오 신호를 인코딩하는 방법 및 장치와, 잡음 감소를 위한 다채널 hoa 오디오 신호를 디코딩하는 방법 및 장치