TWI338461B - Binaural multi-channel decoder in the context of non-energy-conserving upmix rules - Google Patents

Binaural multi-channel decoder in the context of non-energy-conserving upmix rules Download PDF

Info

Publication number
TWI338461B
TWI338461B TW095132641A TW95132641A TWI338461B TW I338461 B TWI338461 B TW I338461B TW 095132641 A TW095132641 A TW 095132641A TW 95132641 A TW95132641 A TW 95132641A TW I338461 B TWI338461 B TW I338461B
Authority
TW
Taiwan
Prior art keywords
channel
filter
upmix
stereo
hrtf
Prior art date
Application number
TW095132641A
Other languages
English (en)
Other versions
TW200803190A (en
Inventor
Villemoes Lars
Original Assignee
Coding Tech Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Tech Ab filed Critical Coding Tech Ab
Publication of TW200803190A publication Critical patent/TW200803190A/zh
Application granted granted Critical
Publication of TWI338461B publication Critical patent/TWI338461B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Television Signal Processing For Recording (AREA)

Description

九、發明說明: 【發明所屬之技術領域】 本發明與-雜據可彻下混信號與額外控制 而以頭部相關傳遞函數(HRTF) _的方式,進行多储、者 音頻信號的立體解碼有關。 k 【先前技術】 音頻編碼的近來發展已經具有可以根據一立體(或單 音)信號及對應控制資料進行音頻信號多頻道表現的重建 方法。這㈣法與較早期根據像是杜比專親輯(祕Υ Prologic)的矩陣解法不同,因為其傳輸額外的控制資料, 以控制根據該傳輸單音或立體聲頻道進行重建,也同 做為環繞頻道上混。 因此’這樣的參數多頻道音頻解碼H,例如動態影像 壓縮標準環繞(MPEG Su_nd),便根據M個傳輸頻道以 及額外的控制=貝料重建N個頻道,其中N>M。該額外控制 =貝料表示一種與傳輸所有N個頻道相比之下的較低資料傳 輸率,其使得編碼動作非常的有效率,而同時也確保與M 個頻道裝置及與N個頻道裝置兩者的相容性。[參考j Breebaart et al. UMPEG spatial audio coding / MPEG Surround: overview and current status", Proc. 119th AES convention, New York, USA, October 2005, Preprint 6447.] 這些參數環繞編碼方法通常包括一種根據頻道強度差 異(CLD)與頻道之間諧和性/相關性(ICC)的參數環繞 L说這些參數描述在上混處理中的功率比率以及頻道對 1338461 之間的相雜。先前技術t也使料⑽頻道預測係數 (CPC),以在上混步驟期間預測中間或輸出頻道。 其他音頻編碼中的發展也已經提供一種獲得遍及立體 聲耳機夕頻道彳§號印象的方法。這__般是利用該原始多頻 道信號與頭部細傳遞函數(HRTF)滤絲,將-多頻道 信號下混為立體聲的方式所完成。 替代的,對於計算效率的理由以及對於音頻品質的理 由來說’賴產生具有左方立麵道與右方立體頻道的立 體信號方式,當然也是有用的。 然而,其問題在於如何能夠組合該原始的頭部相關傳 遞函數(HRTF)舰^。另外在雜-種能量損失效應的 上混規則方式巾’換言之當該乡頻道解碼^輸人的信號, 包含具有像是-第—下混頻道與—第二下混頻道的下混信 號’並另外具有空間參數,以用來進行非能量守恒方式的 上混時,也會產生問題。這樣的參數也已知為像是預測參 數或是頻道酬餘(CPC)。這些參數在麵道程度差異 ^數(CLD)相比之下,具有無法計算反映兩頻道之間能 置分佈的性質,但其可以計算以實作—種可能最佳的波形 =合,並自然地造成能量誤差(例如,能量損失),因此, 备產生該預測參數時,便無法考慮到_上混雜量守值性 質,而只能關心該重建信號與該原始信號相比之下的最可 能時間或次波段域波形吻合。 备想要簡單的根據這種傳輸空間預測參數,進行頭部 相關傳遞函數(HRTF)渡波n的線性組合時,如果該頻道 6 1338461 預測實作不良,將接收到特別嚴重的人為加工。在此情況 中’即使是細微的線性相關性也會導致一種不想要的:體 輸出頻譜染色(coloring)。目前已經發現當該原始頻道載有 不相關類頻道對並具有相異強度時,便會經常形成至這種 人為加工。 【發明内容】 本發明的目標是提供一種有效率與定量的可接受概 念,以進行多頻道解碼,而獲得一種立體信號,其可以在 例如頭戴式耳機的多頻道信號重製令使用。 根據本發明第一觀點,此目標是利用一種多頻道解碼 器所達成,其利用包含以一上混規則將一下混信號進行上 混的可使用上混規則資訊參數,從來自於一原始多頻道信 號所導出的下混信號產生一立體信號,該上混規則造成— 種能量誤差,該多頻道解碼器包括:一增益因子計算器, 其根據該上混規則資訊以及對應於上混頻道,以頭部相關 傳遞函數(HRTF)為基礎的濾波器特性,計算至少一增益 因子,以降低或消除該能量誤差;以及一濾波處理器,其 利用該至少一增益因子、該濾波器特性與該上混規則資訊 將該下混信號進行濾波,以獲得一能量改正立體信號。 根據本發明第二觀點,此目標是利用一種多頻道解碼 的方法所達成,其利用包含以一上混規則將一下混信號進 行上混的可使用上混規則資訊參數,從來自於一原始多頻 道信號所導出的下混信號產生一立體信號,該上混規則造 成一種能量誤差,該方法包括··根據該上混規則資訊以及 7 1338461 對應於上混頻道’以頭部相關傳遞函數(HRTF)為基礎的 滤波器特性’計算至少一增益因子,以降低或消除該能量 誤差,以及利用該至少一增益因子、該遽波器特性與該上 混規則資訊將該下混信號進行濾波,以獲得一能量改正立 體信號。 本發明的另一觀點與一種電腦程式有關,其具有一種 當在電腦上執行時’實作該多頻道解碼方法的電腦可讀碼。 本發明是基於可以更有利地利用一造成能量誤差上混 的上混規則資訊,以將一下混信號濾波,而在不需要完整 表現該多頻道信號下獲得一立體信號,並接著供應一大量 的頭部相關傳遞函數(HRTF)濾波器。取而代之,根據本 發明,與一能量誤差效應上混規則有關的上混規則資訊, 可以有利地用於避免一下混信號的立體表現,而當根據本 發明時,可計算-增益因子並在進行該下混㈣濾波時使 用,其中此計算增益因子可以降低或完全消除該能量誤差。 具體來說,該增益因子不只與像是該預測參數的上混 規則資訊有關’更重要的是,其也與對應於該上混頻道, 以頭部相關傳遞函數(HRTF)為基礎的濾波器有關,其中 該上混規則為已知。具體來說,這些上混頻道從來不存在 於本發明的較佳實施例中,因此該立體頻道並不需要像是 -個中間頻道的首次呈現便可計算。然而,軸該上混頻 道本身從不存在於雜佳實_中,鋪可以導出或提供 對應於該上關道,明部糊傳遞函數⑽TF)為基礎 的濾波器。已經發現由這種能量損失效應上混規則所引入 8 1338461 的能量誤差’並不與從該編碼器傳輸至該解碼器的上混規 則資訊對應’但與以頭部相關傳遞函數(Hrtf)為美礎的 濾波器相關’因此當產生該增益g子時,以頭部相關傳遞 函數(HRTF)為基礎的滤波器也影響該增益因子的計算。 有鑑於此,本發明將說明上混規則資訊之間的互相依 賴關係,因此代表該頻道’以頭部相關傳遞函數(hrtf) 為基礎叙⑽制參數與較表象,將成為湘該上混 規則進行上混的結果。 因此,本發明提供-種方法,以解決從利用一預測上 混與參數㈣道音頻立體解顺合時所產生⑽譜染色現 象。 。本發_較佳實施例包括以下特徵:—種音頻解碼 器,其從Μ瓣碼信號與建立寧〉均個頻道有關的空間 參數產生-立體音頻信號,贿碼器包括—增益計算器, 用於在許多次波段中’從來自於ρ對立體次波段滤波器與 建立/道有__她子集合估計兩補償增 益’並包括—增益調料,用於修改在許多次波段中由該/> 對^體-人波;道波H線性組合所獲得的奶丨立體次波段遽 波器’該修改為龍料立體錢段驗㈣每—個與由 該增皿4算11所計算的兩個增益相乘所組成。 【實施方式】 在詳、,田娜本發明增盈調整觀點之前,現在將連接第7 至第11圖討論頭部相_遞函數(肅⑽波器的組合, 以及以頭部侧傳遞函數(聰F)絲礎的舰ϋ使用。 9 為了較好地鱗本發明的特徵與優點,魏將進行一 f更詳盡的敘述。在第7圖中·—種立體合成演算法。 _部相_遞函數(HRTF)進行—組輸人頻道的滅 波。每個輸人信號都被分裂成兩個信號(―左方(L)以及 一右方⑻成分);接著這些信號的每—個都利用對應於 該要求音響來驗置_部侧傳遞函數(贈F)所遽 波。接著加總所有的左耳信號以產生該左方立體輸出信“ 號’接著並加總該右耳信號以產生該右方立體輸出信號/ 該頭部相關傳遞函數(hrtf)迴旋操作可以在時間域 中進行’但由於計算效率的时,其通錄佳的是在頻率 域中進行狀。在輯況中,在第7 κ中所顯示的加總也 可以在頻率域中進行。 原則上,如同第7圖中所描繪的立體合成方法可以被 直接使用,以與-種動態影像壓縮標準(MpEG)環繞編碼 器/解碼驗合。在第8圖帽概要顯示該動態影像壓縮標 準(MPEG)環繞編碼器。多頻道輸入信號是由一空間編碼 器所分析,並組合空間參數,形成一單音或立體聲下混信 號。該下混可以利用任何的傳統單音或立體聲音頻編碼方 式所編碼。所形成的下混位元串流則利用一多路傳輸器與 該空間參數組合,形成完整的輸出位元串流。 第9圖中顯示組合一動態影像壓縮標準(MpEG)環繞 解碼器的立體合成設計。該輸入位元串流則進行解多路傳 輸,形成空間參數與一下混位元串流。該後者位元串流則 利用一傳統的單音或立體聲解碼器所解碼。—空間解碼器 根據該傳輸空間參數將該解碼下混進行解碼以產生一多 頻道輸出。最後,該多頻道輸_由如在第7圖所描_ 立體合成效果所處理,形成—種立體輸出信號。 然而,這樣的動態影像壓縮標準(MPEG)環繞解碼器 與立體合成模組的Φ流,至少具有三項缺點: 春以-種中間步驟計算多頻道信號表現,之後進行頭部 相關傳遞函數(HRTF)迴魏理並在社體合成步驟中進 行下混。軸在已知每個音頻信號可以具有—不同空間位 置的情況下,應該以每—頻道為基魏行頭部湖傳遞函 數(HRTF)迴旋處理,然而這從複雜度的觀點來說,是一 種不想要的情況。 •遠空間解碼器是在一濾波組(正交鏡相濾波器 (QMF))、巾所操作。換句話說,—般是在快速複立葉轉換 (FFT)域巾翻頭部細傳遞函數(hrtf)迴旋處理。 因此,便需要一多頻道正交鏡相滤波器(QMF)合成滤波 組、-多爾離散複立葉賴(DFT),以及―立體聲反向 離散複立葉轉換(DFT)轉換的㈣,形成-種具有高計 算要求的系統。 由該二間解碼器建立一種可感知的多頻道重建時所 造成的編碼人為加工,將可能在該(立體聲)立體輪出中 所增強。 第11圖中顯示該空間編碼器。一多頻道信號是由
Ly:(:、/?/與&錢所組成,其代表左前、左環繞、中央、 右則與右環繞頻道,並糊兩個,,-對二(OTT),,單元所處 1338461 理’每產生—單音下混與代表兩輸人賴的參數。 該形成的下混信號與該中央頻道組合,並進一步利用一,,二 對二(TTT) ’’編碼器所處理,其產生一立體聲下混與額外 的空間參數。 x
:般來說’由該”二對三(τττ),’編碼器所形成的參數 是由代表每一參數波段的一對預測係數或是一對程度差異 參數所組成’以描述該三個輸人信號的能量比率。該,,一對 二(ΟΤΤ ”編碼器的參數則是利用代表每個頻率波段輸入 L號之間的程度差異無和性,或是交叉襲性數值所组 成。 第12圖則描、續一種動態影像壓縮標準(⑽阳)環繞 解碼器。將該下混信號10與Γ〇輸入至一二對三(τττ)模 中卩重建-中央頻道、一右側頻道與一左側頻道。
=個頻道則進—步由多個—對二(〇tt)模組所處理, 以產生六個輸出頻道。 妒』Ϊ 1G圖中所顯示的概念觀點’可以看到所對應的立 =二°其_波11組域、該立體聲輸人信號… 3貝^二對三(τττ) _器所處理,形成三個信號上、 此三個信號接著進行頭部相關傳遞函數(hrtf) 立。所形成的六_道則進行加總以產生該立體聲 立體輸出對(4、圮)。 车 ~ L - mu mn •J- R - m22 A) C -w3, mn •及〇- 12 目〜則與空間參數有關,空間參數 矩陣項目的關係對於像是在51多頻道動態影像壓縮標 準(MPEG)環、繞解碼器的關係而言為唯一的。該三成 信號乙、/?及C的每—個都被分裂為兩個,並利用與這些立 =源位置的要求(感知)位置所對應的頭部相關傳遞函 數(HRTF)參數進行處理。對於該中央頻道(c)而言, 可以直接地朗該音響來源位置的空間參數,形成兩:代 表中央Z^(Q及的輪出信號: 'W 'HiXC)
C 對於該左方(L)頻道而言,來自於該左前方與左環繞 頻道的頭部相關傳遞函數(HRTF)參數則利用權重~與 HV組合於一單一頭部相關傳遞函數(HRTF)參數集合之 中。所形成的”合成(composite ),,頭部相關傳遞函數(hrtf ) 參數則利用統計概念模擬在該前方與環繞頻道兩者的效 果。該後續方程式則用來產生代表該左方頻道的立體輸出 對u5、心): 'Lb(L) X⑷, β,α\ 以一種相似的形式,也可以根據以下方程式獲得代表 該右方頻道的立體輸出: 'lb(R) mr\ 在已知上述對於 Z^(C) Ά(〇、 與/^(R)的定義下’該完整的&與心信號可以在已知該立 V \ 人 Λ. &Jk_ 體聲輸入信號下,從一種單一 2x2矩陣所導出: 其中 *11 =fnuH/(L) + m2lHL(R) + milHL(C) = ml2H, (L) + mnH, (R) + mi2H, (〇 K =r^i)HK(L) + m2]HR(R) + m:s]HR^ ^=mnHR(L) + m22HR(R) + mnHR(C) 該Hx⑺滤波器可以表示為一種該原始頭部相關傳遞 =數^HRTF)渡波器的參數形式參數加權組合。為了使其 犯夠疋成’該原始頭部相關傳遞函數(^F)滤波器則 示為 “。 •代表該左耳脈衝回應每個辭波段的(平均)程度; •代表該右耳脈衝回應每個頻率波段的(平均)程^ ; •代表該左耳與右耳脈衝回應之間的(平均)抵達時間 或相位差異。 因此’在已知該巾央頻道輸人信號下,代表該左耳與 X(C)' .^r(C). Pr(C)e,c>/2 其中Ρ/(〇為代表該左耳_已知鮮波段下的平均程 度’而#c)則為該相位差異。 口。因此,該頭部相關傳遞函數(HRTF)參數可能可以簡 單地利用-種具有/^與匕的信號乘法運算所組成其對應 於該中央頻翻音響麵位置,同__分散該相位差 異。此處理對於每個正交鏡相·If WMF) 組而言都可 以獨立地進行,其在一波段上從頭部相關傳遞函數(HRTF) 參數映射至正交鏡相濾波器(QMF)組,另一方面也從該 空間參數映射至該正交鏡相濾波器組。 相似的,在已知該左頻道與右頻道之下,代表該左耳 與右耳的頭部相關傳遞函數(HRTF)濾波器可以由以下方 程式所給定: H^L) = ^ρ,2(¥)+Κρ,2(^)
Hr(r) = /^Pr2 (Rf)+ w2rsPr2 (Rs) 明顯的,對於該六個頻道,該頭部相關傳遞函數 (HRTF)為代表該參數頭部相關傳遞函數(HRTF)濾波 器程度與相位差異的加權組合。 該權重外與w/s則與用於左前方(;Lf)及左環繞(Ls) 的一對二(οττ)功能區塊頻道強度差異(CLD)有關: ’ l + l〇c"V 丨。 k l + l〇C"Vl〇 而該權重與Wrs則與用於右前方(Rf)及右環繞(Rs) 的一對二(=ΓΤ)功能區塊頻道強度差異(CLD)有關: <=]^άζνϊό- 該上述解決方式對於短頭部相關傳遞函數(HRTF)濾 波器可以良好顧,其有效精確性可以表示為每個頻率波 段的平均程度,以及每個頻率波段的的平均相位差異。然 而,對於長回聲頭部相關傳遞函數(HRTF)而言,其並不 適用。 八 本發明將教導如何利用一 2x2矩陣立體解碼器的方 1338461
鲁增益調整。 法’延伸至能夠處理任意 滤波器。為了 ;圭5丨丨.LL n ,, 這可以利用六個舰器置換代表、心與科、及、 C U複數增益所達成。這钱波11是從代表 %與料y'心、Λ/、心、c的十個渡波器所導 ' 出而得,其描述在該正交鏡相濾波器(QMF)域中的已知 頭部相關傳遞函數(HRTF)滤波器回應。這些正交鏡相渡 波器(QMF)表現可以根據以下敘述的方法所達成。 鲁 根據以下方程式,利用一種複數線性組合進行該前方 與環繞頻道濾波器的成型:
Hy(X) = gwf ^Μ~]φχγ^25)Ηγ{Χ/) + gws exp(y^w})//y(j^) 該相位參數‘可以從該前方與後方頭部相關傳遞函數 (HRTF)濾波器之間的主要延遲時間差異〜,以及該正交 鏡相慮波器(QMF)組的次波段指標《,透過以下方程气 所定義:
首先,其 此相位參數在濾波器成型中具有雙重角色 1338461 在疊加之前實作-種兩紐器的延_償,而形成 擬對應於該前方與後方揚聲器之間—來源位置延遲時間二 組合回應。第二,其使得所需要的增益補償因子g更 定,並與利用Η所進行的簡單叠加情況相比之下= 頻率呈現緩慢變化。 ~ 該增益因子g則利用相同的非諧和額外功率規則所定 義,如同用於參數頭部相關傳遞函數
PyiXf ^}Py{Xff ^]PY{Xsf 月〆凡 其中 PY{X) -g (yv^Xf) ^^]Py{Xs)2 +2M>fM;sPY{Xf)PY{Xs)pxY) 而~為下述兩遽波器之間的正規化複數交叉關聯 數數值 哪(-)心)AW)及扒(圳
在利用〜=0進行簡單疊加的情況中,數值以頻率為 函數,呈現-種*穩鎌㈣變化方式,其造成需要額外 的增益調整。在實際實作巾,其需要關增益时g的數 值,且該信號的剩餘頻譜染色效應則無法避免。 相比之下,利用本發明所教導以延遲為基礎的相位補 4員成型,开>成一種以頻率為函數的/^平滑行為。此數值對 於利用濾波器對所導出的自然頭部相關傳遞函數(HRTF) 而言通常接近於一,因為其主要的不同在於延遲與振幅, 而該相位參數目的便是考慮該正交鏡相濾波器(QMF)組 中的延遲差異。 相位參數&的另一替代有利選擇是利用下述兩濾波器 17 1338461 之間的正規化複數交叉關聯性相位角度計算所得 HY{Xf)瓦小㈣ 並且利用標準展開技術將該相位數值展開為該正交鏡 相遽波Is (QMF)組次波段指標w的函數。此選擇造成Pw 永遠不會成為負值,因此該補償增益g對於所有次波段而 言都滿足。此外,此相位參數的選擇使得在主要 延遲時間差異〜無法利用的情況時,也能進行該前方與環 繞頻道濾波器成型。 所以以下考慮的信號,為來自於離散時間信號的調變 濾、波器組或®型快速傅立葉(FFT)分析的次波段樣本,或 疋來自於離散時間k號。可瞭解的是這些次波段必須利用 對應的合成濾波器組操作,轉換回到離散時間域之中。 第1圖描述一種利用與頭部相關傳遞函數(HRTF)相 關的遽波器,進行參數多頻道信號的立體合成步驟。空間 解碼器101根據Λ/個傳輸頻道與傳輸空間參數產生包括# 個頻道的多頻道錢(Λ/<Λ〇。接著由卿械傳遞函數 (HRTF )舰ϋ的裝置將這些則_道雜至代表立體聽 覺的兩輸出頻道之巾。綱部相_遞疏(HRTF)遽波 器102將每個輸入頻道的遽波結果叠加,其令一個頭部相 關傳遞函數(HRTF)舰n用於左耳,而另―頭部相關傳 遞函數(HRTF)缝器則用於右耳。總的來說,其需要-個遽波器。反之,當透過_揚聲齡聽時,可達成一種 參數夕頻道錢的n聽者經驗,#健號之間的細微 内部相關性將造成對於該立體聽覺的人為加工 。這些人為 加工則由來自於編碼之前進行賴則_道頭部相關傳遞 函數(HRTF)〉紐所定義的參考立體信號頻譜内容中的差 f所主導:此串聯的另-項缺點為對於立體合成的總體計 异成本必須另外加在用於該每-成分101及102所需要的 成本之上。 _第2圖描述一種利用本發明所教導組合濾波方式所進 行的參數夕頻道信號立體合成。該傳輸空間參數則由201 刀4成兩個集合,集合i與集合2。在此,集合2包括從該 从個傳輸頻錢立該p個巾嶋道的適切參數,而集合^ 包括從該P個巾嶋道建立該AM賴道的適切參數。先前 技術中的預組合器2Q2利用權重將該2雜與該頭部相關傳 遞函數(HHTF)相_次波段丨紐㈣撕組合,該權重 則$該參數集合1及該選麟波ϋ對細。此縣合的結 果疋產生2户個立體次波段濾波器,其表現一種用於該尸個 中間頻道每—個的立體濾波器對。本發明組合器203利用 “參數、、且合2及該2ρ個立體次波段遽波器兩者相關的權 重’將該2Ρ個立體次波段濾波器組合成為一組2从個立體 -人波段遽波器。相比之下先前技術的線性組合器可以應 用只與該參數集合2相關的權重。該形成的2从個濾波器組 則由用於該Λ/個傳輸頻道每一個的立體濾波器所組成。該 組=遽波單元2〇4藉由利用該對應濾波器對濾波的方式, ,仔用於該Λ/個傳輸頻道每一個的兩頻道輸出貢獻對。接 著,進行所有从個傳輸頻道的貢獻加總,以形成一種在該 次波段域+的兩頻道輸出。 第3圖描述本發明組合器2〇3的組件,其用於空間參 數與立體義ϋ敝合。該線,眺合器則_施加從已 :頻譜參數解出的權重,將該2ρ個立體讀段滤波器組 合成為2从個立贿波器,其中這些空間參數為從該Μ個 傳輪頻道建立該/>辦間頻道的物參數。具體來說,此 線性組合麵-歡該職傳輸頻道至該ρ辦間頻道的 上混,以及之後從/>個來驗行立體濾波的㈣。該增益 調整器303利用對每-個對應於左耳輸出的遽波器施加左 方増益的方m對每—個對應於右耳輸出的滤波器施 加右方增益的方式,修正來自該線性組合器3〇1所輸出的 2Λ/個立體滤波器。那些增益則來自於該空間參數與該π 個立_波器。本發明組件3〇2與3〇3所進行的增益調整 目的’在於補償該/M时隨道在具有空_碼線性相關 性時,因為該線性組合器所造成的非預期頻譜染色效果。 由本發明峨導的增益計算器3G2包含_麵參數為函 數所進行該P個令間頻道的能量分佈估計。 第4圖描述在-立體聲傳輸信號情況中,動態影像麼 縮標準環繞(MPEG Surround)空間解碼的結構。該 個傳輸信號分析次波段被提供至該二對三(2+3)功能區 塊401之中,其輸出户=3個中間信號,一組合左方、:: 合右方以及-組合中央信號。此上混與該傳輸空間參數的 次集合有關,其對應於第2圖中的集合2。該三個中間信號 接著被k供至二個一對一(1~>2)功能區塊4〇2_4〇4之中, 其產生總數為的信號405 :左前方(//)、左環繞(4)、 20 1338461 右刖方(7)、右ί魏⑷、中央⑺以及低頻增強(⑹。 此上混與該倾如參數的次集合有關其對應於第2圖 的集合1。該最終多頻道數位音頻輸出則將該六個 段仏號傳送至六個合成濾波鱗_所建立。 第5圖描述利用本發明增益補償所解決的問題。代表 該左耳的參考頭部相_遞函數(贈F)纽立體輸出頻 譜則利用實心圖形所描繪。虛線圖形則描_用第2圖方 法所產生的對應解碼親頻譜,其巾該組奸2G3只由該 線性組合器3G1所組成。如同可見的,在頻率_ 3·4千赫 與1。1 η千赫巾’存在相對於該要求參考頻譜的大量頻譜能 量損失在1千赫與1〇千赫附近也存在少量的頻譜增加。 第6圖則描述利用本發明增益補償的優點。該實心圖 形與第5圖中的參考賴相同,而現在該虛細形描緣利 用第2圖方法所產生的解碼信號頻譜,其中該組合器加 由第3圖中的所有組件所組成。如同可見的,與第5圖兩 條曲線相比之下,該兩條曲線之間獲得—明顯的改善頻譜 吻合。 在之後的文字+’㈣述本發明增細償的數學敎 述。對於離散複數信號以而言,該複數内積與平方模數 (能量)則定義為 (χ^)=Σ^)κ^) •^=ΙΜ2=(χ>χ)=ΣΝ*)Γ· ^=1^=(^^)=21^)12 k ⑴ 其中兩為你)的複數共軛信號。 21 1338461 該原始多頻道信號則由ΛΜ固頻道所組成,而每個頻道 都具有與其_ ’並與—立體頭部相關傳遞函數(咖F) 相關的毅H對。然而在麟假設該參數㈣道信號是利 用從該Λ/個傳輸頻道至/>個·摘道的_上混中間=驟 所建立。此結構則在如同第4圖中所描述的祕影像麗縮 標準環繞(MPEGSurromuO令使用。其將假設該2則固頭 部相關傳遞函數(HRTF)侧歧器的原始集合,已_ 用先前技術的預集合器202減少成為代表該p個預測頻道 的濾波器對,其中MSP·該p個預測頻道信號&㈣、 2、…、P,以近似該P個頻道信號々,产卜2、·、户為 目的,是透過部分下混從該原始#個頻道所導出。'在動態 衫像壓縮標準環繞(MPEG Surround)中,這班·信號為一組 合左方、一組合右方、與一組合並縮放的中央/低頻增強〇伤) 頻道。其假設該頭部相關傳遞函數(HRTF)濾波器對與該 仏號Xp對應,是利用代表該左耳的次波段濾波器以及 代表該右耳的次波段濾波器所描述。該參考立體&出信 號便因此可對於《=1、2,利用濾波信號線性疊加方式所計 ^=t(KP*xPm /Μ (2) 其中星號表示在時間方向中的迴旋計算。該次波段滅 波器可以利用有限脈衝回應(FIR)濾波器、無限脈衝回應 (IIR)的形式所給定’或是從濾波器的參數族所導出。 在該編碼器中’該下混是由利用將一 下混矩陣〇 應用至由、,产丨、2、…、尸所形成行向量信號的方式所 形成,而在該解碼器中的預測則利用將一 ΡχΜ預測矩陣C 應用至由該Μ個傳輸下混頻道Zw、W=1、 、M所形成行 向量信號的方式所實作, ip(k) = TiCP,mZm(k) m=\ (3) 在該解碼器處知悉該兩者矩陣,並忽略該下混頻道的 編碼效應,該預測組合效果可以利用下式計算: (4) 其_ 為該矩陣乘積a=CD的項次。 一種用於在該解碼器處產生立體輸出的直向方法,是 簡單的將(2)中的預測信號'置入,形成 Α(*)=Σ(^*^)(λ) ^ ^ (5) 就計算方面來說,該立體濾波是事先與該預測上混組 合,因此(5)可以寫為 m=\ (6) 而該組合濾波器則定義為
Kmik) = Y,cpmbnp(k) p=\ (7) 此方程式描述該線性組合器301的作用,其將利用空 間參數所導iii的係數epw與該立體次波段域滤波器k組 5田該原始尸個仏號々具有基本上由Μ所限定的數值排 序’該預測便可以良好實作,而該近似方式是成立的。 這在例如如果只有該戶個頻道之中的从個作用時,或是如 1338461 果重要的雜成分是源自於振鴨雜(amp丨itude_^g) 時’便會發生。在該情況中,該解碼立體信號(5)對於該參 考(2)有-良好的吻合n面’在—般情況以及特別是 在原始/MSHf號細的情況巾,將存在—大量的預 測損失,且源自於(5)的輸出可以明顯地與源自於⑺的能量 有所差異。如_差_在不同頻率波段中所不同,該最 後音頻輸出也遭受到如在第5圖中所贿的頻譜染色人為 加工。本發明教導如何__輸出進行增益補償的方式 避免此問題的發生,其根據以下方程式 y»=8n'yn 一 & ⑻
就计算方面來說,根據該增益調整器3〇3lw=gAmW
改變該組合紐II,可以有利地進行增益補償 修正組合濾波變成為 V
m»I (9)
在(8)中的補償增益最佳數值為 g=w ‘、、、
n IW (ίο) 該增益計算器302的目的是用以從在該解碼器中可獲 传的資訊估計這些增益。現在將描㈣於此項目的多種工 具。在此該可獲得的資訊是由矩陣項目%以及與該頭部相 關傳遞函數(HRTF)相關次波段濾、波器k所表示。首先, 後續近似以,將假設代表用於已經_與麵部相關傳 遞函數(HRTF)相關次波段驗器w所過齡號r少 之間的内積, 24 1338461 (i>*X,d*y)^(b,d)(x,y) / (11) 此近似方式是根據通常該濾波器的最大能量是集中在 一主導單一輸出(singletap),其接著預先假定該應用時間 頻率轉換的時間步驟與該頭部相關傳遞函數(HRTF)濾波 器的主要延遲差異相比之下是足夠大的。應用的近似與 (2)組合,形成 M2 ^ iHbr.,PA.q){xp,Xg)
… (12) 該次一近似方式則假設由該不相關原始信號所組成, 對於内而言,〈Ά〉= 0。則(12)便簡化為 Μ-Σ\Κΐ\\4 (13) (14) 對於解碼能量而言,對應於(12)的結果為 I九 Γw Σ〈Κ〉〈\Λ〉
在(14)甲插入該預測信號(4),並應用該原始信號為不相 關的假設,獲得 …j (15) 剩下為了能夠,算由方程式(1 〇)所給定的補償增益為 估計該能量分佈IMI,/7=1、2、...、/>,戶為最大至任意因 子的原始頻道數目。本發明教導如何藉由利用能量分佈的 函數’計算對應於該假設的預測矩陣cm()del而完成此項工 作’其中這些頻道彼此不相關,而該編碼器的目標為將該 預測誤差最小化。如果可能的話,接著利用求解非線性方 25 的方鞋jm°del=c料該能量分佈。對於形成不具有解答 足=1。2統預測參數而言,該增益補償因子則設定為 詳細描述《。月步驟將在後續㈣中,於最重要的特別情況 由U5)所增加的計算負載可以在户=糾的情況中利 以严擴严方式(例如參考PCT/EP2。。細則所減少 Γ^χ9) = (^,χ,) + Δ£.ν/ ·ν
盆 Ρ 9 (16) 八中V為具有成分4的單位向量,因此Dv=0,而Δ£為 預設損失能量 ^=£-^=1||^||2-1||^||2 P M (17) (15)的計算接著可以利用在(14)中應用(16)而有利的置 換,其造成 RIHWI2-A£. (18)
Τν Λ ^ Ρ η、ρ 接著,將討論從兩頻道預測這些頻道的較佳特別處 理。作2與/^=3的情況則在動態影像壓縮標準環繞(ΜρΕ^ Surround)的情況中使用。該信號為一組合左方々=/,一組 合右方λ:2=^以及一(縮放)組合中央/低頻增強(lfe)頻道 X3=C。該下混矩陣為
D = 0 (19) 而由兩傳輸實數參數Cl、c2所建構的預測矩陣,則為
2 + c, c2 -1 c, -1 2 + c2 1-c, l-c2 26 (20) 1338461 在該原始頻道為不相關的假設之 ^ 卜’完成該最小化預 測誤差的預測矩陣如下 取i化視
C model 1
LC + RC + LR
LC + LR ~LC -RC RC+LR RC LC 分佈 令cmodel=c,獲得由本發明所教導的(未正規化) (21)能量 'L /?〇-〇)' R = α(ΐ-σ) C .Ρ _ 、 (24)
α>0 > j3>0 > σ<0(23) 其中該預測誤差可以由相同的縮放方式中獲得 Δ£· = 3^(ΐ-σ) 因為户=3=2+1=綱’利用⑽·⑽所描繪的方法也可 ΜΚΐΆ-ν, 以及 +«(ι-·,2||2 + 未3 適用二f單,位,量為卜'馮4]=[1,1,-丨1/^,並具有下述定義 (25) (26) 在該增益計算器302的較佳實施例中所計算用於每個 耳朵《=1、2的補償增益,可以表示為
Sn min S„ ΕΒη+ε + ε ,if α > 0,y? >〇,cr<i (27) otherwise 在此ε>〇為—小數目,其目的在於穩定靠近該變數參
其中,^ = 、>9 = (l-C2)/3、 下所定義的變數範圍中適用 (22) σ~α + 々而Ρ = 。這在以 27 1338461 數範圍邊緣的方程式,r?ij “為—應用補償增益的上方限 制。(27)的增益對於左耳與右耳㈣、2不同。本發明的不 同是使用一共同增益勒=幻其中 min《 if «>0j/,>〇5<T<I otherwise (f 「 ΕξΤΈ[77
(28) 本發明改正增益因子可以在不牽涉任何與頭部相關傳 遞函數(HRTF)細魏T,使—直向向前多頻道增益補 償成立。 在動態影像壓縮標準環繞(MPEGSurr〇und)中,用於 預測損失的補償已經在該解碼器中,利用一因子丨/p與該 上混矩陣C姆的方式所細,其+ 為該傳輸空
間參數的-部份。其中(27)與⑽的增益已經分別由該乘積 與所取代。這種補償是為了在第5與第6圖中所研 究的立體解碼所細。這也是第5圖的先前技術解碼方式 與參考相比之下具有提高頻譜部分的原因。對於對應於那 些頻率區域的次波段而言’本發明增益補償有效地利用由 方程式(28)所導出的較小數值,取代該傳輸參數增益因子 Ι/p。 此外,因為的情況對應於一種連續的預測方式, 由本發明所教導的一種增益補償更保守變化,將造成用於 P=1的立體增益補償失效。 此外,本發明也可以與殘餘信號一起使用。在動態影 像壓縮標準環繞(MPEG Surround)中,可以傳輪另一預測 28
,幾餘信號A ’而使其可以更準確地重製該原始p==3的信號 \。在此情況中’該增益補償是利用現在將描繪的另一立體 殘餘信號所置換。由一殘餘信號所加強的預測上現則根 據以下方程式所形成 ' 乂 2 研)=Σν» W + Ά(Α〇 (29) 其中[%,1^2,>»;3]=[1,1,-1]/3。利用\代替在(5)中的弋,形 I 成其對應的組合遽波, /η·1 (30) 其中對於卜2的組合濾波器Λ⑽則利用(7)所定義, 而用於該額外殘餘信號的組合濾波器則定義為 , +K,2~bn,3) (31) 此解碼模式的完整結構便因此利用設定的方 式’並利用修正該組合器203進行由(7)與(31)所定義的線性 籲 組合實作,而以第2圖進行描述。 第13圖描述一種第3圖線性組合器3〇1的結果修正表 示。該組合器的結果是-種四個以頭部相關傳遞函數 (HRTF)為基礎的溏波器hn、hi2、&與^。如同利用第 16a與第Π _描述’更加清楚的是這麵波輯應於利 用第16a圖中由15、16、17、18所指明的遽波器。 第16a醜示-跨聽者的頭部,其具有一左耳或左方 立體點以及具有-右耳或右方立體點。當第⑹圖只與一 立體聲方案有關時,該濾波器15、16、17、18則為一㈣ 29 < S > 1338461 頭部相,換函數,其_被各自量贼是透過網際網 路,。或是在-魏者與該左方頻道揚聲器其該右方頻道揚 聲器之間驗不同位置的範本(textb⑽k)所獲得。 然而’因為本發明教導一種多頻道立體解碼器,利用 17 18所描述的遽波II便不是—種純粹的頭部相 關傳遞函數(HRTF)渡波器,而是明部相關傳遞函數 為基礎的渡波器,其不但反映頭部相關傳遞函數 ±时’也無空間參財關,制是與第2圖聯 …^時’便與該空間參數集合1及空間參數集合2有關。 =4 _示在第16中所代表以頭部相關傳遞函 ^於為基魏波器的準則。特暇描述—魏者位 種五頻道揚聲器設置中五揚聲器之_f點的情 牛’在一般的環繞家庭或電影院娛樂系統之中。 ^母個頻道而言,存在兩_部相關傳遞函數(HRTF), 換換為具有以頭部相關傳遞函數(贿F)做為轉 換函數的濾波器頻道脈衝回應。 數域中所熟知的,—種以頭部相關傳遞函 音響傳播/礎的波器可以貞責—魏者頭部之尹的 言’在第14圖中的頭部相關傳遞函 聽者頭部附近之後 =繞揚聲器Ls所放出音響直接地抵達該 ^ 位置以及該耳朵做等等的影響^ 疋該頭部相闕傳遞函數】(HRIT U與頭部相
30 S 1338461 關傳遞函數2 (HRTF2)彼此並不相同。
子;左方頻道的頭部相關傳遞函數3 (HRTF 3)與 頭部相_遞鍵4 (臟F 4)衫也隨成立,因此雙 耳對於該左方頻道L賴係是不同的。對於其他頭部相關 傳遞函數(HRTF)而言也同樣_,雖織第14圖可以 明顯得知,用於該中趣道_部相關傳遞函數5(HRTF5) 與頭部㈣_函數6 (hrtf 6)將是最_或是對於彼 此而言完全相_,然而仍舊可以由該頭部相關傳遞函數 (HRTF)倾肺各自魏者料對讎。 ㈣μ上所陳述的,已經決定了用於模型頭部與揚肩 器設定的這些頭部相_遞函數(hrtf), 何特定的,,平均頭部,,下載。 為
現在,隨著在第17圖中171與172所變的明顯的是 、’二-種組合方式將該左方頻道無左環繞賴組合,^ 第15圖巾_ L’所指出代表該左側_個以頭部本 =函數_為基礎的濾、波器。該相同的步㈣ 樣的對於糊實作,如在第15針以R,所贿,並瑪 部相關傳遞函數13 (HRTF 13)與頭部相關傳遞函數p (HRTF 14)。為此目的,也同樣參考第17圖中的項目⑺ 及Π4。然而’在此應該注意的是,對於組合項目⑺、⑺' 17^與174巾的各別頭部相關傳遞函數(HRTF),便負責反 ,介於該左方(L)驗與觸始奴Ls賴、^ 二於該右方(R)倾與_料鱗設定 頻道間強度差異纽。制i雜錄料了=^ 31 1338461 相關傳遞函數(HRTF)線性組合時哺重因子。 如同在之前描述的,當、组合頭部相關傳遞函數(贈F) 相翻—相位因子’該相位因子是被組合頭部 2傳遞函數(HRTF)之間的時間延遲或展開相位差異所 疋義° _ ’姉侧子並稍鱗輸參數有關。
因此,頭部相關傳遞函數11、12、13與14 (HRTF u、 12、13、Η)並非是真的頭部相關傳遞函數(hrtf)遽波 :,而是以頭部相關傳遞函數(HRTF)為基礎的渡波器, 因此這些核器只與該頭部相關傳遞函數(hrtf)有關, 而與傳輸信號無關。做騎代,由於該頻道程度差異失數 啪與啉是用於計算這些頭部相關傳遞函數u、12:13 與14 (HRTF η、12、13、14) ’頭部相關傳遞函數u、12、 13與^(^^、^、⑷也與該傳輸信號有關。
曰現在’描述第15 ®的情況’其仍然具有三個頻道,而 不是如同在較佳下混信號巾所包含的兩傳輸頻道。因此, 必須將該六個頭部相關傳遞函數u、12、5、6、13、m(hrtf U、12、5、6、13、14)組合成如同在第16a圖中所描述 的四個頭部相關傳遞函數15、16、17、18 (_ i5、16、 17、18)〇 為此目的,利用一左方上混規則組合頭部相關傳遞函 數11、5、13 (HRTF11、5、13),其可以從第16b圖中的 上混矩陣清楚得知。特別是如同在第10b圖中所顯示以及 在功能區塊175巾賴示的左方上混制,其包含參數 mu、與卟「此左方上混規則是在第16圖的矩陣方程 32 1338461 式中,只用於與該左方頻道所相乘。因此,此三個參數也 稱為該左方上混規則。 如同在功能區塊176中所描繪的,現在利用該右方上 混規則組合該相同的頭部相關傳遞函數u、5、13 (胃ρ 1卜5、13 ) ’換言之,在第16b圖的實施例中,該參數卟= ni22與1¾2是用於與第16b圖中的右方頻道相乘。 因此’便產生了頭部相關傳遞函數15 (HRTF 15)與 頭部相關傳遞函數17 (HRTF 17)。類似的,利用該上混左 方參數mu、叫與叫卜组合第ls圖的頭部相關傳遞函匕數 12、6、14 (HRTF 12、6、14)以獲得頭部相關傳遞函數 16 (HRTF 16)。利用頭部相關傳遞函數12、6、14 (hrtf 12、6、14)並利用由叫2、!^2與叫2所指明的上混右方參 數或是右方上混規則進行一對應的組合,以獲得第i6a圖 的頭部相關傳遞函數18 (HRTF 18)。 · 、再次要強調的是,雖然在第14圖中的原始頭部相關傳 遞函數(HRTF)與該傳輸信號完全無關,以頭部相關傳遞 函數(HRTF)為基礎的新濾波器丨5、16、17 18現在則 與該傳輸信號有關,因為包含在該多頻道信號之中的空間 參數是用於計算這些濾波器15、16、17、18。 最後為了獲得一立體左方頻道Lb與一立體右方頻道
Rb,必須在一加法器13〇a中組合濾波器丨5與17的輸出。 類似的,必須在一加法器130b t組合濾波器16與18的輸 出。這些加法器103a、103b反映該人類耳朵之中兩俨號 疊加。 β 33 1338461 接著,將討論第18圖。第18圖顯示本發明多頻道解 碼器的一較佳實施例,用於利用從一原始多頻道信號所導 出的下混信號產生一立體信號。該下混信號則於z〗及巧處 描述,也利用’’L”與’’R”所指明。此外,該下混信號具有與 其相關的參數,該參數至少是一種代表左方與左環繞的頻 道程度差異,或是代表右方與右環繞的頻道程度差異,以 及該上混規則的資訊。 自然地,當該原始多頻道信號只是一種三頻道信號 時’並不傳輸〇1(1|或〇1(11·,而如同之前描述的只有參數側資 訊將成為該上混規則的參數,而此上混規則將造成上混信 號中的能量誤差。因此,雖然當實作一種非立體表現時, 該上混信號的波形盡可能的與該原始波形相符,該上混頻 道的能量卻與該對應原始信號的能量相異。 在第18圖的較佳實施例中,該上混規則資訊是利用兩 上混參數cpci、cpc2所反映。然而,也可以應用任何其他的 上混規則資訊,並透過一特定位元數量發信。特別是,可 以利用在該解碼器處的表格進行特定上混方案與上混參數 的發信’因此只需要從一編碼器傳送該表格指標至該解碼 器。替代的,也可以使用不同的上混方案,像是從二至多 於一頻道的上混方式。替代的,可以傳輸多於兩個預測上 混參數’其接著需要一對應與該上混規則相符的不同下混 規則,如同針對第20圖所詳細討論。 與這種用於該上混規則的一較佳實施例無關,任何可 以進订上说而產生上混頻道能量損失影響集合的上混規則 34 都是可以應用的,其是與該原始信號的對應集合波形相符。 本發明多頻道解碼器包含一增益因子計算器180,用於 計算至少一增益因子&、&或g ,以減少或消除能量誤差。 該增益因子計算器根據該上混規則資訊以及當該上混規則 被應用時’對應於被獲得上混頻道,以頭部相關傳遞函數 (HRTF)為基礎的濾波器特性計算增益因子。然而,如同 之前所描繪的’在該立體表現中,並不進行此上混動作。 除非當聯結第15圖以及第π圖的功能區塊175、176、177、 Π8所討論,才使用對應於這些上混頻道的以頭部相關傳遞 函數(HRTF)為基礎的濾波器。 如在之前所討論的,當取代η而插入1或r時,該增益 因子計算器180可以計算在方程式(27)中所描繪的不同增 益因子gi與gr β替代的,該增益因子計算器180可以產生 由方程式(28)所指明用於兩通道的單一增益因子^ 重要的是,本發明增益因子計算器180不但根據該上 混規則,也根據對應該上混頻道,以頭部相關傳遞函數 (HRTF)為基礎的濾波器特性計算增益因子^此反映了該 遽波器本身也與έ玄傳輸信號有關,並由一能量誤差所反映 的情況。因此’該能量誤差並不僅由像是該預測參數CPC]、 CPC2的上混規則資訊所引起,也受到該濾波器本身的影響。 因此,為了獲得一良好調整的增益改正,本發明增益 因子不但與該預測參數有關,也同樣與對應於該上混頻道 的濾波器有關^ 該增益因子與該下混參數,以及以頭部相關傳遞函數 (HRTF)為基礎的濾波器則在該濾波處理器182中所使 用’以將該下混信號進行濾波而獲得一能量改正的立體信 號,其具有一左方立體頻道以及具有一右方立體頻道 在一較佳實施例中’該增益因子與介於對應於上混頻 道濾波器的頻道脈衝回應中所包含的總能量,相對於此總 食b量之間的差異’以及一估計上混能量誤差ΔΕ之間的關係 有關。ΔΕ可以較佳的利用將對應於上混頻道濾波器的頻道 脈衝反,組合,並接著計算該組合頻道脈衝反映的能量方 式所計算。因為在第18圖中所有用於G4Gr的數目都為 正值’對於ΔΕ與E的定義便較為清楚,也就是兩者增益 因子皆大於卜此反映了在第5圖中所描述的經驗,也就是 在=數時間,社體信號的能量小_原始多頻道信號 的能量。應該也要注意的是,即使應⑽多頻道增益補償 時,換言之’在大錄錢中都使_子^,仍然會引起 能量損失。 第⑽圖摇述第18 _波處理器182力-較佳實施 例。特別疋’ $19a圖推述當在功能區塊職中第咖圖 的組合舰1!15、16、17與18,不進行增益鑛_狀況, 該遽波is輸出信號則如同第13圖中所撕。接著,該功能 區塊隐的輸出被輸入至一縮放功能區塊獅,以利用由 該功所計算的增益因子進行該輸出的縮放。 ηΐΙ’ΓΓ第1%圖所顯示建構該渡波處理器。 在此,頭糊嶋函數15至18 (咖⑽)是如則 36
能區塊182c中所描述而計算。因此,該計算器182c實作 該頭部相關傳遞函數(HRTF)補償,而不進行任何增益調 整。接著,提供一濾波調整器l82d,其使用本發明所計算 的增益因子。該毅調整||形壯在魏區塊職中所顯 示的調整濾波器,其中功能區塊lS2e利用該調整濾波器實 作滤波’並實作如在第13圖中所顯示有關於濾波器輸出的 後續加總動作。因此,要獲得增益改正立體頻道“與^ 並不需要如同第19a圖中的後製縮放處理。 S 一般來說,如同已經聯結方程式16、17以及18所描 繪,可利用該估計上混誤差ΔΕ進行增益計算。此近似方式 對於上混頻道的數目等於下混頻道數目+1時是特別有用 的。因此,在兩下混頻道的情況中,此近似方式可對於三 個上混頻道良好工作。替代的,當具有三個下混頻道時, 此近似方式也同樣對於在具有四個上混頻道的方案+良好 工作。 然而,要注意的是根據該上混誤差估計所進行的增益 因子計算也可以在以下的範例情況令實作,其中利用三個 下混頻道進行五個頻道的預測。替代的,也可以使用一種 以預測為基礎的上混,而從兩個下混頻道上混成為四個上 混頻道。關於此估計上混能量誤差,不但可以對於該較 佳情況以方程式(25)直接地計算此估計誤差,也可以在一位 元流中傳輸某些真實發生上混誤差的資訊。然而,即使在 其他與聯結方程式(25)至(28)所描述特別情況的其他情況 中’也可以接著根據用於該上混頻道以頭部相關傳遞函數 37 為基礎_波器’利用該預測參數計算該數值 η。當考量方程式⑽時,_的是此方程式也可以 ^應用至-種2/4預測上混結構之中,代表該以頭部相關傳 遞函數(HRTF)為基礎的驗衝反應能量的權 也對應的改變。 有鑑於此,明顯的是方程式(27)的一般結構,換言之, 根據ΕΒ/(ΕΒ- △ ΕΒ)計算增益因子的方式,也可以應用於其他 的方案之中。 、 接著’將討論第20騎顯示以預測為基礎的編碼器結 構實作’其可以用於產生該下混信號L、R與傳輸至一解碼 器的上混規則資訊,因此該解碼器可以根據該立體濾波處 理器實作增益補償。 一下混器191接收五個原始信頻道,或替代的接收如 同利用“與心所描述的三個原始頻道。該下混器I%可以 根據一預定的下混規則工作。在該情況中,並不需要以線 & 192所描述的下混規則指示。自然的,該誤差最小化器 193可以改變該下混規則,以將一上混器194輸出處的重建 頻道’對於該對應原始輸入頻道之間的誤差最小化。 因此,該誤差最小化器193可以改變該下混器規則192 或該上混器規則196,因此該重建頻道具有一最小化的預測 損失ΔΕ。在該誤差最小化器193之中’此最佳化問題可以 利用任何已知的演算法所解決,其較佳的是利用一種關於 次波段的方式操作,以將該重建頻道與該輸入頻道之間的 差異最小化。 38 如同之前所陳述的,該輸入頻道可以是原始頻道L、 s =、Rs、〇替代的’該輸人頻道可以是三個頻道l、r、 ’沾、中錄人頻道L、R可以·在第u 功能區塊所導出。替代的,當該原始 !^ 、C頻道時,這些頻道也可以視作為,,原 第20圖另外描述除了傳輸兩預測參數以外,也可以使 用任何的上混規則資訊’只要在該位置中的解碼器可以利 用此上混_魏進行上混。因此,虹混酬資訊也可 以是-種查絲中的實體,或是任何與上混有關的資訊。 本發明因此提供-種根據可利用下混信號與由頭部相 關傳遞函數(HRTF)猶方式㈣的額外㈣資料,實作 多頻道音頻錢立體解碼的有效方式。本發明提供一種解 決從組合_上稍立祕辦所產生頻縣色問題的方 法0 根據本發明方法的特定實作要求,本發明方法可以在 硬體或軟體巾實作。該實作可關用—種數位儲存媒介進 行,特別一種碟片、多功能數位碟片(DVD)或是光盤 (CD) ’其具有儲存在其上的電子可讀控制信號,並利用 -種可程序化電腦系統操作,因而實作本發财法。一般 來說’本發·此是-種電難式產品,其具有儲存在一 機器可讀上的程式碼,當該電肺式於-電腦上執行 時’該程式碼可操作來實作本發财法。換句話說,本發 明方法因此是-種電職式,其具有當該電難式於電腦 39 338461 上執行時實^少—種本發明方法的程式碼。 ㈣雖之μ⑽參考狀實施轉職明及描述 ,本領 -、彳瞭解的疋在不背離本發明精神與觀點下可進行 形式與細節的魏邱改變。也可瞭解在打離此處所公 開以及由後續中請專利朗所包含的廣泛概念下,可以在 不同實施例中進行適合的不同改變。
40 【圖式簡單說明】 本發明現在_由描職触轉考伴隨料的方式所 敘述,其並不限制本發明的觀點或精神,其中·· 第1圖描述頭部相·遞函數(HRTF)相關献器 的參數多頻道信號立體合成; 第2圖描述利用組合滤波器的參數多頻道信號立體合成; 第3圖描述本發明參數/濾波器組合器的組成; 第4圖描述動態影像壓縮標準環繞(MpEG Su_nd)空 間解碼的結構; 第5圖描述不_本_增益補償轉碼立體信號頻譜; 第6圖描述本發明立體信號解碼的頻譜; 第7圖描述利用頭部相關傳遞函數(hrtf)的傳統立體 合成; 第8圖描述-種動態影像壓縮標準(MpEG)環繞編碼器; 第9圖描述動態影像壓縮標準(MPEG)環繞解碼器與立 體合成器的串聯; ~ 第1〇圖描述一種用於特定配置的概念三維(3D)立體解 碼器; 第11圖描述一種用於特定配置的空間編碼器; 第u圖描述一種空間(動態影像壓縮標準環繞(MPEG Surround))解碼器; 第13圖描述利用四個濾波器進行兩下混頻道濾波,以在 不進行增益因子改正下獲得立體信號; 第U圖描述一種在五頻道設定中,說明不同頭部相關傳 4\ 1338461 遞函數(HRTF) “ίο的空間設定; 第15圖描述#已經組合代表l、Ls以及R、Rs _道時, 第14圖的狀態; 5 ; 第咖圖描述當已經實_部相關傳遞函數(HRTF)最 大組合’並只剩餘$ 13 _四倾波科 第15 圖的設定; 〆 第16b圖描述由第2〇圖編石馬器所決定的上混規則,其具 有-種造成雜量雜上混的上混係數; 第—圖私述如何組合頭部相關傳遞函數(HRTF),以在 最後獲得四個明部相_遞函數(HRtf)為基礎的滤波 益, 第18圖描述本發明多頻道解妈器的-較佳實施例; 第19a圖描述在不進行增益改正下,以頭部相關傳遞函 數(HRTF)為基礎進行遽波之後’具有—縮放狀態的本發 明多頻道解碼器第一實施例; 第19b圖描述利用以頭部相關傳遞函數(hrtf)為基礎 的滤波器進行調整之後的本發明裝置,其形成—種增益調 整的濾、波器輸出信號;以及 第20圖顯示-種用於編碼器的範例,其產生代表一非能 量守恆上混規則的資訊。 42 (:S > 1338461 【主要元件符號說明】 1、2、3、4、5、6、7、8、9、10頭部相關傳遞函數 103a、103b 加法器 401-404 功能區塊 405 信號 C、c 中央頻道 CPC 上混參數 CLD 頻道強度差異參數 enc 編碼 g ' ge ' gr 增益因子 H、HRTF 頭部相關傳遞函數 ICC 頻道之間諧和性/相關性參數 L 左方頻道 L、R、C 信號 Lf 左前方頻道 Ls 左環繞頻道 Lb ' Rb 輸出頻道 Lb 左方立體頻道 L〇 第一下混頻道 lfe if 低頻增強頻道 左前方頻道 Is 左環繞頻道 l〇、r〇 輸入頻道 OTT 一對二 43 1338461 R 右方頻道 R〇 第二下混頻道 Rf 右前方頻道 Rs 右環繞頻道 Rb 右方立體頻道 rf 右前方頻道 rs 右環繞頻道 TTT 二對三 Zl ' z2 下混信號 44

Claims (1)

  1. 1338461 十、申請專利範圍: L 一種多頻道解碼器,用以使用參數以從一下混信號產 生一立體k號,該下混訊號係從一原始多頻道信號所 導出,該參數包含一上混規則資訊,該上混規則資訊 可用於以一上混規則將一下混信號進行上混的,該上 混規則造成一能量誤差,該多頻道解碼器包括: -增益因子計算H ’其根_上混_ f訊以及與上 混頻道對應的以頭部相關傳遞函數(HRTF)為基礎 的一濾波器特性,計算至少一增益因子,以降低或消 除該能量誤差;以及 一濾波處理器,其利用該至少一增益因子、該濾波器 特性與該上混規則資訊將該下混信號進行滤波:以獲 得一能量改正立體信號。 2.如中請專利範圍第1項❹頻道解似,其中該滤波 處理器是操作以計算滤波係數以用於該下混信號的每 y頻道的兩增益調賊波器,以及操作以利用該兩增 益調整滅波器之每一個未濾波該下混信號。 3·如申Μ專她圍第i項解頻道解碼器,其中該渡波 處理器並不利用該增益因子而操作以計算用於該下混 2號的各頻道的兩渡波器的濾波係數,並紐該下混 L號的該頻;及减波該下混錢的鋪道之後進 行増益調整。 如申1利賴第丨項的多頻道解媽器,其中該增益 因子計算H是操作以根據_波轉性的—組合脈衝 45 回應的能量未計算該增益因子,該組合脈衝回應則是 藉由加上或減去各自濾波器脈衝回應所計算。 如申請專利範圍第丨項的多頻道解碼器,其中該增益 因子計算器是操作以根據各自濾波器脈衝回應的一功 率組合來計算該増益因子。 如申請專利範圍第5項的多頻道解碼器,其中該增益 因子计舁器疋操作以根據各自爐波器脈衝回應的功率 的一經加權加總來計算該增益因子,其中在該經加權 加總中所使用的權重因子與該上混規則資訊有關。 如申請專利範圍第1項的多頻道解碼器,其中該增益 因子計算H是操作啸據具有__分子與-分母的表示 式來計算該增益因子,該分子具有各自濾波器脈衝遽 波回應的功料-組’而該分母具有各㈣波器脈衝 回應的功率的-經加權加總,其中在該經加權總和中 所使用的權重因子與該上混規則資訊有關。 如申請專鄕圍第1項的㈣道解碼^,其中該增益 因子計算ϋ是操作以根據町方程式計算該增益因 子: Sn gn otherwise 其中當η奴為1時,gn為該下混健之—頻道的一 增益因子’其中gl為該下混信號之—第—頻道的增 益因子,當η設定為2時,gs為該下混信號之一第二 頻道的增翻子’其巾EnB域由使用加權參數對頻 1338461 道脈衝回應的能量進行加權所計算的一經加權加總 能量,而其中ΔΕη為該上混規則所?丨入的該能量誤 差的一估計’其中,/3與r為上混規則相關參數, 而其中ε為大或等於零的一數字。 9. 如申請專利範圍第8項的多頻道解碼器,其中該增益 因子計算器是操作以根據以下方程式計算Εη及δεπ : 参,η,丨 Ά||2’ ^ =/?(ΐ-〇·|6η>)||2 +α(ΐ-σ|&„,||2 +4.β||2> 其中為對應於一第一上混頻道與一第η個立體頻 道的一以頭部相關傳遞函數(HRTF)為基礎的濾波 器脈衝回應,其中bn,2為對應於一第二上混頻道與該 第η個立體頻道的一以頭部相關傳遞函數(HRTF) 為基礎的濾波器脈衝回應,其中bn,3為對應於一第三 上混頻道與該第η個立體頻道的一以頭部相關傳遞 函數(HRTF)為基礎的濾波器脈衝回應, 其中後續定義為有效的 a-(1-ci)/3、A = (l-c2)/3、σ = α +々以及ρ = 其中C】為一第一預測參數,C2為一第二預測參數, 而其中該第一預測參數與該第二預測參數構成該上 混規則資訊。 10. 如申請專利範圍第丨項的多頻道解蝎器’其中該增益 因子計算器是操作以計算用於一左立體頻道與一右立 體頻道的一共用增益因子。 u,如申請專利範圍第1項的多頻道解·,其中該濾、波 47 年月曰修正替換fH_ 處理器是操作以使用用於該虛擬中央、左及右方位置 的該左立體頻道與該右立體頻道的以頭部相關傳遞函 數(HRTF)為基礎的滤波器’做為該濾波器特性或 是使用藉由組合一虛擬左前方位置與一虛擬左環繞位 置的頭部相關傳遞函數(HRTF)濾波器,或是藉由組 合一虛擬右前方位置與一虛擬右環繞位置的頭^相關 傳遞函數(HRTF)遽波器,所導出的該滤波器特性。 如申請專利範圍第11項的多頻道解碼器,其中與原始 左方及左環繞頻道有關或是與秘右方及右環繞頻道 有關的參數是包含在一解碼器輸入信號之中,以及 其中該舰處理器是操作以使財數而將該頭部相關 傳遞函數(HRTF)濾波器進行組合。 如申請專讎ϋ第1項的㈣道解碼器,其中該增益 因子计算0是操作以根據以該立體頻道頭部相關傳遞 函數(HRTF)為基礎的遽波器的頻道脈衝回 經加權線性組合,以及從該加權線性組合減二二 差的-數值之間的比率,來計算—立體頻道的 增益因早。 如申明專利域第1;3項的多頻道解,其中該辦兴 算器是操作以使用該上混規則資訊來決定二 如申明專·圍第14項的多頻道解碼器,其 麻,其可时建構:上混 传輪出頻道具有與對應三輸入頻道有關的能 16. 量誤差。 ^申請專利範圍第!項的多頻道 處理5|是桓你A 解馬杰’八中南慮波 -第=打柄目,做域《特性: 第=器’用於對該下混信號之 以獲得―第—左立體輪出, 仃慮 ―第二應波器’用於對該
    ,崎得—第二左立體if就之一右頻道進行渡 H皮ϋ ’用於觸下混信號之— 波’以獲得-第-右立體輸出, 進仃渡 一第四濾波器 波,以獲得一 ,用於對該下混信號之一右頻道進行濾 第一右立體輸出, ’用_該第—左立體輪出與該第二左立體 進仃加總’以獲得—左方立體頻道,顧於將該
    第—右立體輪出與該m體輪出進行加總,以獲 得一右方立體頻道, 又 其中該渡波處理器是操作以在進行加總之前或之後, 對該第-或第二渡波器或對該些左方立體輸出施加該 左方立體頻道的-增益因子,或是在進行加總之前或 之後’對該第三或第四濾波器或對該些右方立體輸出 施加該右方立體頻道的一增益因子。 17·如申請專利範11第1項的多頻道解碼器’其中該上混 規則資訊包含上混參數,其可用來建構一上混矩陣, 以從兩或三個頻道產生一上混。 18.如申請專利範圍帛17項的多頻道解石馬器,其中該上混 49 矩陣係定義如下: 'L mn' R % w22 A) C w32_ _Λ)_ 其中L為一第一上混頻道,為一第二上混頻道,以 及C為一第三上混頻道,L〇為該下混信號之一第一 頻道,R〇為該下混信號之一第二頻道,而mij為上混 規則資訊參數。 如申請專利範圍第1項的多頻道解碼器,其中一預測 損失參數是包含在一多頻道解碼器輸入信號之中,以 及 其中一遽波處理器是操作以利用該預測損失參數將該 增益因子進行縮放。 如申請專利範圍第1項的多頻道解碼器,其中該增益 计算器是操作以計算次波段相關增益因子,以及 其中該濾波處理器是操作以施加該次波段相關增益因 子。 邪甲堉寻利靶圍第η項的多頻道解碼器,其中該該 波處理器是操作以藉由將該頭部相關傳遞函 ⑽TF)舰H的舰崎回應的加職是相位偏 型式進行加總,以將該頭部相關傳遞函數(hrtf) 波器與兩頻道進行組合,其中用以將該頭部相關傳 函數(HRTF)濾波n頻親衝回應加權的權重因子 =該頻道之_程度差異有關,而—施加的相位偏 1與介於該頭部相關傳遞函數(Hrtf)遽波器的頻 1338461 間延遲有關。 22. 如申請專利範圍第1項的多頻道解碼器,其中該以頭 部相關傳遞函數(HRTF)為基礎的濾波器或頭部相關 傳遞函數(HRTF)濾波器的濾波器特性為複數子波段 濾波器,該複數子波段濾波器是藉由利用一複數指數 調變濾波器組對一頭部相關傳遞函數(HRTF)濾波器 的一實數數值濾波器脈衝回應進行濾波所獲得。
    23. —種多頻道解碼的方法,用以使用參數以從一下混信 號產生一立體信號,該下混信號係從一原始多頻道信 號所導出’該參數包含-上混酬資訊,該上混規則 資訊可用於以-上混規則將一下混信號進行上混,該 上混規則造成一能量誤差,該方法包括: 根據該上混規則資訊以及與上混頻道對應的以頭部相 關傳遞函數(HRTF)為基礎n皮器特性,計算至 少一增益因子’以降低或消除該能量誤差;以及
    利用該至少-增益因子、該滤波器特性與該上混規則 資訊將該下混信號進行舰,以獲得一能量改正立體 信號。 24·:種具有-程式碼的電腦程式,當該電腦程式於一電 月匈上執订時’用以執行如申請專㈣圍第Μ項所 方法。 51 I
TW095132641A 2006-06-02 2006-09-04 Binaural multi-channel decoder in the context of non-energy-conserving upmix rules TWI338461B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US80381906P 2006-06-02 2006-06-02

Publications (2)

Publication Number Publication Date
TW200803190A TW200803190A (en) 2008-01-01
TWI338461B true TWI338461B (en) 2011-03-01

Family

ID=37685624

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095132641A TWI338461B (en) 2006-06-02 2006-09-04 Binaural multi-channel decoder in the context of non-energy-conserving upmix rules

Country Status (13)

Country Link
US (19) US8027479B2 (zh)
EP (2) EP2216776B1 (zh)
JP (1) JP4834153B2 (zh)
KR (1) KR101004834B1 (zh)
CN (3) CN102523552B (zh)
AT (1) ATE503244T1 (zh)
DE (1) DE602006020936D1 (zh)
ES (1) ES2527918T3 (zh)
HK (2) HK1146975A1 (zh)
MY (2) MY157026A (zh)
SI (1) SI2024967T1 (zh)
TW (1) TWI338461B (zh)
WO (1) WO2007140809A1 (zh)

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US20080255857A1 (en) * 2005-09-14 2008-10-16 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US8411869B2 (en) * 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
KR100878816B1 (ko) 2006-02-07 2009-01-14 엘지전자 주식회사 부호화/복호화 장치 및 방법
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
US8265941B2 (en) * 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US20110282674A1 (en) * 2007-11-27 2011-11-17 Nokia Corporation Multichannel audio coding
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
CN102172047B (zh) * 2008-07-31 2014-01-29 弗劳恩霍夫应用研究促进协会 双耳信号的信号生成设备和方法
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
WO2010070016A1 (en) * 2008-12-19 2010-06-24 Dolby Sweden Ab Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters
EP2380364B1 (en) * 2008-12-22 2012-10-17 Koninklijke Philips Electronics N.V. Generating an output signal by send effect processing
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2326108B1 (en) * 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
BR122021008583B1 (pt) * 2010-01-12 2022-03-22 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN101835072B (zh) * 2010-04-06 2011-11-23 瑞声声学科技(深圳)有限公司 虚拟环绕声处理方法
MX2012011532A (es) * 2010-04-09 2012-11-16 Dolby Int Ab Codificacion a estereo para prediccion de complejos basados en mdct.
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
WO2012040897A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
CN103733256A (zh) * 2011-06-07 2014-04-16 三星电子株式会社 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端
US9178553B2 (en) * 2012-01-31 2015-11-03 Broadcom Corporation Systems and methods for enhancing audio quality of FM receivers
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
WO2013120531A1 (en) * 2012-02-17 2013-08-22 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
US20150371644A1 (en) * 2012-11-09 2015-12-24 Stormingswiss Gmbh Non-linear inverse coding of multichannel signals
WO2014164361A1 (en) * 2013-03-13 2014-10-09 Dts Llc System and methods for processing stereo audio content
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US9384741B2 (en) * 2013-05-29 2016-07-05 Qualcomm Incorporated Binauralization of rotated higher order ambisonics
US9369818B2 (en) 2013-05-29 2016-06-14 Qualcomm Incorporated Filtering with binaural room impulse responses with content analysis and weighting
US9215545B2 (en) * 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830048A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for realizing a SAOC downmix of 3D audio content
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
ES2653975T3 (es) 2013-07-22 2018-02-09 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI634547B (zh) * 2013-09-12 2018-09-01 瑞典商杜比國際公司 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102201027B1 (ko) 2014-03-24 2021-01-11 돌비 인터네셔널 에이비 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스
EP3154279A4 (en) * 2014-06-06 2017-11-01 Sony Corporation Audio signal processing apparatus and method, encoding apparatus and method, and program
EP3198594B1 (en) * 2014-09-25 2018-11-28 Dolby Laboratories Licensing Corporation Insertion of sound objects into a downmixed audio signal
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
GB2544458B (en) * 2015-10-08 2019-10-02 Facebook Inc Binaural synthesis
US11256768B2 (en) 2016-08-01 2022-02-22 Facebook, Inc. Systems and methods to manage media content items
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN107221337B (zh) * 2017-06-08 2018-08-31 腾讯科技(深圳)有限公司 数据滤波方法、多人语音通话方法以及相关设备
KR102530000B1 (ko) 2017-06-19 2023-05-08 버지니아 테크 인터렉추얼 프라퍼티스, 인크. 다중 안테나 송수신기를 이용한 무선 송신을 위한 정보의 인코딩 및 디코딩
US10749594B1 (en) * 2017-08-18 2020-08-18 DeepSig Inc. Learning-based space communications systems
DE102017124046A1 (de) * 2017-10-16 2019-04-18 Ask Industries Gmbh Verfahren zur Durchführung eines Morphingvorgangs
CN110853658B (zh) * 2019-11-26 2021-12-07 中国电影科学技术研究所 音频信号的下混方法、装置、计算机设备及可读存储介质
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质
EP4243014A4 (en) * 2021-01-25 2024-07-17 Samsung Electronics Co Ltd APPARATUS AND METHOD FOR PROCESSING A MULTICHANNEL AUDIO SIGNAL
TWI839606B (zh) * 2021-04-10 2024-04-21 英霸聲學科技股份有限公司 音訊處理方法以及音訊處理裝置
US20240274137A1 (en) * 2021-06-10 2024-08-15 Nokia Technologies Oy Parametric spatial audio rendering
GB2609667A (en) * 2021-08-13 2023-02-15 British Broadcasting Corp Audio rendering

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3571794A (en) * 1967-09-27 1971-03-23 Bell Telephone Labor Inc Automatic synchronization recovery for data systems utilizing burst-error-correcting cyclic codes
US5610986A (en) * 1994-03-07 1997-03-11 Miles; Michael T. Linear-matrix audio-imaging system and image analyzer
US5727068A (en) * 1996-03-01 1998-03-10 Cinema Group, Ltd. Matrix decoding method and apparatus
US6757659B1 (en) 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60328402D1 (de) 2002-09-23 2009-08-27 Koninkl Philips Electronics Nv Tonsignalerzeugung
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7680289B2 (en) * 2003-11-04 2010-03-16 Texas Instruments Incorporated Binaural sound localization using a formant-type cascade of resonators and anti-resonators
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
US20060093164A1 (en) * 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
DE102004053090A1 (de) * 2004-11-03 2006-05-04 Basf Ag Verfahren zur Herstellung von Natriumdithionit
EP1810396A1 (en) 2004-11-05 2007-07-25 Labofa Munch A/S A drive mechanism for elevating and lowering a tabletop
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
DE602007004451D1 (de) * 2006-02-21 2010-03-11 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
ATE532350T1 (de) * 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
WO2008016097A1 (fr) * 2006-08-04 2008-02-07 Panasonic Corporation dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci
JP5202090B2 (ja) * 2008-05-07 2013-06-05 アルパイン株式会社 サラウンド生成装置
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
PL3779977T3 (pl) * 2010-04-13 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji
EP3518236B8 (en) * 2014-10-10 2022-05-25 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness

Also Published As

Publication number Publication date
CN102523552B (zh) 2014-07-30
US20230209291A1 (en) 2023-06-29
JP4834153B2 (ja) 2011-12-14
JP2009539283A (ja) 2009-11-12
US10123146B2 (en) 2018-11-06
US10412525B2 (en) 2019-09-10
US10021502B2 (en) 2018-07-10
US20180091914A1 (en) 2018-03-29
US20180139558A1 (en) 2018-05-17
US8948405B2 (en) 2015-02-03
US8027479B2 (en) 2011-09-27
EP2024967A1 (en) 2009-02-18
US20180098169A1 (en) 2018-04-05
US10412524B2 (en) 2019-09-10
US10015614B2 (en) 2018-07-03
US20190110150A1 (en) 2019-04-11
DE602006020936D1 (de) 2011-05-05
US20200021937A1 (en) 2020-01-16
US20190116443A1 (en) 2019-04-18
US20180109897A1 (en) 2018-04-19
SI2024967T1 (sl) 2011-11-30
ATE503244T1 (de) 2011-04-15
US20140343954A1 (en) 2014-11-20
US10097941B2 (en) 2018-10-09
EP2216776B1 (en) 2014-11-12
TW200803190A (en) 2008-01-01
US20180109898A1 (en) 2018-04-19
ES2527918T3 (es) 2015-02-02
EP2024967B1 (en) 2011-03-23
US20180139559A1 (en) 2018-05-17
US10085105B2 (en) 2018-09-25
CN101460997A (zh) 2009-06-17
US20170272885A1 (en) 2017-09-21
US10091603B2 (en) 2018-10-02
US12052558B2 (en) 2024-07-30
MY180689A (en) 2020-12-07
EP2216776A2 (en) 2010-08-11
KR20090007471A (ko) 2009-01-16
US20070280485A1 (en) 2007-12-06
US9992601B2 (en) 2018-06-05
US10863299B2 (en) 2020-12-08
MY157026A (en) 2016-04-15
HK1146975A1 (zh) 2011-07-22
CN102547551A (zh) 2012-07-04
CN102523552A (zh) 2012-06-27
WO2007140809A1 (en) 2007-12-13
US20180132051A1 (en) 2018-05-10
EP2216776A3 (en) 2011-03-23
US20110091046A1 (en) 2011-04-21
US10412526B2 (en) 2019-09-10
US20190110149A1 (en) 2019-04-11
HK1124156A1 (en) 2009-07-03
US20190110151A1 (en) 2019-04-11
US10097940B2 (en) 2018-10-09
KR101004834B1 (ko) 2010-12-28
US10469972B2 (en) 2019-11-05
US20180098170A1 (en) 2018-04-05
US11601773B2 (en) 2023-03-07
CN102547551B (zh) 2014-12-17
US9699585B2 (en) 2017-07-04
US20210195357A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
TWI338461B (en) Binaural multi-channel decoder in the context of non-energy-conserving upmix rules
CN101406074B (zh) 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法
JP6039516B2 (ja) 多チャンネルオーディオ信号処理装置、多チャンネルオーディオ信号処理方法、圧縮効率向上方法及び多チャンネルオーディオ信号処理システム
CN108141685B (zh) 使用呈现变换参数的音频编码和解码
WO2007031896A1 (en) Audio coding
JP2018537710A (ja) パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡
TW201036464A (en) Binaural rendering of a multi-channel audio signal
GB2485979A (en) Spatial audio coding
JP6964703B2 (ja) パラメトリック・バイノーラル出力システムおよび方法のための頭部追跡
EA042232B1 (ru) Кодирование и декодирование звука с использованием параметров преобразования представления
EA047653B1 (ru) Кодирование и декодирование звука с использованием параметров преобразования представления