TW202334938A - 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 - Google Patents
正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 Download PDFInfo
- Publication number
- TW202334938A TW202334938A TW111148928A TW111148928A TW202334938A TW 202334938 A TW202334938 A TW 202334938A TW 111148928 A TW111148928 A TW 111148928A TW 111148928 A TW111148928 A TW 111148928A TW 202334938 A TW202334938 A TW 202334938A
- Authority
- TW
- Taiwan
- Prior art keywords
- filter
- frequency band
- channel
- filters
- time domain
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 122
- 238000012545 processing Methods 0.000 claims abstract description 67
- 230000005236 sound signal Effects 0.000 claims abstract description 42
- 238000006243 chemical reaction Methods 0.000 claims description 50
- 238000003786 synthesis reaction Methods 0.000 claims description 29
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 230000001364 causal effect Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000000545 stagnation point adsorption reflectometry Methods 0.000 claims 2
- 238000004458 analytical method Methods 0.000 description 32
- 239000000523 sample Substances 0.000 description 17
- 230000004044 response Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000001914 filtration Methods 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002898 library design Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Abstract
本發明提供一種處理一多通道音訊信號之一表示之方法。該表示包含一第一通道及與一第二通道相關之後設資料。針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料包含一各自預測參數。該方法包含:將具有複數個第二頻帶之一第二濾波器庫應用於該第一通道,以針對各第二頻帶獲得該第一通道之一帶狀版本;針對各第二頻帶,基於該等預測參數及對應於該等第一頻帶之第一濾波器產生一各自時域濾波器;及針對各第二頻帶,基於該第一通道之一經濾波版本產生該第二通道之一預測,藉由將該第二頻帶中之該各自時域濾波器應用於該第一通道之該帶狀版本而獲得該經濾波版本。本發明亦提供對應設備、程式及電腦可讀儲存媒體。
Description
本發明係關於用於處理多通道音訊信號之表示之技術。特定言之,本發明描述在非常適合於信號操縱之一QMF庫(例如,經過度取樣QMF庫)之域中運行SPAR濾波器庫的SPAR解碼。
IVAS SPAR係基於一低延時核心編解碼器之用於一階立體混響(First Order Ambisonics) (FOA)及高階立體混響(HOA)空間音訊之一低延遲編解碼器。
沉浸式音訊及視訊服務(IVAS)空間重建(SPAR)使用修改型離散傅立葉變換(Modified Discrete Fourier Transform) (MDFT)進行信號分析且作為SPAR有限脈衝回應(FIR)濾波器庫之快速卷積核心(convolution kernel)。SPAR濾波器庫由具有適應人類聽覺系統之時間及頻率解析度之精心設計之低延遲FIR帶通濾波器(通常為12個)組成。SPAR濾波器庫在編碼器及解碼器處運行。在編碼器處,運算主動降混信號及殘差信號且將其與參數(例如,SPAR參數)一起發送至解碼器。在解碼器處,逆轉編碼器側處理,且使用經傳輸參數來重建原始信號。為忠實地重建信號,編碼器及解碼器處之濾波器庫應精確匹配。
另一方面,在解碼器處使用經過度取樣QMF庫可比潛在地呈一精細時間網格之SPAR MDFT域(諸如(舉例而言)參數音訊處理及解碼)更適合於信號操縱。
因此,需要實現針對SPAR解碼內容高效地使用QMF域中之解碼器濾波器庫的技術。一般需要實現在一第二濾波器庫之域中使用一第一濾波器庫之濾波器的技術。
鑑於此需求,本發明提供用於處理多通道音訊信號之表示之方法及設備,以及對應程式及電腦可讀儲存媒體,其等具有各自獨立技術方案之特徵。
本發明之一態樣係關於一種處理一多通道音訊信號之一表示之方法。例如,該方法可為電腦實施的。處理可涉及解碼,諸如(舉例而言) SPAR解碼。該多通道音訊信號可為一空間音訊信號,諸如(舉例而言)一FOA音訊信號或一HOA音訊信號。該表示可包含一第一通道及與一第二通道相關之後設資料。此外,該多通道音訊信號之該表示可包含一個以上第二通道。該第一通道可為一輸送通道(或編碼至一輸送通道之一通道),且該等第二通道可為除該輸送通道(或編碼至該輸送通道之該通道)外之通道,特定言之,經參數寫碼之通道。針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料可包含用於基於該第一頻帶中之該第一通道進行該第二通道之一預測的一各自預測參數(例如,一增益參數)。該方法可包含將具有複數個第二頻帶之一第二濾波器庫應用於該第一通道,以針對該等第二頻帶之各者獲得該第二頻帶中之該第一通道之一帶狀(banded)版本。該第二濾波器庫可不同於該第一濾波器庫。該方法可進一步包含針對該等第二頻帶之各者,基於該等預測參數及該第一濾波器庫之第一濾波器產生一各自時域濾波器。其中,該等第一濾波器可對應於該等第一頻帶。該方法可進一步包含基於該第一通道之該等帶狀版本及該等第二頻帶中之該等時域濾波器產生該第二通道之一預測。此可涉及例如針對該等第二頻帶之各者,基於該第二頻帶中之該第一通道之一經濾波版本產生該第二頻帶中之該第二通道之一預測。其中,可藉由將該第二頻帶中之該各自時域濾波器應用於該第二頻帶中之該第一通道之該帶狀版本而獲得該第一通道之該經濾波版本。
因此,原始多通道音訊信號之重建及後續音訊處理不需要變換至第一濾波器庫之域其後接著變換至第二濾波器庫之域。代替性地,可在第二濾波器庫之域中「仿真」第一濾波器庫之濾波器,藉此避免額外轉換步驟。此容許獲益於用於編碼之第一濾波器庫之特定優點(諸如特別適於人類聽覺之頻帶等),同時亦獲益於用於經重建多通道音訊信號之額外信號處理之第二濾波器庫之特定優點(諸如較佳時間解析度等),而無額外運算負擔。
在一些實施例中,多通道音訊信號可為一階立體混響(FOA)或高階立體混響(HOA)音訊信號。
在一些實施例中,預測參數可為SPAR參數(例如,增益參數)。
在一些實施例中,第一濾波器庫可為包括FIR帶通濾波器之一SPAR濾波器庫且可使用一MDFT。對於SPAR,例如,可存在12個第一頻帶。
在一些實施例中,第二濾波器庫可為一QMF濾波器庫。此外,第二濾波器庫可為一經過度取樣濾波器庫,特定言之例如一經過度取樣QMF濾波器庫。
在一些實施例中,時域濾波器可為多分接頭(multi-tap) FIR濾波器。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可包含:基於各自第一濾波器及用於濾波器轉換之一原型濾波器來產生複數個經調適第一濾波器。
在一些實施例中,針對一給定第二頻帶
,一給定第一頻帶
之一第一濾波器
之經調適第一濾波器
可被計算為
其中
係用於濾波器轉換之原型濾波器,
係第二濾波器庫之跨距(stride),
係第二頻帶之數目,且針對
之加總在用於濾波器轉換之原型濾波器
之支援範圍內。
在一些實施例中,該方法可進一步包含基於第二濾波器庫之一原型濾波器產生用於濾波器轉換之原型濾波器。
在一些實施例中,可藉由求解一最小平方問題來基於第二濾波器庫之原型濾波器產生用於濾波器轉換之原型濾波器。
在一些實施例中,產生用於濾波器轉換之原型濾波器可包含:基於第二濾波器庫之原型濾波器
產生一非因果原型濾波器
。該產生可進一步包含產生非因果原型濾波器
及第二濾波器庫之原型濾波器
之一互相關
。該產生可進一步包含針對某一整數
產生一組矩陣
,其維度係
且僅針對索引
具有非零元素
,其中
係
之整數倍,其中
係用於濾波器轉換之原型濾波器之長度。該產生可進一步包含求解
之一組最小平方問題,其中
係維度為
之一向量,其包含用於濾波器轉換之原型濾波器
之濾波器係數。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可進一步包含:取得經調適第一濾波器之一加權和。其中,經調適第一濾波器可用各自第一頻帶之預測係數(例如,增益)進行加權。
在一些實施例中,用於濾波器轉換之原型濾波器可為一不對稱原型濾波器。
在一些實施例中,各分接頭之處理跨距可等於或小於第二頻帶之數目。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可包含:藉由第一及第二基本信號近似一給定第一濾波器。其中,可作為將第二濾波器庫、基本實值單分接頭濾波器及第二濾波器庫之一合成濾波器庫應用於在各自樣本位置處具有單一非零樣本之基本信號的結果而獲得第一基本信號。基本實值單分接頭濾波器可為用於在各自分接頭位置處具有單一非零濾波器係數之第二頻帶之各自單一第二頻帶的濾波器。此外,可作為將第二濾波器庫、基本虛數單分接頭濾波器及第二濾波器庫之合成濾波器庫應用於基本信號的結果而獲得第二基本信號,其中基本虛數單分接頭濾波器係用於在各自分接頭位置處具有單一非零濾波器係數之第二頻帶之各自單一第二頻帶的濾波器。該產生可進一步包含基於近似中之第一及第二基本信號之係數來針對第二頻帶中之第一濾波器產生經調適時域濾波器。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可包含:獲得將第二濾波器庫、實值單分接頭濾波器
及第二濾波器庫之一合成濾波器庫應用於信號
之結果
,其中
指示一給定第二頻帶,
指示一給定樣本位置,且
指示一濾波器分接頭位置。該產生可進一步包含獲得將第二濾波器庫、虛數單分接頭濾波器
及第二濾波器庫之合成濾波器庫應用於信號
之結果
。該產生可進一步包含判定係數
及
之一最小平方解,使得
對於一給定延遲
,其中
係第一頻帶
之第一濾波器,
係第二頻帶之數目,且
係第二頻帶
之濾波器分接頭之預定義數目。該產生可進一步包含將第二頻帶
中之第一濾波器
之一經調適第一濾波器
產生為
。
在一些實施例中,該方法可進一步包含截斷時域濾波器之一濾波器長度。
藉此,可降低運算複雜性,潛在地無可感知的影響。
在一些實施例中,一給定時域濾波器在截斷之後之濾波器長度可取決於時域濾波器之各自第二頻帶。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可涉及:針對第一濾波器之各者產生給定第二頻帶中之一各自基本(或經調適)時域濾波器(例如,經調適濾波器),及基於給定第二頻帶中之基本時域濾波器及預測參數來產生給定第二頻帶中之時域濾波器。接著,給定第二頻帶之一時域濾波器之截斷可基於基本時域濾波器之濾波器係數之臨限值,其中各臨限值對應於第一濾波器當中之一各自者。可從複數個第二頻帶中之該等基本時域濾波器之一最大量值導出一給定第一濾波器之基本時域濾波器之臨限值。
在一些實施例中,該方法可進一步包含針對各第一頻帶,判定複數個第二頻帶中之對應基本時域濾波器之一最大量值。該方法可進一步包含針對各第一頻帶,基於從該最大量值導出之一臨限值判定複數個第二頻帶中之對應基本時域濾波器之一最小經截斷濾波器長度。該方法可進一步包含針對各第二頻帶,基於該第二頻帶中之基本時域濾波器之最小經截斷濾波器長度來判定該第二頻帶中之時域濾波器之濾波器長度。
在一些實施例中,時域濾波器可為單分接頭FIR濾波器。
藉由採取單分接頭FIR濾波器,可在第二濾波器庫之域中以最小運算負擔仿真第一濾波器庫之濾波器。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可包含:判定複數個第一頻帶當中在該第二頻帶中具有一最高能量之一第一頻帶。該產生可進一步包含基於對應於經判定第一頻帶之第一濾波器之一線性相位近似及經判定第一頻帶之對應預測係數來產生時域濾波器。
在一些實施例中,針對一給定第二頻帶產生時域濾波器可包含:判定複數個第一頻帶當中在該第二頻帶中具有一最高能量之一組第一頻帶。該產生可進一步包含基於對應於該組經判定第一頻帶之第一濾波器之線性相位近似之一加權和來產生時域濾波器。其中,加權和中之權重可取決於該組經判定第一頻帶之對應預測係數及該第二頻帶中之該組經判定第一頻帶之第一頻帶之各自正規化量值或能量。此處,應理解,正規化量值或能量共計為1。
根據另一態樣,提供一種產生一多通道音訊信號之一表示之方法。該表示可包含一第一通道及與一第二通道相關之後設資料。針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料可包含用於基於該第一頻帶中之該第一通道進行該第二通道之一預測的一各自預測參數。該方法可包含基於該第一濾波器庫之第一濾波器及該等預測參數來產生該第二通道之一預測。其中,可藉由一時域信號(例如,預測信號)表示該第二通道之該預測。該方法可進一步包含藉由在時域中從該第二通道減去該第二通道之該預測而產生該第二通道之一殘差。
在一些實施例中,多通道音訊信號之表示可進一步包含第二通道之殘差。
根據另一態樣,提供一種用於處理多通道音訊信號之表示之設備。該設備可包含一處理器及耦合至該處理器且儲存用於該處理器之指令的一記憶體。該處理器可經組態以執行根據前述態樣及其等實施例之方法之全部步驟。
根據另一態樣,描述一種電腦程式。該電腦程式可包括用於在由一運算裝置執行時執行在本發明各處概述之方法或方法步驟的可執行指令。
根據又一態樣,描述一種電腦可讀儲存媒體。該儲存媒體可儲存經調適用於在一處理器上執行及用於在於處理器上實行時執行在本發明各處概述之方法或方法步驟的一電腦程式。
應注意,如本發明中所概述之方法及系統(包含其較佳實施例)可單獨使用或與本文件中所揭示之其他方法及系統組合使用。此外,可任意組合本發明中所概述之方法及系統之全部態樣。特定言之,發明申請專利範圍之特徵可以一任意方式彼此組合。
將瞭解,設備特徵及方法步驟可以許多方式互換。特定言之,如熟習此項技術者將瞭解,可藉由對應設備實現(若干)所揭示方法之細節,反之亦然。此外,關於(若干)方法(及例如其等步驟)作出之上述陳述之任何者被理解為同樣適用於對應設備(及例如其等區塊、級、單元),反之亦然。
相關申請案之交叉參考
本申請案主張於2021年12月20日申請之美國臨時申請案第63/291,817號之優先權利,該案之內容特此以引用的方式併入。
一般而言,本發明係關於用於音訊寫碼之參數濾波器庫處理,其中在編碼器處運用一個濾波器庫(例如,SPAR濾波器庫)應用參數,且應在解碼器處運用另一濾波器庫(例如,複值QMF濾波器庫)逆轉參數應用。本發明解決編碼器及解碼器濾波器庫不匹配之問題以進行精確的參數應用。
使用兩個不同濾波器庫之一個優點在於不同效能權衡。歸因於所需高效基於FFT之實施方案,編碼器處之濾波器庫可具有極低延遲但相對較大處理跨距。另一方面,解碼器處之濾波器庫可具有較高延遲但可具有以一較小跨距應用參數之能力,此為高效後續處理所需的。
根據上文,本發明之實施例係關於例如藉由QMF頻帶中沿時間之FIR濾波將SPAR解碼及SPAR解碼器濾波器庫(作為一第一濾波器庫域之一非限制性實例)整合至QMF域(作為一第二不同濾波器庫域之一非限制性實例)中。
系統概述根據經傳輸SPAR參數,FIR濾波器可為時變的。如同MDFT域中之SPAR濾波器庫操作,可運行全部帶通濾波器之加權和而非個別地運行各帶通濾波器。為降低複雜性,可以一QMF頻帶頻率相依方式截斷QMF域FIR濾波器。潛在地,一些處理可利用良好頻率解析度SPAR濾波器庫且藉由將處理與SPAR濾波器合併而高效地實施(且仍利用QMF域之相對較高時間解析度)。在SPAR濾波之後,其他處理步驟可僅在QMF域中運行。
即使可必須注意,QMF濾波器庫應具有近乎完美的重建特性且具有足夠大的混疊抑制以容許高品質信號修改,若QMF域用於信號修改,則無論如何必須符合此等要求。
圖1示意性地繪示具有後續QMF域處理之一預設IVAS SPAR系統100之一實例。
在編碼器處,一多通道音訊信號10經輸入至MDFT分析區塊105以應用一SPAR MDFT濾波器庫(作為一第一濾波器庫之一非限制性實例)。多通道音訊信號10亦輸入至信號分析區塊110,信號分析區塊110產生用於從與一輸送通道相關之一音訊通道(第一音訊通道)預測除與該輸送通道相關之該音訊通道外之音訊通道(第二音訊通道)的預測參數(例如,SPAR參數、增益參數) 115。MDFT分析區塊105之輸出輸入至一濾波器/預測區塊120,在此處,預測參數115用於產生第二通道之預測且基於預測產生第二通道之殘差(例如,關於第一通道之一經重建版本之殘差)。接著,將第一通道信號及殘差信號提供至執行MDFT分析區塊105之反向操作之MDFT合成區塊130。預測參數115亦經提供至解碼器之一輸出端以作為後設資料輸出。
因此,編碼器輸出包括一第一通道(例如,第一通道之一經波形寫碼之版本)及與一第二通道相關之後設資料之多通道音訊信號的一表示20。潛在地,表示可涉及多個第二通道,但出於簡明及無預期限制之原因,下文描述將限於一單一第二通道。針對第一濾波器庫之複數個第一頻帶之各者,後設資料包括用於基於該第一頻帶中之第一通道進行第二通道之一預測的一各自預測參數。表示可進一步包含第二通道之一殘差。
在替代實施方案中,代替傳輸第二通道之殘差,可執行主動降混。在此情況中,可在編碼器處使用第一濾波器庫(例如,SPAR濾波器庫)藉由時間及頻率變化降混產生經傳輸第一通道。
在解碼器處,藉由MDFT分析區塊135應用一MDFT,藉由濾波器/反向預測區塊140使用預測參數115及編碼器之MDFT分析區塊105之濾波器執行反向預測。明確言之,在各MDFT頻帶中,基於第一通道之各自經濾波版本及預測參數之各自者來產生第二通道之預測,該等預測可用於第二通道以及第二通道之殘差之重建。接著,藉由MDFT合成區塊150執行MDFT分析區塊135之處理之反轉。因此,濾波器/反向預測區塊140之處理可據稱係濾波器/預測區塊120之處理之反轉。
在使用主動降混之實施方案中,可在解碼器處使用相同濾波器庫處理技術藉由基於經傳輸預測參數之時間及頻率變化縮放來至少部分取消主動降混。
接著,MDFT合成區塊150之輸出(例如,一經重建多通道音訊信號)經輸入至一QMF分析區塊160以用於應用一QMF分析濾波器庫(作為一第二濾波器庫之一非限制性實例)。在QMF域中,藉由QMF處理區塊170視情況使用處理參數175來根據需要將QMF處理應用於QMF分析區塊160之輸出。其結果經輸入至QMF合成區塊180以用於應用對應於(例如,反轉)前述QMF分析濾波器庫之一QMF合成濾波器庫。藉此,產生一經重建且經處理之多通道音訊信號30。
圖1之預設IVAS SPAR系統100之處理鏈可在解碼器側處具有高運算複雜性,此係因為其需要MDFT分析及合成,其後接著QMF分析及合成。額外地,處理鏈可具有對應於SPAR濾波器庫及QMF濾波器庫之組合延遲之一延遲。
圖2示意性地繪示根據本發明之實施例之用於整合式QMF域SPAR解碼及處理的一修改型IVAS SPAR系統200之一實例。
區塊105、110、120及130 (即,編碼器)可與圖1之預設IVAS SPAR系統100中之對應區塊相同。在解碼器側處,多通道音訊信號之表示20被輸入至一QMF分析區塊210,QMF分析區塊210可具有與QMF分析區塊160相同之功能性。不同於預設IVAS SPAR系統100,接著在QMF域中藉由濾波器/反向預測區塊220執行反向預測,濾波器/反向預測區塊220採取預測參數(例如,SPAR參數) 115及編碼器之MDFT分析區塊105之濾波器作為輸入。隨後,根據需要在QMF處理區塊230處應用QMF處理。對應於QMF分析區塊210之QMF分析濾波器庫的一QMF合成濾波器庫在一QMF合成區塊240處應用於處理結果,QMF合成區塊240最終輸出一經重建且經處理之多通道音訊信號40。
在一些實施方案中,編碼器未將(預測)殘差傳輸至解碼器。在此情況中,解碼器處之QMF域處理可包含用去相關第一通道(例如,W)信號填補缺失能量。可使用經傳輸參數來導出去相關信號。在主動降混之情況中,QMF域處理可涉及主動混頻以至少部分逆轉主動降混。
圖1及圖2亦給出延遲及時間跨距之指示。在圖1及圖2之預設及修改型IVAS SPAR系統中,關於延遲、時間跨距及運算複雜性,以下內容可適用:
∙ 延遲
○ SPAR濾波器延遲「延遲1」可藉由1 ms與4 ms之間(例如,通常為1 ms)
○ QMF分析-合成延遲「延遲2」通常可為2.5 ms至5.0 ms
○ 系統100及系統200之總延遲可為相同的(延遲1 +延遲1 +延遲2)
∙ 時間跨距
○ 跨距2 <跨距1
▪ MDFT域中之SPAR預測及處理時間跨距「跨距1」可相對較大(例如,通常為10 ms至20 ms)以實現與SPAR濾波器之最高效快速卷積
▪ QMF域跨距通常可為1.25 ms或1.33 ms或1 ms,且可容許精細時間網格信號修改,例如,專用暫態處置
∙ 運算複雜性
○ 無QMF分析-合成之系統100之複雜性可大致相當於包含QMF分析-合成之系統200之複雜性。
一般而言,可針對兩個經寫碼音訊信號
x
1 (與第一通道相關之第一信號)及
x
2 (與一第二通道相關之第二信號)之實例說明編碼及解碼程序。為簡化信號之標記,省略信號及參數之任何量化。再者,為簡單化,假定增益參數(一般而言,作為SPAR參數或預測參數之一實例)為頻率相依的,但隨時間(例如,在一個訊框之持續時間內)為靜態的。
在編碼器處,使用SPAR濾波器庫及其FIR濾波器
(作為第一濾波器庫之一實例)將第一信號
x
1 分割成頻帶。藉由在各頻帶中針對能量壓縮應用增益參數
而從信號
x
1 預測第二信號
x
2 。接著,計算
x
2 之預測殘差,且藉由SPAR濾波器庫合成將
x
1 以及
x
2 之預測殘差轉換回至寬頻時域,從而產生
x’
1 及
x’
2 。接著,在位元串流中連同增益參數(一般而言,作為SPAR參數或預測參數之一實例)一起傳輸所獲得信號
x’
1 及
x’
2 。
在圖1之IVAS SPAR系統100中之解碼器處,使用SPAR濾波器庫及經傳輸增益參數(一般而言,作為SPAR參數或預測參數之實例)來逆轉編碼器處理,從而產生經重建信號
x’’
1 及
x’’
2 。為了後續處理,將QMF分析應用於此等信號,從而增加延遲及運算複雜性。
在圖2之修改型IVAS SPAR系統200中之解碼器處,在QMF域中使用QMF域SPAR濾波器及增益參數來逆轉編碼器處理。QMF域中之額外處理可與SPAR信號重建合併抑或作為QMF域中之一第二處理步驟發生。
處理細節接著,將描述例示性系統100及200中之上述處理之實施細節之實例。
表示法 (Notation)應理解,全部信號及濾波器係針對任意整數引數進行擴展定義,在其等支援範圍外之引數為零,該支援範圍係由有限範圍資料顯式地填入之範圍定義。
SPAR 濾波器庫SPAR濾波器庫之SPAR濾波器可為FIR帶通濾波器。例如,其等長度可為960個或480個或240個分接頭。此外,中心頻率及頻寬可能受聽覺之激勵。FIR濾波器在其等加總為一延遲狄拉克(Dirac)脈衝(例如,延遲通常為1 ms或2 ms或4 ms)之意義上形成一完美的重建濾波器庫。因此,濾波器庫合成操作可僅為帶狀信號之一加總。可經由使用MDFT之快速卷積來實施FIR濾波。可在MDFT域中發生參數之頻帶修改且可應用後續時域交叉衰落(cross-fade)以避免參數集之間之跳躍。
SPAR濾波器庫可為完美的或近乎完美的重建,使得SPAR濾波器庫脈衝回應
可被給出為
(1)
其中
係SPAR頻帶之數目(例如,通常為12個),
係SPAR濾波器庫延遲,且
係SPAR FIR帶通濾波器。在圖5之圖中展示此濾波器之一實例。
在各頻帶中應用增益參數(一般而言作為SPAR參數或預測參數之實例)之情況中的SPAR濾波器庫回應可由下式給出
(2)
其中
係每一頻帶
之增益(SPAR參數、預測參數)。
QMF 濾波器庫一時域信號
x可例如經由下式變換為複數QMF域
X (3)
其中
,其中
係原型濾波器
之長度,其對於
可為非零的且除此之外為零。
係QMF頻道之數目(例如,通常
),
係樣本中之處理跨距,
係指時槽索引,且
係樣本中之分析-合成延遲(逐樣本處理之延遲)。在圖6之圖中展示原型濾波器之一實例。
一般而言,此可用QMF分析運算子以更緊湊形式表達為
(4)
可例如經由下式從QMF表示
X重建一時域信號
(5)
一般而言,此可用QMF合成運算子以更緊湊形式表達為
(6)
在圖1及圖2之系統100、200中,假定QMF分析-合成系統係具有
個樣本之一延遲之近乎完美的重建,例如
(7)
其中
。
針對QMF頻帶
及SPAR濾波器
將SPAR帶通濾波器
轉換為一QMF表示(作為一第二濾波器庫表示之一實例)
可用QMF轉換器運算子以緊湊形式表達(下文在以下章節
濾波器轉換中更詳細地描述)
(8)
QMF域中之SPAR濾波器庫回應係全部SPAR濾波器上之加總,例如
(9)
且類似地,在各SPAR頻帶中應用SPAR增益參數(作為預測參數之實例)之情況中,
(10)
在圖11之底部面板中展示QMF域中之此一SPAR濾波器庫回應之一實例。
SPAR濾波器庫延遲可在QMF域中使用轉換器模型化為
(10a)
信號處理例如,編碼器信號可被運算為
(11)
(12)
其中
係SPAR FIR濾波器之長度。
因此,可基於第一濾波器庫之濾波器(第一濾波器)及預測參數(例如,呈濾波器
之形式)來產生第二通道信號之預測。可藉由一時域信號來表示此預測,如在方程式(12)之實例中。接著,可藉由從第二通道信號
減去預測而產生第二通道之殘差
,必要時在時域中具有適當延遲。即,可例如藉由方程式(12)之右手側的第二項給出預測。
殘差信號
可替代地在SPAR濾波器庫域中被獲得為
(12a)
然而,此實施方案比方程式(12)之實施方案在運算上更昂貴且在SPAR濾波器庫並非完美重建之情況下可導致較大重建誤差。
特定言之,可基於第二通道信號
及第二通道之一重建來計算第二通道信號之殘差
,基於預測參數及第一通道信號
來計算第二通道之重建。
在主動降混之情況中,經傳輸信號可被運算為
(12b)
其中
對應於經編碼信號之數目,在吾人之實例中,
,且因數
對應於關於頻帶
及信號
之混合權重。在已發表國際專利申請案WO 2022/120093 A1中描述判定混合權重之一例示性方法,該案之全文特此以引用的方式併入。
圖1之系統100中之解碼器信號可被運算為
(13)
(14)
圖2之系統200中之解碼器信號可藉由以下步驟進行運算:首先經由下式變換為QMF域
(15)
(16)
且接著運行SPAR濾波器庫,例如為
(17)
(18)
其中
係QMF通道
中之QMF域SPAR濾波器之長度。
在未傳輸殘差信號之情況中,信號可被重建為
(18a)
其中
係指
之一去相關版本且
係指經設計以填補缺失能量之濾波器。在編碼器側處之主動降混之情況中,降混信號被重建為
(18b)
其中
係指在每一頻帶l中縮放經傳輸降混信號以例如正確地重建能量的濾波器。在美國專利11,450,330中描述重建之例示性細節,該案之全文特此以引用的方式併入。
最後,經時域解碼之信號可經由QMF合成例如運算為
(19)
(20)
處理一多通道音訊信號之一表示之例示性方法在圖3之流程圖中展示使用根據本發明之技術來處理(例如,SPAR解碼)一多通道音訊信號(例如,一階立體混響(FOA)或高階立體混響(HOA)音訊信號)之一表示的一方法300之一實例。方法300包括步驟S310至S330。可例如針對多通道音訊信號之各訊框重複執行此等步驟。
根據上文,應理解,表示包括一第一通道(例如,第一通道之一經波形寫碼之版本,其對應於信號
x
1 )及與一第二通道相關之後設資料(例如,其對應於信號
x
2 )。潛在地,表示可涉及多個第二通道,且下文論述可容易擴展至此等案例。針對第一濾波器庫之複數個第一頻帶之各者,後設資料包括用於基於該第一頻帶中之第一通道進行第二通道之一預測的一各自預測參數(例如,SPAR參數或增益參數)。第一濾波器庫可為例如包括FIR帶通濾波器之一SPAR濾波器庫且其使用一MDFT。表示可進一步包含第二通道之一殘差。
在步驟S310,將具有複數個第二頻帶之一第二濾波器庫應用於第一通道,以針對第二頻帶之各者獲得該第二頻帶中之第一通道之一帶狀版本。應理解,第二濾波器庫不同於在產生表示之程序中(例如,在編碼器處)使用之第一濾波器庫。例如,第二濾波器庫可為一QMF濾波器庫。
在步驟S320,針對第二頻帶之各者,基於預測參數及第一濾波器庫之第一濾波器來產生一各自時域濾波器。第一濾波器對應於第一頻帶。在一個實例中,時域濾波器可為多分接頭FIR濾波器。
在步驟S330,基於第一通道之帶狀版本及第二頻帶中之時域濾波器來產生第二通道之一預測。例如,此可涉及針對第二頻帶之各者,基於該第二頻帶中之第一通道之一經濾波版本來產生該第二頻帶中之第二通道之一預測。其中,藉由將該第二頻帶中之各自時域濾波器應用於該第二頻帶中之第一通道之帶狀版本而獲得第一通道之經濾波版本。
在步驟S320針對一給定第二頻帶產生時域濾波器可基於一原型濾波器,該原型濾波器可為一不對稱原型濾波器。特定言之,步驟S320可包括基於各自第一濾波器及一原型濾波器(例如,不對稱原型濾波器)來產生複數個經調適(或基本)第一濾波器。
針對一給定第二頻帶之時域濾波器之該產生可進一步包括:取得經調適第一濾波器之一加權和。為此,經調適第一濾波器可用各自第一頻帶之預測係數(例如,預測參數、SPAR參數、增益參數)進行加權。其中,經調適第一濾波器之各分接頭之處理跨距可等於或小於第二頻帶之數目。
方法300之步驟S320可據稱涉及例如從(MDFT) SPAR FIR濾波器至QMF域SPAR FIR濾波器之一濾波器轉換步驟。此可對應於方程式(8)之QMF轉換器運算子之應用。接著將描述濾波器轉換之細節。
濾波器轉換例如,實施如圖2或圖3中所展示之整合式QMF域SPAR解碼及處理需要將用於編碼之MDFT SPAR濾波器轉換為QMF域(例如,經由方程式(8)之濾波器轉換運算子,
),或一般而言例如藉由一第二不同濾波器庫域之頻帶中沿時間之FIR濾波將一第一濾波器庫域之濾波器轉換為該第二濾波器庫域。
在圖4中示意性地展示例如從(MDFT) SPAR FIR濾波器至QMF域SPAR FIR濾波器之濾波器轉換之一實例。在此實例中,SPAR FIR濾波器410在區塊430處經受FIR至QMF-FIR轉換,以產生QMF域SPAR FIR濾波器。區塊430可採取一組轉換參數420作為額外輸入。此等轉換參數420可包含例如QMF域分接頭之最大數目之一指示及/或一最小相對係數量值之一指示。基於轉換參數420,區塊430處之濾波器轉換可例如包括如下文詳述之濾波器之截斷。
一般而言,在各SPAR濾波器之濾波器轉換中,導出一組複值FIR濾波器,各QMF頻帶導出一個複值FIR濾波器。例如,總計可存在60個QMF頻帶。當應用於QMF域中時,此近似具有一個SPAR濾波器之FIR濾波及後續QMF分析之操作。為模擬全部SPAR頻帶中之參數修改(例如,預測)及濾波器庫合成,可藉由在每一QMF頻帶之(例如,12個)參數修改之複值FIR濾波器上加總(例如,藉由濾波器庫合成)而導出(例如,60個)複值FIR濾波器(各QMF頻帶具有一個複值FIR濾波器)。
對於寬頻SPAR FIR至QMF域FIR轉換,首先基於QMF原型、處理跨距、QMF-分析-合成延遲及QMF頻帶之數目,來基於一最小平方誤差目標導出一新原型濾波器。例如,此新原型通常可具有大小為處理跨距之3倍之一長度,且一般而言係不對稱的。現在,可藉由使用此新原型濾波器與一個SPAR FIR濾波器作為輸入來運行一QMF分析而運算QMF域複值FIR濾波器。
一般而言,可基於第二濾波器庫之原型來導出用於濾波器轉換之新原型濾波器(濾波器轉換器原型)。
先決條件及表示法如上所述,可假定QMF合成濾波器庫之原型濾波器
具有在
上之支援範圍。此外,設
為樣本中之時間跨距且
為QMF濾波器庫之子頻帶之數目(例如,通常為60個)。對於此處使用之模型化(例如,依賴於零延遲濾波器庫),可例如藉由下式定義一非因果分析原型濾波器
(21)
因此,
具有在
上之支援範圍。參數
係濾波器庫設計中使用之延遲參數。
濾波器轉換器原型運算本章節大體上涉及基於第二濾波器庫之原型濾波器
來產生一濾波器轉換器原型
(用於濾波器轉換之原型濾波器)。如下文將更詳細地描述,可藉由求解一或多個最小平方問題(諸如涉及從第二濾波器庫之原型濾波器
導出之矩陣表示的最小平方問題)來基於第二濾波器庫之原型濾波器
產生濾波器轉換器原型
。
例如,可執行以下步驟以獲得在
上支援之一濾波器轉換器原型濾波器
。因此,
係濾波器轉換器原型之長度且
係一偏移參數,兩者皆以樣本為單位。
首先,可例如藉由下式定義一互相關
(22)
可觀察到,無窮和事實上係有限的(在
內)且有限地支援
。
其次,大小為
之一有限矩陣集合
可藉由其等元素例如經由下式定義
(23)
此處,
由
及
編入索引。
之值經選取使得若
,則全部條目
。
最後,可找到濾波器轉換器原型濾波器
之條目例如作為求解最小平方問題之大小為
之一向量
的條目
(24)
此處,
及
分別表示以全1或0作為條目之大小為
之向量。為此,將全部矩陣
垂直堆疊成大小為
之一矩陣
且例如,如下定義大小為
之一右手側向量
係方便的
(25)
如此,在手邊之最小平方問題係
,其具有正規方程式
,其中
,其中
表示
之矩陣轉置。為了較佳的數值穩定性,在求解此方程式組之前,可將一小的正數加至
之全部對角線條目。解向量
之條目可在
上使用濾波器
之條目。
在圖7之圖中展示
之一例示性設計,其中
,
,
,
,且
。
使用濾波器轉換器原型之濾波器轉換給定濾波器轉換器原型
,接著可例如藉由下式定義濾波器
之轉換
(26)
一般而言,複數個經調適第一濾波器
可據稱係基於各自第一濾波器
及濾波器轉換器原型
(用於濾波器轉換之原型濾波器)來產生。
值得注意的是,若對於
,
,則此方法不會引入額外延遲,且此之一充分條件係例如
。
習知濾波器轉換在美國專利8,315,859 (此後被稱為參考文件)中描述不適用於具有整合式QMF處理之IVAS SPAR框架之用於濾波器轉換的習知技術之一實例。特定言之,此參考之濾波器轉換不適用於與低延遲SPAR處理尤其相關之前述SPAR FIR至QMF域SPAR FIR轉換。
此處描述之濾波器轉換在此限於以下情況
∙ 對稱QMF原型濾波器
∙ 具有與樣本中之時間跨距相同之子頻帶數目(即,
)之一QMF濾波器庫
另一方面,與如IVAS SPAR中使用之低延遲處理相關之QMF濾波器庫設計可具有
∙ 不對稱QMF原型濾波器
∙ 過度取樣,其中子頻帶之數目
可大於樣本中之時間跨距
與所引用參考相比,根據本發明之濾波器轉換明確言之容許可具有不對稱QMF原型濾波器及/或其中子頻帶之數目大於樣本中之時間跨距的過度取樣之濾波器庫。
經轉換濾波器之截斷濾波器轉換(例如,在方法300之步驟S320或如圖4中展示)可進一步包含截斷時域濾波器之一濾波器長度(例如,QMF域SPAR濾波器截斷)。特定言之,在QMF域SPAR濾波器庫處理之一高效實施方案中,可有利地藉由將對濾波具有一較小影響(例如,感知影響)之濾波器分接頭設定為零而儘可能地降低濾波器階數(例如,沿每一QMF頻道
之時槽之濾波器長度
)。此可改良解碼之運算效率,若正確地操作,則無感知影響。下文說明進行此之一種方式。
首先,一量值臨限值可針對QMF域中之每一SPAR帶通濾波器導出為
(27)
對於全部
及
及例如-70 dB之一合理臨限位準
。
接著,對於每一QMF頻道
,可找到最大時槽索引
,使得
(28)
對於
。
如此,QMF頻道
中之濾波器長度
可被選取為
。
換言之,截斷可如下進行:
∙ 定義一相對量值臨限值(例如,
)
∙ 針對全部SPAR濾波器
○ 將各自SPAR濾波器轉換為QMF域FIR濾波器(例如,每一QMF頻帶一個)
○ 運算經轉換FIR係數之量值
○ 將每一SPAR濾波器之臨限值
運算為按相對量值臨限值
縮放之最大係數量值
○ 針對全部QMF頻帶
▪ 找到FIR長度,使得超過此長度之係數低於臨限值
▪ 找到全部SPAR濾波器內之最大FIR長度且將其儲存為該QMF頻帶中(例如,在一變數num_taps_per_qmf_band中)之經截斷濾波器長度
∙ 關於經截斷FIR長度之資訊(例如,num_taps_per_qmf_band)可用於QMF域中之高效濾波
注意:通常,可識別具有相同濾波器長度之QMF頻帶相鄰FIR濾波器之群組。例如,通常最高頻率QMF頻帶處之多個FIR濾波器具有相同經截斷濾波器長度,此可簡化實施方案。
一般而言,在方法300之術語中,一給定時域濾波器在截斷之後之濾波器長度可取決於時域濾波器之各自第二頻帶(例如,取決於各自QMF頻帶
)。
此外,根據上文,針對一給定第二頻帶(例如,QMF頻帶)產生時域濾波器可涉及:針對第一濾波器之各者(例如,針對各SPAR濾波器)產生給定第二頻帶中之一各自基本(或經調適)時域濾波器(例如,經轉換FIR濾波器),以及基於給定第二頻帶中之基本時域濾波器及預測參數(例如,作為如上文進一步描述之一加權和)來產生給定第二頻帶中之時域濾波器。接著,給定第二頻帶之一時域濾波器之截斷可基於基本時域濾波器之濾波器係數之臨限值。此等臨限值之各者可對應於第一濾波器當中之一各自者。此外,可從複數個第二頻帶中之基本時域濾波器之一最大量值導出一給定第一濾波器之該等基本時域濾波器之臨限值。例如,可從按一相對臨限值(例如,按-20 dB)縮放之一給定第一濾波器之基本時域濾波器之最大係數量值導出該第一濾波器之臨限值。
截斷時域濾波器可進一步涉及:針對各第一頻帶(例如,針對各SPAR濾波器)判定複數個第二頻帶中(例如,複數個QMF頻帶中)之對應基本時域濾波器(之濾波器係數)的一最大量值。接著,針對各第一頻帶,可基於從該最大量值導出之一臨限值來針對複數個第二頻帶中之對應基本時域濾波器判定一最小經截斷濾波器長度(即,各第一濾波器及第二頻帶之一個最小經截斷濾波器長度)。最後,針對各第二頻帶,可基於該第二頻帶中之基本時域濾波器(即,各第一濾波器一個)之最小經截斷濾波器長度來判定該第二頻帶中之時域濾波器之濾波器長度。該第二頻帶中之濾波器長度可被視為最小濾波器長度之最大值。
例如,可存在第一濾波器庫之
個第一濾波器(例如,
個SPAR濾波器)及第二濾波器庫之
個第二頻帶(例如,
個QMF頻帶)。接著,針對第一濾波器
,可從針對第一濾波器
產生之全部
個基本時域濾波器的係數導出臨限值
。此可藉由取得最大係數值且將其按一相對臨限值
縮小來完成。接著,針對一給定第二頻帶
,存在
個此等臨限值
,第二頻帶l中之B個基本時域濾波器之各者具有一個此臨限值(或等效地,
個第一濾波器之各者有一個)。將此等臨限值
應用於第二頻帶
中之各自基本時域濾波器產生
個不同最小濾波器長度
,該等最小濾波器長度係超過其則第二頻帶
中之基本時域濾波器之係數低於其等各自臨限值
的濾波器長度。接著,針對第二頻帶
,用於截斷之一濾波器長度
可被判定為該第二頻帶
中之最小濾波器長度
之最大值,即,
。
圖8係展示在針對不同相對臨限值
跨QMF頻帶截斷經轉換FIR濾波器之後的FIR濾波器長度之實例之一圖。頂部曲線圖(菱形符號)對應於-80 dB之一相對臨限值,中間曲線圖(方形符號)對應於-60 dB之一相對臨限值,且底部曲線圖(交叉符號)對應於-40 dB之一相對臨限值。此處,最大係數量值與臨限值之間之一較小差異或縮放因數導致較短濾波器長度,反之亦然。
至單分接頭濾波器之濾波器轉換可能存在QMF域中之多分接頭FIR濾波之運算複雜性過高之情境。為解決此問題,接著描述例如用於經QMF調整之SPAR濾波器庫之兩種替代的低複雜性SPAR參數處理方法。應理解,此等方法通常適用於第一及第二濾波器庫,而非限於SPAR及QMF濾波器庫。
關於此,圖12展示針對在低中心頻率下具有低於400 Hz之頻寬的一可能設計(頂部面板)及具有400 Hz之最小頻寬及被調整為QMF頻帶邊界之頻帶邊界的一可能設計(底部面板)之SPAR濾波器頻率回應(1 ms延時,12個頻帶)之實例。此外,圖13展示(經QMF調適之) SPAR編碼器濾波器頻帶(虛線,12個頻帶)及QMF解碼器濾波器頻帶(實線,60個頻帶)的一覆疊之一實例。在圖12 (底部面板)及圖13 (虛線曲線)中展示經QMF調整之SPAR濾波器庫(例如,SPAR濾波器頻帶邊界與QMF頻帶邊界相匹配,SPAR濾波器頻寬等於或大於QMF頻寬)。
理念係藉由線性相位濾波器近似SPAR濾波器庫帶通濾波器,使得圖9A至圖9D中所展示之QMF域多分接頭濾波器可被表示為實值非負的單分接頭濾波器(即,僅第一行係非零的)。如此,
且方程式(17)中之加總變為零,僅剩下分接頭
。為參考,圖10A、圖10B、圖10C及圖10D包含展示根據本發明之實施例之原始SPAR濾波器脈衝回應(實線)之前400個樣本及其等與QMF濾波器之近似(虛線)的實例之圖。
當藉由實值單分接頭濾波器進行近似時,系統200 (參見圖2)之總延遲減小為延遲1 +延遲2 (與延遲1 +延遲1 +延遲2相比)。
即,在本發明之一些實施方案中,時域濾波器可為單分接頭FIR濾波器。應理解,此可能需要用於產生單分接頭FIR濾波器之一處理步驟。
若單分接頭濾波器係數配置成大小為
之一矩陣
中之行,則其等可如圖14中展示般可視化,此涉及作為每一SPAR帶通濾波器之行之QMF域中的單分接頭SPAR濾波器之一實例(QMF頻帶中之量值頻率回應)。
零階 QMF 域 SPAR 濾波器之運算單分接頭濾波器之實值係數可藉助於(修改型)傅立葉變換運算為
(29)
其中
(30)
其中
係一整數。
值得注意的是,方程式(9)之總SPAR濾波器庫回應降低至
(31)
為降低例如按照方程式(10)運算具有增益參數之濾波器庫回應的複雜性,可將
中之非零值之數目限制為最高有效位。此可例如藉由針對全部QMF頻帶
及全部SPAR頻帶
設定下式來完成。
(32)
此外,在一些實施例中,針對一給定第二頻帶產生時域濾波器可包括圖15中所展示之方法1500之步驟S1510及S1520。在步驟S1510,判定複數個第一頻帶當中在該第二頻帶中具有一最高能量之一第一頻帶。且接著在步驟S1520,基於對應於經判定第一頻帶之第一濾波器之一線性相位近似及經判定第一頻帶之對應預測係數來產生時域濾波器。
可針對僅一單一SPAR濾波器對其有顯著貢獻之QMF頻帶(如例如針對最低7個QMF頻帶)達成又一簡化及複雜性降低。在圖13之實例中展示此情況。針對QMF頻帶
將此一匹配SPAR頻帶定義為
,如此
(33)
此外,在一些實施例中,針對一給定第二頻帶產生時域濾波器可包括圖16中所展示之方法1600之步驟S1610及S1620。在步驟S1610,判定複數個第一頻帶當中在該第二頻帶中具有一最高能量之一組第一頻帶。且接著,在步驟S1620,基於對應於該組經判定第一頻帶之第一濾波器之線性相位近似的一加權和來產生時域濾波器,其中加權和中之權重取決於該組經判定第一頻帶之對應預測係數及該第二頻帶中之該組經判定第一頻帶之第一頻帶的各自正規化量值或能量。
在一個實施方案中,可使用方程式(32+x)來運算一些QMF頻帶之SPAR濾波器回應,而針對剩餘QMF頻帶,可使用方程式(33+x)。
最後,圖17及圖18包含展示具有及不具有QMF域重建之IVAS SPAR的經解碼雙耳信號之SNR之實例之圖。圖17涉及根據本發明之實施例之使用適於QMF域及QMF頻帶中之SPAR參數之磚壁應用的一修改型SPAR濾波器庫之情況,而圖18涉及QMF域中之原始SPAR濾波器庫及多分接頭SPAR濾波之情況。
直接濾波器轉換具有較高運算複雜性之一替代轉換方法係藉由以下步驟運算各QMF通道
中具有一預定長度
之一給定SPAR頻帶
的係數
。藉由
將具有係數
之QMF域中之濾波的操作定義為
(34)
且藉由
定義QMF分析、QMF域中之濾波及QMF合成之組合效應,因此
。設計目標係具有
之
近似運用SPAR濾波器
之濾波,直至一延遲
,(可被選取為接近QMF濾波器庫延遲
之一設計參數)。針對各
,考量輸入信號
。
可據稱表示在各自樣本位置處具有(值1之)單一非零樣本的基本信號。針對各
及
,藉由
表示運用單分接頭濾波器
對
應用
之結果。
可據稱表示在各自分接頭位置處具有(值1之)單一非零濾波器係數之第二頻帶(例如,QMF頻帶)之各自單一第二頻帶的基本實值單分接頭濾波器。如此,
可據稱表示可藉由將第二濾波器庫(例如,QMF濾波器庫)、基本實值單分接頭濾波器及第二濾波器庫之一合成濾波器庫應用於基本信號而獲得的基本第一信號。同樣地,對於虛數單分接頭濾波器
,藉由
表示所得信號。此等
可據稱表示在各自分接頭位置處具有(值
之)單一非零濾波器係數之第二頻帶(例如,QMF頻帶)之各自單一第二頻帶的基本虛數單分接頭濾波器。如此,
可據稱表示可藉由將第二濾波器庫、基本虛數單分接頭濾波器及第二濾波器庫之合成濾波器庫應用於基本信號而獲得的基本第二信號。用實值係數
及
書寫
,係數引數
中之
之實值線性意味對
應用
給出以下結果
(35)
針對全部
,所要結果係
。若此成立,則歸因於
之
個樣本之步長的位移不變量,將擴展為針對全部
為真,且因此藉由使用
而達成SPAR濾波器之一實施方案。直接濾波器轉換包括藉由在包含
之支援之一範圍中針對
及
之以下問題找到
及
之一最小平方解來近似此情境,
(36)
及接著設定
。
因此,可藉由第一及第二基本信號來近似一給定第一濾波器
(其具有適當延遲),且接著係數
及
(之一子集)可用於在第二頻帶
中導出經調適第一濾波器
。
用於實施根據本發明之方法之設備最後,本發明同樣涉及一種用於執行在本發明各處描述之方法及技術的設備(例如,電腦實施設備)。圖19展示此設備1900之一實例。特定言之,設備1900包括一處理器1910及耦合至處理器1910之一記憶體1920。記憶體1920可儲存用於處理器1910之指令。取決於使用案例及/或實施方案,處理器1910亦可尤其接收適合輸入資料(例如,音訊輸入)。取決於使用案例及/或實施方案,處理器1910可經調適以實行在本發明各處描述之方法/技術(例如,圖3之方法300)且產生對應輸出資料1940 (例如,一經重建多通道音訊信號)。
本發明之總結總之,本發明係關於:
∙ 一第一濾波器庫(例如,SPAR濾波器庫)在另一第二濾波器庫(例如,QMF濾波器庫)之域內的濾波器庫處理,在時間及頻率解析度以及處理跨距方面對個別濾波器庫之各者的利用
∙ 至QMF域之高效的且低延遲的SPAR FIR濾波器轉換,明確言之運用一不對稱QMF原型濾波器
∙ 視情況,用於複雜型降低之QMF頻帶相依QMF FIR長度截斷
∙ 視情況,基於相對於個別濾波器之最大量值之一臨限值的QMF域FIR長度截斷
∙ 組合SPAR濾波器庫濾波及信號操縱
此外,根據本發明之技術可具有以下特性及優點:
∙ 無需將SPAR濾波器調適為QMF條帶
∙ 藉由避免在QMF分析之前進行基於MDFT之濾波器庫處理而降低運算複雜性
解釋可在用於處理數位或數位化音訊檔案之一適當基於電腦之聲音處理網路環境(例如,伺服器或雲端環境)中實施本文中所描述之系統之態樣。適應性音訊系統之部分可包含一或多個網路,其包括任何所要數目個個別機器,包含用於緩衝及投送在電腦間傳輸之資料之一或多個路由器(未展示)。此一網路可建立於各種不同網路協定上,且可為網際網路、一廣域網路(WAN)、一區域網路(LAN)或其等之任何組合。
可透過控制系統之一基於處理器之運算裝置之執行的一電腦程式來實施組件、區塊、程序或其他功能組件之一或多者。亦應注意,可使用硬體、韌體及/或作為在各種機器可讀或電腦可讀媒體中具體實施之資料及/或指令之任何數目個組合來描述本文中所揭示之各種功能,就其等行為、暫存器轉移、邏輯組件及/或其他特性而言。此等經格式化資料及/或指令可體現在其中之電腦可讀媒體包含但不限於呈各種形式之實體(非暫時性)非揮發性儲存媒體,諸如光學、磁性或半導體儲存媒體。
明確言之,應理解,實施例可包含硬體、軟體及電子組件或模組,出於論述之目的,其等可被繪示及描述,宛如僅在硬體中實施大多數組件。然而,一般技術者將認識到,且基於閱讀此[實施方式],在至少一項實施例中,可在可由一或多個電子處理器(諸如一微處理器及/或特定應用積體電路(「ASIC」))執行之軟體(例如,其儲存於非暫時性電腦可讀媒體上)中實施基於電子之態樣。因而,應注意,可利用複數個基於硬體及軟體之裝置以及複數個不同結構組件來實施實施例。例如,在上文圖1及圖2或圖19之內容背景中描述之系統、編碼器、解碼器或區塊可包含一或多個電子處理器、一或多個電腦可讀媒體模組、一或多個輸入/輸出介面及連接各種組件之各種連接(例如,一系統匯流排)。
雖然已藉由實例且依據特定實施例描述一或多個實施方案,但應理解,一或多個實施方案不限於所揭示實施例。相反,意欲涵蓋如熟習此項技術者將明白之各種修改及類似配置。因此,隨附發明申請專利範圍之範疇應被給予最廣泛解釋以涵蓋全部此等修改及類似配置。
再者,應理解,本文中所使用之措辭及術語係用於描述之目的且不應被視為限制。使用「包含」、「包括」或「具有」及其變動意欲涵蓋其後所列出之品項及其等效物以及額外品項。除非另有指定或限制,否則術語「安裝」、「連接」、「支援」及「耦合」及其變動廣泛地使用且涵蓋直接及間接安裝、連接、支援及耦合兩者。
經枚舉實例實施例亦可從並非發明申請專利範圍之以下經枚舉實例實施例(EEE)瞭解本發明之各種態樣及實施方案。
EEE1. 一種處理一多通道音訊信號之一表示之方法,其中該表示包括一第一通道及與一第二通道相關之後設資料,且其中針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料包括用於基於該第一頻帶中之該第一通道進行該第二通道之一預測的一各自預測參數,該方法包括:
將具有複數個第二頻帶之一第二濾波器庫應用於該第一通道,以針對該等第二頻帶之各者獲得該第二頻帶中之該第一通道之一帶狀版本,其中該第二濾波器庫不同於該第一濾波器庫;
針對該等第二頻帶之各者,基於該等預測參數及該第一濾波器庫之第一濾波器來產生一各自時域濾波器,該等第一濾波器對應於該等第一頻帶;及
基於該第一通道之該等帶狀版本及該等第二頻帶中之該等時域濾波器來產生該第二通道之一預測。
EEE2. 如EEE1之方法,其中產生該第二通道之該預測包括,針對該等第二頻帶之各者,基於該第二頻帶中之該第一通道之一經濾波版本來產生該第二頻帶中之該第二通道之一預測,藉由將該第二頻帶中之該各自時域濾波器應用於該第二頻帶中之該第一通道之該帶狀版本而獲得該第一通道之該經濾波版本。
EEE3. 根據EEE1或EEE2之方法,其中該多通道音訊信號係一階立體混響(FOA)或高階立體混響(HOA)音訊信號。
EEE4. 根據EEE1至EEE3之任一者之方法,其中該等預測參數係SPAR參數。
EEE5. 根據EEE1至EEE4之任一者之方法,其中該第一濾波器庫係包括FIR帶通濾波器之一SPAR濾波器庫且其使用一MDFT。
EEE6. 根據EEE1至EEE5之任一者之方法,其中該第二濾波器庫係一QMF濾波器庫。
EEE7. 根據EEE1至EEE6之任一者之方法,其中該等時域濾波器係多分接頭FIR濾波器。
EEE8. 根據EEE1至EEE7之任一者之方法,其中針對一給定第二頻帶產生該時域濾波器包括:
基於各自第一濾波器及一原型濾波器來產生複數個經調適第一濾波器。
EEE9. 根據EEE8之方法,其中對於一給定第二頻帶
,一給定第一頻帶
之一第一濾波器
之該經調適第一濾波器
被計算為
其中
係用於濾波器轉換之該原型濾波器,
係該第二濾波器庫之跨距,
係第二頻帶之數目,且針對
之加總在用於濾波器轉換之該原型濾波器
之支援範圍內。
EEE10. 根據EEE8或EEE9之方法,其進一步包括基於該第二濾波器庫之一原型濾波器來產生用於濾波器轉換之該原型濾波器。
EEE11. 根據EEE10之方法,其中藉由求解一最小平方問題來基於該第二濾波器庫之該原型濾波器產生用於濾波器轉換之該原型濾波器。
EEE12. 根據EEE10或EEE11之方法,當依附於請求項9時,其中產生用於濾波器轉換之該原型濾波器包括:
基於該第二濾波器庫之該原型濾波器
產生一非因果原型濾波器
;
產生該非因果原型濾波器
及該第二濾波器庫之該原型濾波器
之一互相關
;
針對某一整數
產生一組矩陣
,其維度係
且僅針對索引
具有非零元素
,其中
係
之一整數倍,其中
係用於濾波器轉換之該原型濾波器之長度;及
求解
之一組最小平方問題,其中
係維度為
之一向量,其包含用於濾波器轉換之該原型濾波器
之濾波器係數。
EEE13. 根據EEE8至EEE12之任一者之方法,其中針對一給定第二頻帶產生該時域濾波器進一步包括:
取得該等經調適第一濾波器之一加權和,其中該等經調適第一濾波器係運用該等各自第一頻帶之預測係數進行加權。
EEE14. 根據EEE8至EEE13之任一者之方法,其中用於濾波器轉換之該原型濾波器係一不對稱原型濾波器。
EEE15. 根據EEE8至EEE14之任一者之方法,其中各分接頭之該處理跨距等於或小於第二頻帶之該數目。
EEE16. 根據EEE1至EEE7之任一者之方法,其中針對一給定第二頻帶產生該時域濾波器包括:
藉由第一及第二基本信號近似一給定第一濾波器,
其中可作為將該第二濾波器庫、基本實值單分接頭濾波器及該第二濾波器庫之一合成濾波器庫應用於在各自樣本位置處具有單一非零樣本之基本信號的結果而獲得該等第一基本信號,其中該等基本實值單分接頭濾波器係用於在各自分接頭位置處具有單一非零濾波器係數之該等第二頻帶之各自單一第二頻帶的濾波器;及
其中可作為將該第二濾波器庫、基本虛數單分接頭濾波器及該第二濾波器庫之該合成濾波器庫應用於該等基本信號的結果而獲得該等第二基本信號,其中該等基本虛數單分接頭濾波器係用於在各自分接頭位置處具有單一非零濾波器係數之該等第二頻帶之各自單一第二頻帶的濾波器;及
基於該近似中之第一及第二基本信號之係數來針對該第二頻帶中之該等第一濾波器產生經調適時域濾波器。
EEE17. 根據EEE1至EEE7之任一者之方法,其中針對一給定第二頻帶產生該時域濾波器包括:
獲得將該第二濾波器庫、實值單分接頭濾波器
及該第二濾波器庫之一合成濾波器庫應用於信號
的結果
,其中
指示一給定第二頻帶,
指示一給定樣本位置,且
指示一濾波器分接頭位置;
獲得將該第二濾波器庫、虛數單分接頭濾波器
及該第二濾波器庫之該合成濾波器庫應用於該等信號
的結果
;
判定係數
及
之一最小平方解,使得
對於一給定延遲
,其中
係第一頻帶
之該第一濾波器,
係第二頻帶之該數目,且
係第二頻帶
之濾波器分接頭之一預定義數目;及
將該第二頻帶
中之該第一濾波器
之一經調適第一濾波器
產生為
。
EEE18. 根據EEE1至EEE17之任一者之方法,其進一步包括截斷該等時域濾波器之一濾波器長度。
EEE19. 根據EEE18之方法,其中一給定時域濾波器在截斷之後之該濾波器長度取決於該時域濾波器之該各自第二頻帶。
EEE20. 根據EEE18或EEE19之方法,
其中針對一給定第二頻帶產生該時域濾波器涉及:針對該等第一濾波器之各者產生該給定第二頻帶中之一各自基本時域濾波器,及基於該給定第二頻帶中之該等基本時域濾波器及該等預測參數來產生該給定第二頻帶中之該時域濾波器;及
其中該給定第二頻帶之一時域濾波器之截斷係基於該等基本時域濾波器之該等濾波器係數之臨限值,其中各臨限值對應於該等第一濾波器當中之一各自者,其中從該複數個第二頻帶中之該等基本時域濾波器之一最大量值導出一給定第一濾波器之該等基本時域濾波器之該臨限值。
EEE21. 根據EEE20之方法,其包括:
針對各第一頻帶判定該複數個第二頻帶中之該等對應基本時域濾波器之一最大量值;
針對各第一頻帶,基於從該最大量值導出之一臨限值來判定該複數個第二頻帶中之該等對應基本時域濾波器之一最小經截斷濾波器長度;及
針對各第二頻帶,基於該第二頻帶中之該等基本時域濾波器之該等最小經截斷濾波器長度來判定該第二頻帶中之該時域濾波器之該濾波器長度。
EEE22. 根據EEE1至EEE6之任一者之方法,其中該等時域濾波器係單分接頭FIR濾波器。
EEE23. 根據EEE22之方法,其中針對一給定第二頻帶產生該時域濾波器包括:
判定該複數個第一頻帶當中在該第二頻帶中具有一最高能量之一第一頻帶;及
基於對應於該經判定第一頻帶之該第一濾波器之一線性相位近似及該經判定第一頻帶之該對應預測係數來產生該時域濾波器。
EEE24. 根據EEE22之方法,其中針對一給定第二頻帶產生該時域濾波器包括:
判定該複數個第一頻帶當中在該第二頻帶中具有一最高能量之一組第一頻帶;及
基於對應於該組經判定第一頻帶之該等第一濾波器之線性相位近似的一加權和來產生該時域濾波器,其中該加權和中之權重取決於該組經判定第一頻帶之該等對應預測係數及該第二頻帶中之該組經判定第一頻帶之該等第一頻帶的各自正規化量值或能量。
EEE25. 一種產生一多通道音訊信號之一表示之方法,其中該表示包括一第一通道及與一第二通道相關之後設資料,且其中針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料包括用於基於該第一頻帶中之該第一通道進行該第二通道之一預測的一各自預測參數,該方法包括:
基於該第一濾波器庫之第一濾波器及該等預測參數來產生該第二通道之一預測,其中藉由一時域信號表示該第二通道之該預測;及
藉由在時域中從該第二通道減去該第二通道之該預測而產生該第二通道之一殘差。
EEE26. 根據EEE25之方法,其中該多通道音訊信號之該表示進一步包括該第二通道之該殘差。
EEE27. 一種設備,其包括一處理器及耦合至該處理器且儲存用於該處理器之指令的一記憶體,其中該處理器經調適以實行根據EEE1至EEE26之任一者之方法。
EEE28. 一種程式,其包括指令,該等指令在由一處理器執行時引起該處理器實行根據EEE1至EEE26之任一者之方法。
EEE29. 一種電腦可讀儲存媒體,其儲存根據EEE28之程式。
10:多通道音訊信號
20:表示
30:經重建且經處理之多通道音訊信號
40:經重建且經處理之多通道音訊信號
100:預設沉浸式音訊及視訊服務(IVAS)空間重建(SPAR)系統
105:修改型離散傅立葉變換(MDFT)分析區塊
110:信號分析區塊
115:預測參數
120:濾波器/預測區塊
130:修改型離散傅立葉變換(MDFT)合成區塊
135:修改型離散傅立葉變換(MDFT)分析區塊
140:濾波器/反向預測區塊
150:修改型離散傅立葉變換(MDFT)合成區塊
160:QMF分析區塊
170:QMF處理區塊
175:處理參數
180:QMF合成區塊
210:QMF分析區塊
220:濾波器/反向預測區塊
230:QMF處理區塊
240:QMF合成區塊
300:方法
410:空間重建(SPAR)有限脈衝回應(FIR)濾波器
420:轉換參數
430:區塊
1500:方法
1600:方法
1900:設備
1910:處理器
1920:記憶體
1940:輸出資料
S310:步驟
S320:步驟
S330:步驟
S1510:步驟
S1520:步驟
S1610:步驟
S1620:步驟
下文參考隨附圖式以一例示性方式說明本發明,其中
圖1係示意性地繪示QMF濾波器頻帶域中之SPAR編碼及SPAR解碼其後接著處理的一實例之一方塊圖;
圖2係示意性地繪示根據本發明之實施例之QMF濾波器庫域中的SPAR編碼及SPAR解碼之一實例之一方塊圖;
圖3係示意性地繪示根據本發明之實施例之處理一多通道音訊信號之一表示的一方法之一實例之一流程圖;
圖4示意性地繪示根據本發明之實施例之SPAR濾波器庫FIR帶通濾波器至QMF域FIR濾波器的轉換之一實例;
圖5係展示SPAR編碼器中使用之一低延遲SPAR FIR帶通濾波器的一實例之一圖;
圖6係展示一低延遲不對稱QMF原型濾波器之一實例之一圖;
圖7係展示使用圖6之不對稱原型濾波器將SPAR FIR濾波器轉換為QMF域SPAR FIR濾波器的一原型濾波器之一實例之一圖;
圖8係展示根據本發明之實施例之在經轉換FIR濾波器之截斷之後的FIR濾波器長度之實例之一圖;
圖9A、圖9B、圖9C及圖9D包含展示根據本發明之實施例之經轉換FIR濾波器之濾波器係數的量值之實例之圖;
圖10A、圖10B、圖10C及圖10D包含展示根據本發明之實施例之原始SPAR濾波器脈衝回應(實線)之前400個樣本及其等與QMF濾波器之近似(虛線)的實例之圖;
圖11包含展示根據本發明之實施例之QMF域中之累積SPAR濾波器及QMF域中之修改型累積SPAR濾波器的實例之圖,其中處理在頻帶8中;
圖12包含展示根據本發明之實施例之在低中心頻率下具有低於400 Hz之頻寬的一可能設計以及具有400 Hz之最小頻寬及調整為QMF頻帶邊界之頻帶邊界的一可能設計之SPAR濾波器頻率回應(1 ms延時,12個頻帶)之實例之圖;
圖13係展示根據本發明之實施例之(經QMF調適之) SPAR編碼器濾波器頻帶(虛線,12個頻帶)及QMF解碼器濾波器頻帶(實線,60個頻帶)的一覆疊之一實例之一圖;
圖14係展示根據本發明之實施例之作為每一各自SPAR帶通濾波器之行的QMF域(QMF頻帶中之量值頻率回應)中之單分接頭SPAR濾波器之一實例之一圖;
圖15係示意性地繪示根據本發明之實施例之QMF濾波器庫域中之低複雜性SPAR濾波器處理的一方法之一實例之一流程圖;
圖16係示意性地繪示根據本發明之實施例之QMF濾波器庫域中之低複雜性SPAR濾波器處理的一方法之另一實例之一流程圖;
圖17及圖18包含展示根據本發明之實施例之具有及不具有QMF域重建之IVAS SPAR的經解碼雙耳信號(binaural signal)之信號對雜訊比(SNR)之實例之圖;及
圖19示意性地繪示用於實施根據本發明之實施例之方法的一設備之一實例。
300:方法
S310:步驟
S320:步驟
S330:步驟
Claims (29)
- 一種處理一多通道音訊信號之一表示之方法,其中該表示包括一第一通道及與一第二通道相關之後設資料,且其中針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料包括用於基於該第一頻帶中之該第一通道進行該第二通道之一預測的一各自預測參數,該方法包括: 將具有複數個第二頻帶之一第二濾波器庫應用於該第一通道,以針對該等第二頻帶之各者獲得該第二頻帶中之該第一通道之一帶狀版本,其中該第二濾波器庫不同於該第一濾波器庫; 針對該等第二頻帶之各者,基於該等預測參數及該第一濾波器庫之第一濾波器來產生一各自時域濾波器,該等第一濾波器對應於該等第一頻帶;及 基於該第一通道之該等帶狀版本及該等第二頻帶中之該等時域濾波器來產生該第二通道之一預測。
- 如請求項1之方法,其中產生該第二通道之該預測包括,針對該等第二頻帶之各者: 基於該第二頻帶中之該第一通道之一經濾波版本來產生該第二頻帶中之該第二通道之一預測,藉由將該第二頻帶中之該各自時域濾波器應用於該第二頻帶中之該第一通道之該帶狀版本而獲得該第一通道之該經濾波版本。
- 如請求項1或2之方法,其中該多通道音訊信號係一個一階立體混響FOA或高階立體混響HOA音訊信號。
- 如請求項1或2之方法,其中該等預測參數係SPAR參數。
- 如請求項1或2之方法,其中該第一濾波器庫係包括FIR帶通濾波器之一SPAR濾波器庫且其使用一MDFT。
- 如請求項1或2之方法,其中該第二濾波器庫係一QMF濾波器庫。
- 如請求項1或2之方法,其中該等時域濾波器係多分接頭FIR濾波器。
- 如請求項1或2之方法,其中針對一給定第二頻帶產生該時域濾波器包括: 基於各自第一濾波器及用於濾波器轉換之一原型濾波器來產生複數個經調適第一濾波器。
- 如請求項8之方法,其中針對一給定第二頻帶 ,一給定第一頻帶 之一第一濾波器 之該經調適第一濾波器 被計算為 其中 係用於濾波器轉換之該原型濾波器, 係該第二濾波器庫之跨距, 係第二頻帶之數目,且針對 之加總在用於濾波器轉換之該原型濾波器 之支援範圍內。
- 如請求項8之方法,其進一步包括: 基於該第二濾波器庫之一原型濾波器來產生用於濾波器轉換之該原型濾波器。
- 如請求項10之方法,其中藉由求解一最小平方問題來基於該第二濾波器庫之該原型濾波器產生用於濾波器轉換之該原型濾波器。
- 如請求項10之方法,當依附於請求項9時,其中產生用於濾波器轉換之該原型濾波器包括: 基於該第二濾波器庫之該原型濾波器 產生一非因果原型濾波器 ; 產生該非因果原型濾波器 及該第二濾波器庫之該原型濾波器 之一互相關 ; 針對某一整數 產生一組矩陣 ,其維度係 且僅針對索引 具有非零元素 ,其中 係 之一整數倍,其中 係用於濾波器轉換之該原型濾波器之長度;及 求解 之一組最小平方問題,其中 係維度為 之一向量,其包含用於濾波器轉換之該原型濾波器 之濾波器係數。
- 如請求項8之方法,其中針對一給定第二頻帶產生該時域濾波器進一步包括: 取得該等經調適第一濾波器之一加權和,其中該等經調適第一濾波器係運用該等各自第一頻帶之預測係數進行加權。
- 如請求項8之方法,其中用於濾波器轉換之該原型濾波器係一不對稱原型濾波器。
- 如請求項8之方法,其中各分接頭之該處理跨距等於或小於第二頻帶之該數目。
- 如請求項1或2之方法,其中針對一給定第二頻帶產生該時域濾波器包括: 藉由第一及第二基本信號近似一給定第一濾波器, 其中可作為將該第二濾波器庫、基本實值單分接頭濾波器及該第二濾波器庫之一合成濾波器庫應用於在各自樣本位置處具有單一非零樣本之基本信號的結果而獲得該等第一基本信號,其中該等基本實值單分接頭濾波器係用於在各自分接頭位置處具有單一非零濾波器係數之該等第二頻帶之各自單一第二頻帶的濾波器;及 其中可作為將該第二濾波器庫、基本虛數單分接頭濾波器及該第二濾波器庫之該合成濾波器庫應用於該等基本信號的結果而獲得該等第二基本信號,其中該等基本虛數單分接頭濾波器係用於在各自分接頭位置處具有單一非零濾波器係數之該等第二頻帶之各自單一第二頻帶的濾波器;及 基於該近似中之第一及第二基本信號之係數來針對該第二頻帶中之該等第一濾波器產生經調適時域濾波器。
- 如請求項1或2之方法,其中針對一給定第二頻帶產生該時域濾波器包括: 獲得將該第二濾波器庫、實值單分接頭濾波器 及該第二濾波器庫之一合成濾波器庫應用於信號 的結果 ,其中 指示一給定第二頻帶, 指示一給定樣本位置,且 指示一濾波器分接頭位置; 獲得將該第二濾波器庫、虛數單分接頭濾波器 及該第二濾波器庫之該合成濾波器庫應用於該等信號 的結果 ; 判定係數 及 之一最小平方解,使得 對於一給定延遲 ,其中 係第一頻帶 之該第一濾波器, 係第二頻帶之該數目,且 係第二頻帶 之濾波器分接頭之一預定義數目;及 將該第二頻帶 中之該第一濾波器 之一經調適第一濾波器 產生為 。
- 如請求項1或2之方法,其進一步包括截斷該等時域濾波器之一濾波器長度。
- 如請求項18之方法,其中一給定時域濾波器在截斷之後之該濾波器長度取決於該時域濾波器之該各自第二頻帶。
- 如請求項18之方法, 其中針對一給定第二頻帶產生該時域濾波器涉及:針對該等第一濾波器之各者產生該給定第二頻帶中之一各自經調適時域濾波器,及基於該給定第二頻帶中之該等經調適時域濾波器及該等預測參數來產生該給定第二頻帶中之該時域濾波器;及 其中該給定第二頻帶之一時域濾波器之截斷係基於該等經調適時域濾波器之該等濾波器係數之臨限值,其中各臨限值對應於該等第一濾波器當中之一各自者,其中從該複數個第二頻帶中之該等經調適時域濾波器之一最大量值導出一給定第一濾波器之該等經調適時域濾波器之該臨限值。
- 如請求項20之方法,其包括: 針對各第一頻帶判定該複數個第二頻帶中之該等對應經調適時域濾波器之一最大量值; 針對各第一頻帶,基於從該最大量值導出之一臨限值來判定該複數個第二頻帶中之該等對應經調適時域濾波器之一最小經截斷濾波器長度;及 針對各第二頻帶,基於該第二頻帶中之該等經調適時域濾波器之該等最小經截斷濾波器長度來判定該第二頻帶中之該時域濾波器之該濾波器長度。
- 如請求項1或2之方法,其中該等時域濾波器係單分接頭FIR濾波器。
- 如請求項22之方法,其中針對一給定第二頻帶產生該時域濾波器包括: 判定該複數個第一頻帶當中在該第二頻帶中具有一最高能量之一第一頻帶;及 基於對應於該經判定第一頻帶之該第一濾波器之一線性相位近似及該經判定第一頻帶之該對應預測係數來產生該時域濾波器。
- 如請求項22之方法,其中針對一給定第二頻帶產生該時域濾波器包括: 判定該複數個第一頻帶當中在該第二頻帶中具有一最高能量之一組第一頻帶;及 基於對應於該組經判定第一頻帶之該等第一濾波器之線性相位近似的一加權和來產生該時域濾波器,其中該加權和中之權重取決於該組經判定第一頻帶之該等對應預測係數及該第二頻帶中之該組經判定第一頻帶之該等第一頻帶的各自正規化量值或能量。
- 一種產生一多通道音訊信號之一表示之方法,其中該表示包括一第一通道及與一第二通道相關之後設資料,且其中針對一第一濾波器庫之複數個第一頻帶之各者,該後設資料包括用於基於該第一頻帶中之該第一通道進行該第二通道之一預測的一各自預測參數,該方法包括: 基於該第一濾波器庫之第一濾波器及該等預測參數來產生該第二通道之一預測,其中藉由一時域信號表示該第二通道之該預測;及 藉由在時域中從該第二通道減去該第二通道之該預測而產生該第二通道之一殘差。
- 如請求項25之方法,其中該多通道音訊信號之該表示進一步包括該第二通道之該殘差。
- 一種設備,其包括一處理器及耦合至該處理器且儲存用於該處理器之指令的一記憶體,其中該處理器經調適以實行如請求項1至26中任一項之方法。
- 一種程式,其包括指令,該等指令在由一處理器執行時引起該處理器實行如請求項1至26中任一項之方法。
- 一種電腦可讀儲存媒體,其儲存如請求項28之程式。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163291817P | 2021-12-20 | 2021-12-20 | |
US63/291,817 | 2021-12-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202334938A true TW202334938A (zh) | 2023-09-01 |
Family
ID=84829724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111148928A TW202334938A (zh) | 2021-12-20 | 2022-12-20 | 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202334938A (zh) |
WO (1) | WO2023118138A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI497485B (zh) * | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
MX2007005103A (es) * | 2004-11-02 | 2007-07-04 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de senales de audio utilizando bancos de filtros de valor complejo. |
KR100959971B1 (ko) | 2006-01-27 | 2010-05-27 | 돌비 스웨덴 에이비 | 복소 변조된 필터뱅크를 이용한 효율적인 필터링 |
KR102381216B1 (ko) | 2013-10-21 | 2022-04-08 | 돌비 인터네셔널 에이비 | 오디오 신호들의 파라메트릭 재구성 |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CA3203960A1 (en) | 2020-12-02 | 2022-06-09 | Dolby Laboratories Licensing Corporation | Immersive voice and audio services (ivas) with adaptive downmix strategies |
-
2022
- 2022-12-20 TW TW111148928A patent/TW202334938A/zh unknown
- 2022-12-20 WO PCT/EP2022/086987 patent/WO2023118138A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023118138A1 (en) | 2023-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2337224T3 (en) | Filter unit and method for generating subband filter pulse response | |
US8315859B2 (en) | Efficient filtering with a complex modulated filterbank | |
TW201435858A (zh) | 用於音場之高階保真立體音響表現的壓縮與解壓縮方法及裝置 | |
JP6147337B2 (ja) | サブバンド領域内での自由選択可能な周波数偏移のための装置、方法およびコンピュータプログラム | |
EP2250642B1 (en) | Method and apparatus for transforming between different filter bank domains | |
JP2014194633A (ja) | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 | |
JP6094322B2 (ja) | 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置 | |
TW202334938A (zh) | 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫 |