TWI611398B - 降尺度解碼器、解碼方法及電腦程式 - Google Patents

降尺度解碼器、解碼方法及電腦程式 Download PDF

Info

Publication number
TWI611398B
TWI611398B TW105117582A TW105117582A TWI611398B TW I611398 B TWI611398 B TW I611398B TW 105117582 A TW105117582 A TW 105117582A TW 105117582 A TW105117582 A TW 105117582A TW I611398 B TWI611398 B TW I611398B
Authority
TW
Taiwan
Prior art keywords
length
time
sound source
frame
window
Prior art date
Application number
TW105117582A
Other languages
English (en)
Other versions
TW201717193A (zh
Inventor
馬庫斯 斯奇乃爾
曼費德 盧茲奇
艾琳尼 弗托波羅
高斯坦汀 史密德
寇蘭德 班多夫
安迪恩 湯瑪瑟克
托比亞斯 艾爾貝特
丁瑪恩 席德爾
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=53483698&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TWI611398(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201717193A publication Critical patent/TW201717193A/zh
Application granted granted Critical
Publication of TWI611398B publication Critical patent/TWI611398B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

一音源解碼程序之一降尺度版本可更有效地及/或在改良遵守維護上被達到,假使用於降尺度音源解碼之合成窗係為一參考合成窗之一降取樣版本,其係牽涉到藉由降取樣藉由降取樣因子之非降尺度音源解碼程序,降取樣之取樣率以及原始取樣率係藉由降取樣因子而不同,以及使用在訊框之1/4之區段中之一區段內插之降取樣。

Description

降尺度解碼器、解碼方法及電腦程式
本發明係關於一種降尺度解碼(downscaled decoding)概念。
MPEG-4強化低延遲進階音源編碼(Advanced Audio Coding,AAC)(AAC-ELD)通常操作於達48kHz之取樣率,這導致15ms之演算延遲。對於一些應用,例如對嘴的音源傳輸,低延遲是需要的。AAC-ELD已藉由操作在高較的取樣率,例如96kHz而提供這樣的選項,並且因此提供具有較低延遲,例如7.5ms之操作模式。然而,此操作模式由於高取樣率而伴隨著不必要的高複雜性。
此問題的解法係應用濾波庫(filter bank)之一降尺度版本,並且因此使得音源訊號在一較低的取樣率,例如48kHz,而不是96kHz。該降尺度操作已經是AAC-ELD的一部分,如同從MPEG-4 AAC-LD編解碼器而被獲得,MPEG-4 AAC-LD編解碼器係作為AAC-ELD之一基礎。
然而,仍然存在的問題是如何找到一特定濾波庫之降尺度版本。亦即,唯一的不確定係為得到窗系數(window coefficients)的方法,同時能致能AAC-ELD解碼器之降尺度操作模式之清楚的一致性測試。
以下,係說明AAC-(E)LD編解碼器之降尺度操作模式之原理。
降尺度操作模式或AAC-LD係針對在“Adaptation to systems using lower sampling rates”之4.6.17.2.7章節ISO/IEC 14496-3:2009中之AAC-LD而被說明,如下:
“在一些應用中,當位元流負載之正常取樣率較高時(例如48kHz,對應大約20ms之一演算編解碼器延遲),將低延遲解碼器整合至 執行於較低取樣率(如16kHz)之一音源系統內是必需的。在這樣的例子中,較佳者係直接在目標取樣率解碼低延遲編解碼器之輸出,而不是在解碼之後使用一額外的取樣率轉換。
這可藉由合適之訊框尺寸以及取樣率之降尺度以及一些整數因子(例如2、3)而被近似,這導致編解碼器之相同的時間/頻率解析度。舉例來說,編解碼器輸出可藉由僅保留在合成濾波庫之前之頻譜系數之最低的三分之一(即480/3=160)以及將逆轉換尺寸降低至三分之一(例如窗尺寸960/3=320)而在16kHz之取樣率,而不是在正常的48kHz被產生。
結果,低取樣率之解碼係降低記憶體與計算需求,但可能不會產生與一全帶寬解碼相同的結果,隨著而來的是庫限制(band limiting)以及取樣率轉換。
請注意到在一較低取樣率之解碼,如上所述的,不會影響等級的解譯(interpretation of levels),其係關於AAC低延遲位元流負載之正常取樣率。”
請注意AAC-LD係與一標準的MDCT架構以及兩窗形(shape),即正弦窗與一低重疊窗,一同工作。上述兩窗係藉由公式而完整的說明,並且因此對於任何轉換長度之窗係數可被確定。
對比於AAC-LD,AAC-ELD編解碼器顯示出兩個主要的不同:
●低延遲MDCT窗(LD-MDCT)
●使用低延遲頻帶複製(Spectral band replication,SBR)工具的可能性
使用低延遲MDCT窗之IMDCT演算法係描述於參考文件[1]章節4.6.20.2中,其係非常類似於使用例如正弦窗之標準IMDCT版本。低延遲MDCT窗(480與512取樣訊框尺寸)之係數係載於參考文件[1]表4.A.15及表4.A.16。請注意到由於該等係數是一最佳化演算法的結果,該等係數無法藉由一公式而確定。圖9係顯示針對訊框尺寸512之窗形之示意圖。
在低延遲SBR(LD-SBR)工具被使用關聯於AAC-ELD編解碼器的例子中,LD-SBR模組之濾波庫亦被降尺度。這保證SBR模組在相同的頻率解析度操作並且因此不需再有其他的改變。
如此,如上之敘述係顯示降尺度解碼操作具有一需要,例如是在一AAC-ELD中來降尺度一解碼。再次找出降尺度合成窗函數之係數是可行的,但這是一件麻煩的工作,必需要有額外的儲存量以儲存降尺度版本以及使得在非降尺度解碼與降尺度解碼之間的一致性確認變得更複雜,或者從另一角度來看,它不會遵守在例如AAC-ELD中所要求之降尺度的方法。依據降尺度比例,亦即在原始取樣率與降尺度取樣率之間的比例,某人可僅藉由降取樣,即選出原始合成窗函數之每個第二、第三、…窗係數,就能取得降尺度合成窗函數,但此程序不會產生非降尺度解碼與降尺度解碼之足夠的一致性。使用應用於合成窗函數之更多複雜的大量毀滅(sophisticated decimating)程序係導致從原始合成窗函數形(shape)之無法接受的偏離。因此,本領域就有一需要提供改良的降尺度解碼概念。
據此,本發明之一目的在於提供一種音源解碼方法/結構,其係可達到一改良降尺度解碼。
該目的係藉由本發明獨立請求項之標的而達到。
本發明係基於下面發現,即假使使用於降尺度音源解碼之合成窗係為牽涉於非降尺度音源解碼程序內之一參考合成窗之一降取樣版本,其係藉由讓降取樣之取樣率與原始取樣率偏離之降取樣因子以及藉由降取樣而達到,則一音源解碼程序之一降尺度版本可以更有效率地及/或在改良的遵守維護(compliance maintenance)時被達到,以及在訊框長度的四分之一之區段使用一區段內插之降取樣。
本發明之有利的方面係為附屬項之標的。本發明較佳實施例係依據圖式而描述於下,其中的圖式包含:
10‧‧‧音源解碼器
12‧‧‧接收器
14‧‧‧擷取器
16‧‧‧頻時調變器
18‧‧‧窗化器
20‧‧‧時域混疊取消器
22‧‧‧音源訊號
24‧‧‧資料流
26‧‧‧頻時表現(或頻譜圖、或頻時頻譜圖表現)
28‧‧‧頻譜(或轉換)係數
30‧‧‧時間軸
32‧‧‧頻率軸
36‧‧‧訊框
38‧‧‧轉換窗
40‧‧‧窗函數
42‧‧‧零區間
44‧‧‧低頻部分
46‧‧‧序列
48‧‧‧逆轉換
52‧‧‧時間部分
54‧‧‧窗(或窗函數)
56‧‧‧零部分
58‧‧‧峰值
60‧‧‧窗化時間部分
62‧‧‧重疊相加處理
70‧‧‧參考合成窗
72‧‧‧降取樣
74‧‧‧區段
76‧‧‧區段降取樣器
78‧‧‧輸入
80‧‧‧上升器
82‧‧‧乘法器
84‧‧‧加法器
圖1係為一示意圖,其係描繪當為了保持完美再建而降尺度解碼時,所需要被遵守的完美再建需求。
圖2係為本發明一實施例之降尺度解碼之一音源解碼器之一方塊示意圖。
圖3係為一示意圖,其上半部係描繪一音源訊號已在一原始取樣率下被編碼至一資料流內之方法,其下半部(由一水平虛線所分隔)係描繪為了在一降低或降尺度取樣率下而從該資料流再建音源訊號之一降尺度解碼操作,以致於描繪圖2之音源解碼器之操作之模式。
圖4係為一示意圖,其係描繪圖2之窗化器(windower)與時域混疊取消器(time domain aliasing canceler)之協同作業。
圖5係描繪一可能實施例,以藉由使用頻譜到時間(spectral-to-time)被調變之時間部分之零權重部分之一特別處理而達到依據圖4之再建。
圖6係為一示意圖,其係描繪降取樣以取得降取樣合成窗。
圖7係為一方塊示意圖,其係描繪包含低延遲SBR工具之AAC-ELD之一降尺度操作。
圖8為依據一實施例並針對降尺度解碼之一音源解碼器之一方塊示意圖,在該實施例中,調變器、窗化器以及消除器係依據一上升實現而被實現。
圖9係為依據AAC-ELD並針對512取樣訊框尺寸之一低延遲窗之窗係數之一圖式,以作為要被降取樣之一參考合成窗之一例子。
以下將參照相關圖式,說明依本發明較佳實施例之一種降尺度解碼,其中相同的元件將以相同的參照符號加以說明。
下面的說明係以依據AAC-ELD編解碼器之降尺度解碼之一實施例來開始。亦即,下面的說明係以能形成AAC-ELD之一降尺度模式之一實施例來開始。該說明係同時形成本發明實施例之動機的一種解釋。後續,該說明係被一般化,藉以導致依據本發明一實施例之一音源解碼器 及音源解碼方法之一說明。
如本發明說明書之前導部分所述,AAC-ELD使用低延遲MDCT窗。為了產生其降尺度版本,亦即降尺度低延遲窗,用以形成AAC-ELD之一降尺度模式之下面所解釋的提案係使用一區段樣條內插(segmental spline interpolation)演算法,其係維持LD-MDCT窗之完美再建性質(PR)連同極高精度。因此,該演算法係以相容的方式而容許窗係數以直接形式產生,如ISO/IEC 14496-3:2009所述,以及以上升形式產生,如參考文件[2]所述。這意謂著兩種實現係產生16位元-相符(16bit-conform)輸出。
低延遲MDCT窗之內插係進行如下。
一般而言,一樣條內插係被使用來產生降尺度窗係數以維持頻率反應以及幾乎完美的再建性質(大約170dB SNR)。該內插需要被限制在某些區段內以維持完美再建性質。對於覆蓋轉換之DCT核心(DCT kernel)之窗係數c(亦參照圖1,c(1024)..c(2048)),下面的限制是需要的。
1=|(sgn.c(i).c(2N-1-i)+c(N+i).c(N-1-i))| for i=0...N/2-1 (1)其中N係表示訊框尺寸。一些實施例可使用不同的表示以最佳化複雜度,於此係以sgn表示。式(1)的必要條件係描繪於圖1中。需注意的是,僅僅在F=2的例子中,即使取樣率變為一半,省去參考合成窗之各第二窗係數以得到降尺度合成窗係不會滿足該必要條件。
係數c(0)...c(2N-1)係沿著鑽石形而列出。在窗係數中的N/4零點係用粗體箭頭標示,該些零點係負責濾波庫之延遲減少。圖1係顯示牽涉在MDCT中之摺疊所造成之係數的附屬物,並顯示內插需要被限制以避免任何不想要附屬物之該些點。
●每一N/2係數,內插需要停止以維持式(1)
●此外,由於被插入的零點,內插演算法需要停止每一N/4係數。這保證該些零點被維持並且內插錯誤或誤差不會被散佈,這維持PR。
第二限制不但是包含零點之區段所需要的,亦是其他區段所 需要的。藉由知道在DCT核心中的一些係數不是由最佳化演算法所確定的而是由式(1)所確定的以保證PR,在窗形中的一些不連續可被解釋,例如在圖1之c(1536+128)周圍。在最小化PR誤差,內插需要停止在出現在一N/4網格中之該些點。
由於該理由,N/4之區段尺寸係選擇給區段樣條內插以產生該些降尺度窗係數。來源窗係數總是由用於N=512之係數所給定,亦是由用於導致N=240或N=120之訊框尺寸之降尺度操作之係數所給定。基本的演算法係非常簡單的由下面MATLAB碼來表示:
Figure TWI611398BD00001
由於樣條函數可能不具完全的決定性,完整的演算法係設定在下面的說明,其可包含在ISO/IEC 14496-3:2009內,為以形成在AAC-ELD中之一改良的降尺度模式。
換言之,下面的說明係提供一提案,即關於上述之想法如何能應用於ER AAC ELD,亦即關於一低複合解碼器如何能在一第二資料率解碼被編碼於一第一資料率之一ER AAC ELD位元流,該第二資料率係低於該第一資料率。然而,所強調的是,如下面所使用之N的定義係遵守標準。於此N係對應DCT核心的長度,然而在上面所述、在申請專利範圍以及在下面所描述之一般化的實施例中,N係對應訊框長度,即DCT核心之相互重疊長度,亦即DCT核心長度之一半。據此,當N係如上所述例如指為512時,其係在下面說明指為1024。
下面的段落係經由修正而被提出以包含到14496-3:2009。
A.0藉由使用較低取樣率而適應於系統
對於某些應用,ER AAC LD可改變結束取樣率(playout sample rate)以避免額外的再取樣步驟(參照4.6.17.2.7)。ER AAC ELD可藉由使用低延遲MDCT窗與LD-SBR工具而應用相似的降尺度步驟。在AAC-ELD與LD-SBR工具協同工作的例子中,降尺度因子係被限制在2的倍數。在沒有LD-SBR的情況下,降尺度訊框尺寸需要是一整數數字。
A.1低延遲MDCT窗之降尺度
N=1024之LD-MDCT窗wLD係藉由使用一區段樣條內插及一因子F而被降尺度。在窗係數中之領先的零點之數目,即N/8,係確定該區段尺寸。降尺度之窗係數wLD_d係用於如4.6.20.2所述之逆MDCT但具有Nd=N/F之一降尺度窗長度。需注意者,該演算法亦能產生LD-MDCT之降尺度上升係數。
Figure TWI611398BD00002
Figure TWI611398BD00003
A.2低延遲SBR工具之降尺度
在低延遲SBR工具被用於連結ELD之例子中,該工具可被降尺度至較低的取樣率,至少是以2之倍數之降尺度因子。降尺度因子F係控制使用於CLDFB分析及合成濾波庫之複數帶(bands)之數目。下面兩段係描述一降尺度CLDFB分析及合成濾波庫,請參照4.6.19.4。
4.6.20.5.2.1降尺度分析CLDFB濾波庫
●定義降尺度CLDFB帶B=32/F之數目
●藉由B個位置而轉移在x陣列中之取樣。最老的B個取樣係被捨棄,並且B個新的取樣係被儲存於0至B-1之位置。
●將陣列x之取樣乘以窗ci之係數以得到陣列z。窗係數ci係藉由係數c之線性內插而得到,即經由方程式
Figure TWI611398BD00004
c之窗係數可在表4.A.90被找到。
●加總該些取樣以創造2B-元素陣列uu(n)=z(n)+z(n+2B)+z(n+4B)+z(n+6B)+z(n+8B),0
Figure TWI611398BD00005
n<(2B)
●藉由矩陣操作Mu而計算B個新子帶(subband)取樣,其中
Figure TWI611398BD00006
在該方程式中,exp()表示複合指數函數,並且j係為虛數單元。
4.6.20.5.2.2降尺度合成CLDFB濾波庫
●定義降尺度CLDFB帶B=64/F之數目。
●藉由2B個位置轉移在陣列v中之取樣。最老的2B個取樣係被捨棄。
●B個新的複合值之子帶取樣(complex-valued subband samples)係與矩陣N相乘,其中
Figure TWI611398BD00007
在該方程式中,exp()係表示複合指數函數並且j係為虛數單元。從該操作之輸出之實部係儲存於陣列v之0到2B-1之位置中。
●從v中取出取樣以創造10B-元素(10B-element)陣列g。
Figure TWI611398BD00008
●將陣列g之取樣與窗ci之係數相乘以產生陣列w。窗係數ci係藉由係數c之線性內插而得到,亦即經由方程式
Figure TWI611398BD00009
c之窗係數可在表4.A.90而被找到。
●依據下列方程式並藉由從陣列w之取樣之總和而計算B個新的輸出(output)取樣
Figure TWI611398BD00010
需注意的是,F=2之設定係依據4.6.19.4.3提供降取樣合成濾波庫。因此,為了使用一額外降尺度因子F來處理一降取樣LD-SBR位元流,F需要乘以2。
4.6.20.5.2.3降尺度之實數(real-valued)CLDFB濾波庫
CLDFB之降尺度亦可被應用於低能量(power)SBR模式之實數版本。為了描繪,亦請參照4.6.19.5。
為了降尺度實數分析與合成濾波庫,請跟隨在4.6.20.5.2.1以及4.6.20.2.2中之描述,並請以一cos()調變器來交換在M中之exp()調變器。
A.3低延遲MDCT分析
此子集合係描述用於AAC ELD編碼器之低延遲MDCT濾波庫。核心MDCT演算法(core MDCT algorithm)大部分是無法改變的,但是在一較長窗之下,會使得n從-N到N-1來執行(而不是從0到N-1)。
頻譜係數(spectral coefficient)Xi,k係定義如下:
Figure TWI611398BD00011
其中:zin=窗化之輸入順序(windowed input sequence)
N=取樣索引(sample index)
K=頻譜係數索引(spectral coefficient index)
I=方塊索引(block index)
N=窗長度(window length)
n0=(-N/2+1)/2
窗長度N(基於正弦窗)係為1024或960。
低延遲窗之窗長度係為2*N。窗化(windowing)係以下面方式延伸至過去:z i,n =w LD (N-1-n).x' i,n 對於n=N,…,N-1,同時合成窗w係藉由反向順序而使用為分析窗。
A.4低延遲MDCT合成
合成濾波庫相較於標準IMDCT演算法係藉由使用一正弦窗而被調整,以為採用一低延遲濾波庫。核心IMDCT演算法大部分是無法改變的,但是在一較長窗之下,會使得n現在係執行到2N-1(而不是到N-1)。
Figure TWI611398BD00012
其中:n=取樣索引(sample index)
i=窗索引(window index)
k=頻譜係數索引(spectral coefficient index)
N=窗長度/兩倍訊框長度(window length/twice the frame length)
n0=(-N/2+1)/2 N=960或1024。
窗化與重疊-相加(overlap-add)係以下列方式而被執行:長度N之窗係由在過去具有較多重疊且在未來具有較少重疊(N/8個值實際上為零)之一長度2N之窗所代替。
低延遲窗之窗化:z i,n =w LD (n).x i,n
其中,該窗現在係具有2N之一長度,因此n=0,…,2N-1。
重疊與相加:
Figure TWI611398BD00013
對於0<=n<N/2。
於此,經由修正而提出要被加入14496-3:2009之段落係到此結束。
自然地,上述關於AAC-ELD之一可能降尺度模式之說明係僅僅代表本發明之一實施例,並且多個調整亦是可行的。一般而言,本發明之實施例係非限制於執行AAC-ELD解碼之一降尺度版本之一音源解碼器。換言之,本發明之實施例可例如藉由形成能以一種降尺度方式而執行該逆轉換程序之一音源解碼器而被得到,該降尺度方式係僅僅不支持或不使用多樣的AAC-ELD專特的其他任務,例如頻譜封包絡(spectral envelope)之尺度因子轉換(scale factor-based transmission)、時域噪音整形(temporal noise shaping,TNS)、頻帶複製或其他類似者。
接著係說明一音源解碼器之一更普遍的實施例。上述之支持所描述之降尺度模式之一AAC-ELD音源解碼器可因此代表接下來所描述之音源解碼器之一實施例。特別說來,接著所描述之解碼器係如圖2所示,而圖3係描繪圖2之解碼器所執行之步驟。
圖2之音源解碼器,其係由標號10所表示,其包含一接收器12、一擷取器14、一頻時調變器(spectral-to-time modulator)16、一窗 化器18以及一時域混疊取消器20,上述元件係依序彼此串接。音源解碼器10之方塊12至20之相互作用與功能性係描述於下並請參照圖3。如本案說明之結尾所述的,方塊12至20可被實現於軟體、可編程硬體、或例如以一電腦程式、一FPGA或合適之編程電腦、編程微處理器或特殊應用積體電路之形式存在之硬體,方塊12至20可代表各別的子程式、電路路徑或相似者。
以下敘述更多細節,圖2之音源解碼器10以及音源解碼器10之元件之協同工作係用以從一資料流24解碼一音源訊號22,並且值得注意的是,音源解碼器10係在一取樣率解碼訊號22,該取樣率為音源訊號22已在編碼側被轉換編碼至資料流24所使用之取樣率的(1/F)th。F可例如為任何比1大之有理數。音源解碼器可用以操作在不同或多變的降尺度因子F或操作在一固定者。以下係進一步描述變化態樣。
音源訊號22在編碼或原始取樣率而被轉換編碼至資料流的方法係描繪於圖3之上半部。圖3係描繪使用小盒或方形來表示之頻譜係數28,該等小盒或方形係以一頻時(spectrotemporal)方式並分別沿圖3之水平時間軸30及垂直之頻率軸32排列。從一頻時表現(或頻譜圖、或頻時頻譜圖表現)26來之頻譜係數28係在資料流24中傳送。頻譜係數28被得到之方式以及頻譜係數28因此代表音源訊號22之方式係描繪於圖3之標號34,其係描繪在時間軸30之一部分中,屬於或代表各別時間部分之頻譜係數28係如何從音源訊號中被取得。
特別來說,在資料流24中傳送之係數28係為音源訊號22之一重疊轉換(lapped transform)之係數,以致以原始的或編碼取樣率所取樣之音源訊號22係被分割成一預設長度N之即時時間上連續以及非重疊之訊框,其中N個頻譜係數係在資料流24中被傳送給各訊框36。亦即,頻譜(或轉換)係數28係藉由使用一不可少的被取樣重疊轉換而從音源訊號22中被取得。在頻時表現26中,頻譜係數28之複數行之時間序列之各行係分別對應訊框序列之訊框36的其中之一。N個頻譜係數28係藉由一頻譜分解轉換(spectrally decomposing transform)或時頻調變(time-to-spectral modulation)而被取得給對應的訊框36,其中該時頻調變之調變函數係在時 間上延伸,且不僅是在合量(resulting)頻譜係數28所屬於的訊框36上延伸,也在E+1個先前訊框上延伸,其中E可為任何整數或任何大於零的偶數。亦即,屬於某一訊框36之其中一行之頻譜係數28係藉由將一轉換應用至一轉換窗上而被取得,各別訊框包含E+1個相對於現在訊框之過去的訊框。在此轉換窗38內之音源訊號之取樣之頻譜分解,其係針對屬於顯示在標號34之部分之中間訊框36之轉換係數之該行而描繪於圖3,係藉由使用一低延遲單位模(unimodal)分析窗函數40而被達到,並且藉此在轉換窗38內之該等頻譜取樣係在受到一MDCT或MDST或其他頻譜分解轉換之前而被加權。為了降低編碼器側之延遲,分析窗40係在其時間領先端包含一零區間(zero-interval)42,以致編碼器不需要等待在現在訊框36內之最新取樣之對應部分,藉以計算該現在訊框36之頻譜係數28。亦即,在零區間42內,低延遲窗函數40係為零或具有零個窗係數,以致現在訊框36之位於同處(co-located)之音源取樣由於窗加權40的關係而不會有助於針對該訊框與一資料流24所傳送之轉換係數28。亦即,總結上述,屬於一現在訊框36之轉換係數28係藉由窗化以及在一轉換窗38內之音源訊框之取樣之頻譜分解而被取得,其中該轉換窗38係包含現在訊框以及時間上之前的訊框,並且在時間上與用以確定屬於時間上鄰近訊框之頻譜係數28之對應轉換窗相重疊。
在重新說到音源解碼器10之前,需注意的是,目前為止所提供之在資料流24內之頻譜係數28之傳送之說明係依據下面方式而被簡化,即頻譜係數28被量化或被編碼至資料流24中之方式及/或音源訊號22在接受重疊轉換之前已被預先處理之方式。舉例來說,具有被轉換編碼至資料流24內之音源訊號22之音源編碼器可經由一心理聽覺(psychoacoustic)模型而被控制或是可使用一心理聽覺模型來使量化噪音無法被聽者感受到並且量化頻譜係數28及/或在一遮罩閥值函數(masking threshold function)之下,藉此可確定頻譜帶之尺度因子,藉以被量化與被傳送之頻譜係數28係被尺度化。尺度因子亦被訊號化於資料流24中。另一者,音源編碼器可為一轉換編碼激勵(transform coded excitation,TCX)型之編碼器。然後,在形成頻譜係數28之頻時表現26之前,音源訊號可 藉由實施重疊轉換至激勵訊號,即線性預測殘餘訊號,上而接受一線性預測分析濾波。舉例來說,線性預測係數亦可被訊號化於資料流24中,並且一頻譜統一量化可被應用以為了得到頻譜係數28。
此外,到目前為止所提供的說明亦是依據訊框36之訊框長度及/或依據低延遲窗函數40而被簡化。實際上,音源訊號22可以藉由使用變化訊框尺寸及/或不同的窗40之方式而被編碼至資料流24中。然而,下面所提供的說明係聚焦在一窗40以及一訊框長度上,雖然接下來的說明可被輕易地延伸至一例子,即熵編碼器在將音源訊號編碼至資料流中時改變這些參數。
回到圖2之音源解碼器10及其說明,接收器12係接收資料流24並藉此接收各訊框36之N個頻譜係數28,亦即圖3所顯示之一個各別的係數28行。需注意的是,訊框36之時間長度,在原始的取樣中或以編碼取樣率進行量測時,係為圖3之34所指示之N,但是圖2之音源解碼器10係用以在一減少取樣率下解碼音源訊號22。舉例來說,音源解碼器10僅支持在下面描述之降尺度解碼功能性。另一者,音源解碼器10係可在原始或編碼取樣率之下來重建音源訊號,但可能在降尺度解碼模式與一非降尺度解碼模式之間作切換,同時降尺度解碼模式係與下面所解釋之操作之音源解碼器10之模式一致。舉例來說,在一低電池電量、減少之再生環境功能或類似者之情況下,音源編碼器10可被切換至一降尺度解碼模式。無論何時狀況改變時,音源解碼器10可例如從附尺度解碼模式切換回非降尺度者。在任何例子中,依據如下所述之解碼器10之降尺度解碼處理,音源訊號22係在一取樣率下重建,在該取樣率下,訊框36係具有在縮減取樣率之取樣中所量測之一較低長度,亦即在縮減取樣率下之N/F取樣之一長度。
接收器12之輸出係為N個頻譜係數之序列,亦即一組N個頻譜係數,亦即圖3之各訊框36之一行。從上面對形成資料流24之轉換編碼處理之簡短說明中可以得到,接收器12可應用多樣任務來取得各訊框36之N個頻譜係數。舉例來說,接收器12可使用熵解碼以為了從資料流24中讀取頻譜係數28。接收器12亦可藉由資料流中所提供之尺度因子及 /或運送於資料流24內之線性預測係數所取得之尺度因子而對從資料流中所讀取之頻譜係數進行頻譜塑形(spectrally shape)。舉例來說,接收器12可從資料流24中得到尺度因子,亦即在各訊框與各子帶基準,並且使用這些尺度因子以為了尺度化運送在資料流24內之尺度因子。另一者,接收器12可從運送於資料流24內之線性預測係數取得各訊框36之尺度因子,並且使用這些尺度因子以為了尺度化被傳送之頻譜係數28。非必要地,接收器12可執行填隙以為了合成地將零量化部分填充於各訊框之N個頻譜係數18之多個組內。額外的或另一者,接收器12可將一TNS合成濾波器應用至各訊框之一被傳送TNS濾波器係數上,以幫助頻譜係數28從資料流之重建,並且TNS係數亦可被傳送於資料流24內。剛被說明之接收器12的可能任務應被理解為可能方法之一非排他性列表,並且接收器12可執行更多或其他與從資料流24讀取頻譜係數28相關之任務。
擷取器14因而從接收器12接收頻譜係數28之頻時表現26,並且擷取各訊框36之N個頻譜係數之一低頻部分,亦即N/F最低頻之頻譜係數。
亦即,頻時調變器16係從擷取器14接收各訊框36之N/F頻譜係數28之一串流或序列46,其係對應出於頻時表現26之一低頻切片、頻譜地記錄在圖3之標示”0”所表示之最低頻之頻譜係數,並且延伸到標示”N/F-1”之頻譜係數。
頻時調變器16係針對各訊框36而使頻譜係數28之對應低頻部分44受到一逆轉換48,逆轉換48具有在時間上延伸至各訊框及E+1個先前訊框之長度(E+2).N/F之調變函數,如圖3之「50」所示,藉以得到長度(E+2).N/F之一時間部分,亦即一未窗化之時間區段52。亦即,頻時調變器可藉由使用例如如上所述之被提出替換段落A.4之第一方程式並藉由相同長度之加權與加總調變函數,而得到縮減取樣率之(E+2).N/F個取樣之一時間區段。時間區段52之最新的N/F取樣係屬於現在訊框36。調變函數可如上述的,例如在逆轉換為一逆MDCT的例子時為餘弦函數、或在逆轉換為一逆MDCT時為正弦函數。
如此,窗化器52係針對各訊框接收一時間部分52,在其領 先端之N/F個取樣係時間上對應各別訊框,同時各別時間部分52之其他取樣係屬於對應的時間上的先前訊框。窗化器18係針對各訊框36並藉由使用包含在其一領先端之長度1/4.N/F之一零部分56之長度(E+2).N/F之一單位模合成窗54而窗化時間部分52,亦即1/F.N/F個零值窗係數,單位模合成窗54並具有一峰值58位於在時間上接續該零部分56之其時間間隔之內,亦即未被零部分52覆蓋之時間部分52之時間間隔。後面的時間間隔可被稱為窗58之非零部分並具有長度7/4.N/F,其係以縮減取樣率之取樣來量測,即7/4.N/F個窗係數。窗化器18例如藉由使用窗58而加權該時間部分52。各時間部分52連同窗54之加權或相乘58係導致一窗化時間部分60,其一係針對各訊框36,並且就時間覆蓋來說,其係導致與各時間部分52相一致。在上面所述之A.4部分,可被窗18使用之窗化處理係由與zi,n及xi,n相關之方程式來描述,其中xi,n係對應先前所述之未被窗化之時間部分52,zi,n係對應窗化之時間部分60,i係標示訊框/窗之序列,n係在各時間部分52/60之內標示依據一縮減取樣率之各別部分52/60之取樣或值。
如此,時域混疊取消器20係從窗化器18接收窗化時間部分60之一序列,亦即每個訊框36一個。取消器20係藉由記錄各窗化時間部分60連同其領先N/F值與對應訊框36一致,而使訊框36之窗化時間部分60受到一重疊相加處理62。藉由此量測,一現在訊框之窗化時間部分60之長度(E+1)/(E+2)之一落後端部分,亦即具有長度(E+1).N/F之餘項(remainder),係與先前訊框之時間部分之一對應相等長的領先端重疊。在方程式中,時域混疊取消器20可操作如同在A.4段之上述提出版本之最後的方程式中所顯示的,其中,outi,n係對應在縮減取樣率之重建音源訊號22之音源取樣。
藉由窗化器18與時域混疊取消器20所執行之窗化58與重疊加相62之處理係依據圖4而更清楚地描繪於下。圖4係使用應用於上述提出之A.4段之命名並使用應用在圖3與圖4之標號。x0,0到x0,(E+2).N/F-1係代表藉由頻時調變器16針對第0訊框36所得到之第0時間部分52。x的第一個索引係標示沿著時間順序之訊框36,x的第二個索引係標示沿著時 間順序之時間之取樣之排序,屬於縮減取樣率之內取樣間距(inter-sample pitch)。然後,在圖4中,w0到w(E+2).N/F-1係指示窗54之窗係數。就像x的第二索引,亦即由調變器16所輸出之時間部分52,當窗54係被應用到各時間部分52時,w的索引係使得索引0對應最舊的取樣值且索引(E+2).N/F-1對應最新的取樣值。窗化器18係藉由使用窗54而窗化時間部分52以得到窗化時間部分60,使得z0,0到z0,(E+2).N/F-1,其係表示第0訊框之窗化時間部分60,係依據z0,0=x0,0.w0,...,z0,(E+2).N/F-1=x0,(E+2).N/F-1.w(E+2).N/F-1而被得到。Z的索引具有與x同樣的意義。在此方式下,調變器16與窗化器18係針對由x與z的第一索引所標示之各訊框而作動。取消器20係加總E+2個連續的訊框之E+2個窗化時間部分60,同時藉由一訊框而相對彼此補償窗化時間部分60之取樣,亦即藉由各訊框36之取樣數量,亦即N/F,藉以得到一現在訊框之取樣u,於此係為u-(E+1),0...u-(E+1),N/F-1)。於此,再次地,u的第一索引係指示訊框數量並且第二索引係對沿著時間順序之此訊框之取樣進行排序。取消器係加入如此被得到之重建訊框,以使在連續訊框36之內之重建音源訊號22之取樣係依據u-(E+1),0...u-(E+1),N/F-1,u-E,0,...u-E,N/F-1,u-(E-1),0,...而彼此接著。取消器22係依據u-(E+1),0=z0,0+z-1,N/F+...z-(E+1),(E+1).N/F,...,u-(E+1).N/F-1=z0,N/F-1+z-1,2.N/F-1+...+z-(E+1),(E+2).N/F-1而計算在第-(E+1)th個訊框之內之音源訊號22之各取樣,亦即加總現在訊框之各取樣u之(e+2)個加數(addends)。
圖5係描繪下列事實之一可能利用,即有助於訊框-(E+1)之音源取樣u之剛被窗化之取樣之中,對應到或藉由使用窗54之零部分56,即z-(E+1),(E+7/4).N/F...z-(E+1),(E+2).N/F-1,而被窗化者之值係為零。如此,在未藉由使用E+2個加數而得到音源訊號之第-(E+1)th個訊框36之內之N/F個取樣的情況之下,取消器20係可僅藉由依據u-(E+1),(E+7/4).N/F=z0,3/4.N/F+z-1,7/4.N/F+...+z-E,(E+3/4).N/F,...,u-(E+1),(E+2)N/F-1=z0,N/F-1+z-1,2.N/F-1+...+z-E,(E+1).N/F-1及使用E+1個加數而計算其領先端四分之一,亦即u-(E+1),(E+7/4).N/F...u-(E+1),(E+2).N/F-1。在此方法中,窗化器可甚至有效地省去依據零部分56之加權58之表現。如此,現在訊框到(E+1)th訊框之取樣u-(E+1),(E+7/4).N/F...u-(E+1),(E+2).N/F-1可藉由僅使用E+1個加數而被得到,同時 u-(E+1),(E+1).N/F...u-(E+1),(E+7/4).N/F-1可藉由使用E+2個加數而被得到。
如此,在上述之方法中,圖2之音源解碼器10係以一降尺度方式而重現被編碼至資料流24中之音源訊號。為此目的,音源解碼器10係使用一窗(或窗函數)54,其本身為長度(E+2).N之一參考合成窗之一降取樣版本。如依據圖6解釋的,此降取樣版本,即窗54,係藉由降取樣該參考合成窗、藉由F之一因子,即降取樣因子、藉由使用一區段內插,即在未降尺度下所測量之長度1/4.N之區段中、在降取樣下之長度1/4.N/F之區段中、在時間上量測並表現為獨立於取樣率之訊框36之一訊框之四分之一之區段中,而被得到。在4.(E+2)中,此內插係被執行以得到4.(E+2)倍之1/4.N/F長的區段,其係被連成一串而代表長度(E+2).N之參考合成窗之降取樣版本。請參照圖6,圖6係顯示合成窗54,其係單位模並被音源解碼器10依據一降取樣音源解碼程序而使用,並在參考合成窗70之下,其長度(E+2).N。亦即,藉由從參考合成窗70到實際上被音源解碼器10用以降取樣解碼之合成窗54之降取樣程序,窗係數之數量係藉由F之一因子而縮減。在圖6中,圖5及圖6之命名法已支持如下,即w係用以表示降取樣版本窗54,同時w’已被使用來表示參考合成窗70之窗係數。
如上所述的,為執行降取樣72,參考合成窗70以相同長度之區段74而被處理。在數量上有(E+2).4個區段74。在以原始取樣率量測之下,即在參考合成窗70之窗係數之數量中,各區段74係為1/4.N個窗係數w’長,並且在以縮減或降取樣之取樣率量測之下,各區段74係為1/4.N/F個窗係數w長。
自然地,它是可能發生的,即針對意外地與參考合成窗70之任一窗係數w’j一致之各降取樣窗係數wi來執行降取樣72,其係藉由簡單的設定wi=w’j連同wi之取樣時間與w’j之取樣時間一致,及/或藉由線性內插在時間上位於兩窗係數w’j與w’j+2之間之任何窗係數wi,但此程序會導致該參考合成窗70之不良近似,即被音源解碼器10使用來降取樣解碼之合成窗54係代表參考合成窗70之一不良近似,藉此無法滿足保證相對於從資料流24之音源訊號之非降尺度解碼之降尺度解碼之一致性測試之需求。如此,降取樣72係牽涉一內插程序,據此,降取樣窗54之大部分的 窗係數wi,即偏離區段74之邊界者,係經由降取樣程序而依靠參考窗70之至少二窗係數w’。特別說來,當降取樣窗54之大部分窗係數w’依靠參考窗70之至少二窗係數w’j以為了針對降取樣版本54之各窗係數wi而增加內插/降取樣結果之品質,即近似品質時,同樣者係未依靠屬於不同區段74之窗係數w’j。降取樣程序72係為一區段內插程序。
舉例來說,合成窗54可為長度1/4.N/F之樣條函數之一連鎖(concatenation)。三次樣條函數可被使用。這樣的例子係說明於上述之A.1段,其中外面for-next迴圈(outer for-next loop)係依序在區段74上進行迴圈,其中,在各區段74中,降取樣或內插72係牽涉在例如該段之for-next迴圈之第一款“calculate vector r needed to calculate the coefficients c”之現在區段74之內之連續窗係數w’之一數學結合。然而,應用在區段之內插亦可被不同的選擇。亦即,該內插係不限制於樣條或三次樣條。反而,線性內插或任何其他內插方法亦可被使用。在任何例子中,內插之區段實現可使得降尺度合成窗之取樣之計算,亦即降尺度合成窗之區段之最外面的取樣,並鄰接另一區段,不依靠在不同區段之參考合成窗之窗係數。
可以是窗化器18從一儲存得到降取樣合成窗54,其中在藉由使用降取樣72而被得到之後,此降取樣合成窗54之窗係數wi已被儲存。另一者,如圖2所描繪的,音源解碼器10可包含一區段降取樣器76以基於參考合成窗70而執行圖6之降取樣72。
需注意者,圖2之音源解碼器10可用以僅支持一固定降取樣因子F或可支持不同值。在此例子中,音源解碼器10可負責如在圖2之78之F之一輸入值。擷取器14,例如可負責此值F以為了擷取如上所述之各訊框頻譜之N/F個頻譜值。在類似的方法中,非必要之區段降取樣器76亦可負責如上所述之F值。S/T調變器16亦可負責F,以為了例如計算地取得調變函數之降尺度/降取樣版本,相對於使用於未降尺度操作模式者之降尺度/降取樣,其中重建係導致完滿的音源取樣率。
自然地,調變器16亦可負責F輸入78,如同調變器16合適地使用調變函數之降取樣版本以及同樣的對於窗化器18及消除器20依據在縮減或降取樣之取樣率之訊框之實際長度之一調整亦成立。
舉例來說,F可立於1.5與10之間,包含1.5與10。
需注意者,圖2及3之解碼器或本發明所說明之變化態樣係可被實施,以藉由使用低延遲MDCT之一上升實現,就例如EP 2 378 516 B1所教示的,而執行頻時轉換。
圖8係描繪使用上升概念之解碼器之一實施。S/T調變器16係例示的執行一逆DCT-IV,並且被顯示由代表窗化器18與時域混疊取消器20之連鎖之一方塊所接著。在圖8的例子中,E係為2,亦即E=2。
調變器16係包含一逆type-iv離散餘弦變換頻率/時間轉換器。在未輸出(E+2)N/F長的時間部分52之序列的情況下,它僅僅輸出長度2.N/F之時間部分52,全部係從MF長頻譜46之序列而被取得,這些被縮減部分52係對應DCT核心(kernel),亦即前述部分之2.N/F最新的取樣。
窗化器18係如前述的作動,並且產生各時間部分52之一窗化時間部分60,但其僅操作在DCR核心上。為此目的,窗化器18係使用窗法函數ωi,並且i=0...2N/F-1,具有核心尺寸。wi,i=0...(E+2).N/F-1,之間的關係係在之後描述,就如同後敘之上升係數與wi,i=0...(E+2).N/F-1,之間的關係。
使用前述之命名法,到目前所述的處理係得到:zk,nn.xk,n for n=0,...,2M-1,其中,重定義M=N/F使得M對應表現在降尺度域中之訊框尺寸,並且使用圖2至圖6的命名法,其中,然而,zk,n與xk,n應僅僅包含窗化時間部分之取樣以及在DCT核心之內具有尺寸2.M之未窗化時間部分之取樣,並且時間上對應圖4之取樣E.N/F...(E+2).N/F-1。亦即,n係為一整數,指出一取樣索引,並且ωn係為對應索引n之取樣之一實數窗函數係數。
取消器20之重疊/相加處理係操作在與前述不同的方法。它產生基於下列方程式或式子之中間的時間部分mk(0),...mk(M-1)。
mk,n=zk,n+zk-1,n+M for n=0,...,M-1
在圖8之實施中,裝置更包含一上升器80,其係可被視為 調變器16與窗化器18之一部分,這是因為上升器80補償下列事實,即調變器與窗化器係使其處理受限於DCT核心,而不是在超過朝向過去之核心而使延伸被引入來補償零部分56的情況下來處理調變函數與合成窗之延伸。上升器80係藉由使用延遲器與乘法器82及加法器84之一架構而產生在基於下列方程式或式子之緊連之成對的連續訊框中之長度M之最後重建的時間部分或訊框。
uk,n=mk,n+ln-M/2.mk-1,M-1-n for n=M/2,...,M-1,以及uk,n=mk,n+lM-1-n.outk-1,M-1-n for n=0,...,M/2-1,其中,ln,n=0...M-1,係為與以一種在下面會更詳細描述之方法之降尺度合成窗相關之實數上升係數。
換言之,對於過去之E個訊框之延伸重疊而言,只有M個額外的乘法-加法操作是需要的,就如在上升器80之架構中所見的。這些額外的操作有時亦被視為「零延遲矩陣」。這些操作有時亦被知道為「上升步驟」。圖8所示之有效實施在一些環境之下係可更有效的作為一明確(straightforward)的實施。為了更精確,依據離散實施,這樣一個更有效的實施可能導致節省M個操作,就如在為了M個操作之明確實施的例子中,它可能適合來實施,就如圖19所示之實施,原則上在模組820之架構中需要2M個操作以及在上升器830之架構中需要M個操作。
對於ωn,n=0...2M-1與ln,n=0...M-1在合成窗wi,i=0...(E+2)M-1(於此請注意E=2)的依靠性來說,下面的方程式係描述它們帶著置換的關係,然而在括號內的索引係跟隨各別參數:
Figure TWI611398BD00014
w(M/2+i)=l(n).l(M/2+n).ω(3M/2+n)
Figure TWI611398BD00015
w(3M/2+i)=-l(n).ω(3M/2+n) w(2M+i)=-ω(M+n)-l(M-1-n).ω(n) w(5M/2+i)=-ω(3M/2+n)-l(M/2+n).ω(M/2+n) w(3M+i)=-ω(n) w(7M/2+i)=ω(M+n)
Figure TWI611398BD00016
請注意窗wi包含在此方程式之右側之峰值,亦即在索引2M與4M-1之間。上述方程式係使係數ln,n=0...M-1與ωn,n=0,...,2M-1關連於降尺度合成窗之係數wn,n=0...(E+2)M-1。如所見的,ln,n=0...M-1實際上僅依靠降取樣合成窗之係數的3/4,亦即依靠wn,n=0...(E+1)M-1,同時ωn,n=0,...,2M-1係依靠全部的wn,n=0...(E+2)M-1。
如上所述的,窗化器18可從一儲存得到降取樣合成窗54,wn,n=0...(E+2)M-1,其中此降取樣合成窗54之窗係數wi在藉由使用降取樣72而被得到之後已被儲存,並且從其中同樣的可被應用來藉由使用上述關係而計算係數ln,n=0...M-1以及ωn,n=0,...,2M-1,但是另一者,窗18可重新得到係數ln,n=0...M-1以及ωn,n=0,...,2M-1,如此從預降取樣合成窗、直接從該儲存而被計算。另一者,如上所述,音源解碼器10可包含基於參考合成窗70而執行圖6之降取樣72之區段降取樣器76,藉以得到wn,n=0...(E+2)M-1,基於此,窗化器18係藉由使用上述關係/方程式而計算係數ln,n=0...M-1以及ωn,n=0,...,2M-1。甚至使用上升實施可支持至少二個F值。
簡單總結上升實施,同樣導致一音源解碼器10,其用以從一資料流24在一第一取樣率解碼一音源訊號22,該音源訊號係以一第二取樣率而被轉換編碼至該資料流24,第一取樣率係為第二取樣率之(1/F)th,音源解碼器10係包含接收器12,其係接收音源訊號之長度N之各訊框,N個頻譜係數28,擷取器14針對各訊框擷而從N個頻譜係數28取出長度N/F之一低頻部分,一頻時調變器16係用以針對各訊框36而使低頻部分受到具有在時間上延伸到各別訊框及一先前訊框之長度2.N/F之調變函數之 一逆轉換,藉以得到長度2.N/F之一時間部分,以及一窗化器18,其係針對各訊框36並依據zk,nn.xk,n,n=0,...,2M-1而窗化時間部分xk,n,藉以得到一窗化時間部分zk,n,n=0...2M-1。時域混疊取消器20係依據mk,n=zk,n+zk-1,n+M,n=0,...,M-1而產生中間時間部分mk(0),...mk(M-1)。最後,上升器80係依據uk,n=mk,n+ln-M/2.mk-1,M-1-n,n=M/2,...,M-1以及uk,n=mk,n+lM-1-n.outk-1,M-1-n,n=0,...,M/2-1而計算音源訊號之訊框uk,n,n=0...M-1,其中ln,n=0...M-1係為上升係數,其中逆轉換係為一逆MDCT或逆MDST,並且其中ln,n=0...M-1以及ωn,n=0,...,2M-1係依靠一合成窗之係數wn,n=0...(E+2)M-1,以及該合成窗係為長度4.N之一參考合成窗之一降取樣版本,藉由一F因子並藉由在長度1/4.N之區段中之一區段內插而被降取樣。
經由上述針對依據一降尺度解碼模式之AAC-ELD之一延伸之一提案的討論,圖2之音源解碼器可伴隨一低延遲SBR工具。舉例來說,下面敘述係指出被延伸以支持上述提案之降尺度操作模式之AAC-ELD編碼器係如何操作在使用低延遲SBR工具的情況下。如本案說明書開頭部分所述,在低延遲SBR工具被使用於連結AAC-ELD編碼器的例子中,低延遲SBR模組之濾波庫係亦被降尺度。這保證SBR模組以同樣頻率解析度(frequency resolution)操作,並且因此不再需要調整。圖7指出操作在96kHz之AAC-ELD解碼器之訊號路徑,具有480取樣之訊框尺寸,在降取樣SBR模式以及具有為2之一降尺度因子F。
在圖7中,到達的位元流如被一序列方塊所處理,即一AAC解碼器、一逆LD-MDCT方塊、一CLDFB分析方塊、一SBR解碼器與一CLDFB合成方塊(CLDFB=complex low delay filter bank)。位元流係等於先前依據圖3至圖6所討論之資料流24,但是它額外伴隨參數的SBR資料,其有助於一頻譜延伸帶之一頻譜複製之頻譜塑形,該頻譜延伸帶係延伸藉由降尺度音源解碼在逆低延遲MDCT方塊之輸出而被得到之音源訊號之頻譜頻率,頻譜塑形係由SBR解碼器所執行。特別說來,AAC解碼器係藉由合適的解析(parsing)及熵解碼而重新得到所有必要的排列元素(syntax elements)。AAC解碼器可部分地與音源解碼器10之接收器12一致,在圖 7中音源解碼器10係實施為逆低延遲MDCT方塊。在圖7中,F係例示的等於2。亦即,作為圖2之重建音源訊號22之一例子,圖7之逆低延遲MDCT方塊係輸出一48kHz時間訊號,其係在音源訊號被原始的編碼於到達之位元流內之一半的率下被降取樣。CLDFB分析方塊再將此48kHz時間訊號,亦即藉由降尺度音源解碼所得到之音源訊號,細分為N個帶,於此N=16,並且SBR解碼器係計算這些帶之重塑係數,據此重塑這N個帶,即經由在到達AAC解碼器之輸入之輸入位元流中之SBR資料而被控制,並且CLDFB合成方塊係從頻域至時域而重轉變(re-transition)並藉此得到一高頻延伸訊號,其係被加入至由逆低延遲MDCT方塊所輸出之原始解碼音源訊號。
請注意,SBR之標準操作係使用一32帶CLDFB。針對32帶CLDFB窗係數ci32之內插演算法係已提供於參考文獻[1]之4.6.19.4.1。
Figure TWI611398BD00017
0
Figure TWI611398BD00018
i<320,其中,c64係為提供於參考文獻[1]之Table 4.A.90之64帶窗之窗係數。此方程式亦可進一步一般化以定義針對一較低數量之帶B之窗係數。
Figure TWI611398BD00019
其中F係表示降尺度因子,其係為F=32/B。在窗係數之此定義下,CLDFB分析與合成濾波庫可完全被描述如章節A.2之上述例子中所指出的。
如此,上述例子提供一些針對AAC-ELD編解碼之遺失的定義,以為使編解碼適應具有較低取樣率之系統。這些定義可被包含在ISO/IEC 14496-3:2009標準內。
如此,在上述討論中,其已被描述:
一音源解碼器可用以在一第一取樣率並從一資料流解碼一音源訊號,其中該音源訊號係以一第二取樣率被轉換編碼至該資料流中,第一取樣率係為第二取樣率之(1/F)th。音源解碼器包含:一接收器用以針對音源訊號之長度N之各訊框而接收N個頻譜係數;一擷取器用以針對各訊框而從N個頻譜係數擷取出長度N/F之一低頻部分;一頻時調變器用以針對各訊框而使低頻部分受到一逆轉換,其具有在時間上延伸至各訊框與E+1個先前訊框之長度(E+2).N/F之調變函數,以致得到長度(E+2).N/F之一 時間部分;一窗化器用以針對各訊框並藉由使用長度(E+2).N/F之一單位模合成窗,其係包含在其領先端之長度1/4.N/F之一零部分以及具有在該單位模合成窗之一時間區間內之一峰值,而窗化該時間部分,該時間區間接續該零部分並具有長度7/4.N/F,使得窗化器得到長度(E+2).N/F之一窗化時間部分;以及一時域混疊取消器用以使該等訊框之窗化時間部分受到一重疊-相加處理,使得一現在訊框之窗化時間部分之長度(E+1)/(E+2)之一落後端部分重疊於一先前訊框之窗化時間部分之長度(E+1)/(E+2)之一領先端,其中該逆轉換係為一逆MDCT或逆MDST,並且其中該單位模合成窗係為長度(E+2).N之一參考單位模合成窗之一降取樣版本,其係藉由在長度1/4.N/F之區段內之一區段內並藉由一F因子而被降取樣。
依據一實施例之音源解碼器,其中該單位模合成窗係為長度1/4.N/F之樣條函數之一連鎖。
依據一實施例之音源解碼器,其中該單位模合成窗係為長度1/4.N/F之三次樣條函數之一連鎖。
依據任一先前實施例之音源解碼器,其中E=2。
依據任一先前實施例之音源解碼器,其中逆轉換為一逆MDCT。
依據任一先前實施例之音源解碼器,其中大量的單位模合成窗之超過80%以上係被包含在接續零部分並具有長度7/4.N/F之時間區間之內。
依據任一先前實施例之音源解碼器,其中音源解碼器係用以執行內插或從一儲存取得單位模合成窗。
依據任一先前實施例之音源解碼器,其中音源解碼器係用以支持不同的F值。
依據任一先前實施例之音源解碼器,其中F係介於1.5與10之間,並可包含1.5或10。
藉由依據任一先前實施例之一音源解碼器所執行之一方法。
當執行於一電腦上時,具有用以執行依據一實施例之一方法之一程式碼之一電腦程式。
說到關於長度的詞,需注意到此詞係可被理解為量測在取樣中的長度。說到零部分之長度以及區段,需注意到其可為整數值。另一者,其可為非整數值。
關於峰值位於其內之時間區間,需注意的是圖1顯示該峰值以及針對參考模合成窗之一例子之時間區間,其中E=2且N=512:該峰值在大約取樣No.1408具有其最大值,並且時間區間係從取樣No.1024延伸至取樣No.1920。時間區間係因此為DCT核心的7/8長。
關於「降取樣版本」之詞,需注意的是在上面說明書中,不是使用該詞,而是同義的使用「降尺度版本」。
關於在某一區間之大量的函數之詞,需注意的是其應表示在各別區間之各別函數之限定積分。
在音源解碼器支持不同的F值的例子中,其可包含一儲存,其具有參考單位模合成窗之據此區段內插版本,或是可針對一現在主動的F值而執行區段內插。不同的區段內插版本之共同點為該內插係不負面地影響在區段邊界之不連續。如上所述,它們可為樣條函數。
藉由取得單位模合成窗並藉由從參考單位模合成窗之一區段內插,就如上面圖1所顯示者,4.(E+2)個區段可藉由樣條近似而形成,就如藉由三次樣條與不管該內插,該等不連續係被保存,其係由於合成地被導入之零部分作為用以降低延遲之一方法而呈現在單位模合成窗中並在一1/4間距(pitch)。
參考文獻
[1] ISO/IEC 14496-3:2009
[2] M13958, “Proposal for an Enhanced Low Delay Coding Mode”, October 2006, Hangzhou, China
以上所述僅為舉例性,而非為限制性者。任何未脫離本發明之精神與範疇,而對其進行之等效修改或變更,均應包含於後附之申請專利範圍中。
10‧‧‧音源解碼器
12‧‧‧接收器
14‧‧‧擷取器
16‧‧‧頻時調變器
18‧‧‧窗化器
20‧‧‧時域混疊取消器
22‧‧‧音源訊號
24‧‧‧資料流
28‧‧‧頻譜(或轉換)係數
46‧‧‧序列
52‧‧‧時間部分
60‧‧‧窗化時間部分
70‧‧‧參考合成窗
76‧‧‧區段降取樣器
78‧‧‧輸入

Claims (19)

  1. 一種音源解碼器(10),用以在一第一取樣率並從一資料流(24)而解碼一音源訊號(22),該音源訊號係在一第二取樣率而被轉換編碼至在該資料流(24)中,該第一取樣率係為該第二取樣率之(1/F)th,該音源解碼器(10)包含:一接收器(12),用以接收該音源訊號之長度N之各訊框之N個頻譜係數(28);一擷取器(14),用以針對各訊框而從該N個頻譜係數(28)擷取出長度N/F之一低頻部分;一頻時調變器(16),用以針對各訊框(36)而使該低頻部分受到具有在時間上延伸到各訊框與E+1個先前訊框之長度(E+2).N/F之調變函數之一逆轉換,以得到長度(E+2).N/F之一時間部分;一窗化器(18),用以針對各訊框(36)並藉由使用長度(E+2).N/F之一合成窗而窗化該時間部分,該合成窗包含在其一領先端之長度1/4.N/F之一零部分並具有在該合成窗之一時間區間內之一峰值,該時間區間係接續該零部分並具有長度7/4.N/F,使得該窗化器得到長度(E+2).N/F之一窗化時間部分;以及一時域混疊取消器(20),用以使該等訊框之該窗化時間部分受到一重疊-相加處理,使得一現在訊框之該窗化時間部分之長度(E+1)/(E+2)之一落後端部分係重疊於一先前訊框之該窗化時間部分之長度(E+1)/(E+2)之一領先端,其中該逆轉換係為一逆MDCT或逆MDST,以及其中,該合成窗係為長度(E+2).N之一參考合成窗之一降取樣版本,其係藉由一因子F並藉由在長度1/4.N之區段內之一區段內插而被降取樣。
  2. 如申請專利範圍第1項所述之音源解碼器(10),其中該合成窗係為長度1/4.N/F之樣條函數之一連鎖。
  3. 如申請專利範圍第1項所述之音源解碼器(10),其中該合成窗係為長度 1/4.N/F之三次樣條函數之一連鎖。
  4. 如申請專利範圍第1項所述之音源解碼器(10),其中E=2。
  5. 如申請專利範圍第1項所述之音源解碼器(10),其中該逆轉換係為一逆MDCT。
  6. 如申請專利範圍第1項所述之音源解碼器(10),其中大部分之該合成窗之超過80%係被包含在該時間區間內,該時間區間係接續該零部分並具有長度7/4.N/F。
  7. 如申請專利範圍第1項所述之音源解碼器(10),其中該音源解碼器(10)係用以執行該區段內插或從一儲存而取得該合成窗。
  8. 如申請專利範圍第1項所述之音源解碼器(10),其中該音源解碼器(10)係用以支持不同的F值。
  9. 如申請專利範圍第1項所述之音源解碼器(10),其中F係介於1.5與10之間並可包含1.5或10。
  10. 如申請專利範圍第1項所述之音源解碼器(10),其中該參考合成窗係為單位模(unimodal)。
  11. 如申請專利範圍第1項所述之音源解碼器(10),其中該音源解碼器(10)係用以以一方式執行該區段內插,使得該合成窗之大部分的係數係依靠該參考合成窗之至少三個係數。
  12. 如申請專利範圍第1項所述之音源解碼器(10),其中該音源解碼器(10)係用以執行該區段內插,使得由至少三個係數從區段邊界所分隔之該合成窗之各係數係從該參考合成窗之至少三個係數內插而得。
  13. 如申請專利範圍第1項所述之音源解碼器(10),其中該窗化器(18)與該時域混疊取消器係合作,使得該窗化器係藉由使用該合成窗而略過加權該時間部分之該零部分,並且該時域混疊取消器(20)係忽視在該重疊-相加處理中之該窗化時間部分之一對應非加權部分,使得僅有E+1個 窗化時間部分被加總,以產生一對應訊框之對應的非加權部分,並且E+2個窗化部分係在該對應訊框之一提醒之內而被加總。
  14. 一種音源解碼器,用以產生依據申請專利範圍第1項至第13項之任一項之一音源解碼器(10)之一合成窗之一降尺度版本,其中E=2,使得該合成窗函數包含長度為2.N/F之之一核心半相關,並且該核心半相關係在長度為2.N/F之一半提醒之後,以及其中該頻時調變器(16)、該窗化器(18)與該時域混疊取消器(20)係實施以在一上升實施中並依據下面而合作:該頻時調變器(16)係限制針對各訊框(36)而使該低頻部分受到該逆轉換,該逆轉換具有長度(E+2).N/F之調變函數,其係在時間上延伸至各訊框與E+1個先前訊框,對與各訊框與一先前訊框一致之一轉換核心,以得到時間部分xk,n,n=0...2M-1同時M=N/F作為一取樣索引以及k作為一訊框索引;該窗化器(18)係針對各訊框(36)並依據zk,n=ωn.xk,n,n=0,...,2M-1而窗化該時間部分xk,n,以得到窗化時間部分zk,n,n=0...2M-1;該時域混疊取消器(20)係依據mk,n=zk,n+zk-1,n+M,n=0,...,M-1而產生中間時間部分mk(0),...mk(M-1);以及該音源解碼器包含一上升器(80),用以依據uk,n=mk,n+ln-M/2.mk-1,M-1-n,n=M/2,...,M-1以及uk,n=mk,n+lM-1-n.outk-1,M-1-n,n=0,...,M/2-1而得到該等訊框uk,n,n=0...M-1;其中,ln,n=0...M-1係為上升係數,並且其中ln,n=0...M-1以及ωn,n=0,...,2M-1係依靠該合成窗之係數wn,n=0...(E+2)M-1。
  15. 一種音源解碼器(10),用以在一第一取樣率並從一資料流(24)而解碼一音源訊號(22),該音源訊號係在一第二取樣率而被轉換編碼至在該資料流(24)中,該第一取樣率係為該第二取樣率之(1/F)th,該音源解碼器(10)包含:一接收器(12),用以接收該音源訊號之長度N之各訊框之N個頻譜係數(28); 一擷取器(14),用以針對各訊框而從該N個頻譜係數(28)擷取出長度N/F之一低頻部分;一頻時調變器(16),用以針對各訊框(36)而使該低頻部分受到具有在時間上延伸到各訊框與一先前訊框之長度2.N/F之調變函數之一逆轉換,以得到長度2.N/F之一時間部分;一窗化器(18),用以針對各訊框(36)而窗化依據zk,nn.xk,n,n=0,...,2M-1之該時間部分xk,n,以得到一窗化時間部分zk,n,n=0...2M-1;一時域混疊取消器(20),用以依據mk,n=zk,n+zk-1,n+M,n=0,...,M-1而產生中間時間部分mk(0),...mk(M-1);該上升器(80),用以依據uk,n=mk,n+ln-M/2.mk-1,M-1-n,n=M/2,...,M-1以及uk,n=mk,n+lM-1-n.outk-1,M-1-n,n=0,...,M/2-1而得到該音源訊號之訊框uk,n,n=0...M-1;其中,ln,n=0...M-1係為上升係數;其中,該逆轉換係為一逆MDCT或逆MDST;以及其中,ln,n=0...M-1與ωn,n=0,...,2M-1係依靠一合成窗之係數wn,n=0...(E+2)M-1,並且該合成窗係為長度4.N之一參考合成窗之一降取樣版本,其係藉由一因子F並藉由在長度1/4.N之區段中之一區段內插而被降取樣。
  16. 一種用以產生依據申請專利範圍第1項至第15項之任一項之一音源解碼器(10)之一合成窗之一降尺度版本之裝置,其中該裝置係用以藉由一因子F並藉由在相同長度之4.(E+2)個區段中之一區段內插而降取樣長度(E+2).N之一參考合成窗。
  17. 一種用以產生依據申請專利範圍第1項至第16項之任一項之一音源解碼器(10)之一合成窗之一降尺度版本之方法,其中該方法係包含藉由一因子F並藉由在相同長度之4.(E+2)個區段中之一區段內插而降取樣長度(E+2).N之一參考合成窗。
  18. 一種用以在一第一取樣率並從一資料流(24)而解碼一音源訊號(22)之方 法,該音源訊號係在一第二取樣率而被轉換編碼至在該資料流(24)中,該第一取樣率係為該第二取樣率之(1/F)th,該方法包含:接收該音源訊號之長度N之各訊框之N個頻譜係數(28);針對各訊框而從該N個頻譜係數(28)擷取出長度N/F之一低頻部分;針對各訊框(36)而執行一頻時調變,使該低頻部分受到具有在時間上延伸到各訊框與E+1個先前訊框之長度(E+2).N/F之調變函數之一逆轉換,以得到長度(E+2).N/F之一時間部分;針對各訊框(36)並藉由使用長度(E+2).N/F之一合成窗而窗化該時間部分,該合成窗包含在其一領先端之長度1/4.N/F之一零部分並具有在該合成窗之一時間區間內之一峰值,該時間區間係接續該零部分並具有長度7/4.N/F,使得該窗化器得到長度(E+2).N/F之一窗化時間部分;以及執行一時域混疊取消器,使該等訊框之該窗化時間部分受到一重疊-相加處理,使得一現在訊框之該窗化時間部分之長度(E+1)/(E+2)之一落後端部分係重疊於一先前訊框之該窗化時間部分之長度(E+1)/(E+2)之一領先端,其中該逆轉換係為一逆MDCT或逆MDST,以及其中,該合成窗係為長度(E+2).N之一參考合成窗之一降取樣版本,其係藉由一因子F並藉由在長度1/4.N之區段內之一區段內插而被降取樣。
  19. 一種當執行於一電腦上時,具有執行依據申請專利範圍第16項或第18項之一方法之一程式碼之電腦程式。
TW105117582A 2015-06-16 2016-06-03 降尺度解碼器、解碼方法及電腦程式 TWI611398B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
??15172282.4 2015-06-16
EP15172282 2015-06-16
??15189398.9 2015-10-12
EP15189398.9A EP3107096A1 (en) 2015-06-16 2015-10-12 Downscaled decoding

Publications (2)

Publication Number Publication Date
TW201717193A TW201717193A (zh) 2017-05-16
TWI611398B true TWI611398B (zh) 2018-01-11

Family

ID=53483698

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105117582A TWI611398B (zh) 2015-06-16 2016-06-03 降尺度解碼器、解碼方法及電腦程式

Country Status (20)

Country Link
US (10) US10431230B2 (zh)
EP (11) EP3107096A1 (zh)
JP (10) JP6637079B2 (zh)
KR (10) KR102412485B1 (zh)
CN (6) CN114255768A (zh)
AR (5) AR105006A1 (zh)
AU (1) AU2016278717B2 (zh)
BR (1) BR112017026724B1 (zh)
CA (6) CA2989252C (zh)
ES (1) ES2950408T3 (zh)
FI (1) FI3311380T3 (zh)
HK (1) HK1247730A1 (zh)
MX (1) MX2017016171A (zh)
MY (1) MY178530A (zh)
PL (1) PL3311380T3 (zh)
PT (1) PT3311380T (zh)
RU (1) RU2683487C1 (zh)
TW (1) TWI611398B (zh)
WO (1) WO2016202701A1 (zh)
ZA (1) ZA201800147B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017129270A1 (en) * 2016-01-29 2017-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal
CN115050378B (zh) * 2022-05-19 2024-06-07 腾讯科技(深圳)有限公司 音频编解码方法及相关产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0957580A1 (en) * 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
US20050047793A1 (en) * 2003-08-28 2005-03-03 David Butler Scheme for reducing low frequency components in an optical transmission network
US20060265087A1 (en) * 2003-03-04 2006-11-23 France Telecom Sa Method and device for spectral reconstruction of an audio signal
TW201230010A (en) * 2010-08-12 2012-07-16 Fraunhofer Ges Forschung Resampling output signals of QMF based audio codecs
US20150025896A1 (en) * 2012-03-23 2015-01-22 Dolby International Ab Enabling Sampling Rate Diversity In A Voice Communication System

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729556A (en) * 1993-02-22 1998-03-17 Texas Instruments System decoder circuit with temporary bit storage and method of operation
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
WO2004008806A1 (en) 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
JP4626261B2 (ja) * 2004-10-21 2011-02-02 カシオ計算機株式会社 音声符号化装置及び音声符号化方法
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
EP4325723A3 (en) * 2006-10-25 2024-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating time-domain audio samples
WO2008056775A1 (fr) * 2006-11-10 2008-05-15 Panasonic Corporation Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre
EP2077550B8 (en) 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR101661374B1 (ko) * 2009-02-26 2016-09-29 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치 및 이들 방법
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
ES2441069T3 (es) 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
MX2012004648A (es) 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
WO2011048118A1 (en) 2009-10-20 2011-04-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
TW201214415A (en) * 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
CN103282958B (zh) * 2010-10-15 2016-03-30 华为技术有限公司 信号分析器、信号分析方法、信号合成器、信号合成方法、变换器和反向变换器
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
CN102419978B (zh) * 2011-08-23 2013-03-27 展讯通信(上海)有限公司 音频解码器、音频解码的频谱重构方法及装置
EP2777041B1 (en) * 2011-11-10 2016-05-04 Nokia Technologies Oy A method and apparatus for detecting audio sampling rate
US9280975B2 (en) * 2012-09-24 2016-03-08 Samsung Electronics Co., Ltd. Frame error concealment method and apparatus, and audio decoding method and apparatus
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
CN105378835B (zh) * 2013-02-20 2019-10-01 弗劳恩霍夫应用研究促进协会 使用依赖瞬态位置的重叠对音频信号编码或译码的设备及方法
CN104078048B (zh) * 2013-03-29 2017-05-03 北京天籁传音数字技术有限公司 一种声音解码装置及其方法
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
KR102150496B1 (ko) * 2013-04-05 2020-09-01 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
WO2014161996A2 (en) * 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN103632674B (zh) * 2013-12-17 2017-01-04 魅族科技(中国)有限公司 一种音频信号的处理方法及装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
US10304471B2 (en) 2014-10-24 2019-05-28 Dolby International Ab Encoding and decoding of audio signals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
EP0957580A1 (en) * 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US20060265087A1 (en) * 2003-03-04 2006-11-23 France Telecom Sa Method and device for spectral reconstruction of an audio signal
US20050047793A1 (en) * 2003-08-28 2005-03-03 David Butler Scheme for reducing low frequency components in an optical transmission network
TW201230010A (en) * 2010-08-12 2012-07-16 Fraunhofer Ges Forschung Resampling output signals of QMF based audio codecs
US20150025896A1 (en) * 2012-03-23 2015-01-22 Dolby International Ab Enabling Sampling Rate Diversity In A Voice Communication System

Also Published As

Publication number Publication date
US20220051684A1 (en) 2022-02-17
EP4239633A3 (en) 2023-11-01
EP4235658A3 (en) 2023-09-06
CA3150675C (en) 2023-11-07
CA3150666A1 (en) 2016-12-22
JP2021099498A (ja) 2021-07-01
FI3311380T3 (fi) 2023-08-24
EP4386746A2 (en) 2024-06-19
PT3311380T (pt) 2023-08-07
KR102502644B1 (ko) 2023-02-23
AR120506A2 (es) 2022-02-16
JP7323679B2 (ja) 2023-08-08
CA3150666C (en) 2023-09-19
CN108028046B (zh) 2022-01-11
US11341980B2 (en) 2022-05-24
CN108028046A (zh) 2018-05-11
TW201717193A (zh) 2017-05-16
AR105006A1 (es) 2017-08-30
EP4239633A2 (en) 2023-09-06
JP2023159096A (ja) 2023-10-31
EP4239631A2 (en) 2023-09-06
US20200051578A1 (en) 2020-02-13
AR119537A2 (es) 2021-12-22
KR102660436B1 (ko) 2024-04-25
BR112017026724B1 (pt) 2024-02-27
EP4239632A2 (en) 2023-09-06
US11062719B2 (en) 2021-07-13
JP2020064312A (ja) 2020-04-23
RU2683487C1 (ru) 2019-03-28
CA3150637A1 (en) 2016-12-22
KR20220093253A (ko) 2022-07-05
CN114255768A (zh) 2022-03-29
CA3150643A1 (en) 2016-12-22
EP4375997A2 (en) 2024-05-29
PL3311380T3 (pl) 2023-10-02
US11341979B2 (en) 2022-05-24
CA2989252C (en) 2023-05-09
MY178530A (en) 2020-10-15
AU2016278717A1 (en) 2018-01-04
KR20220093252A (ko) 2022-07-05
ES2950408T3 (es) 2023-10-09
AR119541A2 (es) 2021-12-29
KR20180021704A (ko) 2018-03-05
CA3150637C (en) 2023-11-28
KR102412485B1 (ko) 2022-06-23
US20220051683A1 (en) 2022-02-17
EP3311380B1 (en) 2023-05-24
KR102131183B1 (ko) 2020-07-07
JP2022130446A (ja) 2022-09-06
US10431230B2 (en) 2019-10-01
KR20220093254A (ko) 2022-07-05
EP3311380A1 (en) 2018-04-25
WO2016202701A1 (en) 2016-12-22
AR120507A2 (es) 2022-02-16
CA3150683C (en) 2023-10-31
KR20230145539A (ko) 2023-10-17
KR102502643B1 (ko) 2023-02-23
AU2016278717B2 (en) 2019-02-14
MX2017016171A (es) 2018-08-15
EP3107096A1 (en) 2016-12-21
KR20220095247A (ko) 2022-07-06
CA2989252A1 (en) 2016-12-22
CN114255772A (zh) 2022-03-29
CN114255769A (zh) 2022-03-29
JP2022130448A (ja) 2022-09-06
EP4239632A3 (en) 2023-11-01
US11670312B2 (en) 2023-06-06
US20220051682A1 (en) 2022-02-17
JP6637079B2 (ja) 2020-01-29
JP7322249B2 (ja) 2023-08-07
US11341978B2 (en) 2022-05-24
EP4365895A2 (en) 2024-05-08
CA3150675A1 (en) 2016-12-22
ZA201800147B (en) 2018-12-19
KR102660438B1 (ko) 2024-04-24
JP2023164893A (ja) 2023-11-14
US20240005931A1 (en) 2024-01-04
BR112017026724A2 (zh) 2018-08-21
EP4235658A2 (en) 2023-08-30
CA3150683A1 (en) 2016-12-22
KR102660437B1 (ko) 2024-04-24
EP4239631A3 (en) 2023-11-08
JP2022130447A (ja) 2022-09-06
JP2023164894A (ja) 2023-11-14
CN114255771A (zh) 2022-03-29
US20230360657A1 (en) 2023-11-09
EP4231287A1 (en) 2023-08-23
JP7089079B2 (ja) 2022-06-21
US20210335371A1 (en) 2021-10-28
HK1247730A1 (zh) 2018-09-28
JP6839260B2 (ja) 2021-03-03
KR20230145250A (ko) 2023-10-17
KR20230145252A (ko) 2023-10-17
KR102588135B1 (ko) 2023-10-13
US20180366133A1 (en) 2018-12-20
JP2018524631A (ja) 2018-08-30
KR102503707B1 (ko) 2023-02-28
US20230360658A1 (en) 2023-11-09
US20230360656A1 (en) 2023-11-09
CN114255770A (zh) 2022-03-29
KR20230145251A (ko) 2023-10-17
JP7322248B2 (ja) 2023-08-07
KR20200085352A (ko) 2020-07-14
JP2023164895A (ja) 2023-11-14
EP4386745A2 (en) 2024-06-19

Similar Documents

Publication Publication Date Title
US20230360657A1 (en) Downscaled decoding