TWI398854B - 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法 - Google Patents

用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法 Download PDF

Info

Publication number
TWI398854B
TWI398854B TW097136172A TW97136172A TWI398854B TW I398854 B TWI398854 B TW I398854B TW 097136172 A TW097136172 A TW 097136172A TW 97136172 A TW97136172 A TW 97136172A TW I398854 B TWI398854 B TW I398854B
Authority
TW
Taiwan
Prior art keywords
windowing
conversion
factors
dct
idct
Prior art date
Application number
TW097136172A
Other languages
English (en)
Other versions
TW200926146A (en
Inventor
Ravi Kiran Chivukula
Yuriy Reznik
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW200926146A publication Critical patent/TW200926146A/zh
Application granted granted Critical
Publication of TWI398854B publication Critical patent/TWI398854B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Discrete Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Analogue/Digital Conversion (AREA)

Description

用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法
以下描述大體係關於編碼器及解碼器,且詳言之係關於用於話音及音訊編碼解碼器之有效MDCT/IMDCT實施。本專利申請案主張2007年9月19日申請之標題為"Design of Fast MDCT/IMDCT Module for G.VBR Codec"的美國臨時申請案第60/973,709 號[檔案號碼072441P2]及2007年11月20日申請之標題為"Design of Fixed-Point MDCT/IMDCT Module for G.VBR Codec"的美國臨時申請案第60/989,400 號[檔案號碼080302P1]之優先權,兩者讓與給其受讓人且在此以引用的方式明確併入本文中。
音訊編碼之一目標為將音訊信號壓縮為所要之有限制資訊量且同時儘可能多地保持原始聲音品質。在編碼過程中,時域中之音訊信號被轉換至頻域中,且對應之解碼過程與此操作相反。
作為此編碼過程之部分,信號可藉由修改式離散餘弦轉換(MDCT)進行處理。修改式離散餘弦轉換(MDCT)為基於類型IV離散餘弦轉換(DCT-IV)之傅立葉相關轉換,具有區塊經重疊以使得一區塊之末端與下一區塊的開端重合之額外性質。此重疊有助於避免頻疊假影(aliasing artifact),且與DCT之能量集中品質一起使得MDCT對於信號壓縮應用尤其具吸引力。
MDCT轉換亦已在語音壓縮中得到應用。ITU-T G.722.1及G.722.1C聲碼器將MDCT應用於輸入語音信號,而更近的ITU-T G.729.1及G.718演算法使用其來處理在使用碼激勵線性預測(CELP)編碼器之後餘留之剩餘信號。上文提及之聲碼器以8kHz或16kHz之輸入取樣率,及10或20毫秒之訊框進行操作。因此,其MDCT濾波器組為160點或者320點轉換。
然而,若將來語音編碼器將支援區塊交換功能性,則亦可能需要對整數倍降低取樣大小(160點、80點、40點)之支援。
以下呈現對一或多項實施例之簡化概述以便提供對一些實施例之基本理解。此概述並非所有預期實施例之廣泛綜述,且既不意欲識別所有實施例之關鍵或重要要素,亦不意欲描繪任何或所有實施例之範疇。其獨特目的在於以簡化形式呈現一或多項實施例的一些概念以作為稍後呈現之更為詳細之描述的序言。
提供編碼方法及/或裝置用於計算轉換值。接收表示音訊信號之時域輸入值。可產生或獲得合併來自轉換運算及定窗運算之因子以獲得逐段對稱定窗因子之修改式定窗函數。儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合。所儲存之逐段對稱定窗因子的子集可包括用於定窗因子之每一逐段對稱集合的獨特因子之至少一半。在轉換輸入值之前,可將重新建構之逐段對稱定窗因子的完整集合應用至輸入值。可使用修改式離散餘弦轉換(MDCT)將輸入值轉換為頻譜係數,該MDCT遞歸地分裂為離散餘弦轉換類型IV(DCT-IV)、離散餘弦轉換類型II(DCT-II)中之至少一者,或DCT-IV及DCT-II兩者,其中每一此種轉換具有比MDCT更小之維數,其中MDCT之至少一些乘法運算與應用至輸入值之先前定窗運算合併。DCT-II可為可實施不同大小之MDCT之5點轉換。MDCT可使用相同DCT-II實施320點、160點、80點、40點轉換中之至少兩者。對於固定點實施而言,亦可對來自定窗函數之輸出執行動態範圍估計及再正規化。
提供解碼方法及/或裝置用於計算轉換值。接收表示音訊信號之頻譜係數。可使用逆修改式離散餘弦轉換(IMDCT)將頻譜係數轉換為時域輸出值,該IMDCT遞歸地分裂為反離散餘弦轉換類型IV(IDCT-IV)、反離散餘弦轉換類型II(IDCT-II)中之至少一者,或IDCT-IV及IDCT-II兩者,其中每一此種反轉換具有比IMDCT更小之維數,其中IMDCT之至少一些乘法運算與應用至輸出值之隨後定窗運算合併。舉例而言,IDCT-II為實施不同大小之IMDCT之5點反轉換。IMDCT可使用相同核心IDCT-II實施320點、160點、80點、40點反轉換中之至少兩者。另外,可產生合併來自轉換運算及定窗運算之因子以獲得逐段對稱定窗因子之修改式定窗函數。可儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合。所儲存之逐段對稱定窗因子的子集包括用於定窗因子之每一逐段對稱集合的獨特因子之至少一半。可在轉換頻譜係數之後將重新建構的逐段對稱定窗因子之完整集合應用至輸出值。對於固定點實施而言,可對來自定窗函數之輸出執行動態範圍估計及再正規化。
又一實例證明用於執行定窗運算之方法及/或裝置。可產生合併來自轉換階段及定窗階段之因子以獲得逐段對稱定窗因子之修改式定窗函數。逐段對稱定窗因子可經分裂以獲得逐段對稱定窗因子之子集且減小獨特因子之總數目。可儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合。所儲存之逐段對稱定窗因子的子集包括用於定窗因子之每一逐段對稱集合的獨特因子之至少一半。隨後,可接收表示音訊信號之輸入值。可將重新建構之逐段對稱定窗因子的完整集合應用至輸入值以提供經定窗之輸出值。
在一實例中,定窗階段可在轉換階段之前發生。轉換階段可實施修改式離散餘弦轉換(MDCT),該MDCT遞歸地分裂為離散餘弦轉換類型IV(DCT IV)、離散餘弦轉換類型II(DCT II)中之至少一者,或DCT IV及DCT II兩者,其中每一此種轉換具有比MDCT更小之維數。轉換階段因子可為餘弦因子。
在另一實例中,定窗階段可在轉換階段之後發生。轉換階段可實施逆修改式離散餘弦轉換(IMDCT),該IMDCT遞歸地分裂為反離散餘弦轉換類型IV(IDCT IV)、反離散餘弦轉換類型IV(IDCT IV)中之至少一個,或IDCT IV及IDCT II兩者,其中每一此種轉換具有比IMDCT更小之維數。
當結合圖式(其中相同參考符號貫穿全文對應地識別)進行理解時,各種特徵、性質及優點可自下文闡述之詳細描述而變得顯而易見。
現參看圖式描述各種實施例,其中相同參考數字始終用以指代相同元件。在以下描述中,出於解釋之目的,闡述眾多特定細節以便提供對一或多項實施例之透徹理解。然而,可顯而易見,可在無此等特定細節的情況下實踐該(該等)實施例。在其他實例中,以方塊圖形式展示眾所熟知之結構及裝置以便促進描述一或多項實施例。
綜述
一項特徵提供藉由運用隔離自左乘將N點MDCT轉換映射至較小大小之N/2點DCT-IV及DCT-II轉換而實施該N點MDCT轉換,隔離自左乘可被移動至隨後定窗階段。亦即,定窗運算可分別與核心MDCT/IMDCT函數中之最初/最末階段乘法合併,因此減小乘法之總數目。另外,相對於使用於音訊編碼解碼器中許多現存MDCT設計之DCT-IV或FFT核心,MDCT可藉由利用統一按比例調整的5點DCT-II核心函數(使用至多5個非顯明乘法)而系統地按2之因子整數倍降低取樣。
修改式定窗階段提供可使用一半因子儲存之逐段對稱因子。此種特徵提供複雜性之可觀減小及比先前技術更少之記憶體使用。
編碼解碼器結構
圖1為說明可包括MDCT分析濾波器組之編碼器的實例之方塊圖。編碼器102可接收輸入音訊信號104。MDCT分析濾波器組106(亦即,基於類型IV離散餘弦轉換之修改式離散餘弦轉換)操作以將時域輸入音訊信號104分解為複數個子頻帶信號,且將信號變換至頻域,其中每一子頻帶信號變換為每子頻帶每區塊之轉換係數。接著,所得信號由量化器108予以量化且由熵編碼器110予以編碼,以產生經數位化之音訊信號之位元流112。根據一實例,MDCT分析濾波器組106可由定窗函數114、轉換116(例如,時域至頻域)及/或按比例調整函數118予以實施。包括定窗函數114、轉換116及/或按比例調整函數116之MDCT分析濾波器組106可用硬體(例如,作為處理器、電路、可程式化邏輯裝置等)、軟體(例如,可由處理器執行之指令)及/或其組合予以實施。
圖2為說明可包括IMDCT合成濾波器組之解碼器的實例之方塊圖。解碼器202可接收位元流204。熵解碼器206對位元流204進行解碼,位元流204接著由解量化器208解量化以產生頻域信號。IMDCT合成濾波器組210(亦即,基於類型IV離散餘弦轉換之逆修改式離散餘弦轉換)操作以將頻域信號104變換回至時域音訊信號212。IMDCT合成濾波器組210可反轉MDCT分析濾波器組106之操作。根據一實例,IMDCT合成濾波器組210可由按比例調整函數214、反轉換216(例如,頻域至時域)及定窗加重疊及加法函數218予以實施。包括按比例調整函數214、反轉換216及/或定窗函數218之IMDCT合成濾波器組210可用硬體(例如,作為處理器、電路、可程式化邏輯裝置等)、軟體(例如,可由處理器執行之指令)及/或其組合予以實施。
使用DCT-IV及DCT-II實施MDCT
根據一特徵,轉換116(圖1)及反轉換216(圖2)可分別由可實施為一或多個DCT-II(及IDCT-II)轉換之一或多個DCT-IV(及IDCT-IV)轉換來整數倍降低取樣及實施。
修改式離散餘弦轉換(MDCT)可由以下方程式界定:
類似地,反MDCT(IMDCT)可由以下方程式界定:
其中{x(n),n=0,1,…N-1,表示樣本之輸入順序,N指示訊框長度,X(k)為所得之MDCT係數,且表示重新建構之輸出。
使用矩陣計數法,MDCT轉換可由矩陣M表示:
因此,X=Mx且,其中x表示輸入樣本之矩陣[x(0),...,x(N-1)]T ,X表示所得MDCT係數之矩陣,且表示重新建構之輸出之矩陣
為實施MDCT轉換,MDCT轉換可被映射至N/2點DCT-IV核心函數中。舉例而言,圖1之轉換116可實施為一或多個N/2點DCT-IV轉換。
DCT-IV轉換可界定為:
與此同時,IDCT-IV轉換可界定為:
MDCT轉換可被映射至N/2點DCT-IV轉換,如
且IMDCT轉換可被映射至N/2點IDCT-IV轉換,如
其中
其中IN/4 為N/4×N/4單位矩陣,且JN/4 為N/4×N/4反序矩陣,且矩陣S界定為
為N/2×N/2 DCT-IV矩陣,其可界定為
藉由使用DCT-IV矩陣之對稱及對合性質,DCT-IV矩陣可被映射至DCT-II轉換中。DCT-II轉換可被界定為:
同樣,IDCT-II轉換可被界定為:
其中若k=0,則λ(k)=1/,否則λ(k)等於1。
圖3說明可基於N/2點DCT-IV核心函數實施MDCT轉換之方式。MDCT轉換可實施為將時域輸入樣本轉換為頻域輸出樣本之編碼器之部分。對於輸入順序X(3N/4)至X(N/4)304而言,MDCT轉換可由餘弦因子306繼之以DCT-IV轉換302來表示以產生輸出308。如下文所述,餘弦因子306可被吸收於編碼器內之先前定窗階段/函數中。
類似地,圖4說明可基於N/2點IDCT-IV核心函數實施IMDCT轉換製法方式。IMDCT轉換可實施為將頻域輸入樣本轉換為時域輸出樣本之解碼器之部分。對於輸入順序X(0)至X(N/2-1)404而言,IMDCT轉換可由IDCT-IV轉換402繼之以餘弦因子406來表示以產生輸出408。如下文所述,餘弦因子406可被吸收於解碼器內之隨後定窗階段/函數中。注意,假定在編碼器及解碼器兩者處使用相同定窗函數,則圖4中所說明之IMDCT映射及餘弦因子用來反轉MDCT映射(圖3)之操作。
餘弦因子306及406在此等映射(圖3及圖4)兩者中之使用提供在零值處或靠近零值處之數值穩定性,其不可用其他類型之因子(例如,反餘弦因子)達成。
注意,向MDCT及IMDCT轉換之輸入可被處理為具有複數個資料點之訊框或區塊。因此,為使聲碼器(例如,G.VBR編碼解碼器)支援訊框長度小於320之資料區塊,需要所整數倍降低取樣大小之轉換。對於具有訊框長度160、80、40等之區塊而言,觀察到此等大小全部為5之倍數。因此,最末之不可減小之(藉由整數倍降低取樣技術)區塊大小可使用大小為5之轉換。觀察到,在整數倍降低取樣技術方面,設計5點DCT-II轉換比DCT-IV或者FFF轉換更加有效。
DCT-IV轉換可被映射至DCT-II轉換,如
其中D為具有以下元素之對角矩陣
可為N/2×N/2DCT-II矩陣,其可界定為
圖5為說明可實施為編碼器MDCT轉換之部分的5點DCT-II轉換之因子分解的圖解。注意,此轉換中之因子α為二進有理數,且因此與其之相乘僅為二元移位操作。可使用平面旋轉及5個乘法或藉由因子分解平面旋轉而使用4個乘法,或者使用提昇步驟來實施此5點轉換。對於輸入x 502之5點順序而言,可使用4個非顯明乘法及13個加法或者5個乘法及13個加法產生5點DCT-II轉換之輸出CII 504。DCT-II轉換輸出CII 產生為:
圖6為說明可實施為解碼器IMDCT轉換之部分的5點IDCT-II轉換之圖解。亦即,此IDCT-II轉換可用以對解碼器IMDCT轉換實施IDCT-IV轉換(圖4)。其可使用平面旋轉及5個乘法或藉由因子分解平面旋轉而使用4個乘法,或者使用提昇步驟而實施。對於輸入CII 602之5點順序而言,可使用如所說明之4個非顯明乘法及13個加法或者5個非顯明乘法及12個加法來產生5點IDCT-II轉換之輸出604。IDCT-II轉換輸出產生為:
圖7為說明可使用兩個DCT-II轉換(N=5點)實施長度N=10點之DCT-IV轉換之方式的實例之方塊圖。對於十個輸入點x(0),…,x(9)702之順序而言,10點DCT-IV轉換可由兩個5點DCT-II轉換704及706及因子708實施以產生輸出係數CII (0),…,CII (9)710。以此方式,核心5點DCT-II轉換可用來實施能夠處理160、80、40等訊框長度之轉換。
圖8為說明可使用兩個IDCT-II轉換(N=5點)實施長度N=10點之IDCT-IV轉換之方式的實例之方塊圖。對於十個輸入點CII (0),…,CII (9)802之順序而言,可由兩個5點DCT-II轉換804及806及因子808實施10點IDCT-IV轉換以產生輸出係數(0),…,(9)810。以此方式,核心5點IDCT-II轉換可用來實施能夠處理160、80、40等訊框長度之轉換。
將乘法因子合併於定窗階段中
MDCT轉換常常用於話音及音訊編碼演算法(諸如G.VBR編碼解碼器)中,且實質上為與定窗函數h(n)組合之經按比例調整MDCT:
其中f(n)指示輸入資料樣本,h(n)為定窗函數,且F(k)指示輸出MDCT頻譜係數。舉例而言,定窗函數h(n)可為正弦函數:
如先前所論述,將DCT-IV轉換映射至MDCT轉換中所涉及的自左乘因子(例如,圖3中之306),以及將IDCT-IV轉換映射至IMDCT轉換中所涉及的自右乘因子(例如,圖4中之406)可合併於其各別定窗階段中。舉例而言,定窗函數可為正弦函數,例如,其可界定為:
此定窗函數h(n)及轉換因子之組合產生修改式定窗函數:
對於0n<N/4而言:
對於N/4n<3N/4而言:
此等合併或組合之定窗因子可經預先計算及/或儲存。在圖3中之餘弦因子306及圖4中之餘弦因子406之情況下,此等提供曾合併之片段因子。因此,對於修改式定窗函數而言,僅需要儲存因子之子集(例如,一半)。在對值進行定窗運算期間,可根據其逐段對稱性質擷取及使用所儲存因子之子集。
圖9為說明定窗函數(方程式20)之逐段對稱性質之圖。與對稱正弦窗口相比,由於僅儲存定窗因子902及904之一半,故可使用相同量之記憶體儲存定窗因子。在此實例中,對於N=640樣本/因子及所說明之逐段對稱窗口而言,160個樣本之第一集合(亦即,0至N/4-1)可僅由前80個樣本或因子902(由於此係對稱部分)表示。同樣,480個樣本/因子(亦即,N/4至N)之第二集合可僅由前240個樣本或因子904表示。因此,僅儲存因子之一半,藉此節省記憶體空間。另外,由於樣本點之此減小減小用以擷取定窗因子的記憶體存取之數目,故其亦可導致更快之處理。
使用MDCT轉換進行編碼之實例
圖10為說明用於計算轉換值之裝置之方塊圖。裝置1002可包括輸入模組1006、定窗模組1010及/或轉換模組1014。輸入模組1006可經調適以接收音訊信號1004且提供表示音訊信號之時域輸入值1008。定窗模組1010可產生合併來自轉換運算及定窗運算之因子以獲得逐段對稱定窗因子之修改式定窗函數。舉例而言,定窗模組1010可包括合併模組1018、因子分裂模組1019、儲存模組1020及/或定窗函數1022。合併模組1018可執行合併來自轉換運算及定窗運算之因子以獲得逐段對稱定窗因子之函數。舉例而言,餘弦因子306(圖3)可與其他定窗函數因子合併。因子分裂模組1019可接著獲得逐段對稱定窗因子之子集(如圖9中所說明)。儲存模組1020可接著儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合。舉例而言,逐段對稱定窗因子之子集可包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。定窗模組1010(經由定窗函數1022)可進一步經組態以在轉換輸入值之前將重新建構的逐段對稱定窗因子之完整集合應用至輸入值1008(藉此獲得經定窗之輸入值1012)。
轉換模組1014可使用(例如)修改式離散餘弦轉換(MDCT)將經定窗之輸入值1012轉換為頻譜係數1016。MDCT可遞歸地分裂為離散餘弦轉換類型IV(DCT-IV)、離散餘弦轉換類型II(DCT-II)中之至少一個,或DCT-IV及DCT-II兩者,其中每一此種轉換具有比MDCT更小之維數,其中MDCT之至少一些乘法運算與應用至輸入值之先前定窗運算合併。在一實例中,DCT-II可為實施不同大小之MDCT(諸如圖5中說明之DCT-II)之5點轉換。MDCT可使用相同核心DCT-II實施320點、160點、80點、40點轉換中之至少兩者。裝置1002之組件可實施為硬體、軟體及/或其組合。舉例而言,裝置1002可為實施其組件或模組之功能之處理器及/或電路。
圖11說明用於使用基於核心DCT-II轉換之MDCT轉換對信號進行編碼的方法之實例。可接收表示音訊信號之時域輸入值(1102)。舉例而言,類比音訊信號(例如,話音信號、音樂、視訊等)可經取樣以獲得輸入值。
在一實例中,可產生合併來自轉換運算及定窗運算之因子以獲得逐段對稱定窗因子之修改式定窗函數(1104)。接著儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合(1106)。在轉換輸入值之前,可將重新建構的逐段對稱定窗因子之完整集合應用至輸入值(1108)。舉例而言,圖3中(參考306)說明之用於MDCT轉換之餘弦因子可應用於先前定窗運算處。逐段對稱定窗因子之子集可包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。
可使用修改式離散餘弦轉換(MDCT)將所得(經定窗)輸入值(來自定窗運算)轉換為頻譜係數,該MDCT遞歸地分裂為離散餘弦轉換類型IV(DCT-IV)、離散餘弦轉換類型II(DCT-II)中之至少一者,或DCT-IV及DCT-II兩者,其中每一此種轉換具有比MDCT更小之維數,其中MDCT之至少一些乘法運算與應用至輸入值之先前定窗運算合併(1110)。舉例而言,可基於離散餘弦轉換類型IV(DCT-IV)實施MDCT,該DCT-IV係基於核心DCT-II(例如,圖5中之轉換)而實施。DCT-II可為實施不同大小之MDCT之5點轉換。舉例而言,MDCT可使用相同核心DCT-II實施320點、160點、80點、40點轉換中之至少兩者。核心DCT-II可包括五(5)個乘法運算及12個加法或四(4)個乘法運算及13個加法。
另外,對於固定點實施而言,可對來自定窗函數之輸出執行動態範圍估計及/或再正規化(1112)。在一實例中,可藉由移位所有餘下之中間值(緩衝器)進行再正規化,從而將至少一位元保留為頂部空間以防止轉換中隨後階段中之溢流。
使用IMDCT轉換進行解碼之實例
圖12為說明用於計算轉換值之裝置之方塊圖。裝置1202可包括輸入模組1206、反轉換模組1208及/或定窗模組1212。反轉換模組1208可經調適以將頻譜係數1204轉換為輸出值1210。舉例而言,反轉換模組可使用逆修改式離散餘弦轉換(IMDCT)將頻譜係數轉換為時域輸出值1210,該IMDCT遞歸地分裂為反離散餘弦轉換類型IV(IDCT-IV)、反離散餘弦轉換類型II(IDCT-II)中之至少一者,或IDCT-IV及IDCT-II兩者,其中每一此種反轉換具有比IMDCT更小之維數,其中IMDCT之至少一些乘法運算與應用至輸出值1210之隨後定窗運算1212合併。
定窗模組1212可產生合併來自轉換運算及定窗函數之因子以獲得逐段對稱定窗因子之修改式定窗函數。舉例而言,定窗模組1212可包括合併模組1218、因子分裂模組1219、儲存模組1220及/或定窗函數1222。合併模組1218可執行合併來自反轉換運算及定窗運算以獲得逐段對稱定窗因子之因子之函數。舉例而言,餘弦因子406(圖4)可與其他定窗函數因子合併。因子分裂模組1219可接著獲得逐段對稱定窗因子之子集(如圖9中所說明)。儲存模組1220可接著儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合。舉例而言,逐段對稱定窗因子之子集可包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。定窗模組1212(經由定窗函數1222)可進一步經組態以在頻譜係數1204之轉換之後將重新建構的逐段對稱定窗因子之完整集合應用至輸出值1210(藉此獲得經定窗之輸出值1214)。裝置1202之組件可實施為硬體、軟體及/或其組合。舉例而言,裝置1202可為實施其組件或模組之功能的處理器及/或電路。
圖13說明用於使用基於核心IDCT-II轉換之IMDCT轉換對信號進行解碼的方法之實例。接收或獲得表示音訊信號之頻譜係數(1302)。可使用逆修改式離散餘弦轉換(IMDCT)將頻譜係數轉換為時域輸出值,該IMDCT遞歸地分裂為反離散餘弦轉換類型IV(IDCT-IV)、反離散餘弦轉換類型II(IDCT-II)中之至少一者,或IDCT-IV及IDCT-II兩者,其中每一此種反轉換具有比IMDCT更小之維數,其中IMDCT之至少一些乘法運算與應用至輸出值之隨後定窗運算合併(1304)。核心IDCT-II可為實施不同大小之IMDCT之5點反轉換。IMDCT使用相同核心IDCT-II實施320點、160點、80點、40點反轉換中之至少兩者。在各種實施中,IDCT-II可包括至多五(5)個乘法操作及12個加法或四(4)個乘法操作及13個加法。
另外,可產生合併來自轉換運算及定窗運算之因子以獲得逐段對稱定窗因子之修改式定窗函數(1306)。可儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合(1308)。逐段對稱定窗因子之所儲存子集可包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。在轉換頻譜係數之後可接著將重新建構的逐段對稱定窗因子之完整集合應用至輸出值(1310)。
視需要,對於固定點實施而言,可對至定窗函數之輸入執行動態範圍估計及再正規化(1305)。可在MDCT至DCT-IV映射中之所有遞歸地處理的係數間減法之後執行動態範圍估計及再正規化。可藉由移位所有餘下之中間值(位元移位)進行再正規化,從而將至少兩個位元保留為頂部空間以防止隨後轉換階段中之溢流。為補償動態範圍擴展,IMDCT轉換中之所有中間階段可執行其所得數量的一個位元之右移位。
逐段對稱定窗因子之儲存
圖14為說明用於執行定窗運算之裝置之方塊圖。裝置1402可包括合併模組1404、因子分裂模組1405、儲存模組1406、接收器模組1408及/或定窗模組1410。合併模組1404可組態或產生合併來自轉換階段之因子1412及來自定窗階段之因子1414以獲得逐段對稱定窗因子1420之修改式定窗函數。因子分裂模組1405可將逐段對稱定窗因子1420之完整集合分裂為逐段對稱定窗因子之子集1423。因子之此種分裂說明於(例如)圖9中。儲存模組1406可儲存逐段對稱定窗因子之子集1423,自該子集可重新建構逐段對稱定窗因子1420之完整集合。接收器模組1408可接收表示音訊信號之輸入值1416。定窗模組1410可將重新建構之逐段對稱定窗因子的(重新建構之)完整集合應用至輸入值1416,且提供經定窗之輸出值1418。因此,由於僅儲存定窗因子之子集,故此節省儲存器空間且使得定窗裝置更加有效。裝置1402之組件可實施為硬體、軟體及/或其組合。舉例而言,裝置1402可為實施組件或模組之功能之處理器及/或電路。
圖15說明用於執行定窗運算之方法之實例。可產生合併來自轉換階段及定窗階段之因子以獲得逐段對稱定窗因子之修改式定窗函數(1502)。逐段對稱定窗因子之集合可經分裂以獲得逐段對稱定窗因子之子集且減小獨特因子之總數目(1504)。儲存逐段對稱定窗因子之子集,自該子集可重新建構逐段對稱定窗因子之完整集合(1506)。可接收表示音訊信號之輸入值(1508)。可將重新建構之逐段對稱定窗因子的完整集合應用至輸入值且提供經定窗之輸出值(1510)。逐段對稱定窗因子之子集可包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。
在一實例中,定窗階段在轉換階段之前發生。在此種情況下,轉換階段可實施修改式離散餘弦轉換(MDCT),該MDCT遞歸地分裂為離散餘弦轉換類型IV(DCT IV)、離散餘弦轉換類型II(DCT II)中之至少一者,或DCT IV及DCT II兩者,其中每一此種轉換具有比MDCT更小之維數。舉例而言,轉換階段因子可為圖3之餘弦因子。
在另一實例中,定窗階段可在轉換階段之後發生。轉換階段可實施逆修改式離散餘弦轉換(IMDCT),該IMDCT遞歸地分裂為反離散餘弦轉換類型IV(IDCT IV)、反離散餘弦轉換類型II(IDCT II)中之至少一者,或IDCT IV及IDCT II兩者,其中每一此種轉換具有比IMDCT更小之維數。舉例而言,轉換階段因子可為圖4之餘弦因子。
除了本文提供之實例外,可使用本文描述之實施整數倍降低取樣轉換之演算法以實施為二的倍數之任何其他轉換。另外,應注意,本文描述之技術可應用於包括音訊、話音、視訊、資料等的各種類型之信號。
可使用多種不同技術中之任一者來表示資訊及信號。舉例而言,可由電壓、電流、電磁波、磁場或磁粒子、光場或光粒子或其任何組合來表示貫穿上文之描述而參考之資料、指令、命令、資訊、信號及其類似物。
本文描述之各種說明性邏輯區塊、模組及電路及演算法步驟可實施或執行為電子硬體、軟體或兩者之組合。為清楚說明硬體與軟體之此可互換性,上文已大體在功能性方面描述了各種說明性組件、區塊、模組、電路及步驟。此功能性係實施為硬體還是軟體視特定應用及外加於整個系統之設計約束而定。注意,組態可描述為過程,該過程可被描繪為流程框圖、流程圖、結構圖或方塊圖。儘管流程框圖可將操作描述為順序的過程,但操作中之許多者可並行或同時執行。另外,可重新排列該等操作之次序。當過程之操作完成時,終止該過程。過程可對應於方法、函數、程序、子常式、子程式等。當過程對應於函數時,其終止對應於函數至呼叫函數或主函數之返回。
當實施於硬體中時,各種實例可使用通用處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或經設計以執行本文中所描述之功能的其他可程式化邏輯裝置、離散閘或電晶體邏輯、離散硬體組件,或其任何組合。通用處理器可為微處理器,但在替代例中,處理器可為任何習知處理器、控制器、微控制器或狀態機。亦可將處理器實施為計算裝置之組合,例如,DSP與微處理器之組合、複數個微處理器、結合一DSP核心之一或多個微處理器或任何其他此種組態。
當實施於軟體中時,各種實例可使用韌體、中間軟體或微碼。執行必要任務之程式碼或碼段可儲存於諸如儲存媒體或其他儲存器之電腦可讀媒體中。處理器可執行必要任務。碼段可表示程序、函數、子程式、程式、常式、子常式、模組、套裝軟體、類別,或指令、資料結構或程式語句之任何組合。可藉由傳遞及/或接收資訊、資料、引數、參數或記憶體內容而將一碼段耦接至另一碼段或硬體電路。資訊、引數、參數、資料等可經由包括記憶體共用、訊息傳遞、符記傳遞、網路傳輸等之任何合適方式而傳遞、轉發或傳輸。
於本申請案中使用時,術語"組件"、"模組"、"系統"及其類似者意欲指代電腦相關實體(硬體、韌體、硬體與軟體之組合、軟體,或執行中之軟體)。舉例而言,組件可為(但不限於)在處理器上執行之處理程序、處理器、物件、可執行體、執行線緒、程式及/或電腦。作為說明,在計算裝置上執行之應用程式及該計算裝置可為一組件。一或多個組件可駐留於處理程序及/或執行線緒內,且一組件可位於一電腦上及/或分散於兩個或兩個以上電腦之間。另外,此等組件可由上面儲存有各種資料結構之各種電腦可讀媒體來執行。組件可諸如根據一具有一或多個資料封包之信號(例如,來自一與在區域系統、分散式系統中之另一組件及/或經由該信號而跨越諸如網際網路之網路與其他系統相互作用之組件的資料)而藉由本端及/或遠端過程進行通信。
在本文之一或多項個實例中,所描述之功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則功能可作為一或多個指令或程式碼儲存於電腦可讀媒體上或在電腦可讀媒體上傳輸。電腦可讀媒體包括電腦儲存媒體及通信媒體(包括促進電腦程式自一處轉移至另一處之任何媒體)兩者。儲存媒體可為可由電腦存取之任何可用媒體。作為實例而非限制,此等電腦可讀媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存裝置,或可用於載運或儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取的任何其他媒體。又,任何連接可適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纖電纜、雙絞線、數位用戶線(DSL),或諸如紅外、無線電及微波之無線技術自網站、伺服器或其他遠端源傳輸軟體,則同軸電纜、光纖電纜、雙絞線、DSL,或諸如紅外、無線電及微波之無線技術包括在媒體的定義中。於本文中使用時,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光碟、數位化通用光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再現資料,而光碟用雷射以光學方式再現資料。上述之組合亦應包括在電腦可讀媒體之範疇內。軟體可包含單個指令或許多指令,且可分散於若干不同碼段、分散於不同程式當中及分散跨越多個儲存媒體。可將例示性儲存媒體耦接至處理器,使得該處理器可自該儲存媒體讀取資訊且將資訊寫入至該儲存媒體。在替代例中,儲存媒體可整合至處理器。
本文中所揭示之方法包含用於達成所描述之方法的一或多個步驟或動作。該等方法步驟及/或動作可在不背離申請專利範圍之範疇的情況下彼此互換。換言之,除非所描述之實施例之恰當操作需要特定次序之步驟或動作,否則可在不背離申請專利範圍之範疇的情況下修改特定步驟及/或動作之次序及/或使用。
圖1、圖2、圖3、圖4、圖5、圖6、圖7、圖8、圖9、圖10、圖11、圖12、圖13、圖14及/或圖15中說明之組件、步驟及/或函數中之一或多者可重新排列及/或組合為單個組件、步驟或函數或者實施於若干組件、步驟或函數中。亦可添加額外元件、組件、步驟及/或函數。圖1、圖2、圖10、圖12及圖14中說明之設備、裝置及/或組件可經組態或調適以執行圖3至圖9、圖11、圖13及圖15中描述之方法、特徵或步驟中之一或多者。舉例而言,本文描述之演算法可有效地實施於軟體及/或內嵌式硬體中。
應注意,前述組態僅為實例且不應解釋為限制申請專利範圍。組態之描述意欲為說明性的,且不限制申請專利範圍之範疇。同樣,本發明之教示可易於應用於其他類型之設備,且許多替代、修改及變化對熟習此項技術者而言將為顯而易見的。
102...編碼器
104...輸入音訊信號
106...MDCT分析濾波器組
108...量化器
110...熵編碼器
112...位元流
114...定窗函數
116...轉換
118...按比例調整函數
202...解碼器
204...位元流
206...熵解碼器
208...解量化器
210...IMDCT合成濾波器組
212...時域音訊信號
214...按比例調整函數
216...反轉換
218...定窗加重疊及加法函數
302...DCT-IV轉換
304...輸入順序
306...餘弦因子
308...輸出
402...IDCT-IV轉換
404...輸入順序
406...餘弦因子
408...輸出
502...輸入
504...輸出
602...輸入
604...輸出
702...輸入點
704...5點DCT-II轉換
706...5點DCT-II轉換
708...因子
710...輸出係數
802...輸入點
804...5點DCT-II轉換
806...5點DCT-II轉換
808...因子
810...輸出係數
902...定窗因子
904...定窗因子
1002...裝置
1004...音訊信號
1006...輸入模組
1008...時域輸入值
1010...定窗模組
1012...經定窗之輸入值
1014...轉換模組
1016...頻譜係數
1018...合併模組
1019...因子分裂模組
1020...儲存模組
1022...定窗函數
1202...裝置
1204...頻譜係數
1206...輸入模組
1208...反轉換模組
1210...輸出值
1212...定窗模組
1214...經定窗之輸出值
1218...合併模組
1219...因子分裂模組
1220...儲存模組
1222...定窗函數
1402...裝置
1404...合併模組
1405...因子分裂模組
1406...儲存模組
1408...接收器模組
1410...定窗模組
1412...來自轉換階段之因子
1414...來自定窗階段之因子
1416...輸入值
1418...經定窗之輸出值
1420...逐段對稱定窗因子
1423...逐段對稱定窗因子之子集
圖1為說明可包括MDCT分析濾波器組之編碼器的實例之方塊圖。
圖2為說明可包括IMDCT合成濾波器組之解碼器的實例之方塊圖。
圖3說明可基於N/2點DCT-IV核心函數實施MDCT轉換之方式。
圖4說明可基於N/2點IDCT-IV核心函數實施IMDCT轉換之方式。
圖5為說明可實施為編碼器MDCT轉換之部分的5點DCT-II轉換之圖解。
圖6為說明可實施為解碼器IMDCT轉換之部分的5點IDCT-II轉換之圖解。
圖7為說明可使用兩個DCT-II轉換來實施長度N=10點之DCT-IV轉換之方式的實例之方塊圖。
圖8為說明可使用兩個IDCT-II轉換實施長度N=10點之IDCT-IV轉換之方式的實例之方塊圖。
圖9為說明定窗函數之逐段對稱性質之圖表。
圖10為說明用於計算轉換值之裝置之方塊圖。
圖11說明用於使用基於核心DCT-II轉換之MDCT轉換對信號進行編碼的方法之實例。
圖12為說明用於計算轉換值之裝置之方塊圖。
圖13說明用於使用基於核心IDCT-II轉換之IMDCT轉換對信號進行解碼的方法之實例。
圖14為說明用於執行定窗運算之裝置之方塊圖。
圖15說明用於執行定窗運算之方法之實例。
1002...裝置
1004...音訊信號
1006...輸入模組
1008...時域輸入值
1010...定窗模組
1012...經定窗之輸入值
1014...轉換模組
1016...頻譜係數
1018...合併模組
1019...因子分裂模組
1020...儲存模組
1022...定窗函數

Claims (50)

  1. 一種計算轉換值之方法,其包含:接收表示一音訊信號之時域輸入值;及使用一修改式離散餘弦轉換(MDCT)將該等輸入值轉換為頻譜係數,該MDCT遞歸地分裂為一離散餘弦轉換類型IV(DCT-IV)、一離散餘弦轉換類型II(DCT-II)中之至少一者,或該DCT-IV及該DCT-II兩者,其中每一此種轉換具有比該MDCT更小之維數,其中該MDCT之至少一些乘法運算與一應用至該等輸入值之先前定窗運算合併。
  2. 如請求項1之方法,其中該DCT-II為一可實施不同大小之MDCT之5點轉換。
  3. 如請求項1之方法,其中該DCT-II包括一5點DCT-II轉換,其中:該5點DCT-II轉換包含輸入x (0)~x (4)、輸出C II (0)~C II (4)、及參數αβγδf 1 ~f 6g 1 ~g 4 ,其中: f 1 =x (0)+x (4),f 2 =x (4)-x (0),f 3 =x (3)-x (1),f 4 =x (3)+x (1),f 5 =f 1 +f 4 ,f 6 =f 4 -f 1 ,g 1 =x (2)-αf 5 ,g 2 =x (2)+f 5 ,g 3 =βf 2 +γf 3 ,g 4 =βf 3 -γf 2 ,C II (0)=g 2 ,C II (1)=g 4 ,C II (2)=δf 6 -g 1 ,C II (3)=g 3 ,及C II (4)=g 1 -δf 6
  4. 如請求項1之方法,其中該MDCT使用相同DCT-II實施320點、160點、80點、40點轉換中之至少兩者。
  5. 如請求項1之方法,其中該DCT-II包括至多五(5)個乘法運算。
  6. 如請求項1之方法,其進一步包含:產生一修改式定窗函數,該修改式定窗函數合併來自該轉換運算及該定窗運算之因子,以獲得逐段對稱定窗因子;及儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合。
  7. 如請求項6之方法,其進一步包含:在轉換該等輸入值之前,將重新建構的逐段對稱定窗因子之該完整集合應用至該等輸入值。
  8. 如請求項6之方法,其中該等逐段對稱定窗因子之該子集包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。
  9. 如請求項1之方法,其進一步包含:對來自該定窗函數之輸出執行動態範圍估計及再正規化。
  10. 一種用於計算轉換值之裝置,其包含:一輸入模組,其接收一音訊信號且提供表示該音訊信號之時域輸入值;及一轉換模組,其使用一修改式離散餘弦轉換(MDCT)將該等輸入值轉換為頻譜係數,該MDCT遞歸地分裂為 一離散餘弦轉換類型IV(DCT-IV)、一離散餘弦轉換類型II(DCT-II)中之至少一者,或該DCT-IV及該DCT-II兩者,其中每一此種轉換具有比該MDCT更小之維數,其中該MDCT之至少一些乘法運算與一應用至該等輸入值之先前定窗運算合併。
  11. 如請求項10之裝置,其中該DCT-II為一實施不同大小之MDCT之5點轉換。
  12. 如請求項10之裝置,其中該DCT-II包括一5點DCT-II轉換,其中:該5點DCT-II轉換包含輸入x (0)~x (4)、輸出C II (0)~C II (4)、及參數αβγδf 1 ~f 6g 1 ~g 4 ,其中: f 1 =x (0)+x (4),f 2 =x (4)-x (0),f 3 =x (3)-x (1),f 4 =x (3)+x (1),f 5 =f 1 +f 4 ,f 6 =f 4 -f 1 ,g 1 =x (2)-αf 5 ,g 2 =x (2)+f 5 ,g 3 =βf 2 +γf 3 ,g 4 =βf 3 -γf 2 ,C II (0)=g 2 ,C II (1)=g 4 ,C II (2)=δf 6 -g 1 ,C II (3)=g 3 ,及C II (4)=g 1 -δf 6
  13. 如請求項10之裝置,其中該MDCT使用相同核心DCT-II實施320點、160點、80點、40點轉換中之至少兩者。
  14. 如請求項10之裝置,其進一步包含:一定窗模組,其用於產生一修改式定窗函數,該修改式定窗函數合併來自該轉換運算及該定窗運算之因子, 以獲得逐段對稱定窗因子;及一儲存模組,其用於儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合。
  15. 如請求項14之裝置,其中該定窗模組進一步經組態以在轉換該等輸入值之前將重新建構的逐段對稱定窗因子之該完整集合應用至該等輸入值。
  16. 如請求項14之裝置,其中該等逐段對稱定窗因子之該子集包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。
  17. 一種用於計算轉換值之裝置,其包含:用於接收表示一音訊信號之時域輸入值之構件;及用於使用一修改式離散餘弦轉換(MDCT)將該等輸入值轉換為頻譜係數之構件,該MDCT遞歸地分裂為一離散餘弦轉換類型IV(DCT-IV)、一離散餘弦轉換類型II(DCT-II)中之至少一者,或該DCT-IV及該DCT-II兩者,其中每一此種轉換具有比該MDCT更小之維數,其中該MDCT之至少一些乘法運算與一應用至該等輸入值之先前定窗運算合併。
  18. 如請求項17之裝置,其中該DCT-II為一可實施不同大小之MDCT之5點轉換。
  19. 如請求項17之裝置,其進一步包含:用於產生一修改式定窗函數之構件,該修改式定窗函數合併來自該轉換運算及該定窗運算之因子,以獲得逐 段對稱定窗因子;用於儲存該等逐段對稱定窗因子之一子集之構件,自該子集可重新建構該等逐段對稱定窗因子之一完整集合;及用於在轉換該等輸入值之前將重新建構的逐段對稱定窗因子之該完整集合應用至該等輸入值的構件。
  20. 一種用於計算轉換值之電路,其中該電路經調適以:接收表示一音訊信號之時域輸入值;及使用一修改式離散餘弦轉換(MDCT)將該等輸入值轉換為頻譜係數,該MDCT遞歸地分裂為一離散餘弦轉換類型IV(DCT-IV)、一離散餘弦轉換類型II(DCT-II)中之至少一者,或該DCT-IV及該DCT-II兩者,其中每一此種轉換具有比該MDCT更小之維數,其中該MDCT之至少一些乘法運算與一應用至該等輸入值之先前定窗運算合併。
  21. 一種包含用於計算轉換值之指令之電腦可讀媒體,當該等指令由一處理器執行時使得該處理器執行以下操作:接收表示一音訊信號之時域輸入值;及使用一修改式離散餘弦轉換(MDCT)將該等輸入值轉換為頻譜係數,該MDCT遞歸地分裂為一離散餘弦轉換類型IV(DCT-IV)、一離散餘弦轉換類型II(DCT-II)中之至少一者,或該DCT-IV及該DCT-II兩者,其中每一此種轉換具有比該MDCT更小之維數,其中該MDCT之至少一些乘法運算與一應用至該等輸入值之先前定窗運算合 併。
  22. 一種提供一解碼器之方法,其包含:接收表示一音訊信號之頻譜係數;及使用一逆修改式離散餘弦轉換(IMDCT)將該頻譜係數轉換為時域輸出值,該IMDCT遞歸地分裂為一反離散餘弦轉換類型IV(IDCT-IV)、一反離散餘弦轉換類型II(IDCT-II)中之至少一者,或該IDCT-IV及該IDCT-II兩者,其中每一此種反轉換具有比該IMDCT更小之維數,其中該IMDCT之至少一些乘法運算與一應用至該等輸出值之隨後定窗運算合併。
  23. 如請求項22之方法,其中該IDCT-II為一實施不同大小之IMDCT之5點反轉換。
  24. 如請求項22之方法,其中該IDCT-II包括一5點IDCT-II轉換,其中:該5點IDCT-II包含輸入C II (0)~C II (4)、輸出(0)~(4)及參數αβγδa 1 ~a 2b 1 ~b 6 ,其中: a 1 =C II (2)+C II (4),a 2 =C II (4)-C II (2),b 1 =C II (0)+a 2 ,b 2 =C II (0)-αa 2 ,b 3 =βC II (1)+γC II (3),b 4 =-βC II (3)+γC II (1),b 5 =b 2 +δa 1 ,b 6 =b 2 -δa 1 ,
  25. 如請求項22之方法,其中該IMDCT使用相同核心IDCT- II實施320點、160點、80點、40點反轉換中之至少兩者。
  26. 如請求項22之方法,其進一步包含:產生一修改式定窗函數,該修改式定窗函數合併來自該轉換運算及該定窗運算之因子,以獲得逐段對稱定窗因子;及儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合。
  27. 如請求項26之方法,其進一步包含:在轉換該等頻譜係數之後將重新建構的逐段對稱定窗因子之該完整集合應用至該等輸出值。
  28. 如請求項26之方法,其中該等逐段對稱定窗因子之該子集包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。
  29. 如請求項26之方法,其進一步包含:對來自該定窗函數之該等輸出執行動態範圍估計及再正規化。
  30. 一種用於計算轉換值之裝置,其包含:一輸入模組,其用於接收表示一音訊信號之頻譜係數;及一反轉換模組,其用於使用一逆修改式離散餘弦轉換(IMDCT)將該等頻譜係數轉換為時域輸出值,該IMDCT遞歸地分裂為一反離散餘弦轉換類型IV(IDCT-IV)、一反離散餘弦轉換類型II(IDCT-II)中之至少一者,或該 IDCT-IV及該IDCT-II兩者,其中每一此種反轉換具有比該IMDCT更小之維數,其中該IMDCT之至少一些乘法運算與一應用至該等輸出值之隨後定窗運算合併。
  31. 如請求項30之裝置,其中該IDCT-II為一實施不同大小之IMDCT之5點反轉換。
  32. 如請求項30之裝置,其進一步包含:一合併模組,其用於產生一修改式定窗函數,該修改式定窗函數合併來自該轉換運算及該定窗運算之因子,以獲得逐段對稱定窗因子;一儲存模組,其用於儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合;及一定窗模組,其用於在轉換該等頻譜係數之後將重新建構的逐段對稱定窗因子之該完整集合應用至該等輸出值。
  33. 一種用於計算轉換值之裝置,其包含:用於接收表示一音訊信號之頻譜係數之構件;及用於使用一逆修改式離散餘弦轉換(IMDCT)將該等頻譜係數轉換為時域輸出值之構件,該IMDCT遞歸地分裂為一反離散餘弦轉換類型IV(IDCT-IV)、一反離散餘弦轉換類型II(IDCT-II)中之至少一者,或該IDCT-IV及該IDCT-II兩者,其中每一此種反轉換具有比該IMDCT更小之維數,其中該IMDCT之至少一些乘法運算與一應用至該等輸出值之隨後定窗運算合併。
  34. 一種用於計算轉換值之電路,其中該電路經調適以:接收表示一音訊信號之頻譜係數;及使用一逆修改式離散餘弦轉換(IMDCT)將該等頻譜係數轉換為時域輸出值,該IMDCT遞歸地分裂為一反離散餘弦轉換類型IV(IDCT-IV)、一反離散餘弦轉換類型II(IDCT-II)中之至少一者,或該IDCT-IV及該IDCT-II兩者,其中每一此種反轉換具有比該IMDCT更小之維數,其中該IMDCT之至少一些乘法運算與一應用至該等輸出值之隨後定窗運算合併。
  35. 一種包含用於計算轉換值之指令之電腦可讀媒體,當該等指令由一處理器執行時使得該處理器執行以下操作:接收表示一音訊信號之頻譜係數;及使用一逆修改式離散餘弦轉換(IMDCT)將該等頻譜係數轉換為時域輸出值,該IMDCT遞歸地分裂為一反離散餘弦轉換類型IV(IDCT-IV)、一反離散餘弦轉換類型II(IDCT-II)中之至少一者,或該IDCT-IV及該IDCT-II兩者,其中每一此種反轉換具有比該IMDCT更小之維數,其中該IMDCT之至少一些乘法運算與一應用至該等輸出值之隨後定窗運算合併。
  36. 一種執行一定窗運算之方法,其包含:產生一修改式定窗函數,該修改式定窗函數合併來自一轉換階段及定窗階段之因子,以獲得逐段對稱定窗因子;及儲存該等逐段對稱定窗因子之一子集,自該子集可重 新建構該等逐段對稱定窗因子之一完整集合。
  37. 如請求項36之方法,其進一步包含:接收表示一音訊信號之輸入值;將重新建構之逐段對稱定窗因子的該完整集合應用至該等輸入值且提供經定窗之輸出值。
  38. 如請求項36之方法,其中該等逐段對稱定窗因子之該子集包括用於定窗因子的每一逐段對稱集合之獨特因子的至少一半。
  39. 如請求項36之方法,其進一步包含:分裂該等逐段對稱定窗因子以獲得該等逐段對稱定窗因子之該子集且減小獨特因子之總數目。
  40. 如請求項36之方法,其中該定窗階段在該轉換階段之前發生。
  41. 如請求項40之方法,其中該轉換階段實施一修改式離散餘弦轉換(MDCT),該MDCT遞歸地分裂為一離散餘弦轉換類型IV(DCT IV)、一離散餘弦轉換類型II(DCT II)中之至少一者,或該DCT IV及該DCT II兩者,其中每一此種轉換具有比該MDCT更小之維數。
  42. 如請求項40之方法,其中該轉換階段之因子為,其中j =0,1,...,N /2-1且N指示訊框長度。
  43. 如請求項36之方法,其中該定窗階段在該轉換階段之後發生。
  44. 如請求項43之方法,其中該轉換階段實施一逆修改式離散餘弦轉換(IMDCT),該IMDCT遞歸地分裂為一反離散 餘弦轉換類型IV(IDCT IV)、一反離散餘弦轉換類型II(IDCT II)中之至少一者,或該IDCT IV及該IDCT II兩者,其中每一此種轉換具有比該IMDCT更小之維數。
  45. 如請求項43之方法,其中該轉換階段之因子為,其中j =0,1,...,N /2-1且N指示訊框長度。
  46. 一種用於執行定窗運算之裝置,其包含:一合併模組,其用於產生一修改式定窗函數,該修改式定窗函數合併來自一轉換階段及一定窗階段之因子,以獲得逐段對稱定窗因子;及一儲存模組,其用於儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合。
  47. 如請求項46之裝置,其進一步包含:一接收器模組,其用於接收表示一音訊信號之輸入值;一定窗模組,其用於將重新建構的逐段對稱定窗因子之該完整集合應用至該等輸入值且提供經定窗之輸出值。
  48. 一種用於執行定窗運算之裝置,其包含:用於產生一修改式定窗函數之構件,該修改式定窗函數合併來自一轉換階段及一定窗階段之因子,以獲得逐段對稱定窗因子;及用於儲存該等逐段對稱定窗因子之一子集之構件,自該子集可重新建構該等逐段對稱定窗因子之一完整集 合。
  49. 一種用於執行定窗運算之電路,其中該電路經調適以:產生一修改式定窗函數,該修改式定窗函數合併來自一轉換階段及定窗階段之因子,以獲得逐段對稱定窗因子;及儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合。
  50. 一種包含用於執行定窗運算之指令之電腦可讀媒體,當該等指令由一處理器執行時使得該處理器執行以下操作:產生一修改式定窗函數,該修改式定窗函數合併來自一轉換階段及定窗階段之因子以獲得逐段對稱定窗因子;及儲存該等逐段對稱定窗因子之一子集,自該子集可重新建構該等逐段對稱定窗因子之一完整集合。
TW097136172A 2007-09-19 2008-09-19 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法 TWI398854B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US97370907P 2007-09-19 2007-09-19
US98940007P 2007-11-20 2007-11-20
US12/212,920 US8548815B2 (en) 2007-09-19 2008-09-18 Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications

Publications (2)

Publication Number Publication Date
TW200926146A TW200926146A (en) 2009-06-16
TWI398854B true TWI398854B (zh) 2013-06-11

Family

ID=40039658

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097136172A TWI398854B (zh) 2007-09-19 2008-09-19 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法

Country Status (12)

Country Link
US (1) US8548815B2 (zh)
EP (1) EP2206111A2 (zh)
JP (1) JP2010539625A (zh)
KR (1) KR101329514B1 (zh)
CN (1) CN101796578B (zh)
AU (1) AU2008302070B2 (zh)
BR (1) BRPI0817003A2 (zh)
CA (1) CA2695741A1 (zh)
HK (1) HK1143240A1 (zh)
MX (1) MX2010002848A (zh)
TW (1) TWI398854B (zh)
WO (1) WO2009039451A2 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9110849B2 (en) 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
US9069713B2 (en) 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
CN101930425B (zh) * 2009-06-24 2015-09-30 华为技术有限公司 信号处理方法、数据处理方法及装置
US9075757B2 (en) 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US9118898B2 (en) 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
US9081733B2 (en) 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
EP2309497A3 (en) * 2009-07-07 2011-04-20 Telefonaktiebolaget LM Ericsson (publ) Digital audio signal processing system
CN102104776A (zh) * 2009-12-21 2011-06-22 康佳集团股份有限公司 一种网络电视平台mpeg音频多相合成滤波方法
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
MY156027A (en) 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
CN103229235B (zh) * 2010-11-24 2015-12-09 Lg电子株式会社 语音信号编码方法和语音信号解码方法
US9824066B2 (en) 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding
DK2691951T3 (en) 2011-03-28 2016-11-14 Dolby Laboratories Licensing Corp TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency
CN102568485B (zh) * 2011-12-30 2013-12-11 展讯通信(上海)有限公司 音频信号的频时转换方法及装置
JP6089878B2 (ja) * 2013-03-28 2017-03-08 富士通株式会社 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
CN107452390B (zh) 2014-04-29 2021-10-26 华为技术有限公司 音频编码方法及相关装置
KR102615903B1 (ko) 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW530465B (en) * 2000-10-19 2003-05-01 Nec Corp Encoding device for audio signal
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
WO2004080125A1 (en) * 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
US20040196986A1 (en) * 2002-02-21 2004-10-07 Hyo-Choul Nam Rapidly optimized wireless microphone system and method for controlling thereof
WO2005031596A1 (en) * 2003-09-29 2005-04-07 Agency For Science, Technology And Research Method for transforming a digital signal from the time domain into the frequency domain and vice versa
TW200516545A (en) * 2003-11-07 2005-05-16 Mediatek Inc Subband analysis/synthesis filtering method

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2675969B1 (fr) 1991-04-24 1994-02-11 France Telecom Procede et dispositif de codage-decodage d'un signal numerique.
US5765126A (en) 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
US5719998A (en) 1995-06-12 1998-02-17 S3, Incorporated Partitioned decompression of audio data using audio decoder engine for computationally intensive processing
US6154762A (en) * 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
WO2001059603A1 (en) 2000-02-09 2001-08-16 Cheng T C Fast method for the forward and inverse mdct in audio coding
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
KR100530377B1 (ko) * 2003-12-30 2005-11-22 삼성전자주식회사 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법
EP1711938A1 (en) * 2004-01-28 2006-10-18 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
WO2006049204A1 (ja) 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、符号化方法及び復号化方法
CN100546197C (zh) 2006-08-17 2009-09-30 上海交通大学 适用于多音频标准通用滤波器单元的vlsi实现方法
ES2658942T3 (es) * 2007-08-27 2018-03-13 Telefonaktiebolaget Lm Ericsson (Publ) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW530465B (en) * 2000-10-19 2003-05-01 Nec Corp Encoding device for audio signal
US20040196986A1 (en) * 2002-02-21 2004-10-07 Hyo-Choul Nam Rapidly optimized wireless microphone system and method for controlling thereof
WO2004080125A1 (en) * 2003-03-04 2004-09-16 Nokia Corporation Support of a multichannel audio extension
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
TW200417990A (en) * 2003-03-14 2004-09-16 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
WO2005031596A1 (en) * 2003-09-29 2005-04-07 Agency For Science, Technology And Research Method for transforming a digital signal from the time domain into the frequency domain and vice versa
WO2005031595A1 (en) * 2003-09-29 2005-04-07 Agency For Science, Technology And Research Method for performing a domain transformation of a digital signal from the time domain into the frequency domain and vice versa
TW200516545A (en) * 2003-11-07 2005-05-16 Mediatek Inc Subband analysis/synthesis filtering method

Also Published As

Publication number Publication date
CA2695741A1 (en) 2009-03-26
HK1143240A1 (en) 2010-12-24
JP2010539625A (ja) 2010-12-16
KR20100063122A (ko) 2010-06-10
CN101796578B (zh) 2013-04-10
AU2008302070A1 (en) 2009-03-26
TW200926146A (en) 2009-06-16
US20090094038A1 (en) 2009-04-09
CN101796578A (zh) 2010-08-04
AU2008302070B2 (en) 2011-06-16
MX2010002848A (es) 2010-04-01
EP2206111A2 (en) 2010-07-14
WO2009039451A2 (en) 2009-03-26
BRPI0817003A2 (pt) 2015-03-31
US8548815B2 (en) 2013-10-01
KR101329514B1 (ko) 2013-11-13
WO2009039451A3 (en) 2009-05-22

Similar Documents

Publication Publication Date Title
TWI398854B (zh) 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法
KR101226094B1 (ko) 5-포인트 dct-ⅱ, dct-ⅳ, 및 dst-ⅳ 및 아키텍쳐들의 계산을 위한 고속 알고리즘들
KR101286329B1 (ko) 저 복잡도의 스펙트럼 대역 복제 (sbr) 필터뱅크
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
JP4689625B2 (ja) 信号解析及び合成のための適応型混合変換
JP4398979B2 (ja) 変換表現に転換するか、または変換表現を逆変換するための装置および方法
JP4961042B2 (ja) 整数変換ベースの符号化及び復号化のためのラウンディング雑音シェーピング
JP3814611B2 (ja) 時間離散オーディオサンプル値を処理する方法と装置
TWI420511B (zh) 提供一分析濾過器群及一合成濾過器群之方法、設備及電路以及機器可讀媒體
RU2451998C2 (ru) Эффективный способ проектирования набора фильтров для mdct/imdct в приложениях для кодирования речи и аудиосигналов
RU2464540C2 (ru) Быстрые алгоритмы для вычисления 5-точечного dct-ii, dct-iv и dst-iv, и архитектуры
JP2023526627A (ja) 音声音響統合復号の向上のための方法及び機器
KR20070066514A (ko) 오디오 부호화 및 복호화 방법과 그 장치
Montnémery Johannes Sandvall February 2004

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees