TW200527224A - Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium - Google Patents

Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium Download PDF

Info

Publication number
TW200527224A
TW200527224A TW093129241A TW93129241A TW200527224A TW 200527224 A TW200527224 A TW 200527224A TW 093129241 A TW093129241 A TW 093129241A TW 93129241 A TW93129241 A TW 93129241A TW 200527224 A TW200527224 A TW 200527224A
Authority
TW
Taiwan
Prior art keywords
matrix
conversion
lifting
transformation
auxiliary
Prior art date
Application number
TW093129241A
Other languages
English (en)
Inventor
Haibin Huang
Xiao Lin
Susanto Rahardja
Rongshan Yu
Original Assignee
Agency Science Tech & Res
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency Science Tech & Res filed Critical Agency Science Tech & Res
Publication of TW200527224A publication Critical patent/TW200527224A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Discrete Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Description

Z00527224 4 九、發明說明: [相關申請案之交互參考] 此申請案係主張於西元2003年9月29曰提出的美國 專利臨時申請案第60/5〇7,210號、與於西元2〇〇3年9月29 日提出的美國專利臨時申請案第6〇/5〇7,物號的優先權之 利盈,各者之内容係針對所有目的以參照方式而為整體納 入於本文。 再者,下列共同擁有的申請案係同時提出,且以整體 納入於本文: 代理人案件第P100442號“用於實施由時域至頻域及 反向之數位訊號域轉換的方法,,,及 代理人案件第P100444號“用於由時域至頻域及反向 轉換數位訊號之方法”。 【發明所屬之技術領域】 本發明係關於一種用於決定特定轉換函數之轉換元素 之方法及裝置、用於將數位訊號由時域轉換至頻域及反向 轉換之方法及裝置、以及電腦可讀取媒體。 【先前技術】 例如疋離散餘弦轉換(DCT,discrete cosine transform) 之域轉換係廣泛運用於現代的訊號處理產業。近來,稱為 整數DCT之DCT的一種變化係因為於無損耗(1〇ssless)編碼 (coding)的應用中之重要角色而已經吸引諸多研究興趣。術 語“無損耗”係意謂著:解碼器係可自編碼(enc〇ded)位元 流(bit-stream)產生原始訊號的一個精確無誤的複製(c〇py)。 200527224 DCT是一種貫數值的區塊(bl〇ck)轉換。即使輸入區塊 係僅由整數所組成,DCT之輸出區塊仍可能包含非整數的 成分。為了方便起見,輸入區塊係稱為輸入向量,而輸出 區塊係稱為輸出向量。若一個向量僅包含整數成分,則其 稱為一個整數向量。不同於DCT的是,整數DCT係自一整 數輸入向量產生一整數輸出向量。對於相同的整數輸入向 i而5,整數DCT之整數輸出向量係非常接近DcT之實數 輸出向量。因此,整數DCT係保有DCT於頻譜分析之所有 良好的性質。 整數DCT之一個重要性質係可逆性(reversibility)。可 逆性係意謂著存在一整數逆向DCT(IDCT,inverse DCT),使 得若疋整數DCT係自一輸入向量l產生一輸出向量义,則 整數IDCT係可自向量[回復向量毛。有時,整數DCT亦稱 為正向(forward)轉換,而整數IDCT稱為反向或逆向轉換。 一種稱為整數修改式離散餘弦轉換(IntMDCT,integer modified discrete cosine transform)之轉換係最近被提出且 運用於ISO/IEC MPEG-4音訊壓縮。intMDCT係可從其原 型一修改式離散餘弦轉換(MDCT,modified discrete cosine transform)推導出。於參考文獻[1],Malvar係提供一種 MDCT之有效率的實現,其係藉由串接一組(bank)之Givens 旋轉以及一個DCT-IV區塊。眾所週知的是,Givens旋轉係 了因式分解為三個提升級(lifting step)以供映射整數至整 數。例如,請參閱參考文獻[2]。 因此,IntMDCT之實現係仰賴於整數DCT-IV之有效率 200527224 的施行。 整數轉換係可直接轉換自其原型,此係藉由以三個提 升級替代各個Givens旋轉。因為各個提升級中具有一個化 整(rounding)運算,因此整數轉換之總化整數目係原型轉換 之Givens旋轉數目的三倍。針對於離散三角轉換(例如··離 散傅立葉轉換(DFT)或離散餘弦轉換(DCT)),所涉及的
Glvens旋轉之數目係通常為於#1〇§2#的層級,其中,#係區 塊的尺寸,亦即内含在數位訊號所分割成為的各個區塊中 之資料符號量。是以,針對於直接轉換的整數轉換之系列 而言,總化整數目亦為於的層級。因為化整,所以整 數轉換僅為近似其浮點原型。近似誤差係隨著化整之數目 而增大。 【發明内容】
本發明係解決決定一特定轉換函數的轉換元素之問 忒轉換函數係包含一轉換矩陣且對應於由時域至頻域 =反向之數位訊號的轉換,俾使由該轉換元素所包含之化 整,算的數目顯著地降低。本發明亦提出一種用於根據該 决疋的轉換疋素以將數位訊號由時域轉換至頻域或反向轉 換之方法。 忒問題係藉由一種用於決定特定轉換函數之轉換元素 之方w 在置、一種用於將數位訊號由時域轉換至頻域及 °轉換之方法及裝置、以及一種具有根據申請專利範圍 獨立項之特徵的電腦可讀取媒體而解決。 據本發明,一種用於決定一特定轉換函數之轉換元 200527224 素之方法係被提出,該轉換函數係包含一轉換矩陣且對應 於由時域至頻域或反向之數位訊號的轉換,其中:該轉換 7陣係分解成為-個旋轉矩陣與—個輔助矩陣,該輔助矩 P當乘以其本身時係等於一個置換矩陣乘以一個整數對角 矩陣;該旋轉矩陣與辅助矩陣係各自分解成為複數個提升 矩陣,該轉換元素係被決定為包含對應於該些提升矩陣之 複數個提升級。 f < 再者,根據本發明’ 一種適於實施上述的方法之 係被提出。 展置 再者’根據本發明,—種用於將數位訊號由時域轉換 至頻域或反向轉換之太、土在& 、 门轉換之方法係被提出’其運用一轉換元素, =人該轉換元素係對應於—特定轉換函數,該轉換 係包含一個轉換矩陣,i中, 早^ 5亥轉換兀素係由一種方法所
:”匕3 ·分解該轉換矩陣成為-個旋轉矩陣與一個 輔助矩陣,兮結# & # i & 1U 陣乘以-個敕 其本身時係等於一個置換矩 各自 數對角矩陣;分解該旋轉矩陣與輔助矩陣而 對應於該此提升矩Γ 及’決定該轉換元素為包含 級孫勺人升矩陣之複數個提升級;且其中,各個提升 且3Γ數位訊號的子區塊之處理,其係藉由辅助轉換 且精由一個化整單元。 π 1为 再者’根據本發明,一、奋 係被提出。 種<於實細i述的方法之裝置 根據本發明’―種電料讀取媒㈣被 其係具有記錄於其上之一 壬式,/、中,該程式係適於使得 200527224 電腦實施-種用於決特定轉換函數之轉換元素之方 法,該轉換函數係包含一個轉換矩陣且對應於由時域至頻 域或反向之數位訊號的轉換’其中:該轉換矩陣係分解成 為一個旋轉矩陣與一個輔助矩陣,該辅助矩陣當乘以其本 身時係等於-個置換矩陣乘以—個整數對角矩陣;該旋 矩陣與輔助矩陣係各自分解成為複數個提升矩陣;該轉換 元素係被決定為包含對應於該些提升矩陣之複數個提升 級。 再者’根據本發明,-種電腦可讀取媒體係被提出,· 其:具有記錄於其上之一程式,其中,該程式係適於使得 電月®實施一種用於將數位訊號由時域轉換至頻域或反向轉 換之方法’其係運用一轉換元素,其中··該轉換元素係對 應於-特定轉換函數,該轉換函數係包含一個轉換矩陣, 其中’该轉換兀素係由一種方法所決定,其包含:分解該 ^奐矩陣成為-個旋轉矩陣與一個輔助矩陣,該輔助矩陣 當乘以其本身時係等於一個置換矩陣乘以一個整數對角矩 刀解-亥旋轉矩陣與辅助矩陣而各自成為複數個提升矩_ 陣,以及,決定該轉換元素為包含對應於該些提升矩陣之 複數個提升級,且,各個提升級係包含該數位訊號的子區 鬼之處理,其係藉由輔助轉換且藉由一個化整單元。 〆於個較佳實施例中,本發明係提出一種用於實現整 數類型IV的DCT轉換之程序與方法。相較於先前技藝的方 2根據本發明之方法僅需要顯著降低數目之化整運算。 果近似块差係大為降低,就DCT_IV而論,其可自通常 11 200527224 的AHog,的層級而降低至低為如2·5#,其中,#係表示數位 訊號之區塊尺寸。根據本發明之方法係為低的計算複雜度 且為模組化的結構。 根據本發明之方法及裝置係可運用於任何型式的數位 訊號,諸如:音訊、影像或視訊訊號。數位訊號(其為數位 化的讯號)係對應於一實際測量的訊號,且可為藉著掃描一 個對應的類比訊號之至少一個特性特徵(例如··視訊訊號之 冗度與色度值、類比聲音訊號之振幅、或來自感測器之類 比感測訊號)而產生。該數位訊號係包含複數個資料符號。 數位訊號之資料符號係被分組成為區塊,且各個區塊係具 有相同預定數目之資料符號,該數目為基於對應的類比訊 號之取樣率而定。 根據本發明之方法係可運用於轉換一 入數位訊號至-亦代表整數值之輸出訊號。根據 轉換方法是可逆的。該輸出訊號係可藉著實施根據本發明 之轉換方法而轉換回到原始輸入訊號。根據本發明之方法 的轉換之此種可逆性質係可運用於無損耗編碼,其中,輸 出Λ號係應相同於原始輸入訊號。 根據本發明之訊號的此種整數轉換係可運用於諸多岸 用與系統,諸如:MPEG音訊、影像與視訊壓縮、jpEG2〇〇〇 ,頻譜分析器(用於分析紅外線、紫外線或核磁輻射訊號)。 =可為容易施行於硬體系統(諸如:定點數位訊號處理器 p))而無須考慮於論及於一個實數值的訊號轉換之諸如 /虚位(overflow)的因素。 12 200527224 根據本發明之方法,數位訊號係藉由一轉換元素而轉 換至頻域,該轉換元素係針對於一個特定的轉換函數而根 據本發明之方法所決定。 較佳而吕,轉換元素係包含複數個提升級 stage) ° 轉換το素係可為基於一種提升階梯(ladde〇模型來加以 次月提升階梯模型係具有二個側部,各者係用於接收二 個群、、且的資料4號中之—群組。二或多個串接的提升級係 被設置於該二個側部之間。各個提升級係於一端(輸入端) 接收一舐唬,且經由一總和單元而於另一端(輸出端)輸出一 唬 化整單元係配置於輸出端。提升級係以交替的方 式配置於側部之間’俾使相鄰的提升級之輸出(或輸入)端為 連接至不同的側部。 應注意的是,雖然該轉換元素係以提升階梯模型之形 式來加以描述,但其僅為說明轉換元素之轉換路徑。本發 明不應受限於該種階梯模型。 轉換元素之提升級的數目係由其為根據本發明之方法 所决疋之提升矩陣的數目所定義。 離散餘弦轉換、離散正弦轉換、離散傅立葉轉換或離 散w轉換係轉換函數之實例,其可運用作為根據本發明之 轉換函數。轉換元素之提升級的數目係可為不同的,視根 據本發明之方法的結果而定,以供針對於個別的轉換函數 決定一個轉換元素之用。 【實施方式】 13 200527224 ^發明之說明性質的實施例係參照圖式而解說於後。 第1圖係顯示根據本發明的一個實施例之一種音訊編 碼器100的架構。 曰I編碼态100係、包含··基於修改式離散餘弦轉換 (MDCT)之-個習用的感知(pereept㈣)底層(be㈣⑺編碼 (coder)以及其基於整數修改式離散餘弦轉換(intMDc丁) 之一個無損耗增強編碼器。 一音1〇9 (例如··由—麥克風11〇所提供且其為 ^ -類比至數位轉換器⑴所數位化)係被提供至音訊編碼 器1〇〇。音訊訊號109係包含複數個資料符號。音訊訊號 109係被分割為複數個區塊,其中,各個區塊係包含數位訊 號之複數個資料符號且各個區塊係由一修改式離散餘弦轉 換(MDCT)裝置101所轉換。藉助於一個感知模型1〇2,由 MDCT裝置1〇1所提供的MDCT係數為由一個量化器 所量化。該感知模型係控制量化器1〇3,使得由量化誤差所 造成之可聽見的失真為低的。量化器1〇3之輸出係由一個 位元流編碼器104所編碼,而產生有損耗的〇〇ssy)之感知編 碼的輸出位元流112。位元流編碼器1〇4係無損耗式壓縮其 輸入以產生一輸出,該輸出相較於其輸入而具有較低的平 均位元率(bit-rate),其係藉由諸如霍夫曼編碼 (Huffman-Coding)或運行長度編碼(Run_Length_c〇ding)的 標準方法。輸入音訊訊號1〇9亦饋入至一 IntMDcT裝置 105,其係產生IntMDCT係數。量化的MDCT係數(其為量 化器103之輸出)係被用以預測intMDCT係數。量化的 14 200527224
mdct係數被饋入至一個逆向量化器ι〇6且逆向量化器ι〇6 之輸出係饋入至一個化整單元107,藉其為化整至整數值且 剩餘(residual)的IntMDCT係數(其為化整單元107的輸出與 IntMDCT係數之間的差值)係由一個熵(entropy)編碼器108 而進行網編碼。類比於位元流編碼器1〇4,熵編碼器1 〇8係 無損耗式降低其輸入之位元率且產生一無損耗增強的位元 流11 3。無損耗增強的位元流丨丨3以及感知編碼的位元流 1 12係載有必要資訊,以確實重建輸入音訊訊號1 〇9。 第2圖係顯示包含本發明的一個實施例之一種音訊解 碼器200的架構,其對應於第1圖所示之音訊編碼器1〇〇。
感知編碼的位元流207係由一個位元流解碼器2〇丨(其 係實施對於第1圖之位元流編碼器丨〇4的運算之逆向運算) 所解碼,且被饋入至一個逆向量化器2〇2。逆向 一個逍向MDCT裝置203而施加至逆向量化器2〇2的輸出。 因此,得到重建之感知編碼的音訊訊號2〇9。無損耗增強的 位元流208係由一個熵解碼器2〇4 (其係實施對於第i圖之 熵編碼器、108的運算之逆向運算而產生對應之剩餘 IntMDCT係數)所解碼。逆向量化器2〇2之輸出係由一個化 1波置2〇5所化整,且被加至剩餘IntMDCT係數,因此產 生IntMDCT係數。最後,逆向IntMDCT係藉由一個逆 IntMDCT裝置206而施加至IntMDCT係數,以產生重建之 無損耗編碼的音訊訊號2 1 〇。 々上所述於參考文獻[2]所顯示的是: 編碼中擔任重要肖色且運料第 15 200527224 實施例之IntMDCT的核心者是一整數DCT_IV。 弟3圖係說明根據本發明的方法之一個實施例的流程 圖,其中,轉換函數是一 DCT-IV轉換函數。
下文’根據本發明的用於決定DCT-IV轉換函數的轉換 元素之一個實施例係被解說。所決定的轉換元素係運用於 第1圖所示之編碼器以施行IntMDCT,且因此逆向轉換元 素係運用於弟2圖所示之解碼器以施行逆向IntMDCT。針 對於如何以DCT-IV實施IntMDCT與逆向IntMDCT之說 明,請參閱參考文獻[2]。 個#點的實數輸入序列办)之DCT_IV轉換函數係 義為如後(請參閱參考文獻[2]): 棘称。⑽ 令C為DCT-IV之轉換矩陣,即: Ο) c1 ^ λ !2 In cos \m + l/2)(n + l/2)^
N (2) 根據本發明之方法的實施例,轉換矩陣笠係分解成 一個旋轉矩陣盥—個拓陆 ^ ^ .,-個車#乘]"其本身時係等; 個置換矩陣乘以一個整數對角矩陣。 為了清楚起見,#係假設為偶數。 於步驟300,該方法係起始。 於步驟301,針對於偶數索 有奇數舍U ^ s a 宗引之轉換函數的項次係與j 了欺緊引的項次為分離: 、-(一
Ν 16 --1200527224
π I -石 χ(2π) cos卜 m + 3)(2^7 + 7)旬 + 心石 X(2w +1) cos[(m + 吾)(2π +1 + 吾) 一 Σχι ⑻cos N n=〇 / 、 --1 / Λ / U ^ (m + _)(w+4) + ⑻ c〇s V /1=0 (m+ ^)(^+-)- π Ά V j j 因此 —l y(m)= ⑻cos V ^ /1=0 f N 2 (3) 2 N ~ϊ ▲ —1 + y~77^x2 («)c〇s » ^ n=0 其中,具有成分χ»χ(2«),w = 〇,··.,了一 1之毛L係包含具有偶 索引的所有 x(n)之 個向量,而具有成分 x2 + ,W = 〇,.",Y-1之公係包含具有奇數索 個向量。 以下的一個縮寫係被運用: ⑻ (X m,11 (m + I)(w+去)7^,m,n = u-1 (4) (5) 藉著式(4)與(5),式(3)係可改寫為: (6) y(0)二]liP1 ⑻ CQS(Hm) + ][^ΣΧ2 ⑻ e°s(am,n +
n=Q 於步雜302 ’針對於餘弦之以下的二個加法定理係應 ⑺
co机,,久)= c〇sa-侧久 +siim心.sinA 17 (8)200527224 cos(am,w + — sinaww .sin人 藉著式(7)與(8) ’式(6)係可改寫為··
Xm):
N f_1 f-1 ~l N 1 g ⑻ c°i °°祝+§^气《sin^+2¾ ⑻c()®u。。祝-E^(w)siii%isin^ «=〇 n=0 —-1 n=0 * 2 N_ ~2 Σ C〇S]=m h(«) + ^2(«)]cosa //=〇 V 2 y-l «=〇 Vz (9) 為了縮寫,二個N/2維度的向量釭,與公,係被定義為 包含以下的成分: 文丨》=古[» + '⑻],《 =0””,令-1 (10) 七·⑷=士h⑷-Α(Ό] ’《 = 〇,···,夸-1 (η) 藉著式(10)與(11),式(9)係簡化為: η=0 丨 m’n (12) y(m)=
V 於步驟303,向量 r*K〇r y •Ki)
Lma〇 係分割為 〆〇) ' 少⑴ 部分义^_與以,其中 鲁 .4- 1) 18 (13) (14) 200527224 y{N-2) 4
N 向量ZL係包含對應於索引為自^至#-1且以反向順序 之义_的成分。向量之成分少1〇)係滿足下式: y} (m) = y(N-l-m) fi Scos^^iVOOcos^v-h," + Σδίη A-i-_V〇)sina (15) 1 2 n=0
n-Q
N 對於 m = 0,..·,了-1 0 請注意到: 少(m +寻)= —1
N
Vcos>0 N + VsinNx2\n)sina N K16) m」 wv\ J vt μ」 m Λ. n n=0 m+— 2 m+—,n
N 對於 m = 0,".,~y-1 0 於步驟304,处與u係各為一個DCT-IV矩陣Cf與 τ 個DST-IV矩陣所表示,其各者為維度
N 此係以下列的方式達成。針對於儿=(w + |)i,下式係成 /3 / \ Ν、π , \、π Ν π η π (Λ Π, -y 2 2 IN 2 2# 2 27V w 4 v ’ 立:
Pn l m = (N -l-m + = N · - (m + —) · - βηϊ (18) 2 2# 2N 2 IN 2 再者: cos^yv-i-m : = cos(|-pj = sin 凡 (19) sin/? 一 = = sin(^-/?m) = cos^w (20) 19 200527224 π
N_ Y 下式係成立: a {N —){n + —) π 2 2 ( N 2 (N — m — π 2 ( N 2 N(n + ΤΊΛ~(m++\}77Λ = 2π(<η+^"a,w^ ^2πη + π^ f»,n (21) 再者: cos a cos(2^· n^rπ-amn) = cos(^r-amn) = -cosamn (22) N~\-m,n -sin(2^r ηλ-π-amn) = sin(^r~Λ) = sinamn (23)藉著式(19)、(20)、(22)與(23),式(15)係可改寫為· r^-i …、· ^ 2 2 XW — 1-所)=TTTdZCC)S^M-mV(W)C0SaAM,+ESinAv-nV⑻ Sina sin a N_ 2 N_
2 2 Σ Sin ^ V ⑻(—COS % w ) + Σ COS 凡 V ⑻ Sin A —1 --1
N
[cos^V(w)sinaw,, = 〜sin从
N、 [I 1 2 (N) 2 ZV(OC0S〜,W n + COS 凡 2 2 ^x2\n)smamn n LV UJ LI (24) 對於 m = 0”.·,--1 o 2 再者,由於式(12)係產生 --1 y{m)= N_
Zcos 凡 V ⑻+ Zsin 儿 x2’(w)sina" 20 200527224 βη _2_ 2 + sin 从 2 l 一 1 Σν⑻ sin、 (25) y± = dlag[^Pm\ .^1 + diag[sinβηι]·S1^ ·χ2, _L ~ _L — yi = diag[-smpm\c^ ^xx'Λ-diag[cospm\S1^ -x2\ 對於與之表示式係可由式(24)與(25)而構成: 所= 〇,···,令-1 (26) 所==0”··,] — 1 (2 7) 其中,血gfaw]係表示一個N/2乘以N/2的對角矩陣且% 為於第ni列,cf 係DCT-IV轉換之轉換矩陣而 <係型式" _Χ _τ. 四的離散正弦轉換(DST-IV,discrete sine transformation of type f〇ur)之轉換矩陣。 该二式Γ 2 6Ο 77 LV Y列方式表不為單一式: 少 〇(〇) 一 COS^J sin A _ v(〇) _ y〇(~-i) c〇s凡 sinA« ' f^IV _ ^ N __ ~2 少丨(〇) ' sin βχ c〇s A Cl IV Ί x2,(0) 少丨(令-' - .sin Ah cos^_ L 一=—J V(f -1)_ (28) 下文,fxf矩陣 N_ 2 (29) 與 21 (30) (31) 200527224 係被運用。 可看出的是: 一〆〇) _ \ΐΚΪ Ί 少⑵ 丄Ν 2 _ Λ __2_ 其係縮寫為: y \ _ Τ Λ 一 4 _2_ _Zl_ [N/2 χ Ν/2
少。⑼· (N n(y1) 义⑼Wf-D (32) 進而可看出的是:藉著定義矩陣心為
R 下式 IΝ/2 — IΝII _ vw _ (0) V(鲁-1) V(0) =κ Α (替-1) 又2⑼ 係成立。 式(34)係縮寫為: ίι
Rpr (33) (34) (35) 再者,令匕為一個偶奇(even-odd)矩陣,即:重新排序 向量:ϊ的成分之一個置換矩陣 x(0) 22 200527224 ,其係藉著分離對應於偶數索引的成分與對應於奇數 索引的成分,即:俾使 %⑼ m x(N-l) (36) & (吾-1) χ2⑼ A (令-1) 或是簡單而言: Ρ (37) 係成立。 藉著結合式(28)及式(31)、(34)與(36),可得到 ~ X〇)" 7a Ί oosfix y(2) 一 上N ΟΟ^βτη - sin A c〇sA cos凡 C IV 藉「著前述的縮寫與以下的的縮寫: rcos βλ
S
IV
R AM) (38) C = 一 cos九 與 sin βλ S = 式(38)係可簡窝 In ' ~2 r J N -I. cir s
IV (39) (40) (41) 23 200527224 於步驟305, 係由qr所表 SI〜C丨[dn丄 ^ J 了 7 其中,~係維度為AV2 不 此係藉著下式 (42) 作成 之一個對角 矩陣,其給定 為 (43) 一 1 藉著式(42),式(41)係可改寫 為: y· (44)之所 C s c c
IV (44) 於步驟3H赠轉料^係被計算 ο 出,其係包含式 個矩陣: \ _ 「八 1 2 — ~C s: rl c 一八 - 2 _ - -i-_ (45) 於,(45)之三個矩陣的相乘係產生: COS-
4N cos- 3π 4Ν sin- cos (N% cos-^r
.3;r sm-— 4N
4N ❿ (46)
3π 4N cos- —sin-
3π* ~—- 4N
4N COS- 於步驟307,輔助矩陣係被計算出, /、本身時係專於一個置換矩陣乘
4iV 該輔助矩陣當乘 以一個整數對角矩陣。 祠助矩陣係包含式(44)之第四與第五個矩陣: 以 24 200527224 Τ· τ.τ: -piv - ^N/2 n 1 _ ^N/2^N/2 ^V2[ [1 0 0 1 1 ·· o 0 1 -1 0 0 . 一 1 ^ιν ^Ν/2^Ν/2 ^ C^nD 注意: /-iIV ^Ν/2 Ν/2 (47) ι 1 ο 即,Ζ1乘以其本身係箄於 (48) 陣。 4置換料乘以―整數對角矩 藉著式(46)與(47),式(44)係簡化為: CA/ = /? τ p
KlPeo_ (49) 身時係等於 個置換矩陣乘以一個整數對角矩 於步驟308,心與1係各自因式分解為提升矩 乘積。Z係因式分解成如後: 卜碰… …' (5〇) •個 丄嘗乘以其本 陣之 IN11 \-DN/2 κ2ί '/ Ί 丄n n 玉 I Nn ’ ,:_ L ——- Ύ7 i __1 1 N/2 ----」 其中, (51) (52) (53) ^ ACN/2DNf2 + V^/2fel
r^lV ^1^^2CJNV/2DNJ2 -hIN/2 25 (54)
(54) 且,^係根據下式而被因式分解: ^ N/2 H2 ' I n η H' ’"/2 - /2 Η] I MU (N-l)z SN 200527224
Rpo =及】及2及3 其中, -tan-
8iV -tan-
SN 及 H,
3π L-- 4N '-tan
4N (55) (56) sin
(N - \)π AN 因此,式(49)係可改寫為 (57)
Cl_^RxR2RJJ2T^Pe〇 於步驟309,提升矩陣係儘可能被集成。矩陣之係定義 為與Τ之乘積’即·
S ΙΝ 12 Η,Κ' _ — 1 N12 (58) 此集成係由於2亦為一個提升矩陣而為可行的。 由式(57)與(58) ’對於dct-Iv矩陣之最後的因式分解 係得到為: ^j-RxR2ST2T3Peo (59) 式(59)係指出:根據本發明之針對於整數DCT-IV轉換 的轉換元素係包含五個提升級。 由於最後的因式分解式係被決定,該方法係停止於步 26 200527224 * 驟 3 1 0。 第4圖係顯示根據本發明的方法之一個實施例的流程 圖400,其運用五個提升級,即:第一提升級4〇ι、第二提 升級402、第二提升級403、第四提升級4〇4與第五提升級 405。此方法係車父佳被運用於第j圖之IntMDcT裝置 與第2圖之逆向IntMDCT裝置2〇6,以分別施行intMD(:T 與逆向IntMDCT。於第4圖,^與係分別為數位訊號之 第一與第二區塊,^、^與^係中間訊號,且與&係分 別為對應於數位訊號之第一與第二區塊的輸出訊號。 第5圖係顯示根據本發明的方法之一個實施例的流程 圖,其中,轉換函數係一 DCT-IV轉換函數。被運用於此實 施例之轉換元素係對應於式(59),即,其為由第3圖所示的 方法之實施例所決定者。 轉換元素係包含五個提升級,其對應於式(59)之五個提 升矩陣。 再者,轉換元素係包含一資料混洗(shuffling)級,其對 應於置換矩陣&。 於第5圖,第一提升級之輸入是數位訊號之二個區塊 以_與&,而UL與系中間訊號,且乂1_與此係分別為對 應於數位訊號之第一與第二區塊的輸出訊號。 轉換元素之輸入I及轉換元素的第一提升級之二個輸 入區塊毛7與係滿足下式: (6〇) (請參閱式(37))。 27 200527224 下文,第一提升級501係被解說,其對應於提升矩陣& 之提升級。 2 令為第一提升級之輸出向量,其暫時未化整至整數 值 即 (61) 運用「由式⑼)所提供之㉔定義,式(61)係改寫為: (62) Γ Π ~2 ί!/ _ __2_
由於此實施例中,針對於整數DCT-IV之一種可逆式演 算法係被提供,因此其包括一至整數值的化整運算。故, 根據式(62),於第一提升級5〇1之第一步驟5〇6中,々係乘 以么。此相乘之結果係於步驟507被化整至整數值。於步 驟508中,化整的值係接著被加至公。因此,中間訊號乙 係滿足下式: ~ 么=[^·五」+佥 (63)
其中,[*」係表示化整運算。 由於第5圖所示之轉換元素的其他四個提升級5〇2、 503、504、505 (其分別為對應於矩陣4、5、么與係具有 如同第一提升級501之相同的結構,故其解說係被省略。 僅須注意的是:於第二提升級502之相加步驟509中,根 據工之定義,。係乘以。 下文,反向轉換之轉換元素的提升級係參照第6圖而 加以解說。 第6圖係說明於第5圖所示之轉換的反向轉換之轉換 28 200527224 元素的提升級。 於第6圖,第一提升級之輸入是數位訊號之二個區塊 1與以,而仏與化係中間訊號,且l與包係分別為對 應於數位訊號之第一與第二區塊的輸出訊號。 於第6圖所示的最後一個提升級605係逆向於第5圖 所示的第一提升級501。故,於最後一個提升級6〇5之第一 步驟606,係乘以么。此相乘之結果係於步驟6〇7被化整 至整數值。於步驟608,化整的值係接著從L減去。因此, sfl ^虎^^係滿足下式: 佥= (64) 其中,L*」係表示化整運算。 由於第6圖所示之轉換元素的其他四個提升級601、 602 603、604 (其分別為逆向於提升級505、504、503、502) 係具有如同最後一個提升級6〇5之相同的結構,故其解說 係被省略。僅須注意的是:在第四提升級604的相加步驟 6〇9之後,相加步驟6〇9之結果係乘以—~而產生 可看出的是:第6圖之提升級605、604、603、602與 601係分別為逆向於第5圖之提升級5〇1至5〇5。此外,由 於對應於矩陣匕之輸入訊號的置換係可被反向且因此一個 貝料混洗級係包含逆向的轉換元素,所提供的方法是可逆 的’因此’若運用於第1與2圖所示之音訊編碼器1 〇〇與 音訊解碼器200,則其係提供一種用於無損耗式音訊編碼之 方法及裝置。 運用於此實施例之化整的數目之分析係說明於本發明 29 200527224 之敘述的結尾處。 第7圖係顯示根據本發明的一個實施例之一種影像存 檔(archiving)系統的架構。
/於第7圖’—影像源7()1 (例如:照相機)係提供一個類 々像Λ號3亥影像汛號係由一個類比至數位轉換器7〇2 所處理’以提供—個對應的數位影像訊號。該數位影像訊 號係藉由-個無損耗影像編碼器7()3而無損耗式編碼,該 、扁馬器703係包括自時域至頻域之轉換。於此實施例,時 域係對應於影像之座標空間。無損耗式編碼的影像訊號係 儲存於一個儲存裝4 7〇4,例如:硬碟《则。當需要該 影像時’無損耗式編碼的影像訊號係提取自冑存裝置剔 且提供至一個無損耗影像解碼器705,其係解碼無損耗式編 碼的影像訊號且重建原始的影像訊號而無任何資料喪失。 影像訊號之此種無損耗式的存檔是重要的,舉例而 言,假設影像係半導體晶圓之誤差圖(map)且必須儲存以供 稍後的分析之情形。 μ 下文,根據本發明之用於由時域至頻域及反向之數位
訊號轉換的方法之又-個實施例係被解說。此實施例係較 佳為運用於第7圖所示之影像存㈣統的無損耗影像編碼 為7 0 3與無損耗影像解碼器7 〇 5。 第8圖係說明根據本發明的方法之一個實施例,其運 用DWT-IV作為轉換函數。 八 一個點的實數輸入序歹ιΜ收DWT_IV係定義為如 後· 30 200527224 n=0
π (m + l/2)(n -f \/2)2π N m9n = 〇X--9N^i (65) DWT-IV之轉換矩陣係給定為 K:· π | (ηι^1/2)(η^1/2)2π 4 Ν (66) 根據本發明之方法,DWT-IV矩陣係因式分解為以下 形式: (67) ^係一個旋轉矩陣,其定義為: IN 丨1 J N/2 的 R, 'Έ
JN /2 IN 丨1 (68)
1 N/2 係階數(order)為N/2之單位矩陣(參閱式(29)),而J多 係階數為N/2之反單位矩陣(參閱式(3〇))。 4係一個置換矩陣: 1 N/2
JN /2 (69) I:係一個矩陣,其給定為:
T
Civ rIV ΖΛ'λ —c"/2— 9^I2DNI2 C^/2DN/2 (70) 其中,^係階數為N/2之DCT-IV矩陣:
lN 丨2_ : i(m) cos (^ + 1/2)(η^ι/2)π(m) (71) 階數為N/2之對角矩陣,其給定為: 一 1 N/2 (72) 一 1 矩陣明之方法’…係可〜式分解為提升 31 /2 (73) /2 (73) IΝ/2 「I • ~ ---- .£2; lull IΝ 丨1 - IΝ丨2 一 ..細 Κ3 I ν η— Nnf^n ΚΊ 200527224 ΐ>τ'τ2τ\ 其中, K'={fil訊 Ο
h.^^l2PNI2-IK 且 Rn = RlR2R3 IN丨2 IN/2 其中, = = -tan(^/8)· ljm I n n % -0.414 N/2 -0.414 (74) (75) ;0.414 及 H2 = sin(;r/4)· f N/2 0.707 0.707. (76) 0.707 因此,式(67)係可改寫為以下的形式: = R1R2R3TiT2T,I\t (77) 根據本發明之方法,提升級係儘可能被集成。 於此實施例,提升矩陣么與&係可集成至提升矩陣^ S = RT — ~ y (78) 由式(77)與(78),針對於〇界丁-1¥矩陣之以下的因式分 解式係可得到: ^ = %s τ2τ3% (79) 式(79)係指出的是:根據本發明之針對於整數DWT-IV 轉換的轉換元素係包含五個提升級。 再者,轉換元素係包含一資料混洗級,其對應於置換 32 200527224 矩陣么。資料混洗級係重新排列於各個輸入資料區塊之成 分的次序。根據么,輸入資料向量係以下列方式重新排列: 向量之第一半部係保持為不變;向量之第二半部係倒轉, 即: Χχ ^2 Χ2 ΧΝ/2 ΧΝ/2 ΧΝ/2+\ ΧΝ ; ΧΝ-\ ΧΝ-\ • ^ ΧΝ _ 一ΧΝΙΙλΛ _ (80) 於第8圖,第一提升級之輸入是數位訊號之二個區塊 k與公,而以、仏與仏係中間訊號,且與I係分別為對 應於數位訊號之第一與第二區塊的輸出訊號。 轉換元素之輸入及轉換元素的第一提升級之二個輸 人區「气〜與係滿足下式: (81) 下文,第一提升級801係被解說,其係為對應於提升 矩陣丛之提升級。 令 值,即: V2 — — -η χΛ V2 -J -1 為第一提升級之輪出向量,其暫時未化整至整數 (82) 一 π Ί Ν Ί _ Ν ~2 ν2 ---J Χ2 L— 編 33 (83) 200527224 由於此實施例,針對於整數DWT-IV之一種可逆式演 算法係被提供,其為包括一至整數值的化整運算。故,根 據式(83),於第一提升級8〇1之第一步驟8〇6,红^系乘以么。 此相乘之結果係於步驟807被化整至整數值。於步驟808, 化整的值係接著被加至&。因此,中間訊號L係滿足下式: 佥= 佥 (84) 其中,L*」係表示化整運算。 由於苐8圖所示之轉換元素的其他四個提升級go】、 8〇3、8〇4、8〇5 (其分別為對應於矩陣&、$、么與係具有 鲁 如同第一提升級801之相同的結構,故其解說係被省略。 僅須注意的是:於第二提升級802之相加步驟809,根據r2 之定義,係乘以。 下文,反向轉換之轉換元素的提升級係參照第9圖而 被解說。 第9圖係說明於第8圖所示之轉換的反向轉換之轉換 疋素的升級。 於第9圖,第一提升級之輸入是數位訊號之二個區塊馨 1/_與Zl,而以、仏與心一係中間訊號,且匕與系分別為對 應於數位訊號之第一與第二區塊的輸出訊號。 於第9圖所示的最後一個提升級905係逆向於第8圖 所示的第一提升級8〇1。故,於最後一個提升級9〇5之第一 步驟906,係乘以么。此相乘之結果係於步驟9〇7化整至 整數值。於步驟9〇8,化整的值係接著從k減去。因此,訊 號心_係滿足下式: 34 (85) 200527224 其中’ [%」係表示化整運算。 由於第9圖所示之轉換元素的其他四個提升級9〇1、 902、903、904 (其分別為逆向於提升級805、804、803、與 802)係具有如同最後一個提升級9〇5之相同的結構,故其解 說係被省略。僅須注意的是:在第四提升級904的相力1步 驟909之後,相加步驟9〇9之結果係乘以^而產生心。 可看出的是··第9圖之提升級9〇5、9〇4、9〇3、902、 與901係分別為逆向於第8圖之提升級8〇1至8〇5。此外, 由於對應於矩陣么之輸入訊號的置換係可被反向且因此一 貧料混洗級係包含逆向轉換元素,整體所提供的方法是可 延的Θ此’右運用於第7圖所示之無損耗影像編碼器7〇3 與無損耗影像解碼器7〇5,則其係提供一種用於無損耗式影 像編碼之方法及裝置。 雖'然於解說的實施财,針對於DCT_lv之根據本發明 =係運用於音訊編碼且針對於DWT_Iv之根據本發明 方^運用於影像編碼,但是針對於沉㈣之根據本發 太 ㈣可利於影像編碼,針對於DWT_IV之根據 本發明的方法同樣可土軍據 用於豆# ; 9汛編碼,且二者均同樣可運 用於其他的數位訊號· ^ 、 現(渚如·視訊訊號)之編碼。 考慮式(63)與(64),可看屮μ Η ,化整,,考慮式::的^^ 本發明之DCT-IV演曾、& 、疋十對於根據 五倍,即.心ΓΓ 元素之總化整數目係屬之 即.—其顯著較低於根據現有技藝者之態Μ。 35 200527224 同樣,考慮式(59),可看出的是:當#係一個大的值, 例如:7V =加2 4時,大部分的計算能力係運用於對應於與以2 的相乘之四個A/72點DCT-IV子程序。因為浮點DCT-IV係 可運用一個半長度DC T-IV加上前置旋轉與後置旋轉且根 據式(47)與(49)而計算,因此提出的整數DCT-IV之算術複 雜度係粗略估計為浮點DCT-IV者之二倍。 一個類似的結論係可針對於整數DWT-IV轉換函數而 導出。 下文,另一個實施例係被解說,其中,轉換係一種離 散傅立葉轉換。 轉換矩陣细係階數#之正規化(normalized)FFT的轉換 矩陣,其給定為·· Εν exp 、N J」 (86) m, η = 0, 1, ··· , N - 1 其中,轉換尺寸#係偶數。 依照分時(decimation-in-time)之基底 2 (radix-2)的 FFT 演算法,取係可分解為如後:
In / 2/^ In / 2/^ ίΝ/ 2 5n / 2 _In / 2/^/2 -In / 2/^. w ^/2 . 參 工八T /Γ νΊ (87) 其中,如上所述,&〇係一個偶奇矩陣,即:一個重新 排列一個向量Z的成分之轉置矩陣 χ(〇)
X x(N - 1) ,其係藉由分離對應於偶數索引的成分與對應於奇數 索引的成分,俾使: 36 (88) 200527224 x(〇) x(2) x(N - 2) x(l) x(3) x(〇) x(N - 1) x(N - 令Ik/2為階數#/2之正規化FFT的轉換矩陣 再者,令為一個對角矩陣,其給定為: 「喵 1 w
喵"-I 其中,% = e-:ΐ2π / N 。 如上所述’以/ 2係表示階數WO之單位矩陣。 於式(87)中,從右側數來的第一個矩陣是一個偶奇矩陣 &〇,其僅為重新排序輸入向量中之成分。 於式(87)中,從右側數來的第二個矩陣係可因式分解為 二個提升矩陣,如後: 函/ 2_ Jk/ 2 _ Q 0 ~Q In / 2 In / 2 ' L ίΝ/ 2. Jn / 2 In / 2_ (89) ❿ ίΝ / 2 r^^/2 In/2. 其,’ i是一個階數iV/2的置換矩陣,其給定為: 0 切 2-1_ 且办/ 2一1疋階數#/2-1的反(counter)索引(index)矩陣。 於式(87)中,從右側數來的第三個矩陣是一個反對角矩 陣,其僅將輪入向量中之成分的半數者乘以位於單位圓上 的一個複數。 此係可被解讀為於複數平面上之一旋轉。 37 200527224 令為輸入向量中之一成分。 再者,令 读=e~~j2k71 / N = c〇s (2k7i / N) - j sin (2k7i / N) = Ck - j % 為複 數,即:當輸入向量(在其已經乘以式(87)之自右側數來的 第一個矩陣與於右側數來的第二個矩陣之後)乘以W—時 之成分係乘以X。 結果係 y = Yr + jyi =邊X = (Ckxr + SkXi) + j(ckxi - Skxr),其 係等於x在複數平面逆時針方向旋轉2以/#半徑範圍。該旋轉 係可因式分解為三個提升級,如後: 'λ" = Ck Sk ΊΓXr 1 〇- c-1 . 1 5 1 0" c-1 n V 人 rsk ck\[x^ 1 _ S . _0 1_ -0 _ s _ 人
X (90) 於式(87)中,自右側數來的第四個矩陣係可因式分解為 個提升矩陣,如後: ίΝ/2/>/2 IN/2/V2 .iN/2/V2 -IN/2/V2 W - In / 2 In / 2 In/2 _ In/2 _ ^N/ 2 _ _ In/ 2 _ -丄)In / 2 In / 2 (91)
分頻(decimation-in-frequency)之基底 2 (radix-2)的 FFT 演算法係僅為式(87)之分時之基底2的FFT演算法之轉置 (transposition)。 因此’以上的程序亦適用於因式分解以分頻之方式的 FFT矩陣故。 運用式(87)之右側的因式分解於提升矩陣,藉著產生對 應於各個提升矩陣之一個提升級,一轉換元素係被決定出。 由於上文已經詳述提升級是如何根據提升矩陣而產 38 200527224 生,且於此實施例中其係類似如上述般地運作,因此其解 說在此係予以省略。 [納入參考文獻] 以下的文獻係以參照方式而納入本文: Π] H. S. Malvar,“Signal Processing with Lapped
Transforms” dr/ecA 1992.
[2] R· Geiger,T· Sporer,J. Koller,K. Brandenburg, "Audio Coding based on Integer Transforms55 AES 111th Convention, New York, USA, Sept. 2001. 【圖式簡單說明】 第i圖係顯示根據本發明的一個實施例之一種音訊編 碼器的架構; 第2圖係顯示根據本發明的一個實施例之一種音訊解 碼裔的架構’該音訊解碼器係對應於帛丨圖所示之音訊編 碼器;
第3圖係顯示根據本發明的方法之一個實施例,其中 轉換函數係一 DCT-IV轉換函數; 苐4圖係顯示根據本發 知5的方法之一個實施例的流 圖; 運用 第5圖係說明根據本發 DCT_IV作為轉換函數; 明的方法之一個實施例,其係 第6圖係說明針對於第$ 之實施例的反向轉換之演算法圖所不之根據本發明的方法 苐7圖係顯不根據本發明的一個實施例之一種影像存 39 200527224 檔系統的架構; 第8囷係況明根據本發明的方法之一個實施例,其運 用DWT-IV作為轉換函數;及 第9圖係說明斜斜%| — ^針對於# 8 _示之根據本發 之貫施例的反向轉換之演算法。 的方法 【主要元件符號說明】 1〇〇 :音訊編碼器 1 0 1 : M D C Τ 裝置
1 〇 2 ·•感知模型 1〇3 :量化器 1 04 :位元流編碼器 105 : IntMDCT 裝置 1 06 :逆向量化器 107 ·•化整單元 108 :熵編碼器 109 :音訊訊號 110 :麥克風 111 :類比至數位轉換器 1 1 2 ·感知編碼的位元流 1 1 3 :無損耗增強的位元流 200 :音訊解碼器 201 :位元流解碼器 202 :逆向量化器 203 :逆向MDCT裝置 40 200527224 204 :熵解碼器 205 :化整裝置 206 :逆向IntMDCT裝置 207 :感知編碼的位元流 208 :無損耗增強的位元流 2 0 9 ··感知編碼的音訊訊號 2 1 0 :無損耗編碼的音訊訊號
3 00-3 10 :第3圖之方法的步驟 400 :第4圖之流程圖 401-405 :提升級 501-505 :提升級 5 06 :相乘 507 :化整 508、509 :相加(相減) 601-605 :提升級
606 :相乘 607 :化整 608、609 :相加(相減) 701 :影像源 702 :類比至數位轉換器 703 :無損耗影像編碼器 704 :儲存裝置 705 :無損耗影像解碼器 801-805 :提升級 41 200527224 806 :相乘 807 :化整 808、809 :相加(相減) 901-905 :提升級 906 :相乘 907 :化整 908、909 ··相加(相減)
42

Claims (1)

  1. 200527224 十、申請專利範圍: i-種用於決定一特定轉換函數之一轉換元素之方 法,該轉換函數係包含-轉換矩陣且對應於由時域至頻域 或反向之數位訊號的轉換,其中·· 一 …該㈣矩陣係分解成一個旋轉矩陣與一個輔助矩陣, D亥輔助矩陣當乘以其本身時係等於__個置換矩陣乘以 整數對角矩陣; 該旋轉矩陣與輔助矩陣係各自分解成複數個提升矩 陣; 該轉換元素係被決定為包含對應於該些提升矩 數個提升級。 一 2.如申請專利範圍第β之方法,其中,該轉換函數係 - DCT]轉換函數、DCT_IV轉換函數、轉換函數、 DST-IV轉換函數、耐]轉換函數、耐^轉換函數、 DWT-I轉換函數、或DWT_IV轉換函數。 7 3·如申請專利範圍帛1項之方法,丨中,該等提升矩陣 人各為區塊_肖矩p車,其具有三個可逆的整數矩 角線。 、對 4. 如申請專利範圍帛3項之方*,其中,於各個提升矩 陣中之可逆的整數矩陣係單位矩陣或負單位矩陣。 5. 如申請專利範圍第丨至4項中之任一項之方 1 中,該轉移元素係包含五個提升級。 ,/、 ,6一:申請專利範圍第1纟4項中之任-項之方法,其 中,一音訊訊號或一視訊訊號係被運用作為該數位訊號。 43 200527224 7.-種用於決定-特定轉換函數之—轉換元素之裝 置,該轉換函數係、包含一轉換矩陣且對應☆由時域至頻域 或反向之數位訊號的轉換,該裝置係包含·· 5 -第-分解單元,其係詩分解該轉換矩陣成為—個 :疋轉矩陣與—個輔助矩陣,該輔助矩陣當乘以其本身 等於一個置換矩陣乘以一個整數對角矩陣; 、“ -第二分解單元,其制於分解該旋轉矩陣與輔助矩 陣而各自成為複數個提升矩陣; * -決定單元,其係用於決^該轉換元素為包含對心 *亥些提升矩陣之複數個提升級。 μ ; 8.-種用於將—數位訊號由時域轉換至頻域或反 、之方法,其係運用一轉換元素,其中: :轉換元素係對應於一個特定轉換函數 :包含:個轉換矩陣,其中,該轉換元素係由一種方二 成疋,該方法係包含: :解該轉換矩陣成為一個旋轉矩陣與一個輔助矩陣, 整數對乘以其本身時係等於一個置換矩陣乘以-個 陣; 分解該旋轉矩陣與輔助矩陣而各自成為複數個提升矩 矩陣之複數個 θ決定該轉換元素為包含對應於該些提升 提升級; 各個提升級係包含該數位訊號 Mi,. ❿现的于^塊之處理,其倍 错由輔助轉換且藉由一個化整單元。 八係 44 200527224 9· 一種用於將一數位訊號由 換之裝置,其係包含用”由::轉 或反向轉 號之一轉換單元,其中:、错由—轉換元素來轉換該數位訊 該轉換元素係對應於—個特定轉換函數,該轉 係包含一個轉換矩陣,其中,兮 、八數 決定,該方法係包含:"轉換%素係由—種方法所 :解該轉換矩陣成為一個旋轉矩陣與一個輔 =:乘以其一於-個置換矩陣乘以-個 陣;分解該旋轉矩陣與辅助矩陣而各自成為複數個提升矩 決定該轉換元素為包含對應於該些提升矩陣之複數個 提升級; ^針對於各個提升級,該裝置係包含用於處理該數位訊 =子區塊之一個輔助轉換單元、以及用於處理該數位訊 號的子區塊之一個化整單元。 1〇_一種電腦可讀取媒體,其係具有記錄於其上之一程 2 ’其中’該程式係適於使得電腦實施一種用於決定一特 疋轉換函數之一轉換元素之方法,該轉換函數係包含一個 轉換矩陣且對應於由時域至頻域或反向之數位訊號的轉 換,其中: 該轉換矩陣係分解成一個旋轉矩陣與_個輔助矩陣, 该輔助矩陣當乘以其本身時係等於一個置換矩陣乘以一個 整數對角矩陣; 45 200527224 "亥旋轉矩陣與輔助矩陣係各 陣; 分解成為複數個提升矩 該轉換元素係被決定為包含對應 數個提升級。 於該些提升矩陣之複 種電腦可讀取媒體,其係具有記錄 1匕録於具上〜 鮮11 ’、該程式係適於使得電腦實施—種用於將κ 換:素日轉換至頻域或反向轉換之方法,其係運用-I 該轉換元素係對應於一個特定轉換函數,該轉換函凄 係=含一個轉換矩陣,其中,該轉換元素係由一種方法片 決定,包含·· j
    刀解该轉換矩陣成為一個旋轉矩陣與一個輔助矩陣, 辅助矩陣當乘以其本身時係等於一個置換矩陣乘以 整數對角矩陣; 分解該旋轉矩陣與輔助矩陣而各自成為複數個提升矩 決定該轉換元素為包含對應於該些提升矩陣之複數個 鲁 提升級; 各個提升級係包含該數位訊號的子區塊之處理,其係 藉由辅助轉換且藉由一個化整單元。 十一、囷式: 如次頁 46
TW093129241A 2003-09-29 2004-09-27 Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium TW200527224A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US50721003P 2003-09-29 2003-09-29
US50744003P 2003-09-29 2003-09-29
PCT/SG2004/000122 WO2005031597A1 (en) 2003-09-29 2004-05-06 Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium

Publications (1)

Publication Number Publication Date
TW200527224A true TW200527224A (en) 2005-08-16

Family

ID=34396342

Family Applications (3)

Application Number Title Priority Date Filing Date
TW093129241A TW200527224A (en) 2003-09-29 2004-09-27 Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium
TW093129238A TWI348282B (en) 2003-09-29 2004-09-27 Method for performing a domain transformation of a digital signal from the time domain into the frequency domain and vice versa
TW093129239A TWI343534B (en) 2003-09-29 2004-09-27 Method for transforming a digital signal from the time domain into the frequency domain and vice versa

Family Applications After (2)

Application Number Title Priority Date Filing Date
TW093129238A TWI348282B (en) 2003-09-29 2004-09-27 Method for performing a domain transformation of a digital signal from the time domain into the frequency domain and vice versa
TW093129239A TWI343534B (en) 2003-09-29 2004-09-27 Method for transforming a digital signal from the time domain into the frequency domain and vice versa

Country Status (8)

Country Link
US (3) US20070276894A1 (zh)
EP (3) EP1668534A4 (zh)
JP (3) JP2007507790A (zh)
KR (2) KR100885437B1 (zh)
MX (2) MXPA06003509A (zh)
MY (2) MY137920A (zh)
TW (3) TW200527224A (zh)
WO (3) WO2005031595A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US20070276894A1 (en) * 2003-09-29 2007-11-29 Agency For Science, Technology And Research Process And Device For Determining A Transforming Element For A Given Transformation Function, Method And Device For Transforming A Digital Signal From The Time Domain Into The Frequency Domain And Vice Versa And Computer Readable Medium
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7574064B2 (en) * 2005-04-12 2009-08-11 The Aerospace Corporation Fast lifting lossless wavelet transform
US7577307B2 (en) * 2005-04-12 2009-08-18 The Aerospace Corporation Fast adaptive lifting lossless wavelet transform
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US20100292986A1 (en) * 2007-03-16 2010-11-18 Nokia Corporation encoder
US20080288568A1 (en) * 2007-05-14 2008-11-20 Hou Hsieh S Low power Fast Hadamard transform
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
US8548815B2 (en) * 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8885701B2 (en) * 2010-09-08 2014-11-11 Samsung Electronics Co., Ltd. Low complexity transform coding using adaptive DCT/DST for intra-prediction
US8995532B2 (en) * 2010-09-30 2015-03-31 Texas Instruments Incorporated Low complexity large transform
US10068577B2 (en) 2014-04-25 2018-09-04 Dolby Laboratories Licensing Corporation Audio segmentation based on spatial metadata
EP3134897B1 (en) 2014-04-25 2020-05-20 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs
CN105895109B (zh) * 2016-05-10 2019-02-26 信阳师范学院 一种基于dwt和dct的数字语音取证和篡改恢复方法
KR20180089858A (ko) * 2017-02-01 2018-08-09 엘지전자 주식회사 레이어드 기븐스 변환을 이용하여 변환을 수행하는 방법 및 장치
EP3616196A4 (en) 2017-04-28 2021-01-20 DTS, Inc. AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4031038A (en) * 1975-06-16 1977-06-21 The Dow Chemical Company Water insoluble chelate exchange resins having a crosslinked polymer matrix and pendant thereto a plurality of methyleneaminopyridine groups
US5339265A (en) * 1992-08-31 1994-08-16 University Of Maryland At College Park Optimal unified architectures for the real-time computation of time-recursive discrete sinusoidal transforms
US5523847A (en) 1992-10-09 1996-06-04 International Business Machines Corporation Digital image processor for color image compression
DE69511064T2 (de) * 1994-11-09 2000-02-24 Koninkl Philips Electronics Nv System und verfahren zur übertragung von bild- oder tonsignalen
US5999656A (en) * 1997-01-17 1999-12-07 Ricoh Co., Ltd. Overlapped reversible transforms for unified lossless/lossy compression
US6058215A (en) * 1997-04-30 2000-05-02 Ricoh Company, Ltd. Reversible DCT for lossless-lossy compression
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6421464B1 (en) * 1998-12-16 2002-07-16 Fastvdo Llc Fast lapped image transforms using lifting steps
WO2000055757A1 (en) * 1999-03-17 2000-09-21 The Johns Hopkins University A fast multiplierless transform
US6681052B2 (en) * 2000-01-15 2004-01-20 Sony Corporation Methods and systems for performing inverse quantization and inverse weighting of DV video
AU2002220233A1 (en) * 2000-12-01 2002-06-11 Lizardtech, Inc. Method for lossless encoding of image data by approximating linear transforms and preserving selected properties
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
JP3971135B2 (ja) * 2001-07-11 2007-09-05 株式会社テクノマセマティカル Dct行列分解方法及びdct装置
US7082450B2 (en) * 2001-08-30 2006-07-25 Nokia Corporation Implementation of a transform and of a subsequent quantization
JP3796432B2 (ja) 2001-10-31 2006-07-12 キヤノン株式会社 フィルタ処理装置およびフィルタ処理方法
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
JP3902990B2 (ja) * 2002-07-02 2007-04-11 キヤノン株式会社 アダマール変換処理方法及びその装置
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US20070276894A1 (en) * 2003-09-29 2007-11-29 Agency For Science, Technology And Research Process And Device For Determining A Transforming Element For A Given Transformation Function, Method And Device For Transforming A Digital Signal From The Time Domain Into The Frequency Domain And Vice Versa And Computer Readable Medium

Also Published As

Publication number Publication date
EP1668534A1 (en) 2006-06-14
WO2005031597A1 (en) 2005-04-07
US8126951B2 (en) 2012-02-28
TW200524290A (en) 2005-07-16
TW200529040A (en) 2005-09-01
EP1668533A4 (en) 2013-08-21
JP4942793B2 (ja) 2012-05-30
JP2007507790A (ja) 2007-03-29
WO2005031596A1 (en) 2005-04-07
MXPA06003509A (es) 2007-01-25
US8126950B2 (en) 2012-02-28
JP2007507789A (ja) 2007-03-29
JP4429316B2 (ja) 2010-03-10
KR100885437B1 (ko) 2009-02-24
TWI348282B (en) 2011-09-01
MXPA06003508A (es) 2007-01-25
WO2005031595A1 (en) 2005-04-07
EP1687736A1 (en) 2006-08-09
US20080030385A1 (en) 2008-02-07
EP1668534A4 (en) 2013-08-21
KR100885438B1 (ko) 2009-02-24
EP1668533A1 (en) 2006-06-14
US20070276893A1 (en) 2007-11-29
JP2009266250A (ja) 2009-11-12
MY137920A (en) 2009-03-31
MY139788A (en) 2009-10-30
US20070276894A1 (en) 2007-11-29
KR20070026325A (ko) 2007-03-08
KR20070015363A (ko) 2007-02-02
TWI343534B (en) 2011-06-11

Similar Documents

Publication Publication Date Title
TW200527224A (en) Process and device for determining a transforming element for a given transformation function, method and device for transforming a digital signal from the time domain into the frequency domain and vice versa and computer readable medium
JP4994655B2 (ja) 効率的な損失なしデータ圧縮のための可逆重ね合わせ演算子
Oraintara et al. Integer fast Fourier transform
JP4439522B2 (ja) 離散値のシーケンスを有する信号を処理するための装置および方法
AU2004300713B2 (en) Device and method for conversion into a transformed representation or for inversely converting the transformed representation
TW200923913A (en) Encoding and/or decoding digital content
RU2323469C2 (ru) Устройство и способ для обработки, по меньшей мере, двух входных значений
TW200947419A (en) Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
JP3814611B2 (ja) 時間離散オーディオサンプル値を処理する方法と装置
Parfieniuk et al. Quaternion multiplier inspired by the lifting implementation of plane rotations
WO2023118138A1 (en) Ivas spar filter bank in qmf domain
EP1692686A1 (en) Audio signal coding
Chen Design and application of quincunx filter banks