TWI463790B - 用於信號分析與合成之適應性混成變換技術(一) - Google Patents
用於信號分析與合成之適應性混成變換技術(一) Download PDFInfo
- Publication number
- TWI463790B TWI463790B TW100140903A TW100140903A TWI463790B TW I463790 B TWI463790 B TW I463790B TW 100140903 A TW100140903 A TW 100140903A TW 100140903 A TW100140903 A TW 100140903A TW I463790 B TWI463790 B TW I463790B
- Authority
- TW
- Taiwan
- Prior art keywords
- transform
- spectral
- coefficients
- signal
- sets
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 6
- 238000004458 analytical method Methods 0.000 title abstract description 42
- 230000015572 biosynthetic process Effects 0.000 title abstract description 23
- 238000003786 synthesis reaction Methods 0.000 title abstract description 23
- 230000004044 response Effects 0.000 claims abstract description 13
- 238000002789 length control Methods 0.000 claims abstract 6
- 230000003595 spectral effect Effects 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 46
- 230000009466 transformation Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 17
- 238000013139 quantization Methods 0.000 claims description 7
- 230000006978 adaptation Effects 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000006870 function Effects 0.000 description 45
- 239000000872 buffer Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 230000003068 static effect Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 238000000844 transformation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000021317 sensory perception Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- FMTDIUIBLCQGJB-SEYHBJAFSA-N demeclocycline Chemical compound C1([C@@H](O)[C@H]2C3)=C(Cl)C=CC(O)=C1C(=O)C2=C(O)[C@@]1(O)[C@@H]3[C@H](N(C)C)C(O)=C(C(N)=O)C1=O FMTDIUIBLCQGJB-SEYHBJAFSA-N 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Discrete Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Resistance Or Impedance (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereo-Broadcasting Methods (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Control Of Eletrric Generators (AREA)
Description
概略言之本發明係關於信號分析與合成濾波器排組,例如可用於音訊及視訊編碼系統之信號分析與合成濾波器排組。特別,本發明係關於藉區塊變換串接而實作之分析與合成濾波器排組,該區塊變換可調整適應該濾波器排組之時間解析度及頻率解析度。
編碼系統常用來減少適當表示一來源信號所需之資訊量。經由減少資訊容量需求,信號表示可透過有較低頻寬之通道發射,或使用較少空間來儲存於媒體。編碼經由去除信號中之冗餘成分或不相關成分來減少一來源信號之資訊容量需求。此種感官知覺編碼方法及系統經常使用濾波器排組,經由使用一頻譜成分基本集合解除一來源信號之關聯,來減少冗餘,以及經由根據心理-知覺標準藉適應性量化頻譜成分來減少不相關性。
多種知覺編碼系統可藉區塊變換來實作濾波器排組。於音訊編碼系統,例如由時間節段或時域樣本區塊表示之一來源音訊信號,被變換成為表示該來源信號之頻譜內容之頻域係數集合。節段長度建立濾波器排組之時間解析度及頻率解析度。時間解析度隨著節段長度之減少而增加。頻率解析度隨著節段長度之增加而增加。由於此種關係故,節段長度之選擇造成區塊變換濾波器排組之時間解析度與頻率解析度間之折衷。
並無任何單一節段長度選擇可提供典型編碼系統所遭遇之全部來源信號條件之解析度間之優化折衷。若濾波器排組有較高頻率解析度,其可經由使用較長節段長度提供,則緩慢變化之來源信號或靜態來源信號通常可較為有效編碼。若濾波器排組有較高時間解析度,其可經由使用較短節段長度提供,則快速變化之來源信號或高度非靜態來源信號通常可較為有效編碼。經由回應於變化之來源信號條件,調整適應該節段長度,一區塊變換濾波器排組可獲得其時間解析度與頻率解析度間之優化折衷。
多種變換可用於音訊編碼系統實作濾波器排組,但例如一特殊修改之離散餘弦變換(MDCT)廣為人使用,原因在於其用於音訊編碼有若干極具吸引力之性質,包括MDCT可提供關鍵取樣,同時允許相鄰的來源信號節段彼此重疊。MDCT也具有吸引力,原因在於MDCT實質上可去除於一節段內部為實質靜態之一來源信號的實質全部冗餘成分。MDCT濾波器排組之適當操作要求使用重疊來源信號節段、及視窗函數其可滿足某些標準,例如述於Princen等人,「使用基於時域亂真抵消之濾波器排組設計之子頻帶/變換編碼」,1987年國際聲音、語言及信號處理會議(ICASSP)議事錄,1987年5月,2161-64頁。不幸,由於對必須施加至重疊來源信號節段之視窗函數所加諸之要求,難以回應於信號條件,調整適應MDCT濾波器排組之時間解析度及頻率解析度。
一種某些情況下稱作為「視窗切換」之已知技術經由回應於檢測的某些信號條件(例如信號突然改變或振幅變遷),可介於二視窗函數間適應性切換來調整MDCT濾波器排組之時間解析度。根據此項技術,該技術述於Edler之美國專利5,214,742,核發日期1993年5月5日,節段長度不變,但時間解析度調整適應,其適應方式係經由介於二不同視窗函數形狀間切換來減少藉該濾波器排組所換變之各個節段內部之非零樣本數目。不幸,此項技術並未調整適應濾波器排組之頻率解析度,每當時間解析度降低,則濾波器排組之頻率選擇性嚴重變差,原因在於視窗切換所需視窗函數形狀須次於最佳,來滿足MDCT適當操作的要求。
另一項於某些情況下稱作為「區塊切換」之已知技術係類似前文說明之視窗切換技術,前者也介於不同視窗函數形狀間切換,但區塊切換技術可調整適應MDCT濾波器排組之時間解析度及頻率解析度二者,其方式係經由回應於檢測得若干信號條件(例如信號突然改變或振幅變遷),也介於二不同節段長度間做適應性切換。此項技術用於先進音訊編碼(AAC),述於Bosi等人「ISO/IEC MPEG-2先進音訊編碼」J. Audio Eng. Soc.,45卷,第10期,1997年10月,789-814頁。
於AAC,MDCT濾波器排組應用於長度等於2048樣本之靜態來源信號節段,也應用至長度等於256樣本之非靜態來源信號節段。於AAC之區塊切換係經由使用下列功能達成「長視窗函數」其適合用於較長節段,「短視窗函數」其適合用於較短節段,「長至短橋接視窗函數」其允許由較長節段長度切換至較短節段長度,以及「短至長橋接視窗函數」其允許由較短節段長度切換至較長節段長度。二橋接視窗函數允許不同節段長度間切換,同時滿足MDCT適當操作所需標準。由較長節段長度切換至較短節段長度,以及切換返回較長節段長度係藉下述方式達成:經由使用長至短橋接視窗函數施加MDCT至一長節段,經由使用短視窗函數施加MDCT至一8個短節段之整數倍數,以及經由使用該短至長橋接視窗函數施加MDCT至一長節段來達成。緊接隨後,MDCT必須應用至長節段,但長視窗函數也可使用,或若需要另一區塊切換,也可使用長至短橋接視窗函數。
雖然區塊切換確實提供一種調整適應MDCT濾波器排組之時間解析度及頻率解析度之方式,但因數種理由故,其並非理想解決之道。其中一項理由為變換之頻率選擇性於區塊長度切換期間變差,原因在於橋接視窗函數之形狀必須次於最佳,來允許節段長度的切換,以及滿足MDCT之適當操作要求。另一項理由為,切換無法發生於任何時間。如前文說明,MDCT必須緊接於切換至較長節段長度之後施加至另一長節段。無法即刻切換至較短長度。此種區塊切換技術並非理想解決辦法,原因在於切換機轉僅能提供二節段長度,而此種情況並非對全部信號條件而言為最佳情況。舉例言之,AAC之二節段長度並非最佳,原因在於AAC之較長節段長度及較短節段長度對大部分言語信號節段而言並非最佳。2048樣本節段對言語之非靜態性質通常為過長,而256樣本節段對於有效去除冗餘成分而言通常為過短。此外,有多種靜態信號,對該靜態信號而言比2048樣本更長之節段長度為更佳優化。結果,AAC效能因區塊切換調整適應MDCT濾波器排組之時間解析度及頻率解析度之能力有限因而效能受損。
另一型區塊切換用於編碼系統,該型區塊切換符合杜比數位編碼位元流標準。此種編碼標準偶而稱作AC-3,述於先進電視系統委員會(ATSC)A/52A文件名稱「數位音訊壓縮(AC-3)標準修訂版A」,2001年8月20日公告。AC-3編碼系統所用之區塊切換形式應用MDCT至512靜態信號樣本之來源信號節段、或256非靜態信號樣本之來源信號節段。AC-3編碼系統所用之區塊切換技術於做長度切換時可提供選擇上的更高彈性。此外,編碼效能對非靜態來源信號(例如言語)也合理良好;但更為靜態之信號之編碼效能受較長節段所提供之相對低頻解析度所限。
其它MDCT濾波器排組之時間解析度及頻率解析度之適應性控制技術說明於Davidson之美國專利5,394,473,核發日期1995年2月28日。若干技術允許MDCT濾波器排組使用視窗函數大致上應用至任何長度之節段,該技術比較其它已知技術可能提供之頻率響應為遠更佳的頻率響應。不幸,此等技術必須調整適應MDCT之核心函數或基本函數,因此,與既有位元流標準例如前述AC-3標準不相容。此等技術也屬於運算密集。
需要有更有效率及更有效之方式來調整藉例如MDCT等變換實作之濾波器排組之頻率解析度。較佳,解決之道必須提供實作,該實作可簡化該解決之道結合入系統,且可與既有位元流標準相容。此項目的可經由使用可藉區塊變換串級實作之混成變換濾波器排組來達成。
根據本發明之教示,分析與合成濾波器排組係藉混成變換實作,該混成變換包含一一次變換串級一或多二次變換。於一實作,一次變換為MDCT應用至彼此重疊半節段長度之來源信號節段;以及二次變換為DCT應用至一特殊頻率之MDCT係數跨時間之非重疊區塊。濾波器排組之頻率解析度可藉增加於藉一或多二次變換所變換之區塊中之係數數目來增高。該一或多二次變換可應用至MDCT係數區塊,該區塊有複數個係數係隨係數頻率而改變,藉此允許濾波器排組之頻率解析度以寬廣多種方式調整適應。
本發明之各項特色及其較佳具體例經由參照後文討論及附圖將更為明瞭,附圖中類似之參考編號表示數幅圖間之類似元件。後文討論及附圖僅供舉例說明之用,須了解絕非表示囿限本發明之範圍。
第1圖為一編碼系統所使用之發射器之示意方塊圖。
第2圖為一編碼系統所使用之接收器之示意方塊圖
第3圖為可用於實作本發明之各方面之裝置之示意方塊圖。
第4圖為結合本發明之各方面之分析濾波器排組之示意方塊圖。
第5圖為結合本發明之各方面之分析濾波器排組之示意方塊圖。
A.引言
本發明提供一種藉混成變換實作之濾波器排組,該混成變換之頻率解析度容易調整適應。第1圖及第2圖分別顯示可結合於本發明之各方面之音訊編碼系統中,發射器及接收器之示意方塊圖。所舉例說明之發射器及接收器之特色簡短討論於以下各章節。本討論之後則將討論分析與合成濾波器排組之相關特色。
1.發射器
第1圖所示發射器將分析濾波器排組3應用至一接收自路徑1之來源信號,來產生可表示來源信號之頻譜內容之頻譜係數,將編碼器5應用至該頻譜係數來產生編碼資訊,以及將格式化器8應用至編碼資訊來產生適合沿路徑9傳輸之輸出信號。輸出信號可即刻輸送至接收器,或輸出信號可記錄供隨後輸送之用。分析濾波器排組3可以後文說明之多種方式實作。
於本揭示內容,「編碼器」及「編碼」等詞絕非意圖暗示任何特殊型別之資訊處理。例如編碼經常用來減少資訊容量需求;但於本揭示「編碼器」及「編碼」等詞並非必然表示此等處理型別。編碼器5大致上可執行任何所需型別之處理。一項實作中,編碼資訊係經由使用寬廣多種量化技術,根據感光知覺模型,藉量化頻譜係數而產生,該等量化技術包括向量量化及增益適應性量化述於Davidson等人之美國專利6,246,345,核發日期2001年6月12日。並無特殊型別之編碼對本發明有其重要性。
2.接收器
第2圖所示接收器將解格式化器23應用至一接收自路徑21之輸入信號,來獲得編碼資訊;應用解碼器25至該編碼資訊,來獲得表示該來源信號之頻譜內容之頻譜係數;以及應用該合成濾波器排組27至頻譜係數,來產生沿路徑29之輸出信號,該輸出信號為來源信號之複本,但可能並非確切複本。合成濾波器排組27可以多種與分析濾波器排組3之實作互補之方式實作。
於本揭示,「解碼器」及「解碼」等詞絕非意圖暗示任何特殊型別之資訊處理。解碼器25大致上可進行任何所需或所期望之型別之處理。於一與前述編碼處理反轉之處理,量化頻譜成分被解碼成解量化頻譜成分。並無任何特殊型別之解碼對本發明而言為重要。
B.適應性混成變換
分析濾波器排組3及合成濾波器排組27包含混成變換,可如第4圖及第5圖所示而實作。
第4圖所示分析濾波器排組3包含一次變換43及一或多個與一次變換串級之二次變換45。一次變換應用至一來源信號節段,來產生表示該來源信號之節段內容之頻譜係數集合。該一或多個二次變換各自係跨時間應用至一特殊頻率之頻譜係數區塊。各個區塊之係數數目可響應一控制信號調整。
第5圖所示合成濾波器排組27包含一或多個反二次變換52,及一與該反二次變換串級之反一次變換54。該一或多個反二次變換各自產生對一特殊頻率跨時間之頻譜係數區塊。各個區塊之係數數目係響應一控制信號調整。頻譜係數區塊組譯成為對一特殊時間跨頻率之頻譜係數集合;以及一次變換應用至該頻譜係數集合,來產生一信號節段,係組合而提供原先來源信號之複本。
分析濾波器排組及合成濾波器排組之一次變換實作一分析/合成系統,其中反一次變換抵消由正向一次變換所產生之時域亂真假影。舉例言之,於前述Princen報告所述之經修改之離散餘弦變換(MDCT)及反MDCT(IMDCT)實作奇堆疊之經過臨界取樣之單一邊帶分析/合成系統之時域相當例。此等變換於此處稱作為奇堆疊時域亂真抵消(O-TDAC)變換。另一TDAC實作述於Princen等人,「基於時域亂真抵消之分析/合成濾波器排組」,IEEE Trans. on Acoust.,Speech,Signal Porc.
,vol. ASSP-34,1986,pp. 115-1161。於本實作之分析濾波器排組包含應用MDCT及經修改之離散正弦變換(MDST)至交錯信號節段。合成濾波器排組包含應用IMDCT及反MDST(IMDST)。此等變換實作偶堆疊臨界取樣單一邊帶分析/合成系統之時域相當例,稱作為偶堆疊時域亂真抵消變換。
二次變換可藉多種變換之任一種實作,該等變換包括離散餘弦變換(DCT)、離散正弦變換(DST)及離散富立葉變換(DFT)。
於分析濾波器排組3之較佳實作,型別-II DCT用於前述O-TDAC MDCT串級。於合成濾波器排組27之相對實作,O-TDAC IMDCT用於型別-II反DCT(IDCT)串級。此等實作容後詳述。
1.分析濾波器排組
參照第4圖,一序列來源信號樣本係接收自路徑1及儲存於緩衝器41。分析器47為選擇性元件,其決定各個節段之來源信號樣本數目,或決定節段長度供應用若干分析處理至儲存之樣本進行隨後處理。大致上任何分析方法皆可視需要使用。例如振幅變遷可如前文引述之ATSC A/52A文件之說明檢測。表示如選用之節段長度之資訊沿路徑2送至格式化器7來含括於輸出信號。定長節段用於另一實作,該實作中刪除分析器47及路徑2。
a)分析視窗函數
經由以分析視窗函數加權各個節段之來源信號樣本,視窗42形成一重疊節段序列。各節段之分析視窗函數之長度及形狀係響應接收自路徑2之節段長度資訊而調整。多種視窗函數皆可使用,但通常以開塞-畢索導出(Kaiser-ssel-Derived)(KBD)視窗函數為佳,原因在於其具有絕佳頻率選擇性性質。其視窗函數係由開塞-畢索視窗函數導出且可表示為:
此處α=開塞-畢索α因數,
n=視窗函數樣本數,
N=視窗函數長度,以樣本數表示,以及
4至7範圍之α值用於典型音訊編碼用途之效果良好。
以一矩形視窗函數導算疊積該開塞-畢索視窗函數W(n),該矩形視窗函數之長度係等於預定視窗函數長度N-重疊間隔ν。參考表示式2。此種疊積可簡化為表示式3所示。
此處v=於節段重疊間隔之樣本數,
N=視窗函數之預定長度,
W(n)=長v+1之開塞-畢索視窗函數,
WP(n)=導出之長度N之積-視窗,以及
KBD分析視窗函數可經由取導出之積視窗WP(n)之方根獲得。此分析視窗數顯示於表示式4。
b)一次變換
一次變換43將視窗化來源信號樣本之各節段變換成為一頻譜係數集合。於一頻譜係數集合之各個係數表示一視窗化節段時一特殊頻率之頻譜內容。O-TDAC MDCT用於較佳實作。此變換可表示為:
此處k=頻率係數編號,
n=輸入信號樣本編號,
m=來源信號節段編號,
N=來源信號節段長度,
x(n)=於樣本n之來源信號x之值,以及C(k)=MDCT係數k。
O-TDAC DMCT產生下述形式之頻譜係數集合
一次變換可根據表示式5直接實作,或一次變換可經由運算上更有效之處理實作,例如美國專利5,394,473所述用於快速富立葉變換(FFT)之處理。分析視窗函數及一次變換可響應節段長度,使用大致上任何所需方法實作。數項技術揭示於前文引述之美國專利5,214,742、美國專利5,394,473、ATSC A/52A文件及ISO/MPEG AAC文件。
對一或多個個別頻譜係數,表示視窗化來源信號節段之頻譜內容之頻譜係數沿個別信號路徑前進,且儲存於緩衝器。例如第4圖所示發射器,沿二信號路徑之一,對二頻率之個別頻率通過頻譜係數供儲存於緩衝器44a及44b。為求說明清晰,第4圖只顯示二信號處理路徑。用於典型系統之分析濾波器排組3之實作有數百路徑。
c)頻譜分量分析
參照第4圖所示上信號路徑,於一序列節段對一特殊頻率之頻譜係數儲存於緩衝器44a,組譯入多個區塊。分析器48a決定各區塊之係數數目,其為區塊長度,且沿路徑49a傳送此長度。此長度可經由分析儲存於緩衝器44a之係數判定。並無特殊分析方法對本發明原理有關鍵重要性。少數分析方法述於此處。
一種基本方法形成最長可能之頻譜係數區塊,其中於各區塊之係數之振幅充分類似。此可以多種方式決定。一種方式計算相鄰頻譜係數間之振幅差,且識別平均差係小於若干臨限值之相鄰係數之最長區塊。另一方式使用儲存於緩衝器之頻譜係數用於多信號路徑。此種辦法加總一頻譜係數頻帶之振幅差,以及識別其跨該頻帶之平均差係小於某個臨限值之最長區塊。頻帶寬度可補償所謂之人體聽覺系統之臨界頻寬。
另一項基本方法係仰賴信號分析,該信號分析係藉於發射器執行之信號編碼處理實施。一發射器例如可與前文引述之A/52A文件所述之位元流標準相容,該發射器產生一編碼信號,該信號具有表示為與規度因數關聯之規度化值之頻譜係數。規度因數經分析來識別可共享一規度因數共同集合之MDCT係數集合序列。分析器48a對其個別信號路徑調整適應區塊長度,來等於共享該等指數之係數集合數目。
d)二次變換
二次變換45a將各頻譜係數區塊變換成為一混成變換係數集合。變換長度係響應接收自路徑49a之區塊長度資訊調整適應。於較佳實作,型別II DCT應用至未彼此重疊之頻譜係數區塊。此項實作表示為:
此處X(k,j)=MDCT係數k之混成變換係數j,
M=MDCT係數k之區塊長度,以及
二次變換可直接根據表示式7實作,或二次變換可藉運算上更有效之已知方法實作,例如述於Rao等人,「離散餘弦變換」,學術出版公司,1990年,第4章所述之方法實作。
e)格式化器及其它信號路徑
格式化器46a為選擇性組成元件,格式化器可用來將混成變換係數及區塊長度資訊組譯成為編碼器5及格式化器7可處理之資訊。如此允許第1圖所示發射器之分析濾波器排組3藉混成變換實作,而發射器其餘部分極少變化。
緩衝器44b、分析器48b、二次變換45b及格式化器46b於下信號路徑進行處理,該處理係類似前文對上信號路徑之個別元件所討論之處理。
f)編碼
於典型系統,編碼器5產生表示某種編碼形式之混成變換係數之編碼資訊。若使用感官知覺編碼處理,則混成變換係數編碼成為可降低感官知覺不相關性之形式。感官知覺編碼處理通常造成頻譜資訊的喪失,而無法由接收器回復或重現形成。此種喪失可如下以符號表示,其表示對混成變換產生之混成變換係數可能之修改。使用此種編碼方法對本發明而言並無特殊限制。
2.合成濾波器排組
參照第5圖,解格式化器51a及51b由接收自路徑26a及26b之資料,分別獲得混成變換係數及區塊長度資訊。區塊長度資訊沿路徑59a及59b傳送,混成變換係數傳送至反二次變換52a及52b。為求說明清晰,第5圖只顯示二信號處理路徑。典型系統使用之合成濾波器排組27之實作可有數百路徑。
解格式化器51b、反二次變換52b及緩衝器53b於下信號路徑進行之處理係類似前文對個別元件於上信號路徑進行之處理之討論。
a) 解格式化器
參照第5圖所示上信號路徑,解格式化器51a為選擇性組成元件,其可用來由接收自解格式化器23及解碼器25之資料,解除組譯混成變換係數集合及區塊長度資訊。如此允許合成濾波器排組27之混成變換實作結合入既有接收器,如第2圖所示,而接收器其餘部分極少變化。
b)反二次變換
反二次變換52a將一混成變換係數集合變換成為一頻譜係數區塊,其表示一來源信號節段序列對一特殊頻率之頻譜內容。該頻譜係數區塊儲存於緩衝器53a。變換長度回應於接收自路徑59a之區塊長度資訊調整適應。於一較佳實作,型別II IDCT應用至彼此未重疊之頻譜係數區塊。此變換表示為:
此處=得自編碼混成變換係數之MDCT係數k。
反二次變換可直接根據表示式8實作,或反二次變換可藉運算上更有效之已知方法實作。
c)反一次變換
緩衝器53a及53b儲存頻譜係數,且將其送至反一次變換54,讓反一次變換接收表示個別來源信號節段之頻譜內容之頻譜係數集合。信號樣本節段係經由應用反變換至該頻譜係數集合而產生,且係儲存於緩衝器55。反一次變換長度係響應接收至路徑22之節段長度資訊而調整適應。O-TDAC IMDCT用於較佳實作。
於典型應用,半數MDCT係數於發射器被拋棄。被拋棄的係數由接收器藉如下表示式回復:
O-TDAC IMDCT可表示為:
此處=所回復之信號樣本。
反一次變換可根據表示式10直接實作,或反一次變換可藉運算上更有效之已知方法實作,例如述於美國專利5,394,473之使用FFT之方法。
d)合成視窗函數
視窗56經由以一合成視窗函數加權該儲存於緩衝器55之信號樣本節段,以及於重疊部分加總重疊節段之加權樣本彼此,來產生於沿路徑29之輸出信號。反一次變換、合成視窗函數、及重疊加成處理可抵消至少相當部分之經由正向變換產生之時域亂真假影。抵消可能並不確切,原因在於對變換係數之修改係經由編碼處理所造成,或經由一次變換及二次變換計算時之有限算術精度所造成。各節段之合成視窗函數之長度及形狀係響應接收自路徑22之節段長度資訊調整適應。等於如上表示式4顯示之分析視窗函數WA之KBD視窗函數用於較佳實作。
合成視窗函數及反一次變換可使用例如前述方法,響應節段長度資訊調整適應。
C.實作
前文揭示只陳述少數實作。可使用多種變換及變換型別。本發明原理可以寬廣多種方式應用於實作。
結合本發明之各方面之裝置可以多種方式實作,包括藉電腦或若干其它裝置執行之軟體,該若干其它裝置包含更特化組成元件,例如數位信號處理器(DSP)電路耦合至類似於通用用途電腦所見之組成元件。第3圖為裝置70之示意方塊圖,其可用來實作本發明之各方面。DSP 72使用運算資源。RAM 73為由DSP 72用於信號處理之系統隨機處理記憶體(RAM)。ROM 74表示某種形式之持久儲存裝置,例如唯讀記憶體(ROM)用於儲存操作裝置70及進行本發明各方面之所需程式。I/O控制器75表示藉通訊通道76/77而接收信號與發射信號之介面電路。類比至數位轉換器及數位至類比轉換器可視需要包括I/O控制器75來接收及/或發射類比信號。所示具體例中,全部主要系統元件連結至匯流排71,其表示多於一個實體匯流排;但匯流排架構並非實作本發明所需。
於通用用途電腦系統實作之具體例中,可含括其它組成元件來與鍵盤或滑鼠及顯示器等裝置介面,以及來控制一儲存裝置,其具有儲存媒體如磁帶、磁碟或光碟。儲存媒體可用於記錄操作系統之指令程式、應用工具及應用程式,且包括可實作本發明各方面之程式具體例。
實作本發明之各方面所需之程式可藉以多種方式實作之元件實施,該等元件包括離散邏輯元件、積體電路、一或多個ASICs及/或程式控制處理器。此等元件之實作方式對本發明而言並無特殊限制。
本發明之軟體實作可藉多種機器可讀取媒體例如基頻通訊路徑或經調變之通訊路徑遍及頻譜包括由超音波頻率至紫外光頻率,或藉大致使用任何記錄技術傳輸資訊及儲存媒體傳輸,該等儲存媒體包括磁帶、磁卡或磁碟、光卡或光碟以及於媒體例如紙張上可檢測之記號。
1...路徑
2...路徑
3...分析濾波器排組
5...編碼器
8...格式化器
9...路徑
21...路徑
22...路徑
23...解格式化器
25...解碼器
26a-b...路徑
27...合成濾波器排組
29...路徑
41...緩衝器
42...視窗
43...一次變換
44a-b...緩衝器
45a-b...二次變換
46a-b...格式化器
47...分析器
48a-b...分析器
49a-b...路徑
51a-b...解格式化器
52...反二次變換
53a-b...緩衝器
54...反一次變換
55...緩衝器
56...視窗
59a-b...路徑
70...裝置
71...匯流排
72...DSP
73...RAM
74...ROM
75...I/O控制器
77...通訊通道
第1圖為一編碼系統所使用之發射器之示意方塊圖。
第2圖為一編碼系統所使用之接收器之示意方塊圖
第3圖為可用於實作本發明之各方面之裝置之示意方塊圖。
第4圖為結合本發明之各方面之分析濾波器排組之示意方塊圖。
第5圖為結合本發明之各方面之分析濾波器排組之示意方塊圖。
1...路徑
2...路徑
3...分析濾波器排組
41...緩衝器
42...視窗
43...一次變換
44a-b...緩衝器
45a-b...二次變換
46a-b...格式化器
47...分析器
48a-b...分析器
Claims (8)
- 一種用以產生輸出信號之方法,該方法包含下列步驟:接收具有頻譜內容之一來源信號的樣本;應用一個一次變換至該等樣本之重疊節段,來產生複數個頻譜係數集合,其中該一次變換係一修改型離散餘弦變換,以及各個頻譜係數集合具有時域頻疊假訊,以及表示一個別來源信號節段在對一組頻率上之頻譜內容;由該等複數個頻譜係數集合獲得表示該頻率集合中之相同頻率的複數個頻譜係數,以及組合該等複數個頻譜係數成為一或多個頻譜係數區塊,其中被組合於一或多個區塊之各個區塊之頻譜係數數目係響應一區塊長度控制信號而調整適應;應用一個二次變換至該一或多個頻譜係數區塊,來產生一或多個混成變換係數集合,其中該二次變換係應用於未相重疊的頻譜係數區塊之一離散餘弦變換,以及應用至該一或多個頻譜係數區塊之各區塊之二次變換長度係響應該區塊長度控制信號而調整適應;根據一知覺模型,藉著量化該等一或多個混成變換係數集合來產生編碼資訊;以及組合表示該等一或多個混成變換係數集合與該區塊長度控制信號的該編碼資訊成為該輸出信號。
- 如申請專利範圍第1項之方法,藉向量量化來量化該等一或多個混成變換係數集合。
- 如申請專利範圍第1項之方法,藉向增益適應性量化來量化該等一或多個混成變換係數集合。
- 一種用以產生輸出信號之方法,該方法包含下列步驟:接收一輸入信號,其含有表示一來源信號之頻譜內容的編碼資訊;藉著根據反向於根據一知覺模型而量化之一程序而去量化該編碼資訊,以從該輸入信號獲得一區塊長度控制信號以及一或多個混成變換係數集合;應用一反二次變換至該一或多個混成變換係數集合,來產生一或多個頻譜係數區塊,其表示用於一頻率集合內相同頻率之該來源信號頻譜內容,其中該反二次變換係應用於表示未相重疊之頻譜係數區塊之混成變換係數集合的一反離散餘弦變換,以及應用至該混成變換係數集合之該反二次變換之長度係響應該區塊長度控制信號而調整適應;組合該等頻譜係數成為頻譜係數集合,其中各頻譜係數集合具有時域頻疊假訊,且表示該來源信號之一節段在該頻率集合中所有頻率上之頻譜內容;應用一反一次變換至該等頻譜係數集合,來產生對應於該等來源信號節段之輸出信號節段,其中該反一次變換係一反修改型離散餘弦變換,以及該反一次變換可實質抵消該等時域頻疊假訊。
- 如申請專利範圍第4項之方法,根據反向於向量量化之一程序來去量化該編碼資訊。
- 如申請專利範圍第4項之方法,根據反向於增益適應性量化之一程序來去量化該編碼資訊。
- 一種用以產生輸出信號之裝置,其包含:(a)一輸入端子;(b)一輸出端子;以及(c)信號處理電路,其係耦合至該輸入端子及該輸出端子,其中該信號處理電路係適於實行根據申請專利範圍第1到6項任一項之方法的所有步驟。
- 一種記錄指令程式的媒體,其可藉一裝置來執行根據申請專利範圍第1到6項任一項之方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/783,951 US7516064B2 (en) | 2004-02-19 | 2004-02-19 | Adaptive hybrid transform for signal analysis and synthesis |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201214949A TW201214949A (en) | 2012-04-01 |
TWI463790B true TWI463790B (zh) | 2014-12-01 |
Family
ID=34861377
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094102495A TWI369852B (en) | 2004-02-19 | 2005-01-27 | Adaptive hybrid transform for signal analysis and synthesis |
TW100140903A TWI463790B (zh) | 2004-02-19 | 2005-01-27 | 用於信號分析與合成之適應性混成變換技術(一) |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094102495A TWI369852B (en) | 2004-02-19 | 2005-01-27 | Adaptive hybrid transform for signal analysis and synthesis |
Country Status (22)
Country | Link |
---|---|
US (1) | US7516064B2 (zh) |
EP (3) | EP2293293B1 (zh) |
JP (1) | JP4689625B2 (zh) |
KR (1) | KR101273486B1 (zh) |
CN (2) | CN101826071B (zh) |
AT (1) | ATE526660T1 (zh) |
AU (2) | AU2005217943B2 (zh) |
BR (1) | BRPI0507806B1 (zh) |
CA (4) | CA2880055C (zh) |
CY (1) | CY1122444T1 (zh) |
DE (1) | DE602005015427D1 (zh) |
DK (1) | DK1723638T3 (zh) |
ES (1) | ES2329384T3 (zh) |
HK (2) | HK1092925A1 (zh) |
IL (1) | IL177093A (zh) |
LT (1) | LT2293293T (zh) |
MY (2) | MY143979A (zh) |
PL (1) | PL1723638T3 (zh) |
PT (1) | PT1723638E (zh) |
SI (1) | SI2088583T1 (zh) |
TW (2) | TWI369852B (zh) |
WO (1) | WO2005083682A1 (zh) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050229769A1 (en) * | 2004-04-05 | 2005-10-20 | Nathaniel Resnikoff | System and method for assigning visual markers to the output of a filter bank |
KR101037931B1 (ko) * | 2004-05-13 | 2011-05-30 | 삼성전자주식회사 | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 |
US8744862B2 (en) | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
US7895034B2 (en) * | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
MY148913A (en) * | 2006-12-12 | 2013-06-14 | Fraunhofer Ges Forschung | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
CN103594090B (zh) * | 2007-08-27 | 2017-10-10 | 爱立信电话股份有限公司 | 使用时间分辨率能选择的低复杂性频谱分析/合成 |
US20090099844A1 (en) * | 2007-10-16 | 2009-04-16 | Qualcomm Incorporated | Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
US9384748B2 (en) | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
ES2673637T3 (es) * | 2009-06-23 | 2018-06-25 | Voiceage Corporation | Cancelación prospectiva de solapamiento en dominio de tiempo con aplicación en dominio de señal ponderada u original |
WO2011013983A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
MX2012004572A (es) | 2009-10-20 | 2012-06-08 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, metodo para codificar informacion de audio, metodo para decodificar informacion de audio y programa de computacion que usa una regla dependiente de la region para un mapeado mediante codificacion aritmetica. |
EA024310B1 (ru) | 2009-12-07 | 2016-09-30 | Долби Лабораторис Лайсэнзин Корпорейшн | Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования |
CA2786944C (en) | 2010-01-12 | 2016-03-15 | Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
US9093066B2 (en) | 2010-01-13 | 2015-07-28 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering to cancel time reversed and zero input responses of adjacent frames |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
KR101456639B1 (ko) | 2010-07-08 | 2014-11-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 포워드 앨리어싱 취소를 이용한 코더 |
AU2012230440C1 (en) | 2011-03-18 | 2016-09-08 | Dolby International Ab | Frame element positioning in frames of a bitstream representing audio content |
JP5719966B2 (ja) * | 2011-04-08 | 2015-05-20 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 2つのエンコードされたビットストリームからのオーディオストリームの混合において使用するためのメタデータの自動設定 |
FR2977969A1 (fr) * | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
WO2013022426A1 (en) * | 2011-08-08 | 2013-02-14 | Hewlett-Packard Development Company, L.P. | Method and system for compression of a real-time surveillance signal |
US8527264B2 (en) | 2012-01-09 | 2013-09-03 | Dolby Laboratories Licensing Corporation | Method and system for encoding audio data with adaptive low frequency compensation |
EP2849180B1 (en) * | 2012-05-11 | 2020-01-01 | Panasonic Corporation | Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal |
US9648322B2 (en) * | 2012-07-10 | 2017-05-09 | Qualcomm Incorporated | Coding random access pictures for video coding |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
US9349196B2 (en) | 2013-08-09 | 2016-05-24 | Red Hat, Inc. | Merging and splitting data blocks |
DE102014101307A1 (de) | 2014-02-03 | 2015-08-06 | Osram Opto Semiconductors Gmbh | Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
EP3276620A1 (en) | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
EP3616197A4 (en) | 2017-04-28 | 2021-01-27 | DTS, Inc. | AUDIO ENCODER WINDOW SIZES AND TIME-FREQUENCY TRANSFORMATIONS |
EP3644313A1 (en) | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5394473A (en) * | 1990-04-12 | 1995-02-28 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5357594A (en) * | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
DE3902948A1 (de) * | 1989-02-01 | 1990-08-09 | Telefunken Fernseh & Rundfunk | Verfahren zur uebertragung eines signals |
US5107345A (en) * | 1990-02-27 | 1992-04-21 | Qualcomm Incorporated | Adaptive block size image compression method and system |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
JPH1175157A (ja) * | 1997-08-29 | 1999-03-16 | Sony Corp | 映像信号及び音声信号の記録装置 |
US6430529B1 (en) * | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
JP3762579B2 (ja) * | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
JP2002091500A (ja) * | 2000-09-19 | 2002-03-27 | Sharp Corp | デジタルデータ符号化方法 |
JP3894722B2 (ja) * | 2000-10-27 | 2007-03-22 | 松下電器産業株式会社 | ステレオオーディオ信号高能率符号化装置 |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
JP3725876B2 (ja) * | 2002-03-27 | 2005-12-14 | 株式会社東芝 | オーディオ符号化器とその符号化処理プログラム |
JP2003345779A (ja) * | 2003-03-26 | 2003-12-05 | Seiko Epson Corp | フィルタリング処理方法およびフィルタリング処理装置 |
US7383180B2 (en) * | 2003-07-18 | 2008-06-03 | Microsoft Corporation | Constant bitrate media encoding techniques |
-
2004
- 2004-02-19 US US10/783,951 patent/US7516064B2/en active Active
-
2005
- 2005-01-21 EP EP10183648.4A patent/EP2293293B1/en active Active
- 2005-01-21 CN CN2010101660941A patent/CN101826071B/zh active Active
- 2005-01-21 WO PCT/US2005/001923 patent/WO2005083682A1/en active Application Filing
- 2005-01-21 PL PL05705987T patent/PL1723638T3/pl unknown
- 2005-01-21 CA CA2880055A patent/CA2880055C/en active Active
- 2005-01-21 EP EP09007093A patent/EP2088583B1/en active Active
- 2005-01-21 CN CN2005800053012A patent/CN1926609B/zh active Active
- 2005-01-21 PT PT05705987T patent/PT1723638E/pt unknown
- 2005-01-21 ES ES05705987T patent/ES2329384T3/es active Active
- 2005-01-21 CA CA2924281A patent/CA2924281C/en active Active
- 2005-01-21 LT LTEP10183648.4T patent/LT2293293T/lt unknown
- 2005-01-21 EP EP05705987A patent/EP1723638B1/en active Active
- 2005-01-21 BR BRPI0507806-7A patent/BRPI0507806B1/pt active IP Right Grant
- 2005-01-21 CA CA2554381A patent/CA2554381C/en active Active
- 2005-01-21 DE DE602005015427T patent/DE602005015427D1/de active Active
- 2005-01-21 CA CA2860180A patent/CA2860180C/en active Active
- 2005-01-21 DK DK05705987T patent/DK1723638T3/da active
- 2005-01-21 AU AU2005217943A patent/AU2005217943B2/en active Active
- 2005-01-21 SI SI200531468T patent/SI2088583T1/sl unknown
- 2005-01-21 JP JP2006554100A patent/JP4689625B2/ja active Active
- 2005-01-21 AT AT09007093T patent/ATE526660T1/de not_active IP Right Cessation
- 2005-01-27 TW TW094102495A patent/TWI369852B/zh active
- 2005-01-27 TW TW100140903A patent/TWI463790B/zh active
- 2005-02-18 MY MYPI20050623A patent/MY143979A/en unknown
- 2005-02-18 MY MYPI2010000721A patent/MY146425A/en unknown
-
2006
- 2006-07-25 IL IL177093A patent/IL177093A/en active IP Right Grant
- 2006-08-03 KR KR1020067015751A patent/KR101273486B1/ko active IP Right Grant
- 2006-12-05 HK HK06113316.4A patent/HK1092925A1/xx unknown
-
2009
- 2009-09-04 HK HK09108094.9A patent/HK1130358A1/xx unknown
-
2010
- 2010-07-22 AU AU2010203126A patent/AU2010203126B2/en active Active
-
2019
- 2019-12-23 CY CY20191101356T patent/CY1122444T1/el unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5394473A (en) * | 1990-04-12 | 1995-02-28 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
Non-Patent Citations (4)
Title |
---|
Kryze, David, et al. "A new noise-robust subband front-end and its comparison to PLP." In IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU. 1999) * |
Noll, Peter. "Digital audio for multimedia." Proceedings Signal Processing for Multimedia. NATO Advanced Audio Institute (1999) * |
Painter, T.; Spanias, A, "A review of algorithms for perceptual coding of digital audio signals," Digital Signal Processing Proceedings, 1997. DSP 97., 1997 13th International Conference on , vol.1, no., pp.179,208 vol.1, 2-4 Jul 1997 * |
Vargas, L.F.C.; Malvar, H.S., "ELT-based wavelet coding of high-fidelity audio signals," Circuits and Systems, 1993., ISCAS '93, 1993 IEEE International Symposium on , vol., no., pp.124,127 vol.1, 3-6 May 1993 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI463790B (zh) | 用於信號分析與合成之適應性混成變換技術(一) | |
KR100986150B1 (ko) | 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템 | |
KR20080002853A (ko) | 병렬로 오디오 엔코더들을 동작시키는 방법 및 시스템 | |
TWI288915B (en) | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
JP2006201785A (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
AU2012247062B2 (en) | Adaptive Hybrid Transform for Signal Analysis and Synthesis | |
MXPA06009424A (es) | Transformada hibrida adaptiva para analisis y sintesis de señal |