TWI320172B - Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal - Google Patents

Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal Download PDF

Info

Publication number
TWI320172B
TWI320172B TW095139384A TW95139384A TWI320172B TW I320172 B TWI320172 B TW I320172B TW 095139384 A TW095139384 A TW 095139384A TW 95139384 A TW95139384 A TW 95139384A TW I320172 B TWI320172 B TW I320172B
Authority
TW
Taiwan
Prior art keywords
frame
distortion
information
audio signal
encoder
Prior art date
Application number
TW095139384A
Other languages
English (en)
Other versions
TW200719319A (en
Inventor
Villemoes Lars
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Publication of TW200719319A publication Critical patent/TW200719319A/zh
Application granted granted Critical
Publication of TWI320172B publication Critical patent/TWI320172B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

1320172 九、發明說明: 【發明所屬之技術領域】 本發明與音頻來源編碼系統有關,而更特別的是與利 用區塊基礎轉換的音頻編碼結構有關。 【先前技術】 、在本領域中,有許多用於音頻與影像内容編碼的方 法田然,一般來說,其目標是在不使該訊號重建品質變 差下,以一種位元節省的方式進行内容編碼。 目前,已經建立進行音頻與影像内容編碼的新方法, 其可以在大轉換尺寸時施加,其中以轉換為基礎的感知音 頻編騎於定常訊號而言可以達到最大的編碼增益。(舉例 而言,參考 T. Painter and A. Spanias: “perceptual c〇ding 〇f dlgital audio», Proceedings of the IEEE, V〇l. 88, No. 4, April 2⑻〇,pages 451-513)音頻的定常部分時常可以利用一種固 定有限的定常正弦曲線加以模擬。一旦轉換尺寸是大到足 以分解那些成分時,對於已知失真目標而言便需要固定的 位元數目。藉由另外增加該轉換尺寸,將可以描述愈來愈 多的音頻訊號片段’而不需要增加位元量的要求。然而, 對於非定常訊號而言,便需要減少該轉換尺寸,而因此該 編碼增益將快速地減少。為了克服此問題,對於突然改變 與瞬變事件而言,可以應用轉換尺寸切換,而不需明顯地 增加平均編碼成本。也就是說,當偵測到一瞬變事件時, 起被編碼的樣本區塊尺寸(訊框尺寸)便減少。對於更 5 1320172 頻繁的瞬4峨而言,該位元傳輸率當然會顧地增加。 -種對於頻繁賴行為而言_有趣喊例,是局部 * 错和訊號的音賴化,其主要在語音與歌唱的聲音部分巾 . 產生,但也可能來自於某些樂器的顫音與滑奏。具有—諧 和訊號,換言之’具有沿著時間轴等區間分佈訊號峰值的 訊號,其音調部分則贿介於該職鄰近峰值之間的時間 倒數。因此這種訊號具有―種完美的諧和頻譜,其利用與 該音調相等的基頻以及更高次的譜音所組成。在更一般的 情況中,音調可以定義為一局部諧和訊號之中兩鄰近對應 訊號部分之間的時間倒數。然而,如果該音調以及該基頻 隨時間變化’其通常仏見在聲音的音響中,該頻譜將會變 的更加複雜,並因此更難以被有效率地編碼。 與訊號音調非常有關的參數為該訊號的扭曲。假設該 訊號在時fBU具㈣於灿的音調,且此音雛倾著時間 平滑地變化,該城在_ ,處的扭曲便對數微分加 以定義 對於譜和訊號的音頻倍數或分數而言,此扭曲定義對 於該諧和成分與系統誤差而言並不敏感。該扭曲量測在對 數域中的頻率改變。扭曲—般所使用的自料位為赫兹 [巧,但在音樂方面,具有固定扭曲·%的訊號,是一 種掃猫率為每秒具有物紋八元組[〇ctys]的掃晦。語音頻 · 訊號具有最乡1〇 Get/S触曲,*其平均扭㈣為2。咖。 · 轉換編碼器的典型訊框長度(區塊長度)报大,因此 6 1320172 在該訊框中的相對音調改變較為顯著,該尺寸的扭曲或音 調變化造成那些編碼器的頻率分析干擾。對於所要求的^ 定位元傳輪率*言,其只能增加量化祕度加以克 服,此效果造成量化噪音的狀,其通f可觀知成為回 響。
一種克服此問題的技術則是時間扭曲。時間扭曲編碼 的概念可利用想像具有可變速度錄音機的方式獲得最好說 明。當記錄該音頻訊號時,可動態調整速度,以達到遍及 所有的聲音片段都具有固定的音調。所形成的局部定常音 頻訊號則利用隨著改變施加錄音磁帶速度進行編碼。在該 解碼器中,接著利用相反速度改變進行播放。然而,如同 以上描述施加簡單時間扭曲具有某些明顯的缺點。首先, 無法控制該絕對錄音磁帶速度的結束,而造成一種完全編 竭訊號持續時間與帶寬限制的抵觸。對於訊號重建而言, 必須傳輸該錄音磁帶速度(或等價為該訊號音調)的額外 侧資訊,其特別在低位元傳輸率的情況將引入一種基本的 位元傳輸率耗費。 先前技術方法中,用來克服此無法控制時間扭曲訊號 持續時間的一般解決方式,是利用一種時間扭曲以獨立地 處理該訊號的連續性非重疊片段,換言之,處理各自的訊 框,因此可以保存每個片段的持續時間。舉例而言,此解 決方式在 Yang et. al. Pitch synchronous modulated lapped transform of the linear prediction residual 〇 speech55
Proceedings of ICSP ’98, pages 591-594 中描述。這種處理方 7 1320172 .. 辦—項嚴重缺點是,雖然在片段中的處理訊號具有定常 • 性,但是在每個片段邊界處將存在跳躍。那些跳躍將明顯 地造成該後續音頻編碼器的編碼效率損失,並在該解碼訊 號中引入可聽見的不連續性。 時間扭曲也在一些其他的編碼結構中實作。舉例而 言,US-2002/0120445描述-種結構,其中訊號片段在區塊 基礎轉換編碼之前,將進行持續時間的輕微改正。在該訊 • 號片段持續時間中進行輕微的改正,可用來避免在該區塊 邊界處的大訊號成分。 另一種利用時間扭曲的技術則在us_6,169,97〇中描 述’其中施加時間扭曲以促進語音編碼器長期預測器的效 能。同樣的,在US 2005/0131681中,描述一種用於語音 頻訊號碼激式線性(CELP)編碼的預先處理單元,其在非 重疊區間之間施加一種片段連續的線性扭曲,每一個都包 含一刷白(whitened)音調脈衝。最後,在R j sluijterand • A.J.E.M. Janssen, “A time warper for speech signals” IEEE workshop on speech Coding’99, June 1999, pages 150-152 中 描述如何對一語音訊框施加二次時間扭曲函數,以改善語 音音調估計。 總結來說’先前扭曲技術都具有在訊框邊緣處引入不 連續性,以及需要傳輸描述該訊號音調變化參數,而造成 需要明顯的額外位元傳輸率的問題。 【發明内容】 8 1320172 本發明的目標是提供一種利用時間扭曲所進行更有效 率的音頻訊號編碼概念。 根據本發明第一觀點,此目標是利用一種用於取得具 有一音頻訊號表現的編碼器所達成,該音頻訊號具有一第 一訊框、該第一汛框之後的一第二訊框,以及該第二訊框 之後的一第二訊框,該編碼器包括:一扭曲估計器,用於 估a十代表e亥第與δ亥弟一 §Κ框的第一扭曲資訊,並用於估 計代表該第二訊框與該第三訊框的第二扭曲資訊,該扭曲 資訊則描述該音頻訊號的音調資訊;一頻譜分析器,用於 利用該第一扭曲資訊取得代表該第一與該第二訊框的第一 頻譜係數,並用於利用該第二扭曲資訊取得代表該第二與 該第三訊框的第二頻譜係數;以及一輸出介面,用於輸出 包含該第一與該第二頻譜係數的音頻訊號表現。 根據本發明第二觀點,此目標是利用一種用於重建一 音頻訊號的解碼器所達成,該音頻訊號具有一第一訊框、 該第一訊框之後的一第二訊框,以及該第二訊框之後的一 第三訊框,其利用第—扭崎訊,該第—扭曲資訊描述代 表4第-與该第二訊框的音頻訊號音調資訊,第二扭曲資 訊,該第二扭曲資訊描述代表該第二與該第三訊框的音頻 訊號音調資訊,代表該第—與第二訊框的第—頻譜係數, 代表該第二與第三訊框的第二頻譜係數進行重建,該解碼 器包括:-頻譜值處理H,麟額該第—麟係數與該 第-扭曲資訊取得-第一組合訊框,該第—組合訊框具有 該第-與該第二訊框的#訊;以及麟_該第二頻譜係 9 1320172 數與§玄第'一扭曲資訊取得一第二組合訊框’該第*一組合訊 框具有該第二與該第三訊框的資訊;以及一合成器’用於 利用該第一組合訊框與該第二組合訊框重建該第二訊框。 根據本發明第三觀點,此目標是利用一種取得一音頻 訊號表現的方法所達成,該音頻訊號具有一第一訊框、該 第一訊框之後的一第二訊框,以及該第二訊框之後的一第 三訊框,該方法包括:估計代表該第一與該第二訊框的第 一扭曲資訊,並估計代表該第二與該第三訊框的第二扭曲 資訊,該扭曲資訊描述該音頻訊號的音調資訊;利用該第 一扭曲資訊取得代表該第一與該第二訊框的第一頻譜係 數,並利用該第二扭曲資訊取得代表該第二與該第三訊框 的第二頻譜係數;以及輸出該音頻訊號表現,其包含該第 一與第二頻譜係數。 根據本發明第四觀點,此目標是利用一種重建一音頻 訊號的方法所達成,該音頻訊號具有一第一訊框、該第一 訊框之後的一第二訊框,以及該第二訊框之後的一第三訊 框’其利用第一扭曲資訊’該第一扭曲資訊描述代表該第 一與該第二訊框的音頻訊號音調資訊,第二扭曲資訊,該 第二扭曲資訊描述代表該第二與該第三訊框的音頻訊號音 調資訊,代表該第一與第二訊框的第一頻譜係數,代表該 第二與第三訊框的第二頻譜係數進行重建,該方法包括: 利用該第一頻譜係數與該第一扭曲資訊取得一第一組合訊 框,該第一組合訊框具有該第一與該第二訊框的資訊;以 及利用該第二頻譜係數與該第二扭曲資訊取得一第二組合 10 1320172 成框’该第二組合訊框具有該第二與該第三訊框的資訊; 以及利用該第一組合訊框與該第二組合訊框重建該第二訊 框0 根據本發明第五觀點,此目標是利用一種音頻訊號表 現所達成,該音頻訊號具有一第一訊框、該第一訊框之後 的一第二訊框,以及該第二訊框之後的一第三訊框,該表 現包括代表該第一與該第二訊框的第一頻譜係數,該第一 頻谱係數描述該第一與該第二訊框扭曲表現的頻譜組成; 而該第二頻譜係數描述該第二與該第三訊框扭曲表現的頻 譜組成。 根據本發明第六觀點,此目標是利用一種電腦程式所 達成,该電腦程式具有在電腦上執行時,實作上述任一方 法的程式碼。 本發明疋根據當估計代表任意兩鄰近訊框的一共同時 間扭曲,因此一後續區塊轉換能夠額外使用該扭曲資訊 時,可以更有效率地取得具有連續音頻訊號訊框的音頻訊 號頻譜表現。 因此,可以取得並施加為了在重建期間成功應用一重 叠及加總所步驟需要的窗函數,職函數已經預先考慮到 由於時間扭曲所形成的訊號重採樣。因此,可以在不引入 可聽見的科續下,獲制肋區塊基礎騎行時間扭曲 訊號轉換編碼的效率提升。 對於先前技術問題而言,本發明因此提供一種吸引人 的解決方式。-方面,可以定重疊與加總的技 11 1320172 門扭曲/亥音頻訊號片段有關的問題,其組合窗操作與時 =呆作’並引入該區塊轉換的一時間補償。所形成的 有完美的重建能力’而其離散時間配對物 :卜又到在重建期間對該解碼器所施加重採樣品質的限 :。此特性造成該產生音頻編碼結構的高位元傳輸率收 -2則上可能#域少該量化織度,也就是增加該位
^ 11率的方式,達成訊號的極少傳輸損失。舉例而言, 這無法利用純粹的參數編碼方法達成。 本發明的另—優點是大大減少為了反向時間扭曲所需 傳輪的額外資訊位元傳輸率要求。這可以彻傳輸扭曲參 數侧資訊’而不是音調側資訊的方式達成。其具有的另外 ,點為,本發明在與許多音娜礎音頻編碼方法以及正確 音調偵測極度有關的情況相比之下,只具有-種輕微程度 的參數相_。這是因為音調參數傳輸需要_一局部^
和訊號的基礎頻率,然而其並非總是可以簡單得到。因此 本發明的結構細上扭曲參數的定義下具有高度強健性, 因為一較高諧和的偵測並不會造成被傳輸扭曲參數的歪 曲。 在本發明的一實施例中,施加一編碼結構以將一連續 訊框,特別是彼此依序的—第—m訊框中的配 置音頻訊號編碼。該第二訊框訊號的完整資訊,是利用該 第一與该第二訊框的組合頻譜表現、代表該第一與該第二 訊框的扭曲參數序列,以及該第二與該第三訊框的組合頻 譜表現與代表該第二與該第三訊框的扭曲參數序列所提 12 1320172 供。利用本發明時間扭曲的概念,考慮到一種訊號的重疊 與加總重建,而不需引入在該訊框邊緣的快速音調變化, 也不需引入額外的可聽見不連續。 在本發明另一實施例中,該扭曲參數是利用已知的音 調追蹤演算法所取得,在使用那些已知演算法的情況下, 本發明也可以簡單實作於已經存在的演算法之中。 在本發明另一實施例中,實作扭曲,因此當該音頻訊 • 號利用扭曲參數所指示進行時間扭曲時,在該訊框之中的 音頻號音調能夠盡可能的固定。 在本發明另一實施例中,當選擇該扭曲參數序列,而 因此將3亥頻譜係數的編碼表現最小化時,在編碼期間於更 高計算複雜度成本處,便可以更進一步地減少該位元傳輸 率。 在本發明另一實施例中,將本發明編碼與解碼分解成 為施加窗函數(窗化)、重採樣以及區塊轉換。該分解具有 • 最大的優點為,特別是對於轉換而言,已經存在可以利用 的現存軟體與硬體實作,而有效地實作本發明的編碼概 念。在5亥解碼器侧,引入另一獨立的重疊與加總步驟,以 進行訊號重建。 在本發明解碼器的替代實施例中,在轉換至該時間域 之前’對該訊號頻譜係數施加額外的頻譜權重。進行此加 權所具有的優點為更加減少在該解碼器侧的計算複雜度, 同時也可以因此減少該訊號重採樣的計算複雜度。 應該以一般的概念詮釋該術語”音調,,。此術語在連接 13 1320172 -· 與扭曲資訊有關的地方也涵蓋音調變化。其可能存在一種 • 情況,其中該扭曲資訊並不能夠取得絕對的音調,但可以 取得相對或&準彳b的音調資訊。目此當接受獲得—正確音 _線形狀,而不是y轴上的數值時,在給定一扭曲資訊 下’也可以達成该訊5虎音調的描述。 、 【實施方式】 • 町敘述的實施例只是做為本發明音頻訊號時間扭曲 轉換編碼_則贿。對於本領域其他麟者而言可瞭解 的是,在此可對所描述細節與配置進行修改與變化。因此, 其預期只由附加申請專利範圍的觀點加以限制,而不是由 在此實施例的描述與說明所呈現的特定細節所限制。 之後’將簡短_扭曲與區塊轉換的基本想法及概 念’並在之後參轉隨圖示進行本發明的詳細討論。 -般來說,在連續時間訊號域中最容易取得時間扭曲 • 轉換的特性。該後續章節描述一般的理論,並接著依序地 特殊化並轉換至本發明對離散時間訊號的應用。在此轉換 t駐要步驟是在鱗斜均樣本蚊下,換言之在不改 變該音頻訊號的持續時間下,利用離散時間訊號進行非均 勻重採樣’取代對連續時間訊號所實作的座標改變。 令“,)描述由-連續可微分嚴密遞增函數,時間 座標改變,其將ί-軸區間/映射至心軸區間彡。 W因此是-種可以用來將—時間相關量的時間轴進 行轉換的函數’其與時間離散情況中的重採樣等價。應該 J320172 注思的疋’在後續討論中"·轴區間7為正常時間域中的區 間,而*y-軸區間/為該扭曲時間域中的區間。 給定該區間7有·量減的—正絲礎{%},便可 利用以下規則獲得該區間/有限能量訊號的正交基礎 秦 Ψ'(ήΊ(ή)⑴ ’”《疋一無限時間區間/’時間扭曲的局部特性可以利用 片段/的方式達成,並接著利用將標準化扭曲映圖的重縮 放部分一起組合的方式重建γ。 標準化扭曲映圖是一種連續可微分並嚴密遞增的函 數^其將單位區間[明映射至本身。從〜作範圍中的序列 片段點/=4以及一對應標準化扭曲映圖對應序列%開始, 可建構 W-丨-W tk <:t<tk+l (2) 其中<4=*^1为並調整序列^4,因此變成連續可微 分。這種利用該標準化扭曲映圖序列K所定義的一),具有 最多為的尺寸仿射改變。 令{%„}為區間有限能量訊號的一正交基礎,其適用 於該片段办=^^),其中存在代表重疊因子的整數昃概念, 因此當或 S><S;t+A·時 ’ Vjt,„(>S)=〇。 本發明著重於欠^2的情況,因為尤=丨的情況對應於 不需重疊的先前技術。應該注意的是,對於尺g 3的情況而 言並不存在許多已知的建構方式。之後,本發明概念的一 特定實施例將對於X=2的情況建立’其包含也在改正離散 15 1320172 . 餘弦轉換(MDCT)及其他離散時間重叠轉換中所使用的 局部三角學基礎。 ' 令從該片段所建構的具有局部特性,其中存在整 數的概念’使得外,„〇)對於/分少、仏灸+尤十户而言並不與 ~相關。最後’令建顧此是-種對於如+万的片段仿射改 變,使得基礎改變成為,。 接著 • 气”(,)=〆(,)'/、,„wo)⑶ 其為一種區間/有限能量訊號的時間扭曲正交基礎, 可以從片段點^與該標準化扭曲映圖序列A良好定義,並 與式(2)中的參數序列《y々與馬的初始條件無關。對於給定片 段而言,其在或的情況中具有叫⑺=〇的概念, 而局部定義%„(〇不是與/<hp、/>W:+;?時的〇相關,就是 與 i<k-p、g/c+K+/?時的%相關。 該合成波形(3)具有連續性,但由於賈柯比因子心,(〇)|/2 • 的存在而不一定是可微分。為了此理由並為了減少在離散 時間情況中的計算負載,也可以建構一種雙正交系統。假 設具有〇<(^<ί:2的常數,因此對序列π p>〇而言 c^k<w'{t)<c^k tk 幻〜(4) 接著, /*,»(0 =^ι/2ν*,„(^(0); 1 =〆(〇 %_1/\身⑹·| 定義了用於該區間/有限能量訊號的空間賴斯基礎 (Rieszbases)雙正交對。 16 1320172 因此,imgUt)可以用來進行分析,而特別有利的 疋^用麟做為合成波形,並利用知(〇做為分析波形。 根據上述的一般性考量,在後續章節帽取得代表本 發明概念的-範例,其中具有重疊因子料的均勾片段 ㈣’並利用適合在心軸上形成片段的局部餘弦基礎。又 應該注意的是,明顯的需要處理非均勻片段的改正, 因此本發.純囉可以應用於這種非均勻片段。如同 在 M. W. Wickerilauser,“Adapted 丽伽 __ f_ theoiy to software’’,Α· K. Peters,1994,㈤卿 4 中所提出的 範例,建構一局部餘弦基礎的開始,是定義一種上升切除 函數p,對於r<-l而言〆r)=〇,對於r>1而言p (十卜且 在其作用範圍中 p(r)2+p(_r)2=][。 給疋片段*’接著可根據下式建構在每一區間办 办f2上的窗
w*W=>〇 s-ck pfCi+I~s) L J { J ⑹ 所具有的切除中點為,切除半徑為ε 是—(%"1-办)/2。此對應於魏克豪斯爾(wickerhauser )的中點 建構。 在4=£^+1心=£汁£奸1的情況下,從下式形成一正交基 礎 ⑺ 其中頻率因子《=0、1、2、…。可以簡單驗證此建構 是按照具有p=0及上述仿射不變性所完成。在此情況中, 17 1320172 寫為以下形式 ;的範圍,可以重
⑼"))外㈣取η) M 其中么是_組合η㈣ 續可微分_的方柄Μ在賴_,2]本身上連 ^ (0_{2w*n(〇,
其中 () 〇〇) 第1圖中描述6的建構 在痛上顯示扭曲時間 軸上』4準化時間而 討論,也就是建_,並因二的情況特別 〇至標準化時間i之淑一/传代表持續在標準化時間 持續在標準化時間】 四山数以及代表
曲函數。此外,假M t 間第二訊框12的扭 二訊框且」1〇具有扭曲函數14,而第 〇 C 12具有扭曲函數】 與16所指出的方々、…肩备如同以扭曲函數14 相同音奶的納^ 間轴轉換時,達成在該各自訊框 仰U θ過的目標所取得。 於%而扭曲函數16_;V忍的疋,扭曲函數14對應 圖叫16組合=^:,(9)’場^ 在該區m〇27= 扭曲函數⑽18,以形成 W,2]本身上的連續謂 被轉i奥成為(1♦其與式_2叫相符合此點, 念時,同樣導向應用,與加總策略的時間扭曲概 7 财給妓構代表赌ls與訊框 18 20 20^20172 Λ 4㈣目丨 範例。應該注意的是,鋪重疊金 加〜原則,對於完整的訊框12 、 18與22兩者_訊。 而要扭曲函數 3另粒意岐,__立取得細函數的一起 ;口、、=取得一適用組合扭曲_的唯一方法。扭曲函數 也可以直接利用與兩連續訊框相符的一適用扭曲 目良子取得。較佳的是,在該兩扭曲函數定義域重疊上, /、有扭曲函數的仿射一致性。 根據式(6),式(;8)中的窗函數如以下定義 •饼㈣,⑼ 其在區間[Μ,2]之間由零增加到一,而在[、,2]之間由 -減少到零。 ▲果具有OcCVcq的常數,便可以取得式⑻的一種雙 正交形式,因此對於所有的々而言 又 c丨補% 〇仏2 在式(4Jt選擇;,形成式(5)的特殊化形式 /*’”(0=,(么(卜咖s[砌+赚㈣) — %)];] A”(0- 2么〇-伙(么(卜咖。和(”++)(么(卜幻―%)] (12) 因此,對於連續時間的情況而言,取得合成與分析函 數(,(12)) ’其與該組合扭曲函數相關。此相關性考慮到 一重璺與加總策略之巾㈣間扭曲,但不造成原始訊號的 資訊損失’換言之,考慮到該訊號的完美重建。 可以注意為了實作的目的,可以將式(12)中實作的操作 1320172 分解成為連續的各自處理步驟序列。以此方式處理的—種 . 特別吸引人的地方是首先實作該訊號的窗化、接著是該窗 化訊號的重採樣,而最後進行轉換。 知:照慣例,利用一給定樣本頻率進行音訊離散樣本採 樣的數位化儲存及傳輸,在之後所給定代表本發明實作的 範例,必須對於離散情況中的應用另外發展。 、 魯 可以利用離散分析積分與合成波形,從一時間扭曲巧 部餘弦基礎獲得該時間扭曲改正離散餘弦轉換 (TWMDCT)。該後續敘述則根據該雙正交底(見式(12))。 需要用來處理該正交情況式(8)的改變,包括以賈柯比因子 所進行的額外時間域加權。在不施加扭曲的特別情 况中,兩種建構都降級成為一般的改正離散餘弦轉換 (MDCT)。令L為該轉換尺寸,並假設該被分析訊號 % 對於某些《<1的情況是受到《πΐ (rad/s)的頻帶限制。此 形成以採樣週期為1/Z的樣本描述該被處理訊號。 該分析係數可由以下給定 λ+2 (13) = W/X(0W,-幻^咖+妇⑷卜幻-m*)]你-幻Λ 定義該窗化訊號部分\ +认㈠),並在積分式(j 3) 中實作r =ί-Α:與r=么(r)的替換,得到 2 c*,” = j^(CV))c〇s〇(«++)(r-mjl)]办(14) 利用本發明所指導將此積分離散的一特別吸引人的方 1320172 式,是將該採樣點選擇為卜 數值 便具有以 下的以上敘述的輕微扭曲與頻帶限制, c*,” w 孕 SA(v)c〇s π ’ \ \ ( Λ X w+i- v +丄 、2J V 2j\ η = ~1 (15) 其中, 从)= '(<丨(〇) (16) 式〇5)中的加總區間則由〇4<2所定義。其包含 v~〇 ' 1 Λ ' L-l 、 ♦· 、’仕母—端處延伸此區間,因此其總點數 為U。注意由於該窗化,其結果對於某些整數v〇,當 %”辦所存在的邊緣情況處理並不敏感。 如同已知的方法,可以_基本摺疊操作(ei__ 1, Tv°pratlon) ^ 伽=的離散餘弦轉換(DCT)所計算,其可能適合將 作分解成為—連串的連續操作及轉換,並利用已唾 ^在的硬體及讀實作,_是離散餘轉換(D根 據該離散稽分,一仏—’很 ,,,σ疋的離政時間詮釋為x(〇在採樣週期 下的麵樣本。因此窗化的第-步驟,對於严0 ' /、 2、 …、2X-1而言,便形成: 」、、(17) 在如式(I5)所描述進行區塊轉換之前(引入與 的額外補償),需要進行重採樣,映縣 關 21 該重採樣操作可以利用任何非等距重採樣的適合方法 實作。 總結來說,本發明時間扭曲改正離散餘弦轉換 (MDCT)可以分解成為窗化操作、重採樣以及區塊轉換。 之後參考第2圖至第3b圖簡短描述各自的步驟。第2 圖至第3b ®顯示只考量-合成產生音調贱兩窗化區塊 的時間扭曲改正離散餘弦轉換(MDCT)步驟。每個各自 訊框都包括1024個樣本,因此該兩個考量組合訊框24與 26 (原始訊框30與32以及原始訊框32與34)的每一個 都包括2048個樣本,因此該兩窗化組合訊框具有my個 重豐樣本。第2圖至第2b圖在X軸上顯示3個被處理訊框 的標準化時間。第一訊框30介於時間轴上〇至丨的範圍, 第二訊框32介於1至2的範圍,而第三訊框34介於2至 3的範圍。因此,在該標準化時間域中,每個時間單位都 對應具有1024個訊號樣本的完整訊框^該標準化分析窗 在该標準化時間區間[0,2]與[1,3]之間延伸。該後續考量的 目的是復原該訊號的中間訊框32 ^而重建該外側訊號訊框 (30、34)則需要來自於鄰近窗化訊號片段的資料,在此 並不考量其重建。可以注意的是,在第丨圖中所顯示的組 5扭曲映圖,疋利用第2圖的訊號所取得的扭曲映圖,描 述本發明將三個接續標準化扭曲映圖(點狀曲線)組合至 兩個重疊的扭曲映圖(實體曲線)。如同以上說明,為了訊 唬分析取得本發明的組合扭曲映圖18與22。此外,可以 1320172 圖此曲線代表具有與該原始兩 二號。其格式= ^曲定,曲為該音調的對數微^^^圖 m立^日所取得的本發明分析窗則以點狀曲線疊加。
與標準對_(例如在改球散餘弦轉換 irt中)之間最切差異,發生在該扭曲最大的 ^就疋該第一片段[ο,1]。窗的數學定義則單獨由式 (υ的窗重採樣方式所給^,所實作的重採樣則以式⑹右 手侧的第二因子所表示。 第2a與第2b圆描述本發明將第2圖的窗施加至各自 的訊》號片段的窗化結果。
第3a與第3b圖描述與第與第2a與第2b圖窗化訊號 區塊重採樣侧的扭曲參數結果,該鎌樣翻用第i圖 實體曲線所給定扭曲映圖指示的方式實作。標準化時間區 間[〇,1]被映射至該扭曲時間區間[0J],其與該窗化訊號區 塊的壓縮左半部相等。因此,對該窗訊號區塊的右半部實 作擴展,將區間[1,2]映射至〇,2]。因為該扭曲映圖,是以 將§亥扭曲訊號取得為具有相同音調的目標從該訊號取得, 該扭曲(根據式(18)的重採樣)的結果便是一種具有相同音 調的窗化訊號區塊。應該注意的是,該扭曲映圖與該訊號 之間的不協調將使得此處的訊號區塊仍然具有變化音調, 其並不對該最後的重建造成干擾。 23 1320172 k 利用圓形符號標示後續區塊轉換的補償,因此該區間 [w,m+l]對應於在式(I5)中的離散樣本叫、〇、 、z_卜其 中£=1024。此的確等價性質意謂著該區塊轉換調變波形, 在w處共用一偶對稱點,而在所+1處共用一奇對稱點。特 別重要的是’注意α等於2m,因此所為〇與α之間的中點, 而m+1為與2之間的中點。總結來說,第3a與第3b圖 敘述利用式(18)描述本發明重採樣之後的狀態,當然,其與 籲 該扭曲參數有關。 第3a與第3b圖的訊號時間扭曲轉換域樣本接著被量 化並編碼’並可以與描述標準化扭曲映圖A的扭曲側資訊 一起傳送至一解碼器。量化是一種一般已知的技術,在後 續圖示中並非描述利用一特定量化規則所進行的量化,而 是聚焦在該解碼器側上的訊號重建。 在本發明的一實施例中,該解碼器接受該扭曲映圖序 列以及該解碼時間扭曲轉換域樣本,其中由於該訊號假 •設波段的限制,對於❽[而言可以假設‘=〇。 而在該編碼器侧,代表接收離散時間合成的開始點, 應該利用式U2)的合成波形考量連續時間重建: 沖从-幻(19) n>k k 其中 少*(“) = 〜(么(《)) (20) 並且 2* ⑺=;α)ΪΧη COS [π〇 + +) (r -叫)](21) 24 1320172 式(19)為窗化轉換合成的—般重疊與加總步驟。而在該 分析階段中,有利的θ右勒r π π α疋隹點〜v = % + (叫)/z處進行式⑵ 的採樣,形成 h⑹= Sbk、r危dkn cos 7(«+士)0+士) (22)
其可以利用以下步驟簡單地計算:首先,以^型 Z弦轉換(DCT),以規則G_2的依據,根據該 窗化。-旦制冰),下述重採樣 (V)進仃 h\mk+-
L Η zA<t>k ρ±£ (23) 將在等距樣本點㈣>/ζ處得到訊號片段乃,以做為式 (19)中重疊與加總操作的準備。
該重採樣方法同樣的也可以自由地選擇,並且並不需 要與》亥編碼H巾的相同。在本發明—實_巾,使用一種 以曲線(spline)内插為基礎的方法,其中可以調整該曲線 函數以成為具有波段關參數0的函數,而達成在 该计异後雜度與該重建品質之間的妥協。參數 g的一般常 1/3 ’而二次曲線的情況通常都可以適用。 在之後利用第4a至第7圖描述用於第3a與第3b圖中 所顯Hi的解碼。同樣應該賴的是在此並不欽述區塊 ,換以及轉換參數的傳輸,因為這些都是—般已知的技 ,做為解碼處理的開始’帛與第4b醜示一種已經 實作反向區塊轉換的配置,形成第如與第4b圖中所顯示 25 1320172 的訊號。該反向區塊轉換的一項重要特徵為由於已經在之 前所說明合成功能對稱性質的緣故,在第3a與第3b圖的 原始訊號中並不存在額外的訊號成分。特別是,該合成功 能具有對於w點處的偶對稱,以及對於W+1處的奇對稱。 因此’在該區間[〇,β]中,在該反向區塊轉換中加人正訊號 成分’而在該區間[β,2]中則加入該負訊號成分。此外,在
第4a與第4b圖中以利用點狀曲線疊加本發明用於合成窗 化操作的窗函數。 利用式(11)給定在該扭曲時間域中的合成窗函數數學 定義。第5a與第5b圖顯示在施加本發明窗化之後,仍然 在該扭曲時間域中的訊號。 第6a與第0b圖顯示最後第%與第%圖訊號的扭曲 參數相關重採樣結果。
最後,第7圖顯示該重疊與加總操作的結果,其為該 =號合成的最終步驟。(參考式(19)。)該重疊與加總操作 是-種第6a與第6b圖的波形加總。如同已經在之前所描 述的,只有該中間訊框32被完全重建,而與第2圖原始: 態相比之下’顯補中間赌32可·高精確地重建。因 為本發明的重要特性,其在第丨圖中該兩組合扭曲映圖Μ 與22只在該重疊標準化時間區間[切之中由一仿射映圖造 成差異,因此便可能精準取消在該反向區塊轉換期間所引 入干擾額外減成分。此結果使得在雜曲咖片段k2] 與⑽上的訊號部分與窗之間具有一致性。當考慮第知鱼 26 1320172 第4b圖時,片段[1,6]至[认2]的一種線性延伸,便因此使得 該圖形與該複數半窗能夠描述標準改正離散餘弦轉換 (MDCT)的時間域別名取消已知原則。接著可以利用一 種一般的反向扭曲映圖,將該已經被取消別名的訊號映射 至該標準化時間區間上。可以注意的是,根據本發明另一 實施例,可以在頻率域中應用一種預先濾波步驟以達到計 算複雜度的減少。這可以利用一種將該傳輸樣本值dkn進行 簡單預先加權方式所實作。這種預先濾波的方式,則例如 在 M. Unser,A. Aldroubi,and M. Eden,“B-spline signal processing part II - efficient design and application”中描述。 此實作在該窗化操作之前,必須對該反向區塊轉換的輸出 施加種B-曲線重採樣。在此實施例之中,對一訊號操作 如在式(22)中具有改正為,”的重採樣。同時也不實作該窗函 數心(〜)的施加。因此,在該訊號片段的每一端處,該重採 樣必須注意有關利用該區塊轉換選擇所引入週期性與對稱 性的邊界情況。接著在重採樣之後,利用判)實 作所需要的窗化。 總結來說,根據本發明解碼器一實施例,當將反向時 間扭曲改正離散餘弦轉換(MDCT)分解為各自步驟時, 其包括: 籲反向轉換 *窗化 27 1320172 *重採樣 鲁重疊與加總 根據本發明一第二實施例,反向時間扭曲改正離散餘 弦轉換(MDCT)包括: 籲頻譜加權 籲反向轉換 •窗化 «重採樣 春重疊與加總 可以注意的是,在不施加扭曲的情況中,也就是一種 所有的標準化扭曲映圖都是不重要的情況(η(〇 = ί),在以 上詳細說明的本發明的實施例也與一般的改正離散餘弦轉 換(MDCT) —致。 現在將參考第8至第15圖說明本發明組合上述特徵的 另外實施例。 第8圖顯示本發明音頻編碼器的一範例,其接收一數 位音頻訊號100做為輸入,並產生傳輸至一組合本發明時 間扭曲轉換編碼概念解碼器的位元串流。該數位音頻輸入 訊號100可是-種自然的音頻訊號或是一種預先處理的音 頻訊號,其中舉例而言,該預先處理可以是一種刷白 (whitening)操作,以將該輸入訊號的頻譜刷白。本發明 編碼器組合-扭曲參數取得器m、一扭曲轉換器1〇2、一 感知模型計算H 1G3、-扭曲柄器1()4、—編碼器1〇5、 以及-多工器.106。該扭曲參數取得器謝估計一扭曲參 28 1320172 數序列’並輸入至該扭曲轉換器1〇2與該扭曲編碼器ι〇4 之中。該扭曲轉換器102取得該數位音頻輸入訊號1〇〇的 時間杻曲頻譜表現。將該時間扭曲頻譜表現輸入至嗦 器1〇5之中,以進行量化與其他例如差分編碼的可能編 碼。該編碼器105額外受到該感知模型計算器1〇3所控制。 舉例而s ’當訊號成分被、編碼,而其主要受到其他訊號成 分所遮蔽時,可以增加該量化的嫌度。雜曲編碼器1〇4 將該扭曲參數序列進行編碼,以減少在該位元串流^中, 在傳輪期間的序列尺寸。例如這可能包括量化參數,或是 例如差分編碼或熵編碼技術,以及算術編碼結構。 該多工器106從該扭曲編碼器1〇4接收該編碼扭曲參 數序列以及該數位音頻輸入訊號1〇〇的編碼時間扭曲頻譜 表現,以進行由該編碼器所輸出位元串流之中資料的多工 處理。 第9圖描述一時間扭曲轉換解碼器的範例,其接收一 相各位το串流200,以取得一重建音頻訊號做為輸出。該 解碼器包括一解多工器20卜一扭曲解碼器202、一解碼器 203、以及一反向扭曲轉換器2〇4。該解多工器2〇1將該位 元串桃解多工處理成為該編碼扭曲參數序列,並輪入至該 扭曲解碼器202之t。該解多工器2()1另外將該音頻訊號 時間扭曲頻譜表現的編碼表現進行解多工處理,並輸入至 /解馬器203中’其具有第§圖音頻編碼器對應編碼器 的反向操作。扭曲解碼器2〇2取得該扭曲參數序列的重 建,而解碼器203取得該原始音頻訊號的時間扭曲頻譜表 29 1320172 現。將該扭曲參數序列的表現與該時間扭曲頻譜表現輸入 至該反向,曲轉換器2〇4之中,其實作本發明音頻訊號時 間扭曲重疊轉換編碼的概念,取得—數位音頻輸出訊號。 第10圖顯示一時間扭曲轉換解碼器的另一實施例,其 中該在該解碼器本身之愧得該時間參數序列。第1〇圖中 所顯示的替代實施例包括一解碼器2GS、一扭曲估計器 30卜以及一反向扭曲轉換器2〇4。該解碼器2〇3與該反向 扭曲轉換器204共有與该先前實施例對應裝置中的相同功 能’而因此在不同實施财的這些描述完全沒有改變。該 扭曲估計H则糊組合先前鮮域音調估計以及一目前 頻率域音調估計的方式,取得該解碼器203時間扭曲頻譜 表現輸出的實際扭曲。因此,雜曲參數序删被含蓄地 發信,因為在該位it串流中沒有額外的扭曲參數資訊需要 輸人至該解之中,因此其具錢最大優點為可
則:二=外的位凡傳輸率。然而,該扭曲資料的含蓄發信 則文到該轉換時間解析度的限制。 =11 ®描述當使用不具有本發明時_曲解碼概念能 技術解時’本發明概細後向相容性。這種 解碼i、^、略_相扭岭數f訊,·舰位元串流 向轉ίί—4Γ域訊號,並提供至不實作任何扭曲的一反 實作的頻率分析因?:本發明編碼器中由時間扭曲轉換所 好調進 斤疋與不包含任何時間扭曲的轉換之間良 的土頻於的解碼11將減產生一有意義 9頻輪出。㈣時間扭曲的緣故,這樣操作具有降低音 30 1320172 ',的成本’其在先前技術解褐财並不進行反向操作。 第12圖顯示本發明時間扭曲轉換方法的塊狀圖示。本 ^明時間扭曲轉換包括窗化训、重採樣5〇2、以及區塊轉 換503。首头,分认 „ 以輸入訊號利用—種與該扭曲參數序列有 的,宜·相進行窗化,其做為該各自編碼步驟則至 f每個的額外輸入。每個窗化輸入訊號片段接著都在 〆重採樣步驟5〇2中進行重採樣,其中利用該扭曲參數序 列所指示的方式進行重採樣。 在該區塊轉換步驟503之中,一般來說利用一種已知 的離散三角轉換取得區塊轉換。因此對該窗化及重採樣訊 號片段實作轉換。應紐意的是,_塊㈣並不與從該 扭曲參數序列所取得的補償數值有關。因此,該輸出則由 轉換域訊框序列所組成。 第13圖顯示本發明時間扭曲轉換方法的流程圖。該方 法包括反向區塊轉換601、窗化6〇2、重採樣6〇3、以及重 疊與加總6G4 #步驟。姻該反向區塊轉換6Ql步驟將轉 換域訊號的每-訊框都轉變成為—時間域訊號。對應於該 編碼步驟’該區塊轉換與由該接收參數序列所取得的補償 數值有關,其做為該反向區塊轉換6(n、該窗化6〇2、與該 重採樣603的額外輸入。由該反向區塊轉換6〇1所取得的 訊號片段接著便在該窗化步驟602中進行窗化,並在該重 採樣步驟603中利用該扭曲參數序列進行重採樣。最後, 在重疊與加總步驟604中’以一種一般的重疊與加總操作 將該窗化與重採樣片段加人至該先前的反向轉換片段之 31 1320172 中,形成S亥時間域輸出訊號的重建。
第14圖顯示本發明反向時間扭曲轉換器的-替代眘 施例,其用以額外地減少該計算複雜度。該解碼器且 第13圖中解的部分相同功能。因此該財施例^相 同功能區塊的敘述將完全地相同。該替代實施例與第 實施例不同之處’在於其在該反向區塊轉換6G1之前實作 -種頻错預先加權彻。此固定的頻譜預先加權與利用該 以1換選擇所狀週雛及對稱性的時間域濾波相等: 这種遽波㈣為根據絲射法轉定轉部分, 到後續改正重採樣7〇2的計算複雜度降低。如此,重^ 有魏塊轉換獅削丨人週雛及_性的訊 S最1 在重採樣702之後進行改正窗化步驟 。最後,在重疊與加總步驟604中,以一種一般的重義
步驟將該窗化與重採樣片段加人至該先前的反= 轉換f段之中,獲得該重建時間域輸出訊號。 用!Γί第15b_示本發明時間扭曲編碼概念的效 在進行及不進行時間扭曲應用下的相同訊 ;;=15a圖描述源自於16千赫兹下進行男性娜 =又樣,具有轉換尺寸娜⑽正離散餘_換的頻 :列:框。所形成的頻率解析度為78赫兹,而為了描述 個列,其對應於4.7千_的頻寬。 2由《頻與圖示所見,刻段具有大概為155赫兹平 】曰調的聲音音響。如同鄕以圖所能另外看到的,該 。周頻率新的第-諧音為明顯可辨’但愈往高頻位置,該 32 1320172 分析變的愈來愈密且受_亂。這是祕在該被分析气號 片段長度之中的音調變化所造成。因此,該巾間至高頻範 圍的編碼需要一大量的位元量,以避免在解碼後立即造成 可聽見的人為干擾。相反的,當固定該位元傳輸率時化將 由於增加量化粗糙度的要求而無可避免地形成大量的失 真。 第15b圖描述源自於根據本發明時間扭曲改正離散餘 弦轉換的頻譜列訊框。明顯的,同樣使用第15a圖中已經 使用的原始男性音頻訊號。該轉換參數與第15a圖中所使 用的相同,但是利用適合於該訊號的時間扭曲轉換,對於 頻谱表現上具有可見的戲劇性效果。在該時間扭曲轉換域 中訊號的稀疏與有組織特性,即使在考慮到額外扭曲資料 的編碼成本時,仍可導致一種具有更佳傳輸率失真效能的 編碼結果。 如同已經提到的,傳輪扭曲參數以取代傳輸音調或速 度資訊,具有明顯的優點為戲劇性地減少該額外需要的位 元傳輸率。因此,在該後續章節中,將詳細敘述許多本發 明用來傳輸所需扭曲參數資訊的結構。 對於在時間ί處具有扭曲α⑺的訊號而言,用於該局部 餘弦基礎(參考式(8)、(12))的最佳標準化扭曲映圖序列^ 選擇,可以利用求解下式所獲得 = …以+ 1 (24) 然而,需要用來描述此扭曲映圖序列的資訊總量是過 33 1320172
大,而難以定義β(ί)點數值的量測。對於實際目的而言,立 即决疋一扭曲更新區間〜,而每個扭曲映圖%則以#二1/& 參數所描述。對於與音頻訊號而言,一般來說具有大概1〇 至20微秒的杻曲更新區間是足夠的。同樣的從%與〜+1建 構式(9)中的A,便可透過適當的仿射重縮放操作,由#個
標準化扭曲映圖拼凑一連續可微分標準化映圖。標準化映 圖的原型範例包含
exp(flf)-i 指數: exp(a)-i 4 + α (25)
Moebius : ,
、其中α為扭曲參數,利用㈣,定義一映圖呦的扭由 上述二種扭曲都可軸在卜Μ處科“的 圖具有在完全_把等扭曲,而對於小= 而吕’另外兩個映_此數值之間存在極小的 ^解躲雜㈣目,輯行麵樣(式㈣ :§田在该編碼器中需要用於該重採樣 作。用於反向縣_雕成 "岐咐 扭曲映_反向操作:於該標狗 作,指數㈣#作需要平方根相 映圓的反向操作則是—種罐效有 圖。因為指數函數盘除法相㈣曰主 ^ M〇eblus缺 I除法相·昂貴,因此針對於該解碼 34 斋中的計算最大減緩將使得其最佳選擇為連續二次扭曲映 圖序列h。 接著由則固扭曲參數_、办(1)、...、__υ完全定 義該標準化扭曲映圖h,其具有以下的要求 鲁為一種標準化扭曲映圖; •由該平滑原型扭曲映圖(式(25))之—的重縮放副本 加以拼湊: 癱為連續可微分; *滿足 7(/+1)、(0, / = 0,1,...iV-1 (26) 本發明使得該扭曲參數可以被線性量化,一般來說量 化為一種大概0.5赫茲的階段尺寸。接著將所形成的整數 數值進行編碼。替代的,該微分<可崎釋為-種標準化 的音調曲線,其中該數值 Κ(^Δ〇 1 = 1,2,...,n, (27) 被量化為一固定階段尺寸,一般來說是0.005。在此情 况t,该形成的正數數值以一種連續或階層方式進一步的 差刀編碼。在兩情況巾,卿成的㈣訊位元傳輸率一般 來說為每秒數百位元,其只是在—語音碼巾需要用來描述 音調資料傳輸率的一小部分。 具有大計算資源的編碼器可以決定該扭曲資料序料, /、將忒編媽成本最佳化地減少,或將頻譜列稀疏程度的量 35 測最大化。對於音調追縱而言的一種已知較不昂貴的方法 將形成一量測音調函數〆0,並在存在音調追蹤的區間處以 一連續線性函數副近似於該音鍋線,衫造成在該音 凋數值中的大跳躍。在該音調追蹤區間内部中的估計扭曲 序列,可由下式給定 a*(/) = —m。、
At P〇di + 1)Δί + k) + p^i^f + (28) 注意在該音調估計中的系統性誤差,像是兩倍的音調 週期對於扭曲估計而言具有極小的影響。 如在第10圖中所描述,在本發明一替代實施例中,該 扭曲參數序列可關用—扭曲估計器所得的解碼轉換域資 料所取得。其原則是為了轉換資料的每一訊框,或從隨後 解碼序號d塊的音調計算—頻率域音調似。接著從與式 (28)相同的方程式取得該扭曲資訊。 本發明概念的應用主要已經利用在一音頻訊號頻道策 略中施加本發明時間扭曲的方式描述。本發明概念當然並 不限制於這種單音策略的使用之中。此外,其所具有的高 度優點為在多頻道編碼應用之中藉由使用本發明概念所可 以達到的高度編碼增益,其巾必須傳輸本發明概念所 編碼的單-或多數頻道。此外,減—般來說是定義為根 據Λ:所進行的X軸任意函數轉換。因此,本發明概念也可 以應用於不明顯與時間相關的扭曲訊號函數或表現策略之 中。舉例而言,也可以實作訊號頻率表現的扭曲。 此外本發明概念可以有利的應用至具有任意片段長 度的訊號,其並不具有先前章節所描述的相等長度。 1320172 在先前章郎中所呈現的基礎函數與離散化的利用,可 以另外瞭解為應用本發明概念的優勢範例。對於其他應用 而言,也可以使用不同的基礎函數與不同的離散化方式。 根據本發明方法的特定實作要求,本發明方法可以實作在 硬體或軟體之中。該實作可以利用一種數位儲存媒介實 作,特別是在其上具有儲存電子可讀控制訊號的磁碟、多 功能數位碟片(DVD)或是光盤(CD),其與一種可程序 化的電腦程式組合,因而實作本發明方法。一般來說,本 發明因此疋-種機械可觸介,當該電_式在電腦上執 行時’該程柄便胁實作本發财法。換句話說,本發 5 種具有程式碼的電腦程式,當該電腦程式 在電社執行時,其至少實作本發财法之一。 雖^前已經參考本㈣特定實關騎特錢示並 =二;===的是,在不背離本發明精神 ===範_化™: ’同的實施例進行不同的調整變化。 37 【圖式簡單說明】 在之後膽將以參考圖示的方式描述本發明的較佳實施 W,其中: 第1圖顯示本發明扭曲映圖的範例; 第2至第2b圖顯示本發明扭曲相關窗的應用; 第3a、3b _示本發明重採樣的範例; 第4a、4b圖顯示本發明在該解碼器侧的訊號合成範例; 第5a、5b圖顯示本發明在該解碼器綱窗化範例; 第6a、6b圖顯示本發明在該解碼器侧的時間扭曲範例; 第7圖顯示本發明在該解碼器侧的重疊與力口總處理; 第8圖顯示本發明音頻編碼器的範例; 第9圖顯示本發明音頻解碼器的範例; 第11圖顯示本發明概念向後適用實作的範例;
第10圖顯示本發明音頻解碼㈣另-範例; 第12圖顯示本發明編碼實作的塊狀圖示; 第13圖顯示本發明解碼的範例塊狀圖示; 第14圖顯示本發明解碼另__實施例的塊狀圖示; 第15a、15b圖顯示本發明概念可達成編碼效率 【主要元件符號說明】 實作的描述。 10、30第一訊框 12、32第二訊框 14、16扭曲函數 18、22組合扭曲函數 20後續訊框 24、26組合訊框 34第三訊框 MUK多工器 DEMUX解多工器 38

Claims (1)

1320172 十、申請專利範圍: 1. 一種用於取得一音頻訊號表現的編碼器,該音頻訊號 具有一第一訊框、該第一訊框後的一第二訊框,以及 該第二訊框後的一第三訊框,該編碼器包括: 一扭曲估計器’用於估計該第一與該第二訊框之第一 扭曲資訊’並用於估計該第二訊框與該第三訊框之第
二扭曲資訊,該扭曲資訊描述該音頻訊號的一音調資 訊; 一頻譜分析器,用於使用該第一扭曲資訊來取得該第 一與該第二訊框之第一頻譜係數,並用於使用該第二 扭曲資訊來取得該第二與該第三訊框之第二頻譜係 數;以及 —輸出介面,用於輸出包含該第一與該第二頻譜係數 的該音頻訊號表現。 2. 如申請專利範圍第1項所述的編碼器,其中該扭曲估 叶器是用於估計該扭曲資訊,使得在一訊框扭曲表現 二中的一音調比在該等訊框中的一音調更固定,其中從 5亥訊框取得的扭絲現根據雜曲資訊來轉換該 框令之音頻訊號的時間軸。 ° 如申請專利範圍第 1項所述的編石馬器,其中兮才 =是用於使用該等訊框中之音調變化的資;;:: 5亥扭曲資ffl。 叶 =請專利範圍第3項所述的編碼器,其中該扭 ^是用於估計該扭曲資訊’使得該音調變化的資訊 39 4. /、在該音調變化低於一預定最大音調變化時才被使 用。 如申請專利範圍第1項所述的編碼器,其中該扭曲估 計器是用於估計該扭曲資訊,使得一訊框的一扭曲表 現的一頻譜表現比該攔框的一頻譜表現更為稀疏,其 广從该訊框取得的扭曲表現根據該扭曲資訊來轉換該 等訊框中之音頻訊號的時間軸。 如申请專利範圍第1項所述的編碼器,其中該扭曲估 α十器疋用於估計該扭曲資訊,使得由一訊框的一扭曲 表現的一頻譜係數的編碼表現所消耗的位元數目低於 利用相同編碼規則取得兩者表現時該等訊框的頻譜係 數的一編碼表現,其中從該雜取得的扭曲表現根據 °亥扭曲資訊來轉換該等訊框中之音頻訊號的時間軸。 如申明專利範圍第1項所述的編碼器,其適於取得由 一離散樣本值序顺給定的—音頻峨的一表現。 如申請專利範圍第1項所述的編碼器,其中該扭曲估 計器是用於估計該扭曲資訊,使得訊框的_扭曲表現 描述對應訊框之音頻訊號的相同長度,其中從該訊框 取得的扭曲表現根據該扭曲資訊來轉換該等訊框中之 音頻訊號的時間軸。 如申睛專利$_第1項所述的編碼器,其中雜曲估 ,器是用於估計雜曲資訊,使H對應訊框的 第-中間扭曲資訊與-第二對應訊框的第二中間扭曲 資訊可使用一組合規則而加以組合。 1320172 10. 如申請專利範圍第9項所述的編碼器,其中該組合規 則使得該第一中間扭曲資訊的重縮放扭曲參數序列連 接該第二中間扭曲資訊的重縮放扭曲參數序列。 11. 如申請專利範圍第10項所述的編碼器,其中該組合規 則使得所形成的該扭曲資訊包括一連續可辨扭曲參數 序列。 12. 如申請專利範圍第1項所述的編碼器,其中該扭曲估 計器是用於估計該扭曲資訊,使得該扭曲資訊包括一 漸增扭曲參數序列。 13. 如申請專利範圍第1項所述的編碼器,其中該扭曲估 計器是用於估計該扭曲資訊,使得該扭曲參數描述一 連續可辨重採樣規則,其映射區間[〇,2]至其本身。 14. 如申請專利範圍第1項所述的編碼器,其中該頻譜分 析器適於根據該扭曲資訊而使用餘弦基礎來取得^二 譜係數。 ,人, 15. 如:請專利範圍第1項所述的編碼器,其中該頻譜分 析益適於利用兩訊框的一加權表現來取得該頻譜係 數。 。曰, 16. 如申η請專利範圍帛15項所述的編碼器,其中該頻譜分 =是用於取得該頻譜係數,以藉由對該兩訊框:加 囪函數而獲得該兩訊框的該加權表現, 數與該扭曲資訊有關。 、中^函 17·如申凊專利範圍第1項所述的編碼器,其中兮㈣八 析器適於利用該訊框的-重採樣表現來取得 41 數0 18.如申請專利範圍第17項所述 :=得根據該扭二: 其中所取得的 訊號之-音調ίΓ為音頻訊號之音調的音頻 20. t申請專利範圍第1項所述的編碼器,其中該扭曲估 叶器是用於估計該扭曲資訊’使得該扭曲資訊包括一 扭曲參數序列’其中各扭曲參數据述該音頻訊號的一 有限長度區間。 L如申凊專利|&圍第1項所述的編碼器,其中該輸出介 面是用於進一步包含該扭曲資訊。 22. 如申请專利範圍第!項所述的編碼器,其中該輸出介 面是用於it-步包含該細#·—量化表現。 23. -種用於重建-音頻訊號的解碼器,該音頻訊號具有 一第-訊框、該第-贿之後的—第二訊框,以及該 第二訊框之後的-第三訊框,其利用描述該第一與該 第二訊框之音頻訊號的一音調資訊的第一扭曲資訊, 描述該第二與該第三訊框之音頻訊號的一音調 資訊的 第二扭曲資訊,該第一與第二訊框之第一頻譜係數, 與該第二與第三訊框之第二頻譜係數來進行重建,該 解碼器包括: 頻譜值處理器,用於利用該第一頻譜係數與該第一 42 1320172 組合訊框,鄕-岭訊框具 有該第二訊㈣資訊;以及 ,,該第二頻譜係數與該第二扭曲資訊來取得一 第-、、且δ 該第二組合訊框具有 訊框的資訊;以及 弟二 組合訊 一合成器,用於利用該第一組合訊框與該第二 框重建該第二訊框。 —’
24. 如申請專利範圍第23項所述的解瑪器,其中該頻譜值 處理器是用於使用餘弦基礎函數來取得該等組合訊 框,該餘弦基礎函數與該扭曲資訊有關。 25. 如申請專利範圍帛24項所述的解石馬器,其中該頻譜值 處理器是用於使用餘弦基礎函數,使得對該頻譜係數 使用餘弦基礎函數產生-組合訊框的—時間扭曲未加 權表現。
26. 如申請專利範圍第23項所述的解碼器,其中該頻譜值 處理器疋用於使用-窗函數,以對該組合訊框的樣本 值加權’該窗函數與該扭曲資訊有關。 27. 如申請專利範圍第25項所述的解碼器,其中該頻譜值 處理器是用於使用一窗函數,使得當將該窗函數被施 加至一組合訊框的時間扭曲未加權表現時,可產生一 組合訊框的時間扭曲表現。 28. 如申請專利範圍第23項所述的解碼器,其中該頻譜值 處理态是用於使用扭曲資訊,以根據該扭曲資訊來轉 換組合訊框之表現的時間轴,以取得該組合訊框。 43 1320172 第二訊框 30.如申5月專利範圍帛μ項所述的解碼器,其適於重建由 離政樣本值序列所表現的音頻訊號。 31·如申晴專利範圍帛23項所述的解碼器,更包括一扭曲
估汁器,用以從該第一與該第二頻譜係數取得該第一 與該第二扭曲資訊。 32. 如申請專利範圍第23項所述的解碼器,其中該頻譜值 處理器是用於對該頻譜係數施加預定加權因子以進行 該等頻譜係數之加權。
33. —種用於取得一音頻訊號之一表現的方法,該音頻訊 號具有一第一訊框、該第一訊框之後的一第二訊框, 以及該第二訊框之後的一第三訊框,該方法包括: 估計該第一與該第二訊框之第一扭曲資訊,並估計代 表該第二與該第三訊框之第二扭曲資訊,該扭曲資訊 描述該音頻訊號的一音調資訊; 利用該第一扭曲資訊來取得該第一與該第二訊框之第 一頻譜係數,並利用該第二扭曲資訊來取得該第二與 該第三訊框之第二頻譜係數;以及 輸出該音頻訊號之該表現,其包含該第一與該第二頻 譜係數。 34· —種用於重建一音頻訊號的方法,該音頻訊號具有一 第一訊框、該第一訊框之後的一第二訊框,以及該第 44
TW095139384A 2005-11-03 2006-10-25 Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal TWI320172B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US73351205P 2005-11-03 2005-11-03
US11/464,176 US7720677B2 (en) 2005-11-03 2006-08-11 Time warped modified transform coding of audio signals

Publications (2)

Publication Number Publication Date
TW200719319A TW200719319A (en) 2007-05-16
TWI320172B true TWI320172B (en) 2010-02-01

Family

ID=37507461

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095139384A TWI320172B (en) 2005-11-03 2006-10-25 Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal

Country Status (14)

Country Link
US (3) US7720677B2 (zh)
EP (7) EP2306455B1 (zh)
JP (4) JP4927088B2 (zh)
KR (1) KR100959701B1 (zh)
CN (2) CN102592602B (zh)
AT (1) ATE395687T1 (zh)
DE (1) DE602006001194D1 (zh)
DK (1) DK1807825T3 (zh)
ES (5) ES2604758T3 (zh)
HK (2) HK1105159A1 (zh)
MY (1) MY141264A (zh)
PL (1) PL1807825T3 (zh)
TW (1) TWI320172B (zh)
WO (1) WO2007051548A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI483245B (zh) * 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101380170B1 (ko) * 2007-08-31 2014-04-02 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
TWI455064B (zh) * 2007-12-20 2014-10-01 Thomson Licensing 聲影文件突起映圖之決定方法和裝置
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
CN102150201B (zh) 2008-07-11 2013-04-17 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
AU2013206265B2 (en) * 2008-07-11 2015-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Providing a time warp activation signal and encoding an audio signal therewith
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
EP2211335A1 (en) 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
EP2674943B1 (en) 2009-01-28 2015-09-02 Dolby International AB Improved harmonic transposition
BR122019023709B1 (pt) 2009-01-28 2020-10-27 Dolby International Ab sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
KR101701759B1 (ko) 2009-09-18 2017-02-03 돌비 인터네셔널 에이비 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체
WO2011048815A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 オーディオ符号化装置、復号装置、方法、回路およびプログラム
US9338523B2 (en) * 2009-12-21 2016-05-10 Echostar Technologies L.L.C. Audio splitting with codec-enforced frame sizes
CA2792500C (en) * 2010-03-10 2016-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding
EP2372704A1 (en) 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor and method for processing a signal
KR101809298B1 (ko) * 2010-10-06 2017-12-14 파나소닉 주식회사 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
SG192745A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Noise generation in audio codecs
WO2014108393A1 (en) 2013-01-08 2014-07-17 Dolby International Ab Model based prediction in a critically sampled filterbank
CA2964362C (en) * 2013-06-21 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
EP3000110B1 (en) * 2014-07-28 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
EP3107096A1 (en) * 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
CN117238300A (zh) 2016-01-22 2023-12-15 弗劳恩霍夫应用研究促进协会 使用帧控制同步来编码或解码多声道音频信号的装置和方法
CN110998722B (zh) * 2017-07-03 2023-11-10 杜比国际公司 低复杂性密集瞬态事件检测和译码
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3519830A1 (de) * 1985-06-03 1986-12-18 Ruhrkohle Ag, 4300 Essen Verfahren zur kohlehydrierung mit integrierten raffinationsstufen
JPH01233835A (ja) * 1988-03-14 1989-09-19 Mitsubishi Electric Corp 音声時間軸圧縮符号化装置
JPH0546199A (ja) * 1991-08-21 1993-02-26 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH0784597A (ja) * 1993-09-20 1995-03-31 Fujitsu Ltd 音声符号化装置および音声復号化装置
AU3690197A (en) 1996-08-02 1998-02-25 Universite De Sherbrooke Speech/audio coding with non-linear spectral-amplitude transformation
PL193723B1 (pl) * 1997-04-07 2007-03-30 Koninkl Philips Electronics Nv Sposób i urządzenie do kodowania sygnału mowy oraz sposób i urządzenie do dekodowania sygnału mowy
US6169970B1 (en) * 1998-01-08 2001-01-02 Lucent Technologies Inc. Generalized analysis-by-synthesis speech coding method and apparatus
US6182042B1 (en) * 1998-07-07 2001-01-30 Creative Technology Ltd. Sound modification employing spectral warping techniques
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6502066B2 (en) * 1998-11-24 2002-12-31 Microsoft Corporation System for generating formant tracks by modifying formants synthesized from speech units
KR20010072035A (ko) * 1999-05-26 2001-07-31 요트.게.아. 롤페즈 오디오 신호 송신 시스템
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
AU2001276893A1 (en) 2000-07-13 2002-01-30 Qualcomm Incorporated Maximum distance block coding scheme
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
EP1262952B1 (en) * 2001-05-28 2006-08-16 Texas Instruments Incorporated Programmable melody generator
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
DE60232560D1 (de) 2001-08-31 2009-07-16 Kenwood Hachioji Kk Vorrichtung und Verfahren zur Erzeugung eines Signals mit konstanten Grundfrequenz und Vorrichtung sowie Verfahren zum Synthetisieren von Sprachsignalen unter Verwendung dieser Signals mit konstanten Grundfrequenz.
JP3994332B2 (ja) * 2001-09-27 2007-10-17 株式会社ケンウッド 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム
EP1439524B1 (en) 2002-07-19 2009-04-08 NEC Corporation Audio decoding device, decoding method, and program
CN1290036C (zh) 2002-12-30 2006-12-13 国际商业机器公司 根据机器可读词典建立概念知识的计算机系统及方法
EP1604352A4 (en) * 2003-03-15 2007-12-19 Mindspeed Tech Inc SINGLE NOISE DELETION MODEL
US7587254B2 (en) * 2004-04-23 2009-09-08 Nokia Corporation Dynamic range control and equalization of digital audio using warped processing
US7433463B2 (en) 2004-08-10 2008-10-07 Clarity Technologies, Inc. Echo cancellation and noise reduction method
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US7917561B2 (en) 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8010350B2 (en) * 2006-08-03 2011-08-30 Broadcom Corporation Decimated bisectional pitch refinement
DE602007004502D1 (de) * 2006-08-15 2010-03-11 Broadcom Corp Neuphasierung des status eines dekodiergerätes nach einem paketverlust
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
PL2165328T3 (pl) * 2007-06-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
CN102150201B (zh) * 2008-07-11 2013-04-17 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
WO2011048815A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 オーディオ符号化装置、復号装置、方法、回路およびプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI483245B (zh) * 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
US9037457B2 (en) 2011-02-14 2015-05-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec supporting time-domain and frequency-domain coding modes
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
TWI564882B (zh) * 2011-02-14 2017-01-01 弗勞恩霍夫爾協會 利用重疊變換之資訊信號表示技術(一)
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Also Published As

Publication number Publication date
CN101351840B (zh) 2012-04-04
EP4290512A2 (en) 2023-12-13
JP6125324B2 (ja) 2017-05-10
EP4290513A3 (en) 2024-02-14
KR100959701B1 (ko) 2010-05-24
ES2967257T3 (es) 2024-04-29
TW200719319A (en) 2007-05-16
MY141264A (en) 2010-04-16
PL1807825T3 (pl) 2009-01-30
JP4927088B2 (ja) 2012-05-09
EP3319086A1 (en) 2018-05-09
HK1254427A1 (zh) 2019-07-19
ES2307287T3 (es) 2008-11-16
KR20080066760A (ko) 2008-07-16
US20100204998A1 (en) 2010-08-12
US7720677B2 (en) 2010-05-18
EP2306455A1 (en) 2011-04-06
EP3319086B1 (en) 2021-02-17
ES2646814T3 (es) 2017-12-18
EP1807825B1 (en) 2008-05-14
HK1105159A1 (en) 2008-02-01
ES2863667T3 (es) 2021-10-11
EP2306455B1 (en) 2017-09-27
US20130218579A1 (en) 2013-08-22
EP3852103A1 (en) 2021-07-21
EP1807825A1 (en) 2007-07-18
ATE395687T1 (de) 2008-05-15
JP2012068660A (ja) 2012-04-05
US8412518B2 (en) 2013-04-02
EP4290512A3 (en) 2024-02-14
EP1953738A1 (en) 2008-08-06
DK1807825T3 (da) 2008-09-08
EP3852103B1 (en) 2023-11-29
JP6084595B2 (ja) 2017-02-22
EP4290513A2 (en) 2023-12-13
US20070100607A1 (en) 2007-05-03
EP1953738B1 (en) 2016-10-12
JP2013210654A (ja) 2013-10-10
ES2604758T3 (es) 2017-03-09
US8838441B2 (en) 2014-09-16
DE602006001194D1 (de) 2008-06-26
WO2007051548A1 (en) 2007-05-10
JP2009515207A (ja) 2009-04-09
CN102592602A (zh) 2012-07-18
JP5323164B2 (ja) 2013-10-23
CN102592602B (zh) 2015-11-25
CN101351840A (zh) 2009-01-21
JP2015018274A (ja) 2015-01-29

Similar Documents

Publication Publication Date Title
TWI320172B (en) Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal
KR101203348B1 (ko) 가중 오버랩 애드 방법
RU2436174C2 (ru) Аудиопроцессор и способ обработки звука с высококачественной коррекцией частоты основного тона (варианты)
JP4649208B2 (ja) オーディオコーディング
JP5208901B2 (ja) 音声信号および音楽信号を符号化する方法
KR101740912B1 (ko) 고조파 전위에 기초하여 개선된 서브밴드 블록
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
RU2772356C2 (ru) Усовершенствованное гармоническое преобразование на основе блока поддиапазонов
JP2002099300A (ja) 音声符号化方法及び装置