TWI320172B

TWI320172B - Encoder and method for deriving a representation of an audio signal, decoder and method for reconstructing an audio signal,computer program having a program code and storage medium having stored thereon the representation of an audio signal

Info

Publication number: TWI320172B
Application number: TW095139384A
Authority: TW
Inventors: Villemoes Lars
Priority date: 2005-11-03
Filing date: 2006-10-25
Publication date: 2010-02-01
Also published as: CN101351840B; EP4290512A2; JP6125324B2; EP4290513A3; KR100959701B1; ES2967257T3; TW200719319A; MY141264A; PL1807825T3; JP4927088B2; EP3319086A1; HK1254427A1; ES2307287T3; KR20080066760A; US20100204998A1; US7720677B2; EP2306455A1; EP3319086B1; ES2646814T3; EP1807825B1

Description

1320172 九、發明說明：【發明所屬之技術領域】本發明與音頻來源編碼系統有關，而更特別的是與利用區塊基礎轉換的音頻編碼結構有關。【先前技術】、在本領域中，有許多用於音頻與影像内容編碼的方法田然，一般來說，其目標是在不使該訊號重建品質變差下，以一種位元節省的方式進行内容編碼。目前，已經建立進行音頻與影像内容編碼的新方法，其可以在大轉換尺寸時施加，其中以轉換為基礎的感知音頻編騎於定常訊號而言可以達到最大的編碼增益。（舉例而言，參考 T. Painter and A. Spanias: “perceptual c〇ding 〇f dlgital audio», Proceedings of the IEEE, V〇l. 88, No. 4, April 2⑻〇,pages 451-513)音頻的定常部分時常可以利用一種固定有限的定常正弦曲線加以模擬。一旦轉換尺寸是大到足以分解那些成分時，對於已知失真目標而言便需要固定的位元數目。藉由另外增加該轉換尺寸，將可以描述愈來愈多的音頻訊號片段’而不需要增加位元量的要求。然而，對於非定常訊號而言，便需要減少該轉換尺寸，而因此該編碼增益將快速地減少。為了克服此問題，對於突然改變與瞬變事件而言，可以應用轉換尺寸切換，而不需明顯地增加平均編碼成本。也就是說，當偵測到一瞬變事件時，起被編碼的樣本區塊尺寸（訊框尺寸）便減少。對於更 5 1320172 頻繁的瞬4峨而言，該位元傳輸率當然會顧地增加。 -種對於頻繁賴行為而言_有趣喊例，是局部 * 错和訊號的音賴化，其主要在語音與歌唱的聲音部分巾 . 產生，但也可能來自於某些樂器的顫音與滑奏。具有—諧和訊號，換言之’具有沿著時間轴等區間分佈訊號峰值的訊號，其音調部分則贿介於該職鄰近峰值之間的時間倒數。因此這種訊號具有―種完美的諧和頻譜，其利用與該音調相等的基頻以及更高次的譜音所組成。在更一般的情況中，音調可以定義為一局部諧和訊號之中兩鄰近對應訊號部分之間的時間倒數。然而，如果該音調以及該基頻隨時間變化’其通常仏見在聲音的音響中，該頻譜將會變的更加複雜，並因此更難以被有效率地編碼。與訊號音調非常有關的參數為該訊號的扭曲。假設該訊號在時fBU具㈣於灿的音調，且此音雛倾著時間平滑地變化，該城在_ ,處的扭曲便對數微分加以定義對於譜和訊號的音頻倍數或分數而言，此扭曲定義對於該諧和成分與系統誤差而言並不敏感。該扭曲量測在對數域中的頻率改變。扭曲—般所使用的自料位為赫兹 [巧，但在音樂方面，具有固定扭曲·％的訊號，是一種掃猫率為每秒具有物紋八元組[〇ctys]的掃晦。語音頻 · 訊號具有最乡1〇 Get/S触曲，*其平均扭㈣為2。咖。 · 轉換編碼器的典型訊框長度（區塊長度）报大，因此 6 1320172 在該訊框中的相對音調改變較為顯著，該尺寸的扭曲或音調變化造成那些編碼器的頻率分析干擾。對於所要求的^ 定位元傳輪率*言，其只能增加量化祕度加以克服，此效果造成量化噪音的狀，其通f可觀知成為回響。

一種克服此問題的技術則是時間扭曲。時間扭曲編碼的概念可利用想像具有可變速度錄音機的方式獲得最好說明。當記錄該音頻訊號時，可動態調整速度，以達到遍及所有的聲音片段都具有固定的音調。所形成的局部定常音頻訊號則利用隨著改變施加錄音磁帶速度進行編碼。在該解碼器中，接著利用相反速度改變進行播放。然而，如同以上描述施加簡單時間扭曲具有某些明顯的缺點。首先，無法控制該絕對錄音磁帶速度的結束，而造成一種完全編竭訊號持續時間與帶寬限制的抵觸。對於訊號重建而言，必須傳輸該錄音磁帶速度（或等價為該訊號音調）的額外侧資訊，其特別在低位元傳輸率的情況將引入一種基本的位元傳輸率耗費。先前技術方法中，用來克服此無法控制時間扭曲訊號持續時間的一般解決方式，是利用一種時間扭曲以獨立地處理該訊號的連續性非重疊片段，換言之，處理各自的訊框，因此可以保存每個片段的持續時間。舉例而言，此解決方式在 Yang et. al. Pitch synchronous modulated lapped transform of the linear prediction residual 〇 speech55

Proceedings of ICSP ’98, pages 591-594 中描述。這種處理方 7 1320172 .. 辦—項嚴重缺點是，雖然在片段中的處理訊號具有定常 • 性，但是在每個片段邊界處將存在跳躍。那些跳躍將明顯地造成該後續音頻編碼器的編碼效率損失，並在該解碼訊號中引入可聽見的不連續性。時間扭曲也在一些其他的編碼結構中實作。舉例而言，US-2002/0120445描述-種結構，其中訊號片段在區塊基礎轉換編碼之前，將進行持續時間的輕微改正。在該訊 • 號片段持續時間中進行輕微的改正，可用來避免在該區塊邊界處的大訊號成分。另一種利用時間扭曲的技術則在us_6，169,97〇中描述’其中施加時間扭曲以促進語音編碼器長期預測器的效能。同樣的，在US 2005/0131681中，描述一種用於語音頻訊號碼激式線性（CELP)編碼的預先處理單元，其在非重疊區間之間施加一種片段連續的線性扭曲，每一個都包含一刷白（whitened)音調脈衝。最後，在R j sluijterand • A.J.E.M. Janssen, “A time warper for speech signals” IEEE workshop on speech Coding’99, June 1999, pages 150-152 中描述如何對一語音訊框施加二次時間扭曲函數，以改善語音音調估計。總結來說’先前扭曲技術都具有在訊框邊緣處引入不連續性，以及需要傳輸描述該訊號音調變化參數，而造成需要明顯的額外位元傳輸率的問題。【發明内容】 8 1320172 本發明的目標是提供一種利用時間扭曲所進行更有效率的音頻訊號編碼概念。根據本發明第一觀點，此目標是利用一種用於取得具有一音頻訊號表現的編碼器所達成，該音頻訊號具有一第一訊框、該第一汛框之後的一第二訊框，以及該第二訊框之後的一第二訊框，該編碼器包括：一扭曲估計器，用於估a十代表e亥第與δ亥弟一 §Κ框的第一扭曲資訊，並用於估計代表該第二訊框與該第三訊框的第二扭曲資訊，該扭曲資訊則描述該音頻訊號的音調資訊；一頻譜分析器，用於利用該第一扭曲資訊取得代表該第一與該第二訊框的第一頻譜係數，並用於利用該第二扭曲資訊取得代表該第二與該第三訊框的第二頻譜係數；以及一輸出介面，用於輸出包含該第一與該第二頻譜係數的音頻訊號表現。根據本發明第二觀點，此目標是利用一種用於重建一音頻訊號的解碼器所達成，該音頻訊號具有一第一訊框、該第一訊框之後的一第二訊框，以及該第二訊框之後的一第三訊框，其利用第—扭崎訊，該第—扭曲資訊描述代表4第-與该第二訊框的音頻訊號音調資訊，第二扭曲資訊，該第二扭曲資訊描述代表該第二與該第三訊框的音頻訊號音調資訊，代表該第—與第二訊框的第—頻譜係數，代表該第二與第三訊框的第二頻譜係數進行重建，該解碼器包括：-頻譜值處理H，麟額該第—麟係數與該第-扭曲資訊取得-第一組合訊框，該第—組合訊框具有該第-與該第二訊框的#訊；以及麟_該第二頻譜係 9 1320172 數與§玄第'一扭曲資訊取得一第二組合訊框’該第*一組合訊框具有該第二與該第三訊框的資訊；以及一合成器’用於利用該第一組合訊框與該第二組合訊框重建該第二訊框。根據本發明第三觀點，此目標是利用一種取得一音頻訊號表現的方法所達成，該音頻訊號具有一第一訊框、該第一訊框之後的一第二訊框，以及該第二訊框之後的一第三訊框，該方法包括：估計代表該第一與該第二訊框的第一扭曲資訊，並估計代表該第二與該第三訊框的第二扭曲資訊，該扭曲資訊描述該音頻訊號的音調資訊；利用該第一扭曲資訊取得代表該第一與該第二訊框的第一頻譜係數，並利用該第二扭曲資訊取得代表該第二與該第三訊框的第二頻譜係數；以及輸出該音頻訊號表現，其包含該第一與第二頻譜係數。根據本發明第四觀點，此目標是利用一種重建一音頻訊號的方法所達成，該音頻訊號具有一第一訊框、該第一訊框之後的一第二訊框，以及該第二訊框之後的一第三訊框’其利用第一扭曲資訊’該第一扭曲資訊描述代表該第一與該第二訊框的音頻訊號音調資訊，第二扭曲資訊，該第二扭曲資訊描述代表該第二與該第三訊框的音頻訊號音調資訊，代表該第一與第二訊框的第一頻譜係數，代表該第二與第三訊框的第二頻譜係數進行重建，該方法包括：利用該第一頻譜係數與該第一扭曲資訊取得一第一組合訊框，該第一組合訊框具有該第一與該第二訊框的資訊；以及利用該第二頻譜係數與該第二扭曲資訊取得一第二組合 10 1320172 成框’该第二組合訊框具有該第二與該第三訊框的資訊；以及利用該第一組合訊框與該第二組合訊框重建該第二訊框0 根據本發明第五觀點，此目標是利用一種音頻訊號表現所達成，該音頻訊號具有一第一訊框、該第一訊框之後的一第二訊框，以及該第二訊框之後的一第三訊框，該表現包括代表該第一與該第二訊框的第一頻譜係數，該第一頻谱係數描述該第一與該第二訊框扭曲表現的頻譜組成；而該第二頻譜係數描述該第二與該第三訊框扭曲表現的頻譜組成。根據本發明第六觀點，此目標是利用一種電腦程式所達成，该電腦程式具有在電腦上執行時，實作上述任一方法的程式碼。本發明疋根據當估計代表任意兩鄰近訊框的一共同時間扭曲，因此一後續區塊轉換能夠額外使用該扭曲資訊時，可以更有效率地取得具有連續音頻訊號訊框的音頻訊號頻譜表現。因此，可以取得並施加為了在重建期間成功應用一重叠及加總所步驟需要的窗函數，職函數已經預先考慮到由於時間扭曲所形成的訊號重採樣。因此，可以在不引入可聽見的科續下，獲制肋區塊基礎騎行時間扭曲訊號轉換編碼的效率提升。對於先前技術問題而言，本發明因此提供一種吸引人的解決方式。-方面，可以定重疊與加總的技 11 1320172 門扭曲/亥音頻訊號片段有關的問題，其組合窗操作與時 =呆作’並引入該區塊轉換的一時間補償。所形成的有完美的重建能力’而其離散時間配對物 :卜又到在重建期間對該解碼器所施加重採樣品質的限 :。此特性造成該產生音頻編碼結構的高位元傳輸率收 -2則上可能#域少該量化織度，也就是增加該位

^ 11率的方式，達成訊號的極少傳輸損失。舉例而言，這無法利用純粹的參數編碼方法達成。本發明的另—優點是大大減少為了反向時間扭曲所需傳輪的額外資訊位元傳輸率要求。這可以彻傳輸扭曲參數侧資訊’而不是音調側資訊的方式達成。其具有的另外，點為，本發明在與許多音娜礎音頻編碼方法以及正確音調偵測極度有關的情況相比之下，只具有-種輕微程度的參數相_。這是因為音調參數傳輸需要_一局部^

和訊號的基礎頻率，然而其並非總是可以簡單得到。因此本發明的結構細上扭曲參數的定義下具有高度強健性，因為一較高諧和的偵測並不會造成被傳輸扭曲參數的歪曲。在本發明的一實施例中，施加一編碼結構以將一連續訊框，特別是彼此依序的—第—m訊框中的配置音頻訊號編碼。該第二訊框訊號的完整資訊，是利用該第一與该第二訊框的組合頻譜表現、代表該第一與該第二訊框的扭曲參數序列，以及該第二與該第三訊框的組合頻譜表現與代表該第二與該第三訊框的扭曲參數序列所提 12 1320172 供。利用本發明時間扭曲的概念，考慮到一種訊號的重疊與加總重建，而不需引入在該訊框邊緣的快速音調變化，也不需引入額外的可聽見不連續。在本發明另一實施例中，該扭曲參數是利用已知的音調追蹤演算法所取得，在使用那些已知演算法的情況下，本發明也可以簡單實作於已經存在的演算法之中。在本發明另一實施例中，實作扭曲，因此當該音頻訊 • 號利用扭曲參數所指示進行時間扭曲時，在該訊框之中的音頻號音調能夠盡可能的固定。在本發明另一實施例中，當選擇該扭曲參數序列，而因此將3亥頻譜係數的編碼表現最小化時，在編碼期間於更高計算複雜度成本處，便可以更進一步地減少該位元傳輸率。在本發明另一實施例中，將本發明編碼與解碼分解成為施加窗函數（窗化）、重採樣以及區塊轉換。該分解具有 • 最大的優點為，特別是對於轉換而言，已經存在可以利用的現存軟體與硬體實作，而有效地實作本發明的編碼概念。在5亥解碼器侧，引入另一獨立的重疊與加總步驟，以進行訊號重建。在本發明解碼器的替代實施例中，在轉換至該時間域之前’對該訊號頻譜係數施加額外的頻譜權重。進行此加權所具有的優點為更加減少在該解碼器侧的計算複雜度，同時也可以因此減少該訊號重採樣的計算複雜度。應該以一般的概念詮釋該術語”音調，，。此術語在連接 13 1320172 -· 與扭曲資訊有關的地方也涵蓋音調變化。其可能存在一種 • 情況，其中該扭曲資訊並不能夠取得絕對的音調，但可以取得相對或&準彳b的音調資訊。目此當接受獲得—正確音 _線形狀，而不是y轴上的數值時，在給定一扭曲資訊下’也可以達成该訊5虎音調的描述。、【實施方式】 • 町敘述的實施例只是做為本發明音頻訊號時間扭曲轉換編碼_則贿。對於本領域其他麟者而言可瞭解的是，在此可對所描述細節與配置進行修改與變化。因此，其預期只由附加申請專利範圍的觀點加以限制，而不是由在此實施例的描述與說明所呈現的特定細節所限制。之後’將簡短_扭曲與區塊轉換的基本想法及概念’並在之後參轉隨圖示進行本發明的詳細討論。 -般來說，在連續時間訊號域中最容易取得時間扭曲 • 轉換的特性。該後續章節描述一般的理論，並接著依序地特殊化並轉換至本發明對離散時間訊號的應用。在此轉換 t駐要步驟是在鱗斜均樣本蚊下，換言之在不改變該音頻訊號的持續時間下，利用離散時間訊號進行非均勻重採樣’取代對連續時間訊號所實作的座標改變。令“，)描述由-連續可微分嚴密遞增函數，時間座標改變，其將ί-軸區間/映射至心軸區間彡。 W因此是-種可以用來將—時間相關量的時間轴進行轉換的函數’其與時間離散情況中的重採樣等價。應該 J320172 注思的疋’在後續討論中"·轴區間7為正常時間域中的區間，而*y-軸區間/為該扭曲時間域中的區間。給定該區間7有·量減的—正絲礎{%}，便可利用以下規則獲得該區間/有限能量訊號的正交基礎秦 Ψ'(ήΊ(ή)⑴ ’”《疋一無限時間區間/’時間扭曲的局部特性可以利用片段/的方式達成，並接著利用將標準化扭曲映圖的重縮放部分一起組合的方式重建γ。標準化扭曲映圖是一種連續可微分並嚴密遞增的函數^其將單位區間[明映射至本身。從〜作範圍中的序列片段點/=4以及一對應標準化扭曲映圖對應序列％開始，可建構 W-丨-W tk <：t<tk+l (2) 其中<4=*^1为並調整序列^4，因此變成連續可微分。這種利用該標準化扭曲映圖序列K所定義的一），具有最多為的尺寸仿射改變。令{%„}為區間有限能量訊號的一正交基礎，其適用於該片段办=^^)，其中存在代表重疊因子的整數昃概念，因此當或 S><S；t+A·時 ’ Vjt,„(>S)=〇。本發明著重於欠^2的情況，因為尤=丨的情況對應於不需重疊的先前技術。應該注意的是，對於尺g 3的情況而言並不存在許多已知的建構方式。之後，本發明概念的一特定實施例將對於X=2的情況建立’其包含也在改正離散 15 1320172 . 餘弦轉換（MDCT)及其他離散時間重叠轉換中所使用的局部三角學基礎。 ' 令從該片段所建構的具有局部特性，其中存在整數的概念’使得外，„〇)對於/分少、仏灸+尤十户而言並不與 ~相關。最後’令建顧此是-種對於如+万的片段仿射改變，使得基礎改變成為，。接著 • 气”(，)=〆(，)'/、,„wo)⑶ 其為一種區間/有限能量訊號的時間扭曲正交基礎，可以從片段點^與該標準化扭曲映圖序列A良好定義，並與式(2)中的參數序列《y々與馬的初始條件無關。對於給定片段而言，其在或的情況中具有叫⑺=〇的概念，而局部定義％„(〇不是與/<hp、/>W：+;?時的〇相關，就是與 i<k-p、g/c+K+/?時的％相關。該合成波形(3)具有連續性，但由於賈柯比因子心，(〇)|/2 • 的存在而不一定是可微分。為了此理由並為了減少在離散時間情況中的計算負載，也可以建構一種雙正交系統。假設具有〇<(^<ί：2的常數，因此對序列π p>〇而言 c^k<w'{t)<c^k tk 幻〜(4) 接著， /*,»(0 =^ι/2ν*,„(^(0); 1 =〆(〇 %_1/\身⑹·| 定義了用於該區間/有限能量訊號的空間賴斯基礎 (Rieszbases)雙正交對。 16 1320172 因此，imgUt)可以用來進行分析，而特別有利的疋^用麟做為合成波形，並利用知(〇做為分析波形。根據上述的一般性考量，在後續章節帽取得代表本發明概念的-範例，其中具有重疊因子料的均勾片段㈣’並利用適合在心軸上形成片段的局部餘弦基礎。又應該注意的是，明顯的需要處理非均勻片段的改正，因此本發.純囉可以應用於這種非均勻片段。如同在 M. W. Wickerilauser，“Adapted 丽伽 __ f_ theoiy to software’’，Α· K. Peters，1994,㈤卿 4 中所提出的範例，建構一局部餘弦基礎的開始，是定義一種上升切除函數p，對於r<-l而言〆r)=〇，對於r>1而言p (十卜且在其作用範圍中 p(r)2+p(_r)2=][。給疋片段*’接著可根據下式建構在每一區間办办f2上的窗

w*W=>〇 s-ck pfCi+I~s) L J { J ⑹ 所具有的切除中點為，切除半徑為ε 是—(％"1-办)/2。此對應於魏克豪斯爾（wickerhauser )的中點建構。在4=£^+1心=£汁£奸1的情況下，從下式形成一正交基礎 ⑺ 其中頻率因子《=0、1、2、…。可以簡單驗證此建構是按照具有p=0及上述仿射不變性所完成。在此情況中， 17 1320172 寫為以下形式；的範圍，可以重

⑼"))外㈣取η) M 其中么是_組合η㈣續可微分_的方柄Μ在賴_，2]本身上連 ^ (0_{2w*n(〇,

其中（）〇〇) 第1圖中描述6的建構在痛上顯示扭曲時間軸上』4準化時間而討論，也就是建_，並因二的情況特別〇至標準化時間i之淑一/传代表持續在標準化時間持續在標準化時間】四山数以及代表

曲函數。此外，假M t 間第二訊框12的扭二訊框且」1〇具有扭曲函數14，而第〇 C 12具有扭曲函數】與16所指出的方々、…肩备如同以扭曲函數14 相同音奶的納^ 間轴轉換時，達成在該各自訊框仰U θ過的目標所取得。於％而扭曲函數16_；V忍的疋，扭曲函數14對應圖叫16組合=^:，(9)’場^ 在該區m〇27= 扭曲函數⑽18,以形成 W，2]本身上的連續謂被轉i奥成為(1♦其與式_2叫相符合此點，念時，同樣導向應用，與加總策略的時間扭曲概 7 财給妓構代表赌ls與訊框 18 20 20^20172 Λ 4㈣目丨範例。應該注意的是，鋪重疊金加〜原則，對於完整的訊框12 、 18與22兩者_訊。而要扭曲函數 3另粒意岐，__立取得細函數的一起 ;口、、=取得一適用組合扭曲_的唯一方法。扭曲函數也可以直接利用與兩連續訊框相符的一適用扭曲目良子取得。較佳的是，在該兩扭曲函數定義域重疊上， /、有扭曲函數的仿射一致性。根據式(6)，式(；8)中的窗函數如以下定義 •饼㈣，⑼ 其在區間[Μ，2]之間由零增加到一，而在[、，2]之間由 -減少到零。 ▲果具有OcCVcq的常數，便可以取得式⑻的一種雙正交形式，因此對於所有的々而言又 c丨補％〇仏2 在式(4Jt選擇;，形成式(5)的特殊化形式 /*’”(0=，(么(卜咖s[砌+赚㈣) — ％)];] A”(0- 2么〇-伙(么(卜咖。和(”++)(么(卜幻―％)] (12) 因此，對於連續時間的情況而言，取得合成與分析函數（，(12)) ’其與該組合扭曲函數相關。此相關性考慮到一重璺與加總策略之巾㈣間扭曲，但不造成原始訊號的資訊損失’換言之，考慮到該訊號的完美重建。可以注意為了實作的目的，可以將式(12)中實作的操作 1320172 分解成為連續的各自處理步驟序列。以此方式處理的—種 . 特別吸引人的地方是首先實作該訊號的窗化、接著是該窗化訊號的重採樣，而最後進行轉換。知:照慣例，利用一給定樣本頻率進行音訊離散樣本採樣的數位化儲存及傳輸，在之後所給定代表本發明實作的範例，必須對於離散情況中的應用另外發展。、魯可以利用離散分析積分與合成波形，從一時間扭曲巧部餘弦基礎獲得該時間扭曲改正離散餘弦轉換 (TWMDCT)。該後續敘述則根據該雙正交底（見式(12))。需要用來處理該正交情況式(8)的改變，包括以賈柯比因子所進行的額外時間域加權。在不施加扭曲的特別情况中，兩種建構都降級成為一般的改正離散餘弦轉換 (MDCT)。令L為該轉換尺寸，並假設該被分析訊號 % 對於某些《<1的情況是受到《πΐ (rad/s)的頻帶限制。此形成以採樣週期為1/Z的樣本描述該被處理訊號。該分析係數可由以下給定 λ+2 (13) = W/X(0W，-幻^咖+妇⑷卜幻-m*)]你-幻Λ 定義該窗化訊號部分\ +认㈠)，並在積分式(j 3) 中實作r =ί-Α：與r=么(r)的替換，得到 2 c*，” = j^(CV))c〇s〇(«++)(r-mjl)]办(14) 利用本發明所指導將此積分離散的一特別吸引人的方 1320172 式，是將該採樣點選擇為卜數值便具有以下的以上敘述的輕微扭曲與頻帶限制， c*，” w 孕 SA(v)c〇s π ’ \ \ ( Λ X w+i- v +丄、2J V 2j\ η = ~1 (15) 其中，从)= '(<丨(〇) (16) 式〇5)中的加總區間則由〇4<2所定義。其包含 v~〇 ' 1 Λ ' L-l 、 ♦· 、’仕母—端處延伸此區間，因此其總點數為U。注意由於該窗化，其結果對於某些整數v〇，當 %”辦所存在的邊緣情況處理並不敏感。如同已知的方法，可以_基本摺疊操作（ei__ 1, Tv°pratlon) ^ 伽=的離散餘弦轉換（DCT)所計算，其可能適合將作分解成為—連串的連續操作及轉換，並利用已唾 ^在的硬體及讀實作，_是離散餘轉換（D根據該離散稽分，一仏—’很，，，σ疋的離政時間詮釋為x(〇在採樣週期下的麵樣本。因此窗化的第-步驟，對於严0 ' /、 2、 …、2X-1而言，便形成：」、、（17) 在如式(I5)所描述進行區塊轉換之前（引入與的額外補償），需要進行重採樣，映縣關 21 該重採樣操作可以利用任何非等距重採樣的適合方法實作。總結來說，本發明時間扭曲改正離散餘弦轉換 (MDCT)可以分解成為窗化操作、重採樣以及區塊轉換。之後參考第2圖至第3b圖簡短描述各自的步驟。第2 圖至第3b ®顯示只考量-合成產生音調贱兩窗化區塊的時間扭曲改正離散餘弦轉換（MDCT)步驟。每個各自訊框都包括1024個樣本，因此該兩個考量組合訊框24與 26 (原始訊框30與32以及原始訊框32與34)的每一個都包括2048個樣本，因此該兩窗化組合訊框具有my個重豐樣本。第2圖至第2b圖在X軸上顯示3個被處理訊框的標準化時間。第一訊框30介於時間轴上〇至丨的範圍，第二訊框32介於1至2的範圍，而第三訊框34介於2至 3的範圍。因此，在該標準化時間域中，每個時間單位都對應具有1024個訊號樣本的完整訊框^該標準化分析窗在该標準化時間區間[0,2]與[1，3]之間延伸。該後續考量的目的是復原該訊號的中間訊框32 ^而重建該外側訊號訊框 (30、34)則需要來自於鄰近窗化訊號片段的資料，在此並不考量其重建。可以注意的是，在第丨圖中所顯示的組 5扭曲映圖，疋利用第2圖的訊號所取得的扭曲映圖，描述本發明將三個接續標準化扭曲映圖（點狀曲線）組合至兩個重疊的扭曲映圖（實體曲線）。如同以上說明，為了訊唬分析取得本發明的組合扭曲映圖18與22。此外，可以 1320172 圖此曲線代表具有與該原始兩二號。其格式= ^曲定，曲為該音調的對數微^^^圖 m立^日所取得的本發明分析窗則以點狀曲線疊加。

與標準對_(例如在改球散餘弦轉換 irt中）之間最切差異，發生在該扭曲最大的 ^就疋該第一片段[ο，1]。窗的數學定義則單獨由式 (υ的窗重採樣方式所給^，所實作的重採樣則以式⑹右手侧的第二因子所表示。第2a與第2b圆描述本發明將第2圖的窗施加至各自的訊》號片段的窗化結果。

第3a與第3b圖描述與第與第2a與第2b圖窗化訊號區塊重採樣侧的扭曲參數結果，該鎌樣翻用第i圖實體曲線所給定扭曲映圖指示的方式實作。標準化時間區間[〇，1]被映射至該扭曲時間區間[0J]，其與該窗化訊號區塊的壓縮左半部相等。因此，對該窗訊號區塊的右半部實作擴展，將區間[1，2]映射至〇,2]。因為該扭曲映圖，是以將§亥扭曲訊號取得為具有相同音調的目標從該訊號取得，該扭曲（根據式(18)的重採樣）的結果便是一種具有相同音調的窗化訊號區塊。應該注意的是，該扭曲映圖與該訊號之間的不協調將使得此處的訊號區塊仍然具有變化音調，其並不對該最後的重建造成干擾。 23 1320172 k 利用圓形符號標示後續區塊轉換的補償，因此該區間 [w，m+l]對應於在式(I5)中的離散樣本叫、〇、、z_卜其中£=1024。此的確等價性質意謂著該區塊轉換調變波形，在w處共用一偶對稱點，而在所+1處共用一奇對稱點。特別重要的是’注意α等於2m，因此所為〇與α之間的中點，而m+1為與2之間的中點。總結來說，第3a與第3b圖敘述利用式(18)描述本發明重採樣之後的狀態，當然，其與籲該扭曲參數有關。第3a與第3b圖的訊號時間扭曲轉換域樣本接著被量化並編碼’並可以與描述標準化扭曲映圖A的扭曲側資訊一起傳送至一解碼器。量化是一種一般已知的技術，在後續圖示中並非描述利用一特定量化規則所進行的量化，而是聚焦在該解碼器側上的訊號重建。在本發明的一實施例中，該解碼器接受該扭曲映圖序列以及該解碼時間扭曲轉換域樣本，其中由於該訊號假 •設波段的限制，對於❽[而言可以假設‘=〇。而在該編碼器侧，代表接收離散時間合成的開始點，應該利用式U2)的合成波形考量連續時間重建：沖从-幻（19) n>k k 其中少*(“) = 〜(么(《)) (20) 並且 2* ⑺=;α)ΪΧη COS [π〇 + +) (r -叫)](21) 24 1320172 式(19)為窗化轉換合成的—般重疊與加總步驟。而在該分析階段中，有利的θ右勒r π π α疋隹點〜v = % + (叫)/z處進行式⑵ 的採樣，形成 h⑹= Sbk、r危dkn cos 7(«+士)0+士) (22)

其可以利用以下步驟簡單地計算：首先，以^型 Z弦轉換（DCT)，以規則G_2的依據，根據該窗化。-旦制冰），下述重採樣（V)進仃 h\mk+-

L Η zA<t>k ρ±£ (23) 將在等距樣本點㈣>/ζ處得到訊號片段乃，以做為式 (19)中重疊與加總操作的準備。

該重採樣方法同樣的也可以自由地選擇，並且並不需要與》亥編碼H巾的相同。在本發明—實_巾，使用一種以曲線（spline)内插為基礎的方法，其中可以調整該曲線函數以成為具有波段關參數0的函數，而達成在该计异後雜度與該重建品質之間的妥協。參數 g的一般常 1/3 ’而二次曲線的情況通常都可以適用。在之後利用第4a至第7圖描述用於第3a與第3b圖中所顯Hi的解碼。同樣應該賴的是在此並不欽述區塊，換以及轉換參數的傳輸，因為這些都是—般已知的技，做為解碼處理的開始’帛與第4b醜示一種已經實作反向區塊轉換的配置，形成第如與第4b圖中所顯示 25 1320172 的訊號。該反向區塊轉換的一項重要特徵為由於已經在之前所說明合成功能對稱性質的緣故，在第3a與第3b圖的原始訊號中並不存在額外的訊號成分。特別是，該合成功能具有對於w點處的偶對稱，以及對於W+1處的奇對稱。因此’在該區間[〇，β]中，在該反向區塊轉換中加人正訊號成分’而在該區間[β，2]中則加入該負訊號成分。此外，在

第4a與第4b圖中以利用點狀曲線疊加本發明用於合成窗化操作的窗函數。利用式(11)給定在該扭曲時間域中的合成窗函數數學定義。第5a與第5b圖顯示在施加本發明窗化之後，仍然在該扭曲時間域中的訊號。第6a與第0b圖顯示最後第％與第％圖訊號的扭曲參數相關重採樣結果。

最後，第7圖顯示該重疊與加總操作的結果，其為該 =號合成的最終步驟。（參考式(19)。）該重疊與加總操作是-種第6a與第6b圖的波形加總。如同已經在之前所描述的，只有該中間訊框32被完全重建，而與第2圖原始: 態相比之下’顯補中間赌32可·高精確地重建。因為本發明的重要特性，其在第丨圖中該兩組合扭曲映圖Μ 與22只在該重疊標準化時間區間[切之中由一仿射映圖造成差異，因此便可能精準取消在該反向區塊轉換期間所引入干擾額外減成分。此結果使得在雜曲咖片段k2] 與⑽上的訊號部分與窗之間具有一致性。當考慮第知鱼 26 1320172 第4b圖時，片段[1，6]至[认2]的一種線性延伸，便因此使得該圖形與該複數半窗能夠描述標準改正離散餘弦轉換 (MDCT)的時間域別名取消已知原則。接著可以利用一種一般的反向扭曲映圖，將該已經被取消別名的訊號映射至該標準化時間區間上。可以注意的是，根據本發明另一實施例，可以在頻率域中應用一種預先濾波步驟以達到計算複雜度的減少。這可以利用一種將該傳輸樣本值dkn進行簡單預先加權方式所實作。這種預先濾波的方式，則例如在 M. Unser，A. Aldroubi，and M. Eden，“B-spline signal processing part II - efficient design and application”中描述。此實作在該窗化操作之前，必須對該反向區塊轉換的輸出施加種B-曲線重採樣。在此實施例之中，對一訊號操作如在式(22)中具有改正為，”的重採樣。同時也不實作該窗函數心(〜)的施加。因此，在該訊號片段的每一端處，該重採樣必須注意有關利用該區塊轉換選擇所引入週期性與對稱性的邊界情況。接著在重採樣之後，利用判)實作所需要的窗化。總結來說，根據本發明解碼器一實施例，當將反向時間扭曲改正離散餘弦轉換（MDCT)分解為各自步驟時，其包括：籲反向轉換 *窗化 27 1320172 *重採樣鲁重疊與加總根據本發明一第二實施例，反向時間扭曲改正離散餘弦轉換（MDCT)包括：籲頻譜加權籲反向轉換 •窗化 «重採樣春重疊與加總可以注意的是，在不施加扭曲的情況中，也就是一種所有的標準化扭曲映圖都是不重要的情況（η(〇 = ί)，在以上詳細說明的本發明的實施例也與一般的改正離散餘弦轉換（MDCT) —致。現在將參考第8至第15圖說明本發明組合上述特徵的另外實施例。第8圖顯示本發明音頻編碼器的一範例，其接收一數位音頻訊號100做為輸入，並產生傳輸至一組合本發明時間扭曲轉換編碼概念解碼器的位元串流。該數位音頻輸入訊號100可是-種自然的音頻訊號或是一種預先處理的音頻訊號，其中舉例而言，該預先處理可以是一種刷白 (whitening)操作，以將該輸入訊號的頻譜刷白。本發明編碼器組合-扭曲參數取得器m、一扭曲轉換器1〇2、一感知模型計算H 1G3、-扭曲柄器1()4、—編碼器1〇5、以及-多工器.106。該扭曲參數取得器謝估計一扭曲參 28 1320172 數序列’並輸入至該扭曲轉換器1〇2與該扭曲編碼器ι〇4 之中。該扭曲轉換器102取得該數位音頻輸入訊號1〇〇的時間杻曲頻譜表現。將該時間扭曲頻譜表現輸入至嗦器1〇5之中，以進行量化與其他例如差分編碼的可能編碼。該編碼器105額外受到該感知模型計算器1〇3所控制。舉例而s ’當訊號成分被、編碼，而其主要受到其他訊號成分所遮蔽時，可以增加該量化的嫌度。雜曲編碼器1〇4 將該扭曲參數序列進行編碼，以減少在該位元串流^中，在傳輪期間的序列尺寸。例如這可能包括量化參數，或是例如差分編碼或熵編碼技術，以及算術編碼結構。該多工器106從該扭曲編碼器1〇4接收該編碼扭曲參數序列以及該數位音頻輸入訊號1〇〇的編碼時間扭曲頻譜表現，以進行由該編碼器所輸出位元串流之中資料的多工處理。第9圖描述一時間扭曲轉換解碼器的範例，其接收一相各位το串流200，以取得一重建音頻訊號做為輸出。該解碼器包括一解多工器20卜一扭曲解碼器202、一解碼器 203、以及一反向扭曲轉換器2〇4。該解多工器2〇1將該位元串桃解多工處理成為該編碼扭曲參數序列，並輪入至該扭曲解碼器202之t。該解多工器2()1另外將該音頻訊號時間扭曲頻譜表現的編碼表現進行解多工處理，並輸入至 /解馬器203中’其具有第§圖音頻編碼器對應編碼器的反向操作。扭曲解碼器2〇2取得該扭曲參數序列的重建，而解碼器203取得該原始音頻訊號的時間扭曲頻譜表 29 1320172 現。將該扭曲參數序列的表現與該時間扭曲頻譜表現輸入至該反向，曲轉換器2〇4之中，其實作本發明音頻訊號時間扭曲重疊轉換編碼的概念，取得—數位音頻輸出訊號。第10圖顯示一時間扭曲轉換解碼器的另一實施例，其中該在該解碼器本身之愧得該時間參數序列。第1〇圖中所顯示的替代實施例包括一解碼器2GS、一扭曲估計器 30卜以及一反向扭曲轉換器2〇4。該解碼器2〇3與該反向扭曲轉換器204共有與该先前實施例對應裝置中的相同功能’而因此在不同實施财的這些描述完全沒有改變。該扭曲估計H则糊組合先前鮮域音調估計以及一目前頻率域音調估計的方式，取得該解碼器203時間扭曲頻譜表現輸出的實際扭曲。因此，雜曲參數序删被含蓄地發信，因為在該位it串流中沒有額外的扭曲參數資訊需要輸人至該解之中，因此其具錢最大優點為可

則：二=外的位凡傳輸率。然而，該扭曲資料的含蓄發信則文到該轉換時間解析度的限制。 =11 ®描述當使用不具有本發明時_曲解碼概念能技術解時’本發明概細後向相容性。這種解碼i、^、略_相扭岭數f訊，·舰位元串流向轉ίί—4Γ域訊號，並提供至不實作任何扭曲的一反實作的頻率分析因?:本發明編碼器中由時間扭曲轉換所好調進斤疋與不包含任何時間扭曲的轉換之間良的土頻於的解碼11將減產生一有意義 9頻輪出。㈣時間扭曲的緣故，這樣操作具有降低音 30 1320172 '，的成本’其在先前技術解褐财並不進行反向操作。第12圖顯示本發明時間扭曲轉換方法的塊狀圖示。本 ^明時間扭曲轉換包括窗化训、重採樣5〇2、以及區塊轉換503。首头，分认 „ 以輸入訊號利用—種與該扭曲參數序列有的，宜·相進行窗化，其做為該各自編碼步驟則至 f每個的額外輸入。每個窗化輸入訊號片段接著都在〆重採樣步驟5〇2中進行重採樣，其中利用該扭曲參數序列所指示的方式進行重採樣。在該區塊轉換步驟503之中，一般來說利用一種已知的離散三角轉換取得區塊轉換。因此對該窗化及重採樣訊號片段實作轉換。應紐意的是，_塊㈣並不與從該扭曲參數序列所取得的補償數值有關。因此，該輸出則由轉換域訊框序列所組成。第13圖顯示本發明時間扭曲轉換方法的流程圖。該方法包括反向區塊轉換601、窗化6〇2、重採樣6〇3、以及重疊與加總6G4 #步驟。姻該反向區塊轉換6Ql步驟將轉換域訊號的每-訊框都轉變成為—時間域訊號。對應於該編碼步驟’該區塊轉換與由該接收參數序列所取得的補償數值有關，其做為該反向區塊轉換6(n、該窗化6〇2、與該重採樣603的額外輸入。由該反向區塊轉換6〇1所取得的訊號片段接著便在該窗化步驟602中進行窗化，並在該重採樣步驟603中利用該扭曲參數序列進行重採樣。最後，在重疊與加總步驟604中’以一種一般的重疊與加總操作將該窗化與重採樣片段加人至該先前的反向轉換片段之 31 1320172 中，形成S亥時間域輸出訊號的重建。

第14圖顯示本發明反向時間扭曲轉換器的-替代眘施例，其用以額外地減少該計算複雜度。該解碼器且第13圖中解的部分相同功能。因此該財施例^相同功能區塊的敘述將完全地相同。該替代實施例與第實施例不同之處’在於其在該反向區塊轉換6G1之前實作 -種頻错預先加權彻。此固定的頻譜預先加權與利用該以1換選擇所狀週雛及對稱性的時間域濾波相等: 这種遽波㈣為根據絲射法轉定轉部分，到後續改正重採樣7〇2的計算複雜度降低。如此，重^ 有魏塊轉換獅削丨人週雛及_性的訊 S最1 在重採樣702之後進行改正窗化步驟。最後，在重疊與加總步驟604中，以一種一般的重義

步驟將該窗化與重採樣片段加人至該先前的反= 轉換f段之中，獲得該重建時間域輸出訊號。用！Γί第15b_示本發明時間扭曲編碼概念的效在進行及不進行時間扭曲應用下的相同訊 ;;=15a圖描述源自於16千赫兹下進行男性娜 =又樣，具有轉換尺寸娜⑽正離散餘_換的頻 :列:框。所形成的頻率解析度為78赫兹，而為了描述個列，其對應於4.7千_的頻寬。 2由《頻與圖示所見，刻段具有大概為155赫兹平】曰調的聲音音響。如同鄕以圖所能另外看到的，該。周頻率新的第-諧音為明顯可辨’但愈往高頻位置，該 32 1320172 分析變的愈來愈密且受_亂。這是祕在該被分析气號片段長度之中的音調變化所造成。因此，該巾間至高頻範圍的編碼需要一大量的位元量，以避免在解碼後立即造成可聽見的人為干擾。相反的，當固定該位元傳輸率時化將由於增加量化粗糙度的要求而無可避免地形成大量的失真。第15b圖描述源自於根據本發明時間扭曲改正離散餘弦轉換的頻譜列訊框。明顯的，同樣使用第15a圖中已經使用的原始男性音頻訊號。該轉換參數與第15a圖中所使用的相同，但是利用適合於該訊號的時間扭曲轉換，對於頻谱表現上具有可見的戲劇性效果。在該時間扭曲轉換域中訊號的稀疏與有組織特性，即使在考慮到額外扭曲資料的編碼成本時，仍可導致一種具有更佳傳輸率失真效能的編碼結果。如同已經提到的，傳輪扭曲參數以取代傳輸音調或速度資訊，具有明顯的優點為戲劇性地減少該額外需要的位元傳輸率。因此，在該後續章節中，將詳細敘述許多本發明用來傳輸所需扭曲參數資訊的結構。對於在時間ί處具有扭曲α⑺的訊號而言，用於該局部餘弦基礎（參考式(8)、（12))的最佳標準化扭曲映圖序列^ 選擇，可以利用求解下式所獲得 = …以+ 1 (24) 然而，需要用來描述此扭曲映圖序列的資訊總量是過 33 1320172

大，而難以定義β(ί)點數值的量測。對於實際目的而言，立即决疋一扭曲更新區間〜，而每個扭曲映圖％則以#二1/& 參數所描述。對於與音頻訊號而言，一般來說具有大概1〇至20微秒的杻曲更新區間是足夠的。同樣的從％與〜+1建構式(9)中的A，便可透過適當的仿射重縮放操作，由#個

標準化扭曲映圖拼凑一連續可微分標準化映圖。標準化映圖的原型範例包含

exp(flf)-i 指數： exp(a)-i 4 + α (25)

Moebius : ,

、其中α為扭曲參數，利用㈣，定義一映圖呦的扭由上述二種扭曲都可軸在卜Μ處科“的圖具有在完全_把等扭曲，而對於小= 而吕’另外兩個映_此數值之間存在極小的 ^解躲雜㈣目，輯行麵樣(式㈣ :§田在该編碼器中需要用於該重採樣作。用於反向縣_雕成 "岐咐扭曲映_反向操作：於該標狗作，指數㈣#作需要平方根相映圓的反向操作則是—種罐效有圖。因為指數函數盘除法相㈣曰主 ^ M〇eblus缺 I除法相·昂貴，因此針對於該解碼 34 斋中的計算最大減緩將使得其最佳選擇為連續二次扭曲映圖序列h。接著由則固扭曲參數_、办(1)、...、__υ完全定義該標準化扭曲映圖h，其具有以下的要求鲁為一種標準化扭曲映圖； •由該平滑原型扭曲映圖（式(25))之—的重縮放副本加以拼湊：癱為連續可微分； *滿足 7(/+1)、(0, / = 0,1,...iV-1 (26) 本發明使得該扭曲參數可以被線性量化，一般來說量化為一種大概0.5赫茲的階段尺寸。接著將所形成的整數數值進行編碼。替代的，該微分<可崎釋為-種標準化的音調曲線，其中該數值 Κ(^Δ〇 1 = 1,2,...,n, (27) 被量化為一固定階段尺寸，一般來說是0.005。在此情况t，该形成的正數數值以一種連續或階層方式進一步的差刀編碼。在兩情況巾，卿成的㈣訊位元傳輸率一般來說為每秒數百位元，其只是在—語音碼巾需要用來描述音調資料傳輸率的一小部分。具有大計算資源的編碼器可以決定該扭曲資料序料， /、將忒編媽成本最佳化地減少，或將頻譜列稀疏程度的量 35 測最大化。對於音調追縱而言的一種已知較不昂貴的方法將形成一量測音調函數〆0，並在存在音調追蹤的區間處以一連續線性函數副近似於該音鍋線，衫造成在該音凋數值中的大跳躍。在該音調追蹤區間内部中的估計扭曲序列，可由下式給定 a*(/) = —m。、

At P〇di + 1)Δί + k) + p^i^f + (28) 注意在該音調估計中的系統性誤差，像是兩倍的音調週期對於扭曲估計而言具有極小的影響。如在第10圖中所描述，在本發明一替代實施例中，該扭曲參數序列可關用—扭曲估計器所得的解碼轉換域資料所取得。其原則是為了轉換資料的每一訊框，或從隨後解碼序號d塊的音調計算—頻率域音調似。接著從與式 (28)相同的方程式取得該扭曲資訊。本發明概念的應用主要已經利用在一音頻訊號頻道策略中施加本發明時間扭曲的方式描述。本發明概念當然並不限制於這種單音策略的使用之中。此外，其所具有的高度優點為在多頻道編碼應用之中藉由使用本發明概念所可以達到的高度編碼增益，其巾必須傳輸本發明概念所編碼的單-或多數頻道。此外，減—般來說是定義為根據Λ：所進行的X軸任意函數轉換。因此，本發明概念也可以應用於不明顯與時間相關的扭曲訊號函數或表現策略之中。舉例而言，也可以實作訊號頻率表現的扭曲。此外本發明概念可以有利的應用至具有任意片段長度的訊號，其並不具有先前章節所描述的相等長度。 1320172 在先前章郎中所呈現的基礎函數與離散化的利用，可以另外瞭解為應用本發明概念的優勢範例。對於其他應用而言，也可以使用不同的基礎函數與不同的離散化方式。根據本發明方法的特定實作要求，本發明方法可以實作在硬體或軟體之中。該實作可以利用一種數位儲存媒介實作，特別是在其上具有儲存電子可讀控制訊號的磁碟、多功能數位碟片（DVD)或是光盤（CD)，其與一種可程序化的電腦程式組合，因而實作本發明方法。一般來說，本發明因此疋-種機械可觸介，當該電_式在電腦上執行時’該程柄便胁實作本發财法。換句話說，本發 5 種具有程式碼的電腦程式，當該電腦程式在電社執行時，其至少實作本發财法之一。雖^前已經參考本㈣特定實關騎特錢示並 =二;===的是，在不背離本發明精神 ===範_化™: ’同的實施例進行不同的調整變化。 37 【圖式簡單說明】在之後膽將以參考圖示的方式描述本發明的較佳實施 W，其中：第1圖顯示本發明扭曲映圖的範例；第2至第2b圖顯示本發明扭曲相關窗的應用；第3a、3b _示本發明重採樣的範例；第4a、4b圖顯示本發明在該解碼器侧的訊號合成範例；第5a、5b圖顯示本發明在該解碼器綱窗化範例；第6a、6b圖顯示本發明在該解碼器侧的時間扭曲範例；第7圖顯示本發明在該解碼器侧的重疊與力口總處理；第8圖顯示本發明音頻編碼器的範例；第9圖顯示本發明音頻解碼器的範例；第11圖顯示本發明概念向後適用實作的範例；

第10圖顯示本發明音頻解碼㈣另-範例；第12圖顯示本發明編碼實作的塊狀圖示；第13圖顯示本發明解碼的範例塊狀圖示；第14圖顯示本發明解碼另__實施例的塊狀圖示；第15a、15b圖顯示本發明概念可達成編碼效率【主要元件符號說明】實作的描述。 10、30第一訊框 12、32第二訊框 14、16扭曲函數 18、22組合扭曲函數 20後續訊框 24、26組合訊框 34第三訊框 MUK多工器 DEMUX解多工器 38

Claims

1320172 十、申請專利範圍： 1. 一種用於取得一音頻訊號表現的編碼器，該音頻訊號具有一第一訊框、該第一訊框後的一第二訊框，以及該第二訊框後的一第三訊框，該編碼器包括：一扭曲估計器’用於估計該第一與該第二訊框之第一扭曲資訊’並用於估計該第二訊框與該第三訊框之第

二扭曲資訊，該扭曲資訊描述該音頻訊號的一音調資訊；一頻譜分析器，用於使用該第一扭曲資訊來取得該第一與該第二訊框之第一頻譜係數，並用於使用該第二扭曲資訊來取得該第二與該第三訊框之第二頻譜係數；以及 —輸出介面，用於輸出包含該第一與該第二頻譜係數的該音頻訊號表現。 2. 如申請專利範圍第1項所述的編碼器，其中該扭曲估叶器是用於估計該扭曲資訊，使得在一訊框扭曲表現二中的一音調比在該等訊框中的一音調更固定，其中從 5亥訊框取得的扭絲現根據雜曲資訊來轉換該框令之音頻訊號的時間軸。 ° 如申請專利範圍第 1項所述的編石馬器，其中兮才 =是用於使用該等訊框中之音調變化的資;;:： 5亥扭曲資ffl。叶 =請專利範圍第3項所述的編碼器，其中該扭 ^是用於估計該扭曲資訊’使得該音調變化的資訊 39 4. /、在該音調變化低於一預定最大音調變化時才被使用。如申請專利範圍第1項所述的編碼器，其中該扭曲估計器是用於估計該扭曲資訊，使得一訊框的一扭曲表現的一頻譜表現比該攔框的一頻譜表現更為稀疏，其广從该訊框取得的扭曲表現根據該扭曲資訊來轉換該等訊框中之音頻訊號的時間軸。如申请專利範圍第1項所述的編碼器，其中該扭曲估 α十器疋用於估計該扭曲資訊，使得由一訊框的一扭曲表現的一頻譜係數的編碼表現所消耗的位元數目低於利用相同編碼規則取得兩者表現時該等訊框的頻譜係數的一編碼表現，其中從該雜取得的扭曲表現根據 °亥扭曲資訊來轉換該等訊框中之音頻訊號的時間軸。如申明專利範圍第1項所述的編碼器，其適於取得由一離散樣本值序顺給定的—音頻峨的一表現。如申請專利範圍第1項所述的編碼器，其中該扭曲估計器是用於估計該扭曲資訊，使得訊框的_扭曲表現描述對應訊框之音頻訊號的相同長度，其中從該訊框取得的扭曲表現根據該扭曲資訊來轉換該等訊框中之音頻訊號的時間軸。如申睛專利$_第1項所述的編碼器，其中雜曲估，器是用於估計雜曲資訊，使H對應訊框的第-中間扭曲資訊與-第二對應訊框的第二中間扭曲資訊可使用一組合規則而加以組合。 1320172 10. 如申請專利範圍第9項所述的編碼器，其中該組合規則使得該第一中間扭曲資訊的重縮放扭曲參數序列連接該第二中間扭曲資訊的重縮放扭曲參數序列。 11. 如申請專利範圍第10項所述的編碼器，其中該組合規則使得所形成的該扭曲資訊包括一連續可辨扭曲參數序列。 12. 如申請專利範圍第1項所述的編碼器，其中該扭曲估計器是用於估計該扭曲資訊，使得該扭曲資訊包括一漸增扭曲參數序列。 13. 如申請專利範圍第1項所述的編碼器，其中該扭曲估計器是用於估計該扭曲資訊，使得該扭曲參數描述一連續可辨重採樣規則，其映射區間[〇,2]至其本身。 14. 如申請專利範圍第1項所述的編碼器，其中該頻譜分析器適於根據該扭曲資訊而使用餘弦基礎來取得^二譜係數。，人, 15. 如：請專利範圍第1項所述的編碼器，其中該頻譜分析益適於利用兩訊框的一加權表現來取得該頻譜係數。。曰， 16. 如申η請專利範圍帛15項所述的編碼器，其中該頻譜分 =是用於取得該頻譜係數，以藉由對該兩訊框:加囪函數而獲得該兩訊框的該加權表現，數與該扭曲資訊有關。、中^函 17·如申凊專利範圍第1項所述的編碼器，其中兮㈣八析器適於利用該訊框的-重採樣表現來取得 41 數0 18.如申請專利範圍第17項所述 :=得根據該扭二: 其中所取得的訊號之-音調ίΓ為音頻訊號之音調的音頻 20. t申請專利範圍第1項所述的編碼器，其中該扭曲估叶器是用於估計該扭曲資訊’使得該扭曲資訊包括一扭曲參數序列’其中各扭曲參數据述該音頻訊號的一有限長度區間。 L如申凊專利|&圍第1項所述的編碼器，其中該輸出介面是用於進一步包含該扭曲資訊。 22. 如申请專利範圍第！項所述的編碼器，其中該輸出介面是用於it-步包含該細#·—量化表現。 23. -種用於重建-音頻訊號的解碼器，該音頻訊號具有一第-訊框、該第-贿之後的—第二訊框，以及該第二訊框之後的-第三訊框，其利用描述該第一與該第二訊框之音頻訊號的一音調資訊的第一扭曲資訊，描述該第二與該第三訊框之音頻訊號的一音調資訊的第二扭曲資訊，該第一與第二訊框之第一頻譜係數，與該第二與第三訊框之第二頻譜係數來進行重建，該解碼器包括：頻譜值處理器，用於利用該第一頻譜係數與該第一 42 1320172 組合訊框，鄕-岭訊框具有該第二訊㈣資訊；以及，，該第二頻譜係數與該第二扭曲資訊來取得一第-、、且δ 該第二組合訊框具有訊框的資訊；以及弟二組合訊一合成器，用於利用該第一組合訊框與該第二框重建該第二訊框。 —’

24. 如申請專利範圍第23項所述的解瑪器，其中該頻譜值處理器是用於使用餘弦基礎函數來取得該等組合訊框，該餘弦基礎函數與該扭曲資訊有關。 25. 如申請專利範圍帛24項所述的解石馬器，其中該頻譜值處理器是用於使用餘弦基礎函數，使得對該頻譜係數使用餘弦基礎函數產生-組合訊框的—時間扭曲未加權表現。

26. 如申請專利範圍第23項所述的解碼器，其中該頻譜值處理器疋用於使用-窗函數，以對該組合訊框的樣本值加權’該窗函數與該扭曲資訊有關。 27. 如申請專利範圍第25項所述的解碼器，其中該頻譜值處理器是用於使用一窗函數，使得當將該窗函數被施加至一組合訊框的時間扭曲未加權表現時，可產生一組合訊框的時間扭曲表現。 28. 如申請專利範圍第23項所述的解碼器，其中該頻譜值處理态是用於使用扭曲資訊，以根據該扭曲資訊來轉換組合訊框之表現的時間轴，以取得該組合訊框。 43 1320172 第二訊框 30.如申5月專利範圍帛μ項所述的解碼器，其適於重建由離政樣本值序列所表現的音頻訊號。 31·如申晴專利範圍帛23項所述的解碼器，更包括一扭曲

估汁器，用以從該第一與該第二頻譜係數取得該第一與該第二扭曲資訊。 32. 如申請專利範圍第23項所述的解碼器，其中該頻譜值處理器是用於對該頻譜係數施加預定加權因子以進行該等頻譜係數之加權。

33. —種用於取得一音頻訊號之一表現的方法，該音頻訊號具有一第一訊框、該第一訊框之後的一第二訊框，以及該第二訊框之後的一第三訊框，該方法包括：估計該第一與該第二訊框之第一扭曲資訊，並估計代表該第二與該第三訊框之第二扭曲資訊，該扭曲資訊描述該音頻訊號的一音調資訊；利用該第一扭曲資訊來取得該第一與該第二訊框之第一頻譜係數，並利用該第二扭曲資訊來取得該第二與該第三訊框之第二頻譜係數；以及輸出該音頻訊號之該表現，其包含該第一與該第二頻譜係數。 34· —種用於重建一音頻訊號的方法，該音頻訊號具有一第一訊框、該第一訊框之後的一第二訊框，以及該第 44