TWI431614B

TWI431614B - 用以利用適應性過取樣產生高頻音訊信號之裝置及方法

Info

Publication number: TWI431614B
Application number: TW099135734A
Authority: TW
Inventors: Lars Villemoes; Per Ekstrand; Sascha Disch; Frederik Nagel; Stephan Wilde
Original assignee: Dolby Int Ab; Fraunhofer Ges Forschung
Priority date: 2009-10-21
Filing date: 2010-10-20
Publication date: 2014-03-21
Also published as: BR112012009249A2; WO2011047886A1; AR078717A1; KR101341115B1; US9159337B2; TW201133471A; JP5844266B2; CN102648495A; CA2778205C; BR112012009249B1; RU2012119259A; US20120281859A1; HK1174733A1; KR20120094916A; MX2012004623A; EP2486564A1; RU2547220C2; ES2461172T3; JP2013508758A; AU2010310041A1

Description

用以利用適應性過取樣產生高頻音訊信號之裝置及方法

發明領域

本發明係關於音訊信號之編碼，且特定言之係關於包括諸如諧波換位器之頻域換位器的高頻重建方法。

發明背景

在先前技術中，存在用以利用諧波換位或時間拉伸或類似方式進行高頻重建之若干種方法。所利用的一種方法是基於相角音碼器。該等方法在使用充分高的頻率解析度進行頻率分析且在合成信號之前在頻域內進行信號修改的原理下操作。時間拉伸或換位取決於分析視窗、分析視窗步幅、合成視窗、合成視窗步幅以及分析信號之相位調整的組合。

與該等方法共同存在的一個不可避免的問題是為得到穩定聲音所需之高品質換位所需的頻率解析度與系統對於暫態聲音之暫態回應之間的矛盾。

使用相角音碼器之演算法如例如描述於以下文獻中：M. Puckette之Phase-locked Vocoder,IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics,Mohonk,1995；Rbel,A.之Transient detection and preservation in the phase vocoder;citeseer.ist.psu.edu/679246.html；Laroche L.、Dolson M.之「Improved phase vocoder timescale modification of audio」，IEEE Trans. Speech and Audio Processing，第7卷，第3號，第323-332頁及美國專利第6549884號，Laroche,J.及Dolson,M.之Phase-vocoder pitch-shifting for the patch generation，該演算法已提供於Frederik Nagel、Sascha Disch之「A harmonic bandwidth extension method for audio codecs」,ICASSP International Conference on Acoustics,Speech and Signal Processing,IEEE CNF，臺灣臺北，2009年4月。然而，由於並未保證次頻帶上之垂直相干性能保存於標準的相角音碼器演算法中，且此外離散傅立葉變換(DFT)相位之重新計算必須執行於隱式地假定循環週期性之變換之隔離時間區塊上，故稱為「諧波頻寬擴展」(HBE)之方法易於對音訊信號中含有之暫態造成品質降級，如於Frederik Nagel、Sascha Disch、Nikolaus Rettelbach之「A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs」，第126屆AES會議，德國慕尼黑，2009年5月所描述者。

已知歸因於基於區塊之相角音碼器處理可特定地觀察到兩種假像。特定言之，該兩種假像為波形及時間頻疊之分散，此係歸因於由於應用新近所計算之相位而導致的信號的時間循環迴旋效應。

換言之，因為在BWE演算法中對音訊信號之頻譜值應用相位修改，所以可以使音訊信號區塊中含有的暫態回繞該區塊，亦即，使之循環地捲繞回至該區塊中。此舉導致時間頻疊，且因此導致音訊信號之降級。

因此，應使用對含有暫態之信號部分進行特殊處理之方法。然而，特別是由於BWE演算法是在編解碼器鏈之解碼器端執行的，故計算複雜性為一個嚴重問題。因此，針對上文提及之音訊信號降級之措施較佳地不應以大量增加計算複雜性為代價來進行。

發明概要

本發明之目的為提供用以產生高頻音訊信號之有效且高品質的概念。

此目的係藉由如請求項第1項之用以產生高頻音訊信號之裝置、如請求項第14項之產生高頻音訊信號之方法或如請求項第15項之電腦程式來達成。

本發明利用之特徵為：單獨地處理暫態，亦即不同於音訊信號之非暫態部分。為此，用以產生高頻音訊信號之裝置包含一分析器，該分析器用以分析輸入信號以決定暫態資訊，其中對於該輸入信號之第一部分，暫態資訊受聯結，且該輸入信號之第二隨後時間部分不具有該暫態資訊。實際上，該分析器可分析音訊信號本身，亦即，藉由分析其能量分佈或能量改變來決定暫態部分。此舉需要某種預看措施以使得例如事先在某一時間分析核心編碼器輸出信號，以便可基於該核心編碼器輸出信號使用該分析之結果來產生高頻音訊信號。一不同的替代方案是對編碼器端執行暫態偵測，且使諸如一位元串流中之某一位元的某一旁側資訊與具有暫態特性之信號之時間部分相關聯。隨後，該分析器經組配以用以從該位元串流提取此暫態資訊位元以便決定此輸入音訊信號之某一部分是否為暫態。另外，用以產生高頻音訊信號之裝置包含一頻譜轉換器，該頻譜轉換器用以將輸入信號轉換為輸入頻譜表示型態。在濾波器組域內部執行高頻重建，亦即，繼利用該頻譜轉換器進行頻譜轉換之後。為此，頻譜處理器處理該輸入頻譜表示型態以產生經處理之頻譜表示型態，該經處理之頻譜表示型態包含用於比該輸入頻譜表示型態更高之頻率的值。轉換回至時域之程序係由隨後連接之時間轉換器來進行的，以用以將該經處理之頻譜表示型態轉換為時間表示型態。根據本發明，該頻譜轉換器及/或該時間轉換器為可控制的，以對具有相關聯之暫態資訊之輸入信號的第一部分執行頻域過取樣，且對不具有相關聯之暫態資訊之輸入信號的第二部分不執行頻域過取樣。

本發明之優勢在於其導致複雜性之減少，而同時仍對於諸如組合的濾波器組中之諧波換位之類的換位程序保持良好的暫態效能。因此，本發明包含具有在濾波器組中之組合換位器之頻率下進行適應性過取樣功能的裝置及方法，其中根據一較佳實施例該過取樣由一暫態偵測器來控制。

在一較佳實施例中，該頻譜處理器執行自一基本頻帶至一第一高頻帶部分且較佳諸如三個或四個高頻帶部分之多個額外高頻帶部分的諧波換位。在一個實施例中，每一高頻帶部分具有單獨的合成濾波器組，諸如反向FFT。在另一實施例中，該實施例在計算上更為有效，其中利用諸如單個1024反向FFT之單個合成濾波器組。針對這兩種情況，頻域過取樣係藉由使變換大小增加諸如因數1.5之一個過取樣因數來獲得。藉由較佳執行零填補，亦即，藉由在視窗式訊框之第一值之前添加某一數量的零且藉由在視窗式訊框結束處添加另一數量的零，來獲得額外的FFT輸入。回應於FFT控制信號，該過取樣增加該FFT之大小，且較佳執行零填補，然而亦可將諸如不同於零之某些雜訊值的其他值填補至視窗式訊框。

另外，可由分析器輸出信號，亦即由暫態資訊，來控制頻譜處理器，以使得在暫態部分中該FFT與非暫態或非填補情況相比為更長的情況下，取決於過取樣因數來改變在濾波器組中線映射之開始索引值(亦即不同的換位「回合」或換位迭代之開始索引值)，其中此改變較佳包含使所利用之變換域索引與過取樣因數相乘以獲得用於針對頻域過取樣情況之修補操作之新的開始索引。

圖式簡單說明

以下參照隨附圖式來解釋較佳實施例，其中：第1圖為用以產生高頻音訊信號之裝置之方塊圖；第2a圖為用以產生高頻音訊信號之裝置之實施例；第2b圖繪示頻譜帶複製處理器，其包含用以產生第1圖或第2a圖之高頻音訊信號作為整體SBR處理之區塊以最終獲得頻寬擴展之信號的裝置；第3圖繪示在頻譜處理器內部執行之處理動作/步驟之實施例；第4圖為在若干個合成濾波器組之框架中之本發明的一實施例；第5圖繪示其中利用單個合成濾波器組之另一實施例；第6圖繪示頻譜換位及用於第5圖實施例之濾波器組中相應的線映射；第7a圖繪示接近於視窗之中心之暫態事件的暫態拉伸；第7b圖繪示接近於視窗之邊緣之暫態的拉伸；及第7c圖繪示在具有相關聯之暫態資訊之輸入信號的第一部分中發生過取樣的情況下的暫態拉伸。

較佳實施例之詳細說明

第1圖繪示根據一實施例之用以產生高頻音訊信號之裝置。一輸入信號經由一輸入信號線10提供給一分析器12及一頻譜轉換器14。該分析器經組配以用以分析該輸入信號以決定欲在暫態資訊線16上輸出之暫態資訊。另外，該分析器將發現是否存在不具有暫態資訊之該輸入信號之第二隨後部分。不存在始終為暫態的信號。歸因於複雜性原因，由於本發明的頻域過取樣減少效率，而為良好品質的音訊處理所必需，故較佳執行暫態偵測以使得暫態部分(亦即，輸入信號之「第一部分」)極少發生。根據本發明，儘管如在第7a圖之情形中論述，對於具有接近於視窗之中心之暫態事件的暫態信號甚至可斷開頻域過取樣，但頻域過取樣僅在其實際上為必需時接通且在其為非必需時亦即在信號為非暫態信號時斷開。然而，由於效率及複雜性原因，當某一部分包括一暫態時較佳將該部分標示為暫態部分，而不管暫態事件是否接近視窗中心。歸因於如在第4圖及第5圖之情形下論述之多個重疊處理，對於一些視窗而言，每一暫態將接近該中心，亦即，將為一「良好」暫態；但是對於另外數個視窗而言，每一暫態將接近視窗之邊緣，且因此對於該等視窗而言亦為一「不良」暫態。

頻譜轉換器14經組配以用以將輸入信號轉換為在線11上輸出之輸入頻譜表示型態。頻譜處理器13經由線11連接至該頻譜轉換器。

頻譜處理器13經組配來用以處理該輸入頻譜表示型態以產生經處理之頻譜表示型態，該經處理之頻譜表示型態包含用於比該輸入頻譜表示型態更高之頻率的值。換言之，頻譜處理器13執行換位，且較佳執行諧波換位，然而亦可在頻譜處理器13中執行其他換位。經處理之頻譜表示型態經由線15自頻譜處理器13輸出至時間轉換器17，其中時間轉換器17經組配來用以將該經處理之頻譜表示型態轉換為一時間表示型態。較佳地，該頻譜表示型態為一頻域或濾波器組域表示型態，且該時間表示型態為一簡單的全頻寬時域表示型態，然而該時間轉換器亦可經組配來用以將經處理之頻譜表示型態15直接地變換為具有個別次頻帶信號之濾波器組域，該等次頻帶信號中之每一個具有比FFT濾波器組更高之某一頻寬。因此，在輸出線18上之輸出時間表示型態亦可包含一個或若干個次頻帶信號，其中每一個次頻帶信號皆具有比該經處理之頻譜表示型態中之頻率線或值更高的頻寬。

頻譜轉換器14或時間轉換器17或該兩個元件相對於頻譜轉換演算法之大小皆為可控制的，以對具有相關聯之暫態資訊之音訊信號的第一部分執行頻域過取樣，且對不具有該暫態資訊之該輸入信號之第二部分不執行頻域過取樣，以便在沒有任何音訊品質損失的情況下，提供高效率及減少了的複雜性。

較佳地，該頻譜轉換器經組配來藉由對具有相關聯之暫態資訊之第一部分應用比應用於第二部分之變換長度更長之變換長度來執行該頻域過取樣，其中該更長之變換長度包含填補資料。該兩個變換長度之間的長度差由頻域過取樣因數來表示，該因數可在1.3至3之範圍內，且較佳地該長度差應儘可能低，但要大到足以確保如第7圖中所示之「不良暫態」不引入任何前回聲或僅引入可容忍之較小前回聲。該過取樣因數之較佳值在1.4與1.9之間。

以下，將描述第2a圖以提供關於第1圖之根據較佳實施例的頻譜轉換器14、頻譜處理器13或時間轉換器17之更多細節。

頻譜轉換器14包含分析視窗器14a及FFT處理器14b。另外，該時間轉換器包含反向FFT模組17a、合成視窗器17b及重疊-相加處理器17c。本發明之裝置可包含如例如參照第5圖及第6圖所繪示之單個時間轉換器17，或可包含如第4圖所繪示之單個頻譜轉換器14及若干個時間轉換器。頻譜處理器13較佳包含相位處理/換位模組13a，隨後將對其進行更詳細地描述。然而，相位處理/換位模組可由已知修補演算法之任何一種來實施，諸如從M. Dietz、S. Liljeryd、K. Kjoerling及O. Kunz之「Spectral Band Replication,a Novel Approach in Audio Coding」(第112屆AES會議，慕尼黑，2002年5月)所知者，以在一濾波器組內自低頻線產生高頻線。在ISO/IEC 14496-3:2001(MPEG-4標準)中另外描述有一種修補演算法。然而，與MPEG-4標準中之修補演算法對比，較佳的是頻譜處理器13以若干「回合」或迭代執行諧波換位，如參照第6圖及第5圖之單個合成濾波器組實施例所詳細地論述者。

第2b圖繪示用於高頻重建處理器之SBR(頻譜帶複製)。在輸入線10上，將例如可為時域輸出信號之核心解碼器輸出信號提供給方塊20，方塊20象徵第1圖或第2a圖處理。在此實施例中，時間轉換器18最終輸出真實時域信號。隨後，較佳將此真實時域信號輸入至QMF(正交鏡像濾波器)分析階段21中，分析階段21在線22上提供複數個次頻帶信號。此等個別次頻帶信號輸入至SBR處理器23中，SBR處理器23另外接收SBR參數24，SBR參數24通常源自一輸入位元串流，輸入至核心解碼器(在第2b圖中未繪示)之編碼低頻帶信號屬於該輸入位元串流。SBR處理器23向QMF合成階段25輸出波封經調整的且在其他方面經操作的高頻音訊信號，QMF合成階段25最終在線26上輸出時域高頻帶音訊信號。線26上之信號轉發至組合器27中，其另外經由分流線28接收低頻帶信號。較佳地，分流線28或該組合器將充分的延遲引入至該低頻帶信號中，以使得正確的高頻帶信號26與正確的低頻帶信號28組合。或者，當低頻帶信號在QMF表示型態中亦為可用時且當將低頻帶之QMF表示型態提供至QMF合成階段25之較低的通道中時，如線29所繪示，QMF合成階段25可提供合成階段及組合器之功能。在此情況下，組合器27並非為必需的。在QMF合成階段25之輸出處或在組合器27之輸出處，輸出頻寬擴展之音訊信號。隨後，可儲存、傳輸或經由放大器及揚聲器來重播該信號。

第4圖繪示依賴複數個不同的時間轉換器170a、時間轉換器170b、時間轉換器170c之本發明之一實施例。另外，第4圖繪示第2a圖之分析步幅為a之分析視窗器14a的處理，其在該實施例中為128個取樣。當考慮分析視窗之1024個取樣之長度時，則此舉意謂對分析視窗器14a進行8次重疊處理。

在方塊14之輸出處，存在輸入頻譜表示型態，該輸入頻譜表示型態隨後經由並行排列之相位處理器41、相位處理器42、相位處理器43來處理。相位處理器41為第1圖中之頻譜處理器13之一部分，其接收較佳來自頻譜轉換器14之複雜頻譜值作為輸入，且以對每一值之每一相位乘以2之方式來處理每一值。在相位處理器14之輸出處，存在具有與如前所述方塊41之相同振幅之經處理的頻譜表示型態，但使每一相位乘以2。以類似方式，相位處理器42決定每一輸入頻譜線之相位且將該相位乘以因數3。類似地，相位處理器43再次擷取由此頻譜轉換器輸出之每一複雜頻譜線之相位，且將每一頻譜線之該相位乘以4。隨後，將該等相位處理器之輸出轉發至相應的時間轉換器170a、170b、170c。另外，設置有降低取樣頻率取樣器44及45，其中降低取樣頻率取樣器44具有一降低取樣頻率因數3/2，且降低取樣頻率取樣器45具有一降低取樣頻率因數2。在降低取樣頻率取樣器44、45之輸出處及在時間轉換器170a之輸出處，所有信號具有等於2fs的相同取樣速率，且因此可經由加法器46以逐個取樣之方式將所有信號加在一起。因此，加法器46處之輸出信號具有為在第4圖之左手邊處輸入信號之取樣頻率fs兩倍的取樣頻率。由於頻譜時間轉換器170a以輸入取樣速率之雙倍大小之速率輸出信號，故在此實例中，在方塊170a中執行一步幅為256之不同步幅的重疊-相加處理。因此，在時間轉換器b中形成由「3」指示之另一重疊-相加處理，且時間轉換器170c應用更大的步幅512。儘管項目44及項目45執行3/2及4/2之降低頻率取樣，此降低頻率取樣在某種意義上對應於如從相角音碼器理論已知的三倍降低頻率取樣及四倍降低頻率取樣。因數1/2來自下述事實：與輸入相比，元件170a之輸出無論如何為輸入的取樣頻率的雙倍，且諸如由組合器46進行之第一處理係以雙倍的取樣速率來執行的。在此情形下，應注意的是，由於高頻音訊信號之頻譜含量較高，故取樣速率增加至取樣速率之兩倍或另一較高取樣速率可能是必需的，且為了產生無頻疊之信號，亦必須根據取樣定理來增加取樣速率。

藉由饋送不同的時間轉換器170a、170b、170c來執行較高頻率之產生，使得由頻譜處理器41、42、43輸出之信號輸入至相應頻率通道內。另外，與輸入濾波器組14相比，時間轉換器170a、170b、170c具有增加的頻率間隔，使得由該處理器產生之信號表示較高之頻譜含量，或換言之表示較高的最大頻率，而不是該等處理器具有相同大小，亦即相同FFT大小。

分析器12經組配來用以從輸入信號擷取暫態資訊，及控制處理器14、170a、170b、170c利用較大的變換大小，且在視窗式訊框開始之前及在該視窗式訊框結束之後利用填補值，以使得以適應性之方式執行頻域過取樣。在第5圖所繪示之替代實施例中，使用單個合成濾波器組17，而非三個合成濾波器組170a、170b、170c。為此，相位處理器13集中地執行與如第4圖中方塊41至方塊43所指示之乘以2、乘以3及乘以4相對應之相位處理。另外，頻譜轉換器14執行分析步幅為128之開視窗操作，且時間轉換器17執行合成步幅為256之重疊-相加處理。當在個別頻率線之間應用雙倍間隔時，時間轉換器17執行頻率-時間轉換。由於方塊17之輸出針對每一視窗具有1024個值，且由於取樣速率是經加倍的，故視窗式訊框之時間長度為輸入訊框之時間長度之總量的一半。長度之減少係藉由應用步幅為256之合成步幅或大體而言藉由應用步幅為分析步幅兩倍之合成步幅來平衡。大體而言，該合成步幅必須比該分析步幅大一個因數，該因數可等於取樣頻率增加因數。

第5圖繪示用於換位器之有效組合濾波器組結構，其中省略了第4圖下部之兩個分支。隨後在如第5圖所繪示之二階組中產生三階及四階諧波。歸因於濾波器組參數T=3或T=4之改變，第3圖中之次頻帶之簡單的一對一映射必須推廣至如在第6圖之情形下論述之內插規則。原則上，若合成濾波器組次頻帶之實體間隔為分析濾波器組之實體間隔的兩倍，則從索引為k及k+1之分析頻帶獲得對索引為n之合成頻帶的輸入。另外，出於定義之目的，假定k+r表示nQ/T之整數及小數表示型態。對冪(1-r)及r應用量值之幾何內插，且使相位與加權T(1-r)及Tr線性組合。對於其中Q等於2之示例性情況，針對每一換位因數之相位映射在第6圖中用圖形繪示。具體而言，第6圖在左手邊繪示頻譜之換位之圖形表示型態，且在右手邊繪示該濾波器組域中線之映射，亦即，將源線饋送至目標線，其中該源線是分析濾波器組(亦即，頻譜轉換器)之輸出，且其中該目標線或目標頻段為進入至合成或時間轉換器中之輸入。由於例如如在左手邊之中部及下部可看出，頻率索引k換位至3/2k或2k之頻率，但係在具有雙倍的取樣速率的系統中，故此種「重連」或將源頻段饋送至目標頻段實際上產生更高之頻率，以致最後對應於例如在第6圖之部分中之k由fs指示的實體頻率至目標頻率k、3/2k或2k之換位，分別對應於2、3或4的實體頻率之換位。

另外，儘管第6圖之左手邊之第一部分將具有索引k之頻率線映射至具有相同索引k之頻率線，但其中係繪示因數為2之換位。然而，該換位之發生係歸因於藉由利用相同的FFT核大小但具有不同的頻率間隔(亦即，具有雙倍的頻率間隔)隱式地執行之因數為2的取樣速率轉換。鑒於此，針對第一種情況，由於使相同的索引k映射至相同的索引k，故濾波器組中自分析濾波器組輸出(源頻段)至合成濾波器組輸入(目標頻段)之線的映射為簡單的，但每一源頻段頻譜線之相位乘以2，如“乘以2”箭頭62所指示。此舉將導致換位因數為2之二階換位。

為了實際地實施或約計三階換位，目標頻段相對於頻率從3/2k向上擴展。由於源頻段k、k+2中之相應頻譜線可按其現狀來採用，且其相位如相位相乘箭頭63所指示分別乘以3，故目標頻段3/2k及3/2(k+2)之結果亦為簡單的。然而，目標頻段3/2(k+1)在源頻段中不具有直接的配對狀況。在例如考慮到小的實例時，其中k等於4且k+1等於5，則3/2k對應於6，將6除以1.5，得到k=4。然而，下一個目標頻段等於7，且7除以1.5等於4.66。然而，由於僅整數源頻段確實存在，故具有索引為4.66之源頻段不存在。因此，在鄰近或相鄰之源頻段k與k+1之間執行內插。然而，由於相較於4(k)，4.66更接近於5(k+1)，故如箭頭62所指示源頻段k+1之相位資訊乘以2，且來自源頻段k(在該實例中等於4)之相位資訊乘以1，如相位箭頭61所示，箭頭61表示相位乘以1。當然，此舉對應於僅按照現狀採用該相位。較佳地，將藉由執行箭頭61及箭頭62所象徵之操作而獲得的該等相位進行組合，諸如加在一起，且甚至更佳地，由兩個箭頭共同執行之相位相乘導致相乘值為3，其為三階換位所需要。類似地，可計算針對3/2k+2及3/2(k+2)+1之相位值。

對四階換位執行類似的計算，其中如箭頭62所繪示，內插值由兩個相鄰的源頻段來計算，其中每一源頻段之相位乘以2。另一方面，為整數倍數之直接對應的目標頻段之相位並非必需為內插的，而是利用乘以4之源頻段之相位來計算。

應注意的是，在一較佳實施例中，在根據源頻段對目標頻段進行直接計算之情況下，僅相對於源頻段修改相位且維持源頻段振幅之現狀。關於內插值，較佳是在兩個相鄰源頻段之振幅之間執行內插，但亦可執行組合該兩個源頻段之其他方式，諸如藉由始終採用兩個相鄰源頻段之較高振幅或兩個相鄰源頻段之較低振幅、或相鄰源頻段振幅之幾何平均值或算術平均值或任何其他組合。

第3圖繪示用於第6圖中之程序之流程圖中的較佳實施例。在步驟30中，選擇一目標頻段。隨後，在步驟31中，若可能，則藉由利用一換位因數乘單個相位來計算相位。因此，步驟31請求其中在三階換位中可執行3次相位相乘或其中在四階換位中執行乘以4(箭頭64)之操作的狀況。對於計算內插目標頻段而言，不可能直接地根據單個源頻段來計算該等值。實情為，如步驟32中所指示，選擇欲用於內插之相鄰源頻段。在一實施例中，相鄰源頻段為兩個整數，其封閉藉由在第5圖中組合向上取樣之情況下將欲計算之目標頻段除以整數換位因數或小數換位因數而獲得的非整數。隨後，在步驟33中，將相應相位因數應用於相鄰源頻段相位以計算目標頻段相位。如已在中間部分所繪示，應用於相鄰源頻段之相位因數之和等於換位因數，例如藉由應用箭頭61所象徵之一倍相位「相乘」及箭頭62所象徵之兩倍相位相乘以獲得(1+2)倍相位相乘，其對應於關於三階之等於3的換位因數T。

隨後，在步驟34中，較佳地藉由內插數個源頻段振幅來決定目標頻段振幅。在一替代實施例中，可取決於源頻段振幅或經直接計算之目標頻段的平均目標頻段振幅，來隨機選擇目標頻段振幅。當應用隨機選擇時，可將兩個源頻段振幅值之平均值或其中一個值規定為用於隨機過程之中間值。

藉由頻域過取樣來獲得換位器之改良的暫態回應，頻域過取樣係藉由利用長度為1024F之DFT核且藉由對分析及合成視窗進行對稱地填補零以達該長度來實施。此處，F為頻域過取樣因數。

出於複雜性原因，重要的是保持過取樣之量為一最小值，因此下文將由一系列圖式來解釋其基本理論。

在時間t=t₀ 時，考慮原型暫態信號，狄拉克脈衝。因此，將相位乘以T似乎是欲進行之正確操作，以便達成在t=Tt₀ 時脈衝之變換。實際上，具有無限持續時間之視窗之理論換位器將提供脈衝的正確拉伸。對於有限持續時間之視窗分析，情況由以下事實擾亂：欲將每一分析區塊解釋為週期信號之一個週期間隔，其中週期等於DFT之大小。

在第7a圖中，分別在圖形之頂部及底部描繪風格化的分析及合成視窗。用垂直箭頭將t=t₀ 時之輸入脈衝描繪於頂部圖形上。假定DFT變換區塊大小為L，則相位乘以T之效應將在t=Tt₀ 時產生脈衝之DFT分析(實線)且取消其他貢獻量(虛線)。在接下來的視窗中，該脈衝相對於中心具有另一位置，且期望的行為欲將脈衝移動至其相對於該視窗之中心之位置的T倍。此行為保證所有的貢獻量合計達單個時間拉伸之合成脈衝。

對於第7b圖之情況出現問題，其中該脈衝朝向DFT區塊之邊緣進一步向外移動。合成視窗獲得的分量為在t=Tt₀ -L時之脈衝。對音訊之最終效應是在相當於(相當長)換位器視窗之標度之時距處出現再回聲。

第7c圖示範頻域過取樣之有利效應。DFT變換之大小增加至FL，其中L為視窗持續時間且F1。

現在，脈衝列之週期為FL，且對脈衝拉伸之不需要的貢獻量可藉由選擇充分大的F值來取消。對於在位置t=t₀ <L/2處的任何脈衝，在t=Tt₀ -FL處不合意的影像必須定位至合成視窗之左邊緣(在t=-L/2處)之左邊。等效地，TL/2-FL≦L/2，導致下列規則：

更定量之分析揭示僅因為視窗由接近邊緣之較小的值組成，所以前回聲仍藉由利用略低於此不等式所強加的值的頻域過取樣而減小。

在如第2圖之換位中，上文之推導隱示利用過取樣因數F=2.5來涵蓋所有的情況T=2、3、4。在先前的貢獻中已證明利用F=2已經引起顯著的品質改良。在第3圖之組合濾波器組實施態樣中，利用較小值F=1.5即已足。

由於過取樣僅在信號之暫態部分中所必需，故在編碼器中執行暫態偵測且將暫態旗標發送給解碼器，以供每一核心編碼器訊框控制該解碼器中之過取樣的量。當過取樣為有效時，因數F=1.5至少用於分析視窗在當前核心編碼器訊框中開始的所有換位器區組。

在第7c圖中，「零填補」繪示為視窗之第一非零值之前的部分70及視窗之最後非零值之後的部分71。因此，吾人可將第7c圖中之視窗解釋為在其開始及結束處具有加權因數為零的新的較大的視窗。此舉意謂當分析視窗14a或合成視窗17b應用具有較大長度之此視窗時，由於藉由應用具有開始時零部分及結束時零部分的視窗自動地執行零填補，故單獨之「零填補」步驟並非必需。然而，在較佳替代方案中，視窗並未經改變，而是始終用於相同的形狀，但是暫態偵測一成功，就在視窗式訊框開始之前或視窗式訊框結束之後或在開始之前及結束之後填補零，且可將此舉視為單獨的步驟，其分離於視窗化，且其亦分離於計算該變換。因此，在暫態事件的情況下，啟動數值填補器以較佳地填補零，以使得結果(亦即，視窗式訊框及所填補的零)完全與當應用具有在第7c圖中所繪示的零部分70及71的視窗時所獲得的結果相同。

類似地，在合成情況下，吾人亦可在暫態事件之情況下應用指定之較長合成視窗，其將為由反向FFT處理器17a產生之訊框之前導值及末尾值加入零。然而，較佳的是，始終應用相同的合成視窗，但僅刪除(亦即，取消)從FFT^-1 輸出開始的值，其中在處理器17a輸出的區塊的開始及結束處刪除的零值(填補值)的數量對應於零填補值的數量。

另外，暫態事件之偵測經由第2a圖中之開始索引控制線29來執行開始索引控制。為此，開始索引k，且因此索引3/2k及2k亦乘以頻域過取樣因數。當此因數為例如因數2時，則第6圖之左邊部分中的每一k由2k取代。然而，亦以所繪示的相同方式執行其他程序。

較佳地，對用於產生高頻增強信號之訊框(亦即所謂的SBR訊框)，用信號通知暫態。則輸入信號之第一部分為含有暫態事件之SBR訊框，且輸入信號之第二部分為在時間上較遲而不含有暫態的SBR訊框。因此，具有此暫態訊框之至少一單個取樣值的每一視窗將接受零填補，以使得當一訊框具有一個視窗之長度時且當暫態事件為單個取樣時，此舉產生利用具有填補值的較長變換而遭變換的八個視窗。

本發明亦可視為一種用於頻域換位之裝置，其中在組合換位器之一濾波器組中執行適應性的頻域過取樣，該過取樣由一暫態偵測器控制。

儘管在裝置之情形下已描述一些態樣，但很明顯該等態樣亦代表相應方法的描述，其中一方塊或設備對應於一方法步驟或一方法步驟之一特徵。類似地，在方法步驟之情形下所描述之態樣亦代表一相應方塊或項目或一相應裝置之特徵的描述。

取決於某些實施要求，可在硬體或在軟體中實施本發明之實施例。可利用數位儲存媒體來執行實施，例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體，該類數位存儲媒體具有儲存於其上之可電子式讀取控制信號，其與(或能夠與)可規劃電腦系統合作以使得個別方法獲執行。

根據本發明之一些實施例包含具有可電子式讀取控制信號之資料載體，此等信號能夠與可規劃電腦系統合作，以使得本文所描述之該等方法中之一種獲執行。

大體而言，本發明之實施例可實施為具有程式碼之電腦程式產品，該程式碼可經操作以在該電腦程式產品在電腦上執行時實行該等方法中之一種。該程式碼可例如儲存於一機器可讀取載體上。

其他實施例包含儲存於機器可讀取載體上之電腦程式，該電腦程式用以執行本文所描述之該等方法中之一種。

換言之，因此，本發明之方法之一實施例為具有程式碼之電腦程式，以當電腦程式在電腦上運作時執行本文所描述之該等方法中之一種。

因此，本發明之方法之另一實施例為包含記錄於其上之電腦程式之資料載體(或數位儲存媒體或電腦可讀取媒體)，該電腦程式用以執行本文所描述之該等方法中之一種。

因此，本發明之方法之另一實施例為表示電腦程式之資料串流或信號序列，該電腦程式用以執行本文所描述之該等方法中之一種。該資料串流或該信號序列可以例如經組配來經由資料通訊連接(例如經由網際網路)來傳送。

另一實施例包含處理構件，例如電腦，或可規劃邏輯元件，其經組配或經調適以執行本文所描述之該等方法中之一種。

另一實施例包含具有安裝於其上之電腦程式之電腦，該電腦程式用以執行本文所描述之該等方法中之一種。

在一些實施例中，可規劃邏輯元件(例如可現場規劃閘陣列)可用來執行本文所描述之該等方法中之一些或全部功能性。在一些實施例中，可現場規劃閘陣列可與微處理器合作以便執行本文所描述之該等方法中之一種。大體而言，該等方法較佳由任何硬體裝置來執行。

上文所描述之實施例僅用於例示說明本發明之原理。應理解，本文所描述之配置及細節之修改及變化對於熟習此項技術者而言將顯而易見。因此，本發明意欲僅由下文之申請專利範圍之範疇限制，且並非由本文藉助於對實施例之描述及解釋所提供的特定細節來限制。

10．．．輸入信號線/輸入線

11．．．輸入頻譜表示型態

12．．．分析器

13．．．頻譜處理器

13a．．．相位處理/換位模組

14．．．頻譜轉換器

14a．．．分析視窗器

14b．．．時間頻率處理器/FFT處理器

15．．．經處理之頻譜表示型態

16．．．暫態資訊線

17．．．時間轉換器

17a．．．反向FFT模組/反向FFT處理器

17b．．．合成視窗器

17c．．．重疊-相加處理器

18‧‧‧輸出線

20‧‧‧方塊

21‧‧‧分析階段

22‧‧‧線

23‧‧‧SBR處理器

24‧‧‧SBR參數

25‧‧‧QMF合成階段

26‧‧‧線/高頻帶信號

27‧‧‧組合器

28‧‧‧分流線/低頻帶信號

29‧‧‧開始索引控制線

30、31、32、33、34‧‧‧步驟

41、42、43‧‧‧相位處理器

44、45‧‧‧降低取樣頻率取樣器

46‧‧‧加法器/組合器

61‧‧‧相位箭頭

62‧‧‧箭頭

63‧‧‧相位相乘箭頭

64‧‧‧箭頭

70‧‧‧視窗之第一非零值之前的部分

71‧‧‧視窗之最後非零值之後的部分

170a、170b、170c‧‧‧時間轉換器

第1圖為用以產生高頻音訊信號之裝置之方塊圖；

第2a圖為用以產生高頻音訊信號之裝置之實施例；

第2b圖繪示頻譜帶複製處理器，其包含用以產生第1圖或第2a圖之高頻音訊信號作為整體SBR處理之區塊以最終獲得頻寬擴展之信號的裝置；

第3圖繪示在頻譜處理器內部執行之處理動作/步驟之實施例；

第4圖為在若干個合成濾波器組之框架中之本發明的一實施例；

第5圖繪示其中利用單個合成濾波器組之另一實施例；

第6圖繪示頻譜換位及用於第5圖實施例之濾波器組中相應的線映射；

第7a圖繪示接近於視窗之中心之暫態事件的暫態拉伸；

第7b圖繪示接近於視窗之邊緣之暫態的拉伸；及

第7c圖繪示在具有相關聯之暫態資訊之輸入信號的第一部分中發生過取樣的情況下的暫態拉伸。