TWI417871B

TWI417871B - 雜訊填充器、雜訊填充參數計算器、經編碼音訊信號表示型態、方法和電腦程式

Info

Publication number: TWI417871B
Application number: TW098122013A
Authority: TW
Inventors: Nikolaus Rettelbach; Bernhard Grill; Guillaume Fuchs; Stefan Geyersberger; Markus Multrus; Harald Popp; Juergen Herre; Stefan Wabnik; Gerald Schuller; Jens Hirschfeld
Original assignee: Fraunhofer Ges Forschung
Priority date: 2008-07-11
Filing date: 2009-06-30
Publication date: 2013-12-01
Also published as: ZA201100085B; US20170309283A1; CN102089806B; AR072497A1; EP2304720B1; CA2730536A1; JP5622726B2; ES2526767T3; BR122021003752B1; PL3246918T3; US11869521B2; CN102089808A; AR072482A1; KR20160004403A; BR122021003726B1; BR122021003142B1; EP4407611A1; PL2304719T3; KR101582057B1; US9043203B2

Description

雜訊填充器、雜訊填充參數計算器、經編碼音訊信號表示型態、方法和電腦程式

根據本發明之實施例係有關一種用於基於一音訊信號之輸入頻譜表示型態提供該音訊信號之一雜訊已填充之頻譜表示型態之雜訊填充器；一種用於基於一音訊信號之一已量化頻譜表示型態提供一雜訊填充參數之雜訊填充參數計算器；一種表示一音訊信號之一編碼音訊信號表示型態；一種用於提供一音訊信號之雜訊已填充頻譜表示型態之方法；一種用於基於一音訊信號之一已量化頻譜表示型態提供一雜訊填充參數之方法；及用於實施該等方法之電腦程式。

發明背景

後文將說明若干景況其中可優異地應用根據本發明之實施例。多個頻域音訊信號編碼器係基於下述構想，若干頻率區或頻譜區(例如藉時域變換至頻域所提供之頻率線或頻譜線)比其它頻譜區更重要。如此，高心理聲學相關之頻譜區典型係以比較低頻譜聲學相關之頻譜區更高的準確度編碼。不同頻譜區之心理聲學關係例如可使用心理聲學模型計算，該模型考慮藉相鄰強頻譜峰遮蔽較弱的頻譜峰。

若期望減低一已編碼音訊信號之位元率朝向低位準，某些頻譜區係以極低準確度(例如只有一個位元準確度或二位元準確度)量化。如此，以低準確度量化之多個頻譜區被量化至零。如此於低位元率，基於變換之音訊編碼器容易出現不同的假信號，特別係源自於零量化的頻率線之假信號。確實於低位元率音訊編碼之頻譜值之粗糙量化，可能導致於反相量化後極為稀疏的頻譜，原因在於許多頻譜線可能皆被量化為零。此等於已重建信號中之頻譜孔洞產生非期望的聲音假信號。當頻譜孔洞係位在由訊框移動至訊框的頻譜中時，可能造成重製的聲音特尖銳或聲音不穩(唧啾聲)。

雜訊填補係於解碼器端，經由以一隨機雜訊填補零量化係數或頻帶來遮蔽此等假信號之手段。所插入之雜訊能量係經過電腦運算及藉編碼器傳送。

已知不同的雜訊填充構想。例如所謂的AMR-WB+組合雜訊填充及離散傅立葉變換(DFT)，例如說明於參考文獻[1]。此外，國際標準ITU-T G.729.1定義組合雜訊填充及修改型離散餘弦變換(MDCT)之構想。細節係說明於參考文獻[2]。

有關雜訊填充之額外面相係說明於Koninklijke之國際專利申請案PCT/IB2002/001388(飛利浦電子公司(Philips Electronics N.V.))(參考參考文獻[3])。

雖言如此，習知雜訊填充構想導致聽覺失真。

鑑於此討論，期望形成一種可提供改良型聽覺印象之雜訊填充構想。

發明概要

根據本發明之實施例形成一種用於基於一音訊信號之輸入頻譜表示型態提供該音訊信號之一雜訊已填充之頻譜表示型態之雜訊填充器。該雜訊填充器包含一頻譜區識別器，配置來識別與輸入頻譜表示型態之非零頻譜區(例如頻譜線或頻譜倉(spectral bins))間隔至少一個中間頻譜區之該輸入頻譜表示型態之頻譜區(例如頻譜線或頻譜倉)而獲得已識別之頻譜區。雜訊填充器也包含一種雜訊插入器，配置來選擇性地將雜訊導入該等已識別的頻譜區(例如頻譜線或頻譜倉)而獲得該音訊信號之雜訊已填補之頻譜表示型態。

本發明之實施例係基於發現若雜訊填充係施用於一音訊信號之頻譜表示型態之音高組分之緊鄰，則就聽覺印象而言，該音高組分典型降級。如此，發現若雜訊填充只應用於間隔此種音高非零頻譜區之頻譜區，則可獲得雜訊已填充音訊信號之改良型聽覺印象。如此，音訊信號頻譜之音高組分(於輸入該雜訊填充器之已量化頻譜表示型態中非量化至零的組分)維持可聽聞(亦即不會變成被緊鄰的雜訊所污染)，而仍可有效避免大的頻譜孔洞的存在。

於較佳實施例中，頻譜區識別器係配置來識別輸入頻譜表示型態之頻譜線，其係量化為零，及其包含至少一第一預定數目之量化為零之較低頻鄰近頻譜線及至少一第二預定數目之量化為零之較高頻鄰近頻譜線作為已識別之頻譜區，其中該第一預定數目係大於或等於1，及其中該第二預定數目係大於或等於1。於本實施例中，雜訊插入器係配置來將雜訊選擇性導入已識別之頻譜線，同時留下量化至非零值之頻譜線及量化為零之頻譜線，但第一預定數目之量化為零之較低頻鄰近頻譜線或第二預定數目之量化為零之較高頻鄰近頻譜線未受雜訊填充影響。如此，雜訊填充為選擇性，雜訊只導入被量化為零之頻譜線，且於向上頻譜方向及向下頻譜方向，與量化為非零值之頻譜線例如間隔達第一預定數目之量化為零之較低頻鄰近頻譜線及第二預定數目之量化為零之較高頻鄰近頻譜線。

於較佳實施例中，第一預定數目係等於第二預定數目，使得於由量化為非零值之頻譜線於向上頻率方向之最小間隔係等於與量化為非零值於向下頻率方向之最小間隔。

於較佳實施例中，雜訊填充器係配置來將雜訊只導入音訊信號之頻譜表示型態上部之頻譜區，而留下音訊信號之頻譜表示型態下部不受雜訊填充影響。此種構想有用，原因在於通常較高頻對感官上的重要性比低頻低。零量化值最常出現於頻譜的第二半(亦即高頻)。同時雜訊增加於高頻較不易產生最終雜音的回復。

於較佳實施例中，頻譜區識別器係配置來加總於一給定頻譜區之預定雙邊頻譜鄰近(亦即朝向較低頻及較高頻兩邊之頻譜鄰近)之頻譜區之量化強度值(例如能量值或振幅值)來獲得和值；以及評估該和值來判定該給定頻譜區是否為一已識別的頻譜區。發現於一給定頻譜區之雙邊頻譜鄰近之已量化頻譜能量之和值為有意義數量俾判定雜訊填充是否應應用至該給定頻譜區。

於另一個實施例中，該頻譜區識別器係配置來掃描該輸入頻譜表示型態之頻譜區範圍俾檢測量化為零之連續頻譜區序列，且辨識此種經檢測之連續序列之一個或多個中心頻譜區(亦即非邊界頻譜區)為已識別的頻譜區。

發現某些經量化為零之頻譜區之某個「行程長度」之檢測為可以待低運算複雜度實施之工作。為了識別此種頻譜區之連續序列，可判定於此頻譜區序列中之全部頻譜區是否皆量化為零，可使用相當簡單之演算法或電路實施。若發現此種頻譜區之連續序列被量化為零，則序列內頻譜區中之一者或多者(距本頻譜區序列外側頻譜區之間隔夠遠)被當作已識別的頻譜區處理。如此，經由掃描通過頻譜區範圍(例如經由隨後選擇不同位移的頻譜區序列)，可作頻譜區有效分析，來識別被量化為零且與量化為非零值之頻譜區間隔預定最小距離之該等頻譜區。

根據本發明之另一實施例形成用於基於音訊信號之已量化頻譜表示型態，提供一雜訊填充參數之雜訊填充參數計算器。該雜訊填充參數計算器包含一頻譜區識別器配置來識別與該已量化頻譜表示型態之非零頻譜區間隔至少一個中間頻譜區之該已量化頻譜表示型態之頻譜區。該雜訊填充參數計算器也包含一雜訊值計算器配置來對該雜訊填充參數之計算值選擇性考慮已識別之頻譜區之量化誤差。雜訊填充參數計算器係基於下述關鍵構想，期望將解碼器端雜訊填充限於與音高頻譜區(量化至非零值)隔開之頻譜區；以及結果，考慮此種構想，該雜訊參數須於編碼器端計算。如此，獲得特別適合前述解碼器構想之雜訊填充參數。也發現被量化為零但極為接近量化為非零值之頻譜區之該等頻譜區通常並未反映真正雜訊狀音訊內容，反而與相鄰音高(量化至非零值)頻譜區強力相關。如此，發現對於雜訊填充參數之計算，不期望考慮附近量化為非零值之頻譜區之該等頻譜區之量化誤差，原因在於如此典型導致雜訊的強烈超估，因而導致重建的頻譜表示型態過多雜訊。

如此，此處所述雜訊填充參數計算構想可組合前述雜訊填充構想使用，甚至組合習知雜訊填充構想使用。

於較佳實施例中，已經就雜訊填充器討論之頻譜區識別構想也適用於與雜訊填充參數計算器組合。

於又一較佳實施例中，雜訊值計算器係配置來考慮已識別之頻譜區之量化誤差之實際能量用於雜訊填充參數之計算。發現考慮實際量化誤差(而非考慮估計的量化誤差或平均量化誤差)，典型獲得改良的結果，原在於實際量化誤差典型係偏離統計上預期的量化誤差。

於又一較佳實施例中，雜訊值計算器係配置來相對於其中於單一頻譜區之調性量化誤差能，強調於多數已識別頻譜區之非調性量化誤差能。此種構想係基於發現其平均能量係低於量化臨界值因而被量化為零之一非調性寬頻雜訊比較其強度低於量化臨界值之單一調性音訊組分，對該雜訊填充器於感官上遠較相關，即使量化為零之非調性寬頻雜訊及量化為零之調性組分二者皆被量化為零亦如此。理由在於藉由於解碼器產生隨機雜訊之雜訊填充器可遺漏於該已量化頻譜表示型態中之非調性寬頻雜訊，但未遺漏調性組分來模型化。如此，比較量化為零之調性組分，強調量化為零之非調性雜訊組分獲得更理想的聲音重建。此點也由於人類聽覺印象因頻譜孔洞的存在(例如於無量化為零之寬頻雜訊之存在形式)比因量化為零之小型頻譜尖峰的不存在所造成的降級遠更大。調性組分可集中於單一頻譜線，或可展開於數條鄰接頻譜線(例如i-1、i、i+1)。頻譜區例如包含一條或多條頻譜線。

於較佳實施例中，雜訊值計算器係配置來計算該已識別之頻譜區之對數化量化誤差能之和而獲得雜訊填充參數。經由計算該已識別之頻譜區之對數化量化誤差能之和，可以有效方式獲得如前文說明之比較量化為零之調性區，相對強調量化為零之非調性頻譜區。

根據本發明之另一個實施例形成用於表示一音訊信號之已編碼音訊信號表示型態。已編碼音訊信號表示型態包含該音訊信號之已編碼量化頻譜域表示型態及已編碼雜訊填充參數。該雜訊填充參數表示量化為零且與量化至非零值之該頻譜域表示型態之頻譜區間隔至少預定數目之中間頻譜區之該頻譜域表示型態之該等頻譜區之量化誤差。前述已編碼音訊信號表示型態藉前文討論之雜訊填充器為有用，可使用如前文討論之雜訊填充參數計算器獲得。已編碼音訊信號表示型態允許以待佳音訊品質重建該音訊信號，原因在於該雜訊填充參數選擇性反映出其中存在有有意義雜訊資訊之此種頻譜區之已量化頻譜域表示型態之量化誤差，且該等量化誤差對於解碼器端之雜訊填充也須選擇性考慮者。

根據本發明之另一個實施例形成一種用於提供音訊信號之雜訊已填充表示型態之方法。

根據本發明之又另一個實施例形成一種基於一音訊信號之已量化頻譜表示型態提供雜訊填充參數之方法。

根據本發明之又另一個實施例形成用於實施前述方法之電腦程式。

圖式簡單說明

隨後將參考附圖說明根據本發明之實施例，附圖中：第1圖顯示根據本發明之實施例，雜訊填充器之方塊示意圖；第2圖顯示包含根據本發明之雜訊填充器之音訊信號解碼器之方塊示意圖；第3圖顯示用於實施第1圖之雜訊填充器之功能之虛擬程式碼；第4圖顯示可於根據第1圖之雜訊填充器進行之頻譜區識別之圖解代表圖；第5圖顯示根據本發明之實施例，雜訊填充參數計算器之方塊示意圖；第6圖顯示用於實施根據第5圖之雜訊填充參數計算器之功能之虛擬程式碼；第7圖顯示用於基於音訊信號之輸入頻譜表示型態，提供音訊信號之雜訊已填充之頻譜表示型態之方法之流程圖；第8圖顯示用於基於音訊信號之量化頻譜表示型態提供已雜訊化填充參數之流程圖；及第9圖顯示根據本發明之實施例，音訊信號表示型態之圖解代表圖。

根據第1-4圖之雜訊填充器

第1圖顯示根據本發明之實施例，雜訊填充器100之方塊示意圖。雜訊填充器100係組配來接收音訊信號之輸入頻譜表示型態110，該表示型態例如係呈已解碼頻譜係數形式(例如可經量化或經反相量化)。雜訊填充器100也配置來基於輸入頻譜表示型態110提供該音訊信號之雜訊已填充頻譜表示型態112。

雜訊填充器100包含一頻譜區識別器120，其係配置來識別與輸入頻譜表示型態110之非零頻譜區間隔至少一個中間頻譜區之該等輸入頻譜表示型態110之頻譜區而獲得指示該已識別之頻譜區之資訊122。雜訊填充器100也包含一雜訊插入器130，其係配置來將雜訊選擇性導入已識別之頻譜區(以資訊122描述)而獲得該音訊信號之雜訊已填充頻譜表示型態112。

有關雜訊填充器100之功能，通常雜訊填充器100係以雜訊選擇性填充輸入頻譜表示型態110之頻譜區(例如頻譜線或頻譜倉)，例如係以描述雜訊之置換頻譜值來置換被量化為零之頻譜線之頻譜值。藉此方式，可填充輸入頻譜表示型態110內部之頻譜孔洞或頻譜間隙，該等孔洞或間隙可能係來自於輸入頻譜表示型態110之粗糙量化。但雜訊填充器100並未將雜訊導入量化為零之全部頻譜線(亦即其頻譜值被量化為零之該等頻譜線)。反而雜訊填充器100只將雜訊導入包含距量化為非零之任何頻譜線有足夠距離之此種量化為零之頻譜線。藉此方式，雜訊填充並未完全填充頻譜孔洞或頻譜間隙，反而於其中導入雜訊之該等頻譜線與量化為非零值之該等頻譜線間維持至少一個頻譜區之頻譜距離(或至少任何預定數目之頻譜區之頻譜距離)。如此，維持導入頻譜表示型態之填充雜訊與量化至非零值之頻譜線間之頻譜距離，使得(由於預定數目之一個或多個頻譜區之頻譜距離)可清晰區別心理聲學相關頻譜線(於音訊信號之輸入頻譜表示型態未量化為零)與藉雜訊填充器而導入頻譜之填充雜訊。如此，可清晰接受心理聲學上最相關的音訊內容(於輸入頻譜表示型態110以非零頻譜線值表示)，同時避免大型頻譜孔洞。原因在於實際上於被量化為非零值之輸入頻譜表示型態之頻譜線附近被選擇性刪除雜訊填充，而於頻譜孔洞或頻譜間隙中央區執行雜訊填充。

後文將參考第2圖說明雜訊填充器100之應用環境。第2圖顯示根據本發明之實施例，音訊信號解碼器200之方塊示意圖。音訊信號解碼器200包含雜訊填充器100作為關鍵組件。音訊信號解碼器200也包含一頻譜係數解碼器210，其係配置來接收一已編碼音訊信號表示型態212及提供該已編碼音訊信號之頻譜係數之一已解碼選擇性地經反相量化之表示型態214。頻譜係數解碼器210例如可包含一熵解碼器(例如算術解碼器或行程長度解碼器)及選擇性地包含一反相量化器來由該已編碼之音訊信號表示型態212導算出頻譜係數之已解碼表示型態214(例如係呈反相量化係數形式)。雜訊填充器100係配置來接收頻譜係數之已解碼表示型態214(選擇性地可經反相量化)作為該音訊信號之輸入頻譜表示型態110。

音訊信號解碼器200也包含一雜訊因數擷取器220，其係配置來由該已編碼之音訊信號表示型態212擷取一雜訊因數資訊222，且提供該已擷取的雜訊因數資訊222予雜訊填充器100。音訊信號解碼器200也包含一頻譜整形器230，其係配置來由雜訊填充器100接受一已重建的頻譜表示型態232。已重建的頻譜表示型態232例如係等於由雜訊填充器所提供之雜訊已填充的頻譜表示型態112。頻譜整形器230可視為選擇性，係配置來基於已重建的頻譜表示型態232而提供頻譜資訊234。音訊信號解碼器200進一步包含一頻譜域至時域變換器240，其接收由頻譜整形器230所提供之頻譜資訊234，或於無頻譜整形器230之存在下，接收已重建之頻譜表示型態232；以及基於此提供一時域音訊信號表示型態242。頻譜域至時域變換器240例如可配置來執行反相修改型離散餘弦變換(IMDCT)。

於較佳實施例中，於解碼器端之雜訊填充包括下列步驟(或遵循其次步驟)：

1.解碼雜訊底位準；

2.解碼頻率線之已量化值；

3.於零之行程長度高於最小行程長度大小處，檢測於該頻譜選定部分之頻譜區；及

4.對於選定區內部之各條線應用隨機產生之符號至該已解碼之雜訊底位準。

雜訊底位準解碼如下：

nf_decoded=0.0625*(8-index)

檢測得之頻譜區例如係以於編碼器端之相同方式選擇(容後詳述)。

於MDCT域之無記憶高斯雜訊係藉對全部線皆有相同振幅但有隨機符號之頻譜產生。如此，對選定區內部之各線，解碼器產生隨機符號(-1或+1)且應用至已解碼之雜訊底位準。但其它提供雜訊貢獻之方法也適用。

後文中將參考第1、2、3及4圖說明若干細節，其中第3圖顯示可藉雜訊填充器100執行之於解碼器端用於雜訊填充之演繹法則之虛擬程式碼，及其中第4圖顯示雜訊填充之圖解代表圖。

開始時，藉雜訊因數擷取器220執行雜訊底位準之解碼，雜訊因數擷取器220其例如接收雜訊因數指數(也簡寫為(「指數」)，基於此提供已解碼雜訊因數值222(也標示為「nf_decoded」)。雜訊因數指數例如可使用三位元或四位元編碼，例如可為0至7之範圍之整數值或0至15之範圍之整數值。

頻率線(也稱作為「頻譜線」或「頻譜倉」)之量化值可由頻譜係數解碼器210提供。如此獲得已量化的(或選擇性地，已反相量化的)頻譜線值(也稱作為「頻譜係數」)，標示為「已量化(x(i))」。此處i表示頻譜線值之頻率指數。

隨後藉雜訊填充器100檢測於頻譜選定部分(例如始於預定頻譜線頻率指數i之頻譜上部)之頻譜區，此處零之行程長度(亦即量化為零之已量化頻譜線值)細高於最小行程長度大小。此種頻譜區之檢測係藉第3圖之演繹法則300之第一部分310進行。如由演繹法則300之第一部分310可知，檢測區集合R於演繹法則起點被初始化空白集合(R={}；)。

於第3圖之演繹法則實例中，最小行程長度設定為8之固定值，當然也可選用任何其它數值。

隨後對所考慮之多數頻譜線(標示為行程變數「線指數」)所考慮的各條頻譜線是否包含量化至零之頻譜線之雙邊環境(及所考慮之頻譜線是否本身量化為零)。舉例言之，於頻譜第二半之全部頻譜線隨後皆考慮為接受考慮的頻譜線，其中目前正在考慮之線標示為頻率指數「線指數」。對標示為「線指數」之接受考慮之線，運算由「線指數-(最小行程長度/2之頻譜線頻率指數」至「線指數+(最小行程長度/2之頻譜線頻率指數」之範圍環境中之已量化的頻譜係數「量化(x(i))」之和。若發現於目前正在考慮之頻譜線環境中之頻譜線之和(具有頻譜線頻率指數「線指數」)為零，則目前正在考慮之頻譜線(或更精確言之，其頻譜線頻率指數「線指數」)加至檢測區集合R(或檢測頻譜線)。結果，若頻譜線之頻譜線頻率指數加至集合R，表示具有「線指數-(最小行程長度)/2之頻譜線頻率指數」至「線指數+(最小行程長度)/2之頻譜線頻率指數」間之線指數之頻譜線全部皆包含量化為零之頻譜線值。

如此虛擬程式碼310之第一部分310，獲得頻譜線頻率指數「線指數」之集合R，列舉接受考慮之頻譜部分之該等(且只有該等)頻譜線，其係與量化至非零值之任何頻譜線「充分」隔開(亦即間隔至少最小行程長度/2線)。

此區之檢測示例顯示於第4圖，顯示頻譜之圖形代表圖400。橫座標410係以頻譜線頻率指數「線指數」描述頻譜線頻率。縱座標412描述頻譜線強度(亦即振幅或能量)。如此可知，線圖代表圖400中示例顯示之頻譜部分包含量化至非零值之四條頻譜線420a、420b、420c、及420d。此外，頻譜線420c與420d間有11條量化為零之頻譜線422a-422k。進一步，於目前正在考慮之頻譜線與量化至非零值之任何其它頻譜線間有至少四條量化為零之頻譜線(及當然，若目前接受考慮之頻譜線本身被量化為零)，則假設只考慮與量化為非零值之頻譜線充分間隔之頻譜線。但當考慮頻譜線422a時，發現頻譜線422a緊鄰於頻譜線422c，其未量化為零，故頻譜線422a之頻譜線頻率指數根據演繹法則300之第一部分310將不會構成運算的集合R之一部分。同理，發現頻譜線422b、422c及422d與量化至非零值之任何頻譜線並未足夠間隔遠離，使得頻譜線422b至422d之頻譜線頻率指數也非為集合R之一部分。相反地，須瞭解頻譜線422e與任何量化為非零值之頻譜線足夠遠離，原因在於頻譜線422e為一序列9條全部量化為零之連續頻譜線之中心線(或更通常為中線)。如此，頻譜線422e之頻譜線頻率指數將為於演繹法則300之第一部分310中運算的集合R之一部分。頻譜線422f及422g亦如此，使得頻譜線422f及422g之頻譜線頻率指數將成為於演繹法則300之第一部分310測得之集合R之一部分，原因在於頻譜線422f、422g係充分遠離量化為非零值之較低頻頻譜線420a、420b、及420c，且充分遠離量化為非零值之任何較高頻頻譜線。另一方面，頻譜線422h、422i、422j、及422k將不屬於集合R之一部分，原因在於就頻率而言該等頻譜線太過接近量化為非零值之頻譜線420d。

如此，集合R將不包含頻譜線420a、420b、420c、420d之頻譜線頻率指數，原因在於該等頻譜線被量化為非零值。此外，頻譜線422a、422b、422c、422d、422h、422i、422j、及422k之頻譜線頻率指數將不構成集合R之一部分，原因在於該等頻譜線太過接近頻譜線420a、420b、420c、及420d。相反地，頻譜線422e、422f、422g之頻譜線頻率指數將含括於集合R，原因在於該等頻譜線本身被量化為零，且足夠間隔遠離任何相鄰的非零頻譜線。

演繹法則300也包含解碼雜訊底位準之一第二部分320，其中雜訊值指數(於程式碼部分320之「指數」)被變換成已解碼之雜訊數值(於程式碼300之「nf_decoded」)。

程式碼300也包含一雜訊填充已識別之頻譜線之一第三部分330，亦即其頻譜線頻率指數i係於集合R之該等頻譜線。用於此項目的，已識別之頻譜線之頻譜值(例如以x(i)標示，此處行程變數i隨後取於集合R所含括的全部頻譜線頻率指數)係設定為雜訊填充值。雜訊填充值例如係經由將已解碼之雜訊填充值(nf_decoded)乘以隨機數目或虛擬隨機數目(標示為「random(-1,+1)」)獲得，其中隨機數目或虛擬隨機數目例如可為隨機或虛擬隨機取數目-1及+1。但當然也可取不同的隨機雜訊或虛擬隨機雜訊。

雜訊填充也示例顯示於第4圖。如第4圖可知，頻譜線422e、422f、及422g之零頻譜值係以雜訊填充值置換(第4圖中以虛線表示)。

根據第5圖及第6圖之雜訊填充參數計算器

第5圖顯示雜訊填充參數計算器500之方塊示意圖。雜訊填充參數計算器500係配置來獲得音訊信號之已量化頻譜表示型態510，以及基於該表示型態而提供雜訊填充參數512。雜訊填充參數計算器500包含一頻譜區識別器520，其係配置來接收音訊信號之已量化頻譜表示型態510，且識別與已量化頻譜表示型態510之非零頻譜區間隔至少一個中間頻譜區(例如頻譜線)之已量化頻譜表示型態510之頻譜區(例如頻譜線)，來獲得描述已識別之頻譜區(例如已識別之頻譜線)之資訊522。雜訊填充參數計算器500進一步包含一雜訊值計算器530，配置來接收量化誤差資訊532及提供雜訊填充參數512。用於此項目的，雜訊值計算器係配置來選擇性考慮藉資訊522描述用於計算雜訊填充參數512之已識別的頻譜區之量化誤差。

量化誤差資訊532例如可與描述於已量化頻譜表示型態510中被量化為零之該等頻譜線之能量(或強度)之能量資訊(或強度資訊)相同。

雜訊填充參數計算器500選擇性地包含一量化器540，配置來接收音訊信號之未經量化之頻譜表示型態542，與提供音訊信號之已量化頻譜表示型態510。量化器540可具有可調整之量化解析度，例如可每條頻譜線個別調整或每個頻帶個別調整(例如取決於使用心理聲學模型獲得之頻譜線或頻譜帶之心理聲學關係)。可變解析度量化器之功能可等於國際標準ISO/IEC 13818-7及ISO/IEC 14496-3說明之功能。特定言之，量化器540可經調整，使得音訊信號之量化頻譜表示型態510中有頻譜間隙或頻譜孔洞，亦即被量化為零之相鄰頻譜線之連續區。

此外，未經量化之頻譜表示型態542可用作為量化誤差資訊532，或量化誤差資訊532可由未經量化之頻譜表示型態542導算出。

後文將說明可藉雜訊填充參數計算器500進行之雜訊填充參數運算功能。於編碼器端之雜訊填充參數運算中，雜訊填充較佳係應用於量化域。藉此方式，隨後藉心理聲學相關的反相濾波器成形所導入的雜訊。藉解碼器所導入之雜訊能量經求出且遵照下列步驟於編碼器端編碼：

1.獲得頻率線之已量化值；

2.只選擇部分頻譜；

3.於零行程長度高於最低行程長度大小時，檢測於頻譜選定部分之頻譜區；

4.計算於先前檢測得頻譜區之量化誤差之幾何平均；及

5.以3位元一致地量化該幾何平均。

有關第一步驟，頻譜線之已量化值可使用量化器540獲得。因此頻譜線之已量化值係藉已量化頻譜表示型態510表示。

有關第二步驟，第二步驟被視為選擇性，須注意雜訊填充之運算較佳係基於頻譜之高頻部分進行。於較佳實施例中，雜訊能量(稱作為雜訊底位準)只對雜訊之第二半亦即對高頻(而非對低頻)計算。確實，通常高頻(頻譜上部)於感官上比低頻不重要，零量化值大部分出現於頻譜之第二部分。此外，加入高頻雜訊較不容易獲得最終雜音回復。

有關第三步驟，經由限制於出現零量化值行程長度之頻譜區的雜訊填充，避免雜訊填充太過度影響非零值。藉此方式，雜訊填充並未應用於非零值鄰近，此等線之原先調性被更優異地保留。較佳實施例中，最小行程長度大小固定為8。表示環繞一個非零值之8條線不受雜訊填充影響(結果於雜訊值之計算不考慮)。

有關第四步驟，於已量化域之量化誤差係於[-0.5；0.5]之範圍且假設為一致分布。檢測區之量化誤差能為對數域之平均值(亦即幾何平均)。然後雜訊底位準nf計算如下：

nf=power(10,sum(log10(E(x(i))))/(2*n))

上式中，sum()為檢測區內部個別線x(i)之對數能lkog10(E())之和，n為此等區之線數目。雜訊底位準nf為0至0.5。此種計算允許將零值原先頻譜平坦度列入考慮，然後獲得有關其調性/雜訊特性。

若零化值極為有調性，則雜訊底位準(於裝置500運算)將朝向零改變，於解碼器(例如於前述解碼器100、200)將加上低雜訊底位準。若零化值實際上有雜訊，則雜訊底位準將高，雜訊填充可視為零化頻譜線之高度參數編碼，類似PNS(感官雜訊取代)(也參考參考文獻[4])。

有關第五步驟，雜訊底位準之量化指數(「指數」)計算如下：

index=max(0,min(7,int(8-16*nf)))。

指數例如以3位元傳送。

後文中將參考第6圖說明運算雜訊填充參數之演繹法則，第6圖顯示根據本發明之實施例，用於獲得雜訊填充參數之此種演繹法則之虛擬程式碼600。演繹法則600包含運算雜訊填充參數須考慮之檢測區之第一部分610。已識別區(例如頻譜線)以集合R描述，例如可包含已識別頻譜線之頻譜線頻率指數(「線指數」)。可識別本身被量化為零且與被量化為非零值之任何其它頻譜線充分間隔遠離之該等頻譜線。

程式600之第一部分610係與程式300之第一部分310相同。如此用於演繹法則600之已量化頻譜表示型態(「已量化(x(i))」)可與解碼器端用於演繹法則300之已量化頻譜表示型態(「已量化(x(i))」)相同。換言之，於編碼器端之已量化頻譜表示型態可以編碼形式傳送至包含一編碼器及一解碼器之傳送系統中之該解碼器。

演繹法則600包含運算雜訊底位準之第二部分620。於雜訊底位準之運算中，只考慮藉演繹法則600之第一部分610運算之集合R描述之該等頻譜區(或頻譜線)。可知雜訊填充值nf首先被初始化為零。所考慮之頻譜線數目(n)也被初始化為零。隨後，加總含括於集合R之線指數亦即全部頻譜線之能量，其中該等頻譜線之能量於加總之前經過對數化。例如可加總頻譜線能量(E(x(i)))之以10為底的對數(log10)。須注意量化前頻譜線之實際能量(以「E或能量(x(i))」表示)係以已對數化形式加總。也計算所考慮之頻譜線數目。如此，於執行演繹法則600之第二部分620後，變數nf指示量化前已識別之頻譜線能之對數和，變數n描述已識別之頻譜線數目。

演繹法則600也包含量化值nf之第三部分630，亦即已識別之頻譜線之對數和。可使用如前文說明或如第6圖所示之映射方程式。

根據第7圖之方法

第7圖顯示用於基於音訊信號之輸入頻譜表示型態，提供音訊信號之雜訊已填充之頻譜表示型態之方法之流程圖。第7圖之方法700包含一步驟710，識別與一音訊信號之一輸入頻譜表示型態間隔至少一個中間頻譜區之該輸入表示型態之頻譜區，來獲得已識別之頻譜區。方法700也包含一步驟720，將雜訊選擇性導入已識別之頻譜區來獲得音訊信號之雜訊已填充之頻譜表示型態。

方法700可藉此處參考本發明之雜訊填充器之任何特徵及功能補充。

根據第8圖之方法

第8圖顯示用於基於一音訊信號之已量化頻譜表示型態提供雜訊填充參數之方法之流程圖。方法800包含一步驟810，識別與一音訊信號之一輸入頻譜表示型態間隔至少一個中間頻譜區之該輸入表示型態之頻譜區，來獲得已識別之頻譜區。方法800也包含一步驟820，選擇性考慮已識別之頻譜區之量化誤差用於該填充參數之計算。

方法800可藉此處就雜訊填充參數計算器之任何特徵及功能補充。

第9圖之音訊信號表示型態

第9圖顯示根據本發明之實施例，一音訊信號表示型態之線圖代表圖。音訊信號表示型態900例如可構成輸入頻譜表示型態110之基礎。音訊信號表示型態900也利用已編碼音訊信號表示型態212之功能。音訊信號表示型態900可使用雜訊填充參數計算器500獲得，其中音訊信號表示型態900例如包含音訊信號之已量化頻譜表示型態510及雜訊填充參數512，例如二者皆呈編碼形式。

換言之，已編碼之音訊信號表示型態900可表示音訊信號。已編碼之音訊信號表示型態900包含音訊信號之已編碼已量化頻譜域表示型態，也包含已編碼雜訊填充參數。該雜訊填充參數表示量化為零之頻譜域表示型態之頻譜區之量化誤差，且與量化為非零之頻譜域表示型態之頻譜區間隔至少一個中間頻譜區。

當然音訊信號表示型態900可藉前述任何資訊補充。

實務替代之道

依據某些實務要求而定，本發明之實施例可於硬體或軟體實施。該實務可使用數位儲存媒體執行，例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體，有可電子式讀取之控制信號儲存於其上，且與可程式電腦系統協力(或可協力)因而執行個別方法。

根據本發明之若干實施例包含具有可電子式讀取控制信號之資料載體，該等信號可與可規劃電腦系統協力合作，因而可執行此處所述之方法之一。

通常，本發明實施例可以具有程式碼之電腦程式產品實施，該程式碼可運算用於當該電腦程式產品於電腦上跑時執行該等方法之一。

該程式碼例如可儲存於可機器讀取載體上。

其它實施例包含儲存於一可機器讀取載體上用於執行此處所述方法之一之電腦程式。

換言之，本發明方法之一實施例為一電腦程式其具有一程式碼，當該電腦程式於電腦上跑時該程式碼用於執行此處所述之方法之一。

本發明方法之又一實施例為一資料載體(或一數位儲存媒體)包含可用於執行此處所述方法中之一者之電腦程式。

因而本發明方法之又一實施例為一資料流或信號序列表示用於執行此處所述方法之一之該電腦程式。資料流或信號序列例如可配置來透過資料通訊連結例如透過網際網路傳輸。

又一實施例包含配置來或自適應於執行此處所述方法中之一者之一種處理裝置，例如電腦或可程式邏輯裝置。

又一實施例包含一電腦，其上安裝用於執行此處所述方法之一之電腦程式。

於若干實施例中，可程式邏輯裝置(例如場可規劃閘極陣列)可用來執行此處所述方法之部分或全部功能。於若干實施例中，場可規劃閘極陣列可與微處理器協力合作來執行此處所述方法中之一者。

結論

綜上所述，當於編碼器端運算雜訊填充參數，及於解碼器端應用雜訊二者時，經由考慮輸入信號特性及已解碼信號特性，本發明加強音訊編碼工具「雜訊填充」。於本發明之實施例中，零量化頻譜線之調性/雜訊度經估計且用於估計雜訊底位準。然後此雜訊底位準傳送至解碼器，解碼器將該雜訊填充應用至出現於頻譜特定區之零量化值。此等區係基於已解碼頻譜特性選定。

有關本發明之上下文，發現本發明使用於MDCT上之定標量化應用於基於轉換之編碼。MDCT係數先前係藉基於感官線索計算得之資訊而規度化。經由如同於AMR-WB+之TCX模式(參考參考文獻[1])進行，藉加權LPC係數，由LPC(線性預測編碼)分析階段可推定該曲線。由已加權係數，設計感官加權濾波器且於MDCT之前應用。也於反相MDCT之後，於解碼器端應用反相濾波器。本反相感官加權濾波器成形量化雜訊因而最小化或遮蔽所察覺的雜訊。

於根據本發明之實施例，克服先前技術之問題。習知，只考慮基於頻譜封包臨界值、遮蔽臨界值、或能量臨界值，雜訊填充以系統性方式應用於零量化值。先前技術既未考慮輸入信號特性，也未考慮已解碼信號特性。如此，習知裝置可導入非期望的額外假信號，特別為雜訊假信號而抵消此種工具之優點。

相反地，根據本發明之實施例允許如前文討論獲得具有減少的假信號之一種改良式雜訊填充。

參考文獻：

[1]“Extended Adaptive Multi-Rate-Wideband(AMR-WB+)codec”,3GPP TS 26.290 V6.3.0,2005-06,Technical Specification

[2]Ragot et al,“ITU-T G.729.1：AN 8-32 Kbit/S Scalable Coder Interoperable with G.729 for Wideband Telephony and Voice Over IP”,Vol.4,ICASSP 07,15-20 April 2007

[3]“AUDIO CODING”,International Application No.：PCT/IB2002/001388,Applicant：KONINKLIJKE PHILIPS ELECTRONICS N.V.[NL/NL]；Groenewoudseweg 1 NL-5621 BA Eindhoven(NL).Inventors：TAORI,Rakesh；Prof Holstlaan 6 NL-5656 AA Eindhoven(NL)and VAN DE PAR,Steven,L.,J.,D.,E.；Prof.Holstlaan 6 NL-5656 AA Eindhoven(NL).

[4]Generic Coding of Moving Pictures and Associated Audio：Advanced Audio Coding.International Standard 13818-7,ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group,1997.

100．．．雜訊填充器

110．．．輸入頻譜表示型態

112．．．雜訊已填充之頻譜表示型態

120．．．頻譜區識別器

122．．．指示已識別之頻譜區之資訊

130．．．雜訊插入器

200．．．音訊信號解碼器

212．．．已解碼之音訊信號表示型態

214．．．選擇性地經反相之已量化表示型態、已解碼表示型態

220．．．雜訊因數擷取器

222．．．雜訊因數資訊

230．．．頻譜整形器

232．．．已重建之頻譜表示型態

234．．．頻譜資訊

240．．．頻譜域至時域變換器

242．．．時域音訊信號表示型態

300．．．演繹法則

310．．．第一部分

320．．．第二部分、程式碼部分

330．．．第三部分

400．．．圖解表示型態

410．．．橫座標說明頻譜線頻率

412．．．縱座標說明頻譜線強度

420a-d．．．頻譜線

422a-k．．．頻譜線

500．．．雜訊填充參數計算器

510．．．已量化之頻譜表示型態

512．．．雜訊填充參數

520．．．頻譜區識別器

522．．．資訊

530．．．雜訊值計算器

532．．．量化誤差資訊

540．．．量化器

542‧‧‧未經量化之頻譜表示型態

600‧‧‧虛擬程式碼、演繹法則

610‧‧‧第一部分

620‧‧‧第二部分

630‧‧‧第二部分

700‧‧‧方法

710、720‧‧‧步驟

800‧‧‧方法

810、820‧‧‧步驟

900‧‧‧音訊信號表示型態、已編碼之音訊信號表示型態

第1圖顯示根據本發明之實施例，雜訊填充器之方塊示意圖；第2圖顯示包含根據本發明之雜訊填充器之音訊信號解碼器之方塊示意圖；第3圖顯示用於實施第1圖之雜訊填充器之功能之虛擬程式碼；第4圖顯示可於根據第1圖之雜訊填充器進行之頻譜區識別之圖解代表圖；第5圖顯示根據本發明之實施例，雜訊填充參數計算器之方塊示意圖；第6圖顯示用於實施根據第5圖之雜訊填充參數計算器之功能之虛擬程式碼；第7圖顯示用於基於音訊信號之輸入頻譜表示型態，提供音訊信號之雜訊已填充之頻譜表示型態之方法之流程圖；第8圖顯示用於基於音訊信號之量化頻譜表示型態提供已雜訊化填充參數之流程圖；及第9圖顯示根據本發明之實施例，音訊信號表示型態之圖解代表圖。