TWI503815B

TWI503815B - 用以利用正弦代換進行音訊編碼及解碼之裝置和方法

Info

Publication number: TWI503815B
Application number: TW102102004A
Authority: TW
Inventors: Sascha Disch; Benjamin Schubert; Ralf Geiger; Martin Dietz
Original assignee: Fraunhofer Ges Forschung
Priority date: 2012-01-20
Filing date: 2013-01-18
Publication date: 2015-10-11
Also published as: US9343074B2; JP2014517932A; CN103493130A; EP2673776B1; RU2562383C2; MY157163A; AU2012366843B2; ES2545053T3; HK1192640A1; CA2848275A1; RU2013148123A; EP2673776A1; AU2012366843A1; BR112013026452A2; PL2673776T3; CN103493130B; SG194706A1; KR101672025B1; KR20130137235A; MX2013012409A

Description

用以利用正弦代換進行音訊編碼及解碼之裝置和方法

本發明係關於音訊信號編碼、解碼及處理，且更具體而言，係關於利用正弦代換進行音訊編碼及解碼。

音訊信號處理變得愈來愈重要。隨著數據機感知音訊編解碼器被要求以愈來愈低之位元率傳送令人滿意的音訊品質，挑戰產生了。另外，可允許之等待時間通常亦非常低，例如對於雙向通訊應用或分散式遊戲等而言。

數據機音訊編解碼器，例如USAC(統一話音及音訊寫碼)，通常在時域預估寫碼與變換域寫碼之間切換，然而，音樂內容仍主要於變換域中寫碼。在低位元率下，例如<14 kbit/s，音樂項中之音調分量在經由變換寫碼器寫碼時通常聽起來較差，此情形使得以充足品質寫碼音訊之任務更具挑戰性。

另外，低延遲約束通常導致變換寫碼器之濾波器組的次佳頻率響應(歸因於經低延遲最佳化之窗形狀及/或變換長度)，且因此進一步危害此等編解碼器之感知品質。

根據典型心理聲學模型，界定相對於量化雜訊之透明性的前提。在高位元率下，透明性係關於遵循人類聽覺遮蔽位準之量化雜訊之感知上適應的最佳時間/頻率分佈。然而，在低位元率下，無法到達透明性。因此，可在低位元率下利用降低遮蔽位準要求之策略。

已將頂尖編解碼器用於音樂內容，具體而言，基於修正型離散餘弦變換(Modified Discrete Cosine Transform，MDCT)之變換寫碼器，其量化並在頻域中傳輸頻譜係數。然而，在極低資料率下，每一時間框之僅非常少的頻譜線可由該時間框之可利用的位元寫碼。因此，時間調變異物(artifact)及所謂的顫音異物必然被引入經寫碼之信號中。

最重要的是，此等類型之異物係在準靜態音調分量中被感知。此情形尤其在歸因於延遲約束而必須選擇因熟知的洩露效應而引起鄰近頻譜係數之間的顯著串音(頻譜寬化)的變換窗形狀。然而，通常此等鄰近頻譜係數中之一者或少數幾者在低位元率寫碼器進行之粗略量化之後仍為非零。

如上文所述，在先前技術中，利用變換寫碼器。非常適合音樂內容之寫碼的當代高壓縮比率音訊編解碼器全部依靠變換寫碼。最顯著的實例為MPEG2/4高級音訊寫碼(Advanced Audio Coding，AAC)及MPEG-D統一話音及音訊寫碼(Unified Speech and Audio Coding，USAC)。USAC具有與代數碼激發之線性預測(Algebraic Code Excited Linear Prediction，ACELP)模組加上主要意在用於話音寫碼之經變換寫碼激發(Transform Coded Excitation，TCX)模組 (見[5])及或者主要意在用於音樂之寫碼的AAC一致的經切換核心。類似於AAC，TCX亦為基於變換之寫碼方法。在低位元率設定下，此等寫碼方案易於展現顫音異物，尤其在下面的寫碼方案係基於修正型離散餘弦變換(MDCT)(見[1])之情況下。

對於音樂再製，變換寫碼器為用於音訊資料壓縮之較佳技術。然而，在低位元率下，傳統變換寫碼器展現強顫音及粗糙度異物。該等異物之大部分源自過於稀疏寫碼之音調頻譜分量。此情形尤其在此些分量在頻譜上被主要設計用來滿足嚴苛延遲約束之次佳頻譜轉移函數(洩露效應)抹汙之情況下發生。

根據先前技術中之另一方法，寫碼方案對於暫態、正弦波及雜訊而言為完全參數化的。具體而言，對於中等及低位元率，完全參數化音訊編解碼器已經標準化，其最顯著實例為MPEG-4部分3，分部分7，諧波及個別線加雜訊(Harmonic and Individual Lines plus Noise，HILN)(見[2])，以及MPEG-4部分3，分部分8，正弦寫碼(SinuSoidal Coding，SSC)(見[3])。然而，參數化寫碼器遭受具有令人不快之異物的聲音，且隨著位元率增加，向感知透明度按比例縮放得並不好。

另一方法提供混合波形及參數化寫碼。在[4]中，提出基於變換之波形寫碼與MPEG 4-SSC(僅正弦部分)的混合。在反復過程中，自信號提取並減除正弦波，以形成將要藉助變換寫碼技術寫碼之殘餘信號。所提取之正弦波由一組參數寫碼，並連同該殘餘一起傳輸。在[6]中，提供混合寫碼方法，該方法分別對正弦波及殘餘進行寫碼。在中[7]，在所謂的受約束能量重疊變換(Constrained Energy Lapped Transform，CELT)編解碼器/重影網頁處，描繪利用振盪器組來進行混合寫碼的理念。

在中等或較高位元率下，歸因於其自然聲音，變換寫碼器非常適合音樂之寫碼。在那點上，完全或幾乎完全滿足基本心理聲學模型之透明度要求。然而，在低位元率下，寫碼器不得不嚴重違反心理聲學模型之要求，且在此情形下，變換寫碼器易出現顫音、粗糙度及音樂雜訊異物。

儘管完全參數化音訊編解碼器最適合較低位元率，但已知該等編解碼器聽起來具有令人不快的異物。此外，此等編解碼器並不無縫地向感知透明度按比例縮放，因為相當粗糙參數化模型之逐漸細化並不可行。

混合式波形與參數化寫碼可潛在地克服個別方法之限制，且可潛在地受益於兩種技術之相互正交性質。然而，在當前技術水平下，此舉因混合編解碼器之變換寫碼部分與參數化部分之間缺乏相互作用而受阻。問題係關於參數化編解碼器部分與變換編解碼器部分之間的信號劃分、變換部分與參數化部分之間的位元預算操縱、參數信令技術以及參數化與變換編解碼器輸出之無縫合併。

本發明之目標在於為混合音訊編碼及解碼提供改進之概念。本發明之目標由如請求項1之裝置、如請求項12之裝置，如請求項29之方法、如請求項30之方法以及如請求項31之電腦程式來解決。

本發明提供一種用於基於經編碼之音訊信號頻譜來產生音訊輸出信號的裝置。

該裝置包含處理單元，其用於處理經編碼音訊信號頻譜以獲得經解碼音訊信號頻譜。該經解碼音訊信號頻譜包含多個頻譜係數，其中該等頻譜係數中之每一者具有一在該經編碼音訊信號頻譜內的頻譜位置以及一頻譜值，其中該等頻譜係數根據其在該經編碼音訊信號頻譜內之頻譜位置而依序排序，使得該等頻譜係數形成頻譜係數序列。

此外，該裝置包含偽係數判定器，其用於判定該經解碼音訊信號頻譜之一或多個偽係數，該等偽係數中之每一者具有頻譜位置及頻譜值。

另外，該裝置包含頻譜修正單元，其用於將該一或多個偽係數設定為預定義值，以獲得經修正音訊信號頻譜。

此外，該裝置包含頻譜-時間轉換單元，其用於將該經修正音訊信號頻譜轉換至時域，以獲得時域轉換信號。

另外，該裝置包含可控振盪器，其用於產生時域振盪器信號，該可控振盪器由該一或多個偽係數中之至少一者的頻譜位置及頻譜值控制。

此外，該裝置包含混頻器，其用於混合該時域轉換信號與該時域振盪器信號，以獲得音訊輸出信號。

所提出之概念增強了習知的基於塊的變換編解碼器在低位元率下的感知品質。提出用在一些實施例中具有與將代換之區類似的能量或位準之偽線(亦稱為偽係數)代換音訊信號頻譜中的局部音調區，從而跨越相鄰局部最小值，包含局部最大值。

根據若干實施例，提供低延遲及低位元率音訊寫碼。一些實施例為基於稱為音調填充(ToneFilling，TF)之新穎且具發明性的概念。術語音調填充表示一種寫碼技術，其中原本被惡劣寫碼之自然音調由感知上類似但較純的正弦音調代替。藉此，避免了某一速率下的振幅調變異物(稱為「顫音」)，其取決於正弦波相對於最近MDCT頻率組之頻譜位置的頻譜位置。

根據若干實施例，對所有可想像的異物的惱人程度進行加權。此舉涉及感知態樣，例如間距(pitch)、諧度(harmonicity)、調變以及異物之靜止。所有態樣均在聲音感知惱人模型(Sound Perception Annoyance Model，SPAM)中評估。

由此模型操縱，音調填充提供足夠優勢。對照由稀疏量化之自然音調引起之加成性雜訊及不良穩定性(「顫音」)的影響來對因用純正弦音調代替自然音調而引入之間距及調變誤差進行加權。

音調填充提供與正弦波加雜訊編解碼器的顯著差異。舉例而言，TF用正弦代換音調，而不是正弦波的減除。感知上類似的音調具有與將代換之原始聲音分量相同的局部重心(Centers Of Gravity，COG)。根據若干實施例，在音訊頻譜中抹除原始音調(COG函數之左足至右足)。通常，用於代換之正弦波的頻率解析度盡可能粗略以最小化旁資訊，同時考慮感知要求以避免調外感覺(out-of-tune sensation)。

在一些實施例中，可歸因於該等感知要求而在較低截止頻率之上但不在該較低截止頻率之下進行音調填充。當進行音調填充時，經由變換寫碼器內的頻譜偽線來表示音調。然而，在配備有音調填充之編碼器中，偽線經受由典型心理聲學模型控制的常規處理。因此，當進行音調填充時，不需要參數化部分(在位元率x下，代換y個音調分量)的先驗限制。因此，達成至變換編解碼器中的緊湊整合。

可在編碼器處藉由偵測局部COG(經平滑估計；峰品質量度)、藉由移除音調分量、藉由產生經由偽線之振幅運載位準資訊、經由偽線之頻譜位置運載頻率資訊且經由偽線之正負號運載精細頻率資訊(半頻率組偏移)的經代換偽線(例如偽係數)來使用音調填充功能性。正如任何常規頻譜係數(頻譜線)，偽係數(偽線)由編解碼器之後續量化器單元處置。

可另外在解碼器處藉由偵測經隔離頻譜線來使用音調填充，其中真實偽係數(偽線)可由旗標陣列(例如位元欄位)標記。解碼器可連結偽線資訊來建立正弦軌道。可使用出生/持續/死亡方案來合成連續軌道。

為了解碼，可藉由在旁資訊內傳輸之旗標陣列將偽係數(偽線)如此標記。偽線之半頻率組頻率解析度可由偽係數(偽線)之正負號表示。在解碼器處，可在逆變換單元之前將偽線自頻譜抹除，且藉由一排振盪器來單獨地合成該等偽線。隨著時間的過去，可連結若干對振盪器，且使用參數內插來確保平滑漸進之振盪器輸出。

可對參數驅動之振盪器的開始及偏移進行整型，使得其嚴密對應於變換編解碼器之視窗操作的時間特性，從而確保變換輸出信號之編解碼器所產生部分與振盪器所產生部分之間的無縫轉變。

所提供之概念合意且輕鬆地整合至如AAC、TCX或類似組配等現存變換寫碼方案中。參數量化精度之操縱可由編解碼器之現存速率控制來隱含地執行。

根據一實施例，該等頻譜係數中之每一者可具有最接近前任者及最接近後繼者中的至少一者，其中該頻譜係數之該最接近前任者可為該等頻譜係數中的在該頻譜係數序列內緊接該頻譜係數之前的一個頻譜係數，其中該頻譜係數之該最接近後繼者可為該等頻譜係數中的在該序列中緊接該頻譜係數之後的一個頻譜係數。偽係數判定器可經組配來藉由判定該序列之具有不同於該預定義值的頻譜值的至少一頻譜係數來判定該經解碼音訊信號頻譜之該一或多個頻譜係數，該至少一頻譜係數具有最接近前任者，該最接近前任者之頻譜值等於該預定義值，且該至少一頻譜係數具有最接近後繼者，該最接近後繼者之頻譜值等於該預定義值。

在一實施例中，該預定義值可為零。

根據一實施例，偽係數判定器可經組配來藉由判定該序列之至少一頻譜係數為偽係數候選者來判定該經解碼音訊信號頻譜之該一或多個偽係數，該至少一頻譜係數具有最接近前任者，該最接近前任者之頻譜值等於該預定義值，且該至少一頻譜係數具有最接近後繼者，該最接近後繼者之頻譜值等於該預定義值。偽係數判定器可經組配來藉由判定旁資訊是否指示該偽係數候選者為偽係數來判定該偽係數候選者為偽係數。

在一實施例中，可控振盪器可經組配來產生具有振盪器信號頻率之時域振盪器信號，使得該振盪器信號之振盪器信號頻率取決於該一或多個偽係數中之一者的頻譜位置。

在一些實施例中，藉由進行兩個或兩個以上時間上連續的偽係數之頻譜位置之間的內插來產生振盪器信號之信號頻率。

根據一實施例，偽係數為帶正負號的值，其各自包含正負號分量。可控振盪器可經組配來產生時域振盪器信號，使得振盪器信號之振盪器信號頻率另外取決於該一或多個偽係數中之一者的正負號分量，使得當該正負號分量具有第一正負號值時，振盪器信號頻率具有第一頻率值，且使得當該正負號分量具有不同第二值時，振盪器信號頻率具有不同第二頻率值。

在一實施例中，可控振盪器可經組配來產生時域振盪器信號，其中該振盪器信號之振幅取決於該一或多個偽係數中之一者的頻譜值，使得當頻譜值具有第三值時，該振盪器信號之振幅具有第一振幅值，且使得當頻譜值具有不同第四值時，該振盪器信號之振幅具有不同第二振幅值，當該第四值大於該第三值時，該第二振幅值大於該第一振幅值。

根據一些實施例，藉由在兩個或兩個以上時間上連續的偽係數之頻譜值之間進行內插來產生振盪器信號之振幅值。舉例而言，藉由在傳輸值的時間點之間進行內插來產生振盪器信號的振幅。

在一實施例中，可控振盪器另外經由自在前框之偽係數得出的經外插參數控制，以便例如抵消傳輸期間的資料框損失，或平滑振盪器控制的不穩定行為。

根據一些實施例，藉由在兩個或兩個以上偽係數之頻譜值之間進行內插來產生振盪器信號之振幅值。舉例而言，在一些實施例中，藉由在傳輸值的時間點之間進行內插來產生振盪器信號之振幅。

根據一實施例，經修正音訊信號頻譜可為MDCT頻譜，其包含MDCT係數。頻譜-時間轉換單元可經組配來藉由將經解碼音訊信號頻譜之係數中之至少一些係數轉換至時域來將MDCT頻譜自MDCT域轉換至時域。

在一實施例中，混頻器經組配來藉由在時域中使時域轉換信號與時域振盪器信號相加來混合時域轉換信號與時域振盪器信號。

此外，提供一種用於編碼音訊信號輸入頻譜的裝置。該音訊信號輸入頻譜包含多個頻譜係數，其中該等頻譜係數中之每一者具有在該音訊信號輸入頻譜內的頻譜位置以及頻譜值，其中該等頻譜係數根據其在音訊信號輸入頻譜內的頻譜位置而依序排序，使得該等頻譜係數形成頻譜係數序列。該等頻譜係數中之每一者具有之至少一者具有一或多個前任者中的至少一者且具有一或多個後繼者中的至少一者，其中該頻譜係數之前任者中之每一者為該等頻譜係數中之在該序列內在該頻譜係數之前的一個頻譜係數。該頻譜係數之後繼者中之每一者為該等頻譜係數中之在該序列內在該頻譜係數之後的一個頻譜係數。

該裝置包含極值判定器，其用於較佳以如由基本時間-頻率變換提供之較高頻譜解析度判定一或多個極值係數。

舉例而言，該音訊信號輸入頻譜可為具有多個MDCT係數之MDCT頻譜。

極值判定器可判定比較頻譜上之該或該等極值，其中將比較頻譜之係數的比較值指派給MDCT頻譜之MDCT係數中的每一者。然而，比較頻譜可具有高於音訊信號輸入頻譜的頻譜解析度。舉例而言，比較頻譜可為離散傅立葉變換(Discrete Fourier Transform，DFT)頻譜(偶數或奇數堆疊之DFT)，其頻譜解析度為MDCT音訊信號輸入頻譜之頻譜解析度的兩倍。藉此，接著僅將DFT頻譜之每第二個頻譜值指派給MDCT頻譜之頻譜值。然而，當判定比較頻譜之該或該等極值時，可考慮比較頻譜之其他係數。藉此可將比較頻譜之係數判定為不指派給音訊信號輸入頻譜之頻譜係數但具有最接近前任者及最接近後繼者的極值，該最接近前任者及最接近後繼者分別指派給音訊信號輸入頻譜之頻譜係數及音訊信號輸入頻譜之該頻譜係數的最接近後繼者。因此，可認為比較頻譜之(例如高解析度DFT頻譜之)該極值指派給(MDCT)音訊信號輸入頻譜內位於(MDCT)音訊信號輸入頻譜之該頻譜係數與(MDCT)音訊信號輸入頻譜之該頻譜係數之該最接近後繼者之間的頻譜位置。可藉由選擇如稍後闡釋之偽係數的恰當正負號值來編碼此情形。藉此，達成次頻率組解析度。

此外，該裝置包含頻譜修正器，其用於藉由將極值係數中之至少一者的前任者中的至少一者或後繼者中的至少一者的頻譜值設定為預定義值來修正音訊信號輸入頻譜以獲得經修正音訊信號頻譜。此外，頻譜修正器經組配來不將一或多個極值係數之頻譜值設定為該預定義值，或經組配來用偽係數代替該一或多個極值係數中的至少一者，其中該偽係數之頻譜值不同於該預定義值。

另外，該裝置包含處理單元，其用於處理該經修正音訊信號頻譜，以獲得經編碼音訊信號頻譜。

此外，該裝置包含旁資訊產生器，其用於產生並傳輸旁資訊，其中該旁資訊產生器經組配來定位由該頻譜修正器產生之經修正音訊信號輸入頻譜內的一或多個偽係數候選者，其中該旁資訊產生器經組配來選擇該等偽係數候選者中的至少一者作為選定候選者，且其中該旁資訊產生器經組配來產生旁資訊，使得該旁資訊指示選定候選者為偽係數。

極值判定器經組配來較佳以如由基本時間-頻率變換提供之較高頻譜解析度判定一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，該頻譜係數之頻譜值大於其前任者中的至少一者的頻譜值，且該頻譜係數之頻譜值大於其後繼者中的至少一者的頻譜值。或者，該等頻譜係數中之每一者具有與該頻譜係數相關聯的比較值，其中極值判定器經組配來判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，該頻譜係數之比較值大於其前任者中的至少一者的比較值，且該頻譜係數之比較值大於其後繼者中的至少一者的比較值。

根據若干實施例，由旁資訊產生器產生之旁資訊可為靜態預定義大小，或其大小可以信號適應方式反復估計。在此情況下，亦將旁資訊之實際大小傳輸給解碼器。因此，根據一實施例，旁資訊產生器440經組配來傳輸旁資訊之大小。

在一實施例中，頻譜修正器經組配來修正音訊信號輸入頻譜，使得該音訊信號輸入頻譜之頻譜係數中之至少一些頻譜係數的頻譜值在經修正音訊信號頻譜中獲保留未修正。

根據一實施例，該等頻譜係數中之每一者具有作為其前任者中之一者的最接近前任者及作為其後繼者中之一者的最接近後繼者中之至少一者，其中該頻譜係數之最接近前任者為該等頻譜係數中的在該序列內緊接該頻譜係數之前的一個頻譜係數，其中該頻譜係數之最接近後繼者為該等頻譜係數中的在該序列內緊接該頻譜係數之後的一個頻譜係數。

頻譜修正器可經組配來藉由將極值係數中之一者的最接近前任者或最接近後繼者之頻譜值設定為預定義值來修正音訊信號輸入頻譜以獲得經修正音訊信號頻譜，其中頻譜修正器可經組配來不將一或多個極值係數之頻譜值設定為該預定義值，或可經組配來用偽係數代替該一或多個極值係數中的至少一者，其中該偽係數之頻譜值不同於該預定義值。應注意，當極值判定器基於比較頻譜(例如功率頻譜)判定極值係數時，可例如為比較頻譜(例如功率頻譜)之局部最大值的頻譜係數不必為音訊信號輸入頻譜(例如MDCT頻譜)的局部最大值。

極值判定器可經組配來判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中的一個頻譜係數，該頻譜係數之頻譜值大於其最接近前任者之頻譜值，且該頻譜係數之頻譜值大於其最接近後繼者之頻譜值。或者該等頻譜係數中之每一者具有與該頻譜係數相關聯的比較值，且極值判定器可經組配來判定一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中的一個頻譜係數，該頻譜係數之比較值大於其最接近前任者之比較值，且該頻譜係數之比較值大於其最接近後繼者之比較值。

根據一實施例，極值判定器可經組配來判定一或多個最小係數，使得該一或多個最小係數中之每一者為該等頻譜係數中的一個頻譜係數，該頻譜係數之頻譜值小於其前任者中之一者的頻譜值，且該頻譜係數之頻譜值小於其後繼者中之一者的頻譜值，或其中該等頻譜係數中之每一者具有與該頻譜係數相關聯的比較值，其中該極值判定器經組配來判定該一或多個最小係數，使得該等最小係數中之每一者為該等頻譜係數中的一個頻譜係數，該頻譜係數之比較值小於其前任者中之一者的比較值，且該頻譜係數之比較值小於其後繼者中之一者的比較值。在此實施例中，頻譜修正器可經組配來基於該等極值係數中之一或多者或該等最小係數中之一或多者的頻譜值或比較值判定表示值，使得該表示值不同於該預定義值。另外，頻譜修正器可經組配來藉由將該頻譜值設定為該表示值來改變該音訊信號輸入頻譜之係數中之一者的頻譜值。

根據一實施例，頻譜修正器可經組配來判定該等極值係數中之一者之比較值或頻譜值中的一者之間的值差是否小於臨界值。此外，頻譜修正器可經組配來修正音訊信號輸入頻譜，使得取決於該值差是否小於該臨界值，音訊信號輸入頻譜之頻譜係數中的至少一些的頻譜值在經修正音訊信號頻譜中獲保留未修正。

在一實施例中，極值判定器可經組配來判定頻譜值序列之一或多個子序列，使得該等子序列中之每一者包含該音訊信號輸入頻譜之多個後續頻譜係數，該等後續頻譜係數可在該子序列內根據其頻譜位置依序排序。該等子序列中之每一者可具有在依序排序之子序列中位於第一的第一元素，以及在依序排序之子序列中位於最後的最後元素。此外，該等子序列中之每一者可包含最小係數中之恰好兩者以及極值係數中之恰好一者，最小係數中之一者為該子序列之該第一元素，且最小係數中之另一者為該子序列之該最後元素。在此實例中，頻譜修正器可經組配來基於該等子序列中之一者的極值係數的頻譜值或比較值來判定表示值。頻譜修正器可經組配來藉由將該頻譜值設定為該表示值來改變該子序列之係數中之一者的頻譜值。

根據一實施例，極值判定器可經組配來藉由以下步驟判定重心係數：藉由判定該子序列之每一頻譜係數之比較值與位置值的乘積以獲得多個經加權係數，藉由對該等經加權係數進行求和以獲得第一總和，對該子序列之所有頻譜係數之比較值進行求和以獲得第二總和；藉由使第一總和除以第二總和以獲得中間結果；以及藉由對該中間結果應用捨位至最近捨位以獲得重心係數，且其中頻譜修正器經組配來將子序列之並非重心係數之所有頻譜係數之頻譜值設定為預定義值。或者，極值判定器可經組配來藉由以下步驟判定重心係數：藉由判定子序列之每一頻譜係數之頻譜值與位置值的乘積以獲得多個經加權係數，藉由對經加權係數進行求和以獲得第一總和，對子序列之所有頻譜係數之頻譜值進行求和以獲得第二總和；藉由使第一總和除以第二總和以獲得中間結果；以及藉由對該中間結果應用捨位至最近捨位以獲得重心係數，且其中頻譜修正器經組配來將子序列之並非該重心係數之所有頻譜係數之頻譜值設定為預定義值。

在一實施例中，該預定義值為零。

根據一實施例，每一頻譜係數之比較值為自音訊信號之能量保存變換得出之另一頻譜之另一係數的平方值。

在一實施例中，其中每一頻譜係數之比較值為自音訊信號之能量保存變換得出之另一頻譜之另一係數的振幅值。

根據一實施例，該另一頻譜為離散傅立葉變換(DFT)頻譜，且其中該能量保存變換為離散傅立葉變換(偶數或奇數堆疊之DFT)。

根據另一實施例，該另一頻譜為複雜修正型離散餘弦變換(CMDCT)頻譜，且其中該能量保存變換為CMDCT。

根據一實施例，頻譜修正器可經組配來接收微調資訊。音訊信號輸入頻譜之係數可為帶正負號的值，其各自包含正負號分量。當微調資訊處於第一微調狀態時，頻譜修正器可經組配來將一或多個極值係數中之一者之或偽係數之頻譜值的正負號分量設定為第一正負號值。且當微調資訊處於不同第二微調狀態時，頻譜修正器可經組配來將一或多個極值係數中之一者之或偽係數之頻譜值的正負號分量設定為不同第二正負號值。

在一實施例中，音訊信號輸入頻譜可為包含MDCT係數之MDCT頻譜。

根據一實施例，處理單元可經組配來量化經修正音訊信號頻譜以獲得經量化音訊信號頻譜。處理單元可進一步經組配來處理經量化音訊信號頻譜以獲得經編碼音訊信號頻譜。此外，處理單元可進一步經組配來產生旁資訊，其僅對經量化音訊信號頻譜之具有最接近前任者及最接近後繼者的彼等頻譜係數指示該係數是否為極值係數中的一者，該最接近前任者之頻譜值等於預定義值，且該最接近後繼者之頻譜值等於預定義值。頻譜係數之最接近前任者為在經量化音訊信號頻譜內緊接該頻譜係數之前的另一頻譜係數，且其中頻譜係數之最接近後繼者為在經量化音訊信號頻譜內緊接該頻譜係數之後的另一頻譜係數。

此外，提供一種用於基於經編碼音訊信號頻譜產生音訊輸出信號的方法。頻譜係數中之每一者具有一在該經編碼音訊信號頻譜內的頻譜位置以及一頻譜值，其中該等頻譜係數根據其在經編碼音訊信號頻譜內的頻譜位置而依序排序，使得該等頻譜係數形成頻譜係數序列。該用於產生音訊輸出信號的方法包含：

- 處理經編碼音訊信號頻譜以獲得經解碼音訊信號頻譜，該經解碼音訊信號頻譜包含多個頻譜係數。

- 判定經解碼音訊信號頻譜之一或多個偽係數，該等偽係數中之每一者具有頻譜位置及頻譜值。

- 將一或多個偽係數設定為預定義值，以獲得經修正音訊信號頻譜。

- 將經修正音訊信號頻譜轉換至時域，以獲得時域轉換信號。

- 藉由可控振盪器產生時域振盪器信號，該可控振盪器由一或多個偽係數中之至少一者的頻譜位置及頻譜值控制。以及：

- 混合時域轉換信號與時域振盪器信號，以獲得音訊輸出信號。

此外，提供一種用於編碼音訊信號輸入頻譜的方法。該音訊信號輸入頻譜包含多個頻譜係數。該等頻譜係數中之每一者具有一在該音訊信號輸入頻譜內的頻譜位置、一頻譜值及一比較值。該等頻譜係數根據其在該音訊信號輸入頻譜內的頻譜位置而依序排序，使得該等頻譜係數形成頻譜係數序列。該等頻譜係數中之每一者具有之至少一者具有一或多個前任者及一或多個後繼者中的至少一者。該頻譜係數之每一前任者為該等頻譜係數中在該序列內在該頻譜係數之前的一個頻譜係數。該頻譜係數之每一後繼者為該等頻譜係數中在該序列內在該頻譜係數之後的一個頻譜係數。該用於編碼音訊信號輸入頻譜的方法包含：

- 判定一或多個極值係數。

- 藉由將該等極值係數中的至少一者的前任者中的至少一者或後繼者中的至少一者的頻譜值設定為預定義值來修正音訊信號輸入頻譜以獲得經修正音訊信號頻譜，其中藉由不將一或多個極值係數之頻譜值設定為預定義值，或藉由用偽係數代替一或多個極值係數中的至少一者來進行修正該音訊信號輸入頻譜，其中該偽係數之頻譜值不同於該預定義值。

- 處理經修正音訊信號頻譜以獲得經編碼音訊信號頻譜。以及：

- 產生並傳輸旁資訊，其中藉由定位經修正音訊信號輸入頻譜內的一或多個偽係數候選者來產生旁資訊，其中藉由選擇偽係數候選者中的至少一者作為選定候選者來產生旁資訊，且其中產生旁資訊以使得該旁資訊指示該等選定候選者作為偽係數。

判定一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，該頻譜係數之頻譜值大於其前任者中之至少一者的頻譜值，且該頻譜係數之頻譜值大於其後繼者中之至少一者的該頻譜值。或者，該等頻譜係數中之每一者具有與該頻譜係數相關聯的比較值，其中判定一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，該頻譜係數之比較值大於其前任者中之至少一者的比較值，且該頻譜係數之比較值大於其後繼者中之至少一者的比較值。

此外，提供一種用於在於電腦或信號處理器上執行時實施上文所述方法的電腦程式。

提供一種音訊編碼器、音訊解碼器、相關方法以及程式或經編碼音訊信號。此外，提供用於波形寫碼器之正弦代換的概念。

在低位元率下，本發明提供如何緊湊整合波形寫碼與參數化寫碼來獲得改進的感知品質以及單一技術上之感知品質對位元率之改進定標。

在一些實施例中，頻譜之多峰區域(跨越相鄰局部最小值，包含局部最大值)可完全由單一正弦波代換；與自殘餘物反復減除經合成正弦波的正弦寫碼器形成對比。在經平滑且稍稍白化之頻譜表示上提取合適的多峰區域，且相對於某些特徵(峰高度、峰形狀)來選擇多峰區域。

根據一些實施例，此等代換正弦波可表示為待寫碼頻譜內的偽線(偽係數)，且反映正弦波之全振幅或能量(與之對比，例如常規MDCT線對應於真值的真實投影。

在一些實施例中，正如任何常規頻譜線，偽線(偽係數)可由編解碼器現存量化器來處置；與正弦參數之單獨信令形成對比。

根據一些實施例，偽線(偽係數)可由旁資訊旗標陣列如此標記。

在一些實施例中，偽線之正負號的選擇可表示半次頻帶頻率解析度。

根據一些實施例，歸因於有限的頻率解析度(例如，半次頻帶)，用於正弦代換之較低截止頻率可為可取的。

在一些實施例中，在解碼器中，可將偽線自常規頻譜刪除；偽線合成由一排內插振盪器完成。

在一些實施例中，可使用自在前頻譜之外插獲得的正弦軌道的任擇量測之開始相位。

根據一些實施例，可藉由對正弦軌道之開始/偏移處的頻疊進行建模來使用任擇的時域頻疊消除(Time Domain Alias Cancellation，TDAC)技術。

根據一些實施例，可使用藉由對開始/偏移處的頻疊進行建模來進行之任擇的TDAC頻疊消除。

5、8、25、59、71、83、94、116、141‧‧‧「獨立」係數

55‧‧‧係數

110、430‧‧‧處理單元

112、129、136‧‧‧頻譜係數

120‧‧‧偽係數判定器

130‧‧‧頻譜修正單元

140‧‧‧頻譜-時間轉換單元

150、252、254、256‧‧‧可控振盪器

160‧‧‧混頻器

410‧‧‧極值判定器

420‧‧‧頻譜修正器

440‧‧‧旁資訊產生器

510‧‧‧音訊信號輸入頻譜

511、521‧‧‧橫座標

512、522‧‧‧縱座標

513、514、515‧‧‧虛線

520、620‧‧‧功率頻譜

530‧‧‧經修正(代換)音訊信號頻譜

540‧‧‧經恢復MDCT頻譜

630‧‧‧經修正(代換)MDCT頻譜

635‧‧‧經量化MDCT頻譜

在下文中，參考各圖更詳細地描述本發明之實施例，其中：圖1例示出根據一實施例之用於基於經編碼之音訊信號頻譜來產生音訊輸出信號的裝置，圖2描繪出根據另一實施例之用於基於經編碼之音訊信號頻譜來產生音訊輸出信號的裝置，圖3展示出將原始正弦波與由MDCT/逆MDCT鏈結處理之後的正弦波進行比較的兩個圖，圖4例示出根據一實施例之用於編碼音訊信號輸入頻譜的裝置，圖5描繪出音訊信號輸入頻譜、對應功率頻譜及經修正(經代換)音訊信號頻譜，以及圖6例示出另一功率頻譜、另一經修正(經代換)音訊信號頻譜以及經量化音訊信號頻譜，其中在編碼器側產生之經量化音訊信號頻譜在一些實施例中可對應於在解碼側解碼之經解碼音訊信號頻譜。

圖4例示出根據一實施例之用於編碼音訊信號輸入頻譜的裝置。該用於編碼之裝置包含極值判定器410、頻譜修正器420、處理單元430及旁資訊產生器440。

在更詳細地考慮圖4之裝置之前，更詳細地考慮由圖4之裝置編碼的音訊信號輸入頻譜。

原則上，任何種類之音訊信號頻譜均可由圖4之裝置編碼。音訊信號輸入頻譜可例如為MDCT(修正型離散餘弦變換)頻譜、DFT(離散傅立葉變換)量級頻譜或MDST(修正型離散正弦變換)頻譜。

圖5例示出音訊信號輸入頻譜510之實例。在圖5中，音訊信號輸入頻譜510為MDCT頻譜。

音訊信號輸入頻譜包含多個頻譜係數。該等頻譜係數中之每一者具有在音訊信號輸入頻譜內的頻譜位置以及頻譜值。

考慮圖5之實例，其中音訊信號輸入頻譜因音訊信號之MDCT變換而產生，例如已變換了音訊信號來獲得音訊信號輸入頻譜之濾波器組可例如使用1024個通道。於是，該等頻譜係數中之每一者與1024個通道中之一者相關聯，且可將通道編號(例如，介於0與1023之間的數字)視為該等頻譜係數之頻譜位置。在圖5中，橫座標511代表頻譜係數之頻譜位置。為了更好地例示，圖5僅例示出具有介於 52與148之間的頻譜位置的係數。

在圖5中，縱座標512幫助判定頻譜係數之頻譜值。在圖5之描繪MDCT頻譜(在那點上，音訊信號輸入頻譜之頻譜係數的頻譜值)的實例中，橫座標512代表頻譜係數之頻譜值。應注意，MDCT音訊信號輸入頻譜之頻譜係數可具有正實數及負實數作為頻譜值。

然而，其他音訊信號輸入頻譜可僅具有頻譜值為正或零的頻譜係數。舉例而言，音訊信號輸入頻譜可為DFT量級頻譜，其頻譜係數具有表示因離散傅立葉變換而產生之係數的量級的頻譜值。彼等頻譜值僅能為正或零。

在進一步實施例中，音訊信號輸入頻譜包含頻譜值為複數的頻譜係數。舉例而言，指示量級及相位資訊之DFT頻譜可包含頻譜值為複數的頻譜係數。

如圖5中例示，根據頻譜係數在音訊信號輸入頻譜內之頻譜位置依序對頻譜係數進行排序，使得該等頻譜係數形成頻譜係數序列。該等頻譜係數中之每一者具有一或多個前任者及一或多個後繼者中的至少一者，其中該頻譜係數之每一前任者為該序列內在該頻譜係數之前的頻譜係數中的一者。該頻譜係數之每一後繼者為該序列內在該頻譜係數之後的頻譜係數中的一者。舉例而言，在圖5中，具有頻譜位置81、82或83(等等)之頻譜係數為具有頻譜位置80之頻譜係數的後繼者。具有頻譜位置79、78或77(等等)之頻譜係數為具有頻譜位置80之頻譜係數的前任者。對於MDCT頻譜之實例，頻譜係數之頻譜位置可為MDCT變換之該頻譜係數與之相關的通道(例如，介於例如0與1023之間的通道編號)。再次應注意，出於例示性目的，圖5之MDCT頻譜510僅例示出具有介於52與148之間的頻譜位置的頻譜係數。

返回至圖4，現更詳細地描述極值判定器410。極值判定器410經組配來判定一或多個極值係數。

一般而言，極值判定器410檢查音訊信號輸入頻譜或與該音訊信號輸入頻譜有關之頻譜來尋找極值係數。判定極值係數之目的在於，之後，一或多個局部音調區將在音訊信號頻譜中被偽係數代換，例如被每一音調區之單一偽係數代換。

一般而言，音訊信號之功率頻譜中的多峰區域(音訊信號輸入頻譜與之有關)指示音調區。因此，可較佳識別音訊信號之功率頻譜中音訊信號輸入頻譜與之有關的多峰區域。極值判定器410可例如檢查功率頻譜，包含係數，該等係數可稱為比較係數(因為其頻譜值由極值判定器逐對比較)，使得音訊信號輸入頻譜之頻譜係數中的每一者具有與之關聯的比較值。

在圖5中，例示出功率頻譜520。功率頻譜520及MDCT音訊信號輸入頻譜510與同一音訊信號有關。功率頻譜520包含稱為比較係數之係數。每一頻譜係數包含一與橫座標521有關的頻譜位置以及一比較值。音訊信號輸入頻譜之每一頻譜係數均具有與之相關聯的比較係數，且因此另外具有與之相關聯的其比較係數的比較值。舉例而言，與音訊信號輸入頻譜之頻譜值相關聯的比較值可為與音訊信號輸入頻譜之所考慮頻譜係數具有相同頻譜位置的比較係數的比較值。音訊信號輸入頻譜510之頻譜係數中的三者與功率頻譜520之比較係數中的三者之間的關聯(且因此與此些比較係數之比較值的關聯)由虛線513、514、515指示，虛線513、514、515指示音訊信號輸入頻譜510之相應比較係數(或其比較值)與相應頻譜係數的關聯。

極值判定器410可經組配來判定一或多個極值係數，使得該等極值係數中之每一者為頻譜係數中比較值大於其前任者中之一者的比較值且比較值大於其後繼者中之一者的比較值的一頻譜係數。

舉例而言，極值判定器410可判定功率頻譜之局部最大值。換言之，極值判定器410可經組配以判定一或多個極值係數，使得極值係數中之每一者為頻譜係數中比較值大於其最接近前任者之比較值且比較值大於其最接近後繼者之比較值的一頻譜係數。此處，頻譜係數之最接近前任者為該等頻譜係數中在功率頻譜中緊接該頻譜係數之前的一頻譜係數。該頻譜係數之最接近後繼者為該等頻譜係數中在功率頻譜中緊接該頻譜係數之後的一頻譜係數。

然而，其他實施例不要求極值判定器410判定所有局部最大值。舉例而言，在一些實施例中，極值判定器可僅檢查功率頻譜之例如僅與某一頻率範圍有關的某些部分。

在其他實施例中，極值判定器410經組配來僅作為極值係數之彼等係數，其中所考慮之局部最大值的比較值與後續局部最小值和/或在前局部最小值的比較值之間的差大於臨界值。

極值判定器410可判定比較頻譜上的極值，其中將比較頻譜之係數的比較值指派給MDCT頻譜之MDCT係數中的每一者。然而，比較頻譜可具有比音訊信號輸入頻譜高的頻譜解析度。舉例而言，比較頻譜可為具有與MDCT音訊信號輸入頻譜相比頻譜解析度翻倍的DFT頻譜。藉此，接著將DFT頻譜之僅每隔一個頻譜值指派給MDCT頻譜之頻譜值。然而，當判定比較頻譜之極值時，可考慮比較頻譜之其他係數。藉此，可將比較頻譜之係數判定為不指派給音訊信號輸入頻譜之頻譜係數但具有最接近前任者及最接近後繼者的極值，該前任者及該後繼者分別指派給音訊信號輸入頻譜之頻譜係數及音訊信號輸入頻譜之該頻譜係數的最接近後繼者。因此，可考慮將比較頻譜之(例如，高解析度DFT頻譜之)該極值指派給(MDCT)音訊信號輸入頻譜內的位於該(MDCT)音訊信號輸入頻譜之該頻譜係數與該(MDCT)音訊信號輸入頻譜之該頻譜係數的該最接近後繼者之間的頻譜位置。如後面將闡釋，此情形可藉由選擇偽係數之恰當帶正負號的值來編碼。藉此，達成次頻率組解析度。

應注意，在一些實施例中，極值係數不必滿足其比較值大於其最接近前任者之比較值及其最接近後繼者之比較值的要求。代替地，在彼等實施例中，極值係數之比較值大於其前任者中之一者及其後繼者中之一者的比較值可能已足夠。舉例而言，考慮以下情形，其中：

在表1所述之情形中，極值判定器410可合理地將頻譜位置214處的頻譜係數視為極值係數。頻譜係數214之比較值不大於其最接近前任者213之比較值(0.83<0.84)，且不大於其最接近後繼者215之比較值(0.83<0.85)，但頻譜係數214之比較值(顯著)大於其前任者中之另一者(前任者212)的比較值(0.83>0.02)，且(顯著)大於其後繼者中之另一者(後繼者216)的比較值(0.83>0.01)。此外，將頻譜係數214視為此「多峰區域」之極值看起來亦為合理，因為頻譜係數位於與係數212及216之比較值相比具有相對較大比較值的三個係數213、214、215中間。

舉例而言，極值判定器410可經組配以自比較係數中之一些或全部判定該比較係數之比較值是否大於最靠近該比較係數之頻譜位置的三個前任者之比較值中的至少一者。且/或，極值判定器410可經組配以自比較係數中之一些或全部判定該比較係數之比較值是否大於靠近該比較係數之頻譜位置的三個後繼者之比較值中的至少一者。極值判定器410可接著依據該等判定之結果來決定是否選擇該比較係數。

在一些實施例中，每一頻譜係數之比較值為因音訊信號之能量保存變換而產生之另一頻譜(比較頻譜)之另一係數的平方值。

在進一步實施例中，每一頻譜係數之比較值為因音訊信號之能量保存變換而產生之另一頻譜之另一係數的振幅值。

根據一實施例，該另一頻譜為離散傅立葉變換頻譜，且其中能量保存變換為離散傅立葉變換。根據另一實施例，該另一頻譜為複雜修正型離散餘弦變換(CMDCT)頻譜，且其中能量保存變換為CMDCT。

在另一實施例中，極值判定器410可不檢查比較頻譜，而是可檢查音訊信號輸入頻譜本身。舉例而言，當音訊信號輸入頻譜本身係因能量保存變換而產生時，例如當音訊信號輸入頻譜為離散傅立葉變換量級頻譜時，上述情況可為合理的。

舉例而言，極值判定器410可經組配來判定一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中頻譜值大於其前任者中之一者的頻譜值且頻譜值大於其後繼者中之一者的頻譜值的一頻譜係數。

在一實施例中，極值判定器410可經組配來判定一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中頻譜值大於其最接近前任者之頻譜值且頻譜值大於其最接近後繼者之頻譜值的一頻譜係數。

此外，該裝置包含頻譜修正器420，其用於藉由將極值係數中之至少一者的前任者或後繼者的頻譜值設定為預定義值來修正音訊信號輸入頻譜以獲得經修正之音訊信號頻譜。頻譜修正器420經組配來不將一或多個極值係數之頻譜值設定為預定義值，或經組配來以偽係數代替一或多個極值係數中之至少一者，其中偽係數之頻譜值不同於該預定義值。

較佳地，該預定義值可為零。舉例而言，在圖5之經修正(代換)音訊信號頻譜530中，許多頻譜係數之頻譜值已由頻譜修正器420設定為零。

換言之，為獲得經修正之音訊信號頻譜，頻譜修正器420將至少設定極值係數中之一者的前任者或後繼者之頻譜值為預定義值。該預定義值可例如為零。此前任者或後繼者之比較值小於該極值之比較值。

此外，關於極值係數本身，頻譜修正器420將如下進行：-頻譜修正器420將不設定極值係數為預定義值，或：-頻譜修正器420將用偽係數代替極值係數中的至少一者，其中該偽係數之頻譜值不同於該預定義值。此意味著將極值係數中之至少一者的頻譜值設定為預定義值，且將頻譜係數中之另一者的頻譜值設定為不同於該預定義值的值。此值可例如自該極值係數、該極值係數之前任者中的一者或該極值係數之後繼者中的一者之頻譜值得出。或者，此值可例如自該極值係數、該極值係數之前任者中的一者或該極值係數之後繼者中的一者之比較值得出。

頻譜修正器420可例如經組配來用具有自該極值係數之頻譜值或比較值、自該極值係數之前任者中之一者的頻譜值或比較值或自該極值係數之後繼者中之一者的頻譜值或比較值得出之頻譜值的偽係數代替該等極值係數中的一者。

此外，該裝置包含處理單元430，其用於處理經修正之音訊信號頻譜來獲得經編碼之音訊信號頻譜。

舉例而言，處理單元430可為任何種類之音訊編碼器，例如MP3(MPEG-1音訊層Ⅲ或MPEG-2音訊層Ⅲ；MPEG=動畫專家小組(Moving Picture Experts Group))音訊編碼器、用於WMA(視窗媒體音訊(Windows Media Audio)之音訊編碼器、用於WAVE檔案之音訊編碼器，或MPEG-2/4 AAC(高級音訊寫碼)音訊編碼器，或MPEG-D USAC(統一語音及音訊寫碼(Unified Speed and Audio Coding))寫碼器。

處理單元430可例如為[8](ISO/IEC 14496-3：2005，資訊技術，音訊-視覺物件之寫碼，部分3：音訊，分部分4)中所述，或如[9](ISO/IEC 14496-3：2005-資訊技術，音訊-視覺物件之寫碼，部分3：音訊，分部分4)中所述的音訊編碼器。舉例而言，處理單元430可包含量化器，及/或時間雜訊整型工具，例如如[8]中所述，且/或處理單元430可包含感知雜訊代換工具，例如如[8]中所述。

此外，該裝置包含旁資訊產生器440，其用於產生並傳輸旁資訊。旁資訊產生器440經組配來定位由頻譜修正器420產生之經修正音訊信號輸入頻譜內的一或多個偽係數候選者。另外，旁資訊產生器440經組配來選擇該等偽係數候選者中之至少一者作為選定候選者。此外，旁資訊產生器440經組配來產生旁資訊，使得該旁資訊指示該等選定候選者為偽係數。

在圖4中例示出之實施例中，旁資訊產生器440經組配來藉由頻譜修正器420接收偽係數之位置(例如，偽係數中之每一者的位置)。此外，在圖4之實施例中，旁資訊產生器440經組配來接收偽係數候選者之位置(例如，偽係數候選者中之每一者的位置)。

舉例而言，在一些實施例中，處理單元430可經組配來基於經量化之音訊信號頻譜判定偽係數候選者。在一實施例中，處理單元430可能已藉由量化經修正音訊信號頻譜而產生了經量化音訊信號頻譜。舉例而言，處理單元430可將經量化音訊信號頻譜之至少一頻譜係數判定為偽係數候選者，該候選者具有頻譜值等於預定義值(例如，等於0)的最接近前任者，且具有頻譜值等於預定義值的最接近後繼者。

或者，在其他實施例中，處理單元430可將經量化音訊信號頻譜傳遞給旁資訊產生器440，且旁資訊產生器440可基於該經量化音訊信號頻譜自行判定偽係數候選者。根據其他實施例，基於經修正音訊信號頻譜以替代方式判定偽係數候選者。

旁資訊產生器所產生之旁資訊可具有靜態的預定義大小，或可以信號適應性方式反復估計其大小。在此情況下，亦將旁資訊之實際大小傳輸給解碼器。因此，根據一實施例，旁資訊產生器440經組配來傳輸旁資訊之大小。

根據一實施例，極值判定器410經組配來檢查比較係數，例如圖5中之功率頻譜520之係數，且經組配來判定一或多個最小係數，使得該等最小係數中之每一者為頻譜係數中比較值小於其前任者中之一者的比較值且比較值小於其後繼者中之一者的比較值的一頻譜係數。在此實施例中，頻譜修正器420可經組配來基於極值係數中之一或多者的比較值以及最小係數中之一或多者的比較值來判定代表值，使得該代表值不同於該預定義值。另外，頻譜修正器420可經組配來藉由將該頻譜值設定為該代表值而改變音訊信號輸入頻譜之係數中的一者的頻譜值。

在一特定實施例中，極值判定器經組配來檢查比較係數，例如圖5中之功率頻譜520的係數，且經組配以判定一或多個最小係數，使得該等最小係數中之每一者為頻譜係數中比較值小於其最接近前任者之比較值且比較值小於其最接近後繼者之比較值的一頻譜係數。

或者，極值判定器410經組配來檢查音訊信號輸入頻譜510本身，且經組配來判定一或多個最小係數，使得該一或多個最小係數中之每一者為頻譜係數中頻譜值小於其前任者中之一者的頻譜值且頻譜值小於其後繼者中之一者的頻譜值的一頻譜係數。在此實施例中，頻譜修正器420可經組配來基於極值係數中之一或多者及最小係數中之一或多者的頻譜值來判定代表值，使得該代表值不同於預定義值。此外，頻譜修正器420可經組配來藉由將音訊信號輸入頻譜之係數中的一者的頻譜值設定為該代表值來改變該頻譜值。

在一特定實施例中，極值判定器410經組配來檢查音訊信號輸入頻譜510本身，且經組配來判定一或多個最小係數，使得該一或多個最小係數中之每一者為頻譜係數中頻譜值小於其最接近前任者之頻譜值且頻譜值小於其最接近後繼者之頻譜值的一頻譜係數。

在兩者實施例中，頻譜修正器420考慮極值係數以及該等最小係數中之一或多者，尤其考慮其相關聯比較值或其頻譜值，來判定代表值。接著，將音訊信號輸入頻譜之頻譜係數中的一者的頻譜值設定為該代表值。此外，頻譜值設定為該代表值的頻譜係數可例如為極值係數本身，或頻譜值設定為該代表值的頻譜係數可為代替極值係數的偽係數。

在一實施例中，極值判定器410可經組配來判定頻譜值序列之一或多個子序列，使得該等子序列中之每一者包含音訊信號輸入頻譜之多個後續頻譜係數。根據後續頻譜係數之頻譜位置將後續頻譜係數依序排序在子序列內。該等子序列中之每一者具有在該經依序排序之子序列中位於第一的第一元素以及在該依序排序之子序列中位於最後的最後元素。

在一特定實施例中，該等子序列中之每一者可例如包含最小係數中之恰好兩者以及極值係數中之恰好一者，最小係數中之一者為子序列之第一元素，且最小係數中之另一者為子序列之最後元素。

在一實施例中，頻譜修正器420可經組配來基於子序列中之一者的係數的頻譜值或比較值而判定代表值。舉例而言，若極值判定器410已檢查例如功率頻譜520之比較頻譜之比較係數，則頻譜修正器420可經組配來基於該等子序列中之一者的係數的比較值而判定代表值。然而，若極值判定器410已檢查音訊信號輸入頻譜510之頻譜係數，則頻譜修正器420可經組配來基於該等子序列中之一者的係數的頻譜值而判定代表值。

頻譜修正器420經組配來藉由將該子序列之係數中的一者的頻譜值設定為該代表值來改變該頻譜值。

表2提供在頻譜位置252至258處具有五個頻譜係數的實例。

極值判定器410可判定頻譜係數255(具有頻譜位置255之頻譜係數)為極值係數，因為其比較值(0.73)大於其(此處：最接近)前任者254的比較值(0.48)，且因為其比較值(0.73)大於其(此處：最接近)後繼者256的比較值(0.45)。

此外，極值判定器410可判定頻譜係數253為最小係數，因為其比較值(0.05)小於其(此處：最接近)前任者252之比較值(0.12)，且因為其比較值(0.05)小於其(此處：最接近)後繼者254之比較值(0.48)。

另外，極值判定器410可判定頻譜係數257為最小係數，因為其比較值(0.03)小於其(此處：最接近)前任者256之比較值(0.45)，且因為其比較值(此處：最接近)後繼者258之比較值(0.18)。

極值判定器410可因此藉由判定頻譜係數255為極值係數、藉由判定頻譜係數253為作為最小係數(其為極值係數255之最靠近在前最小係數)，且藉由判定頻譜係數257為最小係數(其為極值係數255之最靠近在後最小係數)來判定包含頻譜係數253至257的子序列。

頻譜修正器420現可基於所有頻譜係數253至257之比較值來判定子序列253至257的代表值。

舉例而言，頻譜修正器420可經組配來總計子序列之所有頻譜係數的比較值。(舉例而言，對於表2，子序列253至257之代表值則總計為：0.05+0.48+0.73+0.45+0.03=1.74)。

或者，例如，頻譜修正器420可經組配來總計子序列之所有頻譜係數之比較值的平方。(舉例而言，對於表2，子序列253至257之代表值則總計為：(0.05)+(0.48)² +(0.73)² +(0.45)² +(0.03)² =0.9692)。

或者，例如，頻譜修正器420可經組配來求子序列253至257之所有頻譜係數之比較值之平方之總和的平方根。(舉例而言，對於表2，代表值則為0.98448)。

根據一些實施例，頻譜修正器420將設定極值係數之頻譜值(在表中，頻譜係數253之頻譜值)設定為預定義值。

然而，其他實施例使用重心方法。表3例示出包含頻譜係數282至288的子序列：

儘管極值係數位於頻譜位置285處，但根據重心方法，重心位於不同頻譜位置處。

為確定重心之頻譜位置，極值判定器410對子序列之所有頻譜係數的經加權頻譜位置進行求和，並使結果除以該子序列之頻譜係數的比較值的總和。接著可對除法結果使用商用捨位以判定重心。頻譜係數之經加權頻譜位置為其頻譜位置與其比較值的乘積。

簡而言之，極值判定器藉由以下步驟來獲得重心：1)判定子序列之每一頻譜係數的比較值與頻譜位置的乘積；2)對1)中所判定之乘積進行求和以獲得第一總和；3)對子序列之所有頻譜係數的比較值進行求和以獲得第二總和；4)使第一總和除以第二總和以產生中間結果；以及5)對該中間結果應用捨位至最近捨位值(round-to-nearest rounding)以獲得重心(捨位至最近捨位值：8.49捨位至8；8.5捨位至9)。

因此，對於表3之實例，藉由以下方式獲得重心： (0.04˙282+0.10˙283+0.20˙284+0.93˙285+0.92˙286+0.90˙287+0.05˙288)/(0.04+0.10+0.20+0.93+0.92+0.90+0.05)=897.25/3.14=285.75=286。

因此，在表3之實例中，極值判定器410將組配來判定頻譜位置286為重心。

在一些實施例中，極值判定器410不檢查完整比較頻譜(例如，功率頻譜520)，或不檢查完整音訊信號輸入頻譜。代替地，極值判定器410可僅部分地檢查比較頻譜或音訊信號輸入頻譜。

圖6例示出以下實例。在該實例中，功率頻譜620(作為比較頻譜)已由極值判定器410自係數55開始檢查。小於55之頻譜位置處的係數尚未檢查。因此，小於55之頻譜位置處的頻譜係數在經代換MDCT頻譜630中保持未修正。相比之下，圖5例示出經代換MDCT頻譜530，其中所有MDCT頻譜線均已由頻譜修正器420修正。

因此，頻譜修正器420可經組配來修正音訊信號輸入頻譜，使得該音訊信號輸入頻譜之頻譜係數中之至少一些的頻譜值獲保留未修正。

在一些實施例中，頻譜修正器420經組配來判定極值係數中之一者的比較值或頻譜值中的一者之間的值差是否小於臨界值。在該等實施例中，頻譜修正器420經組配來修正音訊信號輸入頻譜，使得取決於該值差是否小於臨界值，音訊信號輸入頻譜之頻譜係數中之至少一些的頻譜值在經修正音訊信號頻譜中獲保留未修正。

舉例而言，在一實施例中，頻譜修正器420可經組配來不修正或替換所有極值係數，而是修正或替換極值係數中的僅一些極值係數。舉例而言，當極值係數(例如，局部最大值)的比較值與後續和/或在前最小值的比較值之間的差小於臨界值時，頻譜修正器可決定不修正此等頻譜值(且例如，其之間的頻譜係數的頻譜值)，而是使此等頻譜值在經修正(代換)MDCT頻譜630中保持未修正。在圖6之經修正MDCT頻譜630中，頻譜係數100至112之頻譜值以及頻譜係數124至136之頻譜值在未修正(代換)頻譜630中已由頻譜修正器保持未修正。

處理單元可另外經組配來量化經修正(代換)MDCT頻譜630之係數，以獲得經量化MDCT頻譜635。

根據一實施例，頻譜修正器420可經組配來接收微調資訊。音訊信號輸入頻譜之頻譜係數的頻譜值可為帶正負號的值，其各自包含正負號分量。當微調資訊處於第一微調狀態時，頻譜修正器可經組配來將一或多個極值係數之或偽係數中之一者的正負號分量設定為第一正負號值。並且，當微調資訊處於不同的第二微調狀態時，頻譜修正器可經組配來將一或多個極值係數之或偽係數中之一者的頻譜值的正負號分量設定為不同的第二正負號值。

舉例而言，在表4中，

頻譜係數之頻譜值指示頻譜係數291處於第一微調狀態，頻譜係數301處於第二微調狀態，頻譜係數321處於第一微調狀態，等等。

舉例而言，返回上文所闡釋之重心判定，若重心(例如，近似在中部)位於兩個頻譜位置之間，則頻譜修正器可設定正負號，使得第二微調狀態被指示。

根據一實施例，處理單元430可經組配來量化經修正音訊信號頻譜，以獲得經量化音訊信號頻譜。處理單元430可另外經組配來處理經量化音訊信號頻譜，以獲得經編碼音訊信號頻譜。

此外，處理單元430可進一步經組配來產生旁資訊，其僅對經量化音訊信號頻譜之具有頻譜值等於預定義值的最接近前任者及頻譜值等於預定義值的最接近後繼者的彼等頻譜係數指示該係數是否為極值係數中的一者。

此資訊可由極值判定器410提供給處理單元430。

舉例而言，此資訊可由處理單元430儲存在位元欄位中，從而對經量化音訊信號頻譜之具有頻譜值等於預定義值的最接近前任者及頻譜值等於預定義值的最接近後繼者的頻譜係數中的每一者指示該係數是否為極值係數中的一者(例如，藉由位元值1)，或該係數是否不是極值係數中的一者(例如，藉由位元值0)。在一實施例中，解碼器可稍後使用此資訊來重新儲存音訊信號輸入頻譜。該位元欄位可具有固定長度或信號適應性選擇之長度。在後者情況下，可另外將位元欄位之長度傳達給解碼器。

舉例而言，由處理單元430產生之位元欄位[000111111]可指示出現在(依序排序)(經量化)音訊信號頻譜中的前三個「獨立」係數(其頻譜值不等於預定義值，但其前任者及其後繼者之頻譜值等於預定義值)不是極值係數，但接下來的六個「獨立」係數為極值係數。此位元欄位描述可在圖6中之經量化MDCT頻譜635中看到的情形，其中前三個「獨立」係數5、8、25不是極值係數，但其中接下來的六個「獨立」係數59、71、83、94、116、141是極值係數。

此外，該頻譜係數之最接近前任者為經量化音訊信號頻譜內緊接該頻譜係數之前的另一頻譜係數，且該頻譜係數之最接近後繼者為經量化音訊信號頻譜內緊接該頻譜係數之後的另一頻譜係數。

在下文中，描述一種用於基於經編碼音訊信號頻譜產生音訊輸出信號的裝置。

圖1例示出根據一實施例之用於基於經編碼音訊信號頻譜產生音訊輸出信號的裝置。

該裝置包含處理單元110，其用於處理經編碼音訊信號頻譜以獲得經解碼音訊信號頻譜。該經解碼音訊信號頻譜包含多個頻譜係數，其中該等頻譜係數中之每一者具有在經編碼音訊信號頻譜內的頻譜位置以及頻譜值，其中該等頻譜係數根據其在經編碼音訊信號頻譜內的頻譜位置而依序排序，使得頻譜係數形成頻譜係數序列。

此外，該裝置包含偽係數判定器120，其用於使用旁循序(side info)來判定經解碼音訊信號頻譜之一或多個偽係數，該等偽係數中之每一者具有頻譜位置及頻譜值。

另外，該裝置包含頻譜修正單元130，其用於將一或多個偽係數設定為預定義值，以獲得經修正音訊信號頻譜。

此外，該裝置包含頻譜-時間轉換單元140，其用於將經修正之音訊信號頻譜轉換至時域，以獲得時域轉換信號。

另外，該裝置包含可控振盪器150，其用於產生時域振盪器信號，該可控振盪器由一或多個偽係數中之至少一者的頻譜位置及頻譜值控制。

此外，該裝置包含混頻器160，其用於混合時域轉換信號與時域振盪器信號以獲得音訊輸出信號。

在一實施例中，該混頻器可經組配來藉由在時域中將時域轉換信號與時域振盪器信號相加來混合時域轉換信號與時域振盪器信號。

處理單元110可例如為任何種類之音訊解碼器，例如MP3音訊解碼器、用於WMA之音訊解碼器、用於WAVE檔案之音訊解碼器、A AC音訊解碼器或US AC音訊解碼器。

處理單元110可例如為如中所描述[8](ISO/IEC 14496-3：2005，資訊技術，音訊視覺物件之寫碼，部分3：音訊，子部分4)中所述或如[9](ISO/IEC 14496-3：2005，資訊技術，音訊視覺物件之寫碼，部分3：音訊，子部分4)中所述之音訊解碼器。舉例而言，處理單元430可包含經量化值之重新定標(「去量化」)，及/或時間雜訊整型工具，例如描述於[8]中，且/或處理單元430可包含感知雜訊代換工具，例如描述於[8]中。

根據一實施例，頻譜係數中之每一者可具有最接近前任者及最接近後繼者，其中該頻譜係數之最接近前任者可為該等頻譜係數中在序列內緊接該頻譜係數之前的一個頻譜係數，其中該頻譜係數之最緊接後繼者可為該等頻譜係數中在序列內緊接該頻譜係數之後的一個頻譜係數。

偽係數判定器120可經組配來藉由判定該序列之至少一頻譜係數來判定經解碼音訊信號頻譜之一或多個偽係數，該頻譜係數具有不同於預定義值的頻譜值，該頻譜係數具有頻譜值等於預定義值的最接近前任者，且具有頻譜值等於預定義值的最接近後繼者。在一實施例中，該預定義值可為零，且該預定義值可為零。

換言之，偽係數判定器120對經解碼音訊信號頻譜之一些或所有係數判定相應考慮之係數是否不同於預定義值(較佳：不同於0)，在前係數之頻譜值是否等於預定義值(較佳：等於0)，且在後係數之頻譜值是否等於預定義值(較佳：等於0)。

在一些實施例中，此所判定之係數為(總是)偽係數。

然而，在其他實施例中，此所判定之係數為(僅)偽係數候選者，且可或可不為偽係數。在彼等實施例中，偽係數判定器120經組配來判定該至少一偽係數候選者，其具有不同於預定義值的頻譜值，其具有頻譜值等於預定義值的最接近前任者，且其可具有頻譜值等於預定義值的最接近後繼者。

偽係數判定器120接著經組配來藉由判定旁資訊是否指示該偽係數候選者為偽係數而判定該偽係數候選者是否為偽係數。

舉例而言，該旁資訊可由偽係數判定器120在位元欄位中接收，該旁資訊對經量化音訊信號頻譜之具有頻譜值等於預定義值之最接近前任者及頻譜值等於預定義值之最接近後繼者的頻譜係數中之每一者，指示該係數是否為極值係數中之一者(例如，藉由位元值1)，或該係數是否不是極值係數中之一者(例如，藉由位元值0)。

舉例而言，位元欄位可[000111111]指示出現在(依序排序)(經量化)音訊信號頻譜中之前三個「獨立」係數(其頻譜值不等於預定義值，但其前任者或其後繼者之頻譜值等於預定義值)不是極值係數，但接下來的六個「獨立」係數為極值係數。此位元欄位描述可在圖6中之經量化MDCT頻譜635中看到的情形，其中前三個「獨立」係數5、8、25不是極值係數，但接下來的六個「獨立」係數為極值係數。

頻譜修正單元130可經組配來將偽係數自經解碼音訊信號頻譜中「刪除」。事實上，頻譜修正單元將經解碼音訊信號頻譜之偽係數的頻譜值設定為預定義值(較佳為0)。此為合理的，因為將僅需要(至少一)偽係數來控制(至少一)可控振盪器150。因此，例如考慮圖6中之經量化MDCT頻譜635。若將頻譜635視為經解碼音訊信號頻譜，則頻譜修正單元130將設定極值係數59、71、83、94、116及141之頻譜值以獲得經修正音訊信號頻譜，且將使頻譜之其他係數保持未修正。

頻譜-時間轉換單元140將經修正音訊信號頻譜自頻譜域轉換至時域。舉例而言，經修正音訊信號頻譜可為MDCT頻譜，且頻譜-時間轉換單元140可為逆經修正離散餘弦變換(IMDCT)濾波器組。在其他實施例中，頻譜可為MDST頻譜，且頻譜-時間轉換單元140可為逆經修正離散正弦變換(IMDST)濾波器組。或者，在進一步實施例中，頻譜可為DFT頻譜，且頻譜-時間轉換單元140可為逆離散傅立葉變換(IDFT)濾波器組。

可控振盪器150可經組配來產生具有振盪器信號頻率的時域振盪器信號，使得振動器信號之振盪器信號頻率可取決於一或多個偽係數中之一者的頻譜位置。由振盪器產生之振盪器信號可為時域正弦信號。可控振盪器150可經組配來依據一或多個偽係數中之一者的頻譜值來控制時域正弦信號之振幅。

根據一實施例，偽係數為帶正負號的值，其各自包含正負號分量。可控振盪器150可經組配來產生時域振盪器信號，使得振盪器信號之振盪器信號頻率進一步可取決於一或多個偽係數中之一者的正負號分量，使得當正負號分量具有第一正負號值時，振盪器信號頻率可具有第一頻率值，且使得當正負號分量具有不同的第二值時，振盪器信號頻率可具有不同的第二頻率值。

舉例而言，考慮圖6之MDCT頻譜635中之頻譜位置59處的偽係數。若頻率8200 Hz將被指派給頻譜位置59，且若頻率8400 Hz將被指派給頻譜位置60，則可控振盪器可例如經組配來將振盪器頻率設定為8200 Hz(若偽係數之頻譜值的正負號為正)，且可例如經組配來將振盪器頻率設定為8300 Hz(若偽係數之頻譜值的正負號為負)。

因此，可使用偽係數之頻譜值的正負號來控制可靠振盪器將振盪器頻率設定為指派給偽係數之頻譜位置(例如頻譜位置59)的頻率(例如8200 Hz)抑或設定為介於指派給偽係數之頻譜位置(例如頻譜位置59)的頻率(例如8200 Hz)與指派給緊接該偽係數之頻譜位置之後的頻譜位置(例如頻譜位置60)的頻率(例如8400 Hz)之間的頻率(例如8300 Hz)。

在一實施例中，可控振盪器150另外由自前一框之偽係數得出之一或多個經外插參數控制。舉例而言，可控振盪器150亦可另外經由自該前一框之偽係數得出的經外插參數來控制，以便例如抵消傳輸期間之資料框損失，或平滑振盪器控制之不穩定行為。經外插參數可例如為頻譜位置或頻譜值。舉例而言，當考慮時間-頻率域之頻譜係數時，與時間常數t-1有關的頻譜係數可由第一框組成，且與時間常數t有關的頻譜係數可被指派給第二框。舉例而言，可拷貝與時間常數t-1有關的偽係數之頻譜值及/或頻譜位置，以為與時間常數t有關的當前框獲得經外插參數。

圖2例示出一實施例，其中該裝置包含另外的可控振盪器252、254、256，其用於產生可由頻譜位置控制之另外的時域振盪器信號，以及一或多個偽係數中之另外偽係數的頻譜值。該等另外的可控振盪器252、254、256經組配來基於偽係數中之一者的頻譜位置而操縱振盪器信號頻率。且/或可控振盪器252、254、256中之每一者經組配來基於偽係數中之每一者的頻譜值而操縱振盪器信號之振幅。

圖1及圖2之混頻器160經組配來混合由頻譜-時間轉換單元140產生之時域轉換信號與由一或多個可控振盪器150、252、254、256產生之一或多個時域振盪器信號，以獲得音訊輸出信號。混頻器160可藉由時域轉換信號與一或多個時域振盪器信號之疊加而產生音訊輸出信號。

圖3例示出比較原始正弦波(左)及由MDCT/IMDCT鏈處理之後的正弦波(右)的兩個圖。在由MDCT/IMDCT鏈處理之後，正弦波包含顫音異物。上文所提供之概念避免了正弦波由MDCT/IMDCT鏈處理，而是正弦資訊由偽係數編碼，且/或正弦波由可控振盪器再製。

儘管已在裝置之上下文中描述了一些態樣，但將清除，此等態樣亦表示對應方法之描述，其中方塊或設備對應於方法步驟或方法步驟之特徵。類似地，方法步驟之上下文中所描述之態樣亦表示對應裝置之對應框或項目或特徵之描述。

本發明之經分解信號可儲存於數位儲存媒體上，或可於例如無線傳輸媒體或有線傳輸媒體(例如網際網路)之傳輸媒體上傳輸。

取決於某些實施要求，本發明之實施例可在硬體中或軟體中實施。可使用數位儲存媒體來執行該實施，數位儲存媒體例如為軟式碟片、DVD、CD、ROM、PROM、EPROM及EEPROM或FLASH記憶體，其上儲存有可以電子方式讀取之控制信號，數位儲存媒體與(或能夠與)可規劃電腦系統協作，使得相應方法被執行。

根據本發明之一些實施例包含非暫時性資料載體，其具有可以電子方式讀取之控制信號，該非暫時性資料載體能夠與可規劃電腦系統協作，使得本文所述方法中之一者被執行。

一般而言，本發明之實施例可實施為具有程式代碼之電腦程式產品，當該電腦程式產品在電腦上運行時，該程式代碼操作以用於執行該等方法中之一者。該程式代碼可例如儲存於機器可讀載體上。

其他實施例包含用於執行本文所述之方法中的一者的電腦程式，其儲存於機器可讀載體上。

換言之，本發明之方法的實施例因此為具有用於執行本文所述之方法中的一者的程式代碼的電腦程式，當該電腦程式在電腦上運行時。

本發明之方法的另一實施例因此為資料載體(或數位儲存媒體，或電腦可讀媒體)，其包含記錄於其上的用於執行本文所述方法中之一者的電腦程式。

本發明之方法的另一實施例因此為表示用於執行本文所述方法中之一者的電腦程式的資料流或信號序列。該資料流或該信號序列可例如經組配來經由資料通訊連接(例如經由網際網路)而傳送。

另一實施例包含處理構件，例如電腦或可規劃邏輯裝置，其經組配來或適於執行本文所述方法中之一者。

另一實施例包含一種電腦，其上安裝有用於執行本文所述方法中之一者的電腦程式。

在一些實施例中，可使用可規劃邏輯裝置(例如，可現場規劃閘陣列)來執行本文所述方法之一些或所有功能性。在一些實施例中，可現場規劃閘陣列可與微處理器協作，以便執行本文所述方法中之一者。一般而言，該等方法較佳由任何硬體裝置執行。

上文所述之實施例僅例示本發明之原理。應理解，熟習此項技術者將明白本文所述之佈置及細節的修正及變化。因此，希望本發明僅受附加之申請專利範圍之範疇限制，而非受藉助於本文實施例之描述及闡釋所呈現之具體細節限制。

參考文獻

[1]Daudet, L.; Sandler, M.;, 「MDCT analysis of sinusoids: exact results and applications to coding artifacts reduction,」 Speech and Audio Processing, IEEE Transactions on,第12卷，第3期，第302-312頁,2004年5月

[2]Pumhagen, H.; Meine, N.;, 「HILN-the MPEG-4 parametric audio coding tools,」Circuits and Systems, 2000. Proceedings, ISCAS 2000 Geneva. The 2000 IEEE International Symposium an, 第3卷,no.,第201-204頁第3卷,2000

[3]Oomen, Werner; Schuijers, Erik; den Brinker, Bert; Breebaart, Jeroen:, 「Advances in Parametrie Coding for High-Quality Audio,」 Audio Engineering Society Convention 114, preprint, Amsterdam/NL, 2003年3月

[4]van Schijndel, N.H.; van de Par, S.;, 「Rate-distortion optimized hybrid sound coding,」 Applications of Signal Processing to Audio and Acoustics, 2005.. IEEE Workshop on, vol., no.,第235-238頁,2005年10月16-19日

[5]Bessette, 8.; Lefebvre, R.; Salami, R.;, 「Universal speech/audio coding using hybrid ACELP/TCX techniques,」 Acoustics, Speech, and Signal Processing, 2005. Proceedings. (ICASSP’05). IEEE International Conference on,第3卷,no.,第iii/301-iii/304頁Val. 3, 2005年3月18-23日

[6]Ferreira, A.J.S. 「Combined spectral envelope normalization and subtraction of sinusoidal components in the ODFT and MDCT frequency domains,」 Applications of Signal Processing to Audio and Acoustics, 2001 IEEE Workshop on the, vol., no.,第51-頁,2001

[7]http://people.xiph.org/~xiphmont/demo/ghost/demo.ht ml The corresponding archive.org-website is stored at: http://web.archive.org/web/20110121141149/http://peopl e.xiph.org/~xiphmont /demo/ghost/demo.html

[8]ISO/IEC 14496-3:2005(E)-Information technology-Coding of audio-visual objects-Part 3: Audio, Subpart 4

[9]ISO/IEC 14496-3:2009(E)-Information technology-Coding of audio-visual objects-Part 3: Audio, Subpart 4

110‧‧‧處理單元

120‧‧‧偽係數判定器

130‧‧‧頻譜修正單元

140‧‧‧頻譜-時間轉換單元

150‧‧‧可控振盪器

160‧‧‧混頻器

Claims

一種用以基於經編碼音訊信號頻譜產生音訊輸出信號的裝置，其中該裝置包含：一處理單元，其用以處理該經編碼音訊信號頻譜以獲得一經解碼音訊信號頻譜，該經解碼音訊信號頻譜包含多個頻譜係數，其中該等頻譜係數中之每一者具有一在該經編碼音訊信號頻譜內的頻譜位置以及一頻譜值，其中該等頻譜係數根據其在該經編碼音訊信號頻譜內之頻譜位置而依序排序，使得該等頻譜係數形成一頻譜係數序列，一偽係數判定器，其用以判定該經解碼音訊信號頻譜之一或多個偽係數，該等偽係數中之每一者具有一頻譜位置及一頻譜值，一頻譜修正單元，其用以將該一或多個偽係數設定為一預定義值，以獲得一經修正音訊信號頻譜，一頻譜-時間轉換單元，其用以將該經修正音訊信號頻譜轉換至一時域，以獲得一時域轉換信號，一可控振盪器，其用以產生一時域振盪器信號，該可控振盪器由該一或多個偽係數中之至少一者的該頻譜位置及該頻譜值控制，以及，一混頻器，其用以混合該時域轉換信號與該時域振盪器信號，以獲得該音訊輸出信號。
如請求項1之裝置，其中該等頻譜係數中之每一者具有一最接近前任者及一最接近後繼者中的至少一者，其中該頻譜係數之該最接近前任者為該等頻譜係數中在該頻譜係數序列內緊接該頻譜係數之前的一個頻譜係數，其中該頻譜係數之該最接近後繼者為該等頻譜係數中在該序列中緊接該頻譜係數之後的一個頻譜係數，其中該偽係數判定器係組配來藉由判定該序列中具有一不同於該預定義值的頻譜值的至少一頻譜係數，來判定該經解碼音訊信號頻譜之該一或多個偽係數，該至少一頻譜係數具有一最接近前任者，該最接近前任者之頻譜值等於該預定義值，且該至少一頻譜係數具有一最接近後繼者，該最接近後繼者之頻譜值等於該預定義值。
如請求項2之裝置，其中該預定義值為零。
如請求項2或3之裝置，其中該偽係數判定器係組配來藉由判定該序列之該至少一頻譜係數為一偽係數候選者，來判定該經解碼音訊信號頻譜之該一或多個偽係數，該至少一頻譜係數具有一最接近前任者，該最接近前任者之頻譜值等於該預定義值，且該至少一頻譜係數具有一最接近後繼者，該最接近後繼者之頻譜值等於該預定義值，且其中該偽係數判定器係組配來藉由判定旁資訊是否指出該偽係數候選者為一偽係數，來判定該偽係數候選者為一偽係數。
如請求項1之裝置，其中該可控振盪器係組配來產生具有一振盪器信號頻率之該時域振盪器信號，使得該振盪器信號之該振盪器信號頻率取決於該一或多個偽係數中之一者的頻譜位置。
如請求項5之裝置，其中該偽係數為帶正負號的值，其各自包含一正負號分量，且其中該可控振盪器係組配來產生該時域振盪器信號，使得該振盪器信號之該振盪器信號頻率另外取決於該一或多個偽係數中之一者的該正負號分量，使得當該正負號分量具有一第一正負號值時，該振盪器信號頻率具有一第一頻率值，且使得當該正負號分量具有一不同的第二值時，該振盪器信號頻率具有一不同的第二頻率值。
如請求項1之裝置，其中該可控振盪器係組配來產生該時域振盪器信號，其中該振盪器信號之振幅取決於該一或多個偽係數中之一者的頻譜值，使得當該頻譜值具有一第三值時，該振盪器信號之該振幅具有一第一振幅值，且使得當該頻譜值具有一不同的第四值時，該振盪器信號之該振幅具有一不同的第二振幅值，當該第四值大於該第三值時，該第二振幅值大於該第一振幅值。
如請求項1之裝置，其中該可控振盪器另外由自一在前框之一偽係數得出之一或多個經外插參數控制。
如請求項1之裝置，其中該經修正音訊信號頻譜為一MDCT(修正型離散餘弦變換)頻譜，其包含MDCT係數，且其中該頻譜-時間轉換單元係組配來藉由將該經解碼音訊信號頻譜之該等係數中之至少一些係數轉換至時域，來將該MDCT頻譜自一MDCT域轉換至時域。
如請求項1之裝置，其中該混頻器係組配來藉由在該時域中使該時域轉換信號與該時域振盪器信號相加，來混合該時域轉換信號與該時域振盪器信號。
如請求項1之裝置，其中由該可控振盪器產生之該時域振盪器信號為一第一時域振盪器信號，其中該裝置進一步包含一或多個另外的可控振盪器，用以產生一或多個另外的時域振盪器信號，其中該一或多個另外的可控振盪器中的每一者係組配來產生該一或多個另外的時域振盪器信號中的一者，其中該等另外的可控振盪器中的每一者由該一或多個偽係數中之至少一者的頻譜位置及頻譜值控制，且其中該混頻器係組配來混合該第一時域振盪器信號、該一或多個另外的時域振盪器信號以及該時域轉換信號，以獲得該音訊輸出信號。
一種用以編碼一音訊信號之音訊信號輸入頻譜的裝置，該音訊信號輸入頻譜包含多個頻譜係數，其中該等頻譜係數中之每一者具有在該音訊信號輸入頻譜內的一頻譜位置、一頻譜值，其中該等頻譜係數根據其在該音訊信號輸入頻譜內的頻譜位置而依序排序，使得該等頻譜係數形成一頻譜係數序列，其中該等頻譜係數中之每一者具有一或多個前任者及一或多個後繼者中的至少一者，其中該頻譜係數之該等前任者中之每一者為該等頻譜係數中在該序列內居於該頻譜係數之前的一個頻譜係數，其中該頻譜係數之該等後繼者中之每一者為該等頻譜係數中在該序列內居於該頻譜係數之後的一個頻譜係數，且其中該裝置包含：一極值判定器，其用以判定一或多個極值係數，一頻譜修正器，其用以藉由將該等極值係數中之至少一者的該等前任者中的至少一者或該等後繼者中的至少一者的頻譜值設定為一預定義值，來修正該音訊信號輸入頻譜以獲得一經修正音訊信號頻譜，其中該頻譜修正器係組配來不將該一或多個極值係數之該等頻譜值設定為該預定義值，或組配來用一偽係數代替該一或多個極值係數中的至少一者，其中該偽係數之頻譜值不同於該預定義值，一處理單元，其用以處理該經修正音訊信號頻譜，以獲得一經編碼音訊信號頻譜，以及一旁資訊產生器，其用以產生並傳輸旁資訊，其中該旁資訊產生器係組配來定位由該頻譜修正器產生之該經修正音訊信號輸入頻譜內的一或多個偽係數候選者，其中該旁資訊產生器係組配來選擇該等偽係數候選者中的至少一者作為選定候選者，且其中該旁資訊產生器係組配來產生該旁資訊，使得該旁資訊指出該等選定候選者為該等偽係數，其中該極值判定器係組配來判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，此頻譜係數之頻譜值大於其前任者中的至少一者的頻譜值，且此頻譜係數之該頻譜值大於其後繼者中的至少一者的頻譜值，或其中該等頻譜係數中之每一者具有一與該頻譜係數相關聯的比較值，其中該極值判定器係組配來判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，此頻譜係數之該比較值大於其前任者中的至少一者的該比較值，且此頻譜係數之該比較值大於其後繼者中的至少一者的該比較值。
如請求項12之裝置，其中該旁資訊產生器係組配來傳輸該旁資訊之大小。
如請求項12或13之裝置，其中該頻譜修正器係組配來修正該音訊信號輸入頻譜，使得該音訊信號輸入頻譜之該等頻譜係數中之至少一些頻譜係數的該等頻譜值在該經修正音訊信號頻譜中獲保留未修正。
如請求項12之裝置，其中該等頻譜係數中之每一者具有作為其前任者中之一者的一最接近前任者及作為其後繼者中之一者的一最接近後繼者中之至少一者，其中該頻譜係數之該最接近前任者為該等頻譜係數中在該序列內緊接該頻譜係數之前的一個頻譜係數，其中該頻譜係數之該最接近後繼者為該等頻譜係數中在該序列內緊接該頻譜係數之後的一個頻譜係數，其中該頻譜修正器係組配來藉由將該等極值係數中之至少一者的該最接近前任者或該最接近後繼者之頻譜值設定為該預定義值，來修正該音訊信號輸入頻譜以獲得該經修正音訊信號頻譜，其中該頻譜修正器係組配來不將該一或多個極值係數之該等頻譜值設定為該預定義值，或係組配來用一偽係數代替該一或多個極值係數中的至少一者，其中該偽係數之該頻譜值不同於該預定義值，且其中該極值判定器係組配來判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中的一個頻譜係數，此頻譜係數之該頻譜值大於其最接近前任者之該頻譜值，且此頻譜係數之該頻譜值大於其最接近後繼者之該頻譜值，或其中該等頻譜係數中之每一者具有一與該頻譜係數相關聯的比較值，其中該極值判定器係組配來判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中的一個頻譜係數，此頻譜係數之該比較值大於其最接近前任者之比較值，且此頻譜係數之該比較值大於其最接近後繼者之比較值。
如請求項15之裝置，其中該極值判定器係組配來判定一或多個最小係數，使得該一或多個最小係數中之每一者為該等頻譜係數中的一個頻譜係數，此頻譜係數之該頻譜值小於其前任者中之一者的頻譜值，且此頻譜係數之該頻譜值小於其後繼者中之一者的頻譜值，或其中該等頻譜係數中之每一者具有一與該頻譜係數相關聯的比較值，其中該極值判定器係組配來判定該一或多個最小係數，使得該等最小係數中之每一者為該等頻譜係數中的一個頻譜係數，此頻譜係數之該比較值小於其前任者中之一者的比較值，且此頻譜係數之該比較值小於其後繼者中之一者的比較值，且其中該頻譜修正器係組配來基於該等極值係數中之一或多者或該等最小係數中之一或多者的該等頻譜值或該等比較值，來判定一表示值，使得該表示值不同於該預定義值，且其中該頻譜修正器係組配來藉由將該頻譜值設定為該表示值，來改變該音訊信號輸入頻譜之該等係數中之一者的該頻譜值。
如請求項16之裝置，其中該頻譜修正器係組配來判定該等極值係數中之一者之該比較值或該頻譜值中的一者之間的一數值差是否小於一臨界值，且其中該頻譜修正器係組配來修正該音訊信號輸入頻譜，使得取決於該數值差是否小於該臨界值，該音訊信號輸入頻譜之該等頻譜係數中的至少一些的該等頻譜值在該經修正音訊信號頻譜中獲保留未修正。
如請求項16或17之裝置，其中該極值判定器係組配來判定頻譜值序列之一或多個子序列，使得該等子序列中之每一者包含該音訊信號輸入頻譜的多個後續頻譜係數，該等後續頻譜係數在該子序列內根據其頻譜位置依序排序，其中該等子序列中之每一者具有一在該依序排序之子序列中位於第一的第一元素、以及一在該依序排序之子序列中位於最後的最後元素，其中該等子序列中之每一者包含該等最小係數中之恰好兩者以及該等極值係數中之恰好一者，該等最小係數中之一者為該子序列之該第一元素，且該等最小係數中之另一者為該子序列之該最後元素，且其中該頻譜修正器係組配來基於該等子序列中之一者之該等係數的該等頻譜值或該等比較值來判定該表示值，且其中該頻譜修正器係組配來藉由將該子序列之該等係數中之一者的該頻譜值設定為該表示值來改變此頻譜值。
如請求項18之裝置，其中該頻譜修正器係組配來藉由確定該等子序列中之該一者之該等係數的該等比較值的平方和來判定該表示值。
如請求項18之裝置，其中該極值判定器係組配來藉由以下步驟判定一重心係數：判定該子序列之每一頻譜係數之該比較值與位置值的乘積以獲得多個經加權係數，對該等經加權係數進行求和以獲得一第一總和，對該子序列之所有頻譜係數之該等比較值進行求和以獲得一第二總和；將該第一總和除以該第二總和以獲得一中間結果；以及對該中間結果應用捨位至最近捨位值以獲得該重心係數，且其中該頻譜修正器係組配來將該子序列之並非該重心係數之所有頻譜係數之該等頻譜值設定為該預定義值，或其中該極值判定器係組配來藉由以下步驟判定一重心係數：判定該子序列之每一頻譜係數之該頻譜值與該位置值的乘積以獲得多個經加權係數，對該等經加權係數進行求和以獲得一第一總和，對該子序列之所有頻譜係數之該等頻譜值進行求和以獲得一第二總和；將該第一總和除以該第二總和以獲得一中間結果；以及對該中間結果應用捨位至最近捨位值以獲得該重心係數，且其中該頻譜修正器係組配來將該子序列之並非該重心係數之所有頻譜係數之該等頻譜值設定為該預定義值。
如請求項12之裝置，其中該預定義值為零。
如請求項12之裝置，其中每一頻譜係數之該比較值為自該音訊信號之一能量保存變換得出之一另外頻譜之一另外係數的一平方值。
如請求項12之裝置，其中每一頻譜係數之該比較值為自該音訊信號之一能量保存變換得出之一另外頻譜之一另外係數的一振幅值。
如請求項12之裝置，其中該另外頻譜為一複雜修正型離散餘弦變換頻譜，且其中該能量保存變換為一複雜修正型離散餘弦變換。
如請求項12之裝置，其中該頻譜修正器係組配來接收微調資訊，其中該音訊信號輸入頻譜之該等頻譜係數為帶正負號的值，其各自包含一正負號分量，其中該頻譜修正器係組配來在該微調資訊處於一第一微調狀態時，將該一或多個極值係數中之一者之或該偽係數之該頻譜值的該正負號分量設定為一第一正負號值，以獲得該經修正音訊信號頻譜，且其中該頻譜修正器係組配來在該微調資訊處於一不同的第二微調狀態時，將該一或多個極值係數中之一者之或該偽係數之該頻譜值的該正負號分量設定為一不同的第二正負號值，以獲得該經修正音訊信號頻譜。
如請求項12之裝置，其中該音訊信號輸入頻譜為一包含MDCT係數之MDCT頻譜。
如請求項12之裝置，其中該處理單元係組配來量化該經修正音訊信號頻譜以獲得一經量化音訊信號頻譜，其中該處理單元係進一步組配來處理該經量化音訊信號頻譜以獲得一經編碼音訊信號頻譜，其中該處理單元係進一步組配來產生旁資訊，其僅對該經量化音訊信號頻譜之具有一最接近前任者及一最接近後繼者的彼等頻譜係數指出該係數是否為該等極值係數中的一者，該最接近前任者之該頻譜值等於該預定義值，且該最接近後繼者之該頻譜值等於該預定義值，其中該頻譜係數之該最接近前任者為在該經量化音訊信號頻譜內緊接該頻譜係數之前的另一頻譜係數，且其中該頻譜係數之該最接近後繼者為在該經量化音訊信號頻譜內緊接該頻譜係數之後的另一頻譜係數。
如請求項12之裝置，其中該頻譜修正器係組配來用一具有一自該極值係數之該頻譜值或該比較值、自該極值係數之該等前任者中之一者的該極值係數的該頻譜值或該比較值、或自該極值係數之該等後繼者中之一者的該極值係數的該頻譜值或該比較值得出之頻譜值的偽係數，代替該等極值係數中之一者。
一種用以基於經編碼音訊信號頻譜產生音訊輸出信號的方法，其中頻譜係數中之每一者具有一在該經編碼音訊信號頻譜內的頻譜位置以及一頻譜值，其中該等頻譜係數根據其在該經編碼音訊信號頻譜內的頻譜位置而依序排序，使得該等頻譜係數形成一頻譜係數序列，且其中該方法包含：處理該經編碼音訊信號頻譜以獲得一經解碼音訊信號頻譜，該經解碼音訊信號頻譜包含多個頻譜係數，判定該經解碼音訊信號頻譜之一或多個偽係數，該等偽係數中之每一者具有一頻譜位置及一頻譜值，將該一或多個偽係數設定為一預定義值，以獲得一經修正音訊信號頻譜，將該經修正音訊信號頻譜轉換至一時域，以獲得一時域轉換信號，藉由一可控振盪器產生一時域振盪器信號，該可控振盪器由該一或多個偽係數中之至少一者的該頻譜位置及該頻譜值控制，以及混合該時域轉換信號與該時域振盪器信號，以獲得該音訊輸出信號。
一種用以編碼音訊信號輸入頻譜的方法，該音訊信號輸入頻譜包含多個頻譜係數，其中該等頻譜係數中之每一者具有一在該音訊信號輸入頻譜內的頻譜位置、一頻譜值及一比較值，其中該等頻譜係數根據其在該音訊信號輸入頻譜內的頻譜位置而依序排序，使得該等頻譜係數形成一頻譜係數序列，其中該等頻譜係數中之每一者具有一或多個前任者及一或多個後繼者中的至少一者，其中該頻譜係數之該等前任者中之每一者為該等頻譜係數中在該序列內居於該頻譜係數之前的一個頻譜係數，其中該頻譜係數之該等後繼者中之每一者為該等頻譜係數中在該序列內居於該頻譜係數之後的一個頻譜係數，且其中該方法包含：判定一或多個極值係數，藉由將該等極值係數中的至少一者的該等前任者中的至少一者或該等後繼者中的至少一者的該頻譜值設定為一預定義值，來修正該音訊信號輸入頻譜以獲得一經修正音訊信號頻譜，其中藉由不將該一或多個極值係數之該等頻譜值設定為該預定義值，或藉由用一偽係數代替該一或多個極值係數中的至少一者，來進行修正該音訊信號輸入頻譜，其中該偽係數之該頻譜值不同於該預定義值，處理該經修正音訊信號頻譜以獲得一經編碼音訊信號頻譜，以及產生並傳輸旁資訊，其中藉由定位該經修正音訊信號輸入頻譜內的一或多個偽係數候選者來產生該旁資訊，其中藉由選擇該等偽係數候選者中的至少一者作為選定候選者來產生該旁資訊，且其中產生該旁資訊以使得該旁資訊指出該等選定候選者作為該等偽係數，其中判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，此頻譜係數之頻譜值大於其前任者中之至少一者的該頻譜值，且此頻譜係數之該頻譜值大於其後繼者中之至少一者的該頻譜值，或其中該等頻譜係數中之每一者具有一與該頻譜係數相關聯的比較值，其中判定該一或多個極值係數，使得該等極值係數中之每一者為該等頻譜係數中之一個頻譜係數，此頻譜係數之該比較值大於其前任者中之至少一者的該比較值，且此頻譜係數之該比較值大於其後繼者中之至少一者的該比較值。
一種用以在電腦或信號處理器上執行的電腦程式，其執行時係實施如請求項29或30所述之方法。