TWI555010B

TWI555010B - 音訊編碼方法及裝置、音訊解碼方法以及非暫時性電腦可讀記錄媒體

Info

Publication number: TWI555010B
Application number: TW103143185A
Authority: TW
Inventors: 李男淑; 金賢郁
Original assignee: 三星電子股份有限公司
Priority date: 2013-12-16
Filing date: 2014-12-11
Publication date: 2016-10-21
Also published as: TW201539432A; WO2015093742A1; CN106030704A; US10186273B2; EP3069337A1; US20170018280A1; CN106030704B; KR102251833B1; EP3069337A4; KR20150069919A; JP6573887B2; EP3069337B1; JP2017504054A

Description

音訊編碼方法及裝置、音訊解碼方法以及非暫時性電腦可讀記錄媒體

【相關申請案】

本申請案主張2013年12月16日在韓國智慧財產局申請的韓國專利申請案第10-2013-0156643號的權益，此案的全部揭露內容以引用的方式併入本文中。

本發明的一或多個實施例是關於用於對音訊信號進行編碼或解碼的方法及裝置，且更特定言之是關於用於藉由使用音調濾波器來對音訊信號進行編碼或解碼的方法及裝置。

當對音訊信號進行編碼時，為了確保短的潛伏時間，作為編碼的基本單位的訊框的長度應為小的。或者，為了確保高的聲音品質，訊框的長度應足夠長以達成足夠頻率解析度。因此，難以同時獲得短的潛伏時間以及高的聲音品質。

一般音訊編碼系統可藉由根據待使用的應用而減小訊框的長度以便縮短潛伏時間而降低聲音的品質。或者，為了縮短潛伏時間，一般音訊編碼系統可使用某些類型的窗口函數，所述窗口函數妨礙聲音的完美重新建構。特定言之，在要求短的潛伏時間的應用中，短的訊框引起頻率解析度的減小以及聲音品質的降低。

在將短窗口用於短的潛伏時間的音訊編碼系統中，音調濾波器可用於減小在具有週期性波形的音樂及話音上顯著地發生的寫碼失真。

本發明的一或多個實施例包含用於對音訊信號進行編碼的方法及裝置以及用於對音訊信號進行解碼的方法及裝置，其中在所述音訊信號的編碼及解碼期間產生的錯誤減少以提高經重新建構的音訊信號的音訊品質。

額外態樣將部分闡述於下文的描述中，且將部分自所述描述顯而易見，或可藉由實踐所呈現的實施例而獲悉。

根據本發明的一或多個實施例，一種音訊編碼方法包含：偵測音訊信號的音調；基於所述所偵測的音調而判定濾波係數；基於所述所判定的濾波係數而對所述音訊信號執行第二濾波；以及對由所述第二濾波產生的音訊信號進行編碼。

所述音訊編碼方法可更包含：對所述音訊信號執行第一濾波，其中所述音調的所述偵測包括偵測由所述第一濾波產生的所述音訊信號的音調。

所述第一濾波的所述執行可包含執行使屬於包含於所述音訊信號中的某頻帶的頻率分量的量值增大的預強調，以使得所述量值大於不屬於所述某頻帶的其他頻率分量的量值。

所述音調的所述偵測可包含自所述音訊信號獲取關於所述音調的資訊，關於所述音調的所述資訊包括以下各者中的至少一者：音調週期、音調增益、音調抽頭(pitch tap)，以及指示是否已執行所述第二濾波的旗標。

所述第二濾波的所述執行可包含對所述音訊信號執行梳形濾波。

所述音調的所述偵測可包含自所述音訊信號獲取關於所述音調的資訊。由所述第二濾波產生的所述音訊信號的所述編碼可包含產生並輸出位元串流，所述位元串流包含由所述第二濾波產生的所述音訊信號以及關於所述音調的所述資訊。關於所述音調的所述資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行所述第二濾波的旗標。

所述位元串流的所述產生及輸出可包含產生並輸出所述位元串流，以使得關於所述音調的所述資訊位於所述位元串流的輔助區域中。

所述音調的所述偵測可包含自所述音訊信號分裂而成的多個訊框中的每一者獲取關於所述音調的資訊，關於所述音調的所述資訊包含音調週期、音調增益、音調抽頭，以及指示是否已執行所述第二濾波的旗標。由所述第二濾波產生的所述音訊信號的所述編碼可包含將關於所述音調的所述資訊延遲一個訊框；以及產生並輸出位元串流，所述位元串流包含由所述第二濾波產生的所述音訊信號以及關於所述音調的所述經延遲的資訊。

根據本發明的一或多個實施例，一種音訊解碼方法包含：接收經編碼的信號；對所述所接收的經編碼的信號進行解碼；以及對由所述解碼產生的經解碼的信號進行濾波。所述經編碼的信號是藉由偵測音訊信號的音調、基於所述所偵測的音調而對所述音訊信號執行第二濾波且對由所述第二濾波產生的音訊信號進行編碼而產生的。所述經解碼的信號的所述濾波包含執行所述第二濾波的逆濾波。

在所述音訊解碼方法中，所述經編碼的信號可藉由對音訊信號執行第一濾波且偵測由所述第一濾波產生的音訊信號的音調而產生。

在所述音訊解碼方法中，所述經編碼的信號的接收可包含接收所述經編碼的信號，所述經編碼的信號包含自由所述第一濾波產生的所述音訊信號獲取的關於所述音調的資訊。所述經解碼的信號的濾波可包含自所述所接收的經編碼的信號提取關於所述音調的所述資訊；以及基於關於所述音調的所述資訊而判定用於對所述經解碼的信號進行濾波的濾波係數。

根據本發明的一或多個實施例，一種音訊編碼裝置包含：音調偵測器，其偵測音訊信號的音調；第二濾波器，其基於所述所偵測的音調而判定濾波係數且基於所述所判定的濾波係數而對所述音訊信號執行第二濾波；以及編碼器，其對由所述第二濾波產生的音訊信號進行編碼。

所述音訊編碼裝置可更包含：第一濾波器，其對音訊信號執行第一濾波，且所述音調偵測器可偵測由所述第一濾波產生的所述音訊信號的音調。

在所述音訊編碼裝置中，所述第一濾波器可執行使屬於包含於所述音訊信號中的某頻帶的頻率分量的量值增大的預強調，以使得所述量值大於不屬於所述某頻帶的其他頻率分量的量值。

在所述音訊編碼裝置中，所述音調偵測器可自所述音訊信號獲取關於所述音調的資訊，關於所述音調的所述資訊包含音調週期、音調增益、音調抽頭，以及指示是否已應用所述第二濾波器的旗標。

在所述音訊編碼裝置中，所述第二濾波器可對所述音訊信號執行梳形濾波。

在所述音訊編碼裝置中，所述音調偵測器可自所述音訊信號獲取關於所述音調的資訊，所述編碼器可產生並輸出位元串流，所述位元串流包含由所述第二濾波產生的所述音訊信號以及關於所述音調的所述資訊，且關於所述音調的所述資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已應用所述第二濾波器的旗標。

在所述音訊編碼裝置中，所述編碼器可產生並輸出所述位元串流，以使得關於所述音調的所述資訊位於所述位元串流的輔助區域中。

在所述音訊編碼裝置中，所述音調偵測器可自所述音訊信號分裂而成的多個訊框中的每一者獲取關於所述音調的資訊，關於所述音調的所述資訊包括以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已應用所述第二濾波器的旗標。所述編碼器可將關於所述音調的所述資訊延遲一個訊框，且產生並輸出位元串流，所述位元串流包含由所述第二濾波產生的所述音訊信號以及關於所述音調的所述經延遲的資訊。

根據本發明的一或多個實施例，一種音訊解碼裝置包含：解碼器，其接收經編碼的信號並對所述經編碼的信號進行解碼；以及濾波器，其對由所述解碼產生的經解碼的信號進行濾波。所述經編碼的信號是藉由偵測音訊信號的音調、基於所述所偵測的音調而對所述音訊信號執行第二濾波且對由所述第二濾波產生的音訊信號進行編碼而產生的，且所述濾波器執行所述第二濾波的逆濾波。

在所述音訊解碼裝置中，所述經編碼的信號可藉由對所述音訊信號執行第一濾波且偵測由所述第一濾波產生的音訊信號的音調而產生。

在所述音訊解碼裝置中，所述解碼器接收所述經編碼的信號，所述經編碼的信號包含自由所述第一濾波產生的所述音訊信號獲取的關於所述音調的資訊。所述濾波器可自所述所接收的經編碼的信號提取關於所述音調的所述資訊，且基於關於所述音調的所述資訊而判定用於對所述經解碼的信號進行濾波的濾波係數。

根據本發明的一或多個實施例，一種音訊編碼方法包含：藉由使用自音訊信號獲取的關於音調的資訊而對所述音訊信號進行預濾波；藉由使用具有預定重疊區段的窗口而對由所述預濾波產生的音訊信號執行窗口化；以及基於所述預定重疊區段藉由對由所述窗口化產生的音訊信號進行編碼且藉由對關於所述音調的所述資訊進行編碼來產生並輸出位元串流。

在所述音訊編碼方法中，所述位元串流的所述產生及輸出可包含基於所述預定重疊區段而判定編碼延遲；以及根據所述所判定的編碼延遲來延遲關於所述音調的所述資訊，且輸出關於所述音調的經延遲的資訊。

在所述音訊編碼方法中，所述音訊信號的所述預濾波可包含自所述音訊信號分裂而成的多個訊框中的每一者獲取關於所述音調的所述資訊。所述重疊區段的長度可為所述窗口的50%或50%以上，且所述位元串流的所述產生及輸出可包含基於所述重疊區段而將關於所述音調的所述資訊延遲一個訊框，且輸出關於所述音調的經延遲的資訊。

在所述音訊編碼方法中，所述位元串流的所述產生及輸出可包含產生並輸出所述位元串流，以使得關於所述音調的所述資訊位於所述位元串流的輔助區域中。關於所述音調的所述資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行所述預濾波的旗標。

在所述音訊編碼方法中，關於所述音調的所述資訊可包含指示是否已執行所述預濾波的旗標，且可更包含以下各者中的至少一者：音調週期、音調增益以及音調抽頭。所述位元串流的所述產生及輸出可包含產生並輸出所述位元串流，以使得所述旗標位於所述位元串流的標頭中，且所述音調週期、所述音調增益以及所述音調抽頭中的至少一者位於所述位元串流的輔助區域中。

在所述音訊編碼方法中，所述音訊信號的所述預濾波可包含對所述音訊信號執行第一濾波；自由所述第一濾波產生的音訊信號獲取關於所述音調的所述資訊；基於關於所述音調的所述資訊而判定濾波係數；以及基於所述所判定的濾波係數而對所述音訊信號執行第二濾波。

根據本發明的一或多個實施例，一種音訊解碼方法包含：自所接收的位元串流獲取經頻率變換的音訊信號以及關於音調的資訊；逆變換所述經頻率變換的音訊信號；藉由使用具有重疊區段的窗口而對由所述逆變換產生的音訊信號執行窗口化；藉由使用關於所述音調的所述資訊而對由所述窗口化產生的音訊信號進行後濾波，其中所述後濾波對應於在編碼期間執行的預濾波，且關於所述音調的所述資訊基於所述重疊區段而編碼於所述所接收的位元串流中。

在所述音訊解碼方法中，關於所述音調的所述資訊可根據基於所述重疊區段而判定的編碼延遲來延遲。

在所述音訊解碼方法中，所述音訊信號的所述後濾波可包含自所述所接收的位元串流的輔助區域獲取關於所述音調的所述資訊，且關於所述音調的所述資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行所述預濾波的旗標。

根據本發明的一或多個實施例，一種音訊編碼裝置包含：預濾波器，其藉由使用自音訊信號獲取的關於音調的資訊而對所述音訊信號進行預濾波；以及編碼器，其藉由以下方式而產生並輸出位元串流：藉由使用具有預定重疊區段的窗口而對由所述預濾波產生的音訊信號執行窗口化，以及基於所述預定重疊區段對由所述窗口化產生的音訊信號進行編碼且對關於所述音調的所述資訊進行編碼。

在所述音訊編碼裝置中，所述編碼器可基於所述預定重疊區段而判定編碼延遲，根據所述所判定的編碼延遲而延遲關於所述音調的所述資訊，以及輸出關於所述音調的經延遲的資訊。

在所述音訊編碼裝置中，所述預濾波器可自所述音訊信號分裂而成的多個訊框中的每一者獲取關於所述音調的所述資訊，所述重疊區段的長度可為所述窗口的50%或50%以上，且所述編碼器可基於所述重疊區段而將關於所述音調的所述資訊延遲一個訊框，且輸出關於所述音調的經延遲的資訊。

I在所述音訊編碼裝置中，所述編碼器可產生並輸出所述位元串流，以使得關於所述音調的所述資訊位於所述位元串流的輔助區域中，且關於所述音調的所述資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已應用所述預濾波器的旗標。

在所述音訊編碼裝置中，關於所述音調的所述資訊可包含指示是否已應用所述預濾波器的旗標，且可更包含以下各者中的至少一者：音調週期、音調增益以及音調抽頭。所述編碼器可產生並輸出所述位元串流，以使得所述旗標位於所述位元串流的標頭中，且所述音調週期、所述音調增益以及所述音調抽頭中的至少一者位於所述位元串流的輔助區域中。

在所述音訊編碼裝置中，所述預濾波器可對所述音訊信號執行第一濾波，自由所述第一濾波產生的音訊信號獲取關於所述音調的所述資訊，基於關於所述音調的所述資訊而判定濾波係數，且藉由使用所述所判定的濾波係數而對所述音訊信號執行第二濾波。

根據本發明的一或多個實施例，一種音訊解碼裝置包含：解碼器，其自所接收的位元串流獲取經頻率變換的音訊信號以及關於音調的資訊，逆變換所述經頻率變換的音訊信號，以及藉由使用具有預定重疊區段的窗口而對由所述逆變換產生的音訊信號執行窗口化；以及後濾波器，其藉由使用關於所述音調的所述資訊而對由所述窗口化產生的音訊信號進行後濾波。所述後濾波器執行對應於在編碼期間執行的預濾波的後濾波，且關於所述音調的所述資訊基於所述重疊區段而編碼於所述所接收的位元串流中。

在所述音訊解碼裝置中，關於所述音調的所述資訊可根據基於所述重疊區段而判定的編碼延遲來延遲。

在所述音訊解碼裝置中，所述後濾波器可自所述所接收的位元串流的輔助區域獲取關於所述音調的所述資訊，且關於所述音調的所述資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行所述預濾波的旗標。

根據本發明的一或多個實施例，一種非暫時性電腦可讀記錄媒體上記錄有程式，所述程式在由電腦執行時執行上述方法。

10‧‧‧音訊編碼裝置

11‧‧‧音調預濾波器

12‧‧‧預強調單元

13‧‧‧音調偵測器

14‧‧‧梳形濾波器

15‧‧‧編碼器

20‧‧‧音訊解碼裝置

21‧‧‧音調後濾波器

22‧‧‧解強調單元

24‧‧‧梳形濾波器

25‧‧‧解碼器

30‧‧‧一般音訊編解碼器系統

100‧‧‧音訊編碼裝置

110‧‧‧第一濾波器

120‧‧‧音調偵測器

130‧‧‧第二濾波器

140‧‧‧濾波單元

150‧‧‧編碼器

200‧‧‧音訊解碼裝置

240‧‧‧濾波器

250‧‧‧解碼器

500‧‧‧音訊編碼裝置

510‧‧‧預濾波器

550‧‧‧編碼器

600‧‧‧音訊解碼裝置

610‧‧‧後濾波器

650‧‧‧解碼器

801‧‧‧當前訊框

802‧‧‧當前訊框

803‧‧‧下一訊框

804‧‧‧窗口

805‧‧‧窗口

1101‧‧‧當前訊框

1102‧‧‧當前訊框

1103‧‧‧下一訊框

1104‧‧‧窗口

1105‧‧‧窗口

1401‧‧‧標頭

1402‧‧‧額外資訊區域

1403‧‧‧原始資料區域

1404‧‧‧輔助區域

1410‧‧‧音調資訊

1600‧‧‧音訊編碼裝置

1610‧‧‧音調預濾波器

1620‧‧‧窗口化單元

1630‧‧‧頻率變換器

1640‧‧‧量化器

1650‧‧‧心理聲學模型單元

1660‧‧‧熵編碼器

1670‧‧‧位元串流形成器

S610~S650、S710~S730、S1210~S1230、S1310~S1340‧‧‧操作

N‧‧‧音調資訊

N+1‧‧‧音調資訊

結合附圖，自實施例的以下描述，此等及/或其他態樣將變得顯而易見且更容易理解。

圖1為一般音訊編解碼器系統的方塊圖。

圖2為執行音調預濾波的一般音訊編碼裝置的方塊圖。

圖3為執行音調後濾波的一般音訊解碼裝置的方塊圖。

圖4A及圖4B為根據本發明的實施例的音訊編碼裝置的方塊圖。

圖5為根據本發明的實施例的音訊解碼裝置的方塊圖。

圖6為根據本發明的實施例的音訊編碼方法的流程圖。

圖7為根據本發明的實施例的音訊解碼方法的流程圖。

圖8A至圖8E為用於解釋在一般音訊編解碼器系統中發生的延遲的圖式。

圖9為根據本發明的另一實施例的音訊編碼裝置的方塊圖。

圖10為根據本發明的另一實施例的音訊解碼裝置的方塊圖。

圖11A至圖11E為用於解釋根據本發明的實施例的音訊編解碼器系統基於對訊框進行解碼的時間點而傳輸關於音調的資訊的方法的圖式。

圖12為根據本發明的另一實施例的音訊編碼方法的流程圖。

圖13為根據本發明的另一實施例的音訊解碼方法的流程圖。

圖14A至圖14E為用於解釋根據本發明的實施例的包含關於音調的資訊的位元串流的結構的圖式。

圖15A及圖15B說明用於AC-3編解碼器中的位元串流的結構，以及用於E-AC3編解碼器中的位元串流的結構。

圖16為根據本發明的實施例的使用心理聲學模型的音訊編碼裝置的方塊圖。

現將詳細參考實施例，所述實施例的實例說明於附圖中，其中相似參考數字在全文中指示相似部件。就此而言，本發明的實施例可具有不同形式且不應解釋為限於本文所闡述的描述。因此，在下文中，僅藉由參考附圖來描述實施例以解釋本說明書的態樣。如本文所使用，術語「及/或」包含相關聯的所列出項目中的一或多者的任何及所有組合。諸如「......中的至少一者」的表達在元件的清單之前時修飾元件的整個清單，而不是修飾清單的個別元件。

在本說明書中，以下術語可根據以下準則來解釋，且甚至本文中未使用的術語亦可根據以下觀點來解釋。

用於實施例中的術語「~單元」或「~器」指示包含軟體或硬體的組件，諸如，場可程式化閘陣列(Field Programmable Gate Array,FPGA)或特殊應用積體電路(Application-Specific Integrated Circuit,ASIC)，且術語「~單元」或「~器」起某些作用。然而，「~單元」或「~器」並不限於軟體或硬體。術語「~單元」或「~器」可經組態以包含於可定址儲存媒體中或再生一或多個處理器。因此，舉例而言，術語「~單元」或「~器」可包含物件導向式軟體組件、類別組件及任務組件，以及處理程序、函數、屬性、程序、副常式、程式碼區段、驅動程式、韌體、微碼、電路、資料、資料庫、資料結構、表、陣列以及變數。由組件及單元提供的功能可組合成較小數目的組件及單元，或可進一步分離成額外組件及單元。

術語「窗口的大小」指示，在藉由使用窗口而對音訊信號執行窗口化以使得音訊信號在時域中分裂成多個訊框群組時，藉由對時域中的訊框群組應用時間-頻率變換而產生的頻域中的係數的數目。

本文中所使用的術語「資訊」包含所有值、參數、係數、組件及其類似者，且可根據情形而不同地解釋，且本發明的一或多個實施例並不限於此。

音訊信號在廣義上與視訊信號進行區分，且可為可在再生中聽到的信號。音訊信號在狹義上與話音信號進行區分，且不具有話音特性或某些話音特性。在本說明書中，音訊信號可在廣義上進行解釋，且在與話音信號進行區分時可在狹義上進行解釋。

訊框為用於對音訊信號進行編碼或解碼的資料單元，且並不限於某數目的樣本或某時間量。

音調濾波表示自音訊信號濾除時間段(即，音調)以提高編碼效率的方法。

根據本發明的實施例，用於對音訊信號進行編碼/解碼的方法及裝置可為用於對音訊信號的頻率變換係數進行編碼/解碼的方法及裝置，且亦可為用於應用對音訊信號的頻率變換係數進行編碼/解碼的方法及裝置的音訊信號處理方法及裝置。

為了便於解釋，本文中可描述用於單一窗口的音訊編碼/解碼方法及裝置的操作。然而，在根據本發明的實施例的音訊編碼/解碼方法及裝置中，所描述的操作可針對音訊信號分裂而成的多個窗口中的每一者重複。

現將參看附圖來更全面地描述本發明，附圖中繪示了本發明的例示性實施例。

圖1為一般音訊編解碼器系統30的方塊圖。

參看圖1，一般音訊編解碼器系統30包含音訊編碼裝置10以及音訊解碼裝置20。

音訊編碼裝置10接收輸入音訊信號且對輸入音訊信號進行編碼。音訊編碼裝置10藉由對輸入音訊信號進行編碼而產生經壓縮的音訊位元串流。音訊解碼裝置20接收經壓縮的音訊位元串流並對經壓縮的音訊位元進行解碼。音訊解碼裝置20藉由對經壓縮的音訊位元串流進行解碼而產生輸出音訊信號。

音訊編碼裝置10可逐個訊框地處理輸入音訊信號。舉例而言，每一訊框可具有在2.5毫秒(ms)與40毫秒之間的訊框大小，且包含對應於訊框大小的音訊樣本。

音訊編碼裝置10的編碼器15可將時域音訊信號樣本變換為頻域變換係數。編碼器15可對頻域變換係數進行量化、編碼或壓縮。編碼器15可直接將對應於經壓縮的頻域變換係數的位元串流傳輸至音訊解碼裝置20，或可將位元串流儲存於儲存媒體中，且稍後將所儲存的位元串流傳輸至音訊解碼裝置20。

音訊解碼裝置20的解碼器25對經壓縮的音訊位元串流進行解碼以恢復經量化的變換係數。音訊解碼裝置20可應用逆變換以將經量化的變換係數改變回時域音訊信號樣本。音訊解碼裝置20可執行重疊加法運算以消除訊框邊界處的時域波形不連續性。

當音訊信號的波形為週期性時，人類聽覺系統傾向於對音訊信號中的極小寫碼失真較敏感。因此，音調預濾波器11以及音調後濾波器21可用於減小在具有週期性波形的音樂及音訊信號中顯著地發生的寫碼失真。

音調預濾波器11以及音調後濾波器21可減小諧波分量之間的波谷中產生的量化雜訊的大小。音調預濾波器11以及音調後濾波器21稍達成雜訊成形。現將參看圖2及圖3更詳細地描述音調預濾波器11以及音調後濾波器21。

圖2為執行音調預濾波的音訊編碼裝置10的方塊圖。

參看圖2，音訊編碼裝置10的音調預濾波器11可包含預強調單元12、音調偵測器13以及梳形濾波器14。因為圖2的編碼器15對應於圖1的編碼器15，所以將省略其重複描述。

預強調單元12可強調輸入信號的重要頻率分量。預強調單元12可藉由增大某頻帶中的頻率分量的量值來強調屬於某頻帶的頻率分量，以使得其量值大於不屬於某頻帶的其他頻率分量的量值。或者，預強調單元12可藉由自輸入信號濾除其他頻率分量來強調屬於某頻帶的頻率分量。

包含於音訊信號的低頻率頻帶中的分量與包含於音訊信號的高頻率頻帶中的分量相比隨時間改變極小。因此，當處理音訊信號時，為了自音訊信號提取音調分量，必須強調包含於音訊信號的高頻率頻帶中的分量。音訊編碼裝置10可藉由將高通濾波器用作預強調單元12來移除包含於低頻率頻帶中的分量。使用高通濾波器而實施的預強調單元12可表示為：【方程式1】 y[n]=x[n]-a×x[n-1]

其中x[n]表示當前輸入至預強調單元12的信號，x[n-1]表示先前輸入至預強調單元12的信號，y[n]表示預強調單元12的輸出信號，且α表示範圍可為0.9至1的濾波係數。

音調偵測器13可藉由使用各種音調偵測演算法來偵測自預強調單元12輸出的音訊信號的音調。

梳形濾波器14可基於所偵測的音調而判定濾波係數。梳形濾波器14可藉由使用所判定的濾波係數而將梳形濾波應用於輸入音訊信號。舉例而言，梳形濾波器14可提升頻域中的音調諧波分量之間的波谷。或者，梳形濾波器14可抑制頻域中的音調諧波波峰。

圖3為執行音調後濾波的音訊解碼裝置20的方塊圖。

參看圖3，音訊解碼裝置20的音調後濾波器21可包含梳形濾波器24以及解強調單元22。因為圖3的解碼器25對應於圖1的解碼器25，所以將省略其重複描述。

圖3的梳形濾波器24可為圖2的梳形濾波器14的逆濾波器。因此，梳形濾波器24可使頻域中的音調諧波分量之間的波谷衰減。或者，梳形濾波器24可提升頻域中的音調諧波波峰。

因為解強調單元22與預強調單元12互補，所以解強調單元22可為預強調單元12的逆濾波器。解強調單元22補償由音訊編碼裝置10的預強調單元12強調的頻率分量。換言之，解強調單元22可減小屬於某頻帶的頻率分量的量值，以使得其量值小於其他頻率分量的量值。

實施例1

圖1至圖3的一般音訊編解碼器系統30的音訊編碼裝置10偵測由預強調單元12預強調的輸入音訊信號的音調以便達成準確音調偵測。音訊編碼裝置10藉由使用基於所偵測的音調而判定的濾波係數來執行梳形濾波。音訊編碼裝置10在頻域中對由預強調單元12預強調的輸入音訊信號進行編碼，以產生位元串流。接著，音訊編碼裝置10將位元串流傳輸至音訊解碼裝置20。

一般音訊編解碼器系統30的音訊解碼裝置20對接收自音訊編碼裝置10的位元串流執行頻域解碼、梳形濾波以及解強調。

根據一般音訊編解碼器系統30，預強調的音訊信號經受梳形濾波，且由梳形濾波產生的信號經受編碼、解碼以及解強調。因此，由一般音訊編解碼器系統30輸出的輸出音訊信號具有經由預強調及解強調累積的錯誤。

根據一般音訊編解碼器系統30，隨著音訊信號穿過音訊編碼裝置10以及音訊解碼裝置20，在音訊信號中發生寫碼錯誤。因為經由預強調、梳形濾波、編碼以及解碼而獲得的信號具有寫碼錯誤，所以信號不同於輸入至音訊編碼裝置10的音訊信號。因此，即使在輸入至音訊解碼裝置20的位元串流在解強調單元22中經受解強調，音訊解碼裝置20亦可能不輸出準確的原始音訊信號。

在根據本發明的實施例的音訊編碼裝置及方法以及音訊解碼裝置及方法中，可選擇性地應用對音訊信號的預強調，藉此解決上述問題並提高經重新建構的音訊信號的品質。

圖4A為根據本發明的實施例的音訊編碼裝置100的方塊圖。

參看圖4A，音訊編碼裝置100可包含濾波單元140以及編碼器150。

濾波單元140經組態以減小發生於週期性音訊信號中的寫碼失真。濾波單元140可包含音調偵測器120以及第二濾波器130。

音調偵測器120偵測音訊信號的音調。偵測音訊信號的音調可包含自音訊信號的每一訊框獲取關於音調的資訊，其中音訊信號分裂成訊框。偵測音訊信號的音調亦可包含判定稍後將描述的第二濾波器130的濾波係數。舉例而言，音調偵測器120可自音訊信號獲取以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已應用第二濾波器130的旗標。

第二濾波器130基於由音調偵測器120偵測的音調而判定濾波係數。第二濾波器130基於所判定的濾波係數而對音訊信號執行第二濾波。基於由音調偵測器120偵測的關於音調的資訊，可判定第二濾波器130的增益。舉例而言，第二濾波器130可對音訊信號執行梳形濾波，但本發明的實施例不限於此。

舉例而言，當第二濾波器130為全零梳形濾波器時，第二濾波器130的轉移函數H_pre(z)可表示為：【方程式2】H_pre(z)=(1-bz^-p)

其中p表示自音訊信號獲得的音調週期，且b表示自音訊信號獲得的音調抽頭。在方程式2中，b被選擇為0≦b<1。若判定音訊信號並不具有足夠週期性，則b可為0。音訊信號週期性愈大，b愈靠近1。

根據本發明的實施例，第二濾波器130可由使用者選擇性地使用以對音訊信號進行編碼。在此狀況下，可進一步提供獨立切換器(未圖示)。在第二濾波器130經選擇性地使用以使圖5的音訊解碼裝置200執行對應於由第二濾波器130執行的第二濾波的處理程序的狀況下，音調偵測器120可產生表示是否已應用第二濾波器130的旗標，且可將旗標傳輸至音訊解碼裝置200。換言之，音調偵測器120可基於音訊信號而判定第二濾波器130是否對音訊信號執行第二濾波。音調偵測器120可將表示判定的結果的旗標傳輸至音訊解碼裝置200。舉例而言，表示第二濾波器130的使用或未使用的旗標可包含於位元串流的標頭中，且可接著被傳輸。

編碼器150對由第二濾波產生的音訊信號進行編碼。編碼器150可產生並輸出包含由第二濾波產生的音訊信號的位元串流。

詳言之，編碼器150可對包含於由第二濾波產生的音訊信號中的多個窗口中的每一者執行頻率變換。編碼器150可藉由對由第二濾波產生的音訊信號執行時間至頻率變換(即，時間至頻率映射)來產生頻率變換係數。對音訊信號的頻率變換可經由正交鏡像濾波器組(Quadrature Mirror Filterbank,QMF)、修改型離散傅立葉變換(Modified Discrete Fourier Transform,MDCT)、快速傅立葉變換(Fast Fourier Transform,FFT)或其類似者來達成，但本發明的實施例不限於此。

編碼器150可對變換係數進行量化。編碼器150可對經量化的變換係數執行無雜訊寫碼及位元串流封裝，以產生並輸出經編碼的位元串流。

編碼器150可產生位元串流，其包含由第二濾波產生的音訊信號與關於音調的資訊兩者。由濾波單元140執行的音調濾波為一種自音訊信號濾除時間段(即，音調)以提高編碼效率的方法。因此，若現有編解碼器意欲用於音調濾波，則需要一種維持現有編解碼器與使用音調濾波器的編解碼器之間的相容性的方法。根據當前實施例的編碼器150可產生並輸出位元串流，所述位元串流在其輔助區域中包含關於音調的資訊。

歸因於在音訊編碼期間發生的潛時，藉以傳輸關於音調的資訊的訊框可不同於藉以傳輸音訊信號的訊框。因此，編碼器150可延遲並輸出關於音調的資訊，以使得正輸出的關於音調的資訊與正解碼的訊框同步。舉例而言，當音訊編碼裝置100使用50%重疊窗口時，編碼器150可使關於音調的資訊延遲一個訊框。在此狀況下，音訊編碼裝置100可產生位元串流，所述位元串流包含由第二濾波產生的音訊信號以及關於音調的經延遲的資訊。稍後將參看圖8至圖13更詳細地描述輸出關於音調的經延遲的資訊的方法。儘管圖9至圖13是關於本發明的實施例2，但其可應用於本發明的實施例1。

根據本發明的實施例，音訊編碼裝置100可減小在預強調期間發生的複雜性。根據另一實施例，音訊編碼裝置100可藉由對原始音訊信號而非經預強調的音訊信號進行編碼來減少寫碼錯誤。

參看作為本發明的另一實施例的圖4B，除音調偵測器120以及第二濾波器130外，濾波單元140可更包含第一濾波器110。因為圖4B的音調偵測器120、第二濾波器130以及編碼器150分別對應於圖4A的音調偵測器120、第二濾波器130以及編碼器150，所以將省略其重複描述。

第一濾波器110對音訊信號執行第一濾波。第一濾波器110處理音訊信號，以使得可對音訊信號執行音調偵測。舉例而言，第一濾波器110可對音訊信號執行預強調以強調音訊信號的某頻率頻帶。預強調可包含增大屬於某頻帶的頻率分量的量值，以使得其量值大於不屬於某頻帶的其他頻率分量的量值。或者，預強調可包含減小其他頻率分量的量值，以使得其他頻率分量的量值小於屬於某頻帶的頻率分量的量值。

若第一濾波器110執行預強調，則圖4B的音訊編碼裝置100可偵測經預強調的音訊信號的音調並對未經受預強調的原始音訊信號進行編碼，藉此提高音調偵測的準確度且亦減少寫碼錯誤。

音調偵測器120偵測由第一濾波器110自第一濾波產生的音訊信號的音調。第二濾波器130基於由音調偵測器120偵測的音調來判定濾波係數。第二濾波器130基於所判定的濾波係數而對音訊信號執行第二濾波。

圖5為根據本發明的實施例的音訊解碼裝置200的方塊圖。

參看圖5，音訊解碼裝置200包含解碼器250以及濾波器240。

解碼器250接收位元串流並對位元串流進行解碼。所接收的位元串流可為藉由以下方式而產生的位元串流：偵測原始音訊信號的音調，基於所偵測的音調而對原始音訊信號執行第二濾波，以及對由第二濾波產生的音訊信號進行編碼。或者，所接收的位元串流可為藉由以下方式而產生的位元串流：對原始音訊信號執行第一濾波，偵測由第一濾波產生的音訊信號的音調，基於所偵測的音調而對原始音訊信號執行第二濾波，以及對由第二濾波產生的音訊信號進行編碼。因此，在解碼器250處接收的位元串流包含經編碼的音訊信號。所接收的位元串流可包含由音訊編碼裝置100的濾波單元140在音調濾波期間使用的關於音調的資訊。

詳言之，解碼器250藉由對所接收的位元串流進行解量化而產生頻率變換係數。解碼器250可經由頻率至時間變換(即，頻率至時間映射)而逆變換頻率變換係數，以產生並輸出經解碼的信號。頻率至時間變換可為逆QMF(IQMF)、逆MDFT(IMDCT)、逆FFT(IFFT)或其類似者，但本發明的實施例不限於此。

濾波器240對由解碼器250產生的經解碼的信號進行濾波。濾波器240可對經解碼的信號執行經執行以產生位元串流的第二濾波的逆濾波。濾波器240可自所接收的位元串流提取關於音調的資訊，且基於自所接收的位元串流提取的關於音調的資訊而執行對應於由音訊編碼裝置100執行的第二濾波的處理程序。換言之，濾波器240可基於包含於所接收的位元串流中的參數而重新建構由音訊編碼裝置100移除的週期性分量。

由濾波器240使用的關於音調的資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已應用第二濾波器130的旗標。

根據本發明的實施例，濾波器240可選擇性地用於對音訊信號進行解碼。濾波器240可基於包含於所接收的位元串流中並指示是否已將第二濾波器130應用於包含於所接收的位元串流中的經編碼的信號的旗標而選擇性地使用。舉例而言，表示是否已應用第二濾波器130的旗標可包含於位元串流的標頭中，且可接著與位元串流一起傳輸。基於表示是否已應用第二濾波器130的旗標，濾波器240可基於是否已由音訊編碼裝置100執行第二濾波而執行處理程序。因此，濾波器240可基於在音訊編碼裝置100對音訊信號進行編碼時是否使用第二濾波器130而被使用或未被使用。

濾波器240可對經解碼的信號執行梳形濾波，但本發明的實施例不限於此。舉例而言，當音訊編碼裝置100的第二濾波器130為全零梳形濾波器時，音訊解碼裝置200的濾波器240的轉移函數H_pre(z)可表示為：

其中p表示自音訊信號獲得的音調週期，且b表示自音訊信號獲得的音調抽頭。在方程式3中，b被選擇為0≦b<1。當自音訊信號未偵測到足夠週期性時，b可為0。音訊信號週期性愈大，b愈靠近1。

如上文所描述，根據本發明的實施例的音訊編碼裝置100以及音訊解碼裝置200可藉由省略預強調操作以及解強調操作來減小音訊編解碼器系統的複雜性。音訊編碼裝置100可對原始音訊信號而非經預強調的音訊信號進行編碼，藉此減少寫碼錯誤且因此提高經重新建構的音訊信號的品質。音訊編碼裝置100可藉由在音調偵測期間使用經預強調的音訊信號而確保音調偵測的準確度，且亦可藉由在編碼期間使用原始音訊信號來提高經重新建構的音訊信號的品質。

根據本發明的實施例的音訊編碼方法包含由圖4A的音訊編碼裝置100執行的操作。

音訊編碼裝置100可偵測音訊信號的音調，且基於所偵測的音調而判定濾波係數。音訊編碼裝置100可基於所判定的濾波係數而對音訊信號執行第二濾波，且對由第二濾波產生的音訊信號進行編碼。

圖6為根據本發明的另一實施例的音訊編碼方法的流程圖。

參看圖6，音訊編碼方法包含由圖4B的音訊編碼裝置100執行的操作。因此，儘管下文中省略，但圖4B的音訊編碼裝置100的描述可仍應用於圖6的音訊編碼方法。

在操作S610中，圖4B的音訊編碼裝置100可對音訊信號執行第一濾波。圖4B的音訊編碼裝置100可執行預強調以強調音訊信號的某頻率頻帶。換言之，圖4B的音訊編碼裝置100可執行預強調以增大屬於包含於音訊信號中的某頻帶的頻率分量的量值，以使得其量值大於其他頻率分量的彼等量值，或減小其他頻率分量的量值。

在操作S620中，音訊編碼裝置100可偵測由第一濾波產生的音訊信號的音調。音訊編碼裝置100可自音訊信號分裂而成的音訊信號的多個訊框中的每一者獲取關於音調的資訊。音訊編碼裝置100可自音訊信號獲取以下各者中的至少一者作為關於音調的資訊：指示是否已執行第二濾波的旗標、音調週期、音調增益，以及音調抽頭。

在操作S630中，音訊編碼裝置100可基於所偵測的音調而判定濾波係數。

在操作S640中，音訊編碼裝置100可基於所判定的濾波係數而對音訊信號執行第二濾波。舉例而言，音訊編碼裝置100可對音訊信號執行梳形濾波作為第二濾波。

在操作S650中，音訊編碼裝置100可對由第二濾波產生的音訊信號進行編碼。音訊編碼裝置100可產生並輸出位元串流，所述位元串流包含由第二濾波產生的音訊信號與關於音調的資訊兩者。舉例而言，關於音調的資訊可包含於位元串流的輔助區域中。音訊編碼裝置100可使關於音調的資訊延遲一個訊框，且輸出關於音調的經延遲的資訊。音訊編碼裝置100可產生並輸出位元串流，所述位元串流包含由第二濾波產生的音訊信號與關於音調的經延遲的資訊兩者。

圖7為根據本發明的實施例的音訊解碼方法的流程圖。

參看圖7，音訊解碼方法包含由圖5的音訊解碼裝置200執行的操作。因此，儘管下文省略，但圖5的音訊解碼裝置200的描述可仍應用於圖7的音訊解碼方法。

在操作S710中，音訊解碼裝置200接收經編碼的信號。舉例而言，音訊解碼裝置200可接收包含於位元串流中的經編碼的信號。經編碼的信號可為藉由以下方式而產生的信號：偵測原始音訊信號的音調，基於所偵測的音調而對原始音訊信號執行第二濾波，以及對由第二濾波產生的音訊信號進行編碼。或者，經編碼的信號可為藉由以下方式而產生的信號：對原始音訊信號執行第一濾波，偵測由第一濾波產生的音訊信號的音調，基於所偵測的音調而對原始音訊信號執行第二濾波，以及對由第二濾波產生的音訊信號進行編碼。音訊解碼裝置200可接收經編碼的信號，所述經編碼的信號包含自由第一濾波產生的音訊信號獲取的關於音調的資訊。

在操作S720中，音訊解碼裝置200對所接收的經編碼的信號進行解碼。

在操作S730中，音訊解碼裝置200對由解碼產生的經解碼的信號進行濾波。在此狀況下，音訊解碼裝置200可執行在經執行以產生經編碼的信號的編碼期間執行的第二濾波的逆濾波。第二濾波的逆濾波可與第二濾波互補。音訊解碼裝置200可自所接收的經編碼的信號提取關於音調的資訊。音訊解碼裝置200可基於關於音調的資訊而判定用於對經解碼的信號進行濾波的濾波係數。音訊解碼裝置200可基於所判定的濾波係數而對經解碼的信號執行濾波。

實施例2

在圖1至圖3的音訊編解碼器系統30中，音訊編碼裝置10可獲取音調的資訊，且藉由使用低重疊窗口或50%的重疊窗口來執行窗口化，且執行頻域編碼。窗口化表示將音訊信號劃分成小集合，以便執行頻域編碼。

圖8A至圖8E為用於解釋在一般音訊編解碼器系統30中發生的延遲的圖式。圖8A至圖8E說明對包含第(N-2)、第(N-1)、第N及第(N1+1)訊框的音訊信號進行編碼及解碼的狀況。

圖8A說明輸入至音訊編碼裝置10的音訊信號。圖8B說明由音調預濾波器11執行的音調偵測。圖8C說明由編碼器15執行的音訊信號以及關於音調的資訊的編碼。

參看圖8B，音調預濾波器11偵測當前訊框801的音調。音調預濾波器11自當前訊框801獲取音調資訊N+1。音訊編碼裝置10自音訊信號獲取關於音調的資訊，將窗口804應用於音訊信號，且接著執行頻率變換以執行頻域編碼。因此，如圖8C所說明，音訊編碼裝置10對當前訊框801與音調資訊N+1兩者進行編碼，且將編碼的結果傳輸至音訊解碼裝置20。

在圖1至圖3的音訊編解碼器系統30中，音訊解碼裝置20逆變換包含於經壓縮的位元串流中的經量化的變換係數，以產生並輸出經解碼的信號。

圖8D說明由解碼器25執行的解碼。圖8E說明由音調後濾波器21執行的濾波。如圖8D所說明，音訊解碼裝置20可藉由使用大小與由音訊編碼裝置10應用的窗口804相同的窗口805來對音訊信號進行解碼。音訊解碼裝置20需要等待與當前訊框802重疊的下一訊框803，以便逆變換當前訊框802。換言之，時間延遲歸因於等待重疊區段而發生。舉例而言，如圖8E所說明，若應用50%重疊窗口，則發生一個訊框的延遲。

如圖8A至圖8E所說明，音訊編碼裝置10將提取自訊框的關於音調的資訊與訊框一起傳輸至音訊解碼裝置20。然而，音訊解碼裝置20使用關於音調的資訊以對在所述訊框之前出現的訊框進行解碼。如圖8E所說明，音訊解碼裝置20使用音調資訊N+1來對當前訊框802進行解碼。音調資訊N+1為由音訊編碼裝置10自下一訊框803獲得的資訊，其中下一訊框803為當前訊框802的下一訊框。

如圖8C所說明，音訊編碼裝置10藉以傳輸關於音調的資訊的訊框與音訊編碼裝置10藉以傳輸經頻率變換的音訊信號的訊框相同。然而，當執行頻域解碼時，發生解碼延遲。因此，音訊解碼裝置20藉由使用已自正解碼的訊框的先前訊框獲取的關於音調的資訊來對訊框進行解碼。

因此，當關於音調的資訊應用於經解碼的音訊信號時，關於音調的資訊需要基於解碼延遲來傳輸以便提高經重新建構的音訊信號的品質。換言之，需要一種方法，其中，在對被提取關於音調的資訊的訊框進行解碼的時間點使用關於音調的資訊。

在根據本發明的實施例的音訊編碼裝置及方法以及音訊解碼裝置及方法中，基於對被獲取關於音調的資訊的訊框進行解碼的時間點而傳輸關於音調的資訊，藉此解決上述問題並提高經重新建構的音訊信號的音訊品質。

圖9為根據本發明的另一實施例的音訊編碼裝置500的方塊圖。

參看圖9，音訊編碼裝置500包含預濾波器510以及編碼器550。

預濾波器510經組態以減小在週期性音訊信號的編碼及解碼期間顯著地發生的寫碼失真。預濾波器510自輸入音訊信號獲取關於音調的資訊。預濾波器510可藉由使用關於音調的資訊而對輸入音訊信號執行預濾波。舉例而言，預濾波可為提升頻域中的音調諧波分量之間的波谷或抑制音調諧波波峰的操作。

預濾波器510可包含圖1及圖2的音調預濾波器11。或者，預濾波器510可包含圖4A或圖4B的濾波單元140。將省略其重複描述。

預濾波器510可對輸入音訊信號執行第一濾波，且自由第一濾波產生的音訊信號獲取關於音調的資訊。預濾波器510可自音訊信號的每一訊框獲取關於音調的資訊，其中音訊信號分裂成訊框。預濾波器510可基於關於音調的資訊而判定濾波係數，且藉由使用所判定的濾波係數而對輸入音訊信號執行第二濾波。

編碼器550可藉由使用具有重疊區段的窗口而對經音調濾波的音訊信號執行窗口化。編碼器550可基於窗口的重疊區段來對由窗口化產生的音訊信號以及關於音調的資訊進行編碼。基於窗口的重疊區段而對關於音調的資訊進行編碼包含基於窗口的重疊區段而判定解碼延遲，根據所判定的解碼延遲而延遲關於音調的資訊，且對關於音調的經延遲的資訊進行編碼。編碼器550可產生並輸出位元串流，所述位元串流包含經編碼的音訊信號與關於音調的經編碼的資訊兩者。

編碼器550可基於窗口的重疊區段而判定編碼延遲。當在編碼期間使用的窗口的長度等於在解碼期間使用的窗口的長度且兩個窗口的重疊區段的長度相等時，編碼器550可基於在編碼期間使用的窗口的重疊區段而計算在解碼期間產生的潛伏時間。

編碼器550可根據所判定的編碼延遲而延遲關於音調的資訊，以輸出音調的經延遲的資訊。因此，編碼器550可包含緩衝器(未圖示)，所述緩衝器儲存關於音調的資訊歷時預定編碼延遲且接著輸出經延遲的資訊。舉例而言，當窗口的重疊區段的長度為窗口的50%或50%以上時，編碼器550可將關於音調的資訊延遲一個訊框，且基於重疊區段而輸出經延遲的資訊。作為另一實例，當窗口的重疊區段的長度小於窗口的50%時，編碼器550可將關於音調的資訊延遲短於一個訊框的時間段，且基於重疊區段而輸出經延遲的資訊。

圖11A至圖11E為用於解釋根據本發明的實施例的音訊編解碼器系統基於對訊框進行解碼的時間點而傳輸關於音調的資訊的方法的圖式。圖11A至圖11E說明對包含第(N-2)、第(N-1)、第N及第(N1+1)訊框的音訊信號進行編碼及解碼的狀況。

圖11A說明輸入至音訊編碼裝置500的音訊信號。圖11B說明由預濾波器510執行的音調偵測。圖11C說明由編碼器550執行的音訊信號以及關於音調的資訊的編碼。

參看圖11B，預濾波器510偵測當前訊框1101的音調。音調預濾波器510自當前訊框1101獲取音調資訊N+1。

音訊編碼裝置500獲取關於音訊信號的音調的資訊，將窗口1104應用於音訊信號，且接著執行頻率變換以執行頻域編碼。編碼器550基於窗口的重疊區段而判定解碼延遲，根據所判定的解碼延遲而延遲關於音調的資訊，且對關於音調的經延遲的資訊進行編碼。如圖11A至圖11E所說明，當音訊編解碼器系統使用50%的重疊窗口時，音訊編解碼器系統可將關於音調的資訊延遲一個訊框，且輸出關於音調的經延遲的資訊。參看圖11C，當編碼器550對當前訊框1101進行編碼並輸出包含經編碼的當前訊框1101的位元串流時，編碼器550將被延遲一個訊框的音調資訊N與當前訊框1101一起輸出，而非將對應於當前訊框1101的音調資訊N+1與當前訊框1101一起輸出。

當音訊編碼裝置500輸出包含關於音調的資訊的位元串流時，音訊編碼裝置500可基於解碼延遲而將關於音調的資訊儲存於緩衝器中，且輸出關於音調的經延遲的資訊。

編碼器550可產生位元串流，以使得關於音調的資訊包含於位元串流的輔助區域中，以使得可達成ABC與現有音訊編解碼器(例如，進階音訊寫碼(Advanced Audio Coding,AAC)編解碼器、MPEG-1音訊層3(MPEG-1 Audio Layer-3,MP3)編解碼器、增強型低延遲AAC(AAC Enhanced Low Delay,AAC ELD)編解碼器或其類似者)之間的相容性。

關於音調的資訊可包含以下各者中的至少一者：指示是否已應用預濾波器510的旗標、音調週期、音調增益以及音調抽頭。指示是否已應用預濾波器510的旗標表示指示是否已執行預濾波以使得稍後將描述的音訊解碼裝置600可執行對應於預濾波的處理程序的旗標。

參看圖14A，一般位元串流可包含標頭1401、額外資訊區域1402、原始資料區域1403以及輔助區域1404。

舉例而言，如圖14B所說明，根據本發明的另一實施例的編碼器550可產生並輸出緊接於標頭1401包含音調資訊1410的位元串流。或者，如圖14C所說明，根據本發明的另一實施例的編碼器550可產生並輸出緊接於額外資訊區域1402包含音調資訊1410的位元串流。或者，如圖14D所說明，根據本發明的另一實施例的編碼器550可產生並輸出緊接於原始資料區域1403包含音調資訊1410的位元串流。或者，如圖14E所說明，根據本發明的另一實施例的編碼器550可產生並輸出將音調資訊1410包含於輔助區域1404中的位元串流。

編碼器550可產生並輸出位元串流，以使得指示是否已在預濾波器510處執行預濾波以產生位元串流的旗標包含於位元串流的標頭中。且編碼器550可產生並輸出位元串流，以使得除旗標之外的關於音調的資訊如圖14B、圖14C、圖14D或圖14E所說明包含於位元串流的一區域中。

換言之，編碼器550可產生並輸出位元串流，以使得除指示是否已應用預濾波器510的旗標之外的關於音調的資訊緊接於標頭、額外資訊區域以及原始資料區域中的至少一者而定位。

圖15A說明用於AC-3編解碼器中的位元串流的結構，且圖15B說明用於E-AC3編解碼器中的位元串流的結構。在使用圖15A及圖15B的位元串流結構的AC-3編解碼器以及E-AC3編解碼器中，編碼器550可產生並輸出位元串流，以使得關於音調的資訊包含於位元串流的位元串流資訊(bit stream information,BSI)欄位的addbsi(額外資訊)欄位、音訊區塊欄位AB0至AB5的skipfld(填補位元組)或輔助區域AUX中。音訊編碼裝置500不限於前述實例，且可產生並輸出在各種預定區域中包含音調資訊的位元串流。因此，音訊編碼裝置500與諸如以下各者的各種編解碼器相容：約束能量重疊變換(Constrained Energy Lapped Transform,CELT)編解碼器、AAC編解碼器、MP3編解碼器、AAC ELD編解碼器、AC-3編解碼器，以及E-AC3編解碼器。

圖10為根據本發明的另一實施例的音訊解碼裝置600的方塊圖。

參看圖10，音訊解碼裝置600包含解碼器650以及後濾波器610。

解碼器650接收經壓縮的音訊位元串流並對經壓縮的音訊位元串流進行解碼。解碼器650獲取所接收的經壓縮的音訊位元串流的經頻率變換的音訊信號以及關於音調的資訊。解碼器650 逆變換經頻率變換的音訊信號，且藉由使用具有某重疊區段的窗口而對由逆變換產生的音訊信號執行窗口化。解碼器650可藉由使用大小與由音訊編碼裝置500使用以執行窗口化的窗口相同的窗口來執行窗口化。

音訊解碼裝置600的後濾波器610可對應於音訊編碼裝置500的預濾波器510。後濾波器610經組態以減小在週期性音訊信號的編碼及解碼期間顯著地發生的寫碼失真。後濾波器610可基於自所接收的經壓縮的音訊位元串流提取的關於音調的資訊而執行對應於由音訊編碼裝置500執行的預濾波的處理程序。換言之，後濾波器610可基於包含於所接收的經壓縮的音訊位元串流中的參數而重新建構由音訊編碼裝置500移除的週期性分量。舉例而言，關於音調的資訊可包含於所接收的經壓縮的音訊位元串流的輔助區域中。

關於音調的資訊可為根據基於窗口的重疊區段而判定的編碼延遲來延遲的資訊，如上文參看音訊編碼裝置500所描述。關於音調的資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行預濾波的旗標。

後濾波器610可藉由使用關於音調的資訊而對由窗口化產生的音訊信號執行後濾波。後濾波器610可基於關於音調的資訊而判定濾波係數。後濾波器610可基於所判定的濾波係數而對接收自解碼器650的經解碼的音訊信號執行後濾波。後濾波可為抑制頻域中的音調諧波分量之間的波谷或提升音調諧波波峰的操作。

後濾波可對應於在編碼期間執行的預濾波。因此，根據實施例，音訊解碼裝置600可藉由參考包含於所接收的經壓縮的音訊位元串流的標頭中且指示是否已執行預濾波的旗標而選擇性地執行後濾波。

後濾波器610可包含圖1及圖3的音調後濾波器21。或者，後濾波器610可包含圖5的濾波器240。將省略其重複描述。

圖11D說明由圖10的解碼器650執行的解碼。圖11E說明由圖10的後濾波器610執行的濾波。如圖11D所說明，音訊解碼裝置600可藉由使用大小與由音訊編碼裝置500應用的窗口1104相同的窗口1105來對音訊信號進行解碼。音訊解碼裝置600需要等待與當前訊框1102重疊的下一訊框1103，以便逆變換當前訊框1102。換言之，根據重疊區段而發生時間延遲。舉例而言，如圖11D所說明，若應用50%的重疊窗口，則發生一個訊框的延遲。

因此，如圖11E所說明，音訊解碼裝置600在對當前訊框1102進行解碼時使用對應於當前訊框1102的音調資訊N。音調資訊N為音訊編碼裝置500已自第N訊框(即，當前訊框1102)獲取的資訊。

根據音訊編碼裝置500以及音訊解碼裝置600，可在訊框的解碼期間使用準確地對應於正由音訊解碼裝置600解碼的訊框的關於音調的資訊。因此，根據本發明的實施例，可提高經重新建構的音訊信號的音訊品質。

如上文所描述，包含於根據本發明的實施例的音訊編解碼器系統中的音訊編碼裝置500基於編碼延遲而傳輸關於音調的資訊。因此，包含於根據本發明的實施例的音訊編解碼器系統中的音訊解碼裝置600可與正解碼的訊框同步地接收關於音調的資訊。因此，根據本發明的實施例的音訊編解碼器系統可支援對包含於經編碼的音訊信號中的訊框的隨機存取。此外，當經編碼的音訊信號已損壞時，根據本發明的實施例的音訊編解碼器系統可藉由使用準確地對應於無錯誤訊框的關於音調的資訊而對無錯誤訊框進行解碼。

圖12為根據本發明的另一實施例的音訊編碼方法的流程圖。

參看圖12，音訊編碼方法包含由圖8的音訊編碼裝置500執行的操作。因此，儘管下文省略，但圖8的音訊編碼裝置500的描述可仍應用於圖12的音訊編碼方法。

在操作S1210中，音訊編碼裝置500可藉由使用自音訊信號獲取的關於音調的資訊而對音訊信號執行預濾波。如上文參看圖4A及圖4B的音訊編碼裝置100所描述，音訊編碼裝置500可對音訊信號選擇性地執行預強調。

換言之，音訊編碼裝置500可對音訊信號執行第一濾波，且自由第一濾波產生的音訊信號獲取關於音調的資訊。第一濾波為強調屬於某頻率頻帶的信號以便自音訊信號獲取關於音調的資訊的操作。音訊編碼裝置500可基於關於音調的所獲取的資訊而判定濾波係數，且藉由使用根據所判定的濾波係數而設計的第二濾波器來對音訊信號執行第二濾波。舉例而言，第二濾波可包含梳形濾波。

音訊編碼裝置500可自音訊信號分裂而成的音訊信號的多個訊框中的每一者獲取關於音調的資訊。

在操作S1220中，音訊編碼裝置500可藉由使用具有某重疊區段的窗口而對由預濾波產生的音訊信號執行窗口化。

在操作S1230中，音訊編碼裝置500可基於窗口的重疊區段而對由窗口化產生的音訊信號以及關於音調的資訊進行編碼。音訊編碼裝置500可藉由對由窗口化產生的音訊信號以及關於音調的資訊進行編碼而產生並輸出位元串流。

音訊編碼裝置500可基於窗口的重疊區段而判定編碼延遲，根據所判定的編碼延遲而延遲關於音調的資訊，且輸出關於音調的經延遲的資訊。舉例而言，當窗口的重疊區段的長度為窗口的50%或50%以上時，音訊編碼裝置500可將關於音調的資訊延遲一個訊框。

音訊編碼裝置500可產生並輸出位元串流，其包含位於其輔助區域中的關於音調的資訊。關於音調的資訊可包含以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行預濾波的旗標。舉例而言，音訊編碼裝置500可產生並輸出位元串流，以使得指示是否已執行預濾波的旗標位於其標頭中，且音調週期、音調增益以及音調抽頭中的至少一者位於其輔助區域中。

圖13為根據本發明的另一實施例的音訊解碼方法的流程圖。

參看圖13，音訊解碼方法包含由圖9的音訊解碼裝置600執行的操作。因此，儘管下文省略，但圖9的音訊解碼裝置600的描述可仍應用於圖13的音訊解碼方法。

在操作S1310中，音訊解碼裝置600獲取所接收的位元串流的經頻率變換的音訊信號以及關於音調的資訊。由音訊解碼裝置600接收的關於音調的資訊可為已基於在編碼或解碼期間應用的窗口的重疊區段而延遲的資訊。

在操作S1320中，音訊解碼裝置600藉由逆變換經頻率變換的音訊信號來獲取時域音訊信號樣本。

在操作S1330中，音訊解碼裝置600藉由使用具有某重疊區段的窗口而對由逆變換產生的音訊信號執行窗口化。

在操作S1340中，音訊解碼裝置600藉由使用關於音調的資訊而對由窗口化產生的音訊信號執行後濾波。由音訊解碼裝置600執行的後濾波可對應於由音訊編碼裝置500執行的預濾波。當後濾波對應於預濾波時，此情形可意謂後濾波為預濾波的逆濾波。音訊解碼裝置600可提取所接收的位元串流的輔助區域的關於音調的資訊。關於音調的資訊可包含以下各者中的至少一者：指示是否應用預濾波的旗標、音調週期、音調增益以及音調抽頭。

圖16為根據本發明的實施例的使用心理聲學模型的音訊編碼裝置1600的方塊圖。

參看圖16，音訊編碼裝置1600可包含心理聲學模型單元1650。

圖16的音調預濾波器1610可對應於圖4的濾波單元140或圖9的預濾波器510。因此，將省略其重複描述。

圖16的窗口化單元1620、頻率變換器1630、量化器1640、心理聲學模型單元1650、熵編碼器1660以及位元串流形成器1670可對應於圖4的編碼器150或圖9的編碼器550.

窗口化單元1620可將輸入音訊信號分裂為窗口。窗口的訊框的長度可根據應用於音訊編碼裝置1600的應用而發生變化。

頻率變換器1630可對音訊信號分裂而成的多個窗口中的每一者執行時間至頻率變換。頻率變換器1630可藉由對窗口執行時間至頻率變換而產生變換係數。時間至頻率變換可經由QMF、MDCT、FFT或其類似者來達成，但本發明的實施例不限於此。

心理聲學模型單元1650可藉由將遮蔽效應應用於輸入音訊信號而設定遮蔽臨限值。

遮蔽效應是基於心理聲學理論，且使用人類聽覺系統並不正確地感知鄰近於大信號的小信號的特性，此是因為小信號被大信號遮蔽。舉例而言，在類似於公車站的有噪音的空間中，人們無法聽到原本在安靜地方可聽到的談話。

遮蔽臨限值為可聽到音訊信號的最小等級。根據遮蔽效應，聽不到在遮蔽臨限值以下存在的音訊信號。

在將心理聲學模型應用於音訊信號分裂而成的多個窗口中的一者時，信號中在窗口中具有最大量值的信號可存在於多個頻率縮放因子頻帶中的中間頻率縮放因子頻帶中。且量值比最大信號小得多的若干信號可存在於中間頻率縮放因子頻帶周圍的頻率縮放因子頻帶中。最大信號為遮蔽信號(masker)，且遮蔽曲線自遮蔽信號進行繪製。由遮蔽曲線遮蔽的小信號可為被遮蔽信號(masked signal)或受遮蔽信號(maskee)。被遮蔽信號被移除，且僅剩餘信號維持作為有效信號。此處理程序被稱作遮蔽。

量化器1640可藉由使用由心理聲學模型單元1650判定的遮蔽臨限值來對由頻率變換器1630獲得的窗口的變換係數進行量化。

量化器1640可在對變換係數進行量化的同時產生雜訊。量化器1640可對變換係數進行量化，以使得所產生的雜訊保持低於遮蔽臨限值。量化雜訊保持低於遮蔽臨限值可意謂，藉由量化而產生的雜訊的能量歸因於遮蔽效應而被遮蔽。換言之，聽不到低於遮蔽臨限值的量化雜訊。

熵編碼器1660可對由量化產生的經量化的音訊信號執行熵編碼。熵編碼器1660可經由霍夫曼(Huffman)寫碼、範圍編碼、算術寫碼或其類似者來對經量化的音訊信號進行編碼，但本發明的實施例不限於此。

位元串流形成器1670可自由熵編碼器1660輸出的經編碼的音訊信號產生一或多個位元串流。

本發明的實施例可以儲存媒體來體現，所述儲存媒體包含可由電腦執行的指令碼，諸如，由電腦執行的程式模組。電腦可讀媒體可為可由電腦存取的任何可用媒體，且包含所有揮發性/非揮發性媒體以及抽取式/非抽取式媒體。另外，電腦可讀媒體可包含所有電腦儲存及通信媒體。電腦儲存媒體包含藉由用於儲存諸如電腦可讀指令碼、資料結構、程式模組或其他資料的資訊的某方法或技術而體現的所有揮發性/非揮發性媒體以及抽取式/非抽取式媒體。通信媒體通常包含電腦可讀指令碼、資料結構、程式模組或經調變的資料信號(諸如，載波或其他傳輸機制)的其他資料，且包含任何資訊傳輸媒體。

儘管已出於說明性目的而揭露本發明的實施例，但一般熟習此項技術者將瞭解，多種變化及修改是可行的，而不偏離本發明的精神及範疇。因此，以上實施例在所有態樣中應理解為非約束性而是說明性的。舉例而言，以整合形式描述的各別元件可分開使用，且分開的元件可以組合的狀態使用。

儘管已參考本發明的例示性實施例特定地繪示且描述了本發明，但一般熟習此項技術者將理解，在不脫離如由隨附申請專利範圍界定的本發明的精神以及範疇的情況下，可對本發明進行形式及細節上的各種改變。

S610~S650‧‧‧操作

Claims

一種音訊編碼方法，包括：接收音訊信號；偵測所述音訊信號的音調；基於所偵測的所述音調而判定濾波係數；基於所判定的所述濾波係數而對所述音訊信號執行音調濾波；以及對自所述音調濾波產生的音訊信號進行編碼。
如申請專利範圍第1項所述的音訊編碼方法，更包括對所述音訊信號執行預濾波，其中所述音調的所述偵測包括偵測由所述預濾波產生的經預濾波的所述音訊信號的音調。
如申請專利範圍第2項所述的音訊編碼方法，其中所述預濾波的所述執行包括執行使屬於包含於所述音訊信號中的某頻帶的頻率分量的量值增大的預強調，以使得所述量值大於不屬於所述某頻帶的其他頻率分量的量值。
如申請專利範圍第1項所述的音訊編碼方法，其中所述音調的所述偵測包括自所述音訊信號獲取關於所述音調的資訊，關於所述音調的所述資訊包括以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行所述音調濾波的旗標。
如申請專利範圍第1項所述的音訊編碼方法，其中所述音調濾波的所述執行包括對所述音訊信號執行梳形濾波。
如申請專利範圍第1項所述的音訊編碼方法，其中所述音調的所述偵測包括自所述音訊信號獲取關於所述音調的資訊；由所述音調濾波產生的所述音訊信號的所述編碼包括產生並輸出位元串流，所述位元串流包含由所述音調濾波產生的所述音訊信號以及關於所述音調的所述資訊；且關於所述音調的所述資訊包括以下各者中的至少一者：音調週期、音調增益、音調抽頭，以及指示是否已執行所述音調濾波的旗標。
如申請專利範圍第6項所述的音訊編碼方法，其中所述位元串流的所述產生及輸出包括產生並輸出所述位元串流，以使得關於所述音調的所述資訊位於所述位元串流的輔助區域中。
如申請專利範圍第1項所述的音訊編碼方法，其中所述音調的所述偵測包括自所述音訊信號分裂而成的多個訊框中的每一者獲取關於所述音調的資訊，關於所述音調的所述資訊包括音調週期、音調增益、音調抽頭，以及指示是否已執行所述音調濾波的旗標，且由所述音調濾波產生的所述音訊信號的所述編碼包括：將關於所述音調的所述資訊延遲一個訊框；以及產生並輸出位元串流，所述位元串流包含由所述音調濾波產生的所述音訊信號以及關於所述音調的所述經延遲的資訊。
一種音訊解碼方法，包括：接收經編碼的信號；對所述所接收的經編碼的信號進行解碼；以及對由所述解碼產生的經解碼的信號進行濾波，其中所述經編碼的信號是藉由偵測音訊信號的音調、基於所述所偵測的音調而對所述音訊信號執行音調濾波且對由所述音調濾波產生的經音調濾波的所述音訊信號進行編碼而產生的，且其中所述對由所述解碼產生的經解碼的信號進行濾波包括執行所述音調濾波的逆濾波。
一種音訊編碼裝置，包括：音調偵測器，偵測音訊信號的音調；音調濾波器，基於所述所偵測的音調而判定濾波係數且基於所述所判定的濾波係數而對所述音訊信號執行音調濾波；以及編碼器，對由所述音調濾波產生的音訊信號進行編碼。
一種音訊編碼方法，包括：藉由使用自音訊信號獲取的關於音調的資訊而對所述音訊信號進行預濾波；藉由使用具有預定重疊區段的窗口而對由所述預濾波產生的音訊信號執行窗口化；以及基於所述預定重疊區段藉由對由所述窗口化產生的音訊信號進行編碼且藉由對關於所述音調的所述資訊進行編碼來產生並輸出位元串流。
如申請專利範圍第11項所述的音訊編碼方法，其中所述位元串流的所述產生及輸出包括：基於所述預定重疊區段而判定編碼延遲；以及根據所述所判定的編碼延遲來延遲關於所述音調的所述資訊，且輸出關於所述音調的經延遲的資訊。
一種音訊解碼方法，包括：自所接收的位元串流獲取經頻率變換的音訊信號以及關於音調的資訊；逆變換所述經頻率變換的音訊信號；藉由使用具有重疊區段的窗口而對由所述逆變換產生的音訊信號執行窗口化；藉由使用關於所述音調的所述資訊而對由所述窗口化產生的音訊信號進行後濾波，其中所述後濾波對應於在編碼期間執行的預濾波，且關於所述音調的所述資訊基於所述重疊區段而編碼於所述所接收的位元串流中。
一種音訊編碼裝置，包括：預濾波器，其藉由使用自音訊信號獲取的關於音調的資訊而對所述音訊信號進行預濾波；以及編碼器，其藉由以下方式而產生並輸出位元串流：藉由使用具有預定重疊區段的窗口而對由所述預濾波產生的音訊信號執行窗口化，以及基於所述預定重疊區段對由所述窗口化產生的音訊信號進行編碼且對關於所述音調的所述資訊進行編碼。
一種非暫時性電腦可讀記錄媒體，其上記錄有程式，所述程式在由電腦執行時執行如申請專利範圍第1項至第8項、第11項、第12項中任一項所述的音訊編碼方法或如申請專利範圍第9項或第13項所述的音訊解碼方法。