TW201337913A - 頻譜編碼方法、音訊編碼裝置、頻譜解碼方法、音訊解碼裝置以及非暫時性電腦可讀儲存媒體 - Google Patents

頻譜編碼方法、音訊編碼裝置、頻譜解碼方法、音訊解碼裝置以及非暫時性電腦可讀儲存媒體 Download PDF

Info

Publication number
TW201337913A
TW201337913A TW102104310A TW102104310A TW201337913A TW 201337913 A TW201337913 A TW 201337913A TW 102104310 A TW102104310 A TW 102104310A TW 102104310 A TW102104310 A TW 102104310A TW 201337913 A TW201337913 A TW 201337913A
Authority
TW
Taiwan
Prior art keywords
unit
spectrum
audio
bits
decoding
Prior art date
Application number
TW102104310A
Other languages
English (en)
Inventor
Mi-Young Kim
Anton Viktorovich Porov
Konstantin Sergeevich Osipov
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of TW201337913A publication Critical patent/TW201337913A/zh

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一種音訊編碼裝置,其包含:變換單元,其用以將時域中之音訊信號變換為頻域中之音訊頻譜;位元分配單元,其用以藉由使用音訊頻譜之預定頻帶單元中之頻譜能量來判定所分配位元之數目;以及編碼單元,其用以基於用於音訊頻譜之所分配位元之數目判定用於階乘脈衝寫碼之單位量值脈衝之數目且用以藉由使用單位量值脈衝之經判定數目在音訊頻譜之頻帶單元中執行階乘脈衝寫碼。

Description

在低複雜度之聲音訊號的方法與裝置
本發明是有關於音訊編碼以及解碼,且更特定言之,是有關於用於以低複雜度處理音訊信號之方法以及裝置。
在音訊信號之階乘脈衝寫碼(factorial pulse coding)或解碼(decoding)中,為了根據每一頻帶所需之位元數目b來判定對應於單位量值脈衝之數目之值m,已使用預設m可具有之任意最大值且在使m之值以迭代方式自0逐1增加至預設之最大值之同時根據b找出值m之方法。然而,此迭代方法在頻帶之長度較長或m之值範圍很大時具有高複雜度。
本發明提供用於以與分配至每一頻帶之位元數目相一致之低複雜度判定單位量值脈衝之數目以將階乘脈衝寫碼應用於每一頻帶單元的方法及裝置,以及使用所述方法及裝置之多媒體器 件。
根據本發明之一態樣,提供一種頻譜編碼方法,其包含:基於頻譜之頻帶單元中之所分配位元之數目判定用於階乘脈衝寫碼之單位量值脈衝之數目;以及藉由使用單位量值脈衝之經判定數目在頻譜之頻帶單元中執行階乘脈衝寫碼。
根據本發明之另一態樣,提供一種音訊編碼裝置,其包含:變換單元,其用以將時域中之音訊信號變換為頻域中之音訊頻譜;位元分配單元,其用以藉由使用音訊頻譜之預定頻帶單元中之頻譜能量來判定所分配位元之數目;以及編碼單元,其用以基於用於音訊頻譜之所分配位元之數目判定用於階乘脈衝寫碼之單位量值脈衝之數目且用以藉由使用單位量值脈衝之經判定數目在音訊頻譜之頻帶單元中執行階乘脈衝寫碼。
根據本發明之另一態樣,提供一種頻譜解碼方法,其包含:基於頻譜之頻帶單元中之所分配位元之數目判定用於階乘脈衝寫碼之單位量值脈衝之數目;以及藉由使用單位量值脈衝之經判定數目在頻譜之頻帶單元中執行階乘脈衝解碼。
根據本發明之另一態樣,提供一種音訊解碼裝置,其包含:位元分配單元,其用以藉由使用包含於位元串流中之音訊頻譜之預定頻帶單元中之頻譜能量來判定所分配位元之數目;解碼單元,其用以基於音訊頻譜之頻帶單元中之所分配位元之數目判定用於階乘脈衝解碼之單位量值脈衝之數目且用以藉由使用單位量值脈衝之經判定數目在音訊頻譜之頻帶單元中執行階乘脈衝解碼;以及反變換單元,其用以將由解碼單元解碼之音訊頻譜變換為時域中之音訊信號。
本發明之效應
根據本發明之實施例,藉由選擇性地使用1與最大值之間的二進位搜尋以及用以減少迭代之數目的線性遞減方法藉由使用數學方程式以判定用於每一頻帶之單位量值脈衝之數目之最大值,可實現用於以低複雜度處理音訊信號之方法以及裝置。另外,當分配至任意頻帶之位元之數目小於寫碼一個脈衝所需之最小位元數目時,用於任意頻帶之單位量值脈衝之數目經分配為0,藉此降低例外情形下之處理複雜度。
100‧‧‧音訊編碼裝置
130‧‧‧變換單元
150‧‧‧位元分配單元
170‧‧‧編碼單元
190‧‧‧多工單元
200‧‧‧位元分配單元
210‧‧‧範數估計單元
230‧‧‧範數編碼單元
250‧‧‧位元估計及分配單元
300‧‧‧位元分配單元
310‧‧‧心理聲學模型
330‧‧‧位元估計及分配單元
350‧‧‧縮放因數估計單元
370‧‧‧縮放因數編碼單元
400‧‧‧位元分配單元
410‧‧‧範數估計單元
430‧‧‧位元估計及分配單元
450‧‧‧縮放因數估計單元
470‧‧‧縮放因數編碼單元
500‧‧‧編碼單元
510‧‧‧頻譜正規化單元
530‧‧‧頻譜編碼單元
600‧‧‧音訊編碼裝置
610‧‧‧暫態偵測單元
630‧‧‧變換單元
650‧‧‧位元分配單元
670‧‧‧編碼單元
690‧‧‧多工單元
700‧‧‧音訊解碼裝置
710‧‧‧解多工單元
730‧‧‧位元分配單元
750‧‧‧解碼單元
770‧‧‧反變換單元
800‧‧‧位元分配單元
810‧‧‧範數解碼單元
830‧‧‧位元估計及分配單元
900‧‧‧解碼單元
910‧‧‧頻譜解碼單元
930‧‧‧包絡塑形單元
1000‧‧‧解碼單元
1010‧‧‧頻譜解碼單元
1030‧‧‧包絡塑形單元
1050‧‧‧頻譜填充單元
1100‧‧‧解碼單元
1110‧‧‧頻譜解碼單元
1130‧‧‧頻譜填充單元
1150‧‧‧包絡塑形單元
1200‧‧‧音訊解碼裝置
1210‧‧‧解多工單元
1230‧‧‧縮放因數解碼單元
1250‧‧‧頻譜解碼單元
1270‧‧‧反變換單元
1300‧‧‧音訊解碼裝置
1310‧‧‧解多工單元
1330‧‧‧位元分配單元
1350‧‧‧解碼單元
1370‧‧‧反變換單元
1410、1420、1430、1440‧‧‧操作
1510、1520、1530、1540、1550、1560‧‧‧操作
1610、1620、1630、1640、1650、1660、1670、1680‧‧‧操作
1710、1720、1730、1740、1750‧‧‧操作
1800‧‧‧多媒體器件
1810‧‧‧通信單元
1830‧‧‧編碼模組
1850‧‧‧儲存單元
1870‧‧‧麥克風
1900‧‧‧多媒體器件
1910‧‧‧通信單元
1930‧‧‧解碼模組
1950‧‧‧儲存單元
1970‧‧‧揚聲器
2000‧‧‧多媒體器件
2010‧‧‧通信單元
2020‧‧‧編碼模組
2030‧‧‧解碼模組
藉由參看隨附圖式詳細地描述本發明之例示性實施例,本發明之以上及其他特徵以及優點將變得更顯而易見,其中: 圖1為根據一例示性實施例之音訊編碼裝置之方塊圖。
圖2為根據一例示性實施例的圖1之音訊編碼裝置中之位元分配單元的方塊圖。
圖3為根據另一例示性實施例的圖1之音訊編碼裝置中之位元分配單元的方塊圖。
圖4為根據另一例示性實施例的圖1之音訊編碼裝置中之位元分配單元的方塊圖。
圖5為根據一例示性實施例的圖1之音訊編碼裝置中之編碼單元的方塊圖。
圖6為根據另一例示性實施例之音訊編碼裝置之方塊圖。
圖7為根據一例示性實施例之音訊解碼裝置之方塊圖。
圖8為根據一例示性實施例的圖7之音訊解碼裝置中之位元 分配單元的方塊圖。
圖9為根據一例示性實施例的圖7之音訊解碼裝置中之解碼單元的方塊圖。
圖10為根據另一例示性實施例的圖7之音訊解碼裝置中之解碼單元的方塊圖。
圖11為根據另一例示性實施例的圖7之音訊解碼裝置中之解碼單元的方塊圖。
圖12為根據另一例示性實施例之音訊解碼裝置之方塊圖。
圖13為根據另一例示性實施例之音訊解碼裝置之方塊圖。
圖14為說明根據一例示性實施例之階乘脈衝寫碼方法的流程圖。
圖15為說明根據一例示性實施例之判定滿足頻帶單元中之所分配位元數目b的單位量值脈衝數目m之方法的流程圖。
圖16為說明根據另一例示性實施例之判定滿足頻帶單元中之所分配位元數目b的單位量值脈衝數目m之方法的流程圖。
圖17為說明根據另一例示性實施例之判定滿足頻帶單元中之所分配位元數目b的單位量值脈衝數目m之方法的流程圖。
圖18為根據一例示性實施例之包含編碼模組之多媒體器件的方塊圖。
圖19為根據一例示性實施例之包含解碼模組之多媒體器件的方塊圖。
圖20為根據一例示性實施例之包含編碼模組以及解碼模組之多媒體器件的方塊圖。
本發明概念可允許各種種類之改變或修改以及形式上之各種改變,且將在圖式中說明且在說明書中詳細地描述特定例示性實施例。然而,應理解,特定例示性實施例並不將本發明概念限於特定揭露形式,而是包含在本發明概念之精神以及技術範疇內的每一個經修改、等效或經替換之實施例。在以下描述中,未詳細地描述熟知功能或構造,因為所述功能或構造會以不必要細節使本發明不清楚。
雖然諸如「第一」以及「第二」之術語可用以描述各種元件,但元件不能受所述術語限制。術語可用以將特定元件與另一元件分類開來。
本申請案中所使用之術語僅用以描述特定例示性實施例,且不具有限制本發明概念之任何意圖。雖然在考量了本發明概念中之功能的同時選擇當前儘可能廣泛使用之一般術語作為在本發明概念中所使用之術語,但所述一般術語可能根據一般熟習此項技術者之意圖、司法判例或新技術之出現而變化。另外,在特定情況下,可使用由申請人有意選擇之術語,且在此情況下,所述術語之含義將在本發明之對應描述中予以揭露。因此,本發明概念中所使用之術語不應由術語之簡單名稱來定義,而應由術語以及內容在本發明概念中之含義來定義。
單數形式之表述包含複數形式之表述,除非所述兩種表述在上下文中明顯彼此不同。在本申請案中,應理解,將諸如「包含」以及「具有」之術語用以指示所實施之特徵、數目、步驟、操作、元件、零件或其組合之存在,而並不預先排除一或多個其 他特徵、數目、步驟、操作、元件、零件或其組合之存在或添加的可能性。
在下文中,將參看展示例示性實施例之隨附圖式來更完全地描述本發明概念。圖式中之相同參考數字表示相同元件,且因此將省略元件之重複描述。
圖1為根據一例示性實施例之音訊編碼裝置100之方塊圖。
圖1中所展示之音訊編碼裝置100可包含變換單元130、位元分配單元150、編碼單元170以及多工單元190。所述組件可整合於至少一模組中且實施為至少一處理器(未圖示)。術語「音訊」可指示音樂、語音或音樂與語音之混合信號。
參看圖1,變換單元130可藉由將時域中之音訊信號變換為頻域中之音訊頻譜來產生音訊頻譜。可使用各種熟知方法(諸如離散餘弦變換(discrete cosine transform;DCT))來執行時域-頻域(time-frequency domain)變換。
位元分配單元150可藉由使用遮蔽臨限值(所述遮蔽臨限值是使用頻譜能量或心理聲學模型獲得)以及頻譜能量來判定音訊頻譜之每一子頻帶單元中的所分配位元之數目。術語「子頻帶」可指示將音訊頻譜之樣本分組之單元且可藉由反映臨界頻帶而具有均勻或不均勻長度。在不均勻長度之情況下,可設定子頻帶,使得包含於每一子頻帶中之樣本數目自一個圖框之第一樣本至所述圖框之最後一個樣本逐漸增加。在本文中,可預先判定包含於一個圖框中之子頻帶之數目或包含於子頻帶中之樣本之數目。或者,在將一個圖框劃分為預定數目個具有均勻長度之子頻 帶之後,可根據頻譜係數之分佈來調整子頻帶之長度。可使用頻譜平坦度量測、最大值與最小值之間的差、最大值之差分值或其類似者來判定頻譜係數之分佈。
根據一實施例,位元分配單元150可藉由使用在每一子頻帶單元中所獲得之範數(Norm)值(例如,平均頻譜能量)來估計容許位元之數目,藉由使用平均頻譜能量來分配位元,且將所分配位元之數目限於不超過容許位元之數目。根據另一實施例,位元分配單元150可藉由使用心理聲學模型來估計每一子頻帶單元中的容許位元之數目,藉由使用平均頻譜能量來分配位元,且將所分配位元之數目限於不超過容許位元之數目。
編碼單元170可藉由基於每一子頻帶單元中之所分配位元之最終判定數目對音訊頻譜進行量化及無損編碼來產生關於經編碼頻譜之資訊。
多工單元190可藉由對由位元分配單元150提供的範數值以及由編碼單元170提供的關於經編碼頻譜之資訊進行多工來產生位元串流。
音訊編碼裝置100可產生給定子頻帶之雜訊位準且將所產生之雜訊位準提供至音訊解碼裝置(圖7之700、圖12之1200或圖13之1300)。
圖2為根據一例示性實施例的圖1之音訊編碼裝置100中之位元分配單元200的方塊圖。
圖2中所展示之位元分配單元200可包含範數估計單元210、範數編碼單元230以及位元估計及分配單元250。所述組件可整合於至少一模組中且實施為至少一處理器(未圖示)。
參看圖2,範數估計單元210可獲得對應於每一子頻帶單元中之平均頻譜能量之範數值。此時,可使用(例如)與ITU-T G.719中之方法相同的方法來計算範數值,但計算方法不限於此。可將針對每一子頻帶單元所獲得之範數值提供至編碼單元150。
範數編碼單元230可對針對每一子頻帶單元所獲得之範數值進行量化及無損編碼。可將在每一子頻帶單元中經量化之範數值提供至位元估計及分配單元250,或可將在每一子頻帶單元中再次經解量化之範數值提供至位元估計及分配單元250。可將在每一子頻帶單元中經量化及無損編碼之範數值提供至多工單元190。
位元估計及分配單元250可藉由使用每一子頻帶單元中之範數值來估計並分配所需數目個位元。較佳地,可使用經解量化之範數值,使得可在編碼部分及解碼部分中使用相同位元估計及分配程序。此時,可使用藉由考慮到遮蔽效應而予以調整之範數值。對於範數值之調整,例如,可使用ITU-T G.719中所應用之心理聲學加權,但範數值之調整不限於此。
位元估計及分配單元250可藉由使用每一子頻帶單元中之範數值來計算遮蔽臨限值,且藉由使用遮蔽臨限值來估計感知上所需之位元之數目。可將各種熟知方法用於藉由使用頻譜能量來獲得遮蔽臨限值。亦即,遮蔽臨限值為對應於恰可辨失真(just noticeable distortion;JND)之值,且當量化雜訊小於遮蔽臨限值時,不能感覺到感知雜訊(perceptual noise)。因此,可使用遮蔽臨限值來計算不感覺到感知雜訊所需的最少位元數目。根據另一實施例,可藉由計算信號對遮蔽比(signal-to-mask ratio;SMR)來估計滿足遮蔽臨限值的位元數目,SMR之計算是使用每一子頻 帶單元中的範數值對遮蔽臨限值之比且使用用於SMR的6.025 dB≒1位元之關係。雖然估計位元之數目是不感覺到感知雜訊所需的最少位元數目,但由於就壓縮而言,不必使用比估計位元之數目多的位元,故可將估計位元之數目視為子頻帶單元中所允許的最多位元數目(在下文中稱為容許位元數目)。此時,可以整數單位或小數點單位來表示用於每一子頻帶的容許位元之數目。
根據一實施例,位元估計及分配單元250可藉由使用每一子頻帶單元中之範數值來執行小數點單位之位元分配。此時,自具有較大範數值之子頻帶開始循序地分配位元,且可藉由根據每一子頻帶之感知重要性對每一子頻帶之範數值進行加權來將較多位元分配至感知上重要之子頻帶。可經由(例如)如ITU-T G.719中之心理聲學加權來判定感知重要性。
詳言之,位元估計及分配單元250可自具有較大範數值之子頻帶開始循序地分配用於每一樣本之位元。亦即,首先,將每個樣本之位元分配至具有最大範數值之子頻帶,且使已分配了位元之子頻帶之範數值減小預定單元,且改變優先權,使得位元被分配至另一子頻帶。可重複此程序,直至給定圖框中的數目B個所有可使用位元全部被分配為止。
位元估計及分配單元250可藉由將用於每一子頻帶之所分配位元之數目限於不超過估計位元之數目(亦即,容許位元之數目)來判定最終所分配之位元數目。對於所有子頻帶,將所分配位元之數目與估計位元之數目進行比較,且若所分配位元之數目大於估計位元之數目,則將所分配位元之數目限於估計位元之數目。作為位元數目限制之結果,若用於給定圖框之所有子頻帶 的位元之數目小於給定圖框中的所有可使用位元之數目B,則對應於差之位元可均勻地分佈至所有子頻帶或根據感知重要性不均勻地分佈。
因此,由於每一子頻帶之位元之數目可以小數點單位來判定且限於容許位元之數目,故可有效地分佈給定圖框之所有位元之數目。
數學方程式可用以估計每一子頻帶所需的位元之數目且分配所述數目個位元。舉例而言,可基於用於最佳化量化失真及分配至每一子頻帶的位元之數目之解決方法而在給定圖框中的所有可使用位元之數目B之範圍內估計用於最大化輸入頻譜之信雜比(SNR)的每一子頻帶之每樣本所分配位元數目。因此,由於可立即判定每一子頻帶單元中的所分配位元之數目而無需重複若干次,故可使複雜度降低。
圖3為根據另一例示性實施例的圖1之音訊編碼裝置100中之位元分配單元300的方塊圖。
圖3中所展示之位元分配單元300可包含心理聲學模型310、位元估計及分配單元330、縮放因數估計單元350以及縮放因數編碼單元370。所述組件可整合於至少一模組中且實施為至少一處理器(未圖示)。
參看圖3,心理聲學模型310可藉由接收由變換單元130提供的音訊頻譜來獲得用於每一子頻帶之遮蔽臨限值。
位元估計及分配單元330可藉由在每一子頻帶單元中使用遮蔽臨限值來估計感知上所需之位元之數目。亦即,可獲得每一子頻帶單元中的SMR,且可藉由使用用於SMR的關係6.025 dB≒1位元來估計滿足遮蔽臨限值的位元之數目。雖然估計位元之數目是不感覺到感知雜訊所需的最少位元數目,但由於就壓縮而言,不必使用比估計位元之數目多的位元,故可將估計位元之數目視為子頻帶單元中所允許的最多位元數目(在下文中稱為容許位元之數目)。此時,位元估計及分配單元330可藉由使用每一子頻帶單元中之頻譜能量來以小數點單位執行位元分配。
對於所有子頻帶,位元估計及分配單元330可將所分配位元之數目與估計位元之數目進行比較,且在所分配位元之數目大於估計位元之數目之情況下將所分配位元之數目限於估計位元之數目。作為位元數目限制之結果,若用於給定圖框之所有子頻帶的位元數目小於給定圖框中的所有可使用位元之數目B,則對應於差(difference)之位元可均勻地分佈至所有子頻帶或根據感知重要性不均勻地分佈。
縮放因數估計單元350可藉由使用每一子頻帶單元中之最終所判定之所分配位元數目來估計縮放因數。可將在每一子頻帶單元中所估計之縮放因數提供至編碼單元170。
縮放因數編碼單元370可對在每一子頻帶單元中所估計之縮放因數進行量化及無損編碼。可將在每一子頻帶單元中經編碼之縮放因數提供至多工單元190。
圖4為根據另一例示性實施例的圖1之音訊編碼裝置100中之位元分配單元400的方塊圖。
圖4中所展示之位元分配單元400可包含範數估計單元410、位元估計及分配單元430、縮放因數估計單元450以及縮放因數編碼單元470。所述組件可整合於至少一模組中且實施為至少 一處理器(未圖示)。
參看圖4,範數估計單元410可獲得對應於每一子頻帶中之平均頻譜能量之範數值。
位元估計及分配單元430可藉由使用頻譜能量來獲得遮蔽臨限值,且藉由使用每一子頻帶單元中之遮蔽臨限值來估計感知上所需之位元數目(亦即,容許位元之數目)。
位元估計及分配單元430可藉由使用每一子頻帶單元中之頻譜能量來以整數單位或小數點單位執行位元分配。
對於所有子頻帶,位元估計及分配單元430將所分配位元之數目與估計位元之數目進行比較,且在所分配位元之數目大於估計位元之數目之情況下將所分配位元之數目限於估計位元之數目。作為位元數目限制之結果,若用於給定圖框之所有子頻帶的所分配位元之數目小於給定圖框中的所有可使用位元之數目B,則對應於差之位元可均勻地分佈至所有子頻帶或根據感知重要性不均勻地分佈。
縮放因數估計單元450可藉由使用在每一子頻帶單元中最終所判定之所分配位元數目來估計縮放因數。可將在每一子頻帶單元中所估計之縮放因數提供至編碼單元170。
縮放因數編碼單元470可對在每一子頻帶單元中所估計之縮放因數進行量化及無損編碼。可將在每一子頻帶單元中經編碼之縮放因數提供至多工單元190。
圖5為根據一例示性實施例的圖1之音訊編碼裝置100中之編碼單元500的方塊圖。
圖5中所展示之編碼單元500可包含頻譜正規化單元510 以及頻譜編碼單元530,所述兩者可整合於至少一模組中且實施為至少一處理器(未圖示)。頻譜正規化單元510可為可選的。
參看圖5,頻譜正規化單元510可藉由使用由位元分配單元150提供的每一子頻帶之範數值來正規化音訊頻譜。
頻譜編碼單元530可藉由使用每一子頻帶的所分配位元數目來量化經正規化之音訊頻譜,且對量化結果進行無損編碼。舉例而言,可將階乘脈衝寫碼用於頻譜編碼,但實施例不限於此。根據階乘脈衝寫碼,可以階乘形式來表示在所分配位元數目之範圍內的資訊,諸如脈衝之位置、脈衝之量值及脈衝之正負號。
可將由頻譜編碼單元530編碼之頻譜資訊提供至多工單元190。
圖6為根據另一例示性實施例之音訊編碼裝置600之方塊圖。
圖6中所展示之音訊編碼裝置600可包含暫態偵測單元610、變換單元630、位元分配單元650、編碼單元670以及多工單元690。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。與圖1之音訊編碼裝置100相比,圖6之音訊編碼裝置600更包含暫態偵測單元610,且因此,省略對共同組件之詳細描述。
參看圖6,暫態偵測單元610可偵測音訊信號之暫態特性的週期。可使用各種熟知方法來偵測暫態週期。由暫態偵測單元610提供的暫態發信資訊可由多工單元690包含於位元串流中。
變換單元630可根據暫態週期偵測之結果來判定將用於變換之窗口(window)大小,且基於經判定之窗口大小執行時域- 頻域變換。舉例而言,短窗口可應用於偵測到暫態週期之子頻帶,且長窗口可應用於未偵測到暫態週期之子頻帶。
位元分配單元650可藉由使用圖2至圖4中所展示之位元分配單元200、300及400中之任一者來實施。
類似於變換單元630,編碼單元670可根據暫態週期偵測之結果來判定將用於編碼之窗口大小。
音訊編碼裝置600可產生子頻帶之雜訊位準且將所產生之雜訊位準提供至音訊解碼裝置(圖7之700、圖12之1200或圖13之1300)。
圖7為根據一例示性實施例之音訊解碼裝置700之方塊圖。
圖7中所展示之音訊解碼裝置700可包含解多工單元710、位元分配單元730、解碼單元750以及反變換單元770。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。
參看圖7,解多工單元710可藉由解多工位元串流來擷取經量化且經無損編碼之範數值以及關於經編碼頻譜之資訊。
位元分配單元730可自經量化且經無損編碼之範數值獲得經解量化之範數值,且藉由使用經解量化之範數值來判定所分配位元之數目。位元分配單元730可以實質上與音訊編碼裝置100或600之位元分配單元150或650相同之方式操作。當由音訊編碼裝置100或600經由心理聲學加權來調整範數值時,亦可由音訊解碼裝置700以相同方式來調整經解量化之範數值。
解碼單元750可藉由使用由解多工單元710提供的關於 經編碼頻譜之資訊來對經編碼頻譜進行無損解碼及解量化。舉例而言,可將階乘脈衝解碼用於頻譜解碼。
反變換單元770可藉由將經解碼頻譜變換為時域中之音訊信號來產生經重建的音訊信號。
圖8為根據一例示性實施例的圖7之音訊解碼裝置700中之位元分配單元800的方塊圖。
圖8中所展示之位元分配單元800可包含範數解碼單元810以及位元估計及分配單元830。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。
參看圖8,範數解碼單元810可自解多工單元710所提供的經量化且經無損編碼之範數值獲得經解量化之範數值。
位元估計及分配單元830可藉由使用經解量化之範數值來判定所分配位元之數目。詳言之,位元估計及分配單元830可藉由使用每一子頻帶單元中之頻譜能量(亦即,範數值)來獲得遮蔽臨限值,且藉由使用遮蔽臨限值來預測感知上所需之位元之數目(亦即,容許位元之數目)。
位元估計及分配單元830可藉由使用每一子頻帶單元中之頻譜能量(亦即,範數值)來以整數單位或小數點單位執行位元分配。
對於所有子頻帶,位元估計及分配單元830可將所分配位元之數目與估計位元之數目進行比較,且在所分配位元之數目大於估計位元之數目之情況下將所分配位元之數目限於估計位元之數目。作為位元數目限制之結果,若用於給定圖框之所有子頻帶的所分配位元之數目小於給定圖框中的所有可使用位元之數目 B,則對應於差之位元可均勻地分佈至所有子頻帶或根據感知重要性不均勻地分佈。
圖9為根據一例示性實施例的圖7之音訊解碼裝置700中之解碼單元900的方塊圖。
圖9中所展示之解碼單元900可包含頻譜解碼單元910以及包絡塑形單元930。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。根據對應編碼裝置,包絡塑形單元930可為可選的。
參看圖9,頻譜解碼單元910可藉由使用由解多工單元710提供的關於經編碼頻譜之資訊以及由位元分配單元730提供的所分配位元數目對經編碼頻譜進行無損解碼及解量化。由頻譜解碼單元910提供的經解碼頻譜可為正規化頻譜。
包絡塑形單元930可藉由透過使用由位元分配單元730提供的經解量化範數值來對由頻譜解碼單元910提供的正規化頻譜進行包絡塑形而重建正規化之前的頻譜。
圖10為根據另一例示性實施例的圖7之音訊解碼裝置700中之解碼單元1000的方塊圖。
圖10中所展示之解碼單元1000可包含頻譜解碼單元1010、包絡塑形單元1030以及頻譜填充單元1050。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。與圖9之解碼單元900相比,圖10之解碼單元1000更包含頻譜填充單元1050,且因此,省略對共同組件之詳細描述。根據配備解碼單元1000之器件之用途,頻譜填充單元1050可為可選的。
參看圖10,當包含經解量化至0之部分之子頻帶存在於 由包絡塑形單元1030提供的頻譜中時,頻譜填充單元1050可用雜訊分量填充所述子頻帶。根據一實施例,可隨機地或藉由複製經解量化至非零之子頻帶之頻譜來產生雜訊分量。根據另一實施例,可針對包含經解量化至0之部分之子頻帶產生雜訊分量,且可藉由使用雜訊分量之能量對由位元分配單元730提供的經解量化之範數值(亦即,頻譜能量)之比來調整雜訊分量之能量。根據另一實施例,可針對包含經解量化至0之部分之子頻帶產生雜訊分量,且可調整雜訊分量,使得雜訊分量之平均能量為1。根據另一實施例,自音訊編碼裝置100或600接收每一子頻帶單元中之雜訊位準,且當給定子頻帶包含經解量化至0之部分時,可針對給定子頻帶產生雜訊分量,且可藉由使用接收到之雜訊位準來調整所述雜訊分量之能量。
圖11為根據另一例示性實施例的圖7之音訊解碼裝置700中之解碼單元1100的方塊圖。
圖11中所展示之解碼單元1100可包含頻譜解碼單元1110、頻譜填充單元1130以及包絡塑形單元1150。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。與圖10之解碼單元1000相比,圖11之解碼單元1100具有頻譜填充單元1130以及包絡塑形單元1150之不同配置次序,且因此,省略對共同組件之詳細描述。
參看圖11,當包含經解量化至0之部分之子頻帶存在於由頻譜解碼單元1110提供的正規化頻譜中時,頻譜填充單元1130可用雜訊分量填充所述子頻帶。此時,可使用關於圖10之頻譜填充單元1050所應用之各種雜訊填充方法。較佳地,可針對包含經 解量化至0之部分之子頻帶產生雜訊分量,且可調整雜訊分量,使得雜訊分量之平均能量為1。
包絡塑形單元1150可藉由使用由位元分配單元730提供的經解量化範數值來重建包含填充有雜訊分量之子頻帶的頻譜的正規化之前之頻譜。
圖12為根據另一例示性實施例之音訊解碼裝置1200之方塊圖。
圖12中所展示之音訊解碼裝置1200可包含解多工單元1210、縮放因數解碼單元1230、頻譜解碼單元1250以及反變換單元1270。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。
參看圖12,解多工單元1210可藉由解多工位元串流來擷取經量化且經無損編碼之縮放因數以及關於經編碼頻譜之資訊。
縮放因數解碼單元1230可對每一子頻帶單元中之經量化且經無損編碼之縮放因數進行無損解碼及解量化。
頻譜解碼單元1250可藉由使用由解多工單元1210提供的關於經編碼頻譜之資訊以及經解量化之縮放因數來對經編碼頻譜進行無損解碼及解量化。頻譜解碼單元1250可包含與圖10之解碼單元1000相同之組件。
反變換單元1270可藉由將由頻譜解碼單元1250解碼之頻譜變換為時域中之音訊信號來產生復原的音訊信號。
圖13為根據另一例示性實施例之音訊解碼裝置1300之方塊圖。
圖13中所展示之音訊解碼裝置1300可包含解多工單元 1310、位元分配單元1330、解碼單元1350以及反變換單元1370。所述組件可整合於至少一模組中且可實施為至少一處理器(未圖示)。
與圖7之音訊解碼裝置700相比,圖13中所展示之音訊解碼裝置1300之不同之處在於暫態發信資訊被提供至解碼單元1350以及反變換單元1370,且因此,省略對共同組件之詳細描述。
參看圖13,解碼單元1350可藉由使用由解多工單元1310提供的關於經編碼頻譜之資訊來解碼經編碼頻譜。此時,窗口大小可根據暫態發信資訊而變化。
反變換單元1370可藉由將經解碼頻譜變換為時域中之音訊信號來產生經重建的音訊信號。此時,窗口大小可根據暫態發信資訊而變化。
圖14為說明根據一例示性實施例之階乘脈衝寫碼方法的流程圖,所述方法較佳可由圖1之編碼單元170、圖5之頻譜編碼單元530以及圖6之編碼單元670來執行。
參看圖14,在操作1410中,在頻帶單元(例如,子頻帶單元)中接收所分配位元之數目。所分配位元之數目可由圖1之位元分配單元150提供。
在操作1420中,可基於所分配位元之數目判定用於每一頻帶之單位量值脈衝之數目m。
在操作1430中,可藉由基於經判定用於每一頻帶的單位量值脈衝之數目m來執行階乘脈衝寫碼(factorial pulse coding;FPC)來量化音訊頻譜之變換係數。
在操作1440中,可組合作為針對每一頻帶之階乘脈衝寫 碼之結果所獲得之碼字。可將經組合碼字提供至圖1之多工單元190或圖6之多工單元690。
現將描述階乘脈衝寫碼之原理。
階乘脈衝寫碼是藉由使用單位量值脈衝來有效地寫碼信號之技術,且可藉由使用非零脈衝之數目、非零脈衝之位置、非零脈衝之量值以及非零脈衝之正負號之所有組合來表示信號。能夠表示脈衝之所有組合的偶然數目(occasional number)N可由方程式1表示。
在方程式1中,2i指示用於將i個非零脈衝表示為+或-之正負號之出現(occurrence)的偶然數目,F(n,i)指示可被選擇用於給定n個樣本位置之i個非零脈衝之位置的偶然數目,且D(m,i)指示在i個非零脈衝之位置處所選擇之信號之出現(occurrence)的偶然數目,其可由m個單位量值脈衝表示。
在方程式1中,F(n,i)及D(m,i)可分別由方程式2及3表示。
表示由方程式1計算的所有組合之偶然數目N所需之位元數目b可由方程式4表示。
b=log2 N (4)
方程式4可如方程式5中所示地配置。
亦即,針對包含於任意頻帶中之輸入信號向量執行階乘脈衝寫碼所需之位元數目b是由對應於頻帶長度的n與對應於單位量值脈衝之數目的m之複數多項式表示式定義。在此情況下,由於n為給定值,故所述多項式表示式可被視為m與b之間的相關。為了根據b判定m之值,由於不可能藉由使用方程式5來根據b直接計算m之值,故使用預設m可具有之任意最大值且在使m之值自0逐1增加至預設之最大值之同時找出滿足b的m之值之方法。由於此迭代方法在m之值之範圍很大時具有高複雜度,故可藉由將二進位搜尋應用於所述迭代方法來降低複雜度。階乘脈衝寫碼之基本原理揭露於美國專利第6,236,960號中。
圖15為說明根據一例示性實施例之判定滿足頻帶單元中之容許位元之數目b的單位量值脈衝之數目m之方法的流程圖,在所述方法中應用二進位搜尋。在此情況下,假設階乘脈衝寫碼所需之位元數目b隨單位量值脈衝之數目m增加。
參看圖15,在操作1510中,可設定m可具有之最小值Lp以及最大值Hp。最小值Lp以及最大值Hp可實驗性地設定為對應於所有頻帶。
在操作1520中,可判定最小值Lp與最大值Hp之間的差是否大於1。作為操作1520中之判定之結果,若最小值Lp與最大值Hp之間的差等於或小於1,則可將單位量值脈衝之最終數目num_pulse判定為中值m。
作為操作1520中之判定之結果,若最小值Lp與最大值 Hp之間的差大於1,則在操作1530中,可計算最小值Lp與最大值Hp之中值m。
在操作1540中,可計算關於中值m的階乘脈衝寫碼所需之位元數目,且可將所計算位元之數目與目標值b進行比較。在操作1540中,fpc_bits(m,n)表示用於計算關於m之給定值的階乘脈衝寫碼所需之位元數目的函數,且fpc_bits(m,n)對應於方程式4。
作為操作1540中之比較之結果,若關於中值m的階乘脈衝寫碼所需之位元數目小於目標值b,則可能需要大於中值m之值,且因此,在操作1550中,可將中值m設定為最小值Lp,且可迭代地執行操作1520。
作為操作1540中之比較之結果,若關於中值m的階乘脈衝寫碼所需之位元數目大於目標值b,則可能需要小於中值m之值,且因此,在操作1560中,可將中值m設定為最大值Hp,且可迭代地執行操作1520。
在此情況下,當m之值範圍中的最大值為MAX時,迭代之次數可至多為,且因此,迭代數目可在m可具有之最大值很大時增加。
圖16為說明根據另一例示性實施例之判定滿足頻帶單元中之容許位元之數目b的單位量值脈衝之數目m之方法的流程圖。
首先,將描述判定單位量值脈衝之數目m之最大值的程序。
詳言之,方程式5可等於方程式6。
在方程式6中,z(m,n)可展開為如方程式7中所示之多項式表示式。
當針對方程式7中的m之最高級執行展開時,方程式6可由方程式8表示。
當針對m重排方程式8時,方程式8可由方程式9表示。
亦即,方程式9展現單位量值脈衝之數目m可具有之最大值。根據方程式9的m之最大值為比在初始階段中任意判定之最大值更接近於單位量值脈衝之最終數目的值,且可用比現有方法少得多之迭代來判定最終值。此處,可將最小值設定為0或1。
當針對m重排方程式8時,方程式8亦可由方程式10表示。
在方程式10中,n表示頻帶之長度,b表示執行階乘脈衝寫碼所需之位元之數目,m表示單位量值脈衝之數目,且F(n)表示用於判定單位量值脈衝之數目之最小值的函數,其中F(n)可根據頻帶之長度來判定,例如,在n小於9時經判定為2,在n小於17時經判定為3,且在n小於33時經判定為6。根據此情況, 由於在大多數情況下頻帶之長度小於17,故當使用二進位搜尋方法時,可藉由執行匹配程序一次或兩次來判定每一頻帶之單位量值脈衝之最終數目。
返回參看圖16,在操作1610中,可使用方程式11來計算寫碼預定頻帶中之n個輸入樣本向量的至少一脈衝所需之位元數目b1
b 1=1+log2 n (11)
在操作1620中,可將給予預定頻帶之所分配位元之數目b與寫碼至少一脈衝所需之位元數目b1進行比較。作為操作1620中之比較之結果,若所分配位元之數目b小於寫碼至少一脈衝所需之位元數目b1,則將單位量值脈衝之最終數目num_pulse設定為0而無迭代。
在操作1630中,可使用方程式9來獲取單位量值脈衝之數目m之最大值。
在操作1640中,可使用單位量值脈衝之數目m之最大值來計算階乘脈衝寫碼所需之位元數目,且可獲取階乘脈衝寫碼所需之位元數目與所分配位元之數目b之間的差值diff。在操作1640中,fpc_bits(m,n)表示用於計算關於給定m及n的階乘脈衝寫碼所需之位元數目的函數。
在操作1650中,可將差值diff與0進行比較。作為操作1650中之比較之結果,若差值diff等於或小於0,則可將m之對應值判定為單位量值脈衝之最終數目num_pulse。
作為操作1650中之比較之結果,若差值diff大於0,則在操作1660中,可將差值diff與預定義臨限值THR進行比較。 可經由實驗或模擬將臨限值THR判定為最佳值。
作為操作1660中之比較之結果,若差值diff大於預定義臨限值THR,則在操作1670中,可在範圍(min,m)內使用二進位搜尋來判定單位量值脈衝之最終數目num_pulse。圖15中所說明之方法可用於二進位搜尋。
作為操作1660中之比較之結果,若差值diff等於或小於預定義臨限值THR,則可藉由使m之當前值減小1來重新計算階乘脈衝寫碼所需之位元數目,且可重複線性遞減程序,直至所使用位元之數目滿足所分配之位元數目b為止。可將滿足所分配之位元數目b的m之值判定為對應頻帶之單位量值脈衝之最終數目num_pulse。
圖17為說明根據另一例示性實施例之判定滿足頻帶單元中之所分配位元數目b的單位量值脈衝之數目m之方法的流程圖。儘管圖17中未展示,但認為已預先執行圖16之操作1610及1620。
參看圖17,在操作1710中,若所分配位元之數目b大於寫碼至少一脈衝所需之位元數目b1,則可使用方程式9來計算單位量值脈衝之數目m之最大值。
在操作1720中,可使用單位量值脈衝之數目m之最大值來計算階乘脈衝寫碼所需之位元數目,且可將所計算位元之數目與所分配位元之數目b之間的差值diff(例如,差值diff之絕對值)與預定義臨限值THR進行比較。如在圖16中,可經由實驗或模擬將臨限值THR判定為最佳值。作為比較之結果,若差值diff大於臨限值THR,則可藉由在範圍(min,m)內執行二進位搜尋來 改變m之值。可重複二進位搜尋程序,除非使用m之經改變值計算的位元之數目與所分配位元之數目b之間的差值diff小於臨限值THR。
在操作1730中,當使用m之經改變值計算的位元之數目與所分配位元之數目b之間的差值diff小於臨限值THR時,若使用m之經改變值計算的位元之數目大於所分配位元之數目b,則可使m之當前值減小1,直至滿足所分配位元之數目b為止。可將滿足所分配位元之數目b的m之值判定為對應頻帶之單位量值脈衝之最終數目num_pulse。
在操作1740中,當使用m之經改變值計算的位元之數目與所分配位元之數目b之間的差值diff小於臨限值THR時,若使用m之經改變值計算的位元之數目小於所分配位元之數目b,則可使m之當前值增加1,直至滿足所分配位元之數目b為止。可將滿足所分配位元之數目b的m之值判定為對應頻帶之單位量值脈衝之最終數目num_pulse。
表1說明在使用二進位搜尋方法之情況下的迭代數目與在使用二進位搜尋方法與線性遞減方法之組合之情況下的迭代數目之比較。假設m可具有之值之範圍為90至500。
圖14至圖17之階乘脈衝寫碼方法可被撰寫為電腦程式碼且由至少一處理器件來執行。
圖14至圖17之階乘脈衝寫碼方法可由圖1之編碼單元170、圖5之頻譜編碼單元530或圖6之編碼單元670使用,但所述實施例不限於此。
圖14至圖17之階乘脈衝寫碼方法亦可由圖7之解碼單元750、圖9之頻譜解碼單元910、圖10之頻譜解碼單元1010、圖11之頻譜解碼單元1110、圖12之頻譜解碼單元1250或圖13之頻譜解碼單元1350用於階乘脈衝解碼,但所述實施例不限於此。
圖18為根據一例示性實施例之包含編碼模組之多媒體器件的方塊圖。
參看圖18,多媒體器件1800可包含通信單元1810以及編碼模組1830。另外,多媒體器件1800可更包含儲存單元1850,其用於根據音訊位元串流之用途而儲存作為編碼之結果所獲得之音訊位元串流。此外,多媒體器件1800可更包含麥克風1870。亦即,可以可選地(optionally)包含儲存單元1850以及麥克風1870。多媒體器件1800可更包含任意解碼模組(未圖示),例如,用於執行一般解碼功能之解碼模組或根據一例示性實施例之解碼模組。編碼模組1830可藉由與包含於多媒體器件1800中之其他組件(未圖示)整合作為一個主體而由至少一處理器(例如,中央處理單元(未圖示))實施。
通信單元1810可接收自外部提供之音訊信號或經編碼位元串流中之至少一者,或傳輸經復原音訊信號或作為編碼模組1830進行之編碼之結果所獲得之經編碼位元串流中之至少一者。
通信單元1810經組態以經由無線網路(諸如,無線網際網路、無線企業內部網路、無線電話網路、無線區域網路(wireless Local Area Network;wireless LAN)、Wi-Fi、Wi-Fi直接(Wi-Fi Direct;WFD)、第三代(third generation;3G)、第四代(fourth generation;4G)、藍芽、紅外線資料協會(Infrared Data Association;IrDA)、射頻識別(Radio Frequency Identification;RFID)、超寬頻(Ultra WideBand;UWB)、Zigbee或近場通信(Near Field Communication;NFC))或有線網路(諸如,有線電話網路或有線網際網路)將資料傳輸至外部多媒體器件且自外部多媒體器件接收資料。
根據一例示性實施例,編碼模組1830可藉由以下操作產生位元串流:將時域中之音訊信號(其經由通信單元1810或麥克風1870提供)變換為頻域中之音訊頻譜;藉由使用音訊頻譜之預定頻帶中之頻譜能量來判定所分配位元之數目;基於音訊頻譜之頻帶單元中之所分配位元之數目來判定用於階乘脈衝寫碼之單位量值脈衝之數目;以及藉由使用單位量值脈衝之經判定數目在頻譜之頻帶單元中執行階乘脈衝寫碼。
根據另一例示性實施例,編碼模組1830可估計關於所分配位元之數目的單位量值脈衝之數目之最大值,且藉由在最小值至最大值之範圍內執行二進位搜尋來判定每一頻帶之單位量值脈衝之最終數目。根據另一例示性實施例,編碼模組1830可估計關於所分配位元之數目的單位量值脈衝之數目之最大值,且藉由在最小值至最大值之範圍內選擇性地執行二進位搜尋方法及線性遞減方法來判定每一頻帶之單位量值脈衝之最終數目。
儲存單元1850可儲存由編碼模組1830產生之經編碼位元串流。另外。儲存單元1850可儲存操作多媒體器件1800所需 之各種程式。
麥克風1870可將來自使用者或外部之音訊信號提供至編碼模組1830。
圖19為根據一例示性實施例之包含解碼模組之多媒體器件的方塊圖。
圖19之多媒體器件1900可包含通信單元1910以及解碼模組1930。另外,根據作為解碼結果所獲得之經復原音訊結果之用途,圖19之多媒體器件1900可更包含儲存單元1950,其用於儲存經復原音訊信號。另外,圖19之多媒體器件1900可更包含揚聲器1970。亦即,儲存單元1950及揚聲器1970為可選的。圖19之多媒體器件1900可更包含編碼模組(未圖示),例如,用於執行一般編碼功能之編碼模組或根據一例示性實施例之編碼模組。解碼模組1930可與包含於多媒體器件1900中之其他組件(未圖示)整合且由至少一處理器(例如,中央處理單元(central processing unit;CPU))實施。
參看圖19,通信單元1910可接收自外部提供之音訊信號或經編碼位元串流中之至少一者,或可傳輸作為解碼模組1930之解碼之結果所獲得之經復原音訊信號或作為編碼之結果所獲得之音訊位元串流中之至少一者。通信單元1910可實質上類似於圖18之通信單元1810來實施。
根據一例示性實施例,解碼模組1930可藉由以下操作產生經復原音訊信號:接收經由通信單元1910提供之位元串流;藉由使用位元串流中之音訊頻譜之預定頻帶單元中之頻譜能量來判定所分配位元之數目;基於音訊頻譜之頻帶單元中之所分配位元 之數目來判定用於階乘脈衝寫碼之單位量值脈衝之數目;藉由使用單位量值脈衝之經判定數目在頻譜之頻帶單元中執行階乘脈衝解碼;以及將由解碼單元解碼之音訊頻譜變換為時域中之音訊信號。
根據另一例示性實施例,解碼模組1930可估計關於所分配位元之數目的單位量值脈衝之數目之最大值,且藉由在最小值至最大值之範圍內執行二進位搜尋來判定每一頻帶之單位量值脈衝之最終數目。根據另一例示性實施例,解碼模組1930可估計關於所分配位元之數目的單位量值脈衝之數目之最大值,且藉由關於自最小值至最大值之範圍選擇性地使用二進位搜尋方法及線性遞減方法來判定每一頻帶之單位量值脈衝之最終數目。
儲存單元1950可儲存由解碼模組1930產生之經復原音訊信號。另外。儲存單元1950可儲存操作多媒體器件1900所需之各種程式。
揚聲器1970可將由解碼模組1930產生之經復原音訊信號輸出至外部。
圖20為根據一例示性實施例之包含編碼模組及解碼模組之多媒體器件的方塊圖。
圖20所展示之多媒體器件2000可包含通信單元2010、編碼模組2020以及解碼模組2030。另外,多媒體器件2000可更包含儲存單元2040,其用於根據作為編碼之結果所獲得之音訊位元串流或作為解碼之結果所獲得之經復原音訊信號之用途而儲存音訊位元串流或經復原音訊信號。另外,多媒體器件2000可更包含麥克風2050及/或揚聲器2060。編碼模組2020以及解碼模組 2030可藉由與包含於多媒體器件2000中之其他組件(未圖示)整合作為一個主體而由至少一處理器(例如,中央處理單元(CPU)(未圖示))實施。
由於圖20中所展示之多媒體器件2000之組件對應於圖18中所展示之多媒體器件1800之組件或圖19中所展示之多媒體器件1900之組件,故省略對所述組件之詳細描述。
圖18、圖19以及圖20中所展示之多媒體器件1800、1900以及2000中之每一者可包含僅用於語音通信之終端機(諸如電話或行動電話)、僅用於廣播或音樂之器件(諸如電視(TV)或MP3播放器)或僅用於語音通信之終端機與僅用於廣播或音樂之器件之混合式終端機器件,但不限於此。另外,多媒體器件1800、1900以及2000中之每一者可被用作為用戶端、伺服器或在用戶端與伺服器之間移置的轉換器(transducer)。
當多媒體器件1800、1900或2000為(例如)行動電話時,儘管未展示,但多媒體器件1800、1900或2000可更包含諸如小鍵盤之使用者輸入單元、用於顯示由使用者介面或行動電話處理之資訊之顯示單元,以及用於控制行動電話之功能之處理器。另外,行動電話可更包含具有攝影功能之攝影機單元以及用於執行行動電話所需之功能之至少一組件。
當多媒體器件1800、1900或2000為(例如)TV時,儘管未展示,但多媒體器件1800、1900或2000可更包含諸如小鍵盤之使用者輸入單元、用於顯示接收到的廣播資訊之顯示單元,以及用於控制TV之所有功能之處理器。另外,TV可更包含用於執行TV之功能之至少一組件。
根據所述實施例之方法可被撰寫為電腦可執行程式且可藉由使用非暫時性電腦可讀記錄媒體而實施於執行所述程式之通用數位電腦中。另外,所述實施例中可使用的資料結構、程式指令或資料檔案可以各種方式記錄於非暫時性電腦可讀記錄媒體上。非暫時性電腦可讀記錄媒體為可儲存此後可由電腦系統讀取之資料之任何資料儲存器件。非暫時性電腦可讀記錄媒體之實例包含磁性儲存媒體(諸如硬碟、軟性磁碟以及磁帶)、光學記錄媒體(諸如CD-ROM以及DVD)、磁光媒體(諸如光學磁碟)以及尤其經組態以儲存並執行程式指令之硬體器件(諸如ROM、RAM以及快閃記憶體)。另外,非暫時性電腦可讀記錄媒體可為用於傳輸指定程式指令、資料結構或其類似者之信號之傳輸媒體。程式指令之實例不僅可包含由編譯器產生之機械式語言碼,而且可包含可由電腦使用解譯器或其類似者執行之高階語言碼。
雖然已參考本發明之例示性實施例特定展示並描述了本發明,但一般熟習此項技術者將理解,在不脫離由以下申請專利範圍界定的本發明之精神以及範疇之情況下,可在本文中做出形式以及細節上的各種改變。
1610、1620、1630、1640、1650、1660、1670、1680‧‧‧操作

Claims (22)

  1. 一種頻譜編碼方法,其包括:基於頻譜之頻帶單元中之所分配位元之數目判定用於階乘脈衝寫碼之單位量值脈衝之數目;以及藉由使用單位量值脈衝之所述經判定數目在所述頻譜之所述頻帶單元中執行階乘脈衝寫碼。
  2. 如申請專利範圍第1項所述之頻譜編碼方法,其中對單位量值脈衝之所述數目之所述判定包括估計關於所分配位元之所述數目的單位量值脈衝之所述數目之最大值,以及藉由在最小值至所述最大值之範圍內執行二進位搜尋來判定每一頻帶之單位量值脈衝之最終數目。
  3. 如申請專利範圍第1項所述之頻譜編碼方法,其中所述最小值為0。
  4. 如申請專利範圍第1項所述之頻譜編碼方法,其中所述最小值是藉由自根據頻帶之長度的所述最大值減去預定常數所獲得之值。
  5. 如申請專利範圍第1項所述之頻譜編碼方法,其中對單位量值脈衝之所述數目之所述判定包括估計關於所分配位元之所述數目的單位量值脈衝之所述數目之最大值,以及藉由在最小值至所述最大值之範圍內選擇性地執行二進位搜尋方法以及線性遞減方法來判定每一頻帶之單位量值脈衝之所述最終數目。
  6. 如申請專利範圍第5項所述之頻譜編碼方法,其中所述最小值為0。
  7. 如申請專利範圍第5項所述之頻譜編碼方法,其中所述最 小值為藉由自根據頻帶之長度的所述最大值減去預定常數所獲得之值。
  8. 如申請專利範圍第5項所述之頻譜編碼方法,其中藉由使用階乘脈衝寫碼所需之位元之所述數目與所分配位元之所述數目之間的差值而將二進位搜尋方法以及線性遞減方法中之一者用於預定數目個單位量值脈衝。
  9. 如申請專利範圍第1項所述之頻譜編碼方法,其中當所分配位元之所述數目小於寫碼至少一脈衝所需之位元之所述數目時,對應頻帶之單位量值脈衝之所述數目經分配為0。
  10. 一種音訊編碼裝置,其包括:變換單元,其用以將時域中之音訊信號變換為頻域中之音訊頻譜;位元分配單元,其用以藉由使用所述音訊頻譜之預定頻帶單元中之頻譜能量來判定所分配位元之數目;以及編碼單元,其用以基於用於所述音訊頻譜之所分配位元之所述數目判定用於階乘脈衝寫碼之單位量值脈衝之數目且用以藉由使用單位量值脈衝之所述經判定數目在所述音訊頻譜之所述頻帶單元中執行階乘脈衝寫碼。
  11. 一種頻譜解碼方法,其包括:基於頻譜之頻帶單元中之所分配位元之數目判定用於階乘脈衝寫碼之單位量值脈衝之數目;以及藉由使用單位量值脈衝之所述經判定數目在所述頻譜之所述頻帶單元中執行階乘脈衝解碼。
  12. 如申請專利範圍第11項所述之頻譜解碼方法,其中對單 位量值脈衝之所述數目之所述判定包括估計關於所分配位元之所述數目的單位量值脈衝之所述數目之最大值,以及藉由在最小值至所述最大值之範圍內執行二進位搜尋來判定每一頻帶之單位量值脈衝之最終數目。
  13. 如申請專利範圍第11項所述之頻譜解碼方法,其中所述最小值為0。
  14. 如申請專利範圍第11項所述之頻譜解碼方法,其中所述最小值是藉由自根據頻帶之長度的所述最大值減去預定常數所獲得之值。
  15. 如申請專利範圍第11項所述之頻譜解碼方法,其中對單位量值脈衝之所述數目之所述判定包括估計關於所分配位元之所述數目的單位量值脈衝之所述數目之最大值,以及藉由關於自最小值至所述最大值之範圍選擇性地使用二進位搜尋方法以及線性遞減方法來判定每一頻帶之單位量值脈衝之所述最終數目。
  16. 如申請專利範圍第15項所述之頻譜解碼方法,其中所述最小值為0。
  17. 如申請專利範圍第15項所述之頻譜解碼方法,其中所述最小值是藉由自根據頻帶之長度的所述最大值減去預定常數所獲得之值。
  18. 如申請專利範圍第15項所述之頻譜解碼方法,其中藉由使用階乘脈衝寫碼所需之所述位元數目與所分配位元之所述數目之間的差值而將所述二進位搜尋方法以及所述線性遞減方法中之一者用於預定數目個單位量值脈衝。
  19. 如申請專利範圍第11項所述之頻譜解碼方法,其中當所 分配位元之所述數目小於寫碼至少一脈衝所需之位元之數目時,對應頻帶之單位量值脈衝之所述數目經分配為0。
  20. 一種音訊解碼裝置,其包括:位元分配單元,其用以藉由使用包含於位元串流中之音訊頻譜之預定頻帶單元中之頻譜能量來判定所分配位元之數目;解碼單元,其用以基於所述音訊頻譜之頻帶單元中之所分配位元之所述數目判定用於階乘脈衝解碼之單位量值脈衝之數目且用以藉由使用單位量值脈衝之所述經判定數目在所述音訊頻譜之所述頻帶單元中執行階乘脈衝解碼;以及反變換單元,其用以將由所述解碼單元解碼之所述音訊頻譜變換為時域中之音訊信號。
  21. 一種非暫時性電腦可讀儲存媒體,其中儲存有在由電腦執行時執行申請專利範圍第1至9項中任一項所述之頻譜編碼方法的程式指令。
  22. 一種非暫時性電腦可讀儲存媒體,其中儲存有在由電腦執行時執行申請專利範圍第11至19項中任一項所述之頻譜解碼方法的程式指令。
TW102104310A 2012-02-07 2013-02-04 頻譜編碼方法、音訊編碼裝置、頻譜解碼方法、音訊解碼裝置以及非暫時性電腦可讀儲存媒體 TW201337913A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261595760P 2012-02-07 2012-02-07

Publications (1)

Publication Number Publication Date
TW201337913A true TW201337913A (zh) 2013-09-16

Family

ID=49627965

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102104310A TW201337913A (zh) 2012-02-07 2013-02-04 頻譜編碼方法、音訊編碼裝置、頻譜解碼方法、音訊解碼裝置以及非暫時性電腦可讀儲存媒體

Country Status (1)

Country Link
TW (1) TW201337913A (zh)

Similar Documents

Publication Publication Date Title
JP6726785B2 (ja) ビット割り当て装置
US11355129B2 (en) Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
US20130275140A1 (en) Method and apparatus for processing audio signals at low complexity
TW201337913A (zh) 頻譜編碼方法、音訊編碼裝置、頻譜解碼方法、音訊解碼裝置以及非暫時性電腦可讀儲存媒體