TWI451403B - 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式 - Google Patents

音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式 Download PDF

Info

Publication number
TWI451403B
TWI451403B TW099135555A TW99135555A TWI451403B TW I451403 B TWI451403 B TW I451403B TW 099135555 A TW099135555 A TW 099135555A TW 99135555 A TW99135555 A TW 99135555A TW I451403 B TWI451403 B TW I451403B
Authority
TW
Taiwan
Prior art keywords
value
spectral
decoded
audio
frequency
Prior art date
Application number
TW099135555A
Other languages
English (en)
Other versions
TW201129969A (en
Inventor
Guillaume Fuchs
Vignesh Subbaraman
Nikolaus Rettelbach
Markus Multrus
Marc Gayer
Patrick Warmbold
Christian Griebel
Oliver Weiss
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201129969A publication Critical patent/TW201129969A/zh
Application granted granted Critical
Publication of TWI451403B publication Critical patent/TWI451403B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Description

音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式 發明領域
依據本發明之實施例係有關於一種用以基於已編碼的音訊資訊而提供已解碼的音訊資訊之音訊解碼器,一種用以基於輸入的音訊資訊而提供已編碼的音訊資訊之音訊編碼器,一種用以基於已編碼的音訊資訊而提供已解碼的音訊資訊之方法,一種用以基於輸入的音訊資訊而提供已編碼的音訊資訊之方法,及一種電腦程式。
依據本發明之實施例係有關於一種改良式無雜訊頻譜編碼,其可用於音訊編碼器或音訊解碼器,例如所謂的統一語音與音訊編碼器(USAC)。
發明背景
後文中將簡短解說本發明之背景,方便協助瞭解本發明及其優點。過去十年間,大量努力致力於以良好位元率效率而可能數位式儲存與配送音訊內容。此一方面有一項重大成就係國際標準ISO/IEC 14496-3的定義。此一標準的第三部分係有關音訊內容的編碼及解碼,而第三部分的第四次部分係有關一般音訊編碼。ISO/IEC 14496第三部分,第四次部分定義一般音訊內容的編碼及解碼構想。此外,業已提示進一步改良來改善品質及/或減低所要求的位元率。
依據該項標準所敘述的構想,時域音訊信號被轉換成時頻表示型態。自時域變換成時頻域典型地係使用時域樣本的變換區塊執行,該變換區塊也稱作為「訊框」。業已發現較佳係使用重疊訊框,其移位例如半個訊框,原因在於重疊允許有效地避免(或至少減少)假影(artifacts)。此外,業已發現須進行開窗(windowing),以免源自於此種時間上有限之訊框處理的假影。
藉由將該輸入的音訊信號的一開窗部而自時域變換成時頻域,許多情況下,獲得能量壓縮,使得部分頻譜值包含比較多個其它頻譜值顯著更大的幅度。如此,許多情況下,較少數的頻譜值具有顯著高於該等頻譜值平均幅度的一幅度。結果導致能量壓縮的時域至時頻域變換之一個典型例乃所謂的修正離散餘弦變換(MDCT)。
頻譜值經常係依據心理聲學(psychoacoustic)模型而定標(scaled)及量化,使得心理聲學上較重要的頻譜值其量化誤差較小,而心理聲學上較不重要的頻譜值其量化誤差較大。已經定標與量化的頻譜值係經編碼來提供其位元率有效的表示型態。
例如所謂的量化頻譜係數之霍夫曼編碼的使用係述於ISO/IEC 14496-3:2005(E),第三部分,第四次部分。
但業已發現頻譜值的編碼品質對所要求的位元率有顯著影響。又,業已發現音訊解碼器的複雜程度係取決於用以編碼該等頻譜值的編碼處理,音訊解碼器經常製作成可攜式消費者裝置,因此須價廉且耗電量低。
綜上所述,需要有可提供位元率效率與資源效率間的改良式折衷的一種音訊內容之編碼及解碼構想。
發明概要
依據本發明之一實施例,形成一種用以基於已編碼之音訊資訊而提供已解碼之音訊資訊的音訊解碼器。該音訊解碼器包含用以基於多個頻譜值之經算術編碼的表示型態而提供該等已解碼的頻譜值之一算術解碼器。該音訊解碼器也包含用以使用該等已解碼的頻譜值而提供一時域音訊表示型態,藉此獲得已解碼的音訊資訊之一頻域至時域變換器。該算術解碼器係組配來依據一上下文狀態,而選擇描述一碼值(其可擷取自表示該已編碼的音訊資訊之一位元串流)對映至一符元碼(其可為表示一已解碼的頻譜值、或其最高有效位元平面)之對映規則。該算術解碼器係組配來依據多個事先解碼頻譜值,及也依據欲解碼的頻譜值是否位在第一預定頻率區或位在第二預定頻率區,而判定描述該目前上下文狀態之一數值型目前上下文值。
業已發現目前欲解碼的頻譜值所在的頻率區之考量,允許上下文運算品質的顯著改良而未顯著提高上下文運算所要求的運算量。此外,經由考慮實際上,位在目前欲解碼的頻譜值鄰近的事先解碼頻譜值間之統計相依性係隨頻率而異,上下文可經選擇來允許用於與較低頻相關聯的頻譜值之解碼及用於與較低頻相關聯的頻譜值之解碼二者皆有高的編碼效率。上下文對目前欲解碼的頻譜值與事先解碼頻譜值(典型地來自於目前欲解碼的頻譜值之直接鄰近或間接鄰近)間之統計相依性細節的調整適應良好,獲致可提高編碼效率,同時維持運算量合理地低。發現可以極低運算量考慮頻率區,原因在於目前欲解碼的頻譜值之頻率指標於算術解碼過程中為自然所已知。如此,上下文的選擇性調適可以少量運算量執行而仍然獲致編碼效率的改良。
於一較佳實施例,算術解碼器係組配來依據欲解碼的頻譜值是否位在第一預定頻率區或位在第二預定頻率區,而選擇性地修正該數值型目前上下文值。除了數值型目前上下文值的先前運算(或其它測定)外,數值型目前上下文值的選擇性地修正允許該數值型目前上下文值的「正常」運算(或其它測定)與欲解碼的頻譜值目前所在該頻率區的考量組合。該數值型目前上下文值的「正常」運算可與該數值型目前上下文值的區相依性調適工作分開處理,典型地減低演繹法則與運算量的複雜度。又,只使用此一構想,即容易升級包含該數值型目前上下文值的「正常」運算的系統。
於一較佳實施例,該算術解碼器係組配來測定該數值型目前上下文值,使得該數值型目前上下文值係基於多個事先解碼頻譜值的組合,或基於自多個事先解碼頻譜值所導出的多個中間值的組合;以及使得該數值型目前上下文值依據欲解碼的頻譜值是否係位在第一預定頻率區或位在第二預定頻率區,而基於多個事先解碼頻譜值的組合,或基於自多個事先解碼頻譜值所導出的多個中間值的組合,於所得的一值選擇性地增加。業已發現數值型目前上下文值依據欲解碼的頻譜值所在的頻率區而選擇性增加,允許數值型目前上下文值的有效評估,而同時維持運算量少。
於一較佳實施例,該算術解碼器係組配來於至少第一頻率區與第二頻率區間區別,藉此判定該數值型目前上下文值,其中該第一頻率區包含與該音訊內容之一給定時間部分(例如一訊框或一次訊框)相關聯的頻譜值中之至少15%;及其中該第一頻率區為低頻區且包含具有最低頻率之相關聯的頻譜值(係在與該音訊內容之給定(目前)時間部分相關聯的該頻譜值集合內部)。業已發現藉由常見考慮頻率底部(包含該等頻譜值的至少15%)作為第一頻率區,可達成良好的上下文調適,原因在於頻譜值間之統計相依性並未包含介於此低頻率區的強力變化。如此,不同區的數目可維持充分地小,而其又轉而協助避開使用過多不同的對映規則。但於若干實施例,若第一頻率區包含至少一個頻譜值、至少二個頻譜值、或至少三個頻譜值即足,但即便如此仍以選用更延伸的第一頻譜區為佳。
於一較佳實施例,該算術解碼器係組配來於至少第一頻率區與第二頻率區間區別,藉此判定該數值型目前上下文值,其中該第二頻率區包含與該音訊內容之一給定時間部分(例如一訊框或一次訊框)相關聯的頻譜值中之至少15%;及其中該第二頻率區為高頻區且包含具有最高頻率之相關聯的頻譜值(係在與該音訊內容之給定(目前)時間部分相關聯的該頻譜值集合內部)。業已發現藉由常見考慮頻率頂部(包含該等頻譜值的至少15%)作為第二頻率區,可達成良好的上下文調適,原因在於頻譜值間之統計相依性並未包含介於此高頻率區的強力變化。如此,不同區的數目可維持充分地小,而其又轉而協助避開使用過多不同的對映規則。但於若干實施例,若第二頻率區包含至少一個頻譜值、至少二個頻譜值、或至少三個頻譜值即足,但即便如此仍以選用更延伸的第一頻譜區為佳。
於一較佳實施例,該算術解碼器係組配來至少於第一頻率區、第二頻率區與第三頻率區間區別,藉此依據該欲解碼的頻譜值係在至少三個頻率區中的哪一個之判定而判定該數值型目前上下文值。此種情況下,該第一頻率區、第二頻率區與第三頻率區各自包含多個相關聯的頻譜值。業已發現對典型音訊信號,推薦區別至少三個不同頻率區,原因在於典型地至少有三個不同頻率區其中頻譜值間有不同的統計相依性。業已發現推薦(但非必要)即使對窄頻音訊信號(例如對具有300 Hz至3 KHz間之頻率範圍的音訊信號),在三個或更多個頻率區間作區別。又,發現對有更高頻寬的音訊信號,推薦(但非必要)區別三個或更多個延伸的頻率區(各自具有多於一個相關聯的頻譜值)。
於一較佳實施例,該音訊資訊之一(目前)時間部分之頻譜值中之至少八分之一係與該第一頻率區相關聯,及該音訊資訊之一(目前)時間部分之頻譜值中之至少五分之一係與該第二頻率區相關聯,及該音訊資訊之一(目前)時間部分之頻譜值中之至少四分之一係與該第三頻率區相關聯。業已發現推薦有夠大頻率區,原因在於此種夠大頻率區可獲致編碼效率與運算複雜度間的良好折衷。又,業已發現使用極小頻率區(例如只包含一個相關聯的頻譜值之頻率區)係運算無效,且甚至可能造成編碼效率的降級。此外,須注意即便當只使用兩個頻率區時,也推薦選用夠大頻率區(例如包含至少兩個相關聯的頻譜值的頻率區)。
於一較佳實施例,該算術解碼器係組配來運算包含至少第一被加數及至少第二被加數的和,由於該加總結果而獲得該數值型目前上下文值。此種情況下,該第一被加數係經由描述事先解碼頻譜值之振幅的多個中間值之組合獲得,而該第二被加數描述(目前)欲解碼的頻譜值係與多個頻率區中的哪一個頻率區相關聯。使用此種辦法,可達成基於有關事先解碼頻譜值之振幅資訊之一上下文計算值與依據目前欲解碼的頻譜值相關聯的該頻率區之一上下文調適值間的分開。但也發現統計相依性的評比,其係基於事先解碼頻譜值振幅的評估,可藉將目前欲解碼的頻譜值相關聯的頻率區列入考量而予改良。但業已發現運算上含括該區資訊至數值型目前上下文值作為和值即足,以及即便如此簡單機制也可獲致該數值型目前上下文值的良好改進。
於一較佳實施例,該算術解碼器係組配來依據欲解碼的頻譜值係位在多個不同頻率區中的哪一個頻率區之判定,而修正該數值型目前上下文值之二進制表示型態的一個或多個預定位元位置。業已發現對該區資訊使用專用位元位置,可協助依據該數值型目前上下文值而選用對映規則。舉例言之,經由對該目前欲解碼的頻譜值相關聯的的頻率區之描述,使用該數值型目前上下文值之一預定位元位置,可簡化該對映規則的選擇。舉例言之,典型地有多個上下文情況,其中於目前欲解碼的頻譜值的給定鄰近(就頻譜值而言)之存在下,可使用相同對映規則,而與目前欲解碼的頻譜值相關聯的的頻率區無關。此種情況下,目前欲解碼的頻譜值相關聯的的頻率區有關的資訊可不加考慮,其係藉使用該資訊編碼之預定位元位置協助。但於其它情況下,亦即於目前欲解碼的頻譜值的不同鄰近環境(就頻譜值而言),當選擇對映規則時,有關目前欲解碼的頻譜值相關聯的的頻率區的資訊可加以探討。
於一較佳實施例,該算術解碼器係組配來依據該數值型目前上下文值而選擇對映規則,使得多個不同數值型目前上下文值導致選擇相同的對映規則。業已發現將目前欲解碼的頻譜值相關聯的的頻率區列入考量的構想,可組合相同對映規則係與多個不同數值型目前上下文值相關聯的構想。業已發現於全部情況下,無需考慮與目前欲解碼的頻譜值相關聯的的頻率,但至少於某些情況下,推薦考慮與目前欲解碼的頻譜值相關聯的的頻率區有關的資訊。
於一較佳實施例,該算術解碼器係組配來依據該數值型目前上下文值而執行對映規則的二階段式選擇。此種情況下,該算術解碼器係組配來於第一選擇步驟,檢查該數值型目前上下文值或自其中導出之值是否等於由一直接命中表的一登錄項目所描述之一有效狀態值。該算術解碼器也係組配來於第二選擇步驟,判定若該數值型目前上下文值或自其中導出之值係與由一直接命中表的一登錄項目所描述之一有效狀態值不同,則該數值型目前上下文值位在多個區間中的哪一個區間係唯一執行者。此種情況下,該算術解碼器係組配來依據第一選擇步驟及/或第二選擇步驟的結果而選定該對映規則。該算術解碼器也係組配來依據欲解碼的頻譜值是否位在第一頻率區或係位在第二頻率區而選定該對映規則。業已發現前文討論之數值型目前上下文值之運算與二步驟式對映規則之選擇的組合構想可獲致特殊優勢。舉例言之,使用此種構想,對欲解碼的頻譜值且係排列在不同頻率區,對映規則所相關聯的第一選擇步驟,可定義不同的「直接命中」上下文配置組態。又,在第二選擇步驟,其中執行對映規則之基於區間的選擇,極為適合用於該等情況(事先解碼頻譜值之環境)的處理,其中不期望(或至少不需要)考慮目前欲解碼的頻譜值相關聯的的頻率區。
於一較佳實施例,該算術解碼器係組配來依據該欲解碼的頻譜值係位在多個不同頻率區中的哪一個頻率區之判定,而選擇性地修正該數值型目前上下文值之二進制表示型態之一個或多個最低有效位元部分。此種情況下,該算術解碼器係組配來於該第二選擇步驟,判定該數值型目前上下文值之二進制表示型態係位在多個區間中之哪一個區間,而選擇該對映關係,使得若干數值型目前上下文值導致與該欲解碼的頻譜值位在哪一個頻率區不相干地選擇相同的對映規則;及使得對若干數值型目前上下文值而言,該對映規則係依據欲解碼的頻譜值係位在哪一個頻率區而選定。業已發現以該數值型目前上下文值的二進制表示型態的最低有效位元所編碼之頻率區係極為適合用來與該二步驟式對映規則之選擇作有效協力合作。
依據本發明之一實施例,形成一種用以基於一輸入的音訊資訊而提供一已編碼音訊資訊之音訊編碼器。該音訊編碼器包含用以基於該輸入的音訊資訊之時域表示型態而提供一頻域音訊表示型態,使得該頻域音訊表示型態包含一頻譜值集合的一能量壓縮時域至頻域變換器。該算術解碼器係組配來使用一可變長度碼字組而編碼頻譜值、或其前處理版本。該算術編碼器係組配來將一頻譜值、或一頻譜值之最高有效位元平面值對映至一碼值(其可包括人以編碼形式來表示該輸入的音訊資訊之一位元串流)。該算術編碼器係組配來選擇描述依據一上下文狀態而將一頻譜值、或一頻譜值之最高有效位元平面值對映至一碼值的對映規則。該算術編碼器係組配來依據多個先前已編碼的頻譜值,及也依據欲編碼的頻譜值是否位在第一預定頻率區或係位在第二預定頻率區來判定描述該目前上下文狀態之一數值型目前上下文值。
此種音訊信號編碼器係基於與前文討論之音訊信號解碼器相同的發現。業已發現顯然可有效用於音訊內容解碼的上下文之調適機制,應該也適用於編碼器端來允許獲得一致性系統。
依據本發明之一實施例,形成一種用以基於已編碼的音訊資訊而提供已解碼的音訊資訊之方法。
依據本發明之又另一實施例,形成一種用以基於輸入的音訊資訊而提供已編碼的音訊資訊之方法。
依據本發明之另一實施例,形成一種用於實施該等方法中之一者的電腦程式。
該等方法及電腦程式係基於與前述音訊解碼器及前述音訊編碼器相同的發現。
圖式簡單說明
接著將參考附圖描述依據本發明之實施例,附圖中:第1a及1b圖顯示依據本發明之一實施例,一種音訊編碼器之方塊示意圖;第2a及2b圖顯示依據本發明之一實施例,一種音訊解碼器之方塊示意圖;第3圖顯示用以解碼頻譜值的演繹法則「value_decode()」之虛擬程式碼表示型態;第4圖顯示用於狀態計算的上下文之示意代表圖;第5a圖顯示用以對映上下文的演繹法則「arith_map_context()」之虛擬程式碼表示型態;第5b及5c圖顯示用以獲得上下文狀態值的演繹法則「arith_get_context()」之虛擬程式碼表示型態;第5d1及5d2圖顯示用以自狀態變數導算出累積-頻率-表指標值「pki」的演繹法則「get_pk(s)」之虛擬程式碼表示型態;第5e圖顯示用以自狀態值導算出累積-頻率-表指標值「pki」的演繹法則「arith_get_pk(s)」之虛擬程式碼表示型態;第5f圖顯示用以自狀態值導算出累積-頻率-表指標值「pki」的演繹法則「get_pk(unsigned long s)」之虛擬程式碼表示型態;第5g1及5g2圖顯示用以自可變長度碼字組算術式解碼一符元的演繹法則「arith_decode()」之虛擬程式碼表示型態;第5h圖顯示用以更新上下文的演繹法則「arith_update_context()」之虛擬程式碼表示型態;第5i圖顯示定義及變數的圖說;第6a圖顯示統一語音與音訊編碼器(USAC)原始資料區塊之語法表示型態;第6b圖顯示單一通道元素之語法表示型態;第6c圖顯示成對通道元素之語法表示型態;第6d圖顯示「ics」控制資訊之語法表示型態;第6e圖顯示頻域通道串流之語法表示型態;第6f圖顯示算術式編碼頻譜資料之語法表示型態;第6g圖顯示解碼一頻譜值集合之語法表示型態;第6h圖顯示資料元素及變數的圖說;第7圖顯示依據本發明之另一實施例,一種音訊編碼器之方塊示意圖;第8圖顯示依據本發明之另一實施例,一種音訊解碼器之方塊示意圖;第9圖顯示使用依據本發明之編碼方案,依據USAC草擬標準之工作草稿3,用於無雜訊編碼比較之配置;第10a圖顯示用於狀態計算之上下文當其用於依據USAC草擬標準之工作草稿4時的示意代表圖;第10b圖顯示用於狀態計算之上下文當其用於依據本發明之實施例時的示意代表圖;第11a圖顯示該表當其用於依據USAC草擬標準之工作草稿4之該算術編碼方案時之綜論;第11b圖顯示該表當其用於依據本發明之算術編碼方案時之綜論;第12a圖顯示用於依據本發明及依據USAC草擬標準之工作草稿4之無雜訊編碼方案之唯讀記憶體需求指令之圖解代表圖;第12b圖顯示依據本發明及依據USAC草擬標準之工作草稿4之該構想的總USAC解碼器資料唯讀記憶體需求指令之圖解代表圖;第13a圖顯示依據USAC草擬標準之工作草稿3之算術編碼器、及依據本發明之一實施例之算術解碼器,統一語音與音訊編碼編碼器所使用之平均位元率之表代表圖;第13b圖顯示依據USAC草擬標準之工作草稿3之算術編碼器、及依據本發明之一實施例之算術編碼器,用於統一語音與音訊編碼編碼器位元累積控制之表代表圖;第14圖顯示依據USAC草擬標準之工作草稿3、及依據本發明之一實施例,用於USAC編碼編碼器之平均位元率之表代表圖;第15圖顯示基於訊框基礎,USAC之最小、最大、及平均位元率之表代表圖;第16圖顯示基於訊框基礎,最佳狀況及最惡劣狀況之表代表圖;第17(1)及17(2)圖顯示表「ari_s_hash[387]」之內容之表代表圖;第18圖顯示表「ari_gs_hash[225]」之內容之表代表圖;第19(1)及19(2)圖顯示表「ari_cf_m[64][9]」之內容之表代表圖;第20(1)及20(2)圖顯示表「ari_s_hash[387]」之內容之表代表圖;第21圖顯示依據本發明之一實施例,一種音訊編碼器之方塊示意圖;及第22圖顯示依據本發明之一實施例,一種音訊解碼器之方塊示意圖。
較佳實施例之詳細說明 1.依據第7圖之音訊編碼器
第7圖顯示依據本發明之一實施例,一種音訊編碼器之方塊示意圖。音訊編碼器700係組配來接收輸入的音訊資訊710,及基於此而提供已編碼的音訊資訊712。音訊編碼器包含能量壓縮時域至頻域變換器720,其係組配來基於該輸入的音訊資訊710之時域表示型態而提供頻域音訊表示型態722,使得該頻域音訊表示型態722包含一頻譜值集合。音訊編碼器700也包含算術編碼器730,其係組配來使用一可變長度碼字組而編碼(該頻域音訊表示型態722中之)一頻譜值或其前處理版本,來獲得已編碼之音訊資訊712(其可包含例如多數可變長度碼字組)。
算術編碼器730係組配來依據上下文狀態,而將一頻譜值或頻譜值之一最高有效位元平面值對映至一碼值(亦即對映至一可變長度碼字組)。算術編碼器730係組配來依據上下文狀態,選擇描述將一頻譜值或頻譜值之一最高有效位元平面值對映至一碼值的對映規則。算術編碼器係組配來依據多數事先編碼的(較佳地但非必要相鄰)頻譜值而判定該目前上下文狀態。為了達成此項目的,算術編碼器係組配來檢測一組多個事先編碼相鄰頻譜值其係個別地或共同地滿足有關其幅度的預定狀況,及依據該檢測結果而判定該目前上下文狀態。
如此可知,一頻譜值或頻譜值之一最高有效位元平面值對映至一碼值可藉使用對映規則742之頻譜值編碼740執行。狀態追蹤器750可經組配來追蹤該上下文狀態,且可包含一群組檢測器752來檢測一組多個事先編碼相鄰頻譜值其係個別地或共同地滿足有關其幅度的預定狀況。狀態追蹤器750也較佳係組配來依據由該群組檢測器752所執行的該檢測結果而判定目前上下文狀態。如此,狀態追蹤器750提供描述該目前上下文狀態之資訊754。對映規則選擇器760可選擇對映規則,例如累積頻率表,其描述一頻譜值或頻譜值之一最高有效位元平面值對映至一碼值。如此,對映規則選擇器760提供對映規則資訊742予該頻譜編碼740。
要言之,音訊編碼器700執行由該時域至頻域變換器所提供的一頻域音訊表示型態之算術編碼。該算術編碼為上下文相依性,使得對映規則(例如累積頻率表)係依據事先編碼頻譜值而選擇。如此,時間及/或頻率(或至少於預定環境內)係彼此相鄰及/或與該目前編碼頻譜值(亦即在該目前編碼頻譜值的預定環境以內之頻譜值)相鄰的頻譜值係在算術編碼中考慮來調整藉該算術編碼評估機率的分布。當選定適當對映規則時,執行檢測來測定是否有一組多個事先編碼相鄰頻譜值其係個別地或共同地滿足有關其幅度的預定狀況。此項檢測結果係應用於該目前上下文狀態的選擇,亦即應用在對映規則的選擇。藉由檢測是否有一組多數頻譜值其係特小或特大,可辨識頻域音訊表示型態,其可為時頻表示型態內部的頻譜特徵。頻譜特徵諸如一組多數特小的或特大的頻譜值,指示須使用特定上下文狀態,原因在於此一特定上下文狀態可提供特佳編碼效率。如此,檢測得該組相鄰頻譜值其滿足預定狀況,其典型地係用來與基於多個事先編碼頻譜值的一組合的另一個上下文評估組合,提供一種機制其允許有效地選定適當上下文,該輸入的音訊資訊是否具有某些特殊狀態(例如包含大型被遮蔽的頻率範圍)。
如此,可達成有效編碼,同時維持上下文的計算充分簡單。
2.依據第8圖之音訊解碼器
第8圖顯示音訊解碼器800之方塊示意圖。音訊解碼器800係組配來接收已編碼的音訊資訊810,及基於此而提供已解碼的音訊資訊812。音訊解碼器800包含算術解碼器820,其係組配來基於該等頻譜值的算術式編碼表示型態821而提供多個已解碼的頻譜值822。音訊解碼器800也包含頻域至時域變換器830,其係組配來接收該已解碼的頻譜值822,及使用該已解碼的頻譜值822,提供時域音訊表示型態812,其可組成該已解碼的音訊資訊,來獲得已解碼的音訊資訊812。
算術解碼器820包含頻譜值測定器824,其係組配來將該等算術式編碼的頻譜值表示型態之一碼值對映至表示已解碼的頻譜值中之一者或多者、或該等已解碼的頻譜值中之一者或多者的至少部分(例如,最高有效位元平面)的一符元碼。頻譜值測定器824可經組配來依據對映規則而執行對映,其可藉對映規則資訊828a描述。
算術解碼器820係組配來依據上下文狀態(其可藉上下文狀態資訊826a描述),選擇描述一碼值(藉該等算術式編碼的頻譜值表示型態描述)對映至一符元碼(描述一個或多個頻譜值)的對映規則。算術解碼器820係組配來依據多數事先解碼頻譜值822而判定該目前上下文狀態。為了達成此項目的,可使用狀態追蹤器826,其接收描述該等事先解碼頻譜值之資訊。算術解碼器也係組配來檢測一組多個事先解碼(較佳相鄰,但非必要)頻譜值其係個別地或共同地滿足有關其幅度的預定狀況,及依據該檢測結果而判定該目前上下文狀態(例如藉上下文狀態資訊826a描述)。
該組多個事先解碼相鄰頻譜值其係滿足有關其幅度的預定狀況之檢測例如可藉一群組檢測器,其乃該狀態追蹤器826的一部分而進行。如此獲得目前上下文狀態資訊826a。該對映規則的選擇可藉對映規則選擇器828執行,該對映規則選擇器828係自該目前上下文狀態資訊826a導出對映規則資訊828a,及其提供該對映規則資訊828a予該頻譜值測定器824。
有關該音訊信號解碼器800之功能,須注意該算術解碼器820係組配來選擇平均上極為適合用於欲解碼的頻譜值之對映規則(例如累積頻率表),原因在於該對映規則係依據目前上下文狀態而選定,而該目前上下文狀態又係依據多個事先解碼頻譜值而判定。如此,可探討欲解碼的相鄰頻譜值間的統計相依性。此外,藉由檢測一組多個事先解碼相鄰頻譜值其係個別地或共同地滿足有關其幅度的預定狀況,可調整對映規則適應事先解碼頻譜值的特殊狀況(或樣式)。舉例言之,若識別一組多個較小的事先解碼相鄰頻譜值,或若識別一組多個較大的事先解碼相鄰頻譜值,則可選出特定對映規則。業已發現存在有一組較大頻譜值、或存在有一組較小頻譜值可被視為須使用特別適用於此種狀況的一專用對映規則的有效指示。如此,藉由探討此組多個頻譜值的檢測可協助(或加速)上下文運算。又,若未應用前述構想,則一音訊內容的特性可視為不容易考慮。舉例言之,比較用於正常上下文運算的該頻譜值集合,一組多個事先解碼頻譜值其係個別地或共同地滿足有關其幅度的預定狀況的檢測可基於不同的一頻譜值集合執行。
進一步細節容後詳述。
3.依據第1圖之音訊編碼器
後文中,將敘述依據本發明之一實施例的音訊編碼器。第1圖顯示此種音訊編碼器100之方塊示意圖。
音訊編碼器100係組配來接收一輸入的音訊資訊110,及基於此提供一位元串流112,其係組構成一已編碼的音訊資訊。音訊編碼器100選擇性地包含一前處理器120,其係組配來接收該輸入的音訊資訊110,及基於此而提供前處理輸入的音訊資訊110a。音訊編碼器100也包含一能量壓縮時域至頻域信號變換器130,其也定名為信號變換器。信號變換器130係組配來接收輸入的音訊資訊110、110a,及基於此而提供一頻域音訊資訊132,其較佳係呈一頻譜值集合形式。舉例言之,信號變換器130可經組配來接收輸入的音訊資訊110、110a之一訊框(例如時域樣本之一區塊),及提供表示該個別音訊框之音訊內容的一頻譜值集合。此外,該信號變換器130可經組配來接收多個接續的、重疊或非重疊輸入的音訊資訊110、110a之音訊框,及基於此而提供一時頻域音訊表示型態,其包含與各訊框相鄰頻譜值接續頻譜值集合之一序列,亦即一個頻譜值集合。
能量壓縮時域至頻域信號變換器130可包含一能量壓縮濾波器排組,其係提供與不同的、重疊或非重疊頻率範圍相關聯的頻譜值。舉例言之,該信號變換器130可包含一開窗MDCT變換器130a,其係組配來使用一變換窗而開窗該輸入的音訊資訊110、110a(或其訊框),及執行該開窗輸入的音訊資訊110、110a(或其開窗訊框)之修正離散餘弦變換。如此,該頻域音訊表示型態132可包含與該輸入的音訊資訊之一訊框相關聯的呈MDCT係數形式之例如1024個頻譜值之一集合。
音訊編碼器100選擇性地可又包含一頻譜後處理器140,其係組配來接收頻域音訊表示型態132,及基於此而提供一後處理頻域音訊表示型態142。該頻譜後處理器140例如可經組配來執行時間雜訊成形、及/或長期預測、及/或技藝界已知之任何其它頻譜後處理。音訊編碼器選擇性地進一步包含一定標器/量化器150,其係組配來接收頻域音訊表示型態132或其後處理版本142,及提供一已定標且已量化的頻域音訊表示型態152。
音訊編碼器100選擇性地,進一步包含一心理聲學模型處理器160,其係組配來提供該輸入的音訊資訊110(或其後處理版本110a),及基於此而提供一選擇性控制資訊,其可用於能量壓縮時域至頻域信號變換器130之控制,用於選擇性的頻譜後處理器140之控制,及/或用於選擇性的定標器/量化器150之控制。舉例言之,心理聲學模型處理器160可經組配來分析該輸入的音訊資訊,判定該輸入的音訊資訊110、110a的哪些組分對於人類的音訊內容聽覺特別重要,而該輸入的音訊資訊110、110a的哪些組分對於人類的音訊內容聽覺較不重要。據此,心理聲學模型處理器160可提供控制資訊,其係由音訊編碼器100使用來調整藉該定標器/量化器150對頻域音訊表示型態132、142之定標、及/或由該定標器/量化器150所施加的量化解析度。結果,聽覺上重要的標度因數頻帶(亦即成組的相鄰頻譜值其對人類的音訊內容聽覺特別重要)係以大的定標因數定標且以較高解析度量化,聽覺上較不重要的標度因數頻帶(亦即成組的相鄰頻譜值)係以較小的定標因數定標且以較低解析度量化。據此,聽覺上較為重要的頻率之已定標頻譜值係典型地比聽覺上較不重要的頻譜值顯著更大。
音訊編碼器也包含一算術編碼器170,其係組配來接收頻域音訊表示型態132(或另外,該頻域音訊表示型態132之後處理版本142,或甚至該頻域音訊表示型態132本身)之已定標且已量化版本152,及基於此而提供算術碼字組資訊172a,使得該算術碼字組資訊表示該頻域音訊表示型態152。
音訊編碼器100也包含一位元串流有效負載格式化器190,其係組配來接收該算術碼字組資訊172a。該位元串流有效負載格式化器190也典型地係組配來接收額外資訊,例如描述哪些標度因數已經藉定標器/量化器150施用之標度因數資訊。此外,位元串流有效負載格式化器190可經組配來接收其它控制資訊。位元串流有效負載格式化器190係組配來基於所接收的資訊,藉由依據期望的位元串流語法而組裝該位元串流來提供該位元串流112,容後詳述。
後文中,將敘述有關算術編碼器170之細節。算術編碼器170係組配來接收該頻域音訊表示型態132之多個後處理且已定標且已量化的頻譜值。算術編碼器包含一最高有效位元平面擷取器174,其係組配來自一頻譜值擷取最高有效位元平面m。此處須注意最高有效位元平面可包含一個或甚至多個位元(例如2或3位元)其乃該頻譜值之最高有效位元。如此,最高有效位元平面擷取器174提供一頻譜值的最高有效位元平面值176。
算術編碼器170也包含一第一碼字組測定器180,其係組配來測定表示該最高有效位元平面值m的算術碼字組acod_m[pki][m]。選擇性地,碼字組測定器180也提供一個或多個逸出碼字組(此處也標示以「ARITH_ESCAPE」),指示例如可利用多少個較低有效位元平面(以及結果,指示該最高有效位元平面的數值型權值)。第一碼字組測定器180可經組配來使用具有(或參考)累積頻率表指標pki之一選定的累積頻率表而提供與最高有效位元平面值m相關聯的該碼字組。
為了判定是否應使用該累積頻率表,該算術編碼器較佳包含一狀態追蹤器182,其係組配來例如藉由觀察哪些頻譜值係事先編碼而追蹤該算術編碼器之狀態。結果該狀態追蹤器182提供一狀態資訊184,例如標示以「s」或「t」的狀態值。算術編碼器170也包含一累積頻率表選擇器186,其係組配來接收該狀態資訊184,及提供描述該選定的累積頻率表之資訊188予該碼字組測定器180。舉例言之,累積頻率表選擇器186可提供一累積頻率表指標「pki」描述64累積頻率表之一集合中哪一個累積頻率表係選擇來由該碼字組測定器使用。另外,累積頻率表選擇器186可提供整個選定的累積頻率表予該碼字組測定器。如此,碼字組測定器180可使用所擇定的累積頻率表來提供該最高有效位元平面值m之碼字組acod_m[pki][m],使得編碼該最高有效位元平面值m之實際碼字組acod_m[pki][m]係與m值及累積頻率表指標pki有相依性,及結果與該目前狀態資訊184有相依性。有關編碼程序及所得碼字組格式之進一步細節容後詳述。
算術編碼器170又包含一較低有效位元平面擷取器189a,其係組配來若欲解碼的頻譜值中之一者或多者超過只使用該最高有效位元平面所能編碼的數值範圍,則自該已定標且已量化的頻域音訊表示型態152擷取一個或多個較低有效位元平面。若有所需,該等較低有效位元平面可包含一個或多個位元。據此,該較低有效位元平面擷取器189a提供較低有效位元平面資訊189b。算術編碼器170也包含一第二碼字組測定器189c,其係組配來接收較低有效位元平面資訊189d,及基於此而提供表示0、1、或更多較低有效位元平面之內容的0、1、或更多個碼字組「acor_r」。該第二碼字組測定器189c可經組配來施加算術編碼演繹法則或任何其它編碼演繹法則,而自該較低有效位元平面資訊189b導出該等較低有效位元平面碼字組「acor_r」。
此處須注意,較低有效位元平面數目可取決於該等已定標且已量化的頻譜值152而改變,使得若該欲編碼的已定標且已量化的頻譜值為較小,則絲毫也無較低有效位元平面;使得若欲編碼的該目前已定標且已量化的頻譜值為中等範圍,則可有一個較低有效位元平面;及使得若欲編碼的已定標且已量化的頻譜值具有較大值,則可有多於一個較低有效位元平面。
綜上所述,算術編碼器170係組配來使用階層編碼程序而編碼已定標且已量化的頻譜值,其係藉該資訊152描述。最高有效位元平面(例如每個頻譜值包含1、2或3位元)係編碼來獲得最高有效位元平面值之一算術碼字組「acod_m[pki][m]」。一個或多個較低有效位元平面(該等較低有效位元平面各自例如包含1、2或3位元)係編碼來獲得一個或多個碼字組「acod_r」。當編碼最高有效位元平面時,該最高有效位元平面值m係對映至一碼字組acod_m[pki][m]。為了達成此項目的,64不同累積頻率表可利用於依據算術編碼器170之狀態,亦即依據事先編碼頻譜值來編碼值m。如此,獲得碼字組「acod_m[pki][m]」。此外,若存在有一個或多個較低有效位元平面,則提供一個或多個碼字組「acod_r」且含括於該位元串流。
復置描述
音訊編碼器100選擇性地可經組配來判定經由復置該內容,例如經由將該狀態指標復置至一內設值,是否可獲得位元率的改良。如此,音訊編碼器100可經組配來提供一復置資訊(例如定名「arith_reset_flag」),指示該算術編碼內容是否經復置,及也指示於相對應解碼器中用於算術解碼的內容是否應復置。
有關位元串流格式及施用的累積頻率表之細節容後詳述。
4.音訊解碼器
後文中,將敘述依據本發明之一實施例之音訊解碼器。第2圖顯示此種音訊解碼器200之方塊示意圖。
音訊解碼器200係組配來接收一位元串流210,其表示一己編碼的音訊資訊,及其可與由音訊編碼器100所提供的位元串流112相同。音訊解碼器200基於該位元串流210而提供已解碼的音訊資訊212。
音訊解碼器200包含一選擇性的位元串流有效負載解格式化器220,其係組配來接收該位元串流210,及自該位元串流210擷取一已編碼的頻域音訊表示型態222。例如,該位元串流有效負載解格式化器220可經組配來自位元串流210,擷取算術式編碼的頻譜值,例如表示該頻域音訊表示型態的頻譜值a之最高有效位元平面值m之一算術碼字組「acod_m[pki][m]」,及表示該頻譜值a之較低有效位元平面之內容的碼字組「acod_r」。如此,已編碼的頻域音訊表示型態222組成(或包含)頻譜值之一算術式編碼表示型態。該位元串流有效負載解格式化器220進一步係組配來自該位元串流擷取額外控制資訊,其未顯示於第2圖。此外,位元串流有效負載解格式化器選擇性地係組配來自位元串流210擷取一狀態復置資訊224,其也標示為算術復置旗標或「arith_reset_flag」。
音訊解碼器200包含一算術解碼器230,其也稱作為「頻譜無雜訊解碼器」。算術解碼器230係組配來接收該已編碼的頻域音訊表示型態220,及選擇性地,狀態復置資訊224。算術解碼器230也係組配來提供一已解碼的頻域音訊表示型態232,其可包含已解碼的頻譜值表示型態。舉例言之,已解碼的頻域音訊表示型態232可包含已解碼的頻譜值表示型態,其係藉已編碼的頻域音訊表示型態220描述。
音訊解碼器200也包含一選擇性的反量化器/重定蔡器240,其係組配來接收該已解碼的頻域音訊表示型態232,及基於此而提供已反量化及已重定標的頻域音訊表示型態242。
音訊解碼器200進一步包含一選擇性的頻譜前處理器250,其係組配來接收該已反量化及已重定標的頻域音訊表示型態242,及基於此而提供該已反量化及已重定標的頻域音訊表示型態242之一前處理版本252。音訊解碼器200也包含一頻域至時域信號變換器260,其也稱作「信號變換器」。
信號變換器260係組配來接收該已反量化及已重定標的頻域音訊表示型態242之該前處理版本252(或另外,該已反量化及已重定標的頻域音訊表示型態242或已解碼的頻域音訊表示型態232),及基於此而提供該音訊資訊之一時域表示型態262。該頻域至時域信號變換器260例如可包含用以執行修正離散餘弦反變換(IMDCT)及適當開窗(以及其它輔助功能,例如重疊與相加)之一變換器。
音訊解碼器200進一步可包含選擇性的時域後處理器270,其係組配來接收音訊資訊之時域表示型態262,及使用時域後處理而獲得已解碼的音訊資訊212。但若刪除後處理,則時域表示型態262可與已解碼的音訊資訊212相同。
此處須注意反量化器/重定標器240、頻譜前處理器250、頻域至時域信號變換器260、及時域後處理器270可依據控制資訊加以控制,該控制資訊係藉位元串流有效負載解格式化器220而擷取自該位元串流210。
要言之,音訊解碼器200之整體功能,已解碼的頻域音訊表示型態232例如與已編碼的音訊資訊之音訊框相關聯的的一頻譜值集合,可使用算術解碼器230基於已編碼的頻域音訊表示型態222而得。結果,例如一個1024頻譜值(其可為MDCT係數)集合係經反量化、經重定標、及經前處理。如此,獲得已經反量化、經重定標、及經頻譜前處理的頻譜值集合(例如1024MDCT係數)。隨後,自該已經反量化、經重定標、及經頻譜前處理的頻譜值集合(例如1024MDCT係數)而導出一音訊框的時域表示型態。如此,獲得一音訊框的時域表示型態。一給定音訊框的時域表示型態可組合先前及/或後續音訊框的時域表示型態。舉例言之,後續音訊框的時域表示型態間之重疊及相加可執行來相鄰音訊框的時域表示型態間的變遷,以及執行來獲得頻疊消除(an aliasing cancellation)。有關基於已解碼的頻域音訊表示型態232而重構已解碼的音訊資訊212之相關細節例如可參考國際標準ISO/IEC 14496-3,部分3,次部分4的詳細討論。但也可使用其它煩複的重疊及頻疊消除方案。
後文中,將敘述有關算術解碼器230之若干細節。算術解碼器230包含最高有效位元平面測定器284,其係組配來接收描述最高有效位元平面值m之算術碼字組acod_m[pki][m]。最高有效位元平面測定器284可經組配來使用一集合包含多個64累積頻率表中之一個累積頻率表用以自該算術碼字組「acod_m[pki][m]」而導算出最高有效位元平面值m。
最高有效位元平面測定器284係組配來基於碼字組acod_m而導算出頻譜值之一最高有效位元平面之值286。算術解碼器230進一步包含較低有效位元平面測定器288,其係組配來接收表示一頻譜值的一個或多個較低有效位元平面之一個或多個碼字組「acod_r」。如此,較低有效位元平面測定器288係組配來提供一個或多個較低有效位元平面之多碼值290。音訊解碼器200也包含一位元平面組合器292,其係組配來接收該等頻譜值之最高有效位元平面之解碼值286;及若目前頻譜值可利用較低有效位元平面,則可接收該等頻譜值之一個或多個較低有效位元平面之解碼值290。如此,位元平面組合器292提供已解碼的頻譜值,其乃該已解碼的頻域音訊表示型態232之一部分。當然,算術解碼器230典型地係組配來提供多數頻譜值獲得與該音訊內容之目前訊框相關聯的已解碼的頻譜值之一整個集合。
算術解碼器230進一步包含一累積頻率表選擇器296,其係組配來依據描述該算術解碼器狀態的一狀態指標298而選擇64累積頻率表中之一者。算術解碼器230進一步包含一狀態追蹤器299,其係組配來依據事先解碼頻譜值而追蹤算術解碼器的狀態。該狀態資訊可選擇性地回應於狀態復置資訊224而經復置成一內設狀態資訊。如此,累積頻率表選擇器296係組配來提供選定的累積頻率表之指標(例如pki)、或累積頻率表本身用來依據碼字組「acod_m」而應用於最高有效位元平面值m的解碼。
概述音訊解碼器200之功能,音訊解碼器200係組配來接收一經位元率有效地編碼的頻域音訊表示型態222,及基於此而獲得已解碼的頻域音訊表示型態。於該算術解碼器230,其係用來基於已編碼的頻域音訊表示型態222而獲得已解碼的頻域音訊表示型態232,藉由使用算術解碼器280,其係組配來施用累積頻率表,而探討相鄰頻譜值的最高有效位元平面值間之不同組合的機率。換言之,藉由依據狀態指標298,其係藉由觀察事先運算解碼頻譜值而得,而自包含64否同累積頻率表之一集合中選出不同的累積頻率表,來控討頻譜值間之統計相依性。
5.頻譜無雜訊編碼工具之綜論
後文中,將解說有關由例如算術編碼器170及算術解碼器230執行的編碼及解碼演繹法則之細節。
焦點係放在解碼演繹法則之說明。但須注意相對應的編碼演繹法則可依據解碼演繹法則的教示執行,其中對映關係為反相。
須注意後文將討論的解碼係用來允許典型地經後處理典型地經後處理、經定標且經量化的頻譜值之所謂的「頻譜無雜訊編碼」。頻譜無雜訊編碼係用在音訊編碼/解碼構想來進一步縮減量化頻譜的冗餘,該量化頻譜其係例如經由能量壓縮時域至頻域變換器獲得。
用於本發明之實施例,頻譜無雜訊編碼方案係基於算術編碼結合動態調適上下文。頻譜無雜訊編碼係被饋以量化頻譜值(之原先表示型態或已編碼表示型態),及使用例如自多個事先解碼鄰近頻譜值的上下文相依性累積頻率表。此處,時間上及頻率上二者的鄰近皆列入考慮,如第4圖所示。然後,累積頻率表(容後詳述)由算術編碼器用來產生一可變長度二進制碼,及由算術解碼器用來自一可變長度二進制碼導算出解碼值。
舉例言之,算術編碼器170依據個別機率,對一給定符元集合產生二進制碼。該二進制碼係經由將該符元集合所在的一機率區間對映至一碼字組而產生。
後文中,將提供頻譜無雜訊編碼工具的另一項短綜論。頻譜無雜訊編碼係用來進一步縮減量化頻譜的冗餘。該頻譜無雜訊編碼方案係基於算術編碼結合動態調適上下文。頻譜無雜訊編碼係被饋以量化頻譜值,及使用例如自七個事先解碼鄰近頻譜值的上下文相依性累積頻率表。
此處,時間上及頻率上二者的鄰近皆列入考慮,如第4圖所示。然後,累積頻率表由算術編碼器用來產生一可變長度二進制碼。
算術編碼器對一給定符元集合及其個別機率產生二進制碼。該二進制碼係經由將該符元集合所在的一機率區間對映至一碼字組而產生。
6.解碼程序 6.1. 解碼程序綜論
後文中,將參考第3圖給予解碼頻譜值之程序之綜合討論,該圖顯示解碼多數頻譜值之程序的虛擬程式碼表示型態。
解碼多數頻譜值之程序包含上下文之初始設定310。上下文之初始設定310包含使用函數「arith_map_context(lg)」自前一個上下文導算出該目前上下文。自前一個上下文導算出該目前上下文可包含該上下文的復置。上下文的復置及自前一個上下文導算出該目前上下文二者容後詳述。
多個頻譜值之解碼也包含頻譜值解碼312及上下文更新314的重複,該上下文更新係藉函數「Arith_update_context(a,I,lg)」執行,容後詳述。頻譜解碼312及上下文更新314係重複lg次,其中lg係指示(例如對一音訊框)欲解碼的頻譜值數目。頻譜值解碼312包含上下文值計算312a、最高有效位元平面解碼312b、及較低有效位元平面加法312c。
狀態值運算312a包含使用函數「arith_get_context(I,lg,arith_reset_flag,N/2)」運算第一狀態值s,該函數返回該第一狀態值s。該狀態值運算312a也包含位準值「lev0」及位準值「lev」之運算,該等位準值「lev0」、「lev」係藉將第一狀態值s向右位移24位元獲得。該狀態值運算312a也包含依據第3圖顯示於元件符號312a的公式,運算第二狀態值t。
最高有效位元平面解碼312b包含解碼演繹法則312ba之重複執行,其中初次執行演繹法則312ba之前,變數j係初始設定為0。
演繹法則312ba包含使用函數「arith_get_pk()」,依據第二狀態值t,及也依據位準值「lev」及lev0運算狀態指標「pki」(也用作為累積頻率表指標),容後詳述。演繹法則312ba也包含依據狀態指標pki而選擇累積頻率表,其中變數「cum_freq」可依據狀態指標pki而設定於64累積頻率表中之一個起始位址。又,變數「cfl」可經初始設定為所選定之累積頻率表長度,其例如係等於字母表中的符元數目,亦即可解碼的不同值數目。自「arith_cf_m[pki=0][9]」至「arith_cf_m[pki=63][9]」之全部累積頻率表中可資用於最高有效位元平面值m解碼的長度為9,原因在於8個不同最高有效位元平面值及一個逸出符元可經解碼。隨後考慮所選的累積頻率表(藉變數「cum_freq」及變數「cfl」描述),藉由執行函數「arith_decode()」可獲得最高有效位元平面值m。當導算最高有效位元平面值m時,可評估位元串流210中定名「acod_m」的位元(例如參考第6g圖)。
演繹法則312ba也包含檢驗最高有效位元平面值m是否等於逸出符元「ARITH_ESCAPE」或否。若最高有效位元平面值m係不等於該算術逸出符元,則捨棄演繹法則312ba(「斷裂」狀況),因而演繹法則312ba的其餘指令被跳過。如此,該處理程序的執行係以設定頻譜值a為等於最高有效位元平面值m來繼續(指令「a=m」)。相反地,若最高有效位元平面值m係與算術逸出符元「ARITH_ESCAPE」相等,則位準值「lev」遞增1。如所述,演繹法則312ba然後重複直至最高有效位元平面值m係與該算術逸出符元不同為止。
一旦完成最高有效位元平面解碼,亦即已經解碼與該算術逸出符元不同的最高有效位元平面值m,則頻譜值變數「a」設定為等於最高有效位元平面值m。隨後,獲得較低有效位元平面,例如如第3圖於元件符號312c所示。對該頻譜值的各個較低有效位元平面,解碼兩個二進制值中之一者。舉例言之,獲得較低有效位元平面值r。隨後,藉由將頻譜值變數「a」向左位移1位元,及藉由加上目前解碼的較低有效位元平面值r作為最低有效位元,而更新頻譜值變數「a」。但須注意本發明並未特別推薦獲得較低有效位元平面之構想。於某些情況下,甚至可刪除任何較低有效位元平面之解碼。另外,可使用不同解碼演繹法則用於達成此項目的。
6.2. 依據第4圖之解碼順序
後文中,將敘述頻譜值之解碼順序。
頻譜係數係經無雜訊編碼,及始於最低頻係數及前進至最高頻係數而傳輸(例如於位元串流)。
得自進階音訊編碼(例如使用修正離散餘弦變換獲得,如ISO/IEC 14496-3,部分3,次部分4討論)的係數係儲存於稱作「x_ac_quant[g][win][sfb][bin]」的一陣列,而無雜訊編碼碼字組(例如acod_m、acod_r)之傳輸順序,使得當其係以接收且儲存於該陣列的順序解碼時,「bin」(頻率指標)為最快遞增指標,而「g」為最慢遞增指標。
與較低頻相關聯的頻譜係數係比與較高頻相關聯的頻譜係數更早編碼。
得自變換編碼激勵(tcx)之係數係直接儲存於陣列x_tcx_invquant[win][bin],而無雜訊編碼碼字組之傳輸順序,使得當其係以接收且儲存於該陣列的順序解碼時,「bin」為最快遞增指標,而「win」為最慢遞增指標。換言之,若頻譜值描述語音編碼器的線性預測濾波器的變換編碼激勵,則頻譜值a係與變換編碼激勵之相鄰且遞增的頻率相關聯。
與較低頻相關聯的頻譜係數係比與較高頻相關聯的頻譜係數更早編碼。
值得注意者,音訊編碼器200可經組配來施用由算術解碼器230所提供之已解碼的頻域音訊表示型態232,用於使用頻域至時域信號變換而「直接」產生時域音訊信號表示型態,及用於使用頻域至時域解碼器及藉頻域至時域信號變換器的輸出所激勵的線性預測濾波器二者而「間接」提供音訊信號表示型態。
換言之,此處詳細討論其功能的算術解碼器200極為適合用於解碼以頻域編碼的音訊內容之時頻域表示型態之頻譜值,及用於提供線性預測濾波器之一刺激信號的時頻域表示型態,該濾波器係適用於解碼以線性預測域編碼的語音信號。如此,算術解碼器係極為適合用於音訊解碼器,該音訊解碼器可處理頻域編碼音訊內容及線性預測頻域編碼音訊內容(變換編碼激勵線性預測域模式)。
6.3.依據第5a及5b圖之上下文初始設定
後文中,將敘述於步驟310執行的上下文初始設定(也標示為「上下文對映」)。
上下文初始設定包含依據演繹法則「arith_map_context()」,過去上下文與目前上下文間之對映,顯示於第5a圖。如圖可知,目前上下文係儲存於通用變數q[2][n_context],其係呈具有2之第一維度及n_context之第二維度之陣列。過去上下文係儲存於變數qs[n_context],其係呈具有n_context維度之表形式。變數「previous_lg」描述過去上下文之頻譜值數目。
變數「lg」描述該訊框內欲解碼的頻譜係數數目。變數「previous_lg」描述前一訊框的頻譜行之先前數目。
上下文之對映可依據演繹法則「arith_map_context()」進行。此處須注意若與目前(例如經頻域編碼的)音訊框相關聯的頻譜值數目係與對i=0至i=lg-1之前一個音訊框相關聯的頻譜值數目相等,則函數「arith_map_context()」將目前上下文陣列q之登錄項目q[0][i]設定為過去上下文陣列qs之值qs[i]]。
但若目前音訊框相關聯的頻譜值數目係與前一個音訊框相關聯的頻譜值數目不等,則執行更複雜的對映關係。但此種情況下,有關對映細節與本發明之關鍵構想並非特別相關,故參考第5a圖之虛擬程式碼之細節。
6.4.依據第5b及5c圖之狀態值運算
後文中,將更詳細敘述狀態值運算312a。
須注意第一狀態值s(如第3圖所示)可獲得為函數「arith_get_context(I,lg,arith_reset_flag,N/2)」之返回值,其虛擬程式碼表示型態係顯示於第5b及5c圖。
有關狀態值之運算,也參考第4圖,其顯示用於狀態評估的上下文。第4圖顯示時間及頻率二者,頻譜值之二維表示型態。橫座標410描述時間,及縱座標412描述頻率。如第4圖可知,欲解碼的頻譜值420係與時間指標t0及頻率指標i相關聯。如圖可知,對時間指標t0而言,當具有頻率指標i的頻譜值420欲解碼時,具有頻率指標i-1、i-2及i-3之重元組已經解碼。如由第4圖可知,在頻譜值420解碼之前,具有時間指標t0及頻率指標i-1之頻譜值430已經解碼,而頻譜值430被考慮在用於頻譜值420之解碼的上下文。同理,在頻譜值420解碼之前,具有時間指標t0及頻率指標i-2之頻譜值434已經解碼,而頻譜值434被考慮在用於頻譜值420之解碼的上下文。同理,在頻譜值420解碼之前,具有時間指標t-1及頻率指標i-2之頻譜值440、具有時間指標t-1及頻率指標i-1之頻譜值444、具有時間指標t-1及頻率指標i之頻譜值448、具有時間指標t-1及頻率指標i+1之頻譜值452、具有時間指標t-1及頻率指標i+2之頻譜值456已經解碼,而頻譜值430被考慮在用於頻譜值420之解碼的上下文之判定。當頻譜值420解碼時已經解碼且被考慮用於上下文的頻譜值(頻譜係數)係以影線方形顯示。相反地,(當頻譜值420解碼時)若干其它已經解碼的頻譜值係以具有虛線的方形顯示;而(當頻譜值420解碼時)其它尚未解碼的頻譜值係以具有虛線的圓形顯示,則並未用來判定用於解碼頻譜值420之上下文。
但須注意雖言如此,若干此等尚未用於解碼頻譜值420之上下文的「常規」(或「正常」)運算的此等頻譜值可評估用於檢測多個事先解碼相鄰頻譜值其係個別地或共同地滿足有關其幅度的預定狀況。
現在參考第5b及5c圖,該等圖顯示呈虛擬程式碼形式的函數「arith_get_context()」之函數性,將敘述有關藉函數「arith_get_context()」執行的第一上下文值「s」之計算的進一步細節。
須注意函數「arith_get_context()」接收欲解碼的頻譜值之指標i作為輸入變數。指標i典型地為頻率指標。輸入變數lg描述(對一目前音訊框)預期量化係數之(總)數目。變數N描述變換的行數。旗標「arith_reset_flag」指示該上下文是否應復置。函數「arith_get_context」提供表示連鎖並置(concatenated)狀態指標s及預測位元平面位準lev0的變數「t」作為輸入值。
函數「arith_get_context()」使用整數變數a0、c0、c1、c2、c3、c4、c5、c6、lev0、及「region」。
函數「arith_get_context()」包含第一算術復置處理510、一組多個事先解碼相鄰零頻譜值之檢測512、第一變數設定514、第二變數設定516、位準調適518、區值設定520、位準調適522、位準限制524、算術復置處理526、第三變數設定528、第四變數設定530、第五變數設定532、位準調適534及選擇返回值運算536作為主功能方塊。
於第一算術復置處理510,檢驗是否設定算術復置旗標「arith_reset_flag」,而欲解碼的頻譜值之指標係等於零。此種情況下,返回零上下文值,及捨棄該功能。
於一組多個事先解碼相鄰零頻譜值之檢測512,該功能唯有於算術復置旗標為無作用且欲解碼的頻譜值指標i係非零時才執行,定名為「flag」的變數被初始設定為1,如元件符號512a所示;及欲評估的頻譜值一區經判定,如元件符號512b所示。隨後,如元件符號512b所示而判定的該區頻譜值係經評估,如元件符號512c所示。若發現有足夠一區事先解碼零頻譜值,則返回1上下文值,如元件符號512d所示。舉例言之,上頻率指標邊界「lim_max」設定為i+6,除非欲解碼的頻譜值指標i係接近最大頻率指標lg-1,該種情況下,對上頻率指標邊界作特殊設定,如元件符號512b所示。此外,下頻率指標邊界「lim_min」設定為-5,除非欲解碼的頻譜值指標i係接近零(i+1im_min<0),該種情況下,對下頻率指標邊界lim_min作特殊設定,如元件符號512b所示。當評估步驟512b所判定的該區頻譜值時,首先對下頻率指標邊界lim_min與零間的負頻率指標k執行評估。對1im_min與零間的頻率指標k,證實上下文值q[0][k].c與q[1][k].c中之至少一者是否等於零。但若對lim_min與零間的任何頻率指標k,上下文值q[0][k].c與q[1][k].c二者皆非為零,則獲致結論並無足夠的零頻譜值組群,而捨棄評估512c。隨後,評估零與lim_max間之頻率指標之上下文值q[0][k].c。若發現零與lim_max間之頻率指標之任何上下文值q[0][k].c係為非零,則獲致結論並無足夠的成組事先解碼零頻譜值,而捨棄評估512c。但若發現對lim_min與零間的每個頻率指標k,有至少一個上下文值q[0][k].c或q[1][k].c係等於零,且若對零與lim_max間之每個頻率指標k有零上下文值q[0][k].c,則獲致結論有足夠的成組事先解碼零頻譜值。據此,送返上下文值1來指示此種狀況,而不再作任何額外計算。換言之,若識別有足夠一組多個上下文值q[0][k].c、q[1][k].c係具有零值,則跳過計算514、516、518、520、522、524、526、528、530、532、534、536。換言之,回應於檢測得滿足預定狀況,則描述上下文狀態的所返回的上下文值係與事先解碼頻譜值不相干地判定。
否則換言之,若無足夠成組上下文值q[0][k].c、q[1][k].c係具有零值,則執行至少部分運算514、516、518、520、522、524、526、528、530、532、534、536。
於第一變數設定514,該步驟係若(且唯若)欲解碼的頻譜值指標i係小於1才選擇性執行,變數a0 係初始設定為上下文值q[1][i-1],及變數c0係初始設定具有變數a0的絕對值。變數「lev0」係初始設定為零值。隨後,若變數a0包含較大的絕對值,亦即小於-4,或大於或等於4,則變數「lev0」及c0遞增。變數「lev0」及c0的遞增係迭代進行,直至變數a0藉朝右位移運算而進入-4至3之範圍為止(步驟514b)。
隨後,變數c0及「lev0」分別限於最大值7及3(步驟514c)。
若欲解碼的頻譜值指標值i等於1及算術復置旗標(「arith_reset_flag」)具有作用,返回上下文值,其係單純基於變數c0及lev0運算(步驟514d)。如此,只有單一事先解碼頻譜值具有與欲解碼的頻譜值相同的時間指標,及具有頻率指標比欲解碼的頻譜值之頻率指標i小1,係考慮用於上下文運算(步驟514d)。否則換言之,若無算術復置函數,則初始設定變數c4(步驟514e)。
總結而言,於第一變數設定514,變數c0及「lev0」係依事先解碼頻譜值初始設定,解碼用於與目前欲解碼的頻譜值相同訊框,及用於前一個頻譜倉i-1。變數c4係依事先解碼頻譜值初始設定,解碼用於前一個音訊框(具有時間指標t-1),及具有頻率係低於(例如達一個頻率倉)與目前欲解碼的頻譜值相關聯的頻率。
若(且唯若)目前欲解碼的頻譜值之頻率指標係大於1,才選擇性地執行的第二變數設定516,包含變數c1及c6之初始設定及變數lev0的更新。變數c1係依據目前音訊框之事先解碼頻譜值相關聯的上下文值q[1][i-2].c更新,其頻率係小於(例如達2頻率倉)目前欲解碼的頻譜值頻率。同理,變數c6係依據描述前一個訊框(具有時間指標t-1)之事先解碼頻譜值的上下文值q[0][i-2].c初始設定,其相關頻率係小於(例如達2頻率倉)目前欲解碼的頻譜值頻率。此外,位準變數「lev0」係設定於與目前訊框的事先解碼頻譜值相關聯的位準值q[1][i-2].1,若q[1][i-2].l係大於lev0,則其相關頻率係小於(例如達2頻率倉)目前欲解碼的頻譜值頻率。
若(且唯若)欲解碼的頻譜值之指標i係大於2,位準調適518及區值設定520係經選擇性地執行。於位準調適518,若與目前訊框之事先解碼頻譜值相關聯的位準值q[1][i-3].l,則位準變數「lev0」係增至q[1][i-3].l值,其相關頻率係小於(例如達3頻率倉)目前欲解碼的頻譜值頻率。
於該區值設定520,變數「區(region)」係依據評估設定,其中多個頻譜區中之頻譜區,配置目前欲解碼的頻譜值。舉例言之,若發現目前欲解碼的頻譜值係與在該等頻率倉的第一(最下)象限(0≦i<N/4)頻率倉(具有頻率倉指標i)相關聯,則區變數「區」係設定為零。否則若目前欲解碼的頻譜值係與在該等頻率倉的第二象限(N/4≦i<N/2)頻率倉相關聯,則區變數係設定為值1。否則若目前欲解碼的頻譜值係與在該等頻率倉的第二(上半)半部(N/2≦i<N)頻率倉相關聯,則區變數係設定為值2。如此,區變數係依據目前欲解碼的頻譜值之頻率區相關聯的的頻率區之評估而設定。可區別兩個或多個頻率區。
若(且唯若)目前欲解碼的頻譜值包含大於3之指標,則執行額外位準調適522。此種情況下,若位準值q[1][i-4].l(其係與目前訊框之事先解碼頻譜值相關聯,而其係有關一種頻率,該頻率例如係比目前欲解碼的頻譜值相關聯的頻率小例如4頻率倉)係大於目前位準「lev0」,則位準變數「lev0」增加(設定至值q[1][i-4].l)(步驟522)。位準變數「lev0」係限最大值3(步驟524)。
若檢測得算術復置狀況及目前欲解碼的頻譜值之指標i係大於1,則依據變數c0c1、lev0,以及依據區變數「區」而返回該狀態值(步驟526)。如此,若給定算術復置狀況,則任何先前訊框的事先解碼頻譜值不予考慮。
於第二變數設定528,變數c2係設定為上下文值q[0][i].c,其係與前一音訊框(具有時間指標t-1)之事先解碼頻譜值相關聯,該事先解碼頻譜值係與目前欲解碼的頻譜值的相同頻率相關聯。
於第四變數設定530,除非目前欲解碼的頻譜值係與最高可能頻率指標lg-1相關聯,否則變數c3係設定為上下文值q[0][i+1].c,其係與具有頻率指標i+1之前一個音訊框之事先解碼頻譜值相關聯。
於第五變數設定532,除非目前欲解碼的頻譜值之頻率指標i係太過接近最高可能頻率指標(亦即具頻率指標值lg-2或lg-1)相關聯,否則變數c5係設定為上下文值q[0][i+2].c,其係與具有頻率指標i+2之前一個音訊框之事先解碼頻譜值相關聯。
若頻率指標i係等於零(亦即若目前欲解碼的頻譜值為最低頻譜值),則進行位準變數「lev0」之額外調適。此種情況下,若變數c2或c3具有3之值,其指示與目前欲解碼的頻譜值相關聯的頻率比較時,與相同頻率或甚至更高頻率相關聯的的前一音訊框之事先解碼頻譜值具有較大值,則位準變數「lev0」自零增至1。
於選擇性返回值運算536,返回值之運算係依據目前欲解碼的頻譜值之指標i是否具有值零、1、或更大值。若指標i具有零值,則返回值係依據變數c2、c3、c5及lev0運算,如元件符號536a所示。若指標i具有值1,則返回值係依據變數c0、c2、c3、c4、c5、及lev0運算,如元件符號536b所示。若指標i具有非零或非1之值,則返回值係依據變數c0、c2、c3、c4、c1、c5、c6、「區」及lev0運算(元件符號536c)。
綜上所述,上下文值運算「arith_get_context()」包含一組多個事先解碼零頻譜值(或至少夠小頻譜值)的檢測512。若找到一組足夠事先解碼零頻譜值,藉由設定返回值為1而指示特殊上下文的存在。否則進行上下文值運算。通常可謂於上下文值運算中,指標值i經評估來判定須評估多少個事先解碼頻譜值。舉例言之,若目前欲解碼的頻譜值之頻率指標i係接近下邊界(例如零),或接近上邊界(例如lg-1),則減少所評估的事先解碼頻譜值數目。此外,即便目前欲解碼的頻譜值之頻率指標i係夠遠離最小值,則藉區值設定520區別不同的頻譜區。據此,考慮不同頻譜區(例如第一,低頻率頻譜區;第二,中頻率頻譜區;及第三,高頻率頻譜區)的不同統計性質。計算作為返回值的上下文值係取決於變數「區」,使得該返回的上下文值係取決於該目前欲解碼的頻譜值是否係在第一預定頻率區或第二預定頻率區(或在任何其它預定頻率區)。
6.5.對映規則選擇
後文中,將描述對映規則的選擇,例如累積頻率表其描述碼值之對映至符元碼。對映規則的選擇係依據上下文狀態進行,該上下文狀態係以狀態值s或t描述。
6.5.1.使用依據第5d圖之演繹法則作對映規則選擇
後文中,將說明依據第5d圖使用函數「get_pk」選擇對映規則。須注意函數「get_pk」可執行來於第3圖之演繹法則之次演繹法則312ba而獲得值「pki」。如此函數「get_pk」可取代第3圖之演繹法則之函數「arith_get_pk」。
也須注意依據第5d圖之函數「get_pk」可評估依據第17(1)及17(2)圖之表「ari_s_hash[387]」及依據第18圖之表「ari_gs_hash」[225]。
函數「get_pk」接收狀態值s作為輸入變數,該狀態值s可經由依據第3圖之變數「t」與根據第3圖之變數「lev」、「lev0」組合獲得。函數「get_pk」也可經組配來送返變數「pki」值其標示對映規則或累積頻率表,作為返回值。函數「get_pk」係組配來將狀態值s對映至對映規則指標值「pki」。
函數「get_pk」包含第一表評估540,及第二表評估544。第一表評估540包含變數初始設定541,其中變數i_min、i_max、及i係經初始設定,如元件符號541所示。第一表評估540也包含重複表搜尋542,於該過程判定是否有表「ari_s_hash」之登錄項目係匹配狀態值s。若於重複表搜尋542期間識別此種匹配,則捨棄函數get_pk,其中藉匹配狀態值s之表「ari_s_hash」之登錄項目而判定該函數之返回值,容後詳述。但若於重複表搜尋542期間並未找到狀態值s與表「ari_s_hash」之登錄項目間之完美匹配,則執行邊界登錄項目檢查543。
現在轉向第一表評估540之細節,可知由變數i_min及i_max界定搜尋區間。只要由變數i_min及i_max界定搜尋區間夠大,則重複重複表搜尋542,若條件i_max_i_min>1,則該狀況為真。隨後,至少約略近似地設定變數i來標示該區間的中點(i=i_min+(i_max-i_min)/2)。隨後,設定變數j為由陣列「ari_s_hash」位在變數i所標示的陣列位置所判定之一值(元件符號542)。此處須注意表「ari_s_hash」之各個登錄項目描述二者,亦即與該表登錄項目相關聯的狀態值,及與該表登錄項目相關聯的對映規則指標值。與該表登錄項目相關聯的狀態值係藉該表登錄項目之最高有效位元(位元8-31)描述;而對映規則指標值係藉該表登錄項目之較低位元(例如位元0-7)描述。下邊界i_min或上邊界i_max係依據狀態值s是否小於由該表「ari_s_hash」之藉變數i所參考的登錄項目「ari_s_hash[i]」之最高有效24位元所描述的狀態值而調適。舉例言之,若狀態值s係小於由登錄項目「ari_s_hash[i]」之最高有效24位元所描述的狀態值,則該表區間之上邊界i_max係設定為值i。如此,重複表搜尋542的下次迭代重複的表區間係限於用於重複表搜尋542的本次迭代重複的表區間(自i_min至i_max)的下半。相反地,若狀態值s係大於由表登錄項目「ari_s_hash[i]」之最高有效24位元所描述的狀態值,則重複表搜尋542的下次迭代重複的該表區間之下邊界i_min係設定為值i,使得目前表區間(自i_min至i_max)的上半係用作為下次重複表搜尋的表區間。但若發現狀態值s係與由表登錄項目「ari_s_hash[i]」之最高有效24位元所描述的狀態值相等,則藉函數「get_pk」返回由表登錄項目「ari_s_hash[i]」之最低有效8位元所描述的對映規則指標值,及捨棄該函數。
重複表搜尋542係重複直至由變數i_min與i_max所界定的表區間夠小為止。
(選擇性地)執行邊界登錄項目檢查543來補償重複表搜尋542。若於重複表搜尋542完成後,指標變數i係等於指標變數i_max,則作最後檢查狀態值s是否等於由表登錄項目「ari_s_hash[i_min]」之最高有效24位元所描述的狀態值,及此種情況下,送返由表登錄項目「ari_s_hash[i_min]」之最低有效8位元所描述的對映規則指標值作為函數「get_pk」的結果。相反地,若指標變數i係與指標變數i_max不同,則執行檢查狀態值s是否等於由表登錄項目「ari_s_hash[i_max]」之最高有效24位元所描述的狀態值,及此種情況下,送返由表登錄項目「ari_s_hash[i_max]」之最低有效8位元所描述的對映規則指標值作為函數「get_pk」的返回值。
但須注意邊界登錄項目檢查的全部可視為選擇性。
於第一表評估540之後,執行第二表評估544,除非於第一表評估540期間出現「直接命中」,該種情況下,狀態值s係等於由表「ari_s_hash」之登錄項目(或更明確言之,由其24最高有效位元)所描述的狀態值中之一者。
第二表評估544包含變數初始設定545,其中指標變數i_min、i及i_max係經初始設定,如元件符號545所示。第二表評估544也包含重複表搜尋546,於該過程中,搜尋表「ari_gs_hash」之一登錄項目,其表示與狀態值s相同的狀態值。最後,第二表評估544包含返回值判定547。
只要由變數i_min及i_max界定搜尋區間夠大(例如只要i_max-i_min>1),則重複重複表搜尋546。於重複表搜尋546的重複中,變數i係設定於由i_min及i_max所界定的該表區間的中點(步驟546a)。隨後,表「ari_gs_hash」之變數j係位在指標變數i所判定的表位置獲得(546b)。換言之,表登錄項目「ari_gs_hash[i]」乃位在由表指標i_min及i_max所界定的該目前表區間中點之一表登錄項目。隨後,判定重複表搜尋546之下次重複迭代的表區間。為了達成此項目的,若狀態值s係小於由表登錄項目「j=ari_gs_hash[i]」之最高有效24位元所描述的狀態值,則描述該表區間之上邊界之指標值i_max係設定為值i(546c)。換言之,目前表區間的下半係選用作為重複表搜尋546之下次重複迭代的新表區間(步驟546c)。否則若狀態值s係大於由表登錄項目「j=ari_gs_hash[i]」之最高有效24位元所描述的狀態值,則指標值i_min係設定為值i。如此,目前表區間的上半選用作為重複表搜尋546下次重複的新表區間(步驟546d)。但若發現狀態值s係與由表登錄項目「j=ari_gs_hash[i]」之最高有效24位元所描述的狀態值相等,則指標值i_max係設定為值i+1或設定為值224(若i+1係大於224),且捨棄重複表搜尋546。但若狀態值s係與由「j=ari_gs_hash[i]」之24最高有效位元所描述的狀態值不同,則除非該表區間過小(i_max-i_min≦1),否則重複表搜尋546係以由已更新的指標值i_min及i_max所界定的新設定表區間重複迭代。如此,表區間(由i_min及i_max所界定)的區間大小重複地縮小直至檢測得「直接命中」(s==(j>>8)),或直至區間達最小容許大小(i_max-i_min≦1)為止。最後,於重複表搜尋546捨棄後,判定表登錄項目「j=ari_gs_hash[i_max]」,及由該表登錄項目「j=ari_gs_hash[i_max]」之8最低有效位元所描述的對映規則指標值係送返作為函數「get_pk」的返回值。如此,對映規則指標值係依據於重複表搜尋546完成或捨棄後,表區間(由i_min及i_max所界定)的上邊界i_max判定。
使用重複表搜尋542、546二者的前述表評估540、544允許以極高的運算效率檢驗表「ari_s_hash」及「ari_gs_hash」是否存在有一給定的有效狀態。更明確言之,即便於最惡劣情況下,表存取運算次數仍可維持合理地小。業已發現表「ari_s_hash」及「ari_gs_hash」的數值定序,允許加速搜尋適當雜湊值。此外,表的大小可維持小型,原因在於無需要表「ari_s_hash」及「ari_gs_hash」含括逸出符元。如此,即便有大量不同狀態,仍可建立有效上下文雜湊機制:於第一階段(第一表評估540),進行直接命中的搜尋(s==(j>>8))。
於第二階段(第二表評估544),狀態值s之範圍可對映至對映規則指標值。如此,可執行表「ari_s_hash」中有相關聯的登錄項目之特別有效狀態、與基於範圍之處理的較低有效狀態的良好平衡處置。據此,函數「get_pk」組成對映規則選擇的有效實施。
有關任何進一步細節,請參考第5d圖之虛擬程式碼,其係以依據眾所周知程式語言C的表示型態表示函數「get_pk」之函數性。
6.5.2. 使用依據第5e圖之演繹法則之對映規則選擇
後文中,將參考第5e圖敘述對映規則選擇之另一項演繹法則。須注意依據第5e圖之演繹法則「arith_get_pk」接收描述上下文狀態的一狀態值s作為輸入變數。函數「arith_get_pk」提供機率模型的指標「pki」作為輸出值或返回值,該指標可為用以選擇對映規則的指標(例如累積頻率表)。
須注意依據第5e圖之函數「arith_get_pk」可具有第3圖函數「value_decode」之函數「arith_get_pk」的函數性。
也須注意函數「arith_get_pk」例如可評估依據第20圖之表ari_s_hash及依據第18圖之表ari_gs_hash。
依據第5e圖之函數「arith_get_pk」包含第一表評估550及第二表評估560。於第一表評估550,通過表ari_s_hash作線性掃描,獲得該表登錄項目j=ari_gs_hash[i]。若藉表ari_s_hash之一表登錄項目j=ari_gs_hash[i]的最高有效24位元描述的狀態值係等於狀態值s,則返回由該所識別的表登錄項目j=ari_gs_hash[i]之最低有效8位元所描述的對映規則指標值「pki」,及捨棄函數「arith_get_pk」。據此,除非識別「直接命中」(狀態值s係等於表登錄項目j的最高有效24位元描述的狀態值),否則表ari_s_hash的全部387登錄項目係以上升順序評估。
若於第一表評估550未識別直接命中,即執行第二表評估560。於第二表評估過程中,執行線性掃描,登錄項目指標i自零線性遞增至224最大值。於第二表評估期間,讀取表i的表「ari_gs_hash」之登錄項目「ari_gs_hash[i]」,且評估表登錄項目「j=ari_gs_hash[i]」,其中判定由表登錄項目j的24最高有效位元所表示的狀態值是否大於狀態值s。若屬此種狀況,則返回藉表登錄項目j的8最低有效位元所描述的對映規則指標值作為函數「arith_get_pk」的返回值,及捨棄函數「arith_get_pk」的執行。
但若狀態值s並非小於藉目前表登錄項目j=ari_gs_hash[i]的24最高有效位元所描述的狀態值,則藉遞增表指標i而繼續掃描通過表ari_gs_hash的登錄項目。但若狀態值s係大於或等於藉表登錄項目ari_gs_hash所描述的任一個狀態值,則送返由表ari_gs_hash的8最低有效位元所界定的對映規則指標值「pki」作為函數「arith_get_pk」的返回值。
摘要言之,依據第5e圖之函數「arith_get_pk」執行二步驟式雜湊。於第一步驟,執行直接命中搜尋,其中判定狀態值s是否等於藉第一表「ari_gs_hash」的任一登錄項目所描述的狀態值。則於第一表評估550識別直接命中,則自第一表「ari_s_hash」獲得返回值,而捨棄函數。但若於第一表評估550未識別直接命中,則執行第二表評估560。於第二表評估,執行基於範圍之評估。第二表「ari_gs_hash」的接續登錄項目界定範圍。若發現狀態值s係落入此一範圍(其係藉下述事實指示,由目前表登錄項目「j=ari_gs_hash[i]」的24最高有效位元所描述的狀態值係大於狀態值s),則送返由表登錄項目「j=ari_gs_hash[i]」的8最低有效位元所描述的對映規則指標值「pki」。
6.5.3. 使用依據第5f圖之演繹法則之對映規則選擇
依據第5f圖之函數「get_pk」實質上係相當於第5e圖之函數「arith_get_pk」。因而參考前文討論。有關進一步細節,請參考第5f圖之虛擬程式表示型態。
須注意依據第5f圖之函數「get_pk」可替代第3圖稱作為函數「value_decode」之函數「arith_get_pk」。
6.6. 依據第5g圖之函數「arith_decode()」
後文中,將參考第5g圖討論函數「arith_decode()」之函數性的進一步細節。須瞭解函數「arith_decode()」使用助手函數「arith_first_symbol(void)」,若其為該序列中的第一符元則送返TRUE,否則即送返FALSE。函數「arith_decode()」也使用助手函數「arith_get_next_bit(void)」,其獲取且提供該位元串流之下一位元。
此外,函數「arith_decode()」使用通用變數「low」、「high」及「value」。又,函數「arith_decode()」接收變數「cum_freq[]」作為輸入變數,其係指向所選累積頻率表的第一登錄項目或元素(具有元素指標或登錄項目指標0)。又,函數「arith_decode()」使用輸入變數「cfl」其指示標示以變數「cum_freq[]」的所選累積頻率表長度。函數「arith_decode()」包含變數初始設定570a作為第一步驟,若助手函數「arith_first_symbol()」指示一序列符元的第一符元係經解碼,則執行該步驟。變數初始設定550a依據多個例如20位元而初始設定變數「value」,該等位元係使用助手函數「arith_get_next_bit」而得自位元串流,使得該變數「value」具有該等位元所表示之值。又,變數「low」係初始設定具有0值,而變數「high」係初始設定具有1048575值。
於第二步驟570b,變數「range」係設定為比變數「high」與「low」數值間之差值大1之值。變數「cum」係設定為一值,其表示變數「low」值與變數「high」值間的變數「value」值之相對位置。如此,變數「cum」例如依據變數「value」值而具有0至216 間之一值。指標器p係經初始設定為一值,該值係比所選累積頻率表之起始位址小1。
演繹法則「arith_decode()」也包含重複累積頻率表搜尋570c。該重複累積頻率表搜尋係重複直至變數cfl係小於或等於1為止。於重複累積頻率表搜尋570c,指標器變數q係設定為一值,該值係等於指標器變數p之目前值與變數「cfl」值之半的和數。若所選累積頻率表之由指標器變數q所定址的該登錄項目*q之值係大於變數「cum」之值,則指標器變數p係設定至指標器變數q之值,而變數「cfl」遞增。最後,變數「cfl」向右位移一個位元,藉此有效地將變數「cfl」除以2,及忽略取模(modulo)部分。
如此,重複累積頻率表搜尋570c有效地比較變數「cfl」值與該所選累積頻率表之多個登錄項目,來識別出該所選累積頻率表內部係藉該累積頻率表之登錄項目所畫界的一區間,使得數值cum係位在所識別的區間內。如此,該所選累積頻率表之登錄項目界定區間,其中個別符元值係與該所選累積頻率表的各個區間相關聯。又,該累積頻率表之兩相鄰值間之區間寬度界定與該等區間相關聯的符元之機率,使得所選累積頻率表全體界定不同符元(或符元值)的機率分布。有關可用累積頻率表之細節將參考第19圖討論如下。
再度參考第5g圖,符元值係自指標器變數p導出,其中該符元值之導算係如元件符號570d所示。如此,指標器變數p值與起始位址「cum_freq」間之差值係經評估來獲得該符元值,其係以變數「symbol」表示。
演繹法則「arith_decode」也包含變數「high」及「low」之調適570e。若由變數「symbol」表示之符元值非為0,則變數「high」經更新,如元件符號570e所示。變數「high」係設定為由變數「low」、變數「range」及所選累積頻率表之具有指標「symbol-1」之登錄項目之值所判定的一值。變數「low」增加,其中增加幅度係藉變數「range」及所選累積頻率表之具有指標「symbol」之登錄項目判定。如此,變數「low」與「high」之值間之差值係依據所選累積頻率表之兩相鄰登錄項目之數值差而調整。
據此,若檢測得具有低機率之一符元值,則變數「low」與「high」之值間之區間縮小至狹窄寬度。相反地,若檢測得之符元值包含相對大機率,則變數「low」與「high」之值間之區間寬度設定為較大值。再度,變數「low」與「high」之值間之區間寬度係取決於檢測得之符元及相對應的累積頻率表之登錄項目。
演繹法則「arith_decode」也包含區間再標準化570f,其中於步驟570e測定的區間係經重複位移及定標直至達到「斷裂(break)」狀況為止。於區間再標準化570f,執行選擇性向下位移運算570fa。若變數「high」係小於524286則不作為,而以區間大小增加運算570fb繼續區間再標準化。但若變數「high」係不小於524286,而變數「low」係大於或等於524286,則變數「values」、「low」、及「high」全部減524286,使得由變數「low」及「high」所界定的區間向下位移,且使得變數「value」之值也向下位移。但若發現變數「high」係不小於524286,及變數「low」係不大於或等於524286,及變數「low」係大於或等於262143,及變數「high」係小於786429,則變數「value」、「low」、及「high」全部減262143,使得由變數「low」及「high」所界定的區間向下位移,且使得變數「value」之值也向下位移。但若未滿足前述任一種情況,則捨棄區間再標準化。但若滿足步驟570fa評估的任一個前述件,則執行區間增加運算570fb。於區間增加運算570fb,變數「low」之值加倍。又,變數「high」之值加倍,加倍結果遞增1。又,變數「value」之值加倍(朝左位移1位元),及藉助手函數「arith_get_next_bit」所得的位元串流之一位元係用作為最低有效位元。據此,由變數「low」及「high」所界定的區間大小約略加倍,及變數「value」之精度藉由使用該位元串流之一新位元而增高。如前述,步驟570fa及570fb重複直至達「斷裂」狀況,亦即直至變數「low」與「high」數值間之區間夠大為止。
有關演繹法則「arith_decode()」之函數性,須注意於步驟570e,依據由變數「cum_freq」所參照的累積頻率表之兩相鄰登錄項目,變數「low」與「high」數值間之區間縮小。若所選累積頻率表之兩相鄰值間的區間小,亦即若相鄰值較為靠近,則步驟570e所得變數「low」與「high」數值間之區間將較小。相反地,若累積頻率表之兩相鄰登錄項目較為遠離,則步驟570e所得變數「low」與「high」數值間之區間將較大。
結果,若步驟570e所得變數「low」與「high」數值間之區間為較小,則將執行大量的區間再標準化步驟來重定標該區間至「足夠」的大小(使得不滿足狀況評估570fa的任一種狀況)。如此,較大量來自位元串流的位元將用來提高變數「value」的精度。相反地,若步驟570e所得區間大小為較大,則只需少數區間標準化步驟570fa及570fb來將變數「low」與「high」數值間之區間再標準化為「足夠」大小。如此,只有較少數來自位元串流的位元將用來提高變數「value」之精度,及準備下一個符元的解碼。綜上所述,若解碼一符元,其包含較高機率且所選累積頻率表的登錄項目係與其大區間相關聯,則將只有較少數位元將自位元串流讀取來允許隨後符元的解碼。相反地,若解碼一符元,其包含較低機率且所選累積頻率表之登錄項目係與其小區間相關聯,則將自位元串流取得較大量位元來準備下一符元的解碼。
如此,累積頻率表之登錄項目反映不同符元的機率,同時也反映解碼一序列符元所需位元數目。藉由依據上下文,亦即依據事先解碼符元(或頻譜值)而變數累積頻率表,例如經由依據上下文而選擇不同的累積頻率表,可探討不同符元間之隨機相依性,其允許隨後的(或相鄰的)符元之特定位元率有效編碼。
綜上所述,已經參考第5g圖描述之函數「arith_decode()」係連同累積頻率表「arith_cf_m[pki][]」調用,對應於由函數「arith_get_pk()」所返回的指標「pki」,判定最高有效位元平面值m(其可設定為由返回變數「symbol」表示的符元值)。
6.7. 逸出機制雖然已解碼的最高有效位元平面值m(其可藉函數「arith_decode()」返回作為符元值)為逸出符元「ARITH_ESCAPE」,但解碼另一個最高有效位元平面值m,及變數「lev」遞增1。據此,獲得有關最高有效位元平面值m的數值意義及欲解碼的較低有效位元平面數目。若逸出符元「ARITH_ESCAPE」經解碼,則位準變數「lev」遞增1。如此,輸入至函數「arith_get_pk」的狀態值也經修正,由最高位元(位元24及以上)所表示之值對演繹法則312ba的下次重複迭代增高。
6.8. 依據第5h圖之上下文更新一旦頻譜值完全解碼(亦即全部最低有效位元平面皆已經相加,上下文表q及qs係藉調用函數「arith_update_context(a,i,lg)」更新)。後文中,將參考第5h圖描述有關函數「arith_update_context(a,i,lg)」之細節,其顯示該函數之虛擬程式碼表示型態。函數「arith_update_context(a,i,lg)」接收已解碼的量化頻譜係數a、欲解碼的頻譜值(或已解碼的頻譜值)指標i、及與目前音訊框相關聯的頻譜值(或頻譜係數)之數目lg作為輸入變數。
於步驟580,目前已解碼的量化頻譜值(或頻譜係數)a係拷貝至上下文表或上下文陣列q。如此,上下文表q之登錄項目q[l][i]設定為a。又,變數「a0」設定為值「a」。於步驟582,判定上下文表q之位準值q[l][i].l。經由內設,將上下文表q之位準值q[l][i].l設定為零。但若目前已解碼的頻譜值a之絕對值大於4,則位準值q[l][i].l遞增。隨著各次遞增,變數「a」向右位移一個位元。位準值q[l][i].l的增量重複直至變數a0之絕業值小於或等於4為止。於步驟584,設定上下文表q之2-位元上下文值q[l][i].c。若目前已解碼的頻譜值a係等於零,則2-位元上下文值q[l][i].c係設定為零值。否則若已解碼的頻譜值a係小於或等於1,則2-位元上下文值q[l][i].c設定為1。否則,換言之,若目前已解碼的頻譜值a係小於或等於3,則2-位元上下文值q[l][i].c設定為2。否則若目前已解碼的頻譜值a係大於3則2-位元上下文值q[l][i].c設定為3。如此2-位元上下文值q[l][i].c係藉目前已解碼的頻譜值a之極為粗糙的量化獲得。
於接續步驟586,此步驟唯有在目前已解碼的頻譜值之指標i係等於訊框的係數(頻譜值)數目lg時才執行,換言之,若訊框的最末頻譜值已經解碼及核心模乃線性預測域核心模(其係以「core_mode==1」指示),則登錄項目q[l][j].c係拷貝入上下文表qs[k]。拷貝係元件符號586所示執行,使得目前訊框的頻譜值數目lg係列入考量用以將登錄項目q[l][j].c拷貝至上下文表qs[k]。此外,變數「previous_lg」具有值1024。
但另外,若目前已解碼的頻譜係數之指標i達lg值,及核心模乃線性預測域核心模(其係以「core_mode==1」指示),則登錄項目q[l][j].c係拷貝入上下文表qs[j]。此種情況下,變數「previous_lg」係設定成值1024至訊框內頻譜值數目lg間的最小值。
6.9. 解碼程序之摘要後文中,將簡單摘述解碼程序。有關其細節,請參考前文討論及亦第3、4及5a至5i圖。始於最低頻率係數及前進至最高頻率係數,量化頻譜係數a係無雜訊式編碼及傳輸。
得自進階音訊編碼(AAC)的係數係儲存於陣列「x_ac_quant[g][win][sfb][bin]」,及無雜訊編碼碼字組之傳輸順序為當其係以所接收的及儲存於陣列的順序解碼時,bin為最快遞增指標,而g為最慢遞增指標。指標bin表示頻率倉。指標「sfb」表示定標因數帶。指標「win」指示窗。指標「g」指示音訊框。得自變換編碼激勵的係數係直接儲存於陣列「x_tcx_invquant[win][bin]」,及無雜訊編碼碼字組之傳輸順序為當其係以所接收的及儲存於陣列的順序解碼時,「bin」為最快遞增指標,而「win」為最慢遞增指標。首先,存在上下文表或陣列「qs」之所儲存的過去上下文與目前訊框q上下文(儲存在上下文表或陣列q)間進行對映。過去上下文「qs」係儲存在每一頻率行(或每一頻率倉)2-位元。
存在上下文表「qs」之所儲存的過去上下文與儲存在上下文表「q」的目前訊框上下文間之對映係使用函數「arith_map_context()」執行,其虛擬程式碼表示型態係顯示於第5a圖。
無雜訊解碼器輸出信號傳訊量化頻譜係數「a」。
首先,基於環繞欲解碼的量化頻譜係數之事先解碼頻譜係數,計算上下文狀態。上下文狀態s係與藉函數「arith_get_context()」所返回值的首24位元相對應。超過返回值之第24位元的該等位元係與預測位元平面位準lev0相對應。變數「lev」係初始設定為lev0。函數「arith_get_context」之虛擬程式碼表示型態顯示於第5b及5c圖。
一旦狀態s及預測位準「lev0」為已知,則使用函數「arith_decode()」解碼最高有效逐2-位元平面值m,饋以與上下文狀態相對應的機率模型相對應之適當累積頻率表。對應關係係以函數「arith_get_pk()」作出。函數「arith_get_pk()」之虛擬程式碼表示型態顯示於第5e圖。
可替代函數「arith_get_pk()」的另一個函數「get_pk」之虛擬程式碼表示型態顯示於第5f圖。
可替代函數「arith_get_pk()」的另一個函數「get_pk」之虛擬程式碼表示型態顯示於第5d圖。
值m係使用函數「arith_decode()」連同累積頻率表「arith_cf_m[pki][]」調用,此處「pki」係對應於由函數「arith_get_pk()」(或另外,由函數「get_pk()」)所返回的指標。
算術編碼器為使用以定標標度產生標籤之方法的整數實施(例如參考K. Sayood「資料壓縮導論」第三版2006年,Elsevier Inc.)。第5g圖所示虛擬C碼描述所使用的演繹法則。
當解碼值m為逸出符元「ARITH_ESCAPE」時,解碼另一個值m,及變數「lev」遞增1。一旦值m並非逸出符元「ARITH_ESCAPE」,藉由調用函數「arith_decode()」連同累積頻率表「arith_cf_r[]」「lev」次,則其餘位元平面自最高有效位準至最低有效位準解碼。該累積頻率表「arith_cf_r[]」可描述均衡機率分布。
解碼位元平面r允許事先解碼值m以下述方式精製:
一旦頻譜量化係數已完全解碼,則上下文表q或所儲存的上下文qs係藉函數「arith_update_context()」更新用於欲下一個欲解碼的頻譜係數。
函數「arith_update_context()」之虛擬程式碼表示型態係顯示於第5h圖。
此外,定義之圖說係顯示於第5i圖。
7.對映表
於依據本發明之實施例,特別優異之表「arith_s_hash」及「arith_gs_hash」及「ari_cf_m」係用於函數「get_pk」的執行,其已經參考第5d圖討論;或用於函數「arith_get_pk」的執行,其已經參考第5e圖討論;或用於函數「get_pk」的執行,其已經參考第5f圖討論;或用於函數「arith_decode」的執行,其已經參考第5g圖討論。
7.1. 依據第17圖之表「arith_s_hash[387]」
表「arith_s_hash」特別優異之實施內容係用於函數「get_pk」的執行,其已經參考第5d圖討論係顯示於第17圖之表。須注意第17圖之表列舉表「arith_s_hash[387]」之387登錄項目。也須注意第17圖之表表示型態顯示依元素指標排序的元素,使得第一值「0x00000200」係對應於具有元素指標(或表指標)0之表登錄項目「ari_s_hash[0]」,使得最末值「0x03D0713D」係對應於具有元素指標或表指標386之表「ari_s_hash[386]」。進一步須注意「0x」指示表「ari_s_hash」的表登錄項目係以十六進制格式表示。此外,依據第17圖之表「ari_s_hash」之表登錄項目係以數值順序排列來允許執行函數「get_pk」的第一表評估540。
進一步須注意表「ari_s_hash」之表登錄項目的最高有效24位元表示狀態值,而最低有效8位元表示對映規則指標值pki。
如此,表「ari_s_hash」之表登錄項目係描述一狀態值「直接命中」對映至一對映規則指標值「pki」。
7.2. 依據第18圖之表「ari_gs_hash」
表「ari_gs_hash」之特佳實施例之內容顯示於第18圖之表。此處須注意表18之表列舉表「ari_gs_hash」之登錄項目。該等登錄項目係藉一維整數型登錄項目指標(也標示為「元素指標」或「陣列指表」或「表指標」)參照,例如標示以「i」。須注意共含225登錄項目之表「ari_gs_hash」極為適合用於由第5d圖所述的函數「get_pk」的第二表評估544使用。
須注意表「ari_gs_hash」之登錄項目係以對零至224間之表指標值i之表指標i的上升順序列舉。項「0x」指示表登錄項目係以十六進制格式描述。如此,第一表登錄項目「0X000000401」係對應於具有表指標0之表登「ari_gs_hash[0]」,而最末表登錄項目「0Xfffff3f」係對應於具有表指標224之表登「ari_gs_hash[224]」。
也須注意表登錄項目係以數值型上升方式排序,使得表登錄項目極為適合用於函數「get_pk」之第二表評估544。表「ari_gs_hash」之表登錄項目的最高有效24位元描述狀態值範圍間之邊界,而登錄項目的8最低有效位元描述由24最高有效位元所界定的狀態值範圍相關聯的對映規則指標值「pki」。
7.3. 依據第19圖之表「ari_cf_m」
第19圖顯示一集合64個累積頻率表「ari_cf_m[pki][9]」,其中一者係藉音訊編碼器100、700或音訊解碼器200、800選用來執行函數「arith_decode」,亦即用於最高有效位元平面值的解碼。第19圖所示64累積頻率表中之選定者利用表「cum_freq[]」的函數執行函數「arith_decode()」。
如自第19圖可知,各行表示一個累積頻率表有9登錄項目。舉例言之,第一行1910表示「pki=0」之一累積頻率表的9登錄項目。第二行1912表示「pki=1」之一累積頻率表的9登錄項目。最後第64行1964表示「pki=63」之一累積頻率表的9登錄項目。如此,第19圖有效表示「pki=0」至「pki=63」64個不同累積頻率表,其中64個累積頻率表各自係以單行表示,及其中該等累積頻率表各自包含9登錄項目。
於一行內部(例如行1910或行1912或行1964),最左值描述累積頻率表的第一登錄項目,而最右值描述累積頻率表的最末登錄項目。
如此,第19圖之表表示型態中各行1910、1912、1964表示由依據第5g圖之函數「arith_decode」使用的一累積頻率表的登錄項目。函數「arith_decode」之輸入變數「cum_freq[]」描述表「ari_cf_m」之64累積頻率表(9登錄項目之各行表示)須用於目前頻譜係數的解碼。
7.4. 依據第20圖之表「ari_s_hash」
第20圖顯示表「ari_s_hash」之另一替代實例,其可組合依據第5e或5f圖的替代函數「arith_get_pk()」或「get_pk()」使用。
依據第20圖之表「ari_s_hash」包含386登錄項目,其係以表指標之上升順序列舉於第20圖。如此,第一表值「0x0090D52E」係對應於具有表指標0之表登錄項目「ari_s_hash[0]」,而最末表值「0x03D0513C」係對應於具有表指標386之表登錄項目「ari_s_hash[386]」。
「0x」指示表登錄項目係以十六進制格式表示。表「ari_s_hash」之表登錄項目的最高有效24位元表示有效狀態,而表「ari_s_hash」之登錄項目最低有效8位元表示對映規則指標值。
據此,表「ari_s_hash」之登錄項目描述有效狀態對映至對映規則指標值「pki」。
8. 效能評估及優點
依據本發明之實施例使用如前文討論之更新函數(或演繹法則)及更新表集合來獲得運算複雜度、記憶體需求、與編碼效率間之改良式折衷。
概略言之,依據本發明之實施例形成一種改良式頻譜無雜訊編碼。
本文說明描述CE用於頻譜係數之改良式頻譜無雜訊編碼之實施例。所提示之方案係基於「原先」上下文式算術編碼方案,如描述於USAC草擬標準工作草稿4,但顯著減低記憶體需求(RAM、ROM),同時維持無雜訊編碼效能。WD3(亦即音訊編碼器之輸出信號提供USAC草擬標準工作草稿之位元串流)之無損耗轉碼證實為可能。此處所述方案大致上可定標,允許記憶體需求與編碼效能間的進一步替代折衷。依據本發明之實施例係針對替代如用於USAC草擬標準工作草稿4的無雜訊編碼方案。
此處所述算術編碼方案係基於USAC草擬標準工作草稿4(WD4)之參考模型0(RM0)中的方案。頻譜係數先前於頻率模型或時間模型為上下文。此一上下文用於算術編解碼器(編碼器或解碼器)之累積頻率表的選擇。比較依據WD4之實施例,上下文模型化進一步改良,而保有符元機率之表重新訓練。不同機率模型的數目自32增至64。
依據本發明之實施例將表大小(資料ROM需求)縮減至900個長度32-位元字組或3600位元組。相反地,依據USAC草擬標準的WD4實施例要求16894.5字組或76578位元組。依據本發明之若干實施例,每個核心編碼器通道的靜態RAM需求自666字組(2664位元組)減至72字組(288位元組)。同時,可全然保有編碼效能,比較共9個運算點的總資料率,甚至可達約1.04%至1.39%的增益。全部工作草稿3(WD3)位元串流可以無損耗方式轉碼而不影響位元儲存限制。
依據本發明之實施例所提示的方案可擴增:記憶體需求與編碼效能間之彈性折衷係屬可能。藉由加大表的大小事進一步增加編碼增益。
後文中,將提供USAC草擬標準WD4之編碼構想的簡短討論來協助瞭解此處所述構想的優點。於USAC WD4,基於上下文之算術編碼方案係用於量化頻譜係數的無雜訊編碼。作為上下文,使用頻率及時間上為先前的已解碼的頻譜係數。依據WD4,最大數目16頻譜係數係用作為上下文,其中12個的時間在先。用於上下文的及欲解碼的頻譜係數二者係分組成4-重元組(亦即四個頻譜係數之頻率相鄰,參考第10a圖)。上下文縮減且對映至一累積頻率表,其然後用來解碼頻譜係數之下一個4-重元組。
用於完整WD4無雜訊編碼方案,需要16894.5字組(76578位元組)的記憶體需求(ROM)。此外,靜態ROM的每個核心編碼器通道要求666字組(2664位元組)來儲存正一訊框狀態。
第11a圖之表表示型態描述用於USAC WD4算術編碼方案之表。
完整USAC WD4解碼器之總記憶體需求估算為對不含程式碼的資料ROM為37000字組(148000位元組),而對靜態RAM為10000至17000字組。顯然易知無雜訊編碼器表耗用總資料ROM需求之約45%。該最大的個別表已經耗掉4096字組(16384位元組)。
發現全部表組合的大小及最大的個別表二者皆超過由固定點晶片對低預算的可攜式裝置所提供的典型快取大小,其係在8至32千位元組的典型範圍(例如ARM9e、TIC64xx等)。如此表示表的集合可能並未儲存在最快資料RAM,其允許快速隨機存取資料。如此造成整個解碼過程變慢。
後文中,將簡短敘述所提示之新穎方案。
為了克服前述問題,提示一種改良式無雜訊編碼方案來替代USAC草擬標準WD4之方案。至於基於上下文之算術編碼方案,其係基於USAC草擬標準WD4方案,但具有改良式方案特徵用來自該上下文導算出累積頻率表。又復,上下文導算及符元編碼係對單一頻譜係數的粒度(granularity)執行(與4-重元組相反,如USAC草擬標準WD4所使用)。總計7頻譜係數用於上下文(至少於某些情況下)。藉由減少對映關係,選出總計64機率模型或累積頻率表(於WD4:32)中之一者。
第10b圖顯示用於所提示之方案,用於狀態計算之上下文的圖解代表圖(其中用於零區檢測的上下文未顯示於第10b圖)。
後文中,將簡短說明有關記憶體需求縮減的討論,該目的可使用所提示之編碼方案達成。所提示之新方案具有總計900字組(3600位元組)的ROM需求(參考第11b圖之表,其描述用於所提示之編碼方案的表)。
與USAC草擬標準WD4之無雜訊編碼方案的ROM需求相比較,ROM需求減少15994.5字組(64978位元組)(也參考第12a圖,該圖顯示無雜訊編碼方案之ROM需求的圖解代表圖,而與USAC草擬標準WD4的無雜訊編碼方案之ROM需求相反)。如此將完整USAC解碼器之總ROM需求自約37000字組減少至約21000字組,或減少多於43%(參考第12b圖,其顯示依據USAC草擬標準WD4,以及依據本提示之總USAC解碼器資料ROM需求之圖解代表圖)。
又復,也減少下一訊框(靜態RAM)之上下文導算所需資訊量。依據WD4,典型具有16-位元解析度的係數之完整集合(至多1152)加至須要儲存的每個10-位元解析度4-重元組之一組指標,加總成每個核心編碼器通道(完整USAC WD4解碼器:約10000至17000字組)666字組(2664位元組)。
用於依據本發明之實施例之新穎方案將持久資訊減少至每個頻譜係數只有2-位元,其加總成每個核心編碼器通道總計72字組(288位元組)。對靜態記憶體的需求可綮少594字組(2376位元組)。
後文中,將描述有關細碼效率可能增高的若干細節。依據新穎提示實施例之編碼效率係對依據USAC草擬標準WD3之參考品質位元串流作比較。該項比較係基於參考軟體解碼器,利用轉碼器執行。有關依據USAC草擬標準WD3之無雜訊編碼與本案所提示之編碼方案之比較細節,參考第9圖,顯示測試配置之示意代表圖。
雖然依據本發明之實施例比較依據USAC草擬標準WD3或WD4之實施例,記憶體需求大減,但不僅維持編碼效率,反而編碼效率略增。編碼效率平均增高1.04%至1.39%。有關其細節請參考第13a圖之表,顯示依據本發明之實施例,使用工作草稿算術編碼器及音訊編碼器(例如USAC音訊編碼器),藉USAC編碼器所產生的平均位元率之表表示型態。
藉由測量位元儲存的填補位準,顯示所提示的無雜訊編碼可對每個運算點,無損耗地轉碼WD3位元串流。有關其細節,參考第13b圖之表,其顯示依據本發明之實施例之音訊編碼器及依據USAC WD3之音訊編碼器,位元儲存控制之表表示型態。
每個運算模之平均位元率之相關細節,以訊框為基準之最小、最大及平均位元率,及基於訊框基準之最佳/最惡劣情況效能可參考第14、15及16圖之表,其中第14圖之表顯示依據本發明之實施例之音訊編碼器及依據USAC WD3之音訊編碼器,平均位元率之表表示型態;其中第15圖之表顯示以訊框為基準之最小、最大及平均位元率之表表示型態;及其中第16之表顯示基於訊框基準之最佳及最惡劣情況之表表示型態。
此外,須注意依據本發明之實施例提供良好擴充性。藉由調整表大小,可依據需求而調整記憶體需求、運算複雜度、及編碼效率間之折衷。
9. 位元串流語法 9.1. 頻譜無雜訊編碼器之有效負載
後文中,將敘述有關頻譜無雜訊編碼器之有效負載之若干細邊。於若干實施例,有多種不同編碼模,諸如所謂的線性預測域、「編碼模」及「頻域」編碼模。於線性預測域編碼模,基於音訊信號之線性預測分析而執行雜訊成形,及雜訊成形信號係於頻域編碼。於頻域模,基於心理聲學分析執行雜訊成形,及音訊內容的雜訊成形版本係編碼於頻域。
得自「線性預測域」編碼信號及「頻域」編碼信號二者之頻譜係數係經定標量化,然後藉調適性上下文相依性算術編碼而以無雜訊式編碼。量化係數自最低頻傳輸至最高頻。各個個別量化係數分裂成最高有效逐2-位元平面m,及其餘較低有效位元平面r。值m係依據該係數之鄰近編碼。其餘較低有效位元平面r係經焓編碼,而未考慮上下文。值m及r形成算術編碼器的符元。
算術解碼程序之細節描述於此處。
9.2. 語法元素
後文中,將參考第6a至6h圖說明載有算術式編碼頻譜資訊的位元串流之位元串流語法。
第6a圖顯示所謂的USAC原資料區塊(「usac_raw_data_block()」)之語法表示型態。
USAC原資料區塊包含一個或多個單通道元素(「single_channel_element()」)及/或一個或多個通道對元素(「channel_pair_element()」)。
現在參考第6b圖,敘述單通道元素之語法。依據核心模,單通道元素包含線性預測域通道串流(「lpd_channel_stream()」)或頻域通道串流(「fd_channel_stream()」)。
第6c圖顯示通道對元素之語法表示型態。通道對元素包含核心模資訊(「core_mode0」、「core_mode1」)。此外,通道對元素包含組態資訊「ics_info()」。此外,依核心模資訊而定,該通道對元素包含與該等通道中之第一者相關聯的線性預測域通道串流或頻域通道串流,及該通道對元素也包含與該等通道中之第二者相關聯的線性預測域通道串流或頻域通道串流。
組態資訊「ics_info()」其語法表示型態係顯示於第6d圖,包含多個不同組態資訊項,其與本發明並非特別有關。
頻域通道串流(「fd_channel_stream()」)其語法表示型態係顯示於第6e圖,包含增益資訊(「global_gain」)及組態資訊(「ics_info()」)。此外頻域通道串流包含定標因數資料(「scale_factor_data()」),其係描述用於不同定標因數帶的頻譜值定標之定標因數,及其係利用定標器150及重定標器240施用。頻域通道串流也包含表示算術式編碼頻譜值的算術式編碼頻譜資料(「ac_spectral_data()」)。
算術式編碼頻譜資料(「ac_spectral_data()」)其語法表示型態係顯示於第6f圖,包含用於選擇性地復置上下文之選擇性算術復置旗標(「arith_reset_flag」),說明如前。此外,算術式編碼頻譜資料包含多個算術-資料區塊(「arith_data」),其載有算術式編碼頻譜值。該算術式編碼資料區塊係取決於頻帶(以變數「num_bands」表示)數目,及也取決於算術復置旗標狀態,容後詳述。
算術式編碼資料區塊之結構也將參考第6g圖作說明,該圖顯示該算術式編碼資料區塊之語法表示型態。算術式編碼資料區塊內部的資料表示型態係取決於欲編碼的頻譜值數目1g、算術復置旗標狀態、及亦取決於上下文,亦即事先解碼頻譜值。
用於頻譜值之目前集合編碼的上下文係依據元件符號660所示的上下文判定演繹法則而判定。前文已經參考第5a圖討論之上下文判定演繹法則之細節。算術式編碼資料區塊包含1g個碼字組集合,各個碼字組集合代表一個頻譜值。一個碼字組集合包含使用1至20位元表示頻譜值之最高有效位元平面值m的算術碼字組「acod_m[pki][m]」。此外,若該頻譜值需要比最高有效位元平面用於正確表示型態更多的位元平面,則該碼字組集合包含一個或多個碼字組「acod_r[r]」。碼字組「acod_r[r]」表示1至20位元間之較低有效位元平面。
但若需要一個或多個較低有效位元平面(除了最高有效位元平面值之外)用於頻譜值的適當表示型態,則此係使用一個或多個算術逸出碼字組(「ARITH_ESCAPE」)傳訊。如此,一般可謂對一頻譜值測定需要多少位元平面(最高有效位元平面及可能地,一個或多個額外較低有效位元平面)。若需一個或多個較低有效位元平面,則此係藉一個或多個算術逸出碼字組「acod_m[pki][ARITH_ESCAPE]」傳訊,其係依據目前選定的累積頻率表編碼,其累積頻率表指標係以變數pki給定。此外,若有一個或多個算術逸出碼字組係含括於該位元串流,則上下文經調適,可參考元件符號664、662。接在該一算術逸出碼字組後方,算術碼字組「acod_m[pki][m]」含括於該位元流,如元件符號663所示,其中pki標示目前有效機率模型指標(考慮經由含括算術逸出碼字組所導致的上下文調適),及其中m標示欲編碼或欲解碼的頻譜值之最高有效位元平面值。
如前文討論,任何較低有效位元平面的存在結果導致一個或多個碼字組「acod_r[r]」的存在,其各自表示最低有效位元平面之一個位元。一個或多個碼字組「acod_r[r]]」係依據相對應的累積頻率表編碼,該累積頻率表為恆定且為上下文非相干性。
此外,須注意於各個頻譜值之編碼後,上下文經更新,如元件符號668所示,使得該上下文典型地係與兩個隨後頻譜值的編碼不同。
第6h圖顯示定義算術式編碼資料區塊語法之定義及輔助元素之圖說。
綜上所述,已經敘述位元串流格式,其事藉音訊編碼器100提供,及其可藉音訊解碼器200評估。算術編碼頻譜值之位元串流係經編碼使得其匹配前文討論的解碼演繹法則。
此外,須注意編碼是解碼的反向運算,使得其通常假設編碼器係使用前文討論的表執行表查詢,其近似藉解碼器執行表查詢的反相。一般可謂熟諳技藝人士瞭解解碼演繹法則及/或期望的位元串流語法將容易設計算術編碼器,該算術編碼器提供於位元串流語法所定義的及算術解碼器所要求的資料。
10. 依據第21及22圖之其它實施例
後文中,將描述依據本發明之若干其它簡化實施例。
第21圖顯示依據本發明之一實施例,一種音訊編碼器2100之方塊示意圖。該音訊編碼器2100係組配來接收一輸入的音訊資訊2110,以及基於此資訊而提供一已編碼的音訊資訊2112。該音訊編碼器2100包含一能量壓縮時域至頻域變換器2120,其係組配來接收該輸入的音訊表示型態2110之時域表示型態2122,以及基於此表示型態而提供一頻域音訊表示型態2124,使得該頻域音訊表示型態包含一頻譜值集合(例如頻譜值a)。該音訊編碼器2100也包含一算術編碼器2130,其係組配來使用一可變長度碼字組而編碼頻譜值2124或其前處理版本。該算術編碼器2130係組配來將一頻譜值或一頻譜值的最高有效位元平面值對映至一碼值(例如表示可變長度碼字組之一碼值)。
該算術編碼器2130包含對映規則的選擇2132及一上下文值的判定2136。該算術編碼器係組配來依據描述上下文狀態的一數值型目前上下文值2134而選擇對映規則,該對映規則描述一頻譜值2124或一頻譜值2124之最高有效位元平面之對映至一碼值(其可表示一可變長度碼字組)。該算術解碼器係組配來依據多個先前已編碼的頻譜值,及也依據欲解碼的頻譜值是否係在第一預定頻率區或係在第二預定頻率區而用來判定用在該對映規則的選擇2132之一數值型目前上下文值2134。如此,該對映關係2131係調整適應不同頻率區的特定特性。
第22圖顯示依據本發明之另一實施例,一種音訊信號解碼器2200之方塊示意圖。該音訊信號解碼器2200係組配來接收已編碼之音訊資訊2210,及基於此而提供已解碼之音訊資訊2212。該音訊信號解碼器2200包含一算術解碼器2220,其係組配來接收該頻譜值的已經算術編碼之表示型態2222,以及基於此而提供多個已解碼之頻譜值2224(例如已解碼之頻譜值a)。該音訊信號解碼器2200也包含一頻域至時域變換器2230,其係組配來接收該等已解碼之頻譜值2224,及使用該等已解碼之頻譜值而提供一時域音訊表示型態,藉此獲得該已解碼之音訊資訊2212。
該算術解碼器2220包含對映關係2225,其係用來將一碼值(例如擷取自表示該已編碼之音訊資訊一位元串流之一碼值)對映至一符元碼(該符元碼例如可描述一已解碼之頻譜值或該已解碼之頻譜值之最高有效位元平面)。該算術解碼器進一步包含對映規則的選擇2226,其提供對映規則之選擇資訊2227予該對映關係2225。該算術解碼器2220也包含一上下文值之判定2228,其提供一數值型目前上下文值2229予該對映規則的選擇2226。算術解碼器2220係組配來依據上下文狀態而選定對映規則,該對映規則描述一碼值(例如擷取自表示該已編碼之音訊資訊一位元串流之一碼值)對映至一符元碼(表示該已解碼之頻譜值之一數值,或表示該已解碼之頻譜值之最高有效位元平面之一數值)。該算術解碼器係組配來依據多個事先解碼頻譜值,及也依據欲解碼的頻譜值是否位在第一預定頻率區或係位在第二預定頻率區,而判定描述該目前上下文狀態之一數值型目前上下文值。
如此,於該對映關係2225中考慮不同頻率區的不同特性,其典型地獲致編碼效率的提高而未顯著增加運算量。
11. 實施替代例
雖然於裝置之上下文已經描述若干構面,但顯然此等構面也表示相對應方法之說明,此處區塊或元件係與方法步驟或方法步驟之特徵相對應。類似地,於方法步驟之上下文所述構面也表示相對應區塊或相對應裝置之項目或特徵的描述。部分或全部方法步驟可藉(或使用)硬體裝置執行,例如微處理器、可程式電腦或電子電路。若干實施例中,最重要方法步驟中之某一個或多個可藉此種裝置執行。
本發明編碼之音訊信號可儲存於數位儲存媒體,或可於傳輸媒體上傳輸,諸如無線傳輸媒體或有線傳輸媒體諸如網際網路。
依據某些實施要求而定,本發明實施例可於硬體或軟體實施。實施可使用具有可電子式讀取的控制信號儲存其上之數位儲存媒體,例如軟碟、DVD、藍光碟、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體執行,該等控制信號與可程式電腦系統協力合作,使得可執行個別方法。因此,數位儲存媒體可經電腦讀取。
依據本發明之若干實施例包含一資料載體,其具有可電子式讀取的控制信號,該等控制信號與可程式電腦系統協力合作,使得可執行此處所述方法中之一者。
一般而言,本發明之實施例可實施為帶有程式碼之電腦程式產品,當該電腦程式產品於電腦上跑時,該程式碼可運算來執行該方法中之一者。程式碼例如可儲存在機器可讀取載體上。
其它實施例包含用以執行儲存在機器可讀取載體上的此處所述方法中之一者的電腦程式。
換言之,因此,本發明方法之實施例為具有程式碼用以執行儲存在機器可讀取載體上的此處所述方法中之一者的電腦程式。
因此,本發明方法之又一實施例為資料載體(或數位儲存媒體、或電腦可讀取體)包含用以執行此處所述方法中之一者的電腦程式記錄於其上。
因此,本發明方法之又一實施例為一資料串流或一序列信號,表示用以執行此處所述方法中之一者的電腦程式。該資料串流或信號序列例如可經組配來透過資料通訊連結,例如透過網際網路而傳輸。
又一實施例包含組配來或調適來執行此處所述方法中之一者的處理裝置,例如電腦或可程式邏輯裝置。
又一實施例包含其上已經安裝電腦程式用以執行此處所述方法中之一者的電腦。
於若干實施例,可程式邏輯裝置(例如場可程式閘極陣列)可用來發揮此處所述方法之部分或全部功能。於若干實施例,場可程式閘極陣列可與微處理器協力合作來執行此處所述方法中之一者。大致上,該等方法較佳係藉任何硬體裝置執行。
前述實施例僅供舉例說明本發明之原理。須瞭解此處所述配置及細節的修正與變更將為其它熟諳技藝人士顯然易知。因此意圖本發明之範圍備受隨附之申請專利範圍之範圍所限,而非受此處實施例之描述及解說所呈現的特定細節所限。
雖然前文已經特別顯示及參考前述特定實施例作說明,但熟諳技藝人士須瞭解可未悖離其精髓及範圍對形式與細節上作出多項其它改變。須瞭解可未悖離此處揭示及由如下申請專利範圍所涵蓋之廣義範圍,調適不同實施例而做出多項變化。
12. 結論
總結而言,發現依據本發明之實施例形成一種改良式無雜訊編碼方案。依據該新穎提示之實施例允許將記憶體需求自16894.5字組減少至900字組(ROM)及自666字組減少至72字組(每個核心編碼器通道之靜態RAM)。如此允許於一個實施例,完整系統之資料ROM需求減少約43%。同時,不僅完全維持編碼效能,同時甚至平均增高編碼效能。WD3之(依據USAC草擬標準WD3所提供之位元串流之)無損耗轉碼證實為可能。如此,經由將此處所述無雜訊編碼採用至該USAC草擬標準之未來工作草稿,獲得依據本發明之實施例。
要言之,於一實施例,所提示的新穎無雜訊編碼可導致MPEG USAC草擬標準就下列方面的修正:就如第6g圖所示位元串流元素「arith_data()」之語法;就前述頻譜無雜訊編碼器的有效負載且如第5h圖所示;就前述頻譜無雜訊編碼;就如第4圖所示之狀態計算之上下文;就如第5i圖所示之定義;就前文參考第5a、5b、5c、5e、5g、5h圖所述之解碼程序;及就如第17、18、20圖所示之表;及就如第5d圖所示之函數「get_pk」。但另外,依據第20圖之表「ari_s_hash」可用來替代第17圖之表「ari_s_hash」,及第5f圖之函數「get_pk」可用來替代依據第5d圖之函數「get_pk」。
100‧‧‧音訊編碼器
110‧‧‧輸入的音訊資訊
110a‧‧‧前處理輸入的音訊資訊
112‧‧‧位元串流
120‧‧‧前處理器
130‧‧‧能量壓縮時域至頻域變換器、信號變換器
130a‧‧‧開窗MDCT變換器
132‧‧‧頻域音訊資訊
140‧‧‧頻譜後處理器
142‧‧‧後處理頻域音訊表示型態
150‧‧‧定標器/量化器
152‧‧‧經定標且經量化的頻域音訊表示型態
160‧‧‧心理聲學模型處理器
170‧‧‧算術編碼器
172a,172b‧‧‧算術碼字組資訊
174‧‧‧最高有效位元平面擷取器
176‧‧‧最高有效位元平面值
180‧‧‧第一碼字組測定器
182‧‧‧狀態追蹤器
184‧‧‧狀態資訊
186‧‧‧累積頻率表選擇器
188‧‧‧資訊
189a‧‧‧較低有效位元平面擷取器
189b,189d‧‧‧較低有效位元平面資訊
189c‧‧‧第二碼字組測定器
190‧‧‧位元串流有效負載格式化器
200‧‧‧音訊解碼器
210‧‧‧位元串流
212‧‧‧已解碼的音訊資訊
220‧‧‧位元串流有效負載解格式化器
222‧‧‧已編碼的頻域音訊表示型態
224‧‧‧狀態復置資訊
230‧‧‧算術解碼器
232‧‧‧已解碼的頻域音訊表示型態
288...較低有效位元平面測定器
290...已解碼的值
292...位元平面組合器
296...累積頻率表選擇器
298...狀態指標
299...狀態追蹤器
310...初始設定、步驟
312...頻譜值解碼
314...上下文更新
312a...上下文值計算、狀態值運算
312b...最高有效位元平面解碼
312ba...解碼演繹法則、演繹法則
312c...較低有效位元平面加法
410...橫座標
412...縱座標
420,430,434,440,444,448,452,456...頻譜值
510...第一算術復置處理
512...一組多個事先解碼相鄰零頻譜值之檢測
512a-d,514a-e,536a-c...步驟
514...第一變數設定
516...第二變數設定
518,522,534...位準調適
520...區值設定
524...位準限制
526...算術復置處理
528...第三變數設定
530...第四變數設定
532...第五變數設定
536...選擇返回值運算
540,550...第一表評估
541,545...變數初始設定
542,546...重複表搜尋
543...邊界登錄項目檢查
544,560...第二表評估
546a-d...步驟
547...返回值判定
570a-f...步驟
570a...變數初始設定
570b...第二步驟
570c...重複累積頻率表搜尋
570d...導出符元值
570e...調適
570f...區間再標準化
570fa,570fb...步驟
570fa...選擇性向下位移運算
570fb...區間增加運算
580-588...步驟
660,662,663,664,668...步驟
700...音訊編碼器
710...輸入的音訊資訊
712...已編碼的音訊資訊
720...能量壓縮時域至頻域變換器
722...頻域音訊表示型態
730...算術編碼器
740...頻譜值編碼
742...對映規則、對映規則資訊
750...狀態追蹤器
752...群組檢測器
754...描述目前上下文狀態之資訊、資訊
760...對映規則選擇器
800...音訊解碼器
810...已編碼的音訊資訊
812...已解碼的音訊資訊、時域音訊表示型態
820...算術解碼器
821...算術式編碼的表示型態
822...已解碼的頻譜值、事先解碼頻譜值
824...頻譜值測定器
826...狀態追蹤器
826a...上下文狀態資訊
828...對映規則選擇器
828a...對映規則資訊
830...頻域至時域變換器
1910...第一行
1912...第二行
1964...第64行
2100...音訊編碼器、音訊信號編碼器
2110...輸入的音訊資訊、輸入的音訊表示型態
2112...已編碼的音訊資訊
2120...能量壓縮時域至頻域變換器
2122...時域表示型態
2124...頻域表示型態
2130...算術編碼器
2131...對映關係
2132...對映規則選擇
2133...對映規則資訊、對映規則指標值
2134...數值型目前上下文值
2136...上下文值判定
2200...音訊信號解碼器
2210...已編碼之音訊資訊
2212...已解碼之音訊資訊
2220...算術解碼器
2222...經算術解碼的表示型態
2224...已解碼之頻譜值
2225...對映關係
2226...對映規則之選擇
2227...對映規則之選擇資訊
2136‧‧‧上下文值判定
2200‧‧‧音訊信號解碼器
2210‧‧‧已編碼之音訊資訊
2212‧‧‧已解碼之音訊資訊
2220‧‧‧算術解碼器
2222‧‧‧經算術解碼的表示型態
2224‧‧‧已解碼之頻譜值
2225‧‧‧對映關係
2226‧‧‧對映規則之選擇
2227‧‧‧對映規則之選擇資訊
2228‧‧‧上下文值之判定
2229‧‧‧數值型目前上下文值
2230‧‧‧頻域至時域變換器
第1a及1b圖顯示依據本發明之一實施例,一種音訊編碼器之方塊示意圖;
第2a及2b圖顯示依據本發明之一實施例,一種音訊解碼器之方塊示意圖;
第3圖顯示用以解碼頻譜值的演繹法則「value_decode()」之虛擬程式碼表示型態;
第4圖顯示用於狀態計算的上下文之示意代表圖;
第5a圖顯示用以對映上下文的演繹法則「arith_map_context()」之虛擬程式碼表示型態;
第5b及5c圖顯示用以獲得上下文狀態值的演繹法則「arith_get_context()」之虛擬程式碼表示型態;
第5d1及5d2圖顯示用以自狀態變數導算出累積-頻率-表指標值「pki」的演繹法則「get_pk(s)」之虛擬程式碼表示型態;
第5e圖顯示用以自狀態值導算出累積-頻率-表指標值「pki」的演繹法則「arith_get_pk(s)」之虛擬程式碼表示型態;
第5f圖顯示用以自狀態值導算出累積-頻率-表指標值「pki」的演繹法則「get_pk(unsigned long s)」之虛擬程式碼表示型態;
第5g1及5g2圖顯示用以自可變長度碼字組算術式解碼一符元的演繹法則「arith_decode()」之虛擬程式碼表示型態;
第5h圖顯示用以更新上下文的演繹法則「arith_update_context()」之虛擬程式碼表示型態;
第5i圖顯示定義及變數的圖說;
第6a圖顯示統一語音與音訊編碼器(USAC)原始資料區塊之語法表示型態;第6b圖顯示單一通道元素之語法表示型態;第6c圖顯示成對通道元素之語法表示型態;第6d圖顯示「ics」控制資訊之語法表示型態;第6e圖顯示頻域通道串流之語法表示型態;第6f圖顯示算術式編碼頻譜資料之語法表示型態;第6g圖顯示解碼一頻譜值集合之語法表示型態;第6h圖顯示資料元素及變數的圖說;第7圖顯示依據本發明之另一實施例,一種音訊編碼器之方塊示意圖;第8圖顯示依據本發明之另一實施例,一種音訊解碼器之方塊示意圖;第9圖顯示使用依據本發明之編碼方案,依據USAC草擬標準之工作草稿3,用於無雜訊編碼比較之配置。(即WD3無雜訊編碼與所提示之編碼方案之比較);第10a圖顯示用於狀態計算之上下文當其用於依據USAC草擬標準之工作草稿4時的示意代表圖。(即用於狀態計算之上下文,如USAC WD4使用);第10b圖顯示用於狀態計算之上下文當其用於依據本發明之實施例時的示意代表圖。(即用於狀態計算之上下文,用於所提示之方案);第11a圖顯示該表當其用於依據USAC草擬標準之工作草稿4之該算術編碼方案時之綜論。(即用於所提示之USAC WD4算術編碼方案之表);第11b圖顯示該表當其用於依據本發明之算術編碼方 案時之綜論。(即用於所提示之編碼方案之表);第12a圖顯示用於依據本發明及依據USAC草擬標準之工作草稿4之無雜訊編碼方案之唯讀記憶體需求指令之圖解代表圖。(即如所提示及WD4之無雜訊編碼方案之ROM需求);第12b圖顯示依據本發明及依據USAC草擬標準之工作草稿4之該構想的總USAC解碼器資料唯讀記憶體需求指令之圖解代表圖。(即總USAC解碼器資料之ROM需求,WD4及本提示);第13a圖顯示依據USAC草擬標準之工作草稿3之算術編碼器、及依據本發明之一實施例之算術解碼器,統一語音與音訊編碼編碼器所使用之平均位元率之表代表圖。(即使用WD算術編碼器之USAC編碼器及新穎提示所產生之平均位元率);第13b圖顯示依據USAC草擬標準之工作草稿3之算術編碼器、及依據本發明之一實施例之算術編碼器,用於統一語音與音訊編碼編碼器位元累積控制之表代表圖。(即用於USAC WD3及新穎提示之位元儲存控制);第14圖顯示依據USAC草擬標準之工作草稿3、及依據本發明之一實施例,用於USAC編碼編碼器之平均位元率之表代表圖。(即USAC WD3及新穎提示之平均位元率);第15圖顯示基於訊框基礎,USAC之最小、最大、及平均位元率之表代表圖。(即基於訊框基準USAC之最小、最大及平均位元率); 第16圖顯示基於訊框基礎,最佳狀況及最惡劣狀況之表代表圖。(即基於訊框基準之最佳及最惡劣情況);第17(1)及17(2)圖顯示表「ari_s_hash[387]」之內容之表代表圖;第18圖顯示表「ari_gs_hash[225]」之內容之表代表圖;第19(1)及19(2)圖顯示表「ari_cf_m[64][9]」之內容之表代表圖;第20(1)及20(2)圖顯示表「ari_s_hash[387]」之內容之表代表圖;第21圖顯示依據本發明之一實施例,一種音訊編碼器之方塊示意圖;及第22圖顯示依據本發明之一實施例,一種音訊解碼器之方塊示意圖。
2200...音訊信號解碼器
2210...已編碼之音訊資訊
2212...已解碼之音訊資訊
2220...算術解碼器
2222...經算術解碼的表示型態
2224...已解碼之頻譜值
2225...對映關係
2226...對映規則之選擇
2227...對映規則之選擇資訊
2228...上下文值之判定
2229...數值型目前上下文值
2230...頻域至時域變換器

Claims (16)

  1. 一種用以基於已編碼之音訊資訊而提供已解碼之音訊資訊的音訊解碼器,該音訊解碼器包含:用以基於經算術編碼的頻譜值表示型態而提供多個已解碼的頻譜值之一算術解碼器;及用以使用已解碼的頻譜值來獲得已解碼之音訊資訊而提供時域音訊表示型態之一頻域至時域變換器;其中該算術解碼器係組配來依據脈絡狀態而選擇描述經算術編碼表示的一碼值對應至一符元碼,該符元碼表示一或多個之該已解碼的頻譜值、或一或多個之該已解碼的頻譜值的至少一部分的對映規則:其中該算術解碼器係組配來依據多個事先解碼頻譜值,及也依據欲解碼的頻譜值是否位在一第一預定頻率區或位在一第二預定頻率區,而判定描述一目前脈絡狀態之數值型目前脈絡值。
  2. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來依據欲解碼的頻譜值是否位在第一預定頻率區或係位在第二預定頻率區而選擇性地修正該數值型目前脈絡值。
  3. 如申請專利範圍第1或2項之音訊解碼器,其中該算術解碼器係組配來判定該數值型目前脈絡值,使得該數值型目前脈絡值係基於多個事先解碼頻譜值之組合,或基於自多個事先解碼頻譜值所導出的中間值的組合,以及使得依據欲解碼的頻譜值是否位在第一預定頻率區或係 位在第二預定頻率區,而該數值型目前脈絡值係選擇性地增加基於多個事先解碼頻譜值之組合,或基於自多個事先解碼頻譜值所導出之中間值組合所得的一值。
  4. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來於至少第一頻率區與第二頻率區間區別,藉此判定該數值型目前脈絡值,其中該第一頻率區包含與該音訊內容之一給定時間部分相關聯的頻譜值中之至少15%,及其中該第一頻率區為低頻區且包含具有最低頻率之相關聯的頻譜值。
  5. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來於至少第一頻率區與第二頻率區間區別,藉此判定該數值型目前脈絡值,其中該第二頻率區包含與該音訊內容之一給定時間部分相關聯的頻譜值中之至少15%,及其中該第二頻率區為高頻區且包含具有最高頻率之相關聯的頻譜值。
  6. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來至少於第一頻率區、第二頻率區與第三頻率區間區別,藉此依據該欲解碼的頻譜值係在至少三個頻率區中的哪一個之判定而判定該數值型目前脈絡值;及其中該第一頻率區、第二頻率區及第三頻率區中之每一者包含多個相關聯的頻譜值。
  7. 如申請專利範圍第6項之音訊解碼器,其中該音訊資訊之一給定時間部分之頻譜值中之至少八分之一係與該第一頻率區相關聯,及其中該音訊資訊之一給定時間部 分之頻譜值中之至少五分之一係與該第二頻率區相關聯,及其中該音訊資訊之一給定時間部分之頻譜值中之至少四分之一係與該第三頻率區相關聯。
  8. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來運算包含至少第一被加數及至少第二被加數之一和,經由該加總結果而獲得該數值型目前脈絡值,其中該第一被加數係經由描述事先解碼頻譜值之振幅的多個中間值之組合獲得,及其中該第二被加數描述欲解碼的頻譜值係與多個頻率區中的哪一個頻率區相關聯。
  9. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來依據欲解碼的頻譜值係位在多個不同頻率區中的哪一個頻率區之判定,而修正該數值型目前脈絡值之二進制表示型態的一個或多個預定位元位置。
  10. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來依據該數值型目前脈絡值而選擇對映規則,使得多個不同數值型目前脈絡值導致選擇相同的對映規則。
  11. 如申請專利範圍第1項之音訊解碼器,其中該算術解碼器係組配來依據該數值型目前脈絡值而執行對映規則的二步驟式選擇;其中該算術解碼器係組配來於第一選擇步驟,檢查該數值型目前脈絡值或自其中導出之值是否等於由一 直接命中表的一登錄項目所描述之一有效狀態值;及其中該算術解碼器係組配來於第二選擇步驟,判定若該數值型目前脈絡值或自其中導出之值係與由一直接命中表的一登錄項目所描述之一有效狀態值不同,則該數值型目前脈絡值位在多個區間中的哪一個區間係唯一執行者;及其中該算術解碼器係組配來依據第一選擇步驟或第二選擇步驟的結果而選定該對映規則;及其中該算術解碼器係組配來於第一選擇步驟或於第二選擇步驟,依據欲解碼的頻譜值是否位在第一頻率區或係位在第二頻率區而選定該對映規則。
  12. 如申請專利範圍第11項之音訊解碼器,其中該算術解碼器係組配來依據該欲解碼的頻譜值係位在多個不同頻率區中的哪一個頻率區之判定,而選擇性地修正該數值型目前脈絡值之二進制表示型態之一個或多個最低有效位元部分;其中該算術解碼器係組配來於該第二選擇步驟,判定該數值型目前脈絡值之二進制表示型態係位在多個區間中之哪一個區間,選擇該對映關係,使得若干數值型目前脈絡值導致與該欲解碼的頻譜值位在哪一個頻率區不相干地選擇相同的對映規則,及使得對若干數值型目前脈絡值而言,該對映規則係依據欲解碼的頻譜值係位在哪一個頻率區而選定。
  13. 一種用以基於輸入的音訊資訊而提供已編碼音訊資訊之音訊信號編碼器,該音訊編碼器包含:用以基於該輸入的音訊資訊之時域表示型態而提供一頻域音訊表示型態,使得該頻域音訊表示型態包含一頻譜值集合的一能量壓縮時域至頻域變換器;組配來使用一可變長度碼字組而編碼頻譜值或其前處理版本之一算術編碼器,其中該算術編碼器係組配來將一頻譜值、或一頻譜值之最高有效位元平面值對映至一碼值,其中該算術編碼器係組配來依據一脈絡狀態而選擇描述將一頻譜值、或一頻譜值之最高有效位元平面值對映至一碼值的對映規則,其中該算術編碼器係組配來依據多個先前已編碼的頻譜值,及也依據欲編碼的頻譜值是否位在第一預定頻率區或係位在第二預定頻率區來判定描述該目前脈絡狀態之一數值型目前脈絡值。
  14. 一種用以基於已編碼之音訊資訊而提供已解碼的音訊資訊之方法,該方法包含:基於已經算術編碼的頻譜值表示型態而提供多個已解碼的頻譜值;及執行頻域至時域變換,來使用該等已解碼的頻譜值而提供一時域音訊表示型態,藉此獲得該已解碼的音訊資訊;其中描述經算術編碼表示的一碼值對映至一符元 碼之對映規則,該符元碼表示一或多個該已解碼的頻譜值、或一或多個該已解碼的頻譜值之至少一部分,係依據一脈絡狀態而選擇;及其中描述該目前脈絡狀態之一數值型目前脈絡值係依據多個事先解碼頻譜值而判定,及也依據欲解碼的頻譜值是否位在第一預定頻率區或係位在第二預定頻率區而判定。
  15. 一種用以基於輸入之音訊資訊而提供已編碼的音訊資訊之方法,該方法包含:執行一能量壓縮時域至頻域變換,來基於該輸入的音訊資訊之時域表示型態而提供頻域音訊表示型態,使得該頻域音訊表示型態包含一組頻譜值;及使用一可變長度碼字組來編碼一頻譜值或其前處理版本;其中一頻譜值、或一頻譜值之最高有效位元平面值係對映至一碼值;其中描述一頻譜值、或一頻譜值之最高有效位元平面值係對映至一碼值的對映規則係依據脈絡狀態而選擇;其中描述該目前脈絡狀態之一數值型目前脈絡值係依據多個先前已編碼的頻譜值而判定,及也依據欲編碼的頻譜值是否位在第一預定頻率區或係位在第二預定頻率區而判定。
  16. 一種電腦程式,當該電腦程式於電腦上運行時係用以執 行如申請專利範圍第14或15項之方法中之一者。
TW099135555A 2009-10-20 2010-10-19 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式 TWI451403B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US25345909P 2009-10-20 2009-10-20

Publications (2)

Publication Number Publication Date
TW201129969A TW201129969A (en) 2011-09-01
TWI451403B true TWI451403B (zh) 2014-09-01

Family

ID=43259832

Family Applications (3)

Application Number Title Priority Date Filing Date
TW099135561A TWI430262B (zh) 2009-10-20 2010-10-19 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及利用重複區間大小縮減的電腦程式
TW099135555A TWI451403B (zh) 2009-10-20 2010-10-19 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式
TW099135558A TWI426504B (zh) 2009-10-20 2010-10-19 音訊編碼器、音訊解碼器、用以將音訊資訊編碼的方法、用以將音訊資訊解碼的方法、及使用一組事先解碼頻譜值之檢測的電腦程式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW099135561A TWI430262B (zh) 2009-10-20 2010-10-19 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及利用重複區間大小縮減的電腦程式

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW099135558A TWI426504B (zh) 2009-10-20 2010-10-19 音訊編碼器、音訊解碼器、用以將音訊資訊編碼的方法、用以將音訊資訊解碼的方法、及使用一組事先解碼頻譜值之檢測的電腦程式

Country Status (19)

Country Link
US (6) US8706510B2 (zh)
EP (3) EP2491552B1 (zh)
JP (3) JP5589084B2 (zh)
KR (3) KR101419148B1 (zh)
CN (3) CN102667923B (zh)
AR (3) AR078705A1 (zh)
AU (1) AU2010309820B2 (zh)
BR (6) BR112012009445B1 (zh)
CA (4) CA2778325C (zh)
ES (3) ES2610163T3 (zh)
HK (2) HK1175289A1 (zh)
MX (3) MX2012004572A (zh)
MY (3) MY188408A (zh)
PL (3) PL2491552T3 (zh)
PT (1) PT2491553T (zh)
RU (3) RU2596596C2 (zh)
TW (3) TWI430262B (zh)
WO (3) WO2011048098A1 (zh)
ZA (3) ZA201203610B (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2934052T3 (es) 2008-07-11 2023-02-16 Fraunhofer Ges Forschung Codificador de audio y decodificador de audio
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
BR112012009445B1 (pt) 2009-10-20 2023-02-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método para codificar uma informação de áudio, método para decodificar uma informação de áudio que utiliza uma detecção de um grupo de valores espectrais previamente decodificados
CN102859583B (zh) * 2010-01-12 2014-09-10 弗劳恩霍弗实用研究促进协会 利用对数值先前脉络值的数字表示之修改的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法
AU2011287747B2 (en) * 2010-07-20 2015-02-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an optimized hash table
CN110706715B (zh) 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
LT2869563T (lt) 2012-07-02 2018-07-10 Samsung Electronics Co., Ltd. Vaizdo entropinio dekodavimo būdas
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
WO2015037969A1 (ko) * 2013-09-16 2015-03-19 삼성전자 주식회사 신호 부호화방법 및 장치와 신호 복호화방법 및 장치
CN110867190B (zh) * 2013-09-16 2023-10-13 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
JP6763849B2 (ja) 2014-07-28 2020-09-30 サムスン エレクトロニクス カンパニー リミテッド スペクトル符号化方法
EP3799044B1 (en) * 2014-09-04 2023-12-20 Sony Group Corporation Transmission device, transmission method, reception device and reception method
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10812550B1 (en) * 2016-08-03 2020-10-20 Amazon Technologies, Inc. Bitrate allocation for a multichannel media stream
ES2953832T3 (es) 2017-01-10 2023-11-16 Fraunhofer Ges Forschung Decodificador de audio, codificador de audio, método para proporcionar una señal de audio decodificada, método para proporcionar una señal de audio codificada, flujo de audio, proveedor de flujos de audio y programa informático que utiliza un identificador de flujo
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
KR20200000649A (ko) 2018-06-25 2020-01-03 네이버 주식회사 오디오 병렬 트랜스코딩을 위한 방법 및 시스템
TWI672911B (zh) * 2019-03-06 2019-09-21 瑞昱半導體股份有限公司 解碼方法及相關電路
CN111757168B (zh) * 2019-03-29 2022-08-19 腾讯科技(深圳)有限公司 音频解码方法、装置、存储介质及设备
US11024322B2 (en) * 2019-05-31 2021-06-01 Verizon Patent And Licensing Inc. Methods and systems for encoding frequency-domain data

Family Cites Families (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222189A (en) 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5835792A (en) 1993-06-24 1998-11-10 Discovision Associates Token-based adaptive video processing arrangement
US5659659A (en) 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
CN1126264C (zh) * 1996-02-08 2003-10-29 松下电器产业株式会社 宽频带声音信号编码装置和宽频带声音信号编码解码装置
JP3305190B2 (ja) * 1996-03-11 2002-07-22 富士通株式会社 データ圧縮装置及びデータ復元装置
US6269338B1 (en) 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
JP3367370B2 (ja) 1997-03-14 2003-01-14 三菱電機株式会社 適応符号化方法
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
JPH11225078A (ja) * 1997-09-29 1999-08-17 Canon Inf Syst Res Australia Pty Ltd データ圧縮方法及び装置
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
CA2246532A1 (en) 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
DE19840835C2 (de) 1998-09-07 2003-01-09 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern
JP4504572B2 (ja) 1999-01-13 2010-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 符号化された信号への補足データの組み込み
DE19910621C2 (de) * 1999-03-10 2001-01-25 Thomas Poetter Vorrichtung und Verfahren zum Verbergen von Informationen und Vorrichtung und Verfahren zum Extrahieren von Informationen
US6751641B1 (en) 1999-08-17 2004-06-15 Eric Swanson Time domain data converter with output frequency domain conversion
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP2001119302A (ja) 1999-10-15 2001-04-27 Canon Inc 符号化装置、復号装置、情報処理システム、情報処理方法、及び記憶媒体
US7260523B2 (en) 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
US20020016161A1 (en) 2000-02-10 2002-02-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for compression of speech encoded parameters
US6677869B2 (en) 2001-02-22 2004-01-13 Panasonic Communications Co., Ltd. Arithmetic coding apparatus and image processing apparatus
US6538583B1 (en) * 2001-03-16 2003-03-25 Analog Devices, Inc. Method and apparatus for context modeling
EP1405303A1 (en) 2001-06-28 2004-04-07 Koninklijke Philips Electronics N.V. Wideband signal transmission system
US20030093451A1 (en) 2001-09-21 2003-05-15 International Business Machines Corporation Reversible arithmetic coding for quantum data compression
DE10204617B4 (de) * 2002-02-05 2005-02-03 Siemens Ag Verfahren und Vorrichtungen zur Kompression und Dekompression eines Videodatenstroms
JP2003255999A (ja) 2002-03-06 2003-09-10 Toshiba Corp 符号化デジタルオーディオ信号の変速再生装置
JP4090862B2 (ja) * 2002-04-26 2008-05-28 松下電器産業株式会社 可変長符号化方法および可変長復号化方法
PT1467491E (pt) * 2002-05-02 2007-03-30 Fraunhofer Ges Forschung Codificação aritmética de coeficientes de transformação
US7242713B2 (en) 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
GB2388502A (en) 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
DE20321883U1 (de) * 2002-09-04 2012-01-20 Microsoft Corp. Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes
US7328150B2 (en) 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
AU2003272833A1 (en) * 2002-09-17 2004-04-08 Vladimir Ceperkovic Fast codec with high compression ratio and minimum required resources
FR2846179B1 (fr) 2002-10-21 2005-02-04 Medialive Embrouillage adaptatif et progressif de flux audio
US6646578B1 (en) * 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method
AU2003208517A1 (en) 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US6900748B2 (en) 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7562145B2 (en) 2003-08-28 2009-07-14 International Business Machines Corporation Application instance level workload distribution affinities
JP2005130099A (ja) 2003-10-22 2005-05-19 Matsushita Electric Ind Co Ltd 算術復号装置、算術符号化装置、算術符号化・復号装置、携帯端末装置、動画像撮影装置、及び、動画像記録・再生装置
JP2005184232A (ja) 2003-12-17 2005-07-07 Sony Corp 符号化装置、プログラム、およびデータ処理方法
JP4241417B2 (ja) * 2004-02-04 2009-03-18 日本ビクター株式会社 算術復号化装置、および算術復号化プログラム
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
KR20050087956A (ko) 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
US20090299756A1 (en) 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
WO2005086139A1 (en) 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
US7577844B2 (en) 2004-03-17 2009-08-18 Microsoft Corporation Systems and methods for encoding randomly distributed features in an object
CN100584023C (zh) * 2004-07-14 2010-01-20 新加坡科技研究局 用于基于上下文的信号编码和解码的方法和设备
KR100624432B1 (ko) * 2004-08-05 2006-09-19 삼성전자주식회사 내용 기반 적응적 이진 산술 복호화 방법 및 장치
US20060047704A1 (en) 2004-08-31 2006-03-02 Kumar Chitra Gopalakrishnan Method and system for providing information services relevant to visual imagery
RU2387024C2 (ru) 2004-11-05 2010-04-20 Панасоник Корпорэйшн Кодер, декодер, способ кодирования и способ декодирования
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR100829558B1 (ko) * 2005-01-12 2008-05-14 삼성전자주식회사 스케일러블 오디오 데이터 산술 복호화 방법 및 장치와스케일러블 오디오 비트스트림 절단 방법
CA2590705A1 (en) 2005-01-14 2006-07-20 Sungkyunkwan University Methods of and apparatuses for adaptive entropy encoding and adaptive entropy decoding for scalable video encoding
WO2006107837A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
KR100694098B1 (ko) 2005-04-04 2007-03-12 한국과학기술원 산술 복호 방법 및 그 장치
KR100703773B1 (ko) 2005-04-13 2007-04-06 삼성전자주식회사 향상된 코딩 효율을 갖는 엔트로피 코딩 및 디코딩 방법과이를 위한 장치, 이를 포함하는 비디오 코딩 및 디코딩방법과 이를 위한 장치
US7196641B2 (en) 2005-04-26 2007-03-27 Gen Dow Huang System and method for audio data compression and decompression using discrete wavelet transform (DWT)
ATE433182T1 (de) 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US20070036228A1 (en) 2005-08-12 2007-02-15 Via Technologies Inc. Method and apparatus for audio encoding and decoding
US20080221907A1 (en) 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP1932361A1 (en) * 2005-10-03 2008-06-18 Nokia Corporation Adaptive variable length codes for independent variables
US20070094035A1 (en) 2005-10-21 2007-04-26 Nokia Corporation Audio coding
KR100803206B1 (ko) 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
EP1995974B1 (en) 2005-12-05 2015-05-20 Huawei Technologies Co., Ltd. Method for realizing arithmetic coding
CN101133649B (zh) * 2005-12-07 2010-08-25 索尼株式会社 编码装置、编码方法以及解码装置、解码方法
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
US7283073B2 (en) 2005-12-19 2007-10-16 Primax Electronics Ltd. System for speeding up the arithmetic coding processing and method thereof
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007080225A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US7983343B2 (en) * 2006-01-12 2011-07-19 Lsi Corporation Context adaptive binary arithmetic decoding for high definition video
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR100774585B1 (ko) 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US7948409B2 (en) 2006-06-05 2011-05-24 Mediatek Inc. Automatic power control system for optical disc drive and method thereof
US8306125B2 (en) * 2006-06-21 2012-11-06 Digital Video Systems, Inc. 2-bin parallel decoder for advanced video processing
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8706507B2 (en) 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US7554468B2 (en) 2006-08-25 2009-06-30 Sony Computer Entertainment Inc, Entropy decoding methods and apparatus using most probable and least probable signal cases
JP4785706B2 (ja) 2006-11-01 2011-10-05 キヤノン株式会社 復号装置及び復号方法
DE102007017254B4 (de) 2006-11-16 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Kodieren und Dekodieren
US20080243518A1 (en) 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
KR100868763B1 (ko) 2006-12-04 2008-11-13 삼성전자주식회사 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
US7365659B1 (en) 2006-12-06 2008-04-29 Silicon Image Gmbh Method of context adaptive binary arithmetic coding and coding apparatus using the same
ES2474915T3 (es) 2006-12-13 2014-07-09 Panasonic Intellectual Property Corporation Of America Dispositivo de codificación, dispositivo de decodificación y métodos correspondientes
CN101231850B (zh) 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
KR101365989B1 (ko) 2007-03-08 2014-02-25 삼성전자주식회사 트리 구조를 기반으로 한 엔트로피 부호화 및 복호화 장치및 방법
US7498960B2 (en) * 2007-04-19 2009-03-03 Analog Devices, Inc. Programmable compute system for executing an H.264 binary decode symbol instruction
JP2008289125A (ja) 2007-04-20 2008-11-27 Panasonic Corp 算術復号化装置及びその方法
ES2452348T3 (es) 2007-04-26 2014-04-01 Dolby International Ab Aparato y procedimiento para sintetizar una señal de salida
US7813567B2 (en) * 2007-04-26 2010-10-12 Texas Instruments Incorporated Method of CABAC significance MAP decoding suitable for use on VLIW data processors
JP4748113B2 (ja) 2007-06-04 2011-08-17 ソニー株式会社 学習装置および学習方法、並びにプログラムおよび記録媒体
JP5291096B2 (ja) * 2007-06-08 2013-09-18 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN101743586B (zh) 2007-06-11 2012-10-17 弗劳恩霍夫应用研究促进协会 音频编码器、编码方法、解码器、解码方法
US8521540B2 (en) 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
US20110116542A1 (en) * 2007-08-24 2011-05-19 France Telecom Symbol plane encoding/decoding with dynamic calculation of probability tables
US7839311B2 (en) 2007-08-31 2010-11-23 Qualcomm Incorporated Architecture for multi-stage decoding of a CABAC bitstream
TWI351180B (en) * 2007-09-29 2011-10-21 Novatek Microelectronics Corp Data encoding/decoding method and related apparatus capable of lowering signal power spectral density
US7777654B2 (en) 2007-10-16 2010-08-17 Industrial Technology Research Institute System and method for context-based adaptive binary arithematic encoding and decoding
US8527265B2 (en) 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8515767B2 (en) 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US7714753B2 (en) 2007-12-11 2010-05-11 Intel Corporation Scalable context adaptive binary arithmetic coding
US8631060B2 (en) 2007-12-13 2014-01-14 Qualcomm Incorporated Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8600740B2 (en) 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
JP4893657B2 (ja) 2008-02-29 2012-03-07 ソニー株式会社 算術復号装置
WO2009110738A2 (ko) 2008-03-03 2009-09-11 엘지전자(주) 오디오 신호 처리 방법 및 장치
CN102789784B (zh) 2008-03-10 2016-06-08 弗劳恩霍夫应用研究促进协会 操纵具有瞬变事件的音频信号的方法和设备
JP5449133B2 (ja) * 2008-03-14 2014-03-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
KR101247891B1 (ko) 2008-04-28 2013-03-26 고리츠다이가쿠호징 오사카후리츠다이가쿠 물체 인식용 화상 데이터베이스의 작성 방법, 처리 장치 및 처리용 프로그램
US7864083B2 (en) 2008-05-21 2011-01-04 Ocarina Networks, Inc. Efficient data compression and decompression of numeric sequences
ES2934052T3 (es) 2008-07-11 2023-02-16 Fraunhofer Ges Forschung Codificador de audio y decodificador de audio
EP2346029B1 (en) * 2008-07-11 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and corresponding computer program
US7714754B2 (en) * 2008-07-14 2010-05-11 Vixs Systems, Inc. Entropy decoder with pipelined processing and methods for use therewith
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
JPWO2010016270A1 (ja) 2008-08-08 2012-01-19 パナソニック株式会社 量子化装置、符号化装置、量子化方法及び符号化方法
US20100088090A1 (en) * 2008-10-08 2010-04-08 Motorola, Inc. Arithmetic encoding for celp speech encoders
US7932843B2 (en) 2008-10-17 2011-04-26 Texas Instruments Incorporated Parallel CABAC decoding for video decompression
US7982641B1 (en) 2008-11-06 2011-07-19 Marvell International Ltd. Context-based adaptive binary arithmetic coding engine
GB2466666B (en) * 2009-01-06 2013-01-23 Skype Speech coding
KR101622950B1 (ko) 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
CA2763793C (en) 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
MY163358A (en) 2009-10-08 2017-09-15 Fraunhofer-Gesellschaft Zur Förderung Der Angenwandten Forschung E V Multi-mode audio signal decoder,multi-mode audio signal encoder,methods and computer program using a linear-prediction-coding based noise shaping
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
BR112012009445B1 (pt) 2009-10-20 2023-02-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método para codificar uma informação de áudio, método para decodificar uma informação de áudio que utiliza uma detecção de um grupo de valores espectrais previamente decodificados
US8149144B2 (en) * 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
CN102859583B (zh) * 2010-01-12 2014-09-10 弗劳恩霍弗实用研究促进协会 利用对数值先前脉络值的数字表示之修改的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法
CN102131081A (zh) 2010-01-13 2011-07-20 华为技术有限公司 混合维度编解码方法和装置
AU2011287747B2 (en) * 2010-07-20 2015-02-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an optimized hash table
EP2619758B1 (en) 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis
US20120207400A1 (en) * 2011-02-10 2012-08-16 Hisao Sasai Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus
US8170333B2 (en) * 2011-10-13 2012-05-01 University Of Dayton Image processing systems employing image compression

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Neuendorf Max, et al., "A Novel Scheme for Low Bitrate Unified Speech and Audio Coding AA A MPEG RMO", AES CONVENTION 126, NEW YORK , USA, 1 May 2009 (2009-05-01) Eunju. Imm, et al., "Lossless coding of audio spectral coefficients using selective bitplane coding," 9th IEEE International Symposium on Communication and Information Technology (ISCIT 2009), NJ, USA, 28 September 2009 (2009-09-28), pp.525-530. *

Also Published As

Publication number Publication date
CA2778368C (en) 2016-01-26
EP2491552A1 (en) 2012-08-29
JP5589084B2 (ja) 2014-09-10
ZA201203607B (en) 2013-01-30
AU2010309821A1 (en) 2012-06-07
KR20120074312A (ko) 2012-07-05
US20230162742A1 (en) 2023-05-25
TWI426504B (zh) 2014-02-11
US8612240B2 (en) 2013-12-17
HK1175290A1 (zh) 2013-06-28
JP2013508762A (ja) 2013-03-07
ZA201203609B (en) 2013-01-30
BR112012009445B1 (pt) 2023-02-14
ZA201203610B (en) 2013-01-30
BR122022013482B1 (pt) 2023-04-04
CN102667921A (zh) 2012-09-12
MY188408A (en) 2021-12-08
CN102667923A (zh) 2012-09-12
MX2012004572A (es) 2012-06-08
CA2907353C (en) 2018-02-06
JP2013508764A (ja) 2013-03-07
CA2907353A1 (en) 2011-04-28
TW201137857A (en) 2011-11-01
CN102667922B (zh) 2014-09-10
WO2011048099A1 (en) 2011-04-28
RU2605677C2 (ru) 2016-12-27
CA2778323A1 (en) 2011-04-28
BR112012009446B1 (pt) 2023-03-21
KR101419148B1 (ko) 2014-07-11
US9978380B2 (en) 2018-05-22
AR078706A1 (es) 2011-11-30
RU2012122278A (ru) 2013-11-27
PL2491554T3 (pl) 2014-08-29
TW201129969A (en) 2011-09-01
RU2012122275A (ru) 2013-11-27
CN102667923B (zh) 2014-11-05
JP5245014B2 (ja) 2013-07-24
CN102667921B (zh) 2014-09-10
RU2591663C2 (ru) 2016-07-20
CA2778323C (en) 2016-09-20
BR112012009446A2 (zh) 2021-12-07
EP2491554B1 (en) 2014-03-05
CA2778368A1 (en) 2011-04-28
KR101411780B1 (ko) 2014-06-24
US20120265540A1 (en) 2012-10-18
US11443752B2 (en) 2022-09-13
MY160813A (en) 2017-03-31
US20120330670A1 (en) 2012-12-27
JP5707410B2 (ja) 2015-04-30
US8655669B2 (en) 2014-02-18
ES2610163T3 (es) 2017-04-26
AR078705A1 (es) 2011-11-30
PT2491553T (pt) 2017-01-20
TW201137858A (en) 2011-11-01
EP2491554A1 (en) 2012-08-29
US20180174593A1 (en) 2018-06-21
RU2596596C2 (ru) 2016-09-10
ES2531013T3 (es) 2015-03-10
US20120278086A1 (en) 2012-11-01
MY160807A (en) 2017-03-31
RU2012122277A (ru) 2013-11-27
PL2491552T3 (pl) 2015-06-30
KR101419151B1 (ko) 2014-07-11
BR112012009448A2 (pt) 2022-03-08
EP2491552B1 (en) 2014-12-31
ES2454020T3 (es) 2014-04-09
US8706510B2 (en) 2014-04-22
TWI430262B (zh) 2014-03-11
AU2010309820B2 (en) 2014-05-08
MX2012004569A (es) 2012-06-08
CN102667922A (zh) 2012-09-12
MX2012004564A (es) 2012-06-08
BR122022013496B1 (pt) 2023-05-16
BR122022013454B1 (pt) 2023-05-16
PL2491553T3 (pl) 2017-05-31
AU2010309820A1 (en) 2012-06-07
WO2011048098A1 (en) 2011-04-28
CA2778325A1 (en) 2011-04-28
US20140081645A1 (en) 2014-03-20
EP2491553A1 (en) 2012-08-29
AU2010309898A1 (en) 2012-06-07
HK1175289A1 (zh) 2013-06-28
BR112012009445A2 (pt) 2022-03-03
EP2491553B1 (en) 2016-10-12
AR078707A1 (es) 2011-11-30
KR20120074306A (ko) 2012-07-05
WO2011048100A1 (en) 2011-04-28
CA2778325C (en) 2015-10-06
KR20120074310A (ko) 2012-07-05
JP2013508763A (ja) 2013-03-07

Similar Documents

Publication Publication Date Title
TWI451403B (zh) 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式
TWI466103B (zh) 音訊編碼器、音訊解碼器、用以將音訊資訊編碼的方法、用以將音訊資訊解碼的方法、及使用描述有效狀態值及區間邊界二者之散列表的電腦程式
AU2010309821B2 (en) Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction