TW201222531A - Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program - Google Patents

Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program Download PDF

Info

Publication number
TW201222531A
TW201222531A TW100128857A TW100128857A TW201222531A TW 201222531 A TW201222531 A TW 201222531A TW 100128857 A TW100128857 A TW 100128857A TW 100128857 A TW100128857 A TW 100128857A TW 201222531 A TW201222531 A TW 201222531A
Authority
TW
Taiwan
Prior art keywords
audio
encoding
unit
frame
decoding
Prior art date
Application number
TW100128857A
Other languages
English (en)
Other versions
TWI476762B (zh
Inventor
Kei Kikuiri
Choong Seng Boon
Original Assignee
Ntt Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo Inc filed Critical Ntt Docomo Inc
Publication of TW201222531A publication Critical patent/TW201222531A/zh
Application granted granted Critical
Publication of TWI476762B publication Critical patent/TWI476762B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

201222531 六、發明說明: 【發明所屬之技術領域】 本發明的種種側面係有關於音訊解碼裝置、音訊解碼 方法、音訊解碼程式、音訊編碼裝置、音訊編碼方法、及 音訊編碼程式。 - 【先前技術】 爲了有效率地將語音訊號和音樂訊號雙方加以編碼, 將適合於語音訊號的編碼處理和適合於音樂訊號的編碼處 理進行切換而利用的複合型之音訊編碼方式,是有效的。 下記專利文獻1中係記載著此種複合型之音訊編碼方 式。專利文獻1所記載的音訊編碼方式中,是對每一框架 ,附加上表示該當訊框中的編碼序列之生成時所使用之編 碼處理的資訊。 又,在 MPEG US AC ( Unified Speech and Audio Coding )的音訊編碼中,會使用到三種編碼處理,亦即
- FD ( Modified A AC ( Advanced Audio Coding ) ) 、TCX (transform coded excitation ) 、ACELP ( Algebraic Code
Excited L i ne ar Pre di ctiοn )。在 ΜPEG U S AC 中,TCX 與 ACELP是被整合成一組而定義成LPD。在MPEG USAC中 ’爲了表示是FD被使用過還是LPD被使用過,而對各訊 框附加有1位元之資訊。又,在MPEG U SAC中,若使用 LPD ’則爲了規定將TCX與ACELP加以組合而利用之程 序’而對各訊框附加有4位元之資訊。 -5- 201222531 又,在第3世代行動電話系統(3GPP )的AMR-WB + (Extended Adaptive Multi-Rate Wideband )中,是使用 到二種編碼處理,亦即TCX及ACELP。在AMR-WB +中 ,爲了規定TCX或ACELP之使用,而對各訊框附加有2 位元之資訊。 [先前技術文獻] [專利文獻] [專利文獻1]日本特開2000-267699號公報 容 內 明 發 [發明所欲解決之課題] 音訊訊號,是有時候是以人的發聲爲基礎的訊號亦即 語音訊號爲中心,有時候是以音樂訊號爲中心。若將此種 音訊訊號加以編碼,則可能會利用到複數訊框共通的編碼 處理。對於此種音訊訊號,能夠從編碼側往解碼側更有效 率地傳達資訊的手法,是被需求的。 本發明的各種側面係爲,目的在於提供一種,能夠生 成大小較小之串流的音訊編碼裝置、音訊編碼方法 '及音 訊編碼程式,以及能夠使用大小較小之串流的音訊解碼裝 置、音訊解碼方法、及音訊解碼程式。 [用以解決課題之手段] 本發明的一側面,係有關於音訊編碼,可包含以下的 -6- 201222531 音訊編碼裝置、音訊編碼方法、及音訊編碼程式。 本發明之一側面所述之音訊編碼裝置,係具備:複數 編碼部'選擇部、生成部、及輸出部。複數編碼部,係執 行彼此互異之音訊編碼處理,以從音訊訊號生成編碼序列 。選擇部’係在複數編碼部當中,選擇出複數訊框之音訊 訊號之編碼時所要共通使用的編碼部,或選擇出,分別含 有複數訊框的複數超級訊框之音訊訊號之編碼時所要共通 使用的一組編碼部。生成部,係生成長期編碼處理資訊。 長期編碼處理資訊,係爲對複數訊框的單一資訊,是一用 來表示該當複數訊框之編碼序列之生成時曾經使用過共通 之音訊編碼處理的資訊。或者,長期編碼處理資訊,係爲 對複數超級訊框的單一資訊,是一用來表示該當複數超級 訊框之編碼序列之生成時曾經使用過共通之一組音訊編碼 處理的資訊。輸出部,係輸出串流,其中含有:已被選擇 部所選擇之編碼部所生成的上記複數訊框之編碼序列、或 已被選擇部所選擇之一組編碼部所生成的上記複數超級訊 框之編碼序列、和長期編碼處理資訊。 本發明之一側面所述之音訊編碼方法’係含有:(a )在彼此互異之複數音訊編碼處理當中,選擇出複數訊框 之音訊訊號之編碼時所要共通使用的音訊編碼處理’或在 複數音訊編碼處理當中’選擇出分別含有複數訊框的複數 超級訊框之音訊訊號之編碼時所要共通使用的一組音訊編 碼處理的步驟:和(b)使用已被選擇之音訊編碼處理來 將上記複數訊框之音訊訊號予以編碼以生成該當複數訊框 201222531 之編碼序列,或使用已被選擇之一組音訊編碼處理來將上 記複數超級訊框之音訊訊號予以編碼以生成該當複數超級 訊框之編碼序列的步驟:和(C)生成:對上記複數訊框 的單一之長期編碼處理資訊,該當長期編碼處理資訊係表 示該複數訊框的編碼序列之生成時曾經使用過共通之音訊 編碼處理,或對上記複數超級訊框的單一之長期編碼處理 資訊,該當長期編碼處理資訊係表示該複數超級訊框的編 碼序列之生成時曾經使用過共通之一組音訊編碼處理的步 驟;和(d)將含有:上記複數訊框之編碼序列、或上記 複數超級訊框之編碼序列、和上記長期編碼處理資訊的串 流,予以輸出的步驟。 本發明之一側面所述之音訊編碼程式,係使電腦發癉 機能而成爲複數編碼部、選擇部、生成部、及輸出部。 若依據本發明之一側面所述之音訊編碼裝置、音訊編 碼方法,及音訊編碼程式,則可藉由長期編碼處理資訊來 通知,在編碼側中,複數訊框之編碼序列之生成時曾經使 用過共通之音訊編碼處理,或複數超級訊框之編碼序列之 生成時曾經使用過共通之一組音訊編碼處理之事實。又, 藉由該長期編碼處理資訊之通知,在解碼側上就可選擇共 通之音訊解碼處理、或共通之一組音訊解碼處理。因此, 可以降低串流內所含有之用來特定音訊編碼處理所需的資 訊量。 於一實施形態中,亦可爲,於串流中,至少在複數訊 框當中,比開頭訊框後面的後續訊框裡,不含有用來特定 -8- 201222531 該當後續訊框之編碼序列之生成時所曾經使用過之音訊編 碼處理所需的資訊。 於一實施形態中,亦可對上記複數訊框’在複數編碼 部(或複數音訊編碼處理)當中選擇出所定之編碼部(或 所定之音訊編碼處理),串流裡係亦可不含有,用來特定 上記複數訊框之編碼序列之生成時所曾經使用過之音訊編 碼處理所需的資訊。若依據此形態,則可再降低串流的資 訊量。又,於一實施形態中,長期編碼處理資訊係亦可爲 1位元之資訊。若依據此形態,則可更加降低串流的資訊 量。 本發明的另一側面係有關於音訊解碼,可包含音訊解 碼裝置、音訊解碼方法、及音訊解碼程式。 本發明之另一側面所述之音訊解碼裝置,係具備:複 數解碼部、抽出部、及選擇部。複數解碼部,係執行彼此 互異之音訊解碼處理,以從編碼序列生成音訊訊號。抽出 部,係從串流中抽出長期編碼處理資訊。串流係具有,分 別含有音訊訊號之編碼序列的複數訊框,及/或分別含有 複數訊框的複數超級訊框。長期編碼處理資訊,係爲對複 數訊框的單一之長期編碼處理資訊,是表示該當複數訊框 之編碼序列之生成時曾經使用過共通之音訊編碼處理。或 者,長期編碼處理資訊,係爲對複數超級訊框的單一之長 期編碼處理資訊,是表示該當複數超級訊框之編碼序列之 生成時曾經使用過共通之一組音訊編碼處理。選擇部,係 隨著長期編碼處理資訊已被抽出之事實,而在複數解碼部 -9- 201222531 當中’選擇出複數訊框之編碼序列之解碼時所要共通使用 的解碼部。或者,選擇部係在複數解碼部當中,選擇出複 數超級訊框之編碼序列之解碼時所要共通使用的一組解碼 部。 本發明之另一側面所述之音訊解碼方法,係含有:( a)從具有分別含有音訊訊號之編碼序列的複數訊框及/或 分別含有複數訊框的複數超級訊框的串流中,抽出:對該 當複數訊框的單一之長期編碼處理資訊,此長期編碼處理 資訊係表示該當複數訊框的編碼序列之生成時曾經使用過 共通之音訊編碼處理,或對該當複數超級訊框的單一之長 期編碼處理資訊,此長期編碼處理資訊係表示該當複數超 級訊框的編碼序列之生成時曾經使用過共通之一組音訊編 碼處理的步驟;和(b)隨著長期編碼處理資訊已被抽出 之事實,在彼此互異之複數音訊解碼處理當中,選擇出上 記複數訊框之編碼序列之解碼時所要共通使用的音訊解碼 處理,或在該當複數音訊解碼處理當中,選擇出上記複數 超級訊框之編碼序列之解碼時所要共通使用的一組音訊解 碼處理的步驟;和(c)使用已被選擇之音訊解碼處理來 將上記複數訊框之編碼序列予以解碼,或使用已被選擇之 上記一組音訊解碼處理來將上記複數超級訊框之編碼序列 予以解碼的步驟》 本發明之另一側面所述之音訊解碼程式,係使電腦發 揮機能而成爲複數解碼部、抽出部、及選擇部。 若依據本發明之另一側面所述之音訊解碼裝置、音訊 -10- 201222531 解碼方法,及音訊解碼程式,則可從基於上述有關編碼之 本發明之一側面所生成的串流’生成音訊訊號。 於一實施形態中’亦可爲,於串流中,至少在複數訊 框當中,比開頭訊框後面的後續訊框裡’不含有用來特定 該當後續訊框之編碼序列之生成時所曾經使用過之音訊編 碼處理所需的資訊。 於一實施形態中’亦可對上記複數訊框,在複數解碼 部(或複數音訊解碼處理)當中選擇出所定之解碼部(或 所定之音訊解碼處理)’串流裡係亦可不含有,用來特定 上記複數訊框之編碼序列之生成時所曾經使用過之音訊編 碼處理所需的資訊。若依據此形態,則可再降低串流中的 資訊量。又,於一實施形態中,長期編碼處理資訊係亦可 爲1位元之資訊。若依據此形態,則可更降低串流中的資 訊量。 [發明效果] 如以上說明,若依據本發明的各種側面,則可提供一 種,能夠生成大小較小之串流的音訊編碼裝置、音訊編碼 方法、及音訊編碼程式,以及能夠使用大小較小之串流的 音訊解碼裝置、音訊解碼方法、及音訊解碼程式。 【實施方式】 以下,參照圖面而詳細說明各種實施形態。此外,對 於各圖面中同一或相當之部分係標示同一符號。 -11 - 201222531 圖1係一實施形態所述之音訊編碼裝置的圖示。圖1 所示的音訊編碼裝置10,係可將被輸入至輸入端子In 1 的複數訊框之音訊訊號,使用共通之音訊編碼處理進行編 碼。如圖1所不·音訊編碼裝置10係具備:複數編碼部 l〇ai〜10an、選擇部10b、生成部10c、及輸出部l〇d。此 處,η係爲2以上之整數。 編碼部l〇ai〜l〇an,係執行彼此互異之音訊編碼處理 ,以從音訊訊號生成編碼序列。這些音訊編碼處理中,係 可採用任意的音訊編碼處理。例如,作爲音訊編碼處理係 可使用Modified AAC編碼處理、ACELP編碼處理 '及 TCX編碼處理。 選擇部10b,係隨著被輸入至輸入端子In2的輸入資 訊,而再編碼部l〇ai〜10 an當中選擇出一個編碼部。輸 入資訊係例如是被使用者所輸入。於一實施形態中,該輸 入資訊係可爲,用來特定出複數訊框之音訊訊號所被共通 使用之音訊編碼處理用的資訊。選擇部1 Ob,係可控制著 開關SW,在編碼部l〇ai〜10an當中,把執行被輸入資訊 所特定之音訊編碼處理的編碼部與輸入端子Ini做結合。 生成部l〇c,係基於輸入資訊而生成長期編碼處理資 訊。長期編碼處理資訊,係爲表示複數訊框之編碼序列之 生成時曾經使用過共通之音訊編碼處理的資訊。又,長期 編碼處理資訊係亦可爲,可在解碼側上識別之獨特字元。 又,在一實施形態中,亦可爲,能夠在解碼側上特定出複 數訊框之編碼序列之生成時所曾共通使用過的音訊編碼處 -12- 201222531 理的資訊。 輸出部10d,係將含有已被選擇之編碼部所生成之複 數訊框之編碼序列、及生成部l〇c所生成之長期編碼處理 資訊的串流,予以輸出。 圖2係一實施形態所述之音訊編碼裝置所生成之串流 的圖示。圖2所示的串流,係含有第1〜第m的複數訊框 。此處,m係爲2以上之整數。以下,有些時候會將串流 中的訊框,稱爲輸出訊框。各輸出訊框中係含有,在輸入 音訊訊號中,從該當輸出訊框所對應之訊框的音訊訊號所 生成的編碼序列。又,串流的第1訊框中,可附加有長期 編碼處理資訊來作爲參數資訊。 以下,說明音訊編碼裝置1 〇之動作,和一實施形態 的音訊編碼方法。圖3係一實施形態所述之音訊編碼方法 的流程圖。如圖3所示,於一實施形態中,在步驟S10-1 中,選擇部l〇b會基於輸入資訊而在編碼部l〇ai〜10an 當中選擇出一個編碼部。 接著,在步驟S10-2中,生成部l〇c係基於輸入資訊 而生成長期編碼處理資訊。在後續的步驟S10-3中,輸出 部1 〇d係對第1訊框附加長期編碼處理資訊來作爲參數資 訊。 接著,在步驟S10-4中,已被選擇部l〇b所選擇的編 碼部,係將目前編碼對象之訊框的音訊訊號加以編碼,生 成編碼序列。在後續的步驟S10-5中,輸出部l〇d係使編 碼對象之訊框所對應的串流內的輸出訊框中,含有由編碼 -13- 201222531 部所生成之編碼序列,將該當輸出訊框予以輸出。 於後續的步驟S10-5中,係會進行是否還有尙未 之訊框存在的判定。若沒有尙未編碼之訊框存在,則 處理。另一方面,若還有應編碼的訊框存在時,則以 編碼之訊框爲對象而繼續從步驟S1 0-4起的一連串處 若依據以上所說明的音訊編碼裝置10及一實施 的音訊編碼方法,則只有串流的第1訊框會含有長期 處理資訊。亦即,在串流中,第2訊框以後的訊框裡 含有用來特定上記複數訊框之編碼序列之生成時所曾 用過之音訊編碼處理所需的資訊。因此,可生成大小 之有效率的串流。 以下說明,使電腦動作成爲音訊編碼裝置10的 。圖4係一實施形態所述之音訊編碼程式的圖示。圖 —實施形態所述之電腦的硬體構成之圖示。圖6係一 形態所述之電腦的斜視圖。圖4所示的音訊編碼程式 ,係可使圖5所示的電腦C10,成爲音訊編碼裝置i 動作。此外,本說明書中所說明的程式,係不限定於 所示的電腦,亦可是行動電話、攜帶型資訊終端這類 裝置,依照該當程式而動作。 音訊編碼程式P10,係可被儲存在記錄媒體SM 提供。此外,作爲記錄媒體SM則例如有,軟碟片、 ROM、DVD、或ROM等記錄媒體,或是半導體記憶 〇 如圖5所示,電腦C10係可具備:軟碟片驅動裝 編碼 結束 尙未 理。 形態 編碼 ,不 經使 較小 程式 5係 實施 P 1 0 〇而 圖5 任意 中來 CD- 體等 置、 -14- 201222531 CD-ROM驅動裝置、DVD驅動裝置等讀取裝置C12、讓作 業系統常駐的作業用記憶體(RAM ) C 1 4、用來記憶記錄 媒體SM中所記憶之程式的記憶體C16、顯示器這類顯示 裝置C18、屬於輸入裝置的滑鼠C20及鍵盤C22、進行資 料收送用的通訊裝置C24、控制著程式之執行的CPU C26 〇 電腦CIO,係一旦把記錄媒體SM插入至讀取裝置 C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的 音訊編碼程式P10進行存取,藉由該當程式P10,就可成 爲音訊編碼裝置10而動作。 如圖6所示,音訊編碼程式P10,係可以被重疊於載 波之電腦資料訊號CW的方式,透過網路而提供。此時, 電腦c 1 0,係可將通訊裝置C24所接收到的音訊編碼程式 P 1 〇儲存在記憶體C 1 6,執行程式P 1 0。 如圖4所示,音訊編碼程式P10係具備:複數編碼模 組Ml〇ai〜M10an、選擇模組M10b、生成模組MIOc、及 輸出模組Μ 1 0 d。 於一實施形態中,編碼模組部Ml〇ai〜M10an、選擇 模組Μ 1 Ob、生成模組Μ 1 0c、輸出模組Μ 1 0d,係令電腦 C10執行分別與編碼部l〇ai〜l〇an、選擇部l〇b、生成部 l〇c、輸出部l〇d相同的機能。若依據所述之音訊編碼程 式P10,則電腦C10係可成爲音訊編碼裝置10而動作。 此處說明音訊編碼裝置1 0的變形樣態。圖7係變形 樣態所述之音訊編碼裝置的圖示。在音訊編碼裝置10中 -15- 201222531 ’雖然基於輸入資訊來選擇編碼部(編碼處理),但在圖 7所示的音訊編碼裝置1 〇 A中,則是基於音訊訊號的解析 結果來選擇編碼部。因此,音訊編碼裝置10A係具備有 解析部1 0 e。 解析部10e,係解析複數訊框的音訊訊號,決定最適 合該當複數訊框之音訊訊號之編碼的音訊編碼處理。解析 部l〇e,係將用來特定已決定之音訊編碼處理的資訊,給 予選擇部10b,令選擇部10b選擇會執行該當音訊編碼處 理的編碼部。又,解析部l〇e,係將用來特定已決定之音 訊編碼處理的資訊,送至生成部10c,令生成部10c生成 長期編碼處理資訊β 解析部1 〇e係可解析例如音訊訊號的音調性、音高週 期、時間包絡、過渡之成分(訊號突然上揚/下挫)。例 如,解析部l〇e係當音訊訊號的音調性是比所定之音調性 還要強時,就決定使用會進行頻率領域之編碼的音訊編碼 處理。又,解析部l〇e係例如,若音訊訊號的音高週期是 在所定範圍內,則可決定使用適合於該當音訊訊號之編碼 的音訊編碼處理。甚至,解析部l.〇e係例如,當音訊訊號 的時間包絡之變動是大於所定變動時,或音訊訊號是含有 過渡成分時,就決定使用會進行時間領域之編碼的音訊編 碼處理。 以下,說明可將音訊編碼裝置10所生成之串流予以 解碼的音訊解碼裝置。圖8係一實施形態所述之音訊解碼 裝置的圖示。如圖8所示,音訊解碼裝置12係具備:複 •16- 201222531 數解碼部12a!〜12an、抽出部12b、及選擇部12c。解碼 部12ai〜 12an,係執行彼此互異之音訊解碼處理’以從編 碼序列生成音訊訊號。解碼部12ai〜 12an的處理’係爲 分別與編碼部lOai- 10an之處理相對稱之處理。 抽出部12b,係從被輸入至輸入端子In的串流中’ 抽出長期編碼處理資訊(參照圖3)。抽出部12b,係將 所抽出的長期編碼處理資訊,送至選擇部12c,將摘除了 長期編碼處理資訊的串流的剩餘部分,輸出至開關SW。 選擇部12c,係基於長期編碼處理資訊而控制開關 SW。選擇部12c,係在解碼部12ai〜12an當中,選擇會 執行基於長期編碼處理資訊所特定之編碼處理的解碼部。 又,選擇部1 2c係控制開關SW,使得串流中所含之複數 訊框會被已選擇之解碼部所結合。 以下,說明音訊解碼裝置1 2之動作,及一實施形態 所述之音訊解碼方法。圖9係一實施形態所述之音訊解碼 方法的流程圖。如圖9所示,在一實施形態中,係於步驟 S1 2-1中,抽出部12b會從串流中抽出長期編碼處理資訊 。接著於步驟S12-2中,選擇部12c會隨著已被抽出的長 期編碼處理資訊,而從解碼部12ai〜12an中選擇出一個 解碼部。 在後續的步驟s 1 2-3中,已被選擇的解碼部,係將解 碼對象訊框的編碼序列,予以解碼。接著,在步驟S12-4 中,判定是否有尙未解碼的訊框存在。若沒有尙未解碼之 訊框存在,則結束處理。另一方面,若還有尙未解碼的訊 -17- 201222531 框存在時,則以該當訊框爲對象而使用步驟S12·2中所選 擇的解碼部,繼續步驟S 12-3起的處理。 以下說明’可使電腦動作成爲音訊解碼裝置12的音 訊解碼程式。圖1 〇係一實施形態所述之音訊解碼程式的 圖示。 圖10所示的音訊解碼程式P12,係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P12’係可與音訊 編碼程式P10同樣地提供。 如圖1 0所示,音訊解碼程式p 1 2係具備:解碼模組 Ml 2a ,〜Ml 2an、抽出模組Ml 2b、及選擇模組Ml 2c。解 碼模組M12ai〜M12an、抽出模組M12b、選擇模組M12c ,係可使電腦CIO執行分別與解碼部12a!〜12an、抽出部 12b、選擇部12c相同的機能》 以下,說明另一實施形態所述之音訊編碼裝置。圖 1 1係另一實施形態所述之音訊編碼裝置的圖示。圖1 1所 示的音訊編碼裝置14,係爲MPEG U SAC之擴充中所能使 用的裝置。 圖12係依照先前之MPEG USAC所生成的串流與圖 11所示的音訊編碼裝置所生成的串流的圖示。如圖12所 示,在先前的MPEG U SAC中,在串流中的各訊框裡係被 附加有,用來表示是使用了 FD ( Modified AAC )還是使 用了 LPD ( ACELP或TCX )的資訊,亦即1位元的 core_mode。又’在先前的MPEG USAC中,LPD所被使 用的訊框係具有,含有4個訊框的超級訊框構造。LPD被 -18- 201222531 使用的情況下,作爲用來表示超級訊框之各訊框之編碼時 是使用了 ACELP或TCX之何者的資訊,是有4位元的 lpd_m〇de被附加至該超級訊框。 圖Π所示的音訊編碼裝置14,係可將所有訊框的音 訊訊號以共通之音訊編碼處理而加以編碼。又,音訊編碼 裝置1 4,係亦可和先前的MPEG — USAC同樣地,可切換 各訊框所使用的音訊編碼處理。此外,在一實施形態中, 音訊編碼處理是一亦可對所有的超級訊框,共通地使用 LPD、亦即一組音訊編碼處理。 ‘ 如圖11所示,音訊編碼裝置14係具備:ACELP編 碼部 14ai、TCX 編碼部 14a2、Modified AAC 編碼部 14a3 、選擇部14b、生成部14c、輸出部14d、標頭生成部14e 、第1判定部14f、c〇re_mode生成部14g、第2判定部 14h、lpd_mode 生成部 14i、MPS 編碼部 14m、及、SBR 編碼部14η。 MPS編碼部14m係將被輸入至輸入端子Ini的音訊 訊號,予以接受。被輸入至MPS編碼部14m的音訊訊號 ,係可爲2聲道以上的多聲道之音訊訊號。MPS編碼部 14m,係將各訊框的多聲道之音訊訊號,以比該當多聲道 的聲道數還少之聲道數的音訊訊號、和用來從該當較少聲 道數之音訊訊號解碼出多聲道之音訊訊號所需的參數,來 加以表現。 當多聲道之音訊訊號是立體聲訊號時,MPS編碼部 14m,係藉由將該當立體聲訊號進行縮減混音,以生成單 -19- 201222531 聲道之音訊訊號。又,MPS編碼部14m,係作 訊號解碼出立體聲訊號所需的參數,而生成單 立體聲訊號的各聲道之間的位準差、相位差 關値。MP S編碼部1 4m,係將所生成的單聲道 SBR編碼部14η,將所生成的參數加以編碼所 料,輸出至輸出部14d。此外,立體聲訊號係 聲道訊號與殘差訊號、及參數來表現。 SBR編碼部14η,係從MPS編碼部14m 之音訊訊號》SBR編碼部14η所接受的音訊訊 例如上述單聲道訊號。SBR編碼部14η係當被 端子Ini的音訊訊號是單聲道訊號時,就接受 號。SBR編碼部14η係以所定之頻率爲基準, 之音訊訊號,生成低頻頻帶之音訊訊號及高頻 訊號。又,SBR編碼部14η,係算出用來從低 訊訊號生成高頻頻帶之音訊訊號所需的參數。 數,可以利用例如,表示所定頻率的頻率資訊 率分解能力資訊、頻譜包絡資訊、附加雜訊資 正弦波資訊之類的資訊。SBR編碼部14η,係 之音訊訊號,輸出至開關SW1。又,SBR編碼 將所算出的參數加以編碼而得到的編碼資料, 部 14d。 編碼部14ai係以ACELP編碼處理將音訊 碼而生成編碼序列。編碼部14a2係以TCX編 訊訊號加以編碼而生成編碼序列。編碼部 爲從單聲道 聲道訊號與 、及/或、相 訊號輸出至 得之編碼資 亦可藉由單 接收各訊框 號,係可爲 輸入至輸入 該當音訊訊 從已被輸入 頻帶之音訊 頻頻帶之音 作爲該當參 、時間·頻 訊、及附加 將低頻頻帶 部1 4 η,係 輸出至輸出 訊號加以編 碼處理將音 14a3係以 -20- 201222531
Modified AAC編碼處理將音訊訊號加以編碼而 序列。 選擇部14b,係隨著被輸入至輸入端子ΐη2 訊,而選擇要將被輸入至開關SW1之複數訊框 號進行編碼的編碼部。在本實施形態中,輸入資 由使用者輸入而得的資訊。又,輸入資訊係可爲 否將複數訊框以共通的一種編碼處理進行編碼的 在本實施形態中,選擇部1 4b係當輸入資訊 將複數訊框以共通的一種音訊編碼處理進行編碼 ,則選擇會執行所定編碼處理的所定之編碼部。 說明,當輸入資訊是表示將複數訊框以共通的一 碼處理來進行編碼時,選擇部1 4b係可控制開關 ACELP編碼部14ai選擇成爲所定之編碼部。因 實施形態中,當輸入資訊是表示,將複數訊框以 種音訊編碼處理進行編碼的情況下,則複數訊框 號就會被ACELP編碼部14〜所編碼。 另一方面,選擇部14b係當輸入資訊是表示 數訊框以共通的一種音訊編碼處理來進行編碼時 輸入至開關SW1的各訊框之音訊訊號,與連接^ 定部14f等之路徑做結合。 生成部14c,係基於輸入資訊而生成長期編 訊。如圖12所示,作爲長期編碼處理資訊,係 位元的GEM_ID。又,當輸入資訊是表示,將複 共通的一種音訊編碼處理進行編碼的情況下, 生成編碼 的輸入資 的音訊訊 訊係可爲 *表不是 資訊。 是表不, 的情況下 例如,如 種音訊編 SW1,將 此,在本 共通的一 之音訊訊 並非將複 ,則將被 f第1判 碼處理資 可使用1 數訊框以 則生成部 -21 - 201222531 14c係可將GEM_ID之値設定成「1」。另一方面,當輸 入資訊是表示,並非將複數訊框以共通的一種音訊編碼處 理進行編碼的情況下,則生成部1 4c係可將GEM_ID之値 設定成「〇」。 標頭生成部14e,係生成被含在串流中的標頭,將已 被設定之GEM_ID,包含在該當標頭中。如圖12所示, 該標頭係被從輸出部14d時,可被包含在第1訊框中。 第1判定部1 4f,係當輸入資訊是表示並非將複數訊 框以共通的一種音訊編碼處理來進行編碼時,則透過SW1 而接受編碼對象訊框的音訊訊號。第1判定部14f係解析 編碼對象訊框的音訊訊號,判定是否應該以 Modified AAC編碼部14a3來將該當音訊訊號予以編碼。 第1判定部14f,係當判定爲應該將編碼對象訊框的 音訊訊號以Modified AAC編碼部14a3進行編碼的情況下 ,則控制開關SW2而使該當訊框結合至Modified AAC編 碼部1 4a3。 另一方面,第1判定部1 4f,係當判定爲不應該將編 碼對象訊框的音訊訊號以Modified AAC編碼部14a3進行 編碼的情況下,則控制開關SW2而使該當訊框結合至第2 判定部1 4h及開關SW3。此情況下,編碼對象之訊框,係 於後續的處理中被分割成4個訊框,被視爲含有該當4個 訊框的超級訊框。 此外,第1判定部14f,係例如,將編碼對象訊框的 音訊訊號加以解析,若該當音訊訊號是具有所定量以上的 -22- 201222531 音調成分時,則可將Modified AAC編碼部14&3選擇成爲 該當訊框之語音訊號用的編碼部。 core_mode生成部14g,係隨著第1判定部14f的判 定結果,而生成core_mode。如圖12所示,core_mode係 爲1位元之資訊。core_mode生成部14g,係當第1判定 部14f判定爲應該將編碼對象訊框的音訊訊號以Modified AAC編碼部14a3進行編碼的情況下,則將core_m〇de之 値設定成「0」。另一方面,c〇re_m〇de生成部14g,係當 第1判定部1 4f判定爲不應該將判定對象訊框的音訊訊號 以Modified AAC編碼部14a3進行編碼的情況下,則將 core_mode之値設定成「1」。該core_mode係被從輸出 部14d輸出時,就被當成參數資訊而附加至編碼對象訊框 所對應之串流內的輸出訊框。 第2判定部14h,係透過開關SW2而接收編碼對象之 超級訊框的音訊訊號。第2判定部1 4h係判定,是否應該 將編碼對象之超級訊框中的各訊框的音訊訊號以 ACELP 編碼部14ai進行編碼或是應該以TCX編碼部14a2進行編 碼。 第2判定部14h,係當判定爲應該將編碼對象訊框的 音訊訊號以ACELP編碼部14ai進行編碼的情況下,則控 制開關SW3而使該當訊框之音訊訊號,結合至ACELP編 碼部14ai。另一方面,第2判定部14h,係當判定爲應該 將編碼對象訊框的音訊訊號以TCX編碼部14a2進行編碼 的情況下,則控制開關SW3而使該當訊框之音訊訊號, -23- 201222531 結合至TCX編碼部14a2。 第2判定部14h,係例如’當編碼對象訊框的音訊訊 號是具.有較強語音成分的訊號時’該當音訊訊號的時間包 絡是在短時間內變動得比所定變動幅度還大時’或該當音 訊訊號是含有過渡性成分時’則會判定將該當音訊訊號以 ACELP編碼部14ai進行編碼。第2判定部14h,係在其 他情況下,則會判定將該當音訊訊號以TCX編碼部1 4a2 進行編碼。此外,所謂音訊訊號是具有較強語音成分之訊 號的情況,係爲該當音訊訊號的音高週期是在所定範圍內 的情況、音高週期之時的自我相關是比所定之自我相關還 強的情況、或過零率是小於所定之比率的情況。 lpd_mode生成部14i,係隨著第2判定部14h的判定 結果,而生成lpd_mode。如圖12所示,lpd_mode係爲4 位元之資訊。lpd_mode生成部14i,係將lpd_mode之値 設定成,對來自第2判定部14h之超級訊框中之各訊框之 音訊訊號的判定結果所對應之所定値。被lpd_m〇de生成 部14i設定了値的lpd_mode,係在被從輸出部14d輸出時 ,就被附加至編碼對象之超級訊框所對應之串流內的輸出 超級訊框。 輸出部1 4d,係將串流予以輸出。串流中係含有,具 有含上述GEM_ID之標頭及對應之編碼序列的第1訊框、 及分別具有對應之編碼序列的第2〜第m訊框(m係2以 上之整數)。又,輸出部14d,係使各輸出訊框中,含有 被MPS編碼部14m所生成之參數的編碼資料及被SBR編 -24- 201222531 碼部14η所生成之參數的編碼資料。 以下,說明音訊編碼裝置14之動作,及另一實施形 態所述之音訊編碼方法。圖1 3係另一實施形態所述之音 訊編碼方法的流程圖。 如圖1 3所示,在一實施形態中,係於步驟S 1 4 -1中 ,生成部14c係基於輸入資訊而如上述般地生成(設定) GEM_ID。在後續的步驟S14-2中,標頭生成部I4e係生 成含有已被設定之GEM_ID的標頭。 接著,藉由步驟S14-p所不的判定,若判斷爲被輸入 至輸入端子Ini的音訊訊號是多聲道訊號時,則於步驟 S14-m中,MPS編碼部14m會如上述般地,從所被輸入 之編碼對象訊框的多聲道之音訊訊號,生成比多聲道的聲 道數還少之聲道數的音訊訊號、和用來從該當較少聲道數 之音訊訊號解碼出多聲道之音訊訊號所需的參數。又, MPS編碼部14m係生成該當參數之編碼資料。該編碼資 料,係藉由輸出部14d,而被含在對應的輸出訊框中。另 一方面,當被輸入至輸入端子Ini的音訊訊號是單聲道訊 號時,則MPS編碼部14m係不動作,被輸入至輸入端子 Ini的音訊訊號係被輸入至SBR編碼部14η。 接著,於步驟Sl4_n中,SBR編碼部14η係如上述, 從所被輸入的音訊訊號,生成低頻頻帶之音訊訊號、與用 來從低頻頻帶之音訊訊號生成高頻頻帶之音訊訊號所需之 參數。又,SBR編碼部14η係生成該當參數之編碼資料。 該編碼資料,係藉由輸出部14d,而被含在對應的輸出訊 -25- 201222531 框中。 接著,在步驟S14-3中,選擇部14b係基於輸入資訊 ,而判定是否將複數訊框之音訊訊號、亦即,從SBR編 碼部14η所輸出之複數訊框的低頻頻帶之音訊訊號,以共 通的音訊編碼處理進行編碼。 在步驟S14-3中,當輸入資訊是表示要將複數訊框之 音訊訊號以共通的音訊編碼處理進行編碼時,亦即,當 GEM — ID之値是「1」時,則選擇部14b係選擇ACELP編 碼部1 4ai。 接著,在步驟S14-4中,已被選擇部14b所選擇的 ACELP編碼部14ai,係將編碼對象訊框的音訊訊號加以 編碼,生成編碼序列。 接著,在步驟S14-5中,輸出部14d係判斷是否對訊 框附加標頭。於步驟S14-5中,輸出部14d係當編碼對象 訊框是第1訊框時,則判定爲要對該當編碼對象訊框所對 應之串流內的第1訊框附加標頭,在後續的步驟S14-6中 ,使第1訊框中含有標頭及編碼序列,而將該當第1訊框 予以輸出。另一方面,若是第2訊框以後的訊框,則不附 加標頭,於步驟S14-7中,輸出部14d係使訊框中含有編 碼序列然後輸出。 接著,在步驟S1 4-8中,判斷是否有尙未編碼的訊框 存在。若沒有尙未編碼之訊框存在,則結束處理。另一方 面,若還有尙未編碼之訊框存在時,則以尙未編碼之訊框 爲對象而繼續步驟S14-p起的處理。 -26- 201222531 如此,在本實施形態中,當GEM_ID之値爲「1」時 ’ ACELP編碼部14a!係繼續被使用於複數訊框之所有音 訊訊號的編碼。 在步驟S14-3中,當判斷爲GEM_ID之値是「〇」時 ’亦即,輸入資訊是表示各訊框應該要以個別之編碼處理 方法來處理的情況下,則在步驟S14-9中,第1判定部 14f係判定是否要將編碼對象訊框的音訊訊號、亦即從 SBR編碼部14η所輸出的編碼對象訊框的低頻頻帶之音訊 訊號’以Modified AAC編碼部14a3進行編碼。於後續的 步驟 S14-10 中,core_mode 生成部 14g 係將 core_mode 之 値’設定成符合第1判定部1 4f所致之判定結果的値。 接著,在步驟S 1 4 -1 1中,判定第1判定部1 4 f的判 定結果是否表示,應該以Modified AAC編碼部14a3來將 編碼對象訊框的音訊訊號進行編碼。當第1判定部14f的 判定結果是表示,應該以Modified AAC編碼部14a3來將 編碼對象訊框的音訊訊號進行編碼時,則在後續的步驟 S14-12中,編碼對象訊框的音訊訊號係被Modified AAC 編碼部14a3所編碼。 接著,在步驟S14-13中,輸出部14d係對編碼對象 訊框所對應之串流內的輸出訊框(或超級訊框),附加 core_mode。然後,處理係前進至步驟S14-5。 在步驟S14-1 1中,當第1判定部14f的判定結果是 表示,不應該以Modified AAC編碼部14a3來將編碼對象 訊框的音訊訊號進行編碼時,則從步驟S1 4-14起之處理 -27- 201222531 ,係把編碼對象訊框視爲超級訊框。 於步驟S14-14中,第2判定部14h係判定,是否應 該將超級訊框中的各訊框,以ACELP編碼部14ai進行編 碼、還是應該以TCX編碼部14a2進行編碼。於後續的步 驟S14-15中,lpd_mode生成部14i係將lpd_mode設定成 ,符合第2判定部1 4h之判定結果的値。 接著,在步驟S14-16中係判定第2判定部14h的判 定結果是表示,應該將超級訊框內的編碼對象訊框以 ACELP編碼部14ai進行編碼,還是表示應該將該當編碼 對象之訊框以TCX編碼部14a2進行編碼》 當第2判定部14h的判定結果是表示應該將編碼對象 訊框以ACELP編碼部14&1進行編碼的情況下,則在步驟 S14-17中,編碼對象訊框的音訊訊號係被ACELP編碼部 1 4ai所編碼。另一方面,當第2判定部1 4h的判定結果是 表示應該將編碼對象訊框以TCX編碼部14a2進行編碼的 情況下,則在步驟S14-18中,編碼對象訊框的音訊訊號 係被TCX編碼部14a2所編碼。 接著,在步驟S14-19中,對編碼對象之超級訊框所 對應之串流內的輸出超級訊框,附加lpd_m〇de。然後, 處理係前進至步驟S14-13。 若依據以上說明的音訊編碼裝置14及音訊編碼方法 ,則藉由在標頭中含有設定成「1」的GEM_ID,各訊框 中就不必含有用來特定曾經使用之音訊編碼處理用的資訊 ,可將複數訊框之音訊訊號是僅以ACELP編碼部做過編 -28- 201222531 碼之事實,通知給解碼側。因此’可生成大小較小的串流 〇 以下說明,使電腦動作成爲音訊編碼裝置14的音訊 編碼程式。圖14係另一實施形態所述之音訊編碼程式的 圖示。 圖14所示的音訊編碼程式P14,係可在圖5及圖6 所示的電腦中使用。又,音訊編碼程式P14,係可與音訊 編碼程式P 1 0同樣地提供。 如圖14所示,音訊編碼程式P14係具備:ACELP編 碼模組M14ai、TCX編碼模組M14a2、Modified AAC編碼 模組Μ 1 4a3、選擇模組Μ 1 4b、生成模組Μ 1 4c、輸出模組 M14d、標頭生成模組 M14e、第 1判定模組 M14f、 c〇re_mode生成模組 M14g、第 2判定模組 M14h、 lpd_mode生成模組M14i、MPS編碼模組M14m、及SBR 編碼模組14η。 ACELP編碼模組 M14ai、TCX編碼模組 M14a2、 Modified AAC編碼模組M14a3、選擇模組M14b、生成模 組M14c、輸出模組M14d、標頭生成模組M14e、第1判 定模組Μ 1 4 f、c 〇 r e_m 〇 d e生成模組Μ 1 4 g、第2判定模組 M14h、lpd_mode 生成模組 M14i、MPS 編碼模組 M14m、 及SBR編碼模組14η,係令電腦CIO執行分別與ACELP 編碼部14a]、TCX編碼部14a2、Modified AAC編碼部 14a3、選擇部14b、生成部14c、輸出部14d、標頭生成部 14e、第1判定部14f、core_mode生成部14g、第2判定 -29- 201222531 部 14h、lpd_mode 生成部 14i' MPS 編碼部 14m、SBR 編 碼部14n相同之機能。 以下,說明可將音訊編碼裝置1 4所生成之串流予以 解碼的音訊解碼裝置。圖15係另一實施形態所述之音訊 解碼裝置的圖示。圖15所示的音訊解碼裝置16,係具備 :ACELP 解碼部 16a, ' TCX 解碼部 16a2、Modified AAC 解碼部16a3、抽出部16b、選擇部16c、標頭解析部16d 、core_mode 抽出部 16e、第 1 選擇部 16f、lpd_mode 抽 出部16g、第2選擇部16h、MPS解碼部16m、及SBR解 碼部1 6n。 ACELP解碼部16ai係以ACELP解碼處理將訊框內的 編碼序列予以解碼,生成音訊訊號。TCX解碼部16a2係 以TCX解碼處理將訊框內的編碼序列予以解碼,生成音 訊訊號。Modified AAC 解碼部 16a3 係以 Modified AAC 解碼處理將訊框內的編碼序列予以解碼,生成音訊訊號〃 於一實施形態中,從這些解碼部所輸出的音訊訊號,係關 於音訊編碼處理14而爲上述的低頻頻帶之音訊訊號。 標頭解析部16d,係可從第1訊框分離出標頭。標頭 解析部16d,係將已分離之標頭提供至抽出部16b,將標 頭已被分離之第1訊框、及後續訊框,輸出至開關SW1、 MPS解碼部16m、及SBR解碼部16η。 抽出部16b,係從標頭抽出GEM_ID。選擇部16c, 係隨著已被抽出之GEM_ID’來選擇要使用於複數訊框之 編碼序列之解碼時的解碼部。具體而言,選擇部16c係當 -30- 201222531 GEM_ID之値爲「1」時,則控制開關 SW1,將複數訊框 全部結合至ACELP解碼部16ai。另一方面,GEM_ID之 値爲「0」時,選擇部16c係控制開關SW1,將解碼對象 訊框(或超級訊框),結合至core_mode抽出部16e。 core_mode抽出部16e,係將解碼對象訊框(或超級 訊框)內的core_mode予以抽出,將該當core_mode提供 給第1選擇部16f。第1選擇部16f,係隨著所被提供的 core_mode之値,來控制開關 SW2。具體而言,當 c〇re_m〇de之値爲「0」時,第1選擇部16f係控制開關 SW2,將解碼對象訊框結合至Modified AAC解碼部16a3 。藉此,解碼對象訊框就被輸入至Modified AAC解碼部 16a3。另一方面,當core_mode之値爲「1」時,第1選 擇部1 6f係控制開關SW2,將解碼對象之超級訊框結合至 lpd_mode 抽出部 16g。 lpd_mode抽出部16g,係從解碼對象訊框、亦即超級 訊框中’抽出lpd_mode。lpd_mode抽出部 16g ’係將已 抽出的lpd_m〇de,結合至第2選擇部16h。第2選擇部 16h,係隨應於已被輸入的lpd_mode ’而將從lpd_mode 抽出部16g所輸出的解碼對象之超級訊框內的各訊框,結 合至ACELP解碼部163!或TCX解碼部16a2。 具體而言,第2選擇部16h係參照與lpd_mode之値 建立關連的所定表格,設定mod[k] ( k = 0,1, 2,3 )之値 。然後,第2選擇部16h,係隨應於mod [k]之値來控制開 關SW3,將解碼對象之超級訊框內的各訊框,結合至 -31 - 201222531 ACELP解碼部16ai或TCX解碼部丨6&2。此外 mod[k]之値與ACELP解碼部16a!或TCX解碼部 選擇的關係,將於後述。 SBR解碼部16η’係從解碼部i6ai、16a2、及 接受低頻頻帶之音訊訊號。SBR解碼部16rl,係還 碼對象訊框中所含之編碼資料予以解碼,以將參數 原。SBR解碼部16η,係使用低頻頻帶之音訊訊號 原之參數,而生成高頻頻帶之音訊訊號。又,SBR 16η,係藉由將高頻頻帶之音訊訊號及低頻頻帶之 號予以合成,而生成音訊訊號。 MPS解碼部16m,係從SBR解碼部16η接收 號。該音訊訊號,係當應復原之音訊訊號是立體聲 ,則有可能是單聲道之音訊訊號。MPS解碼部16m 會將解碼對象訊框中所含之編碼資料予以解碼,以 予以復原。又,MPS解碼部16m係使用從SBR 16η所收到之音訊訊號與已復原之參數,而生成多 音訊訊號,將該當多聲道之音訊訊號予以輸出。應 音訊訊號是單聲道訊號的情況下,則MPS解碼部 .不動作,將上記SBR解碼部1 6η所生成的音訊訊 輸出。 以下,說明音訊解碼裝置16的動作,與另一 態所述之音訊解碼方法。圖1 6係另一實施形態所 訊解碼方法的流程圖。 如圖1 6所示,在一實施形態中,係於步驟s] ,關於 16a2 之 1 6a3, 會將解 予以復 及已復 解碼部 音訊訊 音訊訊 訊號時 ,係還 將參數 解碼部 聲道之 復原之 1 6m係 號予以 實施形 述之音 6-1中 -32- 201222531 ,標頭解析部16d會從串流中分離出標頭。在後續的步驟 S 1 6-2中,抽出部1 6b係從標頭解析部1 6d所提供的標頭 中,抽出GEM_ID。 接著,在步驟S16-3中,選擇部16c係隨著已被抽出 部16b所抽出的GEM_ID之値,來選擇將複數訊框予以解 碼的解碼部。具體而言,當GEM_ID之値爲「1」時,選 擇部16c係選擇ACELP解碼部16a!。此情況下,在步驟 S16-4中,ACELP解碼部16ai係將解碼對象訊框內的編 碼序列,予以解碼。步驟S16-4所生成的音訊訊號,係爲 上述的低頻頻帶之音訊訊號。 接著,在步驟S16-n中,SBR解碼部16η,係將解碼 對象訊框中所含之編碼資料予以解碼,以將參數予以復原 。又,於步驟S16-n中,SBR解碼部16η,係使用已被輸 入之低頻頻帶之音訊訊號及已復原之參數,而生成高頻頻 帶之音訊訊號。又,於步驟S16-η中,SBR解碼部16η, 係藉由將高頻頻帶之音訊訊號及低頻頻帶之音訊訊號予以 合成,而生成音訊訊號。 接著,藉由步驟S16-P中的判定而將多聲道訊號判斷 成爲處理對象的時候,於後續的步驟S 1 6-m中,MPS解 碼部16m係將解碼對象訊框中所含之編碼資料予以解碼 ,以將參數予以復原。又,於步驟S1 6-m中,MPS解碼 部1 6m係使用從SBR解碼部1 6η所收到之音訊訊號與已 復原之參數,而生成多聲道之音訊訊號,將該當多聲道之 音訊訊號予以輸出。另一方面,若將單聲道訊號判斷成爲 -33- 201222531 處理對象,則將SBR解碼部16η所生成的音訊訊號予以 輸出。 接著,在步驟S16-5中,會進行是否還有尙未解碼之 訊框存在的判定。若沒有尙未解碼之訊框存在,則結束處 理。另一方面,若有尙未解碼的訊框存在時,則以尙未解 碼之訊框爲對象而繼續從步驟S1 6-4起之處理。藉此,當 gem_id之値是「1」時,則複數訊框的編碼序列是被共 通的解碼部、亦即ACELP解碼部16ai所解碼。 回到步驟S16-3,當GEM_ID之値是「〇」時,則選 擇部16c係將解碼對象訊框結合至core_mode抽出部16e 。此情況下,在步驟S16-6中,core_mode抽出部 16e, 係從解碼對象訊框中抽出c〇re_m〇de。 接著,在步驟S16-7中,第1選擇部16f係隨著所抽 出的 core_mode,來選擇 Modified AAC解碼部 16a3或 lpd_mode抽出部16g»具體而言,當core_mode之値是「 〇」時,則第1選擇部16f係選擇Modified AAC解碼部 16a3,將解碼對象訊框結合至Modified AAC解碼部16a3 。此情況下,在後續的步驟S16-8中,處理對象訊框內的 編碼序列是被Modified AAC解碼部16a3所解碼。該步驟 S 16-8中所生成的音訊訊號,係爲上述的低頻頻帶之音訊 訊號。接著該步驟S16-8之後,會進行上述的SBR解碼 處理(步驟S16-n)及MPS解碼處理(步驟S16-m)。 接著,在步驟S 16-9中,會判定是否還有尙未解碼之 訊框存在,若沒有尙未解碼的訊框存在,則結束處理。另 -34- 201222531 一方面,若有尙未解碼的訊框存在時,則以尙未解碼之訊 框爲對象而繼續從步驟S16-6起之處理。 回到步驟S16-7,當core_mode之値是「1」時’則 第1選擇部I6f係選擇lpd_m〇de抽出部16g,將解碼對 象訊框結合至lpd_m〇de抽出部16g。此外,此情況下, 解碼對象訊框係被視爲超級訊框。 接著,在步驟S16-10中,lPd_m〇de抽出部16g係從 解碼對象之超級訊框中,抽出lpd_mode。然後,第2 ·選 擇部16h係隨著所抽出的lpd_mode而設定mod[k](k=〇, 1, 2, 3)。 接著,在步驟S16-11中,第2選擇部16h係將k的 値設定成「〇」。在後續的步驟S16-12中,第2選擇部 16h係判定m〇d[k]之値是否大於〇。若m〇d[k]之値爲0以 下,則第2選擇部16h係選擇ACELP解碼部16a!。另一 方面,若mod[k]之値大於〇,則第2選擇部16h係選擇 TCX解碼部16a2。 然後’當ACELP解碼部16ai被選擇時,則在後續的 步驟S16-13中,ACELP解碼部16a,會將超級訊框內的解 碼對象訊框之編碼序列予以解碼。接著,於步驟S16-14 中,k之値係被設定成k+Ι。另一方面,當TCX解碼部 16a;j被選擇時,則在後續的步驟S16-15中,TCX解碼部 16 k會將超級訊框內的解碼對象訊框之編碼序列予以解碼 。接著’於步驟S16-16中,k之値係被更新成k+a( mod[k])。此外’關於m〇d[k]和a ( mod[k])之關係,敬 -35- 201222531 請參照圖1 7 » 接著,於步驟S16-17中,判定k的値是否小於4。k 的値小於4的情況下,從步驟S 1 6 -1 2起的處理就會對超 級訊框內的後續訊框繼續進行。另一方面’若k的値爲4 以上’則處理係前進至步驟S16-n。 以下說明,使電腦動作成爲音訊解碼裝置1 6的音訊 解碼程式。圖18係另一實施形態所述之音訊解碼程式的 圖示。 圖18所示的音訊解碼程式P16’係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P16,係可與音訊 編碼程式P 1 0同樣地提供。 如圖18所示,音訊解碼程式P16係具備:ACELP解 碼模組M16ai、TCX解碼模組M16a2、Modified AAC解碼 模組Ml 6a3、抽出模組Ml 6b、選擇模組Ml 6c、標頭解析 模組M16d、c〇re_m〇de抽出模組M16e、第1選擇模組 M16f、lpd_mode抽出模組M16g、第2選擇模組M16h、 MPS解碼模組M16m、及SBR解碼模組M16n。 ACELP解碼模組 M16ai、TCX解碼模組 M16a2、 Μ 〇 d i fi e d A A C解碼模組Μ 1 6 a3、抽出模組Μ 1 6 b、選擇模 組 Μ 1 6 c、標頭解析模組 Μ 1 6 d、c o r e _ m o d e抽出模組 M16e、第1選擇模組M16f、lpd_mode抽出模組M16g、 第2選擇模組M16h、MPS解碼模組M16m、SBR解碼模 組M16n,係令電腦CIO執行分別與ACELP解碼部16a, 、TCX解碼部16a2、Modified AAC解碼部16a3、抽出部 -36- 201222531 16b、選擇部i6c、標頭解析部16d、core_mode抽出部 16e、第1選擇部16f、ipd_mode抽出部16g、第2選擇部 16h、MPS解碼部16m、SBR解碼部16η相同之機能。 以下,說明再另一實施形態所述之音訊編碼裝置。圖 19係再另一實施形態所述之音訊編碼裝置的圖示。圖19 所示的音訊編碼裝置18,係爲可當作AMR-WB +之擴充而 使用的裝置。 圖20係依照先前之AMR WB +所生成的串流與圖19 所示的音訊編碼裝置所生成的串流的圖示。如圖20所示 ,在AMR-WB +中,是對各訊框附加有2位元的Mode bits 。Mode bits係爲,隨著其値,來表示是否選擇ACELP編 碼處理還是選擇TCX編碼處理的資訊。 另一方面,圖19所示的音訊編碼裝置18,係可將所 有訊框的音訊訊號以共通之音訊編碼處理而加以編碼。又 ,音訊編碼裝置18,係亦可切換各訊框所使用的音訊編 碼處理。 如圖19所示,音訊編碼裝置18係具備:ACELP編 碼部18a丨、及TCX編碼部18a2。ACELP編碼部18a!,係 以ACELP編碼處理將音訊訊號加以編碼而生成編碼序列 。TCX編碼部18a2,係以TCX編碼處理將音訊訊號加以 編碼而生成編碼序列。音訊編碼裝置18係還具備:選擇 部18b、生成部18c、輸出部18d、標頭生成部18e、編碼 處理判定部18f、Mode bits生成部18g、分析部18m、縮 減混音部18η、高頻頻帶編碼部18p、及立體聲編碼部 -37- 201222531 1 8 q 〇 分析部18m,係以所定頻率爲基準,將被輸入至輸入 端子Ini的各訊框的音訊訊號,分割成低頻頻帶之音訊訊 號與高頻頻帶之音訊訊號。分析部18m,係若被輸入至輸 入端子Ini的音訊訊號是單聲道之音訊訊號時,則將已生 成之低頻頻帶之音訊訊號輸出至開關SW1,將高頻頻帶之 音訊訊號輸出至高頻頻帶編碼部18p。另一方面,若被輸 入至輸入端子Ini的音訊訊號是立體聲訊號時,則分析部 18m係將已生成之低頻頻帶之音訊訊號(立體聲訊號), 輸出至縮減混音部18η。 縮減混音部18η,係當被輸入至輸入端子Ini的音訊 訊號是立體聲訊號時,則將低頻頻帶之音訊訊號(立體聲 訊號)縮減混音成單聲道之音訊訊號。縮減混音部18η, 係將所生成之單聲道之音訊訊號,輸出至開關SW1。縮減 混音部18η,係將低頻頻帶之音訊訊號以所定頻率爲基準 而分割成二個頻帶之音訊訊號。縮減混音部18η,係將二 個頻帶之音訊訊號當中較低頻帶之音訊訊號(單聲道訊號 )與右聲道之音訊訊號,輸出至立體聲編碼部18q。 高頻頻帶編碼部18p,係算出在解碼側中用來從低頻 頻帶之音訊訊號生成高頻頻帶之音訊訊號所需的參數,生 成該當參數之編碼資料,將該當編碼資料輸出至輸出部 1 8d。作爲參數係可使用例如將頻譜包絡予以模型化之線 性預測係數或功率調整所需的增益》 立體聲編碼部18q,係上記二個頻帶之音訊訊號當中 -38- 201222531 較低頻帶之單聲道之音訊訊號與右聲道之音訊訊號的差分 訊號亦即側旁訊號,予以算出。立體聲編碼部1 8q,係算 出表示單聲道之音訊訊號與側旁訊號之位準差的平衡因子 ’將該當平衡因子、與側旁訊號之波形分別以所定之方法 加以編碼,將編碼資料輸出至輸出部18d。·又,立體聲編 碼部18q,係算出用來從上記二個頻帶之音訊訊號當中較 低頻帶之音訊訊號在解碼裝置中生成立體聲音訊訊號所需 的參數,將該當參數之編碼資料,輸出至輸出部.18d。 選擇部18b,係具有和選擇部14b同樣的機能。具體 而言,當輸入資訊是表示將複數訊框以共通的一種音訊編 碼處理來進行編碼時,選擇部18b係控制開關SW1,而將 被輸入至開關 SW1的所有訊框的音訊訊號,結合至 ACELP編碼部18a!。另一方面,當輸入資訊是表示並非 將複數訊框以共通的一種編碼處理來進行編碼時,則選擇 部1 8 b係控制開關S W 1,而將被輸入至開關S W 1的各訊 框的音訊訊號,結合至與編碼處理判定部18f等連接的路 徑。 生成部1 8c,係和生成部1 4c同樣地設定GEM_ID。 標頭生成部18e,係生成含有已被生成部18c所生成之 GEM_ID的支援AMR-WB +之標頭。該標頭係被放在串流 的開頭中,被輸出部18d所輸出。在本實施形態中, GEM_ID 係可被包含在,標頭的 AMRWBPSampleEntry_fields 內的未使用領域裡。 編碼處理判定部18f,係當輸入資訊是表示並非將複 -39- 201222531 數訊框以共通的一種編碼處理來進行編碼時,則透過SW1 而接受編碼對象訊框的音訊訊號。 編碼處理判定部18f,係將編碼對象訊框,視爲將該 當編碼對象的訊框分割成4個以下之訊框而成的超級訊框 。編碼處理判定部1 8 f,係解析超級訊框中的各訊框的音 訊訊號,判定是否應將該當音訊訊號以 ACELP編碼部 18a!進行編碼、還是應該以TCX編碼部18 a2進行編碼。 該解析係亦可爲和上述第2判定部1 4h相同的解析。 判定部18f,係判定應該將訊框之音訊訊號以ACELP 編碼部18ai進行編碼時,則控制開關SW2,而將該當訊 框之音訊訊號結合至ACELP編碼部18a!。另一方面,若 判定應該將訊框之音訊訊號以TCX編碼部18a2進行編碼 時,則控制開關SW2,而將該當訊框之音訊訊號結合至 TCX編碼部18a2。
Mode bits生成部18g,係生成具有相應於編碼處理 判定部1 8f之判定結果之値的K個Mode Bits[k] ( k= 0〜 K-1 )。此處,Κ的値係爲4以下的整數,是對應於超級 訊框內的訊框數。又,Mode bits[k]係爲表示,編碼對象 訊框的音訊訊號之編碼時是使用了 ACELP編碼處理、還 是使用了 TCX編碼處理的至少2位元之資訊。 輸出部18d,係將具有標頭、及對應之編碼序列複數 訊框的串流,予以輸出。又,輸出部18d係當GEM_ID之 値爲〇時,則使輸出訊框中含有Mode bits[k]。然後,輸 出部18d係使已被高頻頻帶編碼部18p所生成的編碼資料 -40- 201222531 、及已被立體聲編碼部18所生成的編碼資料,被包含在 對應的訊框中。 以下’說明音訊編碼裝置1 8之動作,及一實施形態 所述之音訊編碼方法。圖21係再另一實施形態所述之音 訊編碼方法的流程圖。 如圖2 1所示,在一實施形態中,首先進行和步驟 S14-1相同的步驟S18-1。接著,在步驟S18-2中,標頭 生成部18e係如上述,生成含有GEM_ID的AMR-WB +標 頭。在後續的步驟S18-3中,輸出部18d係將所生成的標 頭,放在串流的開頭而輸出。 接著,於步驟S18-m中,分析部18m,係如上述,將 被輸入至輸入端子Ini的編碼對象訊框的音訊訊號,分割 成低頻頻帶之音訊訊號與高頻頻帶之音訊訊號。又,於步 驟S18-m中,分析部18m,係若被輸入至輸入端子Ini的 音訊訊號是單聲道之音訊訊號時,則將已生成之低頻頻帶 之音訊訊號輸出至開關SW1,將高頻頻帶之音訊訊號輸出 至高頻頻帶編碼部18p。另一方面,若被輸入至輸入端子 Ini的音訊訊號是立體聲訊號時,則分析部18m係將已生 成之低頻頻帶之音訊訊號(立體聲訊號)’輸出至縮減混 音部1 8 η。 接著,藉由步驟S 1 8-1•所示的判定,若判斷爲被輸入 至輸入端子Ini的音訊訊號是單聲道訊號時’則於步驟 S18-p中進行高頻頻帶編碼部〗8p的上述之處理,已被高 頻頻帶編碼部18p所生成之上述的編碼資料’係被輸出部 -41 - 201222531 18d所輸出。另一方面’若被輸入至輸入端子IrU的音訊 訊號是立體聲訊號時,則於步驟S18-n中進行縮減混音部 18η的上述之處理’於後續之步驟S18_q中進行立體聲編 碼部18q的上述之處理,已被立體聲編碼部18q所生成之 上述的編碼資料,係被輸出部18d所輸出,處理係前進至 步驟S18-p 。 接著’在步驟S18-4中,選擇部18b係判定GEM_ID 之値是否爲「0」。GEM_ID之値並非「〇」時,亦即 GEM_ID之値是「1」時,則選擇部i8b係選擇ACELP編 碼部 18a!。接著,在步驟 S18-5中,用已被選擇的 ACELP編碼部18ai,將訊框的音訊訊號(低頻頻帶之音 訊訊號)予以編碼。在後續的步驟S1 8-6中,含有已被生 成之編碼序列的訊框,係被輸出部18d所輸出。然後,當 GEM_ID之値是「1」時,則還會經過步驟S1 8-7的是否 還有應編碼之訊框的判定,所有訊框的音訊訊號(低頻頻 帶之音訊訊號)係被ACELP編碼部18ai所編碼然後輸出 〇 回到步驟S18-4,當GEM_ID之値是「〇」時,則在 後續的步驟S 1 8 - 8中,編碼處理判定部1 8 f係判定,是否 將編碼對象訊框亦即超級訊框中的各訊框之音訊訊號(低 頻頻帶之音訊訊號)以ACELP編碼處理進行編碼,還是 以TCX編碼處理進行編碼。 接著,在步驟S18-9中,Mode bits生成部I8g係生 成具有相應於編碼處理判定部1 8f之判定結果之値的 -42- 201222531
Mode bits[k]。 接著’在步驟S 1 8 -1 0中’判定步驟S 1 8 - 8之判定結 果是否表示’要將編碼對象訊框的音訊訊號以TCX編碼 處理進行編碼,亦即以TCX編碼部18a2進行編碼。 步驟S1 8-8之判定結果是表示要將編碼對象訊框的音 訊訊號以TCX編碼部18 a2進行編碼的情況下,則在後續 的步驟S18-11中,以TCX編碼部18a2將該當訊框的音訊 訊號(低頻頻帶之音訊訊號)進行編碼。另一方面,判定 結果並非表示要將編碼對象訊框的音訊訊號以TCX編碼 部18a2進行編碼的情況下,則在後續的步驟S18-12中, 以ACELP編碼部18&1將該當訊框的音訊訊號(低頻頻帶 之音訊訊號)進行編碼。此外,步驟S18-10〜步驟S18-1 2之處理,係對超級訊框內的各訊框進行。 接著,在步驟S18-13中,輸出部18d係對步驟S18-11或步驟S18-12所生成的編碼序列,附加Mode bits[k] 。然後,處理係前進至步驟S18-6。 即使在以上說明的音訊編碼裝置18及音訊編碼方法 中,也是藉由在標頭中含有設定成「1」的GEM_ID,就 可將複數訊框之音訊訊號是僅以ACELP編碼部做過編碼 之事實,通知給解碼側。因此,可生成大小較小的串流。 以下說明,使電腦動作成爲音訊編碼裝置1 8的音訊 編碼程式。圖22係爲再另一實施形態所述之音訊編碼程 式的圖7K。 圖22所示的音訊編碼程式P18,係可在圖5及圖6 -43- 201222531 所示的電腦中使用。又,音訊編碼程式P 1 8,係可與音訊 編碼程式P 1 0同樣地提供。 音訊編碼程式P18係具備:ACELP編碼模組M18ai、 TCX編碼模組Ml 8a2、選擇模組Ml 8b、生成模組M18c、 輸出模組Μ 1 8d、標頭生成模組Μ 1 8e、編碼處理判定模組 Ml 8f、Mode bits生成模組Ml 8g、分析模組Ml 8m、縮減 混音模組Ml 8η、高頻頻帶編碼模組Ml 8p、及立體聲編碼 模組Μ 1 8 q。 ACELP編碼模組M18ai、TCX編碼模組M18a2、選擇 模組Ml 8b、生成模組Ml 8c、輸出模組Ml 8d、標頭生成 模組Ml 8e、編碼處理判定模組Ml 8f、Mode bits生成模 組Ml 8g、分析模組Ml 8m、縮減混音模組Ml 8n、高頻頻 帶編碼模組Ml 8p、及立體聲編碼模組Ml 8q,係令電腦 C10執行分別與ACELP編碼部Ua^TCX編碼部18a2、 選擇部18b、生成部18c、輸出部18d、標頭生成部18e、 編碼處理判定部18f、Mode bits生成部18g、分析部18m 、縮減混音部18η、高頻頻帶編碼部I8p、立體聲編碼部 1 8 q相同之機能。 以下,說明可將音訊編碼裝置18所生成之串流予以 解碼的音訊解碼裝置。圖2 3係再另一實施形態所述之音 訊解碼裝置的圖示。圖23所示的音訊解碼裝置20係具備 :ACELP解碼部2(^、及TCX解碼部20a2» ACELP解碼 部2〇ai係以ACELP解碼處理將訊框內的編碼序列予以解 碼,生成音訊訊號(低頻頻帶之音訊訊號)。TCX解碼部 • 44 - 201222531 20a2係以TCX解碼處理將訊框內的編碼序列予以解碼’ 生成音訊訊號(低頻頻帶之音訊訊號)。音訊解碼裝置 20係還具備:抽出部20b、選擇部20c、標頭解析部20d 、Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶 解碼部2Op、立體聲解碼部20q、及合成部20m。 標頭解析部20d,係接受圖20所示的串流,從該當 串流中分離出標頭。標頭解析部20d ’係將已分離之標頭 ,提供給抽出部20b。又,標頭解析部20d,係將已分離 出標頭的串流中的各訊框,輸出至開關SW1、高頻頻帶解 碼部2Op、及立體聲解碼部20q。 抽出部20b,係從標頭抽出GEM_ID。選擇部20c係 當已被抽出之GEM_ID之値是「1」時,則控制開關SW1 ,而將複數訊框結合至ACELP解碼部2〇ai。藉此’當 GEM_ID之値是「1」時,則所有訊框的編碼序列是被 ACELP解碼部20ai所解碼。 另一方面,當GEM_ID之値是「〇」時’則選擇部 2〇c係控制開關SW1,而將各訊框結合至Mode bits抽出 部20e。Mode bits抽出部20e係將已被輸入之各訊框、亦 即超級訊框中的各訊框用的Mode bits[k]予以抽出,提供 給解碼處理選擇部20f。 解碼處理選擇部20f,係隨應於Mode bits[k]之之値 ,來控制開關SW2。具體而言,解碼處理選擇部20f係根 據Mode bits[k]之値而判斷應該選擇ACELP解碼處理時 ,則控制開關SW2,而將解碼對象訊框結合至ACELP解 -45 - 201222531 碼部20a,。另一方面,具體而言,解碼處理選擇部20f係 根據Mode bits[k]之値而判斷應該選擇TCX解碼處理時, 則控制開關SW2,而將解碼對象訊框結合至TCX解碼部 2 0a2 ° 高頻頻帶解碼部20p,係將解碼對象訊框中所含之編 碼資料予以解碼,以復原上述之參數。高頻頻帶解碼部 2〇P ’係使用已復原之參數、以及已被ACELP解碼部2〇ai 及/或TCX解碼部20a2所解碼的低頻頻帶之音訊訊號,生 成高頻頻帶之音訊訊號,將該當高頻頻帶之音訊訊號輸出 至合成部20m。 立體聲解碼部20q,係將解碼對象訊框中所含之編碼 資料予以解碼,以將上述的參數、平衡因子、及側旁訊號 之波形予以復原。立體聲解碼部20q,係使用已復原之參 數、平衡因子、及側旁訊號之波形、以及已被ACELP解 碼部2〇ai及/或TCX解碼部20a2所解碼的低頻頻帶之單 聲道之音訊訊號,而生成立體聲訊號。 合成部20m係將已被ACELP解碼部20a,及/或TCX 解碼部2(^2所復原之低頻頻帶之音訊訊號、和已被高頻 頻帶解碼部2 0p所生成之高頻頻帶之音訊訊號加以合成, 以生成解碼音訊訊號。又,若以立體聲訊號爲處理對象時 ’則合成部20m係也會使用來自立體聲解碼部20q的輸 入訊號(立體聲訊號),生成立體聲音訊訊號。 以下,說明音訊解碼裝置20之動作、和一實施形態 所述之音訊解碼方法。圖24係再另一實施形態所述之音 -46- 201222531 訊解碼方法的流程圖。 如圖24所示,在一實施形態中,首先於 中,標頭解析部20d會從串流中分離出標頭。 接著,在步驟S20-2中,抽出部20b係從 GEM — ID。於後續的步驟S20-3中,選擇部 GEM_ID之値來控制開關SW1。 具體而言,當GEM_ID之値是「1」時 2〇c係控制開關SW1,而選擇ACELP解碼部 將串流中的複數訊框之編碼序列予以解碼的解 況下,在後續的步驟S2〇-4中,ACELP解碼若 解碼對象訊框的編碼序列,予以解碼。藉此, 音訊訊號就會被復原》 接著,於步驟S20-p中,高頻頻帶解碼部 碼對象訊框中所含之編碼資料,復原出參數。 S20-p中,高頻頻帶解碼部20p係使用已復原 已被ACELP解碼部2〇ai復原的低頻頻帶之音 生成高頻頻帶之音訊訊號,將該當高頻頻帶之 出至合成部20m。 接著,藉由步驟S20-1•中的判定而將立體 成爲處理對象的時候,於後續的步驟S20-q中 碼部20q係將解碼對象訊框中所含之編碼資料 以將上述的參數、平衡因子、及側旁訊號之波 。又,在步驟S20-q中,立體聲解碼部20q係 之參數、平衡因子、及側旁訊號之波形、 步驟 S 2 0 -1 標頭中抽出 20c係隨著 ,則選擇部 2 0 a i來作爲 碼部。此情 15 2〇ai係將 低頻頻帶之 2〇p會從解 又,在步驟 之參數、及 訊訊號,而 音訊訊號輸 聲訊號判斷 ,立體聲解 予以解碼, 形予以復原 使用已復原 以及已被 -47- 201222531 ACELP解碼部20a,復原的低頻頻帶的單聲道之音訊訊號 ,而將立體聲訊號予以復原。 接著,在步驟S20-m中,合成部20m係將已被 ACELP解碼部2〇ai所復原之低頻頻帶之音訊訊號、和已 被高頻頻帶解碼部20p所生成之高頻頻帶之音訊訊號加以 合成,以生成解碼音訊訊號。又,若以立體聲訊號爲處理 對象時,則合成部20m係也會使用來自立體聲解碼部20q 的輸入訊號(立體聲訊號),以復原立體聲音訊訊號。 然後,在步驟S20-5中判定爲沒有尙未解碼之訊框存 在時,則結束處理。另一方面,若有尙未解碼的訊框存在 時,則以未處理之訊框爲對象而繼續從步驟S2 0-4起之處 理。 回到步驟S20-3,當GEM_ID之値是「0」時,則選 擇部20c係控制開關SW1,而將串流之各訊框結合至 Mode bits抽出部20e。此情況下,在後續的步驟S20-6中 ,Mode bits抽出部20e係從解碼對象之超級訊框中,抽 出Mode bits[k]。此外,Mode bits[k]係亦可從超級訊框 中1次抽出,或是在超級訊框內的各訊框之解碼時依序被 抽出。 接著,在步驟S20-7中,解碼處理選擇部20f係將k 的値設定成「0」。在後續的步驟S20-8中,解碼處理選 擇部20f係判定Mode bits[k]之値是否大於0。若Mode bits[k]之値爲0以下,則在後續的步驟S20-9中,超級訊 框內的解碼對象框架的編碼序列係被ACELP解碼部2〇ai -48- 201222531 所解碼。另一方面,若Mode bits[k]之値大於〇,則超級 訊框內的解碼對象框架的編碼序列係被TCX解碼部20a2 所解碼。 接著,在步驟S20-1 1中,解碼處理選擇部20f係把k 的値更新成 k+a ( Mode bits[k])。此處,Mode bits[k]之 値與a(Mode bits[k])的關係,是具有和圖17所示之 mod[k]與a ( mod[k])相同的關係。 接著,於步驟S2 0-12中,解碼處理選擇部20f係判 定k的値是否小於4。k的値小於4的情況下,係以超級 訊框內的後續訊框爲對象,繼續從步驟S20-8起的處理。 另一方面,若k的値是4以上時,則於步驟S20-P中,高 頻頻帶解碼部2 Op會從解碼對象訊框中所含之編碼資料, 復原出參數。又,在步驟S20-p中,高頻頻帶解碼部20p 係根據該當參數、及已被解碼部2〇ai或解碼部20a2所復 原之低頻頻帶之音訊訊號,生成高頻頻帶之音訊訊號,將 該當高頻頻帶之音訊訊號輸出至合成部20m。 接著,藉由步驟S20-r中的判定而將立體聲訊號判斷 成爲處理對象的時候,於後續的步驟S20-q中,立體聲解 碼部20q係將解碼對象訊框中所含之編碼資料予以解碼, 以將上述的參數、平衡因子、及側旁訊號之波形予以復原 。又,在步驟S20-q中,立體聲解碼部20q係使用已復原 之參數、平衡因子、及側旁訊號之波形、以及已被解碼部 2〇曰1或解碼部2〇32復原的低頻頻帶的單聲道之音訊訊號 ’而將立體聲訊號予以復原。 -49- 201222531 接著,在步驟S20-m中,合成部20m係將已被解碼 部2〇ai或解碼部20a2所復原之低頻頻帶之音訊訊號、和 已被高頻頻帶解碼部2 0p所生成之高頻頻帶之音訊訊號加 以合成,以生成解碼音訊訊號。又,若以立體聲訊號爲處 理對象時,則合成部20m係也會使用來自立體聲解碼部 20q的輸入訊號(立體聲訊號),以復原立體聲音訊訊號 。然後,處理係前進至步驟S20-13。 在步驟S20-13中,會判定是否還有尙未解碼的訊框 。若沒有尙未解碼之訊框存在,則結束處理。另一方面, 若有尙未解碼的訊框存在時,則以該當訊框(超級訊框) 爲對象,而繼續從步驟S20-6起之處理。 以下說明,可使電腦動作成爲音訊解碼裝置20的音 訊解碼程式。圖25係爲再另一實施形態所述之音訊解碼 程式的圖示。 圖25所示的音訊解碼程式P 20,係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P2〇,係可與音訊 編碼程式P10同樣地提供。 音訊解碼程式P20係具備:ACELP解碼模組M2〇ai、 TCX解碼模組M20a2、抽出模組M20b、選擇模組M20c、 標頭解析模組M20d、Mode bits抽出模組M20e、解碼處 理選擇模組M20f、高頻頻帶解碼模組M20P、立體聲解碼 模組M20q、及合成模組M20m。 ACELP解碼模組M2〇ai、TCX解碼模組M20a2、抽出 模組M20b、選擇模組M20c、標頭解析模組M20d、Mode -50- 201222531 bits抽出模組M20e、解碼處理選擇模組M20f、高頻頻帶 解碼模組Μ 2 0 p、立體聲解碼模組Μ 2 0 q、合成模組Μ 2 0 m ,係、令電腦執行分別與ACELP解碼部2〇ai、TCX解碼 部20a2、抽出部20b、選擇部20c、標頭解析部20d、 Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶解 碼部20p、立體聲解碼部20q、合成部20m相同之機能。 以下,說明再另一實施形態的音訊編碼裝置。圖26 係再另一實施形態所述之音訊編碼裝置的圖示。圖26所 示的音訊編碼裝置22,係可切換第1複數訊框之音訊訊 號之編碼時所使用的音訊編碼處理、和後述的第2複數訊 框之音訊訊號之編碼時所使用的音訊編碼處理。 音訊編碼裝置22,係和音訊編碼裝置10同樣地,具 備編碼部lOai-lOa»。音訊編碼裝置22,係還具備生成 部22c、選擇部2 2b、輸出部22d、及檢查部22e。 檢查部22e,係監視著往輸入端子In2之輸入,接受 被輸入至輸入端子In2的輸入資訊。輸入資訊係爲,用來 特定出複數訊框之編碼時所共通使用之音訊編碼處理用的 資訊。 選擇部22b,係選擇出相應於輸入資訊的編碼部。具 體而言,選擇部22b係控制開關SW,而將被輸入至輸入 端子Ini的音訊訊號,結合至會執行被輸入資訊所特定之 音訊編碼處理的編碼部。選擇部22b,係繼續單一編碼部 之選擇,直到有下個輸入資訊被輸入至檢查部22 e。 生成部22c,係在每次藉由檢査部22e而接收了輸入 -51 - 201222531 資訊時,就基於該當輸入資訊而生成用來表示複 經被使用共通之編碼處理之事實的長期編碼處理 輸出部22d,係一旦藉由生成部22c而生成 碼處理資訊,就將該當長期編碼處理資訊對複數 附加。圖27係圖26所示之音訊編碼裝置所生成 圖示。如圖2 7所示,長期編碼處理資訊係被附 訊框當中的開頭訊框。在圖2 7所示的例子中係 1訊框至第1-1訊框的複數訊框是被共通的編碼 碼,在第1訊框中會切換編碼處理,第1訊框至 的複數訊框是被共通的編碼處理進行編碼。 以下,說明音訊編碼裝置22之動作,和一 所述之音訊編碼方法。圖2 8係再另一實施形態 訊編碼方法的流程圖。 如圖2 8所示,在一實施形態中,係於步驟 ,檢查部22e係監視著輸入資訊之輸入。一旦輸 輸入,則於步驟S22-2中,選擇部22b係選擇出 入資訊的編碼部。 接著,在步驟S22-3中,選擇部22b係基於 而生成長期編碼處理資訊。長期編碼處理資訊, S22-4中,藉由輸出部22d,而被附加至複數訊 開頭訊框。 然後,於步驟S22-5中,編碼對象訊框的音 係被已被選擇之編碼部所編碼。此外,直到下個 被輸入爲止的期間,係不經過步驟S22-2〜S22· 數訊框曾 資訊。 了長期編 訊框進行 之串流的 加至複數 表示,第 處理所編 第m訊框 實施形態 所述之音 S22-1 中 入資訊被 相應於輸 輸入資訊 係於步驟 框當中的 訊訊號, 輸入資訊 4的處理 -52- 201222531 ,就將編碼對象訊框的音訊訊號予以編碼。 接著,在步驟S22-6中,已被編碼的編碼序列’係被 包含在編碼對象訊框所對應之位元串流內的訊框中然後從 輸出部22d輸出。 接著,在步驟S22-7中,判定是否有尙未編碼的訊框 存在。若沒有尙未編碼之訊框存在,則結束處理。另一方 面,.若還有尙未編碼之訊框存在時,則繼續從步驟S22-1 起的處理。 以下說明,可使電腦動作成爲音訊編碼裝置22的音 訊編碼程式。圖29係爲再另一實施形態所述之音訊編碼 程式的圖示。 圖29所示的音訊編碼程式P22,係可在圖5及圖6 所示的電腦中使用。又,音訊編碼程式P22,係可與音訊 編碼程式P 1 0同樣地提供。 如圖29所示,音訊編碼程式P22係具備:編碼模組 部Ml〇ai〜i〇an、生成模組M22c、選擇模組M22b、輸出 模組M22d、及檢查模組M22e。 編碼模組部Ml〇ai〜10an、生成模組M22c、選擇模 組M22b、輸出模組M22d、檢查模組M22e,係令電腦 Cl〇執行分別與編碼部i〇ai〜 10an、生成部22c、選擇部 22b、輸出部22d、檢査部22e相同之機能。 以下’說明可將音訊編碼裝置22所生成之串流予以 解碼的音訊解碼裝置。圖30係再另一實施形態所述之音 訊解碼裝置的圖示。 -53- 201222531 圖30所示的音訊解碼裝置24,係和音訊解碼裝置12 同樣地,具備解碼部12a! 〜12an。音訊解碼裝置24,係 還具備有抽出部2 4b、選擇部24c、檢査部2 4d。 檢查部24d係檢查,被輸入至輸入端子In的串流內 的各訊框中,是否含有長期編碼處理資訊。抽出部24b, 係一旦藉由檢查部24d而判斷在訊框中含有長期編碼處理 資訊,則從該當訊框抽出長期編碼處理資訊。又,抽出部 24b係在摘除了長期編碼處理資訊之後,將訊框送出至開 關SW。 選擇部24c,係一旦藉由抽出部24b而抽出長期編碼 處理資訊,則控制開關SW,選擇會執行基於該當長期編 碼處理資訊而被特定之編碼處理所對應之音訊解碼處理的 解碼部。選擇部24c,係直到藉由檢査部24d而抽出下個 長期編碼處理資訊爲止的期間,會持續選擇單一的解碼部 ,將複數訊框的編碼序列持續以共通的音訊解碼處理進行 解碼。 以下,說明音訊解碼裝置24之動作,和一實施形態 所述之音訊解碼方法。圖31係再另一實施形態所述之音 訊解碼方法的流程圖。 如圖3 1所示,在一實施形態中’係於步驟S 2 4 -1中 ,檢查部24d係監視所被輸入之訊框中是否含有長期編碼 處理資訊。若由檢查部24d偵測出長期編碼處理資訊,則 在後續的步驟S24-2中,抽出部24b係從訊框抽出長期編 碼處理資訊。 -54- 201222531 接著,在步驟S24-3中’選擇部24c係基於已被抽出 的長期編碼處理資訊而選擇適切的解碼部。在後續的步驟 S 2 4-4中,已被選擇的解碼部,係將解碼對象訊框的編碼 序列,予以解碼。 然後,在步驟S24-5中’會進行是否還有尙未解碼之 訊框存在的判定。若沒有尙未解碼之訊框存在’則結束處 理。另一方面,若還有尙未解碼之訊框存在時,則繼續從 步驟S24_l起的處理。 在本實施形態中,於步驟S24_1中若判定訊框裡沒有 被附加長期編碼處理資訊’則不經過步驟S24·2〜步驟 S24-3之處理,就執行步驟S24-4之處理。 以下說明,可使電腦動作成爲音訊解碼裝置24的音 訊解碼程式。圖32係爲再另一實施形態所述之音訊解碼 程式的圖示。 圖32所示的音訊解碼程式P24,係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P24 ’係可與音訊 編碼程式p 1 〇同樣地提供。 如圖32所示,音訊解碼程式P24係具備:解碼模組 MUa^Uan、抽出模組M24b、選擇模組M24c、及檢査 模組M24d。 解碼模組M12ai〜12an、抽出模組M24b、選擇模組 M24c、檢查模組M24d,係令電腦C 1 0執行分別與解碼部 12&1〜12 311、抽出部2 413、選擇部24(:、檢查部24(1相同 之機能。 -55- 201222531 以下,說明再另一實施形態所述之音訊編碼裝置。圖 33係再另一實施形態所述之音訊編碼裝置的圖示。又, 圖34係依照先前之MPEG U SAC所生成的串流與圖33所 示的音訊編碼裝置所生成的串流的圖示。 在上述的音訊編碼裝置14中,是可將所有訊框的音 訊訊號以單一的共通之音訊編碼處理來進行編碼,或將各 訊框的音訊訊號以個別的音訊編碼處理來進行編碼。 另一方面,圖33所示的音訊編碼裝置26,係對複數 訊框當中的部分複數訊框,使用共通之音訊編碼處理。又 ,音訊編碼裝置26,係亦可對全部訊框當中的部分訊框 ,使用個別之音訊編碼處理。甚至,音訊編碼裝置26係 可對全部訊框當中的中間訊框起算之複數訊框,使用共通 之音訊編碼處理。 如圖33所示,音訊編碼裝置26係和音訊編碼裝置 14同樣地,具備:ACELP編碼部14a丨、TCX編碼部14a2 、Modified AAC 編碼部 14a3、第 1 判定部 14f、 core_mode生成部14g、第2判定部14h、lpd_mode生成 部14i、MPS編碼部14m、及、SBR編碼部14η。音訊編 碼裝置26,係還具備檢查部26j、選擇部26b、生成部 26c、輸出部26d、及標頭生成部26e。以下,在音訊編碼 裝置26之要素當中,針對與音訊編碼裝置14不同的要素 ,加以說明。 檢査部26j,係檢查是否有輸入資訊被輸入至輸入端 子In2。輸入資訊是表示,是否將複數訊框之音訊訊號以 -56- 201222531 共通的音訊編碼處理進行編碼的資訊。 選擇部26b,係一旦藉由檢查部26j而偵測到輸入資 訊,就會控制開關SW1。具體而言,選擇部26b係當偵測 到的輸入資訊是表示要將複數訊框之音訊訊號以共通的音 訊編碼處理進行編碼時,則控制開關S W1,而將開關 SW1與ACELP編碼部14a,結合。另一方面,當偵測到的 輸入資訊是表示不要將複數訊框之音訊訊號以共通的音訊 編碼處理進行編碼時,則選擇部26b係控制開關SW1,而 將開關SW1結合至含有第1判定部14f等的路徑。 生成部26c,係一旦藉由檢查部26j而偵測到輸入資 訊,則將該時點的編碼對象訊框所對應之輸出訊框用的 GEM_ID予以生成。具體而言,生成部26c係當偵測到的 輸入資訊是表示要將複數訊框之音訊訊號以共通的音訊編 碼處理進行編碼時,則將GEM_ID之値設定成「1」。另 —方面,當偵測到的輸入資訊是表示不要將複數訊框之音 訊訊號以共通的音訊編碼處理進行編碼時,則生成部26c 係將GEM_ID之値設定成「0」。 標頭生成部2 6 e,係一旦藉由檢查部2 6 j而偵測到輸 入資訊,則生成該時點的編碼對象訊框所對應之輸出訊框 的標頭,使該當標頭內含有被生成部26c所生成的 gem_id。
輸出部26d,係將含有已被生成之編碼序列的輸出訊 框,予以輸出。又,輸出部26d,係使各輸出訊框中,含 有被MPS編碼部14m所生成之參數的編碼資料及被SBR -57- 201222531 編碼部14η所生成之參數的編碼資料。此外,輸出訊框係 在藉由檢查部26j而偵測到輸入資訊的情況下,則含有已 被標頭生成部2 6e所生成之標頭。 以下,說明音訊編碼裝置26之動作,和再另一實施 形態所述之音訊編碼方法。圖3 5係再另一實施形態所述 之音訊編碼方法的流程圖。 在圖35所示的流程中,步驟S14-3〜4、步驟S14-9 〜19、步驟S14-m〜步驟S14-n之處理,係和圖13所示 者相同。以下,針對與圖13所示流程不同的處理,加以 說明。 如圖3 5所示,在一實施形態中,係在步驟S 2 6 - a中 ,將GEM_ID之値予以初期化。GEM_ID之値係例如會被 初期化成「〇」。在步驟S26-1中,檢查部26j係如上述 般地監視著輸入資訊。若偵測出有輸入資訊被輸入,則在 後續的步驟S26-2中,生成部26c會生成符合該當輸入資 訊的GEM_ID,在後續的步驟S26-3中,標頭生成部26e 係設定含有已被設定之GEM-1 D的標頭。另一方面’當沒 有輸入資訊時,則不經過步驟S26-2及S 26-3之處理,處 理就前進至步驟S14-P。 在步驟S26-4中,會判斷是否附加標頭。一旦被檢查 部26j偵測到輸入資訊’則對該時點之編碼對象訊框所對 應的輸出訊框,在步驟S26·5中’會被附加含有gEM_ID 的標頭,將含有該當標頭的訊框予以輸出。另一方面’當 未偵測到輸入資訊時’則該時點上的編碼對象訊框所對應 -58- 201222531 的輸出訊框,係在步驟S26-6中直接被輸出。 接著,在步驟S26-7中,判定是否有尙未編碼的訊框 存在。若沒有尙未編碼之訊框存在,則結束處理。另一方 面,若還有尙未編碼之訊框存在時,則以尙未編碼之訊框 爲對象而繼續步驟S26-1起的處理。 若依據以上說明的音訊編碼裝置26及一實施形態所 述之音訊編碼方法,則可將複數訊框以共通之音訊編碼處 理進行編碼,其後,將數個訊框以個別之音訊編碼處理進 行編碼,將更後續的複數訊框以共通之音訊編碼處理進行 編碼。 此外,在音訊編碼裝置26中,雖然是基於輸入資訊 來決定複數訊框之音訊訊號之編碼時所要共通使用的音訊 編碼處理,但本發明係亦可基於各訊框的音訊訊號的解析 結果,來選擇出複數訊框所要共通使用的音訊編碼處理。 例如,亦可在輸入端子Ini與開關SW1之間,含有解析 各訊框之音訊訊號的解析部,基於該解析結果,來令選擇 部26b及生成部26c作動。又,該解析係可使用上述的解 析手法》 又,亦可將所有訊框的音訊訊號,先一度結合至含有 第1判定部14f的路徑,將含有編碼序列的輸出訊框’積 存在輸出部2 6 d中。此情況下,係可使用第1判定部1 4 f 及第 2判定部14h的判定結果’而將lpd_mode、 core_mode等之設定、標頭之生成、附加等,針對各訊框 而在事後做調整。 -59- 201222531 此外,亦可進行所定數之訊框之解析、或對所定數之 訊框進行第1判定部14f及第2判定部的判定,而使用該 當所定數之訊框之解析結果或判定結果,來預測含有該當 所定數之訊框的複數訊框所要共通利用的編碼處理。 又,複數訊框要使用共通之編碼處理或是使用個別之 編碼處理,係可以使包含core_mode、lpd_mode、及標頭 等之附加資訊的量較少的方式,來加以決定。 以下說明,可使電腦動作成爲音訊編碼裝置26的音 訊編碼程式。圖36係爲再另一實施形態所述之音訊編碼 程式的圖示。 圖36所示的音訊編碼程式P26,係可在圖5及圖6 所示的電腦中使用。又,音訊編碼程式P26,係可與音訊 編碼程式P 1 0同樣地提供。 如圖36所示,音訊編碼程式P26係具備:ACELP編 碼模組M14ai、TCX編碼模組M14a2、Modified AAC編碼 模組M14a3、第1判定模組M14f、core_mode生成模組 M14g、第2判定模組M14h、lpd_mode生成模組M14i、 MPS編碼模組M14m、SBR編碼模組 M14n、檢查模組 M2 6j、選擇模組M2 6b、生成模組M2 6c、輸出模組M26d 、及標頭生成模組M26e。 ACELP編碼模組M14a!、TCX編碼模組 M14a2、 Modified AAC編碼模組M14a3、第1判定模組M14f、 core_mode 生成模組 M14g、第 2 判定模組 M14h、 lpd_mode生成模組M14i、MPS編碼模組M14m、SBR編 -60- 201222531 碼模組M14n、檢查模組M26j、選擇模組M26b、生成模 組M26c、輸出模組M26d、標頭生成模組M26e,係令電 腦C10執行分別與ACELP編碼部14ai、TCX編碼部14a2 ' Modified AAC 編碼部 14a3、第 1 判定部 l4f、 core_mode生成部14g、第2判定部14h、lpd_mode生成 部14i、MPS編碼部14m、SBR編碼部14η、檢查部26j、 選擇部26b、生成部26c、輸出部26d、標頭生成部26e 相同之機能。 以下’說明可將音訊編碼裝置26所生成之串流予以 解碼的音訊解碼裝置。圖3 7係再另一實施形態所述之音 訊解碼裝置的圖示。 圖37所示的音訊解碼裝置28,係和音訊解碼裝置16 同樣地’具備:ACELP解碼部16a,、TCX解碼部16a2、 Modified AAC 解碼部 16a3、core_mode 抽出部 16e、第 1 選擇部16f、lpd_mode抽出部I6g、第2選擇部16h、 MPS解碼部16m、及SBR解碼部16η。音訊解碼裝置28 ’係還具備有標頭檢査部28j、標頭解析部28d、抽出部 28b、及選擇部28c。以下,在音訊解碼裝置28之要素當 中,針對與音訊解碼裝置16不同的要素,加以說明。 標頭檢查部2 8j,係監視著被輸入至輸入端子In的各 訊框中是否有標頭存在。標頭解析部28d,係一旦藉由標 頭檢查部28j而偵測出訊框中有標頭存在,則將該當標頭 予以分離。抽出部28b’係從已被抽出之標頭中,抽出 GEM ID。 -61 - 201222531 選擇部28c係隨著已被抽出的GEM_ID,來控制開關 SW1。具體而言,當GEM_ID之値是「1」時,則選擇部 2 8c係控制開關SW1,直到下次GEM_ID被抽出以前,會 —直使從標頭解析部28d所送出的訊框,被結合至 ACELP 解碼部 16at。 另一方面,當GEM_ID之値是「〇」時,則選擇部 28c係將從標頭解析部 28d所送出的訊框,結合至 core — mode 抽出咅16e。 以下,說明音訊解碼裝置28的動作,與再另一實施 形態所述之音訊解碼方法。圖3 8係再另一實施形態所述 之音訊解碼方法的流程圖。 圖38中的含有「S16」之參照符號所特定的處理,是 和圖16中的對應處理相同之處理。以下,在圖38的處理 當中,針對與圖16所示處理不同之處理,加以說明。 如圖3 8所示,在一實施形態中,係於步驟S 2 8 -1中 ,標頭檢査部2 8 j會監視著所被輸入的訊框中是否含有標 頭。當訊框中含有標頭時,則在後續的步驟S2 8-2中,標 頭解析部28d會從該當訊框中分離出標頭。然後,在步驟 S28-3中,抽出部28b係從標頭中抽出GEM_ID。另一方 面,當訊框中不含標頭時,則在步驟S 2 8-4中,前一個被 抽出之 GEM_ID會被複製,以後就利用所被複製的 GEM_ID。 在步驟S28-5中,會進行是否還有尙未解碼之訊框存 在的判定。若沒有尙未解碼之訊框存在,則結束處理。另 -62- 201222531 —方面,若有尙未解碼的訊框存在時’則以尙未解碼之訊 框爲對象,而繼續從步驟S28·1起之處理。 又,在步驟S28-6中’會進行是否還有尙未解碼之訊 框存在的判定。若沒有尙未解碼之訊框存在’則結束處理 。另一方面,若有尙未解碼的訊框存在時’則以尙未解碼 之訊框爲對象,而繼續從步驟S28·1起之處理。 以下說明,可使電腦動作成爲音訊解碼裝置28的音 訊解碼程式。圖39係爲再另一實施形態所述之音訊解碼 程式的圖示。 圖39所示的音訊解碼程式P28’係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P28’係可與音訊 編碼程式P 1 0同樣地提供。 如圖39所示,音訊解碼程式P28係具備:ACELP解 碼模組MWa!、TCX解碼模組M16a2、Modified AAC解碼 模組Μ 1 6 a 3、c 〇 r e _ m 〇 d e抽出模組Μ 1 6 e、第1選擇模組 M16f、lpd_mode抽出模組M16g、第2選擇模組M16h、 Μ P S解碼模組Μ 1 6 m、S B R解碼模組Μ 1 6 η、標頭檢查模 組M28j、標頭解析模組M28d、抽出模組M28b、及選擇 模組Μ 2 8 c。 ACELP解碼模組 Ml 6a!、TCX解碼模組 Ml 6a2、 Modified AAC 解碼模組 Μ1 6a3、core_mode 抽出模組 M16e、第1選擇模組M16f、lpd_mode抽出模組M16g、 第2選擇模組M16h、MPS解碼模組M16m、SBR解碼模 組Μ 1 6 η、標頭檢查模組M2 8j、標頭解析模組M2 8 d、抽 -63- 201222531 出模組M2 8b、選擇模組M2 8c,係令電腦CIO執行分別與 ACELP 解碼部 1 6a,、TCX 解碼部 1 6a2、Modified AAC 解 碼部16a3、core_mode抽出部16e、第1選擇部16f、 lpd_mode抽出部16g、第2選擇部16h、MPS解碼部16m 、SBR解碼部1 6n、標頭檢查部28j、標頭解析部28d、抽 出部28b、選擇部28c相同之機能。 以下,說明再另一實施形態所述之音訊編碼裝置。圖 40係再另一實施形態所述之音訊編碼裝置的圖示。圖41 係圖40所示之音訊編碼裝置所生成之串流的圖示。 圖40所示的音訊編碼裝置30,係除了輸出部30d以 外,其餘具有和音訊編碼裝置22之對應要素相同的要素 。亦即,在音訊編碼裝置30中,當GEM_ID被生成時, 輸出訊框係以含有長期編碼處理資訊的第1訊框類型之輸 出訊框的方式,而被從輸出部3 0 d輸出。另一方面,若長 期編碼處理資訊未被生成時,則輸出訊框係以不含長期編 碼處理資訊的第2訊框類型之輸出訊框的方式,而被從輸 出部30d輸出。 圖4 2係再另一實施形態所述之音訊編碼方法的流程 圖。以下’參照圖42’說明音訊編碼裝置30之動作,和 再另一實施形態所述之音訊編碼方法。此外,圖42所示 的流程,係步驟S30-1及步驟S30-2之處理以外,均和圖 28所示的流程相同。因此’以下針對步驟S3 0-1及步驟 S30-2加以說明。 步驟S30-1中’一旦輸入資訊是被步驟S22-1所輸入 -64 - 201222531 ,則輸出部30d係將此時的編碼對象訊框所對應之輸出訊 框,設定成會含有長期編碼處理資訊的第1訊框類型。另 —方面,若輸入資訊未被步驟S22-1所輸入,則在步驟 S 30-2中,輸出部30d係將此時的編碼對象訊框所對應之 輸出訊框,設定成不含長期編碼處理資訊的第2訊框類型 。此外,在一實施形態中,音訊訊號的最初訊框被輸入之 際,輸入訊號係被輸入,該當最初之訊框所對應的輸出訊 框,會被設定成第1訊框類型。 如此,藉由隨著長期編碼處理資訊之有無來變更訊框 類型,亦可將長期編碼處理資訊通知給解碼側。 以下說明,可使電腦動作成爲音訊編碼裝置30的音 訊編碼程式。圖43係爲再另一實施形態所述之音訊編碼 程式的圖示。 圖43所示的音訊編碼程式P30,係可在圖5及圖6 所示的電腦中使用。又,音訊編碼程式P30,係可與音訊 編碼程式P10同樣地提供。 如圖43所示,音訊編碼程式P30係具備:編碼模組 部Ml〇ai〜10an、生成模組M22c、選擇模組M22b、輸出 模組M3 0d、及檢查模組M22p 編碼模組部MlOa,〜10an、生成模組M22c、選擇模 組M22b、輸出模組M30d、檢查模組M22e,係令電腦 C10執行分別與編碼部l〇ai〜10an、生成部22c、選擇部 22b、輸出部30d、檢查部22e相同之機能。 以下,說明可將音訊編碼裝置3 0所生成之串流予以 -65- 201222531 解碼的音訊解碼裝置。圖44係再另一實施形態所述之音 訊解碼裝置的圖示。圖44所示的音訊解碼裝置32,係除 了抽出部32b及訊框類型檢查部32d以外,還具有與音訊 解碼裝置24中的對應要素相同的要素。以下說明抽出部 32b及訊框類型檢查部32d。 訊框類型檢查部32d,係檢查被輸入至輸入端子In 之串流中的各訊框的訊框類型。具體而言,訊框類型檢查 部32d係當解碼對象訊框是第1訊框類型的訊框時,則將 該當訊框提供給抽出部30b及開關SW1。另一方面,訊框 類型檢査部32d係當解碼對象訊框是第2訊框類型的訊框 時,則將該當訊框僅送出給開關SW1。抽出部32b,係從 訊框類型檢查部3 2d所收到的訊框內,抽出長期編碼處理 資訊,將該當長期編碼處理資訊提供給選擇部24c。 圖45係再另一實施形態所述之音訊解碼方法的流程 圖。以下,參照圖45,說明音訊解碼裝置32之動作、及 再另一實施形態所述之音訊解碼方法。此外,在圖45所 示的流程中,含有「S24」之參照符號所示的處理,是和 圖31所示的對應處理相同之處理。以下,針對與圖3 1所 示處理不同的步驟S3 2-1及步驟S32-2加以說明。 在步驟S32-1中,訊框類型檢查部32d係解析解碼對 象訊框是否爲第1訊框類型之訊框。在後續的步驟S32-2 中,若判定解碼對象訊框是第1訊框類型之訊框,則在步 驟S24-2中,藉由抽出部3 2b而從該當訊框選擇出長期編 碼處理資訊。另一方面,在步驟S3 2-2之判定中、若判定 -66- 201222531 解碼對象訊框不是第1訊框類型之訊框,則處理係前進至 步驟S24-4。亦即,一旦在步驟S24-3中解碼部被選擇, 則直到下次第1訊框類型之訊框被輸入之前,會一直持續 使用共通的解碼部。 以下說明,可使電腦動作成爲音訊解碼裝置32的音 訊解碼程式。圖46係爲再另一實施形態所述之音訊解碼 程式的圖示。 圖46所示的音訊解碼程式P32,係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P 3 2,係可與音訊 編碼程式P 1 0同樣地提供。 如圖46所示,音訊解碼程式P24係具備:解碼模組 M12ai〜12an、抽出模組M32b、選擇模組M24c、及訊框 類型檢査模組Μ 3 2 d。 解碼模組M12ai〜 12an、抽出模組M32b、選擇模組 M24c、訊框類型檢查模組M3 2d,係令電腦C10執行分別 與解碼部12ai〜12an '抽出部32b、選擇部24c、訊框類 型檢查部32d相同之機能。 以下,說明再另一實施形態的音訊編碼裝置。圖47 係再另一實施形態所述之音訊編碼裝置的圖示。圖47所 示的音訊編碼裝置34,係在以下所說明的部分,是與音 訊編碼裝置1 8不同。亦即,音訊編碼裝置3 4係可在所被 輸入的複數訊框當中,對一部分連續的複數訊框使用共通 之音訊編碼處理’對另一部分之訊框則是使用個別之音訊 編碼處理。又’音訊編碼裝置34係可對第1複數訊框使 -67- 201222531 用共通之音訊編碼處理,對後續之一部分訊框使用個別之 音訊編碼處理,對更後續的第2複數訊框使用共通之音訊 編碼處理。圖48係依照先前之AMR-WB +所生成的串流 與圖47所示的音訊編碼裝置所生成的串流的圖示。如圖 48所示’音訊編碼裝置34係可輸出含有GEM_ID的第1 訊框類型之訊框、及不含GEM_ID的第2訊框類型之訊框 〇 如圖47所示,音訊編碼裝置34係和音訊編碼裝置 18同樣地’具備:ACELP編碼部18a!、TCX編碼部18a2 、編碼處理判定部18f、Mode bits生成部18g、分析部 18m、縮減混音部18η、高頻頻帶編碼部18p、及立體聲 編碼部18q。音訊編碼裝置34係還具備:檢查部3 4e、選 擇部34b、生成部34c、及輸出部34d。以下,在音訊編 碼裝置34之要素當中,針對與音訊編碼裝置18之要素不 同的要素,加以說明。 檢查部34e,係監視著往輸入端子In2的輸入資訊之 輸入。輸入資訊是表示,是否對複數訊框之音訊訊號使用 共通之編碼處理的資訊。選擇部34b係一旦藉由檢查部偵 測到輸入資訊之輸入,則判定輸入資訊是否表示要對複數 訊框之音訊訊號使用共通之編碼處理。輸入資訊是表示要 對複數訊框之音訊訊號使用共通之編碼處理時,則選擇部 3 4b係控制開關SW1,而將開關SW1結合至ACElp編碼 部1 8 a!。該結合係一直維持直到下次偵測到輸入資訊之輸 入爲止。另一方面,輸入資訊並非表示要對複數訊框之音 -68- 201222531 訊訊號使用共通之編碼處理時,亦即,輸入資訊是表示對 編碼對象訊框使用個別之編碼處理時,則選擇部34b係將 開關SW1結合至含有編碼處理判定部I8f等之路徑。 生成部3 4c,係一旦藉由檢查部而偵測到輸入資訊之 輸入,則生成具有相應於輸入資訊之値的GEM_ID。具體 而言,若輸入資訊是表示對複數訊框之音訊訊號使用共通 之編碼處理時,則生成部34c係將GEM_ID之値設定成「 1」。另一方面,若輸入資訊並非表示對複數訊框之音訊 訊號使用共通之編碼處理時,則生成部34c係將GEM_ID 之値設定成「〇」。 輸出部34d係當藉由檢查部34e而偵測到輸入資訊時 ,則將該時點之編碼對象訊框所對應的輸出訊框設成第1 訊框類型之輸出訊框,使該當輸出訊框中含有生成部34c 所生成之GEM_ID,並含有編碼對象訊框之音訊訊號的編 碼序列。輸出部34d係當GEM_ID之値爲0時,則使輸出 訊框中含有Mode bits[k]。另一方面,當藉由檢查部34e 而未偵測到輸入資訊時,則將該時點之編碼對象訊框所對 應的輸出訊框設成第2訊框類型之輸出訊框,使該當輸出 訊框中含有編碼對象訊框之音訊訊號的編碼序列。輸出部 3 4d係將如此生成的輸出訊框予以輸出。 圖49係再另一實施形態所述之音訊編碼方法的流程 圖。以下,參照圖49,說明音訊編碼裝置34之動作,和 再另一實施形態所述之音訊編碼方法。此外,在圖49所 示的流程中,含有「S18」之參照符號所示的處理,是和 -69- 201222531 圖21中的對應處理相同。以下,在圖49所示之流程中的 處理當中,針對與圖21之處理不同的處理,加以說明。 如圖49所示,在一實施形態中,係於步驟S34-1中 ,檢查部3 4e,係監視著往輸入端子In2的輸入資訊之輸 入。當偵測到輸入資訊之輸入時,則在後續的步驟S34-2 中,編碼對象訊框所對應之輸出訊框係被設成第1訊框類 型之輸出訊框。另一方面,當未偵測到輸入資訊之輸入時 ,則在後續的步驟S3 4-3中,編碼對象訊框所對應之輸出 訊框係被設成第2訊框類型之輸出訊框。 接著,在步驟S34-4中,d定輸入資訊是否表示對每 —訊框指定編碼處理。亦即,判定輸入資訊是否表示對複 數訊框使用共通之編碼處理。輸入資訊是表示對複數訊框 使用共通之編碼處理時,則在後續的步驟S34-5中, GEM_ID之値係被設定成「1」。另一方面,輸入資訊並 非表示對複數訊框使用共通之編碼處理時,則在後續的步 驟S34-6中,GEM_ID之値係被設定成「〇」。 在步驟S34-7中,會判斷是否附加GEM_ID。具體而 言’當正在處理輸入資訊之輸入被偵測到時的編碼對象訊 框時,在後續的步驟S34-8中,會輸出被附加GEM_ID、 含有編碼序列的第1訊框類型之輸出訊框。另一方面,當 正在處理輸入資訊之輸入未被偵測到時的編碼對象訊框時 ’在後續的步驟S3 4-9中,會輸出含有編碼序列的第2訊 框類型之輸出訊框。 接著,在步驟S34-10中,判定是否有尙未編碼的訊 -70- 201222531 框存在。若沒有尙未編碼之訊框存在,則結束處理。另一 方面,若還有尙未編碼之訊框存在時,則以該當訊框爲對 象而繼續從步驟S34-1起的處理。 以下說明,可使電腦動作成爲音訊編碼裝置34的音 訊編碼程式。圖5 0係爲再另一實施形態所述之音訊編碼 程式的圖示。 圖50所示的音訊編碼程式P34,係可在圖5及圖6 所示的電腦中使用。又,音訊編碼程式P34,係可與音訊 編碼程式P10同樣地提供。 音訊編碼程式P34係具備:ACELP編碼模組Ml 8a,、 TCX編碼模組M18a2、選擇模組M34b、生成模組M34c、 輸出模組M34d、編碼處理判定模組M18f、Mode bits生 成模組Ml 8g、分析模組Ml 8m、縮減混音模組Ml 8n、高 頻頻帶編碼模組Μ 1 8 p、及、立體聲編碼模組Μ 1 8 q CELP編碼模組Ml 8a!、TCX編碼模組Ml 8a2、選擇 模組M34b、生成模組M34c、輸出模組M34d、編碼處理 判定模組Ml 8f、Mode bits生成模組Ml 8g、分析模組 Ml 8m、縮減混音模組Ml 8n、高頻頻帶編碼模組Ml 8p、 立體聲編碼模組Μ 1 8 q,係令電腦C 1 0執行分別與A C E L P 編碼部18ai、TCX編碼部I8a2、選擇部34b、生成部34c '輸出部34d、編碼處理判定部i 8f、Mode bits生成部 1 8g、分析部1 8m、縮減混音部1 8η、高頻頻帶編碼部1 8p 、立體聲編碼部1 8 q相同之機能。 以下,說明可將音訊編碼裝置34所生成之串流予以 -71 - 201222531 解碼的音訊解碼裝置。圖51係再另一實施形態所述之音 訊解碼裝置的圖示。 圖51所示的音訊解碼裝置36,係和音訊解碼裝置20 同樣地,具備:ACELP解碼部2〇ai、TCX解碼部20a2、 Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶解 碼部20p、立體聲解碼部20q、及合成部20m。音訊解碼 裝置36,係還具備有訊框類型檢查部36d、抽出部3 6b、 及選擇部36c。以下,在音訊解碼裝置36之要素當中’ 針對與音訊解碼裝置20不同的要素,加以說明。 訊框類型檢查部36d,係檢査被輸入至輸入端子1n 之串流內的各訊框的訊框類型。訊框類型檢查部36d’係 將第1訊框類型之訊框,送出至抽出部36b、開關SW1、 高頻頻帶解碼部20p、及立體聲解碼部20q。另一方面, 訊框類型檢査部3 6d,係將第2訊框類型之訊框,僅送出 至開關SW1、高頻頻帶解碼部20p、及立體聲解碼部20q 〇 抽出部36b,係從訊框類型檢査部36d所接收到的訊 框中’抽出 GEM._ID。選擇部36c係隨著已被抽出的 GEM — ID之値,來控制開關SW1。具體而言,當GEM_ID 之値爲「1」時’選擇部36c係控制開關SW1,將解碼對 象訊框結合至ACELP解碼部2(^。藉此,當GEM_ID之 値是「1」時,則直到下次第1訊框類型之訊框被輸入之 前’會一直持續選擇ACELP解碼部20ai。另—&面,當 GEM_ID之値是「〇」時,則選擇部36c係控制開關SW1 -72- 201222531 ,而將解碼對象訊框結合至Mode bits抽出部20e。 圖52係再另一實施形態所述之音訊解碼方法的流程 圖。以下,參照圖52,說明音訊解碼裝置36之動作、與 再另一實施形態所述之音訊解碼方法。此外,在圖52所 示的流程的處理當中,含有「S20」之處理,是和圖24所 示的對應處理相同之處理。以下,在圖52所示之流程中 的處理當中,針對與圖24所示之處理不同的處理,加以 說明。 如圖52所示,在一實施形態中,係於步驟S36-1中 ,訊框類型檢査部3 6d係判定解碼對象訊框是否爲第1訊 框類型之訊框。若解碼對象訊框是第1訊框類型之訊框, 則在後續的步驟S36-2中,抽出部36b會抽出GEM_ID。 另一方面,若解碼對象訊框是第2訊框類型之訊框,則在 後續的步驟S36-3中,既存之GEM_ID會被複製,該當 GEMJD會被之後的處理所利用。 在步驟S3 6-4中,會判定是否還有尙未解碼之訊框存 在。若沒有尙未解碼之訊框存在,則結束處理。另一方面 ,若還有尙未解碼之訊框存在時,則以該當訊框爲對象而 繼續從步驟S 3 6 -1起的處理。 以下說明,可使電腦動作成爲音訊解碼裝置36的音 訊解碼程式。圖5 3係爲再另一實施形態所述之音訊解碼 程式的圖示。 圖53所示的音訊解碼程式P36,係可在圖5及圖6 所示的電腦中使用。又,音訊解碼程式P36,係可與音訊 -73- 201222531 編碼程式p 1 〇同樣地提供。 音訊解碼程式Ρ36係具備:ACELP解碼模組M2〇a|、 TCX解碼模組M20a2、抽出模組M36b、選擇模組M36c、 訊框類型檢查模組M36d、Mode bits抽出模組M20e、解 碼處理選擇模組M20f、高頻頻帶解碼模組M20p、立體聲 解碼模組M20q、及合成模組M20m。 ACELP解碼模組M20a,、TCX解碼模組M20a2、抽出 模組M36b、選擇模組M36c、訊框類型檢查模組M36d、 Mode bits抽出模組M20e、解碼處理選擇模組M20f、高 頻頻帶解碼模組M20p、立體聲解碼模組M20q、合成模組 M20m,係、令電腦執行分別與ACELP解碼部2〇a|、TCX 解碼部20a2、抽出部36b、選擇部36c、訊框類型檢查部 36d、Mode bits抽出部20e、解碼處理選擇部20f、高頻 頻帶解碼部20p、立體聲解碼部20q、合成部20m相同之 機能。 以上說明了本發明的各種實施形態。本發明係不限定 於上述實施形態,可做各種變形。例如,在上述的一部分 之實施形態中,ACELP編碼處理及ACELP解碼處理是可 分別被選擇來當做複數訊框所要共通使用的編碼處理及解 碼處理。然而,被共通使用的編碼處理及解碼處理係不限 定於ACELP編碼處理及解碼處理,亦可爲任意的音訊編 碼處理及音訊解碼處理。又,上述的GEM_ID,係亦可爲 被設定成任意位元大小及値的GEM_ID。 -74- 201222531 【圖式簡單說明】 [圖1]一實施形態所述之音訊編碼裝置的圖示。 [圖2]—實施形態所述之音訊編碼裝置所生成之串流 的圖示。 [圖3] —實施形態所述之音訊編碼方法的流程圖。 [圖4] 一實施形態所述之音訊編碼程式的圖示》 [圖5]—實施形態所述之電腦的硬體構成之圖示。 [圖6]—實施形態所述之電腦的斜視圖。 [圖7]變形樣態所述之音訊編碼裝置的圖示。 [圖8]—實施形態所述之音訊解碼裝置的圖示。 [圖9]一實施形態所述之音訊解碼方法的流程圖。 [圖10]—實施形態所述之音訊解碼程式的圖示。 [圖11]另一實施形態所述之音訊編碼裝置的圖示。 [圖12]依照先前之MPEG USAC所生成的串流與圖11 所示的音訊編碼裝置所生成的串流的圖示。 [圖13]另一實施形態所述之音訊編碼方法的流程圖。 [圖14]另一實施形態所述之音訊編碼程式的圖示。 [圖15]另一實施形態所述之音訊解碼裝置的圖示。 [圖16]另一實施形態所述之音訊解碼方法的流程圖。 [圖17]mod[k]與a ( mod[k])之關係的圖不。 [圖1 8]另一實施形態所述之音訊解碼程式的圖示。 [圖19]再另一實施形態所述之音訊編碼裝置的圖示。 [圖2 0]依照先前之AMR WB +所生成的串流與圖19所 示的音訊編碼裝置所生成的串流的圖示° -75- 201222531 [圖21]再另一實施形態所述之音訊編碼方法的流 〇 [圖22]再另—實施形態所述之音訊編碼程式的圖 [圖23]再另一實施形態所述之音訊解碼裝置的圖 [圖24]再另一實施形態所述之音訊解碼方法的流 〇 [圖25]再另一實施形態所述之音訊解碼程式的圖 [圖26]再另一實施形態所述之音訊編碼裝置的圖 [B 27]圖26所示之音訊編碼裝置所生成之串流 示。 [圖28]再另一實施形態所述之音訊編碼方法的流 〇 [圖29]再另一實施形態所述之音訊編碼程式的圖 [圖30]再另一實施形態所述之音訊解碼裝置的圖 [圖3 1 ]再另—實施形態所述之音訊解碼方法的流 〇 [圖32]再另一實施形態所述之音訊解碼程式的圖 [圖33]再另一實施形態所述之音訊編碼裝置的圖 [圖34]依照先前之MPEG USAC所生成的串流與 所示的音訊編碼裝置所生成的串流的圖示。 [圖35]再另一實施形態所述之音訊編碼方法的流 〇 [圖36]再另一實施形態所述之音訊編碼程式的圖 [圖3 7]再另一實施形態所述之音訊解碼裝置的圖 程圖 示。 不 。 程圖 不 ° 不 ° 的圖 程圖 不 ° 不 ° 程圖 示0 不 。 圖33 程圖 不 。 不 ° -76- 201222531 [圖38]再另一實施形態所述之音訊解碼方法的流程圖 〇 [圖3 9]再另一實施形態所述之音訊解碼程式的圖示。 [圖40]再另一實施形態所述之音訊編碼裝置的圖示。 [圖41]圖40所示之音訊編碼裝置所生成之串流的圖 不 ° [圖42]再另一實施形態所述之音訊編碼方法的流程圖 〇 [圖43]再另一實施形態所述之音訊編碼程式的圖示。 [圖44]再另一實施形態所述之音訊解碼裝置的圖示。 [圖45]再另一實施形態所述之音訊解碼方法的流程圖 〇 [圖46]再另一實施形態所述之音訊解碼程式的圖示。 [圖47]再另一實施形態所述之音訊編碼裝置的圖示。 [圖48]依照先前之AMR WB +所生成的串流與圖47所 示的音訊編碼裝置所生成的串流的圖示。 [圖49]再另一實施形態所述之音訊編碼方法的流程圖 〇 [圖50]再另一實施形態所述之音訊編碼程式的圖示。 [圖5 1 ]再另一實施形態所述之音訊解碼裝置的圖示。 [圖52]再另一實施形態所述之音訊解碼方法的流程圖 〇 [圖5 3]再另一實施形態所述之音訊解碼程式的圖示。 -77- 201222531 【主要元件符號說明】 1 0,1 0A :音訊編碼裝置 10ai〜10an:編碼部 l〇b :選擇部 l〇c :生成部 l〇d :輸出部 l〇e :解析部 1 2 :音訊解碼裝置 12a!〜12an :解碼部 12b :抽出部 12c :選擇部 1 4 :音訊編碼裝置 14a! · ACELP 編碼部 14a2 : TCX編碼部 14a3 : Modified AAC 編碼部 14b :選擇部 14c :生成部 1 4 d ·輸出部 14e :標頭生成部 14f :第1判定部 14g: core_mode 生成部 14h :第2判定部 14i: lpd_mode 生成部 14m : MPS編碼部 201222531 14η : SBR編碼部 1 6 :音訊解碼裝置 163! : ACELP 解碼部 16a2 : TCX解碼部 16a3 : Modified AAC 解碼部 16b :抽出部 16c :選擇部 1 6 d :標頭解析部 1 6e : core_mode 抽出部 16f :第1選擇部 1 6g · lpd_mode 抽出部 16h :第2選擇部 1 6m : MPS解碼部 1 6n : SBR解碼部 18 :音訊編碼裝置 1 8a 1 · ACELP 編碼部 18a2 : TCX編碼部 18b :選擇部 1 8 c :生成部 1 8 d :輸出部 18e :標頭生成部 18f :編碼處理判定部 18g : Mode bits 生成部 18m :分析部 -79 201222531 18η :縮減混音部 18ρ :高頻頻帶編碼部 18q :立體聲編碼部 20 :音訊解碼裝置 20a, : ACELP 解碼部 20a2 : TCX解碼部 2 0b :抽出部 20c :選擇部 2〇d :標頭解析部 20e : Mode bits 抽出部 20f :解碼處理選擇部 20m :合成部 2 〇p :高頻頻帶解碼部 2〇q :立體聲解碼部 22 :音訊編碼裝置 22b :選擇部 22c :生成部 22d :輸出部 22e :檢查部 24 :音訊解碼裝置 24b :抽出部 24c :選擇部 24d :檢查部 26 :音訊編碼裝置 -80- 201222531 26b :選擇部 26c :生成部 2 6d :輸出部 26e :標頭生成部 2 6j :檢查部 28 :音訊解碼裝置 28b :抽出部 28c :選擇部 28d :標頭解析部 28j :標頭檢查部 30 :音訊編碼裝置 3 0b :抽出部 30d :輸出部 3 2 :音訊解碼裝置 3 2b :抽出部 3 2d :訊框類型檢查部 34 :音訊編碼裝置 3 4b :選擇部 3 4 c :生成部 34d :輸出部 3 4e :檢查部 3 6 :音訊解碼裝置 36b :抽出部 36c :選擇部 -81 201222531 3 6d :訊框類型檢査部 C 1 0 :電腦 C 1 2 :讀取裝置 C 1 4 :作業用記憶體 C 1 6 :記憶體 C 1 8 :顯示裝置 C20 :滑鼠 C22 :鍵盤 C24 :通訊裝置
C26 : CPU
Ml〇ai〜M10an :編碼模組
Ml Ob :選擇模組 MIOc :生成模組 M10d :輸出模組 M12ai〜M12an :解碼模組
Ml 2b :抽出模組
Ml 2c :選擇模組 Μ 1 4 a, : A C E L P編碼模組 M14a2 : TCX編碼模組 M14a3 : Modified AAC 編碼模組
Ml 4b :選擇模組
Ml 4c :生成模組 M14d :輸出模組 M14e :標頭生成模組 -82- 201222531 M14f :第1判定模組 M14g: core_mode 生成模組 M14h :第2判定模組 M14i: lpd_mode 生成模組 M14m : MPS編碼模組 M14n : SBR編碼模組
Ml 6ai : ACELP解碼模組 M16a2 : TCX解碼模組 Μ 1 6a3 : Modified AAC 解碼模組
Ml 6b :抽出模組
Ml 6c :選擇模組 M16d :標頭解析模組 M16e: core_mode 抽出模組 M16f :第1選擇模組 M16g: lpd_mode 抽出模組 M16h :第2選擇模組 M16m: MPS解碼模組 M16n : SBR解碼模組
Ml 8ai : ACELP編碼模組
Ml 8a2 : TCX編碼模組
Ml 8b :選擇模組
Ml 8c :生成模組 Μ 1 8 d :輸出模組 M18e :標頭生成模組 -83- 201222531 M18f :編碼處理判定模組 M18g : Mode bits 生成模組
Ml 8m :分析模組
Ml 8η :縮減混音模組 Μ18ρ :高頻頻帶編碼模組
Ml 8q :立體聲編碼模組 M20a, : ACELP解碼模組 M20a2 : TCX解碼模組 M20b :抽出模組 M20c :選擇模組 M20d :標頭解析模組 M20e : Mode bits 抽出模組 M2 Of :解碼處理選擇模組 M2 0m :合成模組 M20p :高頻頻帶解碼模組 M20q :立體聲解碼模組 M22b :選擇模組 M22c :生成模組 M22d :輸出模組 M22e :檢查模組 M24b :抽出模組 M24c :選擇模組 M24d :檢查模組 M2 6b :選擇模組 201222531 Μ 2 6 c :生成模組 M26d :輸出模組 M26e :標頭生成模組 M2 6j :檢查模組 M28b :抽出模組 M28c :選擇模組 M28d :標頭解析模組 M2 8j :標頭檢查模組 M30d :輸出模組 M32b :抽出模組 M32d :訊框類型檢查模組 M34b :選擇模組 M34c :生成模組 M34d :輸出模組 Μ 3 6 b :抽出模組 M36c :選擇模組 M36d :訊框類型檢查模組 P 1 0 :音訊編碼程式 P 1 2 :音訊解碼程式 P 1 4 :音訊編碼程式 P 1 6 :音訊解碼程式 P 1 8 :音訊編碼程式 P20 :音訊解碼程式 P22 :音訊編碼程式 201222531 P24 :音訊解碼程式 P26 :音訊編碼程式 P28 :音訊解碼程式 P30:音訊編碼程式 P32 :音訊解碼程式 P34 :音訊編碼程式 P36 :音訊解碼程式 SM :記錄媒體 In 1,In2 :輸入端子 Out :輸出端子 SW,+SW1,S W3 :開關。

Claims (1)

  1. 201222531 七、申請專利範圍: 1·一種音訊解碼裝置,其特徵爲,具備: 複數解碼部,係執行彼此互異之音訊解碼 編碼序列生成音訊訊號;和 抽出部,係從具有分別含有音訊訊號之編 數訊框及/或分別含有複數訊框的複數超級訊 ,抽出:對該複數訊框的單一之長期編碼處理 期編碼處理資訊係表示該複數訊框的編碼序列 經使用過共通之音訊編碼處理,或對該複數超 一之長期編碼處理資訊,該長期編碼處理資訊 數超級訊框的編碼序列之生成時曾經使用過共 訊編碼處理;和 選擇部,係隨著前記長期編碼處理資訊已 實,在前記複數解碼部當中,選擇出前記複數 序列之解碼時所要共通使用的解碼部,或在前 部當中,選擇出前記複數超級訊框之編碼序列 要共通使用的一組解碼部。 2. 如請求項1所記載之音訊解碼裝置,其 串流中,至少在前記複數訊框當中,比開頭訊 續訊框裡,不含有用來特定該當後續訊框之編 成時所曾經使用過之音訊編碼處理所需的資訊 3. 如請求項2所記載之音訊解碼裝置,其I: 前記選擇部,係隨著前記長期編碼處理資 記抽出部所抽出之事實,而在前記複數解碼部 處理,以從 碼序列的複 框的串流中 資訊,該長 之生成時曾 級訊框的單 係表示該複 通之一組音 被抽出之事 訊框之編碼 記複數解碼 之解碼時所 中,於前記 框後面的後 碼序列之生 訊是已被前 當中選擇所 -87- 201222531 定之解碼部; 前記串流裡係不含有,用來特定前記複數訊框之編碼 序列之生成時所曾經使用過之音訊編碼處理所需的資訊。 4. 如請求項3所記載之音訊解碼裝置,其中,前記長 期編碼處理資訊係爲1位元之資訊。 5. —種音訊編碼裝置,其特徵爲,具備: 複數編碼部,係執行彼此互異之音訊編碼處理,以從 音訊訊號生成編碼序列;和 選擇部,係在前記複數編碼部當中,選擇出複數訊框 之音訊訊號之編碼時所要共通使用的編碼部,或選擇出, 分別含有複數訊框的複數超級訊框之音訊訊號之編碼時所 要共通使用的一組編碼部;和 / 生成部,係生成:對前記複數訊框的單一之長期編碼 處理資訊,該長期編碼處理資訊係表示該複數訊框的編碼 序列之生成時曾經使用過共通之音訊編碼處理,或對前記 複數超級訊框的單一之長期編碼處理資訊,該長期編碼處 理資訊係表示該複數超級訊框的編碼序列之生成時曾經使 用過共通之一組音訊編碼處理;和 輸出部,係出串流,其係含有:已被前記選擇部所選 擇之前記編碼部所生成的前記複數訊框之編碼序列、或已 被前記選擇部所選擇之前記一組編碼部所生成的前記複數 超級訊框之編碼序列、和前記長期編碼處理資訊。 6. 如請求項5所記載之音訊編碼裝置,其中,於前記 串流中,至少在前記複數訊框當中,比開頭訊框後面的後 -88- 201222531 續訊框裡,不含有用來特定該當後續訊框之編碼序列之生 成時所曾經使用過之音訊編碼處理所需的資訊。 7.如請求項6所記載之音訊編碼裝置,其中, 前記選擇部,係在前記複數之編碼部當中,選擇所定 之編碼部; 前記串流裡係不含有,用來特定前記複數訊框之編碼 序列之生成時所曾經使用過之音訊編碼處理所需的資訊。 8 .如請求項7所記載之音訊編碼裝置,其中,前記長 期編碼處理資訊係爲1位元之資訊。 9. 一種音訊解碼方法,其特徵爲,含有: 從具有分別含有音訊訊號之編碼序列的複數訊框及/ 或分別含有複數訊框的複數超級訊框的串流中,抽出:對 該複數訊框的單一之長期編碼處理資訊,該長期編碼處理 資訊係表示該複數訊框的編碼序列之生成時曾經使用過共 通之音訊編碼處理,或對該複數超級訊框的單一之長期編 碼處理資訊,該長期編碼處理資訊係表示該複數超級訊框 的編碼序列之生成時曾經使用過共通之一組音訊編碼處理 的步驟;和 隨著前記長期編碼處理資訊已被抽出之事實’在彼此 互異之複數音訊解碼處理當中,選擇出前記複數訊框之編 碼序列之解碼時所要共通使用的音訊解碼處理’或在該複 數音訊解碼處理當中’選擇出前記複數超級訊框之編碼序 列之解碼時所·要共通使用的一組音訊解碼處理的步驟;和 使用已被選擇之前記音訊解碼處理來將前記複數訊框 -89- 201222531 之編碼序列予以解碼,或使用已被選擇之前 碼處理來將前記複數超級訊框之編碼序列予 〇 10. —種音訊編碼方法,其特徵爲,含有 在彼此互異之複數音訊編碼處理當中, 框之音訊訊號之編碼時所要共通使用的音訊 在該複數音訊編碼處理當中,選擇出分別含 複數超級訊框之音訊訊號之編碼時所要共通 訊編碼處理的步驟;和 使用已被選擇之前記音訊編碼處理來將 之音訊訊號予以編碼以生成該複數訊框之編 用已被選擇之前記一組音訊編碼處理來將前 框之音訊訊號予以編碼以生成該複數超級訊 的步驟:和 生成:對前記複數訊框的單一之長期編 該長期編碼處理資訊係表示該複數訊框的編 時曾經使用過共通之音訊編碼處理,或對前 框的單一之長期編碼處理資訊,該長期編碼 示該複數超級訊框的編碼序列之生成時曾經 一組音訊編碼處理的步驟;和 將含有:前記複數訊框之編碼序列、或 訊框之編碼序列、和前記長期編碼處理資訊 輸出的步驟。 11. 一種程式,其特徵爲,係使電腦發揮 記一組音訊解 以解碼的步驟 選擇出複數訊 編碼處理,或 有複數訊框的 使用的一組音 前記複數訊框 碼序列,或使 記複數超級訊 框之編碼序列 碼處理資訊, 碼序列之生成 記複數超級訊 處理資訊係表 使用過共通之 前記複數超級 的串流,予以 機能成爲: -90- 201222531 複數解碼部,係執行彼此互異之音訊解碼處理,以從 編碼序列生成音訊訊號;和 抽出部,係從具有分別含有音訊訊號之編碼序列的複 數訊框及/或分別含有複數訊框的複數超級訊框的串流中 ,抽出:對該複數訊框的單一之長期編碼處理資訊,該長 期編碼處理資訊係表示該複數訊框的編碼序列之生成時曾 經使用過共通之音訊編碼處理,或對該複數超級訊框的單 一之長期編碼處理資訊,該長期編碼處理資訊係表示該複 數超級訊框的編碼序列之生成時曾經使用過共通之一組音 訊編碼處理;和 選擇部,係隨著前記長期編碼處理資訊已被抽出之事 實,在前記複數解碼部當中,選擇出前記複數訊框之編碼 序列之解碼時所要共通使用的解碼部,或在前記複數解碼 部當中,選擇出前記複數超級訊框之編碼序列之解碼時所 要共通使用的一組解碼部。 12.—種程式,其特徵爲,係使電腦發揮機能成爲: 複數編碼部,係執行彼此互異之音訊編碼處理,以從 音訊訊號生成編碼序列;和 選擇部,係在前記複數編碼部當中,選擇出複數訊框 之音訊訊號之編碼時所要共通使用的編碼部,或選擇出, 分別含有複數訊框的複數超級訊框之音訊訊號之編碼時所 要共通使用的一組編碼部;和 生成部,係生成:對前記複數訊框的單一之長期編碼 處理資訊,該長期編碼處理資訊係表示該複數訊框的編碼 -91 - 201222531 序列之生成時曾經使用過共通之音訊編碼處理,或對前記 複數超級訊框的單一之長期編碼處理資訊,該長期編碼處 理資訊係表示該複數超級訊框的編碼序列之生成時曾經使 用過共通之一組音訊編碼處理;和 輸出部,係出串流,其係含有:已被前記選擇部所選 擇之前記編碼部所生成的前記複數訊框之編碼序列、或E 被前記選擇部所選擇之前記—組編碼部所生成的前記複數 超級訊框之編碼序列、和前記長期編碼處理資訊。 -92-
TW100128857A 2010-08-13 2011-08-12 Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program TWI476762B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010181345A JP5749462B2 (ja) 2010-08-13 2010-08-13 オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム

Publications (2)

Publication Number Publication Date
TW201222531A true TW201222531A (en) 2012-06-01
TWI476762B TWI476762B (zh) 2015-03-11

Family

ID=45567788

Family Applications (2)

Application Number Title Priority Date Filing Date
TW103145797A TWI570712B (zh) 2010-08-13 2011-08-12 Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program
TW100128857A TWI476762B (zh) 2010-08-13 2011-08-12 Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW103145797A TWI570712B (zh) 2010-08-13 2011-08-12 Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program

Country Status (6)

Country Link
US (1) US9280974B2 (zh)
EP (1) EP2605240B1 (zh)
JP (1) JP5749462B2 (zh)
CN (2) CN104835501B (zh)
TW (2) TWI570712B (zh)
WO (1) WO2012020828A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5749462B2 (ja) * 2010-08-13 2015-07-15 株式会社Nttドコモ オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
US8620660B2 (en) * 2010-10-29 2013-12-31 The United States Of America, As Represented By The Secretary Of The Navy Very low bit rate signal coder and decoder
TWI591620B (zh) * 2012-03-21 2017-07-11 三星電子股份有限公司 產生高頻雜訊的方法
WO2014006837A1 (ja) * 2012-07-05 2014-01-09 パナソニック株式会社 符号化・復号化システム、復号化装置、符号化装置、及び符号化・復号化方法
SG10201706626XA (en) 2012-11-13 2017-09-28 Samsung Electronics Co Ltd Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals
ES2878061T3 (es) * 2014-05-01 2021-11-18 Nippon Telegraph & Telephone Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US10499229B2 (en) * 2016-01-24 2019-12-03 Qualcomm Incorporated Enhanced fallback to in-band mode for emergency calling
US11483365B2 (en) * 2019-01-31 2022-10-25 British Telecommunications Public Limited Company Methods and apparatus for the encoding of audio and/or video data
US11495240B1 (en) * 2019-07-23 2022-11-08 Amazon Technologies, Inc. Management of local devices
US11392401B1 (en) 2019-07-23 2022-07-19 Amazon Technologies, Inc. Management of and resource allocation for local devices
US10978083B1 (en) * 2019-11-13 2021-04-13 Shure Acquisition Holdings, Inc. Time domain spectral bandwidth replication
CN112740708B (zh) * 2020-05-21 2022-07-22 华为技术有限公司 一种音频数据传输方法及相关装置

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100419545B1 (ko) * 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
TW321810B (zh) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3252782B2 (ja) * 1998-01-13 2002-02-04 日本電気株式会社 モデム信号対応音声符号化復号化装置
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP3784583B2 (ja) * 1999-08-13 2006-06-14 沖電気工業株式会社 音声蓄積装置
US6658381B1 (en) * 1999-10-15 2003-12-02 Telefonaktiebolaget Lm Ericsson (Publ) Methods and systems for robust frame type detection in systems employing variable bit rates
TW501376B (en) * 2001-02-09 2002-09-01 Elan Microelectronics Corp Decoding device and method of digital audio
TW561451B (en) * 2001-07-27 2003-11-11 At Chip Corp Audio mixing method and its device
ES2268112T3 (es) * 2001-11-14 2007-03-16 Matsushita Electric Industrial Co., Ltd. Codificacion y descodificacion de audio.
JP2003173622A (ja) * 2001-12-04 2003-06-20 Matsushita Electric Ind Co Ltd 符号化音声データ復号化装置及び符号化音声データ復号化方法
JP2003195894A (ja) * 2001-12-27 2003-07-09 Mitsubishi Electric Corp 符号化装置、復号化装置、符号化方法、及び復号化方法
US20070223660A1 (en) 2004-04-09 2007-09-27 Hiroaki Dei Audio Communication Method And Device
WO2006011445A1 (ja) 2004-07-28 2006-02-02 Matsushita Electric Industrial Co., Ltd. 信号復号化装置
JP4628798B2 (ja) * 2005-01-13 2011-02-09 Kddi株式会社 通信端末装置
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
JP2008197199A (ja) * 2007-02-09 2008-08-28 Matsushita Electric Ind Co Ltd オーディオ符号化装置及びオーディオ復号化装置
EP2131590A1 (en) * 2008-06-02 2009-12-09 Deutsche Thomson OHG Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure
WO2010047566A2 (en) * 2008-10-24 2010-04-29 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
KR101797033B1 (ko) * 2008-12-05 2017-11-14 삼성전자주식회사 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
US8023530B1 (en) * 2009-01-07 2011-09-20 L-3 Communications Corp. Physical layer quality of service for wireless communications
JP5749462B2 (ja) * 2010-08-13 2015-07-15 株式会社Nttドコモ オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
US8976730B2 (en) * 2011-07-22 2015-03-10 Alcatel Lucent Enhanced capabilities and efficient bandwidth utilization for ISSI-based push-to-talk over LTE

Also Published As

Publication number Publication date
US20130159005A1 (en) 2013-06-20
EP2605240A1 (en) 2013-06-19
TWI476762B (zh) 2015-03-11
EP2605240A4 (en) 2014-04-02
TWI570712B (zh) 2017-02-11
US9280974B2 (en) 2016-03-08
CN104835501B (zh) 2018-08-14
CN103098125A (zh) 2013-05-08
WO2012020828A1 (ja) 2012-02-16
JP2012042534A (ja) 2012-03-01
TW201514975A (zh) 2015-04-16
JP5749462B2 (ja) 2015-07-15
CN104835501A (zh) 2015-08-12
CN103098125B (zh) 2015-04-29
EP2605240B1 (en) 2016-10-05

Similar Documents

Publication Publication Date Title
TW201222531A (en) Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program
JP5934922B2 (ja) 復号装置
JP5883561B2 (ja) アップミックスを使用した音声符号器
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
US8364497B2 (en) Apparatus and method for coding and decoding multi-object audio signal with various channel
CA2757972C (en) Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus
EP2209114A1 (en) Encoder and decoder
TW200935401A (en) Lossless multi-channel audio codec using adaptive segmentation with random access point (RAP) and multiple prediction parameter set (MPPS) capability
US8688442B2 (en) Audio decoding apparatus, audio coding apparatus, and system comprising the apparatuses
BRPI0806228A2 (pt) dispositivo de sintetização de fluxo, unidade de decodificação e método
CN110473560A (zh) 多声道音频内容的编码
EP2426662B1 (en) Acoustic signal decoding device, method and corresponding program
US8838460B2 (en) Apparatus for playing and producing realistic object audio
EP1617415B1 (en) Code conversion method and device, program, and recording medium
TWI309140B (en) Device and method for generating a multi-channel signal or a parameter data set
JP2007110565A (ja) マルチチャンネル音響復号化装置及び方法