TWI570712B - Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program - Google Patents
Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program Download PDFInfo
- Publication number
- TWI570712B TWI570712B TW103145797A TW103145797A TWI570712B TW I570712 B TWI570712 B TW I570712B TW 103145797 A TW103145797 A TW 103145797A TW 103145797 A TW103145797 A TW 103145797A TW I570712 B TWI570712 B TW I570712B
- Authority
- TW
- Taiwan
- Prior art keywords
- frame
- audio
- encoding
- unit
- decoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 251
- 230000005236 sound signal Effects 0.000 claims description 269
- 238000012545 processing Methods 0.000 claims description 222
- 230000008569 process Effects 0.000 claims description 185
- 230000007774 longterm Effects 0.000 claims description 100
- 238000000605 extraction Methods 0.000 claims description 82
- 239000000284 extract Substances 0.000 claims description 22
- 108091026890 Coding region Proteins 0.000 claims description 21
- 238000010586 diagram Methods 0.000 description 69
- 238000007689 inspection Methods 0.000 description 47
- 238000004458 analytical method Methods 0.000 description 39
- 230000006870 function Effects 0.000 description 17
- 230000002194 synthesizing effect Effects 0.000 description 16
- 238000002156 mixing Methods 0.000 description 12
- 230000015654 memory Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明的種種側面係有關於音訊解碼裝置、音訊解碼方法、音訊解碼程式、音訊編碼裝置、音訊編碼方法、及音訊編碼程式。
為了有效率地將語音訊號和音樂訊號雙方加以編碼,將適合於語音訊號的編碼處理和適合於音樂訊號的編碼處理進行切換而利用的複合型之音訊編碼方式,是有效的。
下記專利文獻1中係記載著此種複合型之音訊編碼方式。專利文獻1所記載的音訊編碼方式中,是對每一框架,附加上表示該當訊框中的編碼序列之生成時所使用之編碼處理的資訊。
又,在MPEG USAC(Unified Speech and Audio Coding)的音訊編碼中,會使用到三種編碼處理,亦即FD(Modified AAC(Advanced Audio Coding))、TCX(transform coded excitation)、ACELP(Algebraic Code Excited Linear Prediction)。在MPEG USAC中,TCX與
ACELP是被整合成一組而定義成LPD。在MPEG USAC中,為了表示是FD被使用過還是LPD被使用過,而對各訊框附加有1位元之資訊。又,在MPEG USAC中,若使用LPD,則為了規定將TCX與ACELP加以組合而利用之程序,而對各訊框附加有4位元之資訊。
又,在第3世代行動電話系統(3GPP)的AMR-WB+(Extended Adaptive Multi-Rate Wideband)中,是使用到二種編碼處理,亦即TCX及ACELP。在AMR-WB+中,為了規定TCX或ACELP之使用,而對各訊框附加有2位元之資訊。
[專利文獻1]日本特開2000-267699號公報
音訊訊號,是有時候是以人的發聲為基礎的訊號亦即語音訊號為中心,有時候是以音樂訊號為中心。若將此種音訊訊號加以編碼,則可能會利用到複數訊框共通的編碼處理。對於此種音訊訊號,能夠從編碼側往解碼側更有效率地傳達資訊的手法,是被需求的。
本發明的各種側面係為,目的在於提供一種,能夠生成大小較小之串流的音訊編碼裝置、音訊編碼方法、及音
訊編碼程式,以及能夠使用大小較小之串流的音訊解碼裝置、音訊解碼方法、及音訊解碼程式。
本發明的一側面,係有關於音訊編碼,可包含以下的音訊編碼裝置、音訊編碼方法、及音訊編碼程式。
本發明之一側面所述之音訊編碼裝置,係具備:複數編碼部、選擇部、生成部、及輸出部。複數編碼部,係執行彼此互異之音訊編碼處理,以從音訊訊號生成編碼序列。選擇部,係在複數編碼部當中,選擇出複數訊框之音訊訊號之編碼時所要共通使用的編碼部,或選擇出,分別含有複數訊框的複數超級訊框之音訊訊號之編碼時所要共通使用的一組編碼部。生成部,係生成長期編碼處理資訊。長期編碼處理資訊,係為對複數訊框的單一資訊,是一用來表示該當複數訊框之編碼序列之生成時曾經使用過共通之音訊編碼處理的資訊。或者,長期編碼處理資訊,係為對複數超級訊框的單一資訊,是一用來表示該當複數超級訊框之編碼序列之生成時曾經使用過共通之一組音訊編碼處理的資訊。輸出部,係輸出串流,其中含有:已被選擇部所選擇之編碼部所生成的上記複數訊框之編碼序列、或已被選擇部所選擇之一組編碼部所生成的上記複數超級訊框之編碼序列、和長期編碼處理資訊。
本發明之一側面所述之音訊編碼方法,係含有:(a)在彼此互異之複數音訊編碼處理當中,選擇出複數
訊框之音訊訊號之編碼時所要共通使用的音訊編碼處理,或在複數音訊編碼處理當中,選擇出分別含有複數訊框的複數超級訊框之音訊訊號之編碼時所要共通使用的一組音訊編碼處理的步驟;和(b)使用已被選擇之音訊編碼處理來將上記複數訊框之音訊訊號予以編碼以生成該當複數訊框之編碼序列,或使用已被選擇之一組音訊編碼處理來將上記複數超級訊框之音訊訊號予以編碼以生成該當複數超級訊框之編碼序列的步驟;和(c)生成:對上記複數訊框的單一之長期編碼處理資訊,該當長期編碼處理資訊係表示該複數訊框的編碼序列之生成時曾經使用過共通之音訊編碼處理,或對上記複數超級訊框的單一之長期編碼處理資訊,該當長期編碼處理資訊係表示該複數超級訊框的編碼序列之生成時曾經使用過共通之一組音訊編碼處理的步驟;和(d)將含有:上記複數訊框之編碼序列、或上記複數超級訊框之編碼序列、和上記長期編碼處理資訊的串流,予以輸出的步驟。
本發明之一側面所述之音訊編碼程式,係使電腦發揮機能而成為複數編碼部、選擇部、生成部、及輸出部。
若依據本發明之一側面所述之音訊編碼裝置、音訊編碼方法,及音訊編碼程式,則可藉由長期編碼處理資訊來通知,在編碼側中,複數訊框之編碼序列之生成時曾經使用過共通之音訊編碼處理,或複數超級訊框之編碼序列之生成時曾經使用過共通之一組音訊編碼處理之事實。又,藉由該長期編碼處理資訊之通知,在解碼側上就可選擇共
通之音訊解碼處理、或共通之一組音訊解碼處理。因此,可以降低串流內所含有之用來特定音訊編碼處理所需的資訊量。
於一實施形態中,亦可為,於串流中,至少在複數訊框當中,比開頭訊框後面的後續訊框裡,不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
於一實施形態中,亦可對上記複數訊框,在複數編碼部(或複數音訊編碼處理)當中選擇出所定之編碼部(或所定之音訊編碼處理),串流裡係亦可不含有,用來特定上記複數訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。若依據此形態,則可再降低串流的資訊量。又,於一實施形態中,長期編碼處理資訊係亦可為1位元之資訊。若依據此形態,則可更加降低串流的資訊量。
本發明的另一側面係有關於音訊解碼,可包含音訊解碼裝置、音訊解碼方法、及音訊解碼程式。
本發明之另一側面所述之音訊解碼裝置,係具備:複數解碼部、抽出部、及選擇部。複數解碼部,係執行彼此互異之音訊解碼處理,以從編碼序列生成音訊訊號。抽出部,係從串流中抽出長期編碼處理資訊。串流係具有,分別含有音訊訊號之編碼序列的複數訊框,及/或分別含有複數訊框的複數超級訊框。長期編碼處理資訊,係為對複數訊框的單一之長期編碼處理資訊,是表示該當複數訊框
之編碼序列之生成時曾經使用過共通之音訊編碼處理。或者,長期編碼處理資訊,係為對複數超級訊框的單一之長期編碼處理資訊,是表示該當複數超級訊框之編碼序列之生成時曾經使用過共通之一組音訊編碼處理。選擇部,係隨著長期編碼處理資訊已被抽出之事實,而在複數解碼部當中,選擇出複數訊框之編碼序列之解碼時所要共通使用的解碼部。或者,選擇部係在複數解碼部當中,選擇出複數超級訊框之編碼序列之解碼時所要共通使用的一組解碼部。
本發明之另一側面所述之音訊解碼方法,係含有:(a)從具有分別含有音訊訊號之編碼序列的複數訊框及/或分別含有複數訊框的複數超級訊框的串流中,抽出:對該當複數訊框的單一之長期編碼處理資訊,此長期編碼處理資訊係表示該當複數訊框的編碼序列之生成時曾經使用過共通之音訊編碼處理,或對該當複數超級訊框的單一之長期編碼處理資訊,此長期編碼處理資訊係表示該當複數超級訊框的編碼序列之生成時曾經使用過共通之一組音訊編碼處理的步驟;和(b)隨著長期編碼處理資訊已被抽出之事實,在彼此互異之複數音訊解碼處理當中,選擇出上記複數訊框之編碼序列之解碼時所要共通使用的音訊解碼處理,或在該當複數音訊解碼處理當中,選擇出上記複數超級訊框之編碼序列之解碼時所要共通使用的一組音訊解碼處理的步驟;和(c)使用已被選擇之音訊解碼處理來將上記複數訊框之編碼序列予以解碼,或使用已被選擇
之上記一組音訊解碼處理來將上記複數超級訊框之編碼序列予以解碼的步驟。
本發明之另一側面所述之音訊解碼程式,係使電腦發揮機能而成為複數解碼部、抽出部、及選擇部。
若依據本發明之另一側面所述之音訊解碼裝置、音訊解碼方法,及音訊解碼程式,則可從基於上述有關編碼之本發明之一側面所生成的串流,生成音訊訊號。
於一實施形態中,亦可為,於串流中,至少在複數訊框當中,比開頭訊框後面的後續訊框裡,不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
於一實施形態中,亦可對上記複數訊框,在複數解碼部(或複數音訊解碼處理)當中選擇出所定之解碼部(或所定之音訊解碼處理),串流裡係亦可不含有,用來特定上記複數訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。若依據此形態,則可再降低串流中的資訊量。又,於一實施形態中,長期編碼處理資訊係亦可為1位元之資訊。若依據此形態,則可更降低串流中的資訊量。
如以上說明,若依據本發明的各種側面,則可提供一種,能夠生成大小較小之串流的音訊編碼裝置、音訊編碼方法、及音訊編碼程式,以及能夠使用大小較小之串流的
音訊解碼裝置、音訊解碼方法、及音訊解碼程式。
10,10A‧‧‧音訊編碼裝置
10a1~10an‧‧‧編碼部
10b‧‧‧選擇部
10c‧‧‧生成部
10d‧‧‧輸出部
10e‧‧‧解析部
12‧‧‧音訊解碼裝置
12a1~12an‧‧‧解碼部
12b‧‧‧抽出部
12c‧‧‧選擇部
14‧‧‧音訊編碼裝置
14a1‧‧‧ACELP編碼部
14a2‧‧‧TCX編碼部
14a3‧‧‧Modified AAC編碼部
14b‧‧‧選擇部
14c‧‧‧生成部
14d‧‧‧輸出部
14e‧‧‧標頭生成部
14f‧‧‧第1判定部
14g‧‧‧core_mode生成部
14h‧‧‧第2判定部
14i‧‧‧lpd_mode生成部
14m‧‧‧MPS編碼部
14n‧‧‧SBR編碼部
16‧‧‧音訊解碼裝置
16a1‧‧‧ACELP解碼部
16a2‧‧‧TCX解碼部
16a3‧‧‧Modified AAC解碼部
16b‧‧‧抽出部
16c‧‧‧選擇部
16d‧‧‧標頭解析部
16e‧‧‧core_mode抽出部
16f‧‧‧第1選擇部
16g‧‧‧lpd_mode抽出部
16h‧‧‧第2選擇部
16m‧‧‧MPS解碼部
16n‧‧‧SBR解碼部
18‧‧‧音訊編碼裝置
18a1‧‧‧ACELP編碼部
18a2‧‧‧TCX編碼部
18b‧‧‧選擇部
18c‧‧‧生成部
18d‧‧‧輸出部
18e‧‧‧標頭生成部
18f‧‧‧編碼處理判定部
18g‧‧‧Mode bits生成部
18m‧‧‧分析部
18n‧‧‧縮減混音部
18p‧‧‧高頻頻帶編碼部
18q‧‧‧立體聲編碼部
20‧‧‧音訊解碼裝置
20a1‧‧‧ACELP解碼部
20a2‧‧‧TCX解碼部
20b‧‧‧抽出部
20c‧‧‧選擇部
20d‧‧‧標頭解析部
20e‧‧‧Mode bits抽出部
20f‧‧‧解碼處理選擇部
20m‧‧‧合成部
20p‧‧‧高頻頻帶解碼部
20q‧‧‧立體聲解碼部
22‧‧‧音訊編碼裝置
22b‧‧‧選擇部
22c‧‧‧生成部
22d‧‧‧輸出部
22e‧‧‧檢查部
24‧‧‧音訊解碼裝置
24b‧‧‧抽出部
24c‧‧‧選擇部
24d‧‧‧檢查部
26‧‧‧音訊編碼裝置
26b‧‧‧選擇部
26c‧‧‧生成部
26d‧‧‧輸出部
26e‧‧‧標頭生成部
26j‧‧‧檢查部
28‧‧‧音訊解碼裝置
28b‧‧‧抽出部
28c‧‧‧選擇部
28d‧‧‧標頭解析部
28j‧‧‧標頭檢查部
30‧‧‧音訊編碼裝置
30b‧‧‧抽出部
30d‧‧‧輸出部
32‧‧‧音訊解碼裝置
32b‧‧‧抽出部
32d‧‧‧訊框類型檢查部
34‧‧‧音訊編碼裝置
34b‧‧‧選擇部
34c‧‧‧生成部
34d‧‧‧輸出部
34e‧‧‧檢查部
36‧‧‧音訊解碼裝置
36b‧‧‧抽出部
36c‧‧‧選擇部
36d‧‧‧訊框類型檢查部
C10‧‧‧電腦
C12‧‧‧讀取裝置
C14‧‧‧作業用記憶體
C16‧‧‧記憶體
C18‧‧‧顯示裝置
C20‧‧‧滑鼠
C22‧‧‧鍵盤
C24‧‧‧通訊裝置
C26‧‧‧CPU
M10a1~M10an‧‧‧編碼模組
M10b‧‧‧選擇模組
M10c‧‧‧生成模組
M10d‧‧‧輸出模組
M12a1~M12an‧‧‧解碼模組
M12b‧‧‧抽出模組
M12c‧‧‧選擇模組
M14a1‧‧‧ACELP編碼模組
M14a2‧‧‧TCX編碼模組
M14a3‧‧‧Modified AAC編碼模組
M14b‧‧‧選擇模組
M14c‧‧‧生成模組
M14d‧‧‧輸出模組
M14e‧‧‧標頭生成模組
M14f‧‧‧第1判定模組
M14g‧‧‧core_mode生成模組
M14h‧‧‧第2判定模組
M14i‧‧‧lpd_mode生成模組
M14m‧‧‧MPS編碼模組
M14n‧‧‧SBR編碼模組
M16a1‧‧‧ACELP解碼模組
M16a2‧‧‧TCX解碼模組
M16a3‧‧‧Modified AAC解碼模組
M16b‧‧‧抽出模組
M16c‧‧‧選擇模組
M16d‧‧‧標頭解析模組
M16e‧‧‧core_mode抽出模組
M16f‧‧‧第1選擇模組
M16g‧‧‧lpd_mode抽出模組
M16h‧‧‧第2選擇模組
M16m‧‧‧MPS解碼模組
M16n‧‧‧SBR解碼模組
M18a1‧‧‧ACELP編碼模組
M18a2‧‧‧TCX編碼模組
M18b‧‧‧選擇模組
M18c‧‧‧生成模組
M18d‧‧‧輸出模組
M18e‧‧‧標頭生成模組
M18f‧‧‧編碼處理判定模組
M18g‧‧‧Mode bits生成模組
M18m‧‧‧分析模組
M18n‧‧‧縮減混音模組
M18p‧‧‧高頻頻帶編碼模組
M18q‧‧‧立體聲編碼模組
M20a1‧‧‧ACELP解碼模組
M20a2‧‧‧TCX解碼模組
M20b‧‧‧抽出模組
M20c‧‧‧選擇模組
M20d‧‧‧標頭解析模組
M20e‧‧‧Mode bits抽出模組
M20f‧‧‧解碼處理選擇模組
M20m‧‧‧合成模組
M20p‧‧‧高頻頻帶解碼模組
M20q‧‧‧立體聲解碼模組
M22b‧‧‧選擇模組
M22c‧‧‧生成模組
M22d‧‧‧輸出模組
M22e‧‧‧檢查模組
M24b‧‧‧抽出模組
M24c‧‧‧選擇模組
M24d‧‧‧檢查模組
M26b‧‧‧選擇模組
M26c‧‧‧生成模組
M26d‧‧‧輸出模組
M26e‧‧‧標頭生成模組
M26j‧‧‧檢查模組
M28b‧‧‧抽出模組
M28c‧‧‧選擇模組
M28d‧‧‧標頭解析模組
M28j‧‧‧標頭檢查模組
M30d‧‧‧輸出模組
M32b‧‧‧抽出模組
M32d‧‧‧訊框類型檢查模組
M34b‧‧‧選擇模組
M34c‧‧‧生成模組
M34d‧‧‧輸出模組
M36b‧‧‧抽出模組
M36c‧‧‧選擇模組
M36d‧‧‧訊框類型檢查模組
P10‧‧‧音訊編碼程式
P12‧‧‧音訊解碼程式
P14‧‧‧音訊編碼程式
P16‧‧‧音訊解碼程式
P18‧‧‧音訊編碼程式
P20‧‧‧音訊解碼程式
P22‧‧‧音訊編碼程式
P24‧‧‧音訊解碼程式
P26‧‧‧音訊編碼程式
P28‧‧‧音訊解碼程式
P30‧‧‧音訊編碼程式
P32‧‧‧音訊解碼程式
P34‧‧‧音訊編碼程式
P36‧‧‧音訊解碼程式
SM‧‧‧記錄媒體
In1,In2‧‧‧輸入端子
Out‧‧‧輸出端子
SW,SW1,SW3‧‧‧開關
[圖1]一實施形態所述之音訊編碼裝置的圖示。
[圖2]一實施形態所述之音訊編碼裝置所生成之串流的圖示。
[圖3]一實施形態所述之音訊編碼方法的流程圖。
[圖4]一實施形態所述之音訊編碼程式的圖示。
[圖5]一實施形態所述之電腦的硬體構成之圖示。
[圖6]一實施形態所述之電腦的斜視圖。
[圖7]變形樣態所述之音訊編碼裝置的圖示。
[圖8]一實施形態所述之音訊解碼裝置的圖示。
[圖9]一實施形態所述之音訊解碼方法的流程圖。
[圖10]一實施形態所述之音訊解碼程式的圖示。
[圖11]另一實施形態所述之音訊編碼裝置的圖示。
[圖12]依照先前之MPEG USAC所生成的串流與圖11所示的音訊編碼裝置所生成的串流的圖示。
[圖13]另一實施形態所述之音訊編碼方法的流程圖。
[圖14]另一實施形態所述之音訊編碼程式的圖示。
[圖15]另一實施形態所述之音訊解碼裝置的圖示。
[圖16]另一實施形態所述之音訊解碼方法的流程圖。
[圖17]mod[k]與a(mod[k])之關係的圖示。
[圖18]另一實施形態所述之音訊解碼程式的圖示。
[圖19]再另一實施形態所述之音訊編碼裝置的圖示。
[圖20]依照先前之AMR WB+所生成的串流與圖19所示的音訊編碼裝置所生成的串流的圖示。
[圖21]再另一實施形態所述之音訊編碼方法的流程圖。
[圖22]再另一實施形態所述之音訊編碼程式的圖示。
[圖23]再另一實施形態所述之音訊解碼裝置的圖示。
[圖24]再另一實施形態所述之音訊解碼方法的流程圖。
[圖25]再另一實施形態所述之音訊解碼程式的圖示。
[圖26]再另一實施形態所述之音訊編碼裝置的圖示。
[圖27]圖26所示之音訊編碼裝置所生成之串流的圖示。
[圖28]再另一實施形態所述之音訊編碼方法的流程圖。
[圖29]再另一實施形態所述之音訊編碼程式的圖示。
[圖30]再另一實施形態所述之音訊解碼裝置的圖示。
[圖31]再另一實施形態所述之音訊解碼方法的流程圖。
[圖32]再另一實施形態所述之音訊解碼程式的圖示。
[圖33]再另一實施形態所述之音訊編碼裝置的圖示。
[圖34]依照先前之MPEG USAC所生成的串流與圖33所示的音訊編碼裝置所生成的串流的圖示。
[圖35]再另一實施形態所述之音訊編碼方法的流程圖。
[圖36]再另一實施形態所述之音訊編碼程式的圖示。
[圖37]再另一實施形態所述之音訊解碼裝置的圖示。
[圖38]再另一實施形態所述之音訊解碼方法的流程圖。
[圖39]再另一實施形態所述之音訊解碼程式的圖示。
[圖40]再另一實施形態所述之音訊編碼裝置的圖示。
[圖41]圖40所示之音訊編碼裝置所生成之串流的圖示。
[圖42]再另一實施形態所述之音訊編碼方法的流程圖。
[圖43]再另一實施形態所述之音訊編碼程式的圖示。
[圖44]再另一實施形態所述之音訊解碼裝置的圖示。
[圖45]再另一實施形態所述之音訊解碼方法的流程圖。
[圖46]再另一實施形態所述之音訊解碼程式的圖示。
[圖47]再另一實施形態所述之音訊編碼裝置的圖示。
[圖48]依照先前之AMR WB+所生成的串流與圖47所示的音訊編碼裝置所生成的串流的圖示。
[圖49]再另一實施形態所述之音訊編碼方法的流程圖。
[圖50]再另一實施形態所述之音訊編碼程式的圖示。
[圖51]再另一實施形態所述之音訊解碼裝置的圖示。
[圖52]再另一實施形態所述之音訊解碼方法的流程圖。
[圖53]再另一實施形態所述之音訊解碼程式的圖示。
以下,參照圖面而詳細說明各種實施形態。此外,對於各圖面中同一或相當之部分係標示同一符號。
圖1係一實施形態所述之音訊編碼裝置的圖示。圖1所示的音訊編碼裝置10,係可將被輸入至輸入端子In1的複數訊框之音訊訊號,使用共通之音訊編碼處理進行編碼。如圖1所示,音訊編碼裝置10係具備:複數編碼部10a1~10an、選擇部10b、生成部10c、及輸出部10d。此處,n係為2以上之整數。
編碼部10a1~10an,係執行彼此互異之音訊編碼處理,以從音訊訊號生成編碼序列。這些音訊編碼處理中,係可採用任意的音訊編碼處理。例如,作為音訊編碼處理係可使用Modified AAC編碼處理、ACELP編碼處理、及TCX編碼處理。
選擇部10b,係隨著被輸入至輸入端子In2的輸入資訊,而再編碼部10a1~10an當中選擇出一個編碼部。輸入資訊係例如是被使用者所輸入。於一實施形態中,該輸入資訊係可為,用來特定出複數訊框之音訊訊號所被共通使用之音訊編碼處理用的資訊。選擇部10b,係可控制著開關SW,在編碼部10a1~10an當中,把執行被輸入資訊所特定之音訊編碼處理的編碼部與輸入端子In1做結合。
生成部10c,係基於輸入資訊而生成長期編碼處理資
訊。長期編碼處理資訊,係為表示複數訊框之編碼序列之生成時曾經使用過共通之音訊編碼處理的資訊。又,長期編碼處理資訊係亦可為,可在解碼側上識別之獨特字元。又,在一實施形態中,亦可為,能夠在解碼側上特定出複數訊框之編碼序列之生成時所曾共通使用過的音訊編碼處理的資訊。
輸出部10d,係將含有已被選擇之編碼部所生成之複數訊框之編碼序列、及生成部10c所生成之長期編碼處理資訊的串流,予以輸出。
圖2係一實施形態所述之音訊編碼裝置所生成之串流的圖示。圖2所示的串流,係含有第1~第m的複數訊框。此處,m係為2以上之整數。以下,有些時候會將串流中的訊框,稱為輸出訊框。各輸出訊框中係含有,在輸入音訊訊號中,從該當輸出訊框所對應之訊框的音訊訊號所生成的編碼序列。又,串流的第1訊框中,可附加有長期編碼處理資訊來作為參數資訊。
以下,說明音訊編碼裝置10之動作,和一實施形態的音訊編碼方法。圖3係一實施形態所述之音訊編碼方法的流程圖。如圖3所示,於一實施形態中,在步驟S10-1中,選擇部10b會基於輸入資訊而在編碼部10a1~10an當中選擇出一個編碼部。
接著,在步驟S10-2中,生成部10c係基於輸入資訊而生成長期編碼處理資訊。在後續的步驟S10-3中,輸出部10d係對第1訊框附加長期編碼處理資訊來作為參數資
訊。
接著,在步驟S10-4中,已被選擇部10b所選擇的編碼部,係將目前編碼對象之訊框的音訊訊號加以編碼,生成編碼序列。在後續的步驟S10-5中,輸出部10d係使編碼對象之訊框所對應的串流內的輸出訊框中,含有由編碼部所生成之編碼序列,將該當輸出訊框予以輸出。
於後續的步驟S10-5中,係會進行是否還有尚未編碼之訊框存在的判定。若沒有尚未編碼之訊框存在,則結束處理。另一方面,若還有應編碼的訊框存在時,則以尚未編碼之訊框為對象而繼續從步驟S10-4起的一連串處理。
若依據以上所說明的音訊編碼裝置10及一實施形態的音訊編碼方法,則只有串流的第1訊框會含有長期編碼處理資訊。亦即,在串流中,第2訊框以後的訊框裡,不含有用來特定上記複數訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。因此,可生成大小較小之有效率的串流。
以下說明,使電腦動作成為音訊編碼裝置10的程式。圖4係一實施形態所述之音訊編碼程式的圖示。圖5係一實施形態所述之電腦的硬體構成之圖示。圖6係一實施形態所述之電腦的斜視圖。圖4所示的音訊編碼程式P10,係可使圖5所示的電腦C10,成為音訊編碼裝置10而動作。此外,本說明書中所說明的程式,係不限定於圖5所示的電腦,亦可是行動電話、攜帶型資訊終端這類任意裝置,依照該當程式而動作。
音訊編碼程式P10,係可被儲存在記錄媒體SM中來提供。此外,作為記錄媒體SM則例如有,軟碟片、CD-ROM、DVD、或ROM等記錄媒體,或是半導體記憶體等。
如圖5所示,電腦C10係可具備:軟碟片驅動裝置、CD-ROM驅動裝置、DVD驅動裝置等讀取裝置C12、讓作業系統常駐的作業用記憶體(RAM)C14、用來記憶記錄媒體SM中所記憶之程式的記憶體C16、顯示器這類顯示裝置C18、屬於輸入裝置的滑鼠C20及鍵盤C22、進行資料收送用的通訊裝置C24、控制著程式之執行的CPU C26。
電腦C10,係一旦把記錄媒體SM插入至讀取裝置C12,則從讀取裝置C12就可向記錄媒體SM中所儲存的音訊編碼程式P10進行存取,藉由該當程式P10,就可成為音訊編碼裝置10而動作。
如圖6所示,音訊編碼程式P10,係可以被重疊於載波之電腦資料訊號CW的方式,透過網路而提供。此時,電腦C10,係可將通訊裝置C24所接收到的音訊編碼程式P10儲存在記憶體C16,執行程式P10。
如圖4所示,音訊編碼程式P10係具備:複數編碼模組M10a1~M10an、選擇模組M10b、生成模組M10c、及輸出模組M10d。
於一實施形態中,編碼模組部M10a1~M10an、選擇模組M10b、生成模組M10c、輸出模組M10d,係令電腦
C10執行分別與編碼部10a1~10an、選擇部10b、生成部10c、輸出部10d相同的機能。若依據所述之音訊編碼程式P10,則電腦C10係可成為音訊編碼裝置10而動作。
此處說明音訊編碼裝置10的變形樣態。圖7係變形樣態所述之音訊編碼裝置的圖示。在音訊編碼裝置10中,雖然基於輸入資訊來選擇編碼部(編碼處理),但在圖7所示的音訊編碼裝置10A中,則是基於音訊訊號的解析結果來選擇編碼部。因此,音訊編碼裝置10A係具備有解析部10e。
解析部10e,係解析複數訊框的音訊訊號,決定最適合該當複數訊框之音訊訊號之編碼的音訊編碼處理。解析部10e,係將用來特定已決定之音訊編碼處理的資訊,給予選擇部10b,令選擇部10b選擇會執行該當音訊編碼處理的編碼部。又,解析部10e,係將用來特定已決定之音訊編碼處理的資訊,送至生成部10c,令生成部10c生成長期編碼處理資訊。
解析部10e係可解析例如音訊訊號的音調性、音高週期、時間包絡、過渡之成分(訊號突然上揚/下挫)。例如,解析部10e係當音訊訊號的音調性是比所定之音調性還要強時,就決定使用會進行頻率領域之編碼的音訊編碼處理。又,解析部10e係例如,若音訊訊號的音高週期是在所定範圍內,則可決定使用適合於該當音訊訊號之編碼的音訊編碼處理。甚至,解析部10e係例如,當音訊訊號的時間包絡之變動是大於所定變動時,或音訊訊號是含有
過渡成分時,就決定使用會進行時間領域之編碼的音訊編碼處理。
以下,說明可將音訊編碼裝置10所生成之串流予以解碼的音訊解碼裝置。圖8係一實施形態所述之音訊解碼裝置的圖示。如圖8所示,音訊解碼裝置12係具備:複數解碼部12a1~12an、抽出部12b、及選擇部12c。解碼部12a1~12an,係執行彼此互異之音訊解碼處理,以從編碼序列生成音訊訊號。解碼部12a1~12an的處理,係為分別與編碼部10a1~10an之處理相對稱之處理。
抽出部12b,係從被輸入至輸入端子In的串流中,抽出長期編碼處理資訊(參照圖3)。抽出部12b,係將所抽出的長期編碼處理資訊,送至選擇部12c,將摘除了長期編碼處理資訊的串流的剩餘部分,輸出至開關SW。
選擇部12c,係基於長期編碼處理資訊而控制開關SW。選擇部12c,係在解碼部12a1~12an當中,選擇會執行基於長期編碼處理資訊所特定之編碼處理的解碼部。又,選擇部12c係控制開關SW,使得串流中所含之複數訊框會被已選擇之解碼部所結合。
以下,說明音訊解碼裝置12之動作,及一實施形態所述之音訊解碼方法。圖9係一實施形態所述之音訊解碼方法的流程圖。如圖9所示,在一實施形態中,係於步驟S12-1中,抽出部12b會從串流中抽出長期編碼處理資訊。接著於步驟S12-2中,選擇部12c會隨著已被抽出的長期編碼處理資訊,而從解碼部12a1~12an中選擇出一個
解碼部。
在後續的步驟S12-3中,已被選擇的解碼部,係將解碼對象訊框的編碼序列,予以解碼。接著,在步驟S12-4中,判定是否有尚未解碼的訊框存在。若沒有尚未解碼之訊框存在,則結束處理。另一方面,若還有尚未解碼的訊框存在時,則以該當訊框為對象而使用步驟S12-2中所選擇的解碼部,繼續步驟S12-3起的處理。
以下說明,可使電腦動作成為音訊解碼裝置12的音訊解碼程式。圖10係一實施形態所述之音訊解碼程式的圖示。
圖10所示的音訊解碼程式P12,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P12,係可與音訊編碼程式P10同樣地提供。
如圖10所示,音訊解碼程式P12係具備:解碼模組M12a1~M12an、抽出模組M12b、及選擇模組M12c。解碼模組M12a1~M12an、抽出模組M12b、選擇模組M12c,係可使電腦C10執行分別與解碼部12a1~12an、抽出部12b、選擇部12c相同的機能。
以下,說明另一實施形態所述之音訊編碼裝置。圖11係另一實施形態所述之音訊編碼裝置的圖示。圖11所示的音訊編碼裝置14,係為MPEG USAC之擴充中所能使用的裝置。
圖12係依照先前之MPEG USAC所生成的串流與圖11所示的音訊編碼裝置所生成的串流的圖示。如圖12所
示,在先前的MPEG USAC中,在串流中的各訊框裡係被附加有,用來表示是使用了FD(Modified AAC)還是使用了LPD(ACELP或TCX)的資訊,亦即1位元的core_mode。又,在先前的MPEG USAC中,LPD所被使用的訊框係具有,含有4個訊框的超級訊框構造。LPD被使用的情況下,作為用來表示超級訊框之各訊框之編碼時是使用了ACELP或TCX之何者的資訊,是有4位元的lpd_mode被附加至該超級訊框。
圖11所示的音訊編碼裝置14,係可將所有訊框的音訊訊號以共通之音訊編碼處理而加以編碼。又,音訊編碼裝置14,係亦可和先前的MPEG_USAC同樣地,可切換各訊框所使用的音訊編碼處理。此外,在一實施形態中,音訊編碼處理是一亦可對所有的超級訊框,共通地使用LPD、亦即一組音訊編碼處理。
如圖11所示,音訊編碼裝置14係具備:ACELP編碼部14a1、TCX編碼部14a2、Modified AAC編碼部14a3、選擇部14b、生成部14c、輸出部14d、標頭生成部14e、第1判定部14f、core_mode生成部14g、第2判定部14h、lpd_mode生成部14i、MPS編碼部14m、及、SBR編碼部14n。
MPS編碼部14m係將被輸入至輸入端子In1的音訊訊號,予以接受。被輸入至MPS編碼部14m的音訊訊號,係可為2聲道以上的多聲道之音訊訊號。MPS編碼部14m,係將各訊框的多聲道之音訊訊號,以比該當多聲道
的聲道數還少之聲道數的音訊訊號、和用來從該當較少聲道數之音訊訊號解碼出多聲道之音訊訊號所需的參數,來加以表現。
當多聲道之音訊訊號是立體聲訊號時,MPS編碼部14m,係藉由將該當立體聲訊號進行縮減混音,以生成單聲道之音訊訊號。又,MPS編碼部14m,係作為從單聲道訊號解碼出立體聲訊號所需的參數,而生成單聲道訊號與立體聲訊號的各聲道之間的位準差、相位差、及/或、相關值。MPS編碼部14m,係將所生成的單聲道訊號輸出至SBR編碼部14n,將所生成的參數加以編碼所得之編碼資料,輸出至輸出部14d。此外,立體聲訊號係亦可藉由單聲道訊號與殘差訊號、及參數來表現。
SBR編碼部14n,係從MPS編碼部14m接收各訊框之音訊訊號。SBR編碼部14n所接受的音訊訊號,係可為例如上述單聲道訊號。SBR編碼部14n係當被輸入至輸入端子In1的音訊訊號是單聲道訊號時,就接受該當音訊訊號。SBR編碼部14n係以所定之頻率為基準,從已被輸入之音訊訊號,生成低頻頻帶之音訊訊號及高頻頻帶之音訊訊號。又,SBR編碼部14n,係算出用來從低頻頻帶之音訊訊號生成高頻頻帶之音訊訊號所需的參數。作為該當參數,可以利用例如,表示所定頻率的頻率資訊、時間.頻率分解能力資訊、頻譜包絡資訊、附加雜訊資訊、及附加正弦波資訊之類的資訊。SBR編碼部14n,係將低頻頻帶之音訊訊號,輸出至開關SW1。又,SBR編碼部14n,係
將所算出的參數加以編碼而得到的編碼資料,輸出至輸出部14d。
編碼部14a1係以ACELP編碼處理將音訊訊號加以編碼而生成編碼序列。編碼部14a2係以TCX編碼處理將音訊訊號加以編碼而生成編碼序列。編碼部14a3係以Modified AAC編碼處理將音訊訊號加以編碼而生成編碼序列。
選擇部14b,係隨著被輸入至輸入端子In2的輸入資訊,而選擇要將被輸入至開關SW1之複數訊框的音訊訊號進行編碼的編碼部。在本實施形態中,輸入資訊係可為由使用者輸入而得的資訊。又,輸入資訊係可為,表示是否將複數訊框以共通的一種編碼處理進行編碼的資訊。
在本實施形態中,選擇部14b係當輸入資訊是表示,將複數訊框以共通的一種音訊編碼處理進行編碼的情況下,則選擇會執行所定編碼處理的所定之編碼部。例如,如說明,當輸入資訊是表示將複數訊框以共通的一種音訊編碼處理來進行編碼時,選擇部14b係可控制開關SW1,將ACELP編碼部14a1選擇成為所定之編碼部。因此,在本實施形態中,當輸入資訊是表示,將複數訊框以共通的一種音訊編碼處理進行編碼的情況下,則複數訊框之音訊訊號就會被ACELP編碼部14a1所編碼。
另一方面,選擇部14b係當輸入資訊是表示並非將複數訊框以共通的一種音訊編碼處理來進行編碼時,則將被輸入至開關SW1的各訊框之音訊訊號,與連接著第1判
定部14f等之路徑做結合。
生成部14c,係基於輸入資訊而生成長期編碼處理資訊。如圖12所示,作為長期編碼處理資訊,係可使用1位元的GEM_ID。又,當輸入資訊是表示,將複數訊框以共通的一種音訊編碼處理進行編碼的情況下,則生成部14c係可將GEM_ID之值設定成「1」。另一方面,當輸入資訊是表示,並非將複數訊框以共通的一種音訊編碼處理進行編碼的情況下,則生成部14c係可將GEM_ID之值設定成「0」。
標頭生成部14e,係生成被含在串流中的標頭,將已被設定之GEM_ID,包含在該當標頭中。如圖12所示,該標頭係被從輸出部14d時,可被包含在第1訊框中。
第1判定部14f,係當輸入資訊是表示並非將複數訊框以共通的一種音訊編碼處理來進行編碼時,則透過SW1而接受編碼對象訊框的音訊訊號。第1判定部14f係解析編碼對象訊框的音訊訊號,判定是否應該以Modified AAC編碼部14a3來將該當音訊訊號予以編碼。
第1判定部14f,係當判定為應該將編碼對象訊框的音訊訊號以Modified AAC編碼部14a3進行編碼的情況下,則控制開關SW2而使該當訊框結合至Modified AAC編碼部14a3。
另一方面,第1判定部14f,係當判定為不應該將編碼對象訊框的音訊訊號以Modified AAC編碼部14a3進行編碼的情況下,則控制開關SW2而使該當訊框結合至第2
判定部14h及開關SW3。此情況下,編碼對象之訊框,係於後續的處理中被分割成4個訊框,被視為含有該當4個訊框的超級訊框。
此外,第1判定部14f,係例如,將編碼對象訊框的音訊訊號加以解析,若該當音訊訊號是具有所定量以上的音調成分時,則可將Modified AAC編碼部14a3選擇成為該當訊框之語音訊號用的編碼部。
core_mode生成部14g,係隨著第1判定部14f的判定結果,而生成core_mode。如圖12所示,core_mode係為1位元之資訊。core_mode生成部14g,係當第1判定部14f判定為應該將編碼對象訊框的音訊訊號以Modified AAC編碼部14a3進行編碼的情況下,則將core_mode之值設定成「0」。另一方面,core_mode生成部14g,係當第1判定部14f判定為不應該將判定對象訊框的音訊訊號以Modified AAC編碼部14a3進行編碼的情況下,則將core_mode之值設定成「1」。該core_mode係被從輸出部14d輸出時,就被當成參數資訊而附加至編碼對象訊框所對應之串流內的輸出訊框。
第2判定部14h,係透過開關SW2而接收編碼對象之超級訊框的音訊訊號。第2判定部14h係判定,是否應該將編碼對象之超級訊框中的各訊框的音訊訊號以ACELP編碼部14a1進行編碼或是應該以TCX編碼部14a2進行編碼。
第2判定部14h,係當判定為應該將編碼對象訊框的
音訊訊號以ACELP編碼部14a1進行編碼的情況下,則控制開關SW3而使該當訊框之音訊訊號,結合至ACELP編碼部14a1。另一方面,第2判定部14h,係當判定為應該將編碼對象訊框的音訊訊號以TCX編碼部14a2進行編碼的情況下,則控制開關SW3而使該當訊框之音訊訊號,結合至TCX編碼部14a2。
第2判定部14h,係例如,當編碼對象訊框的音訊訊號是具有較強語音成分的訊號時,該當音訊訊號的時間包絡是在短時間內變動得比所定變動幅度還大時,或該當音訊訊號是含有過渡性成分時,則會判定將該當音訊訊號以ACELP編碼部14a1進行編碼。第2判定部14h,係在其他情況下,則會判定將該當音訊訊號以TCX編碼部14a2進行編碼。此外,所謂音訊訊號是具有較強語音成分之訊號的情況,係為該當音訊訊號的音高週期是在所定範圍內的情況、音高週期之時的自我相關是比所定之自我相關還強的情況、或過零率是小於所定之比率的情況。
lpd_mode生成部14i,係隨著第2判定部14h的判定結果,而生成lpd_mode。如圖12所示,lpd_mode係為4位元之資訊。lpd_mode生成部14i,係將lpd_mode之值設定成,對來自第2判定部14h之超級訊框中之各訊框之音訊訊號的判定結果所對應之所定值。被lpd_mode生成部14i設定了值的lpd_mode,係在被從輸出部14d輸出時,就被附加至編碼對象之超級訊框所對應之串流內的輸出超級訊框。
輸出部14d,係將串流予以輸出。串流中係含有,具有含上述GEM_ID之標頭及對應之編碼序列的第1訊框、及分別具有對應之編碼序列的第2~第m訊框(m係2以上之整數)。又,輸出部14d,係使各輸出訊框中,含有被MPS編碼部14m所生成之參數的編碼資料及被SBR編碼部14n所生成之參數的編碼資料。
以下,說明音訊編碼裝置14之動作,及另一實施形態所述之音訊編碼方法。圖13係另一實施形態所述之音訊編碼方法的流程圖。
如圖13所示,在一實施形態中,係於步驟S14-1中,生成部14c係基於輸入資訊而如上述般地生成(設定)GEM_ID。在後續的步驟S14-2中,標頭生成部14e係生成含有已被設定之GEM_ID的標頭。
接著,藉由步驟S14-p所示的判定,若判斷為被輸入至輸入端子In1的音訊訊號是多聲道訊號時,則於步驟S14-m中,MPS編碼部14m會如上述般地,從所被輸入之編碼對象訊框的多聲道之音訊訊號,生成比多聲道的聲道數還少之聲道數的音訊訊號、和用來從該當較少聲道數之音訊訊號解碼出多聲道之音訊訊號所需的參數。又,MPS編碼部14m係生成該當參數之編碼資料。該編碼資料,係藉由輸出部14d,而被含在對應的輸出訊框中。另一方面,當被輸入至輸入端子In1的音訊訊號是單聲道訊號時,則MPS編碼部14m係不動作,被輸入至輸入端子In1的音訊訊號係被輸入至SBR編碼部14n。
接著,於步驟S14-n中,SBR編碼部14n係如上述,從所被輸入的音訊訊號,生成低頻頻帶之音訊訊號、與用來從低頻頻帶之音訊訊號生成高頻頻帶之音訊訊號所需之參數。又,SBR編碼部14n係生成該當參數之編碼資料。該編碼資料,係藉由輸出部14d,而被含在對應的輸出訊框中。
接著,在步驟S14-3中,選擇部14b係基於輸入資訊,而判定是否將複數訊框之音訊訊號、亦即,從SBR編碼部14n所輸出之複數訊框的低頻頻帶之音訊訊號,以共通的音訊編碼處理進行編碼。
在步驟S14-3中,當輸入資訊是表示要將複數訊框之音訊訊號以共通的音訊編碼處理進行編碼時,亦即,當GEM_ID之值是「1」時,則選擇部14b係選擇ACELP編碼部14a1。
接著,在步驟S14-4中,已被選擇部14b所選擇的ACELP編碼部14a1,係將編碼對象訊框的音訊訊號加以編碼,生成編碼序列。
接著,在步驟S14-5中,輸出部14d係判斷是否對訊框附加標頭。於步驟S14-5中,輸出部14d係當編碼對象訊框是第1訊框時,則判定為要對該當編碼對象訊框所對應之串流內的第1訊框附加標頭,在後續的步驟S14-6中,使第1訊框中含有標頭及編碼序列,而將該當第1訊框予以輸出。另一方面,若是第2訊框以後的訊框,則不附加標頭,於步驟S14-7中,輸出部14d係使訊框中含有
編碼序列然後輸出。
接著,在步驟S14-8中,判斷是否有尚未編碼的訊框存在。若沒有尚未編碼之訊框存在,則結束處理。另一方面,若還有尚未編碼之訊框存在時,則以尚未編碼之訊框為對象而繼續步驟S14-p起的處理。
如此,在本實施形態中,當GEM_ID之值為「1」時,ACELP編碼部14a1係繼續被使用於複數訊框之所有音訊訊號的編碼。
在步驟S14-3中,當判斷為GEM_ID之值是「0」時,亦即,輸入資訊是表示各訊框應該要以個別之編碼處理方法來處理的情況下,則在步驟S14-9中,第1判定部14f係判定是否要將編碼對象訊框的音訊訊號、亦即從SBR編碼部14n所輸出的編碼對象訊框的低頻頻帶之音訊訊號,以Modified AAC編碼部14a3進行編碼。於後續的步驟S14-10中,core_mode生成部14g係將core_mode之值,設定成符合第1判定部14f所致之判定結果的值。
接著,在步驟S14-11中,判定第1判定部14f的判定結果是否表示,應該以Modified AAC編碼部14a3來將編碼對象訊框的音訊訊號進行編碼。當第1判定部14f的判定結果是表示,應該以Modified AAC編碼部14a3來將編碼對象訊框的音訊訊號進行編碼時,則在後續的步驟S14-12中,編碼對象訊框的音訊訊號係被Modified AAC編碼部14a3所編碼。
接著,在步驟S14-13中,輸出部14d係對編碼對象
訊框所對應之串流內的輸出訊框(或超級訊框),附加core_mode。然後,處理係前進至步驟S14-5。
在步驟S14-11中,當第1判定部14f的判定結果是表示,不應該以Modified AAC編碼部14a3來將編碼對象訊框的音訊訊號進行編碼時,則從步驟S14-14起之處理,係把編碼對象訊框視為超級訊框。
於步驟S14-14中,第2判定部14h係判定,是否應該將超級訊框中的各訊框,以ACELP編碼部14a1進行編碼、還是應該以TCX編碼部14a2進行編碼。於後續的步驟S14-15中,lpd_mode生成部14i係將lpd_mode設定成,符合第2判定部14h之判定結果的值。
接著,在步驟S14-16中係判定第2判定部14h的判定結果是表示,應該將超級訊框內的編碼對象訊框以ACELP編碼部14a1進行編碼,還是表示應該將該當編碼對象之訊框以TCX編碼部14a2進行編碼。
當第2判定部14h的判定結果是表示應該將編碼對象訊框以ACELP編碼部14a1進行編碼的情況下,則在步驟S14-17中,編碼對象訊框的音訊訊號係被ACELP編碼部14a1所編碼。另一方面,當第2判定部14h的判定結果是表示應該將編碼對象訊框以TCX編碼部14a2進行編碼的情況下,則在步驟S14-18中,編碼對象訊框的音訊訊號係被TCX編碼部14a2所編碼。
接著,在步驟S14-19中,對編碼對象之超級訊框所對應之串流內的輸出超級訊框,附加lpd_mode。然後,
處理係前進至步驟S14-13。
若依據以上說明的音訊編碼裝置14及音訊編碼方法,則藉由在標頭中含有設定成「1」的GEM_ID,各訊框中就不必含有用來特定曾經使用之音訊編碼處理用的資訊,可將複數訊框之音訊訊號是僅以ACELP編碼部做過編碼之事實,通知給解碼側。因此,可生成大小較小的串流。
以下說明,使電腦動作成為音訊編碼裝置14的音訊編碼程式。圖14係另一實施形態所述之音訊編碼程式的圖示。
圖14所示的音訊編碼程式P14,係可在圖5及圖6所示的電腦中使用。又,音訊編碼程式P14,係可與音訊編碼程式P10同樣地提供。
如圖14所示,音訊編碼程式P14係具備:ACELP編碼模組M14a1、TCX編碼模組M14a2、Modified AAC編碼模組M14a3、選擇模組M14b、生成模組M14c、輸出模組M14d、標頭生成模組M14e、第1判定模組M14f、core_mode生成模組M14g、第2判定模組M14h、lpd_mode生成模組M14i、MPS編碼模組M14m、及SBR編碼模組14n。
ACELP編碼模組M14a1、TCX編碼模組M14a2、Modified AAC編碼模組M14a3、選擇模組M14b、生成模組M14c、輸出模組M14d、標頭生成模組M14e、第1判定模組M14f、core_mode生成模組M14g、第2判定模組
M14h、lpd_mode生成模組M14i、MPS編碼模組M14m、及SBR編碼模組14n,係令電腦C10執行分別與ACELP編碼部14a1、TCX編碼部14a2、Modified AAC編碼部14a3、選擇部14b、生成部14c、輸出部14d、標頭生成部14e、第1判定部14f、core_mode生成部14g、第2判定部14h、lpd_mode生成部14i、MPS編碼部14m、SBR編碼部14n相同之機能。
以下,說明可將音訊編碼裝置14所生成之串流予以解碼的音訊解碼裝置。圖15係另一實施形態所述之音訊解碼裝置的圖示。圖15所示的音訊解碼裝置16,係具備:ACELP解碼部16a1、TCX解碼部16a2、Modified AAC解碼部16a3、抽出部16b、選擇部16c、標頭解析部16d、core_mode抽出部16e、第1選擇部16f、lpd_mode抽出部16g、第2選擇部16h、MPS解碼部16m、及SBR解碼部16n。
ACELP解碼部16a1係以ACELP解碼處理將訊框內的編碼序列予以解碼,生成音訊訊號。TCX解碼部16a2係以TCX解碼處理將訊框內的編碼序列予以解碼,生成音訊訊號。Modified AAC解碼部16a3係以Modified AAC解碼處理將訊框內的編碼序列予以解碼,生成音訊訊號。於一實施形態中,從這些解碼部所輸出的音訊訊號,係關於音訊編碼處理14而為上述的低頻頻帶之音訊訊號。
標頭解析部16d,係可從第1訊框分離出標頭。標頭解析部16d,係將已分離之標頭提供至抽出部16b,將標
頭已被分離之第1訊框、及後續訊框,輸出至開關SW1、MPS解碼部16m、及SBR解碼部16n。
抽出部16b,係從標頭抽出GEM_ID。選擇部16c,係隨著已被抽出之GEM_ID,來選擇要使用於複數訊框之編碼序列之解碼時的解碼部。具體而言,選擇部16c係當GEM_ID之值為「1」時,則控制開關SW1,將複數訊框全部結合至ACELP解碼部16a1。另一方面,GEM_ID之值為「0」時,選擇部16c係控制開關SW1,將解碼對象訊框(或超級訊框),結合至core_mode抽出部16e。
core_mode抽出部16e,係將解碼對象訊框(或超級訊框)內的core_mode予以抽出,將該當core_mode提供給第1選擇部16f。第1選擇部16f,係隨著所被提供的core_mode之值,來控制開關SW2。具體而言,當core_mode之值為「0」時,第1選擇部16f係控制開關SW2,將解碼對象訊框結合至Modified AAC解碼部16a3。藉此,解碼對象訊框就被輸入至Modified AAC解碼部16a3。另一方面,當core_mode之值為「1」時,第1選擇部16f係控制開關SW2,將解碼對象之超級訊框結合至lpd_mode抽出部16g。
lpd_mode抽出部16g,係從解碼對象訊框、亦即超級訊框中,抽出lpd_mode。lpd_mode抽出部16g,係將已抽出的lpd_mode,結合至第2選擇部16h。第2選擇部16h,係隨應於已被輸入的lpd_mode,而將從lpd_mode抽出部16g所輸出的解碼對象之超級訊框內的各訊框,結
合至ACELP解碼部16a1或TCX解碼部16a2。
具體而言,第2選擇部16h係參照與lpd_mode之值建立關連的所定表格,設定mod[k](k=0,1,2,3)之值。然後,第2選擇部16h,係隨應於mod[k]之值來控制開關SW3,將解碼對象之超級訊框內的各訊框,結合至ACELP解碼部16a1或TCX解碼部16a2。此外,關於mod[k]之值與ACELP解碼部16a1或TCX解碼部16a2之選擇的關係,將於後述。
SBR解碼部16n,係從解碼部16a1、16a2、及16a3,接受低頻頻帶之音訊訊號。SBR解碼部16n,係還會將解碼對象訊框中所含之編碼資料予以解碼,以將參數予以復原。SBR解碼部16n,係使用低頻頻帶之音訊訊號及已復原之參數,而生成高頻頻帶之音訊訊號。又,SBR解碼部16n,係藉由將高頻頻帶之音訊訊號及低頻頻帶之音訊訊號予以合成,而生成音訊訊號。
MPS解碼部16m,係從SBR解碼部16n接收音訊訊號。該音訊訊號,係當應復原之音訊訊號是立體聲訊號時,則有可能是單聲道之音訊訊號。MPS解碼部16m,係還會將解碼對象訊框中所含之編碼資料予以解碼,以將參數予以復原。又,MPS解碼部16m係使用從SBR解碼部16n所收到之音訊訊號與已復原之參數,而生成多聲道之音訊訊號,將該當多聲道之音訊訊號予以輸出。應復原之音訊訊號是單聲道訊號的情況下,則MPS解碼部16m係不動作,將上記SBR解碼部16n所生成的音訊訊號予以
輸出。
以下,說明音訊解碼裝置16的動作,與另一實施形態所述之音訊解碼方法。圖16係另一實施形態所述之音訊解碼方法的流程圖。
如圖16所示,在一實施形態中,係於步驟S16-1中,標頭解析部16d會從串流中分離出標頭。在後續的步驟S16-2中,抽出部16b係從標頭解析部16d所提供的標頭中,抽出GEM_ID。
接著,在步驟S16-3中,選擇部16c係隨著已被抽出部16b所抽出的GEM_ID之值,來選擇將複數訊框予以解碼的解碼部。具體而言,當GEM_ID之值為「1」時,選擇部16c係選擇ACELP解碼部16a1。此情況下,在步驟S16-4中,ACELP解碼部16a1係將解碼對象訊框內的編碼序列,予以解碼。步驟S16-4所生成的音訊訊號,係為上述的低頻頻帶之音訊訊號。
接著,在步驟S16-n中,SBR解碼部16n,係將解碼對象訊框中所含之編碼資料予以解碼,以將參數予以復原。又,於步驟S16-n中,SBR解碼部16n,係使用已被輸入之低頻頻帶之音訊訊號及已復原之參數,而生成高頻頻帶之音訊訊號。又,於步驟S16-n中,SBR解碼部16n,係藉由將高頻頻帶之音訊訊號及低頻頻帶之音訊訊號予以合成,而生成音訊訊號。
接著,藉由步驟S16-p中的判定而將多聲道訊號判斷成為處理對象的時候,於後續的步驟S16-m中,MPS解
碼部16m係將解碼對象訊框中所含之編碼資料予以解碼,以將參數予以復原。又,於步驟S16-m中,MPS解碼部16m係使用從SBR解碼部16n所收到之音訊訊號與已復原之參數,而生成多聲道之音訊訊號,將該當多聲道之音訊訊號予以輸出。另一方面,若將單聲道訊號判斷成為處理對象,則將SBR解碼部16n所生成的音訊訊號予以輸出。
接著,在步驟S16-5中,會進行是否還有尚未解碼之訊框存在的判定。若沒有尚未解碼之訊框存在,則結束處理。另一方面,若有尚未解碼的訊框存在時,則以尚未解碼之訊框為對象而繼續從步驟S16-4起之處理。藉此,當GEM_ID之值是「1」時,則複數訊框的編碼序列是被共通的解碼部、亦即ACELP解碼部16a1所解碼。
回到步驟S16-3,當GEM_ID之值是「0」時,則選擇部16c係將解碼對象訊框結合至core_mode抽出部16e。此情況下,在步驟S16-6中,core_mode抽出部16e,係從解碼對象訊框中抽出core_mode。
接著,在步驟S16-7中,第1選擇部16f係隨著所抽出的core_mode,來選擇Modified AAC解碼部16a3或lpd_mode抽出部16g。具體而言,當core_mode之值是「0」時,則第1選擇部16f係選擇Modified AAC解碼部16a3,將解碼對象訊框結合至Modified AAC解碼部16a3。此情況下,在後續的步驟S16-8中,處理對象訊框內的編碼序列是被Modified AAC解碼部16a3所解碼。該
步驟S16-8中所生成的音訊訊號,係為上述的低頻頻帶之音訊訊號。接著該步驟S16-8之後,會進行上述的SBR解碼處理(步驟S16-n)及MPS解碼處理(步驟S16-m)。
接著,在步驟S16-9中,會判定是否還有尚未解碼之訊框存在,若沒有尚未解碼的訊框存在,則結束處理。另一方面,若有尚未解碼的訊框存在時,則以尚未解碼之訊框為對象而繼續從步驟S16-6起之處理。
回到步驟S16-7,當core_mode之值是「1」時,則第1選擇部16f係選擇lpd_mode抽出部16g,將解碼對象訊框結合至lpd_mode抽出部16g。此外,此情況下,解碼對象訊框係被視為超級訊框。
接著,在步驟S16-10中,lpd_mode抽出部16g係從解碼對象之超級訊框中,抽出lpd_mode。然後,第2選擇部16h係隨著所抽出的lpd_mode而設定mod[k](k=0,1,2,3)。
接著,在步驟S16-11中,第2選擇部16h係將k的值設定成「0」。在後續的步驟S16-12中,第2選擇部16h係判定mod[k]之值是否大於0。若mod[k]之值為0以下,則第2選擇部16h係選擇ACELP解碼部16a1。另一方面,若mod[k]之值大於0,則第2選擇部16h係選擇TCX解碼部16a2。
然後,當ACELP解碼部16a1被選擇時,則在後續的步驟S16-13中,ACELP解碼部16a1會將超級訊框內的解
碼對象訊框之編碼序列予以解碼。接著,於步驟S16-14中,k之值係被設定成k+1。另一方面,當TCX解碼部16a2被選擇時,則在後續的步驟S16-15中,TCX解碼部16a2會將超級訊框內的解碼對象訊框之編碼序列予以解碼。接著,於步驟S16-16中,k之值係被更新成k+a(mod[k])。此外,關於mod[k]和a(mod[k])之關係,敬請參照圖17。
接著,於步驟S16-17中,判定k的值是否小於4。k的值小於4的情況下,從步驟S16-12起的處理就會對超級訊框內的後續訊框繼續進行。另一方面,若k的值為4以上,則處理係前進至步驟S16-n。
以下說明,使電腦動作成為音訊解碼裝置16的音訊解碼程式。圖18係另一實施形態所述之音訊解碼程式的圖示。
圖18所示的音訊解碼程式P16,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P16,係可與音訊編碼程式P10同樣地提供。
如圖18所示,音訊解碼程式P16係具備:ACELP解碼模組M16a1、TCX解碼模組M16a2、Modified AAC解碼模組M16a3、抽出模組M16b、選擇模組M16c、標頭解析模組M16d、core_mode抽出模組M16e、第1選擇模組M16f、lpd_mode抽出模組M16g、第2選擇模組M16h、MPS解碼模組M16m、及SBR解碼模組M16n。
ACELP解碼模組M16a1、TCX解碼模組M16a2、
Modified AAC解碼模組M16a3、抽出模組M16b、選擇模組M16c、標頭解析模組M16d、core_mode抽出模組M16e、第1選擇模組M16f、lpd_mode抽出模組M16g、第2選擇模組M16h、MPS解碼模組M16m、SBR解碼模組M16n,係令電腦C10執行分別與ACELP解碼部16a1、TCX解碼部16a2、Modified AAC解碼部16a3、抽出部16b、選擇部16c、標頭解析部16d、core_mode抽出部16e、第1選擇部16f、lpd_mode抽出部16g、第2選擇部16h、MPS解碼部16m、SBR解碼部16n相同之機能。
以下,說明再另一實施形態所述之音訊編碼裝置。圖19係再另一實施形態所述之音訊編碼裝置的圖示。圖19所示的音訊編碼裝置18,係為可當作AMR-WB+之擴充而使用的裝置。
圖20係依照先前之AMR WB+所生成的串流與圖19所示的音訊編碼裝置所生成的串流的圖示。如圖20所示,在AMR-WB+中,是對各訊框附加有2位元的Mode bits。Mode bits係為,隨著其值,來表示是否選擇ACELP編碼處理還是選擇TCX編碼處理的資訊。
另一方面,圖19所示的音訊編碼裝置18,係可將所有訊框的音訊訊號以共通之音訊編碼處理而加以編碼。又,音訊編碼裝置18,係亦可切換各訊框所使用的音訊編碼處理。
如圖19所示,音訊編碼裝置18係具備:ACELP編
碼部18a1、及TCX編碼部18a2。ACELP編碼部18a1,係以ACELP編碼處理將音訊訊號加以編碼而生成編碼序列。TCX編碼部18a2,係以TCX編碼處理將音訊訊號加以編碼而生成編碼序列。音訊編碼裝置18係還具備:選擇部18b、生成部18c、輸出部18d、標頭生成部18e、編碼處理判定部18f、Mode bits生成部18g、分析部18m、縮減混音部18n、高頻頻帶編碼部18p、及立體聲編碼部18q。
分析部18m,係以所定頻率為基準,將被輸入至輸入端子In1的各訊框的音訊訊號,分割成低頻頻帶之音訊訊號與高頻頻帶之音訊訊號。分析部18m,係若被輸入至輸入端子In1的音訊訊號是單聲道之音訊訊號時,則將已生成之低頻頻帶之音訊訊號輸出至開關SW1,將高頻頻帶之音訊訊號輸出至高頻頻帶編碼部18p。另一方面,若被輸入至輸入端子In1的音訊訊號是立體聲訊號時,則分析部18m係將已生成之低頻頻帶之音訊訊號(立體聲訊號),輸出至縮減混音部18n。
縮減混音部18n,係當被輸入至輸入端子In1的音訊訊號是立體聲訊號時,則將低頻頻帶之音訊訊號(立體聲訊號)縮減混音成單聲道之音訊訊號。縮減混音部18n,係將所生成之單聲道之音訊訊號,輸出至開關SW1。縮減混音部18n,係將低頻頻帶之音訊訊號以所定頻率為基準而分割成二個頻帶之音訊訊號。縮減混音部18n,係將二個頻帶之音訊訊號當中較低頻帶之音訊訊號(單聲道訊
號)與右聲道之音訊訊號,輸出至立體聲編碼部18q。
高頻頻帶編碼部18p,係算出在解碼側中用來從低頻頻帶之音訊訊號生成高頻頻帶之音訊訊號所需的參數,生成該當參數之編碼資料,將該當編碼資料輸出至輸出部18d。作為參數係可使用例如將頻譜包絡予以模型化之線性預測係數或功率調整所需的增益。
立體聲編碼部18q,係上記二個頻帶之音訊訊號當中較低頻帶之單聲道之音訊訊號與右聲道之音訊訊號的差分訊號亦即側旁訊號,予以算出。立體聲編碼部18q,係算出表示單聲道之音訊訊號與側旁訊號之位準差的平衡因子,將該當平衡因子、與側旁訊號之波形分別以所定之方法加以編碼,將編碼資料輸出至輸出部18d。又,立體聲編碼部18q,係算出用來從上記二個頻帶之音訊訊號當中較低頻帶之音訊訊號在解碼裝置中生成立體聲音訊訊號所需的參數,將該當參數之編碼資料,輸出至輸出部18d。
選擇部18b,係具有和選擇部14b同樣的機能。具體而言,當輸入資訊是表示將複數訊框以共通的一種音訊編碼處理來進行編碼時,選擇部18b係控制開關SW1,而將被輸入至開關SW1的所有訊框的音訊訊號,結合至ACELP編碼部18a1。另一方面,當輸入資訊是表示並非將複數訊框以共通的一種編碼處理來進行編碼時,則選擇部18b係控制開關SW1,而將被輸入至開關SW1的各訊框的音訊訊號,結合至與編碼處理判定部18f等連接的路徑。
生成部18c,係和生成部14c同樣地設定GEM_ID。標頭生成部18e,係生成含有已被生成部18c所生成之GEM_ID的支援AMR-WB+之標頭。該標頭係被放在串流的開頭中,被輸出部18d所輸出。在本實施形態中,GEM_ID係可被包含在,標頭的AMRWBPSampleEntry_fields內的未使用領域裡。
編碼處理判定部18f,係當輸入資訊是表示並非將複數訊框以共通的一種編碼處理來進行編碼時,則透過SW1而接受編碼對象訊框的音訊訊號。
編碼處理判定部18f,係將編碼對象訊框,視為將該當編碼對象的訊框分割成4個以下之訊框而成的超級訊框。編碼處理判定部18f,係解析超級訊框中的各訊框的音訊訊號,判定是否應將該當音訊訊號以ACELP編碼部18a1進行編碼、還是應該以TCX編碼部18a2進行編碼。該解析係亦可為和上述第2判定部14h相同的解析。
判定部18f,係判定應該將訊框之音訊訊號以ACELP編碼部18a1進行編碼時,則控制開關SW2,而將該當訊框之音訊訊號結合至ACELP編碼部18a1。另一方面,若判定應該將訊框之音訊訊號以TCX編碼部18a2進行編碼時,則控制開關SW2,而將該當訊框之音訊訊號結合至TCX編碼部18a2。
Mode bits生成部18g,係生成具有相應於編碼處理判定部18f之判定結果之值的K個Mode Bits[k](k=0~K-1)。此處,K的值係為4以下的整數,是對應於超級訊
框內的訊框數。又,Mode bits[k]係為表示,編碼對象訊框的音訊訊號之編碼時是使用了ACELP編碼處理、還是使用了TCX編碼處理的至少2位元之資訊。
輸出部18d,係將具有標頭、及對應之編碼序列複數訊框的串流,予以輸出。又,輸出部18d係當GEM_ID之值為0時,則使輸出訊框中含有Mode bits[k]。然後,輸出部18d係使已被高頻頻帶編碼部18p所生成的編碼資料、及已被立體聲編碼部18所生成的編碼資料,被包含在對應的訊框中。
以下,說明音訊編碼裝置18之動作,及一實施形態所述之音訊編碼方法。圖21係再另一實施形態所述之音訊編碼方法的流程圖。
如圖21所示,在一實施形態中,首先進行和步驟S14-1相同的步驟S18-1。接著,在步驟S18-2中,標頭生成部18e係如上述,生成含有GEM_ID的AMR-WB+標頭。在後續的步驟S18-3中,輸出部18d係將所生成的標頭,放在串流的開頭而輸出。
接著,於步驟S18-m中,分析部18m,係如上述,將被輸入至輸入端子In1的編碼對象訊框的音訊訊號,分割成低頻頻帶之音訊訊號與高頻頻帶之音訊訊號。又,於步驟S18-m中,分析部18m,係若被輸入至輸入端子In1的音訊訊號是單聲道之音訊訊號時,則將已生成之低頻頻帶之音訊訊號輸出至開關SW1,將高頻頻帶之音訊訊號輸出至高頻頻帶編碼部18p。另一方面,若被輸入至輸入端子
In1的音訊訊號是立體聲訊號時,則分析部18m係將已生成之低頻頻帶之音訊訊號(立體聲訊號),輸出至縮減混音部18n。
接著,藉由步驟S18-r所示的判定,若判斷為被輸入至輸入端子In1的音訊訊號是單聲道訊號時,則於步驟S18-p中進行高頻頻帶編碼部18p的上述之處理,已被高頻頻帶編碼部18p所生成之上述的編碼資料,係被輸出部18d所輸出。另一方面,若被輸入至輸入端子In1的音訊訊號是立體聲訊號時,則於步驟S18-n中進行縮減混音部18n的上述之處理,於後續之步驟S18-q中進行立體聲編碼部18q的上述之處理,已被立體聲編碼部18q所生成之上述的編碼資料,係被輸出部18d所輸出,處理係前進至步驟S18-p。
接著,在步驟S18-4中,選擇部18b係判定GEM_ID之值是否為「0」。GEM_ID之值並非「0」時,亦即GEM_ID之值是「1」時,則選擇部18b係選擇ACELP編碼部18a1。接著,在步驟S18-5中,用已被選擇的ACELP編碼部18a1,將訊框的音訊訊號(低頻頻帶之音訊訊號)予以編碼。在後續的步驟S18-6中,含有已被生成之編碼序列的訊框,係被輸出部18d所輸出。然後,當GEM_ID之值是「1」時,則還會經過步驟S18-7的是否還有應編碼之訊框的判定,所有訊框的音訊訊號(低頻頻帶之音訊訊號)係被ACELP編碼部18a1所編碼然後輸出。
回到步驟S18-4,當GEM_ID之值是「0」時,則在後續的步驟S18-8中,編碼處理判定部18f係判定,是否將編碼對象訊框亦即超級訊框中的各訊框之音訊訊號(低頻頻帶之音訊訊號)以ACELP編碼處理進行編碼,還是以TCX編碼處理進行編碼。
接著,在步驟S18-9中,Mode bits生成部18g係生成具有相應於編碼處理判定部18f之判定結果之值的Mode bits[k]。
接著,在步驟S18-10中,判定步驟S18-8之判定結果是否表示,要將編碼對象訊框的音訊訊號以TCX編碼處理進行編碼,亦即以TCX編碼部18a2進行編碼。
步驟S18-8之判定結果是表示要將編碼對象訊框的音訊訊號以TCX編碼部18a2進行編碼的情況下,則在後續的步驟S18-11中,以TCX編碼部18a2將該當訊框的音訊訊號(低頻頻帶之音訊訊號)進行編碼。另一方面,判定結果並非表示要將編碼對象訊框的音訊訊號以TCX編碼部18a2進行編碼的情況下,則在後續的步驟S18-12中,以ACELP編碼部18a1將該當訊框的音訊訊號(低頻頻帶之音訊訊號)進行編碼。此外,步驟S18-10~步驟S18-12之處理,係對超級訊框內的各訊框進行。
接著,在步驟S18-13中,輸出部18d係對步驟S18-11或步驟S18-12所生成的編碼序列,附加Mode bits[k]。然後,處理係前進至步驟S18-6。
即使在以上說明的音訊編碼裝置18及音訊編碼方法
中,也是藉由在標頭中含有設定成「1」的GEM_ID,就可將複數訊框之音訊訊號是僅以ACELP編碼部做過編碼之事實,通知給解碼側。因此,可生成大小較小的串流。
以下說明,使電腦動作成為音訊編碼裝置18的音訊編碼程式。圖22係為再另一實施形態所述之音訊編碼程式的圖示。
圖22所示的音訊編碼程式P18,係可在圖5及圖6所示的電腦中使用。又,音訊編碼程式P18,係可與音訊編碼程式P10同樣地提供。
音訊編碼程式P18係具備:ACELP編碼模組M18a1、TCX編碼模組M18a2、選擇模組M18b、生成模組M18c、輸出模組M18d、標頭生成模組M18e、編碼處理判定模組M18f、Mode bits生成模組M18g、分析模組M18m、縮減混音模組M18n、高頻頻帶編碼模組M18p、及立體聲編碼模組M18q。
ACELP編碼模組M18a1、TCX編碼模組M18a2、選擇模組M18b、生成模組M18c、輸出模組M18d、標頭生成模組M18e、編碼處理判定模組M18f、Mode bits生成模組M18g、分析模組M18m、縮減混音模組M18n、高頻頻帶編碼模組M18p、及立體聲編碼模組M18q,係令電腦C10執行分別與ACELP編碼部18a1、TCX編碼部18a2、選擇部18b、生成部18c、輸出部18d、標頭生成部18e、編碼處理判定部18f、Mode bits生成部18g、分析部18m、縮減混音部18n、高頻頻帶編碼部18p、立體聲編
碼部18q相同之機能。
以下,說明可將音訊編碼裝置18所生成之串流予以解碼的音訊解碼裝置。圖23係再另一實施形態所述之音訊解碼裝置的圖示。圖23所示的音訊解碼裝置20係具備:ACELP解碼部20a1、及TCX解碼部20a2。ACELP解碼部20a1係以ACELP解碼處理將訊框內的編碼序列予以解碼,生成音訊訊號(低頻頻帶之音訊訊號)。TCX解碼部20a2係以TCX解碼處理將訊框內的編碼序列予以解碼,生成音訊訊號(低頻頻帶之音訊訊號)。音訊解碼裝置20係還具備:抽出部20b、選擇部20c、標頭解析部20d、Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶解碼部20p、立體聲解碼部20q、及合成部20m。
標頭解析部20d,係接受圖20所示的串流,從該當串流中分離出標頭。標頭解析部20d,係將已分離之標頭,提供給抽出部20b。又,標頭解析部20d,係將已分離出標頭的串流中的各訊框,輸出至開關SW1、高頻頻帶解碼部20p、及立體聲解碼部20q。
抽出部20b,係從標頭抽出GEM_ID。選擇部20c係當已被抽出之GEM_ID之值是「1」時,則控制開關SW1,而將複數訊框結合至ACELP解碼部20a1。藉此,當GEM_ID之值是「1」時,則所有訊框的編碼序列是被ACELP解碼部20a1所解碼。
另一方面,當GEM_ID之值是「0」時,則選擇部20c係控制開關SW1,而將各訊框結合至Mode bits抽出
部20e。Mode bits抽出部20e係將已被輸入之各訊框、亦即超級訊框中的各訊框用的Mode bits[k]予以抽出,提供給解碼處理選擇部20f。
解碼處理選擇部20f,係隨應於Mode bits[k]之之值,來控制開關SW2。具體而言,解碼處理選擇部20f係根據Mode bits[k]之值而判斷應該選擇ACELP解碼處理時,則控制開關SW2,而將解碼對象訊框結合至ACELP解碼部20a1。另一方面,具體而言,解碼處理選擇部20f係根據Mode bits[k]之值而判斷應該選擇TCX解碼處理時,則控制開關SW2,而將解碼對象訊框結合至TCX解碼部20a2。
高頻頻帶解碼部20p,係將解碼對象訊框中所含之編碼資料予以解碼,以復原上述之參數。高頻頻帶解碼部20p,係使用已復原之參數、以及已被ACELP解碼部20a1及/或TCX解碼部20a2所解碼的低頻頻帶之音訊訊號,生成高頻頻帶之音訊訊號,將該當高頻頻帶之音訊訊號輸出至合成部20m。
立體聲解碼部20q,係將解碼對象訊框中所含之編碼資料予以解碼,以將上述的參數、平衡因子、及側旁訊號之波形予以復原。立體聲解碼部20q,係使用已復原之參數、平衡因子、及側旁訊號之波形、以及已被ACELP解碼部20a1及/或TCX解碼部20a2所解碼的低頻頻帶之單聲道之音訊訊號,而生成立體聲訊號。
合成部20m係將已被ACELP解碼部20a1及/或TCX
解碼部20a2所復原之低頻頻帶之音訊訊號、和已被高頻頻帶解碼部20p所生成之高頻頻帶之音訊訊號加以合成,以生成解碼音訊訊號。又,若以立體聲訊號為處理對象時,則合成部20m係也會使用來自立體聲解碼部20q的輸入訊號(立體聲訊號),生成立體聲音訊訊號。
以下,說明音訊解碼裝置20之動作、和一實施形態所述之音訊解碼方法。圖24係再另一實施形態所述之音訊解碼方法的流程圖。
如圖24所示,在一實施形態中,首先於步驟S20-1中,標頭解析部20d會從串流中分離出標頭。
接著,在步驟S20-2中,抽出部20b係從標頭中抽出GEM_ID。於後續的步驟S20-3中,選擇部20c係隨著GEM_ID之值來控制開關SW1。
具體而言,當GEM_ID之值是「1」時,則選擇部20c係控制開關SW1,而選擇ACELP解碼部20a1來作為將串流中的複數訊框之編碼序列予以解碼的解碼部。此情況下,在後續的步驟S20-4中,ACELP解碼部20a1係將解碼對象訊框的編碼序列,予以解碼。藉此,低頻頻帶之音訊訊號就會被復原。
接著,於步驟S20-p中,高頻頻帶解碼部20p會從解碼對象訊框中所含之編碼資料,復原出參數。又,在步驟S20-p中,高頻頻帶解碼部20p係使用已復原之參數、及已被ACELP解碼部20a1復原的低頻頻帶之音訊訊號,而生成高頻頻帶之音訊訊號,將該當高頻頻帶之音訊訊號輸
出至合成部20m。
接著,藉由步驟S20-r中的判定而將立體聲訊號判斷成為處理對象的時候,於後續的步驟S20-q中,立體聲解碼部20q係將解碼對象訊框中所含之編碼資料予以解碼,以將上述的參數、平衡因子、及側旁訊號之波形予以復原。又,在步驟S20-q中,立體聲解碼部20q係使用已復原之參數、平衡因子、及側旁訊號之波形、以及已被ACELP解碼部20a1復原的低頻頻帶的單聲道之音訊訊號,而將立體聲訊號予以復原。
接著,在步驟S20-m中,合成部20m係將已被ACELP解碼部20a1所復原之低頻頻帶之音訊訊號、和已被高頻頻帶解碼部20p所生成之高頻頻帶之音訊訊號加以合成,以生成解碼音訊訊號。又,若以立體聲訊號為處理對象時,則合成部20m係也會使用來自立體聲解碼部20q的輸入訊號(立體聲訊號),以復原立體聲音訊訊號。
然後,在步驟S20-5中判定為沒有尚未解碼之訊框存在時,則結束處理。另一方面,若有尚未解碼的訊框存在時,則以未處理之訊框為對象而繼續從步驟S20-4起之處理。
回到步驟S20-3,當GEM_ID之值是「0」時,則選擇部20c係控制開關SW1,而將串流之各訊框結合至Mode bits抽出部20e。此情況下,在後續的步驟S20-6中,Mode bits抽出部20e係從解碼對象之超級訊框中,抽出Mode bits[k]。此外,Mode bits[k]係亦可從超級訊框
中1次抽出,或是在超級訊框內的各訊框之解碼時依序被抽出。
接著,在步驟S20-7中,解碼處理選擇部20f係將k的值設定成「0」。在後續的步驟S20-8中,解碼處理選擇部20f係判定Mode bits[k]之值是否大於0。若Mode bits[k]之值為0以下,則在後續的步驟S20-9中,超級訊框內的解碼對象框架的編碼序列係被ACELP解碼部20a1所解碼。另一方面,若Mode bits[k]之值大於0,則超級訊框內的解碼對象框架的編碼序列係被TCX解碼部20a2所解碼。
接著,在步驟S20-11中,解碼處理選擇部20f係把k的值更新成k+a(Mode bits[k])。此處,Mode bits[k]之值與a(Mode bits[k])的關係,是具有和圖17所示之mod[k]與a(mod[k])相同的關係。
接著,於步驟S20-12中,解碼處理選擇部20f係判定k的值是否小於4。k的值小於4的情況下,係以超級訊框內的後續訊框為對象,繼續從步驟S20-8起的處理。另一方面,若k的值是4以上時,則於步驟S20-p中,高頻頻帶解碼部20p會從解碼對象訊框中所含之編碼資料,復原出參數。又,在步驟S20-p中,高頻頻帶解碼部20p係根據該當參數、及已被解碼部20a1或解碼部20a2所復原之低頻頻帶之音訊訊號,生成高頻頻帶之音訊訊號,將該當高頻頻帶之音訊訊號輸出至合成部20m。
接著,藉由步驟S20-r中的判定而將立體聲訊號判斷
成為處理對象的時候,於後續的步驟S20-q中,立體聲解碼部20q係將解碼對象訊框中所含之編碼資料予以解碼,以將上述的參數、平衡因子、及側旁訊號之波形予以復原。又,在步驟S20-q中,立體聲解碼部20q係使用已復原之參數、平衡因子、及側旁訊號之波形、以及已被解碼部20a1或解碼部20a2復原的低頻頻帶的單聲道之音訊訊號,而將立體聲訊號予以復原。
接著,在步驟S20-m中,合成部20m係將已被解碼部20a1或解碼部20a2所復原之低頻頻帶之音訊訊號、和已被高頻頻帶解碼部20p所生成之高頻頻帶之音訊訊號加以合成,以生成解碼音訊訊號。又,若以立體聲訊號為處理對象時,則合成部20m係也會使用來自立體聲解碼部20q的輸入訊號(立體聲訊號),以復原立體聲音訊訊號。然後,處理係前進至步驟S20-13。
在步驟S20-13中,會判定是否還有尚未解碼的訊框。若沒有尚未解碼之訊框存在,則結束處理。另一方面,若有尚未解碼的訊框存在時,則以該當訊框(超級訊框)為對象,而繼續從步驟S20-6起之處理。
以下說明,可使電腦動作成為音訊解碼裝置20的音訊解碼程式。圖25係為再另一實施形態所述之音訊解碼程式的圖示。
圖25所示的音訊解碼程式P20,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P20,係可與音訊編碼程式P10同樣地提供。
音訊解碼程式P20係具備:ACELP解碼模組M20a1、TCX解碼模組M20a2、抽出模組M20b、選擇模組M20c、標頭解析模組M20d、Mode bits抽出模組M20e、解碼處理選擇模組M20f、高頻頻帶解碼模組M20p、立體聲解碼模組M20q、及合成模組M20m。
ACELP解碼模組M20a1、TCX解碼模組M20a2、抽出模組M20b、選擇模組M20c、標頭解析模組M20d、Mode bits抽出模組M20e、解碼處理選擇模組M20f、高頻頻帶解碼模組M20p、立體聲解碼模組M20q、合成模組M20m,係、令電腦執行分別與ACELP解碼部20a1、TCX解碼部20a2、抽出部20b、選擇部20c、標頭解析部20d、Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶解碼部20p、立體聲解碼部20q、合成部20m相同之機能。
以下,說明再另一實施形態的音訊編碼裝置。圖26係再另一實施形態所述之音訊編碼裝置的圖示。圖26所示的音訊編碼裝置22,係可切換第1複數訊框之音訊訊號之編碼時所使用的音訊編碼處理、和後述的第2複數訊框之音訊訊號之編碼時所使用的音訊編碼處理。
音訊編碼裝置22,係和音訊編碼裝置10同樣地,具備編碼部10a1~10an。音訊編碼裝置22,係還具備生成部22c、選擇部22b、輸出部22d、及檢查部22e。
檢查部22e,係監視著往輸入端子In2之輸入,接受被輸入至輸入端子In2的輸入資訊。輸入資訊係為,用來
特定出複數訊框之編碼時所共通使用之音訊編碼處理用的資訊。
選擇部22b,係選擇出相應於輸入資訊的編碼部。具體而言,選擇部22b係控制開關SW,而將被輸入至輸入端子In1的音訊訊號,結合至會執行被輸入資訊所特定之音訊編碼處理的編碼部。選擇部22b,係繼續單一編碼部之選擇,直到有下個輸入資訊被輸入至檢查部22e。
生成部22c,係在每次藉由檢查部22e而接收了輸入資訊時,就基於該當輸入資訊而生成用來表示複數訊框曾經被使用共通之編碼處理之事實的長期編碼處理資訊。
輸出部22d,係一旦藉由生成部22c而生成了長期編碼處理資訊,就將該當長期編碼處理資訊對複數訊框進行附加。圖27係圖26所示之音訊編碼裝置所生成之串流的圖示。如圖27所示,長期編碼處理資訊係被附加至複數訊框當中的開頭訊框。在圖27所示的例子中係表示,第1訊框至第1-1訊框的複數訊框是被共通的編碼處理所編碼,在第1訊框中會切換編碼處理,第1訊框至第m訊框的複數訊框是被共通的編碼處理進行編碼。
以下,說明音訊編碼裝置22之動作,和一實施形態所述之音訊編碼方法。圖28係再另一實施形態所述之音訊編碼方法的流程圖。
如圖28所示,在一實施形態中,係於步驟S22-1中,檢查部22e係監視著輸入資訊之輸入。一旦輸入資訊被輸入,則於步驟S22-2中,選擇部22b係選擇出相應於
輸入資訊的編碼部。
接著,在步驟S22-3中,選擇部22b係基於輸入資訊而生成長期編碼處理資訊。長期編碼處理資訊,係於步驟S22-4中,藉由輸出部22d,而被附加至複數訊框當中的開頭訊框。
然後,於步驟S22-5中,編碼對象訊框的音訊訊號,係被已被選擇之編碼部所編碼。此外,直到下個輸入資訊被輸入為止的期間,係不經過步驟S22-2~S22-4的處理,就將編碼對象訊框的音訊訊號予以編碼。
接著,在步驟S22-6中,已被編碼的編碼序列,係被包含在編碼對象訊框所對應之位元串流內的訊框中然後從輸出部22d輸出。
接著,在步驟S22-7中,判定是否有尚未編碼的訊框存在。若沒有尚未編碼之訊框存在,則結束處理。另一方面,若還有尚未編碼之訊框存在時,則繼續從步驟S22-1起的處理。
以下說明,可使電腦動作成為音訊編碼裝置22的音訊編碼程式。圖29係為再另一實施形態所述之音訊編碼程式的圖示。
圖29所示的音訊編碼程式P22,係可在圖5及圖6所示的電腦中使用。又,音訊編碼程式P22,係可與音訊編碼程式P10同樣地提供。
如圖29所示,音訊編碼程式P22係具備:編碼模組部M10a1~10an、生成模組M22c、選擇模組M22b、輸出
模組M22d、及檢查模組M22e。
編碼模組部M10a1~10an、生成模組M22c、選擇模組M22b、輸出模組M22d、檢查模組M22e,係令電腦C10執行分別與編碼部10a1~10an、生成部22c、選擇部22b、輸出部22d、檢查部22e相同之機能。
以下,說明可將音訊編碼裝置22所生成之串流予以解碼的音訊解碼裝置。圖30係再另一實施形態所述之音訊解碼裝置的圖示。
圖30所示的音訊解碼裝置24,係和音訊解碼裝置12同樣地,具備解碼部12a1~12an。音訊解碼裝置24,係還具備有抽出部24b、選擇部24c、檢查部24d。
檢查部24d係檢查,被輸入至輸入端子In的串流內的各訊框中,是否含有長期編碼處理資訊。抽出部24b,係一旦藉由檢查部24d而判斷在訊框中含有長期編碼處理資訊,則從該當訊框抽出長期編碼處理資訊。又,抽出部24b係在摘除了長期編碼處理資訊之後,將訊框送出至開關SW。
選擇部24c,係一旦藉由抽出部24b而抽出長期編碼處理資訊,則控制開關SW,選擇會執行基於該當長期編碼處理資訊而被特定之編碼處理所對應之音訊解碼處理的解碼部。選擇部24c,係直到藉由檢查部24d而抽出下個長期編碼處理資訊為止的期間,會持續選擇單一的解碼部,將複數訊框的編碼序列持續以共通的音訊解碼處理進行解碼。
以下,說明音訊解碼裝置24之動作,和一實施形態所述之音訊解碼方法。圖31係再另一實施形態所述之音訊解碼方法的流程圖。
如圖31所示,在一實施形態中,係於步驟S24-1中,檢查部24d係監視所被輸入之訊框中是否含有長期編碼處理資訊。若由檢查部24d偵測出長期編碼處理資訊,則在後續的步驟S24-2中,抽出部24b係從訊框抽出長期編碼處理資訊。
接著,在步驟S24-3中,選擇部24c係基於已被抽出的長期編碼處理資訊而選擇適切的解碼部。在後續的步驟S24-4中,已被選擇的解碼部,係將解碼對象訊框的編碼序列,予以解碼。
然後,在步驟S24-5中,會進行是否還有尚未解碼之訊框存在的判定。若沒有尚未解碼之訊框存在,則結束處理。另一方面,若還有尚未解碼之訊框存在時,則繼續從步驟S24-1起的處理。
在本實施形態中,於步驟S24-1中若判定訊框裡沒有被附加長期編碼處理資訊,則不經過步驟S24-2~步驟S24-3之處理,就執行步驟S24-4之處理。
以下說明,可使電腦動作成為音訊解碼裝置24的音訊解碼程式。圖32係為再另一實施形態所述之音訊解碼程式的圖示。
圖32所示的音訊解碼程式P24,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P24,係可與音訊
編碼程式P10同樣地提供。
如圖32所示,音訊解碼程式P24係具備:解碼模組M12a1~12an、抽出模組M24b、選擇模組M24c、及檢查模組M24d。
解碼模組M12a1~12an、抽出模組M24b、選擇模組M24c、檢查模組M24d,係令電腦C10執行分別與解碼部12a1~12an、抽出部24b、選擇部24c、檢查部24d相同之機能。
以下,說明再另一實施形態所述之音訊編碼裝置。圖33係再另一實施形態所述之音訊編碼裝置的圖示。又,圖34係依照先前之MPEG USAC所生成的串流與圖33所示的音訊編碼裝置所生成的串流的圖示。
在上述的音訊編碼裝置14中,是可將所有訊框的音訊訊號以單一的共通之音訊編碼處理來進行編碼,或將各訊框的音訊訊號以個別的音訊編碼處理來進行編碼。
另一方面,圖33所示的音訊編碼裝置26,係對複數訊框當中的部分複數訊框,使用共通之音訊編碼處理。又,音訊編碼裝置26,係亦可對全部訊框當中的部分訊框,使用個別之音訊編碼處理。甚至,音訊編碼裝置26係可對全部訊框當中的中間訊框起算之複數訊框,使用共通之音訊編碼處理。
如圖33所示,音訊編碼裝置26係和音訊編碼裝置14同樣地,具備:ACELP編碼部14a1、TCX編碼部14a2、Modified AAC編碼部14a3、第1判定部14f、
core_mode生成部14g、第2判定部14h、lpd_mode生成部14i、MPS編碼部14m、及、SBR編碼部14n。音訊編碼裝置26,係還具備檢查部26j、選擇部26b、生成部26c、輸出部26d、及標頭生成部26e。以下,在音訊編碼裝置26之要素當中,針對與音訊編碼裝置14不同的要素,加以說明。
檢查部26j,係檢查是否有輸入資訊被輸入至輸入端子In2。輸入資訊是表示,是否將複數訊框之音訊訊號以共通的音訊編碼處理進行編碼的資訊。
選擇部26b,係一旦藉由檢查部26j而偵測到輸入資訊,就會控制開關SW1。具體而言,選擇部26b係當偵測到的輸入資訊是表示要將複數訊框之音訊訊號以共通的音訊編碼處理進行編碼時,則控制開關SW1,而將開關SW1與ACELP編碼部14a1結合。另一方面,當偵測到的輸入資訊是表示不要將複數訊框之音訊訊號以共通的音訊編碼處理進行編碼時,則選擇部26b係控制開關SW1,而將開關SW1結合至含有第1判定部14f等的路徑。
生成部26c,係一旦藉由檢查部26j而偵測到輸入資訊,則將該時點的編碼對象訊框所對應之輸出訊框用的GEM_ID予以生成。具體而言,生成部26c係當偵測到的輸入資訊是表示要將複數訊框之音訊訊號以共通的音訊編碼處理進行編碼時,則將GEM_ID之值設定成「1」。另一方面,當偵測到的輸入資訊是表示不要將複數訊框之音訊訊號以共通的音訊編碼處理進行編碼時,則生成部26c
係將GEM_ID之值設定成「0」。
標頭生成部26e,係一旦藉由檢查部26j而偵測到輸入資訊,則生成該時點的編碼對象訊框所對應之輸出訊框的標頭,使該當標頭內含有被生成部26c所生成的GEM_ID。
輸出部26d,係將含有已被生成之編碼序列的輸出訊框,予以輸出。又,輸出部26d,係使各輸出訊框中,含有被MPS編碼部14m所生成之參數的編碼資料及被SBR編碼部14n所生成之參數的編碼資料。此外,輸出訊框係在藉由檢查部26j而偵測到輸入資訊的情況下,則含有已被標頭生成部26e所生成之標頭。
以下,說明音訊編碼裝置26之動作,和再另一實施形態所述之音訊編碼方法。圖35係再另一實施形態所述之音訊編碼方法的流程圖。
在圖35所示的流程中,步驟S14-3~4、步驟S14-9~19、步驟S14-m~步驟S14-n之處理,係和圖13所示者相同。以下,針對與圖13所示流程不同的處理,加以說明。
如圖35所示,在一實施形態中,係在步驟S26-a中,將GEM_ID之值予以初期化。GEM_ID之值係例如會被初期化成「0」。在步驟S26-1中,檢查部26j係如上述般地監視著輸入資訊。若偵測出有輸入資訊被輸入,則在後續的步驟S26-2中,生成部26c會生成符合該當輸入資訊的GEM_ID,在後續的步驟S26-3中,標頭生成部
26e係設定含有已被設定之GEM_ID的標頭。另一方面,當沒有輸入資訊時,則不經過步驟S26-2及S26-3之處理,處理就前進至步驟S14-p。
在步驟S26-4中,會判斷是否附加標頭。一旦被檢查部26j偵測到輸入資訊,則對該時點之編碼對象訊框所對應的輸出訊框,在步驟S26-5中,會被附加含有GEM_ID的標頭,將含有該當標頭的訊框予以輸出。另一方面,當未偵測到輸入資訊時,則該時點上的編碼對象訊框所對應的輸出訊框,係在步驟S26-6中直接被輸出。
接著,在步驟S26-7中,判定是否有尚未編碼的訊框存在。若沒有尚未編碼之訊框存在,則結束處理。另一方面,若還有尚未編碼之訊框存在時,則以尚未編碼之訊框為對象而繼續步驟S26-1起的處理。
若依據以上說明的音訊編碼裝置26及一實施形態所述之音訊編碼方法,則可將複數訊框以共通之音訊編碼處理進行編碼,其後,將數個訊框以個別之音訊編碼處理進行編碼,將更後續的複數訊框以共通之音訊編碼處理進行編碼。
此外,在音訊編碼裝置26中,雖然是基於輸入資訊來決定複數訊框之音訊訊號之編碼時所要共通使用的音訊編碼處理,但本發明係亦可基於各訊框的音訊訊號的解析結果,來選擇出複數訊框所要共通使用的音訊編碼處理。例如,亦可在輸入端子In1與開關SW1之間,含有解析各訊框之音訊訊號的解析部,基於該解析結果,來令選擇
部26b及生成部26c作動。又,該解析係可使用上述的解析手法。
又,亦可將所有訊框的音訊訊號,先一度結合至含有第1判定部14f的路徑,將含有編碼序列的輸出訊框,積存在輸出部26d中。此情況下,係可使用第1判定部14f及第2判定部14h的判定結果,而將lpd_mode、core_mode等之設定、標頭之生成、附加等,針對各訊框而在事後做調整。
此外,亦可進行所定數之訊框之解析、或對所定數之訊框進行第1判定部14f及第2判定部的判定,而使用該當所定數之訊框之解析結果或判定結果,來預測含有該當所定數之訊框的複數訊框所要共通利用的編碼處理。
又,複數訊框要使用共通之編碼處理或是使用個別之編碼處理,係可以使包含core_mode、lpd_mode、及標頭等之附加資訊的量較少的方式,來加以決定。
以下說明,可使電腦動作成為音訊編碼裝置26的音訊編碼程式。圖36係為再另一實施形態所述之音訊編碼程式的圖示。
圖36所示的音訊編碼程式P26,係可在圖5及圖6所示的電腦中使用。又,音訊編碼程式P26,係可與音訊編碼程式P10同樣地提供。
如圖36所示,音訊編碼程式P26係具備:ACELP編碼模組M14a1、TCX編碼模組M14a2、Modified AAC編碼模組M14a3、第1判定模組M14f、core_mode生成模組
M14g、第2判定模組M14h、lpd_mode生成模組M14i、MPS編碼模組M14m、SBR編碼模組M14n、檢查模組M26j、選擇模組M26b、生成模組M26c、輸出模組M26d、及標頭生成模組M26e。
ACELP編碼模組M14a1、TCX編碼模組M14a2、Modified AAC編碼模組M14a3、第1判定模組M14f、core_mode生成模組M14g、第2判定模組M14h、lpd_mode生成模組M14i、MPS編碼模組M14m、SBR編碼模組M14n、檢查模組M26j、選擇模組M26b、生成模組M26c、輸出模組M26d、標頭生成模組M26e,係令電腦C10執行分別與ACELP編碼部14a1、TCX編碼部14a2、Modified AAC編碼部14a3、第1判定部14f、core_mode生成部14g、第2判定部14h、lpd_mode生成部14i、MPS編碼部14m、SBR編碼部14n、檢查部26j、選擇部26b、生成部26c、輸出部26d、標頭生成部26e相同之機能。
以下,說明可將音訊編碼裝置26所生成之串流予以解碼的音訊解碼裝置。圖37係再另一實施形態所述之音訊解碼裝置的圖示。
圖37所示的音訊解碼裝置28,係和音訊解碼裝置16同樣地,具備:ACELP解碼部16a1、TCX解碼部16a2、Modified AAC解碼部16a3、core_mode抽出部16e、第1選擇部16f、lpd_mode抽出部16g、第2選擇部16h、MPS解碼部16m、及SBR解碼部16n。音訊解碼裝置
28,係還具備有標頭檢查部28j、標頭解析部28d、抽出部28b、及選擇部28c。以下,在音訊解碼裝置28之要素當中,針對與音訊解碼裝置16不同的要素,加以說明。
標頭檢查部28j,係監視著被輸入至輸入端子In的各訊框中是否有標頭存在。標頭解析部28d,係一旦藉由標頭檢查部28j而偵測出訊框中有標頭存在,則將該當標頭予以分離。抽出部28b,係從已被抽出之標頭中,抽出GEM_ID。
選擇部28c係隨著已被抽出的GEM_ID,來控制開關SW1。具體而言,當GEM_ID之值是「1」時,則選擇部28c係控制開關SW1,直到下次GEM_ID被抽出以前,會一直使從標頭解析部28d所送出的訊框,被結合至ACELP解碼部16a1。
另一方面,當GEM_ID之值是「0」時,則選擇部28c係將從標頭解析部28d所送出的訊框,結合至core_mode抽出部16e。
以下,說明音訊解碼裝置28的動作,與再另一實施形態所述之音訊解碼方法。圖38係再另一實施形態所述之音訊解碼方法的流程圖。
圖38中的含有「S16」之參照符號所特定的處理,是和圖16中的對應處理相同之處理。以下,在圖38的處理當中,針對與圖16所示處理不同之處理,加以說明。
如圖38所示,在一實施形態中,係於步驟S28-1中,標頭檢查部28j會監視著所被輸入的訊框中是否含有
標頭。當訊框中含有標頭時,則在後續的步驟S28-2中,標頭解析部28d會從該當訊框中分離出標頭。然後,在步驟S28-3中,抽出部28b係從標頭中抽出GEM_ID。另一方面,當訊框中不含標頭時,則在步驟S28-4中,前一個被抽出之GEM_ID會被複製,以後就利用所被複製的GEM_ID。
在步驟S28-5中,會進行是否還有尚未解碼之訊框存在的判定。若沒有尚未解碼之訊框存在,則結束處理。另一方面,若有尚未解碼的訊框存在時,則以尚未解碼之訊框為對象,而繼續從步驟S28-1起之處理。
又,在步驟S28-6中,會進行是否還有尚未解碼之訊框存在的判定。若沒有尚未解碼之訊框存在,則結束處理。另一方面,若有尚未解碼的訊框存在時,則以尚未解碼之訊框為對象,而繼續從步驟S28-1起之處理。
以下說明,可使電腦動作成為音訊解碼裝置28的音訊解碼程式。圖39係為再另一實施形態所述之音訊解碼程式的圖示。
圖39所示的音訊解碼程式P28,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P28,係可與音訊編碼程式P10同樣地提供。
如圖39所示,音訊解碼程式P28係具備:ACELP解碼模組M16a1、TCX解碼模組M16a2、Modified AAC解碼模組M16a3、core_mode抽出模組M16e、第1選擇模組M16f、lpd_mode抽出模組M16g、第2選擇模組M16h、
MPS解碼模組M16m、SBR解碼模組M16n、標頭檢查模組M28j、標頭解析模組M28d、抽出模組M28b、及選擇模組M28c。
ACELP解碼模組M16a1、TCX解碼模組M16a2、Modified AAC解碼模組M16a3、core_mode抽出模組M16e、第1選擇模組M16f、lpd_mode抽出模組M16g、第2選擇模組M16h、MPS解碼模組M16m、SBR解碼模組M16n、標頭檢查模組M28j、標頭解析模組M28d、抽出模組M28b、選擇模組M28c,係令電腦C10執行分別與ACELP解碼部16a1、TCX解碼部16a2、Modified AAC解碼部16a3、core_mode抽出部16e、第1選擇部16f、lpd_mode抽出部16g、第2選擇部16h、MPS解碼部16m、SBR解碼部16n、標頭檢查部28j、標頭解析部28d、抽出部28b、選擇部28c相同之機能。
以下,說明再另一實施形態所述之音訊編碼裝置。圖40係再另一實施形態所述之音訊編碼裝置的圖示。圖41係圖40所示之音訊編碼裝置所生成之串流的圖示。
圖40所示的音訊編碼裝置30,係除了輸出部30d以外,其餘具有和音訊編碼裝置22之對應要素相同的要素。亦即,在音訊編碼裝置30中,當GEM_ID被生成時,輸出訊框係以含有長期編碼處理資訊的第1訊框類型之輸出訊框的方式,而被從輸出部30d輸出。另一方面,若長期編碼處理資訊未被生成時,則輸出訊框係以不含長期編碼處理資訊的第2訊框類型之輸出訊框的方式,而被
從輸出部30d輸出。
圖42係再另一實施形態所述之音訊編碼方法的流程圖。以下,參照圖42,說明音訊編碼裝置30之動作,和再另一實施形態所述之音訊編碼方法。此外,圖42所示的流程,係步驟S30-1及步驟S30-2之處理以外,均和圖28所示的流程相同。因此,以下針對步驟S30-1及步驟S30-2加以說明。
步驟S30-1中,一旦輸入資訊是被步驟S22-1所輸入,則輸出部30d係將此時的編碼對象訊框所對應之輸出訊框,設定成會含有長期編碼處理資訊的第1訊框類型。另一方面,若輸入資訊未被步驟S22-1所輸入,則在步驟S30-2中,輸出部30d係將此時的編碼對象訊框所對應之輸出訊框,設定成不含長期編碼處理資訊的第2訊框類型。此外,在一實施形態中,音訊訊號的最初訊框被輸入之際,輸入訊號係被輸入,該當最初之訊框所對應的輸出訊框,會被設定成第1訊框類型。
如此,藉由隨著長期編碼處理資訊之有無來變更訊框類型,亦可將長期編碼處理資訊通知給解碼側。
以下說明,可使電腦動作成為音訊編碼裝置30的音訊編碼程式。圖43係為再另一實施形態所述之音訊編碼程式的圖示。
圖43所示的音訊編碼程式P30,係可在圖5及圖6所示的電腦中使用。又,音訊編碼程式P30,係可與音訊編碼程式P10同樣地提供。
如圖43所示,音訊編碼程式P30係具備:編碼模組部M10a1~10an、生成模組M22c、選擇模組M22b、輸出模組M30d、及檢查模組M22e。
編碼模組部M10a1~10an、生成模組M22c、選擇模組M22b、輸出模組M30d、檢查模組M22e,係令電腦C10執行分別與編碼部10a1~10an、生成部22c、選擇部22b、輸出部30d、檢查部22e相同之機能。
以下,說明可將音訊編碼裝置30所生成之串流予以解碼的音訊解碼裝置。圖44係再另一實施形態所述之音訊解碼裝置的圖示。圖44所示的音訊解碼裝置32,係除了抽出部32b及訊框類型檢查部32d以外,還具有與音訊解碼裝置24中的對應要素相同的要素。以下說明抽出部32b及訊框類型檢查部32d。
訊框類型檢查部32d,係檢查被輸入至輸入端子In之串流中的各訊框的訊框類型。具體而言,訊框類型檢查部32d係當解碼對象訊框是第1訊框類型的訊框時,則將該當訊框提供給抽出部30b及開關SW1。另一方面,訊框類型檢查部32d係當解碼對象訊框是第2訊框類型的訊框時,則將該當訊框僅送出給開關SW1。抽出部32b,係從訊框類型檢查部32d所收到的訊框內,抽出長期編碼處理資訊,將該當長期編碼處理資訊提供給選擇部24c。
圖45係再另一實施形態所述之音訊解碼方法的流程圖。以下,參照圖45,說明音訊解碼裝置32之動作、及再另一實施形態所述之音訊解碼方法。此外,在圖45所
示的流程中,含有「S24」之參照符號所示的處理,是和圖31所示的對應處理相同之處理。以下,針對與圖31所示處理不同的步驟S32-1及步驟S32-2加以說明。
在步驟S32-1中,訊框類型檢查部32d係解析解碼對象訊框是否為第1訊框類型之訊框。在後續的步驟S32-2中,若判定解碼對象訊框是第1訊框類型之訊框,則在步驟S24-2中,藉由抽出部32b而從該當訊框選擇出長期編碼處理資訊。另一方面,在步驟S32-2之判定中,若判定解碼對象訊框不是第1訊框類型之訊框,則處理係前進至步驟S24-4。亦即,一旦在步驟S24-3中解碼部被選擇,則直到下次第1訊框類型之訊框被輸入之前,會一直持續使用共通的解碼部。
以下說明,可使電腦動作成為音訊解碼裝置32的音訊解碼程式。圖46係為再另一實施形態所述之音訊解碼程式的圖示。
圖46所示的音訊解碼程式P32,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P32,係可與音訊編碼程式P10同樣地提供。
如圖46所示,音訊解碼程式P24係具備:解碼模組M12a1~12an、抽出模組M32b、選擇模組M24c、及訊框類型檢查模組M32d。
解碼模組M12a1~12an、抽出模組M32b、選擇模組M24c、訊框類型檢查模組M32d,係令電腦C10執行分別與解碼部12a1~12an、抽出部32b、選擇部24c、訊框類
型檢查部32d相同之機能。
以下,說明再另一實施形態的音訊編碼裝置。圖47係再另一實施形態所述之音訊編碼裝置的圖示。圖47所示的音訊編碼裝置34,係在以下所說明的部分,是與音訊編碼裝置18不同。亦即,音訊編碼裝置34係可在所被輸入的複數訊框當中,對一部分連續的複數訊框使用共通之音訊編碼處理,對另一部分之訊框則是使用個別之音訊編碼處理。又,音訊編碼裝置34係可對第1複數訊框使用共通之音訊編碼處理,對後續之一部分訊框使用個別之音訊編碼處理,對更後續的第2複數訊框使用共通之音訊編碼處理。圖48係依照先前之AMR-WB+所生成的串流與圖47所示的音訊編碼裝置所生成的串流的圖示。如圖48所示,音訊編碼裝置34係可輸出含有GEM_ID的第1訊框類型之訊框、及不含GEM_ID的第2訊框類型之訊框。
如圖47所示,音訊編碼裝置34係和音訊編碼裝置18同樣地,具備:ACELP編碼部18a1、TCX編碼部18a2、編碼處理判定部18f、Mode bits生成部18g、分析部18m、縮減混音部18n、高頻頻帶編碼部18p、及立體聲編碼部18q。音訊編碼裝置34係還具備:檢查部34e、選擇部34b、生成部34c、及輸出部34d。以下,在音訊編碼裝置34之要素當中,針對與音訊編碼裝置18之要素不同的要素,加以說明。
檢查部34e,係監視著往輸入端子In2的輸入資訊之
輸入。輸入資訊是表示,是否對複數訊框之音訊訊號使用共通之編碼處理的資訊。選擇部34b係一旦藉由檢查部偵測到輸入資訊之輸入,則判定輸入資訊是否表示要對複數訊框之音訊訊號使用共通之編碼處理。輸入資訊是表示要對複數訊框之音訊訊號使用共通之編碼處理時,則選擇部34b係控制開關SW1,而將開關SW1結合至ACELP編碼部18a1。該結合係一直維持直到下次偵測到輸入資訊之輸入為止。另一方面,輸入資訊並非表示要對複數訊框之音訊訊號使用共通之編碼處理時,亦即,輸入資訊是表示對編碼對象訊框使用個別之編碼處理時,則選擇部34b係將開關SW1結合至含有編碼處理判定部18f等之路徑。
生成部34c,係一旦藉由檢查部而偵測到輸入資訊之輸入,則生成具有相應於輸入資訊之值的GEM_ID。具體而言,若輸入資訊是表示對複數訊框之音訊訊號使用共通之編碼處理時,則生成部34c係將GEM_ID之值設定成「1」。另一方面,若輸入資訊並非表示對複數訊框之音訊訊號使用共通之編碼處理時,則生成部34c係將GEM_ID之值設定成「0」。
輸出部34d係當藉由檢查部34e而偵測到輸入資訊時,則將該時點之編碼對象訊框所對應的輸出訊框設成第1訊框類型之輸出訊框,使該當輸出訊框中含有生成部34c所生成之GEM_ID,並含有編碼對象訊框之音訊訊號的編碼序列。輸出部34d係當GEM_ID之值為0時,則使輸出訊框中含有Mode bits[k]。另一方面,當藉由檢查部
34e而未偵測到輸入資訊時,則將該時點之編碼對象訊框所對應的輸出訊框設成第2訊框類型之輸出訊框,使該當輸出訊框中含有編碼對象訊框之音訊訊號的編碼序列。輸出部34d係將如此生成的輸出訊框予以輸出。
圖49係再另一實施形態所述之音訊編碼方法的流程圖。以下,參照圖49,說明音訊編碼裝置34之動作,和再另一實施形態所述之音訊編碼方法。此外,在圖49所示的流程中,含有「S18」之參照符號所示的處理,是和圖21中的對應處理相同。以下,在圖49所示之流程中的處理當中,針對與圖21之處理不同的處理,加以說明。
如圖49所示,在一實施形態中,係於步驟S34-1中,檢查部34e,係監視著往輸入端子In2的輸入資訊之輸入。當偵測到輸入資訊之輸入時,則在後續的步驟S34-2中,編碼對象訊框所對應之輸出訊框係被設成第1訊框類型之輸出訊框。另一方面,當未偵測到輸入資訊之輸入時,則在後續的步驟S34-3中,編碼對象訊框所對應之輸出訊框係被設成第2訊框類型之輸出訊框。
接著,在步驟S34-4中,判定輸入資訊是否表示對每一訊框指定編碼處理。亦即,判定輸入資訊是否表示對複數訊框使用共通之編碼處理。輸入資訊是表示對複數訊框使用共通之編碼處理時,則在後續的步驟S34-5中,GEM_ID之值係被設定成「1」。另一方面,輸入資訊並非表示對複數訊框使用共通之編碼處理時,則在後續的步驟S34-6中,GEM_ID之值係被設定成「0」。
在步驟S34-7中,會判斷是否附加GEM_ID。具體而言,當正在處理輸入資訊之輸入被偵測到時的編碼對象訊框時,在後續的步驟S34-8中,會輸出被附加GEM_ID、含有編碼序列的第1訊框類型之輸出訊框。另一方面,當正在處理輸入資訊之輸入未被偵測到時的編碼對象訊框時,在後續的步驟S34-9中,會輸出含有編碼序列的第2訊框類型之輸出訊框。
接著,在步驟S34-10中,判定是否有尚未編碼的訊框存在。若沒有尚未編碼之訊框存在,則結束處理。另一方面,若還有尚未編碼之訊框存在時,則以該當訊框為對象而繼續從步驟S34-1起的處理。
以下說明,可使電腦動作成為音訊編碼裝置34的音訊編碼程式。圖50係為再另一實施形態所述之音訊編碼程式的圖示。
圖50所示的音訊編碼程式P34,係可在圖5及圖6所示的電腦中使用。又,音訊編碼程式P34,係可與音訊編碼程式P10同樣地提供。
音訊編碼程式P34係具備:ACELP編碼模組M18a1、TCX編碼模組M18a2、選擇模組M34b、生成模組M34c、輸出模組M34d、編碼處理判定模組M18f、Mode bits生成模組M18g、分析模組M18m、縮減混音模組M18n、高頻頻帶編碼模組M18p、及、立體聲編碼模組M18q
CELP編碼模組M18a1、TCX編碼模組M18a2、選擇模組M34b、生成模組M34c、輸出模組M34d、編碼處理
判定模組M18f、Mode bits生成模組M18g、分析模組M18m、縮減混音模組M18n、高頻頻帶編碼模組M18p、立體聲編碼模組M18q,係令電腦C10執行分別與ACELP編碼部18a1、TCX編碼部18a2、選擇部34b、生成部34c、輸出部34d、編碼處理判定部18f、Mode bits生成部18g、分析部18m、縮減混音部18n、高頻頻帶編碼部18p、立體聲編碼部18q相同之機能。
以下,說明可將音訊編碼裝置34所生成之串流予以解碼的音訊解碼裝置。圖51係再另一實施形態所述之音訊解碼裝置的圖示。
圖51所示的音訊解碼裝置36,係和音訊解碼裝置20同樣地,具備:ACELP解碼部20a1、TCX解碼部20a2、Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶解碼部20p、立體聲解碼部20q、及合成部20m。音訊解碼裝置36,係還具備有訊框類型檢查部36d、抽出部36b、及選擇部36c。以下,在音訊解碼裝置36之要素當中,針對與音訊解碼裝置20不同的要素,加以說明。
訊框類型檢查部36d,係檢查被輸入至輸入端子In之串流內的各訊框的訊框類型。訊框類型檢查部36d,係將第1訊框類型之訊框,送出至抽出部36b、開關SW1、高頻頻帶解碼部20p、及立體聲解碼部20q。另一方面,訊框類型檢查部36d,係將第2訊框類型之訊框,僅送出至開關SW1、高頻頻帶解碼部20p、及立體聲解碼部20q。
抽出部36b,係從訊框類型檢查部36d所接收到的訊
框中,抽出GEM_ID。選擇部36c係隨著已被抽出的GEM_ID之值,來控制開關SW1。具體而言,當GEM_ID之值為「1」時,選擇部36c係控制開關SW1,將解碼對象訊框結合至ACELP解碼部20a1。藉此,當GEM_ID之值是「1」時,則直到下次第1訊框類型之訊框被輸入之前,會一直持續選擇ACELP解碼部20a1。另一方面,當GEM_ID之值是「0」時,則選擇部36c係控制開關SW1,而將解碼對象訊框結合至Mode bits抽出部20e。
圖52係再另一實施形態所述之音訊解碼方法的流程圖。以下,參照圖52,說明音訊解碼裝置36之動作、與再另一實施形態所述之音訊解碼方法。此外,在圖52所示的流程的處理當中,含有「S20」之處理,是和圖24所示的對應處理相同之處理。以下,在圖52所示之流程中的處理當中,針對與圖24所示之處理不同的處理,加以說明。
如圖52所示,在一實施形態中,係於步驟S36-1中,訊框類型檢查部36d係判定解碼對象訊框是否為第1訊框類型之訊框。若解碼對象訊框是第1訊框類型之訊框,則在後續的步驟S36-2中,抽出部36b會抽出GEM_ID。另一方面,若解碼對象訊框是第2訊框類型之訊框,則在後續的步驟S36-3中,既存之GEM_ID會被複製,該當GEM_ID會被之後的處理所利用。
在步驟S36-4中,會判定是否還有尚未解碼之訊框存在。若沒有尚未解碼之訊框存在,則結束處理。另一方
面,若還有尚未解碼之訊框存在時,則以該當訊框為對象而繼續從步驟S36-1起的處理。
以下說明,可使電腦動作成為音訊解碼裝置36的音訊解碼程式。圖53係為再另一實施形態所述之音訊解碼程式的圖示。
圖53所示的音訊解碼程式P36,係可在圖5及圖6所示的電腦中使用。又,音訊解碼程式P36,係可與音訊編碼程式P10同樣地提供。
音訊解碼程式P36係具備:ACELP解碼模組M20a1、TCX解碼模組M20a2、抽出模組M36b、選擇模組M36c、訊框類型檢查模組M36d、Mode bits抽出模組M20e、解碼處理選擇模組M20f、高頻頻帶解碼模組M20p、立體聲解碼模組M20q、及合成模組M20m。
ACELP解碼模組M20a1、TCX解碼模組M20a2、抽出模組M36b、選擇模組M36c、訊框類型檢查模組M36d、Mode bits抽出模組M20e、解碼處理選擇模組M20f、高頻頻帶解碼模組M20p、立體聲解碼模組M20q、合成模組M20m,係、令電腦執行分別與ACELP解碼部20a1、TCX解碼部20a2、抽出部36b、選擇部36c、訊框類型檢查部36d、Mode bits抽出部20e、解碼處理選擇部20f、高頻頻帶解碼部20p、立體聲解碼部20q、合成部20m相同之機能。
以上說明了本發明的各種實施形態。本發明係不限定於上述實施形態,可做各種變形。例如,在上述的一部分
之實施形態中,ACELP編碼處理及ACELP解碼處理是可分別被選擇來當做複數訊框所要共通使用的編碼處理及解碼處理。然而,被共通使用的編碼處理及解碼處理係不限定於ACELP編碼處理及解碼處理,亦可為任意的音訊編碼處理及音訊解碼處理。又,上述的GEM_ID,係亦可為被設定成任意位元大小及值的GEM_ID。
10A‧‧‧音訊編碼裝置
10a1~10an‧‧‧編碼部
10b‧‧‧選擇部
10c‧‧‧生成部
10d‧‧‧輸出部
10e‧‧‧解析部
In1‧‧‧輸入端子
Out‧‧‧輸出端子
SW‧‧‧開關
Claims (14)
- 一種音訊解碼裝置,其係具備:複數解碼部,係執行彼此互異之音訊解碼處理,以從編碼序列生成音訊訊號;和抽出部,係從具有分別含有音訊訊號之編碼序列的複數訊框的串流中,抽出對該複數訊框的單一之長期編碼處理資訊,該長期編碼處理資訊係表示該複數訊框之編碼序列之生成時曾經使用過共通之音訊編碼處理;和選擇部,係隨著前記長期編碼處理資訊已被抽出之事實,而在前記複數解碼部當中,選擇出前記複數訊框之編碼序列之解碼時所要共通使用的解碼部;已被前記選擇部所選擇的解碼部,係將解碼對象訊框之編碼序列予以解碼,其後,若有尚未被解碼的訊框存在時,則持續將該當訊框之編碼序列予以解碼的處理;在已被前記抽出部抽出了前記長期編碼處理資訊之訊框之後的後續訊框中,係不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 如請求項1所記載之音訊解碼裝置,其中,前記長期編碼處理資訊係為,能夠在解碼側上特定出複數訊框之編碼序列之生成時所曾共通使用過的音訊編碼處理的資訊。
- 如請求項2所記載之音訊解碼裝置,其中, 僅在前記串流的第1訊框中含有長期編碼處理資訊,於前記串流中,在第2訊框以後的訊框中,係不含有用來特定該當訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 如請求項1所記載之音訊解碼裝置,其中,前記選擇部,係隨著前記長期編碼處理資訊是已被前記抽出部所抽出之事實,而在前記複數解碼部當中選擇所定之解碼部;前記串流裡係不含有,用來特定前記複數訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 如請求項1~4之任一項所記載之音訊解碼裝置,其中,前記抽出部,係從串流中抽出前記長期編碼處理資訊,該串流係具有:含有前記長期編碼處理資訊的訊框、和該訊框之後的一個以上之訊框,且前記一個以上之訊框係不含有用來特定自己訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 一種音訊編碼裝置,其係具備:複數編碼部,係執行彼此互異之音訊編碼處理,以從音訊訊號生成編碼序列;和選擇部,係在前記複數編碼部當中,選擇出複數訊框之音訊訊號之編碼時所要共通使用的編碼部;和生成部,係生成對前記複數訊框的單一之長期編碼處 理資訊,該長期編碼處理資訊係表示該複數訊框的編碼序列之生成時曾經使用過共通之音訊編碼處理;和輸出部,係輸出串流,其係含有:已被前記選擇部所選擇之前記編碼部所生成的前記複數訊框之編碼序列、和前記長期編碼處理資訊;已被前記選擇部所選擇的編碼部,係將編碼對象訊框的音訊訊號予以編碼,其後,若有尚未被編碼的訊框存在時,則持續將該當訊框之音訊訊號予以編碼的處理;在已被前記輸出部附加了前記長期編碼處理資訊之訊框之後的後續訊框中,係不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 如請求項6所記載之音訊編碼裝置,其中,前記長期編碼處理資訊係為,能夠在解碼側上特定出複數訊框之編碼序列之生成時所曾共通使用過的音訊編碼處理的資訊。
- 如請求項7所記載之音訊編碼裝置,其中,僅在前記串流的第1訊框中含有長期編碼處理資訊,於前記串流中,在第2訊框以後的訊框中,係不含有用來特定該當訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 如請求項6所記載之音訊編碼裝置,其中,前記選擇部,係在前記複數之編碼部當中,選擇所定之編碼部; 前記串流裡係不含有,用來特定前記複數訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 如請求項6~9之任一項所記載之音訊編碼裝置,其中,前記輸出部係輸出:在附加了前記長期編碼處理資訊之訊框之後的一個以上之訊框中,係不含有用來特定自己訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊的前記串流。
- 一種音訊解碼方法,其係含有:第1步驟,係從具有分別含有音訊訊號之編碼序列的複數訊框的串流中,抽出對該複數訊框的單一之長期編碼處理資訊,該長期編碼處理資訊係表示該複數訊框之編碼序列之生成時曾經使用過共通之音訊編碼處理;和第2步驟,係隨著前記長期編碼處理資訊已被抽出之事實,在彼此互異之複數音訊解碼處理當中,選擇出前記複數訊框之編碼序列之解碼時所要共通使用的音訊解碼處理;和第3步驟,係使用已被選擇之前記音訊解碼處理來將前記複數訊框之編碼序列予以解碼;在前記第3步驟中,係藉由於前記第2步驟中所被選擇的音訊解碼處理,而將解碼對象訊框之編碼序列予以解碼,其後,若有尚未被解碼的訊框存在時,則藉由該當音訊解碼處理而持續將該當訊框之編碼序列予以解碼的處 理;在於前記第1步驟中被抽出了前記長期編碼處理資訊之訊框之後的後續訊框中,係不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 一種音訊編碼方法,其係含有:第1步驟,係在彼此互異之複數音訊編碼處理當中,選擇出複數訊框之音訊訊號之編碼時所要共通使用的音訊編碼處理;和第2步驟,係使用已被選擇之前記音訊編碼處理來將前記複數訊框之音訊訊號予以編碼以生成該複數訊框之編碼序列;和第3步驟,係生成對前記複數訊框的單一之長期編碼處理資訊,該長期編碼處理資訊係表示該複數訊框的編碼序列之生成時曾經使用過共通之音訊編碼處理;和第4步驟,係將含有:前記複數訊框之編碼序列、和前記長期編碼處理資訊的串流,予以輸出;在前記第2步驟中,係藉由於前記第1步驟中所被選擇的音訊編碼處理,而將編碼對象訊框的音訊訊號予以編碼,其後,若有尚未被編碼的訊框存在時,則藉由該當音訊編碼處理而持續將該當訊框之音訊訊號予以編碼的處理;在於前記第4步驟中被附加了前記長期編碼處理資訊 之訊框之後的後續訊框中,係不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 一種音訊解碼程式,係令電腦發揮機能成為:複數解碼部,係執行彼此互異之音訊解碼處理,以從編碼序列生成音訊訊號;和抽出部,係從具有分別含有音訊訊號之編碼序列的複數訊框的串流中,抽出對該複數訊框的單一之長期編碼處理資訊,該長期編碼處理資訊係表示該複數訊框之編碼序列之生成時曾經使用過共通之音訊編碼處理;和選擇部,係隨著前記長期編碼處理資訊已被抽出之事實,而在前記複數解碼部當中,選擇出前記複數訊框之編碼序列之解碼時所要共通使用的解碼部;已被前記選擇部所選擇的解碼部,係將解碼對象訊框之編碼序列予以解碼,其後,若有尚未被解碼的訊框存在時,則持續將該當訊框之編碼序列予以解碼的處理;在已被前記抽出部抽出了前記長期編碼處理資訊之訊框之後的後續訊框中,係不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
- 一種音訊編碼程式,係令電腦發揮機能成為:複數編碼部,係執行彼此互異之音訊編碼處理,以從音訊訊號生成編碼序列;和選擇部,係在前記複數編碼部當中,選擇出複數訊框 之音訊訊號之編碼時所要共通使用的編碼部;和生成部,係生成對前記複數訊框的單一之長期編碼處理資訊,該長期編碼處理資訊係表示該複數訊框的編碼序列之生成時曾經使用過共通之音訊編碼處理;和輸出部,係輸出串流,其係含有:已被前記選擇部所選擇之前記編碼部所生成的前記複數訊框之編碼序列、和前記長期編碼處理資訊;已被前記選擇部所選擇的編碼部,係將編碼對象訊框的音訊訊號予以編碼,其後,若有尚未被編碼的訊框存在時,則持續將該當訊框之音訊訊號予以編碼的處理;在已被前記輸出部附加了前記長期編碼處理資訊之訊框之後的後續訊框中,係不含有用來特定該當後續訊框之編碼序列之生成時所曾經使用過之音訊編碼處理所需的資訊。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010181345A JP5749462B2 (ja) | 2010-08-13 | 2010-08-13 | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201514975A TW201514975A (zh) | 2015-04-16 |
TWI570712B true TWI570712B (zh) | 2017-02-11 |
Family
ID=45567788
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100128857A TWI476762B (zh) | 2010-08-13 | 2011-08-12 | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program |
TW103145797A TWI570712B (zh) | 2010-08-13 | 2011-08-12 | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100128857A TWI476762B (zh) | 2010-08-13 | 2011-08-12 | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program |
Country Status (6)
Country | Link |
---|---|
US (1) | US9280974B2 (zh) |
EP (1) | EP2605240B1 (zh) |
JP (1) | JP5749462B2 (zh) |
CN (2) | CN104835501B (zh) |
TW (2) | TWI476762B (zh) |
WO (1) | WO2012020828A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
US8620660B2 (en) * | 2010-10-29 | 2013-12-31 | The United States Of America, As Represented By The Secretary Of The Navy | Very low bit rate signal coder and decoder |
EP2830062B1 (en) | 2012-03-21 | 2019-11-20 | Samsung Electronics Co., Ltd. | Method and apparatus for high-frequency encoding/decoding for bandwidth extension |
CN103827964B (zh) * | 2012-07-05 | 2018-01-16 | 松下知识产权经营株式会社 | 编解码系统、解码装置、编码装置以及编解码方法 |
EP2922052B1 (en) | 2012-11-13 | 2021-10-13 | Samsung Electronics Co., Ltd. | Method for determining an encoding mode |
ES2738723T3 (es) * | 2014-05-01 | 2020-01-24 | Nippon Telegraph & Telephone | Dispositivo de generación de secuencia envolvente combinada periódica, método de generación de secuencia envolvente combinada periódica, programa de generación de secuencia envolvente combinada periódica y soporte de registro |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
US10499229B2 (en) * | 2016-01-24 | 2019-12-03 | Qualcomm Incorporated | Enhanced fallback to in-band mode for emergency calling |
EP3891973B1 (en) * | 2019-01-31 | 2022-07-06 | British Telecommunications public limited company | Methods and apparatus for the encoding of audio and/or video data |
US11495240B1 (en) * | 2019-07-23 | 2022-11-08 | Amazon Technologies, Inc. | Management of local devices |
US11392401B1 (en) | 2019-07-23 | 2022-07-19 | Amazon Technologies, Inc. | Management of and resource allocation for local devices |
US10978083B1 (en) * | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
EP4138396A4 (en) * | 2020-05-21 | 2023-07-05 | Huawei Technologies Co., Ltd. | AUDIO DATA TRANSMISSION METHOD AND DEVICE ASSOCIATED |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP2000267699A (ja) * | 1999-03-19 | 2000-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置 |
TWI476762B (zh) * | 2010-08-13 | 2015-03-11 | Ntt Docomo Inc | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1090409C (zh) * | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
JP3252782B2 (ja) * | 1998-01-13 | 2002-02-04 | 日本電気株式会社 | モデム信号対応音声符号化復号化装置 |
JP3784583B2 (ja) * | 1999-08-13 | 2006-06-14 | 沖電気工業株式会社 | 音声蓄積装置 |
US6658381B1 (en) | 1999-10-15 | 2003-12-02 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and systems for robust frame type detection in systems employing variable bit rates |
TW501376B (en) * | 2001-02-09 | 2002-09-01 | Elan Microelectronics Corp | Decoding device and method of digital audio |
TW561451B (en) * | 2001-07-27 | 2003-11-11 | At Chip Corp | Audio mixing method and its device |
MXPA03005133A (es) * | 2001-11-14 | 2004-04-02 | Matsushita Electric Ind Co Ltd | Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos. |
JP2003173622A (ja) * | 2001-12-04 | 2003-06-20 | Matsushita Electric Ind Co Ltd | 符号化音声データ復号化装置及び符号化音声データ復号化方法 |
JP2003195894A (ja) * | 2001-12-27 | 2003-07-09 | Mitsubishi Electric Corp | 符号化装置、復号化装置、符号化方法、及び復号化方法 |
WO2005099243A1 (ja) * | 2004-04-09 | 2005-10-20 | Nec Corporation | 音声通信方法及び装置 |
EP1780895B1 (en) * | 2004-07-28 | 2020-07-01 | III Holdings 12, LLC | Signal decoding apparatus |
JP4628798B2 (ja) * | 2005-01-13 | 2011-02-09 | Kddi株式会社 | 通信端末装置 |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
JP2008197199A (ja) * | 2007-02-09 | 2008-08-28 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置及びオーディオ復号化装置 |
EP2131590A1 (en) * | 2008-06-02 | 2009-12-09 | Deutsche Thomson OHG | Method and apparatus for generating or cutting or changing a frame based bit stream format file including at least one header section, and a corresponding data structure |
US20100114568A1 (en) * | 2008-10-24 | 2010-05-06 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
KR101797033B1 (ko) * | 2008-12-05 | 2017-11-14 | 삼성전자주식회사 | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 |
US8023530B1 (en) * | 2009-01-07 | 2011-09-20 | L-3 Communications Corp. | Physical layer quality of service for wireless communications |
US8976730B2 (en) * | 2011-07-22 | 2015-03-10 | Alcatel Lucent | Enhanced capabilities and efficient bandwidth utilization for ISSI-based push-to-talk over LTE |
-
2010
- 2010-08-13 JP JP2010181345A patent/JP5749462B2/ja active Active
-
2011
- 2011-08-11 EP EP11816491.2A patent/EP2605240B1/en active Active
- 2011-08-11 CN CN201510151793.1A patent/CN104835501B/zh active Active
- 2011-08-11 CN CN201180038817.2A patent/CN103098125B/zh active Active
- 2011-08-11 WO PCT/JP2011/068388 patent/WO2012020828A1/ja active Application Filing
- 2011-08-12 TW TW100128857A patent/TWI476762B/zh active
- 2011-08-12 TW TW103145797A patent/TWI570712B/zh active
-
2013
- 2013-02-12 US US13/765,109 patent/US9280974B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP2000267699A (ja) * | 1999-03-19 | 2000-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置 |
TWI476762B (zh) * | 2010-08-13 | 2015-03-11 | Ntt Docomo Inc | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program |
Also Published As
Publication number | Publication date |
---|---|
CN104835501B (zh) | 2018-08-14 |
US20130159005A1 (en) | 2013-06-20 |
EP2605240A1 (en) | 2013-06-19 |
US9280974B2 (en) | 2016-03-08 |
JP2012042534A (ja) | 2012-03-01 |
WO2012020828A1 (ja) | 2012-02-16 |
EP2605240A4 (en) | 2014-04-02 |
CN103098125B (zh) | 2015-04-29 |
CN103098125A (zh) | 2013-05-08 |
TWI476762B (zh) | 2015-03-11 |
CN104835501A (zh) | 2015-08-12 |
EP2605240B1 (en) | 2016-10-05 |
TW201514975A (zh) | 2015-04-16 |
TW201222531A (en) | 2012-06-01 |
JP5749462B2 (ja) | 2015-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI570712B (zh) | Audio decoding device, audio decoding method, audio decoding program, audio coding device, audio coding method, and audio coding program | |
JP5883561B2 (ja) | アップミックスを使用した音声符号器 | |
JP5934922B2 (ja) | 復号装置 | |
US8364497B2 (en) | Apparatus and method for coding and decoding multi-object audio signal with various channel | |
KR101055739B1 (ko) | 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그 장치 | |
KR101452722B1 (ko) | 신호 부호화 및 복호화 방법 및 장치 | |
JP4601669B2 (ja) | マルチチャネル信号またはパラメータデータセットを生成する装置および方法 | |
US9570082B2 (en) | Method, medium, and apparatus encoding and/or decoding multichannel audio signals | |
EP2209114A1 (en) | Encoder and decoder | |
RU2011141881A (ru) | Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования | |
JP2011527446A (ja) | エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法 | |
CA2754404A1 (en) | Audio signal encoding method, audio signal decoding method, encoding device, decoding device, audio signal processing system, audio signal encoding program, and audio signal decoding program | |
JP4887279B2 (ja) | スケーラブル符号化装置およびスケーラブル符号化方法 | |
JPWO2009050896A1 (ja) | ストリーム合成装置、復号装置、方法 | |
CA3146169A1 (en) | Encoding and decoding ivas bitstreams | |
EP2426662B1 (en) | Acoustic signal decoding device, method and corresponding program | |
JP5174651B2 (ja) | 低演算量符号励振線形予測符号化 | |
JP2006072269A (ja) | 音声符号化装置、通信端末装置、基地局装置および音声符号化方法 | |
JP2007110565A (ja) | マルチチャンネル音響復号化装置及び方法 |