TWI435316B - 用以將經編碼音訊信號解碼之裝置與方法 - Google Patents
用以將經編碼音訊信號解碼之裝置與方法 Download PDFInfo
- Publication number
- TWI435316B TWI435316B TW098122550A TW98122550A TWI435316B TW I435316 B TWI435316 B TW I435316B TW 098122550 A TW098122550 A TW 098122550A TW 98122550 A TW98122550 A TW 98122550A TW I435316 B TWI435316 B TW I435316B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- frequency
- encoding
- algorithm
- encoder
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 79
- 238000000034 method Methods 0.000 title claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 75
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 21
- 238000013139 quantization Methods 0.000 description 18
- 230000005284 excitation Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 206010021403 Illusion Diseases 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明有關於用以將一經編碼音訊信號解碼的一裝置及一方法、用以編碼的一裝置、用以編碼的一方法及一音訊信號。
在該技藝中,諸如MP3或AAC之頻域編碼方案是習知的。此等頻域編碼器基於一時域/頻域轉換、一隨後的量化階段(其中該量化誤差使用來自一心理聲學模組的資訊來控制)及一編碼階段(其中該等量化頻譜係數及相對應的旁側資訊使用碼表予以熵編碼)。
另一方面,有諸如在3GPP TS 26.290中所描述之該AMR-WB+之極為適於語音處理的編碼器。此等語音編碼方案執行一時域信號的一線性預測濾波。這一LP濾波源於對該輸入時域信號的一線性預測分析。該等所產生的LP濾波器係數接著被編碼且作為旁側資訊予以傳送。該過程被稱為線性預測編碼(LPC)。在該濾波器的輸出處,還被稱為激勵信號的預測殘差信號或預測誤差信號使用該ACELP編碼器的綜合分析階段來編碼,或可選擇地使用其使用具有一交疊的一傅利葉變換的一變換編碼器來編碼。在該ACELP編碼與還被稱為TCX編碼的該變換編碼激勵編碼之間的決策使用一閉環或開環演算法來實現。
諸如結合了一AAC編碼方案與一頻譜帶寬複製技術的高效率AAC的頻域音訊編碼方案還可結合於一聯合立體聲或可稱為“環繞MPEG”的一多聲道編碼工具。另一方面,諸如該AMR-WB+的語音編碼器還具有一高頻增強階段及立體聲功能。
此頻譜帶複製(SBR)包含如一附加物(add-on)對於普遍感知之諸如MP3及該高階音訊編碼(AAC)的音訊編碼一樣具有普遍性的一技術。SBR包含一帶寬擴展(BWE)的方法,其中該頻譜的低帶(基帶或核心帶)使用一現存的編碼來編碼,而該上方帶(或高帶)使用較少的參數予以粗略地參數化。SBR利用該低帶與該高帶之間的一相關性來預測從下方帶特徵擷取的該高帶信號。
SBR用於例如HE-AAC或AAC+SBR中。在SBR中可能動態地改變交越頻率(BWE起始頻率)以及意指每訊框參數組(包絡)之數量的時間解析度。AMR-WB+實施與一經轉換時域/頻域核心編碼器相結合的一時域帶寬擴展,特別是為語音信號提供良好的音訊品質。對AMR-WB+音訊品質之一限制性的因素是該音訊帶寬對於核心編解碼器及為該系統之內部取樣頻率之四分之一的BWE起始頻率二者是共用的。儘管該ACELP語音模型能夠在該完全帶寬中極佳地模型化語音信號,但是該頻域音訊編碼器不能為一些一般的音訊信號傳遞良好品質。因而,語音編碼方案不僅顯示在低位元速率下語音信號的一高品質,而且顯示在低位元速率下音樂信號的一差品質。
諸如HE-AAC之頻域編碼方案是有利的,因為它們顯示了在低位元速率下音樂信號的一高品質。然而,問題是在低位元速率下語音信號的品質。
因而,不同類別的音訊信號要求不同特性的帶寬擴展工具。
本發明的目的是提供一改良的編碼/解碼概念。
此目的藉由根據申請專利範圍第1項之一音訊解碼器、根據申請專利範圍第13項之一音訊解碼方法、根據申請專利範圍第8項之一編碼器、根據申請專利範圍第14項之用以編碼之一方法、根據申請專利範圍第15項之一經編碼信號或根據申請專利範圍第16項之一電腦程式予以實現。
本發明是基於對該交越頻率或該BWE起始頻率是影響該音訊品質之一參數的發現。儘管時域(語音)編解碼器通常以一給定的取樣速率來編碼整個頻率範圍,但是音訊帶寬是對變換式編碼器(例如音樂編碼器)的一調諧參數,隨著用以編碼之頻譜線之總數的降低,將同時增加用於編碼之每一頻譜線之位元的數量,意指達到一品質對音訊帶寬的折衷。因此,在新的方法中,具有可變音訊帶寬的不同核心編碼器與具有一共用BWE模組的一轉換系統相結合,其中該BWE模組必須考慮該等不同的音訊帶寬。
可用一直接的方式來找出所有核心編碼器帶寬的最低帶寬且用此作為BWE起始頻率,但是這將惡化所感知之音訊品質。而且,因為在具有與該BWE起始頻率相比一較高的帶寬的時間部分中一核心編碼器起作用,一些頻率區域將由該核心編碼器以及引入冗餘的該BWE表現兩次,所以該編碼效率將被降低。因而,一較好的解決方案是使該BWE起始頻率適應於所使用之核心編碼器的音訊帶寬。
因為根據本發明之實施例,一音訊編碼系統將一帶寬擴展工具與一信號相依核心編碼器(例如經轉換的語音/音訊編碼器)相結合,其中該交越頻率包含一可變的參數。控制不同核心編碼模式之間之轉換的一信號分類器輸出還可用以轉換該BWE系統之諸如該時間解析度與塗抹、頻譜解析度與該交越頻率的特性。
因而,本發明的一層面是一經編碼音訊信號的一音訊解碼器,該經編碼音訊信號包含根據一第一編碼演算法編碼的一第一部分、根據一第二編碼演算法編碼的一第二部分、用於該第一部分及該第二部分的BWE參數及指示一第一解碼演算法或一第二解碼演算法的一編碼模式資訊,該音訊解碼器包含一第一解碼器、一第二解碼器、一BWE模組及一控制器。該第一解碼器根據用於該經編碼信號之一第一時間部分的該第一解碼演算法解碼該第一部分以獲得一第一經解碼信號。該第二解碼器根據用於該經編碼信號之一第二時間部分的該第二解碼演算法解碼該第二部分以獲得一第二經解碼信號。該BWE模組具有一可控制的交越頻率且受組配用以使用該第一經解碼信號及用於該第一部分的BWE參數來執行一帶寬擴展演算法,且用以使用該第二經解碼信號及用於該第二部分的帶寬擴展參數來執行一帶寬擴展演算法。該控制器根據該編碼模組資訊來控制該BWE模組的交越頻率。
根據本發明之另一層面,用以將一音訊信號編碼的一裝置包含一第一及一第二編碼器、一決策階段及一BWE模組。該第一編碼器受組配以根據一第一編碼演算法來編碼,該第一編碼演算法具有一第一頻率帶寬。該第二編碼器受組配以根據一第二編碼演算法來編碼,該第二編碼演算法具有較該第一頻率帶寬小的一第二頻率帶寬。該決策階段指示用於該音訊信號之一第一部分的第一編碼演算法及用於該音訊信號之一第二部分的第二編碼演算法,該第二部分不同於該第一部分。該帶寬擴展模組計算用於該音訊信號的BWE參數,其中該BWE模組受組配以由該決策階段控制來為不包括在該音訊信號之第一部分中之該第一頻率帶寬的一帶且為不包括在該音訊信號之第二部分中之該第二頻率帶寬的一帶計算BWE參數。
相較於實施例,在先前技藝中的SBR僅應用於導致下面缺點的一非轉換音訊編解碼器中。可動態地施加時間解析度以及交越頻率二者,但是諸如3GPP來源之技藝實施的情況對如響板之暫態通常僅)施加暫時解析度的一改變。另外,一較細微整體時間解析度可在較高速率下選擇作為一位元速率相依調諧參數。沒有明顯的分類被執行來判定與例如固定的、音調音樂對語音之該信號類型最佳匹配的時間解析度或控制該時間解析度的一判定臨界值。本發明之實施例克服了此等缺點。實施例特別允許一經適應的交越頻率與對所使用之核心編碼器的一彈性選擇相結合,以便該經編碼信號提供相對比於先前技藝編碼器/解碼器一明顯較高的感知品質。
隨後關於附加的圖式來描述本發明的較佳實施例,其中:第1圖顯示根據本發明之一第一層面,用以解碼的一裝置的一方塊圖;第2圖顯示根據本發明之該第一層面,用以編碼的一裝置的一方塊圖;第3圖更詳細地顯示一編碼方案的一方塊圖;第4圖更詳細地顯示一解碼方案的一方塊圖;第5圖顯示根據一第二層面,一編碼方案的一方塊圖;第6圖顯示根據該第二層面,一解碼方案的一示意圖;第7圖繪示提供短期預測資訊及該預測誤差信號的一編碼器側的LPC階段;第8圖繪示用以產生一加權信號之一LPC裝置的又一實施例;第9a-9b圖顯示包含導致一音訊信號之不同時間解析度的一音訊/語音開關的一編碼器;及第10圖繪示一經編碼音訊信號的一示意圖。
第1圖顯示用以將一經編碼音訊信號102解碼的一解碼器裝置100。該經解碼音訊信號102包含根據該第一編碼演算法編碼的一第一部分104a、根據該第二編碼演算法編碼的一第二部分104b、該第一時間部分104a及該第二時間部分104b的BWE參數106及為該等個別時間部分指示一第一解碼演算法或一第二解碼演算法的一編碼模式資訊108。用以解碼的該裝置110包含一第一解碼器110a、一第二解碼器110b、一BWE模組130及一控制器140。該第一解碼器110a適用於根據用於該經編碼信號102之一第一時間部分的該第一解碼演算法來解碼該第一部分104a以獲得一第一經解碼信號114a。該第二解碼器110b受組配以根據用於該經編碼信號之一第二時間部分的該第二解碼演算法來解碼該第二部分104b以獲得一第二經解碼信號114b。該BWE模組130具有調整該BWE模組130之性能的一可控制的交越頻率fx。該BWE模組130受組配來執行一帶寬擴展演算法以基於該第一經解碼信號114a及該第一部分的BWE參數106在該上方頻率帶中產生該音訊信號的成分,且用以基於該第二經解碼信號114b及該第二部分的帶寬擴展參數106在該上方頻率帶中產生該音訊信號的成分。該控制器140受組配以根據該編碼模式資訊108來控制該BWE模組130的交越頻率fx。
該BWE模組130還可包含將下方與上方頻率帶的音訊信號成分相結合的一結合器且輸出所產生的音訊信號105。
該編碼模式資訊108指示,例如該經編碼音訊信號102之某一時間部分是由哪種編碼演算法編碼的。此資訊可同時識別將用於該等不同時間部分的解碼器。此外,該編碼模式資訊108可控制一開關以在不同時間部分的不同解碼器之間轉換。
因此,該交越頻率fx是根據所使用的解碼器予以調整的一可調整的參數,其可包含例如作為該第一解碼器110a之一語音編碼器及作為該第二解碼器110b之一音訊解碼器。如上所述,一語音解碼器的交越頻率(如對於基於LPC的範例)可高於用於一音訊編碼器(例如對於音樂)的交越頻率。因而,在另外的實施例中,該控制器220受組配以在該等時間部分之一(例如該第二時間部分)內增加該交越頻率fx或降低該交越頻率fx,使得該交越頻率可獲改變而不改變該解碼演算法。這意味著該交越頻率中的一改變可與該所使用之解碼器中的一改變不相關:該交越頻率可獲改變而不改變該所使用之解碼器或反之亦然,該解碼器可獲改變而不改變該交越頻率。
該BWE模組130還可包含由該控制器140及/或由該BWE參數106控制的一開關,以便該第一經解碼信號114a在該第一時間部分期間藉由該BWE模組130來處理且該第二經解碼信號114b在該第二時間部分期間藉由該BWE模組130來處理。此開關可藉由該交越頻率fx中的一改變或藉由在該經編碼音訊信號102內指示在該個別時間部分期間所使用之編碼演算法的一明顯位元來起作用。
在另外的實施例中,該開關受組配以在該第一及第二時間部分之間從該第一解碼器至該第二解碼器轉換,使得該帶寬擴展演算法應用於該第一經解碼信號或應用於該第二經解碼信號。可選擇地,該帶寬擴展演算法應用於該第一及/或第二經解碼信號且該開關遭放置在此之後,使得略去該等經帶寬擴展信號之一。
第2圖顯示用以將一音訊信號105編碼之一裝置200的一方塊圖。用以編碼的該裝置200包含一第一編碼器210a、一第二編碼器210b、一決策階段220及一帶寬擴展模組(BWE模組)230。該第一編碼器210a係可操作以根據具有一第一頻率帶寬的一第一編碼演算法來編碼。該第二編碼器210b係可操作以根據具有小於該第一頻率帶寬的一第二頻率帶寬的一第二編碼演算法來編碼。例如該第一編碼器可是諸如一LPC式編碼器的一語音編碼器,而該第二編碼器210b可包含一音訊(音樂)編碼器。該決策階段220受組配以指示該音訊信號105之一第一部分204a的第一編碼演算法且指示該音訊信號105之一第二部分204b的第二編碼演算法,其中該第二時間部分不同於該第一時間部分。該第一部分204a可相對應於一第一時間部分且該第二部分204b可相對應於不同於該第一時間部分的一第二時間部分。
該BWE模組230受組配以計算該音訊信號105的BWE參數106且受組配來由該決策階段220控制以對不包括在該音訊信號105之第一時間部分204a中的該第一頻率帶寬的一第一帶計算該BWE參數106。該BWE模組230進一步受組配以對不包括在該音訊信號150之第二時間部分204b中的該第二帶寬的一第二帶計算該BWE參數106。因此,該第一(第二)帶包含在該第一(第二)頻率帶寬之外且由該交越頻率fx限制於該頻譜之下方端的該音訊信號105的頻率成分。因而,該第一或該第二帶寬可由受該決策階段220控制之一可變交越頻率來定義。
此外,該BWE模組230可包含受該決策階段220控制的一開關。該決策階段220可為一給定的時間部分判定一較佳的編碼演算法且控制該開關使得在該給定時間部分期間使用該較佳的編碼器。該所修改的編碼模式資訊108’包含該相對應的開關信號。而且,該BWE模組230還可包含一濾波器以在由可包含大約4Hz或5Hz之一值之交越頻率fx分離的該下方/上方頻率帶中獲得該音訊信號105的成分。最後,該BWE 130還可包含一分析工具以判定該BWE參數106。該所修改的編碼模式資訊108’可等價(或相等)於該編碼模式資訊108。該編碼模式資訊108指示例如在該經編碼音訊信號105的位元流中該等個別時間部分所使用的編碼演算法。
根據另外的實施例,該決策階段220包含分析該最初輸入信號105且產生觸發選擇該等不同編碼模式的控制資訊108的一信號分類器工具。該輸入信號105的分析以對一給定的輸入信號訊框選擇最佳的核心編碼模式為目的予以獨立實施。該信號分類器的輸出還可(可取捨地)用以影響其他工具的性能,例如環繞MPEG、增強SBR、時間扭曲濾波器組及其他。對該信號分類器工具的輸入包含例如該最初未修改的輸入信號105,而且還可取捨地包含附加的實施獨立參數。該信號分類器工具的輸出包含該控制信號108以控制該核心編解碼器(例如非LP濾波頻域或LP濾波時域或頻域編碼或又一些編碼演算法)之選擇。
根據實施例,該交越頻率fx是與該轉換決策相結合用以使用一不同編碼演算法之信號相依的調整。因而,一簡單的開關信號可僅是在該交越頻率fx中的一改變(一跳躍)。此外,該編碼模式資訊108還可包含同時指示一較佳編碼方案(例如語音/音訊/音樂)之該交越頻率fx的改變。
根據另外的實施例,可操作該決策階段220來分析該音訊信號105或該第一編碼器210a的一第一輸出或該第二編碼器210b的一第二輸出或依據一目標函數藉由將該編碼器210a或該編碼器210b的一輸出信號解碼而獲得的一信號。可可取捨地操作該決策階段220以用相較於一音樂決策下一語音決策較有利之一方式來執行一語音/音樂鑑別使得例如即使當小於該第一開關之一訊框的50%的一部分是語音及大於該第一開關之該訊框的50%的一部分是音樂時也採用一語音決策。因而,該決策階段220可包含一分析工具,其分析該音訊信號以決定該音訊信號是否主要為一語音信號或主要為一音樂信號以便基於該結果該決策階段可決定哪個是將用於該音訊信號之受分析時間部分的最佳編解碼器。
第1及2圖沒有顯示該編碼器/解碼器的許多細節。該編碼器/解碼器之可能的詳細範例顯示於下面的圖式中。除了第1圖的第一及第二解碼器110a、b,還可以存在可以或可以不使用例如又一些編碼演算法的又一些解碼器。以同一方式,第2圖的編碼器200還可包含可使用附加編碼演算法的附加編碼器。在下面,將更詳細地解釋具有二編碼器/解碼器的範例。
第3圖更詳細地繪示具有二串接開關的一編碼器。一單聲道信號、一立體聲信號或一多聲道信號遭輸入一決策階段220及為第2圖之BWE模組230之部分的一開關232。該開關232由該決策階段220控制。可選擇地,該決策階段220還可接收包括於該單聲道信號、該立體聲信號或該多聲道信號中或至少與這一信號相關聯的一旁側資訊,其中該資訊是現有的,例如是在最初產生該單聲道信號、該立體聲信號或該多聲道信號時所產生的。
該決策階段220啟動該開關232以將一信號提供給現在在第3圖之一上方分支處所繪示的一頻率編碼部分210b中或在第3圖之一下方分支處所繪示的一LPC域編碼部分210a中。該頻域編碼分支的一重要元件是可操作以將一共用預處理階段輸出信號(如稍後將討論的)轉換於一頻譜域中的一頻譜轉換方塊410。該頻譜轉換方塊可包括一MDCT演算法、一QMF、一FFT演算法、一小波分析或諸如具有一定數量之濾波器組聲道的一嚴格取樣濾波器組之一濾波器組,其中此濾波器組中的該等子帶信號可以是實值信號或複值信號。該頻譜轉換方塊410的輸出使用可包括來自該AAC編碼方案之習知的處理方塊的一頻譜音訊編碼器421來編碼。
一般地,分支210b中的該處理是基於一感知式模型或資訊槽模型的一處理。因而,此分支模型化接收聲音之人類聽覺系統。相反地,分支210a中的該處理用以產生在該激勵、殘差或LPC域中的一信號。一般地,分支210a中的該處理是基於一語音模型或一資訊產生模型的一處理。對於語音信號,此模型是產生聲音的該人類語音/聲音產生系統的一模型。然而,如果來自需要一不同聲音產生模型之一不同來源的一聲音將被編碼,那麼分支210a中的處理可不同。除了所顯示的編碼分支,另外的實施例包含附加的分支或核心編碼器。例如,對於該等不同的來源,可可取捨地存在不同的編碼器,使得來自各來源的聲音可藉由使用一較佳的編碼器予以編碼。
在該下方編碼分支210a中,一重要的元件是輸出用於控制一LPC濾波器之特性的LPC資訊的一LPC裝置510。此LPC資訊被傳送至一解碼器。該LPC階段510輸出信號是由一激勵信號及/或一加權信號組成的一LPC域信號。
該LPC裝置一般地輸出可能是在該LPC域中之任何信號的一LPC域信號或藉由將LPC濾波器係數應用於一音訊信號所產生的任何其他信號。此外,一LPC裝置還可判定此等係數且還可量化/編碼此等係數。
該決策階段220中的該決策可是信號自適應以便該決策階段執行一音樂/語音鑑別且以將音樂信號輸入該上方分支210b,且將語音信號輸入該下方分支210a的方式來控制該開關232。在一實施例中,該決策階段220將其決策資訊提供給一輸出位元流使得一解碼器可使用此決策資訊來執行正確的解碼操作。此決策資訊可包含例如還可包含關於該交越頻率fx或該交越頻率fx之一改變之資訊的編碼模式資訊108。
這樣一解碼器繪示於第4圖中。該頻譜音訊編碼器421的信號輸出在傳送之後輸入至一頻譜音訊解碼器431。該頻譜音訊解碼器431的輸出輸入至一時域轉換器440(該時域轉換器一般地可以是從一第一至一第二域的一轉換器)。相似地,第3圖之LPC域編碼分支210a的輸出被接收於該解碼器側且由元件531、533、534及532予以處理用以獲得一LPC激勵信號。該LPC激勵信號輸入至接收由相對應之LPC分析階段510所產生的該LPC資訊作為又一輸入的一LPC合成階段540。該時域轉換器440的輸出及/或該LPC合成階段540的輸出輸入至可為第1圖之BWE模組130之部分的一開關132。該開關132經由例如由該決策階段220所產生或諸如從外部由該最初單聲道信號、立體聲信號或多聲道信號的一產生器所提供的一開關控制信號(諸如該編碼模式資訊108及/或該BWE參數106)來控制。
在第3圖中,至該開關232及該決策階段220的該輸入信號可是一單聲道信號、一立體聲信號、一多聲道信號或通常地為任何音訊信號。依據可來源於該開關232輸入信號或來源於諸如為輸入至階段232之該信號之基礎之該最初音訊信號的一產生器的任何外部來源的該決策,該開關在該頻率編碼分支210b與該LPC編碼分支210a之間轉換。該頻率編碼分支210b包含一頻譜轉換階段410及一隨後相連接的量化/編碼階段421。該量化/編碼階段可包括來自諸如該ACC編碼器之當代頻域編碼器的習知的任何功能。此外,在該量化/編碼階段421中的該量化操作可經由產生諸如一心理聲學遮蔽臨界值的心理聲學資訊的一心理聲學模組來予以控制,其中此資訊輸入至該階段421。
在該LPC編碼分支210a中,該開關輸出信號經由產生LPC旁側資訊及一LPC域信號的一LPC分析階段510來處理。該激勵編碼器可包含用以在該LPC域中的一量化/編碼操作522或正處理該LPC頻譜域中之值的一量化/編碼階段524之間轉換該LPC域信號之進一步處理的一附加開關。為此目的,一頻譜轉換器523提供於該量化/編碼階段524的輸入處。該開關521依據例如該AMR-WB+技術說明書中所描述的特定設定以一開環形式或以一閉環形式來控制。
對於該閉環控制模式,該編碼器另外包括對於該LPC域信號的一反向量化器/編碼器531、對於該LPC頻譜域信號的一反向量化器/編碼器533及對於項目533之輸出的一反向頻譜轉換器534。在該第二編碼分支的處理分支中經編碼的及再經解碼的信號二者輸入至該開關控制裝置525。在該開關控制裝置525中,此等二輸出信號予以相互比較及/或與一目標函數相比較或一目標函數可基於二信號中失真之比較來計算以便使用具有該較低失真的信號來決定該開關521應該採用哪一位置。可選擇地,如果二分支提供非固定的位元速率,那麼即使當此分支的失真或感知失真低於另一分支的失真或感知失真(該失真之一範例可以是該信號對雜訊比)時可選擇提供較低位元速率的該分支。可選擇地,該目標函數可使用各信號的失真及各信號的一位元速率及/或附加標準作為一輸入以找出對一特定目的的最佳決策。如果例如該目的是該位元速率要盡可能的低,那麼該目標函數將很大程度上依賴於該等元件531、534之二信號輸出的位元速率。然而,當該主要目的是具有最好品質的某一位元速率,那麼該開關控制525可例如丟棄在所允許之位元速率之上的各信號且當二信號在該所允許之位元速率之下時,該開關控制將選擇具有較佳估計主觀品質,即具有該等較少的量化/編碼失真或一較好的信號對雜訊比的信號。
根據一實施例的該解碼方案如前所述繪示於第4圖中。對於該等三個可能的輸出信號類型的每一類型,存在一特定的解碼/再量化階段431、531或533。儘管階段431輸出透過使用該頻率/時間轉換器440轉換為時域的一頻率頻譜,但是階段531輸出LPC域信號,且項目533輸出一LPC頻譜。為了確保至開關532的該等輸入信號均在該LPC域中,提供了該LPC頻譜/LPC轉換器534。該開關532的輸出資料透過使用經由編碼器側所產生且傳送的LPC資訊控制的一LPC合成階段540轉換回時域。接著,在方塊540之後,為了依據輸入至第3圖之編碼方案之該信號最終獲得諸如一單聲道信號、一立體聲信號或一多聲道信號的一音訊信號,二分支具有根據一開關控制信號來轉換的時域資訊。
第5及6圖顯示該編碼器/解碼器的另外的實施例,其中該等BWE階段作為該等BWE模組130、230之部分表現一共用的處理單元。
第5圖繪示一編碼方案,其中連接於該開關232輸入的共用預處理方案可包含產生聯合立體聲參數及藉由下降混合具有二或更多個聲道之一信號的一單聲道信號作為一輸出的一環繞/聯合立體聲方塊101。一般地,在方塊101的輸出處的該信號還可以是具有多個聲道的信號,但由於方塊101之下降混合的功能,在方塊101之輸出處的聲道數量將小於輸入至方塊101之聲道的數量。
該共用的預處理方案除了包含該方塊101之外,還包含一帶寬擴展階段230。在第5圖的實施例中,方塊101的輸出輸入至在其輸出處輸出諸如該低帶信號或該低通信號的一限帶信號的帶寬擴展方塊230。較佳地,此信號也是(例如藉由二之一因數)下降取樣。另外,對於輸入至方塊230的信號之該高帶,諸如來自MPEG-4之HE-AAC設定檔之習知的頻譜包絡參數、反向濾波參數、雜訊基準參數等的帶寬擴展參數106被產生且發送至一位元流多工器800。
較佳地,為了在例如一音樂模式或一語音模式之間決策,該決策階段220接收輸入至方塊101或輸入至方塊230的信號。在該音樂模式中,該上方編碼分支210b(第2圖中的第二編碼器)被選擇,而在該語音模式中,該下方編碼分支210a被選擇。較佳地,該決策階段附加地控制該聯合立體聲方塊101及/或該帶寬擴展方塊230以使此等方塊的功能適應於該特定的信號。因而,當該決策階段220判定該輸入信號的某一時間部分相對應於諸如該音樂模式的該第一模式時,那麼方塊101及/或方塊230的特定特徵可由該決策階段220控制。可選擇地,當該決策階段220判定該信號相對應於一語音模式或一般地在一第二LPC域模式中,那麼方塊101及230的特定特徵可根據該決策階段輸出來控制。該決策階段220還可產生該控制資訊108及/或還可傳送至該BWE方塊230且此外至一位元流多工器800使得其傳送至該解碼器側的該交越頻率fx。
較佳地,該編碼分支210b的頻譜轉換使用尤較佳地為該時間扭曲MDCT操作的一MDCT操作來完成,其中該強度或一般地扭曲強度可被控制在零與一高扭曲強度之間。在一零扭曲強度中,方塊411中的該MDCT操作是在該技藝中習知的一直接MDCT操作。該時間扭曲強度可與該時間扭曲旁側資訊一起作為旁側資訊被傳送/輸入至該位元流多工器800。
在該LPC編碼分支中,該LPC域編碼器可包括計算一間距增益、一間距滯後及/或諸如一碼薄索引及增益之碼薄資訊的一ACELP核心526。習知的來自3GPP TS 26.290的該TCX模式包括在該變換域中一感知加權信號的一處理。一傅利葉變換加權信號利用具有雜訊因數量化之一分裂多速率格點量化(代數VQ)來量化。一變換在1024、512或256個樣本視窗中予以計算。該激勵信號藉由經過一反向加權濾波器的反向濾波該經量化的加權信號而重新獲得。該TCX模式還可以經修改的形式予以使用,其中該MDCT與一擴大的交疊、純量量化及用以將頻譜線編碼的一算術編碼器一起使用。
在該“音樂”編碼分支210b中,一頻譜轉換器較佳地包含具有某些視窗函數的一特別適應的MDCT操作,其之後是可由一單一向量量化階段組成的一量化/熵編碼器階段,但是較佳地是相似於在該頻域編碼分支中(即第5圖的項目421中)之該量化器/編碼器的一經結合的純量量化器/熵編碼器。
在該“語音”編碼分支210a中,該LPC方塊510之後是一開關521,再之後是一ACELP方塊526或一TCX方塊527。ACELP描述於3GPP TS 26.190中且TCX描述於3GPP TS 26.290中。一般地,該ACELP方塊526接收由第7圖所描述之一程序所計算出的一LPC激勵信號。該TCX方塊527接收由第8圖所產生的一加權信號。
在第6圖中所說明的解碼器側,在方塊537中的該反向頻譜變換之後,該加權濾波器的反向被應用,即(1-μz -1
)/(1-A
(z
/γ))。接著該信號藉由(1-A(z))予以濾波以轉到該LPC激勵域。因而,對LPC域方塊534及該TCX-1
方塊537的轉換包括反向變換及接著藉由而濾波以從該加權域轉換為該激勵域。
雖然第3、5圖中項目510說明了一單一方塊,但是只要此等信號在該LPC域中,方塊510就可輸出不同的信號。方塊510的實際模式,諸如該激勵信號模式或該加權信號模式,可依該實際的開關狀態而定。可選擇地,該方塊510可具有二平行的處理裝置,其中一裝置相似於第7圖予以實施且另一裝置如第8圖予以實施。因此,在510輸出處的該LPC域可表現該LPC激勵信號或該LPC加權信號或任何其他LPC域信號。
在第5圖的第二編碼分支(ACELP/TCX)中,該信號較佳地在編碼之前藉由一濾波器1-μz-1
予以預加重。在第6圖中該ACELP/TCX解碼器處,該經合成信號由該濾波器1/(1-μz-1
)去加重。在一較佳實施例中,該參數μ具有值0.68。該預加重可以是該LPC方塊510的部分,其中該信號在LPC分析及量化之前予以預加重。類似地,去加重可是該LPC合成方塊LPC-1
540的部分。
第6圖繪示相對應於第5圖之編碼方案的一解碼方案。由第5圖之位元流多工器800(或輸出介面)所產生的該位元流輸入至一位元流解多工器900(或輸入介面)。依據來源於例如經由一模式檢測方塊601(例如第1圖中該控制器140的部分)之位元流的一資訊,一編碼器側開關132被控制以將來自該上方分支的信號或來自該下方分支的信號發送至帶寬擴展方塊701。該帶寬擴展方塊701從該位元流解多工器900接收旁側資訊且基於此旁側資訊及該模式檢測601的輸出,重建基於由開關132輸出之低帶的高帶。該控制信號108控制該所使用的交越頻率fx。
由方塊701所產生的該全帶信號輸入至重建二立體聲聲道或許多多聲道的聯合立體聲/環繞處理階段702。一般地,方塊702將輸出比輸入至此方塊的聲道多的聲道。依據該應用,至方塊702的該輸入可包括諸如在一立體聲模式中的二聲道且只要此方塊的輸出具有比輸入至此方塊的聲道多的聲道,甚至可包含更多的聲道。
第5圖中的該開關232已顯示在二分支之間轉換,使得僅一分支接收需處理的一信號而另一分支不接收需處理的一信號。然而,在一其他實施例中,該開關232還可安排於例如該音訊編碼器421及該激勵編碼器522、523、524之後,這意味著二分支210a、210b並行地處理該相同的信號。然而,為了不使該位元速率加倍,僅選擇將此等編碼分支210a或210b之一的信號輸出寫入該輸出位元流。接著,該決策階段將操作使得寫入該位元流的該信號最小化某一成本函數,其中該成本函數可能是該所產生的位元速率或該所產生的感知失真或一經組合的速率/失真成本函數。因而,在此模式中或在該等圖式所說明的該模式中,為了確保最終僅將該編碼分支輸出寫入對於一給定的感知失真具有該最低的位元速率,或對於一給定的位元速率具有該最低的感知失真的該位元流中,該決策階段還可在一閉環模式中操作。在該閉環模式中,該回饋輸入可來源於第3圖中該等三量化器/純量方塊421、522及424的輸出。
而且在第6圖之實施例中,該開關132可在其他的實施例中配置於該BWE模組701之後使得該帶寬擴展對於二分支並行地執行且該開關選擇該等二帶寬擴展信號之一。
在具有二開關(即該第一開關232及該第二開關521)的該實施中,較佳的是該第一開關的時間解析度低於該第二開關的時間解析度。所述不同的是,至可藉由一開關操作來轉換的該第一開關之該輸入信號的該等方塊大於藉由操作於該LPC域中的該第二開關521來轉換的該等方塊。作為示範地,該頻域/LPC域開關232可轉換1024個樣本之一長度的方塊且該第二開關521可轉換各具有256個樣本的方塊。
第7圖繪示該LPC分析方塊510的一更加詳細的實施。該音訊信號輸入至判定該濾波器資訊A(z)的一濾波器決策方塊83。此資訊作為一解碼器所需的該短期預測資訊予以輸出。該短期預測資訊是實際預測濾波器85需要的。在一減法器86中,輸入該音訊信號的一目前樣本且減去該目前樣本的一經預測值以便對於此樣本,在線84處產生該預測誤差信號。
當第7圖繪示了用以計算該激勵信號的一較佳的方式,而第8圖繪示用以計算該加權信號的一較佳的方式。相較於第7圖,該濾波器85在γ不為1時不同。γ較佳的是小於1的一值。另外,存在該方塊87,且μ較佳地是小於1的一數字。一般地,第7及8圖中的該等元件可以如3GPP TS 26.190或3GPP TS 26.290實施。
隨後,為了說明應用於此演算法的該等修改,對一分析合成CELP編碼器予以討論。此CELP編碼器被詳細地描述於“Speech Coding:A Tutorial Review”,Andreas Spanias,Proceedings of the IEEE,Vol. 82,No. 10,October 1994,pages 1541-1582中。
對於特定的情況,當一訊框是無聲及有聲語音的一混合時或當發生語音在音樂之上時,一TCX編碼可能較適於編碼在該LPC域中的該激勵。該TCX編碼直接地處理在該頻域中的激勵而不用對激勵的產生做任何假設。於是該TCX與CELP編碼相比更普通且不限於一有聲的或一無聲的激勵源模型。TCX更是使用用以模型化該等像語音信號之共振峰的一線性預測濾波器的一源濾波器模型編碼。
在該像AMR-WB+編碼中,在不同的TCX模式與ACELP之間,如該AMR-WB+描述中習知的,發生一選擇。該等TCX模式由於對於不同的模式該分塊快速傅利葉變換的長度不同而不同且該最佳模式可藉由一分析合成方法或藉由一直接“前饋”模式而予以選擇。
如與第5及6圖有關的討論,該共用的預處理階段100較佳地包括一聯合多聲道(環繞/聯合立體聲裝置)101及此外一帶寬擴展階段230。相應地,該解碼器包括一帶寬擴展階段701及一隨後相連接的聯合多聲道階段702。較佳地,對於該編碼器,該聯合多聲道階段101連接於該帶寬擴展階段230之前,且在該解碼器側,該帶寬擴展階段701相對於該信號處理方向連接於該聯合多聲道階段702之前。然而,可選擇地,該共用預處理階段可包括不具有隨後相連接之帶寬擴展階段的一聯合多聲道階段或不具有一相連接之聯合多聲道階段的一帶寬擴展階段。
第9a至9b圖顯示第5圖的編碼器的一簡化視圖,其中該編碼器包含該開關決策單元220及該立體聲編碼單元101。此外,該編碼器還包含例如一包絡資料計算器及SBR相關模組的該等帶寬擴展工具230。該開關決策單元220提供在該音訊編碼器210b與該語音編碼器210a之間轉換的一開關決策信號108’。該語音編碼器210a可進一步分為一有聲及無聲編碼器。此等編碼器之每一個可使用不同數量的樣本值(例如對於一較高解析度為1024或對於一較低解析度為256)來將在該核心頻率帶中的該音訊信號編碼。該開關決策信號108’還提供給該帶寬擴展(BWE)工具230。為了例如調整該等頻譜包絡104的數量且開啟/關閉一可取捨的暫態檢測器且調整該交越頻率fx,該BWE工具230接著將使用該開關決策108’。該音訊信號105輸入至該開關決策單元220且輸入至該立體聲編碼101使得該立體聲編碼101可產生輸入至該帶寬擴展單元230的該等樣本值。依據由該開關單元決策單元220所產生的該決策108’,該帶寬擴展工具230將產生依次發送至一音訊編碼器210b或一語音編碼器210a的頻譜帶複製資料。
該開關決策信號108’是信號相依且可從該開關決策單元220藉由例如使用一暫態檢測器或可包含或可不包含一可變臨界值的其他檢測器來分析該音訊信號而獲得。可選擇地,該開關決策信號108’可手動地(例如由一使用者)調整或從一資料流(包括於該音訊信號中)獲得。
該音訊編碼器210b及該語音編碼器210a的輸出可再輸入至該位元流格式器800(參見第5圖)中。
第9b圖顯示在一第一時間ta之前且一第二時間tb之後的一時段檢測一音訊信號的該開關決策信號108’的一範例。在該第一時間ta與該第二時間tb之間,該開關決策單元220對於該開關決策信號108’檢測到產生不同分立值的一語音信號。
用以使用一較高交越頻率fx的該決策由該轉換決策單元220來控制。這意味著所描述的方法在該SBR模組與僅一單一核心編碼器及一可變交越頻率fx相結合的一系統內也是可用的。
雖然該等第1至9圖的一些作為一裝置的方塊圖予以繪示,但是此等圖式同時地是一方法的說明,其中該等方塊功能相對應於該等方法步驟。
第10圖繪示包含該第一部分104a、該第二部分104b、一第三部分104c及一第四部分104d的一經編碼音訊信號102的一示意圖。在此示意圖中,該經編碼音訊信號102是透過一傳送聲道傳送的一位元流,其另外包含該編碼模式資訊108。該經編碼音訊信號102的各部分104可表現一不同的時間部分,儘管不同的部分104可在該頻域以及時域中,使得該經編碼音訊信號102可以不表示一時間線。
在此實施例中,該經編碼音訊信號102此外包含識別該第一部分104a所使用之編碼演算法的一第一編碼模式資訊108a;識別該第二部分104b所使用之編碼演算法的一第二編碼模式資訊108b;識別該第四部分104d所使用之編碼演算法的一第三編碼模式資訊108d。該第一編碼模式資訊108a還可識別在該第一部分104a內所使用的第一交越頻率fx1,且該第二編碼模式資訊108b還可識別在該第二部分104b內所使用的第二交越頻率fx2。例如,在該第一部分104a內可使用該“語音”編碼模式且在該第二部分104b內可使用該“音樂”編碼模式使得該第一交越頻率fx1可高於該第二交越頻率fx2。
在此示範實施例中,該經編碼音訊信號102不包含該第三部分104c的編碼模式資訊,這指示在該第一及第三部分104a、c之間所使用之編碼器及/或交越頻率fx沒有改變。因而,該編碼模式資訊108對於此等與該前面部分相比使用一不同核心編碼器及/或交越頻率的部分104僅可作為標頭出現。在代替發信用於該等不同部分104之該等交越頻率的值的另外的實施例中,該編碼模式資訊108可包含指示該個別部分104所使用之核心編碼器(第一或第二編碼器210a、b)的一單一位元。
因而,在不同SBR工具之間開關性能的發信可藉由遞交為例如在該位元流內的特定位元來完成使得此特定位元可開啟或關閉該解碼器中的一特定性能。可選擇地,在根據實施例具有二核心編碼器的系統中,該開關的發信還可藉由分析該核心編解碼器來啟動。在這種情況下,該等SBR工具適應的提交可隱含地完成,這意味著其由該相對應的核心編碼器行動所決定。
關於該SBR有效載荷之位元流元件的標準描述的更多細節可在ISO/IEC 14496-3,子條款第4.5.2.8條中查到。此標準位元流的一修改包含對該主頻率表之一擴展的索引的(以識別該所使用的交越頻率)。所使用之索引例如用允許該交越帶在0至15個帶的一範圍上可變的四個位元來編碼。
因此,本發明之實施例可總結如下。具有不同時間/頻率特性的不同信號對該帶寬擴展的特性具有不同的要求。暫態信號(例如在一語音信號內)需要該BWE之一細微的時間解析度且該交越頻率(該核心編碼器的上方頻率邊界)應盡可能高(例如4kHz或5kHz或6kHz)。特別是在有聲語音中,一失真的時間結構可能降低所感知的品質。音調信號需要一穩定再生的頻譜成分及一相匹配的諧波形式的再生高頻部分。音調部分的穩定再生限制該核心編碼器的帶寬,但是這需要不僅具有細微時間解析度而且具有更細微頻譜解析度的一BWE。在一經轉換的語音/音訊編碼器設計中,還可能使用該核心編碼器決策以適應該BWE之時間及頻譜特性二者以及適應對該等信號特性的該BWE起始頻率(交越頻率)。因而,實施例提供一帶寬擴展,其中該核心編碼器決策作為對帶寬擴展特性的適應標準。
該經改變的BWE起始(交越)頻率的發信可明確地藉由發送該位元流中的附加資訊(例如做為該編碼模式資訊108)或隱含地藉由從所使用的該核心編碼器直接地導出交越頻率fx(如果該核心編碼器例如在該位元流內發信)來實現。例如,對於該變換編碼器(例如音訊/音樂編碼器)一較低的BWE頻率fx且對於一時域(語音)編碼器一較高的BWE頻率fx。在這種情況下,該交越頻率可在0Hz直至奈奎斯特(Nyquist)頻率之間的範圍中。
雖然一些層面已經以一裝置的脈絡來描述,但是應清楚的是此等層面還表示該相對應之方法的一描述,其中一方塊或裝置相對應於一方法步驟或一方法步驟的一特徵。相似地,以一方法之脈絡所描述的層面也表示一相對應之方塊或一相對應之裝置之項目或特徵的一描述。
該發明的經編碼音訊信號可儲存於一數位儲存媒體上或可在諸如一無線傳送媒體或諸如該網際網路之一有線傳送媒體之一傳送媒體上傳送。
依據某些實施要求,該發明的實施例可在硬體中或在軟體中實施。該實施可使用具有儲存於其上之具有電子可讀控制信號的例如一軟磁碟、一DVD、一CD、一ROM、一PROM、一EPROM、一EEPROM或一快閃記憶體的一數位儲存媒體來執行,該數位儲存媒體與一可規劃電腦系統相協作(或能夠協作)使得該個別方法予以執行。
根據該發明,一些實施例包含具有電子可讀控制信號的一資料載體,該等電子可讀控制信號能夠與一可規劃電腦系統相協作使得在此所描述之該等方法之一獲得執行。
一般地,本發明之實施例可作為具有一程式碼的一電腦程式產品予以實施,該程式碼可操作以當該電腦程式產品執行於一電腦上時執行該等方法之一。該程式碼可例如儲存於一機械可讀載體上。
另外的實施例包含用以執行在此所描述之該等方法之一,儲存於一機械可讀載體上的該電腦程式。
換句話說,因而該發明的方法的一實施例是具有用以當該電腦程式執行於一電腦上時執行在此所描述之該等方法之一的一程式碼的一電腦程式。
因而,該等發明的方法的又一實施例是包含用以執行在此所描述之該等方法之一的記錄於其上的該電腦程式的一資料載體(或一數位儲存媒體,或一電腦可讀媒體)。
因而,該等發明的方法的又一實施例是表示用以執行在此所描述之該等方法之一的該電腦程式的一資料流或一序列信號。該資料流或該序列信號可例如受組配以經由一資料通訊連接,例如經由該網際網路予以傳輸。
又一實施例包含受組配以或適於執行在此所描述之該等方法之一的一處理裝置,例如一電腦,或一可規劃邏輯裝置。
又一實施例包含具有安裝於其上之用以執行在此所描述之該等方法之一之該電腦程式的一電腦。
在一些實施例中,一可規劃邏輯裝置(例如一現場可規劃閘極陣列)可用以執行在此所描述之該等方法的一些或所有功能。在一些實施例中,一現場可規劃閘極陣列為了執行在此所描述之該等方之一,可與一微處理器相協作。一般地,該等方法較佳地藉由任何硬體裝置來執行。
上面所描述的該等實施例僅是對本發明之原理的說明。應理解的是在此所描述之該等安排及該等細節的修改及變化對於在該技藝中具有通常知識者是顯而易見的。因而,它僅打算由該等將來臨的專利的申請專利範圍來限制而不打算由藉由在此該等實施例的描述及解釋所呈現的該等特定細節來限制。
83...濾波器決策方塊
84...線
85...濾波器
86...減法器
87‧‧‧方塊
100‧‧‧解碼器裝置
101‧‧‧聯合多聲道
102‧‧‧經編碼音訊信號
104a‧‧‧第一部分
104b‧‧‧第二部分
105‧‧‧音訊信號
106‧‧‧BWE參數
108‧‧‧編碼模式資訊
108'‧‧‧開關決策信號
110a‧‧‧第一解碼器
110b‧‧‧第二解碼器
114a‧‧‧第一時間部分
114b‧‧‧第二時間部分
130‧‧‧BWE模組
132‧‧‧開關
140‧‧‧控制器
200‧‧‧裝置
204a‧‧‧第一部分
204b‧‧‧第二部分
210a‧‧‧第一編碼器
210b‧‧‧第二編碼器
220‧‧‧決策階段
230‧‧‧帶寬擴展模組/BWE模組
232‧‧‧開關/第一開關
410‧‧‧頻譜轉換階段
411‧‧‧方塊
421‧‧‧頻譜音訊編碼器/量化/編碼階段/量化器/純量方塊
431‧‧‧頻譜音訊解碼器/解碼/再量化階段
440‧‧‧時域轉換器
510‧‧‧LPC分析階段
521‧‧‧開關/第二開關
522‧‧‧量化/編碼操作/量化器/純量方塊
523‧‧‧頻譜轉換器
524‧‧‧量化/編碼階段
525‧‧‧開關控制裝置
526‧‧‧ACELP核心
527‧‧‧TCX方塊
531‧‧‧反向量化器/編碼器/解碼/再量化階段
532‧‧‧開關
533‧‧‧反向量化器/編碼器/解碼/再量化階段
534‧‧‧LPC頻譜/LPC轉換器/LPC域方塊
537‧‧‧方塊/TCX-1方塊
540‧‧‧LPC合成階段
601‧‧‧模式檢測方塊
701‧‧‧帶寬擴展方塊/BWE模組
702‧‧‧聯合立體聲/環繞處理階段/方塊
800‧‧‧位元流多工器
900‧‧‧位元流解多工器
fx‧‧‧交越頻率
ta‧‧‧第一時間
tb‧‧‧第二時間
第1圖顯示根據本發明之一第一層面,用以解碼的一裝置的一方塊圖;
第2圖顯示根據本發明之該第一層面,用以編碼的一裝置的一方塊圖;
第3圖更詳細地顯示一編碼方案的一方塊圖;
第4圖更詳細地顯示一解碼方案的一方塊圖;
第5圖顯示根據一第二層面,一編碼方案的一方塊圖;
第6圖顯示根據該第二層面,一解碼方案的一示意圖;
第7圖繪示提供短期預測資訊及該預測誤差信號的一編碼器側的LPC階段;
第8圖繪示用以產生一加權信號之一LPC裝置的又一實施例;
第9a-9b圖顯示包含導致一音訊信號之不同時間解析度的一音訊/語音開關的一編碼器;及
第10圖繪示一經編碼音訊信號的一示意圖。
100...解碼器裝置
102...經編碼音訊信號
104a...第一部分
104b...第二部分
105...音訊信號
106...BWE參數
108...編碼模式資訊
110a...第一解碼器
110b...第二解碼器
114a...第一時間部分
114b...第二時間部分
130...BWE模組
140...控制器
fx...交越頻率
Claims (13)
- 一種用以將一經編碼音訊信號解碼的裝置,該經編碼音訊信號包含根據一第一編碼演算法編碼的一第一部分、根據一第二編碼演算法編碼的一第二部分、用於該第一部分及該第二部分的BWE參數及指示一第一解碼演算法或一第二解碼演算法的一編碼模式資訊,該裝置包含:一第一解碼器,其用以根據用於該經編碼信號的一第一時間部分的該第一解碼演算法將該第一部分解碼以獲得一第一經解碼信號,其中該第一解碼器包含一基於LPC的編碼器;一第二解碼器,其用以根據用於該經編碼信號的一第二時間部分的該第二解碼演算法將該第二部分解碼以獲得一第二經解碼信號,其中該第二解碼器包含一基於轉換的編碼器;一BWE模組,其具有一可控制的交越頻率,該BWE模組係組配用以使用該第一經解碼信號及用於該第一部分的該等BWE參數來執行一帶寬擴展演算法,且用以使用該第二經解碼信號及用於該第二部分的該BWE參數來執行一帶寬擴展演算法,其中該BWE模組係組配來使用一第一交越頻率用於該第一經編碼信號之帶寬擴展和使用一第二交越頻率用於該第二經編碼信號之帶寬擴展;其中該第一交越頻率係高於該第二交越頻率;及 一控制器,其用以根據該編碼模式資訊控制用於該BWE模組的該交越頻率。
- 如申請專利範圍第1項所述之用以解碼之裝置,其更包含用以將該經編碼信號作為一位元流輸入的一輸入介面。
- 如申請專利範圍第1項或申請專利範圍第2項所述之用以解碼之裝置,其中該BWE模組包含組配以在該第一時間部分與該第二時間部分之間從該第一解碼器至該第二解碼器轉換使得該帶寬擴展演算法應用於該第一經解碼信號或應用於該第二經解碼信號的一開關。
- 如申請專利範圍第3項所述之用以解碼之裝置,其中該控制器係組配以依據該編碼模式資訊內所指示之該解碼演算法來控制該開關。
- 如申請專利範圍第1項或申請專利範圍第2項所述之用以解碼之裝置,其中該控制器係組配以在該第一時間部分內增加該交越頻率或在該第二時間部分內降低該交越頻率。
- 一種用以將一音訊信號編碼的裝置,其包含:一第一編碼器,其係組配以根據一第一編碼演算法編碼,該第一編碼演算法具有一第一頻率帶寬,其中該第一解碼器包含一基於LPC的編碼器;一第二編碼器,其係組配以根據一第二編碼演算法編碼,該第二編碼演算法具有小於該第一頻率帶寬的一第二頻率帶寬,其中該第二解碼器包含一基於轉換的編 碼器;一決策階段,其用以指示用於該音訊信號之一第一部分的該第一編碼演算法且用以指示用於該音訊信號之一第二部分的該第二編碼演算法,該第二部分係不同於該第一部分;及一帶寬擴展模組,其用以計算用於該音訊信號的BWE參數,其中該BWE模組係組配以由該決策階段控制來對不包括在該音訊信號之該第一部分中的該第一頻率帶寬的一頻帶及對不包括在該音訊信號之該第二部分中的該第二頻率帶寬的一頻帶計算該等BWE參數,其中該第一頻率帶寬或該第二頻率帶寬係由一可變的交越頻率所定義且其中該決策階段係組配來輸出該可變的交越頻率,其中該BWE模組係組配來使用一第一交越頻率,該第一交越頻率係用以為使用該第一編碼器編碼之信號來計算該等BWE參數,且該BWE模組係組配來使用一第二交越頻率,其用於使用該第二編碼器編碼之一信號,其中該第一交越頻率係高於該第二交越頻率。
- 如申請專利範圍第6項所述之用以編碼之裝置,其更包含用以將該經編碼音訊信號輸出的一輸出介面,該經編碼音訊信號包含根據一第一編碼演算法編碼的一第一部分、根據一第二編碼演算法編碼的一第二部分、用於該第一部分及該第二部分的BWE參數及指示該第一解碼演算法或該第二解碼演算法的編碼模式資訊。
- 如申請專利範圍第6或7項所述之用以編碼之裝置,其中該第一頻率帶寬或該第二頻率帶寬由一可變的交越頻率來定義且其中該決策階段係組配來輸出該可變的交越頻率。
- 如申請專利範圍第6或7項之任一項所述之用以編碼之裝置,其中該BWE模組包含受該決策階段控制的一開關,其中該開關係組配以在該第一時間編碼器與該第二時間編碼器之間轉換使得該音訊信號對於不同的時間部分由該第一編碼器或由該第二編碼器所編碼。
- 如申請專利範圍第6或7項之任一項所述之用以編碼之裝置,其中該決策階段係操作來分析該音訊信號或該第一編碼器的一第一輸出或該第二編碼器的一第二輸出或藉由關於一目標函數解碼該第一編碼器或該第二編碼器的一輸出信號所獲得的一信號。
- 一種用以將一經編碼音訊信號解碼的方法,該經編碼音訊信號包含根據一第一編碼演算法編碼的一第一部分、根據一第二編碼演算法編碼的一第二部分、用於該第一部分及該第二部分的BWE參數及指示一第一解碼演算法或一第二解碼演算法的一編碼模式資訊,該方法包含以下步驟:根據用於該經編碼信號之一第一時間部分的該第一解碼演算法將該第一部分解碼以取得一第一經解碼信號,其中將該第一部分解碼之步驟包含使用一基於LPC的編碼器; 根據用於該經編碼信號之一第二時間部分的該第二解碼演算法將該第二部分解碼以取得一第二經解碼信號,其中將該第二部分解碼之步驟包含使用一基於轉換的編碼器;藉由具有一可控制的交越頻率之一BWE模組使用該第一經解碼信號及用於該第一部分的該等BWE參數來執行一帶寬擴展演算法,且藉由具有該可控制的交越頻率之該BWE模組,使用該第二經解碼信號及用於該第二部分的該BWE參數來執行一帶寬擴展演算法,其中一第一交越頻率係用於該第一經編碼信號之帶寬擴展且一第二交越頻率係用於該第二經編碼信號之帶寬擴展,其中該第一交越頻率係高於該第二交越頻率;及根據該編碼模式資訊控制用於該BWE模組的該交越頻率。
- 一種用以將一音訊信號編碼的方法,其包含以下步驟:根據一第一編碼演算法來編碼,該第一編碼演算法具有一第一頻率帶寬,其中該根據一第一編碼演算法來編碼之步驟包含使用一基於LPC的編碼器;根據一第二編碼演算法來編碼,該第二編碼演算法具有小於該第一頻率帶寬的一第二頻率帶寬,其中該根據一第二編碼演算法來編碼之步驟包含使用一基於轉換的編碼器;指示用於該音訊信號之一第一部分的該第一編碼 演算法及用於該音訊信號之一第二部分的該第二編碼演算法,該第二部分係不同於該第一部分;及計算用於該音訊信號的BWE參數使得對不包括在該音訊信號之該第一部分中的該第一頻率帶寬的一頻帶及對不包括在該音訊信號之該第二部分中的該第二頻率帶寬的一頻帶計算該等BWE參數,其中該第一頻率帶寬或該第二頻率帶寬係由一可變的交越頻率所定義,其中該BWE模組係組配來使用一第一交越頻率,該第一交越頻率係用為使用該基於LPC的編碼器編碼之一信號計算該等BWE參數,且該BWE模組係組配來使用一第二交越頻率,其用於使用該基於轉換的編碼器編碼之一信號,其中該第一交越頻率係高於該第二交越頻率。
- 一種電腦程式,其用以當其執行於一電腦上時執行申請專利範圍第11或12項所述之方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7984108P | 2008-07-11 | 2008-07-11 | |
US10382008P | 2008-10-08 | 2008-10-08 | |
PCT/EP2009/004522 WO2010003545A1 (en) | 2008-07-11 | 2009-06-23 | An apparatus and a method for decoding an encoded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201009808A TW201009808A (en) | 2010-03-01 |
TWI435316B true TWI435316B (zh) | 2014-04-21 |
Family
ID=40886797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098122550A TWI435316B (zh) | 2008-07-11 | 2009-07-03 | 用以將經編碼音訊信號解碼之裝置與方法 |
Country Status (19)
Country | Link |
---|---|
US (1) | US8275626B2 (zh) |
EP (2) | EP2304723B1 (zh) |
JP (1) | JP5325293B2 (zh) |
KR (1) | KR101224560B1 (zh) |
CN (1) | CN102089814B (zh) |
AR (1) | AR072481A1 (zh) |
AU (1) | AU2009267531B2 (zh) |
BR (1) | BRPI0910511B1 (zh) |
CA (1) | CA2730232C (zh) |
CO (1) | CO6341674A2 (zh) |
ES (2) | ES2396927T3 (zh) |
HK (2) | HK1154432A1 (zh) |
IL (1) | IL210414A (zh) |
MX (1) | MX2011000370A (zh) |
PL (2) | PL2304723T3 (zh) |
RU (1) | RU2483366C2 (zh) |
TW (1) | TWI435316B (zh) |
WO (1) | WO2010003545A1 (zh) |
ZA (1) | ZA201100087B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10777208B2 (en) | 2015-03-09 | 2020-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
WO2009051404A2 (en) * | 2007-10-15 | 2009-04-23 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
US8442837B2 (en) * | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
CN103270553B (zh) | 2010-08-12 | 2015-08-12 | 弗兰霍菲尔运输应用研究公司 | 对正交镜像滤波器式音频编译码器的输出信号的重新取样 |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN102610231B (zh) * | 2011-01-24 | 2013-10-09 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
KR101748760B1 (ko) | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
RU2725416C1 (ru) | 2012-03-29 | 2020-07-02 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
GB201210373D0 (en) * | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
CN104781877A (zh) * | 2012-10-31 | 2015-07-15 | 株式会社索思未来 | 音频信号编码装置以及音频信号解码装置 |
ES2659001T3 (es) * | 2013-01-29 | 2018-03-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificadores de audio, decodificadores de audio, sistemas, métodos y programas informáticos que utilizan una resolución temporal aumentada en la proximidad temporal de inicios o finales de fricativos o africados |
CA2898637C (en) | 2013-01-29 | 2020-06-16 | Sascha Disch | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
ES2626809T3 (es) * | 2013-01-29 | 2017-07-26 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Concepto para compensación de conmutación del modo de codificación |
ES2924427T3 (es) * | 2013-01-29 | 2022-10-06 | Fraunhofer Ges Forschung | Decodificador para generar una señal de audio mejorada en frecuencia, procedimiento de decodificación, codificador para generar una señal codificada y procedimiento de codificación que utiliza información lateral de selección compacta |
KR102243688B1 (ko) * | 2013-04-05 | 2021-04-27 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
US20160064004A1 (en) * | 2013-04-15 | 2016-03-03 | Nokia Technologies Oy | Multiple channel audio signal encoder mode determiner |
US9426569B2 (en) | 2013-06-13 | 2016-08-23 | Blackberry Limited | Audio signal bandwidth to codec bandwidth analysis and response |
PL3011692T3 (pl) | 2013-06-21 | 2017-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sterowanie buforem rozsynchronizowania, dekoder sygnału audio, sposób i program komputerowy |
ES2667823T3 (es) | 2013-06-21 | 2018-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Escalador de tiempo, decodificador de audio, procedimiento y programa informático mediante el uso de un control de calidad |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
US9620134B2 (en) * | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US9293143B2 (en) | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
WO2015104447A1 (en) | 2014-01-13 | 2015-07-16 | Nokia Technologies Oy | Multi-channel audio signal classifier |
KR102457290B1 (ko) * | 2014-02-24 | 2022-10-20 | 삼성전자주식회사 | 신호 분류 방법 및 장치, 및 이를 이용한 오디오 부호화방법 및 장치 |
US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
CN104143335B (zh) | 2014-07-28 | 2017-02-01 | 华为技术有限公司 | 音频编码方法及相关装置 |
PT3000110T (pt) | 2014-07-28 | 2017-02-15 | Fraunhofer Ges Forschung | Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos. |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10803877B2 (en) * | 2015-09-04 | 2020-10-13 | Samsung Electronics Co., Ltd. | Signal processing methods and apparatuses for enhancing sound quality |
EP3627507A1 (en) * | 2016-02-17 | 2020-03-25 | Fraunhofer Gesellschaft zur Förderung der Angewand | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
US10157621B2 (en) * | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
GB201620317D0 (en) * | 2016-11-30 | 2017-01-11 | Microsoft Technology Licensing Llc | Audio signal processing |
US10734001B2 (en) * | 2017-10-05 | 2020-08-04 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10733318B2 (en) * | 2017-11-21 | 2020-08-04 | International Business Machines Corporation | Processing analytical queries over encrypted data using dynamical decryption |
KR102570480B1 (ko) * | 2019-01-04 | 2023-08-25 | 삼성전자주식회사 | 오디오 신호 처리 방법 및 이를 지원하는 전자 장치 |
JP7092047B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 符号化復号方法、復号方法、これらの装置及びプログラム |
CN111554312A (zh) * | 2020-05-15 | 2020-08-18 | 西安万像电子科技有限公司 | 控制音频编码类型的方法、装置和系统 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6618701B2 (en) | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6978236B1 (en) | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US6901362B1 (en) | 2000-04-19 | 2005-05-31 | Microsoft Corporation | Audio segmentation and classification |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
ES2237706T3 (es) * | 2001-11-29 | 2005-08-01 | Coding Technologies Ab | Reconstruccion de componentes de alta frecuencia. |
WO2004034379A2 (en) * | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
JP4048956B2 (ja) * | 2003-01-20 | 2008-02-20 | ティアック株式会社 | 光ディスク装置 |
SE0301901L (sv) | 2003-06-26 | 2004-12-27 | Abb Research Ltd | Metod för att diagnostisera utrustningsstatus |
DE602004030594D1 (de) | 2003-10-07 | 2011-01-27 | Panasonic Corp | Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
WO2006000110A1 (en) | 2004-06-28 | 2006-01-05 | Abb Research Ltd | System and method for suppressing redundant alarms |
US8036394B1 (en) | 2005-02-28 | 2011-10-11 | Texas Instruments Incorporated | Audio bandwidth expansion |
KR100803205B1 (ko) | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
CN101273404B (zh) * | 2005-09-30 | 2012-07-04 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
KR100647336B1 (ko) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법 |
US7546237B2 (en) | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
CN101385079B (zh) * | 2006-02-14 | 2012-08-29 | 法国电信公司 | 在音频编码/解码中用于知觉加权的设备 |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
ATE463028T1 (de) | 2006-09-13 | 2010-04-15 | Ericsson Telefon Ab L M | Verfahren und anordnungen für einen sprach- /audiosender und empfänger |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
FR2912249A1 (fr) * | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
WO2008151408A1 (en) | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
WO2009051404A2 (en) * | 2007-10-15 | 2009-04-23 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
WO2009081315A1 (en) * | 2007-12-18 | 2009-07-02 | Koninklijke Philips Electronics N.V. | Encoding and decoding audio or speech |
EP2077550B8 (en) | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
CN101965612B (zh) | 2008-03-03 | 2012-08-29 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
AU2009220341B2 (en) * | 2008-03-04 | 2011-09-22 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
-
2009
- 2009-06-23 PL PL09776810T patent/PL2304723T3/pl unknown
- 2009-06-23 BR BRPI0910511-5A patent/BRPI0910511B1/pt active IP Right Grant
- 2009-06-23 EP EP09776810A patent/EP2304723B1/en active Active
- 2009-06-23 CA CA2730232A patent/CA2730232C/en active Active
- 2009-06-23 ES ES09776810T patent/ES2396927T3/es active Active
- 2009-06-23 PL PL11162255T patent/PL2352147T3/pl unknown
- 2009-06-23 MX MX2011000370A patent/MX2011000370A/es active IP Right Grant
- 2009-06-23 KR KR1020117000699A patent/KR101224560B1/ko active IP Right Grant
- 2009-06-23 RU RU2011104000/08A patent/RU2483366C2/ru active
- 2009-06-23 EP EP11162255.1A patent/EP2352147B9/en active Active
- 2009-06-23 WO PCT/EP2009/004522 patent/WO2010003545A1/en active Application Filing
- 2009-06-23 JP JP2011516987A patent/JP5325293B2/ja active Active
- 2009-06-23 ES ES11162255.1T patent/ES2439549T3/es active Active
- 2009-06-23 AU AU2009267531A patent/AU2009267531B2/en active Active
- 2009-06-23 CN CN2009801267055A patent/CN102089814B/zh active Active
- 2009-07-03 TW TW098122550A patent/TWI435316B/zh active
- 2009-07-07 AR ARP090102547A patent/AR072481A1/es active IP Right Grant
-
2010
- 2010-12-30 IL IL210414A patent/IL210414A/en active IP Right Grant
-
2011
- 2011-01-04 ZA ZA2011/00087A patent/ZA201100087B/en unknown
- 2011-01-07 CO CO11001549A patent/CO6341674A2/es active IP Right Grant
- 2011-01-11 US US13/004,272 patent/US8275626B2/en active Active
- 2011-08-15 HK HK11108519.2A patent/HK1154432A1/xx unknown
- 2011-09-29 HK HK11110283.2A patent/HK1156433A1/xx unknown
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10777208B2 (en) | 2015-03-09 | 2020-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US11107483B2 (en) | 2015-03-09 | 2021-08-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US11238874B2 (en) | 2015-03-09 | 2022-02-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US11741973B2 (en) | 2015-03-09 | 2023-08-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US11881225B2 (en) | 2015-03-09 | 2024-01-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI435316B (zh) | 用以將經編碼音訊信號解碼之裝置與方法 | |
US11676611B2 (en) | Audio decoding device and method with decoding branches for decoding audio signal encoded in a plurality of domains | |
US8959017B2 (en) | Audio encoding/decoding scheme having a switchable bypass |