TW201523590A - 使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法 - Google Patents

使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法 Download PDF

Info

Publication number
TW201523590A
TW201523590A TW103124630A TW103124630A TW201523590A TW 201523590 A TW201523590 A TW 201523590A TW 103124630 A TW103124630 A TW 103124630A TW 103124630 A TW103124630 A TW 103124630A TW 201523590 A TW201523590 A TW 201523590A
Authority
TW
Taiwan
Prior art keywords
spectral
frequency
spectrum
source
prediction
Prior art date
Application number
TW103124630A
Other languages
English (en)
Other versions
TWI541797B (zh
Inventor
薩斯洽 帝斯奇
弗瑞德里克 納吉爾
拉夫 紀哲爾
寶拉吉 奈傑娟 索須卡那
高斯坦汀 史密德
史丹芬 拜耶
克利斯汀安 盧坎
貝恩德 艾德勒
克利斯汀 漢姆瑞奇
Original Assignee
弗勞恩霍夫爾協會
紐倫堡大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會, 紐倫堡大學 filed Critical 弗勞恩霍夫爾協會
Publication of TW201523590A publication Critical patent/TW201523590A/zh
Application granted granted Critical
Publication of TWI541797B publication Critical patent/TWI541797B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

本發明揭露一種用於解碼一編碼音源訊號之裝置,包含:一頻譜域音源解碼器(602),係用以產生一第一組第一頻譜部分之一第一解碼表現,將該第一解碼表現係作為頻譜預測剩餘數值;一頻率再生器(604),係使用該第一組第一頻譜部分之一第一頻譜部份以產生一再建第二頻譜部分,其中該再建第二頻譜部分及該第一組第一頻譜部分包含頻率預測剩餘數值;以及一反向預測濾波器(606,616,626),係針對使用一預測濾波器資訊(607)之該第一組第一頻譜部份以及該再建第二頻譜部份,執行一隨頻率改變之反向預測,該隨頻率改變之反向預測則使用該頻譜預測剩餘數值,且該預測濾波器資訊(607)係包含於該編碼音源訊號。

Description

使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法
本發明關於一種音訊編碼/解碼,特別是關於一種使用智能填隙的音訊編碼。
音源編碼係為訊號壓縮之領域,其使用心理聲學知識來消除訊號中多餘以及無關的部分。現今,音源轉碼器通常需要大約60kbps/聲道以對幾乎任何類型之音源訊號進行感知透明編碼。較新的轉碼器係藉由使用如頻寬延伸(BWE)的技術利用訊號中相似頻譜來減少編碼位元速率。BWE機制係使用低位元速率參數來設定代表音源訊號之高頻率(HF)成分。HF頻譜係從低頻率(LF)區向上填經調整的頻譜內容、頻譜形狀、平鋪(tilt)以及時間持續以維持原始訊號的色彩以及音色。此種BWE方法使得音源轉碼器在很低的位元率24kbps/聲道上仍保留好品質。
音源訊號之儲存或是傳送係通常受限於嚴格位元率的約束。在過去,當僅能使用非常低位元率時,轉碼器係被迫激烈地降低傳輸音源的頻寬。
現代音源轉碼器可使用頻寬延伸(BWE)方法(文獻[1]所述)來編碼寬頻帶訊號。這些演算法依賴高頻內容(HF)之參數表現,其係藉由將從解碼訊號之低頻部(LF)調換成HF頻譜區域(“修補”)編碼波形所產生,以及依賴參數驅動後處理之應用。在BWE機制中,在給定所謂的交越頻率上方的HF頻譜區域之再建係通常根據頻譜修補(patching)。通常,HF區域係由多個鄰近修補所構成,且每一修補係源自給定交越頻率下方的LF光譜之複數個帶通(BP)區域。目前最先進的系統係藉由複製從來源至目標區域的 一組鄰近次頻帶係數,以有效地執行濾波器組表示內,例如正交鏡像濾波器組(QMF)的修補。
有另一技術的音源轉碼器係透過增加壓縮效率,使得在低位元率下能延伸音源頻寬,其係音源頻谱之合適部分的參數驅動合成替換。例如,原始音源訊號之類雜訊訊號部分可用解碼器產生且由側資訊參數縮放的人造雜訊來替換,而不會影響主觀品質。其中一範例係為MPEG-4先進音源編碼(AAC)[5]所包含的感知雜訊代替(PNS)工具。
而進一步的規範,其使得低位元率下的延伸音源頻寬為雜訊填充技術,係包含在MPEG-D統一語音與音源編碼(Unified Speech and Audio Coding,USAC)[7]中。由於量化器之過於粗略的量化而產生的無作用區(dead-zone)所推論出頻譜間隙(zeroes),後續在解碼器係填充人造雜訊並藉由參數驅動後處理縮放。
另一先進系統被稱為精確頻譜替換(ASR)[2-4]。除了波形轉譯器,ASR使用專用訊號合成級,其在解碼器恢復訊號中感知上重要的正弦部分。而且,在[5]描述的系統係依賴在波形編碼器之HF區域中的正弦模組化,以使得延伸音源頻寬在低位元率具有還不錯的感知品質。這些所有方法包含數據從修改型離散餘弦轉換(MDCT)轉換成第二領域,以及用於維持HF正弦成分的相當複雜之分析/合成級。
第13a圖係繪示用於頻寬延伸技術之音源編碼器之示意圖,此音源編碼器係使用於高效率先進音源編碼(HE-AAC)。在線1300上的音源訊號係輸入至濾波器系統,其包含有低通濾波器1302以及高通濾波器1304。高通濾波器1304所輸出的訊號係輸入至一參數提取器/編碼器1306。參數提取器/編碼器1306係用於計算以及編碼參數,例如頻譜包絡線參數、雜訊增添參數、消失的諧波參數或是逆濾波參數。這些提取出的參數係輸入至一位元流多工器1308。低通濾波器之輸出訊號係輸入至一處理器,其通常包含降取樣器1310以及核心編碼器1312之功能。低通濾波器1302係將待編碼的頻寬限制成比線1300上的原始輸入音源訊號的頻寬顯著較小頻寬。由於發生在核心編碼器的全部功能僅必須操作在已減少頻寬的訊號上,所以此提供大幅的編碼增益。例如,當線1300上的音源訊號之頻寬為20kHz而,舉例而言,當低通濾波器1302具有4kHz頻寬,為了履行 取樣定理,降取樣器之後的訊號具有8kHz之取樣頻率,其大致上減少至必須至少40kHz的音源訊號1300需要的取樣率。
第13b圖繪示相對應的頻寬延伸解碼器之示意圖。解碼器包含位元流解多工器1320。位元流解多工器1320提取一用於核心解碼器1322的輸入訊號以及一用於參數解碼器1324的輸入訊號。在上述範例中,核心解碼器之輸出訊號具有8kHz之取樣率以及4kHz之頻寬,因此,為了完成頻寬再建,高頻再建器1330的輸出訊號必須在20kHz,並需要至少40kHz之取樣率。為了使其可能,需要具有一升取樣器1325以及一濾波器組1326之功能的解碼處理器。然後,高頻再建器1330接收濾波器組1326所輸出的頻率分析低頻訊號,並使用高頻頻帶之參數表示重建第13a圖之高通濾波器1304所定義的頻率範圍。高頻再建器1330具有幾個功能,例如使用下頻率範圍中的來源範圍再生上頻率範圍、頻譜包絡線調整、增添雜訊功能以及在上頻率範圍中引進消失諧波的功能,以及為了解釋較高頻率範圍係通常不會與較低頻率範圍有相同音調,如果在第13a圖之編碼器中施加以及計算,則更包含逆濾波操作。在HE-AAC中,消失的諧波係在解碼器側上再合成,並精確地放置在再建頻帶之中間。因此,所有已經決定在特定再建頻帶中之消失的諧波線不會設置其位於原始訊號中的頻率值。取而代之地,那些消失的諧波線係設置在特定頻帶之中心位置的複數個頻率。如此,當原始訊號中的消失諧波線係設置非常接近原始訊號中的再建頻帶邊界,對於已經產生以及傳送的參數,在頻帶之中心的再建訊號中放置消失的諧波線而引進的頻率中的錯誤係接近個別再建頻帶之50%。
此外,即使典型的音源核心轉碼器係操作在頻譜領域,然而核心解碼器係產生一時間領域訊號再藉由濾波器組1326的功能將其轉換成頻譜領域。此引進額外的處理延遲,可能由於首次從頻譜域轉換成頻率域以及通常再次轉換成不同頻率域的串列處理而引進假造物,當然,當頻寬延伸技術應用於移動式裝置例如移動式電話、平板電腦或是筆記型電腦等等,此亦需要大量計算複雜度以及電源,這是一特別的議題。
目現的音源轉碼器係使用BWE作為編碼機制之整合部,以執行低位元率音源編碼。然而,BWE技術係限制僅能取代高頻率(HF)的內容。此外,不能讓在給定交越頻率上方的重要感知內容被進行波形編碼。 因此,因為系統之大部分不考慮訊號之音調諧波之精確對準時,當實現BWE時,任一同時期的音源轉碼器將遺失HF細節或是音色。
BWE系統之目前狀態之另一缺點是需要將音源訊號轉換成新的域以執行BWE(例如從MDCT域轉換成QMF域)。此導致同步複雜、額外的計算複雜度以及增加記憶體需求。
特別是,如果一頻寬延伸系統實現在一濾波器組或時間頻率轉換域內,則僅存在一限制的可能性來控制頻寬延伸訊號之頻譜塑形。通常,使用於相鄰轉換視窗之頻譜粒度被跳距所限制。這可能導致在頻寬延伸頻譜範圍內有多餘的預回音以及後回音。可使用較短的跳距或較短的頻寬延伸訊框以增加該頻譜粒度,但這會導致一位元率負載,在一特定的時間週期,對於一具有較大數量之參數而言,針對每個時間訊框之一特定參數組通常必須被傳遞。否則,如果採用過大的個別時間訊框,特別是對於一音源訊號之瞬變部分,將產生預回音以及後回音。
本發明之目的係提供一種對編碼音源訊號解碼之改良概念。
此目的藉由申請專利範圍第1項所述之解碼被編碼音訊的裝置、申請專利範圍第10項之編碼音訊的裝置、申請專利範圍第16項之解碼方法、申請專利範圍第18項之編碼方法或申請專利範圍第19項之電腦程式來達成。
基於本發明的發現,特別是對於包含瞬變部分之訊號,一改良品質以及降低的位元率經常發生於音源訊號裡,此音源訊號是藉由將時域雜訊塑形(TNS)或時域平鋪塑形(TTS)技術與較高頻率重建結合所產生。在編碼器側上的TNS/TTS處理是藉由一隨頻率變化之預測來重建音源訊號之時間包絡線所實現。依據此實現,亦即,當頻譜雜訊塑形濾波器在一頻率範圍內被決定時,不僅覆蓋了來源頻率範圍,且目標頻率範圍在一頻率再生解碼器中被重建,此頻譜包絡線不僅被施加於核心音源訊號直到上升到一間隙填充開始頻率,且此頻譜包絡線也被施加於重建第二頻譜部分之頻譜範圍。因此,如果頻譜平鋪塑形沒有被降低或消除,將會出現預回音以及後回音。在核心頻率範圍上升到一特定間隙填充開始頻率內,以及在 核心頻率範圍上之一頻率範圍內,藉由施加一隨頻率變化之反向預測可完成頻譜平鋪塑形之降低或消除。在此,在施加一隨頻率變化之預測之前,頻率再生或頻率頻鋪的產生是在編碼器側上所執行。然而,隨頻率變化之預測可以在頻譜包絡線塑形之前或之後被施加,在包絡線塑形之前,此頻譜包絡線塑形取決於能量資訊估計是否已經執行於填充的(或全部的)頻譜值之後的頻譜剩餘數值。
隨至少一頻率平鋪變化的TTS額外地建立一連續相關性,此連續相關性在來源範圍與重建範圍之間或是在兩個相鄰重建範圍或是頻率平鋪內。
在較佳地一實施例裡係使用複數個TNS/TTS濾波器。從而,避免一嚴格取樣的實數表現之(頻譜)假造物,像是例如MDCT。藉由施加一修改型離散餘弦轉換以及一修改型離散正弦轉換,一複數TNS濾波器可以在編碼器側上被估計,此外,取得一複數修改型離散轉換。然而,僅有修改型離散餘弦轉換值,亦即複數轉換之實部被傳遞。然而,在編碼器側上,使用先前或之後訊框之MDCT頻譜之虛部有可能被估計,使得在編碼器側上,複數濾波器可以再次施加於隨頻率變化之反向預測,且值得注意的是,在來源範圍與重建範圍之間,以及在重建範圍內之頻率上相近的頻率平鋪之間,預測皆隨著頻率邊界而改變。
進一步來說,基於如下發現,一方面有關頻寬延伸之分離的問題,以及另一方面有關核心編碼的問題,能夠藉由在與核心解碼器運作的相同頻譜域裡來執行頻寬延伸而加以克服。因此,一全部比率核心解碼器被提供來編碼及解碼全部的音源訊號範圍。在編碼器側上的一降取樣的需求以及在解碼器端上的一升取樣的需求在此為不必要的。取代地是,此整體處理是執行在全部取樣率或是在全部頻寬域裡。為了取得一高編碼增益,分析此音源訊號用以尋找可與一高解析度進行編碼的第一組第一頻譜部份,在一實施例中,此第一組第一頻譜部份可以包括音源訊號的音調部份。另一方面,在所述音源訊號的非音調元件或雜訊元件構成一第二組第二頻譜部份,此第二組第二頻譜部份是由低頻譜解析度進行參數化編碼。此編碼的音源訊號僅需要在一具有高頻譜解析度的波形維護方式裡被執行編碼的第一組第一頻譜部份,此外,第二組第二頻譜部份是由一低解析度 進行參數化編碼,此低解度是源自於第一組的頻率"平鋪"。在解碼器側上,此核心解碼器,為一全部頻帶解碼器,在一波形維護方式裡不需任何額外的頻率再生資訊即可再建此第一組第一頻譜部份,然而,如此的再生頻譜會產生許多的頻譜間隙。這些間隙之後會被此發明之智能間隙填充(Intelligent Gap Filling,IGF)技術所填充,此技術是使用一頻率再生,其一方面應用參數化資料,另一方面使用一來源頻譜範圍,此來源頻譜範圍即如由全部比率音源解碼器再建之第一頻譜部份。
在進一步的實施例中,頻譜部份構成一第三組第三頻譜部份,此頻譜部份是僅由雜訊填充而再建,而非由頻寬複製或者由頻率平鋪填充所再建。基於以下的事實,即一方面對於核心編碼/解碼運作在一單一領域裡的編碼概念,以及另一方面的頻率再生,此IGF不僅侷限於去填充一較高頻率的範圍,亦可填充較低頻率的範圍,亦即若不是透過頻率再生而填充雜訊,便是在不同頻率範圍處使用一頻率平鋪的頻率再生。
此外,其處強調的是,在頻譜能量上的一資訊、在個體能量上的一資訊或是一個體能量資訊、一生存能量上的一資訊或是一生存能量資訊、一平鋪能量上的一資訊或是一平鋪能量資訊、或是在一遺失能量上的一資訊或是一遺失能量資訊可以不僅包含一能量數值,亦可以包含從一最後能量數值所衍生的一(絕對)振幅數值、一層級數值或任何其他數值。因此,在一能量上的資訊可以包含能量數值本身,及/或一層級及/或一振幅及或/一絕對振幅的一數值。
進一步的說明,根據此發現,相關性情況不僅對於來源範圍極為重要,其對於目標範圍亦十分地重要。此外,本發明得知不同相關性之情況可以發生在來源範圍和目標範圍內的情況舉例來說,當具有高頻率雜訊的一語音訊號被考慮到時,此情況可以是此低頻率頻帶包含具有一音訊外小數值的語音訊號,當揚聲器置放於中間時,此語音訊號在左聲道及右聲道裡為高度相關的,然而,此高頻率部分可以是強烈的不相關的,由於這樣的事實,有可能是在左側端一個不同的高頻率雜訊與另一個在右側端的高頻率雜訊進行比較,或者是根本在右側端沒有高頻率雜訊可進行比較。如此一來,當一直接的間隙填充操作被執行來忽略此種情況時,然而此高頻率部分也將為相關性的,且在再建訊號裡可能會產生嚴重的空間隔 離假造物。為了強調此議題,針對一再建頻帶的參數化資料,或者是一般地,使用一第一組第一頻譜部份來再建第二組第二頻譜部份,且對於第二頻譜部份或是再建頻道,第二組第二頻譜部份被計算來識別一第一或一第二之不同的雙聲道表現,在編碼器側上,一個雙聲道識別係針對所述第二頻譜部份被加以計算的,對於此第二頻譜部份,再建頻帶之能量資訊是被加以計算的。然後在解碼器側上的一頻率再生器係依據第一組第一頻譜部份之一第一部份產生一第二頻譜部份,即對於第二部分之來源範圍以及參數化資料,如頻譜包絡線資訊或是任何其他的頻譜包絡線資料,另外針對第二部分相依於所述雙聲道識別,如在再建下之再建頻帶。
較佳地,對於每一再建頻帶,此雙聲道識別可被視為一標記來傳送,此資料是從一編碼器傳送至一解碼器,然後此解碼器解碼此核心訊號即如對於核心頻帶之計算標記。然後,在一實施中,此核心訊號儲存在兩個立體聲表現(如,左邊/右邊及中間/側),以及,對於此IGF頻率平鋪填充,如目標範圍,由此雙聲道識別針對智能填充或是再建頻帶指出此來源平鋪表現被選擇以適應目標平鋪表現。
在此要強調的是,此程序不僅可作用於立體聲訊號,如一左聲道及右聲道,亦可作用於多聲道訊號。在多聲道訊號的案例中,不同聲道的數個配對可以以一左及右聲道視為一第一配對,一左環繞聲道以及一右環繞聲道視為一第二配對,一中間聲道以及一LFE聲道視為第三配對,其他的配對可以為更高的輸出聲道格式,如7.1聲道、11.1聲道等等。
另外一方面係基於發現,在音源品質內的特定劣化可藉由施加一訊號自適應頻率平鋪填充方案進行補正。在此,在編碼器側上的一分析被執行,以得知一特定目標區域候選的最佳匹配的來源區域。一匹配資訊同時識別一目標區域的一特定來源區域以及選擇性第一些額外的資訊,且此匹配資訊被產生以及作為解碼器的輔助資訊傳遞。解碼器接著使用匹配資訊,以應用一頻率平鋪填充操作。在此,解碼器從傳送的數據流或數據檔案讀取匹配資訊,且存取來源區域所定義一特定再建頻帶,如果被指定匹配資訊,解碼器額外地執行此來源區域數據的一些處理,以產生再建頻帶的原始頻譜數據。接著,為了在最後取得一再建頻帶,頻率平鋪填充操作之結果,亦即再建頻帶的原始頻譜數據,係被使用頻譜包絡線資訊進 行塑形,其中此再建頻帶包含第一頻譜部分,例如音調部分。然而,這些音調部分並不是藉由自適應平鋪填充方案產生,但這些第一頻譜部分係直接地藉由音源解碼器或核心解碼器輸出。
自適應頻譜平鋪選擇方案可與一較低總粒度操作。在本實施例中,一來源區域通常被細分成重疊的來源區域以及目標區域,或是由非重疊頻率目標區域所給定之再建頻帶。接著,在編碼器側決定在每個來源區域以及每個目標區域之間的相似度,且一來源區域與目標區塊的最佳匹配對係藉由匹配資訊識別,且在解碼器側上,來源區域識別用以產生再建頻帶之原始頻譜數據的匹配資訊。
為了取得一較高總粒度,每個來源區域被允許移動以取得有最高的相似度的一特定延遲。此延遲可以精細到如一個頻率窗,且允許在一來源區域以及目標區域之間有一較佳的匹配。
此外,除了僅識別一較佳匹配對,這些相關性延遲也可在匹配資訊內被傳遞,且額外地,甚至一個符號可以被傳遞。當符號在編碼器側上被決定為負值時,接著一相對應的符號標記也可以在匹配資訊內被傳遞,且在編碼器側上,複數個來源區域頻譜值與“-1”相乘或是在一複數表現內被“旋轉”180度。
本發明之另一實施例係應用一平鋪白化操作。一頻譜白化移動至粗略的頻譜包絡線資訊且強調頻譜精細結構,此頻譜精細結構最主要是用以計算平鋪相似度。因此,在計算一交越測量相關性之前,在一方面的一頻譜平鋪及/或在另一方面的來源訊號被白化。當僅有平鋪被使用一預處理白化時,一傳遞的白化標記指出解碼器其相同的預白化處理將被應用到IGF裡的頻譜平鋪。
關於平鋪選擇性,較佳的是係藉由轉換窗的一個整數,使用相關性的標記以在頻譜上作偏移。頻譜偏移基於基本的轉換可能需要額外的相關性。在奇數延遲的情況中,平鋪係額外地被乘上-1/1之一交替時間順序的調變,以補償在MDCT內的每個其他頻帶的頻率反轉表現。此外,當產生頻率平鋪時,相關性結果的標記被應用。
此外,對於相同的再建區域或目標區域,應當避免假造物由快速變化的來源區域產生,較佳的是使用平鋪縮減及穩定性來確定。在此, 在不同定義的來源區域之間的一相似度分析被執行,且當一來源平鋪與其他的來源平鋪之相似度高於一門檻值時,因與其他的來源平鋪有很高的關聯性,此來源平鋪接著可從此組潛在來源平鋪中去除。此外,作為一種平鋪選擇穩定性,如果沒有任何來源平鋪在目前訊框,較佳的是從先前訊框保持平鋪次序,此目前訊框(最佳為大於一給定門檻值)係關聯於在目標訊框內的目標平鋪。
音源編碼系統可有效地在寬範圍位元率裡編碼任意之音源訊號。然而,針對高位元率,本發明的系統係收斂於通透性,即對於低位元率的感知厭煩即被最小化。因此,可用位元率之主要分享被用於在編碼器裡的波形編碼與感知最相關的結構訊號,且此造成之頻譜間隙將在解碼器裡用近似於原始頻譜的訊號內容加以填充。一個非常有限的位元預算被消耗來控制驅動所謂的頻譜智能間隙填充(Intelligent Gap Filling,IGF)參數,此頻譜智能間隙填充係從編碼器到解碼器所發送之專用輔助信息。
99‧‧‧編碼音源訊號、音源訊號、音源輸入訊號、訊號、時間域音源訊號、音訊數據、輸入音源訊號
100‧‧‧時間頻譜轉換器
101‧‧‧頻譜表現、頻譜、頻譜分析器
102‧‧‧頻譜分析器、分析器
103‧‧‧第一組第一頻譜部分
104‧‧‧參數化編碼器、參數計算器/參數化編碼器
105‧‧‧第二組第二頻譜部分
106‧‧‧頻譜域音源編碼器、頻譜域編碼器、頻率再生器
107‧‧‧第一編碼表現
108‧‧‧位元流形成器、方塊、位元流多工器
109‧‧‧第二編碼表現、線
112‧‧‧方塊、頻譜域解碼器、頻譜域音源解碼器
114‧‧‧參數化解碼器、方塊
116、604、806、906、1106、1107‧‧‧頻率再生器
117、203、1019、1300‧‧‧線
118‧‧‧頻譜時間轉換器
119‧‧‧時域表示
200‧‧‧解多工器/解碼器
202‧‧‧IGF方塊、IGF
204‧‧‧聯合聲道解碼方塊、聯合聲道解碼、聯合聲道解碼器
206‧‧‧音調遮罩方塊、音調遮罩
208‧‧‧組合器、區塊
210‧‧‧方塊、逆TNS、反向預測濾波器
212‧‧‧合成濾波器組、區塊、頻率時間轉換器
220‧‧‧分析濾波器組
222‧‧‧TNS方塊、方塊、分析濾波器組、TNS
224‧‧‧方塊、IGF參數抽取編碼
226‧‧‧音調遮罩方塊、頻譜分析器/音調遮罩、頻譜分析器、音調遮罩
228‧‧‧聯合聲道編碼、聯合聲道編碼方塊、核心編碼器、聯合聲道編碼器
230‧‧‧位元流多工器
232‧‧‧熵編碼器
302‧‧‧編碼音調部分
304、305、306‧‧‧高解析度頻譜成分、編碼音調部分、頻譜部分、第一頻譜部分
307‧‧‧高解析度頻譜成分、編碼音調部分、頻譜部分、第一頻譜部分、諧波
307a、307b‧‧‧第二頻譜部分
309‧‧‧IGF開始頻率、間隙填充開始頻率、智慧型填隙開始頻率、IGF起始頻率
390‧‧‧再建頻率
391‧‧‧頻率錯誤
400‧‧‧倍率因子計算器
401‧‧‧頻譜範圍
402‧‧‧心理聽覺模型
404‧‧‧量化處理器
410、418、422‧‧‧設零方塊、方塊、設零
412‧‧‧方塊、加權方塊、倍率因子加權
420‧‧‧量化器方塊、量化器
424‧‧‧頻譜分析器、頻譜分析器例如音調偵測器
502‧‧‧設窗器
504‧‧‧瞬變偵測器
506‧‧‧區塊轉換器、區塊
510‧‧‧訊框建立器/調整器區塊、訊框建立器/調整器、區塊
512‧‧‧區塊、逆區塊轉換/內插
514‧‧‧區塊、合成設窗
516‧‧‧區塊、對先前時間訊框執行重疊/相加
522‧‧‧區塊、頻率平鋪產生器
523‧‧‧頻譜成分、原始第二部分
524‧‧‧訊框建立器
526‧‧‧調整器
527‧‧‧增益參數
528‧‧‧增益參數計算器
602‧‧‧頻譜域音源解碼器
603‧‧‧頻譜預測殘餘數值、殘餘數值
606‧‧‧頻譜預測濾波器、頻譜反向預測濾波器、反向預測濾波器、步驟
607‧‧‧濾波器資訊、線、預測濾波器資訊、來自數據串流之濾波器資訊
612‧‧‧頻率平鋪產生器
614‧‧‧頻譜塑形器、頻譜包絡線塑形器
616‧‧‧頻譜預測濾波器、反向預測濾波器、步驟
620‧‧‧頻率平鋪產生器
622‧‧‧頻譜預測濾波器、反向預測濾波器
624‧‧‧區塊、頻譜塑形操作、頻譜包絡線塑形
702‧‧‧複數MDCT區塊、時間頻譜轉換器、CMDCT、區塊
704‧‧‧預測濾波器、心裡聽覺驅動音源編碼器、TTS濾波器、TTS區塊、TTS
706‧‧‧區塊、IGF編碼器、參數化編碼器、分析器
708‧‧‧心理聽覺模型、音源編碼器
710‧‧‧位元串流多工器、輸出介面
712‧‧‧IGF輔助資訊
714‧‧‧TTS輔助資訊、濾波器資訊、預測濾波器資訊
720‧‧‧解多工器
724‧‧‧區塊、估計器、MDCT→MDST
726‧‧‧IGF解碼器
728‧‧‧反向TTS操作、逆向TTS、反向預測濾波器
730‧‧‧區塊、反向複數MDCT、頻率時間轉換器
750‧‧‧擴大部份、頻譜部份
802‧‧‧音源解碼器、輸出區塊
804‧‧‧參數解碼器
812、814、816、820‧‧‧步驟
818、822‧‧‧步驟、區塊
824‧‧‧訊號流
830‧‧‧核心解碼器、來源範圍解碼器、來源範圍(核心)解碼器
832‧‧‧方塊、區塊、表現轉換器
833‧‧‧來源範圍ID
834‧‧‧儲存體、對於表現以及來源範圍之儲存體、方塊
835‧‧‧雙聲道ID、目標範圍之雙聲道ID、每頻帶的雙聲道ID
836‧‧‧方塊、區塊、頻率平鋪產生器、頻率平鋪產生
838‧‧‧方塊、包絡線調整者、包絡線調整器
840‧‧‧方塊、參數轉換器
842‧‧‧方塊、表現轉換器、輸出區塊
844‧‧‧訊號流、分開表現
846‧‧‧方塊、區塊、進一步處理、進一步處理(如頻率時間轉換)
860‧‧‧時間頻譜轉換器、頻譜分析器
861‧‧‧控制線
862‧‧‧頻帶化轉換器、雙聲道分析器、時間頻譜轉換器
864‧‧‧雙聲道分析器
866、1004‧‧‧頻譜分析器
868‧‧‧參數編碼器、區塊
870‧‧‧核心編碼器、區塊
872‧‧‧輸出介面、輸出界面
873‧‧‧編碼訊號
900‧‧‧音源解碼器
901a‧‧‧第一組第一頻譜部分、第一組第一頻譜部分之編碼表現、控制數據
901b‧‧‧參數數據之編碼表現、編碼音源訊號
902‧‧‧解碼參數數據、第二頻譜部分參數
904‧‧‧第一組第一頻譜部分、線、第一頻譜部分參數
908‧‧‧時間或頻率分群數據
912‧‧‧計算器、區塊、殘留能量計算器
914‧‧‧計算器、消失能量計算器
916‧‧‧頻譜包絡線調整器、區塊
918‧‧‧計算器、區塊、平鋪能量計算器、判斷
920‧‧‧再建頻帶
921‧‧‧第一頻譜部分、再建頻帶中的第一頻譜部分
922、923‧‧‧第二頻譜部分、頻率頻帶、頻譜部分、區塊、頻帶、調整頻譜值、再建頻帶中的再建以及調整第二頻譜部分
940‧‧‧再建頻帶、逆縮放方塊、逆縮放
941‧‧‧線、再建頻帶中的第一頻譜部分、再建頻帶
942‧‧‧包絡線調整器/計算器
943‧‧‧再建頻帶的能量資訊
1002‧‧‧時間/頻譜轉換器、方塊
1006‧‧‧參數計算器
1007‧‧‧線、再建的第二組頻譜部分
1008‧‧‧音源編碼器、核心或音源編碼器
1012‧‧‧正規化器、正規化器適用於不同頻寬
1014‧‧‧能量數值計算器
1016‧‧‧方塊、計算兩個鄰近頻帶的能量數值
1018‧‧‧方塊、比較鄰近頻帶的能量數值
1020‧‧‧方塊、產生用於兩個頻帶的單一(正規化)數值
1024‧‧‧編碼器位元率控制
1101‧‧‧第一輸入、第一頻譜部分
1102‧‧‧音源解碼器、音源(核心)解碼器
1103‧‧‧參數資訊、第二輸入
1104‧‧‧參數化解碼器
1108‧‧‧頻譜時間轉換器
1119‧‧‧來源範圍延遲
1120‧‧‧區塊
1121‧‧‧來源範圍ID
1122‧‧‧白化濾波器、區塊
1123‧‧‧白化標記、白化、開關
1124‧‧‧開關
1125‧‧‧白化標記
1126‧‧‧旁通線
1128‧‧‧區塊、頻譜包絡線調整
1130‧‧‧時間頻譜轉換器
1132‧‧‧頻譜分析器
1134‧‧‧參數計算器、參數化計算器、計算來源/目標範圍相似度之參數計算器
1136、1312‧‧‧核心編碼器
1140‧‧‧交越相關計算器、區塊、交越相關性計算器
1142‧‧‧區塊、來源/目標範圍白化
1144‧‧‧平鋪選擇器
1146‧‧‧來源平鋪縮減、來源平鋪修剪
1148‧‧‧記憶體、儲存最後訊框之來源平鋪之記憶體
1302‧‧‧低通濾波器、低通
1304‧‧‧高通濾波器、高通
1306‧‧‧參數器、擷取器、編碼器、參數提取器
1308‧‧‧位元流多工器
1310‧‧‧降取樣器
1320‧‧‧位元流解多工器
1322‧‧‧核心解碼器
1324‧‧‧參數器、解碼器、參數解碼器
1325‧‧‧升取樣器
1326‧‧‧濾波器組
1330‧‧‧高頻再建器
E1、E2‧‧‧能量資訊值、能量資訊
E3‧‧‧能量資訊值、能量資訊、能量數值
E4‧‧‧能量資訊值、能量資訊、能量
SCB、SCB 1、SCB2、SCB3、SCB4、SCB5、SCB6、SCB7‧‧‧倍率因數頻帶、倍率因數、倍率因子頻帶
SF4、SF5、SF6、SF7‧‧‧倍率因數
NF2‧‧‧雜音填充能量
第1a圖係繪示用於編碼一音源訊號的裝置。
第1b圖係繪示與第1a圖之編碼器相匹配的解碼器,其用於解碼一編碼音源訊號。
第2a圖係繪示解碼器之較佳實現方式。
第2b圖係繪示編碼器之較佳實現方式。
第3a圖係繪示由第1b圖之頻譜域解碼器產生的頻譜之示意表現圖。
第3b圖係繪示一代表複數個倍率因數頻帶之倍率因數以及用於雜訊填充頻帶之再建頻帶語雜訊填充資訊的能量之間的關係的表格。
第4a圖係繪示將所選之頻譜部分施加於第一組與第二組頻譜部分的此頻譜域編碼器之功能方塊圖。
第4b圖係繪示第4a圖之功能之實現方式之方塊圖。
第5a圖係繪示MDCT編碼器之功能方塊圖。
第5b圖係繪示具有MDCT技術的解碼器之功能方塊圖。
第5c圖係繪示此頻率再生器之實現。
第6a圖繪示具有時域雜訊塑形/時域平鋪塑形功能之一音源編碼器。
第6b圖繪示具有時域訊號塑形/時域平鋪塑形技術之一解碼器。
第6c圖繪示具有一不同順序之頻譜預測濾波器以及頻譜塑形器之時域雜訊塑形/時域平鋪塑形功能之功能圖。
第7a圖繪示時域平鋪塑形(TTS)功能之一實施方式。
第7b圖繪示一解碼器之實施例以匹配第7a圖所實施方式之編碼器。
第7c圖繪示不具有TTS之一原始訊號與一擴大訊號之一頻譜圖。
第7d圖繪示一頻率表現以呈現在智能間隙填充頻率以及時域平鋪塑形能量之間的對應關係示意圖。
第7e圖繪示具有TTS之一原始訊號與一延伸訊號之一頻譜圖。
第8a圖繪示具有頻率再生的一雙聲道解碼器。
第8b圖繪示一表格以呈現來源/目的範圍之不同組合。
第8c圖繪示在第8a圖中具有頻率再生器之雙聲道解碼器之功能流程圖。
第8d圖繪示第8a圖中解碼器之詳細實現方式。
第8e圖繪示一編碼器對雙聲道之實施方式,係使第8a圖之解碼器對此雙聲道進行解碼處理。
第9a圖係繪示針對再生頻率範圍使用能量值,具有頻率再生技術的解碼器。
第9b圖係繪示第9a圖之頻率再生器之更詳細的實現方式。
第9c圖係繪示第9b圖之功能示意圖。
第9d圖係繪示第9a圖之解碼器之另一實現方式。
第10a圖係繪示與第9a圖之解碼器相匹配的編碼器之方塊圖。
第10b圖係繪示第10a圖之參數計算器之另一功能的方塊圖。
第10c圖係繪示第10a圖之參數化計算器之另一功能的方塊圖。
第10d圖係繪示第10a圖之參數化計算器之另一功能的方塊圖。
第11a圖繪示對於在解碼器裡之頻譜平鋪操作具有一特定來源範圍識別的解碼器。
第11b圖繪示第11a圖中頻率再生器之功能圖。
第11c圖繪示與第11a圖之解碼器共同使用之一編碼器。
第11d圖繪示第11c圖之參數計算器之實施方式之方塊圖。
第12a圖及第12b圖繪示一頻率剪影以呈現一來源範圍以及一目標範圍。
第12c圖繪示兩訊號之相關性一情節舉例。
第13a圖係繪示具有頻寬延伸的習知編碼器。
第13b圖係繪示具有頻寬延伸的習知解碼器。
第1a圖繪示一編碼音源訊號99的裝置。音源訊號99係輸入至時間頻譜轉換器100用以將具有取樣率的音源訊號轉換成時間頻譜轉換器所輸出的頻譜表現101。頻譜101係輸入至頻譜分析器102以分析其頻譜表現101。頻譜分析器101係用於判斷第一組第一頻譜部分103,其待編碼成第一頻譜解析度,以及不同的第二組第二頻譜部分105,其待編碼成第二頻譜解析度。第二頻譜解析度係小於第一頻譜解析度。第二組第二頻譜部分105係輸入至參數計算器或是參數化編碼器104,用以計算具有第二頻譜解析度的頻譜包絡線資訊。此外,頻譜域音源編碼器106係用於產生具有第一頻譜解析度之第一組第一頻譜部分的第一編碼表現107。此外,參數計算器/參數化編碼器104係用於產生第二組第二頻譜部分之第二編碼表現109。第一編碼表現107以及第二編碼表現109係輸入至位元流多工器或是位元流形成器108(即方塊108),最後輸出編碼音源訊號以傳送,或是儲存在儲存裝置上。
通常,第一頻譜部分(例如第3a圖之306)將由兩個第二頻譜部分(例如307a與307b)所環繞。此並非HE AAC的情況,在此核心編碼器頻率範圍係頻帶受限。
第1b圖係繪示與第1a圖之編碼器相匹配的解碼器。第一編碼表現107係輸入至頻譜域音源解碼器112用於產生第一組第一頻譜部分的第一解碼表現,此解碼表現具有第一頻譜解析度。此外,第二編碼表現109係輸入至參數化解碼器114用於產生第二組第二頻譜部分之第二解碼表現,此第二組第二頻譜部分具有低於第一頻譜解析度的第二頻譜解析度。
解碼器更包含頻率再生器116,用以使用第一頻譜部分再生 一再建第二頻譜部分,其具有第一頻譜解析度。頻率再生器116係執行平鋪填充操作,即使用一平鋪或是第一組第一頻譜部分之一部分,並將第一組第一頻譜部分複製到重建範圍或具有第二頻譜部分的再建頻帶中。頻率再生器116係通常執行頻譜包絡線塑形或是由參數化解碼器114輸出的第二解碼表現所標示的另一操作,即使用第二組第二頻譜部分上的資訊。解碼的第一組第一頻譜部分以及再建的第二組頻譜部分,其標示在線117上之頻率再生器116之輸出,係輸入至頻譜時間轉換器118用於將第一解碼表現以及再建第二頻譜部分轉換成一時域表示119,其具有特定的高取樣率。
第2b圖係繪示第1a圖之編碼器的實現方式。音源輸入訊號99係輸入至對應於第1a圖之時間頻譜轉換器100的分析濾波器組220。然後,TNS方塊222係執行時域雜訊塑形操作。因此,當沒有使用時域雜訊塑形/時域平鋪塑形操作,輸入至對應於第2b圖之音調遮罩方塊226的第1a圖之頻譜分析器102可以是全部頻譜值中的任一個;當使用如第2b圖所繪示的方塊222之TNS操作時,該輸入可為頻譜剩餘數值。針對雙聲道訊號或是多聲道訊號,可另外執行聯合聲道編碼228,所以第1a圖之頻譜域編碼器106可包含此聯合聲道編碼方塊228。此外,熵編碼器232係執行無損漏數據壓縮,且其亦為第1a圖之頻譜域編碼器之一部分。
頻譜分析器/音調遮罩226係將TNS方塊222之輸出分離成核心頻帶以及對應於第一組第一頻譜部分103的音調成分,以及對應於第1a圖之第二組第二頻譜部分105的剩餘成分。標示為IGF參數抽取編碼的方塊224係對應第1a圖之參數化編碼器104,而位元流多工器230係對應第1a圖之位元流多工器108。
較佳地,分析濾波器組222係以MDCT(修改型離散餘弦轉換濾波器組)來實現,而此MDCT係以修改型離散餘弦轉換作為頻率分析工具,將訊號99轉換成時間頻率域。
較佳地,頻譜分析器226係使用一音調遮罩。音調遮罩估算級係用於區分訊號中的音調成分以及類雜訊成分。此讓核心編碼器228可將所有的音調成分與一心理聽覺模組進行編碼。音調遮罩估算級可實現在多個不同的方式,而較佳地係實現與正弦軌估算級的功能相似,此正弦軌 估算級係用於語音/音源編碼(如文獻[8,9]所述)的正弦以及雜訊模組化,或是與以HILN模型為基礎的音源編碼器的功能相似,如文獻[10]所述。較佳地,使用一實現方式容易實現且不須維持增銷軌,但是可使用任何其他音調偵測器或是雜訊偵測器。
IGF模組係計算存在於來源區域以及目標區域之間的相似性。目標區域將由來自來源區域的頻譜來表現。來源區域以及目標區域之間的相似性之測量係使用交叉相關性方法來完成。目標區域係劃分成nTar未重疊頻率平鋪。針對目標區域內的每一平鋪,從一固定開始頻率創建nSrc來源平鋪。這些來源平鋪係依0以及1之間的參數來重疊,其中0表示0%重疊,而1表示100%重疊。每一來源平鋪係在各種延遲與目標平鋪進行相關計算,以發現與目標平鋪最匹配的來源平鋪。最匹配的平鋪值係儲存成tileNum[idx_tar],目標區域最相關的延遲係儲存成xcorr_lag[idx_tar][idx_src],以及相關性之符號係儲存成xcorr_sign[idx_tar][idx_src]。在高度負相關之情形中,在解碼器進行平鋪填充處理之前來源平鋪必須先乘-1。因為使用音調遮罩保存音調成分,所以IGF模組亦小心不重寫頻譜中的音調成分。帶狀能量參數係用於儲存目標區域之能量,致使能精確地重建頻譜。
此方法優於古典的SBR[1]的優點在於,核心編碼器能保存多音調訊號之諧波網格,而僅複數個正弦波之間的間隙填充來自來源區域之最匹配的“塑形雜訊”。相比於ASR(精確頻譜替換)[2-4],此系統之另一優點在於欠缺一訊號合成級,其在解碼器中產生訊號之重要部分。取而代之地,此任務由核心編碼器接管,以維持頻譜之重要成分。所建議系統之另一優點係特徵提供的連續的可量測性。對於每一平鋪,僅使用tileNum[idx_tar]以及xcorr_lag=0,其被稱為總粒度匹配,且當做為每一平鋪之變數xcorr_lag時,可用於低位元率,使得能較佳地匹配目標頻譜以及來源頻譜。
此外,建議使用平鋪選擇穩定化技術,以移除頻率域假造物,例如三連雜音或音樂雜音。
在一對立體聲道之情形中,使用額外的聯合立體聲處理。此係必要的,因為對於特定的目的範圍,此訊號可為一相關性高的音源。在 為特别區域選擇的來源區域非良好相關之情形中,雖然能量係匹配此目的區域,但此空間影像可能由於此非相關來源區域而受損。編碼器係分析每一個目的區域能量頻帶,通常執行頻譜值之一交叉相關性,且如果超過特定的門檻值,則為此能量頻帶設定聯合旗標。在此解碼器中,如果未設定聯合立體聲旗標,則個別地處理左聲道與右聲道能量頻帶。在設定聯合立體聲旗標之情形中,能量以及修補兩者係在聯合立體聲領域中執行。IGF區域的聯合立體聲資訊係訊號化,且與核心編碼之聯合立體聲資訊相似,如果預測之方向係從降混到剩餘,則此核心編碼含有指示預測之情形的旗標;亦可反向操作。
此能量可從L/R領域中所傳送的能量來計算:midNrg[k]=leftNrg[k]+rightNrg[k];sideNrg[k]=leftNrg[k]-rightNrg[k];其中,k為轉換領域的頻率參數。
另一解決方案係在聯合立體聲領域中針對頻帶直接計算以及傳送能量,在此頻帶中聯合立體聲係活躍的,所以在解碼器側不需要額外的能量轉換。
此來源平鋪總是根據此中間/側矩陣來創建:midTile[k]=0.5.(leftTile[k]+rightTile[k])
sideTile[k]=0.5.(leftTile[k]-rightTile[k])
能量調整:midTile[k]=midTile[k]*midNrg[k];sideTile[k]=sideTile[k]*sideNrg[k];聯合立體聲->LR轉換:如果沒有編碼額外的預測參數:leftTile[k]=midTile[k]+sideTile[k]
rightTile[k]=midTile[k]-sideTile[k]
如果編碼額外的預測參數且如果訊號化方向係從中間往側邊:sideTile[k]=sideTile[k]-predictionCoeffmidTile[k]
leftTile[k]=midTile[k]+sideTile[k]
rightTile[k]=midTile[k]-sideTile[k]
如果訊號化方向係從側邊往中間:midTile1[k]=midTile[k]-predictionCoeffsideTile[k]
leftTile[k]=midTile1[k]-sideTile[k]
rightTile[k]=midTile1[k]+sideTile[k]
此處理係確保用於再生的平鋪與目的區域以及經淘選的目的區域為高度相關,即使來源區域不相關,但此結果左聲道以及右聲道仍然代表具相關性且經淘選的音源,以維護此種區域的立體聲影像。
換句話說,在此位元流中,傳送聯合立體聲旗標以表示是否將使用L/R或是M/S作為一般聯合立體聲編碼之舉例。在解碼器中,首先,核心訊號係解碼,其由核心頻帶之聯合立體聲旗標來標示。第二,核心訊號係儲存在L/R以及M/S表現。為了IGF平鋪填充,選擇來源平鋪表現以配合此目標平鋪表現,其由IGF頻帶之聯合立體聲資訊來標示。
時域雜訊塑形(TNS)係為一標準技術,且為AAC(如文獻[11-13]所述)的一部分。TNS被認為是感知編碼器之基本機制的延伸,在濾波器組以及量化級之間插入一可選擇的處理步驟。TNS模組之主要任務係隱藏在瞬變(像是訊號)之時域遮蔽區域中所製造的量化雜音,如此可導致更高效率的編碼機制。首先,TNS使用“向前預測”在轉換領域(例如MDCT)計算一組預測係數。然後,這些係數用於平坦化訊號之時域包絡線。當量化影響TNS所濾波的頻譜,量化雜音亦暫時地平坦。在解碼器側上使用逆TNS濾波,根據TNS濾波器之時域包絡線塑形量化雜音,因此量化雜音短暫的被遮蔽。
IGF係基於MDCT表現。為高效率的編碼,較佳地,必須使用大約20毫秒之長區塊。如果在此種長區內的訊號包含瞬變訊號,由於平鋪填充,在IGF頻譜帶中可聽見的預回音以及後回音。第7c圖顯示在IGF的瞬變撞擊之前的典型預先回音效果。在左側上,係顯示原始訊號之頻譜圖,在右側上顯示没有TNS濾波的頻寬延伸訊號之頻譜圖。
在IGF的鄰近關係中使用TNS以降低預回音效果。在此,當解碼器中的頻譜再生在TNS剩餘訊號上執行時,TNS係作為一時域平鋪塑形(TTS)工具。通常,使用編碼器側上的全部頻譜來計算以及使用所需要的TTS預測係數。TNS/TTS開始頻率以及停止頻率不受IGF工具之IGF開 始頻率f IGFstart 的影響。相比於傳統的TNS,TTS停止頻率係增加至IGF工具之停止頻率,其係高於f IGFstart 。在解碼器側上,TNS/TTS係數係再次應用於全部頻譜上,即核心頻譜加上再生頻譜加上來自音調圖的音調成分(參見第7e圖)。必須使用TTS以形成再生頻譜之時域包絡線,以再次匹配原始訊號之包絡線。如此可降低所顯示的預先回音。此外,其仍然對低於f IGFstart 的訊號進行塑形量化雜音,如同TNS。
在傳統的解碼器中,音源訊號上的頻譜修補造成修補邊界上的頻譜相關性惡化,從而引進分散影響音源訊號之時域包絡線。因此,在剩餘訊號上執行IGF平鋪填充的另一好處是,在使用塑形濾波器之後平鋪邊界係無縫相關,導致訊號有更忠實的時域再現。
在本發明的編碼器中,除了音調成分之外,高於IGF開始頻率的訊號沒有經歷TNS/TTS濾波、音調遮罩處理以及IGF參數估算的頻譜。核心編碼器使用演算編碼以及預測編碼之原理來編碼此稀疏頻譜。這些編碼成分隨著訊號化位元而形成此音源之位元流。
第2a圖繪示相對應的解碼器實現方式。在第2a圖中的位元流對應於編碼音源訊號,且輸入至解多工器/解碼器,其係連接第1b圖之方塊112與114。位元流解多工器係將輸入音源訊號分離成第1b圖之第一編碼表現107以及第1b圖之第二編碼表現109。具有第一組第一頻譜部分的第一編碼表現係輸入至對應於第1b圖之頻譜域解碼器112的聯合聲道解碼方塊204。第二編碼表現係輸入至參數化解碼器114(第2a圖未繪示),然後輸入至對應於第1b圖之頻率再生器116的IGF方塊202。頻率再生所需的第一組第一頻譜部分係經由線203輸入至IGF方塊202。此外,在聯合聲道解碼204之後,在音調遮罩方塊206使用特定的核心解碼,使得音調遮罩206之輸出能對應頻譜域解碼器112之輸出。然後,組合器208執行結合,即組合器208輸出之訊框架購現在具有全部範圍的頻譜,但是仍然在TNS/TTS濾波領域中。然後,在方塊210,使用線109提供之TNS/TTS濾波器資訊執行逆TNS/TTS操作,即TTS輔助資訊較佳地包含在頻譜域編碼器106(例如直接AAC或是USAC核心編碼器)所產生的第一編碼表現內;或是亦可包含在第二編碼表現內。在方塊210之輸出中,提供完整的到最高頻率的頻譜,其全部範圍頻率係由原始輸入訊號之取樣率所定義。然後, 在合成濾波器組212中執行頻譜/時間轉換,以最後取得音源輸出訊號。
第3a圖繪示此頻譜之示意表現。此頻譜係在倍率因數頻帶SCB細分,在第3a圖之繪示範例中倍率因數頻帶SCB有七個倍率因數頻帶SCB1至SCB7。倍率因數頻帶可為AAC標準所定義的AAC倍率因數頻帶,以及有增加頻寬至上頻率,如第3a圖所大略地繪示。較佳地,不從頻譜此開始處(即低頻處)執行智慧型填隙,但是在309所繪示的IGF開始頻率上開始IGF操作。因此,核心頻帶從最低頻率核心頻帶延伸至IGF開始頻率。高於IGF開始頻率,頻譜分析係用以區分高解析度頻譜成分304、305、306與307,以以及第二組第二頻譜部分所表現的低解析度成分。第3a圖係繪示例示性地輸入至頻譜域編碼器106或聯合聲道編碼器228的頻譜,即核心編碼器運作在全部範圍,但是編碼大量的零頻譜值,即這些零頻譜值量化成零,或是在量化之前或之後設定為零。不管怎樣,核心編碼器運作在全部範圍,彷彿是所繪示的頻譜一樣,即此核心解碼器不知道具有低頻譜解析度之第二組第二頻譜部分之任何智慧型填隙或是編碼。
較佳地,當僅計算每一個比例因數帶的單一頻譜值而定義第二解析度或是低解析度,此高解析度係由頻譜線(例如MDCT線)之線狀編碼來定義。其中一個比例因數帶係覆蓋幾個頻率線。如此,相對於頻譜解析度,第二低解析度係低於線狀編碼所定義的第一解析度或是高解析度許多。核心編碼器(例如AAC核心編碼器或是USAC核心編碼器)係通常使用線狀編碼。
第3b圖係繪示關於倍率因數或是能量計算之狀況。由於編碼器為核心編碼器,但本發明不受限於此,以及由於每一個頻帶中的第一組頻譜部分之成分,此核心編碼器係為每一個頻帶計算倍率因數,不僅在低於IGF開始頻率309的核心範圍,也在高於IGF開始頻率直到最高頻率f IGFstop 。最高頻率f IGFstop 係小於或等於取樣頻率之一半,即fs/2。如此,第3a圖之編碼音調部分302、304、305、306與307,以及此實施例中的倍率因數SCB1至SCB7係對應於高解析度頻譜數據。低解析度頻譜數據係從IGF開始頻率開始計算,且對應於能量資訊值E1、E2、E3與E4,其與倍率因數SF4至SF7一起傳送。
特別地,當核心編碼器係在低位元率之情況時,可額外使用 核心頻帶中的額外雜音填充操作,即比IGF開始頻率更低的頻率,即在倍率因數頻帶SCB1至SCB3。在雜音填充,其存在幾個已經量化成零的相鄰近頻譜線。在解碼器側上,這些量化成零的頻譜值係再合成,且使用雜音填充能量(例如第3b圖之308所繪示的NF2)調整再合成頻譜值之振幅。雜音填充能量,其可相對於USAC中的倍率因數而用絕對用語或是相對用語特別地給定,係對應於該組量化成零的頻譜值之能量。這些雜音填充頻譜線亦可被認為是第三組第三頻譜部分,其係使用來自來源範圍以及能量資訊E1、E2、E3與E4的頻譜值,使用來自用於再建頻率平鋪的其他頻率的頻率平鋪而直接雜音填充合成,沒有使用任何依賴頻率再生的IGF操作。
較佳地,用於能量資訊的此頻帶係與倍率因數頻帶相一致地計算在其他實施例中,使用能量資訊數值分群,例如倍率因數頻帶4以及5,使得僅傳送單一能量資訊數值,但是在此實施例中,分群再建頻帶之邊界係與倍率因數頻帶之邊界相一致。如果使用不同頻帶分隔,然後使用特定的再計算或是計算,此可依據特定的實現方式而能被理解。
較佳地,第1a圖之頻譜域編碼器106係為心理聽覺驅動編碼器,如第4a圖所繪示。通常,如MPEG2/4 AAC標準或是MPEG1/2所繪示,第3層標準,被轉換成頻譜範圍(第4a圖中的401)之後,待編碼的音源訊號係轉發至倍率因子計算器400。倍率因子計算器係由心理聽覺模型所控制,其另外接收此待量化的音源訊號或是接收(在MPEG 1/2第3層或是MPEG AAC標準)音源訊號之複值頻譜表現。心理聽覺模型係針對每一個比例因子帶計算代表心理聽覺門檻值的倍率因子。然後,由內部迭代以及外部迭代或是任何其他合適的編碼程序來調整倍率因子,以執行特定的位元率情況。然後,一方面待量化的頻譜值,以及另一方面所計算的倍率因子係輸入至量化處理器404。在直接音源編碼器操作中,待量化的頻譜值係由倍率因子加權,然後加權頻譜值係輸入至固定量化器(其通常具有壓縮功能)到上振幅範圍。然後,在量化處理器之輸出存在量化參數,其係轉發到熵編碼器,其通常對鄰近頻率值的一組零量化參數有特定且非常高效率的編碼,或是此技術領域中亦被稱為零數值之“執行(run)”。
然而,在第1a圖之音源編碼器中,量化處理器通常從頻譜分析器接收第二頻譜部分上的資訊。如此,量化處理器404係確保,在量 化處理器404之輸出,由頻譜分析器102識別出的第二頻譜部分係為零或是有由編碼器或是解碼器確認為零表示,其可為非常有效率的編碼,特別是當頻譜中存在零值的“執行”。
第4b圖繪示此量化處理器之一實現方式。MDCT頻譜值可輸入至一設零方塊410。然後,在方塊412執行倍率因子加權之前第二頻譜部分已經設定為零。在額外的實現方式,不提供方塊410,但是在加權方塊412之後在方塊418執行設零運作。在另一實現方式,設零操作亦可在量化器方塊420地量化之後,於設零方塊422執行。在此實現方式,將不出現方塊410以及418。通常,依據特定的實現方式來提供方塊410、418與422中的至少一個。
然後,在方塊422之輸出,對應於第3a圖中所繪示的取得量化頻譜。然後,量化頻譜係輸入至熵編碼器,例如第2b圖中的232,其可為一Huffman編碼器或是一演算編碼器,如USAC標準中所定義的。
設零方塊410、418與422係彼此可選擇地提供,或由頻譜分析器424平行控制。較佳地,頻譜分析器包含熟知的音調偵測器之任何實現方式,或包含任何不同種類的偵測器,其操作用於將頻譜分隔成高解析度之待編碼的成分以及低解析度之待編碼成分。在頻譜分析器中實現的其他演算法,可為聲音活動偵測器、雜音偵測器、語音偵測器或是任何其他依據不同頻譜部分之解析度需求上頻譜資訊或是相關聯的元數據而決定的偵測器。
第5a圖係繪示第1a圖之時間頻譜轉換器100較佳實現方式,例如以AAC或是USAC實現。時間頻譜轉換器100包含由瞬變偵測器504控制的設窗器(windower)502。當瞬變偵測器504偵測到一瞬變,然後從長視窗到短視窗的切換係訊號化到設窗器502。然後,設窗器502針對重疊區塊計算設窗的訊框,其中每一個設窗的訊框通常具有兩個N數值,例如2048數值。然後,執行在區塊轉換器506之內的轉換,而區塊轉換器通常另外提供一抽取(decimation),以執行結合的抽取/轉換以取得具有N個數值的頻譜訊框,例如MDCT頻譜值。如此,為了長窗操作,在區塊506之輸入的訊框包含兩倍N個數值,例如2048個數值,而一頻譜訊框具有1024個數值。然而,當執行八個短區塊且相比於長窗每一個短區塊具有1/8設窗 時間域數值,且相比於長區塊每一個頻譜區塊具有1/8頻譜值時,對短區塊執行切換。如此,當抽取與設窗器之50%重疊操作相結合時,此頻譜為時間域音源訊號99之嚴格取樣版本。
後續,參考第5b圖,其繪示第1b圖之頻率再生器116以及頻譜時間轉換器118,或是第2a圖之區塊208與212之結合操作之特定實現方式。在第5b圖,考量特定的再建頻帶,例如第3a圖之比例因子帶6。在再建頻帶中的第一頻譜部分,即第3a圖之第一頻譜部分306係輸入至訊框建立器/調整器區塊510。此外,為了比例因子帶6而再建的第二頻譜部分係一起輸入至訊框建立器/調整器510。此外,用於比例因子帶6的能量資訊,例如第3b圖之E3,亦輸入至區塊510。在再建頻帶中再建的第二頻譜部分已經由使用來源範圍的頻率平鋪填充產生,然後再建頻帶係對應目標範圍。現在,執行此訊框之能量調整,然後最終取得完整的具有N個數值的再建訊框,例如在第2a圖之組合器208之輸出取得。然後,在區塊512,執行逆區塊轉換/內插以取得248時間域數值,例如在區塊512之輸入上的124個頻譜值。然後,在區塊514執行一合成設窗操作,其由在編碼音源訊號中傳送作為輔助資訊之長窗/短窗指示再次控制。然後,在區塊516,對先前時間訊框執行重疊/相加操作。較佳地,MDCT係使用50%重疊,而為了每一個新的2N個數值的時間訊框,最後輸出N個時間域數值。由於在區塊516中重疊/相加操作,從一訊框到下一個訊框提供臨界取樣以及連續交越點,較佳的是50%重疊。
如第3a圖中的301所繪示,不僅在低於IGF開始頻率下另外使用雜音填充操作,但亦可高於IGF開始頻率,例如為考量再建頻帶與第3a圖之比例因子帶6相一致。然後,雜音填充頻譜值亦可輸入至訊框建立器/調整器510,而雜音填充頻譜值之調整亦可在區塊內應用或是在輸入至訊框建立器/調整器510之前可使用雜音填充能量調整雜音填充頻譜值。
較佳地,可在此完整的頻譜中使用IGF操作,即使用來自其他部分的頻譜值的頻率平鋪填充操作。如此,頻譜平鋪填充操作不僅可應用在高於IGF開始頻率的高頻帶,但亦可應用在低頻帶。此外,没有頻率平鋪填充的雜音填充亦可應用在低於IGF開始頻率,亦可高於IGF開始頻率。然而,其發現當雜音填充操作受限於低於IGF開始頻率的頻率範圍, 以及當此頻率平鋪填充操作係受限於高於IGF開始頻率的頻率範圍,可如第3a圖所繪示,獲得高品質以及高效率音源編碼。
較佳地,目標平鋪(TT)(具有大於IGF開始頻率的頻率)係受制於全部比率編碼器之比例因子帶邊界。來源平鋪(ST),其從資訊取得,即低於IGF開始頻率的頻率不受限於比例因子帶邊界。ST的尺寸應對應於相關聯的TT的尺寸。使用後續的範例作為繪示。TT[0]具有10個MDCT段。此係精確地對應兩個後續的SCBs(例如4+6)的長度。然後,所有可能待與TT[0]進行相關的ST也有10段之長度。鄰近TT[0]的第二目標平鋪TT[1]具有15段1(具有長度7+8的SCB)的長度。然後,相比於TT[0]的10段,此ST有15段長度。
此情形出現時,不能發現用於ST的TT具有此目標平鋪之長度(例如當TT之長度大於可取得的來源範圍),然後不計算相關性且來源範圍係將一數量的時間複製進TT(此複製係逐一完成,使得用於第二複製之最低頻率的頻率線跟隨在第一複製之最高頻率之頻率線),直到目標平鋪TT完全地填滿。
後續,參考第5c圖其繪示第1b圖實施例之頻率再生器116或是第2a圖之IGF區塊202之較佳實施例。區塊522係為頻率平鋪產生器,其不僅接收目標頻帶ID,也另外接收來源頻帶ID。例示性地,其已經決定在編碼器側上第3a圖之比例因子帶3係非常良好的適合再建比例因子帶7。如此,來源頻帶ID將是2,而目標頻帶ID將是7。基於此資訊,頻率平鋪產生器522係使用複製或是諧波平鋪填充操作或是任何其他平鋪填充操作,以產生頻譜成分523之原始第二部分。頻譜成分之原始第二部分具有頻率解析度,其與第一組第一頻譜部分中的頻率解析度相同。
然後,再建頻帶之第一頻譜部分,例如第3a圖之307,係輸入至訊框建立器524,而原始第二部分523亦輸入至訊框建立器524。然後,再建訊框係由調整器526使用再建頻帶之增益參數調整,此增益參數係由增益參數計算器528所計算。然而,重要地,訊框中的第一頻譜部分並不受調整器526影響,但是僅再建訊框之原始第二部分受調整器526影響。在此,增益參數計算器528係分析來源頻帶或是原始第二部分523,並另外分析在再建頻帶中的第一頻譜部分,以最終發現正確的增益參數527, 使得當考量比例因子帶7時,調整器526所輸出的調整訊框之能量具有能量E4。
在此上下文中,非常重要的是相比於HE-AAC,評估本發明的高頻率再建準確性。第3a圖說明關於比例因子帶7。其假設習知編碼器,如第13a圖所繪示,係偵測具有高解析度之待編碼的頻譜部分307,作為一“消失的諧波”。然後,頻譜成分之能量將與再建頻帶之頻譜包絡線資訊(例如比例因子帶7)一起傳送給解碼器。然後,解碼器將再創建此消失的諧波。然而,在此頻譜數值上的消失的諧波307將由第13b圖之先前技術解碼器再建,而頻譜數值將在由再建頻率390標示的頻率的頻帶7中間。如此,本發明可避免第13d圖之先前解碼器引進的頻率錯誤391。
實施上,頻譜分析器亦實現計算第一頻譜部分以及第二頻譜部分之間的相似度,並基於此計算的相似度來判斷重建範圍內的第二頻譜部分,第一頻譜部分係盡可能地匹配第二頻譜部分。然後,在可改變來源範圍/目的範圍的實現方式,參數化編碼器將另外引進一匹配資訊到第二編碼表現,此匹配資訊係對每一個目的範圍指示一匹配來源範圍。然後,在解碼器側上,此資訊由第5c圖之頻率平鋪產生器522使用,第5c圖係繪示基於來源頻帶ID以及目標頻帶ID產生原始第二部分523。
此外,如第3a圖所繪示,頻譜分析器係用以分析頻譜表現,直到最高分析頻率,其僅是低於取樣頻率之一半的小數量,而較佳的是取樣頻率的至少一四分之一或是通常更高。
如圖所繪示,編碼器之運作不須降取樣,而解碼器之運作不須升取樣。換句話說,頻譜域音源編碼器係用以產生具有Nyquist頻率的頻譜表現,此Nyquist頻率係由最初輸入音源訊號之取樣率所定義。
此外,如第3a圖所繪示,頻譜分析器係用以分析從填隙開始頻率開始且結束於由最高頻率表現之最高頻率的頻譜表現。從最低頻率向上延伸到填隙開始頻率的頻譜部分係屬於第一組頻譜部分以及另一頻譜部分例如304、305、306與307,其具有高於填隙頻率的頻率值,另外係包含在第一組第一頻譜部分內。
如概述,頻譜域音源解碼器112係使得第一解碼表現中的頻譜數值的最高頻率表現等於包含在具有此取樣率的時域表示內的最高頻 率,其中在第一組第一頻譜部分中的最高頻率的頻譜數值係為零或是不同於零。不管怎樣,對於第一組頻譜成分的最高頻率,存在比例因子帶之倍率因子,其不考慮是否此比例因子帶中的所有頻譜值係設為零而產生且傳送,如第3a圖以及第3b圖所討論的鄰近關係。
因此,相對於其他參數化技術係增加壓縮效率,例如雜音替換以及雜音填充(這些技術係專為像局部訊號內容的雜音之高效率表現),本發明之優點在於讓音調成分之精確頻率再現。目前,沒有技術可以在低頻帶(LF)以及高頻帶(HF)中不須固定a-priory區分的限制而解決任意的訊號內容之高效率參數表現。
本發明系統之實施例係改進目前技術之方法,從而提供高壓縮效率,甚至在低位元率的全部音源頻寬下沒有或是僅有小量的感知厭煩。
此一般系統包含:●全部頻帶核心編碼;●智慧型填隙(平鋪填充或是雜音填充);●由音調遮罩選擇核心中的稀疏音調部分;●對含有平鋪填充的全部頻帶聯合立體聲對編碼;●平鋪上TNS;以及●在IGF範圍內的頻譜白化。
在更高效率系統的第一步驟係除去將頻譜數據轉換成不同於核心編碼器的第二轉換領域的需要。當多數音源轉碼器,例如AAC,使用MDCT作為基本轉換,在MDCT領域執行BWE亦是有用的。BWE系統之第二要求係需要保持音調網格,藉此甚至HF音調成分亦可保存而編碼音源之品質係優於現存的系統。為了小心處理BWE機制之上述兩者需求,所建議的新系統被稱為智慧型填隙(IGF)。第2b圖係顯示編碼器側上所建議的系統之方塊圖,以及第2a圖顯示解碼器側上的系統。
第6a圖繪示在本發明另一實施方式一編碼音源訊號之一解碼裝置,此解碼裝置包含用以產生一第一組頻譜部份之一第一解碼表現的一頻譜域音源解碼器602,且當此頻率再生器604連接頻譜域音源解碼器602之下游用以產生一再建第二頻譜部份,其中此再建第二頻譜部份係使用第一組第一頻譜部份的一第一頻譜部份。如標示603所繪示,在第一頻譜 部份裡及在第二頻譜部份裡的頻譜數值係為頻譜預測殘餘數值,而為了轉換這些頻譜預測殘餘數值至一全部頻譜表現,一頻譜預測濾波器606將被提供。此反向預測濾波器係用以執行一隨頻率改變的反向預測,此反向預測係針對第一組第一頻率以及再建第二頻譜部份使用此頻譜殘餘數值。此頻譜反向預測濾波器606是由被包含在編碼音源訊號裡的濾波器資訊所配置。第6b圖繪示第6a圖中實施例的較多細節實現方式,此頻譜預測殘餘數值603被輸入至一頻率平鋪產生器612,此頻率平鋪產生器612係針對一再建頻帶或一特定第二頻率部分以產生原始頻譜數值,且此原始資料現在所產生的解析度如同第一頻譜表現被輸入到頻譜塑形器614之高解析度。現在此頻譜塑形器使用在位元串流裡傳送的包絡線資訊以塑形此頻譜,然後此頻譜化塑形資料被應用至頻譜預測濾波器616,此頻譜預測濾波器616係產生使用濾波器資訊607之全部頻譜數值之一訊框,而此濾波器資訊607是從編碼器經由位元串流傳輸到解碼器。
在第6b圖中,假設在編碼器側,經由位元串流傳送以及經由線607所使用的濾波器資訊計算,隨後即執行於包絡線資訊之計算。因此,換句話說,匹配如第6b圖解碼器之一編碼器,其首先計算頻譜殘餘數值,然後計算具有頻譜殘餘數值的包絡線資訊,舉例來說,如繪示在第7a圖裡之內容。然而,其他實施方式對於特定實施方式也是有用處的,在編碼器端上執行TNS或TTS過濾之前,所述包絡線資訊即被計算出來,然後,此頻譜預測濾波器622是在區塊624裡執行頻譜塑形之前被應用。即,換句話說,在頻譜塑形操作624被應用前,此(全部)頻譜數值係被產生。
較佳地,一複數數值TNS濾波器或TTS濾波器係被計算的,其係繪示於第7a圖裡。此原始音源訊號係被輸入至一複數MDCT區塊702裡,然後,此TTS濾波器計算以及TTS濾波器係在複數域裡被執行。然後,在區塊706裡,此IGF輔助資訊係被計算,且任何其他操作如編碼頻譜分析,亦會被計算。然後,由區塊706產生之第一組第一頻譜部份即如繪示之708所示之心理聽覺模型驅動編碼器所驅動編碼,以取得在第7a圖裡在X(k)所指示之第一組第一頻譜部份以及所有轉送至位元串流多工器710的那些資料。
在解碼器側上,此編碼資料被輸入到一解多工器720裡,一 方面分離IGF輔助資訊,另一方面分離TTS輔助資訊以及第一組第一頻譜部份之編碼表現。
然後,區塊724被用於從一或更多實數值頻譜計算一複數頻譜,然後,實數值以及複數頻譜兩者都被輸入至區塊706裡,以針對一再建頻帶而在第二組第二頻譜部份裡產生再建頻率數值。然後,在完整取得的平鋪填充全部頻帶訊框上執行此反向TTS操作728,而在解碼器側上,一最後的反向複數MDCT操作在區塊730裡被執行,如此,複數TNS過濾器資訊的使用即允許,當不僅是在核心頻帶或是分離平鋪頻帶裡,也可以在核心/平鋪邊界上或是平鋪/平鋪邊界上自動產生一平鋪邊界處理,最後在結束時重新產生平鋪之間的一頻譜相關性。在平鋪邊界上的頻譜相關性無法僅經由在頻率平鋪之原始資料上產生頻率平鋪以及執行一頻譜包絡線校正而取得。
第7c圖繪示不具TTS之一原始訊號(左邊面板)以及一擴大訊號之一比較,其能夠看出在頻率範圍上面擴大部份750所繪示的強烈假造物,然而,在第7e圖裡,當同樣在750的頻譜部份與第7c圖的相關假造物元件進行比較時,此種情況卻不會發生。
實施例或者是本發明的音源編碼系統使用可用位元率的主要部份,以波形編碼成在編碼器裡與感知最關聯的頻譜化訊號,且此造成之頻譜間隙將在解碼器裡利用近似於原始頻譜的訊號內容加以填充。一個非常有限的位元預算被消耗來控制驅動所謂的頻譜智能間隙填充(Intelligent Gap Filling,IGF)參數,其係從編碼器到解碼器所發送之專用輔助信息。
音源訊號的儲存體或者傳輸通常是受到嚴格的位元率限制,在過去,當只擁有極低之位元率時,編碼器被強制去激烈地減少傳輸之音源頻寬,現在的音源編解碼器能夠使用頻寬延伸(BWE)方法,如頻譜頻寬複製(Spectral Bandwidth Replication,SBR),請參閱文獻[1],來編碼寬頻帶訊號。這些演算法依賴高頻內容(HF)之參數表現,其係藉由將從解碼訊號之低頻部(LF)調換成HF頻譜區域(“修補”)編碼波形所產生,以及依賴參數驅動後處理之使用。在BWE機制中,在給定所謂的交越頻率上方的HF頻譜區域之再建係通常根據頻譜修補(patching)。通常,HF區域係由多 個鄰近修補所構成,且每一修補係源自給定交越頻率下方的LF光譜之複數個帶通(BP)區域。目前習知技術內的系統係藉由複製從來源至目標區域的一組鄰近子頻帶係數,以有效地執行濾波器組表示內。
若是一BWE系統在一濾波器組裡或是時間頻率轉換域裡被實施,那裡只有有限的可能性來控制此頻寬延伸訊號的時域塑形。一般來說,此時域粒度被兩鄰近轉換視窗間的跳距所限制,這能造成在BWE頻譜範圍裡所不想要的預回音或者是後回音。
從感知音源編碼中,其著名的是一音源訊號之時域包絡線形狀能夠使用頻譜過濾技術來復原,如時域包絡線塑形(Temporal Envelope Shaping,TNS),請參閱文獻[14]。然而,先前技術中的知名TNS濾波器是實數值頻譜上的實數值濾波器,此實數值頻譜上的實數值濾波器能夠被別名使用假造物嚴重的削弱,尤其是如果是在下部的實數轉換為一修改型離散餘弦轉換(Modified Discrete Cosine Transform,MDCT)。
此時域包絡線平鋪塑形應用在複數值頻譜上的複數濾波,如從一複數變更離散餘弦轉換(Modified Discrete Cosine Transform,CMDCT)取得。從而,此假造物的使用即可避免。
此時域平鋪塑形包含
●在一編碼器原始訊號頻譜上的複數濾波器係數評估以及一修平濾波器的使用
●輔助資訊裡的濾波器係數傳輸
●在解碼器平鋪填充再建頻譜上的一塑形濾波器應用
本發明是從先前技術的知名音源轉換編碼延伸陳述,特別是由沿頻率方向之線性預測之時域雜訊塑形(TNS),針對於頻寬延伸之上下文裡的一修改型方式中之使用。
較佳地,本發明的頻寬延伸演算是基於智能間隙填充(IGF),但採用一過度取樣,複數值轉換(CMDCT),而非如IGF標準之配置是依賴於一訊號之一實數值取樣MDCT表現,此CMDCT可被視為在每一複數值頻譜係數中,實部裡的MDCT參數以及虛部裡的MDST係數之組合。
雖然新的研究在IGF的上下文裡被描述,本發明之處理可被使用在任何BWE方法的組合,此BWE方法係基於音源訊號的一濾波器 組表現。
在新的上下文裡,沿頻率方向之線性預測不作為時域雜訊塑形,而是作為一個時域平鋪塑形(TTS)技術透過以下事實來重命名是有依據的,即在先前技術的感知轉換編解碼器裡,平鋪填充訊號元件被TTS進行時間塑形,而非由TNS的量化雜訊塑形。
第7a圖顯示使用IGF以及新TTS研究之一BWE編碼器方塊圖。
此基本編碼方案運作如下:
- 計算一時間域訊號x(n)的CMDCT以取得頻率域訊號x(k)
- 計算複數值TTS濾波器
- 對BTW取得輔助資訊以及除去將被解碼器複製的頻譜資訊
- 申請使用心理聽覺模組(PAM)的量化
- 儲存/傳送資料,僅實數值MDCT係數被傳送
第7b圖顯示相關的解碼器。它反向地完成了在編碼器裡的主要步驟。
在此,基本解碼方案之運作如下:
- 從MDCT數值中評估MDST係數(此處理增加一區塊解碼器延遲),且結合MDCT及MDST係數到複數值CMDCT係數裡
- 執行平鋪填充與其後處理
- 應用具有傳送TTS濾波器係數之反向TTS濾波
- 計算此反向CMDCT
值得注意的是,可選擇的是,如果TTS分析和IGF參數評估在編碼器裡是一貫地反向,則TTS合成與IGF後續處理之順序亦可以在解碼器裡為反向。
對於高效率的轉換編碼,即所謂似近20毫秒的"長區塊"來達到合理的轉換增益。如果在這樣的長區塊裡之訊號所包含之瞬變,即在再建頻譜頻帶裡由於平鋪填充而發生可聽見的預回音以及後回音。第7c圖顯示典型的由於IGF損害瞬變的預回音及後回音效果。在第7c圖的左邊部分顯示原始訊號的頻譜圖,而在右邊部份上顯示不具本發明TTS過濾之平鋪填充訊號的頻譜圖。在這個例子中,在核心頻帶以及平鋪填充頻帶間的 IGF起始頻率f_IGFstart或是fSplit被選擇,在第7c圖的右邊部份,預回音及後回音可清楚的看見圍繞著瞬變,其在複製頻率區域的上部頻譜端尤其突出。
TTS模組的主要任務是限制環繞在一瞬變周圍鄰近的這些多餘訊號,並從而隱藏他們在時域區域裡被掌控的人類感知時域遮蔽影響。因此,所需的TTS預測係數被加以計算且應用在CMDCT領域所使用的"向前預測"。
在一實施例中,其結合TTS以及IGF到一編解碼器,排列特定的TTS參數以及IGF參數使得一IGF平鋪能夠完全地被一TTS濾波器(修平或塑形濾波器)過濾與否是極為重要的。因此,所有TTSstart[..]或者是TTSstop[..]頻率不該被一IGF平鋪所包含,而是被排列自相對應的f IGF... 頻率。第7d圖顯示TTS及IGF對一組三個TTS過濾器操作區域的範例。
此TTS停止頻率被調整成IGF工具的停止頻率,其係高於fIGFstart,若是TTS使用一個以上的濾波器,其必須確保在兩個TTS濾波器之間的交越頻率能匹配IGF之分割頻率。否則,一TTS子濾波器將會超出fIGFstart,而導致多餘假造物,例如過度塑形。
在第7a圖和第7b圖的不同實施方式中,額外須注意的是,解碼器IGF能量必須正確地被調整。尤其是如果在TTS及IGF的處理過程中,具有不同預測增益的不同TTS濾波器被應用至一IGF平鋪的來源區域(如一修平濾波器)以及目標頻譜區域(如不像修平濾波器準確的一對照之塑形濾波器)。在此案例中,此兩個應用的TTS濾波器的預測增益比率不再等於1,因此必須應用通過此比例的一能量調整。
在可替換的實施方式中,此IGF後處理與TTS的順序是反向的,在解碼器裡,在TTS過濾之後由IGF後續處理的能量調整即被計算,進而成為在合成轉換前的最後處理步驟。因此,無論不同的TTS濾波器增益是否在編碼期間內被應用到一平鋪裡,最後的能量都將被IGF處理正確地調整。
在解碼器側上,TTS濾波器係數再次被應用在全部頻譜上,如被再生頻譜擴大的核心頻譜,此TTS的應用來形成此再生頻譜的時域包絡線是必要的,此包絡線是用以再次匹配原始訊號的包絡線。如此一 來,所出現的預回音便可減少。此外,如同傳統的TNS,其仍然在fIGFstart下的訊號裡暫時性地塑化此量化雜訊。
在傳統編碼器裡,在一音源訊號(例如SBR)上的頻譜修補會干擾在修補邊界的頻譜相關性,從而損害經由引入散布之音源訊號的時域包絡線。因此,在殘餘訊號上的IGF平鋪填充之執行即為另一個好處,在使用TTS塑形濾波器之後,平鋪邊界是無縫相關地,導致更多忠實的時域再現訊號。
此對應的處理訊號結果即顯示在第7e圖裡。與未濾波的版本(第7c圖之右邊部份)相比,TTS濾波訊號顯示多餘預回音以及後回音(第7e圖右邊部份)之一良好減少。
此外,如上述所討論,第7a圖繪示匹配第7b圖解碼器或第6a圖解碼器之一編碼器。基本上,用於編碼一音源訊號之裝置包含一時間頻譜轉換器,如702,用於轉換一音源訊號到一頻譜表現。此頻譜表現能夠是一實數值頻譜表現或者,如繪示在區塊702裡,為一複數頻譜表現。此外,一預測濾波器如704,用以執行一隨頻率改變的預測以提供來產生頻譜殘餘數值,其中此預測濾波器704是由從音源訊號衍生以及轉送到一位元串流多工器710的預測濾波器資訊所定義,此外,一音源編碼器,如心裡聽覺驅動音源編碼器704,係被提供的。這個音源編碼器被設置為編碼頻譜殘餘數值的一第一組第一頻譜部份,以取得編碼之第一組第一頻譜數值。另外,一參數編碼器,如第7a圖所繪示的706,係提供來編碼一第二組第二頻譜部份。較佳地,第一組第一頻譜部份是利用一較高頻譜解析度來進行編碼,此頻譜解析度係高於第二組第二頻譜部份。
最後,如第7a圖所繪示,一輸出介面係提供用來輸出編碼訊號,此編碼訊號包含參數化之編碼第二組第二頻譜部份、編碼第一組第一頻譜部份以及在第7a圖裡如在714顯示之"TTS輔助資訊"之濾波器資訊。
較佳地,此預測濾波器704包含一濾波器資訊計算器,其配置用來使用頻譜表現之頻譜數值以計算濾波器資訊。此外,此預測濾波器被配置用來計算頻譜殘餘數值,此頻譜殘餘數值與用於計算濾波器資訊之頻譜數值為相同的。
較佳地,如同已知的先前技術裡的同樣方式,TTS濾波器 704被配置成根據AAC標準應用TNS工具的音源編碼器。
接續著,使用雙聲道解碼之一較佳實施方式被討論於第8a圖到第8e圖的上下文裡。此外,請一併參考在第2a圖及第2b圖上下文裡的相關元件描述(聯合聲道編碼器228以及聯合聲道解碼器204)。
第8a圖繪示用於產生一解碼雙聲道訊號的音源解碼器,此音源解碼器包含四個音源解碼器802,其用以解碼一編碼雙聲道訊號以獲得一第一組第一頻譜部份,和另外一參數解碼器804,其用以針對第二組第二頻譜部份提供參數化資料,以及另外,一雙聲道識別針對第二頻譜部份以識別出一第一或一第二之不同雙聲道表現。另外,一頻率再生器806被依據第一組第一頻譜部份之一第一頻譜部份以提供再生第二頻譜部份,以及針對第二部分提供參數化資料以及雙聲道識別。第8b圖繪示了在來源範圍及目的地範圍裡的雙聲道表現之不同組合。此來源範圍能在第一雙聲道表現裡且目的地範圍也能在此第一雙聲道表現裡。另外,此來源範圍能是在第一雙聲道表現裡且此目的地範圍能是在第二雙聲道表現裡。此外,如第8b圖裡第3欄所示,此來源範圍能是在第二雙聲道表現裡,且此目的地範圍能是在第一雙聲道表現裡,最後,來源範圍和目的地範圍兩者都能在第二雙聲道表現裡。在一實施例中,第一雙聲道表現是一分開的雙聲道表現,其中此雙聲道訊號的兩個聲道是個別地被表現的。然後,此第二雙聲道表現是一聯合表現,其中此雙聲道表現之兩個聲道是共同地被表現,其中需要一較佳的處理或表現轉換來重新計算分開的雙聲道表現,如輸出至對應的揚聲器是需要的。
在一實施方式中,第一雙聲道表現能夠是一左/右(L/R)表現且此第二雙聲道表現能夠是一聯合立體聲表現。然而,其他雙聲道表現能分別從左/右、主/副或者是立體聲預測來應用及使用在本發明中。
第8c圖繪示了由第8a圖之音源解碼器執行之操作流程圖。在步驟812中,音源解碼器802執行來源範圍的一解碼。此來源範圍能包含,相對於第3a圖,倍率因子頻帶SCB1至SCB3。此外,那裡能夠是對每一倍率因子頻帶的一雙聲道識別,舉例來說,倍率因子頻帶1能是在第一表現(如左/右)且第三倍率因子頻帶能是在第二雙聲道表現裡,如主/副或者是預測降混/殘餘。如此,步驟812可以對不同頻帶造成不同的表現。然 後,在步驟814裡,此頻率再生器806用以對一頻率再生選擇一來源範圍。在步驟816裡,頻率再生器806確認來源範圍及在區塊818之表現,此頻率再生器806比較來源範圍的雙聲道表現與目標範圍的雙聲道表現。若兩者表現是相同的,頻率再生器806則為雙聲道訊號的每一聲道提供一分開的頻率再生。然而,當兩者表現如在區塊818裡所偵測是不相同時,此訊號流824被擷取且區塊822從來源範圍計算其他雙聲道表現,且對於再生目標範圍使用此計算之其他雙聲道表現。如此一來,第8a圖的解碼器使其可能再生一目的地範圍以指示具有所述第二雙聲道識別,而此第二雙聲道識別是在第一雙聲道表現裡使用一來源範圍。自然地,本發明亦允許再生使用一來源範圍的一目標範圍,其中此來源範圍係具有同樣的雙聲道識別。且,另外本發明允許再生具有一雙聲道識別的一目標範圍,其中此雙聲道識別係指向一聯合雙聲道表現,然而允許轉換此表現到一分開的聲道表現,此分開的聲道表現對於雙聲道訊號而言,儲存或是傳輸至對應的擴音器是需要的。
這裡強調的是,雙聲道表現的兩個聲道可以是兩個立體聲聲道,如左聲道以及右聲道。然而,此訊號也能是多聲道訊號,如五聲道或是一子低音擴音器聲道或是其他更多聲道,然後,如第8a圖至第8e圖上下文裡所討論的一成對雙聲道處理即被執行,舉例來說,其中此配對能是一左聲道和一右聲道,一左環繞聲道和一右環繞聲道,以及一中間聲道和一LFE(低音擴音器)聲道。任何其他的配對能夠被使用來表示,舉例來說,六個輸入聲道通過三個雙聲道處理程序。
第8d圖繪示本發明對應於第8a圖之解碼器之一方塊圖。一來源範圍或者一核心解碼器830可對應於音源解碼器802,其他的方塊832、834、836、838、840、842以及846能是第8a圖之頻率再生器806的部份。尤其是,區塊832是針對在個別頻帶裡轉換來源範圍表現的一表現轉換器,使得一方面在輸出區塊802中呈現第一表現裡來源範圍之完成集合,另一方面在輸出區塊802中呈現第二雙聲道表現裡來源範圍之完成集合。對於兩者來源範圍的表現,這兩個完成來源範圍表現能夠被儲存在儲存體834。
然後,區塊836應用一頻率平鋪產生器,此頻率平鋪產生器 係使用一來源範圍ID以及對於目標範圍的一雙聲道ID作為輸入,在835中針對目標範圍輸入至頻率平鋪產生器,根據對於目標範圍的雙聲道ID,此頻率平鋪產生器係存取此儲存體834以及接收匹配此雙聲道ID之來源範圍之雙聲道表現。如此一來,當雙聲道ID為目標範圍指示聯合立體聲處理時,為了取得被來源範圍ID 833所指示的來源範圍之聯合立體聲表現,此頻率平鋪產生器836便會存取儲存體834。
此頻率平鋪產生器836對每一目標範圍執行此操作以及對頻率平鋪產生器執行輸出,以便透過雙聲道識別識別每一聲道是否存在。然後,通過一包絡線調整者838之一包絡線調整被執行。此包絡線調整是在雙聲道領域裡被執行,其中此雙聲道領域是被雙聲道識別所識別出的。為此需要包絡線調整參數,且這些參數是從編碼器到解碼器在相同雙聲道表現裡的任一傳送。在目標範圍欲被包絡線調整者處理的雙聲道識別中,當有一雙聲道識別指出與目標範圍的包絡線資料之不同雙聲道表現時,然後一參數轉換器840轉換此包絡線參數到所需要的雙聲道表現。舉例來說,當一頻帶指出聯合立體聲編碼的雙聲道識別,以及當針對目標範圍之參數有被傳送參數,如左/右包絡線參數,然後此參數轉換器如描述之從左/右包絡線參數計算此聯合立體聲包絡線參數,使得正確的參數表現能用於目標範圍的頻譜包絡線校正。
在另一較佳實施例中,當聯合立體聲在一目標頻帶裡時,此包絡線參數已經如同聯合立體聲參數被傳送。
當假設此輸入至包絡線調整者838為具有不同雙聲道表現的一目標範圍組,此包絡線調整者838之輸出也會是在不同雙聲道表現裡的一目標範圍組,當一目標範圍有一聯合表現,如同主/副,然後此目標範圍經由一表現轉換器842進行處理,以計算儲存體或傳輸至擴音機所需之分開的表現。然而,當一目標範圍已有一分開的表現,擷取此訊號流844且繞過此表現轉換器842。在輸出區塊842上,可擷取到作為一分開的雙聲道表現之一雙聲道頻譜表現,此分開的雙聲道表現可進一步地被區塊846所處理,其中此進一步處理可以是,舉例來說,一頻率/時間轉換或是任何其他需要的處理。
較佳地,對應頻率頻帶的第二頻譜部份,以及此雙聲道識別 係被提供以一標記陣列以對應於第8b圖之表格,其中每一頻率頻帶存在一個標記。然後,此參數解碼器被配置來確認此標記是否被設定,並且根據一標記去控制頻率再生器106以使用第一頻譜部份之一第一表現或是一第二表現。
在一實施例中,只有啟始於如第3a圖之IGF起始頻率309之再建範圍對於不同的再建頻帶有雙聲道識別。在進一步的實施例中,這也應用在低於IGF開始頻率309的頻率範圍。
在進一步的實施例中,來源頻帶識別以及目標頻帶識別能透過一相似度分析以自適應性地被決定,然而,本發明之雙聲道處理也能應用在當存在一來源範圍到一目標範圍的一固定關係,相對於頻率,一個來源範圍能透過一調和的頻率平鋪填充操作或是一頻率平鋪填充操作之副本而再產生一較廣的目標範圍,此副本是使用二個或以上的頻率平鋪填充操作,其係相似於從著名的高效率AAC處理來針對多個修補之處理。
第8e圖繪示編碼一雙聲道音源訊號的音源編碼器。此編碼器包含一時間頻譜轉換器860,用以轉換雙聲道音源訊號至頻譜表現。此外,一頻譜分析器866用以轉換雙聲道音源聲道之音源訊號至一頻譜表現。此外,一頻譜分析器866被提供用於執行一分析以決定那個頻譜部份將用一高解析度進行編碼,如發現第一組第一頻譜部份及額外發現第二組第二頻譜部份。
此外,一雙聲道分析器864被提供用以分析第二組第二頻譜部份,以確定識別一第一雙聲道表現或一第二雙聲道表現之一雙聲道識別。
取決於雙聲道分析器的結果,在第二頻譜表現的一頻帶是使用第一雙聲道表現或第二雙聲道表現之任一參數化,且此將由一參數編碼器868進行執行。此核心頻率範圍,如低於第3a圖IGF開始頻率309之頻率頻帶是由一核心編碼器870進行編碼,區塊868及870的結果被輸入至一輸出介面872,如同所指示的,雙聲道分析器對每一個高於IGF開始頻率的頻帶或是全部的頻率範圍提供一雙聲道識別,且此雙聲道識別也轉送至輸出介面872,使得包含在一編碼訊號873的資料能透過輸出介面872輸出。
此外,較佳地,音源編碼器包含一頻帶化轉換器862,依據雙聲道分析器862的決定,時間頻譜轉換器862的輸出訊號被轉換至一表 現,此表現係由雙聲道分析器以及雙聲道ID835所指示。如此,頻帶化轉換器862的一輸出即為一頻率頻帶集合,其中每一個頻率頻帶能夠是在第一雙聲道表現裡或是在不同的第二雙聲道表現。當本發明應用於全部頻帶時,如當來源範圍及再建範圍兩者都被頻帶化轉換器處理時,頻譜分析器860即能分析此表現。然而,另外此頻譜分析器860也能分析由控制線861所指定之時間頻譜轉換器所輸出的訊號如此,在被頻帶化轉換器862處理之前,此頻譜分析器860能應用頻帶化轉換器862或者是時間頻譜轉換器860所輸出的較佳音調分析。此外,在頻帶化轉換器862或是時間頻譜轉換器860的結果上,頻譜分析器能針對一特定目標範圍應用最好的匹配來源範圍。
隨後,參考第9a圖至第9d圖所表示,其繪示了在第3a圖及第3b圖之上下文裡已討論之能量資訊數值的一較佳計算。
習知技術之音源編碼器係應用各種技術來最小化一資料數量,其係用以代表所給予之一音源訊號如USAC[1]之音源編碼器應用一時間至頻率的轉換,如同MDCT,用以取得給予的一音源訊號之一頻譜表現。這些MDCT係數利用人類聽覺系統的心理聽覺方面以進行量化,若是可用的位元率被減少,量化變得粗糙,將引起大量的零頻譜數值,而導致在解碼器端可聽見假造物。為了改善此聽覺品質,習知技術的解碼器利用隨機雜訊來填充這些零頻譜部份。此IGF方法從剩餘非零訊號填充頻譜內之那些間隙以獲得平鋪,對於解碼音源訊號的聽覺品質,至關重要的是保留頻譜包絡線以及頻譜係數的能量分布,此處展示之能量調整方法係使用傳輸輔助資訊以重建音源訊號之頻譜MDCT包絡線。
在eSBR[15]裡,音源訊號被至少二個因子降取樣,且頻譜的高頻部份完全被清除[1,17],此被清除的部份是由在解碼器端上的參數技術,eSBR,所取代,eSBR暗示一附加轉換的用法,QMF轉換,其係用於取代空的高頻部份以及重取樣音源訊號[17],這都會對一音源編碼器增加其計算的複雜度以及記憶體的消耗。
USAC編碼器[15]提供了使用亂數雜訊以填充頻譜洞(零頻譜線)的可能性,但其可能有以下缺點:任意雜訊不能保持一瞬變訊號的時域微小構造,且不能保持一音調訊號的調和構造。
在解碼器端上eSBR操作的區域係完全地被編碼器[1]所刪除,因此,eSBR是傾向於在高頻率區域裡刪除音調線或著是扭曲原始訊號的調和結構。當eSBR的QMF頻率解析度非常低,且正弦元件的重返只可能在濾波器組底層的粗糙解析度裡,在eSBR重複頻率範圍裡的再生音調元件具有非常低的精確度。
eSBR使用技術以調整修補地區的能量,即頻譜包絡線校正[1],此技術使用在一QMF頻率時間格上的傳送能量數值來重塑形此頻譜包絡線。先前技術因為高時間解析度無法部份地刪除頻譜,其傾向於需要相對大量地位元以傳輸適當的能量數值或者是在能量數值應用一粗糙的量化。
IGF方法不需要一附加的轉換,因為它使用傳統變形之計算,如在[15]中所描述。
此處呈現的能量調整方法使用由編碼器產生的輔助資訊,以重建音源訊號的頻譜包絡線,被編碼器產生之輔助資訊係概述如下:
a)應用一視窗MDCT轉換到輸入音源訊號[16,第4.6小節],選擇性地計算一視窗MDST或是從計算的MDCT估計一視窗MDST
b)應用MDCT係數上的TNS/TTS[15,7.8小節]
c)對高於IGF開始頻率(fIGFstart)到IGF停止頻率(fIGFstop)的每一MDCT倍率因子頻帶計算其平均能量
d)量化此平均能量數值
fIGFstart及fIGFstop是使用者所給定的參數。
從步驟c及d的計算數值係無損編碼,且此計算數值係作為輔助資訊以位元串流的形式傳送到解碼器。
此解碼器接收此傳送數值並使用這些數值來調整頻譜包絡線。
a)去量化所傳送的MDCT數值
b)若有訊號則應用傳統USAC雜訊填充
c)應用IGF平鋪填充
d)去量化所傳送的能量數值
e)調整頻譜包絡線倍率因子頻帶狀
f)若有訊號,應用TNS/TTS
為MDCT轉換,一視窗長度2N之視窗化音源訊號之實數值頻譜表現。此轉換被描述在[16]裡,此編碼器可選擇性使用在上的TNS。
[16,第4.6.2小節]中描述,在倍率因子頻譜裡之一部份裡,倍率因子頻帶是一組索引之集合且在此文中以scb來表示。
k=0,1,2,...max_sfb的每一個scbk的限定是由一個陣列swb_offset所定義的[16,4.6.2小節],其中swb_offset[k]以及swb_offset[k+1]-1對於包含在scb k 裡的最低以及最高頻譜線定義了第一以及最後一個索引。我們將此倍率因子頻帶表示為:scb k :={swb_offset[k],1+swb_offset[k],2+swb_offset[k],...,swb_offset[k+1]-1}
如果IGF工具被編碼器使用,使用者可定義一個IGF開始頻率以及一個IGF停止頻率。這兩個數值對映到最適合的倍率因子頻帶索引igfStartSfb以及igfStopSfb。它們都會被在位元串流裡變成訊號送至解碼器。
[16]中描述了一長區域及一短區塊的轉換。對於長區域,只有具有一組倍率因子的一組頻譜係數被傳送到解碼器。對於短區塊,具有8組不同頻譜係數的8個短視窗被計算。為了節省位元率,這8個短區塊視窗的倍率因子會被編碼器進行分群。
在此處所呈現的IGF方法,使用傳統的倍率因子頻帶去分群被傳送到解碼器的頻譜數值如下: 其中k=igfStartSfb,1+igfStartSfb,2+igfStartSfb,...,igfEndSfb
針對量化,
是被計算出來的。所有數值都會被傳送到解碼器。
我們假設編碼器決定去分群num_window_group組倍率因子。我們利用w來表示8組{0,1,2,...,7}分別表示8個短視窗的群分割。w l 表示w的第l個子集合,其中l表示視窗群組的索引,且0 l<num_window_group
對於短區塊計算,使用者定義了IGF開始/停止頻率來對映適當的倍率因子率帶。然而,為了簡單起見,一個用於表示短區塊的方式也將為:k=igfStartSfb,1+igfStartSfb,2+igfStartSfb,...,igfEndSfb
此IGF能量計算使用分群資訊來分群數值E k,l
對於量化,
將會被計算,所有數值都會被傳送到解碼器。
上述提及的編碼公式操作使用了實數值MDCT係數。為了取得一個在IGF範圍裡較穩定的能量分佈,也就是,去減少時域振幅波動,一個額外的方法可以被使用來計算此數值
表示MDCT轉換,一視窗長度2N之視窗化音源訊號之實數值頻譜表現,且表示此實數值MDST轉換音源訊號之相同部份之頻譜表現。此MDST頻譜表現可以是被精確計算或是由估計而來。表示視窗化音源訊號之複數頻譜表現,其中具有作為其實數部,作為其複數部。此編碼器可選擇性的應用TNS在以及上。
現在IGF範圍裡的訊號能量可以用以下的式子測量
再建頻帶裡的實數以及複數能量,也就是,IGF範圍scbk之再建的平鋪應該被使用於解碼器側,可以被計算如下:
其中trk是一組索引,與scbk相關的來源平鋪範圍。在上述的兩個式子裡,取代索引組scbk,索引組將隨後在本文中被定義)可以被用來產生trk以達到更精確的數值Et以及Er
計算
若是Etk>0,否則fk=0。
利用
現在一更穩定的值Ek被計算出來,既然具有MDCT數值的Ek之一計算只能被基於MDCT數值不尊守帕斯瓦爾定義(Parseval’s theorem)來受損,因此他們不會反映出頻譜數值之完整能量資訊。之計算如上所示。
如同較早所表示的,對於短區塊,我們假設編碼器決定去分群num_window_group組倍率因子。如上,w l 表示w的第l個子集合,其中l表示視窗群組的索引,且0 l<num_window_group
再次的,如上所概述的版本以計算一更穩定的Ek,l是可以被計算的。利用,定義MDCT轉換以及定義長度2N的MDST轉換視窗化音源訊號,計算
類似地計算,
且與因子fk,l繼續處理
此因子是用來調整先前計算的Erk,l
的計算如上所示。
此程序不僅使用再建頻帶的能量,亦使用從來源範圍之一能量資訊,其中此再建頻帶是從複數再建頻帶或是從MDCT數值中所衍生,而來源範圍提供一改良者能量再建。
特別是,針對再建頻帶能量上之再建頻帶使用資訊,以及另外一來源範圍能量上之使用資訊,此參數計算器1006係被用來計算能量資訊。
此外,參數計算器1006被配置用來計算原始訊號之複數頻譜之再建頻帶上的一能量資訊(Eok),用以計算原始訊號之複數頻譜之實數部之來源範圍上的一能量資訊(Erk),其中此原始訊號係被用於再建此再建頻帶,且其中此參數計算器被配置用來計算使用能量資訊(Eok)以及能量資訊(Erk)之再建頻帶的能量資訊。
此外,此參數計算器1006被配置用來決定原始訊號之一複數頻譜之一欲再建倍率因子頻帶上的一第一能量資訊(Eok),用以決定原始訊號之複數頻譜之來源範圍上的一第二能量資訊(Etk),其中此原始訊號係被用於再建欲被再建之倍率因子頻帶,用以決定原始訊號之複數頻譜之一實數部之一來源範圍上的一第三能量資訊(Erk),其中此原始訊號係被用於再建欲被再建之倍率因子頻帶,用以根據在第一能量資訊、第二能量資訊以及第三能量資訊之最小兩個的一關係來決定一加權資訊,用以使用加權資訊來加權第一能量資訊及第三能量資訊之其中之一,以取得一加權能量資訊,以及針對再建頻帶,使用此加權能量資訊以作為能量資訊。
計算的範例如下所示,但許多其它可能出現本領域技術人員在考慮到上述的一般原則是: A)f_k=E_ok/E_tk;E_k=sqrt(f_k * E_rk);B)f_k=E_tk/E_ok;E_k=sqrt((1/f_k)* E_rk);C)f_k=E_rk/E_tk;E_k=sqrt(f_k * E_ok)D)f_k=E_tk/E_rk;E_k=sqrt((1/f_k)* E_ok)
所有這些實施例中所確認到的事實是,雖然只有實際MDCT數值是在解碼器側被處理,而真正計算是由於重疊以及增加,使用複數之時域混疊消除程序隱約形成,然而,尤其是,判斷918頻率數值在再建頻帶920之頻譜部份922,923之平鋪能量資訊與在再建頻帶920裡具有頻率的第一頻譜部份921之不同,係取決於實際MDCT數值。因此,傳送到解碼器的能量資訊一般將小於原始訊號之複數頻譜之再建頻帶上的能量資訊Eok。以上面的案例C來舉例,即表示因子f_k(加權資訊)將小於1。
在解碼器側,若是IGF工具之訊號為ON,則傳送數值即可從位元串流被取得,且將會被以下式子量化 其中k=igfStartSfb,1+igfStartSfb,2+igfStartSfb,...,igfEndSfb
一解碼器反量化之傳送的MDCT數值至且計算此剩下剩餘的能量:
其中k的範圍如上所定義。
我們定義。此集合包含了倍率因子頻 帶scbk的所有索引,其係已經被解碼器量化成零。
由在編碼器端的MDCT頻譜所引起的一粗糙量化,IGF取得次頻帶方法(不在此處描述)係用於填充頻譜間隙,其中此編碼器端係使用傳送MDCT的非零值。x將會另外包含數值以取代所有先前的零數值。此平鋪能量可由以下式子計算:
其中k即在如上面所定義的範圍內。
在再建頻帶裡的能量遺失可被計算為:mE k :=|scb k |E k 2-sE k
且針對調整的增益因子可由以下獲得:
利用g'=min(g,10)
使用增益因子之頻譜包絡線校正為:x i :=g'x i
對於所有以及k的範圍如上述所定義。
在此將頻譜包絡線x重新塑形成原始的頻譜包絡線的形狀。
如上所概述的利用短視窗序列之計算原則上是相同的,但倍率因子頻帶的分組係被考慮在內。我們將來自位元串流所取得的量化、群組能量數值表示為E k,l ,計算
以及
索引j表示短區塊序列的視窗索引。
計算mE k,l :=|scb k |E k,l 2-sE k,l
以及
利用g'=min(g,10)
應用x j,i :=g'x j,i
對於所有的
對於低位元率的應用,一配對分群數值Ek可能不會錯過太多精確度,此方法只可用於長區塊:
其中k=igfStartSfb,2+igfStartSfb,4+igfStartSfb,...,igfEndSfb
再次地,在量化完所有數值後,Ek>>1便被傳送到解碼器。
第9a圖繪示一編碼音源訊號解碼裝置,其包含第一組第一頻譜部分之編碼表現以及代表第二組第二頻譜部分之頻譜能量之參數數據的編碼表現。第9a圖中,第一組第一頻譜部分係標示為901a,而第9a圖中參數數據之編碼表現係標示為901b。音源解碼器900係用以解碼第一組第一頻譜部分之編碼表現901a,以取得一解碼第一組第一頻譜部分904,以及用以解碼參數數據之編碼表現以取得第二組第二頻譜部分之解碼參數數據902,其代表個別再建頻帶之個別能量。第二頻譜部分係位於再建頻帶 中。此外,頻率再生器906係用以再建再建頻帶之頻譜值,其包含第二頻譜部分。頻率再生器906係使用第一組第一頻譜部分之第一頻譜部分以及用於再建頻帶的個別能量資訊。其中再建頻帶包含第一頻譜部分以及第二頻譜部分。頻率再生器906係包含計算器912用以判斷一包含有第一頻譜部分之累積能量的殘留能量資訊,其具有再建頻帶內的頻率。此外,頻率再生器906包含計算器918用以判斷此再建頻帶之另一頻譜部分之一平鋪能量資訊,而頻率值係不同於第一頻譜部分。這些頻率值有在再建頻帶內的頻率。另一頻譜部分係使用不同於再建頻帶內之第一頻譜部分的第一頻譜部分進行頻率再生而產生。
頻率再生器906更包含一計算器914用以計算再建頻帶內的消失能量,而計算器914係使用再建頻帶之個別能量以及由區塊912產生的殘留能量進行運作。此外,頻率再生器906包含一頻譜包絡線調整器916用以根據消失的能量資訊以及由區塊918產生的平鋪能量資訊,來調整再建頻帶中的另一頻譜部分。
參考第9c圖,其繪示特定的再建頻帶920。再建頻帶包含再建頻帶內的第一頻譜部分,例如第3a圖中大略地繪示成921的第一頻譜部分306。此外,使用一來源區域(例如從低於第3a圖之智慧型填隙開始頻率309的比例因子帶1、2與3)來產生再建頻帶920內的頻譜值之剩餘。頻率再生器906係用於產生第二頻譜部分922與923之原始頻譜值。然後,為了最後調整頻率頻帶922與923的原始頻譜值,如第9c圖所繪示計算增益參數g,以取得在再建頻帶920(其現在有相同頻譜解析度)中的再建以及調整第二頻譜部分,即與第一頻譜部分921相同的線距離。重要的是了解在第9c圖中的921繪示的再建頻帶中的第一頻譜部分,其係由音源解碼器900解碼且不受第9b圖之區塊916執行的包絡線調整影響。取而代之地,因為第一頻譜部分由全部頻寬或是經由線904的全率音源解碼器900輸出,所以標示為921的再建頻帶中的第一頻譜部分保留原貌。
後續,討論具有實數的特定範例。區塊912所計算的剩餘殘留能量係為五個能量單元,而此能量係為第一頻譜部分921中四條頻譜線例示性標示的能量。
此外,再建頻帶之能量數值E3,其對應於第3b圖或是第 3a圖之比例因子帶6,係等於10個單元。重要地,能量數值不僅包含頻譜部分922與923之能量,也包含再建頻帶920之全部能量,如編碼器側上所計算的,即使用音調遮罩執行頻譜分析之前。因此,十個能量單元係覆蓋再建頻帶中的第一頻譜部分以及第二頻譜部分。然後,係假設用於區塊922與923、或是用於區塊922與923的原始目標範圍數據之來源範圍數據之能量係等於八個能量單元。如此,係計算五個單元之消失能量。
根據由平鋪能量tEk所劃分的消失能量,可計算出一增益參數0.79。然後,用於第二頻譜部分922與923的原始頻譜線係與所計算的增益參數相乘。如此,僅用於第二頻譜部分922與923的頻譜值被調整,而用於第一頻譜部分921的頻譜線不受包絡線調整影響。之後相乘第二頻譜部分922與923之原始頻譜值,則可計算出完整的再建頻帶,其由再建頻帶之第一頻譜部分組成,以及由再建頻帶920內第二頻譜部分922與923之頻譜線所組成。
較佳地,用於產生頻帶922與923之原始頻譜數據的來源範圍係在頻率上低於此IGF開始頻率309,而再建頻帶920係高於此IGF開始頻率309。
此外,較佳的是再建頻帶邊界與比例因子帶邊界相一致。如此,在一實施例中,一再建頻帶具有對應核心音源解碼器之倍率因子頻帶的尺寸,致使當使用能量配對時,再建頻帶之能量數值係提供兩個或更多數量的倍率因子頻帶之能量。如此,當假設為了比例因子帶4、比例因子帶5以及比例因子帶6執行能量累積,然後再建頻帶920之低頻率邊界係等於比例因子帶4之下邊界,而再建頻帶920之高頻邊界係與比例因子帶6之較高邊界相一致。
後續,討論第9d圖以顯示第9a圖之解碼器之另一功能。音源解碼器900係接收反量化頻譜值,其對應於第一組頻譜部分之第一頻譜部分。另外,如第3b圖所繪示的倍率因子頻帶之倍率因子係提供至一逆縮放方塊940。逆縮放方塊940係提供低於第3a圖之此IGF開始頻率309的所有第一組第一頻譜部分,另外,第一頻譜部分係高於此IGF開始頻率,即第3a圖之第一頻譜部分304、305、306與307,其係全部位於第9d圖之941所繪示的再建頻帶中。此外,在再建頻帶中用於頻率平鋪填充的來源頻 帶之第一頻譜部分係提供至包絡線調整器/計算器942,而此方塊另外接收用於再建頻帶的能量資訊,其係提供作為第9d圖中的943所繪示之編碼音源訊號的參數化輔助資訊。然後,包絡線調整器/計算器942係提供第9b圖以及第9c圖之功能,最後輸出再建頻帶中用於第二頻譜部分之調整頻譜值。在再建頻帶中用於第二頻譜部分的這些調整頻譜值922與923以及再建頻帶中的第一頻譜部分921,其以第9d圖之線941標示,係共同代表再建頻帶之完整的頻譜表現。
後續,參考第10a圖至第10b圖,以說明音源編碼器之較佳實施例,其用於編碼一音源訊號以提供或是產生一編碼音源訊號。編碼器包含一時間/頻譜轉換器1002,其係輸入一頻譜分析器1004,而頻譜分析器1004係一方面連接至一參數計算器1006,而另一方面連接至一音源編碼器1008。音源編碼器1008係提供第一組第一頻譜部分之編碼表現,且不覆蓋第二組第二頻譜部分。在另一方面,參數計算器1006係提供用於再建頻帶的能量資訊,用以覆蓋第一頻譜部分以及第二頻譜部分。此外,音源編碼器1008係用於產生第一組第一頻譜部分之第一編碼表現,其具有第一頻譜解析度。其中音源編碼器1008係提供用於由方塊1002產生之頻譜表現之所有頻帶的倍率因子。另外,如第3b圖所繪示,編碼器係提供能量資訊,其係至少用於再建頻帶,其在頻率上高於第3a圖所繪示之此IGF開始頻率309。如此,再建頻帶較佳地與倍率因子頻帶相一致或是與多組倍率因子頻帶相一致,係給定兩個數值,即來自音源編碼器1008的對應的倍率因子以及參數計算器1006所輸出的能量資訊。
較佳地,音源編碼器具有不同頻寬的倍率因子頻帶,即不同數量之頻譜值。因此,參數化計算器包含一正規化器1012用以正規化用於不同頻寬的能量,其係相對於特定再建頻帶之頻寬。在此,正規化器1012係接收(作為輸入)在頻帶中的能量以及在頻帶中的頻譜值,然後對每個再建/比例因子帶輸出正規化能量。
此外,第10a圖之參數化計算器1006係包含能量數值計算器,其接收來自如第10a圖之線1007所繪示的核心或音源編碼器1008的控制資訊。控制資訊可包含長/短區塊上的資訊,其由音源編碼器及/或分群資訊所使用。因此,當長/短區塊上的資訊以及短視窗上的分群資訊係有關 於“時間”分群,此分群資訊可另外參考一頻譜分群,即兩個倍率因子頻帶分群成單一再建頻帶。因此,當僅頻譜部分分群,能量數值計算器1014係針對每一分群頻帶輸出單一能量數值,以覆蓋第一頻譜部分以及第二頻譜部分。
第10d圖係繪示實現頻譜分群的另一實施例。在此,方塊1016係用於計算兩個鄰近頻帶的能量數值。然後,方塊1018對鄰近頻帶的能量數值係相比較,當能量數值沒有非常不同或是差異小於一門檻值,方塊1020係產生用於兩個頻帶的單一(正規化)數值。如線1019所繪示,可忽略方塊1018此外,方塊1020可執行用於二個或更多頻帶的單一數值之產生,其可由編碼器位元率控制1024所控制。如此,當位元率降低,編碼器位元率控制1024係控制方塊1020以產生用於二個或更多頻帶的單一正規化數值,即使方塊1018內的比較將不讓能量資訊數值進行分群。
在音源編碼器執行二個或更多短視窗的分群之情形中,分群係應用於能量資訊。當核心編碼器執行二個或更多短區塊之分群,然後,為這些二個或更多區塊,僅計算且傳送單一組倍率因子。在解碼器側上,然後音源解碼器為兩個分群視窗使用相同組的倍率因子。
關於能量資訊計算,在再建頻帶內的頻譜值係累積於二個或更多短視窗。換句話說,其代表用於短區塊以及後續的短區塊之特定再建頻帶內的頻譜值累積一起,而為了覆蓋兩個短區塊的再建頻帶僅傳送單一能量資訊數值。然後,在解碼器側上,對於每一個短區塊,第9a圖至第9d圖所討論的包絡線調整並非個別地執行,而是對於該組分群的短視窗一起執行。
然後,再次使用相對應的正常化,使得即使已經執行任何頻率分群或是時間分群,對於解碼器側上的能量數值資訊計算,正常化容易地讓僅必須已知一方面的能量資訊數值、以及再建頻帶中的頻譜線之數量或是該組分群再建頻帶。
在先前技術的BWE機制中,在高於給定所謂的交越頻率的HF頻譜區域之再建係通常根據頻譜修補。通常,HF區域係由多個鄰近修補所構成,且每一修補係源自給定低於交越頻率的LF光譜之複數個帶通(BP)區域。在訊號的一濾波器組表現裡,這樣的系統從LF頻譜複製了一組 鄰近次頻帶係數至所述目標區域。此選定組的邊界通常是依賴於系統,而不依賴於訊號。對於一些訊號內容,靜態修補選擇能導致令人不愉快的音色以及貌似再建訊號。
其他研究透過一訊號自適應的單一側頻帶(Single Side Band,SSB)調變來轉移LF訊號到HF,相較於[1],這樣的研究具有高計算量之複雜度,因為它們在時域取樣上以高取樣速率來操作。也就是,獲得的修補不穩定,尤其是對於非音調訊號(例如清音的語音),且先前技術的訊號自適應修補可產生到訊號裡的障礙。
本發明研究被稱為智能間隙填充(IGF)以及在其較佳的配置裡,根據一時間頻率轉換,如變更型離散餘弦轉換(MDCT),此智能間隙填充(IGF)被應用在一BWE系統裡。然而,本發明之教示可應用於一般類似正交鏡像濾波器組(Quadrature Mirror Filterbank,QMF)為基礎的系統。
基於MDCT之IGF配置的優點在於其根據音源編碼器可無縫整合至MDCT,例如,MPEG進階音源編碼(MPEG Advanced Audio Coding,AAC)針對波形音源編碼以及BWE,分享相同的轉換大量減少了對音源編解碼器之全部計算的複雜度。
而且,此發明提供了針對先前技術之自適應修補方案所發現的固有穩定性問題。
所提出之系統根據對於一些訊號的發現,一個非控制的修補選擇能導致音色改變以及訊號歪曲。如果一個訊號是在頻譜來源區域(SSR)裡的音調但是為一雜訊,如在頻譜目標區域(STR)裡修補此雜訊,如STR由音調SSR修補,將導致一不自然的音色。自從訊號的音調結構可能透過修補過程以獲得錯位或摧毀,此訊號的音色也能變化。
此提出的IGF系統執行使用交叉相關性的一智能平鋪選擇,以作為一特別SSR及一特殊STR之間的相似度測量。此兩訊號的交叉相關性提供了那些訊號的相似度測量、最大相關性之延遲以及其符號,因此,基於平鋪選擇的一相關性的研究也能被精確地用於調整複製頻譜的頻譜位移,以儘可能地接近原始頻譜結構。
本系統之基本貢獻是一合適相似度測量的選擇,以及用來穩定平鋪選擇處理之技術。所提出的技術提供了在瞬間訊號適應以及在同時 間之時域穩定性間的一最佳平衡。時域穩定性之提供對於具有SSR及STR之低相似度之訊號尤其重要,因此,展示低交叉相關性數值或是如果相似度測量被使用是模棱兩可的。在此案例中,穩定性預防了自適應性平鋪選擇的虛擬亂數行為。
例如,針對目前技術特徵在於一明顯的能量集中的BWE,一類訊號時常對任意頻譜區域造成問題,如第12a圖(左)所繪示。雖然有複數個方法可以用來調整頻譜包絡線以及在目標區域內的再建頻譜的音調,但對於一些訊號來說,這些方法仍無法保留音色,如第12a圖(右)所繪示。在第12a圖之範例中,在原始訊號的目標區域內的頻譜振幅近線性地減少,此原始訊號在一所謂的交越濾波頻率fxover(如第12a圖左)上。相比之下,在再建頻譜(如第12a圖右)內存在被認為是一音色色彩假造物的一明顯的波谷及波峰組。
新方法的一重要步驟係為定義一組平鋪,其中包括可根據選擇來取代後續的相似性。首先,必須定義來源區域以及目標區域兩者的平鋪邊界彼此之間的關聯。因此,在核心編碼器fIGFstart的IGF開始頻率以及一最高可取得的頻率fIGFstop之間的目標區域可被細分為平鋪的一任意整數nTar,每個任意整數nTar具有一個別的預設值。接著,對於每個目標平鋪tar[idx_tar],一組大小相等的來源平鋪src[idx_src]被產生。藉此,IGF系統的基本自由度被決定。複數個來源平鋪nSrc的總數是由來源區域的頻寬所決定,bw src =(f IGFstart -f IGFmin )
在此,fIGFmin係為平鋪選擇的最低可得頻率,使得複數個來源平鋪的一整數nSrc符合bwsrc。複數個來源平鋪的最小值為零。
為了進一步增加選擇及調整的自由度,可藉由在0至1之間的一重疊因數來定義複數個來源平鋪為彼此相互重疊,在此,0意味著沒有重疊且1意味著100%重疊。100%重疊情況表示僅可得到一個來源頻鋪或沒有來源頻鋪。
第12b圖係繪示一組平鋪邊界的一範例。在本例中,全部的目標平鋪相關聯於每個來源平鋪。在此實施例中,來源平鋪被重疊了50%。
對於一目標平鋪,交越相關性與各種來源平鋪是在延遲到 xcorr_maxLag段進行計算。針對一給定目標平鋪idx_tar以及一來源平鋪idx_src,xcorr_val[idx_tar][idx_src]給定複數個平鋪之間的絕對交越相關性,而xcorr_lag[idx_tar][idx_src]給定在xcorr_lag[idx_tar][idx_src]上的交越相關性的延遲。
參數xcorr_lag被用以控制在來源平鋪以及目標平鋪之間的匹配精密度。此參數導致少數的假造物,且有助於更好地保留訊號的音色及色彩。
在一些少數的情況中,其可能發生一特定目標平鋪值大於可取得的複數個來源平鋪值。在此情況中,可取得的來源平鋪需要時常重複進行,以完全地填充特定目標平鋪。其仍可能執行在目標平鋪以及較小的來源平鋪之間的交越相關性,且針對交越相關性延遲lag xcorr_lag以及符號xcorr_sign,較小的來源平鋪係用以取得在目標平鋪內的來源平鋪的最佳位置。
原始頻譜平鋪以及原始訊號的交越相關性未必是最合適的相似性測量,此相似性測量被適用於具有強共振峰結構的音源頻譜。一頻譜的白化移除粗略的包絡線資訊,且從而強調主要用以計算平鋪相似度的頻譜精細結構。針對由IGF處理的複數個區域,白化也有助於在解碼器上的STR的一個簡單包絡線塑型。因此,選擇性地,在計算交越相關性之前,目標訊號以及來源訊號被白化。
在其他的配置中,僅有一個平鋪是使用預處理進行白化。一傳遞的白化標記指出,解碼器相同的預先白化處理將在IGF內被應用於頻譜平鋪白化。
針對白化訊號,首先,一頻譜包絡線估計值被計算。接著,MDCT頻譜值可被除以頻譜包絡線。頻譜包絡線估計值可以在MDCT頻譜值、MDCT頻譜能量以及基於複數功率頻譜或功率頻譜估計值的MDCT上進行估計。訊號的包絡線被估計,此訊號從現在開始將被稱為基底訊號。
基於複數功率頻譜或功率頻譜,複數個包絡線估計值在MDCT上作為基底訊號進行計算,且此基底訊號有不具有在複數個音調成分上的時間波動的優點。
如果基底訊號在一能量域內,MDCT頻譜值必須被除以包 絡線之平方根,以正確地白化訊號。
計算包絡線有不同的方法:
●轉換具有一離散餘弦轉換(DCT)的基底訊號,僅保留較低的DCT係數(設定成最初的零),且接著計算一反向DCT
●計算一組計算於時域音源訊框的線性預測係數(LPC)的一頻譜包絡線
●濾波具有一低通濾波器的基底訊號
較佳地,選擇最後的方法。對於要求較低的計算複雜度的應用,一些簡化可以做到一MDCT頻譜的白化首先,包絡線是由一移動平均計算。在此,每個MDCT段僅需要兩個處理器週期。接著,為避免除法以及平方根的計算,頻譜包絡線近似於2n,此n是包絡線的整數對數。在此領域的平方根操作變成簡單的一移位操作,此外,除以包絡線可透過另一移位操作來進行。
在計算具有每個目標平鋪的每個來源平鋪的相關性之後,具有最高相關性的來源平鋪被選擇性的替換每個nTar目標平鋪。為了最佳地匹配原始頻譜結構,相關性的延遲藉由轉換位元的一整數進行調節。在奇數延遲的情況中,頻鋪被額外地被乘上-1/1之一串交替的頻譜,以補償在MDCT內的每個其他頻帶的頻率反轉表現。
第12c圖係繪示在一來源平鋪以及一目標平鋪之間的相關性之一範例。在此範例中,相關性的延遲為5,所以來源平鋪必須被調節成5位元,以使其接近在BWE演算法的複製階段內的較高頻率位元。此外,平鋪的符號必須被翻轉作為負值的最高相關值,如上所述,一額外的調節導致奇數延遲。
所以從編碼器傳輸至解碼器的側資訊總量可由下列數據組成:
●tileNum[nTar]:每個目標平鋪的選擇性來源平鋪的索引
●tileSign[nTar]:目標平鋪的符號
●tileMod[nTar]:每個目標平鋪的相關性延遲
平鋪縮減以及穩定在IGF內是一個重要的步驟,使用一個範例來說明其必要性以及優點。假設一靜止的音調音源訊號,像是一穩定 的律館音符。如果對於一給定目標區域,來源平鋪皆從相同的來源區域被選擇,此來源平鋪橫跨複數個訊框,邏輯驅使被引進的至少一假造物。即使訊號被假設為靜止,因另一相同地相似來源區域的相似性測量(例如相關性),而使每個訊號的狀況無法保持好,且此另一相同地相似來源區域可主導相似性結果(交越相關性)。這導致在複數個鄰近訊框之間的tileNum[nTar]在兩個或三個非常相似的選擇之間搖擺。這可以是一個討厭的音樂雜訊,像是假造物。
為了消除此種假造物,此組來源平鋪將被縮減以保留的來源組的成員最大的相異性。這是透過一組來源平鋪來實現S={s1,s2,...sn}
如下所示,對於任何的來源平鋪si,我們使所有其他來源平鋪相互關聯,在si以及sj之間發現最大的相關性並儲存於一矩陣Sx。在此,Sx[i][j]包含在si以及sj之間的最大絕對交叉相關性數值。沿著行增加矩陣Sx,提供我們具有所有其他來源平鋪T的一來源平鋪si的交叉相關性總值。
T[i]=Sx[i][1]+Sx[i][2]...+Sx[i][n]
在此,T代表如何使一來源較高相似於其他的來源平鋪的一測量。如果對於任何來源平鋪i,T>臨界值
因與其他的來源平鋪有很高的關聯性,來源平鋪i可從此組潛在的複數個來源中去除。源自此組平鋪的具有低相關性的平鋪被選擇作為此子集合的一代表平鋪,此子集合的平鋪滿足第一方程式的條件。這樣一來,我們可以確定複數個來源平鋪彼此之間有最高的相異性。
平鋪縮減方法還涉及使用於先前訊框之一縮減平鋪記憶體組。如果活躍於先前訊框的複數個平鋪被保留於下一個訊號,則存在用於縮減的可選擇的複數個候選。
讓平鋪s3、s4以及s5活躍在訊框k內的平鋪{s1,s2...,s5}之外,接著,即使s1,s3以及s2在訊框k+1中被爭奪消除s3與其他的最高相關性,s3仍然被保留,因其在先前訊框為一有用的來源平鋪,因此保留此組來源平鋪對於執行在平鋪選擇內的時間持續是有益的。較佳的是,將此方法應用於在來源i以及目標j之間的交越相關性,以Tx[i][j]作為最佳 的表示。
如果在相關聯於目標平鋪的目前訊框k中沒有來源訊框,一種平鋪穩定的額外方法為從先前訊框k-1保留平鋪次序。如果在來源i以及目標j之間的交越相關性可以發生,其可能發生作為表示的Tx[i][j],其所有i及j的值非常小。
例如,如果Tx[i][j]<0.6
一暫定臨界值現在被使用,然後對於訊框k的所有nTartileNum[nTar]k=tileNum[nTar]k-1
上述兩種技術大量降低假造物,此假造物從快速變化的平鋪量組產生,此平鋪量組跨越複數個訊框。平鋪縮減以及穩定的另一個附加的優點為,不需額外的資訊被發送至解碼器且也不需要改變解碼器的架構。在此提出的平鋪縮減係為一巧妙的方法,可降低潛在的音樂雜訊,像是假造物或在平鋪的複數個光譜區內的過度雜訊。
第11a圖係繪示一種解碼編碼音源訊號之音源解碼器。音源編碼器包含一音源(核心)解碼器1102以產生第一組第一頻譜部分之一第一解碼表現,此解碼表現具有一第一頻譜解析度。
此外,音源解碼器包含一參數化解碼器1104以產生一第二組第二頻譜表現之一第二解碼表現,此第二頻譜表現具有低於第一頻譜解析度的一第二頻譜解析度。此外,一頻率再生器1106提供接收一第一輸入1101、解碼第一頻譜部分以及一第二輸入1103參數資訊,且此參數資訊包含每個目標頻率平鋪或目標再建頻帶的一來源範圍資訊。頻率再生器1106接著透過使用源自來源範圍的複數個頻譜值施加頻率再生,以針對目標範圍產生頻譜數據,此來源範圍是透過匹配資訊來定義。接著,第一頻譜部分1101以及頻率再生器1107兩者的輸出被輸入至一頻譜時間轉換器1108,以產生最後的解碼音源訊號。
較佳地,音源解碼器1102係為一頻譜域解碼器,但音源解碼器也可被實現作為任何其他的音源解碼器,例如一時間域或參數化音源解碼器。
如第11b圖所示,頻率再生器1106可包含區塊1120的功 能,區塊1120繪示奇數延遲的一來源範圍選擇頻譜調整器,而當一白化標記1123被提供時,繪示一白化濾波器1122,此外,區塊1120繪示具有調整功能的一頻譜包絡線,此調整功能被使用原始頻譜數據實現且繪示於區塊1128,此原始頻譜數據由區塊1120、區塊1122或其組合所產生。此外,頻率再生器1106可包含反應於一白化標記1123的一開關1124。當白化標記被設定,奇數延遲的來源範圍選擇器/平鋪調節器的輸出被輸入至白化濾波器1122。然而,對於一特別再建頻帶不設置白化標記1123,接著,一旁通線1126被激活,以使區塊1120的輸出被提供至頻譜包絡線調整區塊1128且沒有任何白化。
在位元流中可能有至少一白化(1123)階級被訊號化,且對於每個平鋪這些階級可被訊號化。在此情況中,每個平鋪有三個階級被訊號化,它們將以下列的方法進行編碼:
MID_WHITENING以及STRONG_WHITENING意味著不同的白化濾波器(1122)可以使用不同的方法以計算包絡線(如前文所述)。
當僅有一個粗略的頻譜平鋪選擇方案被應用時,編碼器側頻率再生器可被一來源範圍ID 1121控制。然而,當一微調頻譜平鋪選擇方案 被應用時,接著,額外地提供一來源範圍延遲1119。此外,提出的相關性計算提供一負值結果,接著,此外,一相關性符號也可被施加於區塊1120,以使頁面的每個數據頻譜線被乘以“-1”,藉此產生負號。
因此,本發明如第11a圖及第11b圖所描述,針對一特定目的範圍或一目標範圍,可確保一最佳音源品質被獲得是由於最佳匹配來源範圍被計算及應用於編碼器側上。
第11c圖係編碼音源訊號之特定音源編碼器,此音源訊號包含一時間頻譜轉換器1130以及一隨後連接的頻譜分析器1132,此外,此音源訊號更包含一參數化計算器1134以及一核心編碼器1136。核心編碼器1136輸出複數個編碼來源範圍,參數計算器1134針對複數個目標範圍以輸出匹配資訊。
針對複數個目標範圍,複數個編碼來源範圍與匹配資訊一起被傳輸至一解碼器,以使被繪示於第11a圖的解碼器位於用以執行一頻率再生的位置上。
參數化計算器1134係用以計算第一頻譜部分以及第二頻譜部分之間的相似度,以及用以根據計算的相似度並針對一第二頻譜部分,將一第一匹配頻譜部分與一第二頻譜部分進行匹配。較佳地,不同來源範圍以及目標範圍的匹配結果被繪示於第12a圖及第12b圖,以決定包含第二頻譜部分以及參數計算器的一選擇的匹配對,此參數化計算器被用以提供此匹配資訊,此匹配資訊定義進入一編碼音源訊號的匹配對。較佳地,參數化計算器1134係用以使用在第二組第二頻譜部分內的複數個預定目標區域或在第一組第一頻譜部分內的複數個預定來源區域,如在圖12b中。較佳地,預定目標區域為非重疊的來源區域或重疊的預定來源區域。當預定來源區域為第一組第一頻譜部分的一子集合,此第一組第一頻譜部分低於第3a圖的一間隙填充開始頻率309。較佳地,預定目標區域覆蓋一較低頻譜區域,此較低頻譜區域與其具有間隙開始頻率的較低頻率邊界相一致,以使任何目標範圍位於間隙開始頻率之上且來源範圍位於間隙填充開始頻率之下。
如上所述,藉由將一目標區域與一來源區域做比較以取得一細粒度,沒有任何延遲的來源區域以及相同的來源區域,但具有一特定延 遲。複數個延遲被施加於第11d圖的交越相關性計算器1140,匹配資訊選擇對最後由平鋪選擇器1144執行。
此外,較佳的是執行繪示於區塊1142上的一來源範圍白化及/或目標範圍白化。區塊1142接著提供給位元流一白化標記,此位元流被使用於控制第11b圖的解碼器側上的開關1123。此外,如果交越相關性計算器1140提供一負值結果,接著此負值結果也被訊號化至一解碼器。因此,在一較佳的實施例,平鋪選擇器針對一目標範圍以及一延遲以輸出一來源範圍ID,且區塊1142額外地提供一白化標記。
此外,參數化計算器1134係用以藉由降低潛在的複數個來源區域的數量,以執行一來源平鋪縮減1146,在此潛在的複數個來源區域內的一來源修補根據一相似度門檻值從一組潛在的來源平鋪中去除。因此,當兩個來源平鋪大於或等於一相似度門檻值時,這兩個來源頻鋪的其中一個將被從此組潛在的來源頻鋪中去除,且移除的來源頻鋪不被使用於任何更進一步的處理,尤其是,不會被平鋪選擇器1144選擇,或是不會使用在不同的來源範圍以及目標範圍之間的交越相關性計算,此交越相關性計算是由區塊1140所執行。
不同的實施例已被描述於相對應的圖示。第1a圖至第5c圖係為關於一完整速率或一完整頻寬編碼器/解碼器方案。第6a圖至第7e圖係關於具有TNS或TTS處理的一編碼器/解碼器方案。第8a圖至第8e圖係關於具有特定兩個聲道處理的一編碼器/解碼器方案。第9a圖至第10d圖係關於一特定能量資訊的計算及應用。第11a圖至第12c圖係關於平鋪選擇的一特定方法。
在本發明,所有不同的方法彼此可獨立地使用,或是如第2a圖繪示的基本地一起應用。然而,特定的兩個聲道處理可被應用於如第13圖所繪示的一編碼器/解碼器方案,對於TNS/TTS處理也是如此,包絡線能量資訊計算及應用於再建頻帶或自適應來源範圍識別以及相對的應用於編碼器側上。在另一方面,全部的速率方面可被施加或不施加TNS/TTS處理、兩個聲道處理、一自適應來源區域識別或頻譜包絡線表現之其他種類的能量計算。因此,很顯然這些個別方案的其中之一的複數個特徵也可應用於其他方面。
雖然一些態樣已經在編碼或是解碼裝置之內容中描述,清楚的是這些態樣亦代表相對應的方法之描述,而方塊或是裝置係對應方法步驟或是方法步驟之特徵。同樣地,在方法步驟之內容中描述的態樣亦代表相對應的方塊或是項目或是相對應裝置之特徵的描述。一些或所有的本方法步驟可藉由(或是使用)硬體裝置執行,例如像是微處理器、可程式化電腦或是電子電路。在一些實施例中,一些最重要的方法步驟可藉由此種裝置執行。
取決於特定的執行需求,本發明的實施例可在硬體或是在軟體上實現。此實現方式可使用非暫時性儲存媒體,例如數位儲存媒體,例如儲存有電子可讀取控制訊號的軟碟、Hard Disk Drive(HDD),a DVD、藍光、CD、ROM、PROM以及EPROM、EEPROM或是FLASH記憶體,其能與一可程式化電腦系統合作(或是能夠配合)以執行上述方法。因此,此數位儲存媒體係電腦可讀取。
根據本發明之一些實施例包含具有電子可讀取控制訊號的數據載體,其能夠與可程式化電腦系統配合,以執行上述方法中的其中一個。
通常,本發明之實施例可實現為一具有程式碼的電腦程式產品,當此電腦程式產品在一電腦上執行時此程式碼係操作以執行上述方法中的其中一個。例如,此程式碼可儲存在機器可讀取載體上。
其他實施例包含用以執行上述方法中的其中一個的電腦程式,其儲存在機器可讀取載體上。
換句話說,因此發明的方法之實施例係為具有當此電腦程式在電腦上執行時,能執行上述方法中的其中一個的程式碼的電腦程式。
因此,本發明的方法之另一實施例數據載體(或是數位儲存媒體或是電腦可讀取媒體)包含紀錄用以執行上述方法中的其中一個的電腦程式。此數據載體,此數位儲存媒體或是紀錄媒體係有形實體及/或非暫時的。
因此,本發明的方法之另一實施例係為一數據流或是一串訊號,其代表用於執行上述方法中的其中一個的電腦程式。例如,數據流或是此串訊號可配置經由數據通訊連接傳輸,例如網際網路。
另一實施例包含一處理裝置,例如,電腦或是可程式化邏輯裝置,用以或是採用執行上述方法中的其中一個。
另一實施例包含一安裝有用於執行上述方法中的其中一個之電腦程式的電腦。
根據本發明之另一實施例包含用以傳輸(例如電性或光學)用於執行上述方法中的其中一個的電腦程式到接收器的裝置或是系統。例如,此接收器可為一電腦、移動式裝置、記憶體裝置或其他相似裝置。例如,此裝置或是系統可包含用於傳輸電腦程式至接收器的檔案伺服器。
在一些實施例中,可程式化邏輯裝置(例如場效可程式化閘極陣列)可用以執行上述方法之一些或是全部功能。在一些實施例中,為了執行上述方法中的其中一個,場效可程式化閘極陣列可配合微處理器。通常,此方法可藉由任何硬體裝置較佳執行。
在較佳實施例之詳細說明中所提出之具體實施例僅用以方便說明本發明之技術內容,而非將本發明狹義地限制於上述實施例,在不超出本發明之精神及以下申請專利範圍之情況,所做之種種變化實施,皆屬於本發明之範圍。
參考文獻:
[1] Dietz, L. Liljeryd, K. Kjörling and O. Kunz, “Spectral Band Replication, a novel approach in audio coding,” in 112th AES Convention, Munich, May 2002.
[2] Ferreira, D. Sinha, “Accurate Spectral Replacement”, Audio Engineering Society Convention, Barcelona, Spain 2005.
[3] D. Sinha, A. Ferreiral and E. Harinarayanan, “A Novel Integrated Audio Bandwidth Extension Toolkit (ABET)”, Audio Engineering Society Convention, Paris, France 2006.
[4] R. Annadana, E. Harinarayanan, A. Ferreira and D. Sinha, “New Results in Low Bit Rate Speech Coding and Bandwidth Extension”, Audio Engineering Society Convention, San Francisco, USA 2006.
[5] T. Żernicki, M. Bartkowiak, “Audio bandwidth extension by frequency scaling of sinusoidal partials”, Audio Engineering Society Convention, San Francisco, USA 2008.
[6] J. Herre, D. Schulz, Extending the MPEG-4 AAC Codec by Perceptual Noise Substitution, 104th AES Convention, Amsterdam, 1998, Preprint 4720.
[7] M. Neuendorf, M. Multrus, N. Rettelbach, et al., MPEG Unified Speech and Audio Coding-The ISO/MPEG Standard for High-Efficiency Audio Coding of all Content Types, 132nd AES Convention, Budapest, Hungary, April, 2012.
[8] McAulay, Robert J., Quatieri, Thomas F. “Speech Analysis/Synthesis Based on a Sinusoidal Representation”. IEEE Transactions on Acoustics, Speech, And Signal Processing, Vol 34(4), August 1986.
[9] Smith, J.O., Serra, X. “PARSHL: An analysis/synthesis program for non-harmonic sounds based on a sinusoidal representation”, Proceedings of the International Computer Music Conference, 1987.
[10] Purnhagen, H.; Meine, Nikolaus, "HILN-the MPEG-4 parametric audio coding tools," Circuits and Systems, 2000. Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium on, vol.3, no., pp.201,204 vol.3, 2000
[11] International Standard ISO/IEC 13818-3, Generic Coding of Moving Pictures and Associated Audio: Audio”, Geneva, 1998.
[12] M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder, K. Akagiri, H. Fuchs, M. Dietz, J. Herre, G. Davidson, Oikawa: "MPEG-2 Advanced Audio Coding", 101st AES Convention, Los Angeles 1996
[13] J. Herre, “Temporal Noise Shaping, Quantization and Coding methods in Perceptual Audio Coding: A Tutorial introduction”, 17th AES International Conference on High Quality Audio Coding, August 1999
[14] J. Herre, “Temporal Noise Shaping, Quantization and Coding methods in Perceptual Audio Coding: A Tutorial introduction”, 17th AES International Conference on High Quality Audio Coding, August 1999
[15] International Standard ISO/IEC 23001-3:2010, Unified speech and audio coding Audio, Geneva, 2010.
[16] International Standard ISO/IEC 14496-3:2005, Information technology - Coding of audio-visual objects - Part 3: Audio, Geneva, 2005.
[17] P. Ekstrand, “Bandwidth Extension of Audio Signals by Spectral Band Replication”, in Proceedings of 1st IEEE Benelux Workshop on MPCA, Leuven, November 2002
[18] F. Nagel, S. Disch, S. Wilde, A continuous modulated single sideband bandwidth extension, ICASSP International Conference on Acoustics, Speech and Signal Processing, Dallas, Texas (USA), April 2010
602‧‧‧頻譜域音源解碼器
603‧‧‧頻譜預測殘餘數值、殘餘數值
604‧‧‧頻率再生器
606‧‧‧頻譜預測濾波器、頻譜反向預測濾波器、反向預測濾波器、步驟
607‧‧‧濾波器資訊、線、預測濾波器資訊、來自數據串流之濾波器資訊

Claims (19)

  1. 一種用於解碼一編碼音源訊號之裝置,包含:一頻譜域音源解碼器(602),係用以產生一第一組第一頻譜部分之一第一解碼表現,將該第一解碼表現係作為頻譜預測剩餘數值;一頻率再生器(604),係使用該第一組第一頻譜部分之一第一頻譜部份以產生一再建第二頻譜部分,其中該再建第二頻譜部分及該第一組第一頻譜部分包含頻率預測剩餘數值;以及一反向預測濾波器(606,616,626),係針對使用一預測濾波器資訊(607)之該第一組第一頻譜部份以及該再建第二頻譜部份,執行一隨頻率改變之反向預測,該隨頻率改變之反向預測則使用該頻譜預測剩餘數值,且該預測濾波器資訊(607)係包含於該編碼音源訊號。
  2. 如申請專利範圍第1項之裝置,更包含一頻譜包絡線塑形器(614)以塑形該反向預測濾波器(606)之一輸入訊號或一輸出訊號之一頻譜包絡線。
  3. 如申請專利範圍第2項之裝置,其中該編碼音源訊號包含針對該第二頻譜部分之該頻譜包絡線資訊,該頻譜包絡線資訊具有一第二頻譜解析度,且該第二頻譜解析度係低於關聯於該第一解碼表現之一第一頻譜解析度,其中該頻譜包絡線塑形器(624)係應用一頻譜包絡線塑形操作於該反向預測濾波器(622)之輸出上,其中在預測濾波之前,該濾波器資訊(607)已藉由使用一音源訊號決定,或其中當藉由使用在一編碼器內預測濾波後的一音源訊號來決定該預測濾波器資訊(607)時,該頻譜包絡線塑形器(614)係用以執行一頻譜包絡線塑形操作於該反向預測濾波器(616)之輸入上。
  4. 如申請專利範圍第1項之裝置,更包含一頻率時間轉換器(212),該頻率時間轉換器(212)係用以將該反向預測濾波器(210)之一輸出或該反向預測濾波器(210)之一包絡線塑形輸出轉換成一時域表示。
  5. 如申請專利範圍第1項之裝置,其中該反向預測濾波器(606)係為由該預測濾波器資訊(607)所定義之一複數濾波器。
  6. 如申請專利範圍第1項之裝置,其中該頻譜域音源解碼器(602)係用以產生該第一解碼表現,使該第一解碼表現具有一Nyquist頻率,該Nyquist頻率係等於由該反向預測濾波器(606)之一輸出之時間頻率轉換所產生之一時間域訊號之一取樣率。
  7. 如申請專利範圍第1項之裝置,其中該頻譜域音源解碼器(602)係針對在該第一解碼表現裡之一最高頻率,用以使該最高頻率透過一頻譜值表示,該最高頻率係等於在一時間表現裡所包含之一最高頻率,該時間表現係由頻率時間轉換該預測濾波器(606)之一輸出所產生,其中在該第一表現裡最高頻率之該頻譜值係為零值或非零值。
  8. 如申請專利範圍第1項之裝置,其中一第一組第一頻譜部分之該第一解碼表現包含實數頻譜值,其中該裝置更包含一估計器(724),該估計器(724)係用以從該第一組第一頻譜部分之實數值估計該第一組第一頻譜部分之虛部值,且其中該反向預測濾波器(728)係為複數值預測濾波器資訊(714)所定義之一複數反向預測濾波器,且其中該裝置更包含一頻率時間轉換器(730),該頻率時間轉換器(730)係用以執行將一複數值頻譜轉換成一時間域音源訊號。
  9. 如申請專利範圍第1項之裝置,其中該反向預測濾波器(606,728)係用以執行複數個子濾波器,其中每一該複數個子濾波器係與一再建頻帶之一頻率邊界相一致,該頻率邊界係與一頻率平鋪相一致。
  10. 一種用於解碼一音源訊號之裝置,其包含:一時間頻譜轉換器(100,702),係用以將一音源訊號(99)轉換成一頻譜表現;一預測濾波器(704),係用以執行在頻譜表現上之一隨頻率改變之預測,以產生頻頻預測剩餘數值,該預測濾波器係從該音源訊號所得到之濾波器資訊所定義;一音源編碼器(708),係用以編碼該頻譜剩餘數值之一第一組第一頻譜部分,以取得具有一第一頻譜解析度之一編碼第一組第一頻譜值;一參數化編碼器(706),係用以參數化編碼具有一第二頻譜解析度之該頻譜剩餘數值或該頻譜表現數值之一第二組第二頻譜部分,該第二 頻譜解析度低於該第一頻譜解析度;以及一輸出介面(710),係用以輸出一編碼訊號,該編碼訊號包含該編碼第二組、該編碼第一組以及該濾波器資訊(714)。
  11. 如申請專利範圍第10項之裝置,其中該時間頻譜轉換器係用以執行一修改型離散餘弦轉換,且其中該頻譜剩餘數值係為修改型離散餘弦轉換之頻譜剩餘數值。
  12. 如申請專利範圍第10項之裝置,其中該預測濾波器(704)包含一濾波器資訊估計器,該濾波器資訊估計器係用以使用一頻譜表示之頻譜值以計算該濾波器資訊,且其中該預測濾波器係用以使用該頻譜表現之頻譜值以計算該頻譜剩餘數值,其中該頻譜值係用以計算被輸入至從相同音源訊號所得到之預測濾波器之該濾波器資訊及該頻譜值。
  13. 如申請專利範圍第10項之裝置,其中該預測濾波器包含一濾波器估計器,該濾波器估計器係用以使用從一TNS開始頻率至一TNS停止頻率之頻譜值來計算該濾波器資訊,其中該TNS開始頻率低於4kHz,且該TNS停止頻率高於9kHz。
  14. 如申請專利範圍第10項之裝置,更包含一分析器(102,706),該分析器係用以決定被該音源編碼器(708)編碼之該第一組第一頻譜部分,且該分析器使用一間隙填充頻率,其中低於該間隙填充開始頻率之頻譜部分為第一頻率部分,以及其中該TNS開始頻率高於該間隙填充頻率。
  15. 如申請專利範圍第10項之裝置,其中該時間頻率轉換器(702)係用以提供一複數頻譜表現,其中該預測濾波器係用以執行一隨頻率變化之預測,該隨頻率變化之預測具有該複數值頻譜表現,以及其中該濾波器資訊(714)係用以定義一複數反向預測濾波器。
  16. 一種用於解碼一編碼音源訊號之方法,其包含:產生(602)一第一組第一頻譜部分之一第一解碼表現,且將該第一解碼表現作為頻譜預測剩餘數值;使用該第一組一第一頻譜部分之第一頻譜部分,以再生(604)一再建第二頻譜部分,其中該再建第二頻譜部分以及該第一組一第一頻譜部 分包含頻譜預測剩餘數值;以及針對該第一組一第一頻譜部分及該再建第二頻譜部分,執行(606,616,626)一隨頻率變化之反向預測,該隨頻率改變之反向預測使用該頻譜預測剩餘數值,且該預測濾波器資訊(607)係包含於該編碼音源訊號;其中該方法更包含使用一頻譜包絡線塑形器(614)以塑形該反向預測濾波器(606)之一輸入訊號或一輸出訊號之一頻譜包絡線。
  17. 如申請專利範圍第16項之方法,其中該編碼音源訊號包含針對該第二頻譜部分之頻譜包絡線資訊,該頻譜包絡線資訊係具有一第二頻譜解析度,且該第二頻譜解析度低於該第一解碼表現之一第一頻譜解析度,其中該再生(604)包含一頻譜包絡線塑形(624),該頻譜包絡線塑形(624)包含執行一頻譜包絡線塑形操作於步驟(606,616,626)之一輸出,以執行一隨頻率變化之反向預測,其中在預測濾波之前,該濾波器資訊(607)已透過使用一音源訊號決定,或其中該再生(604)包含一頻譜包絡線塑形(624),當該預測濾波器資訊(607)已透過使用在一編碼器內之一預測濾波之後的一音源訊號決定時,該頻譜包絡線塑形包含執行一頻譜包絡線塑形操作於步驟(606,616,626)之一輸入,以執行一隨頻率變化之反向預測。
  18. 一種編碼一音源訊號之方法,其包含:將(100,702)一音源訊號(99)轉換成一頻譜表現;執行(704)一隨頻率變化之預測於該頻譜表現,以產生頻譜剩餘數值,且該預測濾波器由從該音源訊號所得到之濾波器資訊所定義;編碼(708)該頻譜剩餘數值之一第一組第一頻譜部分,以取得具有一第一頻譜解析度之一編碼第一組第一頻譜值;參數化地編碼(706)具有一第二頻譜解析度之該頻譜剩餘數值或該頻譜表現數值之一第二組第二頻譜部分,該第二頻譜解析度低於該第一頻譜解析度;以及輸出(710)一編碼訊號,該編碼訊號包含該編碼第二組、該編碼第一組以及該濾波器資訊(714)。
  19. 一種電腦程式,當執行於一電腦或一處理器時,該電腦程式係用以執行申請專利範圍第16項之方法或申請專利範圍第18項之方法。
TW103124630A 2013-07-22 2014-07-17 使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法 TWI541797B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13177350 2013-07-22
EP13177353 2013-07-22
EP13177348 2013-07-22
EP13177346 2013-07-22
EP13189358.8A EP2830061A1 (en) 2013-07-22 2013-10-18 Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping

Publications (2)

Publication Number Publication Date
TW201523590A true TW201523590A (zh) 2015-06-16
TWI541797B TWI541797B (zh) 2016-07-11

Family

ID=49385156

Family Applications (7)

Application Number Title Priority Date Filing Date
TW103124628A TWI555009B (zh) 2013-07-22 2014-07-17 使用適應性頻譜平鋪選擇進行解碼及編碼的裝置及方法
TW103124629A TWI545561B (zh) 2013-07-22 2014-07-17 用於解碼具有頻率平鋪適應之編碼音源訊號的裝置
TW103124630A TWI541797B (zh) 2013-07-22 2014-07-17 使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法
TW103124626A TWI545558B (zh) 2013-07-22 2014-07-17 使用重構頻帶之能量資訊值之音頻訊號之編碼或解碼裝置與方法
TW103124622A TWI545560B (zh) 2013-07-22 2014-07-17 具有在頻譜域填充有智慧間隙之音頻訊號之編碼或解碼裝置與方法
TW103124623A TWI555008B (zh) 2013-07-22 2014-07-17 使用在智慧間隙填充架構內之雙聲道處理之音頻編碼器、音頻解碼器及相關方法
TW103124811A TWI549121B (zh) 2013-07-22 2014-07-18 利用在過渡頻率之交叉濾波器之編碼音頻訊號之解碼裝置與方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW103124628A TWI555009B (zh) 2013-07-22 2014-07-17 使用適應性頻譜平鋪選擇進行解碼及編碼的裝置及方法
TW103124629A TWI545561B (zh) 2013-07-22 2014-07-17 用於解碼具有頻率平鋪適應之編碼音源訊號的裝置

Family Applications After (4)

Application Number Title Priority Date Filing Date
TW103124626A TWI545558B (zh) 2013-07-22 2014-07-17 使用重構頻帶之能量資訊值之音頻訊號之編碼或解碼裝置與方法
TW103124622A TWI545560B (zh) 2013-07-22 2014-07-17 具有在頻譜域填充有智慧間隙之音頻訊號之編碼或解碼裝置與方法
TW103124623A TWI555008B (zh) 2013-07-22 2014-07-17 使用在智慧間隙填充架構內之雙聲道處理之音頻編碼器、音頻解碼器及相關方法
TW103124811A TWI549121B (zh) 2013-07-22 2014-07-18 利用在過渡頻率之交叉濾波器之編碼音頻訊號之解碼裝置與方法

Country Status (20)

Country Link
US (24) US10332539B2 (zh)
EP (20) EP2830065A1 (zh)
JP (11) JP6306702B2 (zh)
KR (7) KR101809592B1 (zh)
CN (12) CN110660410B (zh)
AU (7) AU2014295301B2 (zh)
BR (11) BR122022010958B1 (zh)
CA (8) CA2918524C (zh)
ES (9) ES2908624T3 (zh)
HK (1) HK1211378A1 (zh)
MX (7) MX354657B (zh)
MY (5) MY184847A (zh)
PL (8) PL3407350T3 (zh)
PT (7) PT3017448T (zh)
RU (7) RU2646316C2 (zh)
SG (7) SG11201600464WA (zh)
TR (1) TR201816157T4 (zh)
TW (7) TWI555009B (zh)
WO (7) WO2015010953A1 (zh)
ZA (5) ZA201502262B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
TWI702780B (zh) * 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104221082B (zh) 2012-03-29 2017-03-08 瑞典爱立信有限公司 谐波音频信号的带宽扩展
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
BR112016004299B1 (pt) * 2013-08-28 2022-05-17 Dolby Laboratories Licensing Corporation Método, aparelho e meio de armazenamento legível por computador para melhora de fala codificada paramétrica e codificada com forma de onda híbrida
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
EP3518237B1 (en) * 2014-03-14 2022-09-07 Telefonaktiebolaget LM Ericsson (publ) Audio coding method and apparatus
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
KR102547480B1 (ko) 2014-12-09 2023-06-26 돌비 인터네셔널 에이비 Mdct-도메인 에러 은닉
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
GB201504403D0 (en) 2015-03-16 2015-04-29 Microsoft Technology Licensing Llc Adapting encoded bandwidth
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
BR112018014813A2 (pt) * 2016-01-22 2018-12-18 Fraunhofer Ges Forschung ?aparelho, sistema e método para codificar canais de um sinal de entrada de áudio, aparelho, sistema e método para decodificar um sinal de áudio codificado e sistema para gerar um sinal de áudio codificado e um sinal de áudio decodificado?
PT3405951T (pt) 2016-01-22 2020-02-05 Fraunhofer Ges Forschung Aparelhos e métodos para codificar ou descodificar um sinal de áudio multicanal utilizando sincronização de controlo de quadro
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
DE102016104665A1 (de) * 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US10741196B2 (en) 2016-03-24 2020-08-11 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
US10141005B2 (en) 2016-06-10 2018-11-27 Apple Inc. Noise detection and removal systems, and related methods
JP6976277B2 (ja) 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10812550B1 (en) * 2016-08-03 2020-10-20 Amazon Technologies, Inc. Bitrate allocation for a multichannel media stream
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US9679578B1 (en) 2016-08-31 2017-06-13 Sorenson Ip Holdings, Llc Signal clipping compensation
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
US10362423B2 (en) * 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10090892B1 (en) * 2017-03-20 2018-10-02 Intel Corporation Apparatus and a method for data detecting using a low bit analog-to-digital converter
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
ES2881704T3 (es) 2017-05-18 2021-11-30 Fraunhofer Ges Forschung Dispositivo de red de gestión
US11188422B2 (en) 2017-06-02 2021-11-30 Apple Inc. Techniques for preserving clone relationships between files
DK3642839T3 (da) * 2017-06-19 2022-07-04 Rtx As Audiosignalkodning og -afkodning
CN110998722B (zh) 2017-07-03 2023-11-10 杜比国际公司 低复杂性密集瞬态事件检测和译码
CN111386568B (zh) * 2017-10-27 2023-10-13 弗劳恩霍夫应用研究促进协会 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US11076252B2 (en) * 2018-02-09 2021-07-27 Mitsubishi Electric Corporation Audio signal processing apparatus and audio signal processing method
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3576088A1 (en) * 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program
AU2019298307A1 (en) * 2018-07-04 2021-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multisignal audio coding using signal whitening as preprocessing
CN109088617B (zh) * 2018-09-20 2021-06-04 电子科技大学 比率可变数字重采样滤波器
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
WO2020146870A1 (en) * 2019-01-13 2020-07-16 Huawei Technologies Co., Ltd. High resolution audio coding
JP7262593B2 (ja) * 2019-01-13 2023-04-21 華為技術有限公司 ハイレゾリューションオーディオ符号化
KR102470429B1 (ko) * 2019-03-14 2022-11-23 붐클라우드 360 인코포레이티드 우선순위에 의한 공간 인식 다중 대역 압축 시스템
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
US11527252B2 (en) 2019-08-30 2022-12-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. MDCT M/S stereo
CN111862953B (zh) * 2019-12-05 2023-08-22 北京嘀嘀无限科技发展有限公司 语音识别模型的训练方法、语音识别方法及装置
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111199743B (zh) * 2020-02-28 2023-08-18 Oppo广东移动通信有限公司 音频编码格式确定方法、装置、存储介质及电子设备
CN111429925B (zh) * 2020-04-10 2023-04-07 北京百瑞互联技术有限公司 一种降低音频编码速率的方法及系统
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备
CN111371459B (zh) * 2020-04-26 2023-04-18 宁夏隆基宁光仪表股份有限公司 一种适用于智能电表的多操作高频替换式数据压缩方法
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113113033A (zh) * 2021-04-29 2021-07-13 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及可读存储介质
CN113365189B (zh) * 2021-06-04 2022-08-05 上海傅硅电子科技有限公司 多声道无缝切换方法
CN115472171A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
CN113593604A (zh) * 2021-07-22 2021-11-02 腾讯音乐娱乐科技(深圳)有限公司 检测音频质量方法、装置及存储介质
TWI794002B (zh) * 2022-01-28 2023-02-21 緯創資通股份有限公司 多媒體系統以及多媒體操作方法
CN114582361B (zh) * 2022-04-29 2022-07-08 北京百瑞互联技术有限公司 基于生成对抗网络的高解析度音频编解码方法及系统
WO2023224665A1 (en) * 2022-05-17 2023-11-23 Google Llc Asymmetric and adaptive strength for windowing at encoding and decoding time for audio compression
WO2024085551A1 (ko) * 2022-10-16 2024-04-25 삼성전자주식회사 패킷 손실 은닉을 위한 전자 장치 및 방법

Family Cites Families (264)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
CN1038089C (zh) 1993-05-31 1998-04-15 索尼公司 信号编码或译码装置及信号编码或译码方法
JP3465697B2 (ja) * 1993-05-31 2003-11-10 ソニー株式会社 信号記録媒体
TW272341B (zh) * 1993-07-16 1996-03-11 Sony Co Ltd
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5502713A (en) * 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
JPH07336231A (ja) * 1994-06-13 1995-12-22 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US6041295A (en) 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6253172B1 (en) * 1997-10-16 2001-06-26 Texas Instruments Incorporated Spectral transformation of acoustic signals
US5913191A (en) 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6061555A (en) 1998-10-21 2000-05-09 Parkervision, Inc. Method and system for ensuring reception of a communications signal
US6400310B1 (en) * 1998-10-22 2002-06-04 Washington University Method and apparatus for a tunable high-resolution spectral estimator
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
EP1147514B1 (en) * 1999-11-16 2005-04-06 Koninklijke Philips Electronics N.V. Wideband audio transmission system
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
CN100431355C (zh) * 2000-08-16 2008-11-05 多尔拜实验特许公司 响应补充信息修改音频或视频感知编码系统的一个或多个参数
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US20040054525A1 (en) 2001-01-22 2004-03-18 Hiroshi Sekiguchi Encoding method and decoding method for digital voice data
JP2002268693A (ja) 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
DE60220307T2 (de) * 2001-10-25 2008-02-07 Koninklijke Philips Electronics N.V. Verfahren zur übertragung breitbandiger tonsignale über einen übertragungskanal mit verminderter bandbreite
JP3923783B2 (ja) * 2001-11-02 2007-06-06 松下電器産業株式会社 符号化装置及び復号化装置
JP4308229B2 (ja) 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
AU2002352182A1 (en) * 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
DE60323331D1 (de) 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
RU2316154C2 (ru) 2002-04-10 2008-01-27 Конинклейке Филипс Электроникс Н.В. Кодирование стереофонических сигналов
US20030220800A1 (en) * 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
CN1659927A (zh) * 2002-06-12 2005-08-24 伊科泰克公司 房间内扬声器声音的数字均衡方法及其使用
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
DE20321883U1 (de) 2002-09-04 2012-01-20 Microsoft Corp. Computervorrichtung und -system zum Entropiedecodieren quantisierter Transformationskoeffizienten eines Blockes
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
CN1774957A (zh) 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
EP1667109A4 (en) * 2003-09-17 2007-10-03 Beijing E World Technology Co METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
RU2374703C2 (ru) 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
DE602005022641D1 (de) 2004-03-01 2010-09-09 Dolby Lab Licensing Corp Mehrkanal-Audiodekodierung
US7739119B2 (en) 2004-03-02 2010-06-15 Ittiam Systems (P) Ltd. Technique for implementing Huffman decoding
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
EP1852851A1 (en) * 2004-04-01 2007-11-07 Beijing Media Works Co., Ltd An enhanced audio encoding/decoding device and method
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
RU2382419C2 (ru) * 2004-04-05 2010-02-20 Конинклейке Филипс Электроникс Н.В. Многоканальный кодер
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
KR20070009644A (ko) * 2004-04-27 2007-01-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 그방법
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
ATE394774T1 (de) * 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
WO2006003891A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. 音声信号復号化装置及び音声信号符号化装置
US7465389B2 (en) 2004-07-09 2008-12-16 Exxonmobil Research And Engineering Company Production of extra-heavy lube oils from Fischer-Tropsch wax
US6963405B1 (en) 2004-07-19 2005-11-08 Itt Manufacturing Enterprises, Inc. Laser counter-measure using fourier transform imaging spectrometers
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
EP1798724B1 (en) 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
WO2006062202A1 (ja) * 2004-12-10 2006-06-15 Matsushita Electric Industrial Co., Ltd. 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
ES2350494T3 (es) * 2005-04-01 2011-01-24 Qualcomm Incorporated Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla.
NZ562188A (en) 2005-04-01 2010-05-28 Qualcomm Inc Methods and apparatus for encoding and decoding an highband portion of a speech signal
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US8892448B2 (en) * 2005-04-22 2014-11-18 Qualcomm Incorporated Systems, methods, and apparatus for gain factor smoothing
US7698143B2 (en) 2005-05-17 2010-04-13 Mitsubishi Electric Research Laboratories, Inc. Constructing broad-band acoustic signals from lower-band acoustic signals
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
EP1899959A2 (en) 2005-05-26 2008-03-19 LG Electronics Inc. Method of encoding and decoding an audio signal
US8315863B2 (en) * 2005-06-17 2012-11-20 Panasonic Corporation Post filter, decoder, and post filtering method
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US8082157B2 (en) 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8032368B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block swithcing and linear prediction coding
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
CN100539437C (zh) 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
JP4640020B2 (ja) 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
EP1938663A4 (en) 2005-08-30 2010-11-17 Lg Electronics Inc DEVICE FOR ENCODING AND DECODING AUDIO SIGNAL AND CORRESPONDING METHOD
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100866885B1 (ko) * 2005-10-20 2008-11-04 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR20070046752A (ko) * 2005-10-31 2007-05-03 엘지전자 주식회사 신호 처리 방법 및 장치
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR100959971B1 (ko) * 2006-01-27 2010-05-27 돌비 스웨덴 에이비 복소 변조된 필터뱅크를 이용한 효율적인 필터링
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
EP2337224B1 (en) * 2006-07-04 2017-06-21 Dolby International AB Filter unit and method for generating subband filter impulse responses
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
JP2010503881A (ja) 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
DE602007013415D1 (de) * 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
RU2420815C2 (ru) 2006-10-25 2011-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерации значений подполос звукового сигнала и устройство и способ для генерации отсчетов звукового сигнала во временной области
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8170359B2 (en) 2006-11-28 2012-05-01 Panasonic Corporation Encoding device and encoding method
WO2008072524A1 (ja) 2006-12-13 2008-06-19 Panasonic Corporation オーディオ信号符号化方法及び復号化方法
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
TR201906713T4 (tr) * 2007-01-10 2019-05-21 Koninklijke Philips Nv Audio kod çözücü.
US20080208538A1 (en) 2007-02-26 2008-08-28 Qualcomm Incorporated Systems, methods, and apparatus for signal separation
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP5294713B2 (ja) 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
RU2422922C1 (ru) * 2007-06-08 2011-06-27 Долби Лэборетериз Лайсенсинг Корпорейшн Гибридное извлечение аудиоканалов объемного звука посредством управляемого объединения компонент сигналов окружения и компонент матрично-декодируемых сигналов
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CN101809657B (zh) 2007-08-27 2012-05-30 爱立信电话股份有限公司 用于噪声填充的方法和设备
MX2010001394A (es) * 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8527265B2 (en) 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
EP2207166B1 (en) * 2007-11-02 2013-06-19 Huawei Technologies Co., Ltd. An audio decoding method and device
EP2218068A4 (en) 2007-11-21 2010-11-24 Lg Electronics Inc METHOD AND APPARATUS FOR SIGNAL PROCESSING
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
CN101933086B (zh) * 2007-12-31 2013-06-19 Lg电子株式会社 处理音频信号的方法和设备
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US20090180531A1 (en) 2008-01-07 2009-07-16 Radlive Ltd. codec with plc capabilities
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
ES2401817T3 (es) 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
BRPI0907508B1 (pt) * 2008-02-14 2020-09-15 Dolby Laboratories Licensing Corporation Método, sistema e método para modificar uma entrada estéreo que inclui sinais de entrada esquerdo e direito
AU2009221444B2 (en) * 2008-03-04 2012-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Mixing of input data streams and generation of an output data stream therefrom
EP2252996A4 (en) * 2008-03-05 2012-01-11 Voiceage Corp SYSTEM AND METHOD FOR ENHANCING A DECODED TONAL SIGNAL SIGNAL
EP3273442B1 (en) 2008-03-20 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing a parameterized representation of an audio signal
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
WO2009135532A1 (en) 2008-05-09 2009-11-12 Nokia Corporation An apparatus
US20090319263A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
MY178597A (en) 2008-07-11 2020-10-16 Fraunhofer Ges Forschung Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
EP2346030B1 (en) * 2008-07-11 2014-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and computer program
RU2536679C2 (ru) * 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
JP5010743B2 (ja) 2008-07-11 2012-08-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法
MY155538A (en) 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
BR122021007798B1 (pt) * 2008-07-11 2021-10-26 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio e decodificador de áudio
AU2009267525B2 (en) * 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
US8463603B2 (en) 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
JP5295372B2 (ja) * 2008-09-17 2013-09-18 フランス・テレコム デジタルオーディオ信号におけるプリエコーの減衰
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
EP4231294B1 (en) 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
CA3231911A1 (en) 2009-01-16 2010-07-22 Dolby International Ab Cross product enhanced harmonic transposition
JP4977157B2 (ja) 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
KR101367604B1 (ko) * 2009-03-17 2014-02-26 돌비 인터네셔널 에이비 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
TWI643187B (zh) * 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
PL2273493T3 (pl) 2009-06-29 2013-07-31 Fraunhofer Ges Forschung Kodowanie i dekodowanie z rozszerzaniem szerokości pasma
EP2452323B1 (en) 2009-07-07 2018-03-14 Xtralis Technologies Ltd Chamber condition
US8793617B2 (en) * 2009-07-30 2014-07-29 Microsoft Corporation Integrating transport modes into a communication stream
US9031834B2 (en) 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
MX2012004593A (es) 2009-10-20 2012-06-08 Fraunhofer Ges Forschung Codec multimodo de audio y codificacion de celp adaptada a este.
MY166169A (en) 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
ES2906085T3 (es) * 2009-10-21 2022-04-13 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8856011B2 (en) 2009-11-19 2014-10-07 Telefonaktiebolaget L M Ericsson (Publ) Excitation signal bandwidth extension
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CA2779453C (en) 2009-12-07 2015-12-22 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
KR101764926B1 (ko) 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
AU2010332925B2 (en) * 2009-12-16 2013-07-11 Dolby International Ab SBR bitstream parameter downmix
EP2357649B1 (en) * 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CN103038819B (zh) * 2010-03-09 2015-02-18 弗兰霍菲尔运输应用研究公司 用以使用补丁边界对准处理输入音频信号的装置及方法
EP2369861B1 (en) 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
DK2556504T3 (en) * 2010-04-09 2019-02-25 Dolby Int Ab MDCT-BASED COMPLEX PREVIEW Stereo Encoding
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
AU2011240239B2 (en) 2010-04-13 2014-06-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
CN102947882B (zh) 2010-04-16 2015-06-17 弗劳恩霍夫应用研究促进协会 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
WO2011155170A1 (ja) 2010-06-09 2011-12-15 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8489403B1 (en) 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
AR085895A1 (es) * 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
EP2702589B1 (en) 2011-04-28 2017-04-05 Dolby International AB Efficient content classification and loudness estimation
WO2012158705A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
WO2012158333A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
DE102011106033A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
US20130006644A1 (en) 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP6001657B2 (ja) 2011-06-30 2016-10-05 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張信号生成装置及びその方法
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR20130022549A (ko) 2011-08-25 2013-03-07 삼성전자주식회사 마이크 노이즈 제거 방법 및 이를 지원하는 휴대 단말기
US9384749B2 (en) 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
BR112014007481A2 (pt) 2011-09-29 2017-04-04 Dolby Int Ab detecção de alta qualidade em sinais de rádio fm estéreo
EP3321931B1 (en) * 2011-10-28 2019-12-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding apparatus and encoding method
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
JP6069341B2 (ja) * 2011-11-30 2017-02-01 ドルビー・インターナショナル・アーベー オーディオ・コーデックからの向上したクロマ抽出のための方法、エンコーダ、デコーダ、ソフトウェア・プログラム、記憶媒体
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
CN103165136A (zh) * 2011-12-15 2013-06-19 杜比实验室特许公司 音频处理方法及音频处理设备
US9390721B2 (en) 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
KR101398189B1 (ko) 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
CN104221082B (zh) * 2012-03-29 2017-03-08 瑞典爱立信有限公司 谐波音频信号的带宽扩展
KR20140130248A (ko) * 2012-03-29 2014-11-07 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
CN102750955B (zh) * 2012-07-20 2014-06-18 中国科学院自动化研究所 基于残差信号频谱重构的声码器
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
EP2903004A4 (en) 2012-09-24 2016-11-16 Samsung Electronics Co Ltd METHOD AND APPARATUS FOR HAMPERING FRAME ERRORS, AND METHOD AND APPARATUS FOR DECODING AUDIO DATA
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9135920B2 (en) 2012-11-26 2015-09-15 Harman International Industries, Incorporated System for perceived enhancement and restoration of compressed audio signals
PL3054446T3 (pl) 2013-01-29 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
US11289106B2 (en) 2018-01-26 2022-03-29 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
US11626120B2 (en) 2018-01-26 2023-04-11 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
US11626121B2 (en) 2018-01-26 2023-04-11 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
US11646041B2 (en) 2018-01-26 2023-05-09 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
US11646040B2 (en) 2018-01-26 2023-05-09 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
US11756559B2 (en) 2018-01-26 2023-09-12 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
US11961528B2 (en) 2018-01-26 2024-04-16 Dolby International Ab Backward-compatible integration of high frequency reconstruction techniques for audio signals
TWI702780B (zh) * 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法
US11038496B1 (en) 2019-12-03 2021-06-15 Industrial Technology Research Institute Isolator and signal generation method for improving common mode transient immunity

Also Published As

Publication number Publication date
WO2015010952A9 (en) 2017-10-26
US10147430B2 (en) 2018-12-04
PT3025328T (pt) 2018-11-27
EP3025337A1 (en) 2016-06-01
MY187943A (en) 2021-10-30
WO2015010947A1 (en) 2015-01-29
TWI541797B (zh) 2016-07-11
BR112015007533A2 (zh) 2017-08-22
EP3025337B1 (en) 2021-12-08
ES2959641T3 (es) 2024-02-27
AU2014295298A1 (en) 2016-03-10
EP2830059A1 (en) 2015-01-28
WO2015010949A1 (en) 2015-01-29
KR20160034975A (ko) 2016-03-30
CN110310659B (zh) 2023-10-24
MX355448B (es) 2018-04-18
ES2667221T3 (es) 2018-05-10
US20190074019A1 (en) 2019-03-07
CN105518776B (zh) 2019-06-14
US20150287417A1 (en) 2015-10-08
JP6568566B2 (ja) 2019-08-28
US20180102134A1 (en) 2018-04-12
JP6321797B2 (ja) 2018-05-09
KR20160030193A (ko) 2016-03-16
MX353999B (es) 2018-02-07
BR112016000740A2 (pt) 2017-08-22
AU2014295300B2 (en) 2017-05-25
PL3506260T3 (pl) 2024-02-19
SG11201502691QA (en) 2015-05-28
CN105453175B (zh) 2020-11-03
TW201517024A (zh) 2015-05-01
WO2015010948A1 (en) 2015-01-29
CN111554310A (zh) 2020-08-18
KR101774795B1 (ko) 2017-09-05
AU2014295298B2 (en) 2017-05-25
CN105453176B (zh) 2019-08-23
JP6400702B2 (ja) 2018-10-03
US11769513B2 (en) 2023-09-26
MY184847A (en) 2021-04-27
RU2640634C2 (ru) 2018-01-10
JP6306702B2 (ja) 2018-04-04
EP2883227A1 (en) 2015-06-17
BR112016001072B1 (pt) 2022-07-12
HK1211378A1 (zh) 2016-05-20
RU2016105619A (ru) 2017-08-23
CN110660410A (zh) 2020-01-07
EP2883227B1 (en) 2016-08-17
SG11201600506VA (en) 2016-02-26
RU2016105759A (ru) 2017-08-25
CA2918810C (en) 2020-04-28
EP3025340B1 (en) 2019-03-27
AU2014295296B2 (en) 2017-10-19
BR112016001125A2 (zh) 2017-08-22
BR122022011238B1 (pt) 2023-12-19
BR122022010960B1 (pt) 2023-04-04
CA2918807A1 (en) 2015-01-29
US10847167B2 (en) 2020-11-24
TR201816157T4 (tr) 2018-11-21
PT3407350T (pt) 2020-10-27
US20190043522A1 (en) 2019-02-07
PT3017448T (pt) 2020-10-08
BR112016001072A2 (zh) 2017-08-22
EP3025340A1 (en) 2016-06-01
US20220270619A1 (en) 2022-08-25
EP3506260B1 (en) 2023-08-16
JP6389254B2 (ja) 2018-09-12
AU2014295297B2 (en) 2017-05-25
US20160133265A1 (en) 2016-05-12
EP3017448B1 (en) 2020-07-08
AU2014295300A1 (en) 2016-03-10
ES2813940T3 (es) 2021-03-25
EP2830063A1 (en) 2015-01-28
US11922956B2 (en) 2024-03-05
EP2830064A1 (en) 2015-01-28
US11250862B2 (en) 2022-02-15
US10332539B2 (en) 2019-06-25
RU2635890C2 (ru) 2017-11-16
RU2651229C2 (ru) 2018-04-18
TW201523589A (zh) 2015-06-16
MX356161B (es) 2018-05-16
CA2973841A1 (en) 2015-01-29
RU2649940C2 (ru) 2018-04-05
US20210295853A1 (en) 2021-09-23
KR20160046804A (ko) 2016-04-29
JP2016530556A (ja) 2016-09-29
BR112015007533B1 (pt) 2022-09-27
EP3506260A1 (en) 2019-07-03
US10276183B2 (en) 2019-04-30
US20220139407A1 (en) 2022-05-05
US20200082841A1 (en) 2020-03-12
EP2830061A1 (en) 2015-01-28
MX2016000940A (es) 2016-04-25
CN104769671A (zh) 2015-07-08
EP3025344B1 (en) 2017-06-21
BR112016000740B1 (pt) 2022-12-27
CN110310659A (zh) 2019-10-08
AU2014295295B2 (en) 2017-10-19
ES2827774T3 (es) 2021-05-24
US20160140973A1 (en) 2016-05-19
EP3742444A1 (en) 2020-11-25
CN105580075B (zh) 2020-02-07
CA2918807C (en) 2019-05-07
WO2015010952A1 (en) 2015-01-29
ZA201601046B (en) 2017-05-31
EP3407350A1 (en) 2018-11-28
JP6186082B2 (ja) 2017-08-23
PL3017448T3 (pl) 2020-12-28
KR20150060752A (ko) 2015-06-03
EP3025343B1 (en) 2018-02-14
WO2015010950A1 (en) 2015-01-29
US20160210974A1 (en) 2016-07-21
WO2015010953A1 (en) 2015-01-29
CA2918804A1 (en) 2015-01-29
KR101764723B1 (ko) 2017-08-14
PT3025343T (pt) 2018-05-18
BR122022010958B1 (pt) 2024-01-30
US20230352032A1 (en) 2023-11-02
TWI555009B (zh) 2016-10-21
US20220157325A1 (en) 2022-05-19
SG11201600496XA (en) 2016-02-26
US10593345B2 (en) 2020-03-17
WO2015010954A1 (en) 2015-01-29
US10002621B2 (en) 2018-06-19
RU2016105618A (ru) 2017-08-28
ES2698023T3 (es) 2019-01-30
PL3407350T3 (pl) 2020-12-28
US10134404B2 (en) 2018-11-20
MY182831A (en) 2021-02-05
RU2016105610A (ru) 2017-08-25
US20160140980A1 (en) 2016-05-19
JP2022123060A (ja) 2022-08-23
US10311892B2 (en) 2019-06-04
CA2918835A1 (en) 2015-01-29
US20160140981A1 (en) 2016-05-19
SG11201600494UA (en) 2016-02-26
CA2918701C (en) 2020-04-14
US10515652B2 (en) 2019-12-24
US10332531B2 (en) 2019-06-25
BR122022011231B1 (pt) 2024-01-30
TWI545561B (zh) 2016-08-11
MX354002B (es) 2018-02-07
CA2886505A1 (en) 2015-01-29
US20170154631A1 (en) 2017-06-01
EP3025328A1 (en) 2016-06-01
KR20160042890A (ko) 2016-04-20
PT2883227T (pt) 2016-11-18
CA2973841C (en) 2019-08-20
EP3975180A1 (en) 2022-03-30
US11222643B2 (en) 2022-01-11
US11049506B2 (en) 2021-06-29
KR101826723B1 (ko) 2018-03-22
CA2918701A1 (en) 2015-01-29
CA2918524A1 (en) 2015-01-29
KR20160024924A (ko) 2016-03-07
JP2016529545A (ja) 2016-09-23
EP4246512A3 (en) 2023-12-13
JP7092809B2 (ja) 2022-06-28
SG11201600401RA (en) 2016-02-26
CN112466312A (zh) 2021-03-09
EP3025344A1 (en) 2016-06-01
RU2016105613A (ru) 2017-08-28
JP2016527557A (ja) 2016-09-08
EP2830065A1 (en) 2015-01-28
PL3025343T3 (pl) 2018-10-31
BR112016001125B1 (pt) 2022-01-04
ZA201601010B (en) 2017-11-29
KR101681253B1 (ko) 2016-12-01
PL3025337T3 (pl) 2022-04-11
TW201517023A (zh) 2015-05-01
CA2918524C (en) 2018-05-22
TW201513098A (zh) 2015-04-01
CN111554310B (zh) 2023-10-20
MY180759A (en) 2020-12-08
EP3025328B1 (en) 2018-08-01
TW201514974A (zh) 2015-04-16
ZA201601111B (en) 2017-08-30
AU2014295301B2 (en) 2017-05-25
US20190198029A1 (en) 2019-06-27
ZA201502262B (en) 2016-09-28
MX2016000935A (es) 2016-07-05
US20160140979A1 (en) 2016-05-19
BR112016000947B1 (pt) 2022-06-21
CN111179963A (zh) 2020-05-19
MX2016000943A (es) 2016-07-05
US11289104B2 (en) 2022-03-29
MX2016000854A (es) 2016-06-23
US20210217426A1 (en) 2021-07-15
RU2643641C2 (ru) 2018-02-02
US20190251986A1 (en) 2019-08-15
MX2015004022A (es) 2015-07-06
PT3025340T (pt) 2019-06-27
US11769512B2 (en) 2023-09-26
CA2886505C (en) 2017-10-31
EP3017448A1 (en) 2016-05-11
US20180144760A1 (en) 2018-05-24
MX354657B (es) 2018-03-14
AU2014295302B2 (en) 2016-06-30
EP2830056A1 (en) 2015-01-28
KR101822032B1 (ko) 2018-03-08
CN105453175A (zh) 2016-03-30
US11735192B2 (en) 2023-08-22
RU2646316C2 (ru) 2018-03-02
EP2830054A1 (en) 2015-01-28
CN105518776A (zh) 2016-04-20
KR20160041940A (ko) 2016-04-18
AU2014295296A1 (en) 2016-03-10
TWI555008B (zh) 2016-10-21
US20190371355A1 (en) 2019-12-05
BR112016000852A2 (pt) 2017-08-22
JP2018077487A (ja) 2018-05-17
RU2016105473A (ru) 2017-08-23
JP6705787B2 (ja) 2020-06-03
CN105518777B (zh) 2020-01-31
EP3025343A1 (en) 2016-06-01
CN110660410B (zh) 2023-10-24
JP2015535620A (ja) 2015-12-14
JP6144773B2 (ja) 2017-06-07
JP2016527556A (ja) 2016-09-08
AU2014295297A1 (en) 2016-03-10
SG11201600464WA (en) 2016-02-26
CN105580075A (zh) 2016-05-11
US20180268842A1 (en) 2018-09-20
ES2728329T3 (es) 2019-10-23
BR122022010965B1 (pt) 2023-04-04
CN105518777A (zh) 2016-04-20
CA2918835C (en) 2018-06-26
EP4246512A2 (en) 2023-09-20
CA2918804C (en) 2018-06-12
RU2015112591A (ru) 2016-10-27
PL2883227T3 (pl) 2017-03-31
MX2016000924A (es) 2016-05-05
AU2014295295A1 (en) 2016-03-10
MX340575B (es) 2016-07-13
JP2018041100A (ja) 2018-03-15
MX362036B (es) 2019-01-04
TW201517019A (zh) 2015-05-01
EP3407350B1 (en) 2020-07-29
JP2016525713A (ja) 2016-08-25
CN104769671B (zh) 2017-09-26
US20210065723A1 (en) 2021-03-04
US10573334B2 (en) 2020-02-25
ES2638498T3 (es) 2017-10-23
ES2599007T3 (es) 2017-01-31
PL3025340T3 (pl) 2019-09-30
CN105453176A (zh) 2016-03-30
JP6691093B2 (ja) 2020-04-28
ZA201601011B (en) 2017-05-31
KR101807836B1 (ko) 2018-01-18
MX2016000857A (es) 2016-05-05
PL3025328T3 (pl) 2019-02-28
BR112016000852B1 (pt) 2021-12-28
AU2014295302A1 (en) 2015-04-02
EP3506260C0 (en) 2023-08-16
ES2908624T3 (es) 2022-05-03
US10984805B2 (en) 2021-04-20
JP2020060792A (ja) 2020-04-16
RU2607263C2 (ru) 2017-01-10
BR112016000947A2 (zh) 2017-08-22
CA2918810A1 (en) 2015-01-29
JP2016529546A (ja) 2016-09-23
KR101809592B1 (ko) 2018-01-18
CN105556603A (zh) 2016-05-04
JP2018013796A (ja) 2018-01-25
CN105556603B (zh) 2019-08-27
MY175978A (en) 2020-07-19
PT3025337T (pt) 2022-02-23
AU2014295301A1 (en) 2016-03-10
EP3723091A1 (en) 2020-10-14
TWI545560B (zh) 2016-08-11
TWI549121B (zh) 2016-09-11
TWI545558B (zh) 2016-08-11
SG11201600422SA (en) 2016-02-26
US11257505B2 (en) 2022-02-22
US10347274B2 (en) 2019-07-09
JP6310074B2 (ja) 2018-04-11

Similar Documents

Publication Publication Date Title
TWI541797B (zh) 使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法
JP7483792B2 (ja) 符号化オーディオ信号を復号する復号装置および復号方法