TWI426503B - 用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法 - Google Patents

用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法 Download PDF

Info

Publication number
TWI426503B
TWI426503B TW098121856A TW98121856A TWI426503B TW I426503 B TWI426503 B TW I426503B TW 098121856 A TW098121856 A TW 098121856A TW 98121856 A TW98121856 A TW 98121856A TW I426503 B TWI426503 B TW I426503B
Authority
TW
Taiwan
Prior art keywords
block
domain
frequency
sub
signal
Prior art date
Application number
TW098121856A
Other languages
English (en)
Other versions
TW201011737A (en
Inventor
Guillaume Fuchs
Jeremie Lecomte
Stefan Bayer
Ralf Geiger
Markus Multrus
Gerald Schuller
Jens Hirschfeld
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201011737A publication Critical patent/TW201011737A/zh
Application granted granted Critical
Publication of TWI426503B publication Critical patent/TWI426503B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法 發明領域
本發明係關於音訊編碼,更特別係關於低位元率音訊編碼方案。
技藝界已知頻域編碼方案諸如MP3或AAC。此等頻域編碼器係基於時域/頻域變換;隨後之量化階段其中量化誤差係使用得自心理聲學模組之資訊控制;及一編碼階段,其中該已量化的頻譜係數及相對應旁資訊係使用碼表作熵編碼。
另一方面,有極為適合用於語音處理之編碼器,諸如AMR-WB+,說明於3GPP TS 26.290。此種語音編碼方案執行時域信號之線性預測濾波。此種LP濾波係由該輸入的時域信號之線性預測分析所導出。然後所得LP濾波係數經量化/編碼且傳輸作為旁資訊。該方法稱作為線性預測編碼(LPC)。於濾波器之輸出端,預測餘數信號或預測誤差信號(也稱作為激勵信號)係使用ACELP編碼器之藉合成分析階段編碼,或另外,係使用變換編碼器編碼,該變換編碼器係使用具有重疊之傅立葉變換。ACELP編碼與變換編碼激勵編碼(也稱作為TCX編碼)間之判定係使用閉環演繹法則或開環演繹法則進行。
組合AAC編碼方案及頻帶複製技術之頻域音訊編碼方案,諸如高效率-AAC編碼方案,也可組合於「MPEG環繞」一詞下方已知之聯合立體聲編碼工具或多頻道編碼工具。
另一方面,語音編碼器諸如AMR-WB+也有高頻加強階段及立體聲功能。
頻域編碼方案之優點在於其對音樂信號於低位元率顯示高品質,但問題在於於低位元率之語音信號品質。
語音編碼方案即使於低位元率對語音信號也顯示高品質,但對音樂信號於低位元率顯示品質不佳。
頻域編碼方案經常使用所謂的MDCT(MDCT=修改型離散餘弦變換)。MDCT最初係由J. Princen,A. Bradley說明,「基於時域頻疊抵消之分析/合成濾波器組設計」,IEEE Trans. ASSP,ASSP-34(5):1153-1161,1986。MDCT或MDCT濾波器組廣用於近代有效音訊編碼器。此種信號處理提供下列優點:各處理區塊間的順利交叉衰減:即使於各個處理區塊之信號有不同變化(例如由於頻譜係數的量化),但由於視窗化重疊/加法運算,故不會因由區塊至區塊的突然變遷,造成屏蔽假信號。
臨界取樣:於濾波器組輸出信號之頻譜值數目係等於於其輸入信號中之時域輸入值及必須傳輸的額外處理資料值之數目。
MDCT濾波器組再度提供高度頻率選擇性及編碼。
經由利用時域頻疊抵消可達成該等重大性質。時域頻疊抵消係藉重疊相加兩相鄰已視窗化信號而於合成進行。若於MDCT之分析階段與合成階段間未施加量化,則獲得原先信號的完美重建。但該MDCT係用於特別適合用於音樂信號的編碼方案。如前文說明,此等頻域編碼方案對語音信號於低位元率的品質降低,而以特別調整適合之語音編碼器比較頻域編碼方案,於可相媲美的位元率具有較高品質,或對相同品質甚至具有顯著更低的位元率。
語音編碼技術諸如所謂的AMR-WB+編碼解碼器,如定義於「延伸的適應性多速率-寬頻(AMR-WB+)編碼解碼器,3GPP TS 26.290 V6.3.0,2005-06,技術規格,並未應用MDCT,因此無法由MDCT的優異性質獲得任何優勢,特定言之,一方面仰賴臨界取樣處理,而另一方面仰賴由一個區塊至另一個區塊的交越。因此,藉MDCT所得由一個區塊至另一個區塊的交越,就位元率而言,不會有任何犧牲,因此MDCT之臨界取樣性質尚未於語音編碼器獲得。
當將語音編碼器及音訊編碼器組合於單一混成編碼方案中時,仍然有問題,如何以低位元率及高品質獲得由一種編碼模式切換至另一種編碼模式。
本發明之目的係提供一種改良式編碼/解碼構想。
本目的係藉如申請專利範圍第1項之用於編碼一音訊信號之裝置、如申請專利範圍第8項之用於解碼一已編碼音訊信號之裝置、如申請專利範圍第14項之已編碼音訊信號、如申請專利範圍第15項之用於編碼一音訊信號之方法、如申請專利範圍第16項之用於解碼一已編碼音訊信號之方法、或如申請專利範圍第17項之電腦程式達成。
本發明之一個面相為應用混成編碼方案,其中應用特別適合用於某個信號及於一個域運算之第一編碼模式,及其中共同使用特別適合用於其它信號及於不同域運算之一額外編碼模式。於本編碼/解碼構想中,由一個編碼模式至另一個編碼模式之臨界取樣切換為可能,在於於編碼器端,已經由一項視窗化運算所產生的音訊樣本之同一個區塊係以不同方式處理。特定言之,音訊信號之該區塊之頻疊部之處理方式,係經由將與該視窗之頻疊部相關的子區塊於此子區塊視窗化之後,由一域變換至另一域;而藉相同視窗化運算所得之一不同子區塊,係於使用分析視窗視窗化本子區塊之前,由一域變換至另一域。
已處理的第一子區塊及已處理的第二子區塊隨後使用相同區塊變換法則變換成又一域來獲得該音訊信號之已變換的第一區塊,其然後可使用眾所周知之資料壓縮演繹法則諸如量化、熵編碼等中之任一者進一步處理。
於解碼器端,此一區塊再度以不同方式處理,係基於處理該區塊之頻疊部或該區塊之其它額外部決定。頻疊部係於進行合成視窗化之前變換成目標域,而額外部係於進行變換成目標域之前接受合成視窗化。此外,為了獲得臨界取樣性質,進行時域頻疊抵消,其中該音訊資料之視窗化頻疊部及另一已編碼區塊之視窗化頻疊部係於已編碼的音訊信號區塊之頻疊部變換成目標域之後組合,因此獲得與該第一區塊之頻疊部相對應之一已解碼音訊信號。有鑑於此,一個視窗確實存在有兩個子區塊/部分。一個部分/子區塊(頻疊子區塊)具有頻疊組分,其重疊於不同域編碼之第二區塊;及第二子區塊/部分(額外子區塊),其可具有或可未具有頻疊組分其重疊第二區塊或與第二區塊不同之一區塊。
較佳,導入彼此相對應但於不同域編碼之某些部分的頻疊可優異地用於藉差異處理於音訊樣本的一個且同一個已視窗化區塊內部之頻疊部及又另一部,而獲得由一種編碼模式臨界取樣切換至另一種編碼模式。
此點係與基於分析視窗及合成視窗之先前技術處理相反,原因在於至目前為止,經由應用分析視窗所得完整資料區塊已經接受相同處理。但根據本發明,已視窗化區塊之頻疊部係以與本區塊之另一部之不同方式處理。
當使用特定開始/停止視窗時,另一部可包含非頻疊部。另外,另一部包含一頻疊部重疊相鄰視窗化處理所得的部分。然後,另一(頻疊)部重疊與目前訊框之另一(頻疊)部相同域處理的鄰近訊框之一頻疊部,而該頻疊部重疊與目前訊框之頻疊部於不同域處理的一鄰近訊框之頻疊部。
依據實務而定,額外部及頻疊部共同形成應用視窗函數至音訊樣本之一區塊的完整結果。另一部可完全不含頻疊,或可完全頻疊,或可包括一頻疊子部及一無頻疊子部。此外,可任意選擇此等子部之順序及頻疊部及另一部之順序。
於切換音訊編碼方案之較佳實施例中,輸入信號之相鄰節段可於兩個不同域處理。舉例言之,AAC運算於信號域之MDCT,而MTPC(Sean A. Ramprashad,「多模式變換預測編碼範例」,IEEE語音及音訊處理會報,第11卷,第2期,2003年3月)運算於LPC餘數域之MDCT。由於MDCT的使用,當重疊區具有時域頻疊組分時特別成問題。確實於由一個編碼器變遷至另一個編碼器時,時域頻疊無法抵消,原因在於其係於兩個不同域產生。一種解決之道係以無頻疊的交叉衰減視窗化信號進行變遷。然後已切換的編碼器不再臨界取樣而產生資訊的額外處理資料量。實施例允許藉於二不同域運算運算之時域頻疊組分抵消而維持臨界取樣優點。
於本發明之較佳實施例中,循序提供兩個開關,此處第一開關介於使用頻域編碼器於頻譜域編碼與於LPC域編碼,亦即於LPC分析階段之輸出端處理該信號間作判定。第二開關係設置用於LPC域切換俾便於LPC域編碼該LPC域信號諸如使用ACELP編碼器編碼;或於LPC頻譜域編碼該LPC域信號,其要求用於將該LPC域信號變換至LPC頻譜域之一變換器,由於LPC頻譜域顯示LPC已濾波信號之頻譜而非顯示時域信號之頻譜,故LPC頻譜域係與頻譜域不同。
第一開關介於二處理分支間作判定,此處一個分支主要係藉匯集模型及/或心理聲學模型亦即藉聽覺遮蔽而被激勵;而另一分支主要係藉來源模型及藉分段SNR計算而被激勵。舉例言之,一個分支具有頻譜編碼器,而另一個分支具有基於LPC之編碼器,諸如語音編碼器。來源模型通常為語音處理,因此常用LPC。
第二開關再度介於兩個處理分支間作判定,但係於與該「外」第一分支域不同的域。再度一個「內」分支主要係藉來源模型或藉SNR計算激勵,而另一個「內」分支可藉匯集模型及/或心理聲學模型,亦即藉遮蔽或至少包括頻率/頻譜域編碼面相來激勵。舉例言之,一個「內」分支具有頻域編碼器/頻譜變換器,而另一個分支具有編碼於另一域諸如LPC域之編碼器,其中此種編碼器例如為CELP或ACELP量化器/定標器其處理一輸入信號而未作頻譜變換。
又一較佳實施例為一種音訊編碼器,包含一第一資訊匯集導向的編碼分支諸如頻譜域編碼分支;一第二資訊來源或SNR導向編碼分支諸如一LPC域編碼分支;及用於該第一編碼分支與該第二編碼分支間切換之一開關,其中該編碼分支包含一變換器,用於變換成與該時域不同之一特定域,諸如產生激勵信號之LPC分析階段;及其中該第二編碼分支進一步包含一特定域諸如LPC域處理分支及一特定頻譜域諸如LPC頻譜域處理分支;及用於介於該特定域編碼分支與該特定頻譜域編碼分支間切換之一額外開關。
本發明之又一個實施例為一種音訊解碼器,包含一第一域諸如一頻譜域解碼分支、一第二域諸如用於將於第二域之信號諸如激勵信號解碼之一LPC域解碼分支及第三域,諸如用於將於第三域(諸如LPC頻譜域)之一信號諸如激勵信號解碼之LPC頻譜解碼器分支,其中該第三域係經由執行從第二域之頻率變換獲得,其中設置用於該第二域信號及第三域信號之一第一開關,及其中設置用於介於該第一域解碼器與第二域或第三域解碼器間切換之一第二開關。
圖式簡單說明
隨後將就附圖說明本發明之較佳實施例,附圖中:第1A圖為用於編碼音訊信號之較佳裝置或方法之示意代表圖;第1B圖為由MDCT-TCX變遷至AAC之示意代表圖;第1C圖為由AAC變遷至MDCT-TCX之示意代表圖;第1D圖為本發明之構想之較佳實施例呈流程圖之示例說明;第2圖為用於示例說明發生於本發明之實施例之四個不同域及其關係之示意代表圖;第3A圖為示例說明用於解碼音訊信號之本發明之裝置及方法之方案;第3B圖為根據本發明之實施例之解碼方案之進一步示例說明;第4A圖示例顯示頻疊變換諸如應用於兩種編碼模式之MDCT之細節;第4B圖示例顯示可媲美第4A圖之視窗函數但具有一頻疊部及一非頻疊部之視窗函數;第5圖為於一種編碼模式諸如AAC-MDCT編碼模式之編碼器及解碼器之示意代表圖;第6圖為於AMR-WB+中TCX編碼內文中,應用MDCT於不同域諸如LPC域之編碼器及解碼器之代表圖;第7圖為介於AAC與AMR-WB+間變換之視窗之特定順序;第8A圖為由TCX模式切換至AAC模式之內文中,用於一編碼器及一解碼器之較佳實施例之代表圖;第8B圖為用於示例說明由AAC變換至TCX之編碼器及解碼器之較佳實施例;第9A圖為較佳混成切換編碼方案之方塊圖,本發明係應用於其中;第9B圖為示例說明於第9A圖之控制器中執行之處理程序之流程圖;第10A圖為於混成切換編碼方案中之解碼器之較佳實施例;第10B圖為用於示例說明於第10A圖之變遷控制器中執行的程序之流程圖;第11A圖示例顯示其中較佳應用本發明之編碼器之較佳實施例;及第11B圖示例顯示其中較佳應用本發明之較佳解碼器。
第11A圖示例顯示具有兩個級聯開關之本發明之一個實施例。單聲信號、立體聲信號、或多頻道信號輸入開關200。開關200係由決策階段300控制。決策階段接收輸入區塊200之信號作為輸入信號。另外,決策階段300也接收旁資訊,該旁資訊係含括於該單聲信號、立體聲信號、或多頻道信號,或至少係關聯此種信號,此處存在有資訊,而該等資訊例如係於原先產生該單聲信號、立體聲信號、或多頻道信號時生成。
決策階段300作動開關200俾便將一信號饋送至第11A圖之上分支示例顯示之一頻率編碼部400,或饋送至第11A圖之下分支示例顯示之一LPC域編碼部500。頻域編碼部之關鍵元件為頻譜變換區塊411,該區塊411運算來將一共通前處理階段輸出信號(容後詳述)變換成頻譜域。頻譜域變換區塊可包括MDCT演繹法則、QMF、FFT演繹法則、子波分析或濾波器組諸如有某個數目濾波器頻道之經臨界取樣的濾波器組,此處本濾波器組中之子頻帶信號可為實際值信號或複合值信號。頻譜變換區塊411之輸出信號係使用頻譜音訊編碼器421編碼,其可包括如由AAC編碼方案所已知之處理區塊。
較佳於分支400之處理係基於感官模型或資訊匯集模型之處理。如此本分支模型化人類聽覺系統接收聲音。相反地,分支500的處理產生於激勵域、餘數域或LPC域之一信號。大致上,分支500之處理為語音模型或資訊產生模型之處理。用於語音信號,本模型為人類語音/聲音產生系統產生聲音的模型。但若欲編碼來自要求不同聲音產生模型之不同來源的聲音,則分支500的處理可不同。
於下編碼分支500,關鍵元件為LPC裝置510,其輸出用於控制LPC濾波器之特性之LPC資訊。此種LPC資訊傳輸至解碼器。LPC階段510輸出信號為由激勵信號及/或加權信號所組成之LPC域信號。
LPC裝置通常輸出LPC域信號,其可為於LPC域之任一種信號諸如激勵信號或加權(TCX)信號,或為經由將LPC濾波係數應用至音訊信號所產生之任何其它信號。此外,LPC裝置也決定此等係數,也可量化/編碼此等係數。
於決策階段之決策可為信號適應性決策,因此決策階段執行音樂/語音鑑別,且控制開關200使得音樂信號係輸入上分支400,而語音信號係輸入下分支500。於一個實施例中,決策階段將其決策資訊饋入一輸出位元流,故解碼器可使用本決策資訊來執行正確的解碼運算。
此種解碼器係示例顯示於第11B圖。由頻譜音訊編碼器421所輸出之信號於傳送後係輸入頻譜音訊解碼器431。頻譜音訊解碼器431之輸出信號係輸入時域變換器440。同理,第11A圖之LPC域編碼分支500之輸出信號於解碼器端接收且藉元件536及537處理來獲得LPC激勵信號。該LPC激勵信號係輸入一LPC合成階段540,該階段540接收由相對應之LPC分析階段510所產生之LPC資訊作為額外輸入信號。時域變換器440之輸出信號及/或LPC合成階段540之輸出信號係輸入開關600。開關600係透過開關控制信號控制,該開關控制信號例如係由該決策階段300所提供,或由外部提供例如由原先單聲信號、立體聲信號或多頻道信號之形成器所提供。開關600之輸出信號為完整單聲信號、立體聲信號或多頻道信號。
輸入開關200及決策階段300之輸入信號可為單聲信號、立體聲信號或多頻道信號或通稱為音訊信號。依據可由開關200之輸入信號導出或由任何外部來源導出諸如輸入階段200之信號下方的原先音訊信號產生器而定,開關介於頻率編碼分支400與LPC編碼分支500間切換。頻率編碼分支400包含一頻譜變換階段411及一隨後連結的量化/編碼階段421。量化/編碼階段包括由近代頻域編碼器諸如AAC編碼器已知之任一項功能。此外,於量化/編碼階段421之量化運算可透過心理聲學模組控制,該心理聲學模組產生心理聲學資訊諸如於頻率之心理聲學遮蔽臨界值,此處此項資訊係輸入階段421。
於LPC編碼分支,開關輸出信號係透過LPC分析階段510處理而產生LPC旁資訊及LPC域信號。激勵編碼器包含一額外開關521,該開關用於將LPC域信號之進一步處理介於LPC域之量化/編碼運算526或處理LPC頻譜域之數值的量化/編碼階段527間切換。為了達成此項目的,設置頻譜變換器527。依據特定設定值而定,例如說明於AMR-WB+技術說明書,開關521係以開環方式或閉環方式控制。
用於閉環控制模式,編碼器額外包括用於LPC域信號之一反相量化器/編碼器、用於LPC頻譜域信號之一反相量化器/編碼器、及用於該反相量化器/編碼器之輸出信號之一反相頻譜變換器。於第二編碼分支之處理分支中已編碼且再度已解碼信號係輸入一開關控制裝置。於該開關控制裝置中,此二輸出信號彼此比較及/或與目標函數比較,或計算目標函數,該目標函數的計算可基於比較二信號的失真,使得具有較低失真的信號用於判定開關521須採取哪一種位置。另外,當二分支提供非恆定位元率時,可選用提供較低位元率之分支,即使此分支之信號對雜訊比係低於另一分支之信號對雜訊比亦如此。另外,目標函數可使用各個信號之信號對雜訊比及各個信號之位元率及/或使用額外標準作為輸入來找出對一特定目的之最佳決策。例如目的為位元率須儘可能地低,則目標函數極其仰賴由反相量化器/編碼器及/或反相頻譜變換器輸出之二信號之位元率。但當主要目的係對某個位元率具有最佳品質時,則開關控制階段將拋棄高於容許的位元率之各信號;而當二信號係低於容許的位元率時,開關控制階段將選擇具有較佳信號對雜訊比亦即具有較小的量化/編碼失真之信號。
如前文說明,根據本發明之解碼方案示例顯示於第11B圖。對三種可能的輸出信號各自存在有一特定解碼/再量化階段431、536或537。當階段431輸出頻譜也稱作為「時譜」(時域信號之頻譜)且使用頻率/時間變換器440變換成時域時,階段536輸出LPC域信號,階段537接收該LPC域信號之頻譜,也稱作為「LPC譜」。為了確定輸入開關532之輸入信號皆係於LPC域,於LPC域設置頻率/時間變換器537。開關532之輸出資料使用LPC合成階段540變換回時域,該LPC合成階段540係透過編碼器端所產生的且所傳輸的LPC資訊控制。然後於區塊540之後,二分支具有時域資訊,其係根據開關控制信號切換俾便最終獲得一音訊信號諸如單聲信號、立體聲信號或多頻道信號,取決於輸入第11A圖之編碼方案之信號。
因此第11A圖示例顯示根據本發明之較佳編碼方案。連結至開關200輸入端之一共通前處理方案包含環繞/聯合立體聲區塊101,其產生聯合立體聲參數及單聲輸出信號作為輸出信號,該單聲輸出信號係經由將有二或多個頻道之輸入信號降混而產生。大致上,於區塊101之輸出端之信號也可為有多個頻道之信號,但由於區塊101的降混功能,於區塊101輸出端之頻道數目將少於輸入區塊101的頻道數目。
替代區塊101或除了區塊101之外,共同前處理方案可包含頻寬延伸階段102。第11A圖之實施例中,區塊101之輸出信號輸入頻寬延伸階段102,於第11A圖之編碼器中,頻寬延伸階段102於其輸出端輸出一頻帶有限信號諸如低頻帶信號或低通信號。較佳此信號也經降取樣(例如藉因數2)。此外,如由MPEG-4之HE-AAC側寫實料已知,對輸入區塊102之信號的高頻帶,產生頻寬延伸參數諸如頻譜封包參數、反相濾波參數、雜訊底位準參數等且前傳至位元流多工器800。
較佳,決策階段300接收輸入區塊101或輸入區塊102之信號俾便介於音樂模式或語音模式間作判定。於音樂模式中選用上編碼分支400,而於語音模式選用下編碼分支500。較佳,決策階段額外控制聯合立體聲區塊101及/或頻寬延伸區塊102來將此等區塊之功能調整適合特定信號。如此,當決策階段判定輸入信號的某個時間部分具有第一模式諸如音樂模式時,區塊101及/或區塊102之特定特性可藉決策階段300控制。另外,當決策階段300判定信號係於語音模式或通常於第二LPC域模式時,區塊101及102之特定特性將根據決策階段之輸出信號控制。
較佳,編碼分支400之頻譜變換係使用MDCT運算進行,MDCT運算又更佳為時間翹曲的MDCT運算,此處強度或通常為翹曲強度係介於零翹曲強度與高翹曲強度間控制。於零翹曲強度中,於區塊411之MDCT運算為技藝界已知之直捷式MDCT運算。時間翹曲強度連同時間翹曲旁資訊可傳輸/輸入位元流多工器800作為旁資訊。
於LPC編碼分支,LPC域編碼器可包括一ACELP核心526,其計算音高增益、音高滯後及/或碼簿資訊諸如碼簿指數及增益。如由3GPP TS 26.290已知之TCX模式係處理於變換域之感官式加權信號。傅立葉已變換且已加權信號係使用帶有雜訊因數量化之分割多速率格狀量化(代數VQ)而量化。變換係於1024、512、或256個樣本視窗計算。經由將該已量化已加權的信號通過反相加權濾波器反相濾波,復原激勵信號。
於第一編碼分支400中,頻譜變換器較佳包含特別調整適合的MDCT運算,其具有某些視窗功能接著為量化/熵編碼階段,該階段可包含單一向量量化階段,但較佳為類似於頻域編碼分支中的量化器/編碼器,亦即第11A圖之項目421的組合式定標器量化器/熵編碼器。
於第二編碼分支,有個LPC區塊510,接著為開關521,再度接著為ACELP區塊526或TCX區塊527。ACELP係說明於3GPP TS 26.190及TCX係說明於3GPP TS 26.290。通常ACELP區塊526接收LPC激勵信號。TCX區塊527接收加權信號。
於TCX,變換施加至通過基於LPC之加權濾波器濾波輸入信號運算得之該已加權信號。本發明之較佳實施例使用的加權濾波器係以(1-A(z/γ))/(1-μz-1 )表示。如此,已加權信號為LPC域信號,其變換為LPC頻譜域。藉ACELP區塊526處理之信號為激勵信號,且係與藉區塊527處理的信號不同,但二信號皆係於LPC域。激勵信號係經由將輸入信號通過分析濾波器(1-A(z/γ))獲得。
於第11B圖之解碼器端,於區塊537之反相頻譜變換後,施加加權濾波器之反相,亦即(1-μz-1 )/(1-A(z/γ))。任選地,信號可額外通過(1-A(z))濾波來進入LPC激勵域。如此經由通過濾波,得自TCX-1 區塊537之信號可由加權域變換至激勵域,然後用於區塊536。當最後編碼係選用於下一個訊框之情況下,典型濾波係於用於饋送ACELP之適應性碼簿的反相TCX(537)結束時,於AMR-WB+進行此種典型濾波。
雖然第11A圖之項目510示例顯示單一區塊,但區塊510也可輸出不同信號,只要此等信號係於LPC域即可。區塊510之實際模式諸如激勵信號模式或加權信號模式可取決於實際切換狀態。另外,區塊510可具有兩個並聯處理裝置。如此於區塊510之輸出信號之LPC域可表示LPC激勵信號或LPC加權信號或任何其它LPC域信號。
於第11a圖或第11b圖之第二編碼分支(ACELP/TCX),信號較佳係於編碼前通過濾波器1-0.68z-1 進行前置加強。於第11B圖中於ACELP/TCX解碼器,已合成的信號係使用濾波器1/(1-0.68z-1 )解除加強。前置加強可構成LPC區塊510之一部分,此處於分析與量化之前,信號經前置加強。同理,解除加強可構成LPC合成區塊LPC-1 540之一部分。
於較佳實施例中,第一開關200(參考第11A圖)係經由開環決策控制,而第二開關係經由閉環決策控制。
舉例言之,可能為下述情況,於第一處理分支,第一LPC域表示LPC激勵信號;而於第二處理分支,第二LPC域表示LPC加權信號。換言之,第一LPC域信號係經由通過(1-A(z))濾波而變換成LPC殘餘域獲得;而第二LPC域信號係通過濾波器(1-A(z/γ))/(1-μz-1 )分支而變換成LPC加權信號獲得。於較佳模式中,μ係等於0.68。
第11B圖示例顯示與第11A圖之編碼方案相對應之解碼方案。第11A圖中由位元流多工器800產生的位元流輸入位元流解多工器900。依據例如由位元流透過模式檢測區塊601所導出的資訊,解碼器端開關600係控制於來自上分支之信號或來自下分支之信號前傳至頻寬延伸區塊701。頻寬延伸區塊701接收來自位元流解多工器900之旁資訊,此旁資訊及模式決策601之輸出信號,基於由開關600輸出的低頻帶輸出信號而重建高頻帶。
區塊701產生的全頻帶信號係輸入聯合立體聲/環繞處理階段702,其重建兩個立體聲頻道或數個多頻道。通常區塊702將輸出比輸入本區塊更多的頻道。依據應用用途而定,輸入區塊702之信號甚至包括兩個頻道諸如立體聲模式,甚至包括更多個頻道,只要本區塊的輸出信號具有比本區塊的輸入信號更多個頻道即可。
已經顯示開關200介於二分支間切換,故只有一個分支接收一信號進行處理,而另一分支並未接收信號來處理。但於另一個實施例中,開關也配置於例如頻域編碼器421及LPC域編碼器510、521、526、527之後,表示兩個分支400、500並列處理同一個信號。但為了不致於加倍位元率,只有由該等編碼分支400或500中之一者輸出的信號被選用來寫入輸出位元流。然後決策階段運算,使得寫入位元流之信號最小化某個代價函數,此處該代價函數可為所產生的位元率、或所產生的感官失真、或位元率/失真之組合代價函數。因此於本模式中或於附圖示例說明之模式中,決策階段也可以閉環模式運算俾便確保最後只有對一給定感官失真有最低位元率,或對一給定位元率有最低感官失真的編碼分支輸出信號被寫入該位元流。
於有二開關之實施例中,亦即第一開關200及第二開關521,較佳第一開關之時間解析度係低於第二開關之時間解析度。易言之,透過開關運算而切換之輸入第一開關之輸入信號區塊係大於介於LPC域運算之第二開關切換的區塊。舉例言之,頻域/LPC域開關200可切換長1024個樣本的區塊,而第二開關521可切換各自有256個或512個樣本的區塊。
大致上用於第一編碼分支400之音訊編碼演繹法則反映出且模型化音訊匯集情況。音訊資訊的匯集通常為人耳。人耳可模型化為頻率分析器。因此,第一編碼分支輸出已編碼之頻譜資訊。較佳第一編碼分支進一步包括一心理聲學模型用於額外施加心理聲學遮蔽臨界值。此種心理聲學遮蔽臨界值係用於量化音訊頻譜值之時,此處較佳進行量化使得藉量化隱藏於心理聲學遮蔽臨界值下方的頻譜音訊值而導入量化雜訊。
第二編碼分支表示資訊來源模型,反映出音訊聲音的產生。因此資訊來源模型包括一語音模型,其係藉LPC分析階段反映,亦即藉將時域信號變換成LPC域,且隨後處理該LPC殘餘信號亦即激勵信號而反映。但另一種聲音來源模型為表示某種樂器或任何其它聲音產生器諸如存在於實際世界的特定聲音來源的聲音來源模型。不同聲音來源模型間的選擇可於有數個聲音來源模型時進行,例如基於SNR計算,亦即基於計算來選出哪一個來源模型最適合用於編碼一音訊信號之某個時間部分及/或頻率部分。但較佳編碼分支間的切換係於時域進行,換言之某個時間部分係使用一種模型編碼,而中間信號的某個不同時間部分係使用另一個編碼分支編碼。
資訊來源模型係以某些參數表示。有關語音模型,當考慮現代語音編碼器諸如AMR-WB+時,參數為LPC參數及已編碼之激勵參數。AMR-WB+包含ACELP編碼器及TCX編碼器。此種情況下,已編碼激勵參數可為通用增益、雜訊底位準、及可變長度碼。
第11A圖之音訊輸入信號係存在於第一域,該域例如可為時域,但也可為任何其它域諸如頻域、LPC域、LPC頻譜域或任何其它域。通常由一個域變換至另一個域係藉變換演繹法則諸如眾所周知之時間/頻率變換演繹法則或頻率/時間變換演繹法則中之任一者進行。
由時域的另一種變換例如LPC域係由於LPC濾波一時域信號,結果導致LPC殘餘信號或激勵信號的結果。任何其它濾波運算產生已濾波信號,其係於變換可用作為變換演繹法則(視情況而定)之前,對相當大量信號樣本有影響。因此使用基於LPC加權濾波器來加權一音訊信號為又一種變換,其產生於LPC域之信號。於時間/頻率變換中,於變換前單一頻譜值的修改將對全部時域值有影響。另外,任何時域樣本的修改將對各個頻域樣本有影響。同理,由於LPC濾波器之長度,於LPC域情況中激勵信號樣本的修改將對LPC濾波前相當大量的樣本有影響。同理,於LPC變換前的樣本修改將對藉此LPC變換所得的多個樣本有影響,原因在於LPC濾波器特有的記憶效應之故。
第1A圖示例顯示用於編碼一音訊信號10之裝置之較佳實施例。該音訊信號較佳係導入具有第11A圖之第一編碼分支諸如400之一編碼裝置,用於於第三域編碼該音訊信號,第三域例如可為直通頻域。此外,編碼器包含用於基於第四域編碼該音訊信號之一第二編碼分支,該第四域例如為藉第11A圖之TCX區塊527所得之LPC頻域。
較佳本發明裝置包含一視窗化器11,用於使用具有一分析視窗形狀之一第一分析視窗來視窗化於第一域之該音訊信號的第一區塊,如於第8A圖及第8B圖或其它圖討論,該分析視窗具有頻疊部諸如Lk 或Rk ,及如第5圖或其它圖之示例說明,具有一非頻疊部諸如Mk
該裝置額外包含一處理器12,用於處理與該分析視窗之頻疊部相關聯之該音訊信號之第一子區塊,藉由於第一子區塊視窗化之後,將該子區塊從第一域諸如該信號域或直通時域變換成第二域諸如LPC域來獲得一已處理的第一子區塊;以及用於處理與該分析視窗之額外部相關聯之該音訊信號之第二子區塊,藉由於第二子區塊視窗化之前,將該子區塊從第一域諸如直通時域變換成第二域諸如LPC域來獲得一已處理的第二子區塊。此外,本發明裝置包含一變換器13,用於使用相同的區塊變換法則,將該已處理的第一子區塊及已處理的第二子區塊由第二域變換成第四域諸如LPC頻域來獲得一已變換的第一區塊。然後此一已變換的第一區塊可於額外處理階段14進一步處理來進行資料壓縮。
較佳,進一步處理也接收重疊該第一區塊之音訊信號於第一域的第二區塊作為輸入信號,其中音訊信號於第一域諸如時域的第二區塊係使用第二分析視窗於第三域亦即直通頻域處理。此種第二分析視窗具有一頻疊部,該頻疊部係與第一分析視窗之頻疊部相對應。第一分析視窗之頻疊部及第二分析視窗之頻疊部較佳係與視窗化之前原先音訊信號的相同音訊樣本相關,此等部分接受時域頻疊抵消,亦即於解碼器端接受重疊-加法程序。
第1B圖示例說明當進行由於第四域例如LPC頻域編碼之一區塊變換至第三域諸如頻域時發生的情況。一個實施例中,第四域為MDCT-TCX域,第三域為AAC域。施加於於MDCT-TCX域編碼之音訊信號的視窗具有一頻疊部20及一非頻疊部21。該區塊於第1B圖中命名為「第一區塊」可具有或可未具有又一頻疊部22。對於非頻疊部亦為真。可存在或可不存在。
於另一域諸如AAC域編碼之該音訊信號第二區塊包含一相對應之頻疊部23,視情況而定,此第二區塊可包括額外部諸如非頻疊部或頻疊部,於第1B圖指示為24。因此第1B圖示例說明音訊信號之重疊處理,使得於視窗化前第一區塊之頻疊部20中之音訊樣本係與於視窗化前第二區塊之相對應頻疊部23之音訊樣本相同。如此,第一區塊之音訊樣本係經由施加分析視窗至屬於一音訊樣本串流之音訊信號而獲得;及第二區塊之音訊樣本係經由將第二分析視窗施加至多個音訊樣本而獲得,該等多個音訊樣本包括於相對應頻疊部23之樣本及於第二區塊額外部24之樣本。因此,於頻疊部20之音訊樣本為與頻疊部20相關聯之音訊信號之第一區塊,於音訊信號額外部21之音訊樣本係與與該額外部21相關聯之音訊信號之第二子區塊相對應。
第1C圖示例顯示如同第1B圖之類似情況,但係由AAC亦即第三域變遷至MDCT-TCX域亦即第四域。
第1B圖與第1C圖間之差異大致上為第1B圖之頻疊部20包括出現於額外部21之音訊樣本隨後時間之樣本;而第1C圖中,於頻疊部20之音訊樣本於時間上係出現於額外部21之音訊樣本之前。
第1D圖示例顯示使用音訊樣本之一個且同一個視窗化區塊之第一子區塊及第二子區塊中之音訊樣本進行之步驟之細節代表圖。大致上,一個視窗有一增加部及一減少部,依據視窗形狀而定,可有或無相對恆定的中部。
於第一步驟30,進行區塊形成運算,其中取得之一音訊樣本串流之某個數目的音訊樣本。特定言之,區塊形成運算30將定義第1B圖及第1C圖中哪一個音訊樣本屬於第一區塊及哪一個音訊樣本屬於第二區塊。
於頻疊部20之音訊樣本於步驟31a經視窗化。但要緊地,於非頻疊部亦即於第二子區塊之音訊樣本係於步驟32於較佳實施例轉成第二域,亦即LPC域。然後於轉變第二子區塊之音訊樣本後,進行視窗化運算31b。視窗化運算31b所得音訊樣本形成輸入第四域之區塊變換運算之樣本,第1D圖中顯示於項目35。
區塊31a、31b之視窗化運算可或可未包括如就第8A、8B、9A、10A圖討論之摺疊運算。較佳視窗化運算31a、31b額外包含摺疊運算。
但頻疊部變換成第二域諸如區塊33的LPC域。如此域變換入第四域(指示於34)之樣本區塊完成,區塊34組成一個資料區塊輸入一個區塊變換運算諸如時間/頻率變換運算。因於較佳實施例中,第二域為LPC域,故於步驟35之區塊變換運算的輸出信號將於第四域,亦即LPC頻域。由區塊變換35所產生之此一區塊將為已轉換之第一區塊36,其然後首先於步驟37處理俾便應用任一種資料壓縮,例如包含於AMR-WB+編碼器中施加至TCX資料之資料壓縮運算。當然全部其它資料壓縮運算也可於區塊37進行。因此區塊37係與第1A圖之項目14相對應,第1D圖之區塊35係與第1A圖之項目13相對應,及視窗化運算相當於第1D圖之31b及31a係與第1A圖之項目11相對應,對額外部及頻疊部不同的變換與視窗化間之順序排程係藉第1A圖之處理器12進行。
第1D圖示例顯示其中額外部係由第1B圖或第1C圖之非頻疊子部21及頻疊子部22所組成之情況。另外,額外部可只包括頻疊部而不含非頻疊部。於此種情況下,第1B圖及第1C圖之21不存在,而22係由該區塊之邊界延伸至頻疊部20之邊界。總而言之,額外部/額外子區塊係以相同方式處理(而與完全無頻疊或完全頻疊或具有頻疊子部或非頻疊子部無關),但該處理方式係與頻疊子區塊之處理方式不同。
第2圖示例顯示於本發明之較佳實施例發生於不同域之綜論。
通常音訊信號將於第一域40,例如為時域。但本發明實際應用至當音訊信號欲於二不同域編碼時的情況,及應用至已經以位元率最佳化方式亦即使用臨界取樣進行由一個域切換至另一個域時的全部情況。
於較佳實施例中,第二域為LPC域41。由第一域變換至第二域將透過如第2圖指示之LPC濾波器/變換進行。
於較佳實施例中,第三域為直通頻域42,係藉眾所周知之時間/頻率變換之任一種方式獲得,諸如DCT(離散餘弦變換)、DST(離散正弦變換)、傅立葉變換或快速傅立葉變換或任何其它時間/頻率變換。
相對應地,由第二域變換至第四域43諸如LPC頻域或一般言之就第二域41所述之頻域也可藉眾所周知之時間/頻率變換演繹法則諸如DCT、DST、FT、FFT中之任一者獲得。
然後第2圖與第11A圖或第11B圖作比較,區塊421之輸出信號將具有於第三域之信號。此外,區塊526之輸出信號將具有於第二域之信號,及區塊527之輸出信號將包含於第四域之信號。輸入開關200之其它信號或通常為輸入決策階段300或環繞/聯合立體聲階段101之其它信號將於第一域諸如時域。
第3A圖示例顯示用於解碼具有音訊資料之已編碼第一區塊50之一編碼音訊信號之本發明裝置之較佳實施例,此處已編碼區塊具有一頻疊部及一額外部。此外,本發明之解碼器包含一處理器51用於處理該頻疊部,係經由將該頻疊部變換至用於執行合成視窗化之一目標域來獲得一已視窗化頻疊部52;以及該處理器51係用於將該視窗化額外部變換成目標域之前,用於執行該額外部之合成視窗化。
因此,於解碼器端,屬於同一個視窗之一區塊之各部分係以不同方式處理。類似處理應用於編碼器端來允許臨界取樣開關介於不同域間切換。
此外,本發明解碼器包含一時域頻疊抵消器53,用於於已編碼第二區塊之頻疊部變換成目標域之後,組合第一區塊之已視窗化頻疊部亦即輸入信號52與音訊資料之已編碼第二區塊之已視窗化頻疊部,來獲得已解碼音訊信號55,其係與第一區塊之頻疊部相對應。已編碼第二區塊之已視窗化頻疊部係透過54而輸入時域頻疊抵消器53。
較佳時域頻疊抵消器53係實施為重疊/加法裝置,例如施加50%重疊。如此表示一個區塊之合成視窗結果係重疊音訊資料之相鄰已編碼區塊經合成視窗處理結果,此處此重疊較佳包含50%該區塊。如此表示更早期區塊之合成已視窗化音訊資料之第二部以逐一樣本方式加至已編碼音訊資料後來第二區塊之第一部,故最終,已解碼音訊資料為兩相鄰區塊之相對應已視窗化樣本之和。於其它實施例中,重疊範圍可多於或少於50%。此種時域頻疊抵消器之組合特徵提供由一個區塊至下一個區塊連續交叉衰減,完全移除出現於任何基於區塊的變換編碼方案中之任何阻擋假信號。由於實際上不同域之頻疊部可藉本發明組合,獲得由一個域之區塊至另一個域之區塊的臨界取樣切換運算。
比較不含任何交叉衰減之開關編碼器,其中進行由一個區塊至另一個區塊之硬切換,藉本發明程序改良音訊品質,原因在於硬切換無可避免地將導致於區塊邊界的阻擋假信號諸如可聽聞的爆裂或任何其它非期望的雜音。
比較非臨界取樣交叉衰減,確實將去除於區塊邊界的此種非期望的尖銳雜音,但本發明不會因切換導致任何資料率增加。於先前技術,當相同音訊信號透過第一編碼分支於第一區塊編碼,且透過第二編碼分支於第二區塊編碼時,若未經頻疊導入處理,則已經於二編碼分支編碼的樣本量將耗用位元率。但根據本發明,頻疊係導入於區塊邊界。但此種頻疊導入係藉樣本減少獲得,結果導致可能藉時域頻疊抵消器53應用交叉衰減運算而未有位元率增高或非臨界取樣切換的損失。
於最佳實施例中,進行真正臨界取樣切換。但於某些情況下,也有較非有效實施例,其中只導入某種頻疊量,而允許某個位元率額外管理資料量。但由於實際上使用且組合頻疊部,雖言如此,全部此等較非有效的實施例經常性係優於帶有交叉衰減之完全無頻疊變遷;或就品質方面而言係優於由一個編碼分支硬切換至另一個編碼分支。
於本內文中,須瞭解於TCX之非頻疊部仍然產生經臨界取樣的已編碼樣本。於TCX加上非頻疊部不會有損臨界取樣,反而危害變遷品質(較低轉移)及頻譜呈示品質(較低能量壓縮)。有鑑於此,較佳具有於TCX之非頻疊部儘可能地小或甚至接近於零,故該額外部完全頻疊,而未具有一不含頻疊子部。
隨後將討論第3B圖來示例說明第3A圖之程序之較佳實施例。
於步驟56,進行例如於第四域之該已編碼的第一區塊之解碼器處理。此種解碼器處理可為熵解碼諸如霍夫曼解碼或與第1A圖於編碼器端於區塊14之額外處理運算相對應之算術解碼。於步驟57,進行完整第一區塊之頻率/時間變換,指示於步驟57。根據第2圖,於步驟57之此一程序獲得於第一域之完整第一區塊。現在,根據本發明,第一區塊之各部分以不同方式處理。特定言之,頻疊部亦即步驟57之輸出信號之第一子區塊將於使用合成視窗進行視窗化運算前變換至目標域。係以變換步驟58a及視窗化步驟59a之順序指示。第二子區塊亦即無頻疊子區塊就此,亦即未經第3B圖以項目58a之變換運算,使用如59b指示之合成視窗而視窗化。於區塊59a或59b之視窗化運算可包含或可未包含摺疊(展開)運算。但較佳視窗化運算包含摺疊(展開)運算。
依據與額外部相對應之第二子區塊是否確實為頻疊子區塊或非頻疊子區塊,進行如59b指示之變換成目標域之運算,而不含於第二子區塊為非頻疊子區塊之情況下的TDAC運算/組合運算。但當第二子區塊為頻疊子區塊時,於步驟59b變換至目標域之變換運算前,進行TDAC運算,亦即組合運算60b,獲得另一個區塊之相對應部來算出第二區塊之已解碼音訊信號。
於另一分支,亦即對於第一子區塊相對應之頻疊部,步驟59a之視窗化運算結果輸入組合階段60a。本組合階段60a也接收第二區塊之頻疊部作為輸入信號,該第二區塊亦即已經於其它域例如第2圖實例中之AAC域編碼之區塊。然後區塊60a之輸出信號組成第一子區塊之已解碼音訊信號。
比較第3A圖與第3B圖,顯然組合運算60a係與第3A圖之區塊53進行之處理相對應。此外,處理器51進行之變換運算及視窗化運算就變換運算而言係與項目58a、58b相對應,而就視窗化運算而言係與59a及59b相對應,此處第3A圖之處理器51進一步確保維持頻疊部與另一部亦即第二子區塊之正確順序。
於較佳實施例中,施用修改型離散餘弦變換(MDCT)來獲得由一個域之編碼運算切換至不同的另一域之編碼運算之臨界取樣。但也可施用全部其它變換。但因MDCT為較佳實施例,將就第4A圖及第4B圖討論MDCT之進一步細節。
第4A圖示例顯示一視窗70,其具有朝左之一遞增部及朝右之一遞減部,此處可將此視窗劃分成為四部分:a、b、c、及d。由該圖可知,視窗70於示例說明之50%重疊/加法情況下只有頻疊部。特定言之,具有由零至N樣本之第一部係與前一個視窗69之第二部相對應,延伸於視窗70之樣本N至樣本2N間之第二半係重疊視窗71之第一部,視窗71於所示實施例中為視窗i+1,而視窗70為視窗i。
可見MDCT運算為摺疊運算與隨後變換運算及特別為接著DCT運算之級聯,此處應用IV型DCT(DCT-IV)。特定言之,經由將摺疊區塊之第一部N/2計算為-cR -d,及摺疊輸出信號之N/2樣本之第二部計算為a-bR ,此處R為倒數運算元,獲得摺疊運算。如此,摺疊運算獲得N個輸出值,而接收2N個輸入值。
也於第4A圖以方程式形式示例顯示於解碼器端相對應的展開運算。
大致上,對(a,b,c,d)之MDCT運算確切獲得如第4A圖指示之(-cR -d,a-bR )之DCT-IV的相同輸出值。
相對應地且使用展開運算,IMDCT運算獲得施加至DCT-IV反相變換之輸出信號的展開運算之輸出信號。
因此,經由於解碼器端執行摺疊操作導入時間頻疊。然後摺疊運算結果使用要求N個輸入值之DCT-IV區塊變換而變換成頻域。
於解碼器端,N個輸入值使用DCT-IV-1 運算變換回時域,此種反相變換運算之輸出改成展開運算而獲得2N個輸出值,但該等輸出值為頻疊輸出值。
為了移除已經藉摺疊運算所導入之頻疊,且仍然接在展開運算之後,要求藉第3A圖之時域頻疊抵消器53進行重疊/加法運算。
因此,當展開運算的結果與重疊半數的先前IMDCT結果相加時,於第4A圖底的方程式中,倒數項抵消,而只獲得例如b及d,如此復原原先資料。
為了對已視窗化之MDCT獲得TDAC,存在有一種要求,稱作為「普林生-布拉利(Princen-Bradley)」條件,表示對於時域頻疊抵消器中組合的相對應樣本之視窗係數平方,因而各個樣本獲得一單位(1)。
第4A圖示例顯示例如對長視窗或短視窗於AAC-MDCT應用之視窗順序;第4D圖示例顯示不同的視窗函數,其除了頻疊部之外,也有一非頻疊部。
第4D圖示例顯示一分析視窗函數72具有一零部a1 及d2 ,具有一頻疊部72a、72b及具有一非頻疊部72c。
延伸於c2 、d1 之頻疊部72b具有隨後視窗73之相對應頻疊部,以73b指示。相對應地,視窗73額外包含一非頻疊部73a。第4B圖比較第4A圖,顯然由於對視窗72有零部a1 、d1 或對視窗73有零部c1 ,二視窗接收一非頻疊部,於頻疊部之視窗函數係比第4A圖更陡峭。有鑑於此,第4B圖中,頻疊部72a係對應於Lk ,非頻疊部72c係對應於Mk 部,及頻疊部72b係對應於第4B圖之Rk
當摺疊函數施用於藉視窗72而視窗化之樣本區塊時,獲得如第4B圖示例顯示之情況。延伸於前四分之N個樣本之左部具有頻疊。延伸於N/2樣本之第二部不含頻疊原因在於摺疊運算係應用於具有零值之視窗部分,最末N/4樣本再度具有頻疊。由於摺疊運算故,摺疊運算之輸出值數目係等於N,輸入值數目為2N,但實際上因使用視窗72進行視窗化運算,本實施例之N/2值設定為零。
現在DCT IV應用於摺疊運算的結果,但要緊地,由一個編碼模式變遷至另一個編碼模式之頻疊部72係以與非頻疊部不同的方式處理,但二部分係屬於音訊樣本的同一區塊,要緊地,係輸入第1A圖中由變換器30所執行的相同區塊變換運算。
第4B圖額外示例顯示視窗72、73、74之視窗順序,此處視窗73為由確實存在有非頻疊部之情況變遷至只存在有頻疊部之情況之一變遷視窗。此點係經由非對稱地成形視窗函數獲得。視窗73之右部係類似於第4A圖之視窗順序中之視窗右部,而左部具有非頻疊部及相對應之零部(位於c1 )。因此,第4B圖示例顯示當欲使用完全重疊視窗進行AAC時,由MDCT-TCX變遷至AAC;或另外,當視窗74以完全重疊方式視窗化TCX資料區塊時,示例顯示由AAC變遷至MDCT-TCX,當並無理由由一種模式切換至另一種模式時,此乃一方面為MDCT-TCX之常規運算,另一方面為MDCT-AAC之常規運算。
因此,視窗73定名為「開始視窗」或「停止視窗」,其額外具有較佳特性為本視窗長度係與至少一個鄰近視窗之長度相等,因此當一區塊設定為具有與視窗係數相等數目,亦即於第4D圖或第4A圖之實例中2n個樣本時,維持一般區塊格柵或訊框格柵。
隨後,就第5圖討論編碼器端及解碼器端之AAC-MDCT程序。
於視窗化運算80中,應用於81示例說明之視窗函數。該視窗函數具有二頻疊部Lk 及Rk 及一非頻疊部Mk 。因此視窗函數81係類似於第4B圖之視窗函數72。應用本視窗函數至相對應之多數音訊樣本,結果導致具有對應於Rk /Lk 之頻疊子區塊及對應於Mk 之非頻疊子區塊之音訊樣本之已視窗化區塊。
以82示例顯示之摺疊運算係如第4B圖之指示執行,獲得N個輸出信號,表示Lk 部、Rk 部減少成有較少數樣本。
然後如關聯第4A圖之MDCT方程式討論而執行DCT IV 83。MDCT輸出信號進一步藉任何可利用之資料壓縮器諸如量化器84或任何其它執行眾所周知之AAC工具之裝置處理。
於解碼器端,執行反相處理85。然後透過DCT-1 IV 86執行由第三域變換至第一域。然後如第4A圖之討論執行展開運算87。然後於區塊88,執行合成視窗化運算,項目89a及89b共同執行時域頻疊抵消。項目89b為應用Mk +Rk 樣本延遲之延遲裝置,俾便獲得如第4A圖討論之重疊;加法器89執行音訊信號之目前部分之組合,諸如目前視窗輸出信號之第一部Lk 與前一個視窗之最末部Rk-1 之組合。於90指示,結果導致無頻疊部Lk 及Mk 。須注意Mk 由一開始即為無頻疊,但藉裝置89a、89b處理已經抵消於頻疊部Lk 的頻疊。
於較佳實施例中,AAC-MDCT也被施加以只有頻疊部之視窗,如第4A圖指示,但對一種編碼模式切換至另一種編碼模式,較佳應用具有頻疊部及非頻疊部之AAC視窗。
本發明之實施例係用於介於AAC與AMR-WB+[4]間切換之切換音訊編碼。
如第5圖所述,AAC使用MDCT。AAC極為適合用於音樂信號。當於先前處理檢測得輸入信號為音樂或由使用者標示為音樂時,切換編碼使用AAC。
輸入信號訊框k係藉尺寸為Lk 、Mk 及Rk 之三部分視窗而視窗化。於變換於頻域之信號此處執行量化之前,MDCT導入時域頻疊組件。於加上大小Rk-1 =Lk 之重疊前一個視窗化信號之後,若導入任何量化誤差,則可復原原先信號訊框之頭Lk +Mk 樣本。時域頻疊被抵消。
隨後,就第6圖討論本發明之TCX-MDCT程序。
與第5圖之編碼器相反,變換成第二域係藉項目92執行。項目92為產生LPC殘餘信號或加權信號之LPC變換器,該加權信號可使用如由TCX處理已知之加權濾波器,經由加權LPC殘餘信號求出。當然該TCX信號也可使用單一濾波器計算,經由濾波時域信號,獲得TCX信號,該TCX信號為於LPC域之信號或概括言之於第二域之信號。因此,第一域/第二域變換器92於其輸出端,提供輸入視窗化裝置80之信號。除了變換器92之外,第6圖之編碼器中之程序係類似第5圖之編碼器中之程序。當然於第5圖及第6圖之區塊84可應用不同的資料壓縮演繹法則,當AAC編碼工具比較TCX編碼工具時顯然易明。
於解碼器端,執行如就第5圖討論之相同步驟,但此等步驟並非對直通頻域(第三域)之已編碼信號執行,反而係對第四域亦即LPC頻域所產生之已編碼信號執行。
因此第6圖藉裝置89a、89b之重疊加法程序係於第二域執行,而非如第5圖之示例說明,於第一域執行。
AMR-WB+係基於語音編碼ACELP及基於變換之編碼TCX。對各個1024個樣本之超訊框而言,AMR-WB+係以閉環決策於TCX與ACELP之17種不同的組合間作選擇。使用SegSNR客觀評估根據閉環決策選出最佳者。AMR-WB+適合用於語音及語音/音樂信號。原先TCX之DFT係由MDCT置換來享有其重要性質。然後AMR-WB+之TCX等於MPTC編碼,但量化除外,量化仍然維持。當輸入信號被檢測得或被標示為語音或語音/音樂時,由已切換的音訊編碼器使用修改型AMR-WB+。
TCX-MDCT並非直接對信號域執行MDCT,反而係於基於LPC係數藉分析濾波器W(z)濾波該信號後執行MDCT。濾波器稱作為加權分析濾波器,允許同一個時間,TCX白化該信號且藉符合心理聲學理論的基於共振峰之曲線來成形量化雜訊。
第5圖示例說明之處理係對直通AAC-MDCT模式執行,而未使用第4A圖之完全重疊視窗切換至TCX模式或任何其它模式。但當檢測得變遷時應用特定視窗,該視窗為變遷至其它編碼模式之AAC開始視窗,或為由其它編碼模式變遷至AAC模式之AAC停止視窗,如第7圖示例說明。AAC停止視窗93具有一頻疊部示例顯示於93b及一非頻疊部示例顯示於93a,亦即於圖中指示為視窗93之水平部分。相對應地,AAC停止視窗94顯示具有一頻疊部94b及一非頻疊部94a。於AMR-WB+部中,應用類似於第4B圖視窗72之一視窗,此處本視窗具有一頻疊部72a及一非頻疊部72c。雖然只有單一AMR-WB+視窗,可知如第7圖顯示之開始/停止視窗,但可有多數個較佳具50%重疊的視窗,因此類似於第4A圖之視窗。通常於AMR-WB+之TCX未使用50%重疊。只採用小量重疊可使用特有的矩形視窗亦即0%重疊敏捷地切換至ACELP/從ACELP切換。
但當進行變遷時,應用AMR-WB+開始視窗,示例顯示於第7圖之左中部;當判定欲執行由AMR-WB+切換至AAC時,應用AMR-WB+停止視窗。開始視窗具有左側頻疊部,而停止視窗具有右側頻疊部,此處此等頻疊部係示於72a,及此處此等頻疊部係與示於93b或94b之鄰近AAC開始/停止視窗之頻疊部相對應。
於第7圖128個樣本之兩個重疊區進行特殊處理。為了抵消AAC之時域頻疊,AMR-WB+節段之第一個訊框及最後一個訊框被強制變成TCX而非ACELP。可藉由於閉環決策中偏移SegSNR分數進行。此外,TCX-MDCT之前128個樣本係特別如第8A圖處理,此處Lk =128。
AMR-WB+之最末128個樣本係如第8B圖處理,此處Rk =128。
第8A圖示例顯示頻疊部Rk 朝非頻疊部右側之處理用於由TCX變遷至AAC;第8B圖示例顯示頻疊部Lk 朝非頻疊部左側之特殊處理用於由AAC變遷至TCX。就第6圖而言為相似的處理,但加權運算,亦即由第一域變換至第二域之位置不同。特定言之,第6圖中,變換係於視窗化之前進行;而第8B圖中,變換92係於視窗化80(及摺疊82)之後進行,亦即以「TDA」指示之時域頻疊導入運算。
再度,於解碼器端,進行如第6圖之相當類似的處理步驟;但再度,頻疊部之反相加權位置係位在視窗化88之前(及展開87之前),而於第8A圖以86指示之由第一域變換至第二域之後。
因此,根據本發明之較佳實施例,TCX之變遷視窗之頻疊部係如第1A圖或第1B圖指示處理,而該視窗之非頻疊部係根據第6圖處理。
任何AAC-MDCT視窗之處理維持相同,但於變遷時選擇一開始視窗或一停止視窗除外。但於其它實施例中,TCX處理維持相同,AAC-MDCT視窗之頻疊部比較非頻疊部以不同方式處理。
此外,視情況而定二視窗亦即AAC視窗或TCX視窗之兩個頻疊部可以與其非頻疊部之不同方式處理。但於較佳實施例中,較佳AAC處理係就此進行;原因在於由第5圖顯然易知,AAC處理已經於重疊-加法程序之後的信號域;以及較佳TCX變遷視窗對非頻疊部係如第6圖之內文之示例說明處理,而對頻疊部係如第8A圖或第8B圖之示例說明處理。
接著討論第9A圖,其中第1A圖之處理器12指示為控制器98。
第9A圖中具有與第11A圖之各項相對應之元件符號之裝置具有類似的功能而不再討論。
特別,第9A圖示例顯示之控制器98係如第9B圖作業。於步驟98a,檢測得變遷,此處此變遷係藉決策階段300指示。然後控制器98啟動而偏移開關521,使得開關521選擇替代之道(2b)。
然後藉控制器98執行步驟98b。特別,控制器操作而取頻疊部之資料,未將該資料直接饋至LPC 510,反而未藉LPC濾波器加權,將該資料於LPC濾波器510之前,直接饋至TDA區塊527a。然後藉控制器98取得此資料及加權,然後於已經藉於控制器98輸出端之加權濾波器加權後,饋至DCT區塊527b。控制器98之加權濾波器於信號分析後使用於LPC區塊510求出之LPC係數。LPC區塊可饋至ACELP或TCX,此外,執行LPC分析來獲得LPC係數。MDCT裝置之DCT部分527b係由TDA裝置527a及DCT裝置527b組成。於控制器98輸出端之加權濾波器具有與LPC區塊510之濾波器及可能存在的額外加權濾波器諸如於AMR-WB+TCX處理中之感官濾波器相同的特性。如此,於步驟98b,TDA-、LPC-、及DCT處理係照此順序進行。
額外部分之資料饋入LPC區塊510,及隨後如第9A圖之正常信號路徑指示饋至MDCT區塊527a、527b。此種情況下,TCX加權濾波器並未明示於第9A圖,原因在於其係屬於LPC區塊510。
如前述,如第8A圖指示,頻疊部的資料於區塊527a視窗化,於區塊527內部產生的已視窗化資料於控制器輸出端經LPC濾波,然後LPC濾波結構應用至MDCT區塊527之變換部527b。用於加權由LPC區塊510所產生的LPC殘餘信號之TCX加權濾波器未顯示於第9A圖。此外,如就第8A圖討論,裝置527a包括視窗化階段80及摺疊階段82;裝置527b包括DCT IV階段83。然後DCT IV階段83/527b接收處理後之頻疊部及相對應處理後之其它部分,進行共通MDCT運算,隨後於區塊528之資料壓縮例如第9B圖之步驟98d指示進行。因此於就第9A圖討論之有線編碼器或軟體控制編碼器之情況下,如就第9D圖指示,於不同區塊510與527a、527b間,控制器98進行資料排程。
於解碼器端,除了第11B圖指示之區塊之外,設置變遷控制器99,如前文說明。
變遷控制器99之功能將就第10B圖討論。
一旦如第10B圖步驟99a摘述,變遷控制器99檢測為變遷,於資料解壓縮器537a之資料解壓縮後,整個訊框饋至MDCT-1 階段537b。此程序指示於第10B圖步驟99b。然後如步驟99c指示,於進行TDAC處理之前,頻疊部直接饋至LPC-1 階段。但頻疊部並未接受完整「MDCT」處理,反而如第8B圖所示只接受由第四域至第二域之反相變換。
第8B圖之DCT-1 IV階段86/階段537b之後,頻疊部饋至第10A圖之額外LPC-1 階段537d,確保由第二域變換至第一域及隨後,於區塊537c進行第8B圖之展開運算87及視窗化運算88。因此,於階段86之DCT-1 運算後,變遷控制器99接收來自於區塊537b之資料,然後將此資料饋至LPC-1 區塊537d。然後本程序之輸出信號饋入區塊537d來進行展開87及視窗化88。然後頻疊部之視窗化結果前傳至TDAC區塊440b,俾便執行與AAC-MDCT區塊之相對應頻疊部之重疊-加法運算。有鑑於此,頻疊區塊之處理順序為:於537a資料解壓縮,於537b DCT-1 ,於537d反相LPC及反相TCX感官加權(共同表示反相加權),於537c TDA-1 處理及然後於440b重疊及加法。
雖言如此,當忽略與區塊99連接的箭頭時,訊框其餘部分係於540 TDAC及反相濾波/加權之前饋至視窗化階段,如就第6圖討論且如第10A圖之正常信號流程圖指示。
有鑑於此,步驟99c獲得TDAC 440b後頻疊部之已解碼音訊信號;步驟99d獲得於TDAC 537c之LPC域及區塊540之反相加權後,剩餘部分/額外部之已解碼音訊信號。
依據某些實施要求而定,本發明之實施例可於硬體或軟體實施。該實施例可使用數位儲存媒體例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM、或快閃記憶體進行,該等數位儲存媒體有可電子讀取控制信號儲存於其上,與可規劃電腦系統協力合作(或可協力合作)因而進行個別方法。
根據本發明之若干實施例包含具有可電子讀取控制信號之資料載體,該等控制信號可與可規劃電腦系統協力合作,因而執行如此處所述之方法之一。
大致上,本發明之實施例可實施為帶有程式碼之電腦程式產品,當該電腦程式產品於電腦上運轉時,該程式碼可運算用以執行該等方法之一。程式碼例如可儲存於機器可讀取載體上。
其它實施例包含儲存於機器可讀取載體上之用於執行此處所述方法中之一者之電腦程式。
換言之,因此本發明之實施例為一種電腦程式具有一程式碼,當該電腦程式於電腦運轉時用於執行此處所述之方法之一。
因此本發明之又一實施例為一種資料載體(或數位儲存媒體或電腦可讀取媒體)包含記錄於其上之用於執行此處所述方法之一的電腦程式。
因此本發明之又一實施例為一種表示該電腦程式之資料串流或信號序列用於執行此處所述方法之一。該資料串流或信號序列例如可建置成透過資料通訊連結例如網際網路傳送。
又一實施例包含一種處理裝置例如電腦或可規劃邏輯裝置,其係建置成或適合執行此處所述方法之一。
又一實施例包含一種電腦,其上安裝用於執行此處所述方法之一之電腦程式。
於若干實施例中,可規劃邏輯裝置(例如欄可規劃閘極陣列)可用於執行部分或全部此處所述之方法功能。於若干實施例中,欄可規劃閘極陣列可與微處理器協力合作來執行此處所述方法之一。
前文說明之實施例僅供舉例說明本發明之原理。須瞭解熟諳技藝人士顯然易知前文說明之配置及細節之修改及變化。因此意圖本發明之範圍僅受隨附之申請專利範圍所限,而非受此處實施例之說明及解釋表示型態之特定細節所限。
10...音訊信號
11...視窗化器
12...處理器
13...變換器
14...處理裝置、額外處理階段
20...頻疊部
21...非頻疊部、非頻疊子部
22...又一頻疊部、頻疊子部
23...頻疊部
24...額外部
30-37...步驟
31a-b...視窗化運算
40...第一域
41...LPC域、第二域
42...直通頻域、第三域
43...第四域
50...已編碼之第一區塊
51...處理器
52...已視窗化之頻疊部
53...時域頻疊抵消器
54...輸入
55...已解碼音訊信號
56...步驟
57...步驟
58a...變換步驟
58b...視窗化運算
59a...視窗化步驟
59b...變換運算
60a...組合階段
60b...組合步驟
69...視窗
70...視窗
72...分析視窗函數
72a...頻疊部
72b...頻疊部
72c...非頻疊部
73...視窗
73a...非頻疊部
73b...頻疊部
74...視窗
80...視窗化運算、視窗化裝置
81...視窗函數
82...摺疊運算
83...DCT IV階段
84...量化器
85...反相處理
86...DCT-1 IV、第二域
87...展開運算
88...合成視窗化運算
89a-b...時域頻疊抵消裝置
90...無頻疊部
92...LPC變換器、第一域/時域變換器
93...AAC停止視窗
93a...非頻疊部
93b...頻疊部
98...控制器
98a-d...步驟
99...變遷控制器
99a-d...步驟
101...環繞/聯合立體聲區塊
102...頻寬延伸階段
200...開關
300...決策階段
400...上編碼分支、頻率編碼分支
411...頻譜變換區塊、頻譜變換階段、MDCT運算
421...頻譜音訊編碼器、量化/編碼階段、頻域編碼器
431...頻譜音訊解碼器、解碼/再量化階段
440...時域變換器、頻率/時間變換器
440b...TDAC區塊
500...LPC域編碼部、下編碼分支、LPC編碼分支
510...LPC分析階段、LPC裝置、LPC區塊
521...開關、第二開關
526...量化/編碼運算、ACELP核心、ACELP區塊
527...量化/編碼運算、量化/編碼階段、頻譜變換器、TCX區塊、MDCT區塊
527a...TDA區塊
527b...DCT區塊、變換部
532...開關
536...元件、解碼/再量化階段
537...元件、解碼/再量化階段、頻率/時間變換器、TCX-1 區塊
537a...資料解壓縮器
537b...MDCT1 階段、TDAC區塊
537c...TDA-1 階段
537d...反相LPC及反相TCX感官加權階段
540...LPC合成階段、LPC-1
600...開關、解碼器端開關
601...模式檢測區塊
701...頻寬延伸區塊
702...聯合立體聲/環繞處理階段
800...位元流多工器
900...位元流解多工器
第1A圖為用於編碼音訊信號之較佳裝置或方法之示意代表圖;
第1B圖為由MDCT-TCX變遷至AAC之示意代表圖;
第1C圖為由AAC變遷至MDCT-TCX之示意代表圖;
第1D圖為本發明之構想之較佳實施例呈流程圖之示例說明;
第2圖為用於示例說明發生於本發明之實施例之四個不同域及其關係之示意代表圖;
第3A圖為示例說明用於解碼音訊信號之本發明之裝置及方法之方案;
第3B圖為根據本發明之實施例之解碼方案之進一步示例說明;
第4A圖示例顯示頻疊變換諸如應用於兩種編碼模式之MDCT之細節;
第4B圖示例顯示可媲美第4A圖之視窗函數但具有一頻疊部及一非頻疊部之視窗函數;
第5圖為於一種編碼模式諸如AAC-MDCT編碼模式之編碼器及解碼器之示意代表圖;
第6圖為於AMR-WB+中TCX編碼內文中,應用MDCT於不同域諸如LPC域之編碼器及解碼器之代表圖;
第7圖為介於AAC與AMR-WB+間變換之視窗之特定順序;
第8A圖為由TCX模式切換至AAC模式之內文中,用於一編碼器及一解碼器之較佳實施例之代表圖;
第8B圖為用於示例說明由AAC變換至TCX之編碼器及解碼器之較佳實施例;
第9A圖為較佳混成切換編碼方案之方塊圖,本發明係應用於其中;
第9B圖為示例說明於第9A圖之控制器中執行之處理程序之流程圖;
第10A圖為於混成切換編碼方案中之解碼器之較佳實施例;
第10B圖為用於示例說明於第10A圖之變遷控制器中執行的程序之流程圖;
第11A圖示例顯示其中較佳應用本發明之編碼器之較佳實施例;及
第11B圖示例顯示其中較佳應用本發明之較佳解碼器。
10...音訊信號
11...視窗化器
12...處理器
13...變換器
14...處理裝置、額外處理階段

Claims (17)

  1. 一種用於編碼一音訊信號之裝置,包含:一視窗化器,其用於使用一分析視窗將該音訊信號之一第一區塊視窗化,該分析視窗具有一頻疊部(Lk ,Rk )及一額外部(Mk );一處理器,用於處理與該頻疊部相關聯之該音訊信號的一第一子區塊,其係經由在該第一子區塊視窗化後,將該第一子區塊變換至與該音訊信號所在之域不同的一不同之域,以獲得一已處理的第一子區塊;及用於處理與該額外部相關聯之該音訊信號的一第二子區塊,其係經由在視窗化該第二子區塊之前,將該第二子區塊變換至該不同之域,以獲得一已處理的第二子區塊;以及一變換器,用於使用相同區塊變換法則將該已處理的第一子區塊及該已處理的第二子區塊由該不同之域轉換至一額外域以獲得一已轉換的第一區塊,其中該裝置係組配來使用一資料壓縮演算法則進一步處理該已轉換之第一區塊。
  2. 如申請專利範圍第1項之裝置,其係組配來使用一第二分析視窗處理與該第一區塊重疊之該音訊信號的一第二區塊,該第二分析視窗具有與該第一分析視窗之該頻疊部相對應之一頻疊部。
  3. 如申請專利範圍第1或2項之裝置,其中該音訊信號所在之域為一時域,其中該不同之域為一LPC域,其中與該 音訊信號之第一區塊重疊的該音訊信號之第二區塊於其中編碼之一第三域為一頻域,以及其中該變換器組配來於其中變換之該額外域為一LPC頻域,及其中該處理器包含用於進行由該第一域變換至該第二域之一LPC濾波器,或其中該變換器包含用於將輸入資料變換至該輸入資料之一頻域的一以傅立葉為基礎的轉換演算法則,其諸如DCT、DST、FFT、或DFT。
  4. 如申請專利範圍第1項之裝置,其中該視窗化器包含用於將輸入值摺疊以獲得輸出值之一摺疊函數,輸出值數目係小於輸入值數目,其中該摺疊函數係使得時間頻疊係導入至該等輸出值中。
  5. 如申請專利範圍第1項之裝置,其中該視窗化器係操作來執行視窗化以獲得用於一隨後執行之摺疊函數之輸入值。
  6. 如申請專利範圍第1項之裝置,其中該裝置包含用於在一頻域中編碼該音訊信號之一第一編碼分支,及用於基於一不同頻域編碼該音訊信號之一第二編碼分支,其中該第二編碼分支具有用於在其它頻域中編碼該音訊信號之一第一子分支,及用於在其它域中編碼該音訊信號之一第二子分支,該裝置進一步包含一決策階段,用於判定一音訊資料區塊是否藉使用該第一編碼分支或該第二編碼分支之該第一子分支或該第二子分支所產生的資料而呈現於一輸出位元流中,及其中一控制器係組配用於控制該決策階段來於進 行由該第一編碼分支變遷至該第二編碼分支或由該第二編碼分支變遷至該第一編碼分支時判定有利於該第一子分支。
  7. 如申請專利範圍第1項之裝置,其中該額外部包含一非頻疊部(Mk )及一額外頻疊部或與該音訊信號之一鄰近區塊之一相對應頻疊部重疊之一頻疊部。
  8. 一種用於解碼具有一音訊資料已編碼第一區塊之一已編碼音訊信號的裝置,該已編碼區塊具有一頻疊部及一額外部,該裝置包含:一處理器,其用於處理該頻疊部(Lk ,Rk ),係經由在進行一合成視窗化之前將該頻疊部變換至一目標域,以獲得一已視窗化之頻疊部,以及用於在進行變換至該目標域之前,執行該額外部之一合成視窗化;及一時域頻疊抵消器,用來於該音訊資料已編碼第一區塊之頻疊部變換成該目標域之後,將該已視窗化頻疊部與一音訊資料已編碼第二區塊之已視窗化頻疊部組合以獲得與該第一區塊之頻疊部相對應之一已解碼音訊信號。
  9. 如申請專利範圍第8項之裝置,其中該處理器包含用於將該頻疊部由一第四域轉換至一第二域之一變換器,及其中該處理器進一步包含用於將呈現於該第二域中之頻疊部轉換至該第一域之一變換器,其中該變換器可操作來執行一基於區塊之頻率時間轉換演算法則。
  10. 如申請專利範圍第8或9項之裝置,其中該處理器係操作來執行一展開作業,該展開作業用於獲得具有大於輸入至該展開作業之數值數目的數值數目之輸出資料。
  11. 如申請專利範圍第8項之裝置,其中該處理器係操作來使用一合成視窗化函數,其係關係於當產生該已編碼音訊信號時所使用的一分析視窗函數。
  12. 如申請專利範圍第8項之裝置,其中該已編碼音訊信號包含一寫碼模式指示器,其指示該已編碼第一區塊及該已編碼第二區塊之一寫碼模式,其中該裝置進一步包含一變遷控制器,用於當該寫碼模式指示器指示由一第一寫碼模式改變成一不同的第二寫碼模式或反之亦然的一寫碼模式改變時控制該處理器,以及當介於二編碼區塊間之一寫碼模式改變未傳訊時,用於控制該處理器來執行一完整編碼區塊之相同作業。
  13. 如申請專利範圍第8項之裝置,其中一第一寫碼模式及一第二寫碼模式包含一熵解碼階段、一解量化階段、包含一展開作業之一頻率-時間轉換階段、及一合成視窗化階段,其中該時域頻疊抵消器包含用於將由該合成視窗化階段所得之已編碼區塊之相對應頻疊部相加的一加器法,該等相對應頻疊部係藉該音訊信號之一重疊處理而獲得,及其中於該第一寫碼模式中,該時域頻疊抵消器係組 配來將由該合成視窗化所得之各區塊部分相加以獲得於該目標域中之已解碼信號作為該加法之一輸出信號,及其中於該第二寫碼模式中,該加法之輸出信號係藉該處理器處理來執行將該加法之輸出信號變換至該目標域。
  14. 一種電腦可讀取儲存媒體,於其上儲存有一已編碼音訊信號,該已編碼音訊信號包含一音訊信號之一已編碼第一區塊及該音訊信號之一重疊的已編碼第二區塊,該音訊信號之已編碼第一區塊包含一頻疊部及一額外部,該頻疊部於視窗化該頻疊部之後已經由一第一域變換至一第二域,及該額外部於視窗化該第二子區塊之前已經由該第一域變換至該第二域,其中該第二子區塊已經使用相同區塊變換法則變換至一第四域,及其中藉將音訊樣本之一重疊區塊視窗化及藉將一已視窗化區塊變換至一第三域,已經產生該已編碼第二區塊,其中該已編碼第二區塊具有與音訊樣本之該已編碼第一區塊之頻疊部相對應之一頻疊部。
  15. 一種編碼一音訊信號之方法,該方法包含下列步驟:使用一分析視窗將該音訊信號之一第一區塊視窗化,該分析視窗具有一頻疊部及一額外部;處理與該頻疊部相關聯之該音訊信號之一第一子區塊,其經由在視窗化該第一子區塊之後,將該第一子區塊變換至與該音訊信號所在之域不同之一不同之 域,以獲得一已處理之第一子區塊;經由在視窗化一第二子區塊之前,將該第二子區塊變換至該不同之域,來處理與該額外部相關聯之該音訊信號之第二子區塊以獲得一已處理之第二子區塊;使用相同區塊變換法則,將該已處理的第一子區塊及該已處理的第二子區塊由該不同之域變換至一額外域以獲得一已變換的第一區塊;及使用一資料壓縮演算法則,進一步處理該已變換之第一區塊。
  16. 一種解碼一已編碼音訊信號的方法,該已編碼音訊信號具有音訊資料之一已編碼第一區塊,該已編碼區塊具有一頻疊部及一額外部,該方法包含下列步驟:於進行一合成視窗化之前,藉將該頻疊部變換至一目標域,來處理該頻疊部以獲得一已視窗化頻疊部;於進行變換至該目標域之前,合成視窗化該額外部;及於該音訊資料之已編碼第一區塊之頻疊部變換成該目標域之後,組合該已視窗化頻疊部與該音訊資料之一已編碼第二區塊之已視窗化頻疊部以獲得一時域頻疊抵消,而獲得與該第一區塊之頻疊部相對應之一已解碼音訊信號。
  17. 一種電腦程式產品,該電腦程式產品具有一程式碼,該程式碼用於當於電腦上執行時,執行如申請專利範圍第15項之編碼方法或如申請專利範圍第16項之解碼方法。
TW098121856A 2008-07-11 2009-06-29 用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法 TWI426503B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7985208P 2008-07-11 2008-07-11
PCT/EP2009/004374 WO2010003532A1 (en) 2008-07-11 2009-06-17 Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme

Publications (2)

Publication Number Publication Date
TW201011737A TW201011737A (en) 2010-03-16
TWI426503B true TWI426503B (zh) 2014-02-11

Family

ID=41058650

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098121856A TWI426503B (zh) 2008-07-11 2009-06-29 用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法

Country Status (19)

Country Link
US (1) US8862480B2 (zh)
EP (1) EP2301020B1 (zh)
JP (1) JP5551693B2 (zh)
KR (1) KR101250309B1 (zh)
CN (1) CN102089812B (zh)
AR (1) AR072479A1 (zh)
AU (1) AU2009267518B2 (zh)
BR (1) BRPI0910783B1 (zh)
CA (1) CA2730355C (zh)
CO (1) CO6341672A2 (zh)
ES (1) ES2401487T3 (zh)
HK (1) HK1155842A1 (zh)
MX (1) MX2011000373A (zh)
MY (1) MY152252A (zh)
PL (1) PL2301020T3 (zh)
RU (1) RU2492530C2 (zh)
TW (1) TWI426503B (zh)
WO (1) WO2010003532A1 (zh)
ZA (1) ZA201009259B (zh)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
PL2471061T3 (pl) 2009-10-08 2014-03-31 Fraunhofer Ges Forschung Działający w wielu trybach dekoder sygnału audio, działający w wielu trybach koder sygnału audio, sposoby i program komputerowy stosujące kształtowanie szumu oparte o kodowanie z wykorzystaniem predykcji liniowej
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
FR2956495B1 (fr) * 2010-02-18 2021-08-06 Snecma Procede de numerisation d'un signal analogique par un convertisseur analogique-numerique de frequence de shannon determinee
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US9275650B2 (en) 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
CA3093517C (en) * 2010-07-02 2021-08-24 Dolby International Ab Audio decoding with selective post filtering
ES2968927T3 (es) * 2010-07-08 2024-05-14 Fraunhofer Ges Forschung Decodificador que utiliza cancelación del efecto de solapamiento hacia delante
EP2619758B1 (en) 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
AR085895A1 (es) 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
AU2012217158B2 (en) * 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
ES2535609T3 (es) 2011-02-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio con estimación de ruido de fondo durante fases activas
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
EP2772914A4 (en) 2011-10-28 2015-07-15 Panasonic Corp DECODER FOR HYBRID SOUND SIGNALS, COORDINATORS FOR HYBRID SOUND SIGNALS, DECODING PROCEDURE FOR SOUND SIGNALS AND CODING SIGNALING PROCESSES
US9489962B2 (en) * 2012-05-11 2016-11-08 Panasonic Corporation Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9552818B2 (en) 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
KR102201713B1 (ko) 2012-07-19 2021-01-12 돌비 인터네셔널 에이비 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
CN103915100B (zh) * 2013-01-07 2019-02-15 中兴通讯股份有限公司 一种编码模式切换方法和装置、解码模式切换方法和装置
HUE032831T2 (en) 2013-01-08 2017-11-28 Dolby Int Ab Model-based prediction in a critically sampled filter block
MX348505B (es) 2013-02-20 2017-06-14 Fraunhofer Ges Forschung Aparato y método para generar una señal codificada o para decodificar una señal de audio codificada usando una porción multi superpuesta.
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
RU2712814C2 (ru) 2013-04-05 2020-01-31 Долби Лабораторис Лайсэнзин Корпорейшн Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
BR112016003029B1 (pt) * 2013-08-23 2023-04-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Aparelho e método para processamento de um sinal de áudio utilizando uma combinação em uma faixa de sobreposição
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
EP2980796A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2988300A1 (en) 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10475456B1 (en) * 2018-06-04 2019-11-12 Qualcomm Incorporated Smart coding mode switching in audio rate adaptation
US11699451B2 (en) 2018-07-02 2023-07-11 Dolby Laboratories Licensing Corporation Methods and devices for encoding and/or decoding immersive audio signals
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1278184A2 (en) * 2001-06-26 2003-01-22 Microsoft Corporation Method for coding speech and music signals
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
TW200623027A (en) * 2004-08-26 2006-07-01 Nokia Corp Processing of encoded signals
TWI271703B (en) * 2005-07-22 2007-01-21 Pixart Imaging Inc Audio encoder and method thereof
TW200816718A (en) * 2006-07-31 2008-04-01 Qualcomm Inc Systems and methods for modifying a window with a frame associated with an audio signal
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3943881B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US6449596B1 (en) 1996-02-08 2002-09-10 Matsushita Electric Industrial Co., Ltd. Wideband audio signal encoding apparatus that divides wide band audio data into a number of sub-bands of numbers of bits for quantization based on noise floor information
EP0932141B1 (en) * 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
DE60326491D1 (de) * 2002-11-21 2009-04-16 Nippon Telegraph & Telephone Verfahren zur digitalen signalverarbeitung, prozessor dafür, programm dafür und das programm enthaltendesaufzeichnungsmedium
KR101200776B1 (ko) 2003-04-17 2012-11-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 합성
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
US7418394B2 (en) 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
CN1862969B (zh) * 2005-05-11 2010-06-09 尼禄股份公司 自适应块长、常数变换音频解码方法
US7610195B2 (en) * 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
AU2009267531B2 (en) * 2008-07-11 2013-01-10 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for decoding an encoded audio signal
EP2311034B1 (en) * 2008-07-11 2015-11-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
JP5699141B2 (ja) * 2009-06-23 2015-04-08 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
US9275650B2 (en) * 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
ES2968927T3 (es) * 2010-07-08 2024-05-14 Fraunhofer Ges Forschung Decodificador que utiliza cancelación del efecto de solapamiento hacia delante
EP2619758B1 (en) * 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1278184A2 (en) * 2001-06-26 2003-01-22 Microsoft Corporation Method for coding speech and music signals
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
TW200623027A (en) * 2004-08-26 2006-07-01 Nokia Corp Processing of encoded signals
TWI271703B (en) * 2005-07-22 2007-01-21 Pixart Imaging Inc Audio encoder and method thereof
TW200705385A (en) * 2005-07-22 2007-02-01 Pixart Imaging Inc Audio encoder and method thereof
TW200816718A (en) * 2006-07-31 2008-04-01 Qualcomm Inc Systems and methods for modifying a window with a frame associated with an audio signal
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Also Published As

Publication number Publication date
US8862480B2 (en) 2014-10-14
MX2011000373A (es) 2011-03-15
EP2301020B1 (en) 2013-01-02
CA2730355C (en) 2016-03-22
AR072479A1 (es) 2010-09-01
AU2009267518B2 (en) 2012-08-16
ES2401487T3 (es) 2013-04-22
PL2301020T3 (pl) 2013-06-28
RU2492530C2 (ru) 2013-09-10
KR101250309B1 (ko) 2013-04-04
JP2011527446A (ja) 2011-10-27
BRPI0910783B1 (pt) 2024-02-27
RU2011102426A (ru) 2012-07-27
AU2009267518A1 (en) 2010-01-14
JP5551693B2 (ja) 2014-07-16
TW201011737A (en) 2010-03-16
ZA201009259B (en) 2011-09-28
CN102089812B (zh) 2013-03-20
CA2730355A1 (en) 2010-01-14
BRPI0910783A2 (pt) 2020-11-03
US20110173009A1 (en) 2011-07-14
EP2301020A1 (en) 2011-03-30
HK1155842A1 (en) 2012-05-25
MY152252A (en) 2014-09-15
KR20110040823A (ko) 2011-04-20
WO2010003532A1 (en) 2010-01-14
CO6341672A2 (es) 2011-11-21
CN102089812A (zh) 2011-06-08

Similar Documents

Publication Publication Date Title
TWI426503B (zh) 用以使用頻疊切換方案將音訊信號編碼/解碼的裝置與方法
TWI459379B (zh) 用以把音訊樣本編碼和解碼之音訊編碼器與解碼器
US10319384B2 (en) Low bitrate audio encoding/decoding scheme having cascaded switches
US8321210B2 (en) Audio encoding/decoding scheme having a switchable bypass
JP5551692B2 (ja) 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
JP2010512550A (ja) 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
AU2013200679B2 (en) Audio encoder and decoder for encoding and decoding audio samples
EP3002751A1 (en) Audio encoder and decoder for encoding and decoding audio samples