TWI492222B - 用以產生合成音訊信號及將音訊信號編碼之裝置與方法 - Google Patents

用以產生合成音訊信號及將音訊信號編碼之裝置與方法 Download PDF

Info

Publication number
TWI492222B
TWI492222B TW099109379A TW99109379A TWI492222B TW I492222 B TWI492222 B TW I492222B TW 099109379 A TW099109379 A TW 099109379A TW 99109379 A TW99109379 A TW 99109379A TW I492222 B TWI492222 B TW I492222B
Authority
TW
Taiwan
Prior art keywords
frequency
frequency band
patching
band
audio signal
Prior art date
Application number
TW099109379A
Other languages
English (en)
Other versions
TW201044378A (en
Inventor
Frederik Nagel
Markus Multrus
Jeremie Lecomte
Stefan Bayer
Guillaume Fuchs
Johannes Hilpert
Julien Robilliard
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201044378A publication Critical patent/TW201044378A/zh
Application granted granted Critical
Publication of TWI492222B publication Critical patent/TWI492222B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Description

用以產生合成音訊信號及將音訊信號編碼之裝置與方法
本發明係有關於音訊信號處理,及特別地,有關於用以產生一合成音訊信號之一裝置及一方法、用以編碼一音訊信號之一裝置及一方法及一編碼的音訊信號。
儲存及傳輸音訊信號經常受到嚴格的位元率限制。這些限制通常透過信號的一中間編碼來解決。過去,當僅一極低位元率可利用時,編碼器遭迫使急劇減少所傳輸的音訊頻寬。現代的音訊編解碼器藉由使用頻寬延伸方法能夠編碼寬頻信號,如在M. Dietz,L. Liljeryd,K. Kjrling and O. Kunz,“Spectral Band Replication,a novel approach in audio coding”in 112th AES Convention,Munich,May 2002;S. Meltzer,R. Bhm and F. Henn,“SBR enhanced audio codecs for digital broadcasting such as“Digital Radio Mondiale”(DRM),”in 112th AES Convention,Munich,May 2002;T. Ziegler,A. Ehret,P. Ekstrand and M. Lutzky,“Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,”in 112th AES Convention,Munich,May 2002;International Standard ISO/IEC 14496-3:2001/FPDAM 1,“Bandwidth Extension,”ISO/IEC,2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al. US Patent 5,455,888;E. Larsen,R. M. Aarts,and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention,Munich,Germany,May 2002;R.M. Aarts,E. Larsen,and O. Ouweltjes. A unified approach to low-and high frequency bandwidth extension. In AES 115th Convention,New York,USA,October 2003;K. Kyhk. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report,Helsinki University of Technology,Laboratory of Acoustics and Audio Signal Processing,2001;E. Larsen and R.M. Aarts. Audio Bandwidth Extension-Application to psychoacoustics,Signal Processing and Loudspeaker Design. John Wiley & Sons,Ltd,2004;E. Larsen,R.M. Aarts,and M. Danessis. Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention,Munich,Germany,May 2002;J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions of Audio and Electroacoustics,AU-21(3),June 1973;United States Patent Application 08/951,029,Ohmori,et al. Audio band width extending system and method;United States Patent 6895375,Malah,D & Cox,R.V.: System for bandwidth extension of Narrow-band speech,and Frederik Nagel,Sascha Disch,“A harmonic bandwidth extension method for audio codecs,”ICASSP International Conference on Acoustics,Speech and Signal Processing,IEEE CNF,Taipei,Taiwan,April 2009中所述。
這些演算法依靠對高頻內容(HF)的一參數表示。此表示是透過將解碼信號之低頻部分(LF)移調至HF頻譜區域(「修補」)並應用一推動後處理的參數而遭產生。
在習知技藝中,頻寬延伸方法,諸如頻帶複製(SBR)遭用作一在一基於HFR(高頻重建)的編解碼器中產生高頻信號之有效方法。
頻帶複製(SBR),如M Dietz,L. Liljeryd,K. Kjrling and O. Kunz,“Spectral Band Replication,a novel approach in audio coding” in 112th AES Convention,Munich,May 2002中所述,使用一正交鏡像濾波器組(QMF)來產生HF資訊。用所謂的「修補」,較低QMF頻帶信號遭複製至較高QMF頻帶中,造成LF部分資訊複製到HF部分中。產生的HF部分在調整頻譜包絡及音調之參數的幫助下之後適於原始HF部分。
如HE-AAC中遭標準化,SBR中包括透過簡單複製而修補之所有操作始終在QMF域中遭完成。然而,其它不同的修補方法可在不同域中遭完成,諸如FFT域或時域。人們可設想使SBR能夠可選替地選擇一在FFT域或時域中操作的修補演算法,並需要一額外的轉換來回饋QMF分析步驟。
在普通SBR中,僅可得一不計入硬體或軟體需求也不計入信號特性之修補演算法。因此,SBR不能夠適於修補演算法。人們可能設想在兩不同修補演算法之間簡單選擇。因為兩修補演算法運行於不同域中,過渡區域易於產生區塊假影,這使得在兩方法之間密集切換實際上不可能。
WO 98/57436揭露了用於頻帶複製中的移調方法,其與頻譜包絡調整組合。
WO 02/052545教示的是,信號可遭分類為脈衝串樣(pulse-train-like)或非脈衝串樣(non-pulse-train-like)且基於此分類一適應性切換移調器遭提出。該切換移調器並行執行兩修補演算法及混合單元依賴該分類(脈衝串或非脈衝串)來組合這兩修補信號。移調器之間的實際切換或混合響應於包絡及控制資料在一包絡調整濾波器阻中遭執行。再者,對於脈衝串樣信號,基礎信號遭轉換為一濾波器阻域中,一完成的頻率轉譯操作及對頻率轉譯結果的一包絡調整遭執行。這是一組合的修補/進一步處理程序。對於非脈衝樣信號,一頻域移調器(FD移調器)遭提供及頻域移調器的結果接著遭轉換到濾波器阻域中,其中包絡調整遭執行。因此,在一選替中具有一組合的修補/進一步處理方法、在另一選替中具有位於內部發生包絡調整之濾波器阻外的頻域移調器之此程序的實施及靈活性,在靈活性與實施的可能性方面是成問題的。
本發明之一目的是提供用以產生一賦予一改良的品質及允許一有效實施之合成音訊信號的一構想。
此目的透過申請專利範圍第1項所述之一用以產生一合成音訊信號之裝置、申請專利範圍第10項所述之一用以編碼一音訊信號之裝置、申請專利範圍第12項所述之用以產生的一方法、申請專利範圍第13項所述之用以編碼的一方法、申請專利範圍第14項所述之一編碼音訊信號或申請專利範圍第15項所述之一電腦程式來實現。
本發明是基於此基本思想:當執行複數不同頻譜域修補演算法之前一音訊信號之一時間部分被轉換為一頻譜表示時,剛才提到的改良品質及/或有效實施可被實現,其中每一修補演算法產生一修改的頻譜表示,該修改的頻譜表示包含自該音訊信號之一核心頻帶中對應於頻譜成分獲得之在一上頻帶中的頻譜成分,及依據一修補控制信號針對一第一時間部分自該複數修補演算法中選擇一第一頻域修補演算法,並針對一第二不同時間部分自該複數修補演算法中選擇一第二頻域修補演算法。以此方式,由於在不同域中兩修補演算法之間的一切換,一降低的品質及/或靈活性可被預防及進而在保持感知品質的同時處理可較不複雜。
依據本發明之一實施例,一種使用一修補控制信號來產生一合成音訊信號之裝置包含一第一轉換器、一頻域修補產生器、一高頻重建操控器及一組合器。該第一轉換器被組態以將一音訊信號之一時間部分轉換為一頻譜表示。該頻域修補產生器被組態以執行複數不同的頻域修補演算法,其中每一修補演算法產生一修改的頻譜表示,該修改的頻譜表示包含自該音訊信號之一核心頻帶中之相對應頻譜成分獲得之在一上頻帶中的頻譜成分。該頻域修補產生器進一步被組態成依據該修補控制信號針對一第一時間部分自該複數修補演算法中選擇一第一頻域修補演算法,及針對一第二不同時間部分自該複數修補演算法中選擇一第二頻域修補演算法,來獲得該修改的頻譜表示。該高頻重建操控器被組態以依據一頻譜帶複製參數操控該修改的頻譜表示或自該修改的頻譜表示獲得之一信號,來獲得一頻寬延伸信號。該組合器被組態以將在該核心頻帶中有頻譜成分的該音訊信號或是自該音訊信號獲得的一信號與該頻寬延伸信號相組合來獲得合成音訊信號。
依據本發明之另一實施例,一種用以編碼一音訊信號之裝置包含一核心編碼器、一參數擷取器及一參數計算器。該音訊信號包含一核心頻帶及一上頻帶。該核心編碼器被組態以編碼在該核心頻帶中的該音訊信號。該參數擷取器被組態以自該音訊信號擷取一修補控制信號,該修補控制信號指示複數不同頻域修補演算法中之一選定的修補演算法,該選定的修補演算法在一頻域中被執行以在一頻寬延伸解碼器中產生一合成音訊信號。該參數計算器被組態以由該上頻帶計算該頻帶複製參數。
依據另一實施例,一編碼的音訊信號資料流包含一在一核心頻帶中被編碼的編碼音訊信號及一修補控制信號,該修補控制信號指示複數不同頻域修補演算法中之一選定的修補演算法,該選定的修補演算法在該頻域中被執行以在一頻寬延伸解碼器中產生一合成音訊信號及一頻帶複製參數由該音訊信號之一上頻帶而被計算。
因此,本發明之實施例有關於一用以在頻域中的一修補演算法組中之至少兩不同頻域修補演算法之間切換之構想。該修補演算法組可包含一包括一基於一單相語音編碼器的諧波移調及非諧波複製SBR功能之第一修補演算法、一包含一基於一多相語音編碼器之諧波移調的第二修補演算法、一包含非諧波複製SBR功能之第三演算法及一包含一非線性失真之第四修補演算法。此外,頻寬延伸可被執行使得該頻寬延伸信號包含具有一至少四倍於核心頻帶中的交越頻率的最大頻率之上頻帶。
因此,藉由在頻域中該至少兩不同修補演算法之間切換,諸如在一頻寬延伸情形中能以相同感知品質取得一降低的複雜性。
本發明之進一步的實施例有關於一不包含一時間/頻率轉換器之裝置,該時間/頻率轉換器之裝置用以將自該修改的頻譜表示獲得之一時域信號轉換為該頻域。因此,實施例允許高頻重建操控器可在修改的頻譜表示上直接操作而不需要自該時域至該頻域的一進一步轉換(例如,一QMF分析),諸如在一組合修補/進一步處理方法在不同域中操作的情況中。
本發明之進一步的實施例有關於一參數擷取器,該參數擷取器被組態以自該複數不同頻域修補演算法中決定一選定的修補演算法。這裡,該選定的修補演算法是基於該音訊信號或一自該音訊信號獲得之信號與複數頻寬延伸信號之間的一比較,該複數頻寬延伸信號是藉由執行該頻域中的該複數修補演算法及操控該音訊信號之一時間部分之一修改的頻譜表示而被獲得。因此,實施例提供一種選擇該最佳修補演算法來在一頻寬延伸解碼器中產生一合成音訊信號之方法。
控制參數可被用於決定哪一修補是最合適的。為實現此目標,一綜合分析級可被使用;亦即,所有修補可被施加而依據一目標最好的被選擇。在本發明之較佳模式中,目標是得到恢復的最佳感知品質。在選替模式中,一目標函數必須被優化。例如,該目標可以是維持原始HF的頻譜平坦度盡可能近。
一方面,修補選擇藉由考慮原始信號、分析的信號或此兩者可僅在編碼器完成。決策(修補控制信號)接著被傳輸至解碼器。另一方面,僅考慮該同步信號的核心頻寬,選擇可在編碼器與解碼器端被同步執行。後一方法不需要產生額外的旁側資訊。
圖式簡單說明
下面,參考附圖來闡述本發明的實施例,其中:第1a圖繪示一使用一修補控制信號產生一合成音訊信號之裝置的一實施例的一方塊圖;第1b圖繪示第1a圖的一頻域修補產生器之一實施的一方塊圖;第2a圖繪示一用以產生一合成音訊信號之裝置之一進一步實施例的一方塊圖;第2b圖繪示一頻寬延伸方案之一示意說明;第3圖繪示一示範第一修補演算法之一示意說明;第4圖繪示一示範第二修補演算法之一示意說明;第5圖繪示一示範第三修補演算法之一示意說明;第6圖繪示一示範第四修補演算法之一示意說明;第7圖繪示第1a圖之沒有一時間/頻率轉換器置於該頻域修補產生器之後的一實施例的一方塊圖;第8圖繪示第1a圖之有一第二轉換器(時間/頻率轉換器)的一實施例的一方塊圖;第9圖繪示一用以編碼一音訊信號之裝置的一實施例的一方塊圖;第10圖繪示用以編碼一音訊信號之裝置的一進一步實施例的一方塊圖;第11圖繪示一頻域中之一修補方案的一實施例之一概觀。
第1a圖繪示一依據本發明之一實施例之使用一修補控制信號119來產生一合成音訊信號145之裝置100的一方塊圖。裝置100包含一第一轉換器110、一頻域修補產生器120、一高頻重建操控器130及一組合器140。第一轉換器110遭組態以將一音訊信號105的一時間部分轉換為一頻譜表示115。頻域修補產生器120遭組態以執行複數117-1不同的頻域修補演算法,其中每一修補演算法產生一修改的頻譜表示125,該修改的頻譜表示125包含自音訊信號105之一核心頻帶中的相對應頻譜成分獲得之一在上頻帶中的頻譜成分。如第1b圖所示,頻域產生器120可遭組態成依據修補控制信號119針對一第一時間部分107-1自複數117-1修補演算法中選擇一第一頻域修補演算法117-2,及針對一第二不同時間部分107-2自複數117-1修補演算法選擇一第二頻域修補演算法117-3來獲得修改的頻譜表示125。
高頻重建操控器130遭組態以依據一頻譜帶複製參數127來操控修改的頻譜表示125或自修改的頻譜表示125獲得的一信號來獲得一頻寬延伸信號135。自修改的頻譜表示125獲得的信號可以是例如一QMF域中的一信號,其在將一QMF分析施於一基於修改的頻譜表示125之修改的時域信號之後已遭獲得。組合器140遭組態以將在核心頻帶中有頻譜成分的音訊信號105或是自音訊信號105獲得的一信號與頻寬延伸信號135相組合來獲得合成音訊信號145。這裡,自音訊信號105獲得的信號可以是,例如一在解碼核心頻帶中之一編碼的音訊信號之後已遭獲得之解碼的低頻信號。
如第1a圖可見,裝置100之頻域修補產生器120遭實施成在一頻域中而非在一時域中操作。
第2a圖繪示一用以產生合成音訊信號145之裝置200之一進一步實施例的一方塊圖。這裡,第2a圖裝置200與第1a圖裝置100中的相同成分遭忽略且未遭再次繪示或描繪。在第2a圖所示的實施例中,裝置200之頻域修補產生器120遭組態以執行頻域中修補演算法組203中之至少兩不同的頻域修補演算法。修補演算法組203包含一包括一基於一單相語音編碼器之諧波移調及非諧波複製SBR功能之第一修補演算法205-1、一包含一基於一多相語音編碼器的諧波移調之第二修補演算法205-2、一包含非諧波複製SBR功能之第三修補演算法205-3及一包含一非線性失真之第四修補演算法205-4。
如第2b圖所示,裝置200可適於執行一頻寬延伸使得頻寬延伸信號135包含上頻帶220,該上頻帶220具有至少四倍於核心頻帶210中的交越頻率215之一最大頻率225。在SBR的脈絡中,遭定義為核心頻帶210的最高頻率之交越頻率215的典型值可以是,例如在小於4 kHz、5 kHz或6 kHz的一範圍中。因此,上頻帶220的最大頻率225可以是例如,約16 kHz、20 kHz或24 kHz。
第3圖繪示一示範第一修補演算法205-1的一示意說明。特別地,頻域修補產生器120遭組態以執行至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含第一修補演算法205-1。第一修補演算法205-1包含一基於一單相語音編碼器305之諧波移調,該單相語音編碼器305包含一為2的頻寬延伸因數(σ),控制自一自核心頻帶210擷取之源頻帶310至一第一目標頻帶310’的一轉換。這裡,源頻帶310中頻譜成分的相位乘以頻寬延伸因數(σ)使得第一目標頻帶310具有範圍為交越頻率(fx )到兩倍交越頻率(fx )之頻率。第一修補演算法205-1進一步包含非諧波複製SBR功能315,用以由一第一複製將第一目標頻帶310’中的頻譜成分轉換為一第二目標頻帶320’使得第二目標頻帶320具有範圍為兩倍交越頻率(fx )到三倍交越頻率(fx )之頻率,且用以由一第二複製將第二目標頻帶320’中的頻譜成分進一步轉換為一第三目標頻帶330’使得第三目標頻帶330具有遭包括在上頻帶220中範圍為三倍交越頻率(fx )到四倍交越頻率(fx )之頻率,上頻帶220包含第一310’、第二320’及第三330’目標頻帶。特別地,如第3圖所示,頻寬延伸信號135包含自核心頻帶210產生的上頻帶220,其中上頻帶220具有四倍於交越頻率(fx )的一最大頻率。
第4圖繪示一示範第二修補演算法205-2的一示意說明。這裡特別地,頻域修補產生器120遭組態以執行至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含第二修補演算法205-2。第二修補演算法205-2包含一基於一多相語音編碼器405之諧波移調,該多相語音編碼器405包含一為2的第一頻寬延伸因數(σ1 ),控制自一自核心頻帶210擷取之源頻帶410至一第一目標頻帶410’的一轉換。這裡,第一源頻帶410中頻譜成分的相位乘以第一頻寬延伸因數(σ1 )使得第一目標頻帶410’具有範圍為交越頻率(fx )到兩倍交越頻率(fx )之頻率。第二修補演算法205-2進一步包含一為3的第二頻寬延伸因數(σ2 ),控制自一自核心頻帶210擷取之一第二源頻帶420-1、420-2至一第二目標頻帶420’、420”的一轉換。這裡,第二源頻帶420-1、420-2中頻譜成分的相位乘以第二頻寬延伸因數(σ2 )使得第二目標頻帶420’、420”分別具有範圍為兩倍交越頻率(fx )到三倍交越頻率(fx )或範圍為交越頻率(fx )到三倍交越頻率(fx )之頻率。最後,第二修補演算法205-2進一步包含一為4的第三頻寬延伸因數(σ3 ),控制自一自核心頻帶210擷取之一第三源頻帶430-1、430-2至一第三目標頻帶430’、430”的一轉換。這裡,第三源頻帶430-1、430-2中頻譜成分的相位乘以第三頻寬延伸因數(σ3 )使得第三目標頻帶430’、430”分別具有遭包括在上頻帶220中範圍為三倍交越頻率(fx )到四倍交越頻率(fx )或範圍為交越頻率(fx )到四倍交越頻率(fx )之頻率。如第3圖所示之第一修補演算法205-1中,頻寬延伸信號135之上頻帶220包含第一410’、第二420’、420”及第三430’、430”目標頻帶,具有四倍於交越頻率(fx )的一最大頻率。
第5圖繪示一示範第三修補演算法205-3的一示意說明。在第5圖的實施例中,頻域修補產生器120遭組態以執行至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含第三修補演算法205-3。第三修補演算法205-3包含非諧波複製SBR功能505,用以由一第一複製將在一源頻帶510中為核心頻帶210之頻譜成分轉換為一目標頻帶510’使得第一目標頻帶510’具有範圍為交越頻率(fx )到兩倍交越頻率(fx )之頻率。第一目標頻帶510’中的頻譜成分遭一第二複製進一步轉換為一第二目標頻帶520’使得第二目標頻帶520’具有範圍為兩倍交越頻率(fx )到三倍交越頻率(fx )之頻率。最後,第二目標頻帶520’中的頻譜成分遭一第三複製進一步轉換為一第三目標頻帶530’使得第三目標頻帶530’具有遭包括在上頻帶220中範圍為三倍交越頻率(fx )到四倍交越頻率(fx )之頻率。此外,頻寬延伸信號135之上頻帶220包含第一510’、第二520’及第三530’目標頻帶,具有四倍於交越頻率(fx )的一最大頻率。
第6圖繪示一示範第四修補演算法205-4的一示意說明。在第6圖的實施例中,頻域修補產生器120遭組態以執行至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含第四修補演算法205-4。這裡,第四修補演算法205-4包含一非線性失真用以產生上頻帶220中具有範圍為交越頻率(fx )到四倍交越頻率(fx )的頻率之頻譜成分。
一般地,在如上所述第3-6圖之實施例中,頻域修補演算法205-1;205-2;205-4;205-4隨該頻域修補產生器120遭組態以將自核心頻帶210獲得之一初始頻帶310、310’、320’;410、420-1、420-2、430-1、430-2;510、510’、520’中的一頻譜成分或不遭包括於核心頻帶210中之一上頻帶轉換為上頻帶220中之一目標頻譜成分而遭執行,使得該目標頻譜成分針對每一頻域修補演算法是不同的。
特別地,頻域修補產生器120可包含一頻通濾波器以自核心頻帶210或上頻帶220來擷取初始頻帶,其中該頻通濾波器的一頻通特性可遭選擇使得該初始頻帶將遭轉換為第3-6圖所示之一相對應的頻帶310’、320’、330’;410’、420’、430’;510’、520’、530’。
不同的頻域修補演算法205-1、205-2、205-3、205-4可依據一需要的性能而遭執行,諸如第2b圖的頻寬延伸方案。
具體地,藉由分別使用例如第3圖或第4圖所示之一單或多相語音編碼器,頻率結構遭諧波地正確延伸至高頻域,因為基頻(例如,核心頻帶210)遭頻譜延伸偶數倍(例如,σ1 =2,σ2 =3,σ3 =4),及因為基頻中的頻譜成分遭與額外產生的頻譜成分相組合。
如果基頻已遭牢牢地限制於頻寬,例如,藉由僅使用一很低位元率,一基於相語音編碼器的修補演算法可以是有利的。因此,上頻成分的重建已在一相對低的頻率開始。在此情況中,典型地交越頻率不到約5 KHz(或甚至不到4 KHz)。在此區域,人類耳朵由於不正確定位的諧波對不諧和很敏感。這可導致給人「不自然」音調的印象。另外,頻譜緊密間隔的音調(具有約30 Hz至300 Hz的頻譜不諧和)遭感知為粗音調。基頻帶之頻率結構的諧波延續避免了這些不正確及欠佳聽覺印象。
此外,藉由使用例如第5圖所示之非諧波複製SBR功能,頻譜區域可朝子頻帶方向遭複製至一較高頻率區域或要遭複製頻率區域。此外,複製依賴於觀測,這適用於所有較高頻信號的頻譜性質在許多方面類似於基頻帶信號的性質之修補方法。彼此之間僅有極少變化。另外,人類耳朵通常在高頻(典型地始於約5 KHz)並不很敏感,特別是就一非精確頻譜映射而言。實際上,這大體上是頻帶複製的主要思想。特別地,複製包含實施簡單且快速的優點。此修補演算法對修補邊界也具有一高靈活性,因為對頻譜的複製可在任一子頻帶邊界遭執行。
最後,非線性失真的修補演算法(見第6圖)可包含藉由裁減、限制、平方等產生諧波。如果舉例而言,一展開信號遭頻譜很稀疏佔用(例如,在施以上述相位語音編碼器修補演算法之後),展開頻譜能可取捨地遭一失真信號相加補充以避免不想要的頻率孔。
要注意的是,除了修補演算法組203(見第2a圖)中上面提到的修補演算法之外,頻域中的其它修補演算法,諸如一頻譜鏡像,可遭執行。
在第7圖的實施例中,一可對應於第1a圖的裝置100之裝置700遭繪示為不包含一用以將自修改的頻譜表示125獲得之一時域信號轉換為頻域之時間/頻率轉換器。這就是說,在此情況中,高頻重建操控器130將接收修改的頻譜表示125而非自這一時間/頻率轉換器獲得之一頻域信號來作為其輸入。
所描述的組態可以是有利的,因為在此情況中,高頻重建操控器130所執行之對修改頻譜表示125的進一步處理在相同域(例如,FFT或QMF域)中可易於發生,因為頻域修補產生器120所執行的修補演算法在其中有效。因此,不同域之間的一進一步轉換,諸如自時域至頻域的一轉換將不需要,這樣就造成一較簡單實施。
在第8圖的實施例中,一裝置800遭繪示進一步包含一用以將修改的頻譜表示125轉換為時域之第二轉換器810。再者,對應於第1a圖裝置100的組件之第8圖裝置800之組件遭忽略。如第8圖繪示,第二轉換器810可適於施加一匹配於第一轉換器110所施加的一分析之合成。這裡,第一轉換器110遭組態成執行一具有一第一轉換長度111之轉換,而第二轉換器810遭組態成執行一具有一第二轉換長度之轉換。特別地,第二轉換長度可依靠一頻寬延伸特性,因為上頻帶220中最大頻率(fmax )與核心頻帶210中交越頻率(fx )之一比值及第一轉換長度111遭說明。
在本發明的實施例中,第一轉換器110例如可遭實施為執行一快速傅利葉轉換(FFT)、一短時間傅利葉轉換(STFT)、一離散傅利葉轉換(DFT)或一QMF分析,而第二轉換器810例如可遭實施為執行一快速傅利葉逆轉換(IFFT)、一短時間傅利葉逆轉換(ISTFT)、一離散傅利葉逆轉換(IDFT)或一QMF合成。
具體地,第二轉換長度可遭選定使得它將等於fmax /fx 比值乘以第一轉換長度111。以此方式,第二轉換器應用的第二轉換長度或頻率解析度將易適於第2b圖所示頻寬延伸方案之頻寬延伸特性。這是因為根據Nyquist原理頻寬延伸特性實質上受上面對應於一較高有效取樣率之fmax /fx 比來控制。
第9圖繪示一編碼一音訊信號105之裝置900之一實施例的一方塊圖。音訊信號105包含一核心頻帶210及一上頻帶220。特別地,用以編碼的裝置900包含一核心編碼器910、一參數擷取器920及一參數計算器930。核心編碼器910遭組態以編碼核心頻帶210中的音訊信號105來獲得核心頻帶210中之一編碼的音訊信號915。此外,參數擷取器920遭組態以自音訊信號105擷取一修補控制信號119,該修補控制信號119指示自複數117-1不同頻域修補演算法中之一選定的修補演算法。具體地,選定的修補演算法可在一頻域 中執行以在一頻寬延伸解碼器中產生合成音訊信號。最後,參數計算器930遭組態以由上頻帶220計算一SBR參數127。由上頻帶220計算的SBR參數127、指示選定的修補演算法之修補控制信號119及在核心頻帶210中遭編碼的編碼音訊信號915可構成一在一位元流中遭儲存或傳輸之編碼音訊信號935。
在第9圖的實施例中,參數擷取器920可遭組態以分析音訊信號105或一自音訊信號105獲得的信號來基於分析信號的一信號特性決定修補控制信號119。舉例而言,修補控制信號119可指示針對遭分析信號之特徵為‘語音’的一第一時間部分107-1之一第一修補演算法,及針對遭分析信號之特徵為‘靜音樂’的一第二時間部分107-2之一第二修補演算法。
因此,如果是一語音信號,一基於一語音源模型的處理或諸如在一LPC(線性預測編碼)內之一資訊產生模型可使用。在前一情況中,產生聲音的人類語音/聲音產生系統遭說明,在後一情況中,接收聲音的人類聽覺系統遭說明。
另外,一依信號而定的處理方案可藉由在一包含一暫態事件的時間部分之一諧波移調與一不包含一暫態事件的時間部分之一非諧波複製操作之間切換來遭實施。
上面對應於一開回路之程序是基於對音訊信號105或一自音訊信號105獲得之信號在其信號特性方面的一直接分析。
可選擇地,參數擷取器920也可在一對應於「綜合分析」實施之閉回路中操作。
在第10圖的實施例中,在這一綜合分析實施中一用以編碼一音訊信號105之裝置1000遭說明。具體地,用以編碼之裝置1000之參數擷取器920可遭組態成自複數117-1不同頻域修補演算法中決定選定的修補演算法。這裡,選定的修補演算法可以是基於音訊信號105或一自音訊信號105獲得之信號與複數1005頻寬延伸信號的一比較,該複數1005頻寬延伸信號是藉由在頻域中執行複數117-1修補演算法及操控音訊信號105之一時間部分之一修改的頻譜表示125而獲得。該比較可例如由一修補演算法選擇單元1010藉由計算複數1005頻寬延伸信號與音訊信號105(SFMref )的頻譜平坦度(SFM)參數(SFM1005 )、比較計算的SFM參數SFM1005 與SFMref 及自複數117-1修補演算法選擇一特定(最佳)修補演算法而遭完成,藉此比較的SFM參數之一偏差是最小的。最後,選定的最佳修補演算法可在參數擷取器920的輸出出現之修補控制信號119指示。
第11圖繪示一頻域中的一修補方案之一實施例的一概觀。特別地,一用以產生諸如在第2b圖的頻寬延伸方案中的一頻寬延伸信號之裝置1100遭描繪。在第11圖的實施例中,音訊信號105遭具有1024取樣的一訊框長度之PCM(脈衝編碼調變)資料1101表示,PCM資料1101可以是例如一解碼的低頻信號,該解碼的低頻信號包含一自編碼音訊信號935獲得之基頻帶,該編碼的音訊信號935已自用以編碼的一裝置傳輸,諸如編碼器900。接著,例如一降取樣器1110可用於以一因數2將PCM資料1101降取樣來獲得一降取樣的信號1115。該降取樣的信號1115被進一步提供給一分析視窗化器1120,該分析視窗化器1120由用「視窗」表示之一區塊來指示,「視窗」可遭組態成產生音訊取樣之複數重疊視窗化連續區塊。這裡,複數連續區塊中的每一區塊例如可包含512音訊取樣。另外,音訊取樣之兩連續區塊之間的一第一時間距離例如可遭調整為對應於如用「Inc=64」表示之64取樣。音訊取樣之連續區塊的重疊藉由自分析視窗化器1120施以的複數不同分析視窗函數中選擇一適當(最佳)分析視窗函數可另外遭控制。可對應於音訊取樣之複數連續區塊中的一連續區塊之音訊信號105的一時間部分1125遭進一步提供給第一轉換器110,該第一轉換器110可遭實施為例如一具有N=512的第一轉換長度111之FFT處理器1130。該FFT處理器1130可遭組態成將時間部分1125轉換為例如能以一極座標形式1135-1遭實施之頻譜表示115。特別地,此頻譜表示1135-1包含振幅資訊1135-2及相位資訊1135-3,其受一可對應於第2a圖的頻域修補產生器120之頻域修補產生器1141進一步處理。第11圖的頻域修補產生器1141可包含一用「相位語音編碼器加複製」表示、對應於第一修補演算法205-1之第一修補演算法1141-1、一用「相位語音編碼器」表示、對應於第二修補演算法205-2之第二修補演算法1143-1、一用「類似SBR函數」表示、對應於第三修補演算法205-3之第三修補演算法、一用「其它函數,諸如非線性失真」表示、對應於第2a圖所示修補演算法組203中之第四修補演算法205-4之第四修補演算法1147-1。
如前面在第2a圖脈絡中的相應描述,第一修補演算法1141-1包含一單一相位語音編碼器1141-2及非諧波複製功能1141-3、1141-4。此外,基於一多相語音編碼器操作之第二修補演算法1143-1包含一第一相位語音編碼器1143-2、一第二相位語音編碼器1143-3及一第三語音編碼器1143-4。此外,第三修補演算法1145-1包含執行一第一複製操作1145-2、一第二複製操作1145-3及一第三複製操作1145-4之非諧波複製SBR功能。最後,第四修補演算法1147-1包含一非線性失真功能。
特定地,在第11圖實施例中,修補演算法區塊1141-1、1143-1、1145-1、1147-1可對應於第2a圖的區塊205-1、205-2、204-3、205-4。另外,符號骨(xover頻帶)可對應於交越頻率(fx )。
再者,一修補選擇器1150可遭用來提供一對應於修補控制信號119之修補控制信號1155來控制頻域修補產生器1141使得修補演算法組1141-1、1143-1、1145-1、1147-1中之至少兩不同的頻域修補演算法將遭執行,造成對應於修改的頻譜表示125之一修改的頻譜表示1149。
修改的頻譜表示1149可(可取捨地)遭一隨後內插器1160處理來獲得一內插修改的頻譜表示1165。該內插修改的頻譜表示1165接著可遭提供至第二轉換器810,該第二轉換器810可遭實施為一具有N=2048的一第二轉換長度之iFFT處理器1170。這裡,如第8圖相應描述,N=2048之第二轉換長度遭調整為正好高於N=512之第一轉換長度的四倍。因此,如以不同頻域修補演算法執行之頻寬延伸方案的頻寬延伸特性可遭說明,這在前面已遭詳細闡述。
iFFT處理器1170可遭組態以將內插修改的頻譜表示1165轉換為一對應於第8圖修改的時域信號815之修改的時域信號1175。該修改的時域信號1175可接著遭提供至一合成視窗化器1180供將一合成視窗函數施於修改的時域信號1175來獲得一修改的視窗化時域信號1185。這裡,合成視窗函數遭匹配於分析視窗函數使得應用分析視窗函數的效果由應用合成視窗函數來補償。
因為由於頻寬延伸修改的視窗化時域信號1185較之原始取樣率(例如,8KHz)必須以一較高有效取樣率(例如,32KHz)來遭取樣,修改的視窗化時域信號1185可最後在一用「重疊與相加」表示之區塊1190中遭重疊相加,因為例如遭區塊1190應用、用「Inc=256」表示之256取樣的一第二時間距離,與例如遭分析視窗化器1120應用之64取樣的第一時間距離之比(例如比值為4)將等於較高有效取樣率與原始取樣率之比。以此方式,一輸出信號1195可遭獲得,其具有與原始(降取樣)信號1115相同的重疊特性。裝置1100提供的輸出信號1195可自第1a圖所示高頻重建操控器130開始進一步遭處理,以最終獲得一在頻寬上延伸的複製信號。
要注意的是,在第11圖的實施例中,所有不同的修補演算法都在同一域中遭實施,例如在頻域中。該域可以是QMF域(因為其以SBR來完成)或任一其它域,諸如傅利葉轉置的域。實際修補資料產生可以在一不同域中完成。在此情況中,整個修補然而,始終在同一域中遭完成。
此外,不同源模型可遭關聯於在選擇中遭考慮的修補。例如,如在語音頻寬延伸中使用的一語音源模型可針對語音信號而遭選擇,而一靜態源模型可針對靜音樂遭採用。以如前所述相同方式,暫態可有它們自己針對修補的模型。
再者,透過將時間-頻率移調的分析與合成視窗重疊,不同修補方案之間的平滑過渡遭保證。可選擇地,分析與合成的特殊視窗可遭使用以便使較少重疊成為可能。
總之,在第11圖的實施例中,修補方法可在對相鄰頻率段的一簡單複製操作、一基於相位語音編碼器的諧波移調方案、及一基於相位語音編碼器之包括複製相鄰頻率段的諧波移調方案當中遭選擇。
雖然本發明在其中區塊表示實際或邏輯硬體組件之方塊圖的脈絡中遭予以描述,但本發明也可由一電腦實施方法來實施。在電腦實施方法中,區塊表示相對應的方法步驟,其中這些步驟代表相對應邏輯或實體硬體區塊執行的功能。
所予以描述的實施例僅僅是說明本發明的原理。明白的是,對本文所予以描述的安排及細節之修改及改變對其他熟於此技者而言將是顯而易見的。因此,意圖是僅受後附的申請專利範圍之範圍限制,而不受以本文實施例之說明及解釋方式呈現之特性細節限制。
依靠發明方法之某些實施需求,發明方法可在硬體或軟體中遭實施。該實施可使用一數位儲存媒體而遭執行,特別是其上儲存有電子可讀取控制信號之一磁碟、一DVD或一CD,它們可與可程式化電腦系統合作使得發明方法可遭執行。大體上,因此本發明可遭實施為一電腦程式產品,其中一程式遭儲存於一機器可讀取載體上,當該電腦程式產品運行於一電腦上時該程式碼可遭操作執行發明方法。換言之,發明方法因而是一具有一程式碼的電腦程式,當該電腦程式運行於一電腦上時該程式碼執行發明方法當中之至少一方法。發明編碼音訊信號可遭儲存於任一機器可讀取儲存媒體上,諸如一數位儲存媒體。
本發明之實施例容許頻寬延伸計入修補過程的聲音、硬體、及信號特性。對最適合修補的決策可在一開環或一閉環中完成。因此,恢復品質可遭控制及增強。
所呈現的構想也有不同修補演算法之間的一平滑過渡可易於達到、基於信號允許對頻寬延伸的一快速且準確的適應之優點。
大部分突出的應用是音訊解碼器,其經常在手持裝置上遭實施及因而靠一電池供電操作。
100、200、700、800、1000、1100...裝置
105...音訊信號
107-1...第一時間部分
107-2...第二時間部分
110...第一轉換器
111...第一轉換長度
115...頻譜表示
117-1...複數修補演算法
117-2...第一頻域修補演算法
117-3...第二頻域修補演算法
119...修補控制信號
120...頻域修補產生器
125...修改的頻譜表示
127...頻帶複製參數
130...高頻重建操控器
135...頻寬延伸信號
140...組合器
145...合成音訊信號
203...修補演算法組
205-1...第一修補演算法
205-2...第二修補演算法
205-3...第三修補演算法
205-4...第四修補演算法
210...核心頻帶
215...交越頻帶
220...上頻帶
225...最大頻率
305...單相語音編碼器
310、510...源頻帶
310’、410’、510’...第一目標頻帶
315、505...非諧波複製頻帶複製功能
320’、420’、420”、520’...第二目標頻帶
330’、430’、430”、530’...第三目標頻帶
405...多相語音編碼器
410...第一源頻帶
420-1、420-2...第二源頻帶
430-1、430-2...第三源頻帶
810...第二轉換器
815...修改的時域信號
910...核心編碼器
915、935...編碼的音訊信號
920...參數擷取器
930...參數計算器
1005...複數頻寬延伸信號
1010...修補演算法選擇單元
1101...脈衝編碼調變資料
1110...降取樣器
1115...降取樣信號
1120...分析視窗化器
1125...時間部分
1130...快速傅利葉轉換處理器
1135-1...頻譜表示
1135-2...振幅資訊
1135-3...相位資訊
1141...頻域修補產生器
1141-1...第一修補演算法
1141-2...單相語音編碼器
1141-3、1141-4...非諧波複製頻帶複製功能
1143-1...第二修補演算法
1143-2...第一相位語音編碼器
1143-3...第二相位語音編碼器
1143-4...第三語音編碼器
1145-1...第三修補演算法
1145-2...第一複製操作
1145-3...第二複製操作
1145-4...第三複製操作
1147-1...第四修補演算法
1149...修改的頻譜表示
1150...修補選擇器
1155...修補控制信號
1160...內插器
1165...內插修改的頻譜表示
1170...快速傅利葉逆轉換處理器
1175...修改的時域信號
1180...合成視窗
1185...修改視窗化時域信號
1190...區塊
1195...輸出信號
第1a圖繪示一使用一修補控制信號產生一合成音訊信號之裝置的一實施例的一方塊圖;
第1b圖繪示第1a圖的一頻域修補產生器之一實施的一方塊圖;
第2a圖繪示一用以產生一合成音訊信號之裝置之一進一步實施例的一方塊圖;
第2b圖繪示一頻寬延伸方案之一示意說明;
第3圖繪示一示範第一修補演算法之一示意說明;
第4圖繪示一示範第二修補演算法之一示意說明;
第5圖繪示一示範第三修補演算法之一示意說明;
第6圖繪示一示範第四修補演算法之一示意說明;
第7圖繪示第1a圖之沒有一時間/頻率轉換器置於該頻域修補產生器之後的一實施例的一方塊圖;
第8圖繪示第1a圖之有一第二轉換器(時間/頻率轉換器)的一實施例的一方塊圖;
第9圖繪示一用以編碼一音訊信號之裝置的一實施例的一方塊圖;
第10圖繪示用以編碼一音訊信號之裝置的一進一步實施例的一方塊圖;
第11圖繪示一頻域中之一修補方案的一實施例之一概觀。
100‧‧‧裝置
105‧‧‧音訊信號
110‧‧‧第一轉換器
115‧‧‧頻譜表示
117-1‧‧‧複數修補演算法
119‧‧‧修補控制信號
120‧‧‧頻域修補產生器
125‧‧‧修改的頻譜表示
127‧‧‧頻帶複製參數
130‧‧‧高頻重建操控器
135‧‧‧頻寬延伸信號
140‧‧‧組合器
145‧‧‧合成音訊信號

Claims (14)

  1. 一種使用一修補控制信號來產生一合成音訊信號之裝置,該裝置包含:一第一轉換器,其用以將一音訊信號之一時間部分轉換為一頻譜表示;一頻域修補產生器,其用以執行複數不同的頻域修補演算法,其中每一修補演算法產生一修改的頻譜表示,該修改的頻譜表示包含自該音訊信號之一核心頻帶中之相對應頻譜成分獲得之在一上頻帶中的頻譜成分,及其中該頻域修補產生器遭組態成依據該修補控制信號,針對一第一時間部分自該複數修補演算法中選擇一第一頻域修補演算法,及針對一第二不同時間部分自該複數修補演算法中選擇一第二頻域修補演算法,來獲得該修改的頻譜表示;一高頻重建操控器,其用以依據一頻譜帶複製參數操控該修改的頻譜表示或自該修改的頻譜表示獲得之一信號來獲得一頻寬延伸信號,及一組合器,其用以將在該核心頻帶中有頻譜成分的該音訊信號或是自該音訊信號獲得的一信號與該頻寬延伸信號相組合來獲得該合成音訊信號。
  2. 如申請專利範圍第1項所述之裝置,其中該頻域修補產生器遭實施成在一頻域而非一時域中操作。
  3. 如申請專利範圍第1項所述之裝置,其中該頻域修補產生器遭組態以執行頻域中一修補演算法組中之至少兩 不同的頻域修補演算法,該修補演算法組包含一包括一基於一單相語音編碼器之諧波移調及非諧波複製頻帶複製功能之第一修補演算法、一包含一基於多相語音編碼器之諧波移調之第二修補演算法、一包含非諧波複製頻帶複製功能之第三修補演算法及一包含一非線性失真之第四修補演算法,該裝置適於執行一頻寬延伸使得該頻寬延伸信號包含具有一至少四倍於該核心頻帶中的該交越頻率之最大頻率的上頻帶。
  4. 如申請專利範圍第3項所述之裝置,其中頻域修補產生器遭組態以執行該至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含該第一修補演算法,該第一修補演算法包含一基於一單相語音編碼器之諧波移調,該單相語音編碼器包含一為二的頻寬延伸因數(σ),控制自一自該核心頻帶擷取之源頻帶至一第一目標頻帶的一轉換,其中該源頻帶中之該頻譜成分的相位乘以該頻寬延伸因數(σ)使得該第一目標頻帶具有範圍為該交越頻率(fx )到兩倍該交越頻率(fx )之頻率,該第一修補演算法進一步包含非諧波複製頻帶複製功能用以由一第一複製將該第一目標頻帶中的頻譜成分轉換為一第二目標頻帶,使得該第二目標頻帶具有範圍為兩倍該交越頻率(fx )到三倍該交越頻率(fx )之頻率,及用以由一第二複製將該第二目標頻帶中的頻譜成分進一步轉換為一第三目標頻帶,使得該第三目標頻帶具有遭包括於該上頻帶中範圍為三倍該交越頻率(fx )到四倍 該交越頻率(fx )之頻率,該上頻帶包含該第一、第二及第三目標頻帶。
  5. 如申請專利範圍第3項所述之裝置,其中該頻域修補產生器遭組態以執行該至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含該第二修補演算法,該第二修補演算法包含一基於一多相語音編碼器之諧波移調,該多相語音編碼器包含一為二的第一頻寬延伸因數(σ1 ),控制自一自該核心頻帶擷取之第一源頻帶至一第一目標頻帶的一轉換,其中該第一源頻帶中該等頻譜成分的相位乘以該第一頻寬延伸因數(σ1 )使得該第一目標頻帶具有範圍為該交越頻率(fx )到兩倍該交越頻率(fx )之頻率,該第二修補演算法進一步包含一為三的第二頻寬延伸因數(σ2 ),控制自一自該核心頻帶擷取之一第二源頻帶至一第二目標頻帶的一轉換,其中該第二源頻帶中該等頻譜成分的相位乘以該第二頻寬延伸因數(σ2 )使得該第二目標頻帶具有範圍為兩倍該交越頻率(fx )到三倍該交越頻率(fx )或範圍為該交越頻率(fx )到三倍該交越頻率(fx )之頻率,該第二修補演算法進一步包含一為四的第三頻寬延伸因數(σ3 ),控制自一自該核心頻帶擷取之一第三源頻帶至一第三目標頻帶的一轉換,其中該第三源頻帶中該等頻譜成分的相位乘以該第三頻寬延伸因數(σ3 ),使得該第三目標頻帶具有包括在該上頻帶中範圍為三倍該交越頻率(fx )到四倍該交越頻率(fx )或範圍為該交越頻率(fx )到該四倍交越頻率(fx ) 之頻率,該上頻帶包含第一、第二、及第三目標頻帶。
  6. 如申請專利範圍第3項所述之裝置,其中該頻域修補產生器遭組態以執行該至少兩不同的頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含該第三修補演算法,該第三修補演算法包含非諧波複製頻帶複製功能,用以由一第一複製將在一源頻帶中為核心頻帶之頻譜成分轉換為一第一目標頻帶,使得該第一目標頻帶具有範圍為該交越頻率(fx )到兩倍該交越頻率(fx )之頻率,用以由一第二複製將該第一目標頻帶中的頻譜成分進一步轉換為一第二目標頻帶,使得該第二目標頻帶具有範圍為兩倍該交越頻率(fx )到三倍該交越頻率(fx )之頻率,及用以由一第三複製將該第二目標頻帶中的頻譜成分進一步轉換為一第三目標頻帶,使得該第三目標頻帶具有包括在該上頻帶中範圍為三倍該交越頻率(fx )到四倍該交越頻率(fx )之頻率,該上頻帶包含第一、第二及第三目標頻帶。
  7. 如申請專利範圍第3項所述之裝置,其中該頻域修補產生器遭組態以執行該至少兩不同頻域修補演算法中之一選定的修補演算法,該選定的修補演算法包含該第四修補演算法,該第四修補演算法包含一非線性失真以產生在該上頻帶中具有範圍為該交越頻率(fx )到四倍該交越頻率(fx )之頻譜成分。
  8. 如申請專利範圍第1項之裝置,該裝置進一步包含一用以將該修改的頻譜表示轉換為該時域之第二轉換器,其 中該第二轉換器適於施加一匹配於該第一轉換器所施加的一分析之合成,其中該第一轉換器遭組態成執行一具有一第一轉換長度之轉換,及其中該第二轉換器遭組態成執行一具有一第二轉換長度之轉換,該第二轉換長度根據一頻寬延伸特性,此特性是由在該上頻帶中的該最大頻率(fmax )與該核心頻帶中的該交越頻率(fx )之一比值與該第一轉換長度所主導。
  9. 一種用以編碼一音訊信號之裝置,該音訊信號包含一核心頻帶及一上頻帶,該裝置包含:一核心編碼器,其用以編碼該核心頻帶中的該音訊信號,一參數擷取器,其用以自該音訊信號來決定一修補控制信號,該修補控制信號指示複數不同頻域修補演算法中之一選定的修補演算法,該選定的修補演算法在一頻域中遭執行以在一頻寬延伸解碼器中產生一合成音訊信號;及一參數計算器,其用以由該上頻帶計算一頻帶複製參數。
  10. 如申請專利範圍第9項所述之編碼裝置,其中該參數擷取器遭組態以自該複數不同頻域修補演算法中決定該選定的修補演算法,該選定的修演算法是基於該音訊信號或自該音訊信號獲得之一信號與複數頻寬延伸信號之間的一比較,該複數頻寬延伸信號是藉由在該頻域中執行該複數修補演算法及操控該音訊信號之一時間部 分之一修改的頻譜表示而遭獲得。
  11. 一種使用一修補控制信號產生一合成音訊信號之方法,該方法包含:將一音訊信號之一時間部分轉換為一頻譜表示;執行複數不同頻域修補演算法,其中每一修補演算法產生一修改的頻譜表示,該修改的頻譜表示包含自該音訊信號之一核心頻帶中相對應的頻譜成分獲得之一上頻帶中的頻譜成分,及依據該修補控制信號針對一第一時間部分自該複數修補演算法中選擇一第一頻域修補演算法,及針對不同之一第二時間部分自該複數修補演算法中選擇一第二頻域修補演算法,來獲得該修改的頻譜表示;依據一頻帶複製參數操控該修改的頻譜表示或一自該修改的頻譜表示而獲得之信號,來獲得一頻寬延伸信號;及將在該核心頻帶中具有頻譜成分之該音訊信號或一自該音訊信號遭獲得之信號,與該頻寬延伸信號相組合來獲得該合成音訊信號。
  12. 一種用以編碼一音訊信號之方法,該音訊信號包含一核心頻帶及一上頻帶,該方法包含:編碼該核心頻帶內的該音訊信號;自該音訊信號決定一修補控制信號,該修補控制信號指示複數不同頻域修補演算法中之一選定的修補演算法,該選定的修補演算法在一頻域中遭執行以在一頻 寬延伸解碼器中產生一合成音訊信號;及由該上頻帶計算一頻帶複製參數。
  13. 一種其上儲存有編碼的音訊信號之電腦可讀式媒體,其包含:一在一核心頻帶中遭編碼之編碼的音訊信號;一修補控制信號,該修補控制信號指示複數不同頻域修補演算法中之一選定的修補演算法,該選定的修補演算法在一頻域中遭執行以在一頻寬延伸解碼器中產生一合成音訊信號;及一由該音訊信號的一上頻帶而遭計算之頻帶複數參數。
  14. 一種電腦程式,具有當該電腦程式在一電腦上遭執行時用以執行如申請專利範圍第11或12項所述之方法的程式碼。
TW099109379A 2009-04-09 2010-03-29 用以產生合成音訊信號及將音訊信號編碼之裝置與方法 TWI492222B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16806809P 2009-04-09 2009-04-09
EP09181008A EP2239732A1 (en) 2009-04-09 2009-12-30 Apparatus and method for generating a synthesis audio signal and for encoding an audio signal

Publications (2)

Publication Number Publication Date
TW201044378A TW201044378A (en) 2010-12-16
TWI492222B true TWI492222B (zh) 2015-07-11

Family

ID=42123165

Family Applications (2)

Application Number Title Priority Date Filing Date
TW099109379A TWI492222B (zh) 2009-04-09 2010-03-29 用以產生合成音訊信號及將音訊信號編碼之裝置與方法
TW099110102A TWI416507B (zh) 2009-04-02 2010-04-01 用以基於輸入信號表示型態產生擴充頻寬信號之表示型態的裝置及方法和與其相關之音訊解碼器及電腦程式

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW099110102A TWI416507B (zh) 2009-04-02 2010-04-01 用以基於輸入信號表示型態產生擴充頻寬信號之表示型態的裝置及方法和與其相關之音訊解碼器及電腦程式

Country Status (21)

Country Link
US (2) US9697838B2 (zh)
EP (3) EP2239732A1 (zh)
JP (2) JP5227459B2 (zh)
KR (2) KR101207120B1 (zh)
CN (2) CN102177545B (zh)
AR (3) AR076199A1 (zh)
AT (1) ATE534119T1 (zh)
AU (2) AU2010233858B9 (zh)
BR (6) BR122021012137A2 (zh)
CA (2) CA2721629C (zh)
CO (1) CO6311123A2 (zh)
EG (1) EG26400A (zh)
ES (2) ES2396686T3 (zh)
HK (1) HK1159842A1 (zh)
MX (2) MX2010012343A (zh)
MY (2) MY153798A (zh)
PL (2) PL2351025T3 (zh)
RU (1) RU2501097C2 (zh)
SG (1) SG174113A1 (zh)
TW (2) TWI492222B (zh)
WO (2) WO2010112587A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2452044C1 (ru) * 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
BR112012017651B1 (pt) 2010-01-19 2021-01-26 Dolby International Ab método e sistema para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
AU2015203065B2 (en) * 2010-01-19 2017-05-11 Dolby International Ab Improved subband block based harmonic transposition
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102947882B (zh) * 2010-04-16 2015-06-17 弗劳恩霍夫应用研究促进协会 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法
WO2011155170A1 (ja) * 2010-06-09 2011-12-15 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
KR101709095B1 (ko) 2010-07-19 2017-03-08 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
HUE062540T2 (hu) * 2011-02-18 2023-11-28 Ntt Docomo Inc Beszédkódoló és beszédkódolási eljárás
DE102011106034A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und Vorrichtung zur Spektralbandreplikation und Verfahren und System zur Audiodecodierung
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP6001657B2 (ja) * 2011-06-30 2016-10-05 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張信号生成装置及びその方法
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
JP6155274B2 (ja) * 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
ES2568640T3 (es) 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
EP2682941A1 (de) 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
PL3054446T3 (pl) 2013-01-29 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
CA3013744C (en) * 2013-01-29 2020-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information
CN110265047B (zh) 2013-04-05 2021-05-18 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
TR201802303T4 (tr) * 2013-10-31 2018-03-21 Fraunhofer Ges Forschung Frekans alanında zamansal ön şekillendirilmiş gürültü eklenmesiyle ses bant genişliği uzatma.
EP2881943A1 (en) 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP2963645A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
KR102306537B1 (ko) 2014-12-04 2021-09-29 삼성전자주식회사 소리 신호를 처리하는 방법 및 디바이스.
WO2016149085A2 (en) * 2015-03-13 2016-09-22 Psyx Research, Inc. System and method for dynamic recovery of audio data and compressed audio enhancement
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
CN109036457B (zh) 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
TWI742486B (zh) * 2019-12-16 2021-10-11 宏正自動科技股份有限公司 輔助歌唱系統、輔助歌唱方法及其非暫態電腦可讀取記錄媒體
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
WO2002052545A1 (en) * 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
WO2003107329A1 (en) * 2002-06-01 2003-12-24 Dolby Laboratories Licensing Corporation Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2002082685A (ja) 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び音声帯域拡張方法
US20020128839A1 (en) 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
DE60230856D1 (de) 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
EP1444688B1 (en) 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
AU2002352182A1 (en) * 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US20040138876A1 (en) 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
EP1798724B1 (en) 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
JP2006243041A (ja) 2005-02-28 2006-09-14 Yutaka Yamamoto 高域補間装置及び再生装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP1970900A1 (en) 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
CN101276587B (zh) * 2007-03-27 2012-02-01 北京天籁传音数字技术有限公司 声音编码装置及其方法和声音解码装置及其方法
CN101809657B (zh) * 2007-08-27 2012-05-30 爱立信电话股份有限公司 用于噪声填充的方法和设备
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
JP5098569B2 (ja) 2007-10-25 2012-12-12 ヤマハ株式会社 帯域拡張再生装置
EP2220646A1 (en) 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
US9082397B2 (en) 2007-11-06 2015-07-14 Nokia Technologies Oy Encoder
CA2708861C (en) 2007-12-18 2016-06-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
AU2009267525B2 (en) 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
EP2224433B1 (en) 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CA3231911A1 (en) 2009-01-16 2010-07-22 Dolby International Ab Cross product enhanced harmonic transposition
DK2211339T3 (en) 2009-01-23 2017-08-28 Oticon As listening System
EP2481048B1 (en) 2009-09-25 2017-10-25 Nokia Technologies Oy Audio coding
AU2010332925B2 (en) * 2009-12-16 2013-07-11 Dolby International Ab SBR bitstream parameter downmix

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
WO2002052545A1 (en) * 2000-12-22 2002-07-04 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
WO2003107329A1 (en) * 2002-06-01 2003-12-24 Dolby Laboratories Licensing Corporation Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components

Also Published As

Publication number Publication date
ES2396686T3 (es) 2013-02-25
KR101248321B1 (ko) 2013-03-27
WO2010115845A1 (en) 2010-10-14
BR122021012115A2 (pt) 2023-01-03
BR122021012125A2 (pt) 2023-01-03
KR20110081292A (ko) 2011-07-13
BR122021012145A2 (pt) 2023-01-03
AR097531A2 (es) 2016-03-23
HK1159842A1 (en) 2012-08-03
JP5227459B2 (ja) 2013-07-03
CN102177545A (zh) 2011-09-07
JP5165106B2 (ja) 2013-03-21
EP2239732A1 (en) 2010-10-13
EP2351025B1 (en) 2012-11-14
EP2269189A1 (en) 2011-01-05
EP2351025A1 (en) 2011-08-03
MX2010012343A (es) 2011-02-23
MY153798A (en) 2015-03-31
MX2011002419A (es) 2011-04-05
US20130090934A1 (en) 2013-04-11
AR076237A1 (es) 2011-05-26
TW201044378A (en) 2010-12-16
CN102177545B (zh) 2013-03-27
CA2721629A1 (en) 2010-10-07
CA2734973A1 (en) 2010-10-14
US9697838B2 (en) 2017-07-04
CN102027537A (zh) 2011-04-20
CA2721629C (en) 2015-10-13
JP2011520146A (ja) 2011-07-14
KR20110005865A (ko) 2011-01-19
AU2010230129B2 (en) 2011-09-29
US9076433B2 (en) 2015-07-07
AU2010233858A1 (en) 2010-10-14
BRPI1003636B1 (pt) 2020-11-24
TW201044379A (en) 2010-12-16
AR076199A1 (es) 2011-05-26
US20120010880A1 (en) 2012-01-12
ES2377551T3 (es) 2012-03-28
SG174113A1 (en) 2011-10-28
RU2501097C2 (ru) 2013-12-10
BRPI1003636A2 (pt) 2019-07-02
CN102027537B (zh) 2012-10-03
PL2269189T3 (pl) 2012-04-30
RU2011109670A (ru) 2012-09-27
BRPI1001239A2 (pt) 2022-11-22
KR101207120B1 (ko) 2012-12-03
AU2010233858B9 (en) 2013-05-30
BR122021012137A2 (pt) 2023-01-03
EG26400A (en) 2013-10-09
TWI416507B (zh) 2013-11-21
WO2010112587A1 (en) 2010-10-07
CA2734973C (en) 2016-10-18
AU2010233858B2 (en) 2013-05-16
MY151346A (en) 2014-05-15
EP2269189B1 (en) 2011-11-16
BR122021012290A2 (pt) 2023-01-03
ATE534119T1 (de) 2011-12-15
JP2012504781A (ja) 2012-02-23
PL2351025T3 (pl) 2013-04-30
CO6311123A2 (es) 2011-08-22
AU2010230129A1 (en) 2010-10-07

Similar Documents

Publication Publication Date Title
TWI492222B (zh) 用以產生合成音訊信號及將音訊信號編碼之裝置與方法
US8386268B2 (en) Apparatus and method for generating a synthesis audio signal using a patching control signal
JP5244971B2 (ja) オーディオ信号合成器及びオーディオ信号符号器
AU2010268160B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
US10909994B2 (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
AU2013207549B2 (en) Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
AU2014201331A1 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder