TWI421859B - 用以操控音訊信號之裝置與方法 - Google Patents

用以操控音訊信號之裝置與方法 Download PDF

Info

Publication number
TWI421859B
TWI421859B TW099108888A TW99108888A TWI421859B TW I421859 B TWI421859 B TW I421859B TW 099108888 A TW099108888 A TW 099108888A TW 99108888 A TW99108888 A TW 99108888A TW I421859 B TWI421859 B TW I421859B
Authority
TW
Taiwan
Prior art keywords
block
padding
audio
sample
audio signal
Prior art date
Application number
TW099108888A
Other languages
English (en)
Other versions
TW201040943A (en
Inventor
Sascha Disch
Frederik Nagel
Max Neuendorf
Christian Helmrich
Dominik Zorn
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201040943A publication Critical patent/TW201040943A/zh
Application granted granted Critical
Publication of TWI421859B publication Critical patent/TWI421859B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used

Description

用以操控音訊信號之裝置與方法 描述
本發明係有關於諸如在一頻寬擴展(BWE)方案內,透過調整一音訊信號之頻譜值之相位而操控該音訊信號之一方案。
音訊信號之儲存或發送經常遭受嚴格的碼率約束。以往,當只有很低的碼率可用時,編碼器被迫大幅度地降低該發送音訊之頻寬。現代音訊編解碼器目前能夠透過利用頻寬擴展方法來編碼寬頻信號,如以下中所描述:2002年5月慕尼黑第112次AES會議中M.Dietz、L.Liljeryd、K.Kjrling及O.Kunz提出的“Spectral Band Replication,a novel approach in audio coding”;2002年5月慕尼黑第112次AES會議中S.Meltzer、R.Bhm及F.Henn提出的“SBR enhanced audio codecs for digital broadcasting such as“Digital Radio Mondiale”(DRM)”;2002年5月慕尼黑第112次AES會議中T.Ziegler、A.Ehret、P.Ekstrand及M.Lutzky提出的“Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm”;國際標準ISO/IEC 14496-3:2001/填補FPDAM 1,“Bandwidth Extension”,ISO/IEC,2002年;Vasu Iyengar等人提出之“Speech bandwidth extension method and apparatus”;2002年5月德國慕尼黑AES第112次會議中E.Larsen、R.M.Aarts及M.Danessis提出之”Efficient high-frequency bandwidth extension of music and speech”;2003年10月美國紐約AES第115次會議中R.M.Aarts、E.Larsen及O.Ouweltjes提出之“A unified approach to low- and high frequency bandwidth extension”;2001年赫爾辛基科技大學聲學及音訊信號處理試驗室,K.Kyhk之研究報告“A Robust Wideband Enhancement for Narrowband Speech Signal”;2004年John Wiley & Sons有限責任公司,E.Larsen及R.M.Aarts提出之“Audio Bandwidth Extension-Application to psychoacoustics,Signal Processing and Loudspeaker Design”;2002年5月德國慕尼黑AES第112次會議中E.Larsen、R.M.Aarts及M.Danessis提出之“Efficient high-frequency bandwidth extension of music and speech”;1973年6月IEEE Transactions on Audio and Electroacoustics,AU-21(3)中J.Makhoul所著之“Spectral Analysis of Speech by Linear Prediction”;Ohmori等人於美國專利申請案08/951,029中提出之音訊頻寬擴展系統及方法(Audio band width extending system and method);及Malah,D & Cox,R. V.於美國專利6895375提出之窄頻語音之頻寬擴展系統(System for bandwidth extension of Narrow-band speech)。此等演算法依賴於高頻內容(HF)之一參數表示,這是透過轉換成HF頻譜區(“修補”)及應用一參數驅動後處理之方式由已解碼信號之波形編碼的低頻部分(LF)產生。
最近,有使用如以下中所描述之相位聲碼器的一新演算法:M.Puckett提出之”Phase-locked Vocoder”,IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics,Mohonk,1995年;Rbel,A.:“Transient detection and preservation in the phase vocoder”,citeseer.ist.psu.edu/679246.html;Laroche L.、Dolson M.:“Improved phase vocoder timescale modification of audio”,IEEE Trans. Speech and Audio Processing第7卷第3期第323-332頁;及Laroche,J.&Dolson,M.在美國專利6549884中提出之“Phase-vocoder pitch-shifting for the patch generation”,該演算法已經展現在Frederik Nagel、Sascha Disch提出之“A harmonic bandwidth extension method for audio codecs”,2009年4月臺灣臺北ICASSP International Conference on Acoustics,Speech and Signal Processing,IEEE CNF。然而,稱為“諧波頻寬擴展(HBF)”之此方法易遭受包含在音訊信號中之暫態之品質下降,如2009年5月德國慕尼黑第126次AES會議上Frederik Nagel、Sascha Disch、Nikolaus Rettelbach提出之“A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs”中所述,這是由於在該標準相位聲碼器演算法中子頻帶上之垂直相干性不保證被維持且另外離散傅立葉轉換(DFT)相位之重新計算不得不在隱含地假定有循環週期的一轉換之分離時間塊上執行。
已知特別可看到兩種由於基於區塊之相位聲碼器處理而產生之人為因素。這兩種人為因素特別是由於應用了最新計算出的相位而由信號之時域循環捲積效應產生之波形分散及時域混疊。
換句話說,因為在該BWE演算法中對音訊信號之頻譜值應用了一相位調整,所以包含在音訊信號之一區塊中之一暫態可能環繞在該區塊周圍,即循環捲積回該區塊。這產生了時域混疊且因此導致音訊信號降級。
因此,用於特定處理包含暫態之信號部分之方法應當遭使用。然而,尤其因為該BWE演算法在一編解碼器鏈之解碼器端執行,所以計算複雜度是一嚴重問題。因此,針對剛剛所述之音訊信號降級的解決辦法應當較佳地不以大大提高計算複雜度為代價而實現。
本發明之目的是例如在一BWE方案之脈絡中,提供一種用於透過調整一音訊信號之頻譜值的相位而操控該音訊信號之方案,其能夠在減小剛剛所述之品質降級及降低該計算複雜度之間實現一較好折中。
此目的由根據申請專利範圍第1項所述之一裝置或根據申請專利範圍第19項所述之一方法或根據申請專利範圍第20項所述之一電腦程式而實現。
構成本發明之基礎的基本構想在於,當具有填補值與音訊信號值的音訊樣本之至少一個填補區塊在調整該填補區塊之該等頻譜值之相位之前產生時,上述之較好折中可實現。藉由此解決方法,由該相位調整產生之信號內容向區塊邊界的移動及一相應的時域混疊可遭防止發生或至少使其可能性較小,且因此該音訊品質可輕鬆地遭保持。
本發明之用於操控一音訊信號之構想係基於產生音訊樣本之多數個連續區塊,該多數個連續區塊包含音訊樣本之至少一個填補區塊,該填補區塊具有填補值與音訊信號值。該填補區塊接著被轉換成具有頻譜值之一頻譜表示。該等頻譜值接著被調整以獲得一已調頻譜表示。最後,該已調頻譜表示遭轉換成一已調時域音訊信號。用於填補的該範圍的值則可被移除。
根據本發明之一實施例,該填補區塊較佳地透過在一時間區塊之前或之後插入由零值構成之填補值而產生。
根據一實施例,該等填補區塊局限於那些包含一暫態事件者,藉此將額外的計算複雜度負擔限於那些事件。更準確地,例如,當一暫態事件在該音訊信號之一區塊中遭檢測到時,該區塊按照一BWE演算法透過一先進方式以一填補區塊之形式被處理,而當該暫態事件在另一區塊中未檢測到時,該音訊信號之此區塊作為只具有音訊信號之一非填補區塊以一BWE演算法之一標準方式遭處理。透過適應性地在該標準處理及先進處理之間轉換,該平均計算工作量可大大地降低,例如,這允許減低處理器速度及減少記憶體。
根據本發明之實施例,該等填補值安排在其中一暫態事件遭檢測到之一時間區塊之前及/或之後,因此該填補區塊適於以例如分別透過一DFT及一IDFT處理器實現之一第一及第二轉換器在時域及頻域之間轉換。一較好的解決方法可以是將該填補對稱地安排在該時間區塊周圍。
根據一實施例,該至少一個填補區塊透過將諸如零值之填補值補到該音訊信號之音訊樣本之一區塊而產生。可選擇地,具有填補到一分析窗函數之一開始位置或該分析窗函數之一結束位置之至少一個防護區的該分析窗函數用以透過將此分析窗函數應用到該音訊信號之音訊樣本之一區塊而形成一填補區塊。例如,該窗函數可包含具有防護區之韓恩視窗(Hann window)。
圖式簡單說明
下面,參考附圖,本發明之實施例予以說明,其中:第1圖顯示了用於操控一音訊信號之一實施例之方塊圖;第2圖顯示了用於利用該音訊信號執行一頻寬擴展之一實施例之方塊圖;第3圖顯示了利用不同的BWE因子執行一頻寬擴展演算法之一實施例之一方塊圖;第4圖顯示了利用一暫態檢測器轉換一填補區塊或一非填補區塊之另一實施例之一方塊圖;第5圖顯示了第4圖之一實施例之一實施態樣之一方塊圖;第6圖顯示了第4圖之一實施例之另一實施態樣之一方塊圖;第7a圖顯示了相位調整之前及之後的一示範性信號區塊之圖式,用以說明一相位調整對具有位於一時間區塊之中心的一暫態之一信號波形之影響;第7b圖顯示了相位調整之前及之後的一示範性信號區塊之圖式,用以說明一相位調整對在一時間區塊之一第一樣本附近具有該暫態的一信號波形之影響;第8圖顯示了本發明之另一實施態樣之一概述之方塊圖;第9a圖顯示了呈具有防護區之一韓恩視窗形式的一示範性分析窗函數之圖式,其中該等防護區之特徵在於為常數零,該視窗要用在本發明之一可選擇實施例中;第9b圖顯示了呈具有防護區之一韓恩視窗形式的一示範性分析窗函數之圖式,其中該等防護區之特徵在於抖動,該視窗要用在本發明之又一可選擇實施例中;第10圖顯示了一頻寬擴展方案中對一音訊信號之一頻譜帶的一操控之一示意圖;第11圖顯示了一頻寬擴展方案之脈絡中之一重疊相加操作之示意圖;第12圖顯示了基於第4圖之一可選擇實施例之一實施態樣的一方塊圖及示意圖;及第13圖顯示了一典型諧波頻寬擴展(HBE)實施態樣之一方塊圖。
第1圖說明了根據本發明之一實施例操控一音訊信號之一裝置。該裝置包含一窗102,其具有用於一音訊信號之一輸入100。該窗102經實施來產生音訊樣本之多數個連續區塊,其包含至少一個填補區塊。特定地,該填補區塊具有填補值及音訊信號值。出現在該窗102之一輸出103處之該填補區塊被提供到一第一轉換器104,該第一轉換器104經實施來將該填補區塊103轉換成具有頻譜值之一頻譜表示。該第一轉換器104之輸出105處之該等頻譜值接著被提供到一調相器106。該調相器106經實施來調整該等頻譜值105之相位以在107獲得一已調頻譜表示。該輸出107最后被提供到一第二轉換器108,該第二轉換器108經實施來將該已調頻譜表示107轉換為一已調時域音訊信號109。該第二轉換器108之該輸出109可連接到另一整數倍降低取樣器,該整數倍降低取樣器對於一頻寬擴展方案來說是必須的,如結合第2圖、第3圖及第8圖所討論者。
第2圖顯示了利用一頻寬擴展因子(σ)執行一頻寬擴展演算法之一實施例的一示意圖。在此,該音訊信號100饋入包含一分析窗處理器110及一後續填補器112的該窗102。在一實施例中,該分析窗處理器110被實施以產生具有相同大小之多數個連續區塊。該分析窗處理器110之輸出111進一步連接到該填補器112。特定地,該填補器112被實施以填補在該分析窗處理器110之該輸出111處之該多數個連續區塊中之一區塊以在該填補器112之該輸出103處獲得該填補區塊。此處,該填補區塊透過將填補值插入到音訊樣本之連續區塊中之一第一樣本之前或音訊樣本之該連續樣本中之最後一樣本之後的特定時間位置而獲得。該填補區塊103進一步由該第一轉換器104轉換以在該輸出105處獲得一頻譜表示。而且,一帶通濾波器114遭使用,其被實施以從該頻譜表示105或者該音訊信號100中擷取帶通信號113。該帶通濾波器114之一帶通特性被選擇使得該帶通信號113被限制在一恰當的目標頻率範圍。在此,該帶通濾波器114接收到也在一下游調相器106之輸出115處出現之一頻寬擴展因子(σ)。在本發明之一個實施例中,一頻寬擴展因子(σ)2.0用來執行該頻寬擴展演算法。在該音訊信號100具有例如0到4KHz之一頻率範圍之情況下,該帶通濾波器114將擷取出2KHz到4KHz之頻率範圍,因此該帶通信號113將透過該隨後的BWE演算法被轉換到4KHz到8KHz之一目標頻率範圍內,條件是例如,該頻寬擴展因子(σ)2.0被應用來選擇一恰當的帶通濾波器114(見第10圖)。該帶通濾波器114之該輸出113處之該帶通信號之該頻譜表示包含幅度資訊及相位資訊,它們分別在一定標器116與該調相器106中被進一步處理。該定標器116被實施以藉由一因子來定標該幅度資訊之該等頻譜值113,其中該因子依賴於一重疊相加特性,因為由該窗102實施之一重疊相加操作的一第一時間距離(a)與由一下游重疊相加器124施加之一不同時間距離(b)之一關係被計入。
例如,如果有一重疊相加特性,其中音訊樣本之連續區塊之一第六次重疊相加(sixth-fold overlap-add)具有該第一時間距離(a),且該第二時間距離(b)與該第一時間距離(a)之比為b/a=2,則因子b/a x 1/6將由該定標器16用以定標該輸出113處之該等頻譜值(參見第11圖),假定這是在一矩形分析窗之情況下。
然而,該特定幅度定標只可應用於一下游整數倍降低取樣器在該重疊相加操作之後執行時。如果該整數倍降低取樣器在該重疊相加操作之前執行,則該整數倍降低取樣器可能對該等頻譜值之該等幅度產生一影響,此影響一般必須被該定標器116計入。
該調相器106受組配以用該頻寬擴展因子(σ)分別定標或乘以該音訊信號之該頻帶的該等頻率值113之該等相位,藉此音訊樣本之一連續區塊中之至少一個樣本循環捲積到該區塊。
基於一循環週期之循環捲積之影響是該第一轉換器104及該第二轉換器108所執行之該轉換的一不期望的負面影響,其透過位於該分析窗704中間之一暫態700(第7a圖)及位於該分析窗704之一邊界附近之一暫態702(第7b圖)之範例顯示在第7圖中。
第7a圖顯示了位於該分析窗704中間,即在具有一樣本長度706之音訊樣本之連續區塊內居中之該暫態700,,該樣本長度706包括例如具有該連續區塊之一第一樣本708及一最後樣本710之1001個樣本。該原始信號700由一細虛線指明。在由該第一轉換器104轉換且隨後例如使用一相位聲碼器對該原始信號之該頻譜實施一相位調整後,該暫態700將遭平移且在由該第二轉換器108轉換後循環捲積回該分析窗704,即使得該循環捲積暫態701將仍位於該分析窗704內。該循環捲積暫態701由用“沒有防護”來指示的粗線指示。
第7b圖顯示了包含接近該分析窗704之該第一樣本708的一暫態702的該原始信號。具有一暫態702之該原始信號同樣由該細虛線指示。在此情況下,在由該第一轉換器104轉換及隨後實施該相位調整之後,該暫態702將被平移且在由該第二轉換器708轉換之後循環捲積回該分析窗704,藉此一循環捲積暫態703將被獲得,其由用“沒有防護”來指示的該粗線指示。在此,該循環捲積暫態703產生,因為由於相位調整的緣故,該暫態702之至少一部分移到該分析窗704之該第一樣本708之前,這導致該循環捲積暫態703之循環包圍。特定地,可從第7b圖中看出,由於循環週期之作用,該暫態702中移出該分析窗704之該部分(部分705)再次出現在該分析窗704之該最後樣本710之左側。
包含來自該定標器116之該輸出117的該已調幅度資訊及來自該調相器106之該輸出107的該已調相位資訊的該已調頻譜表示被提供到該第二轉換器108,其受組配以將該已調頻譜表示轉換成出現在該第二轉換器108之該輸出109處之該已調整的時域音訊信號。該第二轉換器108之該輸出109處之該已調整時域音訊信號接著遭提供到一填補去除器118。該填補去除器118被實施以去除該已調整之時域音訊信號中那些與在該調相器106之該下游處理應用該相位調整之前被插入以在該窗102之該輸出103處產生填補區塊的該等填補值之該等樣本相對應之樣本。更確切地說,位於該已調整時域音訊信號之與該相位調整之前被插入填補值的該等特定時間位置相對應之那些時間位置的樣本被移除。
在本發明之一實施例中,該等填補值對稱地插入在音訊樣本之該連續區塊之該第一樣本708之前與音訊樣本之該連續區塊之該最後樣本710之後,例如,如第7圖中所示,藉此兩個對稱防護區712、714遭形成,包圍具有該樣本長度706之該居中的連續區塊。在此對稱情況下,在該等頻率值之該相位調整及它們隨後成為該已調整的時域音訊信號之轉換之後,該等防護區或者“防護間隔”712、714較佳地可分別由該填補去除器118自該填補區塊被移除,以便在該填補去除器118之該輸出119處只獲得沒有該等填補值的該連續區塊。
在一可選擇實施態樣中,該等防護間隔可以不由該填補去除器118自該第二轉換器108之該輸出109移除,使得該填補區塊之該已調整之時域音訊信號將具有包括該居中的連續區塊之該樣本長度706及該等防護間隔之該等樣本長度712、714的樣本長度716。此信號可進一步在下至一重疊相加器124之後續處理階段中被處理,如第2圖中之該方塊圖所示。在該填補去除器118不存在之情況下,包括對該等防護間隔進行操作之此處理也可被看作是對該信號之一過取樣。即使該填補去除器118在本發明之實施例中不需要,但如第2圖中所示使用它是有利的,因為出現在該輸出119處之該信號將已具有分別與在藉由該填補器112填補之前出現在該分析窗處理器110之該輸出111處之該原始連續區塊或未經填補的區塊相同的樣本長度。因此,該後續處理階段將容易地適用於該輸出119處之該信號。
較佳地,該填補去除器118之該輸出119處之該已調整之時域音訊信號被提供到一整數倍降低取樣器120。該整數倍降低取樣器120較佳地藉由利用該頻寬擴展因子(σ)操作之一簡單取樣率轉換器來實施以在該整數倍降低取樣器120之輸出121獲得一已整數倍降低取樣的時域信號。在此,該整數倍降低取樣特性依賴於由該調相器106在該輸出115處提供之該相位調整特性。在本發明之一實施例中,該頻寬擴展因子σ=2由該調相器106經由該輸出115提供到該整數倍降低取樣器120,藉此每兩個樣本就有一樣本將自該輸出119處之該已調時域音訊信號移除,產生出現在該輸出121處之該已整數倍降低取樣的時域信號。
出現在該整數倍降低取樣器120之該輸出121處之該已整數倍降低取樣時域信號隨後饋入到一合成窗122,該合成窗122被實施以例如,將一合成窗函數應用到該已整數倍降低取樣的時域信號,其中該合成窗函數匹配於由該窗102之該分析窗處理器110應用之一分析函數。在此,該合成窗函數可以以這樣一方式匹配於該分析函數:應用該合成函數抵消該分析函數之影響。可選擇地,該合成窗122還可被實施以對該第二轉換器108之該輸出109處之該已調整的時域音訊信號進行操作。
來自該合成窗122之該輸出123的已整數倍降低取樣且經加窗的時域信號接著被提供到一重疊相加器124。在此,該重疊相加器124接收關於由該窗102實施之該重疊相加操作之該第一時間距離(a)及該調相器106在該輸出115處使用之該頻寬擴展因子(σ)的資訊。該重疊相加器124將比該第一時間距離(a)大之一不同時間距離(b)應用到該已整數倍降低取樣且經加窗時域信號。
在該整數倍降低取樣在該重疊相加之後執行之情況下,根據一頻寬擴展方案條件σ=b/a可遭滿足。然而,在如第2圖中顯示之該實施例中,該整數倍降低取樣在該重疊相加之前執行,因此該整數倍降低取樣可對一般必須被該重疊相加器124計入之上述條件產生影響。
較佳地,第2圖中顯示之該裝置可受組配用於執行包含一頻寬擴展因子(σ)之一BWE演算法,其中該頻寬擴展因子(σ)控制自該音訊信號之一頻帶到一目標頻帶的一頻率擴展。以此方式,在視該頻寬擴展因子(σ)而定之該目標頻率範圍中之該信號可在該重疊相加器124之該輸出125處獲得。
在一BWE演算法之脈絡中,一重疊相加器124被實施以藉由將一輸入時域信號之該等連續區塊彼此間隔得比該音訊信號之該等原始疊加連續區塊遠而引起該音訊信號之時間擴展以獲得一擴展信號。
在該整數倍降低取樣在該重疊相加之後執行之情況下,例如,藉由一因子2.0進行的一時間擴展將產生具有為該原始音訊信號100之該持續時間兩倍的一擴展信號。例如,以一相應整數倍降低取樣因子2.0進行之後續整數倍降低取樣將產生同樣具有該音訊信號100之該原始持續時間的一已整數倍降低取樣且頻寬延伸之信號。然而,在如第2圖所示之該整數倍降低取樣器120位於該重疊相加器124之前之情況下,該整數倍降低取樣器120可受組配來以一頻寬擴展因子(σ)2.0進行操作,藉此,例如,每兩個樣本就有一樣本自其輸入時域信號中遭移除,這產生具有該原始音訊信號100之持續時間之一半的一已整數倍降低取樣時域信號。同時,頻率範圍例如2KHz到4KHz中之一帶通濾波信號的頻寬將以一因子2.0來擴展,從而在整數倍降低取樣過後產生在該相應目標頻率範圍例如4KHz到8KHz中之一信號121。隨後,該已整數倍降低取樣且頻寬擴展之信號可藉由該下游重疊相加器124時域擴展到該音訊信號100之該原始持續時間。實質上,上述過程與一相位聲碼器之原理有關。
自該重疊相加器124之該輸出125獲得之該目標頻率範圍中之該信號隨後提供到一波封調節器130。基於在該波封調節器130之該輸入101處接收到之由該音訊信號100推導出之發送參數,該波封調節器130被實施以以一確定的方式調節該重疊相加器124之該輸出125處之該信號之波封,藉此該波封調節器130之該輸出129處獲得一校正信號,該校正信號包含一已調節的波封及/或一已校正的音調。
第3圖顯示了本發明之一實施例之一方塊圖,其中該裝置受組配以利用不同的BWE因子(σ),例如σ=2,3,4,....執行一頻寬擴展演算法。開始,該等頻寬擴展演算法參數經由輸入128轉發到共同以該等BWE因子(σ)操作之所有裝置。特定地,此等裝置為該第一轉換器104、該調相器106、該第二轉換器108、該整數倍降低取樣器120及該重疊相加器124,如第3圖所示。如上所述,用於執行該頻寬擴展演算法之該等連續處理裝置被實施以以這樣一方式操作:針對該輸入128處之不同BWE因子(σ),可在該整數倍降低取樣器120之輸出121-1、121-2、121-3...處獲得相應的已調整時域音訊信號,它們之特徵在於分別不同的目標頻率範圍或頻帶。接著,該等不同的已調整時域音訊信號基於該等不同的BWE因子(σ)而由該重疊相加器124處理,從而在該重疊相加器124之輸出125-1、125-2、125-3...處產生不同的疊加結果。此等疊加結果最終由一組合器126在其輸出127處組合以獲得包含該等不同目標頻帶之一組合信號。
為了有一個概要性的觀點,該頻寬擴展演算法之基本原理繪示在第10圖中。特定地,第10圖示意性地顯示了該BWE因子(σ)如何分別控制例如該音訊信號100之該頻帶之一部分113-1、113-2、113-3與一目標頻帶125-1、125-2、125-3之間的頻移。
首先,在σ=2之情況下,具有例如2KHz到4KHz之一頻率範圍的一帶通濾波信號113-1自該音訊信號100之該初始頻帶遭擷取。該帶通濾波信號113-1之該頻帶接著被轉換為該重疊相加器124之該第一輸出125-1。該第一輸出125-1具有與以一因子2.0(σ=2)進行之該音訊信號100之該初始頻帶的一頻寬擴展相對應之一頻率範圍4KHz到8KHz。對於σ=2之此上頻帶也可被稱為“第一填補頻帶”。接著,在σ=3之情況下,具有頻帶範圍8/3KHz到4KHz之一帶通濾波信號113-2被擷取,接著經過該重疊相加器124之後其被轉換為該第二輸出125-2,其特徵在於為8KHz到12KHz之一頻率範圍。與以一因子3.0(σ=3)進行之一頻帶擴展相對應之該輸出125-2之上頻帶也被稱為“第二填補頻帶”。接著,在σ=4之情況下,具有一頻率範圍3KHz到4KHz之該帶通濾波信號113-3被擷取,接著經過該重疊相加器124之後其被轉換為具有一頻率範圍12KHz到16KHz之該第三輸出125-3。與以一因子4.0(σ=4)進行之一頻寬擴展相對應之該輸出125-3之上頻帶也可被稱為“第三填補頻帶”。藉由此方式,該第一、第二及第三填補頻帶可遭獲得,覆蓋一最大頻率高達16KHz之連續頻帶,較佳地該最大頻率16KHz對於在一高品質頻寬擴展演算法之脈絡中操控該音訊信號100來說是需要的。原則上,該頻寬擴展演算法也可針對該BWE因子之較高值σ>4而執行,產生甚至更多的高頻帶。然而,考慮到,這樣的高頻帶一般在該受操控信號之該感知品質上將不會產生進一步提高。
如第3圖所示,基於該等不同BWE因子(σ)之該等疊加結果125-1、125-2、125-3...進一步由一組合器126組合,藉此在該輸出127處獲得包含該等不同的頻帶(見第10圖)之一組合信號。在此,該輸出127處之該組合信號由從該音訊信號100之該最大頻率(fmax )到該最大頻率之σ倍(σxfmax )之範圍(如自4kHz到16kHz(參見第10圖))中之該已轉換高頻填補帶構成。
該下游波封調節器130如上述受組配以基於來自出現在該輸入101處之該音訊信號的發送參數而調整該組合信號之該波封,在該波封調節器130之該輸出129處產生一校正信號。在該輸出129處由該波封調節器130提供之該校正信號進一步由另一組合器132來與該原始音訊信號100組合以最終在該另一組合器132之該輸出131處獲得頻帶經擴展之一受操控信號。如第10圖所示,該輸出131處之該頻寬擴展信號之該頻率範圍包含該音訊信號100之該頻帶及根據該頻寬擴展演算法自該轉換獲得的該等不同頻帶,例如範圍總共從0到16KHz(第10圖)。
在根據第2圖之本發明之一實施例中,該窗102受組配以在音訊樣本之一連續區塊中之一第一樣本之前或音訊樣本之該連續區塊之一最後樣本之後的特定時間位置處插入填補值,其中,填補值之數目及該連續區塊中之值之數目的總和至少為音訊樣本之該連續區塊中之值的該數目的1.4倍。
特定地,對於第7圖,具有該樣本長度712之該填補區塊之該第一部分插入在具有該樣本長度706之該居中的連續區塊704之該第一樣本708之前,而具有該樣本長度714之該填補區塊之一第二部分插入在該居中的連續區塊704之後。要指出的是在第7圖中,該連續區塊704或者該分析窗分別由“感興趣區”(ROI)表示,其中穿過該等樣本0到1000之該豎直實線指示該分析窗704之該等邊界,該循環捲積的條件在其中有效。
較佳地,該連續區塊704左邊之該填補區塊之該第一部分具有與該填補區塊704右邊之該填補區塊之該第二部分相同的長度,其中該填補區塊之該總體大小具有一樣本長度716(例如,從樣本-500到樣本1500),其是該居中的連續區塊704之該樣本長度706之兩倍。第7b圖中顯示,例如,因為該調相器106實施一相位調整,所以最初位置靠近該分析窗704之該左邊界的一暫態702將被時移,藉此將獲得以該居中的連續區塊704之該第一樣本708為中心的一平移暫態707。在此情況下,該平移暫態707將全部位於具有該樣本長度716之該填補區塊內,從而防止由該實施的相位調整導致之循環捲積或循環環繞。
例如,如果該居中的連續區塊704之該第一樣本708左邊之該填補區塊之該第一部分不夠大,不足以完全容納該暫態之一可能時移,則該暫態將被循環捲積,這意味著該暫態之至少一部分將重新出現在該居中的連續區塊704之該最後樣本710右邊之該填補區塊之該第二部分中。然而,在該後續處理階段中應用該調相器106之後,該暫態之此部分可較佳地藉由該填補去除器118移除。然而,該填補區塊之該樣本長度716應當至少為該連續區塊704之該樣本長度706之1.4倍大。應考慮到,由例如一相位聲碼器實現之該調相器106實施之該相位調整總是造成朝著負時間之一時移,即朝著該時間/樣本軸左邊平移。
在本發明之實施例中,該第一及第二轉換器104、108被實施以對與該填補區塊之該樣本長度相對應之一轉換長度操作。例如,如果該連續區塊具有一樣本長度N,而該填補區塊具有至少為1.4xN之一樣本長度,諸如2N,則由該第一及該第二轉換器104、108應用之該轉換長度將也是1.4xN,例如2N。
然而,原則上,該第一轉換器104及該第二轉換器108之該轉換長度應當依據該BWE因子(σ)而選擇,因為該BWE因子(σ)越大,該轉換長度應當越大。然而,較佳地是,使用與該填補區塊之該樣本長度那樣長之一轉換長度就足矣,即便對於該BWE因子之較大值,例如σ>4,該轉換長度不夠大,不足以阻止任何類型之循環捲積效應。這是因為在這樣一情況下(σ>4),由循環捲積造成之暫態事件之時域混疊,例如在該已轉換高頻填補頻帶中是微不足道的且將不能明顯地影響該感知品質。
在第4圖中,一實施例遭顯示,其包含一暫態檢測器134,該暫態檢測器134被實施以檢測該音訊信號100之一區塊中之一暫態事件,諸如,例如在第7圖中顯示之具有該樣本長度706之音訊樣本之該連續區塊704中之一暫態事件。
特定地,該暫態檢測器134受組配以確定音訊區塊之一連續區塊是否包含一暫態事件,其特徵在於該音訊信號100之能量在時間上之一突然變化,諸如,例如從一個時間部分到下一時間部分能量增加或降低了例如50%以上。
例如,該暫態檢測可基於一頻率選擇處理,諸如表示包含在該音訊信號100之該高頻帶中之該能量之一測量值的一頻譜表示之高頻部分之一平方操作,及能量上的時間變化與一預定臨界值之一後續比較。
而且,一方面,當諸如第7b圖之該暫態事件702的該暫態事件由該暫態檢測器134檢測到處於與該填補器112之該輸出103處之該填補區塊相對應之該音訊信號100之某一區塊133-1中時,該第一轉換器104受組配以轉換該填補區塊。另一方面,該第一轉換器104受組配以轉換該暫態檢測器134之該輸出133-2處僅具有音訊信號之一非填補區塊,其中該非填補區塊與該音訊信號100之該區塊對應,這是在該區塊中未檢測到該暫態事件時的情況。
在此,該填補區塊包含填補值,諸如,例如插入在第7b圖之該居中的連續區塊704左邊與右邊之零值,及位於第7b圖之該居中的連續區塊704內部之音訊信號值。然而該非填補區塊只包含音訊信號值,諸如例如位於第7b圖之該連續區塊704內部之音訊樣本之那些值。
在其中由該第一轉換器104進行之該轉換且因而還有基於該第一轉換器104之該輸出105的後續處理階段依賴於對該暫態事件之檢測的上述實施例中,該填補器112之該輸出103處之該填補區塊只在該音訊信號100之某些選定時間區塊(即包含一暫態事件之時間區塊)內產生,在此期間在進一步操控該音訊信號100之前進行填補就知覺品質來講預期是有利的。
在本發明之其它實施例中,對第4圖中分別由“無暫態事件”或“暫態事件”表示之用於該後續處理的該恰當信號路徑的選擇透過利用第5圖中顯示之切換器136完成,該切換器136由該暫態檢測器134之該輸出135控制,該輸出135包含關於該暫態事件之檢測的資訊,其包括在該音訊信號100之該區塊中是否檢測到該暫態事件的資訊。來自該暫態檢測器134之資訊由該切換器136轉發到由“暫態事件”表示之該切換器136之輸出135-1或由“無暫態事件”表示之該切換器136之輸出135-2。在此,第5圖中之該切換器136之該等輸出135-1、135-2完全與第4圖中之該暫態檢測器134之該等輸出133-1、133-2對應。如上所述,該填補器112之該輸出103處之該填補區塊自該音訊信號100之該區塊135-1產生,其中該暫態事件由該暫態檢測器134檢測到在該區塊135-1中。此外,該切換器136受組配以在該暫態事件由該暫態檢測器檢測到時將該填補器112在該輸出103產生之該填補區塊饋入到第一子轉換器138-1且在該暫態事件未由該暫態檢測器134檢測到時將該輸出135-2處之該非填補區塊饋入到一第二子轉換器138-2。在此,該第一子轉換器138-1被用以利用該第一轉換長度(例如2N)執行該填補區塊之一轉換,而該第二子轉換器138-2被用以利用一第二轉換長度(例如N)執行該非填補區塊之一轉換。因為該填補區塊具有比該非填補區塊大之一樣本長度,所以該第二轉換長度比該第一轉換長度短。最後,可分別在該第一子轉換器138-1之該輸出137-1處獲得一第一頻譜表示或者在該第二子轉換器138-2之輸出137-2處獲得一第二頻譜表示,這可在該頻帶擴展演算法之脈絡中進一步被處理,如前面所說明。
在本發明之一可選擇實施例中,該窗102包含一分析窗處理器140,該分析窗處理器140受組配以將一分析窗函數應用到音訊樣本之一連續區塊中,諸如,例如第7圖中之該連續區塊704。由該分析窗處理器140應用之該分析窗函數特定地在該窗函數之一開始位置處包含至少一個防護區,諸如,例如開始於該第7b圖之該連續區塊704左邊之窗函數709之該第一樣本718(即樣本-500)之時間部分,或者在該窗函數之一結束位置處包含至少一個防護區,諸如,例如結束於第7b圖之該連續區塊右側之該窗函數709之最後一樣本720(即樣本1500)之時間部分。
第6圖顯示了本發明之一可選擇實施例,其進一步包含一防護窗切換器142,該防護窗切換器142受組配以依賴於關於該暫態檢測器134之該輸出135提供之該暫態檢測的資訊來控制該分析窗處理器140。該分析窗處理器140受控制,因為具有一第一窗長度之該防護窗切換器142之輸出139-1處之一第一連續區塊產生於該暫態事件由該暫態檢測器134檢測到時且具有一第二窗長度之該防護窗切換器142之該輸出139-2處之另一連續區塊產生於該暫態檢測器沒有檢測到該暫態事件時。在此,該分析窗處理器140受組配以將該分析窗函數(諸如,例如由第9a圖繪示的具有一防護區之一韓恩視窗)應用到該輸出139-1處之該連續區塊或者該輸出139-2處之另一連續區塊,藉此該輸出141-1處之一填補區塊或者該輸出142-2處之一非填補區塊分別遭獲得。
在第9a圖中,例如該輸出141-1處之該填補區塊包含一第一防護區910及一第二防護區920,其中該等防護區910、920之該等音訊樣本之值遭設定為零。在此,該等防護區910、920包圍對應於該窗函數之特性的一區域930,在此情況下該窗函數之特性由例如該韓恩視窗之該特性形狀給定。可選擇地,關於第9b圖,防護區940、950之該等音訊樣本之該等值還可在零附近抖動。第9圖中之豎直線指示該區域930之一第一樣本905及最後一樣本915。此外,該等防護區910、940開始於該窗函數之該第一樣本901,而該等防護區920、950結束於該窗函數之該最後一樣本903。以一韓恩視窗部分為中心之該完整視窗之樣本長度900,例如包括第9a圖的該等防護區910、920,為該區域930之該樣本長度之2倍大。
在該暫態檢測器134檢測到該暫態事件之情況下,該輸出139-1處之該連續區塊遭處理,因為該連續區塊由該分析窗函數之該特性形狀加權,諸如,例如第9a圖中所示之具有該等防護區910、920之該正規化韓恩視窗,而在該暫態檢測器134未檢測到該暫態事件之情況下,該輸出139-2處之該連續區塊遭處理,因為該連續區塊只由該分析窗函數之該區域930之該特性形狀加權,諸如,例如第9a圖之該正規化韓恩視窗901之該區域930。
在該等輸出141-1、141-2處之該填補區塊或非填補區塊係利用包含剛剛上述之該防護區的該分析窗函數產生之情況下,該等填補值或音訊信號值分別源於由該窗函數之該防護區或該非防護(特性)區對該等音訊樣本之該加權。在此,該等填補值及音訊信號值都表示加權值,其中特定地該等填補值近似為零。特定地,該等輸出141-1、141-2處之該填補區塊或非填補區塊可與顯示在第5圖中之該實施例中的該等輸出103、135-2處之那些填補區塊或非填補區塊。
因為由應用該分析窗函數產生之該加權,該暫態檢測器134及該分析窗處理器140較佳地應當以某一方式被安排使得藉由該暫態檢測器134檢測該暫態事件發生在藉由該分析窗處理器140應用該分析窗函數之前。否則,由於該加權處理,該暫態事件之該檢測將大受影響,這尤其與一暫態事件位於該等防護區內或者接近該非防護(特性)區之該等邊界之情況一樣,因為在此區域中,與分析窗函數之該等值相對應之該等加權因子總是接近於零。
利用具有該第一轉換長度之該第一子轉換器138-1及具有該第二轉換長度之該第二子轉換器138-2,該輸出141-1處之該填補區塊及該輸出141-2處之該填補區塊隨後遭轉換成它們在輸出143-1、143-2處之頻譜表示,其中該第一及該第二轉換長度分別與該等遭轉換區塊之該等樣本長度相對應。該等輸出143-1、143-2處之該等頻譜表示可進一步如以前討論之實施例中那樣被處理。
第8圖顯示了該頻寬擴展實施態樣之一實施例之一概述。特定地,第8圖包括由“音訊信號/附加參數”表示之區塊800,該區塊800提供由輸出區塊“低頻(LF)音訊資料”表示之該音訊信號100。此外,該區塊800提供可以與第2圖及第3圖中之該波封調節器130之該輸入101相對應之解碼參數。該區塊800之該輸出101處之該等參數可隨後用於該波封調節器130及/或一音調校正器150。例如,該波封調節器130及該音調校正器150受組配以將一預定失真應用到該合成信號127以獲得該失真信號151,該失真信號151可與第2圖及第3圖之該已校正信號129相對應。
該區塊800可包含關於提供在該頻寬擴展實施態樣之該編碼器端的該暫態檢測的旁側資訊。在此情況下,此旁側資訊進一步透過由該虛線表示之一位元流810發送到該解碼器端上之該暫態檢測器134。
然而較佳地,該暫態檢測執行於在此稱為一“定框”裝置102-1之該分析窗處理器110之該輸出111處之音訊樣本之多數個連續區塊。換句話說,該暫態旁側資訊在表示該解碼器之該暫態檢測器134中遭檢測或者其自該編碼器在該位元流810中遭轉送(虛線)。第一個解決方法未增加要被發送之位元率,而第二個解決方法使該檢測便利,因為原始信號仍然可得到。
特定地,第8圖顯示了受組配以執行一諧波頻寬擴展(HBE)實施態樣之一裝置之一方塊圖,如第13圖所示,其與由該暫態檢測器134控制之該切換器136結合,用來視關於該輸出135處之一暫態事件之發生的資訊而定來執行一信號適應性處理。
在第8圖中,該定框裝置102-1之該輸出111處之該多數個連續區塊遭提供給一分析窗裝置102-2,該分析窗裝置102-2受組配以應用具有一預定窗形狀之一分析窗函數,諸如,例如一上升餘弦窗,該上升餘弦窗之特徵在於:相比於典型地應用在一定框操作中之一矩形窗形狀,其具有較少縱深側面。視用該切換器136獲得的由“暫態”或“非暫態”表示之該切換判決而定,該分析窗裝置102-2之輸出811處之多數個連續加窗(即定框且加權)區塊中之包括該暫態事件之該區塊135-1或不包括該暫態事件之該區塊135-2(由該檢測器134檢測)分別進一步被處理,如以前詳細描述。特定地,可與第2圖、第4圖及第5圖中之該窗102之該填補器112相對應之一零填補裝置102-3較佳地用來在該時間區塊135-1之外部插入零值,藉此獲得與該填補區塊103相對應之一已補零區塊803,其樣本長度2N為該時間區塊135-2之該樣本長度N之2倍長。在此,該暫態檢測器134由“暫態位置檢測器”表示,因為其可用來確定該連續區塊135-1相對於該輸出811處之該多數個連續區塊的位置,即包含該暫態事件之個別時間區塊可從該輸出811處之該連續區塊序列中被識別出。
在一個實施例中,該填補區塊總是產生於在其中該暫態事件被檢測出之一特定連續區塊,而與該暫態事件在該區塊內之位置無關。在此情況下,該暫態檢測器134只受組配以確定(識別)包含該暫態事件之該區塊。在一可選擇實施例中,該暫態檢測器134還可受組配以確定該暫態事件相對於該區塊之特定位置。在該前一實施例中,該暫態檢測器134之一更簡單實施態樣可遭使用,而在該后一實施例中,該處理之計算複雜度可降低,因為只有一暫態事件位於一特定位置且較佳地靠近一區塊邊界時,該填補區塊才將產生且進一步被處理。換句話說,在該後一實施例中,只有當一暫態事件位於該區塊邊界附近時(即當偏離中心暫態發生時),零填補區或防護區才被需要。
第8圖之該裝置實質上提供了一種在進入該相位聲碼器處理之前透過在每一時間區塊之兩端填補零而引入所謂的“防護間隔”來抵消該循環捲積效應的方法。在此,該相位聲碼器處理以該第一子轉換器138-1或該第二子轉換器138-2之該操作開始,例如,該第一子轉換器138-1或該第二子轉換器138-2分別包含具有一轉換長度2N或N的一FFT處理器。
特定地,該第一轉換器104可被實施以執行該填補區塊103之一短時傅立葉轉換(STFT),而該第二轉換器108可被實施以基於該輸出105處之該已調整頻譜表示之該幅度及相位執行一反STFT。
關於第8圖,在已計算出該等新相位且例如執行該反STFT或反離散傅立葉轉換(IDFT)合成之後,該等防護間隔僅僅脫離該時間區塊之該中間部分,此時間區塊在該聲碼器之該重疊相加(OLA)階段中將被進一步處理。可選擇地,該等防護間隔不被移除,但在該OLA階段被進一步處理。此操作還可有效地被看作該信號之一過取樣。
作為根據第8圖之該實施態樣之一結果,在該另一組合器132之該輸出131處獲得頻寬擴展之一受操控信號。隨後,另一定框裝置160可用來以一預定方式調整由“具有高頻(HF)之音訊信號”表示之在該輸出131處之該受操控音訊信號之定框,例如,使得該另一定框裝置160之該輸出161處之音訊樣本之該連續區塊將具有與該初始音訊信號800一樣的視窗長度。
例如,如第8圖之實施例中概述之透過一相位聲碼器處理暫態期間,在此脈絡中利用防護間隔之可能優勢示範性地形象化於第7圖中。面板a)顯示了位於該分析窗中心之該暫態(‘虛線’指示原始信號)。在此情況中,該防護間隔對該處理不具有顯著影響,因為該窗還可容納該已調暫態(‘細實線’表示使用防護間隔,“粗實線”表示不具有防護間隔)。然而,如面板b)中所示,如果該暫態偏離中心(“細虛線”指示原始信號),在該聲碼器處理期間,該暫態將透過該相位操控被時移。如果此平移不能直接由該視窗涵蓋之時間跨度所容納,則循環捲積發生(‘粗實線’表示不具有防護間隔),最終導致該暫態(之多個部分)錯位,從而降低該感知音訊品質。然而,使用防護間隔透過將該等平移部分容納在該防護區(‘細實線’表示利用防護間隔)來防止循環捲積效應。
作為對上述零填補實施態樣之一可選擇方式,具有防護區之視窗(見第9圖)可如上所述地遭使用。在該等視窗具有防護區之情況下,該等視窗之一側或兩側上,該等值大約為零。它們可確切地為零或者在零附近抖動,其具有以下可能優勢:不是將零而是將小值透過相位適應從該防護區移入該視窗。第9圖顯示了兩種類型之視窗。特定地,在第9圖中,該等窗函數901、902之間的差異在於:第9a圖中該窗函數901包含其樣本值準確為零之該等防護區910、920,而第9b圖中該窗函數902包含其樣本值在零附近抖動之該等防護區940、950。因此,在該後一種情況下,替代零值之小值將透過該相位適應自該防護區940或950平移到該視窗之該區域930中。
如上所述,使用防護間隔可能會由於其等效於過取樣而增加計算複雜度,因為分析及合成轉換必須關於具有實質上擴展長度(通常為一因子2)之信號區塊而被計算。一方面,至少對於暫態信號區塊來講,此確保了一改良感知品質,但這些只出現在一平均音樂音訊信號之已選擇區塊中。另一方面,在該整個信號之處理中,處理能力可平穩地提高。
本發明之實施例基於以下事實:過取樣只對某些已選擇信號區塊有利。特定地,該等實施例提供了一種新的信號適應處理方法,其包含一檢測機制且只將過取樣應用於那些確實提高感知品質之信號區塊。而且,透過在該標準處理及先進處理之間適應式切換該信號處理,本發明之脈絡中之該信號處理之效率可大大地提高,從而降低該計算工作量。
為了說明該標準處理及該先進處理之間的差異,將在下面進行一典型諧頻寬擴展(HBE)實施態樣(第13圖)與第8圖之該實施態樣之比較。
第13圖繪示HBE之一概述。在此,多個相位聲碼器階段操作於與該整個系統相同的取樣頻率上。然而,第8圖顯示了只將零填補/過取樣應用到確實有益且產生一提高的感知品質的該信號之那些部分的處理方式。這透過一切換判決來實現,該切換判決較佳地依賴於選擇用於該後續處理之恰當信號路徑的一暫態位置檢測。與第13圖顯示之HBE比較,該暫態位置檢測134(自信號或位元流)、該切換器136及以該零填補器102-3應用之該零填補操作開始且以由該填補去除器118執行之該(可取捨)填補移除結束之右手邊上之該信號路徑已添加在第8圖說明之該等實施例中。
在本發明之一個實施例中,該窗102受組配以產生形成一時間序列之音訊樣本之多數個連續區塊111,該時間序列包含至少一非填補區塊133-2、141-2與一填補區塊103、141-1形成之一第一對145-1及一填補區塊103、141-1及一連續非填補區塊133-2、141-2形成之一第二對145-2(見第12圖)。該第一及該第二對連續區塊145-1、145-2在該頻寬擴展實施態樣之脈絡中遭進一步處理,直到他們相應的整數倍降低取樣音訊樣本分別在該整數倍降低取樣器120之該等輸出147-1、147-2處遭獲得。該等已整數倍降低取樣的音訊樣本147-1、147-2隨後饋入到該重疊相加器124,該重疊相加器124受組配以將該第一對145-1或該第二對145-2之該已整數倍降低取樣音訊樣本147-1、147-2之重疊區塊相加。
可選擇地,該整數倍降低取樣器120還可位於該重疊相加器124之後,如以前相應所述。
接著,對於該第一對145-1來說,分別在該非填補區塊133-2、141-2之一第一樣本151、155與該填補區塊103、141-1之該等音訊信號值之一第一樣本153、157之間與第2圖之該時間距離b相對應之一時間距離b’由該重疊相加器124提供,使得在該重疊相加器124之該輸出149-1處可得到處於該頻寬擴展演算法之該目標頻率範圍中之一信號。
對於該第二對145-2來說,分別在該填補區塊103、141-1之該等音訊信號值之一第一樣本153、157與該非填補區塊133-2、141-2之一第一樣本151、155之間之該時間距離b’由該重疊相加器124提供,使得在該重疊相加器124之該輸出149-2處可得到處於該頻寬擴展演算法之該目標頻率範圍中之一信號。
同樣,在該處理鏈中該整數倍降低取樣器120位於該重疊相加器124之前之情況下,如第2圖所示,應當考慮該整數倍降低取樣可能對與時間距離b’的對應的一影響。
應當指出的是,儘管本發明在其中區塊表示實際或邏輯硬體組件之方塊圖之該脈絡中予以描述,但是本發明還可透過一電腦實施方法遭實施。在後一種情況下,該等區塊表示相應的方法步驟,其中此等步驟代表相應的邏輯或實體硬體區塊執行之功能。
所描述之該等實施例只是為了說明本發明之該等原理。應當理解到,本文描述的之該等安排及細節之改變及變化對於熟於此技者將是明顯的。因此,目的是只受所附申請專利範圍之範圍限制而不受以本文中該等實施例之描述及說明方式表示之該等特定細節限制。視本發明方法之某些實施態樣要求而定,該等發明方法可以以硬體或軟體形式實施。可利用與可程式化電腦系統合作之一數位儲存媒體,特定地其上儲存有電可讀控制信號之一硬碟、一DVD或一CD來執行該實施態樣,使得該等發明方法可遭執行。大體而言,因此本發明可作為具有儲存在一機器可讀載體上之電腦程式碼之一電腦程式產品來實施,當該電腦程式產品運行於一電腦上時,該程式碼被操作用於執行該等發明方法。換句話說,因此,該等發明方法為具有一程式碼之一電腦程式,當該電腦程式運行於一電腦上時該程式碼執行該等發明方法中之至少一個。該發明處理音訊信號可儲存在任何機器可讀儲存媒體上,諸如一數位儲存媒體。
該新處理之優勢在於,在此申請案中描述之該等上述實施例,即裝置、方法或電腦程式,避免了不必要的昂貴、過於複雜的計算過程。其利用一暫態位置檢測,該暫態位置檢測識別包含例如偏離中心暫態事件之時間區塊且切換到先進處理,例如利用防護間隔的過取樣處理,然而這只在那些在感知品質方面產生一提高之情況下進行。
該表示的處理可用於以任何區塊為基礎之音訊處理應用,例如,相位聲碼器或者圍繞聲音應用之參數學(2004年5月音訊工程師協會第116次會議上Herre,J.;Faller,C.;Ertel,C.;Hilpert,J.;Hlzer,A.;Spenger,C所著之“MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio,”),其中時域循環捲積效應造成混疊且同時處理功能是一有限資源。
最重要地申請案為音訊編碼器,其通常實施於一手持式裝置上且從而以一電池供電而操作。
-500、1500...樣本
100...輸入、最初音訊信號
101...輸入、輸出
102...窗
102-1...“定框”裝置、定框裝置
102-2...分析窗裝置
102-3...零填補裝置、零填補器
103...輸出、填補區塊
104...第一轉換器
105...輸出、頻譜值、頻譜表示
106...調相器
107...輸出、已調頻譜表示
108...第二轉換器
109...已調時域音訊信號、輸出
110...分析窗處理器
111...輸出、連續區塊
112...後續填補器
113...帶通信號、頻譜值、輸出端
113-1、113-2、113-3...頻帶之一部分、帶通濾波信號
114...帶通濾波器
115、117、119、121-1、121-2、121-3、123、125、131、135、137-1、137-2、139-1、139-2、143-1、143-2、149-1、149-2、161、811...輸出
116...下游調相器、定標器
118...填補去除器
120...整數倍降低取樣器
121...輸出、信號
122...合成窗
124...下游重疊相加器、重疊相加器
125-1...輸出、目標頻帶、第一輸出、疊加結果
125-2...輸出、目標頻帶、第三輸出、疊加結果
125-3...輸出、目標頻帶、第三輸出、疊加結果
126...組合器
127...輸出、合成信號
128...輸入
129...輸出、已校正信號
130...波封調節器、下游波封調節器
132...另一組合器
133-1...某一區塊
133-2...非填補區塊、連續非填補區塊
134...暫態解碼器、暫態位置檢測
135-1...輸出、時間區塊、連續區塊
135-2...輸出、時間區塊
136...切換器
138-1...第一子轉換器
138-2...第二子轉換器
140...分析窗處理器
141-1...輸出、填補區塊
141-2...輸出、非填補區塊、連續非填補區塊
142...防護窗切換器
145-1...第一對連續區塊
145-2...第二對連續區塊
150...音調校正器
151、153、155、157、708、718、905...第一樣本
160...另一定框裝置
700...暫態、原始信號
702...暫態事件
701、703...循環捲積暫態
704...分析窗、居中的連續區塊
705...部分
706、716、900...樣本長度
707...平移暫態
709...窗函數
710、720、903、915...最後樣本
712、714...防護區、防護間隔、樣本長度
800...區塊、音訊信號
803...已補零區塊
810...位元流
901...第一樣本、標準化韓恩視窗、窗函數
902...窗函數
910...第一防護區、防護區
920...第二防護區、防護區
930...區域
940、950...防護區
a、b’...時間距離
第1圖顯示了用於操控一音訊信號之一實施例之方塊圖;
第2圖顯示了用於利用該音訊信號執行一頻寬擴展之一實施例之方塊圖;
第3圖顯示了利用不同的BWE因子執行一頻寬擴展演算法之一實施例之一方塊圖;
第4圖顯示了利用一暫態檢測器轉換一填補區塊或一非填補區塊之另一實施例之一方塊圖;
第5圖顯示了第4圖之一實施例之一實施態樣之一方塊圖;
第6圖顯示了第4圖之一實施例之另一實施態樣之一方塊圖;
第7a圖顯示了相位調整之前及之後的一示範性信號區塊之圖式,用以說明一相位調整對具有位於一時間區塊之中心的一暫態之一信號波形之影響;
第7b圖顯示了相位調整之前及之後的一示範性信號區塊之圖式,用以說明一相位調整對在一時間區塊之一第一樣本附近具有該暫態的一信號波形之影響;
第8圖顯示了本發明之另一實施態樣之一概述之方塊圖;
第9a圖顯示了呈具有防護區之一韓恩視窗形式的一示範性分析窗函數之圖式,其中該等防護區之特徵在於為常數零,該視窗要用在本發明之一可選擇實施例中;
第9b圖顯示了呈具有防護區之一韓恩視窗形式的一示範性分析窗函數之圖式,其中該等防護區之特徵在於抖動,該視窗要用在本發明之又一可選擇實施例中;
第10圖顯示了一頻寬擴展方案中對一音訊信號之一頻譜帶的一操控之一示意圖;
第11圖顯示了一頻寬擴展方案之脈絡中之一重疊相加操作之示意圖;
第12圖顯示了基於第4圖之一可選擇實施例之一實施態樣的一方塊圖及示意圖;及
第13圖顯示了一典型諧波頻寬擴展(HBE)實施態樣之一方塊圖。
100...輸入、最初音訊信號
101...輸入、輸出
102...窗
103...輸出、填補區塊
104...第一轉換器
105...輸出、頻譜值、頻譜表示
106...調相器
107...輸出、已調頻譜表示
108...第二轉換器
109...已調時域音訊信號、輸出

Claims (19)

  1. 一種用於操控一音訊信號之裝置,其包含:一窗,其用於產生音訊樣本之多數個連續區塊,該多數個連續區塊包含音訊樣本之至少一個填補區塊,該填補區塊具有填補值及音訊信號值;一第一轉換器,其用於將該填補區塊轉換成具有頻譜值之一頻譜表示;一調相器,其用於調整該等頻譜值之相位以獲得一已調頻譜表示;一第二轉換器,其用於將該已調頻譜表示轉換成一已調時域音訊信號;及一暫態檢測器,其用於確定該音訊信號中之一未居中之暫態事件,其中該第一轉換器受組配以在該暫態檢測到該音訊信號中與該填補區塊相對應之一區塊中的該暫態事件時轉換該填補區塊,及其中該第一轉換器受組配以轉換只具有音訊信號值之一非填補區塊,該非填補區塊與該音訊信號之該區塊相對應,這是在該區塊中未檢測到該暫態時。
  2. 如申請專利範圍第1項所述之裝置,其進一步包含:一整數倍降低取樣器,其用於整數倍降低取樣該已調時域音訊信號或已調時域音訊樣本之重疊相加區塊以獲得一已整數倍降低取樣的時域信號,其中一整數倍降低取樣特性依賴於由該調相器應用之一相位調整特 性。
  3. 如申請專利範圍第2項所述之裝置,其適於利用該音訊信號執行一頻寬擴展,其進一步包含:一帶通濾波器,其用於自該頻譜表示或自該音訊信號擷取一帶通信號,其中視該調相器所應用之一相位調整特性而定選擇該帶通濾波器之一帶通特性,藉此該帶通信號透過後續處理被轉換到未包括在該音訊信號中之一目標頻率範圍內。
  4. 如申請專利範圍第2項所述之裝置,其進一步包含:一重疊相加器,其用於將已整數倍降低取樣音訊樣本之重疊區塊或已調時域音訊樣本相加以獲得在一頻寬擴展演算法之一目標頻率範圍中之一信號。
  5. 如申請專利範圍第4項所述之裝置,其進一步包含:一定標器,其用於藉以一因子定標該等頻譜值,其中該因子取決於一重疊相加特性,因為關於由該窗實施之一重疊相加操作的一第一時間距離與由該重疊相加器使用的一不同時間距離之一關係及該窗特性被計入。
  6. 如申請專利範圍第1項所述之裝置,其中該窗包含:一分析窗處理器,其用於產生具有相同大小之多數個連續區塊,及一填補器,其用於填補音訊信號之該多數個連續區塊中之一區塊以獲得該填補區塊,此係藉由在音訊樣本之一連續區塊之一第一樣本之前或音訊樣本之該連續區塊之最後一樣本之後的特定時間位置插入填補值。
  7. 如申請專利範圍第1項所述之裝置,其中該窗受組配以在音訊樣本之一連續區塊中之一第一樣本之前或音訊樣本之該連續區塊之最後一樣本之後的特定時間位置插入填補值,該裝置進一步包含:一填補去除器,其用於移除該已調時域音訊信號之時間位置處之樣本,該等時間位置與該窗應用之該等特定時間位置相對應。
  8. 如申請專利範圍第1項或第2項所述之裝置,其進一步包含:一合成窗,其用於為該已整數倍降低取樣之時域信號或者該已調時域音訊信號加窗,其具有匹配於該窗應用之一分析函數的一合成窗函數。
  9. 如申請專利範圍第1項所述之裝置,其中該窗受組配用於在音訊樣本之一連續區塊之一第一樣本之前或音訊樣本之該連續區塊之最後一樣本之後的特定時間位置插入填補值,其中音訊樣本之該連續區塊中的值之一數目與填補值之一數目之和至少為音訊樣本之該連續區塊中的值之該數目的1.4倍。
  10. 如申請專利範圍第7項所述之裝置,其中該窗受組配用於對稱地在音訊樣本之該連續區塊之該第一樣本之前及音訊樣本之該中間連續區塊之該最後樣本之後插入該等填補值,使得該填補區塊適於由該第一轉換器及該第二轉換器進行轉換。
  11. 如申請專利範圍第1項所述之裝置,其中該窗受組配以 應用一窗函數,該窗函數在該窗函數之開始位置或該窗函數之結束位置具有至少一個防護區。
  12. 如申請專利範圍第1項所述之裝置,該裝置受組配以執行一頻寬擴展演算法,該頻寬擴展演算法包含一頻寬擴展因子(σ),該頻寬擴展因子(σ)控制該音訊信號之一頻帶與一目標頻帶之間的一頻移,其中該調相器受組配以按照該頻寬擴展因子(σ)來定標該音訊信號之該頻帶的頻譜值之相位,使得音訊樣本之一連續區塊之至少一個樣本循環捲積入該區塊。
  13. 如申請專利範圍第2項所述之裝置,該裝置受組配以執行一頻寬擴展演算法,該頻寬擴展演算法包含一頻寬擴展因子(σ),該頻寬擴展因子(σ)控制該音訊信號之一頻帶與一目標頻帶之間的一頻移,其中該第一轉換器、該調相器、該第二轉換器及該整數倍降低取樣器受組配以利用不同的頻寬擴展因子(σ)操作,藉此獲得具有不同目標頻帶之不同已調時間音訊信號,其進一步包含一重疊相加器,該重疊相加器用於基於該等不同頻寬擴展因子(σ)執行一重疊相加操作,及一組合器,其用於組合重疊相加結果以獲得包含該等不同目標頻帶之一組合信號。
  14. 如申請專利範圍第1項所述之裝置,其中該窗包含:一填補器,其用於在音訊樣本之一連續區塊之一第一樣本之前或音訊樣本之該連續區塊之最後一樣本之 後的特定時間位置插入填補值,該裝置進一步包含:由該暫態檢測器控制之一切換器,其中該切換器受組配以控制該填補器使得當一暫態事件由該暫態檢測器檢測到時一填補區塊遭產生,該填補區塊具有填補值與音訊信號值,且該切換器受組配以控制該填補器,使得當該暫態檢測器未檢測到該暫態事件時,一非填補區塊遭產生,該非填補區塊只具有音訊信號值,其中該第一轉換器包含一第一子轉換器及一第二轉換器,其中該切換器進一步受組配以在該暫態事件由該暫態檢測器檢測到時,將該填補區塊饋入該第一子轉換器以執行具有一轉換長度之一轉換,且該切換器受組配以在該暫態檢測器未檢測到該暫態事件時,將該非填補區塊饋入到該第二子轉換器以執行具有比該第一長度短之一第二長度之一轉換。
  15. 如申請專利範圍第1項所述之裝置,其中該窗包含用於將一分析窗函數應用到音訊樣本之一連續區塊的一分析窗處理器,該分析窗處理器是可控的使得該分析窗函數在該窗函數之一開始位置或者該窗函數之一結束位置處包含一防護區,該裝置進一步包含:由該暫態檢測器控制之一防護窗切換器,其中該防護窗切換器受組配以控制該分析窗處理器,藉此透過使用包含該防護區的該分析窗函數,一填補區塊產生於音訊樣本之一連續區塊,當該暫態檢測器檢測到一暫態事 件時,該填補區塊具有填補值與音訊信號值,且該防護窗切換器受組配以控制該分析窗處理器,使得在該暫態檢測器未檢測到該暫態事件時,一非填補區塊產生,該非填補區塊只具有音訊信號值,其中該第一轉換器包含一第一子轉換器及一第二子轉換器,其中該防護窗切換器還受組配以在該暫態檢測器檢測到一暫態事件時將該填補區塊饋入該第一子轉換器以執行具有一第一轉換長度之一轉換,且該防護窗切換器還受組配以在該暫態檢測器未檢測到該暫態事件時將該非填補區塊饋入到該第二子轉換器以執行具有比該第一長度短之一第二長度之一轉換。
  16. 如申請專利範圍第4項或第13項所述之裝置,其進一步包含:一波封調節器,其用於根據已發送參數來調整一目標頻率範圍中之該信號或該組合信號之波封以獲得一已校正信號;及另一組合器,其用於組合該音訊信號及該已校正信號以獲得頻帶擴展之一受操控信號。
  17. 如申請專利範圍第1項所述之裝置,其中該窗受組配以產生音訊樣本之多數個連續區塊,該多數個連續區塊至少包含一非填補區塊與一連續填補區塊形成之一第一對及一填補區塊及一連續非填補區塊形成之一第二對,該裝置進一步包含: 一整數倍降低取樣器,其用於整數倍降低取樣該第一對之該等已調時域音訊樣本或已調時域音訊樣本之重疊相加區塊以獲得該第一對之已整數倍降低取樣音訊樣本或者用於整數倍降低取樣該第二對之該等已調時域音訊樣本或已調時域音訊樣本之重疊相加區塊以獲得該第二對之已整數倍降低取樣音訊樣本,及一重疊相加器,其中該重疊相加器受組配以將該第一對或該第二對之該等已整數倍降低取樣音訊樣本之重疊區塊或已調時域音訊樣本相加,其中對於該第一對而言,該非填補區塊之一第一樣本與該填補區塊之該等音訊信號值之一第一樣本之間之時間距離由該重疊相加器提供,或者其中對於該第二對而言,該填補區塊之該等音訊信號值之一第一樣本與該非填補區塊之一第一樣本之間之一時間距離由該重疊相加器提供,以獲得處於該頻寬擴展演算法之一目標頻率中之一信號。
  18. 一種用於操控一音訊信號之方法,其包含:產生音訊樣本之多數個連續區塊,該多數個連續區塊包含音訊樣本之至少一個填補區塊,該填補區塊具有填補值及音訊信號值;將該填補區塊轉換成具有頻譜值之一頻譜表示;調整該等頻譜值之相位以獲得一已調頻譜表示;將該已調頻譜表示轉換成一已調時域音訊信號;及檢測在該音訊信號中之一暫態事件,其中當該暫態事件被檢測到在與該填補區塊相對 應之一區塊中時轉換該填補區塊,及其中當在該區塊中未檢測到該暫態時,只具有音訊信號值之一非填補區塊被轉換,該非填補區塊與該音訊信號之該區塊相對應。
  19. 一種具有一程式碼之電腦程式,當該電腦程式執行於一電腦上時,該程式碼執行如申請專利範圍第18項所述之該方法。
TW099108888A 2009-03-26 2010-03-25 用以操控音訊信號之裝置與方法 TWI421859B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16360909P 2009-03-26 2009-03-26
EP09013051A EP2234103B1 (en) 2009-03-26 2009-10-15 Device and method for manipulating an audio signal

Publications (2)

Publication Number Publication Date
TW201040943A TW201040943A (en) 2010-11-16
TWI421859B true TWI421859B (zh) 2014-01-01

Family

ID=42027826

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099108888A TWI421859B (zh) 2009-03-26 2010-03-25 用以操控音訊信號之裝置與方法

Country Status (20)

Country Link
US (1) US8837750B2 (zh)
EP (2) EP2234103B1 (zh)
JP (1) JP5328977B2 (zh)
KR (1) KR101462416B1 (zh)
CN (1) CN102365681B (zh)
AR (1) AR075963A1 (zh)
AT (1) ATE526662T1 (zh)
AU (1) AU2010227598A1 (zh)
BR (1) BRPI1006217B1 (zh)
CA (1) CA2755834C (zh)
ES (2) ES2374486T3 (zh)
HK (2) HK1148602A1 (zh)
MX (1) MX2011010017A (zh)
MY (1) MY154667A (zh)
PL (2) PL2234103T3 (zh)
RU (1) RU2523173C2 (zh)
SG (1) SG174531A1 (zh)
TW (1) TWI421859B (zh)
WO (1) WO2010108895A1 (zh)
ZA (1) ZA201106971B (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102648495B (zh) * 2009-10-21 2014-05-28 杜比Ab国际公司 用于利用适应性过取样产生高频音频信号的装置及方法
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
CN103534754B (zh) 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
CN103503062B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
WO2014126688A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
EP2959481B1 (en) 2013-02-20 2017-04-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an encoded audio or image signal or for decoding an encoded audio or image signal in the presence of transients using a multi overlap portion
KR101732059B1 (ko) 2013-05-15 2017-05-04 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
ES2693559T3 (es) 2013-08-23 2018-12-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para procesar una señal de audio mediante una señal de error de aliasing
CN103714824B (zh) * 2013-12-12 2017-06-16 小米科技有限责任公司 一种音频处理方法、装置及终端设备
US20150170655A1 (en) * 2013-12-15 2015-06-18 Qualcomm Incorporated Systems and methods of blind bandwidth extension
CN105096957B (zh) 2014-04-29 2016-09-14 华为技术有限公司 处理信号的方法及设备
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
EP3155828B1 (en) 2014-07-22 2018-11-07 Huawei Technologies Co., Ltd. An apparatus and a method for manipulating an input audio signal
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
JP6668372B2 (ja) * 2015-02-26 2020-03-18 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 目標時間領域エンベロープを用いて処理されたオーディオ信号を得るためにオーディオ信号を処理するための装置および方法
KR102413692B1 (ko) * 2015-07-24 2022-06-27 삼성전자주식회사 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치
JP6564135B2 (ja) * 2015-09-22 2019-08-21 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ信号処理
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
DE102022200660A1 (de) 2022-01-20 2023-07-20 Atlas Elektronik Gmbh Signalverarbeitungsanlage

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
WO2007016107A2 (en) * 2005-08-02 2007-02-08 Dolby Laboratories Licensing Corporation Controlling spatial audio coding parameters as a function of auditory events

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4366349A (en) * 1980-04-28 1982-12-28 Adelman Roger A Generalized signal processing hearing aid
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
DE19736669C1 (de) 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6266003B1 (en) * 1998-08-28 2001-07-24 Sigma Audio Research Limited Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US8019598B2 (en) * 2002-11-15 2011-09-13 Texas Instruments Incorporated Phase locking method for frequency domain time scale modification based on a bark-scale spectral partition
AU2005201813B2 (en) 2005-04-29 2011-03-24 Phonak Ag Sound processing with frequency transposition
US8706496B2 (en) 2007-09-13 2014-04-22 Universitat Pompeu Fabra Audio signal transforming by utilizing a computational cost function
US7729237B2 (en) 2008-03-17 2010-06-01 Lg Electronics Inc. Method of transmitting reference signal and transmitter using the same
JP5691367B2 (ja) * 2009-10-27 2015-04-01 アイシン精機株式会社 トルク変動吸収装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
WO2007016107A2 (en) * 2005-08-02 2007-02-08 Dolby Laboratories Licensing Corporation Controlling spatial audio coding parameters as a function of auditory events

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
C. Faller et al, "Efficient Representation of Spatial Audio Using Perceptual Parametrization," IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, pages W2001-1~W2001-4, 21-24 October 2001. *

Also Published As

Publication number Publication date
AR075963A1 (es) 2011-05-11
PL2234103T3 (pl) 2012-02-29
ATE526662T1 (de) 2011-10-15
WO2010108895A1 (en) 2010-09-30
EP2234103B1 (en) 2011-09-28
HK1166415A1 (zh) 2012-10-26
EP2234103A1 (en) 2010-09-29
CA2755834A1 (en) 2010-09-30
CN102365681B (zh) 2014-07-16
ES2478871T3 (es) 2014-07-23
US8837750B2 (en) 2014-09-16
TW201040943A (en) 2010-11-16
AU2010227598A1 (en) 2011-11-10
BRPI1006217A2 (pt) 2016-11-29
ZA201106971B (en) 2012-07-25
KR20110139294A (ko) 2011-12-28
PL2411976T3 (pl) 2014-10-31
CN102365681A (zh) 2012-02-29
JP5328977B2 (ja) 2013-10-30
RU2011138839A (ru) 2013-04-10
ES2374486T3 (es) 2012-02-17
CA2755834C (en) 2016-03-15
EP2411976A1 (en) 2012-02-01
KR101462416B1 (ko) 2014-11-17
MY154667A (en) 2015-07-15
JP2012521574A (ja) 2012-09-13
US20120076323A1 (en) 2012-03-29
MX2011010017A (es) 2011-10-10
RU2523173C2 (ru) 2014-07-20
HK1148602A1 (en) 2011-09-09
BRPI1006217B1 (pt) 2020-12-22
EP2411976B1 (en) 2014-05-21
SG174531A1 (en) 2011-10-28

Similar Documents

Publication Publication Date Title
TWI421859B (zh) 用以操控音訊信號之裝置與方法
TWI416507B (zh) 用以基於輸入信號表示型態產生擴充頻寬信號之表示型態的裝置及方法和與其相關之音訊解碼器及電腦程式
US10580415B2 (en) Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US10909994B2 (en) Apparatus, method and computer program for generating a representation of a bandwidth-extended signal on the basis of an input signal representation using a combination of a harmonic bandwidth-extension and a non-harmonic bandwidth-extension
TR201816634T4 (tr) Bağımsız gürültü-doldurma kullanarak iyileştirilmiş bir sinyal üretmek için cihaz ve yöntem.
AU2014208306B9 (en) Device and method for manipulating an audio signal