TWI415116B - 用以產生帶寬擴展信號之裝置與方法 - Google Patents

用以產生帶寬擴展信號之裝置與方法 Download PDF

Info

Publication number
TWI415116B
TWI415116B TW098122551A TW98122551A TWI415116B TW I415116 B TWI415116 B TW I415116B TW 098122551 A TW098122551 A TW 098122551A TW 98122551 A TW98122551 A TW 98122551A TW I415116 B TWI415116 B TW I415116B
Authority
TW
Taiwan
Prior art keywords
patch
input signal
frequency band
signal
patching algorithm
Prior art date
Application number
TW098122551A
Other languages
English (en)
Other versions
TW201007708A (en
Inventor
Frederik Nagel
Sascha Disch
Max Neuendorf
Stefan Bayer
Marc Gayer
Markus Lohwasser
Nikolaus Rettelbach
Ulrich Kraemer
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201007708A publication Critical patent/TW201007708A/zh
Application granted granted Critical
Publication of TWI415116B publication Critical patent/TWI415116B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Transmitters (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Description

用以產生帶寬擴展信號之裝置與方法
根據本發明的實施例係關於音訊信號處理,且特別地係關於一種用於從輸入信號產生帶寬擴展信號的裝置與方法、一種用於基於輸入信號與音訊信號提供帶寬減小信號的裝置與方法。
音訊信號的知覺適應性編碼,針對這些信號的有效儲存與傳輸提供實質資料速率減小已在許多領域中獲得了廣泛的接受。許多編碼演算法是已知的,例如MPEG 1/2第3層(“MP3”)或MPEG 4 AAC(高階音訊編碼)。然而,使用此的編碼,特別是當以最低位元率操作時,可導致主觀音訊品質的減小,而這通常主要由將被傳送音訊信號帶寬的編碼器端引起的限制產生。
從WO 98 57436已知的是,在這種情況下使音訊信號在編碼器端遭受一頻帶限制以及透過一高品質音訊編碼器(“核心編碼器”)只編碼音訊信號的較低頻帶。然而,較高頻帶只被非常粗略地特徵化,即透過再現較高頻帶之頻譜包絡的一組參數。在解碼器端,較高頻帶則被合成。為了達到這一目的,諧波轉置被提出,其中經解碼音訊信號的較低頻帶被提供給一濾波器組。較低頻帶的濾波器組通道連接到較高頻帶的濾波器組通道或者遭“修補”,且每一經修補帶通信號遭受包絡調整。屬於一特定分析濾波器組的合成濾波器組接收較低頻帶中之音訊信號的帶通信號及經較低頻帶的經包絡調整帶通信號,該等信號遭調和修補到較高頻帶中。合成濾波器組的輸出信號是相對於其原始帶寬被擴展的音訊信號,該信號透過以一非常低資料速率操作的核心編碼器從編碼器端遭傳送到解碼器端。特別地,濾波器組域中的濾波器組計算與修補可能變成較高的計算工作。
用於帶寬擴展帶限音訊信號的複雜性降低方法替代使用低頻信號部分(LF)到高頻範圍(HF)的複製功能,以近似由頻帶限制產生的資訊丟失。這些方法在下面予以描述:2002年5月在慕尼克召開的第112屆AES會議(112th AES convention,Munich)通過的M.Dietz,L.Liljeryd,K.Kjrling及O.Kunz的“Spectral Band Replication,a novel approach in audio coding”;2002年5月在慕尼克召開的第112屆AES會議通過的S.Meltzer,R.Bhm及F.Henn的“SBR enhanced audio codecs for digital broadcasting such as“Digital Radio Mondiale”(DRM)”;2002年5月在慕尼克召開的第112屆AES會議通過的T.Ziegler,A.Ehret,P.Ekstrand及M.Lutzky的“Enhancing mp3 with SBR:Features and Capabilities of the new mp3PRO Algorithm”;國際標準ISO/IEC 14496-3:2001/FPDAM 1、“Bandwidth Extension”,ISO/IEC 2002或Vasu Iyengar等人的美國專利Nr.5,455,888“Speech bandwidth extension method and apparatus”。
在這些方法中,沒有諧波轉置被執行,但是較低頻帶的連續帶通信號被引入到較高頻帶的連續濾波器組通道中。透過這一點,音訊信號之較高頻帶的粗略近似被實現。在另一步驟中,透過使用從原始信號獲得之控制資訊的後處理,信號的這一粗略近似與原始相似。在這裡,例如縮放因數用於調適頻譜包絡、反向濾波、及雜訊基準的增加,該雜訊基準用於調適音調及丟失諧波之正弦信號部分的增補,這也在MPEG-4高效高階音訊編碼(Efficiency Advanced Audio Coding)(HE-AAC)標準中予以描述。
除此之外,另外的方法使用用於帶寬擴展的一相位聲碼器。當施加用於頻譜擴展的該相位聲碼器時,頻率線進一步彼此遠離移動。若例如透過量化使頻譜中存在間隙,則透過擴展甚至同樣會增加間隙。在能量調適中,與原始信號中的各自的線相比較,頻譜中的剩餘線接收太多的能量。
第13圖顯示使用一相位聲碼器之帶寬擴展1300的一概要繪示。在這個例子中,兩個補丁1312、1314被加入到一信號的低頻帶1302中。也被稱為分頻器(Xover)頻率的該信號的上截止頻率1320(交越頻率)是鄰近補丁1312的低端頻率,而分頻器頻率的兩倍是鄰近補丁1312的上截止頻率及下一補丁1314的下截止頻率。相位聲碼器使信號的低頻帶1302中的頻率線的頻率加倍,以獲得鄰近補丁1312,使信號的低頻帶1302中的頻率線的頻率增至三倍,以獲得下一補丁1314。因此,鄰近補丁1312的頻譜密度只是信號的低頻帶1302之頻譜密度的一半,而下一補丁1314的頻譜密度只是信號的低頻帶1302之頻譜密度的三分之一。
透過使頻帶(補丁)中的能量只集中到少數幾條頻率線,音色中的實質改變導致其不同於原始的。以前較多頻帶(頻率線)中的能量被加和成較少的剩餘的一些。
相位聲碼器的一些例子及其應用在下面提出:ICASSP,09的“Frederik Nagel and Sascha Disch,A Harmonic Bandwidth Extension Method for Audio Codecs”與M.Puckette,"Phase-locked Vocoder,"IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics,Mohonk 1995、Rbel,A.:Transient detection and preservation in the phase vocoder;citeseer.ist.psu.edu/679246.html、Laroche L.,Dolson M.:Improved phase vocoder timescale modification of audio,IEEE Trans.Speech and Audio Processing,第7卷,第3號,第323-332頁及美國專利6549884。
一種用於填充間隙的方法在WO 00/45379中顯示。其包含一種用於使用高頻重建來增強信號源編碼系統的方法與裝置。該應用旨在透過適應性雜訊基準相加來解決所重建高頻帶中的不充足雜訊成分的問題。加入雜訊可填充間隙,但是音訊品質或主觀品質可能不被充分地增加。
本發明的目的是提供音訊信號帶寬擴展的概念,這增加了帶寬擴展信號的主觀品質。
這一目的透過如申請專利範圍第1項及第11項所述之裝置、如申請專利範圍第14項所述之音訊信號及如申請專利範圍第15項及第16項所述之方法得以解決。
本發明的一實施例提供一種用於從輸入信號產生帶寬擴展信號的裝置。該輸入信號的第一頻帶由第一解析度資料表示,第二頻帶由第二解析度資料表示,該第二解析度低於該第一解析度。該裝置包含一補丁產生器及一組合器。該補丁產生器受組配以根據第一修補演算法從輸入信號的第一頻帶產生第一補丁,及受組配以根據第二修補演算法從輸入信號的第一頻帶產生第二補丁。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。該組合器受組配以組合該第一補丁、該第二補丁與輸入信號的第一頻帶,以獲得帶寬擴展信號。用於產生帶寬擴展信號的裝置受組配以根據第一修補演算法及根據第二修補演算法縮放輸入信號或縮放第一補丁及第二補丁,藉此帶寬擴展信號滿足一頻譜包絡準則。
根據本發明的實施例係基於具有低頻譜密度的補丁(這意味著,例如與輸入信號的低頻帶相比較,該補丁包含間隙)與具有高頻譜密度的補丁(這意味著,例如與輸入信號的低頻帶相比較,該補丁只包含較少或不包含間隙)組合,以擴展輸入信號之頻帶的中心思想。因為兩個補丁係基於輸入信號產生,輸入信號之低頻帶的高頻率帶寬擴展可能提供原始音訊信號的良好近似。此外,第一與第二補丁可在產生之前或之後遭縮放(透過縮放輸入信號),以滿足一頻譜包絡準則,因為原始音訊信號的頻譜包絡應被認為用於重建輸入信號的高頻帶。以此方式,帶寬擴展信號的主觀品質或音訊品質可能被顯著地增加。
在根據本發明的一些實施例中,第一修補演算法是諧波修補演算法。換言之,第一補丁被產生,藉此只是輸入信號之第一頻帶中之頻率的整數倍的頻率被包含在第一補丁中。此外,第二修補演算法可能是一混合修補演算法。這意味著例如第二補丁可被產生,藉此第二補丁包含是輸入信號之第一頻帶中之頻率的整數倍的頻率以及不是輸入信號之第一頻帶中之頻率的整數倍的頻率。因此,第二補丁的頻譜密度較第一補丁的頻譜密度高。透過組合第一補丁與第二補丁,第一補丁的丟失頻率線可由第二補丁的頻率線填充。以此方式,根據第一修補演算法之諧波帶寬擴展中的間隙可由第二補丁填充,且帶寬擴展信號的音訊品質可被顯著地提高。
根據本發明的一些實施例與一種基於一輸入信號提供一帶寬減小信號的裝置有關。該裝置包含一頻譜包絡資料決定器、一補丁縮放控制資料產生器、及一輸出介面。該頻譜包絡資料決定器受組配以基於輸入信號的高頻帶決定頻譜包絡資料。該補丁縮放控制資料產生器受組配以產生補丁縮放控制資料,該補丁縮放控制資料用於在解碼器端縮放帶寬減小信號或者用於透過解碼器縮放第一補丁及第二補丁,藉此由該解碼器產生的帶寬擴展信號滿足一頻譜包絡準則。該頻譜包絡準則係基於頻譜包絡資料。第一補丁根據第一修補演算法從帶寬減小信號的低頻帶產生,及第二補丁根據第二修補演算法從帶寬減小信號的低頻帶產生。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。輸出介面受組配以組合輸入信號的低頻帶、頻譜包絡資料、及補丁縮放控制資料,以獲得帶寬減小信號。再者,輸出介面受組配以提供帶寬減小信號用於傳輸或儲存。
根據本發明的另外的實施例與包含第一頻帶及第二頻帶的一音訊信號有關。第一頻帶由第一解析度資料表示,第二頻帶由第二解析度資料表示。第二解析度低於第一解析度。第二解析度資料係基於第二頻帶的頻譜包絡資料及第二頻帶的補丁縮放控制資料,該補丁縮放控制資料用於在解碼器端縮放音訊信號或透過解碼器縮放第一補丁及第二補丁,藉此由該解碼器產生的帶寬擴展信號滿足一頻譜包絡準則。該頻譜包絡準則係基於頻譜包絡資料。第一補丁根據第一修補演算法從音訊信號的第一頻帶產生,及第二補丁根據第二修補演算法從音訊信號的第一頻帶產生。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。
圖式簡單說明
根據本發明的實施例隨後將參考所附圖式詳細說明,其中:第1圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第2a圖是一所產生第一補丁的概要繪示;第2b圖是一所產生第一及第二補丁的概要繪示;第3a圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第3b圖是一剪輯正弦輸入信號的概要繪示;第3c圖是一經半波整流正弦輸入信號的概要繪示;第3d圖是一經全波整流正弦輸入信號的概要繪示;第4圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第5a圖是一相位聲碼器之濾波器組實施態樣的概要繪示;第5b圖是第5a圖中之濾波器的詳細繪示;第5c圖是用於處理在第5a圖之一濾波器通道中的振幅信號與頻率信號的概要繪示;第6圖是一相位聲碼器之轉換實施態樣的概要繪示;第7圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第8圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第9圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第10圖是用於基於輸入信號提供帶寬減小信號之一裝置的方塊圖;第11圖是一種用於從輸入信號產生帶寬擴展信號之方法的流程圖;第12圖是一種用於基於輸入信號提供帶寬減小信號之方法的流程圖;以及第13圖是一已知帶寬擴展演算法的概要繪示。
在下文中,相同的參考數字被部分地用於具有相同或類似功能特性的物件及功能單元,且其關於圖式的描述也將應用到其他圖式,以減小實施例描述的冗餘。
第1圖顯示根據本發明之一實施例的用於從一輸入信號102產生一帶寬擴展信號122之一裝置100的方塊圖。輸入信號102的第一頻帶由第一解析度資料表示,及第二頻帶由第二解析度資料表示,該第二解析度低於該第一解析度。該裝置100包含連接到一組合器120的一補丁產生器110。該補丁產生器120受組配以根據第一修補演算法從輸入信號102的第一頻帶產生第一補丁112,及根據第二修補演算法從輸入信號102的第一頻帶產生第二補丁114。根據第二修補演算法產生的第二補丁114的頻譜密度較根據第一修補演算法產生的第一補丁112的頻譜密度高。該組合器120組合該第一補丁112、該第二補丁114及輸入信號102的第一頻帶,以獲得帶寬擴展信號122。再者,用於產生帶寬擴展信號122的裝置100根據第一修補演算法及根據第二修補演算法縮放輸入信號102或縮放第一補丁112及第二補丁114,藉此帶寬擴展信號122滿足一頻譜包絡準則。
頻譜密度的意思是例如一頻帶中的不同頻率或頻率線的密度。例如,從0Hz到達10kHz的一頻帶(包含具有頻率4kHz及8kHz之頻率部分)較包含具有頻率2kHz、4kHz、6kHz、8kHz及10kHz之頻率部分的相同頻帶具有一較低頻譜密度。因為第一補丁112的頻譜密度較第二補丁114的頻譜密度低,與第二補丁114相比較,第一補丁112包含間隙。因此,第二補丁114可用來填充這些間隙。因為兩個補丁係基於輸入信號102的第一頻帶,兩個補丁都與相對應於輸入信號102之原始信號的特性有關。因此,帶寬擴展信號122可能是原始信號的良好近似,且帶寬擴展信號122的主觀品質或音訊品質可透過使用所描述的概念被顯著地提高。以此方式,較多的能量可分佈在剩餘的線之間,且例如不自然聲音可被避免。
例如,第一修補演算法可能是一諧波修補演算法。因此,補丁產生器110可產生第一補丁112,該第一補丁112只包含是輸入信號102之第一頻帶中的頻率的整數倍的頻率。諧波帶寬擴展可提供原始信號之音調結構的良好近似,但是這一修補演算法將把間隙留在諧波頻率之間。這些間隙可由第二補丁填充。例如,第二修補演算法可能是一混合修補演算法,這意味著補丁產生器110可產生第二補丁114,該第二補丁114包含是輸入信號102之第一頻帶中的頻率的整數倍的頻率(諧波頻率)及不是輸入信號102之第一頻帶中的頻率的整數倍的頻率(非諧波頻率)。非諧波頻率可用於填充第一補丁112中的間隙。組合整個第二補丁114(包括諧波頻率)與第一補丁112也是可能的。在這個例子中,由於組合第一補丁112與第二補丁114的諧波頻率部分產生的諧波頻率的放大可透過合適地縮放第一補丁112及/或第二補丁114予以考慮。
第一補丁112及第二補丁114包含至少部分相同的頻率範圍。例如,第一補丁112包含從4kHz到達8kHz的一頻帶,及第二補丁114包含從6kHz到達10kHz的一頻帶。在根據本發明的一些實施例中,第一補丁之頻率的一下截止等於第二補丁之頻率的一下截止,且第一補丁112之頻率的一上截止等於第二補丁114之頻率的一上截止。例如,兩個補丁都包含從4kHz到達8kHz的一頻帶。
第2a圖及第2b圖顯示根據第一修補演算法212的第一補丁112及根據第二修補演算法214的第二補丁114。為了較佳繪示,第2a圖只顯示第一補丁112,及第2b圖顯示第一補丁112及相對應的第二補丁114。第2a圖繪示輸入信號102之第一頻帶202及根據第一修補演算法212產生的兩個第一補丁112的例子200。在這個例子中,補丁包含與輸入信號102的第一頻帶202相同的帶寬。帶寬也可以是不同的。輸入信號102之第一頻帶202的上截止頻率220由“Xover”頻率(交越頻率)表示。在第2a圖中所示的例子中,補丁在等於交越頻率Xover 220的多倍的一頻率處開始。第一補丁112中的頻率線是輸入信號102之第一頻帶202中的頻率線的整數倍,且可例如由一相位聲碼器產生。與輸入信號102的第一頻帶202相比較,這些第一補丁112包含關於丟失頻率線的間隙。
第2b圖額外地顯示兩個相對應第二補丁114的例子250。這些補丁根據第二修補演算法214產生,且包含諧波及非諧波頻率。非諧波頻率線可用來填充第一補丁112中的間隙。第二補丁114中的頻率線可例如由非線性失真產生。
以此方式,間隙可能不能被任意地填充,例如用雜訊填充間隙。間隙可基於輸入信號之第一頻帶中的第一解析度資料,從而基於原始信號來填充。
輸入信號102的第一頻帶可代表,例如在高解析度下編碼之原始音訊信號的低頻帶。輸入信號102的第二頻帶可代表,例如原始音訊信號的高頻帶,且可在低解析度下透過例如頻譜包絡資料、雜訊資料及/或丟失諧波資料的一個或多個參數來量化。原始音訊信號可以是例如一音訊信號,該音訊信號在處理或編碼之前由麥克風記錄。
根據第一修補演算法及根據第二修補演算法縮放輸入信號意味著,例如輸入信號在第一補丁被產生之前根據第一修補演算法被縮放一次,然後該第一修補基於該所縮放的輸入信號產生,以及輸入信號在第二補丁被產生之前根據第二修補演算法被縮放一次,然後該第二補丁基於該所縮放的輸入信號產生,藉此在組合第一補丁、第二補丁與輸入信號的第一頻帶之後,帶寬擴展信號滿足一頻譜包絡準則。可選擇性地,第一補丁與第二補丁在其產生以後遭縮放,藉此帶寬擴展信號也滿足一頻譜包絡準則。同樣地與第一補丁及第二補丁的縮放相組合,根據第一修補演算法及根據第二修補演算法縮放輸入信號是可能的。
組合器120可以是例如一加法器,且帶寬擴展信號122可能是第一補丁112、第二補丁114與輸入信號102之第一頻帶的加權和。
滿足頻譜包絡準則意味著例如帶寬擴展信號的頻譜包絡係基於輸入信號所包含的頻譜包絡資料。頻譜包絡資料可由一編碼器產生且可代表原始信號的第二頻帶。以此方式,帶寬擴展信號的頻譜包絡可能是原始信號之頻譜包絡的良好近似。
裝置100也可包含用於解碼輸入信號102之第一頻帶的一核心解碼器。
補丁產生器110與組合器120可以是例如專門設計硬體或一處理器或微控制器的一部分,或可以是受組配以在一電腦或微控制器上執行的電腦程式。裝置100可以是一解碼器或音訊解碼器的一部分。
第3a圖顯示根據本發明之一實施例的用於從一輸入信號102產生一帶寬擴展信號122之一裝置300的方塊圖。在這個例子中,補丁產生器110包含用於產生第一補丁112的一相位聲碼器310及用於產生第二補丁114的一振幅剪輯器320。相位聲碼器310與振幅剪輯器320連接到組合器120。相位聲碼器310可擴展輸入音訊信號102的第一頻帶,以產生包含諧波頻率的第一補丁112。在一非線性處理步驟中,振幅剪輯器320可剪輯輸入信號102,以產生包含諧波與非諧波頻率的第二補丁114。作為振幅剪輯器320的替代,同樣地用在特性曲線之二次區域中的半波整流器、全波整流器、混合器或二極體可用來基於輸入信號102由一非線性處理步驟產生非諧波頻率。
第3b圖、第3c圖及第3d圖顯示用以產生非諧波頻率的經剪輯及/或經整流輸入信號102的例子。第3b圖顯示一經剪輯正弦輸入信號102的概要繪示350。透過剪輯信號,以信號斜率380之突變形式的不連續點被產生,且具有較高頻率的諧波與非諧波部分被產生。
可選擇性地,第3c圖顯示也產生不連續點380之一經半波整流正弦輸入信號102的概要繪示360。
再者,剪輯與整流的組合是可能的。第3d圖顯示產生不同不連續點380之一經剪輯及全波整流正弦輸入信號102的概要繪示370。
透過剪輯及/或整流或施加產生不連續點380之非線性處理的其他方法,具有不同頻率的一寬頻譜可被產生。因此,根據這種修補演算法產生的補丁可包含一高頻譜密度。
第4圖顯示根據本發明之一實施例的用於從一輸入信號102產生一帶寬擴展信號122之一裝置400的方塊圖。該裝置400類似於在第3a圖中所示的裝置,但是額外地包含一頻譜線選擇器410。相位聲碼器310與振幅剪輯器320連接到頻譜線選擇器410,而該頻譜線選擇器410連接到組合器120。頻譜線選擇器410可選擇第二補丁114中的多個頻率線,以獲得可與第一補丁互補的一經修改第二補丁414。若第一補丁112中的相對應頻率線丟失,則第二補丁114中的頻率線可被選擇。換言之,頻譜線選擇器410選擇第二補丁114中的頻率線,用於填充第一補丁112中的間隙,且可忽視已包含在第一補丁112中的第二補丁114中的頻率。以此方式,經修改第二補丁414在已包含在第一補丁112中的頻率處可包含間隙。
在這個例子中,組合器120包含第一補丁112、經修改第二補丁414及輸入信號102的第一頻帶。
頻譜線選擇器410可以是例如補丁產生器110的一部分(如在第4圖中所示)或一獨立單元。
在下文中,參考第5圖及第6圖,根據本發明的相位聲碼器310之可能的實施態樣被繪示。第5a圖顯示一相位聲碼器的濾波器組實施態樣,其中一音訊信號被饋給一輸入端500且在一輸出端510被獲得。特別地,在第5a圖中所繪示的概要濾波器組中的每一通道包括一帶通濾波器501及一下游振盪器502。來自每一通道的所有振盪器的輸出信號透過一組合器來組合,該組合器被實施為例如一加法器且在503處予以指示,以獲得輸出信號。每一濾波器501被實施,藉此其一方面提供一振幅信號,另一方面提供一頻率信號。該振幅信號與該頻率信號是說明濾波器501中的振幅隨著時間的逝去之發展的時間信號,而頻率信號代表透過濾波器501濾波的信號的頻率之發展。
濾波器501的概要設置在第5b圖中予以繪示。第5a圖中的每一濾波器501可如在第5b圖中那樣設置,然而,其中只是被提供給兩個輸入混合器551及加法器552的頻率fi 從通道到通道是不同的。混合器551的混合器兩個輸出信號都被低通濾波器553濾波,其中低通信號是不同的,因為它們由相位偏離90°的本地振盪器頻率(LO頻率)產生。較高低通濾波器553提供一正交信號554,而較低濾波器553提供一同相信號555。這兩個信號(即Q及I)被提供給從直角表示產生幅度相位表示的一座標轉換器556。第5a圖中的幅度信號或振幅信號隨著時間的逝去分別在輸出端557被輸出。相位信號被提供給一相位解開器(unwrapper)558。在元件558的輸出端,不再存在通常在0與360°之間的相位值,而存在線性增加的相位值。這一“所解開的”相位值被提供給一相位/頻率轉換器559,該相位/頻率轉換器559可被實施為例如一簡單相位差計算器,該相位差計算器從在一目前時間點的相位減去一先前時間點的相位,以獲得目前時間點的頻率值,或用於獲得相位變異量之近似的任何其他裝置。這一頻率值被加到濾波器通道i中的恆定頻率值fi ,以在輸出端560獲得一時變頻率。在輸出端560處的頻率值具有一直流分量=fi 及一交流分量=濾波器通道中之信號的目前頻率脫離平均頻率fi 的頻率偏移。
因此,如在第5a圖及第5b圖中所繪示的,相位聲碼器實現頻譜資訊與時間資訊的分離。頻譜資訊被包含在特定通道或頻率fi 中,其提供每一通道之頻率的直流部分,而時間資訊分別被包含在頻率偏移或隨著時間的逝之幅度演化中。
第5c圖顯示根據本發明的一處理,該處理被執行用於產生,特別地使用相位聲碼器310來產生第一補丁,且較詳細地被插入在第5a圖中所繪示電路的虛線位置。
對於時間縮放而言,例如每一通道中的振幅信號A(t)或每一通道中之信號f(t)的頻率可被降頻或內插。為了達到轉置目的,因為其對本發明有用,一內插(及信號A(t)與f(t)的時間延伸或擴展)被執行,以獲得擴展信號A'(t)及f'(t),其中該內插受擴展因數598控制。例如,該擴展因數可被選擇,藉此相位聲碼器產生諧波頻率。透過相位變化的內插,即透過加法器552加入恆定頻率之前的值,第5a圖中的每個振盪器502的頻率沒有被改變。然而,總音訊信號的時間改變被減慢,即透過因數2。結果是具有原始補丁的一時間擴展音調,即具有其諧波的原始基本波。
透過執行在第5c圖中所繪示的信號處理,音訊信號可被縮小回到其原始期間,例如透過以一因數2的降頻,而所有頻率同時被加倍。這導致一因數2補丁轉置,然而,其中一音訊信號被獲得,該音訊信號與原始音訊信號具有相同的長度(即相同的樣本數目)。
作為在第5a圖中所繪示濾波器組實施態樣的替代,一相位聲碼器的轉換實施態樣也可如在第6圖中所描述那樣使用。在這裡,音訊信號698被饋給一FFT處理器,或較一般地,一短時傅利葉轉換(STFT)處理器600中作為一時間樣本序列。FFT處理器600被實施,以執行音訊信號的時間視窗化,用以而後透過後續的FFT計算幅度頻譜以及相位頻譜兩者,其中這一計算針對連續頻譜予以執行,該連續頻譜與強重疊的音訊信號區塊有關。
在一極端情況下,針對每一新音訊信號樣本,一新頻譜可被計算,其中一新頻譜也可只針對每一個第二十個新樣本來計算。在兩個頻譜之間的樣本的距離‘a’較佳地由控制器602給出。控制器602進一步被實施,以饋給一IFFT處理器604,該IFFT處理器604被實施以在一重疊-相加操作中操作。特別地,IFFT處理器604被實施,藉此其基於一幅度頻譜與一相位頻譜透過每一頻譜執行一個IFFT來執行一短時傅立葉反轉換,用以而後執行一重疊相加操作,以獲得產生的時間信號。重疊相加操作受組配以消除由分析視窗引起的區塊效應時間信號的時間擴展透過在被IFFT處理器604處理時兩個頻譜之間的距離‘b’大於用於產生FFT頻譜的頻譜之間的距離‘a’來實現。基本思想是透過較分析FFT只被進一步隔開的反FFT來擴展音訊信號。因此,所合成音訊信號中的頻譜改變較原始音訊信號中的較緩慢地發生。
然而,若在方塊606中沒有相位重新縮放,這將導致頻率人工因素。例如當其中45°的連續相位值被實施的一單頻窗被考慮時,這意味著這一濾波器組中的信號的相位以1/8週期之一速率增加,及按每一時間區間45°,其中這裡的時間區間是連續FFT之間的時間區間。若現在該反FFT彼此被較遠地隔開,這意味著45°的相位增加橫跨一較長時間區間發生。這意味著這一信號部分的頻率偶然地被修改。為了消除這種人工因素,相位被完全相同的因數重新縮放,其中音訊信號透過該因數在時間上被擴展。每一FFT頻譜值的相位因此以因數b/a被增加,藉此偶然頻率修改被消除。
儘管在第5c圖中所繪示的實施例中,對於在第5a圖之濾波器組實施態樣中的一個信號振盪器而言,擴展透過振幅/頻率控制信號的內插被實現,但是第6圖中的擴展透過大於兩個FFT頻譜之間之距離的兩個IFFT頻譜之間的距離(即‘b’大於‘a’)來實現,然而,其中為了預防人工因素,相位重新縮放根據比例‘b/a’被執行。例如距離‘b’可被選擇,藉此相位聲碼器產生諧波頻率。
第7圖顯示根據本發明之一實施例的用於從一輸入信號102產生帶寬擴展信號122之一裝置700的方塊圖。該裝置700類似於在第1圖中所示的裝置,但是包含一功率控制器710、第一功率調整裝置720及第二功率調整裝置730。功率控制器710連接到第一功率調整裝置720及第二功率調整裝置730。第一功率調整裝置720與第二功率調整裝置730連接到補丁產生器110。功率控制器710可基於輸入信號所包含的頻譜包絡資料及基於輸入信號所包含的補丁縮放控制資料控制根據第一與第二修補演算法之輸入信號的縮放。可選擇性地,不是輸入信號中所包含的補丁縮放控制資料,而是至少一個所儲存的補丁縮放控制參數可被使用。補丁縮放控制參數可被補丁縮放控制參數記憶體儲存,該補丁縮放控制參數記憶體可以是功率控制器710的一部分或一獨立單元。第一功率調整裝置720可根據第一修補演算法縮放輸入信號102,而第二功率調整裝置730可根據第二修補演算法縮放輸入信號102。換言之,輸入信號102可被預處理,藉此第一與第二補丁可被產生,藉此帶寬擴展信號滿足頻譜包絡準則。為此,頻譜包絡資料可定義帶寬擴展信號122的頻譜包絡,且補丁縮放控制資料或補丁縮放控制參數可設定第一補丁112與第二補丁114之間的比例,或可設定第一補丁112及/或第二補丁114的絕對值。如在第7圖中所示,第一功率調整裝置720與第二功率調整裝置730可以是功率控制器710的一部分或者獨立單元。亦如在第7圖中所示,功率控制器710可以是補丁產生器110的一部分或者一獨立單元。功率調整裝置720、730可以是例如受功率控制器710控制的放大器或濾波器。
可選擇性地,縮放在補丁產生以後被完成。合適地,第8圖顯示根據本發明之一實施例的用於從一輸入信號102產生一帶寬擴展信號122之一裝置800的方塊圖。該裝置800類似於在第7圖中所示的裝置,但是功率調整裝置720、730遭配置在補丁產生器110與組合器120之間。在這個例子中,補丁產生器110連接到第一功率調整裝置720及連接到第二功率調整裝置730。第一功率調整裝置720與第二功率調整裝置730連接到組合器120。以此方式,第一補丁112可根據第一修補演算法透過第一功率調整裝置720來縮放,而第二補丁114可根據第二修補演算法透過第二功率調整裝置730來縮放。該等功率調整裝置基於如前所述的頻譜包絡資料及補丁縮放控制資料或補丁縮放控制參數再次受功率控制器710控制。
可選擇性地,同樣地只縮放或功率調整兩個補丁中的一個,接著在組合所組合補丁與輸入信號102之第一頻帶之前透過組合器120組合補丁及縮放所組合補丁是可能的。換言之,第一個補丁可被縮放,以在兩個補丁之間實現一預定義比例(例如基於補丁縮放控制資料),然後所組合補丁被縮放(例如基於頻譜包絡資料),以滿足頻譜包絡準則。
補丁縮放控制資料可包含例如用於功率分佈縮放的一簡單因數或多個參數。補丁縮放控制資料可指示例如在全部第二頻帶或全部高頻帶上的第一補丁與第二補丁之間的功率比或在全部第二頻帶或全部高頻帶上的第一補丁及/或第二補丁之功率的絕對值且可由至少一個參數表示。可選擇性地,針對一起構成第二頻帶或高頻帶之多個子頻帶中的每一子頻帶,補丁縮放資料包含一因數,例如類似於頻譜帶寬複製應用中的每一子頻帶的頻譜包絡資料。可選擇性地,補丁縮放資料也可指示濾波器的轉換函數。例如,用於縮放第一補丁的濾波器之轉換函數中的參數及/或用於縮放第二補丁的濾波器之轉換函數中的參數可包含在輸入信號中。以此方式,參數可代表一頻率函數。另一備選可以是代表第一補丁與第二補丁之微分函數的補丁縮放控制參數。根據這個實施例,輸入信號的縮放或第一補丁與第二補丁的縮放可基於包含至少一個參數的補丁縮放控制資料。
第9圖顯示根據本發明之一實施例的用於從一輸入信號102產生帶寬擴展信號122之一裝置900的方塊圖。該裝置900類似於在第8圖中所示的裝置,但是額外地包含一雜訊加法器910、一丟失諧波加法器920、一雜訊功率調整裝置940及一丟失諧波功率調整裝置950。雜訊加法器910連接到雜訊功率調整裝置940,雜訊功率調整裝置940連接到組合器120。丟失諧波加法器920連接到丟失諧波功率調整裝置950,丟失諧波功率調整裝置950連接到組合器120。再者,功率控制器710連接到雜訊功率調整裝置940及丟失諧波功率調整裝置950。雜訊加法器910可基於輸入信號102所包含的雜訊資料產生一雜訊補丁912。
雜訊補丁912可透過雜訊功率調整裝置940來縮放。功率控制器710可基於輸入信號102所包含的頻譜包絡資料及/或雜訊縮放資料控制雜訊功率調整裝置940。以此方式,原始信號的雜訊可被近似,以提高帶寬擴展信號的音訊品質。
丟失諧波加法器920可基於輸入信號所包含的丟失諧波資料產生一丟失諧波補丁922。該丟失諧波補丁922可包含諧波頻率,該等諧波頻率可只在原始信號的高頻帶中發生,因此若只是關於輸入信號102之第一頻帶之原始信號之低頻帶的資訊是可得的,不能被再現。丟失諧波資料可提供有關這些丟失諧波的資訊。丟失諧波補丁922可透過丟失諧波功率調整裝置950來縮放。功率控制器710可基於頻譜包絡資料或基於輸入信號102所包含的丟失諧波縮放資料控制丟失諧波功率調整裝置950。
組合器120可組合第一補丁112、第二補丁114、輸入信號102的第一頻帶、雜訊補丁912及丟失諧波補丁922,以獲得帶寬擴展信號122。功率控制器710與功率調整裝置組合可基於頻譜包絡資料縮放第一補丁112、第二補丁114、雜訊補丁912及丟失諧波補丁922,藉此頻譜包絡準則被滿足。
第10圖顯示根據本發明之一實施例的用於基於一輸入信號1002提供一帶寬減小信號1032之一裝置1000的方塊圖。該裝置1000包含一頻譜包絡資料決定器1010、一補丁縮放控制資料產生器1020及一輸出介面1030。頻譜包絡資料決定器1010與補丁縮放控制資料產生器1020連接到輸出介面1030。頻譜包絡資料決定器1010可基於輸入信號1002的一高頻帶決定頻譜包絡資料1012。補丁縮放控制資料產生器1020可產生補丁縮放控制資料1022,該補丁縮放控制資料1022用於在解碼器端縮放帶寬減小信號1032或用於透過解碼器縮放第一補丁及第二補丁,藉此由該解碼器產生的帶寬擴展信號滿足一頻譜包絡準則。該頻譜包絡準則係基於頻譜包絡資料。第一補丁根據第一修補演算法從帶寬減小信號1032的第一頻帶產生,而第二補丁根據第二修補演算法從帶寬減小信號1032的第一頻帶產生。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。輸出介面1030組合輸入信號1002的一低頻帶、頻譜包絡資料1012及補丁縮放控制資料1022,以獲得帶寬減小信號1032。再者,輸出介面1030提供帶寬減小信號1032用於傳輸或儲存。
裝置1000也可能包含用於編碼輸入信號之低頻帶的一核心編碼器。該核心編碼器可以是例如一差動編碼器、一熵編碼器或一知覺音訊編碼器。
裝置1000可以是受組配以為一上述解碼器提供信號之一編碼器的一部分。補丁縮放控制資料1022可包含例如用於功率分佈縮放的一簡單因數或多個參數。補丁縮放控制資料可指示例如在全部高頻帶上的第一補丁與第二補丁之間的一功率比或在全部高頻帶上的第一補丁及/或第二補丁之功率的絕對值且可由至少一個參數表示。可選擇性地,補丁縮放資料包含針對一起構成該高頻帶之多個子頻帶中的每一子頻帶所決定的一因數,例如類似於頻譜帶寬複製應用中的每一子頻帶的頻譜包絡資料。可選擇性地,補丁縮放資料也可指示濾波器的轉換函數。例如,用於縮放第一補丁的濾波器之轉換函數中的參數及/或用於縮放第二補丁的濾波器之轉換函數中的參數可被決定,用於產生補丁縮放控制資料。以此方式,參數可基於一頻率函數產生。另一備選可以是產生代表第一補丁與第二補丁之微分函數的補丁縮放控制參數。
補丁縮放控制資料1022可透過分析輸入信號1002及基於對輸入信號1002的分析選擇儲存在一補丁縮放控制參數記憶體中的補丁縮放控制參數來產生,以獲得補丁縮放控制資料1022。
可選擇性地,補丁縮放控制資料1022的產生可透過一分析合成方法來實現。為此,補丁縮放控制資料產生器1020可額外地包含一補丁產生器(如針對解碼器之所述)及一比較器。該補丁產生器可根據第一修補演算法從輸入信號1002的低頻帶產生第一補丁,及根據第二修補演算法從輸入信號1002的低頻帶產生第二補丁。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。該比較器可比較該第一補丁、該第二補丁及該輸入信號的高頻帶,以獲得補丁縮放控制資料1022。換言之,前述概念也被應用到裝置1000。以此方式,裝置1000可透過比較補丁或所組合補丁與輸入信號來擷取補丁縮放控制資料1022,其中該輸入信號可能是例如一原始音訊信號。此外,裝置1000也可包含如前所述的一頻譜線選擇器、一功率控制器、一雜訊加法器及/或一丟失諧波加法器。以此方式,雜訊資料、雜訊補丁縮放控制資料、丟失諧波資料及/或丟失諧波補丁縮放控制資料也可透過一種分析合成方法來擷取。
根據本發明的一些實施例與包含第一頻帶及第二頻帶的一音訊信號有關。第一頻帶由第一解析度資料表示,且第二頻帶由第二解析度資料表示,其中第二解析度低於第一解析度。第二解析度資料係基於第二頻帶的頻譜包絡資料及第二頻帶的補丁縮放控制資料,該補丁縮放控制資料用於在解碼器端縮放音訊信號或用於透過解碼器縮放第一補丁及第二補丁,藉此透過該解碼器產生的帶寬擴展信號滿足一頻譜包絡準則。該頻譜包絡準則係基於頻譜包絡資料。第一補丁根據第一修補演算法從音訊信號的第一頻帶產生,及第二補丁根據第二修補演算法從音訊信號的第一頻帶產生。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。
音訊信號可以是例如以一原始音訊信號為基礎的帶寬減小信號。音訊信號的第一頻帶可代表在高解析度下編碼之原始音訊信號的一低頻帶。音訊信號的第二頻帶可代表原始音訊信號的一高頻帶,且可透過至少兩個參數來量化:由頻譜包絡資料表示的一頻譜包絡參數及由補丁縮放控制資料表示的一補丁縮放控制參數。基於這種音訊信號,根據上述概念的解碼器可產生一帶寬擴展信號,該帶寬擴展信號提供原始音訊信號的良好近似且與已知概念相比較具有提高的音訊品質。
第11圖顯示根據本發明之一實施例的用於從一輸入信號產生一帶寬擴展信號之一方法1100的流程圖。該輸入信號的第一頻帶由第一解析度資料表示,及第二頻帶由第二解析度資料表示,該第二解析度低於該第一解析度。該方法1100包含以下步驟:產生1110第一補丁、產生1120第二補丁、縮放1130輸入信號或縮放1130第一補丁及第二補丁以及組合1140第一補丁、第二補丁與輸入信號的第一頻帶,以獲得帶寬擴展信號。第一補丁根據第一修補演算法從輸入信號的第一頻帶產生1110,及第二補丁根據第二修補演算法從輸入信號的第一頻帶產生1120。根據第二修補演算法產生1120的第二補丁的頻譜密度較根據第一修補演算法產生1110的第一補丁的頻譜密度高。輸入信號可根據第一修補演算法及根據第二修補演算法來縮放1130,或第一補丁及第二補丁可被縮放1130,藉此帶寬擴展信號滿足一頻譜包絡準則。
再者,方法1100可透過根據上述概念的步驟來擴展。方法1100可例如被實現為用於在一電腦或微控制器上執行的電腦程式。
第12圖顯示根據本發明之一實施例的用於基於一輸入信號提供一帶寬減小信號之一方法1200的流程圖。該方法1200包含以下步驟:基於輸入信號的一高頻帶決定1210頻譜包絡資料、產生1220補丁縮放控制資料、組合1230輸入信號的低頻帶、頻譜包絡資料與補丁縮放控制資料,以獲得帶寬減小信號以及提供1240該帶寬減小信號用於傳輸或儲存。補丁縮放控制資料被產生1220,其用於在解碼器端縮放帶寬減小信號或用於透過解碼器縮放第一補丁及第二補丁,藉此透過該解碼器產生的帶寬擴展信號滿足一頻譜包絡準則。該頻譜包絡準則係基於該頻譜包絡資料。第一補丁根據第一修補演算法從帶寬減小信號的一低頻帶產生,及第二補丁根據第二修補演算法從帶寬減小信號的該低頻帶產生。根據第二修補演算法產生的第二補丁的頻譜密度較根據第一修補演算法產生的第一補丁的頻譜密度高。
再者,方法1200可透過根據上述概念的步驟來擴展。方法1200可例如被實現為用於在一電腦或微控制器上執行的電腦程式。
根據本發明的一些實施例與一種裝置有關,該裝置用於使用用於帶寬擴展的一相位聲碼器與用於一較密集頻譜的非線性失真或雜訊填充相組合來產生一帶寬擴展信號。當施加用於帶寬擴展的相位聲碼器時,頻率線進一步遠離。若例如透過量化使頻譜中存在間隙,則透過擴展同等間隙甚至被增加。在能量調適中,頻譜中的剩餘線接收太多的能量。這透過用雜訊或另外的諧波填充間隙來避免,該等雜訊或另外的諧波可能由信號的非線性失真獲得。這樣,較多的能量可能分佈在剩餘線之間。透過將頻帶中的能量只集中到少數幾條頻率線,產生不自然或金屬似的聲音。以前較多頻帶中的能量被加和到剩餘的一些。
若頻譜中不存在間隙,但是至少雜訊是存在的,則一部分能量保持在雜訊基準中。透過應用非線性失真,頻譜可再次被增加密度,一方面透過失真所產生的雜訊,另一方面透過由合適選擇將失真的信號部分所引入的另外的諧波部分。
所以帶寬擴展信號可以是例如一經濾波失真信號與在相位聲碼器幫助下產生之一信號的加權和。換言之,帶寬擴展信號可以是第一補丁、第二補丁與輸入信號之第一頻帶的加權和。
根據本發明的一些實施例與適用於所有音訊應用的一概念有關,其中在該等音訊應用中不是全部帶寬都是可用的。例如,對於使用數位無線電服務之音訊內容的廣播而言,網際網路串流化或其他音訊通訊應用、所描述的概念可被應用。
儘管本發明已依據若干實施例予以描述,但是存在落入本發明之範圍內的改變、變更、及等效。也應注意的是,存在實施本發明之方法與組成的許多備選方法。因此所意欲的是以下所附申請專利範圍被理解為包括落入本發明之真實精神與範圍內的所有這些改變、變更、及等效。
特別地,其指出的是,本發明方案依據情況也可在軟體中實施。實施可能是在一數位儲存媒體上,特別是具有電氣可讀控制信號的一軟式磁碟或一CD,其中該等電氣可讀控制信號可與一可規劃電腦系統協同工作,藉此相對應的方法被執行。一般而言,本發明因此也存在於一電腦程式產品中,該電腦程式產品具有儲存在機器可讀載體上的程式碼,當該電腦程式產品在一電腦上被執行時,該程式碼用於執行本發明方法。換句話說,本發明因此也可被實現為具有程式碼的電腦程式,當該電腦程式產品在一電腦上被執行時,該程式碼用於執行本方法。
102...輸入信號
110...補丁產生器
112、114、414、200、250、1312、1314...補丁
120...組合器
122...帶寬擴展信號
202...頻帶
212、214...修補演算法
220、1320...截止頻率/Xover
100、300、400、700、800、900、1000...裝置
310...相位聲碼器
320...振幅剪輯器
350...剪輯正弦輸入信號
360...半波整流正弦輸入信號
370...經剪輯及全波整流正弦輸入信號
380...不連續點
410...頻譜線選擇器
500...輸入端
501...帶通濾波器
502...下游振盪器
503、552...加法器
510、557、560...輸出端
551...輸入混合器
553...低通濾波器
554...正交信號
555...同相信號
556...座標轉換器
558...相位解開器
559...相位/頻率轉換器
598...擴展因數
600...短時傅利葉轉換(STFT)處理器
602...控制器
604...IFFT處理器
606...方塊
698...音訊信號
710...功率控制器
720、730...功率調整裝置
910...雜訊加法器
912...雜訊補丁
920...丟失諧波加法器
922...丟失諧波補丁
940...雜訊功率調整裝置
950...丟失諧波功率調整裝置
1002...帶寬減小信號
1010...頻譜包絡資料決定器
1012...頻譜包絡資料
1020...補丁縮放控制資料產生器
1022...補丁縮放控制資料
1030...輸出介面
1032...帶寬減小信號
1100、1200...方法
1110~1140、1210~1240...流程步驟
1300...帶寬擴展
1302...信號的低頻帶
第1圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第2a圖是一所產生第一補丁的概要繪示;第2b圖是一所產生第一及第二補丁的概要繪示;第3a圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第3b圖是一剪輯正弦輸入信號的概要繪示;第3c圖是一經半波整流正弦輸入信號的概要繪示;第3d圖是一經全波整流正弦輸入信號的概要繪示;第4圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第5a圖是一相位聲碼器之濾波器組實施態樣的概要繪示;第5b圖是第5a圖中之濾波器的詳細繪示;第5c圖是用於處理在第5a圖之一濾波器通道中的振幅信號與頻率信號的概要繪示;第6圖是一相位聲碼器之轉換實施態樣的概要繪示;第7圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第8圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第9圖是用於從輸入信號產生帶寬擴展信號之一裝置的方塊圖;第10圖是用於基於輸入信號提供帶寬減小信號之一裝置的方塊圖;第11圖是一種用於從輸入信號產生帶寬擴展信號之方法的流程圖;第12圖是一種用於基於輸入信號提供帶寬減小信號之方法的流程圖;以及第13圖是一已知帶寬擴展演算法的概要繪示。
100...裝置
102...輸入信號
110...補丁產生器
112、114...補丁
120...組合器
122...帶寬擴展信號

Claims (17)

  1. 一種用於從一輸入信號產生一帶寬擴展信號的裝置,其中該輸入信號的一第一頻帶由一第一解析度資料表示,及一第二頻帶由一第二解析度資料表示,該第二解析度低於該第一解析度,該裝置包含:一補丁產生器,受組配以根據一第一修補演算法從該輸入信號的該第一頻帶產生一第一補丁,及受組配以根據一第二修補演算法從該輸入信號的該第一頻帶產生一第二補丁,其中根據該第二修補演算法產生的該第二補丁的一頻譜密度較根據該第一修補演算法產生的該第一補丁的一頻譜密度高;以及一組合器,受組配以組合該第一補丁、該第二補丁與該輸入信號的該第一頻帶,以獲得該帶寬擴展信號,其中用於產生帶寬擴展信號的該裝置受組配以將用於該第一修補演算法及用於該第二修補演算法之該輸入信號縮放,或縮放該第一補丁及該第二補丁,藉此使該帶寬擴展信號滿足一頻譜包絡準則。
  2. 如申請專利範圍第1項所述之裝置,其中該第一修補演算法是一諧波修補演算法,且該補丁產生器受組配以產生該第一補丁,藉此只有該輸入信號之該第一頻帶中之頻率的整數倍的頻率遭該第一補丁包含。
  3. 如申請專利範圍第1項或第2項所述之裝置,其中該第二修補演算法是一混合修補演算法,且該補丁產生器受組配以產生該第二補丁,藉此該第二補丁包含是該輸入信 號之該第一頻帶中之頻率的整數倍的頻率且包含不是該輸入信號之該第一頻帶中之頻率的整數倍的頻率。
  4. 如申請專利範圍第1項所述之裝置,其中該第一補丁的一下截止頻率等於該第二補丁的一下截止頻率,且其中該第一補丁的一上截止頻率等於該第二補丁的一上截止頻率。
  5. 如申請專利範圍第1項所述之裝置,其包含受組配以根據該第一修補演算法產生該第一補丁的一相位聲碼器。
  6. 如申請專利範圍第1項所述之裝置,其包含受組配以根據透過剪輯該輸入信號的該第一頻帶之該第二修補演算法產生該第二補丁的一振幅剪輯器。
  7. 如申請專利範圍第1項所述之裝置,其包含受組配以選擇該第二補丁中的多個頻率線以獲得一經修改第二補丁的一頻譜線選擇器,其中若該第一補丁中的一相對應頻率線丟失,則頻率線遭選擇,其中該組合器受組配以組合該第一補丁、該經修改第二補丁與該輸入信號的該第一頻帶。
  8. 如申請專利範圍第1項所述之裝置,其包含受組配來控制用於該第一及該第二修補演算法之該輸入信號之該縮放動作,或受組配以控制該第一補丁及該第二補丁之該縮放動作的一功率控制器,其中該功率控制器基於該輸入信號所包含的頻譜包絡資料及基於至少一個所儲存的補丁縮放控制參數或該輸入信號所包含的補丁縮放控制資料來控制該縮放動作。
  9. 如申請專利範圍第8項所述之裝置,其包含受組配以根據該第一修補演算法縮放該輸入信號或縮放該第一補丁的一第一功率調整裝置,且包含受組配以根據該第二修補演算法縮放該輸入信號或縮放該第二補丁的一第二功率調整裝置,其中該功率控制器受組配以控制該第一功率調整裝置及該第二功率調整裝置。
  10. 如申請專利範圍第8項所述之裝置,其包含一雜訊加法器及一丟失諧波加法器,其中該雜訊加法器受組配以基於該輸入信號所包含的一雜訊資料產生一雜訊補丁,其中該丟失諧波加法器受組配以基於該輸入信號所包含的一丟失諧波資料產生一丟失諧波補丁,其中該功率控制器受組配以基於該頻譜包絡資料控制該雜訊補丁及該丟失諧波補丁的一縮放動作,且其中該組合器受組配以組合該第一補丁、該第二補丁、該輸入信號的該第一頻帶、該雜訊補丁與該丟失諧波補丁,以獲得該帶寬擴展信號,其中該功率控制器基於該頻譜包絡資料控制該第一補丁、該第二補丁、該雜訊補丁及該丟失諧波補丁的該縮放動作,藉此滿足該頻譜包絡準則。
  11. 一種用於基於一輸入信號提供一帶寬減小信號的裝置,其包含:一頻譜包絡資料決定器,受組配以基於該輸入信號的一高頻帶決定頻譜包絡資料;一補丁縮放控制資料產生器,受組配以產生補丁縮放控制資料,該補丁縮放控制資料用於在一解碼器端縮 放該帶寬減小信號或用於透過該解碼器縮放第一補丁及第二補丁,藉此由該解碼器所產生的一帶寬擴展信號滿足一頻譜包絡準則,其中該頻譜包絡準則係基於該頻譜包絡資料,其中該第一補丁根據第一修補演算法從該帶寬減小信號的一第一頻帶產生,且該第二補丁根據第二修補演算法從該帶寬減小信號的該第一頻帶產生,其中根據該第二修補演算法產生的該第二補丁的一頻譜密度較根據該第一修補演算法產生的該第一補丁的一頻譜密度高;一輸出介面,受組配以組合該輸入信號的一低頻帶、該頻譜包絡資料與該補丁縮放控制資料,以獲得該帶寬減小信號,且該輸出介面受組配以提供該帶寬減小信號用於傳輸或儲存。
  12. 如申請專利範圍第11項所述之裝置,其中該補丁縮放控制資料產生器包含:該補丁產生器受組配以根據一第一修補演算法從該輸入信號的該低頻帶產生一第一補丁,且受組配以根據一第二修補演算法從該輸入信號的該低頻帶產生一第二補丁,其中根據該第二修補演算法產生的該第二補丁的一頻譜密度較根據該第一修補演算法產生的該第一補丁的該頻譜密度高;以及一比較器,受組配以比較該第一補丁、該第二補丁與該輸入信號的該高頻帶,以獲得該補丁縮放控制資料。
  13. 如申請專利範圍第11項所述之裝置,其包含受組配以儲存與提供多個補丁縮放控制參數的一補丁縮放控制參數記憶體,其中該補丁縮放控制資料產生器受組配以分析該輸入資料且受組配以基於以對該輸入資料的該分析為基礎遭選擇的所儲存的補丁縮放控制參數產生該補丁縮放控制資料。
  14. 一種音訊信號,其包含:由一第一解析度資料表示的一第一頻帶;以及由一第二解析度資料表示的一第二頻帶,其中該第二解析度低於該第一解析度,其中該第二解析度資料係基於該第二頻帶的頻譜包絡資料及基於該第二頻帶的補丁縮放控制資料,而用於在一解碼器端縮放該音訊信號或用於透過該解碼器縮放一第一補丁及一第二補丁,藉此由該解碼器所產生的一帶寬擴展信號滿足一頻譜包絡準則,其中該頻譜包絡準則係基於該頻譜包絡資料,其中該第一補丁根據一第一修補演算法從該音訊信號的該第一頻帶產生,且該第二補丁根據一第二修補演算法從該音訊信號的該第一頻帶產生,其中根據該第二修補演算法產生的該第二補丁的一頻譜密度較根據該第一修補演算法產生的該第一補丁的一頻譜密度高。
  15. 一種用於從一輸入信號產生一帶寬擴展信號的方法,其中該輸入信號的一第一頻帶由一第一解析度資料表示,及一第二頻帶由一第二解析度資料表示,該第二解析度低於該第一解析度,該方法包含以下步驟: 根據一第一修補演算法從該輸入信號的該第一頻帶產生一第一補丁;根據一第二修補演算法從該輸入信號的該第一頻帶產生一第二補丁,其中根據該第二修補演算法產生的該第二補丁的一頻譜密度較根據該第一修補演算法產生的該第一補丁的一頻譜密度高;將用於該第一修補演算法及用於該第二修補演算法之該輸入信號縮放,或縮放該第一補丁及該第二補丁,藉此該帶寬擴展信號滿足該頻譜包絡準則;以及組合該第一補丁、該第二補丁與該輸入信號的該第一頻帶,以獲得該帶寬擴展信號。
  16. 一種用於基於一輸入信號提供一帶寬減小信號的方法,其包含以下步驟:基於該輸入信號的一高頻帶決定一頻譜包絡資料;產生補丁縮放控制資料,該補丁縮放控制資料用於在一解碼器端縮放該帶寬減小信號或用於透過該解碼器縮放一第一補丁及一第二補丁,藉此由該解碼器所產生的一帶寬擴展信號滿足一頻譜包絡準則,其中該頻譜包絡準則係基於該頻譜包絡資料,其中該第一補丁根據一第一修補演算法從該帶寬減小信號的一第一頻帶產生,及第二補丁根據一第二修補演算法從該帶寬減小信號的該第一頻帶產生,其中根據該第二修補演算法產生的該第二補丁的一頻譜密度較根據該第一修補演算法產生的該第一補丁的一頻譜密度高; 組合該輸入信號的一低頻帶、該頻譜包絡資料與該補丁縮放控制資料,以獲得該帶寬減小信號;提供該帶寬減小信號用於一傳輸或儲存。
  17. 一種具有電腦程式之電腦程式產品,該電腦程式具有一程式碼,當該電腦程式在一電腦或一微控制器上執行時,該程式碼用於執行如申請專利範圍第15項或第16項所述之方法。
TW098122551A 2008-07-11 2009-07-03 用以產生帶寬擴展信號之裝置與方法 TWI415116B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7984908P 2008-07-11 2008-07-11
PCT/EP2009/004603 WO2010003557A1 (en) 2008-07-11 2009-06-25 Apparatus and method for generating a bandwidth extended signal

Publications (2)

Publication Number Publication Date
TW201007708A TW201007708A (en) 2010-02-16
TWI415116B true TWI415116B (zh) 2013-11-11

Family

ID=41162740

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098122551A TWI415116B (zh) 2008-07-11 2009-07-03 用以產生帶寬擴展信號之裝置與方法

Country Status (18)

Country Link
EP (1) EP2291842B1 (zh)
JP (1) JP5255699B2 (zh)
KR (1) KR101239812B1 (zh)
CN (1) CN102105931B (zh)
AR (1) AR072483A1 (zh)
AU (1) AU2009267460B2 (zh)
BR (2) BR122017003818B1 (zh)
CA (1) CA2729474C (zh)
CO (1) CO6541514A2 (zh)
ES (1) ES2461141T3 (zh)
HK (1) HK1154112A1 (zh)
MX (1) MX2011000365A (zh)
MY (1) MY163454A (zh)
PL (1) PL2291842T3 (zh)
RU (1) RU2512090C2 (zh)
TW (1) TWI415116B (zh)
WO (1) WO2010003557A1 (zh)
ZA (1) ZA201009164B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3564954B1 (en) 2010-01-19 2020-11-11 Dolby International AB Improved subband block based harmonic transposition
AU2011226212B2 (en) * 2010-03-09 2014-03-27 Dolby International Ab Apparatus and method for processing an input audio signal using cascaded filterbanks
RU2596033C2 (ru) 2010-03-09 2016-08-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере
WO2011110496A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch
RU2527735C2 (ru) * 2010-04-16 2014-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы
SG10201505469SA (en) * 2010-07-19 2015-08-28 Dolby Int Ab Processing of audio signals during high frequency reconstruction
CA2808353C (en) 2010-09-16 2017-05-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US8490008B2 (en) * 2011-11-10 2013-07-16 Research In Motion Limited Touchscreen keyboard predictive display and generation of a set of characters
PL2791937T3 (pl) * 2011-11-02 2016-11-30 Wytworzenie rozszerzenia pasma wysokiego sygnału dźwiękowego o poszerzonym paśmie
CN102543086B (zh) * 2011-12-16 2013-08-14 大连理工大学 一种基于音频水印的语音带宽扩展的装置和方法
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2589305C1 (ru) * 2014-11-18 2016-07-10 Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
WO2016149085A2 (en) * 2015-03-13 2016-09-22 Psyx Research, Inc. System and method for dynamic recovery of audio data and compressed audio enhancement
EP3121814A1 (en) * 2015-07-24 2017-01-25 Sound object techology S.A. in organization A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use
TW202341126A (zh) 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070106502A1 (en) * 2005-11-08 2007-05-10 Junghoe Kim Adaptive time/frequency-based audio encoding and decoding apparatuses and methods

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US654988A (en) * 1900-03-16 1900-07-31 Leonhard Lederer Process of making acetyl cellulose.
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
EP1351401B1 (en) 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
KR20040035749A (ko) * 2001-08-31 2004-04-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 사운드 신호의 대역폭 확장 방법
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
US7577259B2 (en) * 2003-05-20 2009-08-18 Panasonic Corporation Method and apparatus for extending band of audio signal using higher harmonic wave generator
JP2005010621A (ja) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd 音声帯域拡張装置及び帯域拡張方法
WO2006046587A1 (ja) * 2004-10-28 2006-05-04 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070106502A1 (en) * 2005-11-08 2007-05-10 Junghoe Kim Adaptive time/frequency-based audio encoding and decoding apparatuses and methods

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Martin Wolters, et al., "A Closer Look into MPEG-4 High Efficiency AAC," in 115th AES Convention, New York, October 10-13, 2003, pp. 1-16. *

Also Published As

Publication number Publication date
EP2291842A1 (en) 2011-03-09
AU2009267460B2 (en) 2013-01-10
CN102105931B (zh) 2013-04-10
MY163454A (en) 2017-09-15
CN102105931A (zh) 2011-06-22
CA2729474A1 (en) 2010-01-14
JP2011527452A (ja) 2011-10-27
RU2512090C2 (ru) 2014-04-10
HK1154112A1 (en) 2012-04-20
AR072483A1 (es) 2010-09-01
CO6541514A2 (es) 2012-10-16
EP2291842B1 (en) 2014-03-12
BR122017003818B1 (pt) 2024-03-05
AU2009267460A1 (en) 2010-01-14
ES2461141T3 (es) 2014-05-16
KR101239812B1 (ko) 2013-03-06
BR122017003818A2 (pt) 2019-09-03
WO2010003557A1 (en) 2010-01-14
MX2011000365A (es) 2011-02-25
PL2291842T3 (pl) 2014-08-29
KR20110033188A (ko) 2011-03-30
RU2011100134A (ru) 2012-07-20
BRPI0910528B1 (pt) 2020-09-24
TW201007708A (en) 2010-02-16
CA2729474C (en) 2015-09-01
ZA201009164B (en) 2011-10-26
JP5255699B2 (ja) 2013-08-07
BRPI0910528A2 (pt) 2018-05-22

Similar Documents

Publication Publication Date Title
TWI415116B (zh) 用以產生帶寬擴展信號之裝置與方法
US8880410B2 (en) Apparatus and method for generating a bandwidth extended signal
AU2009210303B2 (en) Device and method for a bandwidth extension of an audio signal
TWI444991B (zh) 用以利用補丁邊界對齊處理音訊信號之裝置與方法
TWI416507B (zh) 用以基於輸入信號表示型態產生擴充頻寬信號之表示型態的裝置及方法和與其相關之音訊解碼器及電腦程式
KR101369267B1 (ko) 오디오 인코더 및 대역폭 확장 디코더
US20230343356A1 (en) Apparatus and Method for Generating a Bandwidth Extended Signal
AU2019409071B2 (en) Audio processor and method for generating a frequency enhanced audio signal using pulse processing