TWI417871B - 雜訊填充器、雜訊填充參數計算器、經編碼音訊信號表示型態、方法和電腦程式 - Google Patents
雜訊填充器、雜訊填充參數計算器、經編碼音訊信號表示型態、方法和電腦程式 Download PDFInfo
- Publication number
- TWI417871B TWI417871B TW098122013A TW98122013A TWI417871B TW I417871 B TWI417871 B TW I417871B TW 098122013 A TW098122013 A TW 098122013A TW 98122013 A TW98122013 A TW 98122013A TW I417871 B TWI417871 B TW I417871B
- Authority
- TW
- Taiwan
- Prior art keywords
- spectral
- noise
- quantized
- representation
- zero
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 98
- 239000000945 filler Substances 0.000 title claims description 46
- 238000000034 method Methods 0.000 title claims description 43
- 238000004590 computer program Methods 0.000 title claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 462
- 238000013139 quantization Methods 0.000 claims description 58
- 238000001228 spectrum Methods 0.000 claims description 40
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000002146 bilateral effect Effects 0.000 claims description 4
- 230000008676 import Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 8
- 230000001953 sensory effect Effects 0.000 description 6
- 230000000873 masking effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Description
根據本發明之實施例係有關一種用於基於一音訊信號之輸入頻譜表示型態提供該音訊信號之一雜訊已填充之頻譜表示型態之雜訊填充器;一種用於基於一音訊信號之一已量化頻譜表示型態提供一雜訊填充參數之雜訊填充參數計算器;一種表示一音訊信號之一編碼音訊信號表示型態;一種用於提供一音訊信號之雜訊已填充頻譜表示型態之方法;一種用於基於一音訊信號之一已量化頻譜表示型態提供一雜訊填充參數之方法;及用於實施該等方法之電腦程式。
後文將說明若干景況其中可優異地應用根據本發明之實施例。多個頻域音訊信號編碼器係基於下述構想,若干頻率區或頻譜區(例如藉時域變換至頻域所提供之頻率線或頻譜線)比其它頻譜區更重要。如此,高心理聲學相關之頻譜區典型係以比較低頻譜聲學相關之頻譜區更高的準確度編碼。不同頻譜區之心理聲學關係例如可使用心理聲學模型計算,該模型考慮藉相鄰強頻譜峰遮蔽較弱的頻譜峰。
若期望減低一已編碼音訊信號之位元率朝向低位準,某些頻譜區係以極低準確度(例如只有一個位元準確度或二位元準確度)量化。如此,以低準確度量化之多個頻譜區被量化至零。如此於低位元率,基於變換之音訊編碼器容易出現不同的假信號,特別係源自於零量化的頻率線之假信號。確實於低位元率音訊編碼之頻譜值之粗糙量化,可能導致於反相量化後極為稀疏的頻譜,原因在於許多頻譜線可能皆被量化為零。此等於已重建信號中之頻譜孔洞產生非期望的聲音假信號。當頻譜孔洞係位在由訊框移動至訊框的頻譜中時,可能造成重製的聲音特尖銳或聲音不穩(唧啾聲)。
雜訊填補係於解碼器端,經由以一隨機雜訊填補零量化係數或頻帶來遮蔽此等假信號之手段。所插入之雜訊能量係經過電腦運算及藉編碼器傳送。
已知不同的雜訊填充構想。例如所謂的AMR-WB+組合雜訊填充及離散傅立葉變換(DFT),例如說明於參考文獻[1]。此外,國際標準ITU-T G.729.1定義組合雜訊填充及修改型離散餘弦變換(MDCT)之構想。細節係說明於參考文獻[2]。
有關雜訊填充之額外面相係說明於Koninklijke之國際專利申請案PCT/IB2002/001388(飛利浦電子公司(Philips Electronics N.V.))(參考參考文獻[3])。
雖言如此,習知雜訊填充構想導致聽覺失真。
鑑於此討論,期望形成一種可提供改良型聽覺印象之雜訊填充構想。
根據本發明之實施例形成一種用於基於一音訊信號之輸入頻譜表示型態提供該音訊信號之一雜訊已填充之頻譜表示型態之雜訊填充器。該雜訊填充器包含一頻譜區識別器,配置來識別與輸入頻譜表示型態之非零頻譜區(例如頻譜線或頻譜倉(spectral bins))間隔至少一個中間頻譜區之該輸入頻譜表示型態之頻譜區(例如頻譜線或頻譜倉)而獲得已識別之頻譜區。雜訊填充器也包含一種雜訊插入器,配置來選擇性地將雜訊導入該等已識別的頻譜區(例如頻譜線或頻譜倉)而獲得該音訊信號之雜訊已填補之頻譜表示型態。
本發明之實施例係基於發現若雜訊填充係施用於一音訊信號之頻譜表示型態之音高組分之緊鄰,則就聽覺印象而言,該音高組分典型降級。如此,發現若雜訊填充只應用於間隔此種音高非零頻譜區之頻譜區,則可獲得雜訊已填充音訊信號之改良型聽覺印象。如此,音訊信號頻譜之音高組分(於輸入該雜訊填充器之已量化頻譜表示型態中非量化至零的組分)維持可聽聞(亦即不會變成被緊鄰的雜訊所污染),而仍可有效避免大的頻譜孔洞的存在。
於較佳實施例中,頻譜區識別器係配置來識別輸入頻譜表示型態之頻譜線,其係量化為零,及其包含至少一第一預定數目之量化為零之較低頻鄰近頻譜線及至少一第二預定數目之量化為零之較高頻鄰近頻譜線作為已識別之頻譜區,其中該第一預定數目係大於或等於1,及其中該第二預定數目係大於或等於1。於本實施例中,雜訊插入器係配置來將雜訊選擇性導入已識別之頻譜線,同時留下量化至非零值之頻譜線及量化為零之頻譜線,但第一預定數目之量化為零之較低頻鄰近頻譜線或第二預定數目之量化為零之較高頻鄰近頻譜線未受雜訊填充影響。如此,雜訊填充為選擇性,雜訊只導入被量化為零之頻譜線,且於向上頻譜方向及向下頻譜方向,與量化為非零值之頻譜線例如間隔達第一預定數目之量化為零之較低頻鄰近頻譜線及第二預定數目之量化為零之較高頻鄰近頻譜線。
於較佳實施例中,第一預定數目係等於第二預定數目,使得於由量化為非零值之頻譜線於向上頻率方向之最小間隔係等於與量化為非零值於向下頻率方向之最小間隔。
於較佳實施例中,雜訊填充器係配置來將雜訊只導入音訊信號之頻譜表示型態上部之頻譜區,而留下音訊信號之頻譜表示型態下部不受雜訊填充影響。此種構想有用,原因在於通常較高頻對感官上的重要性比低頻低。零量化值最常出現於頻譜的第二半(亦即高頻)。同時雜訊增加於高頻較不易產生最終雜音的回復。
於較佳實施例中,頻譜區識別器係配置來加總於一給定頻譜區之預定雙邊頻譜鄰近(亦即朝向較低頻及較高頻兩邊之頻譜鄰近)之頻譜區之量化強度值(例如能量值或振幅值)來獲得和值;以及評估該和值來判定該給定頻譜區是否為一已識別的頻譜區。發現於一給定頻譜區之雙邊頻譜鄰近之已量化頻譜能量之和值為有意義數量俾判定雜訊填充是否應應用至該給定頻譜區。
於另一個實施例中,該頻譜區識別器係配置來掃描該輸入頻譜表示型態之頻譜區範圍俾檢測量化為零之連續頻譜區序列,且辨識此種經檢測之連續序列之一個或多個中心頻譜區(亦即非邊界頻譜區)為已識別的頻譜區。
發現某些經量化為零之頻譜區之某個「行程長度」之檢測為可以待低運算複雜度實施之工作。為了識別此種頻譜區之連續序列,可判定於此頻譜區序列中之全部頻譜區是否皆量化為零,可使用相當簡單之演算法或電路實施。若發現此種頻譜區之連續序列被量化為零,則序列內頻譜區中之一者或多者(距本頻譜區序列外側頻譜區之間隔夠遠)被當作已識別的頻譜區處理。如此,經由掃描通過頻譜區範圍(例如經由隨後選擇不同位移的頻譜區序列),可作頻譜區有效分析,來識別被量化為零且與量化為非零值之頻譜區間隔預定最小距離之該等頻譜區。
根據本發明之另一實施例形成用於基於音訊信號之已量化頻譜表示型態,提供一雜訊填充參數之雜訊填充參數計算器。該雜訊填充參數計算器包含一頻譜區識別器配置來識別與該已量化頻譜表示型態之非零頻譜區間隔至少一個中間頻譜區之該已量化頻譜表示型態之頻譜區。該雜訊填充參數計算器也包含一雜訊值計算器配置來對該雜訊填充參數之計算值選擇性考慮已識別之頻譜區之量化誤差。雜訊填充參數計算器係基於下述關鍵構想,期望將解碼器端雜訊填充限於與音高頻譜區(量化至非零值)隔開之頻譜區;以及結果,考慮此種構想,該雜訊參數須於編碼器端計算。如此,獲得特別適合前述解碼器構想之雜訊填充參數。也發現被量化為零但極為接近量化為非零值之頻譜區之該等頻譜區通常並未反映真正雜訊狀音訊內容,反而與相鄰音高(量化至非零值)頻譜區強力相關。如此,發現對於雜訊填充參數之計算,不期望考慮附近量化為非零值之頻譜區之該等頻譜區之量化誤差,原因在於如此典型導致雜訊的強烈超估,因而導致重建的頻譜表示型態過多雜訊。
如此,此處所述雜訊填充參數計算構想可組合前述雜訊填充構想使用,甚至組合習知雜訊填充構想使用。
於較佳實施例中,已經就雜訊填充器討論之頻譜區識別構想也適用於與雜訊填充參數計算器組合。
於又一較佳實施例中,雜訊值計算器係配置來考慮已識別之頻譜區之量化誤差之實際能量用於雜訊填充參數之計算。發現考慮實際量化誤差(而非考慮估計的量化誤差或平均量化誤差),典型獲得改良的結果,原在於實際量化誤差典型係偏離統計上預期的量化誤差。
於又一較佳實施例中,雜訊值計算器係配置來相對於其中於單一頻譜區之調性量化誤差能,強調於多數已識別頻譜區之非調性量化誤差能。此種構想係基於發現其平均能量係低於量化臨界值因而被量化為零之一非調性寬頻雜訊比較其強度低於量化臨界值之單一調性音訊組分,對該雜訊填充器於感官上遠較相關,即使量化為零之非調性寬頻雜訊及量化為零之調性組分二者皆被量化為零亦如此。理由在於藉由於解碼器產生隨機雜訊之雜訊填充器可遺漏於該已量化頻譜表示型態中之非調性寬頻雜訊,但未遺漏調性組分來模型化。如此,比較量化為零之調性組分,強調量化為零之非調性雜訊組分獲得更理想的聲音重建。此點也由於人類聽覺印象因頻譜孔洞的存在(例如於無量化為零之寬頻雜訊之存在形式)比因量化為零之小型頻譜尖峰的不存在所造成的降級遠更大。調性組分可集中於單一頻譜線,或可展開於數條鄰接頻譜線(例如i-1、i、i+1)。頻譜區例如包含一條或多條頻譜線。
於較佳實施例中,雜訊值計算器係配置來計算該已識別之頻譜區之對數化量化誤差能之和而獲得雜訊填充參數。經由計算該已識別之頻譜區之對數化量化誤差能之和,可以有效方式獲得如前文說明之比較量化為零之調性區,相對強調量化為零之非調性頻譜區。
根據本發明之另一個實施例形成用於表示一音訊信號之已編碼音訊信號表示型態。已編碼音訊信號表示型態包含該音訊信號之已編碼量化頻譜域表示型態及已編碼雜訊填充參數。該雜訊填充參數表示量化為零且與量化至非零值之該頻譜域表示型態之頻譜區間隔至少預定數目之中間頻譜區之該頻譜域表示型態之該等頻譜區之量化誤差。前述已編碼音訊信號表示型態藉前文討論之雜訊填充器為有用,可使用如前文討論之雜訊填充參數計算器獲得。已編碼音訊信號表示型態允許以待佳音訊品質重建該音訊信號,原因在於該雜訊填充參數選擇性反映出其中存在有有意義雜訊資訊之此種頻譜區之已量化頻譜域表示型態之量化誤差,且該等量化誤差對於解碼器端之雜訊填充也須選擇性考慮者。
根據本發明之另一個實施例形成一種用於提供音訊信號之雜訊已填充表示型態之方法。
根據本發明之又另一個實施例形成一種基於一音訊信號之已量化頻譜表示型態提供雜訊填充參數之方法。
根據本發明之又另一個實施例形成用於實施前述方法之電腦程式。
隨後將參考附圖說明根據本發明之實施例,附圖中:第1圖顯示根據本發明之實施例,雜訊填充器之方塊示意圖;第2圖顯示包含根據本發明之雜訊填充器之音訊信號解碼器之方塊示意圖;第3圖顯示用於實施第1圖之雜訊填充器之功能之虛擬程式碼;第4圖顯示可於根據第1圖之雜訊填充器進行之頻譜區識別之圖解代表圖;第5圖顯示根據本發明之實施例,雜訊填充參數計算器之方塊示意圖;第6圖顯示用於實施根據第5圖之雜訊填充參數計算器之功能之虛擬程式碼;第7圖顯示用於基於音訊信號之輸入頻譜表示型態,提供音訊信號之雜訊已填充之頻譜表示型態之方法之流程圖;第8圖顯示用於基於音訊信號之量化頻譜表示型態提供已雜訊化填充參數之流程圖;及第9圖顯示根據本發明之實施例,音訊信號表示型態之圖解代表圖。
根據第1-4圖之雜訊填充器
第1圖顯示根據本發明之實施例,雜訊填充器100之方塊示意圖。雜訊填充器100係組配來接收音訊信號之輸入頻譜表示型態110,該表示型態例如係呈已解碼頻譜係數形式(例如可經量化或經反相量化)。雜訊填充器100也配置來基於輸入頻譜表示型態110提供該音訊信號之雜訊已填充頻譜表示型態112。
雜訊填充器100包含一頻譜區識別器120,其係配置來識別與輸入頻譜表示型態110之非零頻譜區間隔至少一個中間頻譜區之該等輸入頻譜表示型態110之頻譜區而獲得指示該已識別之頻譜區之資訊122。雜訊填充器100也包含一雜訊插入器130,其係配置來將雜訊選擇性導入已識別之頻譜區(以資訊122描述)而獲得該音訊信號之雜訊已填充頻譜表示型態112。
有關雜訊填充器100之功能,通常雜訊填充器100係以雜訊選擇性填充輸入頻譜表示型態110之頻譜區(例如頻譜線或頻譜倉),例如係以描述雜訊之置換頻譜值來置換被量化為零之頻譜線之頻譜值。藉此方式,可填充輸入頻譜表示型態110內部之頻譜孔洞或頻譜間隙,該等孔洞或間隙可能係來自於輸入頻譜表示型態110之粗糙量化。但雜訊填充
器100並未將雜訊導入量化為零之全部頻譜線(亦即其頻譜值被量化為零之該等頻譜線)。反而雜訊填充器100只將雜訊導入包含距量化為非零之任何頻譜線有足夠距離之此種量化為零之頻譜線。藉此方式,雜訊填充並未完全填充頻譜孔洞或頻譜間隙,反而於其中導入雜訊之該等頻譜線與量化為非零值之該等頻譜線間維持至少一個頻譜區之頻譜距離(或至少任何預定數目之頻譜區之頻譜距離)。如此,維持導入頻譜表示型態之填充雜訊與量化至非零值之頻譜線間之頻譜距離,使得(由於預定數目之一個或多個頻譜區之頻譜距離)可清晰區別心理聲學相關頻譜線(於音訊信號之輸入頻譜表示型態未量化為零)與藉雜訊填充器而導入頻譜之填充雜訊。如此,可清晰接受心理聲學上最相關的音訊內容(於輸入頻譜表示型態110以非零頻譜線值表示),同時避免大型頻譜孔洞。原因在於實際上於被量化為非零值之輸入頻譜表示型態之頻譜線附近被選擇性刪除雜訊填充,而於頻譜孔洞或頻譜間隙中央區執行雜訊填充。
後文將參考第2圖說明雜訊填充器100之應用環境。第2圖顯示根據本發明之實施例,音訊信號解碼器200之方塊示意圖。音訊信號解碼器200包含雜訊填充器100作為關鍵組件。音訊信號解碼器200也包含一頻譜係數解碼器210,其係配置來接收一已編碼音訊信號表示型態212及提供該已編碼音訊信號之頻譜係數之一已解碼選擇性地經反相量化之表示型態214。頻譜係數解碼器210例如可包含一熵解碼器(例如算術解碼器或行程長度解碼器)及選擇性地包含一反相量化器來由該已編碼之音訊信號表示型態212導算出頻譜係數之已解碼表示型態214(例如係呈反相量化係數形式)。雜訊填充器100係配置來接收頻譜係數之已解碼表示型態214(選擇性地可經反相量化)作為該音訊信號之輸入頻譜表示型態110。
音訊信號解碼器200也包含一雜訊因數擷取器220,其係配置來由該已編碼之音訊信號表示型態212擷取一雜訊因數資訊222,且提供該已擷取的雜訊因數資訊222予雜訊填充器100。音訊信號解碼器200也包含一頻譜整形器230,其係配置來由雜訊填充器100接受一已重建的頻譜表示型態232。已重建的頻譜表示型態232例如係等於由雜訊填充器所提供之雜訊已填充的頻譜表示型態112。頻譜整形器230可視為選擇性,係配置來基於已重建的頻譜表示型態232而提供頻譜資訊234。音訊信號解碼器200進一步包含一頻譜域至時域變換器240,其接收由頻譜整形器230所提供之頻譜資訊234,或於無頻譜整形器230之存在下,接收已重建之頻譜表示型態232;以及基於此提供一時域音訊信號表示型態242。頻譜域至時域變換器240例如可配置來執行反相修改型離散餘弦變換(IMDCT)。
於較佳實施例中,於解碼器端之雜訊填充包括下列步驟(或遵循其次步驟):
1.解碼雜訊底位準;
2.解碼頻率線之已量化值;
3.於零之行程長度高於最小行程長度大小處,檢測於該頻譜選定部分之頻譜區;及
4.對於選定區內部之各條線應用隨機產生之符號至該已解碼之雜訊底位準。
雜訊底位準解碼如下:
nf_decoded=0.0625*(8-index)
檢測得之頻譜區例如係以於編碼器端之相同方式選擇(容後詳述)。
於MDCT域之無記憶高斯雜訊係藉對全部線皆有相同振幅但有隨機符號之頻譜產生。如此,對選定區內部之各線,解碼器產生隨機符號(-1或+1)且應用至已解碼之雜訊底位準。但其它提供雜訊貢獻之方法也適用。
後文中將參考第1、2、3及4圖說明若干細節,其中第3圖顯示可藉雜訊填充器100執行之於解碼器端用於雜訊填充之演繹法則之虛擬程式碼,及其中第4圖顯示雜訊填充之圖解代表圖。
開始時,藉雜訊因數擷取器220執行雜訊底位準之解碼,雜訊因數擷取器220其例如接收雜訊因數指數(也簡寫為(「指數」),基於此提供已解碼雜訊因數值222(也標示為「nf_decoded」)。雜訊因數指數例如可使用三位元或四位元編碼,例如可為0至7之範圍之整數值或0至15之範圍之整數值。
頻率線(也稱作為「頻譜線」或「頻譜倉」)之量化值可由頻譜係數解碼器210提供。如此獲得已量化的(或選擇性地,已反相量化的)頻譜線值(也稱作為「頻譜係數」),標示為「已量化(x(i))」。此處i表示頻譜線值之頻率指數。
隨後藉雜訊填充器100檢測於頻譜選定部分(例如始於預定頻譜線頻率指數i之頻譜上部)之頻譜區,此處零之行程長度(亦即量化為零之已量化頻譜線值)細高於最小行程長度大小。此種頻譜區之檢測係藉第3圖之演繹法則300之第一部分310進行。如由演繹法則300之第一部分310可知,檢測區集合R於演繹法則起點被初始化空白集合(R={};)。
於第3圖之演繹法則實例中,最小行程長度設定為8之固定值,當然也可選用任何其它數值。
隨後對所考慮之多數頻譜線(標示為行程變數「線指數」)所考慮的各條頻譜線是否包含量化至零之頻譜線之雙邊環境(及所考慮之頻譜線是否本身量化為零)。舉例言之,於頻譜第二半之全部頻譜線隨後皆考慮為接受考慮的頻譜線,其中目前正在考慮之線標示為頻率指數「線指數」。對標示為「線指數」之接受考慮之線,運算由「線指數-(最小行程長度/2之頻譜線頻率指數」至「線指數+(最小行程長度/2之頻譜線頻率指數」之範圍環境中之已量化的頻譜係數「量化(x(i))」之和。若發現於目前正在考慮之頻譜線環境中之頻譜線之和(具有頻譜線頻率指數「線指數」)為零,則目前正在考慮之頻譜線(或更精確言之,其頻譜線頻率指數「線指數」)加至檢測區集合R(或檢測頻譜線)。結果,若頻譜線之頻譜線頻率指數加至集合R,表示具有「線指數-(最小行程長度)/2之頻譜線頻率指數」至「線指數+(最小行程長度)/2之頻譜線頻率指數」間之線指數之頻譜線全部皆包含量化為零之頻譜線值。
如此虛擬程式碼310之第一部分310,獲得頻譜線頻率指數「線指數」之集合R,列舉接受考慮之頻譜部分之該等(且只有該等)頻譜線,其係與量化至非零值之任何頻譜線「充分」隔開(亦即間隔至少最小行程長度/2線)。
此區之檢測示例顯示於第4圖,顯示頻譜之圖形代表圖400。橫座標410係以頻譜線頻率指數「線指數」描述頻譜線頻率。縱座標412描述頻譜線強度(亦即振幅或能量)。如此可知,線圖代表圖400中示例顯示之頻譜部分包含量化至非零值之四條頻譜線420a、420b、420c、及420d。此外,頻譜線420c與420d間有11條量化為零之頻譜線422a-422k。進一步,於目前正在考慮之頻譜線與量化至非零值之任何其它頻譜線間有至少四條量化為零之頻譜線(及當然,若目前接受考慮之頻譜線本身被量化為零),則假設只考慮與量化為非零值之頻譜線充分間隔之頻譜線。但當考慮頻譜線422a時,發現頻譜線422a緊鄰於頻譜線422c,其未量化為零,故頻譜線422a之頻譜線頻率指數根據演繹法則300之第一部分310將不會構成運算的集合R之一部分。同理,發現頻譜線422b、422c及422d與量化至非零值之任何頻譜線並未足夠間隔遠離,使得頻譜線422b至422d之頻譜線頻率指數也非為集合R之一部分。相反地,須瞭解頻譜線422e與任何量化為非零值之頻譜線足夠遠離,原因在於頻譜線422e為一序列9條全部量化為零之連續頻譜線之中心線(或更通常為中線)。如此,頻譜線422e之頻譜線頻率指數將為於演繹法則300之第一部分310中運算的集合R之一部分。頻譜線422f及422g亦如此,使得頻譜線422f及422g之頻譜線頻率指數將成為於演繹法則300之第一部分310測得之集合R之一部分,原因在於頻譜線422f、422g係充分遠離量化為非零值之較低頻頻譜線420a、420b、及420c,且充分遠離量化為非零值之任何較高頻頻譜線。另一方面,頻譜線422h、422i、422j、及422k將不屬於集合R之一部分,原因在於就頻率而言該等頻譜線太過接近量化為非零值之頻譜線420d。
如此,集合R將不包含頻譜線420a、420b、420c、420d之頻譜線頻率指數,原因在於該等頻譜線被量化為非零值。此外,頻譜線422a、422b、422c、422d、422h、422i、422j、及422k之頻譜線頻率指數將不構成集合R之一部分,原因在於該等頻譜線太過接近頻譜線420a、420b、420c、及420d。相反地,頻譜線422e、422f、422g之頻譜線頻率指數將含括於集合R,原因在於該等頻譜線本身被量化為零,且足夠間隔遠離任何相鄰的非零頻譜線。
演繹法則300也包含解碼雜訊底位準之一第二部分320,其中雜訊值指數(於程式碼部分320之「指數」)被變換成已解碼之雜訊數值(於程式碼300之「nf_decoded」)。
程式碼300也包含一雜訊填充已識別之頻譜線之一第三部分330,亦即其頻譜線頻率指數i係於集合R之該等頻譜線。用於此項目的,已識別之頻譜線之頻譜值(例如以x(i)標示,此處行程變數i隨後取於集合R所含括的全部頻譜線
頻率指數)係設定為雜訊填充值。雜訊填充值例如係經由將已解碼之雜訊填充值(nf_decoded)乘以隨機數目或虛擬隨機數目(標示為「random(-1,+1)」)獲得,其中隨機數目或虛擬隨機數目例如可為隨機或虛擬隨機取數目-1及+1。但當然也可取不同的隨機雜訊或虛擬隨機雜訊。
雜訊填充也示例顯示於第4圖。如第4圖可知,頻譜線422e、422f、及422g之零頻譜值係以雜訊填充值置換(第4圖中以虛線表示)。
根據第5圖及第6圖之雜訊填充參數計算器
第5圖顯示雜訊填充參數計算器500之方塊示意圖。雜訊填充參數計算器500係配置來獲得音訊信號之已量化頻譜表示型態510,以及基於該表示型態而提供雜訊填充參數512。雜訊填充參數計算器500包含一頻譜區識別器520,其係配置來接收音訊信號之已量化頻譜表示型態510,且識別與已量化頻譜表示型態510之非零頻譜區間隔至少一個中間頻譜區(例如頻譜線)之已量化頻譜表示型態510之頻譜區(例如頻譜線),來獲得描述已識別之頻譜區(例如已識別之頻譜線)之資訊522。雜訊填充參數計算器500進一步包含一雜訊值計算器530,配置來接收量化誤差資訊532及提供雜訊填充參數512。用於此項目的,雜訊值計算器係配置來選擇性考慮藉資訊522描述用於計算雜訊填充參數512之已識別的頻譜區之量化誤差。
量化誤差資訊532例如可與描述於已量化頻譜表示型態510中被量化為零之該等頻譜線之能量(或強度)之能量資訊(或強度資訊)相同。
雜訊填充參數計算器500選擇性地包含一量化器540,配置來接收音訊信號之未經量化之頻譜表示型態542,與提供音訊信號之已量化頻譜表示型態510。量化器540可具有可調整之量化解析度,例如可每條頻譜線個別調整或每個頻帶個別調整(例如取決於使用心理聲學模型獲得之頻譜線或頻譜帶之心理聲學關係)。可變解析度量化器之功能可等於國際標準ISO/IEC 13818-7及ISO/IEC 14496-3說明之功能。特定言之,量化器540可經調整,使得音訊信號之量化頻譜表示型態510中有頻譜間隙或頻譜孔洞,亦即被量化為零之相鄰頻譜線之連續區。
此外,未經量化之頻譜表示型態542可用作為量化誤差資訊532,或量化誤差資訊532可由未經量化之頻譜表示型態542導算出。
後文將說明可藉雜訊填充參數計算器500進行之雜訊填充參數運算功能。於編碼器端之雜訊填充參數運算中,雜訊填充較佳係應用於量化域。藉此方式,隨後藉心理聲學相關的反相濾波器成形所導入的雜訊。藉解碼器所導入之雜訊能量經求出且遵照下列步驟於編碼器端編碼:
1.獲得頻率線之已量化值;
2.只選擇部分頻譜;
3.於零行程長度高於最低行程長度大小時,檢測於頻譜選定部分之頻譜區;
4.計算於先前檢測得頻譜區之量化誤差之幾何平均;及
5.以3位元一致地量化該幾何平均。
有關第一步驟,頻譜線之已量化值可使用量化器540獲得。因此頻譜線之已量化值係藉已量化頻譜表示型態510表示。
有關第二步驟,第二步驟被視為選擇性,須注意雜訊填充之運算較佳係基於頻譜之高頻部分進行。於較佳實施例中,雜訊能量(稱作為雜訊底位準)只對雜訊之第二半亦即對高頻(而非對低頻)計算。確實,通常高頻(頻譜上部)於感官上比低頻不重要,零量化值大部分出現於頻譜之第二部分。此外,加入高頻雜訊較不容易獲得最終雜音回復。
有關第三步驟,經由限制於出現零量化值行程長度之頻譜區的雜訊填充,避免雜訊填充太過度影響非零值。藉此方式,雜訊填充並未應用於非零值鄰近,此等線之原先調性被更優異地保留。較佳實施例中,最小行程長度大小固定為8。表示環繞一個非零值之8條線不受雜訊填充影響(結果於雜訊值之計算不考慮)。
有關第四步驟,於已量化域之量化誤差係於[-0.5;0.5]之範圍且假設為一致分布。檢測區之量化誤差能為對數域之平均值(亦即幾何平均)。然後雜訊底位準nf計算如下:
nf=power(10,sum(log10(E(x(i))))/(2*n))
上式中,sum()為檢測區內部個別線x(i)之對數能lkog10(E())之和,n為此等區之線數目。雜訊底位準nf為0至0.5。此種計算允許將零值原先頻譜平坦度列入考慮,然後獲得有關其調性/雜訊特性。
若零化值極為有調性,則雜訊底位準(於裝置500運算)將朝向零改變,於解碼器(例如於前述解碼器100、200)將加上低雜訊底位準。若零化值實際上有雜訊,則雜訊底位準將高,雜訊填充可視為零化頻譜線之高度參數編碼,類似PNS(感官雜訊取代)(也參考參考文獻[4])。
有關第五步驟,雜訊底位準之量化指數(「指數」)計算如下:
index=max(0,min(7,int(8-16*nf)))。
指數例如以3位元傳送。
後文中將參考第6圖說明運算雜訊填充參數之演繹法則,第6圖顯示根據本發明之實施例,用於獲得雜訊填充參數之此種演繹法則之虛擬程式碼600。演繹法則600包含運算雜訊填充參數須考慮之檢測區之第一部分610。已識別區(例如頻譜線)以集合R描述,例如可包含已識別頻譜線之頻譜線頻率指數(「線指數」)。可識別本身被量化為零且與被量化為非零值之任何其它頻譜線充分間隔遠離之該等頻譜線。
程式600之第一部分610係與程式300之第一部分310相同。如此用於演繹法則600之已量化頻譜表示型態(「已量化(x(i))」)可與解碼器端用於演繹法則300之已量化頻譜表示型態(「已量化(x(i))」)相同。換言之,於編碼器端之已量化頻譜表示型態可以編碼形式傳送至包含一編碼器及一解碼器之傳送系統中之該解碼器。
演繹法則600包含運算雜訊底位準之第二部分620。於雜訊底位準之運算中,只考慮藉演繹法則600之第一部分610運算之集合R描述之該等頻譜區(或頻譜線)。可知雜訊填充值nf首先被初始化為零。所考慮之頻譜線數目(n)也被初始化為零。隨後,加總含括於集合R之線指數亦即全部頻譜線之能量,其中該等頻譜線之能量於加總之前經過對數化。例如可加總頻譜線能量(E(x(i)))之以10為底的對數(log10)。須注意量化前頻譜線之實際能量(以「E或能量(x(i))」表示)係以已對數化形式加總。也計算所考慮之頻譜線數目。如此,於執行演繹法則600之第二部分620後,變數nf指示量化前已識別之頻譜線能之對數和,變數n描述已識別之頻譜線數目。
演繹法則600也包含量化值nf之第三部分630,亦即已識別之頻譜線之對數和。可使用如前文說明或如第6圖所示之映射方程式。
第7圖顯示用於基於音訊信號之輸入頻譜表示型態,提供音訊信號之雜訊已填充之頻譜表示型態之方法之流程圖。第7圖之方法700包含一步驟710,識別與一音訊信號之一輸入頻譜表示型態間隔至少一個中間頻譜區之該輸入表示型態之頻譜區,來獲得已識別之頻譜區。方法700也包含一步驟720,將雜訊選擇性導入已識別之頻譜區來獲得音訊信號之雜訊已填充之頻譜表示型態。
方法700可藉此處參考本發明之雜訊填充器之任何特徵及功能補充。
第8圖顯示用於基於一音訊信號之已量化頻譜表示型態提供雜訊填充參數之方法之流程圖。方法800包含一步驟810,識別與一音訊信號之一輸入頻譜表示型態間隔至少一個中間頻譜區之該輸入表示型態之頻譜區,來獲得已識別之頻譜區。方法800也包含一步驟820,選擇性考慮已識別之頻譜區之量化誤差用於該填充參數之計算。
方法800可藉此處就雜訊填充參數計算器之任何特徵及功能補充。
第9圖顯示根據本發明之實施例,一音訊信號表示型態之線圖代表圖。音訊信號表示型態900例如可構成輸入頻譜表示型態110之基礎。音訊信號表示型態900也利用已編碼音訊信號表示型態212之功能。音訊信號表示型態900可使用雜訊填充參數計算器500獲得,其中音訊信號表示型態900例如包含音訊信號之已量化頻譜表示型態510及雜訊填充參數512,例如二者皆呈編碼形式。
換言之,已編碼之音訊信號表示型態900可表示音訊信號。已編碼之音訊信號表示型態900包含音訊信號之已編碼已量化頻譜域表示型態,也包含已編碼雜訊填充參數。該雜訊填充參數表示量化為零之頻譜域表示型態之頻譜區之量化誤差,且與量化為非零之頻譜域表示型態之頻譜區間隔至少一個中間頻譜區。
當然音訊信號表示型態900可藉前述任何資訊補充。
依據某些實務要求而定,本發明之實施例可於硬體或軟體實施。該實務可使用數位儲存媒體執行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體,有可電子式讀取之控制信號儲存於其上,且與可程式電腦系統協力(或可協力)因而執行個別方法。
根據本發明之若干實施例包含具有可電子式讀取控制信號之資料載體,該等信號可與可規劃電腦系統協力合作,因而可執行此處所述之方法之一。
通常,本發明實施例可以具有程式碼之電腦程式產品實施,該程式碼可運算用於當該電腦程式產品於電腦上跑時執行該等方法之一。
該程式碼例如可儲存於可機器讀取載體上。
其它實施例包含儲存於一可機器讀取載體上用於執行此處所述方法之一之電腦程式。
換言之,本發明方法之一實施例為一電腦程式其具有一程式碼,當該電腦程式於電腦上跑時該程式碼用於執行此處所述之方法之一。
本發明方法之又一實施例為一資料載體(或一數位儲存媒體)包含可用於執行此處所述方法中之一者之電腦程式。
因而本發明方法之又一實施例為一資料流或信號序列表示用於執行此處所述方法之一之該電腦程式。資料流或信號序列例如可配置來透過資料通訊連結例如透過網際網路傳輸。
又一實施例包含配置來或自適應於執行此處所述方法中之一者之一種處理裝置,例如電腦或可程式邏輯裝置。
又一實施例包含一電腦,其上安裝用於執行此處所述方法之一之電腦程式。
於若干實施例中,可程式邏輯裝置(例如場可規劃閘極陣列)可用來執行此處所述方法之部分或全部功能。於若干實施例中,場可規劃閘極陣列可與微處理器協力合作來執行此處所述方法中之一者。
綜上所述,當於編碼器端運算雜訊填充參數,及於解碼器端應用雜訊二者時,經由考慮輸入信號特性及已解碼信號特性,本發明加強音訊編碼工具「雜訊填充」。於本發明之實施例中,零量化頻譜線之調性/雜訊度經估計且用於估計雜訊底位準。然後此雜訊底位準傳送至解碼器,解碼器將該雜訊填充應用至出現於頻譜特定區之零量化值。此等區係基於已解碼頻譜特性選定。
有關本發明之上下文,發現本發明使用於MDCT上之定標量化應用於基於轉換之編碼。MDCT係數先前係藉基於感官線索計算得之資訊而規度化。經由如同於AMR-WB+之TCX模式(參考參考文獻[1])進行,藉加權LPC係數,由LPC(線性預測編碼)分析階段可推定該曲線。由已加權係數,設計感官加權濾波器且於MDCT之前應用。也於反相MDCT之後,於解碼器端應用反相濾波器。本反相感官加權濾波器成形量化雜訊因而最小化或遮蔽所察覺的雜訊。
於根據本發明之實施例,克服先前技術之問題。習知,只考慮基於頻譜封包臨界值、遮蔽臨界值、或能量臨界值,雜訊填充以系統性方式應用於零量化值。先前技術既未考慮輸入信號特性,也未考慮已解碼信號特性。如此,習知裝置可導入非期望的額外假信號,特別為雜訊假信號而抵消此種工具之優點。
相反地,根據本發明之實施例允許如前文討論獲得具有減少的假信號之一種改良式雜訊填充。
[1]“Extended Adaptive Multi-Rate-Wideband(AMR-WB+)codec”,3GPP TS 26.290 V6.3.0,2005-06,Technical Specification
[2]Ragot et al,“ITU-T G.729.1:AN 8-32 Kbit/S Scalable Coder Interoperable with G.729 for Wideband Telephony and Voice Over IP”,Vol.4,ICASSP 07,15-20 April 2007
[3]“AUDIO CODING”,International Application No.:PCT/IB2002/001388,Applicant:KONINKLIJKE PHILIPS ELECTRONICS N.V.[NL/NL];Groenewoudseweg 1 NL-5621 BA Eindhoven(NL).Inventors:TAORI,Rakesh;Prof Holstlaan 6 NL-5656 AA Eindhoven(NL)and VAN DE PAR,Steven,L.,J.,D.,E.;Prof.Holstlaan 6 NL-5656 AA Eindhoven(NL).
[4]Generic Coding of Moving Pictures and Associated Audio:Advanced Audio Coding.International Standard 13818-7,ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group,1997.
100...雜訊填充器
110...輸入頻譜表示型態
112...雜訊已填充之頻譜表示型態
120...頻譜區識別器
122...指示已識別之頻譜區之資訊
130...雜訊插入器
200...音訊信號解碼器
212...已解碼之音訊信號表示型態
214...選擇性地經反相之已量化表示型態、已解碼表示型態
220...雜訊因數擷取器
222...雜訊因數資訊
230...頻譜整形器
232...已重建之頻譜表示型態
234...頻譜資訊
240...頻譜域至時域變換器
242...時域音訊信號表示型態
300...演繹法則
310...第一部分
320...第二部分、程式碼部分
330...第三部分
400...圖解表示型態
410...橫座標說明頻譜線頻率
412...縱座標說明頻譜線強度
420a-d...頻譜線
422a-k...頻譜線
500...雜訊填充參數計算器
510...已量化之頻譜表示型態
512...雜訊填充參數
520...頻譜區識別器
522...資訊
530...雜訊值計算器
532...量化誤差資訊
540...量化器
542‧‧‧未經量化之頻譜表示型態
600‧‧‧虛擬程式碼、演繹法則
610‧‧‧第一部分
620‧‧‧第二部分
630‧‧‧第二部分
700‧‧‧方法
710、720‧‧‧步驟
800‧‧‧方法
810、820‧‧‧步驟
900‧‧‧音訊信號表示型態、已編碼之音訊信號表示型態
第1圖顯示根據本發明之實施例,雜訊填充器之方塊示意圖;第2圖顯示包含根據本發明之雜訊填充器之音訊信號解碼器之方塊示意圖;第3圖顯示用於實施第1圖之雜訊填充器之功能之虛擬程式碼;第4圖顯示可於根據第1圖之雜訊填充器進行之頻譜區識別之圖解代表圖;第5圖顯示根據本發明之實施例,雜訊填充參數計算器之方塊示意圖;第6圖顯示用於實施根據第5圖之雜訊填充參數計算器之功能之虛擬程式碼;第7圖顯示用於基於音訊信號之輸入頻譜表示型態,提供音訊信號之雜訊已填充之頻譜表示型態之方法之流程圖;第8圖顯示用於基於音訊信號之量化頻譜表示型態提供已雜訊化填充參數之流程圖;及第9圖顯示根據本發明之實施例,音訊信號表示型態之圖解代表圖。
100...雜訊填充器
110...輸入頻譜表示型態
112...雜訊已填充之頻譜表示型態
120...頻譜區識別器
122...指示已識別之頻譜區之資訊
130...雜訊插入器
Claims (15)
- 一種用於基於一音訊信號之輸入頻譜表示型態提供該音訊信號之一雜訊已填充之頻譜表示型態之雜訊填充器,該雜訊填充器包含:一頻譜區識別器,其配置來識別與該輸入頻譜表示型態之非零頻譜區間隔至少一個中間頻譜區之輸入頻譜表示型態之頻譜區而獲得已識別之頻譜區;及一雜訊插入器,其配置來將雜訊選擇性導入該已識別之頻譜區而獲得該音訊信號之雜訊已填充之頻譜表示型態。
- 如申請專利範圍第1項之雜訊填充器,其中該頻譜區識別器係配置來識別該輸入頻譜表示型態之頻譜線,該等頻譜線係經量化為零且包含至少一第一預定數目之量化為零之較低頻鄰近頻譜線及至少一第二預定數目之量化為零之較高頻鄰近頻譜線作為已識別之頻譜區;其中該第一預定數目係大於或等於1,及其中該第二預定數目係大於或等於1;及其中該雜訊插入器係配置來將雜訊選擇性導入該已識別之頻譜線,同時留下已量化為非零值之頻譜線,及量化為零之頻譜線但不具有該第一預定數目之量化為零之較低頻鄰近頻譜線或該第二預定數目之量化為零之較高頻鄰近頻譜線未受雜訊填充影響。
- 如申請專利範圍第2項之雜訊填充器,其中該第一預定數目係等於第二預定數目。
- 如申請專利範圍第1至3項中任一項之雜訊填充器,其中該雜訊填充器係配置來將雜訊只導入音訊信號之輸入頻譜表示型態上部之頻譜區,而留下該音訊信號之該輸入頻譜表示型態之下部不受雜訊填充影響。
- 如申請專利範圍第1項之雜訊填充器,其中該頻譜區識別器係組配來加總於一給定頻譜區之預定雙邊頻譜鄰近之頻譜區之已量化強度值(已量化(x(i)))以獲得一和值;及評估該和值而判定該給定頻譜區是否為一已識別之頻譜區。
- 如申請專利範圍第1項之雜訊填充器,其中該頻譜區識別器係配置來掃描該輸入頻譜表示型態之一頻譜區範圍而檢測量化為零之頻譜區之接續序列,及辨識所檢測之該接續序列之一個或多個中央頻譜區作為已識別之頻譜區。
- 一種基於音訊信號之已量化頻譜表示型態提供一雜訊填充參數之雜訊填充參數計算器,該雜訊填充參數計算器包含:一頻譜區識別器,其配置來識別與該量化頻譜表示型態之非零頻譜區間隔至少一個中間頻譜區之量化頻譜表示型態之頻譜區而獲得已識別之頻譜區;及一雜訊值計算器,其配置來選擇性考慮該已識別之頻譜區(i)之量化誤差(能量(x(i)))用於該雜訊填充參數之計算。
- 如申請專利範圍第7項之雜訊填充參數計算器, 其中該頻譜區識別器係配置來識別該輸入頻譜表示型態之頻譜線,該等頻譜線係經量化為零且包含至少一第一預定數目之量化為零之較低頻鄰近頻譜線及至少一第二預定數目之量化為零之較高頻鄰近頻譜線作為已識別之頻譜區;其中該第一預定數目係大於或等於1,及其中該第二預定數目係大於或等於1;及其中該雜訊值計算器係組配來選擇性考慮該已識別之頻譜區(i)之量化誤差用於該雜訊填充參數之計算,同時留下量化為非零值之頻譜線,及量化為零之頻譜線但不具有該第一預定數目之量化為零之較低頻鄰近頻譜線或該第二預定數目之量化為零之較高頻鄰近頻譜線並未不考慮用於雜訊填充參數之計算。
- 如申請專利範圍第7至8項中任一項之雜訊填充參數計算器,其中該雜訊值計算器係配置來考慮該已識別之頻譜區(i)之量化誤差之實際能量(能量(x(i)))用於該雜訊填充參數(nf,nf_index)之計算。
- 如申請專利範圍第7項之雜訊填充參數計算器,其中該雜訊值計算器係配置來相對於集中於一單一頻譜區或集中於多數連續頻譜線之調性量化誤差能,強調分布於多數已識別之頻譜區之非調性量化誤差能(能量(x(i)))。
- 如申請專利範圍第7項之雜訊填充參數計算器,其中該雜訊值計算器係配置來計算該已識別之頻譜區之對數化量化誤差能(log10(能量(x(i))))之和,以獲得該雜訊填 充參數(nf,nf_index)。
- 一種表示一音訊信號之已編碼音訊信號表示型態,該已編碼音訊信號表示型態包含:該音訊信號之一已編碼已量化頻譜域表示型態;及一已編碼雜訊填充參數;其中該雜訊填充參數表示量化為零且與該頻譜域表示型態中量化為非零值之頻譜區間隔至少一個中間頻譜區之該頻譜域表示型態之頻譜區之一量化誤差。
- 一種用於基於該音訊信號之一輸入頻譜表示型態提供一音訊信號之雜訊已填充頻譜表示型態之方法,該方法包含:識別與該輸入頻譜表示型態之非零頻譜區間隔至少一個中間頻譜區之該輸入頻譜表示型態之頻譜區而獲得已識別之頻譜區;及將雜訊選擇性導入該等已識別之頻譜區而獲得該音訊信號之雜訊已填充之頻譜表示型態。
- 一種用於基於一音訊信號之已量化頻譜表示型態提供一雜訊填充參數之方法,該方法包含:識別與該已量化頻譜表示型態之非零頻譜區間隔至少一個中間頻譜區之該已量化頻譜表示型態之頻譜區而獲得已識別之頻譜區;及選擇性考慮該已識別之頻譜區之量化誤差用於該雜訊填充參數之計算。
- 一種電腦程式,其係用於當該電腦程式於一電腦上跑時執行如申請專利範圍第13或14項之方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7987208P | 2008-07-11 | 2008-07-11 | |
US10382008P | 2008-10-08 | 2008-10-08 | |
PCT/EP2009/004653 WO2010003565A1 (en) | 2008-07-11 | 2009-06-26 | Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201007696A TW201007696A (en) | 2010-02-16 |
TWI417871B true TWI417871B (zh) | 2013-12-01 |
Family
ID=40941986
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098122013A TWI417871B (zh) | 2008-07-11 | 2009-06-30 | 雜訊填充器、雜訊填充參數計算器、經編碼音訊信號表示型態、方法和電腦程式 |
TW098122400A TWI492223B (zh) | 2008-07-11 | 2009-07-02 | 音訊編碼器、音訊解碼器、用以編碼及解碼音訊信號之方法、音訊串流與電腦程式 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098122400A TWI492223B (zh) | 2008-07-11 | 2009-07-02 | 音訊編碼器、音訊解碼器、用以編碼及解碼音訊信號之方法、音訊串流與電腦程式 |
Country Status (22)
Country | Link |
---|---|
US (9) | US8983851B2 (zh) |
EP (12) | EP2304719B1 (zh) |
JP (2) | JP5622726B2 (zh) |
KR (4) | KR101582057B1 (zh) |
CN (2) | CN102089808B (zh) |
AR (2) | AR072482A1 (zh) |
AT (1) | ATE535903T1 (zh) |
AU (2) | AU2009267459B2 (zh) |
BR (6) | BR122021003726B1 (zh) |
CA (2) | CA2730361C (zh) |
CO (2) | CO6341671A2 (zh) |
EG (1) | EG26480A (zh) |
ES (5) | ES2422412T3 (zh) |
HK (2) | HK1157045A1 (zh) |
MX (2) | MX2011000382A (zh) |
MY (2) | MY178597A (zh) |
PL (3) | PL3246918T3 (zh) |
PT (1) | PT2304719T (zh) |
RU (2) | RU2519069C2 (zh) |
TW (2) | TWI417871B (zh) |
WO (2) | WO2010003556A1 (zh) |
ZA (2) | ZA201100091B (zh) |
Families Citing this family (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
US8553897B2 (en) * | 2009-06-09 | 2013-10-08 | Dean Robert Gary Anderson | Method and apparatus for directional acoustic fitting of hearing aids |
US9101299B2 (en) * | 2009-07-23 | 2015-08-11 | Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust | Hearing aids configured for directional acoustic fitting |
US8879745B2 (en) * | 2009-07-23 | 2014-11-04 | Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust | Method of deriving individualized gain compensation curves for hearing aid fitting |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US20120029926A1 (en) | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
US9008811B2 (en) | 2010-09-17 | 2015-04-14 | Xiph.org Foundation | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
WO2012053150A1 (ja) * | 2010-10-18 | 2012-04-26 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
WO2012122297A1 (en) * | 2011-03-07 | 2012-09-13 | Xiph. Org. | Methods and systems for avoiding partial collapse in multi-block audio coding |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
MX2013010537A (es) | 2011-03-18 | 2014-03-21 | Koninkl Philips Nv | Codificador y decodificador de audio con funcionalidad de configuracion. |
US9530419B2 (en) * | 2011-05-04 | 2016-12-27 | Nokia Technologies Oy | Encoding of stereophonic signals |
EP2728577A4 (en) * | 2011-06-30 | 2016-07-27 | Samsung Electronics Co Ltd | APPARATUS AND METHOD FOR GENERATING A BANDWIDTH EXTENSION SIGNAL |
JP6190373B2 (ja) * | 2011-10-24 | 2017-08-30 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ信号ノイズ減衰 |
US8942397B2 (en) | 2011-11-16 | 2015-01-27 | Dean Robert Gary Anderson | Method and apparatus for adding audible noise with time varying volume to audio devices |
JP5942463B2 (ja) * | 2012-02-17 | 2016-06-29 | 株式会社ソシオネクスト | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
US20130282372A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
CN110047499B (zh) | 2013-01-29 | 2023-08-29 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
KR101757347B1 (ko) | 2013-01-29 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 지각적 변환 오디오 코딩에서의 노이즈 채움 |
AU2014211520B2 (en) | 2013-01-29 | 2017-04-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-frequency emphasis for LPC-based coding in frequency domain |
MY197063A (en) | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
US9940942B2 (en) * | 2013-04-05 | 2018-04-10 | Dolby International Ab | Advanced quantizer |
CN105164918B (zh) * | 2013-04-29 | 2018-03-30 | 杜比实验室特许公司 | 具有动态阈值的频带压缩 |
MY173644A (en) | 2013-05-24 | 2020-02-13 | Dolby Int Ab | Audio encoder and decoder |
SG11201510513WA (en) | 2013-06-21 | 2016-01-28 | Fraunhofer Ges Forschung | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
US9530422B2 (en) | 2013-06-27 | 2016-12-27 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
EP2830060A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in multichannel audio coding |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
ES2641580T3 (es) | 2013-10-03 | 2017-11-10 | Dolby Laboratories Licensing Corporation | Generación de señal difusa adaptativa en un mezclador ascendente |
AU2014339086B2 (en) * | 2013-10-22 | 2017-12-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
PL3288026T3 (pl) | 2013-10-31 | 2020-11-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału pobudzenia w dziedzinie czasu |
PL3355305T3 (pl) | 2013-10-31 | 2020-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu |
RU2636697C1 (ru) | 2013-12-02 | 2017-11-27 | Хуавэй Текнолоджиз Ко., Лтд. | Устройство и способ кодирования |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
BR112016020988B1 (pt) * | 2014-03-14 | 2022-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
EP2980801A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
JPWO2016052191A1 (ja) * | 2014-09-30 | 2017-07-20 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US9830927B2 (en) | 2014-12-16 | 2017-11-28 | Psyx Research, Inc. | System and method for decorrelating audio data |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
WO2016162283A1 (en) * | 2015-04-07 | 2016-10-13 | Dolby International Ab | Audio coding with range extension |
US9454343B1 (en) | 2015-07-20 | 2016-09-27 | Tls Corp. | Creating spectral wells for inserting watermarks in audio signals |
US9311924B1 (en) | 2015-07-20 | 2016-04-12 | Tls Corp. | Spectral wells for inserting watermarks in audio signals |
US9626977B2 (en) | 2015-07-24 | 2017-04-18 | Tls Corp. | Inserting watermarks into audio signals that have speech-like properties |
US10115404B2 (en) | 2015-07-24 | 2018-10-30 | Tls Corp. | Redundancy in watermarking audio signals that have speech-like properties |
EA035078B1 (ru) | 2015-10-08 | 2020-04-24 | Долби Интернэшнл Аб | Многоуровневое кодирование сжатых представлений звука или звукового поля |
EP4411732A3 (en) | 2015-10-08 | 2024-10-09 | Dolby International AB | Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations |
US10142742B2 (en) | 2016-01-01 | 2018-11-27 | Dean Robert Gary Anderson | Audio systems, devices, and methods |
EP3208800A1 (en) * | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
BR112017024480A2 (pt) * | 2016-02-17 | 2018-07-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | pós-processador, pré-processador, codificador de áudio, decodificador de áudio e métodos relacionados para aprimoramento do processamento transiente |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
EP3382702A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
CN111386568B (zh) * | 2017-10-27 | 2023-10-13 | 弗劳恩霍夫应用研究促进协会 | 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质 |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US11694708B2 (en) * | 2018-09-23 | 2023-07-04 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11264014B1 (en) * | 2018-09-23 | 2022-03-01 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
WO2020073148A1 (en) * | 2018-10-08 | 2020-04-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Transmission power determination for an antenna array |
EP4220639A1 (en) * | 2018-10-26 | 2023-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
WO2020164752A1 (en) | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
JP7564117B2 (ja) * | 2019-03-10 | 2024-10-08 | カードーム テクノロジー リミテッド | キューのクラスター化を使用した音声強化 |
WO2020207593A1 (en) * | 2019-04-11 | 2020-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program |
US11361776B2 (en) | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
US11538489B2 (en) | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
US20200402522A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
CN112037802B (zh) * | 2020-05-08 | 2022-04-01 | 珠海市杰理科技股份有限公司 | 基于语音端点检测的音频编码方法及装置、设备、介质 |
US11545172B1 (en) * | 2021-03-09 | 2023-01-03 | Amazon Technologies, Inc. | Sound source localization using reflection classification |
CN114900246B (zh) * | 2022-05-25 | 2023-06-13 | 中国电子科技集团公司第十研究所 | 噪声基底估计方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4703505A (en) * | 1983-08-24 | 1987-10-27 | Harris Corporation | Speech data encoding scheme |
EP0968497B1 (en) * | 1996-10-07 | 2001-07-11 | PictureTel Corporation | Variable length audio coding using a plurality of subband bit allocation patterns |
TW454170B (en) * | 1998-08-24 | 2001-09-11 | Conexant Systems Inc | Speech codec employing speech classification for noise compensation |
US20060241940A1 (en) * | 2005-04-20 | 2006-10-26 | Docomo Communications Laboratories Usa, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4956871A (en) | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
JPH0934493A (ja) | 1995-07-20 | 1997-02-07 | Graphics Commun Lab:Kk | 音響信号符号化装置、音響信号復号装置および音響信号処理装置 |
US6092041A (en) | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
US5797120A (en) * | 1996-09-04 | 1998-08-18 | Advanced Micro Devices, Inc. | System and method for generating re-configurable band limited noise using modulation |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6167133A (en) * | 1997-04-02 | 2000-12-26 | At&T Corporation | Echo detection, tracking, cancellation and noise fill in real time in a communication system |
RU2237296C2 (ru) * | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
US7124079B1 (en) * | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
JP3804902B2 (ja) | 1999-09-27 | 2006-08-02 | パイオニア株式会社 | 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置 |
FI116643B (fi) | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
MXPA02010770A (es) * | 2001-03-02 | 2004-09-06 | Matsushita Electric Ind Co Ltd | Aparato para codificar y aparato para descodificar. |
US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
DE60209888T2 (de) * | 2001-05-08 | 2006-11-23 | Koninklijke Philips Electronics N.V. | Kodieren eines audiosignals |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
KR100462611B1 (ko) | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
JP4218271B2 (ja) * | 2002-07-19 | 2009-02-04 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
KR100477699B1 (ko) * | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
KR101141247B1 (ko) * | 2003-10-10 | 2012-05-04 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 디지털 신호를 확장성 비트스트림으로 인코딩하는 방법;확장성 비트스트림을 디코딩하는 방법 |
US7723474B2 (en) | 2003-10-21 | 2010-05-25 | The Regents Of The University Of California | Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies |
US7436786B2 (en) * | 2003-12-09 | 2008-10-14 | International Business Machines Corporation | Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization |
JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7613306B2 (en) | 2004-02-25 | 2009-11-03 | Panasonic Corporation | Audio encoder and audio decoder |
AU2004319555A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding models |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US7873515B2 (en) * | 2004-11-23 | 2011-01-18 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for error reconstruction of streaming audio information |
KR100707173B1 (ko) | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
ATE490454T1 (de) * | 2005-07-22 | 2010-12-15 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
JP4627737B2 (ja) * | 2006-03-08 | 2011-02-09 | シャープ株式会社 | デジタルデータ復号化装置 |
US7564418B2 (en) | 2006-04-21 | 2009-07-21 | Galtronics Ltd. | Twin ground antenna |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
US7275936B1 (en) * | 2006-09-22 | 2007-10-02 | Lotes Co., Ltd. | Electrical connector |
US8275611B2 (en) | 2007-01-18 | 2012-09-25 | Stmicroelectronics Asia Pacific Pte., Ltd. | Adaptive noise suppression for digital speech signals |
CN101617362B (zh) * | 2007-03-02 | 2012-07-18 | 松下电器产业株式会社 | 语音解码装置和语音解码方法 |
CN101939782B (zh) * | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
PT2186089T (pt) * | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
US8554551B2 (en) * | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
EP2304719B1 (en) * | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
WO2012053150A1 (ja) | 2010-10-18 | 2012-04-26 | パナソニック株式会社 | 音声符号化装置および音声復号化装置 |
-
2009
- 2009-06-25 EP EP09776839.4A patent/EP2304719B1/en active Active
- 2009-06-25 ES ES11157188T patent/ES2422412T3/es active Active
- 2009-06-25 PL PL17175883.2T patent/PL3246918T3/pl unknown
- 2009-06-25 PT PT97768394T patent/PT2304719T/pt unknown
- 2009-06-25 PL PL09776839T patent/PL2304719T3/pl unknown
- 2009-06-25 EP EP24167799.6A patent/EP4375998A1/en active Pending
- 2009-06-25 BR BR122021003726-4A patent/BR122021003726B1/pt active IP Right Grant
- 2009-06-25 ES ES17175883T patent/ES2955669T3/es active Active
- 2009-06-25 MX MX2011000382A patent/MX2011000382A/es active IP Right Grant
- 2009-06-25 CN CN200980127118.8A patent/CN102089808B/zh active Active
- 2009-06-25 EP EP24167725.1A patent/EP4407610A1/en active Pending
- 2009-06-25 KR KR1020147004791A patent/KR101582057B1/ko active IP Right Grant
- 2009-06-25 EP EP24167801.0A patent/EP4407612A1/en active Pending
- 2009-06-25 RU RU2011104006/08A patent/RU2519069C2/ru active
- 2009-06-25 KR KR1020117000768A patent/KR101518532B1/ko active IP Right Grant
- 2009-06-25 EP EP23178772.2A patent/EP4235660B1/en active Active
- 2009-06-25 ES ES11157204.6T patent/ES2526767T3/es active Active
- 2009-06-25 EP EP17175883.2A patent/EP3246918B1/en active Active
- 2009-06-25 BR BR122021003752-3A patent/BR122021003752B1/pt active IP Right Grant
- 2009-06-25 BR BR122021003142-8A patent/BR122021003142B1/pt active IP Right Grant
- 2009-06-25 JP JP2011516991A patent/JP5622726B2/ja active Active
- 2009-06-25 WO PCT/EP2009/004602 patent/WO2010003556A1/en active Application Filing
- 2009-06-25 BR BRPI0910811-4A patent/BRPI0910811B1/pt active IP Right Grant
- 2009-06-25 ES ES09776839.4T patent/ES2642906T3/es active Active
- 2009-06-25 BR BR122021003097-9A patent/BR122021003097B1/pt active IP Right Grant
- 2009-06-25 KR KR1020157036527A patent/KR101706009B1/ko active IP Right Grant
- 2009-06-25 MY MYPI2011000098A patent/MY178597A/en unknown
- 2009-06-25 EP EP24167794.7A patent/EP4407611A1/en active Pending
- 2009-06-25 CA CA2730361A patent/CA2730361C/en active Active
- 2009-06-25 EP EP24167804.4A patent/EP4407614A1/en active Pending
- 2009-06-25 EP EP24167802.8A patent/EP4407613A1/en active Pending
- 2009-06-25 AU AU2009267459A patent/AU2009267459B2/en active Active
- 2009-06-25 EP EP24167758.2A patent/EP4372744A1/en active Pending
- 2009-06-25 EP EP24167780.6A patent/EP4372745A1/en active Pending
- 2009-06-26 PL PL09776859T patent/PL2304720T3/pl unknown
- 2009-06-26 CN CN2009801270908A patent/CN102089806B/zh active Active
- 2009-06-26 AT AT09776859T patent/ATE535903T1/de active
- 2009-06-26 RU RU2011102410/08A patent/RU2512103C2/ru active
- 2009-06-26 JP JP2011516997A patent/JP5307889B2/ja active Active
- 2009-06-26 AU AU2009267468A patent/AU2009267468B2/en active Active
- 2009-06-26 CA CA2730536A patent/CA2730536C/en active Active
- 2009-06-26 ES ES09776859T patent/ES2374640T3/es active Active
- 2009-06-26 EP EP09776859A patent/EP2304720B1/en active Active
- 2009-06-26 BR BRPI0910522-0A patent/BRPI0910522A2/pt not_active Application Discontinuation
- 2009-06-26 MX MX2011000359A patent/MX2011000359A/es active IP Right Grant
- 2009-06-26 WO PCT/EP2009/004653 patent/WO2010003565A1/en active Application Filing
- 2009-06-26 MY MYPI2011000076A patent/MY155785A/en unknown
- 2009-06-26 KR KR1020117000435A patent/KR101251790B1/ko active IP Right Grant
- 2009-06-30 TW TW098122013A patent/TWI417871B/zh active
- 2009-07-02 TW TW098122400A patent/TWI492223B/zh active
- 2009-07-07 AR ARP090102551 patent/AR072482A1/es active IP Right Grant
- 2009-07-13 AR ARP090102626A patent/AR072497A1/es active IP Right Grant
-
2011
- 2011-01-04 ZA ZA2011/00091A patent/ZA201100091B/en unknown
- 2011-01-04 ZA ZA2011/00085A patent/ZA201100085B/en unknown
- 2011-01-07 CO CO11001536A patent/CO6341671A2/es active IP Right Grant
- 2011-01-10 EG EG2011010058A patent/EG26480A/en active
- 2011-01-11 US US13/004,493 patent/US8983851B2/en active Active
- 2011-01-11 US US13/004,508 patent/US9043203B2/en active Active
- 2011-01-13 CO CO11003109A patent/CO6280569A2/es active IP Right Grant
- 2011-10-03 HK HK11110436.8A patent/HK1157045A1/xx unknown
-
2012
- 2012-01-19 HK HK12100643.7A patent/HK1160285A1/zh unknown
-
2014
- 2014-01-16 US US14/157,185 patent/US9449606B2/en active Active
- 2014-12-24 US US14/582,828 patent/US9711157B2/en active Active
-
2016
- 2016-09-15 US US15/266,862 patent/US10629215B2/en active Active
-
2017
- 2017-07-07 US US15/643,908 patent/US11024323B2/en active Active
-
2021
- 2021-05-17 US US17/322,656 patent/US11869521B2/en active Active
-
2023
- 2023-11-29 US US18/522,732 patent/US12080305B2/en active Active
- 2023-11-29 US US18/522,762 patent/US12080306B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4703505A (en) * | 1983-08-24 | 1987-10-27 | Harris Corporation | Speech data encoding scheme |
EP0968497B1 (en) * | 1996-10-07 | 2001-07-11 | PictureTel Corporation | Variable length audio coding using a plurality of subband bit allocation patterns |
TW454170B (en) * | 1998-08-24 | 2001-09-11 | Conexant Systems Inc | Speech codec employing speech classification for noise compensation |
US20060241940A1 (en) * | 2005-04-20 | 2006-10-26 | Docomo Communications Laboratories Usa, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI417871B (zh) | 雜訊填充器、雜訊填充參數計算器、經編碼音訊信號表示型態、方法和電腦程式 | |
JP3762579B2 (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
CN1181467C (zh) | 利用自适应噪声本底相加和噪声替换限制,增强信源编码和解码的方法和系统 | |
CN110189760B (zh) | 对音频信号的频谱执行噪声填充的装置 | |
JP3739959B2 (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
US8831959B2 (en) | Transform audio codec and methods for encoding and decoding a time segment of an audio signal | |
US9275649B2 (en) | Method and system for encoding audio data with adaptive low frequency compensation | |
JP2008518264A (ja) | 振幅の包絡線を有するパラメトリックオーディオコーディング | |
CN110998722B (zh) | 低复杂性密集瞬态事件检测和译码 | |
US20240194209A1 (en) | Apparatus and method for removing undesired auditory roughness | |
Gunjal et al. | Traditional Psychoacoustic Model and Daubechies Wavelets for Enhanced Speech Coder Performance | |
US10089993B2 (en) | Apparatus and method for comfort noise generation mode selection |