TW202333143A - 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備 - Google Patents
在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備 Download PDFInfo
- Publication number
- TW202333143A TW202333143A TW111149823A TW111149823A TW202333143A TW 202333143 A TW202333143 A TW 202333143A TW 111149823 A TW111149823 A TW 111149823A TW 111149823 A TW111149823 A TW 111149823A TW 202333143 A TW202333143 A TW 202333143A
- Authority
- TW
- Taiwan
- Prior art keywords
- spectral
- value
- frequency
- noise
- audio decoder
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 826
- 238000000034 method Methods 0.000 title claims abstract description 233
- 238000001914 filtration Methods 0.000 title claims abstract description 202
- 238000001228 spectrum Methods 0.000 claims description 209
- 238000012545 processing Methods 0.000 claims description 35
- 238000013139 quantization Methods 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 19
- 230000002829 reductive effect Effects 0.000 claims description 19
- 230000000873 masking effect Effects 0.000 description 46
- 238000010586 diagram Methods 0.000 description 38
- 230000006978 adaptation Effects 0.000 description 34
- 230000011664 signaling Effects 0.000 description 32
- 230000007774 longterm Effects 0.000 description 29
- 238000007493 shaping process Methods 0.000 description 28
- 230000001419 dependent effect Effects 0.000 description 24
- 238000004364 calculation method Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 20
- 230000005236 sound signal Effects 0.000 description 20
- 230000002123 temporal effect Effects 0.000 description 20
- 238000012937 correction Methods 0.000 description 16
- 238000012417 linear regression Methods 0.000 description 16
- 230000001052 transient effect Effects 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 238000009795 derivation Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013213 extrapolation Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002087 whitening effect Effects 0.000 description 3
- 240000004759 Inga spectabilis Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000945 filler Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- -1 substituted Chemical class 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
根據本發明之實施例係關於在音訊寫碼中使用一濾波用於頻譜時間改善頻譜間隙填充之方法及設備。
根據本發明之實施例係關於在音訊寫碼中使用不同雜訊填充方法用於頻譜時間改善頻譜間隙填充之方法及設備。
根據本發明之實施例係關於在音訊寫碼中使用一傾斜用於頻譜時間改善頻譜間隙填充之方法及設備。
Description
發明領域
根據本發明之實施例係關於在音訊寫碼中使用一濾波用於頻譜時間改善頻譜間隙填充之方法及設備。
根據本發明之實施例係關於在音訊寫碼中使用不同雜訊填充方法用於頻譜時間改善頻譜間隙填充之方法及設備。
根據本發明之實施例係關於在音訊寫碼中使用一傾斜用於頻譜時間改善頻譜間隙填充之方法及設備。
根據本發明之實施例係關於使用頻譜傾斜資訊用於音訊寫碼之解碼器、編碼器及方法。
根據本發明之其他實施例係關於使用一預測滯後資訊及/或使用一滯後值及一增益值及/或一高頻能量值或一高頻能量差量值用於音訊寫碼之解碼器、編碼器及方法。
根據本發明之其他實施例係關於使用一濾波強度調適之解碼器及方法。
根據本發明之其他實施例係關於使用一濾波強度調適之解碼器及方法。
發明背景
習知音訊寫碼方法包含用於以隨機頻譜值填充頻譜範圍之零量化部分的技術。作為一實例,感知雜訊取代(PNS)解碼器可將偽隨機值插入至零量化頻帶中,經縮放以使得插入信號能量匹配經傳信目標能量。然而,對於此類方法,許多位元可能必須保留以用於零量化頻帶能量之傳信。此外,僅全零量化頻譜帶可經取代,因此此類方法可能缺乏靈活性。
其他雜訊填充方法可允許在解碼後以高於某一「雜訊填充開始頻率」之偽隨機值替代零量化頻譜係數,然而,因此可能需要較大傳信額外負荷,尤其在許多頻帶零量化時。
因此,需要得到基於經寫碼音訊資訊之聽覺印象與用於傳輸經寫碼音訊資訊之傳信工作量之間產生較佳折衷的概念。
此係藉由本申請案之獨立請求項之標的物實現的。
根據本發明之其他實施例係由本申請案之附屬技術方案之主題定義。
發明概要
在下文中,根據本發明之態樣解釋、構造本發明之實施例。然而,應注意,以下構造係出於解釋性目的,以便促進理解本發明。
因此,應注意,根據根據本發明之任何態樣的實施例之任何特徵、功能性及/或細節可個別地或以組合方式與根據本發明之相同及/或另一態樣的任何其他實施例一起使用及/或併入於其中。
此外,將在解碼器之上下文中解釋一些本發明實施例,且將在編碼器之上下文中解釋其他本發明實施例。應注意,在解碼器之上下文中所解釋的特徵、功能性及細節可類似地個別地或以組合方式實施於對應編碼器中或添加至對應編碼器或與對應編碼器一起使用。反之亦然,如對於本發明編碼器所揭露之特徵、功能性及細節可併入於對應解碼器中。因此,應注意,解碼器及對應編碼器(或反之亦然)可基於類似及/或等效發明概念,且可因此包含對應優點。
此外,將在方法之上下文中解釋其他發明性態樣。應注意,如在本發明編碼器及/或解碼器中之任一者之上下文中所解釋的特徵、功能性及/或細節中之任一者可個別地或以組合方式併入至本發明方法中之任一者或可與本發明方法中之任一者一起使用,或可添加至本發明方法中之任一者。此外,根據本發明之實施例的方法可基於與對應編碼器及/或解碼器相同或類似或相似的考慮因素及/或構想。因此,此等方法可包含相同或類似或相似的特徵及優點。
根據以上解釋,一些特徵、功能性及細節可在實施例之上下文中根據特定態樣或編碼器而非解碼器或反之亦然來解釋或揭露,或出於簡潔及簡明起見,根據方法來解釋或揭露。因此,此外,應強調,一實施例之任何特徵、功能性及/或細節可個別地或以組合方式併入根據本發明之任何其他實施例或與根據本發明之任何其他實施例一起使用或添加至根據本發明之任何其他實施例。
態樣1
根據本發明之第一態樣的實施例包含一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之音訊解碼器,其中該音訊解碼器經組配以自該經編碼音訊資訊導出一頻譜傾斜資訊,例如T'
sf。此外,該音訊解碼器經組配以使用填充值(例如間隙填充係數;例如雜訊填充之雜訊值;例如智慧型間隙填充之間隙填充值),以便填充經解碼頻譜值集合一頻譜孔。
此外,該音訊解碼器經組配以例如以乘法方式將頻譜傾斜係藉由頻譜傾斜資訊來判定之頻率可變縮放應用於該等填充值,例如應用於取代零量化樣本之雜訊樣本,其中作為一實例,該頻率可變縮放之頻譜傾斜係藉由頻譜傾斜資訊判定。
本發明之發明人認識到,經解碼音訊資訊之品質可使用用於填充經解碼頻譜值集合之頻譜孔的填充值之頻率可變縮放來改善。因此,根據本發明之實施例的音訊解碼器可經組配以自判定頻率可變縮放可基於之經編碼音訊資訊導出頻譜傾斜資訊。
舉例而言,根據本發明之第一態樣之實施例的一個主要想法為計算及例如低位元速率傳信例如在對數強度域中,在訊框(及/或子訊框)(例如,真實)之頻譜包絡(例如,其輸入信號包絡)與訊框(及/或子訊框)之遮蔽包絡(例如,其雜訊塑形包絡)之間的差異曲線。由於可將遮蔽包絡傳輸至解碼器,例如,差異之額外傳輸可允許在頻譜孔填充程序中(例如,在間隙或雜訊填充解碼程序中)自遮蔽包絡及差異曲線重構例如真實頻譜包絡。因此,根據本發明,差異曲線可由頻譜傾斜資訊表徵。使用對應發明性解碼器,音訊資訊之良好準確度及/或品質可例如以少數旁側資訊位元達成。
頻譜傾斜資訊可例如為一逐訊框及/或一逐子訊框頻譜傾斜資訊。作為一實例,頻譜傾斜資訊可包含傾斜索引,例如t
sf,作為一實例,可基於該傾斜索引判定資訊T'
sf,其中T'
sf可例如與頻率相依項(例如,f)相乘以便將頻率可變縮放應用於填充值。任擇地,可不傳輸零量化非重疊頻率範圍中之目標能量的顯式傳輸,因此可將傳信工作量保持在低位準處。
本發明之發明人認識到,使用頻譜傾斜,音訊資訊之頻譜包絡可在僅具有極少額外傳信位元之情況下自音訊資訊之遮蔽包絡(例如,雜訊塑形包絡,例如,對應於或相關聯於訊框及/或子訊框之縮放值或縮放因數的遮蔽包絡)恢復。
根據根據本發明之第一態樣的其他實施例,音訊解碼器經組配以自經編碼音訊資訊導出雜訊位準資訊(例如,L
sf),且音訊解碼器經組配以例如除了頻率可變縮放之外亦使用該雜訊位準資訊,以便獲得填充值。
舉例而言,雜訊位準資訊(例如,L
sf)可自雜訊位準索引導出或重構,例如N位元雜訊位準索引0≤l
sf<2
N。舉例而言,雜訊位準資訊及/或雜訊位準索引可自對應編碼器傳輸至解碼器。作為一實例,雜訊位準資訊及/或雜訊位準索引可例如包含關於頻譜傾斜資訊之資訊(例如,亦即,關於差異曲線之其他資訊),例如偏移,例如O
sf。換言之,解碼器可經組配以自雜訊位準資訊及/或自雜訊位準索引導出關於頻譜傾斜資訊之資訊(例如,亦即,關於差異曲線之其他資訊)。
本發明之發明人認識到,使用雜訊位準資訊用於解碼可允許判定改善之填充值,例如允許經編碼音訊信號之良好重構。
根據根據本發明之第一態樣的其他實施例,該音訊解碼器經組配以應用該頻率可變縮放,使得該頻率可變縮放在對數強度階上例如在為+/-3 dB或+/-2 dB或+/-1 dB之一容限內描述例如填充值之強度隨頻率增大之線性減小。
本發明之發明人認識到,在對數強度階上使用或藉由強度隨著頻率增大之線性減低,可達成音訊資訊之頻譜包絡的改善重構。作為一實例,可補償在音訊資訊之遮蔽包絡之計算期間所應用的預加重傾斜之影響,使得可至少大致恢復頻譜包絡。
根據根據本發明之第一態樣的其他實施例,頻譜傾斜資訊描述對數域中之頻譜傾斜,例如其中頻譜傾斜(例如,頻譜傾斜資訊)可例如用於對數域及/或線性域中。
應注意,根據本發明之實施例不限於對數域中之頻譜傾斜資訊。頻譜傾斜資訊可例如用於對數域及/或線性域中。在對數域中之使用可允許以低計算成本計算例如頻譜傾斜之填充值。
根據根據本發明之第一態樣的其他實施例,該頻譜傾斜資訊描述在一對數域中具有一頻譜傾斜之一線函數。
本發明之發明人認識到,在對數域中具有頻譜傾斜之此形式之函數允許以良好準確度有效地解碼音訊資訊。
根據根據本發明之第一態樣之其他實施例,音訊解碼器經組配以在對數域中獲得用於頻率可變縮放之縮放值,且音訊解碼器經組配以例如使用指數函數(例如使用以10為底之指數函數;例如使用形式10
x之函數)將用於頻率可變縮放之縮放值自對數域轉換至線性域。
根據本發明之實施例,計算域(例如,對數域或線性域)可例如經改變或經調適用於不同處理步驟。本發明之發明人認識到,域之此類切換或改變可改善本發明之音訊寫碼概念之靈活性。此外,可藉由在各別適合域中執行不同處理步驟來減少計算成本。
根據根據本發明之第一態樣之其他實施例,該音訊解碼器經組配以取決於基於該傾斜資訊之一傾斜值(例如,T'
sf)與一頻率值(例如f,例如描述該頻率之一頻率值或描述相對於一參考值之一頻率偏移之一頻率值)的一乘積而獲得用於頻率可變縮放之縮放值。
作為一實例,傾斜值可例如藉由常數(例如額外常數)縮放,以便平均維持雜訊位準資訊(例如L
sf)之值範圍。本發明之發明人認識到,用於頻率可變縮放之縮放值可例如使用傾斜值與頻率值之乘積以低計算工作量獲得。
根據根據本發明之第一態樣的其他實施例,音訊解碼器經組配以獲得與不同頻帶相關聯之用於頻率可變縮放的多個縮放值,例如使得縮放值與不同頻帶相關聯。
本發明之發明人認識到,使用與不同頻帶相關聯之縮放值,音訊資訊之解碼可在例如複雜度或靈活性方面得以改善。
根據根據本發明之第一態樣的其他實施例,該音訊解碼器經組配以使用各別頻帶之開始頻率或使用各別頻帶之中心頻率獲得用於頻率可變縮放之縮放值;其中,例如,與第一頻帶相關聯之縮放值係使用第一頻帶之(例如,較低)開始頻率與傾斜值之乘法獲得,且其中,例如,與第二頻帶相關聯之縮放值係使用第二頻帶之(例如,較低)開始頻率與傾斜值之乘法獲得;或其中,例如,與第一頻帶相關聯之縮放值係使用第一頻帶之中心頻率與傾斜值之乘法獲得,且其中,例如,與第二頻帶相關聯之縮放值係使用第二頻帶之中心頻率與傾斜值之乘法獲得。
應注意,根據本發明之實施例不限於對各別頻帶之頻率表示的特定選擇。如之前所解釋,可使用開始頻率及/或中心頻率。然而,可實施頻帶資訊之其他(例如應用特定)有利選擇。因此,根據實施例的本發明概念可提供高靈活性。
根據根據本發明之第一態樣的其他實施例,音訊解碼器經組配以使用各別頻帶之開始頻率區間索引或使用各別頻帶之中心頻率區間索引獲得用於頻率可變縮放之縮放值;其中,例如,與第一頻帶相關聯之縮放值係使用第一頻帶之(例如,較低)開始頻率區間索引與傾斜值之乘法獲得,且其中,例如,與第二頻帶相關聯之縮放值係使用第二頻帶之(例如,較低)開始頻率區間索引與傾斜值之乘法獲得;或其中,例如,與第一頻帶相關聯之縮放值係使用第一頻帶之中心頻率區間索引與傾斜值之乘法獲得,且其中,例如,與第二頻帶相關聯之縮放值係使用第二頻帶之中心頻率區間索引與傾斜值之乘法獲得。
本發明之發明人認識到,使用頻率區間索引(例如,替代頻率值)可允許降低計算成本。
根據根據本發明之第一態樣之其他實施例,音訊解碼器經組配以使用雜訊強度資訊(例如,L
sf)來獲得填充值;例如,使用頻率非相依雜訊縮放值,該頻率非相依雜訊縮放值可例如自經編碼音訊資訊導出;該經編碼音訊資訊可例如自l
sf導出。
因此,音訊解碼器可例如經組配以使用雜訊位準資訊及/或雜訊強度資訊判定或獲得填充值。任擇地,解碼器可例如經組配以導出雜訊強度資訊。在一些應用中,雜訊位準資訊可例如等於雜訊強度資訊。
根據根據本發明之第一態樣之其他實施例,該音訊解碼器經組配以使用雜訊值、頻率非相依雜訊縮放值(例如L
sf)與在考慮頻譜傾斜之情況下判定的頻率可變雜訊縮放值(例如,10
T 'sf * f)之乘法獲得一填充值;其中該雜訊值為一隨機雜訊值或一偽隨機雜訊值,例如,具有一預定振幅或具有在一預定振幅範圍內之振幅。
本發明之發明人認識到,用頻率非相依雜訊縮放值及基於頻譜傾斜之頻率可變雜訊縮放值調適雜訊值可改善經解碼音訊資訊之品質,而對各別解碼器之複雜度僅具有有限影響。頻率可變雜訊縮放值可允許塑形(例如,相對於頻率傾斜)音訊資訊之遮蔽包絡,以便更佳地近似得出原先經編碼音訊資訊之頻譜包絡。
根據根據本發明之第一態樣的其他實施例,音訊解碼器經組配以將基於遮蔽包絡之縮放應用於例如非零解碼頻譜值且應用於填充值,例如使得實際上遮蔽包絡應用於完整頻譜,任擇地包括填充值。
本發明之發明人認識到,例如,本發明縮放之應用可在不僅填充值,而且其他經解碼頻譜值受到縮放影響時改善經解碼音訊資訊。因此,音訊資訊之經解碼頻譜可例如經調適,例如取決於頻率而傾斜。
根據本發明之第一態樣之其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之音訊編碼器,其中該音訊編碼器經組配以編碼多個經量化頻譜值,且其中該音訊編碼器經組配以基於例如頻譜包絡之頻譜能量資訊及一遮蔽包絡資訊判定頻譜傾斜資訊(例如,描繪在對數域中具有頻譜傾斜之線函數的頻譜傾斜資訊,例如其中頻譜傾斜,例如頻譜傾斜資訊可例如用於對數域及/或線性域中),例如使得頻譜傾斜資訊描述頻譜能量與遮蔽包絡之間的差異的平均頻率變化。此外,該音訊編碼器經組配以編碼該頻譜傾斜資訊。
如之前所解釋,頻譜傾斜資訊可描述音訊資訊之頻譜能量與用於編碼音訊資訊之遮蔽包絡之間的形狀差異。此形狀差異可例如以頻率相依傾斜(在頻率-振幅平面中)之形式表達。因此,頻譜傾斜資訊可傳輸至對應的解碼器,且頻譜傾斜資訊可例如用作校正因數以調適所傳輸之遮蔽包絡,以便更佳地重構音訊資訊之頻譜包絡。
根據根據本發明之第一態樣的其他實施例,該音訊編碼器經組配以判定該頻譜傾斜資訊,使得該頻譜傾斜資訊描述頻譜能量資訊(例如「真實頻譜包絡」或頻譜值之平滑化(例如,在頻率方向上)版本)與遮蔽包絡資訊(例如表示為縮放因數或一或多個預測係數)之間的差異隨頻率的頻率變化,例如使得傾斜資訊描述頻率變化之平均值,或例如,使得傾斜資訊描述頻譜能量資訊與遮蔽包絡資訊之間的差異隨頻率之(例如,線性)回歸線之傾斜。
如之前所解釋,根據本發明之實施例的想法計算及例如低位元速率傳信例如在對數強度域中,在訊框(及/或子訊框) (例如,真實)之頻譜能量(例如頻譜包絡,例如其輸入信號包絡)與訊框(及/或子訊框)之遮蔽包絡之間的頻率變化,例如差異曲線。可使用頻譜傾斜資訊傳輸此資訊。因此,作為一實例,藉由提供遮蔽包絡及頻譜傾斜資訊且因此提供關於該差異曲線之資訊,可以良好準確度且以低傳信工作量執行音訊資訊之頻譜能量的重構。此可尤其改善零量化頻譜係數之重構,此係因為經雜訊填充或頻譜間隙填充之係數(在對應解碼器中)可例如使用頻譜傾斜資訊加以調適或校正,因此減小「初始」頻譜與音訊資訊之經重構或經解碼頻譜之間的差異。
根據根據本發明之第一態樣的其他實施例,該頻譜傾斜資訊描述在一對數域中具有一頻譜傾斜之一線函數。本發明之發明人認識到,此可允許傳信用於遮蔽包絡之校正資訊,以較少傳信位元及良好準確度更佳地近似得出音訊資訊之原始頻譜。
根據根據本發明之第一態樣的其他實施例,音訊編碼器經組配以例如使用頻譜能量資訊之對數化(例如頻率相依)表示且例如使用遮蔽包絡資訊之對數化(例如頻率相依)表示來在對數域中判定頻譜傾斜資訊。
如之前所解釋,本發明之發明人認識到,在對數域中對頻譜傾斜資訊之判定可在計算上有效地執行。
根據根據本發明之第一態樣的其他實施例,音訊編碼器經組配以基於可構成頻譜能量資訊的頻譜包絡之對數化表示(例如隨頻率而變)與可構成遮蔽包絡資訊的遮蔽包絡之對數化表示(例如隨頻率而變)之間的差異(例如差異曲線(f) =真實頻譜包絡(f)-遮蔽包絡(f),例如頻率相依差異)判定頻譜傾斜資訊。
本發明之發明人認識到,在對數域中對頻譜傾斜資訊之判定可作為例如簡單且可有效實施的差異操作而執行。
根據根據本發明之第一態樣的其他實施例,音訊編碼器經組配以使用線性回歸獲得頻譜傾斜資訊,其中頻譜傾斜資訊可例如為藉由例如在對數強度域中的(真實)頻譜包絡與遮蔽包絡之間的差異隨頻率的演進之線性回歸獲得之回歸係數。
本發明之發明人認識到,線性回歸可允許以有限複雜度及良好近似結果近似得出(例如真實)頻譜包絡與遮蔽包絡之間的校正項或差異項或(例如單調)差異曲線。基於校正項或差異項或例如單調差異曲線,可例如獲得頻譜傾斜資訊。任擇地,校正項或差異項或例如單調差異曲線可為頻譜傾斜資訊。
根據根據本發明之第一態樣的其他實施例,該音訊編碼器經組配以基於表示多個各別頻譜帶中之頻譜值之一能量的逐頻譜帶(例如加總)能量值或逐頻譜帶均方根值且基於表示例如多個各別頻譜帶中之遮蔽臨限值的能量位準之逐頻譜帶(例如加總)能量值或逐頻譜帶均方根值來獲得該頻譜傾斜資訊。
本發明之發明人認識到,用於獲得頻譜傾斜資訊之逐頻譜帶能量值(例如,差值平方和或均方根(RMS)值之表示的使用可允許將計算複雜度保持為低。然而,實施例不限於使用此類表示,因此亦可使用逐變換係數值。
根據根據本發明之第一態樣的其他實施例,該音訊編碼器經組配以針對不同音訊訊框及/或針對不同音訊子訊框判定單獨的頻譜傾斜資訊,例如單獨的頻譜傾斜值。
本發明之發明人認識到,逐訊框或逐子訊框頻譜傾斜資訊可允許判定有效校正資訊,例如待傳輸至對應解碼器之頻譜傾斜,以便改善音訊資訊之經解碼頻譜與音訊資訊之原始頻譜的擬合。
根據根據本發明之第一態樣的其他實施例,該音訊編碼器經組配以判定在包含多個頻譜區間之一頻率範圍內(例如在一頻帶上,或甚至在多個頻譜帶上,或甚至在所有頻帶上)以單一值之形式表示頻譜能量資訊與遮蔽包絡資訊之間的差異之差值(例如,O
sf或T
sf,例如偏移值O
sf;或例如傾斜值T
sf,例如量化例如至值t
sf,及/或可例如傳輸至例如雜訊填充解碼器,及/或可例如以例如否定形式用於雜訊填充編碼器中之值)。此外,音訊編碼器經組配以獲得雜訊位準資訊,其可例如取決於差值而描述多個頻譜帶或甚至所有頻帶上之雜訊位準,例如l
sf。
舉例而言,O
sf可為偏移,其可能實際上不需要或可能不需要編碼(但可任擇地使用)。舉例而言,T
sf可為經量化(例如,為t
sf)且可經傳輸的值,且其可例如在雜訊填充編碼器中(及/或在雜訊填充解碼器中)使用(例如,以否定形式)。
本發明之發明人認識到,使用單一差值可提供音訊資訊之(例如,傳信或傳輸)複雜度與重構準確度之間的良好折衷。作為一實例,可判定可描述遮蔽包絡相對於音訊資訊之原始頻譜在頻率上之傾斜的傾斜資訊。因此,根據遮蔽包絡調適且使用傾斜資訊校正的例如基於填充值之零量化頻譜係數之解碼器側校正可允許有效音訊資訊重構。
根據根據本發明之第一態樣之其他實施例,音訊編碼器經組配以使用線性回歸,例如使用上文提及之線性回歸獲得差值(例如,Osf或Tsf,例如偏移值Osf;或例如傾斜值Tsf,例如量化例如至值tsf,及/或可例如傳輸至例如雜訊填充解碼器,及/或可例如以例如否定形式用於雜訊填充編碼器中之值)。
本發明之發明人認識到,例如,在許多應用中,原始(例如「真實」)音訊信號頻譜包絡與遮蔽包絡之間的差異可包含大致線性的(例如在對數頻域中)特性。換言之,真實頻譜包絡與遮蔽包絡之間的強度差異可隨頻率單調地改變。例如,在對數強度域(例如,以10為底之對數)中且在間隙或雜訊填充頻譜區中,單調差異曲線可在大部分時間類似於直線。因此,使用線性回歸可允許以低計算成本及良好準確度近似得出對應差值。
根據根據本發明之第一態樣的其他實施例,音訊編碼器經組配以使用三個位元來編碼頻譜傾斜資訊。
此可允許傳信位元之數目與頻譜傾斜資訊之準確度之間的良好權衡。
根據根據本發明之第一態樣的其他實施例,音訊編碼器經組配以編碼頻譜傾斜資訊,使得經編碼頻譜傾斜資訊始終表示負頻譜傾斜,例如隨頻率增大而減小。
本發明之發明人認識到,負頻譜傾斜可例如允許經重構音訊資訊之良好調適或校正或改善。作為一實例,用負頻譜傾斜資訊進行之填充值之校正可補償預加重之不合需要的影響。
根據根據本發明之第一態樣之其他實施例,音訊編碼器經組配以針對一或多個訊框或子訊框sf (例如,音訊訊框或音訊子訊框)執行以下功能性:
1. 自一輸入例如未經寫碼頻譜計算逐頻譜帶能量值或RMS值E
sf(f);
2. 將一或多個值E
sf(f)轉換至對數域且自值E
sf(f)或例如自其對數化版本減去多個值E
sf(f)或例如其對數化版本之總體平均值,以獲得零平均值E'
sf(f);
3. 自零平均值E'
sf計算、量化及解量化遮蔽包絡M
sf;
4. 自M
sf重構逐頻譜帶能量值或RMS值,且自M
sf導出對數(或例如,對數化)及零平均值M'
sf(f);
5. 在成對的逐頻譜帶E'
sf與M'
sf之間進行線性回歸,以便獲得斜率T
sf及偏移O
sf;
6. 量化且自T
sf解量化傾斜索引t
sf;
7. 自t
sf重構傾斜值以獲得經解碼傾斜T'
sf,且使用-T'
sf*f用於計算雜訊位準索引I
sf。
本發明之發明人認識到,上述功能性可允許音訊資訊之有效編碼。
根據本發明之第一態樣的其他實施例包含一種用於基於經編碼音訊資訊提供經解碼音訊資訊之方法,該方法包含:自經編碼音訊資訊導出頻譜傾斜資訊,例如T'
sf;及使用填充值(例如間隙填充係數;例如雜訊填充之雜訊值;例如智慧型間隙填充之間隙填充值),以便填充經解碼頻譜值集合之頻譜孔。該方法進一步包含例如以乘法方式將頻譜傾斜係藉由頻譜傾斜資訊來判定之頻率可變縮放應用於填充值,例如應用於取代零量化樣本之雜訊樣本。
根據本發明之第一態樣的其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之方法,該方法包含:編碼多個經量化頻譜值;及基於一頻譜能量資訊(例如一頻譜包絡)及一遮蔽包絡資訊判定一頻譜傾斜資訊,例如使得該頻譜傾斜資訊描述該頻譜能量與該遮蔽包絡之間的差異之平均頻率變化。該方法進一步包含編碼該頻譜傾斜資訊。
根據本發明之第一態樣之另外實施例包含一種電腦程式,其用於在電腦程式於電腦上運行時執行以上方法中之任一者。
態樣2
根據本發明之一第二態樣的實施例包含一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之音訊解碼器,其中該音訊解碼器經組配以例如使用基於各別填充值而量化為零的頻譜係數之一取代來填充經解碼頻譜值集合之頻譜孔。此外,該音訊解碼器經組配以例如自一位元串流或自該經編碼音訊資訊獲得預測滯後資訊,例如頻域長預測滯後值p
sf;例如,指示頻率方向上之預測週期之預測滯後資訊,例如頻譜(LTP,例如,長期預測)距離值p
sf。
此外,該音訊解碼器經組配以取決於預測滯後資訊而在第一頻譜填充方法(例如「雜訊填充」+ FD LTP,例如若p
sf不為零)與一或多個其他頻譜填充方法(例如,第二頻譜填充方法或第三頻譜填充方法,例如無FD-LTP之「雜訊填充」;例如「間隙填充」,例如若p
sf為零)之間切換,在該第一頻譜填充方法中,使用頻率濾波或頻率預測(例如TNS或LTP (例如,其中與第一頻率相關聯之頻譜值對與第二頻率相關聯之頻譜值具有影響的濾波)來獲得用以填充頻譜孔之填充值,且在該一或多個其他頻譜填充方法中,不使用頻率濾波且不使用頻率預測(例如既不使用頻率濾波亦不使用頻率預測)來獲得用以填充頻譜孔之填充值。
根據本發明之第二態樣之實施例的想法係例如基於(例如,子)訊框之信號特性,適應性地在第一頻譜填充方法(例如,雜訊填充解決方案)與第二(或多個第二,例如,第二及第三)頻譜填充方法(例如,間隙填充解決方案)之間的切換。此外,第一頻譜填充方法可包含頻率濾波或頻率預測,例如頻率域長期預測(FD-LTP),且第二頻譜填充方法可不包含頻率濾波及頻率預測。因此,解碼器可例如在用於產生用於填充零量化頻譜係數之「人工」頻譜內容的不同方法之間切換。
本發明之發明人認識到,不同填充方法之間的切換可改善經重構(例如,經解碼)音訊信號。此外,本發明之發明人發現,預測滯後資訊可允許在僅對傳信複雜度具有有限影響之情況下控制不同填充方法之調適。作為一實例,根據實施例之解碼器可經組配以取決於預測滯後資訊,例如取決於FD-LTP滯後值p
sf而在具有FD-LTP之雜訊填充與無FD-LTP之基於調性之間隙填充(例如,類似於EVS中之IGF)或無FD-LTP之雜訊填充(例如,類似EVS或MPEG-D中之雜訊填充)之間切換或選擇。
作為另一任擇特徵,預測滯後資訊可例如包含例如僅整數值,以便降低計算複雜度。
因此,根據本發明之第二態樣的發明性寫碼概念可例如在切換或選擇頻譜孔填充方法時提供良好靈活性,以便達成用於音訊資訊之較佳寫碼效率。
預測滯後資訊可包含關於不同頻率區塊之例如零量化之頻譜係數之關係的資訊。預測滯後資訊可包含關於週期性或關於頻譜係數之減少的資訊。因此,預測滯後資訊可例如為例如零量化之頻譜係數之間的關係是否足夠或合適,以便取決於對應相關頻譜係數重構或近似得出頻譜係數的指示符。在此情況下,可例如達成良好聽覺印象,但可節省位元。
詳言之,作為一實例,本發明之發明人以實驗方式發現,例如,鼓掌類、下雨類及低頻LF男性語音信號可受益於在解碼器側頻譜孔填充(例如間隙或雜訊填充)期間的高頻HF精細時間信號包絡之改善的重構。對於可例如經偵測並分類為「長期瞬態」(例如,使用預測滯後資訊分類)之此等信號,特定(例如,子)訊框之精細時間結構可藉由例如頻域長期預測(FD-LTP)資訊之預測滯後資訊參數化。類似於例如時域(TD)中獲取之習知LTP音調及增益資訊,作為一實例,預測滯後資訊滯後及增益值(例如FD-LTP滯後及增益值)可例如直接在音訊編碼解碼器之變換域中獲得。待應用於解碼器中之頻譜孔填充之選擇可取決於在音訊位元串流中傳輸的該預測滯後資訊(例如FD-LTP滯後p或p
sf)之值而作出並傳信至解碼器。
根據根據本發明之第二態樣之其他實施例,音訊解碼器經組配以例如在預測滯後資訊(例如預測滯後值,例如經量化FD LTP滯後值,例如長期預測滯後值;例如p
sf)為非零的情況下例如選擇性地使用第一頻譜填充方法。替代地或例如另外,音訊解碼器經組配以在預測滯後資訊(例如預測滯後值;例如經量化FD LTP滯後值;例如p
sf)大於零的情況下例如選擇性地使用第一頻譜填充方法。此外,音訊解碼器經組配以例如在預測滯後資訊為零,或預測滯後資訊小於或等於零的情況下,例如選擇性地使用一或多個其他頻譜填充方法中之一者。
本發明之發明人認識到,預測滯後資訊可允許實施情況之簡單區別。作為一實例,在例如零量化頻譜係數之間的關係對於重構帶來優點(例如,時間信號之較佳重構)之情況下,預測滯後資訊可為非零或大於零。否則,解碼器可例如使用第二頻譜填充,例如在預測滯後資訊為零之情況下,其可與頻譜係數之間的小相依性相關聯。
根據根據本發明之第二態樣之其他實施例,該音訊解碼器經組配以使用包括於該經編碼音訊資訊中之預測滯後值之一經編碼表示(例如,經量化及經編碼表示),以便獲得該預測滯後值。
根據根據本發明之第二態樣的其他實施例,當使用第一頻譜填充方法時,該音訊解碼器經組配以使用預測或濾波(例如使用計算規則d*c(i) +G'
sf*c(i-P'
sf))判定例如最終填充值(例如用於c(i)之替代,例如č(i)),使得與給定頻率(例如與給定頻率區間)相關聯之給定填充值(例如č(i))係取決於與不同頻率(例如,具有不同頻率區間,例如具有頻率區間索引i-P'
sf之不同頻率區間,例如距給定頻率或距給定頻率區間具有頻譜距離P'
sf或頻譜距離d
sf之頻率或頻率區間)相關聯之另一頻譜值(例如c(i-P'
sf),或č (i-P'
sf))而獲得。
此外,當使用第一頻譜填充方法時,該音訊解碼器經組配以取決於與不同頻率(例如,具有不同頻率區間;例如具有頻率區間索引i-P'
sf之不同頻率區間)相關聯之經編碼或經量化頻譜值(例如,例如最初係由經編碼音訊資訊中的個別頻譜值之經編碼表示判定,例如由應用雜訊填充之前的頻譜值判定,例如由直接在算術解碼之後的頻譜值判定的頻譜值)調適濾波強度(例如,與不同頻率相關聯之頻譜值的加權,例如藉由將濾波強度選擇性地設定為G'
sf或1/2G'
sf)。
如之前所解釋,例如在預測滯後資訊為非零的情況下,與給定頻率相關聯之填充值可基於或使用與不同頻率相關聯之頻譜值來判定或獲得或計算,且因此作為一實例,指示信號之瞬態性。此外,本發明之發明人認識到,音訊資訊之解碼及/或重構可藉由取決於與不同頻率相關聯之經編碼或經量化頻譜值調適濾波強度來改善。
作為一實例,在選擇第一頻譜填充方法之情況下,例如在選擇具有FD-LTP之雜訊填充的情況下(例如,若預測滯後資訊為非零,作為一實例,若FD-LTP滯後為非零),可執行在解碼器側雜訊填充常式期間(例如,取決於「當前」寫碼FD係數是否為零,且例如取決於距當前係數一定距離(由經傳輸預測滯後資訊指定,例如由所傳輸FD-LTP滯後指定)處之對應「先前」寫碼FD係數是否為零)在音訊變換編解碼器之頻譜域(例如MDCT域)中應用長期預測性濾波器。
作為一實例,無限脈衝回應(IIR) LTP類濾波器可用於濾波。
根據根據本發明之第二態樣之其他實施例,濾波強度判定例如c(i-P'
sf)之另一頻譜值對給定填充值的影響。
本發明之發明人認識到,基於濾波強度調適另一頻譜值對給定填充值之影響可改善經解碼音訊資訊之品質。
根據根據本發明之第二態樣之其他實施例,音訊解碼器經組配以取決於與不同頻率相關聯之頻譜值(該頻譜值例如最初係由經編碼音訊資訊中之個別頻譜值之經編碼表示判定)而調適濾波強度。
本發明之發明人認識到,使用由用於調適濾波強度之經編碼表示表示的值允許使用或利用由經編碼表示而非其經濾波版本(其可例如交替)提供的資訊。已發現,相比於使用取決於在解碼器側上已經預處理之值的準則,使用此準則對於濾波強度之選擇更可靠。
根據根據本發明之第二態樣之其他實施例,該音訊解碼器經組配以在應用一雜訊填充之前取決於與該不同頻率相關聯之該頻譜值來調適該濾波強度。
本發明之發明人認識到,使用在雜訊填充之前的與不同頻率相關聯之頻譜值可允許基於頻譜值是否經量化為零之資訊來調適濾波強度。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以取決於與該不同頻率(或值)相關聯之該頻譜值是否量化為零而調適該濾波強度。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以取決於是否將雜訊填充應用於與不同頻率(或值)相關聯之頻譜值而調適濾波強度。
本發明之發明人認識到,使用此準則,例如,除針對頻譜值之各別頻率是否意欲執行或已執行雜訊填充以外,濾波強度調適亦可基於是否將各別頻譜值量化為零之資訊來執行。此可包含使用旗標。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以選擇性地對於針對其應用雜訊填充之頻譜值(例如針對位置i>=P'
sf處的每一雜訊填充零量化頻譜係數c)應用頻率方向上之濾波或頻率方向上之預測。
本發明之發明人認識到,作為一實例,可基於或使用頻率方向上之濾波或預測來近似得出或估計零量化頻譜值。因此,可例如利用不同頻譜值中之頻譜值在頻率方向上之相依性。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以應用預測或濾波,以便基於隨機或偽隨機雜訊值(例如c(i))判定給定(例如最終)填充值,例如č(i)。
本發明之發明人認識到,隨機或偽隨機雜訊值可例如使用預測或濾波來調適,以便計算例如可提供用於音訊資訊之例如原始例如輸入頻譜之零量化頻譜值之良好近似的最終填充值。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以執行與給定頻率相關聯之雜訊值及與另一頻率相關聯之雜訊值的加權組合,以便獲得給定(例如最終)填充值,例如č(i)。
作為一實例,音訊解碼器可經組配以執行組合d*c(i) + G'
sf*c(i-P'
sf),其中雜訊值c(i)之權重d與給定頻率相關聯,且雜訊值的權重G'
sf與另一頻率相關聯,或執行組合d*c(i) + ½*G'
sf*c(i-P'
sf),其中雜訊值c(i)之權重d與給定頻率相關聯,且雜訊值之權重½*G'
sf與另一頻率相關聯。
或者,音訊解碼器經組配以執行與給定頻率相關聯之雜訊值及與另一頻率相關聯之填充值的加權組合,以便獲得給定(例如最終)填充值,例如č(i)。
此外,音訊解碼器經組配以取決於雜訊填充是否已應用於與另一頻率相關聯之頻譜值而調整給定至與另一頻率相關聯之雜訊值的權重(例如G'
sf或½*G'
sf)或給定至與另一頻率相關聯之填充值的權重(例如G'
sf或½*G'
sf)。
如上所解釋,本發明之發明人認識到,例如最終填充值可例如使用例如與給定頻率相關聯之雜訊值及/或與另一頻率相關聯之雜訊值及/或與另一頻率相關聯之填充值的不同頻率相依性量來計算。因此,本發明概念可允許判定或獲得或計算具有良好靈活性之例如最終填充值,以使得根據特定情形,可獲得可良好或甚至最佳地適合於例如原始音訊資訊頻譜之重構的填充值。舉例而言,可基於預測滯後資訊執行待用於獲得例如最終填充值之各別量之選擇。此外,本發明之發明人認識到,與另一頻率相關聯之對應雜訊值或填充值之各別權重的調適或調整可改善例如最終填充值之判定,且因此改善音訊資訊之重構。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以執行與給定頻率相關聯之雜訊值及與另一頻率相關聯之雜訊值的加權組合,以便獲得給定(例如最終)填充值,例如č(i)。
作為一實例,音訊解碼器可經組配以執行組合d*c(i) + G'
sf*c(i-P'
sf),其中雜訊值c(i)之權重d與給定頻率相關聯,且雜訊值的權重G'
sf與另一頻率相關聯,或執行組合d*c(i) + ½*G'
sf*c(i-P'
sf),其中雜訊值c(i)之權重d與給定頻率相關聯,且頻譜(或雜訊)值之權重½*G'
sf與另一頻率相關聯。
或者,音訊解碼器經組配以執行與給定頻率相關聯之雜訊值及與另一頻率相關聯之填充值的加權組合,以便獲得給定(例如最終)填充值,例如č(i)。
此外,音訊解碼器經組配以取決於是否已針對與另一頻率相關聯之頻譜值應用雜訊填充而調整給出至與另一頻率相關聯之雜訊值或給出至與另一頻率相關聯之頻譜值或給出至與另一頻率相關聯之權重(例如,例如G'
sf或½*G'
sf)或給出至與另一頻率相關聯之頻譜值的權重,例如G'
sf或½*G'
sf。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以基於描述包括於音訊資訊之經編碼表示中的頻譜距離之經編碼資訊(例如經編碼值)判定與給定頻率相關聯之填充值與同不同頻率相關聯之另一頻譜值之間的頻譜距離,例如P'
sf(例如,基於P'
sf之頻譜距離d
sf)。
作為一實例,可對填充值(例如,雜訊樣本,例如取代零量化樣本之č(i))進行濾波,使得濾波強度取決於距i之頻譜距離d
sf處的經量化值c(i-d
sf)。在使用FD-LTP之情況下,d
sf可等於P'
sf。
本發明之發明人認識到,可例如使用頻譜距離以便改善對頻譜填充值之判定。
根據根據本發明之第二態樣之其他實施例,音訊解碼器經組配以基於包括於音訊資訊之經編碼表示中的增益資訊(例如,增益值,例如,g
sf)判定應用於與給定頻率相關聯之雜訊值的權重(例如,d),其中應用於與給定頻率相關聯之雜訊值的該權重為正值,例如在0.5與1之間的範圍內。
本發明之發明人認識到,權重之此判定及應用可例如允許調整與給定頻率相關聯之雜訊值,以便更佳地近似得出音訊資訊之原始頻譜包絡。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以取決於包括於音訊資訊之經編碼表示中的增益資訊(例如增益值,例如g
sf)判定應用於與另一頻率相關聯之雜訊值(例如c(i-P'
sf))或與另一頻率相關聯之填充值的權重(G
sf=(-1)
Ssf*(3+2*g
sf)/8,或½*G
sf),其中應用於與給定頻率相關聯之雜訊值的權重例如為正或負值,例如具有在0.25與0.75之間的絕對值。
本發明之發明人認識到,各別雜訊值或與另一頻率相關聯之各別填充值可例如用取決於增益資訊判定之權重加以調適。此可允許對該雜訊或填充值進行塑形以改善其與最初經編碼音訊資訊之對應頻譜值的匹配。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以取決於包括於音訊資訊之經編碼表示中的正負號資訊(例如正負號值,例如S
sf)而判定應用於與另一頻率相關聯之雜訊值(例如,c(i-P'
sf)f)或與另一頻率相關聯之填充值的權重,例如G
sf=(-1)
Ssf*(3+2*g
sf)/8,或½*G
sf。
本發明之發明人認識到,例如,使用正負號資訊,例如1位元資訊,可例如改善權重判定。作為一實例,正負號資訊可允許例如最終填充值相對於其可基於的與另一頻率相關聯之雜訊值及/或填充值的相位關係之調適。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以在係數c(i-P'
sf)係使用雜訊填充獲得的情況下(例如在頻譜位置i-P'
sf處的係數c(i-P'
sf)在先前處理中被標記為雜訊填充零量化頻譜係數的情況下)根據č(i)=d*c(i) + G'
sf*c(i-P'
sf)判定給定填充值č(i),且在係數c(i-P'
sf)並非係使用雜訊填充獲得的情況下(例如在頻譜位置i-P'
sf處之係數c(i-P'
sf)在先前處理中並未被標記為雜訊填充零量化頻譜係數的情況下)根據č(i)=d*c(i) + ½*G'
sf*c(i-P'
sf)判定給定填充值č(i)。c(i)表示使用雜訊填充獲得且具有頻譜索引i之頻譜係數,d表示衰減係數,G'
sf表示基於包括於經編碼音訊表示中之增益值的權重;且c(i-P'
sf)表示具有頻譜索引i-P'
sf之頻譜係數(其可例如使用雜訊獲得,或其可例如在不使用雜訊填充的情況下獲得,且其可例如使用預測或濾波獲得),其中P'
sf為基於包括於經編碼音訊表示中之預測參數資訊的預測參數或濾波參數。
本發明之發明人認識到,使用上述等式,可判定有效填充值。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以根據P'
sf=p
sf+B獲得預測參數或濾波參數P'
sf,其中p
sf為包括於經編碼音訊表示中之滯後索引,且其中B為常數,其中B可例如等於用以編碼p
sf之位元的數目,其中p
sf可例如採用0與2
B-1之間的值。另外或替代地,音訊解碼器經組配以根據G'
sf=(-1)
Ssf* (3+2*g
sf)/8獲得權重G'
sf,其中S
sf為例如以經編碼形式包括於經編碼表示中之二進位值,且其中g
sf為例如以經編碼形式包括於經編碼表示中之二進位值。替代地或另外,音訊解碼器經組配以根據d=(7.5-g
sf)/8獲得衰減係數d,其中g
sf為例如以經編碼形式包括於經編碼表示中之二進位值。
作為一實例,可根據給定訊框是否具有多於一個子訊框來選擇常數B。本發明之發明人認識到,使用上述等式,可達成解碼之傳信工作量、複雜性及有效性之間的良好權衡。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以標記雜訊填充零量化頻譜係數,且音訊解碼器經組配以選擇性地使用應用於未標記為雜訊填充零量化頻譜係數之頻譜係數的減小之濾波強度,例如½*G'
sf。
本發明之發明人認識到,用於未標記頻譜係數之濾波強度之減小可例如改善音訊資訊之原始頻譜之重構或近似得出。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以取決於預測滯後資訊及/或取決於音訊資訊之調性而在第二頻譜填充方法(例如,「雜訊填充」,其中隨機或偽隨機填充值用以填充頻譜孔,例如不使用頻率濾波且不使用頻率預測以便獲得填充值)與第三頻譜填充方法(例如「間隙填充」,其中使用非零頻譜係數之複製獲得的填充值用來填充頻譜孔)之間切換。任擇地,可例如取決於調性資訊之存在及/或取決於調性資訊及/或取決於HPF資料而判斷調性。作為另一任擇特徵,第二頻譜填充方法及第三頻譜填充方法為例如「一或多個其他頻譜填充方法」。
本發明之發明人認識到,音訊資訊之解碼可例如藉由在隨機或偽隨機填充值之使用與非零頻譜之複製之間例如在頻率距離內(例如在由預測滯後資訊判定之頻率距離內)切換來改善。此外,本發明之發明人認識到,此切換可基於預測滯後資訊及/或取決於音訊資訊之調性來執行。
作為一實例,將音訊資訊或例如子訊框分類為「音調」可基於先前技術音訊調性資料來執行,例如藉由在音訊調性資料存在的情況下(例如,TD-LTP/HPF資料為非零)將sf分類為「音調」。或者,作為另一實例,sf可僅在傳輸TD-LTP/HPF增益值且其為最大值的情況下才被分類為「音調」。
根據根據本發明之第二態樣之其他實施例,音訊解碼器經組配以基於經編碼音訊資訊獲得調性資訊,例如,定量地描述經編碼音訊資訊之調性內容之調性值,或例如基於經編碼音訊資訊之音訊內容是否為音調之調性旗標,以例如自位元串流獲得逐訊框或逐子訊框(例如,逐音訊訊框或逐音訊子訊框)時間(音訊調性)音調資訊j
sf。此外,音訊解碼器經組配以取決於調性資訊而在第二頻譜填充方法(例如,「雜訊填充」,例如基於隨機或偽隨機雜訊值之雜訊填充)與第三頻譜填充方法(例如,「間隙填充」)之間切換。
本發明之發明人認識到,若解碼器經組配以自或基於經編碼音訊資訊獲得調性資訊,則可改善傳信工作量。
根據根據本發明之第二態樣之其他實施例,音訊解碼器經組配以例如自位元流或自經編碼音訊資訊獲得預測滯後資訊,例如頻域長預測滯後值p
sf,例如頻譜(LTP,例如長期預測)距離值p
sf。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以取決於包括於經編碼音訊表示中且可由音訊解碼器自經編碼音訊資訊提取之調性資訊及/或取決於指示調性資訊是否包括於經編碼音訊資訊中之資訊(例如旗標)及/或取決於濾波增益值及/或取決於預測增益值(例如TD-LTP增益值)及/或取決於時域後置濾波器增益值(HPF增益值,例如諧波後置濾波器增益值)而判斷,例如判定或決定,音訊資訊是否為音調。
如上文所解釋,根據本發明之實施例不限於音訊資訊之調性特性的特定評估。因此,本發明之解碼器可包含用於檢測調性資訊之良好靈活性。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以針對低於例如較高雜訊填充結束頻率之較高頻區中的頻譜孔之填充應用高頻雜訊增益調整。
作為一實例,使用高頻雜訊增益調整,用於填充頻譜孔之填充值的頻譜能量可經調整以允許例如原始音訊輸入頻譜之較佳重構。
根據根據本發明之第二態樣之其他實施例,音訊解碼器經組配以例如使用包括於經編碼音訊資訊中之經編碼高頻能量資訊值的解碼,基於經編碼音訊資訊獲得高頻能量資訊,例如高頻能量差量值。
作為一實例,高頻能量資訊,例如HF能量值(或例如,在差分熵寫碼之情況下之差量)可表示例如稍微低於雜訊填充結束頻率(例如,在8 kHz至10 kHz頻率範圍內)的音訊資訊之頻譜時間正規化之頻譜係數(經量化為零)的原始能量,例如原始RMS能量。舉例而言,高頻能量資訊可經量化,如AAC中之縮放因數,例如在1.51 dB之步長中對數性地量化。
使用高頻能量資訊,可有效地解碼及/或重構音訊資訊。任擇地,增益調整可基於高頻能量資訊而執行。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以取決於高頻能量值(例如EHF
sf,其可例如以經編碼形式包括於經編碼音訊表示中)、取決於全域增益值(例如GG
sf,其可例如以經編碼形式包括於經編碼音訊表示中)且取決於例如寬頻雜訊位準資訊(其可例如寬於與高頻能量值所相關聯的頻率區之頻率區相關聯,例如L
sf,其可例如以經編碼形式包括於經編碼音訊表示中)而獲得高頻能量差量值(例如nrFac
sf)。此外,音訊解碼器經組配以應用高頻能量差量值來獲得一或多個雜訊填充值。
作為一實例,為了將傳達關於高頻能量值之資訊至解碼器所需的傳信額外負荷降至最低,可將關於能量值之資訊作為相對於全域增益值(例如核心寫碼器之全域增益)及雜訊位準資訊(例如雜訊位準)乘積之差量值進行傳輸,例如作為「雜訊增益正規化」值,例如GG
sf*L
sf。此可例如藉由傳輸高頻能量值與全域增益值與雜訊位準資訊之乘積之間的比率之對數的經捨入縮放結果來實現。
本發明之發明人認識到,基於增益值與雜訊位準資訊之乘積,可獲得HF能量值,其允許獲得填充可提供例如原始輸入音訊頻譜之良好重構之頻譜孔的雜訊填充值。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以選擇性地將與低於例如較高雜訊填充結束頻率之較高頻區中之頻率相關聯的一或多個中間雜訊填充值與高頻能量差量值相乘,例如,而使低於該較高頻區之一較低頻率區中之雜訊值不受該高頻能量差量值影響。
使用此方法,較高頻區中之雜訊強度可例如基於可在位元串流中編碼之高頻能量差量值加以調整。以此方式,可例如改善聽覺印象。
根據根據本發明之第二態樣的其他實施例,音訊解碼器經組配以將高頻雜訊增益調整選擇性地應用於執行雜訊填充所針對的頻譜值,而例如使不執行雜訊填充的頻譜值不受影響。
本發明之發明人認識到,在計算工作量與最佳化工作量之間的良好折衷可藉由例如僅對被執行雜訊填充的頻譜值進行增益調整來達成。
根據根據本發明之第二態樣的其他實施例,該音訊解碼器經組配以例如基於單一共同高頻能量值或基於單一共同高頻能量差量值而例如選擇性地應用在8 kHz與10 kHz之間的頻率範圍中之高頻雜訊增益調整。
本發明之發明人認識到,在上述頻率範圍內應用高頻雜訊增益調整可提供額外複雜度與經解碼音訊資訊之品質之間的良好折衷。
根據根據本發明之第二態樣之其他實施例,高頻能量值或高頻能量差量值表示頻率低於且例如鄰近於雜訊填充結束頻率或在低於且例如鄰近於雜訊填充結束頻率的頻率區中的多個例如頻譜時間正規化頻譜係數(量化為零)之例如原始(例如RMS)能量。
因此,較高頻區中之雜訊可經調整為接近於例如原始強度,例如真實強度。
根據本發明之第二態樣的其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之音訊編碼器,其中該音訊編碼器經組配以編碼多個經量化頻譜值,且其中該音訊編碼器經組配以獲得,例如判定,滯後值,例如FD-LTP滯後,例如滯後值P
sf,其界定待由音訊解碼器執行以導出用於填充頻譜孔的一或多個填充值的濾波操作(例如在頻率方向上)或預測操作(例如在頻率方向上)之特性。此外,音訊編碼器經組配以獲得,例如判定,增益值,例如G
sf,該增益值界定待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作之特性。此外,若例如G
sf之增益值小於臨限值,例如β,或若增益值之絕對值小於臨限值,則音訊編碼器經組配以例如選擇性地設定或例如改變滯後值為零,藉此獲得經修改之滯後值,例如p
sf=0;且若增益值被修改,則音訊編碼器經組配以例如使用3或4個位元編碼所判定的滯後值或經修改之滯後值,其中例如編碼經修改滯後值。
舉例而言,如之前所解釋,可基於預測滯後資訊執行經解碼頻譜值集合之頻譜孔的解碼器側填充。預測滯後資訊可對應於,例如可為或可包含,滯後值或經修改滯後值,或可使用該滯後值或經修改滯後值確定。因此,基於此滯後資訊,音訊資訊之解碼及/或重構可例如有效地執行。
本發明之發明人認識到,滯後值可根據增益值來判定,該增益值與待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作相關聯。簡言之,且作為一實例,若增益值不顯著,則滯後值可設定為零。此調適可得到經修改滯後值。
舉例而言,在增益值低或不顯著的情況下,在來自不同頻帶之頻譜係數之間可能僅存在弱關係,因此可對應於此等值之間在頻率方向上的相關性的滯後資訊可能不可利用,或例如因為逐增益低影響相關性而可能不適用於頻譜值重構。因此,藉由在增益過小的情況下將滯後值設定為零,可節省位元速率。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以使用應用於例如處於滯後B<p'<B+2
B處的一組頻譜值(例如應用於頻譜時間正規化頻譜)的自相關資訊判定滯後值及增益值,其中例如,滯後值(例如P
sf)係取決於基於該組頻譜值獲得的自相關函數之峰值之位置而判定。
作為一實例,自相關資訊可為正規化自相關資訊。一般而言,滯後值(或經修改滯後值)、用於頻譜係數之濾波及/或預測之增益值及/或正負號索引或對應索引可例如在例如變換係數量化之前利用之頻譜時間正規化域中計算。
根據根據本發明之第二態樣之其他實施例,若經編碼之滯後值(例如滯後值或經修正滯後值)為非零,則音訊編碼器經組配以選擇性地編碼該增益值。
作為實例,反之亦然,如之前所解釋,若增益值顯著,且滯後值為非零,則可執行頻譜係數(例如雜訊填充或間隙填充頻譜值)之預測或濾波,因此,作為一實例,僅在此類情況下,才可提供用於增益值及滯後值之傳信位元。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以在經編碼滯後值為零的情況下選擇性地編碼高頻能量值,該高頻能量值描述例如輸入音訊資訊或其經預處理版本之頻譜之上部部分中的能量。
作為一實例,在由於不利增益及/或滯後值而可能不執行對頻譜係數之濾波或預測的情況下,可提供高頻能量值,例如以按對應頻譜能量執行雜訊填充或間隙填充。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以取決於經編碼滯後值選擇性地編碼增益值或高頻能量值,其描述頻譜(例如輸入音訊資訊或其經預處理版本)之上部部分中的能量。
作為實例,藉由使用增益值或高頻能量值之選擇性編碼,可減少傳信工作量。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以使用相同數目個位元編碼增益值及高頻能量值,其中例如,增益值係使用一個位元用於正負號且一個位元用於量值而編碼,且其中例如,高頻能量值係使用2個位元編碼。
本發明之發明人認識到,可提供使用相同數目個位元來編碼增益值及高頻能量值,可提供可互換編碼,使得可關於滯後值採取編碼內容之決策,而不必調適待編碼之位元的數目。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以針對不同音訊訊框及/或不同音訊子訊框判定單獨滯後值及/或單獨增益值。
本發明之發明人認識到,逐訊框及/或逐子訊框滯後值及/或增益值可改善音訊資訊之寫碼。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以例如使用一組頻譜值(例如使用在頻率方向上對該組頻譜值中之週期性的分析)在變換域中獲得滯後值及/或增益值。
本發明之發明人認識到,可以計算上有效之方式執行該資訊之判定或獲得。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以執行長期瞬態性偵測,且在發現例如由sf指定之音訊訊框或音訊子訊框不為長期瞬態的情況下將滯後值選擇性地設定為零。
由於滯後值可例如為用於訊框或子訊框之瞬態性的指示符,因此倘若未偵測到瞬態性,該值可設定為零。因此,在未偵測到訊框或子訊框之瞬態性的情況下,編碼器可進一步基於瞬態性偵測而暫時中止解碼器中對零量化頻譜值的濾波或預測。
根據本發明之其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之音訊編碼器,其中該音訊編碼器經組配以編碼多個經量化頻譜值,且其中該音訊編碼器經組配以編碼一高頻能量值或一高頻能量差量值。此外,高頻能量值或高頻能量差量值表示頻率低於且例如鄰近於雜訊填充結束頻率或在低於且例如鄰近於雜訊填充結束頻率的頻率區中的多個例如頻譜時間正規化頻譜係數(量化為零)之例如原始(例如RMS)能量。
如之前所解釋,高頻能量值(或例如在差分熵寫碼之情況下之差量)可表示稍微低於雜訊填充結束頻率(例如在8 kHz至10 kHz頻率範圍內)之頻譜時間正規化頻譜係數(經量化為零)的原始能量,例如原始RMS能量。
為了最小化傳信額外負荷以將高頻能量值傳達至解碼器,能量值可例如作為例如相對於全域增益及雜訊位準乘積之差量傳輸,例如作為「雜訊增益正規化」值傳輸。此可例如藉由傳輸高頻能量值與全域增益與雜訊位準之乘積之間的比率之對數的經捨入縮放結果來實現。
作為一實例,基於高頻能量值或高頻能量差量值,在解碼器中,可例如使用間隙填充來重構零量化頻譜係數,使得該等零量化係數(例如,原始音訊信號)之能量至少得以近似得出。
根據根據本發明之第二態樣的其他實施例,該音訊編碼器經組配以對數性地量化高頻能量值或高頻能量差量值。
本發明之發明人認識到,可以計算上有效之方式執行對數量化。
根據根據本發明之第二態樣的其他實施例,該音訊編碼器經組配以編碼高頻能量差量值,其描述頻率低於且例如鄰近於雜訊填充結束頻率或在低於且例如鄰近於雜訊填充結束頻率之頻率區中的多個例如頻譜時間正規化頻譜係數(經量化為零)相對於由音訊編碼器編碼的全域增益與由音訊編碼器編碼的雜訊位準之乘積的能量。
本發明之發明人認識到,高頻能量差量值之編碼可例如最小化傳信額外負荷。
根據根據本發明之第二態樣的其他實施例,音訊編碼器經組配以獲得高頻能量值與全域增益與雜訊資訊之乘積之間的比率之對數的經捨入縮放結果,以便編碼高頻能量值,例如以高頻能量差量值之形式。
本發明之發明人意識到,可以計算上有效之方式獲得經捨入縮放結果。
根據根據本發明之第二態樣之其他實施例,音訊編碼器經組配以根據Ehf
sf=1+round(Δ*log
2(EHF
sf/(GG
sf*L
sf))判定經量化高頻能量差量值,其中EHF為高頻能量值,例如例如經量化為零之頻譜值的HF原始RMS能量,其中GG
sf為全域增益,其中L
sf為雜訊位準,且其中Δ為常數。
本發明之發明人認識到,上式之使用可允許對經量化高頻能量差量值之有效判定。
根據本發明之其他實施例包含一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之方法,該方法包含:基於各別填充值例如使用量化為零之頻譜係數之取代填充經解碼頻譜值集合之頻譜孔;及例如自位元串流或經編碼音訊資訊獲得預測滯後資訊,例如頻域長期預測滯後值p
sf,例如指示頻率方向上之預測週期的預測滯後資訊,例如頻譜(LTP,例如長期預測)距離值psf。此外,該方法包含取決於預測滯後資訊而在第一頻譜填充方法(例如「雜訊填充」+ FD LTP)與一或多個其他頻譜填充方法(例如第二頻譜填充方法或第三頻譜填充方法,例如「間隙填充」)之間切換,在該第一頻譜填充方法中,使用頻率濾波或頻率預測(例如TNS或LTP,例如其中與第一頻率相關聯之頻譜值對與第二頻率相關聯之頻譜值具有影響的濾波)來獲得用以填充頻譜孔之填充值,且在該一或多個其他頻譜填充方法中,不使用頻率濾波且不使用頻率預測來獲得用以填充頻譜孔之填充值。
根據本發明之其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之方法,該方法包含:編碼多個經量化頻譜值;及獲得,例如判定,滯後值,例如FD-LTP滯後,例如滯後值P
sf,其界定待由音訊解碼器執行以用於導出用於填充頻譜孔之一或多個填充值的濾波操作(例如在頻率方向上)或預測操作(例如在頻率方向上)之特性。該方法進一步包含:獲得,例如判定,增益值,例如G
sf,其界定待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作之特性;及在該增益值(例如G
sf)小於臨限值(例如β)的情況下或在該增益值之絕對值小於臨限值的情況下將該滯後值例如選擇地設定或例如改變為零,以藉此獲得經修改滯後值,例如p
sf=0。此外,該方法包含例如使用3或4個位元編碼所判定之滯後值或經修飾滯後值,其中例如若增益值被修改,則編碼經修改滯後值。
根據本發明之其他實施例包含一種電腦程式,其用於在該電腦程式在一電腦上運行時執行上文所解釋之方法中之任一者。
根據本發明之其他實施例,該音訊解碼器經組配以執行與給定頻率相關聯之雜訊值及與另一頻率相關聯之頻譜值(例如,雜訊值或填充值,或經處理或未經處理編碼值)之加權組合,或與給定頻率相關聯之填充值及與另一頻率相關聯之頻譜值(例如,雜訊值或填充值,或經處理或未經處理編碼值)之加權組合,以便獲得給定填充值。此外,該音訊解碼器經組配以取決於是否已針對與另一頻率相關聯之頻譜值應用雜訊填充而調整給出至與另一頻率相關聯之頻譜值的權重。
其他實施例包含一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之音訊解碼器,其中該音訊解碼器經組配以填充一經解碼頻譜值集合之頻譜孔。此外,該音訊解碼器經組配以:獲得預測滯後資訊;及取決於預測滯後資訊而在第一頻譜填充方法與一或多個其他頻譜填充方法之間切換,在該第一頻譜填充方法中,使用頻率濾波或頻率預測來獲得用以填充頻譜孔之填充值,且在該一或多個其他頻譜填充方法中,不使用頻率濾波且不使用頻率預測來獲得用以填充頻譜孔之填充值。
根據本發明之其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之音訊編碼器,其中該音訊編碼器經組配以編碼多個經量化頻譜值。此外,該音訊編碼器經組配以獲得一增益值,該增益值界定待由一音訊解碼器執行以用於導出用於填充頻譜孔之一或多個填充值的一濾波操作或一預測操作之一特性。此外,該音訊編碼器經組配以編碼該增益值,且若一經量化增益值或一經編碼增益值為非零,則選擇性地編碼一滯後值,該滯後值界定待由一音訊解碼器執行以用於導出用於填充頻譜孔之一或多個填充值的該濾波操作或該預測操作之一特性。替代地或另外,該音訊編碼器經組配以在該增益值大於或等於臨限值的情況下,選擇性地編碼一滯後值,該滯後值界定待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作之特性。
根據本發明之其他實施例包含一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之方法,該方法包含:填充一經解碼頻譜值集合之頻譜孔;獲得一預測增益資訊;及取決於該預測增益資訊而在第一頻譜填充方法與一或多個其他頻譜填充方法之間切換,在該第一頻譜填充方法中,使用頻率濾波或頻率預測來獲得用以填充頻譜孔之填充值,且在該一或多個其他頻譜填充方法中,不使用頻率濾波且不使用頻率預測來獲得用以填充頻譜孔之填充值。
根據本發明之其他實施例包含一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之方法,該方法包含:編碼多個量化頻譜值;獲得一增益值,該增益值界定待由一音訊解碼器執行以用於導出用於填充頻譜孔之一或多個填充值的一濾波操作或一預測操作之特性;編碼該增益值;若一經量化增益值或一經編碼增益值為非零,則選擇性地編碼一滯後值,該滯後值界定待由一音訊解碼器執行以用於導出用於填充頻譜孔的一或多個填充值的濾波操作或預測操作之特性;或若該增益值大於或等於臨限值,則選擇性地編碼一滯後值,該滯後值界定待由一音訊解碼器執行以用於導出用於填充頻譜孔的一或多個填充值的濾波操作或預測操作之特性。
態樣3
根據本發明之第三態樣之其他實施例包含一種用於基於經編碼音訊表示提供一經解碼音訊表示之音訊解碼器,其中該音訊解碼器經組配以例如使用量化為零的頻譜係數之取代基於各別填充值使用各別填充值填充經解碼頻譜值集合之頻譜孔。此外,該音訊解碼器經組配以使用預測或濾波(例如使用計算規則d*c(i) +G'
sf*c(i-P'
sf))判定例如最終填充值(例如用於c(i)之替代,例如č(i)),使得與給定頻率(例如與給定頻率區間)相關聯之給定填充值(例如č(i))係取決於與不同頻率(例如,具有不同頻率區間,例如具有頻率區間索引i-P'
sf之不同頻率區間,例如距給定頻率或距給定頻率區間具有頻譜距離P'
sf或頻譜距離d
sf之頻率或頻率區間)相關聯之另一頻譜值(例如c(i-P'
sf),或č (i-P'
sf))而獲得。
此外,該音訊解碼器經組配以取決於與不同頻率(例如,具有不同頻率區間;例如具有頻率區間索引i-P'
sf之不同頻率區間)相關聯之經編碼或經量化頻譜值(例如,例如最初由經編碼音訊資訊中的個別頻譜值之經編碼表示判定,例如由應用雜訊填充之前的頻譜值判定,例如由直接在算術解碼之後的頻譜值判定之頻譜值)調適濾波強度(例如,與不同頻率相關聯之頻譜值的加權,例如藉由將濾波強度選擇性地設定為G'
sf或1/2G'
sf)。
本發明之發明人認識到,可使用預測或濾波基於與不同頻率相關聯之其他頻譜值來判定或計算或獲得填充值。換言之,且作為一實例,可利用不同頻率(例如不同頻帶)之頻譜值的頻譜係數之相關性或相依性。
因此,可例如藉由利用此類相關性而減少寫碼工作量及/或可改善聽覺印象。因此,使用預測係數及/或濾波係數,填充值可藉由需要傳輸的減少之位元量判定,同時仍提供最初經編碼音訊信號之良好表示。
此外,本發明之發明人認識到,經編碼音訊表示之解碼可例如藉由取決於與不同頻率相關聯之經編碼或經量化頻譜值而調適濾波強度來改善。
如之前所解釋,與一給定頻率相關聯之填充值可例如,在預測滯後資訊為非零,且因此作為一實例,指示信號之瞬態性之情況下,可基於或使用與不同頻率相關聯之頻譜值來判定或獲得或計算。
作為一實例,在選擇第一頻譜填充方法之情況下,例如在選擇具有FD-LTP之雜訊填充的情況下(例如,若預測滯後資訊為非零,作為一實例,若FD-LTP滯後為非零),可執行在解碼器側雜訊填充常式期間(例如,取決於「當前」寫碼FD係數是否為零,且例如取決於距當前係數一定距離(由經傳輸預測滯後資訊指定,例如由所傳輸FD-LTP滯後指定)處之對應「先前」寫碼FD係數是否為零)在音訊變換編解碼器之頻譜域(例如MDCT域)中應用長期預測性濾波器。作為一實例,無限脈衝回應(IIR) LTP類濾波器可用於濾波。
舉例而言,若與不同頻率相關聯之頻譜值相對大,例如非零,則濾波強度可減小。因此,與不同頻率相關聯之大頻譜值的影響可藉由選擇性地調適濾波強度而減小。因此,可避免填充值或雜訊值採用過大的值。
根據根據本發明之第三態樣之其他實施例,濾波強度判定例如c(i-P'
sf)之另一頻譜值對給定填充值的影響。
因此,作為一實例,濾波強度可表示另一頻譜值之加權因數。本發明之發明人認識到,此類影響之調適性或作為一實例,另一頻譜值之加權,可改善經解碼音訊資訊。
根據根據本發明之第三態樣之其他實施例,音訊解碼器經組配以取決於與不同頻率相關聯之頻譜值(該頻譜值例如最初係由經編碼音訊資訊中之個別頻譜值之經編碼表示判定)而調適濾波強度。
本發明之發明人認識到,使用由用於調適濾波強度之經編碼表示表示的值允許使用或利用由經編碼表示而非其經濾波版本(其可例如交替)提供的資訊。已發現,相比於使用取決於在解碼器側上已經預處理之值的準則,使用此準則對於濾波強度之選擇更可靠。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以取決於應用雜訊填充之前的與該不同頻率相關聯之該頻譜值而調適該濾波強度。
本發明之發明人認識到,使用在雜訊填充之前的與不同頻率相關聯之頻譜值可允許基於頻譜值是否經量化為零之資訊來調適濾波強度。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以取決於與該不同頻率(或值)相關聯之該頻譜值是否量化為零而調適該濾波強度。
本發明之發明人認識到,例如,相較於未經量化為零之頻譜值,不同濾波強度可應用於經量化為零之頻譜值。此可改善經重構頻譜之準確度。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以取決於是否將雜訊填充應用於與不同頻率相關聯之頻譜值而調適該濾波強度。
本發明之發明人認識到,使用此準則,例如,除針對頻譜值之各別頻率是否意欲執行或已執行雜訊填充以外,濾波強度調適亦可基於是否將各別頻譜值量化為零之資訊來執行。此可包含使用旗標。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以選擇性地對於針對其應用雜訊填充之頻譜值(例如針對位置i>=P'
sf處的每一雜訊填充零量化頻譜係數c)應用頻率方向上之濾波或頻率方向上之預測。
如之前所解釋,本發明之發明人認識到,作為一實例,可基於或使用頻率方向上之濾波或預測來近似得出或估計零量化頻譜值。因此,可例如利用不同頻譜值中之頻譜值在頻率方向上之相依性。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以應用預測或濾波,以便基於隨機或偽隨機雜訊值(例如c(i))判定給定(例如最終)填充值,例如č(i)。
如之前所解釋,本發明之發明人認識到,隨機或偽隨機雜訊值可例如使用預測或濾波來調適,以便計算例如可提供用於音訊資訊之例如原始例如輸入頻譜之零量化頻譜值之良好近似的最終填充值。
根據根據本發明之第三態樣的其他實施例,音訊解碼器可經組配以執行與給定頻率相關聯的雜訊值及與另一頻率相關聯的雜訊值之加權(例如,組合d*c(i) + G'
sf*c(i-P'
sf),其中雜訊值c(i)之權重d與給定頻率相關聯,且雜訊值的權重G'
sf與另一頻率相關聯,或執行組合d*c(i) + ½*G'
sf*c(i-P'
sf),其中雜訊值c(i)之權重d與給定頻率相關聯,且雜訊值之權重½*G'
sf與另一頻率相關聯),或與給定頻率相關聯的雜訊值及與另一頻率相關聯的填充值之加權組合,以便獲得給定(例如最終)填充值,例如č(i)。此外,音訊解碼器經組配以取決於雜訊填充是否已應用於與另一頻率相關聯之頻譜值而調整給定至與另一頻率相關聯之雜訊值的權重(例如G'
sf或½*G'
sf)或給定至與另一頻率相關聯之填充值的權重(例如G'
sf或½*G'
sf)。
如上所解釋,本發明之發明人認識到,例如最終填充值可例如使用例如與給定頻率相關聯之雜訊值或與另一頻率相關聯之雜訊值及/或與另一頻率相關聯之填充值的不同頻率相依性量來計算。因此,本發明概念可允許判定或獲得或計算具有良好靈活性之例如最終填充值,以使得根據特定情形,可獲得可良好或甚至最佳地適合於例如原始音訊資訊頻譜之重構的填充值。舉例而言,可基於預測滯後資訊執行待用於獲得例如最終填充值之各別量之選擇。此外,本發明之發明人認識到,與另一頻率相關聯之對應雜訊值或填充值之各別權重的調適或調整可改善例如最終填充值之判定,且因此改善音訊資訊之重構。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以基於描述包括於音訊資訊之經編碼表示中的頻譜距離之經編碼資訊(例如經編碼值)判定與給定頻率相關聯之填充值與同不同頻率相關聯之另一頻譜值之間的頻譜距離,例如P'
sf。
基於該頻譜距離,該解碼器可例如決定是否將預測或濾波用於填充值之判定。該距離可與上文所闡述之預測滯後資訊及/或預測滯後值相關聯。此外,可基於該距離判定或設定或獲得對應預測或濾波之參數,例如濾波階數。本發明之發明人認識到,可使用頻譜距離以便改善對頻譜填充值之判定。
根據根據本發明之第三態樣之其他實施例,音訊解碼器經組配以基於包括於音訊資訊之經編碼表示中的增益資訊(例如,增益值,例如,g
sf)判定應用於與給定頻率相關聯之雜訊值的權重(例如,d),其中作為一實例,應用於與給定頻率相關聯之雜訊值的該權重為正值,例如在0.5與1之間的範圍內。
如之前所解釋,本發明之發明人認識到,例如,與給定頻率相關聯之各別雜訊值可用取決於增益資訊判定之權重加以調適。此可允許對該雜訊值進行塑形以改善其與最初經編碼音訊資訊之對應頻譜值的匹配。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以取決於包括於音訊資訊之經編碼表示中的增益資訊(例如增益值,例如g
sf)判定應用於與另一頻率相關聯之雜訊值(例如c(i-P'
sf))或與另一頻率相關聯之填充值的權重(G
sf=(-1)
Ssf*(3+2*g
sf)/8,或½*G
sf),其中應用於與給定頻率相關聯之雜訊值的權重例如為正或負值,例如具有在0.25與0.75之間的絕對值。
如之前所解釋,本發明之發明人認識到,例如,各別雜訊值或與另一頻率相關聯之各別填充值可用取決於增益資訊判定之權重加以調適。此可允許對該雜訊或填充值進行塑形以改善其與最初經編碼音訊資訊之對應頻譜值的匹配。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以取決於包括於音訊資訊之經編碼表示中的正負號資訊(例如正負號值,例如S
sf)而判定應用於與另一頻率相關聯之雜訊值(例如,c(i-P'
sf)f)或與另一頻率相關聯之填充值的權重,例如G
sf=(-1)
Ssf*(3+2*g
sf)/8,或½*G
sf。
如之前所解釋,本發明之發明人認識到,例如,使用正負號資訊,例如1位元資訊,可例如改善權重判定。作為一實例,正負號資訊可允許例如最終填充值相對於其可基於的與另一頻率相關聯之雜訊值及/或填充值的相位關係之調適。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以在係數c(i-P'
sf)係使用雜訊填充獲得的情況下(例如在頻譜位置i-P'
sf處的係數c(i-P'
sf)在先前處理中被標記為雜訊填充零量化頻譜係數的情況下)根據č(i)=d*c(i) + G'
sf*c(i-P'
sf)判定給定填充值č(i),且在係數c(i-P'
sf)並非係使用雜訊填充獲得的情況下(例如在頻譜位置i-P'
sf處之係數c(i-P'
sf)在先前處理中並未被標記為雜訊填充零量化頻譜係數的情況下)根據č(i)=d*c(i) + ½*G'
sf*c(i-P'
sf)判定給定填充值č(i)。c(i)表示使用雜訊填充獲得且具有頻譜索引i之頻譜係數,d表示衰減係數,G'
sf表示基於包括於經編碼音訊表示中之增益值的權重;c(i-P'
sf)表示可例如使用雜訊獲得,或可例如在不使用雜訊填充的情況下獲得,且可例如使用預測或濾波獲得的具有頻譜索引i-P'
sf之頻譜係數,其中P'
sf為基於包括於經編碼音訊表示中之預測參數資訊的預測參數或濾波參數。
本發明之發明人認識到,使用上述等式,可判定有效填充值。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以根據P'
sf=p
sf+B獲得預測參數或濾波參數P'
sf,其中p
sf為包括於經編碼音訊表示中之滯後索引,且其中B為常數,其中B可例如等於用以編碼p
sf之位元的數目,其中p
sf可例如採用0與2
B-1之間的值。替代地或另外,音訊解碼器經組配以根據G'
sf=(-1)
Ssf* (3+2*g
sf)/8獲得權重G'
sf,其中S
sf為例如以經編碼形式包括於經編碼表示中之二進位值,且其中g
sf為例如以經編碼形式包括於經編碼表示中之二進位值。替代地或另外,音訊解碼器經組配以根據d=(7.5-g
sf)/8獲得衰減係數d,其中g
sf為例如以經編碼形式包括於經編碼表示中之二進位值。
作為一實例,可根據給定訊框是否具有多於一個子訊框來選擇常數B。本發明之發明人認識到,使用上述等式,可達成解碼之傳信工作量、複雜性及有效性之間的良好權衡。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以標記雜訊填充零量化頻譜係數,且音訊解碼器經組配以選擇性地使用應用於未標記為雜訊填充零量化頻譜係數之頻譜係數的減小之濾波強度,例如½*G'
sf。
本發明之發明人認識到,用於未標記頻譜係數之濾波強度之減小可例如改善音訊資訊之原始頻譜之重構或近似得出。
根據根據本發明之第三態樣之其他實施例,該音訊解碼器經組配以針對多個子訊框(sf)執行以下處理:
1. 設定P'
sf=p
sf+B,G'
sf=(-1)
Ssf* (3+2*g
sf)/8且d=(7.5-g
sf)/8,其中,例如,p
sf>0;
2. 例如使用l
sf,例如使用用以取代為零之頻譜係數的隨機或偽隨機雜訊值執行例如習知雜訊填充,其中雜訊強度可例如,由雜訊強度值I
sf判定,且標記例如所有或多個雜訊填充零量化頻譜係數
3. 對於例如按增大i排序之在位置i>=P'
sf處之多個或甚至每一雜訊填充零量化頻譜係數c,進行:
4. 若在步驟2中標記位置i-P'
sf處之係數c,則用d*c(i) + G'
sf*c(i-P'
sf)替代c(i);否則
5. 用d * c(i) + 1/2*G'
sf*c(i-P'
sf)替代c(i)。
本發明之發明人認識到,使用上述步驟,可達成解碼之傳信工作量、複雜性及有效性之間的良好權衡。
根據本發明之第三態樣的其他實施例包含一種用於基於一經編碼音訊表示提供一經解碼音訊表示之音訊解碼器,其中該音訊解碼器經組配以使用預測或濾波(例如使用時間雜訊塑形(TNS)及/或使用頻域雜訊塑形(FD-LTP))判定經處理頻譜值(例如頻譜係數),使得與給定頻率(例如與給定頻率區間)相關聯之給定經處理頻譜值係取決於另一頻譜值(例如c(i-P'
sf),或č(i-P'
sf),其與不同頻率相關聯,例如與不同頻率區間相關聯,例如與具有頻率區間索引i-P'
sf之不同頻率區間相關聯,例如與距給定頻率或給定頻率區間具有頻譜距離P'
sf或頻譜距離d
sf之頻率或頻率區間相關聯)而獲得。
此外,該音訊解碼器經組配以取決於與不同頻率(例如,具有不同頻率區間;例如具有頻率區間索引i-P'
sf之不同頻率區間)相關聯之經編碼或經量化頻譜值(例如,例如最初由經編碼音訊資訊中的個別頻譜值之經編碼表示判定,例如由應用雜訊填充之前的頻譜值判定,例如由直接在算術解碼之後的頻譜值判定之頻譜值)調適濾波強度(例如,與不同頻率相關聯之頻譜值的加權,例如藉由將濾波強度選擇性地設定為G'
sf或1/2G'
sf)。
本發明之發明人認識到,經處理頻譜值可例如使用預測或濾波基於與不同頻率相關聯之其他頻譜值來判定或計算或獲得。如之前所解釋,可利用不同頻率(例如不同頻帶)之頻譜值的頻譜係數之相關性或相依性,例如不僅用於填充值,而且用於經處理頻譜值。
因此,可例如藉由利用此相關性而減少寫碼工作量。因此,使用預測係數及/或濾波係數,可以需要傳輸的減少之位元量判定頻譜值,同時仍提供最初經編碼音訊信號之良好表示。
此外,本發明之發明人認識到,經編碼音訊表示之解碼可藉由取決於與不同頻率相關聯之經編碼或經量化頻譜值調適濾波強度來改善。
根據根據本發明之第三態樣之其他實施例,例如,當相比於包括於預測或濾波中的零量化(及可能先前經處理,例如先前TNS合成濾波)(例如,較低頻率)頻譜係數之貢獻(例如,在預測或濾波中之加權)時)時,音訊解碼器經組配以調適濾波強度,以例如選擇性地減少包括於預測或濾波中的非零量化且可能先前經處理(例如,先前TNS合成濾波,例如的較低頻率)頻譜係數之貢獻(例如,在預測或濾波中之加權)。
根據根據本發明之第三態樣之其他實施例,音訊解碼器經組配以選擇性地調適,例如減小濾波強度(例如,時間雜訊塑形濾波,例如頻域長期預測,例如,基於未經濾波之當前頻譜係數(例如,c(i)與經濾波或未經濾波的先前頻譜係數(例如,c(i-P'
sf)的加權組合,例如d*c(i)+att*G'
sf*c(i-P'
sf)),其中,例如,d為未經濾波的當前頻譜係數之權重,att為描述濾波強度之調適的衰減因數,G'
sf為濾波或未經濾波的先前頻譜係數之正常權重,且P'
sf描述在當前頻譜係數(例如,由頻譜索引I指定的當前頻譜位置處的頻譜係數c(i),例如在應用濾波之前在當前頻譜位置處的頻譜係數c(i),例如所傳輸當前頻譜係數或經編碼當前頻譜係數或經量化當前頻譜係數)為零(例如已量化為零)的情況下當前頻譜係數與先前頻譜係數(例如頻譜係數c(i-P'
sf),例如表示為「另一頻譜值」,其例如在音訊編碼器側處尚未編碼為零或尚未量化為零)之間的頻譜距離。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以將濾波強度選擇性地減小至0.25與0.75之間的值,或較佳地減小至0.4與0.6之間的值,或較佳地減小至0.5之值,以便調適濾波強度。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以在當前頻譜係數(例如c(i))編碼或量化為零的情況下,取決於多個(例如d
sf個)先前(例如經編碼或量化或傳信)頻譜係數(例如多個先前頻譜係數)之值(例如經編碼值或經量化值或傳信值)而例如藉由使用共同按比例縮小因數按比例縮小濾波之濾波係數或預測係數(例如藉由按比例縮小濾波係數,其考慮多個(例如d
sf個)先前頻譜係數,例如c(i-1)至c(i-d
sf))來選擇性地減小濾波強度。
根據根據本發明之第三態樣的其他實施例,該音訊解碼器經組配以在當前頻譜係數(例如c(i))經編碼或量化或傳信為零的情況下或在濾波中考慮的所有先前頻譜係數(例如c(i-1)至c(i-(d
sf-1))(除了濾波中考慮的一個先前頻譜係數,例如c(i-d
sf),例如在濾波中考慮的距當前頻譜係數具有最大頻譜距離的頻譜係數)經編碼或量化或傳信為零的情況下,選擇性地減小濾波強度(其中該濾波強度可例如由多個濾波權重界定,其中該等濾波權重可例如使用共同按比例縮小因數而例如選擇性地按比例縮小,在濾波強度減小的情況下其可例如等於½),否則,使用未減小的濾波強度。
根據根據本發明之第三態樣的其他實施例,音訊解碼器經組配以使用濾波或預測取決於具有頻譜索引i-d
sf至i-1之多個(例如,經編碼或經量化或經傳訊或經濾波或經預測)先前頻譜係數(例如,c(i-1)至c(i-d
sf))而獲得具有頻譜索引i的經濾波當前頻譜係數(例如,c(i))。
此外,該音訊解碼器經組配以在以下情況下選擇性地減小濾波強度:在(例如在且僅在)具有頻譜索引i-d
sf+1至i之一或多個(例如,經傳信)頻譜係數或所有頻譜係數已經量化或編碼或傳信為零的情況下,且在具有頻譜索引i-d
sf之頻譜係數尚未量化或編碼或傳信為零的情況下,其中例如d
sf等於濾波階數或預測階數。
根據根據本發明之第三態樣的另外實施例,與具有i-d
sf+1與i-1之間的頻譜索引之頻譜係數相關聯的濾波係數等於零。
根據根據本發明之第三態樣之其他實施例,音訊解碼器經組配以例如在雜訊填充之前使用經編碼或經量化或經傳信頻譜係數用於決定濾波強度。此外,該音訊解碼器經組配以例如在應用雜訊填充之後及/或在應用頻域長期預測之後使用經預處理頻譜係數作為用於濾波或預測之輸入。
根據本發明之第三態樣之其他實施例包含一種用於基於經編碼音訊表示提供一經解碼音訊表示之方法,該方法包含例如使用量化為零的頻譜係數之取代使用各別填充值基於各別填充值填充經解碼頻譜值集合之頻譜孔。該方法進一步包含使用預測或濾波(例如使用計算規則d*c(i) +G'
sf*c(i-P'
sf))判定例如最終填充值(例如用於c(i)之替代,例如č(i)),使得與給定頻率(例如與給定頻率區間)相關聯之給定填充值(例如č(i))係取決於與不同頻率(例如,具有不同頻率區間,例如具有頻率區間索引i-P'
sf之不同頻率區間,例如距給定頻率或距給定頻率區間具有頻譜距離P'
sf或頻譜距離d
sf之頻率或頻率區間)相關聯之另一頻譜值(例如c(i-P'
sf),或č (i-P'
sf))而獲得。此外,該方法包含取決於與不同頻率(例如,具有不同頻率區間;例如具有頻率區間索引i-P'
sf之不同頻率區間)相關聯之經編碼或經量化頻譜值(例如,例如(最初)由經編碼音訊資訊中的個別頻譜值之經編碼表示判定,例如由應用雜訊填充之前的頻譜值判定,例如由直接在算術解碼之後的頻譜值判定之頻譜值)調適濾波強度(例如,與不同頻率相關聯之頻譜值的加權,例如藉由將濾波強度選擇性地設定為G'
sf或1/2G'
sf)。
根據本發明之第三態樣之其他實施例包含一種用於基於一經編碼音訊表示提供一經解碼音訊表示之方法,該方法包含使用預測或濾波判定經處理頻譜值(例如頻譜係數),使得與給定頻率(例如與給定頻率區間)相關聯之給定經處理頻譜值係取決於與不同頻率(例如,具有不同頻率區間,例如具有頻率區間索引i-P'
sf之不同頻率區間,例如距給定頻率或距給定頻率區間具有頻譜距離P'
sf或頻譜距離d
sf之頻率或頻率區間)相關聯之另一頻譜值(例如c(i-P'
sf),或č (i-P'
sf))而獲得。此外,該方法包含取決於與不同頻率(例如,具有不同頻率區間;例如具有頻率區間索引i-P'
sf之不同頻率區間)相關聯之經編碼或經量化頻譜值(例如,例如(最初)由經編碼音訊資訊中的個別頻譜值之經編碼表示判定,例如由應用雜訊填充之前的頻譜值判定,例如由直接在算術解碼之後的頻譜值判定之頻譜值)調適濾波強度(例如,與不同頻率相關聯之頻譜值的加權,例如藉由將濾波強度選擇性地設定為G'
sf或1/2G'
sf)。
根據本發明之第三態樣的其他實施例包含一種電腦程式,其用於在該電腦程式在一電腦上運行時執行以上方法中之任一者。
較佳實施例之詳細說明
即使具有相同或等效功能性之相同或等效的一或多個元件出現於不同圖式中,以下描述中仍藉由相同或等效參考數字來表示該一或多個元件。
在以下描述中,闡述多個細節以提供對本發明之實施例的較透徹解釋。然而,本領域中具有通常知識者將顯而易見,可在無此等特定細節之情況下實踐本發明之實施例。在其他情況下,以方塊圖形式而非詳細地展示熟知結構及裝置以便避免混淆本發明之實施例。另外,除非另外特定地指出,否則本文所描述之不同實施例的特徵可彼此組合。
圖1展示根據根據本發明之第一態樣的實施例之用於基於經編碼音訊信號提供經解碼音訊信號的音訊解碼器之示意圖。圖1展示音訊解碼器100,其具有頻譜傾斜資訊導出單元110、頻率可變縮放單元120及頻譜孔填充單元130。任擇地,如圖1之實例中所示,解碼器100可包含解碼單元140。
解碼器100可具備經編碼音訊資訊102。根據或使用經編碼音訊資訊,頻譜傾斜資訊導出單元110可經組配以導出或判定或計算頻譜傾斜資訊112。
任擇地,解碼器100可經組配以使用任擇解碼單元140解碼經編碼音訊資訊102或經編碼音訊資訊之一部分,以便獲得經解碼頻譜值集合142。然而,應注意,亦可自外部裝置提供經解碼頻譜值集合142。
使用頻率可變縮放單元,解碼器100可經組配以將頻譜傾斜由頻譜傾斜資訊120判定之頻率可變縮放應用於填充值122。填充值122可例如為間隙填充係數或雜訊填充之雜訊值或智慧型間隙填充之間隙填充值(例如來自不同頻率或頻帶之頻譜值)。因此,頻率可變縮放單元可將經縮放填充值124提供至頻譜孔填充單元130。
使用頻譜孔填充單元130,解碼器100可經組配以使用經修改填充值122、124以便填充經解碼頻譜值集合142之頻譜孔。
基於頻譜孔填充,可提供經解碼音訊資訊104。
應注意,頻率可變縮放可例如在填充經解碼頻譜值集合142之頻譜孔之後執行,其中該等孔可以未經修改之填充值122進行填充。縮放可接著任擇地應用於已修改之頻譜值集合(例如,填充有填充值122之經解碼頻譜值集合142)。作為一實例,經解碼音訊資訊可因此基於頻率可變縮放單元120而提供,其中頻率可變縮放單元可自頻譜孔填充單元130接收其輸入。
如之前所解釋,經解碼頻譜值(例如,經解碼頻譜係數)之頻譜包絡的調適可允許更好地重構或近似得出音訊資訊之原始頻譜包絡。
此態樣將在圖2及圖3之上下文中進一步解釋。
圖2展示根據習知概念之頻譜包絡(隨頻率而變之強度)的示意性實例。藉由線210展示原始頻譜包絡之實例,原始頻譜包絡例如表示原始頻譜值,例如表示音訊資訊或音訊資訊之訊框或子訊框之原始頻譜係數。虛線220向下偏移以實現所有曲線之較佳可見性,且表示可與縮放因數相關聯的例如遮蔽臨限值(例如,雜訊塑形包絡)之遮蔽包絡的實例。線230可展示根據習知概念之經重構雜訊包絡的實例。根據遮蔽包絡220,可針對具有介於雜訊填充開始頻率240與雜訊填充結束頻率250之間的頻率的信號部分執行雜訊填充。如圖2中所示,經重構包絡230在高頻下超過原始頻譜包絡210,因此在解碼之後可能引起可聽雜訊,同時其在較低頻率下保持顯著低於原始頻譜包絡120,因此可能導致不足的間隙填充能量及可聽頻譜孔洞。可見,遮蔽包絡210與有效經重構雜訊包絡230之間的距離可為恆定的(細雙箭頭),且因此,並不準確遵循原始頻譜包絡210。舉例而言,此可例如尤其藉由在遮蔽包絡之計算期間的預加重傾斜而引起。
使用根據本發明之實施例,例如如圖1中所示之解碼器,可達成如圖3中所示之經重構雜訊包絡310。圖3展示根據本發明之第一態樣之頻譜包絡(隨頻率而變之強度)的示意性實例。
因此,使用頻譜傾斜資訊,例如如圖1中所示之頻譜傾斜資訊112,經重構雜訊包絡310可經校正以減小原始信號包絡210與經重構包絡310之間的差異。
關於圖2及圖3,應注意,遮蔽包絡220可例如為基於不同頻帶之多個縮放因數的近似或內插。
圖4展示根據根據本發明之第一態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖。圖4展示音訊解碼器400,其包含頻譜傾斜資訊導出單元410、頻率可變縮放單元420、頻譜孔填充單元430及任擇解碼單元440,作為實例,其功能性係根據來自圖1之音訊解碼器100。
作為任擇特徵,解碼器400包含雜訊資訊導出單元450。雜訊資訊導出單元450可經組配以自經編碼音訊資訊402導出雜訊資訊450。雜訊資訊可為或可包含例如雜訊位準資訊,例如L
sf及/或雜訊強度資訊。
此外,解碼器400可任擇地包含填充值獲得單元460,其可經組配以使用雜訊資訊450 (例如,雜訊位準資訊及/或雜訊強度資訊)來獲得或判定或計算填充值422。因此,填充值422可為雜訊填充值,其中各別雜訊填充值之能量可根據雜訊位準資訊設定。
任擇地,頻率可變縮放單元420可經組配以應用頻率可變縮放,使得頻率可變縮放描述隨著頻率在對數強度階上增大,強度線性地減小。
作為另一任擇特徵,頻譜傾斜資訊412可描述對數域中之頻譜傾斜。
作為另一任擇特徵,解碼器400可包含縮放值獲得單元470。縮放值獲得單元可例如經組配以獲得用於頻率可變縮放之縮放值472。解碼器400,例如解碼器400之縮放值獲得單元470,可在對數域中判定或獲得或導出縮放值472。然而,應注意,可針對任何值(例如,頻譜值或數學運算)執行自對數域至線性域之轉換。因此,作為一實例,縮放值472用於自對數域至線性域之頻率可變縮放。
作為一實例,縮放值472可例如基於或使用或取決於基於傾斜資訊412的傾斜值474與例如頻率值的頻率資訊476之乘積而導出或獲得或計算。
作為一實例,傾斜值474可例如由頻譜傾斜資訊導出單元例如基於頻譜傾斜資訊412或例如直接自經編碼音訊資訊402提供。在一些實施例中,頻譜傾斜資訊412可例如為傾斜值474。舉例而言,頻率資訊可為頻率值或頻率索引,其描述或提供關於待縮放之頻譜值或係數之頻率的資訊。
作為一實例,頻率可變縮放單元420可經由基於傾斜值474之縮放值472而具備頻譜傾斜資訊412之資訊。
任擇地,縮放值獲得單元470可經組配以獲得與不同頻帶相關聯的用於頻率可變縮放之多個縮放值。
作為另一任擇特徵,頻率資訊476可例如包含各別頻帶之開始頻率中心頻率,該等頻帶之頻譜值(例如,頻譜係數,例如雜訊值)或間隙填充值(例如,填充值)有待縮放。因此,縮放值獲得單元可經組配以使用各別頻帶之開始頻率或使用各別頻帶之中心頻率來獲得縮放值472。
類似地,頻率資訊476可包含各別頻帶之開始頻率區間索引或中心頻率區間索引以用於獲得縮放值472。
作為另一任擇特徵,縮放值472可例如包含頻率非相依雜訊縮放值及/或頻率可變雜訊縮放值,其中頻率可變雜訊縮放值可基於傾斜值474 (例如,頻譜傾斜)而判定。任擇地,解碼器400,例如解碼器200之頻率可變縮放單元420,可經組配以使用雜訊值(雜訊資訊可例如包含雜訊值)、頻率非相依雜訊縮放值與頻率可變雜訊縮放值之乘法來獲得填充值(例如,經縮放填充值424)。雜訊值可例如為隨機雜訊值或偽隨機雜訊值,且可由雜訊資訊導出單元450判定。
作為另一任擇特徵,音訊解碼器400可經組配以將基於遮蔽包絡之縮放應用於經解碼頻譜值442及填充值222。
一般而言,音訊解碼器可例如經組配以自經編碼音訊資訊獲得遮蔽包絡。遮蔽包絡可例如與縮放因數相關聯,遮蔽包絡可例如為縮放因數之內插。
因此,縮放(例如,基於遮蔽包絡)可例如應用於完整頻譜,例如,未經量化至零之經解碼頻譜值,及經量化至零且以填充值填充之頻譜值(或,例如,首先縮放填充值,且接著將其填充於頻譜「孔」中)。
任擇地,頻譜傾斜資訊導出單元410可例如經組配以自經編碼音訊資訊402獲得頻譜包絡,且可經組配以使用可用以調適完整頻譜之頻譜傾斜資訊來提供關於頻譜包絡之資訊。
圖5展示根據根據本發明之第一態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器的示意圖。圖5展示包含任擇編碼單元510之編碼器500。舉例而言,編碼單元可經組配以編碼多個經量化頻譜值512。編碼器500進一步包含任擇頻譜傾斜資訊判定單元520。頻譜傾斜資訊判定單元520可經組配以基於頻譜能量資訊524及遮蔽包絡資訊526判定頻譜傾斜資訊522。任擇地,遮蔽包絡資訊526可由處理單元530例如基於輸入音訊資訊提供。作為一實例,可取決於輸入音訊資訊計算遮蔽包絡。作為另一實例,可使用固定遮蔽包絡。舉例而言,頻譜傾斜資訊可描述輸入音訊信號之頻譜能量與遮蔽包絡之間的差異的平均變化。
作為一任擇實例,編碼器500可包含處理單元530,該處理單元可經組配以基於輸入音訊資訊502 (例如輸入音訊資料)而將頻譜能量資訊524 (例如頻譜能量)及經量化頻譜值512分別提供至頻譜傾斜資訊判定單元520及編碼單元510。
此外,編碼單元510可接收頻譜傾斜資訊522,且可經組配以編碼頻譜傾斜資訊。作為一實例,編碼器,例如編碼器500之編碼單元510,可經組配以提供經編碼音訊資訊504,例如包含經量化頻譜值512之經編碼表示及頻譜傾斜資訊522之經編碼表示。
圖6展示根據根據本發明之第一態樣的實施例之具有額外任擇特徵之音訊編碼器之示意圖。圖6展示編碼器600,其包含頻譜傾斜資訊判定單元620、任擇處理單元630及編碼單元610(及對應輸入/輸出信號),如在圖5之上下文中所解釋。
作為另一任擇特徵,頻譜傾斜資訊判定單元620可任擇地經組配以判定頻譜傾斜資訊622,使得頻譜傾斜資訊描述頻譜能量資訊624與遮蔽包絡資訊626之間隨頻率而變得差異之頻率變化。
此外,頻譜傾斜資訊622可例如描述在對數域中具有頻譜傾斜之線函數。如之前所解釋,線函數可允許調整經重構頻譜之傾斜以較佳地近似得出輸入音訊資訊602之原始頻譜。
作為另一任擇特徵,頻譜傾斜資訊判定單元可例如經組配以在對數域中判定頻譜傾斜資訊。
作為另一任擇特徵,頻譜傾斜資訊判定單元620可經組配以基於頻譜包絡之對數化表示與遮蔽包絡之對數化表示之間的差異判定頻譜傾斜資訊622。因此,頻譜能量資訊624可包含關於例如呈對數化形式之輸入音訊資訊602之頻譜包絡的資訊,且遮蔽包絡資訊626可例如包含例如呈對數化形式之遮蔽包絡,例如包含縮放因數。
再次,應注意,一般而言,編碼器可在對數及/或線性域中執行任何計算。因此,值及或計算可在一個域或另一域中變換。
作為另一任擇特徵,頻譜傾斜資訊判定單元620可例如經組配以使用線性回歸獲得頻譜傾斜資訊622。本發明的發明人認識到,使用線性回歸,可執行具有針對傾斜資訊之良好準確度的計算低廉計算。
作為另一任擇特徵,頻譜傾斜資訊可例如經組配以基於表示多個各別頻譜帶中之頻譜值的能量之逐頻譜帶能量值或逐頻譜帶均方根值且基於表示多個各別頻譜帶中之遮蔽臨限值的逐頻譜帶能量值或逐頻譜帶均方根值獲得頻譜傾斜資訊。
作為一實例,頻譜能量資訊624可因此包含表示多個各別頻譜帶中之頻譜值之能量的逐頻譜帶均方根值,且遮蔽包絡資訊626可例如包含表示多個各別頻譜帶中之遮蔽臨限值的逐頻譜帶能量值或逐頻譜帶均方根值。
任擇地,處理單元630可經組配以提供該資訊。
作為另一任擇特徵,頻譜傾斜資訊判定單元620可經組配以判定用於不同音訊訊框及/或用於不同音訊子訊框之單獨頻譜傾斜資訊622。
作為另一任擇實例,編碼器600可例如包含差值判定器640。差值判定器640可例如經組配以判定差值642,該差值在包含多個頻譜區間之頻率範圍上表示呈單一值形式的在頻譜能量資訊624與遮蔽包絡資訊626之間的差異。
此外,編碼器600可任擇地包含雜訊位準資訊獲得單元650,其可經組配以取決於或基於差值642獲得或判定或計算雜訊位準資訊652。
作為另一任擇特徵,編碼單元610可例如接收雜訊位準資訊652,且可經組配以將雜訊位準資訊編碼於經編碼音訊資訊中。
任擇地,差值判定器640可例如經組配以使用線性回歸獲得差值642。
作為另一任擇特徵,編碼單元610可例如經組配以使用三個位元來編碼頻譜傾斜資訊622。
此外,編碼單元610可例如經組配以編碼頻譜傾斜資訊622,使得經編碼頻譜傾斜資訊始終表示負頻譜傾斜。
圖7展示根據根據本發明之第一態樣之實施例的編碼器(例如,圖5中所示之編碼器500或圖6中所示之編碼器600)之功能性的實例。因此,本發明之編碼器可經組配以執行以下步驟:
1. 自輸入頻譜602計算逐頻譜帶能量值或RMS值E
sf(f);(710)
2. 將一或多個值E
sf(f)轉換至對數域且自值E
sf(f)減去多個值E
sf(f)之總體平均值,以獲得零平均值E'
sf(f);(720)
3. 自零平均值E'
sf計算、量化及解量化遮蔽包絡M
sf;(730)
4. 自M
sf重構逐頻譜帶能量值或RMS值,且自M
sf導出對數及零平均值M'
sf(f);(740)
5. 在成對的逐頻譜帶E'
sf與M'
sf之間進行線性回歸,以便獲得斜率T
sf及偏移O
sf;(750)
6. 量化且自T
sf解量化傾斜索引t
sf;(760)
7. 自t
sf重構傾斜值以獲得經解碼傾斜T'
sf,且使用-T'
sf*f用於計算雜訊位準索引I
sf(770)。
圖8展示根據根據本發明之第二態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊的音訊解碼器之示意圖。圖8展示包含頻譜孔填充單元810之解碼器800,其經組配以填充經解碼頻譜值集合812之頻譜孔。舉例而言,孔填充之結果可為經解碼音訊資訊802。
作為另一任擇特徵,解碼器600可包含預測滯後資訊獲得單元820。預測滯後資訊獲得單元820可經組配以獲得或判定或計算預測滯後資訊822。作為另一任擇特徵,預測滯後資訊獲得單元820可接收可用於判定預測滯後資訊822之經編碼音訊資訊804。
作為另一任擇特徵,解碼器800包含解碼單元830。解碼單元830可經組配以基於經編碼音訊資訊804提供經解碼頻譜值集合812。
此外,解碼器800可包含第一頻譜填充方法單元840及第二頻譜填充方法單元850 (任擇地,解碼器800可包含例如其他頻譜填充方法單元之多個第二頻譜填充方法單元,或第二頻譜填充方法單元可經組配以提供多個其他頻譜填充方法之功能性)。各別頻譜填充方法單元可例如經組配以將填充值814提供至頻譜孔填充單元810,以便填充頻譜孔。
基於預測滯後資訊822,可在第一頻譜填充方法單元840與第二頻譜填充方法單元850 (或例如多個其他頻譜填充方法單元)之間執行切換(使用開關860),以將填充值814供應至頻譜孔填充單元810。
使用第一頻譜填充方法,可使用頻率濾波或頻率預測來獲得用以填充頻譜孔之填充值,使用第二頻譜填充方法,可不使用頻率濾波且不使用頻率預測來獲得用以填充頻譜孔之填充值。
任擇地,解碼器800可例如經組配以在預測滯後資訊822為非零的情況下使用第一頻譜填充方法,或在預測滯後資訊822大於零的情況下使用第一頻譜填充方法,且在其他情況下使用第二頻譜填充方法(例如一或多個其他頻譜填充方法中之一者)。
作為另一任擇特徵,預測滯後資訊獲得單元可例如經組配以使用包括於經編碼音訊資訊804中之預測滯後值之經編碼表示,以獲得預測滯後資訊822,例如預測滯後值。
圖9展示根據根據本發明之第二態樣的實施例之第一頻譜填充方法單元之示意圖。圖9可展示圖8之第一頻譜填充方法單元840之細節的示意圖。圖9展示預測或濾波單元910及濾波強度調適單元920。
舉例而言,本發明之音訊解碼器可經組配以取決於與不同頻率相關聯之另一頻譜值914,例如使用預測或濾波單元910來判定與給定頻率相關聯之填充值912。預測或濾波單元910可因此經組配以使用或應用預測或濾波。
此外,本發明之音訊解碼器可例如經組配以取決於與不同頻率相關聯之經編碼或經量化頻譜值924而例如使用濾波強度調適單元920來調適濾波強度資訊922,例如濾波強度。作為一實例,頻譜值914可例如替代地用以調適濾波強度。
任擇地,濾波強度資訊922可例如包含濾波強度,其中濾波強度判定另一頻譜值914對填充值912之影響。
任擇地,例如使用濾波強度調適單元920,本發明之解碼器可經組配以取決於與不同頻率相關聯之頻譜值924而調適濾波強度資訊,例如濾波強度,因為該頻譜值係由經編碼音訊資訊中之個別頻譜值之經編碼表示判定。
任擇地,取決於與不同頻率相關聯之頻譜值924對例如濾波強度之濾波資訊922的調適可例如在應用雜訊填充之前執行。
作為另一任擇特徵,濾波強度調適單元可經組配以取決於與不同頻率(或值)相關聯之頻譜值924或914是否經量化為零而調適濾波資訊922,例如濾波強度。因此,濾波強度可取決於例如縮放因數之遮蔽包絡而調整。本發明之發明人認識到,可以不同方式對零量化頻譜值進行濾波,以便改善音訊資訊之解碼。
任擇地,本發明之解碼器可經組配以取決於是否將雜訊填充應用於與不同頻率(或值)相關聯之頻譜值924或914而調適(例如,使用濾波強度調適單元920)濾波強度。
任擇地,本發明之解碼器可經組配以例如使用預測或濾波單元910來針對應用雜訊填充所針對的頻譜值924或914選擇性地應用頻率方向上之濾波或頻率方向上之預測。
任擇地,本發明之解碼器可經組配以例如使用預測或濾波單元910應用預測或濾波,以便基於隨機或偽隨機雜訊值判定給定填充值912。例如包含隨機或偽隨機雜訊值的任擇雜訊值資訊916因此可提供至預測或濾波單元910。任擇雜訊值資訊916可包含隨機及/或偽隨機雜訊值。此等值可例如由雜訊產生器(未展示)提供。因此,解碼器可任擇地包含雜訊產生器。此外,雜訊值資訊可包含雜訊產生器信號,例如隨機及/或偽隨機雜訊值。
作為另一任擇特徵,與不同頻率924或914相關聯之頻譜值可例如為與另一頻率相關聯之填充值。任擇地,與不同頻率924或914相關聯之頻譜值可為例如與另一頻率相關聯之雜訊值。本發明之發明人認識到,填充值912可例如使用與給定頻率相關聯之雜訊值及與另一頻率相關聯之雜訊值的加權組合或與給定頻率相關聯之雜訊值及與另一頻率相關聯之填充值的加權組合來判定。因此,預測及/或濾波單元910可經組配以執行一或兩個加權組合以便獲得給定填充值912。
此外,本發明之解碼器可包含權重調整單元930。舉例而言,權重調整單元可經組配以取決於雜訊填充是否已應用於與另一頻率相關聯之頻譜值924或914而調整給定至與另一頻率相關聯之雜訊值的權重或給定至與另一頻率相關聯之填充值的權重。
任擇地,本發明之音訊解碼器可包含頻譜距離判定單元940,該頻譜距離判定單元可經組配以基於描述包括於音訊資訊之經編碼表示804中的頻譜距離之經編碼資訊判定與給定頻率相關聯之填充值912與同不同頻率相關聯之另一頻譜值924或914之間的頻譜距離。
任擇地,權重調整單元930可接收音訊資訊之經編碼表示804。權重調整單元930可經組配以基於包括於音訊資訊之經編碼表示804中的增益資訊而判定權重資訊932,例如權重,該權重資訊應用於與給定頻率相關聯之雜訊值。
作為另一任擇特徵,權重調整單元930可經組配以取決於包括於音訊資訊之經編碼表示804中之增益資訊判定權重資訊932,例如權重,該權重資訊應用於與另一頻率相關聯之雜訊值或應用於與另一頻率相關聯之填充值。
作為另一任擇特徵,權重調整單元930可經組配以取決於包括於音訊資訊之經編碼表示中之正負號資訊而判定權重資訊932,例如權重,該權重資訊應用於與另一頻率相關聯之雜訊值或應用於與另一頻率相關聯之填充值。
任擇地,預測或濾波單元910可例如經組配以在係數c(i-P'
sf)(例如,與不同頻率924或914相關聯之頻譜值)係使用雜訊填充獲得的情況下根據č(i)=d*c(i) + G'
sf*c(i-P'
sf)判定給定填充值č(i)(例如填充值912),且在係數c(i-P'
sf)並非係使用雜訊填充獲得的情況下根據č(i)=d*c(i) + ½*G'
sf*c(i-P'
sf)判定給定填充值č(i),其中c(i)表示使用雜訊填充獲得且具有頻譜索引i之頻譜係數;其中d表示衰減係數,其中G'
sf(例如,權重資訊932)表示基於包括於經編碼音訊表示804中之增益值的權重;且其中c(i-P'
sf)表示具有頻譜索引i-P'
sf之頻譜係數,其中P'
sf為基於包括於經編碼音訊表示中之預測參數資訊的預測參數或濾波參數。
作為另一任擇特徵,本發明之解碼器可經組配以根據P'
sf=p
sf+B獲得預測參數或濾波參數P'
sf,其中p
sf為包括於經編碼音訊表示804中之滯後索引,且其中B為常數及/或其中音訊解碼器經組配以根據G'
sf=(-1)
Ssf* (3+2*g
sf)/8獲得經權重G'
sf,其中S
sf為包括於經編碼表示中之二進位值,且其中g
sf為包括於經編碼表示中之二進位值;及/或其中音訊解碼器經組配以根據d=(7.5-g
sf)/8獲得該衰減係數d,其中g
sf為包括於該經編碼表示中之二進位值。
任擇地,濾波強度調適單元可例如經組配以選擇性地使用應用於未標記為雜訊填充零量化頻譜係數之頻譜係數的減小之濾波強度。任擇地,解碼器可包含用於標記雜訊填充零量化頻譜係數(未展示)之標記單元。
圖10展示根據根據本發明之第二態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖。圖10展示解碼器1000,其包含頻譜孔填充單元1010、預測滯後資訊獲得單元1020、解碼單元1030、第一頻譜填充方法單元1040、第二頻譜填充方法單元1050及開關1060。此等元件之功能性可例如類似或相似於圖8及圖9之各別元件。
作為另一任擇特徵,解碼器1000包含第三頻譜填充方法單元1070。舉例而言,解碼器1000可經組配以取決於預測滯後資訊及/或音訊資訊之調性資訊1082 (例如調性)而在第二頻譜填充方法(例如,使用頻譜填充方法單元1050,其中隨機或偽隨機填充值用以填充頻譜孔(例如,將各別填充值1014提供至頻譜孔填充單元1010))與第三頻譜填充方法1070 (其中使用非零頻譜係數之複製獲得的填充值1014用來填充頻譜孔)之間切換。
作為另一任擇特徵,解碼器1000可包含調性資訊獲得單元1080,該調色資訊獲得單元可經組配以基於經編碼音訊資訊1004獲得調性資訊1082。
任擇地,調性資訊獲得單元1080可例如經組配以取決於包括於經編碼音訊表示1004中之調性資訊及/或取決於指示調性資訊是否包括於經編碼音訊資訊中之資訊及/或取決於濾波增益值及/或取決於預測增益值及/或取決於時域後置濾波器增益值而判斷音訊資訊是否為音調。調性資訊獲得單元1080可因此經組配以判定或提取用於自經編碼音訊資訊1004判斷之各別資訊。因此,調性資訊獲得單元1080可接收經編碼音訊資訊及/或例如以下各者中之至少一者:指示調性資訊是否包括於經編碼音訊資訊中的資訊、濾波增益值、預測增益值及/或時域後置濾波器增益值。
作為另一任擇特徵,頻譜孔填充單元1010可例如經組配以針對低於雜訊填充結束頻率之較高頻區中的頻譜孔之填充應用高頻雜訊增益調整。因此,頻譜孔填充單元1010可具備高頻(HF)能量資訊1032。
作為一實例,解碼單元1030可經組配以基於經編碼音訊資訊1004獲得高頻能量資訊1032。
作為另一任擇特徵,解碼器1000 (例如解碼單元1030)可例如經組配以取決於高頻能量值、取決於全域增益值且取決於雜訊位準資訊而獲得高頻能量差量值。在圖10之實例中,HF能量資訊1032可包含高頻能量差量值。此外,高頻能量值、全域增益值及/或雜訊位準資訊可例如以經編碼形式包括於經編碼音訊資訊1004中。
任擇地,音訊解碼器可經組配以應用高頻能量差量值來獲得一或多個雜訊填充值。作為一實例,根據一實施例,填充值1014可為雜訊填充值,且頻譜孔填充單元1010可經組配以應用由解碼單元提供之高頻能量差量值來調適填充值1014以將雜訊填充值「填充」於經解碼頻譜值集合中。
作為另一任擇特徵,音訊解碼器1000 (例如,頻譜孔填充單元)可經組配以選擇性地使與低於雜訊填充結束頻率之較高頻區中之頻率相關聯的一或多個中間雜訊填充值(例如,填充值1014)與高頻能量差量值相乘。
任擇地,音訊解碼器1000 (例如,頻譜孔填充單元1010)可經組配以將高頻雜訊增益調整選擇性地應用於執行雜訊填充所針對的頻譜值。作為一實例,可在8 kHz與10 kHz之間的頻率範圍中應用高頻雜訊增益調整。
任擇地,高頻能量值或高頻能量差量值可表示在低於雜訊填充結束頻率之頻率下或在低於經量化為零之雜訊填充結束頻率之頻率區中的多個頻譜係數之能量。
圖11展示根據根據本發明之第二態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器的示意圖。圖11展示包含任擇編碼單元1110之編碼器1100。編碼單元1110可經組配以編碼多個經量化頻譜值1112。
此外,編碼器1100包含可經組配以獲得滯後值1122之滯後值獲得單元1120,該滯後值界定待由音訊解碼器執行以導出用於填充頻譜孔的一或多個填充值之濾波操作或預測操作之特性。
此外,編碼器1100包含可經組配以獲得增益值1132之增益值獲得單元1130,該增益值界定待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作之特性。
編碼器1100可另外包含滯後值修改單元1140,該滯後值修改單元可經組配以在增益值1132小於臨限值的情況下或在增益值之絕對值小於臨限值的情況下將滯後值1122設定為零,以藉此獲得經修改滯後值1142。
編碼單元1110可經組配以編碼所判定之滯後值1122或經修改滯後值1142。
因此,作為一選項,經量化頻譜值1112及(經修改)滯後值1122/1142可使用編碼單元1110編碼於經編碼音訊資訊1102中。
此外,編碼器xx可包含用於基於輸入音訊資訊1104將經量化頻譜值1112提供至編碼單元1110之任擇處理單元1150。
作為一實例,滯後值1122及增益值1132可使用或基於應用於一組頻譜值1152之自相關資訊來判定或計算,該組頻譜值可例如與頻譜值1112相關聯。舉例而言,增益值1132可取決於自相關函數之峰值而判定,該峰值係基於該組頻譜值而獲得。作為一實例,處理單元1150可經組配以將該組頻譜值1152提供至滯後值獲得單元1120及增益值獲得單元1130。頻譜值1152可例如經量化,且可例如等於經量化頻譜值1112。
任擇地,編碼單元1110可經組配以在經編碼滯後值為非零的情況下編碼增益值1132。滯後值1122/1142可包含關於頻譜係數(例如,頻譜值)之間例如在不同頻帶上的相依性或相關性之資訊。在此類相關性存在之情況下,滯後值1122可為非零,且因此相依性可藉由增益值1132表徵。
一般而言,簡言之,且作為實例,滯後值1122可描述具有給定頻率之頻譜值與具有不同頻率之另一頻譜值在頻域中之距離。舉例而言,增益值可描述或量化頻譜值之間的相關性。因此,一個頻譜值可由另一頻譜值以及增益及滯後資訊判定。因此,第二頻譜值之傳輸在已知滯後及增益資訊的情況下可能並無必要。
作為另一任擇特徵,處理單元1150可例如經組配以判定或計算高頻(HF)能量值1154。HF能量值1154可包括用於調整HF間隙填充範圍的資訊。
任擇地,編碼單元1110可經組配以在經編碼滯後值為零的情況下選擇性地編碼高頻能量值1154,該高頻能量值可描述在例如具有經量化頻譜值之頻譜之上部部分中的能量。作為一實例,為零之滯後值1122/1142可指示,無頻譜係數之間的相關性可用於編碼頻譜值。因此,替代編碼滯後及增益值,HF能量值可經編碼以執行間隙填充,例如使得在解碼器中根據HF能量值1154調適間隙填充範圍中之頻譜能量。
作為另一任擇特徵,編碼單元1110可經組配以取決於經編碼滯後值而選擇性地編碼增益值1132或高頻能量值1154。
此外,編碼單元1110可任擇地經組配以使用相同數目個位元編碼增益值1132與高頻能量值1154。因此,編碼方案(例如,經編碼位元串流中經保留用於特定資訊的位元之數目)可在任一情況下保持恆定,或換言之,無關於增益值抑或高頻能量值經編碼而保持恆定。
作為另一任擇特徵,編碼器1100可任擇地經組配以判定用於不同音訊訊框及/或用於不同音訊子訊框之單獨滯後值1122/1142及/或單獨增益值1132。
此外,滯後值1122/1142及/或增益值1132可在變換域中判定或計算。
任擇地,滯後值獲得單元1120可經組配以執行長期瞬態性偵測,且在發現音訊訊框或音訊子訊框並非長期瞬態的情況下將滯後值1122選擇性地設定為零。
圖12展示根據根據本發明之第二態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之另一音訊編碼器的示意圖。圖12展示編碼器1200,其包含任擇處理單元1210及任擇編碼單元1220。
編碼單元1220可經組配以編碼多個經量化頻譜值1222。此外,編碼單元1220可經組配以編碼高頻能量值或高頻能量差量值1224。因此,編碼器1200可提供包含經量化頻譜值及/或HF能量(差量)值之經編碼表示的經編碼音訊資訊1202。
處理單元1210可經組配以基於輸入音訊資訊1204提供該等經量化頻譜值1222。此外,處理單元1210可經組配以使用輸入音訊資訊1204提供該等HF能量(差量)值1224。
高頻能量值或高頻能量差量值可表示在低於雜訊填充結束頻率之頻率下或在低於經量化為零之雜訊填充結束頻率之頻率區中的多個頻譜係數之能量。作為一實例,HF能量值(或例如在差分熵寫碼之情況下之差量) 1224可表示稍微低於經量化為零之雜訊填充結束頻率(例如在8 kHz至10 kHz頻率範圍內)之頻譜時間正規化頻譜係數的原始RMS能量。
任擇地,處理單元1210可進一步經組配以對數性地量化高頻能量值或高頻能量差量值(作為一實例),因此將高頻能量值或高頻能量差量值的經量化表示提供至編碼單元1220。
作為另一任擇特徵,處理單元1210可例如經組配以將例如GG
sf之全域增益1212及/或雜訊資訊1214 (例如雜訊位準,例如L
sf)提供至編碼單元1220 (其可基於輸入音訊資訊1204而判定)。編碼單元1220可任擇地經組配以編碼相對於全域增益1212與雜訊位準1214之乘積之高頻能量差量值,其可任擇地描述在低於雜訊填充結束頻率之頻率下或在低於經量化為零之雜訊填充結束頻率之頻率區中的多個頻譜係數之能量。
作為另一任擇特徵,編碼單元1220可例如經組配以獲得高頻能量值與全域增益1212與雜訊資訊1214 (例如呈雜訊值之形式)之乘積之間的比率之對數的經捨入縮放結果,以便編碼高頻能量值。
任擇地,處理單元1210可經組配以根據下式判定經量化高頻能量差量值:
Ehf
sf=1+round(Δ*log
2(EHF
sf/(GG
sf*L
sf)),
其中EHF為高頻能量值,其中GG
sf為全域增益1212,其中L
sf為雜訊位準1214,且其中Δ為常數。
圖13展示根據根據本發明之第三態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊的音訊解碼器之示意圖。圖13展示音訊解碼器1300,其包含任擇頻譜孔填充單元1310,該頻譜孔填充單元可經組配以使用各別填充值1314填充經解碼頻譜值集合1312的頻譜孔。
解碼器1300可進一步包含任擇預測或濾波單元1320,該預測或濾波單元可經組配以使用預測或濾波判定各別填充值1314,使得與給定頻率相關聯之給定填充值1314係取決於與不同頻率相關聯之另一頻譜值1322而獲得。
此外,解碼器1300可任擇地包含濾波強度調適單元1330。濾波強度調適單元1330可將濾波強度資訊1332 (例如,關於濾波強度之資訊)提供至預測或濾波單元1320。濾波強度調適單元1330可經組配以取決於經編碼或經量化頻譜值1334 (任擇地例如作為替代例)而利用與不同頻率相關聯的提供至預測或濾波單元1320之頻譜值1322來調適強度強度。
作為任擇特徵,解碼器1330可包含解碼單元1340,該解碼單元可經組配以使用或基於經編碼音訊資訊1302將經解碼頻譜值集合1312提供至頻譜孔填充單元1310。任擇地,解碼單元1300可將與不同頻率相關聯(例如,自經編碼音訊資訊1302判定)之頻譜值1322提供至預測或濾波單元1320及/或濾波強度調適單元1330。
任擇地,濾波強度(例如,作為濾波強度資訊1332之部分)判定另一頻譜值1322對給定填充值1314之影響。此外,濾波強度調適單元1330可例如經組配以取決於如藉由經編碼音訊資訊1302中之個別頻譜值之經編碼表示判定的與不同頻率相關聯之頻譜值1334而調適濾波強度。任擇地,濾波強度可取決於在應用雜訊填充之前與不同頻率相關聯之頻譜值1334及/或取決於與不同頻率(或值)相關聯之頻譜值1334是否經量化為零及/或取決於是否將雜訊填充應用於與不同頻率(或值)相關聯之頻譜值1334而調適。
作為另一任擇特徵,預測或濾波單元1320可經組配以針對應用雜訊填充所針對的頻譜值選擇性地應用頻率方向上之濾波或頻率方向上之預測。
圖14展示根據根據本發明之第三態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖。圖14展示解碼器1400,其包含任擇解碼單元1410、頻譜孔填充單元1420、預測或濾波單元1430及濾波強度調適單元1440。此等元件可包含與在圖13之上下文中所解釋者相同或類似或相似功能性及對應輸入及/或輸出信號。
另外,作為另一任擇特徵,音訊解碼器1400,例如音訊解碼器1400之預測或濾波單元1440,可經組配以應用預測或濾波,以便基於隨機或偽隨機雜訊值判定給定填充值1432。因此,雜訊值資訊1436 (例如,包含隨機或偽隨機雜訊值)可提供至預測或濾波單元1430。
任擇地,雜訊值資訊1436可例如包含與給定頻率相關聯之雜訊值及/或與另一頻率相關聯之雜訊值。作為另一任擇特徵,與不同頻率相關聯之頻譜值1454或1434可例如為與另一頻率相關聯之填充值。因此,任擇地,解碼器1400可包含用以提供雜訊值資訊1436及或與不同頻率相關聯之填充值(例如,因此在此情況下,任擇地不由解碼單元1410提供)的構件。舉例而言,解碼單元1410可提供頻譜值經量化為零之資訊,該頻譜值可基於雜訊值資訊或基於具有不同頻率之填充值來替換(例如,如下文所解釋)。
作為另一任擇特徵,音訊解碼器1400,例如其預測或濾波單元1430,可經組配以執行與給定頻率相關聯之雜訊值及與另一頻率相關聯之雜訊值的加權組合,或與給定頻率相關聯之雜訊值及與另一頻率相關聯之填充值的加權組合,以便獲得給定填充值1432。
此外,解碼器1400可包含權重調整單元1450,該權重調整單元可經組配以取決於雜訊填充是否已應用於與另一頻率相關聯之頻譜值1454或1434而調整給定至與另一頻率相關聯之雜訊值的權重或給定至與另一頻率相關聯之填充值的權重。因此,可將例如包含關於各別權重之資訊的權重資訊1452自權重調整單元1450提供至預測或濾波單元1430。
作為另一任擇特徵,解碼器1400可包含頻譜距離判定單元1460,該頻譜距離判定單元可經組配以基於描述包括於音訊資訊之經編碼表示1402中的頻譜距離之經編碼資訊判定與給定頻率相關聯之填充值1430與同不同頻率相關聯之另一頻譜值1454或1434之間的頻譜距離。
任擇地,音訊解碼器1400,例如權重調整單元1450,可經組配以基於包括於音訊資訊之經編碼表示1402中的增益資訊判定權重(其中權重資訊1452可包含權重),該權重應用於與給定頻率相關聯之雜訊值(其中雜訊值資訊1436可包含雜訊值)。
作為另一任擇特徵,音訊解碼器1400,例如權重調整單元1450,可經組配以取決於包括於音訊資訊之經編碼表示中之增益資訊判定權重(其中權重資訊1452可包含權重),該權重應用於與另一頻率相關聯之雜訊值(其中雜訊值資訊1436可包含雜訊值)或應用於與另一頻率相關聯之填充值。
因此,音訊資訊之經編碼表示1402可包含增益資訊之經編碼表示,其可例如由解碼單元1410解碼並提供至權重調整單元1450。作為一實例,任擇地包含增益資訊之調整資訊1454可提供至權重調整單元1450。
任擇地,音訊解碼器,例如權重調整單元1450,可經組配以取決於包括於音訊資訊之經編碼表示1402中之正負號資訊判定權重,該權重應用於與另一頻率相關聯之雜訊值或應用於與另一頻率相關聯之填充值。
因此,音訊資訊之經編碼表示1402可包含可例如由解碼單元1410解碼且例如在調整資訊1454中提供至權重調整單元1450的正負號資訊之經編碼表示。
作為一實例,音訊解碼器,例如預測或濾波單元1430,可經組配以在係數c(i-P'
sf) 1454或1434係使用雜訊填充獲得的情況下根據č(i)=d*c(i) + G'
sf*c(i-P'
sf)判定給定填充值č(i) 1432,且在係數c(i-P'
sf) 1454或1434並非係使用雜訊填充獲得的情況下根據č(i)=d*c(i) + ½*G'
sf*c(i-P'
sf)判定給定填充值č(i),其中c(i)表示使用雜訊填充獲得且具有頻譜索引i之頻譜係數; 其中d表示衰減係數,其中G'
sf表示基於包括於經編碼音訊表示1402中之增益值1454的權重1452;且其中c(i-P'
sf)表示具有頻譜索引i-P'
sf之頻譜係數,其中P'
sf為基於包括於經編碼音訊表示中之預測參數資訊的預測參數或濾波參數。
作為另一任擇特徵,音訊解碼器1400,例如解碼單元1410,可經組配以根據P'
sf=p
sf+B獲得預測參數或濾波參數P'
sf,其中p
sf為包括於經編碼音訊表示中之滯後索引,且其中B為常數。
替代地或另外,音訊解碼器,例如權重調整單元1450,可經組配以根據G'
sf=(-1)
Ssf* (3+2*g
sf)/8獲得權重G'
sf(權重資訊可包含權重G'
sf),其中S
sf為包括於經編碼表示中之二進位值,且其中g
sf為包括於經編碼表示中之二進位值。
替代地或另外,音訊解碼器,例如解碼單元1410,可經組配以根據d=(7.5-gsf)/8獲得衰減係數d,其中g
sf為包括於經編碼表示中之二進位值。
如任擇地在圖14中所示,解碼單元1410可例如將例如包含預測參數或濾波參數P'
sf及/或常數B及/或衰減係數d之參數資訊1412提供至預測或濾波單元1430。然而,應注意,解碼單元1410可任擇地僅將經解碼頻譜值集合1422提供至頻譜孔填充單元1420,且解碼器1400可包含用於例如基於經編碼音訊資訊1402提供各別資訊之一或多個專用獲得及/或計算及/或判定單元。
作為另一任擇特徵,音訊解碼器1400可經組配以標記雜訊填充零量化頻譜係數,且選擇性地使用應用於未標記之頻譜係數的減小之濾波強度。
圖15展示根據根據本發明之第三態樣的實施例之解碼器(例如,圖14中所示之解碼器1400或圖13中所示之解碼器1300)之功能性的實例。因此,本發明之解碼器可經組配以執行以下步驟:
1. 設定P'
sf=p
sf+B、G'
sf=(-1)
Ssf* (3+2*g
sf)/8且d=(7.5-g
sf)/8 (1501);
2. 執行雜訊填充,且標記雜訊填充零量化頻譜係數(1502);
3. 對於位置i>=P'
sf處之多個雜訊填充零量化頻譜係數c,進行(1503):
4. 若在步驟2中標記位置i-P'
sf處之係數c,則用d*c(i) + G'
sf*c(i-P'
sf)替代c(i);否則
5. 用d * c(i) + 1/2*G'
sf*c(i-P'
sf)替代c(i)。
圖16展示根據根據本發明之第三態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖。圖16展示解碼器1600,其包含任擇預測或濾波單元1610,該預測或濾波單元可經組配以使用預測或濾波判定經處理頻譜值1612,使得取決於與不同頻率相關聯之另一頻譜值1614獲得與給定頻率相關聯之給定經處理頻譜值1612。
作為任擇特徵,解碼器1600可包含解碼單元1620,該解碼單元可經組配以基於經編碼音訊表示1602將與不同頻率相關聯之頻譜值1614提供至預測或濾波單元1610。
作為另一任擇特徵,解碼器1600可包含濾波強度調適單元1630,其可經組配以取決於經編碼或經量化頻譜值1634 (例如,任擇地替代地,與不同頻率相關聯之1614)而調適濾波強度。因此,濾波強度調適單元可將濾波強度資訊1632提供至預測或濾波單元1610。任擇地,頻譜值1634可由解碼單元基於經編碼音訊表示提供。
任擇地,濾波強度調適單元1630可經組配以調適濾波強度以減少包括於預測或濾波中的非零量化頻譜係數之貢獻。
圖17展示根據根據本發明之第一態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之方法的方塊圖。方法1700包含:自經編碼音訊資訊導出1710頻譜傾斜資訊;使用1720填充值以便填充經解碼頻譜值集合之頻譜孔;及將頻率可變縮放應用1730於填充值,頻率可變縮放之頻譜傾斜由頻譜傾斜資訊判定。
圖18展示根據根據本發明之第一態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之方法的方塊圖。方法1800包含:編碼1810多個經量化頻譜值;基於頻譜能量資訊及遮蔽包絡資訊判定1820頻譜傾斜資訊;及編碼1830頻譜傾斜資訊。
圖19展示根據根據本發明之第二態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之方法的方塊圖。方法1900包含:填充1910經解碼頻譜值集合之頻譜孔;獲得1920預測滯後資訊;及取決於預測滯後資訊而在第一頻譜填充方法與一或多個其他頻譜填充方法之間切換1930,在該第一頻譜填充方法中,使用頻率濾波或頻率預測來獲得用以填充頻譜孔之填充值,且在該一或多個其他頻譜填充方法中,不使用頻率濾波且不使用頻率預測來獲得用以填充頻譜孔之填充值。
圖20展示根據根據本發明之第二態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之方法的方塊圖。方法2000包含:編碼2001多個經量化頻譜值;獲得2002滯後值,該滯後值界定待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作之特性;獲得2003增益值,其界定待由音訊解碼器執行以導出用於填充頻譜孔之一或多個填充值的濾波操作或預測操作之特性;在該增益值小於臨限值的情況下或在該增益值之絕對值小於臨限值的情況下將該滯後值設定2004為零,以藉此獲得經修改滯後值;及編碼2005經判定滯後值或經修改滯後值。
圖21展示根據根據本發明之第三態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之第一方法的方塊圖。方法2100包含:使用各別填充值填充2101經解碼頻譜值集合之頻譜孔;使用預測或濾波判定2102填充值,使得取決於與不同頻率相關聯之另一頻譜值獲得與給定頻率相關聯之給定填充值;及取決於與不同頻率相關聯之經編碼或經量化頻譜值調適2103濾波強度。
圖22展示根據根據本發明之第三態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之第二方法的方塊圖。方法2200包含:使用預測或濾波判定2201經處理頻譜值,使得取決於與不同頻率相關聯之另一頻譜值獲得與給定頻率相關聯之給定經處理頻譜值;及取決於與不同頻率相關聯之經編碼或經量化頻譜值調適2202濾波強度。
在下文中,揭露本發明之其他實施例。另外,將以不同詞語解釋如上文所論述之根據本發明之實施例。應注意,如上文所論述之任何特徵、功能性及細節可任擇地與下文所解釋之實施例中之任一者一起使用或併入其中,且反之亦然。
此外,應注意,在下文中,根據本發明之一些實施例經解釋為根據不同發明性態樣結構化。然而,諸態樣中之以下結構化可例如不同於之前解釋的結構化,以便突出實施例之不同特徵、功能性及細節以及該等特徵、功能性及細節之各別可組合性。作為一實例,如之前所解釋之態樣1可對應於以下態樣1。如之前所解釋之態樣2可例如對應於以下態樣2、3及4。如之前所解釋之態樣3可例如對應於以下態樣2、3及4。然而,此等僅為實例,且再次應注意,根據任何實施例之任何特徵、功能性及細節可併入任何其他實施例或與任何其他實施例一起使用,例如,無關於至不同態樣之分類。此類分類可例如僅用以提供實施例之集群的實例,以便於熟習此項技術者形成對本發明之較佳理解。
在下文中,不同發明實施例及態樣將描述於「音訊寫碼中用於頻譜時間改善頻譜間隙填充之方法及設備」中,例如章節「引言,習知解決方案」、例如章節「習知解決方案之缺陷」、章節「發明內容」、例如章節「本發明之描述」、例如章節「FD-LTP適應性濾波態樣至時間雜訊塑形濾波之應用」及例如章節「根據本發明之實施例之對於三個[例如,部分地]非相依解碼器之提議」。
此外,其他實施例將由所附申請專利範圍界定。
應注意,如由申請專利範圍所界定之任何實施例可藉由分別在上文所提及的章節中所描述之細節(特徵及功能性)中之任一者及在如本文所揭露之任何其他實施例之上下文中所描述之細節(特徵及功能性)中之任一者加以補充。
又,在上文所提及的章節中所描述之實施例以及之前論述的實施例中的任一者可個別地使用,且亦可藉由在另一章節中或來自任何其他實施例之特徵中之任一者或藉由包括於申請專利範圍中之任何特徵加以補充。
又,應注意,可個別地或組合地使用本文中所描述之個別態樣。因此,細節可添加至該等個別態樣中之每一者,而不將細節添加至該等態樣中之另一者。
此外,本文所揭露之與方法相關之特徵及功能性亦可用於設備(經組配以執行此類功能性)中。另外,本文中相對於設備所揭露之任何特徵及功能性亦可用於對應方法中。換言之,本文中所揭露之方法可藉由關於設備所描述之特徵及功能性中之任一者來補充。
又,本文中所描述之特徵及功能性中之任一者可用硬體或軟體來實施,或使用硬體與軟體之組合來實施,如將在章節「實施方案替代例」中所描述。
實施替代例:
儘管已在設備之上下文中描述或將描述一些態樣,但顯而易見,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,方法步驟之內容脈絡中所描述之態樣亦表示對應區塊或項目或對應設備之特徵的描述。可由(或使用)硬體設備(例如,微處理器、可規劃電腦或電子電路)執行方法步驟中之一些或所有。在一些實施例中,可由此類設備執行最重要之方法步驟中之一或多者。
本發明之經編碼音訊信號可儲存於數位儲存媒體上或可在諸如無線傳輸媒體之傳輸媒體或諸如網際網路之有線傳輸媒體上傳輸。
取決於某些實施要求,本發明之實施例可在硬體或軟體中實施。實施可使用數位儲存媒體來進行,該數位儲存媒體例如軟性磁碟、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該數位儲存媒體上儲存有電子可讀控制信號,該電子可讀控制信號與可規劃電腦系統協作(或能夠協作)使得各別方法被進行。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可規劃電腦系統合作,使得本文中所描述之方法中的一者得到執行。
通常,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品在電腦上運行時,程式碼操作性地用於執行該等方法中之一者。程式碼可例如儲存於機器可讀載體上。
其他實施例包含儲存於機器可讀載體上的用於執行本文中所描述之方法中的一者的電腦程式。
換言之,因此,本發明方法之實施例為具有當電腦程式運行於電腦上時,用於執行本文中所描述之方法中的一者的程式碼之電腦程式。
因此,本發明方法之另一實施例為包含記錄於其上的,用於執行本文中所描述之方法中的一者的電腦程式之資料載體(或數位儲存媒體,或電腦可讀媒體)。資料載體、數位儲存媒體或記錄媒體通常係有形的及/或非暫時性的。
因此,本發明方法之再一實施例為表示用於執行本文中所描述之方法中的一者之電腦程式之資料串流或信號序列。資料串流或信號序列可例如經組配以經由資料通訊連接(例如,經由網際網路)而傳遞。
另一實施例包含處理構件,例如,經組配或經調適以執行本文中所描述之方法中的一者的電腦或可規劃邏輯裝置。
另一實施例包括其上安裝有用於執行本文中所描述之方法中的一者的電腦程式之電腦。
根據本發明之另一實施例包含經組配以將用於執行本文中所描述之方法中的一者的電腦程式傳送(例如,用電子方式或光學方式)至接收器的設備或系統。接收器可為例如電腦、行動裝置、記憶體裝置或類似者。該設備或系統可例如包含用於傳送電腦程式至接收器之檔案伺服器。
在一些實施例中,可規劃邏輯裝置(例如,場可規劃閘陣列)可用以執行本文中所描述之方法的功能性中之一些或所有。在一些實施例中,場可規劃閘陣列可與微處理器合作,以便執行本文中所描述之方法中的一者。通常,該等方法較佳地由任一硬體設備執行。
本文中所描述之設備可使用硬體設備或使用電腦或使用硬體設備與電腦之組合來實施。
本文中所描述之設備或本文中所描述之設備的任何組件可至少部分地以硬體及/或以軟體來實施。
本文中所描述之方法可使用硬體設備或使用電腦或使用硬體設備與電腦的組合來進行。
本文所描述之方法或本文中所描述之設備的任何組件可至少部分地由硬體及/或由軟體執行。
在音訊寫碼中用於頻譜時間改善頻譜間隙填充之方法及設備 1. 引言,習知解決方案
本發明係關於例如在感知上改善計算頻譜包絡(例如,如應用於現代音訊變換編解碼器中)之方式,及/或改善重構在編碼器中經量化為零的頻譜區之頻譜及/或時間精細結構之方式。另外,或換言之,作為實例,本發明係關於表示例如在習知音訊編解碼器中之頻譜量化期間所使用之時變及/或頻變遮蔽臨限值的
頻譜包絡,其中作為一實例,每一頻譜可例如在量化之前例如除以相關聯遮蔽臨限值,且例如在量化之後乘以相關聯遮蔽臨限值,從而例如根據遮蔽臨限值得到量化失真之
頻譜塑形。此類頻譜包絡之計算可例如傳統地涉及在量化之前將某一
頻譜傾斜(作為一實例或舉例而言,亦常常被稱作「預加重」)應用於包絡資料,例如以便確保例如在寫碼位元分配期間,在低頻率下之寫碼SNR高於高頻下之寫碼SNR,且藉此作為一實例確保較高音訊品質。見例如自2018年以來之3GPP TS 26.445,增強型語音服務(EVS)詳細演算法描述或PCT/EP2018/080137。另外,本發明係關於由在相對低目標位元速率下之粗略量化引起的頻譜間隙(編碼之後的零量化頻率係數)之
頻譜取代或「填充」。
已發現,低頻(LF)頻譜內容例如通常藉由上述方法足夠準確地寫碼,例如,此係因為例如歸因於在計算遮蔽包絡期間將頻譜傾斜應用於實際頻譜包絡上,LF SNR例如相對較高。然而,亦發現,在低寫碼位元速率下,例如,高頻(HF)頻譜範圍之較大部分可例如很可能經量化為零,從而例如導致HF頻譜間隙。存在可例如用隨機頻譜值(例如,諸如MPEG-4進階音訊寫碼(AAC)中之感知雜訊取代(PNS)及/或MPEG-D擴展HE-AAC及3GPP EVS中之頻域雜訊填充)填充此等零量化部分之方法,但此等方法可能展現某些缺陷,例如在靈活性及/或傳信方面,例如如下文中所描述。
2. 習知解決方案之缺陷
PNS方法可將頻譜帶之目標能量傳信至解碼器,該頻譜帶已例如在編碼器中經量化為零,且PNS解碼器可將偽隨機值插入至零量化頻帶中,例如經縮放以使得插入信號能量與經傳信目標能量匹配。儘管此方案可例如相當準確地(例如,在低位元速率下)保持頻譜能量(且藉此作為一實例,保持原始頻譜包絡),但其可能傾向於需要許多位元,例如用於零量化頻帶能量之傳信,此可能適得其反。此外,其可為例如相對不靈活的,此係因為僅完全零量化頻譜帶可例如經取代——在至少一個頻譜係數為非零之頻帶中(例如,在量化之後)可能不執行取代。
MPEG-D擴展HE-AAC及3GPP EVS中所使用之
雜訊填充方法可例如藉由允許例如在解碼後用例如高於某一「雜訊填充開始頻率」之偽隨機值替換零量化頻譜係數(例如,即使某一頻譜帶在編碼器中並未完全量化為零時)來改善PNS設計。然而,MPEG-D編解碼器可仍針對所有完全零量化頻帶傳信逐頻帶目標能量資料,因此作為一實例,增大傳信額外負荷,例如,尤其在許多頻帶零量化時。3GPP EVS中之雜訊填充方法可避免此等逐頻帶能量之傳輸,且實情為,可利用例如僅傳輸之頻譜全域雜訊位準
l及/或預定義之頻譜傾斜
t。
藉助於
圖 2 及圖3更仔細審視EVS雜訊填充方法顯示,在EVS中,在零量化頻譜區中重構之頻譜包絡可例如不直接由原始信號之頻譜包絡(亦即,信號包絡;實線粗黑色曲線)給出,而是例如由遮蔽臨限值之經縮放版本(亦即,在量化之前使用的正規化包絡之反數,例如,用於量化失真之
頻譜塑形,例如如在引言中所描述;粗黑虛曲線)給出。此並不出人意料:零量化頻譜區中之解碼結果可為經插入偽隨機值、經傳輸頻譜全域雜訊位準0 <
L< 1與經傳輸遮蔽包絡之乘積——真實頻譜包絡之表示可自編碼器傳達至解碼器。
圖2比較在無任何頻譜傾斜補償存在下由EVS間隙填充(或例如,雜訊填充)演算法作為目標的頻譜包絡,或可例如展示該比較。應注意,出於所有曲線之較佳可視性,虛線遮蔽臨限值曲線已向下偏移。可看到,例如,歸因於頻率不變位準
l,遮蔽包絡與有效重構雜訊包絡(實線灰色曲線)之間的距離可為恆定的(細雙箭頭),且例如因此,可能不會或
並不準確地遵循原始頻譜包絡。實際上,經重構之雜訊包絡可能在高頻下超過原始頻譜包絡,例如,因此可能在解碼之後引起可聽雜訊,而其可能例如在較低頻率下保持顯著低於原始頻譜包絡,例如因此可能導致不足的填隙能量及/或可聽頻譜孔。例如在計算遮蔽包絡(亦即,雜訊塑形包絡,例如如所解釋)期間所應用的頻譜傾斜可例如因此用於在零量化頻譜區中重構之頻譜包絡中。
圖3繪示例如所要頻譜間隙填充行為之實例,或可例如展示該實例之說明。此處,雜訊塑形包絡與零量化頻譜區中之有效經重構包絡之間的距離(灰色曲線)並不恆定,而是朝向較高頻向下
傾斜(細雙箭頭之長度隨著頻率而減小)。可例如以頻率相依方式
( 例如針對頻率相依方式及/ 或以頻率相依方式)用乘法應用於
l之此傾斜可意欲補償例如在遮蔽包絡之計算期間應用的預加重傾斜,例如以便恢復或至少近似得出輸入信號之真實頻譜包絡(例如在間隙填充期間)。在EVS中,此傾斜
t(參見上文)可為預定義常數,但可例如觀測到,例如歸因於遮蔽包絡之量化(例如,藉助於EVS及導出之編解碼器中之低速率向量量化)及/或某一輸入信號相依性,每個訊框或變換之
t的最佳值可例如改變相當大。舉例而言,信號適應性、逐訊框或逐變換傳信之
t將或可因此例如相較於例如
t之恆定值係例如更合乎需要的。
此外,將需要或可能例如需要允許例如在解碼期間調整經取代偽隨機間隙填充值之精細頻譜及/或時間包絡,例如以較佳地匹配輸入信號包絡。
3. 發明內容
舉例而言,為解決目前先進技術之前述缺點,例如即,相對較大間隙填充能量傳信額外負荷及/或例如經由間隙填充在音訊解碼期間之不充分準確之頻譜包絡恢復例如與例如在經由間隙填充產生之頻譜區中精細頻譜時間包絡之不充分準確重構組合,提議用於改善間隙填充之以下方法,例如,根據本發明之實施例:
1. 例如在音訊變換編解碼器中傳輸逐訊框及/或逐子訊框頻譜傾斜校正
t,例如,在不顯式傳輸零量化頻帶中之目標能量的情況下應用頻譜間隙填充(其中,例如,「頻帶」指示特定非重疊頻率範圍)。在部分4.1中描述根據實施例之此態樣或例如此態樣之實例。其益處可例如為例如來自經傳輸遮蔽包絡(亦即,雜訊塑形包絡)之真實頻譜包絡的改善恢復,及/或例如與經傳輸遮蔽包絡(亦即,雜訊塑形包絡)之量化無關。
2. 信號適應性選擇,例如每訊框及/或每子訊框,例如在不同方法之間,例如用於產生例如在間隙填充期間使用之「人工」頻譜內容,其中該選擇作為一實例例如藉助於頻域長期預測(FD-LTP)滯後參數傳信至音訊變換解碼器。此態樣或例如根據實施例之此態樣之實例描述於部分4.2中。根據實施例之一般想法為例如取決於FD-LTP滯後值,在以下各者之間進行選擇:
a)具有FD-LTP之雜訊填充;
b)基於調性之間隙填充,例如無FD-LTP,例如類似於EVS (先前技術方法)中之IGF;及
c)例如習知雜訊填充,例如無FD-LTP,例如類似於EVS或MPEG-D中之雜訊填充。
3. 當例如在以上態樣2中,選擇具有FD-LTP之雜訊填充時(其中作為一實例,FD-LTP滯後為非零),可例如執行例如在解碼器側雜訊填充常式期間(例如,取決於「當前」寫碼FD係數是否為零,且例如取決於距當前係數一定距離(由經傳輸FD-LTP滯後指定)處之對應「先前」寫碼FD係數是否為零)例如在例如音訊變換編解碼器之頻譜域(例如MDCT域)中應用長期預測性濾波器。根據實施例之此態樣或此態樣之實例描述於部分4.3中。
4. 舉例而言,在以上態樣2中,當選擇無FD-LTP之間隙填充(其中例如FD-LTP滯後為零)時,可例如執行信號適應性(例如,
複製及/ 或基於調性之)頻譜間隙填充程序之應用,例如類似於在例如3GPP EVS及MPEG-H音訊中使用之智慧型間隙填充(IGF)方法。
複製可指示自較低頻率非零量化FD係數重構零量化FD係數,且
基於調性可例如意謂可藉由例如自習知解決方案(此處,時域LTP或HPF滯後)已知之所傳輸逐(子)訊框(例如,逐訊框及/或逐子幀)「音訊調性資料」引導複製程序。根據實施例之此態樣(例如最終態樣)或此態樣之實例描述於部分4.4中。
作為一實例,此等態樣經設計用於3GPP IVAS編解碼器,但可同樣適用於(或例如,以類似方式)其他編解碼器,例如EVS。
4. 本發明之實施例的描述
舉例而言,一個或甚至本發明態樣之較佳實施(例如實施例)可能例如需要以下各者例如用於音訊編解碼器中。作為一實例,根據本發明的實施例可包含為了滿足以下先決條件的構件。因此,根據本發明之實施例可包含以下特徵:
先決條件a:在例如每一訊框及/或子訊框
sf內傳輸
N 位元雜訊位準索引(例如0 ≤ l
sf< 2
N),作為一實例,用以導出雜訊位準,例如
L
sf < 1。例如,在EVS、IVAS及/或其他編解碼器中,通常任擇擇
N= 3。
先決條件b:傳輸例如藉由獲得輸入頻譜之逐頻譜帶能量或RMS值來作為一實例在編碼器中導出的雜訊塑形包絡(作為一實例,亦即遮蔽包絡)。
先決條件c:例如藉助於時域長期預測(TD-LTP)及/或諧波後置濾波(例如HPF)滯後及增益將例如某種訊框及/或子訊框
音訊調性資訊傳輸至解碼器。若此資訊存在,則(子)訊框可例如被視為音調。
亦應注意,在以下描述中,術語訊框與子訊框可互換地使用。
4.1. 較佳實施例 : 例如根據態樣1 ( 作為一實例 , 適應性傾斜校正)
傳輸傾斜校正值背後的根據實施例的一般想法可例如為計算及/或低位元速率傳信例如在對數強度域中例如在子訊框之例如真實頻譜包絡(作為一實例,亦即,其輸入信號包絡,圖2及圖3中之實線黑色曲線)與子訊框之遮蔽包絡(作為一實例,亦即,雜訊塑形包絡,圖2及圖3中之虛線黑色曲線)之間的
差異曲線。由於可將遮蔽包絡傳輸至解碼器(例如,根據先決條件b),因此差異之額外傳輸可例如允許例如在間隙及/或雜訊填充解碼程序中例如以與習知解決方案相比更佳的準確度及/或以較少旁側資訊位元例如自遮蔽包絡及/或傾斜相關差異曲線重構真實頻譜包絡。
4.1.1. 編碼器中之傾斜線計算及編碼( 任擇)
圖3指示例如真實頻譜包絡與遮蔽包絡之間的強度差可單調地(例如隨著頻率)而改變。在對數強度域(例如,以10為底的對數)中及/或在間隙及/或雜訊填充頻譜區中(例如,在兩個細垂直箭頭之間),發現單調差異曲線例如在大部分時間類似於直線。因此,例如根據實施例提議例如藉助於例如簡單
線性回歸例如在對數強度域中(見例如https://en.m.wikipedia.org/wiki/Simple_linear_regression獲得描述)例如經由或使用以下函數計算及參數化差異曲線
差異曲線(
f) = 真實頻譜包絡(
f) - 遮蔽包絡(
f) =
T·
f+
O,
其中
f為所要頻率(或例如等效地,變換係數之偏移),
T為傾斜或
斜率值,
O為強度偏移,且兩個包絡皆在該對數域中。舉例而言,為了最小化
T及
O之計算複雜度,兩個包絡皆可例如較佳地由逐頻譜帶能量(例如,平方和)及/或均方根(RMS)值(例如,而非逐變換係數值)表示(例如,根據先決條件b,作為一實例,亦即,
f之值的數目可例如小於變換係數之數目)。
T及
O之編碼器側計算及/或編碼/解碼可例如接著如下進行:
對於每一(子)訊框
sf,
進行:
1. 例如自用於
sf之輸入(亦即,未經寫碼)頻譜計算逐頻譜帶能量及/或RMS值
E
sf (
f)
2. 將例如所有
E
sf (
f)轉換至對數域;自所有
E
sf (
f)減去其總平均值=> (例如,提供)零平均值
E'
sf 3. 自
E'
sf 計算、量化及/或解量化遮蔽包絡
M
sf ,例如,如目前先進技術中所描述
4. 自
M
sf 重構逐頻譜帶能量及/或RMS值=> (例如提供)對數及零平均值
M '
sf (
f)
5. 對例如所有成對的頻譜帶值
E'
sf 與
M'
sf 之間進行例如簡單線性回歸=> (例如提供)
T
sf 及
O
sf 6. 量化(例如至3個位元)及自
T
sf 解量化傾斜索引
t
sf (例如,經量化
T
sf 值:[1, 2,... 7, 8] / -5)
7. 自
t
sf 重構傾斜值=> (例如提供)經解碼傾斜
T'
sf ;在計算雜訊位準索引
l
sf 期間使用-
T'
sf ·
f。
應注意,在例如在步驟7期間的某些常數之恰當選擇的情況下,
O
sf 之值可例如在
l
sf 之計算中予以考量(作為一實例,亦即,可藉由
l
sf 自身補償)。因此,舉例而言,可能不必量化及傳信
O
sf 至解碼器,從而例如致使方法速率極低(例如,僅可或例如必須傳輸3位元
t
sf )。
應進一步注意,
T'
sf 可例如仍在對數域中,作為一實例,亦即,
T'
sf·f
可為例如在對數域中之加法乘積。因此,在導出
l
sf 時消除此對數域乘積例如在線性域中執行之計算的情況下,意味著除以線性域,例如乘積(例如,10
T'sf·f )之等值。
4.1.2. 解碼器中之傾斜重構及應用( 任擇)
在解碼器中之間隙及/或雜訊填充(例如使用
l
sf )期間,編碼器側步驟7可例如反向應用,例如如下:
對於每一(子)訊框
sf,
進行:
1. 例如根據目前先進技術自所傳輸之
l
sf 重構最終雜訊位準
L
sf ;亦作為實例,參見部分4.5
2. 自
t
sf 重構傾斜值=> (例如提供)經解碼傾斜
T'
sf ;例如在例如最終雜訊位準
L
sf 之乘法期間使用
T'
sf ·
f。
作為一實例,換言之,例如,當將
L
sf 相乘至所產生的間隙填充係數時,可例如以頻率偏移(
f)相依方式例如亦乘以傾斜校正乘積
T'
sf ·
f(例如,10
T'sf·f ,如上所述)之線性域等值。為了例如平均地維持
L
sf 之值範圍,可例如按某一常數縮放
T'
sf 。
在例如如上文所描述之變換頻譜之逐頻帶分段的情況下,例如每一頻譜帶之頻率偏移
f可例如表示例如:
a)彼頻帶之開始頻率(或例如,等效地,與彼頻帶相關聯之第一變換係數之偏移),或
b)頻帶之中心頻率(或例如等效地,第一變換係數在頻帶中之偏移加上該頻帶之寬度之一半,例如在變換係數之數目上)。發現兩個選項導致該方法之幾乎相同的準確度。
4.2. 較佳實施例 : 例如根據態樣2 ( 作為一實例 , 適應性間隙填充選擇)
例如如在部分.2中描述之目前先進技術提供例如至少兩種不同方法以在音訊變換寫碼中重構零量化頻譜區:例如使用偽隨機產生之變換係數值的簡單
雜訊填充(或PNS),及例如應用來自非零量化頻譜係數之複製的更智慧型
間隙填充(或例如,頻譜帶複製,SBR)。根據實施例及例如在根據本發明之實施例之此態樣或此態樣之實例背後的一般想法係提供例如基於(子)訊框之信號特徵在
雜訊填充與
間隙填充解決方案之間切換的構件,前者具有例如如下之任擇經改善精細時間塑形。
4.2.1.
「長期瞬態性」偵測及FD-LTP 編碼( 任擇)
以實驗方式發現,例如,特定言之,鼓掌類、下雨類及/或LF男性語音信號可例如受益於例如在解碼器側間隙及/或雜訊填充期間的例如HF精細時間信號包絡之改善的重構。對於經偵測及/或分類為例如「長期瞬態」之此等信號,舉例而言,特定(子)訊框
sf之精細時間結構可例如藉由頻域長期預測(FD-LTP)資訊參數化。類似於時域(TD)中獲取之習知LTP
音調及
增益資訊,FD-LTP滯後及/或增益值可例如直接在音訊編解碼器之變換域中獲得;詳細描述遵循部分4.3。舉例而言,待應用於解碼器中之雜訊及/或間隙填充之選擇可例如取決於例如在音訊位元串流中傳輸的該FD-LTP滯後
p之值而作出及/或傳信至解碼器,例如如下:
對於每一(子)訊框
sf,
進行:
1. 執行「長期瞬態性」偵測;
若 sf並非長期瞬態,則設定
p
sf = 0且中止;
否則:
2. 計算FD-LTP滯後
P
sf 及/或增益
G
sf ;
若|G
sf| < ß,其中0 < ß < 1為臨限值,則設定p
sf= 0且停止;
否則:
3. 例如自滯後
P
sf 獲得經量化(例如至3或4位元) FD-LTP滯後索引
p
sf ,例如如下文部分4.3中所描述
4.
若 p
sf 為0,則計算例如用於調整HF間隙填充區的經量化(例如至2個位元) HF能量值;
否則:
5. 自
G
sf 獲得經量化(例如至2個位元) FD-LTP增益
g
sf 及/或正負號
s
sf ,例如如下文在部分4.3中所描述。
根據用於計算HF能量值(例如用於調整HF間隙填充範圍)之實施例的實例詳細地描述於部分4.4中。應注意,例如藉由比較(例如對於每一子訊框)所計算之瞬時(及例如可能在時間上平滑化)頻譜及/或時間平坦度量測值與預定義臨限值且例如將
sf分類為「長期瞬態」(例如,在時間平坦度低於臨限值且頻譜平坦度高於臨限值的情況下),可例如習知地如在目前先進技術音訊編碼器中執行「長期瞬態性」偵測。
4.2.2. 解碼器中之填充類型選擇及參數讀取( 任擇)
在具有經量化FD-LTP滯後值
p
sf (例如,與FD-LTP
g
sf 及其正負號
s
sf 以及
音訊調性資訊(TD-LTP或HPF資料,先決條件c)一起在位元串流中傳輸)之情況下,解碼器可例如在具有或不具有FD-LTP濾波之情況下選擇應用哪種類型之頻譜填充(間隙填充或雜訊填充),例如如下:
對於每一(子)訊框
sf,
進行:
1.
若經量化滯後
p
sf > 0,則讀取經量化增益
g
sf 及正負號
s
sf 且
選擇類型:雜訊填充 + FD-LTP;
否則:
2. 讀取HF能量值,檢查音訊調性資料之存在;
若 sf為音調,則
選擇類型:間隙填充;
否則:
3.
選擇類型:無FD-LTP之傳統雜訊填充,如目前先進技術中所描述(例如EVS、MPEG-D)。
在下文描述用於操作FD-LTP擴增雜訊填充及基於調性的間隙填充的根據實施例之實例。應注意,在步驟2中將
sf分類為「音調」可例如基於先前技術音訊調性資料,例如在音訊調性資料存在的情況下藉由將
sf分類為「音調」(作為一實例,亦即,TD-LTP/HPF資料為非零)。或者,
sf可例如僅在傳輸TD-LTP/HPF增益值且其為最大值的情況下才被分類為「音調」。
4.3. 較佳實施例 : 例如根據態樣3 ( 作為一實例 , 具有FD-LTP 之雜訊填充)
如部分4.2.1中所提及或所解釋,舉例而言,經寫碼音訊信號之時間精細結構可例如在解碼器側雜訊填充程序期間例如藉助於FD-LTP濾波更準確地重構。因此,當在部分4.2.2中之逐(子)訊框程序中,已選擇(或作為一實例,可根據實施例選擇)類型
雜訊填充 + FD-LTP時,作為一實例,無限脈衝回應(IIR) LTP類濾波器可根據此態樣應用於例如在解碼器側雜訊填充期間產生的偽隨機雜訊係數,從而產生(作為一實例)精細時間塑形雜訊填充信號。
4.3.1. 編碼器中之FD-LTP 計算( 任擇)
是否應用具有FD-LTP濾波之雜訊填充的決策可例如基於可例如在編碼器中判定之FD預測器參數。此等預測器參數(滯後索引
p
sf 、增益索引
g
sf 及/或正負號索引
s
sf )可例如較佳地在例如在變換係數量化之前利用的頻譜時間正規化域中計算,作為一實例,亦即,關於(若適用) TNS分析濾波變換向量,其例如已例如藉由雜訊塑形包絡在感知上正規化(作為一實例,亦即,經劃分)。應注意,TNS分析濾波可例如有效地移除子訊框之
粗略時間包絡,而感知正規化可例如移除
粗略頻譜包絡,從而例如僅留下
精細時間包絡(例如,待由FD-LTP參數化)及/或
精細頻譜包絡(其對於該等「長期暫態」信號可預期為可忽略的)。FD-LTP參數計算可例如類似於習知TD-LTP及/或HPF計算來應用:
作為一實例,
對於分類為「長期瞬態」之每一(子)訊框
sf,
進行:
1. 在頻譜時間正規化頻譜上在滯後
B < p' < B + 2
B 處計算正規化自相關
2. 找出使正規化自相關之量值為最大之
p'=> (例如提供)具有自相關(例如自相關)值
G
sf 之
P
sf 3.
若|G
sf| < ß,則設定p
sf= 0且停止(亦參見例如部分4.2.1;0 < ß < 1可為臨限值,例如¼);
否則,設定
p
sf= P
sf-
B
4.
若|
G
sf | < ½,則設定
g
sf = 0;
否則,設定
g
sf = 1。最後,
若 G
sf ≥ 0,則設定
s
sf = 0;
否則,設定
s
sf = 1 (亦例如參見部分 4.2.1)。
應注意,例如僅為了降低計算複雜度,可針對FD-LTP計算整數頻譜滯後。此外,所有計算可僅應用在HF間隙填充區中。作為一實例,常數
B描述於部分4.5中。
4.3.2. 解碼器中之FD-LTP 應用( 任擇)
在例如已執行部分4.2.2中之所有步驟且已選擇類型
雜訊填充 + FD-LTP之後,三個FD-LTP參數可例如經解碼,且可例如應用傳統雜訊填充及例如隨後FD-LTP濾波:
作為一實例,
對於已選擇類型
雜訊填充 + FD-LTP之每一(子)訊框
sf,
進行:
1. 設定
P'
sf =
p
sf +
B,
G'
sf = (-1)
Ssf · (3 + 2·
g
sf ) / 8,且
d= (7.5 -
g
sf ) / 8。應注意,此處,可保證
p
sf > 0
2. 執行習知雜訊填充(亦即使用
l
sf );標記例如所有雜訊填充零量化頻譜係數
3.
對於位置i ≥
P'
sf 處之每一雜訊填充零量化頻譜係數
c,
進行:
4.
若在步驟2中標記位置
i-
P'
sf 處之係數
c,則用
d · c(i) + G'
sf· c(i - P'
sf)
替代
c(
i);
否則:
5. 用
d·
c(
i) + ½ ·
G'
sf ·
c(
i-
P'
sf )替代
c(
i)。
圖23繪示經受反變換(作為一實例,亦即,頻率至時間變換,例如,使用反MDCT)之偽隨機雜訊頻譜之FD-LTP濾波的時域效應(或可展示其實例之說明)。其展示,例如,取決於
p
sf 及/或
s
sf 之選擇,塑形波峰之數目及位置可例如變化。
附註1:
應注意,解碼步驟4及5可例如舉例而言在FD-LTP濾波期間有效地限制低頻非零量化頻譜係數例如對給定經取代零量化頻譜係數之貢獻。例如相同方法可在FD-LPC濾波(例如時間雜訊塑形(TNS)合成濾波)期間應用,例如以降低例如低位元速率音訊寫碼中可聽咔噠聲之可能性。具體言之,當使用例如TNS合成濾波器對給定零量化頻譜係數(例如作為向量之部分)進行濾波時,包括於濾波操作中之非零量化(且例如可能先前經TNS合成濾波)較低頻頻譜係數的貢獻(作為一實例,亦即,藉由非零濾波權重縮放)可例如藉由衰減其(例如濾波器輸出)值(例如如在步驟5中衰減½,例如當在濾波操作期間使用彼等值時)來加以限制。
4.4. 較佳實施例 : 例如根據態樣4 ( 作為一實例 , 基於調性之間隙填充)
態樣3或根據態樣3之實施例解決了對較準確的
精細時間雜訊塑形之需要。對較準確的
精細頻譜雜訊塑形(例如,尤其對高度音調及/或諧波音訊信號(例如,諸如語音或隔離樂器,如聲學或電吉他、大鍵琴、喇叭))之需要係藉由根據本發明之其他實施例的以下基於調性之頻譜間隙填充方法解決,該方法可例如類似於例如3GPP EVS中之IGF方案。以下提議與IGF技術之間的三個主要差異可為:
a)對
音訊調性參數(例如特定言之,TD-LTP或HPF參數)之相依性,及/或
b)在較低頻率下應用該基於調性之間隙填充(作為一實例,亦即在通常藉由雜訊填充作為目標之HF頻譜區中),及/或
c)可例如經由
l
sf 及/或傾斜線實現使用僅一個HF能量值(或例如,差量) LF頻譜塑形。
4.4.1. 編碼器中基於調性之間隙填充( 實例)
作為一實例,當在部分4.2.1中之逐(子)訊框程序中,執行步驟4(作為一實例,亦即,選擇基於調性之間隙填充且停用FD-LTP)時,諧波連續間隙取代可例如根據例如Marković等人之歐洲專利EP21185666 (
Integral Band-wise Parametric Coder,2021年)中所描述之「零填充」方法來應用,例如值得注意的例外情況為此方法排他性地用於相關HF間隙填充區中的頻譜時間正規化頻譜上。此區可例如為典型雜訊填充開始頻率(例如,2 kHz)與雜訊填充結束頻率(例如,10 kHz)之間的頻譜範圍,其中後者在超寬頻及/或全頻帶寫碼之情況下可例如等於傳統IGF開始頻率。應注意,作為一實例,在高於10 kHz下仍可應用用於音訊頻寬擴展(ABE)之習知IGF處理,亦即,可針對該IGF ABE區計算其他IGF相關白化/平坦化/能量資料。
HF能量值(或例如在差分熵寫碼之情況下之差量)可表示例如稍微低於可能已量化為零之雜訊填充結束頻率(例如在8 kHz至10 kHz頻率範圍內)之頻譜時間正規化頻譜係數的原始RMS能量。舉例而言,能量值可較佳地經量化,如AAC中之縮放因數,作為一實例,亦即在1.51 dB之步長中對數性地量化。除
精細頻譜包絡之外,基於調性之間隙填充可例如因此亦準確地重構
粗略HF雜訊頻譜包絡。應注意,例如,為了將例如傳達HF能量值至解碼器所需的傳信額外負荷降至最低,能量值可例如作為相對於核心寫碼器之
全域增益與雜訊位準乘積之差量來傳輸,作為一實例,亦即,作為「雜訊增益正規化」值)。較佳地,此可例如藉由例如根據下式傳輸例如HF能量值與全域增益與雜訊位準之乘積之間的比率之對數的經捨入縮放結果來實現:
例如,
ehf
sf = 1 + round ( Δ · log
2(
EHF
sf / (
GG
sf ·
L
sf ) ),
其中
ehf
sf 為經量化HF能量值(或差量),
EHF
sf 為上述HF原始RMS能量,
GG
sf 為全域增益,
L
sf 為例如之前的雜訊位準,且Δ為恆定純量(例如Δ=2)。為確保
ehf
sf 之恆定位元消耗,可能需要將其限制在其值範圍中(例如,對於2位元,0 ≤
ehf
sf < 4)。
4.4.2. 解碼器中基於調性之間隙填充( 任擇)
作為一實例,對於無FD-LTP之間隙填充被傳信(亦即,其中
p
sf 等於0)的所有子訊框
sf,以上「雜訊增益正規化」HF能量差量(作為一實例,亦即,比率
EHF
sf /(
GG
sf ·
L
sf ))可例如根據下式於解碼器中重構:
例如,
nrgFac
sf =
EHF
sf / (
GG
sf ·
L
sf ) = 2(
ehfsf- 1) / Δ,
其中
ehf
sf 及
L
sf 分別為所傳輸的經量化HF能量差量及經解碼雜訊位準,且
GG
sf 表示如用於編碼器中之增益正規化的經重構全域增益值。應注意,值Δ可如編碼器中般進行選擇,且可省略「-1」(及「1+」,在部分4.4.1中)。
由於乘積
GG
sf ·
L
sf 可能例如已經例如藉由目前先進技術的解碼器乘以經取代零量化頻譜係數,因此例如可例如簡單地藉由將針對該頻譜區(例如,稍微低於雜訊填充結束頻率(例如,在8 kHz至10 kHz頻率範圍中,例如如上所述)中的零量化寫碼係數而取代的所有所產生的間隙填充頻譜係數乘以
nrgFac
sf (例如在將諸如IMDCT之反(作為一實例,亦即,頻率至時間)變換應用於經重構的頻譜係數向量之前)來達成所要HF頻譜能量之本發明之恢復。以此方式,稍微低於雜訊填充結束頻率之間隙/雜訊填充頻譜值(例如,間隙及/或雜訊填充頻譜值)的原始RMS能量可例如被接近地重構。
作為一實例,解碼器側間隙填充操作之剩餘部分(例如,或即,基於調性之填充或習知雜訊填充的應用)可例如取決於先前所提及之
音訊調性資料的存在。作為一實例:
● 若
sf為音調(作為一實例,亦即,TD-LTP/HPF資料為非零),則應用
複製及/或
基於調性之間隙填充,例如,如Marković等人之歐洲專利EP21185666 (
Integral Band-wise Parametric Coder,2021年)中所描述。
● 否則(作為一實例,亦即,
sf並非音調,TD-LTP/HPF資料為零或不存在),應用傳統雜訊填充。
4.5. 較佳實施例:參數傳信
例如傳信逐子訊框
l 、t及FD-LTP滯後及增益或HF能量差量資料可能需要之旁側資訊可例如較佳具有固定位元長度。此可簡化在編碼器中之頻譜量化之前的位元分配。根據傳輸設計之實施例的以下實例(每子訊框消耗固定12位元)實務上良好地起作用:
傳信語法:-------------------------------------------------------------------------------------------------
若給定訊框具有多於一個子訊框(例如,2個子訊框),
則:
- 設定
B= 3
- 傳輸具有{子訊框之數目個}位元之其他控制資料(參見下文)
否則:
- 設定
B= 4
對於給定訊框中之每一子訊框0 ≤
sf< {子訊框之數目},
進行:
- 例如根據目前先進技術,例如以3個位元傳輸雜訊位準索引
l
sf - 例如根據本發明,例如以3個位元傳輸頻譜傾斜索引
t
sf - 根據本發明,以B個位元傳輸FD-LTP滯後索引
p
sf 若所傳輸之FD-LTP滯後為非零(亦即,使用FD-LTP),
則:
- 根據本發明,例如以1個位元傳輸FD-LTP增益
g
sf - 根據本發明,例如以1個位元傳輸FD-LTP正負號
s
sf 否則:
- 根據本發明,例如以2個位元傳輸HF能量值。
-------------------------------------------------------------------------------------------------
應注意,當訊框被劃分成2個子訊框時,例如,兩個TCX-10變換而非EVS或IVAS中之一個TCX-20變換,FD-LTP滯後值可例如歸因於減小之變換長度而使用每子訊框3個而非4個位元來傳輸,其可例如有效地對於受影響訊框節省兩個位元。然而,兩個位元可例如用於(且例如較佳地用於)其他位元分配控制資料,例如2位元索引,例如其界定可用於寫碼頻譜係數及間隙填充資料之位元預算如何分佈於兩個子訊框當中。在此情況下,本發明之傳信額外負荷與例如(若適用) 2位元子訊框位元分佈資訊之總和可保持處於每子訊框恆定12個位元,例如無關於子訊框之數目的選擇。此可簡化編碼器側位元分配及/或量化步驟。
舉例而言,概言之,吾人論述及/或澄清
l
sf 及頻譜時間平坦化資料(例如,根據本發明之實施例),其可自習知解決方案併入:
- 逐子訊框3位元雜訊位準索引
l
sf 可例如如在EVS或PCT/EP2018/080137中般進行傳信,作為一實例,亦即,最終雜訊位準
L
sf 可例如如下重構:L
sf= l
sf· 3/32,或作為一實例替代地,L
sf= (l
sf+ ½) · 3/32。
- 頻譜白化旗標可例如用於區分
中等與
強頻譜平坦化(例如,若TD-LTP或HPF資料不可用)及/或複製頻譜內容之
無頻譜平坦化與
中等頻譜平坦化(例如,若該資料可用)。對於此類頻譜白化內容及如何獲得該內容的描述,參見例如EVS或ISO/IEC 23008-3 (MPEG-H)音訊標準,具體言之,IGF解碼描述。
- 時間平坦化旗標可例如用以傳信複製頻譜內容之TNS樣濾波的啟動,例如,以便使其時間包絡變平。此外,對於此技術之描述,參見例如EVS或ISO/IEC 23008-3 (MPEG-H)音訊標準,具體言之,IGF解碼演算法。
描述於部分4.2中之態樣2例如尤其例如在用於產生「人工」頻譜間隙填充內容之不同方法之間引入每訊框及/或每子訊框之信號適應性選擇,其中該選擇例如藉助於頻域長期預測(FD-LTP)參數傳信至例如該音訊變換解碼器。具體言之,此FD-LTP參數較佳構成任擇地在用於該訊框或子訊框
sf之音訊位元串流中傳輸的變換域「滯後」參數
p
sf 。熟習此項技術者應顯而易見,作為「滯後」參數
p
sf 之替代方案,頻譜間隙填充方法之選擇可例如改為取決於不同FD-LTP參數,即或例如FD-LTP「增益」參數
g
sf 。
作為一實例,更精確而言,例如絕對增益值之參數化可經選擇,使得經量化增益值
g
sf = 0表示撤銷啟動之FD-LTP (例如,此係因為有效經解碼增益
G
sf 可能或將為零)。在彼情況下,FD-LTP滯後
p
sf 及/或正負號
s
sf 資料不需要被傳輸(實情為,可例如傳輸HF能量值),且是否應用具有FD-LTP後處理之雜訊填充(例如,而非無FD-LTP之傳統雜訊或間隙填充)之選擇可取決於例如增益,而非滯後參數。
例如如部分4.2.2中所描述之解碼器側步驟
1接著將或可例如寫為如下(注意
p
sf 與
g
sf 之交換):
1.
若經量化增益
g
sf > 0,則讀取經量化滯後
p
sf 及正負號s
sf且選擇類型:
雜訊填充+
FD-LTP;…。
類似地,在編碼器側,例如如部分4.2.1中所描述,吾人將或可能例如需要用交換例如所有
p
sf 與
g
sf ,且反之亦然。另一改變將或可例如為例如在編碼器及解碼器側兩者上調整用於傳信HF能量值的位元之數目,例如自所描述之2個位元調整至4或5個位元,例如以便匹配用於逐(例如,子)訊框FD-LTP滯後(3或4個位元)及/或正負號(1個位元)參數之傳信的位元之總和。
5. 參考文獻及進一步讀物 專利
- M. Dietz, G. Fuchs, C. R. Helmrich, and G. Markovic,
Low-Complexity Tonality-Adaptive Audio Signal Quantization, 美國專利PCT/EP2014/0516242014 (關於具有基於調性的死區之量化)。
- S. Disch, M. Gayer, C. R. Helmrich, G. Markovic, and M. Luis Valero,
Noise Filling Concept, 美國專利PCT/EP2014/0516302014 (關於連續零量化頻譜區之填充及其塑形)。
- E. Ravelli, C. R. Helmrich, G. Markovic, M. Neusinger, S. Disch, M. Jander, and M. Dietz,
Apparatus and Method for Processing an Audio Signal Using a Harmonic Post-Filter, 美國專利PCT/EP2015/066998。
- E. Ravelli, M. Schnell, C. Benndorf, M. Lutzky, M. Dietz, and S. Korse,
Apparatus and Method for Encoding and Decoding an Audio Signal Using Downsampling or Interpolation of Scale Parameters, 美國專利PCT/EP2018/0801372018 (關於IVAS SNS方法,亦即,雜訊塑形包絡之計算)。
- Niedermeier, C. Ertel, R. Geiger, F. Ghido, and C. R. Helmrich,
Apparatus and Method for Decoding or Encoding an Audio Signal Using Energy Information Values for a Reconstruction Band, 美國專利PCT/EP2014/0651102013 (關於EVS或MPEG-H音訊中之智慧型間隙填充,區間能量態樣)。
- S. Disch, R. Geiger, C. Helmrich, F. Nagel, C. Neukam, K. Schmidt, and M. Fischer,
Apparatus, Method and Computer Program for Decoding an Encoded Audio Signal, 美國專利PCT/EP2014/0651182013。
- S. Disch, F. Nagel, R. Geiger, B. N. Thoshkahna, K. Schmidt, S. Bayer, C. Neukam, B. Edler, and C. R. Helmrich,
Apparatus and Method for Encoding or Decoding an Audio Signal with Intelligent Gap Filling in the Spectral Domain, 美國專利PCT/EP2014/0651232013 (另一基本IGF應用)。
論文
- C. R. Helmrich, G. Markovic, and B. Edler,
Improved Low-Delay MDCT-Based Coding of Both Stationary and Transient Audio Signals, Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 第6954-6958頁, 2014年。線上: https://ieeexplore.ieee.org/document/6854948/
- C. R. Helmrich, A. Niedermeier, S. Disch, and F. Ghido,
Spectral Envelope Reconstruction via IGF for Audio Transform Coding, Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 第389-393頁, 2015年。線上: https://ieeexplore.ieee.org/document/7177997/
- G. Fuchs, C. R. Helmrich, G. Markovic, M. Neusinger, E. Ravelli, and T. Moriya,
Low Delay LPC and MDCT Based Audio Coding in the EVS Codec, Proc. IEEE Int. Conference on Acoustics, Speech, and Signal Processing (ICASSP), 第5723-5727頁, 2015年。線上: https://ieeexplore.ieee.org/document/7179068/
- C. R. Helmrich, A. Niedermeier, S. Bayer, and B. Edler,
Low-Complexity Semi-Parametric Joint-Stereo Audio Transform Coding, Proc. EURASIP 23
rdEUSIPCO, 第799-803, 2015頁. (立體聲填充及IGF立體聲)
- K. Schmidt and C. Neukam,
Low Complexity Tonality Control in the Intelligent Gap Filling Tool, Proc. IEEE ICASSP, 第644-648頁, 2016年。線上: https://ieeexplore.ieee.org/document/7471754/ (whitening)。
連結
- 簡單線性回歸方法:https://en.m.wikipedia.org/wiki/Simple_linear_regression
- 頻譜平坦度(量測):https://en.m.wikipedia.org/wiki/Spectral_flatness
附錄1 :FD-LTP 適應性濾波態樣至時間雜訊塑形濾波之應用
應注意,下文中所解釋之態樣可獨立地使用,且亦可任擇地與本文中所揭露之特徵、功能性及細節中之任一者組合使用。
在部分4.3.2中的附註1中提及,在部分4.3.2中由步驟4及5界定的所提出之強度適應性濾波操作亦可例如應用於時間雜訊塑形(TNS)合成濾波。舉例而言,例如在且僅在以下情況下,該兩個步驟才可使濾波器(作為一實例,亦即其強度)以逐樣本索引(i)方式有效地衰減
● 位於索引i處之所傳輸當前頻譜係數c(i)已經量化為零,且
● 位於索引i-P'
sf處之「先前」頻譜係數c(i - P'
sf)尚未量化為零,
其中較佳衰減為例如½ (參見例如步驟5),且例如表示與i之頻譜距離的例如FD-LTP滯後P'
sf> 0在本段中將縮寫為d
sf。舉例而言,此兩部分條件可如下一般化,例如以便使其適用於類似TNS之濾波器,例如,替代滯後及增益,特性化濾波階數及一或多個濾波器權重或濾波係數,例如,其中此等權重之數目取決於濾波階數(濾波係數之數目可例如等於濾波階數)。設定距離d
sf等於濾波階數,可例如在且僅在以下情況下才可例如藉由將每一濾波器權重乘以½ (例如,對於每一i)而使TNS或FD-LTP濾波器衰減
● 一或多個經傳信頻譜係數c(i - d
sf+ 1) ... c(i)已量化為零,且
● 位於索引i-d
sf處之「先前」頻譜係數c(i - d
sf)尚未量化為零。
換言之,當以上兩個條件皆成立時,頻譜係數c(i)可用TNS及/或FD-LTP濾波器(例如,其權重已衰減)來濾波。相反,當至少一個條件不成立時,係數c(i)可例如藉由未改變之TNS及/或FD-LTP濾波器濾波。此在圖24及圖25中繪示,其中為了清楚起見已省略(子)訊框下標
sf。應注意,FD-LTP濾波器可例如藉由設定d
sf= P'
sf及將在索引範圍1...d
sf-1中之所有濾波器權重指定為等於零而由類似TNS之濾波器表示。因此,用於強度適應性濾波之以上一般化條件可例如應用於TNS及FD-LTP兩者。
亦應注意,在例如如部分4.3.2中所提出之IIR濾波的情況下,輸入至濾波器強度決策之頻譜係數向量(例如,圖24中之「經量化頻譜」)與輸入至實際內嵌濾波操作之頻譜係數向量(例如,圖25中之「待濾波之頻譜」)可例如不同:前者可指定雜訊填充之前的頻譜(例如,用於在部分4.3.2中之步驟2中標記),而後者可指定雜訊填充之後的FD-LTP濾波頻譜。
附錄2 : 根據本發明之實施例的三個[ 例如部分] 非相依解碼器之提議
在下文中,將關於根據本發明之實施例的解碼器之其他提議來解釋本發明之其他實施例。應注意,根據下文中所解釋之態樣的實施例可獨立地使用,且亦可任擇地與本文中所揭露之特徵、功能性及細節中之任一者組合使用。換言之,此處例如根據態樣1至4所描述之實施例可任擇地藉由本文中所揭露之特徵、功能性及細節中之任一者補充。
1經縮放?
態樣1 ( 適應性傾斜校正 , 部分4.1)( 實施例1)
1. 音訊變換解碼器藉由雜訊樣本執行零量化頻譜樣本之取代,其中自位元串流讀取逐訊框或子訊框譜傾斜校正值
t
sf ,自
t
sf 導出頻率相依性依傾斜曲線,例如對數域中之線函數,且取代零量化樣本之雜訊樣本乘以
1傾斜曲線。
態樣2 ( 適應性間隙填充選擇 , 部分4.2)( 實施例2)
2. 音訊變換解碼器執行或經組配以執行藉由或使用經填充樣本取代零量化頻譜樣本,其中自位元串流讀取逐訊框或逐子訊框頻譜(例如LTP)距離值
p
sf ,若
p
sf 指示零,則選擇第一頻譜取代方法,例如雜訊填充或某一間隙填充,否則,選擇另一頻譜取代方法,即態樣3之雜訊填充+ FD-LTP。
態樣3 ( 具有FD-LTP 之雜訊填充 , 部分4.3) ( 實施例3)
3. 音訊變換解碼器經組配以執行或執行藉由雜訊樣本取代零量化頻譜樣本,其中取代零量化樣本之雜訊樣本
č(i)經(例如,LTP、TNS)濾波,使得濾波強度取決於位於自
i之頻譜距離
d
sf 處的經量化值
c(i - d
sf)
。
在FD-LTP之情況下,
d
sf =
P'
sf 。對於一般化,此處已選擇č (在雜訊填充之後)作為符號以與c (在雜訊填充之前)相區分,此係因為c(
i -d
sf )可例如始終為雜訊填充之前的值。
態樣4 ( 基於調性之間隙填充 , 部分4.4) ( 實施例4)
舉例而言,以下實施例可解決三種類型之頻譜取代的適應性逐(子)訊框選擇及其間之切換(其中此功能性可任擇地用於本文所揭露之實施例中之任一者中)。以下實施例可例如為在部分態樣2 (適應性間隙填充選擇,部分4.2)中解釋的實施例之發明性進一步開發或例如改善,但可任擇地與本文所揭露之任何其他實施例一起使用或獨立於其他實施例使用。
2.1.
根據實施例2,音訊變換解碼器例如經組配以執行或執行零量化樣本之取代,其中自位元串流讀取逐訊框或子訊框時間(例如音訊調性)音調資訊
j
sf ,若
p
sf 等於零,則選擇第一頻譜取代方法(例如雜訊填充)或第二頻譜取代方法(例如間隙填充),否則,選擇另一頻譜取代方法(例如,雜訊填充+ FD-LTP,態樣3),且第一頻譜取代方法與第二頻譜取代方法之間的選擇取決於音調資訊
j
sf 。
j
sf 在本文中未明確地提及,此係因為其在一些習知解決方案中(例如,在本文中提及的習知解決方案中之一些中)已知。大體而言,根據本發明之實施例係關於待用於產生頻譜值之方法的選擇及實施,解碼器藉由該等頻譜值在頻率-時間轉換之前取代「零量化頻譜樣本」,作為一實例,亦即,此等所產生頻譜值藉助於雜訊產生器產生(例如,雜訊填充=第一頻譜取代方法,任擇地,其中後續FD-LTP濾波=其他頻譜取代方法),或其藉助於「複製」轉換方法(間隙填充=第二頻譜取代方法)產生。
作為EVS及MPEG-H中所使用之IGF方法之擴展,「第二頻譜取代方法」(亦即例如諧波準確的「基於調性之間隙填充」)之細節對於根據本發明之實施例並非必需的。本發明之實施例任擇地在第一或第二頻譜取代方法之情況下解決經量化(及例如經取代)至零乘8 kHz至10 kHz的RF頻譜值之縮放(例如,藉助於「RF能量(差量)值」) (例如,因為僅接著傳輸RF能量(差量)值)。應注意,此概念(例如,經量化為零之RF頻譜值的縮放)可例如與根據態樣2之實施例組合使用,但可任擇地與本發明之其他實施例中之任一者組合使用或甚至獨立地使用。應注意,當選擇舊版雜訊填充(第一頻譜取代方法)時,使用此RF能量(差量)值亦可有效;因此,在8 kHz至10 kHz範圍內之此縮放可例如不結合至基於「複製」之填充方法。
此外,應注意,根據本發明之實施例的濾波可例如包含相同訊框或相同子訊框或相同頻帶或相同時間間隔之一或多個頻譜值或取樣值之處理及/或不同訊框或不同子訊框或不同頻帶或不同間隔之一或多個頻譜值或取樣值之處理。
根據一些實施例,濾波可例如包含線性濾波或非線性濾波,其中經濾波值係基於一或多個輸入值(例如至少一個樣本值或頻譜值)而獲得。舉例而言,濾波可基於多個輸入值(例如,樣本值或頻譜值)提供經濾波值。根據實施例之濾波可例如包含內插(或外推)頻譜值或內插樣本值之判定。舉例而言,可使用濾波以便獲得具有良好穩健性及/或確定性之頻譜值或樣本值。
此外,應注意,根據本發明之實施例之預測可例如包含相同訊框或相同子訊框或相同頻帶或相同時間間隔之一或多個頻譜值或取樣值之處理及/或不同訊框或不同子訊框或不同頻帶或不同間隔之一或多個頻譜值或取樣值之處理。
根據一些實施例,預測可例如包含基於一或多個「較早」值(例如,例如與先於待藉由預測獲得預測值之時間的一或多個時間相關聯的值,或例如與低於待藉由預測獲得之預測值的頻率之一或多個頻率相關聯的值)判定一或多個樣本值或頻譜值。根據實施例之預測可例如包含頻譜值或樣本值之外推(例如,時間外推或在頻率方向上之外推)。因此,預測可例如包含某一頻帶之頻率值的處理,以便在另一(較佳較高)頻帶中獲得頻率值,例如頻譜係數。該情形例如針對時域中之樣本值亦可如此應用。
此外,應注意,根據一些實施例,濾波及預測可例如可互換使用,或換言之,可例如在預測濾波器之上下文中甚至相同。因此,濾波可例如經執行以便預測一值。換言之,預測可例如使用濾波來執行,但例如,亦可任擇地使用並不使用濾波之其他預測演算法。又,舉例而言,一些濾波操作可執行預測,而例如,其他濾波操作可實際上在待獲得之值之前(例如,時間上之前)及之後(例如,時間上之後)使用值(或樣本)。因此,舉例而言,濾波與預測在一些情況下可被視為類似或相同概念,而例如,存在不執行預測的濾波操作,且反之亦然。
此外,應注意,根據本發明之實施例可例如用於EVS、智慧型間隙填充(IGF)、IVAS、MDCT寫碼、MPEG-H 3D音訊、雜訊填充之上下文中。實施例可例如經使用,或可例如為用於3GPP IVAS的基於MDCT之音訊寫碼之技術領域的部分。實施例可例如用於3GPP IVAS、IIS專屬低速率語音及音訊編解碼器。
在下文中,用不同詞語論述根據本發明之實施例:
根據本發明之實施例可例如係關於在感知上改善計算頻譜包絡(例如,如應用於現代音訊變換編解碼器中)之方式,及例如改善重構在編碼器中經量化為零的頻譜區之頻譜及/或時間精細結構之方式。換言之,實施例可例如係關於表示例如在習知音訊編解碼器中之頻譜量化期間所使用之時變及/或頻變遮蔽臨限值的頻譜包絡,其中舉例而言,每一頻譜可例如在量化之前例如除以相關聯遮蔽臨限值,且例如在量化之後乘以相關聯遮蔽臨限值,從而任擇地根據遮蔽臨限值得到量化失真之頻譜塑形。另外,實施例可例如係關於例如由粗略量化(例如,在相對低目標位元速率下)引起的頻譜間隙(例如,在編碼之後的零量化頻率係數)之頻譜取代或「填充」。
實施例可例如包含:
1. 在音訊變換編解碼器中傳輸逐訊框及/或逐子訊框頻譜傾斜校正t,任擇地應用例如頻譜間隙填充,而無需明確傳輸零量化頻帶中之目標能量。
2. 在頻譜域中,例如在解碼器側雜訊填充常式期間應用長期預測性濾波器。
上述實施例僅說明本發明之原理。應理解,對本文中所描述之配置及細節的修改及變化將對熟習此項技術者顯而易見。因此,其僅意欲由接下來之申請專利範圍之範疇限制,而非由藉由本文中實施例之描述及解釋所呈現的特定細節限制。
100,400,1300:音訊解碼器
102,402,504,604,804,1004,1102,1202,1302:經編碼音訊資訊
104,404,802,1002,1304,1404:經解碼音訊資訊
110,410:頻譜傾斜資訊導出單元
112,412,522,622:頻譜傾斜資訊
120,420:頻率可變縮放單元
122,222,814,912,1014,1314,1432:填充值
124,424:經縮放填充值
130,430,810,1010,1310,1420:頻譜孔填充單元
140,440,830,1030,1340,1410,1620:解碼單元
142,812,1012,1312,1422:經解碼頻譜值集合
210:線/原始頻譜包絡
220:虛線/遮蔽包絡
230:線/經重構包絡
240:雜訊填充開始頻率
250:雜訊填充結束頻率
310:經重構雜訊包絡
442:經解碼頻譜值
450:雜訊資訊導出單元
452,652:雜訊位準資訊
460:填充值獲得單元
470:縮放值獲得單元
472:縮放值
474:傾斜值
476:頻率資訊
500,600,1100,1200:編碼器
502,602,1204:輸入音訊資訊
510,610,1110,1220:編碼單元
512,612,1112,1222:經量化頻譜值
520,620:頻譜傾斜資訊判定單元
524,624:頻譜能量資訊
526,626:遮蔽包絡資訊
530,630,1150,1210:處理單元
640:差值判定器
642:差值
650:雜訊位準資訊獲得單元
710,720,730,740,750,760,770,1501,1502,1503,1710,1720,1730,1810,1820,1830,1910,1920,1930,2001,2002,2003,2004,2005,2101,2102,2103,2201,2202:步驟
800,1000,1400,1600:解碼器
820,1020:預測滯後資訊獲得單元
822:預測滯後資訊
840,1040:第一頻譜填充方法單元
850,1050:第二頻譜填充方法單元
860,1060:開關
910,1320,1430,1610:預測或濾波單元
914,1322,1614:另一頻譜值
916,1436:雜訊值資訊
920,1330,1440,1630:濾波強度調適單元
922,1332,1632:濾波強度資訊
924,1634:經編碼或經量化頻譜值
930,1450:權重調整單元
932,1452:權重資訊
940,1460:頻譜距離判定單元
1032:高頻(HF)能量資訊
1070:第三頻譜填充方法單元
1080:調性資訊獲得單元
1082:調性資訊
1112,1152,1434,1612:頻譜值
1120:滯後值獲得單元
1122:滯後值
1130:增益值獲得單元
1132:增益值
1140:滯後值修改單元
1142:經修改滯後值
1154:高頻(HF)能量值
1212:全域增益
1214:雜訊資訊
1224:高頻能量差量值
1334:經編碼或經量化頻譜值
1402,1602:經編碼音訊表示
1412:參數資訊
1454:調整資訊
1700,1800,1900,2000,2100,2200:方法
圖式未必按比例繪製,實際上重點一般放在說明本發明之原理上。在以下描述中,參考以下圖式描述本發明之各種實施例,在圖式中:
圖1展示根據根據本發明之第一態樣的實施例之用於基於經編碼音訊信號提供經解碼音訊信號的音訊解碼器之示意圖;
圖2展示根據習知概念之頻譜包絡的示意性實例;
圖3展示根據本發明之第一態樣之頻譜包絡(隨頻率而變之強度)的示意性實例;
圖4展示根據根據本發明之第一態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖;
圖5展示根據根據本發明之第一態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器的示意圖;
圖6展示根據根據本發明之第一態樣的實施例之具有額外任擇特徵之音訊編碼器之示意圖;
圖7展示根據根據本發明之第一態樣之實施例的編碼器之功能性的實例;
圖8展示根據根據本發明之第二態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊的音訊解碼器之示意圖;
圖9展示根據根據本發明之第二態樣的實施例之第一頻譜填充方法單元之示意圖。
圖10展示根據根據本發明之第二態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖;
圖11展示根據根據本發明之第二態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器的示意圖;
圖12展示根據根據本發明之第二態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之另一音訊編碼器的示意圖。
圖13展示根據根據本發明之第三態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊的音訊解碼器之示意圖;
圖14展示根據根據本發明之第三態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖;
圖15展示根據根據本發明之第三態樣之實施例的解碼器之功能性的實例;
圖16展示根據根據本發明之第三態樣的實施例之具有額外任擇特徵之音訊解碼器之示意圖;
圖17展示根據根據本發明之第一態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之方法的方塊圖;
圖18展示根據根據本發明之第一態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之方法的方塊圖;
圖19展示根據根據本發明之第二態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之方法的方塊圖;
圖20展示根據根據本發明之第二態樣的實施例之用於基於輸入音訊資訊提供經編碼音訊資訊之方法的方塊圖;
圖21展示根據根據本發明之第三態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之第一方法的方塊圖;
圖22展示根據根據本發明之第三態樣的實施例之用於基於經編碼音訊資訊提供經解碼音訊資訊之第二方法的方塊圖;
圖23展示根據本發明之實施例的經受反變換之偽隨機雜訊頻譜之FD-LTP濾波的時域效應之實例曲線圖;
圖24展示根據本發明之實施例的濾波強度減小之示意性實例;及
圖25展示根據本發明之實施例之適應性濾波的示意圖實例。
1300:音訊解碼器
1302:經編碼音訊資訊
1304:經解碼音訊資訊
1310:頻譜孔填充單元
1312:經解碼頻譜值集合
1314:填充值
1320:預測或濾波單元
1322:另一頻譜值
1330:濾波強度調適單元
1332:濾波強度資訊
1334:經編碼或經量化頻譜值
1340:解碼單元
Claims (29)
- 一種用於基於一經編碼音訊表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)提供一經解碼音訊表示(104、404、802、1002、1304、1404)之音訊解碼器(100、400、800、1000、1300、1400、1600); 其中該音訊解碼器經組配以使用各別填充值(122、124、222、424、814、922、1014、1314、1432)填充一經解碼頻譜值集合(142、442、812、1012、1312、1422)之頻譜孔; 其中該音訊解碼器經組配以使用一預測或濾波判定一填充值,使得與一給定頻率相關聯之一給定填充值係取決於與一不同頻率相關聯之另一頻譜值(914、924、1322、1334、1434、1614)而獲得, 其中該音訊解碼器經組配以取決於與該不同頻率相關聯之一經編碼或經量化頻譜值(914、924、1322、1334、1434、1614)而調適一濾波強度。
- 如請求項1之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該濾波強度判定該另一頻譜值(914、924、1322、1334、1434、1614)對該給定填充值(122、124、222、424、814、922、1014、1314、1432)之一影響。
- 如請求項1至2中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以取決於與該不同頻率相關聯之該頻譜值而調適該濾波強度,該頻譜值係由該經編碼音訊資訊(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中之個別頻譜值之該經編碼表示判定。
- 如請求項1至3中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以在應用一雜訊填充之前取決於與該不同頻率相關聯之該頻譜值來調適該濾波強度。
- 如請求項1至4中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以取決於與該不同頻率相關聯之該頻譜值是否經量化成零而調適該濾波強度。
- 如請求項1至4中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以取決於一雜訊填充是否應用於與該不同頻率相關聯之該頻譜值而調適該濾波強度。
- 如請求項1至6中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以對於應用一雜訊填充所針對的頻譜值選擇性地應用在一頻率方向上之一濾波或在一頻率方向上之一預測。
- 如請求項1至7中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以應用該預測或該濾波,以便基於一隨機或偽隨機雜訊值(916、1432)判定該給定填充值(122、124、222、424、814、922、1014、1314、1432)。
- 如請求項1至8中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以執行 與該給定頻率相關聯之一雜訊值及與該另一頻率相關聯之一雜訊值的一加權組合 或 與該給定頻率相關聯的一雜訊值及與該另一頻率相關聯的一填充值的一加權組合, 以便獲得該給定填充值;且 其中該音訊解碼器經組配以取決於一雜訊填充是否已應用於與該另一頻率相關聯之一頻譜值而調整給定至與該另一頻率相關聯之該雜訊值的一權重(1452)或給定至與該另一頻率相關聯之該填充值的該權重。
- 如請求項1至9中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以基於包括於該音訊資訊之該經編碼表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中的描繪一頻譜距離之一經編碼資訊而判定與該給定頻率相關聯之該填充值(122、124、222、424、814、922、1014、1314、1432)及與該不同頻率相關聯的該另一頻譜值(914、924、1322、1334、1434、1614)之間的該頻譜距離。
- 如請求項1至10中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以基於包括於該音訊資訊之該經編碼表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中的一增益資訊(1132、1212)判定應用於與該給定頻率相關聯之該雜訊值(916)的一權重(1452)。
- 如請求項1至11中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以取決於包括於該音訊資訊之該經編碼表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中之一增益資訊(1132、1212)而判定應用於與該另一頻率相關聯之該雜訊值或應用於與該另一頻率相關聯之該填充值(1322、1334、1434、1614)的一權重(1452)。
- 如請求項1至12中任一項之音訊解碼器 (100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以取決於包括於該音訊資訊之該經編碼表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中之一正負號資訊而判定應用於與該另一頻率相關聯之該雜訊值或應用於與該另一頻率相關聯之該填充值(1322、1334、1434、1614)的該權重(1452)。
- 如請求項1至13中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以根據以下各式判定該給定填充值č(i) (122、124、222、424、814、922、1014、1314、1432) 若該係數c(i-P' sf)係使用一雜訊填充獲得,則根據č(i)=d*c(i) + G' sf*c(i-P' sf);且 若該係數c(i-P' sf)並非係使用一雜訊填充獲得,則根據č(i)=d*c(i) + ½*G' sf*c(i-P' sf); 其中c(i)表示使用一雜訊填充獲得且具有一頻譜索引i的一頻譜係數; 其中d表示一衰減係數, 其中G' sf表示一權重(1452),該權重係基於包括於該經編碼音訊表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中之一增益值(1132、1212);且 其中c(i-P' sf)表示具有一頻譜索引i-P' sf之一頻譜係數, 其中P' sf為基於包括於該經編碼音訊表示中之一預測參數資訊(1412)的一預測參數或一濾波參數。
- 如請求項1至14中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以根據P' sf=p sf+B獲得該預測參數或濾波參數P' sf,其中p sf為包括於該經編碼音訊表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中之一滯後索引,且其中B為一常數;及/或 其中該音訊解碼器經組配以根據G' sf=(-1) Ssf* (3+2*g sf)/8獲得該權重G' sf(1452),其中S sf為包括於該經編碼表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)中之一個二進位值,且其中g sf為包括於該經編碼表示中之一個二進位值;及/或 其中音訊解碼器經組配以根據d=(7.5-g sf)/8獲得該衰減係數d,其中g sf為包括於該經編碼表示中之二進位值。
- 如請求項1至15中任一項之音訊解碼器 (100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以標記雜訊填充零量化頻譜係數,且 其中該音訊解碼器經組配以選擇性地使用應用於未標記之頻譜係數的一減小之濾波強度。
- 如請求項1至16中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以針對多個子訊框(sf)執行以下處理: 1. 設定P' sf=p sf+B,G' sf=(-1) Ssf* (3+2*g sf)/8,且d=(7.5-g sf)/8; 2. 執行雜訊填充,且標記雜訊填充零量化頻譜係數 3. 對於位置i>=P' sf處之多個雜訊填充零量化頻譜係數c,進行: 4. 若在步驟2中標記位置i-P' sf處之該係數c,則用d*c(i) + G' sf*c(i-P' sf)替代c(i);否則 5. 用d * c(i) + 1/2*G' sf*c(i-P' sf)替代c(i)。
- 一種用於基於一經編碼音訊表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)提供一經解碼音訊表示(104、404、802、1002、1304、1404)之音訊解碼器(100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以使用一預測或濾波判定一經處理頻譜值,使得與一給定頻率相關聯之一給定經處理頻譜值係取決於與一不同頻率相關聯之另一頻譜值(914、924、1322、1334、1434、1614)而獲得, 其中該音訊解碼器經組配以取決於與該不同頻率相關聯之一經編碼或經量化頻譜值(914、924、1322、1334、1434、1614)而調適一濾波強度。
- 如請求項18之音訊解碼器(100、400、800、1000、1300、1400、1600),其中該音訊解碼器經組配以調適該濾波強度以減小包括於該預測或濾波中的一非零量化頻譜係數之一貢獻。
- 如請求項18至19中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以在一當前頻譜係數為零且一先前頻譜係數尚未經編碼為零或尚未經量化為零時選擇性地調適該濾波強度。
- 如請求項18至20中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以將該濾波強度選擇性地減小至介於0.25與0.75之間的一值,以便調適該濾波強度。
- 如請求項18至21中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以在該當前頻譜係數經編碼或經量化為零之情況下取決於多個先前頻譜係數之值選擇性地減小一濾波之該濾波強度,該濾波考慮多個先前頻譜係數。
- 如請求項22之音訊解碼器 (100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以在該當前頻譜係數經編碼或經量化或傳信為零的情況下及在該濾波中考慮之除了在該濾波中考慮的一個先前頻譜係數之外的所有先前頻譜係數經編碼或經量化或傳信為零的情況下,選擇性地減小該濾波強度。
- 如請求項22或23之音訊解碼器(100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以取決於具有頻譜索引i-d sf至i-1之多個先前頻譜係數使用該濾波或預測獲得具有頻譜索引i之一經濾波當前頻譜係數, 其中該音訊解碼器經組配以在具有頻譜索引i-d sf+1至i之一或多個頻譜係數已經量化或編碼或傳信為零的情況下,且在具有頻譜索引i-d sf之一頻譜係數尚未量化或編碼或傳信為零的情況下,選擇性地減小該濾波強度。
- 如請求項24之音訊解碼器 (100、400、800、1000、1300、1400、1600), 其中與具有i-d sf+1與i-1之間的頻譜索引之頻譜係數相關聯的濾波器係數等於零。
- 如請求項18至25中任一項之音訊解碼器(100、400、800、1000、1300、1400、1600), 其中該音訊解碼器經組配以使用經編碼或經量化或經傳信頻譜係數以用於決定該濾波強度,且 其中該音訊解碼器經組配以使用經預處理之頻譜係數作為用於該濾波或預測之一輸入。
- 一種用於基於一經編碼音訊表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)提供一經解碼音訊表示(104、404、802、1002、1304、1404)之方法(2100),該方法包含: 使用各別填充值(122、124、222、424、814、922、1014、1314、1432)填充(2101)一經解碼頻譜值集合(142、442、812、1012、1312、1422)之頻譜孔; 使用一預測或濾波判定(2102)一填充值,使得與一給定頻率相關聯之一給定填充值係取決於與一不同頻率相關聯之另一頻譜值(914、924、1322、1334、1434、1614)而獲得, 取決於與該不同頻率相關聯之一經編碼或經量化頻譜值 (914、924、1322、1334、1434、1614)而調適(2103)一濾波強度。
- 一種用於基於一經編碼音訊表示(102、402、504、604、804、1004、1102、1202、1302、1402、1602)提供一經解碼音訊表示(104、404、802、1002、1304、1404)之方法(2200),該方法包含: 使用一預測或濾波判定(2201)一經處理頻譜值,使得與一給定頻率相關聯之一給定經處理頻譜值係取決於與一不同頻率相關聯之另一頻譜值(914、924、1322、1334、1434、1614)而獲得, 取決於與該不同頻率相關聯之一經編碼或經量化頻譜值(914、924、1322、1334、1434、1614)而調適(2202)一濾波強度。
- 一種電腦程式,其用於在該電腦程式在一電腦上運行時執行如請求項27至28中任一項之方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21217661 | 2021-12-23 | ||
EP21217661.4 | 2021-12-23 | ||
PCT/EP2022/052151 WO2023117146A1 (en) | 2021-12-23 | 2022-01-28 | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering |
WOPCT/EP2022/052151 | 2022-01-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202333143A true TW202333143A (zh) | 2023-08-16 |
Family
ID=84887775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111149823A TW202333143A (zh) | 2021-12-23 | 2022-12-23 | 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備 |
Country Status (2)
Country | Link |
---|---|
TW (1) | TW202333143A (zh) |
WO (1) | WO2023118605A1 (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
-
2022
- 2022-12-23 TW TW111149823A patent/TW202333143A/zh unknown
- 2022-12-23 WO PCT/EP2022/087818 patent/WO2023118605A1/en active Search and Examination
Also Published As
Publication number | Publication date |
---|---|
WO2023118605A1 (en) | 2023-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2660605C2 (ru) | Концепция заполнения шумом | |
CN105654958B (zh) | 用于高频带宽扩展的对信号进行编码和解码的设备和方法 | |
CA2985115C (en) | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension | |
US11854561B2 (en) | Low-frequency emphasis for LPC-based coding in frequency domain | |
JP7203179B2 (ja) | 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム | |
AU2014211529A1 (en) | Apparatus and method for generating a frequency enhancement signal using an energy limitation operation | |
CN107710324B (zh) | 音频编码器和用于对音频信号进行编码的方法 | |
CN111587456A (zh) | 时域噪声整形 | |
TW202333143A (zh) | 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備 | |
TW202345142A (zh) | 在音訊寫碼中使用傾斜用於頻譜時間改善頻譜間隙填充之方法及設備 | |
TW202334940A (zh) | 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備 | |
WO2023117145A1 (en) | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods | |
WO2023117146A1 (en) | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering | |
WO2023117144A1 (en) | Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a tilt | |
WO2022147615A1 (en) | Method and device for unified time-domain / frequency domain coding of a sound signal |