TW201637002A - 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、及用以解碼經編碼音訊信號之方法 - Google Patents
音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、及用以解碼經編碼音訊信號之方法 Download PDFInfo
- Publication number
- TW201637002A TW201637002A TW105107024A TW105107024A TW201637002A TW 201637002 A TW201637002 A TW 201637002A TW 105107024 A TW105107024 A TW 105107024A TW 105107024 A TW105107024 A TW 105107024A TW 201637002 A TW201637002 A TW 201637002A
- Authority
- TW
- Taiwan
- Prior art keywords
- spectral coefficients
- encoded
- encoder
- decoder
- spectral
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 149
- 238000000034 method Methods 0.000 title claims description 58
- 230000003595 spectral effect Effects 0.000 claims abstract description 520
- 238000001228 spectrum Methods 0.000 claims description 20
- 238000003491 array Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 8
- 230000006978 adaptation Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/635—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一種用以編碼音訊信號之編碼器。該編碼器係組配來在一轉換域或濾波器庫域中編碼該音訊信號,其中該編碼器係組配來針對一當前訊框及至少一先前訊框決定該音訊信號之頻譜係數,其中該編碼器係組配來選擇性地將預測編碼應用於由至少一頻譜係數分隔開之多個個別頻譜係數或頻譜係數組。
Description
本發明係有關於一種音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、及用以解碼經編碼音訊信號之方法
實施例係與音訊編碼有關,特別是,關於使用預測編碼來編碼音訊信號的方法與裝置及使用預測解碼來解碼經編碼音訊信號的方法與裝置。較佳實施例係與針對音高適應性頻譜預測之方法與裝置有關。更佳的實施例係與藉由使用頻域訊框間預測工具的轉換編碼之音調音訊信號的感知編碼有關。
為改進特別是在低位元率之經編碼音調信號的品質,現代音訊轉換編碼器採用非常長的變換及/或長期預測或預/後濾波。一個長的轉換,然而,意謂著一個長的演算延遲,其對低延遲通訊情景來說是不被期望的。因此,基於瞬時基礎音高之具有非常低延遲的預測器近來受到歡迎。IETF(網際網路工程任務組)Opus編解碼器在其頻
域CELT(受限能量重疊轉換)編碼路徑中利用音高適應性預及後濾波[J.M.Valin,K.Vos,and T.Terriberry,“Definition of the Opus audio codec,”2012,IETF RFC 6716.http://tools.ietf.org/html/rfc67161.],以及3GPP(第三代合作夥伴計劃)EVS(增強語音服務)編解碼器針對轉換解碼信號之感知改進提供一長期諧波後濾波器[3GPP TS 26.443,“Codec for Enhanced Voice Services(EVS),”Release 12,Dec.2014.]。這兩種方法途徑在時域中對完全解碼信號波形操作,使得要頻率選擇地應用它們是困難及/或運算上昂貴的(兩種方案僅針對一些頻率選擇性提供簡單低通率波器)。因而像是在MPEG-2 AAC中受支援[ISO/IEC 13818-7,“Information technology-Part 7:Advanced Audio Coding(AAC),”2006.]之頻域預測(FDP)提供一受歡迎之對時域長期預測(LTP)或預/後濾波(PPF)的替代方案。雖然促進頻率選擇性,此方法有其本身缺點,如下文所述。
介紹於上之FDP方法對其他工具有兩個缺點。第一,該FDP方法要求高運算複雜度。詳細地說,在所有比例因子帶中之預測的最壞情況下對於每個訊框及通道會應用至少二階(亦即來自至少兩個訊框之通道轉換倉)之線性預測編碼於數百個頻譜倉上[ISO/IEC 13818-7,“Information technology-Part 7:Advanced Audio Coding(AAC),”2006.]。第二,該FDP方法包含一受限總體預測增益。更精確地說,預測的效率係受限制因為可預測諧波、音調頻譜部份之間的雜訊成份亦受到預測,引入誤差因為
這些雜訊部份通常是不可預測的。
此高複雜度肇因於預測器的向後適應性。此代表針對每個倉的預測係數必須基於先前傳送倉而計算。因此,編碼器與解碼器間之數值的不準確可導致由於分歧預測係數之重建錯誤。為克服此問題,位元完全相同適應必須被保證。此外,即使數組預測器在某些訊框中被停用,為了保持預測係數為最新,適應永遠必須執行。
因此,本發明之目的在於提供一用於編碼音訊信號及/或解碼經編碼音訊信號之概念,其避免至少一(例如,兩者)前述問題並導致更有效與運算上低廉的實作形式。
此目的係藉申請專利範圍獨立項解決。
有利的實作形式係藉申請專利範圍依附項解決。
實施例提供一種用以編碼音訊信號之編碼器。該編碼器係組配來在一轉換域或濾波器庫域中編碼該音訊信號,其中該編碼器係組配來針對一當前訊框及至少一先前訊框決定該音訊信號之頻譜係數,其中該編碼器係組配來選擇性地將預測編碼應用於多個個別頻譜係數或數組頻譜係數,其中該編碼器係組配來決定一間距值,其中該編碼器係組配來基於可當作旁側資訊連同經編碼音訊信號被傳送的該間距值選擇應用預測編碼的該等多個個別頻譜係數或數組頻譜係數。
進一步之實施例提供一種用以解碼經編碼音訊信號(例如,以上述之編碼器編碼之)的解碼器。該解碼器係組配來在一轉換域或濾波器庫域中解碼該經編碼音訊信號,其中該解碼器係組配來解析該經編碼音訊信號以針對一當前訊框及至少一先前訊框獲得該音訊信號之經編碼頻譜係數,及其中該解碼器係組配來選擇性地將預測解碼應用於多個個別經編碼頻譜係數或數組經編碼頻譜係數,其中該解碼器可組配來基於一經傳送間距值選擇應用預測解碼的該等多個個別經編碼頻譜係數或數組經編碼頻譜係數。
根據本發明之概念,預測編碼係(僅)應用於選擇之頻譜係數。預測編碼應用於的該等頻譜係數可依賴於信號特性而選擇。舉例而言,藉由不將預測編碼應用於雜訊信號成份,避免了前述由預測非可預測的雜訊信號成份所引入之誤差。同時運算複雜度可因為僅將預測編碼應用於選擇之頻譜成份而減少。
舉例而言,音調音訊信號之感知編碼可藉由具導引/適應性頻譜域訊框間預測方法之轉換編碼被執行(例如,藉編碼器)。頻域預測(FDP)之效率可增加且運算複雜度可減少,藉由將預測僅應用於頻譜係數,例如,位於一基礎頻率或音高整數倍之諧波信號成份周圍的頻譜係數,其可在一適合的位元串流中從一編碼器被發信至一解碼器,(例如,作為一間距值)。本發明之實施例可較佳地實作或整合進MPEG-H 3D音訊編解碼器,但也可應用於諸
如,例如MPEG-2 AAC之任何音訊轉換編碼系統。
進一步之實施例提供一種用以在一轉換域或濾波器庫域中編碼音訊信號之方法,該方法包含:- 針對一當前訊框及至少一先前訊框決定該音訊信號之頻譜係數;- 決定一間距值;以及- 選擇性地將預測編碼應用於多個個別頻譜係數或數組頻譜係數,其中應用預測編碼的該等多個個別頻譜係數或數組頻譜係數係基於該間距值而選擇。
進一步之實施例提供一種用以在一轉換域或濾波器庫域中解碼經編碼音訊信號之方法,該方法包含:- 解析該經編碼音訊信號以針對一當前訊框及至少一先前訊框獲得該音訊信號之經編碼頻譜係數;- 獲得一間距值;以及- 選擇性地將預測解碼應用於多個個別經編碼頻譜係數或數組經編碼頻譜係數,其中應用預測解碼的該等多個個別經編碼頻譜係數或數組經編碼頻譜係數係基於該間距值而選擇。
100‧‧‧編碼器
102‧‧‧音訊信號
104,204‧‧‧轉換域或濾波器庫域
106_t0_f1~106_t0_f6,106_t-1_f1~106_t-1_f6,106_t-2_f1~106_t-2_f6‧‧‧頻譜係數
108_t0,208_t0‧‧‧當前訊框
108_t-1,108_t-2,208_t-1,208_t-2‧‧‧先前訊框
110_t0_f2,110_t0_f4,110_t0_f5,210_t0_f2,210_t0_f4,210_t0_f5‧‧‧經預測頻譜係數
112_f2,112_f4,112_f5,114_f2,114_f4,114_f5,212_f2,212_f4,212_f5,214_f2,214_f4,214_f5‧‧‧預測係數
116_1~116_6,118_1~118_5‧‧‧頻譜係數組
120‧‧‧經編碼音訊信號
122_1~122_6‧‧‧箭號
124_1~124_6‧‧‧諧波信號成分
200‧‧‧解碼器
206_t0_f1~206_t0_f6,206_t-1_f1~206_t-1_f6,206_t-2_f1~206_t-2_f6‧‧‧經編碼頻譜係數
220‧‧‧解碼音訊信號
300,400‧‧‧方法
302,304,402,404‧‧‧步驟
本發明之實施例係參照隨附之圖式敘述於此,其中:根據實施例,圖1顯示用以編碼一音訊信號之一編碼器的概略區塊圖;根據實施例,圖2在一圖中顯示針對一當前訊框於頻
率上繪製之音訊信號的一振幅及對應之應用預測編碼的選擇頻譜係數;根據實施例,圖3在一圖中顯示針對一當前訊框於頻率上繪製之音訊信號的一振幅及對應之受到根據MPEG-2 AAC預測的頻譜係數;根據實施例,圖4顯示用以解碼一經編碼音訊信號之一解碼器的概略區塊圖;根據實施例,圖5顯示用以編碼一音訊信號之方法的流程圖;根據實施例,圖6顯示用以解碼一經編碼音訊信號之方法的流程圖。
相等或等效的元件或是具有相等或等效功能之元件係藉相等或等效的參考標號表示於以下的敘述中。
在以下的敘述中,闡述多個細節以提供本發明之實施例更詳盡的解釋。然而,對本領域熟習技術者而言本發明之實施例可被實行而不需這些特定的細節是顯而易見的。在其他實例中,為了避免隱晦本發明之實施例眾所皆知的結構及設備係以區塊圖形式表示而非細節。再者,敘述於其後之不同實施例的特徵可互相組合除非另外有特別註明。
根據實施例,圖1顯示用以編碼音訊信號102之編碼器100的一概略區塊圖。編碼器100係組配以在一轉換域或濾波器庫域104中(例如,頻域或頻譜域)編碼該音訊信
號102,其中編碼器100係組配來針對當前訊框108_t0決定音訊信號102之頻譜係數106_t0_f1至106_t0_f6以及針對至少一先前訊框108_t-1決定音訊信號之頻譜係數106_t-1_f1至106_t-1_f6。進一步,編碼器100係組配來選擇性地將預測編碼應用於多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5,其中編碼器100係組配來決定一間距值,其中編碼器100係組配來基於該間距值選擇應用預測編碼的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5。
換句話說,編碼器100係組配來選擇性地將預測編碼應用於基於做為旁側資訊被傳送的一間距值所選擇的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5。
該間距值可對應至一頻率(例如,(音訊信號102之)一諧波音調之基頻),該頻率與其整數倍一起定義了應用預測所針對的所有頻譜係數組的中心:第一組可圍繞此頻率為中心、第二組可可圍繞此頻率之兩倍為中心、第三組可可圍繞此頻率之三倍為中心,以此類推。這些中心頻率的知識使得預測係數之計算能夠用來預測對應之正弦信號成份(例如,諧波信號之基音與泛音)。因此,不再需要複雜且易出錯的向後預測係數適應。
在實施例中,編碼器100可組配以決定每訊框一個間距值。
在實施例中,多個個別頻譜係數106_t0_f2或數
組頻譜係數106_t0_f4及106_t0_f5可藉至少一頻譜係數106_t0_f3被分隔。
在實施例中,編碼器100可組配來將預測編碼應用於藉至少一頻譜係數而分隔之多個個別頻譜係數,如應用於藉至少一頻譜係數而分隔之兩個個別頻譜係數。進一步,編碼器100可組配來將預測編碼應用於藉至少一頻譜係數而分隔之多組頻譜係數(各組包含至少兩個頻譜係數),如應用於藉至少一頻譜係數而分隔之兩組頻譜係數。進一步,編碼器100可組配來將預測編碼應用於藉至少一頻譜係數而分隔之多個個別頻譜係數及/或數組頻譜係數,如應用於藉至少一頻譜係數而分隔之至少一個別頻譜係數及/或至少一組頻譜係數。
在圖1顯示的示例中,編碼器100係組配來針對當前訊框108_t0決定六個頻譜係數106_t0_f1至106_t0_f6以及針對先前訊框108_t-1決定六個頻譜係數106_t-1_f1至106_t-1_f6。藉此,編碼器100係組配來選擇性地將預測編碼應用於該當前訊框之個別第二頻譜係數106_t0_f2以及應用於由當前訊框108_t0之第四及第五頻譜係數106_t0_f4與106_t0_f5組成的頻譜係數組。如所見,個別第二頻譜係數106_t0_f2及由第四及第五頻譜係數106_t0_f4與106_t0_f5組成的頻譜係數組係藉第三頻譜係數106_t0_f3彼此分隔開。
注意此處使用之用語「選擇性」是指將預測編碼(僅)應用於選擇之頻譜係數。換句話說,預測編碼不必要
應用至所有頻譜係數,而是僅應用於選擇之個別頻譜係數或數組頻譜係數,該等選擇之個別頻譜係數及/或數組頻譜係數可藉至少一頻譜係數互相分隔開。換句話說,預測編碼可針對該等選擇之多個個別頻譜係數或數組頻譜係數被分隔開所憑藉的至少一頻譜係數被停用。
在實施例中,編碼器100可組配來選擇性基於至少一對應之先前訊框108_t-1的多個個別頻譜係數106_t-1_f2或數組頻譜係數106_t-1_f4及106_t-1_f5將預測編碼應用於當前訊框108_t0的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5。
舉例而言,編碼器100可組配來藉由編碼當前訊框108_t0的多個經預測個別頻譜係數110_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5與當前訊框(或其量化版本)的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5之間的預測誤差,預測編碼當前訊框108_t0的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5。
在圖1中,編碼器100藉由編碼當前訊框108_t0的經預測個別頻譜係數110_t0_f2與當前訊框108_t0的個別頻譜係數106_t0_f2之間以及當前訊框的數組經預測頻譜係數110_t0_f4及110_t0_f5與當前訊框的數組頻譜係數106_t0_f4及106_t0_f5之間的預測誤差,編碼個別頻譜係數106_t0_f2及由頻譜係數106_t0_f4與106_t0_f5組成的頻譜係數組。
換句話說,第二頻譜係數106_t0_f2係藉編碼經預測第二頻譜係數110_t0_f2與(實際或決定之)第二頻譜係數106_t0_f2之間的預測誤差(或差異)而編碼,其中第四頻譜係數106_t0_f4係藉編碼經預測第四頻譜係數110_t0_f4與(實際或決定之)第四頻譜係數106_t0_f4之間的預測誤差(或差異)而編碼,且其中第五頻譜係數106_t0_f5係藉編碼經預測第五頻譜係數110_t0_f5與(實際或決定之)第五頻譜係數106_t0_f5之間的預測誤差(或差異)而編碼。
在一實施例中,編碼器100可組配來藉助於對應的先前訊框108_t-1之多個個別頻譜係數106_t-1_f2或數組頻譜係數106_t-1_f4及106_t-1_f5的實際版本針對當前訊框108_t0決定多個經預測個別頻譜係數110_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5。
換句話說,在上述之決定程序中,編碼器100可直接地使用先前訊框108_t-1之多個實際個別頻譜係數106_t-1_f2或數組實際頻譜係數106_t-1_f4及106_t-1_f5,其中106_t-1_f2、106_t-1_f4及106_t-1_f5分別代表原始、尚未被量化的頻譜係數或數組頻譜係數,因為他們係藉編碼器100而獲得使得該編碼器可在轉換域或濾波器庫域104中操作。
舉例來說,編碼器100可組配來基於先前訊框108_t-1之第二頻譜係數106_t-1_f2之相對應尚未被量化的版本決定當前訊框108_t0之第二經預測頻譜係數110_t0_f2、基於先前訊框108_t-1之第四頻譜係數
106_t-1_f4之相對應尚未被量化的版本決定當前訊框108_t0之經預測第四頻譜係數110_t0_f4,以及基於先前訊框之第五頻譜係數106_t-1_f5之相對應尚未被量化的版本決定當前訊框108_t0之經預測第五頻譜係數110_t0_f5。
通過此方法途徑,預測編碼及解碼方案可展示一種量化雜訊的諧波整形,因為一相對應的解碼器,其一種實施例係相關於圖4敘述於後,僅能運用,在上述決定步驟中,傳輸之先前訊框108_t-1的多個個別頻譜係數106_t-1_f2之或多組頻譜係數106_t-1_f4及106_t-1_f5之量化版本,來用於一預測解碼。
雖然此種諧波雜訊整形,因為其係例如傳統上在時域中藉長期預測(LTP)所執行,可主觀地對預測編碼有利,而在某些實例中其可能是不被期望的因為會導致不需要、過量的音調被引入一解碼音訊信號內。為此原因,一個與對應之解碼完全同步、並因此僅利用任何可能之預測增益但卻不會導致量化雜訊整形的替代預測編碼方案,會於隨後敘述。根據此替代編碼實施例,編碼器100可組配來使用先前訊框108_t-1之多個個別頻譜係數106_t-1_f2或數組頻譜係數106_t-1_f4及106_t-1_f5的對應之量化版本針對當前訊框108_t0決定多個經預測個別頻譜係數110_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5。
舉例而言,編碼器100可組配來基於先前訊框108_t-1之第二頻譜係數106_t-1_f2的對應之量化版本決定當前訊框108_t0的第二經預測頻譜係數110_t0_f2、基於先
前訊框108_t-1之第四頻譜係數106_t-1_f4的對應之量化版本決定當前訊框108_t0的經預測第四頻譜係數110_t0_f4,及基於先前訊框108_t-1之第五頻譜係數106_t-1_f5的對應之量化版本決定當前訊框108_t0的經預測第五頻譜係數110_t0_f5。
進一步,編碼器100可組配來自該間距值導出預測係數112_f2、114_f2、112_f4、114_f4、112_f5及114_f5,並使用至少兩個先前訊框108_t-1及108_t-2之多個個別頻譜係數106_t-1_f2及106_t-2_f2或數組頻譜係數106_t-1_f4、106_t-2_f4、106_t-1_f5及106_t-2_f5之對應的量化版本及使用該導出之預測係數112_f2、114_f2、112_f4、114_f4、112_f5及114_f5針對當前訊框108_t0計算多個經預測個別頻譜係數110_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5。
舉例而言,編碼器100可組配來:自該間距值為第二頻譜係數106_t0_f2導出預測係數112_f2及114_f2、自該間距值為第四頻譜係數106_t0_f4導出預測係數112_f4及114_f4,以及自該間距值為第五頻譜係數106_t0_f5導出預測係數112_f5及114_f5。
舉例而言,預測係數的推導可以下述方式導出:若間距值對應至頻率f0或其一編碼版本,則啟用預測所針對之第K組頻譜係數的中心頻率為fc=K*f0。若取樣頻率為fs且轉換躍程大小(在連續訊框間轉移)為N,則假設具有頻率fc之一正弦信號在第K組中的理想預測器係數為:
p1=2*cos(N*2*pi*fc/fs)且p2=-1。
若,例如,頻譜係數106_t0_f4及106_t0_f5兩者皆在此組內,則預測係數為:112_f4=112_f5=2*cos(N*2*pi*fc/fs)且112_f4=112_f5=-1
由於穩定性原因,減震因數d可引入導致修改預測係數:112_f4’=112_f5’=d*2*cos(N*2*pi*fc/fs),114_f4’=114_f5’=d2。
由於間距值係在經編碼音訊信號120中傳輸,解碼器可導出完全相同的預測係數112_f4=112_f5=2*cos(N*2*pi*fc/fs)且112_f4=112_f5=-1。若使用減震因數d,則係數可相應地被修改。
如同圖1中所表示,編碼器100可組配來提供經編碼音訊信號120。藉此,編碼器100可組配來將針對應用預測編碼的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5之預測誤差的量化版本包括於經編碼音訊信號120中。進一步,編碼器100可組配來不將預測係數112_f2至114_f5包括於經編碼音訊信號120中。
因此,編碼器100可僅使用預測係數112_f2至114_f5以計算多個經預測個別頻譜係數110_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5以及從其計算之當前訊框的經預測個別頻譜係數110_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5與個別頻譜係數106_t0_f2或數組經預測頻譜係數110_t0_f4及110_t0_f5之間的預測誤差,但將
不會提供個別頻譜係數106_t0_f4(或其量化版本)或數組頻譜係數106_t0_f4及106_t0_f5(或其量化版本)也不會提供預測係數112_f2至114_f5於經編碼音訊信號120中。因此一解碼器,其實施例係相關於圖4敘述於後,可導出預測係數112_f2至114_f5以從間距值針對當前訊框計算多個經預測個別頻譜係數或數組經預測頻譜係數110_t0_f4及110_t0_f5。
換句話說,編碼器100可組配來針對應用預測編碼的多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5提供包括預測誤差之量化版本而非多個個別頻譜係數106_t0_f2之或數組頻譜係數106_t0_f4及106_t0_f5之量化版本的經編碼音訊信號120。
進一步,編碼器100可組配來提供包括多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5被分隔開所憑藉的頻譜係數106_t0_f3之量化版本的經編碼音訊信號120,使得會有被包括於經編碼音訊信號120中的預測誤差之量化版本所針對之頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5與不使用預測編碼而提供的量化版本所針對之頻譜係數106_t0_f3或頻譜係數組的一個交替。
在實施例中,編碼器100可進一步組配來熵編碼預測編碼之量化版本及多個個別頻譜係數106_t0_f2或數組頻譜係數106_t0_f4及106_t0_f5被分隔開所憑藉的頻譜係數106_t0_f3之量化版本,以及將經熵編碼之版本包括於經
編碼音訊信號120(而不是其非經編碼之版本)中。
圖2顯示針對當前訊框108_t0在頻率上繪製的音訊信號102之振幅的圖。進一步,在圖2中,表示了針對音訊信號102的當前訊框108_t0藉編碼器100決定之一轉換域或濾波器庫域中之頻譜係數。
如圖2中所示,編碼器100可組配來選擇性地將預測編碼應用於由至少一頻譜係數所分隔開之多個頻譜係數組116_1至116_6。詳細地說,在圖2所示之實施例中,編碼器100選擇性地將預測編碼應用於六個頻譜係數組116_1至116_6,其中前五個頻譜係數組116_1至116_5之每個包括三個頻譜係數(例如,第二組116_2包括頻譜係數106_t0_f8、106_t0_f9及106_t0_f10),其中第六個頻譜係數組116_6包括兩個頻譜係數。因此,此六個頻譜係數組116_1至116_6係由不應用預測編碼的(五個)頻譜係數組118_1至118_5分隔開。
換句話說,如圖2中所表示,編碼器100可組配來選擇性地將預測編碼應用於頻譜係數組116_1至116_6,使得會有應用預測編碼的頻譜係數組116_1至116_6與不應用預測編碼的頻譜係數組118_1至118_5的一個交替。
在實施例中,編碼器100可組配來決定一間距值(藉箭號122_1及122_2表示於圖2中),其中編碼器100可組配來基於該間距值選擇應用預測編碼的多個頻譜係數組116_1至116_6(或多個個別頻譜係數)。
該間距值可為,例如,在音訊信號102之二特徵
頻率之間的間距(或距離),像是音訊信號之尖峰124_1及124_2。進一步,該間距值可為近似該音訊信號之該二特徵頻率之間的間距之整數個頻譜係數(或頻譜係數之指數)。自然地,該間距值亦可為描述該音訊信號之該二特徵頻率之間的間距之實數或分數或倍數整數個頻譜係數。
在實施例中,編碼器100可組配來決定音訊信號(102)的瞬時基礎頻率並自該瞬時基礎頻率或其分數或倍數導出間距值。
舉例而言,音訊信號102之第一尖峰124_1可為音訊信號102的瞬時基礎頻率(或音高、或第一諧波)。因此,編碼器100可組配來決定音訊信號102的瞬時基礎頻率並自該瞬時基礎頻率或其分數或倍數導出間距值。在該情況下,間距值可為近似該音訊信號102之瞬時基礎頻率124_1與一第二諧波124_2之間的間距之整數(或其分數或倍數)個頻譜係數。
自然地,音訊信號102可包含兩個以上諧波。例如,顯示於圖2中之音訊信號102包含頻譜上分佈之六個諧波124_1至124_6使得音訊信號102在每個瞬時基礎頻率之整數倍包含一諧波。自然地,音訊信號102亦可能不包含所有但只有一些諧波,像是第一、第三及第五諧波。
在實施例中,編碼器100可組配來選擇根據由間距值定義之諧波柵而頻譜配置之頻譜係數組116_1至116_6(或個別頻譜係數)以用於預測編碼。藉此,由間距值定義之諧波柵描述音訊信號102中諧波之週期頻譜分佈(等
距間隔)。換句話說,由間距值定義之諧波柵可為描述音訊信號之諧波的等距間隔之一序列間隔值。
進一步,編碼器100可組配來選擇頻譜係數(例如,僅那些頻譜係數),其頻譜指數係與在以該間距值的基礎上導出之多個頻譜指數周圍的一範圍相等或位於該範圍內(例如,預先決定或可變的),用於預測編碼。
代表音訊信號102之諧波的頻譜係數之指數(或個數)可自間距值導出。例如,假設一第四頻譜係數106_t0_f4代表音訊信號102之瞬時基礎頻率且假設間距值為五,則基於該間距值可導出該頻譜係數具有指數九。如同圖2中所見,該所導出之頻譜係數具有指數九,亦即,第九個頻譜係數106_t0_f9,代表第二個諧波。同樣地,可以導出頻譜係數具有指數14、19、24及29,代表第三至第六個諧波124_3至124_6。然而,不僅具有相等於基於間距值導出之多個頻譜指數的指數之頻譜係數可被預測編碼,具有在基於間距值導出的多個頻譜指數周圍之一給定範圍內的指數之頻譜係數亦可被預測編碼。舉例來說,如圖2中所示,該範圍可為三,使得不是多個個別頻譜係數經選擇用以預測編碼,而是多組頻譜係數。
進一步,編碼器100可組配來選擇應用預測編碼之頻譜係數組116_1至116_6(或多個個別頻譜係數)使得在應用預測編碼之頻譜係數組116_1至116_6(或多個個別頻譜係數)與分隔應用預測編碼之頻譜係數組(或多個個別頻譜係數)的該等頻譜係數之間會有一週期性交替,其以+/-1
頻譜係數之一容許誤差為周期。當在音訊信號102之兩諧波間的距離不等於一整數間距值(關於頻譜係數之指數或數目的整數)而是其分數或倍數時,可能需要以+/-1頻譜係數之該容許誤差。此亦可於圖2中所見,因為箭號122_1至122_6並不總是完全指向對應頻譜係數之中央或中間。
換句話說,音訊信號102可包含至少兩個諧波信號成分124_1至124_6,其中編碼器100可組配來選擇性地將預測編碼應用於代表該等至少兩個諧波信號成分124_1至124_6或音訊信號102之該等至少兩個諧波信號成分124_1至124_6周圍的頻譜環境之該等頻譜係數組116_1至116_6(或個別頻譜係數)。該等至少兩個諧波信號成分124_1至124_6周圍的頻譜環境可為,例如,+/-1、2、3、4或5個頻譜成分。
藉此,編碼器100可組配來不將預測編碼應用於不代表該等至少兩個諧波信號成分124_1至124_6或音訊信號102之該等至少兩個諧波信號成分124_1至124_6的頻譜環境之該等頻譜係數組118_1至118_5(或多個個別頻譜係數)。換句話說,編碼器100可組配來不將預測編碼應用於屬於信號諧波124_1至124_6間之一非音調背景雜訊的該等多個頻譜係數組118_1至118_5(或個別頻譜係數)。
進一步,編碼器100可組配來決定指示音訊信號102之至少兩個諧波信號成分124_1至124_6間之一頻譜間距的一諧波間距值,該諧波間距值指示代表音訊信號102之至少兩個諧波信號成分124_1至124_6之該等多個個別頻
譜係數或頻譜係數組。
除此之外,編碼器100可組配來提供經編碼音訊信號120使得經編碼音訊信號120包括該間距值(例如,每訊框一間距值)或(替代地)可直接導出該間距值的一參數。
本發明實施例藉由將一諧波間距值引入FDP程序解決了前述FDP方法的兩個問題,該諧波間距值從編碼器(發射器)100傳信至各別的解碼器(接收器)使得此兩者可以完全同步的方式作業。該諧波間距值可作為與要被編碼之訊框相關聯的一或多個頻譜之一瞬時基礎頻率(或音高)的指示器,並識別哪些頻譜倉(頻譜係數)應被預測。更明確地,只有位於(以指數方式)整數倍基礎音高(如由諧波間距值定義)處之諧波信號成分周圍的那些頻譜係數應受預測。圖2及3藉由簡單示例的方式說明此音高適應性預測方法,其中圖3顯示以MPEG-2 AAC之當前技術的預測器的操作,其不只在諧波柵周圍預測亦使低於一定停止頻率的每個頻譜倉受到預測,且其中圖2繪示帶有根據整合來僅執行預測於最接近該諧波間距柵的那些“音調”倉上之實施例而修改的相同預測器。
比較圖2與圖3顯露了依據實施例修改的兩個優點,分別為(1)少得多的頻譜倉被包括於預測程序中,減少了複雜度(在所給的例子中少了粗略約40%因為僅預測五分之三的倉),以及(2)屬於諧波信號間之非音調背景雜訊的倉不會受預測影響,其應會增加預測的效率。
注意諧波間距值不一定需要相對於輸入信號之
實際瞬時音高,但若可對預測程序的效率產生整體改進,則其可代表真實音高的分數或倍數。再者,必須強調該諧波間距值不一定要反映整數倍數的倉指數或頻寬單元,但可包括該單元的分數。
隨後地,將敘述實施為MPEG式音訊編碼器的較佳例子。
音高適應性預測較佳地係整合進MPEG-2 AAC[ISO/IEC 13818-7,“Information technology-Part 7:Advanced Audio Coding(AAC),”2006.]或,利用如在AAC中之相似預測器進MPEG-H 3D audio codec[ISO/IEC 23008-3,“Information technology-High efficiency coding,part 3:3D audio,”2015.]。特別地,一位元旗標可針對每個訊框及非獨立編碼通道寫入至、且讀取自相對應的位元串流(對於獨立訊框通道,旗標可不傳輸,因為可停用預測以確保獨立性)。若將旗標設置至一,則另外8位元可被寫入及讀取。這些8位元代表針對所給訊框及通道之諧波間距值的量化版本(例如指數)。採用使用線性或非線性映射函數從該量化版本導出該諧波間距值,則可以以根據顯示於圖2中之實施例的方式實現該預測程序。較佳地,只有位於諧波柵周圍一最大距離1.5倉內的倉會受到預測。例如,若諧波距離值指示一諧波線在倉指數47.11,則只有在指數46、47及48的倉會受預測。然而所述最大距離,可做不同地指定,對所有通道及訊框為固定先驗的或基於諧波間距值對每個訊框及通道為分開的。
圖4顯示用以解碼經編碼信號120之解碼器200的概略區塊圖。解碼器200係組配來在一轉換域或濾波器庫域204中解碼經編碼音訊信號120,其中解碼器200係組配來解析經編碼音訊信號120以針對當前訊框208_t0獲得音訊信號之經編碼頻譜係數206_t0_f1至206_t0_f6以及針對至少一先前訊框208_t-1獲得經編碼頻譜係數206_t-1_f0至206_t-1_f6,及其中該解碼器200係組配來選擇性地將預測解碼應用於藉由至少一經編碼頻譜係數分隔開之多個個別經編碼頻譜係數或數組經編碼頻譜係數。
在實施例中,解碼器200可組配來將預測解碼應用於由至少一經編碼頻譜係數分隔之多個個別經編碼頻譜係數,諸如應用於由至少一經編碼頻譜係數分隔之兩個個別經編碼頻譜係數。進一步,解碼器200可組配來將預測解碼應用於由至少一經編碼頻譜係數分隔之多組經編碼頻譜係數(每組包含至少兩個經編碼頻譜係數),諸如應用於由至少一經編碼頻譜係數分隔之兩組經編碼頻譜係數。進一步,解碼器200可組配來將預測解碼應用於由至少一經編碼頻譜係數分隔之多個個別經編碼頻譜係數及/或數組經編碼頻譜係數,諸如應用於由至少一經編碼頻譜係數分隔之至少一個別經編碼頻譜係數及至少一組經編碼頻譜係數。
在圖4顯示的示例中,解碼器200可組配來針對當前訊框208_t0決定六個經編碼頻譜係數206_t0_f1至206_t0_f6以及針對先前訊框208_t-1決定六個經編碼頻譜
係數206_t-1_f1至206_t-1_f6。藉此,解碼器200係組配來選擇性地將預測解碼應用於該當前訊框之個別第二經編碼頻譜係數206_t0_f2以及應用於由當前訊框208_t0之第四及第五經編碼頻譜係數206_t0_f4與206_t0_f5組成的經編碼頻譜係數組。如所見,個別第二經編碼頻譜係數206_t0_f2及由第四及第五經編碼頻譜係數206_t0_f4與206_t0_f5組成的經編碼頻譜係數組係藉第三經編碼頻譜係數206_t0_f3彼此分隔開。
注意此處使用之用語「選擇性」是指將預測解碼(僅)應用於選擇之經編碼頻譜係數。換句話說,預測解碼不必要應用至所有經編碼頻譜係數,而是僅應用於選擇之個別經編碼頻譜係數或數組經編碼頻譜係數,該等選擇之個別經編碼頻譜係數及/或數組經編碼頻譜係數係藉至少一經編碼頻譜係數互相分隔開。換句話說,預測解碼係不應用於分隔所選擇之多個個別經編碼頻譜係數或數組經編碼頻譜係數的至少一經編碼頻譜係數。
在實施例中解碼器200可組配來不將預測解碼應用於分隔個別經編碼頻譜係數206_t0_f2或該組經編碼頻譜係數206_t0_f4及206_t0_f5的至少一經編碼頻譜係數206_t0_f3。
解碼器200可組配來熵解碼經編碼頻譜係數,以針對要應用預測解碼的頻譜係數206_t0_f2、206_t0_f4及206_t0_f5獲得量化預測誤差,及針對將不應用預測解碼的至少一頻譜係數獲得量化頻譜係數206_t0_f3。藉此,解碼
器200可組配來將量化預測誤差應用至多個經預測個別頻譜係數210_t0_f2或數組經預測頻譜係數210_t0_f4及210_t0_f5,以針對當前訊框208_t0獲得與應用預測解碼之經編碼頻譜係數206_t0_f2、206_t0_f4及206_t0_f5相關聯的經解碼頻譜係數。
舉例而言,解碼器200可組配來針對第二量化頻譜係數206_t0_f2獲得一第二量化預測誤差及將該第二量化預測誤差應用於經預測第二頻譜係數210_t0_f2,以獲得與該第二經編碼頻譜係數206_t0_f2相關聯之第二經解碼頻譜係數,其中解碼器200可組配來針對第四量化頻譜係數206_t0_f4獲得一第四量化預測誤差及將該第四量化預測誤差應用於經預測第四頻譜係數210_t0_f4,以獲得與該第四經編碼頻譜係數206_t0_f4相關聯之第四經解碼頻譜係數,以及其中解碼器200可組配來針對第五量化頻譜係數206_t0_f5獲得一第五量化預測誤差及將該第五量化預測誤差應用於經預測第五頻譜係數210_t0_f5,以獲得與該第五經編碼頻譜係數206_t0_f5相關聯之第五經解碼頻譜係數。
解碼器200可組配來基於先前訊框208_t-1之對應的多個個別經編碼頻譜係數206_t-1_f2(例如,使用與多個個別經編碼頻譜係數206_t-1_f2相關聯的多個先前解碼之頻譜係數)或數組經編碼頻譜係數206_t-1_f4及206_t-1_f5(例如,使用與數組經編碼頻譜係數206_t-1_f4及206_t-1_f5相關聯的數組先前解碼之頻譜係數)針對當前訊框208_t0決定多個經預測個別頻譜係數210_t0_f2或數組
經預測頻譜係數210_t0_f4及210_t0_f5。
舉例而言,解碼器200可組配來使用與先前訊框208_t-1之第二經編碼頻譜係數206_t-1_f2相關聯之先前解碼(量化)之第二頻譜係數決定當前訊框208_t0之第二經預測頻譜係數210_t0_f2、使用與先前訊框208_t-1之第四經編碼頻譜係數206_t-1_f4相關聯之先前解碼(量化)之第四頻譜係數決定當前訊框208_t0之第四經預測頻譜係數210_t0_f4、及使用與先前訊框208_t-1之第五經編碼頻譜係數206_t-1_f5相關聯之先前解碼(量化)之第五頻譜係數決定當前訊框208_t0之第五經預測頻譜係數210_t0_f5。
再者,解碼器200可組配來自間距值導出預測係數,且其中解碼器200可組配來使用至少兩個先前訊框208_t-1及208_t-2之對應的多個先前解碼之個別頻譜係數或先前解碼之數組頻譜係數及使用導出之預測係數來針對當前訊框208_t0計算多個經預測個別頻譜係數210_t0_f2或數組經預測頻譜係數210_t0_f4及210_t0_f5。
舉例而言,解碼器200可組配來:從間距值導出針對第二經編碼頻譜係數206_t0_f2之預測係數212_f2及214_f2、從該間距值導出針對第四經編碼頻譜係數206_t0_f4之預測係數212_f4及214_f4,以及從該間距值導出針對第五經編碼頻譜係數206_t0_f5之預測係數212_f5及214_f5。
注意解碼器200可組配來針對應用預測解碼之多個個別經編碼頻譜係數或數組經編碼頻譜係數來解碼經編
碼音訊信號120以為了獲得量化預測誤差而非多個個別量化頻譜係數或數組量化頻譜係數。
進一步,解碼器200可組配來解碼經編碼音訊信號120以為了獲得分隔多個個別頻譜係數或數組頻譜係數之量化頻譜係數,使得會有獲得量化預測誤差所針對之經編碼頻譜係數206_t0_f2或數組經編碼頻譜係數206_t0_f4及206_t0_f5以及獲得量化頻譜係數所針對之經編碼頻譜係數206_t0_f3或數組經編碼頻譜係數的一個交替。
解碼器200可組配來使用與應用預測解碼之經編碼頻譜係數206_t0_f2、206_t0_f4及206_t0_f5相關聯的經解碼頻譜係數,及使用與不應用預測解碼之經編碼頻譜係數206_t0_f1、206_t0_f3及206_t0_f6相關聯的熵解碼之頻譜係數提供一經解碼音訊信號220。
在實施例中,解碼器200可組配來獲得一間距值,其中解碼器200可組配來基於該間距值選擇應用預測解碼之多個個別經編碼頻譜係數206_t0_f2或數組經編碼頻譜係數206_t0_f4及206_t0_f5。
如已於上提及之關於相對應之編碼器100的敘述,該間距值可為,例如,在音訊信號之二特徵頻率之間的間距(或距離)。進一步,該間距值可為近似該音訊信號之該二特徵頻率之間的間距之整數個頻譜係數(或頻譜係數之指數)。自然地,該間距值亦可為描述該音訊信號之該二特徵頻率之間的間距之分數或倍數整數個頻譜係數。
解碼器200可組配來選擇根據由間距值定義之諧
波柵而頻譜配置之個別頻譜係數或數組頻譜係數以用於預測解碼。由間距值定義之諧波柵可描述音訊信號102中諧波之週期頻譜分佈(等距間隔)。換句話說,由間距值定義之諧波柵可為描述音訊信號102之諧波的等距間隔之一序列間隔值。
進一步,解碼器200可組配來選擇頻譜係數(例如,僅那些頻譜係數),其頻譜指數係與在以該間距值的基礎上導出之多個頻譜指數周圍的一範圍相等或位於該範圍內(例如,預先決定或可變的範圍),用於預測解碼。藉此,解碼器200可組配來依賴於該間距值而設定該範圍的寬度。
在實施例中,經編碼音訊信號可包含該間距值或其經編碼版本(例如,可從其直接導出該間距值之參數),其中解碼器200可組配來從經編碼音訊信號提取該間距值或其經編碼版本以獲得該間距值。
替代地,解碼器200可組配來藉其自身決定間距值,亦即,經編碼音訊信號不包括該間距值。在此實例中,解碼器200可組配來決定(代表音訊信號102之經編碼音訊信號120的)瞬時基礎頻率並自該瞬時基礎頻率或其分數或倍數導出該間距值。
在實施例中,解碼器200可組配來選擇應用預測解碼之多個個別頻譜係數或頻譜係數組使得在應用預測解碼之多個個別頻譜係數或頻譜係數組與分隔應用預測解碼之多個個別頻譜係數或頻譜係數組的該等頻譜係數之間會
有一週期性交替,其以+/-1頻譜係數之一容許誤差為周期。
在實施例中,藉經編碼音訊信號120代表之音訊信號102包含至少兩個諧波信號成分,其中解碼器200係組配來選擇性地將預測解碼應用於代表該等至少兩個諧波信號成分或音訊信號102之該等至少兩個諧波信號成分周圍的頻譜環境之那些多個個別經編碼頻譜係數206_t0_f2或數組經編碼頻譜係數206_t0_f4及206_t0_f5。該等至少兩個諧波信號成分周圍的頻譜環境可為,例如,+/-1、2、3、4或5個頻譜成分。
藉此,解碼器200可組配來識別至少兩個諧波信號成分,並選擇性地將預測解碼應用於與(例如,代表經識別諧波信號成分或環繞經識別諧波信號成分的)經識別諧波信號成分相關聯之那些多個個別經編碼頻譜係數206_t0_f2或數組經編碼頻譜係數206_t0_f4及206_t0_f5。
替代地,經編碼音訊信號120可包含識別至少兩個諧波信號成分的資訊(例如,間距值)。在該實例中,解碼器200可組配來選擇性地將預測解碼應用於與(例如,代表經識別諧波信號成分或環繞經識別諧波信號成分的)經識別諧波信號成分相關聯之那些多個個別經編碼頻譜係數206_t0_f2或數組經編碼頻譜係數206_t0_f4及206_t0_f5。
在前述及的替代例兩者中,解碼器200可組配來不將預測解碼應用於不代表該等至少兩個諧波信號成分或音訊信號102之該等至少兩個諧波信號成分之頻譜環境的
那些多個個別經編碼頻譜係數206_t0_f3、206_t0_f1及206_t0_f6或數組經編碼頻譜係數。
換句話說,解碼器200可組配來不將預測解碼應用於屬於音訊信號102之信號諧波間之一非音調背景雜訊的那些多個個別經編碼頻譜係數206_t0_f3、206_t0_f1、206_t0_f6或數組經編碼頻譜係數。
根據一實施利,圖5顯示用以編碼音訊信號之方法300的流程圖。該方法300包含針對當前訊框或至少一先前訊框決定音訊信號之頻譜係數的步驟302,以及選擇性地將預測編碼應用於藉至少一頻譜係數分隔之多個個別頻譜係數或數組頻譜係數的步驟304。
根據一實施例,圖6顯示用以解碼經編碼音訊信號之方法400的流程圖。該方法400包含解析經編碼音訊信號以針對當前訊框及至少一先前訊框獲得音訊信號之經編碼頻譜係數的步驟402,以及選擇性地將預測解碼應用於藉至少一經編碼頻譜係數分隔之多個個別經編碼頻譜係數或數組經編碼頻譜係數的步驟404。
雖然一些面向已敘述於一裝置之上下文中,可清楚的是這些面向亦代表對應方法的敘述,其中一區塊或設備對應至方法步驟或方法步驟之特徵。類似地,敘述於方法步驟之上下文中的面向亦代表對應裝置之對應區塊或項目或特徵的敘述。該等方法步驟的一些或全部可藉(或使用)硬體裝置而執行,像是例如,微處理器、可規劃電腦或電子電路。在一些實施例中,一或多最重要之方法步
驟可藉此類裝置而執行。
本發明之經編碼音訊信號可儲存於數位儲存媒介上或可於諸如無線傳輸媒介之傳輸媒介或諸如網際網路之有線傳輸媒介上傳輸。
取決於一些實行例需求,本發明之實施例可以硬體或軟體方式實行。該實行例可使用數位儲存媒介而執行,例如,軟式磁碟、DVD、藍光、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該數位儲存媒介具有電子可讀控制信號儲存於其上,且與可規劃電腦系統協作(或能夠協作)使得各自之方法被執行。因此,該數位儲存媒介可為電腦可讀的。
根據本發明之一些實施例包含帶有電子可讀控制信號的資料載體,其能夠與可規劃電腦系統協作,使得此處所敘述之該等方法之一者可被執行。
一般地,本發明之實施例可實行為帶有程式碼之電腦程式產品,當該電腦程式產品在電腦上運行時,該程式碼係操作來執行該等方法之一者。該程式碼可例如儲存於機器可讀載體上。
其他實施例包含用以執行此處所敘述之該等方法之一者的電腦程式,其儲存有機器可讀載體。
換句話說,本發明方法之實施例,因此,係為具有程式碼之電腦程式,當該電腦程式在電腦上運行時,用以執行此處所敘述之該等方法之一者。
本發明方法之進一步實施例,因此,係資料載
體(或數位儲存媒介或電腦可讀媒介)包含,記錄於其上之用以執行此處所敘述之該等方法之一者的電腦程式。資料載體、數位儲存媒介或電腦可讀媒介係通常為有形及/或非暫態的。
本發明方法之進一步實施例,因此,係代表用以執行此處所敘述之該等方法之一者的電腦程式之資料串流或信號序列。資料串流或信號序列可舉例而言組配來透過資料通訊連結而傳輸,例如透過網際網路。
進一步之實施例包含一運算構件,例如電腦、或可規劃邏輯設備,組配來或配適於執行此處所敘述之該等方法之一者。
進一步之實施例包含用以執行此處所敘述之該等方法之一者的一電腦,該電腦具有電腦程式安裝於其上。
根據本發明之進一步實施例包含組配來將用以執行此處所敘述之該等方法之一者的電腦程式傳送(例如,電子或光學地)至接收器之裝置或系統。該接收器,例如,可為電腦、行動設備、記憶體設備或類似裝置。該裝置或系統可,例如,包含用以將電腦程式傳送至接收器之檔案伺服器。
在一些實施例中,可規劃邏輯設備(例如現場可規劃閘陣列)可用來執行此處所敘述該等之方法的一些或所有功能。在一些實施例中,現場可規劃閘陣列可與一微處理器協作以為了執行此處所敘述之該等方法之一者。一
般地,該等方法較佳地係由任何硬體裝置所執行。
此處所敘述之裝置可使用硬體裝置、或使用電腦、或使用硬體裝置及電腦之組合而實行。
此處所敘述之方法可使用硬體裝置、或使用電腦、或使用硬體裝置及電腦之組合而執行。
以上敘述之實施例僅針對本發明之原理的說明。要了解的是對此處敘述之安排及詳情所做的修改及變動將對此領域其他熟習技術者來說是顯而易見的。此意圖,因此,係僅由即將成為的專利申請專利範圍之範疇所限制且非由透過此處實施例之說明及敘述的方式所呈現之具體詳情。
100‧‧‧編碼器
102‧‧‧音訊信號
104‧‧‧轉換域或濾波器庫域
106_t0_f1~106_t0_f6,
106_t-1_f1~106_t-1_f6,
106_t-2_f1~106_t-2_f6‧‧‧頻譜係數
108_t0‧‧‧當前訊框
108_t-1,108_t-2‧‧‧先前訊框
110_t0_f2,110_t0_f4,110_t0_f5‧‧‧經預測頻譜係數
112_f2,112_f4,112_f5,114_f2,114_f4,114_f5‧‧‧預測係數
Claims (50)
- 一種用以編碼音訊信號之編碼器,其中該編碼器係組配來在一轉換域或濾波器庫域中編碼該音訊信號,其中該編碼器係組配來針對一當前訊框及至少一先前訊框決定該音訊信號之頻譜係數,其中該編碼器係組配來選擇性地將預測編碼應用於多個個別頻譜係數或數組頻譜係數,其中該編碼器係組配來決定一間距值,其中該編碼器係組配來基於該間距值選擇應用預測編碼的該等多個個別頻譜係數或數組頻譜係數。
- 如請求項1之編碼器,其中該間距值係描述諧波間之一間距的一諧波間距值。
- 如請求項1及2中任一項之編碼器,其中該等多個個別頻譜係數或數組頻譜係數係藉至少一頻譜係數而分隔開。
- 如請求項3之編碼器,其中該預測編碼係不應用於分隔該等個別頻譜係數或該等數組頻譜係數之該至少一頻譜係數。
- 如請求項1至4中任一項之編碼器,其中該編碼器係組配來藉由該當前訊框的多個經預測個別頻譜係數或數組經預測頻譜係數與該當前訊框的該等多個個別頻譜係數或數組頻譜係數之間的編碼預測誤差,預測編碼該當前訊框的該等多個個別頻譜係數或該等數組頻譜係數。
- 如請求項5之編碼器,其中該編碼器係組配來自該間距值導出預測係數,且其中該編碼器係組配來使用至少二 先前訊框之對應之多個個別頻譜係數或對應之數組頻譜係數及使用導出之該等預測係數針對該當前訊框計算該等多個經預測個別頻譜係數或數組經預測頻譜係數。
- 如請求項5之編碼器,其中該編碼器係組配來使用該先前訊框之該等多個個別頻譜係數或該等數組頻譜係數之對應的量化版本針對該當前訊框決定該等多個經預測個別頻譜係數或數組經預測頻譜係數。
- 如請求項7之編碼器,其中該編碼器係組配來自該間距值導出預測係數,且其中該編碼器係組配來使用至少二先前訊框之該等多個個別頻譜係數或該等數組頻譜係數之對應的量化版本及使用導出之該等預測係數針對該當前訊框計算該等多個經預測個別頻譜係數或數組經預測頻譜係數。
- 如請求項6或8之編碼器,其中該編碼器係組配來提供一經編碼音訊信號,該經編碼音訊信號不包括該等預測係數或其經編碼版本。
- 如請求項5至9中任一項之編碼器,其中該編碼器係組配來提供一經編碼音訊信號,該經編碼音訊信號包括針對應用預測編碼的該等多個個別頻譜係數或數組頻譜係數的該等預測誤差之量化版本而非該等多個個別頻譜係數之或該等數組頻譜係數之量化版本。
- 如請求項10之編碼器,其中該經編碼音訊信號包括不應用預測編碼之該等頻譜係數的量化版本,使得會有被包 括於該經編碼音訊信號中的該等預測誤差之量化版本所針對之頻譜係數或數組頻譜係數與不使用預測編碼而提供的量化版本所針對之頻譜係數或頻譜係數組的一個交替。
- 如請求項1至11中任一項之編碼器,其中該編碼器係組配來決定該音訊信號的一瞬時基礎頻率並自該瞬時基礎頻率或其分數或倍數導出該間距值。
- 如請求項1至12中任一項之編碼器,其中該編碼器係組配來選擇根據由該間距值定義之一諧波柵而頻譜配置之個別頻譜係數或頻譜係數組以用於預測編碼。
- 如請求項1至13中任一項之編碼器,其中該編碼器係組配來選擇用於預測編碼之頻譜係數,其頻譜指數係與在以該間距值的基礎上導出之多個頻譜指數周圍的一範圍相等或位於該範圍內。
- 如請求項14之編碼器,其中該編碼器係組配來依賴於該間距值而設定該範圍的寬度。
- 如請求項1至15中任一項之編碼器,其中該編碼器係組配來選擇應用預測編碼之該等多個個別頻譜係數或頻譜係數組使得在應用預測編碼之該等多個個別頻譜係數或頻譜係數組與不應用預測編碼之該等頻譜係數或頻譜係數組間會有一週期性交替,其以+/-1頻譜係數之一容許誤差為周期。
- 如請求項1至16中任一項之編碼器,其中該音訊信號包含至少二諧波信號成分,其中該編碼器係組配來選擇性 地將預測編碼應用於代表該等至少二諧波信號成分或該音訊信號之該等至少二諧波信號成分周圍的頻譜環境之該等多個個別頻譜係數或頻譜係數組。
- 如請求項17之編碼器,其中該編碼器係組配來不將預測編碼應用於不代表該等至少二諧波信號成分或該音訊信號之該等至少二諧波信號成分的頻譜環境之該等多個個別頻譜係數或頻譜係數組。
- 如請求項17或18之編碼器,其中該編碼器係組配來不將預測編碼應用於屬於信號諧波間之一非音調背景雜訊的該等多個個別頻譜係數或頻譜係數組。
- 如請求項17至19中任一項之編碼器,其中該間距值係指示該音訊信號之該等至少二諧波信號成分間之一頻譜間距的一諧波間距值,該諧波間距值指示代表該音訊信號之該等至少二諧波信號成分之該等多個個別頻譜係數或頻譜係數組。
- 如請求項11至20中任一項之編碼器,其中該編碼器係組配來提供一經編碼音訊信號,其中該編碼器係組配來將該間距值或其一經編碼版本包括於該經編碼音訊信號中。
- 如請求項1至21中任一項之編碼器,其中該等頻譜係數係頻譜倉。
- 一種用以解碼經編碼音訊信號之解碼器,其中該解碼器係組配來在一轉換域或濾波器庫域中解碼該經編碼音訊信號,其中該解碼器係組配來解析該經編碼音訊信號 以針對一當前訊框及至少一先前訊框獲得該音訊信號之經編碼頻譜係數,及其中該解碼器係組配來選擇性地將預測解碼應用於多個個別經編碼頻譜係數或數組經編碼頻譜係數,其中該解碼器係組配來基於間距值選擇應用預測解碼的該等多個個別經編碼頻譜係數或數組經編碼頻譜係數。
- 如請求項23之解碼器,其中該間距值係描述諧波之間一間距的一諧波間距值。
- 如請求項24之解碼器,其中該等多個個別經編碼頻譜係數或數組經編碼頻譜係數係藉至少一經編碼頻譜係數分隔。
- 如請求項24之解碼器,其中該預測解碼係不應用於分隔該等個別頻譜係數或該等數組頻譜係數的該至少一頻譜係數。
- 如請求項24至26中任一項之解碼器,其中該解碼器係組配來熵解碼該經編碼頻譜係數,以針對要應用預測解碼的該等頻譜係數獲得量化預測誤差,及針對將不應用預測解碼的頻譜係數獲得量化頻譜係數;以及其中該解碼器係組配來將該等量化預測誤差應用至多個經預測個別頻譜係數或數組經預測頻譜係數,以針對該當前訊框獲得與應用預測解碼之該等經編碼頻譜係數相關聯的經解碼頻譜係數。
- 如請求項27之解碼器,其中該解碼器係組配來基於該先前訊框之一對應的多個個別經編碼頻譜係數或數組經 編碼頻譜係數針對該當前訊框決定該等多個經預測個別頻譜係數或數組經預測頻譜係數。
- 如請求項28之解碼器,其中該解碼器係組配來從該間距值導出預測係數,且其中該解碼器係組配來使用至少二先前訊框之一對應的多個先前解碼之個別頻譜係數或先前解碼之數組頻譜係數及使用導出之該等預測係數來針對該當前訊框計算該等多個經預測個別頻譜係數或數組經預測頻譜係數。
- 如請求項24至29中任一項之解碼器,其中該解碼器係組配來針對應用預測解碼之該等多個個別經編碼頻譜係數或數組經編碼頻譜係數來解碼該經編碼音訊信號以為了獲得量化預測誤差而非多個個別量化頻譜係數或數組量化頻譜係數。
- 如請求項30之解碼器,其中該解碼器係組配來解碼該經編碼音訊信號以為了針對不應用預測解碼之經編碼頻譜係數獲得量化頻譜係數,使得會有獲得量化預測誤差所針對之經編碼頻譜係數或數組經編碼頻譜係數以及獲得量化頻譜係數所針對之經編碼頻譜係數或數組經編碼頻譜係數的一個交替。
- 如請求項24至31中任一項之解碼器,其中該解碼器係組配來選擇根據由該間距值定義之一諧波柵而頻譜配置之個別頻譜係數或數組頻譜係數以用於預測解碼。
- 如請求項24至32中任一項之解碼器,其中該解碼器係組配來選擇用於預測解碼之頻譜係數,其頻譜指數係與在 以該間距值的基礎上導出之多個頻譜指數周圍的一範圍相等或位於該範圍內。
- 如請求項33之解碼器,其中該解碼器係組配來依賴該間距值而設定該範圍的寬度。
- 如請求項24至34中任一項之解碼器,其中該經編碼音訊信號包含該間距值或其一經編碼版本,其中該解碼器係組配來從該經編碼音訊信號提取該間距值或其該經編碼版本以獲得該間距值。
- 如請求項24至34中任一項之解碼器,其中該解碼器係組配來決定該間距值。
- 如請求項36之解碼器,其中該解碼器係組配來決定一瞬時基礎頻率並自該瞬時基礎頻率或其分數或倍數導出該間距值。
- 如請求項24至37中任一項之解碼器,其中該解碼器係組配來選擇應用預測解碼之該等多個個別頻譜係數或頻譜係數組使得在應用預測解碼之該等多個個別頻譜係數或頻譜係數組與不應用預測解碼之該等頻譜係數間會有一週期性交替,其以+/-1頻譜係數之一容許誤差為周期。
- 如請求項24至38中任一項之解碼器,其中藉該經編碼音訊信號代表之該音訊信號包含至少二諧波信號成分,其中該解碼器係組配來選擇性地將預測解碼應用於代表該等至少二諧波信號成分或該音訊信號之該等至少二諧波信號成分周圍的頻譜環境之該等多個個別經編碼 頻譜係數或數組經編碼頻譜係數。
- 如請求項39之解碼器,其中該解碼器係組配來識別該等至少二諧波信號成分,並選擇性地將預測解碼應用於與該等經識別諧波信號成分相關聯之該等多個個別經編碼頻譜係數或數組經編碼頻譜係數。
- 如請求項39之解碼器,其中該經編碼音訊信號包含該間距值或其一經編碼版本,其中該間距值識別該等至少二諧波信號成分,其中該解碼器係組配來選擇性地將預測解碼應用於與該等經識別諧波信號成分相關聯之該等多個個別經編碼頻譜係數或數組經編碼頻譜係數。
- 如請求項39至42中任一項之解碼器,其中該解碼器係組配來不將預測解碼應用於不代表該等至少二諧波信號成分或該音訊信號之該等至少二諧波信號成分之頻譜環境的該等多個個別經編碼頻譜係數或數組經編碼頻譜係數。
- 如請求項39至42中任一項之解碼器,其中該解碼器係組配來不將預測解碼應用於屬於該音訊信號之信號諧波間之一非音調背景雜訊的該等多個個別經編碼頻譜係數或數組經編碼頻譜係數。
- 如請求項24至43中任一項之解碼器,其中該經編碼音訊信號包括該間距值或其一經編碼版本,其中該間距值係一諧波間距值,該諧波間距值指示代表該音訊信號之該等至少二諧波信號成分之該等多個個別經編碼頻譜係數或經編碼頻譜係數組。
- 如請求項24至44中任一項之解碼器,其中該等頻譜係數係頻譜倉。
- 一種用以在轉換域或濾波器庫域中編碼音訊信號之方法,該方法包含:針對一當前訊框及至少一先前訊框決定該音訊信號之頻譜係數;決定一間距值;以及選擇性地將預測編碼應用於多個個別頻譜係數或數組頻譜係數,其中應用預測編碼之該等多個個別頻譜係數或數組頻譜係數係基於該間距值而選擇。
- 一種用以在轉換域或濾波器庫域中解碼經編碼音訊信號之方法,該方法包含:解析該經編碼音訊信號以針對一當前訊框及至少一先前訊框獲得該音訊信號之經編碼頻譜係數;獲得一間距值;以及選擇性地將預測解碼應用於多個個別經編碼頻譜係數或數組經編碼頻譜係數,其中應用預測解碼之該等多個個別經編碼頻譜係數或數組經編碼頻譜係數係基於該間距值而選擇。
- 一種用以執行如請求項46或47之方法的電腦程式。
- 一種用以編碼音訊信號之編碼器,其中該編碼器係組配來在一轉換域或濾波器庫域中編碼該音訊信號,其中該編碼器係組配來針對一當前訊框及至少一先前訊框決定該音訊信號之頻譜係數,其中該編碼器係組配來選擇 性地將預測編碼應用於多個個別頻譜係數或數組頻譜係數,其中該編碼器係組配來決定一間距值,其中該編碼器係組配來基於該間距值選擇應用預測編碼的該等多個個別頻譜係數或數組頻譜係數;其中該編碼器係組配來選擇根據由該間距值定義之一諧波柵而頻譜配置之個別頻譜係數或頻譜係數組以用於預測編碼。
- 一種用以解碼經編碼音訊信號之解碼器,其中該解碼器係組配來在一轉換域或濾波器庫域中解碼該經編碼音訊信號,其中該解碼器係組配來解析該經編碼音訊信號以針對一當前訊框及至少一先前訊框獲得該音訊信號之經編碼頻譜係數,及其中該解碼器係組配來選擇性地將預測解碼應用於多個個別經編碼頻譜係數或數組經編碼頻譜係數,其中該解碼器係組配來基於間距值選擇應用預測解碼的該等多個個別經編碼頻譜係數或數組經編碼頻譜係數;其中該解碼器係組配來選擇根據由該間距值定義之一諧波柵而頻譜配置之個別頻譜係數或數組頻譜係數以用於預測解碼。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158253 | 2015-03-09 | ||
??15158253.3 | 2015-03-09 | ||
PCT/EP2015/063658 WO2016142002A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
??PCT/EP2015/063658 | 2015-06-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201637002A true TW201637002A (zh) | 2016-10-16 |
TWI613644B TWI613644B (zh) | 2018-02-01 |
Family
ID=52692424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105107024A TWI613644B (zh) | 2015-03-09 | 2016-03-08 | 音訊編碼器、音訊解碼器、用以編碼音訊信號之方法、用以解碼經編碼音訊信號之方法、及相關電腦程式 |
Country Status (20)
Country | Link |
---|---|
US (2) | US10600428B2 (zh) |
EP (3) | EP4297027A3 (zh) |
JP (3) | JP6666356B2 (zh) |
KR (1) | KR102151728B1 (zh) |
CN (3) | CN114067813A (zh) |
AR (6) | AR103890A1 (zh) |
AU (4) | AU2016231220B2 (zh) |
BR (1) | BR112017019185B1 (zh) |
CA (1) | CA2978815C (zh) |
ES (1) | ES2821025T3 (zh) |
HK (1) | HK1244583A1 (zh) |
MX (1) | MX365267B (zh) |
MY (1) | MY181486A (zh) |
PL (2) | PL3373298T3 (zh) |
PT (1) | PT3268960T (zh) |
RU (1) | RU2707151C2 (zh) |
SG (1) | SG11201707349WA (zh) |
TW (1) | TWI613644B (zh) |
WO (1) | WO2016142002A1 (zh) |
ZA (6) | ZA201706604B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2020094263A1 (en) * | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
CN109473116B (zh) * | 2018-12-12 | 2021-07-20 | 思必驰科技股份有限公司 | 语音编码方法、语音解码方法及装置 |
Family Cites Families (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH572650A5 (zh) * | 1972-12-21 | 1976-02-13 | Gretag Ag | |
JPS6031198A (ja) * | 1983-07-29 | 1985-02-16 | 松下電器産業株式会社 | 予測残差信号符号化方法 |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3680374B2 (ja) * | 1995-09-28 | 2005-08-10 | ソニー株式会社 | 音声合成方法 |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
JP2002162998A (ja) * | 2000-11-28 | 2002-06-07 | Fujitsu Ltd | パケット修復処理を伴なう音声符号化方法 |
EP1304885A3 (de) * | 2001-09-14 | 2005-04-20 | Siemens Aktiengesellschaft | Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen |
WO2003088314A2 (en) * | 2002-04-12 | 2003-10-23 | Arch Specialty Chemicals, Inc. | Remote monitoring system for chemical liquid delivery |
US7634399B2 (en) * | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
EP1475144A2 (de) * | 2003-05-09 | 2004-11-10 | Pfaudler Werke GmbH | Stromstörer für einen Rührkessel, aufweisend mindestens ein Stromstörelement |
US7688894B2 (en) * | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
EP1667109A4 (en) * | 2003-09-17 | 2007-10-03 | Beijing E World Technology Co | METHOD AND DEVICE FOR QUANTIFYING MULTI-RESOLUTION VECTOR FOR AUDIO CODING AND DECODING |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
TWI277013B (en) * | 2005-02-01 | 2007-03-21 | Ind Tech Res Inst | Method for reducing buffered-frame memory sizes and accesses in a video codec |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
KR101365445B1 (ko) * | 2007-01-03 | 2014-02-19 | 삼성전자주식회사 | 전역 및 국부 움직임 보상을 순차적으로 이용하는 움직임보상 방법, 복호화 방법, 장치, 인코더 및 디코더 |
DE102007018484B4 (de) * | 2007-03-20 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
CN101965612B (zh) | 2008-03-03 | 2012-08-29 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、系统及装置 |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
EP3300076B1 (en) * | 2008-07-11 | 2019-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and audio decoder |
ES2642906T3 (es) * | 2008-07-11 | 2017-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador |
EP2311034B1 (en) * | 2008-07-11 | 2015-11-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
US8406307B2 (en) * | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
EP2192786A1 (en) * | 2008-11-27 | 2010-06-02 | Panasonic Corporation | Frequency domain filters for video coding |
EP2380363B1 (en) * | 2009-01-20 | 2015-09-30 | MED-EL Elektromedizinische Geräte GmbH | High accuracy tonotopic and periodic coding with enhanced harmonic resolution |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
BR112012007803B1 (pt) * | 2009-10-08 | 2022-03-15 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear |
EP4358082A1 (en) * | 2009-10-20 | 2024-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
KR101487687B1 (ko) * | 2010-01-14 | 2015-01-29 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
ES2458354T3 (es) * | 2010-03-10 | 2014-05-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de señales de audio, codificador de señales de audio, métodos y programa de ordenador que utiliza tasa de muestreo dependiente de la codificación del contorno de distorsión en el tiempo |
CN101847413B (zh) * | 2010-04-09 | 2011-11-16 | 北京航空航天大学 | 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法 |
JP5387522B2 (ja) * | 2010-07-01 | 2014-01-15 | コニカミノルタ株式会社 | カラー画像形成装置 |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
CA3067155C (en) * | 2010-09-16 | 2021-01-19 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
CA2813898C (en) * | 2010-10-07 | 2017-05-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for level estimation of coded audio frames in a bit stream domain |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
EP2684355B1 (en) * | 2011-03-10 | 2014-11-12 | Telefonaktiebolaget L M Ericsson (PUBL) | Decoding of transforms with curved basis functions |
EP2770503B1 (en) * | 2011-10-21 | 2019-05-29 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame errors and method and apparatus for audio decoding |
EP2795884A4 (en) * | 2011-12-20 | 2015-07-29 | Nokia Corp | AUDIOCONFERENCING |
CN109147827B (zh) | 2012-05-23 | 2023-02-17 | 日本电信电话株式会社 | 编码方法、编码装置以及记录介质 |
CN102798870B (zh) * | 2012-08-07 | 2013-09-25 | 中国空间技术研究院 | 一种卫星导航系统兼容性分析方法 |
WO2014054556A1 (ja) * | 2012-10-01 | 2014-04-10 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、および記録媒体 |
CA3054712C (en) * | 2013-01-08 | 2020-06-09 | Lars Villemoes | Model based prediction in a critically sampled filterbank |
US9528371B2 (en) * | 2013-02-27 | 2016-12-27 | Evolution Engineering Inc. | Fluid pressure pulse generating apparatus and method of using same |
JP6013646B2 (ja) * | 2013-04-05 | 2016-10-25 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
EP3011556B1 (en) * | 2013-06-21 | 2017-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
PL3285256T3 (pl) * | 2013-10-31 | 2020-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału pobudzenia w dziedzinie czasu |
WO2015068225A1 (ja) | 2013-11-06 | 2015-05-14 | 株式会社日立製作所 | 信号伝送回路及びプリント基板 |
EP3040987B1 (en) * | 2013-12-02 | 2019-05-29 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
CN104934034B (zh) * | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
SG11201608787UA (en) * | 2014-03-28 | 2016-12-29 | Samsung Electronics Co Ltd | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
JP5723472B1 (ja) * | 2014-08-07 | 2015-05-27 | 廣幸 田中 | データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル |
US9536509B2 (en) * | 2014-09-25 | 2017-01-03 | Sunhouse Technologies, Inc. | Systems and methods for capturing and interpreting audio |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US20170022149A1 (en) * | 2015-07-25 | 2017-01-26 | Mark Quang Nguyen | Fumarate compounds, pharmaceutical compositions thereof, and methods of use |
-
2015
- 2015-06-17 WO PCT/EP2015/063658 patent/WO2016142002A1/en active Application Filing
-
2016
- 2016-03-07 ES ES16709331T patent/ES2821025T3/es active Active
- 2016-03-07 AU AU2016231220A patent/AU2016231220B2/en active Active
- 2016-03-07 MX MX2017011494A patent/MX365267B/es active IP Right Grant
- 2016-03-07 EP EP23209483.9A patent/EP4297027A3/en active Pending
- 2016-03-07 EP EP16709331.9A patent/EP3268960B1/en active Active
- 2016-03-07 CN CN202110984955.5A patent/CN114067813A/zh active Pending
- 2016-03-07 EP EP18170157.4A patent/EP3373298B1/en active Active
- 2016-03-07 KR KR1020177028551A patent/KR102151728B1/ko active IP Right Grant
- 2016-03-07 CN CN202110984953.6A patent/CN114067812A/zh active Pending
- 2016-03-07 PL PL18170157.4T patent/PL3373298T3/pl unknown
- 2016-03-07 CN CN201680015022.2A patent/CN107533847B/zh active Active
- 2016-03-07 SG SG11201707349WA patent/SG11201707349WA/en unknown
- 2016-03-07 PT PT167093319T patent/PT3268960T/pt unknown
- 2016-03-07 CA CA2978815A patent/CA2978815C/en active Active
- 2016-03-07 PL PL16709331T patent/PL3268960T3/pl unknown
- 2016-03-07 JP JP2017546946A patent/JP6666356B2/ja active Active
- 2016-03-07 RU RU2017134620A patent/RU2707151C2/ru active
- 2016-03-07 MY MYPI2017001298A patent/MY181486A/en unknown
- 2016-03-07 BR BR112017019185-7A patent/BR112017019185B1/pt active IP Right Grant
- 2016-03-08 TW TW105107024A patent/TWI613644B/zh active
- 2016-03-09 AR ARP160100621A patent/AR103890A1/es active IP Right Grant
-
2017
- 2017-09-06 US US15/697,042 patent/US10600428B2/en active Active
- 2017-10-02 ZA ZA2017/06604A patent/ZA201706604B/en unknown
-
2018
- 2018-03-06 HK HK18103159.1A patent/HK1244583A1/zh unknown
-
2019
- 2019-05-06 AU AU2019203173A patent/AU2019203173B2/en active Active
- 2019-11-01 JP JP2019200326A patent/JP7078592B2/ja active Active
-
2020
- 2020-02-26 US US16/802,397 patent/US20200227058A1/en active Pending
-
2021
- 2021-05-31 AR ARP210101476A patent/AR122219A2/es unknown
- 2021-05-31 AR ARP210101478A patent/AR122487A2/es unknown
- 2021-05-31 AR ARP210101480A patent/AR122489A2/es unknown
- 2021-05-31 AR ARP210101479A patent/AR122488A2/es unknown
- 2021-05-31 AR ARP210101477A patent/AR122486A2/es unknown
- 2021-08-13 AU AU2021215252A patent/AU2021215252B2/en active Active
-
2022
- 2022-04-29 ZA ZA2022/04766A patent/ZA202204766B/en unknown
- 2022-04-29 ZA ZA2022/04765A patent/ZA202204765B/en unknown
- 2022-04-29 ZA ZA2022/04768A patent/ZA202204768B/en unknown
- 2022-04-29 ZA ZA2022/04767A patent/ZA202204767B/en unknown
- 2022-04-29 ZA ZA2022/04764A patent/ZA202204764B/en unknown
- 2022-05-19 JP JP2022082087A patent/JP2022110116A/ja active Pending
-
2023
- 2023-10-05 AU AU2023241343A patent/AU2023241343A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7078592B2 (ja) | オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法 | |
US10847166B2 (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
JP2016508618A (ja) | 周波数領域におけるlpc系符号化のための低周波数エンファシス | |
JP2019164367A (ja) | 低複雑度の調性適応音声信号量子化 | |
KR102486258B1 (ko) | 스테레오 신호 인코딩 방법 및 인코딩 장치 | |
KR102353050B1 (ko) | 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스 | |
WO2016142357A1 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |