TWI705432B - 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 - Google Patents
音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 Download PDFInfo
- Publication number
- TWI705432B TWI705432B TW107126918A TW107126918A TWI705432B TW I705432 B TWI705432 B TW I705432B TW 107126918 A TW107126918 A TW 107126918A TW 107126918 A TW107126918 A TW 107126918A TW I705432 B TWI705432 B TW I705432B
- Authority
- TW
- Taiwan
- Prior art keywords
- mode
- current frame
- downmix
- downmix mode
- channel combination
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 165
- 230000000875 corresponding effect Effects 0.000 claims description 737
- 230000006870 function Effects 0.000 claims description 298
- 230000002596 correlated effect Effects 0.000 claims description 259
- 239000011159 matrix material Substances 0.000 claims description 145
- 239000000203 mixture Substances 0.000 claims description 135
- 238000004364 calculation method Methods 0.000 claims description 71
- 230000008569 process Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 82
- 238000012937 correction Methods 0.000 description 31
- 238000013139 quantization Methods 0.000 description 29
- 238000013507 mapping Methods 0.000 description 28
- 230000007774 longterm Effects 0.000 description 18
- 230000007704 transition Effects 0.000 description 17
- 230000009286 beneficial effect Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 238000009499 grossing Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 9
- 238000003672 processing method Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申請實施例公開了音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質。一種音訊編碼方法,包括:確定當前幀的聲道組合方案;根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式;根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。本申請實施例提供的技術方案有利於提高編碼品質。
Description
本發明涉及音訊編解碼技術領域,尤其涉及音訊編解碼方法和相關產品。
隨著生活品質的提高,人們對高品質音訊的需求不斷增大。相對於單聲道音訊,立體聲音訊具有各聲源的方位感和分佈感,能夠提高資訊的清晰度、可懂度和臨場感,因而備受人們青睞。
參數立體聲編解碼技術通過將立體聲信號轉換為單聲道信號和空間感知參數,對多聲道信號進行壓縮處理,是一種常見的立體聲編解碼技術。但是由於參數立體聲編解碼技術通常需要在頻域提取空間感知參數,需進行時頻變換,使得整個轉碼器的時延相對較大。因此在時延要求較嚴格的情況下,時域立體聲編碼技術,是一種更好的選擇。
傳統時域立體聲編碼技術是在時域將信號下混為兩路單聲道信號,例如MS編碼技術先將左右聲道信號下混為中央通道(Mid channel)信號和邊通道(Side channel)信號。例如L表示左聲道信號,R表示右聲道信號,則Mid channel信號為0.5*(L+R),Mid channel信號表徵了左右兩個聲道之間的相關資訊;Side channel信號為0.5*(L-R),Side channel信號表徵了左右兩個聲道之間的差異資訊。然後,分別對Mid channel信號和Side channel信號採用單聲道編碼方法編碼,對於Mid channel信號,通常用相對較多比特數進行編碼;對於Side channel信號,通常用相對較少比特數進行編碼。
本申請發明人研究和實踐發現,採用傳統時域立體聲編碼技術有時候出現主要信號能量特別小甚至能量缺失的現象,進而導致最終編碼品質下降。
本申請實施例提供音訊編解碼方法和相關產品。
第一方面,本申請實施例提供了一種音訊編碼方法,包括:確定當前幀的聲道組合方案;根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式;根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
其中,當前幀的立體聲信號例如由當前幀的左右聲道信號組成。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。例如所述多種聲道組合方案包括非相關性信號聲道組合方案和相關性信號聲道組合方案。其中,所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。
可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
其中,音訊幀(例如前一幀/當前幀)的下混模式為多種下混模式中的其中一種,其中,所述多種下混模式包括:下混模式A、下混模式B、下混模式C和下混模式D;其中,所述下混模式A和所述下混模式D為相關性信號下混模式;所述下混模式B和所述下混模式C為非相關性信號下混模式;其中,所述音訊幀的下混模式A、所述音訊幀的下混模式B、所述音訊幀的下混模式C和所述音訊幀的下混模式D對應的下混矩陣互不相同。
可以理解,由於下混矩陣和上混矩陣是對應的,因此,所述音訊幀的下混模式A、所述音訊幀的下混模式B、所述音訊幀的下混模式C和所述音訊幀的下混模式D對應的上混矩陣也互不相同。
可以理解,上述編碼方案中,需根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,因此,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
此外,第二方面,本申請實施例提供了一種音訊編碼模式確定方法,可以包括:確定當前幀的聲道組合方案;根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,所述當前幀的編碼模式為多種編碼模式中的其中一種。例如所述多種編碼模式可包括:下混模式切換型編碼模式和下混模式非切換型編碼模式等。
具體的,下混模式非切換型編碼模式可包括:下混模式A到下混模式A對應的編碼模式、下混模式B到下混模式B對應的編碼模式、下混模式C到下混模式C對應的編碼模式和下混模式D到下混模式D對應的編碼模式。
具體的,下混模式切換型編碼模式可包括:下混模式A切換到下混模式B對應的編碼模式、下混模式A切換到下混模式C對應的編碼模式、下混模式B切換到下混模式A對應的編碼模式、下混模式B切換到下混模式D對應的編碼模式、下混模式C切換到下混模式A對應的編碼模式、下混模式C切換到下混模式D對應的編碼模式、下混模式D切換到到下混模式B對應的編碼模式和下混模式D切換到到下混模式C對應的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實施方式可以是多種多樣的。
例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可以包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。
又例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可包括:根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,所述當前幀的下混模式切換代價值例如可為根據所述當前幀的下混模式切換代價函數進行計算的計算結果(例如結果越大表示切換代價越大);其中,所述下混模式切換代價函數基於如下參數的至少一種來構建:所述當前幀的至少一種時域立體聲參數、所述前一幀的至少一種時域立體聲參數和所述當前幀的左右聲道信號。
或者,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數。
其中,下混模式切換代價函數例如為如下切換代價函數的其中一種:下混模式A切換到下混模式B的下混模式切換代價函數、下混模式A切換到下混模式C的下混模式切換代價函數、下混模式D切換到下混模式B的下混模式切換代價函數、下混模式D切換到下混模式C的下混模式切換代價函數、下混模式B切換到下混模式A的下混模式切換代價函數、下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切換代價函數、下混模式C切換到下混模式D的下混模式切換代價函數等。
在一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,具體可包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第一下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第一模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值;或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第二下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第二模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第三下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第三模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第四下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第四模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第五下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第五模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第六下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第六模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第七下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第七模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第八下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第八模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
在另一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,例如可包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第九下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第九模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S1;或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第十下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S1;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十一下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,並且所述第十一模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S2;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十二下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十二模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S2;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十三下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十三模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S3;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十四下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十四模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S3;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十五下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十五模式切換條件為當前幀的聲道組合比例因數小於或或等於聲道組合比例因數閾值S4;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十六下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價函數值為當前幀的聲道組合比例因數,且所述第十六模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S4。
其中,在所述當前幀和前一幀的下混模式不同的情況下,可確定當前幀的編碼模式例如可能為下混模式切換型編碼模式,那麼,可根據所述當前幀和前一幀的下混模式對所述當前幀的左右聲道信號進行分段時域下混處理。
由於在所述當前幀和前一幀的聲道組合方案不同的情況下引入了對所述當前幀的左右聲道信號進行分段時域下混處理的機制,分段時域下混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
在一些可能的實施方式中,確定當前幀的聲道組合方案可包括:利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型;利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案。其中,所述當前幀的立體聲信號的信號正反相類型可以是類正相信號或類反相信號。所述當前幀的立體聲信號的信號正反相類型可通過所述當前幀的信號正反相類型標識來指示。具體例如,當所述當前幀的信號正反相類型標識取值為“1”時,指示所述當前幀的立體聲信號的信號正反相類型為類正相信號,當所述當前幀的信號正反相類型標識取值為“0”時,指示所述當前幀的立體聲信號的信號正反相類型為類反相信號,反之亦可。
音訊幀(例如前一幀或當前幀)的聲道組合方案可通過所述音訊幀的聲道組合方案標識來指示。具體例如,當音訊幀的聲道組合方案標識取值為“0”時,指示該音訊幀的聲道組合方案為相關性信號聲道組合方案。當音訊幀的聲道組合方案標識取值為“1”時,指示該音訊幀的聲道組合方案為非相關性信號聲道組合方案,反之亦可。
其中,利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型可包括:計算所述當前幀的左右聲道信號之間的相關性值,在所述小於或者等於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類正相信號,在所述大於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類反相信號。進一步的,若利用所述當前幀的信號正反相類型標識來指示所述當前幀的立體聲信號的信號正反相類型,則在確定所述當前幀的立體聲信號的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類正相信號;那麼,在確定所述當前幀的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類反相信號。
具體例如,音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“0”時,指示該音訊幀的立體聲信號的信號正反相類型為類正相信號;音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“1”時,指示該音訊幀的立體聲信號的信號正反相類型為類反相信號,以此類推。
其中,利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案,例如可包括:
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;在所述當前幀的立體聲信號的信號正反相類型為類反相信號,且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,並且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類反相信號,並且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案。
協力廠商面,本申請實施例還提供一種音訊解碼方法,包括:根據碼流進行解碼以得到當前幀的主次聲道解碼信號;根據碼流進行解碼以確定所述當前幀的下混模式;根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式;根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。例如所述多種聲道組合方案包括非相關性信號聲道組合方案和相關性信號聲道組合方案。所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
可以理解,由於時域下混和時域上混是對應的,編碼和解碼是對應的,因此,可根據當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理(其中,時域上混處理所使用的上混矩陣與編碼裝置時域下混所使用的下混矩陣是對應的)以得到所述當前幀的左右聲道重建信號。
在一些可能的實施方式中,所述根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,可包括:若前一幀的下混模式為下混模式A,所述當前幀的下混模式A為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式C,確定所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式A,確定所述當前幀的編碼模式為從下混模式B到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式D,確定所述當前幀的編碼模式為從下混模式B到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式C到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式C到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式D到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式D到下混模式B對應的編碼模式。
可以理解,上述解碼方案中,需根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
第四方面,本申請實施例還提供一種音訊編碼模式確定方法,包括:根據碼流進行解碼以得到當前幀的主次聲道解碼信號;根據碼流進行解碼以確定所述當前幀的下混模式;根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
下面對各種下混模式切換代價函數進行舉例說明。在實際應用中,切換代價函數的具體構建方式可以是多種多樣的,並不一定限於下面的舉例形式。
其中,所述表示下混模式A切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
例如end_sample_A-start_sample_A的取值範圍可為[60,200],例如end_sample_A-start_sample_A等於60、69、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述表示下混模式A切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式B切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式B切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式C切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C。
例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述表示下混模式C切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C,
例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式D切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式D切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
下面對當前幀的不同下混模式A對應的一些下混矩陣和上混矩陣進行舉例說明。
下面對前一幀的一些下混矩陣和上混矩陣進行舉例說明。
可以理解,上面對下混矩陣和上混矩陣形式的舉例都是示例性的,當然,在實際應用中還可能存在其它形式的下混矩陣和上混矩陣。
第五方面,本申請實施例還提供一種音訊編碼裝置,可以包括:相互耦合的處理器和記憶體,所述記憶體存儲有電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行第一方面中的任意一種音訊編碼方法的部分或全部步驟,或者,以用於執行第二方面中的任意一種音訊編碼模式確定方法的部分或全部步驟。
第六方面,本申請實施例還提供一種音訊解碼裝置,可以包括:相互耦合的處理器和記憶體,所述記憶體存儲有電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行協力廠商面中的任意一種音訊解碼方法的部分或全部步驟,或者,以用於執行第四方面中的任意一種音訊編碼模式確定方法的部分或全部步驟。
第七方面,本申請實施例提供一種音訊編碼裝置,包括用於實施第一方面或第二方面的任意一種方法的若干個功能單元。
第八方面,本申請實施例提供一種音訊解碼裝置,包括用於實施協力廠商面或第四方面的任意一種方法的若干個功能單元。
第九方面,本申請實施例提供一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了程式碼,其中,所述程式碼包括用於執行第一方面或第二方面的任意一種方法的部分或全部步驟的指令。
第十方面,本申請實施例提供一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了程式碼,其中,所述程式碼包括用於執行協力廠商面或第四方面的任意一種方法的部分或全部步驟的指令。
第十一方面,本申請實施例還提供一種電腦程式產品,其中,當所述電腦程式產品在電腦上運行時,使得所述電腦執行第一方面或第二方面的任意一種方法的部分或全部步驟。
第十二方面,本申請實施例還提供一種電腦程式產品,其中,當所述電腦程式產品在電腦上運行時,使得所述電腦執行協力廠商面或第四方面的任意一種方法的部分或全部步驟。
下面結合本申請實施例中的附圖對本申請實施例進行描述。
本申請說明書和權利要求書以及上述附圖之中的術語“包括”和“具有”以及它們的任何變形,意圖在於覆蓋不排他的包括。例如包括一系列步驟或單元的過程、方法、系統或產品或設備沒有限定於已列出的步驟或單元,而是可選地還可包括沒有列出的步驟或單元,或者可選地還包括對於這些過程、方法、產品或設備固有的其它步驟或單元。另外來說,術語“第一”、“第二”、“第三”和“第四”等是用於區別不同物件,而不是用於描述特定順序。
需要說明,由於本申請各實施例方案針對的時域場景,因此為了簡化描述,時域信號可簡稱“信號”。例如,左聲道時域信號可簡稱“左聲道信號”。又例如,右聲道時域信號可以簡稱“右聲道信號”。又例如,單聲道時域信號可簡稱“單聲道信號”。又例如參考聲道時域信號可簡稱“參考聲道信號”。又例如主要聲道時域信號可簡稱“主要聲道信號”。次要聲道時域信號可簡稱“次要聲道信號”。又例如中央通道(Mid channel)時域信號可以簡稱“中央通道信號”。又例如邊通道(Side channel)時域信號可簡稱“邊通道信號”。其他情況可以此類推。
需要說明,本申請各實施例中,左聲道時域信號和右聲道時域信號可合稱“左右聲道時域信號”或可合稱“左右聲道信號”。也就是說,左右聲道時域信號包括左聲道時域信號和右聲道時域信號。又例如當前幀經時延對齊處理的左右聲道時域信號包括當前幀經時延對齊處理的左聲道時域信號和當前幀經時延對齊處理的右聲道時域信號。類似的,主要聲道信號和次要聲道信號可合稱“主次聲道信號”。也就是說,主次聲道信號包括主要聲道信號和次要聲道信號。又例如主次聲道解碼信號包括主要聲道解碼信號和次要聲道解碼信號。又例如左右聲道重建信號包括左聲道重建信號和右聲道重建信號。以此類推。
其中,例如傳統MS編碼技術先將左右聲道信號下混為中央通道(Mid channel)信號和邊通道(Side channel)信號。例如L表示左聲道信號,R表示右聲道信號,則Mid channel信號為0.5*(L+R),Mid channel信號表徵了左右兩個聲道之間的相關資訊。Side channel信號為0.5*(L-R),Side channel信號表徵了左右兩個聲道之間的差異資訊。然後,分別對Mid channel信號和Side channel信號採用單聲道編碼方法編碼。其中,對於Mid channel信號,通常用相對較多比特數進行編碼;對於Side channel信號,通常用相對較少比特數進行編碼。
進一步的,為了提高編碼品質,一些方案通過對左右聲道的時域信號進行分析,提取用於指示時域下混處理中左右聲道所占比例的時域立體聲參數。提出這種方法的目的是:當立體聲左右聲道信號之間的能量相差比較大的時候,有利於提升時域下混信號中的主要聲道的能量,降低次要聲道的能量。
例如,L表示左聲道信號,R表示右聲道信號,那麼,則主要聲道(Primary channel)信號記作Y,Y= alpha*L+beta*R,其中,Y表徵了兩個聲道之間的相關資訊。次要聲道(Secondary channel)記作X,X= alpha*L-beta*R,X表徵了兩個聲道之間的差異資訊。alpha和beta為0到1的實數。
參見圖1,圖1示出了一種左聲道信號和右聲道信號的幅度變化情況。在時域某一時刻上,左聲道信號、右聲道信號的對應樣點之間幅度的絕對值基本相同,但是符號相反,這種就是典型的類反相信號。圖1只是給出了類反相信號的一個典型例子。實際上類反相信號是指左右聲道信號之間的相位差接近180度的立體聲信號。例如可將左右聲道信號之間的相位差屬於的立體聲信號稱作類反相信號,其中,可取0°到90°之間的任意角度,例如可等於0°、5°、15°、17°、20°、30°、40等等角度。
類似的,類正相信號是指左右聲道信號之間的相位差接近0度的立體聲信號。例如可將左右聲道信號之間的相位差屬於的立體聲信號稱作類正相信號。可取0°到90°之間的任意角度,例如可以等於0°、5°、15°、17°、20°、30°、40°等角度。
當左右聲道信號為類正相信號時,時域下混處理生成的主要聲道信號能量往往明顯大於次要聲道信號的能量。若用較多的比特數對主要聲道信號進行編碼,同時用較少的比特數對次要聲道信號進行編碼,那麼有利於獲得較好的編碼效果。但是,當左右聲道信號為類反相信號時,如果採用相同的時域下混處理方法,則生成的主要聲道信號能量會出現特別小甚至能量缺失的現象,進而導致最終編碼品質下降。
下面繼續探討一些有利於提升立體聲編解碼品質的技術方案。
本申請實施例提及的音訊編碼裝置和音訊解碼裝置可為具有採集、存儲、向外傳輸話音信號等功能的裝置,具體的,音訊編碼裝置和音訊解碼裝置例如可為手機、伺服器、平板電腦、個人電腦或筆記型電腦等等。
可以理解,本申請方案中,左右聲道信號是指立體聲信號的左右聲道信號。立體聲信號可以是原始的立體聲信號,也可以是多聲道信號中包含的兩路信號組成的立體聲信號,還可以是由多聲道信號中包含的多路信號聯合產生的兩路信號組成音訊的立體聲信號。其中,音訊編碼方法,也可以是多聲道編碼中使用的立體聲編碼方法。音訊編碼裝置,也可以是多聲道編碼裝置中使用的立體聲編碼裝置。類似的,音訊解碼方法,也可以是多聲道解碼中使用的立體聲解碼方法。音訊解碼裝置,也可以是多聲道解碼裝置中使用的立體聲解碼裝置。本申請實施例中的音訊編碼方法例如針對的是立體聲編碼場景,本申請實施例中的音訊解碼方法例如針對的是立體聲解碼場景。
下面首先提供一種音訊編碼確定方法,可包括:確定當前幀的聲道組合方案。根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號。對得到的所述當前幀的主次聲道信號進行編碼。
參見圖2,圖2是本申請實施例提供的一種音訊編碼方法的流程示意圖。一種音訊編碼方法的相關步驟可由編碼裝置來實施,例如可包括如下步驟:
201、確定當前幀的聲道組合方案。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。例如所述多種聲道組合方案可以包括非相關性信號聲道組合方案(anticorrelated signal Channel Combination Scheme)和相關性信號聲道組合方案(correlated signal Channel Combination Scheme)。其中,所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
202、根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
此外,若當前幀為第一幀(即不存在當前幀的前一幀)的情況下,可以基於當前幀的聲道組合方案確定當前幀的下混模式和編碼模式。或者,也可以將默認的某種下混模式和編碼模式作為當前幀的下混模式和編碼模式。
其中,前一幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
其中,當前幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述當前幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
其中,本申請一些實施例中,有時候將“時域下混”簡稱“下混”,有時候將“時域上混”簡稱“上混”。例如將“時域下混模式”簡稱“下混模式”;將“時域下混矩陣”簡稱“下混矩陣”;將“時域上混模式”簡稱“上混模式”;將“時域上混矩陣”簡稱“上混矩陣”;將“時域上混處理”簡稱“上混處理”,將“時域下混處理”簡稱“下混處理”,以此類推。
可以理解,本申請實施例中對編碼模式、解碼模式、下混模式、上混模式和聲道組合方案等物件的命名都是示意性的,在實際應用中也可能選用其他名稱。
203、根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號,對得到的所述當前幀的主次聲道信號進行編碼。
其中,對當前幀的左右聲道信號進行時域下混處理可得到當前幀的主次聲道信號,通過進一步對得到的所述當前幀的主次聲道信號進行編碼以得到碼流。可進一步將當前幀的聲道組合方案標識(當前幀的聲道組合方案標識用於指示當前幀的聲道組合方案)寫入碼流,以便於解碼裝置基於碼流中包含的當前幀的聲道組合方案標識來確定當前幀的聲道組合方案。可進一步將當前幀的下混模式標識(當前幀的下混模式標識用於指示當前幀的下混模式)寫入碼流,以便於解碼裝置基於碼流中包含的當前幀的下混模式標識來確定當前幀的下混模式。
其中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實現方式可以是多種多樣的。
具體例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可以包括: 若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。
又例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可包括:根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
在一些可能的實施方式中,下混模式切換代價值可以表徵下混模式切換代價,例如下混模式切換代價值越大則表示下混模式切換代價。
例如,所述當前幀的下混模式切換代價值可為根據所述當前幀的下混模式切換代價函數進行計算的計算結果(計算結果即下混模式切換代價函數值)。其中,所述下混模式切換代價函數例如可基於如下參數的至少一種來構建:當前幀的至少一種時域立體聲參數(當前幀的至少一種時域立體聲參例如包括當前幀的聲道組合比例因數等)、前一幀的至少一種時域立體聲參數(前一幀的至少一種時域立體聲參例如包括前一幀的聲道組合比例因數等)和所述當前幀的左右聲道信號。
又例如,當前幀的下混模式切換代價值可為當前幀的聲道組合比例因數。
例如下混模式切換代價函數可為如下切換代價函數的其中一種:
下混模式A切換到下混模式B的下混模式切換代價函數、下混模式A切換到下混模式C的下混模式切換代價函數、下混模式D切換到下混模式B的下混模式切換代價函數、下混模式D切換到下混模式C的下混模式切換代價函數、下混模式B切換到下混模式A的下混模式切換代價函數、下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切換代價函數、下混模式C切換到下混模式D的下混模式切換代價函數。
具體例如如圖4舉例所示,在一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可以包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第一下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第一模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值。或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第二下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第二模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第三下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第三模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第四下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第四模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第五下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第五模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第六下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第六模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第七下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第七模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第八下混模式切換條件,則可確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第八模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
又具體例如圖5舉例所示,在一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第九下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第九模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S1。或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第十下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S1。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十一下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,並且所述第十一模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S2。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十二下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十二模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S2。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十三下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十三模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S3。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十四下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十四模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S3。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十五下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十五模式切換條件為當前幀的聲道組合比例因數小於或或等於聲道組合比例因數閾值S4。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十六下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價函數值為當前幀的聲道組合比例因數,且所述第十六模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S4。
其中,聲道組合比例因數閾值S1的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.42、0.45、0.5、0.55、0.58、0.6或其它值。
其中,聲道組合比例因數閾值S2的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.42、0.45、0.5、0.55、0.57、0.6或其它值。
其中,聲道組合比例因數閾值S3的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.42、0.45、0.5、0.55、0.59、0.6或其它值。
其中,聲道組合比例因數閾值S4的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.43、0.45、0.5、0.55、0.58、0.6或其它值。
可以理解,上述對聲道組合比例因數閾值S4取值範圍的舉例是示例性的,可以基於切換測量來靈活的設置。
其中,在所述當前幀和前一幀的下混模式不同的情況下,那麼可根據所述當前幀編碼模式對所述當前幀的左右聲道信號進行分段時域下混處理。由於在所述當前幀和前一幀的下混模式不同的情況下引入了對所述當前幀的左右聲道信號進行分段時域下混處理的機制,分段時域下混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
可以理解,上述編碼方案中,需確定當前幀的聲道組合方案,且需根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,這就表示當前幀的聲道組合方案存在多種可能,當前幀的編碼模式存在多種可能,這相對於只有唯一一種聲道組合方案和唯一一種編碼模式的傳統方案而言,多種可能的聲道組合方案、多種編碼模式和多種可能場景之間有利於獲得更好的相容匹配效果,進而有利於提高編碼品質。
並且,由於引入了針對類反相信號對應的聲道組合方案,這使得對於當前幀的立體聲信號為類反相信號的情況,有了針對性相對更強的聲道組合方案和編碼模式,進而有利於提高編碼品質。
進一步的,由於針對相關性信號聲道組合方案和非相關性信號聲道組合方案分別引入了兩種不同的下混模式,通過合理設計對應的下混矩陣,有利於實現無切換位置要求的隨意性切換。
相應的,下面針對時域立體聲的解碼場景進行舉例說明。
參見圖3,下面還提供一種音訊解碼方法,音訊解碼方法的相關步驟可由解碼裝置來實施,方法具體可包括:
301、根據碼流進行解碼以得到當前幀的主次聲道解碼信號。
302、根據碼流進行解碼以確定所述當前幀的下混模式。
其中,例如編碼裝置在碼流中寫入了所述當前幀的下混模式標識(所述當前幀的下混模式標識指示出所述當前幀的下混模式),那麼根據碼流進行解碼可得到所述當前幀的下混模式標識,進而可基於解碼得到的所述當前幀的下混模式標識確定所述當前幀的下混模式。當然,解碼端也可基於編碼端的類似方式來確定所述當前幀的下混模式。或者基於碼流中包含的其它資訊確定當前幀的下混模式。
其中,前一幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
其中,當前幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述當前幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
可以理解,不同的下混矩陣對應不同的上混矩陣。
舉例來說,下混模式標識例如可包括至少兩個比特,例如當下混模式標識取值“00”時可表示所述當前幀的下混模式為下混模式A。例如當下混模式標識取值“01”時可以表示所述當前幀的下混模式為下混模式B,例如當下混模式標識取值“10”時可以表示所述當前幀的下混模式為下混模式C,例如當下混模式標識取值“11”時可以表示所述當前幀的下混模式為下混模式D。
可以理解,由於所述下混模式A和所述下混模式D為相關性信號下混模式,因此當基於解碼得到的所述當前幀的下混模式標識確定所述當前幀的下混模式為下混模式A或下混模式D時,也就可以確定當前幀的聲道組合方案為相關性聲道組合方案。
類似的,由於所述下混模式B和所述下混模式C為相關性信號下混模式,因此當基於解碼得到的所述當前幀的下混模式標識確定所述當前幀的下混模式為下混模式B或下混模式C時,也就可以確定當前幀的聲道組合方案為非相關性聲道組合方案。
303、根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的下混模式確定當前幀的編碼模式可能是下混模式切換型編碼模式或下混模式非切換型編碼模式。具體的,下混模式非切換型編碼模式可包括:下混模式A到下混模式A對應的編碼模式、下混模式B到下混模式B對應的編碼模式、下混模式C到下混模式C對應的編碼模式和下混模式D到下混模式D對應的編碼模式。
具體的,下混模式切換型編碼模式可包括:下混模式A切換到下混模式B對應的編碼模式、下混模式A切換到下混模式C對應的編碼模式、下混模式B切換到下混模式A對應的編碼模式、下混模式B切換到下混模式D對應的編碼模式、下混模式C切換到下混模式A對應的編碼模式、下混模式C切換到下混模式D對應的編碼模式、下混模式D切換到到下混模式B對應的編碼模式和下混模式D切換到到下混模式C對應的編碼模式。
具體例如,根據前一幀的下混模式和當前幀的下混模式確定所述當前幀的編碼模式,可包括:
若前一幀的下混模式為下混模式A,所述當前幀的下混模式A為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式C,確定所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式A,確定所述當前幀的編碼模式為從下混模式B到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式D,確定所述當前幀的編碼模式為從下混模式B到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式C到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式C到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式D到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式D到下混模式B對應的編碼模式。
304、根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
其中,左右聲道重建信號可為左右聲道解碼信號,或可通過將左右聲道重建信號進行時延調整處理和/或時域後處理以得到左右聲道解碼信號。
可以理解,下混模式和上混模式是對應的,編碼模式和解碼模式也是對應的。
例如,在所述當前幀和前一幀的下混模式不同的情況下,那麼可根據所述當前幀編碼模式對所述當前幀的主次聲道解碼信號進行分段時域上混處理。由於在所述當前幀和前一幀的下混模式不同的情況下引入了對所述當前幀的主次聲道解碼信號進行分段時域上混處理的機制,分段時域上混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
可以理解,上述解碼方案中,需根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,這就表示前一幀和當前幀的下混模式存在多種可能,當前幀的編碼模式存在多種可能,這相對於只有唯一一種下混模式和唯一一種編碼模式的傳統方案而言,多種可能的下混模式、多種編碼模式和多種可能場景之間有利於獲得更好的相容匹配效果,進而有利於提高編碼品質。
並且,由於引入了針對類反相信號對應的聲道組合方案,這使得對於當前幀的立體聲信號為類反相信號的情況,有了針對性相對更強的聲道組合方案和編碼模式,進而有利於提高編碼品質。
下面舉例編碼裝置確定當前幀的聲道組合方案的一些具體實現方式。編碼裝置確定當前幀的聲道組合方案的具體實現方式是多種多樣的。
其中,在所述當前幀和前一幀的下混模式不同的情況下,可確定當前幀的編碼模式例如可能為下混模式切換型編碼模式,那麼,可根據所述當前幀和前一幀的下混模式對所述當前幀的左右聲道信號進行分段時域下混處理。
由於在所述當前幀和前一幀的聲道組合方案不同的情況下引入了對所述當前幀的左右聲道信號進行分段時域下混處理的機制,分段時域下混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
在一些可能的實施方式中,確定當前幀的聲道組合方案可包括:利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型;利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案。其中,所述當前幀的立體聲信號的信號正反相類型可以是類正相信號或類反相信號。所述當前幀的立體聲信號的信號正反相類型可通過所述當前幀的信號正反相類型標識來指示。具體例如,當所述當前幀的信號正反相類型標識取值為“1”時,指示所述當前幀的立體聲信號的信號正反相類型為類正相信號,當所述當前幀的信號正反相類型標識取值為“0”時,指示所述當前幀的立體聲信號的信號正反相類型為類反相信號,反之亦可。
音訊幀(例如前一幀或當前幀)的聲道組合方案可通過所述音訊幀的聲道組合方案標識來指示。具體例如,當音訊幀的聲道組合方案標識取值為“0”時,指示該音訊幀的聲道組合方案為相關性信號聲道組合方案。當音訊幀的聲道組合方案標識取值為“1”時,指示該音訊幀的聲道組合方案為非相關性信號聲道組合方案,反之亦可。
其中,利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型可包括:計算所述當前幀的左右聲道信號之間的相關性值,在所述小於或者等於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類正相信號,在所述大於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類反相信號。進一步的,若利用所述當前幀的信號正反相類型標識來指示所述當前幀的立體聲信號的信號正反相類型,則在確定所述當前幀的立體聲信號的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類正相信號;那麼,在確定所述當前幀的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類反相信號。
其中,第一閾值的取值範圍例如可為[0.5,1.0),例如可等於0.5、0.85、0.75、0.65或0.81等。
具體例如,音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“0”時,指示該音訊幀的立體聲信號的信號正反相類型為類正相信號;音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“1”時,指示該音訊幀的立體聲信號的信號正反相類型為類反相信號,以此類推。
其中,利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案,例如可包括:
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;在所述當前幀的立體聲信號的信號正反相類型為類反相信號,且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,並且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類反相信號,並且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案。
其中,第二閾值的取值範圍例如可為[0.8,1.2],例如可等於0.8、0.85、0.9、1、1.1或1.18等。
可以理解,上述舉例中給出了確定當前幀的聲道組合方案的一些實施方式,但實際應用中也可能不限於上述舉例方式。
下面對各種下混模式切換代價函數進行舉例說明。其中,下混模式切換代價函數可為如下切換代價函數的其中一種:下混模式A切換到下混模式B的下混模式切換代價函數、下混模式A切換到下混模式C的下混模式切換代價函數、下混模式D切換到下混模式B的下混模式切換代價函數、下混模式D切換到下混模式C的下混模式切換代價函數、下混模式B切換到下混模式A的下混模式切換代價函數、下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切換代價函數、下混模式C切換到下混模式D的下混模式切換代價函數。例如,下混模式切換代價函數例如可基於如下參數的至少一種來構建:當前幀的至少一種時域立體聲參數(當前幀的至少一種時域立體聲參例如包括當前幀的聲道組合比例因數等)、前一幀的至少一種時域立體聲參數(前一幀的至少一種時域立體聲參例如包括前一幀的聲道組合比例因數等)和所述當前幀的左右聲道信號。
在實際應用中,切換代價函數的具體構建方式可以是多種多樣的,下面進行舉例說明。
其中,所述表示下混模式A切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
例如end_sample_A-start_sample_A的取值範圍可為[60,200],例如end_sample_A-start_sample_A等於60、69、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述表示下混模式A切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式B切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式B切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式C切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C。
例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述表示下混模式C切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C,例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式D切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述表示下混模式D切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
下面對當前幀的不同下混模式A對應的一些下混矩陣和上混矩陣進行舉例說明。
下面對前一幀的一些下混矩陣和上混矩陣進行舉例說明。
可以理解,上面對下混矩陣和上混矩陣形式的舉例都是示例性的,當然在實際應用中還可能存在其它形式的下混矩陣和上混矩陣。
下面進一步針對不同的編碼模式場景和對應解碼模式場景進行舉例說明。可以理解,不同的編碼模式所對應的時域下混處理方式通常不同。並且每種編碼模式也可能對應一種或多種時域下混處理方式。
下面先針針對當前幀和前一幀的下混模式相同的一些編解碼情況進行舉例說明。
首先,針對當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式的情況下的編碼場景和解碼場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在一些可能的編碼實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述表示所述當前幀的左聲道信號,所述表示所述當前幀的右聲道信號,所述表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述表示經時域下混處理而得到的所述當前幀的次要聲道信號;其中,所述n表示樣點序號。所述表示所述當前幀的下混模式A對應的下混矩陣。
其中,所述n表示樣點序號,所述表示所述當前幀的左聲道重建信號,所述表示所述當前幀的右聲道重建信號,所述表示所述當前幀的主要聲道解碼信號,所述表示所述當前幀的次要聲道解碼信號。所述表示所述當前幀的下混模式A對應的上混矩陣。
又例如,當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在另一些可能的編碼實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
所述delay_com表示編碼時延補償。
又例如,當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式B到下混模式B對應的編碼模式的場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式B到下混模式B對應的編碼模式,那麼,在一些可能實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述表示所述當前幀的左聲道信號,所述表示所述當前幀的右聲道信號,所述表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述表示經時域下混處理而得到的所述當前幀的次要聲道信號。其中,所述n表示樣點序號。所述表示所述當前幀的下混模式B對應的下混矩陣。
又例如,當前幀的編碼模式為下混模式B到下混模式B對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述n表示樣點序號,N表示幀長;所述delay_com表示編碼時延補償。
所述delay_com表示編碼時延補償。
又例如,當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式C到下混模式C對應的編碼模式的場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式,那麼,在一些可能實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述表示所述當前幀的左聲道信號,所述表示所述當前幀的右聲道信號,所述表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述表示經時域下混處理而得到的所述當前幀的次要聲道信號;其中,所述n表示樣點序號。所述表示所述當前幀的下混模式C對應的下混矩陣。
其中,所述n表示樣點序號,所述表示所述當前幀的左聲道重建信號,所述表示所述當前幀的右聲道重建信號,所述表示所述當前幀的主要聲道解碼信號,所述表示所述當前幀的次要聲道解碼信號。所述表示所述當前幀的下混模式A對應的上混矩陣。
又例如,當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
所述delay_com表示編碼時延補償。
又例如,當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式D到下混模式D對應的編碼模式的場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式,那麼,在一些可能實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述表示所述當前幀的左聲道信號,所述表示所述當前幀的右聲道信號,所述表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述表示經時域下混處理而得到的所述當前幀的次要聲道信號;其中,所述n表示樣點序號。所述表示所述當前幀的下混模式D對應的下混矩陣。
其中,所述n表示樣點序號,所述表示所述當前幀的左聲道重建信號,所述表示所述當前幀的右聲道重建信號,所述表示所述當前幀的主要聲道解碼信號,所述表示所述當前幀的次要聲道解碼信號。所述表示所述當前幀的下混模式D對應的上混矩陣。
又例如,當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
所述delay_com表示編碼時延補償。
又例如,當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對當前幀和前一幀的下混模式不同的一些編解碼情況進行舉例說明。例如,在所述當前幀和前一幀的下混模式不同的情況下,那麼編碼裝置可根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行分段時域上混處理。例如,在所述當前幀和前一幀的下混模式不同的情況下,那麼解碼編碼裝置可根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行分段時域上混處理。
下面先針對下混模式A到下混模式B對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式A到下混模式B對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式A到下混模式C對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式A到下混模式C對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式B到下混模式A對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式B到下混模式A對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式B到下混模式D對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式B到下混模式D對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式C到下混模式A對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式C到下混模式A對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述n表示樣點序號,N表示幀長。
下面針對下混模式C到下混模式D對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式C到下混模式D對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
下面針對下混模式D到下混模式C對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式D到下混模式C對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,所述n表示樣點序號,N表示幀長。
下面針對下混模式D到下混模式B對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式D到下混模式B對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
其中,上述舉例場景中,當前幀的左右聲道信號具體可以是當前幀的原始左右聲道信號(原始左右聲道信號是未經時域預處理的左右聲道信號,例如可以是採樣得到左右聲道信號),或者可是當前幀的經時域預處理的左右聲道信號;或者可以是當前幀的經時延對齊處理的左右聲道信號。
具體例如,或或其中,表示所述當前幀的原始左聲道信號,表示所述當前幀的原始右聲道信號;所述表示所述當前幀的經時域預處理的左聲道信號,所述表示所述當前幀的經時域預處理的右聲道信號;所述表示所述當前幀的經時延對齊處理的左聲道信號,所述表示所述當前幀的經時延對齊處理的右聲道信號。
上述場景舉例中示例性的給出了不同編碼模式下的時域上混和時域下混處理方式,當然在實際應用中還可採用類似上述舉例的其它方式進行時域上混處理和下混處理,本申請實施例並不限於上述舉例的那些時域上混和時域下混處理方式。
參見圖6,圖6是本申請實施例提供的一種音訊編碼模式確定方法的流程示意圖。一種音訊編碼模式確定方法的相關步驟可由編碼裝置來實施,例如可包括如下步驟:
601、確定當前幀的聲道組合方案。
其中,編碼裝置確定當前幀的聲道組合方案的具體實施方式可參考其它實施例的相關描述,此處不在贅述。
602、根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,編碼裝置根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實施方式可參考其它實施例的相關描述,此處不在贅述。
可以理解,上述編碼場景中,需確定當前幀的聲道組合方案,這就表示當前幀的聲道組合方案存在多種可能,相對於只有唯一一種聲道組合方案的傳統方案而言,多種可能的聲道組合方案和多種可能場景之間有利於獲得更好的相容匹配效果。
可以理解,上述編碼場景中,需根據根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
參見圖7,圖7是本申請實施例提供的一種音訊解碼模式確定方法的流程示意圖。一種音訊解碼模式確定方法的相關步驟可由解碼裝置來實施,例如可包括如下步驟:
701、根據碼流進行解碼以確定所述當前幀的下混模式。
例如根據碼流進行解碼以得到碼流中包含的所述當前幀的下混模式標識(當前幀的下混模式標識指示出當前幀的下混模式),基於得到的所述當前幀的下混模式標識確定所述當前幀的下混模式。
702、根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式的具體實施方式可參考其它實施例的相關描述,此處不在贅述。
可以理解,上述解碼場景中,需根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
下面對當前幀/前一幀的一些立體聲參數進行介紹。
在本申請的一些實施例中,當前幀的立體聲參數(例如聲道組合比例因數和/或聲道間時延差)可為固定值,也可基於當前幀的聲道組合方案(例如相關性信號聲道組合方案或者非相關性信號聲道組合方案)來確定。
參見圖8,下面舉例一種時域立體聲參數的確定方法,時域立體聲參數的確定方法的相關步驟可由編碼裝置來實施,方法具體可以包括:
801、確定當前幀的聲道組合方案。
802、根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數,所述時域立體聲參數包括聲道組合比例因數和聲道間時延差中的至少一種。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。
其中,例如所述多種聲道組合方案包括非相關性信號聲道組合方案和相關性信號聲道組合方案。
其中,所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
在確定所述當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,所述當前幀的時域立體聲參數為所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數;在確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,所述當前幀的時域立體聲參數為所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數。
可以理解,上述方案中需確定當前幀的聲道組合方案,這就表示當前幀的聲道組合方案存在多種可能,這相對於只有唯一一種聲道組合方案的傳統方案而言,多種可能的聲道組合方案和多種可能場景之間有利於獲得更好的相容匹配效果。由於是根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數,這使得時域立體聲參數和多種可能場景之間有利於獲得更好的相容匹配效果,進而有利於提升編解碼品質。
在一些可能實施方式中,可以先分別計算出當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數和當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。而後在確定當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定當前幀的時域立體聲參數為所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數;或者,在確定當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,確定當前幀的時域立體聲參數為所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數。或者,也可先計算出當前幀的相關性信號聲道組合方案對應的時域立體聲參數,在確定當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定當前幀的時域立體聲參數為所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數;而在確定當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,再計算所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數,將計算出的所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數,確認為當前幀的時域立體聲參數。
或者,也可先確定當前幀的聲道組合方案,在確定所述當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,計算所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數,那麼,當前幀的時域立體聲參數為當前幀的相關性信號聲道組合方案對應的時域立體聲參數。而在確定當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,計算所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數,那麼,當前幀的時域立體聲參數為當前幀的非相關性信號聲道組合方案對應的時域立體聲參數。
在一些可能實施方式中,根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數包括:根據所述當前幀的聲道組合方案,確定所述當前幀的聲道組合方案所對應的聲道組合比例因數初始值。在無需對所述當前幀的聲道組合方案(相關性信號聲道組合方案或非相關性信號聲道組合方法)對應的聲道組合比例因數的初始值進行修正的情況之下,所述當前幀的聲道組合方案對應的聲道組合比例因數,等於所述當前幀的聲道組合方案對應的聲道組合比例因數的初始值。在需對所述當前幀的聲道組合方案(相關性信號聲道組合方案或非相關性信號聲道組合方法)對應的聲道組合比例因數的初始值進行修正的情況之下,對所述當前幀的聲道組合方案對應的聲道組合比例因數的初始值進行修正,以得到所述當前幀的聲道組合方案對應的聲道組合比例因數的修正值,所述當前幀的聲道組合方案對應的聲道組合比例因數,等於所述當前幀的聲道組合方案對應的聲道組合比例因數的修正值。
舉例來說,所述根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數可以包括:根據所述當前幀左聲道信號計算所述當前幀的左聲道信號的幀能量;根據所述當前幀右聲道信號計算所述當前幀的右聲道信號的幀能量;根據所述當前幀左聲道信號的幀能量和右聲道信號的幀能量,計算所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值。
其中,在無需對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正的情況下,所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數初始值,所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值的編碼索引;
在需對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正的情況下,對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引進行修正,以得到所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值及其編碼索引,所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值;所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值的編碼索引。
其中,所述表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,所述表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值對應的編碼索引,所述表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值。
又例如,根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數包括:根據所述當前幀的左聲道信號和右聲道信號獲得所述當前幀的參考聲道信號;計算所述當前幀的左聲道信號與參考聲道信號之間的幅度相關性參數;計算所述當前幀的右聲道信號與參考聲道信號之間的幅度相關性參數;根據所述當前幀的左右聲道信號與參考聲道信號之間的幅度相關性參數,計算所述當前幀的左右聲道信號之間的幅度相關性差異參數;根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數,例如可包括:根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值;對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值進行修正,以得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。可以理解,當無需對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值進行修正時,那麼,所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數,等於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值。
其中,所述表示所述當前幀經時延對齊處理的左聲道信號;所述表示所述當前幀經時延對齊處理的右聲道信號。所述表示所述當前幀的左聲道信號與參考聲道信號之間的幅度相關性參數,所述表示所述當前幀的右聲道信號與參考聲道信號之間的幅度相關性參數。
在一些可能的實施方式中,所述根據所述當前幀的左右聲道信號與參考聲道信號之間的幅度相關性參數,計算所述當前幀的左右聲道信號之間的幅度相關性差異參數,包括:根據當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數;根據當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數;根據當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀左右聲道之間的幅度相關性差異參數。
其中,,所述A表示所述當前幀的左聲道信號的長時平滑幀能量的更新因數。所述表示所述當前幀的左聲道信號的長時平滑幀能量;其中,所述表示所述當前幀左聲道信號的幀能量。表示當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數。表示前一幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數。表示左聲道平滑因數。
其中,;所述B表示所述當前幀的右聲道信號的長時平滑幀能量的更新因數。所述表示所述當前幀的右聲道信號的長時平滑幀能量。其中,所述表示所述當前幀右聲道信號的幀能量。其中,表示所述當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。表示前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。表示右聲道平滑因數。
其中,表示所述當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,表示所述當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,所述表示所述當前幀左右聲道信號之間的幅度相關性差異參數。
在一些可能的實施方式中,所述根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數包括:對當前幀的左右聲道信號之間的幅度相關性差異參數進行映射處理,使映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的取值範圍在之間;將映射處理後的左右聲道信號之間的幅度相關性差異參數轉換為聲道組合比例因數。
在一些可能的實施方式中,對所述當前幀的左右聲道之間的幅度相關性差異參數進行映射處理包括:對所述當前幀的左右聲道信號之間的幅度相關性差異參數進行限幅處理;對經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數進行映射處理。
其中,表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最大值;表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的高門限;表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的低門限;表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最小值;
表示經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最大值,表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的高門限,表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的低門限,表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最小值;
其中,所述表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數。所述表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數,或所述表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值。
在本申請一些實施方式,在需進行聲道組合比例因數修正的場景,修正可以在編碼聲道組合比例因數之前或之後。具體例如,可先計算得到當前幀的聲道組合比例因數(例如非相關性信號聲道組合方案對應的聲道組合比例因數或者相關性信號聲道組合方案對應的聲道組合比例因數)的初始值,而後對聲道組合比例因數的初始值進行編碼,進而得到當前幀的聲道組合比例因數的初始編碼索引,而後再對得到的當前幀的聲道組合比例因數的初始編碼索引進行修正,進而得到當前幀的聲道組合比例因數的編碼索引(得到當前幀的聲道組合比例因數的編碼索引,也就相當於也得到了當前幀的聲道組合比例因數)。或者,也可以先計算得到當前幀的聲道組合比例因數的初始值,而後對計算得到當前幀的聲道組合比例因數的初始值進行修正,進而得到當前幀的聲道組合比例因數,而後在對得到的當前幀的聲道組合比例因數進行編碼,以得到當前幀的聲道組合比例因數的編碼索引。
其中,對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正的方式可以是多種多樣的,例如,在需要通過對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正,來得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的情況下,例如可以基於前一幀的聲道組合比例因數和所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值,來對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正;或者,也可基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值,對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正。
例如,首先,根據當前幀的左聲道信號的長時平滑幀能量、當前幀的右聲道信號的長時平滑幀能量、當前幀的左聲道信號的幀間能量差異、歷史緩存中的緩存前一幀的編碼參數(例如主要聲道信號的幀間相關性、次要聲道信號的幀間相關性)、當前幀以及前一幀的聲道組合方案標識、前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數以及當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值,確定是否需要對當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正。若是,則將前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;否則,將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
當然,通過對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正,來得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的具體實現方式並不限於上述舉例。
803、對確定的所述當前幀的時域立體聲參數進行編碼。
其中,所述表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書,所述表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,所述表示當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的量化編碼初始值。
其中,表示所述當前幀的非相關性信號聲道組合方案對應的初始編碼索引,表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數的最終編碼索引,其中,為非相關性信號聲道組合方案對應的聲道組合比例因數的修正因數。其中,所述表示當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
在一些可能的實施方式中,在需要通過對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正,來得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的情況下,還可以先所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行量化編碼,所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,然後可以基於前一幀的聲道組合比例因數的編碼索引和所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,來對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引進行修正;或者,也可基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引進行修正。
例如,可以是先將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行量化編碼,得到當前幀的非相關性信號聲道組合方案對應的初始編碼索引。然後在需要對當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正時,將前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引;否則,將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引。最後,將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引對應的量化編碼值作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
此外,在時域立體聲參數包括聲道間時間差的情況下,根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數可包括:在所述當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,計算所述當前幀的聲道間時間差。並且可將計算得到的所述當前幀的聲道間時間差寫入碼流。在所述當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下使用預設的聲道間時間差(例如0)作為所述當前幀的聲道間時間差。並且可不將默認的聲道間時間差寫入碼流,解碼裝置也使用預設的聲道間時間差。
此外,在另一些可能實施方式中,如果當前幀的聲道組合方案不同於前一幀的聲道組合方案(例如當前幀的聲道組合方案標誌不同於前一幀的聲道組合方案標誌)時,也可將當前幀的聲道組合比例因數的值置為前一幀的聲道組合比例因數的值;否則,可根據聲道組合方案以及時延對齊後的左右聲道信號,按照當前幀的聲道組合方案相對應的方法,提取並編碼當前幀的聲道組合比例因數。
下面還舉例提供一種時域立體聲參數的編碼方法,例如可以包括:確定當前幀的聲道組合方案;根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數;對確定的所述當前幀的時域立體聲參數進行編碼,所述時域立體聲參數包括聲道組合比例因數和聲道間時延差中的至少一種。
相應的,解碼裝置可從碼流中獲得當前幀的時域立體聲參數,進而基於從碼流中獲得的當前幀的時域立體聲參數來進行相關解碼。
下面通過一個更為具體的應用場景進行舉例說明。
參見圖9-A,圖9-A是本申請實施例提供的一種音訊編碼方法的流程示意圖。本申請實施例提供的一種音訊編碼方法可由編碼裝置來實施,方法具體可包括:
901、對當前幀的原始左右聲道信號進行時域預處理。
例如若立體聲音訊信號的取樣速率為16KHz,一幀信號為20ms,幀長記作N,當N=320是表示幀長為320個樣點。其中,當前幀的立體聲信號包括當前幀的左聲道信號和當前幀的右聲道信號。其中,當前幀的原始左聲道信號記作,當前幀的原始右聲道信號記作,n為樣點序號,。
例如,對當前幀的原始左右聲道信號進行時域預處理可包括:對當前幀的原始左右聲道信號進行高通濾波處理,得到當前幀經時域預處理的左右聲道信號,當前幀經時域預處理的左聲道信號記作,當前幀經時域預處理的的右聲道信號記作。其中,n為樣點序號。。其中,高通濾波處理採用的濾波器例如可為截止頻率為20Hz的無限脈衝回應濾波器(英文:Infinite Impulse Response,縮寫:IIR)濾波器,也可採用其他類型的濾波器。
其中,=0.994461788958195,= -1.988923577916390,=0.994461788958195,=1.988892905899653,= -0.988954249933127,z為Z變換的變換因數。
902、對當前幀經時域預處理的左右聲道信號進行時延對齊處理,得到當前幀經時延對齊處理的左右聲道信號。
其中,經時延對齊處理的信號可簡稱“時延對齊的信號”。例如經時延對齊處理的左聲道信號可簡稱“時延對齊的左聲道信號”,經時延對齊處理的右聲道信號可簡稱“時延對齊的左聲道信號”,以此類推。
具體地,可根據當前幀預處理後的左右聲道信號提取聲道間時延參數並編碼,根據編碼後的聲道間時延參數對左右聲道信號進行時延對齊處理,得到當前幀經時延對齊處理的左右聲道信號。其中,當前幀經時延對齊處理的左聲道信號記作,當前幀經時延對齊處理的右聲道信號記作,其中,n為樣點序號,。
具體例如,編碼裝置可根據當前幀預處理後的左右聲道信號計算左右聲道間的時域互相關函數。搜索左右聲道間的時域互相關函數的最大值(或其它值)以確定左右聲道信號間的時延差。對確定的左右聲道間的時延差進行量化編碼。根據量化編碼後的左右聲道間時延差,以左右聲道中選定的一個聲道的信號為基準,對另一個聲道的信號進行時延調整,從而獲得當前幀經時延對齊處理的左右聲道信號。
值得注意的是,時延對齊處理的具體實現方法有很多種,本申請實施例中對具體時延對齊處理方法不做限定。
903、對當前幀經時延對齊處理的左右聲道信號進行時域分析。
具體地,時域分析可以包括瞬態檢測等。其中,瞬態檢測可以是對分別當前幀經時延對齊處理的左右聲道信號進行能量檢測(具體可檢測當前幀是否發生能量突變)。例如,當前幀經時延對齊處理的左聲道信號的能量表示為,前一幀時延對齊後的左聲道信號的能量表示為,那麼可根據和之間的差值的絕對值來進行瞬態檢測,得到當前幀經時延對齊處理的左聲道信號的瞬態檢測結果。同理,可以用同樣的方法對當前幀經時延對齊處理的左聲道信號進行瞬態檢測。時域分析也可以包括除瞬態檢測之外的其他傳統方式的時域分析,例如可包括頻帶擴展預處理等。
可以理解,步驟903可在步驟902之後,在對當前幀的主要聲道信號編碼和次要聲道信號編碼之前的任意位置執行。
904、根據當前幀經時延對齊處理的左右聲道信號進行當前幀的聲道組合方案判決以確定當前幀的聲道組合方案。
本實施例中舉例兩種可能的聲道組合方案,以下描述中分別稱為相關性信號聲道組合方案和非相關性信號聲道組合方案。本實施例中,相關性信號聲道組合方案對應了當前幀(時延對齊後的)左右聲道信號為類正相信號的情況下,而非相關性信號聲道組合方案對應了當前幀(時延對齊後的)左右聲道信號為類反相信號的情況。當然,除了用“相關性信號聲道組合方案”和“非相關性信號聲道組合方案”來表徵這兩種可能的聲道組合方案之外,在實際應用中不限於用其他的名稱命名這兩種不同的聲道組合方案。
本實施例一些方案中,聲道組合方案判決可分為聲道組合方案初始判決和聲道組合方案修正判決。可以理解,通過進行當前幀的聲道組合方案判決,進而確定所述當前幀的聲道組合方案。其中,確定當前幀的聲道組合方案的一些舉例實施方式,可參考上述實施例的相關描述,此處不再贅述。
905、根據當前幀經時延對齊處理的左右聲道信號和當前幀的聲道組合方案標識,計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數並編碼,得到當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引。
具體例如,首先根據當前幀經時延對齊處理的左右聲道信號計算當前幀的左右聲道信號的幀能量。
量化編碼後的當前幀相關性信號聲道組合方案對應的聲道組合比例因數即為得到的當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值,編碼索引即為當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值對應的編碼索引。
例如,量化編碼為5比特的標量量化,則當時,將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值對應的編碼索引修正為某一預先設定值(例如15或其他取值);並且,可將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值修正為。
值得注意的是,除了上述計算方法,還可根據時域立體聲編碼傳統技術中任何一種計算聲道組合方案對應的聲道組合比例因數的方法,計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數。也可直接將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值設置為固定值(例如0.5或其他值)。
906、可根據聲道組合比例因數修正標識來判決是否需對聲道組合比例因數進行修正。
若是,則修正當前幀相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引,得到當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值及其編碼索引。
其中,當前幀的聲道組合比例因數修正標識記作。例如聲道組合比例因數修正標識取值為0,表示無需進行聲道組合比例因數的修正,聲道組合比例因數修正標識取值為1,表示需進行聲道組合比例因數的修正。當然聲道組合比例因數修正標識也可選用其它不同的取值來表示是否需進行聲道組合比例因數的修正。
例如,根據聲道組合比例因數修正標識判決是否需對聲道組合比例因數進行修正具體可包括:例如若聲道組合比例因數修正標識,則判決需對聲道組合比例因數進行修正。又例如若聲道組合比例因數修正標識,則判決無需對聲道組合比例因數進行修正。
其中,修正當前幀相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引具體可以包括:
907、根據當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引、當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值及其編碼索引、以及聲道組合比例因數修正標識,確定當前幀相關性信號聲道組合方案對應的聲道組合比例因數和編碼索引。
908、判斷當前幀的聲道組合方案標識是否對應非相關性信號聲道組合方案,若是則計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼,得到非相關性信號聲道組合方案對應的聲道組合比例因數和編碼索引。
首先,可判斷是否需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置。
例如若當前幀的聲道組合方案標識等於1(例如等於1表示當前幀的聲道組合方案標識對應非相關性信號聲道組合方案),而前一幀的聲道組合方案標識等於0(例如等於0表示當前幀的聲道組合方案標識對應相關性信號聲道組合方案),則表示需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置。
值得注意的是,判斷是否需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置,也可以通過在聲道組合方案初始判決和聲道組合方案修正判決的過程中確定歷史緩存重置標識,然後,通過判斷歷史緩存重置標識的取值來實現。例如為1,表示當前幀的聲道組合方案標識對應了非相關性信號聲道組合方案而前一幀的聲道組合方案標識對應了相關性信號聲道組合方案。例如歷史緩存重置標識等於1,表示需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置。具體的重置方法有很多種,可以是將計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中的所有參數均按照預先設定的初始值進行重置;或者也可以是將計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中的部分參數均按照預先設定的初始值進行重置;或者還可將計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中的部分參數均按照預先設定的初始值進行重置,而另一部分參數按照計算相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中對應的參數值進行重置。
接下來,進一步判斷當前幀的聲道組合方案標識是否對應非相關性信號聲道組合方案。其中,非相關性信號聲道組合方案是一種更加適合於對類反相立體聲信號進行時域下混的聲道組合方案。其中,在本實施例中,在當前幀的聲道組合方案標識時,表徵當前幀的聲道組合方案標識對應了非相關性信號聲道組合方案;在當前幀的聲道組合方案標識時,表徵當前幀的聲道組合方案標識對應了相關性信號聲道組合方案。
判斷當前幀的聲道組合方案標識是否對應非相關性信號聲道組合方案具體可包括:
判斷當前幀的聲道組合方案標識的值是否為1。若當前幀的聲道組合方案標識,表示當前幀的聲道組合方案標識對應非相關性信號聲道組合方案。在這種情況下,可計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼。
參見圖9-B,計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼例如可包括如下的步驟9081-9085。
9081、對當前幀經時延對齊處理的左右聲道信號進行信號能量分析。
分別得到當前幀左聲道信號的幀能量、當前幀右聲道信號的幀能量、當前幀左聲道的長時平滑幀能量、當前幀右聲道的長時平滑幀能量、當前幀左聲道的幀間能量差異和當前幀右聲道的幀間能量差異。
9082、根據當前幀經時延對齊處理的左右聲道信號確定當前幀的參考聲道信號。參考聲道信號也可被稱作單聲道信號,若將參考聲道信號稱作單聲道信號,則後續所有與參考聲道相關的描述和參數命名,則可以統一將參考聲道信號替換為單聲道信號。
9083、分別計算當前幀經時延對齊處理的左右聲道信號與參考聲道信號之間的幅度相關性參數。
可以理解,步驟9081可在步驟9082、9083之前執行,或者也可以在步驟9082、9083之後且在步驟9084之前執行。
90841、根據當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數,以及當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
例如一種計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,可包括:當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數滿足:。
其中,表示當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,表示前一幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,表示左聲道平滑因數,其中,可以是預先設定的0到1之間的實數,如0.2、0.5、0.8。或者,的取值也可以通過自我調整計算得到。
其中,表示當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,表示前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,表示右聲道平滑因數,其中,可以是預先設定的0到1之間的實數,可以和左聲道平滑因數取值相同或不同,例如可等於0.2、0.5、0.8。或者的取值也可以通過自我調整計算得到。
另一種計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數的方法,可包括:
首先,對當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數進行修正,得到修正後的當前幀左聲道信號與參考聲道信號之間的幅度相關性參數;對當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數進行修正,得到修正後的當前幀右聲道信號與參考聲道信號之間的幅度相關性參數。
然後,根據修正後的當前幀左聲道信號與參考聲道信號之間的幅度相關性參數和修正後的當前幀右聲道信號與參考聲道信號之間的幅度相關性參數,以及前一幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數和前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,確定當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
接下來,根據當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,獲得當前幀的左右聲道之間的幅度相關性差異參數的初始值;並根據獲得的當前幀的左右聲道之間的幅度相關性差異參數的初始值以及前一幀的左右聲道之間的幅度相關性差異參數,確定當前幀的左右聲道之間的幅度相關性差異的幀間變化參數。
最後,根據信號能量分析而獲得的當前幀左聲道信號的幀能量、當前幀右聲道信號的幀能量幀能量、當前幀左聲道的長時平滑幀能量、當前幀右聲道的長時平滑幀能量、當前幀左聲道的幀間能量差異、當前幀右聲道的幀間能量差異以及當前幀的左右聲道之間的幅度相關性差異的幀間變化參數,自我調整選擇不同的左聲道平滑因數、右聲道平滑因數,並計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數以及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
除以上舉例的兩種方法,還可以有很多種計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數的方法,本申請對此不作限定。
參見圖9-D,將當前幀左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數的一種可能方法具體可以包括步驟90851-90853。
對左右聲道之間的幅度相關性差異參數進行映射處理的一種方法可包括:
表示限幅後左右聲道之間的幅度相關性差異參數的最大值,表示限幅後左右聲道之間的幅度相關性差異參數的最小值。其中,例如為預先設定的經驗值,例如為1.5、3.0或其他值。其中,例如為預先設定的經驗值,例如為-1.5、-3.0或其他值。其中,。
其中,表示映射處理後的左右聲道之間的幅度相關性差異參數取值的最大值,表示映射處理後的左右聲道之間的幅度相關性差異參數取值的高門限,表示映射處理後的左右聲道之間的幅度相關性差異參數取值的低門限。表示映射處理後的左右聲道之間的幅度相關性差異參數取值的最小值。
表示限幅後左右聲道之間的幅度相關性差異參數的最大值,表示限幅後左右聲道之間的幅度相關性差異參數取值的高門限,表示限幅後左右聲道之間的幅度相關性差異參數取值的低門限,表示限幅後左右聲道之間的幅度相關性差異參數的最小值。
90852、將映射處理後的左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數。
除了上述方法之外,還可以通過其他方法將左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數,例如:
根據信號能量分析而獲得的當前幀左聲道的長時平滑幀能量、當前幀右聲道的長時平滑幀能量、當前幀左聲道的幀間能量差異、編碼器歷史緩存中的緩存前一幀的編碼參數(例如主要聲道信號的幀間相關性參數、次要聲道信號的幀間相關性參數)、當前幀以及前一幀的聲道組合方案標識、當前幀以及前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數,確定是否對非相關性信號聲道組合方案對應的聲道組合比例因數進行更新。
若需要對非相關性信號聲道組合方案對應的聲道組合比例因數進行更新,則使用上述舉例方法將左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數;否則,直接將前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引,作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引。
90853、對轉換後得到的聲道組合比例因數進行量化編碼,確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,量化編碼可以採用傳統技術中的任何一種標量量化方法,如均勻標量量化,也可以是非均勻標量量化,編碼比特數可以是5比特,這裡對具體方法不再贅述。非相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書可以採用和相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書相同或不同的碼書。其中,當碼書相同,這樣可只需要存儲一個用於聲道組合比例因數標量量化的碼書即可。此時,量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值。
例如,一種方法是將量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值直接作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數,並將當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引直接作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,即:
另一種方法可以是:根據前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引或者前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數,對量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值以及當前幀非相關性信號聲道組合方案對應的初始編碼索引進行修正,將修正後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,將修正後的非相關性信號聲道組合方案對應的聲道組合比例因數作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,表示當前幀非相關性信號聲道組合方案對應的初始編碼索引,為前一幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,為非相關性信號聲道組合方案對應的聲道組合比例因數的修正因數。的取值可為經驗值,例如可等於0.8。
此外,第四種方法是:根據前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數,對未量化的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數進行修正,將修正後的非相關性信號聲道組合方案對應的聲道組合比例因數,作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數,並對其進行量化編碼,得到當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引。
除以上述方法,還可以有很多種方法來將左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數並進行編碼量化,同樣也有很多不同的方法來確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引,本申請對此不作限定。
909、根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
具體例如,=0表示當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式;=1表示當前幀的編碼模式為下混模式A切換到下混模式B對應的編碼模式;=2表示當前幀的編碼模式為下混模式A切換到下混模式C對應的編碼模式。
又具體例如,=3表示當前幀的編碼模式為下混模式B到下混模式B對應的編碼模式。=4表示當前幀的編碼模式為下混模式B切換到下混模式A對應的編碼模式。=5表示當前幀的編碼模式為下混模式B切換到下混模式D對應的編碼模式。
又具體例如,=6表示當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式。=7表示當前幀的編碼模式為下混模式C切換到下混模式A對應的編碼模式。=8表示當前幀的編碼模式為下混模式C切換到下混模式D對應的編碼模式。
又具體例如,=9表示當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式。=10表示當前幀的編碼模式為下混模式D切換到下混模式B對應的編碼模式。=11表示當前幀的編碼模式為下混模式D切換到下混模式C對應的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實施方式可以參考其它實施例的相關描述,此處不再贅述。
其中,不同編碼模式進行時域下混處理的實施方式,可參考上述實施例中的相關舉例描述,此處不再贅述。
911、編碼裝置對主要聲道信號和次要聲道信號分別進行編碼,得到主要聲道編碼信號和次要聲道編碼信號。
具體地,可以先根據前一幀的主要聲道信號和/或次要聲道信號編碼中得到的參數資訊以及主要聲道信號編碼和次要聲道信號編碼的總比特數,對主要聲道信號編碼和次要聲道信號編碼進行比特分配。然後根據比特分配的結果,分別對主要聲道信號和次要聲道信號進行編碼,得到主要聲道編碼的編碼索引、次要聲道編碼的編碼索引。主要聲道編碼和次要聲道編碼,可以採用任何一種單聲道音訊編碼技術,這裡不再贅述。
具體例如,若當前幀的聲道組合方案標識對應了相關性信號聲道組合方案,則將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引寫入碼流;若當前幀的聲道組合方案標識對應了非相關性信號聲道組合方案,則將當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引寫入碼流。
相應的,下面針對時域立體聲的解碼場景進行舉例說明。
參見圖10,下面還提供一種音訊解碼方法,音訊解碼方法的相關步驟可由解碼裝置來具體實施,具體可包括:
1001、根據碼流進行解碼以得到當前幀的主次聲道解碼信號。
1002、根據碼流進行解碼以得到當前幀的時域立體聲參數。
其中,當前幀的時域立體聲參數包括當前幀的聲道組合比例因數(碼流包含的是當前幀的聲道組合比例因數的編碼索引,基於當前幀的聲道組合比例因數的編碼索引進行解碼可以得到當前幀的聲道組合比例因數),還可包括當前幀的聲道間時間差(例如,碼流包含的是當前幀的聲道間時間差的編碼索引,基於當前幀的聲道間時間差的編碼索引進行解碼可以得到當前幀的聲道間時間差;或者碼流包含的是當前幀的聲道間時間差的絕對值得編碼索引,基於當前幀的聲道間時間差的絕對值的編碼索引進行解碼可以得到當前幀的聲道間時間差的絕對值)等。
1003、基於碼流得到所述碼流中包含的當前幀的下混模式標識確定所述當前幀的下混模式。
1004、基於所述當前幀的下混模式和前一幀的下混模式確定當前幀的編碼模式。
例如當前幀的下混模式標識為(00),則表示當前幀的下混模式為下混模式A;當前幀的下混模式標識為(11),則表示當前幀的下混模式為下混模式B;當前幀的下混模式標識為(01),則表示當前幀的下混模式為下混模式C;當前幀的下混模式標識為(10),則表示當前幀的下混模式為下混模式D。
可以理解,步驟1001、步驟1002、步驟1003-1004的執行沒有必然的先後順序。
1005、根據確定的當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
其中,不同編碼模式進行時域上混處理的相關實施方式可參考上述實施例中的相關舉例描述,此處不再贅述。
其中,時域上混處理所使用的上混矩陣基於得到的當前幀的聲道組合比例因數構建。
其中,當前幀的左右聲道重建信號可作為所述當前幀的左右聲道解碼信號。
或者,進一步的,還可基於當前幀的聲道間時間差對當前幀的左右聲道重建信號進行時延調整,得到當前幀經時延調整的左右聲道重建信號,當前幀經時延調整的左右聲道重建信號可作為當前幀的左右聲道解碼信號。或者,進一步的,還可對當前幀經時延調整的左右聲道重建信號進行時域後處理,其中,當前幀經時域後處理的左右聲道重建信號可作為所述當前幀的左右聲道解碼信號。
上述詳細闡述了本申請實施例的方法,下面提供了本申請實施例的裝置。
參見圖11-A,本申請實施例還提供一種裝置1100,可包括:
相互耦合的處理器1110和記憶體1120。所述記憶體1110存儲有電腦程式;所述處理器1120調用所述記憶體存儲的電腦程式,用於執行本申請實施例提供的任意一種方法的部分或全部步驟。
記憶體1120包括但不限於是隨機存儲記憶體(英文:Random Access Memory,簡稱:RAM)、唯讀記憶體(英文:Read-Only Memory,簡稱:ROM)、可擦除可程式設計唯讀記憶體(英文:Erasable Programmable Read Only Memory,簡稱:EPROM)、或可擕式唯讀記憶體(英文:Compact Disc Read-Only Memory,簡稱:CD-ROM),該記憶體402用於相關指令及資料。
當然,裝置1100還可包括用於接收和發送資料的收發器1130。
處理器1110可以是一個或多個中央處理器(英文:Central Processing Unit,簡稱:CPU),在處理器1110是一個CPU的情況下,該CPU可以是單核CPU,也可以是多核CPU。處理器1110具體可以是數位訊號處理器。
在實現過程中,上述方法的各步驟可通過處理器1110中的硬體的集成邏輯電路或者軟體形式的指令完成。上述處理器1110可以是通用處理器、數位訊號處理器、專用積體電路、現成可程式設計閘陣列或者其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件。處理器1110可以實現或者執行本發明實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本發明實施例所公開的方法的步驟可以直接體現為硬體解碼處理器執行完成,或者用解碼處理器中的硬體及軟體模組組合執行完成。
軟體模組可以位於隨機記憶體,快閃記憶體、唯讀記憶體,可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、寄存器等等本領域成熟的存儲介質之中。該存儲介質位於記憶體1120,例如處理器1110可讀取記憶體1120中的資訊,結合其硬體完成上述方法的步驟。
進一步的,裝置1100還可包括收發器1130,收發器1130例如可用於相關資料(例如指令或聲道信號或碼流)的收發。
舉例來說,裝置1100可以執行上述圖2、圖3、圖6、圖7、圖8、圖10、圖9-A-圖9-D任意一附圖所示實施例中對應的方法的部分或全部步驟。具體例如,當裝置1100執行上述編碼的相關步驟時,裝置1100可稱為編碼裝置(或音訊編碼裝置)。當裝置1100執行上述解碼的相關步驟時,裝置1100可稱為解碼裝置(或音訊解碼裝置)。
參見圖11-B,在裝置1100為編碼裝置的情況下,裝置1100例如還可進一步包括:麥克風1140和類比數位轉換器1150等。
其中,麥克風1140例如可用於採樣得到類比音訊信號。
類比數位轉換器1150例如可用於將類比音訊信號轉換為數位音訊信號。
參見圖11-C,在裝置1100為解碼裝置的情況下,裝置1100例如還可進一步包括:揚聲器1160和數位類比轉換器1170等。
數位類比轉換器1170例如可用於將數位音訊信號轉換為類比音訊信號。
其中,揚聲器1160例如可用於播放類比音訊信號。
此外,參見圖12-A,本申請實施例提供一種裝置1200,包括用於實施本申請實施例提供的任意一種方法的若干個功能單元。
例如,當裝置1200執行圖2所示實施例中對應的方法時,裝置1200可包括: 第一確定單元1210,用於確定當前幀的聲道組合方案,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。 編碼單元1220,用於根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
此外參見圖12-B,裝置1200還可包括第二確定單元1230,用於確定當前幀的時域立體聲參數。編碼單元1220還可用於對當前幀的時域立體聲參數進行編碼。
又例如,參見圖12-C,當裝置1200執行圖3所示實施例中對應的方法時,裝置1200可包括:第三確定單元1240,用於根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
解碼單元1250,用於根據碼流進行解碼以得到當前幀的主次聲道解碼信號;根據碼流進行解碼以確定所述當前幀的下混模式,根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
這個裝置執行其他方法時的情況以此類推。
本申請實施例提供一種電腦可讀存儲介質,所述電腦可讀存儲介質存儲了程式碼,所述程式碼包括用於執行本申請實施例提供的任意一種方法的部分或全部步驟的指令。
本申請實施例提供一種電腦程式產品,當所述電腦程式產品在電腦上運行時,使得所述電腦執行本申請實施例提供的任意一種方法的部分或全部步驟。
在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。
在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置,可通過其它的方式實現。例如以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或元件可結合或者可以集成到另一個系統,或一些特徵可以忽略或不執行。另一點,所顯示或討論的相互之間的間接耦合或者直接耦合或通信連接可以是通過一些介面,裝置或單元的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例的方案的目的。
另外,在本發明各實施例中的各功能單元可集成在一個處理單元中,也可以是各單元單獨物理存在,也可兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,或者也可以採用軟體功能單元的形式實現。
所述集成的單元如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟體產品的形式體現出來,該電腦軟體產品存儲在一個存儲介質中,包括若干指令用以使得一台電腦設備(可為個人電腦、伺服器或者網路設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、唯讀記憶體(ROM,Read-Only Memory)、隨機存取記憶體(RAM,Random Access Memory)、移動硬碟、磁碟或者光碟等各種可以存儲程式碼的介質。
201‧‧‧確定當前幀的聲道組合方案202‧‧‧根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式203‧‧‧根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號,對得到的所述當前幀的主次聲道信號進行編碼301‧‧‧根據碼流進行解碼以得到當前幀的主次聲道解碼信號302‧‧‧根據碼流進行解碼以確定所述當前幀的下混模式303‧‧‧根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式304‧‧‧根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號下混模式A下混模式B下混模式C下混模式D滿足第一下混模式切換條件滿足第二下混模式切換條件滿足第三下混模式切換條件滿足第四下混模式切換條件滿足第五下混模式切換條件滿足第六下混模式切換條件滿足第七下混模式切換條件滿足第八下混模式切換條件滿足第九下混模式切換條件滿足第十下混模式切換條件滿足第十一下混模式切換條件滿足第十二下混模式切換條件滿足第十三下混模式切換條件滿足第十四下混模式切換條件滿足第十五下混模式切換條件滿足第十六下混模式切換條件601‧‧‧確定當前幀的聲道組合方案602‧‧‧根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式701‧‧‧根據碼流進行解碼以確定所述當前幀的下混模式702‧‧‧根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式801‧‧‧確定當前幀的聲道組合方案802‧‧‧根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數,所述時域立體聲參數包括聲道組合比例因數和聲道間時延差中的至少一種803‧‧‧對確定的所述當前幀的時域立體聲參數進行編碼901‧‧‧對當前幀的原始左右聲道信號進行時域預處理902‧‧‧對當前幀經時域預處理的左右聲道信號進行時延對齊處理,得到當前幀經時延對齊處理的左右聲道信號903‧‧‧對當前幀經時延對齊處理的左右聲道信號進行時域分析904‧‧‧根據當前幀經時延對齊處理的左右聲道信號進行當前幀的聲道組合方案判決以確定當前幀的聲道組合方案905‧‧‧計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引906‧‧‧根據聲道組合比例因數修正標識來判決是否需對聲道組合比例因數進行修正907‧‧‧確定當前幀相關性信號聲道組合方案對應的聲道組合比例因數和編碼索引908‧‧‧計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼909‧‧‧根據前一幀的聲道組合方案標識和當前幀的聲道組合方案標識進行編碼模式判決,以確定當前幀的編碼模式910‧‧‧根據當前幀的編碼模式採用對應的時域下混處理方法對當前幀的左右聲道信號進行時域下混處理,以得到當前幀的主要聲道信號和次要聲道信號911‧‧‧對主要聲道信號和次要聲道信號分別進行編碼,得到主要聲道編碼信號和次要聲道編碼信號912‧‧‧根據聲道組合方案標識選擇相應的聲道組合比例因數編碼索引寫入碼流,並將主要聲道編碼信號‧‧‧次要聲道編碼信號以及當前幀的下混模式標識寫入碼流9081‧‧‧對當前幀經時延對齊處理的左右聲道信號進行信號能量分析9082‧‧‧根據當前幀經時延對齊處理的左右聲道信號確定當前幀的參考聲道信號9083‧‧‧分別計算當前幀經時延對齊處理的左右聲道信號與參考聲道信號之間的幅度相關性參數9084‧‧‧計算當前幀左右聲道之間的幅度相關性差異參數9085‧‧‧將當前幀左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數並進行編碼量化90841‧‧‧計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數90842‧‧‧計算當前幀左右聲道之間的幅度相關性差異參數90851‧‧‧對左右聲道之間的幅度相關性差異參數進行映射處理90852‧‧‧將映射處理後的左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數90853‧‧‧對轉換後得到的聲道組合比例因數進行量化編碼,確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數1001‧‧‧根據碼流進行解碼以得到當前幀的主次聲道解碼信號1002‧‧‧基於碼流得到所述碼流中包含的當前幀的時域立體聲參數1003‧‧‧基於碼流得到所述碼流中包含的當前幀的下混模式標識確定所述當前幀的下混模式1004‧‧‧基於所述當前幀的下混模式和前一幀的下混模式確定當前幀的編碼模式
1005‧‧‧根據確定的當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號
1100、1200‧‧‧裝置
1110‧‧‧處理器
1120‧‧‧記憶體
1130‧‧‧收發器
1140‧‧‧麥克風
1150‧‧‧類比數位轉換器
1160‧‧‧揚聲器
1170‧‧‧數位類比轉換器
1210‧‧‧第一確定單元
1220‧‧‧編碼單元
1230‧‧‧第二確定單元
1240‧‧‧第三確定單元
1250‧‧‧解碼單元
下面將對本申請實施例或背景技術中所涉及的附圖進行說明。 圖1是本申請實施例提供的一種類反相信號的示意圖; 圖2是本申請實施例提供的一種音訊編碼方法的流程示意圖; 圖3是本申請實施例提供的一種音訊解碼模式確定方法的流程示意圖; 圖4是本申請實施例提供的一種下混模式切換的示意圖; 圖5是本申請實施例提供的淩一種下混模式切換的流程示意圖; 圖6是本申請實施例提供的一種音訊編碼模式確定方法的流程示意圖; 圖7是本申請實施例提供的另一種音訊編碼模式確定方法的流程示意圖; 圖8是本申請實施例提供的一種時域立體聲參數的確定方法的流程示意圖; 圖9-A是本申請實施例提供的另一種音訊編碼方法的流程示意圖; 圖9-B是本申請實施例提供的一種計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼的方法的流程示意圖; 圖9-C是本申請實施例提供的一種計算當前幀左右聲道之間的幅度相關性差異參數的方法的流程示意圖; 圖9-D是本申請實施例提供的一種將當前幀左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數的方法的流程示意圖; 圖10是本申請實施例提供的另一種音訊解碼方法的流程示意圖; 圖11-A是本申請實施例提供的一種裝置的示意圖; 圖11-B是本申請實施例提供的另一種裝置的示意圖; 圖11-C是本申請實施例提供的另一種裝置的示意圖; 圖12-A是本申請實施例提供的另一種裝置的示意圖; 圖12-B是本申請實施例提供的另一種裝置的示意圖; 圖12-C是本申請實施例提供的另一種裝置的示意圖。
201‧‧‧確定當前幀的聲道組合方案
202‧‧‧根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式
203‧‧‧根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號,對得到的所述當前幀的主次聲道信號進行編碼
Claims (58)
- 一種音訊編碼方法,其中,包括:確定一當前幀的一聲道組合方案;根據一前一幀的一下混模式和所述當前幀的聲道組合方案確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的一左右聲道信號進行一時域下混處理以得到所述當前幀的一主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
- 如申請專利範圍第1項所述的方法,其中所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種;所述多種聲道組合方案包括一非相關性信號聲道組合方案和一相關性信號聲道組合方案;所述相關性信號聲道組合方案為一類正相信號對應的聲道組合方案;所述非相關性信號聲道組合方案為一類反相信號對應的聲道組合方案。
- 如申請專利範圍第1項或第2項所述的方法,其中所述前一幀的下混模式為多種下混模式中的其中一種,其中,所述多種下混模式包括:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述下混模式A和所述下混模式D為相關性信號下混模式;所述下混模式B和所述下混模式C為非相關性信號下混模式;其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一下混矩陣互不相同。
- 如申請專利範圍第3項所述的方法,其中所述根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:根據所述前一幀的下混模式、所述當前幀的一下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
- 如申請專利範圍第4項所述的方法,其中所述當前幀的下混模式切換代價值為根據所述當前幀的一下混模式切換代價函數進行計算的計算結果;其中,所述下混模式切換代價函數基於如下參數的至少一種來構建:所述當前幀的一至少一種時域立體聲參數、所述前一幀的一至少一種時域立體聲參數和所述當前幀的左右聲道信號;或者,所述當前幀的下混模式切換代價值為所述當前幀的一聲道組合比例因數。
- 如申請專利範圍第5項所述的方法,其中,所述下混模式切換代價函數為如下切換代價函數的其中一種:所述下混模式A切換到下混模式B的下混模式切換代價函數、所述下混模式A切換到下混模式C的下混模式切換代價函數、所述下混模式D切換到下混模式B的下混模式切換代價函數、所述下混模式D切換到下混模式C的下混模式切換代價函數、所述下混模式B切換到下混模式A的下混模式切換代價函數、所述下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切 換代價函數、所述下混模式C切換到下混模式D的下混模式切換代價函數。
- 如申請專利範圍第6項所述的方法,其中,所述下混模式A切換到下混模式B的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式A切換到下混模式C的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式B切換到下混模式A的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式B切換到下混模式D的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式C切換到下混模式D的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式C切換到下混模式A的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式D切換到下混模式C的下混模式切換代價函數為:
- 如申請專利範圍第6項所述的方法,其中,所述下混模式D切換到下混模式B的下混模式切換代價函數為:
- 如申請專利範圍第3項所述的方法,其中,所述根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到所述下混模式A對應的所述編碼模式;或者,若前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到所述下混模式B對應的所述編碼模式;或者,若前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到所述下混模式C對應的所述編碼模式;或者, 若前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到所述下混模式D對應的所述編碼模式。
- 如申請專利範圍第4項至第14項任一項所述的方法,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第一下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,當前幀的編碼模式為從所述下混模式A切換到所述下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第一下混模式切換條件為所述當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從 下混模式A切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第二下混模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第三下混模式切換條件為所述當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第四下混模式切換條件為所述當前幀的下混模式B切換到下混模式A的切換代 價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第五下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第五下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值;或者若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第六下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值; 或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第七下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第七下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第八下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第八下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
- 如申請專利範圍第4項至第5項任一項所述的方法,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代 價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第九下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第九下混模式切換條件為當前幀的聲道組合比例因數小於或等於一聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第十下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十模式切換條件為所述當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的 下混模式切換代價值滿足一第十一下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,並且所述第十一下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S2;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十二模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S2;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且 所述第十三下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十四下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十五下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十五下混模式切換條件為所述當前幀的聲道組合比例因數小於或或等於一聲道組合比例因數閾值S4;或者, 若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價函數值為所述當前幀的聲道組合比例因數,且所述第十六下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S4。
- 一種音訊解碼方法,其中,包括:根據一碼流進行解碼以得到一當前幀的一主次聲道解碼信號;根據所述碼流進行解碼以確定所述當前幀的一下混模式;根據所述前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行一時域上混處理以得到所述當前幀的一左右聲道重建信號。
- 如申請專利範圍第22項所述的方法,其中,所述前一幀的下混模式為如下多種下混模式中的其中一種:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述前一幀 的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一上混矩陣互不相同;所述當前幀的下混模式為如下多種下混模式中的其中一種:所述下混模式A、所述下混模式B、所述下混模式C和所述下混模式D;其中,所述當前幀的下混模式A、所述當前幀的下混模式B、所述當前幀的下混模式C和所述當前幀的下混模式D對應的上混矩陣互不相同;其中,所述下混模式A和所述下混模式D為一相關性信號下混模式;所述下混模式B和所述下混模式C為一非相關性信號下混模式。
- 如申請專利範圍第23項所述的方法,其中,所述根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的下混模式A為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式A切換到下混模式B對應的編碼模式;或者, 若所述前一幀的下混模式為所述下混模式A,所述當前幀的為下混模式C,確定所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;或者,若前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到下混模式B對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式B到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式B到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到下混模式C對應的編碼模式;或者, 若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式C到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式C到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式D到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式D到下混模式B對應的編碼模式。
- 一種音訊編碼裝置,其中,包括:相互耦合的一處理器和一記憶體,其中,所述記憶體存儲有一電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行如下步驟:確定一當前幀的一聲道組合方案;根據所述前一幀的一下混模式和所述當前幀的聲道組合方案確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的一左右聲道信號進行一時域下混處理以得到所述當前幀的一主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
- 如申請專利範圍第29項所述的裝置,其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種;所述多種聲道組合方案包括一非相關性信號聲道組合方案和一相關性信號聲道組合方案;所述相關性信號聲道組合方案為一類正相信號對應的聲道組合方案;所述非相關性信號聲道組合方案為一類反相信號對應的聲道組合方案。
- 如申請專利範圍第29項或第30項所述的裝置,其中,所述前一幀的下混模式為多種下混模式中的其中一種,其中,所述多種下混模式包括:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述下混模式A和所述下混模式D為一相 關性信號下混模式;所述下混模式B和所述下混模式C為一非相關性信號下混模式;其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一下混矩陣互不相同。
- 如申請專利範圍第31項所述的裝置,其中,所述根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:根據所述前一幀的下混模式、所述當前幀的一下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
- 如申請專利範圍第32項所述的裝置,其中,所述當前幀的下混模式切換代價值為根據所述當前幀的一下混模式切換代價函數進行計算的計算結果;其中,所述下混模式切換代價函數基於如下參數的至少一種來構建:所述當前幀的一至少一種時域立體聲參數、所述前一幀的一至少一種時域立體聲參數和所述當前幀的左右聲道信號;或者,所述當前幀的下混模式切換代價值為所述當前幀的一聲道組合比例因數。
- 如申請專利範圍第33項所述的裝置,其中,所述下混模式切換代價函數為如下切換代價函數的其中一種:所述下混模式A切換到下混模式B的下混模式切換代價函數、所述下混模式A切換到下混模式C的下混模式切換代價函數、所述下混模式D切換 到下混模式B的下混模式切換代價函數、所述下混模式D切換到下混模式C的下混模式切換代價函數、所述下混模式B切換到下混模式A的下混模式切換代價函數、所述下混模式B切換到下混模式D的下混模式切換代價函數、所述下混模式C切換到下混模式A的下混模式切換代價函數、所述下混模式C切換到下混模式D的下混模式切換代價函數。
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式A切換到下混模式B的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式A切換到下混模式C的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式B切換到下混模式A的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式B切換到下混模式D的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式C切換到下混模式D的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式C切換到下混模式A的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式D切換到下混模式C的下混模式切換代價函數為:
- 如申請專利範圍第34項所述的裝置,其中,所述下混模式D切換到下混模式B的下混模式切換代價函數為:
- 如申請專利範圍第31項所述的裝置,其中,所述根據前一幀的聲道組合方案和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到下混模式B對應的編碼模式;或者, 若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到下混模式D對應的編碼模式。
- 如申請專利範圍第32項至第42項任一項所述的裝置,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第一下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從所述下混模式A切換到下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第一下混模式切換條件為所述當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值; 或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從所述下混模式A切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第二下混模式切換條件為所述當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從所述下混模式B切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第三下混模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值;或者, 若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從所述下混模式B切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第四下混模式切換條件為所述當前幀的下混模式B切換到下混模式A的切換代價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第五下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從所述下混模式C切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第五下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值;或者若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的 下混模式切換代價值滿足一第六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從所述下混模式C切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第六下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第七下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第七下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第八下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為 從下混模式D切換到下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第八下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
- 如申請專利範圍第32項至第33項任一項所述的裝置,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第九下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第九下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於一聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第十下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從 所述下混模式A切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十一下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,所述當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,並且所述第十一下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S2;或者,若所述前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從所述下混模式B切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十二下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S2; 或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十三下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十四下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十五下混模式切換條件,則確定 所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十五下混模式切換條件為所述當前幀的聲道組合比例因數小於或或等於一聲道組合比例因數閾值S4;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價函數值為所述當前幀的聲道組合比例因數,且所述第十六下混模式切換條件為當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S4。
- 一種音訊解碼裝置,其中,包括:相互耦合的一處理器和一記憶體,其中,所述記憶體存儲有一電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行如下步驟:根據一碼流進行解碼以得到一當前幀的一主次聲道解碼信號;根據所述碼流進行解碼以得到所述當前幀的一下混模式; 根據一前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的一主次聲道解碼信號進行一時域上混處理以得到所述當前幀的一左右聲道重建信號。
- 如申請專利範圍第50項所述的裝置,其中,所述前一幀的下混模式為如下多種下混模式中的其中一種:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一上混矩陣互不相同;所述前當幀的下混模式為如下多種下混模式中的其中一種:所述下混模式A、所述下混模式B、所述下混模式C和所述下混模式D;其中,所述當前幀的下混模式A、所述當前幀的下混模式B、所述當前幀的下混模式C和所述當前幀的下混模式D對應的上混矩陣互不相同;其中,所述下混模式A和所述下混模式D為一相關性信號下混模式;所述下混模式B和所述下混模式C為一非相關性信號下混模式。
- 如申請專利範圍第51項所述的裝置,其中,所述根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述 當前幀的下混模式A為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為下混模式A,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從所述下混模式A切換到下混模式B對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從所述下混模式A切換到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到下混模式B對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從所述下混模式B到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式B到下混模式D對應的編碼模式; 或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式C到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式C到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式D到下混模式C對應的編碼模式;或者, 若所述前一幀的下混模式為下混模式D,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式D到下混模式B對應的編碼模式。
- 一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了一程式碼,所述程式碼包括用於執行申請專利範圍第1項至第21項任一項所述方法的指令。
- 一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了一程式碼,所述程式碼包括用於執行申請專利範圍第22項至第28項任一項所述方法的指令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??201711244330.5 | 2017-11-30 | ||
CN201711244330.5A CN109859766B (zh) | 2017-11-30 | 2017-11-30 | 音频编解码方法和相关产品 |
CN201711244330.5 | 2017-11-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201926318A TW201926318A (zh) | 2019-07-01 |
TWI705432B true TWI705432B (zh) | 2020-09-21 |
Family
ID=66663812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107126918A TWI705432B (zh) | 2017-11-30 | 2018-08-02 | 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11393482B2 (zh) |
EP (1) | EP3703050B1 (zh) |
JP (1) | JP7088450B2 (zh) |
KR (1) | KR102437451B1 (zh) |
CN (1) | CN109859766B (zh) |
BR (1) | BR112020010850A2 (zh) |
TW (1) | TWI705432B (zh) |
WO (1) | WO2019105436A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7207578B2 (ja) * | 2019-07-10 | 2023-01-18 | 日本電気株式会社 | 話者埋め込み装置、方法、およびプログラム |
CN112751792B (zh) * | 2019-10-31 | 2022-06-10 | 华为技术有限公司 | 一种信道估计方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101218628A (zh) * | 2005-07-11 | 2008-07-09 | Lg电子株式会社 | 编码和解码音频信号的装置和方法 |
TWI342718B (en) * | 2006-03-24 | 2011-05-21 | Coding Tech Ab | Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program |
CN102089809A (zh) * | 2008-06-13 | 2011-06-08 | 诺基亚公司 | 用于提供改进的音频处理的方法、装置及计算机程序产品 |
TWI344638B (en) * | 2006-01-19 | 2011-07-01 | Lg Electronics Inc | Method and apparatus for processing a media signal |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
CN101630509B (zh) * | 2008-07-14 | 2012-04-18 | 华为技术有限公司 | 一种编解码方法、装置及系统 |
WO2010036060A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
US9536529B2 (en) * | 2010-01-06 | 2017-01-03 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
ES2555136T3 (es) * | 2012-02-17 | 2015-12-29 | Huawei Technologies Co., Ltd. | Codificador paramétrico para codificar una señal de audio multicanal |
CN104240712B (zh) * | 2014-09-30 | 2018-02-02 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
DK3353779T3 (da) * | 2015-09-25 | 2020-08-10 | Voiceage Corp | Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal |
US10210871B2 (en) * | 2016-03-18 | 2019-02-19 | Qualcomm Incorporated | Audio processing for temporally mismatched signals |
CN109389987B (zh) * | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
-
2017
- 2017-11-30 CN CN201711244330.5A patent/CN109859766B/zh active Active
-
2018
- 2018-08-02 TW TW107126918A patent/TWI705432B/zh active
- 2018-11-29 WO PCT/CN2018/118301 patent/WO2019105436A1/zh unknown
- 2018-11-29 EP EP18884568.9A patent/EP3703050B1/en active Active
- 2018-11-29 BR BR112020010850-2A patent/BR112020010850A2/pt unknown
- 2018-11-29 JP JP2020529337A patent/JP7088450B2/ja active Active
- 2018-11-29 KR KR1020207017982A patent/KR102437451B1/ko active IP Right Grant
-
2020
- 2020-05-29 US US16/887,878 patent/US11393482B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101218628A (zh) * | 2005-07-11 | 2008-07-09 | Lg电子株式会社 | 编码和解码音频信号的装置和方法 |
TWI344638B (en) * | 2006-01-19 | 2011-07-01 | Lg Electronics Inc | Method and apparatus for processing a media signal |
TWI342718B (en) * | 2006-03-24 | 2011-05-21 | Coding Tech Ab | Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program |
CN102089809A (zh) * | 2008-06-13 | 2011-06-08 | 诺基亚公司 | 用于提供改进的音频处理的方法、装置及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
KR102437451B1 (ko) | 2022-08-30 |
EP3703050A1 (en) | 2020-09-02 |
CN109859766A (zh) | 2019-06-07 |
EP3703050B1 (en) | 2024-01-03 |
BR112020010850A2 (pt) | 2020-11-10 |
JP2021504759A (ja) | 2021-02-15 |
TW201926318A (zh) | 2019-07-01 |
US20200294513A1 (en) | 2020-09-17 |
US11393482B2 (en) | 2022-07-19 |
CN109859766B (zh) | 2021-08-20 |
EP3703050A4 (en) | 2020-12-30 |
WO2019105436A1 (zh) | 2019-06-06 |
JP7088450B2 (ja) | 2022-06-21 |
KR20200090856A (ko) | 2020-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI697892B (zh) | 音訊編解碼模式確定方法和相關產品 | |
TWI689210B (zh) | 時域身歷聲編解碼方法和相關產品 | |
TWI705432B (zh) | 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 | |
KR102380454B1 (ko) | 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품 | |
JP2023129450A (ja) | 時間領域ステレオパラメータ符号化方法および関連製品 | |
RU2772405C2 (ru) | Способ стереокодирования и декодирования во временной области и соответствующий продукт |