TWI705432B - 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 - Google Patents

音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 Download PDF

Info

Publication number
TWI705432B
TWI705432B TW107126918A TW107126918A TWI705432B TW I705432 B TWI705432 B TW I705432B TW 107126918 A TW107126918 A TW 107126918A TW 107126918 A TW107126918 A TW 107126918A TW I705432 B TWI705432 B TW I705432B
Authority
TW
Taiwan
Prior art keywords
mode
current frame
downmix
downmix mode
channel combination
Prior art date
Application number
TW107126918A
Other languages
English (en)
Other versions
TW201926318A (zh
Inventor
李海婷
王賓
苗磊
Original Assignee
華為技術有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 華為技術有限公司 filed Critical 華為技術有限公司
Publication of TW201926318A publication Critical patent/TW201926318A/zh
Application granted granted Critical
Publication of TWI705432B publication Critical patent/TWI705432B/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申請實施例公開了音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質。一種音訊編碼方法,包括:確定當前幀的聲道組合方案;根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式;根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。本申請實施例提供的技術方案有利於提高編碼品質。

Description

音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質
本發明涉及音訊編解碼技術領域,尤其涉及音訊編解碼方法和相關產品。
隨著生活品質的提高,人們對高品質音訊的需求不斷增大。相對於單聲道音訊,立體聲音訊具有各聲源的方位感和分佈感,能夠提高資訊的清晰度、可懂度和臨場感,因而備受人們青睞。
參數立體聲編解碼技術通過將立體聲信號轉換為單聲道信號和空間感知參數,對多聲道信號進行壓縮處理,是一種常見的立體聲編解碼技術。但是由於參數立體聲編解碼技術通常需要在頻域提取空間感知參數,需進行時頻變換,使得整個轉碼器的時延相對較大。因此在時延要求較嚴格的情況下,時域立體聲編碼技術,是一種更好的選擇。
傳統時域立體聲編碼技術是在時域將信號下混為兩路單聲道信號,例如MS編碼技術先將左右聲道信號下混為中央通道(Mid channel)信號和邊通道(Side channel)信號。例如L表示左聲道信號,R表示右聲道信號,則Mid channel信號為0.5*(L+R),Mid channel信號表徵了左右兩個聲道之間的相關資訊;Side channel信號為0.5*(L-R),Side channel信號表徵了左右兩個聲道之間的差異資訊。然後,分別對Mid channel信號和Side channel信號採用單聲道編碼方法編碼,對於Mid channel信號,通常用相對較多比特數進行編碼;對於Side channel信號,通常用相對較少比特數進行編碼。
本申請發明人研究和實踐發現,採用傳統時域立體聲編碼技術有時候出現主要信號能量特別小甚至能量缺失的現象,進而導致最終編碼品質下降。
本申請實施例提供音訊編解碼方法和相關產品。
第一方面,本申請實施例提供了一種音訊編碼方法,包括:確定當前幀的聲道組合方案;根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式;根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
其中,當前幀的立體聲信號例如由當前幀的左右聲道信號組成。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。例如所述多種聲道組合方案包括非相關性信號聲道組合方案和相關性信號聲道組合方案。其中,所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。
可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
其中,音訊幀(例如前一幀/當前幀)的下混模式為多種下混模式中的其中一種,其中,所述多種下混模式包括:下混模式A、下混模式B、下混模式C和下混模式D;其中,所述下混模式A和所述下混模式D為相關性信號下混模式;所述下混模式B和所述下混模式C為非相關性信號下混模式;其中,所述音訊幀的下混模式A、所述音訊幀的下混模式B、所述音訊幀的下混模式C和所述音訊幀的下混模式D對應的下混矩陣互不相同。
可以理解,由於下混矩陣和上混矩陣是對應的,因此,所述音訊幀的下混模式A、所述音訊幀的下混模式B、所述音訊幀的下混模式C和所述音訊幀的下混模式D對應的上混矩陣也互不相同。
可以理解,上述編碼方案中,需根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,因此,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
此外,第二方面,本申請實施例提供了一種音訊編碼模式確定方法,可以包括:確定當前幀的聲道組合方案;根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,所述當前幀的編碼模式為多種編碼模式中的其中一種。例如所述多種編碼模式可包括:下混模式切換型編碼模式和下混模式非切換型編碼模式等。
具體的,下混模式非切換型編碼模式可包括:下混模式A到下混模式A對應的編碼模式、下混模式B到下混模式B對應的編碼模式、下混模式C到下混模式C對應的編碼模式和下混模式D到下混模式D對應的編碼模式。
具體的,下混模式切換型編碼模式可包括:下混模式A切換到下混模式B對應的編碼模式、下混模式A切換到下混模式C對應的編碼模式、下混模式B切換到下混模式A對應的編碼模式、下混模式B切換到下混模式D對應的編碼模式、下混模式C切換到下混模式A對應的編碼模式、下混模式C切換到下混模式D對應的編碼模式、下混模式D切換到到下混模式B對應的編碼模式和下混模式D切換到到下混模式C對應的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實施方式可以是多種多樣的。
例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可以包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。
又例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可包括:根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,所述當前幀的下混模式切換代價值例如可為根據所述當前幀的下混模式切換代價函數進行計算的計算結果(例如結果越大表示切換代價越大);其中,所述下混模式切換代價函數基於如下參數的至少一種來構建:所述當前幀的至少一種時域立體聲參數、所述前一幀的至少一種時域立體聲參數和所述當前幀的左右聲道信號。
或者,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數。
其中,下混模式切換代價函數例如為如下切換代價函數的其中一種:下混模式A切換到下混模式B的下混模式切換代價函數、下混模式A切換到下混模式C的下混模式切換代價函數、下混模式D切換到下混模式B的下混模式切換代價函數、下混模式D切換到下混模式C的下混模式切換代價函數、下混模式B切換到下混模式A的下混模式切換代價函數、下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切換代價函數、下混模式C切換到下混模式D的下混模式切換代價函數等。
在一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,具體可包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第一下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第一模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值;或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第二下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第二模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第三下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第三模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第四下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第四模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第五下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第五模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第六下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第六模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第七下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第七模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第八下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第八模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
在另一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,例如可包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第九下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第九模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S1;或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第十下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S1;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十一下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,並且所述第十一模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S2;或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十二下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十二模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S2;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十三下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十三模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S3;或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十四下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十四模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S3;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十五下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十五模式切換條件為當前幀的聲道組合比例因數小於或或等於聲道組合比例因數閾值S4;或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十六下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價函數值為當前幀的聲道組合比例因數,且所述第十六模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S4。
其中,在所述當前幀和前一幀的下混模式不同的情況下,可確定當前幀的編碼模式例如可能為下混模式切換型編碼模式,那麼,可根據所述當前幀和前一幀的下混模式對所述當前幀的左右聲道信號進行分段時域下混處理。
由於在所述當前幀和前一幀的聲道組合方案不同的情況下引入了對所述當前幀的左右聲道信號進行分段時域下混處理的機制,分段時域下混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
在一些可能的實施方式中,確定當前幀的聲道組合方案可包括:利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型;利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案。其中,所述當前幀的立體聲信號的信號正反相類型可以是類正相信號或類反相信號。所述當前幀的立體聲信號的信號正反相類型可通過所述當前幀的信號正反相類型標識來指示。具體例如,當所述當前幀的信號正反相類型標識取值為“1”時,指示所述當前幀的立體聲信號的信號正反相類型為類正相信號,當所述當前幀的信號正反相類型標識取值為“0”時,指示所述當前幀的立體聲信號的信號正反相類型為類反相信號,反之亦可。
音訊幀(例如前一幀或當前幀)的聲道組合方案可通過所述音訊幀的聲道組合方案標識來指示。具體例如,當音訊幀的聲道組合方案標識取值為“0”時,指示該音訊幀的聲道組合方案為相關性信號聲道組合方案。當音訊幀的聲道組合方案標識取值為“1”時,指示該音訊幀的聲道組合方案為非相關性信號聲道組合方案,反之亦可。
其中,利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型可包括:計算所述當前幀的左右聲道信號之間的相關性值
Figure 02_image001
,在所述
Figure 02_image003
小於或者等於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類正相信號,在所述
Figure 02_image003
大於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類反相信號。進一步的,若利用所述當前幀的信號正反相類型標識來指示所述當前幀的立體聲信號的信號正反相類型,則在確定所述當前幀的立體聲信號的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類正相信號;那麼,在確定所述當前幀的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類反相信號。
具體例如,音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“0”時,指示該音訊幀的立體聲信號的信號正反相類型為類正相信號;音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“1”時,指示該音訊幀的立體聲信號的信號正反相類型為類反相信號,以此類推。
其中,利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案,例如可包括:
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;在所述當前幀的立體聲信號的信號正反相類型為類反相信號,且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,並且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類反相信號,並且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案。
協力廠商面,本申請實施例還提供一種音訊解碼方法,包括:根據碼流進行解碼以得到當前幀的主次聲道解碼信號;根據碼流進行解碼以確定所述當前幀的下混模式;根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式;根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。例如所述多種聲道組合方案包括非相關性信號聲道組合方案和相關性信號聲道組合方案。所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
可以理解,由於時域下混和時域上混是對應的,編碼和解碼是對應的,因此,可根據當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理(其中,時域上混處理所使用的上混矩陣與編碼裝置時域下混所使用的下混矩陣是對應的)以得到所述當前幀的左右聲道重建信號。
在一些可能的實施方式中,所述根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,可包括:若前一幀的下混模式為下混模式A,所述當前幀的下混模式A為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式C,確定所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式A,確定所述當前幀的編碼模式為從下混模式B到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式D,確定所述當前幀的編碼模式為從下混模式B到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式C到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式C到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式D到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式D到下混模式B對應的編碼模式。
可以理解,上述解碼方案中,需根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
第四方面,本申請實施例還提供一種音訊編碼模式確定方法,包括:根據碼流進行解碼以得到當前幀的主次聲道解碼信號;根據碼流進行解碼以確定所述當前幀的下混模式;根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
下面對各種下混模式切換代價函數進行舉例說明。在實際應用中,切換代價函數的具體構建方式可以是多種多樣的,並不一定限於下面的舉例形式。
舉例來說,當前幀的下混模式A切換到下混模式B的下混模式切換代價函數可為:
Figure 02_image004
Figure 02_image006
其中,所述
Figure 02_image008
表示下混模式A切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
例如end_sample_A-start_sample_A的取值範圍可為[60,200],例如end_sample_A-start_sample_A等於60、69、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,
Figure 02_image018
;所述
Figure 02_image020
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式A切換到下混模式C的下混模式切換代價函數可為:
Figure 02_image022
Figure 02_image006
其中,所述
Figure 02_image024
表示下混模式A切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image026
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式B切換到下混模式A的下混模式切換代價函數為:
Figure 02_image028
Figure 02_image006
其中,所述
Figure 02_image030
表示下混模式B切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式B切換到下混模式D的下混模式切換代價函數可為:
Figure 02_image040
Figure 02_image006
其中,所述
Figure 02_image042
表示下混模式B切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式C切換到下混模式D的下混模式切換代價函數可為:
Figure 02_image044
Figure 02_image006
其中,所述
Figure 02_image046
表示下混模式C切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C。
例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號。
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式C切換到下混模式A的下混模式切換代價函數可為:
Figure 02_image048
Figure 02_image006
其中,所述
Figure 02_image050
表示下混模式C切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C,
例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式D切換到下混模式C的下混模式切換代價函數可為:
Figure 02_image052
Figure 02_image006
其中,所述
Figure 02_image054
表示下混模式D切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image026
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式D切換到下混模式B的下混模式切換代價函數為:
Figure 02_image057
Figure 02_image059
其中,所述
Figure 02_image061
表示下混模式D切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,
Figure 02_image026
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
下面對當前幀的不同下混模式A對應的一些下混矩陣和上混矩陣進行舉例說明。
例如,
Figure 02_image063
表示當前幀的下混模式A對應的下混矩陣,所述
Figure 02_image065
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。那麼,例如:
Figure 02_image066
或者
Figure 02_image068
其中,
Figure 02_image070
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image071
表示當前幀的下混模式A對應的下混矩陣
Figure 02_image063
對應的上混矩陣,所述
Figure 02_image071
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image073
或者
Figure 02_image075
例如,所述
Figure 02_image077
表示當前幀的下混模式B對應的下混矩陣。所述
Figure 02_image077
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image079
Figure 02_image081
其中,
Figure 02_image014
Figure 02_image083
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image085
表示當前幀的下混模式B對應的下混矩陣
Figure 02_image077
對應的上混矩陣,所述
Figure 02_image085
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image087
Figure 02_image089
其中,
Figure 02_image014
Figure 02_image083
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image091
表示當前幀的下混模式C對應的下混矩陣;所述
Figure 02_image091
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image093
Figure 02_image095
其中,
Figure 02_image097
Figure 02_image083
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image098
表示當前幀的下混模式C對應的下混矩陣
Figure 02_image091
對應的上混矩陣,所述
Figure 02_image098
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image100
Figure 02_image102
其中,
Figure 02_image097
Figure 02_image083
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image104
表示當前幀的下混模式D對應的下混矩陣;所述
Figure 02_image104
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image106
Figure 02_image108
其中,
Figure 02_image110
Figure 02_image111
;所述
Figure 02_image113
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image114
表示當前幀的下混模式D對應的下混矩陣
Figure 02_image116
對應的上混矩陣,所述
Figure 02_image114
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建,例如:
Figure 02_image117
Figure 02_image119
其中,
Figure 02_image110
Figure 02_image111
;所述
Figure 02_image113
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
下面對前一幀的一些下混矩陣和上混矩陣進行舉例說明。
例如,
Figure 02_image121
表示前一幀的下混模式A對應的下混矩陣,所述
Figure 02_image121
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。那麼,例如:
Figure 02_image123
或者
Figure 02_image125
其中,
Figure 02_image127
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image128
表示前一幀的下混模式A對應的下混矩陣
Figure 02_image130
對應的上混矩陣(
Figure 02_image128
簡稱前一幀的下混模式A對應的上混矩陣),其中,所述
Figure 02_image131
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image132
或者
Figure 02_image134
其中,
Figure 02_image127
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
例如,所述
Figure 02_image136
表示前一幀的下混模式B對應的下混矩陣。所述
Figure 02_image138
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image139
Figure 02_image141
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image149
表示前一幀的下混模式B對應的下混矩陣
Figure 02_image151
對應的上混矩陣,所述
Figure 02_image152
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image153
Figure 02_image155
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image157
表示前一幀的下混模式C對應的下混矩陣;所述
Figure 02_image157
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image159
Figure 02_image161
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image163
表示前一幀的下混模式C對應的下混矩陣
Figure 02_image165
對應的上混矩陣,所述
Figure 02_image163
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image166
Figure 02_image168
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image104
表示前一幀的下混模式D對應的下混矩陣;所述
Figure 02_image170
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image172
Figure 02_image174
其中,
Figure 02_image127
Figure 02_image145
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image176
表示前一幀的下混模式D對應的下混矩陣
Figure 02_image178
對應的上混矩陣,所述
Figure 02_image176
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建,例如:
Figure 02_image179
Figure 02_image181
其中,
Figure 02_image127
Figure 02_image145
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
可以理解,上面對下混矩陣和上混矩陣形式的舉例都是示例性的,當然,在實際應用中還可能存在其它形式的下混矩陣和上混矩陣。
第五方面,本申請實施例還提供一種音訊編碼裝置,可以包括:相互耦合的處理器和記憶體,所述記憶體存儲有電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行第一方面中的任意一種音訊編碼方法的部分或全部步驟,或者,以用於執行第二方面中的任意一種音訊編碼模式確定方法的部分或全部步驟。
第六方面,本申請實施例還提供一種音訊解碼裝置,可以包括:相互耦合的處理器和記憶體,所述記憶體存儲有電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行協力廠商面中的任意一種音訊解碼方法的部分或全部步驟,或者,以用於執行第四方面中的任意一種音訊編碼模式確定方法的部分或全部步驟。
第七方面,本申請實施例提供一種音訊編碼裝置,包括用於實施第一方面或第二方面的任意一種方法的若干個功能單元。
第八方面,本申請實施例提供一種音訊解碼裝置,包括用於實施協力廠商面或第四方面的任意一種方法的若干個功能單元。
第九方面,本申請實施例提供一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了程式碼,其中,所述程式碼包括用於執行第一方面或第二方面的任意一種方法的部分或全部步驟的指令。
第十方面,本申請實施例提供一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了程式碼,其中,所述程式碼包括用於執行協力廠商面或第四方面的任意一種方法的部分或全部步驟的指令。
第十一方面,本申請實施例還提供一種電腦程式產品,其中,當所述電腦程式產品在電腦上運行時,使得所述電腦執行第一方面或第二方面的任意一種方法的部分或全部步驟。
第十二方面,本申請實施例還提供一種電腦程式產品,其中,當所述電腦程式產品在電腦上運行時,使得所述電腦執行協力廠商面或第四方面的任意一種方法的部分或全部步驟。
下面結合本申請實施例中的附圖對本申請實施例進行描述。
本申請說明書和權利要求書以及上述附圖之中的術語“包括”和“具有”以及它們的任何變形,意圖在於覆蓋不排他的包括。例如包括一系列步驟或單元的過程、方法、系統或產品或設備沒有限定於已列出的步驟或單元,而是可選地還可包括沒有列出的步驟或單元,或者可選地還包括對於這些過程、方法、產品或設備固有的其它步驟或單元。另外來說,術語“第一”、“第二”、“第三”和“第四”等是用於區別不同物件,而不是用於描述特定順序。
需要說明,由於本申請各實施例方案針對的時域場景,因此為了簡化描述,時域信號可簡稱“信號”。例如,左聲道時域信號可簡稱“左聲道信號”。又例如,右聲道時域信號可以簡稱“右聲道信號”。又例如,單聲道時域信號可簡稱“單聲道信號”。又例如參考聲道時域信號可簡稱“參考聲道信號”。又例如主要聲道時域信號可簡稱“主要聲道信號”。次要聲道時域信號可簡稱“次要聲道信號”。又例如中央通道(Mid channel)時域信號可以簡稱“中央通道信號”。又例如邊通道(Side channel)時域信號可簡稱“邊通道信號”。其他情況可以此類推。
需要說明,本申請各實施例中,左聲道時域信號和右聲道時域信號可合稱“左右聲道時域信號”或可合稱“左右聲道信號”。也就是說,左右聲道時域信號包括左聲道時域信號和右聲道時域信號。又例如當前幀經時延對齊處理的左右聲道時域信號包括當前幀經時延對齊處理的左聲道時域信號和當前幀經時延對齊處理的右聲道時域信號。類似的,主要聲道信號和次要聲道信號可合稱“主次聲道信號”。也就是說,主次聲道信號包括主要聲道信號和次要聲道信號。又例如主次聲道解碼信號包括主要聲道解碼信號和次要聲道解碼信號。又例如左右聲道重建信號包括左聲道重建信號和右聲道重建信號。以此類推。
其中,例如傳統MS編碼技術先將左右聲道信號下混為中央通道(Mid channel)信號和邊通道(Side channel)信號。例如L表示左聲道信號,R表示右聲道信號,則Mid channel信號為0.5*(L+R),Mid channel信號表徵了左右兩個聲道之間的相關資訊。Side channel信號為0.5*(L-R),Side channel信號表徵了左右兩個聲道之間的差異資訊。然後,分別對Mid channel信號和Side channel信號採用單聲道編碼方法編碼。其中,對於Mid channel信號,通常用相對較多比特數進行編碼;對於Side channel信號,通常用相對較少比特數進行編碼。
進一步的,為了提高編碼品質,一些方案通過對左右聲道的時域信號進行分析,提取用於指示時域下混處理中左右聲道所占比例的時域立體聲參數。提出這種方法的目的是:當立體聲左右聲道信號之間的能量相差比較大的時候,有利於提升時域下混信號中的主要聲道的能量,降低次要聲道的能量。
例如,L表示左聲道信號,R表示右聲道信號,那麼,則主要聲道(Primary channel)信號記作Y,Y= alpha*L+beta*R,其中,Y表徵了兩個聲道之間的相關資訊。次要聲道(Secondary channel)記作X,X= alpha*L-beta*R,X表徵了兩個聲道之間的差異資訊。alpha和beta為0到1的實數。
參見圖1,圖1示出了一種左聲道信號和右聲道信號的幅度變化情況。在時域某一時刻上,左聲道信號、右聲道信號的對應樣點之間幅度的絕對值基本相同,但是符號相反,這種就是典型的類反相信號。圖1只是給出了類反相信號的一個典型例子。實際上類反相信號是指左右聲道信號之間的相位差接近180度的立體聲信號。例如可將左右聲道信號之間的相位差屬於
Figure 02_image183
的立體聲信號稱作類反相信號,其中,
Figure 02_image185
可取0°到90°之間的任意角度,例如
Figure 02_image187
可等於0°、5°、15°、17°、20°、30°、40等等角度。
類似的,類正相信號是指左右聲道信號之間的相位差接近0度的立體聲信號。例如可將左右聲道信號之間的相位差屬於
Figure 02_image188
的立體聲信號稱作類正相信號。
Figure 02_image190
可取0°到90°之間的任意角度,例如
Figure 02_image190
可以等於0°、5°、15°、17°、20°、30°、40°等角度。
當左右聲道信號為類正相信號時,時域下混處理生成的主要聲道信號能量往往明顯大於次要聲道信號的能量。若用較多的比特數對主要聲道信號進行編碼,同時用較少的比特數對次要聲道信號進行編碼,那麼有利於獲得較好的編碼效果。但是,當左右聲道信號為類反相信號時,如果採用相同的時域下混處理方法,則生成的主要聲道信號能量會出現特別小甚至能量缺失的現象,進而導致最終編碼品質下降。
下面繼續探討一些有利於提升立體聲編解碼品質的技術方案。
本申請實施例提及的音訊編碼裝置和音訊解碼裝置可為具有採集、存儲、向外傳輸話音信號等功能的裝置,具體的,音訊編碼裝置和音訊解碼裝置例如可為手機、伺服器、平板電腦、個人電腦或筆記型電腦等等。
可以理解,本申請方案中,左右聲道信號是指立體聲信號的左右聲道信號。立體聲信號可以是原始的立體聲信號,也可以是多聲道信號中包含的兩路信號組成的立體聲信號,還可以是由多聲道信號中包含的多路信號聯合產生的兩路信號組成音訊的立體聲信號。其中,音訊編碼方法,也可以是多聲道編碼中使用的立體聲編碼方法。音訊編碼裝置,也可以是多聲道編碼裝置中使用的立體聲編碼裝置。類似的,音訊解碼方法,也可以是多聲道解碼中使用的立體聲解碼方法。音訊解碼裝置,也可以是多聲道解碼裝置中使用的立體聲解碼裝置。本申請實施例中的音訊編碼方法例如針對的是立體聲編碼場景,本申請實施例中的音訊解碼方法例如針對的是立體聲解碼場景。
下面首先提供一種音訊編碼確定方法,可包括:確定當前幀的聲道組合方案。根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號。對得到的所述當前幀的主次聲道信號進行編碼。
參見圖2,圖2是本申請實施例提供的一種音訊編碼方法的流程示意圖。一種音訊編碼方法的相關步驟可由編碼裝置來實施,例如可包括如下步驟:
201、確定當前幀的聲道組合方案。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。例如所述多種聲道組合方案可以包括非相關性信號聲道組合方案(anticorrelated signal Channel Combination Scheme)和相關性信號聲道組合方案(correlated signal Channel Combination Scheme)。其中,所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
202、根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
此外,若當前幀為第一幀(即不存在當前幀的前一幀)的情況下,可以基於當前幀的聲道組合方案確定當前幀的下混模式和編碼模式。或者,也可以將默認的某種下混模式和編碼模式作為當前幀的下混模式和編碼模式。
其中,前一幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
其中,當前幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述當前幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
其中,本申請一些實施例中,有時候將“時域下混”簡稱“下混”,有時候將“時域上混”簡稱“上混”。例如將“時域下混模式”簡稱“下混模式”;將“時域下混矩陣”簡稱“下混矩陣”;將“時域上混模式”簡稱“上混模式”;將“時域上混矩陣”簡稱“上混矩陣”;將“時域上混處理”簡稱“上混處理”,將“時域下混處理”簡稱“下混處理”,以此類推。
可以理解,本申請實施例中對編碼模式、解碼模式、下混模式、上混模式和聲道組合方案等物件的命名都是示意性的,在實際應用中也可能選用其他名稱。
203、根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號,對得到的所述當前幀的主次聲道信號進行編碼。
其中,對當前幀的左右聲道信號進行時域下混處理可得到當前幀的主次聲道信號,通過進一步對得到的所述當前幀的主次聲道信號進行編碼以得到碼流。可進一步將當前幀的聲道組合方案標識(當前幀的聲道組合方案標識用於指示當前幀的聲道組合方案)寫入碼流,以便於解碼裝置基於碼流中包含的當前幀的聲道組合方案標識來確定當前幀的聲道組合方案。可進一步將當前幀的下混模式標識(當前幀的下混模式標識用於指示當前幀的下混模式)寫入碼流,以便於解碼裝置基於碼流中包含的當前幀的下混模式標識來確定當前幀的下混模式。
其中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實現方式可以是多種多樣的。
具體例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可以包括: 若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為相關性信號聲道組合方案,則確定所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。
又例如,在一些可能的實施方式中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可包括:根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
在一些可能的實施方式中,下混模式切換代價值可以表徵下混模式切換代價,例如下混模式切換代價值越大則表示下混模式切換代價。
例如,所述當前幀的下混模式切換代價值可為根據所述當前幀的下混模式切換代價函數進行計算的計算結果(計算結果即下混模式切換代價函數值)。其中,所述下混模式切換代價函數例如可基於如下參數的至少一種來構建:當前幀的至少一種時域立體聲參數(當前幀的至少一種時域立體聲參例如包括當前幀的聲道組合比例因數等)、前一幀的至少一種時域立體聲參數(前一幀的至少一種時域立體聲參例如包括前一幀的聲道組合比例因數等)和所述當前幀的左右聲道信號。
又例如,當前幀的下混模式切換代價值可為當前幀的聲道組合比例因數。
例如下混模式切換代價函數可為如下切換代價函數的其中一種:
下混模式A切換到下混模式B的下混模式切換代價函數、下混模式A切換到下混模式C的下混模式切換代價函數、下混模式D切換到下混模式B的下混模式切換代價函數、下混模式D切換到下混模式C的下混模式切換代價函數、下混模式B切換到下混模式A的下混模式切換代價函數、下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切換代價函數、下混模式C切換到下混模式D的下混模式切換代價函數。
具體例如如圖4舉例所示,在一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可以包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第一下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第一模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值。或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第二下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第二模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第三下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第三模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第四下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第四模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第五下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第五模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第六下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第六模式切換條件為當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第七下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第七模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第八下混模式切換條件,則可確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,下混模式切換代價值為下混模式切換代價函數值,所述第八模式切換條件為當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
又具體例如圖5舉例所示,在一些可能的實施方式中,根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,可包括:
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第九下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第九模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S1。或者,
若前一幀的下混模式為下混模式A,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足第十下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S1。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十一下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,並且所述第十一模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S2。或者,
若前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十二下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十二模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S2。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十三下混模式切換條件,則確定所述當前幀的下混模式為下混模式D,當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十三模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S3。或者,
若前一幀的下混模式為下混模式C,所述當前幀的聲道組合方案為相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十四下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十四模式切換條件為當前幀的聲道組合比例因數小於或等於聲道組合比例因數閾值S3。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十五下混模式切換條件,則確定所述當前幀的下混模式為下混模式B,當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十五模式切換條件為當前幀的聲道組合比例因數小於或或等於聲道組合比例因數閾值S4。或者,
若前一幀的下混模式為下混模式D,所述當前幀的聲道組合方案為非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足第十六下混模式切換條件,則確定所述當前幀的下混模式為下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,當前幀的下混模式切換代價函數值為當前幀的聲道組合比例因數,且所述第十六模式切換條件為當前幀的聲道組合比例因數大於或等於聲道組合比例因數閾值S4。
其中,聲道組合比例因數閾值S1的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.42、0.45、0.5、0.55、0.58、0.6或其它值。
其中,聲道組合比例因數閾值S2的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.42、0.45、0.5、0.55、0.57、0.6或其它值。
其中,聲道組合比例因數閾值S3的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.42、0.45、0.5、0.55、0.59、0.6或其它值。
其中,聲道組合比例因數閾值S4的取值範圍例如可以是[0.4,0.6],例如S1可等於0.4、0.43、0.45、0.5、0.55、0.58、0.6或其它值。
可以理解,上述對聲道組合比例因數閾值S4取值範圍的舉例是示例性的,可以基於切換測量來靈活的設置。
其中,在所述當前幀和前一幀的下混模式不同的情況下,那麼可根據所述當前幀編碼模式對所述當前幀的左右聲道信號進行分段時域下混處理。由於在所述當前幀和前一幀的下混模式不同的情況下引入了對所述當前幀的左右聲道信號進行分段時域下混處理的機制,分段時域下混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
可以理解,上述編碼方案中,需確定當前幀的聲道組合方案,且需根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,這就表示當前幀的聲道組合方案存在多種可能,當前幀的編碼模式存在多種可能,這相對於只有唯一一種聲道組合方案和唯一一種編碼模式的傳統方案而言,多種可能的聲道組合方案、多種編碼模式和多種可能場景之間有利於獲得更好的相容匹配效果,進而有利於提高編碼品質。
並且,由於引入了針對類反相信號對應的聲道組合方案,這使得對於當前幀的立體聲信號為類反相信號的情況,有了針對性相對更強的聲道組合方案和編碼模式,進而有利於提高編碼品質。
進一步的,由於針對相關性信號聲道組合方案和非相關性信號聲道組合方案分別引入了兩種不同的下混模式,通過合理設計對應的下混矩陣,有利於實現無切換位置要求的隨意性切換。
相應的,下面針對時域立體聲的解碼場景進行舉例說明。
參見圖3,下面還提供一種音訊解碼方法,音訊解碼方法的相關步驟可由解碼裝置來實施,方法具體可包括:
301、根據碼流進行解碼以得到當前幀的主次聲道解碼信號。
302、根據碼流進行解碼以確定所述當前幀的下混模式。
其中,例如編碼裝置在碼流中寫入了所述當前幀的下混模式標識(所述當前幀的下混模式標識指示出所述當前幀的下混模式),那麼根據碼流進行解碼可得到所述當前幀的下混模式標識,進而可基於解碼得到的所述當前幀的下混模式標識確定所述當前幀的下混模式。當然,解碼端也可基於編碼端的類似方式來確定所述當前幀的下混模式。或者基於碼流中包含的其它資訊確定當前幀的下混模式。
其中,前一幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
其中,當前幀的下混模式可為如下多種下混模式中的其中一種:下混模式A、下混模式B、下混模式C和下混模式D。其中,所述下混模式A和所述下混模式D為相關性信號下混模式。所述下混模式B和所述下混模式C為非相關性信號下混模式。其中,所述當前幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的下混矩陣互不相同。
可以理解,不同的下混矩陣對應不同的上混矩陣。
舉例來說,下混模式標識例如可包括至少兩個比特,例如當下混模式標識取值“00”時可表示所述當前幀的下混模式為下混模式A。例如當下混模式標識取值“01”時可以表示所述當前幀的下混模式為下混模式B,例如當下混模式標識取值“10”時可以表示所述當前幀的下混模式為下混模式C,例如當下混模式標識取值“11”時可以表示所述當前幀的下混模式為下混模式D。
可以理解,由於所述下混模式A和所述下混模式D為相關性信號下混模式,因此當基於解碼得到的所述當前幀的下混模式標識確定所述當前幀的下混模式為下混模式A或下混模式D時,也就可以確定當前幀的聲道組合方案為相關性聲道組合方案。
類似的,由於所述下混模式B和所述下混模式C為相關性信號下混模式,因此當基於解碼得到的所述當前幀的下混模式標識確定所述當前幀的下混模式為下混模式B或下混模式C時,也就可以確定當前幀的聲道組合方案為非相關性聲道組合方案。
303、根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的下混模式確定當前幀的編碼模式可能是下混模式切換型編碼模式或下混模式非切換型編碼模式。具體的,下混模式非切換型編碼模式可包括:下混模式A到下混模式A對應的編碼模式、下混模式B到下混模式B對應的編碼模式、下混模式C到下混模式C對應的編碼模式和下混模式D到下混模式D對應的編碼模式。
具體的,下混模式切換型編碼模式可包括:下混模式A切換到下混模式B對應的編碼模式、下混模式A切換到下混模式C對應的編碼模式、下混模式B切換到下混模式A對應的編碼模式、下混模式B切換到下混模式D對應的編碼模式、下混模式C切換到下混模式A對應的編碼模式、下混模式C切換到下混模式D對應的編碼模式、下混模式D切換到到下混模式B對應的編碼模式和下混模式D切換到到下混模式C對應的編碼模式。
具體例如,根據前一幀的下混模式和當前幀的下混模式確定所述當前幀的編碼模式,可包括:
若前一幀的下混模式為下混模式A,所述當前幀的下混模式A為下混模式A,確定所述當前幀的編碼模式為從下混模式A到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式A,所述當前幀的為下混模式C,確定所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從下混模式B到下混模式B對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式A,確定所述當前幀的編碼模式為從下混模式B到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式B,所述當前幀的為下混模式D,確定所述當前幀的編碼模式為從下混模式B到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式C到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從下混模式C到下混模式A對應的編碼模式。或者,
若前一幀的下混模式為下混模式C,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式C到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式D,確定所述當前幀的編碼模式為從下混模式D到下混模式D對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從下混模式D到下混模式C對應的編碼模式。或者,
若前一幀的下混模式為下混模式D,所述當前幀的下混模式為下混模式B,確定所述當前幀的編碼模式為從下混模式D到下混模式B對應的編碼模式。
304、根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
其中,左右聲道重建信號可為左右聲道解碼信號,或可通過將左右聲道重建信號進行時延調整處理和/或時域後處理以得到左右聲道解碼信號。
可以理解,下混模式和上混模式是對應的,編碼模式和解碼模式也是對應的。
例如,在所述當前幀和前一幀的下混模式不同的情況下,那麼可根據所述當前幀編碼模式對所述當前幀的主次聲道解碼信號進行分段時域上混處理。由於在所述當前幀和前一幀的下混模式不同的情況下引入了對所述當前幀的主次聲道解碼信號進行分段時域上混處理的機制,分段時域上混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
可以理解,上述解碼方案中,需根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,這就表示前一幀和當前幀的下混模式存在多種可能,當前幀的編碼模式存在多種可能,這相對於只有唯一一種下混模式和唯一一種編碼模式的傳統方案而言,多種可能的下混模式、多種編碼模式和多種可能場景之間有利於獲得更好的相容匹配效果,進而有利於提高編碼品質。
並且,由於引入了針對類反相信號對應的聲道組合方案,這使得對於當前幀的立體聲信號為類反相信號的情況,有了針對性相對更強的聲道組合方案和編碼模式,進而有利於提高編碼品質。
下面舉例編碼裝置確定當前幀的聲道組合方案的一些具體實現方式。編碼裝置確定當前幀的聲道組合方案的具體實現方式是多種多樣的。
其中,在所述當前幀和前一幀的下混模式不同的情況下,可確定當前幀的編碼模式例如可能為下混模式切換型編碼模式,那麼,可根據所述當前幀和前一幀的下混模式對所述當前幀的左右聲道信號進行分段時域下混處理。
由於在所述當前幀和前一幀的聲道組合方案不同的情況下引入了對所述當前幀的左右聲道信號進行分段時域下混處理的機制,分段時域下混處理機制有利於實現聲道組合方案的平滑過度,進而有利於提高編碼品質。
在一些可能的實施方式中,確定當前幀的聲道組合方案可包括:利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型;利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案。其中,所述當前幀的立體聲信號的信號正反相類型可以是類正相信號或類反相信號。所述當前幀的立體聲信號的信號正反相類型可通過所述當前幀的信號正反相類型標識來指示。具體例如,當所述當前幀的信號正反相類型標識取值為“1”時,指示所述當前幀的立體聲信號的信號正反相類型為類正相信號,當所述當前幀的信號正反相類型標識取值為“0”時,指示所述當前幀的立體聲信號的信號正反相類型為類反相信號,反之亦可。
音訊幀(例如前一幀或當前幀)的聲道組合方案可通過所述音訊幀的聲道組合方案標識來指示。具體例如,當音訊幀的聲道組合方案標識取值為“0”時,指示該音訊幀的聲道組合方案為相關性信號聲道組合方案。當音訊幀的聲道組合方案標識取值為“1”時,指示該音訊幀的聲道組合方案為非相關性信號聲道組合方案,反之亦可。
其中,利用所述當前幀的左右聲道信號確定所述當前幀的立體聲信號的信號正反相類型可包括:計算所述當前幀的左右聲道信號之間的相關性值
Figure 02_image001
,在所述
Figure 02_image003
小於或者等於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類正相信號,在所述
Figure 02_image003
大於第一閾值的情況下確定所述當前幀的立體聲信號的信號正反相類型為類反相信號。進一步的,若利用所述當前幀的信號正反相類型標識來指示所述當前幀的立體聲信號的信號正反相類型,則在確定所述當前幀的立體聲信號的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類正相信號;那麼,在確定所述當前幀的信號正反相類型為類正相信號的情況下,可置所述當前幀的信號正反相類型標識的取值指示出所述當前幀的立體聲信號的信號正反相類型為類反相信號。
其中,第一閾值的取值範圍例如可為[0.5,1.0),例如可等於0.5、0.85、0.75、0.65或0.81等。
具體例如,音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“0”時,指示該音訊幀的立體聲信號的信號正反相類型為類正相信號;音訊幀(例如前一幀或當前幀)的信號正反相類型標識取值為“1”時,指示該音訊幀的立體聲信號的信號正反相類型為類反相信號,以此類推。
其中,利用所述當前幀的立體聲信號的信號正反相類型和前一幀的聲道組合方案確定所述當前幀的聲道組合方案,例如可包括:
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;在所述當前幀的立體聲信號的信號正反相類型為類反相信號,且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類正相信號,並且前一幀的聲道組合方案為非相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;或者,
在所述當前幀的立體聲信號的信號正反相類型為類反相信號,並且前一幀的聲道組合方案為相關性信號聲道組合方案的情況下,如果所述當前幀的左右聲道信號的信噪比均小於第二閾值,確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案;如果所述當前幀的左聲道信號和/或右聲道信號的信噪比大於或等於第二閾值,確定所述當前幀的聲道組合方案為相關性信號聲道組合方案。
其中,第二閾值的取值範圍例如可為[0.8,1.2],例如可等於0.8、0.85、0.9、1、1.1或1.18等。
其中,當前幀的聲道組合方案標識可記作
Figure 02_image192
其中,前一幀的聲道組合方案標識可記作
Figure 02_image194
可以理解,上述舉例中給出了確定當前幀的聲道組合方案的一些實施方式,但實際應用中也可能不限於上述舉例方式。
下面對各種下混模式切換代價函數進行舉例說明。其中,下混模式切換代價函數可為如下切換代價函數的其中一種:下混模式A切換到下混模式B的下混模式切換代價函數、下混模式A切換到下混模式C的下混模式切換代價函數、下混模式D切換到下混模式B的下混模式切換代價函數、下混模式D切換到下混模式C的下混模式切換代價函數、下混模式B切換到下混模式A的下混模式切換代價函數、下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切換代價函數、下混模式C切換到下混模式D的下混模式切換代價函數。例如,下混模式切換代價函數例如可基於如下參數的至少一種來構建:當前幀的至少一種時域立體聲參數(當前幀的至少一種時域立體聲參例如包括當前幀的聲道組合比例因數等)、前一幀的至少一種時域立體聲參數(前一幀的至少一種時域立體聲參例如包括前一幀的聲道組合比例因數等)和所述當前幀的左右聲道信號。
在實際應用中,切換代價函數的具體構建方式可以是多種多樣的,下面進行舉例說明。
舉例來說,當前幀的下混模式A切換到下混模式B的下混模式切換代價函數可為:
Figure 02_image004
Figure 02_image006
其中,所述
Figure 02_image008
表示下混模式A切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
例如end_sample_A-start_sample_A的取值範圍可為[60,200],例如end_sample_A-start_sample_A等於60、69、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,
Figure 02_image018
;所述
Figure 02_image020
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式A切換到下混模式C的下混模式切換代價函數可為:
Figure 02_image022
Figure 02_image006
其中,所述
Figure 02_image024
表示下混模式A切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_A為表示下混模式A切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image026
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式B切換到下混模式A的下混模式切換代價函數為:
Figure 02_image028
Figure 02_image006
其中,所述
Figure 02_image030
表示下混模式B切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式B切換到下混模式D的下混模式切換代價函數可為:
Figure 02_image040
Figure 02_image006
其中,所述
Figure 02_image042
表示下混模式B切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_B為表示下混模式B切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B。
例如end_sample_B-start_sample_B的取值範圍可為[60,200],例如end_sample_B-start_sample_B等於60、67、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式C切換到下混模式D的下混模式切換代價函數可為:
Figure 02_image044
Figure 02_image006
其中,所述
Figure 02_image046
表示下混模式C切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式D的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式D的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C。
例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號。
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式C切換到下混模式A的下混模式切換代價函數可為:
Figure 02_image048
Figure 02_image006
其中,所述
Figure 02_image050
表示下混模式C切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式A的模式切換代價函數的計算起始樣點,end_sample_C為表示下混模式C切換到下混模式A的模式切換代價函數的計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C,例如end_sample_C-start_sample_C的取值範圍可為[60,200],例如end_sample_C-start_sample_C等於60、71、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image032
,其中,所述
Figure 02_image034
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image036
;所述
Figure 02_image038
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式D切換到下混模式C的下混模式切換代價函數可為:
Figure 02_image052
Figure 02_image006
其中,所述
Figure 02_image054
表示下混模式D切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式C的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式C的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image026
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
又例如,當前幀的下混模式D切換到下混模式B的下混模式切換代價函數為:
Figure 02_image057
Figure 02_image059
其中,所述
Figure 02_image061
表示下混模式D切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式B的模式切換代價函數的計算起始樣點,end_sample_D為表示下混模式D切換到下混模式B的模式切換代價函數的計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D。
例如end_sample_D-start_sample_D的取值範圍可為[60,200],例如end_sample_D-start_sample_D等於60、73、80、100、120、150、180、191、200或其它值。
其中,所述n表示樣點序號,所述N為幀長;
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號;
其中,
Figure 02_image014
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;
其中,
Figure 02_image026
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
下面對當前幀的不同下混模式A對應的一些下混矩陣和上混矩陣進行舉例說明。
例如,
Figure 02_image063
表示當前幀的下混模式A對應的下混矩陣,所述
Figure 02_image065
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。那麼,例如:
Figure 02_image066
或者
Figure 02_image068
其中,
Figure 02_image070
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image071
表示當前幀的下混模式A對應的下混矩陣
Figure 02_image063
對應的上混矩陣,所述
Figure 02_image071
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image073
或者
Figure 02_image075
例如,所述
Figure 02_image077
表示當前幀的下混模式B對應的下混矩陣。所述
Figure 02_image077
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image079
Figure 02_image081
其中,
Figure 02_image014
Figure 02_image083
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image085
表示當前幀的下混模式B對應的下混矩陣
Figure 02_image077
對應的上混矩陣,所述
Figure 02_image085
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image087
Figure 02_image089
其中,
Figure 02_image014
Figure 02_image083
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image091
表示當前幀的下混模式C對應的下混矩陣;所述
Figure 02_image091
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image093
Figure 02_image095
其中,
Figure 02_image097
Figure 02_image083
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image098
表示當前幀的下混模式C對應的下混矩陣
Figure 02_image091
對應的上混矩陣,所述
Figure 02_image098
基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image100
Figure 02_image102
其中,
Figure 02_image097
Figure 02_image083
;所述
Figure 02_image016
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image104
表示當前幀的下混模式D對應的下混矩陣;所述
Figure 02_image104
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image106
Figure 02_image108
其中,
Figure 02_image110
Figure 02_image111
;所述
Figure 02_image113
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image114
表示當前幀的下混模式D對應的下混矩陣
Figure 02_image116
對應的上混矩陣,所述
Figure 02_image114
基於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數構建,例如:
Figure 02_image117
Figure 02_image119
其中,
Figure 02_image110
Figure 02_image111
;所述
Figure 02_image113
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
下面對前一幀的一些下混矩陣和上混矩陣進行舉例說明。
例如,
Figure 02_image121
表示前一幀的下混模式A對應的下混矩陣,所述
Figure 02_image121
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。那麼,例如:
Figure 02_image123
或者
Figure 02_image125
其中,
Figure 02_image127
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image128
表示前一幀的下混模式A對應的下混矩陣
Figure 02_image130
對應的上混矩陣(
Figure 02_image128
簡稱前一幀的下混模式A對應的上混矩陣),其中,所述
Figure 02_image131
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image132
或者
Figure 02_image134
其中,
Figure 02_image127
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
例如,所述
Figure 02_image136
表示前一幀的下混模式B對應的下混矩陣。所述
Figure 02_image138
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image139
Figure 02_image141
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image149
表示前一幀的下混模式B對應的下混矩陣
Figure 02_image151
對應的上混矩陣,所述
Figure 02_image152
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image153
Figure 02_image155
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image157
表示前一幀的下混模式C對應的下混矩陣;所述
Figure 02_image157
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image159
Figure 02_image161
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image163
表示前一幀的下混模式C對應的下混矩陣
Figure 02_image165
對應的上混矩陣,所述
Figure 02_image163
基於所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image166
Figure 02_image168
其中,
Figure 02_image143
Figure 02_image145
Figure 02_image147
表示所述前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
例如,
Figure 02_image104
表示前一幀的下混模式D對應的下混矩陣;所述
Figure 02_image170
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建。例如:
Figure 02_image172
Figure 02_image174
其中,
Figure 02_image127
Figure 02_image145
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
相應的,
Figure 02_image176
表示前一幀的下混模式D對應的下混矩陣
Figure 02_image178
對應的上混矩陣,所述
Figure 02_image176
基於所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數構建,例如:
Figure 02_image179
Figure 02_image181
其中,
Figure 02_image127
Figure 02_image145
;所述
Figure 02_image027
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
可以理解,上面對下混矩陣和上混矩陣形式的舉例都是示例性的,當然在實際應用中還可能存在其它形式的下混矩陣和上混矩陣。
下面進一步針對不同的編碼模式場景和對應解碼模式場景進行舉例說明。可以理解,不同的編碼模式所對應的時域下混處理方式通常不同。並且每種編碼模式也可能對應一種或多種時域下混處理方式。
下面先針針對當前幀和前一幀的下混模式相同的一些編解碼情況進行舉例說明。
首先,針對當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式的情況下的編碼場景和解碼場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在一些可能的編碼實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image280
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號;其中,所述n表示樣點序號。所述
Figure 02_image286
表示所述當前幀的下混模式A對應的下混矩陣。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image287
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。所述
Figure 02_image297
表示所述當前幀的下混模式A對應的上混矩陣。
又例如,當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在另一些可能的編碼實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image298
Figure 02_image300
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image302
Figure 02_image304
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號;
其中,所述
Figure 02_image306
表示解碼時延補償。
所述delay_com表示編碼時延補償。
其中,所述n表示樣點序號,N表示幀長;例如
Figure 02_image308
所述
Figure 02_image310
表示所述前一幀的下混模式A對應的下混矩陣。所述
Figure 02_image311
表示所述當前幀的下混模式A對應的下混矩陣。所述
Figure 02_image312
表示所述前一幀的下混模式A對應的上混矩陣。所述
Figure 02_image314
表示所述前一幀的下混模式A對應的下混矩陣。
又例如,當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image315
Figure 02_image317
Figure 02_image319
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image323
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image327
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image329
Figure 02_image331
Figure 02_image333
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image335
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image337
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,
Figure 02_image339
表示下混模式A對應的過渡處理長度。其中,
Figure 02_image341
取值可根據具體場景需要設定。
Figure 02_image342
例如可等於3/N或者
Figure 02_image342
可為小於N的其它值。
下面針對下混模式B到下混模式B對應的編碼模式的場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式B到下混模式B對應的編碼模式,那麼,在一些可能實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image343
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。其中,所述n表示樣點序號。所述
Figure 02_image347
表示所述當前幀的下混模式B對應的下混矩陣。
又例如,當前幀的編碼模式為下混模式B到下混模式B對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image349
Figure 02_image351
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號;
其中,所述n表示樣點序號,N表示幀長;所述delay_com表示編碼時延補償。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image353
Figure 02_image355
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號;
其中,所述
Figure 02_image306
表示解碼時延補償。
所述delay_com表示編碼時延補償。
其中,所述n表示樣點序號,N表示幀長;例如
Figure 02_image308
所述
Figure 02_image361
表示所述前一幀的下混模式B對應的下混矩陣。所述
Figure 02_image363
表示所述當前幀的下混模式B對應的下混矩陣。所述
Figure 02_image364
表示所述前一幀的下混模式B對應的上混矩陣。所述
Figure 02_image366
表示所述前一幀的下混模式B對應的下混矩陣。
又例如,當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image367
Figure 02_image369
Figure 02_image371
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image373
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image375
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image377
Figure 02_image379
Figure 02_image381
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image383
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image385
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,
Figure 02_image387
表示下混模式B對應的過渡處理長度。其中,
Figure 02_image387
的取值可根據具體場景需要設定。
Figure 02_image387
例如可等於3/N或者
Figure 02_image387
可為小於N的其它值。
下面針對下混模式C到下混模式C對應的編碼模式的場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式,那麼,在一些可能實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image389
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號;其中,所述n表示樣點序號。所述
Figure 02_image391
表示所述當前幀的下混模式C對應的下混矩陣。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image393
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。所述
Figure 02_image395
表示所述當前幀的下混模式A對應的上混矩陣。
又例如,當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image396
Figure 02_image398
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號;
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image400
Figure 02_image402
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號;
其中,所述
Figure 02_image306
表示解碼時延補償。
所述delay_com表示編碼時延補償。
其中,所述n表示樣點序號,N表示幀長;例如
Figure 02_image308
所述
Figure 02_image404
表示所述前一幀的下混模式C對應的下混矩陣。所述
Figure 02_image406
表示所述當前幀的下混模式C對應的下混矩陣。所述
Figure 02_image407
表示所述前一幀的下混模式C對應的上混矩陣。所述
Figure 02_image409
表示所述前一幀的下混模式C對應的下混矩陣。
又例如,當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image410
Figure 02_image412
Figure 02_image414
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image416
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image418
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image420
Figure 02_image422
Figure 02_image424
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image426
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image428
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,
Figure 02_image430
表示下混模式C對應的過渡處理長度。其中,
Figure 02_image430
取值可根據具體場景需要設定。
Figure 02_image430
例如可等於3/N或者
Figure 02_image430
可為小於N的其它值。
下面針對下混模式D到下混模式D對應的編碼模式的場景進行舉例說明。
舉例來說,例如當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式,那麼,在一些可能實施方式中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image432
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號;其中,所述n表示樣點序號。所述
Figure 02_image434
表示所述當前幀的下混模式D對應的下混矩陣。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image436
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。所述
Figure 02_image438
表示所述當前幀的下混模式D對應的上混矩陣。
又例如,當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image440
Figure 02_image442
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號;
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image444
Figure 02_image446
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號;
其中,所述
Figure 02_image306
表示解碼時延補償。
所述delay_com表示編碼時延補償。
其中,N表示幀長;例如
Figure 02_image308
所述
Figure 02_image448
表示所述前一幀的下混模式D對應的下混矩陣。所述
Figure 02_image450
表示所述當前幀的下混模式D對應的下混矩陣。所述
Figure 02_image451
表示所述前一幀的下混模式D對應的上混矩陣。所述
Figure 02_image453
表示所述前一幀的下混模式D對應的下混矩陣。
又例如,當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式,那麼,在另一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image454
Figure 02_image456
Figure 02_image458
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image460
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image462
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image464
Figure 02_image466
Figure 02_image468
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image470
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image472
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,
Figure 02_image474
表示下混模式D對應的過渡處理長度。其中,
Figure 02_image474
取值可根據具體場景需要設定。
Figure 02_image474
例如可等於3/N或者
Figure 02_image474
可為小於N的其它值。
下面針對當前幀和前一幀的下混模式不同的一些編解碼情況進行舉例說明。例如,在所述當前幀和前一幀的下混模式不同的情況下,那麼編碼裝置可根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行分段時域上混處理。例如,在所述當前幀和前一幀的下混模式不同的情況下,那麼解碼編碼裝置可根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行分段時域上混處理。
下面先針對下混模式A到下混模式B對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式A到下混模式B對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image476
Figure 02_image477
Figure 02_image479
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image481
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image483
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image485
Figure 02_image486
Figure 02_image488
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image490
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image492
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image494
表示下混模式A切換到下混模式B對應的過渡處理長度。
Figure 02_image496
取值可根據具體場景需要設定。
Figure 02_image496
例如可等於3/N或者
Figure 02_image496
可為小於N的其它值。
其中,N表示幀長;例如
Figure 02_image308
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image497
表示所述前一幀的下混模式A對應的下混矩陣。所述
Figure 02_image499
表示所述當前幀的下混模式B對應的下混矩陣。所述
Figure 02_image500
表示所述前一幀的下混模式A對應的上混矩陣。所述
Figure 02_image501
表示所述當前幀的下混模式B對應的上混矩陣。
下面針對下混模式A到下混模式C對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式A到下混模式C對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image476
Figure 02_image502
Figure 02_image504
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image506
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image508
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image485
Figure 02_image510
Figure 02_image512
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image514
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image516
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image518
表示下混模式A切換到下混模式C對應的過渡處理長度。
Figure 02_image520
取值可根據具體場景需要設定。
Figure 02_image521
例如可等於3/N或者
Figure 02_image521
可為小於N的其它值。
其中,N表示幀長;例如
Figure 02_image308
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image497
表示所述前一幀的下混模式A對應的下混矩陣。所述
Figure 02_image522
表示所述當前幀的下混模式C對應的下混矩陣。所述
Figure 02_image500
表示所述前一幀的下混模式A對應的上混矩陣。所述
Figure 02_image523
表示所述當前幀的下混模式C對應的上混矩陣。
下面針對下混模式B到下混模式A對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式B到下混模式A對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image524
Figure 02_image525
Figure 02_image527
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image529
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image531
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image533
Figure 02_image534
Figure 02_image536
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image538
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image540
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image542
表示下混模式B切換到下混模式A對應的過渡處理長度。
Figure 02_image542
取值可根據具體場景需要設定。
Figure 02_image542
例如可等於3/N或者
Figure 02_image542
可為小於N的其它值。
其中,N表示幀長;例如
Figure 02_image308
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image544
表示所述前一幀的下混模式B對應的下混矩陣。所述
Figure 02_image545
表示所述當前幀的下混模式A對應的下混矩陣。所述
Figure 02_image547
表示所述前一幀的下混模式B對應的上混矩陣。所述
Figure 02_image548
表示所述當前幀的下混模式A對應的上混矩陣。
下面針對下混模式B到下混模式D對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式B到下混模式D對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image524
Figure 02_image549
Figure 02_image551
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image553
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image555
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image533
Figure 02_image557
Figure 02_image559
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image561
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image563
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image565
表示下混模式B切換到下混模式D對應的過渡處理長度。
Figure 02_image565
取值可根據具體場景需要設定。
Figure 02_image565
例如可等於3/N或者
Figure 02_image565
可為小於N的其它值。
其中,N表示幀長;例如
Figure 02_image308
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image544
表示所述前一幀的下混模式B對應的下混矩陣。所述
Figure 02_image567
表示所述當前幀的下混模式D對應的下混矩陣。所述
Figure 02_image547
表示所述前一幀的下混模式B對應的上混矩陣。所述
Figure 02_image568
表示所述當前幀的下混模式D對應的上混矩陣。
下面針對下混模式C到下混模式A對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式C到下混模式A對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image569
Figure 02_image570
Figure 02_image572
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image574
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image576
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image578
Figure 02_image579
Figure 02_image581
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image583
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image585
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image587
表示下混模式C切換到下混模式A對應的過渡處理長度。
Figure 02_image587
取值可根據具體場景需要設定。
Figure 02_image587
例如可等於3/N或者
Figure 02_image587
可為小於N的其它值。
其中,所述n表示樣點序號,N表示幀長。
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image589
表示所述前一幀的下混模式C對應的下混矩陣。所述
Figure 02_image545
表示所述當前幀的下混模式A對應的下混矩陣。所述
Figure 02_image590
表示所述前一幀的下混模式C對應的上混矩陣。所述
Figure 02_image548
表示所述當前幀的下混模式A對應的上混矩陣。
下面針對下混模式C到下混模式D對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式C到下混模式D對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image569
Figure 02_image591
Figure 02_image593
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image595
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image597
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image578
Figure 02_image599
Figure 02_image601
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image603
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image605
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image607
表示下混模式C切換到下混模式D對應的過渡處理長度。
Figure 02_image607
取值可根據具體場景需要設定。
Figure 02_image607
例如可等於3/N或者
Figure 02_image607
可為小於N的其它值。
其中,N表示幀長;例如
Figure 02_image308
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image589
表示所述前一幀的下混模式C對應的下混矩陣。所述
Figure 02_image609
表示所述當前幀的下混模式D對應的下混矩陣。所述
Figure 02_image590
表示所述前一幀的下混模式C對應的上混矩陣。所述
Figure 02_image610
表示所述當前幀的下混模式D對應的上混矩陣。
下面針對下混模式D到下混模式C對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式D到下混模式C對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image611
Figure 02_image612
Figure 02_image614
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image616
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image618
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image620
Figure 02_image621
Figure 02_image623
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image625
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image627
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image629
表示下混模式D切換到下混模式C對應的過渡處理長度。
Figure 02_image629
取值可根據具體場景需要設定。
Figure 02_image629
例如可等於3/N或者
Figure 02_image629
可為小於N的其它值。
其中,所述n表示樣點序號,N表示幀長。
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image631
表示所述前一幀的下混模式D對應的下混矩陣。所述
Figure 02_image522
表示所述當前幀的下混模式C對應的下混矩陣。所述
Figure 02_image632
表示所述前一幀的下混模式D對應的上混矩陣。所述
Figure 02_image523
表示所述當前幀的下混模式C對應的上混矩陣。
下面針對下混模式D到下混模式B對應的編碼模式的場景進行舉例。
具體例如,當前幀的編碼模式為下混模式D到下混模式B對應的編碼模式,那麼,在一些可能的實施方式之中,在根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號的情況下,
Figure 02_image611
Figure 02_image633
Figure 02_image635
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image637
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image639
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述
Figure 02_image010
表示所述當前幀的左聲道信號,所述
Figure 02_image012
表示所述當前幀的右聲道信號,所述
Figure 02_image282
表示經時域下混處理而得到的所述當前幀的主要聲道信號,所述
Figure 02_image284
表示經時域下混處理而得到的所述當前幀的次要聲道信號。
相應的,在對應的解碼場景中,在根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號的情況下,
Figure 02_image620
Figure 02_image641
Figure 02_image643
其中,
Figure 02_image321
表示淡入因數。例如
Figure 02_image645
,當然
Figure 02_image321
也可以是基於n的其它函數關係的淡入因數。
Figure 02_image325
表示淡出因數。例如
Figure 02_image647
。當然
Figure 02_image325
也可以是基於n的其它函數關係的淡出因數。
其中,所述n表示樣點序號,所述
Figure 02_image289
表示所述當前幀的左聲道重建信號,所述
Figure 02_image291
表示所述當前幀的右聲道重建信號,所述
Figure 02_image293
表示所述當前幀的主要聲道解碼信號,所述
Figure 02_image295
表示所述當前幀的次要聲道解碼信號。
其中,
Figure 02_image649
表示下混模式D切換到下混模式B對應的過渡處理長度。
Figure 02_image649
取值可根據具體場景需要設定。
Figure 02_image649
例如可等於3/N或者
Figure 02_image649
可為小於N的其它值。
其中,N表示幀長;例如
Figure 02_image308
其中,所述delay_com表示編碼時延補償。所述
Figure 02_image306
表示解碼時延補償。
所述
Figure 02_image631
表示所述前一幀的下混模式D對應的下混矩陣。所述
Figure 02_image651
表示所述當前幀的下混模式B對應的下混矩陣。所述
Figure 02_image632
表示所述前一幀的下混模式D對應的上混矩陣。所述
Figure 02_image652
表示所述當前幀的下混模式B對應的上混矩陣。
可以理解,上述舉例的編解碼場景中,不同下混模式對應的過渡處理長度可以互不相同,部分相同或者全部相同。例如
Figure 02_image653
Figure 02_image654
Figure 02_image655
Figure 02_image656
Figure 02_image649
Figure 02_image657
可以互不相同,部分相同或者全部相同,其它情況以此類推。
其中,上述舉例場景中,當前幀的左右聲道信號具體可以是當前幀的原始左右聲道信號(原始左右聲道信號是未經時域預處理的左右聲道信號,例如可以是採樣得到左右聲道信號),或者可是當前幀的經時域預處理的左右聲道信號;或者可以是當前幀的經時延對齊處理的左右聲道信號。
具體例如,
Figure 02_image658
Figure 02_image660
Figure 02_image662
其中,
Figure 02_image664
表示所述當前幀的原始左聲道信號,
Figure 02_image666
表示所述當前幀的原始右聲道信號;所述
Figure 02_image668
表示所述當前幀的經時域預處理的左聲道信號,所述
Figure 02_image670
表示所述當前幀的經時域預處理的右聲道信號;所述
Figure 02_image672
表示所述當前幀的經時延對齊處理的左聲道信號,所述
Figure 02_image674
表示所述當前幀的經時延對齊處理的右聲道信號。
上述場景舉例中示例性的給出了不同編碼模式下的時域上混和時域下混處理方式,當然在實際應用中還可採用類似上述舉例的其它方式進行時域上混處理和下混處理,本申請實施例並不限於上述舉例的那些時域上混和時域下混處理方式。
參見圖6,圖6是本申請實施例提供的一種音訊編碼模式確定方法的流程示意圖。一種音訊編碼模式確定方法的相關步驟可由編碼裝置來實施,例如可包括如下步驟:
601、確定當前幀的聲道組合方案。
其中,編碼裝置確定當前幀的聲道組合方案的具體實施方式可參考其它實施例的相關描述,此處不在贅述。
602、根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,編碼裝置根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實施方式可參考其它實施例的相關描述,此處不在贅述。
可以理解,上述編碼場景中,需確定當前幀的聲道組合方案,這就表示當前幀的聲道組合方案存在多種可能,相對於只有唯一一種聲道組合方案的傳統方案而言,多種可能的聲道組合方案和多種可能場景之間有利於獲得更好的相容匹配效果。
可以理解,上述編碼場景中,需根據根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
參見圖7,圖7是本申請實施例提供的一種音訊解碼模式確定方法的流程示意圖。一種音訊解碼模式確定方法的相關步驟可由解碼裝置來實施,例如可包括如下步驟:
701、根據碼流進行解碼以確定所述當前幀的下混模式。
例如根據碼流進行解碼以得到碼流中包含的所述當前幀的下混模式標識(當前幀的下混模式標識指示出當前幀的下混模式),基於得到的所述當前幀的下混模式標識確定所述當前幀的下混模式。
702、根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式的具體實施方式可參考其它實施例的相關描述,此處不在贅述。
可以理解,上述解碼場景中,需根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,這就表示當前幀的編碼模式存在多種可能,相對於只有唯一一種編碼模式的傳統方案而言,多種可能的編碼模式、下混模式和多種可能場景之間有利於獲得更好的相容匹配效果。
下面對當前幀/前一幀的一些立體聲參數進行介紹。
在本申請的一些實施例中,當前幀的立體聲參數(例如聲道組合比例因數和/或聲道間時延差)可為固定值,也可基於當前幀的聲道組合方案(例如相關性信號聲道組合方案或者非相關性信號聲道組合方案)來確定。
參見圖8,下面舉例一種時域立體聲參數的確定方法,時域立體聲參數的確定方法的相關步驟可由編碼裝置來實施,方法具體可以包括:
801、確定當前幀的聲道組合方案。
802、根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數,所述時域立體聲參數包括聲道組合比例因數和聲道間時延差中的至少一種。
其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種。
其中,例如所述多種聲道組合方案包括非相關性信號聲道組合方案和相關性信號聲道組合方案。
其中,所述相關性信號聲道組合方案為類正相信號對應的聲道組合方案。所述非相關性信號聲道組合方案為類反相信號對應的聲道組合方案。可以理解,類正相信號對應的聲道組合方案適用於類正相信號,類反相信號對應的聲道組合方案適用於類反相信號。
在確定所述當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,所述當前幀的時域立體聲參數為所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數;在確定所述當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,所述當前幀的時域立體聲參數為所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數。
可以理解,上述方案中需確定當前幀的聲道組合方案,這就表示當前幀的聲道組合方案存在多種可能,這相對於只有唯一一種聲道組合方案的傳統方案而言,多種可能的聲道組合方案和多種可能場景之間有利於獲得更好的相容匹配效果。由於是根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數,這使得時域立體聲參數和多種可能場景之間有利於獲得更好的相容匹配效果,進而有利於提升編解碼品質。
在一些可能實施方式中,可以先分別計算出當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數和當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。而後在確定當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定當前幀的時域立體聲參數為所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數;或者,在確定當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,確定當前幀的時域立體聲參數為所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數。或者,也可先計算出當前幀的相關性信號聲道組合方案對應的時域立體聲參數,在確定當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,確定當前幀的時域立體聲參數為所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數;而在確定當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,再計算所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數,將計算出的所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數,確認為當前幀的時域立體聲參數。
或者,也可先確定當前幀的聲道組合方案,在確定所述當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,計算所述當前幀的相關性信號聲道組合方案對應的時域立體聲參數,那麼,當前幀的時域立體聲參數為當前幀的相關性信號聲道組合方案對應的時域立體聲參數。而在確定當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下,計算所述當前幀的非相關性信號聲道組合方案對應的時域立體聲參數,那麼,當前幀的時域立體聲參數為當前幀的非相關性信號聲道組合方案對應的時域立體聲參數。
在一些可能實施方式中,根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數包括:根據所述當前幀的聲道組合方案,確定所述當前幀的聲道組合方案所對應的聲道組合比例因數初始值。在無需對所述當前幀的聲道組合方案(相關性信號聲道組合方案或非相關性信號聲道組合方法)對應的聲道組合比例因數的初始值進行修正的情況之下,所述當前幀的聲道組合方案對應的聲道組合比例因數,等於所述當前幀的聲道組合方案對應的聲道組合比例因數的初始值。在需對所述當前幀的聲道組合方案(相關性信號聲道組合方案或非相關性信號聲道組合方法)對應的聲道組合比例因數的初始值進行修正的情況之下,對所述當前幀的聲道組合方案對應的聲道組合比例因數的初始值進行修正,以得到所述當前幀的聲道組合方案對應的聲道組合比例因數的修正值,所述當前幀的聲道組合方案對應的聲道組合比例因數,等於所述當前幀的聲道組合方案對應的聲道組合比例因數的修正值。
舉例來說,所述根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數可以包括:根據所述當前幀左聲道信號計算所述當前幀的左聲道信號的幀能量;根據所述當前幀右聲道信號計算所述當前幀的右聲道信號的幀能量;根據所述當前幀左聲道信號的幀能量和右聲道信號的幀能量,計算所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值。
其中,在無需對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正的情況下,所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數初始值,所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值的編碼索引;
在需對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正的情況下,對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引進行修正,以得到所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值及其編碼索引,所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值;所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引等於所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值的編碼索引。
具體例如,在對所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引進行修正的情況下,
Figure 02_image676
Figure 02_image678
其中,所述
Figure 02_image680
表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,所述
Figure 02_image682
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值對應的編碼索引,所述
Figure 02_image684
表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值。
又例如,根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數包括:根據所述當前幀的左聲道信號和右聲道信號獲得所述當前幀的參考聲道信號;計算所述當前幀的左聲道信號與參考聲道信號之間的幅度相關性參數;計算所述當前幀的右聲道信號與參考聲道信號之間的幅度相關性參數;根據所述當前幀的左右聲道信號與參考聲道信號之間的幅度相關性參數,計算所述當前幀的左右聲道信號之間的幅度相關性差異參數;根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數,例如可包括:根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值;對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值進行修正,以得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。可以理解,當無需對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值進行修正時,那麼,所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數,等於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數初始值。
在一些可能的實施方式中,
Figure 02_image686
Figure 02_image688
其中,
Figure 02_image690
其中,所述
Figure 02_image692
表示所述當前幀的參考聲道信號。
其中,所述
Figure 02_image694
表示所述當前幀經時延對齊處理的左聲道信號;所述
Figure 02_image695
表示所述當前幀經時延對齊處理的右聲道信號。所述
Figure 02_image696
表示所述當前幀的左聲道信號與參考聲道信號之間的幅度相關性參數,所述
Figure 02_image698
表示所述當前幀的右聲道信號與參考聲道信號之間的幅度相關性參數。
在一些可能的實施方式中,所述根據所述當前幀的左右聲道信號與參考聲道信號之間的幅度相關性參數,計算所述當前幀的左右聲道信號之間的幅度相關性差異參數,包括:根據當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數;根據當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數;根據當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀左右聲道之間的幅度相關性差異參數。
其中,平滑處理的方式可以是多樣多樣的,舉例來說:
Figure 02_image700
其中,
Figure 02_image702
,所述A表示所述當前幀的左聲道信號的長時平滑幀能量的更新因數。所述
Figure 02_image704
表示所述當前幀的左聲道信號的長時平滑幀能量;其中,所述
Figure 02_image706
表示所述當前幀左聲道信號的幀能量。
Figure 02_image708
表示當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數。
Figure 02_image710
表示前一幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數。
Figure 02_image712
表示左聲道平滑因數。
舉例來說,
Figure 02_image714
其中,
Figure 02_image716
;所述B表示所述當前幀的右聲道信號的長時平滑幀能量的更新因數。所述
Figure 02_image718
表示所述當前幀的右聲道信號的長時平滑幀能量。其中,所述
Figure 02_image720
表示所述當前幀右聲道信號的幀能量。其中,
Figure 02_image722
表示所述當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
Figure 02_image724
表示前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
Figure 02_image726
表示右聲道平滑因數。
在一些可能的實施方式中,
Figure 02_image728
其中,
Figure 02_image730
表示所述當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,
Figure 02_image732
表示所述當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,所述
Figure 02_image734
表示所述當前幀左右聲道信號之間的幅度相關性差異參數。
在一些可能的實施方式中,所述根據所述當前幀的左右聲道信號之間的幅度相關性差異參數,計算所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數包括:對當前幀的左右聲道信號之間的幅度相關性差異參數進行映射處理,使映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的取值範圍在
Figure 02_image736
之間;將映射處理後的左右聲道信號之間的幅度相關性差異參數轉換為聲道組合比例因數。
在一些可能的實施方式中,對所述當前幀的左右聲道之間的幅度相關性差異參數進行映射處理包括:對所述當前幀的左右聲道信號之間的幅度相關性差異參數進行限幅處理;對經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數進行映射處理。
其中,限幅處理的方式可以是多種多樣的,具體例如:
Figure 02_image738
其中,
Figure 02_image740
表示經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最大值,
Figure 02_image742
表示經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最小值,
Figure 02_image744
其中,映射處理的方式可以是多種多樣的,具體例如:
Figure 02_image746
Figure 02_image748
Figure 02_image750
,或
Figure 02_image752
Figure 02_image754
Figure 02_image756
,或
Figure 02_image758
Figure 02_image760
Figure 02_image762
,或
Figure 02_image764
其中,所述
Figure 02_image766
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數;
其中,
Figure 02_image768
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最大值;
Figure 02_image770
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的高門限;
Figure 02_image772
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的低門限;
Figure 02_image774
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最小值;
其中,
Figure 02_image776
Figure 02_image778
表示經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最大值,
Figure 02_image779
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的高門限,
Figure 02_image781
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的低門限,
Figure 02_image783
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數的最小值;
其中,
Figure 02_image784
又例如,
Figure 02_image786
其中,
Figure 02_image788
表示經限幅處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數;
Figure 02_image790
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數。
其中,
Figure 02_image791
其中,所述
Figure 02_image793
表示所述當前幀的左右聲道信號之間的幅度相關性差異參數的最大幅度,所述
Figure 02_image794
表示所述當前幀的左右聲道信號之間的幅度相關性差異參數的最小幅度。
在一些可能的實施方式中,
Figure 02_image796
其中,所述
Figure 02_image798
表示經映射處理後的所述當前幀的左右聲道信號之間的幅度相關性差異參數。所述
Figure 02_image799
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數,或所述
Figure 02_image799
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值。
在本申請一些實施方式,在需進行聲道組合比例因數修正的場景,修正可以在編碼聲道組合比例因數之前或之後。具體例如,可先計算得到當前幀的聲道組合比例因數(例如非相關性信號聲道組合方案對應的聲道組合比例因數或者相關性信號聲道組合方案對應的聲道組合比例因數)的初始值,而後對聲道組合比例因數的初始值進行編碼,進而得到當前幀的聲道組合比例因數的初始編碼索引,而後再對得到的當前幀的聲道組合比例因數的初始編碼索引進行修正,進而得到當前幀的聲道組合比例因數的編碼索引(得到當前幀的聲道組合比例因數的編碼索引,也就相當於也得到了當前幀的聲道組合比例因數)。或者,也可以先計算得到當前幀的聲道組合比例因數的初始值,而後對計算得到當前幀的聲道組合比例因數的初始值進行修正,進而得到當前幀的聲道組合比例因數,而後在對得到的當前幀的聲道組合比例因數進行編碼,以得到當前幀的聲道組合比例因數的編碼索引。
其中,對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正的方式可以是多種多樣的,例如,在需要通過對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正,來得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的情況下,例如可以基於前一幀的聲道組合比例因數和所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值,來對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正;或者,也可基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值,對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正。
例如,首先,根據當前幀的左聲道信號的長時平滑幀能量、當前幀的右聲道信號的長時平滑幀能量、當前幀的左聲道信號的幀間能量差異、歷史緩存中的緩存前一幀的編碼參數(例如主要聲道信號的幀間相關性、次要聲道信號的幀間相關性)、當前幀以及前一幀的聲道組合方案標識、前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數以及當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值,確定是否需要對當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正。若是,則將前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;否則,將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
當然,通過對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正,來得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的具體實現方式並不限於上述舉例。
803、對確定的所述當前幀的時域立體聲參數進行編碼。
在一些可能的實施方式中,對確定的當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數進行量化編碼,
Figure 02_image800
其中,所述
Figure 02_image802
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書,所述
Figure 02_image804
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,所述
Figure 02_image806
表示當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的量化編碼初始值。
在一些可能的實施方式中,
Figure 02_image808
Figure 02_image810
其中,所述
Figure 02_image812
表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
Figure 02_image813
表示當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引;或者,
Figure 02_image815
Figure 02_image817
其中,
Figure 02_image819
表示所述當前幀的非相關性信號聲道組合方案對應的初始編碼索引,
Figure 02_image820
表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數的最終編碼索引,其中,
Figure 02_image822
為非相關性信號聲道組合方案對應的聲道組合比例因數的修正因數。其中,所述
Figure 02_image812
表示當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
在一些可能的實施方式中,在需要通過對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正,來得到所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的情況下,還可以先所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行量化編碼,所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,然後可以基於前一幀的聲道組合比例因數的編碼索引和所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,來對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引進行修正;或者,也可基於所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引,對所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引進行修正。
例如,可以是先將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行量化編碼,得到當前幀的非相關性信號聲道組合方案對應的初始編碼索引。然後在需要對當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始值進行修正時,將前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引;否則,將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引。最後,將當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引對應的量化編碼值作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
此外,在時域立體聲參數包括聲道間時間差的情況下,根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數可包括:在所述當前幀的聲道組合方案為相關性信號聲道組合方案的情況下,計算所述當前幀的聲道間時間差。並且可將計算得到的所述當前幀的聲道間時間差寫入碼流。在所述當前幀的聲道組合方案為非相關性信號聲道組合方案的情況下使用預設的聲道間時間差(例如0)作為所述當前幀的聲道間時間差。並且可不將默認的聲道間時間差寫入碼流,解碼裝置也使用預設的聲道間時間差。
此外,在另一些可能實施方式中,如果當前幀的聲道組合方案不同於前一幀的聲道組合方案(例如當前幀的聲道組合方案標誌不同於前一幀的聲道組合方案標誌)時,也可將當前幀的聲道組合比例因數的值置為前一幀的聲道組合比例因數的值;否則,可根據聲道組合方案以及時延對齊後的左右聲道信號,按照當前幀的聲道組合方案相對應的方法,提取並編碼當前幀的聲道組合比例因數。
下面還舉例提供一種時域立體聲參數的編碼方法,例如可以包括:確定當前幀的聲道組合方案;根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數;對確定的所述當前幀的時域立體聲參數進行編碼,所述時域立體聲參數包括聲道組合比例因數和聲道間時延差中的至少一種。
相應的,解碼裝置可從碼流中獲得當前幀的時域立體聲參數,進而基於從碼流中獲得的當前幀的時域立體聲參數來進行相關解碼。
下面通過一個更為具體的應用場景進行舉例說明。
參見圖9-A,圖9-A是本申請實施例提供的一種音訊編碼方法的流程示意圖。本申請實施例提供的一種音訊編碼方法可由編碼裝置來實施,方法具體可包括:
901、對當前幀的原始左右聲道信號進行時域預處理。
例如若立體聲音訊信號的取樣速率為16KHz,一幀信號為20ms,幀長記作N,當N=320是表示幀長為320個樣點。其中,當前幀的立體聲信號包括當前幀的左聲道信號和當前幀的右聲道信號。其中,當前幀的原始左聲道信號記作
Figure 02_image824
,當前幀的原始右聲道信號記作
Figure 02_image826
,n為樣點序號,
Figure 02_image827
例如,對當前幀的原始左右聲道信號進行時域預處理可包括:對當前幀的原始左右聲道信號進行高通濾波處理,得到當前幀經時域預處理的左右聲道信號,當前幀經時域預處理的左聲道信號記作
Figure 02_image828
,當前幀經時域預處理的的右聲道信號記作
Figure 02_image830
。其中,n為樣點序號。
Figure 02_image831
。其中,高通濾波處理採用的濾波器例如可為截止頻率為20Hz的無限脈衝回應濾波器(英文:Infinite Impulse Response,縮寫:IIR)濾波器,也可採用其他類型的濾波器。
例如取樣速率為16KHz且對應截止頻率為20Hz的高通濾波器的傳遞函數可為:
Figure 02_image832
其中,
Figure 02_image834
=0.994461788958195,
Figure 02_image836
= -1.988923577916390,
Figure 02_image838
=0.994461788958195,
Figure 02_image840
=1.988892905899653,
Figure 02_image842
= -0.988954249933127,z為Z變換的變換因數。
其中,相應的時域濾波器的傳遞函數可表示為:
Figure 02_image844
Figure 02_image846
902、對當前幀經時域預處理的左右聲道信號進行時延對齊處理,得到當前幀經時延對齊處理的左右聲道信號。
其中,經時延對齊處理的信號可簡稱“時延對齊的信號”。例如經時延對齊處理的左聲道信號可簡稱“時延對齊的左聲道信號”,經時延對齊處理的右聲道信號可簡稱“時延對齊的左聲道信號”,以此類推。
具體地,可根據當前幀預處理後的左右聲道信號提取聲道間時延參數並編碼,根據編碼後的聲道間時延參數對左右聲道信號進行時延對齊處理,得到當前幀經時延對齊處理的左右聲道信號。其中,當前幀經時延對齊處理的左聲道信號記作
Figure 02_image848
,當前幀經時延對齊處理的右聲道信號記作
Figure 02_image849
,其中,n為樣點序號,
Figure 02_image850
具體例如,編碼裝置可根據當前幀預處理後的左右聲道信號計算左右聲道間的時域互相關函數。搜索左右聲道間的時域互相關函數的最大值(或其它值)以確定左右聲道信號間的時延差。對確定的左右聲道間的時延差進行量化編碼。根據量化編碼後的左右聲道間時延差,以左右聲道中選定的一個聲道的信號為基準,對另一個聲道的信號進行時延調整,從而獲得當前幀經時延對齊處理的左右聲道信號。
值得注意的是,時延對齊處理的具體實現方法有很多種,本申請實施例中對具體時延對齊處理方法不做限定。
903、對當前幀經時延對齊處理的左右聲道信號進行時域分析。
具體地,時域分析可以包括瞬態檢測等。其中,瞬態檢測可以是對分別當前幀經時延對齊處理的左右聲道信號進行能量檢測(具體可檢測當前幀是否發生能量突變)。例如,當前幀經時延對齊處理的左聲道信號的能量表示為
Figure 02_image851
,前一幀時延對齊後的左聲道信號的能量表示為
Figure 02_image853
,那麼可根據
Figure 02_image855
Figure 02_image856
之間的差值的絕對值來進行瞬態檢測,得到當前幀經時延對齊處理的左聲道信號的瞬態檢測結果。同理,可以用同樣的方法對當前幀經時延對齊處理的左聲道信號進行瞬態檢測。時域分析也可以包括除瞬態檢測之外的其他傳統方式的時域分析,例如可包括頻帶擴展預處理等。
可以理解,步驟903可在步驟902之後,在對當前幀的主要聲道信號編碼和次要聲道信號編碼之前的任意位置執行。
904、根據當前幀經時延對齊處理的左右聲道信號進行當前幀的聲道組合方案判決以確定當前幀的聲道組合方案。
本實施例中舉例兩種可能的聲道組合方案,以下描述中分別稱為相關性信號聲道組合方案和非相關性信號聲道組合方案。本實施例中,相關性信號聲道組合方案對應了當前幀(時延對齊後的)左右聲道信號為類正相信號的情況下,而非相關性信號聲道組合方案對應了當前幀(時延對齊後的)左右聲道信號為類反相信號的情況。當然,除了用“相關性信號聲道組合方案”和“非相關性信號聲道組合方案”來表徵這兩種可能的聲道組合方案之外,在實際應用中不限於用其他的名稱命名這兩種不同的聲道組合方案。
本實施例一些方案中,聲道組合方案判決可分為聲道組合方案初始判決和聲道組合方案修正判決。可以理解,通過進行當前幀的聲道組合方案判決,進而確定所述當前幀的聲道組合方案。其中,確定當前幀的聲道組合方案的一些舉例實施方式,可參考上述實施例的相關描述,此處不再贅述。
905、根據當前幀經時延對齊處理的左右聲道信號和當前幀的聲道組合方案標識,計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數並編碼,得到當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引。
具體例如,首先根據當前幀經時延對齊處理的左右聲道信號計算當前幀的左右聲道信號的幀能量。
其中,當前幀左聲道信號的幀能量
Figure 02_image857
滿足:
Figure 02_image858
其中,當前幀右聲道信號的幀能量
Figure 02_image860
滿足:
Figure 02_image861
其中,
Figure 02_image863
表示當前幀經時延對齊處理的左聲道信號。
其中,
Figure 02_image864
表示當前幀經時延對齊處理的右聲道信號。
然後,根據當前幀左聲道的幀能量和右聲道的幀能量,計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數。其中,計算得到的當前幀相關性信號聲道組合方案對應的聲道組合比例因數
Figure 02_image865
滿足:
Figure 02_image867
然後,對計算得到的當前幀相關性信號聲道組合方案對應的聲道組合比例因數
Figure 02_image865
進行量化編碼,得到對應的編碼索引
Figure 02_image869
,及量化編碼後的當前幀相關性信號聲道組合方案對應的聲道組合比例因數
Figure 02_image871
Figure 02_image873
其中,
Figure 02_image875
為標量量化的碼書。其中,量化編碼可以採用傳統的任何一種標量量化方法,例如均勻標量量化,也可以是非均勻標量量化,編碼比特數例如為5比特,這裡對標量量化的具體方法不再贅述。
量化編碼後的當前幀相關性信號聲道組合方案對應的聲道組合比例因數
Figure 02_image877
即為得到的當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值,編碼索引
Figure 02_image879
即為當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值對應的編碼索引。
另外,還可根據當前幀的聲道組合方案標識
Figure 02_image880
的值,對當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值對應的編碼索引進行修正。
例如,量化編碼為5比特的標量量化,則當
Figure 02_image882
時,將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值對應的編碼索引
Figure 02_image884
修正為某一預先設定值(例如15或其他取值);並且,可將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值修正為
Figure 02_image885
值得注意的是,除了上述計算方法,還可根據時域立體聲編碼傳統技術中任何一種計算聲道組合方案對應的聲道組合比例因數的方法,計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數。也可直接將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值設置為固定值(例如0.5或其他值)。
906、可根據聲道組合比例因數修正標識來判決是否需對聲道組合比例因數進行修正。
若是,則修正當前幀相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引,得到當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值及其編碼索引。
其中,當前幀的聲道組合比例因數修正標識記作
Figure 02_image887
。例如聲道組合比例因數修正標識取值為0,表示無需進行聲道組合比例因數的修正,聲道組合比例因數修正標識取值為1,表示需進行聲道組合比例因數的修正。當然聲道組合比例因數修正標識也可選用其它不同的取值來表示是否需進行聲道組合比例因數的修正。
例如,根據聲道組合比例因數修正標識判決是否需對聲道組合比例因數進行修正具體可包括:例如若聲道組合比例因數修正標識
Figure 02_image889
,則判決需對聲道組合比例因數進行修正。又例如若聲道組合比例因數修正標識
Figure 02_image891
,則判決無需對聲道組合比例因數進行修正。
其中,修正當前幀相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引具體可以包括:
例如當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值對應的編碼索引滿足:
Figure 02_image893
,其中,
Figure 02_image894
為上一幀相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引。
那麼,當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值
Figure 02_image895
滿足:
Figure 02_image896
907、根據當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引、當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值及其編碼索引、以及聲道組合比例因數修正標識,確定當前幀相關性信號聲道組合方案對應的聲道組合比例因數
Figure 02_image897
和編碼索引
Figure 02_image899
具體例如,確定的相關性信號聲道組合方案對應的聲道組合比例因數
Figure 02_image897
滿足:
Figure 02_image901
其中,上述
Figure 02_image903
表示當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的初始值,上述
Figure 02_image905
表示當前幀的相關性信號聲道組合方案對應的聲道組合比例因數的修正值,上述
Figure 02_image907
表示當前幀的聲道組合比例因數修正標識。
其中,確定的相關性信號聲道組合方案對應的聲道組合比例因數對應的編碼索引
Figure 02_image899
滿足:
Figure 02_image909
其中,
Figure 02_image911
表示當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值對應的編碼索引,
Figure 02_image913
表示當前幀相關性信號聲道組合方案對應的聲道組合比例因數的修正值對應的編碼索引。
908、判斷當前幀的聲道組合方案標識是否對應非相關性信號聲道組合方案,若是則計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼,得到非相關性信號聲道組合方案對應的聲道組合比例因數和編碼索引。
首先,可判斷是否需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置。
例如若當前幀的聲道組合方案標識
Figure 02_image914
等於1(例如
Figure 02_image914
等於1表示當前幀的聲道組合方案標識對應非相關性信號聲道組合方案),而前一幀的聲道組合方案標識
Figure 02_image916
等於0(例如
Figure 02_image916
等於0表示當前幀的聲道組合方案標識對應相關性信號聲道組合方案),則表示需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置。
值得注意的是,判斷是否需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置,也可以通過在聲道組合方案初始判決和聲道組合方案修正判決的過程中確定歷史緩存重置標識
Figure 02_image918
,然後,通過判斷歷史緩存重置標識的取值來實現。例如
Figure 02_image920
為1,表示當前幀的聲道組合方案標識對應了非相關性信號聲道組合方案而前一幀的聲道組合方案標識對應了相關性信號聲道組合方案。例如歷史緩存重置標識
Figure 02_image921
等於1,表示需要對計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存進行重置。具體的重置方法有很多種,可以是將計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中的所有參數均按照預先設定的初始值進行重置;或者也可以是將計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中的部分參數均按照預先設定的初始值進行重置;或者還可將計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中的部分參數均按照預先設定的初始值進行重置,而另一部分參數按照計算相關性信號聲道組合方案對應的聲道組合比例因數用到的歷史緩存中對應的參數值進行重置。
接下來,進一步判斷當前幀的聲道組合方案標識
Figure 02_image923
是否對應非相關性信號聲道組合方案。其中,非相關性信號聲道組合方案是一種更加適合於對類反相立體聲信號進行時域下混的聲道組合方案。其中,在本實施例中,在當前幀的聲道組合方案標識
Figure 02_image925
時,表徵當前幀的聲道組合方案標識對應了非相關性信號聲道組合方案;在當前幀的聲道組合方案標識
Figure 02_image927
時,表徵當前幀的聲道組合方案標識對應了相關性信號聲道組合方案。
判斷當前幀的聲道組合方案標識是否對應非相關性信號聲道組合方案具體可包括:
判斷當前幀的聲道組合方案標識的值是否為1。若當前幀的聲道組合方案標識
Figure 02_image929
,表示當前幀的聲道組合方案標識對應非相關性信號聲道組合方案。在這種情況下,可計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼。
參見圖9-B,計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼例如可包括如下的步驟9081-9085。
9081、對當前幀經時延對齊處理的左右聲道信號進行信號能量分析。
分別得到當前幀左聲道信號的幀能量、當前幀右聲道信號的幀能量、當前幀左聲道的長時平滑幀能量、當前幀右聲道的長時平滑幀能量、當前幀左聲道的幀間能量差異和當前幀右聲道的幀間能量差異。
例如當前幀左聲道信號的幀能量
Figure 02_image930
滿足:
Figure 02_image931
其中,當前幀右聲道信號的幀能量
Figure 02_image860
滿足:
Figure 02_image861
其中,
Figure 02_image694
表示當前幀經時延對齊處理的左聲道信號。
其中,
Figure 02_image695
表示當前幀經時延對齊處理的右聲道信號。
例如當前幀左聲道的長時平滑幀能量
Figure 02_image704
滿足:
Figure 02_image702
其中,
Figure 02_image932
表示前一幀左聲道的長時平滑幀能量,A表示左聲道長時平滑幀能量的更新因數,A例如可以取0到1之間的實數,A例如可等於0.4。
例如當前幀右聲道的長時平滑幀能量
Figure 02_image934
滿足:
Figure 02_image716
其中,
Figure 02_image718
表示前一幀右聲道的長時平滑幀能量,B表示右聲道長時平滑幀能量的更新因數,B例如可以取0到1之間的實數,B例如可以和左聲道長時平滑幀能量的更新因數取相同或不同的數值,B例如也可等於0.4。
例如當前幀左聲道的幀間能量差異
Figure 02_image936
滿足:
Figure 02_image938
例如當前幀右聲道的幀間能量差異
Figure 02_image940
滿足:
Figure 02_image942
9082、根據當前幀經時延對齊處理的左右聲道信號確定當前幀的參考聲道信號。參考聲道信號也可被稱作單聲道信號,若將參考聲道信號稱作單聲道信號,則後續所有與參考聲道相關的描述和參數命名,則可以統一將參考聲道信號替換為單聲道信號。
例如參考聲道信號
Figure 02_image944
滿足:
Figure 02_image690
其中,
Figure 02_image945
為當前幀經時延對齊處理的左聲道信號,其中,
Figure 02_image946
為當前幀經時延對齊處理的右聲道信號。
9083、分別計算當前幀經時延對齊處理的左右聲道信號與參考聲道信號之間的幅度相關性參數。
例如,當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image947
例如滿足:
Figure 02_image948
例如當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image950
例如滿足:
Figure 02_image951
其中,
Figure 02_image953
表示當前幀經時延對齊處理的左聲道信號。其中,
Figure 02_image954
表示當前幀經時延對齊處理的右聲道信號。
Figure 02_image955
表示當前幀的參考聲道信號。
Figure 02_image956
表示取絕對值。
9084、根據當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀左右聲道之間的幅度相關性差異參數
Figure 02_image958
可以理解,步驟9081可在步驟9082、9083之前執行,或者也可以在步驟9082、9083之後且在步驟9084之前執行。
參見圖9-C,例如,計算當前幀左右聲道之間的幅度相關性差異參數
Figure 02_image958
具體可包括如下步驟90841-90842。
90841、根據當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數,以及當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
例如一種計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,可包括:當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image959
滿足:
Figure 02_image700
其中,
Figure 02_image708
表示當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,
Figure 02_image710
表示前一幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,
Figure 02_image712
表示左聲道平滑因數,其中,
Figure 02_image712
可以是預先設定的0到1之間的實數,如0.2、0.5、0.8。或者,
Figure 02_image712
的取值也可以通過自我調整計算得到。
例如當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image960
滿足:
Figure 02_image714
其中,
Figure 02_image722
表示當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,
Figure 02_image724
表示前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,
Figure 02_image726
表示右聲道平滑因數,其中,
Figure 02_image726
可以是預先設定的0到1之間的實數,
Figure 02_image726
可以和左聲道平滑因數
Figure 02_image712
取值相同或不同,例如
Figure 02_image726
可等於0.2、0.5、0.8。或者
Figure 02_image726
的取值也可以通過自我調整計算得到。
另一種計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數的方法,可包括:
首先,對當前幀經時延對齊處理的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image961
進行修正,得到修正後的當前幀左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image962
;對當前幀經時延對齊處理的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image964
進行修正,得到修正後的當前幀右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image965
然後,根據修正後的當前幀左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image967
和修正後的當前幀右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image968
,以及前一幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image969
和前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image970
,確定當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image971
及前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image973
接下來,根據當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image975
及前一幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image976
,獲得當前幀的左右聲道之間的幅度相關性差異參數的初始值
Figure 02_image977
;並根據獲得的當前幀的左右聲道之間的幅度相關性差異參數的初始值
Figure 02_image979
以及前一幀的左右聲道之間的幅度相關性差異參數
Figure 02_image980
,確定當前幀的左右聲道之間的幅度相關性差異的幀間變化參數
Figure 02_image982
最後,根據信號能量分析而獲得的當前幀左聲道信號的幀能量、當前幀右聲道信號的幀能量幀能量、當前幀左聲道的長時平滑幀能量、當前幀右聲道的長時平滑幀能量、當前幀左聲道的幀間能量差異、當前幀右聲道的幀間能量差異以及當前幀的左右聲道之間的幅度相關性差異的幀間變化參數,自我調整選擇不同的左聲道平滑因數、右聲道平滑因數,並計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image984
以及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數
Figure 02_image985
除以上舉例的兩種方法,還可以有很多種計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數的方法,本申請對此不作限定。
90842、根據當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數,計算當前幀左右聲道之間的幅度相關性差異參數
Figure 02_image986
例如當前幀左右聲道之間的幅度相關性差異參數
Figure 02_image734
滿足:
Figure 02_image728
其中,
Figure 02_image730
表示當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,
Figure 02_image732
表示當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數。
9085、將當前幀左右聲道之間的幅度相關性差異參數
Figure 02_image986
轉換為聲道組合比例因數並進行編碼量化,以確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引。
參見圖9-D,將當前幀左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數的一種可能方法具體可以包括步驟90851-90853。
90851、對左右聲道之間的幅度相關性差異參數進行映射處理,使映射處理後的左右聲道之間的幅度相關性差異參數的取值範圍在
Figure 02_image736
之間。
對左右聲道之間的幅度相關性差異參數進行映射處理的一種方法可包括:
首先,對左右聲道之間的幅度相關性差異參數進行限幅處理,例如經限幅處理後的左右聲道之間的幅度相關性差異參數
Figure 02_image987
滿足:
Figure 02_image738
Figure 02_image740
表示限幅後左右聲道之間的幅度相關性差異參數的最大值,
Figure 02_image742
表示限幅後左右聲道之間的幅度相關性差異參數的最小值。其中,
Figure 02_image988
例如為預先設定的經驗值,
Figure 02_image988
例如為1.5、3.0或其他值。其中,
Figure 02_image989
例如為預先設定的經驗值,
Figure 02_image989
例如為-1.5、-3.0或其他值。其中,
Figure 02_image744
然後,對限幅處理後的左右聲道之間的幅度相關性差異參數進行映射處理。映射處理後的左右聲道之間的幅度相關性差異參數
Figure 02_image990
滿足:
Figure 02_image992
其中,
Figure 02_image748
Figure 02_image750
,或者
Figure 02_image752
Figure 02_image754
Figure 02_image756
,或者
Figure 02_image758
Figure 02_image760
Figure 02_image762
,或者
Figure 02_image764
其中,
Figure 02_image768
表示映射處理後的左右聲道之間的幅度相關性差異參數取值的最大值,
Figure 02_image770
表示映射處理後的左右聲道之間的幅度相關性差異參數取值的高門限,
Figure 02_image772
表示映射處理後的左右聲道之間的幅度相關性差異參數取值的低門限。
Figure 02_image774
表示映射處理後的左右聲道之間的幅度相關性差異參數取值的最小值。
其中,
Figure 02_image776
例如在本申請的一些實施例中,
Figure 02_image993
可為2.0,
Figure 02_image994
可為1.2,
Figure 02_image995
可為0.8,
Figure 02_image996
可為0.0。當然實際應用中不限於這樣的取值舉例。
Figure 02_image778
表示限幅後左右聲道之間的幅度相關性差異參數的最大值,
Figure 02_image779
表示限幅後左右聲道之間的幅度相關性差異參數取值的高門限,
Figure 02_image781
表示限幅後左右聲道之間的幅度相關性差異參數取值的低門限,
Figure 02_image783
表示限幅後左右聲道之間的幅度相關性差異參數的最小值。
其中,
Figure 02_image784
例如在本申請一些實施例中,
Figure 02_image997
為1.5,
Figure 02_image998
為0.75,
Figure 02_image999
為-0.75,
Figure 02_image1000
為-1.5。當然實際應用中不限於這樣的取值舉例。
本申請的一些實施例的另一種方法是:映射處理後的左右聲道之間的幅度相關性差異參數
Figure 02_image1001
滿足:
Figure 02_image1002
其中,
Figure 02_image788
表示經過限幅處理後的左右聲道之間的幅度相關性差異參數。
其中,
Figure 02_image1003
其中,
Figure 02_image1004
表示左右聲道之間的幅度相關性差異參數的最大幅度,
Figure 02_image1005
表示左右聲道之間的幅度相關性差異參數的最小幅度。其中,
Figure 02_image1006
可以為預先設定的經驗值,
Figure 02_image1006
例如可為1.5、3.0或其他大於0的實數。
90852、將映射處理後的左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數。
聲道組合比例因數
Figure 02_image1007
滿足:
Figure 02_image796
其中,
Figure 02_image1008
表示余弦運算。
除了上述方法之外,還可以通過其他方法將左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數,例如:
根據信號能量分析而獲得的當前幀左聲道的長時平滑幀能量、當前幀右聲道的長時平滑幀能量、當前幀左聲道的幀間能量差異、編碼器歷史緩存中的緩存前一幀的編碼參數(例如主要聲道信號的幀間相關性參數、次要聲道信號的幀間相關性參數)、當前幀以及前一幀的聲道組合方案標識、當前幀以及前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數,確定是否對非相關性信號聲道組合方案對應的聲道組合比例因數進行更新。
若需要對非相關性信號聲道組合方案對應的聲道組合比例因數進行更新,則使用上述舉例方法將左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數;否則,直接將前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引,作為當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引。
90853、對轉換後得到的聲道組合比例因數進行量化編碼,確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數。
具體例如,對轉換後得到的聲道組合比例因數進行量化編碼,得到當前幀非相關性信號聲道組合方案對應的初始編碼索引
Figure 02_image804
,及量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值
Figure 02_image806
其中,
Figure 02_image800
其中,
Figure 02_image802
表示非相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書。
其中,量化編碼可以採用傳統技術中的任何一種標量量化方法,如均勻標量量化,也可以是非均勻標量量化,編碼比特數可以是5比特,這裡對具體方法不再贅述。非相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書可以採用和相關性信號聲道組合方案對應的聲道組合比例因數標量量化的碼書相同或不同的碼書。其中,當碼書相同,這樣可只需要存儲一個用於聲道組合比例因數標量量化的碼書即可。此時,量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值
Figure 02_image1010
其中,
Figure 02_image1012
例如,一種方法是將量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值直接作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數,並將當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始編碼索引直接作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,即:
其中,當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引
Figure 02_image813
滿足:
Figure 02_image808
其中,當前幀非相關性信號聲道組合方案對應的聲道組合比例因數滿足:
Figure 02_image810
另一種方法可以是:根據前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引或者前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數,對量化編碼後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的初始值以及當前幀非相關性信號聲道組合方案對應的初始編碼索引進行修正,將修正後的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,將修正後的非相關性信號聲道組合方案對應的聲道組合比例因數作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數。
其中,當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引
Figure 02_image1014
滿足:
Figure 02_image815
其中,
Figure 02_image819
表示當前幀非相關性信號聲道組合方案對應的初始編碼索引,
Figure 02_image820
為前一幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引,
Figure 02_image822
為非相關性信號聲道組合方案對應的聲道組合比例因數的修正因數。
Figure 02_image822
的取值可為經驗值,例如
Figure 02_image822
可等於0.8。
則當前幀非相關性信號聲道組合方案對應的聲道組合比例因數滿足:
Figure 02_image817
還有一種方法是:將未量化的非相關性信號聲道組合方案對應的聲道組合比例因數,作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數,即當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的
Figure 02_image1015
滿足:
Figure 02_image1016
此外,第四種方法是:根據前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數,對未量化的當前幀非相關性信號聲道組合方案對應的聲道組合比例因數進行修正,將修正後的非相關性信號聲道組合方案對應的聲道組合比例因數,作為當前幀非相關性信號聲道組合方案對應的聲道組合比例因數,並對其進行量化編碼,得到當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引。
除以上述方法,還可以有很多種方法來將左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數並進行編碼量化,同樣也有很多不同的方法來確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數及其編碼索引,本申請對此不作限定。
909、根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
其中,當前幀的聲道組合方案標識可記作
Figure 02_image1018
其中,前一幀的聲道組合方案標識可記作
Figure 02_image194
其中,當前幀的下混模式標識可記作
Figure 02_image1020
其中,前一幀的下混模式標識可記作
Figure 02_image1022
類似的,可以使用
Figure 02_image1024
來表示當前幀的編碼模式。
具體例如,
Figure 02_image1024
=0表示當前幀的編碼模式為下混模式A到下混模式A對應的編碼模式;
Figure 02_image1024
=1表示當前幀的編碼模式為下混模式A切換到下混模式B對應的編碼模式;
Figure 02_image1024
=2表示當前幀的編碼模式為下混模式A切換到下混模式C對應的編碼模式。
又具體例如,
Figure 02_image1024
=3表示當前幀的編碼模式為下混模式B到下混模式B對應的編碼模式。
Figure 02_image1024
=4表示當前幀的編碼模式為下混模式B切換到下混模式A對應的編碼模式。
Figure 02_image1024
=5表示當前幀的編碼模式為下混模式B切換到下混模式D對應的編碼模式。
又具體例如,
Figure 02_image1024
=6表示當前幀的編碼模式為下混模式C到下混模式C對應的編碼模式。
Figure 02_image1024
=7表示當前幀的編碼模式為下混模式C切換到下混模式A對應的編碼模式。
Figure 02_image1024
=8表示當前幀的編碼模式為下混模式C切換到下混模式D對應的編碼模式。
又具體例如,
Figure 02_image1024
=9表示當前幀的編碼模式為下混模式D到下混模式D對應的編碼模式。
Figure 02_image1024
=10表示當前幀的編碼模式為下混模式D切換到下混模式B對應的編碼模式。
Figure 02_image1024
=11表示當前幀的編碼模式為下混模式D切換到下混模式C對應的編碼模式。
其中,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式的具體實施方式可以參考其它實施例的相關描述,此處不再贅述。
910、在確定當前幀的編碼模式
Figure 02_image1024
之後,編碼裝置根據當前幀的編碼模式對當前幀的左右聲道信號進行時域下混處理以得到當前幀的主次聲道信號。
其中,不同編碼模式進行時域下混處理的實施方式,可參考上述實施例中的相關舉例描述,此處不再贅述。
911、編碼裝置對主要聲道信號和次要聲道信號分別進行編碼,得到主要聲道編碼信號和次要聲道編碼信號。
具體地,可以先根據前一幀的主要聲道信號和/或次要聲道信號編碼中得到的參數資訊以及主要聲道信號編碼和次要聲道信號編碼的總比特數,對主要聲道信號編碼和次要聲道信號編碼進行比特分配。然後根據比特分配的結果,分別對主要聲道信號和次要聲道信號進行編碼,得到主要聲道編碼的編碼索引、次要聲道編碼的編碼索引。主要聲道編碼和次要聲道編碼,可以採用任何一種單聲道音訊編碼技術,這裡不再贅述。
912、編碼裝置根據聲道組合方案標識選擇相應的聲道組合比例因數編碼索引寫入碼流,並將主要聲道編碼信號、次要聲道編碼信號以及當前幀的下混模式標識
Figure 02_image1020
寫入碼流。
具體例如,若當前幀的聲道組合方案標識
Figure 02_image1026
對應了相關性信號聲道組合方案,則將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引
Figure 02_image1027
寫入碼流;若當前幀的聲道組合方案標識
Figure 02_image1028
對應了非相關性信號聲道組合方案,則將當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引
Figure 02_image1029
寫入碼流。
例如,
Figure 02_image1030
,則將當前幀相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引
Figure 02_image1032
寫入碼流;
Figure 02_image1033
,則將當前幀非相關性信號聲道組合方案對應的聲道組合比例因數的編碼索引
Figure 02_image1035
寫入碼流。
並且,將主要聲道編碼信號、次要聲道編碼信號以及當前幀的下混模式標識
Figure 02_image1020
等寫入位元流。可以理解的是,寫碼流操作無先後順序。
相應的,下面針對時域立體聲的解碼場景進行舉例說明。
參見圖10,下面還提供一種音訊解碼方法,音訊解碼方法的相關步驟可由解碼裝置來具體實施,具體可包括:
1001、根據碼流進行解碼以得到當前幀的主次聲道解碼信號。
1002、根據碼流進行解碼以得到當前幀的時域立體聲參數。
其中,當前幀的時域立體聲參數包括當前幀的聲道組合比例因數(碼流包含的是當前幀的聲道組合比例因數的編碼索引,基於當前幀的聲道組合比例因數的編碼索引進行解碼可以得到當前幀的聲道組合比例因數),還可包括當前幀的聲道間時間差(例如,碼流包含的是當前幀的聲道間時間差的編碼索引,基於當前幀的聲道間時間差的編碼索引進行解碼可以得到當前幀的聲道間時間差;或者碼流包含的是當前幀的聲道間時間差的絕對值得編碼索引,基於當前幀的聲道間時間差的絕對值的編碼索引進行解碼可以得到當前幀的聲道間時間差的絕對值)等。
1003、基於碼流得到所述碼流中包含的當前幀的下混模式標識確定所述當前幀的下混模式。
1004、基於所述當前幀的下混模式和前一幀的下混模式確定當前幀的編碼模式。
例如當前幀的下混模式標識
Figure 02_image1020
為(00),則表示當前幀的下混模式為下混模式A;當前幀的下混模式標識
Figure 02_image1020
為(11),則表示當前幀的下混模式為下混模式B;當前幀的下混模式標識
Figure 02_image1020
為(01),則表示當前幀的下混模式為下混模式C;當前幀的下混模式標識
Figure 02_image1020
為(10),則表示當前幀的下混模式為下混模式D。
可以理解,步驟1001、步驟1002、步驟1003-1004的執行沒有必然的先後順序。
1005、根據確定的當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
其中,不同編碼模式進行時域上混處理的相關實施方式可參考上述實施例中的相關舉例描述,此處不再贅述。
其中,時域上混處理所使用的上混矩陣基於得到的當前幀的聲道組合比例因數構建。
其中,當前幀的左右聲道重建信號可作為所述當前幀的左右聲道解碼信號。
或者,進一步的,還可基於當前幀的聲道間時間差對當前幀的左右聲道重建信號進行時延調整,得到當前幀經時延調整的左右聲道重建信號,當前幀經時延調整的左右聲道重建信號可作為當前幀的左右聲道解碼信號。或者,進一步的,還可對當前幀經時延調整的左右聲道重建信號進行時域後處理,其中,當前幀經時域後處理的左右聲道重建信號可作為所述當前幀的左右聲道解碼信號。
上述詳細闡述了本申請實施例的方法,下面提供了本申請實施例的裝置。
參見圖11-A,本申請實施例還提供一種裝置1100,可包括:
相互耦合的處理器1110和記憶體1120。所述記憶體1110存儲有電腦程式;所述處理器1120調用所述記憶體存儲的電腦程式,用於執行本申請實施例提供的任意一種方法的部分或全部步驟。
記憶體1120包括但不限於是隨機存儲記憶體(英文:Random Access Memory,簡稱:RAM)、唯讀記憶體(英文:Read-Only Memory,簡稱:ROM)、可擦除可程式設計唯讀記憶體(英文:Erasable Programmable Read Only Memory,簡稱:EPROM)、或可擕式唯讀記憶體(英文:Compact Disc Read-Only Memory,簡稱:CD-ROM),該記憶體402用於相關指令及資料。
當然,裝置1100還可包括用於接收和發送資料的收發器1130。
處理器1110可以是一個或多個中央處理器(英文:Central Processing Unit,簡稱:CPU),在處理器1110是一個CPU的情況下,該CPU可以是單核CPU,也可以是多核CPU。處理器1110具體可以是數位訊號處理器。
在實現過程中,上述方法的各步驟可通過處理器1110中的硬體的集成邏輯電路或者軟體形式的指令完成。上述處理器1110可以是通用處理器、數位訊號處理器、專用積體電路、現成可程式設計閘陣列或者其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件。處理器1110可以實現或者執行本發明實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本發明實施例所公開的方法的步驟可以直接體現為硬體解碼處理器執行完成,或者用解碼處理器中的硬體及軟體模組組合執行完成。
軟體模組可以位於隨機記憶體,快閃記憶體、唯讀記憶體,可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、寄存器等等本領域成熟的存儲介質之中。該存儲介質位於記憶體1120,例如處理器1110可讀取記憶體1120中的資訊,結合其硬體完成上述方法的步驟。
進一步的,裝置1100還可包括收發器1130,收發器1130例如可用於相關資料(例如指令或聲道信號或碼流)的收發。
舉例來說,裝置1100可以執行上述圖2、圖3、圖6、圖7、圖8、圖10、圖9-A-圖9-D任意一附圖所示實施例中對應的方法的部分或全部步驟。具體例如,當裝置1100執行上述編碼的相關步驟時,裝置1100可稱為編碼裝置(或音訊編碼裝置)。當裝置1100執行上述解碼的相關步驟時,裝置1100可稱為解碼裝置(或音訊解碼裝置)。
參見圖11-B,在裝置1100為編碼裝置的情況下,裝置1100例如還可進一步包括:麥克風1140和類比數位轉換器1150等。
其中,麥克風1140例如可用於採樣得到類比音訊信號。
類比數位轉換器1150例如可用於將類比音訊信號轉換為數位音訊信號。
參見圖11-C,在裝置1100為解碼裝置的情況下,裝置1100例如還可進一步包括:揚聲器1160和數位類比轉換器1170等。
數位類比轉換器1170例如可用於將數位音訊信號轉換為類比音訊信號。
其中,揚聲器1160例如可用於播放類比音訊信號。
此外,參見圖12-A,本申請實施例提供一種裝置1200,包括用於實施本申請實施例提供的任意一種方法的若干個功能單元。
例如,當裝置1200執行圖2所示實施例中對應的方法時,裝置1200可包括: 第一確定單元1210,用於確定當前幀的聲道組合方案,根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。 編碼單元1220,用於根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
此外參見圖12-B,裝置1200還可包括第二確定單元1230,用於確定當前幀的時域立體聲參數。編碼單元1220還可用於對當前幀的時域立體聲參數進行編碼。
又例如,參見圖12-C,當裝置1200執行圖3所示實施例中對應的方法時,裝置1200可包括:第三確定單元1240,用於根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式。
解碼單元1250,用於根據碼流進行解碼以得到當前幀的主次聲道解碼信號;根據碼流進行解碼以確定所述當前幀的下混模式,根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號。
這個裝置執行其他方法時的情況以此類推。
本申請實施例提供一種電腦可讀存儲介質,所述電腦可讀存儲介質存儲了程式碼,所述程式碼包括用於執行本申請實施例提供的任意一種方法的部分或全部步驟的指令。
本申請實施例提供一種電腦程式產品,當所述電腦程式產品在電腦上運行時,使得所述電腦執行本申請實施例提供的任意一種方法的部分或全部步驟。
在上述實施例中,對各個實施例的描述都各有側重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。
在本申請所提供的幾個實施例中,應該理解到,所揭露的裝置,可通過其它的方式實現。例如以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或元件可結合或者可以集成到另一個系統,或一些特徵可以忽略或不執行。另一點,所顯示或討論的相互之間的間接耦合或者直接耦合或通信連接可以是通過一些介面,裝置或單元的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例的方案的目的。
另外,在本發明各實施例中的各功能單元可集成在一個處理單元中,也可以是各單元單獨物理存在,也可兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,或者也可以採用軟體功能單元的形式實現。
所述集成的單元如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解,本發明的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟體產品的形式體現出來,該電腦軟體產品存儲在一個存儲介質中,包括若干指令用以使得一台電腦設備(可為個人電腦、伺服器或者網路設備等)執行本發明各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、唯讀記憶體(ROM,Read-Only Memory)、隨機存取記憶體(RAM,Random Access Memory)、移動硬碟、磁碟或者光碟等各種可以存儲程式碼的介質。
201‧‧‧確定當前幀的聲道組合方案202‧‧‧根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式203‧‧‧根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號,對得到的所述當前幀的主次聲道信號進行編碼301‧‧‧根據碼流進行解碼以得到當前幀的主次聲道解碼信號302‧‧‧根據碼流進行解碼以確定所述當前幀的下混模式303‧‧‧根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式304‧‧‧根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號下混模式A下混模式B下混模式C下混模式D滿足第一下混模式切換條件滿足第二下混模式切換條件滿足第三下混模式切換條件滿足第四下混模式切換條件滿足第五下混模式切換條件滿足第六下混模式切換條件滿足第七下混模式切換條件滿足第八下混模式切換條件滿足第九下混模式切換條件滿足第十下混模式切換條件滿足第十一下混模式切換條件滿足第十二下混模式切換條件滿足第十三下混模式切換條件滿足第十四下混模式切換條件滿足第十五下混模式切換條件滿足第十六下混模式切換條件601‧‧‧確定當前幀的聲道組合方案602‧‧‧根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式701‧‧‧根據碼流進行解碼以確定所述當前幀的下混模式702‧‧‧根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式801‧‧‧確定當前幀的聲道組合方案802‧‧‧根據所述當前幀的聲道組合方案確定所述當前幀的時域立體聲參數,所述時域立體聲參數包括聲道組合比例因數和聲道間時延差中的至少一種803‧‧‧對確定的所述當前幀的時域立體聲參數進行編碼901‧‧‧對當前幀的原始左右聲道信號進行時域預處理902‧‧‧對當前幀經時域預處理的左右聲道信號進行時延對齊處理,得到當前幀經時延對齊處理的左右聲道信號903‧‧‧對當前幀經時延對齊處理的左右聲道信號進行時域分析904‧‧‧根據當前幀經時延對齊處理的左右聲道信號進行當前幀的聲道組合方案判決以確定當前幀的聲道組合方案905‧‧‧計算當前幀相關性信號聲道組合方案對應的聲道組合比例因數的初始值及其編碼索引906‧‧‧根據聲道組合比例因數修正標識來判決是否需對聲道組合比例因數進行修正907‧‧‧確定當前幀相關性信號聲道組合方案對應的聲道組合比例因數和編碼索引908‧‧‧計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼909‧‧‧根據前一幀的聲道組合方案標識和當前幀的聲道組合方案標識進行編碼模式判決,以確定當前幀的編碼模式910‧‧‧根據當前幀的編碼模式採用對應的時域下混處理方法對當前幀的左右聲道信號進行時域下混處理,以得到當前幀的主要聲道信號和次要聲道信號911‧‧‧對主要聲道信號和次要聲道信號分別進行編碼,得到主要聲道編碼信號和次要聲道編碼信號912‧‧‧根據聲道組合方案標識選擇相應的聲道組合比例因數編碼索引寫入碼流,並將主要聲道編碼信號‧‧‧次要聲道編碼信號以及當前幀的下混模式標識寫入碼流9081‧‧‧對當前幀經時延對齊處理的左右聲道信號進行信號能量分析9082‧‧‧根據當前幀經時延對齊處理的左右聲道信號確定當前幀的參考聲道信號9083‧‧‧分別計算當前幀經時延對齊處理的左右聲道信號與參考聲道信號之間的幅度相關性參數9084‧‧‧計算當前幀左右聲道之間的幅度相關性差異參數9085‧‧‧將當前幀左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數並進行編碼量化90841‧‧‧計算當前幀長時平滑後的左聲道信號與參考聲道信號之間的幅度相關性參數,及當前幀長時平滑後的右聲道信號與參考聲道信號之間的幅度相關性參數90842‧‧‧計算當前幀左右聲道之間的幅度相關性差異參數90851‧‧‧對左右聲道之間的幅度相關性差異參數進行映射處理90852‧‧‧將映射處理後的左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數90853‧‧‧對轉換後得到的聲道組合比例因數進行量化編碼,確定當前幀非相關性信號聲道組合方案對應的聲道組合比例因數1001‧‧‧根據碼流進行解碼以得到當前幀的主次聲道解碼信號1002‧‧‧基於碼流得到所述碼流中包含的當前幀的時域立體聲參數1003‧‧‧基於碼流得到所述碼流中包含的當前幀的下混模式標識確定所述當前幀的下混模式1004‧‧‧基於所述當前幀的下混模式和前一幀的下混模式確定當前幀的編碼模式 1005‧‧‧根據確定的當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行時域上混處理以得到所述當前幀的左右聲道重建信號 1100、1200‧‧‧裝置 1110‧‧‧處理器 1120‧‧‧記憶體 1130‧‧‧收發器 1140‧‧‧麥克風 1150‧‧‧類比數位轉換器 1160‧‧‧揚聲器 1170‧‧‧數位類比轉換器 1210‧‧‧第一確定單元 1220‧‧‧編碼單元 1230‧‧‧第二確定單元 1240‧‧‧第三確定單元 1250‧‧‧解碼單元
下面將對本申請實施例或背景技術中所涉及的附圖進行說明。 圖1是本申請實施例提供的一種類反相信號的示意圖; 圖2是本申請實施例提供的一種音訊編碼方法的流程示意圖; 圖3是本申請實施例提供的一種音訊解碼模式確定方法的流程示意圖; 圖4是本申請實施例提供的一種下混模式切換的示意圖; 圖5是本申請實施例提供的淩一種下混模式切換的流程示意圖; 圖6是本申請實施例提供的一種音訊編碼模式確定方法的流程示意圖; 圖7是本申請實施例提供的另一種音訊編碼模式確定方法的流程示意圖; 圖8是本申請實施例提供的一種時域立體聲參數的確定方法的流程示意圖; 圖9-A是本申請實施例提供的另一種音訊編碼方法的流程示意圖; 圖9-B是本申請實施例提供的一種計算當前幀非相關性信號聲道組合方案對應的聲道組合比例因數並編碼的方法的流程示意圖; 圖9-C是本申請實施例提供的一種計算當前幀左右聲道之間的幅度相關性差異參數的方法的流程示意圖; 圖9-D是本申請實施例提供的一種將當前幀左右聲道之間的幅度相關性差異參數轉換為聲道組合比例因數的方法的流程示意圖; 圖10是本申請實施例提供的另一種音訊解碼方法的流程示意圖; 圖11-A是本申請實施例提供的一種裝置的示意圖; 圖11-B是本申請實施例提供的另一種裝置的示意圖; 圖11-C是本申請實施例提供的另一種裝置的示意圖; 圖12-A是本申請實施例提供的另一種裝置的示意圖; 圖12-B是本申請實施例提供的另一種裝置的示意圖; 圖12-C是本申請實施例提供的另一種裝置的示意圖。
201‧‧‧確定當前幀的聲道組合方案
202‧‧‧根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式
203‧‧‧根據所述當前幀的編碼模式對所述當前幀的左右聲道信號進行時域下混處理以得到所述當前幀的主次聲道信號,對得到的所述當前幀的主次聲道信號進行編碼

Claims (58)

  1. 一種音訊編碼方法,其中,包括:確定一當前幀的一聲道組合方案;根據一前一幀的一下混模式和所述當前幀的聲道組合方案確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的一左右聲道信號進行一時域下混處理以得到所述當前幀的一主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
  2. 如申請專利範圍第1項所述的方法,其中所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種;所述多種聲道組合方案包括一非相關性信號聲道組合方案和一相關性信號聲道組合方案;所述相關性信號聲道組合方案為一類正相信號對應的聲道組合方案;所述非相關性信號聲道組合方案為一類反相信號對應的聲道組合方案。
  3. 如申請專利範圍第1項或第2項所述的方法,其中所述前一幀的下混模式為多種下混模式中的其中一種,其中,所述多種下混模式包括:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述下混模式A和所述下混模式D為相關性信號下混模式;所述下混模式B和所述下混模式C為非相關性信號下混模式;其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一下混矩陣互不相同。
  4. 如申請專利範圍第3項所述的方法,其中所述根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:根據所述前一幀的下混模式、所述當前幀的一下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
  5. 如申請專利範圍第4項所述的方法,其中所述當前幀的下混模式切換代價值為根據所述當前幀的一下混模式切換代價函數進行計算的計算結果;其中,所述下混模式切換代價函數基於如下參數的至少一種來構建:所述當前幀的一至少一種時域立體聲參數、所述前一幀的一至少一種時域立體聲參數和所述當前幀的左右聲道信號;或者,所述當前幀的下混模式切換代價值為所述當前幀的一聲道組合比例因數。
  6. 如申請專利範圍第5項所述的方法,其中,所述下混模式切換代價函數為如下切換代價函數的其中一種:所述下混模式A切換到下混模式B的下混模式切換代價函數、所述下混模式A切換到下混模式C的下混模式切換代價函數、所述下混模式D切換到下混模式B的下混模式切換代價函數、所述下混模式D切換到下混模式C的下混模式切換代價函數、所述下混模式B切換到下混模式A的下混模式切換代價函數、所述下混模式B切換到下混模式D的下混模式切換代價函數、下混模式C切換到下混模式A的下混模式切 換代價函數、所述下混模式C切換到下混模式D的下混模式切換代價函數。
  7. 如申請專利範圍第6項所述的方法,其中,所述下混模式A切換到下混模式B的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0174-1
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_AB表示所述下混模式A切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_A表示所述下混模式A切換到下混模式B的模式切換代價函數的一計算起始樣點,end_sample_A為表示所述下混模式A切換到下混模式B的模式切換代價函數的一計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  8. 如申請專利範圍第6項所述的方法,其中,所述下混模式A切換到下混模式C的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0175-2
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_AC表示下混模式A切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_A表示下混模式A切換到下混模式C的模式切換代價函數的一計算起始樣點,end_sample_A為表示下混模式A切換到下混模式C的模式切換代價函數的一計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  9. 如申請專利範圍第6項所述的方法,其中,所述下混模式B切換到下混模式A的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0176-3
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_BA表示下混模式B切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式A的模式切換代價函數的一計算起始樣點,end_sample_B為表示下混模式B切換到下混模式A的模式切換代價函數的一計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  10. 如申請專利範圍第6項所述的方法,其中,所述下混模式B切換到下混模式D的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0176-4
    α 2_pre =1-α 1_pre ,α 2=1-α 1 其中,所述Cost_BD表示下混模式B切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_B表示下混模式B切換到下混模式D的模式切換代價函數的一計算起始樣點,end_sample_B為表示下混模式B切換到下混模式D的模式切換代價函數的一計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,所述X L (n)表示所述當前幀的左聲道信號,所述X R (n)表示所述當前幀的右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  11. 如申請專利範圍第6項所述的方法,其中,所述下混模式C切換到下混模式D的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0177-5
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_CD表示下混模式C切換到下混模式D的下混模 式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式D的模式切換代價函數的一計算起始樣點,end_sample_C為表示下混模式C切換到下混模式D的模式切換代價函數的一計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  12. 如申請專利範圍第6項所述的方法,其中,所述下混模式C切換到下混模式A的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0178-6
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_CA表示下混模式C切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_C表示下混模式C切換到下混模式A的模式切換代價函數的一計算起始樣點,end_sample_C為表示下混模式C切換到下混模式A的模式切換 代價函數的一計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  13. 如申請專利範圍第6項所述的方法,其中,所述下混模式D切換到下混模式C的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0179-7
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_DC表示下混模式D切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式C的模式切換代價函數的一計算起始樣點,end_sample_D為表示下混模式D切換到下混模式C的模式切換代價函數的一計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D; 其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  14. 如申請專利範圍第6項所述的方法,其中,所述下混模式D切換到下混模式B的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0180-8
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_DB表示下混模式D切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_D表示下混模式D切換到下混模式B的模式切換代價函數的一計算起始樣點,end_sample_D為表示下混模式D切換到下混模式B的模式切換代價函數的一計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號; 其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  15. 如申請專利範圍第3項所述的方法,其中,所述根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到所述下混模式A對應的所述編碼模式;或者,若前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到所述下混模式B對應的所述編碼模式;或者,若前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到所述下混模式C對應的所述編碼模式;或者, 若前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到所述下混模式D對應的所述編碼模式。
  16. 如申請專利範圍第4項至第14項任一項所述的方法,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第一下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,當前幀的編碼模式為從所述下混模式A切換到所述下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第一下混模式切換條件為所述當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從 下混模式A切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第二下混模式切換條件為當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第三下混模式切換條件為所述當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第四下混模式切換條件為所述當前幀的下混模式B切換到下混模式A的切換代 價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第五下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第五下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值;或者若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第六下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值; 或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第七下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第七下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第八下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第八下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
  17. 如申請專利範圍第4項至第5項任一項所述的方法,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代 價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第九下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第九下混模式切換條件為當前幀的聲道組合比例因數小於或等於一聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第十下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式A切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十模式切換條件為所述當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的 下混模式切換代價值滿足一第十一下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,並且所述第十一下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S2;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式B切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十二模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S2;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且 所述第十三下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十四下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十五下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十五下混模式切換條件為所述當前幀的聲道組合比例因數小於或或等於一聲道組合比例因數閾值S4;或者, 若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價函數值為所述當前幀的聲道組合比例因數,且所述第十六下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S4。
  18. 如申請專利範圍第3項所述的方法,其中,
    Figure 107126918-A0305-02-0189-10
    或者
    Figure 107126918-A0305-02-0189-12
    其中,所述M 2A 表示所述當前幀的下混模式A對應的下混矩陣;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  19. 如申請專利範圍第3項所述的方法,其中,
    Figure 107126918-A0305-02-0189-13
    Figure 107126918-A0305-02-0189-15
    其中,所述M 2B 表示當前幀的下混模式B對應的下混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  20. 如申請專利範圍第3項所述的方法,其中,
    Figure 107126918-A0305-02-0189-20
    Figure 107126918-A0305-02-0189-19
    其中,所述M 2C 表示所述當前幀的下混模式C對應的下混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  21. 如申請專利範圍第3項所述的方法,其中,
    Figure 107126918-A0305-02-0190-21
    Figure 107126918-A0305-02-0190-22
    其中,所述M 2D 表示所述當前幀的下混模式D對應的下混矩陣;其中,α 1=ratioα 2=1-ratio;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  22. 一種音訊解碼方法,其中,包括:根據一碼流進行解碼以得到一當前幀的一主次聲道解碼信號;根據所述碼流進行解碼以確定所述當前幀的一下混模式;根據所述前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的主次聲道解碼信號進行一時域上混處理以得到所述當前幀的一左右聲道重建信號。
  23. 如申請專利範圍第22項所述的方法,其中,所述前一幀的下混模式為如下多種下混模式中的其中一種:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述前一幀 的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一上混矩陣互不相同;所述當前幀的下混模式為如下多種下混模式中的其中一種:所述下混模式A、所述下混模式B、所述下混模式C和所述下混模式D;其中,所述當前幀的下混模式A、所述當前幀的下混模式B、所述當前幀的下混模式C和所述當前幀的下混模式D對應的上混矩陣互不相同;其中,所述下混模式A和所述下混模式D為一相關性信號下混模式;所述下混模式B和所述下混模式C為一非相關性信號下混模式。
  24. 如申請專利範圍第23項所述的方法,其中,所述根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的下混模式A為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式A切換到下混模式B對應的編碼模式;或者, 若所述前一幀的下混模式為所述下混模式A,所述當前幀的為下混模式C,確定所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;或者,若前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到下混模式B對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式B到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式B到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到下混模式C對應的編碼模式;或者, 若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式C到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式C到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式D到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式D到下混模式B對應的編碼模式。
  25. 如申請專利範圍第23項至第24項任一項所述的方法,其中,
    Figure 107126918-A0305-02-0194-24
    或者
    Figure 107126918-A0305-02-0194-26
    其中,所述
    Figure 107126918-A0305-02-0194-64
    表示所述當前幀的下混模式A對應的上混矩陣;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的一聲道組合比例因數。
  26. 如申請專利範圍第23項至第24項任一項所述的方法,其中,
    Figure 107126918-A0305-02-0194-27
    Figure 107126918-A0305-02-0194-28
    其中,所述
    Figure 107126918-A0305-02-0194-65
    表示所述當前幀的下混模式B對應的上混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  27. 如申請專利範圍第23項至第24項任一項所述的方法,其中
    Figure 107126918-A0305-02-0194-29
    Figure 107126918-A0305-02-0194-31
    其中,所述
    Figure 107126918-A0305-02-0194-68
    表示所述當前幀的下混模式C對應的上混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  28. 如申請專利範圍第23項至第24項任一項所述的方法,其中,
    Figure 107126918-A0305-02-0194-34
    Figure 107126918-A0305-02-0194-33
    其中,所述
    Figure 107126918-A0305-02-0194-70
    表示所述當前幀的下混模式D對應的上混矩陣; 其中,α 1=ratioα 2=1-ratio;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  29. 一種音訊編碼裝置,其中,包括:相互耦合的一處理器和一記憶體,其中,所述記憶體存儲有一電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行如下步驟:確定一當前幀的一聲道組合方案;根據所述前一幀的一下混模式和所述當前幀的聲道組合方案確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的一左右聲道信號進行一時域下混處理以得到所述當前幀的一主次聲道信號;對得到的所述當前幀的主次聲道信號進行編碼。
  30. 如申請專利範圍第29項所述的裝置,其中,所述當前幀的聲道組合方案為多種聲道組合方案中的其中一種;所述多種聲道組合方案包括一非相關性信號聲道組合方案和一相關性信號聲道組合方案;所述相關性信號聲道組合方案為一類正相信號對應的聲道組合方案;所述非相關性信號聲道組合方案為一類反相信號對應的聲道組合方案。
  31. 如申請專利範圍第29項或第30項所述的裝置,其中,所述前一幀的下混模式為多種下混模式中的其中一種,其中,所述多種下混模式包括:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述下混模式A和所述下混模式D為一相 關性信號下混模式;所述下混模式B和所述下混模式C為一非相關性信號下混模式;其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一下混矩陣互不相同。
  32. 如申請專利範圍第31項所述的裝置,其中,所述根據前一幀的下混模式和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:根據所述前一幀的下混模式、所述當前幀的一下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式。
  33. 如申請專利範圍第32項所述的裝置,其中,所述當前幀的下混模式切換代價值為根據所述當前幀的一下混模式切換代價函數進行計算的計算結果;其中,所述下混模式切換代價函數基於如下參數的至少一種來構建:所述當前幀的一至少一種時域立體聲參數、所述前一幀的一至少一種時域立體聲參數和所述當前幀的左右聲道信號;或者,所述當前幀的下混模式切換代價值為所述當前幀的一聲道組合比例因數。
  34. 如申請專利範圍第33項所述的裝置,其中,所述下混模式切換代價函數為如下切換代價函數的其中一種:所述下混模式A切換到下混模式B的下混模式切換代價函數、所述下混模式A切換到下混模式C的下混模式切換代價函數、所述下混模式D切換 到下混模式B的下混模式切換代價函數、所述下混模式D切換到下混模式C的下混模式切換代價函數、所述下混模式B切換到下混模式A的下混模式切換代價函數、所述下混模式B切換到下混模式D的下混模式切換代價函數、所述下混模式C切換到下混模式A的下混模式切換代價函數、所述下混模式C切換到下混模式D的下混模式切換代價函數。
  35. 如申請專利範圍第34項所述的裝置,其中,所述下混模式A切換到下混模式B的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0197-35
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_AB表示所述下混模式A切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_A表示所述下混模式A切換到下混模式B的模式切換代價函數的一計算起始樣點,end_sample_A為表示所述下混模式A切換到下混模式B的模式切換代價函數的一計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性 信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示所述前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  36. 如申請專利範圍第34項所述的裝置,其中,所述下混模式A切換到下混模式C的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0198-36
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_AC表示所述下混模式A切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_A表示所述下混模式A切換到下混模式C的模式切換代價函數的一計算起始樣點,end_sample_A為表示所述下混模式A切換到下混模式C的模式切換代價函數的一計算結束樣點,所述start_sample_A為大於0且小於N-1的整數,所述end_sample_A為大於0且小於N-1的整數,所述start_sample_A小於所述end_sample_A;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  37. 如申請專利範圍第34項所述的裝置,其中,所述下混模式B切換到下混模式A的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0199-37
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_BA表示所述下混模式B切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_B表示所述下混模式B切換到下混模式A的模式切換代價函數的一計算起始樣點,end_sample_B為表示所述下混模式B切換到下混模式A的模式切換代價函數的一計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  38. 如申請專利範圍第34項所述的裝置,其中,所述下混模式B切換到下混模式D的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0200-38
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_BD表示所述下混模式B切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_B表示所述下混模式B切換到下混模式D的模式切換代價函數的一計算起始樣點,end_sample_B為表示下混模式B切換到所述下混模式D的模式切換代價函數的一計算結束樣點,所述start_sample_B為大於0且小於N-1的整數,所述end_sample_B為大於0且小於N-1的整數,所述start_sample_B小於所述end_sample_B;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,所述X L (n)表示所述當前幀的左聲道信號,所述X R (n)表示所述當前幀的右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  39. 如申請專利範圍第34項所述的裝置,其中,所述下混模式C切換到下混模式D的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0201-40
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_CD表示所述下混模式C切換到下混模式D的下混模式切換代價函數值;其中,所述start_sample_C表示所述下混模式C切換到所述下混模式D的模式切換代價函數的一計算起始樣點,end_sample_C為表示所述下混模式C切換到下混模式D的模式切換代價函數的一計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  40. 如申請專利範圍第34項所述的裝置,其中,所述下混模式C切換到下混模式A的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0201-41
    α 2_pre =1-α 1_pre ,α 2=1-α 1 其中,所述Cost_CA表示所述下混模式C切換到下混模式A的下混模式切換代價函數值;其中,所述start_sample_C表示所述下混模式C切換到下混模式A的模式切換代價函數的一計算起始樣點,end_sample_C為表示所述下混模式C切換到下混模式A的模式切換代價函數的一計算結束樣點,所述start_sample_C為大於0且小於N-1的整數,所述end_sample_C為大於0且小於N-1的整數,所述start_sample_C小於所述end_sample_C;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio,其中,所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio_SM;所述tdm_last_ratio_SM表示前一幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  41. 如申請專利範圍第34項所述的裝置,其中,所述下混模式D切換到下混模式C的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0202-42
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_DC表示所述下混模式D切換到下混模式C的下混模式切換代價函數值;其中,所述start_sample_D表示所述下混模式D切換到下混模式C的模式切換代價函數的一計算起始樣 點,end_sample_D為表示所述下混模式D切換到下混模式C的模式切換代價函數的一計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所述start_sample_D小於所述end_sample_D;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  42. 如申請專利範圍第34項所述的裝置,其中,所述下混模式D切換到下混模式B的下混模式切換代價函數為:
    Figure 107126918-A0305-02-0203-43
    α 2_pre =1-α 1_pre ,α 2=1-α 1其中,所述Cost_DB表示所述下混模式D切換到下混模式B的下混模式切換代價函數值;其中,所述start_sample_D表示所述下混模式D切換到下混模式B的模式切換代價函數的一計算起始樣點,end_sample_D為表示所述下混模式D切換到下混模式B的模式切換代價函數的一計算結束樣點,所述start_sample_D為大於0且小於N-1的整數,所述end_sample_D為大於0且小於N-1的整數,所 述start_sample_D小於所述end_sample_D;其中,所述n表示一樣點序號,所述N為一幀長;其中,所述X L (n)表示所述當前幀的一左聲道信號,所述X R (n)表示所述當前幀的一右聲道信號;其中,α 1=ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數;其中,α 1_pre =tdm_last_ratio;所述tdm_last_ratio表示前一幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  43. 如申請專利範圍第31項所述的裝置,其中,所述根據前一幀的聲道組合方案和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到下混模式B對應的編碼模式;或者, 若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,則確定所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到下混模式D對應的編碼模式。
  44. 如申請專利範圍第32項至第42項任一項所述的裝置,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第一下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從所述下混模式A切換到下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第一下混模式切換條件為所述當前幀的下混模式A切換到下混模式B的切換代價函數值大於或等於下混模式A切換到下混模式C的切換代價函數值; 或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從所述下混模式A切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第二下混模式切換條件為所述當前幀的下混模式A切換到下混模式B的切換代價函數值小於或等於下混模式A切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從所述下混模式B切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第三下混模式切換條件為當前幀的下混模式B切換到下混模式A的切換代價函數值小於或等於下混模式B切換到下混模式D的切換代價函數值;或者, 若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從所述下混模式B切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第四下混模式切換條件為所述當前幀的下混模式B切換到下混模式A的切換代價函數值大於或等於下混模式B切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第五下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從所述下混模式C切換到下混模式D對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第五下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值大於或等於下混模式C切換到下混模式D的切換代價函數值;或者若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的 下混模式切換代價值滿足一第六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從所述下混模式C切換到下混模式A對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第六下混模式切換條件為所述當前幀的下混模式C切換到下混模式A的切換代價函數值小於或等於下混模式C切換到下混模式D的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第七下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第七下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值小於或等於下混模式D切換到下混模式C的切換代價函數值;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第八下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為 從下混模式D切換到下混模式C對應的編碼模式;其中,所述下混模式切換代價值為所述下混模式切換代價函數值,所述第八下混模式切換條件為所述當前幀的下混模式D切換到下混模式B的切換代價函數值大於或等於下混模式D切換到下混模式C的切換代價函數值。
  45. 如申請專利範圍第32項至第33項任一項所述的裝置,其中,所述根據前一幀的下混模式、所述當前幀的下混模式切換代價值和所述當前幀的聲道組合方案確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第九下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式A切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第九下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於一聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,且所述當前幀的下混模式切換代價值滿足一第十下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從 所述下混模式A切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S1;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十一下混模式切換條件,則確定所述當前幀的下混模式為下混模式A,所述當前幀的編碼模式為從下混模式B切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,並且所述第十一下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S2;或者,若所述前一幀的下混模式為下混模式B,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十二下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從所述下混模式B切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十二下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S2; 或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十三下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式D,所述當前幀的編碼模式為從下混模式C切換到下混模式D對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十三下混模式切換條件為所述當前幀的聲道組合比例因數大於或等於一聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的聲道組合方案為所述相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十四下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式A,所述當前幀的編碼模式為從下混模式C切換到下混模式A對應的編碼模式;其中,所述當前幀的下混模式切換代價值為當前幀的聲道組合比例因數,且所述第十四下混模式切換條件為所述當前幀的聲道組合比例因數小於或等於所述聲道組合比例因數閾值S3;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十五下混模式切換條件,則確定 所述當前幀的下混模式為所述下混模式B,所述當前幀的編碼模式為從下混模式D切換到下混模式B對應的編碼模式;其中,所述當前幀的下混模式切換代價值為所述當前幀的聲道組合比例因數,且所述第十五下混模式切換條件為所述當前幀的聲道組合比例因數小於或或等於一聲道組合比例因數閾值S4;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的聲道組合方案為所述非相關性信號聲道組合方案,並且所述當前幀的下混模式切換代價值滿足一第十六下混模式切換條件,則確定所述當前幀的下混模式為所述下混模式C,所述當前幀的編碼模式為從下混模式D切換到下混模式C對應的編碼模式;其中,所述當前幀的下混模式切換代價函數值為所述當前幀的聲道組合比例因數,且所述第十六下混模式切換條件為當前幀的聲道組合比例因數大於或等於所述聲道組合比例因數閾值S4。
  46. 如申請專利範圍第31項所述的裝置,其中,
    Figure 107126918-A0305-02-0212-44
    或者
    Figure 107126918-A0305-02-0212-46
    其中,所述M 2A 表示所述當前幀的下混模式A對應的下混矩陣;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  47. 如申請專利範圍第31項所述的裝置,其中,
    Figure 107126918-A0305-02-0212-47
    Figure 107126918-A0305-02-0212-48
    其中,所述M 2B 表示所述當前幀的下混模式B對應的下混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  48. 如申請專利範圍第31項所述的裝置,其中,
    Figure 107126918-A0305-02-0213-49
    Figure 107126918-A0305-02-0213-51
    其中,所述M 2C 表示所述當前幀的下混模式C對應的下混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  49. 如申請專利範圍第31項所述的裝置,其中,
    Figure 107126918-A0305-02-0213-52
    Figure 107126918-A0305-02-0213-53
    其中,所述M 2D 表示所述當前幀的下混模式D對應的下混矩陣;其中,α 1=ratioα 2=1-ratio;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  50. 一種音訊解碼裝置,其中,包括:相互耦合的一處理器和一記憶體,其中,所述記憶體存儲有一電腦程式;所述處理器調用所述記憶體存儲的電腦程式,以用於執行如下步驟:根據一碼流進行解碼以得到一當前幀的一主次聲道解碼信號;根據所述碼流進行解碼以得到所述當前幀的一下混模式; 根據一前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的一編碼模式;根據所述當前幀的編碼模式對所述當前幀的一主次聲道解碼信號進行一時域上混處理以得到所述當前幀的一左右聲道重建信號。
  51. 如申請專利範圍第50項所述的裝置,其中,所述前一幀的下混模式為如下多種下混模式中的其中一種:一下混模式A、一下混模式B、一下混模式C和一下混模式D;其中,所述前一幀的下混模式A、所述前一幀的下混模式B、所述前一幀的下混模式C和所述前一幀的下混模式D對應的一上混矩陣互不相同;所述前當幀的下混模式為如下多種下混模式中的其中一種:所述下混模式A、所述下混模式B、所述下混模式C和所述下混模式D;其中,所述當前幀的下混模式A、所述當前幀的下混模式B、所述當前幀的下混模式C和所述當前幀的下混模式D對應的上混矩陣互不相同;其中,所述下混模式A和所述下混模式D為一相關性信號下混模式;所述下混模式B和所述下混模式C為一非相關性信號下混模式。
  52. 如申請專利範圍第51項所述的裝置,其中,所述根據前一幀的下混模式和所述當前幀的下混模式確定所述當前幀的編碼模式,包括:若所述前一幀的下混模式為所述下混模式A,所述 當前幀的下混模式A為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式A到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為下混模式A,所述當前幀的為下混模式B,確定所述當前幀的編碼模式為從所述下混模式A切換到下混模式B對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式A,所述當前幀的下混模式為下混模式C,確定所述當前幀的編碼模式為從所述下混模式A切換到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式B到下混模式B對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為下混模式A,確定所述當前幀的編碼模式為從所述下混模式B到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式B,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式B到下混模式D對應的編碼模式; 或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式C到下混模式C對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式A,確定所述當前幀的編碼模式為從所述下混模式C到下混模式A對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式C,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式C到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式D,確定所述當前幀的編碼模式為從所述下混模式D到下混模式D對應的編碼模式;或者,若所述前一幀的下混模式為所述下混模式D,所述當前幀的下混模式為所述下混模式C,確定所述當前幀的編碼模式為從所述下混模式D到下混模式C對應的編碼模式;或者, 若所述前一幀的下混模式為下混模式D,所述當前幀的下混模式為所述下混模式B,確定所述當前幀的編碼模式為從所述下混模式D到下混模式B對應的編碼模式。
  53. 如申請專利範圍第51項至第52項任一項所述的裝置,其中,
    Figure 107126918-A0305-02-0217-54
    或者
    Figure 107126918-A0305-02-0217-55
    其中,所述
    Figure 107126918-A0305-02-0217-71
    表示所述當前幀的下混模式A對應的上混矩陣;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的一聲道組合比例因數。
  54. 如申請專利範圍第51項至第52項任一項所述的裝置,其中,
    Figure 107126918-A0305-02-0217-56
    Figure 107126918-A0305-02-0217-58
    其中,所述
    Figure 107126918-A0305-02-0217-72
    表示所述當前幀的下混模式B對應的上混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  55. 如申請專利範圍第51項至第52項任一項所述的裝置,其中,
    Figure 107126918-A0305-02-0217-59
    Figure 107126918-A0305-02-0217-61
    其中,所述
    Figure 107126918-A0305-02-0217-73
    表示所述當前幀的下混模式C對應的上混矩陣;其中,α 1=ratio_SMα 2=1-ratio_SM;所述ratio_SM表示所述當 前幀的非相關性信號聲道組合方案對應的聲道組合比例因數。
  56. 如申請專利範圍第51項至第52項任一項所述的裝置,其中,
    Figure 107126918-A0305-02-0218-62
    Figure 107126918-A0305-02-0218-63
    其中,所述
    Figure 107126918-A0305-02-0218-74
    表示所述當前幀的下混模式D對應的上混矩陣;其中,α 1=ratioα 2=1-ratio;所述ratio表示所述當前幀的相關性信號聲道組合方案對應的聲道組合比例因數。
  57. 一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了一程式碼,所述程式碼包括用於執行申請專利範圍第1項至第21項任一項所述方法的指令。
  58. 一種電腦可讀存儲介質,其中,所述電腦可讀存儲介質存儲了一程式碼,所述程式碼包括用於執行申請專利範圍第22項至第28項任一項所述方法的指令。
TW107126918A 2017-11-30 2018-08-02 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質 TWI705432B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201711244330.5 2017-11-30
CN201711244330.5A CN109859766B (zh) 2017-11-30 2017-11-30 音频编解码方法和相关产品
CN201711244330.5 2017-11-30

Publications (2)

Publication Number Publication Date
TW201926318A TW201926318A (zh) 2019-07-01
TWI705432B true TWI705432B (zh) 2020-09-21

Family

ID=66663812

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107126918A TWI705432B (zh) 2017-11-30 2018-08-02 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質

Country Status (8)

Country Link
US (1) US11393482B2 (zh)
EP (1) EP3703050B1 (zh)
JP (1) JP7088450B2 (zh)
KR (1) KR102437451B1 (zh)
CN (1) CN109859766B (zh)
BR (1) BR112020010850A2 (zh)
TW (1) TWI705432B (zh)
WO (1) WO2019105436A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7207578B2 (ja) * 2019-07-10 2023-01-18 日本電気株式会社 話者埋め込み装置、方法、およびプログラム
CN112751792B (zh) * 2019-10-31 2022-06-10 华为技术有限公司 一种信道估计方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101218628A (zh) * 2005-07-11 2008-07-09 Lg电子株式会社 编码和解码音频信号的装置和方法
TWI342718B (en) * 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
CN102089809A (zh) * 2008-06-13 2011-06-08 诺基亚公司 用于提供改进的音频处理的方法、装置及计算机程序产品
TWI344638B (en) * 2006-01-19 2011-07-01 Lg Electronics Inc Method and apparatus for processing a media signal

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
WO2010036060A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
ES2555136T3 (es) * 2012-02-17 2015-12-29 Huawei Technologies Co., Ltd. Codificador paramétrico para codificar una señal de audio multicanal
CN104240712B (zh) * 2014-09-30 2018-02-02 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及系统
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
CN109389987B (zh) * 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101218628A (zh) * 2005-07-11 2008-07-09 Lg电子株式会社 编码和解码音频信号的装置和方法
TWI344638B (en) * 2006-01-19 2011-07-01 Lg Electronics Inc Method and apparatus for processing a media signal
TWI342718B (en) * 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
CN102089809A (zh) * 2008-06-13 2011-06-08 诺基亚公司 用于提供改进的音频处理的方法、装置及计算机程序产品

Also Published As

Publication number Publication date
KR102437451B1 (ko) 2022-08-30
EP3703050A1 (en) 2020-09-02
CN109859766A (zh) 2019-06-07
EP3703050B1 (en) 2024-01-03
BR112020010850A2 (pt) 2020-11-10
JP2021504759A (ja) 2021-02-15
TW201926318A (zh) 2019-07-01
US20200294513A1 (en) 2020-09-17
US11393482B2 (en) 2022-07-19
CN109859766B (zh) 2021-08-20
EP3703050A4 (en) 2020-12-30
WO2019105436A1 (zh) 2019-06-06
JP7088450B2 (ja) 2022-06-21
KR20200090856A (ko) 2020-07-29

Similar Documents

Publication Publication Date Title
TWI697892B (zh) 音訊編解碼模式確定方法和相關產品
TWI689210B (zh) 時域身歷聲編解碼方法和相關產品
TWI705432B (zh) 音訊編解碼方法、音頻編解碼裝置及電腦可讀存儲介質
KR102380454B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
JP2023129450A (ja) 時間領域ステレオパラメータ符号化方法および関連製品
RU2772405C2 (ru) Способ стереокодирования и декодирования во временной области и соответствующий продукт