TW201443877A - 音訊處理系統中之訊號去相關 - Google Patents

音訊處理系統中之訊號去相關 Download PDF

Info

Publication number
TW201443877A
TW201443877A TW103101428A TW103101428A TW201443877A TW 201443877 A TW201443877 A TW 201443877A TW 103101428 A TW103101428 A TW 103101428A TW 103101428 A TW103101428 A TW 103101428A TW 201443877 A TW201443877 A TW 201443877A
Authority
TW
Taiwan
Prior art keywords
audio
decorrelation
channel
information
transient
Prior art date
Application number
TW103101428A
Other languages
English (en)
Other versions
TWI618050B (zh
Inventor
Vinay Melkote
Kuan-Chieh Yen
Grant Davidson
Matthew C Fellers
Mark S Vinton
Vivek Kumar
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW201443877A publication Critical patent/TW201443877A/zh
Application granted granted Critical
Publication of TWI618050B publication Critical patent/TWI618050B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)

Abstract

音訊處理方法可包含接收對應於複數個音訊頻道的音訊資料。音訊資料可包括一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數。一種去相關程序可以音訊編碼或處理系統所使用的相同濾波器組係數來進行。去相關程序可無須將頻域表示的係數轉換成另一頻域或時域表示來進行。去相關程序可包含特定頻道及/或特定頻帶的選擇性或訊號適應性去相關。去相關程序可包含對收到之音訊資料的一部分施用一去相關濾波器以產生經濾波的音訊資料。去相關程序可包含使用一非階層混合器以根據空間參數來結合收到之音訊資料的一直接部分與經濾波的音訊資料。

Description

音訊處理系統中之訊號去相關
本揭露關於訊號處理。
對音訊和視訊資料之數位編碼和解碼程序的發展持續對傳送娛樂內容具有顯著影響。儘管記憶體裝置的容量增加且在愈來愈高的頻寬下傳送廣泛可用的資料,但有持續的壓力來最小化將被儲存及/或傳送的資料量。通常一起傳送音訊和視訊資料,且音訊資料的頻寬通常受到視訊部分的要求限制。
因此,通常在高壓縮因數下,有時在30:1或更高的壓縮因數下編碼音訊資料。由於訊號失真隨著所施用的壓縮量增加,因此可在解碼的音訊資料之保真度與儲存及/或傳送編碼的資料之效率之間取得折衷。
此外,期望降低編碼和解碼演算法的複雜性。關於編碼程序的編碼附加資料能簡化解碼程序,但以儲存及/或傳送附加編碼的資料為代價。雖然現有的音訊編碼和解碼方法通常是令人滿意的,但仍期望改進的方 法。
本揭露所述之標的的一些態樣能以音訊處理方法來實作。一些上述方法可包含接收對應於複數個音訊頻道的音訊資料。音訊資料可包括一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數。方法可包含對至少一些音訊資料施用一去相關程序。在一些實作中,去相關程序可以音訊編碼或處理系統所使用的相同濾波器組係數來進行。
在一些實作中,去相關程序可無須將頻域表示的係數轉換成另一頻域或時域表示來進行。頻域表示可以是施用一完美重建、臨界取樣的濾波器組之結果。去相關程序可包含藉由對至少一部分的頻域表示施用線性濾波器來產生混響訊號或去相關訊號。頻域表示可以是對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。去相關程序可包含施用完全對實數值係數操作的去相關演算法。
根據一些實作,去相關程序可包含特定頻道的選擇性或訊號適應性去相關。另外或此外,去相關程序可包含特定頻帶的選擇性或訊號適應性去相關。去相關程序可包含對一部分收到之音訊資料施用一去相關濾波器以產生經濾波的音訊資料。去相關程序可包含使用一非階層混合器以根據空間參數來結合收到之音訊資料的一直接部 分與經濾波的音訊資料。
在一些實作中,可一起接收去相關資訊和音訊資料或其他資料。去相關程序可包含根據收到之去相關資訊來去相關至少一些音訊資料。收到之去相關資訊可包括個別離散頻道與一耦合頻道之間的相關係數、個別離散頻道之間的相關係數、清楚音調資訊及/或暫態資訊。
方法可包含基於收到之音訊資料來決定去相關資訊。去相關程序可包含根據決定之去相關資訊來去相關至少一些音訊資料。方法可包含接收與音訊資料一起編碼的去相關資訊。去相關程序可包含根據收到之去相關資訊或決定之去相關資訊之至少一者來去相關至少一些音訊資料。
根據一些實作,音訊編碼或處理系統可以是一傳統音訊編碼或處理系統。方法可包含接收在傳統音訊編碼或處理系統所產生之一位元流中的控制機制元件。去相關程序可至少部分基於控制機制元件。
在一些實作中,一種設備可包括一介面及一邏輯系統,配置用於經由介面來接收對應於複數個音訊頻道的音訊資料。音訊資料可包括一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數。邏輯系統可配置用於對至少一些音訊資料施用一去相關程序。在一些實作中,去相關程序可以音訊編碼或處理系統所使用的相同濾波器組係數來進行。邏輯系統可包括一通用單或多晶片處理器、一數位訊號處理器(DSP)、一專用積體電路(ASIC)、 一現場可程式閘陣列(FPGA)或其他可程式邏輯裝置、離散閘或電晶體邏輯、或離散硬體元件之至少一者。
在一些實作中,去相關程序可無須將頻域表示的係數轉換成另一頻域或時域表示來進行。頻域表示可以是施用一臨界取樣的濾波器組之結果。去相關程序可包含藉由對至少一部分的頻域表示施用線性濾波器來產生混響訊號或去相關訊號。頻域表示可以是對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。去相關程序可包含施用完全對實數值係數操作的一去相關演算法。
去相關程序可包含特定頻道的選擇性或訊號適應性去相關。去相關程序可包含特定頻帶的選擇性或訊號適應性去相關。去相關程序可包含對一部分收到之音訊資料施用一去相關濾波器以產生經濾波的音訊資料。在一些實作中,去相關程序可包含使用一非階層混合器以根據空間參數來結合這部分收到之音訊資料與經濾波的音訊資料。
設備可包括一記憶體裝置。在一些實作中,介面可以是邏輯系統與記憶體裝置之間的介面。另外,介面可以是一網路介面。
音訊編碼或處理系統可以是一傳統音訊編碼或處理系統。在一些實作中,邏輯系統可更配置用於經由介面來接收在傳統音訊編碼或處理系統所產生之一位元流中的控制機制元件。去相關程序可至少部分基於控制機制 元件。
本揭露之一些態樣可在一種具有軟體儲存於其上的非暫態媒體中實作。軟體可包括用於控制一設備接收對應於複數個音訊頻道的音訊資料之指令。音訊資料可包括一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數。軟體可包括用於控制設備對至少一些音訊資料施用一去相關程序的指令。在一些實作中,去相關程序係以音訊編碼或處理系統所使用的相同濾波器組係數來進行。
在一些實作中,去相關程序可無須將頻域表示的係數轉換成另一頻域或時域表示來進行。頻域表示可以是施用一臨界取樣的濾波器組之結果。去相關程序可包含藉由對至少一部分的頻域表示施用線性濾波器來產生混響訊號或去相關訊號。頻域表示可以是對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。去相關程序可包含施用完全對實數值係數操作的一去相關演算法。
一些方法可包含接收對應於複數個音訊頻道的音訊資料及決定音訊資料的音訊特性。音訊特性可包括暫態資訊。方法可包含至少部分基於音訊特性來決定用於音訊資料的去相關量及根據決定之去相關量來處理音訊資料。
在一些實例中,可不隨音訊資料一起接收任何清楚暫態資訊。在一些實作中,決定暫態資訊的程序可包含偵測一軟暫態事件。
決定暫態資訊的程序可包含評估一暫態事件的可能性及/或嚴重性。決定暫態資訊的程序可包含評估音訊資料的時間功率變化。
決定音訊特性的程序可包含隨音訊資料一起接收清楚暫態資訊。清楚暫態資訊可包括對應於確定暫態事件的暫態控制值、對應於確定非暫態事件的暫態控制值或中間暫態控制值之至少一者。清楚暫態資訊可包括中間暫態控制值或對應於確定暫態事件的暫態控制值。暫態控制值可能會受到指數衰變函數。
清楚暫態資訊可指出確定暫態事件。處理音訊資料可包含暫時地停止或減慢去相關程序。清楚暫態資訊可包括對應於確定非暫態事件的暫態控制值或中間暫態值。決定暫態資訊的程序可包含偵測一軟暫態事件。偵測軟暫態事件的程序可包含評估一暫態事件的可能性或嚴重性之至少一者。
決定之暫態資訊可以是對應於軟暫態事件的決定之暫態控制值。方法可包含結合決定之暫態控制值與收到之暫態控制值以獲得新的暫態控制值。結合決定之暫態控制值與收到之暫態控制值的程序可包含判定決定之暫態控制值與收到之暫態控制值的最大值。
偵測軟暫態事件的程序可包含偵測音訊資料的時間功率變化。偵測時間功率變化可包含決定對數功率平均的變化。對數功率平均可以是頻帶加權對數功率平均。決定對數功率平均的變化可包含決定時間不對稱功率 差動。不對稱功率差動可能強調提高功率且可能不再強調降低功率。方法可包含基於不對稱功率差動來決定原始暫態測量。決定原始暫態測量可包含基於時間不對稱功率差動係根據高斯分佈來分佈的假設來計算暫態事件的概似函數。方法可包含基於原始暫態測量來決定暫態控制值。方法可包含對暫態控制值施用指數衰變函數。
一些方法可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料及根據一混合比來混合經濾波的音訊資料與一部分收到之音訊資料。決定去相關量的程序可包含至少部分基於暫態控制值來修改混合比。
一些方法可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料。決定用於音訊資料的去相關量可包含基於暫態資訊來衰減至去相關濾波器的輸入。決定用於音訊資料之去相關量的程序可包含回應於偵測軟暫態事件而減少去相關量。
處理音訊資料可包含對一部分音訊資料施用一去相關濾波器以產生經濾波的音訊資料,及根據混合比來混合經濾波的音訊資料與一部分收到之音訊資料。減少去相關量的程序可包含修改混合比。
處理音訊資料可包含對音訊資料的一部分施用一去相關濾波器以產生經濾波的音訊資料、估計將對經濾波的音訊資料施用之增益、對經濾波的音訊資料施用增益及混合經濾波的音訊資料與一部分收到之音訊資料。
估計程序可包含使經濾波的音訊資料的功率與收到之音訊資料的功率相配。在一些實作中,估計和施用增益的程序可藉由一組閃避器(ducker)來進行。這組閃避器可包括緩衝器。可對經濾波的音訊資料施用固定延遲且可對緩衝器施用相同延遲。
用於閃避器的功率估計平滑化視窗或將對經濾波的音訊資料施用的增益之至少一者可至少部分基於決定之暫態資訊。在一些實作中,當暫態事件較為可能或偵測到相對較強的暫態事件時,可施用較短的平滑化視窗,且當暫態事件較不可能、偵測到相對較弱的暫態事件或未偵測到任何暫態事件時,可施用較長的平滑化視窗。
一些方法可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料、估計將施用至經濾波的音訊資料之閃避器增益、對經濾波的音訊資料施用閃避器增益及根據混合比來混合經濾波的音訊資料與一部分收到之音訊資料。決定去相關量的程序可包含基於暫態資訊或閃避器增益之至少一者來修改混合比。
決定音訊特性的程序可包含判定頻道被區塊切換、頻道離開耦合或未使用頻道耦合之至少一者。決定用於音訊資料的去相關量可包含決定應減慢或暫時地停止去相關程序。
處理音訊資料可包含去相關濾波器顫動程序。方法可包含至少部分基於暫態資訊來決定應修改或暫時地停止去相關濾波器顫動程序。根據一些方法,可決定 將藉由改變用於顫動去相關濾波器之極點的最大步幅值來修改去相關濾波器顫動程序。
根據一些實作,一種設備可包括一介面及一邏輯系統。邏輯系統可配置用於從介面接收對應於複數個音訊頻道的音訊資料及用於決定音訊資料的音訊特性。音訊特性可包括暫態資料。邏輯系統可配置用於至少部分基於音訊特性來決定用於音訊資料的去相關量及用於根據決定之去相關量來處理音訊資料。
在一些實作中,可能不隨音訊資料一起接收任何清楚暫態資訊。決定暫態資訊的程序可包含偵測一軟暫態事件。決定暫態資訊的程序可包含評估一暫態事件的可能性或嚴重性之至少一者。決定暫態資訊的程序可包含評估音訊資料的時間功率變化。
在一些實作中,決定音訊特性可包含隨音訊資料一起接收清楚暫態資訊。清楚暫態資訊可指出對應於確定暫態事件的暫態控制值、對應於確定非暫態事件的暫態控制值或中間暫態控制值之至少一者。清楚暫態資訊可包括中間暫態控制值或對應於確定暫態事件的暫態控制值。暫態控制值可能受到指數衰變函數。
若清楚暫態資訊指出確定暫態事件,則處理音訊資料可包含暫時地減慢或停止去相關程序。若清楚暫態資訊包括對應於確定非暫態事件的暫態控制值或中間暫態值,則決定暫態資訊的程序可包含偵測一軟暫態事件。決定之暫態資訊可以是對應於軟暫態事件的決定之暫態控 制值。
邏輯系統可更配置用於結合決定之暫態控制值與收到之暫態控制值以獲得新的暫態控制值。在一些實作中,結合決定之暫態控制值與收到之暫態控制值的程序可包含判定決定之暫態控制值與收到之暫態控制值的最大值。
偵測軟暫態事件的程序可包含評估一暫態事件的可能性或嚴重性之至少一者。偵測軟暫態事件的程序可包含偵測音訊資料的時間功率變化。
在一些實作中,邏輯系統可更配置用於對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料、及根據混合比來混合經濾波的音訊資料與一部分收到之音訊資料。決定去相關量的程序可包含至少部分基於暫態資訊來修改混合比。
決定用於音訊資料之去相關量的程序可包含回應於偵測軟暫態事件而減少去相關量。處理音訊資料可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料,及根據混合比來混合經濾波的音訊資料與一部分收到之音訊資料。減少去相關量的程序可包含修改混合比。
處理音訊資料可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料、估計將施用至經濾波的音訊資料之增益、對經濾波的音訊資料施用增益及混合經濾波的音訊資料與一部分收到之音訊資料。估 計程序可包含使經濾波的音訊資料的功率與收到之音訊資料的功率相配。邏輯系統可包括一組閃避器,配置以進行估計和施用增益的程序。
本揭露之一些態樣可在一種具有軟體儲存於其上的非暫態媒體中實作。軟體可包括用以控制一設備接收對應於複數個音訊頻道的音訊資料及決定音訊資料的音訊特性之指令。在一些實作中,音訊特性可包括暫態資訊。軟體可包括用以控制一設備來至少部分基於音訊特性來決定用於音訊資料的去相關量及根據決定之去相關量來處理音訊資料之指令。
在一些實例中,可不隨音訊資料一起接收任何清楚暫態資訊。決定暫態資訊的程序可包含偵測一軟暫態事件。決定暫態資訊的程序可包含評估一暫態事件的可能性或嚴重性之至少一者。決定暫態資訊的程序可包含評估音訊資料的時間功率變化。
然而,在一些實作中,決定音訊特性可包含隨音訊資料一起接收清楚暫態資訊。清楚暫態資訊可包括對應於確定暫態事件的暫態控制值、對應於確定非暫態事件的暫態控制值及/或中間暫態控制值。若清楚暫態資訊指出暫態事件,則處理音訊資料可包含暫時地停止或減慢去相關程序。
若清楚暫態資訊包括對應於確定非暫態事件的暫態控制值或中間暫態值,則決定暫態資訊的程序可包含偵測一軟暫態事件。決定之暫態資訊可以是對應於軟暫 態事件的決定之暫態控制值。決定暫態資訊的程序可包含結合決定之暫態控制值與收到之暫態控制值以獲得新的暫態控制值。結合決定之暫態控制值與收到之暫態控制值的程序可包含判定決定之暫態控制值與收到之暫態控制值的最大值。
偵測軟暫態事件的程序可包含評估一暫態事件的可能性或嚴重性之至少一者。偵測軟暫態事件的程序可包含偵測音訊資料的時間功率變化。
軟體可包括指令,用於控制設備對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料、及根據一混合比來混合經濾波的音訊資料與一部分收到之音訊資料。決定去相關量的程序可包含至少部分基於暫態資訊來修改混合比。決定用於音訊資料之去相關量的程序可包含回應於偵測軟暫態事件而減少去相關量。
處理音訊資料可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料,及根據混合比來混合經濾波的音訊資料與一部分收到之音訊資料。減少去相關量的程序可包含修改混合比。
處理音訊資料可包含對一部分的音訊資料施用一去相關濾波器以產生經濾波的音訊資料、估計施用至經濾波的音訊資料之增益、對經濾波的音訊資料施用增益及混合經濾波的音訊資料與一部分收到之音訊資料。估計程序可包含使經濾波的音訊資料的功率與收到之音訊資料的功率相配。
一些方法可包含接收對應於複數個音訊頻道的音訊資料及決定音訊資料的音訊特性。音訊特性可包括暫態資訊。暫態資訊可包括指出確定暫態事件與確定非暫態事件之間之暫態值的中間暫態控制值。上述方法也可包含形成包括編碼的暫態資訊之編碼的音訊資料訊框。
編碼的暫態資訊可包括一或更多控制旗標。方法可包含將音訊資料的二或更多頻道之至少一部分耦合至至少一個耦合頻道中。控制旗標可包括頻道區塊切換旗標、頻道離開耦合旗標或使用耦合旗標之至少一者。方法可包含決定控制一或更多旗標的組合以形成編碼的暫態資訊,其指出確定暫態事件、確定非暫態事件、暫態事件的可能性或暫態事件的嚴重性之至少一者。
決定暫態資訊的程序可包含評估一暫態事件的可能性或嚴重性之至少一者。編碼的暫態資訊可指出確定暫態事件、確定非暫態事件、暫態事件的可能性或暫態事件的嚴重性之至少一者。決定暫態資訊的程序可包含評估音訊資料的時間功率變化。
編碼的暫態資訊可包括對應於暫態事件的暫態控制值。暫態控制值可能受到指數衰變函數。暫態資訊可能指出應暫時地減慢或停止去相關程序。
暫態資訊可能指出應修改去相關程序的混合比。例如,暫態資訊可指出應暫時地減少去相關程序中的去相關量。
一些方法可包含接收對應於複數個音訊頻道 的音訊資料及決定音訊資料的音訊特性。音訊特性可包括空間參數資料。方法可包含至少部分基於音訊特性來決定用於音訊資料的至少兩個去相關濾波程序。去相關濾波程序可導致用於至少一對頻道的頻道特定去相關訊號之間的特定去相關訊號間的關連性(「IDC」)。去相關濾波程序可包含對至少一部分之音訊資料施用一去相關濾波器以產生經濾波的音訊資料。可藉由對經濾波的音訊資料進行操作來產生頻道特定去相關訊號。
方法可包含對至少一部分之音訊資料施用去相關濾波程序以產生頻道特定去相關訊號、至少部分基於音訊特性來決定混合參數及根據混合參數來混合頻道特定去相關訊號與音訊資料的一直接部分。直接部分可對應於被施用去相關濾波器的部分。
方法也可包含接收關於輸出頻道數量的資訊。決定用於音訊資料之至少兩個去相關濾波程序的程序可至少部分基於輸出頻道數量。接收程序可包含接收對應於N個輸入音訊頻道的音訊資料。方法可包含判定用於N個輸入音訊頻道的音訊資料將被降混或升混至用於K個輸出音訊頻道的音訊資料及產生對應於K個輸出音訊頻道的去相關音訊資料。
方法可包含將用於N個輸入音訊頻道的音訊資料降混或升混至用於M個中間音訊頻道的音訊資料、產生用於M個中間音訊頻道的去相關音訊資料及將用於M個中間音訊頻道的去相關音訊資料降混或升混至用於K 個輸出音訊頻道的去相關音訊資料。決定用於音訊資料的兩個去相關濾波程序可至少部分基於中間音訊頻道的數量M。去相關濾波程序可至少部分基於N至K、M至K或N至M混合等式來決定。
方法也可包含控制複數個音訊頻道對之間之頻道間的關連性(「ICC」)。控制ICC的程序可包含至少部分基於空間參數資料來接收ICC值或決定ICC值之至少一者。
控制ICC的程序可包含至少部分基於空間參數資料來接收一組ICC值或決定這組ICC值之至少一者。方法也可包含至少部分基於這組ICC值來決定一組IDC值及藉由對經濾波的音訊資料進行操作來合成與這組IDC值對應的一組頻道特定去相關訊號。
方法也可包含在空間參數資料的第一表示與空間參數資料的第二表示之間轉換的程序。空間參數資料的第一表示可包括個別離散頻道與耦合頻道之間的關連性表示。空間參數資料的第二表示可包括個別離散頻道之間的關連性表示。
對至少一部分之音訊資料施用去相關濾波程序的程序可包含針對複數個頻道對音訊資料施用相同的去相關濾波器以產生經濾波的音訊資料及將對應於左頻道或右頻道之經濾波的音訊資料乘以-1。方法也可包含針對對應於左頻道之經濾波的音訊資料來反向對應於左環繞頻道之經濾波的音訊資料之極性及針對對應於右頻道之經濾波 的音訊資料來反向對應於右環繞頻道之經濾波的音訊資料之極性。
對至少一部分之音訊資料施用去相關濾波程序的程序可包含針對第一和第二頻道對音訊資料施用第一去相關濾波器以產生第一頻道濾波的資料和第二頻道濾波的資料及針對第三和第四頻道對音訊資料施用第二去相關濾波器以產生第三頻道濾波的資料和第四頻道濾波的資料。第一頻道可以是左頻道,第二頻道可以是右頻道,第三頻道可以是左環繞頻道且第四頻道可以是右環繞頻道。方法也可包含相對於第二頻道濾波的資料地反向第一頻道濾波的資料之極性及相對於第四頻道濾波的資料地反向第三頻道濾波的資料之極性。決定用於音訊資料之至少兩個去相關濾波程序的程序可包含決定將針對中央頻道對音訊資料施用不同的去相關濾波器或決定將不針對中央頻道對音訊資料施用去相關濾波器。
方法也可包含接收頻道特定縮放因數和對應於複數個耦合頻道的耦合頻道訊號。施用程序可包含對耦合頻道施用至少一去相關濾波程序以產生頻道特定濾波的音訊資料及對頻道特定濾波的音訊資料施用頻道特定縮放因數以產生頻道特定去相關訊號。
方法也可包含至少部分基於空間參數資料來決定去相關訊號合成參數。去相關訊號合成參數可以是輸出頻道特定去相關訊號合成參數。方法也可包含接收對應於複數個耦合頻道的耦合頻道訊號和頻道特定縮放因數。 決定用於音訊資料之至少兩個去相關濾波程序及對一部分之音訊資料施用去相關濾波程序的程序之至少一者可包含藉由對耦合頻道訊號施用一組去相關濾波器來產生一組種子去相關訊號、將種子去相關訊號發送至合成器、對合成器所接收的種子去相關訊號施用輸出頻道特定去相關訊號合成參數以產生頻道特定合成去相關訊號、將頻道特定合成去相關訊號乘以適用於每個頻道的頻道特定縮放因數以產生經縮放的頻道特定合成去相關訊號及將經縮放的頻道特定合成去相關訊號輸出至直接訊號和去相關訊號混合器。
方法也可包含接收頻道特定縮放因數。決定用於音訊資料之至少兩個去相關濾波程序及對一部分之音訊資料施用去相關濾波程序的程序之至少一者可包含:藉由對音訊資料施用一組去相關濾波器來產生一組頻道特定種子去相關訊號;將頻道特定種子去相關訊號發送至合成器;至少部分基於頻道特定縮放因數來決定一組頻道對特定層級調整參數;對合成器所接收的頻道特定種子去相關訊號施用輸出頻道特定去相關訊號合成參數和頻道對特定層級調整參數以產生頻道特定合成去相關訊號;及將頻道特定合成去相關訊號輸出至直接訊號和去相關訊號混合器。
決定輸出頻道特定去相關訊號合成參數可包含至少部分基於空間參數資料來決定一組IDC值及決定與這組IDC值對應的輸出頻道特定去相關訊號合成參數。這 組IDC值可至少部分根據個別離散頻道與耦合頻道之間的關連性和個別離散頻道對之間的關連性來決定。
混合程序可包含使用一非階層混合器來結合頻道特定去相關訊號與音訊資料的直接部分。決定音訊特性可包含隨音訊資料一起接收清楚音訊特性資訊。決定音訊特性可包含基於音訊資料之一或更多屬性來決定音訊特性資訊。空間參數資料可包括個別離散頻道與耦合頻道之間的關連性表示及/或個別離散頻道對之間的關連性表示。音訊特性可包括音調資訊或暫態資訊之至少一者。
決定混合參數可至少部分基於空間參數資料。方法也可包含將混合參數提供至直接訊號和去相關訊號混合器。混合參數可以是輸出頻道特定混合參數。方法也可包含至少部分基於輸出頻道特定混合參數和暫態控制資訊來決定修改的輸出頻道特定混合參數。
根據一些實作,一種設備可包括一介面及一邏輯系統,配置用於接收對應於複數個音訊頻道的音訊資料及決定音訊資料的音訊特性。音訊特性可包括空間參數資料。邏輯系統可配置用於至少部分基於音訊特性來決定用於音訊資料的至少兩個去相關濾波程序。去相關濾波程序可導致用於至少一對頻道的頻道特定去相關訊號之間的特定IDC。去相關濾波程序可包含對至少一部分之音訊資料施用一去相關濾波器以產生經濾波的音訊資料。可藉由對經濾波的音訊資料進行操作來產生頻道特定去相關訊號。
邏輯系統可配置用於:對至少一部分之音訊資料施用去相關濾波程序以產生頻道特定去相關訊號;至少部分基於音訊特性來決定混合參數;及根據混合參數來混合頻道特定去相關訊號與音訊資料的直接部分。直接部分可對應於被施用去相關濾波器的部分。
接收程序可包含關於輸出頻道數量的資訊。決定用於音訊資料之至少兩個去相關濾波程序的程序可至少部分基於輸出頻道數量。例如,接收程序可包含接收對應於N個輸入音訊頻道的音訊資料且邏輯系統可配置用於:判定用於N個輸入音訊頻道的音訊資料將被降混或升混至用於K個輸出音訊頻道的音訊資料及產生對應於K個輸出音訊頻道的去相關音訊資料。
邏輯系統可更配置用於:將用於N個輸入音訊頻道的音訊資料降混或升混至用於M個中間音訊頻道的音訊資料、產生用於M個中間音訊頻道的去相關音訊資料;及將用於M個中間音訊頻道的去相關音訊資料降混或升混至用於K個輸出音訊頻道的去相關音訊資料。
去相關濾波程序可至少部分基於N至K混合等式來決定。決定用於音訊資料的兩個去相關濾波程序可至少部分基於中間音訊頻道的數量M。去相關濾波程序可至少部分基於M至K或N至M混合等式來決定。
邏輯系統可更配置用於控制複數個音訊頻道對之間的ICC。控制ICC的程序可包含接收ICC值或至少部分基於空間參數資料來決定ICC值之至少一者。邏輯系 統可更配置用於至少部分基於這組ICC值來決定一組IDC值及藉由對經濾波的音訊資料進行操作來合成與這組IDC值對應的一組頻道特定去相關訊號。
邏輯系統可更配置用於在空間參數資料的第一表示與空間參數資料的第二表示之間轉換的程序。空間參數資料的第一表示可包括個別離散頻道與耦合頻道之間的關連性表示。空間參數資料的第二表示可包括個別離散頻道之間的關連性表示。
對至少一部分之音訊資料施用去相關濾波程序的程序可包含針對複數個頻道對音訊資料施用相同的去相關濾波器以產生經濾波的音訊資料及將對應於左頻道或右頻道之經濾波的音訊資料乘以-1。邏輯系統可更配置用於針對對應於左側頻道之經濾波的音訊資料來反向對應於左環繞頻道之經濾波的音訊資料之極性及針對對應於右側頻道之經濾波的音訊資料來反向對應於右環繞頻道之經濾波的音訊資料之極性。
對至少一部分之音訊資料施用去相關濾波程序的程序可包含針對第一和第二頻道對音訊資料施用第一去相關濾波器以產生第一頻道濾波的資料和第二頻道濾波的資料及針對第三和第四頻道對音訊資料施用第二去相關濾波器以產生第三頻道濾波的資料和第四頻道濾波的資料。第一頻道可以是左側頻道,第二頻道可以是右側頻道,第三頻道可以是左環繞頻道且第四頻道可以是右環繞頻道。
邏輯系統可更配置用於相對於第二頻道濾波的資料地反向第一頻道濾波的資料之極性及相對於第四頻道濾波的資料地反向第三頻道濾波的資料之極性。決定用於音訊資料之至少兩個去相關濾波程序的程序可包含決定將針對中央頻道對音訊資料施用不同的去相關濾波器或決定將不針對中央頻道對音訊資料施用去相關濾波器。
邏輯系統可更配置用於從介面接收頻道特定縮放因數和對應於複數個耦合頻道的耦合頻道訊號。施用程序可包含對耦合頻道施用至少一去相關濾波程序以產生頻道特定濾波的音訊資料及對頻道特定濾波的音訊資料施用頻道特定縮放因數以產生頻道特定去相關訊號。
邏輯系統可更配置用於至少部分基於空間參數資料來決定去相關訊號合成參數。去相關訊號合成參數可以是輸出頻道特定去相關訊號合成參數。邏輯系統可更配置用於從介面接收對應於複數個耦合頻道的耦合頻道訊號和頻道特定縮放因數。
決定用於音訊資料之至少兩個去相關濾波程序及對一部分之音訊資料施用去相關濾波程序的程序之至少一者可包含:藉由對耦合頻道訊號施用一組去相關濾波器來產生一組種子去相關訊號;將種子去相關訊號發送至合成器;對合成器所接收的種子去相關訊號施用輸出頻道特定去相關訊號合成參數以產生頻道特定合成去相關訊號;將頻道特定合成去相關訊號乘以適用於每個頻道的頻道特定縮放因數以產生經縮放的頻道特定合成去相關訊 號;及將經縮放的頻道特定合成去相關訊號輸出至直接訊號和去相關訊號混合器。
決定用於音訊資料之至少兩個去相關濾波程序及對一部分之音訊資料施用去相關濾波程序的程序之至少一者可包含:藉由對音訊資料施用一組頻道特定去相關濾波器來產生一組頻道特定種子去相關訊號;將頻道特定種子去相關訊號發送至合成器;至少部分基於頻道特定縮放因數來決定頻道對特定層級調整參數;對合成器所接收的頻道特定種子去相關訊號施用輸出頻道特定去相關訊號合成參數和頻道對特定層級調整參數以產生頻道特定合成去相關訊號;及將頻道特定合成去相關訊號輸出至直接訊號和去相關訊號混合器。
決定輸出頻道特定去相關訊號合成參數可包含至少部分基於空間參數資料來決定一組IDC值及決定與這組IDC值對應的輸出頻道特定去相關訊號合成參數。這組IDC值可至少部分根據個別離散頻道與耦合頻道之間的關連性和個別離散頻道對之間的關連性來決定。
混合程序可包含使用一非階層混合器來結合頻道特定去相關訊號與音訊資料的直接部分。決定音訊特性可包含隨音訊資料一起接收清楚音訊特性資訊。決定音訊特性可包含基於音訊資料之一或更多屬性來決定音訊特性資訊。音訊特性可包括音調資訊及/或暫態資訊。
空間參數資料可包括個別離散頻道與耦合頻道之間的關連性表示及/或個別離散頻道對之間的關連性 表示。決定混合參數可至少部分基於空間參數資料。
邏輯系統可更配置用於將混合參數提供至直接訊號和去相關訊號混合器。混合參數可以是輸出頻道特定混合參數。邏輯系統可更配置用於至少部分基於輸出頻道特定混合參數和暫態控制資訊來決定修改的輸出頻道特定混合參數。
設備可包括一記憶體裝置。介面可以是邏輯系統與記憶體裝置之間的介面。然而,介面可以是網路介面。
本揭露之一些態樣可在一種具有軟體儲存於其上的非暫態媒體中實作。軟體可包括指令,用以控制一設備用於接收對應於複數個音訊頻道的音訊資料及用於決定音訊資料的音訊特性。音訊特性可包括空間參數資料。軟體可包括指令,用以控制設備用於至少部分基於音訊特性來決定用於音訊資料的至少兩個去相關濾波程序。去相關濾波程序可導致用於至少一對頻道的頻道特定去相關訊號之間的特定IDC。去相關濾波程序可包含對至少一部分之音訊資料施用一去相關濾波器以產生經濾波的音訊資料。可藉由對經濾波的音訊資料進行操作來產生頻道特定去相關訊號。
軟體可包括指令,用以控制設備來對至少一部分之音訊資料施用去相關濾波程序以產生頻道特定去相關訊號;至少部分基於音訊特性來決定混合參數;及根據混合參數來混合頻道特定去相關訊號與音訊資料的直接部 分。直接部分可對應於被施用去相關濾波器的部分。
軟體可包括指令,用於控制設備接收關於輸出頻道數量的資訊。決定用於音訊資料之至少兩個去相關濾波程序的程序可至少部分基於輸出頻道數量。例如,接收程序可包含接收對應於N個輸入音訊頻道的音訊資料。軟體可包括指令,用於控制設備判定用於N個輸入音訊頻道的音訊資料將被降混或升混至用於K個輸出音訊頻道的音訊資料及產生對應於K個輸出音訊頻道的去相關音訊資料。
軟體可包括指令,用於控制設備:將用於N個輸入音訊頻道的音訊資料降混或升混至用於M個中間音訊頻道的音訊資料;產生用於M個中間音訊頻道的去相關音訊資料;及將用於M個中間音訊頻道的去相關音訊資料降混或升混至用於K個輸出音訊頻道的去相關音訊資料。
決定用於音訊資料的兩個去相關濾波程序可至少部分基於中間音訊頻道的數量M。去相關濾波程序可至少部分基於N至K、M至K或N至M混合等式來決定。
軟體可包括指令,用於控制設備進行控制複數個音訊頻道對之間之ICC的程序。控制ICC的程序可包含接收ICC值及/或至少部分基於空間參數資料來決定ICC值。控制ICC的程序可包含接收一組ICC值或至少部分基於空間參數資料來決定這組ICC值之至少一者。軟體 可包括指令,用於控制設備進行至少部分基於這組ICC值來決定一組IDC值及藉由對經濾波的音訊資料進行操作來合成與這組IDC值對應的一組頻道特定去相關訊號之程序。
對至少一部分之音訊資料施用去相關濾波程序的程序可包含針對複數個頻道對音訊資料施用相同的去相關濾波器以產生經濾波的音訊資料及將對應於左頻道或右頻道之經濾波的音訊資料乘以-1。軟體可包括指令,用於控制設備進行針對對應於左側頻道之經濾波的音訊資料來反向對應於左環繞頻道之經濾波的音訊資料之極性及針對對應於右側頻道之經濾波的音訊資料來反向對應於右環繞頻道之經濾波的音訊資料之極性。
對一部分之音訊資料施用去相關濾波器的程序可包含針對第一和第二頻道對音訊資料施用第一去相關濾波器以產生第一頻道濾波的資料和第二頻道濾波的資料及針對第三和第四頻道對音訊資料施用第二去相關濾波器以產生第三頻道濾波的資料和第四頻道濾波的資料。第一頻道可以是左側頻道,第二頻道可以是右側頻道,第三頻道可以是左環繞頻道且第四頻道可以是右環繞頻道。
軟體可包括指令,用於控制設備進行相對於第二頻道濾波的資料地反向第一頻道濾波的資料之極性及相對於第四頻道濾波的資料地反向第三頻道濾波的資料之極性的程序。決定用於音訊資料之至少兩個去相關濾波程序的程序可包含決定將針對中央頻道對音訊資料施用不同 的去相關濾波器或決定將不針對中央頻道對音訊資料施用去相關濾波器。
軟體可包括指令,用於控制設備接收頻道特定縮放因數和對應於複數個耦合頻道的耦合頻道訊號。施用程序可包含對耦合頻道施用至少一去相關濾波程序以產生頻道特定濾波的音訊資料及對頻道特定濾波的音訊資料施用頻道特定縮放因數以產生頻道特定去相關訊號。
軟體可包括指令,用於控制設備至少部分基於空間參數資料來決定去相關訊號合成參數。去相關訊號合成參數可以是輸出頻道特定去相關訊號合成參數。軟體可包括指令,用於控制設備接收對應於複數個耦合頻道的耦合頻道訊號和頻道特定縮放因數。決定用於音訊資料之至少兩個去相關濾波程序及對一部分之音訊資料施用去相關濾波程序的程序之至少一者可包含:藉由對耦合頻道訊號施用一組去相關濾波器來產生一組種子去相關訊號;將種子去相關訊號發送至合成器;對合成器所接收的種子去相關訊號施用輸出頻道特定去相關訊號合成參數以產生頻道特定合成去相關訊號;將頻道特定合成去相關訊號乘以適用於每個頻道的頻道特定縮放因數以產生經縮放的頻道特定合成去相關訊號;及將經縮放的頻道特定合成去相關訊號輸出至直接訊號和去相關訊號混合器。
軟體可包括指令,用於控制設備接收對應於複數個耦合頻道的耦合頻道訊號和頻道特定縮放因數。決定用於音訊資料之至少兩個去相關濾波程序及對一部分之 音訊資料施用去相關濾波程序的程序之至少一者可包含:藉由對音訊資料施用一組頻道特定去相關濾波器來產生一組頻道特定種子去相關訊號;將頻道特定種子去相關訊號發送至合成器;至少部分基於頻道特定縮放因數來決定頻道對特定層級調整參數;對合成器所接收的頻道特定種子去相關訊號施用輸出頻道特定去相關訊號合成參數和頻道對特定層級調整參數以產生頻道特定合成去相關訊號;及將頻道特定合成去相關訊號輸出至直接訊號和去相關訊號混合器。
決定輸出頻道特定去相關訊號合成參數可包含至少部分基於空間參數資料來決定一組IDC值及決定與這組IDC值對應的輸出頻道特定去相關訊號合成參數。這組IDC值可至少部分根據個別離散頻道與耦合頻道之間的關連性和個別離散頻道對之間的關連性來決定。
在一些實作中,一種方法可包含:接收包含第一組頻率係數和第二組頻率係數的音訊資料;至少部分基於第一組頻率係數來估計用於至少一部分之第二組頻率係數的空間參數;及對第二組頻率係數施用估計的空間參數以產生修改的第二組頻率係數。第一組頻率係數可對應於第一頻率範圍且第二組頻率係數可對應於第二頻率範圍。第一頻率範圍可低於第二頻率範圍。
音訊資料可包括對應於個別頻道和耦合頻道的資料。第一頻率範圍可對應於個別頻道頻率範圍且第二頻率範圍可對應於耦合頻道頻率範圍。施用程序可包含在 每個頻道基礎上施用估計的空間參數。
音訊資料可包括在用於二或更多頻道之第一頻率範圍中的頻率係數。估計程序可包含基於二或更多頻道的頻率係數來計算合成耦合頻道的組合頻率係數,及至少針對第一頻道,計算第一頻道的頻率係數與組合頻率係數之間的交叉相關係數。組合頻率係數可對應於第一頻率範圍。
交叉相關係數可以是正規化交叉相關係數。第一組頻率係數可包括用於複數個頻道的音訊資料。估計程序可包含估計用於複數個頻道之多個頻道的正規化交叉相關係數。估計程序可包含將第一頻率範圍之至少一部分分成第一頻率範圍頻帶及計算用於每個第一頻率範圍頻帶的正規化交叉相關係數。
在一些實作中,估計程序可包含平均跨頻道之所有第一頻率範圍頻帶之正規化交叉相關係數及對正規化交叉相關係數的平均施用縮放因數以獲得用於頻道之估計的空間參數。平均正規化交叉相關係數的程序可包含跨頻道的時間段地平均。縮放因數可隨著漸增的頻率而減少。
方法可包含加入雜訊以模型化估計的空間參數之變化。所加入的雜訊之變化可至少部分基於正規化交叉相關係數之變化。所加入的雜訊之變化可至少部分取決於跨頻帶之空間參數的預測,取決於預測之變化係基於經驗資料。
方法可包含接收或決定關於第二組頻率係數的音調資訊。所施用的雜訊可根據音調資訊而變化。
方法可包含測量第一組頻率係數的頻帶與第二組頻率係數的頻帶之間的每頻帶能量比。估計的空間參數可根據每頻帶能量比而變化。在一些實作中,估計的空間參數可根據輸入音訊訊號的時間改變而變化。估計程序可包含僅對實數值頻率係數的操作。
對第二組頻率係數施用估計的空間參數之程序可以是去相關程序的一部分。在一些實作中,去相關程序可包含產生混響訊號或去相關訊號及將其施用至第二組頻率係數。去相關程序可包含施用完全對實數值係數操作的去相關演算法。去相關程序可包含特定頻道的選擇性或訊號適應性去相關。去相關程序可包含特定頻帶的選擇性或訊號適應性去相關。在一些實作中,第一和第二組頻率係數可以是對時域中的音訊資料施用修改的離散正弦轉換、修改的離散餘弦轉換或重疊正交轉換之結果。
估計程序可至少部分基於估計理論。例如,估計程序可至少部分基於最大概似法、貝氏估計量、動差估計法、最小均方誤差估計量或最小變異無偏估計量之至少一者。
在一些實作中,可在根據傳統編碼程序所編碼的位元流中接收音訊資料。傳統編碼程序可能例如是AC-3音訊編解碼器或增強AC-3音訊編解碼器之程序。施用空間參數可產生空間上比藉由根據與傳統編碼程序對應 之傳統解碼程序來解碼位元流所獲得更準確的音訊播放。
一些實作包含包括一介面及一邏輯系統的設備。邏輯系統可配置用於:接收包含第一組頻率係數和第二組頻率係數的音訊資料;至少部分基於第一組頻率係數來估計用於至少一部分之第二組頻率係數的空間參數;及對第二組頻率係數施用估計的空間參數以產生修改的第二組頻率係數。
設備可包括一記憶體裝置。介面可以是邏輯系統與記憶體裝置之間的介面。然而,介面可以是網路介面。
第一組頻率係數可對應於第一頻率範圍且第二組頻率係數可對應於第二頻率範圍。第一頻率範圍可低於第二頻率範圍。音訊資料可包括對應於個別頻道和耦合頻道的資料。第一頻率範圍可對應於個別頻道頻率範圍且第二頻率範圍可對應於耦合頻道頻率範圍。
施用程序可包含在每個頻道基礎上施用估計的空間參數。音訊資料可包括在用於二或更多頻道之第一頻率範圍中的頻率係數。估計程序可包含基於二或更多頻道的頻率係數來計算合成耦合頻道的組合頻率係數,及至少針對第一頻道,計算第一頻道的頻率係數與組合頻率係數之間的交叉相關係數。
組合頻率係數可對應於第一頻率範圍。交叉相關係數可以是正規化交叉相關係數。第一組頻率係數可包括用於複數個頻道的音訊資料。估計程序可包含估計用 於複數個頻道之多個頻道的正規化交叉相關係數。
估計程序可包含將第二頻率範圍分成第二頻率範圍頻帶及計算用於每個第二頻率範圍頻帶的正規化交叉相關係數。估計程序可包含將第一頻率範圍分成第一頻率範圍頻帶,平均跨所有第一頻率範圍頻帶之正規化交叉相關係數及對正規化交叉相關係數的平均施用縮放因數以獲得估計的空間參數。
平均正規化交叉相關係數的程序可包含跨頻道的時間段地平均。邏輯系統可更配置用於對修改的第二組頻率係數加入雜訊。可增加加入雜訊以模型化估計的空間參數之變化。邏輯系統所加入的雜訊之變化可至少部分基於正規化交叉相關係數之變化。邏輯系統可更配置用於接收或決定關於第二組頻率係數的音調資訊及根據音調資訊來改變所施用的雜訊。
在一些實作中,可在根據傳統編碼程序所編碼的位元流中接收音訊資料。例如,傳統編碼程序可以是AC-3音訊編解碼器或增強AC-3音訊編解碼器之程序。
本揭露之一些態樣可在一種具有軟體儲存於其上的非暫態媒體中實作。軟體可包括指令,用以控制一設備用於:接收包含第一組頻率係數和第二組頻率係數的音訊資料;至少部分基於第一組頻率係數來估計用於至少一部分之第二組頻率係數的空間參數;及對第二組頻率係數施用估計的空間參數以產生修改的第二組頻率係數。
第一組頻率係數可對應於第一頻率範圍且第 二組頻率係數可對應於第二頻率範圍。音訊資料可包括對應於個別頻道和耦合頻道的資料。第一頻率範圍可對應於個別頻道頻率範圍且第二頻率範圍可對應於耦合頻道頻率範圍。第一頻率範圍可低於第二頻率範圍。
施用程序可包含在每個頻道基礎上施用估計的空間參數。音訊資料可包括在用於二或更多頻道之第一頻率範圍中的頻率係數。估計程序可包含基於二或更多頻道的頻率係數來計算合成耦合頻道的組合頻率係數,及至少針對第一頻道,計算第一頻道的頻率係數與組合頻率係數之間的交叉相關係數。
組合頻率係數可對應於第一頻率範圍。交叉相關係數可以是正規化交叉相關係數。第一組頻率係數可包括用於複數個頻道的音訊資料。估計程序可包含估計用於複數個頻道之多個頻道的正規化交叉相關係數。估計程序可包含將第二頻率範圍分成第二頻率範圍頻帶及計算用於每個第二頻率範圍頻帶的正規化交叉相關係數。
估計程序可包含:將第一頻率範圍分成第一頻率範圍頻帶;平均跨所有第一頻率範圍頻帶之正規化交叉相關係數;及對正規化交叉相關係數的平均施用縮放因數以獲得估計的空間參數。平均正規化交叉相關係數的程序可包含跨頻道的時間段地平均。
軟體也可包括指令,用於控制解碼設備對修改的第二組頻率係數加入雜訊以模型化估計的空間參數之變化。所加入的雜訊之變化可至少部分基於正規化交叉相 關係數之變化。軟體也可包括指令,用於控制解碼設備接收或決定關於第二組頻率係數的音調資訊。所施用的雜訊可根據音調資訊而變化。
在一些實作中,可在根據傳統編碼程序所編碼的位元流中接收音訊資料。例如,傳統編碼程序可以是AC-3音訊編解碼器或增強AC-3音訊編解碼器之程序。
根據一些實作,一種方法可包含:接收對應於複數個音訊頻道的音訊資料;決定音訊資料的音訊特性;至少部分基於音訊特性來決定用於音訊資料的去相關濾波器參數;根據去相關濾波器參數來形成去相關濾波器;及對至少一些音訊資料施用去相關濾波器。例如,音訊特性可包括音調資訊及/或暫態資訊。
決定音訊特性可包含隨音訊資料一起接收清楚音調資訊或暫態資訊。決定音訊特性可包含基於音訊資料之一或更多屬性來決定音調資訊或暫態資訊。
在一些實作中,去相關濾波器可包括具有至少一個延遲元件的線性濾波器。去相關濾波器可包括全通濾波器。
去相關濾波器參數可包括用於全通濾波器之至少一個極點的顫動參數或隨機選定的極點位置。例如,顫動參數或極點位置可包含用於極點移動的最大步幅值。最大步幅值對於音訊資料的高音調訊號而言可實質上為零。顫動參數或極點位置可被限制極點移動的限制區域限制。在一些實作中,限制區域可以是圓形或環形的。在一 些實作中,限制區域可以是固定的。在一些實作中,音訊資料的不同頻道可共享相同的限制區域。
根據一些實作,極點可獨立於每個頻道而顫動。在一些實作中,極點的運動可能不被限制區域限制。在一些實作中,極點可維持彼此實質上一致的空間或角度關係。根據一些實作,從極點到z平面圓中心的距離可以是音訊資料頻率的函數。
在一些實作中,一種設備可包括一介面及一邏輯系統。在一些實作中,邏輯系統可包括一通用單或多晶片處理器、數位訊號處理器(DSP)、專用積體電路(ASIC)、現場可程式閘陣列(FPGA)或其他可程式邏輯裝置、離散閘或電晶體邏輯及/或離散硬體元件。
邏輯系統可配置用於從介面接收對應於複數個音訊頻道的音訊資料及決定音訊資料的音訊特性。在一些實作中,音訊特性可包括音調資訊及/或暫態資訊。邏輯系統可配置用於至少部分基於音訊特性來決定用於音訊資料的去相關濾波器參數,根據去相關濾波器參數來形成去相關濾波器及對至少一些音訊資料施用去相關濾波器。
去相關濾波器可包括具有至少一個延遲元件的線性濾波器。去相關濾波器參數可包括用於去相關濾波器之至少一個極點的顫動參數或隨機選定的極點位置。顫動參數或極點位置可被限制極點移動的限制區域限制。可參考用於極點移動的最大步幅值來決定顫動參數或極點位置。最大步幅值對於音訊資料的高音調訊號而言可實質上 為零。
設備可包括一記憶體裝置。介面可以是邏輯系統與記憶體裝置之間的介面。然而,介面可以是網路介面。
本揭露之一些態樣可在一種具有軟體儲存於其上的非暫態媒體中實作。軟體可包括指令,用以控制一設備:接收對應於複數個音訊頻道的音訊資料;決定音訊資料的音訊特性,音訊特性包含音調資訊或暫態資訊之至少一者;至少部分基於音訊特性來決定用於音訊資料的去相關濾波器參數;根據去相關濾波器參數來形成去相關濾波器;及對至少一些音訊資料施用去相關濾波器。去相關濾波器可包括具有至少一個延遲元件的線性濾波器。
去相關濾波器參數可包括用於去相關濾波器之至少一個極點的顫動參數或隨機選定的極點位置。顫動參數或極點位置可被限制極點移動的限制區域限制。可參考用於極點移動的最大步幅值來決定顫動參數或極點位置。最大步幅值對於音訊資料的高音調訊號而言可實質上為零。
根據一些實作,一種方法可包含:接收對應於複數個音訊頻道的音訊資料;決定對應於去相關濾波器之最大極點位移的去相關濾波器控制資訊;至少部分基於去相關濾波器控制資訊來決定用於音訊資料的去相關濾波器參數;根據去相關濾波器參數來形成去相關濾波器;及對至少一些音訊資料施用去相關濾波器。
音訊資料可以在時域或頻域中。決定去相關濾波器控制資訊可包含接收最大極點位移的明確指示。
決定去相關濾波器控制資訊可包含決定音訊特性資訊及至少部分基於音訊特性資訊來決定最大極點位移。在一些實作中,音訊特性資訊可包括音調資訊或暫態資訊之至少一者。
在附圖和下面的說明中提出了本說明書中所揭露之主題之一或更多實作的細節。其他特徵、態樣、及優點將從說明、圖示、及申請專利範圍變得顯而易見。請注意下列圖的相對尺寸可不按比例來繪製。
102‧‧‧圖
104‧‧‧圖
106‧‧‧圖
108‧‧‧圖
200‧‧‧音訊處理系統
201‧‧‧緩衝器
203‧‧‧開關
205‧‧‧去相關器
255‧‧‧反轉換模組
220a-220n‧‧‧音訊資料元件
230a-230n‧‧‧去相關音訊資料元件
260‧‧‧時域音訊資料
207‧‧‧選擇資訊
270‧‧‧方法
272-274‧‧‧方塊
240‧‧‧去相關資訊
210‧‧‧音訊資料
225‧‧‧升混器
212‧‧‧耦合座標
220‧‧‧音訊資料
230‧‧‧去相關音訊資料
245a‧‧‧音訊資料
245b‧‧‧音訊資料
262‧‧‧N至M升混器/降混器
264‧‧‧M至K升混器/降混器
266‧‧‧混合資訊
268‧‧‧混合資訊
218‧‧‧去相關訊號產生器
215‧‧‧混合器
227‧‧‧去相關訊號
300‧‧‧去相關程序
305-345‧‧‧方塊
410‧‧‧去相關濾波器
415‧‧‧固定延遲
420‧‧‧時變部分
405‧‧‧去相關濾波器控制模組
425‧‧‧清楚音調資訊
430‧‧‧清楚暫態資訊
500‧‧‧圖
505a‧‧‧極點
505b‧‧‧極點
505c‧‧‧極點
515‧‧‧單位圓
510a‧‧‧限制區域
510b‧‧‧限制區域
510c‧‧‧限制區域
520a‧‧‧步幅
505a’‧‧‧位置
525‧‧‧最大步幅圓
520b‧‧‧步幅
505a”‧‧‧位置
530‧‧‧直徑
505a”’‧‧‧三角形
505b”’‧‧‧三角形
505c”’‧‧‧三角形
θ‧‧‧角度
505d‧‧‧極點
510d‧‧‧限制區域
505e‧‧‧極點
510e‧‧‧限制區域
625‧‧‧去相關訊號產生器控制資訊
605‧‧‧合成器
610‧‧‧直接訊號和去相關訊號混合器
615‧‧‧去相關訊號合成參數
620‧‧‧混合係數
630‧‧‧空間參數資訊
635‧‧‧降混/升混資訊
640‧‧‧控制資訊接收器/產生器
245‧‧‧音訊資料元件
645‧‧‧混合器控制資訊
650‧‧‧濾波器控制模組
655‧‧‧暫態控制模組
660‧‧‧混合器控制模組
665‧‧‧空間參數模組
800‧‧‧方法
802-825‧‧‧方塊
215a-215d‧‧‧頻道特定混合器
630a-630d‧‧‧輸出頻道特定空間參數資訊
890‧‧‧修改的混合係數
845a-845d‧‧‧輸出頻道特定混合音訊資料
850a-850d‧‧‧增益控制模組
218a-218d‧‧‧去相關訊號產生器
847a-847d‧‧‧頻道特定去相關控制資訊
210a-210d‧‧‧音訊資料
405‧‧‧去相關濾波器控制模組
227a-227d‧‧‧去相關訊號
840‧‧‧極性反向模組
851‧‧‧方法
855-870‧‧‧方塊
880‧‧‧合成和混合係數產生模組
886‧‧‧合成去相關訊號
888‧‧‧混合器暫態控制模組
900‧‧‧方法
905-925‧‧‧方塊
1000‧‧‧方法
1005-1015‧‧‧方塊
1020‧‧‧方法
1022-1055‧‧‧方塊
1100‧‧‧方法
1105-1120‧‧‧方塊
240a‧‧‧去相關資訊
240b‧‧‧去相關資訊
1125‧‧‧去相關濾波器輸入控制模組
625e‧‧‧去相關訊號產生器控制資訊
1130‧‧‧軟暫態計算器
625f‧‧‧去相關訊號產生器控制資訊
1135‧‧‧閃避器模組
625h‧‧‧去相關訊號產生器控制資訊
1145‧‧‧混合器暫態控制模組
1127‧‧‧時變濾波值
1150‧‧‧方法
1152-1164‧‧‧方塊
1172-1180‧‧‧方塊
1200‧‧‧裝置
1205‧‧‧介面系統
1210‧‧‧邏輯系統
1215‧‧‧記憶體系統
1220‧‧‧揚聲器
1225‧‧‧麥克風
1230‧‧‧顯示系統
1235‧‧‧使用者輸入系統
1240‧‧‧電源系統
第1A和1B圖係顯示在音訊編碼程序期間的頻道耦合之實例的圖。
第2A圖係繪示音訊處理系統之元件的方塊圖。
第2B圖提出可由第2A圖之音訊處理系統進行之操作的概要。
第2C圖係顯示另一音訊處理系統之元件的方塊圖。
第2D圖係顯示去相關器可如何在音訊處理系統中使用之實例的方塊圖。
第2E圖係繪示另一音訊處理系統之元件的方塊圖。
第2F圖係顯示去相關器元件之實例的方塊圖。
第3圖係繪示去相關程序之實例的流程圖。
第4圖係繪示可配置用於進行第3圖之去相關程序的去相關器元件之實例的方塊圖。
第5A圖係顯示移動全通濾波器的極點之實例的圖。
第5B和5C圖係顯示移動全通濾波器的極點之其他實例的圖。
第5D和5E圖係顯示當移動全通濾波器的極點時可施用之限制區域之其他實例的圖。
第6A圖係繪示去相關器之另一實作的方塊圖。
第6B圖係繪示去相關器之另一實作的方塊圖。
第6C圖繪示音訊處理系統的另一實作。
第7A和7B圖係提出空間參數之簡化圖示的向量圖。
第8A圖係繪示本文所提出之一些去相關方法之方塊的流程圖。
第8B圖係繪示側向正負號翻轉法之方塊的流程圖。
第8C和8D圖係繪示可用於實作一些正負號翻轉法之元件的方塊圖。
第8E圖係繪示從空間參數資料決定合成係數和混合係數的方法之方塊的流程圖。
第8F圖係顯示混合器元件之實例的方塊圖。
第9圖係概述在多頻道情況下合成去相關訊號之程序的流程圖。
第10A圖係提出用於估計空間參數的方法之概要的流程圖。
第10B圖係提出用於估計空間參數的另一方法之概要的流程圖。
第10C圖係指出縮放項VB與頻帶索引l之間關係的圖。
第10D圖係指出變數VM與q之間關係的圖。
第11A圖係概述暫態判定和暫態相關控制之一些方法的流程圖。
第11B圖係包括用於暫態判定和暫態相關控制的各種元件之實例的方塊圖。
第11C圖係概述至少部分基於音訊資料的時間功率變化來決定暫態控制值之一些方法的流程圖。
第11D圖係繪示將原始暫態值映射至暫態控制值之實例的圖。
第11E圖係概述編碼暫態資訊之方法的流程圖。
第12圖係提出可配置用於實作本文所述之程序態樣之設備的元件之實例的方塊圖。
在不同圖中,相同參考數字和標記表示類似元件。
下面的說明係關於為了描述本揭露之一些創新態樣的某些實作,以及其中可實作這些創新態樣之內文的實例。然而,能以各種不同方式來應用本文之教導。雖然主要針對AC-3音訊編解碼器、和增強AC-3音訊編解碼器(也稱為E-AC-3)來說明本申請書中所提出的實例,但本文所提出之概念也應用於其他音訊編解碼器,包括但不限於MPEG-2 AAC和MPEG-4 AAC。此外,所述之實作可具體化在各種音訊處理裝置(包括但不限於編碼器及/或解碼器)中,其可包括在行動電話、智慧型手機、桌上型電腦、手持或可攜式電腦、小筆電、筆記型電腦、智慧小筆電、平板電腦、立體聲系統、電視、DVD播放器、數位記錄裝置及各種各樣其他裝置中。藉此,本揭露之教導不打算限於圖所示及/或本文所述之實作,而是具有廣泛的適用性。
包括AC-3和E-AC-3音訊編解碼器的一些音訊編解碼器(其中的專屬實作被授權為「Dolby Digital」和「Dolby Digital Plus」採用某種形式的頻道耦合以利用頻道之間的冗餘、更有效地編碼資料及減少編碼位元率。例如,藉由在超出特定「耦合開始頻率」外之耦合頻道頻率範圍中的AC-3和E-AC-3編解碼器,離散頻道(在本文中 也稱為「個別頻道」)之修改的離散餘弦轉換(MDCT)係數被降混至單音頻道,其在本文中可稱為「合成頻道」或「耦合頻道」。一些編解碼器可形成二或更多耦合頻道。
AC-3和E-AC-3解碼器基於在位元流中發送的耦合座標使用縮放因數來將耦合頻道的單音訊號升混至離散頻道中。以此方式,解碼器修復高頻率包絡,而不是在每個頻道之耦合頻道頻率範圍中的音訊資料之相位。
第1A和1B圖係顯示在音訊編碼程序期間的頻道耦合之實例的圖。第1A圖之圖102指出在頻道耦合之前對應於左頻道的音訊訊號。圖104指出在頻道耦合之前對應於右頻道的音訊訊號。第1B圖顯示在編碼(包括頻道耦合)和解碼之後的左和右頻道。在簡化實例中,圖106指出用於左頻道的音訊資料實質上是不變的,而圖108指出用於右頻道的音訊資料現在與用於左頻道的音訊資料同相。
如第1A和1B圖所示,超出耦合開始頻率的解碼訊號在頻道之間可能是相關的。因此,相較於原始訊號,超出耦合開始頻率的解碼訊號可能在空間上聽起來係崩解的。當降混解碼頻道時,例如針對經由耳機虛擬化的雙聲道呈現或透過立體聲擴音器的播放,耦合頻道可相關地加起來。當相較於原始參考訊號時,這可能導致音色不相配。當解碼訊號透過耳機而雙聲道呈現時,頻道耦合的負面影響可能特別明顯。
本文所述之各種實作可至少部分地減輕這些 影響。一些上述實作包含新穎的音訊編碼及/或解碼工具。上述實作可配置以修復藉由頻道耦合所編碼之頻率區域中的輸出頻道之相位差異。依照各種實作,可從每個輸出頻道之耦合頻道頻率範圍中的解碼頻譜係數合成去相關訊號。
然而,本文說明了許多其他類型的音訊處理裝置和方法。第2A圖係繪示音訊處理系統之元件的方塊圖。在本實作中,音訊處理系統200包括緩衝器201、開關203、去相關器205及反轉換模組255。開關203可例如是交叉點開關。緩衝器201接收音訊資料元件220a至220n,將音訊資料元件220a至220n轉送至開關203且將音訊資料元件220a至220n的副本發送至去相關器205。
在本實例中,音訊資料元件220a至220n對應於複數個音訊頻道1至N。在此,音訊資料元件220a至220n包括頻域表示,對應於音訊編碼或處理系統(其可以是傳統音訊編碼或處理系統)的濾波器組係數。然而,在其他實作中,音訊資料元件220a至220n可對應於複數個頻帶1至N。
在本實作中,開關203和去相關器205兩者接收所有的音訊資料元件220a至220n。在此,去相關器205處理所有的音訊資料元件220a至220n以產生去相關音訊資料元件230a至230n。此外,開關203接收所有的去相關音訊資料元件230a至230n。
然而,並非所有的去相關音訊資料元件230a 至230n都被反轉換模組255接收且轉換成時域音訊資料260。反而,開關203選擇去相關音訊資料元件230a至230n中的何者將被反轉換模組255接收。在本實例中,開關203根據頻道來選擇音訊資料元件230a至230n中的何者將被反轉換模組255接收。在此,例如,音訊資料元件230a被反轉換模組255接收,而音訊資料元件230n沒有。反而,開關203將未被去相關器205處理的音訊資料元件220n發送至反轉換模組255。
在一些實作中,開關203可根據對應於頻道1至N的預定設定來判斷是否將直接音訊資料元件220或去相關音訊資料元件230發送至反轉換模組255。另外或此外,開關203可根據選擇資訊207的頻道特定元件來判斷是否將音訊資料元件220或去相關音訊資料元件230發送至反轉換模組255,其可被產生或在本地儲存、或與音訊資料220一起接收。藉此,音訊處理系統200可提供特定音訊頻道的選擇性去相關。
另外或此外,開關203可根據音訊資料220的改變來判斷是否將直接音訊資料元件220或去相關音訊資料元件230發送至反轉換模組255。例如,開關203可根據選擇資訊207的訊號適應性元件來判定將去相關音訊資料元件230之何者(若有的話)發送至反轉換模組255,其可指出音訊資料220的暫態或音調改變。在其他實作中,開關203可從去相關器205接收上述訊號適應性資訊。在其他實作中,開關203可配置以決定音訊資料的改 變,如暫態或音調改變。由此,音訊處理系統200可提供特定音訊頻道的訊號適應性去相關。
如上所述,在一些實作中,音訊資料元件220a至220n可對應於複數個頻帶1至N。在一些上述實作中,開關203可根據對應於頻帶的預定設定及/或根據收到之選擇資訊207來判斷是否將音訊資料元件220或去相關音訊資料元件230發送至反轉換模組255。藉此,音訊處理系統200可提供特定頻帶的選擇性去相關。
另外或此外,開關203可根據音訊資料220的改變來判斷是否將直接音訊資料元件220或去相關音訊資料元件230發送至反轉換模組255,其可由選擇資訊207或由從去相關器205收到的資訊指出。在一些實作中,開關203可配置以決定音訊資料的改變。因此,音訊處理系統200可提供特定頻帶的訊號適應性去相關。
第2B圖提出可由第2A圖之音訊處理系統進行之操作的概要。在本實例中,方法270開始於接收對應於複數個音訊頻道之音訊資料的程序(方塊272)。音訊資料可包括頻域表示,對應於音訊編碼或處理系統的濾波器組係數。例如,音訊編碼或處理系統可以是傳統音訊編碼或處理系統,如AC-3或E-AC-3。一些實作可包含接收在傳統音訊編碼或處理系統所產生之位元流中的控制機制元件,如區塊切換之指示等。去相關程序可至少部分基於控制機制元件。下面提出了詳細實例。在本實例中,方法270也包含對至少一些音訊資料施用去相關程序(方塊 274)。去相關程序可以音訊編碼或處理系統所使用的相同濾波器組係數來進行。
再次參考第2A圖,去相關器205可取決於特定實作來進行各種類型的去相關操作。本文提出了許多實例。在一些實作中,去相關程序無須將音訊資料元件220之頻域表示的係數轉換成另一頻域或時域表示來進行。去相關程序可包含藉由對至少一部分頻域表示施用線性濾波器來產生混響訊號或去相關訊號。在一些實作中,去相關程序可包含施用完全對實數值係數操作的去相關演算法。如本文所使用,「實數值」表示只使用餘弦或正弦調變濾波器組之其一者。
去相關程序可包含對收到之音訊資料元件220a至220n的一部分施用去相關濾波器以產生經濾波的音訊資料元件。去相關程序可包含使用非階層混合器以根據空間參數來結合收到之音訊資料的直接部分(對其未施用任何去相關濾波器)與經濾波的音訊資料。例如,音訊資料元件220a的直接部分可以輸出頻道特定方式來與音訊資料元件220a之經濾波的部分混合。一些實作可包括去相關或混響訊號的輸出頻道特定結合器(例如,線性結合器)。下面說明了各種實例。
在一些實作中,音訊處理系統200可依據收到之音訊資料220的分析來決定空間參數。另外或此外,空間參數可在位元流中連同音訊資料220被接收作為部分或所有的去相關資訊240。在一些實作中,去相關資訊 240可包括個別離散頻道與耦合頻道之間的相關係數、個別離散頻道之間的相關係數、清楚音調資訊及/或暫態資訊。去相關程序可包含至少部分基於去相關資訊240來去相關至少一部分之音訊資料220。一些實作可配置以使用本地決定與收到之空間參數兩者及/或其他去相關資訊。下面說明了各種實例。
第2C圖係顯示另一音訊處理系統之元件的方塊圖。在本實例中,音訊資料元件220a至220n包括用於N個音訊頻道的音訊資料。音訊資料元件220a至220n包括頻域表示,對應於音訊編碼或處理系統的濾波器組係數。在本實作中,頻域表示係施用一完美重建、臨界取樣的濾波器組之結果。例如,頻域表示可以是對時域中的音訊資料施用修改的離散正弦轉換、修改的離散餘弦轉換或重疊正交轉換之結果。
去相關器205對至少一部分的音訊資料元件220a至220n施用去相關程序。例如,去相關程序可包含藉由對至少一部分的音訊資料元件220a至220n施用線性濾波器來產生混響訊號或去相關訊號。去相關程序可至少部分根據去相關器205收到的去相關資訊240來進行。例如,可在位元流中接收去相關資訊240連同音訊資料元件220a至220n的頻域表示。另外或此外,可藉由例如去相關器205在本地決定至少一些去相關資訊。
反轉換模組255施用反轉換以產生時域音訊資料260。在本實例中,反轉換模組255施用等同於完美 重建、臨界取樣之濾波器組的反轉換。完美重建、臨界取樣的濾波器組可能相當於(例如,由編碼裝置)對時域中的音訊資料所施用的以產生音訊資料元件220a至220n的頻域表示。
第2D圖係顯示去相關器可如何在音訊處理系統中使用之實例的方塊圖。在本實例中,音訊處理系統200係包括去相關器205的解碼器。在一些實作中,解碼器可配置以根據AC-3或E-AC-3音訊編解碼器來運行。然而,在一些實作中,音訊處理系統可配置用於為其他音訊編解碼器處理音訊資料。去相關器205可包括各種子組件,如本文別處所述之那些。在本實例中,升混器225接收音訊資料210,其包括耦合頻道之音訊資料的頻域表示。在本實例中,頻域表示係MDCT係數。
升混器225也接收用於每個頻道和耦合頻道頻率範圍的耦合座標212。在本實作中,已在Dolby Digital或Dolby Digital Plus編碼器中採用指數尾數形式來計算為耦合座標212形式的縮放資訊。升混器225可藉由將耦合頻道頻率座標乘以用於此頻道的耦合座標來計算用於每個輸出頻道的頻率係數。
在本實作中,升混器225將在耦合頻道頻率範圍中之個別頻道的去耦MDCT係數輸出至去相關器205。因此,在本實例中,輸入至去相關器205的音訊資料220包括MDCT係數。
在第2D圖所示之實例中,去相關器205所輸 出的去相關音訊資料230包括去相關MDCT係數。在本實例中,並非所有被音訊處理系統200收到的音訊資料也被去相關器205去相關。例如,音訊資料245a的頻域表示(針對低於耦合頻道頻率範圍的頻率)、以及音訊資料245b的頻域表示(針對高於耦合頻道頻率範圍的頻率)未被去相關器205去相關。這些資料連同從去相關器205輸出的去相關MDCT係數230被輸入至反MDCT程序255。在本實例中,音訊資料245b包括E-AC-3音訊編解碼器之頻譜擴展工具、音訊頻寬擴展工具所決定的MDCT係數。
在本實例中,去相關器205接收去相關資訊240。收到之去相關資訊240的類型可根據實作而有所不同。在一些實作中,去相關資訊240可包括清楚去相關器特定控制資訊及/或可形成這類控制資訊之基礎的清楚資訊。例如,去相關資訊240可包括空間參數,如個別離散頻道與耦合頻道之間的相關係數及/或個別離散頻道之間的相關係數。這類清楚去相關資訊240也可包括清楚音調資訊及/或暫態資訊。此資訊可用來至少部分地決定用於去相關器205的去相關濾波器參數。
然而,在其他實作中,去相關器205未接收任何這類清楚去相關資訊240。根據一些上述實作,去相關資訊240可包括來自傳統音訊編解碼器之位元流的資訊。例如,去相關資訊240可包括時間分段資訊,其可在根據AC-3音訊編解碼器或E-AC-3音訊編解碼器所編碼的位元流中得到。去相關資訊240可包括使用耦合資訊、 區塊切換資訊、指數資訊、指數策略資訊等。上述資訊可能已連同音訊資料210一起在位元流中被音訊處理系統接收。
在一些實作中,去相關器205(或音訊處理系統200的另一元件)可基於音訊資料的一或更多屬性來決定空間參數、音調資訊及/或暫態資訊。例如,音訊處理系統200可基於在耦合頻道頻率範圍之外的音訊資料245a或245b來決定用於在耦合頻道頻率範圍中之頻率的空間參數。另外或此外,音訊處理系統200可基於來自傳統音訊編解碼器之位元流的資訊來決定音調資訊。以下將說明一些上述實作。
第2E圖係繪示另一音訊處理系統之元件的方塊圖。在本實作中,音訊處理系統200包括N至M升混器/降混器262和M至K升混器/降混器264。在此,N至M升混器/降混器262和去相關器205接收包括用於N個音訊頻道之轉換係數的音訊資料元件220a-220n。
在本實例中,N至M升混器/降混器262可配置以根據混合資訊266來將用於N個頻道的音訊資料升混或降混至用於M個頻道的音訊資料。然而,在一些實作中,N至M升混器/降混器262可以是通過元件。在上述實作中,N=M。混合資訊266可包括N至M混合等式。例如,混合資訊266可連同去相關資訊240、對應於耦合頻道的頻域表示等一起在位元流中被音訊處理系統200接收。在本實例中,被去相關器205接收的去相關資訊240 指出去相關器205應將去相關音訊資料230的M個頻道輸出至開關203。
開關203可根據選擇資訊207來判斷是否將來自N至M升混器/降混器262的直接音訊資料或去相關音訊資料230轉送至M至K升混器/降混器264。M至K升混器/降混器264可配置以根據混合資訊268來將用於M個頻道的音訊資料升混或降混至用於K個頻道的音訊資料。在上述實作中,混合資訊268可包括M至K混合等式。針對N=M的實作中,M至K升混器/降混器264可根據混合資訊268來將用於N個頻道的音訊資料升混或降混至用於K個頻道的音訊資料。在上述實作中,混合資訊268可包括N至K混合等式。例如,混合資訊268可連同去相關資訊240及其他資料一起在位元流中被音訊處理系統200接收。
N至M、M至K或N至K混合等式可以是升混或降混等式。N至M、M至K或N至K混合等式可以是將輸入音訊訊號映射至輸出音訊訊號的一組線性組合係數。根據一些上述實作,M至K混合等式可以是立體聲降混等式。例如,M至K升混器/降混器264可配置以根據混合資訊268中的M至K混合等式來將用於4、5、6、或更多頻道的音訊資料降混至用於2個頻道的音訊資料。在一些上述實作中,用於左頻道(「L」)、中央頻道(「C」)和左環繞頻道(「Ls」)的音訊資料可根據M至K混合等式來結合成左立體聲輸出頻道Lo。用於右頻道 (「R」)、中央頻道和右環繞頻道(「Rs」)的音訊資料可根據M至K混合等式來結合成右立體聲輸出頻道Ro。例如,M至K混合等式可如下:Lo=L+0.707C+0.707Ls
Ro=R+0.707C+0.707Rs
另外,M至K混合等式可如下:Lo=L+-3dB*C+att*Ls
Ro=R+-3dB*C+att*Rs,
其中att可例如代表如-3dB、-6dB、-9dB或零的值。針對N=M的實作,上述等式可被視為N至K混合等式。
在本實例中,被去相關器205接收的去相關資訊240指出用於M個頻道的音訊資料隨後將被升混或降混至K個頻道。去相關器205可配置以使用不同的去相關程序,這取決於用於M個頻道的資料是否隨後將被升混或降混至用於K個頻道的音訊資料。藉此,去相關器205可配置以至少部分基於M至K混合等式來決定去相關濾波程序。例如,若M個頻道之後將被降混至K個頻道,則可對將在隨後降混中結合的頻道使用不同的去相關濾波器。根據一個上述實例,若去相關資訊240指出用於L、R、Ls和Rs頻道的音訊資料將被降混至2個頻道,則可對L和R頻道兩者使用一個去相關濾波器,且可對Ls和Rs頻道兩者使用另一去相關濾波器。
在一些實作中,M=K。在上述實作中,M至 K升混器/降混器264可以是通過元件。
然而,在其他實作中,M>K。在這樣實作中,M至K升混器/降混器264可當作降混器。根據一些這樣實作,可使用產生去相關降混器之較低計算強度的方法。例如,去相關器205可配置以僅為開關203將發送至反轉換模組255之頻道產生去相關音訊資料230。例如,若N=6,且M=2,則去相關器205可配置以僅為2個降混頻道產生去相關音訊資料230。在程序中,去相關器205可僅為2個而不是6個頻道使用去相關濾波器,降低了複雜性。對應混合資訊可包括在去相關資訊240、混合資訊266和混合資訊268中。由此,去相關器205可配置以至少部分基於N至M、N至K或M至K混合等式來決定去相關濾波程序。
第2F圖係顯示去相關器元件之實例的方塊圖。例如,第2F圖所示之元件可在解碼設備(如下面關於第12圖所述之設備)的邏輯系統中實作。第2F圖描繪包括去相關訊號產生器218和混合器215的去相關器205。在一些實施例中,去相關器205可包括其他元件。本文別處提出了去相關器205之其他元件的實例以及它們可如何運行。
在本實例中,音訊資料220被輸入至去相關訊號產生器218和混合器215。音訊資料220可對應於複數個音訊頻道。例如,音訊資料220可包括於在被去相關器205接收之前被升混之音訊編碼程序期間從頻道耦合產 生的資料。在一些實施例中,音訊資料220可在時域中,而在其他實施例中,音訊資料220可在頻域中。例如,音訊資料220可包括轉換係數的時序。
去相關訊號產生器218可形成一或更多去相關濾波器,對音訊資料220施用去相關濾波器且將生成之去相關訊號227提供至混合器215。在本實例中,混合器結合音訊資料220與去相關訊號227以產生去相關音訊資料230。
在一些實施例中,去相關訊號產生器218可為去相關濾波器決定去相關濾波器控制資訊。根據一些這類實施例,去相關濾波器控制資訊可對應於去相關濾波器的最大極點位移。去相關訊號產生器218可至少部分基於去相關濾波器控制資訊來為音訊資料220決定去相關濾波器參數。
在一些實作中,決定去相關濾波器控制資訊可包含一起接收去相關濾波器控制資訊的明確指示(例如,最大極點位移的明確指示)和音訊資料220。在其他實作中,決定去相關濾波器控制資訊可包含決定音訊特性資訊及至少部分基於音訊特性資訊來決定去相關濾波器參數(如最大極點位移)。在一些實作中,音訊特性資訊可包括空間資訊、音調資訊及/或暫態資訊。
現在將參考第3至5E圖來更詳細說明去相關器205的一些實作。第3圖係繪示去相關程序之實例的流程圖。第4圖係繪示可配置用於進行第3圖之去相關程序 的去相關器元件之實例的方塊圖。可在如下面關於第12圖所述之解碼設備中至少部分地進行第3圖之去相關程序300。
在本實例中,程序300當去相關器接收音訊資料時開始(方塊305)。如上面關於第2F圖所述,音訊資料可被去相關器205的去相關訊號產生器218和混合器215接收。在此,從升混器(如第2D圖之升混器225)接收至少一些音訊資料。由此,音訊資料對應於複數個音訊頻道。在一些實作中,去相關器所接收的音訊資料可包括在每個頻道之耦合頻道頻率範圍中的音訊資料之頻域表示(如MDCT係數)的時序。在其他實作中,音訊資料可在時域中。
在方塊310中,決定去相關濾波器控制資訊。例如,可根據音訊資料的音訊特性來決定去相關濾波器控制資訊。在一些實作中,如第4圖所示之實例,上述音訊特性可包括與音訊資料一起編碼的清楚空間資訊、音調資訊及/或暫態資訊。
在第4圖所示之實施例中,去相關濾波器410包括固定延遲415和時變部分420。在本實例中,去相關訊號產生器218包括去相關濾波器控制模組405,用於控制去相關濾波器410的時變部分420。在本實例中,去相關濾波器控制模組405接收為音調旗標形式的清楚音調資訊425。在本實作中,去相關濾波器控制模組405也接收清楚暫態資訊430。在一些實作中,可隨音訊資料一起接 收清楚音調資訊425及/或清楚暫態資訊430,例如作為部分的去相關資訊240。在一些實作中,可在本地產生清楚音調資訊425及/或清楚暫態資訊430。
在一些實作中,去相關器205未接收任何清楚空間資訊、音調資訊或暫態資訊。在一些上述實作中,去相關器205的暫態控制模組(或音訊處理系統的另一元件)可配置以基於音訊資料的一或更多屬性來決定暫態資訊。去相關器205的空間參數模組可配置以基於音訊資料的一或更多屬性來決定空間參數。本文別處說明了一些實例。
在第3圖之方塊315中,至少部分基於方塊310中所決定的去相關濾波器控制資訊來決定用於音訊資料的去相關濾波器參數。接著,可根據去相關濾波器參數來形成去相關濾波器,如方塊320所示。例如,濾波器可以是具有至少一個延遲元件的線性濾波器。在一些實作中,濾波器可至少部分基於半純函數。例如,濾波器可包括全通濾波器。
在第4圖所示之實作中,去相關濾波器控制模組405可至少部分基於去相關器205在位元流中收到之音調旗標425及/或清楚暫態資訊430來控制去相關濾波器410的時變部分420。下面說明了一些實例。在本實例中,僅對在耦合頻道頻率範圍中的音訊資料施用去相關濾波器410。
在本實施例中,去相關濾波器410包括在時 變部分420前面的固定延遲415,在本實例中這是全通濾波器。在一些實施例中,去相關訊號產生器218可包括一組全通濾波器。例如,在音訊資料220在頻域中的一些實施例中,去相關訊號產生器218可包括用於複數個頻率區間之各者的全通濾波器。然而,在其他實作中,可對每個頻率區間施用相同濾波器。另外,頻率區間可被分組且可對每組施用相同濾波器。例如,頻率區間可被分組為頻帶,可藉由頻道來分組及/或藉由頻帶和藉由頻道來分組。
固定延遲量可能是可選擇的,例如,藉由邏輯裝置及/或根據使用者輸入。為了將受控渾沌引入去相關訊號227中,去相關濾波器控制405可施用去相關濾波器參數以控制全通濾波器的極點,使得一或更多極點在受限區域中隨機地或偽隨機地移動。
因此,去相關濾波器參數可包括用於移動全通濾波器之至少一極點的參數。這類參數可包括用於顫動全通濾波器之一或更多極點的參數。另外,去相關濾波器參數可包括用於從全通濾波器之每個極點的複數個預定極點位置中選擇極點位置的參數。在預定時間間隔(例如,每Dolby Digital Plus區塊一次),可隨機地或偽隨機地選擇全通濾波器之每個極點的新位置。
現在將參考第5A至5E圖來說明一些上述實作。第5A圖係顯示移動全通濾波器的極點之實例的圖。圖500係第三級全通濾波器的極點圖。在本實例中,濾波 器具有兩個複數極點(極點505a和505c)和一個實數極點(極點505b)。大圓是單位圓515。隨著時間的推移,極點位置可能顫動(或以其他方式改變),使得它們在分別限制極點505a、505b和505c之可能路徑的限制區域510a、510b和510c內移動。
在本實例中,限制區域510a、510b和510c係圓形的。極點505a、505b和505c的初始(或「種子」)位置係由在限制區域510a、510b和510c中心的圓表示。在第5A圖之實例中,限制區域510a、510b和510c係以初始極點位置為中心之半徑為0.2的圓。極點505a和505c相當於複數共軛對,而極點505b是實數極點。
然而,其他實作可包括更多或更少極點。其他實作也可包括不同尺寸或形狀的限制區域。一些實例係顯示於第5D和5E圖中,並於下面說明。
在一些實作中,音訊資料的不同頻道共享相同的限制區域。然而,在其他實作中,音訊資料的頻道不共享相同的限制區域。無論音訊資料的頻道是否共享相同的限制區域,都可對每個音訊頻道獨立地顫動(或以其他方式移動)極點。
極點505a的樣本軌道係由限制區域510a內的箭頭表示。每個箭頭代表極點505a的移動或「步幅」520。雖然未顯示於第5A圖中,但複數共軛對的兩個極點(極點505a和505c)前後地移動,使得極點保持其共軛關係。
在一些實作中,可藉由改變最大步幅值來控制極點的移動。最大步幅值可對應於從最近極點位置的最大極點位移。最大步幅值可定義具有等於最大步幅值之半徑的圓。
一個這樣的實例係顯示於第5A圖中。極點505a從其初始位置位移步幅520a至位置505a’。可根據先前的最大步幅值(例如,初始最大步幅值)來限制步幅520a。在極點505a從其初始位置移至位置505a’之後,決定新的最大步幅值。最大步幅值定義最大步幅圓525,其具有等於最大步幅值的半徑。在第5A圖所示之實例中,下一個步幅(步幅520b)恰好等於最大步幅值。因此,步幅520b將極點移至在最大步幅圓525的圓周上之位置505a”。然而,步幅520通常可能小於最大步幅值。
在一些實作中,可在每個步幅之後重設最大步幅值。在其他實作中,可在多個步幅之後及/或根據音訊資料的改變來重設最大步幅值。
可以各種方式來決定及/或控制最大步幅值。在一些實作中,最大步幅值可至少部分基於將被施用去相關濾波器之音訊資料的一或更多屬性。
例如,最大步幅值可至少部分基於音調資訊及/或暫態資訊。根據一些上述實作,對於音訊資料的高音調訊號(如關於調音管、大鍵琴等之音訊資料)而言,最大步幅值可能是零或接近零,這導致極點很少或沒有發生變化。在一些實作中,最大步幅值在暫態訊號(如關於爆 炸、關門等之音訊資料)的攻擊瞬間可能是零或接近零。隨後(例如,經過極少區塊的時間週期),最大步幅值可斜線上升至較大值。
在一些實作中,可基於音訊資料的一或更多屬性來在解碼器中偵測音調及/或暫態資訊。例如,可根據音訊資料的一或更多屬性藉由如控制資訊接收器/產生器640的模組來決定音調及/或暫態資訊,其係以下關於第6B和6C圖所述。另外,清楚音調及/或暫態資訊可從編碼器傳送且在解碼器所接收的位元流中收到,例如,經由音調及/或暫態旗標。
在本實作中,可根據顫動參數來控制極點的移動。因此,儘管可根據最大步幅值來限制極點的移動,但極點移動的方向及/或程度可包括隨機或準隨機成分。例如,極點的移動可至少部分基於以軟體所實作之隨機數產生器或虛擬隨機數產生器演算法的輸出。這類軟體可儲存於非暫態媒體上且被邏輯系統執行。
然而,在其他實作中,去相關濾波器參數可不包含顫動參數。反而,極點移動可能受限於預定極點位置。例如,一些預定極點位置可位於最大步幅值所定義的半徑內。邏輯系統可隨機地或偽隨機地選擇這些預定極點位置之其一者作為下一個極點位置。
可採用各種其他方法來控制極點移動。在一些實作中,若極點正接近限制區域的邊界,則極點移動的選擇可偏向較接近限制區域中心的新極點位置。例如,若 極點505a移向限制區域510a的邊界,則最大步幅圓525中心可往限制區域510a中心內移,使得最大步幅圓525永遠位於限制區域510a的邊界內。
在一些上述實作中,可施用權重函數以建立可能將極點位置移動遠離限制區域邊界的偏移。例如,可能不對最大步幅圓525內的預定極點位置指派等於被選定為下一個極點位置的機率。反而,可能指派較接近限制區域中心的預定極點位置具有高於距限制區域中心較遠之預定極點位置的機率。根據一些上述實作,當極點505a接近限制區域510a的邊界時,下一個極點移動將更有可能往限制區域510a之中心。
在本實例中,極點505b的位置也改變,但被控制,使得極點505b繼續保持實數。藉此,極點505b的位置被限制為位於沿著限制區域510b的直徑530。然而,在其他實作中,極點505b可移至具有虛數分量的位置。
在另外其他實作中,所有極點的位置可被限制為僅沿著半徑移動。在一些上述實作中,極點位置的改變僅增加或減少極點(在振幅方面),但不影響它們的相位。例如,上述實作可能有用於告知選定混響時間常數。
用於對應於較高頻率之頻率係數的極點可能比用於對應於較低頻率之頻率係數的極點更接近單位圓515中心。我們將使用第5B圖(第5A圖之變化)來說明示範實作。在此,在給定時間瞬間,三角形505a”’、505b”’ 和505c”’表示在顫動或說明其時間變化的一些其他程序之後所獲得之頻率f0的極點位置。令位於505a”’的極點由z1表示且位於505b”’的極點由z2表示。位於505c”’的極點是位於505a”’的極點之複數共軛,且因此由z1 *來表示,其中星號表示複數共軛。
在本實例中,用於在任何其他頻率f下使用之濾波器的極點係藉由以因數a(f)/a(f0)縮放極點z1、z2和z1 *來獲得,其中a(f)係隨著音訊資料頻率f而減少的函數。當f=f0時,縮放因數等於1且極點係位於預期位置。根據一些上述實作,可對比對應於較低頻率之頻率係數更高頻率的頻率係數施用較小群組延遲。在這裡所述之實施例中,極點在一個頻率下顫動且被縮放以獲得用於其他頻率的極點位置。例如,頻率f0可以是耦合開始頻率。在其他實作中,極點可在每個頻率下分開顫動,且限制區域(510a、510b、和510c)可實質上在比較低頻率更高的頻率下接近原點。
根據本文所述之各種實作,極點505可以是可移動的,但可維持彼此實質上一致的空間或角度關係。在一些上述實作中,可不根據限制區域來限制極點505的移動。
第5C圖顯示一個上述實例。在本實例中,複數共軛極點505a和505c可在單位圓515內以順時針或反時針方向來移動。當極點505a和505c(例如,以預定時間間隔)移動時,這兩個極點可被旋轉角度θ,這被隨機地或 準隨機地選定。在一些實施例中,此角運動可根據最大角度步幅值來限制。在第5C圖所示之實例中,極點505a已在順時針方向上移動角度θ。由此,極點505c已在反時針分向上移動角度θ,以維持極點505a與極點505c之間的複數共軛關係。
在本實例中,極點505b被限制為沿著實軸移動。在一些上述實作中,極點505a和極點505c也可往或遠離單位圓515中心移動,例如,如以上關於第5B圖所述。在其他實作中,可不移動極點505b。在另外其他實作中,可從實軸移動極點505b。
在第5A和5B圖所示之實例中,限制區域510a、510b和510c係圓形的。然而,發明人考慮了各種其他限制區域形狀。例如,第5D圖之限制區域510d的形狀實質上係橢圓形的。極點505d可位於橢圓形限制區域510d內的各種位置。在第5E圖之實例中,限制區域510e係環形的。極點505e可位於限制區域510d之環形內的各種位置。
現在回去第3圖,在方塊325中,對至少一些音訊資料施用去相關濾波器。例如,第4圖之去相關訊號產生器218可對至少一些輸入音訊資料220施用去相關濾波器。去相關濾波器227的輸出可與輸入音訊資料220不相關。此外,去相關濾波器的輸出可具有與輸入訊號實質上相同的功率頻譜密度。因此,去相關濾波器227的輸出可能聽起來係自然的。在方塊330中,去相關濾波器的 輸出係與輸入音訊資料混合。在方塊335中,輸出去相關音訊資料。在第4圖之實例中,在方塊330中,混合器215結合去相關濾波器227的輸出(其在本文中可稱為「經濾波的音訊資料」)與輸入音訊資料220(其在本文中可稱為「直接音訊資料」)。在方塊335中,混合器215輸出去相關音訊資料230。在方塊340中,若判定將處理更多音訊資料,則去相關程序300返回至方塊305。否則,去相關程序300結束(方塊345)。
第6A圖係繪示去相關器之另一實作的方塊圖。在本實例中,混合器215和去相關訊號產生器218接收對應於複數個頻道的音訊資料元件220。例如,至少一些音訊資料元件220可從升混器(如第2D圖之升混器225)輸出。
在此,混合器215和去相關訊號產生器218也接收各種類型的去相關資訊。在一些實作中,至少一些去相關資訊可在位元流中連同音訊資料元件220一起被接收。另外或此外,可例如藉由去相關器205之其他元件或藉由音訊處理系統200之一或更多其他元件來在本地決定至少一些去相關資訊。
在本實例中,收到之去相關資訊包括去相關訊號產生器控制資訊625。去相關訊號產生器控制資訊625可包括去相關濾波器資訊、增益資訊、輸入控制資訊等。去相關訊號產生器至少部分基於去相關訊號產生器控制資訊625來產生去相關訊號227。
在此,收到之去相關資訊也包括暫態控制資訊430。在本揭露中的別處提出了去相關器205可如何使用及/或產生暫態控制資訊430的各種實例。
在本實作中,混合器215包括合成器605及直接訊號和去相關訊號混合器610。在本實例中,合成器605係去相關或混響訊號(如從去相關訊號產生器218收到的去相關訊號227)的輸出頻道特定結合器。根據一些上述實作,合成器605可以是去相關或混響訊號的線性結合器。在本實例中,去相關訊號227對應於已被去相關訊號產生器施用一或更多去相關濾波器之用於複數個頻道的音訊資料元件220。因此,去相關訊號227在本文中也可稱為「經濾波的音訊資料」或「經濾波的音訊資料元件」。
在此,直接訊號和去相關訊號混合器610係經濾波的音訊資料元件與對應於複數個頻道之「直接」音訊資料元件220的輸出頻道特定結合器,用以產生去相關音訊資料230。於是,去相關器205可提供音訊資料的頻道特定和非階層去相關。
在本實例中,合成器605根據去相關訊號合成參數615(其在本文中也可稱為「去相關訊號合成係數」)來結合去相關訊號227。同樣地,直接訊號和去相關訊號混合器610根據混合係數620來結合直接與經濾波的音訊資料元件。去相關訊號合成參數615和混合係數620可至少部分基於收到之去相關資訊。
在此,收到之去相關資訊包括空間參數資訊 630,其在本實例中係頻道特定的。在一些實作中,混合器215可配置以至少部分基於空間參數資訊630來決定去相關訊號合成參數615及/或混合係數620。在本實例中,收到之去相關資訊也包括降混/升混資訊635。例如,降混/升混資訊635可指出結合多少音訊資料的頻道來產生降混的音訊資料,其可對應於在耦合頻道頻率範圍中的一或更多耦合頻道。降混/升混資訊635也可指出一些期望輸出頻道及/或輸出頻道的特性。如以上關於第2E圖所述,在一些實作中,降混/升混資訊635可包括對應於被N至M升混器/降混器262收到之混合資訊266及/或被M至K升混器/降混器264收到之混合資訊268的資訊。
第6B圖係繪示去相關器之另一實作的方塊圖。在本實例中,去相關器205包括控制資訊接收器/產生器640。在此,控制資訊接收器/產生器640接收音訊資料元件220和245。在本實例中,對應音訊資料元件220也被混合器215和去相關訊號產生器218接收。在一些實作中,音訊資料元件220可對應於在耦合頻道頻率範圍中的音訊資料,而音訊資料元件245可對應於在耦合頻道頻率範圍之外之一或更多頻率範圍中的音訊資料。
在本實作中,控制資訊接收器/產生器640根據去相關資訊240及/或音訊資料元件220及/或245來決定去相關訊號產生器控制資訊625和混合器控制資訊645。下面說明了控制資訊接收器/產生器640及其功能的一些實例。
第6C圖繪示音訊處理系統的另一實作。在本實例中,音訊處理系統200包括去相關器205、開關203及反轉換模組255。在一些實作中,開關203和反轉換模組255可實質上如以上關於第2A圖所述。同樣地,混合器215和去相關訊號產生器可實質上如本文別處所述。
控制資訊接收器/產生器640可根據特定實作而具有不同的功能。在本實作中,控制資訊接收器/產生器640包括濾波器控制模組650、暫態控制模組655、混合器控制模組660及空間參數模組665。當使用音訊處理系統200的其他元件時,控制資訊接收器/產生器640的元件可經由硬體、韌體、儲存於非暫態媒體上的軟體及/或以上之組合來實作。在一些實作中,這些元件可藉由如本揭露中之別處所述的邏輯系統來實作。
例如,濾波器控制模組650可配置以控制去相關訊號產生器,如以上關於第2E-5E圖所述及/或如以下關於第11B圖所述。下面提出了暫態控制模組655和混合器控制模組660之功能的各種實例。
在本實例中,控制資訊接收器/產生器640接收音訊資料元件220和245,其可包括開關203及/或去相關器205所接收的至少一部分音訊資料。音訊資料元件220被混合器215和去相關訊號產生器218接收。在一些實作中,音訊資料元件220可對應於在耦合頻道頻率範圍中的音訊資料,而音訊資料元件245可對應於在耦合頻道頻率範圍之外之頻率範圍中的音訊資料。例如,音訊資料 元件245可對應於在高於及/或低於耦合頻道頻率範圍之頻率範圍中的音訊資料。
在本實作中,控制資訊接收器/產生器640根據去相關資訊240、音訊資料元件220及/或音訊資料元件245來決定去相關訊號產生器控制資訊625和混合器控制資訊645。控制資訊接收器/產生器640將去相關訊號產生器控制資訊625和混合器控制資訊645分別提供至去相關訊號產生器218和混合器215。
在一些實作中,控制資訊接收器/產生器640可配置以決定音調資訊及至少部分基於音調資訊來決定去相關訊號產生器控制資訊625及/或混合器控制資訊645。例如,控制資訊接收器/產生器640可配置以經由清楚音調資訊(如音調旗標)來接收清楚音調資訊作為去相關資訊240的一部分。控制資訊接收器/產生器640可配置以處理收到之清楚音調資訊及決定音調控制資訊。
例如,若控制資訊接收器/產生器640判定在耦合頻道頻率範圍中的音訊資料是高音調,則控制資訊接收器/產生器640可配置以提供指出最大步幅值應設成零或接近零的去相關訊號產生器控制資訊625,這導致極點很少或沒有發生變化。隨後(例如,經過極少區塊的時間週期),最大步幅值可斜線上升至較大值。在一些實作中,若控制資訊接收器/產生器640判定在耦合頻道頻率範圍中的音訊資料是高音調,則控制資訊接收器/產生器640可配置以對空間參數模組665指出相對較高的平滑程 度可應用於計算各種量,如估計空間參數所使用的能量。本文別處提出了回應於判定高音調音訊資料的其他實例。
在一些實作中,控制資訊接收器/產生器640可配置以根據音訊資料220之一或更多屬性及/或根據來自經由去相關資訊240所接收的傳統音訊碼之位元流的資訊(如指數資訊及/或指數策略資訊)來決定音調資訊。
例如,在根據E-AC-3音訊編解碼器所編碼之音訊資料的位元流中,差分地編碼用於轉換係數的指數。在頻率範圍中之絕對指數差的總和係沿著對數強度域中之訊號的頻譜包絡行進之距離的測量。如定調管和大鍵琴的訊號具有柵欄頻譜且因此測量此距離所沿著之路徑的特徵在於許多波峰和波谷。因此,針對上述訊號,沿著在相同頻率範圍中的頻譜包絡所行進的距離大於用於對應於例如鼓掌或雨水之音訊資料的訊號(其具有較平坦的頻譜)。
由此,在一些實作中,控制資訊接收器/產生器640可配置以至少部分基於根據在耦合頻道頻率範圍中的指數差來決定音調度量。例如,控制資訊接收器/產生器640可配置以基於在耦合頻道頻率範圍中的平均絕對指數差來決定音調度量。根據一些上述實作,只有當對訊框中的所有區塊共享耦合指數策略且不指出指數頻率共享時才計算音調度量,在這種情況下,定義從一個頻率區間至下一個頻率區間的指數差係有意義的。根據一些實作,只有當對耦合頻道設定E-AC-3適應性混合轉換(「AHT」)旗標時才計算音調度量。
若音調度量被判定為E-AC-3音訊資料的絕對指數差,則在一些實作中,音調度量可取0與2之間的值,因為-2、-1、0、1、和2係根據E-AC-3所允許的唯一指數差。可設定一或更多音調臨界值以區分音調與非音調訊號。例如,一些實作包含設定用於進入音調狀態的一個臨界值及用於退出音調狀態的另一臨界值。用於退出音調狀態的臨界值可低於用於進入音調狀態的臨界值。上述實作提供滯後程度,使得略低於上臨界值的音調值將不會無意間造成音調狀態改變。在一實例中,用於退出音調狀態的臨界值是0.40,而用於進入音調狀態的臨界值是0.45。然而,其他實作可包括更多或更少臨界值,且臨界值可具有不同值。
在一些實作中,音調度量計算可根據存在於訊號中的能量來加權。這種能量可直接地從指數推知。對數能量度量可與指數成反比,因為指數被表示為E-AC-3中的兩個負功率。根據上述實作,為低能量之頻譜的那些部分將比為高能量之頻譜的那些部分貢獻更少給整體音調度量。在一些實作中,僅可對訊框的區塊零進行音調度量計算。
在第6C圖所示之實例中,來自混合器215的去相關音訊資料230被提供至開關203。在一些實作中,開關203可決定直接音訊資料220和去相關音訊資料230的哪些成分將被發送至反轉換模組255。藉此,在一些實作中,音訊處理系統200可提供音訊資料成分的選擇性或 訊號適應性去相關。例如,在一些實作中,音訊處理系統200可提供音訊資料之特定頻道的選擇性或訊號適應性去相關。另外或此外,在一些實作中,音訊處理系統200可提供音訊資料之特定頻帶的選擇性或訊號適應性去相關。
在音訊處理系統200的各種實作中,控制資訊接收器/產生器640可配置以決定音訊資料220之一或更多類型的空間參數。在一些實作中,至少一些上述功能可由第6C圖所示之空間參數模組665提供。一些上述空間參數可以是個別離散頻道與耦合頻道之間的相關係數,其在本文中也可稱為「alpha」。例如,若耦合頻道包括用於四個頻道的音訊資料,則可能有四個alpha,每個頻道一個alpha。在一些上述實作中,四個頻道可以是左頻道(「L」)、右頻道(「R」)、左環繞頻道(「Ls」)及右環繞頻道(「Rs」)。在一些實作中,耦合頻道可包括用於上述頻道和中央頻道的音訊資料。可或可不對中央頻道計算alpha,這取決於是否將去相關中央頻道。其他實作可包含更大或更小頻道數量。
其他空間參數可以是頻道間相關係數,其指出個別離散頻道對之間的相關。上述參數在本文中有時可稱為反映「頻道間關連性」或「ICC」。在上面提到的四個頻道實例中,可能有包含六個ICC值,用於L-R對、L-Ls對、L-Rs對、R-Ls對、R-Rs對及Ls-Rs對。
在一些實作中,藉由控制資訊接收器/產生器640來決定空間參數可包含例如經由去相關資訊240來在 位元流中接收清楚空間參數。另外或此外,控制資訊接收器/產生器640可配置以估計至少一些空間參數。控制資訊接收器/產生器640可配置以至少部分基於空間參數來決定混合參數。因此,在一些實作中,可藉由混合器控制模組660來至少部分地進行關於決定和處理空間參數的功能。
第7A和7B圖係提出空間參數之簡化圖示的向量圖。第7A和7B圖可被視為在N維相量空間中之訊號的3-D概念圖。每個N維向量可表示實數或複數值的隨機變數,其N個座標對應於任何N個獨立試驗。例如,N個座標可對應於在頻率範圍內及/或在時間間隔(例如,在極少音訊區塊期間)內之訊號的N個頻域係數之集合。
首先參考第7A圖之左平面,此向量圖表示左輸入頻道lin、右輸入頻道rin與耦合頻道xmono(藉由加總lin與rin形成之單音降混)之間的空間關係。第7A圖係形成耦合頻道(其可藉由編碼設備來進行)的簡化實例。左輸入頻道lin與耦合頻道xmono之間的相關係數是αL,且右輸入頻道rin與耦合頻道之間的相關係數是αR。由此,表示左輸入頻道lin與耦合頻道xmono的向量之間的角度θL等於arccos(αL),且表示右輸入頻道rin與耦合頻道xmono的向量之間的角度θR等於arccos(αR)。
第7A圖之右平面顯示去相關個別輸出頻道與耦合頻道的簡化實例。這種類型的去相關程序可例如藉由 解碼設備來進行。藉由產生與耦合頻道xmono不相關(垂直)的去相關訊號yL,且使用適當權重來將它與耦合頻道xmono混合,個別輸出頻道的振幅(在本實例中是lout)及其與耦合頻道xmono分離的角度能準確地反映出個別輸入頻道的振幅及其與耦合頻道的空間關係。去相關訊號yL應具有與耦合頻道xmono相同的功率分佈(在此係由向量長度表示)。在本實例中,l out =α L x mono + y L 。藉由指示=β L l out =α L x mono +β L y L
然而,修復個別離散頻道與耦合頻道之間的空間關係並不保證修復離散頻道之間的空間關係(由ICC表示)。這項事實係繪示於第7B圖中。第7B圖中的兩個平面顯示兩種極端情況。當去相關訊號yL和yR分離180°時lout與rout之間的間隔會最大,如第7B圖之左平面所示。在這種情況下,左與右頻道之間的ICC會最小且lout與rout之間的相位差異會最大。相反地,如第7B圖之右平面所示,當去相關訊號yL和yR分離0°時lout與rout之間的間隔會最小。在這種情況下,左與右頻道之間的ICC會最大且lout與rout之間的相位差異會最小。
在第7B圖所示之實例中,所有顯示向量都在相同平面上。在其他實例中,yL和yR可位於相對於彼此的其他角度。然而,yL和yR最好是垂直於,或至少實質上垂直於耦合頻道xmono。在一些實例中,yL和yR之任一者可至少部分地延伸至正交於第7B圖之平面的平面中。
由於離散頻道最後播放且呈現給聽眾,因此 適當修復離散頻道之間的空間關係(ICC)可顯著地改進音訊資料的空間特性之修復。如可由第7B圖之實例看出,ICC的準確修復係取決於建立彼此具有適當空間關係的去相關訊號(在此是yL和yR)。去相關訊號之間的這種相關在本文中可稱為去相關訊號間的關連性或「IDC」。
在第7B圖之左平面上,yL與yR之間的IDC是-1。如上所述,此IDC與左和右頻道之間的最小ICC對應。藉由比較第7B圖之左平面與第7A圖之左平面,可觀察到在本實例中具有兩個耦合頻道,lout與rout之間的空間關係準確地反映出lin與rin之間的空間關係。在第7B圖之右平面上,yL與yR之間的IDC是1(完全相關)。藉由比較第7B圖之右平面與第7A圖之左平面,可看出在本實例中的lout與rout之間的空間關係未準確地反映出lin與rin之間的空間關係。
於是,藉由將空間上相鄰的個別頻道之間的IDC設成-1,可最小化這些頻道之間的ICC且當這些頻道是主要的時可嚴密地修復頻道之間的空間關係。這導致整體聲音影像,其在感知上近似於原始音訊訊號的聲音影像。這樣的方法在本文中可稱為「正負號翻轉」法。在這樣的方法中,不需要任何實際ICC的知識。
第8A圖係繪示本文所提出之一些去相關方法之方塊的流程圖。當使用本文所述之其他方法時,不一定以所指示的順序來進行方法800的方塊。此外,方法800的一些實作及其他方法可包括比所示或所述更多或更少的 方塊。方法800開始於方塊802,其中接收對應於複數個音訊頻道的音訊資料。音訊資料可例如被音訊解碼系統的元件接收。在一些實作中,音訊資料可被音訊解碼系統的去相關器接收,如本文所揭露之去相關器205的其中一個實作。音訊資料可包括用於藉由升混對應於耦合頻道的音訊資料所產生之複數個音訊頻道的音訊資料元件。根據一些實作,可能已藉由對對應於耦合頻道的音訊資料施用頻道特定、時變縮放因數來升混音訊資料。下面提出了一些實例。
在本實例中,方塊804包含決定音訊資料的音訊特性。在此,音訊特性包括空間參數資料。空間參數資料可包括alpha、個別音訊頻道與耦合頻道之間的相關係數。方塊804可包含接收空間參數資料,例如,經由以上關於第2A圖以及下列等等所述之去相關資訊240。另外或此外,方塊804可包含在本地估計空間參數,例如,藉由控制資訊接收器/產生器640(參見例如第6B或6C圖)。在一些實作中,方塊804可包含決定其他音訊特性,如暫態特性或音調特性。
在此,方塊806包含至少部分基於音訊特性來決定用於音訊資料的至少兩個去相關濾波程序。去相關濾波程序可以是頻道特定去相關濾波程序。根據一些實作,在方塊806中決定的每個去相關濾波程序包括一系列有關去相關的操作。
施用在方塊806中決定之至少兩個去相關濾 波程序可產生頻道特定去相關訊號。例如,施用在方塊806中決定之去相關濾波程序可導致用於至少一對頻道的頻道特定去相關訊號之間的特定去相關訊號間的關連性(「IDC」)。一些上述去相關濾波程序可包含對至少一部分的音訊資料施用至少一個去相關濾波器(例如,如以下關於第8B圖或第8E圖之方塊820所述)以產生經濾波的音訊資料,在本文中也稱為去相關訊號。可對經濾波的音訊資料進行另外操作來產生頻道特定去相關訊號。一些上述去相關濾波程序可包含側向正負號翻轉程序,如以下關於第8B-8D圖所述的其中一個側向正負號翻轉程序。
在一些實作中,在方塊806中,可判定將使用相同的去相關濾波器來產生對應於將被去相關的所有頻道之經濾波的音訊資料,而在其他實作中,在方塊806中,可判定將使用不同的去相關濾波器來產生用於將被去相關之至少一些頻道之經濾波的音訊資料。在一些實作中,在方塊806中,可判定將不去相關對應於中央頻道的音訊資料,而在其他實作中,方塊806可包含決定用於中央頻道之音訊資料的不同去相關濾波器。此外,雖然在一些實作中,在方塊806中決定的每個去相關濾波程序包括一系列有關去相關的操作,但在其他實作中,在方塊806中決定的每個去相關濾波程序可與整體去相關程序的特定階段對應。例如,在其他實作中,在方塊806中決定的每個去相關濾波程序可與在有關產生用於至少兩個頻道的去相關訊號之一系列操作內的特定操作(或一組相關操作)對 應。
在方塊808中,將實作在方塊806中決定的去相關濾波程序。例如,方塊808可包含對至少一部分收到之音訊資料施用去相關濾波器以產生經濾波的音訊資料。例如,經濾波的音訊資料可與去相關訊號產生器218所產生的去相關訊號227對應,如以上關於第2F、4及/或6A-6C圖所述。方塊808也可包含各種其他操作,將在下面提出其實例。
在此,方塊810包含至少部分音訊特性來決定混合參數。可藉由控制資訊接收器/產生器640的混合器控制模組660(參見第6C圖)來至少部分地進行方塊810。在一些實作中,混合參數可以是輸出頻道特定混合參數。例如,方塊810可包含接收或估計用於將被去相關之每個音訊頻道的alpha值,及至少部分基於alpha來決定混合參數。在一些實作中,alpha可根據暫態控制資訊來修改,暫態控制資訊可由暫態控制模組655(參見第6C圖)決定。在方塊812中,經濾波的音訊資料可根據混合參數來與音訊資料的直接部分混合。
第8B圖係繪示側向正負號翻轉法之方塊的流程圖。在一些實作中,第8B圖所示之方塊係第8A圖之「決定」方塊806和「施用」方塊808的實例。因此,這些方塊在第8B圖中被標記為「806a」和「808a」。在本實例中,方塊806a包含決定去相關濾波器及用於至少兩個相鄰頻道之去相關訊號的極性以導致用於這對頻道的去 相關訊號之間的特定IDC。在本實作中,方塊820包含對至少一部分收到之音訊資料施用在方塊806a中決定的一或更多去相關濾波器以產生經濾波的音訊資料。例如,經濾波的音訊資料可與去相關訊號產生器218所產生的去相關訊號227對應,如以上關於第2E和4圖所述。
在一些四個頻道實例中,方塊820可包含針對第一和第二頻道對音訊資料施用第一去相關濾波器以產生第一頻道濾波的資料和第二頻道濾波的資料,及針對第三和第四頻道對音訊資料施用第二去相關濾波器以產生第三頻道濾波的資料和第四頻道濾波的資料。例如,第一頻道可以是左頻道,第二頻道可以是右頻道,第三頻道可以是左環繞頻道且第四頻道可以是右環繞頻道。
可在升混音訊資料之前或之後施用去相關濾波器,這取決於特定實作。在一些實作中,例如,可對音訊資料的耦合頻道施用去相關濾波器。隨後,可施用適用於每個頻道的縮放因數。下面參考第8C圖來說明一些實例。
第8C和8D圖係繪示可用於實作一些正負號翻轉法之元件的方塊圖。首先參考第8B圖,在本實作中,在方塊820中,對輸入音訊資料的耦合頻道施用去相關濾波器。在第8C圖所示之實例中,去相關訊號產生器控制資訊625和音訊資料210(其包括對應於耦合頻道的頻域表示)被去相關訊號產生器218接收。在本實例中,去相關訊號產生器218輸出去相關訊號227,其對於將被去 相關之所有頻道係相同的。
第8B圖之程序808a可包含對經濾波的音訊資料進行操作以產生去相關訊號,其具有用於至少一對頻道的去相關訊號之間的特定去相關訊號間的關連性IDC。在本實作中,方塊825包含對在方塊820中產生之經濾波的音訊資料施加極性。在本實例中,在方塊806a中,決定在方塊820中施加的極性。在一些實作中,方塊825包含反向用於相鄰頻道之經濾波的音訊資料之間的極性。例如,方塊825可包含將對應於左側頻道或右側頻道之經濾波的音訊資料乘以-1。方塊825可包含針對對應於左側頻道之經濾波的音訊資料來反向對應於左環繞頻道之經濾波的音訊資料之極性。方塊825也可包含針對對應於右側頻道之經濾波的音訊資料來反向對應於右環繞頻道之經濾波的音訊資料之極性。在上述四個頻道實例中,方塊825可包含相對於第二頻道濾波的資料地反向第一頻道濾波的資料之極性及相對於第四頻道濾波的資料地反向第三頻道濾波的資料之極性。
在第8C圖所示之實例中,去相關訊號227(其也被表示為y)被極性反向模組840接收。極性反向模組840係配置以反向用於相鄰頻道之去相關訊號的極性。在本實例中,極性反向模組840係配置以反向用於右頻道和左環繞頻道之去相關訊號的極性。然而,在其他實作中,極性反向模組840可配置以反向用於其他頻道之去相關訊號的極性。例如,極性反向模組840可配置以反向用於左 頻道和右環繞頻道之去相關訊號的極性。其他實作可包含反向用於另外其他頻道之去相關訊號的極性,這取決於所包含之頻道數量及其空間關係。
極性反向模組840將去相關訊號227(包括正負號翻轉的去相關訊號227)提供至頻道特定混合器215a-215d。頻道特定混合器215a-215d也接收耦合頻道之直接未經濾波的音訊資料210及輸出頻道特定空間參數資訊630a-630d。另外或此外,在一些實作中,頻道特定混合器215a-215d可接收以下關於第8F圖所述之修改的混合係數890。在本實例中,輸出頻道特定空間參數資訊630a-630d已根據暫態資料(例如,根據來自如第6C圖所示之暫態控制模組的輸入)來修改。下面提出了根據暫態資料來修改空間參數的實例。
在本實作中,頻道特定混合器215a-215d根據輸出頻道特定空間參數資訊630a-630d來混合去相關訊號227與耦合頻道的直接音訊資料210及將產生之輸出頻道特定混合音訊資料845a-845d輸出至增益控制模組850a-850d。在本實例中,增益控制模組850a-850d係配置以對輸出頻道特定混合音訊資料845a-845d施用輸出頻道特定增益(在本文中也稱為縮放因數)。
現在將參考第8D圖來說明另一種正負號翻轉法。在本實例中,藉由去相關訊號產生器218a-218d至少部分基於頻道特定去相關控制資訊847a-847d來對音訊資料210a-210d施用頻道特定去相關濾波器。在一些實作 中,去相關訊號產生器控制資訊847a-847d可在位元流中連同音訊資料一起收到,而在其他實作中,可例如藉由去相關濾波器控制模組405來在本地(至少部分地)產生去相關訊號產生器控制資訊847a-847d。在此,去相關訊號產生器218a-218d也可根據從去相關濾波器控制模組405收到的去相關濾波器係數資訊來產生頻道特定去相關濾波器。在一些實作中,可藉由去相關濾波器控制模組405(其被所有頻道共享)來產生單一濾波器描述。
在本實例中,已在去相關訊號產生器218a-218d接收音訊資料210a-210d之前對音訊資料210a-210d施用頻道特定增益/縮放因數。例如,若已根據AC-3或E-AC-3音訊編解碼器來編碼音訊資料,則縮放因數可以是耦合座標或「cplcoord」,其與其餘的音訊資料一起被編碼且在位元流中被如解碼裝置的音訊處理系統接收。在一些實作中,cplcoord也可能是增益控制模組850a-850d對輸出頻道特定混合音訊資料845a-845d(參見第8C圖)所施用之輸出頻道特定縮放因數的基準。
因此,去相關訊號產生器218a-218d輸出用於將被去相關之所有頻道的頻道特定去相關訊號227a-227d。在第8D圖中,去相關訊號227a-227d也分別稱為yL、yR、yLS和yRS
去相關訊號227a-227d被極性反向模組840接收。極性反向模組840係配置以反向用於相鄰頻道之去相關訊號的極性。在本實例中,極性反向模組840係配置以 反向用於右頻道和左環繞頻道之去相關訊號的極性。然而,在其他實作中,極性反向模組840可配置以反向用於其他頻道之去相關訊號的極性。例如,極性反向模組840可配置以反向用於左和右環繞頻道之去相關訊號的極性。其他實作可包含反向用於另外其他頻道之去相關訊號的極性,這取決於所包含之頻道數量及其空間關係。
極性反向模組840將去相關訊號227a-227d(包括正負號翻轉的去相關訊號227b和227c)提供至頻道特定混合器215a-215d。在此,頻道特定混合器215a-215d也接收直接音訊資料210a-210d及輸出頻道特定空間參數資訊630a-630d。在本實例中,輸出頻道特定空間參數資訊630a-630d已根據暫態資料來修改。
在本實作中,頻道特定混合器215a-215d根據輸出頻道特定空間參數資訊630a-630d來混合去相關訊號227與直接音訊資料210a-210d及輸出輸出頻道特定混合音訊資料845a-845d。
本文提出了用於修復離散輸入頻道之間的空間關係之其他方法。方法可包含有系統地決定合成係數以決定將如何合成去相關或混響訊號。根據一些這類方法,從alpha和目標ICC判定最佳IDC。這類方法可包含根據被判定為最佳的IDC來有系統地合成一組頻道特定去相關訊號。
現在將參考第8E和8F圖來說明一些這樣有系統的方法之概要。隨後將說明進一步細節,包括一些實 例的基本數學公式。
第8E圖係繪示從空間參數資料決定合成係數和混合係數的方法之方塊的流程圖。第8F圖係顯示混合器元件之實例的方塊圖。在本實例中,方法851在第8A圖的方塊802和804之後開始。由此,第8E圖所示之方塊可被視為第8A圖之「決定」方塊806和「施用」方塊808的另外實例。因此,第8E圖之方塊855-865被標記為「806b」且方塊820和870被標記為「808b」。
然而,在本實例中,在方塊806中決定的去相關程序可包含根據合成係數來對經濾波的音訊資料進行操作。下面提出了一些實例。
可選方塊855可包含將一種形式的空間參數轉換成等效表示。參考第8F圖,例如,合成和混合係數產生模組880可接收空間參數資訊630b,其包括描述N個輸入頻道之間的空間關係、或這些空間關係之子集的資訊。模組880可配置以將至少一些空間參數資訊630b從一種形式的空間參數轉換成等效表示。例如,可將alpha轉換成ICC,或反之亦然。
在其他音訊處理系統實作中,可藉由除了混合器215以外的元件來進行合成和混合係數產生模組880的至少一些功能。例如,在一些其他實作中,可藉由如第6C圖所示和以上所述之控制資訊接收器/產生器640來進行合成和混合係數產生模組880的至少一些功能。
在本實作中,方塊860包含針對空間參數表 示來決定輸出頻道之間的期望空間關係。如第8F圖所示,在一些實作中,合成和混合係數產生模組880可接收降混/升混資訊635,其可包括對應於N至M升混器/降混器262收到之混合資訊266及/或第2E圖之M至K升混器/降混器264收到之混合資訊268的資訊。合成和混合係數產生模組880也可接收空間參數資訊630a,其包括描述K個輸出頻道之間的空間關係、或這些空間關係之子集的資訊。如以上關於第2E圖所述,輸入頻道的數量可能或可能不等於輸出頻道的數量。模組880可配置以計算K個輸出頻道之至少一些對之間的期望空間關係(例如,ICC)。
在本實例中,方塊865包含基於期望空間關係來決定合成係數,混合係數也可至少部分基於期望空間關係來決定。再次參考第8F圖,在方塊865中,合成和混合係數產生模組880可根據輸出頻道之間的期望空間關係來決定去相關訊號合成參數615。合成和混合係數產生模組880也可根據輸出頻道之間的期望空間關係來決定混合係數620。
合成和混合係數產生模組880可將去相關訊號合成參數615提供至合成器605。在一些實作中,去相關訊號合成參數615可以是輸出頻道特定的。在本實例中,合成器605也接收去相關訊號227,其可由如第6A圖所示之去相關訊號產生器218產生。
在本實例中,方塊820包含對至少一部分收 到之音訊資料施用一或更多去相關濾波器以產生經濾波的音訊資料。例如,經濾波的音訊資料可與去相關訊號產生器218所產生的去相關訊號227符合,如以上關於第2E和4圖所述。
方塊870可包含根據合成係數來合成去相關訊號。在一些實作中,方塊870可包含藉由對在方塊820中產生之經濾波的音訊資料進行操作來合成去相關訊號。由此,合成去相關訊號可被視為修改型式之經濾波的音訊資料。在第8F圖所示之實例中,合成器605可配置以根據去相關訊號合成參數615來對去相關訊號227進行操作及將合成去相關訊號886輸出至直接訊號和去相關訊號混合器610。在此,合成去相關訊號886係頻道特定合成去相關訊號。在一些上述實作中,方塊870可包含將頻道特定合成去相關訊號乘以適用於每個頻道的縮放因數以產生經縮放的頻道特定合成去相關訊號886。在本實例中,合成器605根據去相關訊號合成參數615來構成去相關訊號227的線性組合。
合成和混合係數產生模組880可將混合係數620提供至混合器暫態控制模組888。在本實作中,混合係數620係輸出頻道特定混合係數。混合器暫態控制模組888可接收暫態控制資訊430。暫態控制資訊430可連同音訊資料一起收到或可例如藉由如第6C圖所示之暫態控制模組655的暫態控制模組來在本地決定。混合器暫態控制模組888可至少部分基於暫態控制資訊430來產生經修 改的混合係數890,及可將經修改的混合係數890提供至直接訊號和去相關訊號混合器610。
直接訊號和去相關訊號混合器610可混合合成去相關訊號886與直接未經濾波的音訊資料220。在本實例中,音訊資料220包括對應於N個輸入頻道的音訊資料元件。直接訊號和去相關訊號混合器610在輸出頻道特定基礎上混合音訊資料元件與頻道特定合成去相關訊號886及取決於特定實作來輸出用於N或M個輸出頻道的去相關音訊資料230(例如,參見第2E圖及對應說明)。
下面是方法851之方法的一些程序之詳細實例。雖然至少部分地參考AC-3和E-AC-3音訊編解碼器的特徵來說明這些方法,但方法對於許多其他音訊編解碼器而言具有廣泛的適用性。
一些上述方法之目標係為了準確地播放所有ICC(或選定的ICC組)以修復可能已由於頻道耦合而遺失之原始音訊資料的空間特性。混合器的功能可被公式化為:
在等式1中,x代表耦合頻道訊號,αi代表用於頻道I的空間參數alpha,gi代表用於頻道I的「cplcoord」(對應於縮放因數),yi代表去相關訊號且Di(x)代表從去相關濾波器Di產生的去相關訊號。希望去相關濾波器的輸出具有與輸入音訊資料相同,但與輸入音 訊資料不相關的頻譜功率分佈。根據AC-3和E-AC-3音訊編解碼器,cplcoord和alpha係每個耦合頻道頻帶,而訊號和濾波器係每個頻率區間。而且,訊號的樣本對應於濾波器組係數的區塊。為了簡單起見,在此省略了這些時間和頻率索引。
alpha值代表原始音訊資料的離散頻道與耦合頻道之間的相關性,其可表示如下:
在等式2中,E代表波形括號內之項目的期望值,x*代表x的複數共軛且si代表用於頻道I的離散訊號。
一對去相關訊號之間的頻道間關連性或ICC能被推導如下:
在等式3中,IDC i1,i2代表Di1(x)與Di2(x)之間的去相關訊號間的關連性(「IDC」)。使用固定alpha,ICC當IDC是+1時會最大且當IDC是-1時會最小。當已知原始音訊資料的ICC時,複製它所需的最佳IDC能被解開為:
可藉由選擇滿足等式4之最佳IDC條件的去相關訊號來控制去相關訊號之間的ICC。下面將論述產生上述去相關訊號的一些方法。在論述之前,說明這些空間參數之一些者之間(特別是ICC與alpha之間)的關係可能是有用的。
如以上關於方法851的可選方塊855所述,本文所提出的一些實作可包含將一種形式的空間參數轉換成等效表示。在一些上述實作中,可選方塊855可包含從alpha轉換成ICC,或反之亦然。例如,若已知cplcoord(或可比較縮放因數)與ICC兩者,則可唯一地決定alpha。
耦合頻道可被產生如下:
在等式5中,si代表用於包含在耦合中之頻道i的離散訊號,且gx代表對x施用的任意增益調整。藉由將等式2的x項目替換成等式5的等效表達式,用於頻道i的alpha能表示如下:
每個離散頻道的功率能由耦合頻道的功率和對應cplcoord的功率表示如下: E{|s i |2}=g i 2 E{|x|2}
交叉相關項目能被取代如下:E{s i s j *}=g i g j E{|x|2}ICC i,j
因此,可以此方式來表示alpha:
基於等式5,x的功率可表示如下:
由此,增益調整gx可表示如下:
藉此,若已知所有cplcoordc和ICC,則alpha能根據下面的表達式來計算:
如上所述,可藉由選擇滿足等式4的去相關 訊號來控制去相關訊號之間的ICC。在立體聲的情況下,可形成單一去相關濾波器,其產生與耦合頻道訊號不相關的去相關訊號。能僅藉由正負號翻轉來實現為-1的最佳IDC,例如,根據上述之其中一個正負號翻轉法。
然而,控制用於多頻道情況之ICC的任務更為複雜。除了確保所有去相關訊號實質上與耦合頻道不相關之外,去相關訊號中的IDC也應滿足等式4。
為了產生具有期望IDC的去相關訊號,首先可產生一組互不相關的「種子」去相關訊號。例如,可根據本文別處所述之方法來產生去相關訊號227。隨後,可藉由線性地結合這些種子與適當權重來合成期望去相關訊號。以上參考第8E和8F圖來說明一些實例之概要。
從一個降混產生許多高品質和互不相關(例如,正交)的去相關訊號可能具有挑戰性。再者,計算適當組合權重可包含矩陣反轉,這可帶來複雜性和穩定性方面的挑戰。
因此,在本文所提出的一些實例中,可實作「定錨和擴展」程序。在一些實作中,一些IDC(和ICC)可能比其他更為顯著。例如,旁邊ICC在感知上可能比對角ICC更為重要。在杜比5.1頻道實例中,用於L-R、L-Ls、R-Rs和Ls-Rs頻道對的ICC在感知上可能比用於L-Rs和R-Ls頻道對的ICC更為重要。前面頻道在感知上可能比後面或環繞頻道更為重要。
在一些上述實作中,能首先藉由結合兩個正 交(種子)去相關訊號以合成用於所包含之兩個頻道的去相關訊號來滿足用於最重要IDC之等式4的項目。接著,使用這些合成去相關訊號作為錨點及加入新種子,能滿足用於次級IDC之等式4的項目且能合成對應去相關訊號。可重覆此程序,直到對所有IDC滿足等式4的項目為止。上述實作允許使用較高品質的去相關訊號來控制相對更重要的ICC。
第9圖係概述在多頻道情況下合成去相關訊號之程序的流程圖。方法900的方塊可被視為第8A圖之方塊806的「決定」程序和第8A圖之方塊808的「施用」程序之另外實例。於是,在第9圖中,方塊905-915被標記為「806c」且方法900的方塊920和925被標記為「808c」。方法900提出在5.1頻道內容中的實例。然而,方法900對於其他內容而言具有廣泛的適用性。
在本實例中,方塊905-915包含計算將對一組互不相關的種子去相關訊號Dni(x)所施用之合成參數,其係產生於方塊920中。在一些5.1頻道實作中,i={1,2,3,4}。若將去相關中央頻道,則可包含第五種子去相關訊號。在一些實作中,可藉由將單音降混訊號輸入至數個不同的去相關濾波器中來產生不相關(正交)的去相關訊號Dni(x)。另外,初始升混訊號能各被輸入至唯一的去相關濾波器中。下面提出了各種實例。
如上所述,前面頻道在感知上可能比後面或環繞頻道更為重要。因此,在方法900中,用於L和R 頻道的去相關訊號被共同定錨於前兩個種子上,然後使用這些錨點和其餘種子來合成用於Ls和Rs頻道的去相關訊號。
在本實例中,方塊905包含計算用於前面L和R頻道的合成參數ρ和ρr。在此,ρ和ρr從L-R IDC被推導為:
於是,方塊905也包含從等式4計算L-R IDC。藉此,在本實例中,使用ICC資訊來計算L-R IDC。方法的其他程序也可使用ICC值作為輸入。可從編碼位元流或藉由在解碼器端估計(例如,基於非耦合較低頻帶或較高頻帶、cplcoord、alpha等)來獲得ICC值。
在方塊925中,可使用合成參數ρ和ρr來合成用於L和R頻道的去相關訊號。可使用用於L和R頻道的去相關訊號作為錨點來合成用於Ls和Rs頻道的去相關訊號。
在一些實作中,可能希望控制Ls-Rs ICC。根據方法900,合成具有兩個種子去相關訊號的中間去相關訊號D’Ls(x)和D’Rs(x)包含計算合成參數σ和σr。因此,可選方塊910包含計算用於環繞頻道的合成參數σ和σr。能推導出中間去相關訊號D’Ls(x)和D’Rs(x)之間的所需相關係數可表示如下:
可從其相關係數推導出變數σ和σr
因此,D’Ls(x)和D’Rs(x)能被定義為:D ' Ls (x)=σD n3(x)+σ r D n4(x)
D ' Rs (x)=σD n4(x)+σ r D n3(x)
然而,若Ls-Rs ICC不必關切,則D’Ls(x)和D’Rs(x)之間的相關係數能設成-1。由此,這兩個訊號僅會是藉由其餘種子去相關訊號建構的彼此之正負號翻轉型式。
中央頻道可能或可能不被去相關,這取決於特定實作。藉此,計算用於中央頻道的合成參數t1和t2之方塊915的程序係可選的。例如,若希望控制L-C和R-C ICC,則可計算出用於中央頻道的合成參數。若是,則能加入第五種子Dn5(x)且用於C頻道的去相關訊號可表示如下:
為了實現期望L-C和R-C ICC,應對L-C和R-C IDC滿足等式4: IDC L,C =ρt 1 *+ρ r t 2 *
IDC R,C =ρ r t 1 *+ρt 2 *
星號表示複數共軛。因此,用於中央頻道的合成參數t1和t2可表示如下:
在方塊920中,可產生一組互不相關的種子去相關訊號Dni(x),i={1,2,3,4}。若將去相關中央通道,則在方塊920中,可產生第五種子去相關訊號。可藉由將單音降混訊號輸入至數個不同的去相關濾波器中來產生這些不相關(正交)的去相關訊號Dni(x)。
在本實例中,方塊925包含施用上面推導出的項目來合成去相關訊號,如下:D L (x)=ρD n1(x)+ρ r D n2(x)
D R (x)=ρD n2(x)+ρ r D n1(x)
D Ls (x)=IDC L,Ls * ρD n1(x)+IDC L,Ls * ρ r D n2(x)
在本實例中,用來合成用於Ls和Rs頻道之去相關訊號(DLs(x)和DRs(x))的等式係取決於用來合成用於L和R頻道之去相關訊號(DL(x)和DR(x))的等式。在方 法900中,用於L和R頻道的去相關訊號被共同定錨以減緩由於不完美的去相關訊號而造成的可能左右偏移。
在上述實例中,在方塊920中,從單音降混訊訊號x產生種子去相關訊號。另外,能藉由將每個初始升混訊號輸入至唯一去相關濾波器中來產生種子去相關訊號。在這種情況下,所產生的種子去相關訊號會是頻道特定的:Dni(gix),i={L,R,Ls,Rs,C}。這些頻道特定種子去相關訊號通常會由於升混程序而具有不同功率層級。於是,希望當結合它們時對齊這些種子中的功率層級。為了實現此,用於方塊925的合成等式能被修改如下:D L (x)=ρD nL (g L x)+ρ r λ L,R D nR (g R x)
D R (x)=ρD nR (g R x)+ρ r λ R,L D nL (g L x)
D Ls (x)=IDC L,Ls * ρλ Ls,L D nL (g L x)+IDC L,Ls * ρ r λ Ls,R D nR (g R x)
在修改的合成等式中,所有合成參數保持相同。然而,當使用從頻道j產生的種子去相關訊號來合成用於頻道i的去相關訊號時,需要層級調整參數λi,j來對齊功率層級。這些頻道對特定層級調整參數能基於估計的頻道層級差來計算,如:
再者,在這種情況下,由於頻道特定縮放因數已併入合成去相關訊號中,因此用於方塊812(第8A圖)的混合器等式應從根據等式1被修改為:
如本文別處所述,在一些實作中,空間參數可連同音訊資料一起被接收。例如,空間參數已可與音訊資料一起被編碼。可藉由如解碼器的音訊處理系統來在位元流中接收編碼的空間參數和音訊資料,例如,如以上關於第2D圖所述。在此實例中,空間參數經由清楚去相關資訊240被去相關器205接收。
然而,在其他實作中,沒有任何編碼的空間參數(或不完整的空間參數組)被去相關器205接收。根據一些上述實作,以上關於第6B和6C圖所述之控制資訊接收器/產生器640(或音訊處理系統200的另一元件)可配置以基於音訊資料的一或更多屬性來估計空間參數。在一些實作中,控制資訊接收器/產生器640可包括空間參數模組665,其係配置用於空間參數估計及本文所述之相關功能。例如,空間參數模組665可基於耦合頻道頻率範圍之外之音訊資料的特性來估計用於在耦合頻道頻率範圍中之頻率的空間參數。現在將參考第10A圖以及下列等等來說明一些上述實作。
第10A圖係提出用於估計空間參數的方法之概要的流程圖。在方塊1005中,包括第一組頻率係數和 第二組頻率係數的音訊資料被音訊處理系統接收。例如,第一和第二組頻率係數可以是對時域中的音訊資料施用修改的離散正弦轉換、修改的離散餘弦轉換或重疊正交轉換之結果。在一些實作中,可已根據傳統編碼程序來編碼音訊資料。例如,傳統編碼程序可以是AC-3音訊編解碼器或增強AC-3音訊編解碼器之程序。因此,在一些實作中,第一和第二組頻率係數可以是實數值頻率係數。然而,方法1000並不限定其應用為這些編解碼器,而是廣泛地適用於許多音訊編解碼器。
第一組頻率係數可對應於第一頻率範圍且第二組頻率係數可對應於第二頻率範圍。例如,第一頻率範圍可對應於個別頻道頻率範圍且第二頻率範圍可對應於收到之耦合頻道頻率範圍。在一些實作中,第一頻率範圍可低於第二頻率範圍。然而,在其他實作中,第一頻率範圍可高於第二頻率範圍。
參考第2D圖,在一些實作中,第一組頻率係數可對應於音訊資料245a或245b,其包括耦合頻道頻率範圍之外之音訊資料的頻域表示。在本實例中,音訊資料245a和245b未被去相關,但仍可作為用於去相關器205所進行之空間參數估計的輸入。第二組頻率係數可對應於音訊資料210或220,其包括對應於耦合頻道的頻域表示。然而,不同於第2D圖之實例,方法1000可不包含接收空間參數資料連同用於耦合頻道的頻率係數。
在方塊1010中,估計用於至少一部分的第二 組頻率係數之空間參數。在一些實作中,估計係基於估計理論之一或更多態樣。例如,估計程序可至少部分基於最大概似法、貝氏估計量、動差估計法、最小均方誤差估計量及/或最小變異無偏估計量。
一些上述實作可包含估計較低頻率和較高頻率之空間參數的聯合機率密度函數(「PDF」)。例如,比如說我們具有兩個頻道L和R,且在每個頻道中,我們具有在個別頻道頻率範圍中的低頻帶及在耦合頻道頻率範圍中的高頻帶。因此,我們可具有ICC_lo,其表示在個別頻道頻率範圍中的L和R頻道之間的頻道間關連性、及ICC_hi,其存在於耦合頻道頻率範圍中。
若我們具有大量訓練組的音訊訊號,則我們能分段它們,且能為每個區段計算ICC_lo和ICC_hi。因此,我們可具有大量訓練組的ICC對(ICC_lo,ICC_hi)。這對參數的聯合PDF可被計算為直方圖及/或經由參數模型(例如,高斯混合模型)來模型化。這種模型可以是在解碼器中已知的時不變模型。另外,模型參數可經由位元流來定期地發送至解碼器。
在解碼器中,可計算用於收到之音訊資料之特定區段的ICC_lo,例如,根據如何如本文所述地計算個別頻道與合成耦合頻道之間的交叉相關係數。給定此ICC_lo值和參數之聯合PDF的模型,解碼器可嘗試估計ICC_hi是什麼。一個這樣的估計值是最大概似(「ML」)估計值,其中解碼器可計算給定ICC_lo值之ICC_hi的條 件PDF。此條件PDF現在基本上是能呈現於x-y軸上的正實數值函數,x軸代表連續的ICC_hi值且y軸代表每個上述值的條件機率。ML估計值可包含選擇此函數之峰值作為ICC_hi的估計值。另一方面,最小均方誤差(「MMSE」)估計值係此條件PDF的平均數,其係ICC_hi的另一有效估計值。估計理論提出許多這樣的工具來想出ICC_hi的估計值。
上述兩個參數實例係非常簡單的實例。在一些實作中,可能有較大數量的頻道以及頻帶。空間參數可以是alpha或ICC。此外,PDF模型可能受限於訊號類型。例如,可以有用於暫態的不同模型、用於音調訊號的不同模型、等等。
在本實例中,方塊1010的估計係至少部分基於第一組頻率係數。例如,第一組頻率係數可包括用於在收到之耦合頻道頻率範圍之外的第一頻率範圍中之二或更多個別頻道的音訊資料。估計程序可包含基於二或更多頻道的頻率係數來計算在第一頻率範圍內之合成耦合頻道的組合頻率係數。估計程序也可包含計算組合頻率係數與在第一頻率範圍內之個別頻道的頻率係數之間的交叉相關係數。估計程序的結果可根據輸入音訊訊號的時間變化而有所不同。
在方塊1015中,可對第二組頻率係數施用估計的空間參數以產生修改的第二組頻率係數。在一些實作中,對第二組頻率係數施用估計的空間參數之程序可以是 去相關程序的一部分。去相關程序可包含產生混響訊號或去相關訊號及將其施用至第二組頻率係數。在一些實作中,去相關程序可包含施用完全對實數值係數操作的去相關演算法。去相關程序可包含特定頻道及/或特定頻帶的選擇性或訊號適應性去相關。
現在將參考第10B圖來說明更詳細的實例。第10B圖係提出用於估計空間參數的另一方法之概要的流程圖。可藉由如解碼器的音訊處理系統來進行方法1020。例如,可藉由如第6C圖所示之控制資訊接收器/產生器640來至少部分地進行方法1020。
在本實例中,第一組頻率係數係在個別頻道頻率範圍中。第二組頻率係數對應於音訊處理系統所接收的耦合頻道。第二組頻率係數係在收到之耦合頻道頻率範圍中,其在本實例中高於個別頻道頻率範圍。
藉此,方塊1022包含接收用於個別頻道及用於收到之耦合頻道的音訊資料。在一些實作中,可根據傳統編碼程序來編碼音訊資料。對收到之耦合頻道的音訊資料施用根據方法1000或方法1020所估計的空間參數可產生空間上比藉由根據符合傳統編碼程序之傳統解碼程序來解碼收到之音訊資料所獲得更準確的音訊播放。在一些實作中,傳統編碼程序可以是AC-3音訊編解碼器或增強AC-3音訊編解碼器之程序。由此,在一些實作中,方塊1022可包含接收實數值頻率係數而不是具有虛數值的頻率係數。然而,方法1020並不限於這些編解碼器,而是 廣泛地適用於許多音訊編解碼器。
在方法1020的方塊1025中,至少一部分的個別頻道頻率範圍分成複數個頻帶。例如,個別頻道頻率範圍可分成2、3、4或更多頻帶。在一些實作中,每個頻帶可包括預定數量的連續頻率係數,例如,6、8、10、12或更多連續頻率係數。在一些實作中,只有部分之個別頻道頻率範圍可分成頻帶。例如,一些實作可包含只將個別頻道頻率範圍的較高頻率部分(較接近收到之耦合頻道頻率範圍)分成頻帶。根據一些E-AC-3為基的實例,個別頻道頻率範圍的較高頻率部分可分成2或3個頻帶,各包括12個MDCT係數。根據一些上述實作,只有個別頻道頻率範圍之高於1kHz、高於1.5kHz等的部分可分成頻帶。
在本實例中,方塊1030包含計算在個別頻道頻帶中的能量。在本實例中,若已從耦合排除個別頻道,則在方塊1030中,將不計算所排除之頻道的頻帶能量。在一些實作中,在方塊1030中計算的能量值可能是平滑的。
在本實作中,在方塊1035中,基於在個別頻道頻率範圍中之個別頻道的音訊資料來建立合成耦合頻道。方塊1035可包含計算用於合成耦合頻道的頻率係數,其在本文中可稱為「組合頻率係數」。可使用在個別頻道頻率範圍中之二或更多頻道的頻率係數來建立組合頻率係數。例如,若已根據E-AC-3編解碼器來編碼音訊資料,則方塊1035可包含計算低於「耦合開始頻率」(其係 在收到之耦合頻道頻率範圍中的最低頻率)的MDCT係數之局部降混。
在方塊1040中,可決定在個別頻道頻率範圍之每個頻帶內之合成耦合頻道的能量。在一些實作中,在方塊1040中計算的能量值可能是平滑的。
在本實例中,方塊1045包含決定交叉相關係數,其對應於個別頻道的頻帶與合成耦合頻道的對應頻帶之間的相關性。在此,在方塊1045中計算交叉相關係數也包含計算在個別頻道之各者之頻帶中的能量及在合成耦合頻道之對應頻帶中的能量。可正規化交叉相關係數。根據一些實作,若已從耦合排除個別頻道,則將不會在計算交叉相關係數中使用排除之頻道的頻率係數。
方塊1050包含估計用於已耦合至收到之耦合頻道中之每個頻道的空間參數。在本實作中,方塊1050包含基於交叉相關係數來估計空間參數。估計程序可包含平均跨所有個別頻道頻帶之正規化交叉相關係數。估計程序也可包含對正規化交叉相關係數的平均施用縮放因數以獲得用於已耦合至收到之耦合頻道中的個別頻道之估計的空間參數。在一些實作中,縮放因數可隨著漸增的頻率而減少。
在本實例中,方塊1055包含對估計的空間參數加入雜訊。可加入雜訊以模型化估計的空間參數之變化。可根據對應於跨頻帶之空間參數之預期預測的一組規則來加入雜訊。規則可基於經驗資料。經驗資料可對應於 從大量的音訊資料樣本組得到的觀察及/或測量。在一些實作中,所加入的雜訊之變化可基於用於頻帶之估計的空間參數、頻帶索引及/或正規化交叉相關係數之變化。
一些實作可包含接收或決定關於第一或第二組頻率係數的音調資訊。根據一些上述實作,方塊1050及/或1055之程序可根據音調資訊而變化。例如,若第6B圖或第6C圖之控制資訊接收器/產生器640判定在耦合頻道頻率範圍中的音訊資料是高音調的,則控制資訊接收器/產生器640可配置以暫時地減少在方塊1055中加入的雜訊量。
在一些實作中,估計的空間參數可以是用於接收之耦合頻道頻帶之估計的alpha。一些上述實作可包含對對應於耦合頻道的音訊資料施用alpha,例如,作為去相關程序的一部分。
現在將說明方法1020的更詳細實例。在E-AC-3音訊編解碼器的內容中提出了這些實例。然而,這些實例所示之概念並不限於E-AC-3音訊編解碼器之內容,而是廣泛地適用於許多音訊編解碼器。
在本實例中,合成耦合頻道被計算為離散來源之混合物:
在等式8中,其中SDi代表頻道i之特定頻率範圍(kstart..kend)的解碼MDCT轉換之列向量,其中 kend=KCPL,區間索引對應於E-AC-3耦合開始頻率、收到之耦合頻道頻率範圍的最低頻率。在此,gx代表不影響估計程序的正規化項目。在一些實作中,gx可設成1。
關於kstart與kend之間所分析之區間數量的決定可基於複雜性限制與估計alpha的期望準確性之間的折衷。在一些實作中,kstart可對應於等於或高於特定臨界值的頻率(例如,1kHz),以便使用在較接近收到之耦合頻道頻率範圍之頻率範圍中的音訊資料以增進估計alpha值。頻率區域(kstart..kend)可分成頻帶。在一些實作中,用於這些頻帶的交叉相關係數可被計算如下:
在等式9中,sDi(l)代表對應於較低頻率範圍之頻帶l之sDi的區段,且xD(l)代表xD的對應區段。在一些實作中,可使用簡單的極零無限脈衝回應(「IIR」)濾波器來逼近期望值E{},例如,如下所示:
在等式10中,{y}(n)代表使用多達區塊之n次方個之樣本的E{y}之估計值。在本實例中,僅對用於目前區塊耦合中的那些頻道計算cc i (l)。為了平滑功率估計之目的,僅給定實數為基的MDCT係數,發現α=0.2的值是足夠的。針對除了MDCT以外的轉換,且特別針對複雜轉 換,可使用較大的α值。在這種情況下,在0.2<α<0.5範圍中的α值會是合理的。一些較低複雜性的實作可包含所計算之相關係數cc i (l)而不是功率和交叉相關係數的時間平滑化。雖然分別估計分子和分母在數學上不相等,但得到這樣較低複雜性平滑化以提供交叉相關係數之足夠準確的估計值。作為第一級IIR濾波器之估計函數的特定實作不排除透過其他架構的實作,如基於「先進後出」(「FILO」)緩衝器的實作。在上述實作中,可從目前估計值E{}刪去緩衝器中的最舊樣本,而可將最新樣本加入至目前估計值E{}
在一些實作中,平滑化程序考慮先前區塊的係數sDi是否為耦合。例如,若在先前區塊中,頻道i並非為耦合,則針對目前區塊,α可設成1.0,因為用於先前區塊的MDCT係數未包括在耦合頻道中。而且,先前的MDCT轉換已使用E-AC-3短區塊模式來編碼,其在這種情況下進一步有效設定α為1.0。
在此階段中,已決定個別頻道與合成耦合頻道之間的交叉相關係數。在第10B圖之實例中,已進行對應於方塊1022至1045的程序。下面的程序係基於交叉相關係數來估計空間參數的實例。這些程序係方法1020之方塊1050的實例。
在一實例中,使用用於低於KCPL(收到之耦合頻道頻率範圍的最低頻率)之頻帶的交叉相關係數,可產生將用於去相關高於KCPL的MDCT係數之alpha的估計 值。根據一個上述實作之用於從cc i (l)計算估計之alpha的虛擬碼係如下:
對產生alpha之上述外插程序的主要輸入係CCm,其代表目前區域上方之相關係數(cc i (l))的平均數。 「區域」可以是連續E-AC-3區塊的任意分組。E-AC-3訊框可由超過一個區域組成。然而,在一些實作中,區域不跨載訊框邊界。CCm可被計算如下(表示為上述虛擬碼中的函數MeanRegion()):
在等式11中,i代表頻道索引,L代表用於 估計的低頻帶(低於KCPL)數量,且N代表目前區域內的區塊數量。在此,我們延伸記號cc i (l)以包括區塊索引n。平均交叉相關係數可接下來經由重覆應用下面的縮放操作被外插至收到之耦合頻道頻率範圍以產生用於每個耦合頻道頻帶的預期alpha值:fAlphaRho=fAlphaRho * MAPPED_VAR_RHO (等式12)
當應用等式12時,用於第一耦合頻道頻帶的fAlphaRho可以是CCm(i)*MAPPED_VAR_RHO。在虛擬碼實例中,藉由觀察平均alpha值趨於隨著漸增的頻帶索引而減少來試探性地推導出變數MAPPED_VAR_RHO。由此,MAPPED_VAR_RHO被設成小於1.0。在一些實作中,MAPPED_VAR_RHO被設成0.98。
在此階段中,已估計空間參數(在本實例中的alpha)。在第10B圖之實例中,已進行對應於方塊1022至1050的程序。下面的程序係加入雜訊至或「顫動」估計的空間參數之實例。這些程序係方法1020之方塊1055的實例。
基於預測誤差如何隨著用於大量不同類型之多頻道輸入訊號的頻率而變化之分析,本發明人已訂出試探規則,其控制施加於估計的alpha值之隨機程度。(外插之後藉由從較低頻率之相關計算所獲得之)在耦合頻道頻率範圍中之估計的空間參數最後可能具有相同的統計量,猶如當所有個別頻道係可用的而未耦合時,已在耦合頻道 頻率範圍中從原始訊號直接地計算這些參數。加入雜訊的目的係給予類似於憑經驗所觀察到的統計變量。在上述虛擬碼中,VB代表憑經驗推導出的縮放項,其指出變量如何隨著頻帶索引的函數而變化。VM代表憑經驗推導出的特徵,其係基於對施用合成變量之前之alpha的預測。這說明了預測誤差的變量實際上是預測之函數的事實。例如,當用於頻帶之alpha的線性預測接近1.0時,變量非常低。CCV項代表基於用於目前共享區塊區域的所計算cci值之局部變量的控制。CCv可被計算如下(以上述虛擬碼中的VarRegion()表示):
在本實例中,VB控制根據頻帶索引的顫動變量。藉由檢查跨從來源計算的alpha預測誤差之頻帶的變量來憑經驗推導出VB。本發明人發現可根據下面的等式來模型化正規化變量與頻帶索引l之間的關係:
第10C圖係指出縮放項VB與頻帶索引l之間關係的圖。第10C圖顯示VB特徵的結合將導致估計的alpha,其將具有隨著頻帶索引的函數逐漸增大的變量。在等式13中,頻帶索引l3對應於低於3.42kHz(E-AC-3 音訊編解碼器之最低耦合開始頻率)的區域。因此,用於那些頻帶索引的VB值係不重要的。
藉由檢查alpha預測誤差的行為作為預測本身的函數來推導出VM參數。尤其是,本發明人透過分析大量多頻道內容發現到當預測alpha值係負的時,預測誤差的變量增加,其中alpha的峰值=-0.59375。這意味著當在分析下的目前頻道與降混xD是負相關時,估計的alpha通常可能更混亂。於下,等式14模型化期望行為:
在等式14中,q代表預測的量化型式(以虛擬碼中的fAlphaRho表示),且可根據下列等式來計算:q=floor(fAlphaRho*128)
第10D圖係指出變數VM與q之間關係的圖。請注意VM會被q=0的值來正規化,使得VM修改促成預測誤差變量的其他因素。於是,VM項僅影響用於q=0以外之值的整體預測誤差變量。在虛擬碼中,符號iAlphaRho被設成q+128。這種映射避免對iAlphaRho之負值的需要且允許直接從如表格的資料結構讀取VM(q)之值。
在本實作中,下一個步驟係用以藉由三個因數VM、Vb和CCv來縮放隨機變數w。VM與CCv之間的幾何平均可被計算且被應用為對隨機變數的縮放因數。在一些實作中,w可被實作為具有零平均數單位變量高斯分佈的隨機數之極大表格。
在縮放程序之後,可施用平滑程序。例如,可例如藉由使用簡單的極零或FILO平滑器來跨時間地平滑顫動估計的空間參數。若先前區塊並非為耦合,或若目前區塊係區塊區域中的第一區塊,則平滑係數可設成1.0。藉此,來自雜訊記錄w的縮放隨機數可被低通濾波,其被發現以更好使估計的alpha值之變量與來源中的alpha之變量相配。在一些實作中,此平滑程序可以是比用於cc i (l)之平滑較不具侵略性的(即,具有較短脈衝回應的IIR)。
如上所述,可藉由如第6C圖所示之控制資訊接收器/產生器640來至少部分地進行包含在估計alpha及/或其他空間參數中的程序。在一些實作中,控制資訊接收器/產生器640的暫態控制模組655(或音訊處理系統的一或更多其他元件)可配置以提供暫態相關功能。現在將參考第11A圖以及下列等等來說明暫態偵測及相應地控制去相關程序的一些實例。
第11A圖係概述暫態判定和暫態相關控制之一些方法的流程圖。在方塊1105中,例如藉由解碼裝置或另一這類音訊處理系統來接收對應於複數個音訊頻道的 音訊資料。如下所述,在一些實作中,可藉由編碼裝置來進行類似程序。
第11B圖係包括用於暫態判定和暫態相關控制的各種元件之實例的方塊圖。在一些實作中,方塊1105可包含藉由包括暫態控制模組655的音訊處理系統來接收音訊資料220和音訊資料245。音訊資料220和245可包括音訊訊號的頻域表示。音訊資料220可包括在耦合頻道頻率範圍中的音訊資料元件,而音訊資料元件245可包括耦合頻道頻率範圍之外的音訊資料。音訊資料元件220及/或245可被路由至包括暫態控制模組655的去相關器。
除了音訊資料元件245和220之外,在方塊1105中,暫態控制模組655還可接收其他相關音訊資訊,如去相關資訊240a和240b。在本實例中,去相關資訊240a可包括清楚去相關特定控制資訊。例如,去相關資訊240a可包括如下所述之清楚暫態資訊。去相關資訊240b可包括來自傳統音訊編解碼器之位元流的資訊。例如,去相關資訊240b可包括時間分段資訊,其在根據AC-3音訊編解碼器或E-AC-3音訊編解碼器所編碼的位元流中可得到。例如,去相關資訊240b可包括使用耦合資訊、區塊切換資訊、指數資訊、指數策略資訊等。上述資訊可連同音訊資料220一起在位元流中被音訊處理系統接收。
方塊1110包含決定音訊資料的音訊特性。在 各種實作中,方塊1110包含例如藉由暫態控制模組655來決定暫態資訊。方塊1115包含至少部分基於音訊特性來決定用於音訊資料的去相關量。例如,方塊1115可包含至少部分基於暫態資訊來決定去相關控制資訊。
在方塊1115中,第11B圖之暫態控制模組655可將去相關訊號產生器控制資訊625提供至去相關訊號產生器,如本文別處所述之去相關訊號產生器218。在方塊1115中,暫態控制模組655也可將混合器控制資訊645提供至混合器,如混合器215。在方塊1120中,可根據在方塊1115中進行的判定來處理音訊資料。例如,可至少部分根據暫態控制模組655所提供的去相關控制資訊來進行去相關訊號產生器218和混合器215的操作。
在一些實作中,第11A圖之方塊1110可包含隨音訊資料一起接收清楚暫態資訊及至少部分根據清楚暫態資訊來決定暫態資訊。
在一些實作中,清楚暫態資訊可指出對應於確定暫態事件的暫態值。上述暫態值可以是較高(或最大)暫態值。高暫態值可對應於暫態事件的高可能性及/或高嚴重性。例如,若可能的暫態值範圍係從0至1,則暫態值在0.9與1之間的範圍可對應於確定及/或嚴重暫態事件。然而,可使用任何適當的暫態值範圍,例如,0至9、1至100等。
清楚暫態資訊可指出對應於確定非暫態事件的暫態值。例如,若可能的暫態值範圍係從1至100,則 在1至5範圍中的值可對應於確定非暫態事件或極輕微的暫態事件。
在一些實作中,清楚暫態資訊可具有二進制表示,例如,0或1。例如,為1的值可能符合確定暫態事件。然而,為0的值可能不指出非暫態事件。反而,在一些上述實作中,為0的值可僅指出缺乏確定及/或嚴重暫態事件。
然而,在一些實作中,清楚暫態資訊可包括最小暫態值(例如,0)與最大暫態值(例如,1)之間的中間暫態值。中間暫態值可對應於暫態事件的中間可能性及/或中間嚴重性。
第11B圖之去相關濾波器輸入控制模組1125可根據經由去相關資訊240a收到的清楚暫態資訊來在方塊1110中決定暫態資訊。另外或此外,去相關濾波器輸入控制模組1125可根據來自傳統音訊編解碼器之位元流的資訊來在方塊1110中決定暫態資訊。例如,基於去相關資訊240b,去相關濾波器輸入控制模組1125可判定對目前區塊未使用頻道耦合、頻道在目前區塊中係離開耦合的及/或頻道在目前區塊中係區塊切換的。
基於去相關資訊240a及/或240b,在方塊1110中,去相關濾波器輸入控制模組1125有時可決定對應於確定暫態事件的暫態值。在一些實作中,若是如此,則去相關濾波器輸入控制模組1125在方塊1115中可判定應暫時地停止去相關程序(及/或去相關濾波器顫動程序)。 由此,在方塊1120中,去相關濾波器輸入控制模組1125可產生指出應暫時地停止去相關程序(及/或去相關濾波器顫動程序)的去相關訊號產生器控制資訊625e。另外或此外,在方塊1120中,軟暫態計算器1130可產生去相關訊號產生器控制資訊625f,指出應暫時地停止或減慢去相關濾波器顫動程序。
在其他實作中,方塊1110可包含不隨音訊資料一起接收任何清楚暫態資訊。然而,無論是否收到清楚暫態資訊,方法1100的一些實作都可包含根據音訊資料220的分析來偵測暫態事件。例如,在一些實作中,即便清楚暫態資訊不指出暫態事件,在方塊1110中,仍可偵測暫態事件。根據音訊資料220的分析被解碼器、或類似音訊處理系統判定或偵測的暫態事件在本文中可稱為「軟暫態事件」。
在一些實作中,無論暫態值是否被提供為清楚暫態值或判定為軟暫態值,暫態值都可受到指數衰變函數。例如,指數衰變函數可使暫態值經過一段時間週期平滑地從初始值衰變至零。使暫態值受到指數衰變函數可防止關聯於突然切換的事件。
在一些實作中,偵測軟暫態事件可包含評估暫態事件的可能性及/或嚴重性。上述評估可包含計算音訊資料220的時間功率變化。
第11C圖係概述至少部分基於音訊資料的時間功率變化來決定暫態控制值之一些方法的流程圖。在一 些實作中,可至少部分藉由暫態控制模組655的軟暫態計算器1130來進行方法1150。然而,在一些實作中,可藉由編碼裝置來進行方法1150。在一些上述實作中,清楚暫態資訊可根據方法1150被編碼裝置決定且連同其他音訊資料一起包括在位元流中。
方法1150開始於方塊1152,其中接收在耦合頻道頻率範圍中的升混音訊資料。在第11B圖中,例如,在方塊1152中,升混音訊資料元件220可被軟暫態計算器1130接收。在方塊1154中,收到之耦合頻道頻率範圍被分成一或更多頻帶,其在本文中也可稱為「功率頻帶」。
方塊1156包含計算用於升混音訊資料之每個頻道和區塊的頻帶加權對數功率(「WLP」)。為了計算WLP,可決定每個功率頻帶的功率。這些功率可轉換成對數值且接著跨功率頻帶地平均。在一些實作中,可根據下面的表達式來進行方塊1156:WLP[ch][blk]=mean pwr_bnd {log(P[ch][blk][pwr_bnd])} (等式15)
在等式15中,WLP[ch][blk]代表用於頻道和區塊的加權對數功率,[pwr_bnd]代表已劃分收到之耦合頻道頻率範圍的頻帶或「功率頻帶」且mean pwr_bnd {log(P[ch][blk][pwr_bnd])}代表跨頻道和區塊之功率頻帶的功率之對數的平均數。
為了下面的原因,分頻帶可預先強調較高頻率的功率變化。若整個耦合頻道頻率範圍是一個頻帶,則 P[ch][blk][pwr_bnd]將是位於在耦合頻道頻率範圍中之每個頻率的功率之算術平均數,且通常具有較高功率的較低頻率將傾向於壓抑P[ch][blk][pwr_bnd]之值而因此為log(P[ch][blk][pwr_bnd])的值。(在這種情況下,log(P[ch][blk][pwr_bnd])將具有與平均log(P[ch][blk][pwr_bnd])相同的值,因為將只有一個頻帶。)藉此,暫態偵測將大程度地基於較低頻率的時間變化。將耦合頻道頻率範圍分成例如較低頻率頻帶和較高頻率頻帶且接著平均在對數域中之兩個頻帶的功率有點等同於計算較低頻率之功率和較高頻率之功率的幾何平均數。上述幾何平均數將比算術平均數更接近較高頻率的功率。因此,分頻帶、決定對數(功率)且接著決定平均數將傾向於導致對在較高頻率下之時間變化更敏感的數量。
在本實作中,方塊1158包含基於WLP來決定不對稱功率差動(「APD」)。例如,APD可被決定如下:
在等式16中,dWLP[ch][blk]代表用於頻道和區塊的差動加權對數功率且WLP[ch][blk][blk-2]代表前兩個區塊之用於頻道的加權對數功率。等式16的實例對於處理經由如E-AC-3和AC-3之音訊編解碼器所編碼的音 訊資料係有用的,其中在連續區塊之間有50%的重疊。於是,將目前區塊的WLP與前兩個區塊的WLP相比。若在連續區塊之間沒有重疊,則可將目前區塊的WLP與先前區塊的WLP相比。
本實例利用先前區塊之可能的時間遮罩效應。因此,若目前區塊的WLP大於或等於先前區塊的WLP(在本實例中,是前兩個區塊的WLP),APD被設成實際WLP差。然而,若目前區塊的WLP小於先前區塊的WLP,則APD被設成實際WLP差的一半。由此,APD強調提高功率且不再強調降低功率。在其他實作中,可使用實際WLP差的不同分數,例如,實際WLP差的1/4。
方塊1160可包含基於APD來決定原始暫態測量(「RTM」)。在本實作中,決定原始暫態測量包含基於時間不對稱功率差動係根據高斯分佈來分佈的假設來計算暫態事件的概似函數:
在等式17中,RTM[ch][blk]代表用於頻道和區塊的原始暫態測量,且SAPD代表調諧參數。在本實例中,當SAPD增加時,將需要較大的功率差動來產生相同的RTM值。
在方塊1162中,可從RTM決定暫態控制值(其在本文中也可稱為「暫態測量」)。在本實例中,根據 等式18來決定暫態控制值:
在等式18中,TM[ch][blk]代表用於頻道和區塊的暫態測量,TH代表上臨界值且TL代表下臨界值。第11D圖提出施用等式18且可如何使用臨界值TH和TL的實例。其他實作可包含其他類型之從RTM至TM的線性或非線性映射。根據一些上述實作,TM係RTM的非減少函數。
第11D圖係繪示將原始暫態值映射至暫態控制值之實例的圖。在此,原始暫態值和暫態控制值兩者範圍係從0.0至1.0,但其他實作可包含其他範圍的值。如等式18和第11D圖所示,若原始暫態值大於或等於上臨界值TH,則暫態控制值被設成其最大值(其在本實例中是1.0)。在一些實作中,最大暫態控制值可與確定暫態事件對應。
若原始暫態值小於或等於下臨界值TL,則暫態控制值被設成其最小值,在本實例中是0.0。在一些實作中,最小暫態控制值可與確定非暫態事件對應。
然而,若原始暫態值係在下臨界值TL與上臨界值TH之間的範圍1166內,則暫態控制值可被縮放至中間暫態控制值,在本實例中是在0.0與1.0之間。中間暫 態控制值可與暫態事件的相對可能性及/或相對嚴重性對應。
再次參考第11C圖,在方塊1164中,可對在方塊1162中決定的暫態控制值施用指數衰變函數。例如,指數衰變函數可使暫態控制值平滑地從初始值衰變至零一段時間週期。使暫態控制值受到指數衰變函數可防止關聯於突然切換的事件。在一些實作中,每個目前區塊的暫態控制值可被計算且與先前區塊之暫態控制值的指數衰變型式相比。用於目前區塊的最後暫態控制值可設成兩個暫態控制值的最大值。
暫態資訊(無論是否連同其他音訊資料一起被接收或被解碼器決定)可用以控制去相關程序。暫態資訊可包括如上述之那些的暫態控制值。在一些實作中,可至少部分基於上述暫態資訊來修改(例如,減少)用於音訊資料的去相關量。
如上所述,上述去相關程序可包含對一部分的音訊資料施用去相關濾波器以產生經濾波的音訊資料,及根據混合比來混合經濾波的音訊資料與一部分收到之音訊資料。一些實作可包含根據暫態資訊來控制混合器215。例如,上述實作可包含至少部分基於暫態資訊來修改混合比。上述暫態資訊可例如被混合器暫態控制模組1145包括在混合器控制資訊645中。(參見第11B圖。)
根據一些上述實作,暫態控制值可被混合器215用來修改alpha以在暫態事件期間中止或減少去相 關。例如,可根據下面的虛擬碼來修改alpha:
在上述虛擬碼中,alpha[ch][bnd]代表用於一個頻道之頻帶的alpha值。decorrelationDecayArray[ch]之項目代表取自範圍0至1之值的指數衰變變數。在一些實例中,可在暫態事件期間往+/-1修改alpha。修改的程度可與decorrelationDecayArray[ch]成比例,其將減少混合用於去相關訊號往0的權重且由此中止或減少去相關。decorrelationDecayArray[ch]的指數衰變慢慢地恢復正常去相關程序。
在一些實作中,軟暫態計算器1130可將軟暫態資訊提供至空間參數模組665。至少部分基於軟暫態資訊,空間參數模組665可選擇平滑器來平滑化在位元流中接收之空間參數或平滑化包含在空間參數估計中之能量及其他量。
一些實作可包含根據暫態資訊來控制去相關訊號產生器218。例如,上述實作可包含至少部分基於暫態資訊來修改或暫時地停止去相關濾波器顫動程序。這可能是有利的,因為在暫態事件期間顫動全通濾波器的極點可能導致不希望的振鈴事件。在一些上述實作中,可至少 部分基於暫態資訊來修改用於顫動去相關濾波器之極點的最大步幅值。
例如,軟暫態計算器1130可將去相關訊號產生器控制資訊625f提供至去相關訊號產生器218的去相關濾波器控制模組405(也參見第4圖)。去相關濾波器控制模組405可回應於去相關訊號產生器控制資訊625f而產生時變濾波值1127。根據一些實作,去相關訊號產生器控制資訊625f可包括用於根據指數衰變變數之最大值來控制最大步幅值的資訊,如:
例如,當在任何頻道中偵測到暫態事件時,可將最大步幅值乘以上述表達式。藉此,可停止或減慢顫動程序。
在一些實作中,可至少部分基於暫態資訊來對經濾波的音訊資料施用增益。例如,經濾波的音訊資料之功率可與直接音訊資料之功率相配。在一些實作中,可藉由第11B圖之閃避器模組1135來提供上述功能。
閃避器模組1135可從軟暫態計算器1130接收暫態資訊,如暫態控制值。閃避器模組1135可根據暫態控制值來決定去相關訊號產生器控制資訊625h。閃避器模組1135可將去相關訊號產生器控制資訊625h提供至去相關訊號產生器218。例如,去相關訊號產生器控制資訊625h包括去相關訊號產生器218能對去相關訊號227 施用的增益以將經濾波的音訊資料之功率維持在低於或等於直接音訊資料之功率的層級。閃避器模組1135可藉由為每個收到之耦合頻道計算在耦合頻道頻率範圍中之每個頻帶的能量來決定去相關訊號產生器控制資訊625h。
閃避器模組1135可例如包括一組閃避器。在一些上述實作中,閃避器可包括緩衝器來暫時地儲存在閃避器模組1135所決定之耦合頻道頻率範圍中的每個頻帶之能量。可對經濾波的音訊資料施用固定延遲且可對緩衝器施用相同的延遲。
閃避器模組1135也可決定混合器相關資訊且可將混合器相關資訊提供至混合器暫態控制模組1145。在一些實作中,閃避器模組1135可提供用於控制混合器215基於將對經濾波的音訊資料施用之增益來修改混合比的資訊。根據一些上述實作,閃避器模組1135可提供用於控制混合器215在暫態事件期間中止或減少去相關的資訊。例如,閃避器模組1135可提供下面的混合器相關資訊:
在上述虛擬碼中,TransCtrlFlag代表暫態控制值且DecorrGain[ch][bnd]代表用以對經濾波的音訊資料 之一組頻道施用的增益。
在一些實作中,用於閃避器的功率估計平滑化視窗可至少部分基於暫態資訊。例如,當暫態事件較為可能時或當偵測到較強的暫態事件時,可施用較短的平滑化視窗。當暫態事件較不可能時、當偵測到較弱的暫態事件時或當未偵測到任何暫態事件時,可施用較長的平滑化視窗。例如,可基於暫態控制值來動態地調整平滑化視窗長度,使得視窗長度當旗標值接近最大值(例如,1.0)時較短且當旗標值接近最小值(例如,0.0)時較長。上述實作可有助於避免在暫態事件期間的時間模糊,同時在非暫態情況期間導致平滑增益因數。
如上所述,在一些實作中,可藉由編碼裝置來決定暫態資訊。第11E圖係概述編碼暫態資訊之方法的流程圖。在方塊1172中,接收對應於複數個音訊頻道的音訊資料。在本實例中,音訊資料被編碼裝置接收。在一些實作中,音訊資料可從時域轉換成頻域(可選方塊1174)。
在方塊1176中,決定包括暫態資訊的音訊特性。例如,可如以上關於第11A-11D圖所述地決定暫態資訊。例如,方塊1176可包含評估音訊資料的時間功率變化。方塊1176可包含根據音訊資料的時間功率變化來決定暫態控制值。上述暫態控制值可指出確定暫態事件、確定非暫態事件、暫態事件的可能性及/或暫態事件的嚴重性。方塊1176可包含對暫態控制值施用指數衰變函 數。
在一些實作中,在方塊1176中決定的音訊特性可包括空間參數,其可實質上如本文別處所述來決定。然而,空間參數可藉由計算在耦合頻道頻率範圍內的相關性而不是計算在耦合頻道頻率範圍之外的相關性來決定。例如,用於將以耦合來編碼之個別頻道的alpha可藉由在頻帶基礎上計算此頻道與耦合頻道的轉換係數之間的相關性來決定。在一些實作中,編碼器可藉由使用音訊資料的複雜頻率表示來決定空間參數。
方塊1178包含將音訊資料的二或更多頻道之至少一部分耦合至耦合頻道中。例如,在方塊1178中,可結合用於在耦合頻道頻率範圍內的耦合頻道之音訊資料的頻域表示。在一些實作中,在方塊1178中,可形成超過一個耦合頻道。
在方塊1180中,形成了編碼的音訊資料訊框。在本實例中,編碼的音訊資料訊框包括對應於耦合頻道的資料及在方塊1176中決定之編碼的暫態資訊。例如,編碼的暫態資訊可包括一或更多控制旗標。控制旗標可包括頻道區塊切換旗標、頻道離開耦合旗標及/或使用耦合旗標。方塊1180可包含決定一或更多控制旗標的組合以形成編碼的暫態資訊,其指出確定暫態事件、確定非暫態事件、暫態事件的可能性或暫態事件的嚴重性。
無論是否藉由結合控制旗標來形成,編碼的暫態資訊都可包括用於控制去相關程序的資訊。例如,暫 態資訊可指出應暫時地停止去相關程序。暫態資訊可指出應暫時地減少去相關程序中的去相關量。暫態資訊可指出應修改去相關程序的混合比。
編碼的音訊資料訊框也可包括各種其他類型的音訊資料,包括用於在耦合頻道頻率範圍之外之個別頻道的音訊資料、用於非耦合之頻道的音訊資料、等等。在一些實作中,編碼的音訊資料訊框也可包括空間參數、耦合座標、及/或如本文別處所述之其他類型的附帶資訊。
第12圖係提出可用於實作本文所述之程序態樣之設備的元件之實例的方塊圖。裝置1200可以是行動電話、智慧型手機、桌上型電腦、手持或可攜式電腦、小筆電、筆記型電腦、智慧小筆電、平板電腦、立體聲系統、電視、DVD播放器、數位記錄裝置、或各種各樣其他裝置之任一者。裝置1200可包括編碼工具及/或解碼工具。然而,第12圖所示之元件僅為實例。特定裝置可配置以實作本文所述之各種實施例,但可或可不包括所有元件。例如,一些實作可不包括揚聲器或麥克風。
在本實例中,裝置包括介面系統1205。介面系統1205可包括網路介面,如無線網路介面。另外或此外,介面系統1205可包括通用序列匯流排(USB)介面或另一這類介面。
裝置1200包括邏輯系統1210。邏輯系統1210可包括處理器,如通用單或多晶片處理器。邏輯系統1210可包括數位訊號處理器(DSP)、專用積體電路 (ASIC)、現場可程式閘陣列(FPGA)或其他可程式邏輯裝置、離散閘或電晶體邏輯、或離散硬體元件、或以上之組合。邏輯系統1210可配置以控制裝置1200的其他元件。雖然在第12圖中顯示裝置1200的元件之間沒有介面,但可配置邏輯系統1210來與其他元件通訊。視情況而定可或可不配置其他元件來彼此通訊。
邏輯系統1210可配置以進行各種類型的音訊處理功能,如編碼器及/或解碼器功能。上述編碼器及/或解碼器功能可包括,但不限於本文所述之編碼器及/或解碼器功能的類型。例如,邏輯系統1210可配置以提供本文所述之去相關器相關功能。在一些上述實作中,邏輯系統1210可配置以(至少部分)根據儲存於一或更多非暫態媒體上的軟體來操作。非暫態媒體可包括關聯於邏輯系統1210的記憶體,如隨機存取記憶體(RAM)及/或唯讀記憶體(ROM)。非暫態媒體可包括記憶體系統1215的記憶體。記憶體系統1215可包括一或更多適當類型的非暫態儲存媒體,如快閃記憶體、硬碟機等。
例如,邏輯系統1210可配置以經由介面系統1205來接收編碼的音訊資料之訊框及根據本文所述之方法來解碼編碼的音訊資料。另外或此外,邏輯系統1210可配置以經由記憶體系統1215與邏輯系統1210之間的介面來接收編碼的音訊資料之訊框。邏輯系統1210可配置以根據解碼的音訊資料來控制揚聲器1220。在一些實作中,邏輯系統1210可配置以根據傳統編碼方法及/或根據 本文所述之編碼方法來編碼音訊資料。邏輯系統1210可配置以經由麥克風1225、經由介面系統1205等來接收上述音訊資料。
顯示系統1230可包括一或更多適當類型的顯示器,這取決於裝置1200的表現形式。例如,顯示系統1230可包括液晶顯示器、電漿顯示器、雙穩態顯示器、等等。
使用者輸入系統1235可包括配置以接受來自使用者之輸入的一或更多裝置。在一些實作中,使用者輸入系統1235可包括重疊顯示系統1230之顯示器的觸控螢幕。使用者輸入系統1235可包括按鈕、鍵盤、開關等。在一些實作中,使用者輸入系統1235可包括麥克風1225:使用者可經由麥克風1225來提供用於裝置1200的語音命令。邏輯系統可配置用於語音辨識及用於根據上述語音命令來控制裝置1200的至少一些操作。
電源系統1240可包括一或更多適當的能量儲存裝置,如鎳-鎘電池或鋰離子電池。電源系統1240可配置以從電源插座接收電源。
對本揭露所述之實作的各種修改對於具有本領域之通常技藝者而言可以是顯而易見的。在不脫離本揭露之精神或範圍下可對其他實作應用本文所定義的一般原理。例如,儘管已針對Dolby Digital和Dolby Digital Plus來說明各種實作,但可連同其他音訊編解碼器來實作本文所述之方法。因此,申請專利範圍並不打算限於本文 所示之實作,而是符合與本揭露一致的最廣範圍、本文所揭露之原理和新穎特徵。
200‧‧‧音訊處理系統
205‧‧‧去相關器
255‧‧‧反轉換模組
220a-220n‧‧‧音訊資料元件
230a-230n‧‧‧去相關音訊資料元件
260‧‧‧時域音訊資料
240‧‧‧去相關資訊

Claims (45)

  1. 一種方法,包含:接收對應於複數個音訊頻道的音訊資料,該音訊資料包含一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數;及對該音訊資料之至少一些者施用一去相關程序,該去相關程序係以該音訊編碼或處理系統所使用的相同濾波器組係數來進行。
  2. 如申請專利範圍第1項所述之方法,其中該去相關程序無須將該頻域表示的係數轉換成另一頻域或時域表示來進行。
  3. 如申請專利範圍第1項或第2項所述之方法,其中該頻域表示係施用一完美重建、臨界取樣的濾波器組之結果。
  4. 如申請專利範圍第3項所述之方法,其中該去相關程序包含藉由對該頻域表示之至少一部分施用線性濾波器來產生混響訊號或去相關訊號。
  5. 如申請專利範圍第1項至第4項之任一項所述之方法,其中該頻域表示係對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。
  6. 如申請專利範圍第1項至第5項之任一項所述之方法,其中該去相關程序包含施用完全對實數值係數操作的一去相關演算法。
  7. 如申請專利範圍第1項至第6項之任一項所述之方法,其中該去相關程序包含特定頻道的選擇性或訊號適應性去相關。
  8. 如申請專利範圍第1項至第7項之任一項所述之方法,其中該去相關程序包含特定頻帶的選擇性或訊號適應性去相關。
  9. 如申請專利範圍第1項至第8項之任一項所述之方法,其中該去相關程序包含對收到之該音訊資料的一部分施用一去相關濾波器以產生經濾波的音訊資料。
  10. 如申請專利範圍第9項所述之方法,其中該去相關程序包含使用一非階層混合器以根據空間參數來結合收到之該音訊資料的一直接部分與該經濾波的音訊資料。
  11. 如申請專利範圍第1項至第10項之任一項所述之方法,更包含一起接收該音訊資料和去相關資訊,其中該去相關程序包含根據收到之該去相關資訊來去相關該音訊資料之至少一些者。
  12. 如申請專利範圍第11項所述之方法,其中收到之該去相關資訊包括個別離散頻道與一耦合頻道之間的相關係數、個別離散頻道之間的相關係數、清楚(explicit)音調資訊或暫態資訊之至少一者。
  13. 如申請專利範圍第1項至第12項之任一項所述之方法,更包含基於收到之音訊資料來決定去相關資訊,其中該去相關程序包含根據決定之去相關資訊來去相關該音訊資料之至少一些者。
  14. 如申請專利範圍第13項所述之方法,更包含接收與該音訊資料一起編碼的去相關資訊,其中該去相關程序包含根據收到之該去相關資訊或決定之該去相關資訊之至少一者來去相關該音訊資料之至少一些者。
  15. 如申請專利範圍第1項至第14項之任一項所述之方法,其中該音訊編碼或處理系統係一傳統音訊編碼或處理系統。
  16. 如申請專利範圍第15項所述之方法,更包含接收在該傳統音訊編碼或處理系統所產生之一位元流中的控制機制元件,其中該去相關程序係至少部分基於該些控制機制元件。
  17. 一種設備,包含:一介面;及一邏輯系統,配置用於:經由該介面來接收對應於複數個音訊頻道的音訊資料,該音訊資料包含一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數;及對該音訊資料之至少一些者施用一去相關程序,該去相關程序係以該音訊編碼或處理系統所使用的相同濾波器組係數來進行。
  18. 如申請專利範圍第17項所述之設備,其中該去相關程序無須將該頻域表示的係數轉換成另一頻域或時域表示來進行。
  19. 如申請專利範圍第17項或第18項所述之設備, 其中該頻域表示係施用一臨界取樣的濾波器組之結果。
  20. 如申請專利範圍第19項所述之設備,其中該去相關程序包含藉由對該頻域表示之至少一部分施用線性濾波器來產生混響訊號或去相關訊號。
  21. 如申請專利範圍第17項至第20項之任一項所述之設備,其中該頻域表示係對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。
  22. 如申請專利範圍第17項至第21項之任一項所述之設備,其中該去相關程序包含施用完全對實數值係數操作的一去相關演算法。
  23. 如申請專利範圍第17項至第22項之任一項所述之設備,其中該去相關程序包含特定頻道的選擇性或訊號適應性去相關。
  24. 如申請專利範圍第17項至第23項之任一項所述之設備,其中該去相關程序包含特定頻帶的選擇性或訊號適應性去相關。
  25. 如申請專利範圍第17項至第24項之任一項所述之設備,其中該去相關程序包含對收到之該音訊資料的一部分施用一去相關濾波器以產生經濾波的音訊資料。
  26. 如申請專利範圍第25項所述之設備,其中該去相關程序包含使用一非階層混合器以根據空間參數來結合收到之該音訊資料的該部分與該經濾波的音訊資料。
  27. 如申請專利範圍第17項至第26項之任一項所述 之設備,其中該邏輯系統包括一通用單或多晶片處理器、一數位訊號處理器(DSP)、一專用積體電路(ASIC)、一現場可程式閘陣列(FPGA)或其他可程式邏輯裝置、離散閘或電晶體邏輯、或離散硬體元件之至少一者。
  28. 如申請專利範圍第17項至第27項之任一項所述之設備,更包含一記憶體裝置,其中該介面包含該邏輯系統與該記憶體裝置之間的介面。
  29. 如申請專利範圍第17項至第28項之任一項所述之設備,其中該介面包含一網路介面。
  30. 如申請專利範圍第17項至第29項之任一項所述之設備,其中該音訊編碼或處理系統係一傳統音訊編碼或處理系統。
  31. 如申請專利範圍第30項所述之設備,其中該邏輯系統更配置用於經由該介面來接收在該傳統音訊編碼或處理系統所產生之一位元流中的控制機制元件,且其中該去相關程序係至少部分基於該些控制機制元件。
  32. 一種具有軟體儲存於其上的非暫態媒體,該軟體包括指令,用於控制一設備:接收對應於複數個音訊頻道的音訊資料,該音訊資料包含一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數;及對該音訊資料之至少一些者施用一去相關程序,該去相關程序係以該音訊編碼或處理系統所使用的相同濾波器組係數來進行。
  33. 如申請專利範圍第32項所述之非暫態媒體,其中該去相關程序無須將該頻域表示的係數轉換成另一頻域或時域表示來進行。
  34. 如申請專利範圍第32項或第33項所述之非暫態媒體,其中該頻域表示係施用一臨界取樣的濾波器組之結果。
  35. 如申請專利範圍第34項所述之非暫態媒體,其中該去相關程序包含藉由對該頻域表示之至少一部分施用線性濾波器來產生混響訊號或去相關訊號。
  36. 如申請專利範圍第32項至第35項之任一項所述之非暫態媒體,其中該頻域表示係對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。
  37. 如申請專利範圍第32項至第36項之任一項所述之非暫態媒體,其中該去相關程序包含施用完全對實數值係數操作的一去相關演算法。
  38. 一種設備,包含:接收機構,用於接收對應於複數個音訊頻道的音訊資料,該音訊資料包含一頻域表示,對應於一音訊編碼或處理系統的濾波器組係數;及施用去相關程序之機構,用於對該音訊資料之至少一些者施用一去相關程序,該去相關程序係以該音訊編碼或處理系統所使用的相同濾波器組係數來進行。
  39. 如申請專利範圍第38項所述之設備,其中該去相 關程序無須將該頻域表示的係數轉換成另一頻域或時域表示來進行。
  40. 如申請專利範圍第38項或第39項所述之設備,其中該頻域表示係施用一臨界取樣的濾波器組之結果。
  41. 如申請專利範圍第40項所述之設備,其中該去相關程序包含藉由對該頻域表示之至少一部分施用線性濾波器來產生混響訊號或去相關訊號。
  42. 如申請專利範圍第38項至第41項之任一項所述之設備,其中該頻域表示係對一時域中的音訊資料施用一修改的離散正弦轉換、一修改的離散餘弦轉換或一重疊正交轉換之結果。
  43. 如申請專利範圍第38項至第42項之任一項所述之設備,其中該去相關程序包含施用完全對實數值係數操作的一去相關演算法。
  44. 如申請專利範圍第38項至第43項之任一項所述之設備,其中該去相關程序包含特定頻道的選擇性或訊號適應性去相關。
  45. 如申請專利範圍第38項至第44項之任一項所述之設備,其中該去相關程序包含特定頻帶的選擇性或訊號適應性去相關。
TW103101428A 2013-02-14 2014-01-15 用於音訊處理系統中之訊號去相關的方法及設備 TWI618050B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361764837P 2013-02-14 2013-02-14
US61/764,837 2013-02-14

Publications (2)

Publication Number Publication Date
TW201443877A true TW201443877A (zh) 2014-11-16
TWI618050B TWI618050B (zh) 2018-03-11

Family

ID=50064800

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103101428A TWI618050B (zh) 2013-02-14 2014-01-15 用於音訊處理系統中之訊號去相關的方法及設備

Country Status (12)

Country Link
US (1) US9830916B2 (zh)
EP (1) EP2956933B1 (zh)
JP (1) JP6038355B2 (zh)
KR (1) KR102114648B1 (zh)
CN (1) CN104995676B (zh)
BR (1) BR112015018981B1 (zh)
ES (1) ES2613478T3 (zh)
HK (1) HK1213686A1 (zh)
IN (1) IN2015MN01954A (zh)
RU (1) RU2614381C2 (zh)
TW (1) TWI618050B (zh)
WO (1) WO2014126682A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI640843B (zh) * 2014-04-02 2018-11-11 美商克萊譚克公司 用於產生遮罩之高密度對位映圖的方法、系統及電腦程式產品
TWI659413B (zh) * 2015-12-08 2019-05-11 瑞典商安訊士有限公司 用於在音訊區域中控制聲音影像之方法、裝置與系統

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN105702263B (zh) * 2016-01-06 2019-08-30 清华大学 语音重放检测方法和装置
CN105931648B (zh) * 2016-06-24 2019-05-03 百度在线网络技术(北京)有限公司 音频信号解混响方法和装置
CN107895580B (zh) * 2016-09-30 2021-06-01 华为技术有限公司 一种音频信号的重建方法和装置
JP6843992B2 (ja) * 2016-11-23 2021-03-17 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 相関分離フィルタの適応制御のための方法および装置
US10019981B1 (en) 2017-06-02 2018-07-10 Apple Inc. Active reverberation augmentation
EP3573058B1 (en) * 2018-05-23 2021-02-24 Harman Becker Automotive Systems GmbH Dry sound and ambient sound separation
CN111107024B (zh) * 2018-10-25 2022-01-28 航天科工惯性技术有限公司 时间与频率混合编码的防错解码方法
CN109557509B (zh) * 2018-11-23 2020-08-11 安徽四创电子股份有限公司 一种用于改善脉间干扰的双脉冲信号合成器
CN109672946B (zh) * 2019-02-15 2023-12-15 深圳市昊一源科技有限公司 一种无线通话系统、转发设备、终端设备及转发方法
CN110267064B (zh) * 2019-06-12 2021-11-12 百度在线网络技术(北京)有限公司 音频播放状态处理方法、装置、设备及存储介质
CN110740404B (zh) * 2019-09-27 2020-12-25 广州励丰文化科技股份有限公司 一种音频相关性的处理方法及音频处理装置
CN110740416B (zh) * 2019-09-27 2021-04-06 广州励丰文化科技股份有限公司 一种音频信号处理方法及装置
CN114365509B (zh) * 2021-12-03 2024-03-01 北京小米移动软件有限公司 一种立体声音频信号处理方法及设备/存储介质/装置

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8308843D0 (en) 1983-03-30 1983-05-11 Clark A P Apparatus for adjusting receivers of data transmission channels
US5077798A (en) 1988-09-28 1991-12-31 Hitachi, Ltd. Method and system for voice coding based on vector quantization
KR20010006291A (ko) 1998-02-13 2001-01-26 요트.게.아. 롤페즈 서라운드 음향 재생 시스템, 음향/시각 재생 시스템, 서라운드 신호 처리 유닛 및 입력 서라운드 신호 처리 방법
US6175631B1 (en) 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
US7218665B2 (en) 2003-04-25 2007-05-15 Bae Systems Information And Electronic Systems Integration Inc. Deferred decorrelating decision-feedback detector for supersaturated communications
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
WO2007109338A1 (en) 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
US20090299756A1 (en) 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
RU2392671C2 (ru) * 2004-04-05 2010-06-20 Конинклейке Филипс Электроникс Н.В. Способы и устройства для кодирования и декодирования стереосигнала
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
KR101205480B1 (ko) * 2004-07-14 2012-11-28 돌비 인터네셔널 에이비 오디오 채널 변환
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
EP1803115A2 (en) 2004-10-15 2007-07-04 Koninklijke Philips Electronics N.V. A system and a method of processing audio data to generate reverberation
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
ES2374309T3 (es) 2005-07-14 2012-02-15 Koninklijke Philips Electronics N.V. Decodificación de audio.
DE602006010712D1 (de) 2005-07-15 2010-01-07 Panasonic Corp Audiodekoder
AU2006285538B2 (en) 2005-08-30 2011-03-24 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
RU2383942C2 (ru) 2005-08-30 2010-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
JP2007178684A (ja) * 2005-12-27 2007-07-12 Matsushita Electric Ind Co Ltd マルチチャンネルオーディオ復号装置
JP4806031B2 (ja) 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
CA2646961C (en) 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
DE602006010323D1 (de) 2006-04-13 2009-12-24 Fraunhofer Ges Forschung Audiosignaldekorrelator
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP1883067A1 (en) 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP2070392A2 (en) 2006-09-14 2009-06-17 Koninklijke Philips Electronics N.V. Sweet spot manipulation for a multi-channel signal
RU2394283C1 (ru) 2007-02-14 2010-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
DE102007018032B4 (de) 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
PL2137725T3 (pl) 2007-04-26 2014-06-30 Dolby Int Ab Urządzenie i sposób do syntetyzowania sygnału wyjściowego
ES2358786T3 (es) * 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US8064624B2 (en) 2007-07-19 2011-11-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for generating a stereo signal with enhanced perceptual quality
US20100040243A1 (en) 2008-08-14 2010-02-18 Johnston James D Sound Field Widening and Phase Decorrelation System and Method
US8374883B2 (en) 2007-10-31 2013-02-12 Panasonic Corporation Encoder and decoder using inter channel prediction based on optimally determined signals
US9373339B2 (en) 2008-05-12 2016-06-21 Broadcom Corporation Speech intelligibility enhancement system and method
EP2144229A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
JP5326465B2 (ja) 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
PL2234103T3 (pl) 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio
US8497467B2 (en) 2009-04-13 2013-07-30 Telcordia Technologies, Inc. Optical filter control
EP2535892B1 (en) 2009-06-24 2014-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
GB2465047B (en) 2009-09-03 2010-09-22 Peter Graham Craven Prediction of signals
EA024310B1 (ru) 2009-12-07 2016-09-30 Долби Лабораторис Лайсэнзин Корпорейшн Способ декодирования цифровых потоков кодированного многоканального аудиосигнала с использованием адаптивного гибридного преобразования
EP2360681A1 (en) 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
TWI444989B (zh) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
JP5299327B2 (ja) 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
ES2935911T3 (es) 2010-04-09 2023-03-13 Dolby Int Ab Descodificación estéreo de predicción compleja basada en MDCT
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
WO2012026741A2 (ko) 2010-08-24 2012-03-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
AU2011295367B2 (en) 2010-08-25 2014-07-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding a signal comprising transients using a combining unit and a mixer
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
KR101748760B1 (ko) 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN102903368B (zh) * 2011-07-29 2017-04-12 杜比实验室特许公司 用于卷积盲源分离的方法和设备
US9299355B2 (en) 2011-08-04 2016-03-29 Dolby International Ab FM stereo radio receiver by using parametric stereo
US8527264B2 (en) 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
EP2704142B1 (en) 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI640843B (zh) * 2014-04-02 2018-11-11 美商克萊譚克公司 用於產生遮罩之高密度對位映圖的方法、系統及電腦程式產品
TWI659413B (zh) * 2015-12-08 2019-05-11 瑞典商安訊士有限公司 用於在音訊區域中控制聲音影像之方法、裝置與系統

Also Published As

Publication number Publication date
EP2956933B1 (en) 2016-11-16
TWI618050B (zh) 2018-03-11
US9830916B2 (en) 2017-11-28
BR112015018981A2 (pt) 2017-07-18
RU2614381C2 (ru) 2017-03-24
KR102114648B1 (ko) 2020-05-26
JP2016510433A (ja) 2016-04-07
WO2014126682A1 (en) 2014-08-21
IN2015MN01954A (zh) 2015-08-28
BR112015018981B1 (pt) 2022-02-01
CN104995676A (zh) 2015-10-21
US20150380000A1 (en) 2015-12-31
RU2015133287A (ru) 2017-02-21
ES2613478T3 (es) 2017-05-24
CN104995676B (zh) 2018-03-30
EP2956933A1 (en) 2015-12-23
KR20150106949A (ko) 2015-09-22
JP6038355B2 (ja) 2016-12-07
HK1213686A1 (zh) 2016-07-08

Similar Documents

Publication Publication Date Title
TWI618050B (zh) 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
JP6046274B2 (ja) 上方混合されたオーディオ信号のチャネル間コヒーレンスの制御方法
US9830917B2 (en) Methods for audio signal transient detection and decorrelation control
US20150371646A1 (en) Time-Varying Filters for Generating Decorrelation Signals