TW201521013A - 解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器 - Google Patents

解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器 Download PDF

Info

Publication number
TW201521013A
TW201521013A TW103136287A TW103136287A TW201521013A TW 201521013 A TW201521013 A TW 201521013A TW 103136287 A TW103136287 A TW 103136287A TW 103136287 A TW103136287 A TW 103136287A TW 201521013 A TW201521013 A TW 201521013A
Authority
TW
Taiwan
Prior art keywords
downmix matrix
matrix
gain
input
channels
Prior art date
Application number
TW103136287A
Other languages
English (en)
Other versions
TWI571866B (zh
Inventor
Florin Ghido
Achim Kuntz
Bernhard Grill
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201521013A publication Critical patent/TW201521013A/zh
Application granted granted Critical
Publication of TWI571866B publication Critical patent/TWI571866B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本文描述一種方法,其解碼一下混矩陣以用於將音訊內容之複數個輸入頻道映射至複數個輸出頻道,該等輸入及輸出頻道與在相對於一收聽者位置之預定位置處之各別揚聲器相關聯,其中藉由利用該複數個輸入頻道之揚聲器對的對稱性及該複數個輸出頻道之揚聲器對的對稱性來編碼該下混矩陣。表示該經編碼下混矩陣之經編碼資訊經接收及解碼以用於獲得該經解碼下混矩陣。

Description

解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器 發明領域
本發明係關於音訊編碼/解碼之領域,尤其係關於空間音訊寫碼及空間音訊目標寫碼,例如,係關於3D音訊編解碼器系統之領域。本發明之實施例係關於用於編碼及解碼下混矩陣以將音訊內容之複數個輸入頻道映射至複數個輸出頻道之方法、係關於用於呈現音訊內容之方法、係關於用於編碼下混矩陣之編碼器、係關於用於解碼下混矩陣之解碼器、係關於音訊編碼器且係關於音訊解碼器。
發明背景
空間音訊寫碼工具在此項技術中係已知的,且(例如)經在MPEG-Surround標準中標準化。空間音訊寫碼自複數個原始輸入頻道(例如,五個或七個輸入頻道)開始,該 等輸入頻道由其在再現設置中之置放識別為(例如)左頻道、中心頻道、右頻道、左環繞頻道、右環繞頻道及低頻增強頻道。空間音訊編碼器可自原始頻道導出一或多個下混頻道,且另外可導出關於空間提示(諸如,頻道相干值中之頻道間等級差、頻道間相位差、頻道間時間差等)之參數資料。一或多個下混頻道與指示空間提示之參數旁側資訊一起傳輸至用於解碼下混頻道及相關聯之參數資料的空間音訊解碼器,以便最終獲得原始輸入頻道之近似型式的輸出頻道。頻道在輸出設置中之置放可為固定的,例如,5.1格式、7.1格式等等。
又,空間音訊目標寫碼工具在此項技術中係熟知的,且(例如)經在MPEG SAOC(SAOC=空間音訊目標寫碼)標準中標準化。與自原始頻道開始之空間音訊寫碼相反,空間音訊目標寫碼自音訊目標開始,該等音訊目標不自動專用於某一呈現再現設置。相反,音訊目標在再現場景中之置放為靈活的且可由使用者(例如)藉由將某些呈現資訊輸入至空間音訊目標寫碼解碼器中而設定。替代地或另外,呈現資訊可作為額外旁側資訊或後設資料傳輸,呈現資訊可包括某一音訊目標在再現設置中待置放至之位置(例如,附著時間過去)的資訊。為獲得某一資料壓縮,使用SAOC編碼器編碼大量音訊目標,該SAOC編碼器藉由根據某一下混資訊下混目標來自輸入目標計算一或多個輸送頻道。此外,SAOC編碼器計算表示目標間提示(諸如,目標等級差(OLD)、目標相干值等)之參數旁側資訊。如在SAC(SAC= 空間音訊寫碼)中,目標間參數資料經針對個別時間/頻率塊計算。對於音訊信號之某一訊框(例如,1024或2048個樣本),考慮複數個頻帶(例如,24、32或64個頻帶),以使得針對每一訊框及每一頻帶提供參數資料。舉例而言,當音訊片段具有20個訊框時且當每一訊框經細分成32個頻帶時,時間/頻率塊之數目為640。
在3D音訊系統中,可能需要使用喇叭(loudspeaker)或揚聲器(speaker)組配在接收器處提供音訊信號之空間印象,此係由於喇叭或揚聲器在接收器處可用,然而,該組配可不同於用於原始音訊信號之原始揚聲器組配。在此情形下,需要進行轉換,根據哪些輸入頻道根據音訊信號之原始揚聲器組配經映射至根據接收器之揚聲器組配界定之輸出頻道,該轉換亦被稱作「下混」。
發明概要
本發明之目標為提供用於對接收器提供下混矩陣之改良方法。
此目標由如請求項1、2及20之方法、如請求項24之編碼器、如請求項26之解碼器、如請求項28之音訊編碼器及如請求項29之音訊解碼器實現。
本發明係基於穩定下混矩陣之更有效率寫碼可藉由利用對稱性達成之發現,該等對稱性可在關於與各別頻道相關聯之揚聲器之置放之輸入頻道組配及輸出頻道組配中發現。本發明之發明者已發現,利用此對稱性允許將 對稱配置之揚聲器(例如,具有關於收聽者位置之具有相同仰角及方位角之相同絕對值但具有不同正負號的位置之彼等揚聲器)組合至下混矩陣之共同列/行。此舉允許產生具有減小之大小的緊密下混矩陣,因此,當與原始下混矩陣相比時,該緊密下混矩陣可更容易且更有效率地編碼。
根據實施例,不僅界定對稱揚聲器群組,且實際上創造三類揚聲器群組,亦即,上述對稱揚聲器、中心揚聲器及不對稱揚聲器,該等揚聲器接著可用於產生緊密表示。該方法為有利的,此係因為其允許不同地處置來自各別類別之揚聲器且因此更有效率。
根據實施例,編碼緊密下混矩陣包含編碼與關於實際緊密下混矩陣之資訊分開的增益值。藉由建立緊密有效矩陣來編碼關於實際緊密下混矩陣之資訊,該緊密有效矩陣關於緊密輸入/輸出頻道組配藉由將輸入及輸出對稱揚聲器對中之每一者併入一個群組中來指示非零增益之存在。該方法為有利的,此係因為其允許基於延行長度方案有效率地編碼有效矩陣。
根據實施例,可提供模板矩陣,該模板矩陣類似於緊密下混矩陣,其中模板矩陣之矩陣元素中的條目實質上對應於緊密下混矩陣中之矩陣元素中的條目。大體而言,該等模板矩陣提供於編碼器及解碼器處,且與緊密下混矩陣不同之處僅在於減少數目個矩陣元素,使得藉由將逐個元素XOR應用至具有此模板矩陣之緊密有效矩陣將大幅減少矩陣元素的數目。該方法為有利的,此係因為其允許再 次使用(例如)延行長度方案更進一步增大編碼有效矩陣之效率。
根據又一實施例,編碼係進一步基於正常揚聲器是否僅混合至正常揚聲器且LFE揚聲器僅混合至LFE揚聲器的指示。此舉為有利的,此係因為其進一步改良有效矩陣之寫碼。
根據又一實施例,關於延行長度寫碼應用至之一維向量,緊密有效矩陣或上述XOR運算之結果經提供以將其轉換至成串之零,其後為一個一,此係有利地,此係由於其提供寫碼資訊之極高效可能性。為達成更有效率編碼,根據實施例,將有限哥倫布-萊斯編碼應用於延行長度值。
根據針對每一輸出揚聲器群組之另外實施例,指示對稱性及可分離性之性質適用於產生該等性質之所有對應的輸入揚聲器群組。此舉為有利的,此係因為其指示在(例如)由左揚聲器及右揚聲器組成之揚聲器群組中,輸入頻道群組中之左揚聲器僅映射至對應的輸出揚聲器群組中的左頻道,輸入頻道群組中之右揚聲器僅經映射至輸出頻道群組中之右揚聲器,且自左頻道至右頻道不存在混合。此舉允許由單一增益值替換原始下混矩陣中之2×2子矩陣中的四個增益值,該單一增益值可引入至緊密矩陣中,或在緊密矩陣為有效矩陣的情況下可單獨寫碼。在任何情況下,待寫碼之增益值之總數減少。因此,對稱性及可分離性之傳訊之性質為有利的,此係因為其允許有效率地寫碼對應於每一輸入及輸出揚聲器群組對之子矩陣。
根據實施例,對於寫碼增益值,使用傳訊之最小及最大增益以及傳訊之所要精度以特定次序創造可能增益之清單。以常用增益在清單或表之開始處的此次序創造增益值。此舉為有利的,此係因為其允許藉由將最短碼字應用於最頻率使用之增益以編碼該等增益來有效率地編碼增益值。
根據一實施例,產生之增益值可提供於清單中,清單中之每一條目具有與其相關聯之索引。當寫碼增益值,而非寫碼實際值時,編碼增益之索引。此可(例如)藉由應用有限哥倫布-萊斯編碼方法進行。此增益值處置為有利的,此係因為其允許有效率地編碼該等增益值。
根據實施例,均衡器(EQ)參數可連同下混矩陣一起傳輸。
100‧‧‧音訊編碼器
102‧‧‧預呈現器/混合器電路
104、204‧‧‧頻道信號
106、120、208‧‧‧目標信號
108‧‧‧目標後設資料/目標後設資料資訊
110‧‧‧信號
112‧‧‧空間音訊目標寫碼(SAOC)編碼器
114‧‧‧SAOC輸送頻道
116‧‧‧統一語音及音訊寫碼(USAC)編碼器
118‧‧‧SAOC旁側資訊
122、206‧‧‧預呈現之目標信號
124‧‧‧目標相關後設資料(OAM)編碼器
126、212‧‧‧經壓縮目標後設資料資訊
128‧‧‧經編碼信號/3D音訊位元 串流
200‧‧‧音訊解碼器
202‧‧‧USAC解碼器
210‧‧‧SAOC輸送頻道信號
214‧‧‧SAOC-SI
216‧‧‧目標呈現器
218、222‧‧‧呈現之目標信號
220‧‧‧SAOC解碼器
224‧‧‧OAM解碼器
226‧‧‧混合器
228‧‧‧頻道信號/傳輸之頻道組配
230、234、238‧‧‧參考符號
232‧‧‧格式轉換電路/喇叭呈現器模組
236‧‧‧立體聲呈現器/立體聲呈現器模組
250‧‧‧下混器
252‧‧‧中間下混信號
254‧‧‧實際立體聲轉換器
300‧‧‧右邊行/輸入頻道組配
302‧‧‧底部列/輸出頻道組配
304、314'、318、318'、320、 320'‧‧‧矩陣元素
306‧‧‧原始下混矩陣
308‧‧‧緊密下混矩陣
310‧‧‧緊密輸入組配/經轉換輸入頻道組配
310'‧‧‧輸入頻道組配
312‧‧‧緊密輸出頻帶組配/經轉換輸出頻帶組配
312'‧‧‧輸出頻道組配
314‧‧‧緊密下混矩陣元素/矩陣條目
316‧‧‧模板矩陣
將參看附隨圖式描述本發明之實施例,其中:圖1說明3D音訊系統之3D音訊編碼器的概述;圖2說明3D音訊系統之3D音訊解碼器的概述;圖3說明可在圖2之3D音訊解碼器中實施的立體聲呈現器之一實施例;圖4說明此項技術中已知之用於自22.2輸入組配映射至5.1輸出組配之一例示性下混矩陣;圖5示意性說明用於將圖4之原始下混矩陣轉換成緊密下混矩陣的本發明之一實施例;圖6說明根據本發明之一實施例的圖5之緊密下混矩陣, 該緊密下混矩陣具有經轉換輸入及輸出頻道組配,其中矩陣條目表示有效值;圖7說明用於使用模板矩陣編碼圖5之緊密下混矩陣之結構的本發明之又一實施例;及圖8(a)至圖8(g)說明根據輸入及輸出揚聲器之不同組合的可自圖4中所展示之下混矩陣導出的可能子矩陣。
較佳實施例之詳細說明
將描述本發明方法之實施例。以下描述將以可實施本發明方法之3D音訊編解碼器系統的系統概述開始。
圖1及圖2展示根據實施例的3D音訊系統之演算法方塊。更具體言之,圖1展示3D音訊編碼器100之概述。音訊編碼器100在可視情況提供之預呈現器/混合器電路102處接收輸入信號,更具體言之,在提供至音訊編碼器100之複數個輸入頻道處接收複數個頻道信號104、複數個目標信號106及對應的目標後設資料108。由預呈現器/混合器102處理之目標信號106(參見信號110)可提供至SAOC編碼器112(SAOC=空間音訊目標寫碼)。SAOC編碼器112產生提供至USAC編碼器116(USAC=統一語音及音訊寫碼)之SAOC輸送頻道114。另外,信號SAOC-SI 118(SAOC-SI=SAOC旁側資訊)亦提供至USAC編碼器116。USAC編碼器116進一步直接自預呈現器/混合器接收目標信號120,以及頻道信號及預呈現之目標信號122。目標後設資料資訊108應用於用於將經壓縮目標後設資料資訊126 提供至USAC編碼器的OAM編碼器124(OAM=目標相關聯後設資料)。USAC編碼器116基於上述輸入信號產生如128處所展示之經壓縮輸出信號mp4。
圖2展示3D音訊系統之3D音訊解碼器200的概述。由圖1之音訊編碼器100產生之經編碼信號128(mp4)在音訊解碼器200處、更具體言之在USAC解碼器202處接收。USAC解碼器202將接收之信號128解碼成頻道信號204、預呈現之目標信號206、目標信號208及SAOC輸送頻道信號210。另外,經壓縮目標後設資料資訊212及信號SAOC-SI 214由USAC解碼器202輸出。目標信號208提供至輸出呈現之目標信號218之目標呈現器216。SAOC輸送頻道信號210供應至輸出呈現之目標信號222之SAOC解碼器220。經壓縮目標後設資料資訊212供應至OAM解碼器224,該OAM解碼器224將各別控制信號輸出至目標呈現器216及SAOC解碼器220以用於產生呈現之目標信號218及呈現之目標信號222。解碼器進一步包含接收(如圖2中所示)輸入信號204、206、218及222之一混合器226,以用於輸出頻道信號228。頻道信號可直接輸出至喇叭,例如,如230處所指示之32頻道喇叭。信號228可提供至格式轉換電路232,該格式轉換電路232接收指示待轉換頻道信號228之方式的再現佈局信號作為控制輸入。在圖2中描繪之實施例中,假設轉換係以信號可提供至如234處所示之5.1揚聲器系統的方式進行。又,頻道信號228可提供至產生(例如)用於如238處所指示之耳機的兩個輸出信號的立體聲呈現器236。
在本發明之一實施例中,圖1及圖2中所描繪之編碼/解碼系統係基於用於寫碼頻道信號及目標信號(參見信號104及106)之MPEG-D USAC編解碼器。為增加寫碼大量目標之效率,可使用MPEG SAOC技術。三種類型之呈現器可執行將目標呈現至頻道、將頻道呈現至耳機或將頻道呈現至不同揚聲器設置(參見圖2,參考符號230、234及238)之任務。當使用SAOC明確傳輸或參數編碼目標信號時,對應的目標後設資料資訊108經壓縮(參見信號126)且多工至3D音訊位元串流128。
以下將進一步詳細描述圖1及圖2中所展示之總體3D音訊系統的演算法方塊。
可視情況提供預呈現器/混合器102以在編碼前將頻道加目標輸入場景轉換成頻道場景。該預呈現器/混合器102在功能上與以下將描述之目標呈現器/混合器相同。可能需要預呈現目標以確保編碼器輸入端處之基本上獨立於許多同時作用中目標信號的決定性信號熵。在預呈現目標之情況下,不需要目標後設資料傳輸。離散目標信號經呈現至編碼器經組配以使用之頻道佈局。自相關聯之目標後設資料(OAM)獲得用於每一頻道的目標之權重。
USAC編碼器116為用於喇叭-頻道信號、離散目標信號、目標下混信號及預呈現信號的核心編解碼器。該USAC編碼器116係基於MPEG-D USAC技術。其藉由基於輸入頻道及目標指派之幾何及語義資訊創造頻道及目標映射資訊來處置以上信號之寫碼。此映射資訊描述輸入頻道及 目標如何映射至USAC頻道元素,如頻道對元素(CPE)、單一頻道元素(SCE)、低頻效應(LFE)及四頻道元素(QCE)及CPE、SCE及LFE,且對應的資訊傳輸至解碼器。所有額外酬載(如SAOC資料114、118或目標後設資料126)視為在編碼器之速率控制下。取決於呈現器之速率/失真要求及互動性要求,以不同方式寫碼目標係可能的。根據實施例,以下目標寫碼變體係可能的:
預呈現目標:目標信號在編碼前經預呈現且混合至22.2頻道信號。隨後寫碼鏈見到22.2頻道信號。
離散目標波形:目標作為單音波形供應至編碼器。編碼器使用單一頻道元素(SCE)傳輸除頻道信號之外亦有的目標。經解碼目標在接收器側處呈現且混合。經壓縮目標後設資料資訊傳輸至接收器/呈現器。
參數目標波形:目標性質及其彼此的關係藉由SAOC參數描述。目標信號之下混藉由USAC寫碼。參數資訊沿旁側傳輸。取決於目標之數目及總資料速率,選擇下混頻道之數目。經壓縮目標後設資料資訊傳輸至SAOC呈現器。
用於目標信號之SAOC編碼器112及SAOC解碼器220可基於MPEG SAOC技術。系統能夠基於較少數目個輸送頻道及額外參數資料(諸如,OLD、IOC(目標間相干性)、OMG(下混增益))再生、修改及呈現大量音訊目標。額外參數資料展現明顯低於個別地傳輸所有目標所需之資料速率,從而使寫碼非常有效率。SAOC編碼器112將作為單音波形之目標/頻道信號當作輸入,且輸出參數資訊(其經封裝至 3D音訊位元串流128內)及SAOC輸送頻道(其由使用單一頻道元素而編碼且經傳輸)。SAOC解碼器220自經解碼SAOC輸送頻道210及參數資訊214重建目標/頻道信號,且基於再現佈局、經解壓縮目標後設資料資訊且視情況基於使用者互動資訊產生輸出音訊場景。
提供目標後設資料編解碼器(參見OAM編碼器124及OAM解碼器224),以使得對於每一目標,指定幾何位置及目標在3D空間中之體積的相關聯後設資料經藉由量化目標在時間及空間中之性質而有效率地寫碼。經壓縮目標後設資料cOAM 126作為旁側資料傳輸至接收器200。
目標呈現器216利用經壓縮目標後設資料根據給定再現格式產生目標波形。每一目標根據其後設資料呈現至某一輸出頻道。該區塊之輸出自部分結果之總和產生。若解碼基於頻道之內容以及離散/參數目標兩者,則基於頻道之波形及呈現之目標波形在輸出所得波形228前或在將其饋入至後處理器模組(如立體聲呈現器236或喇叭呈現器模組232)前由混合器226混合。
立體聲呈現器模組236產生多頻道音訊材料之立體聲下混,以使得每一輸入頻道由虛擬聲源表示。處理以逐個訊框在QMF(正交鏡像濾波器組)域中進行,且立體聲化係基於量測之立體聲房間脈衝回應。
喇叭呈現器232在傳輸之頻道組配228與所要的再現格式之間轉換。亦可稱為「格式轉換器」。格式轉換器執行至較低數目個輸出頻道之轉換,亦即,其創造下混。
圖3說明圖2之立體聲呈現器236之一實施例。立體聲呈現器模組可提供多頻道音訊材料之立體聲下混。立體聲化可基於量測之立體聲房間脈衝回應。房間脈衝回應可視為真實房間之聲學性質的「指紋」。房間脈衝回應經量測及儲存,且任意聲學信號可具備此「指紋」,藉此允許在收聽者處模擬與房間脈衝回應相關聯之房間的聲學性質。立體聲呈現器236可經規劃或組配以用於使用頭部有關轉移功能或立體聲房間脈衝回應(BRIR)將輸出頻道呈現至兩個立體聲頻道中。舉例而言,對於行動器件而言,需要立體聲呈現用於附接至該等行動器件之耳機或喇叭。在該等行動器件中,歸因於約束,可能有必要限制解碼器及呈現複雜性。除了省略在該等處理情形下之解相關之外,首先使用下混器250對中間下混信號252(亦即,對較低數目個輸出頻道)進行下混可能係較佳的,較低數目個輸出頻道導致用於實際立體聲轉換器254之較低數目個輸入頻道。舉例而言,22.2頻帶材料可由下混器250下混至5.1中間下混,或替代地,中間下混可由圖2中之SAOC解碼器220以一種「捷徑」之方式直接計算。接著,立體聲呈現必須應用十個HRTF(頭部相關轉移功能)或BRIR功能以在不同位置處呈現五個個別頻道,此與在22.2輸入頻道待直接呈現的情況下應用44個HRTF或BRIR功能形成對比。立體聲呈現所必要之卷積操作需要大量處理能力,且因此降低此處理能力同時仍獲得可接受之音訊品質對行動器件特別有用。立體聲呈現器236產生多頻道音訊材料228之立體聲下混238,以使得每一輸 入頻道(不包括LFE頻道)由虛擬聲源表示。處理可按逐個訊框在QMF域中進行。立體聲化係基於量測之立體聲房間脈衝回應,且直達聲及早期回聲可在偽FFT域中經由卷積方法使用QMF域上之快速卷積壓印至音訊資料,而後期混響可分開來處理。
多頻道音訊格式當前存在於大量多種組配中,該等格式用於如其已在上文詳細描述之3D音訊系統中,3D音訊系統用於(例如)提供DVD及藍光光碟上提供之音訊資訊。一個重要問題為適應多頻道音訊之即時傳輸,同時維持與現有可用客戶實體揚聲器設置之相容性。解決方案為將音訊內容按(例如)生產中使用之原始格式編碼,該格式通常具有大量輸出頻道。另外,下混旁側資訊經提供以產生具有較少獨立頻道之其他格式。假設(例如)數目N個輸入頻道及數目M個輸出頻道,接收器處之下混程序可由具有大小為N×M之下混矩陣指定。如其可能在上述格式轉換器或立體聲呈現器之下混器中執行之此特定程序表示被動下混,其意謂無取決於實際音訊內容處理之適應性信號應用至輸入信號或經下混輸出信號。
下混矩陣試圖不僅匹配音訊資料之實體混合,且亦可傳達可使用其關於經傳輸之實際內容的知識之生產者之藝術意圖。因此,存在若干產生下混矩陣之方式,例如,藉由使用關於輸入及輸出揚聲器之作用及位置的通用聲學知識手動產生下混矩陣、藉由使用關於實際內容及藝術意圖之知識手動產生下混矩陣及例如藉由使用軟體工具自動 產生下混矩陣,該軟體工具使用給定輸出揚聲器計算近似值。
存在用於提供該等下混矩陣之此項技術中許多已知的方法。然而,現有方案做了許多假設且硬式寫碼結構之重要部分及實際下混矩陣之內容。在先前技術參考[1]中,描述了使用特定下混程序,該等下混程序明確針對自5.1頻道組配(參見先前技術參考[2])下混至2.0頻道組配、自6.1或7.1前部或前高度或後部環繞變體下混至5.1或2.0頻道組配而定義。此等已知方法之缺點為在一些輸入頻道與預定義權重混合(例如,在將7.1後部環繞映射至5.1組配的情況下,L、R及C輸入頻道直接映射至對應的輸出頻道)及減少數目個增益值共用於一些其他輸入頻道(例如,在將7.1前置映射至5.1組配的情況下,L、R、Lc及Rc輸入頻道使用僅一個增益值映射至L及R輸出頻道)意義上,下混方案僅具有有限自由度。此外,增益僅具有有限範圍及精度,例如,自0dB至9dB,其中一共八個等級。明確描述用於每一輸入及輸出組配對之下混程序很費力且暗示以延遲之順應性為代價,依附於現有標準。先前技術參考[5]中描述另一建議。此方法使用表示靈活性之改良的明確下混矩陣,然而,該方案再次限制0dB至9dB(其中一共16個等級)之範圍及精度。此外,每一增益按4位元之固定精度編碼。
因此,鑒於已知先前技術,需要用於有效率地寫碼下混矩陣之改良方法,包括選擇合適表示域及量化方案以及無損寫碼量化值的態樣。
根據實施例,藉由允許按由生產者根據其需要指定之範圍及精度編碼任意下混矩陣來達成針對處置下混矩陣的不受限制之靈活性。又,本發明之實施例提供非常有效率之無損寫碼,所以典型矩陣使用少量位元,且脫離典型矩陣將僅逐漸降低效率。此意謂矩陣與典型矩陣愈類似,則根據本發明之實施例描述之寫碼將愈有效率。
根據實施例,所需精度可由生產者指定為1dB、0.5dB或0.25dB以用於均勻量化。應注意,根據其他實施例,亦可選擇用於精度之其他值。與此相反,現有方案僅允許1.5dB或0.5dB之精度用於約0dB之值,同時將較低精度用於其他值。使用較粗略量化用於一些值影響達成之最差情況容差且使經解碼矩陣之寫碼更加困難。在現有技術中,較低精度用於一些值,此為使用均勻寫碼減少所需位元之數目的簡單方式。然而,實務上,可在不犧牲精度的情況下藉由使用以下將進一步詳細描述之改良寫碼方案達成相同結果。
根據實施例,混合增益值可經指定在最大值(例如,+22dB)與最小值(例如,-47dB)之間。該等值亦可包括負無窮大值。矩陣中使用之有效值範圍在位元串流中指示為最大增益及最小增益,藉此不浪費實際上未使用但不限制所要的靈活性之值的任何位元。
根據實施例,假設下混矩陣待提供至之音訊內容之輸入頻道清單為可用的,以及指示輸出揚聲器組配之輸出頻道清單。此等清單提供關於輸入組配及輸出組配中之 每一揚聲器的幾何資訊,諸如,方位角及仰角。視情況地,亦可提供揚聲器習知名稱。
圖4展示如此項技術中已知用於自22.2輸入組配映射至5.1輸出組配之一例示性下混矩陣。在矩陣之右邊行300中,根據22.2組配之各別輸入頻道由與各別頻道相關聯之揚聲器名稱指示。底部列302包括輸出頻道組配(5.1組配)之各別輸出頻道。再次,各別頻道由相關聯之揚聲器名稱指示。矩陣包括複數個矩陣元素304,每一矩陣元素304具有增益值,亦被稱作混合增益。混合增益指示當對各別輸出頻道302有影響時,如何調整給定輸入頻道(例如,輸入頻道300中之一者)之等級。舉例而言,左上方矩陣元素展示值「1」,意謂輸入頻道組配300之中心頻道C完全匹配輸出頻道組配302之中心頻道C。同樣,兩個組配中之各別左及右頻道(L/R頻道)經完全映射,亦即,輸入組配中之左/右頻道完全對輸出組配中之左/右頻道有影響。輸入組配中之其他頻道(例如,頻道Lc及Rc)以0.7之降低等級映射至輸出組配302之左及右頻道。如自圖4可見,亦存在許多不具有條目之矩陣元素,意謂與矩陣元素相關聯之各別頻道不彼此映射,或意謂經由不具有條目之矩陣元素與輸出頻道相關之輸入頻道不對各別輸出頻道有影響。舉例而言,左/右輸入頻道皆不映射至輸出頻道Ls/Ls,亦即,左及右輸入頻道不對輸出頻道Ls/Ls有影響。亦已指示零增益,而非在矩陣中提供空隙。
在下文中將描述若干技術,該等技術根據本發明 之實施例應用以達成有效率地無損寫碼下混矩陣。在下列實施例中,將對圖4中所展示之下混矩陣之寫碼進行參考,然而,顯而易見的是,下文中描述之細節可應用於可提供之任何其他下混矩陣。根據實施例,提供用於解碼下混矩陣之方法,其中藉由利用複數個輸入頻道之揚聲器對之對稱性及複數個輸出頻道之揚聲器對之對稱性來編碼下混矩陣。下混矩陣在其傳輸至解碼器之後(例如)在音訊解碼器處經解碼,該音訊解碼器接收包括經編碼音訊內容之位元串流及亦表示下混矩陣之經編碼資訊或資料,從而允許在解碼器處建構對應於原始下混矩陣之下混矩陣。解碼下混矩陣包含接收表示下混矩陣之經編碼資訊及解碼經編碼資訊以用於獲得下混矩陣。根據其他實施例,提供用於編碼下混矩陣之方法,該方法包含利用複數個輸入頻道之揚聲器對之對稱性及複數個輸出頻道之揚聲器對之對稱性。
在本發明之實施例之以下描述中,將在編碼下混矩陣之情況下描述一些態樣,然而,對於熟習此項技術之讀者,很明顯,此等態樣亦表示用於解碼下混矩陣之對應的方法之描述。類似地,在解碼下混矩陣之情況下描述之態樣亦表示用於編碼下混矩陣之對應的方法之描述。
根據實施例,第一步驟為利用矩陣中之相當大的數目個零條目。在接著的步驟中,根據實施例,吾人利用全域規則性及亦精細等級規則性,該等規則性通常存在於下混矩陣中。第三步驟為利用非零增益值之典型分佈。
根據第一實施例,本發明方法自下混矩陣開始, 此係由於其可由音訊內容之生產者提供。對於以下論述,為簡單起見,假設考慮之下混矩陣為圖4之下混矩陣。根據本發明方法,圖4之下混矩陣經轉換以用於提供當與原始矩陣相比時可更有效率地編碼之緊密下混矩陣。
圖5示意性表示剛提到之轉換步驟。在圖5之上部部分中,圖4之原始下混矩陣306經展示為以下文將進一步詳細描述之方式轉換成圖5之下部部分中所展示之緊密下混矩陣308。根據本發明方法,使用「對稱揚聲器對」之概念,該概念意謂相對於收聽者位置,一個揚聲器在左半平面中,而另一揚聲器在右半平面中。此對稱對組配對應於具有相同仰角同時具有用於方位角之相同絕對值但具有不同正負號之兩個揚聲器。
根據實施例,定義不同類別之揚聲器群組,主要為對稱揚聲器S、中心揚聲器C及不對稱揚聲器A。中心揚聲器為在改變揚聲器位置之方位角之正負號時位置不改變的彼等揚聲器。不對稱揚聲器為缺乏給定組配中之另一或對應的對稱揚聲器之彼等揚聲器,或在一些罕見組配中,另一側上之揚聲器可具有不同仰角或方位角,以使得在此情況下存在兩個單獨不對稱揚聲器,而非一對稱對。在圖5中所展示之下混矩陣306中,輸入頻道組配300包括圖5之上部部分中指示的九個對稱揚聲器對S1至S9。舉例而言,對稱揚聲器對S1包括22.2輸入頻道組配300之揚聲器Lc及Rc。又,22.2輸入組配中之LFE揚聲器為對稱揚聲器,此係因為其關於收聽者位置具有相同仰角及相同絕對方位角但具有 不同正負號。22.2輸入頻道組配300進一步包括六個中心揚聲器C1至C6,亦即,揚聲器C、Cs、Cv、Ts、Cvr及Cb。輸入頻道組配中不存在不對稱頻道。不同於輸入頻道組配,輸出頻道組配302僅包括兩個對稱揚聲器對S10及S11,及一個中心揚聲器C7及一個不對稱揚聲器A1
根據所描述之實施例,藉由將形成對稱揚聲器對之輸入及輸出揚聲器分群在一起而將下混矩陣306轉換至緊密表示308。將各別揚聲器分群在一起產生包括與原始輸入組配300中相同之中心揚聲器C1至C6的緊密輸入組配310。然而,當與原始輸入組配300相比時,對稱揚聲器S1至S9分別分群在一起,以使得各別對現僅佔據單一列,如圖5之下部部分中所指示。以類似方式,原始輸出頻道組配302亦經轉換成亦包括原始中心及不對稱揚聲器(即,中心揚聲器C7及不對稱揚聲器A1)之緊密輸出頻道組配312。然而,各別揚聲器對S10及S11經組合至單一行中。因此,如自圖5可見,原始下混矩陣306之24×6的尺寸減小至緊密下混矩陣之15×4的尺寸。
在關於圖5所描述之實施例中,吾人可看到在原始下混矩陣306中,指示輸入頻道多強地對輸出頻道有影響的與各別對稱揚聲器對S1至S11相關聯之混合增益經針對輸入頻道中及輸出頻道中之對應的對稱揚聲器對對稱地排列。舉例而言,在查看對S1及S10時,各別左及右頻道經由增益0.7組合,而左/右頻道之組合與增益0組合。因此,當以如緊密下混矩陣308中所展示之方式將各別頻道分群在一起 時,緊密下混矩陣元素314可包括亦關於原始矩陣306描述之各別混合增益。因此,根據上述實施例,藉由將對稱揚聲器對分群在一起來減小原始下混矩陣之大小,以使得「緊密」表示308可比原始下混矩陣有效率地加以編碼。
關於圖6,現將描述本發明之又一實施例。圖6再次展示具有已關於圖5展示及描述之經轉換輸入頻道組配310及輸出頻道組配312的緊密下混矩陣308。在圖6之實施例中,不同於圖5中之緊密下混矩陣之矩陣條目314不表示任何增益值,而表示所謂的「有效值」。有效值指示在各別矩陣元素314處與其相關聯之任何增益是否為零。展示值「1」之彼等矩陣元素314指示各別元素具有與其相關聯之增益值,而空隙矩陣元素指示無增益值或零增益與此元素相關聯。根據此實施例,當與圖5相比時,用有效值替代實際增益值允許更進一步有效率地編碼緊密下混矩陣,此係因為圖6之表示308可使用(例如)每條目一個位元(指示用於各別有效值之值1或值0)來簡單編碼。另外,除編碼有效值之外,亦將有必要編碼與矩陣元素相關聯之各別增益值,以使得解碼接收之資訊後,可重建構完整下混矩陣。
根據另一實施例,下混矩陣在其如圖6中所展示之緊密形式下的表示可使用延行長度方案來編碼。在此延行長度方案中,藉由將以列1開始且以列15結束之列串接在一起而將矩陣元素314變換成一維向量。此一維向量接著轉換成含有延行長度(例如,以1結束之連續零的數目)之清單。在圖6之實施例中,此舉產生以下清單:
其中(1)表示位元向量以0結束的情況下之虛擬終止。以上所展示之延行長度可使用適當寫碼方案(諸如,將可變長度前置碼指派至每一數目之有限哥倫布-萊斯寫碼)來寫碼,以使得使總位元長度最小化。哥倫布-萊斯寫碼方法用以使用非負整數參數p 0寫碼非負整數n 0如下:首先,使用一元寫碼來寫碼數目),h一(1)位元後接著為終止零位元;接著使用p位元均勻寫碼數目l=n-h.2 p
有限哥倫布-萊斯寫碼為提前已知n<N時使用的平凡變體。當寫碼h之最大可能值(h為))時,有限哥倫布-萊斯寫碼不包括終止零位元。更準確而言,為編碼h=h max ,在未終止零位元的情況下僅使用h一(1)位元,不需要該終止零位元,因為解碼器可暗中偵測此情況。
如上所提到,與各別元素314相關聯之增益需要經編碼以及傳輸,且以下將進一步詳細描述用於進行此舉之實施例。在詳細論述增益之編碼之前,現將描述用於編碼圖6中所展示之緊密下混矩陣之結構的另外實施例。
圖7描述用於藉由使用典型緊密矩陣具有某一有意義結構以使得其大體上類似於在音訊編碼器及音訊解碼器兩者處可用之模板矩陣的事實來編碼緊密下混矩陣之結構的又一實施例。圖7展示具有有效值之緊密下混矩陣308,如圖6中亦展示。另外,圖7展示具有相同輸入頻道組配310'及輸出頻道組配312'之可能模板矩陣316的一實例。模板矩 陣(如緊密下混矩陣)包括各別模板矩陣元素314'中的有效值。有效值基本上以與在緊密下混矩陣中相同之方式分佈在元素314'中,惟如上所提到之僅「類似於」緊密下混矩陣之模板矩陣在一些元素314'中不同除外。模板矩陣316與緊密下混矩陣308不同之處在於,在緊密下混矩陣308中,矩陣元素318及320不包括任何增益值,而在對應的矩陣元素318'及320'中,模板矩陣316包括有效值。因此,關於突出顯示之條目318'及320',模板矩陣316不同於需要編碼之緊密矩陣。為達成更進一步有效率地寫碼緊密下混矩陣,當與圖6比較,兩個矩陣308、316中之對應的矩陣元素314、314'經邏輯組合以按與關於圖6所描述類似之方式獲得可以與以上所描述類似之方式編碼的一維向量。矩陣元素314、314'中之每一者可經受XOR運算,更具體言之,使用緊密模板將逐個邏輯元素XOR運算應用於緊密矩陣,此舉產生轉換成含有以下延行長度之清單的一維向量:
此清單現可(例如)藉由亦使用有限哥倫布-萊斯寫碼來編碼。當與關於圖6描述之實施例相比時,可見此清單可甚至更有效率地編碼。在最好情況下,當緊密矩陣與模板矩陣相同時,整個向量僅由零組成,且僅需要編碼一個延行長度數目。
關於模板矩陣之使用,如參看圖7所描述,應注意,與由揚聲器之清單判定之輸入及輸出組配相反,編碼 器及解碼器兩者需要具有一組預定義之該等緊密模板,該組由一組輸入及輸出揚聲器唯一地判定。此意謂著輸入及輸出揚聲器之次序對於判定模板矩陣不相關,相反,該次序可在用以匹配給定緊密矩陣之次序之前經排列。
在下文中,如上所提到,將描述關於原始下混矩陣中提供之混合增益之編碼的實施例,該等混合增益不再存在於緊密下混矩陣中且需要經編碼及傳輸。
圖8描述用於編碼混合增益之一實施例。該實施例根據輸入及輸出揚聲器群組(即,群組S(對稱的L及R)、群組C(中心)及群組A(不對稱))之不同組合使用對應於原始下混矩陣中的一或多個非零條目的子矩陣之性質。圖8描述可根據輸入及輸出揚聲器(即,對稱揚聲器L及R、中心揚聲器C及不對稱揚聲器A)之不同組合自圖4中所展示之下混矩陣導出的可能子矩陣。在圖8中,字母a、b、c及d表示任意增益值。
圖8(a)展示四個可能子矩陣,此係由於其可自圖4之矩陣導出。第一個為界定兩個中心頻道(例如,輸入組配300中之揚聲器C及輸出組配302中之揚聲器C)之映射的子矩陣,且增益值「a」為矩陣元素[1,1](圖4中之左上方元素)中指示之增益值。圖8(a)中之第二子矩陣表示(例如)將兩個對稱輸入頻道(例如,輸入頻道Lc及Rc)映射至輸出頻道組配中之中心揚聲器(諸如,揚聲器C)。增益值「a」及「b」為矩陣元素[1,2]及[1,3]中指示之增益值。圖8(a)中之第三子矩陣指將圖4之輸入組配300中之中心揚聲器C(諸如,揚 聲器Cvr)映射至輸出組配302中之兩個對稱頻道(諸如,頻道Ls及Rs)。增益值「a」及「b」為矩陣元素[4,21]及[5,21]中指示之增益值。圖8(a)中之第四子矩陣表示映射兩個對稱頻道之情況,例如,輸入組配300中之頻道L、R經映射至輸出組配302中之頻道L、R。增益值「a」至「d」為矩陣元素[2,4]、[2,5]、[3,4]及[3,5]中指示之增益值。
圖8(b)展示映射不對稱揚聲器時之子矩陣。第一表示為藉由映射兩個不對稱揚聲器獲得之子矩陣(圖4中未給出該子矩陣之實例)。圖8(b)之第二子矩陣指兩個對稱輸入頻道至不對稱輸出頻道之映射,該映射在圖4之實施例中為(例如)兩個對稱輸入頻道LFE及LFE2至輸出頻道LFE之映射。增益值「a」及「b」為矩陣元素[6,11]及[6,12]中指示之增益值。圖8(b)中之第三子矩陣表示輸入不對稱揚聲器匹配對稱輸出揚聲器對的情況。在一實例情況下,不存在不對稱輸入揚聲器。
圖8(c)展示用於將中心揚聲器映射至不對稱揚聲器之兩個子矩陣。第一子矩陣將輸入中心揚聲器映射至不對稱輸出揚聲器(圖4中未給出該子矩陣之實例),且第二子矩陣將不對稱輸入揚聲器映射至中心輸出揚聲器。
根據此實施例,對於每一輸出揚聲器群組,檢查對於所有條目,對應的行是否滿足對稱性及可分離性之性質,且使用兩個位元將此資訊作為旁側資訊傳輸。
將參看圖8(d)及圖8(e)描述對稱性性質,且意謂包含L及R揚聲器之S群組與至或來自中心揚聲器或不對稱 揚聲器之相同增益混合,或S群組相等地混合至另一S群組或自另一S群組混合。混合S群組的剛提到之兩個可能性在圖8(d)中描繪,且兩個子矩陣對應於以上關於圖8(a)描述之第三子矩陣及第四子矩陣。應用剛提到之對稱性性質(即,混合使用相同增益)產生圖8(e)中所展示之第一子矩陣,其中輸入中心揚聲器C經使用相同增益值映射至對稱揚聲器群組S(例如,參見圖4中輸入揚聲器Cvr至輸出揚聲器Ls及Rs之映射)。此在相反方面亦適用,例如,在查看輸入揚聲器Lc、Rc至輸出頻道之中心揚聲器C之映射時;此處可發現相同對稱性性質。對稱性性質進一步導致圖8(e)中所展示之第二子矩陣,根據此,在對稱性揚聲器當中之混合為相等的,其意謂左揚聲器之映射與右揚聲器之映射使用相同增益因數,且左揚聲器至右揚聲器之映射與右揚聲器至左揚聲器之映射亦使用相同增益值來進行。此在圖4中(例如)關於輸入頻道L、R至輸出頻道L、R之映射來描繪,其中增益值「a」=1,且增益值「b」=0。
可分離性性質意謂對稱群組藉由保持自左側向左之所有信號及自右側向右之所有信號來混合至另一對稱群組或自另一對稱群組混合。此適用於圖8(f)中所展示之子矩陣,該子矩陣對應於上文關於圖8(a)所描述之四個子矩陣。應用剛提到之可分離性性質導致圖8(g)中所展示之子矩陣,根據此,左輸入頻道僅映射至左輸出頻道且右輸入頻道僅映射至右輸出頻道,且歸因於零增益因數,不存在「頻道間」映射。
使用在多數已知下混矩陣中遇到之以上提到的兩個性質允許進一步顯著減少需要寫碼之增益的實際數目,且亦直接消除在滿足可分離性性質的情況下對於大量零增益所需要之寫碼。舉例而言,當考慮包括有效值之圖6之緊密矩陣時且當將以上提及之性質應用於原始下混矩陣時,可見,足以(例如)以如圖5中在下部部分中所展示之方式定義用於各別有效值之單一增益值,此係由於歸因於可分離性及對稱性性質,已知與各別有效值相關聯之各別增益值需要在解碼後分佈在原始下混矩陣當中之方式。因此,當關於圖6中所展示之矩陣應用圖8之上述實施例時,足以僅提供需要與經編碼有效值一起編碼且傳輸之19個增益值,以用於允許解碼器重建構原始下混矩陣。
在下文中,將描述用於動態建立增益表之實施例,該表可用於(例如)由音訊內容之生產者定義原始下混矩陣中之原始增益值。根據此實施例,使用指定精度在最小增益值(minGain)與最大增益值(maxGain)之間動態地建立增益表。較佳地,該表經建立使得最頻繁使用之值及較多「捨入」之值比其他值(即,不常用之值或未如此捨入之值)靠近表或清單開頭排列。根據一實施例,使用maxGain、maxGain及精度等級之可能值之清單可如下建立:- 添加3dB之整數倍,自0dB降低至minGain;- 添加3dB之整數倍,自3dB上升至maxGain;- 添加1dB之剩餘整數倍,自0dB降低至minGain;- 添加1dB之剩餘整數倍,自1dB上升至maxGain; 在精度等級為1dB時停止;- 添加0.5dB之剩餘整數倍,自0dB降低至minGain;- 添加0.5dB之剩餘整數倍,自0.5dB上升至maxGain;在精度等級為0.5dB時停止;- 添加0.25dB之剩餘整數倍,自0dB降低至minGain;及- 添加0.25dB之剩餘整數倍,自0.25dB上升至maxGain。
舉例而言,當maxGain為2dB且minGain為-6dB且精度為0.5dB時,建立以下清單:0、-3、-6、-1、-2、-4、-5、1、2、-0.5、-1.5、-2.5、-3.5、-4.5、-5.5、0.5、1.5。
關於以上實施例,應注意,本發明並不限於上文指示之值,相反,而是使用3dB之整數倍且自0dB開始,可選擇其他值,且亦可取決於情況選擇用於精度等級之其他值。
大體而言,增益值清單可如下建立:- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第一增益值的整數倍;- 在起始增益值(包括性)與最大增益(包括性)之間以遞增次序添加第一增益值的剩餘整數倍;- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第一精度等級的剩餘整數倍; - 在起始增益值(包括性)與最大增益(包括性)之間以遞減次序添加第一精度等級的剩餘整數倍;- 在精度等級為第一精度等級時停止;- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第二精度等級的剩餘整數倍;- 在起始增益值(包括性)與最大增益(包括性)之間以遞增次序添加第二精度等級的剩餘整數倍;- 在精度等級為第二精度等級時停止;- 在最小增益(包括性)與起始增益值(包括性)之間以遞減次序添加第三精度等級的剩餘整數倍;及- 在起始增益值(包括性)與最大增益(包括性)之間以遞增次序添加第三精度等級的剩餘整數倍。
在以上實施例中,當起始增益值為零時,以遞增次序添加剩餘值且滿足相關聯之倍數性條件之部分將一開始添加第一增益值或第一或第二或第三精度等級。然而,在一般情況下,以遞增次序添加剩餘值之部分將一開始添加最小值,從而滿足起始增益值(包括性)與最大增益(包括性)之間的間隔中之相關聯之倍數性條件。對應地,以遞減次序添加剩餘值之部分將一開始添加最大值,從而滿足最小增益(包括性)與起始增益值(包括性)之間的間隔中之相關聯之倍數性條件。
考慮類似於以上實例但具有起始增益值=1dB之實例(第一增益值=3dB、maxGain=2dB、minGain=-6dB且精度等級=0.5dB)產生以下: 下:0、-3、-6
上:[空]
下:1、-2、-4、-5
上:2
下:0.5、-0.5、-1.5、-2.5、-3.5、-4.5、-5.5
上:1.5
為編碼增益值,較佳地,在表中查找增益,且輸出其在表內部之位置。將始終找到所要增益,因為所有增益先前經量化至(例如)1dB、0.5dB或0.25dB之指定精度的最近整數倍。根據一較佳實施例,增益值之位置具有與其相關聯之索引,其指示表中之位置,且增益之索引可(例如)使用有限哥倫布-萊斯寫碼方法來編碼。此導致小索引比大索引使用較少數目個位元,且以此方式,頻繁使用之值或典型值(如0dB、-3dB或-6dB)將使用最少數目個位元,且較多「捨入」值(如-4dB)將比並非如此捨入之數(例如,-4.5dB)使用較少數目個位元。因此,藉由使用上述實施例,不僅音訊內容之生產者可產生所要的增益清單,且亦可非常有效率地編碼此等增益,以使得當根據又一實施例應用所有上述方法時,可達成下混矩陣的高度有效率之寫碼。
上述功能性可為音訊編碼器之一部分,此係因為其已在上文關於圖1描述,替代地,其可由單獨編碼器器件提供,該編碼器器件將下混矩陣之經編碼型式提供至待在位元串流中朝向接收器或解碼器傳輸之音訊編碼器。
在接收器側處接收到經編碼緊密下混矩陣後,根 據實施例,提供解碼方法,該方法解碼經編碼緊密下混矩陣且將經分群之揚聲器取消分群(分離)成單一揚聲器,從而產生原始下混矩陣。當編碼矩陣包括編碼有效值及增益值時,在解碼步驟期間,此等值經解碼,以使得基於有效值及基於所要的輸入/輸出組配,下混矩陣可經重建構,且各別經解碼增益可與重建構下混矩陣之各別矩陣元素相關聯。此可由單獨解碼器執行,該解碼器產生至可將其用於格式轉換器中之音訊解碼器(例如,上文關於圖2、圖3及圖4描述之音訊解碼器)的完整下混矩陣。
因此,如上所定義之本發明方法亦提供用於將具有具體輸入頻道組配之音訊內容呈現至具有不同輸出頻道組配之接收系統的系統及方法,其中用於下混之額外資訊與來自編碼器側之經編碼位元串流一起傳輸至解碼器側,且根據本發明方法,歸因於下混矩陣的非常有效率之寫碼,故明顯降低耗用。
在下文中,描述實施有效率的靜態下混矩陣寫碼之又一實施例。更具體言之,將描述用於具有可選EQ寫碼之靜態下混矩陣的實施例。亦如較早先所提到,與多頻道音訊有關之一個問題為適應其即時傳輸,同時維持與所有現有可用消費者實體揚聲器設置之相容性。一個解決方案為在呈原始生產格式之音訊內容旁提供下混旁側資訊以產生具有較少獨立頻道之其他格式(若需要)。假設inputCount輸入頻道及outputCount輸出頻道,下混程序由大小為inputCount乘outputCount之下混矩陣指定。此特定程序表示 被動下混,意謂無取決於實際音訊內容之適應性信號處理經應用至輸入信號或經下混輸出信號。根據現在描述之實施例,本發明方法描述用於下混矩陣之有效率的編碼之完整方案(包括關於選擇合適表示域之態樣)及亦關於無損寫碼經量化值之量化方案。每一矩陣元素表示調整給定輸入頻道對給定輸出頻道有影響的程度之混合增益。現在描述之實施例旨在藉由允許編碼具有可由生產者根據其需要指定之範圍及精度的任意下混矩陣來達成不受限制之靈活性。又,需要有效率之無損寫碼,以使得典型矩陣使用少量位元,且脫離典型矩陣將僅逐漸降低效率。此意謂矩陣愈類似於典型矩陣,則該矩陣之寫碼將愈有效率。根據實施例,所需之精度可由生產者指定為1dB、0.5dB或0.25dB以用於均勻量化。混合增益之值可指定在最大值+22dB至最小值-47dB(包括性)之間,且亦包括值-∞(線性域中之0)。下混矩陣中使用之有效值範圍在位元串流中指示為最大增益值maxGain及最小增益值minGain,因此不浪費實際上未使用之值的任何位元,同時不限制靈活性。
假設(例如)根據先前技術參考[6]或[7],提供關於每一揚聲器之幾何資訊(諸如,方位角及仰角及視情況揚聲器習知名稱)之輸入頻道清單以及輸出頻道清單可用,根據實施例,用於編碼下混矩陣之演算法可如下表1中所展示:
根據實施例,用於解碼增益值之演算法可如下表2中所展示:
根據實施例,用於定義讀取範圍函式之演算法可如下表3中所展示:
根據實施例,用於定義均衡器組配之演算法可如下表4中所展示:
根據實施例,下混矩陣之元素可如下表5中所展示:
哥倫布-萊斯寫碼用以使用給定非負整數參數p 0寫碼任何非負整數n 0,如下:首先使用一元寫碼來寫碼數目),由於h一位元之後為終止零位元;接著使用p位元均勻寫碼數目l=n-h.2 p
有限哥倫布-萊斯寫碼為提前已知n<N(對於給定整數N 1)時使用的平凡變體。當寫碼最大可能值h(其h(h))時,有限哥倫布-萊斯寫碼不包括終止零位元。更準確而言,為編碼h=h max ,吾人僅寫入h一位元,而非終止零位元,不需要該終止零位元,因為解碼器可暗中偵測此條件。
以下描述之函式ConvertToCompactConfig(paramConfig,paramCount)用以將由paramCount揚聲器組成之給定paramConfig組配轉換成由compactParamCount揚聲器群組組成之緊密compactParamConfig組配。compactParamConfig[i].pairType欄位可在群組表示一對對稱揚聲器時為SYMMETRIC(S)、在群組表示中心揚聲器時 為CENTER(C)或在群組表示在無對稱對之揚聲器時為ASYMMETRIC(A)。
函式FindCompactTemplate(inputConfig,inputCount,outputConfig,outputCount)用以發現匹配由inputConfiginputCount表示之輸入頻道組配及由outputConfigoutputCount表示之輸出頻道組配的緊密模 板矩陣。
藉由在編碼器及解碼器兩者處可用之緊密模板矩陣之預定義清單中搜尋具有與inputConfig相同之輸入揚聲器組及與outputConfig相同之輸出揚聲器組的緊密模板矩陣而發現緊密模板矩陣,與不相關之實際揚聲器次序無關。在傳回經發現緊密模板矩陣之前,函式可需要重排序其列及行以匹配如自給定輸入組配導出之揚聲器群組的次序及如自給定輸出組配導出之揚聲器群組的次序。
若未發現匹配之緊密模板矩陣,則函式應傳回具有正確數目個列(其為輸入揚聲器群組之計算數目)及行(其為輸出揚聲器群組之計算數目)的矩陣,對於所有條目,該矩陣具有值一(1)。
函式SearchForSymmetricSpeaker(paramConfig,paramCount,i)用以在由paramConfigparamCount表示之頻道組配中搜尋對應於揚聲器paramConfig[i]之對稱揚聲器。該對稱揚聲器paramConfig[j]應位於揚聲器paramConfig[i]之後,因此,j可在i+1至paramConfig-1(包括性)之範圍中。另外,其不應為揚聲器群組之一部分,意謂paramConfig[j].alreadyUsed必須為假(false)。
函式readRange()用以讀取0...alphabetSize-1(包括性)之範圍中的均勻分佈之整數,該整數具有一共alphabetSize個可能值。此可藉由讀取ceil(log2(alphabetSize))位元但不利用未使用之值而簡單地進行。舉例而言,當alphabetSize為3時,函式將僅使用一個位元用於整數0,及 兩個位元用於整數1及2。
函式generateGainTable(maxGain,minGain,precisionLevel)用以動態產生增益表gainTable,該增益表gainTable含有具有精度precisionLevel之在minGainmaxGain之間的所有可能增益之清單。選擇值之次序,以使得最頻繁使用之值以及較多「捨入」值將通常更靠近清單之開頭。具有所有可能增益值之清單的增益表經如下產生:- 添加3dB之整數倍,自0dB降低至minGain;- 添加3dB之整數倍,自3dB上升至maxGain;- 添加1dB之剩餘整數倍,自0dB降低至minGain;- 添加1dB之剩餘整數倍,自1dB上升至maxGain;- 在precisionLevel為0(對應於1dB)時停止;- 添加0.5dB之剩餘整數倍,自0dB降低至minGain;- 添加0.5dB之剩餘整數倍,自0.5dB上升至maxGain;- 在precisionLevel為1(對應於0.5dB)時停止;- 添加0.25dB之剩餘整數倍,自0dB降低至minGain;- 添加0.25dB之剩餘整數倍,自0.25dB上升至maxGain
舉例而言,當maxGain為2dB,及minGain為-6dB,且precisionLevel為0.5dB時,吾人建立以下清單:0、-3、-6、-1、-2、-4、-5、1、2、-0.5、-1.5、-2.5、-3.5、-4.5、-5.5、0.5、1.5。
根據實施例,用於均衡器組配之元素可如下表6 中所展示:
在下文中,將描述根據實施例的解碼過程之態樣,自下混矩陣之解碼開始。
語法元素DownmixMatrix()含有下混矩陣資訊。解碼首先讀取由語法元素EqualizerConfig()表示之均衡器資訊(若經啟用)。接著讀取欄位precisionLevelmaxGainminGain。使用函式ConvertToCompactConfig()將輸入及輸出組配轉換至緊密組配。接著,讀取指示對於每一輸出揚聲器群組是否滿足可分離性及對稱性性質之旗標。
接著藉由a)每條目原始使用一個位元或b)使用延行長度之有限哥倫布萊斯寫碼,且接著將經解碼位元自flactCompactMatrix複製至compactDownmixMatrix且應用compactTemplate矩陣來讀取有效矩陣 compactDownmixMatrix
最後,讀取非零增益。對於compactDownmixMatrix之每一非零條目,取決於對應的輸入群組之欄位pairType及對應的輸出群組之欄位pairType,必須重建構大小高達2乘2之子矩陣。使用可分離性及對稱性相關聯之性質,使用函式DecodeGainValue()讀取大量增益值。可藉由使用函式ReadRange()或使用增益在gainTable表中之索引之有限哥倫布-萊斯寫碼來均勻寫碼增益值,該gainTable表含有所有可能增益值。
現在將描述解碼均衡器組配之態樣。語法元素EqualizerConfig()含有待應用於輸入頻道之均衡器資訊。numEqualizers均衡器濾波器之數目首先經解碼且隨後使用eqIndex[i]針對具體輸入頻道選擇。欄位eqPrecisionLeveleqExtendedRange指示縮放增益及峰值濾波器增益之量化精度及可用範圍。
每一均衡器濾波器為存在於峰值濾波器之大量numSections及一scalingGain中的串聯級聯。每一峰值濾波器完全由其centerFreqqualityFactorcenterGain定義。
屬於給定均衡器濾波器之峰值濾波器的centerFreq參數必須以非遞減次序給出。參數限於10...24000Hz(包括性),且其如下計算:centerFreq=centerFreqLd2×10 centerFreqP10
峰值濾波器之qualityFactor參數可表示具有0.05之精度的在0.05與1.0(包括性)之間的值及具有0.1之精度的自1.1 至11.3(包括性)之值,且如下計算:
介紹給出對應於給定eqPrecisionLevel之以dB為單位之精度的向量eqPrecisions,及給出對應於給定eqExtendedRangeeqPrecisionLevel之用於增益之以dB為單位的最小值及最大值的eqMinRanges矩陣及eqMaxRanges矩陣。
eqPrecisions[4]={1.0、0.5、0.25、0.1};eqMinRanges[2][4]={{-8.0、-8.0、-8.0、-6.4}、{-16.0、-16.0、-16.0、-12.8}};eqMaxRanges[2][4]={{7.0、7.5、7.75、6.3}、{15.0、15.5、15.75、12.7}}。
參數scalingGain使用精度等級min(eqPrecisionLevel+1,3),該精度等級為下一個最佳精度等級(若尚不為最後一個精度等級)。欄位centerGainIndexscalingGainIndex至增益參數centerGainscalingGain之映射計算如下:centerGain=eqMinRanges[eqExtendedRange][eqPrecisionLevel]+eqPrecisions[eqPrecisionLevelcenterGainIndex
scalingGain=eqMinRanges[eqExtendedRange][min(eqPrecisionLevel+1,3)]+eqPrecisions[min(eqPrecisionLevel+1,3)]×scalingGainIndex
雖然已在一裝置之情況下描述一些態樣,但很明顯,此等態樣亦表示對應的方法之描述,其中區塊或器件對應於方法步驟或方法步驟之特徵。類似地,在方法步驟 之情況下描述之態樣亦表示對應的裝置之對應的區塊或項目或特徵的描述。一些或所有方法步驟可由(或使用)硬體裝置(如例如,微處理器、可規劃電腦或電子電路)執行。在一些實施例中,最重要的方法步驟中之一或多者可由該裝置執行。
取決於某些實施要求,本發明之實施例可以硬體或以軟體實施。實施可使用非暫時性儲存媒體(諸如,具有儲存於其上之電子可讀控制信號之數位儲存媒體(例如,軟碟、硬碟、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體))執行,該等信號與可規劃電腦系統合作(或能夠合作),以使得執行各別方法。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等信號能夠與可規劃電腦系統合作,以使得執行本文中所描述之方法中之一者。
大體而言,本發明之實施例可作為具有程式碼之電腦程式產品實施,該程式碼可操作用於在電腦程式產品在電腦上執行時執行方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含用於執行本文中所描述之方法中之一者的儲存於機器可讀載體上之電腦程式。
換言之,因此,本發明之一實施例為具有程式碼之電腦程式,該程式碼用於當電腦程式在電腦上執行時執行本文中所描述之方法中的一者。
因此,本發明之又一實施例為資料載體(或數位儲存媒體,或電腦可讀媒體),其包含記錄於其上用於執行本文中所描述之方法中之一者的電腦程式。資料載體、數位儲存媒體或記錄之媒體通常為有形的及/或非暫時性的。
因此,本發明之又一實施例為表示用於執行本文中所描述之方法中之一者的電腦程式之資料串流或一系列信號。資料串流或一系列信號可(例如)經組配以經由資料通訊連接(例如,經由網際網路)傳送。
又一實施例包含處理構件(例如,電腦或可規劃邏輯器件),其經組配或經規劃以執行本文中所描述之方法中的一者。
又一實施例包含電腦,該電腦具有安裝於其上之用於執行本文中所描述之方法中的一者之電腦程式。
根據本發明之又一實施例包含裝置或系統,該裝置或系統經組配以將用於執行本文中所描述之方法中之一者的電腦程式傳送(例如,電子地或光學地)至接收器。接收器可(例如)為電腦、行動器件、記憶體器件或類似者。裝置或系統可(例如)包含用於將電腦程式傳送至接收器的檔案伺服器。
在一些實施例中,可規劃邏輯器件(例如,場可規劃閘陣列)可用以執行本文中所描述之方法的一些或所有功能性。在一些實施例中,場可程式閘陣列可與微處理器合作以便執行本文中所描述之方法中的一者。大體而言, 方法較佳地由任一硬體裝置執行。
以上描述之實施例僅為說明本發明之原理。應理解,本文中所描述之配置及細節的修改及變化對熟習此項技術者而言將為顯而易見的,因此,意在僅由即將到來的專利申請專利範圍之範疇限制,而不受藉由本文中之實施例之描述及解釋提出的具體細節限制。
文獻
[1] Information technology - Coding of audio-visual objects - Part 3: Audio, AMENDMENT 4: New levels for AAC profiles, ISO/IEC 14496-3:2009/DAM 4, 2013.
[2] ITU-R BS.775-3, “Multichannel stereophonic sound system with and without accompanying picture,” Rec., International Telecommunications Union, Geneva, Switzerland, 2012.
[3] K. Hamasaki, T. Nishiguchi, R. Okumura, Y. Nakayama and A. Ando, “A 22.2 Multichannel Sound System for Ultrahigh-definition TV (UHDTV),” SMPTE Motion Imaging J., pp. 40-49, 2008.
[4] ITU-R Report BS.2159-4, “Multichannel sound technology in home and broadcasting applications”, 2012.
[5] Enhanced audio support and other improvements, ISO/IEC 14496-12:2012 PDAM 3, 2013.
[6] International Standard ISO/IEC 23003-3:2012, Information technology - MPEG audio technologies - Part 3: Unified Speech and Audio Coding, 2012.
[7] International Standard ISO/IEC 23001-8:2013, Information technology - MPEG systems technologies - Part 8: Coding-independent code points, 2013.
300‧‧‧右邊行/輸入頻道組配
302‧‧‧底部列/輸出頻道組配
304‧‧‧矩陣元素
306‧‧‧原始下混矩陣
308‧‧‧緊密下混矩陣
310‧‧‧緊密輸入組配/經轉換輸入頻道組配
312‧‧‧緊密輸出頻帶組配/經轉換輸出頻帶組配
314‧‧‧緊密下混矩陣元素/矩陣條目

Claims (30)

  1. 一種用於解碼一下混矩陣以用於將音訊內容之複數個輸入頻道映射至複數個輸出頻道之方法,該等輸入及輸出頻道與在相對於一收聽者位置之預定位置處之各別揚聲器相關聯,其中藉由利用該複數個輸入頻道之揚聲器對的對稱性及該複數個輸出頻道之揚聲器對的對稱性來編碼該下混矩陣,該方法包含:接收表示該經編碼下混矩陣之經編碼資訊;以及解碼該經編碼資訊以獲得該經解碼下混矩陣。
  2. 一種用於編碼一下混矩陣以用於將音訊內容之複數個輸入頻道映射至複數個輸出頻道之方法,該等輸入及輸出頻道與在相對於一收聽者位置之預定位置處的各別揚聲器相關聯,其中編碼該下混矩陣包含利用該複數個輸入頻道之揚聲器對之對稱性及該複數個輸出頻道之揚聲器對之對稱性。
  3. 如請求項1或2之方法,其中該下混矩陣中之輸入及輸出頻道之各別對具有用於調適一給定輸入頻道對一給定輸出頻道有影響之一程度的相關聯之各別混合增益,且該方法進一步包含:自表示該下混矩陣之該資訊解碼經編碼有效值,其中各別有效值經指派至該等輸入頻道之對稱揚聲器群組對及該等輸出頻道之對稱揚聲器群組對,該有效值指 示用於該等輸入頻道中之一或多者之一混合增益是否為零;以及自表示該下混矩陣之該資訊解碼經編碼混合增益。
  4. 如請求項3之方法,其中該等有效值包含指示為零之一混合增益的一第一值,及其指示一混合增益不為零之一第二值,且其中編碼該等有效值包含藉由以一預定義次序串接該等有效值來形成一一維向量,及使用一延行長度方案編碼該一維向量。
  5. 如請求項3之方法,其中編碼該等有效值係基於具有該等輸入頻道之揚聲器群組及該等輸出頻道之揚聲器群組之相同對的一模板,該模板具有與其相關聯之模板有效值。
  6. 如請求項5之方法,其包含:邏輯群組合該等有效值與該模板有效值以用於產生一一維向量,該一維向量藉由一第一值指示一有效值與一模板有效值相同,且藉由一第二值指示一有效值與模板有效值不同;以及藉由一延行長度方案編碼該一維向量。
  7. 如請求項4或6之方法,其中編碼該一維向量包含將該一維向量轉換至含有該等延行長度之一清單,一延行長度為以該第二值終止之連續第一值的數目。
  8. 如請求項4、6或7之方法,其中使用哥倫布-萊斯寫碼或有限哥倫布-萊斯寫碼來編碼該等延行長度。
  9. 如請求項1至8中任一項之方法,其中解碼該下混矩陣包含:自表示該下混矩陣之該資訊解碼指示在用於每一輸出頻道群組之該下混矩陣中是否滿足一對稱性性質及一可分離性性質的資訊,該對稱性性質指示一輸出頻道群組與來自一單一輸入頻道之相同增益混合或一輸出頻道群組自一輸入頻道群組同等混合,且該可分離性性質指示一輸出頻道群組自一輸入頻道群組混合,同時保持所有信號在各別左側或右側處。
  10. 如請求項9之方法,其中對於滿足該對稱性性質及該可分離性性質之輸出頻道群組,提供一單一混合增益。
  11. 如請求項1至10中任一項之方法,其包含:提供保持該等混合增益之一清單,每一混合增益與該清單中之一索引相關聯;自表示該下混矩陣之該資訊解碼該清單之該等索引;以及根據該清單中之該等經解碼索引自該清單選擇該等混合增益。
  12. 如請求項11之方法,其中使用該哥倫布-萊斯寫碼或該有限哥倫布-萊斯寫碼來編碼該等索引。
  13. 如請求項11或12之方法,其中提供該清單包含:自表示該下混矩陣之該資訊解碼一最小增益值、一最大增益值及一所要的精度;以及建立包括該最小增益值與該最大增益值之間的複 數個增益值之該清單,該等增益值具備該所要的精度,其中通常使用該等增益值愈頻繁,則該等增益值愈接近該清單之開頭,該清單之該開頭具有最小索引。
  14. 如請求項13之方法,其中該增益值清單經如下建立:在該最小增益(包括性)與一起始增益值(包括性)之間以遞減次序添加一第一增益值的整數倍;在該起始增益值(包括性)與該最大增益(包括性)之間以遞增次序添加該第一增益值的剩餘整數倍;在該最小增益(包括性)與該起始增益值(包括性)之間以遞減次序添加一第一精度等級的剩餘整數倍;在該起始增益值(包括性)與該最大增益(包括性)之間以遞增次序添加該第一精度等級的剩餘整數倍;在精度等級為該第一精度等級時停止;在該最小增益(包括性)與該起始增益值(包括性)之間以遞減次序添加一第二精度等級的剩餘整數倍;在該起始增益值(包括性)與該最大增益(包括性)之間以遞增次序添加該第二精度等級的剩餘整數倍;在精度等級為該第二精度等級時停止;在該最小增益(包括性)與該起始增益值(包括性)之間以遞減次序添加一第三精度等級的剩餘整數倍;以及在該起始增益值(包括性)與該最大增益(包括性)之間以遞增次序添加該第三精度等級的剩餘整數倍。
  15. 如請求項14之方法,其中該起始增益值=0dB,該第一增益值=3dB,該第一精度等級=1dB,該第二精度等級 =0.5dB,且該第三精度等級=0.25dB。
  16. 如請求項1至5中任一項之方法,其中一喇叭之一預定位置取決於該揚聲器位置相對於該收聽者位置之一方位角及一仰角而界定,且其中一對稱揚聲器對由具有相同仰角且具有該方位角之相同絕對值但具有不同正負號的揚聲器形成。
  17. 如請求項1至6中任一項之方法,其中該等輸入及輸出頻道進一步包括與一或多個中心揚聲器及一或多個不對稱揚聲器相關聯之頻道,一不對稱揚聲器缺乏由該等輸入/輸出頻道定義之該組配中的另一對稱揚聲器。
  18. 如請求項1至7中任一項之方法,其中編碼該下混矩陣包含藉由將與對稱揚聲器對相關聯之該下混矩陣中的輸入頻道及與對稱揚聲器對相關聯之該下混矩陣中的輸出頻道一起分群至共同行或列中來將該下混矩陣轉換成一緊密下混矩陣,及編碼該緊密下混矩陣。
  19. 如請求項18之方法,其中解碼該緊密矩陣包含:接收該等經編碼有效值及該等經編碼混合增益,解碼該等有效值、產生該經解碼緊密下混矩陣且解碼該等混合增益,將該等經解碼混合增益指派至指示一增益不為零之該等對應的有效值,以及對經分群在一起之該等輸入頻道及該等輸出頻道取消分群,用於獲得該經解碼下混矩陣。
  20. 一種用於將具有複數個輸入頻道之音訊內容呈現至具 有不同於該等輸入頻道之複數個輸出頻道的一系統之方法,該方法包含:提供該音訊內容及一下混矩陣用於將該等輸入頻道映射至該等輸出頻道,編碼該音訊內容;編碼該下混矩陣;將該經編碼音訊內容及該經編碼下混矩陣傳輸至該系統;解碼該音訊內容;解碼下混矩陣;以及使用該經解碼下混矩陣將該音訊內容之該等輸入頻道映射至該系統之該等輸出頻道,其中根據前述請求項中任一項之方法編碼/解碼該下混矩陣。
  21. 如請求項20之方法,其中該下混矩陣由一使用者指定。
  22. 如請求項20或21之方法,其進一步包含傳輸與該等輸入頻道或該等下混矩陣元素相關聯之均衡器參數。
  23. 一種非暫時性電腦產品,其包括儲存用於進行如請求項1至22中任一項之一方法的指令之一電腦可讀媒體。
  24. 一種用於編碼一下混矩陣以將音訊內容之複數個輸入頻道映射至複數個輸出頻道之編碼器,該等輸入及輸出頻道與在相對於一收聽者位置之預定位置處的各別揚聲器相關聯,該編碼器包含:一處理器,其經組配以編碼該下混矩陣,其中編碼 該下混矩陣包含利用該複數個輸入頻道之揚聲器對之對稱性及該複數個輸出頻道之揚聲器對之對稱性。
  25. 如請求項24之編碼器,其中該處理器經組配以根據如請求項2至22中任一項之方法操作。
  26. 一種用於解碼一下混矩陣以用於將音訊內容之複數個輸入頻道映射至複數個輸出頻道之解碼器,該等輸入及輸出頻道與在相對於一收聽者位置之預定位置處之各別揚聲器相關聯,其中藉由利用該複數個輸入頻道之揚聲器對的對稱性及該複數個輸出頻道之揚聲器對的對稱性來編碼該下混矩陣,該解碼器包含:一處理器,其經組配以接收表示該經編碼下混矩陣之經編碼資訊,以及解碼該經編碼資訊以用於獲得該經解碼下混矩陣。
  27. 如請求項26之解碼器,其中該處理器經組配以根據如請求項1至22之方法操作。
  28. 一種用於編碼一音訊信號之音訊編碼器,其包含如請求項24或25之一編碼器。
  29. 一種用於解碼一經編碼音訊信號之音訊解碼器,該音訊解碼器包含如請求項26或27之一解碼器。
  30. 如請求項29之音訊解碼器,其包含一格式轉換器,該格式轉換器耦接至用於接收該經解碼下混矩陣之該解碼器且可操作以根據該接收之經解碼下混矩陣轉換該經解碼音訊信號的格式。
TW103136287A 2013-10-22 2014-10-21 解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器 TWI571866B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP20130189770 EP2866227A1 (en) 2013-10-22 2013-10-22 Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Publications (2)

Publication Number Publication Date
TW201521013A true TW201521013A (zh) 2015-06-01
TWI571866B TWI571866B (zh) 2017-02-21

Family

ID=49474267

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103136287A TWI571866B (zh) 2013-10-22 2014-10-21 解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器

Country Status (19)

Country Link
US (4) US9947326B2 (zh)
EP (2) EP2866227A1 (zh)
JP (1) JP6313439B2 (zh)
KR (1) KR101798348B1 (zh)
CN (2) CN105723453B (zh)
AR (1) AR098152A1 (zh)
AU (1) AU2014339167B2 (zh)
BR (1) BR112016008787B1 (zh)
CA (1) CA2926986C (zh)
ES (1) ES2655046T3 (zh)
MX (1) MX353997B (zh)
MY (1) MY176779A (zh)
PL (1) PL3061087T3 (zh)
PT (1) PT3061087T (zh)
RU (1) RU2648588C2 (zh)
SG (1) SG11201603089VA (zh)
TW (1) TWI571866B (zh)
WO (1) WO2015058991A1 (zh)
ZA (1) ZA201603298B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
EP3285257A4 (en) 2015-06-17 2018-03-07 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
US10607622B2 (en) * 2015-06-17 2020-03-31 Samsung Electronics Co., Ltd. Device and method for processing internal channel for low complexity format conversion
CN107787509B (zh) * 2015-06-17 2022-02-08 三星电子株式会社 处理低复杂度格式转换的内部声道的方法和设备
EP3453190A4 (en) 2016-05-06 2020-01-15 DTS, Inc. SYSTEMS FOR IMMERSIVE AUDIO PLAYBACK
JP7003924B2 (ja) * 2016-09-20 2022-01-21 ソニーグループ株式会社 情報処理装置と情報処理方法およびプログラム
US10075789B2 (en) * 2016-10-11 2018-09-11 Dts, Inc. Gain phase equalization (GPEQ) filter and tuning methods for asymmetric transaural audio reproduction
US10659906B2 (en) * 2017-01-13 2020-05-19 Qualcomm Incorporated Audio parallax for virtual reality, augmented reality, and mixed reality
US10979844B2 (en) * 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
JP7224302B2 (ja) * 2017-05-09 2023-02-17 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャネル空間的オーディオ・フォーマット入力信号の処理
WO2019004524A1 (ko) * 2017-06-27 2019-01-03 엘지전자 주식회사 6자유도 환경에서 오디오 재생 방법 및 오디오 재생 장치
JP7222668B2 (ja) * 2017-11-17 2023-02-15 日本放送協会 音響処理装置及びプログラム
BR112020012648A2 (pt) 2017-12-19 2020-12-01 Dolby International Ab métodos e sistemas de aparelhos para aprimoramentos de decodificação de fala e áudio unificados
GB2571572A (en) * 2018-03-02 2019-09-04 Nokia Technologies Oy Audio processing
KR20240033290A (ko) * 2018-04-11 2024-03-12 돌비 인터네셔널 에이비 오디오 렌더링을 위한 사전 렌더링된 신호를 위한 방법, 장치 및 시스템
JP7504091B2 (ja) 2018-11-02 2024-06-21 ドルビー・インターナショナル・アーベー オーディオ・エンコーダおよびオーディオ・デコーダ
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
EP4014506B1 (en) 2019-08-15 2023-01-11 Dolby International AB Methods and devices for generation and processing of modified audio bitstreams
CN114303392A (zh) * 2019-08-30 2022-04-08 杜比实验室特许公司 多声道音频信号的声道标识
GB2593672A (en) * 2020-03-23 2021-10-06 Nokia Technologies Oy Switching between audio instances

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108633A (en) * 1996-05-03 2000-08-22 Lsi Logic Corporation Audio decoder core constants ROM optimization
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
US6522270B1 (en) * 2001-12-26 2003-02-18 Sun Microsystems, Inc. Method of coding frequently occurring values
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
EP1914722B1 (en) * 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
EP1735774B1 (en) * 2004-04-05 2008-05-14 Koninklijke Philips Electronics N.V. Multi-channel encoder
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
JP4794448B2 (ja) * 2004-08-27 2011-10-19 パナソニック株式会社 オーディオエンコーダ
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
JP4610650B2 (ja) * 2005-03-30 2011-01-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャンネルオーディオ符号化
ATE421845T1 (de) * 2005-04-15 2009-02-15 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
JP4988716B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US8121836B2 (en) * 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
CN101248483B (zh) * 2005-07-19 2011-11-23 皇家飞利浦电子股份有限公司 多声道音频信号的生成
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
MY151722A (en) * 2006-07-07 2014-06-30 Fraunhofer Ges Forschung Concept for combining multiple parametrically coded audio sources
CA2874451C (en) * 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
CN101529504B (zh) * 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
EP2111616B1 (en) * 2007-02-14 2011-09-28 LG Electronics Inc. Method and apparatus for encoding an audio signal
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
ES2452348T3 (es) * 2007-04-26 2014-04-01 Dolby International Ab Aparato y procedimiento para sintetizar una señal de salida
CN101816191B (zh) * 2007-09-26 2014-09-17 弗劳恩霍夫应用研究促进协会 用于提取环境信号的装置和方法
ES2461601T3 (es) * 2007-10-09 2014-05-20 Koninklijke Philips N.V. Procedimiento y aparato para generar una señal de audio binaural
DE102007048973B4 (de) * 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
EP2082396A1 (en) * 2007-10-17 2009-07-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
WO2009084914A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US7733245B2 (en) * 2008-06-25 2010-06-08 Aclara Power-Line Systems Inc. Compression scheme for interval data
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
MX2011002626A (es) * 2008-09-11 2011-04-07 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para proveer un conjunto de pistas espaciales en base a una señal de microfono y aparato para proveer una señal de audio de dos canales y un conjunto de pistas especiales.
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
CN105225667B (zh) * 2009-03-17 2019-04-05 杜比国际公司 编码器系统、解码器系统、编码方法和解码方法
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
EP2446435B1 (en) * 2009-06-24 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
TWI443646B (zh) * 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012125855A1 (en) * 2011-03-16 2012-09-20 Dts, Inc. Encoding and reproduction of three dimensional audio soundtracks
WO2012177067A2 (ko) 2011-06-21 2012-12-27 삼성전자 주식회사 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
KR20130093798A (ko) * 2012-01-02 2013-08-23 한국전자통신연구원 다채널 신호 부호화 및 복호화 장치 및 방법
WO2013192111A1 (en) * 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
KR101729930B1 (ko) * 2013-02-14 2017-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법
US10199044B2 (en) * 2013-03-20 2019-02-05 Nokia Technologies Oy Audio signal encoder comprising a multi-channel parameter selector
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder

Also Published As

Publication number Publication date
US20230005489A1 (en) 2023-01-05
ES2655046T3 (es) 2018-02-16
TWI571866B (zh) 2017-02-21
US20180197553A1 (en) 2018-07-12
US20160232901A1 (en) 2016-08-11
PL3061087T3 (pl) 2018-05-30
ZA201603298B (en) 2019-09-25
US11393481B2 (en) 2022-07-19
WO2015058991A1 (en) 2015-04-30
PT3061087T (pt) 2018-03-01
EP2866227A1 (en) 2015-04-29
BR112016008787B1 (pt) 2022-07-12
RU2016119546A (ru) 2017-11-28
BR112016008787A2 (zh) 2017-08-01
US10468038B2 (en) 2019-11-05
AR098152A1 (es) 2016-05-04
JP2016538585A (ja) 2016-12-08
EP3061087A1 (en) 2016-08-31
CN105723453B (zh) 2019-11-08
AU2014339167A1 (en) 2016-05-26
MY176779A (en) 2020-08-21
CA2926986A1 (en) 2015-04-30
RU2648588C2 (ru) 2018-03-26
EP3061087B1 (en) 2017-11-22
CN110675882B (zh) 2023-07-21
JP6313439B2 (ja) 2018-04-25
MX2016004924A (es) 2016-07-11
SG11201603089VA (en) 2016-05-30
MX353997B (es) 2018-02-07
CN110675882A (zh) 2020-01-10
KR101798348B1 (ko) 2017-11-15
CN105723453A (zh) 2016-06-29
AU2014339167B2 (en) 2017-01-05
KR20160073412A (ko) 2016-06-24
US20200090666A1 (en) 2020-03-19
CA2926986C (en) 2018-06-12
US11922957B2 (en) 2024-03-05
US9947326B2 (en) 2018-04-17

Similar Documents

Publication Publication Date Title
TWI571866B (zh) 解碼及編碼下混矩陣之方法、呈現音訊內容之方法、用於下混矩陣之編碼器及解碼器、音訊編碼器及音訊解碼器
JP6750061B2 (ja) エンコードされたオーディオメタデータベースのイコライゼーション
ES2645674T3 (es) Procedimiento y unidad de procesamiento de señales para mapear una pluralidad de canales de entrada de una configuración de canales de entrada con canales de salida de una configuración de canales de salida
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
RU2643644C2 (ru) Кодирование и декодирование аудиосигналов
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
JP6346278B2 (ja) ジョイント符号化残留信号を用いたオーディオエンコーダ、オーディオデコーダ、方法、およびコンピュータプログラム
JP6134867B2 (ja) レンダラ制御式空間アップミックス
US20170098452A1 (en) Method and system for audio processing of dialog, music, effect and height objects
CN107077861B (zh) 音频编码器和解码器
KR20090033720A (ko) 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치