TWI584271B - 編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式 - Google Patents

編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式 Download PDF

Info

Publication number
TWI584271B
TWI584271B TW105105526A TW105105526A TWI584271B TW I584271 B TWI584271 B TW I584271B TW 105105526 A TW105105526 A TW 105105526A TW 105105526 A TW105105526 A TW 105105526A TW I584271 B TWI584271 B TW I584271B
Authority
TW
Taiwan
Prior art keywords
channel
channels
mch
processing
pair
Prior art date
Application number
TW105105526A
Other languages
English (en)
Other versions
TW201642248A (zh
Inventor
薩斯洽 迪克
弗羅里恩 史庫
尼可拉斯 里特貝屈
陶比亞斯 史屈瓦格勒
李查 弗格
強尼斯 希爾佩特
曼薩斯 紐新傑
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201642248A publication Critical patent/TW201642248A/zh
Application granted granted Critical
Publication of TWI584271B publication Critical patent/TWI584271B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式
本發明係關於音源編碼/解碼,特別關於利用聲道內訊號相依(inter-channel signal dependencies)之音源編碼。
音源編碼係為壓縮域並處理利用在音源訊號中的冗餘(redundancy)及無關係(irrelevancy)。在MPEG USAC[ISO/IEC 23003-3:2012-Information technology-MPEG audio technologies Part 3:Unified speech and audio coding]中,兩聲道之聯合立體聲編碼係藉由使用複預測(complex prediction)、MPS 2-1-2或統一立體聲連同有限頻帶或全頻帶殘餘訊號而進行。MPEG surround[ISO/IEC 23003-1:2007-Information technology-MPEG audio technologies Part 1:MPEG Surround]係針對多聲道音源的聯合編碼而等級地結合OTT與TTT盒(OTT and TTT boxes)並且是在有或沒有殘餘訊號的傳輸之下。MPEG-H四聲道元件(Quad Channel Elements)係等級地應用MPS 2-1-2立體聲盒,而建立一固定的4*4再混合樹之複預測/MS立體聲盒係接在其後。AC4[ETSI TS 103 190 V1.1.1(2014-04)-Digital Audio Compression(AC-4)Standard]係引入新的3-、4-、5-聲道元件,其係考慮到經由一被傳輸之混合矩陣與後續的聯合立體聲編碼資訊而再混合被傳輸聲道。此外,先前技術係建議使用正交轉換,就如針對增強之多聲道音源編碼之Karhunen-Loeve轉換(KLT)[Yang,Dai and Ai,Hongmei and Kyriakakis,Chris and Kuo,C.-C.Jay,2001:Adaptive Karhunen-Loeve Transform for Enhanced Multichannel Audio Coding,http://ict.usc.edu/pubs/Adaptive%20Karhunen-Loeve%20Transform%20for%20 Enhanced %20Multichannel%20Audio%20Coding.pdf]。
在3D音源上下文中,擴音器聲道係分佈在多個高度層中,並導致水平與垂直的聲道對。僅有兩個聲道之聯合編碼,就如在USAC中所定義的,並不足以考慮到聲道之間的空間及感知關係。環繞MPEG(MPEGSurround)係應用於一額外的預/後處理步驟,殘餘訊號係在沒有聯合立體聲編碼的可能性之下,被個別傳輸,以例如利用在左與右垂直殘餘訊號之間的相依。在AC-4中,專用的N聲道元件係被引入以考慮到聯合編碼參數的高效率編碼,但無法考慮到具有更多聲道之一般擴音器設定,其係針對新的浸入錄放場景(7.1+4,22.2)而被提出。MPEG-H四聲道元件(Quad Channel Elements)亦被限制在僅僅4個聲道並且無法被動態地應用在任意的聲道而只能應用在一預配置且固定數量的聲道。
本發明之一目的係在於提供一改良的編碼/解碼概念。
該目的係藉由依據申請專利範圍第1項之一裝置而達到,該裝置係為了編碼具有至少三個聲道之一多聲道訊號;或藉由依據申請專利範圍第12項之一裝置而達到,該裝置係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號;或藉由依據申請專利範圍第21項之一方法而達到,該方法係為了編碼具有至少三個聲道之一多聲道訊號;或藉由依據申請專利範圍第22項之一方法而達到,該方法係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號;或藉由依據申請專利範圍第23項之一電腦程式而達到。
實施例係提供為了編碼具有至少三個聲道之一多聲道訊號之一裝置。該裝置包含一疊代處理器、一聲道編碼器及一輸出介面。疊代處理器係用以在一第一疊代步驟中計算在該至少三個聲道之各對之間之聲道內相關值,以為了在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值的一對,並且為了藉由使用一多聲道處理作業而處理該被選擇之對,以得到針對該被選擇之對之多個第一多聲道參數並得到多個第一被處理聲道。此外,該疊代處理器係用以在一第二疊代步驟中藉由使用該等被處理聲道之至少一而執行該計算、該選擇及該處理,以得到多個第二多 聲道參數與第二被處理聲道。聲道編碼器係用以編碼聲道以得到被編碼聲道,該等聲道係從藉由疊代處理器所執行之一疊代處理而產生。該輸出介面係用以產生具有該等被編碼聲道與該等第一及第二多聲道參數之一被編碼多聲道訊號。
另外,實施例係提供為解碼一被編碼多聲道訊號之一裝置,該被編碼多聲道訊號係具有被編碼聲道與至少第一及第二多聲道參數。該裝置包含一聲道解碼器以及一多聲道處理器。聲道解碼器係用以解碼該等被編碼聲道以得到被解碼聲道。該多聲道處理器係用以藉由使用由第二多聲道參數所識別之被解碼聲道之一第二對與藉由使用該等第二多聲道參數而執行一多聲道處理,以得到被處理聲道並藉由使用由第一多聲道參數所識別之聲道之一第一對及使用該等第一多聲道參數而執行另一多聲道處理,其中聲道之該第一對係包含至少一被處理聲道。
與使用一固定訊號路徑(例如立體聲編碼樹)之常見的多聲道編碼概念相比,本發明的實施例係使用一動態訊號路徑,其係適應於多聲道輸入訊號之該至少三個輸入聲道之特性。詳細地說,疊代處理器102係可適應於在該第一疊代步驟中並基於在該至少三個聲道CH1~CH3之各對之間之一聲道內相關值而建立該訊號路徑(例如立體聲樹),以在該第一疊代步驟中選擇具有該最高值或超過一閥值之一值之一對,並且在該第二疊代步驟中並基於在該至少三個聲道之各對與對應先前被處理聲道之間之聲道內相關值,而在該第二疊代步驟中選擇具有該最高值或超過一閥值之一值之一對。
更有實施例係提供一方法以編碼具有至少三聲道之一多聲道訊號。該方法包含:●在一第一疊代步驟中,計算在該至少三聲道之各對之間的聲道內相關值,並在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對,以及藉由使用一多聲道處理作業而處理該被選擇之對,以得到為了該被選擇之對之第一多聲道參數並得到第一被處理聲道;●在一第二疊代步驟中並藉由使用該等被處理聲道之至少一而執 行該計算、該選擇及該處理,以得到第二多聲道參數及第二被處理聲道;●編碼由藉由該疊代處理器所執行之一疊代處理所產生之聲道以得到被編碼聲道;以及●產生具有該等被編碼聲道與該等第一及第二多聲道參數之一被編碼多聲道訊號。
更有實施例係提供一方法以解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。該方法包含:●解碼該等被編碼聲道以得到被解碼聲道;及●藉由使用由該等第二多聲道參數所識別之該等被解碼聲道之一第二對並藉由使用該等第二多聲道參數而執行一多聲道處理以得到被處理聲道,並且藉由使用由該等第一多聲道參數所識別之聲道之一第一對並藉由使用該等第一多聲道參數而執行另一多聲道處理,其中聲道之該第一對係包含至少一被處理聲道。
100‧‧‧裝置(編碼器)
101‧‧‧多聲道訊號
102‧‧‧疊代處理器
104‧‧‧聲道編碼器
106‧‧‧輸出介面
107‧‧‧多聲道訊號
110、112、114、116‧‧‧立體聲盒、立體聲工具、處理盒
120_1~120_3‧‧‧單音編碼器
200‧‧‧裝置(解碼器)
202‧‧‧聲道解碼器
204‧‧‧多聲道處理器
206_1~206_3‧‧‧單音解碼器
212‧‧‧輸入介面
300、400‧‧‧方法
302、304、306、308、402、404‧‧‧步驟
C‧‧‧中間聲道
CH1~CH3‧‧‧聲道
D1~D3‧‧‧被解碼聲道
E1~E3‧‧‧被編碼聲道
I1、I2‧‧‧輸入訊號
L‧‧‧左聲道
LFE‧‧‧低頻效用聲道
Ls‧‧‧左環繞聲道
MCH_PAR1‧‧‧第一多聲道參數
MCH_PAR2‧‧‧第二多聲道參數
O1、O2‧‧‧輸出訊號
P1~P8、P1*~P4*‧‧‧被處理聲道
R‧‧‧右聲道
Rs‧‧‧右環繞聲道
S1~S4‧‧‧s-參數
圖中示意地出示:圖1係為本發明一實施例之一裝置的方塊示意圖,其係為編碼具有至少三聲道之一多聲道訊號。
圖2係為本發明一實施例之一裝置的方塊示意圖,其係為編碼具有至少三聲道之一多聲道訊號。
圖3為本發明一實施例之一立體聲盒之一方塊示意圖。
圖4為本發明一實施例之一裝置的方塊示意圖,其係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。
圖5為本發明一實施例之一方法的流程圖,其係為編碼具有至少三聲道之一多聲道訊號。
圖6為本發明一實施例之一方法的流程圖,其係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。
具有相等或等效功能之相等或等效元件係在下面的敘述中以相等或等效的參考標號來表示。
在下面的敘述中,多個細節被提出以提供對本發明之實壽例之一更完全的解釋。然而,對於該項領域具有通常知識者是明顯的,本發明之實施例可不具有這些特定的細節。在其他例子中,熟知的結構及構件係以方塊形式來顯示而不顯示其細節,以避免使本發明之實施例模糊。此外,以下所描述之不同實施例的特徵可相互結合,除非有特定例外的說明。
圖1係為本發明一實施例之一裝置(編碼器)100的方塊示意圖,其係為編碼具有至少三聲道CH1~CH3之一多聲道訊號101。裝置100係包含一疊代處理器102、一聲道編碼器104以及一輸出介面106。
疊代處理器102係用以在一第一疊代步驟中計算在該至少三個聲道CH1~CH3之各對之間之聲道內相關值,以為了在第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值的一對,並且為了藉由使用一多聲道處理作業而處理該被選擇之對,以得到針對該被選擇之對之多個第一多聲道參數MCH_PAR1並得到多個第一被處理聲道P1、P2。此外,該疊代處理器102係用以在一第二疊代步驟中藉由使用該等被處理聲道P1、P2之至少一而執行該計算、該選擇及該處理,以得到多個第二多聲道參數MCH_PAR2與第二被處理聲道P3、P4。
舉例來說,如圖1所示,疊代處理器102可在第一疊代步驟中計算在該至少三聲道CH1~CH3之一第一對之間之一聲道內相關值、在該至少三聲道CH1~CH3之一第二對之間之一聲道內相關值、及在該至少三聲道CH1~CH3之一第三對之間之一聲道內相關值,其中該第一對係由一第一聲道CH1與一第二聲道CH2組成,該第二對係由第二聲道CH2與一第三聲道CH3組成,該第三對係由第一聲道CH1與第三聲道C3組成。
在圖1中,其係假設由第一聲道CH1與第三聲道C3組成之該第三對具有最高聲道內相關值,如此該疊代處理器102係在第一疊代步驟中選擇具有最高聲道內相關值之該第三對並且藉由使用一多聲道處理作業來處理該被選擇之對,亦即該第三對,以得到針對該被選擇之對之第一多聲道參數MCH_PAR1並且得到第一被處理聲道P1、P2。
此外,疊代處理器102係可用以在第二疊代步驟中計算在至少三聲道CH1~CH3之各對之間之聲道內相關值與被處理聲道P1、P2,以為了在第二疊代步驟中選擇具有一最高聲道內相關值或具有超過一閥值之一值之一對。藉此,疊代處理器102可用以在第二疊代步驟中(或在任何另外的疊代步驟中)不選擇該第一疊代步驟之被選擇之對。
關於圖1所示之例子,疊代處理器102可更計算聲道之由第一聲道CH1與第一被處理聲道P1所組成之一第四對之間之一聲道內相關值、由第一聲道C1與第二被處理聲道P2所組成之一第五對之間之一聲道內相關值、由第二聲道C2與第一被處理聲道P1所組成之一第六對之間之一聲道內相關值、由第二聲道C2與第二被處理聲道P2所組成之一第七對之間之一聲道內相關值、由第三聲道C3與第一被處理聲道P1所組成之一第八對之間之一聲道內相關值、由第三聲道C3與第二被處理聲道P2所組成之一第九對之間之一聲道內相關值、以及由第一被處理聲道P1與第二被處理聲道P2所組成之一第十對之間之一聲道內相關值。
在圖1中,其係假設在第二疊代步驟中由第二聲道CH2與第一被處理聲道P1所組成之該第六對具有最高聲道內相關值,如此該疊代處理器102係在第二疊代步驟中選擇該第六對並且藉由使用一多聲道處理作業來處理該被選擇之對,亦即該第六對,以得到針對該被選擇之對之第二多聲道參數MCH_PAR2並且得到第二被處理聲道P3、P4。
疊代處理器102可用以僅選擇一對,當該對之程度差(level difference)小於一閥值時。該閥值係小於40dB、25dB、12dB、或小於6dB。藉此,25dB或40dB之閥值係對應3度或0.5度之旋轉角度。
疊代處理器102可用以計算正規化整數相關值。其中疊代處理器102可用以選擇一對,當整數相關值係大於例如0.2或較佳0.3時。
此外,疊代處理器102可提供由多聲道處理所產生之聲道給聲道編碼器104。舉例來說,請參照圖1,疊代處理器102可提供由在第二疊代步驟中執行之多聲道處理所產生之第三被處理聲道P3及第四被處理聲道P4並提供由在第一疊代步驟中所執行之多聲道處理所產生之第二被處理聲道P2給聲道編碼器104。藉此,疊代處理器102可僅提供那些未在一後 續疊代步驟中被(另外)處理之被處理聲道給聲道編碼器104。如圖1所示,第一被處理聲道P1未被提供給聲道編碼器104,這是由於它在第二疊代步驟中被另外處理。
聲道編碼器104可用以編碼由該疊代處理器102所執行之疊代處理(或多聲道處理)所產生之聲道P2~P4,以得到被編碼聲道E1~E3。
舉例來說,聲道編碼器104可用以使用單音編碼器(或單音盒或單音工具)120_1~120_3來編碼由疊代處理(或多聲道處理)所產生之聲道P2~P4。該等單音盒可用以編碼該等聲道,如此與編碼具有較高能量(或一較高振幅)之一聲道相比,編碼具有較少能量(或一較小振幅)之一聲道可需要較少的位元。單音盒120_1~120_3可例如為運用轉換音源編碼器(transformation based audio encoders)。此外,聲道編碼器104可用以使用立體聲編碼器(例如參數立體聲編碼器(parametric stereo encoders)、或耗損立體聲編碼器(lossy stereo encoders))來編碼由疊代處理(或多聲道處理)所產生之聲道P2~P4。
輸出介面106可用以產生被編碼之多聲道訊號107,被編碼之多聲道訊號107係具有被編碼聲道E1~E3以及第一與第二多聲道參數MCH_PAR1、MCH_PAR2。
舉例來說,輸出介面106可用以產生被編碼多聲道訊號107而作為一串列訊號(serial signal)或串列位元流(serial bit stream),並且如此該第二多聲道參數MCH_PAR2係在第一多聲道參數MCH_PAR1之前而在被編碼訊號107內。如此,一解碼器,會在以下配合圖4說明之一實施例,將會在第一多聲道參數MCH_PAR1之前接收第二多聲道參數MCH_PAR2。
在圖1中,疊代處理器102係例示地執行兩個多聲道處理作業,其中一多聲道處理作業係在第一疊代步驟,而另一多聲道處理作業係在第二疊代步驟。自然地,疊代處理器102亦可後續的疊代步驟中執行另外的多聲道處理作業。藉此,疊代處理器102可用以執行疊代步驟直到一疊代終止判定標準被達到。疊代終止判定標準可係為疊代步驟之一最大數量與多聲道訊號101之聲道之一總數量相等或高過多聲道訊號101之聲道 之一總數量兩個,或者疊代終止判定標準可係為當聲道內相關值不具有大於閥值之一值時成立,而閥值較佳可大於0.2或等於0.3。在其他實施例中,疊代終止標準可係為疊代步驟之一最大數量與多聲道訊號101之聲道之一總數量相等或高過多聲道訊號101之聲道之一總數量,或者疊代終止判定標準可係為當聲道內相關值不具有大於閥值之一值時成立,而閥值較佳可大於0.2或等於0.3。
為了說明目的,由疊代處理器102在第一疊代步驟與第二疊代步驟中所執行之多聲道處理作業係例示地由圖1及處理盒110、112來說明。處理盒110、112可以硬體或軟體實現。處理盒110、112可例如為立體聲盒。
藉此,聲道內訊號相依可藉由等級地應用已知的聯合立體聲編碼工具而被利用。與先前的MPEG方式相比,要被處理之訊號對不是由一固定訊號路徑(例如立體聲編碼樹)來預先確定,而是可被動態地改變以適應於輸入訊號特性。實際立體聲盒之輸入可為(1)未處理聲道,例如聲道CH1~CH3、(2)一前立體聲盒之輸出,例如被處理之訊號P1~P4、或(3)一未處理聲道與一前立體聲盒之一輸出之一結合。
在立體聲盒110、112內的處理可為運用預測的(prediction based)(例如在USAC中的複預測盒)或運用KLT/PCA的(KLT/PCA based)(輸入聲道係在編碼器中被旋轉(例如經由一2x2旋轉矩陣)以最大化能量濃縮,亦即將訊號能量集中於一聲道內,在解碼器內該等被旋轉訊號將會再轉換到原有輸入訊號方向)。
在編碼器100之一可能的實現中,(1)該編碼器係計算在各聲道對之間之一聲道內相關並從輸入訊號選擇一合適的訊號對,並且應用立體聲工具到被選擇聲道;(2)該編碼器係再計算在所有聲道(未處理聲道及被處理之中間輸出聲道)之間之聲道內相關並從輸入訊號選擇一合適的訊號對,並且應用立體聲工具到被選擇聲道;以及(3)該編碼器係重覆步驟(2)直到所有聲道內相關係低於一閥值或假使轉換之一最大數量被應用。
如前所述,要被編碼器100,更精確來說是疊代處理器102,所處理之訊號對並未由一固定訊號路徑(例如立體聲編碼樹)所確定,而 是可以動態地改變以適應於輸入訊號特性。藉此,編碼器100(或疊代處理器102)可用以依據多聲道(輸入)訊號101之至少三聲道CH1~CH3而建立該立體聲樹。換言之,編碼器100(或疊代處理器102)可用以基於一聲道內相關而建立立體聲樹(例如藉由在第一疊代步驟中計算在該至少三聲道CH1~CH3之各對之間之聲道內相關值,以為了在第一疊代步驟中選擇具有最高值或超過一閥值之一值之一對,並且藉由在一第二疊代步驟中計算在該至少三聲道之各對之間之聲道內相關值以為了在第二疊代步驟中選擇具有最高值或超過一閥值之一值之一對)。依據一單一步驟方法,一相關矩陣可針對可能包含所有在先前疊代中可能被處理之聲道之相關之各疊代而被計算。
如前所述,疊代處理器102可用以在第一疊代步驟中得到針對被選擇之對之第一多聲道參數MCH_PAR1並在第二疊代步驟中得到針對被選擇之對之第二多聲道參數MCH_PAR2。第一多聲道參數MCH_PAR1可包含一第一聲道對識別(或索引),其可識別(或標示)在第一疊代步驟中被選擇之聲道對,其中第二多聲道參數MCH_PAR2可包含一第二聲道對識別(或索引),其可識別(或標示)在第二疊代步驟中被選擇之聲道對。
以下係描述輸入訊號之一高效率索引。舉例來說,聲道對可藉由依據聲道的總數量使用針對各對之獨一的索引而被有效地標示。舉例來說,針對六聲道之對之索引可以下表顯示:
舉例來說,在上表中,索引5可標示由第一及第二聲道組成之對。相似地,索引6可標示由第一及第三聲道組成之對。
針對n個聲道之可能聲道對索引的總數量可計算如下: numPairs=numChannels*(numChannels-1)/2
因此,需要用來標示一聲道對的位元量係如下:numBits=floor(log2(numPairs-1))+1
此外,編碼器100可使用一聲道遮罩。多聲道工具之配置可包含一聲道遮罩用以指示該工具對於哪些聲道是有效的。如此,在考慮到一個更有效率的編碼,LFEs(LFE=低頻效應/增強聲道(low frequency effects/enhancement channels))可從該聲道對索引中移除。例如,對於一個11.1設定,這可使聲道對索引的數量從12*11/2=66減少到11*10/2=55,在容許標示具有6位元而非7位元的情況下。此機制亦可被用來排除用來作為單音物件(例如多語言音軌)之聲道。在聲道遮罩之解碼上,一聲道圖(channelMap)可被產生以容許聲道對索引再映像(re-mapping)至解碼器聲道。
此外,疊代處理器102可用以得到針對一第一訊框(frame)之複數被選擇對指示,其中輸出介面106可用以包含一保持指示器,其係轉入多聲道訊號107並針對接在第一訊框之後之一第二訊框,並且指示第二訊框具有與第一訊框相同多個被選擇對指示。
保持指示器或保持樹旗標可用以標示沒有新的樹被傳送,但是最後的立體聲樹應被使用。假使聲道相關性在一段較長時間維持不變,這可用來避免相同的立體聲樹配置之多重傳送。
圖2係顯示一立體聲盒110、112之一示意方塊圖。立體聲盒110、112包含針對一第一輸入訊號I1與一第二輸入訊號I2之輸入並包含針對一第一輸出訊號O1與一第二輸出訊號O2之輸出。如圖2所示,從輸入訊號I1、I2之輸出訊號O1、O2之相依可藉由s-參數S1~S4來描述。
疊代處理器102可使用(或包含)立體聲盒110、112以執行在輸入聲道及/或被處理聲道上之多聲道處理作業,以得到(另外的)被處理聲道。舉例來說,疊代處理器102可用以使用一般的、運用預測的或運用KLT(Karhunen-Loève-Transformation)之旋轉立體聲盒110、112。
一種一般性的編碼器(或編碼器側之立體聲盒)可用以編碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2:
一種一般性的解碼器(或解碼器側之立體聲盒)可用以解碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2:
一種運用預測之編碼器(或編碼器側之立體聲盒)可用以編碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2: ,其中p係為預測係數。
一種運用預測之解碼器(或解碼器側之立體聲盒)可用以解碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2:
一種運用KLT之旋轉編碼器(或編碼器側之立體聲盒)可用以編碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2:
一種運用KLT之旋轉解碼器(或解碼器側之立體聲盒)可用以解碼輸入訊號I1、I2以得到基於下列方程式之輸出訊號O1、O2(反向旋轉):
以下係描述針對運用KLT之旋轉之旋轉角度α之一計算。
針對運用KLT之旋轉之旋轉角度α可定義如下: ,其中c xy 係為一非正規化相關矩陣之元素(entries),其中c 11c 22係為聲道能量。
這可藉由使用atan2函數而被實現,以考慮到在分子中的負相關之間之區別以及在分母中的負能量差:alpha=0.5*atan2(2*correlation[ch1][ch2],(correlation[ch1][ch1]-correlation[ch2][ch2]));此外,疊代處理器102可用以藉由使用包含複數頻帶之各聲道之一訊框而計算一聲道內相關,藉此可得到針對該等頻帶之一單一聲道內相關值,其中疊代處理器102可用以執行針對各該等頻帶之多聲道處理,使得該第一或第二多聲道參數可從各該等頻帶被得到。
藉此,疊代處理器102可用以計算在多聲道處理中之立體聲參數,其中疊代處理器102可用以在多個頻帶中僅執行一立體聲處理,其中一立體聲參數係高於由一立體聲量化器(例如運用KLT之旋轉編碼器)所定義之一量化到零(quantized-to-zero)閥值。立體聲參數可例如為MS On/Off、或旋轉角度、或預測係數。
舉例來,疊代處理器102可用以計算在多聲道處理中之旋轉角度,其中疊代處理器102可用以在多個頻帶中僅執行一旋轉處理,其中一旋轉角度係高於由一立體聲量化器(例如運用KLT之旋轉編碼器)所定義之一量化到零(quantized-to-zero)閥值。
如此,編碼器100(或輸出介面106)可用以傳輸該轉換/旋轉資訊,其可作為針對完整頻譜(全頻盒(full band box))之一參數或針對部分頻譜之多個頻率相依參數。
編碼器100可用以基於下表而產生位元流107:
圖3係顯示依據一實施例之一疊代處理器102之一示意的方塊示意圖。在圖3所示之實施例中,多聲道訊號101係為一5.1聲道訊號, 其具有六聲道:一左聲道L、一右聲道R、一左環繞聲道Ls、一右環繞聲道Rs、一中間聲道C以及一低頻效用(low frequency effects)聲道LFE。
如圖3所示,LFE聲道並未被疊代處理器102處理。這可能是由於在LFE聲道與各其他五個聲道L、R、Ls、Rs、C之間之之聲道內相關值太小,或是由於聲道遮罩指示不要處理LFE聲道,這在下面敘述中會被假設。
在一第一疊代步驟中,疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間之聲道內相關值,以在第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中,其係假設左聲道L與右聲道R具有最高值,使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)110,其係執行多聲道作業處理作業,而處理左聲道L與右聲道R,以得到第一及第二被處理聲道P1、P2。
在一第二疊代步驟中,疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間與被處理聲道P1、P2之間之聲道內相關值,以在第二疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中,其係假設左環繞聲道Ls與右環繞聲道Rs具有最高值,使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)112而處理左環繞聲道Ls與右環繞聲道Rs,以得到第三及第四被處理聲道P3、P4。
在一第三疊代步驟中,疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間與被處理聲道P1~P4之間之聲道內相關值,以在第三疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中,其係假設第一被處理聲道P1與第三被處理聲道P3具有最高值,使得疊代處理器102係藉由使用一立體聲盒(或立體聲工具)114而處理第一被處理聲道P1與第三被處理聲道P3,以得到第五及第六被處理聲道P5、P6。
在一第四疊代步驟中,疊代處理器102係計算五個聲道L、R、Ls、Rs、C之各對之間與被處理聲道P1~P6之間之聲道內相關值,以在第四疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對。在圖3中,其係假設第五被處理聲道P5與中間聲道C具有最高值,使得疊代 處理器102係藉由使用一立體聲盒(或立體聲工具)115而處理第五被處理聲道P5與第中間聲道C,以得到第七及第八被處理聲道P7、P8。
立體聲盒110~116可為MS立體聲盒,亦即中側立體聲盒(mid/side stereophony boxes),其係用以提供一中聲道與一側聲道。中聲道可為立體聲盒之輸入聲道之總和,其中側聲道可為立體聲盒之輸入聲道之間之差。此外,立體聲盒110、116可為旋轉盒或立體聲預測盒。
在圖3中,第一被處理聲道P1、第三被處理聲道P3與第五被處理聲道P5可皆為中聲道,其中第二被處理聲道P2、第四被處理聲道P4與第六被處理聲道P6可皆為側聲道。
另外,如圖3所示,疊代處理器102可用以執行在該第二疊代步驟中之該計算、該選擇及該處理,並且假使可行,在任何另外的疊代步驟中使用輸入聲道L、R、Ls、Rs、C及被處理聲道之(僅僅)中聲道P1、P3、P5。換言之,疊代處理器102可被配置為在第二疊代步驟中之該計算、該選擇及該處理中不使用被處理聲道之側聲道P2、P4、P6,並且假使可行的話,這可應用在任何其他疊代步驟中。
圖4係顯示一裝置(解碼器)200之一示意方塊圖,其係為了解碼具有被編碼聲道E1~E3以及至少第一與第二多聲道參數MCH_PAR1、MCH_PAR2之一被編碼多聲道訊號107。裝置200係包含一聲道解碼器202與一多聲道處理器204。
聲道解碼器202係用以解碼該等被編碼聲道E1~E3以得到被解碼聲道D1~D3。
舉例來說,聲道解碼器202可包含至少三單音解碼器(或單音盒、或單音工具)206_1~206_3,其中各單音解碼器206_1~206_3可用以解碼至少三被編碼聲道E1~E3之其中之一,以得到各別的被解碼聲道D1~D3。單音解碼器206_1~206_3可例如為運用轉換之音源解碼器。
多聲道處理器204係用以藉由使用由第二多聲道參數MCH_PAR2所定義之被解碼聲道之一第二對並藉由使用第二多聲道參數MCH_PAR2來執行一多聲道處理,以得到被處理聲道,並用以藉由使用由第一多聲道參數MCH_PAR1所定義之聲道之一第一對並藉由使用第一多聲 道參數MCH_PAR1來執行另一多聲道處理,其中聲道之第一對係包含至少一被處理聲道。
如圖4所示之例子,第二多聲道參數MCH_PAR2可指示(或標示)被解碼聲道之第二對係由第一被解碼聲道D1及第二被解碼聲道D2所組成。如此,多聲道處理器204係藉由使用由第一被解碼聲道D1及第二被解碼聲道D2(由第二多聲道參數MCH_PAR2所定義)所組成之被解碼聲道之第二對並藉由使用第二多聲道參數MCH_PAR2來執行一多聲道處理,以得到被處理聲道P1*、P2*。第一多聲道參數MCH_PAR1可指示被解碼聲道之第一對係由第一被處理聲道P1*及第三被解碼聲道D3所組成。如此,多聲道處理器204係藉由使用由第一被處理聲道P1*及第三被解碼聲道D3(由第一多聲道參數MCH_PAR1所定義)所組成之被解碼聲道之第一對並藉由使用第一多聲道參數MCH_PAR1來執行一多聲道處理,以得到被處理聲道P3*、P4*。
此外,多聲道處理器204可提供第三被處理聲道P3*作為第一聲道CH1、第四被處理聲道P4*作為第三聲道CH3、以及第二被處理聲道P2*作為第二聲道CH2。
假設圖4所示之解碼器200係從圖1所示之編碼器100接收被解碼之多聲道訊號107,解碼器200之第一被解碼聲道D1可等效於編碼器100之第三被處理聲道P3,其中解碼器200之第二被解碼聲道D2可等效於編碼器100之第四被處理聲道P4,並且其中該解碼器200之第三被解碼聲道D3可等效於編碼器100之第二被處理聲道P2。另外,解碼器200之第一被處理聲道P1*可等效於編碼器100之第一被處理聲道P1。
另外,被編碼之多聲道訊號107可為一串列訊號(serial signal),其中第二多聲道參數MCH_PAR2係在解碼器200並在第一多聲道參數MCH_PAR1之前被接收。在此狀況中,多聲道處理器204可用以依序處理被解碼聲道,其中該多聲道參數MCH_PAR1、MCH_PAR2係被解碼器所接收。在圖4所示之例子中,解碼器係在第一多聲道參數MCH_PAR1之前接收第二多聲道參數MCH_PAR2,並且如此藉由使用由第二多聲道參數MCH_PAR2所定義之被解碼聲道之第二對(由第一及第二被解碼聲道D1、 D2所組成)來執行多聲道處理,而這是在藉由使用由第一多聲道參數MCH_PAR1所定義之被解碼聲道之第一對(由第一被處理聲道P1*及第三被解碼聲道D3所組成)來執行多聲道處理之前進行的。
在圖4中,多聲道處理器204係示意地執行兩個多聲道處理作業。為了說明目的,由多聲道處理器204所執行之多聲道處理作業係以圖4及處理盒208、210來說明。處理盒208、210可以硬體或軟體實現。處理盒208、210可例如為立體聲盒,就如前關於編碼器100所述的,例如一般解碼器(或解碼器側之立體聲盒)、運用預測之解碼器(或解碼器側之立體聲盒)、或運用KLT之旋轉解碼器(或解碼器側之立體聲盒)。
舉例來說,編碼器100可使用運用KLT之旋轉編碼器(或編碼器側之立體聲盒)。在此狀況中,編碼器100可得到第一及第二多聲道參數MCH_PAR1、MCH_PAE2,使得第一及第二多聲道參數MCH_PAR1、MCH_PAE2包含旋轉角度。旋轉角度可為差分編碼(differentially encoded)。因此,解碼器200之多聲道處理器204可包含一差分解碼器以為了差分解碼該等被差分編碼之旋轉角度。
裝置200可更包含一輸入介面212,其係用以接收並處理被編碼之多聲道訊號107,以提供被編碼聲道E1~E3給聲道解碼器202並提供第一及第二多聲道參數MCH_PAR1、MCH_PAR2給多聲道處理器204。
就如前述,一保持指示器(或保持樹旗標)可被用來標示沒有新的樹要被傳送,但是最後的立體聲樹應被使用。假使聲道相關性在一段較長時間維持不變,這可用來避免相同的立體聲樹配置之多重傳送。
因此,當被編碼之多聲道訊號107包含針對一第一訊框之第一或第二多聲道參數MCH_PAR1、MCH_PAR2以及針對接在第一訊框之後一第二訊框之保持指示器時,多聲道處理器204可用以對如同在第一訊框所使用之聲道的第二對或第一對來執行在第二訊框之多聲道處理或另外的多聲道處理。
多聲道處理與另外的多聲道處理可包含使用一立體聲參數之一立體聲處理,其中針對各別比例因子頻帶(scale factor bands)或被解碼聲道D1~D3之比例因子頻帶之群組,一第一立體聲參數係被包含在第 一多聲道參數MCH_PAR1中並且一第二立體聲參數被包含在第二多聲道參數MCH_PAR2中。藉此,第一立體聲參數與第二立體聲參數可屬於相同類型,例如是旋轉角度或預測係數。自然地,第一立體聲參數與第二立體聲參數可屬於不同類別。舉例來說,第一立體聲參數可為一旋轉角度,第二立體聲參數可為一預測係數,反之亦可。
另外,第一或第二多聲道參數MCH_PAR1、MCH_PAR2可包含一多聲道處理遮罩,其係指示哪些比例因子頻帶經過多聲道處理以及哪些比例因子頻帶未經過多聲道處理。藉此,多聲道處理器204可用以不執行在由多聲道處理遮罩所指示之比例因子頻帶中之多聲道處理。
第一與第二多聲道參數MCH_PAR1、MCH_PAR2可各別包含一聲道對識別(或索引),其中多聲道處理器204可用以藉由使用一預定義之解碼規則或在被編碼之多聲道訊號中所指示之一解碼規則而解碼該聲道對識別(或索引)。
舉例來說,聲道對可藉由依據聲道之總數量來使用獨一的索引給各對而有效地被標示,就如上面關於編碼器100的敘述。
此外,解碼規則可為一Huffman解碼規則,其中該多聲道處理器204可用以執行聲道對識別之一Huffman解碼。
被編碼之多聲道訊號107可更包含一多聲道處理容許指示器,其係指示可容許多聲道處理之被解碼聲道之僅僅一子群組並且指示不容許多聲道處理之至少一被解碼聲道。藉此,多聲道處理器204可用以針對該至少一被解碼聲道不執行任何多聲道處理。對於該至少一被解碼聲道而言,多聲道處理未被容許,就如多聲道處理容許指示器所指示。
舉例來說,當多聲道訊號為一5.1聲道訊號,多聲道處理容許指示器可指示多聲道處理僅容許給5聲道,亦即右聲道R、左聲道L、右環繞聲道Rs、左環繞聲道Ls及中間聲道C,其中多聲道處理未被容許給LFE聲道。
對於解碼處理(聲道對索引之解碼),下面的c-code可被使用。藉此,對於所有的聲道對,聲道連同有效KLT處理的數量(nChannels)以及現在訊框之聲道對之數量(numPairs)是需要的。
對於解碼非關於頻帶之角度(non-bandwise angles)之預測係數,下列的c-code可被使用。
對於解碼非關於頻帶之KLT角度(non-bandwise KLT angles)之預測係數,下列的c-code可被使用。
為避免不同平台上之三角函數之浮點差異,可使用下面為了將角度索引直接轉成sin/cos之查找表。
為了多聲道編碼之解碼,下面為了運用KLT旋轉之方法之c-code可被使用。
為了關於頻帶之處理,可使用下面的c-code。
為了KLT旋轉之一應用,可使用下面的c-code。
圖5係顯示一方法300之一流程圖,其係為編碼具有至少三聲道之一多聲道訊號。方法300包含一步驟302,其係在一第一疊代步驟中計算該至少三聲道之各對之間之聲道內相關值,在第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對,並且藉由使用一多聲道處理作業而處理該被選擇之對以得到針對被選擇之對之第一多聲道參數並得到第一被處理聲道;一步驟304,其係在一第二疊代步驟中藉由使用被處理聲道之至少一而執行該計算、該選擇及該處理,以得到第二多聲道參數及第二被處理聲道;一步驟306,其係編碼從由疊代處理器執行之一疊代處理所產生之聲道以得到被編碼聲道;以及一步驟308,其係產生具有被編碼聲道及第一與第二多聲道參數之一被編碼多聲道訊號。
圖6係顯示一方法400之一流程圖,其係為解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號。方法400包含一步驟402,其係解碼被編碼聲道以得到被解碼聲道;以及一步驟404,其係藉由使用由第二多聲道參數所識別之被解碼聲道之一第二對並藉由使用第二多聲道參數而執行一多聲道處理,以得到被處理聲道,並且藉由使用由第一多聲道參數所識別之聲道之一第一對並藉由使用第一多聲道參數而 執行另一多聲道處理,其中聲道之第一對係包含至少一被處理聲道。
雖然本發明已經藉由方塊示意圖之上下文進行描述,其中該等方塊代表實際或邏輯硬體元件,但是本發明亦可藉由一電腦實現方法而被實現。在後面的例子中,該等方法代表對應的方法步驟,其中這些步驟係支持由對應邏輯或實體硬體方塊所執行之功能性。
雖然一些方法係藉由一裝置之上下文來進行描述,但是清楚地,這些方法亦代表對應方法之一描述,其中一方塊或裝置係對應一方法步驟或一方法步驟之一特徵。類似地,由一方法步驟之上下文所描述的方法亦代表一對應裝置之一對應方塊、項目或特徵之一描述。部皆或全部的方法步驟可藉由(或使用)一硬體裝置而被執行,例如一微處理器、一可編程電腦或一電子電路。在一些實施例中,最重要的方法步驟之某個或多個可藉由這樣的裝置來執行。
本發明之被傳送或被編碼的訊號可被儲存於一數位儲存媒介上或可被傳送在一傳輸媒介上,例如一無線傳輸媒介或一有線傳輸媒介,例如網路。
依據某些實現需求,本發明之實施例可以硬體或軟體實現。該實現可藉由使用一數位儲存媒介而執行,例如一軟碟、一DVD、一藍光、一CD、一唯讀記憶體、一可編程唯讀記憶體、可消除可編程唯讀記憶體、一電子式可消除可編程唯讀記憶體或一快閃記憶體,其具有電子式可讀控制訊號儲存於其上,並可與一可編程電腦系統合作(或能夠合作),使得各別方法可被執行。如此,數位儲存媒介可為電腦可讀。
本發明之一些實施例係包含具有電子式可讀控制訊號之一資料戴體,其係能夠與一可編程電腦系統合作,使得本發明之該些方法之其中之一可被執行。
一般而言,本發明之實施例可被實現如同一電腦程式產品連同一程式碼,當電腦程式產品執行於一電腦上時,該程式碼係可執行該些方法之一。程式碼可例如被儲存於一機械可讀載體上。
其他實施例係包含電腦程式,其係為了執行本發明之方法之其中之一並儲存於一機械可讀載體。
換言之,本發明之方法之一實施例係因此為具有一程式碼之一電腦程式,以為了當電腦程式執行於一電腦時,其係執行本發明方法之一。
本發明之方法之另一實施例係因此為一資料載體(或一非暫態儲存媒介例如一數位儲存媒介或一電腦可讀媒介),其係包含,記錄於其上,為執行本發明方法之一之電腦程式。資料載體、數位儲存媒介或被記錄媒介係為典型地具體及/或非暫態。
本發明方法之另一實施例係因此為一資料流或一訊號序列(sequence of signals),其係代表用以執行本發明方法之一之電腦程式。資料流或訊號序列可例如經由一資料通訊連接而被傳送,例如經由網路。
另一實施例包含一處理手段,例如一電腦或一可編程邏輯裝置,可被配置或被適應於執行本發明方法之其中之一。
另一實施例係包含一電腦,其係具有電腦程式安裝於其上用以執行本發明方法之一。
本發明另一實施例係包含一裝置或一系統,其係可傳移(例如以電子式或光學式)用以執行本發明方法之一之一電腦程式到一接收器。該接收器可例如為一電腦、一行動裝置、一記憶體裝置等等。裝置或系統可例如包含一檔案伺服器用以傳送電腦程式至接收器。
在一些實施例中,一可編程邏輯裝置(例如一現場可編程邏輯閘陣列)可被使用來執行本發明方法之部分或全部的功能性。在一些實施例中,一現場可編程邏輯閘陣列可與一微處理器合作以執行本發明方法之一。一般而言,該些方法較佳係藉由任何硬體裝置來執行。
以上所述僅為舉例性,而非為限制性者。任何未脫離本發明之精神與範疇,而對其進行之等效修改或變更,均應包含於後附之申請專利範圍中。
100‧‧‧裝置(編碼器)
101‧‧‧多聲道訊號
102‧‧‧疊代處理器
104‧‧‧聲道編碼器
106‧‧‧輸出介面
107‧‧‧多聲道訊號
110、112‧‧‧立體聲盒
120_1~120_3‧‧‧單音編碼器
CH1~CH3‧‧‧聲道
E1~E3‧‧‧被編碼聲道
MCH_PAR1‧‧‧第一多聲道參數
MCH_PAR2‧‧‧第二多聲道參數
P1~P4‧‧‧被處理聲道

Claims (27)

  1. 一種編碼裝置(100),其係用以編碼具有至少三聲道(CH1~CH3)之一多聲道訊號(101),包含:一疊代處理器(102),係用以在一第一疊代步驟中計算在該至少三聲道(CH1~CH3)之各對之間之聲道內相關值,以為了在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值的一對,並且為了藉由使用一多聲道處理作業(110,112)而處理該被選擇之對,以得到針對該被選擇之對之第一多聲道參數(MCH_PAR1)並得到多個第一被處理聲道(P1,P2),其中,該疊代處理器(102)係用以在一第二疊代步驟中藉由使用該等第一被處理聲道之至少一(P1)而執行該計算、該選擇及該處理,以得到第二多聲道參數(MCH_PAR2)與第二被處理聲道(P3,P4);一聲道編碼器,係用以編碼從由該疊代處理器(102)所執行之一疊代處理所產生之聲道(P2,P4)以得到被編碼聲道(E1,E3);以及一輸出介面(106),係用以產生具有該等被編碼聲道(E1,E3)與該等第一及第二多聲道參數(MCH_PAR1,MCH_PAR2)之一被編碼多聲道訊號(107)。
  2. 如申請專利範圍第1項所述之編碼裝置(100),其中該輸出介面(106)係用以產生該被編碼多聲道訊號(107)作為一串列位元流,並且該第二多聲道參數(MCH_PAR2)係在該第一多聲道參數(MCH_PAR1)之前而在該被編碼訊號中。
  3. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以執行包含一群組之至少一之立體聲處理,該群組具有從該被選擇之對使用一旋轉角度計算之旋轉處理與預測處理。
  4. 如申請專利範圍第1項所述之編碼裝置(100),其中該第一多聲道參數(MCH_PAR1)包含針對該第一疊代步驟並在該被選擇之對之聲道之一第一識別,以及該第二多聲道參數(MCH_PAR2)包含在該第二疊代步驟之一被選擇之對之該等聲道之一第二識別。
  5. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102) 係用以藉由使用包含複數頻帶之各聲道之一訊框而計算一聲道內相關,以得到針對該等頻帶之一單一聲道內相關值,並且其中該疊代處理器(102)係用以針對各該等頻帶執行該多聲道處理,以得到針對各該等頻帶之該第一或該第二多聲道參數(MCH_PAR1,MCH_PAR2)。
  6. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以得到針對一第一訊框之複數被選擇對指示,並且其中該輸出介面(106)係用以包含一保持指示器,其係轉入該被編碼多聲道訊號(107)並針對接在第一訊框之後之一第二訊框,並且指示該第二訊框具有與該第一訊框相同之多個被選擇對指示。
  7. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以僅選擇該等聲道之一對,當該等聲道之該對之程度差小於一閥值時,該閥值係小於40dB、25dB、12dB、或小於6dB。
  8. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以計算正規化相關值,並且當該相關值係大於0.2或較佳0.3時,該疊代處理器(102)係用以選擇該等聲道之一對。
  9. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以在該疊代處理中計算立體聲參數,並且其中該疊代處理器(102)係用以在多個頻帶中僅執行一立體聲處理,其中一立體聲參數係高於由一立體聲參數量化器所定義之一量化到零閥值。
  10. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以在該疊代處理中計算旋轉角度,並且其中疊代處理器(102)係用以在多個頻帶中僅執行一旋轉處理,其中一旋轉角度係高於一解碼器側量化到零閥值。
  11. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以在該第二疊代步驟中不選擇該第一疊代步驟之該被選擇對,並且假使可行的話,其任何另外的疊代步驟中亦不選擇。
  12. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以執行疊代步驟直到一疊代終止判定標準被達到,其中該疊代終止判定標準係為疊代步驟之一最大數量與該多聲道訊號(101)之聲道之 一總數量相等或高過該多聲道訊號(101)之聲道之一總數量兩個,或者其中該疊代終止判定標準係為當該等聲道內相關值不具有大於該閥值之一值時成立。
  13. 如申請專利範圍第1項所述之編碼裝置(100),其中該疊代處理器(102)係用以在該第一疊代步驟中藉由使用該多聲道處理而處理該被選擇對,使得該等被處理聲道(P1,P2)係為一中聲道(P1)及一側聲道(P2);以及其中該疊代處理器(102)係用以在該第二疊代步驟中並藉由僅僅使用該等被處理聲道(P1,P2)之該中聲道(P1)作為該等被處理聲道(P1,P2)之該至少一而執行該計算、該選擇及該處理,以得到該第二多聲道參數(MCH_PAR2)與第二被處理聲道(P3,P4)。
  14. 如申請專利範圍第1項所述之編碼裝置(100),其中該聲道編碼器包含子聲道編碼器(120_1~120_3)以編碼由該疊代處理所產生之該等聲道(P2~P4),其中該等子等聲道編碼器係用以編碼該等聲道(P2~P4),使得相較於編碼具有較多能量之一聲道,較少的位元係被使用來編碼具有較少能量之一聲道。
  15. 一種解碼裝置(200),係用以解碼一被編碼多聲道訊號(107),該被編碼多聲道訊號(107)係具有被編碼聲道(E1~E3)與至少第一及第二多聲道參數(MCH_PAR1,MCH_PAR2),該裝置(200)包含:一聲道解碼器(202),係用以解碼該等被編碼聲道(E1~E3)以得到被解碼聲道(D1~D3);以及一多聲道處理器(204),係用以藉由使用由該等第二多聲道參數(MCH_PAR2)所識別之該等被解碼聲道(D1~D3)之一第二對與藉由使用該等第二多聲道參數(MCH_PAR2)而執行一多聲道處理,以得到被處理聲道(P1*,P2*),並藉由使用由該等第一多聲道參數(MCH_PAR1)所識別之聲道(D1~D3,P1*,P2*)之一第一對及使用該等第一多聲道參數(MCH_PAR1)而執行另一多聲道處理,其中該等聲道之該第一對係包含至少一被處理聲道(P1*,P2*)。
  16. 如申請專利範圍第15項所述之解碼裝置(200),其中該被編碼多聲道訊 號(107)包含為了一第一訊框之該第一及該第二多聲道參數(MCH_PAR1,MCH_PAR2)以及為了在該第一訊框之後之一第二訊框之一保持指示器,並且其中該多聲道處理器(204)係用以對如同在該第一訊框所使用之聲道的第二對及第一對來執行在該第二訊框之該多聲道處理或該另一多聲道處理。
  17. 如申請專利範圍第15項所述之解碼裝置(200),其中該多聲道處理與該另一多聲道處理包含使用一立體聲參數之一立體聲處理,其中針對各別比例因子頻帶或該等被解碼聲道(D1~D3)之比例因子頻帶之群組,一第一立體聲參數係被包含在該第一多聲道參數(MCH_PAR1)中並且一第二立體聲參數被包含在該第二多聲道參數(MCH_PAR2)中。
  18. 如申請專利範圍第15項所述之解碼裝置(200),其中該第一或該第二多聲道參數(MCH_PAR1,MCH_PAR2)係包含一多聲道處理遮罩,其係指示哪些比例因子頻帶經過該多聲道處理以及哪些比例因子頻帶未經過該多聲道處理,並且其中該多聲道處理器(204)係用以不執行在由該多聲道處理遮罩所指示之比例因子頻帶中之該多聲道處理。
  19. 如申請專利範圍第15項所述之解碼裝置(200),其中該第一與該第二多聲道參數(MCH_PAR1,MCH_PAR2)係各別包含一聲道對識別,並且其中該多聲道處理器(204)係用以藉由使用一預定義之解碼規則或在被編碼之多聲道訊號中所指示之一解碼規則而解碼該等聲道對識別。
  20. 如申請專利範圍第19項所述之解碼裝置(200),其中該解碼規則係為一Huffman解碼規則,並且其中該多聲道處理器(204)係用以執行該等聲道對識別之一Huffman解碼。
  21. 如申請專利範圍第15項所述之解碼裝置(200),其中該被編碼之多聲道訊號(107)係更包含一多聲道處理容許指示器,其係指示可容許該多聲道處理之該等被解碼聲道之僅僅一子群組並且指示不容許該多聲道處理之至少一被解碼聲道,並且其中該多聲道處理器(204)係用以針對該至少一被解碼聲道不執行任何多聲道處理,對於該至少一被解碼聲道而言,該多聲道處理未被容許,就如該多聲道處理容許指示器所指示。
  22. 如申請專利範圍第15項所述之解碼裝置(200),其中該第一及第二多聲 道參數((MCH_PAR1,MCH_PAR2)係包含立體聲參數,並且其中該等立體聲參數係為差分編碼,並且其中該多聲道處理器(204)係包含一差分解碼器以為了差分解碼該等被差分編碼之立體聲參數。
  23. 如申請專利範圍第15項所述之解碼裝置(200),其中該被編碼之多聲道訊號(107)係為一串列訊號,其中該等第二多聲道參數(MCH_PAR2)係在該解碼器(200)並在該第一多聲道參數(MCH_PAR1)之前被接收,並且其中該多聲道處理器(204)係用以依序處理該等被解碼聲道(D1~D3),其中該等多聲道參數(MCH_PAR1,MCH_PAR2)係被該解碼器(200)接收。
  24. 一種編碼方法(300),其係為編碼具有至少三聲道之一多聲道訊號,該方法(300)包含:在一第一疊代步驟中計算(302)該至少三聲道之各對之間之聲道內相關值,在該第一疊代步驟中選擇具有一最高值或具有超過一閥值之一值之一對,並且藉由使用一多聲道處理作業而處理該被選擇之對以得到針對被選擇之對之第一多聲道參數並得到第一被處理聲道;在一第二疊代步驟中藉由使用該等第一被處理聲道之至少一而執行(304)該計算、該選擇及該處理,以得到第二多聲道參數及第二被處理聲道;編碼(306)從由該疊代處理器執行之一疊代處理所產生之聲道以得到被編碼聲道;以及產生(308)具有該等被編碼聲道及該等第一與第二多聲道參數之一被編碼多聲道訊號。
  25. 一種解碼具有被編碼聲道與至少第一及第二多聲道參數之一被編碼多聲道訊號之方法(400),包含:解碼(402)該等被編碼聲道以得到被解碼聲道;以及藉由使用由該等第二多聲道參數所識別之該等被解碼聲道之一第二對並藉由使用該等第二多聲道參數而執行(404)一多聲道處理,以得到被處理聲道,並且藉由使用由該等第一多聲道參數所識別之聲道之一第一對並藉由使用該等第一多聲道參數而執行另一多聲道處理, 其中聲道之該第一對係包含至少一被處理聲道。
  26. 一種電腦程式,當執行於一電腦或一處理器時,其係執行申請專利範圍第24項之編碼該多聲道訊號之該方法或申請專利範圍第25項之解碼一被編碼多聲道訊號之該方法。
  27. 一種如申請專利範圍第1、15、24、25或26項所述之裝置、方法或電腦程式,其中多聲道處理係指一聯合立體聲處理或多於二聲道之一聯合處理,並且其中一多聲道訊號具有二聲道或多於二聲道。
TW105105526A 2015-03-09 2016-02-24 編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式 TWI584271B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP15158234 2015-03-09
EP15172492.9A EP3067885A1 (en) 2015-03-09 2015-06-17 Apparatus and method for encoding or decoding a multi-channel signal

Publications (2)

Publication Number Publication Date
TW201642248A TW201642248A (zh) 2016-12-01
TWI584271B true TWI584271B (zh) 2017-05-21

Family

ID=52692421

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105105526A TWI584271B (zh) 2015-03-09 2016-02-24 編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式

Country Status (17)

Country Link
US (4) US10388289B2 (zh)
EP (3) EP3067885A1 (zh)
JP (3) JP6600004B2 (zh)
KR (1) KR102109159B1 (zh)
CN (2) CN107592937B (zh)
AR (1) AR103873A1 (zh)
AU (1) AU2016231238B2 (zh)
BR (6) BR122023021854A2 (zh)
CA (1) CA2978818C (zh)
ES (1) ES2769032T3 (zh)
MX (1) MX364419B (zh)
PL (1) PL3268959T3 (zh)
PT (1) PT3268959T (zh)
RU (1) RU2711055C2 (zh)
SG (1) SG11201707180SA (zh)
TW (1) TWI584271B (zh)
WO (1) WO2016142375A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI690920B (zh) * 2018-01-10 2020-04-11 盛微先進科技股份有限公司 音訊處理方法、音訊處理裝置及用於音訊處理之非暫時性電腦可讀媒體

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN106710600B (zh) * 2016-12-16 2020-02-04 广州广晟数码技术有限公司 多声道音频信号的去相关编码方法和装置
WO2019143867A1 (en) 2018-01-18 2019-07-25 Dolby Laboratories Licensing Corporation Methods and devices for coding soundfield representation signals
SG11202012936VA (en) * 2018-07-04 2021-01-28 Fraunhofer Ges Forschung Multisignal audio coding using signal whitening as preprocessing
US10547927B1 (en) * 2018-07-27 2020-01-28 Mimi Hearing Technologies GmbH Systems and methods for processing an audio signal for replay on stereo and multi-channel audio devices
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) * 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
CN112151045B (zh) 2019-06-29 2024-06-04 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
EP4243015A4 (en) * 2021-01-27 2024-04-17 Samsung Electronics Co Ltd AUDIO PROCESSING APPARATUS AND METHOD
CN115410584A (zh) * 2021-05-28 2022-11-29 华为技术有限公司 多声道音频信号的编码方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080262854A1 (en) * 2005-10-26 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US20110022402A1 (en) * 2006-10-16 2011-01-27 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US20120259642A1 (en) * 2009-08-20 2012-10-11 Yousuke Takada Audio stream combining apparatus, method and program
TW201419266A (zh) * 2012-10-05 2014-05-16 Fraunhofer Ges Forschung 用於空間音訊物件編碼中信號相依變比變換之編碼器、解碼器及方法
TW201444383A (zh) * 2013-03-05 2014-11-16 Fraunhofer Ges Forschung 用於音訊信號處理之多聲道直接-周圍分解之裝置及方法

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4369140B2 (ja) * 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
DE102005010057A1 (de) * 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
RU2416129C2 (ru) * 2005-03-30 2011-04-10 Конинклейке Филипс Электроникс Н.В. Масштабируемое многоканальное кодирование звука
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP5171622B2 (ja) * 2005-07-19 2013-03-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号の生成
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
WO2008006108A2 (en) * 2006-07-07 2008-01-10 Srs Labs, Inc. Systems and methods for multi-dialog surround audio
JP2008129250A (ja) * 2006-11-20 2008-06-05 National Chiao Tung Univ Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
KR101450940B1 (ko) * 2007-09-19 2014-10-15 텔레폰악티에볼라겟엘엠에릭슨(펍) 멀티채널 오디오의 조인트 인핸스먼트
WO2009049896A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2009146734A1 (en) * 2008-06-03 2009-12-10 Nokia Corporation Multi-channel audio coding
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN102171754B (zh) * 2009-07-31 2013-06-26 松下电器产业株式会社 编码装置以及解码装置
KR101646650B1 (ko) * 2009-10-15 2016-08-08 오렌지 최적의 저-스루풋 파라메트릭 코딩/디코딩
WO2011080916A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 音声符号化装置および音声符号化方法
KR101641685B1 (ko) * 2010-03-29 2016-07-22 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
US9154896B2 (en) * 2010-12-22 2015-10-06 Genaudio, Inc. Audio spatialization and environment simulation
WO2013156814A1 (en) * 2012-04-18 2013-10-24 Nokia Corporation Stereo audio signal encoder
US9659569B2 (en) * 2013-04-26 2017-05-23 Nokia Technologies Oy Audio signal encoder
JP2015011076A (ja) * 2013-06-26 2015-01-19 日本放送協会 音響信号符号化装置、音響信号符号化方法、および音響信号復号化装置
EP2830334A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
CN110992964B (zh) * 2014-07-01 2023-10-13 韩国电子通信研究院 处理多信道音频信号的方法和装置
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080262854A1 (en) * 2005-10-26 2008-10-23 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US20110022402A1 (en) * 2006-10-16 2011-01-27 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US20120259642A1 (en) * 2009-08-20 2012-10-11 Yousuke Takada Audio stream combining apparatus, method and program
TW201419266A (zh) * 2012-10-05 2014-05-16 Fraunhofer Ges Forschung 用於空間音訊物件編碼中信號相依變比變換之編碼器、解碼器及方法
TW201423729A (zh) * 2012-10-05 2014-06-16 Fraunhofer Ges Forschung 用於空間音訊物件編碼中時間/頻率解析度之反向相容動態調適的編碼器、解碼器及方法
TW201444383A (zh) * 2013-03-05 2014-11-16 Fraunhofer Ges Forschung 用於音訊信號處理之多聲道直接-周圍分解之裝置及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI690920B (zh) * 2018-01-10 2020-04-11 盛微先進科技股份有限公司 音訊處理方法、音訊處理裝置及用於音訊處理之非暫時性電腦可讀媒體
US10650834B2 (en) 2018-01-10 2020-05-12 Savitech Corp. Audio processing method and non-transitory computer readable medium

Also Published As

Publication number Publication date
US11955131B2 (en) 2024-04-09
SG11201707180SA (en) 2017-10-30
JP6600004B2 (ja) 2019-10-30
US10388289B2 (en) 2019-08-20
US20230134993A1 (en) 2023-05-04
BR122023021817A2 (pt) 2023-12-26
JP2023052219A (ja) 2023-04-11
CN107592937B (zh) 2021-02-23
US11508384B2 (en) 2022-11-22
AU2016231238B2 (en) 2018-08-02
JP2018513402A (ja) 2018-05-24
EP3067885A1 (en) 2016-09-14
CN107592937A (zh) 2018-01-16
CA2978818C (en) 2020-09-22
EP3268959B1 (en) 2019-08-14
BR122023021774A2 (pt) 2023-12-26
AU2016231238A1 (en) 2017-09-21
US20180090151A1 (en) 2018-03-29
BR122023021854A2 (pt) 2023-12-26
TW201642248A (zh) 2016-12-01
CN112233684A (zh) 2021-01-15
AR103873A1 (es) 2017-06-07
PL3268959T3 (pl) 2020-01-31
RU2017134964A3 (zh) 2019-04-05
ES2769032T3 (es) 2020-06-24
US20190333524A1 (en) 2019-10-31
JP2020034920A (ja) 2020-03-05
CN112233684B (zh) 2024-03-19
JP7208126B2 (ja) 2023-01-18
RU2017134964A (ru) 2019-04-05
BR122023021787A2 (pt) 2023-12-26
PT3268959T (pt) 2019-11-11
KR102109159B1 (ko) 2020-05-12
BR122023021855A2 (pt) 2023-12-26
US20210012783A1 (en) 2021-01-14
KR20170130458A (ko) 2017-11-28
BR112017019187A2 (pt) 2018-04-24
US10762909B2 (en) 2020-09-01
EP3506259A1 (en) 2019-07-03
MX364419B (es) 2019-04-25
RU2711055C2 (ru) 2020-01-14
CA2978818A1 (en) 2016-09-15
EP3268959A1 (en) 2018-01-17
WO2016142375A1 (en) 2016-09-15
MX2017011495A (es) 2018-01-25

Similar Documents

Publication Publication Date Title
TWI584271B (zh) 編碼裝置及其編碼方法、解碼裝置及其解碼方法、電腦程式
US9966080B2 (en) Audio object encoding and decoding
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP6117997B2 (ja) 符号化表現に基づいて少なくとも4つのオーディオチャネル信号を提供するためのオーディオデコーダ、オーディオエンコーダ、方法、帯域幅拡張を用いた少なくとも4つのオーディオチャネル信号に基づいて符号化表現を提供するための方法およびコンピュータプログラム
KR101449434B1 (ko) 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
EP1909265A2 (en) Interpolation and signalling of spatial reconstruction parameters for multichannel coding and decoding of audio sources
CN108141689B (zh) 从基于对象的音频转换到hoa
WO2017119953A1 (en) Mixed domain coding of audio
JP6520937B2 (ja) オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム