TWI587286B - 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 - Google Patents

音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 Download PDF

Info

Publication number
TWI587286B
TWI587286B TW104133508A TW104133508A TWI587286B TW I587286 B TWI587286 B TW I587286B TW 104133508 A TW104133508 A TW 104133508A TW 104133508 A TW104133508 A TW 104133508A TW I587286 B TWI587286 B TW I587286B
Authority
TW
Taiwan
Prior art keywords
channel
signal
channels
group
audio
Prior art date
Application number
TW104133508A
Other languages
English (en)
Other versions
TW201629951A (zh
Inventor
拉斯 維爾默斯
海克 普恩哈根
海蒂瑪麗亞 萊托寧
Original Assignee
杜比國際公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杜比國際公司 filed Critical 杜比國際公司
Publication of TW201629951A publication Critical patent/TW201629951A/zh
Application granted granted Critical
Publication of TWI587286B publication Critical patent/TWI587286B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 相關申請案相互參照
本申請案主張2014年10月31日提出之美國專利臨時申請案No.62/073,462及2015年5月28日提出之美國專利臨時申請案No.62/167,711之優先權,其整體內容被併入本文中當作參考。
文中所揭露之本發明大體上係有關音頻訊號之編碼及解碼,尤其有關基於相關聯的元資料之降混訊號的通道混合。
包含多個揚聲器之音頻播放系統被頻繁地用來再生藉由多通道音頻訊號代表之音頻場景,其中,多通道音頻訊號之個別通道被播放於個別的揚聲器上。多通道音頻訊號例如可經由複數個聲波換能器記錄,或由音頻編 寫裝備產生。在許多狀況下,存在有將音頻訊號傳輸至播放裝備之頻寬限制及/或將音頻訊號儲存於電腦記憶體或可攜式儲存裝置中之有限空間。存在有音頻編碼系統用於音頻訊號之參數編碼,以便減少所需頻寬或儲存裝置。在編碼器端,該些系統典型地降混多通道音頻訊號為降混訊號,其典型地為單聲道(一個通道)或立體聲(二個通道)降混,並藉由參數位準差異及交互關聯提取描述通道屬性之旁側資訊(side information)。降混及旁側資訊接著編碼並發送至解碼器端。在解碼器端,重建多通道音頻訊號,亦即,在旁側資訊之參數控制下,從降混近似。
鑒於播放多通道音頻內容可用之廣泛不同類型裝置及系統,包括針對家中終端用戶之新型領域,需要有效率地編碼多通道音頻內容新且替代的方式,以便減少頻寬要求及/或儲存所需記憶體尺寸,促進解碼器端多通道音頻訊號之重建,及/或增加在解碼器端重建時多通道音頻訊號之保真度。亦需促進不同類型揚聲器系統上編碼多通道音頻內容之播放,包括具較原始多通道音頻內容中所呈現通道數目更少揚聲器的系統。
100‧‧‧編碼部
110‧‧‧降混部
120‧‧‧分析部
200‧‧‧音頻編碼系統
201‧‧‧聲波換能器
202‧‧‧正交鏡相濾波器(QMF)分析部
203‧‧‧附加編碼部
204、208‧‧‧QMF合成部
205、209、214、802、806、809、810‧‧‧轉換部
206、207、210、211‧‧‧量化部
216‧‧‧多工器
300‧‧‧音頻編碼方法
310、1010、1020、1030‧‧‧接收
320‧‧‧運算
330、340、1050‧‧‧決定
350‧‧‧輸出
401、403、1301、1401、1501、1601‧‧‧第一組
402、404、1302、1402、1502、1602‧‧‧第二組
501、503、1303、1403、1603‧‧‧第三組
502、504、1404‧‧‧第四組
601、603‧‧‧第五組
602、604‧‧‧第六組
700、900、1200‧‧‧解碼部
710、910、1210‧‧‧去相關部
720、920、1220‧‧‧混合部
800‧‧‧音頻解碼系統
801‧‧‧接收部
803、807‧‧‧QMF分析部
804、808‧‧‧反量化部
805‧‧‧附加解碼部
811‧‧‧QMF合成部
812‧‧‧多揚聲器系統
1000‧‧‧音頻解碼方法
1040‧‧‧產生
1060‧‧‧形成
1070‧‧‧通過
1100‧‧‧電腦可讀取媒體
1304、1405、1503、1604‧‧‧附加第一組
1305、1406、1504、1605‧‧‧附加第二組
1306、1407、1606‧‧‧附加第三組
1408‧‧‧附加第四組
B‧‧‧位元流
c1、c2、c3、c4、c5‧‧‧增益
D、rL‧‧‧去相關訊號
D1、D2、D3‧‧‧去相關器
F1‧‧‧第一編碼格式
F2‧‧‧第二編碼格式
F3‧‧‧第三編碼格式
F4‧‧‧第四編碼格式
F5‧‧‧第五編碼格式
F6‧‧‧第六編碼格式
F7‧‧‧第七編碼格式
g‧‧‧增益因子
L、LB、LS、LSCRN、LW、TFL、TBL、R、RB、RS、RSCRN、RW、TFR、TBR、C、LFE、x1、x2、x3、x4、x5‧‧‧通道
L1‧‧‧第一通道
L2‧‧‧第二通道
m1、m2‧‧‧降混通道
r‧‧‧誤差訊號
γ‧‧‧參數
R1、R2‧‧‧附加降混訊號
αLM‧‧‧混合參數
αLU、ci‧‧‧升混參數
αRM‧‧‧附加混合參數
αRU‧‧‧附加升混參數
u1、u2、u3、u4、y1、y2、z1、z2‧‧‧音頻訊號
下列將更詳細並參照附圖描述範例實施例,其中:圖1為依據範例實施例之編碼部的廣義方塊圖,用於編碼M通道訊號為二通道降混訊號及相關聯的 元資料;圖2為依據範例實施例之音頻編碼系統的廣義方塊圖,包含圖1中所繪示之編碼部;圖3為依據範例實施例之音頻編碼方法的流程圖,用於編碼M通道音頻訊號為二通道降混訊號及相關聯的元資料;圖4-6繪示依據範例實施例之替代方式,將11.1通道(或7.1+4通道或7.1.4通道)音頻訊號分區為藉由個別降混通道代表之通道組;圖7為依據範例實施例之解碼部的廣義方塊圖,用於提供依據二通道降混訊號及相關聯的升混參數之二通道輸出訊號;圖8為依據範例實施例之音頻解碼系統的廣義方塊圖,包含圖7中所繪示之解碼部;圖9為依據範例實施例之解碼部的廣義方塊圖,用於提供依據二通道降混訊號及相關聯的混合參數之二通道輸出訊號;圖10為依據範例實施例之音頻解碼方法的流程圖,用於提供依據二通道降混訊號及相關聯的元資料之二通道輸出訊號;圖11示意地繪示依據範例實施例之電腦可讀取媒體;圖12為依據範例實施例之解碼部的廣義方塊圖,用於提供依據二通道降混訊號及相關聯的升混參數之 K通道輸出訊號;圖13-14繪示依據範例實施例之替代方式,將11.1通道(或7.1+4通道或7.1.4通道)音頻訊號分區為通道組;以及圖15-16繪示依據範例實施例之替代方式,將13.1通道(或9.1+4通道或9.1.4通道)音頻訊號分區為通道組。
所有圖係示意且大體上僅顯示必須零件以闡明本發明,反之其他零件可省略或僅暗示。
【發明內容及實施方式】
如文中所使用,音頻訊號可為獨立音頻訊號、視聽訊號、或與元資料之任何組合。
如文中所使用,通道為與預先定義/固定空間位置/方位或未定義之空間位置(諸如「左」或「右」)相關聯之音頻訊號。
I. 概述-解碼器端
依據第一態樣,範例實施例提出音頻解碼系統、音頻解碼方法及相關聯的電腦程式產品。依據第一態樣,提出之解碼系統、方法及電腦程式產品一般可共享相同的特徵及優點。
依據範例實施例,提供一種音頻解碼方法,包含接收二通道降混訊號。降混訊號與包含升混參數之元 資料相關聯,用於依據降混訊號之M通道音頻訊號的參數重建,其中,M4。降混訊號之第一通道相應於M通道音頻訊號之第一組一或更多個通道的線性組合,及降混訊號之第二通道相應於M通道音頻訊號之第二組一或更多個通道的線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。音頻解碼方法進一步包含:接收至少一部分的元資料;依據降混訊號之至少一個通道產生去相關訊號;依據接收到之元資料決定一組混合係數;及依據混合係數形成二通道輸出訊號為降混訊號及去相關訊號之線性組合。決定混合係數,使得輸出訊號之第一通道近似M通道音頻訊號之第三組一或更多個通道的線性組合,及使得輸出訊號之第二通道近似M通道音頻訊號之第四組一或更多個通道的線性組合。亦決定混合係數,使得第三及第四組組成M通道音頻訊號之M通道的分區,及使得第三及第四組包含來自第一組之至少一個通道。
M通道音頻訊號編碼為二通道降混訊號及升混參數,用於M通道音頻訊號之參數重建。當於編碼器端編碼M通道音頻訊號時,可挑選編碼格式,例如用於來自降混訊號之M通道音頻訊號的重建,當重建降混訊號時改進M通道音頻訊號之保真度,及/或改進降混訊號之編碼效率。編碼格式之挑選可藉由選擇第一及第二組,及形成降混訊號之通道做為個別組中通道之個別線性組合,而予實施。
發明者已理解,儘管挑選之編碼格式可促進 來自降混訊號之M通道音頻訊號的重建,降混訊號本身並不適於使用特定二揚聲器組態之播放。相應於第三及第四組中M通道音頻訊號之不同分區的輸出訊號,較降混訊號更適於特定二通道播放設定。依據降混訊號及接收到之元資料提供輸出訊號因此可改進二通道播放品質,如聽者所感知,及/或改進二通道播放之保真度為M通道音頻訊號所代表之聲場。
發明者已進一步理解,取代從降混訊號之M通道音頻訊號的首先重建,接著產生M通道音頻訊號之替代二通道代表(例如,藉由相加混合),藉由利用M通道音頻訊號之若干通道類似地於二通道代表中成組的事實,可更有效率地從降混訊號及接收到之元資料產生由輸出訊號提供之替代二通道代表。形成輸出訊號為降混訊號及去相關訊號之線性組合,例如可減少解碼器端之運算複雜性,及/或減少採用之組件或處理步驟數量,以獲得M通道音頻訊號之替代二通道代表。
例如可於編碼器端形成降混訊號之第一通道,做為第一組一或更多個通道的線性組合。類似地,可於編碼器端形成降混訊號之第二通道,做為第二組一或更多個通道的線性組合。
M通道音頻訊號之通道例如可形成代表聲場之較大數量通道之子組。
將理解的是由於第三及第四組包含來自第一組之至少一個通道,由第三及第四組提供之分區與由第一 及第二組提供之分區不同。
去相關訊號用以增加降混訊號之音頻內容的維度,如聽者所感知。產生去相關訊號例如可包括將線性濾波器施加於降混訊號之一或更多個通道。
形成輸出訊號例如可包括將至少若干混合係數施加於降混訊號之通道,及將至少若干混合係數施加於去相關訊號之一或更多個通道。
在範例實施例中,接收到之元資料可包括升混參數,且可藉由處理升混參數決定混合係數,例如藉由在升混參數上實施數學作業(例如,包括算術作業)。升混參數典型地於編碼器端決定,並提供與降混訊號用於解碼器端之M通道音頻訊號的參數重建。升混參數攜帶有關M通道音頻訊號之資訊,其可用於依據降混訊號提供輸出訊號。於解碼器端依據升混參數決定混合係數,減少於編碼器端產生附加元資料的需要,並允許減少從編碼器端傳輸資料。
在範例實施例中,接收到之元資料可包括與升混參數不同之混合參數。在本範例實施例中,可依據接收到之元資料並藉以依據混合參數而決定混合係數。混合參數已於編碼器端決定,並傳輸至解碼器端,用於促進混合係數之決定。再者,使用混合參數決定混合係數,允許控制來自編碼器端之混合係數。由於原始M通道音頻訊號於編碼器端可用,例如可於編碼器端調整混合參數,以便增加二通道輸出訊號之保真度,做為M通道音頻訊號 之二通道代表。混合參數例如可為混合係數本身,或混合參數可提供混合係數之更緊密代表。混合係數例如可借由處理混合參數決定,例如依據預定規則。混合參數例如可包括三個獨立可指定參數。
在範例實施例中,混合係數可獨立於任何值之升混參數決定,其允許獨立於升混參數調整混合係數,及允許增加二通道輸出訊號之保真度,做為M通道音頻訊號之二通道代表。
在範例實施例中,可保持M=5,亦即,M通道音頻訊號可為五個通道音頻訊號。本範例實施例之音頻解碼方法例如可用於目前建立之5.1音頻格式之一的五個正規通道,或用於11.1多通道音頻訊號之左手或右手端的五個通道。另一方面,可保持M=4或M6。
在範例實施例中,降混訊號之通道相應之控制從M通道音頻訊號之通道至線性組合的其中一者之貢獻的每一增益,可符合控制從M通道音頻訊號之通道至輸出訊號之通道近似之線性組合的其中一者之貢獻的增益。事實上,本範例實施例中增益符合,允許用於依據降混訊號簡化輸出訊號之提供。尤其,可減少依據降混訊號近似第三及第四組之線性組合所採用之去相關通道數量。
不同增益例如可用於M通道音頻訊號之不同通道。
在第一範例中,所有增益可具有值1。在第一範例中,降混訊號之第一及第二通道可分別相應於第一及 第二組之非加權總和,輸出訊號之第一及第二通道可分別近似第三及第四組之非加權總和。
在第二範例中,至少若干增益可具有1以外之不同值。在第二範例中,降混訊號之第一及第二通道可分別相應於第一及第二組之加權總和,輸出訊號之第一及第二通道可分別近似第三及第四組之加權總和。
在範例實施例中,解碼方法可進一步包含:接收代表降混訊號及元資料之位元流;及從位元流提取降混訊號及元資料之接收部分。換言之,首先可從位元流提取決定混合係數採用之接收到之元資料。例如可從位元流提取包括升混參數之所有元資料。在替代範例中,決定混合係數僅需之元資料可從位元流提取,並例如可禁止進一步元資料之提取。
在範例實施例中,去相關訊號可為單一通道訊號,及藉由將不超過一個去相關訊號通道包括於降混訊號及去相關訊號之線性組合中,亦即,包括於獲得輸出訊號之線性組合中,可形成輸出訊號。發明者已理解不需重建M通道音頻訊號以便提供二通道輸出訊號,且由於不需重建全M通道音頻訊號,去相關訊號通道之數目可減少。
在範例實施例中,可決定混合係數使得輸出訊號之二通道從去相關訊號接收等量(例如,等幅)貢獻。從去相關訊號至輸出訊號之個別通道的貢獻可具有相反符號。換言之,可決定混合係數,使得控制從去相關訊號之 通道至輸出訊號之第一通道之貢獻的混合係數總和,及控制從去相關訊號之相同通道至輸出訊號之第二通道之貢獻的混合係數,具有值0。
在範例實施例中,源自去相關訊號之音頻內容(亦即,用於增加降混訊號之維度之音頻內容)的量(例如,振幅),例如在輸出訊號之二通道中可相等。
在範例實施例中,形成輸出訊號可相當於從三通道至二通道之投射,亦即,從降混訊號及一去相關訊號通道之二通道至輸出訊號之二通道的投射。例如,可直接獲得輸出訊號做為降混訊號及去相關訊號之線性組合,而未首先重建M通道音頻訊號之全M通道。
在範例實施例中,可決定混合係數,使得控制從降混訊號之第一通道至輸出訊號之第一通道之貢獻的混合係數,及控制從降混訊號之第一通道至輸出訊號之第二通道之貢獻的混合係數的總和,具有值1。尤其,混合係數的其中一者可從升混參數衍生(例如,以明確值發送或可於實施緊密代表運算後從升混參數獲得),另一者可藉由要求二混合係數之總和為1,而易於運算。
此外,或另一方面,可決定混合係數,使得控制從降混訊號之第二通道至輸出訊號之第一通道之貢獻的混合係數,及控制從降混訊號之第二通道至輸出訊號之第二通道之貢獻的混合係數的總和,具有值1。
在範例實施例中,第一組可由二或三通道組成。相應於二或三通道之線性組合而非相應於四或更多個 通道之線性組合之降混訊號的通道,當由實施所有M通道之參數重建的解碼器重建時,可增加M通道音頻訊號之保真度。本範例實施例之解碼方法可與該編碼格式相容。
在範例實施例中,M通道音頻訊號可包含代表M通道音頻訊號之播放環境中不同水平方向之三通道,及代表與播放環境中三通道之方向垂直分離之方向的二通道。換言之,M通道音頻訊號可包含希望由置於與聽者(或聽者耳朵)實質上相同高度之音頻源播放及/或實質上水平傳播之三通道,及希望由置於其他高度之音頻源播放及/或(實質上)非水平傳播之二通道。二通道例如可代表提高方向。
在範例實施例中,第一組可由代表M通道音頻訊號之播放環境中不同水平方向之三通道組成,及第二組可由代表與播放環境中三通道之方向垂直分離之方向之二通道組成。在範例實施例中,由第一及第二組提供之M通道音頻訊號的垂直分區,於實施所有M通道之參數重建的解碼器重建時,例如在垂直維度對於M通道音頻訊號代表之聲場的整體傳送重要的狀況下,可增加M通道音頻訊號之保真度。本範例實施例之解碼方法可與提供此垂直分區之編碼格式相容。
在範例實施例中,第三及第四組的其中一者可包含代表與播放環境中三通道之方向垂直分離之方向之二通道。另一方面,第三及第四組之每一者可包含代表與 播放環境中三通道之方向垂直分離之方向之二通道的其中一者,亦即,第三及第四組可各包含該些二通道的其中一者。
在範例實施例中,可藉由處理降混訊號之通道的線性組合獲得去相關訊號,例如包括施加線性濾波器至降混訊號通道之通道的線性組合。另一方面,可依據降混訊號之不超過一個通道獲得去相關訊號,例如藉由處理降混訊號之通道(例如,包括施加線性濾波器)。例如若由降混訊號之單一通道及第二通道組成之第二組通道相應於單一通道,則例如可藉由僅處理降混訊號之第一通道而獲得去相關訊號。
在範例實施例中,第一組可由N通道組成,其中,N3,及第一組可藉由施加文中稱為乾式升混係數之第一類型升混係數至降混訊號之第一通道,及施加文中稱為濕式升混係數之第二類型升混係數至(N-1)通道去相關訊號之通道,而重建為降混訊號之第一通道及(N-1)通道去相關訊號的線性組合。在範例實施例中,接收到之元資料可包括文中稱為乾式升混參數之第一類型升混參數,及文中稱為濕式升混參數之第二類型升混參數。決定混合係數可包含:依據乾式升混參數決定乾式升混係數;依據接收到之濕式升混參數及知道中間矩陣屬於預定矩陣級,而填充具有較接收到之濕式升混參數數目更多元件之中間矩陣;藉由預定矩陣乘以中間矩陣,獲得濕式升混係數,其中,濕式升混係數相應於源自乘法之矩陣,並包括 較中間矩陣中元件數目更多之係數;以及處理溼式及乾式升混係數。
在範例實施例中,用於重建第一組通道之濕式升混係數的數字大於接收到之濕式升混參數的數字。藉由利用預定矩陣及預定矩陣級之知識,而從接收到之濕式升混參數獲得濕式升混係數,可減少第一組通道之參數重建所需資訊量,允許減少連同降混訊號從編碼器端傳輸之元資料量。藉由減少參數重建所需資料量,可減少M通道音頻訊號之參數代表傳輸所需頻寬,及/或儲存該代表所需記憶體尺寸。
可依據降混訊號之第一通道產生(N-1)通道去相關訊號,並用以增加重建之第一組通道的內容維度,如聽者所感知。
預定矩陣級可為至少若干矩陣元件之相關聯已知屬性,其針對類中所有矩陣有效,諸如若干矩陣元件間之某關係,或若干矩陣元件為零。該些屬性之知識允許依據較中間矩陣中矩陣元件之全數量更少之濕式升混參數而填充中間矩陣。解碼器端具有至少屬性之知識,及在較少濕式升混參數之基礎上需運算所有矩陣元件之元件間之關係。
在第一列名發明者Lars Villemoes於2014年4月3日提出申請之美國臨時專利申請案No 61/974,544之第16頁15行至第20頁2行中,更詳細描述如何決定及採用預定矩陣及預定矩陣級。例如詳文中預定矩陣之特 定方程式(9)。
在範例實施例中,接收到之元資料可包括N(N-1)/2濕式升混參數。在範例實施例中,填充中間矩陣可包括依據接收到之N(N-1)/2濕式升混參數而獲得(N-1)2矩陣元件之值,並知道中間矩陣屬於預定矩陣級。此可包括立即插入濕式升混參數之值做為矩陣元件,或以適當方式處理濕式升混參數用於衍生矩陣元件之值。在範例實施例中,預定矩陣可包括N(N-1)元件,及濕式升混係數組可包括N(N-1)係數。例如,接收到之元資料可與可指定濕式升混參數無關地包括不多於N(N-1)/2,及/或濕式升混參數之數字可不多於用於重建第一組通道之濕式升混係數之數字的一半。
在範例實施例中,接收到之元資料可包括(N-1)乾式升混參數。在範例實施例中,乾式升混係數可包括N係數,並可依據接收之(N-1)乾式升混參數及乾式升混係數間之預定關係,而決定乾式升混係數。例如,接收到之元資料可與可指定乾式升混參數無關地包括不多於(N-1)。
在範例實施例中,預定矩陣級可為以下之一:下或上三角矩陣,其中,類中所有矩陣之已知屬性包括預定矩陣元件為零;對稱矩陣,其中,類中所有矩陣之已知屬性包括預定矩陣元件(主對角線之任一端)相等;及正交矩陣及對角矩陣之積,其中,類中所有矩陣之已知屬性包括預定矩陣元件間之已知關係。換言之,預定矩陣級 可為下三角矩陣類、上三角矩陣類、對稱矩陣類或正交矩陣及對角矩陣之積類。以上每一類之共同屬性為其維度小於矩陣元件之全數目。
在範例實施例中,解碼方法可進一步包含:接收表示M通道音頻訊號之至少二個編碼格式之(選擇)一者之信令(signalling),編碼格式相應於與降混訊號之通道相關聯之個別第一及第二組中,M通道音頻訊號之通道的個別不同分區。在範例實施例中,可預先定義第三及第四組,並可決定混合係數,使得由輸出訊號通道近似之第三及第四組通道中,M通道音頻訊號之單一分區維持用於(亦即,共用於)至少二個編碼格式。
在範例實施例中,例如可依據表示之編碼格式及降混訊號之至少一個通道決定去相關訊號。
在範例實施例中,當決定降混訊號及元資料時,可於編碼器端採用至少二個不同編碼格式,且解碼方法可藉由調整混合係數而處理編碼格式間之差異,可選地去相關訊號亦然。若檢測到從第一編碼格式至第二編碼格式之切換,解碼方法例如可包括實施從與第一編碼格式相關聯之混合參數內插至與第二編碼格式相關聯之混合參數。
在範例實施例中,解碼方法可進一步包含:回應於表示特定編碼格式之信令,通過降混訊號做為輸出訊號。在範例實施例中,特定編碼格式可相應於符合第三及第四組定義之分區的M通道音頻訊號之通道的分區。 在範例實施例中,由降混訊號之通道提供之分區,可符合由輸出訊號之通道提供之分區,且不需處理降混訊號。可因此通過降混訊號做為輸出訊號。
在範例實施例中,解碼方法可包含:回應於表示特定編碼格式之信令,而抑制從去相關訊號至輸出訊號之貢獻。在範例實施例中,特定編碼格式可相應於符合第三及第四組定義之通道之分區的M通道音頻訊號之分區。在範例實施例中,由降混訊號之通道提供之分區,可符合由輸出訊號之通道提供之分區,不需去相關。
在範例實施例中,在第一編碼格式中,第一組可由代表M通道音頻訊號之播放環境中不同水平方向的三通道組成,及第二組通道可由代表與播放環境中三通道之方向垂直分離之方向之二通道組成。在第二編碼格式中,第一及第二組之每一者可包含二通道之一者。
依據範例實施例,提供一種音頻解碼系統,包含解碼部係組構成接收二通道降混訊號。降混訊號與元資料相關聯,包含升混參數,用於依據降混訊號之M通道音頻訊號的參數重建,其中,M4。降混訊號之第一通道相應於M通道音頻訊號之第一組一或更多個通道的線性組合,及降混訊號之第二通道相應於M通道音頻訊號之第二組一或更多個通道的線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。解碼部係進一步組構成:接收至少一部分的元資料;及依據降混訊號及接收到之元資料而提供二通道輸出訊號。解碼部包含去相關 部,係組構成接收降混訊號之至少一個通道,及基此輸出去相關訊號。解碼部進一步包含混合部,係組構成:依據接收到之元資料而決定一組混合係數,及依據混合係數形成輸出訊號,做為降混訊號及去相關訊號之線性組合。混合部係組構成決定混合係數,使得輸出訊號之第一通道近似M通道音頻訊號之第三組一或更多個通道之線性組合,及使得輸出訊號之第二通道近似M通道音頻訊號之第四組一或更多個通道之線性組合。混合部係進一步組構成決定混合係數,使得第三及第四組組成M通道音頻訊號之M通道之分區,及使得第三及第四組包含來自第一組之至少一個通道。
在範例實施例中,音頻解碼系統可進一步包含附加解碼部,係組構成接收附加二通道降混訊號。附加降混訊號可與附加元資料相關聯,包含附加升混參數,用以依據附加降混訊號之附加M通道音頻訊號的參數重建。附加降混訊號之第一通道可相應於附加M通道音頻訊號之第一組一或更多個通道的線性組合,及附加降混訊號之第二通道可相應於附加M通道音頻訊號之第二組一或更多個通道的線性組合。附加M通道音頻訊號之第一及第二組通道可組成附加M通道音頻訊號之M通道的分區。附加解碼部可進一步組構成:接收至少一部分的附加元資料;及依據附加降混訊號及附加接收到之元資料而提供附加二通道輸出訊號。附加解碼部可包含附加去相關部,係組構成接收至少一個通道附加降混訊號,及基此輸 出附加去相關訊號。附加解碼部可進一步包含附加混合部,係組構成:依據接收到之附加元資料而決定一組附加混合係數,及依據附加混合係數,而形成附加輸出訊號,做為附加降混訊號及附加去相關訊號的線性組合。附加混合部可組構成決定附加混合係數,使得附加輸出訊號之第一通道近似附加M通道音頻訊號之第三組一或更多個通道的線性組合,及使得附加輸出訊號之第二通道近似附加M通道音頻訊號之第四組一或更多個通道的線性組合。附加混合部可進一步組構成決定附加混合係數,使得附加M通道音頻訊號之第三及第四組通道組成附加M通道音頻訊號之M通道的分區,及使得附加M通道音頻訊號之第三及第四組訊號包含來自附加M通道音頻訊號之第一組通道的至少一個通道。
在範例實施例中,附加解碼部、附加去相關部及附加混合部例如可分別機能地等同於(或類似地組構成)解碼部、去相關部及混合部。另一方面,附加解碼部、附加去相關部及附加混合部之至少一者,例如可組構成實施與解碼部、去相關部及混合部之相應部所實施者至少一個不同類型之運算及/或內插。
在範例實施例中,附加解碼部、附加去相關部及附加混合部例如可與解碼部、去相關部及混合部無關地操作。
在範例實施例中,解碼系統可進一步包含解多工器,係組構成從位元流提取:降混訊號、至少一部分 的元資料、及離散編碼音頻通道。解碼系統可進一步包含單一通道解碼部,可操作以解碼離散編碼音頻通道。離散編碼音頻通道例如可使用感知音頻編解碼器,諸如杜比數位或MPEG AAC,而於位元流中編碼,且單一通道解碼部例如可包含核心解碼器,用於解碼離散編碼音頻通道。單一通道解碼部例如可與解碼部無關地操作以解碼離散編碼音頻通道。
依據範例實施例,提供一種電腦程式產品,包含電腦可讀取媒體,具有指令用以實施第一態樣之任一方法。
以上描述依據範例實施例之第一態樣的音頻解碼系統、方法、及電腦程式產品,輸出訊號可為K通道訊號,其中,2K<M,而非二通道訊號,且輸出訊號之K通道可相應於K組中M通道音頻訊號之分區,而非相應於二組中M通道訊號之分區之輸出訊號的二通道。
更具體地,依據範例實施例,提供一種音頻解碼方法,其包含接收二通道降混訊號。降混訊號與包含升混參數之元資料相關聯,用以依據降混訊號之M通道音頻訊號的參數重建,其中,M4。降混訊號之第一通道相應於M通道音頻訊號之第一組一或更多個通道的線性組合,及降混訊號之第二通道相應於M通道音頻訊號之第二組一或更多個通道的線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。音頻解碼方法可進一步包含:接收至少一部分的元資料;依據降混訊號之至少 一通道而產生去相關訊號;依據接收到之元資料而決定一組混合係數;及依據混合係數而形成K通道輸出訊號,做為降混訊號及去相關訊號之線性組合,其中,2K<M。可決定混合係數使得輸出訊號之K通道的每一者近似M通道音頻訊號之一或更多個通道組的線性組合(輸出訊號之K通道的每一者因此相應於M通道音頻訊號之一或更多個通道組),相應於輸出訊號之個別通道的組組成M通道音頻訊號之M通道的分區為K組一或更多個通道;及K組之至少二者包含來自第一組的至少一個通道。
M通道音頻訊號已編碼為二通道降混訊號及升混參數,用於M通道音頻訊號之參數重建。當於編碼器端編碼M通道音頻訊號時,可挑選編碼格式,例如用以促進來自降混訊號之M通道音頻訊號的重建,用以當從降混訊號重建時,改進M通道音頻訊號之保真度,及/或用以改進降混訊號之編碼效率。可藉由選擇第一及第二組及形成降混訊號之通道做為個別組中通道之個別線性組合,而實施編碼格式之選擇。
發明者已理解,儘管挑選之編碼格式可促進來自降混訊號之M通道音頻訊號的重建,降混訊號本身不適於使用特定K揚聲器組態播放。K通道輸出訊號相應於K組中M通道音頻訊號之分區,可較降混訊號更適於特定K通道播放設定。依據降混訊號及接收到之元資料而提供輸出訊號,可因此改進K通道播放品質,如聽者所感知,及/或改進K通道播放之保真度為M通道音頻訊號 所代表之聲場。
發明者進一步理解,取代來自降混訊號之M通道音頻訊號的首先重建,及接著產生M通道音頻訊號之M通道代表(例如,藉由相加混合),藉由利用M通道音頻訊號之若干通道類似地於由將提供之降混訊號及K通道代表提供之二通道代表中群聚一起之事實,由輸出訊號提供之K通道代表可更有效率地從降混訊號及接收到之元資料產生。形成輸出訊號做為降混訊號及去相關訊號之線性組合,例如可減少解碼器端之運算複雜性,及/或減少獲得M通道音頻訊號之K通道代表所採用之組件或處理步驟的數量。
藉由K組組成M通道音頻訊號之通道的分區,表示K組不相交並一起包括M通道音頻訊號之所有通道。
形成K通道輸出訊號,例如可包括將至少若干混合係數施加於降混訊號之通道,及將至少若干混合係數施加於去相關訊號之一或更多個通道。
降混訊號之第一及第二通道例如可分別相應於(加權或非加權)第一及第二組一或更多個通道中通道之總和。
輸出訊號之K通道例如可分別近似(加權或非加權)K組一或更多個通道中通道之總和。
在若干範例實施例中,K=2、K=3、或K=4。
在若干範例實施例中,M=5、或M=6。
在範例實施例中,去相關訊號可為二通道訊號,及可藉由降混訊號及去相關訊號之線性組合中,即獲得輸出訊號之線性組合中,包括不超過二個去相關訊號通道,而形成輸出訊號。發明者已理解,不需重建M通道音頻訊號以便提供二通道輸出訊號,且由於全M通道音頻訊號不需重建,可減少去相關訊號通道之數量。
在範例實施例中,K=3且形成輸出訊號可相當於從四通道至三通道之投射,亦即,從降混訊號及二去相關訊號通道之二通道至輸出訊號之三通道的投射。例如,可直接獲得輸出訊號,做為降混訊號及去相關訊號之線性組合,而未首先重建M通道音頻訊號之全M通道。
在範例實施例中,可決定混合係數使得輸出訊號之一對通道接收來自去相關訊號之通道的等量(例如,等幅)貢獻。從去相關訊號之通道至該對之個別通道的貢獻,可具有相反符號。換言之,可決定混合係數,使得控制從去相關訊號之通道至輸出訊號之(例如,第一)通道之貢獻之混合係數,及控制從去相關訊號之相同通道至輸出訊號之另一(例如,第二)通道之貢獻之混合係數的總和,具有值0。K通道輸出訊號例如可包括未接收來自去相關訊號之特定通道之任何貢獻的一或更多個通道。
在範例實施例中,可決定混合係數使得控制從降混訊號之第一通道至輸出訊號之(例如,第一)通道之貢獻之混合係數,及控制從降混訊號之第一通道至輸出訊 號之另一(例如,第二)通道之貢獻之混合係數的總和,具有值1。尤其,混合係數之一者例如可從升混參數(例如,發送為明確值或於緊密代表上實施運算後,可從升混參數獲得,如本揭露之其他部中說明)衍生,且另一者可藉由要求混合係數之總和等於1而易於運算。K通道輸出訊號例如可包括未接收來自降混訊號之第一通道之任何貢獻的一或更多個通道。
在範例實施例中,可決定混合係數,使得控制從降混訊號之第二通道至輸出訊號之(例如,第一)通道之貢獻之混合係數,及控制從降混訊號之第二通道至輸出訊號之另一(例如,第二)通道之貢獻之混合係數的總和,具有值1。K通道輸出訊號例如可包括未接收來自降混訊號之第二通道之任何貢獻的一或更多個通道。
在範例實施例中,方法可包含接收表示(選擇)M通道音頻訊號之至少二個編碼格式之一者的信令。編碼格式可相應於與降混訊號之通道相關聯之個別第一及第二組中,M通道音頻訊號之通道的個別不同分區。可預先定義K組。可決定混合係數,使得輸出訊號之通道近似之K組通道中M通道音頻訊號之單一分區維持(亦即,共用於)至少二個編碼格式。
在範例實施例中,去相關訊號可包含二通道。可依據降混訊號之第一通道,例如處理不多於降混訊號之第一通道,而獲得去相關訊號之第一通道。可依據降混訊號之第二通道,例如處理不多於降混訊號之第二通 道,而獲得去相關訊號之第二通道。
II. 概述-編碼器端
依據第二態樣,範例實施例提出音頻編碼系統以及音頻編碼方法及相關聯電腦程式產品。依據第二態樣提出之編碼系統、方法及電腦程式產品,通常可共用相同特徵及優點。再者,以上呈現之優點用於依據第一態樣之解碼系統、方法及電腦程式產品之特徵,通常可有效用於依據第二態樣之編碼系統、方法及電腦程式產品的相應特徵。
依據範例實施例,提供一種音頻編碼方法,包含:接收M通道音頻訊號,其中,M4;及依據M通道音頻訊號而運算二通道降混訊號。形成降混訊號之第一通道做為M通道音頻訊號之第一組一或更多個通道的線性組合,及形成降混訊號之第二通道之M通道音頻訊號之第二組一或更多個通道的線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。編碼方法進一步包含:決定升混參數用於來自降混訊號之M通道音頻訊號的參數重建;及依據降混訊號而決定混合參數,用於獲得二通道輸出訊號,其中,輸出訊號之第一通道近似M通道音頻訊號之第三組一或更多個通道的線性組合,且其中,輸出訊號之第二通道近似M通道音頻訊號之第四組一或更多個通道的線性組合。第三及第四組組成M通道音頻訊號之M通道的分區,且第三及第四組包含來自第 一組之至少一通道。編碼方法進一步包含:輸出降混訊號及元資料用於聯合儲存或傳輸,其中,元資料包含升混參數及混合參數。
降混訊號之通道相應於第一及第二組中M通道音頻訊號之M通道的分區,並例如可提供M通道音頻訊號之位元效率二通道代表及/或允許M通道音頻訊號之高保真度參數重建的二通道代表。
發明者已理解,儘管採用之二通道代表可促進來自降混訊號之M通道音頻訊號的重建,降混訊號本身可不適於使用特定二揚聲器配置之播放。連同降混訊號及升混參數一同輸出之混合參數允許依據降混訊號而獲得二通道輸出訊號。輸出訊號相應於第三及第四組通道中M通道音頻訊號之不同分區,可較降混訊號更適於特定二通道播放設定。依據降混訊號及混合參數而提供輸出訊號,可因此改進二通道播放品質,如聽者所感知,及/或改進至M通道音頻訊號所代表聲場之二通道播放的保真度。
例如可形成降混訊號之第一通道,做為第一組中通道之總和,或做為其定標。換言之,例如可形成降混訊號之第一通道,做為第一組中通道之總和(亦即,來自個別通道之音頻內容之總和,例如由基於一樣本或每一轉換係數之相加混合形成),或做為該總和之重縮放版本(例如,藉由加總通道及以重縮放因子乘以總和而獲得)。類似地,例如可形成降混訊號之第二通道,做為第二組中通道之總和,或做為其定標。輸出訊號之第一通道例如可 近似第三組之通道總和,或其定標,且輸出訊號之第二通道例如可近似第四組中通道總和,或其定標。
例如,M通道音頻訊號可為五通道音頻訊號。音頻編碼方法例如可用於目前建立之5.1音頻格式之一的五個正規通道,或用於11.1多通道音頻訊號之左手或右手端的五個通道。另一方面,可保持M=4或M6。
在範例實施例中,混合參數可控制從降混訊號及從去相關訊號至輸出訊號之個別貢獻。至少若干混合參數可由最小化在分別致使輸出訊號之通道為第一組及第二組通道之線性組合(或總和)的共變數-保存近似的該等混合參數中來自去相關訊號之貢獻而決定。在貢獻之訊號能量或振幅最小化之意義上,例如可最小化來自去相關訊號之貢獻。
輸出訊號之第一通道近似之第三組的線性組合,及輸出訊號之第二通道近似之第四組的線性組合,例如可相應於具有第一共變數矩陣之二通道音頻訊號。輸出訊號之通道分別為第一及第二組通道之線性組合的共變數-保存近似,例如可相應於符合(或至少實質上符合)第一共變數矩陣之輸出訊號的共變數矩陣。
在共變數-保存近似中,來自去相關訊號之貢獻的減少尺寸(例如,能量或振幅)可為播放期間近似之增加保真度的表示,如聽者所感知。採用減少來自去相關訊號之貢獻的混合參數可改進輸出訊號之保真度,做為M 通道音頻訊號之二通道代表。
在範例實施例中,第一組通道可由N通道組成,其中,N3,且至少若干升混參數可適於來自降混訊號之第一通道及依據降混訊號之第一通道決定之(N-1)通道去相關訊號之第一組通道的參數重建。在範例實施例中,決定升混參數可包括:決定第一類型之一乾式升混係數組,稱為乾式升混係數,以便定義近似第一組之降混訊號之第一通道的線性映射;以及依據接收時第一組之共變數與由降混訊號之第一通道之線性映射近似時第一組之共變數間之差異,決定中間矩陣。當乘以預定矩陣時,中間矩陣可相應於定義去相關訊號之線性映射做為第一組之部分參數重建的第二類型之一濕式升混係數組,稱為濕式升混係數。該濕式升混係數組可包括較中間矩陣中元件數目更多之係數,在範例實施例中,升混參數可包括第一類型之乾式升混參數,稱為乾式升混參數,由此可衍生該乾式升混係數組,且獨特定義中間矩陣之第二類型之升混參數,稱為濕式升混參數,假定中間矩陣屬於預定矩陣級。中間矩陣具有較濕式升混參數數目更多之元件。
在範例實施例中,在解碼器端之第一組通道的參數重建複製,包括由降混訊號之第一通道之線性映射形成之乾式升混訊號,做為一貢獻,及由去相關訊號之線性映射形成之濕式升混訊號,做為進一步貢獻。乾式升混係數組定義降混訊號之第一通道之線性映射,及濕式升混係數組定義去相關訊號之線性映射。藉由輸出較濕式升混 係數數字更少之濕式升混參數,及由此可依據預定矩陣及預定矩陣級衍生濕式升混係數,可減少發送至解碼器端以致能M通道音頻訊號之重建的資訊量。藉由減少參數重建所需之資料量,可減少傳輸M通道音頻訊號之參數代表所需頻寬,及/或儲存該代表所需記憶體尺寸。
例如可決定中間矩陣使得由去相關訊號之線性映射獲得之訊號的共變數補充第一組通道之共變數,如降混訊號之第一通道的線性映射所近似。
在第一列名發明者Lars Villemoes於2014年4月3日提出申請之美國臨時專利申請案No 61/974,544之第16頁15行至第20頁2行中,更詳細描述如何決定及採用預定矩陣及預定矩陣級。例如詳文中預定矩陣之特定方程式(9)。
在範例實施例中,決定中間矩陣可包括決定中間矩陣,使得由去相關訊號之線性映射獲得之由濕式升混係數組定義之訊號的共變數,近似或實質上符合接收時第一組通道之共變數及當降混訊號之第一通道之線性映射近似時第一組通道之共變數間之差異。換言之可決定中間矩陣,使得做為由降混訊號之第一通道之線性映射形成之乾式升混訊號,及由去相關訊號之線性映射形成之濕式升混訊號之總和,所獲得之第一組通道的重建複製完全或至少近似恢復接收時第一組通道之共變數。
在範例實施例中,濕式升混參數可包括可無關地指定濕式升混參數之不多於N(N-1)/2。在範例實施 例中,中間矩陣可具有(N-1)2個矩陣元件,並可由濕式升混參數獨特定義,假定中間矩陣屬於預定矩陣級。在範例實施例中,濕式升混係數組可包括N(N-1)個係數。
在範例實施例中,乾式升混係數組可包括N個係數。在範例實施例中,乾式升混參數可包括不多於N-1個乾式升混參數,且乾式升混係數組可使用預定規則從N-1個乾式升混參數衍生。
在範例實施例中,決定之乾式升混係數組可定義相應於第一組通道之最小均方誤差近似,亦即,在降混訊號之第一通道的線性映射組中,降混訊號之第一通道的線性映射,決定之乾式升混係數組可定義以最小均方意義之最佳近似第一組通道的線性映射。
在範例實施例中,編碼方法可進一步包含選擇至少二個編碼格式之一者,其中,編碼格式相應於與降混訊號之通道相關聯之個別第一及第二組中M通道音頻訊號之通道的個別不同分區。可依據選擇之編碼格式形成降混訊號之第一及第二通道,分別做為M通道音頻訊號之第一及第二組一或更多個通道的線性組合。可依據選擇之編碼格式決定升混參數及混合參數。編碼方法可進一步包含提供表示選擇之編碼格式的信令。信令例如可輸出用於聯合儲存及/或傳輸,具有降混訊號及元資料。
當依據降混訊號及升混參數重建時,M通道音頻訊號可為以下總和:藉由將乾式升混係數施加於降混訊號所形成之乾式升混訊號;及將濕式升混係數施加於依 據降混訊號決定之去相關訊號所形成之濕式升混訊號。例如可依據接收時M通道音頻訊號之共變數及當乾式升混訊號近似時之M通道音頻訊號之共變數間之差異,實施編碼格式選擇用於個別編碼格式。例如可依據個別編碼格式之濕式升混係數實施編碼格式選擇,例如依據個別編碼格式之濕式升混係數之平方的個別總和。選擇之編碼格式例如可與個別編碼格式之平方之總和的最小者相關聯。
依據範例實施例,提供一種音頻編碼系統,包含編碼部,係組構成編碼M通道音頻訊號,做為二通道降混訊號及相關聯元資料,其中,M4,及輸出降混訊號及元資料用於聯合儲存或傳輸。編碼部包含降混部,係組構成依據M通道音頻訊號而運算降混訊號。形成降混訊號之第一通道,做為M通道音頻訊號之第一組一或更多個通道的線性組合,及形成降混訊號之第二通道,做為M通道音頻訊號之第二組一或更多個通道的線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。編碼部進一步包含分析部,係組構成以決定:升混參數,用於來自降混訊號之M通道音頻訊號的參數重建;及混合參數,用於依據降混訊號而獲得二通道輸出訊號。輸出訊號之第一通道近似M通道音頻訊號之第三組一或更多個通道之線性組合,及輸出訊號之第二通道近似M通道音頻訊號之第四組一或更多個通道之線性組合。第三及第四組組成M通道音頻訊號之M通道的分區。第三及第四組包含來自第一組之至少一通道。元資料包含升混參 數及混合參數。
依據範例實施例,提供一種電腦程式產品,包含電腦可讀取媒體,具有指令用於實施第二態樣之任一方法。
依據以上所描述之第二態樣之音頻編碼系統、方法、及電腦程式產品的範例實施例,輸出訊號可為K通道訊號,其中,2K<M,而非二通道訊號,且輸出訊號之K通道可相應於K組中M通道音頻訊號的分區,而非相應於二組中M通道訊號之分區之輸出訊號的二通道。
更具體地,依據範例實施例,提供一種音頻編碼方法,包含:接收M通道音頻訊號,其中,M4;以及依據M通道音頻訊號而運算二通道降混訊號。形成降混訊號之第一通道,做為M通道音頻訊號之第一組一或更多個通道之線性組合,及形成降混訊號之第二通道,做為M通道音頻訊號之第二組一或更多個通道之線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。編碼方法可進一步包含:決定升混參數用於來自降混訊號之M通道音頻訊號的參數重建;及依據降混訊號而決定混合參數,用於獲得K通道輸出訊號,其中,2K<M,其中,輸出訊號之每一K通道近似M通道音頻訊號之一或更多個通道組的線性組合。相應於輸出訊號之個別通道的該些組可組成K組一或更多個通道中M通道音頻訊號之M通道的分區,且至少二個K組可包含來自第一 組之至少一通道。編碼方法可進一步包含輸出降混訊號及元資料用於聯合儲存或傳輸,其中,元資料包含升混參數及混合參數。
在範例實施例中,混合參數可控制從降混訊號及從去相關訊號至輸出訊號的個別貢獻。至少若干混合參數可由最小化在致使輸出訊號之通道為個別K組通道之一或更多個通道之線性組合(或總和)的共變數-保存近似的該等混合參數中來自去相關訊號之貢獻而決定。在貢獻之訊號能量或振幅最小化之意義上,例如可最小化來自去相關訊號之貢獻。
輸出訊號之K通道近似之K組通道之線性組合,例如可相應於具有第一共變數矩陣之K通道音頻訊號。輸出訊號之通道分別為K組通道之線性組合的共變數-保存近似,例如可相應於符合(或至少實質上符合)第一共變數矩陣之輸出訊號的共變數矩陣。
在共變數-保存近似中,來自去相關訊號之貢獻的減少尺寸(例如,能量或振幅)可為播放期間近似之增加保真度的表示,如聽者所感知。採用減少來自去相關訊號之貢獻的混合參數可改進輸出訊號之保真度,做為M通道音頻訊號之K通道代表。
III. 概述-電腦可讀取媒體
依據第三態樣,範例實施例提出電腦可讀取媒體。以上呈現依據第一及/或第二態樣之系統、方法及 電腦程式產品之特徵的優點,通常可針對依據第三態樣之電腦可讀取媒體之相應特徵有效。
依據範例實施例,提供資料載體,代表:二通道降混訊號;及允許依據降混訊號之M通道音頻訊號之參數重建的升混參數,其中,M4。降混訊號之第一通道相應於M通道音頻訊號之第一組一或更多個通道之線性組合,及降混訊號之第二通道相應於M通道音頻訊號之第二組一或更多個通道之線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。資料載體進一步代表混合參數,允許提供依據降混訊號之二通道輸出訊號。輸出訊號之第一通道近似M通道音頻訊號之第三組一或更多個通道的線性組合,及輸出訊號之第二通道近似M通道音頻訊號之第四組一或更多個通道的線性組合。第三及第四組組成M通道音頻訊號之M通道的分區。第三及第四組包含來自第一組之至少一通道。
在範例實施例中,由資料載體代表之資料可配置於時間訊框中,並可分層,使得對特定時間訊框而言,可與相關聯升混參數無關地提取時間訊框之降混訊號及相關聯混合參數。例如,資料載體可分層,使得可提取時間訊框之降混訊號及相關聯混合參數,而未提取及/或存取相關聯升混參數。依據以上所描述之第三態樣之電腦可讀取媒體(或資料載體)之範例實施例,輸出訊號可為K通道訊號,其中,2K<M,而非二通道訊號,且輸出訊號之K通道可相應於K組中M通道音頻訊號之分區, 而非相應於二組中M通道訊號之分區之輸出訊號的二通道。
更具體地,依據範例實施例,提供電腦可讀取媒體(或資料載體),代表:二通道降混訊號;及升混參數,允許依據降混訊號之M通道音頻訊號的參數重建,其中,M4。降混訊號之第一通道相應於M通道音頻訊號之第一組一或更多個通道的線性組合,及降混訊號之第二通道相應於M通道音頻訊號之第二組一或更多個通道的線性組合。第一及第二組組成M通道音頻訊號之M通道的分區。資料載體可進一步代表混合參數,允許提供依據降混訊號之K通道輸出訊號,其中,2K<M。輸出訊號之每一通道可近似M通道音頻訊號之一或更多個通道組之線性組合(例如,加權或非加權總和)。相應於輸出訊號之個別通道的該些組,可組成K組一或更多個通道中M通道音頻訊號之M通道的分區。至少二個K組可包含來自第一組之至少一通道。
進一步範例實施例係定義於從屬申請項中。請注意,範例實施例包括特徵之所有組合,即使在相互不同申請項中提及。
IV. 範例實施例
圖4-6繪示替代方式區分11.1通道音頻訊號為11.1通道音頻訊號之參數編碼之多組通道,做為5.1通道音頻訊號,或用於包含五個揚聲器及一超低音揚聲器之 揚聲器系統之11.1通道音頻訊號的播放。
11.1通道音頻訊號包含通道L(左)、LS(左端)、LB(左後)、TFL(左上前)、TBL(左上後)、R(右)、RS(右端)、RB(右後)、TFR(右上前)、TBR(右上後)、C(中央)、及LFE(低頻效果)。五個通道L、LS、LB、TFL及TBL形成五通道音頻訊號,代表11.1通道音頻訊號之播放環境中左半空間。三個通道L、LS及LB代表播放環境中不同水平方向,及二個通道TFL及TBL代表與三個通道L、LS及LB之方向垂直分離之方向。二個通道TFL及TBL例如可預期用於在吸頂揚聲器中播放。類似地,五個通道R、RS、RB、TFR及TBR形成附加五個通道音頻訊號,代表播放環境之右半空間,三個通道R、RS及RB代表播放環境中不同水平方向,及二個通道TFR及TBR代表與三個通道R、RS及RB之方向垂直分離之方向。
為將11.1通道音頻訊號代表為5.1通道音頻訊號,通道L、LS、LB、TFL、TBL、R、RS、RB、TFR、TBR、C、及LFE之聚集可區分為由個別的降混通道及相關聯的元資料代表之多組通道。五個通道音頻訊號L、LS、LB、TFL、TBL可由二個通道降混訊號L1、L2及相關聯的元資料代表,同時附加五個通道音頻訊號R、RS、RB、TFR、TBR可由附加二個通道降混訊號R1、R2及附加相關聯的元資料代表。通道C及LFE可保持為分離通道,亦在11.1通道音頻訊號之5.1通道代表中。
圖4繪示第一編碼格式F1,其中,五個通道 音頻訊號L、LS、LB、TFL、TBL區分為通道L、LS、LB之第一組401,及通道TFL、TBL之第二組402,其中,附加五個通道音頻訊號R、RS、RB、TFR、TBR區分為通道R、RS、RB之附加第一組403,及通道TFR、TBR之附加第二組404。在第一編碼格式F1中,第一組通道401係由二通道降混訊號之第一通道L1代表,及第二組通道402係由二通道降混訊號之第二通道L2代表。降混訊號之第一通道L1可相應於第一組通道401之總和,按照L 1=L+LS+LB,及降混訊號之第二通道L2可相應於第二組通道402之總和,按照L 2=TFL+TBL在若干範例實施例中,若干或所有通道可於加總之前重縮放,使得降混訊號之第一通道L1可相應於第一組通道401之線性組合,依據L1=c1L+c2LS+c3LB,及降混訊號之第二通道L2可相應於第二組通道402之線性組合,依據L2=c4TFL+c5TBL。增益c2、c3、c4、c5例如可一致,同時增益c1例如可具有不同值;例如,c1可相應於完全未重定標。例如,可使用值c1=1及c2=c3=c4=c5=1/。然而,只要施加於第一編碼格式F1之個別通道L、LS、 LB、TFL、TBL的增益c1,...,c5符合施加於其他編碼格式F2及F3之該些通道的增益,以下參照圖5及6所描述之該些增益便不會影響以下所描述之運算。因此,通道L、LS、LB、TFL、TBL之方程式及以下衍生之近似亦施加於該些通道的重縮放版本c1L、c2LS、c3LB、c4TFL、c5TBL。另一方面,若不同編碼格式中採用不同增益,以下實施之至少若干運算必須修改;例如,為提供更如實近似,可考慮包括附加去相關器之選項。
類似地,由附加降混訊號之第一通道代表附加第一組通道403,及由附加降混訊號之第二通道代表附加第二組通道404。
第一編碼格式F1提供專用降混通道L2及R2,代表吸頂通道TFL、TBL、TFR及TBR。在例如播放環境中垂直維度對11.1通道音頻訊號之整體傳送重要的狀況下,使用第一編碼格式F1可因此允許具相對高保真度之11.1通道音頻訊號的參數重建。
圖5繪示第二編碼格式F2,其中,五通道音頻訊號L、LS、LB、TFL、TBL區分為由個別通道L1及L2代表之第三組通道501及第四組通道502,其中,通道L1及L2相應於個別組通道之總和,例如如第一編碼格式F1中將相同增益c1,...,c5用於重縮放。類似地,附加五通道音頻訊號R、RS、RB、TFR、TBR區分為由個別通道R1及R2代表之附加第三組通道503及第四組通道504。
第二編碼格式未提供代表吸頂通道TFL、 TBL、TFR及TBR之專用降混通道,但在播放環境中垂直維度不如11.1通道音頻訊號之整體傳送重要的狀況下,可允許具相對高保真度之11.1通道音頻訊號的參數重建。第二編碼格式F2亦可較第一編碼格式F1更適於5.1通道播放。
圖6繪示第三編碼格式F3,其中,五通道音頻訊號L、LS、LB、TFL、TBL區分為由降混訊號之個別通道L1及L2代表之第五組通道601及第六組通道602,其中,通道L1及L2相應於個別組通道之總和,例如如第一編碼格式F1中將相同增益c1,...,c5用於重縮放。類似地,附加五通道訊號R、RS、RB、TFR、TBR區分為由個別通道R1及R2代表之附加第五組通道603及第六組通道604。
在第三編碼格式F3中,四通道LS、LB、TFL及TBL係由第二通道L2代表。儘管在第三編碼格式F3中,11.1通道音頻訊號之高保真度參數重建可能較在其他編碼格式中更難,第三編碼格式F3例如可用於5.1通道播放。
發明者已理解,依據編碼格式F1、F2、F3之一者,與11.1通道音頻訊號之5.1通道代表相關聯之元資料,可用以產生依據編碼格式F1、F2、F3之另一者之5.1通道代表,而未首先重建原始11.1通道訊號。代表11.1通道音頻訊號之左半平面的五通道訊號L、LS、LB、TFL、TBL,及代表右半平面之附加五通道訊號R、RS、 RB、TFR、TBR,可類似地處理。
依據m1=x1+x2+x3,假定三個通道x1、x2、x3已加總形成m1,且x1及x2+x3將重建。所有三個通道x1、x2、x3可從降混通道重建為 藉由採用於編碼器端決定之升混參數ci,1i3,及pij,1i3,1j2,以及獨立去相關器D1及D2。假定採用之升混參數滿足c1+c2+c3=1,且對k=1、2而言,p1k+p2k+p3k=0,則訊號x1及x2+x3可重建為 其可表示為 其中,該二個去相關器D1及D2已由單一去相關器D1取代,且其中,p1 2=p11 2+p12 2。依據m2=x4+x5,若二個通道x4及x5已加總以形成第二降混通道m2,則訊號x1及x2+x3+x4+x5可重建為 如以下所描述,依據第一編碼格式F1之訊號共形,方程式(2)可用以產生第三編碼格式F3之訊號共形。
通道x4及x5可重建為 採用去相關器D3及滿足d1+d2=1及q1+q2=0之升混參數。依據方程式(1)及(3),訊號x1+x4及x2+x3+x5可重建為 及為 其中,來自該二個去相關器D1及D3(亦即,保存其輸入訊號能量之類型的去相關器)之貢獻已近似來自單一去相關器D1(亦即,保存其輸入訊號能量之類型的去相關器)之貢獻。近似可與保真度之極小感知損失相關聯,特別是若降混通道m1、m2係不相關,且若值a=p1及b=q1用於加權a及b。依據降混通道m1、m2於編碼器端產生之編碼格式,例如可挑選用以保持降混通道m1、m2間之相關 低。如以下所描述,方程式(4)可用以依據第一編碼格式F1之訊號共形,產生第二編碼格式F2之訊號共形。
方程式(4)之結構可選地修改為 其中,採用增益因子g=(a2+b2)1/2以調整至去相關器D1之輸入訊號的功率。亦可採用其他值之增益因子,諸如g=(a2+b2)1/v,0<v<1。
若採用第一編碼格式F1提供11.1通道訊號之參數代表,並在解碼器端需要第二編碼格式F2呈現音頻內容,則於左及右端施加方程式(4)之近似,並以波浪符號表示若干左端品質之近似性質(輸出訊號之四個通道),產出 其中,依據第二編碼格式F2 L+TFL LS+LB+TBL, R+TFR RS+RB+TBR, 其中,SL=D(a L L 1 +bLL2)及SR=D(a R R 1 +bRR2),其中,c 1,L 、d 1,L 、a L 、bL及c1,R、d1,R、aR,、bR分別為來自方程式(4)之參數c1、d1、a、b的左通道及右通道版本,且其中,D標示去相關算子。因此,可依據升混參數而從第一編碼格式F1獲得第二編碼格式F2之近似,用於11.1通道音頻訊號之參數重建,不需實際重建11.1通道音頻訊號。
若採用第一編碼格式F1提供11.1通道訊號之參數代表,並在解碼器端需要第三編碼格式F3呈現音頻內容,則於左及右端施加方程式(2)之近似,並表示若干左端品質之近似性質,產出 其中,藉由第三編碼格式F3 L LS+LB+TFL+TBL, R RS+RB+TFR+TBR,其中,c 1,L 、p 1,L 及c1,R、p1,分別為來自方程式(2)之參數 c1及p1的左通道及右通道版本,且其中,D標示去相關算子。因此,可依據升混參數而從第一編碼格式F1獲得第三編碼格式F3之近似,用於11.1通道音頻訊號之參數重建,不需實際重建11.1通道音頻訊號。
若採用第二編碼格式F2提供11.1通道訊號之參數代表,並在解碼器端需要第一編碼格式F1或第三編碼格式F3呈現音頻內容,則可使用相同概念衍生與方程式(5)及(6)中呈現的類似關係。
若採用第三編碼格式F3提供11.1通道訊號之參數代表,並在解碼器端需要第一編碼格式F1或第二編碼格式F2呈現音頻內容,則可採用以上描述之至少若干概念。然而,因為由通道L 2代表之第六組通道602包括四通道LS、LB、TFL、TBL,例如一個以上去相關通道可用於左手端(及類似地用於右手端),且例如可不包括僅代表通道L之及其他通道做為至任何去相關器之輸入。
如以上所描述,可採用自5.1通道參數代表用於11.1通道音頻訊號之參數重建的升混參數(共形編碼格式F1、F2及F3之一者),以獲得11.1通道音頻訊號之替代5.1通道代表(共形其他編碼格式F1、F2及F3之任一者)。在其他範例實施例中,可依據為編碼器端具體決定之混合參數,而獲得替代5.1通道代表。現在將描述決定該等混合參數之一方式。
提供從四個音頻訊號u1、u2、u3、u4形成之二個音頻訊號y1=u1+u2及y2=u3+u4,可獲得二個音頻訊號 z1=u1+u3及z2=u2+u4之近似。可依據下式從y1及y2估計差異z1-z2為最小平方估計,z 1-z 2=αy 1+βy 2+r,其中,誤差訊號r正交於y1及y2。採用z1+z2=y1+y2,則可衍生 為達到恢復訊號z1及z2之正確共變數結構的近似,可由相同功率之去相關訊號取代誤差訊號r,例如型式γD(y1+y2),其中,D標示去相關,且其中,調整參數γ以保存訊號功率。採用方程式(7)之不同參數化,近似可表示為
若第一編碼格式F1用於提供11.1通道訊號之參數代表,及在解碼器端希望第二編碼格式F2用於呈現音頻內容,則將左手端之z1=L+TFL、z2=LS+LB+TBL、y1=L+LS+LB、及y2=TFL+TBL,與z1=R+TFR、z2=RS+RB+TBR、y1=R+RS+RB、及y2=TFR+TBR施加於方程式(8)之近似,並藉由波浪符號表示若干左端品質之近似性質,產出: 藉由第一編碼格式F1 L+TFL LS+LB+TBL, R+TFR,及 RS+RB+TBRL=D(L1+L2)及γR=D(R1+R2),且其中,cL、dL、γL及cR、dR、γR分別為來自方程式(8)之參數c、d、γ之左通道及右通道版本,其中,D標示去相關。因此,可依據混合參數cL、dL、γL、cR、dR及γR,例如在編碼器端為與降混訊號一同傳輸至解碼器端之目的而決定者,而從第一編碼格式F1獲得第二編碼格式F2之近似。使用混合參數允許用於來自編碼器端之增加的控制。由於原始11.1通道音頻訊號可用於編碼器端,例如可於編碼器端調整混合參數,以便增加第二編碼格式F2之近似的保真度。
類似地,可依據類似混合參數而從第一編碼格式F1獲得第三編碼格式F3之近似。亦可從第二編碼格式F2獲得第一編碼格式F1及第三編碼格式F3之類似近似。
如方程式(9)中可見,輸出訊號,之二個通 道接收來自去相關訊號rL之等量貢獻,但相反符號。相應情況分別適於方程式(5)及(6)中來自去相關訊號SL及D(L1)之貢獻。
如方程式(9)中可見,控制從降混訊號至第一通道L1至輸出訊號之第一通道之貢獻的混合係數cL,及控制從降混訊號至第一通道L1至輸出訊號之第二通道之貢獻的混合係數1-CL的總和,具有值1。方程式(5)及(6)中亦保持相應關係。
圖1為依據範例實施例之編碼部100之廣義方塊圖,用於編碼M通道訊號做為二通道降混訊號及相關聯的元資料。
文中以參照圖4描述之五通道訊號L、LS、LB、TFL及TBL示例M通道音頻訊號,及以依據參照圖4描述之第一編碼格式F1運算之第一通道L1及第二通道L2示例降混訊號。可設想範例實施例,其中,編碼部100依據參照圖4至6描述之任一編碼格式運算降混訊號。亦可設想範例實施例,其中,編碼部100依據M通道音頻訊號而運算降混訊號,其中,M4。尤其,將理解的是類似於以上描述及在方程式(5)、(6)及(9)之前之運算及近似,可實施為例如實施例,其中,M=4或M6。
編碼部100包含降混部110及分析部120。藉由形成降混訊號之第一通道L1,做為五通道音頻訊號之第一組通道401的線性組合(例如,做為總和),及藉由形成降混訊號之第二通道L2,做為五通道音頻訊號之第二 組通道402的線性組合(例如,做為總和),降混部110依據五通道音頻訊號運算降混訊號。第一及第二組401、402組成五通道音頻訊號之五通道L、LS、LB、TFL、TBL的分區。分析部120決定升混參數αLU,用於參數解碼器中來自降混訊號之五通道音頻訊號的參數重建。分析部120亦決定混合參數αLM,用於依據降混訊號而獲得二通道輸出訊號。
在範例實施例中,輸出訊號為依據參照圖5描述之第二編碼格式F2的五通道音頻訊號之二通道代表。然而,亦可設想範例實施例,其中,輸出訊號代表依據參照圖4至6描述之任一編碼格式的五通道音頻訊號。
輸出訊號之第一通道近似五通道音頻訊號之第三組通道501之線性組合(例如,總和),及輸出訊號之第二通道近似五通道音頻訊號之第四組通道502之線性組合(例如,總和)。第三及第四組501、502組成與第一及第二組通道401、402提供之五通道音頻訊號之五通道L、LS、LB、TFL、TBL的不同分區。尤其,第三組501包含來自第一組401之通道L,同時第四組502包含來自第一組401之通道LS及LB。
編碼部100輸出降混訊號L1及L2及相關聯元資料,用於聯合儲存及/或傳輸至解碼器端。元資料包含升混參數αLU及混合參數αLM。混合參數αLM可攜帶充分資訊,用於採用方程式(9)以依據降混訊號L1、L2而獲得輸出訊號,。混合參數αLM例如可包括參數cL、dL、γL 或甚至方程式(9)中最左矩陣之所有元件。
圖2為依據範例實施例之包含參照圖1描述之編碼部100之音頻編碼系統200的廣義方塊圖。在範例實施例中,例如由一或更多個聲波換能器201記錄,或由音頻編寫裝備201產生之音頻內容,係以參照圖4至6描述之11.1通道音頻訊號之形式提供。正交鏡相濾波器(QMF)分析部202一個時間段一個時間段地將五通道音頻訊號L、LS、LB、TFL、TBL轉換為QMF域,用於時間/頻率區塊形式之五通道音頻之編碼部100的處理。音頻編碼系統200包含附加編碼部203,類似於編碼部100及適以編碼附加五通道音頻訊號R、RS、RB、TFR及TBR,做為附加二通道降混訊號R1、R2及相關聯的元資料,包含附加升混參數αRU及附加混合參數αRM。附加混合參數αRM例如可包括來自方程式(9)之參數cR、dR及γR。QMF分析部202亦將附加五通道音頻訊號R、RS、RB、TFR及TBR轉換為QMF域,用於附加編碼部203的處理。由編碼部100輸出之降混訊號L1、L2由QMF合成部204從QMF域回退轉換,並由轉換部205轉換為改良型離散餘弦轉換(MDCT)域。量化部206及207分別量化升混參數αLU及混合參數αLM。例如,可採用具0.1或0.2(無因次)之步驟尺寸的均勻量化,其後為霍夫曼編碼形式之熵編碼。例如可採用具步驟尺寸0.2之粗糙量化以節省傳輸頻寬,及例如可採用具步驟尺寸0.1之更精細量化以改進解碼器端之重建保真度。類似地,由附加編碼部 203輸出之附加降混訊號R1、R2藉由QMF合成部208而從QMF域回退轉換,及藉由轉換部209轉換為MDCT域。量化部210及211分別量化附加升混參數αRU及附加混合參數αRM。通道C及LFE亦由個別轉換部214及215轉換為MDCT域。MDCT轉換之降混訊號及通道及量化之元資料接著由多工器216組合為位元流,用於傳輸至解碼器端。音頻編碼系統200亦可包含核心編碼器(圖2中未顯示),組構成以於降混訊號及通道C及LFE提供至多工器216之前,編碼降混訊號L1、L2,附加降混訊號R1、R2及使用感知音頻編解碼器之通道C及LFE,諸如杜比數位或MPEG AAC。例如相應於-8.7dB之剪輯增益,例如可在形成之前施加於降混訊號L1、L2、附加降混訊號R1、R2、及通道C。
圖3為依據範例實施例之音頻編碼系統200實施之音頻編碼方法300的流程圖。音頻編碼方法300包含:接收310五通道音頻訊號L、LS、LB、TFL、TBL;依據五通道音頻訊號而運算320二通道降混訊號L1、L2;決定330升混參數αLU;決定340混合參數αLM;及輸出350降混訊號及元資料,用於聯合儲存及/或傳輸,其中,元資料包含升混參數αLU及混合參數αLM
圖7為依據範例實施例之解碼部700之廣義方塊圖,用於依據二通道降混訊號L1、L2及相關聯的元資料而提供二通道輸出訊號,
在範例實施例中,降混訊號L1、L2為參照圖 1描述之編碼部100輸出之降混訊號L1、L2,與由編碼部100輸出之升混參數αLU及混合參數αLM相關聯。如參照圖1及4所描述,升混參數αLU係適用於依據降混訊號L1、L2之五通道音頻訊號L、LS、LB、TFL、TBL的參數重建。然而,亦可設想實施例,其中,升混參數αLU係適用於M通道音頻訊號之參數重建,其中,M=4或M6。
在範例實施例中,降混訊號之第一通道L1相應於五通道音頻訊號之第一組通道401的線性組合(例如,總和),及降混訊號之第二通道L2相應於五通道音頻訊號之第二組通道402的線性組合(例如,總和)。第一及第二組401、402組成五通道音頻訊號之五通道L、LS、LB、TFL、TBL的分區。
在範例實施例中,解碼部700接收二通道降混訊號L1、L2及升混參數αLU,及依據降混訊號L1、L2及升混參數αLU而提供二通道輸出訊號,。解碼部700包含去相關部710及混合部720。去相關部710接收降混訊號L1、L2,並基此及依據升混參數(比較方程式(4)及(5))而輸出單一通道去相關訊號D。混合部720依據升混參數αLU而決定一組混合係數,並依據混合係數而形成輸出訊號,做為降混訊號L1、L2及去相關訊號D之線性組合。換言之,混合部720實施從三通道至二通道之投射。
在範例實施例中,解碼部700依據參照圖5描述之第二編碼格式F2而組構成提供輸出訊號,,並 因此形成依據方程式(5)之輸出訊號,。換言之,混合係數相應於方程式(5)之最左矩陣中之元件,並可依據升混參數αLU由混合部決定。
因此,混合部720決定混合係數,使得輸出訊號之第一通道近似五通道音頻訊號L、LS、LB、TFL、TBL之第三組通道501的線性組合(例如,總和),及使得輸出訊號之第二通道近似五通道音頻訊號L、LS、LB、TFL、TBL之第四組通道的線性組合(例如,總和)。如參照圖5所描述,第三及第四組501、502組成五通道音頻訊號之五通道訊號L、LS、LB、TFL、TBL的分區,且第三及第四組501、502包含來自第一組通道401之至少一通道。
在若干範例實施例中,用於來自降混訊號L1、L2及來自去相關訊號之五通道音頻訊號L、LS、LB、TFL、TBL之參數重建的係數,可由緊密形式之升混參數αLU代表,包括較用於參數重建之實際係數數字更少之參數。在該等實施例中,可依據所採用特定緊密形式之知識,而於解碼器端衍生實際係數。
圖8為依據範例實施例之音頻解碼系統800的廣義方塊圖,包含參照圖7所描述之解碼部700。
例如包括解多工器之接收部801,接收從參照圖2描述之音頻編碼系統200傳輸的位元流B,並從位元流B提取降混訊號L1、L2及相關聯的升混參數αLU、附加降混訊號R1、R2及相關聯的附加升混參數αRU、以及通道 C及LFE。
儘管混合參數αLM及附加混合參數αRM在位元流B中可用,在本範例實施例中,該些參數並未被音頻解碼系統800採用。換言之,本範例實施例之音頻解碼系統800與未提取該等混合參數之位元流相容。以下將參照圖9進一步描述採用混合參數αLM之解碼部。
在降混訊號L1、L2之狀況下,在位元流B中使用感知音頻編解碼器編碼附加降混訊號R1、R2及/或通道C及LFE,諸如杜比數位、MPEG AAC、或其發展,音頻解碼系統800可包含核心解碼器(圖8中未顯示)組構成當從位元流B提取時,解碼個別訊號及通道。
轉換部802藉由實施反向MDCT而轉換降混訊號L1、L2,及QMF分析部803將降混訊號L1、L2轉換為QMF域,用於時間/頻率區塊形式之降混訊號L1、L2之解碼部700的處理。反量化部804於將升混參數αLU供應至解碼部700之前,例如從熵編碼格式反量化升混參數αLU。如參照圖2所描述,量化可經實施而具二不同步驟尺寸之一者,例如0.1或0.2。採用之實際步驟尺寸可預先定義,或可例如經由位元流B而從編碼器端發信號通知音頻解碼系統800。
在範例實施例中,音頻解碼系統800包含附加解碼部805,類似於解碼部700。附加解碼部805組構成接收參照圖2及4描述之附加二通道降混訊號R1、R2,及附加元資料包括附加升混參數αRU,用於依據附加 降混訊號R1、R2之附加五通道音頻訊號R、RS、RB、TFR、TB的參數重建。附加解碼部805組構成依據降混訊號及附加升混參數αRU而提供附加二通道輸出訊號,。附加輸出訊號,提供與參照圖5描述之第二編碼格式F2共形之附加五通道音頻訊號R、RS、RB、TFR、TBR的代表。
轉換部806藉由實施反向MDCT而轉換附加降混訊號R1、R2,及QMF分析部807將附加降混訊號R1、R2轉換為QMF域,用於時間/頻率區塊形式之附加降混訊號R1、R2之附加解碼部805的處理。反量化部808在供應附加升混參數αRU至附加解碼部805之前,例如從熵編碼格式反量化附加升混參數αRU
在範例實施例中,剪輯增益已施加於編碼器端之降混訊號L1、L2、附加降混訊號R1、R2、及通道C,例如相應於8.7dB之相應增益可於音頻解碼系統800施加該些訊號,以補償剪輯增益。
在參照圖8所描述之範例實施例中,將分別由解碼部700及附加解碼部805輸出之輸出訊號,及附加輸出訊號,,於與通道C及LFE一起提供做為音頻解碼系統800之輸出,用於在包括例如五揚聲器及超低音揚聲器之多揚聲器系統812上播放之前,由QMF合成部811從QMF域回退轉換。轉換部809、810藉由在該些通道包括於音頻解碼系統800之輸出中之前,實施反向MDCT而將通道C及LFE轉換為時域。
例如可從離散編碼形式之位元流B提取通道C及LFE,且解碼系統800例如可包含單一通道解碼部(圖8中未顯示),組構成解碼個別離散編碼通道。單一通道解碼部例如可包括核心解碼器,用於使用感知音頻編解碼器解碼音頻內容編碼,諸如杜比數位、MPEG AAG、或其發展。
圖9為依據範例實施例之替代解碼部900的廣義方塊圖。解碼部900與參照圖7所描述之解碼部700類似,除了解碼部900採用編碼部100提供之混合參數αLM,如參照圖1所描述,而非採用亦由編碼部100提供之升混參數αLU以外。
類似於解碼部700,解碼部900包含去相關部910及混合部920。去相關部910組構成接收由參照圖1所描述之編碼部100提供之降混訊號L1、L2,並依據降混訊號L1、L2而輸出單一通道去相關訊號D。混合部920依據混合參數αLM而決定一組混合係數,並依據混合係數形成輸出訊號,,做為降混訊號L1、L2及去相關訊號D之線性組合。混合部920無關於升混參數αLU而決定混合參數,並藉由實施從三至二通道之投射而形成輸出訊號,
在範例實施例中,解碼部900組構成依據參照圖5描述之第二編碼格式F2而提供輸出訊號,,及因此依據方程式(9)而形成輸出訊號,。換言之,接收到之混合參數αLM可包括方程式(9)之最左矩陣中之參數 cL、dL、γL,且如關於方程式(9)所描述,可於編碼器端決定混合參數αLM。因此,混合部920決定混合係數,使得輸出訊號之第一通道近似參照圖4至6所描述之五通道音頻訊號L、LS、LB、TFL、TBL之第三組通道501的線性組合(例如,總和),及使得輸出訊號之第二通道近似五通道音頻訊號L、LS、LB、TFL、TBL之第四組通道502的線性組合(例如,總和)。
例如可藉由參照圖2所描述之音頻編碼系統200,而從位元流B輸出提取降混訊號L1、L2及混合參數αLM。本範例實施例之解碼部900可不採用亦於位元流B中編碼之升混參數αLU,因此不需從位元流B提取。
圖10為依據範例實施例之音頻解碼方法1000的流程圖,用於依據二通道降混訊號及相關聯的升混參數而提供二通道輸出訊號。例如可藉由參照圖8所描述之音頻解碼系統800實施解碼方法1000。
解碼方法1000包含依據降混訊號而接收1010二通道降混訊號,其與包含升混參數之元資料相關聯,用於參照圖4至6所描述之五通道音頻訊號L、LS、LB、TFL、TBL的參數重建。降混訊號例如可為參照圖1所描述之降混訊號L1、L2,並可與相關於圖4所描述之第一編碼格式F1共形。解碼方法1000進一步包含接收1020至少若干元資料。接收到之元資料例如可包括參照圖1所描述之升混參數αLU及/或混合參數αLM。解碼方法1000進一步包含:依據降混訊號之至少一通道而產生1040去相 關訊號;依據接收到之元資料而決定1050一組混合係數;及依據混合係數而形成1060二通道輸出訊號,做為降混訊號及去相關訊號之線性組合。二通道輸出訊號例如可為參照圖7及8所描述之二通道輸出訊號,,並可與參照圖5所描述之第二編碼格式F2共形。換言之,可決定混合係數而使得:輸出訊號之第一通道近似第三組通道501之線性組合,及輸出訊號之第二通道近似第四組通道502之線性組合。
解碼方法1000可選地包含:接收1030表示接收到之降混訊號L1、L2分別與參照圖4及5所描述之第一編碼格式F1及第二編碼格式F2之一者共形的信令。可預先定義第三及第四組501、502及可決定混合係數,使得輸出訊號,之通道近似之第三及第四組通道501、502中五通道音頻訊號L、LS、LB、TFL、TBL之單一分區維持用於接收到之降混訊號的二可能編碼格式F1、F2。解碼方法1000可選地包含回應於表示由於接收到之降混訊號L1、L2之編碼格式符合輸出訊號,中將提供之編碼格式,接收到之降混訊號共形第二編碼格式F2的信令,通過1070降混訊號L1、L2做為輸出訊號,(及/或抑制從去相關訊號至輸出訊號之貢獻)。
圖11示意地繪示依據範例實施例之電腦可讀取媒體1100。電腦可讀取媒體1100代表:參照圖1及4所描述之二通道降混訊號L1、L2;參照圖1所描述之升混參數αLU,允許依據降混訊號L1、L2之五通道音頻訊號 L、LS、LB、TFL、TBL的參數重建;以及參照圖1所描述之混合參數αLM
將理解的是儘管參照圖1所描述之編碼部100,組構成依據第一編碼格式F1而編碼11.1通道音頻訊號,並提供混合參數αLM用於提供與第二編碼格式F2共形之輸出訊號,可提供類似編碼部,其係組構成依據編碼格式F1、F2、F3之任一者而編碼11.1通道音頻訊號,並提供混合參數用於提供與第一格式F1、F2、F3之任一者共形之輸出訊號。
亦將理解的是儘管參照圖7及9所描述之解碼部700、900,係組構成依據與第一編碼格式F1共形之降混訊號而提供與第二編碼格式F2共形之輸出訊號,可提供類似解碼部,其係組構成依據與編碼格式F1、F2、F3之任一者共形之降混訊號,而提供與編碼格式F1、F2、F3之任一者共形之輸出訊號。
由於參照圖6所描述之第六組通道602包括四通道,將理解的是依據與第三編碼格式F3共形之降混訊號,而提供與第一或第二編碼格式F1、F2共形之輸出訊號,例如可包括:採用一個以上去相關通道;及/或採用降混訊號之不超過一個通道,做為至去相關部之輸入。
將理解的是儘管以上描述之範例已依據參照圖4至6所描述之11.1通道音頻訊號而用公式表示,可設想編碼系統及解碼系統,其分別包括任何數量之編碼部或解碼部,且其可組構成處理包含任何數量之M通道音 頻訊號的音頻訊號。
圖12為依據範例實施例之解碼部1200的廣義方塊圖,用於依據二通道降混訊號L1、L2及相關聯的元資料而提供K通道輸出訊號,...,。解碼部1200類似於參照圖7所描述之解碼部700,除了解碼部1200提供K通道輸出訊號,...,,其中,2K<M,而非2通道輸出訊號,以外。
更具體地,解碼部1200組構成接收二通道降混訊號L1、L2,其與元資料相關聯,元資料包含升混參數αLU,用於依據降混訊號L1、L2之M通道音頻訊號的參數重建,其中,M4。降混訊號L1、L2之第一通道L1相應於M通道音頻訊號之第一組一或更多個通道的線性組合(或總和)(例如,參照圖4所描述之第一組401)。降混訊號L1、L2之第二通道L2相應於M通道音頻訊號之第二組一或更多個通道的線性組合(或總和)(例如,參照圖4所描述之第二組402)。第一及第二組組成M通道音頻訊號之M通道的分區。換言之,第一及第二組不相交及一起包括M通道音頻訊號之所有通道。
解碼部1200係組構成接收至少一部分的元資料(例如,包括升混參數αLU),及依據降混訊號L1、L2及接收到之元資料而提供K通道輸出訊號,...,。解碼部1200包含去相關部1210,係組構成接收降混訊號L1、L2之至少一通道,並基此輸出去相關訊號D。解碼部1200進一步包含混合部1220,係組構成依據接收到之元資料 而決定一組混合係數,並依據混合係數而形成輸出訊號,...,,做為降混訊號L1、L2及去相關訊號D之線性組合。混合部1220組構成決定混合係數,使得輸出訊號,...,之每一K通道近似M通道音頻訊號之一或更多個通道組的線性組合。決定混合係數使得相應於輸出訊號,...,之個別通道的組組成K組一或更多個通道中M通道音頻訊號之M通道的分區,及使得至少二個K組包含來自M通道訊號之第一組通道的至少一通道(亦即,相應於降混訊號之第一通道L1的組)。
去相關訊號D例如可為單一通道訊號。如圖12中所表示,去相關訊號D例如可為二通道訊號。在若干範例實施例中,去相關訊號D可包含二個以上通道。
M通道訊號例如可為參照圖4所描述之五通道訊號L、LS、LB、TFL、TBL,及降混訊號L1、L2例如可為依據參照圖4-6所描述之編碼格式F1、F2、F3之任一者之五通道訊號L、LS、LB、TFL、TBL的二通道代表。
參照圖8所描述之音頻解碼系統800例如可包含參照圖12所描述之類型的一或更多個解碼部1200,而非解碼部700及805,且多揚聲器系統812例如可包括參照圖8所描述之五個以上揚聲器及超低音揚聲器。
音頻解碼系統800例如可適以實施參照圖10所描述之音頻解碼方法,類似於音頻解碼方法1000,除了提供K通道輸出訊號而非二通道輸出訊號以外。
以下將參照圖12-16描述解碼部1200及音頻 解碼系統800之範例實施。
類似於圖4-6,圖12-13繪示區分一或更多個通道組中11.1通道音頻訊號的替代方式。
為代表11.1通道(或7.1+4通道,或7.1.4通道)音頻訊號做為7.1通道(或5.1+2通道或5.1.2通道)音頻訊號,通道L、LS、LB、TFL、TBL、R、RS、RB、TFR、TBR、C、及LFE之聚集可區分為由個別通道代表之通道組。五通道音頻訊號L、LS、LB、TFL、TBL可由三通道訊號L1、L2、L3代表,同時附加五通道音頻訊號R、RS、RB、TFR、TBR可由附加三通道訊號R1、R2、R3代表。在11.1通道音頻訊號之7.1通道代表中,通道C及LFE亦可保持做為分離通道。
圖13繪示第四編碼格式F4,其提供11.1通道音頻訊號之7.1通道代表。在第四編碼格式F4中,五通道音頻訊號L、LS、LB、TFL、TBL區分為僅包括通道L之第一組通道1301、包括通道LS、LB之第二組通道1302、及包括通道TFL、TBL之第三組通道1303。三通道訊號L1、L2、L3之通道L1、L2、L3相應於個別組通道1301、1302、1303之線性組合(例如,加權或非加權總和)。類似地,附加五通道音頻訊號R、RS、RB、TFR、TBR區分為包括通道R之附加第一組1304、包括通道RS、RB之附加第二組1305、及包括通道TFR、TBR之附加第三組1306。附加三通道訊號R1、R2、R3之通道R1、R2、R3相應於個別附加組通道1304、1305、1306之線性 組合(例如,加權或非加權總和)。
發明者已理解,可採用與依據第一、第二及第三編碼格式F1、F2、F3之一者之11.1通道音頻訊號之5.1通道代表相關聯之元資料,以產生依據第四編碼格式F4之7.1通道代表,而未首先重建原始11.1通道訊號。五通道訊號L、LS、LB、TFL、TBL代表11.1通道音頻訊號之左半平面,及附加五通道訊號R、RS、RB、TFR、TBR代表右半平面,可類似地處理。
回憶二通道x4及x5可使用方程式(3)從總和=x4+x5重建。
若第二編碼格式F2用於提供11.1通道訊號之參數代表,且在解碼器端希望第四編碼格式F4用於呈現音頻內容之7.1通道,則可施加方程式(1)提供之近似x 1=TBL,x 2=LS,x 3=LB,接著x 1=TBR,x 2=RS,x 3=RB,可施加方程式(3)提供之近似x 4=L,x 5=TFL,接著x 4=R,x 5=TFR.以波浪符號表示若干左端品質(輸出訊號之六通道)之近似 性質,方程式(1)及(3)之該等應用產出 其中 且其中,依據第四編碼格式F4 在上述矩陣A中,參數c1,L、p1,L及c1,R、p1,R分別為來自方程式(1)之升混參數c1、p1之左通道及右通道版本,參數d1,L、q1,L及d1,R、q1,R分別為來自方程式(3)之升混參數d1、q1之左通道及右通道版本,及D標示去相關算子。因此,可依據升混參數(例如,參照圖1及2所描述 之升混參數αLU、αRU)從第二編碼格式F2獲得第四編碼格式F4之近似,用於11.1通道音頻訊號之參數重建,而未實際重建11.1通道音頻訊號。
參照圖12所描述之解碼部1200的二實例(具K=3、M=5,及二通道去相關訊號D),可提供近似第四編碼格式F4之三通道訊號L1、L2、L3及R1、R2、R3的三通道輸出訊號,,,,。更具體地,依據方程式(10)之矩陣A,解碼部1200之混合部1220可依據升混參數決定混合係數。音頻解碼系統類似於參照圖8所描述之音頻解碼系統800,可採用二該等解碼部1200而提供7.1通道播放之11.1音頻訊號的7.1通道代表。
若第一編碼格式F1用於提供11.1通道訊號之參數代表,且在解碼器端希望第四編碼格式F4用於呈現音頻內容,則可施加方程式(1)提供之近似x 1=L,x 2=LS,x 3=LB,接著x 1=R,x 2=RS,x 3=RB.以波浪符號表示若干左端品質(輸出訊號之六通道)之近似性質,方程式(1)之該等應用產出 其中,依據第四編碼格式F4 L, LS+LB,=TFL+TBL(未近似), R, RS+RB,=TFR+TBR(未近似)。在上述方程式(11)中,參數c1,L、p1,L及c1,R、p1,R分別為來自方程式(1)之參數c1、p1之左通道及右通道版本,及D標示去相關算子。因此,可依據升混參數從第一編碼格式F1獲得第四編碼格式F4之近似,用於11.1通道音頻訊號之參數重建,而未實際重建11.1通道音頻訊號。
參照圖12所描述之解碼部1200的二實例(具K=3及M=5),可提供近似第四編碼格式F4之三通道訊號L1、L2、L3及R1、R2、R3的三通道輸出訊號,,,,。更具體地,依據方程式(11),解碼部之混合部1220可依據升混參數決定混合係數。音頻解碼系統類似於參照圖8所描述之音頻解碼系統800,可採用二該等解碼部1200而提供7.1通道播放之11.1音頻訊號的7.1通道代表。
如方程式(11)中可見,實際上僅需二去相關通 道。儘管從第一編碼格式F1提供第四編碼格式F4不需去相關通道D(L2)及D(R2),該等去相關器例如可保持運行(或保持作用),使得去相關器之緩衝器/記憶體保持更新及在降混訊號之編碼格式改變為例如第二編碼格式F2之狀況下可用。回憶當從第二編碼格式F2提供第四編碼格式F4時係採用四個去相關通道(詳方程式(10)及相關聯矩陣A)。
若第三編碼格式F3用於提供11.1通道音頻訊號之參數代表,及在解碼器端需要第四編碼格式F4用於呈現音頻內容,則可使用相同概念衍生與方程式(10)及(11)中呈現之類似關係。依據第四編碼格式F4,類似於參照圖8所描述之音頻解碼系統800的音頻解碼系統,可採用二解碼部1200而提供11.1音頻訊號之7.1通道代表。
為代表11.1通道音頻訊號做為9.1通道(或5.1+4通道、或5.1.4通道)音頻訊號,通道L、LS、LB、TFL、TBL、R、RS、RB、TFR、TBR、C、及LFF之聚集可區分為由個別通道代表之通道組。五通道音頻訊號L、LS、LB、TFL、TBL可由四通道訊號L1、L2、L3、L4代表,同時附加五通道音頻訊號R、RS、RB、TFR、TBR可由附加四通道訊號R1、R2、R3、R4代表。通道C及LFE亦可保持做為11.1通道音頻訊號之9.1通道代表中的分離通道。
圖14繪示第五編碼格式F5,提供11.1通道音頻訊號之9.1通道代表。在第五編碼格式中,五通道音 頻訊號L、LS、LB、TFL、TBL區分為僅包括通道L之第一組通道1401、包括通道LS、LB之第二組通道1402、僅包括通道TFL之第三組通道1403、及僅包括通道TBL之第四組通道1404。四通道訊號L1、L2、L3、L4之通道L1、L2、L3、L4相應於個別組一或更多個通道1401、1402、1403、1404的線性組合(例如,加權或非加權總和)。類似地,附加五通道音頻訊號R、RS、RB、TFR、TBR區分為包括通道R之附加第一組1405、包括通道RS、RB之附加第二組1406、包括通道TFR之附加第三組1407、及包括通道TBR之附加第四組1408。附加四通道訊號R1、R2、R3、R4之通道R1、R2、R3、R4相應於個別附加組一或更多個通道1405、1406、1407、1408的線性組合(例如,加權或非加權總和)。
發明者已理解,依據編碼格式F1、F2、F3之一者,與11.1通道音頻訊號之5.1通道代表相關聯之元資料可用以產生依據第五編碼格式F5之9.1通道代表,而未首先重建原始11.1通道訊號。代表11.1通道音頻訊號之左半平面之五通道訊號L、LS、LB、TFL、TBL,及代表右半平面之附加五通道訊號R、RS、RB、TFR、TBR可類似地處理。
若第二編碼格式F2用於提供11.1通道訊號之參數代表,且在解碼器端希望第五編碼格式F5用於呈現音頻內容,則可施加方程式(1)提供之近似 x 1=TBL,x 2=LS,x 3=LB,接著x 1=TBR,x 2=RS,x 3=RB,並可施加方程式(3)提供之近似x 4=L,x 5=TFL,接著x 4=R,x 5=TFR.以波浪符號表示若干左端品質(輸出訊號之八通道)之近似性質,方程式(1)及(3)之該等應用產出 其中 且其中,依據第五編碼格式F5 在上述矩陣A中,參數c1,L、p1,L及c1,R、p1,R分別為來自方程式(1)之升混參數c1、p1之左通道及右通道版本,參數d1,L、q1,L及d1,R、q1,R分別為來自方程式(3)之升混參數d1、q1之左通道及右通道版本,及D標示去相關算子。因此,可依據升混參數從第二編碼格式F2獲得第五編碼格式F5之近似,用於11.1通道音頻訊號之參數重建,而未實際重建11.1通道音頻訊號。
參照圖12所描述之解碼部1200的二實例(具K=3、M=5,及二通道去相關訊號D),可提供近似第五編碼格式F5之四通道訊號L1、L2、L3、L4及R1、R2、R3、R4的四通道輸出訊號,,,,,,。更具體地,依據方程式(12),解碼部之混合部1220可依據升混參數決定混合係數。音頻解碼系統類似於參照圖8所描述之音頻解碼系統800,可採用二該等解碼部1200而提供9.1通道播放之11.1音頻訊號的9.1通道代表。
若第一編碼格式F1或第三編碼格式F3用於提供11.1通道訊號之參數代表,且在解碼器端希望第五編碼格式F5用於呈現音頻內容,則可使用相同概念衍生與方程式(12)中呈現之類似關係。
圖15-16繪示區分13.1通道(或9.1+4通道、或9.1.4通道)音頻訊號為通道組之替代方式,用以代表13.1通道音頻訊號分別做為5.1通道音頻訊號及7.1通道訊號。
13.1通道音頻訊號包含通道LW(左大半)、LSCRN(左畫面)、LS(左端)、LB(左後)、TFL(左上前)、TBL(左上後)、RW(右大半)、RSCRN(右畫面)、RS(右端)、RB(右後)、TFR(右上前)、TBR(右上後)、C(中央)、及LFE(低頻效果)。六通道LW、LSCRN、LS、LB、TFL及TBL形成六通道音頻訊號,代表13.1通道音頻訊號之播放環境中的左半空間。四通道LW、LSCRN、LS及LB代表播放環境中不同水平方向,及二通道TFL及TBL代表與四通道LW、LSCRN、LS及LB之方向垂直分離的方向。例如可希望二通道TFL及TBL用於吸頂揚聲器中之播放。類似地,六通道RW、RSCRN、RS、RB、TFR及TBR形成附加六通道音頻訊號,代表播放環境之右半空間,四通道RW、RSCRN、RS、RB代表播放環境中的不同水平方向,及二通道TFR及TBR代表與四通道RW、RSCRN、RS及RB之方向垂直分離的方向。
圖15繪示第六編碼格式F6,其中,六通道音頻訊號LW、LSCRN、LS、LB、TFL及TBL區分為第一組通道LW、LSCRN、TFL 1501及第二組通道LS、LB、TBL 1502,且其中,附加六通道音頻訊號RW、RSCRN、RS、RB、TFR及TBR區分為附加第一組通道RW、 RSCRN、TFR 1503及附加第二組通道RS、RB、TBR 1504。二通道降混訊號L1、L2之通道L1、L2相應於個別組通道1501、1502之線性組合(例如,加權或非加權總和)。類似地,附加二通道降混訊號R1、R2之通道R1、R2相應於個別附加通道組1503、1504之線性組合(例如,加權或非加權總和)。
圖16繪示第七編碼格式F7,其中,六通道音頻訊號LW、LSCRN、LS、LB、TFL及TBL區分為第一組通道LW、LSCRN 1601、第二組通道LS、LB 1602、及第三組通道TFL、TBL 1603,且其中,附加六通道音頻訊號RW、RSCRN、RS、RB、TFR及TBR區分為附加第一組通道RW、RSCRN 1604、附加第二組通道RS、RB 1605、及附加第三組通道TFR、TBR 1606。三通道L1、L2、L3相應於個別組通道1601、1602、1603之線性組合(例如,加權或非加權總和)。類似地,三附加通道R1、R2、R3相應於個別附加組通道1604、1605、1606之線性組合(例如,加權或非加權總和)。
發明者已理解,依據第六編碼格式F6,與13.1通道音頻訊號之5.1通道代表相關聯之元資料可用以產生依據第七編碼格式F7之7.1通道代表,而未首先重建原始13.1通道訊號。代表13.1通道音頻訊號之左半平面六通道訊號LW、LSCRN、LS、LB、TFL及TBL,及代表右半平面之附加六通道訊號RW、RSCRN、RS、RB、TFR及TBR可類似地處理。
回憶二通道x4及x5可使用方程式(3)從總和m2=x4-x5而重建。
若第六編碼格式F6用於提供13.1通道訊號之參數代表,且在解碼器端希望第七編碼格式F7用於呈現音頻內容之7.1通道(或5.1+2通道或5.1.2通道),則可施加方程式(1)提供之近似x 1=TBL,x 2=LS,x 3=LB,接著x 1=TBR,x 2=RS,x 3=RB,接著x 1=TFL,x 2=LW,x 3=LSCRN,且接著x 1=TFR,x 2=RW,x 3=RSCRN,以波浪符號表示若干左端品質(輸出訊號之六通道)之近似性質,方程式(1)之該等應用產出 其中 且其中,依據第七編碼格式F7 在上述矩陣A中,參數c1,L、p1,L及c'1,L、p'1,L為用於左端之來自方程式(1)之升混參數c1、p1之二不同實例,參數c1,R、p1,R及c'1,R、p'1,R為用於右端之來自方程式(1)之升混參數c1、p1之二不同實例,及D標示去相關算子。因此,可依據升混參數從第六編碼格式F6獲得第七編碼格式F7之近似,用於13.1通道音頻訊號之參數重建,而未實際重建13.1通道音頻訊號。
參照圖12所描述之解碼部1200的二實例(具K=3、M=6,及二通道去相關訊號D),可於第六編碼格式F6中依據編碼器端產生之二通道降混訊號,而提供近似第七編碼格式F7之三通道訊號L1、L2、L3及R1、R2、R3的三通道輸出訊號,,,,。更具體地,依據來自方程式(13)之矩陣A,解碼部1200之混合部1220可依據升混參數而決定混合係數。音頻解碼系統類似於參照圖 8所描述之音頻解碼系統800,可採用二該等解碼部1200而提供7.1通道播放之13.1音頻訊號的7.1通道代表。
如方程式(10)-(13)(及相關聯矩陣A)中可見,若輸出訊號之二通道(例如,方程式(11)中之通道接收來自相同去相關通道(例如,方程式(11)中之D(L1))之貢獻,則該些二貢獻具有等量但相反符號(例如,由方程式(11)中混合係數p1,L及-p1,L所表示)。
如方程式(10)-(13)(及相關聯矩陣A)中可見,若輸出訊號之二通道(例如,方程式(11)中之通道接收來自相同降混通道(例如,方程式(11)中之通道L1)之貢獻,則控制該些二貢獻之二混合係數的總和(例如,方程式(11)中混合係數c1,L及-c1,L)具有值1。
如以上參照圖12-16所描述,解碼部1200可依據二通道降混訊號L1、L2及升混參數αLU,而提供K通道輸出訊號,...,。升混參數αLU可適用於原始M通道音頻訊號之參數重建,及解碼部1200之混合部1220可依據升混參數αLU,而運算適當混合參數,用於提供K通道輸出訊號,...,,而未重建M通道音頻訊號。
在若干範例實施例中,可從編碼器端發送專用混合參數αLM,以促進解碼器端K通道輸出訊號,...,之提供。
例如,解碼部1200可組構成類似於以上參照圖9所描述之解碼部900。
例如,解碼部1200可接收方程式(10)-(13)中 所示之一或更多個混合矩陣(亦即,矩陣A)之元件(或混合係數)形式之混合參數αLM。在該等範例中,解碼部1200於方程式(10)-(13)中不需運算混合矩陣中之任何元件。
可設想範例實施例,其中,參照圖1所描述之分析部120(及類似地參照圖2所描述之附加分析部202),依據降混訊號L1、L2而決定混合參數αLM,用於獲得K通道輸出訊號,其中,2K<M。例如可以方程式(10)-(13)之一或更多個混合矩陣(亦即,矩陣A)之元件(或混合係數)的形式提供混合參數αLM
例如可提供多個混合參數組,其中,個別混合參數組預備用於解碼器端呈現之不同類型。例如以上參照圖2描述之音頻編碼系統200可提供位元流B,其中,提供原始11.1通道音頻訊號之5.1降混代表,且其中,混合參數組αLM可提供用於5.1通道呈現(依據第一、第二及/或第三編碼格式F1、F2、F3)、用於7.1通道呈現(依據第四編碼格式F4)及/或用於9.1通道呈現(依據第五編碼格式F5)。
參照圖3所描述之音頻編碼方法300例如可包括決定340混合參數用於依據降混訊號L1、L2而獲得K通道輸出訊號,其中,2F<M。
可設想範例實施例,其中,參照圖11所描述之電腦可讀取媒體1100代表:二通道降混訊號(例如,參照圖1及4所描述之二通道降混訊號L1、L2);升混參數(例如,參照圖1所描述之升混參數αLU),允許依據降混 訊號之M通道音頻訊號(例如,五通道音頻訊號L、LS、LB、TFL、TBL)之參數重建;以及混合參數,允許依據降混訊號之M通道輸出訊號之提供。如以上所描述,M4及2K<M。
將理解的是儘管以上描述之範例已依據原始音頻訊號用公式表示具M=5及M=6通道,及輸出訊號具K=2、K=3及K=4通道,可設想類似編碼系統(及編碼部)及解碼系統(及解碼部),用於滿足M4及2K<M之任何M及K。
V. 等效、延伸、替代及雜項
即使本揭露描述及繪示特定範例實施例,本發明不限於該些特定範例。對以上範例實施例而言可實施修改及變化,而未偏離本發明之範圍,其僅由申請項所定義。
在申請項中,「包含」單詞並未排除其他元件或步驟,且不定冠詞並未排除複數。事實是在相互不同附屬項中提及之某測量並非表示該些測量之組合無法有利地使用。申請項中出現的任何參考符號並未理解為侷限其範圍。
以上所揭露之裝置及方法可實施為軟體、韌體、硬體或其組合。在硬體實施中,以上描述中所稱功能單元間之工作分工不一定相應於實體單元分工;相反地,一個實體組件可具有多個功能性,且一項工作可由若干實 體組件合作以分布的方式來實施。可實施某組件或所有組件為由數位處理器、訊號處理器或微處理器執行之軟體、或實施為硬體或專用積體電路。該等軟體可分布於電腦可讀取媒體上,其可包含電腦儲存媒體(或非暫態性媒體)及通訊媒體(或暫態性媒體)。如熟悉本技藝之人士所熟知,電腦儲存媒體包括揮發性及非揮發性,以任何方法或技術實施可移除及非可移除媒體用於資訊儲存,諸如電腦可讀取指令、資料結構、程式模組或其他資料。電腦儲存媒體包括但不侷限於RAM、ROM、EEPROM、快閃記憶體或其他記憶體技術、CD-ROM、數位影音光碟(DVD)或其他光碟儲存器、磁帶盒、磁帶、磁碟儲存器或其他磁性儲存裝置,或可用以儲存所欲資訊並可由電腦存取之任何其他媒體。此外,熟悉本技藝之人士熟知通訊媒體典型地體現電腦可讀取指令、資料結構、程式模組、或調變資料訊號中之其他資料,諸如載波或其他傳送機構,並包括任何傳送媒體。
VI. 範例列表
1.一種音頻解碼方法(1000),包含:接收(1010)二通道降混訊號(L1,L2),其與元資料相關聯,元資料包含升混參數(αLU),用於依據降混訊號之M通道音頻訊號(L,LS,LB,TFL,TBL)的參數重建,其中,M4,其中,降混訊號之第一通道(L1)相應於M通道音頻訊號之第一組(401)一或更多個通道的線性組合,其 中,降混訊號之第二通道(L2)相應於M通道音頻訊號之第二組(402)一或更多個通道的線性組合,且其中,第一組及第二組組成M通道音頻訊號之M通道的分區;接收(1020)至少一部分的元資料;依據降混訊號之至少一通道產生(1040)去相關訊號(D);依據接收到之元資料決定(1050)一組混合係數;以及依據混合係數形成(1060)二通道輸出訊號(,),做為降混訊號及去相關訊號之線性組合,其中,決定混合係數使得:輸出訊號之第一通道()近似M通道音頻訊號之第三組(501)一或更多個通道的線性組合;輸出訊號之第二通道()近似M通道音頻訊號之第四組(502)一或更多個通道的線性組合;第三組及第四組組成M通道音頻訊號之M通道的分區;以及第三組及第四組包含來自第一組之至少一通道。
2.範例1之音頻解碼方法,其中,接收到之元資料包括升混參數,且其中,混合係數係藉由處理升混參數決定。
3.範例1之音頻解碼方法,其中,接收到之元資料包括與升混參數不同之混合參數(αLM)。
4.範例3之音頻解碼方法,其中,混合係數係與升混參數之任何值無關地被決定。
5.前述範例的任一項之音頻解碼方法,其中,M=5。
6.前述範例的任一項之音頻解碼方法,其中,降混訊號之通道相應之控制從M通道音頻訊號之通道至線性組合的其中一者之貢獻的每一增益,符合控制從M通道音頻訊號之通道至輸出訊號之通道近似之線性組合的其中一者之貢獻的增益。
7.前述範例的任一項之音頻解碼方法,進一步包含初始步驟,接收代表降混訊號及元資料之位元流(B),其中,降混訊號及接收到之元資料係從位元流提取。
8.前述範例的任一項之音頻解碼方法,其中,去相關訊號為單一通道訊號,且其中,輸出訊號係藉由將不超過一個去相關訊號通道包括於降混訊號及去相關訊號之線性組合中而形成。
9.範例8之音頻解碼方法,其中,決定混合係數使得輸出訊號之二通道接收來自去相關訊號之通道的等量貢獻,從去相關訊號至輸出訊號之個別通道的貢獻具有相反符號。
10.範例8至9任一項之音頻解碼方法,其中,形成輸出訊號量以投射從三通道至二通道。
11.前述範例的任一項之音頻解碼方法,其中,決定混合係數使得控制從降混訊號之第一通道至輸出訊號之第一通道之貢獻之混合係數,及控制從降混訊號之 第一通道至輸出訊號之第二通道之貢獻之混合係數的總和具有值1。
12.前述範例的任一項之音頻解碼方法,其中,第一組由二或三通道組成。
13.前述範例的任一項之音頻解碼方法,其中,M通道音頻訊號包含代表M通道音頻訊號之播放環境中不同水平方向的三通道(L,LS,LB),及代表與播放環境中三通道之方向垂直分離之方向的二通道(TFL,TBL)。
14.範例13之音頻解碼方法,其中,第一組由三通道組成,且其中,第二組由二通道組成。
15.範例14之音頻解碼方法,其中,該第三組及第四組的其中一者包含該二通道。
16.範例14之音頻解碼方法,其中,該第三組及第四組之每一者包含該二通道之一。
17.前述範例的任一項之音頻解碼方法,其中,藉由處理降混訊號之通道的線性組合而獲得去相關訊號。
18.範例1至15任一項之音頻解碼方法,其中,依據降混訊號之不超過一個通道而獲得去相關訊號。
19.範例1至2及5至18任一項之音頻解碼方法,其中,第一組由N通道組成,其中N3,其中,藉由施加乾式升混係數至降混訊號之第一通道及施加濕式升混係數至(N-1)通道去相關訊號之通道,第一組可重建為降混訊號之第一通道及(N-1)通道去相關訊號之通道的線 性組合,其中,接收到之元資料包括濕式升混參數及乾式升混參數,且其中,決定混合係數包含:依據乾式升混參數決定乾式升混係數;依據接收到之濕式升混參數,填充具有較接收到之濕式升混參數之數目更多元件之中間矩陣,並知道中間矩陣屬於預定矩陣級;藉由以中間矩陣乘以預定矩陣而獲得濕式升混係數,其中,濕式升混係數相應於源自乘法之矩陣,並包括較中間矩陣中更多元件數目之係數;以及處理濕式升混係數及乾式升混係數。
20.前述範例的任一項之音頻解碼方法,進一步包含:接收(1030)表示M通道音頻訊號之至少二個編碼格式(F1,F2,F3)的其中一者之信令,編碼格式相應於與降混訊號之通道相關聯之個別第一組及第二組中M通道音頻訊號之通道之個別不同分區,其中,該第三組及該第四組係預先定義,且其中,決定混合係數使得由輸出訊號之通道近似之通道的該第三組及該第四組中,M通道音頻訊號之單一分區維持用於該至少二個編碼格式。
21.範例20之音頻解碼方法進一步包含:回應於表示特定編碼格式(F2)之信令,通過(1070)降混訊號做為輸出訊號,特定編碼格式相應於M通道音頻訊號之通道的分區,後者符合該第三組及該第四組定義之 分區。
22.範例20之音頻解碼方法進一步包含:回應於表示特定編碼格式之信令,抑制從去相關訊號至輸出訊號之貢獻,特定編碼格式相應於M通道音頻訊號之通道的分區,後者符合該第三組及該第四組定義之分區。
23.範例20至22任一項之音頻解碼方法,其中:在第一編碼格式(F1)中,第一組由代表M通道音頻訊號之播放環境中不同水平方向之三通道(L,LS,LB)組成,且第二組由代表與播放環境中三通道之方向垂直分離之方向的二通道(TFL,TBL)組成;以及在第二編碼格式(F2)中,第一組及第二組之每一者包含該二通道的其中一者。
24.一種音頻解碼系統(800),包含解碼部(700)係組構成:接收二通道降混訊號(L1,L2),其與元資料相關聯,元資料包含升混參數(αLU),用於依據降混訊號之M通道音頻訊號(L,LS,LB,TFL,TBL)的參數重建,其中M4,其中,降混訊號之第一通道(L1)相應於M通道音頻訊號之第一組(401)一或更多個通道的線性組合,其中,降混訊號之第二通道(L2)相應於M通道音頻訊號之一或更多個通道(TFL,TBL)之第二組(402)的線性組合,且其中,第一組及第二組組成M通道音頻訊號之M通道的分區;接收至少一部分的元資料;以及 依據降混訊號及接收到之元資料提供二通道輸出訊號(,),解碼部包含:去相關部(710),係組構成接收降混訊號之至少一通道,並基此輸出去相關訊號(D);以及混合部(720),係組構成依據接收到之元資料而決定一組混合係數,及依據混合係數形成輸出訊號,做為降混訊號及去相關訊號之線性組合,其中,混合部係組構成決定混合係數,使得:輸出訊號之第一通道()近似M通道音頻訊號之第三組(501)一或更多個通道的線性組合;輸出訊號之第二通道()近似M通道音頻訊號之第四組(502)一或更多個通道的線性組合;第三組及第四組組成M通道音頻訊號之M通道之分區;以及第三組及第四組包含來自第一組之至少一通道。
25.範例24之音頻解碼系統,進一步包含附加解碼部(805)係組構成:接收附加二通道降混訊號(R1,R2),其與附加元資料相關聯,附加元資料包含附加升混參數(αRU),用於依據附加降混訊號之附加M通道音頻訊號(R,RS,RB,TFR,TBR)的參數重建,其中,附加降混訊號之第一通道(R1)相應於附加M通道音頻訊號之第一組(403)一或更多個通道的線 性組合,其中,附加降混訊號之第二通道(R2)相應於附加M通道音頻訊號之第二組(404)一或更多個通道的線性組合,且其中,附加M通道音頻訊號之第一組及第二組通道組成附加M通道音頻訊號之M通道的分區;接收至少一部分的附加元資料;以及依據附加降混訊號及附加接收到之元資料提供附加二通道輸出訊號(,),附加解碼部包含:附加去相關部,係組構成接收附加降混訊號之至少一通道,並基此輸出附加去相關訊號;以及附加混合部,係組構成依據接收到之附加元資料而決定一組混合係數,及依據附加混合係數形成附加輸出訊號,做為附加降混訊號及附加去相關訊號之線性組合,其中,附加混合部係組構成決定附加混合係數,使得:附加輸出訊號之第一通道()近似M通道音頻訊號之第三組(503)一或更多個通道的線性組合;附加輸出訊號之第二通道()近似M通道音頻訊號之第四組(504)一或更多個通道的線性組合;附加輸出訊號之第三組及第四組通道組成附加M通道音頻訊號之M通道之分區;以及附加M通道音頻訊號之第三組及第四組通道包含來自附加M通道音頻訊號之第一組通道之至少一通道。
26.範例24至25任一項之解碼系統,進一步包含:解多工器(801),係組構成從位元流(B)提取降混訊號、接收到之元資料、及離散編碼音頻通道(C);以及單一通道解碼部,可操作以解碼離散編碼音頻通道。
27.一種音頻編碼方法(300),包含:接收(310)M通道音頻訊號(L,LS,LB,TFL,TBL),其中M4;依據M通道音頻訊號,運算(320)二通道降混訊號(L1,L2),形成降混訊號之第一通道(L1)做為M通道音頻訊號之第一組(401)一或更多個通道的線性組合,及形成降混訊號之第二通道(L2)做為M通道音頻訊號之第二組(402)一或更多個通道的線性組合,其中,第一組及第二組組成M通道音頻訊號之M通道的分區;決定(330)升混參數(αLU),用於從降混訊號之M通道音頻訊號的參數重建;依據降混訊號決定(340)混合參數,用於獲得二通道輸出訊號(,),其中,輸出訊號之第一通道()近似M通道音頻訊號之第三組(501)一或更多個通道的線性組合,其中,輸出訊號之第二通道()近似M通道音頻訊號之第四組(502)一或更多個通道的線性組合,其中,第三組及第四組組成M通道音頻訊號之M通道之分區,且其中,第三組及第四組包含來自該第一組之至少一通道;以及輸出(350)降混訊號及元資料,用於聯合儲存或傳 輸,其中,元資料包含升混參數及混合參數。
28.範例27之音頻編碼方法,其中,混合參數控制從降混訊號及從去相關訊號至輸出訊號之個別貢獻,且其中,至少若干混合參數係由最小化在分別致使輸出訊號之通道為第一組及第二組通道之線性組合的共變數-保存近似的該等混合參數中來自去相關訊號之貢獻而決定。
29.範例27至28任一項之音頻編碼方法,其中,第一組由N通道組成,其中N3,其中,至少若干升混參數適於來自降混訊號之第一通道及依據降混訊號之第一通道決定之(N-1)通道去相關訊號之第一組的參數重建,其中,決定升混參數包括:決定一乾式升混係數組,以便定義近似第一組之降混訊號之第一通道的線性映射;以及依據接收時第一組之共變數與由降混訊號之第一通道之線性映射近似時第一組之共變數間之差異,決定中間矩陣,其中,當乘以預定矩陣時,中間矩陣相應於定義去相關訊號之線性映射做為第一組之部分參數重建的一濕式升混係數組,其中,該濕式升混係數組包括較中間矩陣中元件數目更多之係數,其中,升混參數包括乾式升混參數,由此可衍生該乾式升混係數組,且獨特定義中間矩陣之濕式升混參數假定中間矩陣屬於預定矩陣級,且其中,中間矩陣具有較濕式升混參數數目更多之元件。
30.範例27至29任一項之音頻編碼方法,進 一步包含:選擇至少二個編碼格式(F1,F2,F3)的其中一者於與降混訊號之通道相關聯之個別第一組及第二組中,編碼格式相應於M通道音頻訊號之通道之個別不同分區,其中,依據選擇之編碼格式形成降混訊號之第一通道及第二通道,分別做為M通道音頻訊號之第一組及第二組一或更多個通道之線性組合,且其中,依據選擇之編碼格式決定升混參數及混合參數,方法進一步包含:提供表示選擇之編碼格式的信令。
31.一種音頻編碼系統(200),包含編碼部(100)係組構成編碼M通道音頻訊號(L,LS,LB,TFL,TBL)做為二通道降混訊號(L1,L2),並與元資料相關聯,其中M4,及輸出降混訊號及元資料用於聯合儲存或傳輸,編碼部包含:降混部(110),係組構成依據M通道音頻訊號運算降混訊號,降混訊號之第一通道(L1)經形成做為M通道音頻訊號之第一組(401)一或更多個通道的線性組合,及降混訊號之第二通道(L2)經形成做為M通道音頻訊號之第二組(402)一或更多個通道的線性組合,其中,第一組及第二組組成M通道音頻訊號之通道的分區;以及分析部(120)係組構成決定升混參數(αLU),用於來自降混訊號之M通道音頻訊號的參數重建,以及 混合參數(αLM),用於依據降混訊號獲得二通道輸出訊號(,),其中,輸出訊號之第一通道()近似M通道音頻訊號之第三組(501)一或更多個通道的線性組合,其中,輸出訊號之第二通道()近似M通道音頻訊號之第四組(502)一或更多個通道的線性組合,其中,第三組及第四組組成M通道音頻訊號之M通道之分區,且其中,第三組及第四組包含來自第一組之至少一通道,其中,元資料包含升混參數及混合參數。
32.一種電腦程式產品,包含電腦可讀取媒體,具指令用於實施範例1至23及27至30任一項之方法。
33.一種電腦可讀取媒體(1100),代表:二通道降混訊號(L1,L2);升混參數(αLU),依據降混訊號允許M通道音頻訊號(L,LS,LB,TFL,TBL)之參數重建,其中M4,其中,降混訊號之第一通道(L1)相應於M通道音頻訊號之第一組(401)一或更多個通道的線性組合,其中,降混訊號之第二通道(L2)相應於M通道音頻訊號之第二組(402)一或更多個通道的線性組合,且其中,第一組及第二組組成M通道音頻訊號之M通道的分區;以及混合參數(αLM),允許依據降混訊號提供二通道輸出訊號(,),其中,輸出訊號之第一通道()近似M通道音頻訊號之第三組(501)一或更多個通道的線性組合,其中,輸出訊號之第二通道()近似M通道音頻訊號之第四 組(502)一或更多個通道的線性組合,其中,第三組及第四組組成M通道音頻訊號之M通道之分區,且其中,第三組及第四組包含來自第一組之至少一通道。
34.範例33之電腦可讀取媒體,其中,由資料載體代表之資料配置於時間框中,並針對特定時間框分層,使得可獨立於相關聯升混參數提取時間框之降混訊號及相關聯混合參數。
1200‧‧‧解碼部
1210‧‧‧去相關部
1220‧‧‧混合部
D‧‧‧去相關訊號
L1‧‧‧第一通道
L2‧‧‧第二通道
αLU‧‧‧升混參數

Claims (40)

  1. 一種音頻解碼方法(1000),包含:接收(1010)二通道降混訊號(L1,L2),其與元資料相關聯,該元資料包含升混參數(αLU),用於基於該降混訊號之M通道音頻訊號(L,LS,LB,TFL,TBL)的參數重建,其中,M4;接收(1020)至少一部分的該元資料;基於該降混訊號之至少一個通道而產生(1040)去相關訊號(D);基於該接收到之元資料而決定(1050)一組混合係數;以及依據該混合係數而形成(1060)K通道輸出訊號(,...,),做為該降混訊號及該去相關訊號的線性組合,其中,2K<M,其中,決定該混合係數而使得控制從該降混訊號之該第一通道至該輸出訊號之通道之貢獻的混合係數和控制從該降混訊號之該第一通道至該輸出訊號之另一通道之貢獻的混合係數之總和具有值1,其中,如果該降混訊號表示依據第一編碼格式(F1)之該M通道音頻訊號,其中:該降混訊號之第一通道(L1)相應於該M通道音頻訊號之第一群組(401)一或更多個通道的某種線性組合;該降混訊號之第二通道(L2)相應於該M通道音頻訊號之第二群組(402)一或更多個通道的某種線性組合;以及 該第一群組及該第二群組組成該M通道音頻訊號之該M個通道的某種分區,則該K通道輸出訊號表示依據第二編碼格式(F2,F4)之該M通道音頻訊號,其中:該輸出訊號之該K個通道的每一者近似該M通道音頻訊號之一群組一或更多個通道的線性組合;相應於該輸出訊號之該等個別通道的該等群組將該M通道音頻訊號之該M個通道的分區組成為K個群組(501-502,1301-1303)的一或更多個通道;以及該K個群組之至少二者包含來自該第一群組之至少一個通道。
  2. 如申請專利範圍第1項之音頻解碼方法,其中,K=2。
  3. 如申請專利範圍第1項之音頻解碼方法,其中,K=3或K=4。
  4. 如申請專利範圍前述項的任一項之音頻解碼方法,其中,該接收到之元資料包括該等升混參數,且其中,該等混合係數係藉由處理該等升混參數來予以決定。
  5. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該接收到之元資料包括與該等升混參數不同之混合參數(αLM)。
  6. 如申請專利範圍第5項之音頻解碼方法,其中,該等混合係數係與該等升混參數之任何值無關地被決定。
  7. 如申請專利範圍第1至3項的任一項之音頻解碼方 法,其中,M=5或M=6。
  8. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中:在該第一編碼格式中,該M通道音頻訊號之該等通道的每一個通道係與控制從此通道至與該降混訊號之該等通道相應之該等線性組合的其中一者之貢獻的非零增益相關聯;在該第二編碼格式中,該M通道音頻訊號之該等通道的每一個通道係與控制從此通道至由該輸出訊號之該等通道所近似之該等線性組合的其中一者之貢獻的非零增益相關聯;以及對於該M通道音頻訊號之該等通道的每一個通道而言,與該第一編碼格式中之該通道相關聯的該非零增益和與該第二編碼格式中之該通道相關聯的該非零增益相符。
  9. 如申請專利範圍第1至3項的任一項之音頻解碼方法,進一步包含接收代表該降混訊號及該元資料之位元流(B)的初始步驟,其中,該降混訊號及該接收到之元資料係從該位元流中被提取出。
  10. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該去相關訊號為單一通道訊號,且其中,該輸出訊號係藉由將不超過一個去相關訊號通道包括於該降混訊號及該去相關訊號之該線性組合中而被形成。
  11. 如申請專利範圍第10項之音頻解碼方法,其中, K=2,且其中,形成該輸出訊號相當於從三個通道至二個通道的投射。
  12. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該去相關訊號為二通道訊號,且其中,該輸出訊號係藉由將不超過二個去相關訊號通道包括於該降混訊號及該去相關訊號之該線性組合中而形成。
  13. 如申請專利範圍第12項之音頻解碼方法,其中,K=3,且其中,形成該輸出訊號相當於從四個通道至三個通道的投射。
  14. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,決定該混合係數而使得該輸出訊號之一對通道接收來自該去相關訊號之通道的等量值的貢獻,從該去相關訊號之該通道至該對之該個別通道的該等貢獻具有相反的符號。
  15. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該第一群組由二或三個通道組成。
  16. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該M通道音頻訊號包含代表該M通道音頻訊號之播放環境中不同水平方向的三個通道(L,LS,LB),及代表與該播放環境中該三個通道之方向垂直分離之方向的二個通道(TFL,TBL)。
  17. 如申請專利範圍第16項之音頻解碼方法,其中,該第一群組由該三個通道組成,且其中,該第二群組由代表與該播放環境中該三個通道之方向垂直分離之方向的二 個通道組成。
  18. 如申請專利範圍第17項之音頻解碼方法,其中,K=2,且其中,該K個群組的其中一者包含代表與該播放環境中該三個通道之方向垂直分離之方向的二個通道。
  19. 如申請專利範圍第17項之音頻解碼方法,其中,代表與該播放環境中該三個通道之方向垂直分離之方向的該二個通道包含於該K個群組之不同群組中。
  20. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該M通道音頻訊號包含代表該M通道音頻訊號之播放環境中不同水平方向之四個通道(LSCRN,LW,LS,LB),及代表與該播放環境中該四個通道之方向垂直分離之方向的二個通道(TFL,TBL)。
  21. 如申請專利範圍第16項之音頻解碼方法,其中,該K個群組的其中一者包含代表與該播放環境中該三個通道之方向垂直分離之方向的該二個通道。
  22. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,藉由處理該降混訊號之該等通道的線性組合而獲得該去相關訊號。
  23. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,依據該降混訊號之不超過一個通道而獲得該去相關訊號。
  24. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該去相關訊號包含二個通道,該去相關訊號之第一通道係基於該降混訊號之該第一通道而被獲得,及 該去相關訊號之第二通道係基於該降混訊號之該第二通道而被獲得。
  25. 如申請專利範圍第1至3項的任一項之音頻解碼方法,其中,該第一群組由N個通道組成,其中,N3,其中,藉由施加乾式升混係數至該降混訊號之該第一通道及施加濕式升混係數至(N-1)通道去相關訊號之通道,該第一群組係可重建為該降混訊號之該第一通道及(N-1)通道去相關訊號之通道的線性組合,其中,該接收到之元資料包括濕式升混參數及乾式升混參數,且其中,決定該等混合係數包含:基於該等乾式升混參數而決定該梗乾式升混係數;基於接收到之濕式升混參數而填充具有較該接收到之濕式升混參數的數目更多之元件的中間矩陣,並且知道該中間矩陣屬於預先定義的矩陣類型;藉由以該中間矩陣乘以預先定義矩陣而獲得該等濕式升混係數,其中,該等濕式升混係數相應於源自該乘法之該矩陣,並包括較該中間矩陣中之元件數目更多的係數;以及處理該等濕式升混係數及乾式升混係數。
  26. 如申請專利範圍第1至3項的任一項之音頻解碼方法,進一步包含:接收(1030)表示該M通道音頻訊號之至少二個編碼格式(F1,F2,F3)的其中一者之信令,該編碼格式相應於與該降混訊號之該等通道相關聯之個別第一群組及第二群組中 該M通道音頻訊號之該等通道的個別不同分區,其中,該K個群組係預先定義的,且其中,決定該混合係數而使得由該輸出訊號之該通道近似之通道的該K個群組中,該M通道音頻訊號之單一分區維持用於該至少二個編碼格式。
  27. 如申請專利範圍第26項之音頻解碼方法,其中,K=2,該音頻解碼方法進一步包含:回應於表示特定編碼格式(F2)之該信令,通過(1070)該降混訊號做為該輸出訊號,該特定編碼格式相應於該M通道音頻訊號之該等通道的分區,其符合該K個群組定義之分區。
  28. 如申請專利範圍第26項之音頻解碼方法,其中,K=2,該音頻解碼方法進一步包含:回應於表示特定編碼格式之該信令,抑制從該去相關訊號至該輸出訊號之該貢獻,該特定編碼格式相應於該M通道音頻訊號之該等通道的分區,其符合該K個群組定義之分區。
  29. 如申請專利範圍第26項之音頻解碼方法,其中:在該至少二個編碼格式的第一編碼格式(F1)中,該第一群組由代表該M通道音頻訊號之播放環境中不同水平方向之三個通道(L,LS,LB)組成,且該第二群組由代表與該播放環境中該三個通道之方向垂直分離之方向的二個通道(TFL,TBL)組成;以及在該至少二個編碼格式的第二編碼格式(F2)中,該第 一群組及該第二群組的每一者包含代表與該播放環境中該三個通道之方向垂直分離之方向的該二個通道的其中一者。
  30. 一種包含解碼部(700,1200)的音頻解碼系統(800),係組構成:接收二通道降混訊號(L1,L2),其係與元資料相關聯,該元資料包含升混參數(αLU),用於基於該降混訊號之M通道音頻訊號(L,LS,LB,TFL,TBL)的參數重建,其中,M4;接收至少一部分的該元資料;以及基於該降混訊號及該接收到之元資料而提供K通道輸出訊號(,...,),其中,2K<M,該解碼部包含:去相關部(710,1210),係組構成接收該降混訊號之至少一個通道,並基於此而輸出去相關訊號(D);以及混合部(720,1220),係組構成基於該接收到之元資料而決定一組混合係數,及依據該混合係數而形成該輸出訊號,做為該降混訊號及該去相關訊號之線性組合,其中,該混合部係組構成決定該混合係數而使得控制從該降混訊號之該第一通道至該輸出訊號之通道之貢獻之混合係數和控制從該降混訊號之該第一通道至該輸出訊號之另一通道之貢獻之混合係數的總和具有值1,其中,如果該降混訊號表示依據第一編碼格式(F1)之 該M通道音頻訊號,其中:該降混訊號之第一通道(L1)相應於該M通道音頻訊號之第一群組(401)一或更多個通道的某種線性組合;該降混訊號之第二通道(L2)相應於該M通道音頻訊號之第二群組(402)一或更多個通道的某種線性組合;以及該第一群組及該第二群組組成該M通道音頻訊號之該M個通道的某種分區,則該K通道輸出訊號表示依據第二編碼格式(F2,F4)之該M通道音頻訊號,其中:該輸出訊號之該K個通道的每一者近似該M通道音頻訊號之一群組一或更多個通道的線性組合;相應於該輸出訊號之該個別通道的該等組將該M通道音頻訊號之該M個通道的分區組成為K個群組(501-502,1301-1303)的一或更多個通道;以及該K個群組之至少二者包含來自該第一群組之至少一個通道。
  31. 如申請專利範圍第30項之音頻解碼系統,進一步包含附加解碼部(805),該附加解碼部(805)係組構成:接收附加二通道降混訊號(R1,R2),其係與附加元資料相關聯,該附加元資料包含附加升混參數(αRU),用於基於該附加降混訊號之附加M通道音頻訊號(R,RS,RB,TFR,TBR)的參數重建;接收至少一部分的該附加元資料;以及基於該附加降混訊號及該附加接收到之元資料而提供 附加K通道輸出訊號(,...,.),該附加解碼部包含:附加去相關部,該附加去相關部係組構成接收該附加降混訊號之至少一個通道,並基於此而輸出附加去相關訊號;以及附加混合部,該附加混合部係組構成基於該接收到之附加元資料而決定一組附加混合係數,及依據該附加混合係數而形成該附加輸出訊號,做為該附加降混訊號及該附加去相關訊號之線性組合,其中,該附加混合部係組構成決定該附加混合係數,使得控制從該附加降混訊號之該第一通道至該附加輸出訊號之通道之貢獻之混合係數和控制從該附加降混訊號之該第一通道至該附加輸出訊號之另一通道之貢獻之混合係數的總和具有值1,其中,如果該附加降混訊號表示依據第三編碼格式之該附加M通道音頻訊號,其中:該附加降混訊號之第一通道(R1)相應於該附加M通道音頻訊號之第一群組(403)一或更多個通道的線性組合;該附加降混訊號之第二通道(R2)相應於該M通道音頻訊號之第二群組(404)一或更多個通道的線性組合;以及該第一群組及該第二群組組成該附加M通道音頻訊號之該M個通道的分區,則該附加K通道輸出訊號表示依據第四編碼格式之該 附加M通道音頻訊號,其中:該附加輸出訊號之該K個通道的每一者近似該M通道音頻訊號之一群組一或更多個通道的線性組合;相應於該附加輸出訊號之該個別通道的該等組將該附加M通道音頻訊號之該M個通道的分區組成為K個群組(503-504,1304-1306)的一或更多個通道;以及該附加M通道音頻訊號之該K個群組一或更多個通道之至少二者包含來自該附加M通道音頻訊號之該第一群組通道之至少一個通道。
  32. 如申請專利範圍第30或31項之音頻解碼系統,進一步包含:解多工器(801),係組構成從位元流(B)中提取出該降混訊號、該接收到之元資料、及離散編碼音頻通道(C);以及單一通道解碼部,係可操作成解碼該離散編碼音頻通道。
  33. 一種音頻編碼方法(300),包含:接收(310)M通道音頻訊號(L,LS,LB,TFL,TBL),其中,M4;基於該M通道音頻訊號而運算(320)二通道降混訊號(L1,L2),形成該降混訊號之第一通道(L1)做為該M通道音頻訊號之第一群組(401)一或更多個通道的線性組合,及形成該降混訊號之第二通道(L2)做為該M通道音頻訊號之第二群組(402)一或更多個通道的線性組合,其中,該 第一群組及該第二群組組成該M通道音頻訊號之該M個通道的分區;決定(330)升混參數(αLU),用於從該降混訊號之該M通道音頻訊號的參數重建;基於該降混訊號而決定(340)混合參數,用以獲得K通道輸出訊號(,...,),其中,2K<M,其中,該輸出訊號之該K個通道的每一者近似該M通道音頻訊號之一群組一或更多個通道的線性組合,其中,這些K個群組將該M通道音頻訊號之該M個通道之分區組成為K個群組(501-502,1301-1303)的一或更多個通道,且其中,該K個群組之至少二者包含來自該第一群組之至少一個通道;以及輸出(350)該降混訊號及該元資料,用於聯合儲存或傳輸,其中,該元資料包含該升混參數及該混合參數。
  34. 如申請專利範圍第33項之音頻編碼方法,其中,該等混合參數控制從該降混訊號及從去相關訊號至該輸出訊號之個別貢獻,且其中,該等混合參數的至少一些混合參數係藉由使在致使該輸出訊號之該K個通道的共變數矩陣與該個別K個群組一或更多個通道之該一或更多個通道的該線性組合的共變數相符的該等混合參數中來自該去相關訊號之貢獻最小化來予以決定。
  35. 如申請專利範圍第33或34項之音頻編碼方法,其中,該第一群組由N個通道組成,其中,N3,其中,該等升混參數的至少一些升混參數係適用於該第一群 組之來自該降混訊號之該第一通道及基於該降混訊號之該第一通道所決定之(N-1)通道去相關訊號的參數重建,其中,決定該等升混參數包括:決定一組乾式升混係數,以便定義近似該第一群組之該降混訊號之該第一通道的線性映射;以及基於接收到時該第一群組之共變數與藉由該降混訊號之該第一通道之該線性映射來予以近似時該第一群組之共變數間的差異來決定中間矩陣,其中,當乘以預先定義矩陣時,該中間矩陣相應於定義該去相關訊號之線性映射做為該第一群組之部分參數重建的一組濕式升混係數,其中,該組濕式升混係數包括較該中間矩陣中之元件數目更多的係數,其中,該等升混參數包括乾式升混參數和濕式升混參數,可自該等乾式升混參數而推導出該組乾式升混係數,且假設該中間矩陣屬於預先定義的矩陣類型,該等濕式升混參數唯一地定義該中間矩陣,且其中,該中間矩陣具有較該等濕式升混參數之數目更多的元件。
  36. 如申請專利範圍第33或34項之音頻編碼方法,進一步包含:選擇至少二個編碼格式(F1,F2,F3)的其中一者,該編碼格式相應於分割成與該降混訊號之該等通道相關聯之個別第一群組及第二群組的該M通道音頻訊號之該等通道的個別不同分區,其中,依據該選擇之編碼格式,該降混訊號之該第一 通道及該第二通道分別被形成為該M通道音頻訊號之第一群組及第二群組一或更多個通道的線性組合,且其中,基於該選擇之編碼格式而決定該等升混參數及該等混合參數,該方法進一步包含:提供表示該選擇之編碼格式的信令。
  37. 一種包含編碼部(100)的音頻編碼系統(200),係組構成將M通道音頻訊號(L,LS,LB,TFL,TBL)編碼為二通道降混訊號(L1,L2)和相關聯的元資料,其中,M4,及輸出該降混訊號及元資料用於聯合儲存或傳輸,該編碼部包含:降混部(110),係組構成基礎該M通道音頻訊號而運算該降混訊號,該降混訊號之第一通道(L1)被形成為該M通道音頻訊號之第一群組(401)一或更多個通道的線性組合,及該降混訊號之第二通道(L2)被形成為該M通道音頻訊號之第二群組(402)一或更多個通道的線性組合,其中,該第一群組及該第二群組組成該M通道音頻訊號之該M個通道的分區;以及分析部(120),係組構成決定升混參數(αLU),用於來自該降混訊號之該M通道音頻訊號的參數重建,以及混合參數(αLM),用於基於該降混訊號而獲得K通道輸出訊號(,...,),其中,2K<M,其中,該輸出訊號之每一個通道近似該M通道音頻訊號之一群組一或更多個 通道的線性組合,其中,這些K個群組將該M通道音頻訊號之該M個通道之分區組成為K個群組(501-502,1301-1303)的一或更多個通道,且其中,該K個群組之至少二者包含來自該第一群組之至少一個通道,其中,該元資料包含該等升混參數及該等混合參數。
  38. 一種電腦程式產品,包含電腦可讀取媒體,具有指令用以實施如申請專利範圍第1至29項及33至36項中任一項之方法。
  39. 一種電腦可讀取媒體(1100),代表:二通道降混訊號(L1,L2);升混參數(αLU),基於該降混訊號而允許M通道音頻訊號(L,LS,LB,TFL,TBL)之參數重建,其中,M4,其中,該降混訊號之第一通道(L1)相應於該M通道音頻訊號之第一群組(401)一或更多個通道的線性組合,其中,該降混訊號之第二通道(L2)相應於該M通道音頻訊號之第二群組(402)一或更多個通道的線性組合,且其中,該第一群組及該第二群組組成該M通道音頻訊號之該M個通道的分區;以及混合參數(αLM),允許依據該降混訊號而提供K通道輸出訊號(,...,),其中,2K<M,其中,該輸出訊號之每一個通道近似該M通道音頻訊號之一群組一或更多個通道的線性組合,其中,這些K個群組將該M通道音頻訊號之該M個通道之分區組成為K個群組(501-502,1301-1303)的一或更多個通道,且其中,該K個群組之至少二 者包含來自該第一群組之至少一個通道。
  40. 如申請專利範圍第39項之電腦可讀取媒體,其中,由該電腦可讀取媒體代表之資料係配置於時間訊框中,並被分層而使得針對特定時間訊框,用於該時間訊框之該降混訊號及相關聯的混合參數可被提取出而與該等相關聯的升混參數無關。
TW104133508A 2014-10-31 2015-10-13 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體 TWI587286B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462073462P 2014-10-31 2014-10-31
US201562167711P 2015-05-28 2015-05-28

Publications (2)

Publication Number Publication Date
TW201629951A TW201629951A (zh) 2016-08-16
TWI587286B true TWI587286B (zh) 2017-06-11

Family

ID=54364338

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104133508A TWI587286B (zh) 2014-10-31 2015-10-13 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體

Country Status (39)

Country Link
US (1) US9930465B2 (zh)
EP (1) EP3213322B1 (zh)
JP (1) JP6686015B2 (zh)
KR (1) KR102501969B1 (zh)
CN (1) CN107112020B (zh)
AU (1) AU2015340622B2 (zh)
CA (1) CA2965731C (zh)
CL (1) CL2017001037A1 (zh)
CO (1) CO2017004283A2 (zh)
CY (1) CY1121917T1 (zh)
DK (1) DK3213322T3 (zh)
EA (1) EA034250B1 (zh)
EC (1) ECSP17023702A (zh)
ES (1) ES2732668T3 (zh)
GE (1) GEP20196960B (zh)
GT (1) GT201700088A (zh)
HK (1) HK1243547B (zh)
HR (1) HRP20191107T1 (zh)
HU (1) HUE044368T2 (zh)
IL (1) IL251789B (zh)
LT (1) LT3213322T (zh)
ME (1) ME03453B (zh)
MX (1) MX364405B (zh)
MY (1) MY190174A (zh)
PE (1) PE20170759A1 (zh)
PH (1) PH12017500723B1 (zh)
PL (1) PL3213322T3 (zh)
PT (1) PT3213322T (zh)
RS (1) RS58874B1 (zh)
SA (1) SA517381440B1 (zh)
SG (1) SG11201703263PA (zh)
SI (1) SI3213322T1 (zh)
SV (1) SV2017005431A (zh)
TN (1) TN2017000143A1 (zh)
TW (1) TWI587286B (zh)
UA (1) UA123388C2 (zh)
UY (1) UY36378A (zh)
WO (1) WO2016066705A1 (zh)
ZA (1) ZA201702647B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102486338B1 (ko) * 2014-10-31 2023-01-10 돌비 인터네셔널 에이비 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩
EP3286930B1 (en) 2015-04-21 2020-05-20 Dolby Laboratories Licensing Corporation Spatial audio signal manipulation
KR20210124283A (ko) * 2019-01-21 2021-10-14 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 공간 오디오 표현을 인코딩하기 위한 장치 및 방법 또는 인코딩된 오디오 신호를 트랜스포트 메타데이터를 이용하여 디코딩하기 위한 장치 및 방법 및 연관된 컴퓨터 프로그램들
US11523239B2 (en) * 2019-07-22 2022-12-06 Hisense Visual Technology Co., Ltd. Display apparatus and method for processing audio

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200636676A (en) * 2005-04-12 2006-10-16 Coding Tech Ab Method for representing multi-channel audio signals
TW200910328A (en) * 2007-04-26 2009-03-01 Coding Tech Ab Apparatus and method for synthesizing an output signal
US7983424B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Envelope shaping of decorrelated signals

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US20060106620A1 (en) 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
EP1825713B1 (en) 2004-11-22 2012-10-17 Bang & Olufsen A/S A method and apparatus for multichannel upmixing and downmixing
EP1844626A2 (en) 2005-01-24 2007-10-17 THX Ltd Ambient and direct surround sound system
WO2007089131A1 (en) * 2006-02-03 2007-08-09 Electronics And Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
US7965848B2 (en) 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
DE602007013415D1 (de) 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
WO2008069594A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
KR101244515B1 (ko) 2007-10-17 2013-03-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 업믹스를 이용한 오디오 코딩
US8639368B2 (en) * 2008-07-15 2014-01-28 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2214162A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
EP2249334A1 (en) 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
ES2569779T3 (es) 2009-11-20 2016-05-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para proporcionar una representación de señal de mezcla ascendente con base en la representación de señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio multicanal, métodos, programas informáticos y flujo de bits que representan una señal de audio multicanal usando un parámetro de combinación lineal
KR20150032651A (ko) 2012-07-02 2015-03-27 소니 주식회사 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램
BR112015000247B1 (pt) 2012-07-09 2021-08-03 Koninklijke Philips N.V. Decodificador, método de decodificação, codificador, método de codificação, e sistema de codificação e decodificação.
RU2630370C9 (ru) 2013-02-14 2017-09-26 Долби Лабораторис Лайсэнзин Корпорейшн Способы управления межканальной когерентностью звуковых сигналов, подвергнутых повышающему микшированию
RU2648947C2 (ru) 2013-10-21 2018-03-28 Долби Интернэшнл Аб Параметрическая реконструкция аудиосигналов

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200636676A (en) * 2005-04-12 2006-10-16 Coding Tech Ab Method for representing multi-channel audio signals
US7983424B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Envelope shaping of decorrelated signals
TW200910328A (en) * 2007-04-26 2009-03-01 Coding Tech Ab Apparatus and method for synthesizing an output signal

Also Published As

Publication number Publication date
SA517381440B1 (ar) 2020-05-23
UA123388C2 (uk) 2021-03-31
PH12017500723A1 (en) 2017-10-09
CO2017004283A2 (es) 2017-07-19
CN107112020A (zh) 2017-08-29
PT3213322T (pt) 2019-07-05
JP6686015B2 (ja) 2020-04-22
DK3213322T3 (da) 2019-07-15
ECSP17023702A (es) 2018-03-31
US20170332185A1 (en) 2017-11-16
AU2015340622A1 (en) 2017-04-20
EP3213322A1 (en) 2017-09-06
US9930465B2 (en) 2018-03-27
JP2017537342A (ja) 2017-12-14
SI3213322T1 (sl) 2019-08-30
RS58874B1 (sr) 2019-08-30
CY1121917T1 (el) 2020-10-14
HUE044368T2 (hu) 2019-10-28
BR112017007521A2 (pt) 2017-12-19
LT3213322T (lt) 2019-09-25
GEP20196960B (en) 2019-03-25
NZ731194A (en) 2020-11-27
CL2017001037A1 (es) 2017-12-01
PH12017500723B1 (en) 2017-10-09
PE20170759A1 (es) 2017-07-04
EP3213322B1 (en) 2019-04-03
HK1243547B (zh) 2019-11-29
AU2015340622B2 (en) 2021-04-01
IL251789A0 (en) 2017-06-29
MY190174A (en) 2022-03-31
WO2016066705A1 (en) 2016-05-06
TN2017000143A1 (en) 2018-10-19
SG11201703263PA (en) 2017-05-30
MX2017005409A (es) 2017-06-21
CA2965731A1 (en) 2016-05-06
KR20170078663A (ko) 2017-07-07
UY36378A (es) 2016-06-01
KR102501969B1 (ko) 2023-02-21
MX364405B (es) 2019-04-24
CN107112020B (zh) 2021-01-22
HRP20191107T1 (hr) 2019-10-18
EA034250B1 (ru) 2020-01-21
ES2732668T3 (es) 2019-11-25
ZA201702647B (en) 2018-08-29
EA201790753A1 (ru) 2017-12-29
CA2965731C (en) 2023-12-05
SV2017005431A (es) 2017-06-07
PL3213322T3 (pl) 2019-09-30
ME03453B (me) 2020-01-20
IL251789B (en) 2019-07-31
GT201700088A (es) 2019-08-12
TW201629951A (zh) 2016-08-16

Similar Documents

Publication Publication Date Title
US10332532B2 (en) Encoding/decoding apparatus for processing channel signal and method therefor
JP7000488B2 (ja) マルチチャネル非相関器、マルチチャネル・オーディオ・デコーダ、マルチチャネル・オーディオ・エンコーダおよび非相関器入力信号のリミックスを使用したコンピュータ・プログラム
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
KR102486365B1 (ko) 오디오 신호들의 파라메트릭 재구성
RU2643644C2 (ru) Кодирование и декодирование аудиосигналов
CN110675882A (zh) 用于对降混合矩阵解码及编码的方法、编码器及解码器
CN107077861B (zh) 音频编码器和解码器
TWI587286B (zh) 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
BR112017007521B1 (pt) Método e sistema de decodificação de áudio e meio legível por computador
NZ731194B2 (en) Parametric mixing of audio signals