TWI330825B - Parametric representation, apparatus for processing/deriving parametric representation and method thereof - Google Patents
Parametric representation, apparatus for processing/deriving parametric representation and method thereof Download PDFInfo
- Publication number
- TWI330825B TWI330825B TW094138330A TW94138330A TWI330825B TW I330825 B TWI330825 B TW I330825B TW 094138330 A TW094138330 A TW 094138330A TW 94138330 A TW94138330 A TW 94138330A TW I330825 B TWI330825 B TW I330825B
- Authority
- TW
- Taiwan
- Prior art keywords
- parameter
- stereo
- spatial
- parameters
- channel
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000012545 processing Methods 0.000 title claims description 5
- 230000005236 sound signal Effects 0.000 claims abstract description 45
- 230000005540 biological transmission Effects 0.000 claims description 22
- 238000009795 derivation Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- 230000006835 compression Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 230000008439 repair process Effects 0.000 claims description 4
- 239000000835 fiber Substances 0.000 claims description 2
- 238000006467 substitution reaction Methods 0.000 claims 3
- 239000000126 substance Substances 0.000 claims 2
- 238000009395 breeding Methods 0.000 claims 1
- 235000012149 noodles Nutrition 0.000 claims 1
- 230000009977 dual effect Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000013139 quantization Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 206010011469 Crying Diseases 0.000 description 1
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 1
- 241000237536 Mytilus edulis Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000104952 Xanthophyllum eurhynchum Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000020638 mussel Nutrition 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000007261 regionalization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 239000002759 woven fabric Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transceivers (AREA)
Description
1330825 九、發明說明: 修⑻正替換頁 【發明所屬之技術領域】 本發明係有_純道音訊編碼,別是,本剌係有關於 產生及_彡魏道音諷狀參數表秘魏念,並且,產生 及利用多重通道音概號之參錄科綠全向射目容於參數 立體聲播放環境。 【先前技術】 本發明係有關於_空間音訊參數之多重通道音訊訊號之 編碼’並且’洲空間音訊參數0重通道音訊喊之編碼係相 容於利用參數立餅參數之雙重通道立體聲訊號之編碼。本發明 係教導新财法’藉叫時_ _音訊參數及參數立體聲表數 之效率編碼,以及,_向後相容之方式’藉以將編碼參數内嵌 於位元串流。特別是,本發明之目標係利用向後相容之方式,藉 以使參數立體聲參數及空間音訊參數之整體位元速率能夠最^ 化,而不需要妥協解碼雙重通道立體聲訊號及多重通道音訊訊號 之品質。當解碼雙重通道立體聲訊號之輕微妥協品質係可以接受 時,整體位元速率係可以進一步降低。 近來,多重通道音訊重製技術係顯得愈來愈加重要。為了滿 足具有五個或更多分離音訊通道之多重通道音訊訊號之效率傳 輸’壓縮立體聲訊號或多重通道音訊訊號之數種方式係已經發展 出來。多重通道音訊訊號之參數編碼(舉例來說,參數立體聲 (PS)、心理聲學編碼(BCC)等等)之近來手段係利用下行混 音(down—mix)訊號(可能是單聲道或具有複數通道)及表^ 其感知空間音場(spatial sound stage)之參數側邊資訊(亦稱為 7 T330825_ W年?月^日修(更)正替換頁 空間方位資訊(spatial cue) ”)表示多重通道音訊訊號。 一般而言,多重通道編碼裝置係接收至少兩個通道以做為輸-入、並輸出單一或複數載波通道及參數資料。參數資料係進行推 導’藉此’在解碼器中,原始多重通道音訊訊號之近似值係可以 δ十异。正$而5,載波通道係包括子頻帶取樣、波譜係數、時域 取樣等等,其中,子頻帶取樣、波譜係數、時域取樣等等係提供 · 所屬訊號之相對精細(fme)表示法,同時,參數資料係不包括 -波譜係數之取樣,然而,參數資料係包括控制參數以控制特定重 建演算法。這種重建係可以包括乘法加權(wdghting by春 multiplication )、時間平移(time lifting )、頻率平移(frequency shifting)、相位平移(phase shifting)等等。如此,參數資料僅 包括所屬訊號或關連通道之相對粗縫(coarse)表示法。 心理聲學編碼技術係揭露於複數公開期刊,諸如:“利用於 立體聲訊號及多重通道音訊訊號之壓縮之心理聲學編碼(The binaural cue coding applied to stereo and multi-channel audio compression) ”,其作者為 c Faller 及 F Baumgarte,並且,發表 於音訊工程學會(AES)大會論文5574,2002年5月,德國幕鲁 尼黑(Munich,Germany )’以及,“心理聲學編碼之聽覺空間 方位資訊預測(Estimation of auditory spatial cues for binaural cue coding) ”及“心理聲學編碼:空間音訊之正常及效率表示法 (Binaural cue coding : a normal and efficient representation of spatial audio) ”,兩篇論文之作者均為 c Faller 及 F Baumgarte, 並且,發表於聲訊、語言及訊號處理國際會議(ICASSP)公開 期刊’ 2002年5月’佛州奥蘭多(〇rian(j〇,FL)。 8 1330825 在心理聲學編碼編碼巾,複數音訊輸人通道係_數位傅立 葉轉換(DFT)基礎之轉換’離散傅立葉轉換(dft)基礎之轉 換係具有重疊視窗,藉以轉換為波譜表示法。隨後,得到之均句 波譜係分割為非重疊部分(partiticm;)。各個部分(partitiQQ) # 具有正比於等效矩賴寬(ERB)之頻寬。隨後,各個部分 (partition)係預測稱為相互通道位準差異(ICLD)及相互通道 時間差異(ICTD)之空間參數。相互通道位準差異係描述兩個 通道間之位準差異,並且,相互通道時間差異係描述不同通道之 兩個訊號間之時間差異(相位平移)。一般而言,各個通道計算 之位準差異及時間差異係相對於參考通道^在推導得到這些參數 以後,這些參數係量化並編碼以進行傳輸。 雖然相互通道位準差異及相互通道時間差異參數係表示最 重要音源(sound source)區域化參數,然而,利用這些參數之 空間表示法亦可以加入額外參數而強化。 稱為參數立體聲”之相關技術係描述雙重通道立體聲訊號 之參數編碼,並且,雙重通道立體聲訊號之參數編碼係基於傳輸 單聲道訊號加上參數側邊資訊。分別稱為相互通道強度差異 (IIDs)、相互通道相位差異(IPDs)、及相互通道連貫性(IC) 之三種空間參數係加入。具有連貫性參數(關連參數)之空間參 數集合之延伸係使音場(sound stage)之感知空間“擴散度 (diffiiseness) ”或空間“密集度(compactness),,能夠參數化。 參數立體聲係進一步詳細說明於公開期刊,諸如:“立體聲音訊 之參數編碼(Parametric coding of stereo audio) ”,其作者為 j
Breebaart、S· van de Par、A· Kohlrausch、及 E. Schuijers,並且, 9 發表於(2005 ) Eurasip,J. Applied Signal Proc. 9,pages 1305 — 1322 低位元速率之高品質參數空間音訊編碼(High一 quality parametric spatial coding at low bitrates) ”,其作者為 J. Breebaart、S· van de Par、A. Kohlrausch、及 E. Schuijers,並且, 發表於音訊工程學會(AES)第--六次大會論文6072,2004 年5月,德國柏林(Berlin,Germany);及“低複雜度參數立 體聲編碼(Low complexity parametric stereo coding) ”,其作者 為 E. Schuijers、J. Breebaart、H. Pumhagen、及 J. Engdegard,並 且,發表於音訊工程學會(AES)第一一六次大會論文6073, 2004 年 5 月,德國柏林(Berlin,Germany)。 如先前所述,近來,參數立體聲編碼及空間音訊編碼之系統 係已經發展出來。誠如參數立體聲,其間,雙重通道立體聲音訊 訊號係利用單聲道下行混音音訊訊號及承載立體聲參數之額外 側邊資訊表示(請參照專利號碼PCT/SE02/01372之“低位元 速率音訊編碼應用之效率及可調參數立體聲編碼(Efficient and scalable parametric stereo coding for low bitrate audio coding applications) ”)’遺留參數立體聲解碼器係經由單聲道訊號及側 邊資訊以重建雙重通道立體聲訊號。 在空間音訊編碼手段中,多重通道環場(surround )音訊訊 號係利用單聲道或立體聲下行混音及承載空間音訊參數之額外 側邊資訊表示。廣為人知之範例係包括家庭娛樂系統利用之5.1 通道架構。 遺留空間音訊解碼器係基於單聲道或立體聲訊號及額外空 間音訊參數以重建5.1多重通道訊號。 1330825 一般而言,參數立體聲或空間音訊編碼系統利用之下行混音 訊號係額外編碼,利用低位元速率之感知音訊編碼技術(類似 MPEG AAC) ’藉以進一步降低不同訊號麵傳輸需要之傳輸頻 寬。除此以外,一般而言,下行混音訊號係與參數立體聲或空間 音訊側邊資訊組合於位元串流,藉以確保與遺留解碼器之向後相 容,也就是說,向後相容於無法操作用來處理參數立體聲或空間 音訊參數之解碼器。利用這種方式,遺留音訊解碼器僅重建傳輸 之單聲道或立體聲下行混音訊號。當利用實施參數立體聲或空間 音訊編碼之解碼器時’解碼器亦會回復内嵌於位元串流之側邊資 訊’以及,解亦會重新全雙通道立麟或51通道環場訊號。 、當空㈣訊編碼係基於單聲道下行混音訊鱗,提供訊號以 、曰加向後相谷性係更有其需要,藉此,不僅遺贼知音訊解碼器 可以推導單聲道下行混音訊號,並且,除肢外,不支援空間音 訊解碼之參數域聲解碼H亦可能支援位元串流之參數立體聲 解碼為了達到上述目標,位元串流係需要同時包括參數立體聲 侧邊資訊及空間音訊側邊資訊在内之兩種資訊。這種顯而易見之 手段係導致位元串流之非理想大量側邊資訊。也就是說,在傳遞 早聲道訊號及側邊資訊之最大位元逮率係需要維持之情境中,當 側邊資訊增加時’感知編碼料道下行齡可狀資料速率將可 ^少、並賴㈣見地導致解碼單聲道下行混音 音訊品 質降低。 需要同時包括參數立體聲及空間音訊參數及側邊資訊之另 二^知技術手縣係需要—組空間音訊參數並且,這組空間 曰訊,數係物結構,藉贿這組空間音訊參數之子集合能夠經 1330825 由單聲道下行混音喊重建雙通道立體聲訊號。這組空間音訊來·丨 數之子集合係_相容於參數立體聲位元串流之方式内-元串流以做為參數侧邊資訊’並且’非屬於這組空間音訊參數之 子集合之其餘空間音訊參數係利用相容於空間音訊編竭器之方 式内喪於位元串流以做為空間音訊侧邊資訊。在解碼器側邊,僅 實施參數立體聲解碼之解碼器係基於内嵌為參數立體聲側邊資· 訊之參數子集合,進而重建雙通道立鱗訊號。另—方面,實施. 空間音訊之解碼器係回復參數立體聲子集合及其餘空間音訊參 數。利用空間參數之完整集合,多重通道訊號係可以重建。φ 然而’這種手段係存在缺點,因為這種手段係妥協於向後相 容,數立體聲重建或多重通道重建之音訊品質。這種妥協係至為 顯著,因為在第一種情況中,亦做為空間音訊參數之參數子集合 係描述5.1多重通道訊號之兩個通道間之相互關連。最自然之選 擇係左前⑴及右前⑴通道,然而,左前⑴及右前、(r) 通道係可能基本上^;同齡鱗下行混音之左(1啦道及右⑽ 通道之關係之正確數值。在第二種情況中,立體聲下行混音之正 確數值係形成第-子集合,其表示:立體聲下行混音之正確數值φ 係用來描述多重通道環場訊號之左前⑴通道及右前⑴通道 間之相互關連。然而,這種手段係可能導致空間音訊重建之嚴重 不良影響,因為參數量化係有其需要,藉以利用多重通道相容之 方式將參數内嵌於位元串流。 有鑑於此’本發明之目的係提供一種產生及利用多重通道音 訊訊號之參數表示法之觀念,藉以得到幾乎不需要妥協於參數立 體聲重建品質及空間音訊重建品質之更具效率表示法。 12
【發明内容】 音的係利用申請專利範圍第1項所述之多重通'* 及申請專利範圍第„項所述之音訊編碼器3 本發明係基於下列發現 訊,並且料錄及㈣參數集合之資
係表不空間參數集合),多重通道音訊訊號之 孫數’ 利^向後相容之方式而具效率地推導出來,其中,多重通道q 訊號係具有適合魏單聲道下行混音峨儀之參數。4 、:由利用空間參數及立體聲參數間之相互關連,其中,立體 描述空間參數描述之_多重通道音訊訊號之立體聲 門Γί音’吾等係可以基於參數立體聲參數,進而有利地預測空 間參數之子集合。 、、由於立麟參數财之雙重财域聲織·示51多重 通道訊號之立H聲下行混音之某_式,錄域聲线之立體 聲參數及空間音訊編m空間參數間係存在相關性,如先前 所述。本發明係繼_立體聲參數及㈣音訊參數之子集合, 藉以預測非屬於空間音訊參數之子集合之其餘空間音訊參數之 數值。隨後,僅非屬於空間音訊參數之子集合之其餘空間音訊參 數之預測數值及實際數值間之差異係需要傳遞。—般而言,這種 差異之熵(entropy)係(也就是說,預測錯誤)係小於實際參數 自身之熵。這種差異之熵係可以提供實施本發明之系統利用, 13 1330825 及’這種差異之熵係可以提供往後之某麵編碼利用。 係需要參數立體聲參肢郎音轉數之較 元速· 率’相較於侧立_終岭數之_。應紐意岐,同時 j系統亦不需要妥協於參數立體聲重建品質或空間音訊重建 口口貝0 標係提供—種向後相容於參數立體聲解碼 應 體聲下行混音之正確參數最好亦 該利用#以不為要女協於參數立體聲解碼器重建之雙重通道 立體聲訊f品質。然而,在本發明之另一種較佳實施例中,基於 預測空間參數,參數立體聲參數之輕微變動係利用於編碼写,夢 =善空間音訊參數之參數預測效能。_統,Hi 約略降低僅實施參數立體聲解碼之解 =之重建立體賴號品質。细本㈣之較佳實施例,重建空 二,號tr夺非受參數立體聲參數變動之影響,並且,内嵌 位元速率係降低^之參數立體聲參數及空間側邊資訊需要之整體 示法=====中:導多重通道音訊訊號之參數表 容之方式《。也聲參㈣則全向後相 號㈣聲參數以重建高品質立體聲訊 法及空間參數之_^部係彻實體空間參數之差異表示 係可以基於立體聲表數及==間參數,藉此,空間參數之預測 /數及未取代之空間音訊參數集合。由於空間 1330825 ΓΓίί絲歧錄立體縣科之參數储顧對通道間 #及酸性,m音訊參數及立體聲參制係存在相互 者皆是經由相同資料基礎(也就是說,多重通道訊 2推導出來的。由此可知’經由姻傳輸預測及實體數值間之 ㈣耗可㈣省’因為差異之麟常係具有遠小於基 ‘二之Γ當__,_見地,預測及實 :數值間之差異係零,亦即:做為取代空間參數之表示法,僅有
、零=需要傳輸或儲存於參數表示法。當其他熵編碼步階係利用 讀表示法f施時’如通常範例所見,這種表示法係最為有利。 之顯絲’本發明之編碼_碼器係具有下列 =不損及精確度地向後相容,位元速率係可以降低,相= 間曰訊參魏錄立鱗她_讀輸射^㈣之情境。 動種較佳實闕巾,在參數及傳輸變 ^間參數崎,輕微變化係實祕參數謂聲參數。這種 Γ=:Γ列顯著優點,其包括:預測穩定性係可以利用參 ^立體聲參數之輕微變麵改善,且因此,整體位元速率係可以 -步降低。這種較佳實施例之代價係係利用變動立體聲參數重 =立體聲上行混音(upmix)之輕微品f降級,因為 參數立體聲參數係改變於編碼程序中。 ’、4 間下另一種祕實鮮】中,本發明之編碼器係包括空 =仃心WcWnnxeO,㈣經由輪人編碼器〇重通道訊 =輪^產=單聲道訊號。單聲道訊號係利用語音編碼器進一步壓 、、’牛例H _感知音訊壓縮,藉以進—步降低單聲道下行 15 ^30825 產生位位元f率。最終’位元串流產生器係 組合為單-參數立體聲元空串1 音訊參數及參數立體聲參數 在本發明之另一種較佳實 括控制單元,藉以或解碼器係包 施例之達成係比較空間參數之差異表示== 數=較佳實 =:用實際空_及空間參數預測間:差==! 編碼程序纽,其錢編韻细兩階段 =以及,後續之熵編碼(舉例來說,利用霍夫曼(Huffin 、,扁碼器、算術編碼n、或變動長度(nm—= ^碼程序絲於自身歷史(她於先前所述之參數隼合= Z道)’猎以糊各個參數之預測性(或重覆性)。在差里預測編碼 2較高位元速率之情財,位元速耗可以_直接傳輸給定 夺間訊框之㈣參數而進一步節省,選擇何種策略之決定係可 以傳輸於欲處理於解侧邊之位元串流,或者,解韻係可以 應用適當侧演算法(不需要進行額外通知)而決定原始利 略。 如先前所述嘯據本發生之減係具有下賴著優點, 其包括:向後相容於參數立體聲解碼器,以及,當傳輸至本發明 解碼器時額外包含重製完整空間(環場)訊號需要之資訊。 有鑑於此’接收參數立體聲參數及空間音訊參數之本發明解 碼器係可以重建空間參數之完整集合,其係應用空間參數預測及 差異傳輸空間音訊參數之反向轉換,進而經由本發明位元串流推 16 1330825 導得到《音鱗數之完整集合,並且,朗音訊參數之完整集 合係表示多重通道訊號之空間特性。 〃 換句話說’組合參數讀聲參數及接收雜音訊參數以重建 空間參數 =完整集合之組合規_實施於編碼器㈣之反向規 則。在先刖職之差異編碼之情況巾,這種組合酬絲示首 先,期待參數之預測係利用單一或複數參數立體聲參數及單一或 複數接收㈣音财數純轉。_,酬触麟輸數值間 之〜、和係加以預測數值及傳輸數值間之總和係空間 參數之完整集合之期待參數。 在本發明之另-種較佳實施例中,本發明解碼器亦能夠利用 高品質參數讀聲參數重建多重通道訊號之立體聲絲法。這種 較佳實施_具有下著伽,其包括:本發轉碼器係可以 視情況需要進行架構,也就是說,當可以提供立體聲播放環境 時’高品質立體聲訊號係可以利用本發明解碼器重製,相對於 此田可以提供多重通道播放環境時,訊號之多重通道表示法係 了以重製,進而谷許環場(sound)音效之跨聽享受。 在本發明之另-餘佳實施例中,本發明編碼器係包含於傳 輪器或音訊記錄H ’進而料節錢存或倾音概號之位元速 率’並且,音訊訊親可以_極佳品f錄為讀聲訊號或全 環場訊號。 。在本發明之另-種較佳實施例巾’本發明解碼器係包含於接 收器或音訊播放器,進而容許利用不同揚聲器設置之訊號接收及 播放’其中,音訊訊號係可以利用最適當及既存播放環境之表示 法加以重製。 17 曾ί發明係具有下列有利特徵,其包括: 夕重通道“峨之相容編碼,包括: 法;、編媽器側邊’將多重通道訊號下行混音至單-通道之表承 之參ί給定多重通道訊號之編侧邊,定義表示多重通道訊號 之立===_嶋,纖哨通道訊號 將兩=二::=及_容之方式,進而 ,解側邊’經由位元串流摘取内敌參數; 示多==用經由位元串流娜之參數,進而重建表 崎由位元串流 立體聲=:立?聲下行混音之參數於位元串流,藉此,表示 留㈣#了^=軸可關鍾支齡數讀輯碼之遺 子集^割表不多重通道訊號之參數集合為第—子集合及第二 編j第參數子集合之數值,其係基於第二參數子集合及 不夕重通道音訊之立體聲下行混音之參數; B 控制機制’藉以自動選擇是否直接編碼第一參數子集合或 疋否僅編碼差異(相對於預測參數數值); 18 0 調正表示立體聲下行混音之參數,其中,表示多重通道訊 ,之原始參數及表不立體聲下行混音之參數翻時湘,藉以做 為推導調整參數之基礎; 查表,藉以找到預測參數數值; —多項式函數,藉以找到預測參數數值; -數學函數’經由_方法推導得到,藉以產生藉以找到預 測參數數值之立體聲下行混音。 【實施方式】 立體較佳實施例僅介紹本發明改善空間音訊之參數 立體聲相病奴原理。應該瞭解的是,熟習此項技術之人士亦 可以對本發驗佳實_職之_及細節進行各種調整及變 動。有鑑於此,本發明之保護範圍僅會受到所附之巾請專利範圍 限制’科會受_錢解釋本發·佳實補之具體 制0 m 係表示本發明編碼器10之方塊圖,藉以推導多重通 道訊號之她表秘12。編補1G係包括郎她計算器14、 立體聲參數計料16、及參數組合H 18。 ° 空間參數計算n 14係計算雜參數集合2g,射 數集合!0係描述多重通道訊號之郎特性。立體聲參數計瞀ί 16係计异立體聲參數22,其中,立體聲參數 πβ 之立體聲下行混音之空間特性。空間參數集合:=:= 2„參數組合㈣’並且’參數組合器18係推4到ί 數表示法,其巾,參數表示法12絲括 二 數24及空間參數集合26之資訊。 用立體聲參 1330825 串沒俜’、不μ目谷位凡串流之範例’其中,向後相容位 几串抓係第1 _示之本發明編碼器1G產 參數表示法。位元串流係包括立體聲 ^ 訊、之 段…立轉數區段梅有立體==== 體聲標頭34係位於立體聲參數區段3()之 器可用立體聲參數…b’其係提•數立== 立體聲峨。僅㈣處理參數立體聲參數之解碼器 H 聲標頭%之資訊,進而識別參數立體聲參數 空間參數區段32係開始於空間標頭38、並具有四個空間立 訊參數4〇a至·。根據本發明之多重通道解碼器係利用空間^ 數40a至40d (空間參數他至4〇d係經由空間標頭38之協助 以識別)及立體聲標頭34識別之立體聲參數3如及灿。如第2 圖所示,相對於空間參數働至·,空間參數4〇a係消耗較少 位το速率。在第2圖所示之範例中,空間參數4〇&係表示為基礎 原始空間參數及預測空間參數(預測空間參數係利用單一或複數 立體聲參數36a或36b及單一或複數空間音訊參數4〇a至4〇d推鲁 導得到)間之差異。有鑑於此,本發明多重通道解碼器係需要同 時利用立體聲參數36a&36b及空間參數4〇a至4〇d ’藉以重建 空間參數,並且,空間參數係構成位元串流傳輸之空間參數4〇a 之資訊。 第3圖係表示本發明編碼器%之較佳實施例,藉以推導多 重通道音訊訊號50 (也就是說,多重通道音訊訊號50係具有三 個通道’其包括:左通道1、右通道r、及中心通道c)之參數表 20 示法。 心本器5=系包括空間下行混音器54、空間參數預測 編碼聲 9 11 58、參數立體聲參數_器60、立部 ^ 64^ 立哭Γ間下行混音器54、空間參數預測器56、及立體聲下…曰 器分係經由多重通道訊號50產生單H行H下行混音 產生立趙聲下==打咖8餘衫重通道訊號50 6〇,ΐ體聲下行混音訊號72係輸入至參數立體聲參數預測器 _讀聲下行混音峨72料制立縣參數74, 性-f*體聲參數74係描述立體聲下行混音訊號72之空間特 編石·,、單聲道下行混音訊號68係輸人至音訊編碼11 62,藉以利用 聲=方式(舉例來說,糊感知音訊編碼技術)推導得到表示單 收处下行此θ訊號68之音訊位元串流76。參數組合器64係接 空間參數70及參數立體聲參數74以做為輸入、並利用空間參 參預測及_參數本身間之差異取代空間參數集合,藉以推導得 ^碼器可用立體聲參數(參數立體聲側邊資訊)78及空間參 資訊(空間側邊資訊)8〇,進而做為參數組合器64之輸出。 參數,合器64將會利用所附圖式進一步詳細說明如下。 攻後’位元φ流計算器66係接收音訊位元串流76、空間參 數术5之資訊80、及解碼器可用立體聲參數78以做為輸入’並 21 1330825 將輸入組合為參數立體聲相容位元串流82,其中,參數立體聲 相容位元串流82係可以具有第2圖所示之參數區段。 位元串流計算器66可以是簡單之多工器。然而,將三個輸 入組合為相容位元枝之其他手段亦可以實施,進而根據本發明 推導得到位元串流。 x 換句話說,第3圖係介紹-種編碼器,其中,這種編碼 接收多重通道音訊訊號(包括左通道i、右通道r、及中心通道^ 以做為輸人、並產生相容位元串流以容許空間解碼器之解碼及參 數立體聲解之向後相容解碼。如下行混音54係接收多重 通道訊號卜ρ e賴為輸人、並產生科道下行混音訊號〇。 隨後’单聲道下彳了混音峨m係可以選擇性之感知音訊編 碼器加以編碼,進而產生表示單聲道訊號之密集音訊位元串济。 空間參數預測56係接收多重通道訊號卜r、e以做為輸入 生量化參賴合。量化參數集合可以是時間及頻率之函數 混音至立體聲58係’舉說,_國際電觸盟無 部(而-幻下行混音等核其他手段,進而產生多= 號之雙重通道立體聲下行混音1G、W。參數立體聲參 = 收立體聲下行混音1G、W讀騎人、錢生量化參數立體聲= 數集合,其巾,量化錄域聲參數集合可以是時間及 ^ 數。聯合編碼錢64係_接收空間參數及參數立體聲^ 做為輸入、並產生參數立體聲侧邊資訊及空間側邊資訊。最後, 多工器66係接收音訊位元串流76及空間及參數立體聲侧邊資訊 之位兀串流以做為輸人、並將側邊資訊内嵌於位元串流%,' 此’在位元串流82中’遺留解碼器(遺留解碼器係僅實施‘ 22 1330825 立體聲)之向後相容解媽係成為可能。 第4圖係表示第3圖戶斤示之參數組合器64之細部圖。參數 組合器64係具有參數分割器9〇、參數立體聲參數調整器92、空 '參數酬器94、組合器96、控制單元%、空間參數組成器灌、 二第、差二’扁碼态102、第二差異編碼器1〇4、第三差異編碼器 a、及四差異編碼器祕。參數組合器64係接收空間參數 〇及 > 數立體聲參數Μ賴為輸人。錄立
入至參數謂聲參數調整㈣之第―輸人,獻,空間夫= 參數立體聲參數調整器92之第二輸入。空間參數70係 性之ϊΐ,ϋ數:9〇。參數立體聲參數調整器92係選擇 體聲參數調整器%係、可以利用空間參 參數立體聲參;;⑽體聲參數74,進而推導得到解媽器可用 合空間參數70分割為空間參數… ^工間參數之第二子集合114,其中 节
道訊號之最终參數表示法之差異預測取代: 參數η。及空間參數之第:子集二:=用立體聲 測器94。空間參數 陶者句輪入至空間參數預 m及郎參數之第= 隼合m推^可轉數立體聲參數 參數116係第—子集合m之參數_,並^參數116。_ 與第-子集合112之參數比較。 且’預測參數m係 23 1330825 有鑑於此’預測參數116及第一參數子集合112係利用組合 器96以逐個計算’藉以推導得到差異參數118。第一參數子集 σ 112係輸入至第二差異編碼$ 1〇如,並且,第三差異編碼器 106a係實施時間或頻率之差異編碼,藉以差異編碼第一參數子 集合112。差異參數118係輸入至第四差異編碼器勵。 根據第4圖所示之本發明触實酬,第—子集合ιΐ2之差 異編碼表示法係利用控制單元98而與差異參數118之差異編碼· 表示=比較那縣示法係需要位元串流之較多位元。 控制單兀98係控制開關12〇,藉以供應第一子集合η〗之差異鲁 編碼表示法至需要較少位元之空間參數組成器漏,相對於此,、 利用=種表示法之資訊係經由控制單元98額外轉移至蝴參數 空間參數之第二子集合114係利用第二差異編碼器1〇4加以 碼’並且’第二子集合114之差異編碼表示法係輸入至空 成器H)〇,藉以具有空間參數7Q之完整資訊。最後, =參數組成器觸係將第一子集合112之表示法及第二子华人 包含帥參數^ 有鑑於此,空間參數集合80 參數之第二子集合,無論空間參數 空間 及空間參數之第一子集合之表^==碼, 碼表示法,端視需魏纽_之==^118之差異續 利用本發明錄組合㈣彳_^之解參數立題 24 1330825 聲參數78係利用第一差異編碼器1〇2推導得到。第一差異編碼 102係接收調整參數立體聲參數11()以做為輸入、並差異編碣調 整參數立體聲參數110以推導得到解碼器可用參數立體聲數78。 換句話5兒,第4圖係表示聯合編碼方塊,其中,聯合編碼方 塊係同時接收空間參數及參數立體聲參數以做為輸入、並同時產 生空間側邊資訊及參數立體聲侧邊資訊。選擇性之參數立體聲參 數調整方塊係同時接收空間參數及參數立體聲參數以做為輸 入、並產生調整參數立體聲參數。藉此,空間參數之較佳預測係 可以達成’其代價為經由調整參數立體聲參數重建之雙重通道立 體聲訊號之品質妥協。若未利用參數立體聲參數調整方塊,進入 參數立體聲參數係直接做為空間參數預測方塊及參數立體聲編 碼之輸入。(調整)參數立體聲參數集合係可以利用時間差異(由) 或頻率差異(df)、編碼(也就是說,時間或頻率方向之後續參數 之差異編碼)及霍夫曼(Huffinan)編碼(也就是說,無損失熵 編碼)加以編碼,藉以使表示參數集合需要之位元數目最小化。 參數分割方塊係將空間參數集合分離為直接編碼之第二子集合 及互補之第—子集合’其巾’互補之第—子集合係包含所有其他 =數’並且’互補之第—子集合係可以利用參數預測加以編碼。 空間參數預測方塊係接收空間參數之第二子集合及(調整)參數 立體^參數峨為輸人、並計算㈣參數之第-子集合之預測數 值。隨後,預測數值係自空間參數之第一子集合之實 去’進而__錯錄錢合。 @第二參數子集合係可以時間差異或鮮差異編碼及霍 夫曼(Hufifinan)編碼加以編碼,藉以使表示參數子集合需要之 25 1330825 位元數目最小化。第一參數子集合之預測錯誤數值係可以利用時 間差異或頻率差異編碼及霍夫曼(Huffinan)編碼加以編碼,藉 以使表示參數子集合需要之位元數目最小化。控制方塊係選擇第 一參數子集合是否應該直接編碼或選擇預測錯誤數值是否應該 編碼,藉以使表示第一參數子集合需要之位元數目最小化。這種 選擇係可以個別實施於子集合之各個參數。實際選擇決策係可以 傳遞為位元串流之側邊資訊,或者’實際選擇決策係可以基於部 分空間參數預測之規則◊在後者之情況中,實際選擇決策並不會 傳遞為側邊資訊。最後,多工器係組合全部編碼資料,藉以形成鲁 空間侧邊資訊。 想要利用本發明編碼或解碼之觀念,參數預測之不同實施方 式係可以行得通。一般而言,吾人係需要利用適當設計之查表, 藉以經由立體聲參數及空間參數之第二子集合推導得到空間參 數之第一子集合之預測,或者,吾人係可以應用分析函數,藉以 基於特定下行混音處理之充份瞭解及空間參數及立體聲參數之 推導方式’進而推導得到預測參數。下列段落係提供達成適當預 測之部分特定範例之概括說明。 鲁 概括說明係基於具有三個通道之多重通道訊號,其係僅視為 範例,包括: —/:右通道 —^ .右通道 —c :中心通道 除此以外,顯而易見地’提出原理亦可以對應地適用於其他 通道架構。舉例來說’在5.1通道_中.,左前及左環場通道係 26 1330825 可以利用參數立體聲模組加以組合而形成左訊號(1),並且右 前及右環場通道係可以利用參數立體聲模組加以組合而形成右 訊號(r) ’並且,中心前及低頻加強通道係可以利用參數立體聲 模組加以組合而形成中心訊號(c)。 下列描述係進一步詳細討論空間參數預測方塊。立體聲下行 混音訊號之兩個通道係表示為: 丁 /〇 :左通道 :右通道
並且,單聲道下行混音係表示為: W:單聲道下行混音 預測方塊係輸出前尤個量化空間參數^,〜(也就是說,空 合)爛她,給繼調整或未調 正,數立财參數Α,及其他量化空間參數之第二子集合 S K+\,S κ+2,···,5 Ν 〇 就最=見之忍義而言’預測方塊係包括列表函數(編lated function)(查表)。
等式(1) 隨後’差魏麟'等_測錯誤。 等式⑵ ^ ^ (tabulated function) :::庫:巧其中’多變數多項式係加以選擇,進而使大參 數貝科庫之取斜杨輙綠小化 以使表示空間參數之第一子隹人^又有U以L擇猎 木0而要之位元速率最小化,其中, 數貝料係、似做為訓練資料,進而朗最舒。在用於預 27 1^30825 /貝J單元以如,這種列表函數(也neti〇n )或多變數多項 式係可以跟隨四捨五入(r〇unding)或量化操作,進而產生整數 結果。 适種設計方法之重要特例係線性預測之利用,其中,尸係冪 次一之多項式。 第二種類型之預測器設計係考量利用之實際參數結構。在本 發月之較佳只知例中’ [=2,並且,#=4 ’並且,參數係根據 下列定義傳遞資訊: A .通道/〇及r〇間之相互通道強度差異 2 .通道及〜間之相互通道關連性(ICC)或連貫性(icc
Sl 53 54 通道/及r間之相互通道強度差異〇id—丨^) 通道/及r間之相互通道關連性或連貫性〇cc—丨―r) 通道/+,及d相互通道缝差異㈤―lr_c) 、古道/+"及"間之相互通道關連性或連貫性加上C) 這稽之第—細係先前所述線性預·之制,並且, 種。又权弟—範例係利用下列條件而構成: ^l=Pl, S2= p2 々 這,簡單預測器係具有下列優點,其包括4H單預測哭 之全邱預ϋι r差異或鮮差異編碼。趣先祕述多項式 之王#預測裔均具有同等效果。 第二種範例係基於下列假設,亦 下列等式而產生: 立體聲下行混音係基於 28 1330825 lQ = l+q.c,rQ = r+q.c 等式(4) 其中,中心通道增益g係已知(通常為1或1/W)。全部訊 號/、r、c係有限長度向量(通常產生於時間訊號之複數調變遽 波器組(complex modulated filter bank)分析之子頻帶取樣之時 間及頻率間隔)。對於複數(complex)向量χ,少而言,複數内 積(complex inner product)及平方範數(SqUared n〇rm)係定義 為· {x^y)=Y,xin)y\n\ η
x = H2 =〈u〉=J>(„)|2, 等式(5) η ΗΜΙ2 如〉=ΣΜ«)|2, η 其中,星號係表示複數共軛。隨後,相互通道強度差異之線 性及非量化版本係假設為:
Pl=畏,—S,等式(6) …對於相互通道關連性而言,在相互關連之情況中,等式係表 >1^ 為·
,Re(A>,r〇〉 a
„ Ke(/ + r,c) . N
ViRii 對於連貝性而言’實數(real)數值操作係利用等式 絕對值(複數大小(complexmagnitude))取代。 為方便起見,假設心〉=〈rc〉=o,其跟隨及〇=Λ+^:,其可以插入 狄;,丄 個未知數之兩個㈣=⑹弟—异式。經由解出具有兩 後得到: :下仃及卜脱之預測係可以隨 之
v,^2-g2(^2-l) /f+l 等式(8) 29 1330825 ^式⑴之兩個數值均為正數時4之預測係表示為 在這種情況中’需要之線性參數數值輪彳用去量化 =整數參數而得到,並且,整數參數預測係隨即_ &之量化 而4W·虽|| 〇
當解碼立體聲訊號之輕微妥協品質係可接受時,整 率係可以輕錄立縣錄錢—步降低。這齡數調整步驟 ,目的係達成空間參數之第-子集合之更败_及降低之預 2錯誤。也就是說,這齡數·步驟射以視為穩定先前所述 什异之手段。這種參數調整之最極端範例係利用下列條件,其勺 ^ ^及以’其中,A’及一表示調整之參數立體聲參數^ 由於攻種參數調整步驟僅實施於編側邊,解碼器 不 要額外注意。 卜南
除此以外,更通用手段係經由等式(6)及(7)整人户 A、&、&之完整功率及關連性結構資訊,進而得到S及 預測。經由參數之尺度不變性(scalinginvariance),為計 L 假設C=1係不會喪失通用性。接著,利用下列定義: 、,
a = Re(lA b = Rc{r,c), Ρ = Κ<1,ή 等式(9) 下列等式之系統可以得到: L + q2 +2qa = Px2(R + q2 + 2qb) 等式(10) t P + q2 +2q{a + b) = P2(L + q2 + 2qa)m(R + q2 + 2 Λ1/2 L + R = S32 . a + b = S4(L + R + 2p)V2 預測之重要未知數係u、p,並且,β6係額外未知 上列等式之(未定)祕係可以做為複數細等式之指5|
於額外未知數之限制選擇。舉例來說,等式(1Q)之第L 30 1330825 及第三异式係暗示: fc:卜»2办2“丨邮1 【(叫‘心咖―)一★“)| 等式(H) 因此,得到等式⑻之計算係對應於^
的是’料 aeurtstle)參 w H 之限制。 am3疋我額外未知數 之先前所述之預測手段僅是可能預測手段 碼器側邊。 此則手段係可以實施於編碼器側邊或解 且,示本發明多重通道音訊解碼器朋之方塊圖,並 解碼器200係藉以處理參數表示法202。 ’表不法202係包括空間參數集合2〇 二器可用立體聲參數206,其中,解可用 特性。λ發明之多重通道音訊解碼器綱係具有參 2〇8 ’藉以組合解端可用立體聲參數·及空間參數集合之次 訊204,進而得到空間參數210。 、〇貝 第6圖係表示本發明多重通道音訊解碼@ 22〇之方塊圖。多 重通道音訊解碼器22G係包括:位元串流分解器(去多工器) 222、音鱗碼器224、參數重建器(聯合解碼器)挪、及上 混音器228。 位元串仙_刀解器222係接收向後相容位元串流Mo,其中, 向後相容位7L串流230係包括音訊位元串流23卜空間參數集合 31 1330825 之資訊(空間側邊資訊)232、及解碼器可用立體聲參數(參數 立體聲側邊資訊)234。位元串流分解器222係分解或去多工向 後相容位元串流230’藉以推導得到音訊位元串流23ι、办門參 數集合之資訊(空間侧邊資訊)232、及解碼器可用立體^數 (參數立體聲側邊資訊)234。音訊解碼器234係接收音訊位元 串流231以做為輸入、並經由音訊位元串& μ i推導得到單聲道 下行混音訊號236。 參數重建器226係接收空間參數集合之資訊(空間側邊資 訊)232及解碼器可用立體聲參數(參數立體聲側邊資訊)说 以做為輸入。參數重建器226係組合空間參數集合之資訊(空間 侧邊資訊)232及解碼器可用立體聲參數(參數立體聲側邊資工訊) 234以推導得到空間參數集合228,進而做為上行混音器228之 輸入’除此以外,上行混音器228更接收音聲道下行混音訊號 236以做為第二輸^基於空間參數238及單聲道下行混音訊號 236 ’上行混音器228係推導得到多重通道訊號24〇之重建以做 為其輸出。 有鑑於此’第6圖係表示一種空間音訊解碼器,其中,這種 空間音訊解碼器係接收相容位元串流以做為輪入、並產生多重通 道音訊訊號,其包括:左通道卜右通道Γ、及中心通道c。首先, 去夕工器係接收相谷位元串流以做為輸入、並將相容位元串流分 解為音訊位元串流及空間側邊資訊及參數立體聲側邊資訊。若感 知音訊編碼係實施於單聲道訊號’對應之音訊解碼器係接收音訊 位元串流以做為輸入、並產生解碼單聲道音訊訊號m,其中,單 聲道音訊訊號m係可能受到感知音訊編碼解碼器(c〇dec)導致 32 1330825 之失真影響。聯合解碼方塊係同時接收空間側邊資訊及參數立體 聲側邊資訊以做為輸入,進而重建空間參數。最後,空間重建係 接收解碼之單聲道訊號m及空間參數以做為輸入’進而重建多 重通道音訊訊號。 第7圖係表示多重通道音訊解碼器220利用之參數重建器 226之細部圖。參數重建器226係包括:空間參數去組成器25〇、 控制單元252、空間參數預測器254、空間參數組成器256、第 一差異解碼器258、第二差異解碼器260、第三差異解碼器262a、 及第四差異解碼器262b。 空間參數去組成器250係接收空間參數集合之資訊(空間側 邊資訊)232以做為輸入,藉以經由空間音訊參數集合之資訊(空 間側邊資訊)232推導得到第一子集合266及第二子集合268。 第一子集合266係包括可能利用編碼器側邊實施之預測差異表 示法表示之參數,並且,第二子集合268係包括傳輸於位元串流 且未經調整之空間參數集合之資訊。 除此以外,控制單元252係選擇性地經由空間參數去組成器 接收控制魏,進而指示侧差異表示法是否已經實施於編^ 驟。控制資訊係選擇性的,因為控制單元252亦可以利用適當演 算法推導得到這種酬是否已經實施,而不需要存取指示參數。 第二參數子集合268係輸入至第二差異解碼器26〇,藉以差 異解碼第二子集合而推導制如參數之第二子集合,。 *第-差異解碼器258係經由編碼表示法接收解碼器可用立 體聲參數272以做為輸入。空間參數預測器254與其編碼器側邊 之對應it件係顧相同方式操作,有鑑於此,空間參數預測器 33 254係接收參數立體聲參數说以做為第—輸人、並接收空間參 數’之第二子集合以做為第二輸人,進而推導得到預測 274 〇 " 控制單元252係控制空間參數集合之資訊之第一子集合之 兩種可,不同資料路徑。當控制單元252絲示空間參數集二之 資訊之第-子集合並非测差異編碼加以傳輸時控制單元 252係操縱開關278a及通,藉以使第一子集合2的輸入至第 二差異解碼If 262a,進而推導得到空間參數集合之第一子 集合’而不需要實施反向預測。隨後,第一空間參數子集合280 係輸入至空間參數組成器256以做為空間參數組成器256之第二 輸入。 然而,若控制單元252係表示差異預測參數時,空間參數集 合之資訊之第一子集合266係輸入至第四差異解碼器262b,進 而在差異解碼器之輸出282推導得到第一子集合266之差異預測 表不法。隨後,差異表示法及預測參數274之總和係利用加法器 284計算,藉以反轉編碼器侧邊實施之差異預測操作。有鑑於此, 第一空間參數集合280係可提供於空間參數組成器256之第二輸 入。空間參數組成器256係組合第一空間參數集合280及第二空 間參數集合270,藉以於輸出提供空間參數之完整集合,進而做 為編碼訊號之多重通道訊號之基礎。 综上所述,第7圖係介紹一種聯合解碼方塊,其中,這種聯 合解碼方塊係同時接收空間側邊資訊及參數立體聲參數以做為 輸入,進而重建空間參數。多工器係將空間邊資訊分離為編碼之 第二空間參數子集合及空間參數及控制資訊之第一編碼子集 34 1330825 合。第三差異解碼方塊係接收編碼之第二空間參數子 :並峨個參數集合。這種解碼步驟係包括; ⑽—解碼及時間差異(d〇或頻率差異( : 設編碼器係_這種編碼步驟。第—差異解碼方塊係接收參數立又 體聲側邊資誠做為輸人、並重建(調整)參數立體聲 *
間參數預測方塊係接收第二空間參數子集合及(調整)^數立^ 聲參數以做為輸人,進輯算第—空間參數子集合之酬數值, 並且’㈣參數制方塊之操作方式係相同於編碼器之對應元 件。控制單元雜定解碼器之對應元件(編端之控制單元^ 該利用何種選擇決策。基於選擇決策,編碼之第一空間參數子^ 合係直接編碼或考量删而加以編碼。錢兩種情況中,這種^ 碼步驟均包括霍夫曼(Huffinan)解碼辦間差異或解差異解 碼,假設編碼器係利用這種編碼。當控制單元判定未利用預測 時,解碼方塊之輸入係輸出以做為重建之第—空間參數子集合1 否則,解碼方塊之輸出係包含預測錯誤數值,其隨即會加間 參數預測產生之預測參數數值,藉以得到第—空間參數子集:丄 原始數值。最後,重建之第-空間參數子集合及第二空間參數子 集合係合併’進而形成空間參數之完整集合。 第8圖係表示相容之本發明位元串流如何利用遺留參數立 體聲解碼器處理,藉以推導得到訊號之立體聲上行混音,進而強 調本發明觀念之完整向後相容性之顯著優點。 參數立體聲解碼器300係接收相容位元串流3〇2以做為輸 入。參數立體聲解碼器30(H系包括:去多工器·、音訊解碼器 306、差異解碼器308、及上行混音器31〇。去多工器3〇4係經由 35 1330825 相谷位元串流302,藉以推導得到音訊位元串流312及解碼器可 用參數立體聲參數314。 當參數立體聲解碼器300無法實施於空間音訊參數時,去多 工器304係僅忽略相谷位元串流3〇2内含之空間音訊參數,舉例 來5尤’跳過解碼H未知之標頭欄位及位元串流之關連資料區段。 音訊位元串流312係輸入至音訊解碼器3〇6以推導得到單聲道下. 行混音訊號316 ’相對於此,解碼器可用立體聲參數314係利用· 差異解碼器308差異解碼以推導得到參數立體聲參數318。單聲 道下行混音訊號316及參數立體聲參數318係輸入至上行混音器鲁 310 ’藉以·單聲道下行混音訊號316及參數立體聲參數318 推導得到立體聲上行混音訊號32〇。 換句話s尤,第8圖係介紹一種參數立體聲解碼器,其中,這 種參數立體聲解碼1係接收相容位元核以做為輸人、並產生雙 重通道立體聲音訊織’其巾,雙重通道立體聲音舰號係包括 左通道10及右通道r0。首先’去多工器係接收相容位元串流以 做為輸入、並將相容位元串流分解為音訊位元串流及參數立體聲 侧邊資訊。由於空間侧邊資訊係利用向後相容之方式内嵌於相容# 位Ϊ串流,去多工器並不致於受到影響。若感知音訊編碼係實施 於單聲道訊號’對應音訊解碼器係接收音訊位元串流以做為輸 ,、並產生解碼之單聲道音訊訊號m,其中,單聲道音訊訊號m 係可能受到感知音訊編碼解碼器(c〇dec)導致之失真影響。參 數立體聲解碼方塊係接收參數立體聲侧邊資訊以做為輸入,進而 重建參數立體聲參數。這種解碼步驟均包括霍夫曼(取飾姐) 解碼及時間差異或鮮差異解碼,假設編係棚這種編瑪。 36 1330825 最後’參數立體聲重建係接收解喝單聲道訊號m及參數立體聲 參數以做為輸入,進而重建雙重通道立體聲訊號。 第9圖係表示本發明之音訊傳輪器或記脑挪,其中,這 種音訊傳輸器或記錄器330係包括:音訊編媽器1〇、輸入界面 332、及輸出界面334。 音訊訊號係可以供應於傳輸器/記錄器33〇之輸入界面 332。音訊訊號係利用傳輸器/記錄器330之本發明編碼器 10加
以編碼,並且’編碼表示法係輸出於傳輸器/記錄器别之輸出 界面334。賴,編碼絲絲可以雜出去或儲存浦存媒體。 “第10目係表示本發明之接收器或音訊播放器,其中, 這種接收器或音訊播放器34〇係包括:本發明之音訊編碼器 180、位το串流輸入342、及音訊輸出 344。 位元串流係可以輸入於本發明接收器或音訊播放器34〇之 輸入342。隨後,位元串流係利用本發明音訊解碼器⑽加以解 :’並二’解碼訊號係輸出或播放於本發明接收器或音訊播放器 340之輸出344。 ^ _表示-種傳齡統,其中’這種傳輸祕係包括: 本發明之傳輸器33G、及本發明之接收器34〇。 傳輸器330之輸入342之位元串流係加以 器330之輸出334轉移至接收器34〇之輸人342。接 解碼音訊_、放或輸出音舰號於接㈣_之輸出淋 -訊之觀念,吾等可以說:本發明係有關於利用空間 、酋# 表不之編碼,並且,空間音訊參數之多 α表不之編碼係相容於·錄立體聲參數之雙重通道立 37 1330825 體聲訊號之編碼。本發明係提出空間音訊參數及參數立體聲參數 之效率編碼方法,以及,本發明係利用向後相容之方式,藉以將 編碼參數⑽於位元枝。制是’本發明之目的做向^相容 位4流之參數立體聲參數及空間音訊參數之整體位元速率最 ’、化’而不需要妥協於解碼立體聲域或多重通道訊號之。 狀雛挪邱财接料,整&元 不包產生之位元输 亦可以輕易地加人位“二叙_ ’ _跋地·這種參數 非僅限定於先前所述之某種預測規則。,本發明係絕 雖然推導得到多重通道訊號之 聲下行混音器58確實存在於杯明^仃此曰之參數立體 際實施方式中,立體聲下行混音 ^編碼15,然而’在實 係已知’且因此,參數立體聲參數係;J二右下行混音規則 推導得到。 ’、、!由夕重通道訊號直接 在給定實施方式中,單聲 立〇 進-步編碼或解碼於解碼器側邊。這種二= 系利用音訊編碼器 的,也就是說,省略轉道下彳_ u賴喊解碼步驟係選擇性 到包含本發明觀念之編竭器及HU訊號之進一步壓縮亦可以得 38 1330825 本發明編碼器及解碼器之控制單元係可以省略,並且,五等 係可以尋求通用決策’進而在差異預測表示法無法節省位元速率 時利用差異綱數表示空間參數子集合,其係可 ’之好處,並且’其係需要在少數情況下接受輕微較二= 率之代價。 中’雖然應用於訊號路徑之額外編碼器係僅稱為 之任何其他適當編碼器或輸亦可: 器,器及霍夫曼(HU—器或編碼 ==^,藉赠參數_錢差異編碼 編碼參數係能夠霍夫曼(Huffinan)編碼,進 == 2元速率之參數表示法,因為差異預測表示法, 具有較低她於顧蝴參數本身。 H,係 總結本發明之想法,本發縣提訂列特徵: 有下歹括之相容編碼方法係具 至單—通道之邊’、將多重通道訊號下行混音 表示多重通道訊號之史數二二訊號之編媽器側邊,定義 定義表示編碼器側邊, 二利用位元速率效率及向 :2,在編碼器側 同時内嵌於位元串流;在解碼 f進而將兩组參數集合 數;在解蝎器侧邊 ώ ,士由位几串流擷取内嵌參 示多重通道訊==^,參數’進而重建表 就’給定經由位元串流資料重建^數,及下建多重通道輸出訊 ^ 及下行混音訊號。 39 在第二特徵中,根據第一特徵方法係具有下列特徵,其勺 括:内嵌表示立體聲下行混音之參數於位元串流,藉此,二0 體聲下行混音之參數係可以利用僅支援參數立體聲解:立 解碼方法加以解碼。 …k留 在第三特徵中,根據第一特徵方法係具有下列特徵,复々 括:分割表示多重通道訊號之參數集合為第一子隹 /、包 合。 丁市a及弟二子集 在第四特徵中,根據第三特徵方法係具有下列 括:預測第-參數子集合之數值’其係基於第二參數子二/、包 示多重通道音訊之立體聲下行混音之參數。 ”。及表 括· 徵’其包 括.控制機制,稭以自動選擇是否直接編碼第—參數 否僅編碼差異(相對於預測參數數值)。 "*合或是 在第六特财,根鄕三特财法係具 括:調整表示立體聲下行混音之參數,1中 j特徵’其包 推導調整參數之基礎。 列特徵,其包 在第七特徵中’根據第四特徵方法係具有下 括:查表,藉以找到預測參數數值。 、 在第八特徵中 根據 第四特徵方法係具有下列特徵, 其包 括中中,多項式函數係藉以找到預測參數數值。 在弟九特徵中’根據第四特徵方 值 利財法推導得狀數學函數係二產惟徵’其包 參數數值U轉下行混音 生藉以找到預挪 择且十特徵中一種多重通道音訊訊號之表示法之編碼裝置 至單-通道’如料重通道域下行混音 表不法,裝置,藉以定義表示多重通道訊號之參 數.^ 定絲7^重通道訊號之立體聲下行混音之參 利用位元速率效率及向後相容之方式,進而將兩 組參數集合同時内嵌於位元串流。 舌十。特徵中,—種基於下行混音訊號及對應參數集合以
夕通道訊號之裝置係具有下列特徵,其包括:裝置,藉以 70串流絲内齡數;裝置,藉以繼經由位元串流操取 厂進而重建表不多重通道訊號之參數;裝置,藉以重建多 通道輸出訊號’給定經由位元串流資料重建之參數,及下行混 音訊號。 根據本發财法之特定實施需求,本發明方法射以實施為 硬體或軟體。除此以外’實施方式係可以湘數位儲存媒體實 施’特別是’儲財電子可餘控输狀猶、數位影音光碟
a DVD)、或麵(CD),其係配何喊電齡糾實施本發 月有鑑於此,一般而言,本發明係於機械可讀取載體儲存有程 式碼之電腦程式產品’並且,程式碼係可以在電驗式產品執行 於電腦=實施本發明。換句話說,有鑑於此,本發_具有程式 馬之電服私式,並且,程式碼係在電腦程式執行於電腦時實施 發明。 、 雖然本發明已經配合先前所示之特定較佳實施例詳細說明 如上,然而’應該瞭解的是,熟習此項技術之人士,在不違背本 發明精神及賴之前提下’亦可麟前所示讀佳實施例進 41 1330825 行各種形式或細部之變化。有鑑於此,應該瞭解的是,只要不違 背本發明揭露之廣義觀念且能夠經由下列申請專利範圍理解,不 同較佳實施例之各種變化亦有其可能。
42 1330825 第2圖係表讀據本發明產生之位元串流; 第3圖係表示本發明編碼器之另—較佳實施例; 第4圖係絲第3圖之本發明編韻之細部圖; 第5圖係'表示本發明解碼ϋ之方塊圖; 表示本發明多重通道解碼器之較佳實施例;
【圖式簡單說明】 第1圖係表示本㈣編端之方塊圖; 第8 第6圖之本發明多重通道解碼器之細部圖; 弟8圖係表示本發明訊號之向後相容性; 具有本發明箱之傳輪爾訊記錄器: 放器;以Γ有本發料线道解抑之接《及音訊播 第11圖係表示傳輸系統。
【主要元件符號說明】 10'52編碼器 14空間參數計算5| 18參數組合器 22、24、36立體聲參數 32空間參數區段 38空間標碩 50多重通道訊號 56、94空間參數預測 6〇參數立體聲參數預測 U參數表示法 16立體聲參數計算器 2〇、26空間參數集合 30立體聲參數區段 34立體聲標頭 40空間音訊參數 54空間下行混音 58下行混音至立體聲 62音訊編碼器 43 1330825 64 聯合編碼 68、236、316單聲道訊號 66、100多工器 70、238、290 空間參數 76、231、3U音訊位元串流74 318參數立體聲參數 78、234、3Μ參數立體聲側邊資訊 相容位元串流80、232空間侧邊資訊 92參數立體聲參數調整 82、230、302 90參數分割 1〇2、1〇4、106時間差異及頻率差異編碼器 110、272調整參數立體聲參數 258、⑽、262時間差異及頻率差異解碼器 空間參數之第一集合310參數立體聲重建 參數立體聲時間差異或頻率差異解碼器 112、266第一子集合 114、268第二子集合 222、250、304去多工器 226聯合解碼 252控制單元 256空間參數組成器 330音訊傳輸器/紀錄器 334輸出界面 342位元串流輸入 ICC相互通道關連性 PS參數立體聲 98控制 118差異參數 224、306音訊解碼器 228空間重建 254空間參數預測器 274預測參數 332輸入界面 340接收器或音訊播放器 344音訊輸出 IID相互通道強度差異
44
Claims (1)
- V --- 十、申請專利範圍: [— --一:(更)替換s L Z多重通道音訊解碼器⑽),用於處理一參數表示法⑽), 、該參數表不法(⑽)包括單-祕數空間參數(2⑷之 ,訊及—立體聲參數⑽),其中,該—或該等空間參數(2〇4) ' =迷-多重通道訊號之空間特性,該立體聲參數(2〇6)描述該多 • 號之—立體聲下行混音之㈣特性,其中,該-或該等 二間,數(2〇4)的資訊及該立體聲錄(2〇6),當利用一組合規 合時,產生單—或複數空間參數⑽),衫重通道音^ W 嫣器(200)包括: 一參數重建器(208),其利用該組合規則以組合該立體聲參 數(206)及該-或該等空間參數(2。4)之資訊,進而得到單二 或複數空間參數(21〇)。 2.如申喷專利範圍第1項所述之多重通道音訊解碼器(2⑻),其中, 該組合規則使得該組合步驟包括:利用組合該立體聲參數⑽) 及該-或該等空間參數(2〇4 )資訊之一第一參數子集合所推導出 之取代參數,進而取代該第一參數子集合。 _ 3.如申請專利範圍第2項所述之多重通道音訊解碼器⑽),其中, 該組合規則使得-取代參數利用從該第一參數子集合之對應參數 及相同參數之-酬的一線性組合所推導,其中,該預測係利用 該-及該等空間參數(2〇4)資訊之-第二參數子集合之參數及該 立體聲參數(206),以及,利用一預測規則組合兩者所導出。 4. 如申請專利範圍第3項所述之多重通道音訊解碼器(2〇〇),其中, 該預測規則使該預測步驟利用該立體聲參數(2〇6)所推導。 5. 如申凊專利範圍第4項所述之多重通道音訊解碼器(2〇〇),其中, 45該麵規則使該立體聲參數(206)做為該空間參數之該預測。 6.如申請專利範圍第!項所述之多重通道音訊解碼器(2〇〇),其中, 該立體聲參數(206)包括一第一參數匕及一第二參數p2,其中, 該第一參數Pi描述該立體聲下行混音通道間之一強度差異,該等 二參數P2描述該立體聲下行混音通道間之一關連性;八 其中,該第二參數子集合包括-參數&,其中,該參數& 描述該多重通道訊號之-左通道及一右通道之一總和與該多重 通道訊號之一中心通道間之一強度差異;以及 其中,該賴規則使該第-參數子集合之—參數&利用根 據下列等式之-預測參數式加以預測,其中,該參數•賴多 重通道訊號之該左通道及該右通道間之一強度差異, 5, =VZ/?,,其中, v-si ~^2(^2-ι) 7. 如申。月專利範圍第1項所述之多重通道音訊解碼器(; 22〇), :、中該參數重建H⑵6)更包括一決策單元⑵2),用以決定 該第一參數子集合是否利用取代參數加以取代。 8. 如申β月專利範圍第工項所述之多重通道音訊解碼器(2〇〇 ;⑽), 更包括一位元串流分解器(222),用以從一位元串流(23〇)分解 該立體聲參數(234)之一表示及該一或該等空間參數(加)之 二、s之表示其中,該位元串流(230)係向後相容以利用遺留 參數立體聲裝置處理。 申°月專利範圍第8項所述之多重通道音訊解碼器(2〇〇 ; 220), 更包括-熵解碼器及一差異解碼器(258,26〇,施,26%),用 、從該立體聲參數(234)之該表示法及該—或該等空間參數(加) 46 1330825 0年?月~&修(更)正替換頁 之資訊之該表示,進而推導該立體聲參數(272)及該一或該等空 間參數(266,268)之資訊。 10. 如申請專利範圍第8項所述之多重通道音訊解碼器(22〇),其中, 該位元串流分解器(222)更操作以從該位元串流(23〇)分解一 單聲道下行混音訊號(236)’其中,該單聲道下行混音訊號(236 ) 係該多重通道訊號(240)之一單聲道下行混音;以及 更包括一上行混音器(228),其從該下行混音訊號(236) 及該一或該等參數(238)而導出該多重通道訊號(24〇)之一重 建。 11. 如申清專利範圍第10項所述之多重通道音訊解碼器(22〇),更包 括一音訊解碼器(224)’其從該位元串流(23〇)所分解該單聲道 下行混音訊號(231)之-編碼表示而導出該單聲道下行混音訊號 (236)。 12. -種編碼11(10),肋推導—多重通道音誠號之—參數表示法 (12)’該參數表示法(12)具有適合搭配一單聲道下行混音訊號 使用之參數,該編碼器(1〇)包括: -空間參數計算II (14),用以計算單__或複數空間參數 (2〇),該—或該等空間參數(20)描述該多重通道音訊訊號之 空間特性; 立體聲參數計算器(16),用以計算-立體聲參數(22), 該立體聲參數描述從該多重通道音訊訊號所導出 一立體聲下行 /Wj音訊號之空間特性;以及 參數組合器(18),其利用一組合規則來組合該一或該等 空間參數(2G)及該立體聲參數(22),而產生該參數表示法(12), 47 Θ月y日修(更)正替換頁 其中’該參數組合器(18)係操作以利用一組合規則,該組合規 則導致-解碼器可用立體聲參數(24)及該一或該等空間參數 (26)之資訊,並且,該一或該等空間參數(26)之資訊係搭配 該解瑪器可用立體聲參數(Μ)以表示該—或該等空間參數 (20) 〇 13.,申睛專利乾圍第12項所述之編碼器⑽;52),其中,該立體 ,參數計算H (16)更包括—立體聲下行混音器(%),用以從該 夕重通道音訊訊號(5〇)推導該立體聲下行混音訊號(72)。 R如申睛專利範圍第12項所述之編碼器(1G ; 52),更包括一空間 下仃混音器(54),用以從該多重通道音訊訊號(5〇)推導該單聲 道下行混音訊號(68)。 15·如Π利麵第12項所述之編碼器⑼;52),更包括一位元 叶异H (66) ’利肋後相容於遺留參數立體聲解竭器之方 以推導包括該參數表示法及該單聲道下行混音之—位^串流 \ 82 ) 〇 叫申請專利範圍第14項所述之編媽器,其中,該空間下行混音器 54)更包括-音訊編碼器(62),用以利用一壓縮規則壓縮該 聲道下行混音訊號(68)。 17.=處理-參數表示法之方法,其巾,該參數表示法包括單 $空間參數之資訊及-立體聲參數,該—或該等空間表數 多重通道訊號d間特性,並且,該立體聲參數描述該 道訊號之-立體聲下行混音之空間特性,其中,該 間參數之資訊及該讀聲參數,當细—組合規則級合時了 係件到該-或該等空間參數,該方法包括下列步驟: 吋 48 利用該組合規則以組合該立體聲參數及該一或該等空間 參數之資訊,進而得到該一或該等空間參數。 18.一種用於推導一多重通道音訊訊號之一參數表示之方法,其中, 該參數表示法具有適合搭配一單聲道下行混音訊號使用之參數, 該方法包括下列步驟: 計算單一或複數空間參數’該一或該等空間參數描述該多 重通道音訊訊號之空間特性;計算一立體聲參數,該立體聲參數描述從該多重通道音訊 訊號所推導之一立體聲下行混音訊號之空間特性;以及 利用一組合規則組合該一或該等空間參數及該立體聲參 數,以產生該參數表示,其中,利用該組合規則係導致一解碼 器可用立體聲參數及該-或該等空間參數之資訊,並且,該一 或該等空間參數之資訊係魏該解碼ϋ可用立體聲參數 示該一或該等空間參數。 ^ 19.—配種示法,該參數表示法具有適合搭 早麵下狀音喊伽之錄,射,該參 一解碼ϋ可社料參數及組合單—紐數㈣' 一或複數空間參數之資訊,其中,該解 > ^生之單 該多重通道音訊訊號之-立體聲下行、、3立體聲參數推述 或複數空間參數而產生之單一或複數;… 通道音訊截及社體聲參數之郎雜,胃袖述該多重 間參數之資訊係搭配該解碼器可社*該—或該等空 空間參數。 4乂表示該一或該等 20·一種電腦可讀取儲存媒體,其中, 該電腦可 項取儲存媒體儲存 如 49申請專利範圍第I9項所述之一多重通道音訊訊號之參數 21. -種傳輸器’其中’該傳輸器(則具有如中請專利範園^ u ^所述之-㈣轉4錄道音職號之—參數絲法的編碼 22. -種音訊記錄器’其中,該音訊記錄器具有如申請專利 j所述_以推導-多重通道音訊訊號的—參數表示法的編瑪 23. 一種接收器’其中,該接㈣具有—如申請專纖U第1項所述 之多重通道音訊解碼器(2〇〇)。 24. -種音訊播放器’其中,該音訊播放器具有如申請專利範圍第1 項所述的多重通道音訊解碼器。 25·一種傳輸方法,其中,該傳輸方法具有一如申請專利範圍第18 項所述用於推導一多重通道音訊訊號之一參數表示法之方法。 26. —種音訊記錄方法,其中,該音訊記錄方法具有如申請專利範圍 第18項所述的用於推導一多重通道音訊訊號的一參數表示法的 方法。 27. —種接收方法,其中,該接收方法具有一如申請專利範圍第I? 項所述用以處理參數表示法之方法。 28. —種音訊播放方法,其中,該音訊播放方法具有如申請專利範圍 第17項所述的用以處理參數表示法的方法。 29. —種傳輸系統’其中,該傳輸系統具有一傳輸器(33〇)及一接收 器(340); 該傳輸器(330)具有一如申請專利範圍第12項所述用以推 導一多重通道音訊訊號之一參數表示法的編碼器;以及 50 月、修(更)正替換頁 ^' 一…--- 該接收器(34〇)具有一如申請專利範圍第1項所述之多重 通道音訊解媽器。 •種傳輸及接收方法,該傳輸及接收方法包含: ,該傳輸方法具有一如申請專利範圍第18項 多重通道音訊訊號之一參數表示法之方法;以一傳輪方法 所述用於推導— 及 所述接收方法,該接收方法具有一如申請專利範圍第17項 用於處理〜參數表示法之方法。1330825 七、指定代表圖: (一) 本案指定代表圖為:第(7 )圖。 (二) 本代表圖之元件符號簡單說明: 236單聲道訊號 238、290 空間參數 231 音訊位元串流 234 參數立體聲側邊資訊 230相容位元串流 232 空間側邊資訊 272調整參數立體聲參數 266第一子集合 268第二子集合 222、250 去多工器 224 音訊解碼器 226聯合解碼 228 空間重建 252控制單元 254 空間參數預測器 256 空間參數組成器 274預測參數 258、260、262 時間差異及頻率差異解碼器 PS參數立體聲 280 空間參數之第一集合 八、本案若有化學式時,請揭示最能顯示發明特徵的化學式:
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0402650A SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Improved parametric stereo compatible coding of spatial audio |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200627379A TW200627379A (en) | 2006-08-01 |
TWI330825B true TWI330825B (en) | 2010-09-21 |
Family
ID=33448766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094138330A TWI330825B (en) | 2004-11-02 | 2005-11-01 | Parametric representation, apparatus for processing/deriving parametric representation and method thereof |
Country Status (13)
Country | Link |
---|---|
US (2) | US7916873B2 (zh) |
EP (1) | EP1784819B1 (zh) |
JP (1) | JP4616349B2 (zh) |
KR (1) | KR100936498B1 (zh) |
CN (1) | CN101036183B (zh) |
AT (1) | ATE393951T1 (zh) |
DE (1) | DE602005006424T2 (zh) |
ES (1) | ES2306235T3 (zh) |
HK (1) | HK1106606A1 (zh) |
RU (1) | RU2381570C2 (zh) |
SE (1) | SE0402650D0 (zh) |
TW (1) | TWI330825B (zh) |
WO (1) | WO2006048226A1 (zh) |
Families Citing this family (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2363116C2 (ru) * | 2002-07-12 | 2009-07-27 | Конинклейке Филипс Электроникс Н.В. | Аудиокодирование |
CA3035175C (en) | 2004-03-01 | 2020-02-25 | Mark Franklin Davis | Reconstructing audio signals with multiple decorrelation techniques |
PL1769491T3 (pl) * | 2004-07-14 | 2010-03-31 | Koninl Philips Electronics Nv | Przekształcanie kanałów audio |
US7945447B2 (en) * | 2004-12-27 | 2011-05-17 | Panasonic Corporation | Sound coding device and sound coding method |
BRPI0519454A2 (pt) * | 2004-12-28 | 2009-01-27 | Matsushita Electric Ind Co Ltd | aparelho de codificaÇço reescalonÁvel e mÉtodo de codificaÇço reescalonÁvel |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
WO2006103581A1 (en) * | 2005-03-30 | 2006-10-05 | Koninklijke Philips Electronics N.V. | Scalable multi-channel audio coding |
EP1905002B1 (en) * | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2007004830A1 (en) | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
EP1913578B1 (en) | 2005-06-30 | 2012-08-01 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US8494667B2 (en) | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
CN101233571B (zh) * | 2005-07-29 | 2012-12-05 | Lg电子株式会社 | 处理音频信号的方法和装置 |
JP5113049B2 (ja) * | 2005-07-29 | 2013-01-09 | エルジー エレクトロニクス インコーポレイティド | 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法 |
US7987097B2 (en) * | 2005-08-30 | 2011-07-26 | Lg Electronics | Method for decoding an audio signal |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR100857107B1 (ko) * | 2005-09-14 | 2008-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
KR100857113B1 (ko) * | 2005-10-05 | 2008-09-08 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
WO2007040349A1 (en) * | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing |
US7742913B2 (en) | 2005-10-24 | 2010-06-22 | Lg Electronics Inc. | Removing time delays in signal paths |
JP5161109B2 (ja) * | 2006-01-19 | 2013-03-13 | エルジー エレクトロニクス インコーポレイティド | 信号デコーディング方法及び装置 |
BRPI0707136A2 (pt) * | 2006-01-19 | 2011-04-19 | Lg Electronics Inc | método e aparelho para processamento de um sinal de mìdia |
US8560303B2 (en) * | 2006-02-03 | 2013-10-15 | Electronics And Telecommunications Research Institute | Apparatus and method for visualization of multichannel audio signals |
KR101294022B1 (ko) | 2006-02-03 | 2013-08-08 | 한국전자통신연구원 | 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치 |
CA2637722C (en) | 2006-02-07 | 2012-06-05 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
US20090177479A1 (en) * | 2006-02-09 | 2009-07-09 | Lg Electronics Inc. | Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof |
ES2339888T3 (es) * | 2006-02-21 | 2010-05-26 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de audio. |
JP5254808B2 (ja) | 2006-02-23 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
EP1999745B1 (en) * | 2006-03-30 | 2016-08-31 | LG Electronics Inc. | Apparatuses and methods for processing an audio signal |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
EP2036204B1 (en) * | 2006-06-29 | 2012-08-15 | LG Electronics Inc. | Method and apparatus for an audio signal processing |
CN101485094B (zh) * | 2006-07-14 | 2012-05-30 | 安凯(广州)软件技术有限公司 | 最大熵意义下后向兼容多通道音频编码与解码方法和系统 |
US20080235006A1 (en) * | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
WO2008039045A1 (en) * | 2006-09-29 | 2008-04-03 | Lg Electronics Inc., | Apparatus for processing mix signal and method thereof |
KR100891668B1 (ko) | 2006-10-12 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호 처리 방법 및 장치 |
JP5232791B2 (ja) | 2006-10-12 | 2013-07-10 | エルジー エレクトロニクス インコーポレイティド | ミックス信号処理装置及びその方法 |
KR100891672B1 (ko) | 2006-10-12 | 2009-04-03 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
WO2008060111A1 (en) | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR100891669B1 (ko) | 2006-12-01 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
KR100891671B1 (ko) | 2006-12-01 | 2009-04-03 | 엘지전자 주식회사 | 믹스신호 제어 방법 및 장치 |
JP5270566B2 (ja) | 2006-12-07 | 2013-08-21 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
KR101062353B1 (ko) | 2006-12-07 | 2011-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 그 장치 |
KR20080052813A (ko) * | 2006-12-08 | 2008-06-12 | 한국전자통신연구원 | 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법 |
WO2008096313A1 (en) * | 2007-02-06 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Low complexity parametric stereo decoder |
CN101647060A (zh) * | 2007-02-13 | 2010-02-10 | Lg电子株式会社 | 处理音频信号的方法和装置 |
US20100121470A1 (en) * | 2007-02-13 | 2010-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
TWI374671B (en) | 2007-07-31 | 2012-10-11 | Realtek Semiconductor Corp | Audio encoding method with function of accelerating a quantization iterative loop process |
KR101505831B1 (ko) | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
EP2232486B1 (en) * | 2008-01-01 | 2013-07-17 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
ES2391801T3 (es) * | 2008-01-01 | 2012-11-30 | Lg Electronics Inc. | Procedimiento y aparato para procesar una señal de audio |
KR101444102B1 (ko) * | 2008-02-20 | 2014-09-26 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
EP2111062B1 (en) | 2008-04-16 | 2014-11-12 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
CN102007532B (zh) | 2008-04-16 | 2013-06-19 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
KR101061128B1 (ko) * | 2008-04-16 | 2011-08-31 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
KR101629862B1 (ko) * | 2008-05-23 | 2016-06-24 | 코닌클리케 필립스 엔.브이. | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
US8346380B2 (en) * | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
EP2169666B1 (en) * | 2008-09-25 | 2015-07-15 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8258849B2 (en) * | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8479015B2 (en) * | 2008-10-17 | 2013-07-02 | Oracle International Corporation | Virtual image management |
KR101499785B1 (ko) | 2008-10-23 | 2015-03-09 | 삼성전자주식회사 | 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법 |
US20110311063A1 (en) * | 2009-03-13 | 2011-12-22 | Fransiscus Marinus Jozephus De Bont | Embedding and extracting ancillary data |
CN105225667B (zh) * | 2009-03-17 | 2019-04-05 | 杜比国际公司 | 编码器系统、解码器系统、编码方法和解码方法 |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
WO2011045549A1 (fr) * | 2009-10-16 | 2011-04-21 | France Telecom | Decodage parametrique stereo optimise |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
CN102157152B (zh) | 2010-02-12 | 2014-04-30 | 华为技术有限公司 | 立体声编码的方法、装置 |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US9236047B2 (en) | 2010-05-21 | 2016-01-12 | Microsoft Technology Licensing, Llc | Voice stream augmented note taking |
TWI516138B (zh) | 2010-08-24 | 2016-01-01 | 杜比國際公司 | 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品 |
KR101697550B1 (ko) * | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
KR101748756B1 (ko) * | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
WO2012176084A1 (en) * | 2011-06-24 | 2012-12-27 | Koninklijke Philips Electronics N.V. | Audio signal processor for processing encoded multi - channel audio signals and method therefor |
KR101842257B1 (ko) * | 2011-09-14 | 2018-05-15 | 삼성전자주식회사 | 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치 |
KR101662680B1 (ko) * | 2012-02-14 | 2016-10-05 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치 |
JP6163545B2 (ja) | 2012-06-14 | 2017-07-12 | ドルビー・インターナショナル・アーベー | 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え |
KR101434206B1 (ko) | 2012-07-25 | 2014-08-27 | 삼성전자주식회사 | 신호 복호화 장치 |
KR102173422B1 (ko) * | 2012-11-15 | 2020-11-03 | 가부시키가이샤 엔.티.티.도코모 | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 |
US9191516B2 (en) * | 2013-02-20 | 2015-11-17 | Qualcomm Incorporated | Teleconferencing using steganographically-embedded audio data |
BR122021009025B1 (pt) | 2013-04-05 | 2022-08-30 | Dolby International Ab | Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio |
US8804971B1 (en) * | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
WO2014191793A1 (en) * | 2013-05-28 | 2014-12-04 | Nokia Corporation | Audio signal encoder |
TWI774136B (zh) | 2013-09-12 | 2022-08-11 | 瑞典商杜比國際公司 | 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統 |
TWI579831B (zh) | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
CN117037810A (zh) * | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
RU2648632C2 (ru) | 2014-01-13 | 2018-03-26 | Нокиа Текнолоджиз Ой | Классификатор многоканального звукового сигнала |
KR101500972B1 (ko) * | 2014-03-05 | 2015-03-12 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
US9848275B2 (en) * | 2014-04-02 | 2017-12-19 | Wilus Institute Of Standards And Technology Inc. | Audio signal processing method and device |
US9674598B2 (en) | 2014-04-15 | 2017-06-06 | Fairchild Semiconductor Corporation | Audio accessory communication with active noise cancellation |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
CN108694955B (zh) | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
EP3588495A1 (en) | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
WO2023088560A1 (en) * | 2021-11-18 | 2023-05-25 | Nokia Technologies Oy | Metadata processing for first order ambisonics |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR9105987A (pt) | 1990-09-19 | 1993-02-02 | Philips Nv | Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
JP2002175097A (ja) * | 2000-12-06 | 2002-06-21 | Yamaha Corp | 音声信号のエンコード/圧縮装置およびデコード/伸長装置 |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
CN1705980A (zh) | 2002-02-18 | 2005-12-07 | 皇家飞利浦电子股份有限公司 | 参数音频编码 |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
EP1500082B1 (en) * | 2002-04-22 | 2007-02-14 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
BR0305555A (pt) * | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado |
WO2004072956A1 (en) | 2003-02-11 | 2004-08-26 | Koninklijke Philips Electronics N.V. | Audio coding |
ATE487213T1 (de) * | 2003-03-17 | 2010-11-15 | Koninkl Philips Electronics Nv | Verarbeitung von mehrkanalsignalen |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
-
2004
- 2004-11-02 SE SE0402650A patent/SE0402650D0/xx unknown
-
2005
- 2005-10-31 ES ES05798859T patent/ES2306235T3/es active Active
- 2005-10-31 DE DE602005006424T patent/DE602005006424T2/de active Active
- 2005-10-31 JP JP2007539523A patent/JP4616349B2/ja active Active
- 2005-10-31 CN CN2005800338587A patent/CN101036183B/zh active Active
- 2005-10-31 KR KR1020077006367A patent/KR100936498B1/ko active IP Right Grant
- 2005-10-31 RU RU2007120634/09A patent/RU2381570C2/ru active
- 2005-10-31 AT AT05798859T patent/ATE393951T1/de not_active IP Right Cessation
- 2005-10-31 EP EP05798859A patent/EP1784819B1/en active Active
- 2005-10-31 WO PCT/EP2005/011663 patent/WO2006048226A1/en active IP Right Grant
- 2005-11-01 TW TW094138330A patent/TWI330825B/zh active
- 2005-11-23 US US11/286,239 patent/US7916873B2/en active Active
-
2007
- 2007-11-01 HK HK07111849A patent/HK1106606A1/xx unknown
-
2011
- 2011-03-03 US US13/040,057 patent/US8654985B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
RU2381570C2 (ru) | 2010-02-10 |
DE602005006424D1 (de) | 2008-06-12 |
DE602005006424T2 (de) | 2009-05-28 |
US7916873B2 (en) | 2011-03-29 |
US20110211703A1 (en) | 2011-09-01 |
CN101036183B (zh) | 2011-06-01 |
WO2006048226A1 (en) | 2006-05-11 |
US8654985B2 (en) | 2014-02-18 |
ES2306235T3 (es) | 2008-11-01 |
SE0402650D0 (sv) | 2004-11-02 |
JP2008519301A (ja) | 2008-06-05 |
EP1784819B1 (en) | 2008-04-30 |
EP1784819A1 (en) | 2007-05-16 |
JP4616349B2 (ja) | 2011-01-19 |
HK1106606A1 (en) | 2008-03-14 |
US20060133618A1 (en) | 2006-06-22 |
RU2007120634A (ru) | 2008-12-10 |
ATE393951T1 (de) | 2008-05-15 |
TW200627379A (en) | 2006-08-01 |
KR20070051915A (ko) | 2007-05-18 |
CN101036183A (zh) | 2007-09-12 |
KR100936498B1 (ko) | 2010-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI330825B (en) | Parametric representation, apparatus for processing/deriving parametric representation and method thereof | |
US11343631B2 (en) | Compatible multi-channel coding/decoding | |
JP4685925B2 (ja) | 適応残差オーディオ符号化 | |
CN102714038B (zh) | 用以基于下混信号表示型态而提供上混信号表示型态的装置、用以提供表示多声道音频信号的位流的装置、方法 | |
AU2005281937B2 (en) | Generation of a multichannel encoded signal and decoding of a multichannel encoded signal | |
JP4603037B2 (ja) | マルチチャネルオーディオ信号を表示するための装置と方法 | |
JP4772279B2 (ja) | オーディオ信号のマルチチャネル/キュー符号化/復号化 | |
JP5592974B2 (ja) | 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現 | |
KR101422745B1 (ko) | 다채널로 구성된 다객체 오디오 신호의 인코딩 및 디코딩장치 및 방법 | |
CN111179956B (zh) | 音频信号的参数化重构 | |
EP1754222A1 (en) | Energy dependent quantization for efficient coding of spatial audio parameters | |
AU2004306509B2 (en) | Compatible multi-channel coding/decoding | |
Quackenbush | MPEG Audio Compression Advances |