TWI380286B - Multi-channel encoder - Google Patents

Multi-channel encoder Download PDF

Info

Publication number
TWI380286B
TWI380286B TW094110561A TW94110561A TWI380286B TW I380286 B TWI380286 B TW I380286B TW 094110561 A TW094110561 A TW 094110561A TW 94110561 A TW94110561 A TW 94110561A TW I380286 B TWI380286 B TW I380286B
Authority
TW
Taiwan
Prior art keywords
encoder
channel
signals
signal
output
Prior art date
Application number
TW094110561A
Other languages
English (en)
Other versions
TW200612392A (en
Inventor
Gerard Herman Hotho
Dirk Jeroen Breebaart
Evgeny Alexandrovitch Verbitskiy
Brinker Albertus Cornelis Den
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of TW200612392A publication Critical patent/TW200612392A/zh
Application granted granted Critical
Publication of TWI380286B publication Critical patent/TWI380286B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

^«0286 九、發明說明: 【發明所屬之技術領域】 ;· 本發明有關多通道編碼器,如利用空間音訊之參數描述 / 的夕通道音訊編碼器。此外,本發明亦有關在此種多通道 4碼器中處理如空間音訊信號之信號的方法。此外,本發 . 明有關可操作以解碼此種多通道編碼器所產生之信號的解 碼。 ^ 【先前技街】 音訊記錄與重現近年來已從單聲道單通道格式進展到雙 通道立體聲格式,最近甚至進展到多通道格式,如家庭劇 院系統常用的五通道音訊格式。超音頻光碟(SACD)與數位 視訊光碟(DVD)資料載體的出現使此種五通道音訊重現成 為時下一股風潮。許乡使用者現在家裡都擁㈣夠提供五 通道音訊播放的設備;相應地,適合之資料載體上的五通 道音訊程式内容越來越垂手可得,例如上述3八(:〇與1)乂〇類 • ㉟的資料載體。由於吾人對多通道程式内容的興趣與日俱 增,更有效地編碼多通道音訊程式内容成為重要的課題, 例如以提供增強品質、t長的播放時間及甚至更多通道中 的一或多項。此外,這股與日俱增的興趣已促使如MpEG 的標準化組織體認到多通道編碼器的設計主題關係重大。 已知編碼器能夠藉由參數描述符來表示如用於音訊程式 内容的空間音訊資訊。例如,在公開之國際pcT專利申靖 案第PC纖則湖28㈣(鄭2G_刪5)中,說明編碼 多通道音訊信號包括至少第一信號成分(LF)、第二信號成 I00751.doc 1380286 分(LR)、及第三信號成分(RF)。此編碼利用包含以下步驟 的方法: :· (a)使用第一參數編碼器來編碼第一信號成分及第二信號成 - 刀,以產生第一编碼k號(L)及第一組編碼參數(p2); (b)使用第一參數編碼器來編碼第一編碼信號(l)及進一步 . 的信號(R) ’以產生第二編碼信號(T)及第二組編碼參數 (P1),其_進一步的信號(R)係得自於至少第三信號成分 I (RF);及 (C)至少以得自於至少第二編碼信號(τ)、第一組編碼參數 (Ρ2)、及第一組編碼參數(ρ丨)之所產生的編碼信號(丁)表示 多通道音訊信號。 音訊信號的參數描述近年來深受矚目,因其證明傳輸描 述音訊信號的量化參數需要相對較少的傳輸容量。這些量 化參數能夠在解碼器中進行接收及處理,以重新產生知覺 上和其對應之原始音訊信號相差不遠的音訊信號。 • 其後在解碼時下多通道編碼器的輸出時引起明顯的通道 間干擾問題。此類干擾在經配置可產生和二通道降頻混合 相關聯之良好立體聲影像的多通道編碼器中尤其顯著。本 發明係經配置可至少部分解決此問題,藉此提高對應之解 碼多通道音訊的品質。 【發明内容】 本發明的目的在於提供一種替代的多通道編碼器或在多 ' 通道編碼器内使用的區塊,該多通道編碼器可產生其後能 夠以降低之通道間干擾進行解碼的編碼輸出資料。 100751.doc 根據本發明的第—方面,其中提供—種多通道編碼器, /、A操作可處理在複數個輸入通道中傳遞的輸入信號,以 產生包含降頻混合輸出信號和補充之參數 資料之對應的輸 出資料,該編碼器包括: (a)降頻混合器,用於降頻混合該等輸入信號,以產生該 等對應的降頻混合輸出信號;及 。刀析益,用於處理該等輸入信號,該分析器係經操作 可產生補U等降頻混合輸出信號的該參數資料; 在產生及等降頻混合輸出信號時可操作該編碼器,以允許 炱續解馬Β亥等降頻混合輸出信號’以預測在該編碼器内處 理然後丟棄之通道的信號。 本發明的有利之處在於’可以降低的通道間干擾來解碼 碼15的輸出資料’即加強輸入信號的後續重新產生。 料輸出量亦了降低多通道編碼器之代表輸人信號所需的資 較佳,可操作編碼器以根據 號。較佳,在處理輸人信號期 義這些微磚。 時間/頻率微磚來處理輸入信 間,在編碼益之前或之中定 來=參2碼器I可操作分析器以藉由套用以下方式 個輸入信號* ( C : : 2,i)中至少部分:最佳化得自-或多 -信號,Si 輸入信號之估計間之差值的至少 料產生。車:住或多個輸入信號係從多通道編碼器的輸出資 norm)。 乂 ,最佳化牽涉極小化歐幾里得模(Euclidean I0075I.doc 較佳,在編碼器中’其中有N個輸入通道,苴… 析器以為各時間/頻率微磚產生參數資料二理㈣分 器經操作可輪出參數和Μ個降頻漏合^出理^析 以代表輪出資料中的輸入信號 =號, 佳,在編碼器中,在整數Μ等於二的情況,數=<Ν。較 混A 51 IV太i 了操作降頻 P盗以產生兩個降頻混合輸出信號,該等 道立f摩姑思+ 1 0號7在一通 體聲裝置中播放並可以標準的立體 碼。此種特性能夠使編碼器與其關聯的輸 於早期的播放系統,如立體聲二通道播放系統後相今 根據本發明的第二方面’其中提供一種含在本發明第一 處編碼器内的信號處理器’可操作該處理器以 處理夕通道編碼器中的資料,以產生其 與參數資料。 《鞠出佗唬 根據本發明的第三方面,其中提供一種在多通道編碼号 中編碼輸入信號以產生對應之輸出資料的方法,該對應之 輸出資料包含降頻混合輸出信號和補充的參數資m 法包括以下步驟: ^ (a)經由複數(N)個輸入通道將該等輸入信號提供給該多通 道編碼器; 夕通 ⑻降頻混合該等輸人信號以產生該等對應之(吻 輸出信號;及 /tCl (c)處理该等輸入信號以產生補充該等降頻混合輪出作號 該參數資料; ° ; 其中處理該多通道編碼器中的該等輸入信號牵涉決定該參 l0075l.doc 1380286 數資料,以在其後重新產生該等輪入信號的表示,該 頻混合信號允許其中的解碼,以預測在該編碼器中處理缺 後在其中丟棄之通道之信號的内容。 根據本發明的第四方面,其中提供根據本發明第三方面 載體中。 …係儲存於資料 ^據本發明的第五方面’其中提供一種用於解碼由本發 器月=方面之編碼器所產生之輸出資料的解碼器,該解碼 =理構件,用於從編碼器接收降頻混合輸出信號和參數 資料,可操作該處理構件以處理該參數資料,以 多個係數或參數;及 、 5
ΓΓ各算Γ牛’用於計算使用該參數資料以編碼成該輸出資 ^各輸入信號的-近似表示,還有在步驟(a)決定的H 夕個絲,以進-步處理以實f上重新產生輸人信號(引起 編碼器產生輸出資料)的表示。 根據本發明的第六方面里 第五方面之多通道解碼器㈣於含在本發明 處3$器以協# σ,處理态,可操作該信號 資料“協助處理和重新產生之輸入信號之表示相關聯的 2據本發明的第七方面,其中提供一種在多通道解碼器 多方法,料屬於由本發明第-方面之 ::編碼.所產生的形式,該方法包括 ⑷處理出現在該編碼資料中的降頻混合輸出信號和參數資 100751.doc 1380286 料丄該—處理利用該參數資料決定一或多個係數或參數;及 (b)汁异制該參數f料以編碼成該編碼f料之各輸入信號 =一近似表*,還有在步驟⑷決定的—或多個係數,以進 :處理以霄質上重新產生輸入信號(引起編碼器產生編 ,碼資料)的表示。 北應明白本發明之特徵可容易地組合在任何組合内,而不 月綠本發明之範圍。 【實施方式】 本發明將以第一背景與第二背景來說明。在第一背景 二本發Γ考量的編碼器如下:其經操作可處理原始輸二 = 後續在解碼器中解碼之對應的編碼輸出 :表二產:::輸:信號在知覺上比之前更加精確 隹弟一 #牙、中,本發明 具體實施例。 之特疋的乾例 現在說明詩圖丨與2的第—背景。總之 中大致如5所示的編碼器。編碼器5包括關輸:通= 收對應的原始輸入信號;例 /入通道’以接 入通道Cm、CH2、CH3 ^ 、編碼器在㈣時包括三個輸 原始輸入信號以產生:細作編碼器5以處理n個通道的 ⑷Μ個降㈣合通道輸出之對應 Μ<Ν,例如當Μ=2時 ㈣出U,其中 出ΟΡ1與ΟΡ2 ;及 乂 610、620代表的兩個通道輸 ⑻-或多個參數信號輸出, 為了其後能夠以最佳的 的:數輸出》 飞在.為碼益5產生的解碼器輸 100751.doc 出,號中進行解碼,即關於最小平方誤差,同時有利的做 法是’在產生其編碼輸出信號6〇〇、61〇、62〇時,在編碼器 5中採用主要成分分析(PCA)e在將編碼器WPCA產生的參 數洎入考里時,處理這些輸出信號6〇〇、6 1 〇、即可以儘 可能的最佳方式在如圖2之1〇所示的解碼器中重新產生對 應於交給編碼器個輸入信號的信號。信號_、副、 620中PCA參數的值係由原始輸入信號本身造成因此在編 碼器5中發生降頻混合時不允許任何控制。此種缺之控制使 其在編碼器5與其對應的解碼器1()中採用pcA時,實質上同 時無法獲得理想的立體聲影像品質。 本發明人等發現本發明在編碼器5中結合上述Μ個降頻 混合通道㈣固定降頻混合時,在藉由傳遞補充資訊之 Ν-Μ個通道的附加適當組來擴充這些關降頻混合通道 時,可在補充的解碼器10實質上完美重新產生原始輸入信 號·。因此’在編碼期間已至少部分丢棄關於此Ν·Μ個通道 的資訊時由m定降頻混合所產生之μ個降頻混合通道的 輸出信號無法用來重新產生Ν個通道之原始輸人信號之實 質上完美的表示。,然而,本發明人等發現將合適的處理套 用於Μ個降頻混合通道,例如套用於輸出㈣㈣時,至 少部分可預測這些Ν-Μ個通道。 因此根據本發明進行組態配置的編碼器5從Μ個降頻混 合通道預測至少部分對應於解碼器之ν_μ個通道的資訊, 同時不用從編碼器5發送特定參數至解碼器1〇。此類預測利 用發生於Ν個通道之信號間的信號冗餘,下文將會詳細說 100751.doc •12· 對應相容 此外在解鳴從編碼器5提供的編碼資料時 的解碼器1 0將恢復冗餘。 器5的 信號 々為了進-步說明本發明,將說明如圖1所示之編碼 範例具體實施例,鈇德夫去甘把盘j 0 …、设参考其數學式呈現在其中採用 處理的方法。 見在將參考圖3及4來說明依據上述第二背景之本發明的 範例具體實施例。 在圖3中’其中顯示大致如15所示的多通道編碼器。編碼 器15包括三個處理單元20、30、40,以接收如4()()至45()所 示的六個輸人信號,務後將會說明這六個輸人信號的特 ,。可操作三個處理單元2。、3()、伽產生上述參考編碼 3 5所述的N個通道_至52G。編碼器15還包含混合與參數 擷取單元180,以分別接收處理單元2〇、3〇、4〇之處理的輸 出5 00、510、520。擷取單元18〇的輸出包含上述第三參數 組輸出600、及分別經由反向變換與〇LA單元36〇連接的左 邊與右邊中間信號950、960,以產生上述分別用於左邊與 右邊通道的降頻混合輸出61〇 ' 62〇。參數輸出組72〇、82〇、 920、600及降頻混合輸出61〇、62〇對應於適於其後傳達至 對應之相容解碼器之編碼器15的編碼輸出資料,在該解碼 器上,將解碼輸出資料以重新產生六個輸入信號4〇〇至45〇 中一或多個的表示。或者,可將降頻混合輸出61〇與62〇供 應至標準的立體聲編碼器。 如400至450所示的六個原始輸入信號包含:左前方音訊 仏號400、左後方音訊信號41〇、音效音訊信號42〇、中央音 100751.doc • 13· 1380286 訊信號430、左後方音訊信號440 '及右後方音訊信號450。 音效信號420較佳具有實質上為120 Hz的頻寬,以用於模擬 如隆隆聲、爆炸、及打雷音效。此外,輸入信號400、4 1 〇、 430、440、45 0較佳對應於五通道家庭劇院聲道。 處理單元20、30、40較佳係按說明於公開之歐洲專利申 請案第EP 1,107,232號的方式來實施,其關於這些單元 2〇、30、40的内容在此以提及的方式併入本文中。 .處理單元20包含:區段與變換單元1〇〇、參數分析單元 110、參數至PCA角單元120、及PCA旋轉單元130。變換單 疋包括已變換的左前方與左後方輸出7〇〇、71〇,其係分 別耦合至PCA旋轉單元130及參數分析單元11〇 ^第一參數 組輸出720係經由pCA角單元12〇耦合至pCA旋轉單元13〇。 可操作旋轉單元13〇以處理輸出7〇〇、71〇及第一參數組輸 出,以產生已處理的輸出500。在單元2〇内的處理係根據時 間/頻率微碎來執行。 同樣地,處理單元30包含:區段與變換單元200、參數分 析單元210、參數至pCA角單元22〇、及旋轉單元。 *奐單元2〇〇包括已變換的左前方與左後方輸出, 、刀別耦。至PC A旋轉單元230及參數分析單元210。第 ^ \輸出820係經由pCA角單元22〇耦合至pcA旋轉單 可操作灰轉單元230以處理輸出800、8 1 〇及第四參 a 出以產生已處理的輸出51〇。在單元30内的處理也 是根據相/頻率微4來執行。 同樣地,虛ί田SS - 早疋40包含:區段與變換單元3〇〇、參數分 100751.doc 14 1380286 ,早=31〇、參數至pCA角單元32〇、及pcA旋轉單元33〇。 變換單Moo包括已變換的左前方與左後方輸出觸、91〇, , ’、係刀別耦合至PCA旋轉單元330及參數分析單元3 1〇β第 厂,參數組輸出920係經由PCA角單元32〇耦合至pCA旋轉單 疋330。可操作旋轉單元330以處理輸出900、91〇及第二參 數組輸出,以產生已處理的輸出52〇。在單元4〇内的處理係 根據時間/頻率微磚來執行。 • 已處理的輸出500、510、520分別對應於左邊 '中央、及 右邊之已處理的信號。此外,降頻混合輸出61〇、62〇可經 由時下二通道立體聲播放裝置播放,藉此維持和早期立體 聲聲音系統的向後相容性。第三參數組輸出6〇〇包括可於解 碼器(如2圖所示的解碼器1〇)處理的附加參數資料和輸出參 數組720、820、920及降頻混合輸出61〇、62〇,以重新產生 六個輸入信號400至450的表示。接著說明發生此降頻混合 以在第三參數組輸出600產生降頻混合輸出61〇 62〇與參數 • 資料的方式。 再次參考本發明關於圖!與2的第一背景,N個通道chi 至CH3的原始輸入信號(即Ζ|[η]、Ζ2[η]、、“[η])描述_ 通道之離散的時域波形◊將這些信號〜[…至“…]分段成三 個處理單元20、30、40,此種分段使用共同的隔離,較佳 採用時間重疊分析窗。其後,藉由套用合適的變換,如快 速傅立葉變換(FFT)或相似同等類型的變換,將各區段從時 間格式轉換為頻率格式,即從時域轉換為頻域。較佳在執 行合適軟體的計算硬體中實施此類格式轉換。或者,使用 I00751.doc 15 1380286 濾波器組結構來實施轉換,以獲得時間/頻率微磚。此外, 此轉換對通道CH1至CH3的輸入信號造成分段子頻帶表 :: 示。為了方便,將輸入信號Ζι[η]至ζΝ[η]的這些分段子頻帶 ν 表示分別表示為zi[k]至ZN[k],其中k為頻率指數。 - » • 為了方便,吾人考慮兩個降頻混合通道,如用於編碼器 « 15所示,不過,也可以擴充為其他數量的降頻混合通道。 從在N個通道CH1至CH3中傳遞的原始輸入信號,編碼器5 φ 處理上述子頻帶表示Zi [k]至ZN[k]以產生兩個降頻混合通 道L〇[k]與R〇[k],如方程式1與2(Eq. 1與2)所示: 方程式1 方程式2 其中參數Oti與βι較佳根據兩個降頻混合通道L〇[k]與R〇[k]中 良好立體聲影像的需求來設定。如上述,在以適當組的參 數補充兩個降頻混合通道L()[k]與R()[k]以實質上重新產生 • N_2個遺失通道時’後續為CHI至CH3重新產生原始輸入信 號之表示的解碼器,例如解碼器1〇,只能夠羞生實質上完 美的表示。在採用固定的降頻混合時,就某種程度而言, 可從兩個降頻混合通道LG[k]與RQ[k]預測N_2個已丟棄之通 道的資Λ,藉此在對應的解碼器(如解碼器1 〇)對通道CH1 至CH3的原始輸入信號的上述表示提供加強重新產生之精 確性的方式。 在產生輸出信號600、610、620時丟棄關於]^個通道中特 定通道的資訊的情況中,即如Cc,i[k]m示之被丟棄的通道, ! 0075 丨.doc -16- 1380286 ==方程式3(Eq. 3)從降頻混合通道心 預測每些破丟棄的通道:
Co./ [^] = Cxj L0 [i]+ c2J R0 [Jt] 〜 1 方程式3 其令參數C,·,.與C"係根據—或多個最佳化標準來選擇。較佳 ^物編㈣佳化標準是㈣c。嫌其估計細 的最小歐幾里得模。為了合也 付耦為了允許方程式3的處理能夠用在補充
編碼器5㈣碼器中,較佳在自編碼W輸出㈣三參數组 600中包括參數^與匕。 本發明人等發現方程式3中的參數匕與&係關於極小化 信號叩]與其在解碼諸產生的估計細之差的歐幾里得 模時在扁碼器5中產生的參數。編碼n 5較佳經組態配置以 採用後兩個參數2作]、έψ】。然後藉由套用方程式4(Eq 4), 可在編碼器5中計算原始輸入信號Zi[k]之差的歐幾里得模 平方: ?hw_z4 *程式4 其中 f,W=clzAW+qz,/^] 方程式 5 方程式4的極小化較佳藉由套用方程式6與7(]59. 6與7)來達 成· 1,2< 刚1|2|刚丨|2-丨“〇[小〇爾 方程式6 </?〇Μζί[4Ίμ〇ΜΙ1-<ι〇Η^<[^]),<^^ΐ/?η [k]y ll^oMirH^oWir-K^H^oW 方程式7 10075).doc 1380286 其中 方程式8 方程式9 ΙΜ[Λ]|Γ = Σ \Aik]\2 -· k
·** <A[klB[k]) = Y • k 言· — · 因此,對於可從方程式6與7計算的參數^與c^,,可從關 於係數oti與βί(如和方程式1與2(Eq 1與2)相關)的方程式1〇 至13(Eq. 10至13)取得以下關係:
N φ =1 方程式 10
N ΣΑ^2,Ζ( =1 方程式 11 -EAC,.Z( =0 方程式 12
N -ΣαΑ,Ζ( =〇 方程式 13 因此,在編碼器5中,套用如方程式1至13(£(1 1至13)所 • 描述的處理運算,即可轉換對應於Ν個通道的輸入信號,即 CH1至CH3的輸入信號,其中Ν=3,其中每個通道兩個參數 及產生輸出610、620與第三參數組輸出6〇〇之信號的兩個降 頻混合通道;第i通道的兩個參數為匸^與。如果每個時 間/頻率微磚的降頻混合均為固定,則解碼器1 〇的降頻混合 為已知,因此參數間的關係為事先已知。另一方面,如果 選擇要改變降頻混合,則必須將關於實際降頻混合的資訊 '•發送至解碼器! 〇 e - 在編碼器5中,在通道單元1〇〇、2〇〇、3〇〇中處理輸入信 100751.doc 1380286
號CH1至CH3以得到時間/頻率微磚之輸入信號的表示。對 這些微磚中的各微磚重複如方程式1至13所述的處理運 算。所有頻率微碑的信號L〇[k]均在編碼器5中加以組合並變 換至時域,以形成目前區段的信號’然後將此信號至少部 刀f關於其至少一先刖區段的信號結合,以產生編碼輪出 仏號620。信號R〇[k]的處理方式和信號L〇[k]的相同,以產 生編碼輸出信號610。
簡言之,編碼器5,及同樣為本發明之特定範例具體實施 例的編碼器15,均可操作以在處理輸入信號CH1至CH3時, 對於各套用的時間/頻率微磚,將三個輸入信號至〔Η] 編碼為兩個降頻混合的通道6丨〇、62〇,即l〇[n]、r〇[n]與2N 4 個參數。 如圖1所示的編碼器5(同樣地,如圖3所示的編碼器15)的 補充’為如圖2所示的補充解碼器,在其中大致以1〇表示。 解碼器10包括處理單元画,其經操作可從編碼器5接收降
頻混合輸出信號61〇、62〇及傳遞參數資訊的第三參數組輸 出600 ’例如上述參數^與^的數值。可操作解碼器胸 處理在其處接收之輸出600、61〇、62〇的信號,以產生解碼 輸出信號1500、151〇、152。,其係分別為輸入信號⑽、 CH2、CH3的解碼表示。 在解碼器H),在自編碼器5接收各時間/頻率微碑的輸出 6〇〇、610、620時’例如藉由如網際網路的通信網路及/或 數位視訊光碟(DVD)的資料載體或類似資料媒體傳遞, 執行以下處理函數: 10075 丨.doc •19· 1380286 (a) 使用2N-4個係數與描述係數間關係的四個方程式,即關 於方程式10至13的資訊,計算所有Ν個通道的係數^與 C2A ;然後 ’'
(b) 使用方程式14(Eq. 14)計算各輸入信號&以]的近似表示 之W : 乏’ -Ci.z,A)W+c2ζ<Λ。㈤ 方程式 14 其中1/〇[让]與汉〇1>]為代表分別於解碼器10接收之兩個降頻 混合通道之時間/頻率微碑的信號,即輸出61〇、62〇。 現在將參考第二背景的圖4來說明第一背景中如2圖所示 之解碼器10的特定範例具體實施例。在圖4中,其中顯示大 致如18所示的解碼器。解碼器18包含區段與變換單元 1600,用於變換上述降頻混合輸出61〇、62〇(表示為%、丨。), 以產生對應的變換信號1650、1660,其分別表示為Rq、l。。 此外·,解碼器18還包括解碼處理器161〇,用於接收信號 600、1650、1660並處理這些信號,以分別產生關於左通道 (L)、中央通道(C)、及右通道(R)之對應的處理信號17〇〇、 1710、1720。 信號1700係直接及另外經由所示的解相關器175〇耦合至 反向PCA單元1800’該單元經操作可產生兩個中間輸出Lf、 Ls ’該等輸出係耦合至反向變換與〇LA單元19〇〇。可操作 反向變換單元1900以處理中間輸A]Lf、Ls,以產生對應於 圖2之輸出1500的解碼器輸出2〇〇〇、2010,即輸入信號4〇〇、 410的重新產生版。 同樣地,彳s號17 10係直接及另外經由所示的解相關器 100751.doc •20- 1380286 1760耦合至反向PCA單元181〇,該單元經操作可產生兩個 中間輸出Cs、LFE ’該等輸出係耗合至反向變換與單元 1910。可操作反向變換單元191〇以處理中間輸出Cs、LFE,
以產生對應於圖2之輸出1510的解碼器輪出202 〇、2030,即 輸入信號420、430的重新產生版。 同樣地,仏號1720係直接及另外經由所示的解相關器 1770耦合至反向PCA單元182〇,該單元經操作可產生兩個 中間輸出Rf、Rs,該等輸出係耦合至反向變換與〇la單元 1920。可操作反向變換單元192〇以處理中間輸出心、, 以產生對應於圖2之輸出1520的解碼器輸出2〇4〇、2〇5〇,即 輸入信號440、450的重新產生版。 單元1800、1810、182〇在運算期間需要使用參數輸入 920、820、720 ’以接收足夠獲得正確運算的資料。 處理在解碼處理器1610(本發明又稱為解媽器)内執行的 運算牽涉數學運算,如上述參考如圖2所示之解碼器職 應明白’可修改上述本發明的具體實施例,而不背離隨 附申請專利範圍所定義之本發明的範疇。 例如,編碼器5(同樣地,編碼器15)較佳經配置可運作以 在處理期間’在降頻混合輸出中,藉由套用方程式】# 16(Eq. 15與16),以產生良好的立體聲影像 ^〇[^]= ^[/t]+Cs[jt] 及 〇[无]=雄]+Cy[jt] 方程式15 方程式16 100751.doc -21 - 1380286 在此種ί月;兄中,N=3,因此,每個微碑僅有 如2N-4所決定,需要從編碼器$傳送至解碼器!種數’ 的有利之處在於,兩個參數或係數= 數值範圍t,致使能夠對其套用相㈣量彳卜、相同 對應地,在解碼器10,在提供 其中對各㈣計算六個參數,Epc ^錢放時, ^ ^ L' C2(L' C, R. Γ, s n 及C2.Cs。此種計算係美於兩袖击 ,R丨’Cs、 數間之關係的資:兩個傳送的參數及關於這六個參 例:二係數〜與“從編碼器5傳送至解碼器1〇。缺 ,’解碼㈣能夠從其中藉由方程麵17)得到其: 係數’该方程式即: '、 ^2,L - C2 R - 1 Ci,。=1 一Cu C丨.Λ =Cu -1 C2.〇=1-C2iJ{ 方程式17 在為各微磚取得這六個餘時,藉由使用解碼ϋ 10内執 ^^的/程式18(Eq.18),可在解碼㈣内重新產生編 輸“號的表示’即杯%]、及細: L[k]4k] Csfjt] C^LAk)+C2LR0[k) ChcL〇[k}+C2CR^[k] 方程式18 然後可將&些信號φ]、如、及細從頻域變換至時域, 以差生信號】500至1520,以例如在家庭劇院播放期間,從 解碼器10輸出供使用者欣賞。 10075 丨,<j〇c •22· 1380286 在多通道編碼器5、15的最直接使用中,在上述多通道編 碼器5、15及多通道解碼器1〇、18間採用標準立體聲編瑪 二 器,即編碼器及解碼器’其中m=2。換言之,參考圖3及4, v 直接將圖3的輸出信號610、620饋送給標準立體聲編碼器 • 3000 ’之後經由如圖5所示的多工器3002。其後經由資料通 信路由3010,例如經由資料載體或通信網路,將包括參數 資料(600 ; 600、720、820、920)之多工器 3002的輸出 3005 φ 傳遞至解多工器3012 ’其後再傳遞至補充立體聲編碼器 3000的立體聲解碼器3020。將解碼器3020的解碼輸出信號 3030和解多工器3012的參數資料(600 ; 600、720、820、920) 饋送給多通道解碼器1〇、18。解碼器3〇2〇的輸出3〇3〇為多 通道編碼器5、15之輸出信號610、620的重新產生版。如圖 5所不的組態為一種方式範例,其中可將多通道編碼器$、 I5及多通道解碼器10、18互連。 在隨附的申請專利範圍中,在括弧内的數字與其他符號 • 可協助瞭解申請專利範圍,但絕非用來限制申請專利範圍 的範疇》 在說明本案内容及其關聯的申請專利範圍時,應以非專 有的方式來解讀如「包含」、「包括」、「併入」、「含有」、「係 為」、及「具有」等措辭,即其解讀允許呈現未明確定義的 其他項目或成分。也應將所提的單數形解讀為複數形,反 之亦然》 【圖式簡單說明】 現在參考附圖,僅經由範例說明本發明之具體實施例, 100751.doc •23- 1380286 γ- 圖2為和關於本發明第一背景 B0 ^ 月京之圖1的編碼器相容之本發 月之解碼器之具體實施例的方塊圖; 圖3為本發明的較佳具體實 政加吐 例其中編碼器用於關於本 發月第二背景之本發明的多通道編碼器之内;
圖4為使用本發明之編碼器之解碼器的具體實施例,該編 碼器和關於本發明第二背景之圖3的編碼器相容;及 圖5為其中共同以標準立體聲編碼器與解瑪器進行组綠 配置之本發明之多通道編碼器與多通道解碍器的組態。 【主要元件符號說明】
其中: 圖1為在其中包括關於本 哭夕夕又 β弟方景之本發明之編碼 盗之夕通道編碼器之具體實施例的方塊圖; 5 編碼器 10 解碼器 15 編碼器 18 解碼器 20 處理單元 30 處理單元 40 處理單元 100 區段與變換單元 110 、 210 、 310 參數分析單元 120 、 220 、 320 參數至PCA角單元 130 、 230 、 330 PC A旋轉單元 180 混合與參數擷取單 100751.doc -24-
1380286
200 區段與變換單元 300 區段與變換單元 360 反向變換與OLA單元 400 輸入信號 410 輸入信號 420 輸入信號 430 輸入信號 440 輸入信號 450 輸入信號 500 通道 5 10 通道 520 通道 600 > 610 ' 620 輸出 700、 710 、 720 輸出 800 ' 810 ' 820 輸出 900、 910 ' 920 輸出 950 ' 960 中間信號 1000 處理單元 1500 解碼輸出信號 1510 解碼輸出信號 1520 解碼輸出信號 1600 區段與變換單元 1610 處理器 100751.doc -25·
1380286
1650 ' 1660 1700、1710、1720 1 750、1760、1770 1 800、1810、1820 1900 1910 1920 2000 2010 2020 2030 2040 2050 3000 3002 3005 3010 3012 3020 3030 變換信號 處理信號 解相關器 反向PCA單元 反向變換與OLA單元 反向變換與OLA單元 反向變換與OLA單元 解碼器輸出 解碼器輸出 解碼器輸出 解碼器輸出 解碼器輸出 解碼器輸出 立體聲編碼器 多工器 輸出 資料通信路由 解多工器 立體聲解碼器 解碼輸出信號 •26· 100751.doc

Claims (1)

138.0286 第094110561號專利申請案 ' 中文申請專利範圍替換本(101年5月)__ 十、申請專利範圍: /〇%許日修正本 1. 一種多通道編碼器(5; 15),其經操作可處理i復数個輸· ' 入通道(CH1至CH3 ; 400至450)中傳遞的輸入信號以產生 包含降頻昆合(down-mix)輸出信號(610、620)和互補 (complementary)之參數資料(600)之對應的輸出資料,該 編碼器(5 ; 15)包括: (a) 一降頻混合器,用於降頻混合該等輸入信號(CH1至 CH3 ; 400至450),以產生該等對應的降頻混合輸出信號 (610、620);及 (b) —分析器(180),用於處理該等輸入信號(CH1至 CH3 ; 400至450),該分析器(180)可操作以產生互補該等 降頻混合輸出信號(61〇、620)的該參數資料;其特徵為: 該編碼器可經操作以在產生該等降頻混合輸出信號 (610、620)時允許後續解碼該等降頻混合輸出信號(6ι〇、 620),以預測在該編碼器内處理然後丟棄之通道的信號’ 其:該分析器可操作以藉由套用得自一或多個輸入信號 及。亥4夕個輸入信號之一估計之差值之至少一信號的 最佳化’來產生該參數資料(6〇〇)中至少部分(C,,i ; C2i) ,該預計絲該參數資料(_)及該等降頻混合輸出信號 (61° 62〇)產生於該多通道編碼器(5 ; 15)中。 青求項1之多通道編碼器(5 ; 1 5),可操作該編媽器(5 ; 1 5 )以根擄時間/镅盎 頻丰微磚處理該等輸入信號(CH1至 CH3 ; 400至 450)。 3.如凊求項2之多通道蝙 馬1§ (5,15),其中在該等輸入信號 100751-1010504.doc 至CH3; 400至物)的處理期間,在該編碼器(5旧 之前或之中定義該等微碑。 如請求項1之多通道編碼器(5 I ’15)’其中該最佳化牵涉極 小化一歐幾里得模β 如請求机多通道編碼器(5; 15),其中有可操作該分析 器以處理的Ν個輸入通道’以為各時間/頻率微磚產生該參 數資料可操作該分析器以輸出μ(ν·μ)個參數和難降 頻混合輸出信號’以代表該等輸出資料(_、61〇、62〇) 中的該等輸人信號咖至cH3;_至45G);M_為整數 &Μ<Ν。 如π求項5之多通道編碼器(5 ; 15),其中該整數μ等於二。 7.:種用於含在如請求項i之多通道編碼器之内的信號處理 器(180)彳操作該處理器(18())以處理在該多通道編碼器 (15)中的資料,以產生其降頻混合輸出信號(6! 〇、62〇) 與參數資料(_),其特徵為該處理器(180)可操作以藉由 套用什自一或多個輸入信號及該一或多個輸入信號之一 估计之差值之至少一信號的最佳化,來產生該參數資料 (600)中至》部分(Cl i; C2,i),該預計可從該參數資料(6〇〇) 及該等降頻混合輸出信號(61〇、620)產生於該多通道編碼 器(5 ; 15)中。 種在一多通道編碼器(5; 15)中編碼輸入信號(CH1至 CH3 ; 400至450)以產生對應之輸出資料(600 ' 610、620) 之方法’ 3亥對應之輸出資料包含降頻混合輸出信號(6 1 〇、 62〇)和互補的參數資料(600),該方法包括以下驟: l〇〇751-l〇i〇5〇4.d〇c S 138.0286 (a) 經由複數(N)個輸入通道將該等輸入信號(cm至 CH3 ; 400至450)提供至該編碼器(5 ; 15); (b) 降頻混合該等輸入信號(chi至CH3 ; 400至450),以 產生該等對應的(M)降頻混合輸出信號(6丨〇、62〇);及 ⑷處理該等輸入信號(CmCH3 ; 4〇〇至45〇)以產生互 補该等降頻混合輸出信號(61〇、62〇)的該參數資料 (600),其待徵為: 在s亥多通道編碼器中處理該等輸入信號(CH1至CH3 ; 400至450)牵涉決定該參數資料(6〇〇),以在其後能夠重新 產生該等輸入信號((:出至(:113 ; 4〇〇至45〇)的表示,該等 降頻混合信號允許其中的解碼,以預測在該編 碼器中處理然後在其中丟棄之通道之信號的内容,其中- 處理該等輸入信號以產生該參數資料之步驟包含藉由套 用得自一或多個輪入信號及該一或多個輸入信號之一估 值之至父彳§號的最佳化,來產生該參數資料(6〇〇) 中至少部分(ci,i ; C2,i),該預計可從該參數資料_)及 該等降㈣合輪出信號(610、620)產生於該多通道編碼器 (5 ; 15)中 〇 10075M010504.doc
TW094110561A 2004-04-05 2005-04-01 Multi-channel encoder TWI380286B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04102862 2004-06-22

Publications (2)

Publication Number Publication Date
TW200612392A TW200612392A (en) 2006-04-16
TWI380286B true TWI380286B (en) 2012-12-21

Family

ID=34962080

Family Applications (1)

Application Number Title Priority Date Filing Date
TW094110561A TWI380286B (en) 2004-04-05 2005-04-01 Multi-channel encoder

Country Status (10)

Country Link
US (2) US7813513B2 (zh)
EP (3) EP1735777A1 (zh)
JP (2) JP4938648B2 (zh)
KR (1) KR101135869B1 (zh)
CN (1) CN1938760B (zh)
BR (1) BRPI0509100B1 (zh)
MX (1) MXPA06011359A (zh)
RU (1) RU2382419C2 (zh)
TW (1) TWI380286B (zh)
WO (1) WO2005098824A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1735777A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Multi-channel encoder
JP5451394B2 (ja) * 2006-09-29 2014-03-26 韓國電子通信研究院 多様なチャネルから構成されたマルチオブジェクトオーディオ信号の符号化および復号化装置、並びにその方法
EP2372701B1 (en) * 2006-10-16 2013-12-11 Dolby International AB Enhanced coding and parameter representation of multichannel downmixed object coding
EP2283483B1 (en) * 2008-05-23 2013-03-13 Koninklijke Philips Electronics N.V. A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2146522A1 (en) 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
BR122019023924B1 (pt) 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US8942989B2 (en) 2009-12-28 2015-01-27 Panasonic Intellectual Property Corporation Of America Speech coding of principal-component channels for deleting redundant inter-channel parameters
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN102907120B (zh) * 2010-06-02 2016-05-25 皇家飞利浦电子股份有限公司 用于声音处理的系统和方法
PL2609590T3 (pl) * 2010-08-25 2015-10-30 Fraunhofer Ges Forschung Urządzenie do dekodowania sygnału zawierającego transjenty z użyciem jednostki łączenia i miksera
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
CN103415883B (zh) 2011-03-28 2015-11-25 杜比实验室特许公司 用于低频效果声道的减少复杂性变换
WO2013120510A1 (en) * 2012-02-14 2013-08-22 Huawei Technologies Co., Ltd. A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
EP2733965A1 (en) 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
CN105229733B (zh) * 2013-05-24 2019-03-08 杜比国际公司 包括音频对象的音频场景的高效编码
BR122020017144B1 (pt) 2013-05-24 2022-05-03 Dolby International Ab Método para a codificação de objetos de áudio em um fluxo de dados, codificador para a codificação de objetos de áudio em um fluxo de dados, método em um decodificador para decodificar um fluxo de dados incluindo objetos de áudio codificados e decodificador para decodificar um fluxo de dados incluindo objetos de áudio codificados
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10170125B2 (en) 2013-09-12 2019-01-01 Dolby International Ab Audio decoding system and audio encoding system
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69428939T2 (de) * 1993-06-22 2002-04-04 Thomson Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
JP3342001B2 (ja) * 1998-10-13 2002-11-05 日本ビクター株式会社 記録媒体、音声復号装置
KR100915120B1 (ko) * 1999-04-07 2009-09-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 다중-채널 오디오 신호들을 무손실 부호화 및 복호화하기 위한 장치 및 방법
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
CN100429960C (zh) * 2000-07-19 2008-10-29 皇家菲利浦电子有限公司 用于获得立体声环绕和/或音频中心信号的多声道立体声转换器
US7200561B2 (en) * 2001-08-23 2007-04-03 Nippon Telegraph And Telephone Corporation Digital signal coding and decoding methods and apparatuses and programs therefor
CN1666572A (zh) * 2002-04-05 2005-09-07 皇家飞利浦电子股份有限公司 信号处理
CN1284319C (zh) * 2002-04-22 2006-11-08 西安大唐电信有限公司 一种多通道amr声码器的实现方法和设备
EP1881486B1 (en) * 2002-04-22 2009-03-18 Koninklijke Philips Electronics N.V. Decoding apparatus with decorrelator unit
CN100539742C (zh) * 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
EP1735777A1 (en) * 2004-04-05 2006-12-27 Koninklijke Philips Electronics N.V. Multi-channel encoder

Also Published As

Publication number Publication date
EP1735777A1 (en) 2006-12-27
EP1895512A3 (en) 2014-09-17
KR101135869B1 (ko) 2012-04-19
BRPI0509100B1 (pt) 2018-11-06
US20110040398A1 (en) 2011-02-17
US7813513B2 (en) 2010-10-12
RU2006139082A (ru) 2008-05-20
EP3573055B1 (en) 2022-03-23
CN1938760B (zh) 2012-05-23
WO2005098824A1 (en) 2005-10-20
JP2007531914A (ja) 2007-11-08
US8065136B2 (en) 2011-11-22
CN1938760A (zh) 2007-03-28
KR20070001206A (ko) 2007-01-03
US20070239442A1 (en) 2007-10-11
RU2382419C2 (ru) 2010-02-20
MXPA06011359A (es) 2007-01-16
TW200612392A (en) 2006-04-16
EP1895512A2 (en) 2008-03-05
BRPI0509100A (pt) 2007-08-28
JP2011209745A (ja) 2011-10-20
JP4938648B2 (ja) 2012-05-23
JP5539926B2 (ja) 2014-07-02
EP3573055A1 (en) 2019-11-27

Similar Documents

Publication Publication Date Title
TWI380286B (en) Multi-channel encoder
TWI393119B (zh) 多通道編碼器、編碼方法、電腦程式產品及多通道解碼器
JP5265358B2 (ja) パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念
TWI387351B (zh) 編碼器、解碼器及其相關方法
JP5455647B2 (ja) オーディオデコーダ
KR101236259B1 (ko) 오디오 채널들을 인코딩하는 방법 및 장치
JP5694279B2 (ja) 符号化装置
EP3468074B1 (en) Method and apparatus for decoding an ambisonics representation of a 2- or 3-dimensional sound field
CA2593290C (en) Compact side information for parametric coding of spatial audio
JP5171622B2 (ja) マルチチャンネルオーディオ信号の生成
RU2608847C1 (ru) Кодирование звуковых сцен
KR20080107422A (ko) 오디오 인코딩 및 디코딩
KR20090066190A (ko) 대화형 오디오 송/수신 장치 및 그 방법