TWI455614B - 方法、器件、編碼器裝置、解碼器裝置及聲訊系統 - Google Patents
方法、器件、編碼器裝置、解碼器裝置及聲訊系統 Download PDFInfo
- Publication number
- TWI455614B TWI455614B TW094110514A TW94110514A TWI455614B TW I455614 B TWI455614 B TW I455614B TW 094110514 A TW094110514 A TW 094110514A TW 94110514 A TW94110514 A TW 94110514A TW I455614 B TWI455614 B TW I455614B
- Authority
- TW
- Taiwan
- Prior art keywords
- processing
- signal
- channel
- signals
- parameter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 46
- 238000012805 post-processing Methods 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 17
- 230000002441 reversible effect Effects 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 241001342895 Chorus Species 0.000 description 2
- 239000011449 brick Substances 0.000 description 2
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明係關於一種用以處理從一編碼器獲得的一立體聲信號之方法及器件,該編碼器將一N聲道聲訊信號編碼成左與右信號及空間參數。本發明還係關於一種包含此一編碼器與此一器件之編碼器裝置。
本發明還係關於一種藉由對用以處理從一編碼器獲得的一立體聲信號之一方法及器件而獲得之一立體聲信號進行處理之此一方法及器件。本發明還係關於一種包含用以處理一立體聲信號的此一器件之解碼器裝置。
本發明還係關於一種包含此一編碼器裝置與此一解碼器裝置之聲訊系統。
長久以來,音樂的立體聲重製(例如在家庭環境中)一直較普遍。在20世紀70年代,有些實驗係藉由家庭音樂設備的四聲道重製來進行。
在較大的廳堂裏,例如電影院,聲音的多聲道重製已存在一段較長時間。為在大廳裏提供真實而動人的聲音重製,而開發出Dolby Digital及其他系統。
此類多聲道系統已引入家庭影院並引起廣泛的關注。因此,具有五個全音域聲道及一個部分音域聲道或低頻效果(LFE)聲道之系統,即所謂的5.1系統,如今已普遍進入市場。還存在其他系統,例如2.1、4.1、7.1,甚至8.1。
藉由引入SACD及DVD,多聲道聲訊重製正引起人們更大的興趣。許多消費者已經可在家裏進行多聲道播放,而多聲道原始材料開始受到歡迎。
由於多聲道材料越來越受到人們歡迎,因此對多聲道材料進行有效的編碼正變得更加重要,此點已為標準機構(例如,MPEG)所認知。
先前已知的編碼器常常並不應用有效的方法來編碼多聲道聲訊。基本上可個別地編碼該等輸入聲道(可能在矩陣化後),從而由於為數眾多的聲道而需要較高的位元率。
但是,一多聲道聲訊編碼器可產生一2聲道降頻混合,此一混合可與2聲道重製系統相容,同時仍使得在解碼器側能夠進行高品質的多聲道重建。藉由控制立體聲至多聲道升頻混合程序所傳送的參數P來控制該高品質重建。該些參數包含說明諸多方面之資訊,其中包括說明前方信號相對於在該2聲道降頻混合中存在的環繞聲信號之比率。使用此一方法,一解碼器能控制與在該升頻混合程序中的前方信號相對的環繞聲信號之數量。換言之,該等參數說明存在於原始多聲道信號中但因該降頻混合程序而在該立體聲混合中遺失的空間聲場之重要特性。
本發明係關於使用此參數化的空間資訊來對一2聲道降頻混合施加與參數相關而較佳係可逆的後處理,以增強該降頻混合(例如,該降頻混合之知覺品質或空間特性)之可能性。
本發明之一目的係使得依據在該多聲道編碼器中決定的參數可在編碼後對該降頻混合進行後處理,且仍然保持可進行多聲道解碼而不受該後處理之影響。
此目的係藉由一種用以處理從一編碼器獲得的一立體聲信號之方法及器件,該編碼器將一N聲道(N>2)信號編碼成左與右信號及空間參數。該方法包含對該等左與右聲道信號進行處理以便提供經處理的信號。對該處理之控制取決於該等空間參數。一般的理念係使用從一N聲道至立體聲編碼器獲得之空間參數來控制一特定的後處理演算法。以此方式,可處理從該編碼器獲得之立體聲信號,例如用以增強空間感。
在本發明之一項具體實施例中,藉由針對每一輸入聲道(例如針對該等左與右信號中的每一信號)之一第一參數來控制該處理,該第一參數係取決於該等空間參數。該第一參數可能係一時間及/或頻率函數。從而,該系統可能經歷可變數量之後處理,其中後處理的實際數量取決於該等空間參數。可在不同的頻帶中個別地執行該後處理。該編碼器輸送獨立的空間參數,該等參數說明針對一組頻帶之空間影像。在該情況下,該第一參數可能與頻率相關。
在本發明之另一項具體實施例中,該後處理包含添加一第一、第二及第三信號以便獲得該等經處理的聲道信號。該第一信號包括由一第一傳輸函數修改的第一輸入信號(即,該左或右信號),該第二信號包括由一第二傳輸函數修改的第一輸入信號,而該第三信號包括由一第三傳輸函數修改的第二輸出信號(即,該右或左信號)。該第二傳輸函數可包含該第一參數與一第一濾波函數。該第一傳輸函數可能包含一第二參數,從而該第一參數與該第二參數之和可能係一和諧值。該第三傳輸函數可包含該第二輸入信號之該第一參數與一第二濾波函數。
該濾波函數可不隨時間變化。
在一項特定具體實施例中,可以下面的等式來說明該等信號:=H 其中:H
=其中,a係一常數。
使用此表示法,該等濾波函數H1
、H2
、H3
及H4
之濾波效果可因改變該等參數wl
及wr
而變化。若二參數之值皆等於零,則該等經後處理的信號L0 w
、R0 w
本質上等於立體聲輸入信號對L0
、R0
。另一方面,若該等參數為+1,則經後處理的立體聲對L0 w
、R0 w
完全係藉由該等濾波函數H1
、H2
、H3
及H4
來處理。本發明使得可藉由該等空間參數P來控制濾波的實際數量,即該等參數wl
及wr
之值。
依據一項具體實施例,該等濾波函數及參數之選擇使得該傳輸函數矩陣可逆轉。此點使得可重建該原始立體聲信號。
在本發明之另一方面,其包含一種用以依據上面提到的方法來處理一立體聲信號之器件以及一種包含此一器件之編碼器裝置。
在本發明之另一方面,提供一種用以依據上面提到的方法來逆轉該處理之方法及器件以及一種包含此一逆向器件之解碼器裝置。
在本發明之另一方面,提供一種包含此一編碼器裝置與此一解碼器裝置之聲訊系統。
圖1係希望在其中使用本發明之一編碼器/解碼器系統之一方塊圖。在聲訊系統1中,將一N聲道聲訊信號提供給一編碼器2,而N係一大於2之整數。該編碼器2將該等N聲道聲訊信號轉換為信號L0
與R0
及參數解碼器資訊P,藉由此舉,一解碼器便能解碼該資訊並估計欲從該解碼器輸出之原始N聲道信號。該空間參數集合P較佳的係與時間及/或頻率相關。該等N聲道信號可能係針對一5.1系統之信號,該系統包含一中心聲道、二前方聲道、二環繞聲道及一LFE聲道。
以一合適的方式,例如,藉由CD、DVD、VHS Hi-Fi、廣播、雷射碟片、DBS、數位電纜、網際網路或任何其他傳輸或分配系統,將該等經編碼的立體聲信號對L0
與R0
及解碼器空間資訊P傳送給使用者,如圖1中的環形線4所示。由於傳送該等左及右信號,因此該系統可與眾多僅能重製立體聲信號的接收設備相容。若該接收設備包括一解碼器,則該解碼器可解碼該等N聲道信號並提供關於該等信號之一估計,此係依據該立體聲信號對L0
與R0
中的資訊以及該等解碼器空間資訊信號或空間參數P。
但是,由於播放信號數量減少,因此立體聲信號與該等N聲道信號相比缺少空間資訊或缺少對於特定情況而言可能需要的其他特性。因此,依據本發明,提供一種在傳輸/分配給該接收器之前處理該立體聲信號之後處理器5。該後處理可能係與位置相關而「添加」低音或混響,或移除合音(卡拉OK在中心聲道中有合音)。
後處理之其他範例係立體聲基線加寬,此舉係藉由利用關於原始環繞聲混合(例如,前方/後方)組成之知識來實行,因為個別輸入信號在其中所起之作用已知係來自該等解碼器資訊信號P。從原理上說,可能已經在該編碼器中施加立體聲加寬,但此處理一般不可逆轉,因為在該解碼器中僅有二信號可用而非N個信號,所以逆轉一般不可實現。但是除立體聲加寬外,還可就個別多聲道在其中所起的作用而採用其他後處理技術。
依據本發明,將該等經後處理的信號傳送給一接收器,如圖1中的環形線6所示。用以處理從一編碼器獲得的一立體聲信號之發明器件包含該後處理器5。依據本發明之編碼器裝置包含該編碼器2與該後處理器5。
可直接使用接收到的信號,例如在該接收器不包括一多聲道解碼器之情況下。此點可能係在透過該網際網路而接收該信號6之一電腦或在僅具有二揚聲器之一接收器的情況中。此類接收到的信號係感知為一高品質信號,因為其具有增強的空間感或具有如該信號之處理過程中由該編碼器及該後處理器決定的其他特徵。
若該信號應係用於在一傳統N聲道解碼器3中進行解碼,則必須首先藉由一逆向後處理器7來對該信號進行逆轉的後處理,以便重建該原始立體聲信號對L0
與R0
,該原始立體聲信號對L0
及R0
與該解碼器資訊或空間參數P一起產生一估計出的N聲道信號。依據本發明,此類重建可能屬於該多聲道混合,此重建幾乎不受該後處理之影響。同樣,可針對該立體聲播放而在該解碼器中進行後處理以作為可由使用者來選擇的特徵,而無需首先決定該多聲道信號。用以處理包含左與右信號之一立體聲信號之發明器件包含該逆向後處理器7。依據本發明之解碼器裝置包含該解碼器3與該逆向後處理器7。
若不進行後處理,則該降頻混合可與一標準的ITU降頻混合相容。但是,本發明之方法可明顯改善該降頻混合。
本發明方法能夠借助於在該編碼器中決定的空間參數P來決定該原始聲道的降頻混合在該多聲道混合中所起的作用。以此方式,可向該多聲道混合的特定聲道施加後處理,例如後方聲道之立體聲基線加寬,而不會影響其他聲道。若該後處理係可逆轉的,則該後處理不影響最終的多聲道重建。還可施加該後處理來改善立體聲播放,而無需首先重建該多聲道混合。
此方法與現有的後處理技術不同之處在於,其使用原始多聲道混合之知識,即決定出的空間參數P。
該編碼器2之操作方式如下:將一N聲道聲訊信號假定為該編碼器2之一輸入信號,其中z1
[n]、z2
[n]、...、zN
[n]說明該等N聲道之分離的時域波形。使用一般的分割方法(segmentation)來分割該些N個信號,較佳的係使用重疊分析視窗。隨後,可使用一複雜的轉換(例如,FFT)將每一區段轉換成該頻域。但是,複雜的濾波器組結構亦可適用於獲得時頻微磚。此程序使得已分割的子頻帶表示該等輸入信號,即,該等信號將會表示為Z1
[k]、Z2
[k]、ZN
[k],而k表示頻率指數。
由該些N聲道產生2個降頻混合聲道,其分別係L0
[k]與R0
[k]。每一降頻混合聲道皆係該等N個輸入信號之一線性組合:
該等參數αi
及βi
係選擇成使得由L0
[k]與R0
[k]組成的立體聲信號具有一良好的立體聲影像。在由Lf
、Rf
、C、Ls
及Rs
(分別針對左前方、右前方、中心、左環繞、右環繞聲道)組成的一5聲道輸入信號之情況下,可依據下式而獲得一合適的降頻混合:
可依據以下等式而獲得該等信號L及R:
此外,擷取空間參數P,使得能對來自L0
及R0
的信號Lf
、Rf
、C、Ls
及Rs
進行知覺重建。
在一項具體實施例中,該參數集合P包括在該等信號對(Lf
、Ls
)與(Rf
、Rs
)間的聲道間強度差(IID)且還可包括聲道間交互相關(ICC)值。依據以下等式而獲得該Lf
、Ls
對之間的IID及ICC:
此處,(*
)表示共軛複數。對於其他信號對,可使用類似的等式。因此,該參數IIDl
說明該等左前方與左環繞聲道之間的相對能量量,而參數ICCl
說明該等左前方與左環繞聲道之間的交互相關量。該些參數本質上說明前方與環繞聲道之間的知覺相關參數。
可藉由估計二個預測參數c1
與c2
而實現存在於L0
、R0
中的中心信號數量之參數化。該些二預測參數定義一2×3矩陣,其控制從L0
、R0
至L、C及R的解碼器升頻混合處理:
該升頻混合矩陣M之實施如下式所給定:
對於上述範例,該參數集合P包括針對每一時頻微磚之{c1
,c2
,IIDl
,ICCl
,IIDr
,ICCr
}。
針對所產生的立體聲信號對(L0
、R0
)而施加後處理之方式可能令該後處理主要影響Zi
[k]在該立體聲混合所起之作用,例如該立體聲混合中的Ls
及Rs
。圖1中顯示此區塊在該編碼解碼器中的位置。
圖2係依據本發明之一項具體實施例的圖1的後處理器5之詳細視圖。經後處理的左信號L0 w
係三個信號之和,該等三個信號即,經一傳輸函數HA
修改的左信號L0
、經一傳輸函數HB
修改的左信號L0
及經一傳輸函數HD
修改的右信號R0
。以相同方式,經後處理的右信號R0 w
係三個信號之和,該等三個信號即,經一傳輸函數HF
修改的右信號R0
、經一傳輸函數HE
修改的右信號R0
及經一傳輸函數HC
修改的左信號L0
。該等傳輸函數HA
至HF
可能係實施為FIR或IIR型濾波器,或可能僅係與頻率相關的(複)比例因數。此外,該傳輸函數HA
可能係與一第二參數(1-wl
)相乘,而傳輸函數HB
可能包括一第一參數wl
,從而此參數wl
決定該立體聲信號的後處理數量。
圖3中顯示此點。該參數wl
決定L0
[k]之後處理數量及wr
決定R0
[k]之後處理數量。當wl
等於0時,L0
[k]不受影響,而當wl
等於1時,L0
[k]受到的影響最大。此情形亦適用於wr
相對於R0
[k]之處理中。
以下等式適用於該等後處理參數wl
及wr
:wl
=f1
(IIDl
,ICCl
,c1
,c2
) Wr
=fr
(IIDr
,ICCr
,c1
,c2
)圖3中的區塊H1
、H2
、H3
及H4
係濾波函數,其可能係各類濾波器、例如立體聲加寬濾波器,如下面之顯示。
所產生的輸出係:=H 其中:H
=其中,a係一任意常數(例如,+1)。
若該等濾波函數H1
、H2
、H3
及H4
之選擇適當,則可令該傳輸函數矩陣H逆轉。此外,為使得能在該解碼器側計算該逆向矩陣,該等濾波函數H1
、H2
、H3
及H4
及參數wl
與wr
在該解碼器處應係已知。此點係可做到的,因為可依據所傳送的參數而計算出wl
及wr
。從而,該原始立體聲信號L0
、R0
將再次可用,此對於解碼該多聲道混合係必需的。
可做到的另一點係,在該解碼器中傳送該原始立體聲信號並施加該後處理從而可進行改善的立體聲播放而無需首先決定該多聲道混合。
下面,詳細說明該後處理之一項具體實施例。但是,本發明不限於確切的細節而可在隨附申請專利範圍中定義的本發明之範疇內變化。
該等後處理參數或權重wl
及wr
係所傳送的空間參數之一函數:(wl
,wr
)=f(P)該函數f之設計方式使得在該信號L0
包含更多來自該左環繞聲信號的能量(與來自該等左前方或中心信號之能量相比)之情況下使wl
增加。以一類似的方式,wr
隨存在於R0
中的右環繞聲信號之相對能量之增加而增加。針對wl
及wr
之傳統的表達式係給定為下式:wl
=f1
(c1
)f2
(IIDl
) wr
=f1
(c2
)f2
(IIDr
)而
及
對於該等濾波函數H1
、H2
、H3
及H4
,接著會選擇以下範例性函數(在z域中):H1
(z)=H4
(z)=0.8(1.0+0.2z- 1
+0.2z- 2
) H2
(z)=H3
(z)=0.8(-1.0z- 1
-0.2z- 2
)。
可將本發明整合於產生可與立體聲相容的降頻混合之一多聲道聲訊編碼器裝置中。藉由上述後處理方案而增強此一多聲道參數聲訊編碼器之一般方案可概述如下:-藉由分割並轉換或藉由施加一濾波器組,將該多聲道輸入信號轉換為該頻域;-擷取空間參數P並在該頻域中產生一降頻混合;-在該頻域中應用該後處理演算法;-將經後處理的信號轉換成該時域;-使用傳統的編碼技術(例如,MPEG中所定義之技術)來編碼該立體聲信號;-藉由經編碼的參數P來多工處理立體聲位元流,以形成一總輸出位元流。
一對應的多聲道解碼器裝置(即,具有整合的後處理版本之一解碼器)可概述如下:-解多工處理該參數位元流以擷取該等參數P及經編碼的立體聲信號;-解碼該立體聲信號;-將經解碼的立體聲信號轉換為該頻域;-依據該等參數P而施加該後處理版本;-依據該等參數P而從立體聲升頻混合為多聲道輸出;-將該多聲道輸出轉換為該時域。
由於該後處理及逆後處理係在該頻域中執行,因此較佳的係在該頻域中藉由可能與頻率相關的簡單(實數或複數)比例因數來轉換或約計該等濾波函數H1
至H4
。
熟習此項技術者可瞭解,如上面所概述之一或多個處理階段可組合為一單一處理階段。
本發明之另一應用係僅在該解碼器側對該立體聲信號施加該後處理(即,在該編碼器側不進行後處理)。使用此方法,該解碼器能從一未增強的立體信號產生一增強的立體聲信號。
在發出表示是否已進行該後處理以及是否已使用參數函數f1
、f2
及哪幾個濾波函數H1
、H2
、H3
及H4
之信號的位元流中,可提供額外的資訊,從而使得能進行逆後處理。
一濾波函數可能係說明為在該頻域中之一乘法。由於參數係存在用於個別頻帶,因此,本發明可能係實施為簡單、複數增益而非個別適用於不同頻帶中的濾波器。在此情況下,藉由一簡單的(2×2)矩陣乘法而從來自(L0
、R0
)的對應頻帶獲得L0 w
、R0 w
之頻帶。藉由代表該等濾波函數H並因此由該等不隨時間變化之增益H與受一隨時間/頻率變化的參數控制之增益wl
及wr
組成之參數及頻域,來決定實際矩陣項。由於該濾波器對於每一頻帶皆係純量,因此可進行逆處理。
可藉由以下矩陣等式來說明該編碼器中的後處理:
其中:
此矩陣等式適用於每一頻帶。該矩陣H包含所有純量。純量之使用使得相對較容易進行後處理及逆後處理。
該等參數wl
及wr
係純量並係該等參數集P之函數。該些二參數決定該等輸入聲道的後處理數量。
該等參數H1
...H4
係複合濾波函數。
此程序之逆轉亦可藉由逐一頻帶地執行一簡單矩陣乘法來實行。逐一頻帶適用以下等式:
其中
該矩陣H- 1
僅包含純量。該等元素H- 1
、k1
......k4
亦係該參數集合P之函數。當在該解碼器中已知該矩陣H中的函數h1 1
......h2 2
及該等參數P時,則可將該後處理逆轉。
圖4說明執行此類逆後處理的一逆向後處理器3之一方塊圖。
當該矩陣H之行列式不等於零時,可進行此逆轉。H之行列式等於:det(H
)=h 1 1 h 2 2
-h 1 2 h 2 1
=(1-w l
) a
(1-w r
) a
+(1-w l
) a w r a H 4
+(1-w r
) a w l a H 1
+w l a w r a
(H 1 H 4
-H 2 H 3
)當選擇合適的函數h1 1
......h2 2
時,det(H)將不等於零,因此該程序可逆轉。
在此特別提出,表達詞「包含」不排除其他元件或步驟,而「一」不排除複數個元件。此外,請求項中的參考標記不應解釋為限制該等請求項之範疇。
上文中,已參考特定具體實施例來說明本發明。但是,本發明不限於所說明的各種具體實施例,而閱讀本說明書的熟習此項技術者會明白,可以不同方式來修改並組合本發明。
1...聲訊系統
2...編碼器
3...N聲道解碼器
4...環形線
5...後處理器
6...環形線
7...逆向後處理器
H1
...濾波函數
H2
...濾波函數
H3
...濾波函數
H4
...濾波函數
HA
-HF
...傳輸函數
L0
...左立體聲道信號
L0 w
...經處理的聲道信號
P...空間參數
R0
...右立體聲道信號
wl
...第一參數
wr
...另一聲道之第一參數
從上面參考本發明之具體實施例並參考隨附圖式而對本發明所作的詳細說明,將會明白本發明之其他目的、特徵及優點,在該等圖式中:圖1顯示依據本發明包括後處理與逆後處理一編碼器/解碼器聲訊系統之一示意性方塊圖。
圖2顯示用以對從一多聲道編碼器獲得的一立體聲信號進行後處理之一器件之一項具體實施例之一詳細方塊圖。
圖3顯示用以對從一多聲道解碼器獲得的一立體聲信號進行後處理之器件之另一項具體實施例之一方塊圖。
圖4顯示用以對一包含左與右信號的立體聲信號進行逆後處理之一項具體實施例之一方塊圖。
5...後處理器
H1
...濾波函數
H2
...濾波函數
H3
...濾波函數
H4
...濾波函數
L0
...左立體聲道信號
L0 w
...經處理的聲道信號
R0
...右立體聲道信號
R0 w
...經處理的聲道信號
wl
...第一參數
wr
...另一聲道之第一參數
Claims (18)
- 一種處理從一編碼器獲得之一立體聲信號之方法,該編碼器將一N聲道聲訊信號編碼成左與右信號(L0 ;R0 )及空間參數(P),該方法包含:- 處理該等左與右信號以便提供經處理的信號(L0w ;R0w ),其中對該處理之控制取決於該等空間參數(P)。
- 如請求項1之方法,其中藉由針對該等左與右信號中每一信號之一第一參數(wl ;wr )來控制該處理,該第一參數取決於該等空間參數(P)。
- 如請求項2之方法,其中該第一參數(wl ;wr )係一時間及/或頻率函數。
- 2或3之方法,其中該處理包含藉由一取決於該等空間參數(P)的傳輸函數來過濾該等左與右信號中的至少一信號。
- 如請求項2之方法,其中該處理包含:- 添加一第一、第二及第三信號以便獲得該等經處理的聲道信號(L0w ;R0w ),其中該第一信號包括經一第一傳輸函數(L0 *HA ;R0 *HF )修改之立體聲信號,該第二信號包括經一第二傳輸函數(L0 *HB ;R0 *HE )修改的該同一聲道之立體聲信號,而該第三信號包括經一第三傳輸函數(R0 *HD ;L0 *HC )修改的另一聲道之立體聲信號。
- 如請求項5之方法,其中:- 該第二傳輸函數(HB ;HE )包含與該第一參數(wl ;wr )相乘而後面接著與一第一濾波函數(H1 ;H4 )相乘; - 該第一傳輸函數(HA ;HF )包含與一第二參數相乘;且- 該第三傳輸函數(HC ;HD )包含與該第一參數(wl ;wr )相乘而後面接著與一第二濾波函數(H2 ;H3 )相乘。
- 如請求項6之方法,其中該第一傳輸函數(HA ;HF )包含與一第二參數相乘,其中該第一參數係該第二參數之一函數。
- 如請求項6之方法,其中該第一濾波函數及該第二濾波函數之至少一者(H1 、H2 、H3 、H4 )不隨時間變化。
- 如請求項6之方法,其中藉由以下等式來說明該等信號:
- 如請求項9之方法,其中藉由以下等式來說明該傳輸函數矩陣(H): ,而a係一常數。
- 如請求項9之方法,其中該等濾波函數(H1 、H2 、H3 、H4 )及該等參數(wl 、wr )之選擇使得該傳輸函數矩陣(H)可逆轉。
- 如請求項1之方法,其中該等空間參數(P)包含說明該N聲道信號的信號位準之資訊。
- 一種用以處理從一編碼器獲得的一立體聲信號之器件,該編碼器將一N聲道聲訊信號編碼成左與右信號(L0 ;R0 ) 及空間參數(P),該器件包含:- 一後處理器(5),其係用以對該等左與右信號進行後處理以便提供經處理的信號(L0w ;R0w ),其中對該後處理之控制取決於該等空間參數(P)。
- 一種編碼器裝置,其包含:- 一編碼器(2),其係用以將一N聲道聲訊信號編碼成左及右信號(L0;R0)及空間參數(P),以及- 一種如請求項13之器件(5),其係根據該等空間參數(P)以處理該等左及右信號(L0;R0)。
- 一種用以處理一包含左及右信號(L0w ;R0w )的立體聲信號之方法,該方法包含依據請求項1至12項中任一項之方法而逆轉該處理。
- 一種用以處理一包含左及右信號(L0w ;R0w )的立體聲信號之器件(7),該器件包含用以依據請求項1至12項中任一項之方法而逆轉該處理之構件。
- 一種解碼器裝置,其包含:- 一種如請求項16之器件(7),其係用以處理一包含左與右信號(L0w ;R0w )之立體聲信號,以及- 一解碼器,其係用以將該等經處理的立體聲信號(L0 ;R0 )解碼成一N聲道聲訊信號。
- 一種聲訊系統(1),其包含一如請求項14之編碼器裝置與一如請求項17之解碼器裝置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04101405 | 2004-04-05 | ||
EP04103367 | 2004-07-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200611588A TW200611588A (en) | 2006-04-01 |
TWI455614B true TWI455614B (zh) | 2014-10-01 |
Family
ID=34962191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094110514A TWI455614B (zh) | 2004-04-05 | 2005-04-01 | 方法、器件、編碼器裝置、解碼器裝置及聲訊系統 |
Country Status (12)
Country | Link |
---|---|
US (1) | US9992599B2 (zh) |
EP (1) | EP1735779B1 (zh) |
JP (1) | JP5284638B2 (zh) |
KR (1) | KR101183862B1 (zh) |
CN (1) | CN1947172B (zh) |
BR (1) | BRPI0509110B1 (zh) |
ES (1) | ES2426917T3 (zh) |
MX (1) | MXPA06011397A (zh) |
PL (1) | PL1735779T3 (zh) |
RU (1) | RU2396608C2 (zh) |
TW (1) | TWI455614B (zh) |
WO (1) | WO2005098826A1 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2373728T3 (es) | 2004-07-14 | 2012-02-08 | Koninklijke Philips Electronics N.V. | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio. |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
ATE433182T1 (de) * | 2005-07-14 | 2009-06-15 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
US8626503B2 (en) | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
CN101263742B (zh) * | 2005-09-13 | 2014-12-17 | 皇家飞利浦电子股份有限公司 | 音频编码 |
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
US8411869B2 (en) * | 2006-01-19 | 2013-04-02 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
KR100878816B1 (ko) | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
DE602007004451D1 (de) | 2006-02-21 | 2010-03-11 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
SG175632A1 (en) | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
JP5394931B2 (ja) * | 2006-11-24 | 2014-01-22 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の復号化方法及びその装置 |
US8855795B2 (en) | 2007-01-09 | 2014-10-07 | Mediatek Inc. | Multiple output audio system |
KR100998913B1 (ko) * | 2008-01-23 | 2010-12-08 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 이의 장치 |
EP2083584B1 (en) | 2008-01-23 | 2010-09-15 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
US8615316B2 (en) | 2008-01-23 | 2013-12-24 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
US8942989B2 (en) | 2009-12-28 | 2015-01-27 | Panasonic Intellectual Property Corporation Of America | Speech coding of principal-component channels for deleting redundant inter-channel parameters |
CN102280107B (zh) * | 2010-06-10 | 2013-01-23 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
CN103262158B (zh) * | 2010-09-28 | 2015-07-29 | 华为技术有限公司 | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 |
ES2643163T3 (es) | 2010-12-03 | 2017-11-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para codificación de audio espacial basada en geometría |
RU2591026C2 (ru) * | 2011-01-05 | 2016-07-10 | Конинклейке Филипс Электроникс Н.В. | Аудиосистема и способ ее работы |
EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
EP2830046A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal to obtain modified output signals |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5818941A (en) * | 1995-11-22 | 1998-10-06 | Sony Corporation | Configurable cinema sound system |
US6154545A (en) * | 1997-07-16 | 2000-11-28 | Sony Corporation | Method and apparatus for two channels of sound having directional cues |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4095049A (en) * | 1976-03-15 | 1978-06-13 | National Research Development Corporation | Non-rotationally-symmetric surround-sound encoding system |
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
JPH06165079A (ja) * | 1992-11-25 | 1994-06-10 | Matsushita Electric Ind Co Ltd | マルチチャンネルステレオ用ダウンミキシング装置 |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
SG54379A1 (en) | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
US6931291B1 (en) | 1997-05-08 | 2005-08-16 | Stmicroelectronics Asia Pacific Pte Ltd. | Method and apparatus for frequency-domain downmixing with block-switch forcing for audio decoding functions |
US6173061B1 (en) * | 1997-06-23 | 2001-01-09 | Harman International Industries, Inc. | Steering of monaural sources of sound using head related transfer functions |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
AU2003244932A1 (en) | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7613306B2 (en) * | 2004-02-25 | 2009-11-03 | Panasonic Corporation | Audio encoder and audio decoder |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US20050247756A1 (en) | 2004-03-31 | 2005-11-10 | Frazer James T | Connection mechanism and method |
DE602005006777D1 (de) | 2004-04-05 | 2008-06-26 | Koninkl Philips Electronics Nv | Mehrkanal-codierer |
ES2373728T3 (es) * | 2004-07-14 | 2012-02-08 | Koninklijke Philips Electronics N.V. | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio. |
-
2005
- 2005-03-30 KR KR1020067020272A patent/KR101183862B1/ko active IP Right Grant
- 2005-03-30 CN CN200580012133XA patent/CN1947172B/zh active Active
- 2005-03-30 RU RU2006139068/09A patent/RU2396608C2/ru active
- 2005-03-30 WO PCT/IB2005/051065 patent/WO2005098826A1/en active Application Filing
- 2005-03-30 JP JP2007506884A patent/JP5284638B2/ja active Active
- 2005-03-30 BR BRPI0509110-1A patent/BRPI0509110B1/pt active IP Right Grant
- 2005-03-30 US US10/599,560 patent/US9992599B2/en active Active
- 2005-03-30 PL PL05718592T patent/PL1735779T3/pl unknown
- 2005-03-30 MX MXPA06011397A patent/MXPA06011397A/es active IP Right Grant
- 2005-03-30 ES ES05718592T patent/ES2426917T3/es active Active
- 2005-03-30 EP EP05718592.8A patent/EP1735779B1/en active Active
- 2005-04-01 TW TW094110514A patent/TWI455614B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5818941A (en) * | 1995-11-22 | 1998-10-06 | Sony Corporation | Configurable cinema sound system |
US6697491B1 (en) * | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
US6154545A (en) * | 1997-07-16 | 2000-11-28 | Sony Corporation | Method and apparatus for two channels of sound having directional cues |
Also Published As
Publication number | Publication date |
---|---|
EP1735779B1 (en) | 2013-06-19 |
JP5284638B2 (ja) | 2013-09-11 |
RU2006139068A (ru) | 2008-05-20 |
BRPI0509110B1 (pt) | 2019-07-09 |
CN1947172A (zh) | 2007-04-11 |
KR101183862B1 (ko) | 2012-09-20 |
MXPA06011397A (es) | 2006-12-20 |
TW200611588A (en) | 2006-04-01 |
WO2005098826A1 (en) | 2005-10-20 |
PL1735779T3 (pl) | 2014-01-31 |
EP1735779A1 (en) | 2006-12-27 |
US9992599B2 (en) | 2018-06-05 |
JP2007531916A (ja) | 2007-11-08 |
KR20070001205A (ko) | 2007-01-03 |
ES2426917T3 (es) | 2013-10-25 |
CN1947172B (zh) | 2011-08-03 |
US20070183601A1 (en) | 2007-08-09 |
BRPI0509110A (pt) | 2007-08-28 |
BRPI0509110A8 (pt) | 2016-02-10 |
RU2396608C2 (ru) | 2010-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI455614B (zh) | 方法、器件、編碼器裝置、解碼器裝置及聲訊系統 | |
US20220392467A1 (en) | Parametric joint-coding of audio sources | |
EP2175671B1 (en) | Method, device, encoder apparatus, decoder apparatus and audio system | |
JP5455647B2 (ja) | オーディオデコーダ |