TWI462086B - 音頻訊號之解碼方法及其裝置 - Google Patents
音頻訊號之解碼方法及其裝置 Download PDFInfo
- Publication number
- TWI462086B TWI462086B TW095134072A TW95134072A TWI462086B TW I462086 B TWI462086 B TW I462086B TW 095134072 A TW095134072 A TW 095134072A TW 95134072 A TW95134072 A TW 95134072A TW I462086 B TWI462086 B TW I462086B
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- spatial information
- audio signal
- spatial
- information
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 217
- 238000000034 method Methods 0.000 title claims description 84
- 238000013507 mapping Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 34
- 230000000694 effects Effects 0.000 description 16
- 101100355601 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RAD53 gene Proteins 0.000 description 10
- 101150087667 spk1 gene Proteins 0.000 description 10
- 101001062093 Homo sapiens RNA-binding protein 15 Proteins 0.000 description 9
- 102100029244 RNA-binding protein 15 Human genes 0.000 description 9
- 210000005069 ears Anatomy 0.000 description 7
- 101001130554 Homo sapiens Putative RNA-binding protein 15B Proteins 0.000 description 6
- 102100031409 Putative RNA-binding protein 15B Human genes 0.000 description 6
- 239000000203 mixture Substances 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 238000009795 derivation Methods 0.000 description 4
- 238000013213 extrapolation Methods 0.000 description 4
- 101100043388 Arabidopsis thaliana SRK2D gene Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
本發明係關於音頻訊號處理,尤其係關於一種音頻訊號之解碼裝置及其方法。雖然本發明適合廣泛的應用,但是尤其適合用於解碼音頻訊號。
通常,當編碼器編碼音頻訊號時,如果待編碼的音頻訊號為多通道音頻訊號,此多通道音頻訊號被降混為兩個通道或一個通道以產生降混音頻訊號,並且從多通道音頻訊號中擷取空間資訊。空間資訊係為可用於升混來自降混訊號的多通道音頻訊號的資訊。同時,編碼器係依照預定的樹狀組態,降混多通道音頻訊號。這個實例中,預定的樹狀組態可為音頻訊號解碼器以及音頻訊號編碼器間所議定之結構。特別是,如果識別資訊指出所屬預定樹狀組態類型之一,解碼器則能夠知道已升混的音頻訊號結構,例如通道的數目,每個通道的位置等等。
因此,如果編碼器依照預定的樹狀組態降混多通道訊號,這個過程擷取的空間資訊也由此結構決定。所以,如果解碼器使用此結構所決定的空間資訊升混此降混音頻訊號,則依照此結構之多通道音頻訊號即被產生。
也就是說,如果解碼器使用編碼器所產生的空間資訊,則升混過程係依照編碼器與解碼器間之議定結構而完成。所以,無法
產生不遵循議定結構的輸出通道音頻訊號。例如,無法升混訊號為具有通道數目不同於(小於或者大於)依照議定結構所決定的通道數目之音頻訊號。
鑒於以上的問題,本發明的主要目的在於提供一種音頻訊號之解碼裝置及其方法,實質上消除由於習知技術之限制及缺點導致的一或多個問題。
本發明的目的在於提供一種音頻訊號之解碼裝置及其方法,藉以解碼音頻訊號,從而使得其結構不同於編碼器所決定的結構。
本發明的另一目的在於提供一種音頻訊號之解碼裝置及其方法,可藉由修正編碼時所產生的先前空間資訊從而產生新的空間資訊以進行音頻訊號之解碼。
本發明其它的特徵和優點將在如下的說明書中加以闡述,並且透過本發明如下的說明得以部分地理解或者可以從本發明的實踐中得出。本發明的目的和其它優點可以透過本發明所記載的說明書和申請專利範圍中特別指明的結構並結合圖式部份,得以實現和獲得。
為了獲得本發明的這些目的和其他優點,現對本發明作具體化和概括性的描述,本發明的一種音頻訊號之解碼方法包含接收音頻訊號及空間資訊(spatial information),識別經修正的空間資訊的類型,使用空間資訊產生經修正的空間資訊,以及使用經修正
的空間資訊解碼音頻訊號,其中經修正的空間資訊的類型包含部分空間資訊、組合式空間資訊以及擴充空間資訊至少其中之一。
為了進一步獲得本發明的這些目的和其他優點,本發明的一種音頻訊號之解碼方法包含接收空間資訊,使用此空間資訊產生組合式空間資訊,以及使用此組合式空間資訊解碼音頻訊號,其中透過組合包含於空間資訊中的空間參數產生組合式空間資訊。
為了進一步獲得本發明的這些目的和其他優點,本發明的一種音頻訊號之解碼方法包含接收空間資訊及空間濾波器資訊,其中空間資訊至少包含一空間參數,空間濾波器資訊至少包含一濾波器參數;透過組合空間參數及濾波器參數產生包含環繞效果的組合式空間資訊;以及使用組合式空間資訊轉換音頻訊號為虛擬環繞訊號。
為了進一步獲得本發明的這些目的和其他優點,本發明的一種音頻訊號之解碼方法包含接收音頻訊號;接收包含樹狀組態資訊及空間參數的空間資訊;透過增加延伸空間資訊至空間資訊以產生經修正的空間資訊;以及使用經修正的空間資訊升混音頻訊號,其中包含根據空間資訊將音頻訊號轉換為初級升混音頻訊號,以及根據延伸空間資訊將初級升混音頻訊號轉換為二次升混音頻訊號。
可以理解的是,如上所述的本發明之概括說明和隨後所述的本發明之詳細說明均是具有代表性和解釋性的說明,並且是為了
進一步揭示本發明之申請專利範圍。
以下,將結合圖式部份對本發明的較佳實施方式作詳細說明。
本發明使用的術語係選擇當前全球使用的常用術語。並且,針對特定的實例,申請者任意地選擇術語,其中本發明之較佳實施例的說明中將詳盡地解釋詳細含義。因此,應該根據術語的含義而並非根據術語的名字來理解本發明。
首先,本發明使用空間資訊產生經修正的空間資訊,然後使用產生的經修正的空間資訊解碼音頻訊號。這個實例中,空間資訊係為依照預定樹狀組態於降混過程中所擷取的空間資訊,並且經修正的空間資訊係為使用空間資訊所新產生的空間資訊。
下面結合「第1圖」詳細解釋本發明。
「第1圖」係為本發明實施例之音頻訊號編碼裝置以及音頻訊號解碼裝置之方塊圖。
請參考「第1圖」,音頻訊號之編碼裝置100包含降混單元110以及空間資訊擷取單元120。音頻訊號之解碼裝置200包含輸出通道產生單元210以及經修正的空間資訊產生單元220。
編碼裝置100之降混單元110透過降混多通道音頻訊號IN_M產生降混音頻訊號d。降混音頻訊號d可為降混單元110降混多通道音頻訊號IN_M所產生的訊號,或者使用者任意地降混多通道音頻訊號IN_M所產生的任意降混音頻訊號。
編碼裝置100之空間資訊擷取單元120從多通道音頻訊號IN_M中擷取空間資訊。這個實例中,空間資訊係將降混音頻訊號d升混為多通道音頻訊號IN_M所需要的資訊。
同時,空間資訊可為依照預定的樹狀組態在降混多通道音頻訊號IN_M的過程中所擷取的資訊。這個實例中,此樹狀組態可以對應於音頻訊號解碼以及編碼裝置之間議定的樹狀組態,但本發明並非限制於此。
空間資訊可包含樹狀組態資訊、指示元以及空間參數等。樹狀組態資訊係為樹狀組態類型的資訊。所以,若干個多通道以及各通道降混序列等係依照樹狀組態類型而變化。指示元係用於指示是否出現延伸空間資訊。此外,空間參數可包含將至少兩個通道降混為至多兩個通道過程中的通道位階差值(channel level difference;CLD)、通道間相關或同調(inter-channel correlation or coherence;ICC)以及通道預測係數(channel prediction coefficients;CPC)等。
同時,空間資訊擷取單元120更能夠擷取延伸空間資訊以及空間資訊。這個實例中,延伸空間資訊係為需要被額外地延伸之具有已升混空間參數的降混音頻訊號d之資訊。延伸空間資訊可包含延伸通道組態資訊以及延伸空間參數。以後將解釋延伸空間資訊,並非限制於空間資訊擷取單元120所擷取的延伸空間資訊。
此外,編碼裝置100更包含核心編解碼器(codec)之編碼單
元(圖中未表示),用以透過編碼降混音頻訊號d產生降混音頻位元流;空間資訊編碼單元(圖中未表示),用以透過編碼空間資訊s產生空間資訊位元流;以及多工單元(圖中未表示),用以透過多工降混音頻位元流及空間資訊位元流產生音頻訊號位元流,本發明並非限制於此。
解碼裝置200更可包含解多工單元(圖中未表示),用以分離音頻訊號位元流為降混音頻位元流及空間資訊位元流;核心編解碼器之解碼單元(圖中未表示),用以解碼降混音頻位元流;以及空間資訊解碼單元(圖中未表示),用以解碼空間資訊位元流,本發明並非限制於此。
解碼裝置200之經修正的空間資訊產生單元220使用空間資訊識別經修正的空間資訊的類型,然後基於所識別出之空間資訊產生某個類型的經修正的空間資訊s’。這個實例中,此空間資訊可為轉換自編碼裝置100的空間資訊s。經修正的空間資訊係為使用此空間資訊所新產生的資訊。
此外,還存在多種類型的經修正的空間資訊。經修正的空間資訊的類型至少包含以下之一:a)部分空間資訊,b)組合式空間資訊,以及c)延伸空間資訊,本發明並非限制於此。
部分空間資訊包含部分的空間參數;組合式空間資訊係透過組合空間參數而產生;延伸空間資訊則藉由空間資訊以及延伸空間資訊而產生。
經修正的空間資訊產生單元220用以產生經修正的空間資訊,其產生方式可依照經修正的空間資訊的類型而變化。下面將詳細解釋各種類型的經修正的空間資訊的產生方法。
同時,用於決定經修正的空間資訊的參考可對應於空間資訊之樹狀組態資訊、空間資訊之指示元或者輸出通道資訊等。樹狀組態資訊以及指示元可包含於編碼裝置之空間資訊s中。輸出通道資訊係用於與解碼裝置200互相連接之揚聲器,其可包含若干輸出通道以及每個輸出通道之位置資訊等。輸出通道資訊可由製造業者事先輸入或者由使用者輸入。
下面將詳細解釋藉由這些資訊決定經修正的空間資訊之類型之方法。
解碼裝置200之輸出通道產生單元210使用經修正的空間資訊s’以產生降混音頻訊號d的輸出通道音頻訊號OUT_N。
空間濾波器資訊230係為聲音路徑之資訊,且提供至經修正的空間資訊產生單元220。如果經修正的空間資訊產生單元220產生包含環繞音效的組合式空間資訊,則可使用此空間濾波器資訊。
在下文中,依照經修正的空間資訊的類型產生經修正的空間資訊,這種方式的音頻訊號解碼方法之解釋依序如下:(1)部分空間資訊,(2)組合式空間資訊,以及(3)擴充空間資訊。
(1)部分空間資訊
由於空間參數係依照預定樹狀組態在多通道音頻訊號的降混過程中被用以計算,因此如果使用完整的空間參數以解碼降混音頻訊號,將可重建降混前的初始多通道音頻訊號。如果嘗試使得輸出通道音頻訊號的通道數目N小於多通道音頻訊號的通道數目M,將能夠藉由應用部分的空間參數以解碼降混音頻訊號。
這種方法可依照編碼裝置中多通道音頻訊號之降混次序以及降混方法而變化,例如,樹狀組態的類型。此外,可使用空間資訊的樹狀組態資訊查詢樹狀組態的類型。這種方法可依照輸出通道的數目而變化。此外,還能夠使用輸出通道資訊查詢輸出通道的數目。
在下文中,如果輸出通道音頻訊號的通道數目小於多通道音頻訊號的通道數目,則可採用一種應用包含部分空間參數之部分空間資訊的音頻訊號解碼方法,下文將結合多個樹狀組態的實例解釋這種方法。
(1)-1樹狀組態之第一實例(5-2-5樹狀組態)
「第2圖」係為應用部分空間資訊之實施例示意圖。
請參考「第2圖」的左部,圖中表示將多通道音頻訊號降混為立體降混通道Lo及Ro的次序以及多通道音頻訊號與空間參數之間的關係,其中多通道音頻訊號的通道數目為6(左前通道L、左環繞通道Ls、中央通道C、低頻通道LFE、右前通道R及右環繞通道Rs)。
首先,完成左前通道L與左環繞通道Ls之間的降混、中央通道C與低頻通道LFE之間的降混以及右前通道R與右環繞通道Rs之間的降混。這個初級降混過程中,產生左總通道Lt、中央總通道Ct以及右總通道Rt。此外,在此初級降混過程中計算的空間參數包含CLD2(包含ICC2)、CLD1(包含ICC1)及CLD0(包含ICC0)等。
接續初級降混過程的二次降混過程中,左總通道Lt、中央總通道Ct以及右總通道Rt一同降混以產生左通道Lo以及右通道Ro。第二降混過程中所計算的的空間參數可包含CLDTTT、CPCTTT及ICCTTT等。
換言之,具有六個通道之多通道音頻訊號可以上述次序方式降混產生立體降混之左右通道Lo以及Ro。
如果使用上述次序方式所計算的空間參數(CLD2、CLD1、CLD0及CLDTTT等),按照與降混次序相反的次序升混則產生多通道音頻訊號,其中通道數目為6(左前通道L、左環繞通道Ls、中央通道C、低頻通道LFE、右前通道R及右環繞通道Rs)。
請參考「第2圖」的右部,如果部分空間資訊對應於空間參數(CLD2、CLD1、CLD0及CLDTTT等)中的CLDTTT,則升混為左總通道Lt、中央總通道Ct以及右總通道Rt。如果選擇左總通道Lt以及右總通道Rt作為輸出通道音頻訊號,則能夠產生兩個通道Lt及Rt的輸出通道音頻訊號。如果選擇左總通道Lt、中央總通道
Ct以及右總通道Rt作為輸出通道音頻訊號,則能夠產生三個通道Lt、Ct以及Rt的輸出通道音頻訊號。使用附加的空間參數CLD1完成升混後,如果選擇左總通道Lt、右總通道Rt、中央通道C以及低頻通道LFE,則能夠產生四個通道(Lt、Rt、C以及LFE)的輸出通道音頻訊號。
(1)-2樹狀組態之第二實例(5-1-5樹狀組態)
「第3圖」係為應用部分空間資訊之另一實例之示意圖。
請參考「第3圖」的左部,圖中表示將多通道音頻訊號降混為單一降混音頻訊號M的次序以及多通道音頻訊號與空間參數之間的關係,其中多通道音頻訊號的通道數目為6(左前通道L、左環繞通道Ls、中央通道C、低頻通道LFE、右前通道R及右環繞通道Rs)。
首先,類似於第一實例,完成左前通道L與左環繞通道Ls之間的降混、中央通道C與低頻通道LFE之間的降混以及右前通道R與右環繞通道Rs之間的降混。在初級降混過程中,產生左總通道Lt、中央總通道Ct以及右總通道Rt。初級降混過程中計算的空間參數包含CLD3(包含ICC3)、CLD4(包含ICC4)及CLD5(包含ICC5)等(在此實例中,CLDx以及ICCx有別於先前第一實例中的CLDx)。
接續初級降混過程的二次降混過程中,左總通道Lt以及右總通道Rt一同降混以產生左中央通道LC;中央總通道Ct以及右總
通道Rt一同降混以產生右中央通道RC。二次降混過程中計算的空間參數可包含CLD2(包含ICC2)及CLD1(包含ICC1)等。
接著,三次降混過程中,降混左中央通道LC以及右中央通道RC以產生單一降混音頻訊號M。三次降混過程中計算的空間參數包含CLD0(包含ICC0)等。
請參考「第3圖」的右部,如果部分空間資訊對應於空間參數(CLD3、CLD4、CLD5、CLD1、CLD2及CLD0等)中的CLD0,則產生左中央通道LC以及右中央通道RC。如果選擇左中央通道LC以及右中央通道RC作為輸出通道音頻訊號,則能夠產生兩個通道LC及RC的輸出通道音頻訊號。
同時,如果部分空間資訊對應於空間參數(CLD3、CLD4、CLD5、CLD1、CLD2及CLD0等)中的CLD0、CLD1以及CLD2,則產生左總通道Lt、中央總通道Ct以及右總通道Rt。
如果選擇左總通道Lt以及右總通道Rt作為輸出通道音頻訊號,則能夠產生兩個通道Lt以及Rt的輸出通道音頻訊號。如果選擇左總通道Lt、中央總通道Ct以及右總通道Rt作為輸出通道音頻訊號,則能夠產生三個通道Lt、Ct以及Rt的輸出通道音頻訊號。
如果部分空間資訊尚包含空間參數CLD4,中央通道C以及低頻通道LFE完成升混後,如果選擇左總通道Lt、右總通道Rt、中央通道C以及低頻通道LFE作為輸出通道音頻訊號,則能夠產生四個通道(左總通道Lt、右總通道Rt、中央通道C以及低頻通道
LFE)的輸出通道音頻訊號。
(1)-3樹狀組態之第三實例(5-1-5樹狀組態)
「第4圖」係為應用部分空間資訊之再一實例之示意圖。
請參考「第4圖」的左部,圖中表示將多通道音頻訊號降混為單一降混音頻訊號M的次序以及多通道音頻訊號與空間參數之間的關係,其中多通道音頻訊號的通道數目為6(左前通道L、左環繞通道Ls、中央通道C、低頻通道LFE、右前通道R、右環繞通道Rs)。
類似於第一或者第二實例,首先完成左通道L與左環繞通道Ls之間的降混、中央通道C與低頻通道LFE之間的降混以及右通道R與右環繞通道Rs之間的降混。在初級降混過程中,產生左總通道Lt、中央總通道Ct以及右總通道Rt。初級降混過程中計算的空間參數包含CLD1(包含ICC1)、CLD2(包含ICC2)及CLD3(包含ICC3)等(在此實例中,CLDx及ICCx有別於先前第一或第二實例中的CLDx及ICCx)。
接續初級降混過程的二次降混過程中,一同降混左總通道Lt、中央總通道Ct以及右總通道Rt以產生左中央通道LC以及右通道R。並且計算了空間參數CLDTTT(包含ICCTTT)。
順序地,三次降混過程中,降混左中央通道LC以及右通道R以產生單一降混音頻訊號M。並且計算出空間參數CLD0(包含ICC0)。
請參考「第4圖」的右部,如果部分空間資訊對應於空間參數(CLD1、CLD2、CLD3、CLDTTT及CLD0等)中的CLD0以及CLDTTT,將產生左總通道Lt、中央總通道Ct以及右總通道Rt。
如果選擇左總通道Lt以及右總通道Rt作為輸出通道音頻訊號,則能夠產生兩個通道Lt以及Rt的輸出通道音頻訊號。
如果選擇左總通道Lt、中央總通道Ct以及右總通道Rt作為輸出通道音頻訊號,則能夠產生三個通道Lt、Ct以及Rt的輸出通道音頻訊號。
如果部分空間資訊尚包含空間參數CLD2,中央通道C以及低頻通道LFE完成升混後,如果選擇左總通道Lt、右總通道Rt、中央通道C以及低頻通道LFE作為輸出通道音頻訊號,則能夠產生四個通道(左總通道Lt、右總通道Rt、中央通道C以及低頻通道LFE)的輸出通道音頻訊號。
上面的描述中,解釋了應用部分的空間參數產生輸出通道音頻訊號的過程,但是僅僅使用三種樹狀組態作為實例。此外,像部分空間資訊一樣,還能夠應用組合式空間資訊或者延伸空間資訊。如此,對於應用經修正的空間資訊至音頻訊號的過程,則能夠階層式地或者組合式地且合成式地加以控制。
(2)組合式空間資訊
由於空間資訊係依照預定的樹狀組態在多通道音頻訊號的降混過程中計算得出,因此如果按照相同的方式使用空間資訊的空
間參數以解碼降混音頻訊號,則可重建降混前的初始多通道音頻訊號。如果多通道音頻訊號的通道數目M不同於輸出通道音頻訊號的通道數目N,透過組合空間資訊產生新的組合式空間資訊,然後則可使用產生的資訊升混此降混音頻訊號。尤其是,應用空間參數至轉換公式,則能夠產生組合式空間參數。
這種方法可依照編碼裝置中多通道音頻訊號的降混次序及方法而變化。並且,能夠使用空間資訊之樹狀組態資訊查詢降混的次序及方法。這種方法可依照輸出通道的數目而變化。此外,還能夠使用輸出通道資訊查詢輸出通道的數目等。
下面的描述中,將解釋修正空間資訊的方法的詳細實施例以及獲得虛擬3-D效果的實施例。
(2)-1一般組合式空間資訊
本發明提供一種藉由組合空間資訊之空間參數而產生組合式空間參數之方法,用以根據不同於降混過程的樹狀組態進行升混過程。所以,無論樹狀組態資訊係根據何種樹狀組態,這種方法均可應用於各種降混音頻訊號。
如果多通道音頻訊號為5.1通道且降混音頻訊號為1通道(單一通道),則結合以下兩種實例解釋兩個通道的輸出通道音頻訊號的產生方法。
(2)-1-1樹狀組態之第四實施例(5-1-51樹狀組態)
「第5圖」係為應用組合式空間資訊之實例之示意圖。
請參考「第5圖」的左部,CLD0至CLD4以及ICC0至ICC4(圖中未表示)可稱為空間參數,係在5.1通道的多通道音頻訊號之降混過程中計算獲得。例如,空間參數中,左通道訊號L以及右通道訊號R之間的通道間位階差值為CLD3,L與R之間的通道間相關為ICC3。左環繞通道Ls以及右環繞通道Rs之間的通道間位階差值為CLD2,Ls以及Rs之間的通道間相關為ICC2。
另一方面,請參考「第5圖」的右部,如果應用組合式空間參數CLDα及ICCα至單一降混音頻訊號m,產生左通道訊號Lt及右通道訊號Rt,則能夠從單一通道音頻訊號m中直接地產生立體輸出通道音頻訊號Lt及Rt。這個實例中,透過組合空間參數CLD0至CLD4以及ICC0至ICC4,可計算出組合式空間參數CLDα及ICCα。
下面,首先解釋透過組合空間參數CLD0至CLD4以計算出組合式空間參數中CLDα的過程,然後解釋透過組合空間參數CLD0至CLD4以及ICC0至ICC4以計算出組合式空間參數中ICCα的過程。
(2)-1-1-a空間參數CLDα的推導
首先,由於空間參數CLDα係為左輸出訊號Lt及右輸出訊號Rt之間的位階差值,輸入左輸出訊號Lt及右輸出訊號Rt至空間參數CLD的定義公式之結果如下所示:[公式1]
CLDα=10*log10(PLt/PRt)
其中PLt係為左輸出訊號Lt的功率,PRt係為右輸出訊號Rt的功率。
[公式2]CLDα=10*log10(PLt+a/PRt+a)
其中PLt係為左輸出訊號Lt的功率,PRt係為右輸出訊號Rt的功率,‘a’係為非常小的一個常數。
因此,空間參數CLDα由公式1或者公式2定義。
同時,為了使用空間參數CLD0至CLD4表示PLt及PRt,則需要輸出通道音頻訊號的左輸出訊號Lt、輸出通道音頻訊號的右輸出訊號Rt與多通道訊號L、Ls、R、Rs、C以及LFE之間的關係公式。對應的關係式可定義如下:
因為類似於公式3的關係式可依照如何定義輸出通道音頻訊號而變化,所以也可用不同於公式3的公式定義。例如,C/或者LFE/中的‘1/’可為‘0’或者‘1’。
公式3可導出如下的公式4:[公式4]PLt=PL+PLs+PC/2+PLFE/2
PRt=PR+PRs+PC/2+PLFE/2
依照公式1或者公式2,能夠使用PLt及PRt表示空間參數CLDα。依照公式4,可使用PL、PLs、PC、PLFE、PR以及PRs表示PLt以及PRt。所以,需要找到一個關係式,能夠使用空間參數CLD0至CLD4表示PL、PLs、PC、PLFE、PR以及PRs。
同時,如果樹狀組態如「第5圖」所示,多通道音頻訊號(L、R、C、LFE、Ls及Rs)與單一降混通道訊號m之間的關係如下所示:
其中,
公式5可導出如下的公式6:
其中,
特別是,透過輸入公式6至公式4,並且輸入公式4至公式1或者公式2,則能夠藉由組合空間參數CLD0至CLD4的方式表示組合式空間參數CLDα。
同時,輸入公式6至公式4的PC/2+PLFE/2的擴充結果如公式7所示:[公式7]PC/2+PLFE/2=[(c1,OTT4)2+(c2,OTT4)2]*(c2,OTT1*c1,OTT0)2 * m2/2
這個實例中,依照c1及c2的定義(請參考公式5),因為(c1,x)2+(c2,x)2=1,得出(c1,OTT4)2+(c2,OTT4)2=1。
因此,公式7可簡化如下:[公式8]PC/2+PLFE/2=(c2,OTT1*c1,OTT0)2 * m2/2
因此,輸入公式8以及公式6至公式4,並且輸入公式4至公式1,則能夠透過組合空間參數CLD0至CLD4的方式表示組合式空間參數CLDα。
(2)-1-1-b通道間相關ICCα的導出
首先,因為通道間相關ICCα係為左輸出訊號Lt與右輸出訊號Rt之間的相關,輸入左輸出訊號Lt與右輸出訊號Rt至對應的定義公式之結果如下所示:[公式9]
,其中
公式9中,PLt及PRt可使用公式4、公式6以及公式8中的空間參數CLD0至CLD4表示。PLtPRt可藉由公式10的方式展開。
[公式10]PLtRt=PLR+PLsRs+PC/2+PLFE/2
公式10中,‘PC/2+PLFE/2’可依照公式6表示為空間參數CLD0至CLD4。PLR及PLsRs可依照ICC的定義展開如下:
公式11中,如果移項或者,則得到公式12。
公式12中,PL、PR、PLs以及PRs可依照公式6表示為空間參數CLD0至CLD4。輸入公式6至公式12的結果對應於公式13。
[公式13]PLR=ICC3 *c1,OTT3 *c2,OTT3 *(c1,OTT1*c1,OTT0)2 *m2 PLsRs=ICC2 *c1,OTT2 *c2,OTT2 *(c2,OTT0)2 *m2
總之,輸入公式6以及公式13至公式10,輸入公式10以及公式4至公式9,則能夠以空間參數CLD0至CLD3、ICC2以及ICC3
表示組合式空間參數ICCα。
(2)-1-2樹狀組態之第五實施例(5-1-52樹狀組態)
「第6圖」係為應用組合式空間資訊之另一實例之示意圖。
請參考「第6圖」的左部,CLD0至CLD4以及ICC0至ICC4(圖中未表示)可稱為空間參數,其可在5.1通道的多通道音頻訊號的降混過程中用於計算。
空間參數中,左通道訊號L與左環繞通道訊號Ls之間的通道間位階差值為CLD3,左通道訊號L與左環繞通道訊號Ls之間的通道間相關為ICC3。右通道R與右環繞通道Rs之間的通道間位階差值為CLD4,R與Rs之間的通道間相關為ICC4。
另一方面,請參考「第6圖」的右部,如果透過應用組合式空間參數CLDβ以及ICCβ至單一降混音頻訊號m,產生左通道訊號Lt以及右通道訊號Rt,則能夠直接地從單一降混音頻訊號m中產生立體輸出通道音頻訊號Lt及Rt。這個實例中,可藉由組合空間參數CLD0至CLD4以及ICC0至ICC4計算出組合式空間參數CLDβ以及ICCβ。
下面,首先解釋透過組合空間參數CLD0至CLD4以計算出組合式空間參數中的CLDβ的過程,然後解釋透過組合空間參數CLD0至CLD4以及ICC0至ICC4以計算出組合式空間參數中的ICCβ的過程。
(2)-1-2-a空間參數CLDβ的推導
首先,由於空間參數CLDβ係為左輸出訊號Lt與右輸出訊號Rt之間的位階差值,輸入左輸出訊號Lt與右輸出訊號Rt至CLD的定義公式的結果如下所示:[公式14]CLDβ=10*log10(PLt/PRt)
其中,PLt係為左輸出訊號Lt的功率,PRt係為右輸出訊號Rt的功率。
[公式15]CLDβ=10*log10(PLt+a/PRt+a)
其中,PLt係為左輸出訊號Lt的功率,PRt係為右輸出訊號Rt的功率,‘a’係為非常小的數字。
因此,空間參數CLDβ由公式14或者公式15定義。
同時,為了使用空間參數CLD0至CLD4表示PLt以及PRt,需要輸出通道音頻訊號的左輸出訊號Lt、輸出通道音頻訊號的右輸出訊號Rt與多通道訊號L、Ls、R、Rs、C以及LFE之間的關係式。對應的關係式可定義如下:
因為類似於公式16的關係式可依照如何定義輸出通道音頻訊號而變化,所以還可以用不同於公式16的方式定義。例如,C/
或者LFE/中的‘1/’可為‘0’或者‘1’。
公式16可導出如下的公式17:[公式17]PLt=PL+PLs+PC/2+PLFE/2 PRt=PR+PRs+PC/2+PLFE/2
依照公式14或者公式15,能夠使用PLt以及PRt表示空間參數CLDβ。依照公式15,可使用PL、PLs、PC、PLFE、PR以及PRs表示PLt以及PRt。所以,需要找到一個關係式,能夠使用空間參數CLD0至CLD4表示PL、PLs、PC、PLFE、PR以及PRs。
同時,如果樹狀組態如「第6圖」所示,則多通道音頻訊號(L、R、C、LFE、Ls、Rs)與單一降混通道訊號m之間的關係如下所示:
其中
公式18導出如下的公式19:[公式19]
其中
尤其地,輸入公式19至公式17,並且輸入公式17至公式14或者公式15,則能夠透過組合空間參數CLD0至CLD4的方式表示組合式空間參數CLDβ。
同時,輸入公式19至公式17中的PL+PLs,得到的展開公式如公式20所示:[公式20]PL+PLs=[(c1,OTT3)2+(c2,OTT3)2](c1,OTT1*c1,OTT0)2 *m2
這個實例中,依照c1以及c2的定義(比較公式5),由於(c1,x)2+(c2,x)2=1,所以得到(c1,OTT3)2+(c2,OTT3)2=1。
所以,公式20可簡化如下:[公式21]PL_=PL+PLs=(c1,OTT1*c1,OTT0)2 *m2
另一方面,輸入公式19至公式17中的PR+PRs,得到的展開公式如公式22所示:[公式22]
PR+PRs=[(c1,OTT4)2+(c2,OTT4)2](c1,OTT1*c1,OTT0)2 *m2
這個實例中,依照c1以及c2的定義(請參考公式5),由於(c1,x)2+(c2,x)2=1,所以得到(c1,OTT4)2+(c2,OTT4)2=1。
所以,公式22可簡化如下。
[公式23]PR_=PR+PRs=(c2,OTT1*c1,OTT0)2 *m2
另一方面,輸入公式19至公式17的PC/2+PLFE/2,展開公式的結果如公式24所示:[公式24]PC/2+PLFE/2=[(c1,OTT2)2+(c2,OTT2)2](c2,OTT0)2 *m2/2
這個實例中,依照c1以及c2的定義(請參考公式5),由於(c1,x)2+(c2,x)2=1,所以得到(c1,OTT2)2+(c2,OTT2)2=1。
所以,公式24可簡化如下:[公式25]PC/2+PLFE/2=(c2,OTT0)2 *m2/2
因此,輸入公式21、公式23以及公式25至公式17,並且輸入公式17至公式14或者公式15,則能夠透過組合空間參數CLD0至CLD4的方式表示組合式空間參數CLDβ。
(2)-1-2-b空間參數ICCβ的推導
首先,由於空間參數ICCβ係為左輸出訊號Lt與右輸出訊號Rt之間的通道間相關,輸入左輸出訊號Lt與右輸出訊號Rt至對應
的定義公式的結果如下:
[公式26]
,其中
公式26中,依照公式19,可使用空間參數CLD0至CLD4表示PLt以及PRt。PLtPRt可藉由公式27的方式展開如下:[公式27]PLtRt=PL_R_+PC/2+PLFE/2
公式27中,‘PC/2+PLFE/2’可依照公式9表示為空間參數CLD0至CLD4。PL_R_可依照ICC的定義展開如下:
如果移項,則得到公式29:
公式29中,依照公式21以及公式23,PL_以及PR_可表示為空間參數CLD0至CLD4。輸入公式21以及公式23至公式29得到的公式對應公式30:[公式30]PL_R_=ICC1 *c1,OTT1 *c1,OTT0 *c2,OTT1 *c1,OTT0 *m2
總之,輸入公式30至公式27,並且輸入公式27以及公式17至公式26,則能夠以空間參數CLD0至CLD4以及ICC1表示組合
式空間參數ICCβ。
上面解釋的空間參數的修正方法僅僅為一個實施例。得到Px或者Pxy的過程中,透過考慮各通道間以及附加的訊號能量之間的通道間相關(例如ICC0等),顯然上面解釋的公式可變化為多種形式。
(2)-2具有環繞效果的組合式空間資訊
首先,如果考慮聲音路徑,透過組合空間資訊以產生組合式空間資訊,則能夠產生虛擬的環繞效果。
虛擬的環繞效果或者虛擬的3D效果能夠產生下述效果,在沒有環繞通道的揚聲器的條件下產生實質上存在有環繞通道的揚聲器效果。例如,5.1通道音頻訊號透過兩個立體揚聲器而輸出。
聲音路徑可對應於空間濾波器資訊。空間濾波器資訊能夠使用一種名為頭部相關轉移函數(head-related transfer function;HRTF)之函數,但本發明並非限制於此。空間濾波器資訊可包含濾波器參數。輸入濾波器參數以及空間參數至轉換公式,則能夠產生組合式空間參數。產生的組合式空間參數可包含濾波器係數。
下文中,假設多通道音頻訊號為5通道,並且產生三通道的輸出通道音頻訊號,一種考慮聲音路徑以產生具有環繞效果的組合式空間資訊的方法解釋如下。
「第7圖」係為揚聲器至收聽者的聲音路徑的示意圖,圖中顯示出揚聲器的所在位置。
請參考「第7圖」,三個揚聲器SPK1、SPK2以及SPK3的位置分別位於左前方L、中央C以及右前方R。虛擬環繞通道的位置分別為左環繞Ls以及右環繞Rs。
圖中分別表示三個揚聲器的位置L、C及R以及虛擬環繞通道的位置Ls及Rs到收聽者的左右耳的位置r及l的聲音路徑。‘Gx_y’表示位置x到位置y的聲音路徑。例如‘GL_r’表示左前位置L到收聽者的右耳位置r的聲音路徑。
如果五個位置存在揚聲器(例如,揚聲器也處於左環繞Ls以及右環繞Rs的位置),並且收聽者處於「第7圖」所示的位置,則進入收聽者左耳的訊號L0以及進入收聽者右耳的訊號R0可由公式31表示:[公式31]L0=L*GL_l+C*GC_l+R*GR_l+Ls*GLs_l+Rs*GRs_l R0=L*GL_r+C*GC_r+R*GR_r+Ls*GLs_r+Rs*GRs_r,
其中L、C、R、Ls以及Rs分別為各位置的通道,Gx_y表示位置x到位置y的聲音路徑,‘*’表示卷積。
但是,如上所述,如果僅三個位置L、C以及R存在揚聲器,則進入收聽者左耳的訊號L0_real以及進入收聽者右耳的訊號R0_real分別表示如下:[公式32]L0_real=L*GL_l+C*GC_l+R*GR_l
R0_real=L*GL_r+C*GC_r+R*GR_r
由於公式32所示的訊號並沒有考慮到環繞通道訊號Ls以及Rs,所以無法產生虛擬環繞效果。為了產生虛擬環繞效果,可使自揚聲器所在位置Ls’到達收聽者位置(l,r)的左環繞通道訊號Ls等於自不同於初始位置Ls’之各揚聲器L、C以及R所在位置到達收聽者位置(l,r)的左環繞通道訊號Ls。同樣也可應用於右環繞通道訊號Rs的例子中。
進一步地深究左環繞通道訊號Ls,如果左環繞通道訊號Ls係輸出自以左環繞位置Ls’作為初始位置的揚聲器,則到達收聽者左右耳l以及r的訊號分別表示如下:[公式33]‘Ls*GLs_l’,‘Ls*GLs_r’
如果右環繞通道訊號Rs輸出自以右環繞位置Rs’作為初始位置的揚聲器,則到達收聽者左右耳l以及r的訊號分別表示如下:[公式34]‘Rs*GRs_l’,‘Rs*GRs_r’
如果到達收聽者左右耳l以及r的訊號等於公式33以及公式34的分量,即使經由任何位置的揚聲器(例如經由左前方的揚聲器SPK1)輸出,收聽者皆能夠感覺到彷彿揚聲器係分別位於左右環繞位置Ls’以及Rs’。
同時,如果公式33所示的分量輸出自左環繞位置Ls的揚聲
器,則其分別為到達收聽者左右耳l以及r的訊號。所以,如果公式33所示的分量完整輸出自左前位置的揚聲器SPK1,則到達收聽者的左右耳l以及r的訊號可分別表示如下:[公式35]‘Ls*GLs_l*GL_l’,‘Ls*GLs_r*GL_r’
深究公式35,對應於自左前位置L到收聽者的左耳l(或者右耳r)的聲音路徑之分量‘GL_l’(or‘GL_r’)則被增加。
到達收聽者的左右耳l以及r的訊號應該為公式33而非公式35所示之分量。如果左前位置L處的揚聲器輸出的聲音到達收聽者,分量‘GL_l’(or‘GL_r’)則被增加。所以,如果公式33所示的分量係輸出自左前位置L的揚聲器SPK1,則聲音路徑中應該考慮分量‘GL_l’(或者‘GL_r’)的反函數‘GL_l -1’(或者‘‘GL_r -1’)。換言之,如果對應於公式33的分量輸出自左前位置L的揚聲器SPK1,則應該修正為如下的公式:[公式36]‘Ls*GLs_l*GL_l -1’,‘Ls*GLs_r*GL_r -1’
如果對應於公式34的分量輸出自左前位置L的揚聲器SPK1,則應該修正為如下的公式:[公式37]‘Rs*GRs_l*GL_l -1’,‘Rs*GRs_r*GL_l -1’
所以,輸出自左前位置L的揚聲器SPK1的訊號L’可總括如
下:[公式38]L’=L+Ls*GLs_l*GL_l -1+Rs*GRs_l*GL_l -1
(省略分量Ls*GLs_r*GL_r -1以及Rs*GRs_r*GL_l -1。)
如果公式38所示之訊號係輸出自左前位置L的揚聲器SPK1而到達收聽者的左耳的位置l,聲音路徑因數‘GL_l’則被增加。所以,公式38中的‘GL_l’則互相抵消,最終保留公式33以及公式34所示的因數。
「第8圖」所示係為解釋自各揚聲器位置輸出的訊號以產生虛擬環繞效果之示意圖。
請參考「第8圖」,如果考慮聲音路徑,輸出自環繞位置Ls’以及Rs’的環繞通道訊號Ls以及Rs包含於輸出自揚聲器SPK1位置的訊號L’中,則對應於公式38。
公式38中,GLs_l*GL_l -1簡寫為HLs_L,因此可表示如下:[公式39]L’=L+Ls*HLs_L+Rs*HRs_L
例如,中央位置C處的揚聲器SPK2輸出的訊號C’總括如下:[公式40]C’=C+Ls*HLs_C+Rs*HRs_C
例如,右前位置R處的揚聲器SPK3輸出的訊號R’總括如下。
[公式41]
R’=R+Ls*HLs_R+Rs*HRs_R
「第9圖」所示係為使用類似於公式38、公式39或者公式40的5通道訊號以產生3通道訊號的方法之概念示意圖。
如果使用5通道訊號產生2通道訊號R’以及L’,或者中央通道訊號C’中不包含環繞通道訊號Ls或Rs,則HLs_C或HRs_C變為0。
為了便於實現,Hx_y可透過多種方式修正,比如以Gx_y取代Hx_y,或者使用Hx_y時考慮串音。
上述詳細解釋係關於具有環繞效果的組合式空間資訊之實例。顯然可依照空間濾波器資訊的應用方法而變化。如前所述,依照上述過程經由揚聲器(上述實例中,左前通道L’、右前通道R’以及中央通道C’)輸出的訊號可透過組合式空間資訊產生自降混音頻訊號,其中尤其是使用了組合式空間參數。
(3)擴充空間資訊
首先,透過增加延伸空間資訊至空間資訊,則能夠產生擴充空間資訊。然後則可使用延伸空間資訊升混音頻訊號。對應的升混過程中,基於空間資訊,音頻訊號被轉換為初級升混音頻訊號,然後基於延伸空間資訊,初級升混音頻訊號則被轉換為二次升混音頻訊號。
這個實例中,延伸空間資訊能夠包含延伸通道組態資訊、延伸通道對映資訊以及延伸空間參數。
延伸通道組態資訊係為用於可配置通道的資訊,通道可藉由空間資訊的樹狀組態資訊而組態。延伸通道組態資訊可包含劃分識別碼以及非劃分識別碼至少其中之一,下面將詳細解釋。延伸通道對映資訊係為配態延伸通道的每個通道的位置資訊。延伸空間參數可用於升混一個通道為至少兩個通道。延伸空間參數可包含通道間位階差值。
上面解釋的延伸空間參數經由編碼裝置(i)或者解碼裝置本身(ii)產生後,可能包含於空間資訊中。如果延伸空間資訊由編碼裝置產生,則延伸空間資訊之存在或者不存在可取決於空間資訊的指示元。如果延伸空間資訊由解碼裝置本身產生,則延伸空間資訊之延伸空間參數可使用空間資訊之空間參數計算得出。
同時,利用基於空間資訊以及延伸空間資訊所產生的擴充空間資訊以升混音頻訊號的過程可被連續地且階層式地或者組合式地且合成式地執行。如果基於空間資訊以及延伸空間資訊計算擴充空間資訊得到一個矩陣,則可使用此矩陣組合式地且直接地將一降混音頻訊號升混為多通道音頻訊號。這個實例中,可依照空間參數以及延伸空間參數定義組態矩陣的因數。
下面,透過編碼裝置產生延伸空間資訊的實例解釋完成後,將解釋透過解碼裝置本身產生延伸空間資訊的實例。
(3)-1透過編碼裝置產生延伸空間資訊的實例:任意樹狀組態
首先,透過增加延伸空間資訊至空間資訊,編碼裝置產生擴充空間資訊。然後解釋解碼裝置接收此延伸空間資訊之實例。此外,延伸空間資訊可擷取於編碼裝置降混多通道音頻訊號的過程中。
如前所述,延伸空間資訊包含延伸通道組態資訊、延伸通道對映資訊以及延伸空間參數。這個實例中,延伸通道組態資訊可能包含劃分識別碼以及非劃分識別碼至少其中之一。下文中,將詳細解釋根據劃分以及非劃分識別碼的陣列以配置延伸通道的過程。
「第10圖」係為基於延伸通道組態資訊以配置延伸通道之實施例示意圖。
請參考「第10圖」的下端,0以及1係重複地排列成一序列。這個實例中,0表示非劃分識別碼,1表示劃分識別碼。非劃分識別碼0位於第一順位(1),匹配於第一順位的非劃分識別碼的通道係為左通道L,處於最上端。所以,匹配於非劃分識別碼的左通道L被選擇作為輸出通道,而非被劃分。第二順位(2)中,存在劃分識別碼1。匹配於劃分識別碼的通道係為左環繞通道Ls,鄰接於左通道L。所以,匹配於劃分識別碼1的左環繞通道Ls被劃分為兩個通道。
因為第三順位(3)以及第四順位(4)中存在非劃分識別碼0,左環繞通道Ls劃分出的兩個通道被完整地選擇作為輸出通道,而
非被劃分。上述過程重複到最後的順位(10),則能夠配置出整個延伸通道。
重複通道劃分過程的次數等於劃分識別碼1的數目,並且重複選擇通道作為輸出通道的過程次數等於非劃分識別碼0的數目。所以,通道劃分單元AT0以及AT1的數目等於劃分識別碼1的數目(2),延伸通道(L、Lfs、Ls、R、Rfs、Rs、C以及LFE)的數目等於非劃分識別碼0的數目(8)。
同時,延伸通道經過配置後,則能夠使用延伸通道對映資訊對映每個輸出通道的位置。「第10圖」的實例中,完成對映的順序如下:左前通道L、左前側通道Lfs、左環繞通道Ls、右前通道R、右前側通道Rfs、右環繞通道Rs、中央通道C以及低頻通道LFE。
如上所述,可基於延伸通道組態資訊以配置延伸通道。因此,需要劃分一個通道為至少兩個通道的通道劃分單元。劃分一個通道為至少兩個通道時,通道劃分單元可使用延伸空間參數。因為延伸空間參數的數目等於通道劃分單元的數目,所以也等於劃分識別碼的數目。因此,延伸空間參數的擷取次數可等於劃分識別碼的數目。
「第11圖」係為解釋「第10圖」所示之延伸通道組態以及與延伸空間參數之關係示意圖。
請參考「第11圖」,應用於兩個通道劃分單元AT0以及AT1
上的延伸空間參數ATD0以及ATD1分別如圖所示。
如果延伸空間參數係為通道間位階差值,通道劃分單元則能夠使用延伸空間參數決定兩個劃分通道的位階。
因此,透過增加延伸空間參數以完成升混的過程中,延伸空間參數不需要完全被應用,而是部分被應用。
(3)-2產生延伸空間資訊的實例:內插法/外插法
首先,藉由增加延伸空間資訊至空間資訊,將能夠產生擴充空間資訊。下面將解釋使用空間資訊產生延伸空間資訊的實例。尤其是,使用空間資訊之空間參數,能夠產生延伸空間資訊。整個實例中,可使用內插法、外插法或其等類似方法。
(3)-2-1延伸至6.1通道
如果多通道音頻訊號為5.1通道,則結合如下的實例解釋產生6.1通道的輸出通道音頻訊號的情況。
「第12圖」係為5.1通道的多通道音頻訊號的位置以及6.1通道的輸出通道音頻訊號的位置之示意圖。
請參考「第12A圖」,可以看到5.1通道的多通道音頻訊號的通道位置分別為左前通道L、右前通道R、中央通道C、低頻通道(圖中未表示)LFE、左環繞通道Ls以及右環繞通道Rs。
在5.1通道的多通道音頻訊號係為降混音頻訊號情況下,如果空間參數被應用至降混音頻訊號,則此降混音頻訊號將再次被升混為5.1通道的多通道音頻訊號。
然而,如「第12B圖」所示之後中央RC的通道訊號應該更進一步地被產生,以將降混音頻訊號升混為6.1通道的多通道音頻訊號。
可使用兩個後通道(左環繞通道Ls以及右環繞通道Rs)相關的空間參數產生後中央RC的通道訊號。尤其是,空間參數中的通道間位階差值(CLD)指示兩個通道之間的位階差值。所以,透過調整兩個通道之間的位階差值,則能夠改變兩個通道之間的虛擬聲音源的位置。
虛擬聲音源依照兩個通道之間的位置差值而變化的原則解釋如下。
「第13圖」係為虛擬聲音源位置與兩個通道間的位階差值之間的關係示意圖,其中左右環繞通道Ls以及Rs的位階分別為‘a’以及‘b’。
請參考「第13A圖」,在左環繞通道Ls的位階a大於右環繞通道Rs的位階b之情況下,則可看出虛擬聲音源VS的位置較接近左環繞通道Ls的位置而非右環繞通道Rs的位置。
如果音頻訊號係輸出自兩個通道,收聽者則感覺到虛擬聲音源VS實質上存在於兩個通道之間。這個實例中,虛擬聲音源VS的位置較接近具有較高位階的通道位置。
在「第13B圖」的情況下,由於左環繞通道Ls的位階a幾乎等於右環繞通道Rs的位階b,因此收聽者感覺虛擬聲音源VS的
位置處於左環繞通道Ls以及右環繞通道Rs之間的中央位置。
因此,能夠使用上述原則決定後中央位置的位階。
「第14圖」係為兩個後通道的位階以及一個後中央通道的位階之示意圖。
請參考「第14圖」,透過內插左環繞通道Ls的位階a以及右環繞通道Rs的位階b之間的差值,能夠計算出後中央通道RC的位階c。這個實例中,計算時可使用非線性內插法或者線性內插法。
透過下面的公式,可根據線性內插法計算出兩個通道(例如Ls以及Rs)之間的新通道(例如後中央通道RC)位階c:[公式42]c=a*k+b*(1-k)
其中,‘a’以及‘b’各自為兩個通道的位階,‘k’係為位階a的通道、位階b的通道以及位階c的通道之間的相對位置。
如果位階c的通道(例如後中央通道RC)位於位階a的通道(例如Ls)以及位階b的通道Rs之間的中央位置,則‘k’為0.5。如果‘k’為0.5,則公式42將變為公式43。
[公式43]c=(a+b)/2
依照公式43,如果位階c的通道(例如後中央通道RC)位於位階a的通道(例如Ls)以及位階b的通道Rs之間的中央位置,新通道的位階c則對應於之前通道的位階a與b的平均值。此外,
公式42以及公式43僅是具有代表性的。因此,也可能重新調整位階c的結果以及位階a及位階b的值。
(3)-2-2延伸至7.1通道
當多通道音頻訊號為5.1通道時,下面將解釋嘗試產生7.1通道的輸出通道音頻訊號的實例。
「第15圖」係為解釋5.1通道的多通道音頻訊號的位置以及7.1通道的輸出通道音頻訊號的位置之示意圖。
請參考「第15A圖」,類似於「第12A圖」,可看出5.1通道的多通道音頻訊號的位置通道各自為左前通道L、右前通道R、中央通道C、低頻通道(圖中未表示)LFE、左環繞通道Ls以及右環繞通道Rs。
在5.1通道的多通道音頻訊號係為降混音頻訊號之情況下,如果空間參數被應用至此降混音頻訊號,則此降混音頻訊號將再次被升混為5.1通道的多通道音頻訊號。
然而,如「第15B圖」所示之左前側通道Lfs以及右前側通道Rfs,更應該被產生以將降混音頻訊號升混為7.1通道的多通道音頻訊號。
因為左前側通道Lfs位於左前通道L與左環繞通道Ls之間,則能夠使用左前通道L的位階以及左環繞通道Ls的位階透過內插法決定左前側通道Lfs的位階。
「第16圖」係為解釋兩個左通道的位階以及一個左前側通道
(Lfs)的位階之示意圖。
請參考「第16圖」,可看出,左前側通道Lfs的位階c係為基於左前通道L的位階a以及左環繞通道Ls的位階b的線性內插值。
同時,雖然左前側通道Lfs位於左前通道L以及左環繞通道Ls之間,但是也可位於左前通道L、中央通道C以及右前通道R的外面。所以,可使用左前通道L、中央通道C以及右前通道R的位階透過外插法決定左前側通道Lfs的位階。
「第17圖」係為解釋三個前通道的位階以及一個左前側通道的位階之示意圖。
請參考「第17圖」,如圖所示可以看出左前側通道Lfs的位階d係為基於左前通道L的位階a、中央通道C的位階c以及右前通道R的位階b的線性外插值。使用延伸空間資訊的升混過程中,延伸的空間參數可不需要完全應用,而是部分應用。因此,應用空間參數至音頻訊號的過程可順序地且階層式地或者組合式地且合成式地執行。
因此,本發明提供以下效果。
首先,本發明能夠產生一種音頻訊號,包含的組態不同於預定的樹狀組態,從而產生各種組態的音頻訊號。
第二,因為產生的音頻訊號包含的組態可不同於預定樹狀組態,即使執行降混前的多通道的數目小於或者大於揚聲器的數
目,仍然能夠自降混音頻訊號產生具有等於揚聲器數目的輸出通道數目。
第三,在產生具有數目小於多通道數目的輸出通道之情況下,由於多通道音頻訊號係直接地產生自降混音頻訊號,而非降混來自多通道音頻訊號的輸出通道音頻訊號,其中多通道音頻訊號係由升混一降混音頻訊號所產生,因此能夠頗為減少解碼音頻訊號所需要的作業量。
第四,因為產生組合式空間資訊時需要考慮聲音路徑,本發明可在無法實現環繞通道輸出條件下提供一種偽環繞效果。
雖然本發明以前述之較佳實施例揭露如上,然其並非用以限定本發明。本領域之技術人員應當意識到在不脫離本發明所附之申請專利範圍所揭示之本發明之精神和範圍的情況下,所作之更動與潤飾,均屬本發明之專利保護範圍之內。
100‧‧‧編碼裝置
110‧‧‧降混單元
120‧‧‧空間資訊擷取單元
200‧‧‧解碼裝置
210‧‧‧輸出通道產生單元
220‧‧‧經修正的空間資訊產生單元
230‧‧‧空間濾波器資訊
d‧‧‧降混音頻訊號
s‧‧‧空間資訊
IN_M‧‧‧多通道音頻訊號
OUT_N‧‧‧輸出通道音頻訊號
s’‧‧‧經修正的空間資訊
L‧‧‧左前通道
Ls‧‧‧左環繞通道
C、RC‧‧‧中央通道
LFE‧‧‧低頻通道
R‧‧‧右前通道
Rs‧‧‧右環繞通道
Lt‧‧‧左總通道
Ct‧‧‧中央總通道
Rt‧‧‧右方總通道
Lo、Ro‧‧‧立體降混通道
CLD‧‧‧通道位階差值
ICC‧‧‧通道間相關或同調
CPC‧‧‧通道預測係數
M‧‧‧多通道音頻訊號的通道數目
N‧‧‧輸出通道音頻訊號的通道數目
m‧‧‧單一降混音頻訊號
SPK1、SPK2、SPK3‧‧‧揚聲器
AT0、AT1‧‧‧通道劃分單元
VS‧‧‧虛擬聲音源
Lfs‧‧‧左前側通道
Rfs‧‧‧右前側通道
a‧‧‧左環繞通道的位階
b‧‧‧右環繞通道的位階
c‧‧‧中央通道的位階
R’、L’、C’‧‧‧訊號
第1圖所示係為本發明之音頻訊號編碼裝置以及音頻訊號解碼裝置之方塊圖;第2圖所示係為應用部分空間資訊之實施例之方塊圖;第3圖所示係為應用部分空間資訊之另一實施例之方塊圖;第4圖所示係為應用部分空間資訊之再一實施例之方塊圖;第5圖所示係為應用組合空間資訊之實施例之方塊圖;第6圖所示係為應用組合空間資訊之另一實施例之方塊圖;
第7圖所示係為揚聲器至收聽者的聲音路徑之示意圖,圖中表示揚聲器的位置;第8圖所示係為用於產生環繞效果的揚聲器的每個位置輸出訊號之示意圖;第9圖所示係為使用5通道訊號產生3通道訊號的方法的概念方塊圖;第10圖係為基於延伸通道組態資訊以配置延伸通道之實施例示意圖;第11圖係為解釋第10圖所示之延伸通道組態以及與延伸空間參數之關係示意圖;第12圖係為5.1通道的多通道音頻訊號以及6.1通道的輸出通道音頻訊號的位置之示意圖;第13圖係為虛擬聲音源位置與兩個通道間的位階差值之間的關係示意圖;第14圖係為解釋兩個後通道的位階以及一個後中央通道的位階之示意圖;第15圖係為解釋5.1通道的多通道音頻訊號的位置以及7.1通道的輸出通道音頻訊號的位置之示意圖;第16圖係為解釋兩個左通道的位階以及一個左前側通道(Lfs)的位階之示意圖;以及第17圖係為解釋三個前通道的位階以及一個左前側通道
(Lfs)的位階之示意圖。
100‧‧‧編碼裝置
110‧‧‧降混單元
120‧‧‧空間資訊擷取單元
200‧‧‧解碼裝置
210‧‧‧輸出通道產生單元
220‧‧‧經修正的空間資訊產生單元
230‧‧‧空間濾波器資訊
d‧‧‧降混音頻訊號
s‧‧‧空間資訊
IN_M‧‧‧多通道音頻訊號
OUT_N‧‧‧輸出通道音頻訊號
Claims (9)
- 一種音頻訊號之解碼方法,包含有:接收一降混訊號、一空間資訊與一延伸空間資訊,於一編碼設備中透過降混一第一多通道音頻訊號產生該降混訊號,當該第一多通道音頻訊號於該編碼設備中被降混為該降混訊號時產生該空間資訊,該降混訊號與該空間資訊係接收自該音頻訊號,其中該空間資訊包含一指示元與複數個空間參數;使用該空間資訊產生一經修正的空間資訊;以及透過向該降混訊號應用該經修正的空間資訊,產生一第二多通道音頻訊號,其中該經修正的空間資訊包含一部分空間資訊、一組合式空間資訊以及透過增加該空間資訊到該延伸空間資訊產生的一擴充空間資訊,其中該空間資訊與該延伸空間資訊用於升混該降混訊號,其中該第一多通道音頻訊號之通道數目不同於該第二多通道音頻訊號的通道數目,其中該延伸空間資訊包含一延伸通道組態資訊、一延伸通道對映資訊與複數個延伸空間參數。
- 如申請專利範圍第1項所述之音頻訊號之解碼方法,更包含:在產生該經修正的空間資訊以前,識別該經修正的空間資訊之類型,以及 其中該經修正的空間資訊之類型係基於該空間資訊所包含之該指示元所識別。
- 如申請專利範圍第2項所述之音頻訊號之解碼方法,其中該經修正的空間資訊之類型係基於該空間資訊所包含之一樹狀組態資訊所識別。
- 如申請專利範圍第2項所述之音頻訊號之解碼方法,其中經修正的空間資訊之類型係基於一輸出通道資訊所識別。
- 如申請專利範圍第1項所述之音頻訊號之解碼方法,其中該部分空間資訊包含部分的該等空間參數。
- 如申請專利範圍第5項所述之音頻訊號之解碼方法,其中該等空間參數係為階層式,並且該部分空間資訊包含該等空間參數之一上層。
- 如申請專利範圍第6項所述之音頻訊號之解碼方法,其中該部分空間資訊更部分地包含該等空間參數之一下層。
- 如申請專利範圍第1項所述之音頻訊號之解碼方法,其中該組合式空間資訊係透過組合該等空間參數而產生。
- 一種音頻訊號之解碼裝置,包含有:一經修正的空間資訊產生單元,係利用一空間資訊產生一經修正的空間資訊,從該音頻訊號接收一降混訊號、一空間資訊與一延伸空間資訊,於一編碼設備中透過降混一第一多通道音頻訊號產生該降混訊號,當該第一多通道音頻訊號於該編碼 設備中被降混為該降混訊號時產生該空間資訊,其中該空間資訊包含一指示元與複數個空間參數;以及一輸出通道產生單元,透過向該降混訊號應用該經修正的空間資訊,產生一第二多通道音頻訊號,其中該經修正的空間資訊包含一部分空間資訊、一組合式空間資訊以及透過增加該空間資訊到該延伸空間資訊產生的一擴充空間資訊,其中該空間資訊與該延伸空間資訊用於升混該降混訊號,其中該第一多通道音頻訊號之通道數目不同於該第二多通道音頻訊號的通道數目,其中該延伸空間資訊包含一延伸通道組態資訊、一延伸通道對映資訊與一延伸空間參數。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US71652405P | 2005-09-14 | 2005-09-14 | |
US75998006P | 2006-01-19 | 2006-01-19 | |
US76036006P | 2006-01-20 | 2006-01-20 | |
US77366906P | 2006-02-16 | 2006-02-16 | |
US77672406P | 2006-02-27 | 2006-02-27 | |
US78751606P | 2006-03-31 | 2006-03-31 | |
US81602206P | 2006-06-22 | 2006-06-22 | |
KR20060078300 | 2006-08-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200721112A TW200721112A (en) | 2007-06-01 |
TWI462086B true TWI462086B (zh) | 2014-11-21 |
Family
ID=44072944
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095134072A TWI462086B (zh) | 2005-09-14 | 2006-09-14 | 音頻訊號之解碼方法及其裝置 |
TW100109444A TWI485698B (zh) | 2005-09-14 | 2006-09-14 | 音頻訊號之解碼方法及其裝置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW100109444A TWI485698B (zh) | 2005-09-14 | 2006-09-14 | 音頻訊號之解碼方法及其裝置 |
Country Status (3)
Country | Link |
---|---|
JP (2) | JP4740335B2 (zh) |
BR (1) | BRPI0616057A2 (zh) |
TW (2) | TWI462086B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007032648A1 (en) * | 2005-09-14 | 2007-03-22 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
WO2007111568A2 (en) * | 2006-03-28 | 2007-10-04 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for a decoder for multi-channel surround sound |
CN102667920B (zh) * | 2009-12-16 | 2014-03-12 | 杜比国际公司 | Sbr比特流参数缩混 |
KR20120004909A (ko) | 2010-07-07 | 2012-01-13 | 삼성전자주식회사 | 입체 음향 재생 방법 및 장치 |
KR102033071B1 (ko) * | 2010-08-17 | 2019-10-16 | 한국전자통신연구원 | 멀티 채널 오디오 호환 시스템 및 방법 |
CH703771A2 (de) * | 2010-09-10 | 2012-03-15 | Stormingswiss Gmbh | Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen. |
AU2013284705B2 (en) | 2012-07-02 | 2018-11-29 | Sony Corporation | Decoding device and method, encoding device and method, and program |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2741286A4 (en) | 2012-07-02 | 2015-04-08 | Sony Corp | DECODING DEVICE AND METHOD, CODING DEVICE AND METHOD AND PROGRAM |
KR20150032649A (ko) | 2012-07-02 | 2015-03-27 | 소니 주식회사 | 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 |
EP2830052A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
US6711266B1 (en) * | 1997-02-07 | 2004-03-23 | Bose Corporation | Surround sound channel encoding and decoding |
WO2005036925A2 (en) * | 2003-10-02 | 2005-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Compatible multi-channel coding/decoding |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2924539B2 (ja) * | 1993-01-29 | 1999-07-26 | 日本ビクター株式会社 | 音像定位制御方法 |
DE69428939T2 (de) * | 1993-06-22 | 2002-04-04 | Deutsche Thomson-Brandt Gmbh | Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix |
JP3572165B2 (ja) * | 1997-04-04 | 2004-09-29 | 株式会社デノン | 映像音響信号再生装置及び映像音響信号再生方法 |
US7212872B1 (en) * | 2000-05-10 | 2007-05-01 | Dts, Inc. | Discrete multichannel audio with a backward compatible mix |
JP4304401B2 (ja) * | 2000-06-07 | 2009-07-29 | ソニー株式会社 | マルチチャンネルオーディオ再生装置 |
US7391869B2 (en) * | 2002-05-03 | 2008-06-24 | Harman International Industries, Incorporated | Base management systems |
AU2003244932A1 (en) * | 2002-07-12 | 2004-02-02 | Koninklijke Philips Electronics N.V. | Audio coding |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
JPWO2005081229A1 (ja) * | 2004-02-25 | 2007-10-25 | 松下電器産業株式会社 | オーディオエンコーダ及びオーディオデコーダ |
-
2006
- 2006-09-14 BR BRPI0616057-3A patent/BRPI0616057A2/pt not_active IP Right Cessation
- 2006-09-14 TW TW095134072A patent/TWI462086B/zh not_active IP Right Cessation
- 2006-09-14 TW TW100109444A patent/TWI485698B/zh not_active IP Right Cessation
- 2006-09-14 JP JP2008531016A patent/JP4740335B2/ja active Active
- 2006-09-14 JP JP2008531015A patent/JP4728398B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
US6711266B1 (en) * | 1997-02-07 | 2004-03-23 | Bose Corporation | Surround sound channel encoding and decoding |
WO2005036925A2 (en) * | 2003-10-02 | 2005-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Compatible multi-channel coding/decoding |
Also Published As
Publication number | Publication date |
---|---|
JP2009508432A (ja) | 2009-02-26 |
TW201145263A (en) | 2011-12-16 |
JP4728398B2 (ja) | 2011-07-20 |
JP4740335B2 (ja) | 2011-08-03 |
TW200721112A (en) | 2007-06-01 |
TWI485698B (zh) | 2015-05-21 |
BRPI0616057A2 (pt) | 2011-06-07 |
JP2009508433A (ja) | 2009-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI462086B (zh) | 音頻訊號之解碼方法及其裝置 | |
JP5108772B2 (ja) | オーディオ信号のデコーディング方法及び装置 | |
US20080235006A1 (en) | Method and Apparatus for Decoding an Audio Signal | |
AU2007328614B2 (en) | A method and an apparatus for processing an audio signal | |
TWI469133B (zh) | 媒體訊號處理方法及裝置 | |
US20080221907A1 (en) | Method and Apparatus for Decoding an Audio Signal | |
CN101356572B (zh) | 解码音频信号的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |