TWI415113B

TWI415113B - 用以把向下混合音訊信號向上混合之向上混合器、方法與電腦程式

Info

Publication number: TWI415113B
Application number: TW099100787A
Authority: TW
Inventors: Matthias Neusinger; Julien Robilliard; Johannes Hilpert
Original assignee: Fraunhofer Ges Forschung
Priority date: 2009-01-28
Filing date: 2010-01-13
Publication date: 2013-11-11
Also published as: RU2011133697A; US20120020499A1; PT2382624T; CA2750451C; AR075162A1; EP2214162A1; AU2010209872B2; TW201032217A; EP2382624A1; CA2750451A1; PL2382624T3; JP2012516596A; US9099078B2; JP5490143B2; RU2547221C2; WO2010086218A1; CN102334158B; EP2382624B1; ES2596319T3; HK1163913A1

Description

用以把向下混合音訊信號向上混合之向上混合器、方法與電腦程式

根據本發明之實施例有關於一向上混合器，用以把一向下混合音訊信號向上混合為描述一或多個經向上混合音訊聲道的一經向上混合音訊信號。根據本發明的一些實施例有關於用以把一向下混合音訊信號向上混合的一方法及一電腦程式。

根據本發明的一些實施例有關於對於參數多聲道音訊編碼進行改良的相位處理。

在下面，將提供一簡短的概述且本發明的脈絡將獲得描述。近來在參數音訊編碼領域中的發展實現了將一多聲道音訊(例如5.1)信號聯合地編碼為一(或多個)向下混合聲道及一旁側資訊流的技術。已知此等技術是，例如雙耳線索編碼、參數立體聲及MPEG環繞等。

多個刊物描述了所謂的“雙耳線索編碼”參數多聲道編碼方式，例如參見參考文獻[1][2][3][4]及[5]。

“參數立體聲”是用以基於一所發送的單聲信號及參數旁側資訊，參數編碼一個二聲道立體聲信號的相關技術。詳細地，可參照參考文獻[6]及[7]。

“MPEG環繞”是用於參數多聲道編碼的一ISO(國際標準化組織)標準。詳細地，參照參考文獻[8]。

此等技術都是基於將人類空間聽力的相關感知線索以小巧的形式，與相關聯單聲或立體聲向下混合信號一起發送至接收器。典型的線索可以是聲道間位準差(ILD)、聲道間相關性或相干性(ICC)、以及聲道間時間差(ITD)與聲道間相位差(IPD)。

此等參數以適用於人類聽覺解析度的頻率及時間解析度來發送。

為了再現原始信號的特徵，解碼器可生成所發送向下混合信號的一或多個經去相關版本。此外，輸出信號的相位旋轉可以在該解碼器中執行，以回復該原始的聲道間相位關係。

第4圖之示範雙耳線索編碼系統

在下面，一般雙耳線索編碼方案將參照第4圖予以描述。第4圖顯示一雙耳線索編碼傳輸系統400的一方塊示意圖，其包含一雙耳線索編碼的編碼器410及一雙耳線索編碼的解碼器420。該雙耳線索編碼的編碼器410可以例如接收多個音訊信號412a、412b及412c。而且，該雙耳線索編碼的編碼器410受組配以使用一向下混合器414，把音訊輸入信號412a-412c向下混合，而獲得例如可能是總和信號的一向下混合信號416。而且，該雙耳線索編碼的編碼器410可受組配以使用一分析器418來分析該等音訊輸入信號412a-412c，而獲得旁側資訊信號419。該總和信號416及該旁側資訊信號419從該雙耳線索編碼的編碼器410發送至該雙耳線索編碼的解碼器420。該雙耳線索編碼的解碼器420可受組配以在該總和信號416及聲道間線索424的基礎上，合成包含例如音訊聲道y1、y2、...、y_N 的一多聲道音訊輸出信號。以此為目的，該雙耳線索編碼的解碼器420可包含接收該總和信號416及聲道間線索424，且提供音訊信號y1、y2、...、y_N 的雙耳線索編碼合成器422。該雙耳線索編碼的解碼器420更包含一旁側資訊處理器426，其受組配接收該旁側資訊419，且可取捨地接收一使用者輸入427。該旁側資訊處理器426受組配以在該旁側資訊419及可取捨使用者輸入427的基礎上，提供聲道間線索424。

綜上所述，該等音訊輸入信號在該BBC編碼器410中予以分析及向下混合。該總和信號及該旁側資訊發送至該BCC解碼器420。該等聲道間線索是由該旁側資訊及本地使用者輸入而產生。該雙耳線索編碼合成產生多聲道音訊信號。

詳細地，參照由C. Faller與F. Baumgarte所著的論文“Binaural Cue Coding Part II: Schemes and applications”(出版於：2003年11月6日，IEEE Transactions on Speech and Audio Processing，第11卷)。

習知方式的討論

在上述方式中，適當地控制聲道間關係是很困難的。

因此，期望建立一概念，能夠把一向下混合信號向上混合，從而對聲道間相關性提供良好的正確性。

本發明的概要

根據本發明的實施例建立了一向上混合器，用以把一向下混合音訊信號向上混合為描述一或多個經向上混合音訊聲道的一經向上混合音訊信號。該向上混合器包含一參數使用器，其受組配以使用向上混合參數來把該向下混合音訊信號向上混合，以獲得該經向上混合音訊信號。該參數使用器受組配以將一相位偏移用於該向下混合音訊信號，以獲得該向下混合音訊信號的相位偏移版本，而使一經去相關信號不會受到該相位偏移修改。該參數使用器也受組配以將該向下混合音訊信號的相位偏移版本與該經去相關信號相結合，以獲得該向上混合信號。

根據本發明的一些實施例是基於以下的發現，在不同經向上混合音訊信號之間的聲道間相關性透過將一相位偏移(例如，依據空間線索而定在時間上可變的相位偏移)用於該經去相關信號而降低。因此，已發現期望使經去相關信號不會受到用於該向下混合信號的該相位偏移修改，以在該等經向上混合音訊聲道之間獲得適當的聲道間相位偏移。

因此，根據本發明之所改良的相位處理有利於防止可能由於該經去相關信號部分的相位偏移而導致之(該等經向上混合音訊聲道的)錯誤的輸出聲道間相關性。

在一較佳的實施例中，該向上混合器受組配以獲得該經去相關信號，使得該經去相關信號是該向下混合音訊信號的一經去相關版本。因而，該經去相關信號可以容易地從該向下混合信號中獲得。然而，在一些其他實施例中，可使用不同的概念來獲得該經去相關信號。在一極其簡單的解決方案中，雜訊信號可以用作該經去相關信號。

在一較佳的實施例中，該向上混合器受組配以把該向下混合音訊信號向上混合為描述多個經向上混合音訊聲道的一經向上混合音訊信號。在這種情況下，該參數使用器受組配以使用該等向上混合參數來使用該經去相關信號，把該向下混合音訊信號向上混合，以獲得一第一經向上混合音訊聲道信號及一第二經向上混合音訊聲道信號。該參數使用器受組配以將一在時間上可變的相位偏移用於該向下混合音訊信號，以獲得相對於彼此包含一在時間上可變相位偏移之該向下混合音訊信號的至少二個版本。該參數使用器還受組配以將該向下混合音訊信號的至少二個版本與該經去相關信號相結合，以獲得該等至少二個經向上混合音訊聲道信號，使得該經去相關信號保持未受該在時間上可變相位偏移的影響。因此，該經向上混合音訊信號的多個聲道信號可以獲得，其中(該經向上混合音訊信號的)該等多個經向上混合聲道中的經去相關信號部分不會受到在該等相關信號部分之間所引入的相對相位偏移的影響。因而，在該等經向上混合音訊聲道之間的聲道間相關性可以獲得極其準確地控制。

在一實施例中，該參數使用器受組配以將該向下混合音訊信號的至少二個版本與該經去相關信號相結合，以使該第一經向上混合音訊聲道信號中表示該經去相關信號的一信號部分與該第二經向上混合音訊聲道信號中表示該經去相關信號的一信號部分是在時間上恆定的相位關係，例如相對於彼此同相或180°異相。因而，表示該經去相關信號的信號部分可有效地用以調整該等經向上混合音訊聲道信號的相關性。相反地，如果表示該經去相關信號的信號部分在不同經向上混合音訊聲道信號中，相對於彼此是任意的或受到可變的相位偏移，那麼期望的聲道間相關性的調整可能會降級或甚至受阻。

在根據本發明的一實施例中，該參數使用器受組配以在將該向下混合音訊信號的至少二個版本(包含相對於彼此在時間上可變的相位偏移)與該經去相關信號相結合之前，獲得相對於彼此包含在時間上可變相位偏移之向下混合音訊信號的至少二個版本，其中經去相關信號不會受到該在時間上可變相位偏移的影響。透過在將其結果與該經去相關信號相結合之前，使用該在時間上可變的相位偏移，該經去相關信號不會受到該在時間可變相位偏移的影響。因而，該等所產生的經向上混合音訊聲道信號的相關性特性可以獲得準確地調整。

在根據本發明的一實施例中，該向上混合器包含一參數判定器，其受組配以在一聲道間相位差參數的基礎上，判定要用於該向下混合音訊信號的相位偏移。因此，該相位偏移適用於滿足所期望的人類聽力印象。

在根據本發明的一實施例中，該參數使用器包含一矩陣-向量乘法器，其受組配以將表示該向下混合信號之一或多個樣本及該經去相關信號之一或多個樣本的一輸入向量與包含表示向上混合參數之矩陣元素的一矩陣相乘。該乘法被執行以由此獲得表示一第一經向上混合音訊信號聲道之一或多個樣本及一第二經向上混合音訊信號聲道之一或多個樣本的一輸出向量。該向上混合器包含一參數判定器，其受組配以在與該向下混合音訊信號相關聯之空間線索的基礎上，獲得矩陣元素。該參數判定器受組配以將一在時間上可變的相位旋轉僅用於要用於該向下混合信號之一或多個樣本的矩陣元素，而使要用於該經去相關信號之一或多個樣本的矩陣元素之相位不受該在時間上可變相位旋轉的影響。透過使一些矩陣元素，即用於該經去相關信號者，不受隨時間變化相位旋轉影響，該發明性概念的有效實施可以獲得。藉由一些矩陣元素可降低在運算上的費力程度，該等矩陣元素包含一固定相位值(或例如可以是獨立於該等空間線索的實數值)。此外，矩陣元素的判定當然會相當簡單，如果該等相位值是恆定的話。

在一實施例中，該矩陣-向量乘法器受組配以接收以複數值表示之該向下混合音訊信號的樣本及該經去相關信號的樣本。此外，該矩陣-向量乘法器受組配以將複數值矩陣元素用於該輸入向量，以使用一相位偏移，且獲得以複數值表示之該等經向上混合音訊信號聲道的樣本。在這種情況下，該參數判定器受組配以在與該向下混合音訊信號相關聯之聲道間位準差參數及/或聲道間相關性參數及/或聲道間相干性參數(或聲道間相關性或相干性參數)的基礎上，運算矩陣元素的實數值或幅值。此外，該參數判定器受組配以在與該向下混合音訊信號相關聯之聲道間相位差參數的基礎上，運算要用於該向下混合信號之一或多個樣本的矩陣元素的相位值。此外，該參數判定器受組配以根據相對應的相位值，將複數旋轉用於要使用於該向下混合信號之一或多個樣本之矩陣元素的幅值，以獲得要使用於該向下混合信號之一或多個樣本的矩陣元素。因此，矩陣元素之有效的多步驟判定可以獲得實施。矩陣元素的實數值或幅值可以在不考慮聲道間相位差的情況下獲得計算。類似地，矩陣元素的相位值可以在不考慮該等聲道間位準差參數或聲道間相關性/相干性參數的情況下獲得，這允許運算可取捨地並列進行。此外，矩陣元素可以獲得有效地使用，以使該等經向上混合音訊聲道信號的聲道間相關性可以獲得極為準確地調整。

根據本發明的一實施例建立了一方法，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號。

根據本發明的另一實施例包含一電腦程式，用以執行該發明性方法的功能。

圖式的簡單描述

隨後，根據本發明的實施例將參照所揭露的圖式予以描述，其中：第1圖顯示根據本發明的一實施例，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號的一向上混合器的方塊示意圖；第2a、2b圖顯示根據本發明的另一實施例，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號的一向上混合器的詳細方塊示意圖；第3a圖顯示根據本發明的一實施例，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號的一方法的流程圖；第3b圖顯示根據本發明的一實施例，用以獲得一組向上混合參數的一方法的方塊示意圖；以及第4圖顯示習知的一般雙耳線索編碼方案的方塊示意圖。

實施例的詳細描述

根據第1圖的實施例

第1圖顯示根據本發明之一實施例的一向上混合器100的方塊示意圖。為了簡潔，第1圖顯示僅顯示了一單一聲道的向上混合。當然，在此所揭露的概念也可以用於多聲道系統中，如參照第2圖所述。

向上混合器100受組配以接收一向下混合音訊信號110，且把該向下混合音訊信號110向上混合為描述一或多個經向上混合音訊聲道的一經向上混合音訊信號120。

該向上混合器包含一參數-使用器130，其受組配以使用向上混合參數來把該向下混合音訊信號110向上混合，而獲得該經向上混合音訊信號120。該參數使用器130受組配以將一相位偏移(由參考數字140顯示)用於該向下混合音訊信號110，而獲得該向下混合音訊信號110的相位偏移版本，同時使經去相關信號150不會受到相位偏移修改。該參數-使用器130進一步受組配以將該向下混合音訊信號110的相位偏移版本142與該經去相關信號150相結合(由參考數字160顯示)，而獲得該經向上混合音訊信號120。

透過僅將該相位偏移用於向下混合音訊信號110，而不用於該經去相關信號150(例如，其可以是該向下混合音訊信號110的一經去相關版本)，該經向上混合音訊信號120包含一經去相關部分，其中該經向上混合音訊信號120的經去相關部分是基於該經去相關信號150，且其中該經去相關部分的相位不會受到用於該向下混合音訊信號110之相位偏移的影響。因此，經向上混合音訊信號120與向下混合音訊信號110相關的一信號部分根據所使用的相位偏移，(例如以隨時間變化的方式)予以相位偏移，而經向上混合音訊信號120與該向下混合音訊信號110去相關的一部分沒有受到相位偏移的影響。因此，可以高正確性地執行對經向上混合音訊信號(對於其他經向上混合音訊信號)之聲道間相關性特性的調整，而不必考慮用於向下混合音訊信號之隨時間變化的相位偏移。

根據第2a及2b圖的實施例

第2a及2b圖顯示根據本發明之另一實施例的一裝置200的詳細方塊示意圖。

該裝置200受組配以接收一向下混合音訊信號210，且把該向下混合音訊信號向上混合為一經向上混合音訊信號220。該經向上混合音訊信號220例如可以描述一第一經向上混合音訊聲道222a及一第二經向上混合音訊聲道222b。

該向下混合音訊信號210例如可以是由一空間音訊編碼器所提供的一總和信號(例如，由該雙耳線索編碼的編碼器410所提供的總和信號416)。該向下混合音訊信號210可以例如由複數值頻率分解的形式來表示。例如，該向下混合音訊信號可包含對於每一音訊樣本更新間隔(由時間索引k來表示)之(多個頻帶中的)每一頻帶的一樣本。

在下面，樣本在一頻帶中的處理將予以描述。然而，在其他頻帶中的音訊樣本可類似地予以處理。換句話說，在根據本發明的一些實施例中，不同的頻帶可獨立地予以處理。

類似地，假設該第一經向上混合音訊聲道信號222a以複數值樣本的形式來表示在經向上混合音訊信號220之一特定頻帶中的音訊內容。同樣地，假設該第二經向上混合音訊聲道信號222b以複數值樣本的形式來表示在所考慮之特定頻帶中的音訊內容。然而，根據在此所述的同一概念，可以獲得對於不同頻帶的經向上混合音訊聲道信號。

從而，該裝置200的頻帶處理(即對於一單一頻帶之向上混合信號的產生)受組配以接收描述所考慮頻帶之音訊內容的一序列隨後、複數值樣本的一串流x(k)。在此符號中，k作為一時間索引。在下面，x(k)將會簡單地表示為“向下混合音訊信號”，要記住的是，x(k)僅描述在總(多頻帶)向下混合音訊信號中所考慮之單一頻帶的音訊內容。

頻帶處理包含一去相關器230，其受組配以接收該向下混合音訊信號x(k)，且在其基礎上，提供該向下混合音訊信號x(k)的經去相關版本q(k)。該經去相關版本q(k)可以由一序列複數值樣本來表示。該頻帶處理還包含一參數-使用器240，其受組配以接收該向下混合音訊信號x(k)及該向下混合音訊信號的經去相關版本q(k)，且在其基礎上，提供該第一經向上混合音訊聲道信號222a及該第二經向上混合音訊聲道信號222b。

在第2圖的實施例中，該參數-使用器240包含一矩陣向量乘法器242(或任何其他適當的裝置)，其受組配以執行向下混合音訊信號x(k)與該向下混合音訊信號之經去相關版本q(k)的加權線性結合，而獲得該等經向上混合音訊聲道信號222a、222b。x(k)與q(k)的加權由一加權矩陣H (k)的元素來判定，其中該加權矩陣的元素是在時間上可變的(即依賴於時間索引k)。大體上來說，加權矩陣H (k)的一些元素可以是複數值的，如在下面詳細的討論。

在第2圖的實施例中，該第一經向上混合音訊聲道信號222a的樣本y₁ (k)可透過使由一複數值矩陣元素H₁₁ 加權的向下混合音訊信號樣本x(k)與由一(典型地，但不一定是實數值)矩陣元素H₁₂ 加權之經去相關信號在時間上相對應的樣本q(k)相加來獲得。類似地，該第二經向上混合音訊聲道信號222b的樣本y₂ (k)透過使由一複數值矩陣元素H₂₁ 加權的向下混合音訊信號樣本x(k)與由一(典型地是實數值)矩陣元素H₂₂ 加權之經去相關信號在時間上相對應的樣本q(k)相加來獲得。

因此，相位偏移或相位旋轉在根據該等經向上混合音訊聲道信號222a、222b的樣本y₁ (k)、y₂ (k)來推導時，用於該(相關)向下混合音訊信號的樣本x(k)。相反地，在計算該經去相關信號之樣本q(k)對該等經向上混合音訊聲道信號222a、222b之樣本的貢獻時，可避免使用相位偏移或相位旋轉。

在下面，將描述可以如何獲得矩陣H 的矩陣元素H_11、 H_12、 H_21、 H₂₂ 。

以此為目的，裝置200包含一旁側資訊處理單元260，其受組配以接收描述該等向上混合參數的一旁側資訊262。該旁側資訊262可以例如包含空間線索，例如聲道間位準差參數、聲道間相關性或相干性參數、聲道間時間差參數或聲道間相位差參數。該等參數ILD、ICC、ITD、IPD在空間編碼技藝中是已知的，且在此將不予以詳細地描述。

該旁側資訊處理單元260受組配以將該等(全部的)矩陣元素H_11、 H_12、 H_21. H₂₂ 提供給該矩陣向量乘法器242(其由參考數字264顯示)。從而，該旁側資訊處理單元260可被視為是一“參數判定器”。

該旁側資訊處理單元260包含一向上混合參數實數值判定器270，其受組配以接收描述在該等經向上混合音訊聲道信號222a、222b中之不同信號成分之間的振幅關係或功率關係的空間線索。例如，該向上混合參數實數值判定器270受組配以接收聲道間位準差參數及/或聲道間相關性或相干性參數。該向上混合參數實數值判定器270受組配以在該等空間線索(例如ILD、ICC)的基礎上，提供實數值矩陣元素。該向上混合參數實數值判定器270受組配以在該等所接收空間線索(例如ILD、ICC)的基礎上，提供實數值矩陣元素。該等實數值矩陣元素由272來表示。因為實數值矩陣元素272的運算在空間解碼技藝中是已知的，所以在此省略了對其的詳細描述。而是，參考對在該技藝中具有通常知識者來說已知的，從段落標題為“參考文獻”中所引用的文件及任何其他出版物。

該旁側資訊處理單元260更包含一向上混合參數相位偏移角度判定器280，其受組配以接收表示在該等經向上混合音訊聲道信號222a、222b中不同信號成分之間之相位偏移的空間線索。例如，該向上混合參數相位偏移角度判定器280受組配以接收聲道間相位差參數282。該向上混合參數相位偏移角度判定器280還受組配以提供與該向下混合音訊信號相關聯之相位偏移角度值α₁ 、α₂ ，其由284來表示。在該等聲道間相位差參數282的基礎上，對相位偏移角度值的運算在該技藝中是已知的，因此在此省略了對其的詳細描述。例如，可參照對該技藝中具有通常知識者來說已知的，且從段落標題為“參考文獻”中所引用的文件及任何其他出版物。

該旁側資訊處理單元260更包含一矩陣元素旋轉器290，其受組配以接收該等實數值矩陣元素272及相位偏移角度值284，且在其基礎上，運算該矩陣H 的(全部)矩陣元素(也由H(k) 來表示以指示時間相依性)。以此為目的，該矩陣元素旋轉器290可受組配以將該等相位偏移角度值α₁ 、α₂ 用於此等(且較佳地，僅用於此等)實數值矩陣元素272，該等實數值矩陣元素272是打算應用於向下混合音訊信號x(k)。相反地，矩陣元素旋轉器290較佳地受組配以使打算應用於經去相關信號q(k)之樣本的那些實數值矩陣元素不受該等相位偏移角度值α₁ 、α₂ 影響。從而，打算(由矩陣-向量乘法器242)應用於該經去相關信號q(k)之樣本的那些矩陣元素保持為由該向上混合參數實數值判定器270所提供的實數值。然而，在一些實施例中，可能會出現相反的符號。

在第2圖所示的實施例中，下面的關係式可以成立：

因此，矩陣元素旋轉器290受組配以推導出矩陣H 的(全部)矩陣元素，且將此等(全部)矩陣元素提供給該矩陣-向量乘法器242。

通常，該矩陣H 的矩陣元素可以在裝置200的操作期間更新。例如矩陣H 的矩陣元素264可以在一組新的旁側資訊262由裝置200所接收時更新。在其他實施例中，內插可以獲得執行。因而，矩陣元素264在可以使用內插的一些實施例中，可以每一音訊樣本更新間隔k更新一次。

在下面，參照第2a及2b圖所詳細描述，將簡單地概述根據本發明的概念。根據本發明的實施例透過一改良相位處理來增強向上混合技術，該改良的相位處理能防止由於該經去相關信號部分之相位偏移所導致的錯誤的輸出聲道間相關性。

為了簡單起見，第2圖所示的實施例及下面的描述僅限於從一個聲道至兩個聲道的向上混合。從例如一個聲道至兩個聲道的解碼器向上混合程序透過使由向下混合信號x(稱為“乾信號”)，及該向下混合信號q的一經去相關版本(稱為“濕信號”)組成的一向量，與一向上混合矩陣H 實行矩陣相乘來執行。該濕信號q可透過使向下混合信號x經過一去相關濾波器(例如，去相關器230的形式)而產生。該輸出信號y是包含該輸出之第一及第二聲道(例如，該第一向上混合音訊聲道信號222a及該第二向上混合音訊聲道222b)的一向量。

所有信號x、q、y 都可用於一複數值的頻率分解中。矩陣操作可以對於每一頻帶的所有子帶樣本來執行。下面的矩陣操作可加以執行：

可由該矩陣-向量乘法器242所執行的該矩陣操作還顯示於第2圖中，其中該時間索引k表示輸出樣本x、y、該等經向上混合輸出樣本y₁ 、y₁ ，及該向上混合矩陣H 典型地隨時間變化。

該向上混合矩陣H 的係數(或矩陣元素)H₁₁ 、H₁₂ 、H₂₁ 、H₂₂ 透過例如使用該旁側資訊處理單元260，從該等空間線索中推導出。該矩陣操作(由該矩陣-向量乘法器242所執行)根據ICC實施乾信號x與濕信號y的混合，且根據ILD實施該等輸出聲道222a、222b的加權。透過使用複數值係數，可以使用根據IPD的一額外相位偏移(在下面將予以描述)。

該濕信號q透過使該向下混合信號x經過一去相關濾波器(例如該去相關器230)而產生，該去相關濾波器以使x與q之間的相關性足夠接近於零的方式來設計。為了再現由所傳送ICC所述的二個聲道之間原始相關性程度，該等信號x及q對於該等二個輸出聲道222a、222b會予以不同地混合。該等混合係數(例如該矩陣H 的矩陣元素)以使輸出聲道的相關性與該等所傳送ICC相匹配的方式來計算。

由該等所傳送IPD所述的該等二個聲道之間的相位關係透過將相位偏移用於該等輸出信號而獲得重現。該等二個信號通常旋轉不同的角度。

習知的解碼器將該等相位偏移用於該等完整的輸出信號，這就意味著乾及濕信號成分都會獲得處理。

該等所傳送的IPD描述了二個聲道之間相位角度的不同。已經發現，因為對於非相關信號無法定義相位差，所以IPD值總是基於該等相關信號成分。從而發現，不一定要將相位旋轉用於該等輸出聲道的濕信號部分。而且，已經發現，將不同的相位偏移用於該等二個聲道(包含該等經去相關信號部分)甚至可能會導致錯誤的輸出相關性程度，因為乾及濕混合的運算可能基於相同的經去相關信號混合至二個聲道的假設。

用以混合乾及濕信號的常見方式是把相同量的濕信號以不同的符號混合至二個聲道。已經發現，如果將不同的相位偏移用於輸出聲道(例如，在將該乾信號x與該濕信號q相結合之後)，該濕信號部分的異相特性受到破壞，從而導致去相關的損失。

相反地，發明性的解決方案會幫助維持所期望程度的去相關。

在下面，與上述實施例有關的其他細節將予以說明。在根據本發明的一實施例中，一(與習知的向上混合技術比較時)經修改的向上混合用以透過根據聲道間相位差(IPD)的此旋轉，來避免去相關的損失。如上所述，已經發現，濕信號部分的相位偏移可能導致去相關的損失，且對於重新構建聲道之間的原始相位關係是不需要的。當使用複數係數來將相位偏移用於該向上混合矩陣H 中時，該處理可透過僅旋轉與該乾信號相乘的此等係數而限於該乾信號。

在下面，一方法將予以描述，其可用於獲得該向上混合矩陣H 或向上混合參數(例如，該向上混合矩陣H 的元素)。

在一第一步驟中，該實數值矩陣(或其元素)根據該等所傳送聲道間位準差(ILD)及聲道間相關性或相干性參數(ICC)來運算，其空間線索可以作為該旁側資訊262的一部分，由該裝置200接收。此運算(其可由該向上混合參數實數值判定器270所執行)可以與如果不使用聲道間相位差(IPD)相同的方式來進行。

在下一步驟(其可取捨地與該第一步驟並行地執行，或甚至在該“第一步驟”之前執行)中，對於例如二個輸出聲道的相位偏移角度α₁ 及α₂ 通常根據該等所傳送的IPD(例如在該向上混合參數相位偏移角度判定器280中)來計算。

最後，執行對與該乾信號相乘之矩陣的此等要素(或元素)，即矩陣的第一行的複數旋轉，以獲得該向上混合矩陣H (例如，使用該矩陣元素旋轉器290)：

使用此經修改的向上混合矩陣，相位旋轉會僅用於該乾信號部分(例如，藉由使用該矩陣H 的該矩陣-向量乘法器242)，而該濕信號部分不獲得修改，且正確的去相關獲得保留。

根據第3a圖的方法

第3a圖顯示用以把向下混合音訊信號向上混合為描述一或多個經向上混合音訊聲道的經向上混合音訊信號的方法300的一流程圖。該方法300大體上包含310，使用向上混合參數來把該向下混合音訊信號向上混合，而獲得該經向上混合音訊信號。310使用向上混合參數包含步驟320，將一相位偏移用於該向下混合音訊信號，來獲得該向下混合音訊信號的相位偏移版本，而使去相關信號不會受到相位偏移修改。310使用向上混合參數更包含步驟330，將該向下混合音訊信號的相位偏移版本與該經去相關信號相結合，以獲得該經向上混合音訊信號。

應注意的是，方法300可以補充有在此針對於該發明性裝置所述的任何功能。

根據第3b圖的方法

第3b圖顯示用以根據本發明的一實施例，用以獲得一組向上混合參數的方法350。該方法350包含一第一步驟360，根據一或多個表示貢獻強度的空間線索(例如ILD、ICC)，來獲得描述該向下混合音訊信號(例如信號x)及去相關信號(例如信號q)對該等經向上混合音訊聲道信號(例如y₁ 、y₂ )之所期望貢獻強度的實數值向上混合參數(例如，實數值矩陣元素)。該方法350更包含一第二步驟370，根據一或多個表示聲道間相位偏移(例如IPD)的空間線索，來獲得描述在不同的經向上混合音訊聲道信號(例如y₁ 、y₂ )之向下混合音訊信號成分之間的所期望相位偏移的相位偏移角度值(例如α₁ 、α₂ )。該方法350更包含步驟380，根據該等相位偏移角度值來旋轉(例如相位偏移)打算用於該向下混合音訊信號的實數值向上混合參數，同時使打算用於該去相關信號之實數值向上混合參數不受該等相位偏移角度值影響，從而獲得該組向上混合參數之全部的向上混合參數。

該方法350可補充有在此針對於該發明性裝置所述的任何特徵及功能。

電腦程式實施

依據某些實施需求，本發明的實施例可實施於硬體或軟體中。該實施可以使用例如一軟碟、一DVD、一CD、一ROM、一PROM、一EPROM、一EEPROM或一快閃記憶體的一數位儲存媒體來執行，在該數位儲存媒體上儲存有電子可讀控制信號，與一可規劃電腦系統協作(或能夠協作)使得各別方法獲得執行。

根據本發明的一些實施例包含一資料載體，具有能夠與一可規劃電腦系統相協作以使在此所述方法之一獲得執行的電子可讀控制信號。

大體上，本發明的實施例可以實施為具有一程式碼的一電腦程式產品，該程式碼可操作來在該電腦程式產品執行於一電腦上時，執行該等方法之一。該程式碼可以例如儲存於一機械可讀載體上。

其他實施例包含儲存於一機械可讀載體上，用於執行在此所述方法之一的電腦程式。從而，換句話說，該發明性方法的實施例是一電腦程式，具有用於在該電腦程式執行於一電腦上時，執行在此所述方法之一的一程式碼。

從而，該等發明性方法的另一實施例是一資料載體(或一數位儲存媒體，或一電腦可讀媒體)，包含記錄在其上用於執行在此所述方法之一的電腦程式。

從而，該發明性方法的另一實施例是表示用於執行在此所述方法之一的電腦程式的一資料流或一序列信號。該資料流或該序列信號例如可以受組配以經由一資料通訊連接體，例如經由網際網路來傳輸。

另一實施例包含一處理裝置，例如一電腦或一可規劃邏輯裝置，其受組配以或適用於執行在此所述方法之一。

另一實施例包含已安裝有用於執行在此所述方法之一的電腦程式的一電腦。

在一些實施例中，一可規劃邏輯裝置(例如一現場可規劃閘極陣列)可用以執行在此所述方法中的一些或所有功能。在一些實施例中，一現場可規劃閘極陣列可以與一微處理器相協作以執行在此所述方法之一。

結論

綜上所述，用以再現原始聲道間相位差，同時保留正確去相關的改良向上混合方法獲得描述。根據本發明的實施例藉由防止在輸出信號中由於該去相關輸出的不受期望相位處理而導致的去相關損失，取代了其他技術。

參考文獻：

[1]　C. Faller and F. Baumgarte,“Efficient representation of Spatial audio using perceptual parametrization,”IEEE WASPAA,Mohonk,NY,October 2001.

[2]　F. Baumgarte and C. Faller,“Estimation of auditory spatial cues for binaural cue coding,”ICASSP,Orlando,FL,May 2002.

[3]　C. Faller and F. Baumgarte,“Binaural cue coding: a novel and efficient representation of spatial audio,”ICASSP,Orlando,FL,May 2002.

[4]　C. Faller and F. Baumgarte,“Binaural cue coding applied to audio compression with flexible rendering,”AES 113th Convention,Los Angeles,Preprint 5686,October 2002.

[5]　C. Faller and F. Baumgarte,“Binaural Cue Coding-Part II: Schemes and applications,”IEEE Trans. on Speech and Audio Proc.,vol. 11,no. 6,Nov. 2003.

[6]　J. Breebaart,S. van de Par,A. Kohlrausch,E. Schuijers,“High-Quality Parametric Spatial Audio Coding at Low Bitrates”,AES 116th Convention,Berlin,Preprint 6072,May 2004.

[7]　E. Schuijers,J. Breebaart,H. Purnhagen,J. Engdegard,“Low Complexity Parametric Stereo Coding”,AES 116th Convention,Berlin,Preprint 6073,May 2004.[8]　ISO/IEC JTC 1/SC 29/WG 11,23003-1,MPEG Surround.

[9]　J. Blauert,Spatial Hearing: The Psychophysics of Human Sound Localization,The MIT Press,Cambridge,MA,revised edition 1997.

100．．．向上混合器

110．．．向下混合音訊信號

120．．．經向上混合音訊信號

130．．．參數-使用器

140．．．相位偏移

142．．．向下混合信號的相位偏移版本

150．．．經去相關信號

160．．．結合

200．．．裝置

210．．．向下混合音訊信號

220．．．經向上混合音訊信號

222a．．．第一經向上混合音訊聲道

222b．．．第二經向上混合音訊聲道

230．．．去相關器

240．．．參數-使用器

242．．．矩陣向量乘法器

260．．．旁側資訊處理單元

262．．．旁側資訊

264．．．矩陣元素

270．．．向上混合參數實數值判定器

272．．．實數值矩陣元素

280．．．向上混合參數相位偏移角度判定器

282．．．聲道間相位差參數

284．．．相位偏移角度值

290．．．矩陣元素旋轉器

300．．．方法

310~330．．．步驟

350．．．方法

360~380．．．步驟

400．．．雙耳線索編碼傳輸系統

410．．．雙耳線索編碼的編碼器

412a~412c．．．音訊信號

414．．．向下混合器

416．．．向下混合信號

418．．．分析器

419．．．旁側資訊信號

420．．．雙耳線索編碼的解碼器

422．．．雙耳線索編碼合成器

424．．．聲道間線索

426．．．旁側資訊處理器

427．．．使用者輸入

H(k)．．．矩陣

H11/H12/H21/H22．．．矩陣元素

k．．．時間索引

y1(k)/y2(k)/q(k)/x(k)．．．樣本

α1/α2．．．相位偏移角度值

ICC．．．聲道間相關性或相干性

ILD．．．聲道間位準差

IPD．．．聲道間相位差

第1圖顯示根據本發明的一實施例，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號的一向上混合器的方塊示意圖；

第2a、2b圖顯示根據本發明的另一實施例，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號的一向上混合器的詳細方塊示意圖；

第3a圖顯示根據本發明的一實施例，用以把一向下混合音訊信號向上混合為一經向上混合音訊信號的一方法的流程圖；

第3b圖顯示根據本發明的一實施例，用以獲得一組向上混合參數的一方法的方塊示意圖；以及

第4圖顯示習知的一般雙耳線索編碼方案的方塊示意圖。