TWI444989B - 針對改良多通道上混使用多通道解相關之技術 - Google Patents

針對改良多通道上混使用多通道解相關之技術 Download PDF

Info

Publication number
TWI444989B
TWI444989B TW099144459A TW99144459A TWI444989B TW I444989 B TWI444989 B TW I444989B TW 099144459 A TW099144459 A TW 099144459A TW 99144459 A TW99144459 A TW 99144459A TW I444989 B TWI444989 B TW I444989B
Authority
TW
Taiwan
Prior art keywords
matrix
vectors
signals
audio signals
signal
Prior art date
Application number
TW099144459A
Other languages
English (en)
Other versions
TW201140561A (en
Inventor
David Mcgrath
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW201140561A publication Critical patent/TW201140561A/zh
Application granted granted Critical
Publication of TWI444989B publication Critical patent/TWI444989B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Description

針對改良多通道上混使用多通道解相關之技術 發明領域
本發明大體上有關於音訊信號之信號處理且更具體地有關於可用以產生代表一漫射聲場的音訊信號的信號處理技術。此類信號處理技術可用在類似上混的音訊應用中,上混是由較小數目的輸入通道信號推導出某數目的輸出通道信號。
發明背景
本發明可用以改良由上混而獲得的音訊信號之品質;然而,本發明可有利地與需要一或更多個代表一漫射聲場的音訊信號的基本上任一應用配合使用。在以下說明中更特別的提及上混應用。
一種被稱為上混的方法由較小數目N 個音訊信號通道導出某數目M 個音訊信號通道。例如,針對被指定為左(L)、右(R)、中心(C)、左環繞(LS)及右環繞(RS)的五個通道之音訊信號可藉由上混針對此處被指定為左輸入(Li )與右輸入(Ri )的兩輸入通道之音訊信號而獲得。一上混裝置之一範例為岡德里(Gundry)於2001年5月“19th AES Conference”,“A New Active Matrix Decoder for Surround Sound”中所記載之杜比定向邏輯II(Dolby® Pro Logic® II)解碼器。一使用此特定技術的上混器分析二輸入信號通道之相位及振幅以確定它們所代表之聲場欲怎樣傳送定向印象給一聽眾。依期望 得到的輸入音訊信號的藝術效果而定,上混器應該能夠產生針對五個通道的輸出信號以為聽眾提供對在一無明顯方向的包絡漫射聲場內具有明顯方向的一或更多個聽覺分量之感知能力。本發明旨在產生針對一或更多個通道的輸出音訊信號,該等信號可透過一或更多個聲音傳感器而產生一具有較高品質的漫射聲場。
意欲代表一漫射聲場的音訊信號使聽眾產生聲音是發自聽眾周圍的許多個方向(若非所有方向的話)的感覺。此效果與藉由透過每一揚聲器來重現同一音訊信號而在二揚聲器之間產生一幻像聲像或視聲向的習知現象相反。一高品質漫射聲場通常不能藉由透過位於聽眾周圍的多個揚聲器來重現同一音訊信號而產生。所產生的聲場在不同收聽位置具有廣泛變化的振幅,通常對非常小的位置變化變化很大。在收聽區域內的某些位置一隻耳朵好像沒有感覺到聲音而另一隻耳朵感覺到聲音並不罕見。所產生的聲場感覺好像是假的。
發明概要
本發明之一目的在於提供用以推導出二或更多通道之音訊信號的音訊信號處理技術,二或更多通道之音訊信號可用以透過諸如揚聲器之類的聲音傳感器來產生一較高品質的漫射聲場。
依據本發明之一層面,由N個輸入音訊信號導出M個輸出信號來呈現一漫射聲場,其中M大於N且大於二。這藉由由N個輸入音訊信號來推導出K個中間音訊信號而完成,使得每一中間信號與N個輸入音訊信號心理聲學性解相關,且若K大於一,則與所有其他中間信號心理聲學性解相關。N個輸入音訊信號及K個中間信號依據具有指定一M維空間中的一組N+K個向量之一矩陣的係數的一線性方程式系統而被混合以得到M個輸出音訊信號。N+K個向量中的至少K個向量與該組中的所有其他向量大體上正交。數目K大於或等於一且小於或等於M-N。
依據本發明之另一層面,用於混合N個輸入音訊信號以推導出M個輸出音訊信號來呈現一漫射聲場之一線性方程式系統之一係數矩陣被獲得。這藉由以下步驟而完成:獲得具有指定一M維空間中的一組N個第一向量的係數的第一矩陣;推導出該M維空間中的一組K個第二向量,每一第二向量與每一第一向量大體上正交,且若K大於一,則與所有其他第二向量大體上正交;獲得具有指定該組K個第二向量的係數的第二矩陣;將該第一矩陣與第二矩陣連接在一起以獲得一具有指定該組N個第一向量與該組K個第二向量之聯集的係數的中間矩陣;及較佳地縮放該中間矩陣之係數以獲得一具有小於該第一矩陣之費氏範數(Frobenius norm)之10%的費氏範數的信號處理矩陣,其中該信號處理矩陣之係數為該線性方程式系統之係數。
參照以下討論及所附圖式,本發明之各種不同的特徵及其較佳實施例可獲更好理解,在諸圖中相同的參考數字指相同的元件。以下討論內容及圖式僅作為範例而被提及且不應被理解為代表對本發明範圍加以限制。
圖式簡單說明
第1圖為一可包含本發明之層面的音訊信號處理裝置之一示意方塊圖。
第2圖為一基本上混矩陣之一示意圖。
第3圖為與一增廣上混矩陣連接的一基本上混矩陣之一示意圖。
第4圖為一使用延遲組件的信號解相關器之一示意圖。
第5圖為使用具有雙模態頻率相依相位變化的一次頻帶濾波器及具有一頻率相依延遲的一次頻帶濾波器的信號解相關器之一示意圖。
第6圖為可用以實施本發明之各種不同層面的一裝置之一示意方塊圖。
較佳實施例之詳細說明
A.引論
第1圖為一可包含本發明之層面的裝置10之一示意方塊圖。裝置10從信號路徑19接收針對一或更多輸入通道的音訊信號且沿信號路徑59產生針對多數個輸出通道的音訊信號。與信號路徑19交叉的短線以及與其他信號路徑交叉的短線指出這些信號路徑攜帶有針對一或更多通道的信號。緊挨該等短交叉線下方的符號N及M分別指出各種不同的信號路徑攜帶有針對N及M個通道的信號。緊挨某些短交叉線下方的符號x及y指出各別信號路徑攜帶有一未指定數目之信號,這對理解本發明並不重要。
在裝置10中,輸入信號分析器20從信號路徑19接收針對一或更多輸入通道的音訊信號且分析它們以確定該等輸入信號的哪些部分代表一漫射聲場且哪些部分代表一非漫射聲場。一漫射聲場使聽眾產生聲音是發自聽眾周圍的許多個方向(若非所有方向的話)的感覺。一非漫射聲場產生聲音是發自一特定方向或發自一相對較窄範圍內之方向的印象。漫射聲場與非漫射聲場之區分是主觀上的且可能未必總是確定的。儘管這可能影響利用本發明層面的實際實施之性能,但並不影響本發明所隱含的原理。
被視為代表一非漫射聲場的輸入音訊信號部分沿信號路徑28被傳送至非漫射信號處理器30,非漫射信號處理器30沿信號路徑39產生一組M個信號,該組信號旨在透過諸如揚聲器之類的多數個聲音傳感器來重現該非漫射聲場。執行此類型處理的一上混裝置之一範例為上述之杜比定向邏輯II解碼器。
被視為代表一漫射聲場的輸入音訊信號部分沿信號路徑29被傳送至漫射信號處理器40,漫射信號處理器40沿信號路徑49產生一組M個信號,該組信號旨在透過諸如揚聲器之類的多數個聲音傳感器來重現該漫射聲場。本發明針對漫射信號處理器40中所執行的處理。
求和組件50將來自非漫射信號處理器30的M個信號中的每一者與來自漫射信號處理器40的M個信號中的各別一者相組合以產生針對M個輸出通道中的各別一者的一音訊 信號。針對每一輸出通道的音訊信號旨在驅動一聲音傳感器,諸如揚聲器。
本發明針對開發及使用一線性混合方程式系統以產生可代表一漫射聲場的一組音訊信號。這些混合方程式可用在例如漫射信號處理器40中。此揭露之剩餘部分假定數目N大於或等於一,數目M大於或等於三,且數目M大於數目N。
裝置10僅為本發明可如何被使用之一範例。本發明可被併入功能或結構上不同於第1圖中所示者的其他裝置。例如,代表一聲場之漫射及非漫射部分的信號可由一單一組件來處理。針對一不同的漫射信號處理器40之若干實施在下文中加以描述,該等實施係依據由一矩陣所定義之一線性方程式系統來混合信號。針對漫射信號處理器40與非漫射信號處理器30二者的處理之各種不同部分可藉由由一單一矩陣所定義之一線性方程式系統來實施。此外,本發明之層面可併入一並不亦包含輸入信號分析器20、非漫射信號處理器30或求和組件50的裝置中。
B.第一推導方法
漫射信號處理器40藉由依據一線性方程式系統來混合自路徑29接收的N個通道之音訊信號而沿路徑49產生一組M個信號。在以下討論中,為了便於說明,自路徑29接收的N個通道之音訊信號部分被稱為中間輸入信號且沿路徑49產生的M個通道之中間信號被稱為中間輸出信號。此混合操作包括使用一線性方程式系統,該線性方程式系統可由如表達式1中所示之矩陣乘法來代表: 其中=代表由N個中間輸入信號所獲得的N+K個信號的行向量;C =混合係數之M x (N+K)矩陣或陣列;且=代表M個中間輸出信號的行向量。混合操作可對在時域或頻域中表示的信號執行。以下討論更特別的提及時域實施。
若需要的話,同一線性混合方程式系統可藉由使該等向量及矩陣如下轉置來表示: 其中=代表由N個中間輸入信號所獲得的N+K個信號的列向量;C T =矩陣C 之(N+K) x M轉置;且=代表M個中間輸出信號的列向量。
以下說明使用諸如與表達式1一致的列及行之類的符號及用語;然而,本發明原理可使用諸如表達式2或一明確的線性方程式系統之類的其他形式或表達式而被獲得及應用。
如表達式1中所示者,K大於或等於一且小於或等於差(M-N)。因此,信號Xi 之數目及矩陣C中的行數在N+1與M之間。
矩陣C 之係數可由一M維空間中的一組N+K個單位量值向量而獲得,該組單位量值向量彼此「大體上正交」。若二向量之點積小於它們的量值的乘積之35%,則它們被視 為彼此大體上正交。這對應於向量之間的一角度,該角度在約70度與約110度之間。矩陣C 中的每一行可能具有對應於該組中的向量中之一者之元素的M個係數。例如,矩陣C之第一行中的係數對應於元素被表示為(V 1 ,...,V M )之組中的向量V 中之一者使得C 1,1 =pV 1 ,...,C M ,1 =pV M ,其中p 為用以按照可能所期望地來縮放矩陣係數的一比例因數。可選擇地,矩陣C 中的每一行j中的係數可由不同的比例因數pj 來縮放。在許多應用中,該等係數被縮放成使得矩陣之費氏範數等於或小於之10%。附加的縮放層面在下文中加以討論。
該組N+K個向量可以可能期望的任一種方式而得出。一種方法係以具有高斯分佈的偽隨機值建立M x M係數矩陣G,及計算此矩陣之奇異值分解以獲得三個M x M矩陣,該等矩陣在此處被表示為U、S與V。U矩陣與V矩陣均為么正矩陣。C矩陣可藉由從U矩陣或V矩陣中選出N+K行且縮放這些行中的係數以獲得等於或小於之10%之費氏範數而得出。一種放鬆對正交性的某些要求的較佳方法在下文中加以描述。
N+K個輸入信號係藉由使N個中間輸入信號彼此解相關而獲得。所期望的解相關類型在本文中被稱為「心理聲學性解相關」。心理聲學性解相關與數值解相關相比較不嚴格之處在於,即使二信號彼此具有某種程度的數值相關性,它們也可被視為是心理聲學性解相關的。
二信號之數值相關性可使用各種不同的已知數值演算法而被計算出來。這些演算法得到被稱為一相關係數的一數值相關量測值,該相關係數在負一與正一之間變化。量值等於或接近一的一相關係數表明二信號是緊密相關的。量值等於或接近零的一相關係數表明二信號通常是彼此無關的。
心理聲學性相關指在具有一所謂的臨界頻寬的頻率次頻帶中存在的音訊信號之相關性質。人類聽覺系統之頻率解析能力隨著音訊頻譜中的頻率而變化。人耳可聽出在約500Hz以下之較低頻中頻率接近但隨頻率上行至聽度限度而不接近的頻譜成分。此頻率解析度之寬度被稱為臨界頻寬,且如剛才所說明,其隨頻率而變化。
若心理聲學臨界頻寬中的平均數值相關係數等於或接近零,則二信號被視為彼此是心理聲學性解相關的。若二信號之間的數值相關係數在所有頻率下均等於或接近零,則心理聲學性解相關得以實現。若數值相關性變化使得其在每一心理聲學臨界頻帶上的平均值小於針對此臨界頻帶內的任一頻率的最大相關係數的一半,則即使二信號之間的數值相關係數在所有頻率下均不等於或接近零,心理聲學性解相關也可得以實現。
心理聲學解相關可使用將在下文中加以描述的延遲器或特定類型的濾波器而得以實現。在許多實施中,N+K個信號Xi 中的N個信號可直接取自於N個中間輸入信號而毋需使用任何延遲器或濾波器來實現心理聲學性解相關,因為此N個信號代表一漫射聲場且可能已經是心理聲學性解相關的。
C.改良推導方法
若由漫射信號處理器40產生的該等信號與代表舉例而言諸如第1圖中所示者之類的一非漫射聲場的其他信號組合在一起,則在矩陣C是使用上述方法而設計出時所生成的信號組合可能產生不期望的人工因素。因為設計矩陣C 未考慮到一聲場之漫射部分與非漫射部分之間之可能的相互作用,故可能產生這些人工因素。如上所述者,漫射與非漫射之區分未必總是確定的,及輸入信號分析器20在某種程度上可能沿路徑28產生代表一漫射聲場的信號且在某種程度上可能沿路徑29產生代表一非漫射聲場的信號。若漫射信號產生器40破掉或修改由路徑29上之信號所代表之聲場之非漫聲特性,則該聲場中可能出現由沿路徑59所產生之輸出信號而產生的不期望的人工因素或可聽失真。例如,若路徑49上的M個漫射處理信號與路徑39上的M個非漫射處理信號之總和致使某些非漫射信號分量消除,則這可能削弱藉由使用本發明而會得以實現之主觀印象。
藉由將矩陣C 設計成考慮到由非漫射信號處理器30所處理之聲場之非漫射性質可實現改良。這可藉由以下步驟而完成:首先確認代表或被假定代表編碼處理之一矩陣E ,該編碼處理處理M個通道的音訊信號以產生自路徑19所接收之N個通道的輸入音訊信號,且接著如將在下文中討論推導出此矩陣之反矩陣。
一矩陣E之一範例為用以將五通道L、C、R、LS、RS下混成表示為左-總(left-total)(LT )與右總(right total)(RT )的二通道的一5x2矩陣。針對LT 及RT 通道的信號僅為接收自路徑19的針對二(N=2)通道的輸入音訊信號之一範例。在此範例中,裝置10可用以合成五(M=5)通道的輸出音訊信號,該等信號可產生一聲場,該聲場感知上類似於(若非相同的話)可由原始的五音訊信號已產生的聲場。
可用以由L、C、R、LS及RS通道信號來編碼LT 及RT 通道信號的一示範性5 x 2矩陣E 在以下表達式中顯示出來:
一M x N虛擬反矩陣B 通常可使用已知的數值技術由N x M矩陣E 而被推導出來,該等技術包括在數值軟體中所實施的那些技術,諸如由馬薩諸賽州內蒂克市MathWorksTM 公司提供的中的“pinv”函數或由伊利諾州香檳市伍爾佛朗研究公司(Wolfram Research)提供的中之“PseudoInverse”函數。若矩陣B 之係數在任意通道之間產生不想要的串音,或若任何係數為虛數或複數,則矩陣B 可能不是最佳的。矩陣B 可經調整以除去這些不想要的特性。也可藉由改變係數以強調針對所選揚聲器之信號來調整它以實現任何期望得到的藝術效果。例如,可改變係數來增加指定用於透過左及右通道之揚聲器播放的信號上的能量及減小指定用於透過中心通道之揚聲器播放的信號上的能量。矩陣B 中的係數被縮放成使得該矩陣中每一行代表一M維空間中的一單位量值向量。由矩陣B 中的行所代表的向量不必彼此大體上正交。
一示範性5x2矩陣B 在以下表達式中被顯示出來:
此矩陣可用以藉由下列運算由N個中間輸入信號來產生一組M個中間輸出信號:
此運算在第2圖中示意性地繪示出來。一混合器41從信號路徑29-1及29-2接收N個中間輸入信號且依據一線性方程式系統將這些信號混合以沿信號路徑49-1至49-5產生一組M個中間輸出信號。混合器41內的方框代表以依據線性方程式系統之矩陣B 之係數進行的信號相乘或放大。
儘管矩陣B 可被單獨使用,但是藉由使用一額外的M x K增廣矩陣A ,性能也得以改良,其中1K(M-N)。矩陣A 中的每一行代表一M維空間中的一單位量值向量,該向量與由B 矩陣之N行所代表的向量大體上正交。若K大於一,則每一行代表一向量,該向量也與由矩陣A 中的所有其他行所代表的向量大體上正交。
針對矩陣A 中的行的向量可以基本上可能期望的任何方式來推導。上述技術可被使用。一較佳方法將在下文中加以描述。
增廣矩陣A 與矩陣B 中的係數可如下文所說明來縮放且連接以產生矩陣C 。縮放及連接可代數式地表示為:C =[βB |αA ] (6)其中|=矩陣B 及矩陣A 中的行之水平連接;α =用於矩陣A 係數的比例因數;且β =用於矩陣B 係數的比例因數。
對許多應用而言,比例因數αβ 被選擇成使得複合矩陣C 之費氏範數等於或小於矩陣B之費氏範數之10%。矩陣C 之費氏範數可被表示為: 其中c i,j =列i 及列j 中的矩陣係數。
若矩陣B 中的N行中的每一者及矩陣A 中的K行中的每一者代表一單位量值向量,則矩陣B 之費氏範數等於且矩陣A 之費氏範數等於。對此情況而言,可表明,若矩陣C 之費氏範數被設定成等於,則比例因數αβ 的值如下列表達式中所示般彼此相關連: 在設定比例因數β 的值之後,比例因數α 的值可由表達式7被計算出來。較佳的是,比例因數β 被選擇成使得以矩陣B中之行中的係數混合的信號比由增廣矩陣A中之行中的係數混合的信號大至少5分貝的權數。至少6dB的權數差可藉由限制該等比例因數使得α<½ β而得以實現。針對矩陣B及矩陣A中之行的縮放權數之較大或較少差可用以使音訊通 道之間實現一所期望的聲音平衡。
可選擇地,增廣矩陣A 中每一行中的係數可如以下表達式中所示般被個別地縮放:C =[βB |α 1A 1 α 2A 2α K A K ] (8)其中Aj =增廣矩陣A中的行j;且αj =用於行j的各別比例因數。對此替代者而言,假如每一比例因數均滿足限制條件αj <½ β,則可為每一比例因數αj 選擇任意值。較佳的是,αjβ 係數的值被選擇成確保C 之費氏範數約等於矩陣B之費氏範數。
依據增廣矩陣A 而被混合的各該信號被處理使得它們與N個中間輸入信號及與依據增廣矩陣A 而被混合的所有其他信號心理聲學性解相關。這在第3圖中被示意性地繪示出來,該圖舉例繪示二(N=2)中間輸入信號、五(M=5)中間輸出信號及依據增廣矩陣A 而被混合的三(K=3)解相關信號。在此範例中,該等二中間輸入信號依據由方框41所代表的基本反矩陣B 而被混合,且它們藉由解相關器43而被解相關以提供依據由方框42所代表的增廣矩陣A 而被混合的三個解相關信號。
解相關器43可以各種不同方式被實施。第4圖中所示之一實施藉由使其輸入信號延遲不同量來實現心理聲學性解相關。從一到二十毫秒範圍內的延遲適用於許多應用。
解相關器43之另一實施之一部分在第5圖中被繪示出來。此部分處理中間輸入信號中的一者。一中間輸入信號沿對在二重疊頻率次頻帶中的它們各自的信號應用濾波器的二不同的信號處理路徑被傳送。較低頻路徑包括依據第一脈衝響應將第一次頻帶中的其輸入信號濾波的一相位反轉濾波器61及定義該第一頻率次頻帶的一低通濾波器62。較高頻路徑包括由依據不同於該第一脈衝響應的一第二脈衝響應將第二次頻帶中的其輸入信號濾波的濾波器所實施的一頻率相依延遲器63、定義該第二頻率次頻帶的一高通濾波器64及一延遲組件65。延遲器65及低通濾波器62之輸出在求和節點66中組合。求和節點66之輸出為相對於中間輸入信號心理聲學性解相關的一信號。
相位反轉濾波器61之相位響應是頻率相依的且具有一雙模態頻率分佈,其中波峰實質上等於正及負九十度。相位反轉濾波器61之一理想實施具有一統一量值響應及在位於濾波器之通帶內的二或更多頻帶邊緣處的正九十度與負九十度之間交替或反轉的一相位響應。一相位反轉可藉由具有下列表達式中所示之一脈衝響應的一稀疏希伯特(Hilbert)轉換來實施:
稀疏希伯特轉換之脈衝響應應該藉由在頻率響應之暫態性能與平滑度之間平衡折衷而被截短到一被選擇成使解相關器性能最佳化的長度。
相位反轉之數目由S參數的值來控制。此參數應被選擇成在解相關程度與脈衝響應長度之間平衡折衷。當S參數值增大時,需要一較長的脈衝響應。若S參數值太小,則濾波器提供不充分的解相關。若S參數太大,則濾波器將在足夠長的一時間間隔上塗抹暫態聲音以使解相關信號產生討厭的人工因數。
平衡這些特性的能力可藉由實施相位反轉濾波器21以使在相鄰相位反轉之間的頻率有一不均勻間隔、在較低頻下有一較窄間隔且在較高頻下有一較寬間隔而得以改良。較佳的是,相鄰相位反轉之間的間隔為頻率的一對數函數。
頻率相依延遲器63可藉由一濾波器來實施,該濾波器具有一等於一有限長度正弦序列h [n ]的脈衝響應,該序列之瞬時頻率在該序列之持續時間上從π 至零單調遞減。此序列可被表示為:
其中ω (n )=瞬時頻率;ω' (n )=瞬時頻率之一階導數;G=正規化因數;Φ (n )=(t )dt =瞬時相位;且L=延遲濾波器之長度。
正規化因數G 被設定成一值使得:
當具有此脈衝響應的一濾波器被應用於具有暫態的音訊信號時,其有時可能產生「啁啾」人工因素。可藉由向如下列表達式中所示之瞬時相位項加入一類雜訊項而減小此效應:
若類雜訊項為具有為π 的一小部分的一變異數之一白高斯雜訊序列,則藉由濾波暫態而產生的人工因數將聽起來更像雜訊而不是啁啾且延遲與頻率之間所期望的關係還是得以實現。
低通濾波器62及高通濾波器64之截止頻率應被選擇成約2.5kHz使得該等二濾波器之通帶之間無間隙且使得在接近交越頻率之通帶重疊的區域中的它們的組合輸出之頻譜能量實質上等於此區域中的中間輸入信號之頻譜能量。由延遲器65所強加的延遲量應該被設定成使得較高頻及較低頻信號處理路徑之傳播延遲在交越頻率近似相等。
解相關器可以不同方式來實施。例如,低通濾波器62與高通濾波器64中的任一者或此二者可分別被置於相位反轉濾波器61及頻率相依延遲器63之前。延遲器65可根據需要藉由被置於信號處理路徑中的一或更多個延遲組件來實施。
額外的實施細節可從由McGrath等人所著並於2009年9月28日提出申請的名稱為“Decorrelator for Upmixing Systems”的國際專利申請案第PCT/US2009/058590號案中獲得。
D.較佳推導方法
一種用以推導增廣矩陣A的較佳方法係藉由建立一「種子矩陣」P而開始。種子矩陣P包含對增廣矩陣A中係數的初始估計。從種子矩陣P中選出行以形成一中間矩陣Q。中間矩陣Q用以形成第二中間矩陣R。係數的數行從中間矩陣R中纈取出來以獲得增廣矩陣A。在描述一用以形成中間矩陣Q、中間矩陣R及增廣矩陣A的流程之後,一種可用以建立種子矩陣P的方法將在下文中加以描述。
1. 增廣矩陣A之推導
上述基本反矩陣B有M列及N行。有M列及K行的一種子矩陣P已建立,其中1K(M-N)。矩陣B及種子矩陣P水平連接以形成有M列及N+K行的一中間矩陣Q。此連接可被表示為:
Q =[B |P ] (13)
中間矩陣Q中每一行j 中的係數被縮放成使得它們代表一M維空間中的單位量值向量Q(j)。這可藉由用每一行中的係數除它們所代表的向量之量值而完成。每一向量之量值可由該行中的係數之平方之總和之平方根被計算出來。
具有排列在M列及N+K行中的係數的一中間矩陣R接著由中間矩陣Q而獲得。中間矩陣R中每一行j 中的係數代表一M維空間中的一向量R(j)。這些行向量藉由一由下列虛擬程式碼片段所表示的程序而被計算出來:
此虛擬程式碼片段中的語句具有類似於C程式語言的句法特徵。此程式碼片段不欲為一實際實施而僅旨在幫助說明可計算增廣矩陣A的一程序。
符號R(j)、Q(j)、T(j)及A(j)分別代表中間矩陣R、中間矩陣Q、一臨時矩陣T及增廣矩陣A中的行j。
符號RR(j-1)代表矩陣R之一子矩陣,該子矩陣具有M列及j-1行。此子矩陣包含中間矩陣R中的行1至j-1。
符號TRANSP[RR(j-1)]代表一返回矩陣RR(j-1)之轉置的函數。符號MAG[T(j)]代表一返回行向量T(j)之量值的函數,該量值為臨時矩陣T中的行j中的係數之歐式(Euclidean)范數。
參照虛偽程式碼片段,語句(1)用矩陣Q之第一行來初始化矩陣R之第一行。語句(2)至(9)實施一計算矩陣R之行2至K的循環。
語句(3)由子矩陣RR及中間矩陣Q來計算臨時矩陣T中的行j。如上所述者,子矩陣RR(j-1)包含中間矩陣R中的第一j-1行。語句(4)確定行向量T(j)之量值是否大於0.001。若其大於0.001,則在向量R(j)已被縮放成具有一單位量值之後,語句(5)將向量R(j)設定成等於向量T(j)。若行向量T(j)之量值不大於0.001,則向量R(j)被設定成等於所有元素均等於零的一向量零(ZERO)。
語句(10)至(12)實施一循環,該循環由中間矩陣R之最後K行即行N+1至N+K而獲得M x K增廣矩陣A。增廣矩陣A中的行向量彼此大體上正交也與基本矩陣B之行向量大體上正交。
若語句(4)判定任一行向量T(j)之量值不大於0.001,則此表明向量T(j)不與行向量Q(1)至Q(j-1)充分地線性無關且對應的行向量R(j)被設定成等於零向量。若行向量R(j)(N<jN+K)中任一者等於零向量,則種子矩陣之對應行P(j)不與其先前行線性無關。此後一種情況藉由獲得針對種子矩陣P的一新行P(j)及再次執行該程序以推導出另一增廣矩陣A來修正。
a)種子矩陣P之選擇
M x K種子矩陣P可以各種不同的方式來建立。兩種方式在以下段落中加以描述。
第一種方式係藉由產生具有偽隨機值之係數的一M x K陣列來建立種子矩陣。
第二種方式產生一種子矩陣,其中係數在將用以重現由中間輸出信號所代表的聲場的聲音傳感器之預期位置呈對稱性。這可藉由在種子矩陣建立期間臨時地重排序其行而完成。
例如,上述五通道矩陣產生針對按照L、C、R、LS及RS的順序被列出之通道的信號。針對此特定組通道的揚聲器佈局之預期對稱性可藉由依據它們各自的聲音傳感器之方位位置順序重新安排通道而被更加容易地加以利用。一種適用 順序為LS、L、C、R及RS,中心通道C被置於該組的中間。
使用此順序,一組具有適當對稱性的候選向量可被構建出來。一範例繪示於表格I中,其中每一向量被繪示於該表格中的一個別列中。這些向量之轉置將用以定義種子矩陣P中的行。
該表格中的每一列均相對於中心通道的行具有偶或奇對稱性。總數K個向量從該表格中被選出、轉置且用以形成一初始矩陣P’。例如,若K=3且該等向量針對函數FE1、FE2及FO1而被選出,則初始矩陣P’為:
該等向量之元素的順序接著被改成符合所期望的種子矩陣P的通道順序。這產生以下矩陣:
若此種子矩陣P與表達式4中所示之基本矩陣B配合使用,則由上述程序而獲得的中間矩陣Q為:
由此矩陣Q而形成的第二中間矩陣R為:
由此中間矩陣R而獲得的增廣矩陣A為:
E.實施
包含本發明各種不同層面的裝置可以各種不同方式來實施,該等方式包括由一電腦或某一其他裝置執行的軟體,某一其他裝置包括諸如耦合至類似於在一通用電腦中找到的那些組件之組件的數位信號處理器(DSP)電路之類的較專業組件。第6圖為一可用以實施本發明層面的裝置70之一示意方塊圖。處理器72提供運算資源。RAM 73為由處理器72使用來處理的系統隨機存取記憶體(RAM)。ROM 74代表某種形式的持久儲存器,諸如唯讀記憶體(ROM),用以儲存操作裝置70所需程式且可能用以實施本發明各種不同層面。I/O控制器75代表用以藉由通訊信號路徑19、59接收及傳送信號的介面電路。在所示實施例中,所有主要系統組件連接至匯流排71,匯流排71可表示多於一個實體或邏輯匯流排;然而,實施本發明不需要一匯流排架構。
在由一通用電腦系統所實施的實施例中,可包括附加組件,該等組件用以與諸如鍵盤或滑鼠及顯示器之類的裝置連接及用以控制一儲存裝置,該儲存裝置具有一儲存媒體,諸如磁帶或碟片或一光學媒體。該儲存媒體可用以記錄用於作業系統、公用程式及應用的指令之程式,且可包括實施本發明之各種不同層面的程式。
用以實踐本發明之各種不同層面所需的功能可由組件來執行,該等組件以各種方式實施,包括分立邏輯組件、積體電路、一或更多個ASIC及/或程式控制處理器。此類組件之被實施方式對本發明並不重要。
本發明之軟體實施可藉由各種不同的機器可讀取媒體或儲存媒體來傳達,該等機器可讀取儲存媒體有如包括從超音波到紫外線頻率的頻譜內的基頻或調變通訊路徑之類,該等儲存媒體基本上使用任何記錄技術來傳達資訊,包括磁帶、磁卡或碟片、光學卡或光碟及包括紙的媒體上的可檢測標記。
10、70...裝置
19、28、29、29-1、29-2、39、49-1~49-5、59...信號路徑
29...信號路徑/路徑
19、49...路徑
19、59...通訊信號路徑
20...輸入信號分析器
30...非漫射信號處理器
40...漫射信號處理器/漫射信號產生器
41...混合器/方框
42...方框
43...解相關器
50...求和組件
21、61...相位反轉濾波器
62...低通濾波器
63...頻率相依延遲器
64...高通濾波器
65...延遲分量/延遲器
66...求和節點
71...匯流排
72...處理器
73...RAM
74...ROM
75...I/O控制
N、M、x、y...符號
第1圖為一可包含本發明之層面的音訊信號處理裝置之一示意方塊圖。
第2圖為一基本上混矩陣之一示意圖。
第3圖為與一增廣上混矩陣連接的一基本上混矩陣之一示意圖。
第4圖為一使用延遲組件的信號解相關器之一示意圖。
第5圖為使用具有雙模態頻率相依相位變化的一次頻帶濾波器及具有一頻率相依延遲的一次頻帶濾波器的信號解相關器之一示意圖。
第6圖為可用以實施本發明之各種不同層面的一裝置之一示意方塊圖。
29-1、29-2、49-1~49-5...信號路徑
40...漫射信號處理器/漫射信號產生器
41...混合器/方框
42...方框
43...解相關器

Claims (10)

  1. 一種用以由N個輸入音訊信號推導出M個輸出音訊信號來呈現一漫射聲場的方法,其中M大於N且大於二,且其中該方法包含以下步驟:接收該等N個輸入音訊信號;由該等N個輸入音訊信號推導出K個中間音訊信號使得每一中間信號與該等N個輸入音訊信號在心理聲學上解相關,且若K大於一,則與所有其他中間信號在心理聲學上解相關,其中K大於或等於一且小於或等於M-N;及將該等N個輸入音訊信號與該等K個中間信號混合以推導出M個輸出音訊信號,其中該混合依據一線性方程式系統而被執行,該等線性方程式系統具有指定一M維空間中的一組N+K個向量的一矩陣的係數,且其中該等N+K個向量中的至少K個向量與該組中的所有其他向量大體上正交。
  2. 如申請專利範圍第1項所述之方法,其藉由延遲該等N個輸入音訊信號中之一者來推導出該等K個中間信號中的每一者。
  3. 如申請專利範圍第1項所述之方法,其藉由一包含以下步驟的方法來推導出一各別的中間信號:將該等N個輸入音訊信號中的一輸入音訊信號濾波,其係依據一第一頻率次頻帶中的一第一脈衝響應以獲得具有一頻率相依相位變化的一第一次頻帶信號,該 頻率相依相位變化具有一雙模態頻率分佈,其中波峰實質上等於正及負九十度,以及依據一第二頻率次頻帶中的一第二脈衝響應以獲得具有一頻率相依延遲的一第二次頻帶信號,其中:該第二脈衝響應不同於該第一脈衝響應,該第二頻率次頻帶包括高於包括在該第一頻率次頻帶中之頻率的頻率,且該第一頻率次頻帶包括低於包括在該第二頻率次頻帶中之頻率的頻率;及由該第一次頻帶信號與該第二次頻帶信號之一組合而推導出該各別的中間信號。
  4. 如申請專利範圍第1至3項中任一項所述之方法,其中N大於一。
  5. 如申請專利範圍第1至3項中任一項所述之方法,其中:該矩陣包含具有以一第一比例因數β而縮放之係數的針對N個向量的一第一係數子矩陣,及以一或更多個第二比例因數α而縮放之針對K個向量的一第二係數子矩陣;該等N個輸入音訊信號是依據具有該第一子矩陣之係數以該第一比例因數縮放之一線性方程式系統而混合;該等K個中間音訊信號是依據具有該第二子矩陣之係數以該等一或更多個第二比例因數縮放之一線性方程式系統而混合。
  6. 如申請專利範圍第5項所述之方法,其中:針對K個向量的該第二係數子矩陣由一第二比例因數α來縮放;且該第一比例因數及該第二比例因數被選擇成(such that)使得該矩陣之費氏範數係於未以該第一比例因數β縮放的該第一子矩陣之費氏範數之10%內;且
  7. 一種用以獲得用於混合N個輸入音訊信號以推導出M個輸出音訊信號來呈現一漫射聲場之一線性方程式系統的一係數矩陣的方法,其中該方法包含以下步驟:獲得一第一矩陣,該第一矩陣具有指定一M維空間中的一組N個第一向量的係數;推導出該M維空間中的一組K個第二向量,每一第二向量與每一第一向量大體上正交,且若K大於一,則與所有其他第二向量大體上正交;獲得一第二矩陣,該第二矩陣具有指定該組K個第二向量的係數;及將該第一矩陣與第二矩陣連接在一起以獲得一中間矩陣,該中間矩陣具有指定該組N個第一向量與該組K個第二向量之一聯集的係數,其中該信號處理矩陣之係數為該線性方程式系統之係數。
  8. 如申請專利範圍第7項所述之方法,該方法包含將該中間矩陣之係數縮放成使得已縮放中間矩陣之一費氏範 數係於該第一矩陣之一費氏範數之10%內。
  9. 一種用於信號處理之裝置,其包含:一或更多個輸入端,該等輸入端用以接收輸入信號;記憶體;一儲存媒體,其記錄用以進行如申請專利範圍第1至8項中任一項所述之方法的一或更多個指令程式;處理電路,其耦接至該等一或更多個輸入端、該記憶體、該儲存媒體及一或更多個輸出端以執行該等一或更多個指令程式;及一或更多個輸出端,該等輸出端用以傳送輸出信號。
  10. 一種儲存媒體,其記錄可由一裝置執行來進行如申請專利範圍第1至8項中任一項所述之方法的一指令程式。
TW099144459A 2010-01-22 2010-12-17 針對改良多通道上混使用多通道解相關之技術 TWI444989B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US29769910P 2010-01-22 2010-01-22

Publications (2)

Publication Number Publication Date
TW201140561A TW201140561A (en) 2011-11-16
TWI444989B true TWI444989B (zh) 2014-07-11

Family

ID=43766522

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099144459A TWI444989B (zh) 2010-01-22 2010-12-17 針對改良多通道上混使用多通道解相關之技術

Country Status (12)

Country Link
US (1) US9269360B2 (zh)
EP (1) EP2526547B1 (zh)
JP (1) JP5612125B2 (zh)
KR (1) KR101380167B1 (zh)
CN (1) CN102714039B (zh)
AR (1) AR081098A1 (zh)
BR (1) BR112012018291B1 (zh)
ES (1) ES2588222T3 (zh)
MX (1) MX2012008403A (zh)
RU (1) RU2519045C2 (zh)
TW (1) TWI444989B (zh)
WO (1) WO2011090834A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011199847A (ja) * 2010-02-25 2011-10-06 Ricoh Co Ltd 会議システムの端末装置、会議システム
EP2751803B1 (en) * 2011-11-01 2015-09-16 Koninklijke Philips N.V. Audio object encoding and decoding
CN104584588B (zh) * 2012-07-16 2017-03-29 杜比国际公司 用于渲染音频声场表示以供音频回放的方法和设备
CN104025470B (zh) * 2012-12-31 2018-09-07 华为技术有限公司 报告信道状态信息csi的方法、用户设备和基站
GB2509533B (en) * 2013-01-07 2017-08-16 Meridian Audio Ltd Group delay correction in acoustic transducer systems
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
CN104981867B (zh) 2013-02-14 2018-03-30 杜比实验室特许公司 用于控制上混音频信号的通道间相干性的方法
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
JP6192813B2 (ja) * 2013-05-24 2017-09-06 ドルビー・インターナショナル・アーベー オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
KR101760248B1 (ko) 2013-05-24 2017-07-21 돌비 인터네셔널 에이비 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩
TWI557724B (zh) * 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
JP6186503B2 (ja) * 2013-10-03 2017-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション アップミキサーにおける適応的な拡散性信号生成
EP3127109B1 (en) 2014-04-01 2018-03-14 Dolby International AB Efficient coding of audio scenes comprising audio objects
CN105336332A (zh) 2014-07-17 2016-02-17 杜比实验室特许公司 分解音频信号
CN104484559B (zh) * 2014-12-09 2017-07-04 大连楼兰科技股份有限公司 数字信号的解析方法及其解析装置
CN105992120B (zh) 2015-02-09 2019-12-31 杜比实验室特许公司 音频信号的上混音
ES2922373T3 (es) * 2015-03-03 2022-09-14 Dolby Laboratories Licensing Corp Realce de señales de audio espacial por decorrelación modulada
JP6202076B2 (ja) * 2015-12-07 2017-09-27 オンキヨー株式会社 音声処理装置
EP3382702A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
MX2022002320A (es) * 2019-09-03 2022-04-06 Dolby Laboratories Licensing Corp Banco de filtros de audio con componentes de descorrelacion.
US11533560B2 (en) 2019-11-15 2022-12-20 Boomcloud 360 Inc. Dynamic rendering device metadata-informed audio enhancement system
GB202207289D0 (en) 2019-12-17 2022-06-29 Cirrus Logic Int Semiconductor Ltd Two-way microphone system using loudspeaker as one of the microphones

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
MY139849A (en) * 2002-08-07 2009-11-30 Dolby Lab Licensing Corp Audio channel spatial translation
DE10351793B4 (de) 2003-11-06 2006-01-12 Herbert Buchner Adaptive Filtervorrichtung und Verfahren zum Verarbeiten eines akustischen Eingangssignals
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
JP4335752B2 (ja) 2004-06-15 2009-09-30 三菱電機株式会社 擬似ステレオ信号生成装置および擬似ステレオ信号生成プログラム
US8090586B2 (en) 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
US8284961B2 (en) * 2005-07-15 2012-10-09 Panasonic Corporation Signal processing device
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
KR100857102B1 (ko) * 2005-07-29 2008-09-08 엘지전자 주식회사 인코딩된 오디오 신호 생성 및 처리 방법
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US8712061B2 (en) 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
DE102006050068B4 (de) 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
US8705757B1 (en) * 2007-02-23 2014-04-22 Sony Computer Entertainment America, Inc. Computationally efficient multi-resonator reverberation
CN101809654B (zh) 2007-04-26 2013-08-07 杜比国际公司 供合成输出信号的装置和方法
JP5021809B2 (ja) * 2007-06-08 2012-09-12 ドルビー ラボラトリーズ ライセンシング コーポレイション アンビエンス信号成分とマトリックスデコードされた信号成分とを制御可能に結合することによるサラウンドサウンドオーディオチャンネルのハイブリッド導出
MX2010012580A (es) 2008-05-23 2010-12-20 Koninkl Philips Electronics Nv Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.

Also Published As

Publication number Publication date
RU2012134496A (ru) 2014-02-27
EP2526547B1 (en) 2016-07-06
CN102714039A (zh) 2012-10-03
MX2012008403A (es) 2012-08-15
ES2588222T3 (es) 2016-10-31
US9269360B2 (en) 2016-02-23
KR20120102127A (ko) 2012-09-17
RU2519045C2 (ru) 2014-06-10
US20120321105A1 (en) 2012-12-20
JP2013517687A (ja) 2013-05-16
EP2526547A1 (en) 2012-11-28
BR112012018291A2 (pt) 2018-06-05
CN102714039B (zh) 2014-09-10
WO2011090834A1 (en) 2011-07-28
TW201140561A (en) 2011-11-16
KR101380167B1 (ko) 2014-04-02
AR081098A1 (es) 2012-06-13
BR112012018291B1 (pt) 2020-10-27
JP5612125B2 (ja) 2014-10-22

Similar Documents

Publication Publication Date Title
TWI444989B (zh) 針對改良多通道上混使用多通道解相關之技術
EP2174519B1 (en) Method and apparatus for generating a stereo signal with enhanced perceptual quality
EP3739908B1 (en) Binaural filters for monophonic compatibility and loudspeaker compatibility
TWI413109B (zh) 用於上混系統之解相關器
US8175280B2 (en) Generation of spatial downmixes from parametric representations of multi channel signals
JP5524237B2 (ja) 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
AU2017208916B2 (en) Audio enhancement for head-mounted speakers
TWI451772B (zh) 中央聲道音訊呈現技術
US9913036B2 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
EP3611727B1 (en) Enhancement of spatial audio signals by modulated decorrelation
US9794716B2 (en) Adaptive diffuse signal generation in an upmixer
KR20200018717A (ko) 부대역 공간 오디오 향상
US11284213B2 (en) Multi-channel crosstalk processing
JP2007104601A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための装置