TWI845344B - 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法 - Google Patents
從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法 Download PDFInfo
- Publication number
- TWI845344B TWI845344B TW112122168A TW112122168A TWI845344B TW I845344 B TWI845344 B TW I845344B TW 112122168 A TW112122168 A TW 112122168A TW 112122168 A TW112122168 A TW 112122168A TW I845344 B TWI845344 B TW I845344B
- Authority
- TW
- Taiwan
- Prior art keywords
- matrix
- panning
- pan
- decoding
- audio signal
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims description 16
- 239000013598 vector Substances 0.000 claims abstract description 12
- 239000011159 matrix material Substances 0.000 claims description 44
- 238000004091 panning Methods 0.000 abstract description 39
- 238000005070 sampling Methods 0.000 abstract description 5
- 230000004807 localization Effects 0.000 abstract description 2
- 238000013459 approach Methods 0.000 abstract 1
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000010606 normalization Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Abstract
已知對立體聲擴音器裝備的保真立體音響表示法之解碼,可用於第一階保真立體音響聲頻訊號。但此等第一階保真立體音響解決方略,不是有高度負旁波瓣,便是在前區域有不良局限。本發明涉及高階保真立體音響(HOA)的立體聲解碼器之處理。從擴音器間置設虛擬源之泛移律,可推論所需泛移函數。對於各擴音器,需界定在取樣點對全部可能輸入方向之所需泛移函數。泛移函數係以圓形諧函數概算,提高保真立體音響位階,所需泛移函數即減少誤差。對於擴音器間的前區,使用泛移律,像正切律或向量基準波幅泛移(VBAP)。對於後方向,是以來自此等方向的聲音稍微減弱來界定泛移函數。
Description
本發明係關於使用圓圈上取樣點之泛移函數(panning function),從高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法和裝置。
已知對立體聲擴音器或頭戴式受話器裝備的保真立體音響表示法之解碼,可用於第一階保真立體音響,例如J.S.Bamford,J.Vender-kooy合著〈為我等之保真立體音響聲音〉中之方程式(10),見音響工程協會預刊本,第99屆會議提出論文4138,1995年10月,紐約,以及XiphWiki-Ambisonics http://wiki.xiph.org/index.php/Ambisonics#Default_channel_conversions_from_B-Format
。此等解決方略係根據英國專利394325號揭示之Blumlein立體聲。另一解決方略是使用模態匹配:M.A.Poletti〈根據球形諧波之三維周圍聲音系統〉,J.Audio Eng.Soc.,vol.53(11),pp.1004-1025,2005年11月。
此等第一階保真立體音響解決方略具有高度負旁波瓣(negative side lobes),一如根據Blumlein立體聲之保真立體音響解碼器(GB 394325),其虛擬麥克風有8字形態(參見S.Weinzierl著《聲頻技術手冊》第3.3.4.1節,柏林Springer出版社,2008),或在前方向之不良局限。以負旁波瓣,例如來自正背後方向之聲音客體,會在左方立體聲擴音器回放。
本發明要解決的問題是,提供具有改進立體聲訊號輸出之保真立體音響訊號解碼。此問題是以申請專利範圍第1和2項揭示之方法解決。利用此等方法之裝置載於申請專利範圍第3項。
本發明記載高階保真立體音響HOA聲頻訊號的立體聲解碼器之處理。所需泛移函數可由擴音器間置設虛擬源之泛移律推衍。對各擴音器,要界定對全部可能輸入方向之所需泛移函數。保真立體音響解碼矩陣之計算,類似J.M.Batke,F.Keiler的相對應說明,見〈使用VBAP衍生之泛移函數於3D保真立體音響解碼〉,第二屆國際保真立體音響和球形聲學會議議事錄,2010年5月6-7
日,法國巴黎,URL http://ambisonics10.ircam.fr/drupal/files/proceedings/presentations/O14_47.pdf,以及WO 2011/117399 A1。泛移函數係利用圓形諧函數概算,提高保真立體音響位階,所需泛移函數隨著降低誤差。尤其是對介置於擴音器間的前區,可用泛移律,像正切律或向量基準波幅泛移(VBAP)。對於背面超越擴音器位置之方向,使用泛移函數,來自此等方向的聲音稍微減弱。特別情況是使用對背面方向針對擴音器方向的半心臟形態。在本發明中,特別在前區開拓高階保真立體音響之較高空間解像度,而且在背面方向的負旁波瓣減弱,隨保真立體音響位階提高而增加。
本發明亦可用於有二個擴音器以上排成半圓形,或小於半圓之圓形段之擴音器裝備。又可方便對立體音的技巧性混合調降通道數(artistic downmixes),使有些空間區域接收到更加減弱。此舉有利於創造改進直接音對擴散音之比,以致對話更為清晰。
本發明立體聲解碼器符合若干重要性質:擴音器間前方向之良好局限,所得泛移函數只有小負旁波瓣,以及背方向之輕微減弱。又可減弱或遮蔽空間區域,否則在諦聽二通道版時,會感受到干擾或困擾。
與WO 2011/117399 A1相較之下,所需泛移函數界定為圓形弓段方式,在介入擴音器中間的前區域內,可用公知的泛移處理(例如VBAP或正切律),而在後方向可稍微減弱。使用第一階保真立體音響解碼器時,
此等性質不宜用。
原則上,本發明方法適於從第一階保真立體音響聲頻訊號 a (t)解碼立體聲擴音器訊號 l (t),該方法包含步驟為:
決定該保真立體音響聲頻訊號 a (t)的位階 N ;
從該矩陣 G 和Ξ+計算解碼矩陣 D = G Ξ+;
計算擴音器訊號 l (t)= Da (t)。
原則上,本發明方法適於從2-D高階保真立體音響聲頻訊號 a (t),決定可用於解碼立體聲擴音器訊號 l (t)= Da (t)之解碼矩陣 D ,該方法包含步驟為:
接收該保真立體音響聲頻訊號 a (t)之位階 N ;
從該矩陣 G 和Ξ+計算解碼矩陣 D = G Ξ+。
原則上,本發明裝置適於從高階保真立體音響聲頻訊號 a (t),解碼立體聲擴音器訊號 l (t),該裝置包含:
適於決定該保真立體音響聲頻訊號 a (t)的位階 N 之機構;
適於從該矩陣 G 和Ξ+計算解碼矩陣 D = G Ξ+之機構;
適於計算擴音器訊號 l (t)= Da (t)之機構。
本發明有益之其他具體例,載於申請專利範圍各附屬項。
51:計算所需泛移函數
52:取得位階
53:計算模態矩陣
54:計算模態擬似反逆
55:計算解碼矩陣
56:計算擴音器訊號
57:3D變換成2D(視情形)
第5圖為本發明處理之方塊流程圖。
茲參照附圖說明本發明具體例。
解碼處理第一步驟,必須界定諸擴音器的位置。假設諸擴音器與聆聽位置的距離相同,因而擴音器位置是以方位角界定。此方位角以標示,按反時鐘方向測量。左、右擴音器之方位角為和,呈對稱配置 。典型度數為。在下述說明中,所有度數可解釋為2π(弧度)整數倍數或360°之偏差值。
圓圈上之虛擬取樣點有待界定。此等為保真立體音響解碼處理中所用虛擬源方向,為此等方向對例如二真實擴音器位置界定所需泛移函數值。虛擬取樣點以 S
標示,相對應方向等距分佈於圓圈周圍,導致
左右擴音器所需泛移函數和,需加以界定。與WO 2011/117399 A1和上述Batke/Keiler論文之策略相反的是,泛移函數係為複數節而界定,其中諸節使用不同泛移函數。例如,對於使用三節之所需泛移函數:
(a)對二擴音器間之前方向,使用公知泛移律,例如正切律,或等效之向量基準波幅泛移(VBAP),如V.Pulkki在〈使用向量基準波幅泛移之虛擬聲音源定位〉所述,J.Audio Eng.Society,45(6),第456-466頁,1997年6月。
(b)對超過擴音器圓圈段位置之方向,界定背方向之稍微減弱,因而此部份泛移函數在擴音器位置大約對立角度,接近零值。
(c)其餘部份之所需泛移函數設定於零,以避免右邊聲音回放到左邊擴音器,和左邊聲音回放到右邊擴音器。
所需泛移函數在虛擬取樣點取樣。含有全部虛擬取樣點所需泛移函數之矩陣界定為:
實質或複值保真立體音響圓形諧函數為,其中m=-N,...,N,而 N 為上述保真立體音響位階。圓形諧波係以球形諧波的方位角依賴性部份表示,參見Earl G.Williams〈傅立葉聲學〉,應用學數科學第93卷,學術出版社,1999年。
以實值圓形諧波:
圓形諧波在向量上組合:
D = G Ξ+ (14)Ξ+係矩陣Ξ之擬似反逆。對於方程式(1)內所指定同等分佈的虛擬取樣點,其擬似反逆可改為ΞH定標版,係Ξ之伴隨(轉置和複共軛)。在此情況,解碼矩陣為:
D =α G Ξ H (15)其中定標因數 α 視圓形諧波之常態化綱要和設計方向數 S 而定。
向量 l (t)代表在時點t的擴音器樣本訊號,由下式計算:
l (t)= Da (t) (16)
當使用3維度高階保真立體音響訊號 a (t)為輸入訊號時,施以適當變換為2維度空間,得變換後保真立體音響係數 a '(t)。在此情況,方程式(16)改變成 l (t)= Da '(t)。
亦可界定已包含3D/2D變換之矩陣 D 3D ,直接應用於保真立體音響訊號 a (t)。
以下說明之實施例,為立體聲擴音器裝備之
泛移函數。介於擴音器位置之間,使用方程式(2)和(3)所得泛移函數和,以及按照VBAP之泛移增益。此等泛移函數連續半心臟形態,其最大值在擴音器位置。界定角度和,以便具有在擴音器位置之對立位置:
為評估解碼,對隨意輸入方向所得泛移函數,由下式求得:
W = Dγ (21)其中γ為所考慮輸入方向之模態矩陣。 W 為應用保真立體音響解碼過程時,含有所用輸入方向和所用擴音器位置所用泛移權值之矩陣。
第1和2圖分別繪示所需(即理論上或是完美)泛移函數對照線性角度比例尺以及極座標格式。所得保真立體音響之泛移權值,係為所用輸入方向,使用方程式(21)算出。第3和4圖分別表示為計算保真立體音響位階N=4,相對應所得泛移函數對照線性角度比例尺,以及極座標格式。就第3和4圖與第1和2圖比較,顯示所需泛移函數很相配,而所得負旁波瓣很小。
以下提供複值球形和圓形諧波由3D變換成2D
之例(實值基函數可按類似方式進行)。3D保真立體音響之球形諧波為:
在第5圖,所需泛移函數之計算步驟51,接收左、右擴音器之方位角和度數,以及虛擬取樣點數 S ,由此按上述計算矩陣 G ,含有全部虛擬取樣點之所需泛移函數值。在步驟52,從保真立體音響訊號a(t)推算位階 N 。在步驟53,根據方程式(11)至(13),從 S 和 N 計算模態矩陣Ξ。步驟54計算矩陣Ξ計算擬似反逆Ξ+。在步驟55,按照方程式(15),從矩陣 G 和Ξ+計算解碼矩陣 D 。在步驟56,使用解碼矩陣 D ,從保真立體音響訊號a(t)計算擴音器訊號l(t)。若保真立體音響輸入訊號 a (t)為三維度空間訊號,在步驟57進行3D變換為2D,而步驟56接收2D保真立體音響訊號 a '(t)。
51:計算所需泛移函數
52:取得位階
53:計算模態矩陣
54:計算模態擬似反逆
55:計算解碼矩陣
56:計算擴音器訊號
57:3D變換成2D(視情形)
Claims (5)
- 一種用於解碼高階保真立體音響(HOA)聲頻訊號的方法,所述方法包含:接收所述HOA聲頻訊號;確定泛移函數值的矩陣G,其中對於球面上的虛擬取樣點的數目S中之各者,所述矩陣G含有增益向量g 1 ...g s ,其中至少位於與擴音器位置相對的第一虛擬取樣點的第一泛移函數值接近零,而至少位於靠近所述擴音器位置的第二來源的第二泛移函數值具有不接近零的值;以及基於所述矩陣G來確定解碼矩陣;以及藉由至少一個處理器,基於所述解碼矩陣將所述HOA聲頻訊號轉列為立體聲擴音器訊號。
- 如請求項1的方法,其中所述矩陣G的大小為L x S,其中L對應於擴音器的數目。
- 如請求項2的方法,其中所述增益向量g 1 ...g s 係用以在L個擴音器的S個方向上實現泛移混合。
- 一種其上儲存有指令的非暫態電腦可讀取媒體,當所述指令由一或多個處理器執行時,使一或多個處理器用以執行如請求項1的方法。
- 一種用於解碼高階保真立體音響(HOA)聲頻訊號的設備,所述設備包含:第一接收器,其配置成接收所述HOA聲頻訊號;第一處理器,其用於確定泛移函數值的矩陣G,其中 對於球面上的虛擬取樣點的數目S中之各者,所述矩陣G含有增益向量g 1 ...g s ,其中至少位於與擴音器位置相對的第一虛擬取樣點的第一泛移函數值接近零,而至少位於靠近所述擴音器位置的第二來源的第二泛移函數值具有不接近零的值;以及第二處理器,其用於基於所述矩陣G來確定解碼矩陣;以及轉列器,其用於基於所述解碼矩陣將所述HOA聲頻訊號轉列為立體聲擴音器訊號。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12305356.3 | 2012-03-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202416269A TW202416269A (zh) | 2024-04-16 |
TWI845344B true TWI845344B (zh) | 2024-06-11 |
Family
ID=
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200822781A (en) | 2006-09-25 | 2008-05-16 | Dolby Lab Licensing Corp | Improved spatial resolution of the sound field for multi-channel audio playback systems by deriving signals with high-order angular terms |
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW200822781A (en) | 2006-09-25 | 2008-05-16 | Dolby Lab Licensing Corp | Improved spatial resolution of the sound field for multi-channel audio playback systems by deriving signals with high-order angular terms |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI775497B (zh) | 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法 | |
TWI845344B (zh) | 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法 | |
TW202416269A (zh) | 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法 | |
KR102678270B1 (ko) | 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치 | |
KR20240100475A (ko) | 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치 |