TW201735667A - 一種獲得空間音訊定向向量的方法、裝置及設備 - Google Patents
一種獲得空間音訊定向向量的方法、裝置及設備 Download PDFInfo
- Publication number
- TW201735667A TW201735667A TW105134696A TW105134696A TW201735667A TW 201735667 A TW201735667 A TW 201735667A TW 105134696 A TW105134696 A TW 105134696A TW 105134696 A TW105134696 A TW 105134696A TW 201735667 A TW201735667 A TW 201735667A
- Authority
- TW
- Taiwan
- Prior art keywords
- vector
- proportional constant
- sound
- audio
- spatial audio
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
本發明涉及一種獲得空間音訊定向向量的方法、裝置及設備,其中獲得空間音訊定向向量的方法包括:決定多音響系統中聲源的位置;設定參數;其中所述參數包括:人的反應時間△t、容差率δ;從所述聲源中獲得聲音信號;利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量□。在實際應用中,根據所述空間音訊定向向量□的模來決定比例常數D,所述比例常數D為多音訊信號對應的虛擬影像提供深度方面的空間資訊,所述空間音訊定向向量□的向量角θE為多音訊信號對應的虛擬影像提供方向方面的空間資訊,提高觀眾的觀賞感。
Description
本發明涉及聲信號處理技術領域,特別涉及一種獲得空間音訊定向向量的方法、裝置及設備。
在視聽技術的發展歷史上,從多角度多頻道音訊技術獨立開發(如多平面三維,360° VR等)顯示技術一直是個熱門領域。隨著環繞聲的普及,比如:杜比5.1、7.1和最先進的環繞聲系統更是高達22.2的24個揚聲器,多平面三維顯示、VR、AR和MR(混合現實)是一種全新的用戶體驗,如何滿足觀眾對聲音方向/深度資訊的需要是急需解決的問題。
本發明實施例的主要目的在於提出一種獲得空間音訊定向向量的方法、裝置及設備,提高觀眾對聲音方面的體驗度。
為實現上述目的,本發明提供了一種獲得空間音訊定向向量的方法,包括:決定多音響系統中聲源的位置;設定參數;其中所述參數包括:人的反應時間△t、容差率δ;從所述聲源獲得聲音信號;
利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
優選地,還包括:根據所述空間音訊定向向量,決定向量的向量角θ E 。
優選地,還包括:根據向量角θ E ,決定比例常數D的取值範圍;根據比例常數D的取值範圍決定比例常數D的取值。
優選地,所述空間音訊定向向量根據向量集合R中元素的個數決定;其中
集合R的表達方式為:;其中
,1 j J,
,;根
據第j個聲道的信號波形在每一時間段△t內所有採樣點所對應的幅值的平方的總和決定;J表示多音響系統中聲道的總個數;j表示多音響系統中聲道的索引值;
當集合R中有且只有一個元素時,;當
集合R中至少有兩個元素時,通過向量集合R中的各向量
相加決定;其中表示第j個聲道的時間段△t內對應的
信號向量。
優選地,所述比例常數D的取值範圍為:當-90° θ E 90°時,則0<D 1;當-180° θ E <-90°或90°<θ E 180°,則-1 D<0。
優選地,所述比例常數D的取值為:當0<D 1時,則比例常數D根據向量的模、集合R中每個向量模的平方之和決定;當-1 D<0時,則比例常數D根據向量的模、集合R中每個向量模的平方之和的基礎上取負決定。
優選地,還包括:當輸入至多音響系統的實際聲頻不符合所述多音響系統所需聲頻要求時,對輸入至多音響系統的實際聲頻通過彙總函式或者分解函數進行處理,變換成符合所述多音響系統所需要的聲頻要求。
對應地,為實現上述目的,本發明還提供了一種獲得空間音訊定向向量的裝置,包括:聲源決定單元,用於決定多音響系統中聲源的位置;參數決定單元,用於設定參數;其中所述參數包括:人的反應時間△t、容差率δ;聲音信號獲取單元,用於從所述聲源獲得聲音信號;空間音訊定向向量獲取單元,用於利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
優選地,還包括:空間音訊定向向量角獲取單元,用於根據所述空間音訊定向向量,決定向量的角度θ E 。
優選地,還包括:比例常數取值範圍單元,用於根據角度θ E ,決定比例常數D的取值範圍;比例常數取值單元,用於根據比例常數D的取值範圍決定比例常數D的取值。
優選地,所述空間音訊定向向量獲取單元根據
向量集合R中元素的個數決定空間音訊定向向量;其中
集合R的表達方式為:;其中
,1 j J,
,;根
據第j個聲道的信號波形在每一時間段△t內所有採樣點所對應的幅值的平方的總和決定;J表示多音響系統中聲道的總個數;j表示多音響系統中聲道的索引值;
當集合R中有且只有一個元素時,;當
集合R中至少有兩個元素時,通過向量集合R中的各向量
相加決定;其中表示第j個聲道的時間段△t內對應的
信號向量。
優選地,所述比例常數取值範圍單元決定的比例常數D的取值範圍為:當-90° θ E 90°時,則0<D 1;當-180° θ E <-90°或90°<θ E 180°,則-1 D<0。
優選地,所述比例常數取值單元決定的比例常數D的取值為:
當0<D 1時,則比例常數D根據向量的模、集合R中每個向量模的平方之和決定;當-1 D<0時,則比例常數D根據向量的模、集合R中每個向量模的平方之和的基礎上取負決定。
優選地,還包括:預處理單元,用於當輸入至多音響系統的實際聲頻不符合所述多音響系統所需聲頻要求時,對輸入至多音響系統的實際聲頻通過彙總函式或者分解函數進行處理,變換成符合所述多音響系統所需要的聲頻要求。
為實現上述目的,本發明還提供了一種設備,其中所述設備包括上述所述的獲得空間音訊定向向量的裝置。
上述技術方案具有如下有益效果:通過本技術方案獲得空間音訊定向向量,運用該向量為環繞音訊信號對應的虛擬影像提供深度和方向方面的空間資訊,實現音訊信號與影像的匹配,提高觀眾的觀賞感。另外,可以根據空間音訊定向向量對家用多音響系統進行調整,最佳化音箱和用戶之間的關係,提高用戶的體驗度。
101‧‧‧方法/步驟
102‧‧‧方法/步驟
103‧‧‧方法/步驟
104‧‧‧方法/步驟
105‧‧‧方法/步驟
106‧‧‧方法/步驟
107‧‧‧方法/步驟
701‧‧‧方塊/裝置
702‧‧‧方塊/裝置
703‧‧‧方塊/裝置
704‧‧‧方塊/裝置
705‧‧‧方塊/裝置
706‧‧‧方塊/裝置
707‧‧‧方塊/裝置
a‧‧‧記憶體
b‧‧‧處理器
為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域一般技藝人士
來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本發明實施例提供的方法流程示意圖之一;圖2為本發明實施例提供的方法流程示意圖之二;圖3為本發明實施例提供的方法流程示意圖之三;圖4為比例常數D為正值時的空間音訊定向向量示意圖;圖5為比例常數D為負值時的空間音訊定向向量示意圖;圖6為本發明實施例提供的裝置方塊圖之一;圖7為本發明實施例提供的裝置方塊圖之二;圖8為本發明實施例提供的裝置方塊圖之三;圖9為本發明實施例提供的設備方塊圖;圖10為本實施例為裸眼下的3D音視頻系統示意圖;圖11為本實施例的分析示意圖之一;圖12為本實施例的分析示意圖之二;圖13為本實施例的參數設置示意圖。
下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描
述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域一般技藝人士在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
本領域技藝人士知道,本發明的實施方式可以實現為一種系統、裝置、設備、方法或電腦程式產品。因此,本案可以具體實現為以下形式,即:完全的硬體、完全的軟體(包括韌體、常駐軟體、微代碼等),或者硬體和軟體結合的形式。
根據本發明的實施方式,提出了一種獲得空間音訊定向向量的方法、裝置及系統。
在本文中,需要理解的是,所涉及的術語中:
1、多聲道:在多音響系統上使用多個音軌重建聲音。在系統中,根據音軌的數量設置不同種類的揚聲器或音箱,兩個數位通過一個小數點分開,用來分類不同的音響系統。比如:2.1聲道、5.1聲道、7.1聲道、22.1聲道等。
2、向量:包括向量大小和向量角。比如:向
量R=x+iy;向量大小通過表示,向量角通過表示。
此外,附圖中的任何元素數量均用於示例而非限制,以及任何命名都僅用於區分,而不具有任何限制含義。
下面參考本發明的若干代表性實施方式,詳細闡釋本發明的原理和精神。
本技術方案涉及一種設備、方法和裝置,用於將多頻道音訊輸入信號轉換成空間資訊。以下我們稱之為空間音訊定向向量。多聲音音訊信號可為5.1環繞聲信號、7.1環繞聲信號或10.1環繞聲信號等等。空間音訊定向向量是任何給定的時間內多通道信號中的主音訊信號,該主音訊信號能夠被用來控制3D圖像的深度或3D視頻的深度、以及在三維顯示、噴泉表演,廣告和互動設備這些方面的應用,對觀眾的感知方面帶來最大的影響。
在介紹了本發明的基本原理之後,下面具體介紹本發明的各種非限制性實施方式。
在三維、音視頻系統中的應用方面,根據空間音訊定向向量的比例常數D,決定3D影像呈現在顯示螢幕前面還是在顯示螢幕後面,可以為環繞音訊信號的深度和方向方面提供空間資訊,實現音訊信號與三維影像的匹配,提高觀眾的觀賞感。
對於噴泉主題公園來說,根據噴泉音樂音訊獲得空間音訊定向向量,空間音訊定向向量可以在噴泉運動或互動投影圖像方面提供附加方向,該附加方向為空間音訊定向向量的方向,該方向通過向量角θ E 表示。隨著
音樂的變化,噴泉噴射方向可以在0°~360°之間變化,提高觀眾的觀賞感。
在虛擬實境中,例如以互動遊戲為例,遊戲以玩家為中心點,聆聽著多音響系統擋放的音樂,玩家前方可以看到前置的左方位、中間、右方位的揚聲器,玩家後方有後置的左方位、右方位的揚聲器。蝴蝶作為目標,它根據空間音訊定向向量的方向呈現在遊戲中,玩家可通過頭部移動描准目標(蝴蝶),便可累積得分。在該應用場景中,空間音訊定向向量的方向為向量角θ E 。
下面結合應用場景,參考圖1、圖2、圖3分別對本發明示例性實施方式的方法進行介紹。
需要注意的是,上述應用場景僅是為了便於理解本發明的精神和原理而示出,本發明的實施方式在此方面不受任何限制。相反,本發明的實施方式可以應用於適用的任何場景。
參見圖1,為本發明實施例提供的方法流程示意圖之一。如圖所示,獲得空間音訊定向向量的方法的步驟包括:步驟101):決定多音響系統中聲源的位置;在本實施例中,當輸入至多音響系統的實際聲頻不符合所述多音響系統所需聲頻要求時,對輸入至多音響系統的實際聲頻通過彙總函式或者分解函數進行處理,變換成符合所述多音響系統所需要的聲頻要求。
步驟102):設定參數;其中所述參數包括:人的反應時間△t、容差率δ;步驟103):從所述聲源獲得聲音信號;步驟104):利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
在技術方案中,獲得的空間音訊定向向量是該通道中聲音能量最強的聲音信號。
對於本實施例來說,步驟104獲得的每一時間段△t內對應的空間音訊定向向量是根據向量集合R中元素的個數決定;其中
集合R的表達方式為:;其中
,1 j J,
,;根據第j個聲道的信號波形
在每一時間段△t內所有採樣點所對應的幅值的平方的總和決定的;J表示多音響系統中聲道的總個數;j表示多音響系統中聲道的索引值;
當集合R中有且只有一個元素時,;當
集合R中至少有兩個元素時,通過向量集合R中的各向量
相加決定;其中表示第j個聲道的時間段△t內對應的
信號向量。
比如:在一單聲道裡傳輸的聲音信號的頻率為44100Hz,這就意味著聲音信號一秒內有44100個採樣點。那麼,在0.25秒內有11025個採樣點。如果設定△t=0.25
s。那麼在每一0.25s內,是基於信號波形內11025
個採樣點各自對應的幅值的平方的總和決定的。然後利用上述步驟104的演算法決定每一0.25s內對應的空間音訊定向向量。
圖2為本發明實施例提供的方法流程示意圖之二。在圖1的基礎上,還包括:步驟105):根據所述空間音訊定向向量,決定向量的角度θ E 。
對於本步驟來說,根據空間音訊定向向量就可以直接決定該向量的向量角。
圖3為本發明實施例提供的方法流程示意圖之三。在圖2的基礎上,還包括:步驟106):根據角度θ E ,決定比例常數D的取值範圍;如圖4所示,比例常數D為正值時的空間音訊定向向量示意圖。當-90° θ E 90°時,則0<D 1;如圖5所示,比例常數D為負值時的空間音訊定向向量示意圖。當-180° θ E <-90°或90°<θ E 180°,則-1 D<0。
步驟107):根據比例常數D的取值範圍決定比例常數D的取值。
當0<D 1時,則;當-1 D<0時,
則。
其中表示向量的模。表示集合R
中每個向量模的平方之和。
當-1 D<0時,虛擬影像呈現在顯示螢幕後方
,呈現的虛擬影像到顯示螢幕的距離h總的離散個數為
。其中△z根據z決定。目標離散間隔數為。當0<D 1時
,虛擬影像呈現在顯示螢幕前方,呈現的虛擬影像到顯示
螢幕的距離H總的離散個數為,目標離散間隔數為
。在本實施例中,H表示虛擬影像到顯示螢幕前方的距離最大值,h表示虛擬影像到顯示螢幕後方的距離最大值。對H、h進行離散處理,虛擬影像呈現在以顯示帶幕為起
點相應方向的第個△z位置處。比如:比例常數D決定
為1,且△z為2,H取值為8,則決定為4,則表示該虛
擬影像會在顯示螢幕前方的第4個△z位置處呈現。比例常
數D決定為-0.5,且△z為2,h取值為6,則決定為1,
則表示該虛擬影像會在顯示螢幕後方的第1個△z位置處呈現。
應當注意,儘管在附圖中以特定順序描述了本發明方法的操作,但是,這並非要求或者暗示必須按照該特定順序來執行這些操作,或是必須執行全部所示的操作才能實現期望的結果。附加地或備選地,可以省略某些步驟,將多個步驟合併為一個步驟執行,及/或將一個步驟分解為多個步驟執行。
在介紹了本發明示例性實施方式的方法之後,接下來,參考圖7、圖8、圖9分別對本發明示例性實施方式的裝置進行介紹。
如圖6所示,為本發明實施例提供的裝置方塊圖之一。獲得空間音訊定向向量的裝置包括:聲源決定單元601,用於決定多音響系統中聲源的位置;在本實施例中,當輸入至多音響系統的實際聲頻不符合所述多音響系統所需聲頻要求時,聲源決定單元601,還用於對輸入至多音響系統的實際聲頻通過彙總函式或者分解函數進行處理,變換成符合所述多音響系統所需要的聲頻要求。
參數決定單元602,用於設定參數;其中所述參數包括:人的反應時間△t、容差率δ;聲音信號獲取單元603,用於從所述聲源獲得聲音信號;空間音訊定向向量獲取單元604,用於利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
對於本實施例來說,空間音訊定向向量獲取單元604獲得的每一時間段△t內對應的空間音訊定向向量是根據向量集合R中元素的個數決定;其中
集合R的表達方式為:;其中
,1 j J,
,;根據第j個聲道的信號波形
在每一時間段△t內所有採樣點所對應的幅值的平方的總和決定;J表示多音響系統中聲道的總個數;j表示多音響系統中聲道的索引值;
當集合R中有且只有一個元素時,;當
集合R中至少有兩個元素時,通過向量集合R中的各向量
相加決定;其中表示第j個聲道的時間段△t內對應的
信號向量。
在獲得空間音訊定向向量之後,對空間音訊定向向量進行處理,獲得角度θ E 和比例常數D。那麼,如圖7所示,為本發明實施例提供的裝置方塊圖之二。在圖6的基礎上,還包括:空間音訊定向向量角獲取單元605,用於根據所述空間音訊定向向量,決定向量的角度θ E 。
對於本實施例來說,空間音訊定向向量角獲取單元605根據空間音訊定向向量就可以直接決定該向量的向量角。
如圖8所示,為本發明實施例提供的裝置方塊圖之三。在圖7的基礎上,還包括:比例常數取值範圍單元606,用於根據角度θ E ,決定比例常數D的取值範圍;比例常數取值單元607,用於根據比例常數D的取值範圍決定比例常數D的取值。
對於本實施例來說,當-90° θ E 90°時,則比例常數取值範圍單元606決定比例常數D的取值範圍為
0<D 1,比例常數取值單元607通過運算式
決定比例常數取值;當-180° θ E <-90°或90°<θ E 180°,則比例常數取值範圍單元606決定比例常數D的取值範圍為
-1 D<0,比例常數取值單元607通過運算式
決定比例常數取值。
在上述基礎上,當-1 D<0時,虛擬影像呈現在顯示螢幕後方,呈現的虛擬影像到顯示螢幕的距離h總
的離散個數為。其中△z根據z決定。目標離散間隔數為
。當0<D 1時,虛擬影像呈現在顯示螢幕前方,呈現
的虛擬影像到顯示螢幕的距離H總的離散個數為,目標
離散間隔數為。在本實施例中,H表示虛擬影像到顯
示螢幕前方的距離最大值,h表示虛擬影像到顯示螢幕後方的距離最大值。對H、h進行離散處理,虛擬影像呈現
在以顯示螢幕為起點相應方向的第個△z位置處。比如
:比例常數D決定為1,且△z為2,H取值為8,則決定
為4,則表示該虛擬影像會在顯示螢幕前方的第4個△z位置處呈現。比例常數D決定為-0.5,且△z為2,h取值為6,
則決定為1,則表示該虛擬影像會在顯示螢幕後方的
第1個△z位置處呈現。
此外,儘管在上文詳細描述中提及裝置的若干單元,但是這種劃分僅僅並非強制性的。實際上,根據本發明的實施方式,上文描述的兩個或更多單元的特徵和功能可以在一個單元中具體化。同樣,上文描述的一個單元的特徵和功能也可以進一步劃分為由多個單元來具體化。
基於上述示例性裝置和方法,本實施例還提出一種設備,如圖9所示。該系統用於獲得空間音訊定向向量;包括:記憶體a,用於儲存請求指令;處理器b,其與所述記憶體耦合,該處理器被配置為執行儲存在所述記憶體中的請求指令,其中所述處理器被配置的應用程式用於:決定多音響系統中聲源的位置;設定參數;其中所述參數包括:人的反應時間△t、容差率δ;從所述聲源獲得聲音信號;利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
對空間音訊定向向量作進一步處理,處理器b進一步被配置的應用程式還用於:根據所述空間音訊定向向量,決定向量的角度θ E ;根據角度θ E ,決定比例常數D的取值範圍;
根據比例常數D的取值範圍決定比例常數D的取值。
本發明實施例還提供一種電腦可讀程式,其中當在電子設備中執行所述程式時,所述程式使得電腦在所述電子設備中執行如圖1、圖2、以及圖3之獲得空間音訊定向向量的方法。
本發明實施例還提供一種儲存有電腦可讀程式的儲存媒體,其中所述電腦可讀程式使得電腦在電子設備中執行如圖1、圖2、以及圖3之獲得空間音訊定向向量的方法。
為了能夠更加直觀的描述本發明的特點和工作原理,下文將結合一個實際運用場景來描述。
如圖10所示,為本實施例為裸眼下的3D音視頻系統示意圖。該應用涉及SADeVTM實驗,目標是:在裸眼下的3D音視頻系統下運用空間音訊定向向量來提高觀眾的體驗度。
在本實施例中,以5.1聲道為例。5.1聲道是指中央聲道,前置左、右聲道、後置左、右環繞聲道,及所謂的0.1聲道重低音聲道。一套系統總共可連接6個喇叭。5.1聲道已廣泛運用於各類傳統影院和家庭影院中,一些比較知名的聲音錄製壓縮格式,譬如杜比AC-3(Dolby Digital)、DTS等都是以5.1聲音系統為技術藍本的,其中「0.1」聲道,則是一個專門設計的超低音
聲道,這一聲道可以產生頻響範圍20~120Hz的超低音。5.1聲道就是使用5個喇叭和1個超低音揚聲器來實現一種身臨其境的音樂播放方式,它是由杜比公司開發的,所以叫做「杜比5.1聲道」。在5.1聲道系統裡採用左(L)、中(C)、右(R)、左後(LS)、右後(RS)五個方向輸出聲音,使人產生猶如身臨音樂廳的感覺。五個聲道相互獨立,其中「.1」聲道,則是一個專門設計的超低音聲道。正是因為前後左右都有喇叭,所以就會產生被音樂包圍的真實感。
假設:
1、五個相同型號的揚聲器,該揚聲器設置在前方、中央、四周等。
2、對於聽眾來說,離上述五個揚聲器的距離均相同。
3、根據觀眾的視線方向的角度調整:中央(C)角度為0°,左方(L)角度為-θF,右方(R)角度為θF,左後方(SL)角度為-θS,右後方(SR)角度為θS。
如圖11所示,為本實施例的分析示意圖之一。在圖12中,以螢幕為參照物,outward表示3D影像呈現在螢幕的前方的方向,inward表示3D影像呈現在螢幕的後方的方向。比例常數D取值情況會影響虛擬影像在顯示螢幕的前方還是後方呈現。H表示虛擬影像到顯示螢幕
前方的距離最大值,h表示虛擬影像到顯示螢幕後方的距離最大值。H、h兩個參數均人為設置。
如圖12所示,為本實施例的分析示意圖之二。利用本實施例的方法和/裝置,設定下列參數。
δ:容差率,取值δ>0;在本實施例中,δ=0.2。
△t:時間間隔;在本實施例中,△t=2s。
θF:前置左、右聲道的位置角;在本實施例中,θF的絕對值為30°。
θS:後置左、右環繞聲道的位置角。在本實施例中,θS的絕對值為120°。
在圖13的下方,顯示出5個聲道傳輸的聲信號的波形。第一幅波形圖是左前方聲道的信號波形圖,第二幅波形圖是右前方聲道的信號波形圖,第三幅波形圖是中央聲道的信號波形圖,第四幅波形圖是左後方聲道的信號波形圖,第五幅波形圖是右後方聲道的信號波形圖。經過本技術方案處理,得到比例常數D在不同的時間段內的取值情況。通過圖13下方的第六幅圖展示。
有一段音訊,多音響系統出廠設置下錄製。出廠設置的意思是;錄音訊時音箱所擺放的特定位置。運用本技術方案獲得出廠設置下的比例常數D1。當使用者通過家用5.1多音響系統播放這一音訊時,用戶所設置的音箱的位置未必是出廠設置的位置。為了提高觀眾的體驗度,用戶可以自行設定音箱位置,播放這一音訊,再通過本
技術方案獲得比例常數D2.然後比較比例常數D1和比例常數D2之間的大小。如果沒有大的分別,即說明用戶的自行設置跟出廠設置是比較接近的。反之,如果比例常數之間有一定的相差程度,使用者需要繼續調節音箱位置,以便貼近出廠設置。從而最佳化音箱和用戶之間的位置關係,提高用戶的整體體驗度。
以上具體實施方式,對本發明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上僅為本發明的具體實施方式而已,並不用於限定本發明的保護範圍,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明的保護範圍之內。
101‧‧‧方法/步驟
102‧‧‧方法/步驟
103‧‧‧方法/步驟
104‧‧‧方法/步驟
Claims (15)
- 一種獲得空間音訊定向向量的方法,其中包括:決定多音響系統中聲源的位置;設定參數;其中所述參數包括:人的反應時間△t、容差率δ;從所述聲源獲得聲音信號;利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
- 如請求項1之方法,還包括:根據所述空間音訊定向向量,決定向量的向量角θ E 。
- 如請求項2之方法,還包括:根據向量角θ E ,決定比例常數D的取值範圍;根據比例常數D的取值範圍決定比例常數D的取值。
- 如請求項1~3任一請求項所述的方法,其中所述空間音訊定向向量根據向量集合R中元素的個數決定;其中 集合R的表達方式為:;其中 ,1 j J,
- 如請求項3之方法,其中所述比例常數D的取值範圍為:當-90° θ E 90°時,則0<D 1;當-180° θ E <-90°或90°<θ E 180°,則-1 D<0。
- 如請求項5之方法,其中所述比例常數D的取值為:當0<D 1時,則比例常數D根據向量的模、集合R中每個向量模的平方之和決定;當-1 D<0時,則比例常數D根據向量的模、集合R中每個向量模的平方之和的基礎上取負決定。
- 如請求項1~3任一請求項所述的方法,還包括:當輸入至多音響系統的實際聲頻不符合所述多音響系統所需聲頻要求時,對輸入至多音響系統的實際聲頻通過彙總函式或者分解函數進行處理,變換成符合所述多音響系統所需要的聲頻要求。
- 一種獲得空間音訊定向向量的裝置,其中包括:聲源決定單元,用於決定多音響系統中聲源的位置;參數決定單元,用於設定參數;其中所述參數包括:人的反應時間△t、容差率δ;聲音信號獲取單元,用於從所述聲源獲得聲音信號;空間音訊定向向量獲取單元,用於利用所述參數對所述聲音信號進行處理,獲得每一時間段△t內對應的空間音訊定向向量。
- 如請求項8之裝置,還包括:空間音訊定向向量角獲取單元,用於根據所述空間音訊定向向量,決定向量的向量角θ E 。
- 如請求項9之裝置,還包括:比例常數取值範圍單元,用於根據向量角θ E ,決定比例常數D的取值範圍;比例常數取值單元,用於根據比例常數D的取值範圍決定比例常數D的取值。
- 如請求項8~10任一請求項所述的裝置,其中所述空間音訊定向向量獲取單元根據向量集合R中元素的個數決定空間音訊定向向量;其中 集合R的表達方式為:;其中 ,1 j J,
- 如請求項10之裝置,其中所述比例常數取值範圍單元決定的比例常數D的取值範圍為:當-90° θ E 90°時,則0<D 1;當-180° θ E <-90°或90°<θ E 180°,則-1 D<0。
- 如請求項12之裝置,其中所述比例常數取值單元決定的比例常數D的取值為:當0<D 1時,則比例常數D根據向量的模、集合R中每個向量模的平方之和決定;當-1 D<0時,則比例常數D根據向量的模、集合R中每個向量模的平方之和的基礎上取負決定。
- 如請求項8~10任一請求項所述的裝置,還包括: 預處理單元,用於當輸入至多音響系統的實際聲頻不符合所述多音響系統所需聲頻要求時,對輸入至多音響系統的實際聲頻通過彙總函式或者分解函數進行處理,變換成符合所述多音響系統所需要的聲頻要求。
- 一種設備,其中所述設備包括如請求項8~14任一項請求項所述的獲得空間音訊定向向量的裝置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
HK16103566.0A HK1221372A2 (zh) | 2016-03-29 | 2016-03-29 | 種獲得空間音頻定向向量的方法、裝置及設備 |
HK16103566.0 | 2016-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201735667A true TW201735667A (zh) | 2017-10-01 |
TWI648994B TWI648994B (zh) | 2019-01-21 |
Family
ID=58716722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105134696A TWI648994B (zh) | 2016-03-29 | 2016-10-27 | 一種獲得空間音訊定向向量的方法、裝置及設備 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9918175B2 (zh) |
CN (1) | CN107241672B (zh) |
HK (1) | HK1221372A2 (zh) |
TW (1) | TWI648994B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI636453B (zh) * | 2017-12-05 | 2018-09-21 | 鴻海精密工業股份有限公司 | 多媒體資料處理裝置及方法 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10595122B2 (en) * | 2017-06-15 | 2020-03-17 | Htc Corporation | Audio processing device, audio processing method, and computer program product |
CN110876100B (zh) * | 2018-08-29 | 2022-12-09 | 嘉楠明芯(北京)科技有限公司 | 一种音源定向方法与系统 |
CN110491403B (zh) * | 2018-11-30 | 2022-03-04 | 腾讯科技(深圳)有限公司 | 音频信号的处理方法、装置、介质和音频交互设备 |
EP3984027B1 (en) * | 2019-06-12 | 2024-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Packet loss concealment for dirac based spatial audio coding |
US11341952B2 (en) | 2019-08-06 | 2022-05-24 | Insoundz, Ltd. | System and method for generating audio featuring spatial representations of sound sources |
CN111277811B (zh) * | 2020-01-22 | 2021-11-09 | 上海爱德赞医疗科技有限公司 | 一种三维空间相机及其拍照方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013156818A1 (en) * | 2012-04-19 | 2013-10-24 | Nokia Corporation | An audio scene apparatus |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
JP5952692B2 (ja) * | 2012-09-13 | 2016-07-13 | 本田技研工業株式会社 | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
EP2936829A4 (en) * | 2012-12-18 | 2016-08-10 | Nokia Technologies Oy | SPACE AUDIO DEVICE |
US9232337B2 (en) * | 2012-12-20 | 2016-01-05 | A-Volute | Method for visualizing the directional sound activity of a multichannel audio signal |
CN105103569B (zh) * | 2013-03-28 | 2017-05-24 | 杜比实验室特许公司 | 使用被组织为任意n边形的网格的扬声器呈现音频 |
US9736606B2 (en) * | 2014-08-01 | 2017-08-15 | Qualcomm Incorporated | Editing of higher-order ambisonic audio data |
US9693009B2 (en) * | 2014-09-12 | 2017-06-27 | International Business Machines Corporation | Sound source selection for aural interest |
WO2016040623A1 (en) * | 2014-09-12 | 2016-03-17 | Dolby Laboratories Licensing Corporation | Rendering audio objects in a reproduction environment that includes surround and/or height speakers |
US20170086008A1 (en) * | 2015-09-21 | 2017-03-23 | Dolby Laboratories Licensing Corporation | Rendering Virtual Audio Sources Using Loudspeaker Map Deformation |
US10123120B2 (en) * | 2016-03-15 | 2018-11-06 | Bacch Laboratories, Inc. | Method and apparatus for providing 3D sound for surround sound configurations |
-
2016
- 2016-03-29 HK HK16103566.0A patent/HK1221372A2/zh not_active IP Right Cessation
- 2016-07-19 CN CN201610566911.XA patent/CN107241672B/zh active Active
- 2016-07-22 US US15/216,726 patent/US9918175B2/en active Active
- 2016-10-27 TW TW105134696A patent/TWI648994B/zh not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI636453B (zh) * | 2017-12-05 | 2018-09-21 | 鴻海精密工業股份有限公司 | 多媒體資料處理裝置及方法 |
Also Published As
Publication number | Publication date |
---|---|
HK1221372A2 (zh) | 2017-05-26 |
US20170289726A1 (en) | 2017-10-05 |
CN107241672B (zh) | 2019-10-11 |
US9918175B2 (en) | 2018-03-13 |
CN107241672A (zh) | 2017-10-10 |
TWI648994B (zh) | 2019-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201735667A (zh) | 一種獲得空間音訊定向向量的方法、裝置及設備 | |
CN103493513B (zh) | 用于将音频上混以便产生3d音频的方法和系统 | |
JP5919201B2 (ja) | 音声を定位知覚する技術 | |
CN103329571B (zh) | 沉浸式音频呈现系统 | |
RU2586842C2 (ru) | Устройство и способ преобразования первого параметрического пространственного аудиосигнала во второй параметрический пространственный аудиосигнал | |
AU2021218089A1 (en) | Concept for generating an enhanced sound-field description or a modified sound field description using a depth-extended dirac technique or other techniques | |
JP7504140B2 (ja) | 音響処理装置および方法、並びにプログラム | |
US10003904B2 (en) | Method and device for processing binaural audio signal generating additional stimulation | |
US9820072B2 (en) | Producing a multichannel sound from stereo audio signals | |
US20200267473A1 (en) | Hybrid speaker and converter | |
US20200260209A1 (en) | Devices and methods for binaural spatial processing and projection of audio signals | |
US11863965B2 (en) | Interaural time difference crossfader for binaural audio rendering | |
US20120105603A1 (en) | Display system with dynamic 3d sound reproduction and related method | |
JP2018110366A (ja) | 3dサウンド映像音響機器 | |
CN111512648A (zh) | 启用空间音频内容的渲染以用于由用户消费 | |
US10869151B2 (en) | Speaker system, audio signal rendering apparatus, and program | |
CN105594227A (zh) | 利用恒定功率成对平移的矩阵解码器 | |
TW202105164A (zh) | 用於低頻率效應之音訊呈現 | |
Pulkki et al. | Multichannel audio rendering using amplitude panning [dsp applications] | |
JP2011234177A (ja) | 立体音響再生装置及び再生方法 | |
EP3503579A1 (en) | Multi-camera device | |
Ranjan et al. | Wave field synthesis: The future of spatial audio | |
Gölles et al. | Cat3DA-Camera-Tracked 3D Audio Player | |
Grigoriou et al. | Binaural mixing using gestural control interaction | |
US11758348B1 (en) | Auditory origin synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |