TW201534144A - 用以產生多個音訊通道之裝置及方法 - Google Patents
用以產生多個音訊通道之裝置及方法 Download PDFInfo
- Publication number
- TW201534144A TW201534144A TW104100290A TW104100290A TW201534144A TW 201534144 A TW201534144 A TW 201534144A TW 104100290 A TW104100290 A TW 104100290A TW 104100290 A TW104100290 A TW 104100290A TW 201534144 A TW201534144 A TW 201534144A
- Authority
- TW
- Taiwan
- Prior art keywords
- speaker
- imaginary
- energy distribution
- speakers
- setting
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000009826 distribution Methods 0.000 claims abstract description 98
- 239000011159 matrix material Substances 0.000 claims description 40
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000013519 translation Methods 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000008901 benefit Effects 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
一種用於產生用於一第一揚聲器設置之多個音訊通道的裝置之特性在於一假想揚聲器判定器、一能量分佈計算器、一處理器及一顯現器。該假想揚聲器判定器經組配以判定不含於該第一揚聲器設置中之一假想揚聲器之一位置,以獲得含有該假想揚聲器之一第二揚聲器設置。該能量分佈計算器經組配以計算自該假想揚聲器至該第二揚聲器設置中之另一揚聲器的一能量分佈。該處理器經組配以重複該能量分佈,以獲得用於自該第二揚聲器設置至該第一揚聲器設置之一降混的一降混資訊。該顯現器經組配以使用該降混資訊產生該等多個音訊通道。
Description
本發明係關於一種用於產生用於揚聲器設置之多個音訊通道之裝置及方法。
空間音訊寫碼及解碼硬體及軟體係此項技術中熟知的,且(例如)按照MPEG環繞聲標準來標準化。空間音訊系統包含數個擴音器及各別音訊通道,例如,左通道、中置通道、右通道、左環繞通道、右環繞通道及低頻增強通道。該等通道中之每一者通常由各別擴音器再現。該等擴音器在輸出設置中之置放通常為固定的,且(例如)取決於5.1格式、7.1格式或其類似者。取決於各別格式,定義擴音器之位置。一些設置定義在收聽者之位置上方的擴音器位置。此擴音器亦被稱作上帝之聲(VoG)。一些格式亦可定義具有在收聽者下方之位置的擴音器。此擴音器可各別地被稱作地獄之聲(VoH)。為了產生定義用於擴音器設置之擴音器之音訊信號的音訊通道,可使用向量基幅度平移(VBAP)
法。VBAP使用指向揚聲器集合之擴音器的N個單位向量 l 1,..., l N的集合。在揚聲器集合經組配以再現3維聲學場景之狀況下,揚聲器集合經表示為3D揚聲器集合。由笛卡耳單位向量p給出之平移方向由彼等擴音器向量之線性組合定義。
p =[ l 1,..., l N ][g 1,...,g N ] T (1)
其中g n 表示應用於 l n 之比例因子。在R3中,藉由3個向量基形成向量空間。因此,若作用中揚聲器之數目及因此非零比例因子之數目限於3,則(1)通常可藉由矩陣求逆來求解。
實務上,此求解可藉由在擴音器之間定義三角形網格及藉由為其間之區域選擇彼等三元組來進行。此可依據下式導致待應用之比例因子的解:[g n1,g n2,g n3] T =[ l n1, l n2, l n3]-1 p , (2)
其中{n 1,n 2,n 3}表示作用中擴音器三元組。最後,確保功率正規化之輸出信號的正規化產生最終平移增益a 1,...,a N :
包括於MPEG-H解碼器中之物件顯現器使用VBAP顯現用於給定擴音器組配之音訊物件。若擴音器設置不包括T0(「上帝之聲」)擴音器,如9.1揚聲器設置,則相對於收聽者之位置具有大於35°之仰角的物件限於35°(上部擴音器之預設仰角)之仰角。雖然此解決方案為切實可行的解決方案,但其顯然並非為最佳的,此係因為其可改變所
再現之聲學場景。
在9.1揚聲器設置(亦即,根據9.1格式之揚聲器設置)中,將上半球劃分成兩個三角形的替代例將導致不對稱性,且在收聽者正上方之物件將接著由兩個對置擴音器再現。因此,儘管揚聲器設置具有對稱性,但(例如)自上右前方移動至上左後方之音訊物件聽起來將不同於其將自上左前方移動至上右後方之情況。此難題之解決方案將使用逐N平移,其中對於上半球中之物件,涉及到所有上部擴音器。將VBAP平移自三個擴音器擴展至N個擴音器被稱為逐N平移。相鄰關係可由用將(例如)由MPEG解碼器計算之三角形之邊緣指定的曲線給出。三角形可(例如)藉由形成具有N個頂點之一或多個多面體來獲得。頂點可藉由揚聲器形成。三角形可由多面體之外表面形成。
VBAP平移法需要對所有立體角之恰當三角測量。在當前MPEG-H 3D參考軟體中,針對固定數目個揚聲器設置預先計算且以表格形式給出三角測量。此情形當前將所支援之揚聲器設置限於給定設置或限於僅相差小位移之設置。
定義擴音器位置之音訊格式引導使用者(例如,收聽者)將擴音器置放於彼等所定義位置處。此種要求(例如)在擴音器經定義為在收聽者周圍配置成一個圓或配置於圓形路徑上之狀況下可能難以滿足。在具有擴音器設置之起居室為矩形而非圓形且一些使用者(尤其住在公寓裏之使用者)偏好將擴音器定位於牆壁附近而非定位於房間
中間時,使用者需要調適此等設置。
因此,例如,需要音訊解碼概念以實現更靈活的擴音器設置。
本發明之目標為提供用於音訊編碼之更靈活裝置及方法的概念。
此目標係藉由獨立請求項之標的物解決。
本發明之另外有利修改為附屬請求項之主題。
本發明之實施例係關於一種用於產生用於第一揚聲器設置之多個音訊通道之裝置。該裝置包含一假想揚聲器判定器,該假想揚聲器判定器用於判定不含於第一揚聲器設置中之假想揚聲器的位置。藉由判定假想揚聲器之位置,獲得含有假想揚聲器之第二揚聲器設置。該裝置進一步包含一能量分佈計算器,該能量分佈計算器用於計算自假想揚聲器至第二揚聲器設置中之另一揚聲器的能量分佈。該裝置進一步包含一處理器,該處理器用於重複能量分佈以獲得用於自第二揚聲器設置至第一揚聲器設置之降混的降混資訊。該裝置之顯現器經組配以使用降混資訊產生多個音訊通道。
本發明者已發現,藉由判定虛擬(亦即,假想)揚聲器(擴音器)之位置,可如同真實設置(第一設置)將匹配關於擴音器之數目及/或擴音器之位置的已定義組配來處理針對已定義格式而格式化之電影的音訊資料(諸如,3D音訊
資料)。為了控制真實擴音器,根據能量分佈來降混假想第二設置,使得可如同第一設置(實際上實施之設置)為第二設置(例如,藉由格式定義之設置)來控制第一設置。
此允許使藉由各別格式定義之音訊通道適於(例如)在收聽者之家中實施的擴音器之真實設置。
本發明之另外實施例係關於一種裝置,其中該處理器經組配以基於能量分佈產生能量分佈矩陣。能量分佈矩陣之元素可表示假想揚聲器至另一揚聲器之能量分佈。該處理器經組配以計算能量分佈矩陣之冪。能量分佈矩陣之冪使所獲得矩陣之元素減小或收斂至所定義臨限值,使得可針對忽略彼等元素。結果,可基於能量分佈矩陣之冪獲得降混資訊。降混資訊指示如何控制模擬第二揚聲器設置的第一揚聲器設置之擴音器。
本發明之另外實施例係關於一種裝置,其進一步包含一能量分佈計算器,該能量分佈計算器包含鄰域估計器。該鄰域估計器經組配以判定作為假想揚聲器之相鄰者的至少一個揚聲器。該能量分佈計算器經組配以計算假想揚聲器至假想揚聲器之至少一個相鄰者的能量分佈。
藉由判定假想揚聲器之相鄰者,各別假想揚聲器可配置於任何區位處,使得第二擴音器設置可經組配以根據諸如某一格式之預定義設置而實施。另一益處為當重複鄰域估計時,可針對變化之第一揚聲器設置而產生多個音訊通道。因此,相同的真實擴音器設置可(例如)用以一次再現5.1多通道信號,且下次再現7.1多通道信號。
另外實施例係關於一種裝置,其中該鄰域估計器經組配以判定為假想揚聲器之相鄰者的至少兩個揚聲器,且其中該能量分佈計算器經組配以計算能量分佈,使得為假想揚聲器之相鄰者的至少兩個揚聲器間之能量分佈在預定義容限內為相等的(亦即,均勻地分佈)。該預定義容限可為(例如)均勻分佈值之0.1%、1%或10%的偏差。
藉由計算相鄰者間之均勻分佈能量,可確保能量分佈矩陣之冪之收斂性,使得可獲得降混資訊之唯一結果。
本發明之另外實施例係關於一種裝置,其中該鄰域估計器經組配以判定為假想揚聲器之相鄰者的至少兩個揚聲器,且其中為假想揚聲器之相鄰者的至少兩個揚聲器中之至少一者為假想揚聲器。一優點為,即使第一揚聲器設置與第二揚聲器設置相差一個以上部揚聲器,仍可獲得降混資訊。
本發明之另外實施例係關於一種裝置,其中該裝置為音訊解碼器之格式轉換單元的部分,使得由音訊解碼器提供的(例如)用於控制第一揚聲器設置之通道的數目自分別符合一格式的音訊通道之較高或最大數目(例如,由諸如MPEG-H之標準支援的最大數目)降混至實際存在之擴音器的數目。
另外實施例係關於一種裝置,其中該裝置為音訊解碼器之物件顯現器的部分,且其中該裝置包含平移器使得該物件顯現器經調適以根據第一擴音器設置提供數個音訊通道。
另外實施例係關於一種裝置,其中該裝置經組配以提供第一揚聲器設置之有效性資訊。
此實施例之一優點為,該裝置分別該有效性資訊可指示(例如)由使用者(例如)在家中實施之第一揚聲器設置是否可具備適當音訊通道,或(例如)擴音器是否必須經重定位以匹配諸如揚聲器位置之容限的要求。
另外實施例係關於一種音訊系統,該音訊系統包含用於產生用於揚聲器設置之多個音訊通道的一裝置及根據由該裝置提供之多個音訊通道的多個擴音器。
該實施例之一優點為,可實施(例如)用於實施3D聲學場景之音訊系統。
本發明之另外實施例係關於一種用於產生用於第一揚聲器設置之多個音訊通道之方法及一種電腦程式。
10、10-1、10-2、112‧‧‧裝置
12、12-2‧‧‧音訊通道
12-1‧‧‧音訊信號/音訊通道
14、14-1‧‧‧第一揚聲器設置/第一擴音器設置
16a‧‧‧擴音器/左前(FL)揚聲器
16b、16c‧‧‧擴音器/揚聲器
18、18-1‧‧‧假想揚聲器判定器
22‧‧‧假想擴音器/假想揚聲器
22a‧‧‧假想上部揚聲器/VoG揚聲器
22b‧‧‧假想下部揚聲器/VoH揚聲器
22c‧‧‧假想環繞左(SL)揚聲器/擴音器
22d‧‧‧假想環繞右(SR)揚聲器/擴音器
24‧‧‧第二揚聲器設置/假想設置
24-1、24-2、24-3‧‧‧第二擴音器設置/第二揚聲器設置
26、26-1‧‧‧能量分佈計算器
28、28-1‧‧‧處理器
32、34‧‧‧區塊
36‧‧‧降混資訊
38、38-1‧‧‧顯現器
39‧‧‧輸入信號/音訊通道
42‧‧‧收聽者之位置
44、54‧‧‧層/幾何平面
46a‧‧‧邊界/上層
46b‧‧‧邊界/下層
48‧‧‧圓
49‧‧‧參考角度
52‧‧‧球面
56‧‧‧平移器
110‧‧‧音訊系統
1200‧‧‧物件處理器
1205‧‧‧資料/輸出(資料)通道
1210‧‧‧物件顯現器
1220‧‧‧混音器
1300‧‧‧USAC解碼器
1700‧‧‧後處理器
1710‧‧‧雙耳顯現器
1720‧‧‧格式轉換器/格式轉換區塊
1730‧‧‧輸出/輸出介面
1800‧‧‧空間音訊物件寫碼解碼器
α、β1、β2‧‧‧角度
M‧‧‧能量分佈矩陣/降混矩陣
D‧‧‧能量分佈矩陣
將參看附圖更詳細地描述本發明之實施例,其中:圖1展示根據本發明之一實施例的用於產生用於第一揚聲器設置之多個音訊通道的裝置之示意性方塊圖;圖2展示根據本發明之一實施例的例示性第二擴音器設置之示意圖,該第二擴音器設置包含形成第一擴音器設置之真實揚聲器及假想揚聲器;圖3展示自上方以透視圖投影至2維平面中之圖2的第二揚聲器之示意圖;圖4a展示根據本發明之一實施例的相對於位置42之第
一擴音器設置14-1之透視圖;圖4b展示圖4a之組配之俯視圖;圖5a展示根據本發明之一實施例的形成第二揚聲器設置的圖4a之第一揚聲器設置與形成於圓形形狀上之額外假想揚聲器之示意性透視圖;圖5b展示關於圖5a之情境的俯視圖且描繪圓48之圓形;圖6展示關於包含第一揚聲器設置及假想揚聲器之第二揚聲器設置之透視圖。根據本發明之實施例,假想揚聲器之位置位於計算球面上;圖7展示根據圖2之第二擴音器設置之示意圖,其中描繪與平層正交之層以用於闡明根據本發明之一實施例的揚聲器之相鄰關係;圖8展示音訊解碼器之方塊示意圖,該音訊解碼器可用於解碼MP4信號以獲得描繪用於根據本發明之一實施例的裝置之兩個選項之多個音訊信號;圖9展示被參考為圖8中之選項1的裝置之示意性方塊圖;圖10展示被參考為圖8中之選項2的格式轉換區塊1720之方塊示意圖;以及圖11展示音訊系統之示意性方塊圖。
即使具有相等或等效功能性之一或多個相等或
等效元件出現於不同圖式中,以下描述中仍藉由相等或等效參考數字來表示該一或多個元件。
在以下描述中,闡述多個細節以提供對本發明之實施例的較透徹解釋。然而,熟習此項技術者將顯而易見,可在無此等特定細節之情況下實踐本發明之實施例。在其他情況下,以方塊圖形式而非詳細地展示熟知結構及器件以便避免混淆本發明之實施例。另外,除非另外特定指出,否則可將下文中所描述之不同實施例的特徵彼此組合。
圖1展示用於產生用於第一揚聲器設置14之多個音訊通道12的裝置10之示意性方塊圖。第一擴音器設置14包含數個擴音器16a至16c。擴音器16a至16c可位於(例如)收聽室中且可為再現系統之部分,例如,作為影院或家庭影院應用之一部分。第一揚聲器設置14現實中確實存在。裝置10包含用於判定第一擴音器設置14中不含有之假想擴音器22之位置的假想揚聲器判定器18。假想揚聲器判定器18經組配以獲得含有假想揚聲器22之第二揚聲器設置24。第二揚聲器設置24包含第一擴音器設置14之擴音器16a至16c中的一些或全部。假想揚聲器判定器18可經組配以判定假想揚聲器22之位置,使得假想揚聲器位於根據由格式定義的揚聲器應位於但實際上未位於之位置的位置處。由假想揚聲器判定器18執行之判定可經控制,使得由設置14及24共同擁有或同置於設置14及24中之揚聲器之數目得以最大化或使得兩個設置14及24之最近相鄰揚聲器之間的平均距離得以最小化,或可為可由使用者手動控制的。
裝置10包含一能量分佈計算器26,該能量分佈計算器用於計算自假想揚聲器22至第二揚聲器設置中之另一揚聲器的能量分佈。替代地或另外,假想揚聲器判定器18可經組配以判定假想揚聲器22之位置,使得假想揚聲器22位於「已位移」揚聲器16a至16c附近,使得假想揚聲器可校正由位移產生之聲學效應。
當(例如)第一揚聲器設置14部分地實施根據諸如5.1、7.1、9.1、11.2或其類似者之音訊格式的擴音器組配或擴音器設置時,假想揚聲器22可為關於待實施之格式而在第一擴音器設置14中缺失之揚聲器。
能量分佈表示假想揚聲器22之能量分佈至第二揚聲器設置24中之另一揚聲器的量或份額。換言之,能量分佈表示在第二擴音器設置24之剩餘揚聲器間共用時的假想揚聲器22之能量。
裝置10進一步包含一處理器28。處理器28經組配以重複能量分佈(如由區塊32所指示),以獲得降混資訊36,如由區塊34中之M所指示。降混資訊可用於將第二揚聲器設置24之音訊通道降混至第一揚聲器設置14。換言之,降混資訊36允許控制第一揚聲器設置14之擴音器16a至16c,以用於獲得在假想揚聲器22將為真實揚聲器時將至少部分獲得的聲學場景。
裝置10包含一顯現器38,該顯現器用於使用降混資訊36產生多個音訊通道12。顯現器38經組配以將降混資訊38應用於一輸入信號或一組輸入信號39,例如,對應於
或專用於由第二揚聲器設置24再現之數個音訊通道。顯現器38經組配以藉由使用降混資訊36獲得自第二揚聲器設置24至第一揚聲器設置14之降混36。換言之,顯現器38經組配以藉由將假想設置24之(假想)音訊通道39降混至真實第一設置14之真實音訊通道12而判定多個音訊通道12。
此實施例之一優點為可至少部分地藉由將在擴音器16a至16c將匹配更廣泛設置時獲得之擴音器16a至16c產生聲學場景。因此,即使在真實的第一揚聲器設置14中缺失一或多個擴音器(例如,環繞揚聲器),仍可實現一格式(例如,3D格式)之聲學場景。
待藉由裝置10解決之任務可為(例如)3D音訊物件在任意揚聲器設置上之顯現,即使3D音訊物件關於某一格式為無效3D設置亦如此。儘管藉由使用假想揚聲器,不會脫離不包含真實揚聲器之方向產生聲音,但遞送(例如,自動地)可被視為合理解決方案的用於控制揚聲器之確定性解決方案。舉例而言,此在如下狀況下適用:當環繞左揚聲器不存在時,經由左前通道,接著經由右前通道,藉由較大份額來再現環繞左通道。因此,就回退解決方案而言,所呈現之裝置及方法較適合於MPEG-H。
替代地或另外,可根據可含於(例如)表格或資料庫中之預定義位置來判定第二揚聲器設置24之至少一個其他假想揚聲器的數目及/或假想揚聲器22及/或另外假想揚聲器之位置。替代地或另外,可判定假想揚聲器22及/或至少一個其他假想揚聲器之位置,使得第一揚聲器設置14及
或第二揚聲器設置24之揚聲器之間的距離實質上等距或對應於音訊格式或標準。
換言之,裝置10包含使用VBAP平移器或相當的平移法之以下組件:
1.判定缺失及/或所需擴音器位置之組件
2.判定彼等假想擴音器之相鄰者的組件
3.藉由使用「能量分佈」方法實現降混且作為選項而執行能量正規化之組件
換言之,例如,若(例如)儲存於諸如CD之資料儲存器上的聲學場景包含六個音訊通道且第一揚聲器設置包含2個揚聲器,則該裝置可經組配以判定缺失擴音器。
「能量分佈矩陣」M可被視為實質性貢獻且定義各別能量至各別相鄰者之分佈。不需要能量分佈矩陣含有具有常數值之行。作為一替代例,具有其他值之實施亦為可能的。可較佳定義行之值使得該等值可總計為值1。能量分佈矩陣之基礎可為(例如)如描繪於圖3中之能量分佈曲線。
圖2展示例示性第二擴音器設置24-1之示意圖,該第二擴音器設置包含形成第一擴音器設置14-1之揚聲器16a及16b。第二揚聲器設置24-1包含四個假想揚聲器22a至22d。第二揚聲器設置24-1可為由假想揚聲器判定器所判定之結果且可為用於相對於收聽者之位置42再現3D聲學場景的可能揚聲器設置,該假想揚聲器判定器可為假想揚聲器判定器18。當第一揚聲器設置14-1為(例如)立體聲組配時,
(例如)在相對於位置42之前壁處,揚聲器16a可表示為立體聲組配之左揚聲器且揚聲器16b表示為右揚聲器。假想揚聲器判定器可經組配以實施諸如音訊格式之預設定。當揚聲器16a及16b之位置匹配音訊格式之預定義位置(可能在容限範圍內)時,假想揚聲器判定器可接著經組配以藉由匹配揚聲器16a及16b之區位與預定義區位來判定假想揚聲器22a至22d之位置。未由揚聲器16a及16b佔據之區位可被判定為假想揚聲器22a至22d之區位。容限可為絕對值,諸如5cm、50cm或5m,或可為相對值,諸如第一揚聲器設置14-1或第二揚聲器設置24-1之空間的1%、10%或30%。
第二揚聲器設置24-1可包含一假想上部揚聲器(上帝之聲-VoG)22a、位於位置42下方之一下部揚聲器(地獄之聲-VoH)22b、一假想環繞左(SL)揚聲器22c及一假想環繞右(SR)揚聲器22d。假想揚聲器22a至22d係用「I」標記。替代地,第一揚聲器設置14-1及/或第二揚聲器設置24-1可包含不同數目個真實或假想揚聲器16a至16b及/或22a至22d。真實及/或假想揚聲器可位於不同於所描繪區位之區位處。
舉例而言,可定義平面環繞聲設置(例如,無上帝之聲及地獄之聲揚聲器之設置),其中所有揚聲器在平層44內。歸因於如收聽室之特性或(例如)諸如TV螢幕或視窗之其他物件之存在的情況,擴音器16a、16b及/或22c至22d亦可位於由上層46a及/或下層46b界定之容限內,該上層及下層界定擴音器16a、16b及/或22c及22d可位於之容限的上邊界及/或下邊界。層46a及46b可(例如)藉由位置42相對於
擴音器16a/16b及/或22c及22d之最大角度界定。舉例而言,揚聲器16a及16b可各自包含小於或等於5度、小於或等於10度、小於或等於20度或小於或等於45°之角度α。揚聲器16a及22c配置於層44中,揚聲器16b配置於層46a中,揚聲器22d配置於層46b中。替代地或另外,揚聲器可配置於層46a與44之間及/或層44與46b之間。換言之,第一揚聲器設置14-1及/或第二揚聲器設置24-1在被稱作平面設置時亦可配置於不同層中。
假想揚聲器22b(VoH)位於位置42之正下方。假想揚聲器22a(VoG)配置於藉由位置42上方之空間界定的上半球內。假想揚聲器22a相對於前揚聲器16a及16b位於位置42前方。換言之且相對於位置42,假想揚聲器22a配置於幾何平面(層44)之第一側處,且假想揚聲器22b係沿幾何平面的與幾何平面之第一側對置的第二側配置。幾何平面可經組配以分開揚聲器之鄰域。舉例而言,揚聲器16a、16b、22c及22d為假想揚聲器22a及22b之相鄰者(且假想揚聲器22a及22b為揚聲器16a、16b、22c及22d之相鄰者)。藉由包括邊界46a及46b之幾何平面(層44)分離的假想揚聲器22a及22b可描述為「無相鄰者」。
假想揚聲器22a至22d之間的箭頭描繪自假想揚聲器22a至22d至第二設置24-1的為各別揚聲器22a至22d之相鄰者的鄰近揚聲器之可能能量分佈。能量分佈由諸如能量分佈計算器26之能量分佈計算器執行。換言之,假想揚聲器22a至22d中之每一者的能量經分佈至假想揚聲器22a
至22d中之每一者的各別相鄰者且在該等相鄰者間分佈。投影至2維平面中的揚聲器之示意圖描繪於以下圖3中。
圖3展示第二揚聲器設置24-1之示意圖,該第二揚聲器設置包括自上方以透視圖投影至2維平面中之第一設置14-1。圖3藉由經由指示自假想揚聲器22a至22d中之每一者至其相鄰者的能量分佈之錯誤之連接來描繪假想揚聲器22a至22d中之每一者的相鄰者。可藉由鄰域估計器來判定假想揚聲器之相鄰者,該鄰域估計器可為諸如能量分佈計算器26之能量分佈計算器的部分或(例如)為諸如假想揚聲器判定器18之假想揚聲器判定器的部分。替代地,鄰域估計器可配置於假想揚聲器判定器與能量分佈計算器之間。
假想環繞左(SL)揚聲器22c具有四個相鄰者:左前(FL)揚聲器16a、VoG揚聲器22a、環繞右(SR)揚聲器22d及VoH揚聲器22b。假想揚聲器22a至22d中之每一者的能量自假想揚聲器22a至22d分佈至其相鄰者,其中能量分佈可藉由能量分佈係數dxy表示,其中x指示分佈能量源且y指示分佈能量之接收擴音器。左前揚聲器16a係用索引1表示,右前揚聲器係用索引2表示,VoG揚聲器22a係用索引3表示,VoH揚聲器22b係用索引4表示,環繞左揚聲器22c係用索引5表示,且環繞右揚聲器22d係用6表示。
能量分佈係數dxy中之每一者可由能量分佈計算器獨立地判定。根據一實施例,能量分佈係數係根據兩個鄰近揚聲器之間的距離來判定或計算。根據一替代實施
例,能量分佈及因此能量分佈係數dxy經計算及均勻地分佈。因為在例示性設置內假想揚聲器22a至22d中之每一者具有四個相鄰者,所以此可導致(例如)¼的相等能量分佈係數。
換言之,自此鄰域曲線開始,可建構可表示為能量分佈曲線之加權定向曲線。此曲線之權重(亦即,能量分佈係數dxy)描述自假想節點(揚聲器)22a至22d重新分佈至其相鄰者之聲能的部分。
能量分佈計算器(例如,描繪於圖1中之能量分佈計算器26)可經組配以將能量分佈係數整理至能量分佈矩陣(例如,表示為D)。根據上文所描述之鄰域曲線,揚聲器例示性地按次序FL、FR、VoG、VoH、SL、SR來整理。所得能量分佈矩陣D可形成為:
其中行及列之數目對應於索引1至6。以第一揚聲器設置14-1表示之立體聲設置可藉由添加假想揚聲器22a至22d而變換成有效的3D揚聲器設置。
對於此實例,將索引dxy設定至¼,且因此為0.25。當關於矩陣D的表示為具有索引1、2、5及6之揚聲器16a、16b、22c及22d之相鄰者的假想揚聲器22a之第三行時,矩陣D在第1行、第2行、第5行及6行中展示值0.25。
替代地,假想揚聲器之相鄰者可由可自凸包獲得
之三角測量的邊緣定義。在全平面環繞聲設置之狀況下,當假想揚聲器中之所有相鄰者為現有揚聲器時,則降混矩陣之對應行針對每一相鄰者可具有常數值1/,其中N表示相鄰者之數目。
能量分佈可用以(例如)計算不存在於真實揚聲器設置中之假想揚聲器22a至22d可如何由其他揚聲器補償。
根據一實施例的裝置之處理器(例如,處理器28)經組配以重複能量分佈。該處理器經組配以重複能量分佈,此係因為假想揚聲器(例如,22c至22d)可經計算以用於部分地補償假想揚聲器22a,亦即,假想揚聲器22a之能量經部分地分配或重新分配至假想揚聲器22c至22d以及至真實揚聲器16a及16b。經分配至假想揚聲器22c至22d的能量或至假想揚聲器22c至22d的經重新分配能量(例如)由處理器28重新分佈至假想揚聲器之相鄰者,使得藉由重複能量分佈,假想揚聲器22a至22d之能量經分配或重新分配至真實揚聲器16a及16b。此意謂假想揚聲器22c至22d自假想揚聲器22a「接收」必須經重新分佈之能量。
該重複可(例如)藉由計算矩陣D之冪執行。處理器28經組配以獲得用於自第二揚聲器設置24-1降混至第一揚聲器設置14-1之降混資訊。為了獲得降混資訊,處理器可經組配以計算D的第n次冪的平方根(開平方運算符),其可由下式表達: M =sqrt( D n ), (5)
其中D表示具有分佈權重dxy作為元素之能量分佈矩陣,n表示迭代(亦即,重複)之數目且sqrt(‧)表示逐元素平方根,且M表示可表示為降混矩陣之結果。
舉例而言,在20次迭代(亦即,重複)之後(且因此n=20),此可產生以下降混矩陣:
其中第3行、第4行、第5行及第6行包含值0,其中已將該等值降值捨位。第1行及第2行表示具有索引1之揚聲器(16a)及具有索引2之揚聲器(16b)在操作時的資訊,使得模仿假想揚聲器22a至22d之存在。
換言之,藉由將能量分佈係數設定為相鄰者之數目的倒數,得到能量節省且同時可確保演算法之收斂性。
處理器可經組配以判定能量分佈矩陣D之n次冪,其中n為固定值。替代地,處理器可經組配以迭代地計算D之冪。處理器可(例如)經組配以將D與D相乘且之後將結果與D相乘等等,以迭代性地獲得D之迭代增長次冪且接著應用開平方運算符。當針對固定維數之冪而計算能量分佈矩陣之冪時,可獲得包括所得降混資訊之不同的第二揚聲器設置的再現性。替代地,當迭代地計算能量分佈矩陣D之冪時,可比較所得矩陣或開平方運算符之結果的元素與(例如)某一臨限值,且在元素低於此某一臨限值時,該等值可設定為零。臨限值可為(例如)0.05、0.1或0.2,或任一其
他合適值。此方法可導致計算時間更短且計算努力更低,此係因為該方法可在一達成恰當結果後便停止。
換言之,計算能量分佈矩陣之n次冪可藉由應用能量分佈n次而實施。平方根將能量值改變至可依據降混係數應用於信號值之衰減值。藉由計算能量分佈矩陣之冪而實施的迭代可得出對應於假想擴音器之所有行轉換成0的結果。
換言之,在每一迭代步驟中,由處理器實施之演算法用以根據給定權重而重新分佈彼等能量部分。重複此操作直至假想節點之能量的總量低於給定臨限值為止。收集經重新分配能量以用於現有揚聲器之節點的平方根最終得出降混矩陣M之元素。可為顯現器38之顯現器可經組配以應用諸如降混矩陣M及/或降混資訊39之降混資訊,以將音訊通道的較高數目降混至真實揚聲器之數目。
降混矩陣之目的可被視為消除添加之假想揚聲器且將所計算的增益限於現有揚聲器。舉例而言,若給定揚聲器設置既不含有高度揚聲器,亦不含有後揚聲器,則收聽者上方之添加的假想揚聲器亦將為假想後揚聲器之相鄰者且假想後揚聲器亦將為收聽者上方之額外假想揚聲器的相鄰者。
對於所有平移方向,VBAP需要導致正平移增益之3個獨立基向量。此意謂由三個向量產生之座標系統的原點需要在多面體內部且可能並非其表面之部分。因此,若給定揚聲器設置為有效的3D設置,則藉由檢查所有三角形
之距離是否高於某一臨限值,可執行有效性檢查。顯現器可經組配以藉由實施此有效性檢查及用於處理無效揚聲器設置之策略而支援具有任意揚聲器位置之新揚聲器設置。舉例而言,顯現器可指示真實揚聲器之重定位,使得經重定位揚聲器實現假想揚聲器之有效位置。
平面揚聲器設置或無任何後揚聲器之設置明顯並非有效的3D設置。顯現器可經組配以提供用於藉由執行降混來支援此等設置之最佳努力方法。藉由在圖2之設置14-1之上及之下添加此非現有的假想揚聲器,可將平面設置變成有效的3D設置。藉由在缺失位置處置放此非現有揚聲器及藉由將其降混至其相鄰者,可獲得用於控制第一設置14-1之策略。
圖4a展示相對於位置42的第一擴音器設置14-1之透視圖。以下圖5及圖6將解釋用於實施假想揚聲器之位置之判定的假想揚聲器判定器之可能方法。
圖4b展示圖4a之組配之俯視圖。
圖5a展示一起形成第二揚聲器24-2的圖5a之第一揚聲器設置14-1與假想揚聲器22b及22d之示意性透視圖。假想揚聲器22b及22d之位置可由諸如假想揚聲器判定器18之假想揚聲器判定器(例如)藉由形成包含第一揚聲器設置14-1之揚聲器16a及16b兩者的圓48而獲得。因為如7.1之一些格式將擴音器位置定義在圓上,其中位置42在圓內,所以此可為用於定義假想揚聲器22b及22d之位置的恰當解決方案。
圖5b展示關於圖5a之情境的俯視圖且描繪圓48之圓形。假想揚聲器判定器(例如,作為用於顯現待再現之聲學場景內之聲學物件的物件顯現器之部分)可經組配以除了針對給定設置實施手動選擇之三角測量外,亦實施三角測量演算法。舉例而言,德洛涅(Delaunay)三角測量可提供此問題之良好解決方案,此係因為其對應於沃羅諾伊(Voronoi)圖之對偶圖。替代地或另外,假想揚聲器判定器可經組配以藉由考慮假想揚聲器22b及22d之各別位置與位置42及/或參考角度49(諸如,0°)之間的角度β1及/或β2來判定假想揚聲器22b及22d之位置。因此,可實施自中心位置(0°)之組配,諸如,60°。
圖6展示關於包含第一揚聲器設置14-1、假想揚聲器22b、22d及22a之第二揚聲器設置24-3的透視圖。假想揚聲器22b及22d關於其位置與圖5a及圖5b中所描述之位置相等。假想揚聲器22a之位置可(例如)藉由基於圓48計算球面52來獲得。球面52可(例如)藉由計算揚聲器16a、16b、22c及22d或第一揚聲器設置14-1(給定頂點集合)之凸包來計算。凸包可(例如)藉由「快速凸包(QuickHull)」演算法來判定,如描述於[1]中,該演算法具有平均計算複雜度O(N*log(N))及最不利複雜度O(N2),其中O表示複雜度。快速凸包演算法經調適以提供關於揚聲器之相鄰者的資訊。替代實施例使用諸如分治(Devide and Conquor)演算法或捲包(Gift Wrap)演算法之其他演算法。
快速凸包演算法相當簡單且可歸因於所有頂點
(亦即,揚聲器)位於球面上之事實而得以進一步簡化。簡單演算法允許包括在現有構架(諸如,參考軟體)中。藉由利用三角測量演算法,可藉由形成所有表面在必要時被再分成三角形之多面體來獲得根據MPEG格式之所需三角形。因為所有頂點(亦即,擴音器位置)在容限內位於球面上,所以德洛涅解決方案可藉由計算給定頂點集合之凸包來發現。
根據本發明之一實施例的用於產生多個音訊通道之裝置經組配以判定第一揚聲器設置14-1之擴音器的位置之有效性。舉例而言,當第一揚聲器設置包含兩個以上擴音器時,假想揚聲器判定器可經組配以判定所有擴音器是否在某一容限內配置於圓形路徑上或擴音器是否相對於位置42在某一容限內配置於一個層中。
換言之,例如,根據德洛涅三角測量之空圓性質可為三角測量之充分條件。此條件需要無其他頂點(亦即,擴音器)位於任何三角形之外接圓內。因為頂點位於球面上,所以違反此條件之頂點將位於所考慮表面外部且該包在此區域中將不為凸的。因此,如快速凸包演算法之凸包演算法滿足可提供關於揚聲器設置之有效性之資訊的德洛涅三角測量之充分「空圓」條件。另外,假想揚聲器判定器或(例如)鄰域估計器可經組配以根據德洛涅三角測量及/或提供凸包之演算法判定假想揚聲器之位置或相鄰關係。
快速凸包演算法可(例如)用以向具有或不具有上帝之聲的3D設置應用逐N平移。藉由使用快速凸包演算法,可提供用於任意3D揚聲器設置之三角測量方法,且可
藉由使用所提議的能量分佈方法來支援任意(且甚至無效)揚聲器設置。
對於在(例如)上部擴音器層上方之音訊目標,在設置不包含上帝之聲的情況下,可使用一個或所有架高的揚聲器而非如在參考模型0(RM0)中所實施而限制高度。此可藉由逐N平移來執行。新增計算複雜度可小至微不足道。
因此,(例如)若用於顯現聲學物件之各別物件顯現器針對給定設置除包括手動選擇之三角測量外,亦包括三角測量演算法,則可支援任意3D揚聲器設置。給定設置可藉由擴音器設置所再現之各別格式來定義。
圖7展示根據圖2之第二擴音器設置24-1之示意圖,其中描繪與層44正交之層54。揚聲器16a及16b配置於幾何平面54之第一側處。假想揚聲器22b及22d配置於幾何平面54的與第一側對置之側處。假想揚聲器22a係沿幾何平面54之第一側配置。
藉由將假想揚聲器配置於幾何平面54的與揚聲器16a及/或16b之側對置的側處,可在預定義收聽者位置42處再現三維聲學場景。簡言之,第二揚聲器設置24-1模仿在收聽者前方之揚聲器(揚聲器16a及16b)、在收聽者後方之揚聲器(揚聲器22b及22d)、在收聽者下方之揚聲器(揚聲器22b)及上方之揚聲器(揚聲器22a)。
圖8展示音訊解碼器之方塊示意圖,該音訊解碼器可用於解碼MP4信號以獲得多個音訊信號12-1。
後處理器1700可實施為雙耳顯現器1710或格式
轉換器1720。替代地,資料1205(亦即,音訊通道)之直接輸出亦可如由1730所說明而實施。因此,較佳對諸如22.2或32之最高數目個通道執行解碼器中之處理以便具有靈活性且在需要較小格式時接著進行後處理。
物件處理器1200可包含SAOC解碼器(SAC=空間音訊寫碼)1800,且SAOC解碼器經組配以用於解碼由核心解碼器所輸出之一或多個輸送通道及相關聯之參數資料且使用經解壓縮之後設資料獲得多個所顯現音訊物件。為此,OAM輸出連接至方塊1800。
此外,物件處理器1200經組配以顯現由核心解碼器輸出之經解碼物件,該等物件並不編碼於SAOC輸送通道中,但個別地編碼於通常單一通道化之元件中,如由物件顯現器1210所指示。此外,解碼器包含對應於輸出1730之輸出介面,該輸出用於輸出混音器之輸出至擴音器。
物件處理器1200可包含一空間音訊物件寫碼解碼器1800,該空間音訊物件寫碼解碼器用於解碼表示經編碼音訊物件或經編碼音訊通道之一或多個輸送通道及相關聯之參數旁側資訊,其中空間音訊物件寫碼解碼器經組配以將相關聯之參數資訊及經解壓縮之後設資料轉碼成可用於直接顯現如(例如)定義於SAOC之較早版本中的輸出格式之經轉碼之參數旁側資訊。後處理器1700經組配以使用經解碼之輸送通道及經轉碼之參數旁側資訊來計算輸出格式之音訊通道。由後處理器執行之處理可類似於MPEG環繞聲處理,或可為諸如BCC處理等等之任一其他處理。
物件處理器1200可包含一空間音訊物件寫碼解碼器1800,該空間音訊物件寫碼解碼器經組配以使用經解碼(藉由核心解碼器)之輸送通道及參數旁側資訊針對輸出格式直接上混及顯現通道信號。
物件處理器1200另外包含混音器1220,該混音器接收在與通道混音之預先顯現之物件存在時由USAC解碼器1300直接輸出的資料作為輸入。另外,混音器1220自在無SAOC解碼之情況下執行物件顯現之物件顯現器接收資料。此外,混音器接收SAOC解碼器輸出資料,亦即,SAOC顯現物件。
混音器1220連接至輸出介面1730、雙耳顯現器1710及格式轉換器1720。雙耳顯現器1710經組配以用於使用頭部相關傳送功能或雙耳房間脈衝回應(BRIR)將輸出通道顯現成兩個雙耳通道。格式轉換器1720經組配以用於將輸出通道轉換成具有比混音器之輸出(資料)通道1205少的數目個通道之輸出格式,且格式轉換器1720需要關於諸如5.1揚聲器等等之再現佈局的資訊。
在選項1中且如將在以下圖9中所描述,用於產生多個音訊通道12-1之裝置可(例如)為物件顯現器1210之部分。作為選項2且如將在以下圖10中所描述,用於產生多個音訊通道12-2之裝置可(例如)為(例如)用以將該等數目個通道1205降混至多個音訊通道12-2的格式轉換區塊1720之部分。當應用選項1時,可在混音器1220之輸出端處獲得多個音訊通道12-1。該輸出可為(例如)可與包含多個擴音器之擴
音器系統連接的連接器。
當應用選項2時,可在格式轉換區塊1720之輸出端處獲得多個音訊通道12-2。格式轉換區塊1720可實施為實現應基於通道1205輸出之格式選擇(例如,5.1格式)的裝置(例如,包含開關)。格式轉換區塊1720可與混音器1220連接使得格式轉換區塊1720之輸入可為標準或格式系列(諸如,MPEG)之最大數目(例如,32)個通道。
換言之,此實現藉由僅改變解碼器內之信號處理而使位元串流語法不改變。參考模型0(RM0)可藉由以下新特徵擴展:
圖9展示被參考為圖8中之選項1之裝置10-1的示意性方塊圖。裝置10-1經組配以接收關於待在聲學場景內再現之物件的資料或資訊。裝置10-1之平移器56經組配以基於關於物件之資料計算平移係數。平移係數之數目可等於經判定以根據音訊標準或格式再現聲學場景之擴音器之數目。舉例而言,關於格式5.1,此數目可為六個擴音器之數目。換言之,平移係數表示用於由物件所輻射之聲音的比例因子,其中平移係數經調適以(例如)相對於聲壓級按比例調整擴音器信號,以實施物件相對於收聽者之位置的位置或方向。
可為假想揚聲器判定器18之假想揚聲器判定器18-1經組配以判定一或多個假想揚聲器之位置。舉例而言,當參看圖8時,可在選擇(例如)由特定格式表示之特定收聽體驗時獲得待由假想揚聲器表示之揚聲器的決策。基
於此,可考慮連接至混音器或解碼器之擴音器的數目。可選擇待根據該格式實施但並不連接至混音器或解碼器之每一揚聲器作為假想揚聲器。
可為能量分佈計算器26之能量分佈計算器26-1經組配以計算自該或該等假想揚聲器至所獲得之第二揚聲器設置中之其他揚聲器的能量分佈。可為處理器28之處理器28-1經組配以重複能量分佈,從而(例如)藉由計算降混矩陣M來獲得降混資訊,以用於自第二揚聲器設置降混至第一揚聲器設置。因此,平移係數之數目可高於音訊通道12-1之數目。處理器28-1經組配以將加權因子輸出至顯現器38-1(例如,顯現器38)。顯現器38-1經組配以根據加權因子及各別物件之聲音或雜訊而產生多個音訊通道12-1。聲音或雜訊信號可提供(例如)為單信號。因此,顯現器38-1經組配以基於降混資訊及平移係數產生多個音訊通道12-1,其中可至少部分地由加權因子表示函數關係。
此實施例之一優點為藉由在物件顯現器1210內實施用於產生多個音訊通道12-1之裝置,可以匹配所實施硬體設置之方式獲得多個音訊通道12-1。當音訊通道之最大數目為32且所需的音訊通道之數目為6時,可在處理期間跳過數個(例如,26個)不需要之音訊通道使得可減少計算努力。
圖10展示描繪於圖8中之格式轉換區塊1720之方塊示意圖,該格式轉換區塊包含用於產生多個音訊通道12-2之裝置10-2。裝置10-2經組配以將通道1205之數目降混
至多個音訊通道12-2之數目。
此實施例之一優點為在使解碼器自身不改變及基於由解碼器輸出之通道1205根據所需輸出格式而降混經解碼之音訊信號及音訊通道時,格式轉換區塊1720可附接或包括至解碼器(例如,如描繪於圖8中之解碼器)。
圖11展示音訊系統110之示意性方塊圖,該音訊系統包含可為或可包含(例如)裝置10、裝置10-1或裝置10-2之裝置112。音訊系統110包含兩個擴音器16a及16b。裝置112經組配以產生多個音訊通道使得該等數目之兩個揚聲器16a及16b模仿五個揚聲器16a、16b及22a至22c在位置42處之存在。
另外實施例展示具有不同數目個(諸如,6個、10個、13個或32個或32個以上)擴音器及用於根據該等數目個擴音器產生多個擴音器信號(音訊通道)之裝置。多個擴音器經組配以接收多個音訊通道且基於多個音訊通道提供多個聲學信號。音訊通道之數目可等於待控制的揚聲器之數目。
此使能夠顯現物件以及實現所定義揚聲器設置(例如,包括有效性檢查)且亦實現任意3D設置。此實現可(例如)藉由將快速凸包演算法整合(例如)至諸如MPEG-H3D參考模型(RM)0之參考軟體內來執行。能量分佈方法允許在可為但並不需要為有效3D設置之任意設置上顯現物件。此方法包括以下步驟:
1.針對具有額外假想揚聲器之擴展揚聲器設置計算VBAP增益(加權因子)
2.應用在初始化期間計算之降混矩陣。
3.將能量正規化應用於經降混之VBAP增益。
此程序亦可由格式轉換器在不存在應用於給定(任意)設置之對應格式的規則時應用(例如,作為最後手段)。此可添加顯現器可能已針對任何給定設置產生信號的有益性質。該方法可(例如)藉由以程式設計語言(諸如,C)撰寫之程式碼來實施。
換言之,裝置10可經組配以根據各別格式基於用於可為無效3D設置之任何揚聲器設置的基於物件之MPEG-H資料串流來獲得合適的音訊信號(音訊通道)。當參考公式2時,降混係數g之數目。係數g亦可表示為VBAP-係數。
如在圖2中例示性地描述,可在容限內判定真實及假想揚聲器之位置。此等臨限值亦可適用於在其他幾何平面及/或諸如凸包之包上的區位或位置。
儘管已在裝置之上下文中描述一些態樣,但顯然,此等態樣亦表示對應方法之描述,其中區塊或器件對應於方法步驟或方法步驟之特徵。類似地,方法步驟之上下文中所描述之態樣亦表示對應區塊或項目或對應裝置之特徵的描述。
取決於某些實施要求,本發明之實施例可以硬體或軟體實施。可使用數位儲存媒體來執行該實施,該媒體例如軟性磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該媒體具有儲存於其上之電子可讀控制信
號,該等電子可讀控制信號與可規劃電腦系統協作(或能夠協作)以使得執行各別方法。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可規劃電腦系統協作,使得執行本文中所描述之方法中的一者。
大體而言,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品執行於電腦上時,程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含儲存於機器可讀載體上的用於執行本文中所描述之方法中的一者的電腦程式。
換言之,本發明方法之實施例因此為具有當電腦程式執行於電腦上時用於執行本文中所描述之方法中的一者的程式碼之電腦程式。
因此,本發明方法之另一實施例為資料載體(或數位儲存媒體,或電腦可讀媒體),該資料載體包含記錄於其上的用於執行本文中所描述之方法中的一者的電腦程式。
因此,本發明方法之另一實施例為表示用於執行本文中所描述之方法中的一者的電腦程式之資料串流或信號序列。資料串流或信號序列可(例如)經組配以經由資料通訊連接(例如,經由網際網路)而傳送。
另一實施例包含經組配以或經調適以執行本文中所描述之方法中的一者的處理構件,例如,電腦或可規
劃邏輯器件。
另一實施例包含電腦,該電腦具有安裝於其上之用於執行本文中所描述之方法中的一者之電腦程式。
在一些實施例中,可規劃邏輯器件(例如,場可規劃閘陣列)或積體電路可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可規劃閘陣列可與微處理器協作,以便執行本文中所描述之方法中的一者。大體而言,該等方法較佳地由任一硬體裝置執行。
上文所描述之實施例僅說明本發明之原理。應理解,熟習此項技術者將顯而易見對本文中所描述之配置及細節的修改及變化。因此,意圖為僅由接下來之申請專利範圍之範疇限制,而非由受到本文中實施例之描述解釋所呈現的特定細節限制。
[1] Barber, C. Bradford; Dobkin, David P.; Huhdanpaa, H., “The quickhull algorithm for convex hulls,” ACM Transactions on Mathematical Software, vol. 22, no 4, pp. 469-483, 1996.
10‧‧‧裝置
12‧‧‧音訊通道
14‧‧‧第一揚聲器設置第一擴音器設置
16a‧‧‧擴音器/左前(FL)揚聲器
16b、16c‧‧‧擴音器/揚聲器
18‧‧‧假想揚聲器判定器
22‧‧‧假想擴音器/假想揚聲器
24‧‧‧第二揚聲器設置/假想設置
26‧‧‧能量分佈計算器
28‧‧‧處理器
32、34‧‧‧區塊
36‧‧‧降混資訊
38‧‧‧顯現器
39‧‧‧輸入信號/音訊通道
Claims (17)
- 一種用於產生用於一第一揚聲器設置之多個音訊通道之裝置,其特性在於:一假想揚聲器判定器,其用於判定不含於該第一揚聲器設置中之一假想揚聲器之一位置以獲得含有該假想揚聲器之一第二揚聲器設置;一能量分佈計算器,其用於計算自該假想揚聲器至該第二揚聲器設置中之另一揚聲器的一能量分佈;一處理器,其用於重複該能量分佈以獲得用於自該第二揚聲器設置至該第一揚聲器設置之一降混的一降混資訊;以及一顯現器,其用於使用該降混資訊產生該等多個音訊通道。
- 如請求項1之裝置,其中該處理器經組配以基於該能量分佈產生一能量分佈矩陣(D),其中該能量分佈矩陣(D)包含表示該假想揚聲器至該第二揚聲器設置之另一揚聲器的該能量分佈之元素(dxy)。
- 如請求項2之裝置,其中該處理器經進一步組配以計算該能量分佈矩陣(D)之一冪(n),其中該冪(n)為一預定義值,且其中該處理器經組配以基於該能量分佈矩陣(D)之該冪獲得該降混資訊。
- 如請求項2之裝置,其中該處理器經進一步組配以迭代地計算該能量分佈矩陣(D)之一冪(n),其中迭代步驟之 一數目係基於該能量分佈矩陣(D)之該冪(n)之一值。
- 如前述請求項中任一項之裝置,其中該能量分佈計算器包含一鄰域估計器,該鄰域估計器用於判定該第二揚聲器設置的為該假想揚聲器之一相鄰者的至少一個揚聲器,且其中該能量分佈計算器經組配以計算該假想揚聲器至該假想揚聲器之該至少一個相鄰者的該能量分佈。
- 如請求項5之裝置,其中該鄰域估計器經組配以判定為該假想揚聲器之相鄰者的至少兩個揚聲器,且其中該能量分佈計算器經組配以計算該能量分佈,使得為該假想揚聲器之相鄰者的該等至少兩個揚聲器間之該能量分佈在一預定義容限內為相等的。
- 如請求項5或6中任一項之裝置,其中該鄰域估計器經組配以判定為該假想揚聲器之相鄰者的至少兩個揚聲器,且其中為該假想揚聲器之相鄰者的該等至少兩個揚聲器中之至少一者為一假想揚聲器。
- 如前述請求項中任一項之裝置,其中該第一揚聲器設置之該等揚聲器係在一預定義容限內配置於一幾何平面中,其中該幾何平面包含一預定義收聽者位置,且其中該假想揚聲器配置於該幾何平面之一側處。
- 如前述請求項中任一項之裝置,其中該第一揚聲器設置之一揚聲器配置於該幾何平面之一第一側處,且其中該假想揚聲器配置於該幾何平面的與該幾何平面之該第一側對置的一第二側處。
- 如前述請求項中任一項之裝置,其中該裝置由一格式轉 換單元包含,其中該格式轉換單元經組配以基於多個資料通道輸出該等多個音訊通道,且其中資料通道之一數目高於該等多個音訊通道之一數目。
- 如請求項1至9中任一項之裝置,其中該裝置包含一平移器,該平移器用於產生用於該第二擴音器設置之平移係數,且其中該顯現器經組配以基於該降混資訊及該等平移係數產生該等多個音訊通道。
- 如請求項11之裝置,其中該裝置由一物件顯現器包含,其中該物件顯現器經組配以基於聲學物件之位置資訊輸出該等多個音訊通道,且其中平移係數之一數目高於該等多個音訊通道之一數目。
- 如前述請求項中任一項之裝置,其中該假想揚聲器判定器經組配以基於該第一揚聲器設置之揚聲器之一位置計算一凸包且根據一快速凸包演算法判定該假想揚聲器之該位置,其中該假想揚聲器之該位置及該第一揚聲器設置之揚聲器之該位置在一預定義臨限值內配置於該凸包處。
- 如請求項13之裝置,其中該裝置經組配以提供該第一揚聲器設置之一有效性資訊,該有效性資訊指示該第一揚聲器設置中的每一揚聲器之一位置在一預定義臨限值內配置於該凸包處或指示該第一揚聲器設置中的至少一個揚聲器之一位置在一預定義臨限值內配置於該凸包外。
- 一種音訊系統,其包含 如請求項1至14中任一項之一裝置;以及根據該等多個音訊通道之多個擴音器;其中該等多個擴音器經組配以接收該等多個音訊通道且基於該等多個音訊通道提供多個聲學信號。
- 一種用於產生用於一第一揚聲器設置之多個音訊通道之方法,其包含:判定不含於該第一揚聲器設置中之一假想揚聲器之一位置且獲得含有該假想揚聲器之一第二揚聲器設置;計算自該假想揚聲器至該第二揚聲器設置中之另一揚聲器的一能量分佈;重複該能量分佈且獲得用於自該第二揚聲器設置至該第一揚聲器設置之一降混的一降混資訊;以及使用該降混資訊產生該等多個音訊通道。
- 一種非暫時性儲存媒體,其具有儲存於其上之一電腦程式,該電腦程式具有在執行於一電腦上時用於執行如請求項16的用於產生用於一第一揚聲器設置之多個音訊通道的一方法之一程式碼。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14150362.3A EP2892250A1 (en) | 2014-01-07 | 2014-01-07 | Apparatus and method for generating a plurality of audio channels |
PCT/EP2015/050043 WO2015104237A1 (en) | 2014-01-07 | 2015-01-05 | Apparatus and method for generating a plurality of audio channels |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201534144A true TW201534144A (zh) | 2015-09-01 |
TWI558231B TWI558231B (zh) | 2016-11-11 |
Family
ID=49955911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104100290A TWI558231B (zh) | 2014-01-07 | 2015-01-06 | 用以產生多個音訊通道之裝置及方法 |
Country Status (18)
Country | Link |
---|---|
US (6) | US9729995B2 (zh) |
EP (4) | EP2892250A1 (zh) |
JP (1) | JP6228689B2 (zh) |
KR (1) | KR101806060B1 (zh) |
CN (1) | CN105934955B (zh) |
AR (1) | AR099037A1 (zh) |
AU (1) | AU2015205696B2 (zh) |
BR (1) | BR112016015028B1 (zh) |
CA (1) | CA2934811C (zh) |
ES (2) | ES2773623T3 (zh) |
MX (1) | MX352097B (zh) |
MY (1) | MY188021A (zh) |
PL (2) | PL3618460T3 (zh) |
PT (1) | PT3092823T (zh) |
RU (1) | RU2676948C2 (zh) |
SG (1) | SG11201605560UA (zh) |
TW (1) | TWI558231B (zh) |
WO (1) | WO2015104237A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2892250A1 (en) | 2014-01-07 | 2015-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a plurality of audio channels |
CN106303897A (zh) * | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
US9854375B2 (en) * | 2015-12-01 | 2017-12-26 | Qualcomm Incorporated | Selection of coded next generation audio data for transport |
US10419866B2 (en) | 2016-10-07 | 2019-09-17 | Microsoft Technology Licensing, Llc | Shared three-dimensional audio bed |
WO2018202642A1 (en) * | 2017-05-04 | 2018-11-08 | Dolby International Ab | Rendering audio objects having apparent size |
EP3619922B1 (en) | 2017-05-04 | 2022-06-29 | Dolby International AB | Rendering audio objects having apparent size |
US20190250878A1 (en) * | 2018-02-15 | 2019-08-15 | Disney Enterprises, Inc. | Remote control for an audio monitoring system |
EP3541097B1 (en) * | 2018-03-13 | 2022-04-13 | Nokia Technologies Oy | Spatial sound reproduction using multichannel loudspeaker systems |
US10904687B1 (en) * | 2020-03-27 | 2021-01-26 | Spatialx Inc. | Audio effectiveness heatmap |
CN115226001B (zh) * | 2021-11-24 | 2024-05-03 | 广州汽车集团股份有限公司 | 声能量补偿方法、装置及计算机设备 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5889867A (en) * | 1996-09-18 | 1999-03-30 | Bauck; Jerald L. | Stereophonic Reformatter |
JP2001028799A (ja) * | 1999-05-10 | 2001-01-30 | Sony Corp | 車載用音響再生装置 |
US8054980B2 (en) * | 2003-09-05 | 2011-11-08 | Stmicroelectronics Asia Pacific Pte, Ltd. | Apparatus and method for rendering audio information to virtualize speakers in an audio system |
US7813933B2 (en) * | 2004-11-22 | 2010-10-12 | Bang & Olufsen A/S | Method and apparatus for multichannel upmixing and downmixing |
EP1696702B1 (en) * | 2005-02-28 | 2015-08-26 | Sony Ericsson Mobile Communications AB | Portable device with enhanced stereo image |
CN101185118B (zh) * | 2005-05-26 | 2013-01-16 | Lg电子株式会社 | 解码音频信号的方法和装置 |
JP2007116365A (ja) * | 2005-10-19 | 2007-05-10 | Sony Corp | マルチチャンネル音響システム及びバーチャルスピーカ音声生成方法 |
US8515105B2 (en) * | 2006-08-29 | 2013-08-20 | The Regents Of The University Of California | System and method for sound generation |
JP4561785B2 (ja) | 2007-07-03 | 2010-10-13 | ヤマハ株式会社 | スピーカアレイ装置 |
FR2922404B1 (fr) * | 2007-10-10 | 2009-12-18 | Goldmund Monaco Sam | Methode pour creer un environnement audio avec n haut-parleurs |
CN102246543B (zh) * | 2008-12-11 | 2014-06-18 | 弗兰霍菲尔运输应用研究公司 | 产生多信道音频信号的装置 |
EP2360681A1 (en) * | 2010-01-15 | 2011-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information |
JP2011211312A (ja) * | 2010-03-29 | 2011-10-20 | Panasonic Corp | 音像定位処理装置及び音像定位処理方法 |
US20120113224A1 (en) * | 2010-11-09 | 2012-05-10 | Andy Nguyen | Determining Loudspeaker Layout Using Visual Markers |
ES2909532T3 (es) * | 2011-07-01 | 2022-05-06 | Dolby Laboratories Licensing Corp | Aparato y método para renderizar objetos de audio |
ES2871224T3 (es) * | 2011-07-01 | 2021-10-28 | Dolby Laboratories Licensing Corp | Sistema y método para la generación, codificación e interpretación informática (o renderización) de señales de audio adaptativo |
EP2645749B1 (en) * | 2012-03-30 | 2020-02-19 | Samsung Electronics Co., Ltd. | Audio apparatus and method of converting audio signal thereof |
KR102681514B1 (ko) * | 2012-07-16 | 2024-07-05 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 음장 표현을 렌더링하는 방법 및 장치 |
EP2891338B1 (en) * | 2012-08-31 | 2017-10-25 | Dolby Laboratories Licensing Corporation | System for rendering and playback of object based audio in various listening environments |
EP2892250A1 (en) | 2014-01-07 | 2015-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a plurality of audio channels |
-
2014
- 2014-01-07 EP EP14150362.3A patent/EP2892250A1/en not_active Withdrawn
-
2015
- 2015-01-05 RU RU2016132133A patent/RU2676948C2/ru active
- 2015-01-05 MX MX2016008877A patent/MX352097B/es active IP Right Grant
- 2015-01-05 SG SG11201605560UA patent/SG11201605560UA/en unknown
- 2015-01-05 CA CA2934811A patent/CA2934811C/en active Active
- 2015-01-05 PL PL19203003.9T patent/PL3618460T3/pl unknown
- 2015-01-05 WO PCT/EP2015/050043 patent/WO2015104237A1/en active Application Filing
- 2015-01-05 CN CN201580003783.1A patent/CN105934955B/zh active Active
- 2015-01-05 ES ES15700180T patent/ES2773623T3/es active Active
- 2015-01-05 JP JP2016562066A patent/JP6228689B2/ja active Active
- 2015-01-05 AU AU2015205696A patent/AU2015205696B2/en active Active
- 2015-01-05 PT PT157001801T patent/PT3092823T/pt unknown
- 2015-01-05 KR KR1020167021526A patent/KR101806060B1/ko active IP Right Grant
- 2015-01-05 EP EP19203003.9A patent/EP3618460B1/en active Active
- 2015-01-05 MY MYPI2016001211A patent/MY188021A/en unknown
- 2015-01-05 BR BR112016015028-7A patent/BR112016015028B1/pt active IP Right Grant
- 2015-01-05 EP EP15700180.1A patent/EP3092823B1/en active Active
- 2015-01-05 ES ES19203003T patent/ES2975074T3/es active Active
- 2015-01-05 EP EP24159429.0A patent/EP4351173A3/en active Pending
- 2015-01-05 PL PL15700180T patent/PL3092823T3/pl unknown
- 2015-01-06 TW TW104100290A patent/TWI558231B/zh active
- 2015-01-07 AR ARP150100025A patent/AR099037A1/es active IP Right Grant
-
2016
- 2016-07-05 US US15/202,443 patent/US9729995B2/en active Active
-
2017
- 2017-07-14 US US15/650,146 patent/US10097945B2/en active Active
-
2018
- 2018-10-08 US US16/154,502 patent/US10595153B2/en active Active
-
2020
- 2020-02-28 US US16/804,686 patent/US10904693B2/en active Active
-
2021
- 2021-01-11 US US17/145,758 patent/US11438723B2/en active Active
-
2022
- 2022-07-28 US US17/815,860 patent/US11785414B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI558231B (zh) | 用以產生多個音訊通道之裝置及方法 | |
Cuevas-Rodríguez et al. | 3D Tune-In Toolkit: An open-source library for real-time binaural spatialisation | |
JP6284955B2 (ja) | 仮想スピーカーを物理スピーカーにマッピングすること | |
CN105247894B (zh) | 音频装置及其方法 | |
US10674301B2 (en) | Fast and memory efficient encoding of sound objects using spherical harmonic symmetries | |
CN111869241B (zh) | 用于使用多通道扬声器系统的空间声音再现的装置和方法 | |
JP7449184B2 (ja) | 音場モデリング装置及びプログラム | |
JP2014045282A (ja) | 残響付加装置、残響付加プログラム | |
Tarzan et al. | Assessment of sound spatialisation algorithms for sonic rendering with headphones |