TW201426738A - 用以產生多個參數式音訊串流之裝置及方法和用以產生多個揚聲器信號之裝置及方法 - Google Patents
用以產生多個參數式音訊串流之裝置及方法和用以產生多個揚聲器信號之裝置及方法 Download PDFInfo
- Publication number
- TW201426738A TW201426738A TW102141061A TW102141061A TW201426738A TW 201426738 A TW201426738 A TW 201426738A TW 102141061 A TW102141061 A TW 102141061A TW 102141061 A TW102141061 A TW 102141061A TW 201426738 A TW201426738 A TW 201426738A
- Authority
- TW
- Taiwan
- Prior art keywords
- parametric
- audio
- input
- signals
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 56
- 230000005236 sound signal Effects 0.000 claims abstract description 107
- 238000012732 spatial analysis Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 15
- 238000002156 mixing Methods 0.000 claims description 10
- 239000003607 modifier Substances 0.000 claims description 5
- 238000009877 rendering Methods 0.000 description 25
- 238000012545 processing Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 230000004044 response Effects 0.000 description 15
- 239000013598 vector Substances 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000003491 array Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 238000009792 diffusion process Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic Arrangements (AREA)
Abstract
一種用以從於一記錄空間的一記錄所得的一輸入空間音訊信號產生複數個參數式音訊串流(θi,Ψi,Wi)的裝置包含一分段器及一產生器。該分段器係經組配以從該輸入空間音訊信號提供至少二個節段性音訊信號(Wi,Xi,Yi,Zi),其中該等至少二個節段性音訊信號(Wi,Xi,Yi,Zi)係與該記錄空間的相對應節段(Segi)相聯結。該產生器係經組配以針對該等至少二個節段性音訊信號(Wi,Xi,Yi,Zi)各自產生一參數式音訊串流以獲得該等複數個參數式音訊串流(θi,Ψi,Wi)。
Description
本發明大致上係有關於參數式空間音訊處理,及更明確言之,係有關於用以產生多個參數式音訊串流之裝置及方法和用以產生多個揚聲器信號之裝置及方法。進一步本發明之實施例係有關於以扇區為基礎的參數式空間音訊處理。
於多聲道收聽中,收聽者係由多個揚聲器圍繞。存在有多個已知方法以捕捉此種設備的音訊。首先考慮揚聲器系統及使用該等揚聲器系統所能產生的空間感受。沒有特殊技術,常見二聲道立體聲設備只能在連結揚聲器的線路上產生聽覺事件。無法產生來自其它方向的聲音。邏輯上,藉使用環繞收聽者的更多個揚聲器,能夠涵蓋更多個方位及可產生更自然的空間感受。最為眾所周知的多聲道揚聲器系統及布局為5.1標準(ITU-R 775-1),其係由相對
於收聽位置在0度、30度及110度的五個揚聲器組成。也已知具有位在不同位置的不等數目的揚聲器之其它系統。
於業界中,針對前述揚聲器系統已經設計出數種不同記錄方法以再生如同在記錄環境中所知覺的該收聽情況下的空間感受。於此種情況下,麥克風的指向性樣式須也相對應於揚聲器布局,使得來自任何單一方向的聲音只以一、二、或三個麥克風記錄。使用愈多個揚聲器,則需要的指向性樣式愈窄。但如此窄指向性麥克風相當昂貴,典型具有非平坦頻率響應,此乃非期望者。此外,使用具有太寬指向性樣式的數個麥克風作為多聲道再生的輸入,結果導致多彩而模糊的聽覺感受,原因在於從單一方向冒出的聲音經常係由比需要者更多個揚聲器所再生。因此,目前麥克風乃最適合二聲道記錄與再生而無環繞空間感受目標者。
空間聲音記錄的另一種已知辦法係記錄分散在寬廣空間面積的大量麥克風。舉例言之,當記錄在舞台上的一支管弦樂團時,單一樂器可藉所謂的點麥克風拾取,其位置係接近音源。前聲音舞台的空間分布例如可藉習知立體聲麥克風捕捉。相對應於後期混響的聲場成分可藉位距舞台相對遠距的數個麥克風捕捉。然後音響師可藉使用可用的全部麥克風聲道的組合而混合期望的多聲道輸出。但此項記錄技術暗示極大型記錄設備及記錄聲道的手工混音,經常實際上為不可行。
根據指向性音訊編碼(DirAC)的習知記錄與再生
系統(如述於T.Lokki、J.Merimaa、V.Pulkki:於多頻道收聽中再生自然或修正空間感受之方法,美國專利案第7,787,638 B2號,2010年8月31日及V.Pulkki:具有指向性音訊編碼的空間聲音再生,J.Audio Eng.Soc.,Vol.55,No.6,pp.503-516,2007)仰賴簡單通用的聲場模型。因而有若干系統性缺點,限制了實際上可達到的聲音品質及經驗。
已知解決方案的常見問題為該等方案相當複雜且典型地顗空間聲音品質降級相聯結。
因此,本發明之一目的係提出參數式空間音訊處理的改良構想,其許可使用相對容易且精簡的麥克風組態以達成更高品質更可靠的聲音記錄與再生。
本目的係藉如請求項1之裝置、如請求項13之裝置、如請求項15之方法、如請求項16之方法、如請求項17之電腦程式、或如請求項17之電腦程式達成。
依據本發明之一實施例,一種用以從於一記錄空間的一記錄所得的一輸入空間音訊信號產生複數個參數式音訊串流的裝置包含一分段器及一產生器。該分段器係經組配以從該輸入空間音訊信號提供至少二個節段性音訊信號。此處該等至少二個節段性音訊信號係與該記錄空間的相對應節段相聯結。該產生器係經組配以針對該等至少二個節段性音訊信號各自產生一參數式音訊串流以獲得該等複數個參數式音訊串流。
本發明潛在的基本構想為若從輸入空間音訊信號提供至少兩個輸入節段式音訊信號,其中該等至少兩個輸入節段式音訊信號係與該記錄空間的相對應節段相聯結,及若針對該等至少兩個輸入節段式音訊信號各自產生一參數式音訊串流以獲得複數個參數式音訊串流,則能夠達成改良的參數式空間音訊處理。如此許可使用相對容易且精簡的麥克風組態以達成更高品質更可靠的聲音記錄與再生。
依據又一實施例,該分段器係經組配以針對該記錄空間的該等節段各自使用一指向性樣式。此處,該指向性樣式指示該等至少兩個輸入節段式音訊信號的一指向性。藉使用該等指向性樣式,可能獲得所觀察的聲場特別複雜音景的更佳模型匹配。
依據又一實施例,該產生器係經組配以獲得複數個參數式音訊串流,其中該等複數個參數式音訊串流各自係包含該等至少二個輸入節段性音訊信號中之一成分及一相對應參數式空間資訊。例如,該等參數式音訊串流各自之該參數式空間資訊係包含到達方位(DOA)參數及/或一漫射性參數。藉提供該等DOA參數及/或漫射性參數,可能於參數式信號表示型態域中描述觀察得的聲場。
依據又一實施例,一種用以從記錄於一記錄空間的一輸入空間音訊信號推衍得的該等複數個參數式音訊串流產生複數個揚聲器信號的裝置包含一呈現器及一組合器。該呈現器係經組配以從該等複數個參數式音訊串流提
供複數個輸入節段式揚聲器信號。此處該等輸入節段式揚聲器信號係與該記錄空間的該等節段相聯結。該組合器係經組配以組合該輸入節段式揚聲器信號而獲得該等複數個揚聲器信號。
本發明之額外實施例提出產生複數個參數式音訊串流及產生複數個揚聲器信號之方法。
100、500‧‧‧裝置
105‧‧‧輸入空間音訊信號
110‧‧‧分段器
115‧‧‧輸入節段性音訊信號
120‧‧‧產生器
125、725-1~2‧‧‧參數式音訊串流
305‧‧‧指向性樣式
505‧‧‧參數式空間資訊
510‧‧‧呈現器
515、735-1~2‧‧‧輸入節段式揚聲器信號
520‧‧‧組合器
525‧‧‧揚聲器信號
600、700、800、900、1000、1100、1200‧‧‧示意說明圖
610、620、630、640‧‧‧節段
715-1~2‧‧‧節段式麥克風信號
720-1~2‧‧‧指向性及漫射性分析方塊
725-1‧‧‧第一參數式音訊串流
725-2‧‧‧第二參數式音訊串流
730-1‧‧‧第一呈現單元
730-2‧‧‧第二呈現單元
802、804、806、808‧‧‧乘數
803、805、807、809‧‧‧加權因數
810、814‧‧‧直達聲子串流
811、815‧‧‧增益因數乘數
812、816‧‧‧漫射子串流
813、817‧‧‧解相關處理區塊
822、824‧‧‧向量基底幅值汰選(VBAP)運算區塊
832、834‧‧‧組合單元
842、844‧‧‧加總單元
843、845‧‧‧揚聲器信號
905‧‧‧修正控制參數
910‧‧‧修正器
912、914‧‧‧修正單元
915、916、918‧‧‧已修正參數式音訊串流
1010、1020、1022、1030、1032‧‧‧指向性響應
1101、1102、1103‧‧‧節段或扇區
1110‧‧‧麥克風組態
1112、1114、1116‧‧‧指向性麥克風、線性麥克風陣列
1201‧‧‧統一圓陣列(UCA)
1210‧‧‧全向麥克風
後文中,將參考附圖解說本發明之實施例,附圖中:圖1顯示用以從使用一分段器及一產生器記錄在一記錄空間裡的一輸入空間音訊信號產生複數個參數式音訊串流的裝置之一實施例的方塊圖;圖2顯示根據混合或矩陣化操作依據圖1之該裝置之該實施例的分段器之示意說明圖;圖3顯示使用一指向性樣式依據圖1之該裝置之實施例的該分段器之一示意說明圖;圖4顯示根據參數式空間分析依據圖1之該裝置之該實施例的分段器之示意說明圖;圖5顯示使用一呈現器及一組合器從複數個參數式音訊串流以產生複數個揚聲器信號之裝置的一實施例之方塊圖;圖6顯示一記錄空間之節段實施例之示意說明圖,各自表示在一二維(2D)平面內部之一方位子集;圖7顯示針對一記錄空間的兩個節段或扇區一揚聲器
信號運算實施例之示意說明圖;圖8顯示使用二級B格式輸入信號針對一記錄空間的兩個節段或扇區之一揚聲器信號運算之一實施例的示意說明圖;圖9顯示針對於一參數式信號表示型態域中包括一信號修正的一記錄空間之兩個節段或扇區之揚聲器信號運算之一實施例的示意說明圖;圖10顯示由依據圖1裝置之該實施例的分段器所提供的輸入節段式音訊信號的指向性樣式之一實施例的示意說明圖;圖11顯示用以執行聲場記錄的麥克風組態之一實施例的示意說明圖;及圖12顯示用以獲得更高級麥克風信號的全向麥克風之圓陣列之一實施例的示意說明圖。
於利用附圖以進一步細節討論本發明之前,須指出於附圖中相同元件、具有相同功能或相同效果的元件係被提供以相同的元件符號,使得於不同實施例中示例說明的此等元件之描述及其功能於不同實施例中係可彼此交換或可彼此運用。
圖1顯示用以從使用一分段器110及一產生器120記錄在一記錄空間裡的一輸入空間音訊信號105產生複數個參數式音訊串流125(θi,Ψi,Wi)的裝置100之一實施例的
方塊圖。舉例言之,該輸入空間音訊信號105包含一全向信號W及複數個不同方位信號X、Y、Z、U、V(或X、Y、U、V)。如圖1所示,該裝置100包含一分段器110及一產生器120。例如該分段器110係經組配以從該輸入空間音訊信號105的該全向信號W及複數個不同方位信號X、Y、Z、U、V提供至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi),其中該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)係與該記錄空間的相對應節段Segi相聯結。此外,產生器120可經組配以針對該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)各自產生一參數式音訊串流以獲得複數個參數式音訊串流125(θi,Ψi,Wi)。
藉用以產生複數個參數式音訊串流125的裝置100,可能避免空間聲音品質的降級與避免相對複雜的麥克風組態。據此,依據圖1的裝置100之實施例許可利用相對簡單而精簡的麥克風組態即獲得更高品質更可靠的空間聲音記錄。
於實施例中,該記錄空間的該節段Segi各自表示一二維(2D)平面內部或一三維(3D)空間內部的方位之一子集。
於實施例中,該記錄空間的該節段Segi各自係藉一相聯結的指向性度量特徵化。
依據實施例,該裝置100係經組配以執行聲場記錄而獲得輸入空間音訊信號105。舉例言之,分段器110係經組配以將一關注的全角度範圍劃分成為該記錄空間的該
等節段Segi。又復,該記錄空間的該等節段Segi可各自涵蓋比該關注的全角度範圍更小的角度範圍。
圖2顯示根據混合(或矩陣化)操作依據圖1之該裝置100之該實施例的分段器110之示意說明圖。如圖2舉例說明,分段器110係經組配以運用一混合或矩陣化運算,取決於該記錄空間的該等節段Segi,從該全向信號W及複數個不同方位信號X、Y、Z、U、V而產生該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)。藉圖2示例說明的分段器110,運用一預先界定的混合或矩陣化運算,可能對映組成該該輸入空間音訊信號105的該全向信號W及複數個不同方位信號X、Y、Z、U、V至該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)。此一預先界定的混合或矩陣化運算係取決於該記錄空間的該等節段Segi,且能實質上用以從該輸入空間音訊信號105分支該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)。與用在聲場的一單純通用模型相反,根據混合或矩陣化運算,藉該分段器110而分支該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)實質上許可達成前述優點。
圖3顯示使用一(期望的或預定的)指向性樣式305 qi(I),依據圖1之該裝置100之實施例的該分段器110之一示意說明圖。如圖3之示意描繪,該分段器110係經組配以針對該記錄空間的該等節段Segi各自使用一指向性樣式305 qi(I)。此外,指向性樣式305 qi(I)可指示該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)的指向性。
於實施例中,指向性樣式305 qi()係由下式給定
於該處a及b表示可經改性以獲得期望的指向性樣式之乘數,及其中表示一方位角,及Θi指示該記錄空間的第i個節段之一較佳方位。舉例言之,a係於0至1之範圍及b係於-1至1之範圍。
乘數a、b的一項有用的選擇可為a=0.5及b=0.5,獲得如下指向性樣式:
藉圖3示意地描繪的該分段器110,可能獲得分別地具有指向性樣式305 qi()的與該記錄空間的該等相對應節段Segi相聯結的該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)。此處須指出針對該記錄空間的該等節段Segi各自,使用指向性樣式305 qi()許可加強空間聲音品質。
圖4顯示根據參數式空間分析,依據圖1之該裝置100之實施例的該產生器120之一示意說明圖。如圖4之描繪實施例,產生器120係經組配以獲得複數個參數式音訊串流125(θi、Ψi、Wi)。此外,該等複數個參數式音訊串流125(θi,Ψi,Wi)可各自包含該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)之一成分Wi及一相對應參數式空間資訊θi、Ψi。
於實施例中,產生器120可經組配以針對該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)各自執行參數式空間分析以獲得該相對應參數式空間資訊θi、Ψi。
於實施例中,參數式音訊串流125(θi,Ψi,Wi)各自的參數式空間資訊θi、Ψi包含一到達方位(DOA)參數θi及/或一漫射性參數Ψi。
於實施例中,由實施例4舉例描繪之產生器120所提供的到達方位(DOA)參數θi及/或漫射性參數Ψi可組成參數式空間音訊信號處理的DirAC參數。舉例言之,產生器120係經組配以利用該等至少兩個輸入節段性音訊信號115的一時頻表示式而產生DirAC參數(例如DOA參數θi及漫射性參數Ψi)。
圖5顯示使用一呈現器510及一組合器520從複數個參數式音訊串流125(θi、Ψi、Wi)以產生複數個揚聲器信號525(L1,L2,...)之裝置500的一實施例之方塊圖。於圖5之實施例中,複數個參數式音訊串流125(θi、Ψi、Wi)可從記錄在一記錄空間的一輸入空間音訊信號(例如圖1實施例中舉例描繪的輸入空間音訊信號105)導出。如圖5所示,該裝置500包含一呈現器510及一組合器520。舉例言之,該呈現器510係經組配以從複數個參數式音訊串流125(θi,Ψi,Wi)提供複數個輸入節段式揚聲器信號515,其中該輸入節段式揚聲器信號515係與該記錄空間之相對應節段Segi相聯結。此外,該組合器520可經組配以組合該等輸入節段式揚聲器信號515以獲得複數個揚聲器信號525(L1,L2,...)。
藉由提供圖5之裝置500,可能從複數個參數式音訊串流125(θi,Ψi,Wi)產生複數個揚聲器信號525(L1,L2,...),其中參數式音訊串流125(θi,Ψi,Wi)可從圖1之裝置
100發送。又復,圖5之裝置500許可使用從相對簡單而精簡的麥克風組態所導出的參數式音訊串流達成更高品質更可靠的空間聲音再生。
於實施例中,呈現器510係經組配以接收複數個參數式音訊串流125(θi,Ψi,Wi)。舉例言之,複數個參數式音訊串流125(θi,Ψi,Wi)各自包含一節段式音訊成分Wi及一相對應參數式空間資訊θi、Ψi。此外,該呈現器510可經組配以運用該相對應參數式空間資訊505(θi,Ψi)呈現節段式音訊成分Wi各自以獲得複數個輸入節段式揚聲器信號515。
圖6顯示一記錄空間之節段Segi(i=1、2、3、4)610、620、630、640之示意說明圖600。於該圖6之示意說明圖600中,該記錄空間之節段610、620、630、640之實施例各自表示在一二維(2D)平面內部之一方位子集。此外,記錄空間之節段Segi各自表示在一三維(3D)空間內部之一方位子集。舉例言之,表示在該三維(3D)空間內部之該方位子集的節段Segi可與圖6舉例描繪的節段610、620、630、640相似。依據圖6之示意說明圖600,舉例顯示圖1之裝置100的四個節段610、620、630、640實施例。但也可能使用不同數目的節段Segi(i=1、2、...、n,其中i為整數指數,及n表示節段數目)。節段610、620、630、640實施例各自可以極座標系(例如參考圖6)表示。至於三維(3D)空間,節段Segi同樣地可以球座標系表示。
於實施例中,舉例顯示於圖1的分段器110可經組配以使用節段Segi(例如圖6之節段610、620、630、640實施
例)以提供該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)。藉使用該等節段(或扇區),可能實現聲場的以節段為基礎(或以扇區為基礎)的參數模型。如此許可以相對精簡的麥克風組態而達成較高品質的空間音訊記錄及再生。
圖7顯示針對一記錄空間的兩個節段或扇區一揚聲器信號運算實施例之示意說明圖700。於圖7之示意說明圖700中,舉例描繪用以產生複數個參數式音訊串流125(θi,Ψi,Wi)的裝置100之實施例及用以產生複數個揚聲器信號525(L1,L2,...)的裝置500之實施例。如圖7之示意說明圖700所示,分段器110可經組配以接收輸入空間音訊信號105(例如麥克風信號)。又復,分段器110可經組配以提供該等至少兩個輸入節段性音訊信號115(例如一第一節段之節段式麥克風信號715-1及一第二節段之節段式麥克風信號715-2)。該產生器120可包含一第一參數式空間分析方塊720-1及一第二參數式空間分析方塊720-2。此外,該產生器120可經組配以針對該等至少兩個輸入節段性音訊信號115各自產生該參數式音訊串流。在該裝置100之該實施例的輸出,將獲得複數個參數式音訊串流125。舉例言之,該第一參數式空間分析方塊720-1將輸出一第一節段之一第一參數式音訊串流725-1,而該第二參數式空間分析方塊720-2將輸出一第二節段之一第二參數式音訊串流725-2。又復,由該第一參數式空間分析方塊720-1提供的該第一參數式音訊串流725-1可包含一第一節段之參數式空間資訊(例如θ1、Ψ1)及該第一節段之一或多個節段式音訊信號(例如
W1),而由該第二參數式空間分析方塊720-2提供的該第二參數式音訊串流725-2可包含一第二節段之參數式空間資訊(例如θ2、Ψ2)及該第二節段之一或多個節段式音訊信號(例如W2)。該裝置100之實施例可經組配以發送複數個參數式音訊串流125。也如圖7之示意說明圖700顯示,該裝置500之實施例可經組配以從該裝置100之實施例接收複數個參數式音訊串流125。呈現器510可包含一第一呈現單元730-1及一第二呈現單元730-2。此外,該呈現器510可經組配以從所接收的複數個參數式音訊串流125提供複數個輸入節段式揚聲器信號515。舉例言之,第一呈現單元730-1可經組配以從一第一節段的第一參數式音訊串流725-1提供該第一節段的輸入節段式揚聲器信號735-1,第二呈現單元730-2可經組配以從一第二節段的第二參數式音訊串流725-2提供該第二節段的輸入節段式揚聲器信號735-2。此外,該組合器520可經組配以組合該輸入節段式揚聲器信號515而獲得複數個揚聲器信號525(L1,L2,...)。
圖7之實施例大致表示使用聲場的以節段為基礎(或以扇區為基礎)的參數模型之一較高品質的空間音訊記錄及再生,其許可以相對精簡的麥克風信號也記錄複雜的空間音訊場景。
圖8顯示使用二級B格式輸入信號105針對一記錄空間的兩個節段或扇區之一揚聲器信號運算之一實施例的示意說明圖800。圖8示意說明的揚聲器信號運算之實施例大致上相對應於圖7示意說明的揚聲器信號運算之實施
例。於圖8之示意說明圖中,舉例描繪用以產生複數個參數式音訊串流125之裝置100之實施例及用以產生複數個揚聲器信號525之裝置500之實施例。如圖8所示,裝置100之實施例可經組配以接收輸入空間音訊信號105(例如B格式麥克風聲道諸如[W、X、Y、U、V])。此處,須注意圖8中之信號U、V為第二級B格式成分。例如以「矩陣化」標示的分段器110可經組配以利用混合或矩陣化運算,取決於該記錄空間的該等節段Segi,而從該全向信號及複數個不同方位信號產生該等至少兩個輸入節段性音訊信號115。舉例言之,該等至少兩個輸入節段性音訊信號115可包含一第一節段(例如[W1、X1、Y1])之節段式麥克風信號715-1及一第二節段(例如[W2、X2、Y2])之節段式麥克風信號715-2。此外,產生器120可包含一第一指向性及漫射性分析方塊720-1及一第二指向性及漫射性空間分析方塊720-2。圖8舉例顯示的該第一及第二指向性及漫射性空間分析方塊720-1及720-2大致上係相對應於圖7舉例顯示的該第一及第二參數式空間分析方塊720-1、720-2。產生器120可經組配以針對該等至少兩個輸入節段性音訊信號115各自產生一參數式音訊串流而獲得複數個參數式音訊串流125。舉例言之,產生器120可經組配以使用第一指向性及漫射性分析方塊720-1對第一節段之節段式麥克風信號715-1執行空間分析,及用以從該第一節段之節段式麥克風信號715-1提取一第一成分(例如一節段式音訊成分W1)以獲得第一節段之第一參數式音訊串流725-1。此外,該產生器120可經組配以
使用第二指向性及漫射性分析方塊720-2對第二節段之節段式麥克風信號715-2執行空間分析,及用以從該第二節段之節段式麥克風信號715-2提取一第二成分(例如一節段式音訊成分W1)以獲得第二節段之第二參數式音訊串流725-2。舉例言之,第一節段之第一參數式音訊串流725-1可包含該第一節段之參數式空間資訊包含一第一到達方位(DOA)參數θ1及一第一漫射性參數Ψ1以及一第一提取成分W1;而第二節段之第二參數式音訊串流725-2可包含該第二節段之參數式空間資訊包含一第二到達方位(DOA)參數θ2及一第二漫射性參數Ψ2以及一第二提取成分W2。裝置100之實施例可經組配以發送複數個參數式音訊串流125。
也如圖8之示意說明圖800顯示,用以產生複數個揚聲器信號525的該裝置500之實施例可經組配以接收從裝置100之實施例發送的複數個參數式音訊串流125。於圖8之示意說明圖800中,呈現器510包含第一呈現單元730-1及第二呈現單元730-2。例如,第一呈現單元730-1包含一第一乘數802及一第二乘數804。第一呈現單元730-1之第一乘數802可經組配以施加一第一加權因數803(例如)至該第一節段之第一參數式音訊串流725-1的節段式音訊信號W1以藉該第一呈現單元730-1獲得一直達聲子串流810,而第一呈現單元730-1之第二乘數804可經組配以施加一第二加權因數805(例如)至該第一節段之第一參數式音訊串流725-1的節段式音訊信號W1以藉該第一呈現單元730-1獲得一漫射子串流812。又復,第二呈現單元730-2包含一第一
乘數806及一第二乘數808。例如,第二呈現單元730-2之第一乘數806可經組配以施加一第一加權因數807(例如)至該第二節段之第二參數式音訊串流725-2的節段式音訊信號W2以藉該第二呈現單元730-2獲得一直達聲子串流814,而第二呈現單元730-2之第二乘數808可經組配以施加一第二加權因數809(例如)至該第二節段之第二參數式音訊串流725-2的節段式音訊信號W2以藉該第二呈現單元730-2獲得一漫射子串流816。於實施例中,該第一及該第二呈現單元730-1、730-2的該第一及第二加權因數803、805、807、809係從相對應漫射性參數Ψ1導出。依據實施例,該第一呈現單元730-1可包含增益因數乘數811、解相關處理區塊813及組合單元832,而第二呈現單元730-2可包含增益因數乘數815、解相關處理區塊817及組合單元834。舉例言之,第一呈現單元730-1的增益因數乘數811可經組配以施加得自藉區塊822進行一向量基底幅值汰選(VBAP)運算的增益因數至由第一呈現單元730-1的第一乘數802輸出的該直達聲子串流810。又復,該第一呈現單元730-1之解相關處理區塊813可經組配以施加一解相關/增益運算至在第一呈現單元730-1的第二乘數804的輸出之漫射子串流812。此外,第一呈現單元730-1的組合單元832可經組配以組合得自增益因數乘數811及解相關處理區塊813的該等信號以獲得第一節段之節段式揚聲器信號735-1。舉例言之,第二呈現單元730-2的增益因數乘數815可經組配以施加得自藉區塊824進行一向量基底幅值汰選(VBAP)運算的增益
因數至由第二呈現單元730-2的第一乘數806輸出的該直達聲子串流814。又復,該第二呈現單元730-2之解相關處理區塊817可經組配以施加一解相關/增益運算至在第二呈現單元730-2的第二乘數808的輸出之漫射子串流816。此外,第二呈現單元730-2的組合單元834可經組配以組合得自增益因數乘數815及解相關處理區塊817的該等信號以獲得第二節段之節段式揚聲器信號735-2。
於實施例中,藉第一及第二呈現單元730-1、730-2之區塊822、824的向量基底幅值汰選(VBAP)運算係取決於相對應到達方位(DOA)參數θi。如圖8舉例描繪,組合器520可經組配以組合輸入節段式揚聲器信號515以獲得複數個揚聲器信號525(L1,L2,...)。如圖8舉例描繪,組合器520可包含一第一加總單元842及一第二加總單元844。舉例言之,第一加總單元842係經組配以加總該第一節段之該節段式揚聲器信號735-1中之一第一者及該第二節段之該節段式揚聲器信號735-2中之一第一者以獲得一第一揚聲器信號843。此外,第二加總單元844係經組配以加總該第一節段之該節段式揚聲器信號735-1中之一第二者及該第二節段之該節段式揚聲器信號735-2中之一第二者以獲得一第二揚聲器信號845。該第一及第二揚聲器信號843、845可組成複數個揚聲器信號525。參考圖8之實施例,須注意針對各個節段,可產生針對該回放的全部揚聲器之潛在揚聲器信號。
圖9顯示針對於一參數式信號表示型態域中包括
一信號修正的一記錄空間之兩個節段或扇區之揚聲器信號運算之一實施例的示意說明圖900。於圖9之示意說明圖900中之揚聲器信號運算之該實施例大致上係相對應於圖7之示意說明圖700中的揚聲器信號運算之該實施例。但於圖9之示意說明圖900中之揚聲器信號運算之該實施例包括一額外信號修正。
於圖9之示意說明圖900中,裝置100包含分段器110及產生器120用以獲得複數個參數式音訊串流125(θi,Ψi,Wi)。此外,裝置500包括呈現器510及組合器520用以獲得複數個揚聲器信號525。
舉例言之,裝置100可進一步包含一修正器910用以修正於一參數式信號表示型態域中的複數個參數式音訊串流125(θi,Ψi,Wi)。此外,修正器910可經組配以使用一相對應修正控制參數905以修正參數式音訊串流125(θi,Ψi,Wi)中之至少一者。藉此方式,可獲得一第一節段的一第一已修正參數式音訊串流916及一第二節段的一第二已修正參數式音訊串流918。該第一及第二已修正參數式音訊串流916、918可組成複數個已修正參數式音訊串流915。於實施例中,該裝置100可經組配以發送複數個已修正參數式音訊串流915。此外,該裝置500可經組配以接收從該裝置100發送的複數個已修正參數式音訊串流915。
藉提供依據圖9之揚聲器信號運算之該實施例,可能達成更有彈性的空間音訊記錄及再生方案。更明確言之,當於參數域施加修正時,可能獲得更高品質輸出信號。
在產生複數個參數式音訊表示型態(串流)之前,藉將輸入信號分段,可獲得更高的空間選擇性,更佳許可差異地處理被捕捉聲場的不同成分。
圖10顯示依據圖1用以產生複數個參數式音訊串流125(θi,Ψi,Wi),由裝置100的實施例之分段器110提供的輸入節段性音訊信號115(Wi,Xi,Yi,Zi)的指向性之實施例的示意說明圖1000。於圖10之示意說明圖1000中,輸入節段性音訊信號115之實施例係於針對二維(2D)平面的個別極座標系中變成視覺化。同理,輸入節段性音訊信號115之實施例係於針對三維(3D)空間的個別極座標系中變成視覺化。圖10之示意說明圖1000舉例描繪針對一第一輸入節段性音訊信號(例如全向信號Wi)的一第一指向性響應1010、針對一第二輸入節段性音訊信號(例如第一方位信號Xi)的一第二指向性響應1020、及針對一第三輸入節段性音訊信號(例如第二方位信號Yi)的一第三指向性響應1030。此外,比較第二指向性響應1020具有相反符號的一第四指向性響應1022及比較第三指向性響應1030具有相反符號的一第五指向性響應1032係舉例描繪於圖10之示意說明圖1000。如此,不同的指向性響應1010、1020、1030、1022、1032(指向性)可由分段器110用於輸入節段性音訊信號115。此處須指出輸入節段性音訊信號115可取決於時間及頻率,亦即Wi=Wi(m,k);Xi=Xi(m,k);及Yi=Yi(m,k),其中(m,k)為指示在一空間音訊信號表示型態中之一時頻拼貼塊的指數。
於本脈絡中,須注意圖10舉例描繪針對單一輸入
信號集合的極圖,亦即針對單一扇區i的信號115(例如[Wi、Xi、Yi])。此外,極圖作圖的正及負部分一起表示一信號的極圖(舉例言之,部分1020及1022一起顯示信號Xi的極圖,而部分1030及1032一起顯示信號Yi的極圖)。
圖11顯示用以執行聲場記錄的一麥克風組態1110之實施例的示意說明圖1100。於圖11的示意說明圖1100中,該麥克風組態1110可包含指向性麥克風1112、1114、1116的多個線性陣列。圖11的示意說明圖1100舉例描繪二維(2D)觀察空間如何能夠劃分成該記錄空間的不同節段或扇區1101、1102、1103(例如Segi,i=1、2、3)。此處,圖11的節段1101、1102、1103可相對應於圖6舉例描繪的節段Segi。同理,麥克風組態1110之實施例也能用在三維(3D)觀察空間,其中該三維(3D)觀察空間可劃分成用於給定麥克風組態的節段或扇區。於實施例中,於圖11的示意說明圖1100中之該麥克風組態1110可用以針對依據圖1的該裝置100之實施例提供輸入空間音訊信號105。舉例言之,該麥克風組態1110之指向性麥克風1112、1114、1116的多個線性陣列可經組配以針對輸入空間音訊信號105提供不同的方位信號。藉使用圖11的麥克風組態1110實施例,可能使用聲場的以節段為基礎(或以扇區為基礎)的參數模型以最佳化該空間音訊記錄品質。
於先前實施例中,該裝置100及裝置500可經組配以於時頻域操作。
要言之,本發明之實施例係有關於高品質空間音
訊記錄及再生領域。使用聲場的以節段為基礎或以扇區為基礎的參數模型也許可以相對精簡麥克風組態記錄複雜的空間音訊場景。與業界現況方法假設聲場的簡單通用模型相反,可針對多個節段決定參數資訊,於該等節段中劃分整個觀察空間。因此,根據參數資訊連同已記錄的音訊聲道,可執行針對幾乎任意揚聲器組態的呈現。
依據實施例,針對平面二維(2D)聲場記錄,關注的整個方位角範圍可被劃分成涵蓋縮小範圍之方位角的多個扇區或節段。同理,以3D為例,完整立體角範圍(方位角及仰角)能被劃分成涵蓋一較小魚範圍的扇區或節段。不同的扇區或節段也可部分重疊。
依據實施例,各個扇區或節段係以相聯結的指向性度量加以特徵化,其可用以載明或參照相對應扇區或節段。該指向性度量例如可為指向(或自)該扇區或節段中心的一向量,或以2D為例為一方位角,或以3D為例為一方位角與一仰角的集合。該節段或扇區可稱作為在2D平面內部或在3D空間內部的一方位子集二者。為了表示型態的簡單,先前實施例係針對2D情況描述;但延伸至3D組態為直捷。
參考圖6,該指向性度量可定義為一向量,針對節段Seg3,從原點,亦即具有座標(0,0)的中心指向右,亦即朝向極圖的座標(1,0),或若於圖6中,角度係從(或參考)x軸(水平軸)計數則為0度方位角。
參考圖1之實施例,該裝置100可經組配以接收多個麥克風信號作為一輸入(輸入空間音訊信號105)。此等麥
克風信號例如可得自實際記錄,或可藉虛擬環境中的模擬記錄而人工產生。由此等麥克風信號,可決定相對應於節段麥克風信號(輸入節段性音訊信號115),其係與相對應節段(Segi)相聯結。節段麥克風信號具有特定特性特徵。比較在該相聯結的角扇區外部的敏感度,其指向拾取樣式可顯示在此角扇區內部顯著增高的敏感度。一360度全方位角之分段及該等相聯結的節段麥克風信號之拾取樣式之一實施例係參考圖6示例說明。於圖6之實施例中,與該等扇區相聯結的麥克風之指向性具有心型樣式,係根據由相對應扇區所涵蓋的角範圍旋轉。舉例言之,指向0度的與扇區3(Seg3)相聯結的麥克風之指向性也係指向0度。此處,須注意於圖6之極圖中,最大敏感度之方位為其中所描繪的曲線半徑包含最大值的方位。如此,Seg3對來自右側的聲音成分具有最高敏感度。換言之,節段Seg3具有其較佳方位於方位角0度(假設角度係從x軸算起)。
依據實施例,針對各個扇區,一DOA參數(θi)可連同一以扇區為基礎的漫射性參數(Ψi)決定。於一簡單具現中,針對全部扇區的漫射性參數(Ψi)可相同。原則上,可施用(例如藉產生器120)任何較佳DOA估計演算法。舉例言之,DOA參數(θi)可解譯為反射反向,其中大部分聲能係在所考慮的扇區內部行進。據此,以扇區為基礎的漫射性係有關於在該所考慮的扇區內部之漫射聲能與總聲能之比。須注意針對各個頻帶,參數估計(諸如以產生器120執行)可時間變異地個別地進行。
依據實施例,針對各個扇區,可組成一指向性音訊串流(參數式音訊串流)包括節段麥克風信號(Wi)及以扇區為基礎的DOA及漫射性參數(θi,Ψi),其主控描述在由該扇區表示的該角範圍內部之該聲場的空間音訊性質。舉例言之,用於回放的揚聲器信號525可使用參數式方位資訊(θi、Ψi)及節段麥克風信號125(例如Wi)中之一或多者決定。因此,針對各個節段可決定一節段式揚聲器信號515集合,然後諸如可藉組合器520組合(例如矩陣化或混合)以建立用於回放的揚聲器信號525。在一扇區內部的直達聲成分例如可藉施用向量基底幅值汰選之一實施例而呈現成點狀音源(如V.Pulkki:使用向量基底幅值汰選之虛擬音源定位,J.Audio Eng.Soc.,Vol.45,pp.456-466,1997所述),而漫射聲可同時從數個揚聲器回放。
圖7之方塊圖示例說明如前文針對二扇區描述的揚聲器信號525之運算。於圖7中,粗體箭頭表示音訊信號,而細箭頭表示參數信號或控制信號。於圖7中,示意說明由分段器110產生節段性音訊信號115,針對各個扇區(例如藉產生器120)施用參數式空間信號分析(方塊720-1、720-1),由呈現器510產生節段式揚聲器信號515,及藉組合器520組合節段式揚聲器信號515。
於實施例中,該分段器110可經組配以執行從一麥克風輸入信號105集合產生節段麥克風信號115。此外,產生器120可經組配以針對各扇區執行參數式空間信號分析的施用,因而將獲得針對各扇區的參數式音訊串流
725-1、725-2。舉例言之,參數式音訊串流725-1、725-2各自可由至少一個節段性音訊信號(例如分別為W1、W2)以及相聯結的參數資訊(例如分別為DOA參數θ1、θ2及漫射性參數Ψ1、Ψ2)組成。呈現器510可經組配以根據對該等特定扇區產生的參數式音訊串流725-1、725-2,針對各扇區執行節段式揚聲器信號515之產生。組合器520可經組配以執行節段式揚聲器信號515的組合以獲得終揚聲器信號525。
圖8之方塊圖示例說明針對第二級B格式麥克風信號應用之一實施例所顯示的二扇區情況,揚聲器信號525之運算。如圖8之實施例顯示,二(集合)節段式麥克風信號715-1(例如[W1、X1、Y1])及715-2(例如[W2、X2、Y2])可如前文說明藉混合或矩陣化運算(例如藉區塊110)而從一集合之輸入麥克風信號105產生。針對該等二節段式麥克風信號各自,可執行指向性音訊分析(例如藉方塊720-1、720-2),針對第一扇區及第二扇區分別獲得指向性音訊串流725-1(例如θ1、Ψ1、W1)及725-2(例如θ2、Ψ2、W2)。
於圖8中,針對各個扇區可分開產生節段式揚聲器信號515如下。節段音訊成分Wi藉使用從漫射性參數Ψi導出的乘數803、805、807、809加權而被劃分成兩個互補子串流810、812、814、816。一個子串流可主要載有直達聲成分,而另一個子串流可主要載有漫射聲成分。直達聲子串流810、814可使用由DOA參數θi決定的汰選增益811、815呈現,而漫射子串流812、816可使用解相關處理區塊813、817無條理地呈現。
至於最末步驟之實施例,可組合(例如藉區塊520)節段式揚聲器信號515以獲得終輸出信號525用於揚聲器再生。
參考圖9之實施例,值得一提在決定實際用於回放的揚聲器信號525之前,估計參數(參數式音訊串流125內部)也可經修正(例如藉修正器910)。舉例言之,DOA參數θi可重新對映以達成聲景的操弄。於其它情況下,若含括於此等扇區的某個或全部方位的聲音為非期望,則在運算揚聲器信號525之前,可衰減某些扇區的音訊信號(例如Wi)。類似地,若主要地或只須呈現直達聲,則可衰減漫射聲成分。針對分段成二節段的一實施例,此項處理包括參數式音訊串流125的修正910係舉例示例說明於圖9。
以先前實施例執行的2D情況實施例中,以扇區為基礎的參數估計之一實施例將說明如下。假設用於捕捉的麥克風信號可被轉換成所謂第二級B格式信號。第二級B格式信號可藉相對應麥克風的指向性形狀描述:
此處表示方位角。相對應B格式信號(例如圖8之輸入105)係以W(m,k)、X(m,k)、Y(m,k)、U(m,k)、及V(m,k)表示,於該處m及k分別表示時間及頻率指數。現在假設與
第i個扇區相聯結的分段麥克風信號具有指向性qi()。然後發明人能夠決定(例如藉方塊110)額外麥克風信號115,具有指向性Wi(m,k),Xi(m,k),Yi(m,k)可如下表示
以心形樣式qi()=0.5+0.5cos(+Θi)為例的所描述之麥克風信號的指向性之若干實施例係顯示於圖10。第i個扇區之較佳指向係取決於方位角Θi。於圖10中,虛線指示比較以實線描繪的指向性響應1020、1030,具有相反符號的指向性響應1022、1032(指向性)。
注意針對Θi=0之情況實施例,信號Wi(m,k),Xi(m,k),Yi(m,k)可根據下式藉混合輸入成分W、X、Y、U、V可從第二級B格式信號決定
W i (m,k)=0.5W(m,k)+0.5X(m,k) (10)
X i (m,k)=0.25W(m,k)+0.5X(m,k)+0.25U(m,k) (11)
Y i (m,k)=0.5Y(m,k)+0.25V(m,k) (12)
此項混合操作例如於圖2的積木110進行。注意qi()的不同選擇導致不同混合法則而從第二級B格式信號獲得成分Wi,Xi,Yi。
從節段性音訊信號115,Wi(m,k),Xi(m,k),Yi(m,k),然後發明人可藉運算以扇區為基礎的活性強度向量而決定(例如藉方塊120)與第i個扇區相聯結的DOA參數θi
於該處Re{A}表示複數A的實數部分,及*表示共軛複數。此外,ρ0乃空氣密度及c為音速。例如以單位向量e i(m,k)表示的期望DOA估值θi(m,k)可藉下式求出
發明人可進一步決定以扇區為基礎的聲場能量相關量
然後可由下式決定第i個扇區的期望的漫射性參數Ψi(m,k)
於該處g表示合宜定規因數,E{ }為預期運算元,及∥ ∥表示向量範數。可顯示以純漫射聲場為例,唯有當存在平面波且具有大於或等於1的正值時漫射性參數Ψi(m,k)才為零。一般而言,針對漫射性可定義另一對映函數,其具有相似表現,亦即只對直達聲給予0,而對全漫射聲場則趨近於1。
參考圖11之實施例,參數估計的另一項具現可用於不同麥克風組態。如圖11舉例描繪,可使用指向性麥克風的多個線性陣列1112、1114、1116。圖11也顯示針對給
定麥克風組態,2D觀察如何可被劃分成節段或扇區1101、1102、1103的一實施例。節段性音訊信號115可藉束形成技術諸如過濾及和束形成施加至線性麥克風陣列1112、1114、1116各自而決定。束形成也可被刪除,亦即指向性麥克風的指向性可用作為獲得針對各個扇區(Segi)顯示期望的空間選擇性之節段性音訊信號115。在各個扇區內部的DOA參數θi可使用常用估計技術估計,諸如「ESPRIT」演算法(如述於R.Roy及T.Kailath:透過旋轉不變技術的信號參數之ESPRI估計,IEEE聲學異動處理、語音及信號處理,37卷7期984995頁,1989年7月)。針對各個扇區的漫射性參數Ψi例如可藉評估DOA估值的時間變異決定(述於J.Ahonen、V.Pulkki:使用強度向量的時間變異之漫射性估計,IEEE信號處理應用於音訊及聲學工作坊,2009年。WAS-PAA’09,pp.285-288,2009年10月18-21日)。另外,可採用不同麥克風與直達對漫射聲比間之相干性的已知關係式(述於O.Thiergart、G.Del Galdo、E.A.P.Habets:全向麥克風,IEEE聲學、語音及信號處理國際會議(ICASSP),2012年309-312頁,2012年3月25-30日)。
圖12顯示用以獲得更高級麥克風信號(例如輸入空間音訊信號105)的全向麥克風1210之圓陣列實施例之示意說明圖1200。於圖12之示意說明圖1200中,全向麥克風1210之圓陣列例如包含5個等距麥克風於極圖中沿一圓(虛線)排列。於實施例中,全向麥克風1210之圓陣列可用以獲得更高級(HO)麥克風信號,容後詳述。為了從全向麥克風
信號(由全向麥克風1210提供)運算第二級麥克風信號U及V之實施例,須使用至少5個獨立麥克風信號。如圖12以實施例顯示,此點例如可使用統一圓陣列(UCA)簡練地達成。在某個時間及頻率得自麥克風信號的向量例如可使用離散富利葉變換(DFT)加以變換。麥克風信號W、X、Y、U及V(亦即輸入空間音訊信號105)然後可藉DFT係數的線性組合獲得。注意DFT係數表示從麥克風信號之向量求出的富利葉級數之係數。
設表示由指向性定義的廣義第m級麥克風信號
於該處表示方位角使得
然後,可證實
於該處
於該處j為虛數單位,k為波數,r及φ為界定極座標系的半徑及方位角,Jm(.)為第一種m級貝賽爾函數,及P m 為在極座標(r,φ)上測得的壓力信號之富利葉級數的係數。
注意在(較高級)B格式信號的計算之陣列設計及體現上須審慎避免因貝賽爾函數的數值性質導致的過度雜訊放大。
與所述信號變換相關的數學背景及推衍可參考例如A.Kuntz,使用虛擬圓麥克風陣列之波場分析,Dr.Hut,2009,ISBN:978-3-86853-006-3。
本發明之額外實施例係有關於一種從得自於一
記錄空間的記錄的一輸入空間音訊信號105產生複數個參數式音訊串流125(θi,Ψi,Wi)之方法。舉例言之,該輸入空間音訊信號105包含一全向信號W及複數個不同方位信號X、Y、Z、U、V。該方法包含從該輸入空間音訊信號105(例如該全向信號W及複數個不同方位信號X、Y、Z、U、V)提供至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi),其中該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)係與該記錄空間的相對應節段Segi相聯結。此外,該方法包含針對該等至少兩個輸入節段性音訊信號115(Wi,Xi,Yi,Zi)各自產生一參數式音訊串流以獲得複數個參數式音訊串流125(θi,Ψi,Wi)。
進一步本發明之實施例係有關於一種用以從記
錄於一記錄空間的一輸入空間音訊信號105推衍得的該等複數個參數式音訊串流125(θi,Ψi,Wi)產生複數個揚聲器信號525(L1,L2,...)的方法。該方法係包含從該等複數個參數式音訊串流125(θi,Ψi,Wi)提供複數個輸入節段式揚聲器信號515,其中該等輸入節段式揚聲器信號515係與該記錄空間的該等節段Segi相聯結。又復,該方法係包含組合該輸入節段式揚聲器信號515以獲得該等複數個揚聲器信號525(L1,L2,...)。
雖然已經以方塊圖脈絡描述本發明,於該處該等方塊表示實際或邏輯硬體成分,但本發明也係藉電腦具現之方法具現。於後述情況下,方塊表示相對應的方法步驟,於該處此等步驟表示由相對應邏輯或實體硬體區塊執行的功能。
所描述之實施例僅用於示例說明本發明之原理。須瞭解此處描述的排列及細節之修正及變化將為熟諳技藝人士顯然易知。因此,意圖僅受隨附之申請專利範圍各項之範圍所限而非藉此處實施例之說明及解釋所呈現的特定細節所限。
雖然已經以裝置脈絡描述若干面向,但顯然此等面向也表示該相對應方法的說明,於該處一方塊或一裝置係相對應於一方法步驟或一方法步驟的特性件。同理,以一方法步驟之脈絡描述的面向也表示一相對應裝置的一相對應區塊或物項或特性件之說明。該等方法步驟之部分或全部可藉(或使用)一硬體裝置執行,例如微處理器、可規劃
電腦或電子電路。於若干實施例中,最重要的方法步驟中之某一或多者可藉此種裝置執行。
該等參數式音訊串流125(θi,Ψi,Wi)可儲存於一數位儲存媒體上或可在一傳輸媒體諸如無線傳輸媒體或有線傳輸媒體諸如網際網路上傳輸。
取決於某些具現要求,本發明之實施例可於硬體或軟體具現。該具現可使用數位儲存媒體執行,諸如軟碟、DVD、藍光碟、CD、ROM、EPROM、EEPROM、或快閃記憶體具有可電子讀取控制信號儲存其上,其與可規劃電腦系統協作(或能夠協作)使得執行個別方法。因此,該數位儲存媒體可為電腦可讀取。
依據本發明之若干實施例包含一種具有可電子讀取控制信號的資料載體,其能夠與可規劃電腦系統協作使得執行此處描述之該等方法中之一者。
概略言之,本發明之實施例可具現為一種具有一程式碼的電腦程式產品,當該電腦程式產品在一電腦上跑時該程式碼係可操作用以執行該等方法中之一者。該程式碼例如可儲存於一機器可讀取載體上。
其它實施例係包含儲存於一機器可讀取載體上的此處描述之該等方法中之一者。
換言之,本發明之實施例因而為一種具有一程式碼的電腦程式,當該電腦程式在一電腦上跑時該程式碼係用以執行此處描述之該等方法中之一者。
因此,本發明方法之又一實施例為一種資料載體
(或數位儲存媒體或電腦可讀取媒體)包含用以執行此處描述之該等方法中之一者的電腦程式記錄於其上。該資料載體、數位儲存媒體或記錄媒體典型為具體有形及/或非過渡。
因此,本發明方法之又一實施例為一種資料串流或一序列之信號表示用以執行此處描述之該等方法中之一者的電腦程式。該資料串流或該序列之信號例如可經組配以透過一資料通訊連結例如透過網際網路傳輸。
又一實施例包含一種處理構件例如電腦或可規劃邏輯裝置經組配以或適用於執行此處描述之該等方法中之一者。
又一實施例包含一種電腦其上安裝有用以執行此處描述之該等方法中之一者的電腦程式。
本發明方法之又一實施例為一種裝置或系統經組配以傳輸(例如電子式或光學式)用以執行此處描述之該等方法中之一者的電腦程式。接收器例如可為電腦、行動裝置、記憶體裝置等。該裝置或系統例如可包含一檔案伺服器用以傳輸該電腦程式至接收器。
於若干實施例中,一種可規劃邏輯裝置(例如可現場程式規劃閘陣列)可用以執行此處描述之該等方法的功能之部分或全部。於若干實施例中,可現場程式規劃閘陣列可以微處理器操作以執行此處描述之該等方法中之一者。概略言之,該等方法係藉任一種硬體裝置執行。
本發明之實施例提出一種高品質實用的利用簡
單而精簡的麥克風組態之空間聲音記錄與再生。
本發明之實施例係根據指向性音訊編碼(DirAC)(如述於T.Lokki、J.Merimaa、V.Pulkki:於多聲道收聽中再生自然或修正空間感受之方法,美國專利案第7,787,638 B2號,2010年8月31日及V.Pulkki:具有指向性音訊編碼的空間聲音再生,J.Audio Eng.Soc.,Vol.55,No.6,pp.503-516,2007),其可用於不同麥克風系統及任意揚聲器設備。DirAC的效果係使用多聲道揚聲器系統僅可能地精準再生既有聲學環境的空間感受。在所選環境內部,響應(連續聲音或脈衝響應)可使用一全向麥克風(W)及使用一組麥克風測量,該組麥克風係許可測量聲音的到達方向(DOA)及聲音的漫射性。可能的方法係施用對準迪卡爾座標軸的三支8字形麥克風(X,Y,Z)。達成此項目的之一方式係使用「聲場」麥克風,其直接獲得全部期望的響應。令人關注地須注意全向麥克風信號表示聲壓,而偶極信號係與粒子速度向量的相對應於元素成比例。
由此等信號,DirAC參數亦即聲音的DOA及所觀察的聲場之漫射性可於具有一解析度係相對應於人類聽覺系統的解析度之合宜時/頻格柵測量。然後實際揚聲器信號可根據DirAC參數而從該全向麥克風信號決定(如V.Pulkki:具有指向性音訊編碼的空間聲音再生,J.Audio Eng.Soc.,Vol.55,No.6,pp.503-516,2007所述)。直達聲成分可使用汰選技術只藉少數揚聲器(例如一或二個)回放,而漫射聲成分可同時從全部揚聲器回放。
根據DirAC之本發明之實施例表示一種具有精簡麥克風組態之空間聲音記錄的簡單辦法。更明確言之,本發明避免了先前技術的若干系統性缺點其限制了實際上可達成的聲音品質及經驗。
與習知DirAC相反,本發明之實施例提出一種較高品質參數式空間分析處理。習知DirAC仰賴聲場的簡單通用模型,只採用一個DOA及一個漫射參數用於整個觀察空間。係根據假設針對各個時/頻拼貼塊,聲場可只以一個單一直達聲成分諸如一平面波及一個通用漫射參數表示。但結果實際上經常並不維持有關聲場的此種簡化假設。在複雜的真實世界聲學尤其為真,例如於該處多個音源諸如說話者或樂器同時作動。它方面,本發明之實施例不會導致所觀察聲場的模型不匹配,相對應參數估值更準確。也能防止模型不匹配結果,特別於收聽揚聲器輸出時,直達聲成分被漫射性地呈現及無法知覺方位時尤為如此。於實施例中,解相關器能用以從全部揚聲器產生回放的不相關漫射聲(如V.Pulkki:具有指向性音訊編碼的空間聲音再生,J.Audio Eng.Soc.,Vol.55,No.6,pp.503-516,2007所述)。與先前技術相反,於該處解相關器經常導入非期望的額外室內效應,本發明可能更準確地再生具有某個空間程度的音源(與使用DirAC的簡單聲場模型之情況相反,後者無法精準地捕捉此等音源)。
本發明之實施例提出於假設信號模型中更高的自由度,許可於複雜音景中的更佳模型匹配。
又復,以使用指向性麥克風而產生扇區(或任何其它時間不變線性例如實體手段)之情況下,能夠獲得較佳的麥克風之特有指向性。因此,較少需要施加時間變異增益以避免不明確方位、串擾、及染色。如此導致音訊信號路徑中的較少非線性處理,結果導致較高品質。
概略言之,更多直達聲成分可被呈現成直達音源(點音源/平面波音源)。結果,出現較少解相關缺陷,知覺更多(正確地)可定位事件,及可達成更確切的空間再生。
本發明之實施例提出於參數域中操弄的效能提高,例如指向性過濾(如述於M.Kallinger、H.Ochsenfeld、G.Del Galdo、F.Kuech、D.Mahne、R.Schultz-Amling、及O.Thiergart:指向性音訊編碼之空間過濾辦法,第126屆AES會議,報告7653,德國墨尼黑2009年),原因在於總信號能量的較大分量係具有正確DOA與其相聯結的直達聲事件,及可獲得較大量資訊。更多(參數式)資訊的提供例如許可分開多個直達聲成分或也分開來自不同方向撞擊的早期反射之直達聲成分。
更明確言之,實施例提出下列特徵。以2D為例,全方位角範圍能夠分裂成涵蓋減縮方位角範圍的扇區。以3D為例,全立體角範圍能夠分裂成涵蓋減縮立體角範圍的扇區。針對各個扇區,節段式麥克風信號可從所接收的麥克風信號決定,其主要係由來自與特定扇區對準的/所涵蓋的方位到達的聲音組成。此等麥克風信號也可藉模擬虛擬記錄人工決定。針對各個扇區,可執行參數式聲場分析決
定指向性參數諸如DOA及漫射性。針對各個扇區,參數式空間資訊(DOA及漫射性)主要描述與該特定扇區相聯結的該聲場之角範圍之空間性質。針對各個扇區,以回放為例,揚聲器信號可根據指向性參數及節段式麥克風信號決定。以操弄為例,在運算回放麥克風信號之前,估計參數及/或節段式音訊信號也可經修正以達成該音景的操弄。
100‧‧‧裝置
105‧‧‧輸入空間音訊信號
110‧‧‧分段器
115‧‧‧輸入節段性音訊信號
120‧‧‧產生器
125‧‧‧參數式音訊串流
Claims (18)
- 一種用以從於一記錄空間的一記錄所得的一輸入空間音訊信號產生複數個參數式音訊串流的裝置,該裝置係包含:一分段器以從該輸入空間音訊信號提供至少二個輸入節段性音訊信號,其中該等至少二個輸入節段性音訊信號係與該記錄空間的相對應節段相聯結;及一產生器以針對該等至少二個輸入節段性音訊信號各自產生一參數式音訊串流以獲得該等複數個參數式音訊串流。
- 如請求項1之裝置,其中該記錄空間的該等節段各自係表示在一二維(2D)平面內部或在一三維(3D)空間內部的一方位子集。
- 如請求項1或2之裝置,其中該記錄空間的該等節段各自係以一相聯結的指向度量為特徵。
- 如請求項1至3中任一項之裝置,其中該裝置係經組配以執行一聲場記錄以獲得該輸入空間音訊信號;其中該分段器係經組配以將一關注全角範圍劃分成該記錄空間的該等節段;其中該記錄空間的該等節段各自涵蓋比該關注全角範圍減少的一角範圍。
- 如請求項1至4中任一項之裝置,其中該輸入空間音訊信號係包含一全向信號及複數個不同方位信號。
- 如請求項1至5中任一項之裝置,其中該分段器係經組配以使用一混合運算,其係取決於該記錄空間的該等節段,以從該全向信號及該等複數個不同方位信號產生該等至少二個輸入節段性音訊信號。
- 如請求項1至6中任一項之裝置,其中該分段器係經組配以針對該記錄空間的該等節段各自而使用一指向性;其中該指向性樣式係指示該等至少二個節段性音訊信號的一指向性。
- 如請求項7之裝置,其中該指向性樣式(qi())係由下式給定qi()=a+b cos(+Θi),其中a及b表示乘數,其係經修正以獲得一期望的指向性樣式(qi());其中表示一方位角,及Θi指示該記錄空間的第i個節段之一較佳方位。
- 如請求項1至8中任一項之裝置,其中該產生器係經組配以獲得複數個參數式音訊串流;其中該等複數個參數式音訊串流各自係包含該等 至少二個輸入節段性音訊信號中之一成分及一相對應參數式空間資訊。
- 如請求項9之裝置,其中該產生器係經組配以針對該等至少二個輸入節段性音訊信號各自執行一參數式空間分析而獲得該相對應參數式空間資訊。
- 如請求項9或10之裝置,其中該等參數式音訊串流各自之該參數式空間資訊係包含到達方位(DOA)參數及/或一漫射性參數。
- 如請求項1至11中任一項之裝置,一修正器以修正於一參數信號表示型態域中的該等複數個參數式音訊串流;其中該修正器係經組配以使用一相對應修正控制參數以修正該等參數式音訊串流中之至少一者。
- 一種用以從記錄於一記錄空間的一輸入空間音訊信號推衍得的該等複數個參數式音訊串流產生複數個揚聲器信號的裝置,該裝置係包含:一呈現器以從該等複數個參數式音訊串流提供複數個輸入節段式揚聲器信號,其中該等輸入節段式揚聲器信號係與該記錄空間的該等節段相聯結;及一組合器以組合該輸入節段式揚聲器信號而獲得該等複數個揚聲器信號。
- 如請求項13之裝置,其中該呈現器係經組配以接收該等複數個參數式 音訊串流;其中該等複數個參數式音訊串流各自係包含一節段式音訊成分及一相對應參數式空間資訊;其中該呈現器係經組配以使用該相對應參數式空間資訊呈現該等節段式音訊成分各自而獲得該等複數個輸入節段式揚聲器信號。
- 一種用以從於一記錄空間的一記錄所得的一輸入空間音訊信號產生複數個參數式音訊串流的方法,該方法係包含:從該輸入空間音訊信號提供至少二個輸入節段性音訊信號,其中該等至少二個輸入節段性音訊信號係與該記錄空間的相對應節段相聯結;及針對該等至少二個輸入節段性音訊信號各自產生一參數式音訊串流以獲得該等複數個參數式音訊串流。
- 一種用以從記錄於一記錄空間的一輸入空間音訊信號推衍得的該等複數個參數式音訊串流產生複數個揚聲器信號的方法,該方法係包含:從該等複數個參數式音訊串流提供複數個輸入節段式揚聲器信號,其中該等輸入節段式揚聲器信號係與該記錄空間的該等節段相聯結;及組合該輸入節段式揚聲器信號而獲得該等複數個揚聲器信號。
- 一種具有一程式碼的電腦程式,當該電腦程式在一電腦上執行時該程式碼係用以執行如請求項15之方法。
- 一種具有一程式碼的電腦程式,當該電腦程式在一電腦上執行時該程式碼係用以執行如請求項16之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261726887P | 2012-11-15 | 2012-11-15 | |
EP13159421.0A EP2733965A1 (en) | 2012-11-15 | 2013-03-15 | Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201426738A true TW201426738A (zh) | 2014-07-01 |
TWI512720B TWI512720B (zh) | 2015-12-11 |
Family
ID=48013737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW102141061A TWI512720B (zh) | 2012-11-15 | 2013-11-12 | 用以產生多個參數式音訊串流之裝置及方法和用以產生多個揚聲器信號之裝置及方法 |
Country Status (13)
Country | Link |
---|---|
US (1) | US10313815B2 (zh) |
EP (2) | EP2733965A1 (zh) |
JP (1) | JP5995300B2 (zh) |
KR (1) | KR101715541B1 (zh) |
CN (1) | CN104904240B (zh) |
AR (1) | AR093509A1 (zh) |
BR (1) | BR112015011107B1 (zh) |
CA (1) | CA2891087C (zh) |
ES (1) | ES2609054T3 (zh) |
MX (1) | MX341006B (zh) |
RU (1) | RU2633134C2 (zh) |
TW (1) | TWI512720B (zh) |
WO (1) | WO2014076058A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105376691A (zh) * | 2014-08-29 | 2016-03-02 | 杜比实验室特许公司 | 感知方向的环绕声播放 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3018026B1 (fr) * | 2014-02-21 | 2016-03-11 | Sonic Emotion Labs | Procede et dispositif de restitution d'un signal audio multicanal dans une zone d'ecoute |
CN105992120B (zh) | 2015-02-09 | 2019-12-31 | 杜比实验室特许公司 | 音频信号的上混音 |
CN107290711A (zh) * | 2016-03-30 | 2017-10-24 | 芋头科技(杭州)有限公司 | 一种语音寻向系统及方法 |
EP3297298B1 (en) | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
GB2559765A (en) * | 2017-02-17 | 2018-08-22 | Nokia Technologies Oy | Two stage audio focus for spatial audio processing |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
US11393483B2 (en) | 2018-01-26 | 2022-07-19 | Lg Electronics Inc. | Method for transmitting and receiving audio data and apparatus therefor |
CN111819862B (zh) * | 2018-03-14 | 2021-10-22 | 华为技术有限公司 | 音频编码设备和方法 |
GB2572420A (en) * | 2018-03-29 | 2019-10-02 | Nokia Technologies Oy | Spatial sound rendering |
US20190324117A1 (en) * | 2018-04-24 | 2019-10-24 | Mediatek Inc. | Content aware audio source localization |
EP3618464A1 (en) * | 2018-08-30 | 2020-03-04 | Nokia Technologies Oy | Reproduction of parametric spatial audio using a soundbar |
GB201818959D0 (en) * | 2018-11-21 | 2019-01-09 | Nokia Technologies Oy | Ambience audio representation and associated rendering |
GB2611357A (en) * | 2021-10-04 | 2023-04-05 | Nokia Technologies Oy | Spatial audio filtering within spatial audio capture |
CN114023307B (zh) * | 2022-01-05 | 2022-06-14 | 阿里巴巴达摩院(杭州)科技有限公司 | 声音信号处理方法、语音识别方法、电子设备和存储介质 |
WO2024175587A1 (en) | 2023-02-23 | 2024-08-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal representation decoding unit and audio signal representation encoding unit |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04158000A (ja) * | 1990-10-22 | 1992-05-29 | Matsushita Electric Ind Co Ltd | 音場再生システム |
JP3412209B2 (ja) | 1993-10-22 | 2003-06-03 | 日本ビクター株式会社 | 音響信号処理装置 |
US6021206A (en) * | 1996-10-02 | 2000-02-01 | Lake Dsp Pty Ltd | Methods and apparatus for processing spatialised audio |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
GB2410164A (en) * | 2004-01-16 | 2005-07-20 | Anthony John Andrews | Sound feature positioner |
US7813513B2 (en) * | 2004-04-05 | 2010-10-12 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
JP5513887B2 (ja) * | 2006-09-14 | 2014-06-04 | コーニンクレッカ フィリップス エヌ ヴェ | 多チャネル信号のためのスイートスポット操作 |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
WO2009126561A1 (en) * | 2008-04-07 | 2009-10-15 | Dolby Laboratories Licensing Corporation | Surround sound generation from a microphone array |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
EP2346028A1 (en) * | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
US9552840B2 (en) * | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
CN202153724U (zh) * | 2011-06-23 | 2012-02-29 | 四川软测技术检测中心有限公司 | 有源组合扬声器 |
-
2013
- 2013-03-15 EP EP13159421.0A patent/EP2733965A1/en not_active Withdrawn
- 2013-11-12 TW TW102141061A patent/TWI512720B/zh active
- 2013-11-12 RU RU2015122630A patent/RU2633134C2/ru active
- 2013-11-12 EP EP13789558.7A patent/EP2904818B1/en active Active
- 2013-11-12 MX MX2015006128A patent/MX341006B/es active IP Right Grant
- 2013-11-12 CN CN201380066136.6A patent/CN104904240B/zh active Active
- 2013-11-12 WO PCT/EP2013/073574 patent/WO2014076058A1/en active Application Filing
- 2013-11-12 JP JP2015542238A patent/JP5995300B2/ja active Active
- 2013-11-12 CA CA2891087A patent/CA2891087C/en active Active
- 2013-11-12 BR BR112015011107-6A patent/BR112015011107B1/pt active IP Right Grant
- 2013-11-12 KR KR1020157015650A patent/KR101715541B1/ko active IP Right Grant
- 2013-11-12 ES ES13789558.7T patent/ES2609054T3/es active Active
- 2013-11-15 AR ARP130104217A patent/AR093509A1/es active IP Right Grant
-
2015
- 2015-05-14 US US14/712,576 patent/US10313815B2/en active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105376691A (zh) * | 2014-08-29 | 2016-03-02 | 杜比实验室特许公司 | 感知方向的环绕声播放 |
US10362401B2 (en) | 2014-08-29 | 2019-07-23 | Dolby Laboratories Licensing Corporation | Orientation-aware surround sound playback |
CN105376691B (zh) * | 2014-08-29 | 2019-10-08 | 杜比实验室特许公司 | 感知方向的环绕声播放 |
CN110636415A (zh) * | 2014-08-29 | 2019-12-31 | 杜比实验室特许公司 | 感知方向的环绕声播放 |
US10848873B2 (en) | 2014-08-29 | 2020-11-24 | Dolby Laboratories Licensing Corporation | Orientation-aware surround sound playback |
CN110636415B (zh) * | 2014-08-29 | 2021-07-23 | 杜比实验室特许公司 | 用于处理音频的方法、系统和存储介质 |
US11330372B2 (en) | 2014-08-29 | 2022-05-10 | Dolby Laboratories Licensing Corporation | Orientation-aware surround sound playback |
US11902762B2 (en) | 2014-08-29 | 2024-02-13 | Dolby Laboratories Licensing Corporation | Orientation-aware surround sound playback |
Also Published As
Publication number | Publication date |
---|---|
BR112015011107A2 (pt) | 2017-10-24 |
EP2904818B1 (en) | 2016-09-28 |
RU2633134C2 (ru) | 2017-10-11 |
WO2014076058A1 (en) | 2014-05-22 |
MX341006B (es) | 2016-08-03 |
TWI512720B (zh) | 2015-12-11 |
BR112015011107B1 (pt) | 2021-05-18 |
RU2015122630A (ru) | 2017-01-10 |
US20150249899A1 (en) | 2015-09-03 |
JP2016502797A (ja) | 2016-01-28 |
EP2904818A1 (en) | 2015-08-12 |
CA2891087A1 (en) | 2014-05-22 |
MX2015006128A (es) | 2015-08-05 |
CN104904240B (zh) | 2017-06-23 |
KR101715541B1 (ko) | 2017-03-22 |
US10313815B2 (en) | 2019-06-04 |
CN104904240A (zh) | 2015-09-09 |
EP2733965A1 (en) | 2014-05-21 |
AR093509A1 (es) | 2015-06-10 |
ES2609054T3 (es) | 2017-04-18 |
KR20150104091A (ko) | 2015-09-14 |
JP5995300B2 (ja) | 2016-09-21 |
CA2891087C (en) | 2018-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI512720B (zh) | 用以產生多個參數式音訊串流之裝置及方法和用以產生多個揚聲器信號之裝置及方法 | |
TWI770059B (zh) | 用以再生空間分散聲音之方法 | |
JP7119060B2 (ja) | マルチポイント音場記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト | |
US9578439B2 (en) | Method, system and article of manufacture for processing spatial audio | |
US9271081B2 (en) | Method and device for enhanced sound field reproduction of spatially encoded audio input signals | |
TWI458364B (zh) | 藉由導出具高階角度項之信號而用於多聲道音訊播放系統之音場改良空間解析度技術 | |
CN113994716A (zh) | 信号处理装置和方法以及程序 | |
CN112189348B (zh) | 空间音频捕获的装置和方法 | |
JP2023515968A (ja) | 空間メタデータ補間によるオーディオレンダリング | |
CN109314832A (zh) | 音频信号处理方法和设备 | |
CN116671132A (zh) | 利用空间元数据内插和源位置信息的音频渲染 | |
Wakayama et al. | Extended sound field recording using position information of directional sound sources | |
Hollebon et al. | Experimental study of various methods for low frequency spatial audio reproduction over loudspeakers | |
US20230370777A1 (en) | A method of outputting sound and a loudspeaker | |
Dickins et al. | Validation of a Practical Spatial Soundfield Reproduction System Using a Directional Microphone | |
Politis et al. | Wide-Area 6DOF Rendering of Multi-Point Ambisonic Recordings Based on Interpolation of Spatial Parameters | |
Tronchin et al. | Implementing spherical microphone array to determine 3D sound propagation in the" Teatro 1763" in Bologna, Italy | |
Pinto et al. | Study and Implementation of 3D Sound Decoding Algorithms for Loudspeaker Arrays of Different Geometries |