JP2016509812A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2016509812A5 JP2016509812A5 JP2015556516A JP2015556516A JP2016509812A5 JP 2016509812 A5 JP2016509812 A5 JP 2016509812A5 JP 2015556516 A JP2015556516 A JP 2015556516A JP 2015556516 A JP2015556516 A JP 2015556516A JP 2016509812 A5 JP2016509812 A5 JP 2016509812A5
- Authority
- JP
- Japan
- Prior art keywords
- time frame
- dominant
- source
- sound source
- hoa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000875 corresponding Effects 0.000 claims 12
- 230000003111 delayed Effects 0.000 claims 5
- 238000005070 sampling Methods 0.000 claims 3
- 238000000034 method Methods 0.000 claims 2
- 230000002596 correlated Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 claims 1
- 238000009499 grossing Methods 0.000 claims 1
- 230000001131 transforming Effects 0.000 claims 1
Claims (10)
- 音場の高次アンビニソニクス(HOA)表現における無相関な音源の方向を決定する方法であって、
HOA係数の現在時間フレームにおいて、ドミナント音源の予備的な方向推定を探索するステップと、
対応するドミナント音源に基づきHOA音場成分を決定するするステップと
を有し、
現在の方向推定は、前に見つけられた音源の信号と相関する全ての成分が取り除かれている原のHOA表現を表す残余HOA表現に基づき決定され、
前記現在の方向推定は、前記残余HOA表現の関連する一般平面波の電力が、全ての他の試験方向の夫々の電力と比較して、聴取者位置に対してある方向から作用することに基づき、複数の予め定義された試験方向の中から選択され、
前記HOA係数の現在時間フレームについての前記現在の方向推定は、HOA係数の前の時間フレームの少なくとも1つのドミナント音源へ割り当てられ、時間軌跡に対して平滑化される、方法。 - 前記平滑化は、ベイズ推定プロセスに基づき、該ベイズ推定プロセスは、前記原のHOA表現のドミナント音源成分の指向性電力分布と、統計に基づく先験的な音源移動モデルとを利用する、
請求項1に記載の方法。 - 前記統計に基づく先験的な音源移動モデルは、個々の音源の動きを、前記前の時間フレームにおけるそれらの方向と、前記前の時間フレームと最後から2番目の時間フレームとの間での動きとに基づき、統計的に予測する、
請求項2に記載の方法。 - 方向推定は、方向推定及び前に見つけられた音源の方向の組の間の角度の連帯的な最小化と、方向推定に及び前記HOA係数の前の時間フレームにおいて見つけられたドミナント音源に関連した指向性信号の組の間の相関係数の絶対値の最大化とに基づき、前記HOA係数の前の時間フレームのドミナント音源に割り当てられる、
請求項2に記載の方法。 - 音場の高次アンビニソニクス(HOA)表現における無相関な音源の方向を決定する方法であって、
HOA係数の現在時間フレームにおいて、ドミナント音源の予備的な方向推定を探索するステップと、
対応するドミナント音源に基づきHOA音場成分を決定し、対応する指向性信号を決定するステップと、
前記現在時間フレームの前記予備的な方向推定と前記HOA係数の前の時間フレームにおいてアクティブな音源の平滑化された方向とを比較することに基づき、前記ドミナント音源を、前記前の時間フレームにおいてアクティブな対応する音源に割り当てるステップであり、該割り当ては、前記現在時間フレームの前記指向性信号と前記前の時間フレームにおいてアクティブな音源の指向性信号との相関に更に基づき、割り当て関数を得るステップと、
前記割り当て関数、前記前の時間フレームにおける平滑化されたドミナント源方向、前記前の時間フレームにおけるアクティブなドミナント音源のインデックス、最後から2番目の時間フレームと前記前の時間フレームとの間での夫々の源移動角度、及び前記対応するドミナント音源に基づく前記HOA音場成分に基づき、平滑化されたドミナント源方向を決定するステップと、
前記平滑化されたドミナント源方向、前記前の時間フレームの前記アクティブなドミナント音源の方向のフレーム遅延されたバージョン、及び前記前の時間フレームの前記アクティブなドミナント音源のインデックスのフレーム遅延されたバージョンに基づき、前記現在時間フレームの前記アクティブなドミナント音源のインデックス及び方向を決定するステップと
を有し、
前記前の時間フレームにおいてアクティブな音源の前記指向性信号は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及び前記前の時間フレームのHOA係数に基づくモードマッチングに基づき決定され、
前記最後から2番目の時間フレームと前記前の時間フレームとの間での前記源移動角度は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及びその更にフレーム遅延されたバージョンに基づき決定される、方法。 - 音場の高次アンビニソニクス(HOA)表現における無相関な音源の方向を決定する装置であって、
HOA係数の現在時間フレームにおいて、ドミナント音源の予備的な方向推定を探索し、対応するドミナント音源に基づきHOA音場成分を決定するよう構成され、更には、対応する指向性信号を決定するよう構成されるプロセッサを有し、
前記プロセッサは、前記現在時間フレームの前記予備的な方向推定と前記HOA係数の前の時間フレームにおいてアクティブな音源の平滑化された方向との比較に基づき、前記ドミナント音源を、前記前の時間フレームにおいてアクティブな対応する音源に割り当てるよう更に構成され、該割り当ては、前記現在時間フレームの前記指向性信号と前記前の時間フレームにおいてアクティブな音源の指向性信号との相関に更に基づいて、割り当て関数を得、
前記プロセッサは、前記割り当て関数、前記前の時間フレームにおける平滑化されたドミナント源方向、前記前の時間フレームにおけるアクティブなドミナント音源のインデックス、最後から2番目の時間フレームと前記前の時間フレームとの間での夫々の源移動角度、及び前記対応するドミナント音源に基づく前記HOA音場成分に基づき、平滑化されたドミナント源方向を決定するよう更に構成され、
前記プロセッサは、前記平滑化されたドミナント源方向、前記前の時間フレームの前記アクティブなドミナント音源の方向のフレーム遅延されたバージョン、及び前記前の時間フレームにおける前記アクティブなドミナント音源のインデックスのフレーム遅延されたバージョンに基づき、前記現在時間フレームの前記アクティブなドミナント音源のインデックス及び方向を決定するよう更に構成され、
前記前の時間フレームにおいてアクティブな音源の前記指向性信号は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及び前記前の時間フレームのHOA係数に基づくモードマッチングに基づき決定され、
前記最後から2番目の時間フレームと前記前の時間フレームとの間での前記源移動角度は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及びその更にフレーム遅延されたバージョンに基づき決定される、装置。 - 検出されたドミナント指向性信号及び対応する予備的な方向推定の決定は、対応する残余HOA表現を得るために、前記HOA係数の現在時間フレームからの前記対応するドミナント音源の減算に基づき、HOA音場成分を決定することを更に含み、該減算の処理は、更なる音場成分についてのその都度の残りの残余HOA表現について繰り返し実行され、前記音場成分が更なる方向探索について除外されるようにする、
請求項5に記載の方法。 - 単位球面においてほぼ一様に分布する所定の数の離散的な試験方向について表現を決定するステップを更に有し、
指向性電力分布は、ドミナント音源の存在について解析され、ドミナント音源の不在の決定に基づき、前記方向探索は停止され、ドミナント音源の検出の決定に基づき、座標原点に対するその方向の予備的な推定は決定される、
請求項7に記載の方法。 - 同じ音源に基づく音場成分のHOA表現及び夫々の指向性信号は、
単位球面に一様に分布することを目標とされるサンプリング位置から成る固定の予め定義された球面グリッドを回転させて、回転されたサンプリング位置のグリッドを決定し、前記回転が、第1の回転されたサンプリング位置が前記予備的な方向推定に対応するように実行されることと、
前記残りの残余HOA表現を空間領域へと変換し、ドミナント音源信号及びグリッド指向性信号を決定することと、
ドミナント音源信号からの前記グリッド指向性信号の予測を実行することと、
前記残りの残余HOA表現によって表される音場に対する前記ドミナント音源の寄与を表す、前記予測されたグリッド指向性信号のHOA表現を、逆球面調和関数変換に基づき決定することと
に基づき決定される、
請求項8に記載の方法。 - 前記平滑化されたドミナント源方向は、
前記割り当て関数、前記前の時間フレームにおける平滑化されたドミナント源方向、前記前の時間フレームにおけるアクティブなドミナント音源のインデックス、及び前記源移動角度に基づき、ドミナント音源方向についての方向の事前確率関数を決定することと、
前記割り当て関数と、ドミナント音源によって生成される前記HOA音場成分とに基づき、ドミナント音源方向についての方向の尤度関数を決定することと、
前記方向の尤度関数及び前記方向の事前確率関数に基づき、ドミナント音源方向についての方向の事後確率関数を決定することと、
ドミナント音源方向についての前記方向の事後確率関数に基づき、平滑化されたドミナント音源方向を決定することと
に基づき決定される、
請求項5に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20130305156 EP2765791A1 (en) | 2013-02-08 | 2013-02-08 | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
EP13305156.5 | 2013-02-08 | ||
PCT/EP2014/052479 WO2014122287A1 (en) | 2013-02-08 | 2014-02-07 | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016509812A JP2016509812A (ja) | 2016-03-31 |
JP2016509812A5 true JP2016509812A5 (ja) | 2017-02-09 |
JP6374882B2 JP6374882B2 (ja) | 2018-08-15 |
Family
ID=47780000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015556516A Active JP6374882B2 (ja) | 2013-02-08 | 2014-02-07 | 音場の高次アンビソニクス表現における無相関な音源の方向を決定する方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9622008B2 (ja) |
EP (2) | EP2765791A1 (ja) |
JP (1) | JP6374882B2 (ja) |
KR (1) | KR102220187B1 (ja) |
CN (1) | CN104995926B (ja) |
TW (1) | TWI647961B (ja) |
WO (1) | WO2014122287A1 (ja) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9502044B2 (en) | 2013-05-29 | 2016-11-22 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
WO2017055485A1 (en) | 2015-09-30 | 2017-04-06 | Dolby International Ab | Method and apparatus for generating 3d audio content from two-channel stereo content |
CN105516875B (zh) * | 2015-12-02 | 2020-03-06 | 上海航空电器有限公司 | 用于快速测量虚拟声音产生设备空间角度分辨率的装置 |
GR1008860B (el) * | 2015-12-29 | 2016-09-27 | Κωνσταντινος Δημητριου Σπυροπουλος | Συστημα διαχωρισμου ομιλητων απο οπτικοακουστικα δεδομενα |
US10089063B2 (en) | 2016-08-10 | 2018-10-02 | Qualcomm Incorporated | Multimedia device for processing spatialized audio based on movement |
JP6723120B2 (ja) * | 2016-09-05 | 2020-07-15 | 本田技研工業株式会社 | 音響処理装置および音響処理方法 |
CN107147975B (zh) * | 2017-04-26 | 2019-05-14 | 北京大学 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
EP3622509B1 (en) | 2017-05-09 | 2021-03-24 | Dolby Laboratories Licensing Corporation | Processing of a multi-channel spatial audio format input signal |
US10405126B2 (en) * | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
FR3074584A1 (fr) * | 2017-12-05 | 2019-06-07 | Orange | Traitement de donnees d'une sequence video pour un zoom sur un locuteur detecte dans la sequence |
CN110751956B (zh) * | 2019-09-17 | 2022-04-26 | 北京时代拓灵科技有限公司 | 一种沉浸式音频渲染方法及系统 |
CN112019971B (zh) * | 2020-08-21 | 2022-03-22 | 安声(重庆)电子科技有限公司 | 声场构建方法、装置、电子设备及计算机可读存储介质 |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9915398D0 (en) | 1999-07-02 | 1999-09-01 | Baker Matthew J | Magnetic particles |
FR2801108B1 (fr) | 1999-11-16 | 2002-03-01 | Maxmat S A | Analyseur chimique ou biochimique a regulation de la temperature reactionnelle |
FR2839565B1 (fr) * | 2002-05-07 | 2004-11-19 | Remy Henri Denis Bruno | Procede et systeme de representation d'un champ acoustique |
FR2858403B1 (fr) * | 2003-07-31 | 2005-11-18 | Remy Henri Denis Bruno | Systeme et procede de determination d'une representation d'un champ acoustique |
EP2297557B1 (en) * | 2008-07-08 | 2013-10-30 | Brüel & Kjaer Sound & Vibration Measurement A/S | Reconstructing an acoustic field |
EP2285139B1 (en) * | 2009-06-25 | 2018-08-08 | Harpex Ltd. | Device and method for converting spatial audio signal |
US9113281B2 (en) * | 2009-10-07 | 2015-08-18 | The University Of Sydney | Reconstruction of a recorded sound field |
AU2011231565B2 (en) * | 2010-03-26 | 2014-08-28 | Dolby International Ab | Method and device for decoding an audio soundfield representation for audio playback |
WO2012025580A1 (en) * | 2010-08-27 | 2012-03-01 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2738962A1 (en) | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
US9913064B2 (en) * | 2013-02-07 | 2018-03-06 | Qualcomm Incorporated | Mapping virtual speakers to physical speakers |
-
2013
- 2013-02-08 EP EP20130305156 patent/EP2765791A1/en not_active Withdrawn
-
2014
- 2014-02-07 US US14/766,739 patent/US9622008B2/en active Active
- 2014-02-07 KR KR1020157021230A patent/KR102220187B1/ko active IP Right Grant
- 2014-02-07 CN CN201480008017.XA patent/CN104995926B/zh active Active
- 2014-02-07 EP EP14703102.5A patent/EP2954700B1/en active Active
- 2014-02-07 WO PCT/EP2014/052479 patent/WO2014122287A1/en active Application Filing
- 2014-02-07 JP JP2015556516A patent/JP6374882B2/ja active Active
- 2014-02-10 TW TW103104224A patent/TWI647961B/zh active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016509812A5 (ja) | ||
JP7158806B2 (ja) | オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム | |
JP6374882B2 (ja) | 音場の高次アンビソニクス表現における無相関な音源の方向を決定する方法及び装置 | |
JP7324753B2 (ja) | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 | |
JP6837099B2 (ja) | 音響エコーキャンセルのための室内インパルス応答の推定 | |
CA2819393C (en) | Apparatus and method for spatially selective sound acquisition by acoustic triangulation | |
JP2014523003A5 (ja) | ||
CN113113034A (zh) | 用于平面麦克风阵列的多源跟踪和语音活动检测 | |
CN110619882B (zh) | 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法 | |
JP2014099913A5 (ja) | ||
JP2014099911A5 (ja) | ||
JP2015535962A5 (ja) | ||
JP2016226019A5 (ja) | ||
JP6225245B2 (ja) | 信号処理装置、方法及びプログラム | |
BR112019013548A2 (pt) | Aparelho de captura de áudio, método de operação para capturar áudio, e produto de programa de computador | |
WO2016167141A1 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
JP2017501440A5 (ja) | ||
US11107492B1 (en) | Omni-directional speech separation | |
JP6106571B2 (ja) | 音源位置推定装置、方法及びプログラム | |
Do et al. | Stochastic particle filtering: A fast SRP-PHAT single source localization algorithm | |
JP2022511271A (ja) | 音響信号を用いて手の動きを追跡することによる装置の制御 | |
GB2516314A (en) | Method and apparatus for sound sources localization with improved secondary sources localization | |
RU2019131411A (ru) | Устройство, способ и компьютерная программа для обработки сигналов | |
Silva et al. | A branch-and-bound inspired technique to improve the computational efficiency of DOA estimation | |
Fakhry et al. | Underdetermined source detection and separation using a normalized multichannel spatial dictionary |