JP2016509812A5 - - Google Patents

Download PDF

Info

Publication number
JP2016509812A5
JP2016509812A5 JP2015556516A JP2015556516A JP2016509812A5 JP 2016509812 A5 JP2016509812 A5 JP 2016509812A5 JP 2015556516 A JP2015556516 A JP 2015556516A JP 2015556516 A JP2015556516 A JP 2015556516A JP 2016509812 A5 JP2016509812 A5 JP 2016509812A5
Authority
JP
Japan
Prior art keywords
time frame
dominant
source
sound source
hoa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015556516A
Other languages
English (en)
Other versions
JP6374882B2 (ja
JP2016509812A (ja
Filing date
Publication date
Priority claimed from EP20130305156 external-priority patent/EP2765791A1/en
Application filed filed Critical
Publication of JP2016509812A publication Critical patent/JP2016509812A/ja
Publication of JP2016509812A5 publication Critical patent/JP2016509812A5/ja
Application granted granted Critical
Publication of JP6374882B2 publication Critical patent/JP6374882B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (10)

  1. 音場の高次アンビニソニクス(HOA)表現における無相関な音源の方向を決定する方法であって、
    HOA係数の現在時間フレームにおいて、ドミナント音源の予備的な方向推定を探索するステップと、
    対応するドミナント音源に基づきHOA音場成分を決定するするステップ
    を有し、
    現在の方向推定は、前に見つけられた音源の信号と相関する全ての成分が取り除かれている原のHOA表現を表す残余HOA表現に基づき決定され、
    前記現在の方向推定は、前記残余HOA表現の関連する一般平面波の電力が、全ての他の試験方向の夫々の電力と比較して、聴取者位置に対してある方向から作用することに基づき、複数の予め定義された試験方向の中から選択され
    前記HOA係数の現在時間フレームについての前記現在の方向推定は、HOA係数の前の時間フレームの少なくとも1つのドミナント音源へ割り当てられ、時間軌跡に対して平滑化される、方法。
  2. 前記平滑化は、ベイズ推定プロセスに基づき、該ベイズ推定プロセスは、前記原のHOA表現のドミナント音源成分の指向性電力分布と、統計に基づく先験的な音源移動モデルとを利用する、
    請求項に記載の方法。
  3. 前記統計に基づく先験的な音源移動モデルは、個々の音源の動きを、前記前の時間フレームにおけるそれらの方向と、前記前の時間フレームと最後から2番目の時間フレームとの間での動きとに基づき、統計的に予測する、
    請求項に記載の方法。
  4. 方向推定は、方向推定及び前に見つけられた音源の方向の組の間の角度の連帯的な最小化と、方向推定に及び前記HOA係数の前の時間フレームにおいて見つけられたドミナント音源に関連した指向性信号の組の間の相関係数の絶対値の最大化とに基づき、前記HOA係数の前の時間フレームのドミナント音源に割り当てられる
    請求項に記載の方法。
  5. 音場の高次アンビニソニクス(HOA)表現における無相関な音源の方向を決定する方法であって、
    HOA係数の現在時間フレームにおいて、ドミナント音源の予備的な方向推定を探索するステップと、
    対応するドミナント音源に基づきHOA音場成分を決定し、対応する指向性信号を決定するステップと、
    前記現在時間フレームの前記予備的な方向推定と前記HOA係数の前の時間フレームにおいてアクティブな音源の平滑化された方向とを比較することに基づき、前記ドミナント音源を、前記前の時間フレームにおいてアクティブな対応する音源に割り当てるステップであり該割り当ては、前記現在時間フレームの前記指向性信号と前記前の時間フレームにおいてアクティブな音源の指向性信号と相関に更に基づき、割り当て関数を得るステップと、
    前記割り当て関数、前記前の時間フレームにおける平滑化されたドミナント源方向、前記前の時間フレームにおけるアクティブなドミナント音源のインデックス、最後から2番目の時間フレームと前記前の時間フレームとの間での夫々の源移動角度、及び前記対応するドミナント音源に基づく前記HOA音場成分に基づき、平滑化されたドミナント源方向を決定するステップと、
    前記平滑化されたドミナント源方向、前記前の時間フレームの前記アクティブなドミナント音源の方向のフレーム遅延されたバージョン、及び前記前の時間フレーム前記アクティブなドミナント音源のインデックスのフレーム遅延されたバージョンに基づき、前記現在時間フレームの前記アクティブなドミナント音源のインデックス及び方向を決定するステップと
    を有し、
    前記前の時間フレームにおいてアクティブな音源の前記指向性信号は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及び前記前の時間フレームのHOA係数に基づくモードマッチングに基づき決定され、
    前記最後から2番目の時間フレームと前記前の時間フレームとの間での前記源移動角度は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及びその更にフレーム遅延されたバージョンに基づき決定される、方法。
  6. 音場の高次アンビニソニクス(HOA)表現における無相関な音源の方向を決定する装置であって、
    HOA係数の現在時間フレームにおいて、ドミナント音源の予備的な方向推定を探索し、対応するドミナント音源に基づきHOA音場成分を決定するよう構成され、更には、対応する指向性信号を決定するよう構成されるプロセッサを有し
    前記プロセッサは、前記現在時間フレームの前記予備的な方向推定と前記HOA係数の前の時間フレームにおいてアクティブな音源の平滑化された方向と比較に基づき、前記ドミナント音源を、前記前の時間フレームにおいてアクティブな対応する音源に割り当てるよう更に構成され該割り当ては、前記現在時間フレームの前記指向性信号と前記前の時間フレームにおいてアクティブな音源の指向性信号と相関に更に基づいて、割り当て関数を得
    前記プロセッサは、前記割り当て関数、前記前の時間フレームにおける平滑化されたドミナント源方向、前記前の時間フレームにおけるアクティブなドミナント音源のインデックス、最後から2番目の時間フレームと前記前の時間フレームとの間での夫々の源移動角度、及び前記対応するドミナント音源に基づく前記HOA音場成分に基づき、平滑化されたドミナント源方向を決定するよう更に構成され
    前記プロセッサは、前記平滑化されたドミナント源方向、前記前の時間フレームの前記アクティブなドミナント音源の方向のフレーム遅延されたバージョン、及び前記前の時間フレームにおける前記アクティブなドミナント音源のインデックスのフレーム遅延されたバージョンに基づき、前記現在時間フレームの前記アクティブなドミナント音源のインデックス及び方向を決定するよう更に構成され
    前記前の時間フレームにおいてアクティブな音源の前記指向性信号は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及び前記前の時間フレームのHOA係数に基づくモードマッチングに基づき決定され、
    前記最後から2番目の時間フレームと前記前の時間フレームとの間での前記源移動角度は、前記前の時間フレームの前記アクティブなドミナント音源の方向の前記フレーム遅延されたバージョン及びその更にフレーム遅延されたバージョンに基づき決定される、装置。
  7. 検出されたドミナント指向性信号及び対応する予備的な方向推定の決定対応する残余HOA表現を得るために、前記HOA係数の現在時間フレームからの前記対応するドミナント音源の減算に基づき、HOA音場成分を決定することを更に含み、該減算の処理は、更なる音場成分についてのその都度の残りの残余HOA表現について繰り返し実行され、前記音場成分が更なる方向探索について除外されるようにする
    請求項に記載の方法
  8. 単位球面においてほぼ一様に分布する所定の数の離散的な試験方向について表現を決定するステップを更に有し、
    指向性電力分布は、ドミナント音源の存在について解析され、ドミナント音源の不在の決定に基づき、前記方向探索は停止され、ドミナント音源検出の決定に基づき、座標原点に対するその方向の予備的な推定は決定される、
    請求項に記載の方法
  9. 同じ音源に基づく音場成分のHOA表現及び夫々の指向性信号は、
    単位球面に一様に分布することを目標とされるサンプリング位置から成る固定の予め定義された球面グリッドを回転させて、回転されたサンプリング位置のグリッドを決定し、前記回転が、第1の回転されたサンプリング位置が前記予備的な方向推定に対応するように実行されることと、
    前記残りの残余HOA表現を空間領域へと変換し、ドミナント音源信号及びグリッド指向性信号を決定することと、
    ドミナント音源信号からの前記グリッド指向性信号の予測を実行することと、
    前記残りの残余HOA表現によって表される音場に対する前記ドミナント音源の寄与を表す、前記予測されたグリッド指向性信号のHOA表現を、逆球面調和関数変換に基づき決定することと
    基づき決定される、
    請求項に記載の方法
  10. 前記平滑化されたドミナント源方向は
    前記割り当て関数、前記前の時間フレームにおける平滑化されたドミナント源方向、前記前の時間フレームにおけるアクティブなドミナント音源のインデックス、及び前記源移動角度に基づき、ドミナント音源方向について方向の事前確率関数を決定することと、
    前記割り当て関数、ドミナント音源によって生成される前記HOA音場成分とに基づき、ドミナント音源方向について方向の尤度関数を決定することと、
    前記方向の尤度関数及び前記方向の事前確率関数に基づき、ドミナント音源方向について方向の事後確率関数を決定することと、
    ドミナント音源方向についての前記方向の事後確率関数に基づき、平滑化されたドミナント音源方向を決定することと
    基づき決定される、
    請求項に記載の方法
JP2015556516A 2013-02-08 2014-02-07 音場の高次アンビソニクス表現における無相関な音源の方向を決定する方法及び装置 Active JP6374882B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20130305156 EP2765791A1 (en) 2013-02-08 2013-02-08 Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
EP13305156.5 2013-02-08
PCT/EP2014/052479 WO2014122287A1 (en) 2013-02-08 2014-02-07 Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field

Publications (3)

Publication Number Publication Date
JP2016509812A JP2016509812A (ja) 2016-03-31
JP2016509812A5 true JP2016509812A5 (ja) 2017-02-09
JP6374882B2 JP6374882B2 (ja) 2018-08-15

Family

ID=47780000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015556516A Active JP6374882B2 (ja) 2013-02-08 2014-02-07 音場の高次アンビソニクス表現における無相関な音源の方向を決定する方法及び装置

Country Status (7)

Country Link
US (1) US9622008B2 (ja)
EP (2) EP2765791A1 (ja)
JP (1) JP6374882B2 (ja)
KR (1) KR102220187B1 (ja)
CN (1) CN104995926B (ja)
TW (1) TWI647961B (ja)
WO (1) WO2014122287A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9502044B2 (en) 2013-05-29 2016-11-22 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
WO2017055485A1 (en) 2015-09-30 2017-04-06 Dolby International Ab Method and apparatus for generating 3d audio content from two-channel stereo content
CN105516875B (zh) * 2015-12-02 2020-03-06 上海航空电器有限公司 用于快速测量虚拟声音产生设备空间角度分辨率的装置
GR1008860B (el) * 2015-12-29 2016-09-27 Κωνσταντινος Δημητριου Σπυροπουλος Συστημα διαχωρισμου ομιλητων απο οπτικοακουστικα δεδομενα
US10089063B2 (en) 2016-08-10 2018-10-02 Qualcomm Incorporated Multimedia device for processing spatialized audio based on movement
JP6723120B2 (ja) * 2016-09-05 2020-07-15 本田技研工業株式会社 音響処理装置および音響処理方法
CN107147975B (zh) * 2017-04-26 2019-05-14 北京大学 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法
EP3622509B1 (en) 2017-05-09 2021-03-24 Dolby Laboratories Licensing Corporation Processing of a multi-channel spatial audio format input signal
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
FR3074584A1 (fr) * 2017-12-05 2019-06-07 Orange Traitement de donnees d'une sequence video pour un zoom sur un locuteur detecte dans la sequence
CN110751956B (zh) * 2019-09-17 2022-04-26 北京时代拓灵科技有限公司 一种沉浸式音频渲染方法及系统
CN112019971B (zh) * 2020-08-21 2022-03-22 安声(重庆)电子科技有限公司 声场构建方法、装置、电子设备及计算机可读存储介质
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9915398D0 (en) 1999-07-02 1999-09-01 Baker Matthew J Magnetic particles
FR2801108B1 (fr) 1999-11-16 2002-03-01 Maxmat S A Analyseur chimique ou biochimique a regulation de la temperature reactionnelle
FR2839565B1 (fr) * 2002-05-07 2004-11-19 Remy Henri Denis Bruno Procede et systeme de representation d'un champ acoustique
FR2858403B1 (fr) * 2003-07-31 2005-11-18 Remy Henri Denis Bruno Systeme et procede de determination d'une representation d'un champ acoustique
EP2297557B1 (en) * 2008-07-08 2013-10-30 Brüel & Kjaer Sound & Vibration Measurement A/S Reconstructing an acoustic field
EP2285139B1 (en) * 2009-06-25 2018-08-08 Harpex Ltd. Device and method for converting spatial audio signal
US9113281B2 (en) * 2009-10-07 2015-08-18 The University Of Sydney Reconstruction of a recorded sound field
AU2011231565B2 (en) * 2010-03-26 2014-08-28 Dolby International Ab Method and device for decoding an audio soundfield representation for audio playback
WO2012025580A1 (en) * 2010-08-27 2012-03-01 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2738962A1 (en) 2012-11-29 2014-06-04 Thomson Licensing Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field
US9913064B2 (en) * 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers

Similar Documents

Publication Publication Date Title
JP2016509812A5 (ja)
JP7158806B2 (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
JP6374882B2 (ja) 音場の高次アンビソニクス表現における無相関な音源の方向を決定する方法及び装置
JP7324753B2 (ja) 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調
JP6837099B2 (ja) 音響エコーキャンセルのための室内インパルス応答の推定
CA2819393C (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
JP2014523003A5 (ja)
CN113113034A (zh) 用于平面麦克风阵列的多源跟踪和语音活动检测
CN110619882B (zh) 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法
JP2014099913A5 (ja)
JP2014099911A5 (ja)
JP2015535962A5 (ja)
JP2016226019A5 (ja)
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
BR112019013548A2 (pt) Aparelho de captura de áudio, método de operação para capturar áudio, e produto de programa de computador
WO2016167141A1 (ja) 信号処理装置、信号処理方法、およびプログラム
JP2017501440A5 (ja)
US11107492B1 (en) Omni-directional speech separation
JP6106571B2 (ja) 音源位置推定装置、方法及びプログラム
Do et al. Stochastic particle filtering: A fast SRP-PHAT single source localization algorithm
JP2022511271A (ja) 音響信号を用いて手の動きを追跡することによる装置の制御
GB2516314A (en) Method and apparatus for sound sources localization with improved secondary sources localization
RU2019131411A (ru) Устройство, способ и компьютерная программа для обработки сигналов
Silva et al. A branch-and-bound inspired technique to improve the computational efficiency of DOA estimation
Fakhry et al. Underdetermined source detection and separation using a normalized multichannel spatial dictionary