JP2020522171A - 指向性分解および経路距離の見積りを用いたアンビソニックス音場ナビゲーション - Google Patents

指向性分解および経路距離の見積りを用いたアンビソニックス音場ナビゲーション Download PDF

Info

Publication number
JP2020522171A
JP2020522171A JP2019565244A JP2019565244A JP2020522171A JP 2020522171 A JP2020522171 A JP 2020522171A JP 2019565244 A JP2019565244 A JP 2019565244A JP 2019565244 A JP2019565244 A JP 2019565244A JP 2020522171 A JP2020522171 A JP 2020522171A
Authority
JP
Japan
Prior art keywords
sound field
directional signal
matrix
sound
directions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019565244A
Other languages
English (en)
Inventor
アレン、アンドリュー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of JP2020522171A publication Critical patent/JP2020522171A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/038Control and interface arrangements therefor, e.g. drivers or device-embedded control circuitry
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

リスナー用のサウンドをレンダリングする技術は、第1位置にて、1組の方向であって、その方向から音場エネルギーのうちいくらかの指定された大きさの部分が生じる方向を決定することを伴い、その1組の方向に基づいて第2位置に音場を再構築する。このように、サウンドレンダリングコンピュータは、マイクロフォンを中心とする球面上の位置から生じるサウンドを表すサウンドデータを受信してよい。それにも関わらず、リスナーに向けられた音場エネルギーの大半に寄与するのは、これらの球面上の地点のうち小さな大きさの部分のみである。サウンドレンダリングコンピュータは、音エネルギーのうち最も大きな大きさの部分を有するそれらの方向が識別される指向性分解を用いて、そうした方向を決定する。リスナーがマイクロフォンの位置から離れて移動するとき、サウンドレンダリングコンピュータは、そうした方向を識別した後、振幅および位相因子をそれらの方向に対応する音場に適用する。

Description

本記載は仮想現実(VR)および類似環境における音場のレンダリングに関する。
アンビソニックスは、全天球サラウンドサウンド技術であり、水平面に加え、リスナーの上方および下方の音源をカバーする。他のマルチチャンネルサラウンドフォーマットとは異なり、アンビソニックスの伝送チャンネルは、スピーカ信号を搬送しない。これに代えて、アンビソニックスの伝送チャンネルは、B−フォーマットと呼ばれる音場のスピーカから独立した表現を含み、次いで、この表現がリスナーのスピーカセットアップに対しデコードされる。この追加の工程によって、指向性信号の位置よりはむしろソースの方向に関してプロデューサが考えることが可能となり、再生用に用いられるスピーカのレイアウトと数とに関して相当の程度の柔軟性がリスナーに対し提供される。
アンビソニックスでは、リスナーを取り囲む仮想的な指向性信号のアレイが、B−フォーマットとして知られるスキームにエンコードされたサウンドファイルをデコードすることによって、等方的に録音された音源から音場を生成する。仮想的な指向性信号のアレイにて生成された音場は、リスナーに対する任意の地点から音源の効果を再生成することが可能である。そうしたデコードは、仮想現実(VR)システムにおけるヘッドフォンスピーカを通じた音声の配信に用いられることが可能である。バイノーラルにレンダリングされた高次アンビソニックス(HOA)は、1対の信号を左右のヘッドフォンスピーカに提供するように組み合わさった多くの指向性信号の生成を参照する。
1つの一般的な態様では、方法は、リスナー用の音場をレンダリングするように構成されているサウンドレンダリングコンピュータの制御回路が、空間内の第1位置に複数の指向性信号源によって生成される音場から得られるサウンドデータ(音データ)を受信する工程であって、各指向性信号源は前記音場に寄与する指向性信号を生成する、工程を備えることが可能である。その方法は、前記制御回路が、前記サウンドデータに基づいて前記指向性信号源の複数の方向を識別する方向識別工程であって、前記複数の方向は、音場のエネルギーのうち少なくとも指定された大きさの部分が第1位置に生成される方向である、工程を備えることも可能である。その方法は、前記制御回路が、前記指向性信号源の空間内の前記第1位置からの複数の距離を取得する工程と、前記制御回路が、前記複数の方向と前記複数の距離とに基づいて、前記第1位置とは異なる第2位置に音場を生成する音場生成工程をさらに備える。
本明細書に記載される改良された技術を実装するための例示的な電子環境を示す図。 本明細書に記載される改良された技術に係る、例示的な指向性信号源の方向および距離を示す図。 本明細書に記載される改良された技術に係る、音場ナビゲーション中の例示的な指向性信号源の方向および距離を示す図。 本明細書に記載される改良された技術に係る、部屋における反射を伴う例示的な音場ナビゲーションを示す図。 図1に示される電子環境内において改良された技術を行う例示的な方法を示すフローチャート。 本明細書に記載される回路とともに用いられることが可能なコンピュータデバイスおよびモバイルコンピュータデバイスの一例を示す図。
1または複数の実装の詳細は、添付の図面および以下の記載において説明される。他の特徴は、本記載および図面から、また特許請求の範囲から明らかとなる。
HOA音場をレンダリングするための従来のアプローチは、その音場が記録された正確な位置にリスナーを配置することを伴う。そうした従来のアプローチでは、記録場所からリスナーが離れるよう移動したとき、再現エラーを誘発する。さらに、従来のナビゲーションでは、反射の環境において、乏しくモデル化されたソースにしかアプローチしない。
本明細書に記載される実装に従って、またHOA音場をレンダリングするための上記の従来のアプローチとは対照的に、改良された技術は、第1位置にて、1組の方向であって、その方向から音場エネルギーのうちいくらかの指定された大きさの部分が生じる方向を決定することと、その1組の方向に基づいて第2位置に音場を再構築することとを伴う。このように、サウンドレンダリングコンピュータは、マイクロフォンを中心とする球面上の複数の位置から生じるサウンドを表すサウンドデータを受信してよい。いくつかの実装では、各地点から生じたサウンドを表すサウンドデータは、その地点からの音場の球面調和関数表現の係数を含む。この音場は、マイクロフォンの位置にいるリスナーに聞こえ得るサウンドである。それにも関わらず、リスナーに向けられた音場エネルギーの大半に実際に寄与するのは、これらの指向性信号のうち小さな大きさの部分のみである。サウンドレンダリングコンピュータは、音エネルギーのうち最も大きな大きさの部分を有するそれらの方向が識別される指向性分解を用いて、そうした方向を決定する。リスナーがマイクロフォンの位置から離れて移動するとき、サウンドレンダリングコンピュータは、そうした方向を識別した後、振幅および位相因子をそれらの方向に対応する音場に適用する。サウンドレンダリングコンピュータは、それらの方向にてマイクロフォンからの指向性信号の距離の測定を受信してもよい。さらに、指向性信号の類似行列を構築することにより、サウンドレンダリングコンピュータは、指向性信号がサウンドの直接のソースであるか、サウンドの別のソースからの反射であるかを判定してよい。
有利には、そうしたサウンドレンダリングコンピュータは、部屋における反射を考慮に入れながら、リアルタイムに音場の更新を行う。これらのリアルタイムの更新は、特定の技術における厳しい計算要求と、生じ得る他のものにおける不正確さと(例えば、ローパスと指向性エラーと)のいずれかを回避する。
図1は、上記の改良された技術を実施することができる例示的な電子環境100を示す。示されるように、図1において、例示的な電子環境100は、サウンドレンダリングコンピュータ120を含む。
サウンドレンダリングコンピュータ120は、リスナー用の音場をレンダリングするように構成される。サウンドレンダリングコンピュータ120は、ネットワークインタフェース122、1または複数の処理ユニット124、およびメモリ126を含む。ネットワークインタフェース122は、サウンドレンダリングコンピュータ120による使用のために、ネットワーク170から受信した電子信号および/または光信号を電子形式に変換するための、例えば、イーサネット(登録商標)アダプタ、トークンリングアダプタなどを含む。一組の処理ユニット124は、1または複数の処理チップおよび/またはアセンブリを含む。メモリ126は、揮発性メモリ(例えば、RAM)および1または複数のROMなどの不揮発性メモリの両方、ディスクドライブ、ソリッドステートドライブなどを含む。一組の処理ユニット124とメモリ126とはともに制御回路を形成し、制御回路は本明細書に記載されるように様々な方法および機能を実行するように構成および配置される。
いくつかの実施形態では、サウンドレンダリングコンピュータ120の1または複数のコンポーネントは、メモリ126に記憶された命令を処理するように構成されたプロセッサ(例えば、処理ユニット124)であること、またはそのプロセッサを含むことが可能である。図1に示される命令の例には、サウンド入手マネージャ130、距離入手マネージャ140、指向性分解マネージャ150、音場ナビゲーションマネージャ160、および指向性信号ラベリングマネージャ170が含まれる。さらに、図1に示されるように、メモリ126は、そうしたデータを使用するそれぞれのマネージャに関して記載される様々なデータを記憶するように構成される。
サウンド入手マネージャ130は、様々なソースからサウンドデータ132を入手するように構成される。例えば、サウンド入手マネージャ130は、光学ドライブから、またはネットワークインタフェース122を通じて、サウンドデータ132を取得してよい。サウンド入手マネージャ130がサウンドデータ132を入手すると、サウンド入手マネージャは、そのサウンドデータ132をメモリ126に保存するようにさらに構成される。いくつかの実装では、サウンド入手マネージャ130は、ネットワークインタフェース122を通じてサウンドデータ132をストリーミングする。
いくつかの実装では、サウンドデータ132はB−フォーマット(すなわち、4つの成分(すなわち、アンビソニックスチャンネル)を有する1次のアンビソニックス)にエンコードされる。いくつかの実装では、サウンドデータ132は、より高次のアンビソニックス(例えば、L次まで)にエンコードされる。この場合、(L+1)のアンビソニックスチャンネルが存在し、各チャンネルは指向性信号源から生じる音場の球面調和関数(SH)展開の項に対応する。いくつかの実装では、サウンドデータ132は行列として表現され、各サンプルが列として表現され、各HOAチャンネルが行として表現される。
距離入手マネージャ140は、球面上の点の選択された組について距離データ144を入手するように構成されることが可能である。そうした点は、方向データ152に含まれることが可能であり、指向性分解マネージャ150により決定されることが可能である。いくつかの実装では、距離データ144は、球体カメラを用いて入手され得る。
指向性分解マネージャ150は、支配的な方向(すなわち、指向性信号方向であって、その方向から音場エネルギーの指定された大きさの部分(例えば、50%)が生じる指向性信号方向)を生成し、それらの方向を方向データ152に記憶するように構成されることが可能である指向性分解マネージャ150は、指向性分解演算をサウンドデータ132に対して行い、それらの方向を決定することが可能である。いくつかの実装では、指向性分解マネージャ150は、支配的な方向に関連付けられている音場データを、アレイに音エネルギーの部分の大きさの順に記憶するように構成されることも可能である。指向性分解演算は、図2に関してさらに詳細に説明される。
音場ナビゲーションマネージャ160は、平行移動データ162に従うリスナーの平行移動に与えられる、平行移動したサウンドデータ166にて表されることが可能なサウンドデータ132の補正を生成するように構成されることが可能である。例えば、リスナーがマイクロフォンの位置(すなわち、球体の中心から方向データが測定される、その中心)から離れて移動するとき、追跡システムは任意の与えられた時間に平行移動データ162を提供してよい。それに応じて、音場ナビゲーションマネージャ160は、方向データ152に含まれる様々な支配的な方向に沿って、サウンドデータに対する振幅補正および位相補正を行い、平行移動したサウンドデータ166にて表される平行移動した音場を生成する。いくつかの実装では、平行移動したサウンドデータ166は、各支配的な方向についてSH展開として表現される。
いくつかの実装では、リスナーが移動する空間には、サウンドを再現することについての困難を示し得る位置、すなわち、指向性信号がそうした位置においてサウンドを忠実に再現することができない位置が存在する。いくつかの実装では、そうした位置は、図1に示されるように、指向性信号源の位置データ142により定められる指向性信号源の位置の凸包により決定されてよい。この場合、音場ナビゲーションマネージャ160は、指向性信号源の位置の凸包を生成し、その凸法を凸包データ164として記憶するようにさらに構成される。音場ナビゲーションマネージャ160は、次いで、平行移動データ162からの平行移動が凸包データにより表される凸包の内にあるか外にあるかを判定するように構成され、外にある場合には、その平行移動により定められた位置にて音場が正確には再現され得ないという指示を生成する。
指向性信号ラベリングマネージャ170は、特定方向に伝搬する指向性信号がサウンドを直接生成するか別の指向性信号からのサウンドの反射から生じたサウンドを生成するか、を示す指向性信号ラベリングデータ172を生成するように構成される。指向性信号ラベリングマネージャ170は、指向性信号ラベリング演算を行い、指向性信号ラベリングデータ172を生成するように構成される。いくつかの実装では、指向性信号ラベリング演算は、方向の対からの音場間の相互相関を行うことを伴う。そうした場合には、既知の直接の指向性信号から生じる音場と別の指向性信号との間の相互相関が何らかの閾値(例えば、0.5)よりも大きく、そのときには、この別の指向性信号からの音場が、既知の直接の指向性信号からのサウンドの反射であると考えられる。
いくつかの実装では、メモリ126は、ランダムアクセスメモリ、ディスクドライブメモリ、フラッシュメモリなどといった任意の種類のメモリであり得る。いくつかの実装では、メモリ126は、サウンドレンダリングコンピュータ120のコンポーネントに関連付けられている2以上のメモリコンポーネント(例えば、2つ以上のRAMコンポーネントまたはディスクドライブメモリ)として実装され得る。いくつかの実装では、メモリ126はデータベースメモリであり得る。いくつかの実装では、メモリ126は、非ローカルメモリであり得るか、非ローカルメモリを含み得る。例えば、メモリ126は、複数のデバイス(図示せず)によって共有されるメモリであり得るか、またはそのメモリを含み得る。いくつかの実装では、メモリ126は、ネットワーク内のサーバデバイス(図示せず)に関連付けられることが可能であり、またサウンドレンダリングコンピュータ120のコンポーネントの役割を果たすように構成されることが可能である。
サウンドレンダリングコンピュータ120のコンポーネント(例えば、モジュール、処理ユニット124)は、1または複数の種類のハードウェア、ソフトウェア、ファームウェア、オペレーティングシステム、ランタイムライブラリ、などを含むことが可能な1または複数のプラットフォーム(たとえば、1または複数の類似または異なるプラットフォーム)に基づいて動作するように構成されることが可能である。いくつかの実装では、サウンドレンダリングコンピュータ120のコンポーネントは、デバイスのクラスタ(例えば、サーバファーム)内にて動作するように構成されることが可能である。そうした実装では、サウンドレンダリングコンピュータ120のコンポーネントの機能および処理を、デバイスのクラスタのいくつかのデバイスに分散させることができる。
サウンドレンダリングコンピュータ120のコンポーネントは、属性を処理するように構成された任意の種類のハードウェアおよび/またはソフトウェアであり得るか、そのハードウェアおよび/またはソフトウェアを含み得る。いくつかの実装では、図1におけるサウンドレンダリングコンピュータ120のコンポーネントに示されるコンポーネントの1または複数の部分は、ハードウェアベースのモジュール(例えば、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、メモリ)、ファームウェアモジュール、および/またはソフトウェアベースのモジュール(例えば、コンピュータコードのモジュール、コンピュータにて実行可能な一組のコンピュータ可読命令)であり得るか、それらを含み得る。例えば、いくつかの実装では、サウンドレンダリングコンピュータ120のコンポーネントの1または複数の部分は、1以上プロセッサ(図示せず)による実行用に構成されたソフトウェアモジュールであり得るか、それを含み得る。いくつかの実装では、コンポーネントの機能は、図1に示されたものとは異なるモジュールおよび/または異なるコンポーネントに含まれ得る。
図示されていないが、いくつかの実装では、サウンドレンダリングコンピュータ120のコンポーネント(またはその一部)は、例えばデータセンタ(例えば、クラウドコンピューティング環境)、コンピュータシステム、1または複数のサーバ/ホストデバイスなどの内部にて動作するように構成されることが可能である。いくつかの実装では、サウンドレンダリングコンピュータ120のコンポーネント(またはその一部)は、ネットワーク内にて動作するように構成されることが可能である。したがって、サウンドレンダリングコンピュータ120のコンポーネント(またはその一部)は、1または複数のデバイスか、1または複数のサーバデバイスか、その両方を含むことが可能な様々な種類のネットワーク環境内にて機能するように構成されることが可能である。例えば、ネットワークは、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)などであり得るか、それらを含み得る。ネットワークは、無線ネットワークおよび/または例えば、ゲートウェイデバイス、ブリッジ、スイッチなどを用いて実装される無線ネットワークであり得るか、その無線ネットワークを含み得る。ネットワークは、1または複数のセグメントを含むことが可能であるか、インターネットプロトコル(IP)および/またはプロプライエタリプロトコルなどの様々なプロトコルに基づく一部を有することが可能であるか、またはその両方である。ネットワークは、インターネットの少なくとも一部を含み得る。
いくつかの実施形態では、サウンドレンダリングコンピュータ120の1または複数のコンポーネントは、メモリに記憶された命令を処理するように構成されたプロセッサであり得るか、そのプロセッサを含み得る。例えば、サウンド入手マネージャ130(および/またはその一部)、距離入手マネージャ140(および/またはその一部)、指向性分解マネージャ150(および/またはその一部)、音場ナビゲーションマネージャ160(および/またはその一部)、および指向性信号ラベリングマネージャ170(および/またはその一部)は、1または複数の機能を実装するための処理に関連する命令を実行するように構成されたプロセッサとメモリとの組合せであり得る。
図2は、改良された技術に係る、例示的な音場環境200を示す。この環境200内には、1組の指向性信号源(例えば、指向性信号源220(黒丸(filled disks)))の中心にマイクロフォン210(白丸(open disk))が存在する。各指向性信号源(例えば、j番目の指向性信号源)は、マイクロフォン210から距離dであり、方向
にある。
サウンドレンダリングコンピュータ120は、指向性分解演算を用いてサウンドデータ132から指向性信号の方向(例えば、指向性信号源220から)を決定する。指向性分解演算は、中心にあるマイクロフォン210とともにM個のサンプルからの音場のSH展開の係数を行として有し、SH展開のチャンネルを列として有する、行列bとして、サウンドデータ132を定めることを伴う(行列bは、請求項に記載の「第1の行列」の一例である)。例えば、次式である。
ここで、bm,n (j)は、Y (θ,φ)の係数であり、(m,n)SHはn∈{0,...,N}およびm∈{−n,...,n}である。このように、8kHzのサンプルの音声の1秒間では、N=1のとき、bは4行、また、例えば、8000個のサンプルについて8000列を有する。
指向性分解演算は、球面上の各点についての球面調和関数Y (θ,φ)の初期値bおよび行列Y(請求項に記載の「第2の行列」の一例)を有する残差の行列rを伴う帰納の形態をとる。いくつかの実装では、指向性分解演算は、以下の処理を含む。
ここで、argmax(・,k)は第1の引数の値が最大となるkの範囲にわたる指数であり、||列(rY,k)||(請求項に記載の「第5の行列」の一例)は行列rYの第k列のノルムであり、Y はYの第j列の転置であり、YはYの第j列であり、Y はYの第j列の複素共役であり、εは指定の許容誤差であり、Sはその列がマイクロフォンにおける支配的な方向からの音場である行列であり、SはSの第j列であり、Jは支配的な方向に対応する列指数のベクトルであり、Eはその列が支配的な方向における球面調和関数である行列である。したがって、b=SE+r。残差rは、コンテンツにおいて十分に周囲にあるため、rは平行移動から独立していると見なされる。いくつかの実装では、ノルムはフロベニウスノルム(すなわち、行列の成分の平方和)である。
図2では、音場が単純な単極源を含むため、方向
に沿ったソースXにおける音場は、下記のようなグリーン関数により決定され得る。
ここでkは波数である。
図3は、マイクロフォンから位置tに平行移動した位置310における一例としての音場bを示す。そうした平行移動の際、音場ナビゲーションマネージャ160は、平行移動した位置からj番目の指向性信号源(例えば、指向性信号源220)への距離djtを生成する。次いで、音場ナビゲーションマネージャ160は、下記の式に従って、j番目の指向性信号(例えば、指向性信号源220(S)から平行移動した位置310における音場を計算する。
残差は平行移動から独立していると見なされるため、平行移動地点における音場について下記の関係を書くこともできる。
=S+r
ここでEは平行移動した球面調和関数のエンコード行列である。
いくつかの実装では、音場ナビゲーションマネージャ160は、平行移動地点310が指向性信号源(例えば、指向性信号源220)により定義される凸包230の内にあるか外にあるかを判定する。いくつかの実装では、平行移動地点310が凸包230の外にあるか否かを音場ナビゲーションマネージャ160が判定すると、音場ナビゲーションマネージャ160は、その平行移動地点における音場が不正確にレンダリングされるという指示を返してよい。それにも関わらず、いくつかの実装では、凸包230の外の平行移動地点における音場は、十分な数の指向性信号源により正確にレンダリングされてよい。
図4は、壁440を有する部屋におけるソースの位置410に対するマイクロフォンの位置420における一例としての音場を示す図である。そうしたシナリオでは、上述の単極源のアプローチは不十分である。むしろ、ある条件下では、地点420におけるソース410からの音場は、距離λの直接経路450(すなわち、反射を伴わない)と距離λ+λの反射経路460とによる寄与の合計であると見なされる。いくつかの実装では、壁440は、必須ではないが、完全反射であると見なされる。壁が完全反射体であるとき、反射経路は、見かけのソース430から同一の距離を通じて直接達するものと考えられる。複数の反射では、複数の見かけのソースが存在し得る。
図4はさらに、リスナーが位置422に平行移動した一例としてのシナリオを、対応する見かけのソース432とともに示す。この場合における直接経路は、長さη0tを有し、反射(見かけの)経路は長さη1tを有する。音場ナビゲーションマネージャ160は、平行移動tに与えられたこれらの経路の長さを計算する。
音場ナビゲーションマネージャ160は、次いで、平行移動したリスナーについての反射した音場S reflを、下記の関係に従って生成してよい。
ここでη=dj+μであり、ここでμはSの全ての見かけの経路の和であり、またηjtは見かけのソースから平行移動した距離である。
反射が仮定される条件下では、その条件は下記のように記述される。行列Sは、上に詳述した指向性分解演算により決定される方向にて各ソースからの音場寄与を列として有する。第1の列が、反射がないソース(すなわち、直接のソース)に対応する場合には、その列の第2の列との相互相関が指定の閾値(例えば、0.5)よりも大きいときに、第2の列は反射した音場を表す。いくつかの実装では、相互相関ρは、
の形式をとる。ここで、S (p)は、第i行第p列におけるSの成分であり、q>pである。
より一般には、指向性信号ラベリングマネージャ170は、指向性信号間の類似性の程度を示す類似尺度を成分として含む類似行列を構築するように構成される。上述の相互相関は、そうした類似尺度のほんの一例である。そうした類似尺度は、指向性信号が直接の信号か反射した信号かを識別するためのスペクトラルクラスタリングまたは親和性伝搬手順に従ってクラスタリングされてよい。
μの量を見積もるため、音場ナビゲーションマネージャ160は上記の相互相関ρを計算する(ここで、例えば、q=j)。ρが指定の閾値(例えば、0.5)未満であると、音場ナビゲーションマネージャ160はμ=0に設定する。ρが指定の閾値よりも大きいと、音場ナビゲーションマネージャ160はj番目の音場をより早いもの(例えば、p番目の音場)と比較し、最小2乗解によりSに最もよくフィットする複素数値のスカラーを計算する。例えば、α=S・(Srefl−1と定義する(ここで、逆元は疑似逆行列である)。音場ナビゲーションマネージャ160は、反射した音場についての上記の関係が当てはまると見なして、量αから距離μを決定してよい。
図5は、サウンドのバイノーラルレンダリングを行う一例としての方法500を示すフローチャートである。方法500は、サウンドレンダリングコンピュータ120のメモリ126に存在し1組の処理ユニット124により実行される、図1に関連して記載されたソフトウェア構成により実行されてよい。
502にて、リスナー用の音場をレンダリングするように構成されているサウンドレンダリングコンピュータの制御回路は、空間内の第1位置に生成される音場から得られるサウンドデータを受信する。
504にて、制御回路は、そのサウンドデータに基づいて指向性信号の複数の方向を識別し、その複数の方向は、それによって音場のエネルギーのうちの少なくとも指定された大きさの部分が第1位置に生成される方向である。
506にて、制御回路は、指向性信号源の空間内の第1位置からの複数の距離を取得する。
508にて、制御回路は、複数の方向と複数の距離とに基づいて、第1位置とは異なる第2位置に音場を生成する。
図6は、本明細書に記載される技術とともに用いられ得る一般的なコンピュータデバイスP00および一般的なモバイルコンピュータデバイスP50の一例を示す。コンピューティングデバイスP00は、ラップトップ、デスクトップ、タブレット、ワークステーション、個人用情報端末、テレビ、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピューティングデバイスなどの様々な形態のデジタル・コンピュータを表すように意図されている。コンピューティングデバイスP50は、個人用情報端末、携帯電話、スマートフォン、および他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すように意図されている。本明細書に示されるコンポーネントと、コンポーネント同士の接続および関係と、コンポーネントの機能とは、例示として意図されるに過ぎず、本明細書に記載された、および/または特許請求の範囲に記載された発明の実装を限定するようには意図されていない。
コンピューティングデバイスP00は、プロセッサP02、メモリP04、記憶デバイスP06、メモリP04と高速拡張ポートP10とに接続している高速インタフェースP08、および低速バスP14と記憶デバイスP06とに接続している低速インタフェースP12を備える。プロセッサP02は、半導体ベースのプロセッサであることが可能である。メモリP04は、半導体ベースのメモリであることが可能である。コンポーネントP02,P04,P06,P08,P10,P12の各々は、様々なバスを用いて相互接続されており、共通のマザーボードに、または必要に応じて他の態様により取り付けられていてよい。プロセッサP02は、高速インタフェースP08に結合されているディスプレイP16などの外部の入出力デバイス上にGUI用のグラフィカル情報を表示するためのメモリP04または記憶デバイスP06に記憶されている命令を含む、コンピューティングデバイスP00内における実行用の命令を処理可能である。他の態様では、複数のプロセッサおよび/または複数のバスは、必要に応じて、複数のメモリおよび複数の種類のメモリとともに使用されてよい。さらに、複数のコンピューティングデバイスP00が接続されて、各々のデバイスが必要な動作のうちの部分(例えば、サーババンク、ブレードサーバのグループ、またはマルチプロセッサシステム)を提供してもよい。
メモリP04は、コンピューティングデバイスP00内に情報を記憶する。1つの実装では、メモリP04は、1または複数の揮発性メモリユニットである。別の実装では、メモリP04は、1または複数の不揮発性メモリユニットである。さらに、メモリP04は、磁気ディスクまたは光学ディスクなどの別の形態のコンピュータ可読媒体であってよい。
記憶デバイスP06は、コンピューティングデバイスP00用の大容量の記憶を提供できる。1つの実装では、記憶デバイスP06は、フロッピー(登録商標)ディスクデバイス、ハードディスクデバイス、光ディスクデバイス、テープデバイス、フラッシュメモリもしくは他の同様のソリッド・ステート・メモリ・デバイス、またはデバイスからなるアレイ(ストレージエリアネットワークまたは他の構成のデバイスを含む)などのコンピュータ可読媒体であってよく、または、そのコンピュータ可読媒体を含んでよい。コンピュータプログラム製品は、情報キャリアに有形に具現化されることが可能である。さらに、コンピュータプログラム製品は、実行時に、上述した方法などの1または複数の方法を実行する命令を含んでよい。情報キャリアは、メモリP04、記憶デバイスP06、またはプロセッサP02上のメモリなどのコンピュータ可読媒体または機械可読媒体である。
高速制御部P08は、コンピューティングデバイスP00用の帯域集約の動作を管理する一方、低速制御部P12は、より低い帯域集約の動作を管理する。機能のそうした割り当ては、例示にすぎない。1つの実装では、高速制御部P08は、メモリP04と、ディスプレイP16(例えば、グラフィクスのプロセッサまたはアクセラレータを通じて)と、様々な拡張カード(図示せず)を受容し得る高速拡張ポートP10とに結合されている。その実装では、低速制御部P12は、記憶デバイスP06と低速拡張ポートP14とに結合されている。様々な通信ポート(例えば、USB、Bluetooth(登録商標)、イーサネット(登録商標)、無線イーサネット)を含み得る低速拡張ポートは、キーボード、ポインティングデバイス、スキャナなどの1または複数の入出力デバイス、またはスイッチもしくはルータなどのネットワーキングデバイス(例えば、ネットワークアダプタを通じて)に結合されてよい。
コンピューティングデバイスP00は、図に示されるように、複数の異なる形態において実装されてよい。例えば、コンピューティングデバイスP00は、スタンダードサーバP20として、またはそうしたサーバのグループにおいて複数回にわたって実装されてよい。さらにコンピューティングデバイスP00は、ラックサーバシステムP24の一部として実装されてもよい。これに加えて、コンピューティングデバイスP00は、ラップトップコンピュータP22などのパーソナルコンピュータにおいて実装されてよい。これに代えて、コンピューティングデバイスP00からのコンポーネントは、デバイスP50などのモバイルデバイス(図示せず)における他のコンポーネントと組み合わされてよい。そうしたデバイスの各々は、コンピューティングデバイスP00,P50のうちの1または複数を含んでよく、システム全体が、互いに通信する複数のコンピューティングデバイスP00,P50から構成されてよい。
コンピューティングデバイスP50は、プロセッサP52と、メモリP64と、ディスプレイP54などの入出力デバイスと、通信インタフェースP66と、送受信機P68とをコンポーネントとして特に備える。デバイスP50には、追加の記憶部を提供するように、マイクロドライブまたは他のデバイスなどの記憶デバイスがさらに提供されてもよい。コンポーネントP50,P52,P64,P54,P66およびP68の各々は、様々なバスを用いて相互接続されており、コンポーネントのうちのいくつかは、共通のマザーボードに取り付けられているか、必要に応じて他の態様により取り付けられてよい。
プロセッサP52は、コンピューティングデバイスP50内にて、メモリP64に記憶されている命令を含む命令を実行可能である。プロセッサは、別個の複数のアナログプロセッサおよびデジタルプロセッサを含むチップからなるチップセットとして実装されてよい。プロセッサは、例えば、ユーザインタフェースの制御などのデバイスP50の他のコンポーネントの協働と、デバイスP50により動作するアプリケーションと、デバイスP50による無線通信とを可能にする。
プロセッサP52は、ディスプレイP54に結合されている制御インタフェースP58およびディスプレイインタフェースP56を通じてユーザと通信してよい。ディスプレイP54は、例えば、TFT LCD(薄膜トランジスタ液晶ディスプレイ)もしくはOLED(有機発光ダイオード)ディスプレイ、または他の適切なディスプレイ技術であってよい。ディスプレイインタフェースP56は、グラフィカル情報および他の情報をユーザに提示するためにディスプレイP54を駆動するための適切な回路を備えてよい。制御インタフェースP58は、ユーザからコマンドを受信し、プロセッサP52に渡すためにそのコマンドを変換してよい。これに加えて、外部インタフェースP62は、他のデバイスとのデバイスP50の近領域通信を可能にするように、プロセッサP52との通信に提供されてよい。外部インタフェースP62は、例えば、いくつかの実装における有線通信または他の実装における無線通信を可能にしてよく、さらに、複数のインタフェースが用いられてもよい。
メモリP64は、コンピューティングデバイスP50内に情報を記憶する。メモリP64は、1または複数のコンピュータ可読媒体と、1または複数の揮発性メモリユニットと、1または複数の不揮発性メモリユニットと、のうちの1または複数として実装されることが可能である。さらに、拡張メモリP74が提供されるとともに、例えば、SIMM(シングルインラインメモリモジュール)カードインタフェースを含み得る拡張インタフェースP72を通じてデバイスP50に接続されてもよい。そうした拡張メモリP74によって、デバイスP50用の追加の記憶スペースが提供されてよく、またはデバイスP50用のアプリケーションまたは他の情報が記憶されてもよい。具体的には、拡張メモリP74は、上述した処理を実行または補完するための命令を含んでよく、またセキュア情報も含んでよい。したがって、例えば、拡張メモリP74は、デバイスP50用のセキュリティモジュールとして提供されてよく、デバイスP50のセキュアな使用を可能にする命令に関しプログラミングされていてよい。これに加えて、セキュアアプリケーションは、ハッキング不可能な態様により識別情報をSIMMカード上に配置することなど、追加の情報とともにSIMMカードを介して提供されてよい。
メモリは、例えば、下記のように、フラッシュメモリおよび/またはNVRAMメモリを含んでよい。1つの実装では、コンピュータプログラム製品は、情報キャリアに有形に具現化される。コンピュータプログラム製品は、実行時に、上述した方法などの1または複数の方法を実行する命令を含む。情報キャリアは、例えば、送受信機P68または外部インタフェースP62によって受信され得る、メモリP64、拡張メモリP74、またはプロセッサP52上のメモリなどのコンピュータ可読媒体または機械可読媒体である。
デバイスP50は、必要な場合には、デジタル信号処理回路を含み得る通信インタフェースP66を通じて無線により通信してよい。通信インタフェースP66は、特に、GSM(登録商標)ボイスコール、SMS、EMS、またはMMSのメッセージング、CDMA、TDMA、PDC、WCDMA(登録商標)、CDMA2000、またはGPRSなど、様々なモードまたはプロトコルの下、通信を可能にし得る。そうした通信は、例えば、無線周波数の送受信機P68を通じて行われてよい。これに加えて、狭域通信は、Bluetooth、WiFi(登録商標)、または他のそうした送受信機(図示せず)を用いることなどして行われてよい。これに加えて、GPS(全地球測位システム)受信機モジュールP70は、航行および場所に関係する追加の無線データをデバイスP50に提供してよく、その無線データは、必要に応じて、デバイスP50上にて動作するアプリケーションにより用いられ得る。
さらに、デバイスP50は、ユーザから音声情報を受信し、これを使用に適したデジタル情報に変換できる音声コーデックP60を用いて可聴の通信を行ってよい。音声コーデックP60は、例えば、デバイスP50のハンドセットにおいて、スピーカを通じるなどによりユーザ用の可聴音を同様に生成してよい。そうした音は、音声通話からの音を含んでよく、記録された音(例えば、ボイスメッセージ、音楽ファイルなど)を含んでよく、また、デバイスP50上にて動作するアプリケーションにより生成される音を含んでよい。
コンピューティングデバイスP50は、図に示されるように、複数の異なる形態により実装されてよい。例えば、コンピューティングデバイスP50は、携帯電話P80として実装されてよい。さらに、コンピューティングデバイスP50は、スマートフォンP82、個人用情報端末、または他の同様のモバイルデバイスの一部として実装されてよい。
本明細書に記載されたシステムおよび技術の様々な実装は、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにより実現することができる。これらの様々な実装は、記憶システム、1以上の入力デバイス、および1以上の出力デバイスからデータおよび命令を受信し、また記憶システム、1以上の入力デバイス、および1以上の出力デバイスにデータおよび命令を送信するように結合された1以上のプログラム可能なプロセッサを含むプログラマブルシステム上で実行可能および/または解釈可能な1または複数のコンピュータプログラムにおける実装を含むことが可能である。
これらのコンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られている)は、プログラム可能なプロセッサ用のマシン命令を含み、高度な手続き型および/またはオブジェクト指向プログラミング言語および/またはアセンブリ言語/機械語により実装されることが可能である。本明細書にて用いられる「機械可読媒体」、「コンピュータ可読媒体」という用語は、機械可読信号として機械命令を受信する機械可読媒体を含むプログラマブルプロセッサに機械命令および/またはデータを提供するように用いられる任意のコンピュータプログラム製品、装置および/またはデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブル論理デバイス(PLD))を指す。「機械可読信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するように用いられる任意の信号を指す。
ユーザとの対話を提供するために、本明細書に記載されたシステムおよび技術は、情報をユーザに表示するためのディスプレイデバイス(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、ユーザがそれによって入力をコンピュータに提供することが可能なキーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)と、を有するコンピュータ上に実装されてもよい。他の種類のデバイスもまた、ユーザとの対話を提供するように用いられてよく、例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触知フィードバック)であることが可能であり、ユーザからの入力は、音響入力、音声入力、または触知入力を含む任意の形態により受信されることが可能である。
本明細書に記載されたシステムおよび技術は、バックエンドコンポーネント(例えば、データサーバとして)を含むコンピューティングシステム、ミドルウェアコンポーネント(例えば、アプリケーションサーバ)を含むコンピューティングシステム、フロントエンドコンポーネント(例えば、ユーザが本明細書に記載されたシステムおよび技術の実装と対話可能なグラフィカルユーザインタフェースまたはウェブブラウザを有するクライアントコンピュータ)を含むコンピューティングシステム、またはそうしたバックエンドコンポーネント、ミドルウェアコンポーネント、もしくはフロントエンドコンポーネントの任意の組み合わせにより実装されることが可能である。システムのコンポーネントは、デジタルデータ通信の任意の形態または媒体(例えば、通信ネットワーク)によって相互接続されることが可能である。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、およびインターネットが含まれる。
コンピューティングシステムは、クライアントおよびサーバを含むことが可能である。クライアントおよびサーバは、一般に、互いに遠く離れており、典型的には、通信ネットワークを介してインタラクトする。クライアントとサーバとの関係は、個々のコンピュータ上で動作し、かつ互いにクライアント−サーバ関係を有するコンピュータプログラムにより生じる。
本明細書および添付の特許請求の範囲において、単数形「1つの(a,an)」および「その(the)」は、文脈において明示する場合を除き、複数の参照を排除するものではない。さらに、「および(and)」、「または(or)」および「および/または(and/or)」などの接続詞は、文脈において明示する場合を除き、包括的なものである。例えば、Aおよび/またはBは、Aのみ、Bのみ、およびAとBと、を含む。さらに、提示される様々な図面に示される接続線およびコネクタは、例示的な機能の関係および/または様々な要素間の物理的結合か論理的結合を表すことを意図する。多くの代替または追加の機能の関係、物理的接続または論理的接続が、実際のデバイスに存在してよい。さらに、要素が“必須(essential)”または“重要(critical)”と特に記載されていない限り、本明細書に開示される実施形態の実施にとってアイテムまたはコンポーネントは必須ではない。
約、実質的に、一般になどの用語は、その正確な値または範囲が要求されていないこと、また特定される必要がないことを意図するように、本明細書において用いられる。本明細書で用いられるように、上記の用語は、当業者にとって迅速かつ即座の意味を有する。
さらに、本明細書において上方、下方、頂部、底部、側方、端部、前方、後方などといった用語の使用は、現在考えられているか示されている配向を参照して用いられる。別の配向に関して考えられている場合には、そうした用語は対応して修正される必要があると理解される。
さらに、本明細書および添付の特許請求の範囲において、単数形「1つの(a,an)」および「その(the)」は、文脈において明示する場合を除き、複数の参照を排除するものではない。さらに、「および(and)」、「または(or)」および「および/または(and/or)」などの接続詞は、文脈において明示する場合を除き、包括的なものである。例えば、Aおよび/またはBは、Aのみ、Bのみ、およびAとBと、を含む。
特定の例としての製造の方法、装置および物が本明細書に記載されているが、この特許の適用範囲はそれらに限定されない。本明細書に用いられる専門用語は、特定の側面を説明するためであり、限定することを意図するものではない。それどころか、この特許は、この特許の特許請求の範囲内にいくらか該当する製造の全ての方法、装置および物にわたる。

Claims (20)

  1. 方法であって、
    リスナー用の音場をレンダリングするように構成されているサウンドレンダリングコンピュータの制御回路が、空間内の第1位置に複数の指向性信号源によって生成される音場から得られるサウンドデータを受信する工程であって、各指向性信号源は前記音場に寄与する指向性信号を生成する、工程と、
    前記制御回路が、前記サウンドデータに基づいて前記複数の指向性信号源の複数の方向を識別する方向識別工程であって、前記複数の方向は、前記音場のエネルギーのうち少なくとも指定された大きさの部分が前記第1位置に生成される方向である、工程と、
    前記制御回路が、前記複数の指向性信号源の空間内の前記第1位置からの複数の距離を取得する工程と、
    前記制御回路が、前記複数の方向と前記複数の距離とに基づいて、前記第1位置とは異なる第2位置に前記音場を生成する音場生成工程と、を備える方法。
  2. 前記サウンドデータは第1の行列を含み、前記第1の行列の各成分は、前記第1位置を中心とする単位球面上の複数の地点における前記音場の球面調和関数展開の係数であり、
    前記方向識別工程は、
    前記第1位置を中心とする前記単位球面上の前記複数の地点において評価される球面調和関数の項を成分として有する、第2の行列を生成する工程と、
    第3の行列を生成するべく前記第1の行列と前記第2の行列とを乗算する工程であって、前記第3の行列の各列は、前記単位球面上の前記複数の地点のうちの一地点に対応し、前記単位球面上の前記複数の地点のうちの前記一地点における前記音場を表す、工程と、
    前記単位球面上の前記複数の地点のうち、前記第3の行列の列のうち最大値のベクトルノルムを有する列に対応する一地点を、前記複数の方向のうちの1つの方向として識別する工程と、を含む、請求項1に記載の方法。
  3. 前記ベクトルノルムは、フロベニウスノルムである、請求項2に記載の方法。
  4. 前記方向識別工程は、
    前記第3の行列の前記列と前記第2の行列の転置とを乗算して第4の行列を生成する工程と、
    前記第1の行列から前記第4の行列を減算して残差の行列を生成する工程と、
    前記単位球面上の前記複数の地点のうち、前記残差の行列と前記第2の行列とを乗算することにより形成される第5の行列の列のうち最大値のベクトルノルムを有する列に対応する一地点を、前記複数の方向のうちの第2の方向として識別する工程と、をさらに含む、請求項2または3に記載の方法。
  5. 前記音場は壁を有する部屋において受信され、
    前記方法は、
    前記複数の指向性信号源の前記複数の方向の各々について、該方向を有する前記指向性信号源により生成される指向性信号が、前記部屋の1つの壁からの別の指向性信号のサウンドの反射の結果であるか否かの指示を生成するべく、指向性信号ラベリング演算を行う、ラベリング演算工程をさらに備える、請求項2〜4のいずれか一項に記載の方法。
  6. 前記ラベリング演算工程は、
    前記複数の方向のうちの第1の方向の第1の音場と前記複数の方向のうちの第2の方向の第2の音場とに対する相互相関演算を行い、相互相関結果を生成する工程であって、前記第1の音場は、前記第1の音場が前記第1の方向の指向性信号源により前記複数の距離のうちの1つの距離に生成される指向性信号の結果である、直接の音場である、工程と、
    前記相互相関結果が閾値よりも小さいことに応じて、前記第2の音場が直接の音場であることを示す第1のインジケータを生成する工程と、
    前記相互相関結果が前記閾値よりも大きいことに応じて、前記第2の音場が前記部屋の1つの壁からの別の指向性信号の反射の結果であることを示す、第2のインジケータを生成する工程と、を含む請求項5に記載の方法。
  7. 前記音場生成工程は、前記複数の方向の各々について、該方向の音場に振幅因子と位相因子とを乗算する工程であって、前記位相因子の位相は、空間内の前記第2位置から該方向の前記指向性信号源までの距離と空間内の前記第1位置から該方向の前記指向性信号源までの距離との差に基づく、工程を含む、請求項2〜4のいずれか一項に記載の方法。
  8. 1組の前記方向の各々の前記音場に振幅因子を乗算することは、
    該方向を有する前記指向性信号源が直接のソースであることに応じて、前記振幅因子を、空間内の前記第1位置から該方向を有する前記指向性信号源までの距離に対する、空間内の前記第2位置から該方向を有する前記指向性信号源までの距離の比率となるように設定することと、
    該方向を有する前記指向性信号が反射の結果であることに応じて、前記振幅因子を、空間内の前記第1位置から該方向にある見かけのソースまでの距離の合計に対する、空間内の前記第2位置から該方向にある前記見かけのソースまでの距離の合計の比率となるように設定することと、を含む、請求項7に記載の方法。
  9. 複数の仮想的な指向性信号源の空間内の前記第1位置からの複数の距離を取得することは、球体カメラから前記複数の距離を受信することを含む、請求項1〜8のいずれか一項に記載の方法。
  10. 複数の仮想的な指向性信号源の複数の方向と複数の距離とから凸包を生成する工程をさらに備え、
    前記音場生成工程は、
    前記第2地点が前記凸包の外にあるか否かを判定する工程と、
    前記第2地点が前記凸包の外にあることに応じて、前記音場は前記第2地点にて正確に再現されない場合があるという指示を返す工程と、を含む、請求項1〜9のいずれか一項に記載の方法。
  11. 非一時的な記憶媒体を備えるコンピュータプログラム製品であって、リスナー用の音場をレンダリングするように構成されているサウンドレンダリングコンピュータの処理回路による実行時に、前記処理回路に、
    空間内の第1位置に複数の指向性信号源によって生成される音場から得られるサウンドデータを受信する工程であって、各指向性信号源は前記音場に寄与する指向性信号を生成する、工程と、
    前記サウンドデータに基づいて前記複数の指向性信号源の複数の方向を識別する方向識別工程であって、前記複数の方向は、前記音場のエネルギーのうち少なくとも指定された大きさの部分が前記第1位置に生成される方向である、工程と、
    前記複数の指向性信号源の空間内の前記第1位置からの複数の距離を取得する工程と、
    前記複数の方向と前記複数の距離とに基づいて、前記第1位置とは異なる第2位置に前記音場を生成する音場生成工程と、を備える方法を行わせるコードを含む、コンピュータプログラム製品。
  12. 前記サウンドデータは第1の行列を含み、前記第1の行列の各成分は、前記第1位置を中心とする単位球面上の複数の地点における前記音場の球面調和関数展開の係数であり、
    前記方向識別工程は、
    前記第1位置を中心とする前記単位球面上の前記複数の地点において評価される球面調和関数の項を成分として有する、第2の行列を生成する工程と、
    第3の行列を生成するべく前記第1の行列と前記第2の行列とを乗算する工程であって、前記第3の行列の各列は、前記単位球面上の前記複数の地点のうちの一地点に対応し、前記単位球面上の前記複数の地点のうちの前記一地点における前記音場を表す、工程と、
    前記単位球面上の前記複数の地点のうち、前記第3の行列の列のうち最大値のベクトルノルムを有する列に対応する一地点を、前記複数の方向のうちの1つの方向として識別する工程と、を含む、請求項11に記載のコンピュータプログラム製品。
  13. 前記方向識別工程は、
    前記第3の行列の前記列と前記第2の行列の転置とを乗算して第4の行列を生成する工程と、
    前記第1の行列から前記第4の行列を減算して残差の行列を生成する工程と、
    前記単位球面上の前記複数の地点のうち、前記残差の行列と前記第2の行列とを乗算することにより形成される第5の行列の列のうち最大値のベクトルノルムを有する列に対応する一地点を、前記複数の方向のうちの第2の方向として識別する工程と、をさらに含む、請求項12に記載のコンピュータプログラム製品。
  14. 前記音場は壁を有する部屋において受信され、
    前記方法は、
    前記複数の指向性信号源の前記複数の方向の各々について、該方向を有する前記指向性信号源により生成される指向性信号が、前記部屋の1つの壁からの別の指向性信号のサウンドの反射の結果であるか否かの指示を生成するべく、指向性信号ラベリング演算を行う、ラベリング演算工程をさらに備える、請求項12または13に記載のコンピュータプログラム製品。
  15. 前記ラベリング演算工程は、
    前記複数の方向のうちの第1の方向の第1の音場と前記複数の方向のうちの第2の方向の第2の音場とに対する相互相関演算を行い、相互相関結果を生成する工程であって、前記第1の音場は、前記第1の音場が前記第1の方向の指向性信号源により前記複数の距離のうちの1つの距離に生成される指向性信号の結果である、直接の音場である、工程と、
    前記相互相関結果が閾値よりも小さいことに応じて、前記第2の音場が直接の音場であることを示す第1のインジケータを生成する工程と、
    前記相互相関結果が前記閾値よりも大きいことに応じて、前記第2の音場が前記部屋の1つの壁からの別の指向性信号の反射の結果であることを示す、第2のインジケータを生成する工程と、を含む請求項14に記載のコンピュータプログラム製品。
  16. 前記音場生成工程は、前記複数の方向の各々について、該方向の音場に振幅因子と位相因子とを乗算する工程であって、前記位相因子の位相は、空間内の前記第2位置から該方向の前記指向性信号源までの距離と空間内の前記第1位置から該方向の仮想的な前記指向性信号源までの距離との差に基づく、工程を含む、請求項12〜15のいずれか一項に記載のコンピュータプログラム製品。
  17. 1組の前記方向の各々の前記音場に振幅因子を乗算することは、
    該方向を有する前記指向性信号源が直接のソースであることに応じて、前記振幅因子を、空間内の前記第1位置から該方向を有する前記指向性信号源までの距離に対する、空間内の前記第2位置から該方向を有する前記指向性信号源までの距離の比率となるように設定することと、
    該方向を有する前記指向性信号が反射の結果であることに応じて、前記振幅因子を、空間内の前記第1位置から該方向にある見かけのソースまでの距離の合計に対する、空間内の前記第2位置から該方向にある前記見かけのソースまでの距離の合計の比率となるように設定することと、を含む、請求項16に記載のコンピュータプログラム製品。
  18. 複数の仮想的な指向性信号源の空間内の前記第1位置からの複数の距離を取得することは、球体カメラから前記複数の距離を受信することを含む、請求項11〜17のいずれか一項に記載のコンピュータプログラム製品。
  19. 複数の仮想的な指向性信号源の複数の方向と複数の距離とから凸包を生成する工程をさらに備え、
    前記音場生成工程は、
    前記第2地点が前記凸包の外にあるか否かを判定する工程と、
    前記第2地点が前記凸包の外にあることに応じて、前記音場は前記第2地点にて正確に再現されない場合があるという指示を返す工程と、を含む、請求項11〜18のいずれか一項に記載のコンピュータプログラム製品。
  20. リスナー用の音場をレンダリングするように構成されている電子装置であって、
    メモリと、
    前記メモリに結合されている制御回路と、を備え、該制御回路は、
    空間内の第1位置に複数の指向性信号源によって生成される音場から得られるサウンドデータを受信することであって、各指向性信号源は前記音場に寄与する指向性信号を生成することと、
    前記サウンドデータに基づいて前記複数の指向性信号源の複数の方向を識別することであって、前記複数の方向は、前記音場のエネルギーのうち少なくとも指定された大きさの部分が前記第1位置に生成される方向であることと、
    前記複数の指向性信号源の空間内の前記第1位置からの複数の距離を取得することと、
    前記複数の方向と前記複数の距離とに基づいて、前記第1位置とは異なる第2位置に前記音場を生成することと、を行うように構成されている、電子装置。
JP2019565244A 2017-07-12 2018-06-15 指向性分解および経路距離の見積りを用いたアンビソニックス音場ナビゲーション Pending JP2020522171A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/647,741 US10182303B1 (en) 2017-07-12 2017-07-12 Ambisonics sound field navigation using directional decomposition and path distance estimation
US15/647,741 2017-07-12
PCT/US2018/037696 WO2019013924A1 (en) 2017-07-12 2018-06-15 NAVIGATION IN A SOUND OF AMBIPHONIA USING DIRECTIONAL DECOMPOSITION AND TRAVEL DISTANCE ESTIMATION

Publications (1)

Publication Number Publication Date
JP2020522171A true JP2020522171A (ja) 2020-07-27

Family

ID=62842259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019565244A Pending JP2020522171A (ja) 2017-07-12 2018-06-15 指向性分解および経路距離の見積りを用いたアンビソニックス音場ナビゲーション

Country Status (6)

Country Link
US (3) US10182303B1 (ja)
EP (1) EP3652965B1 (ja)
JP (1) JP2020522171A (ja)
KR (1) KR102311004B1 (ja)
CN (1) CN110574398B (ja)
WO (1) WO2019013924A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10182303B1 (en) * 2017-07-12 2019-01-15 Google Llc Ambisonics sound field navigation using directional decomposition and path distance estimation
RU2740703C1 (ru) 2017-07-14 2021-01-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многослойного описания
RU2736418C1 (ru) 2017-07-14 2020-11-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многоточечного описания звукового поля
US11615208B2 (en) 2018-07-06 2023-03-28 Capital One Services, Llc Systems and methods for synthetic data generation
CN110456792A (zh) * 2019-08-06 2019-11-15 清华大学 动态环境下的多智能体群系统导航与避障方法及装置
FR3131164B1 (fr) * 2021-12-16 2023-12-22 Fond B Com Procédé d’estimation d’une pluralité de signaux représentatifs du champ sonore en un point, dispositif électronique et programme d’ordinateur associés

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006038402A1 (ja) * 2004-10-01 2006-04-13 Matsushita Electric Industrial Co., Ltd. 音響調整装置および音響調整方法
JP2007329702A (ja) * 2006-06-08 2007-12-20 Toyota Motor Corp 受音装置と音声認識装置とそれらを搭載している可動体
JP2016508343A (ja) * 2013-01-16 2016-03-17 トムソン ライセンシングThomson Licensing Hoaラウドネスレベルを測定する方法及びhoaラウドネスレベルを測定する装置
WO2017098949A1 (ja) * 2015-12-10 2017-06-15 ソニー株式会社 音声処理装置および方法、並びにプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4347422B2 (ja) 1997-06-17 2009-10-21 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 空間形成されたオーディオの再生
FR2847376B1 (fr) * 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US9196238B2 (en) 2009-12-24 2015-11-24 Nokia Technologies Oy Audio processing based on changed position or orientation of a portable mobile electronic apparatus
CN107071687B (zh) * 2012-07-16 2020-02-14 杜比国际公司 用于渲染音频声场表示以供音频回放的方法和设备
CN104244164A (zh) * 2013-06-18 2014-12-24 杜比实验室特许公司 生成环绕立体声声场
US10225680B2 (en) 2013-07-30 2019-03-05 Thomas Alan Donaldson Motion detection of audio sources to facilitate reproduction of spatial audio spaces
US10089063B2 (en) * 2016-08-10 2018-10-02 Qualcomm Incorporated Multimedia device for processing spatialized audio based on movement
US10182303B1 (en) * 2017-07-12 2019-01-15 Google Llc Ambisonics sound field navigation using directional decomposition and path distance estimation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006038402A1 (ja) * 2004-10-01 2006-04-13 Matsushita Electric Industrial Co., Ltd. 音響調整装置および音響調整方法
JP2007329702A (ja) * 2006-06-08 2007-12-20 Toyota Motor Corp 受音装置と音声認識装置とそれらを搭載している可動体
JP2016508343A (ja) * 2013-01-16 2016-03-17 トムソン ライセンシングThomson Licensing Hoaラウドネスレベルを測定する方法及びhoaラウドネスレベルを測定する装置
WO2017098949A1 (ja) * 2015-12-10 2017-06-15 ソニー株式会社 音声処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
US20190020967A1 (en) 2019-01-17
WO2019013924A1 (en) 2019-01-17
EP3652965B1 (en) 2023-08-02
KR102311004B1 (ko) 2021-10-07
US10715944B2 (en) 2020-07-14
EP3652965A1 (en) 2020-05-20
US20210160643A1 (en) 2021-05-27
CN110574398A (zh) 2019-12-13
US10182303B1 (en) 2019-01-15
KR20190140022A (ko) 2019-12-18
CN110574398B (zh) 2021-07-27
US20190373392A1 (en) 2019-12-05

Similar Documents

Publication Publication Date Title
JP2020522171A (ja) 指向性分解および経路距離の見積りを用いたアンビソニックス音場ナビゲーション
US9992602B1 (en) Decoupled binaural rendering
US10873814B2 (en) Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices
US11284211B2 (en) Determination of targeted spatial audio parameters and associated spatial audio playback
CN109964272B (zh) 声场表示的代码化
US10158963B2 (en) Ambisonic audio with non-head tracked stereo based on head position and time
US11595774B2 (en) Spatializing audio data based on analysis of incoming audio data
US20180197551A1 (en) Spatial audio warp compensator
EP3695403A1 (en) Joint wideband source localization and acquisition based on a grid-shift approach
JP6985425B2 (ja) インコヒーレント冪等アンビソニックスレンダリング
CN111684822B (zh) 环境立体声的定向增强
US12126984B2 (en) Three-dimensional audio source spatialization
US20240334146A1 (en) Headphone rendering metadata-preserving spatial coding
CN117523090A (zh) 一种场景重建方法、装置、设备及存储介质
EP3984249A1 (en) Three-dimensional audio source spatialization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191125

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200121

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20200122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210524

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20211025