JP2020526962A - 多チャネルバイノーラル録音および動的再生 - Google Patents

多チャネルバイノーラル録音および動的再生 Download PDF

Info

Publication number
JP2020526962A
JP2020526962A JP2019572550A JP2019572550A JP2020526962A JP 2020526962 A JP2020526962 A JP 2020526962A JP 2019572550 A JP2019572550 A JP 2019572550A JP 2019572550 A JP2019572550 A JP 2019572550A JP 2020526962 A JP2020526962 A JP 2020526962A
Authority
JP
Japan
Prior art keywords
binaural
pairs
head position
microphones
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019572550A
Other languages
English (en)
Inventor
エリクセン,シュタイン,オーヴ
Original Assignee
ハドリー インコーポレイテッド
ハドリー インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ハドリー インコーポレイテッド, ハドリー インコーポレイテッド filed Critical ハドリー インコーポレイテッド
Publication of JP2020526962A publication Critical patent/JP2020526962A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • H04R1/083Special constructions of mouthpieces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Stereophonic Arrangements (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

VR/AR用途における強化された音声体験のための方法およびシステムが提供される。本開示の装置は、複数のバイノーラルステレオ対を録音し、ユーザの頭部位置に対応する選ばれたバイノーラル対を再生するように適合されている。複数のバイノーラルステレオ対を録音するために、さまざまな実施形態で、実質的に球形のマイクロアレイが利用される。さらに、ユーザの頭部位置を追跡し、頭部位置に対応するバイノーラル音対を動的に再生するように、VR/ARヘッドセットが適合されている。

Description

本開示は一般に音声録音および再生に関する。詳細には、本開示は、強化された仮想現実感/拡張現実感(VR/AR)音声体験を提供するための装置および方法に関する。より詳細には、多チャネルサラウンドサウンド録音および録音された音のバイノーラル再生のための装置および方法が提供される。
録音は、長い間、主要な2つの方法、すなわちモノおよびステレオを使用して実施されてきた。モノは、音をピックアップするのに単一のマイクロホンを使用し、ステレオは、互いに間隔を置いて配置された2つのマイクロホンを使用する。近年のVR/AR技術の出現および広がりにより、録音はしばしば、2つ超のマイクロホンを使用して実施されている。その結果得られた録音は通常、再生に2つ超のスピーカを必要とする。いくつかのシナリオでは、この録音に対してミキシング処理または信号処理が実行され、それによって2つのスピーカだけを使用して再生がなされる。しかしながら、関与するスピーカの数を問わず、このような「シミュレートされた」サラウンドサウンドはしばしば、現実とは感じられないまたは満足できない人間の耳の聴音(listening)体験につながる。これは、1つには、人間の耳による聴力(hearing)または聴覚(auditory perception)の複雑さ、特に、リスナの頭および耳に対する音源の相対的位置および向きに対する聴力の感度に起因する。
録音および聴音体験を改善する目的でバイノーラル録音が利用されている。しかしながら、一組の耳介を有する従来の「ダミーヘッド」は一般に1つの向きまたは位置を提示するため、このようなダミーヘッドには限界がある。例えば、ダミーヘッドが、リスナの頭の位置(以後、頭部位置という)または向きを模倣しない場合、その結果得られる音は、リスナの耳の聴音体験を、現実のものまたはビセラル(visceral)なものとしては生み出さないであろう。このことは特にVR/AR用途で問題となる。これは、聴覚のわずかな瑕疵が、全体のVR/AR体験を、設計よりも劣ったものにする可能性があるためである。
したがって、強化されたVR/AR音声体験を提供する改良された方法およびシステムが求められている。より詳細には、サラウンドサウンド録音および再生を改良する装置および方法であって、頭部位置および向きの変化を考慮する装置および方法が求められている。
したがって、本開示の目的は、ユーザまたはリスナの頭部位置および角度に対応した強化されたVR/AR音声体験のための方法およびシステムを提供することにある。
具体的には、本開示によれば、一実施形態において、ユーザの少なくとも2つの頭部位置に対応するサラウンドサウンド録音およびバイノーラル再生のためのシステムが提供される。このシステムは、複数のバイノーラル音対を録音するように適合された実質的に球形のマイクロホンアレイと、これらの複数のバイノーラル音対を処理し、それによって複数のバイノーラル音声対を生成するように適合された多チャネル録音プロセッサと、ユーザの頭部位置を検索し、その頭部位置に基づいてこれらの複数のバイノーラル音声対を処理し、それによってその頭部位置に対応するバイノーラル音対を再現するように適合された多チャネル再生プロセッサと、このバイノーラル音対を再生するように適合された再生ユニットとを備える。
別の実施形態では、再生ユニットが、ヘッドホンとイヤホンのうちの一方である。さらに別の実施形態では、このヘッドホンまたはイヤホンが無線式である。
さらなる実施形態では、このシステムが、多チャネル再生プロセッサに接続された追跡ユニット(tracking unit)であり、ユーザの頭部位置を追跡するように適合された追跡ユニットをさらに備える。
別の実施形態によれば、この追跡ユニットが、仮想現実感および拡張現実感(VR/AR)ヘッドセットである。
さらに別の実施形態によれば、実質的に球形のマイクロホンアレイが、実質的に球形のフレームと、このフレームに固定された複数のマイクロホンとを備える。バイノーラル音対を録音するため、これらの複数のマイクロホンのうちのそれぞれのマイクロホンは、大円(orthodrome)上でそのマイクロホンの反対側に位置するマイクロホンと対をなしている。
さらに別の実施形態によれば、フレームのそれぞれの大円の直径が実質的に、人間の一対の耳の耳と耳の間の距離である。
さらなる実施形態によれば、フレームが、ゴム、シリコーン、金属、プラスチックまたはこれらの組合せでできている。
別の実施形態では、実質的に球形のマイクロホンアレイが18個のマイクロホンを含む。さらに別の実施形態では、実質的に球形のマイクロホンアレイが32個のマイクロホンを含む。
さらなる実施形態では、多チャネル録音プロセッサが、音信号をフィルタリング処理するように適合された多チャネル増幅器をさらに備える。
本開示によれば、別の実施形態において、バイノーラル録音のための装置が提供される。この装置は、複数のバイノーラル音対を録音するように適合された実質的に球形のマイクロホンアレイと、これらの複数のバイノーラル音対を処理し、それによって複数のバイノーラル音声対を生成するように適合された多チャネル録音プロセッサとを備える。
本開示によれば、さらに別の実施形態において、強化された音声体験をユーザに提供するためのVR/ARシステムが提供される。このシステムは、ユーザの頭部位置を追跡するように適合されたVR/ARヘッドセットと、前述の装置と、VR/ARヘッドセットに接続されたVR/ARイヤセットであり、VR/ARヘッドセットからユーザの頭部位置を検索するように適合されたVR/ARイヤセットとを備える。このVR/ARイヤセットはさらに、複数のバイノーラル音対を受け取り、頭部位置に対応するバイノーラル音対を動的に再現するように適合されている。
別の実施形態では、VR/ARヘッドセットとVR/ARイヤセットとが物理的に接合されている。さらに別の実施形態では、VR/ARヘッドセットとVR/ARイヤセットとが無線で接続されている。
本開示によれば、さらなる実施形態において、バイノーラル音声ストリームをユーザの頭部位置に基づいて動的に再生するための方法が提供される。この方法は、異なる頭部位置に対応するサラウンドサウンドのバイノーラル録音による複数のバイノーラル音声対を処理すること、ユーザの頭部位置を検索すること、および頭部位置に対応するバイノーラル音対を出力することを含む。
別の実施形態では、この方法が、実質的に球形のマイクロホンアレイを使用して複数のバイノーラル音対を録音すること、および複数のバイノーラル音声対を生成することをさらに含む。さらに別の実施形態では、これらの複数のバイノーラル音対が9つのチャネルを含む。さらなる実施形態では、これらの複数のバイノーラル音対が16個のチャネルを含む。
実質的に球形のマイクロホンアレイを示す、本開示の一実施形態に基づく図である。 実質的に球形のマイクロホンアレイの透視図を示す、一実施形態に基づく図である。 ヘッドホン再生ユニットを示す、別の実施形態に基づく図である。 上は、ある頭部位置、下は、異なる角度から見た実質的に球形のフレーム上の対応するマイクロホン対を示す、一実施形態に基づく図である。 上は、ある別の頭部位置、下は、異なる角度から見た実質的に球形のフレーム上の対応するマイクロホン対を示す、別の実施形態に基づく図である。 上は、ある追加の頭部位置、下は、異なる角度から見た実質的に球形のフレーム上の対応するマイクロホン対を示す、別の実施形態に基づく図である。 上は、あるさらなる頭部位置、下は、異なる角度から見た実質的に球形のフレーム上の対応するマイクロホン対を示す、一実施形態に基づく図である。 バイノーラル音対を再生するための方法の概要を示す、一実施形態に基づく図である。
本開示の録音および再生システムは、複数のバイノーラルステレオ対を録音し、ユーザの頭部位置に対応する選ばれたバイノーラル対を再生するように適合されている。さまざまな実施形態で、バイノーラルサラウンドサウンド録音および動的再生の方法は、VR/AR用途におけるユーザのサラウンドサウンド音声体験を強化する。
<バイノーラル録音>
本開示の例示的なシステムは、球形マイクロホンアレイを含み、このアレイは、アレイのそれぞれのマイクロホンの近傍の音を集めるためのものである。一実施形態では、この球形マイクロホンアレイが、実質的に球形のフレームと、フレームに固定された複数のマイクロホンとを備える。図1を参照すると、この球形フレームの3次元(3−D)透視図が示されている。球形フレームの外面には複数のマイクロホンが固定されている。これらのマイクロホンは、球の表面全体にわたって複製された(dubbed)突起物として示されている。それぞれのマイクロホンは3−D座標系内に配置されており、したがって3−D座標系内で追跡可能である。一実施形態ではこの3−D座標系が球座標系であり、代替実施形態では3−Dデカルト座標系である。図1の球形フレームの中心に3−D座標系の一例が示されている。
一実施形態によれば、これらの複数のマイクロホンのうちのそれぞれのマイクロホンは、大円上でそのマイクロホンの反対側に位置するマイクロホンと対をなしている。それぞれのマイクロホン対は、ユーザの頭の対応する向きまたは角度に対するバイノーラル音対を録音するように設計されている。対をなす2つのマイクロホン間の距離は実質的に耳と耳の間の距離と同じである。すなわち、球形フレームのそれぞれの大円の直径は、人間の一対の耳の耳と耳の間の距離に実質的に等しい。図3を参照すると、一実施形態では、人間の一対の耳の耳と耳の間の距離が12cmである。代替実施形態では、ユーザの母集団内の異なる頭のサイズまたは耳の距離に対応するためにこの距離が変動する。
図2を参照すると、球形フレーム上のマイクロホンの配置の一例が、別の図解で示されている。球形フレームの中心にはやはり3−D座標系が示されている。球形マイクロホンアレイのそれぞれのマイクロホンは、3−D座標系におけるそのマイクロホンの座標、例えば一実施形態によれば3−Dデカルト座標系の(a,b,c)または別の実施形態によれば球座標系の(r,θ,φ)によってアドレス指定または追跡が可能である。
さまざまな実施形態で、球形フレームは、ゴム、シリコーン、金属、プラスチックまたは他の複合材料でできている。球形フレーム上に固定されたマイクロホンは、さまざまな録音環境に適したさまざまな仕様を有する。
図4〜7を参照すると、球形フレーム上のマイクロホンの位置が、人間の頭の異なる向きに対してマップされている。これらの向きは例えば、前向きから後ろ向き、左向きから右向き、上向きから下向きおよび斜め上向きまたは斜め下向きを含む。これらの位置は特に、上で論じた3−D座標を使用して追跡される。
図2に示された例示的配置では、球形フレーム上に18個のマイクロホンが固定されている。したがって、このマイクロホンアレイは最大9つのバイノーラル音声チャネルを録音することができる。さまざまな実施形態で、マイクロホンアレイの設計に従ってマイクロホンの数を変更することができる。代替実施形態では、球形フレーム上に32個のマイクロホンが固定されており、最大16個のバイノーラル音声チャネルが生成されうる。
本開示のシステムはさらに、球形マイクロホンアレイに接続された多チャネル録音プロセッサを含む。この多チャネル録音プロセッサは、マイクロホンアレイの集められた音信号から複数のバイノーラル音声対を生成するように適合されている。一実施形態では、この多チャネル録音プロセッサが、音信号をフィルタリング処理してn個の音声ストリーム対を生成するための多チャネル(例えば、N対の)前置増幅器を含む。別の実施形態では、この録音プロセッサがさらに、サンプリング用のデータ取得カードを含む。
その結果得られる多チャネル録音プロセッサからのバイノーラルサラウンドサウンドは、本開示のシステムにより、以下に論じるようにして、動的に再生することができる。
<動的再生>
一実施形態では、本開示の録音および再生システムが、多チャネルサラウンドサウンド録音のバイノーラル再生能力を有する。この多チャネルサラウンドサウンドは、リスナに対して動的にレンダリングされ、サラウンドサウンドフィールド内で頭を回転させているまたは動かしているリスナに、その頭部位置または向きに整合した一対のバイノーラル音を送達する。このことは、VR/AR用途について音声体験を強化および改善する。
動的再生のため、本開示のシステムは、再生ユニットおよび多チャネル再生プロセッサを含む。この再生ユニットは、バイノーラル音対を再生するように適合されている。さまざまな実施形態で、再生ユニットは、さまざまな設計の有線または無線のヘッドホンまたはイヤホンである。ある実施形態では再生ユニットがVR/ARヘッドセットである。代替実施形態では、再生ユニットが、サラウンドサウンド効果のために空間内に配置された複数のスピーカ対を含む。
この再生ユニットは、本開示の多チャネル再生プロセッサに接続されている。ある実施形態では、再生ユニットと再生プロセッサとが物理的に接合されている。多チャネル再生プロセッサは、ユーザの頭部位置を検索し、頭部位置に基づいて複数のバイノーラル音声対を処理し、それによって頭部位置に対応するバイノーラル音対を再現するように適合されている。この動的再生プロセスの概要が図8に示されている。
詳細には、本開示の再生プロセッサは、音声データと頭部位置データ(例えばリスナの頭の位置および角度)との結合処理(joint processing)を実行するように構成されている。一実施形態では、再生プロセッサがさらに、3−D座標系における頭部位置および向きを追跡するように適合された追跡ユニットを含む。この3−D座標系は、一実施形態では3−Dデカルト座標系、別の実施形態では3−D球座標系である。さまざまな実施形態で、この追跡ユニットを、ハードウェア、ソフトウェア、ファームウェアまたはこれらの組合せとすることができる。ある実施形態では、この追跡ユニットが、追跡カメラを備えるVR/ARヘッドセットである。別の実施形態では、この追跡ユニットが、ジャイロスコープを備えるスマートホンまたはスマートカメラ装置である。
一実施形態に基づく動的再生法は、追跡ユニットの3−D座標系の座標もしくは基準点を、球形マイクロホンアレイの3−D座標系の座標もしくは基準点に関係づけること、または前者を後者と比較することに基づく。1つの座標または一組の座標によって定義された対応する頭部位置を検索し、次いで、その頭部位置を、その3−D座標に基づいて、球形マイクロホンアレイのそれぞれのマイクロホン対と整合させる。代替実施形態では、使用可能なマイクロホン対に基づいて、マイクロホン対と頭部位置とを実質的にまたは近似的に整合させることができる。
次いで、再生ユニットが、整合した座標データを受け取り、整合した座標に基づいてバイノーラル音対を再生する。
<音声が強化されたVR/ARシステム>
サラウンドサウンド録音およびバイノーラル再生のための本開示のシステムおよび方法を、VR/AR用途において有利に使用することができる。
一実施形態では、音声が強化されたVR/ARシステムが提供され、このVR/ARシステムは、ユーザの頭部位置を追跡するように適合されたVR/ARヘッドセットと、VR/ARヘッドセットに接続されたVR/ARイヤセットであり、VR/ARヘッドセットからユーザの頭部位置を検索するように適合されたVR/ARイヤセットと、球形マイクロホンアレイを備えるバイノーラル録音装置とを含む。このVR/ARイヤセットは、複数のバイノーラル音対を受け取り、頭部位置に対応するバイノーラル音対を動的に再現するように適合されている。代替実施形態では、VR/ARヘッドセットとVR/ARイヤセットとが接合されて1つの装置として構成されている。
VR設定では、近似的に整合させたバイノーラル音声対のこのシステムによる動的レンダリングが、視覚的体験に対応しその視覚的体験を確認する音声体験をリスナに与え、それによって、多チャネルサラウンドサウンド録音が実施された空間内でユーザが頭を回転させたり、動かしたりしたときに、全体的な没入感のある(immersive)VR体験を提供する。
ある実施形態によれば、VR/ARシステム上で事前較正が実行される。例えば、最初に、多チャネル再生プロセッサが、球形マイクロホンアレイのマイクロホン対の座標に対応するリスナの頭の向きのマップを較正および構築する。再生プロセッサは次いで、頭の向きまたは位置を検出する。再生プロセッサは、頭の向きまたは位置の現在位置または当時の現在位置に整合した、マイクロホン対によって録音された2つのサウンドトラックを検索し、対応する録音対を、再生のため、一実施形態ではVRヘッドホンまたはイヤセットである再生ユニットに送る。
別の実施形態では、VRサラウンドサウンド空間に戦略的に配置された複数の球形アレイを備える本開示の録音システムによって、バイノーラルサラウンドサウンド録音が達成される。
図面および例を含む上記のさまざまな実施形態の説明は、本発明および本発明のさまざまな実施形態を例示するためのものであり、本発明を限定するものではない。

Claims (23)

  1. ユーザの少なくとも2つの頭部位置に対応するサラウンドサウンド録音およびバイノーラル再生のためのシステムであって、
    複数のバイノーラル音対を録音するように適合された実質的に球形のマイクロホンアレイと、
    前記複数のバイノーラル音対を処理し、それによって複数のバイノーラル音声対を生成するように適合された多チャネル録音プロセッサと、
    前記ユーザの頭部位置を検索し、前記頭部位置に基づいて前記複数のバイノーラル音声対を処理し、それによって前記頭部位置に対応するバイノーラル音対を再現するように適合された多チャネル再生プロセッサと、
    前記バイノーラル音対を再生するように適合された再生ユニットと
    を備えるシステム。
  2. 前記再生ユニットが、ヘッドホンとイヤホンのうちの一方である、請求項1に記載のシステム。
  3. ヘッドホンとイヤホンのうちの前記一方が無線式である、請求項2に記載のシステム。
  4. 前記多チャネル再生プロセッサに接続された追跡ユニットをさらに備え、前記追跡ユニットが、ユーザの頭部位置を追跡するように適合された、請求項1に記載のシステム。
  5. 前記追跡ユニットが、仮想現実感および拡張現実感(VR/AR)ヘッドセットである、請求項4に記載のシステム。
  6. 前記実質的に球形のマイクロホンアレイが、実質的に球形のフレームと、前記フレームに固定された複数のマイクロホンとを備え、バイノーラル音対を録音するために、前記複数のマイクロホンのうちのそれぞれのマイクロホンが、大円上でそのマイクロホンの反対側に位置するマイクロホンと対をなしている、請求項1に記載のシステム。
  7. 前記フレームのそれぞれの大円の直径が実質的に、人間の一対の耳の耳と耳の間の距離である、請求項6に記載のシステム。
  8. 前記フレームが、ゴム、シリコーン、金属およびプラスチックのうちの少なくとも1つでできている、請求項5に記載のシステム。
  9. 前記実質的に球形のマイクロホンアレイが18個のマイクロホンを含む、請求項6に記載のシステム。
  10. 前記実質的に球形のマイクロホンアレイが32個のマイクロホンを含む、請求項6に記載のシステム。
  11. 前記多チャネル録音プロセッサが、音信号をフィルタリング処理するように適合された多チャネル増幅器をさらに備える、請求項1に記載のシステム。
  12. バイノーラル録音のための装置であって、
    複数のバイノーラル音対を録音するように適合された実質的に球形のマイクロホンアレイと、
    前記複数のバイノーラル音対を処理し、それによって複数のバイノーラル音声対を生成するように適合された多チャネル録音プロセッサと、
    を備える装置。
  13. 前記実質的に球形のマイクロホンアレイが、実質的に球形のフレームと、前記フレームに固定された複数のマイクロホンとを備え、
    バイノーラル音対を録音するために、前記複数のマイクロホンのうちのそれぞれのマイクロホンが、大円上でそのマイクロホンの反対側に位置するマイクロホンと対をなしている、請求項12に記載の装置。
  14. 前記複数のマイクロホンが18個のマイクロホンを含む、請求項13に記載の装置。
  15. 前記複数のマイクロホンが32個のマイクロホンを含む、請求項13に記載の装置。
  16. 前記多チャネル録音プロセッサが、音信号をフィルタリング処理するように適合された多チャネル増幅器をさらに備える、請求項12に記載の装置。
  17. 強化された音声体験をユーザに提供するためのVR/ARシステムであって、
    ユーザの頭部位置を追跡するように適合されたVR/ARヘッドセットと、
    請求項12に記載の装置と、
    前記VR/ARヘッドセットに接続されたVR/ARイヤセットであり、前記VR/ARヘッドセットから前記ユーザの頭部位置を検索するように適合されたVR/ARイヤセットと、
    を備え、
    前記VR/ARイヤセットがさらに、複数のバイノーラル音対を受け取り、前記頭部位置に対応するバイノーラル音対を動的に再現するように適合された、VR/ARシステム。
  18. 前記VR/ARヘッドセットと前記VR/ARイヤセットとが物理的に接合された、請求項17に記載のVR/ARシステム。
  19. 前記VR/ARヘッドセットと前記VR/ARイヤセットとが無線で接続された、請求項17に記載のVR/ARシステム。
  20. バイノーラル音声ストリームをユーザの頭部位置に基づいて動的に再生するための方法であって、
    異なる頭部位置に対応するサラウンドサウンドのバイノーラル録音による複数のバイノーラル音声対を処理することと、
    前記ユーザの頭部位置を検索することと、
    前記頭部位置に対応するバイノーラル音対を出力することと、
    を含む方法。
  21. 実質的に球形のマイクロホンアレイを使用して複数のバイノーラル音対を録音することと、
    複数のバイノーラル音声対を生成することと、
    をさらに含む、請求項20に記載の方法。
  22. 前記複数のバイノーラル音対が9つのチャネルを含む、請求項21に記載の方法。
  23. 前記複数のバイノーラル音対が16個のチャネルを含む、請求項21に記載の方法。
JP2019572550A 2017-07-06 2018-07-04 多チャネルバイノーラル録音および動的再生 Pending JP2020526962A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/643,374 2017-07-06
US15/643,374 US10516962B2 (en) 2017-07-06 2017-07-06 Multi-channel binaural recording and dynamic playback
PCT/US2018/040829 WO2019010251A1 (en) 2017-07-06 2018-07-04 MULTI-CHANNEL BINARY RECORDING AND DYNAMIC READING

Publications (1)

Publication Number Publication Date
JP2020526962A true JP2020526962A (ja) 2020-08-31

Family

ID=64903011

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019572550A Pending JP2020526962A (ja) 2017-07-06 2018-07-04 多チャネルバイノーラル録音および動的再生

Country Status (9)

Country Link
US (2) US10516962B2 (ja)
EP (1) EP3649793A4 (ja)
JP (1) JP2020526962A (ja)
KR (1) KR102534802B1 (ja)
CN (2) CN116761130A (ja)
AU (1) AU2018298083B2 (ja)
CA (1) CA3068843A1 (ja)
NO (1) NO20200013A1 (ja)
WO (1) WO2019010251A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006503526A (ja) * 2002-10-18 2006-01-26 ザ リージェンツ オブ ザ ユニヴァーシティー オブ カリフォルニア 動的なバイノーラルサウンドの取込及び再生

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2722637B1 (fr) 1994-07-15 1996-09-20 Mahieux Yannick Systeme de prise de son selective pour environnement reverberant et bruyant
US20080056517A1 (en) * 2002-10-18 2008-03-06 The Regents Of The University Of California Dynamic binaural sound capture and reproduction in focued or frontal applications
US8229134B2 (en) * 2007-05-24 2012-07-24 University Of Maryland Audio camera using microphone arrays for real time capture of audio images and method for jointly processing the audio images with video images
TWI651005B (zh) 2011-07-01 2019-02-11 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
US10585472B2 (en) 2011-08-12 2020-03-10 Sony Interactive Entertainment Inc. Wireless head mounted display with differential rendering and sound localization
EP2592845A1 (en) * 2011-11-11 2013-05-15 Thomson Licensing Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US9154877B2 (en) * 2012-11-28 2015-10-06 Qualcomm Incorporated Collaborative sound system
US9237398B1 (en) * 2012-12-11 2016-01-12 Dysonics Corporation Motion tracked binaural sound conversion of legacy recordings
US9197962B2 (en) * 2013-03-15 2015-11-24 Mh Acoustics Llc Polyhedral audio system based on at least second-order eigenbeams
US9794684B2 (en) * 2015-02-13 2017-10-17 Seiko Epson Corporation Head-mounted display device, control method for the same, and computer program
CN105263093B (zh) * 2015-10-12 2018-06-26 深圳东方酷音信息技术有限公司 一种全方位声音采集装置、编辑装置及系统
US10979843B2 (en) * 2016-04-08 2021-04-13 Qualcomm Incorporated Spatialized audio output based on predicted position data
US10250986B2 (en) * 2016-05-24 2019-04-02 Matthew Marrin Multichannel head-trackable microphone
WO2018027880A1 (zh) * 2016-08-12 2018-02-15 森声数字科技(深圳)有限公司 一种固定装置及音频采集设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006503526A (ja) * 2002-10-18 2006-01-26 ザ リージェンツ オブ ザ ユニヴァーシティー オブ カリフォルニア 動的なバイノーラルサウンドの取込及び再生

Also Published As

Publication number Publication date
KR102534802B1 (ko) 2023-05-22
EP3649793A1 (en) 2020-05-13
AU2018298083A1 (en) 2020-01-30
WO2019010251A1 (en) 2019-01-10
CN116761130A (zh) 2023-09-15
US20200084566A1 (en) 2020-03-12
EP3649793A4 (en) 2021-03-10
NO20200013A1 (en) 2020-01-06
US11671782B2 (en) 2023-06-06
CN111095951A (zh) 2020-05-01
KR20200022455A (ko) 2020-03-03
AU2018298083B2 (en) 2022-06-16
CA3068843A1 (en) 2019-01-10
US10516962B2 (en) 2019-12-24
US20190014432A1 (en) 2019-01-10

Similar Documents

Publication Publication Date Title
JP6799141B2 (ja) 空間化オーディオを用いた複合現実システム
US20180206039A1 (en) Capturing Sound
US8442244B1 (en) Surround sound system
CN106134223A (zh) 重现双耳信号的音频信号处理设备和方法
US11546703B2 (en) Methods for obtaining and reproducing a binaural recording
WO2011154270A1 (en) Virtual spatial soundscape
JP6246922B2 (ja) 音響信号処理方法
US11683654B2 (en) Audio content format selection
JP2018110366A (ja) 3dサウンド映像音響機器
US20240107232A1 (en) Directional sound recording and playback
US11102604B2 (en) Apparatus, method, computer program or system for use in rendering audio
US11671782B2 (en) Multi-channel binaural recording and dynamic playback
Hoose Creating Immersive Listening Experiences with Binaural Recording Techniques
TW519849B (en) System and method for providing rear channel speaker of quasi-head wearing type earphone
US20220225047A1 (en) Methods for making Spatial Microphone subassemblies, Recording System and Method for Recording Left and Right Ear Sounds for use in Virtual Reality ("VR") Playback
Tan Binaural recording methods with analysis on inter-aural time, level, and phase differences
KR20020087593A (ko) 3차원 입체음향 입출력 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210616

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221004

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20221005

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20221107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230221