JP2022529202A - ヘッドセットのユーザについての頭部伝達関数の決定のための音周波数のリモート推論 - Google Patents
ヘッドセットのユーザについての頭部伝達関数の決定のための音周波数のリモート推論 Download PDFInfo
- Publication number
- JP2022529202A JP2022529202A JP2021540496A JP2021540496A JP2022529202A JP 2022529202 A JP2022529202 A JP 2022529202A JP 2021540496 A JP2021540496 A JP 2021540496A JP 2021540496 A JP2021540496 A JP 2021540496A JP 2022529202 A JP2022529202 A JP 2022529202A
- Authority
- JP
- Japan
- Prior art keywords
- headset
- audio
- user
- audio signal
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 title claims abstract description 24
- 238000012546 transfer Methods 0.000 title claims description 18
- 230000005236 sound signal Effects 0.000 claims abstract description 108
- 238000001514 detection method Methods 0.000 claims abstract description 80
- 238000000034 method Methods 0.000 claims description 40
- 210000000613 ear canal Anatomy 0.000 claims description 38
- 210000003128 head Anatomy 0.000 claims description 21
- 210000000845 cartilage Anatomy 0.000 claims description 7
- 238000010586 diagram Methods 0.000 abstract description 6
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000003287 optical effect Effects 0.000 description 27
- 230000009471 action Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 238000005259 measurement Methods 0.000 description 14
- 230000033001 locomotion Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 9
- 238000012512 characterization method Methods 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 230000004075 alteration Effects 0.000 description 4
- 210000003484 anatomy Anatomy 0.000 description 4
- 230000004438 eyesight Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000004304 visual acuity Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004297 night vision Effects 0.000 description 2
- 230000001681 protective effect Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 241000226585 Antennaria plantaginifolia Species 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 241000746998 Tragus Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 201000009310 astigmatism Diseases 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 208000018769 loss of vision Diseases 0.000 description 1
- 231100000864 loss of vision Toxicity 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
- H04S1/005—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/033—Headphones for stereophonic communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/01—Head-up displays
- G02B27/017—Head mounted
- G02B2027/0178—Eyeglass type
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/01—Head-up displays
- G02B27/017—Head mounted
- G02B27/0176—Head mounted characterised by mechanical features
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/028—Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2460/00—Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
- H04R2460/13—Hearing devices using bone conduction transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Headphones And Earphones (AREA)
- General Physics & Mathematics (AREA)
- Optics & Photonics (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
ヘッドセットが、フレーム(105)とオーディオシステムとを備える。
オーディオシステムは、検出領域(125)においてフレーム(105)上に配置されたマイクロフォンアセンブリ(120)であって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、耳の耳道からしきい値距離内にあり、マイクロフォンアセンブリ(120)が、オーディオソースから発せられたオーディオ信号を検出するように構成され、検出領域(125)において検出されたオーディオ信号が、ユーザの耳道における音圧波のしきい類似度内にある、マイクロフォンアセンブリ(120)と、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定するように構成されたオーディオコントローラとを含む。
【選択図】図1
オーディオシステムは、検出領域(125)においてフレーム(105)上に配置されたマイクロフォンアセンブリ(120)であって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、耳の耳道からしきい値距離内にあり、マイクロフォンアセンブリ(120)が、オーディオソースから発せられたオーディオ信号を検出するように構成され、検出領域(125)において検出されたオーディオ信号が、ユーザの耳道における音圧波のしきい類似度内にある、マイクロフォンアセンブリ(120)と、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定するように構成されたオーディオコントローラとを含む。
【選択図】図1
Description
関連出願の相互参照
本出願は、その内容全体がすべての目的のために参照により本明細書に組み込まれる、2019年4月22日に出願された米国出願第16/390,405号からの優先権を主張する。
本出願は、その内容全体がすべての目的のために参照により本明細書に組み込まれる、2019年4月22日に出願された米国出願第16/390,405号からの優先権を主張する。
本開示は、一般に、頭部伝達関数(HRTF:head-related transfer function)の決定に関し、詳細には、ヘッドセットのユーザについてのHRTFの決定のための音周波数のリモート推論(remote inference)に関する。
2つの耳において知覚された音は、音の方向、各耳に関する音ソースのロケーション、およびユーザの頭部および/または身体の解剖学的構造のうちの少なくとも1つ、ならびに音が知覚された部屋の周囲の状況に応じて、異なり得る。人間は、各耳において知覚された音を比較することによって音ソースのロケーションを決定することができる。あるタイプの「空間音」システムでは、複数のスピーカーが、HRTFを使用して音の方向性側面(directional aspect)を再生する。HRTFは、自由場における音ソースから人の耳への音伝達(sound transmission)を表現する。HRTFは、それらの両耳間時間差および強度差において、ならびにそれらのオーディオ周波数応答において、音ソースの方向性情報を符号化する。HRTFは人によって変動し、ユーザについての個人化されたHRTFは、オーディオコンテンツをユーザに配信するとき、ユーザが優れた空間音品質を経験することを可能にする。
HRTFを決定するための較正システムは、一般に、ユーザの耳道内に置かれるマイクロフォンを含み得る。ローカルエリア中の音ソースに応答して耳道においてオーディオ信号を測定することによって、HRTFが、ユーザについて決定され、カスタマイズされ得る。しかしながら、これは、快適または好都合なユーザ経験でない。
ヘッドセットの装着者についてのHRTFの決定のための低い音周波数のリモート推論のためのオーディオシステム。オーディオシステムは、ヘッドセットのユーザについてのHRTFのセットを生成し、および/またはカスタマイズするように構成される。HRTFは、ヘッドセットのユーザのためのオーディオコンテンツを生成するために使用され得る。いくつかの実施形態によれば、ヘッドセットは、人工現実ヘッドセットである。
オーディオシステムは、検出領域において(ヘッドセットの)フレーム上に配置されたマイクロフォンアセンブリを含む。検出領域は、ヘッドセットを装着しているユーザの耳の外部にあり、耳の耳道からしきい値距離内にある。マイクロフォンアセンブリは、オーディオソースから発せられたオーディオ信号を検出するように構成される。検出領域において検出されたオーディオ信号は、ユーザの耳道における音圧波のしきい類似度内にある。さらに、オーディオシステムは、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定するように構成されたオーディオコントローラをも含む。
いくつかの実施形態では、オーディオシステムは方法を実施する。本方法は、ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、オーディオソースから発せられたオーディオ信号を検出することを含む。検出領域は、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号は、耳道における音圧波のしきい類似度内にある。本方法は、オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいてHRTFのセットを決定することをさらに含む。
いくつかの実施形態では、好ましくは、フレームと、オーディオシステムとを備えるヘッドセットが提供され、オーディオシステムは、検出領域においてフレーム上に配置されたマイクロフォンアセンブリであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、耳の耳道からしきい値距離内にあり、マイクロフォンアセンブリが、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出するように構成され、検出領域において検出されたオーディオ信号が、ユーザの耳道における音圧波のしきい類似度内にある、マイクロフォンアセンブリと、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定するように構成されたオーディオコントローラとを含む。
マイクロフォンアセンブリは複数のマイクロフォンを備え得る。
いくつかの実施形態では、複数のマイクロフォンのうちの少なくとも1つのマイクロフォンが、検出領域以外のロケーションにおいてフレーム上に配置される。
いくつかの実施形態では、しきい値距離は最大でも3インチである。
いくつかの実施形態では、オーディオソースは、オーディオシステムの一部であるスピーカーである。
いくつかの実施形態では、スピーカーはヘッドセットのフレーム上に配置される。
いくつかの実施形態では、オーディオソースは軟骨伝導システムのトランスデューサである。
オーディオソースは、ヘッドセットの外部にあり、ヘッドセットとは別個であり得、オーディオ信号はヘッドセットのローカルエリアにおける周辺音を表す。
いくつかの実施形態では、オーディオ信号の周波数は2kHz以下である。
いくつかの実施形態では、オーディオコントローラは、ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することとを行うように構成される。
ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号が、耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することとを含む方法が提供され得る。
いくつかの実施形態では、ヘッドセットはオーディオシステムを備え、オーディオソースは、オーディオシステムの一部であるスピーカーである。
いくつかの実施形態では、オーディオ信号の周波数は2kHz以下である。
オーディオソースは軟骨伝導システムのトランスデューサであり得る。
いくつかの実施形態では、オーディオ信号はユーザのローカルエリアにおける周辺音を表す。
いくつかの実施形態では、本方法は、好ましくは、ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することとをさらに含む。
いくつかの実施形態では、好ましくは、命令を記憶する非一時的コンピュータ可読媒体が提供され、命令は、1つまたは複数のプロセッサによって実行されたとき、1つまたは複数のプロセッサに、ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号が、耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することとを含む動作を実施させる。
いくつかの実施形態では、オーディオ信号の周波数は2kHz以下である。
いくつかの実施形態では、マイクロフォンアセンブリは複数のマイクロフォンを備える。
いくつかの実施形態では、オーディオコントローラは、好ましくは、ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することとを行うように構成される。
1つまたは複数の実施形態への組込みに好適であるものとして本明細書で説明される特徴は、本開示の教示にわたって一般化され、したがって本発明の任意の実施形態への組込みに好適であるものとして、諒解される。
図は、単に例示の目的で様々な実施形態を示す。本明細書で説明される原理から逸脱することなく、本明細書で示される構造および方法の代替実施形態が採用され得ることを、当業者は以下の説明から容易に認識されよう。
概観
人間の耳介は、個別化された音響フィルタのように働き、これは、音方向に応じて入来音の周波数応答を整形する。人間の場合、この機能は、3D音像定位において重要である。したがって、すべての定位キューが正確にキャプチャされ得る、耳道の入口における音圧を収集することが重要である。しかし、たとえば、工業デザインの問題により、耳道の入口においてマイクロフォンを有することは、しばしば望ましくない。本明細書では、耳道への入口からリモートにあるロケーションにおいて検出された音圧に基づいて、耳道への入口における音圧を推論するオーディオシステムの様々な実施形態が説明される。オーディオシステムは、ヘッドセットの装着者についての頭部伝達関数(HRTF)の決定のために、検出された音圧を使用する。オーディオシステムは、決定されたHRTFを使用してオーディオコンテンツをユーザに提示する。
人間の耳介は、個別化された音響フィルタのように働き、これは、音方向に応じて入来音の周波数応答を整形する。人間の場合、この機能は、3D音像定位において重要である。したがって、すべての定位キューが正確にキャプチャされ得る、耳道の入口における音圧を収集することが重要である。しかし、たとえば、工業デザインの問題により、耳道の入口においてマイクロフォンを有することは、しばしば望ましくない。本明細書では、耳道への入口からリモートにあるロケーションにおいて検出された音圧に基づいて、耳道への入口における音圧を推論するオーディオシステムの様々な実施形態が説明される。オーディオシステムは、ヘッドセットの装着者についての頭部伝達関数(HRTF)の決定のために、検出された音圧を使用する。オーディオシステムは、決定されたHRTFを使用してオーディオコンテンツをユーザに提示する。
オーディオシステムは、ユーザについての1つまたは複数の頭部伝達関数(HRTF)を生成するために音(すなわち、音圧)を検出する。いくつかの実施形態では、オーディオシステムは、複数の音響センサーを含むマイクロフォンアセンブリとコントローラとを含む。各音響センサーは、マイクロフォンアセンブリの周囲のローカルエリア内の音を検出するように構成される。複数の音響センサーのうちの少なくともいくつかが、ユーザによって装着されるように構成されたヘッドセットに結合され、ユーザの各耳のための少なくとも1つの音響センサーが、対応する耳の耳道の入口からしきい値距離内にある検出領域内のヘッドセットのフレーム上に位置する。ローカルエリア内の1つまたは複数のオーディオソースが、ヘッドセット上の音響センサーによって検出されるオーディオ信号を発する。各検出領域について、検出領域において音響センサーによって検出されたオーディオ信号の第1の周波数帯域(たとえば、2kHz以下)が、第1の周波数帯域について検出領域において耳道の入口における音圧を推論するために使用される。第1の周波数帯域は、概して、比較的低い/中間オーディオ周波数(たとえば、2kHz以下)に対応する。検出領域において検出された、第1の周波数帯域におけるオーディオ信号は、ユーザの耳道への入口における第1の周波数帯域の音圧波に対してしきい類似度内にある(たとえば、実質的に同じである)。この関係は、たとえば、低い/中間周波数音圧波がより高い周波数における音圧波よりも小さい方向依存性を有するので、発生する。第1の周波数帯域の外のオーディオ信号(たとえば、2kHz超)の場合、方向依存性は増加し、音響センサーにおける検出されたオーディオ信号と耳道への入口における対応する圧力波との間の類似度がより小さくなる(すなわち、誤差が増加する)。コントローラは、たとえば、較正、より高い周波数のHRTFのためのテンプレートなどを使用して、第1の周波数帯域の外の周波数についての増加された誤差を考慮し得る。コントローラは、検出されたオーディオ信号を使用して1つまたは複数のHRTFを生成し得る。コントローラは、次いで、生成されたHRTFを使用してオーディオコンテンツをユーザに提示するように、スピーカーアセンブリに命令し得る。
本開示の実施形態は、人工現実システムを含むか、または人工現実システムとともに実装され得る。人工現実は、ユーザへの提示の前に何らかの様式で調整された形式の現実であり、これは、たとえば、仮想現実(VR)、拡張現実(AR)、複合現実(MR)、ハイブリッド現実、あるいはそれらの何らかの組合せおよび/または派生物を含み得る。人工現実コンテンツは、完全に生成されたコンテンツ、またはキャプチャされた(たとえば、現実世界の)コンテンツと組み合わせられた生成されたコンテンツを含み得る。人工現実コンテンツは、ビデオ、オーディオ、触覚フィードバック、またはそれらの何らかの組合せを含み得、それらのいずれも、単一のチャネルまたは複数のチャネルにおいて提示され得る(観察者に3次元効果をもたらすステレオビデオなど)。さらに、いくつかの実施形態では、人工現実は、たとえば、人工現実におけるコンテンツを作成するために使用される、および/または人工現実において別様に使用される(たとえば、人工現実におけるアクティビティを実施する)アプリケーション、製品、アクセサリ、サービス、またはそれらの何らかの組合せにも関連付けられ得る。人工現実コンテンツを提供する人工現実システムは、ホストコンピュータシステムに接続されたヘッドセット、独立型ヘッドセット、モバイルデバイスまたはコンピューティングシステム、あるいは、1人または複数の観察者に人工現実コンテンツを提供することが可能な任意の他のハードウェアプラットフォームを含む、様々なプラットフォーム上に実装され得る。
ヘッドセットデバイス構成
図1は、1つまたは複数の実施形態による、オーディオシステムを含むヘッドセット100を示す一例である。ヘッドセット100は、ユーザにメディアを提示する。一実施形態では、ヘッドセット100はニアアイディスプレイ(NED)であり得る。ヘッドセット100によって提示されるメディアの例は、1つまたは複数の画像、ビデオ、オーディオ、またはそれらの何らかの組合せを含む。ヘッドセット100は、他の構成要素の中でも、フレーム105と、1つまたは複数のレンズ110と、センサーデバイス115と、オーディオシステムとを含み得る。図1は、ヘッドセット100の構成要素をヘッドセット100上の例示的なロケーションに示すが、構成要素は、ヘッドセット100上の他の場所に、ヘッドセット100とペアにされた周辺デバイス上に、またはそれらの何らかの組合せで位置し得る。
図1は、1つまたは複数の実施形態による、オーディオシステムを含むヘッドセット100を示す一例である。ヘッドセット100は、ユーザにメディアを提示する。一実施形態では、ヘッドセット100はニアアイディスプレイ(NED)であり得る。ヘッドセット100によって提示されるメディアの例は、1つまたは複数の画像、ビデオ、オーディオ、またはそれらの何らかの組合せを含む。ヘッドセット100は、他の構成要素の中でも、フレーム105と、1つまたは複数のレンズ110と、センサーデバイス115と、オーディオシステムとを含み得る。図1は、ヘッドセット100の構成要素をヘッドセット100上の例示的なロケーションに示すが、構成要素は、ヘッドセット100上の他の場所に、ヘッドセット100とペアにされた周辺デバイス上に、またはそれらの何らかの組合せで位置し得る。
ヘッドセット100は、ユーザの視覚を補正または増強するか、ユーザの眼を保護するか、あるいはユーザに画像を提供し得る。ヘッドセット100は、ユーザの視力の欠損を補正する眼鏡であり得る。ヘッドセット100は、太陽からユーザの眼を保護するサングラスであり得る。ヘッドセット100は、衝撃からユーザの眼を保護する保護眼鏡であり得る。ヘッドセット100は、夜間にユーザの視覚を増強するための暗視デバイスまたは赤外線ゴーグルであり得る。ヘッドセット100は、ユーザのためのVR、AR、またはMRコンテンツを作り出すニアアイディスプレイであり得る。代替的に、ヘッドセット100は、レンズ110を含まないことがあり、ユーザにオーディオ(たとえば、音楽、ラジオ、ポッドキャスト)を提供するオーディオシステムをもつフレーム105であり得る。
フレーム105は、1つまたは複数のレンズ110を保持する前面部分と、ユーザに付けるためのエンドピースとを含む。フレーム105の前面部分は、ユーザの鼻の上をまたいでいる。エンドピース(たとえば、テンプル)は、ユーザ上の所定の位置にヘッドセット100を保持するフレーム105の部分である(たとえば、各エンドピースは、ユーザの対応する耳にわたって延びる)。エンドピースの長さは、異なるユーザにフィットするように調整可能であり得る。エンドピースはまた、ユーザの耳の後ろ側で湾曲する部分(たとえば、テンプルの先端、イヤピース)を含み得る。
1つまたは複数のレンズ110は、ヘッドセット100を装着しているユーザに対して光を提供するかまたは透過する。レンズ110は、ユーザの視力の欠損を補正するのを助けるための処方レンズ(たとえば、単焦点、二焦点、および三焦点、または累進多焦点(progressive))であり得る。処方レンズは、ヘッドセット100を装着しているユーザに対して周辺光を透過する。透過された周辺光は、ユーザの視力の欠損を補正するように処方レンズによって変えられ得る。1つまたは複数のレンズ110は、太陽からユーザの眼を保護するための偏光レンズまたは色付きレンズであり得る。1つまたは複数のレンズ110は、ユーザの眼に向かって導波路の端部または縁部を通って画像光が結合された導波路ディスプレイの一部としての1つまたは複数の導波路であり得る。1つまたは複数のレンズ110は、画像光を提供するための電子ディスプレイを含み得、電子ディスプレイからの画像光を拡大するための光学ブロックをも含み得る。1つまたは複数のレンズ110は、ヘッドセット100のフレーム105の前面部分によって保持される。
いくつかの実施形態では、ヘッドセット100は、ヘッドセット100の周囲のローカルエリアについての深度情報を表すデータをキャプチャする深度カメラアセンブリ(DCA)を含み得る。一実施形態では、DCAは、構造化光プロジェクタと、イメージングデバイスと、コントローラとを含み得る。キャプチャされたデータは、構造化光プロジェクタによってローカルエリア上に投影された構造化光の、イメージングデバイスによってキャプチャされた画像であり得る。一実施形態では、DCAは、ローカルエリアの部分をステレオでキャプチャするために配向される2つまたはそれ以上のカメラと、コントローラとを含み得る。キャプチャされたデータは、ローカルエリアの2つまたはそれ以上のカメラによってステレオでキャプチャされた画像であり得る。コントローラは、キャプチャされたデータを使用してローカルエリアの深度情報を算出する。深度情報に基づいて、コントローラは、ローカルエリア内のヘッドセット100の絶対位置情報を決定する。DCAは、ヘッドセット100と統合され得るか、またはヘッドセット100の外部のローカルエリア内に配置され得る。後者の実施形態では、DCAのコントローラは、オーディオシステムに深度情報を送信し得る。
センサーデバイス115は、ヘッドセット100の運動に応答して1つまたは複数の測定信号を生成する。センサーデバイス115は、ヘッドセット100のフレーム105の一部分に位置し得る。センサーデバイス115は、位置センサー、慣性測定ユニット(IMU)、またはその両方を含み得る。ヘッドセット100のいくつかの実施形態は、センサーデバイス115を含むことも含まないこともあり、または2つ以上のセンサーデバイス115を含み得る。センサーデバイス115がIMUを含む実施形態では、IMUは、センサーデバイス115からの測定信号に基づいてIMUデータを生成する。センサーデバイス115の例は、1つまたは複数の加速度計、1つまたは複数のジャイロスコープ、1つまたは複数の磁力計、運動を検出する別の好適なタイプのセンサー、IMUの誤差補正のために使用されるタイプのセンサー、またはそれらの何らかの組合せを含む。センサーデバイス115は、IMUの外部に、IMUの内部に、またはそれらの何らかの組合せで位置し得る。
1つまたは複数の測定信号に基づいて、センサーデバイス115は、ヘッドセット100の初期位置に対するヘッドセット100の現在位置を推定する。推定位置は、ヘッドセット100のロケーションおよび/あるいはヘッドセット100またはヘッドセット100を装着しているユーザの頭部の配向、あるいはそれらの何らかの組合せを含み得る。配向は、基準点に対する各耳の位置に対応し得る。いくつかの実施形態では、センサーデバイス115は、ヘッドセット100の現在位置を推定するために、DCAからの深度情報および/または絶対位置情報を使用する。センサーデバイス115は、並進運動(前/後、上/下、左/右)を測定するための複数の加速度計と、回転運動(たとえば、ピッチ、ヨー、ロール)を測定するための複数のジャイロスコープとを含み得る。いくつかの実施形態では、IMUは、測定信号を迅速にサンプリングし、サンプリングされたデータからヘッドセット100の推定位置を計算する。たとえば、IMUは、加速度計から受信された測定信号を経時的に積分して速度ベクトルを推定し、その速度ベクトルを経時的に積分して、ヘッドセット100上の基準点の推定位置を決定する。代替的に、IMUは、サンプリングされた測定信号をコンソールに提供し、コンソールはIMUデータを決定する。基準点は、ヘッドセット100の位置を表すために使用され得る点である。基準点は、概して空間中の点として定義され得るが、実際には、基準点は、ヘッドセット100内の点として定義される。
オーディオシステムは、ユーザについての1つまたは複数のHRTFを生成するために音を検出する。HRTFは、音が空間中の点からユーザによってどのように受信されるかを特徴づける。1つまたは複数のHRTFは、ヘッドセット100を装着しているユーザに関連し得る。ヘッドセット100のオーディオシステムは、マイクロフォンアセンブリと、スピーカーアセンブリと、コントローラ135とを含む。オーディオシステムに関する追加の詳細が、図3に関して説明される。
マイクロフォンアセンブリは、マイクロフォンアセンブリの周囲のローカルエリア内の音を検出する。マイクロフォンアセンブリは、複数の音響センサー120を含む。音響センサー120は、音波による空気圧力変動を検出するセンサーである。各音響センサー120は、音を検出し、検出された音を電子フォーマット(アナログまたはデジタル)に変換するように構成される。音響センサー120は、音響波センサー、マイクロフォン、音トランスデューサ、または音を検出するのに好適である同様のセンサーであり得る。マイクロフォンアセンブリは、フレーム105上のそれぞれの検出領域125内に各々配置された少なくとも2つの音響センサー120を含む。各検出領域125は、ユーザの耳道の対応する入口からしきい値距離内にある。示されているように、検出領域125はフレーム105上にあるが、他の実施形態では、検出領域125はフレーム105上にないエリアを含む。2つの音響センサー120のみが示されているが、他の実施形態では、マイクロフォンアレイは追加の音響センサーを含む。追加の音響センサーは、オーディオ信号についてのより良い到来方向(DoA)推定を提供するために使用され得る。さらに、マイクロフォンアセンブリの各追加の音響センサーの位置は変動し得る。追加の音響センサーは、一方または両方の検出領域125内に、フレーム105上の他の場所に、またはそれらの何らかの組合せで位置し得る。たとえば、追加の音響センサーは、テンプルの長さに沿って、ブリッジにわたって、レンズ110の上方または下方に、あるいはそれらの何らかの組合せで配置され得る。マイクロフォンアレイの音響センサーは、マイクロフォンアセンブリが、ヘッドセット100を装着しているユーザの周囲の広範囲の方向における音を検出することが可能であるように、配向され得る。
マイクロフォンアセンブリは、マイクロフォンアセンブリの周囲のローカルエリア内の音を検出する。ローカルエリアは、ヘッドセット100を囲む環境である。たとえば、ローカルエリアは、ヘッドセット100を装着しているユーザが中にいる部屋であり得、またはヘッドセット100を装着しているユーザは外にいることがあり、ローカルエリアは、マイクロフォンアセンブリが音を検出することが可能である、外のエリアである。検出された音は、制御されない音または制御される音であり得る。制御されない音は、オーディオシステムによって制御されず、ローカルエリア中で生じる音である。制御されない音の例は、自然発生的周辺雑音であり得る。この構成では、オーディオシステムは、オーディオシステムによって検出された制御されない音を使用してヘッドセット100を較正することが可能であり得る。制御される音は、オーディオシステムによって制御される音である。制御される音の例は、スピーカー、スピーカーアセンブリ、較正システム、またはそれらの何らかの組合せなど、外部システムによって出力された1つまたは複数の信号であり得る。ヘッドセット100は、制御されない音を使用して較正され得るが、いくつかの実施形態では、外部システムは、較正プロセス中にヘッドセット100を較正するために使用され得る。各検出された音(制御されないおよび制御される)は、周波数、振幅、持続時間、またはそれらの何らかの組合せに関連し得る。
検出されたオーディオ信号は、概して、第1の周波数帯域および1つまたは複数の高周波数帯域に分割され得る。第1の周波数帯域は、概して、比較的低い音響周波数および可能な中域音響周波数に対応する。たとえば、第1の周波数帯域は0~2kHzであり得、2kHzを超える周波数をカバーする1つまたは複数の高周波数帯域。各検出領域125について、検出領域125において音響センサー120によって検出されたオーディオ信号の第1の周波数帯域は、第1の周波数帯域について耳道への対応する入口における音圧を推論するために使用される。検出領域において検出された、第1の周波数帯域におけるオーディオ信号は、ユーザの耳道への入口における第1の周波数帯域の音圧波に対してしきい類似度内にある。しきい類似度は、それらが、第1の周波数帯域にわたって実質的に同等の圧力波形(たとえば、1dBよりも小さい差、および/または、知覚が考慮される場合、丁度可知差(JND)しきい値内)であるようなものであり得る。この関係は、たとえば、低い/中間周波数音圧波がより高い周波数における音圧波よりも小さい方向依存性を有するので、発生する。
コントローラ135は、マイクロフォンアセンブリによって検出された音を表す、マイクロフォンアセンブリからの情報を処理する。各検出された音に関連する情報は、検出された音の周波数、振幅、および/または持続時間を含み得る。各検出された音について、コントローラ135はDoA推定を実施する。DoA推定は、検出された音がマイクロフォンアセンブリの音響センサー120および/または音響センサー125に到来した推定方向である。音がマイクロフォンアセンブリの少なくとも2つの音響センサーによって検出された場合、コントローラ135は、たとえば、三角測量を介して、検出された音のソースロケーションを推定するために、音響センサーの知られている位置関係と、各音響センサーからのDoA推定とを使用することができる。ソースロケーション推定の精度は、音を検出した音響センサーの数が増加するにつれて、および/または、音を検出した音響センサー間の距離が増加するにつれて、増加し得る。
いくつかの実施形態では、コントローラ135は、オーディオデータセットを情報でポピュレートする。情報は、検出された音と、各検出された音に関連するパラメータとを含み得る。例示的なパラメータは、周波数、振幅、持続時間、DoA推定、ソースロケーション、またはそれらの何らかの組合せを含み得る。各オーディオデータセットは、ヘッドセットに対する異なるソースロケーションに対応し、そのソースロケーションを有する1つまたは複数の音を含み得る。このオーディオデータセットは、そのソースロケーションについての1つまたは複数のHRTFに関連し得る。1つまたは複数のHRTFは、データセットに記憶され得る。代替実施形態では、各オーディオデータセットは、ヘッドセット100に対するいくつかのソースロケーションに対応し、各ソースロケーションについての1つまたは複数の音を含み得る。たとえば、比較的互いの近くに位置するソースロケーションは、一緒にグループ化され得る。コントローラ135は、音がマイクロフォンアセンブリによって検出されたとき、オーディオデータセットを情報でポピュレートし得る。コントローラ135は、さらに、各検出された音についてDoA推定が実施されたかまたはソースロケーションが決定されたとき、各検出された音についてのオーディオデータセットをポピュレートし得る。
いくつかの実施形態では、コントローラ135は、コントローラ135がDoA推定を実施する検出された音を選択する。コントローラ135は、オーディオデータセットに記憶された各検出された音に関連するパラメータに基づいて、検出された音を選択し得る。コントローラ135は、各検出された音に関連する記憶されたパラメータを評価し、1つまたは複数の記憶されたパラメータが対応するパラメータ条件を満たすかどうかを決定し得る。たとえば、パラメータがしきい値を上回るまたは下回る、あるいはターゲット範囲内に入る場合、パラメータ条件は満たされ得る。パラメータ条件が満たされた場合、コントローラ135は、検出された音についてDoA推定を実施する。たとえば、コントローラ135は、周波数範囲内の周波数、しきい値振幅を上回る振幅、しきい値持続時間を下回る持続時間、他の同様の変形態、またはそれらの何らかの組合せを有する検出された音について、DoA推定を実施し得る。パラメータ条件は、履歴データに基づいて、オーディオデータセット中の情報の分析(たとえば、パラメータの収集された情報を評価し、平均を設定すること)に基づいて、またはそれらの何らかの組合せで、オーディオシステムのユーザによって設定され得る。コントローラ135は、検出された音のDoA推定および/またはソースロケーションを記憶するための、オーディオセット中の要素を作成し得る。いくつかの実施形態では、コントローラ135は、データがすでに存在する場合、オーディオセット中の要素を更新し得る。
いくつかの実施形態では、コントローラ135は、ヘッドセット100の外部のシステムからヘッドセット100の位置情報を受信し得る。位置情報は、ヘッドセット100のロケーションと、ヘッドセット100またはヘッドセット100を装着しているユーザの頭部の配向とを含む。位置情報は、基準点に対して定義され得る。位置情報は、ローカルエリア中の音ソースの相対ロケーションを決定することを含む、ユーザについてのHRTFを生成すること、および/またはカスタマイズすることにおいて、使用され得る。外部システムの例は、イメージングアセンブリ、(たとえば、図6で説明されるような)コンソール、同時位置特定およびマッピング(SLAM:simultaneous localization and mapping)システム、深度カメラアセンブリ、構造化光システム、または他の好適なシステムを含む。いくつかの実施形態では、ヘッドセット100は、SLAM計算のために使用され得るセンサーを含み得、SLAM計算は、コントローラ135によって全体的にまたは部分的に行われ得る。コントローラ135は、連続的に、またはランダムに、または指定された間隔で、システムから位置情報を受信し得る。他の実施形態では、コントローラ135は、ヘッドセット100に結合されたシステムを使用してヘッドセット100の位置情報を受信する。たとえば、ヘッドセット100に結合された深度カメラアセンブリが、コントローラ135に位置情報を提供するために使用され得る。
検出された音のパラメータに基づいて、コントローラ135は、オーディオシステムに関連する1つまたは複数のHRTFを生成する。HRTFは、耳が空間中の点からどのように音を受信するかを特徴づける。人に対する特定のソースロケーションについてのHRTFは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造(たとえば、耳の形状、肩など)により、人の各耳に固有である(および人に固有である)。たとえば、図1では、コントローラ135は、各耳について少なくとも1つのHRTFを生成する。HRTFは、第1の周波数帯域におけるオーディオ信号の部分を使用して生成されるHRTFを含み、これらのHRTFは第1の周波数帯域における周波数に対応する。より高い周波数のHRTFは、方向性情報を提供する(音響センサー120を含み得る)複数の音響センサーを使用して、ユーザの耳道に置かれた音響センサーを使用して、図1に示されているような音響センサー120のロケーション以外の他のロケーションにおいてフレーム上に置かれた音響センサーを使用して、テンプレートのより高い周波数のHRTFを使用して、またはそれらの何らかの組合せで、生成され得る。このようにして、コントローラ135は、ユーザについてのHRTFのカスタマイズされたセットを生成し、および/または更新する。コントローラ135は、オーディオコンテンツをユーザに提示するために、HRTFのカスタマイズされたセットを使用する。たとえば、カスタマイズされたHRTFは、空間中の特定の点から来たように思われる音を含むオーディオコンテンツを作成するために使用され得る。いくつかの実施形態では、コントローラ135は、各検出された音のDoA推定に基づいて1つまたは複数の既存のHRTFを更新し得る。ヘッドセット100の位置がローカルエリア内で変化するにつれて、コントローラ135は、1つまたは複数の新しいHRTFを生成するか、または、それに応じて1つまたは複数の既存のHRTFを更新し得る。
図2は、1つまたは複数の実施形態による、音響センサーを含むヘッドセットの一部分を示す一例である。ヘッドセット200は、ヘッドセット100の一実施形態であり得る。ヘッドセット200は、音響センサー120の一実施形態であり得る音響センサー210を含む。いくつかの実施形態によれば、音響センサー210は、検出領域230においてヘッドセット200のフレーム220の一部分上に各々配置されたマイクロフォンであり、検出領域230は検出領域125の一実施形態である。1つの耳240のみが図2に示されているが、いくつかの実施形態によれば、ユーザのもう1つの耳240に対応するヘッドセット200の一部分も、図2に示されている同じ構成を含む。ヘッドセット200は、図2に示されているものとは異なる、音響センサーの構成を有し得る。たとえば、いくつかの実施形態では、検出領域230中に位置する、より多くの音響センサー210がある。図2に示されているように、ヘッドセット200のフレーム220の一部分は、ヘッドセット200をユーザに固定するために各耳240の耳介の後ろに配置される。
音響センサー210は、ユーザの耳道の入口250の外部の検出領域230において配置される。検出領域において音響センサー210によって検出されたオーディオ信号の第1の周波数帯域(たとえば、2kHz以下)が、耳道の入口250における音圧波を推論するために使用される。検出領域230において検出された、第1の周波数帯域におけるオーディオ信号は、耳道への入口250における第1の周波数帯域の音圧波に対してしきい類似度内にある(たとえば、実質的に同じである)。この関係は、たとえば、低い/中間周波数音圧波がより高い周波数における音圧波よりも小さい方向依存性を有するので、発生する。第1の周波数帯域の外のオーディオ信号(たとえば、2kHz超)の場合、方向依存性は増加し、音響センサーにおける検出されたオーディオ信号と耳道への入口における対応する圧力波との間の類似度がより小さくなる(すなわち、誤差が増加する)。簡単のために、検出領域230はフレーム220上に示されているが、検出領域230は、しきい値距離内にある(たとえば、耳道の入口250により近い)、フレーム220上にないエリアに延び得る。いくつかの実施形態では、検出領域230は、耳240の耳輪の前面部分からしきい値距離内に位置する。
上述のように、しきい値距離(たとえば、3インチ以下)は、検出領域内で測定された低周波数オーディオ信号が、耳道の入口250における低周波数音圧波のしきい類似度内にある距離であり得る。このしきい類似度により、ユーザの耳道にマイクロフォンを置くことなしに、耳道の入口250における低周波数圧力波の推論が可能になる。しきい類似度は、それらが、第1の周波数帯域にわたって実質的に同等の圧力波形(たとえば、1dBよりも小さい差、および/または、JNDしきい値内)であるようなものであり得る。
第1の周波数帯域におけるオーディオ信号の部分は、耳道の入口250における音圧を正確におよびリモートで推論するために使用され得る。ユーザの耳道の入口250における推論された音圧波は、第1の周波数帯域における周波数について、ユーザの各耳についての固有のHRTFを生成し、および/またはカスタマイズするために使用される。
マイクロフォンアセンブリの音響センサー210の構成は変動し得る。ヘッドセット200は、ユーザの各耳240について1つの音響センサー210を有するものとして図2に示されているが、音響センサー210の数は増加され得る。音響センサー210の数を増加させることは、収集されるオーディオ情報の量ならびにオーディオ情報の感度および/または精度を増加させ得る。たとえば、検出領域250中の音響センサー210の数を増加させることは、耳道の入口250における第1の周波数帯域内の音圧波の推論に基づいてユーザについてのHRTFを生成し、および/またはカスタマイズすることを伴う較正を改善し得る。検出領域250の外のフレーム220上に位置する追加の音響センサー210は、いくつかの実施形態によれば、ユーザについてのより高い周波数のHRTFを生成し、および/またはカスタマイズするために使用される。さらなる実施形態では、追加の音響センサー210は、より高い周波数のHRTFを生成し、および/またはカスタマイズするためのDoA推定を実施するために使用される音響センサーアレイの一部である。
他の実施形態では、音響センサー210によって検出されたオーディオ信号の部分はまた、第1の周波数帯域を上回る周波数についての情報を収集するために使用され得る。たとえば、第1の周波数帯域を上回る周波数は、2kHzを上回ることがある。上述のように、第1の周波数帯域よりも高い周波数の場合、方向依存性は増加し、音響センサー210における検出されたオーディオ信号と耳道への入口250における対応する圧力波との間の類似度がより小さくなる(すなわち、誤差が増加する)。いくつかの実施形態では、誤差の増加は、追加の音響センサーからのデータを使用することによってオフセットされ得る。追加の音響センサーは、フレーム220上のどこにでも置かれ得、いくつかの実施形態では、同じく検出領域230内にあり得る。より多数の音響センサーはDOA分析における精度の増加を可能にし、これは、より高い周波数に関連する方向依存性をオフセットするのを助けることができる。
オーディオシステムの概観
図3は、1つまたは複数の実施形態による、オーディオシステム300のブロック図である。図1および図3におけるオーディオシステムは、オーディオシステム300の実施形態であり得る。オーディオシステム300は、ユーザについての1つまたは複数のHRTFを生成するために音を検出する。オーディオシステム300は、次いで、ユーザのためのオーディオコンテンツを生成するために1つまたは複数のHRTFを使用し得る。図3の実施形態では、オーディオシステム300は、マイクロフォンアセンブリ310と、コントローラ320と、スピーカーアセンブリ330とを含む。オーディオシステム300のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラ320の一部または全部は、ヘッドセットからリモートにあるサーバまたはコンソール上に位置し得る。
図3は、1つまたは複数の実施形態による、オーディオシステム300のブロック図である。図1および図3におけるオーディオシステムは、オーディオシステム300の実施形態であり得る。オーディオシステム300は、ユーザについての1つまたは複数のHRTFを生成するために音を検出する。オーディオシステム300は、次いで、ユーザのためのオーディオコンテンツを生成するために1つまたは複数のHRTFを使用し得る。図3の実施形態では、オーディオシステム300は、マイクロフォンアセンブリ310と、コントローラ320と、スピーカーアセンブリ330とを含む。オーディオシステム300のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラ320の一部または全部は、ヘッドセットからリモートにあるサーバまたはコンソール上に位置し得る。
マイクロフォンアセンブリ310は、マイクロフォンアセンブリ310の周囲のローカルエリア内の音を検出する。マイクロフォンアセンブリ310は、各々音波の空気圧力変動を検出し、検出された音を電子フォーマット(アナログまたはデジタル)に変換する、複数の音響センサーを含み得る。複数の音響センサーは、ユーザの各耳に関連する各検出領域中の少なくとも1つの音響センサーを含む。複数の音響センサーは、音響センサー120の実施形態を含み得る。複数の音響センサーは、ヘッドセット、たとえばヘッドセット100上に、ユーザ上に、またはそれらの何らかの組合せで配置され得る。上記で説明されたように、検出された音は、制御されない音または制御される音であり得る。各検出された音は、周波数、振幅、持続時間、またはそれらの何らかの組合せなど、オーディオ情報に関連し得る。
スピーカーアセンブリ330は、コントローラ320からの命令に従ってオーディオコンテンツをプレイする。スピーカーアセンブリ330は、図1に示されているスピーカー130の実施形態を含み得る。スピーカーは、たとえば、可動コイルトランスデューサ、圧電トランスデューサ、電気信号を使用して音響圧力波を生成する何らかの他のデバイス、またはそれらの何らかの組合せであり得る。いくつかの実施形態では、スピーカーアセンブリ330は、各耳を覆うスピーカー(たとえば、ヘッドフォン、イヤバッドなど)をも含む。他の実施形態では、スピーカーアセンブリ330は、ユーザの耳を閉塞するスピーカーを含まない。いくつかの実施形態では、スピーカーアセンブリ330は、空気伝導、たとえば骨伝導、軟骨伝導または耳珠伝導以外の伝導方法を使用してユーザにオーディオコンテンツを送信するスピーカーを含む。空気伝導以外の伝導方法を使用するオーディオソースに関する追加の詳細は、そのすべての全体が参照により本明細書に組み込まれる、米国特許出願第15/680,836号、15/702,680号、および15/967,924号において見つけられ得る。
コントローラ320は、オーディオシステム300の構成要素を制御する。コントローラ320は、ユーザに対してカスタマイズされるHRTFのセットを決定するためにマイクロフォンアセンブリ310からの情報を処理する。コントローラ320は、HRTFのセットを使用してオーディオコンテンツを提示するように、スピーカーアセンブリ330に命令し得る。コントローラ320は、コントローラ135の一実施形態であり得る。図3の実施形態では、コントローラ320は、HRTFカスタマイゼーションモジュール340と、較正モジュール345と、データストア350と、オーディオコンテンツエンジン360とを含む。ただし、他の実施形態では、コントローラ320は、異なるおよび/または追加の構成要素を含み得る。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラ320の機能性の一部または全部が、(たとえば、図6に示されているような)コンソールによって実施され得る。
データストア350は、コントローラ320によって生成および/または使用されるデータを記憶する。データは、いくつかの実施形態によれば、マイクロフォンアセンブリ310による検出されたオーディオ信号、スピーカーアセンブリ330によってプレイされるべきオーディオコンテンツ、HRTFカスタマイゼーションモジュール340によって生成および/またはカスタマイズされるHRTF、オーディオシステム300に関連のある他のデータ、あるいはそれらの何らかの組合せを含み得る。データストア350は、データ記憶デバイスを含み得る。いくつかの実施形態では、データ記憶デバイスは、ヘッドセットのフレームに結合され得る。他の実施形態では、データ記憶デバイスは、ヘッドセットの外部にある。いくつかの実施形態では、データストア350は、ネットワーク通信を介してコントローラ320によってアクセスされるリモートデータベースの一部である。
HRTFカスタマイゼーションモジュール340は、いくつかの実施形態によれば、第1の周波数帯域よりも高い周波数(たとえば、2kHz超)における検出された音についてDoA推定を実施する。DoA推定は、検出された音がマイクロフォンアセンブリ310の音響センサーに到来した推定方向である。音がマイクロフォンアセンブリの少なくとも2つの音響センサーによって検出された場合、コントローラ320は、たとえば、三角測量を介して、検出された音のソースロケーションを推定するために、音響センサーの位置関係と、各音響センサーからのDoA推定とを使用することができる。各検出された音のDoA推定は、検出された音の推定ソースロケーションとローカルエリア内のマイクロフォンアセンブリ310の位置との間のベクトルとして表現され得る。推定ソースロケーションは、マイクロフォンアセンブリ310の位置に対するローカルエリア中のソースロケーションの相対位置であり得る。DoA推定の追加の詳細は、たとえば、その全体が参照により本明細書に組み込まれる、米国特許出願第16/015,879号において見つけられ得る。
マイクロフォンアセンブリ310の位置は、マイクロフォンアセンブリ310を有するヘッドセット上の1つまたは複数のセンサーによって決定され得る。いくつかの実施形態では、コントローラ320は、マイクロフォンアセンブリ310の絶対位置がローカルエリア中で知られている場合、ソースロケーションの絶対位置を決定し得る。マイクロフォンアセンブリ310の位置は、外部システム(たとえば、イメージングアセンブリ、ARまたはVRコンソール、SLAMシステム、深度カメラアセンブリ、構造化光システムなど)から受信され得る。外部システムは、ローカルエリアとマイクロフォンアセンブリ310の位置とがマッピングされる、ローカルエリアの仮想モデルを作成し得る。受信された位置情報は、マッピングされたローカルエリア中のマイクロフォンアセンブリのロケーションおよび/または配向を含み得る。コントローラ135は、検出された音の決定されたソースロケーションを用いてローカルエリアのマッピングを更新し得る。コントローラ320は、連続的に、またはランダムに、または指定された間隔で、外部システムから位置情報を受信し得る。いくつかの実施形態では、コントローラ320は、コントローラ320がDoA推定を実施する検出された音を選択する。
HRTFカスタマイゼーションモジュール340は、1つまたは複数のHRTFを生成し、および/またはカスタマイズする。HRTFは、人の耳が空間中の点からどのように音を受信するかを特徴づける。人に対する特定のソースロケーションについてのHRTFは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造(たとえば、耳の形状、肩など)により、人の各耳に固有である(および人に固有である)。HRTFカスタマイゼーションモジュール340は、検出領域において音響センサーによって検出されたオーディオ信号の部分を使用して、第1の周波数帯域における周波数に関連するHRTFを生成し、および/または更新し得る。HRTFカスタマイゼーションモジュール340は、マイクロフォンアセンブリによってキャプチャされるオーディオ信号、第1の周波数帯域よりも高い周波数についてのHRTFに関連するテンプレート、またはそれらの何らかの組合せを使用して、第1の周波数帯域よりも高い周波数に関連するHRTFを生成し、および/または更新し得る。いくつかの実施形態では、HRTFカスタマイゼーションモジュール340は、図2に示されているような音響センサー210の位置以外の位置に位置するマイクロフォンアセンブリ310のマイクロフォンによってキャプチャされるオーディオ信号を使用して、第1の周波数帯域よりも高い周波数に関連するHRTFを生成し、および/または更新する。いくつかの実施形態では、HRTFカスタマイゼーションモジュール340は、ユーザについての個人化されたHRTFを生成し、および/またはカスタマイズするために、機械学習技法を使用する。たとえば、機械学習モデルは、マイクロフォンアセンブリ310によって検出されたオーディオ信号に基づいて音ソースの方向を決定するようにトレーニングされ得る。他の実施形態では、機械学習モデルは、マイクロフォンアセンブリ310によって検出されたオーディオ信号に基づいて、第1の周波数帯域よりも高い周波数において音を生成する音ソースの方向を決定するようにトレーニングされる。いくつかの実施形態では、機械学習モデルは、マイクロフォンアセンブリ310によってキャプチャされたオーディオ信号と、ユーザの耳道に置かれたマイクロフォンを用いてオーディオ信号を測定することによって生成されたトレーニングHRTFとに関して、トレーニングされる。
機械学習モデルは、任意の数の機械学習アルゴリズムを含むことができる。採用され得るいくつかの他の機械学習モデルは、線形および/またはロジスティック回帰、分類および回帰ツリー、k-meansクラスタリング、ベクトル量子化などである。いくつかの実施形態では、機械学習モデルは、強化学習を用いてトレーニングされた決定論的方法を含む(それにより強化学習モデルを作成する)。
HRTFカスタマイゼーションモジュール340は、単一の人について複数のHRTFを生成し得、各HRTFは、異なるソースロケーション、マイクロフォンアセンブリ310を装着している人の異なる位置、またはそれらの何らかの組合せに関連し得る。一例として、HRTFカスタマイゼーションモジュール340は、単一のソースロケーションに対する、ローカルエリア中のユーザの頭部の特定のロケーションおよび配向において、ユーザについての2つのHRTFを生成し得る。ユーザが異なる方向にユーザの頭部の向きを変える場合、HRTFカスタマイゼーションモジュール340は、特定のロケーションおよび新しい配向においてユーザについての2つの新しいHRTFを生成し得るか、または、HRTFカスタマイゼーションモジュール340は、2つの既存のHRTFを更新し得る。したがって、HRTFカスタマイゼーションモジュール340は、異なるソースロケーション、ローカルエリア中のマイクロフォンアセンブリ310の異なる位置、またはそれらの何らかの組合せについて、HRTFを生成する。
較正モジュール345は、カスタマイズされたHRTFの生成(および/または更新)のためにオーディオシステム300を較正する。較正ステップは、マイクロフォンアセンブリ330に対する異なる配向において発生する制御される音を所定のタイミングで生成するように、スピーカーアセンブリ330および/または外部スピーカーに命令することを含み得る。較正モジュール345は、スピーカーアセンブリ330および/または外部スピーカーによって発せられたオーディオ信号、ローカルエリア中のオーディオソースによって発せられた制御されないオーディオ信号、またはそれらの何らかの組合せを検出するように、マイクロフォンアセンブリ310に命令し得る。オーディオ信号は、特定の周波数のものであり、マイクロフォンアセンブリ320に対する異なる相対位置においてオーディオソースによって発せられ得る。いくつかの実施形態では、較正プロセス中にマイクロフォンアセンブリ310によって検出されたオーディオ信号に基づいて、1つまたは複数のテンプレートHRTFがカスタマイズされる。
いくつかの実施形態では、較正システム345は、スピーカーアセンブリ330によって発せられたオーディオ信号と、マイクロフォンアセンブリ310によって検出された、測定されたオーディオ信号との間のコヒーレンス度が、しきいコヒーレンス度を上回ることに応答して、オーディオシステム300を較正する。第1の周波数帯域内の周波数を有する発せられたオーディオ信号の場合、較正システム345は、発せられたオーディオ信号と対応する測定されたオーディオ信号との間のコヒーレンス度がしきいコヒーレンス度を上回ることに応答して、第1の周波数帯域についてオーディオシステム300を較正する。より高い周波数を有する発せられたオーディオ信号の場合、較正システム345は、発せられたオーディオ信号と測定されたオーディオ信号との間のコヒーレンス度がしきいコヒーレンス度を上回ることに応答して、オーディオシステム300を較正する。この場合、較正システム345は、スピーカーアセンブリ330とマイクロフォンアセンブリ310との間の伝達関数のみを較正する。
オーディオコンテンツエンジン360は、カスタマイズされたHRTFを使用してオーディオ特徴づけ構成を生成する。オーディオ特徴づけ構成は、空間中の特定の点から来たように思われるバイノーラル音を合成するためにオーディオシステム300が使用する関数である。オーディオコンテンツエンジン360は、たとえば、補間関数(interpolating function)をHRTF(たとえば、球面調和関数のセット)に適合させ得、それにより、空間中の所与の方向がHRTFにマッピングする。代替的に、オーディオコンテンツエンジン360は、空間中の異なる方向を最も近いHRTFにマッピングするルックアップテーブルを生成し得る。オーディオ特徴づけ構成は、オーディオコンテンツ(たとえば、サラウンド音)を提示するためにスピーカーアセンブリ330によって使用され得る。いくつかの実施形態では、オーディオコンテンツエンジン360は、オーディオ特徴づけ構成に従ってオーディオコンテンツを提示するように、スピーカーアセンブリ330に命令する。
例示的なデータ
図4は、1つまたは複数の実施形態による、方向および周波数に応じた、耳道の入口における音圧と検出領域における音圧との類似度比を示すグラフ400である。グラフは、曲線410、曲線420、曲線430、および曲線440を含む。曲線410は、ユーザの前面に対応する、球面座標系を使用する0°の方位角および0°の仰角に対応する位置におけるオーディオソースの記録に対応する。曲線420は、45°の方位角および0°の仰角に対応する位置におけるオーディオソースに対応する。曲線430は、90°の方位角および45°の仰角に対応する位置におけるオーディオソースにおけるオーディオソースに対応する。曲線440は、180°の方位角および0°の仰角に対応する位置におけるオーディオソースに対応する。水平軸は周波数(Hz)の単位であり、垂直軸はデシベル(dB)の単位である。したがって、耳道の開口における音圧が検出領域における音圧と実質的に同じである場合、2つの値の比は約1であり、これは、0dBの値を生じる(1の対数は0である)。
図4は、1つまたは複数の実施形態による、方向および周波数に応じた、耳道の入口における音圧と検出領域における音圧との類似度比を示すグラフ400である。グラフは、曲線410、曲線420、曲線430、および曲線440を含む。曲線410は、ユーザの前面に対応する、球面座標系を使用する0°の方位角および0°の仰角に対応する位置におけるオーディオソースの記録に対応する。曲線420は、45°の方位角および0°の仰角に対応する位置におけるオーディオソースに対応する。曲線430は、90°の方位角および45°の仰角に対応する位置におけるオーディオソースにおけるオーディオソースに対応する。曲線440は、180°の方位角および0°の仰角に対応する位置におけるオーディオソースに対応する。水平軸は周波数(Hz)の単位であり、垂直軸はデシベル(dB)の単位である。したがって、耳道の開口における音圧が検出領域における音圧と実質的に同じである場合、2つの値の比は約1であり、これは、0dBの値を生じる(1の対数は0である)。
図4に示されているように、第1の周波数帯域(たとえば、0~2kHz)における周波数について音響センサーによって検出されたオーディオ信号は、オーディオソースの異なる位置についての耳道中の検出されたオーディオ信号に対してしきい類似度内にある。したがって、検出領域において音響センサーによって検出された第1の周波数帯域におけるオーディオ信号の部分は、ユーザの耳道の入口における音圧波を推論するために使用され得る。第1の周波数帯域におけるオーディオ信号の波長は大きいので、検出領域において測定された、第1の周波数帯域におけるオーディオ信号の部分は、耳輪の小さい特徴および/または耳の解剖学的構造の他の部分によって著しく影響を及ぼされない。したがって、検出領域において測定された、第1の周波数帯域におけるオーディオ信号の部分は、ユーザの耳道中の音圧波に対してしきい類似度内にある。
図4に示されているように、曲線410、420、430、および440は、約2kHzを上回る周波数について、互いから実質的に離れ始める(各曲線が異なる方向に関連することを想起する)。離れる曲線は、方向依存性が周波数とともに増加することによるものである。
頭部伝達関数(HRTF)個人化
図5は、1つまたは複数の実施形態による、ヘッドセットを使用するユーザについての頭部伝達関数(HRTF)のセットをカスタマイズするためのプロセスを示すフローチャートである。一実施形態では、図5のプロセスは、オーディオシステム300の構成要素によって実施される。他の実施形態では、他のエンティティ(たとえば、コンソール)がプロセスのステップの一部または全部を実施し得る。同様に、実施形態は、異なるおよび/または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。
図5は、1つまたは複数の実施形態による、ヘッドセットを使用するユーザについての頭部伝達関数(HRTF)のセットをカスタマイズするためのプロセスを示すフローチャートである。一実施形態では、図5のプロセスは、オーディオシステム300の構成要素によって実施される。他の実施形態では、他のエンティティ(たとえば、コンソール)がプロセスのステップの一部または全部を実施し得る。同様に、実施形態は、異なるおよび/または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。
オーディオシステム300は、オーディオソースから発せられたオーディオ信号を検出する510。オーディオシステム300は、ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを使用して、オーディオ信号を検出する。検出領域は、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にある。検出された信号の一部または全部は、第1の周波数帯域(たとえば、0~2kHz)内にある。検出領域において検出された、第1の周波数帯域内のオーディオ信号の部分は、同じ周波数帯域にわたって耳道における音圧波のしきい類似度内にある。
オーディオシステム300は、検出されたオーディオ信号に部分的に基づいてHRTFのセットを決定する520。HRTFのセットは、コントローラを使用して決定され得る。HRTFのうちの少なくともいくつかは、第1の周波数帯域についての耳道への入口における推論された音圧を使用して決定される。第1の周波数帯域よりも高い周波数に関連するHRTFの場合、オーディオシステム300は、たとえば、テンプレートHRTF、マイクロフォンアレイの追加の音響センサーによってキャプチャされたオーディオ信号、音場分解、機械学習などを使用し得る。いくつかの実施形態では、オーディオシステム300は、第1の周波数帯域よりも高い周波数に関連するHRTFを決定することにおいて、DoA推定を使用する。
オーディオシステム300は、HRTFのセットを使用してオーディオコンテンツを提示する530。図3に関して上記で説明されたように、オーディオシステム300は、決定されたHRTFを使用してオーディオ特徴づけ構成を生成する。オーディオシステム300は、オーディオ特徴づけ構成とスピーカーアセンブリ330とを使用してオーディオコンテンツをユーザに提示する。
ローカルエリア内のヘッドセットを装着しているユーザの位置の場合、オーディオシステムは、1つまたは複数の新しいHRTFを生成するか、または、それに応じて1つまたは複数の既存の音響伝達関数を更新し得る。プロセス500は、ヘッドセットを装着しているユーザがローカルエリア中を移動するとき連続的に繰り返され得るか、または、プロセス500は、マイクロフォンアセンブリを介して音を検出すると始動され得る。
例示的なシステム環境
図6は、1つまたは複数の実施形態による、オーディオシステムを含むヘッドセットのシステム環境である。システム600は、人工現実環境において動作し得る。図6に示されているシステム600は、ヘッドセット605と、コンソール615に結合された入出力(I/O)インターフェース610とを含む。ヘッドセット605は、ヘッドセット100の一実施形態であり得る。図6は、1つのヘッドセット605と1つのI/Oインターフェース610とを含む例示的なシステム600を示すが、他の実施形態では、任意の数のこれらの構成要素が、システム600中に含まれ得る。たとえば、各々が、関連するI/Oインターフェース610を有する、複数のヘッドセット605があり得、各ヘッドセット605およびI/Oインターフェース610はコンソール615と通信する。代替構成では、異なるおよび/または追加の構成要素が、システム600中に含まれ得る。さらに、図6に示されている構成要素のうちの1つまたは複数に関して説明される機能性は、いくつかの実施形態では、図6に関して説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コンソール615の機能性の一部または全部がヘッドセット605によって提供される。
図6は、1つまたは複数の実施形態による、オーディオシステムを含むヘッドセットのシステム環境である。システム600は、人工現実環境において動作し得る。図6に示されているシステム600は、ヘッドセット605と、コンソール615に結合された入出力(I/O)インターフェース610とを含む。ヘッドセット605は、ヘッドセット100の一実施形態であり得る。図6は、1つのヘッドセット605と1つのI/Oインターフェース610とを含む例示的なシステム600を示すが、他の実施形態では、任意の数のこれらの構成要素が、システム600中に含まれ得る。たとえば、各々が、関連するI/Oインターフェース610を有する、複数のヘッドセット605があり得、各ヘッドセット605およびI/Oインターフェース610はコンソール615と通信する。代替構成では、異なるおよび/または追加の構成要素が、システム600中に含まれ得る。さらに、図6に示されている構成要素のうちの1つまたは複数に関して説明される機能性は、いくつかの実施形態では、図6に関して説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コンソール615の機能性の一部または全部がヘッドセット605によって提供される。
いくつかの実施形態では、ヘッドセット605は、ユーザの視覚を補正または増強するか、ユーザの眼を保護するか、あるいはユーザに画像を提供し得る。ヘッドセット605は、ユーザの視力の欠損を補正する眼鏡であり得る。ヘッドセット605は、太陽からユーザの眼を保護するサングラスであり得る。ヘッドセット605は、衝撃からユーザの眼を保護する保護眼鏡であり得る。ヘッドセット605は、夜間にユーザの視覚を増強するための暗視デバイスまたは赤外線ゴーグルであり得る。代替的に、ヘッドセット605は、レンズを含まないことがあり、ただ、ユーザにオーディオ(たとえば、音楽、ラジオ、ポッドキャスト)を提供するオーディオシステム620をもつフレームであり得る。
いくつかの実施形態では、ヘッドセット605は、コンピュータ生成された要素(たとえば、2次元(2D)または3次元(3D)画像、2Dまたは3Dビデオ、音など)を用いた物理的な現実世界環境の拡張ビューを備えるコンテンツをユーザに提示するヘッドマウントディスプレイであり得る。いくつかの実施形態では、提示されるコンテンツは、オーディオシステム620を介して提示されるオーディオを含み、オーディオシステム620は、ヘッドセット605、コンソール615、またはその両方からオーディオ情報を受信し、そのオーディオ情報に基づいてオーディオデータを提示する。いくつかの実施形態では、ヘッドセット605は、ユーザの周囲の実際の環境に部分的に基づく仮想コンテンツをユーザに提示する。たとえば、仮想コンテンツは、アイウェアデバイスのユーザに提示され得る。ユーザは、物理的に部屋の中にいることがあり、その部屋の仮想壁および仮想床が、仮想コンテンツの一部としてレンダリングされる。図6の実施形態では、ヘッドセット605は、オーディオシステム620と、電子ディスプレイ625と、光学ブロック630と、位置センサー635と、深度カメラアセンブリ(DCA)640と、慣性測定(IMU)ユニット645とを含む。ヘッドセット605のいくつかの実施形態は、図6に関して説明されるものとは異なる構成要素を有する。さらに、図6に関して説明される様々な構成要素によって提供される機能性は、他の実施形態ではヘッドセット605の構成要素の間で別様に分散されるか、またはヘッドセット605からリモートにある別個のアセンブリにおいて取り込まれ得る。
オーディオシステム620は、ユーザについての1つまたは複数のHRTFを生成するために音を検出する。オーディオシステム620は、次いで、ユーザのためのオーディオコンテンツを生成するために1つまたは複数のHRTFを使用し得る。オーディオシステム620は、オーディオシステム300の一実施形態であり得る。図3に関して上記で説明されたように、オーディオシステム620は、構成要素の中でも、マイクロフォンアセンブリと、コントローラと、スピーカーアセンブリとを含み得る。マイクロフォンアセンブリは、マイクロフォンアセンブリの周囲のローカルエリア内の音を検出する。複数の音響センサーは、ヘッドセット(たとえば、ヘッドセット100)上に、ユーザ上に(たとえば、ユーザの耳道中に)、ネックバンド上に、またはそれらの何らかの組合せで配置され得る。音響センサーのうちの少なくとも2つは、各々、いくつかの実施形態によれば、ユーザの各耳道の入口からしきい値距離内の検出領域において配置される。検出された音は、制御されない音または制御される音であり得る。コントローラは、マイクロフォンアセンブリによって検出された、より高い周波数、すなわち2kHz超の音について、DoA推定を実施し得る。いくつかの実施形態では、検出されたより高い周波数の音のDoA推定と、検出された音に関連するパラメータとに部分的に基づいて、コントローラは、検出された音のソースロケーションに関連する1つまたは複数のHRTFを生成し、および/または更新する。コントローラはまた、低周波数オーディオセンサーによって検出領域において測定された、検出された低周波数オーディオ信号に少なくとも部分的に基づいて、1つまたは複数のHRTFを生成し、および/または更新する。コントローラは、空間中のいくつかの異なる点から来たように思われるオーディオコンテンツを発するようにとの、スピーカーアセンブリのための命令を生成し得る。いくつかの実施形態では、コントローラの一部または全部がコンソール615上の部分であることに留意されたい。
電子ディスプレイ625は、コンソール615から受信されたデータに従ってユーザに2D画像または3D画像を表示する。様々な実施形態では、電子ディスプレイ625は、単一の電子ディスプレイまたは複数の電子ディスプレイ(たとえば、ユーザの各眼のためのディスプレイ)を備える。電子ディスプレイ625の例は、液晶ディスプレイ(LCD)、有機発光ダイオード(OLED)ディスプレイ、アクティブマトリックス有機発光ダイオードディスプレイ(AMOLED)、何らかの他のディスプレイ、またはそれらの何らかの組合せを含む。
光学ブロック630は、電子ディスプレイ625から受光された画像光を拡大し、画像光に関連する光学誤差を補正し、補正された画像光をヘッドセット605のユーザに提示する。電子ディスプレイ625と光学ブロック630とは、レンズ110の一実施形態であり得る。様々な実施形態では、光学ブロック630は、1つまたは複数の光学要素を含む。光学ブロック630中に含まれる例示的な光学要素は、アパーチャ、フレネルレンズ、凸レンズ、凹レンズ、フィルタ、反射面、または画像光に影響を及ぼす任意の他の好適な光学要素を含む。その上、光学ブロック630は、異なる光学要素の組合せを含み得る。いくつかの実施形態では、光学ブロック630中の光学要素のうちの1つまたは複数は、部分反射コーティングまたは反射防止コーティングなど、1つまたは複数のコーティングを有し得る。
光学ブロック630による画像光の拡大および集束は、電子ディスプレイ625が、より大きいディスプレイよりも、物理的により小さくなり、重さが減じ、少ない電力を消費することを可能にする。さらに、拡大は、電子ディスプレイ625によって提示されるコンテンツの視野を増大させ得る。たとえば、表示されるコンテンツの視野は、表示されるコンテンツが、ユーザの視野のほとんどすべて(たとえば、対角約110度)、およびいくつかの場合にはすべてを使用して提示されるようなものである。さらにいくつかの実施形態では、拡大量は、光学要素を追加することまたは取り外すことによって調整され得る。
いくつかの実施形態では、光学ブロック630は、1つまたは複数のタイプの光学誤差を補正するように設計され得る。光学誤差の例は、たる形ひずみまたは糸巻き形ひずみ、縦色収差、あるいは横色収差を含む。他のタイプの光学誤差は、球面収差、色収差、またはレンズ像面湾曲による誤差、非点収差、または任意の他のタイプの光学誤差をさらに含み得る。いくつかの実施形態では、表示のために電子ディスプレイ625に提供されるコンテンツは予歪され、光学ブロック630が、そのコンテンツに基づいて生成された画像光を電子ディスプレイ625から受光したとき、光学ブロック630はそのひずみを補正する。
DCA640は、ヘッドセット605の周囲のローカルエリアについての深度情報を表すデータをキャプチャする。一実施形態では、DCA640は、構造化光プロジェクタと、イメージングデバイスと、コントローラとを含み得る。キャプチャされたデータは、構造化光プロジェクタによってローカルエリア上に投影された構造化光の、イメージングデバイスによってキャプチャされた画像であり得る。一実施形態では、DCA640は、ローカルエリアの部分をステレオでキャプチャするために配向される2つまたはそれ以上のカメラと、コントローラとを含み得る。キャプチャされたデータは、ローカルエリアの2つまたはそれ以上のカメラによってステレオでキャプチャされた画像であり得る。コントローラは、キャプチャされたデータを使用してローカルエリアの深度情報を算出する。深度情報に基づいて、コントローラは、ローカルエリア内のヘッドセット605の絶対位置情報を決定する。DCA640は、ヘッドセット605と統合され得るか、またはヘッドセット605の外部のローカルエリア内に配置され得る。後者の実施形態では、DCA640のコントローラは、オーディオシステム620のコントローラに深度情報を送信し得る。
IMU645は、1つまたは複数の位置センサー635から受信された測定信号に基づいて、ヘッドセット605の位置を指示するデータを生成する電子デバイスである。1つまたは複数の位置センサー635は、センサーデバイス115の一実施形態であり得る。位置センサー635は、ヘッドセット605の運動に応答して1つまたは複数の測定信号を生成する。位置センサー635の例は、1つまたは複数の加速度計、1つまたは複数のジャイロスコープ、1つまたは複数の磁力計、運動を検出する別の好適なタイプのセンサー、IMU645の誤差補正のために使用されるタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー635は、IMU645の外部に、IMU645の内部に、またはそれらの何らかの組合せで位置し得る。
1つまたは複数の位置センサー635からの1つまたは複数の測定信号に基づいて、IMU645は、ヘッドセット605の初期位置に対するヘッドセット605の推定現在位置を指示するデータを生成する。たとえば、位置センサー635は、並進運動(前/後、上/下、左/右)を測定するための複数の加速度計と、回転運動(たとえばピッチ、ヨー、およびロール)を測定するための複数のジャイロスコープとを含む。いくつかの実施形態では、IMU645は、測定信号を迅速にサンプリングし、サンプリングされたデータからヘッドセット605の推定現在位置を計算する。たとえば、IMU645は、加速度計から受信された測定信号を経時的に積分して速度ベクトルを推定し、その速度ベクトルを経時的に積分して、ヘッドセット605上の基準点の推定現在位置を決定する。代替的に、IMU645は、サンプリングされた測定信号をコンソール615に提供し、コンソール615は、誤差を低減するようにデータを解釈する。基準点は、ヘッドセット605の位置を表すために使用され得る点である。基準点は、一般に、アイウェアデバイス605の配向および位置に関係する空間中の点、または位置として定義され得る。
IMU645は、コンソール615から1つまたは複数のパラメータを受信する。以下でさらに説明されるように、1つまたは複数のパラメータは、ヘッドセット605の追跡を維持するために使用される。受信されたパラメータに基づいて、IMU645は、1つまたは複数のIMUパラメータ(たとえば、サンプルレート)を調整し得る。いくつかの実施形態では、DCA640からのデータは、IMU645が基準点の初期位置を更新することを引き起こし、したがって、その初期位置は、基準点の次の位置に対応する。基準点の初期位置を基準点の次の較正された位置として更新することは、IMU645によって推定された現在位置に関連する累積誤差を低減するのを助ける。ドリフト誤差とも呼ばれる累積誤差は、基準点の推定位置が経時的に基準点の実際の位置から離れて「ドリフト」することを引き起こす。ヘッドセット605のいくつかの実施形態では、IMU645は、専用ハードウェア構成要素であり得る。他の実施形態では、IMU645は、1つまたは複数のプロセッサにおいて実装されるソフトウェア構成要素であり得る。
I/Oインターフェース610は、ユーザがアクション要求を送り、コンソール615から応答を受信することを可能にするデバイスである。アクション要求は、特定のアクションを実施するための要求である。たとえば、アクション要求は、画像データまたはビデオデータのキャプチャを開始または終了するための命令、音を作り出すことからオーディオシステム620を開始または終了するための命令、ヘッドセット605の較正プロセスを開始または終了するための命令、あるいはアプリケーション内で特定のアクションを実施するための命令であり得る。I/Oインターフェース610は、1つまたは複数の入力デバイスを含み得る。例示的な入力デバイスは、キーボード、マウス、ゲームコントローラ、またはアクション要求を受信し、そのアクション要求をコンソール615に通信するための任意の他の好適なデバイスを含む。I/Oインターフェース610によって受信されたアクション要求は、コンソール615に通信され、コンソール615は、そのアクション要求に対応するアクションを実施する。いくつかの実施形態では、I/Oインターフェース615は、上記でさらに説明されたように、I/Oインターフェース610の初期位置に対するI/Oインターフェース610の推定位置を指示する較正データをキャプチャするIMU645を含む。いくつかの実施形態では、I/Oインターフェース610は、コンソール615から受信された命令に従って、ユーザに触覚フィードバックを提供し得る。たとえば、アクション要求が受信されたときに触覚フィードバックが提供されるか、またはコンソール615がアクションを実施するときに、コンソール615が、I/Oインターフェース610に命令を通信して、I/Oインターフェース610が触覚フィードバックを生成することを引き起こす。
コンソール615は、ヘッドセット605とI/Oインターフェース610とのうちの1つまたは複数から受信された情報に従って、処理するためのコンテンツをヘッドセット605に提供する。図6に示されている例では、コンソール615は、アプリケーションストア650と、追跡モジュール655と、エンジン660とを含む。コンソール615のいくつかの実施形態は、図6に関して説明されるものとは異なるモジュールまたは構成要素を有する。同様に、以下でさらに説明される機能は、図6に関して説明されるものとは異なる様式でコンソール615の構成要素の間で分散され得る。
アプリケーションストア650は、コンソール615が実行するための1つまたは複数のアプリケーションを記憶する。アプリケーションは、プロセッサによって実行されたとき、ユーザへの提示のためのコンテンツを生成する命令のグループである。アプリケーションによって生成されたコンテンツは、ヘッドセット605またはI/Oインターフェース610の移動を介してユーザから受信された入力に応答したものであり得る。アプリケーションの例は、ゲームアプリケーション、会議アプリケーション、ビデオプレイバックアプリケーション、較正プロセス、または他の好適なアプリケーションを含む。
追跡モジュール655は、1つまたは複数の較正パラメータを使用してシステム環境600を較正し、ヘッドセット605またはI/Oインターフェース610の位置を決定する際の誤差を低減するように、1つまたは複数の較正パラメータを調整し得る。また、追跡モジュール655によって実施される較正は、ヘッドセット605中のIMU645および/またはI/Oインターフェース610中に含まれるIMU645から受信された情報を考慮する。さらに、ヘッドセット605の追跡が失われた場合、追跡モジュール655は、システム環境600の一部または全部を再較正し得る。
追跡モジュール655は、1つまたは複数のセンサーデバイス635、IMU645、またはそれらの何らかの組合せからの情報を使用して、ヘッドセット605またはI/Oインターフェース610の移動を追跡する。たとえば、追跡モジュール655は、ヘッドセット605からの情報に基づいて、ローカルエリアのマッピングにおいてヘッドセット605の基準点の位置を決定する。追跡モジュール655はまた、ヘッドセット605の基準点の位置、またはI/Oインターフェース610の基準点の位置を、それぞれ、ヘッドセット605の位置を指示するIMU645からのデータを使用して、またはI/Oインターフェース610の位置を指示するI/Oインターフェース610中に含まれるIMU645からのデータを使用して決定し得る。さらに、いくつかの実施形態では、追跡モジュール655は、位置またはヘッドセット605を指示するIMU645からのデータの部分を使用して、ヘッドセット605の将来のロケーションを予測し得る。追跡モジュール655は、ヘッドセット605またはI/Oインターフェース610の推定または予測された将来の位置をエンジン660に提供する。
エンジン660はまた、システム環境600内でアプリケーションを実行し、追跡モジュール655から、ヘッドセット605の位置情報、加速度情報、速度情報、予測された将来の位置、オーディオ情報、またはそれらの何らかの組合せを受信する。受信された情報に基づいて、エンジン660は、ユーザへの提示のためにヘッドセット605に提供すべきコンテンツを決定する。たとえば、受信された情報が、ユーザが左を見ていることを指示する場合、エンジン660は、仮想環境において、またはローカルエリアを追加のコンテンツで拡張する環境において、ユーザの移動を反映する、ヘッドセット605のためのコンテンツを生成する。さらに、エンジン660は、I/Oインターフェース610から受信されたアクション要求に応答して、コンソール615上で実行しているアプリケーション内でアクションを実施し、そのアクションが実施されたというフィードバックをユーザに提供する。提供されるフィードバックは、ヘッドセット605を介した視覚または可聴フィードバック、あるいはI/Oインターフェース610を介した触覚フィードバックであり得る。
追加の構成情報
本発明による実施形態は、特に、ヘッドセット、方法、および記憶媒体を対象とする添付の特許請求の範囲で開示され、1つの請求項カテゴリー、たとえば、ヘッドセットにおいて述べられた任意の特徴は、別の請求項カテゴリー、たとえば、方法、記憶媒体、システムおよびコンピュータプログラム製品においても請求され得る。添付の特許請求の範囲における従属関係または参照は、形式的理由で選定されるにすぎない。ただし、前の請求項への意図的な参照(特に複数の従属関係)から生じる主題も請求され得、その結果、請求項とその特徴との任意の組合せが、開示され、添付の特許請求の範囲で選定された従属関係にかかわらず請求され得る。請求され得る主題は、添付の特許請求の範囲に記載の特徴の組合せだけでなく、特許請求の範囲における特徴の任意の他の組合せをも含み、特許請求の範囲において述べられた各特徴は、特許請求の範囲における任意の他の特徴または他の特徴の組合せと組み合わせられ得る。さらに、本明細書で説明または示される実施形態および特徴のいずれかは、別個の請求項において、ならびに/あるいは、本明細書で説明もしくは示される任意の実施形態もしくは特徴との、または添付の特許請求の範囲の特徴のいずれかとの任意の組合せで請求され得る。
本発明による実施形態は、特に、ヘッドセット、方法、および記憶媒体を対象とする添付の特許請求の範囲で開示され、1つの請求項カテゴリー、たとえば、ヘッドセットにおいて述べられた任意の特徴は、別の請求項カテゴリー、たとえば、方法、記憶媒体、システムおよびコンピュータプログラム製品においても請求され得る。添付の特許請求の範囲における従属関係または参照は、形式的理由で選定されるにすぎない。ただし、前の請求項への意図的な参照(特に複数の従属関係)から生じる主題も請求され得、その結果、請求項とその特徴との任意の組合せが、開示され、添付の特許請求の範囲で選定された従属関係にかかわらず請求され得る。請求され得る主題は、添付の特許請求の範囲に記載の特徴の組合せだけでなく、特許請求の範囲における特徴の任意の他の組合せをも含み、特許請求の範囲において述べられた各特徴は、特許請求の範囲における任意の他の特徴または他の特徴の組合せと組み合わせられ得る。さらに、本明細書で説明または示される実施形態および特徴のいずれかは、別個の請求項において、ならびに/あるいは、本明細書で説明もしくは示される任意の実施形態もしくは特徴との、または添付の特許請求の範囲の特徴のいずれかとの任意の組合せで請求され得る。
一実施形態では、ヘッドセットは、フレームと、オーディオシステムとを備え得、オーディオシステムは、検出領域においてフレーム上に配置されたマイクロフォンアセンブリであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、耳の耳道からしきい値距離内にあり、マイクロフォンアセンブリが、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出するように構成され、検出領域において検出されたオーディオ信号が、ユーザの耳道における音圧波のしきい類似度内にある、マイクロフォンアセンブリと、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定するように構成されたオーディオコントローラとを含む。
マイクロフォンアセンブリは複数のマイクロフォンを備え得る。
一実施形態では、ヘッドセットは、検出領域以外のロケーションにおいてフレーム上に配置された、複数のマイクロフォンのうちの少なくとも1つのマイクロフォンを備え得る。
しきい値距離は最大でも3インチであり得る。
オーディオソースは、オーディオシステムの一部であるスピーカーであり得る。
スピーカーはヘッドセットのフレーム上に配置され得る。
オーディオソースは軟骨伝導システムのトランスデューサであり得る。
オーディオソースは、ヘッドセットの外部にあり、ヘッドセットとは別個であり得、オーディオ信号はヘッドセットのローカルエリアにおける周辺音を表し得る。
オーディオ信号の周波数は2kHz以下であることがある。
オーディオコントローラは、
ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することと
を行うように構成され得る。
ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することと
を行うように構成され得る。
一実施形態では、方法は、
ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号が、耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、
オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することと
を含み得る。
ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号が、耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、
オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することと
を含み得る。
ヘッドセットはオーディオシステムを備え得、オーディオソースは、オーディオシステムの一部であるスピーカーであり得る。
オーディオ信号の周波数は2kHz以下であることがある。
オーディオソースは軟骨伝導システムのトランスデューサであり得る。
オーディオ信号はユーザのローカルエリアにおける周辺音を表し得る。
一実施形態では、方法は、
ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することと
を含み得る。
ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することと
を含み得る。
一実施形態では、非一時的コンピュータ可読媒体が命令を記憶し得、命令は、1つまたは複数のプロセッサによって実行されたとき、1つまたは複数のプロセッサに、
ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号が、耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、
オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することと
を含む動作を実施させる。
ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、検出領域が、ヘッドセットを装着しているユーザの耳の外部にあり、ユーザの耳道からしきい値距離内にあり、検出領域において検出されたオーディオ信号が、耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、
オーディオコントローラを介して、検出されたオーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することと
を含む動作を実施させる。
オーディオ信号の周波数は2kHz以下であることがある。
マイクロフォンアセンブリは複数のマイクロフォンを備え得る。
オーディオコントローラは、
ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することと
を行うように構成され得る。
ローカルエリア内のヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連するHRTFを更新することと
を行うように構成され得る。
一実施形態では、1つまたは複数のコンピュータ可読非一時的記憶媒体は、実行されたとき、上述の実施形態のいずれかによる方法または上述の実施形態のいずれか内の方法を実施するように動作可能であるソフトウェアを具現し得る。
一実施形態では、システムは、1つまたは複数のプロセッサと、プロセッサに結合され、プロセッサによって実行可能な命令を備える少なくとも1つのメモリとを備え得、プロセッサは、命令を実行したとき、上述の実施形態のいずれかによる方法または上述の実施形態のいずれか内の方法を実施するように動作可能である。
一実施形態では、好ましくはコンピュータ可読非一時的記憶媒体を備えるコンピュータプログラム製品は、データ処理システム上で実行されたとき、上述の実施形態のいずれかによる方法または上述の実施形態のいずれか内の方法を実施するように動作可能であり得る。
本開示の実施形態の上記の説明は、説明の目的で提示されており、網羅的であること、または開示される正確な形態に本開示を限定することは意図されない。当業者は、上記の開示に照らして多くの修正および変形が可能であることを諒解することができる。
本明細書のいくつかの部分は、情報に関する動作のアルゴリズムおよび記号表現に関して本開示の実施形態について説明する。これらのアルゴリズム説明および表現は、データ処理技術分野の当業者が、他の当業者に自身の仕事の本質を効果的に伝えるために通常使用される。これらの動作は、機能的に、算出量的に、または論理的に説明されるが、コンピュータプログラムまたは等価な電気回路、マイクロコードなどによって実装されることが理解される。さらに、一般性の喪失なしに、動作のこれらの仕組みをモジュールと呼ぶことが時々好都合であることも証明された。説明される動作およびそれらの関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの任意の組合せにおいて具現され得る。
本明細書で説明されるステップ、動作、またはプロセスのいずれも、1つまたは複数のハードウェアまたはソフトウェアモジュールで、単独でまたは他のデバイスとの組合せで実施または実装され得る。一実施形態では、ソフトウェアモジュールは、コンピュータプログラムコードを含んでいるコンピュータ可読媒体を備えるコンピュータプログラム製品で実装され、コンピュータプログラムコードは、説明されるステップ、動作、またはプロセスのいずれかまたはすべてを実施するためにコンピュータプロセッサによって実行され得る。
本開示の実施形態はまた、本明細書の動作を実施するための装置に関し得る。この装置は、必要とされる目的のために特別に構築され得、および/あるいは、この装置は、コンピュータに記憶されたコンピュータプログラムによって選択的にアクティブ化または再構成される汎用コンピューティングデバイスを備え得る。そのようなコンピュータプログラムは、非一時的有形コンピュータ可読記憶媒体、または電子命令を記憶するのに好適な任意のタイプの媒体に記憶され得、それらの媒体はコンピュータシステムバスに結合され得る。さらに、本明細書で言及される任意のコンピューティングシステムは、単一のプロセッサを含み得るか、または増加された算出能力のために複数のプロセッサ設計を採用するアーキテクチャであり得る。
本開示の実施形態はまた、本明細書で説明されるコンピューティングプロセスによって製造される製品に関し得る。そのような製品は、コンピューティングプロセスから生じる情報を備え得、その情報は、非一時的有形コンピュータ可読記憶媒体に記憶され、本明細書で説明されるコンピュータプログラム製品または他のデータ組合せの任意の実施形態を含み得る。
最終的に、本明細書において使用される言い回しは、主に読みやすさおよび教育目的で選択されており、本明細書において使用される言い回しは、本発明の主題を定めるかまたは制限するように選択されていないことがある。したがって、本開示の範囲はこの詳細な説明によって限定されるのではなく、むしろ、本明細書に基づく出願に関して生じる請求項によって限定されることが意図される。したがって、実施形態の開示は、以下の特許請求の範囲に記載される本開示の範囲を例示するものであり、限定するものではない。
Claims (15)
- フレームと、
オーディオシステムと
を備えるヘッドセットであって、前記オーディオシステムは、
検出領域において前記フレーム上に配置されたマイクロフォンアセンブリであって、前記検出領域が、前記ヘッドセットを装着しているユーザの耳の外部にあり、前記耳の耳道からしきい値距離内にあり、前記マイクロフォンアセンブリが、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出するように構成され、前記検出領域において検出された前記オーディオ信号が、前記ユーザの前記耳道における音圧波のしきい類似度内にある、マイクロフォンアセンブリと、
検出された前記オーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定するように構成されたオーディオコントローラと
を含む、ヘッドセット。 - 前記マイクロフォンアセンブリが複数のマイクロフォンを備え、好ましくは、前記複数のマイクロフォンのうちの少なくとも1つのマイクロフォンが、前記検出領域以外のロケーションにおいて前記フレーム上に配置される、請求項1に記載のヘッドセット。
- 前記しきい値距離が、最大でも3インチである、請求項1または2に記載のヘッドセット。
- 前記オーディオソースが、前記オーディオシステムの一部であるスピーカーであり、好ましくは、前記スピーカーが前記ヘッドセットの前記フレーム上に配置される、請求項1から3のいずれか一項に記載のヘッドセット。
- 前記オーディオソースが軟骨伝導システムのトランスデューサであり、および/または、前記オーディオソースが、前記ヘッドセットの外部にあり、前記ヘッドセットとは別個であり、前記オーディオ信号が前記ヘッドセットのローカルエリアにおける周辺音を表す、請求項1から4のいずれか一項に記載のヘッドセット。
- 前記オーディオ信号の周波数が2kHz以下である、請求項1から5のいずれか一項に記載のヘッドセット。
- 前記オーディオコントローラが、
前記ローカルエリア内の前記ヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、前記オーディオシステムに関連する前記HRTFを更新することと
を行うように構成されている、請求項1から6のいずれか一項に記載のヘッドセット。 - ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、前記検出領域が、前記ヘッドセットを装着しているユーザの耳の外部にあり、前記ユーザの耳道からしきい値距離内にあり、前記検出領域において検出された前記オーディオ信号が、前記耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、
オーディオコントローラを介して、検出された前記オーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することと
を含む、方法。 - 前記ヘッドセットがオーディオシステムを備え、前記オーディオソースが、前記オーディオシステムの一部であるスピーカーである、請求項8に記載の方法。
- 前記オーディオ信号の周波数が2kHz以下であり、および/あるいは、前記オーディオソースが軟骨伝導システムのトランスデューサである、請求項8または9に記載の方法。
- 前記オーディオ信号が前記ユーザのローカルエリアにおける周辺音を表す、請求項8から10のいずれか一項に記載の方法。
- 前記ローカルエリア内の前記ヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、前記オーディオシステムに関連する前記HRTFを更新することと
をさらに含む、請求項8から11のいずれか一項に記載の方法。 - 命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、1つまたは複数のプロセッサによって実行されたとき、前記1つまたは複数のプロセッサに、
ヘッドセットのフレーム上の検出領域内に配置されたマイクロフォンアセンブリを介して、ローカルエリア中のオーディオソースから発せられたオーディオ信号を検出することであって、前記検出領域が、前記ヘッドセットを装着しているユーザの耳の外部にあり、前記ユーザの耳道からしきい値距離内にあり、前記検出領域において検出された前記オーディオ信号が、前記耳道における音圧波のしきい類似度内にある、オーディオ信号を検出することと、
オーディオコントローラを介して、検出された前記オーディオ信号に部分的に基づいて頭部伝達関数(HRTF)のセットを決定することと
を含む動作を実施させる、非一時的コンピュータ可読媒体。 - 前記オーディオ信号の周波数が2kHz以下であり、および/または、前記マイクロフォンアセンブリが複数のマイクロフォンを備える、請求項13に記載の非一時的コンピュータ可読媒体。
- 前記オーディオコントローラが、
前記ローカルエリア内の前記ヘッドセットの位置に対する検出された音の到来方向(DoA)を推定することと、
DoA推定に基づいて、2kHzを上回る周波数について、オーディオシステムに関連する前記HRTFを更新することと
を行うように構成されている、請求項13または14に記載の非一時的コンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/390,405 US10848891B2 (en) | 2019-04-22 | 2019-04-22 | Remote inference of sound frequencies for determination of head-related transfer functions for a user of a headset |
US16/390,405 | 2019-04-22 | ||
PCT/US2020/029139 WO2020219460A1 (en) | 2019-04-22 | 2020-04-21 | Remote inference of sound frequencies for determination of head-related transfer functions for a user of a headset |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022529202A true JP2022529202A (ja) | 2022-06-20 |
Family
ID=70482945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021540496A Pending JP2022529202A (ja) | 2019-04-22 | 2020-04-21 | ヘッドセットのユーザについての頭部伝達関数の決定のための音周波数のリモート推論 |
Country Status (6)
Country | Link |
---|---|
US (2) | US10848891B2 (ja) |
EP (1) | EP3959900A1 (ja) |
JP (1) | JP2022529202A (ja) |
KR (1) | KR20210153671A (ja) |
CN (1) | CN113711626A (ja) |
WO (1) | WO2020219460A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11544036B2 (en) * | 2014-09-23 | 2023-01-03 | Zophonos Inc. | Multi-frequency sensing system with improved smart glasses and devices |
US10848891B2 (en) * | 2019-04-22 | 2020-11-24 | Facebook Technologies, Llc | Remote inference of sound frequencies for determination of head-related transfer functions for a user of a headset |
US11159872B1 (en) * | 2020-04-24 | 2021-10-26 | Bose Corporation | Wearable audio device magnetometer compensation |
US11064282B1 (en) * | 2020-04-24 | 2021-07-13 | Bose Corporation | Wearable audio system use position detection |
US11234095B1 (en) * | 2020-05-21 | 2022-01-25 | Facebook Technologies, Llc | Adjusting acoustic parameters based on headset position |
US11792581B2 (en) * | 2021-08-03 | 2023-10-17 | Sony Interactive Entertainment Inc. | Using Bluetooth / wireless hearing aids for personalized HRTF creation |
TWI837867B (zh) * | 2022-10-06 | 2024-04-01 | 宏碁股份有限公司 | 聲音補償方法及頭戴式裝置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2A (en) * | 1826-12-15 | 1836-07-29 | mode of manufacturing wool or other fibrous materials | |
US20110091057A1 (en) * | 2009-10-16 | 2011-04-21 | Nxp B.V. | Eyeglasses with a planar array of microphones for assisting hearing |
JP2012249097A (ja) * | 2011-05-27 | 2012-12-13 | Kyocera Corp | 音声出力装置 |
US8787584B2 (en) | 2011-06-24 | 2014-07-22 | Sony Corporation | Audio metrics for head-related transfer function (HRTF) selection or adaptation |
US9338561B2 (en) * | 2012-12-28 | 2016-05-10 | Gn Resound A/S | Hearing aid with improved localization |
DE102013207161B4 (de) * | 2013-04-19 | 2019-03-21 | Sivantos Pte. Ltd. | Verfahren zur Nutzsignalanpassung in binauralen Hörhilfesystemen |
ES2517765B1 (es) | 2013-04-30 | 2015-08-11 | Grupo Eye2021, S.L. | Dispositivo y método de análisis, almacenamiento y representación espacial mediante sonidos |
US9324313B1 (en) | 2013-10-23 | 2016-04-26 | Google Inc. | Methods and systems for implementing bone conduction-based noise cancellation for air-conducted sound |
WO2016089133A1 (ko) * | 2014-12-04 | 2016-06-09 | 가우디오디오랩 주식회사 | 개인 특징을 반영한 바이노럴 오디오 신호 처리 방법 및 장치 |
CN107996028A (zh) | 2015-03-10 | 2018-05-04 | Ossic公司 | 校准听音装置 |
US9609436B2 (en) * | 2015-05-22 | 2017-03-28 | Microsoft Technology Licensing, Llc | Systems and methods for audio creation and delivery |
US9648438B1 (en) * | 2015-12-16 | 2017-05-09 | Oculus Vr, Llc | Head-related transfer function recording using positional tracking |
US9918177B2 (en) * | 2015-12-29 | 2018-03-13 | Harman International Industries, Incorporated | Binaural headphone rendering with head tracking |
US10231046B1 (en) | 2017-08-18 | 2019-03-12 | Facebook Technologies, Llc | Cartilage conduction audio system for eyewear devices |
DK3588981T3 (da) * | 2018-06-22 | 2022-01-10 | Oticon As | Høreanordning der omfatter en akustisk hændelsesdetektor |
US10848891B2 (en) * | 2019-04-22 | 2020-11-24 | Facebook Technologies, Llc | Remote inference of sound frequencies for determination of head-related transfer functions for a user of a headset |
-
2019
- 2019-04-22 US US16/390,405 patent/US10848891B2/en active Active
-
2020
- 2020-04-21 EP EP20723773.6A patent/EP3959900A1/en not_active Withdrawn
- 2020-04-21 JP JP2021540496A patent/JP2022529202A/ja active Pending
- 2020-04-21 WO PCT/US2020/029139 patent/WO2020219460A1/en unknown
- 2020-04-21 KR KR1020217037322A patent/KR20210153671A/ko not_active Application Discontinuation
- 2020-04-21 CN CN202080029950.0A patent/CN113711626A/zh active Pending
- 2020-10-09 US US17/066,975 patent/US11234092B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2020219460A1 (en) | 2020-10-29 |
EP3959900A1 (en) | 2022-03-02 |
CN113711626A (zh) | 2021-11-26 |
US20200336856A1 (en) | 2020-10-22 |
US11234092B2 (en) | 2022-01-25 |
KR20210153671A (ko) | 2021-12-17 |
US20210029484A1 (en) | 2021-01-28 |
US10848891B2 (en) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110636414B (zh) | 用于个性化声传递函数的动态确定的音频系统 | |
US11234092B2 (en) | Remote inference of sound frequencies for determination of head-related transfer functions for a user of a headset | |
JP7551639B2 (ja) | 多数のヘッドセット間の音声空間化および強化 | |
US11361744B2 (en) | Acoustic transfer function personalization using sound scene analysis and beamforming | |
US20200045491A1 (en) | Customizing head-related transfer functions based on monitored responses to audio content | |
JP2022529203A (ja) | 音声コンテンツ表現のための頭部伝達関数テンプレートの個別化 | |
JP2022524306A (ja) | ウェアラブルオーディオデバイスにおける振動緩和のための高コンプライアンスマイクロスピーカー | |
US11622223B2 (en) | Dynamic customization of head related transfer functions for presentation of audio content | |
JP2021525465A (ja) | 軟骨伝導オーディオデバイスを製造すること | |
JP2022548462A (ja) | オーディオ個人化のための空間ロケーションを選択すること | |
JP2022546161A (ja) | 個別化された空間オーディオを作り出すためにビームフォーミングを介して耳殻情報を推論すること | |
KR20220047257A (ko) | 히어쓰루 오디오 시스템용 귀마개 조립체 | |
CN114080820A (zh) | 用于选择传感器阵列的声学传感器子集的方法及其系统 | |
KR20210119461A (ko) | 머리 전달 함수에 대한 헤드셋 효과의 보상 | |
CN117981347A (zh) | 用于对虚拟声源进行空间化的音频系统 | |
US11171621B2 (en) | Personalized equalization of audio output based on ambient noise detection | |
CN114009061A (zh) | 减轻组织传导音频系统中的串扰 | |
CN116195269A (zh) | 基于外耳的位移的虚拟传声器校准 | |
JP2022504999A (ja) | オーディオコンテンツに対する監視された応答に基づく頭部関連伝達関数のカスタマイズ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |