JP2022534833A - 個人化されたオーディオ拡張のためのオーディオプロファイル - Google Patents
個人化されたオーディオ拡張のためのオーディオプロファイル Download PDFInfo
- Publication number
- JP2022534833A JP2022534833A JP2021554615A JP2021554615A JP2022534833A JP 2022534833 A JP2022534833 A JP 2022534833A JP 2021554615 A JP2021554615 A JP 2021554615A JP 2021554615 A JP2021554615 A JP 2021554615A JP 2022534833 A JP2022534833 A JP 2022534833A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- user
- profile
- wearable device
- audio profile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 33
- 230000004044 response Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 18
- 210000001508 eye Anatomy 0.000 description 70
- 230000006870 function Effects 0.000 description 29
- 238000012546 transfer Methods 0.000 description 28
- 230000003287 optical effect Effects 0.000 description 21
- 230000009471 action Effects 0.000 description 16
- 230000033001 locomotion Effects 0.000 description 14
- 238000013507 mapping Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 210000003128 head Anatomy 0.000 description 11
- 210000000988 bone and bone Anatomy 0.000 description 10
- 210000000845 cartilage Anatomy 0.000 description 9
- 230000001179 pupillary effect Effects 0.000 description 9
- 238000003384 imaging method Methods 0.000 description 8
- 230000001953 sensory effect Effects 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 208000013057 hereditary mucoepithelial dysplasia Diseases 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 210000001747 pupil Anatomy 0.000 description 6
- 230000004075 alteration Effects 0.000 description 5
- 210000004728 ear cartilage Anatomy 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000003190 augmentative effect Effects 0.000 description 4
- 238000005286 illumination Methods 0.000 description 4
- 230000006855 networking Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 206010020751 Hypersensitivity Diseases 0.000 description 3
- 206010036626 Presbyacusis Diseases 0.000 description 3
- 208000026935 allergic disease Diseases 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000009610 hypersensitivity Effects 0.000 description 3
- 208000009800 presbycusis Diseases 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 210000003484 anatomy Anatomy 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 210000000613 ear canal Anatomy 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 210000003625 skull Anatomy 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 210000005010 torso Anatomy 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 241000226585 Antennaria plantaginifolia Species 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 206010020559 Hyperacusis Diseases 0.000 description 1
- 241001183191 Sclerophthora macrospora Species 0.000 description 1
- 241000746998 Tragus Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000006117 anti-reflective coating Substances 0.000 description 1
- 201000009310 astigmatism Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000537 electroencephalography Methods 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000010370 hearing loss Effects 0.000 description 1
- 231100000888 hearing loss Toxicity 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 108091008695 photoreceptors Proteins 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000010255 response to auditory stimulus Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 231100000430 skin reaction Toxicity 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/70—Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/0002—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network
- A61B5/0015—Remote monitoring of patients using telemetry, e.g. transmission of vital signals via a communication network characterised by features of the telemetry system
- A61B5/0022—Monitoring a patient using a global network, e.g. telephone networks, internet
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/12—Audiometering
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/68—Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
- A61B5/6801—Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
- A61B5/6802—Sensor mounted on worn items
- A61B5/6803—Head-worn items, e.g. helmets, masks, headphones or goggles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/68—Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient
- A61B5/6801—Arrangements of detecting, measuring or recording means, e.g. sensors, in relation to patient specially adapted to be attached to or worn on the body surface
- A61B5/6813—Specially adapted to be attached to a specific body part
- A61B5/6814—Head
- A61B5/6815—Ear
- A61B5/6817—Ear canal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/30—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to physical therapies or activities, e.g. physiotherapy, acupressure or exercising
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Pathology (AREA)
- Acoustics & Sound (AREA)
- Heart & Thoracic Surgery (AREA)
- Otolaryngology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Signal Processing (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Neurosurgery (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physical Education & Sports Medicine (AREA)
- Data Mining & Analysis (AREA)
- Computer Networks & Wireless Communication (AREA)
- Stereophonic System (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
システムが、オーディオプロファイルを作成する。オーディオプロファイルは、データベースに記憶され得る。たとえば、オーディオプロファイルは、ソーシャルネットワークのデータベースにセキュアに記憶され、ユーザアカウントに関連付けられ得る。オーディオプロファイルは、特定のユーザが音を聞き、解釈するやり方を表すデータを含んでいることがある。ユーザに音を提示するシステムおよびアプリケーションが、ユーザのためのオーディオ体験を拡張するために、オーディオプロファイルにアクセスし、オーディオプロファイル中のデータに基づいてユーザに提示される音を修正し得る。【選択図】図3
Description
関連出願の相互参照
本出願は、2019年6月5日に出願された米国出願第62/857,410号および2019年9月6日に出願された米国出願第16/562,879号の優先権を主張する。米国出願第62/857,410号および米国出願第16/562,879号は、すべての目的のためにその全体が参照により本明細書に組み込まれる。
本出願は、2019年6月5日に出願された米国出願第62/857,410号および2019年9月6日に出願された米国出願第16/562,879号の優先権を主張する。米国出願第62/857,410号および米国出願第16/562,879号は、すべての目的のためにその全体が参照により本明細書に組み込まれる。
本開示は、一般に、オーディオシステムに関し、詳細には、カスタマイズされたオーディオコンテンツを提供することに関する。
人によって、音は異なって聞こえる。人工現実システムにおけるオーディオシステムなど、オーディオシステムのユーザについて、オーディオシステムによって提示される音は、異なるユーザによって異なって聞こえ得る。たとえば、何人かのユーザは、聴覚過敏(過度に敏感)、老人性難聴(いくつかの周波数に対して鈍感)、またはそれらのユーザが音をどのように知覚するかに影響を及ぼす何らかの他の状態を有し得る。したがって、異なるユーザの間の聴覚差が、提示されたオーディオコンテンツのそれらのユーザの知覚に影響を及ぼすことがある。
ウェアラブルデバイスが、ユーザのためのオーディオ評価を実施する。オーディオ評価の結果に基づいて、ウェアラブルデバイスは、オーディオプロファイルを作成する。オーディオプロファイルは、データベースに記憶され得る。たとえば、オーディオプロファイルは、ソーシャルネットワークのデータベースに記憶され、ユーザアカウントに関連付けられ得る。オーディオプロファイルは、特定のユーザが音を聞き、解釈するやり方を表すデータを含んでいることがある。たとえば、多くのユーザは、極めて残響のある環境における音声を理解することが困難である。ユーザに音を提示するシステムおよびアプリケーションが、ユーザのためのオーディオ体験を拡張する(enhance)ために、オーディオプロファイルにアクセスし、オーディオプロファイル中のデータに基づいてユーザに提示される音を修正し得る。
いくつかの実施形態では、システム、方法、およびコンピュータプログラム製品が、ウェアラブルデバイス上のオーディオシステムによって、ユーザのためのオーディオ評価データを収集することを含む動作を実施し得る。オーディオ評価データは、アクティブおよび/またはパッシブオーディオ評価ルーチンを使用して収集され得る。オーディオシステムは、オーディオ評価データとユーザを表す身体的データとに基づいて、オーディオプロファイルを作成する。オーディオシステムは、ウェアラブルデバイス上にローカルにオーディオプロファイルを記憶するか、またはオーディオファイルをソーシャルネットワークなどの外部システムに送信し得る。オーディオシステムは、オーディオプロファイルに部分的に基づいて、ユーザにオーディオコンテンツを提示する。
本発明によれば、ウェアラブルデバイスによって、ユーザのオーディオ評価データを収集することと、オーディオ評価データとユーザを表す身体的データとに基づいて、オーディオプロファイルを更新することと、オーディオプロファイルに部分的に基づいて、ユーザにオーディオコンテンツを提示することとを含む方法が提供される。
任意選択的に、本方法は、オーディオプロファイルをソーシャルネットワークに送信することをさらに含み、ソーシャルネットワークは、オーディオプロファイルをユーザプロファイルに関連付ける。任意選択的に、ソーシャルネットワークは、オーディオプロファイルを拡張(enhancement)方式に関連付ける。
任意選択的に、本方法は、ウェアラブルデバイスによって、オーディオプロファイルを作成することをさらに含む。任意選択的に、本方法は、外部システムからオーディオコンテンツを受信することと、オーディオプロファイルに基づいてオーディオコンテンツを修正することとをさらに含む。
任意選択的に、オーディオ評価データを収集することは、ユーザに音を提示することと、ユーザによる音に対する応答を検出することとを含む。任意選択的に、オーディオ評価データを収集することは、ローカルエリアにおける音ソースのロケーションを決定することと、ユーザによる音ソースに対する応答を検出することとを含む。任意選択的に、オーディオ評価データを収集することは、ユーザの聴覚の特性を表すパラメータを決定するためにオーディオ評価ルーティングを行うことを含む。任意選択的に、パラメータは、スケーリングファクタまたは残響の最大レベルのうちの少なくとも1つを含む。
任意選択的に、身体的データは、ユーザの耳形状を表す。
任意選択的に、本方法は、ソーシャルネットワークからオーディオプロファイルを取り出すことをさらに含む。
任意選択的に、オーディオプロファイルは、セキュリティ設定を含み、セキュリティ設定は、サードパーティがオーディオプロファイルにアクセスすることを許可されるかどうかを示す。
本発明によれば、非一時的コンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、非一時的コンピュータ可読記憶媒体が、ウェアラブルデバイスによって、ユーザのオーディオ評価データを収集することと、オーディオ評価データとユーザを表す身体的データとに基づいて、オーディオプロファイルを更新することと、オーディオプロファイルに部分的に基づいて、ユーザにオーディオコンテンツを提示することとを行うためのコンピュータプログラムコードを含んでいる、コンピュータプログラム製品がさらに提供される。
任意選択的に、本コンピュータプログラム製品は、オーディオプロファイルをソーシャルネットワークに送信するためのコンピュータプログラムコードをさらに備え、ソーシャルネットワークは、オーディオプロファイルをユーザプロファイルに関連付ける。
本発明によれば、非一時的コンピュータ可読記憶媒体を備えるウェアラブルデバイスであって、非一時的コンピュータ可読記憶媒体が、ウェアラブルデバイスによって、ユーザのオーディオ評価データを収集することと、オーディオ評価データとユーザを表す身体的データとに基づいて、オーディオプロファイルを更新することと、オーディオプロファイルに部分的に基づいて、ユーザにオーディオコンテンツを提示することとを行うためのコンピュータプログラムコードを含んでいる、ウェアラブルデバイスがさらに提供される。
任意選択的に、本ウェアラブルデバイスは、オーディオプロファイルをソーシャルネットワークに送信するためのコンピュータプログラムコードをさらに備え、ソーシャルネットワークは、オーディオプロファイルをユーザプロファイルに関連付けた。任意選択的に、ソーシャルネットワークは、オーディオプロファイルを拡張方式に関連付けた。
任意選択的に、本ウェアラブルデバイスは、外部システムからオーディオコンテンツを受信することと、オーディオプロファイルに基づいてオーディオコンテンツを修正することとを行うためのコンピュータプログラムコードをさらに備える。
図は、単に例示の目的で様々な実施形態を示す。本明細書で説明される原理から逸脱することなく、本明細書で示される構造および方法の代替実施形態が採用され得ることを、当業者は以下の説明から容易に認識されよう。
システムが、ユーザのオーディオ体験を拡張するために、個人化されたオーディオコンテンツをユーザに提供する。ヘッドセットまたはスマートウォッチなど、ウェアラブルデバイスが、ユーザのためのオーディオ評価を行い得る。たとえば、ウェアラブルデバイスは、ユーザに、オーディオゲーム、聴覚学スクリーン(audiology screen)、リスニングテスト、瞬時環境評価、および体験後調査(post experience survey)を提示し得る。ウェアラブルデバイスは、音に応答した眼の視線の方向、ユーザが音に反応したかどうか、ユーザがオーディオコンテンツ中の音声を理解したかどうかなど、オーディオコンテンツに応答したユーザの挙動を監視し得る。システムは、オーディオプロファイルを作成し得る。オーディオプロファイルは、データベースに記憶され得る。たとえば、オーディオプロファイルは、ソーシャルネットワークのデータベースに記憶され、ユーザアカウントに関連付けられ得る。オーディオプロファイルは、特定のユーザが音を聞き、解釈するやり方を表すデータを含んでいることがある。ユーザに音を提示するシステムおよびアプリケーションが、ユーザのためのオーディオ体験を拡張するために、オーディオプロファイルにアクセスし、オーディオプロファイル中のデータに基づいてユーザに提示される音を修正し得る。たとえば、ユーザが10kHz~15kHzの間の周波数に対する聴覚過敏を有する場合、その周波数帯域における音の振幅がユーザのために減少され得る。
旧来の聴覚学的スクリーニング(audiological screening)が、純粋なトーン可聴性しきい値の理解を与えることができるが、そのような評価は、絶対的静寂において行われ、必ずしも、聴取者が実環境においてどのように知覚または実施するかに対する洞察を与えるとは限らない。本明細書で説明されるシステムおよび方法は、現実的なシナリオにおけるユーザの聴覚性能を監視および評価する。さらに、これらのルーチンは、一意の個々のオーディオプロファイルを生成するために、個人化された頭部伝達関数および身体伝達関数など、ユーザの身体的特性に関係する他の結果と組み合わせられ得る。オーディオプロファイルが確立されると、オーディオプロファイルは、ユーザのソーシャルネットワークプロファイルの一部として、アタッチされ、維持され得る。オーディオプロファイルは、ユーザの医学的データを保護するために、暗号化されるかまたはさもなければセキュアにされ得る。システムは、オーディオプロファイルを記憶するためのパーミッションについてユーザにプロンプトし得、システムは、ユーザが、誰がオーディオプロファイルにアクセスし得るかを選択することを可能にし得る。オーディオプロファイルは、ビデオ発呼、仮想現実ゲームおよびアプリケーション、拡張現実テレプレゼンス、リアルタイム音声拡張、リアルタイム雑音低減などを含む、ユーザのオーディオ体験のすべてにわたってオーディオを改善するためにアクセスされ得る。
本発明の実施形態は、人工現実システムを含むか、または人工現実システムに関連して実装され得る。人工現実は、ユーザへの提示の前に何らかの様式で調整された形式の現実であり、これは、たとえば、仮想現実(VR)、拡張現実(AR)、複合現実(MR)、ハイブリッド現実、あるいはそれらの何らかの組合せおよび/または派生物を含み得る。人工現実コンテンツは、完全に生成されたコンテンツ、またはキャプチャされた(たとえば、現実世界の)コンテンツと組み合わせられた生成されたコンテンツを含み得る。人工現実コンテンツは、ビデオ、オーディオ、触覚フィードバック、またはそれらの何らかの組合せを含み得、それらのいずれも、単一のチャネルまたは複数のチャネルにおいて提示され得る(観察者に3次元効果をもたらすステレオビデオなど)。さらに、いくつかの実施形態では、人工現実は、人工現実におけるコンテンツを作成するために使用される、および/または人工現実において別様に使用される、アプリケーション、製品、アクセサリ、サービス、またはそれらの何らかの組合せにも関連付けられ得る。人工現実コンテンツを提供する人工現実システムは、ホストコンピュータシステムに接続されたウェアラブルデバイス(たとえば、ヘッドセット)、独立型ウェアラブルデバイス(たとえば、ヘッドセット)、モバイルデバイスまたはコンピューティングシステム、あるいは、1人または複数の観察者に人工現実コンテンツを提供することが可能な任意の他のハードウェアプラットフォームを含む、様々なプラットフォーム上に実装され得る。
図1Aは、1つまたは複数の実施形態による、アイウェアデバイスとして実装されるヘッドセット100の斜視図である。いくつかの実施形態では、アイウェアデバイスは、ニアアイディスプレイ(NED)である。概して、ヘッドセット100は、コンテンツ(たとえば、メディアコンテンツ)が、ディスプレイアセンブリおよび/またはオーディオシステムを使用して提示されるように、ユーザの顔に装着され得る。しかしながら、ヘッドセット100はまた、メディアコンテンツが異なる様式でユーザに提示されるように使用され得る。ヘッドセット100によって提示されるメディアコンテンツの例は、1つまたは複数の画像、ビデオ、オーディオ、またはそれらの何らかの組合せを含む。ヘッドセット100は、フレームを含み、構成要素の中でも、1つまたは複数のディスプレイ要素120を含むディスプレイアセンブリと、深度カメラアセンブリ(DCA)と、オーディオシステムと、位置センサー190とを含み得る。図1Aは、ヘッドセット100上の例示的なロケーションにおけるヘッドセット100の構成要素を示すが、構成要素は、ヘッドセット100上の他の場所に、ヘッドセット100とペアリングされた周辺デバイス上に、またはそれらの何らかの組合せに、位置し得る。同様に、図1Aに示されているものよりも多いまたは少ない構成要素がヘッドセット100上にあり得る。
フレーム110は、ヘッドセット100の他の構成要素を保持する。フレーム110は、1つまたは複数のディスプレイ要素120を保持する前面部と、ユーザの頭部に付けるためのエンドピース(たとえば、テンプル)とを含む。フレーム110の前面部は、ユーザの鼻の上をまたいでいる。エンドピースの長さは、異なるユーザにフィットするように調整可能(たとえば、調整可能なテンプルの長さ)であり得る。エンドピースはまた、ユーザの耳の後ろ側で湾曲する部分(たとえば、テンプルの先端、イヤピース)を含み得る。
1つまたは複数のディスプレイ要素120は、ヘッドセット100を装着しているユーザに光を提供する。図示のように、ヘッドセットは、ユーザの各眼のためのディスプレイ要素120を含む。いくつかの実施形態では、ディスプレイ要素120は、ヘッドセット100のアイボックスに提供される画像光を生成する。アイボックスは、ヘッドセット100を装着している間にユーザの眼が占有する空間中のロケーションである。たとえば、ディスプレイ要素120は導波路ディスプレイであり得る。導波路ディスプレイは、光ソース(たとえば、2次元光ソース、1つまたは複数の線ソース、1つまたは複数の点ソースなど)と、1つまたは複数の導波路とを含む。光ソースからの光は、1つまたは複数の導波路中に内部結合され(in-coupled)、1つまたは複数の導波路は、ヘッドセット100のアイボックス中に瞳複製(pupil replication)があるような様式で光を出力する。1つまたは複数の導波路からの光の内部結合(in-coupling)および/または外部結合(outcoupling)が、1つまたは複数の回折格子を使用して行われ得る。いくつかの実施形態では、導波路ディスプレイは、光ソースからの光が1つまたは複数の導波路中に内部結合されるときにその光を走査する走査要素(たとえば、導波路、ミラーなど)を含む。いくつかの実施形態では、ディスプレイ要素120の一方または両方が不透明であり、ヘッドセット100の周りのローカルエリアからの光を透過しないことに留意されたい。ローカルエリアは、ヘッドセット100の周囲のエリアである。たとえば、ローカルエリアは、ヘッドセット100を装着しているユーザが中にいる部屋であり得、または、ヘッドセット100を装着しているユーザは外にいることがあり、ローカルエリアは外のエリアである。このコンテキストでは、ヘッドセット100はVRコンテンツを生成する。代替的に、いくつかの実施形態では、ARおよび/またはMRコンテンツを作り出すために、ローカルエリアからの光が1つまたは複数のディスプレイ要素からの光と組み合わせられ得るように、ディスプレイ要素120の一方または両方は少なくとも部分的に透明である。
いくつかの実施形態では、ディスプレイ要素120は、画像光を生成せず、代わりに、ローカルエリアからの光をアイボックスに透過するレンズである。たとえば、ディスプレイ要素120の一方または両方は、補正なしのレンズ(非処方)であるか、または、ユーザの視力の欠損を補正するのを助けるための処方レンズ(たとえば、単焦点、二焦点、および三焦点、または累進多焦点(progressive))であり得る。いくつかの実施形態では、ディスプレイ要素120は、太陽からユーザの眼を保護するために、偏光および/または色付けされ得る。
いくつかの実施形態では、ディスプレイ要素120は追加の光学ブロック(図示せず)を含み得ることに留意されたい。光学ブロックは、ディスプレイ要素120からの光をアイボックスに向ける1つまたは複数の光学要素(たとえば、レンズ、フレネルレンズなど)を含み得る。光学ブロックは、たとえば、画像コンテンツの一部または全部における収差を補正するか、画像の一部または全部を拡大するか、あるいはそれらの何らかの組合せを行い得る。
ディスプレイ要素120は、オーディオ評価ルーチンの一部としてコンテンツを表示し得る。たとえば、ディスプレイ要素120は、オーディオ評価ルーチン中に命令を表示するかまたはユーザにフィードバックを提供し得る。
DCAは、ヘッドセット100の周囲のローカルエリアの一部分についての深度情報を決定する。DCAは、1つまたは複数のイメージングデバイス130と、DCAコントローラ(図1Aに図示せず)とを含み、照明器140をも含み得る。いくつかの実施形態では、照明器140は、ローカルエリアの一部分を光で照明する。光は、たとえば、赤外線(IR)における構造化光(たとえば、ドットパターン、バーなど)、飛行時間についてのIRフラッシュなどであり得る。いくつかの実施形態では、1つまたは複数のイメージングデバイス130は、照明器140からの光を含むローカルエリアの一部分の画像をキャプチャする。図示のように、図1Aは、単一の照明器140と2つのイメージングデバイス130とを示す。代替実施形態では、照明器140がなく、少なくとも2つのイメージングデバイス130がある。
DCAコントローラは、キャプチャされた画像と1つまたは複数の深度決定技法とを使用して、ローカルエリアの一部分についての深度情報を算出する。深度決定技法は、たとえば、直接飛行時間(ToF)深度検知、間接ToF深度検知、構造化光、パッシブステレオ分析、アクティブステレオ分析(照明器140からの光によってシーンに追加されたテクスチャを使用する)、シーンの深度を決定するための何らかの他の技法、またはそれらの何らかの組合せであり得る。
DCAコントローラは、オーディオシステムと組み合わせて、ローカルシーンにおける1つまたは複数の音ソースのロケーションを決定し得る。DCAコントローラは、ローカルシーンにおけるオブジェクトのロケーションを提供し得る。DCAは、オーディオシステムにオブジェクトのロケーションを提供し得る。オーディオシステムは、DCAによって位置を特定されたオブジェクトの同じ方向から出る音ソースが、そのオブジェクトによって引き起こされ得ると決定し得る。オーディオシステムは、その後、オーディオ評価ルーチンとともに音ソースの決定されたロケーションを使用し得る。
オーディオシステムはオーディオコンテンツを提供する。オーディオシステムは、トランスデューサアレイと、センサーアレイと、オーディオコントローラ150とを含む。ただし、他の実施形態では、オーディオシステムは、異なるおよび/または追加の構成要素を含み得る。同様に、いくつかの場合には、オーディオシステムの構成要素に関して説明される機能性は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラの機能の一部または全部が、リモートサーバによって実施され得る。
オーディオシステムは、ユーザのためのオーディオ評価ルーチンを行い得る。オーディオ評価ルーチンは、オーディオシステムが、いくつかの周波数に対する聴覚過敏または老人性難聴、許容できる残響レベルなど、ユーザの聴覚の特性を表すパラメータを決定する一連のステップである。オーディオ評価ルーチンは、イメージングデバイス130、音響センサー180、または位置センサー190など、ヘッドセット100上の様々なセンサーを用いてユーザ応答を監視することを含み得る。オーディオシステムは、パラメータに基づいてユーザのためのオーディオプロファイルを作成する。オーディオプロファイルは、ユーザがどのように音を聞くかを表すパラメータのセットである。オーディオシステムは、ユーザに提示される音を修正するためにオーディオプロファイルを使用し得る。
トランスデューサアレイは、ユーザに音を提示する。トランスデューサアレイは、複数のトランスデューサを含む。トランスデューサは、スピーカー160または組織トランスデューサ170(たとえば、骨伝導トランスデューサまたは軟骨伝導トランスデューサ)であり得る。スピーカー160はフレーム110の外部に示されているが、スピーカー160はフレーム110に囲まれ得る。いくつかの実施形態では、各耳のための個々のスピーカーの代わりに、ヘッドセット100は、提示されたオーディオコンテンツの方向性を改善するためにフレーム110に組み込まれた複数のスピーカーを備えるスピーカーアレイを含む。組織トランスデューサ170は、ユーザの頭部に結合し、ユーザの組織(たとえば、骨または軟骨)を直接振動させて、音を生成する。トランスデューサの数および/またはロケーションは、図1Aに示されているものとは異なり得る。
センサーアレイは、ヘッドセット100のローカルエリア内の音を検出する。センサーアレイは、複数の音響センサー180を含む。音響センサー180は、ローカルエリア(たとえば、部屋)中の1つまたは複数の音ソースから発せられた音をキャプチャする。各音響センサーは、音を検出し、検出された音を電子フォーマット(アナログまたはデジタル)に変換するように構成される。音響センサー180は、音響波センサー、マイクロフォン、音トランスデューサ、または音を検出するのに好適である同様のセンサーであり得る。
いくつかの実施形態では、1つまたは複数の音響センサー180は、各耳の耳道中に置かれ得る(たとえば、バイノーラルマイクロフォンとして働く)。いくつかの実施形態では、音響センサー180は、ヘッドセット100の外面上に置かれるか、ヘッドセット100の内面上に置かれるか、ヘッドセット100とは別個(たとえば、何らかの他のデバイスの一部)であるか、またはそれらの何らかの組合せであり得る。音響センサー180の数および/またはロケーションは、図1Aに示されているものとは異なり得る。たとえば、収集されたオーディオ情報の量ならびにその情報の感度および/または精度を増加させるために、音響検出ロケーションの数が増加され得る。音響検出ロケーションは、マイクロフォンが、ヘッドセット100を装着しているユーザの周囲の広範囲の方向における音を検出することが可能であるように、配向され得る。
オーディオコントローラ150は、センサーアレイによって検出された音を表す、センサーアレイからの情報を処理する。オーディオコントローラ150は、プロセッサとコンピュータ可読記憶媒体とを備え得る。オーディオコントローラ150は、到来方向(DOA)推定値を生成するか、音響伝達関数(たとえば、アレイ伝達関数および/または頭部伝達関数)を生成するか、音ソースのロケーションを追跡するか、音ソースの方向にビームを形成するか、音ソースを分類するか、スピーカー160のための音フィルタを生成するか、またはそれらの何らかの組合せを行うように構成され得る。
位置センサー190は、ヘッドセット100の運動に応答して1つまたは複数の測定信号を生成する。位置センサー190は、ヘッドセット100のフレーム110の一部分に位置し得る。位置センサー190は、慣性測定ユニット(IMU)を含み得る。位置センサー190の例は、1つまたは複数の加速度計、1つまたは複数のジャイロスコープ、1つまたは複数の磁力計、運動を検出する別の好適なタイプのセンサー、IMUの誤差補正のために使用されるタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー190は、IMUの外部に、IMUの内部に、またはそれらの何らかの組合せで位置し得る。
いくつかの実施形態では、ヘッドセット100は、ヘッドセット100の位置のための同時位置特定およびマッピング(SLAM)と、ローカルエリアのモデルの更新とを提供し得る。たとえば、ヘッドセット100は、カラー画像データを生成するパッシブカメラアセンブリ(PCA)を含み得る。PCAは、ローカルエリアの一部または全部の画像をキャプチャする1つまたは複数のRGBカメラを含み得る。いくつかの実施形態では、DCAのイメージングデバイス130の一部または全部が、PCAとしても機能し得る。PCAによってキャプチャされた画像と、DCAによって決定された深度情報とは、ローカルエリアのパラメータを決定するか、ローカルエリアのモデルを生成するか、ローカルエリアのモデルを更新するか、またはそれらの何らかの組合せを行うために使用され得る。さらに、位置センサー190は、部屋内のヘッドセット100の位置(たとえば、ロケーションおよび姿勢)を追跡する。ヘッドセット100の構成要素に関する追加の詳細は、図4に関して以下で説明される。
ヘッドセット100は、視標追跡ユニット195を備える。視標追跡ユニット195は、ユーザの眼の画像をキャプチャする1つまたはカメラを含み得る。視標追跡ユニット195は、ユーザの眼を照明する1つまたは複数の照明器をさらに備え得る。視標追跡ユニット195は、ユーザの1つまたは複数の眼の角配向を推定する。いくつかの実施形態では、視標追跡ユニット195は、ユーザの眼の角配向を決定するために、照明器によって投影された照明パターンにおけるひずみを検出し得る。眼の配向は、ヘッドセット100内のユーザの視線の方向に対応する。ユーザの眼の配向は、中心窩(受光体が最も集中する眼の網膜上のエリア)と眼の瞳孔の中心との間の軸である、中心窩軸の方向であり得る。概して、ユーザの眼がある点上に固定されるとき、ユーザの眼の中心窩軸は、その点と交差する。瞳孔軸は、角膜表面に垂直である瞳孔の中心を通過する軸として定義される眼の別の軸である。瞳孔軸は、概して、中心窩軸と直接整合しない。両方の軸は、瞳孔の中心において交差するが、中心窩軸の配向は、瞳孔軸から横方向に約-1°から8°、および垂直方向に±4°だけずれている。中心窩軸が、眼の背面にある中心窩に従って定義されるので、中心窩軸は、いくつかの視標追跡実施形態では直接検出することが困難または不可能であり得る。したがって、いくつかの実施形態では、瞳孔軸の配向が検出され、中心窩軸は、検出された瞳孔軸に基づいて推定される。しかしながら、いくつかの実施形態では、瞳孔軸の配向が、中心窩軸差について調整することなしにユーザの1つまたは複数の眼の角配向を推定するために使用され得る。
概して、眼の移動が、眼の角回転だけでなく、眼の並進、眼のねじれの変化、および/または眼の形状の変化にも対応する。視標追跡ユニット195は、眼の並進、すなわち、眼窩に対する眼の位置の変化をも検出し得る。いくつかの実施形態では、眼の並進は、直接検出されないが、検出された角配向からのマッピングに基づいて近似される。視標追跡ユニットの検出構成要素に対する眼の位置の変化に対応する眼の並進も検出され得る。このタイプの並進は、たとえば、ユーザの頭部上のヘッドセット100の位置のシフトにより生じ得る。視標追跡ユニット195は、眼のねじれ、すなわち、瞳孔軸を中心とする眼の回転をも検出し得る。視標追跡ユニット195は、瞳孔軸から中心窩軸の配向を推定するために、眼の検出されたねじれを使用し得る。視標追跡ユニット195は、眼の形状の変化をも追跡し得、これは、スキューまたはスケーリング線形変換あるいは(たとえば、ねじれ変形による)ねじりひずみとして近似され得る。視標追跡ユニット195は、瞳孔軸の角配向、眼の並進、眼のねじれ、および眼の現在の形状の何らかの組合せに基づいて中心窩軸を推定し得る。
いくつかの実施形態では、視標追跡ユニット195は、眼の全部または一部分の上に構造化光パターンを投影する少なくとも1つのエミッタを含み得る。次いで、このパターンは、次いで、眼の形状上に投影され、これは、オフセット角から見られたとき、構造化光パターンにおける知覚されるひずみを作り出し得る。視標追跡ユニット195は、眼上に投影された光パターンの(もしあれば)ひずみを検出する少なくとも1つのカメラをも含み得る。エミッタとは異なる軸上に配向されたカメラが、眼上の照明パターンをキャプチャする。このプロセスは、本明細書では眼を「走査する」こととして示される。眼の表面上の照明パターンの変形を検出することによって、視標追跡ユニット195は、走査された眼の部分の形状を決定することができる。したがって、キャプチャされたひずんだ光パターンは、眼の照明された部分の3D形状を示す。エミッタによって照明された眼の部分の3D形状を導出することによって、眼の配向が導出され得る。視標追跡ユニットは、カメラによってキャプチャされた照明パターンの画像に基づいて、瞳孔軸、眼の並進、眼のねじれ、および眼の現在の形状を推定することもできる。
他の実施形態では、任意の好適なタイプの視標追跡システムが利用され得る。たとえば、視標追跡ユニット195は、眼の画像をキャプチャし、眼のステレオ画像をキャプチャし得、連続して光を放出する眼の周りのLEDのリングを利用し、LEDからの反射に基づいて眼の配向を決定し得、飛行時間測定値を利用し得る、などである。
配向は、ユーザの両方の眼について決定され得るので、視標追跡ユニット195は、ユーザがどこを見ているかを決定することが可能である。ヘッドセット100は、たとえば、ユーザの瞳孔間距離(IPD)を決定するために、視線方向を決定するために、深度キューを導入する(たとえば、ユーザの主要な見通し線の外部の画像を不鮮明にする)ために、VRメディアにおけるユーザ対話に対するヒューリスティック(たとえば、さらされた刺激に応じた特定の対象、オブジェクト、またはフレームに費やされた時間)を収集するために、ユーザの眼のうちの少なくとも1つの配向に部分的に基づく何らかの他の機能、あるいはそれらの何らかの組合せのために、眼の配向を使用することができる。ユーザの視線の方向を決定することは、ユーザの左および右の眼の決定された配向に基づいて集束点を決定することを含み得る。集束点は、ユーザの眼の2つの中心窩軸が交差する点(または2つの軸間の最も近い点)であり得る。ユーザの視線の方向は、集束点を通る、およびユーザの眼の瞳孔間の中間の点を通る線の方向であり得る。ヘッドセット100の構成要素に関する追加の詳細は、図4に関して以下で説明される。
オーディオシステムは、ユーザのためのオーディオプロファイルを生成する。オーディオシステムは、音に対するユーザ応答を監視する。視標追跡ユニット195は、音に応答したユーザの眼の視線ロケーションを検出する。オーディオシステムは、視線ロケーションと音ソースロケーションとの間の差など、ユーザ応答に基づく音についての様々なパラメータの精度を測定する。オーディオシステムは、拡張されたオーディオコンテンツをユーザにその後提示するために、オーディオプロファイルを使用する。オーディオ拡張プロセスは、図2~図4を参照しながらさらに説明される。
図1Bは、1つまたは複数の実施形態による、HMDとして実装されるヘッドセット105の斜視図である。ARシステムおよび/またはMRシステムについて説明する実施形態では、HMDの前側の部分は、可視帯域(約380nm~750nm)内で少なくとも部分的に透明であり、HMDの前側とユーザの眼との間にあるHMDの部分は、少なくとも部分的に透明である(たとえば、部分的に透明な電子ディスプレイ)。HMDは、前面剛体115とバンド175とを含む。ヘッドセット105は、図1Aを参照しながら上記で説明された同じ構成要素の多くを含むが、HMDフォームファクタと一体化するように修正される。たとえば、HMDは、ディスプレイアセンブリと、DCAと、オーディオシステムと、位置センサー190とを含む。図1Bは、照明器140と、複数のスピーカー160と、複数のイメージングデバイス130と、複数の音響センサー180と、位置センサー190とを示す。スピーカー160は、(図示のように)バンド175に結合される、前面剛体115に結合されるなど、様々なロケーションにあり得、またはユーザの耳道内に挿入されるように構成され得る。
図2は、1つまたは複数の実施形態による、オーディオシステム200のブロック図である。図1Aまたは図1B中のオーディオシステムは、オーディオシステム200の一実施形態であり得る。オーディオシステム200は、ユーザのためのカスタムオーディオプロファイルを生成する。オーディオシステム200は、次いで、ユーザのためのオーディオコンテンツを生成するためにオーディオプロファイルを使用し得る。図2の実施形態では、オーディオシステム200は、トランスデューサアレイ210と、センサーアレイ220と、オーディオコントローラ230とを含む。オーディオシステム200のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。
トランスデューサアレイ210は、オーディオコンテンツを提示するように構成される。トランスデューサアレイ210は、複数のトランスデューサを含む。トランスデューサは、オーディオコンテンツを提供するデバイスである。トランスデューサは、たとえば、スピーカー(たとえば、スピーカー160)、組織トランスデューサ(たとえば、組織トランスデューサ170)、オーディオコンテンツを提供する何らかの他のデバイス、またはそれらの何らかの組合せであり得る。組織トランスデューサは、骨伝導トランスデューサまたは軟骨伝導トランスデューサとして機能するように構成され得る。トランスデューサアレイ210は、空気伝導を介して(たとえば、1つまたは複数のスピーカーを介して)、骨伝導を介して(1つまたは複数の骨伝導トランスデューサを介して)、軟骨伝導オーディオシステムを介して(1つまたは複数の軟骨伝導トランスデューサを介して)、またはそれらの何らかの組合せでオーディオコンテンツを提示し得る。いくつかの実施形態では、トランスデューサアレイ210は、周波数範囲の異なる部分をカバーするための1つまたは複数のトランスデューサを含み得る。たとえば、周波数範囲の第1の部分をカバーするために圧電トランスデューサが使用され得、周波数範囲の第2の部分をカバーするために可動コイルトランスデューサが使用され得る。
骨伝導トランスデューサは、ユーザの頭部における骨/組織を振動させることによって音響圧力波を生成する。骨伝導トランスデューサは、ヘッドセットの一部分に結合され得、耳介の後ろでユーザの頭蓋骨の一部分に結合されるように構成され得る。骨伝導トランスデューサは、オーディオコントローラ230から振動命令を受信し、受信された命令に基づいてユーザの頭蓋骨の一部分を振動させる。骨伝導トランスデューサからの振動は、鼓膜を迂回して、ユーザの蝸牛のほうへ伝搬する組織伝搬音響圧力波を生成する。
軟骨伝導トランスデューサは、ユーザの耳の耳介軟骨の1つまたは複数の部分を振動させることによって音響圧力波を生成する。軟骨伝導トランスデューサは、ヘッドセットの一部分に結合され得、耳の耳介軟骨の1つまたは複数の部分に結合されるように構成され得る。たとえば、軟骨伝導トランスデューサは、ユーザの耳の耳介の背面に結合し得る。軟骨伝導トランスデューサは、外耳の周りの耳介軟骨に沿ったどこか(たとえば、耳介、耳珠、耳介軟骨の何らかの他の部分、またはそれらの何らかの組合せ)に位置し得る。耳介軟骨の1つまたは複数の部分を振動させることは、耳道外の空気伝搬音響圧力波、耳道のいくつかの部分を振動させ、それにより、耳道内に空気伝搬音響圧力波を生成させる、組織伝搬音響圧力波、またはそれらの何らかの組合せを生成し得る。生成された空気伝搬音響圧力波は、耳道に沿って鼓膜のほうへ伝搬する。
トランスデューサアレイ210は、オーディオコントローラ230からの命令に従ってオーディオコンテンツを生成する。オーディオコンテンツは、オーディオ評価ルーチンとともに生成され得る。いくつかの実施形態では、オーディオコンテンツが空間化される。空間化されたオーディオコンテンツは、特定の方向および/またはターゲット領域(たとえば、ローカルエリアにおけるオブジェクトおよび/または仮想オブジェクト)から発生するように思われるオーディオコンテンツである。たとえば、空間化されたオーディオコンテンツは、オーディオシステム200のユーザから部屋の向こうの仮想歌手から音が発生しているように思わせることができる。トランスデューサアレイ210は、ウェアラブルデバイス(たとえば、ヘッドセット100またはヘッドセット105)に結合され得る。代替実施形態では、トランスデューサアレイ210は、ウェアラブルデバイスとは別個である(たとえば、外部コンソールに結合された)複数のスピーカーであり得る。
センサーアレイ220は、センサーアレイ220の周囲のローカルエリア内の音を検出する。センサーアレイ220は、各々音波の空気圧力変動を検出し、検出された音を電子フォーマット(アナログまたはデジタル)に変換する、複数の音響センサーを含み得る。複数の音響センサーは、ヘッドセット(たとえば、ヘッドセット100および/またはヘッドセット105)上に、ユーザ上に(たとえば、ユーザの耳道中に)、ネックバンド上に、またはそれらの何らかの組合せで配置され得る。音響センサーは、たとえば、マイクロフォン、振動センサー、加速度計、またはそれらの任意の組合せであり得る。いくつかの実施形態では、センサーアレイ220は、複数の音響センサーのうちの少なくともいくつかを使用して、トランスデューサアレイ210によって生成されたオーディオコンテンツを監視するように構成される。センサーの数を増加させることは、トランスデューサアレイ210によって作り出された音場および/またはローカルエリアからの音を表す情報(たとえば、方向性)の精度を改善し得る。
オーディオコントローラ230は、オーディオシステム200の動作を制御する。図2の実施形態では、オーディオコントローラ230は、データストア235と、DOA推定モジュール240と、伝達関数モジュール250と、追跡モジュール260と、ビームフォーミングモジュール270と、音フィルタモジュール280と、個人化モジュール290とを含む。オーディオコントローラ230は、ヘッドセットなど、ウェアラブルデバイス内に位置し得る。オーディオコントローラ230のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラのいくつかの機能が、ヘッドセットの外部で実施され得る。
データストア235は、オーディオシステム200による使用のためのデータを記憶する。データストア235中のデータは、オーディオシステム200のローカルエリアにおいて録音された音、オーディオコンテンツ、頭部伝達関数(HRTF)、1つまたは複数のセンサーのための伝達関数、音響センサーのうちの1つまたは複数のためのアレイ伝達関数(ATF)、音ソースロケーション、ローカルエリアの仮想モデル、到来方向推定値、音フィルタ、およびオーディオシステム200による使用のために関連する他のデータ、またはそれらの任意の組合せを含み得る。データストア235は、1つまたは複数のユーザのためのオーディオプロファイル、オーディオ評価ルーチンのための命令、オーディオ評価ルーチンのためのユーザ応答データなどを含み得る。
DOA推定モジュール240は、センサーアレイ220からの情報に部分的に基づいて、ローカルエリアにおける音ソースの位置を特定するように構成される。位置特定は、オーディオシステム200のユーザに対して音ソースがどこに位置するかを決定するプロセスである。DOA推定モジュール240は、ローカルエリア内の1つまたは複数の音ソースの位置を特定するためにDOA分析を実施する。DOA分析は、音が発生した方向を決定するために、センサーアレイ220において、各音の強度、スペクトル、および/または到来時間を分析することを含み得る。いくつかの場合には、DOA分析は、オーディオシステム200が位置する周囲音響環境を分析するための任意の好適なアルゴリズムを含み得る。
たとえば、DOA分析は、センサーアレイ220から入力信号を受信し、入力信号にデジタル信号処理アルゴリズムを適用して、到来方向を推定するように設計され得る。これらのアルゴリズムは、たとえば、入力信号がサンプリングされ、サンプリングされた信号の得られた重み付けおよび遅延されたバージョンが、DOAを決定するために一緒に平均化される、遅延和アルゴリズムを含み得る。適応フィルタを作成するために、最小2乗平均(LMS:least mean squared)アルゴリズムも実装され得る。この適応フィルタは、次いで、たとえば信号強度の差、または到来時間の差を識別するために使用され得る。これらの差は、次いで、DOAを推定するために使用され得る。別の実施形態では、DOAは、入力信号を周波数ドメインに変換し、処理すべき時間周波数(TF)ドメイン内の特定のビンを選択することによって決定され得る。各選択されたTFビンは、そのビンが、直接経路オーディオ信号をもつオーディオスペクトルの一部分を含むかどうかを決定するために、処理され得る。直接経路信号の一部分を有するビンは、次いで、センサーアレイ220が直接経路オーディオ信号を受信した角度を識別するために、分析され得る。決定された角度は、次いで、受信された入力信号についてのDOAを識別するために使用され得る。上記に記載されていない他のアルゴリズムも、DOAを決定するために、単独でまたは上記のアルゴリズムと組み合わせて使用され得る。
いくつかの実施形態では、DOA推定モジュール240は、ローカルエリア内のオーディオシステム200の絶対位置に関するDOAをも決定し得る。センサーアレイ220の位置は、外部システム(たとえば、ヘッドセット、人工現実コンソール、マッピングサーバ、位置センサー(たとえば、位置センサー190)などの何らかの他の構成要素)から受信され得る。外部システムは、ローカルエリアとオーディオシステム200の位置とがマッピングされる、ローカルエリアの仮想モデルを作成し得る。受信された位置情報は、オーディオシステム200の一部または全部(たとえば、センサーアレイ220)のロケーションおよび/または配向を含み得る。DOA推定モジュール240は、受信された位置情報に基づいて、推定されたDOAを更新し得る。
伝達関数モジュール250は、1つまたは複数の音響伝達関数を生成するように構成される。概して、伝達関数は、各可能な入力値についての対応する出力値を与える数学関数である。検出された音のパラメータに基づいて、伝達関数モジュール250は、オーディオシステムに関連付けられた1つまたは複数の音響伝達関数を生成する。音響伝達関数は、アレイ伝達関数(ATF)、頭部伝達関数(HRTF)、他のタイプの音響伝達関数、またはそれらの何らかの組合せであり得る。ATFは、マイクロフォンが空間中の点からどのように音を受信するかを特徴づける。
ATFは、音ソースとセンサーアレイ220中の音響センサーによって受信された対応する音との間の関係を特徴づけるいくつかの伝達関数を含む。したがって、音ソースについて、センサーアレイ220中の音響センサーの各々についての対応する伝達関数がある。また、まとめて、伝達関数のセットはATFと呼ばれる。したがって、各音ソースについて、対応するATFがある。音ソースは、たとえば、ローカルエリアにおける音を生成する誰かまたは何か、ユーザ、あるいはトランスデューサアレイ210の1つまたは複数のトランスデューサであり得ることに留意されたい。センサーアレイ220に対する特定の音ソースロケーションについてのATFは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造(たとえば、耳形状、肩など)により、ユーザによって異なり得る。したがって、センサーアレイ220のATFは、オーディオシステム200の各ユーザのために個人化される。
いくつかの実施形態では、伝達関数モジュール250は、オーディオシステム200のユーザのための1つまたは複数のHRTFを決定する。HRTFは、耳が空間中の点からどのように音を受信するかを特徴づける。人に対する特定のソースロケーションについてのHRTFは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造(たとえば、耳形状、肩など)により、人の各耳に固有である(および人に固有である)。いくつかの実施形態では、伝達関数モジュール250は、較正プロセスを使用してユーザのためのHRTFを決定し得る。
いくつかの実施形態では、伝達関数モジュール250は、ユーザのためのオーディオプロファイル中のオーディオ評価データと組み合わせられるべき、ATFおよびHRTFを個人化モジュール290に提供し得る。
追跡モジュール260は、1つまたは複数の音ソースのロケーションを追跡するように構成される。追跡モジュール260は、現在のDOA推定値を比較し、それらを、前のDOA推定値の記憶された履歴と比較し得る。いくつかの実施形態では、オーディオシステム200は、1秒当たり1回、または1ミリ秒当たり1回など、周期的スケジュールでDOA推定値を再計算し得る。追跡モジュールは、現在のDOA推定値を前のDOA推定値と比較し得、音ソースについてのDOA推定値の変化に応答して、追跡モジュール260は、音ソースが移動したと決定し得る。いくつかの実施形態では、追跡モジュール260は、ヘッドセットまたは何らかの他の外部ソースから受信された視覚情報に基づいてロケーションの変化を検出し得る。追跡モジュール260は、経時的に1つまたは複数の音ソースの移動を追跡し得る。追跡モジュール260は、各時点において音ソースの数と各音ソースのロケーションとについての値を記憶し得る。音ソースの数またはロケーションの値の変化に応答して、追跡モジュール260は、音ソースが移動したと決定し得る。追跡モジュール260は、位置特定分散(localization variance)の推定値を計算し得る。位置特定分散は、移動の変化の各決定についての信頼性レベルとして使用され得る。
ビームフォーミングモジュール270は、あるエリア内の音ソースからの音を選択的に強調するが、他のエリアからの音を強調しないように、1つまたは複数のATFを処理するように構成される。センサーアレイ220によって検出された音を分析する際に、ビームフォーミングモジュール270は、ローカルエリアの特定の領域からの関連付けられた音を強調するが、領域の外側からのものである音を強調しないために、異なる音響センサーからの情報を組み合わせ得る。ビームフォーミングモジュール270は、たとえば、DOA推定モジュール240および追跡モジュール260からの異なるDOA推定値に基づいて、ローカルエリアにおける他の音ソースから、特定の音ソースからの音に関連付けられたオーディオ信号を分離し得る。したがって、ビームフォーミングモジュール270は、ローカルエリアにおける個別の音ソースを選択的に分析し得る。いくつかの実施形態では、ビームフォーミングモジュール270は、音ソースからの信号を拡張し得る。たとえば、ビームフォーミングモジュール270は、いくつかの周波数を上回る信号、それらを下回る信号、またはそれらの間の信号を除去する、音フィルタを適用し得る。信号拡張は、センサーアレイ220によって検出された他の音に対して所与の識別された音ソースに関連付けられた音を拡張するように働く。いくつかの実施形態では、個人化モジュール290から受信されたパラメータに基づいて、ビームフォーミングモジュール270は、ユーザの推定された音声理解またはリスニングの取り組みに従って、雑音が多い環境におけるビームの幅または挙動を調整し得る。
音フィルタモジュール280は、トランスデューサアレイ210のための音フィルタを決定する。いくつかの実施形態では、音フィルタは、オーディオコンテンツがターゲット領域から発生するように思われるように、オーディオコンテンツが空間化されることを引き起こす。音フィルタモジュール280は、音フィルタを生成するためにHRTFおよび/または音響パラメータを使用し得る。音響パラメータは、ローカルエリアの音響プロパティを表す。音響パラメータは、たとえば、残響時間、残響レベル、室内インパルス応答などを含み得る。いくつかの実施形態では、音フィルタモジュール280は、音響パラメータのうちの1つまたは複数を計算する。いくつかの実施形態では、音フィルタモジュール280は、(たとえば、図4に関して以下で説明されるように)マッピングサーバに音響パラメータを要求する。
音フィルタモジュール280は、トランスデューサアレイ210に音フィルタを提供する。いくつかの実施形態では、音フィルタは、周波数に応じて音の正または負の増幅を引き起こし得る。たとえば、個人化モジュール290から受信されたパラメータに基づいて、音フィルタモジュール280は、ユーザが他の周波数ほど容易に検出しないいくつかの周波数における音を増幅し得る。
個人化モジュール290は、ユーザのためのオーディオプロファイルを生成する。オーディオプロファイルは、ユーザがどのように音を知覚するかを表す。オーディオプロファイルは、ユーザのためのオーディオ体験を拡張するために音がどのようにユーザに提示されるべきであるかを表すパラメータを含んでいる。パラメータは、音についての利得および限界を含み得る。たとえば、パラメータは、85dB音圧レベルの最大限界まで、10kHz~15kHzの間の周波数帯域について6dBの利得を示し得、したがって、オーディオシステムは、その周波数帯域における音の振幅を6dBだけ増加させる。
いくつかの実施形態では、パラメータは、他の周波数に対して、いくつかの周波数の振幅が増加されるべきであること、またはいくつかの周波数の振幅が減少されるべきであることを示すスケーリングファクタを含み得る(たとえば、10kHz~15kHzの間の周波数帯域についての1.2のスケーリングファクタが、オーディオシステムがその周波数帯域における音の振幅を20%だけ増加させるべきであることを示し得る)。パラメータは、音声がユーザに理解できることを可能にする環境についての残響の最大レベルを示し得る。パラメータは、ユーザの推定された音声理解またはリスニングの取り組みに従う、雑音が多い環境における、幅または動的挙動など、ビームフォーマ調整を表し得る。パラメータは、マスキングからの空間的解除を助けるために音ソース分離の人工誇張を提供し得る。パラメータは、ユーザの聴覚に適合された利得および圧縮構造を提供し得る。パラメータは、周波数をシフトすることによってなど、他の話者の音をどのように拡張するかを表し得、これは、ユーザが話者をより良く理解することを可能にする。音パラメータは、音位置特定能力、マスキングからの空間的解除の大きさ、両耳マスキングレベル差、異なるタイプの背景雑音のための雑音中音声しきい値(speech in noise threshold)、またはユーザのためのオーディオ品質を増加させ得る任意の他の好適なパラメータを含み得る。
オーディオシステム200は、ユーザのための拡張されたオーディオ体験を提供するために、オーディオファイル中のパラメータに従ってユーザに提示される音を修正する。たとえば、オーディオプロファイル中のパラメータは、オーディオシステムが、ユーザに提示されるいくつかの周波数の振幅を増加または減少させるべきであることを示し得る。
ユーザのためのオーディオプロファイルを生成するために、個人化モジュール290は、ユーザのためのアクティブおよび/またはパッシブオーディオ評価を行う。たとえば、個人化モジュール290は、ユーザに、オーディオゲーム、聴覚学スクリーン、リスニングテスト、瞬時環境評価、および体験後調査を提示し得る。
オーディオ評価は、オーディオ評価ルーチンを含み得る。オーディオ評価ルーチンは、オーディオシステムが、いくつかの周波数に対する聴覚過敏または老人性難聴、許容できる残響レベルなど、ユーザの聴覚の特性を表すパラメータを決定する一連のステップである。たとえば、オーディオ評価ルーチンは、旧来の聴覚学、雑音中音声テスト(speech in noise test)、オーディオゲーム、空間分解能テスト、リスニングの取り組み、位置特定精度、性能監視、および体験後調査を含む、明示的リスニングテストルーチンを含み得る。オーディオ評価ルーチンは、オーディオ評価ルーチンに対するユーザの応答を表すオーディオ評価データを生じる。たとえば、オーディオ評価データは、ユーザが音に反応したかどうかを示すバイナリデータ、ユーザが異なる雑音環境における音声をどのくらい良く理解したかを示す精度値、音ソースのほうへの配向移動の持続時間および滑らかさ、前面/背面混乱の比率、位置特定誤り、最小可聴角度、両耳マスキングレベル差の程度などを含み得る。
個人化モジュール290は、オーディオプロファイルにオーディオ評価データを記憶する。いくつかの実施形態では、オーディオプロファイルは、データストア235になど、ウェアラブルデバイスにローカルに記憶され得る。いくつかの実施形態では、個人化モジュール290は、評価データまたはオーディオプロファイルを、ソーシャルネットワーキングシステムなど、外部システムに送信し得る。個人化モジュール290は、追加の評価データがキャプチャされたとき、オーディオプロファイルを継続的に更新し得る。
いくつかの実施形態では、個人化モジュール290は、オーディオ評価ルーチンの一部としてユーザから知覚フィードバックを取得する。知覚フィードバックは、ユーザが音に応答したかどうか、ユーザがオーディオコンテンツ中の音声を理解したかどうかを示すか、または合成音の知覚されたロケーションを示し得る。いくつかの実施形態では、知覚フィードバックは、ユーザが視線方向から出る音を知覚したことを示す、ユーザの眼の視線方向を含み得る。知覚フィードバックは、「前面」、「背面」、「左」、または「右」など、ユーザからの話された応答、あるいはユーザに提示されるフレーズのユーザによる繰り返しを含み得る。知覚フィードバックは、ユーザが自身の頭部の向きを変えることまたはある方向に手を向けることなど、ユーザによる移動を含み得る。
個人化モジュール290は、ユーザからアクティブおよびパッシブ応答をキャプチャする。応答は、マイクロフォン、手追跡、コントローラ、瞳孔測定、脳波記録(EEG)、電気皮膚反応(GSR)、視標追跡モジュールを介して、グローブからの触覚フィードバックによって、IMUなどのヘッドセットの運動をキャプチャする位置センサーによってなど、ヘッドセット上の任意のセンサーによってキャプチャされ得る。いくつかの実施形態では、知覚フィードバックは、ヘッドセットまたはユーザの位置を検出するカメラによってなど、外部センサーによってキャプチャされ得る。
いくつかの実施形態では、知覚フィードバックは、アクティブ評価ルーチンにおいて取得され得る。たとえば、ヘッドセットは、オーディオ評価が行われていることをユーザに通知し得、ヘッドセットは、フレーズを繰り返すかまたは音の方向を見るためのなど、アクションを実施するためのオーディオおよび/または視覚命令を提供し得る。
いくつかの実施形態では、知覚フィードバックは、オーディオ評価が行われていることにユーザが気づいていないことがある、パッシブ評価ルーチンにおいて取得され得る。たとえば、ユーザは、仮想現実ゲームに参加しているなど、ヘッドセットと対話していることがあり、個人化モジュール290は、仮想現実ゲームの最中に音に対するユーザ応答を監視し得る。
個人化モジュール290は、オーディオ評価ルーチンにおける各音ソースについての知覚フィードバックを、音ソースの1つまたは複数のプロパティと比較する。1つまたは複数の音ソースが、オーディオ評価ルーチンのためにオーディオシステムによって生成され得る。オーディオシステムによって生成された音ソースは、知られているプロパティを有し得る。1つまたは複数の音ソースが、ローカルエリアにおけるオブジェクトまたは人々によって生成され得る。オーディオシステムは、ロケーションを追跡することおよび周波数を測定することなど、音ソースについてのプロパティを決定することを行い、ユーザ応答を、測定されたプロパティと比較し得る。音ソースのプロパティは、ロケーション、振幅、周波数、音声中のワードなどを含み得る。
個人化モジュール290は、各音ソースの1つまたは複数のプロパティについての精度値を決定し得る。たとえば、個人化モジュール290は、1~10の間のスカラー精度値を割り当て得、10が、音ソースに対する極めて正確なユーザ応答を示す。各音ソースは、各プロパティについての精度値を含み得る。たとえば、音ソースについての第1の精度値が、ユーザがフレーズ中のワードをどのくらい良く理解したかを示し得、第2の精度値が、音ソースのユーザの知覚したロケーションと、音ソースの実際のまたは意図されたロケーションとの差を示し得る。
個人化モジュール290は、オーディオプロファイルを作成するために、オーディオ評価の結果を分析する。いくつかの実施形態では、個人化モジュール290は、ヘッドセット上でローカルに結果を分析する。いくつかの実施形態では、個人化モジュール290は、結果を外部システムに送信し、外部システムは、オーディオプロファイルを生成する。
オーディオプロファイルは、ユーザのための正または負の評価データに関連付けられた環境条件を表し得る。たとえば、環境条件は、部屋またはローカルエリアの幾何学的条件、GPS座標、時刻、話されている言語、信号対雑音比、残響、背景雑音特性などを含み得る。オーディオプロファイルは、ユーザが、特定の環境条件における音声を理解することが可能であったのか不可能であったのかを示し得る。
さらに、オーディオプロファイルは、カスタマイズされたオーディオプロファイルを生成するために、個人化されたHRTFおよび身体伝達関数など、聴覚に影響を及ぼすユーザの身体的特性に関係する結果を含み得る。身体的データは、ユーザの頭部、耳、および胴の形状を表し得る。身体的データは、ウェアラブルデバイスによってキャプチャされたユーザのピクチャから取得されるか、または、ソーシャルネットワーキングシステムからなど、データベースから取り出され得る。オーディオプロファイルは、形状に部分的に基づいて生成されたHRTFを含み得る。オーディオプロファイルは、ユーザのための音の後での提示のための命令を提供するために、オーディオ評価データとともにHRTFを使用し得る。たとえば、特定の角度における音ソースについてのHRTFが、いくつかの周波数を、他の周波数よりも多く減衰させ得、これは、ユーザにとって不可聴な周波数を潜在的にレンダリングし得る。しかしながら、オーディオ評価データに基づいて、オーディオプロファイルは、周波数が、ユーザにとって可聴であるdBレベルまで増加されるべきであることを示し得る。したがって、HRTFをオーディオ評価データと組み合わせることによって、オーディオプロファイルは、ユーザのオーディオ体験を改善するためのパラメータの完全なセットを含んでいることがある。
いくつかの実施形態では、個人化モジュール290は、オーディオプロファイルを、データストア235になど、ヘッドセットにローカルに記憶し得る。いくつかの実施形態では、個人化モジュール290は、オーディオプロファイルを外部システムに送信し得、外部システムは、オーディオプロファイルをデータベースに記憶し得る。たとえば、オーディオプロファイルは、ソーシャルネットワークのデータベースに記憶され、ユーザアカウントに関連付けられ得る。
オーディオコントローラ230が、ユーザにオーディオコンテンツを提示することを決定したことに応答して、オーディオコントローラ230は、オーディオプロファイル中のパラメータについて個人化モジュール290に照会する。個人化モジュール290は、データストア235に照会することによって、または外部システムに照会することによってなど、ユーザのためのオーディオプロファイルを取り出す。
個人化モジュール290は、ユーザに提示される音を修正するためにオーディオプロファイルを使用する。オーディオプロファイルを使用することは、ビデオ発呼、仮想現実ゲームおよびアプリケーション、拡張現実テレプレゼンス、リアルタイム音声拡張、リアルタイム雑音低減などを含む、ユーザのオーディオ体験のすべてにわたってオーディオを改善し得る。たとえば、ビデオ呼中に、個人化モジュール290は、オーディオプロファイル中のパラメータが、ユーザがいくつかの周波数範囲において低い感度を有することを示す場合、それらの周波数範囲において話す話者の振幅を増加させ得る。仮想現実ゲームでは、オーディオファイル中のパラメータが、ユーザが残響環境における音声を理解することが困難であることを示す場合、個人化モジュール290は、ユーザに提示される音における残響の量を減少させ得る。個人化モジュール290は、パラメータに従って音フィルタを調整するために、パラメータまたはパラメータに基づく命令を音フィルタモジュール280に提供し得る。
いくつかの実施形態では、個人化モジュール290は、データストア235に、オーディオプロファイルに関連付けられた拡張方式を記憶し得る。拡張方式は、ユーザのための音を修正するために使用されるパラメータのあらかじめ定義されたセットである。拡張方式は、ユーザのためのオーディオプロファイル中のパラメータの代わりに使用され得る。異なるユーザが、同様の聴覚特性を有し得、したがって、異なるユーザが、ユーザに提示される音に対する同様の修正から恩恵を受け得る。複数のユーザを、拡張方式に関連付けられたサブセットにグループ化することによって、システムは、ユーザのための拡張されたオーディオ体験を生成するために使用される複雑さおよび処理電力を減少させ得る。たとえば、いくつかの実施形態では、システムは、10個の異なる拡張方式、または1000個の異なる拡張方式を備え得、拡張方式のうちの1つが、ユーザの評価データと選択された拡張方式との間の類似度に基づいてオーディオプロファイルに割り当てられ得る。
オーディオシステム200が新しいユーザを検出したことに応答して、オーディオシステム200は、新しいユーザのためのオーディオプロファイルを取り出すことを試み得る。オーディオシステム200は、たとえば、ログイン情報、パスワード、顔認識などに基づいて、新しいユーザを識別し得る。いくつかの実施形態では、ユーザは、オーディオシステム200にユーザのソーシャルネットワーク識別情報を提供し得る。個人化モジュール290は、新しいユーザのためのオーディオプロファイルについてデータストア235または外部システムに照会し得る。データストア235または外部システムが、新しいユーザのためのオーディオプロファイルを識別した場合、データストア235または外部システムは、そのオーディオプロファイルをオーディオシステム200に送信し得る。個人化モジュール290が、新しいユーザのためのオーディオプロファイルを取得することが不可能である場合、個人化モジュール290は、オーディオプロファイルを生成するために、新しいユーザのためのオーディオ評価を始動し得る。
ユーザに音を提示するシステムおよびアプリケーションが、ユーザのためのオーディオ体験を拡張するために、オーディオプロファイルにアクセスし、オーディオプロファイル中のデータに基づいてユーザに提示される音を修正し得る。ヘッドセット、外部システム、またはサードパーティアプリケーションは、ヘッドセットのユーザのための音を生成するために、オーディオプロファイルにアクセスし得る。たとえば、ユーザは、ユーザにとって利用可能な任意のデバイスを使用して、ゲームアプリケーションまたはウェブサイトなど、サードパーティオーディオコンテンツにアクセスし得る。ユーザは、サードパーティにソーシャルネットワークのためのユーザIDを提供し得、サードパーティシステムは、ユーザのオーディオファイルについてソーシャルネットワークに照会し得る。サードパーティシステムは、オーディオファイル中のパラメータに従ってユーザに提示されるオーディオコンテンツを修正し得る。
オーディオプロファイルは、セキュリティ設定を含み得る。セキュリティ設定は、オーディオプロファイルへの許可された当事者アクセスのみを可能にするか、またはオーディオプロファイルに記憶されたデータのいくつかの部分へのアクセスのみを可能にし得る。たとえば、オーディオプロファイルは、ユーザのユーザプロファイルとともにソーシャルネットワークに記憶され得、セキュリティ設定は、ソーシャルネットワークにおけるユーザとのつながりを有するエンティティのみが、ユーザのオーディオプロファイルにアクセスし得ることを示し得る。いくつかの実施形態では、オーディオプロファイル中のデータは暗号化され得、暗号化鍵がユーザのウェアラブルデバイスに記憶され得、そのようなサードパーティシステムは、オーディオプロファイルのコンテンツへのアクセスをサードパーティシステムに提供することなしに、ユーザのデバイス上でユーザにコンテンツを提示するためにオーディオプロファイルを利用し得る。
図3は、1つまたは複数の実施形態による、拡張されたオーディオコンテンツを生成する方法300のフローチャートである。図3に示されているプロセスは、オーディオシステム(たとえば、オーディオシステム200)の構成要素によって実施され得る。他のエンティティが、他の実施形態において図3中のステップの一部または全部を実施し得る。実施形態は、異なるおよび/または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。
ウェアラブルデバイス上のオーディオシステムが、310において、ユーザのオーディオ評価データを収集する。オーディオ評価データを収集することは、オーディオ評価ルーチンを実施することを含み得る。オーディオ評価ルーチンは、オーディオコンテンツに対するユーザ応答を監視することを含み得る。たとえば、ユーザは、フレーズを繰り返す、オーディオコンテンツのためのレーティングを提供する、音ソースの方向を見る、などを行い得る。
オーディオシステムは、320において、オーディオ評価データとユーザを表す身体的データとに基づいて、オーディオプロファイルを更新する。オーディオプロファイルは、ユーザへの提示のためのオーディオコンテンツをどのように調整すべきかを示すパラメータを含み得る。たとえば、オーディオ評価ルーチンの結果に基づいて、パラメータは、いくつかの周波数帯域の振幅がユーザのために増加されるべきであること、または人工オーディオ環境における残響のレベルが、ユーザが音声を理解することを可能にするために減少されるべきであることを示し得る。身体的データは、ユーザの頭部、耳、および胴の形状を表し得る。身体的データは、ウェアラブルデバイスによってキャプチャされたユーザのピクチャから取得されるか、または、ソーシャルネットワーキングシステムからなど、データベースから取り出され得る。オーディオプロファイルは、形状に部分的に基づいて生成されたHRTFを含み得る。
オーディオシステムは、330において、オーディオプロファイルを記憶する。いくつかの実施形態では、オーディオシステムは、オーディオプロファイルをウェアラブルデバイスにローカルに記憶する。他の実施形態では、オーディオシステムは、オーディオプロファイルを、ソーシャルメディアネットワークなど、外部システムに送信し得、外部システムは、ユーザのためのユーザプロファイルとともにオーディオプロファイルを記憶し得る。オーディオシステムまたは外部システムは、オーディオプロファイルに拡張方式を割り当て得る。
オーディオシステムは、340において、オーディオプロファイルに部分的に基づいて、ユーザにオーディオコンテンツを提示する。オーディオコンテンツは、仮想現実ゲームのためのオーディオ、ユーザのローカルエリアにおけるオブジェクトによって生成された音、音楽、またはウェアラブルデバイスによる生成に好適な任意の他のオーディオを含み得る。オーディオシステムは、オーディオプロファイル内のパラメータに基づいてオーディオコンテンツを修正し得る。いくつかの実施形態では、オーディオシステムは、オーディオファイルに関連付けられた拡張方式に基づいてオーディオコンテンツを修正し得る。
いくつかの実施形態では、オーディオコンテンツは、ユーザが前に使用していないデバイスなど、任意のデバイスによってユーザに提示され得る。デバイスは、外部システムにオーディオプロファイルを要求し得、デバイスは、オーディオプロファイルに基づいてユーザにカスタマイズされたオーディオコンテンツを提示し得る。
図4は、1つまたは複数の実施形態による、ウェアラブルデバイス405を含むシステム400である。いくつかの実施形態では、ウェアラブルデバイス405は、図1Aのヘッドセット100または図1Bのヘッドセット105であり得る。システム400は、人工現実環境(たとえば、仮想現実環境、拡張現実環境、複合現実環境、またはそれらの何らかの組合せ)において動作し得る。図4によって示されているシステム400は、ウェアラブルデバイス405と、コンソール415に結合された入出力(I/O)インターフェース410と、ネットワーク420と、マッピングサーバ425と、外部システム470とを含む。図4は、1つのウェアラブルデバイス405と1つのI/Oインターフェース410とを含む例示的なシステム400を示すが、他の実施形態では、任意の数のこれらの構成要素が、システム400中に含まれ得る。たとえば、各々が、関連付けられたI/Oインターフェース410を有する、複数のヘッドセットがあり得、各ヘッドセットおよびI/Oインターフェース410はコンソール415と通信する。代替構成では、異なるおよび/または追加の構成要素が、システム400中に含まれ得る。さらに、図4に示されている構成要素のうちの1つまたは複数に関して説明される機能性は、いくつかの実施形態では、図4に関して説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コンソール415の機能性の一部または全部がウェアラブルデバイス405によって提供され得る。
ウェアラブルデバイス405は、ディスプレイアセンブリ430と、光学ブロック435と、1つまたは複数の位置センサー440と、DCA445とを含む。ウェアラブルデバイス405のいくつかの実施形態は、図4に関して説明されるものとは異なる構成要素を有する。さらに、図4に関して説明される様々な構成要素によって提供される機能性は、他の実施形態ではウェアラブルデバイス405の構成要素の間で別様に分散されるか、またはウェアラブルデバイス405からリモートにある別個のアセンブリにおいて取り込まれ得る。
ディスプレイアセンブリ430は、コンソール415から受信されたデータに従ってユーザにコンテンツを表示する。ディスプレイアセンブリ430は、1つまたは複数のディスプレイ要素(たとえば、ディスプレイ要素120)を使用してコンテンツを表示する。ディスプレイ要素は、たとえば、電子ディスプレイであり得る。様々な実施形態では、ディスプレイアセンブリ430は、単一のディスプレイ要素または複数のディスプレイ要素(たとえば、ユーザの各眼のためのディスプレイ)を備える。電子ディスプレイの例は、液晶ディスプレイ(LCD)、有機発光ダイオード(OLED)ディスプレイ、アクティブマトリックス有機発光ダイオードディスプレイ(AMOLED)、導波路ディスプレイ、何らかの他のディスプレイ、またはそれらの何らかの組合せを含む。いくつかの実施形態では、ディスプレイ要素120は光学ブロック435の機能性の一部または全部をも含み得ることに留意されたい。
光学ブロック435は、電子ディスプレイから受光された画像光を拡大し、画像光に関連する光学誤差を補正し得、補正された画像光をウェアラブルデバイス405の一方または両方のアイボックスに提示する。様々な実施形態では、光学ブロック435は、1つまたは複数の光学要素を含む。光学ブロック435中に含まれる例示的な光学要素は、アパーチャ、フレネルレンズ、凸レンズ、凹レンズ、フィルタ、反射面、または画像光に影響を及ぼす任意の他の好適な光学要素を含む。その上、光学ブロック435は、異なる光学要素の組合せを含み得る。いくつかの実施形態では、光学ブロック435中の光学要素のうちの1つまたは複数は、部分反射コーティングまたは反射防止コーティングなど、1つまたは複数のコーティングを有し得る。
光学ブロック435による画像光の拡大および集束は、電子ディスプレイが、より大きいディスプレイよりも、物理的により小さくなり、重さが減じ、少ない電力を消費することを可能にする。さらに、拡大は、電子ディスプレイによって提示されるコンテンツの視野を増加させ得る。たとえば、表示されるコンテンツの視野は、表示されるコンテンツが、ユーザの視野のほとんどすべて(たとえば、対角約110度)、およびいくつかの場合にはすべてを使用して提示されるようなものである。さらに、いくつかの実施形態では、拡大の量は、光学要素を追加することまたは取り外すことによって調整され得る。
いくつかの実施形態では、光学ブロック435は、1つまたは複数のタイプの光学誤差を補正するように設計され得る。光学誤差の例は、たる形ひずみまたは糸巻き形ひずみ、縦色収差、あるいは横色収差を含む。他のタイプの光学誤差は、球面収差、色収差、またはレンズ像面湾曲による誤差、非点収差、または任意の他のタイプの光学誤差をさらに含み得る。いくつかの実施形態では、表示のために電子ディスプレイに提供されるコンテンツは予歪され、光学ブロック435が、そのコンテンツに基づいて生成された画像光を電子ディスプレイから受光したとき、光学ブロック435はそのひずみを補正する。
位置センサー440は、ウェアラブルデバイス405の位置を示すデータを生成する電子デバイスである。位置センサー440は、ウェアラブルデバイス405の運動に応答して1つまたは複数の測定信号を生成する。位置センサー190は、位置センサー440の一実施形態である。位置センサー440の例は、1つまたは複数のIMU、1つまたは複数の加速度計、1つまたは複数のジャイロスコープ、1つまたは複数の磁力計、運動を検出する別の好適なタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー440は、並進運動(前/後、上/下、左/右)を測定するための複数の加速度計と、回転運動(たとえば、ピッチ、ヨー、ロール)を測定するための複数のジャイロスコープとを含み得る。いくつかの実施形態では、IMUは、測定信号を迅速にサンプリングし、サンプリングされたデータからウェアラブルデバイス405の推定位置を計算する。たとえば、IMUは、加速度計から受信された測定信号を経時的に積分して速度ベクトルを推定し、その速度ベクトルを経時的に積分して、ウェアラブルデバイス405上の基準点の推定位置を決定する。基準点は、ウェアラブルデバイス405の位置を表すために使用され得る点である。基準点は、概して空間中の点として定義され得るが、実際には、基準点は、ウェアラブルデバイス405内の点として定義される。
DCA445は、ローカルエリアの一部分についての深度情報を生成する。DCAは、1つまたは複数のイメージングデバイスとDCAコントローラとを含む。DCA445は照明器をも含み得る。DCA445の動作および構造は、図1Aに関して上記で説明された。
オーディオシステム450は、ウェアラブルデバイス405のユーザにオーディオコンテンツを提供する。オーディオシステム450は、上記で説明されたオーディオシステム200の一実施形態であり得る。オーディオシステム450は、1つまたは音響センサーと、1つまたは複数のトランスデューサと、オーディオコントローラとを備え得る。オーディオシステム450は、空間化されたオーディオコンテンツをユーザに提供し得る。いくつかの実施形態では、オーディオシステム450は、ネットワーク420を介してマッピングサーバ425に音響パラメータを要求し得る。音響パラメータは、ローカルエリアの1つまたは複数の音響プロパティ(たとえば、室内インパルス応答、残響時間、残響レベルなど)を表す。オーディオシステム450は、たとえば、DCA445からのローカルエリアの少なくとも一部分を表す情報、および/または位置センサー440からのウェアラブルデバイス405についてのロケーション情報を提供し得る。オーディオシステム450は、マッピングサーバ425から受信された音響パラメータの1つまたは複数を使用して、1つまたは複数の音フィルタを生成し、音フィルタを使用して、ユーザにオーディオコンテンツを提供し得る。
オーディオシステム450は、オーディオ評価ルーチンを行い得る。オーディオシステム450は、オーディオ評価ルーチンに基づいてユーザのためのオーディオプロファイル480を作成し得る。オーディオシステム450は、オーディオプロファイル480および/またはオーディオ評価ルーチンの結果を外部システム470に送信し得、外部システム470は、オーディオプロファイル480を記憶し得る。いくつかの実施形態では、オーディオシステム450は、外部システム470にユーザのためのオーディオプロファイルを要求し得る。オーディオシステム450は、オーディオプロファイルに記憶されたパラメータに基づいて、ユーザに提示されているオーディオコンテンツを修正し得る。
I/Oインターフェース410は、ユーザがアクション要求を送り、コンソール415から応答を受信することを可能にするデバイスである。アクション要求は、特定のアクションを実施するための要求である。たとえば、アクション要求は、画像データまたはビデオデータのキャプチャを開始または終了するための命令、あるいはアプリケーション内で特定のアクションを実施するための命令であり得る。I/Oインターフェース410は、1つまたは複数の入力デバイスを含み得る。例示的な入力デバイスは、キーボード、マウス、ゲームコントローラ、またはアクション要求を受信し、そのアクション要求をコンソール415に通信するための任意の他の好適なデバイスを含む。I/Oインターフェース410によって受信されたアクション要求は、コンソール415に通信され、コンソール415は、そのアクション要求に対応するアクションを実施する。いくつかの実施形態では、I/Oインターフェース410は、I/Oインターフェース410の初期位置に対するI/Oインターフェース410の推定位置を示す較正データをキャプチャするIMUを含む。いくつかの実施形態では、I/Oインターフェース410は、コンソール415から受信された命令に従って、ユーザに触覚フィードバックを提供し得る。たとえば、アクション要求が受信されたときに触覚フィードバックが提供されるか、または、コンソール415がアクションを実施するときに、コンソール415が、I/Oインターフェース410に命令を通信して、I/Oインターフェース410が触覚フィードバックを生成することを引き起こす。
コンソール415は、DCA445、ウェアラブルデバイス405、およびI/Oインターフェース410のうちの1つまたは複数から受信された情報に従って処理するためのコンテンツをウェアラブルデバイス405に提供する。図4に示されている例では、コンソール415は、アプリケーションストア455と、追跡モジュール460と、エンジン465とを含む。コンソール415のいくつかの実施形態は、図4に関して説明されるものとは異なるモジュールまたは構成要素を有する。同様に、以下でさらに説明される機能は、図4に関して説明されるものとは異なる様式でコンソール415の構成要素の間で分散され得る。いくつかの実施形態では、コンソール415に関して本明細書で説明される機能性は、ウェアラブルデバイス405、またはリモートシステムにおいて実装され得る。
アプリケーションストア455は、コンソール415による実行のための1つまたは複数のアプリケーションを記憶する。アプリケーションは、プロセッサによって実行されたとき、ユーザへの提示のためのコンテンツを生成する命令のグループである。アプリケーションによって生成されたコンテンツは、ウェアラブルデバイス405またはI/Oインターフェース410の移動を介してユーザから受信された入力に応答したものであり得る。アプリケーションの例は、ゲームアプリケーション、会議アプリケーション、ビデオ再生アプリケーション、または他の好適なアプリケーションを含む。いくつかの実施形態では、1つまたは複数のアプリケーションが、ネットワーク420を介してコンソール415またはウェアラブルデバイス405と通信する外部サーバに記憶され得る。アプリケーションは、ウェアラブルデバイス405上での提示のためのオーディオコンテンツを生成し得、オーディオシステム450は、オーディオプロファイル485に基づいてオーディオコンテンツを修正し得る。いくつかの実施形態では、アプリケーションは、オーディオコンテンツをオーディオシステム450に送信し、オーディオシステム450は、ウェアラブルデバイス405にローカルに記憶されたオーディオファイル中のパラメータに基づいてオーディオコンテンツを修正する。
追跡モジュール460は、DCA445からの情報、1つまたは複数の位置センサー440からの情報、またはそれらの何らかの組合せを使用して、ウェアラブルデバイス405またはI/Oインターフェース410の移動を追跡する。たとえば、追跡モジュール460は、ウェアラブルデバイス405からの情報に基づいて、ローカルエリアのマッピングにおいてウェアラブルデバイス405の基準点の位置を決定する。追跡モジュール460は、オブジェクトまたは仮想オブジェクトの位置をも決定し得る。さらに、いくつかの実施形態では、追跡モジュール460は、ウェアラブルデバイス405の将来のロケーションを予測するために、位置センサー440からのウェアラブルデバイス405の位置を示すデータの部分ならびにDCA445からのローカルエリアの表現を使用し得る。追跡モジュール460は、ウェアラブルデバイス405またはI/Oインターフェース410の推定または予測された将来の位置をエンジン465に提供する。
エンジン465は、アプリケーションを実行し、追跡モジュール460から、ウェアラブルデバイス405の位置情報、加速度情報、速度情報、予測された将来の位置、またはそれらの何らかの組合せを受信する。受信された情報に基づいて、エンジン465は、ユーザへの提示のためにウェアラブルデバイス405に提供すべきコンテンツを決定する。たとえば、受信された情報が、ユーザが左を見ていることを示す場合、エンジン465は、仮想ローカルエリアにおいて、またはローカルエリアを追加のコンテンツで拡張するローカルエリアにおいて、ユーザの移動をミラーリングする、ウェアラブルデバイス405のためのコンテンツを生成する。さらに、エンジン465は、I/Oインターフェース410から受信されたアクション要求に応答して、コンソール415上で実行しているアプリケーション内でアクションを実施し、そのアクションが実施されたというフィードバックをユーザに提供する。提供されるフィードバックは、ウェアラブルデバイス405を介した視覚または可聴フィードバック、あるいはI/Oインターフェース410を介した触覚フィードバックであり得る。
ネットワーク420は、ウェアラブルデバイス405および/またはコンソール415をマッピングサーバ425に結合する。ネットワーク420は、ワイヤレス通信システムおよび/またはワイヤード通信システムの両方を使用する、ローカルエリアネットワークおよび/またはワイドエリアネットワークの任意の組合せを含み得る。たとえば、ネットワーク420は、インターネット、ならびに携帯電話網を含み得る。一実施形態では、ネットワーク420は、標準通信技術および/またはプロトコルを使用する。したがって、ネットワーク420は、イーサネット、802.11、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス(WiMAX)、2G/3G/4Gモバイル通信プロトコル、デジタル加入者回線(DSL)、非同期転送モード(ATM)、InfiniBand、PCI Expressアドバンストスイッチングなどの技術を使用するリンクを含み得る。同様に、ネットワーク420上で使用されるネットワーキングプロトコルは、マルチプロトコルラベルスイッチング(MPLS)、伝送制御プロトコル/インターネットプロトコル(TCP/IP)、ユーザデータグラムプロトコル(UDP)、ハイパーテキストトランスポートプロトコル(HTTP)、簡易メール転送プロトコル(SMTP)、ファイル転送プロトコル(FTP)などを含むことができる。ネットワーク420を介して交換されるデータは、2進形式(たとえばポータブルネットワークグラフィックス(PNG))の画像データ、ハイパーテキストマークアップ言語(HTML)、拡張可能マークアップ言語(XML)などを含む、技術および/またはフォーマットを使用して表現され得る。さらに、リンクの全部または一部は、セキュアソケットレイヤ(SSL)、トランスポートレイヤセキュリティ(TLS)、仮想プライベートネットワーク(VPN)、インターネットプロトコルセキュリティ(IPsec)など、従来の暗号化技術を使用して暗号化され得る。
マッピングサーバ425は、複数の空間を表す仮想モデルを記憶するデータベースを含み得、仮想モデル中の1つのロケーションが、ウェアラブルデバイス405のローカルエリアの現在の構成に対応する。マッピングサーバ425は、ウェアラブルデバイス405からネットワーク420を介して、ローカルエリアおよび/またはローカルエリアについてのロケーション情報の少なくとも一部分を表す情報を受信する。マッピングサーバ425は、受信された情報および/またはロケーション情報に基づいて、ウェアラブルデバイス405のローカルエリアに関連付けられた仮想モデル中のロケーションを決定する。マッピングサーバ425は、仮想モデル中の決定されたロケーションおよび決定されたロケーションに関連付けられた任意の音響パラメータに部分的に基づいて、ローカルエリアに関連付けられた1つまたは複数の音響パラメータを決定する(たとえば、取り出す)。マッピングサーバ425は、ローカルエリアのロケーションおよびローカルエリアに関連付けられた音響パラメータの任意の値をウェアラブルデバイス405に送信し得る。
外部システム470は、ソーシャルネットワークなど、ユーザプロファイルを記憶するシステムであり得る。外部システム470は、ウェアラブルデバイス405のユーザのためのユーザプロファイル475を記憶し得る。ユーザプロファイル475は、人口統計学的情報、ユーザによってアップロードされたコンテンツ、ユーザと外部システム470の他のユーザとの間のつながりなど、ユーザに関する情報を含み得る。外部システム470は、ユーザプロファイル475の一部としての、またはユーザプロファイル475に関連付けられた、オーディオプロファイル480を記憶し得る。オーディオプロファイル480は、ウェアラブルデバイス405から受信されたオーディオ評価データを含んでいることがある。
いくつかの実施形態では、外部システム470は、オーディオプロファイルに関連付けられた拡張方式を記憶し得る。拡張方式は、ユーザのための音を修正するために使用されるパラメータのあらかじめ定義されたセットである。拡張方式は、ユーザのためのオーディオファイル中のパラメータの代わりに使用され得る。
追加の構成情報
本開示の実施形態の上記の説明は、説明の目的で提示されており、網羅的であること、または開示される正確な形態に本開示を限定することは意図されない。当業者は、上記の開示に照らして多くの修正および変形が可能であることを諒解することができる。
本開示の実施形態の上記の説明は、説明の目的で提示されており、網羅的であること、または開示される正確な形態に本開示を限定することは意図されない。当業者は、上記の開示に照らして多くの修正および変形が可能であることを諒解することができる。
本明細書のいくつかの部分は、情報に関する動作のアルゴリズムおよび記号表現に関して本開示の実施形態について説明する。これらのアルゴリズム説明および表現は、データ処理技術分野の当業者が、他の当業者に自身の仕事の本質を効果的に伝えるために通常使用される。これらの動作は、機能的に、算出量的に、または論理的に説明されるが、コンピュータプログラムまたは等価な電気回路、マイクロコードなどによって実装されることが理解される。さらに、一般性の喪失なしに、動作のこれらの仕組みをモジュールと呼ぶことが時々好都合であることも証明された。説明される動作およびそれらの関連するモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの任意の組合せにおいて具現され得る。
本明細書で説明されるステップ、動作、またはプロセスのいずれも、1つまたは複数のハードウェアまたはソフトウェアモジュールで、単独でまたは他のデバイスとの組合せで実施または実装され得る。一実施形態では、ソフトウェアモジュールは、コンピュータプログラムコードを含んでいるコンピュータ可読媒体を備えるコンピュータプログラム製品で実装され、コンピュータプログラムコードは、説明されるステップ、動作、またはプロセスのいずれかまたはすべてを実施するためにコンピュータプロセッサによって実行され得る。
本開示の実施形態はまた、本明細書の動作を実施するための装置に関し得る。この装置は、必要とされる目的のために特別に構築され得、および/あるいは、この装置は、コンピュータに記憶されたコンピュータプログラムによって選択的にアクティブ化または再構成される汎用コンピューティングデバイスを備え得る。そのようなコンピュータプログラムは、非一時的有形コンピュータ可読記憶媒体、または電子命令を記憶するのに好適な任意のタイプの媒体に記憶され得、それらの媒体はコンピュータシステムバスに結合され得る。さらに、本明細書で言及される任意のコンピューティングシステムは、単一のプロセッサを含み得るか、または増加された算出能力のために複数のプロセッサ設計を採用するアーキテクチャであり得る。
本開示の実施形態はまた、本明細書で説明されるコンピューティングプロセスによって製造される製品に関し得る。そのような製品は、コンピューティングプロセスから生じる情報を備え得、その情報は、非一時的有形コンピュータ可読記憶媒体に記憶され、本明細書で説明されるコンピュータプログラム製品または他のデータ組合せの任意の実施形態を含み得る。
最終的に、本明細書において使用される言い回しは、主に読みやすさおよび教育目的で選択されており、本明細書において使用される言い回しは、本発明の主題を定めるかまたは制限するように選択されていないことがある。したがって、本開示の範囲はこの詳細な説明によって限定されるのではなく、むしろ、本明細書に基づく出願に関して生じる請求項によって限定されることが意図される。したがって、実施形態の開示は、以下の特許請求の範囲に記載される本開示の範囲を例示するものであり、限定するものではない。
Claims (15)
- ウェアラブルデバイスによって、ユーザのオーディオ評価データを収集することと、
前記オーディオ評価データと前記ユーザを表す身体的データとに基づいて、オーディオプロファイルを更新することと、
前記オーディオプロファイルに部分的に基づいて、前記ユーザにオーディオコンテンツを提示することと
を含む、方法。 - 前記オーディオプロファイルをソーシャルネットワークに送信することをさらに含み、前記ソーシャルネットワークが、前記オーディオプロファイルをユーザプロファイルに関連付け、前記ソーシャルネットワークが、前記オーディオプロファイルを拡張方式に関連付けた、請求項1に記載の方法。
- 前記ウェアラブルデバイスによって、前記オーディオプロファイルを作成することをさらに含む、請求項1に記載の方法。
- 外部システムから前記オーディオコンテンツを受信することと、
前記オーディオプロファイルに基づいて前記オーディオコンテンツを修正することと
をさらに含む、請求項1に記載の方法。 - 前記オーディオ評価データを前記収集することが、
前記ユーザに音を提示することと、
前記ユーザによる前記音に対する応答を検出することと
を含む、請求項1に記載の方法。 - 前記オーディオ評価データを前記収集することが、
ローカルエリアにおける音ソースのロケーションを決定することと、
前記ユーザによる前記音ソースに対する応答を検出することと
を含む、請求項1に記載の方法。 - 前記身体的データが、前記ユーザの耳形状を表す、請求項1に記載の方法。
- ソーシャルネットワークから前記オーディオプロファイルを取り出すことをさらに含む、請求項1に記載の方法。
- 前記オーディオ評価データを前記収集することが、前記ユーザの聴覚の特性を表すパラメータを決定するためにオーディオ評価ルーチンを行うことを含み、前記パラメータが、スケーリングファクタまたは残響の最大レベルのうちの少なくとも1つを含む、請求項1に記載の方法。
- 前記オーディオプロファイルが、セキュリティ設定を含み、前記セキュリティ設定が、サードパーティが前記オーディオプロファイルにアクセスすることを許可されるかどうかを示す、請求項1に記載の方法。
- 非一時的コンピュータ可読記憶媒体を備えるコンピュータプログラム製品であって、前記非一時的コンピュータ可読記憶媒体が、
ウェアラブルデバイスによって、ユーザのオーディオ評価データを収集することと、
前記オーディオ評価データと前記ユーザを表す身体的データとに基づいて、オーディオプロファイルを更新することと、
前記オーディオプロファイルに部分的に基づいて、前記ユーザにオーディオコンテンツを提示することと
を行うためのコンピュータプログラムコードを含んでいる、コンピュータプログラム製品。 - 前記オーディオプロファイルをソーシャルネットワークに送信するためのコンピュータプログラムコードをさらに備え、前記ソーシャルネットワークが、前記オーディオプロファイルをユーザプロファイルに関連付ける、請求項11に記載のコンピュータプログラム製品。
- 非一時的コンピュータ可読記憶媒体を備えるウェアラブルデバイスであって、前記非一時的コンピュータ可読記憶媒体が、
前記ウェアラブルデバイスによって、ユーザのオーディオ評価データを収集することと、
前記オーディオ評価データと前記ユーザを表す身体的データとに基づいて、オーディオプロファイルを更新することと、
前記オーディオプロファイルに部分的に基づいて、前記ユーザにオーディオコンテンツを提示することと
を行うためのコンピュータプログラムコードを含んでいる、ウェアラブルデバイス。 - 前記オーディオプロファイルをソーシャルネットワークに送信するためのコンピュータプログラムコードをさらに備え、前記ソーシャルネットワークが、前記オーディオプロファイルをユーザプロファイルに関連付け、前記ソーシャルネットワークが、前記オーディオプロファイルを拡張方式に関連付ける、請求項13に記載のウェアラブルデバイス。
- 外部システムから前記オーディオコンテンツを受信することと、
前記オーディオプロファイルに基づいて前記オーディオコンテンツを修正することと
を行うためのコンピュータプログラムコードをさらに備える、請求項13に記載のウェアラブルデバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962857410P | 2019-06-05 | 2019-06-05 | |
US62/857,410 | 2019-06-05 | ||
US16/562,879 | 2019-09-06 | ||
US16/562,879 US10976991B2 (en) | 2019-06-05 | 2019-09-06 | Audio profile for personalized audio enhancement |
PCT/US2020/032304 WO2020247150A1 (en) | 2019-06-05 | 2020-05-11 | Audio profile for personalized audio enhancement |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022534833A true JP2022534833A (ja) | 2022-08-04 |
Family
ID=73650341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021554615A Pending JP2022534833A (ja) | 2019-06-05 | 2020-05-11 | 個人化されたオーディオ拡張のためのオーディオプロファイル |
Country Status (5)
Country | Link |
---|---|
US (2) | US10976991B2 (ja) |
EP (1) | EP3935871A1 (ja) |
JP (1) | JP2022534833A (ja) |
CN (1) | CN113841425A (ja) |
WO (1) | WO2020247150A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10841724B1 (en) * | 2017-01-24 | 2020-11-17 | Ha Tran | Enhanced hearing system |
US11119328B2 (en) * | 2017-08-23 | 2021-09-14 | Flex Ltd. | Light projection engine attachment and alignment |
US10976991B2 (en) * | 2019-06-05 | 2021-04-13 | Facebook Technologies, Llc | Audio profile for personalized audio enhancement |
CN113223544B (zh) * | 2020-01-21 | 2024-04-02 | 珠海市煊扬科技有限公司 | 音频的方向定位侦测装置及方法以及音频处理系统 |
US11375251B2 (en) * | 2020-05-19 | 2022-06-28 | International Business Machines Corporation | Automatically generating enhancements to AV content |
US11234095B1 (en) * | 2020-05-21 | 2022-01-25 | Facebook Technologies, Llc | Adjusting acoustic parameters based on headset position |
US11849274B2 (en) * | 2020-06-25 | 2023-12-19 | Qualcomm Incorporated | Systems, apparatus, and methods for acoustic transparency |
US11790096B2 (en) * | 2021-04-12 | 2023-10-17 | Philip Scott Lyren | Tokenizing digital assets with restrictions on a blockchain |
FR3122817B1 (fr) * | 2021-05-13 | 2023-11-17 | Calyxen | Systèmes et procédés pour déterminer un score de localisation auditive spatiale |
CN114189467B (zh) * | 2021-12-08 | 2023-10-03 | 北京达佳互联信息技术有限公司 | 内容分发网络服务评估方法及装置 |
US12003949B2 (en) * | 2022-01-19 | 2024-06-04 | Meta Platforms Technologies, Llc | Modifying audio data transmitted to a receiving device to account for acoustic parameters of a user of the receiving device |
US20240121569A1 (en) * | 2022-10-09 | 2024-04-11 | Sony Interactive Entertainment Inc. | Altering audio and/or providing non-audio cues according to listener's audio depth perception |
WO2024137499A1 (en) * | 2022-12-22 | 2024-06-27 | Meta Platforms Technologies, Llc | Estimation of hearing loss of a user from interactions with a local environment by the user identified from captured audio and information describing the local area |
US20240256600A1 (en) * | 2023-02-01 | 2024-08-01 | Meta Platforms Technologies, Llc | Use of biometric signals to personalize audio |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030128859A1 (en) | 2002-01-08 | 2003-07-10 | International Business Machines Corporation | System and method for audio enhancement of digital devices for hearing impaired |
US20080008328A1 (en) * | 2006-07-06 | 2008-01-10 | Sony Ericsson Mobile Communications Ab | Audio processing in communication terminals |
US8572493B2 (en) * | 2009-01-29 | 2013-10-29 | Rick Qureshi | Mobile device messaging application |
US9138178B2 (en) * | 2010-08-05 | 2015-09-22 | Ace Communications Limited | Method and system for self-managed sound enhancement |
US11102593B2 (en) * | 2011-01-19 | 2021-08-24 | Apple Inc. | Remotely updating a hearing aid profile |
US20120183164A1 (en) | 2011-01-19 | 2012-07-19 | Apple Inc. | Social network for sharing a hearing aid setting |
EP2672426A3 (en) * | 2012-06-04 | 2014-06-04 | Sony Mobile Communications AB | Security by z-face detection |
US20150019982A1 (en) * | 2013-07-12 | 2015-01-15 | Felix Houston Petitt, JR. | System, devices, and platform for security |
WO2015066332A1 (en) * | 2013-10-30 | 2015-05-07 | Technology Against Als | Communication and control system and method |
CN104352243B (zh) * | 2014-11-26 | 2016-09-21 | 首都医科大学附属北京朝阳医院 | 测量声源定位能力的测听系统 |
CN107113524B (zh) | 2014-12-04 | 2020-01-03 | 高迪音频实验室公司 | 反映个人特性的双耳音频信号处理方法和设备 |
EP3375207B1 (en) * | 2015-12-07 | 2021-06-30 | Huawei Technologies Co., Ltd. | An audio signal processing apparatus and method |
GB2554634B (en) * | 2016-07-07 | 2020-08-05 | Goshawk Communications Ltd | Enhancement of audio signals |
US10455313B2 (en) * | 2016-10-31 | 2019-10-22 | Bragi GmbH | Wireless earpiece with force feedback |
US11321890B2 (en) * | 2016-11-09 | 2022-05-03 | Microsoft Technology Licensing, Llc | User interface for generating expressive content |
US10680995B1 (en) * | 2017-06-28 | 2020-06-09 | Racket, Inc. | Continuous multimodal communication and recording system with automatic transmutation of audio and textual content |
US10617842B2 (en) * | 2017-07-31 | 2020-04-14 | Starkey Laboratories, Inc. | Ear-worn electronic device for conducting and monitoring mental exercises |
US10652674B2 (en) | 2018-04-06 | 2020-05-12 | Jon Lederman | Hearing enhancement and augmentation via a mobile compute device |
US11586413B2 (en) * | 2018-10-05 | 2023-02-21 | Google Llc | Synchronous sounds for audio assistant on devices |
US10976991B2 (en) * | 2019-06-05 | 2021-04-13 | Facebook Technologies, Llc | Audio profile for personalized audio enhancement |
-
2019
- 2019-09-06 US US16/562,879 patent/US10976991B2/en active Active
-
2020
- 2020-05-11 CN CN202080036524.XA patent/CN113841425A/zh active Pending
- 2020-05-11 EP EP20729450.5A patent/EP3935871A1/en active Pending
- 2020-05-11 WO PCT/US2020/032304 patent/WO2020247150A1/en unknown
- 2020-05-11 JP JP2021554615A patent/JP2022534833A/ja active Pending
-
2021
- 2021-03-09 US US17/196,725 patent/US11579837B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20210216271A1 (en) | 2021-07-15 |
CN113841425A (zh) | 2021-12-24 |
EP3935871A1 (en) | 2022-01-12 |
US10976991B2 (en) | 2021-04-13 |
US11579837B2 (en) | 2023-02-14 |
WO2020247150A1 (en) | 2020-12-10 |
US20200387341A1 (en) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11579837B2 (en) | Audio profile for personalized audio enhancement | |
US11523240B2 (en) | Selecting spatial locations for audio personalization | |
US11561757B2 (en) | Methods and system for adjusting level of tactile content when presenting audio content | |
JP2022546161A (ja) | 個別化された空間オーディオを作り出すためにビームフォーミングを介して耳殻情報を推論すること | |
JP2023534154A (ja) | 個別化された音プロファイルを使用するオーディオシステム | |
US11670321B2 (en) | Audio visual correspondence based signal augmentation | |
JP2022542755A (ja) | センサーアレイの音響センサーのサブセットを選択するための方法およびそのためのシステム | |
US20220342213A1 (en) | Miscellaneous audio system applications | |
CN117981347A (zh) | 用于对虚拟声源进行空间化的音频系统 | |
US11290837B1 (en) | Audio system using persistent sound source selection for audio enhancement | |
EP4186244A1 (en) | Virtual microphone calibration based on displacement of the outer ear | |
US11171621B2 (en) | Personalized equalization of audio output based on ambient noise detection | |
US11681492B2 (en) | Methods and system for controlling tactile content | |
EP4432053A1 (en) | Modifying a sound in a user environment in response to determining a shift in user attention | |
EP4411531A1 (en) | Use of biometric signals to personalize audio | |
WO2024137499A1 (en) | Estimation of hearing loss of a user from interactions with a local environment by the user identified from captured audio and information describing the local area |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240702 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241001 |