JP2023519487A

JP2023519487A - 軟骨伝導を使用した頭部伝達関数決定

Info

Publication number: JP2023519487A
Application number: JP2022548632A
Authority: JP
Inventors: ヴァムシクリシュナイサプ，; アントニオジョンミラー，; モルテザカレギメーボディ，
Original assignee: Meta Platforms Technologies LLC
Current assignee: Meta Platforms Technologies LLC
Priority date: 2020-04-01
Filing date: 2021-03-08
Publication date: 2023-05-11
Also published as: CN115280798A; US10966043B1; WO2021202057A1; KR20220162694A; US20210314720A1; EP4128819A1; US11445318B2

Abstract

実施形態は、軟骨伝導音を使用して、（たとえば、ヘッドセットの構成要素としての）オーディオシステムのユーザのための頭部伝達関数（ＨＲＴＦ）を較正することに関する。トランスデューサ（たとえば、軟骨伝導）を使用してユーザにテスト音が提示され、応答して、マイクロフォンを介してユーザの耳道への入口においてオーディオ信号が受信される。テスト音とオーディオ信号の組合せがオーディオサーバに提供され得、ここで、ユーザのための１つまたは複数のＨＲＴＦを決定するためのモデルが使用される。１つまたは複数のＨＲＴＦを表す情報が、ユーザにオーディオを提供するために使用されるためにオーディオシステムに提供される。オーディオサーバは、その組合せに基づいて、ユーザの耳殻を表す幾何学的情報を決定するためのモデルをも使用し得る。一実施形態では、幾何学的情報は、ユーザのための１つまたは複数のＨＲＴＦを決定するために使用される。【選択図】図２

Description

本開示は、一般にオーディオシステムに関し、より詳細には、軟骨伝導を使用して頭部伝達関数（ＨＲＴＦ）を決定することに関する。

２つの耳において知覚された音は、各耳に関する音ソースの方向およびロケーション、ならびに音が知覚された環境コンテキストに応じて、異なり得る。人間は、各耳において知覚された音を比較することによって音ソースのロケーションを決定する。人工現実コンテキストでは、「サラウンド音」（すなわち、空間オーディオ）は、ＨＲＴＦを使用してシミュレートされ得る。ＨＲＴＦは、耳が空間中の点からどのように音を受信するかを特徴づける。人に対する特定のソースロケーションについてのＨＲＴＦは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造により、人の各耳に固有である（および人に固有である）。音が人に当たるとき、人の頭部、耳、耳道のサイズおよび形状、鼻腔および口腔のサイズおよび形状により、音が変わり、音がユーザによってどのように知覚されるかに影響を及ぼす。

従来、人工現実システムのユーザのためのＨＲＴＦを決定することは、ユーザに対する多くの異なるソースロケーション（たとえば、一般に１００個超のスピーカー）について消音室においてＨＲＴＦを直接測定することによって行われる。ＨＲＴＦは、人工現実システムを使用しながら、ユーザのための「サラウンド音」体験を生成するために使用され得る。したがって、高品質サラウンド音のために、ＨＲＴＦを決定することは、ユーザが、比較的複雑である特殊なシステム（たとえば、消音室、１つまたは複数のスピーカーアレイ、走査デバイスなど）と対話することを必要とする比較的長いプロセス（たとえば、１時間超）である。したがって、ＨＲＴＦを取得するための従来の手法は、必要とされるハードウェアリソースおよび／または時間に関して非効率的である。

本発明の第１の態様によれば、オーディオシステムからテスト情報を受信することであって、テスト情報が、ユーザのためのオーディオ信号およびテスト音を表し、オーディオ信号は、ユーザの耳殻（ｐｉｎｎａ）に結合された軟骨伝導トランスデューサがユーザにテスト音を提示したことに応答した、ユーザの耳道への入口における音に対応する、テスト情報を受信することと、テスト情報と、オーディオ信号およびテスト音の組合せを対応する頭部伝達関数（ＨＲＴＦ）にマッピングするモデルとを使用して、ユーザのためのＨＲＴＦを決定することと、ＨＲＴＦを表す情報をオーディオシステムに提供することとを含む、方法が提供される。

好ましくは、オーディオシステムは、軟骨伝導トランスデューサがユーザの耳殻上のテスト位置においてテスト音を提示したことに応答して、オーディオ信号をキャプチャする。

好ましくは、本方法は、軟骨伝導トランスデューサを耳殻上の複数のテスト位置に移動するようにユーザに促すための命令を生成することであって、各テスト位置において、オーディオシステムが、１つまたは複数のそれぞれのテスト音を提示し、１つまたは複数の対応するオーディオ信号をキャプチャする、命令を生成することと、命令をオーディオシステムに提供することとをさらに含む。

好ましくは、各テスト位置において、オーディオシステムは複数のテスト音を提示し、各テスト音は同じである。

好ましくは、各テスト位置において、オーディオシステムは複数のテスト音を提示し、複数のテスト音のうちの少なくとも１つは、複数のテスト音のうちの別のものとは異なる。

好ましくは、テスト情報は、軟骨伝導トランスデューサがテスト音を提示したユーザの耳殻上の特定のテスト位置に関連付けられ、モデルは、軟骨伝導トランスデューサの様々なテスト位置について、オーディオ信号とテスト音との組合せを、対応するＨＲＴＦにマッピングする。

本発明のさらなる態様によれば、オーディオシステムからテスト情報を受信することであって、テスト情報が、ユーザのためのオーディオ信号およびテスト音を表し、オーディオ信号は、ユーザの耳殻に結合された軟骨伝導トランスデューサがユーザにテスト音を提示したことに応答した、ユーザの耳道への入口における音に対応する、テスト情報を受信することと、テスト情報と、オーディオ信号およびテスト音の組合せをユーザの耳殻を表す対応する幾何学的情報にマッピングするモデルとを使用して、ユーザの耳殻を表す幾何学的情報を決定することと、幾何学的情報をオーディオシステムに提供することとを含む、方法が提供される。

好ましくは、テスト情報は、軟骨伝導トランスデューサがテスト音を提示したユーザの耳殻上の特定のテスト位置に関連付けられ、モデルは、軟骨伝導トランスデューサの様々なテスト位置について、オーディオ信号とテスト音との組合せを、対応する幾何学的情報にマッピングする。

好ましくは、本方法は、幾何学的情報を使用して、ユーザのための頭部伝達関数（ＨＲＴＦ）を決定することと、ＨＲＴＦを表す情報をオーディオシステムに提供することとをさらに含む。

好ましくは、ＨＲＴＦを決定することは、ＨＲＴＦを決定するために、幾何学的情報を使用するシミュレーションを実施することを含む。

好ましくは、本方法は、幾何学的情報を使用して、ウェアラブルデバイスを表す設計ファイルを生成することであって、設計ファイルがウェアラブルデバイスの作製において使用され、ウェアラブルデバイスが、ユーザの耳殻にフィットするようにカスタマイズされる、設計ファイルを生成することをさらに含む。

本発明のさらなる態様によれば、オーディオシステムからテスト情報を受信することであって、テスト情報が、ユーザのためのオーディオ信号およびテスト音を表し、オーディオ信号は、ユーザの耳殻に結合された軟骨伝導トランスデューサがユーザにテスト音を提示したことに応答した、ユーザの耳道への入口における音に対応する、テスト情報を受信することと、テスト情報と、オーディオ信号およびテスト音の組合せを、ユーザの耳殻を表す対応する幾何学的情報にマッピングするモデルとを使用して、ユーザの耳殻を表す幾何学的情報を決定することと、幾何学的情報を使用して、ユーザのための頭部伝達関数（ＨＲＴＦ）を決定することと、ＨＲＴＦを表す情報をオーディオシステムに提供することとを含む、方法が提供される。

好ましくは、ＨＲＴＦを決定することは、耳殻の幾何学的情報と、耳殻の幾何学的情報を、対応するＨＲＴＦにマッピングするモデルとを使用して、ユーザのためのＨＲＴＦを決定することを含む。

実施形態は、ユーザのための頭部伝達関数（ＨＲＴＦ）を決定するオーディオシステムに関する。オーディオシステムは、１つまたは複数の軟骨伝導トランスデューサと、１つまたは複数の音響センサーと、オーディオコントローラとを含む。オーディオシステムは、１つまたは複数の軟骨伝導トランスデューサを介して、ユーザの耳（たとえば、耳殻）上のロケーションから様々なテスト音を提示する。１つまたは複数のマイクロフォンは、耳の耳道への入口に置かれた少なくとも１つのマイクロフォンを含む。オーディオシステムは、少なくとも１つのマイクロフォンを介して、ユーザの耳道への入口におけるテスト音から生じたオーディオ信号を受信する。提示された音と受信されたオーディオ信号の組合せは、対応するＨＲＴＦを決定するために使用され得る。いくつかの実施形態では、テスト情報と、対応するオーディオ信号とを使用して、ＨＲＴＦは直接決定される。いくつかの実施形態では、テスト情報と、対応するオーディオ信号とを使用して、耳殻ジオメトリが決定され得る。耳殻ジオメトリは、たとえば、ユーザの耳にフィットしたデバイスなどを設計するために使用されるＨＲＴＦを決定するために使用され得る。オーディオシステムは、ユーザのための３次元空間化オーディオを生成するために、決定されたＨＲＴＦを使用し得る。

いくつかの実施形態では、ユーザの１つまたは複数のＨＲＴＦを決定するための方法が説明される。テスト情報が、オーディオシステムから受信される。テスト情報は、ユーザのためのオーディオ信号およびテスト音を表す。オーディオ信号は、ユーザの耳殻に結合された軟骨伝導トランスデューサがユーザにテスト音を提示したことに応答した、ユーザの耳道への入口における音に対応する。テスト情報と、オーディオ信号およびテスト音の組合せを対応するＨＲＴＦにマッピングするモデルとを使用して、１つまたは複数のＨＲＴＦがユーザのために決定される。オーディオシステムへの１つまたは複数のＨＲＴＦを表す情報が、オーディオシステムに提供される。

いくつかの実施形態では、ユーザの耳殻を表す幾何学的情報を決定するための方法が説明される。テスト情報が、オーディオシステムから受信される。テスト情報は、ユーザのためのオーディオ信号およびテスト音を表す。オーディオ信号は、ユーザの耳殻に結合された軟骨伝導トランスデューサがユーザにテスト音を提示したことに応答した、ユーザの耳道への入口における音に対応する。テスト情報と、オーディオ信号およびテスト音の組合せを、ユーザの耳殻を表す対応する幾何学的情報にマッピングするモデルとを使用して、ユーザの耳殻を表す幾何学的情報が決定される。幾何学的情報は、オーディオシステムに提供される。

いくつかの実施形態では、ユーザの１つまたは複数のＨＲＴＦを決定するための別の方法が説明される。テスト情報が、オーディオシステムから受信される。テスト情報は、ユーザのためのオーディオ信号およびテスト音を表す。オーディオ信号は、ユーザの耳殻に結合された軟骨伝導トランスデューサがユーザにテスト音を提示したことに応答した、ユーザの耳殻の耳道への入口における音に対応する。テスト情報と、オーディオ信号およびテスト音の組合せを、ユーザの耳殻を表す対応する幾何学的情報にマッピングするモデルとを使用して、ユーザの耳殻を表す幾何学的情報が決定される。ユーザのための１つまたは複数のＨＲＴＦは、幾何学的情報を使用して決定される。１つまたは複数のＨＲＴＦを表す情報は、オーディオシステムに提供される。

１つまたは複数の実施形態による、アイウェアデバイスとして実装されるヘッドセットの斜視図である。１つまたは複数の実施形態による、ヘッドマウントディスプレイとして実装されるヘッドセットの斜視図である。１つまたは複数の実施形態による、ヘッドセットデバイスのユーザのためのＨＲＴＦを決定するためのシステム環境のブロック図である。１つまたは複数の実施形態による、オーディオサーバのブロック図である。一実施形態による、トレーニングユーザのためのトレーニングテスト情報を収集するためのシステムの斜視図である。１つまたは複数の実施形態による、オーディオシステムのブロック図である。１つまたは複数の実施形態による、ユーザのためのテスト情報を使用して、ＨＲＴＦを決定するためのプロセスを示すフローチャートである。１つまたは複数の実施形態による、ユーザのためのテスト情報を使用して、ユーザの耳殻を表す幾何学的情報を決定するためのプロセスを示すフローチャートである。１つまたは複数の実施形態による、ヘッドセットを含むシステムの図である。

図は、単に例示の目的で様々な実施形態を示す。本明細書で説明される原理から逸脱することなく、本明細書で示される構造および方法の代替実施形態が採用され得ることを、当業者は以下の説明から容易に認識されよう。

構成概観

本発明の実施形態は、人工現実システムを含むか、または人工現実システムに関連して実装され得る。人工現実は、ユーザへの提示の前に何らかの様式で調整された形式の現実であり、これは、たとえば、仮想現実（ＶＲ）、拡張現実（ＡＲ）、複合現実（ＭＲ）、ハイブリッド現実、あるいはそれらの何らかの組合せおよび／または派生物を含み得る。人工現実コンテンツは、完全に生成されたコンテンツ、またはキャプチャされた（たとえば、現実世界の）コンテンツと組み合わせられた生成されたコンテンツを含み得る。人工現実コンテンツは、ビデオ、オーディオ、触覚フィードバック、またはそれらの何らかの組合せを含み得、それらのいずれも、単一のチャネルまたは複数のチャネルにおいて提示され得る（観察者に３次元効果をもたらすステレオビデオなど）。さらに、いくつかの実施形態では、人工現実は、人工現実におけるコンテンツを作成するために使用される、および／または人工現実において別様に使用される、アプリケーション、製品、アクセサリ、サービス、またはそれらの何らかの組合せにも関連付けられ得る。人工現実コンテンツを提供する人工現実システムは、ホストコンピュータシステムに接続されたウェアラブルデバイス（たとえば、ヘッドセット）、独立型ウェアラブルデバイス（たとえば、ヘッドセット）、モバイルデバイスまたはコンピューティングシステム、あるいは、１人または複数の観察者に人工現実コンテンツを提供することが可能な任意の他のハードウェアプラットフォームを含む、様々なプラットフォーム上に実装され得る。

ＨＲＴＦは、ユーザの外耳（たとえば、耳殻）が、耳に対する特定の位置における音ソースからどのように音を受信するかを特徴づける。いくつかの実施形態では、オーディオシステムは、１つまたは複数のトランスデューサ（たとえば、軟骨伝導トランスデューサ）を使用して、ユーザにテスト音を提示する。特に、オーディオシステムは、ユーザの一方または両方の耳に、それぞれの左耳トランスデューサおよび右耳トランスデューサを使用して、テスト音を提示し得る。オーディオシステムは、ユーザによって装着されるヘッドセットの一部であり得る。オーディオシステムは、生じた（たとえば、軟骨伝導トランスデューサによって作成された）オーディオ信号を、ユーザの耳道の入口に置かれたマイクロフォンを介して受信する。オーディオシステムは、ユーザの左耳道への入口に置かれた左耳マイクロフォン、およびユーザの右耳道への入口に置かれた右耳マイクロフォンの一方または両方において、オーディオ信号を受信し得る。

オーディオシステムは、ユーザにカスタマイズされたＨＲＴＦおよび／またはユーザの一方または両方の耳殻の幾何学的情報を決定するために、テスト音とオーディオ信号の組合せを使用する。いくつかの実施形態では、オーディオシステムは、テスト音とオーディオ信号の組合せを、オーディオシステムからリモートにあるリモートシステム（たとえば、オーディオサーバ、ユーザのモバイルフォン）に提供する。リモートシステムは、１つまたは複数の機械学習モデルを使用して、オーディオ信号およびテスト音を、ユーザの対応するＨＲＴＦおよび／または幾何学的情報にマッピングし得る。特に、リモートシステムは、オーディオ信号およびテスト音を、それぞれの左耳ＨＲＴＦおよび／または幾何学的情報、ならびに右耳ＨＲＴＦおよび／または幾何学的情報にマッピングし得る。リモートシステムは、（たとえば、数値シミュレーションパイプラインを使用して）１つまたは複数の対応するＨＲＴＦを決定するために、幾何学的情報をさらに使用し得る。マッピングを実施した後に、リモートシステムは、ＨＲＴＦおよび／または幾何学的情報をオーディオシステムに提供し得る。

いくつかの実施形態では、リモートシステムの機能性の一部または全部が、オーディオシステムによって実施され得る。たとえば、リモートシステムは、１つまたは複数のＨＲＴＦモデルおよび／または耳殻ジオメトリモデルをオーディオシステムに提供し得、オーディオシステムは、テスト音およびオーディオ信号の組合せからユーザの一方または両方の耳殻の対応するＨＲＴＦおよび／または幾何学的情報へのマッピングを実施するために、ＨＲＴＦモデルおよび耳殻ジオメトリモデルの一方または両方を使用し得る。

リモートシステムは、１つまたは複数のＨＲＴＦモデルおよび／または耳殻ジオメトリモデルをトレーニングするために、トレーニングユーザのセット（たとえば、ラボラトリ設定におけるテスト対象）のために収集された、テスト音およびオーディオ信号の組合せのトレーニングデータベースを使用し得る。特に、リモートシステムは、トレーニングＨＲＴＦで標示されたテスト音およびオーディオ信号の組合せを使用して、ＨＲＴＦモデルをトレーニングし得る。データベースはまた、トレーニングユーザのセットの頭部関係ジオメトリおよび耳関係ジオメトリを表す幾何学的情報を含み得る。この幾何学的情報は、カメラおよび３次元スキャナによってキャプチャされ得る。リモートシステムは、幾何学的情報で標示されたテスト音およびオーディオ信号の組合せを使用して、耳殻ジオメトリモデルをトレーニングし得る。リモートシステムはまた、幾何学的情報を使用して、頭部関係ジオメトリおよび耳関係ジオメトリのこのセット上で、ＨＲＴＦシミュレーションを実施し、ＨＲＴＦモデルをトレーニングするための、またはオーディオシステムに提供するためのＨＲＴＦを決定し得る。

オーディオシステムは、オーディオ出力デバイス（たとえば、スピーカー、ヘッドフォン）を通して音コンテンツを提示するために、オーディオシステムのユーザのために決定されたＨＲＴＦを使用し得る。特に、決定されたＨＲＴＦは、空間化オーディオを（たとえば、トランスデューサアレイを介して）ユーザに提供するために使用され得る。

本明細書で説明される方法およびシステムは、オーディオシステムユーザのためのリアルタイムＨＲＴＦ較正および／または頭部関係幾何学的情報較正のための効率的な手段を提供する。特に、説明されるシステムは、ユーザのためのテスト音およびオーディオ信号の組合せを使用して、対応するＨＲＴＦを決定し、これは、（大きいスピーカーアレイを使用して、消音室においてＨＲＴＦを直接測定することに対して）システムによって比較的容易に収集され得る。さらに、説明されるシステムは、ユーザの頭部の画像またはビデオをとること、あるいは頭部または耳の物理的寸法をキャプチャするための何らかの他の手段など、ユーザが余分な方策を実施することなしに、ＨＲＴＦを構築するための情報を収集することができる。

ヘッドセット例

図１Ａは、１つまたは複数の実施形態による、アイウェアデバイスとして実装されるヘッドセット１００の斜視図である。いくつかの実施形態では、アイウェアデバイスは、ニアアイディスプレイ（ＮＥＤ）である。概して、ヘッドセット１００は、コンテンツ（たとえば、メディアコンテンツ）が、ディスプレイアセンブリおよび／またはオーディオシステムを使用して提示されるように、ユーザの顔に装着され得る。しかしながら、ヘッドセット１００はまた、メディアコンテンツが異なる様式でユーザに提示されるように使用され得る。ヘッドセット１００によって提示されるメディアコンテンツの例は、１つまたは複数の画像、ビデオ、オーディオ、またはそれらの何らかの組合せを含む。ヘッドセット１００は、フレームを含み、構成要素の中でも、１つまたは複数のディスプレイ要素１２０を含むディスプレイアセンブリと、深度カメラアセンブリ（ＤＣＡ）と、オーディオシステムと、位置センサー１９０とを含み得る。図１Ａは、ヘッドセット１００上の例示的なロケーションにおけるヘッドセット１００の構成要素を示すが、構成要素は、ヘッドセット１００上の他の場所に、ヘッドセット１００とペアリングされた周辺デバイス上に、またはそれらの何らかの組合せで位置し得る。同様に、図１Ａに示されているものよりも多いまたは少ない構成要素がヘッドセット１００上にあり得る。

フレーム１１０は、ヘッドセット１００の他の構成要素を保持する。フレーム１１０は、１つまたは複数のディスプレイ要素１２０を保持する前面部と、ユーザの頭部に取り付けるためのエンドピース（たとえば、テンプル）とを含む。フレーム１１０の前面部は、ユーザの鼻の上をまたいでいる。エンドピースの長さは、異なるユーザにフィットするように調整可能（たとえば、調整可能なテンプルの長さ）であり得る。エンドピースはまた、ユーザの耳の後ろ側で湾曲する部分（たとえば、テンプルの先端、イヤピース）を含み得る。

１つまたは複数のディスプレイ要素１２０は、ヘッドセット１００を装着しているユーザに光を提供する。図示のように、ヘッドセットは、ユーザの各眼のためのディスプレイ要素１２０を含む。いくつかの実施形態では、ディスプレイ要素１２０は、ヘッドセット１００のアイボックスに提供される画像光を生成する。アイボックスは、ヘッドセット１００を装着している間にユーザの眼が占有する空間中のロケーションである。たとえば、ディスプレイ要素１２０は導波路ディスプレイであり得る。導波路ディスプレイは、光ソース（たとえば、２次元ソース、１つまたは複数の線ソース、１つまたは複数の点ソースなど）と、１つまたは複数の導波路とを含む。光ソースからの光は、１つまたは複数の導波路中に内部結合され、１つまたは複数の導波路は、ヘッドセット１００のアイボックス中に瞳複製（ｐｕｐｉｌｒｅｐｌｉｃａｔｉｏｎ）があるような様式で光を出力する。１つまたは複数の導波路からの光の内部結合および／または外部結合が、１つまたは複数の回折格子を使用して行われ得る。いくつかの実施形態では、導波路ディスプレイは、光ソースからの光が１つまたは複数の導波路中に内部結合されるときにその光を走査する走査要素（たとえば、導波路、ミラーなど）を含む。いくつかの実施形態では、ディスプレイ要素１２０の一方または両方が不透明であり、ヘッドセット１００の周りのローカルエリアからの光を透過しないことに留意されたい。ローカルエリアは、ヘッドセット１００の周囲のエリアである。たとえば、ローカルエリアは、ヘッドセット１００を装着しているユーザが中にいる部屋であり得、または、ヘッドセット１００を装着しているユーザは外にいることがあり、ローカルエリアは外のエリアである。このコンテキストでは、ヘッドセット１００はＶＲコンテンツを生成する。代替的に、いくつかの実施形態では、ＡＲおよび／またはＭＲコンテンツを作り出すために、ローカルエリアからの光が１つまたは複数のディスプレイ要素からの光と組み合わせられ得るように、ディスプレイ要素１２０の一方または両方は少なくとも部分的に透明である。

いくつかの実施形態では、ディスプレイ要素１２０は、画像光を生成せず、代わりに、ローカルエリアからの光をアイボックスに透過するレンズである。たとえば、ディスプレイ要素１２０の一方または両方は、補正なしのレンズ（非処方）であるか、または、ユーザの視力の欠損を補正するのを助けるための処方レンズ（たとえば、単焦点、二焦点、および三焦点、または累進多焦点（ｐｒｏｇｒｅｓｓｉｖｅ））であり得る。いくつかの実施形態では、ディスプレイ要素１２０は、太陽からユーザの眼を保護するために、偏光および／または色付けされ得る。

いくつかの実施形態では、ディスプレイ要素１２０は追加の光学ブロック（図示せず）を含み得る。光学ブロックは、ディスプレイ要素１２０からの光をアイボックスに向ける１つまたは複数の光学要素（たとえば、レンズ、フレネルレンズなど）を含み得る。光学ブロックは、たとえば、画像コンテンツの一部または全部における収差を補正するか、画像の一部または全部を拡大するか、あるいはそれらの何らかの組合せを行い得る。

ＤＣＡは、ヘッドセット１００の周囲のローカルエリアの一部分についての深度情報を決定する。ＤＣＡは、１つまたは複数のイメージングデバイス１３０と、ＤＣＡコントローラ（図１Ａに図示せず）とを含み、照明器１４０をも含み得る。いくつかの実施形態では、照明器１４０は、ローカルエリアの一部分を光で照明する。光は、たとえば、赤外線（ＩＲ）における構造化光（たとえば、ドットパターン、バーなど）、飛行時間についてのＩＲフラッシュなどであり得る。いくつかの実施形態では、１つまたは複数のイメージングデバイス１３０は、照明器１４０からの光を含むローカルエリアの一部分の画像をキャプチャする。図示のように、図１Ａは、単一の照明器１４０と２つのイメージングデバイス１３０とを示す。代替実施形態では、照明器１４０がなく、少なくとも２つのイメージングデバイス１３０がある。

ＤＣＡコントローラは、キャプチャされた画像と１つまたは複数の深度決定技法とを使用して、ローカルエリアの一部分についての深度情報を算出する。深度決定技法は、たとえば、直接飛行時間（ＴｏＦ）深度検知、間接ＴｏＦ深度検知、構造化光、パッシブステレオ分析、アクティブステレオ分析（照明器１４０からの光によってシーンに追加されたテクスチャを使用する）、シーンの深度を決定するための何らかの他の技法、またはそれらの何らかの組合せであり得る。

オーディオシステムはオーディオコンテンツを提供する。オーディオシステムは、トランスデューサアレイと、センサーアレイと、オーディオコントローラ１５０とを含む。ただし、他の実施形態では、オーディオシステムは、異なるおよび／または追加の構成要素を含み得る。同様に、いくつかの場合には、オーディオシステムの構成要素に関して説明される機能性は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラの機能の一部または全部が、リモートサーバによって実施され得る。

トランスデューサアレイは、ユーザに音を提示する。トランスデューサアレイは、少なくとも１つの組織トランスデューサを含む複数のトランスデューサを含む。トランスデューサは、スピーカー１６０または組織トランスデューサ１７０（たとえば、骨伝導トランスデューサまたは軟骨伝導トランスデューサ）であり得る。スピーカー１６０はフレーム１１０の外部に示されているが、スピーカー１６０はフレーム１１０に囲まれ得る。いくつかの実施形態では、各耳のための個々のスピーカーの代わりに、ヘッドセット１００は、提示されたオーディオコンテンツの方向性を改善するためにフレーム１１０に組み込まれた複数のスピーカーを備えるスピーカーアレイを含む。組織トランスデューサ１７０は、ユーザの頭部に結合し、ユーザの組織（たとえば、骨または軟骨）を直接振動させて、音を生成する。オーディオシステムは、ヘッドセット１００のユーザにオーディオを提供するためのオーディオシステムを較正するために、組織トランスデューサ１７０を使用し得る。特に、組織トランスデューサ１７０は、ユーザのための対応するＨＲＴＦおよび／または幾何学的情報を決定するために、テスト音をヘッドセット１００のユーザに提示し得る。組織トランスデューサ１７０は、可動であり得る。たとえば、トランスデューサ１７０は、部分フレーム１１０に沿って摺動可能であり、フレーム１１０上のいくつかの位置から取付け可能および分離可能であり、ならびに／またはヘッドセット１００上の様々なロケーションに配置されるための任意の他の機能性を所有し得る。軟骨伝導を介してテスト音およびオーディオ信号を収集および使用することが、図２～図６Ａ／Ｂを参照しながら以下でより詳細に説明される。トランスデューサの数および／またはロケーションは、図１Ａに示されているものとは異なり得る。

センサーアレイは、ヘッドセット１００のローカルエリア内の音を検出する。センサーアレイは、複数の音響センサー１８０を含む。音響センサー１８０は、ローカルエリア（たとえば、部屋）中の１つまたは複数の音ソースから発せられた音をキャプチャする。各音響センサーは、音を検出し、検出された音を電子フォーマット（アナログまたはデジタル）に変換するように構成される。音響センサー１８０は、音響波センサー、マイクロフォン、音トランスデューサ、または音を検出するのに好適である同様のセンサーであり得る。

いくつかの実施形態では、１つまたは複数の音響センサー１８０は、各耳の耳道中に置かれ得る（たとえば、バイノーラルマイクロフォンとして働く）。いくつかの場合には、音響センサー１８０は、ヘッドセット１００が使用されている間、各耳の耳道中に常に存在し得るが、他の場合には、音響センサー１８０は、（たとえば、オーディオシステムが較正された後に）取外し可能であり得る。１つまたは複数の音響センサー１８０は、組織トランスデューサ１７０によって提示されたテスト音に応答したオーディオ信号を受信するために使用され得、これは、図２および図４を参照しながら以下でより詳細に説明される。いくつかの実施形態では、音響センサー１８０は、ヘッドセット１００の外面上に置かれるか、ヘッドセット１００の内面上に置かれるか、ヘッドセット１００とは別個（たとえば、何らかの他のデバイスの一部）であるか、またはそれらの何らかの組合せであり得る。音響センサー１８０の数および／またはロケーションは、図１Ａに示されているものとは異なり得る。たとえば、収集されたオーディオ情報の量ならびにその情報の感度および／または精度を増加させるために、音響検出ロケーションの数が増加され得る。音響検出ロケーションは、マイクロフォンが、ヘッドセット１００を装着しているユーザの周囲の広範囲の方向における音を検出することが可能であるように、配向され得る。

オーディオコントローラ１５０は、センサーアレイによって検出された音を表す、センサーアレイからの情報を処理する。オーディオコントローラ１５０は、プロセッサとコンピュータ可読記憶媒体とを備え得る。オーディオコントローラ１５０は、到来方向（ＤＯＡ）推定値を生成するか、音響伝達関数（たとえば、アレイ伝達関数および／または頭部伝達関数）を生成するか、音ソースのロケーションを追跡するか、音ソースの方向にビームを形成するか、音ソースを分類するか、スピーカー１６０のための音フィルタを生成するか、またはそれらの何らかの組合せを行うように構成され得る。

オーディオコントローラ１５０は、さらに、オーディオシステムの動作を制御する。オーディオコントローラは、組織トランスデューサ１７０を使用することによってなど、ヘッドセット１００のユーザのためのテスト情報を収集する。オーディオコントローラ１５０は、ユーザのＨＲＴＦおよび／またはユーザのための幾何学的情報を較正するためのテスト情報を収集するために、組織トランスデューサ１７０をユーザの耳上の様々な位置に配置するようにユーザに促し得る。ユーザは、オーディオコントローラ１５０が、ヘッドセット１００によってキャプチャされたデータ（たとえば、テスト情報）をヘッドセットの外部のシステムに送信することを可能にすることをオプトインし（ｏｐｔｉｎ）得、ユーザは、そのようなデータへのアクセスを制御するプライバシー設定を選択し得る。たとえば、オーディオコントローラ１５０は、ユーザのためのテスト情報をオーディオサーバに送信し得る。オーディオコントローラ１５０は、テスト情報に基づいて、オーディオサーバからユーザのための１つまたは複数のＨＲＴＦを表す情報を受信し得る。さらに、オーディオコントローラ１５０は、テスト情報に基づいて、オーディオサーバから幾何学的情報を受信し得る。オーディオコントローラおよびオーディオサーバによって実施されるこれらのプロセスの実施形態が、図２および図５を参照しながら以下でより詳細に説明される。

位置センサー１９０は、ヘッドセット１００の運動に応答して１つまたは複数の測定信号を生成する。位置センサー１９０は、ヘッドセット１００のフレーム１１０の一部分に位置し得る。位置センサー１９０は、慣性測定ユニット（ＩＭＵ）を含み得る。位置センサー１９０の例は、１つまたは複数の加速度計、１つまたは複数のジャイロスコープ、１つまたは複数の磁力計、運動を検出する別の好適なタイプのセンサー、ＩＭＵの誤差補正のために使用されるタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー１９０は、ＩＭＵの外部に、ＩＭＵの内部に、またはそれらの何らかの組合せで位置し得る。

いくつかの実施形態では、ヘッドセット１００は、ヘッドセット１００の位置のための同時位置特定およびマッピング（ＳＬＡＭ）と、ローカルエリアのモデルの更新とを提供し得る。たとえば、ヘッドセット１００は、カラー画像データを生成するパッシブカメラアセンブリ（ＰＣＡ）を含み得る。ＰＣＡは、ローカルエリアの一部または全部の画像をキャプチャする１つまたは複数のＲＧＢカメラを含み得る。いくつかの実施形態では、ＤＣＡのイメージングデバイス１３０の一部または全部が、ＰＣＡとしても機能し得る。ＰＣＡによってキャプチャされた画像と、ＤＣＡによって決定された深度情報とは、ローカルエリアのパラメータを決定するか、ローカルエリアのモデルを生成するか、ローカルエリアのモデルを更新するか、またはそれらの何らかの組合せを行うために使用され得る。さらに、位置センサー１９０は、部屋内のヘッドセット１００の位置（たとえば、ロケーションおよび姿勢）を追跡する。ヘッドセット１００の構成要素に関する追加の詳細は、図７に関して以下で説明される。

図１Ｂは、１つまたは複数の実施形態による、ＨＭＤとして実装されるヘッドセット１０５の斜視図である。ＡＲシステムおよび／またはＭＲシステムについて説明する実施形態では、ＨＭＤの前側の部分は、可視帯域（約３８０ｎｍ～７５０ｎｍ）内で少なくとも部分的に透明であり、ＨＭＤの前側とユーザの眼との間にあるＨＭＤの部分は、少なくとも部分的に透明である（たとえば、部分的に透明な電子ディスプレイ）。ＨＭＤは、前面剛体１１５とバンド１７５とを含む。ヘッドセット１０５は、図１Ａを参照しながら上記で説明された同じ構成要素の多くを含むが、ＨＭＤフォームファクタと一体化するように修正される。たとえば、ＨＭＤは、ディスプレイアセンブリと、ＤＣＡと、オーディオシステムと、位置センサー１９０とを含む。図１Ｂは、照明器１４０と、複数のスピーカー１６０と、複数のイメージングデバイス１３０と、複数の音響センサー１８０と、位置センサー１９０とを示す。スピーカー１６０は、（図示のように）バンド１７５に結合される、前面剛体１１５に結合されるなど、様々なロケーションにあり得、またはユーザの耳道内に挿入されるように構成され得る。

ＨＲＴＦを決定するためのシステム環境

図２は、一実施形態による、ユーザ２１０にカスタマイズされたＨＲＴＦを決定するための、軟骨伝導音を使用したシステム２００の概略図である。ユーザ２１０は、ネットワーク２９０を通してオーディオサーバ２８０に結合されたヘッドセット２２０を装着する。ヘッドセット２２０は、軟骨伝導音を収集して、ユーザ２１０のためのＨＲＴＦおよび／または幾何学的情報を決定するための、軟骨伝導トランスデューサ２３０とマイクロフォン２４０とを備えるオーディオシステムを含む。他の実施形態では、オーディオシステムは、ヘッドセット２２０以外の他のシステムまたはデバイスに組み込まれ得る。システム２００のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。

ヘッドセット２２０は、ユーザ２１０によって装着されるアイウェアデバイスである。図１Ａまたは図１Ｂ中のヘッドセットは、ヘッドセット２２０の一実施形態であり得る。ヘッドセット２２０のオーディオシステム（たとえば、図１Ａおよび図１Ｂのオーディオシステム）は、複数の軟骨伝導トランスデューサ２３０（たとえば、ユーザ２１０の両方の耳について１つ）および複数のマイクロフォン２４０または他の音響センサーを含み得る。ヘッドセット２２０の一方の側とユーザの単一の耳殻２４５に関するその機能とのみが図２に示されているが、本明細書のヘッドセット２２０の説明は、ユーザ２１０の左耳殻と右耳殻の両方に適用され得る。オーディオシステムは、図５を参照しながら以下でより詳細に説明される。

ヘッドセット２２０のオーディオシステムは、ユーザ２１０のためのテスト情報を収集する。オーディオシステム２２０は、ネットワーク２９０を介して、収集されたテスト情報をオーディオサーバ２８０に送信し得る。オーディオシステムは、オーディオサーバ２８０からのテスト情報を使用して決定された、ＨＲＴＦおよび／または幾何学的情報を受信し得る。代替実施形態では、ヘッドセット２２０は、テスト音およびオーディオ信号の組合せに対応する、ユーザ２１０の耳のＨＲＴＦおよび／または幾何学的情報を決定するために、テスト情報自体を処理する。テスト情報という用語は、テスト音および／またはテスト音に応答してキャプチャされたオーディオ信号を表すオーディオデータである。テスト情報は、個々のテスト音とテスト音に応答して受信されたオーディオ信号の組合せを含み得る。たとえば、いくつかの実施形態では、テスト情報は、ユーザの耳殻上の位置においてトランスデューサ（たとえば、軟骨伝導トランスデューサ）によって提示されたテスト音と、ユーザの耳道への入口において（たとえば、１つまたは複数の音響センサーによって）キャプチャされた対応するオーディオ信号の組合せを含む。いくつかの実施形態では、テスト情報は、トランスデューサが提示することが可能であるテスト音の周波数のセットなど、トランスデューサの特性をも含み得る。オーディオ信号自体は、軟骨伝導トランスデューサ２３０から出力されたオーディオ信号の短期または中期のバーストに対応し得る。これらのオーディオ信号の周波数特性が、詳細には、ユーザ２１０のためのＨＲＴＦまたはユーザ２１０の耳の幾何学的情報と直接相関する何らかの有用なテスト情報を抽出するために、選定され得る。

軟骨伝導トランスデューサ２３０は、ヘッドセット２２０のオーディオシステムからの命令に従って、１つまたは複数のテスト音をユーザ２１０に提示するように構成される。いくつかの実施形態では、軟骨伝導トランスデューサ２３０は、ユーザ２１０の一方または両方の耳殻上の様々なテスト位置に置かれ、テスト位置の各々において１つまたは複数のテスト音を発するように構成される。たとえば、軟骨伝導トランスデューサ２３０自体は、ヘッドセット２２０の部分フレーム（たとえば、フレーム１１０）に沿って摺動可能であり、ならびに／またはヘッドセット２２０上のいくつかの位置から取付け可能および分離可能であるなど、可動であり得る。別の例として、ユーザ２１０は、軟骨伝導トランスデューサ２３０を移動するために、ヘッドセット２２０のフレーム全体を再配置し得る。図示の実施形態では、テスト位置は、概して、耳殻２４５の上部分、耳殻２４５の中間部分、および耳殻２４５の下部分に対応する、耳殻２４５上のテスト位置２５０、２６０、および２７０を含む。軟骨伝導トランスデューサ２３０は、（テスト位置２６０の暗い部分によって示されているように）図２中のテスト位置２６０に置かれる。オーディオシステムは、ユーザ２１０のためのテスト情報を収集するために、軟骨伝導トランスデューサ２３０をユーザ２１０の耳殻２４５上の様々な位置に配置するようにユーザに促し得る。たとえば、オーディオシステムは、テスト位置２６０において１つまたは複数のテスト音およびオーディオ信号の組合せを収集した後に、軟骨伝導トランスデューサ２３０をテスト位置２５０および／またはテスト位置２７０に移動するようにユーザに促し得る。テスト位置２５０、２６０、および２７０は例示的であるにすぎず、耳殻２４５上の他のロケーションが、テスト位置として使用され得ることに留意されたい。たとえば、耳殻２４５の耳珠上にテスト位置があり得る。

マイクロフォン２４０は、ユーザ２１０の耳道への入口における音に対応するオーディオ信号をキャプチャする。音は、たとえば、トランスデューサ（たとえば、軟骨伝導トランスデューサ２３０、軟骨伝導トランスデューサアレイのトランスデューサ）、ヘッドセット２２０上のＨＲＴＦスピーカーアレイのスピーカー、またはそれらの何らかの組合せからのものであり得る。図示の実施形態では、オーディオ信号は、軟骨伝導トランスデューサ２３０がテスト音を提示したことに応答して、ユーザ２１０の耳道の入口においてマイクロフォン２４０によってキャプチャされる。さらに、いくつかの実施形態では、ユーザ２１０の他方の耳の耳道への入口に配置された別のマイクロフォン２４０がある。マイクロフォン２４０は、キャプチャされたオーディオ信号を、ヘッドセット２２０のオーディオシステムの他の構成要素（たとえば、オーディオコントローラ）に提供する。

ユーザ２１０のために収集されたテスト情報は、オーディオシステムによって、（たとえば、ヘッドセット２２０およびネットワーク２９０を介して）オーディオサーバ２８０に送られる。ネットワーク２９０は、データ送信のための任意の好適な通信ネットワークであり得る。いくつかの例示的な実施形態では、ネットワーク２９０は、インターネットであり、標準通信技術および／またはプロトコルを使用する。したがって、ネットワーク２９０は、イーサネット、８０２．１１、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス（ＷｉＭＡＸ）、３Ｇ、４Ｇ、デジタル加入者回線（ＤＳＬ）、非同期転送モード（ＡＴＭ）、ＩｎｆｉｎｉＢａｎｄ、ＰＣＩｅｘｐｒｅｓｓアドバンストスイッチングなどの技術を使用するリンクを含むことができる。いくつかの例示的な実施形態では、エンティティは、上記で説明されたものの代わりに、またはそれに加えて、カスタムデータ通信技術および／または専用データ通信技術を使用する。

オーディオサーバ２８０は、ヘッドセット２２０のオーディオシステムから受信されたテスト情報を処理する。オーディオサーバ２８０は、ヘッドセットユーザのためのＨＲＴＦを決定するために、テスト情報を処理し得る。オーディオサーバ２８０は、所与のテスト音およびオーディオ信号の組合せのためのＨＲＴＦを予測するために、ＨＲＴＦモデルを使用し得る。いくつかの実施形態では、オーディオサーバ２８０は、ユーザの耳殻のジオメトリを表す、ユーザのための幾何学的情報を決定し得る。幾何学的情報は、（たとえば、３次元メッシュ、サブ形状の集合、形状に関する表面法線の集合、ポイントクラウドの形態の形状に関するキーポイントおよびランドマークの集合などを介して）３次元オブジェクトを表すデータを指す。幾何学的情報は、ユーザの一方または両方の耳殻の一部または全部のジオメトリを表し得る。オーディオサーバ２８０は、所与のテスト音およびオーディオ信号の組合せのための幾何学的情報を予測するために、トレーニングされた耳殻ジオメトリモデルを使用し得る。オーディオサーバ２８０は、テスト情報に対応するＨＲＴＦを決定するために幾何学的情報を使用し得る。オーディオサーバ２８０は、ヘッドセット２２０の１つまたは複数のプロセスのために使用されるように、決定されたＨＲＴＦおよび／または幾何学的情報をヘッドセット２２０に提供し得る。たとえば、ヘッドセット２２０は、ＡＲ、ＶＲ、またはＭＲについての空間化オーディオをシミュレートするために、ＨＲＴＦを使用し得る。オーディオサーバ２８０は、図３～図４を参照しながら以下でより詳細に説明される。代替実施形態では、オーディオサーバ２８０によって実施されるプロセスの一部または全部は、ヘッドセットまたは他のデバイスのオーディオシステムによって実施され得る（たとえば、ヘッドセット１００のオーディオコントローラ１５０によって実施され得る）。

図３は、１つまたは複数の実施形態による、オーディオサーバ３００のブロック図である。図３の実施形態では、オーディオサーバ３００は、データストア３１０と、モデル生成モジュール３２０と、較正モジュール３３０と、ＨＲＴＦマッピングモジュール３４０と、耳殻ジオメトリマッピングモジュール３５０と、ＨＲＴＦシミュレーションモジュール３６０とを含む。オーディオサーバ３００のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。

データストア３１０は、オーディオサーバ３００による使用のためのデータを記憶する。データストア３１０中のデータは、たとえば、１つまたは複数のテスト位置についてのテスト情報、１つまたは複数のテスト位置についてのトレーニングテスト情報、１人または複数のユーザのためのＨＲＴＦ、１つまたは複数のモデル（たとえば、ＨＲＴＦモデル、耳殻ジオメトリモデルなど）、頭部関係ジオメトリ情報、耳殻ジオメトリ、１つまたは複数のテスト音、トランスデューサ特性、耳道中のマイクロフォンの音響伝達関数、およびオーディオサーバ３００による使用のために関連する他のデータ、またはそれらの任意の組合せを含み得る。トレーニングテスト情報は、１つまたは複数のモデルをトレーニングするために使用されるテスト情報である。トレーニングテスト情報は、ＨＲＴＦ（すなわち、トレーニングＨＲＴＦ）および／または幾何学的情報（すなわち、トレーニング幾何学的情報）で標示された、トレーニングユーザのためのキャプチャされたテスト音およびオーディオ信号の組合せを含み得る。トレーニングテスト情報は、トレーニングオーディオシステムを使用してトレーニングするためにキャプチャされ得、これは、図４を参照しながら以下でより詳細に説明される。

モデル生成モジュール３２０は、オーディオシステム（たとえば、ヘッドセット２２０のオーディオシステム）から受信されたテスト情報を処理するためにオーディオサーバ３００によって使用される１つまたは複数のモデルをトレーニングするためのトレーニングテスト情報を使用する。モデル生成モジュール３２０は、（たとえば、データストア３１０に記憶された）トレーニングテスト情報を使用して、ユーザのためのテスト音およびオーディオ信号の組合せをユーザのための対応するＨＲＴＦにマッピングするモデル（すなわち、ＨＲＴＦモデル）を生成および／または更新し得る。ＨＲＴＦモデルは、ユーザのための１つまたは複数のＨＲＴＦの表現を出力し得る。これらの表現は、（極座標系における仰角、方位角および半径によってパラメータ化された）３次元空間中の各ロケーションについてのスカラーのセットであり得る。これらの表現はまた、ＨＲＴＦを生成するためにインパルス応答基底関数の別のセットとともに使用され得る、（たとえば、１００未満の）数のセットであり得る。いくつかの実施形態では、ＨＲＴＦ表現はまた、上記で説明された、スカラーのセットと数のセットの組合せであり得る。追加または代替として、モデル生成モジュール３２０は、トレーニングテスト情報を使用して、テスト音およびオーディオ信号の組合せを、ユーザの耳殻を表す対応する幾何学的情報にマッピングするモデル（すなわち、耳殻ジオメトリモデル）を生成し得る。幾何学的情報は、ランドマークのキーポイントのセット、または３次元オブジェクトの２次元投影のセット、またはメッシュであり得るか、あるいは、幾何学的情報はまた、密なまたは疎なポイントクラウドであり得る。いくつかのインスタンス化では、幾何学的情報はまた、ポイントクラウドのメッシュによってキャプチャされた必要とされる情報を生成するために事前トレーニングされた基底関数のセットとともに使用され得る、スカラーのセットであり得る。

モデル生成モジュール３２０は、１つまたは複数のトレーニングユーザのためのＨＲＴＦ（すなわち、トレーニングＨＲＴＦ）を決定する。いくつかの実施形態では、モデル生成モジュール３２０は、トレーニング情報がトレーニングユーザの耳殻の形状についてのグランドトゥルースとしてそこから取得された、トレーニングユーザに固有の頭部関係ジオメトリを使用する。モデル生成モジュール３２０は、トレーニングユーザの頭部関係ジオメトリ（および、特に耳殻ジオメトリ）に固有のトレーニングユーザのためのＨＲＴＦをシミュレートし得る。そのシミュレーションは、以下でＨＲＴＦシミュレーションモジュール３６０によって実施されるようなシミュレーションと同じであり得る。いくつかの実施形態では、モデル生成モジュール３２０は、（たとえば、図４に関して以下で説明されるように）オーディオトレーニングシステムから、１人または複数のトレーニングユーザのためのＨＲＴＦを受信する。他の実施形態では、モデル生成モジュール３２０は、（たとえば、図４に関して以下で説明されるように）ＨＲＴＦスピーカーアレイから発せられたテスト音に応答して耳道への入口においてマイクロフォンを介して受信されたオーディオ音が与えられれば、１人または複数のトレーニングユーザのためのＨＲＴＦを決定する。

モデル生成モジュール３２０は、限定はしないが、サポートベクターマシンと、人工ニューラルネットワークと、線形およびカーネル化（ｋｅｒｎｅｌｉｚｅｄ）回帰と、最近傍と、ブースティングおよびバギングと、単純ベイズおよびベイズ回帰と、デシジョンツリーと、ランダムフォレストと、関係する統計的および計算論的学習モデルとを含む、様々な教師あり学習技法を使用して、１つまたは複数のモデルをトレーニングし得る。モデル生成モジュール３２０は、１人または複数のトレーニングユーザから収集された情報を使用して、１つまたは複数のモデルをトレーニングし得る。情報は、各トレーニングユーザについて、たとえば、（たとえば、複数の異なるテスト位置についてのテスト音とオーディオ信号の組合せと標示された）トレーニングテスト情報、トレーニングユーザのための２つの形状情報（特に、耳殻の一方または両方を表す高解像度幾何学的情報）をキャプチャする頭部関係ジオメトリおよび耳関係ジオメトリ、ユーザのためのＨＲＴＦ、１つまたは複数のトランスデューサ（すなわち、テスト音を発するために使用されるもの）の特性、テスト音についてオーディオ信号をキャプチャするために使用される音響センサーに対応する音響センサー伝達関数、またはそれらの何らかの組合せを含み得る。トレーニングされたモデルは、ユーザから決定されたテスト情報（たとえば、所与のテスト音についてのキャプチャされたオーディオ信号）が与えられれば、ユーザの一方または両方の耳殻を表すジオメトリ情報および／あるいはユーザのＨＲＴＦを表す情報を出力し得る。

いくつかの実施形態では、モデル生成モジュール３２０は、ユーザの一方または両方の耳殻を表すジオメトリ情報および／あるいはユーザのＨＲＴＦを表す情報を出力することができる単一のトレーニングされたモデルを生成する。他の実施形態では、モデル生成モジュール３２０は、ユーザからのテスト情報に基づいて、そのユーザの一方または両方の耳殻を表すジオメトリ情報を出力することができる単一のトレーニングされたモデル（すなわち、耳殻ジオメトリモデル）を生成し、ユーザからのテスト情報に基づいて、そのユーザのＨＲＴＦを表す情報を出力することができる単一のトレーニングされたモデル（すなわち、ＨＲＴＦモデル）を生成する。いくつかの実施形態では、モデル生成モジュール３２０は、複数の耳殻ジオメトリモデルおよび／またはＨＲＴＦモデルを生成する。たとえば、モデル生成モジュール３２０によって受信されたテスト情報は、較正モジュール３３０に関して以下で説明されるような、複数のテスト位置から提示されるテスト音を含み得る。この場合、モデル生成モジュール３２０は、複数のテスト位置からの各テスト位置についてのＨＲＴＦモデルおよび／または耳殻ジオメトリモデルをトレーニングし得る。別の例として、モデル生成モジュール３２０は、ユーザの各耳殻について１つまたは複数の別個のＨＲＴＦモデルおよび／または耳殻ジオメトリモデル（たとえば、左耳ＨＲＴＦモデルおよび右耳ＨＲＴＦモデル）を生成し得る。

較正モジュール３３０は、オーディオサーバ３００の１つまたは複数のプロセスにおいて使用するためのデータ収集を容易にし得る。較正モジュール３３０は、それぞれのテスト情報を収集するために、トランスデューサをユーザの耳殻上の１つまたは複数の位置に配置するように１つまたは複数のオーディオシステムのユーザに促すために、（たとえば、ネットワーク２９０を介して）１つまたは複数のオーディオシステムと（たとえば、ヘッドセット２２０のオーディオシステムと）通信し得る。たとえば、較正モジュール３３０は、トランスデューサを１つまたは複数の位置に配置するようにユーザに促すための命令を生成し、その命令を１つまたは複数のオーディオシステムに提供し得る。１つまたは複数の位置は、モデルをトレーニングするためにモデル生成モジュール３２０によって使用されるトレーニングテスト情報を収集するために使用される、１つまたは複数の位置に対応し得る。たとえば、モデル生成モジュール３２０は、ある位置に配置されたトレーニング軟骨伝導トランスデューサを含むトレーニングオーディオシステムから、トレーニングテスト情報を受信し得る。この場合、較正モジュール３３０は、トランスデューサをトレーニング軟骨伝導トランスデューサと同じ位置（たとえば、テスト位置２６０）に配置するようにユーザに促し得る。トレーニングオーディオシステムを用いてトレーニングテスト情報を収集することは、図４を参照しながら以下でより詳細に説明される。較正モジュール３３０は、オーディオシステムに、ユーザの耳殻の一方または両方上のあらかじめ定義されたテスト位置のセットについてのテスト情報を取得するように命令し得る。いくつかの実施形態では、複数のテスト音が発せられ、複数のテスト音は同じ（たとえば、同じ１つまたは複数の周波数）であり、トランスデューサの各テスト位置におけるテスト音についての複数のオーディオ信号がキャプチャされる。特定のテスト位置から発せられた特定のテスト音についてのデータの複数のインスタンスが、処理中のデータにおける誤差を低減するのを助け得る。いくつかの実施形態では、トランスデューサの各テスト位置において発せられた複数のテスト音があり、複数のテスト音のうちの少なくとも１つが、複数のテスト音のうちの別のテスト音とは異なる。たとえば、各々が異なる周波数（または周波数の範囲）を有するテスト音のセットがあり得、オーディオサーバ３００は、オーディオシステムに、トランスデューサの各テスト位置についてのテスト音のセットの一部または全部を提示するように命令する。オーディオサーバ３００は、オーディオシステムから（たとえば、ネットワーク２９０を介して）テスト情報を受信する。

いくつかの実施形態では、較正モジュール３３０は、１つまたは複数のオーディオシステムからのテスト情報を使用して、１つまたは複数のモデルを更新し得る。たとえば、較正モジュール３３０は、さらに、１つまたは複数のオーディオシステムのユーザからの情報を使用して、１つまたは複数のモデルをトレーニングし得る。情報は、各ユーザについて、たとえば、（たとえば、複数の異なるテスト位置についてのテスト音とオーディオ信号の組合せと標示された）テスト情報、１つまたは複数のトランスデューサ（すなわち、テスト音を発するために使用されるもの）の特性、テスト音についてオーディオ信号をキャプチャするために使用される音響センサーに対応する音響センサー伝達関数、またはそれらの何らかの組合せを含み得る。このようにして、較正モジュール３３０は、たとえば、ユーザのためのテスト情報が与えられれば、そのユーザのためのＨＲＴＦおよび／または幾何学的情報を予測する際の、１つまたは複数のモデルの有効性を増加させ続け得る。

ＨＲＴＦマッピングモジュール３４０は、ＨＲＴＦモデルを使用して、ユーザのためのテスト音とオーディオ信号の組合せを、対応するＨＲＴＦにマッピングする。ＨＲＴＦマッピングモジュール３４０は、オーディオサーバ３００の別の構成要素（たとえば、データストア３１０）から、および／またはオーディオシステム（たとえば、ヘッドセット２２０のオーディオシステム）から直接、テスト情報を取得し得る。ＨＲＴＦマッピングモジュール３４０は、ＨＲＴＦモデルを使用して、テスト音およびオーディオ信号の組合せのうちの１つまたは複数を、ユーザのためのＨＲＴＦのセットを表す情報にマッピングする。情報は、たとえば、ユーザのためのＨＲＴＦ、テスト音周波数およびソース位置が与えられればＨＲＴＦを提供する関数および／またはモデル、ユーザのためのＨＲＴＦを決定するために使用され得る何らかの他の情報、あるいはそれらの何らかの組合せであり得る。ＨＲＴＦは、いくつかの表現フォーマットのうちの１つにおいてオーディオシステムに提供され得る。これらの表現は、（極座標系における仰角、方位角および半径によってパラメータ化された）３次元空間中の各ロケーションについてのスカラーのセットであり得る。これらの表現はまた、インパルス応答基底関数の別のセットとともに利用されるとき、ＨＲＴＦを生成することになる、（１００未満の）数のセットであり得る。いくつかのインスタンス化では、ＨＲＴＦ表現はまた、上記の両方の組合せであり得る。

いくつかの実施形態では、ＨＲＴＦマッピングモジュール３４０は、ユーザのために決定されたＨＲＴＦのセットの精度を改善するために、テスト音およびオーディオ信号の組合せのうちの１つまたは複数についてのＨＲＴＦモデルによって出力された情報を比較し（たとえば、組み合わせるか、平均化するか、または場合によっては処理し）得る。いくつかの実施形態では、ＨＲＴＦマッピングモジュール３４０はまた、ユーザのためのＨＲＴＦのセットを表す情報を決定するためにＨＲＴＦモデルへの入力として、（１）所与のテスト音およびオーディオ信号の組合せを取得するために使用されるトランスデューサの特性、ならびに／または、（２）テスト音およびオーディオ信号の組合せについてオーディオ信号をキャプチャするために使用される音響センサーに対応する伝達関数（たとえば、マイクロフォン伝達関数）を使用する。ＨＲＴＦマッピングモジュール３４０は、ユーザのためのＨＲＴＦのセットを表す情報をオーディオシステムに提供し得る。

耳殻ジオメトリマッピングモジュール３５０は、耳殻ジオメトリモデルを使用して、１人または複数のユーザのためのテスト音とオーディオ信号の組合せを、１人または複数のユーザの耳殻を表す対応する幾何学的情報にマッピングする。耳殻マッピングモジュール３４０は、オーディオサーバ３００の別の構成要素（たとえば、データストア３１０）から、および／またはオーディオシステム（たとえば、ヘッドセット２２０のオーディオシステム）から直接、テスト情報を取得し得る。耳殻ジオメトリマッピングモジュール３５０は、耳殻ジオメトリモデルを使用して、テスト情報（たとえば、テスト音およびオーディオ信号の組合せ）を、ユーザの耳殻を表す対応する幾何学的情報にマッピングし得る。いくつかの実施形態では、耳殻ジオメトリマッピングモジュール３５０はまた、ユーザの耳殻を表す幾何学的情報を決定するために耳殻ジオメトリモデルへの入力として、（１）所与のテスト音およびオーディオ信号の組合せを取得するために使用されるトランスデューサの特性、ならびに／または、（２）テスト音およびオーディオ信号の組合せについてオーディオ信号をキャプチャするために使用される音響センサーに対応する伝達関数（たとえば、マイクロフォン伝達関数）を使用する。耳殻ジオメトリマッピングモジュール３５０は、幾何学的情報を、ユーザのオーディオシステム、さらなる処理のためのオーディオサーバ３００の他の構成要素（たとえば、ＨＲＴＦシミュレーションモジュール３６０）、製造システム、またはそれらの何らかの組合せに提供し得る。

ＨＲＴＦシミュレーションモジュール３６０は、ユーザのための１つまたは複数のＨＲＴＦを決定するために、ユーザの頭部のシミュレートされた位置に対する異なるロケーションにおいて、オーディオソースからの音の伝搬をシミュレートする。ＨＲＴＦシミュレーションモジュール３６０は、ユーザのＨＲＴＦを決定するために、（たとえば、耳殻ジオメトリマッピングモジュール３５０からの出力としての）頭部関係ジオメトリ、および詳細には、耳関係ジオメトリを表す幾何学的情報を使用し得る。たとえば、幾何学的情報は、ユーザの頭部および／または耳殻の３次元メッシュを含み得る。シミュレートされたＨＲＴＦを決定するために、シミュレーションモジュール３５０は、取得された幾何学的情報（たとえば、ユーザの耳殻ジオメトリおよび頭部／肩ジオメトリ）が与えられれば、シミュレートされた音ソースからユーザのシミュレートされた耳道に音がどのように伝搬するかをシミュレートするために、数値シミュレーションを使用し得る。たとえば、ＨＲＴＦシミュレーションモジュール３６０は、参照により本明細書に組み込まれる、２０１８年５月１１日に出願された、「Ｈｅａｄ－ＲｅｌａｔｅｄＴｒａｎｓｆｅｒＦｕｎｃｔｉｏｎＰｅｒｓｏｎａｌｉｚａｔｉｏｎＵｓｉｎｇＳｉｍｕｌａｔｉｏｎ」と題する同時係属米国特許出願第６２／６７０，６２８号（代理人整理番号＃３１７１８－３６８００）において説明される方法のいずれかを使用して、シミュレートされたＨＲＴＦを決定し得る。ＨＲＴＦシミュレーションモジュール３６０は、シミュレーションの結果に基づいて、ユーザのためのシミュレートされたＨＲＴＦを作り出す。いくつかの実施形態では、ＨＲＴＦシミュレーションモジュール３６０は、テスト音およびオーディオ信号の組合せならびに／または幾何学的情報が、対応するＨＲＴＦにマッピングするように、シミュレーション結果に基づいてＨＲＴＦモデルおよび／または耳殻ジオメトリモジュールを更新する。

いくつかの実施形態では、耳殻ジオメトリマッピングモジュール３５０によって決定された幾何学的情報は、ウェアラブルデバイスの設計および／または製造のために使用され得る。たとえば、オーディオサーバ３００および／または製造システムは、幾何学的情報に対応する、ユーザにフィットするようにカスタマイズされたウェアラブルデバイス（たとえば、人工現実ヘッドセット）を表す設計ファイルを生成するために、幾何学的情報を使用し得る。設計ファイルは、イヤバッド、他のヘッドフォン、または組織トランスデューサなど、ユーザの耳にフィットし得るデバイス（たとえば、インイヤデバイス）のジオメトリを表す情報を含み得る。設計ファイルは、設計ファイルの仕様に基づいてインイヤデバイスを作製するために、たとえば、製造システムによって使用され得る。そうする際に、インイヤデバイスは、ユーザの耳の形状によりぴったりフィットすること、または一致することなど、ユーザの耳にフィットするようにカスタマイズされ得る。さらに、インイヤデバイスは、ヘッドセットデバイス（たとえば、ヘッドセット１００またはヘッドセット１０５）など、別のデバイスの構成要素として製造され得る。同じまたは異なる実施形態では、オーディオサーバ３００は、複数のユーザに対応する設計ファイルを（たとえば、データストア３１０に）記憶し得る。この場合、サーバ３００またはサードパーティは、複数の設計ファイルのうちの１つまたは複数を使用して、１つまたは複数の設計ファイルに基づいて、集約された設計ファイルを生成し得る。たとえば、集約された設計ファイルは、１つまたは複数の設計ファイルにわたる平均仕様（たとえば、平均頭部直径、平均耳殻外周など）を含み得る。

図４は、一実施形態による、トレーニングユーザのためのトレーニングテスト情報を収集するためのトレーニングオーディオシステム４００の斜視図である。トレーニングユーザ（たとえば、トレーニングユーザ４４０）は、１つまたは複数のモデルをトレーニングするための情報（たとえば、頭部関係幾何学的情報、ＨＲＴＦ）がそこから決定される、テスト対象である。テスト対象は、人間または人間の物理モデルであり得る。図４の実施形態では、トレーニングオーディオシステム４００は、ＤＣＡ４１０と、１つまたは複数のトランスデューサ（たとえば、トランスデューサ４２０）と、マイクロフォン４２５と、コントローラ４３０とを含む。トレーニングオーディオシステム４００のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。いくつかの実施形態では、トレーニングオーディオシステム４００の構成要素の一部または全部が、無響室中にある。図示のように、トレーニングユーザ４４０は、オーディオシステムを含むヘッドセット（たとえば、ヘッドセット１００）を装着していないが、他の実施形態では、トレーニングユーザがヘッドセットを装着している間に、情報が収集される。これらのインスタンスでは、トレーニングオーディオシステム４００の部分が、ヘッドセットの一部でもあり得る。たとえば、トランスデューサ３２０およびマイクロフォン４２５は、ヘッドセットのオーディオシステムの一部であり得る。さらに、トレーニングユーザ４４０の頭部の一方の側および単一の耳殻４５０のみが図４に示されているが、本明細書のトレーニングオーディオシステム４００の説明は、ユーザ４４０の頭部のすべての側および左耳殻と右耳殻の両方に適用される。

ＤＣＡ４１０は、複数のトレーニングユーザの頭部関係ジオメトリを表す幾何学的情報（すなわち、トレーニング幾何学的情報）を収集する。たとえば、図４では、ＤＣＡ４１０は、トレーニングユーザ４４０の幾何学的情報を収集している。ＤＣＡ４１０は、１つまたは複数のイメージングデバイスを含み、ＤＣＡコントローラを含み得る（図４に図示せず）。いくつかの実施形態では、１つまたは複数のイメージングデバイスは、トレーニングユーザの耳および頭部の部分の画像、ビデオ、または３次元走査をキャプチャするために使用される。画像は、トレーニングユーザの各々の一方または両方の耳殻を含む。ＤＣＡ４１０は、いくつかの角度から（たとえば、トレーニングユーザの周りを移動すること、ＤＣＡ４１０に対して回転するようにユーザに促すことなどによって）トレーニングユーザの画像走査を取得し得る。いくつかの実施形態では、ＤＣＡ４１０は、トレーニングユーザのいくつかの部分（すなわち、耳殻）の高解像度走査を取得しながら、トレーニングユーザの他の部分（たとえば、頭部および肩）の低解像度走査を取得し得る。各トレーニングユーザについて、ＤＣＡ４１０は、そのトレーニングユーザの走査を使用して、頭部関係ジオメトリを生成する。たとえば、図示のように、ＤＣＡ４１０は、トレーニングユーザ４４０の頭部の一部分を画像化する。頭部の一部分は、トレーニングユーザの耳殻４５０を含む。ＤＣＡ４１０は、頭部の画像化された部分の頭部関係ジオメトリを生成する。頭部関係ジオメトリは、トレーニングユーザの頭部の３次元ジオメトリを表す。頭部関係ジオメトリは、一方または両方の耳殻の３次元ジオメトリを表し、いくつかの実施形態では、頭部の他の部分、肩、またはそれらの何らかの組合せの３次元ジオメトリを表し得る。また、いくつかのインスタンスでは、頭部関係ジオメトリはヘッドセットを含み得る。いくつかのインスタンスでは、ヘッドセットは、頭部が走査された間、トレーニングユーザによって装着され得る。他の実施形態では、ヘッドセットは、頭部関係ジオメトリを生成するためにトレーニングユーザの頭部の３次元モデルと組み合わせられたヘッドセットの３次元仮想モデルである。いくつかの実施形態では、頭部関係ジオメトリは、３次元メッシュ、代表的３次元形状（たとえば、ボクセル）の組合せ、トレーニングユーザの頭部の走査された部分の何らかの他の表現、またはそれらの何らかの組合せであり得る。

トランスデューサ４２０は、コントローラ４３０からの命令に従って、１つまたは複数のテスト音をトレーニングユーザに提示するように構成される。図示のように、トランスデューサ４２０は、トレーニングテスト情報を収集するために使用される軟骨伝導トランスデューサ（すなわち、トレーニング軟骨伝導トランスデューサ）である。いくつかの実施形態では、トランスデューサ４２０は、トレーニングユーザの一方または両方の耳殻上の様々なテスト位置に置かれ、テスト位置の各々において１つまたは複数のテスト音を発するように構成される。これらの様々なテスト位置は、各々、ユーザのためのＨＲＴＦおよび／または幾何学的情報を決定するためにユーザのためのテスト情報を収集するためのヘッドセットデバイス（たとえば、ヘッドセット１００、１０５、または２２０）によって使用される位置に対応し得る。たとえば、ヘッドセットデバイスは、テスト位置４６５、すなわち、トランスデューサ４２０が現在図４において配置されているところと同じ位置に配置されたトランスデューサを含み得る。図示の実施形態では、テスト位置は、概して、それぞれ、耳殻の上部分、耳殻の中間部分、耳殻の下部分、および耳殻の耳珠に対応する、テスト位置４６０、４６５、４７０、および４７５を含む。これらの部分は例示的であるにすぎず、耳殻上の他のロケーションが、テスト位置として使用され得ることに留意されたい。

示されていない実施形態では、トランスデューサ４２０は、複数の軟骨伝導トランスデューサを含む軟骨伝導トランスデューサアレイと置き換えられる。軟骨伝導トランスデューサは、耳殻４５０上の異なるテスト位置に位置し得る。たとえば、トレーニングユーザの各耳殻は、コントローラ４３０からの命令に従ってテスト音を発するように構成された軟骨伝導トランスデューサアレイとフィットし得る。

他の実施形態では、トランスデューサ３２０は、何らかの他のタイプのトランスデューサ（たとえば、空気または骨）であり得る。これらの他のタイプのトランスデューサは、図示されたものとは異なるテスト位置に置かれ得る。たとえば、骨伝導トランスデューサについてのテスト位置が、耳殻の後ろに位置し、耳殻の代わりに頭蓋骨（たとえば、乳様突起）に結合され得、空気伝導トランスデューサが、トレーニングユーザによって装着されたヘッドセット上に位置し得る、などである。

さらに、（示されていない）いくつかの実施形態では、トレーニングオーディオシステム４００は、トレーニングユーザに対して異なるロケーションに配置された複数のスピーカーを含むＨＲＴＦスピーカーアレイを含む。スピーカーの各々は、スピーカーから発せられた音がトレーニングユーザ４４０に対する異なる相対位置にあるように配置される。発せられた音は、たとえば、チャープ、トーンなどであり得る。

マイクロフォン４２５は、トレーニングユーザの耳道への入口における音に対応するオーディオ信号をキャプチャする。音は、たとえば、トランスデューサ（たとえば、トランスデューサ４２０、軟骨伝導トランスデューサアレイのトランスデューサ）、トレーニングユーザ４４０によって装着されたヘッドセット上のトランスデューサ、ＨＲＴＦスピーカーアレイのスピーカー、またはそれらの何らかの組合せからのものであり得る。図示の実施形態では、オーディオ信号は、トランスデューサ４２０がテスト音を提示したことに応答して、トレーニングユーザ４４０の耳道の入口４９０においてキャプチャされる。さらに、いくつかの実施形態では、トレーニングユーザ４４０の他方の耳の耳道への入口に配置された別のマイクロフォン４２５がある。マイクロフォン４２５は、キャプチャされたオーディオ信号をコントローラ４３０に提供する。

コントローラ４３０は、トレーニングオーディオシステム４００の構成要素を制御する。コントローラ４３０は、トランスデューサ４２０、軟骨伝導トランスデューサアレイの１つまたは複数のトランスデューサ、ヘッドセット上の１つまたは複数のトランスデューサ、ＨＲＴＦスピーカーアレイの１つまたは複数のスピーカー、またはそれらの何らかの組合せに、テスト音を発するように命令する。コントローラ４３０は、マイクロフォン４２５から、テスト音に対応するオーディオ信号を受信する。図示の実施形態では、コントローラ４３０は、トランスデューサ４２０に、１つまたは複数のテスト音を発するように命令し、対応するオーディオ信号が、マイクロフォン４２５から受信され、トランスデューサ４２０は、次いで、異なるテスト位置（たとえば、４６０、４７０、または４７５）に移動され、次いで、そのプロセスは繰り返す。このようにして、コントローラ４３０は、各テスト位置についてのテスト情報（すなわち、１つまたは複数のオーディオ信号および１つまたは複数の対応するテスト音）を収集する。

コントローラ４３０は、ＤＣＡ４１０に、トレーニングユーザ４４０のための頭部関係ジオメトリを生成するように命令する。トレーニングユーザ４４０の一方または両方の耳殻の３次元ジオメトリを表す情報を含む頭部関係ジオメトリ。コントローラ４３０は、ＤＣＡ４１０に、トレーニングユーザ４４０の異なる部分（たとえば、頭部の側面、顔、肩など）の走査をキャプチャするために、（たとえば、１つまたは複数のアクチュエータを介して）異なる位置に移動するように命令し得る。

コントローラ４３０は、トレーニングユーザの一方または両方の耳のためのＨＲＴＦを決定し得る。テスト音がＨＲＴＦスピーカーアレイから発せられる、実施形態では、コントローラ４３０は、検出された音に部分的に基づいて、トレーニングユーザの一方または両方の耳のためのＨＲＴＦを決定し得る。他の実施形態では、コントローラは、トレーニングユーザのためのＨＲＴＦをシミュレートするために、トレーニングユーザのための頭部関係ジオメトリを使用し得る。ＨＲＴＦのシミュレーションは、図３を参照しながら上記で説明されたＨＲＴＦシミュレーションに関して上記で説明されたシミュレーションと同じであり得る。

コントローラ４３０は、テスト情報、上記で説明された頭部関係ジオメトリ、一方または両方の耳のためのＨＲＴＦ、またはそれらの何らかの組合せを、オーディオサーバ２８０に提供し得る。オーディオサーバ２８０は、１つまたは複数のモデル（たとえば、ＨＲＴＦモデル、耳殻ジオメトリモデル）をトレーニングするために、受信された情報を使用し得る。他の実施形態では、トレーニングオーディオシステム４００は、図３を参照しながら上記で説明されたプロセスを使用して、１つまたは複数のモデルをトレーニングし得る。トレーニングオーディオシステム４００は、次いで、トレーニングされた１つまたは複数のモデルを、たとえば、オーディオサーバ３００に提供し得る。また、いくつかの実施形態では、トレーニングされた１つまたは複数のモデルは、（たとえば、ヘッドセットの一部である）１つまたは複数のオーディオシステム上にローカルにインストールされ得る。

図５は、１つまたは複数の実施形態による、オーディオシステム５００のブロック図である。図１Ａ、図１Ｂ、および／または図２中のオーディオシステムは、オーディオシステム５００の一実施形態であり得る。オーディオシステム５００は、ユーザのための１つまたは複数の音響伝達関数を生成する。オーディオシステム５００は、ユーザのためのオーディオコンテンツを生成するために１つまたは複数の音響伝達関数を使用し得る。図５の実施形態では、オーディオシステム５００は、トランスデューサアレイ５１０と、センサーアレイ５２０と、オーディオコントローラ５３０とを含む。オーディオシステム５００のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、いくつかの場合には、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。

トランスデューサアレイ５１０は、オーディオコンテンツを提示するように構成される。トランスデューサアレイ５１０は、複数のトランスデューサを含む。トランスデューサは、オーディオコンテンツを提供するデバイスである。トランスデューサは、たとえば、スピーカー（たとえば、スピーカー１６０）、組織トランスデューサ（たとえば、組織トランスデューサ１７０）、オーディオコンテンツを提供する何らかの他のデバイス、またはそれらの何らかの組合せであり得る。組織トランスデューサは、骨伝導トランスデューサまたは軟骨伝導トランスデューサとして機能するように構成され得る。トランスデューサアレイ５１０は、空気伝導を介して（たとえば、１つまたは複数のスピーカーを介して）、骨伝導を介して（１つまたは複数の骨伝導トランスデューサを介して）、軟骨伝導オーディオシステムを介して（１つまたは複数の軟骨伝導トランスデューサを介して）、またはそれらの何らかの組合せでオーディオコンテンツを提示し得る。たとえば、いくつかの実施形態では、トランスデューサアレイ５１０は、ユーザの各耳について単一の軟骨伝導トランスデューサを含む。いくつかの実施形態では、トランスデューサアレイ５１０は、周波数範囲の異なる部分をカバーするための１つまたは複数のトランスデューサを含み得る。たとえば、周波数範囲の第１の部分をカバーするために圧電トランスデューサが使用され得、周波数範囲の第２の部分をカバーするために可動コイルトランスデューサが使用され得る。

骨伝導トランスデューサは、ユーザの頭部における骨／組織を振動させることによって音響圧力波を生成する。骨伝導トランスデューサは、ヘッドセットの一部分に結合され得、耳介（ａｕｒｉｃｌｅ）の後ろでユーザの頭蓋骨の一部分に結合されるように構成され得る。骨伝導トランスデューサは、オーディオコントローラ５３０から振動命令を受信し、受信された命令に基づいてユーザの頭蓋骨の一部分を振動させる。骨伝導トランスデューサからの振動は、鼓膜を迂回して、ユーザの蝸牛のほうへ伝搬する組織伝搬音響圧力波を生成する。

軟骨伝導トランスデューサは、ユーザの耳の耳介軟骨の１つまたは複数の部分を振動させることによって音響圧力波を生成する。軟骨伝導トランスデューサは、ヘッドセットの一部分に結合され得、耳の耳介軟骨の１つまたは複数の部分に結合されるように構成され得る。たとえば、軟骨伝導トランスデューサは、ユーザの耳の耳介の背面に結合し得る。軟骨伝導トランスデューサは、外耳の周りの耳介軟骨に沿ったどこか（たとえば、耳殻、耳珠、耳介軟骨の何らかの他の部分、またはそれらの何らかの組合せ）に位置し得る。耳介軟骨の１つまたは複数の部分を振動させることは、耳道外の空気伝搬音響圧力波、耳道のいくつかの部分を振動させ、それにより、耳道内に空気伝搬音響圧力波を生成させる、組織伝搬音響圧力波、またはそれらの何らかの組合せを生成し得る。生成された空気伝搬音響圧力波は、耳道に沿って鼓膜のほうへ伝搬する。

トランスデューサアレイ５１０は、オーディオコントローラ５３０からの命令に従ってオーディオコンテンツを生成する。いくつかの実施形態では、オーディオコンテンツが空間化される。空間化オーディオコンテンツは、特定の方向および／またはターゲット領域（たとえば、ローカルエリアにおけるオブジェクトおよび／または仮想オブジェクト）から発生するように思われるオーディオコンテンツである。たとえば、空間化オーディオコンテンツは、オーディオシステム５００のユーザから部屋の向こうの仮想歌手から音が発生しているように思わせることができる。トランスデューサアレイ５１０は、ユーザのために較正されたＨＲＴＦを使用して、空間化オーディオコンテンツを生成し得る。トランスデューサアレイ５１０は、ウェアラブルデバイス（たとえば、ヘッドセット１００またはヘッドセット１０５）に結合され得る。代替実施形態では、トランスデューサアレイ５１０は、ウェアラブルデバイスとは別個である（たとえば、外部コンソールに結合された）複数のスピーカーであり得る。

センサーアレイ５２０は、センサーアレイ５２０の周囲のローカルエリア内の音を検出する。センサーアレイ５２０は、各々音波の空気圧力変動を検出し、検出された音を電子フォーマット（アナログまたはデジタル）に変換する、複数の音響センサーを含み得る。複数の音響センサーは、ヘッドセット（たとえば、ヘッドセット１００および／またはヘッドセット１０５）上に、ユーザ上に（たとえば、ユーザの耳道中に）、ネックバンド上に、またはそれらの何らかの組合せで配置され得る。センサーアレイ５２０は、各耳道の入口に置かれるべきマイクロフォンを含む。いくつかの実施形態では、これらのマイクロフォンは、一時的にセンサーアレイ５２０の一部であり、（たとえば、較正が行われた後に）センサーアレイ５２０から取り外され得る。音響センサーは、たとえば、マイクロフォン、振動センサー、加速度計、またはそれらの任意の組合せであり得る。いくつかの実施形態では、センサーアレイ５２０は、複数の音響センサーのうちの少なくともいくつかを使用して、トランスデューサアレイ５１０によって生成されたオーディオコンテンツを監視するように構成される。センサーの数を増加させることは、トランスデューサアレイ５１０によって作り出された音場および／またはローカルエリアからの音を表す情報（たとえば、方向性）の精度を改善し得る。

オーディオコントローラ５３０は、オーディオシステム５００の動作を制御する。図５の実施形態では、オーディオコントローラ５３０は、データストア５３５と、ＤＯＡ推定モジュール５４０と、伝達関数モジュール５５０と、追跡モジュール５６０と、ビームフォーミングモジュール５７０と、音フィルタモジュール５８０と、較正モジュール５９０とを含む。オーディオコントローラ５３０は、いくつかの実施形態では、ヘッドセット内に位置し得る。オーディオコントローラ５３０のいくつかの実施形態は、ここで説明されるものとは異なる構成要素を有する。同様に、機能は、ここで説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コントローラのいくつかの機能が、ヘッドセットの外部で実施され得る。ユーザは、オーディオコントローラ５３０が、ヘッドセットによってキャプチャされたデータをヘッドセットの外部のシステムに送信することを可能にすることをオプトインし得、ユーザは、そのようなデータへのアクセスを制御するプライバシー設定を選択し得る。

データストア５３５は、オーディオシステム５００による使用のためのデータを記憶する。データストア５３５中のデータは、オーディオシステム５００のローカルエリアにおいて録音された音、オーディオコンテンツ、頭部伝達関数（ＨＲＴＦ）、１つまたは複数のセンサーのための伝達関数、音響センサーのうちの１つまたは複数のためのアレイ伝達関数（ＡＴＦ）、音ソースロケーション、ローカルエリアの仮想モデル、到来方向推定値、音フィルタ、幾何学的情報、テスト音、（たとえば、テスト音の提示に応答して）耳道への入口においてマイクロフォンによってキャプチャされたオーディオ信号、テスト位置情報（たとえば、テスト音を提示するトランスデューサの位置）、オーディオシステム５００の使用および／または較正のために関連する何らかの他のデータ、あるいはそれらの何らかの組合せを含み得る。

ＤＯＡ推定モジュール５４０は、センサーアレイ５２０からの情報に部分的に基づいて、ローカルエリアにおける音ソースの位置を特定するように構成される。位置特定は、オーディオシステム５００のユーザに対して音ソースがどこに位置するかを決定するプロセスである。ＤＯＡ推定モジュール５４０は、ローカルエリア内の１つまたは複数の音ソースの位置を特定するためにＤＯＡ分析を実施する。ＤＯＡ分析は、音が発生した方向を決定するために、センサーアレイ５２０において、各音の強度、スペクトル、および／または到来時間を分析することを含み得る。いくつかの場合には、ＤＯＡ分析は、オーディオシステム５００が位置する周囲音響環境を分析するための任意の好適なアルゴリズムを含み得る。

たとえば、ＤＯＡ分析は、センサーアレイ５２０から入力信号を受信し、入力信号にデジタル信号処理アルゴリズムを適用して、到来方向を推定するように設計され得る。これらのアルゴリズムは、たとえば、入力信号がサンプリングされ、サンプリングされた信号の得られた重み付けおよび遅延されたバージョンが、ＤＯＡを決定するために一緒に平均化される、遅延和アルゴリズムを含み得る。適応フィルタを作成するために、最小２乗平均（ＬＭＳ：ｌｅａｓｔｍｅａｎｓｑｕａｒｅｄ）アルゴリズムも実装され得る。この適応フィルタは、次いで、たとえば信号強度の差、または到来時間の差を識別するために使用され得る。これらの差は、次いで、ＤＯＡを推定するために使用され得る。別の実施形態では、ＤＯＡは、入力信号を周波数ドメインに変換し、処理すべき時間周波数（ＴＦ）ドメイン内の特定のビンを選択することによって決定され得る。各選択されたＴＦビンは、そのビンが、直接経路オーディオ信号をもつオーディオスペクトルの一部分を含むかどうかを決定するために、処理され得る。直接経路信号の一部分を有するビンは、次いで、センサーアレイ５２０が直接経路オーディオ信号を受信した角度を識別するために、分析され得る。決定された角度は、次いで、受信された入力信号についてのＤＯＡを識別するために使用され得る。上記に記載されていない他のアルゴリズムも、ＤＯＡを決定するために、単独でまたは上記のアルゴリズムと組み合わせて使用され得る。

いくつかの実施形態では、ＤＯＡ推定モジュール５４０は、ローカルエリア内のオーディオシステム５００の絶対位置に関するＤＯＡをも決定し得る。センサーアレイ５２０の位置は、外部システム（たとえば、ヘッドセット、人工現実コンソール、オーディオサーバ、位置センサー（たとえば、位置センサー１９０）などの何らかの他の構成要素）から受信され得る。外部システムは、ローカルエリアとオーディオシステム５００の位置とがマッピングされる、ローカルエリアの仮想モデルを作成し得る。受信された位置情報は、オーディオシステム５００の一部または全部（たとえば、センサーアレイ５２０）のロケーションおよび／または配向を含み得る。ＤＯＡ推定モジュール５４０は、受信された位置情報に基づいて、推定されたＤＯＡを更新し得る。

伝達関数モジュール５５０は、１つまたは複数の音響伝達関数を生成するように構成される。概して、伝達関数は、各可能な入力値についての対応する出力値を与える数学関数である。検出された音のパラメータに基づいて、伝達関数モジュール５５０は、オーディオシステムに関連付けられた１つまたは複数の音響伝達関数を生成する。音響伝達関数は、アレイ伝達関数（ＡＴＦ）、頭部伝達関数（ＨＲＴＦ）、他のタイプの音響伝達関数、またはそれらの何らかの組合せであり得る。ＡＴＦは、マイクロフォンが空間中の点からどのように音を受信するかを特徴づける。

ＡＴＦは、音ソースとセンサーアレイ５２０中の音響センサーによって受信された対応する音との間の関係を特徴づけるいくつかの伝達関数を含む。したがって、音ソースについて、センサーアレイ５２０中の音響センサーの各々についての対応する伝達関数がある。また、まとめて、伝達関数のセットはＡＴＦと呼ばれる。したがって、各音ソースについて、対応するＡＴＦがある。音ソースは、たとえば、ローカルエリアにおける音を生成する誰かまたは何か、ユーザ、あるいはトランスデューサアレイ５１０の１つまたは複数のトランスデューサであり得ることに留意されたい。センサーアレイ５２０に対する特定の音ソースロケーションについてのＡＴＦは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造（たとえば、耳形状、肩など）により、ユーザによって異なり得る。したがって、センサーアレイ５２０のＡＴＦは、オーディオシステム５００の各ユーザのために個人化される。

いくつかの実施形態では、伝達関数モジュール５５０は、オーディオシステム５００のユーザのための１つまたは複数のＨＲＴＦを決定する。ＨＲＴＦは、耳が空間中の点からどのように音を受信するかを特徴づける。人に対する特定のソースロケーションについてのＨＲＴＦは、音が人の耳に進むときに音に影響を及ぼす人の解剖学的構造（たとえば、耳形状、肩など）により、人の各耳に固有である（および人に固有である）。いくつかの実施形態では、伝達関数モジュール５５０は、較正モジュール５９０に関して以下で説明されるような、較正プロセスを使用してユーザのためのＨＲＴＦを決定し得る。いくつかの実施形態では、伝達関数モジュール５５０は、ユーザに関する情報をリモートシステム（たとえば、オーディオシステム２１０）に提供し得る。ユーザは、伝達関数モジュール５５０がユーザに関する情報をリモートシステムに提供するのを可能にするかまたは防ぐように、プライバシー設定を調整し得る。リモートシステムは、たとえば、機械学習を使用して、ユーザにカスタマイズされたＨＲＴＦのセットを決定し、ＨＲＴＦのカスタマイズされたセットをオーディオシステム５００に提供する。

追跡モジュール５６０は、１つまたは複数の音ソースのロケーションを追跡するように構成される。追跡モジュール５６０は、現在のＤＯＡ推定値を比較し、それらを、前のＤＯＡ推定値の記憶された履歴と比較し得る。いくつかの実施形態では、オーディオシステム２００は、１秒当たり１回、または１ミリ秒当たり１回など、周期的スケジュールでＤＯＡ推定値を再計算し得る。追跡モジュールは、現在のＤＯＡ推定値を前のＤＯＡ推定値と比較し得、音ソースについてのＤＯＡ推定値の変化に応答して、追跡モジュール５６０は、音ソースが移動したと決定し得る。いくつかの実施形態では、追跡モジュール２６０は、ヘッドセットまたは何らかの他の外部ソースから受信された視覚情報に基づいてロケーションの変化を検出し得る。追跡モジュール５６０は、経時的に１つまたは複数の音ソースの移動を追跡し得る。追跡モジュール５６０は、各時点において音ソースの数と各音ソースのロケーションとについての値を記憶し得る。音ソースの数またはロケーションの値の変化に応答して、追跡モジュール５６０は、音ソースが移動したと決定し得る。追跡モジュール５６０は、位置特定分散（ｌｏｃａｌｉｚａｔｉｏｎｖａｒｉａｎｃｅ）の推定値を計算し得る。位置特定分散は、移動の変化の各決定についての信頼性レベルとして使用され得る。

ビームフォーミングモジュール５７０は、あるエリア内の音ソースからの音を選択的に強調するが、他のエリアからの音を強調しないように、１つまたは複数のＡＴＦを処理するように構成される。センサーアレイ５２０によって検出された音を分析する際に、ビームフォーミングモジュール５７０は、ローカルエリアの特定の領域からの関連付けられた音を強調するが、領域の外側からのものである音を強調しないために、異なる音響センサーからの情報を組み合わせ得る。ビームフォーミングモジュール５７０は、たとえば、ＤＯＡ推定モジュール５４０および追跡モジュール５６０からの異なるＤＯＡ推定値に基づいて、ローカルエリアにおける他の音ソースから、特定の音ソースからの音に関連付けられたオーディオ信号を分離し得る。したがって、ビームフォーミングモジュール５７０は、ローカルエリアにおける個別の音ソースを選択的に分析し得る。いくつかの実施形態では、ビームフォーミングモジュール５７０は、音ソースからの信号を拡張し得る。たとえば、ビームフォーミングモジュール５７０は、いくつかの周波数を上回る信号、それらを下回る信号、またはそれらの間の信号を除去する、音フィルタを適用し得る。信号拡張は、センサーアレイ５２０によって検出された他の音に対して所与の識別された音ソースに関連付けられた音を拡張するように働く。

音フィルタモジュール５８０は、トランスデューサアレイ５１０のための音フィルタを決定する。いくつかの実施形態では、音フィルタは、オーディオコンテンツがターゲット領域から発生するように思われるように、オーディオコンテンツが空間化されることを引き起こす。音フィルタモジュール５８０は、音フィルタを生成するためにＨＲＴＦおよび／または音響パラメータを使用し得る。音響パラメータは、ローカルエリアの音響プロパティを表す。音響パラメータは、たとえば、残響時間、残響レベル、室内インパルス応答などを含み得る。いくつかの実施形態では、音フィルタモジュール５８０は、音響パラメータのうちの１つまたは複数を計算する。いくつかの実施形態では、音フィルタモジュール２８０は、（たとえば、図７に関して以下で説明されるように）オーディオサーバに音響パラメータを要求する。

音フィルタモジュール５８０は、トランスデューサアレイ５１０に音フィルタを提供する。いくつかの実施形態では、音フィルタは、周波数に応じて音の正または負の増幅を引き起こし得る。

較正モジュール５９０は、ユーザに対するオーディオシステム５００を較正する。いくつかの実施形態では、較正モジュール５９０は、トランスデューサアレイ５１０の１つまたは複数のトランスデューサ（たとえば、軟骨伝導）を、ユーザの一方または両方の耳殻上の対応するテスト位置に配置するようにユーザに促す。たとえば、較正モジュール５９０は、オーディオシステム５００の構成要素（たとえば、スピーカー）を使用して、トランスデューサをどこに配置すべきかをユーザに命令するボイスコマンド（たとえば、「あなたの耳の上部にトランスデューサを置いてください」）を発し得る。テスト位置の各々において、較正モジュール５９０は、１つまたは複数のトランスデューサに、１つまたは複数のテスト音を提示するように命令する。較正モジュール５９０は、ユーザの耳道への入口に置かれた音響センサー（センサーアレイ５２０の一部）から、対応するオーディオ信号のセットを受信する。較正モジュール５９０は、次いで、トランスデューサを異なるテスト位置（たとえば、耳珠、耳の下部など）に移動するようにユーザに促す。較正モジュール５９０は、トランスデューサに、新しいテスト位置において１つまたは複数のテスト音を発するように命令し、対応するオーディオ信号が、耳道への入口において音響センサーから受信され、次いで、そのプロセスは繰り返す。このようにして、較正モジュール５９０は、複数のテスト位置の各テスト位置についてのテスト情報（すなわち、１つまたは複数のオーディオ信号および１つまたは複数の対応するテスト音）を収集する。較正モジュール５９０は、統計的に有意なデータサンプルを収集するために、各テスト音を一定の回数（たとえば、各々５回）提示することなど、あるデータ収集基準に基づいて、各テスト音を提示し得る。いくつかの実施形態では、較正モジュール５９０は、テスト情報をオーディオサーバ２８０に提供する。較正モジュール５９０は、次いで、オーディオサーバ２８０から、ユーザからの１つまたは複数のＨＲＴＦを表す情報を受信する。代替的に、オーディオサーバ２８０のいくつかのプロセスは、較正モジュール５９０によってローカルに実施され得る。たとえば、いくつかの実施形態では、較正モジュール５９０は、１つまたは複数のモデル（たとえば、ＨＲＴＦモデル）と、テスト情報とを使用して、ユーザのためのＨＲＴＦを決定し得る。

ＨＲＴＦを決定するための方法

図６Ａは、１つまたは複数の実施形態による、ユーザのためのテスト情報を使用して、ＨＲＴＦを決定するためのプロセス６００を示すフローチャートである。図６Ａに示されているプロセス６００は、オーディオサーバ（たとえば、オーディオサーバ３００）の構成要素によって実施され得る。他のエンティティが、他の実施形態において図６Ａ中のステップの一部または全部を実施し得る。実施形態は、異なるおよび／または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。

オーディオサーバ３００は、６１０において、テスト音とオーディオ信号とを含む、オーディオシステムのユーザのためのテスト情報を受信する。テスト情報は、軟骨伝導トランスデューサを使用してテスト音を提示することと、応答して、マイクロフォンを介してユーザの耳道への入口においてオーディオ信号を受信することとによって、オーディオシステム（たとえば、オーディオシステム５００）によって収集されていることがある。たとえば、オーディオシステム５００は、テスト音およびオーディオ信号の組合せを収集し、その組合せをオーディオサーバ３００に提供し得る。

オーディオサーバ３００は、６２０において、受信されたテスト情報と、オーディオ信号およびテスト音の組合せを対応するＨＲＴＦにマッピングする機械学習モデルとを使用して、ユーザのためのＨＲＴＦを決定する。たとえば、オーディオサーバ３００は、テスト音およびオーディオ信号の組合せをＨＲＴＦモデルに適用して、その組合せに対応するＨＲＴＦを決定し得る。他の実施形態では、オーディオサーバ３００は、テスト音およびオーディオ信号の組合せをジオメトリモデルに適用して、ユーザの耳殻のジオメトリを決定する。オーディオサーバ３００は、次いで、耳殻の決定されたジオメトリに基づいて、ユーザのその耳のためのＨＲＴＦをシミュレートし得る。

オーディオサーバ３００は、６３０において、ＨＲＴＦをオーディオシステムに提供する。たとえば、オーディオサーバ３００は、ＨＲＴＦをオーディオシステム５００に提供し得る。オーディオシステムは、空間化オーディオをユーザに提示するために、提供されたＨＲＴＦを使用し得る。

図６Ｂは、１つまたは複数の実施形態による、ユーザのためのテスト情報を使用して、ユーザの耳殻を表す幾何学的情報を決定するためのプロセス６５０を示すフローチャートである。図６Ｂに示されているプロセス６５０は、オーディオサーバ（たとえば、オーディオサーバ３００）の構成要素によって実施され得る。他のエンティティが、他の実施形態において図６Ｂ中のステップの一部または全部を実施し得る。実施形態は、異なるおよび／または追加のステップを含むか、あるいは異なる順序でステップを実施し得る。

オーディオサーバ３００は、６６０において、テスト音とオーディオ信号とを含む、オーディオシステムのユーザのためのテスト情報を受信する。プロセス６００に関して上記で説明されたように、テスト情報は、軟骨伝導トランスデューサを使用してテスト音を提示することと、応答して、マイクロフォンを介してユーザの耳道への入口においてオーディオ信号を受信することとによって、オーディオシステム（たとえば、オーディオシステム５００）によって収集されていることがある。

オーディオサーバ３００は、６７０において、受信されたテスト情報と、オーディオ信号およびテスト音の組合せを対応する幾何学的情報にマッピングする機械学習モデルとを使用して、ユーザの耳殻を表す幾何学的情報を決定する。たとえば、オーディオサーバ３００は、テスト音およびオーディオ信号の組合せを、トレーニングされた耳殻ジオメトリモデルに適用して、その組合せに対応する幾何学的情報を決定し得る。

オーディオサーバ３００は、６８０において、幾何学的情報をオーディオシステムに提供する。たとえば、オーディオサーバ３００は、耳殻ジオメトリをオーディオシステム５００に提供し得る。オーディオシステムは、ユーザのためのＨＲＴＦを決定するために、提供された幾何学的情報を使用し得る。同じまたは異なる実施形態では、オーディオサーバは、幾何学的情報を使用して、ユーザのための１つまたは複数のＨＲＴＦを決定し、さらに、１つまたは複数のＨＲＴＦをオーディオシステムに提供し得る。

図７は、１つまたは複数の実施形態による、ヘッドセット７０５を含むシステム７００である。いくつかの実施形態では、ヘッドセット７０５は、図１Ａのヘッドセット１００または図１Ｂのヘッドセット１０５であり得る。システム７００は、人工現実環境（たとえば、仮想現実環境、拡張現実環境、複合現実環境、またはそれらの何らかの組合せ）において動作し得る。図７によって示されているシステム７００は、ヘッドセット７０５と、コンソール７１５に結合された入出力（Ｉ／Ｏ）インターフェース７１０と、ネットワーク７２０と、オーディオサーバ７２５とを含む。図７は、１つのヘッドセット７０５と１つのＩ／Ｏインターフェース７１０とを含む例示的なシステム７００を示すが、他の実施形態では、任意の数のこれらの構成要素が、システム７００中に含まれ得る。たとえば、各々が、関連付けられたＩ／Ｏインターフェース７１０を有する、複数のヘッドセットがあり得、各ヘッドセットおよびＩ／Ｏインターフェース７１０はコンソール７１５と通信する。代替構成では、異なるおよび／または追加の構成要素が、システム７００中に含まれ得る。さらに、図７に示されている構成要素のうちの１つまたは複数に関して説明される機能性は、いくつかの実施形態では、図７に関して説明されるものとは異なる様式で構成要素の間で分散され得る。たとえば、コンソール７１５の機能性の一部または全部がヘッドセット７０５によって提供され得る。

ヘッドセット７０５は、ディスプレイアセンブリ７３０と、光学ブロック７３５と、１つまたは複数の位置センサー７４０と、ＤＣＡ７４５とを含む。ヘッドセット７０５のいくつかの実施形態は、図７に関して説明されるものとは異なる構成要素を有する。さらに、図７に関して説明される様々な構成要素によって提供される機能性は、他の実施形態ではヘッドセット７０５の構成要素の間で別様に分散されるか、またはヘッドセット７０５からリモートにある別個のアセンブリにおいて取り込まれ得る。

ディスプレイアセンブリ７３０は、コンソール７１５から受信されたデータに従ってユーザにコンテンツを表示する。ディスプレイアセンブリ７３０は、１つまたは複数のディスプレイ要素（たとえば、ディスプレイ要素１２０）を使用してコンテンツを表示する。ディスプレイ要素は、たとえば、電子ディスプレイであり得る。様々な実施形態では、ディスプレイアセンブリ７３０は、単一のディスプレイ要素または複数のディスプレイ要素（たとえば、ユーザの各眼のためのディスプレイ）を備える。電子ディスプレイの例は、液晶ディスプレイ（ＬＣＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、アクティブマトリックス有機発光ダイオードディスプレイ（ＡＭＯＬＥＤ）、導波路ディスプレイ、何らかの他のディスプレイ、またはそれらの何らかの組合せを含む。いくつかの実施形態では、ディスプレイ要素１２０は光学ブロック７３５の機能性の一部または全部をも含み得ることに留意されたい。

光学ブロック７３５は、電子ディスプレイから受光された画像光を拡大し得、画像光に関連付けられた光学誤差を補正し、補正された画像光をヘッドセット７０５の一方または両方のアイボックスに提示する。様々な実施形態では、光学ブロック７３５は、１つまたは複数の光学要素を含む。光学ブロック７３５中に含まれる例示的な光学要素は、アパーチャ、フレネルレンズ、凸レンズ、凹レンズ、フィルタ、反射面、または画像光に影響を及ぼす任意の他の好適な光学要素を含む。その上、光学ブロック７３５は、異なる光学要素の組合せを含み得る。いくつかの実施形態では、光学ブロック７３５中の光学要素のうちの１つまたは複数は、部分反射コーティングまたは反射防止コーティングなど、１つまたは複数のコーティングを有し得る。

光学ブロック７３５による画像光の拡大および集束は、電子ディスプレイが、より大きいディスプレイよりも、物理的により小さくなり、重さが減じ、少ない電力を消費することを可能にする。さらに、拡大は、電子ディスプレイによって提示されるコンテンツの視野を増加させ得る。たとえば、表示されるコンテンツの視野は、表示されるコンテンツが、ユーザの視野のほとんどすべて（たとえば、対角約１１０度）、およびいくつかの場合にはすべてを使用して提示されるようなものである。さらに、いくつかの実施形態では、拡大の量は、光学要素を追加することまたは取り外すことによって調整され得る。

いくつかの実施形態では、光学ブロック７３５は、１つまたは複数のタイプの光学誤差を補正するように設計され得る。光学誤差の例は、たる形ひずみまたは糸巻き形ひずみ、縦色収差、あるいは横色収差を含む。他のタイプの光学誤差は、球面収差、色収差、またはレンズ像面湾曲による誤差、非点収差、または任意の他のタイプの光学誤差をさらに含み得る。いくつかの実施形態では、表示のために電子ディスプレイに提供されるコンテンツは予歪され、光学ブロック７３５が、そのコンテンツに基づいて生成された画像光を電子ディスプレイから受光したとき、光学ブロック７３５はそのひずみを補正する。

位置センサー７４０は、ヘッドセット７０５の位置を示すデータを生成する電子デバイスである。位置センサー７４０は、ヘッドセット７０５の運動に応答して１つまたは複数の測定信号を生成する。位置センサー１９０は、位置センサー７４０の一実施形態である。位置センサー７４０の例は、１つまたは複数のＩＭＵ、１つまたは複数の加速度計、１つまたは複数のジャイロスコープ、１つまたは複数の磁力計、運動を検出する別の好適なタイプのセンサー、またはそれらの何らかの組合せを含む。位置センサー７４０は、並進運動（前／後、上／下、左／右）を測定するための複数の加速度計と、回転運動（たとえば、ピッチ、ヨー、ロール）を測定するための複数のジャイロスコープとを含み得る。いくつかの実施形態では、ＩＭＵは、測定信号を迅速にサンプリングし、サンプリングされたデータからヘッドセット７０５の推定された位置を計算する。たとえば、ＩＭＵは、加速度計から受信された測定信号を経時的に積分して速度ベクトルを推定し、その速度ベクトルを経時的に積分して、ヘッドセット７０５上の基準点の推定された位置を決定する。基準点は、ヘッドセット７０５の位置を表すために使用され得る点である。基準点は、概して空間中の点として定義され得るが、実際には、基準点は、ヘッドセット７０５内の点として定義される。

ＤＣＡ７４５は、ローカルエリアの一部分についての深度情報を生成する。ＤＣＡは、１つまたは複数のイメージングデバイスとＤＣＡコントローラとを含む。ＤＣＡ７４５は照明器をも含み得る。ＤＣＡ７４５の動作および構造は、図１Ａに関して上記で説明された。

オーディオシステム７５０は、ヘッドセット７０５のユーザにオーディオコンテンツを提供する。オーディオシステム７５０は、上記で説明されたオーディオシステム５００と実質的に同じである。オーディオシステム７５０は、１つまたは複数の音響センサーと、１つまたは複数のトランスデューサと、オーディオコントローラとを備え得る。オーディオシステム７５０は、１つまたは複数の音響センサーとトランスデューサとを使用して、ユーザのためのテスト情報を収集し得る。オーディオシステム７５０は、収集されたテスト情報をオーディオサーバ７２５に送信し得、オーディオサーバ７２５からユーザのためのＨＲＴＦを受信し得る。代替的に、オーディオシステム７２５は、オーディオサーバ７２５から受信されたトレーニングされたＨＲＴＦモデルを使用することによってなど、ＨＲＴＦをローカルに決定するために、収集されたテスト情報を使用し得る。オーディオシステム７５０は、（たとえば、ユーザのためのＨＲＴＦを使用して）空間化オーディオコンテンツをユーザに提供し得る。いくつかの実施形態では、オーディオシステム７５０は、ネットワーク７２０を介してオーディオサーバ７２５に音響パラメータを要求し得る。音響パラメータは、ローカルエリアの１つまたは複数の音響プロパティ（たとえば、室内インパルス応答、残響時間、残響レベルなど）を表す。オーディオシステム７５０は、たとえば、ＤＣＡ７４５からのローカルエリアの少なくとも一部分を表す情報、および／または位置センサー７４０からのヘッドセット７０５についてのロケーション情報を提供し得る。オーディオシステム７５０は、オーディオサーバ７２５から受信された音響パラメータのうちの１つまたは複数を使用して、１つまたは複数の音フィルタを生成し、音フィルタを使用して、ユーザにオーディオコンテンツを提供し得る。

Ｉ／Ｏインターフェース７１０は、ユーザがアクション要求を送り、コンソール７１５から応答を受信することを可能にするデバイスである。アクション要求は、特定のアクションを実施するための要求である。たとえば、アクション要求は、画像データまたはビデオデータのキャプチャを開始または終了するための命令、あるいはアプリケーション内で特定のアクションを実施するための命令であり得る。Ｉ／Ｏインターフェース７１０は、１つまたは複数の入力デバイスを含み得る。例示的な入力デバイスは、キーボード、マウス、ゲームコントローラ、またはアクション要求を受信し、そのアクション要求をコンソール７１５に通信するための任意の他の好適なデバイスを含む。Ｉ／Ｏインターフェース７１０によって受信されたアクション要求は、コンソール７１５に通信され、コンソール７１５は、そのアクション要求に対応するアクションを実施する。いくつかの実施形態では、Ｉ／Ｏインターフェース７１０は、Ｉ／Ｏインターフェース７１０の初期位置に対するＩ／Ｏインターフェース７１０の推定された位置を示す較正データをキャプチャするＩＭＵを含む。いくつかの実施形態では、Ｉ／Ｏインターフェース７１０は、コンソール７１５から受信された命令に従って、ユーザに触覚フィードバックを提供し得る。たとえば、アクション要求が受信されたときに触覚フィードバックが提供されるか、または、コンソール７１５がアクションを実施するときに、コンソール７１５が、Ｉ／Ｏインターフェース７１０に命令を通信して、Ｉ／Ｏインターフェース７１０が触覚フィードバックを生成することを引き起こす。

コンソール７１５は、ＤＣＡ７４５とヘッドセット７０５とＩ／Ｏインターフェース７１０とのうちの１つまたは複数から受信された情報に従って処理するためのコンテンツをヘッドセット７０５に提供する。図７に示されている例では、コンソール７１５は、アプリケーションストア７５５と、追跡モジュール７６０と、エンジン７６５とを含む。コンソール７１５のいくつかの実施形態は、図７に関して説明されるものとは異なるモジュールまたは構成要素を有する。同様に、以下でさらに説明される機能は、図７に関して説明されるものとは異なる様式でコンソール７１５の構成要素の間で分散され得る。いくつかの実施形態では、コンソール７１５に関して本明細書で説明される機能性は、ヘッドセット７０５、またはリモートシステムにおいて実装され得る。

アプリケーションストア７５５は、コンソール７１５が実行するための１つまたは複数のアプリケーションを記憶する。アプリケーションは、プロセッサによって実行されたとき、ユーザへの提示のためのコンテンツを生成する命令のグループである。アプリケーションによって生成されたコンテンツは、ヘッドセット７０５またはＩ／Ｏインターフェース７１０の移動を介してユーザから受信された入力に応答したものであり得る。アプリケーションの例は、ゲーミングアプリケーション、会議アプリケーション、ビデオ再生アプリケーション、または他の好適なアプリケーションを含む。

追跡モジュール７６０は、ＤＣＡ７４５からの情報、１つまたは複数の位置センサー７４０からの情報、またはそれらの何らかの組合せを使用して、ヘッドセット７０５またはＩ／Ｏインターフェース７１０の移動を追跡する。たとえば、追跡モジュール７６０は、ヘッドセット７０５からの情報に基づいて、ローカルエリアのマッピングにおいてヘッドセット７０５の基準点の位置を決定する。追跡モジュール７６０は、オブジェクトまたは仮想オブジェクトの位置をも決定し得る。さらに、いくつかの実施形態では、追跡モジュール７６０は、ヘッドセット７０５の将来のロケーションを予測するために、位置センサー７４０からのヘッドセット７０５の位置を示すデータの部分ならびにＤＣＡ７４５からのローカルエリアの表現を使用し得る。追跡モジュール７６０は、ヘッドセット７０５またはＩ／Ｏインターフェース７１０の推定または予測された将来の位置をエンジン７６５に提供する。

エンジン７６５は、アプリケーションを実行し、追跡モジュール７６０から、ヘッドセット７０５の位置情報、加速度情報、速度情報、予測された将来の位置、またはそれらの何らかの組合せを受信する。受信された情報に基づいて、エンジン７６５は、ユーザへの提示のためにヘッドセット７０５に提供すべきコンテンツを決定する。たとえば、受信された情報が、ユーザが左を見ていることを示す場合、エンジン７６５は、仮想ローカルエリアにおいて、またはローカルエリアを追加のコンテンツで拡張するローカルエリアにおいて、ユーザの移動をミラーリングする、ヘッドセット７０５のためのコンテンツを生成する。さらに、エンジン７６５は、Ｉ／Ｏインターフェース７１０から受信されたアクション要求に応答して、コンソール７１５上で実行しているアプリケーション内でアクションを実施し、そのアクションが実施されたというフィードバックをユーザに提供する。提供されるフィードバックは、ヘッドセット７０５を介した視覚または可聴フィードバック、あるいはＩ／Ｏインターフェース７１０を介した触覚フィードバックであり得る。

ネットワーク７２０は、ヘッドセット７０５および／またはコンソール７１５をオーディオサーバ７２５に結合する。ネットワーク７２０は、ワイヤレス通信システムおよび／またはワイヤード通信システムの両方を使用する、ローカルエリアネットワークおよび／またはワイドエリアネットワークの任意の組合せを含み得る。たとえば、ネットワーク７２０は、インターネット、ならびに携帯電話網を含み得る。一実施形態では、ネットワーク７２０は、標準通信技術および／またはプロトコルを使用する。したがって、ネットワーク７２０は、イーサネット、８０２．１１、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス（ＷｉＭＡＸ）、２Ｇ／３Ｇ／４Ｇモバイル通信プロトコル、デジタル加入者回線（ＤＳＬ）、非同期転送モード（ＡＴＭ）、ＩｎｆｉｎｉＢａｎｄ、ＰＣＩＥｘｐｒｅｓｓアドバンストスイッチングなどの技術を使用するリンクを含み得る。同様に、ネットワーク７２０上で使用されるネットワーキングプロトコルは、マルチプロトコルラベルスイッチング（ＭＰＬＳ）、伝送制御プロトコル／インターネットプロトコル（ＴＣＰ／ＩＰ）、ユーザデータグラムプロトコル（ＵＤＰ）、ハイパーテキストトランスポートプロトコル（ＨＴＴＰ）、簡易メール転送プロトコル（ＳＭＴＰ）、ファイル転送プロトコル（ＦＴＰ）などを含むことができる。ネットワーク７２０を介して交換されるデータは、２進形式（たとえば、ポータブルネットワークグラフィックス（ＰＮＧ））の画像データ、ハイパーテキストマークアップ言語（ＨＴＭＬ）、拡張可能マークアップ言語（ＸＭＬ）などを含む、技術および／またはフォーマットを使用して表現され得る。さらに、リンクの全部または一部は、セキュアソケットレイヤ（ＳＳＬ）、トランスポートレイヤセキュリティ（ＴＬＳ）、仮想プライベートネットワーク（ＶＰＮ）、インターネットプロトコルセキュリティ（ＩＰｓｅｃ）など、従来の暗号化技術を使用して暗号化され得る。

オーディオサーバ７２５は、ヘッドセット７０５とコンソール７１５とＩ／Ｏインターフェース７１０とのうちの１つまたは複数から受信された情報に従って処理するための情報をヘッドセット７０５に提供する。オーディオサーバ７２５は、上記で説明されたオーディオサーバ３００と実質的に同じである。オーディオサーバ７２５は、ヘッドセット７０５のユーザのためのＨＲＴＦを決定するために、ヘッドセット７０５から受信されたテスト情報を処理する。オーディオサーバ７２５は、決定されたＨＲＴＦをヘッドセット７０５に提供し得る。いくつかの実施形態では、オーディオサーバ７０５は、ユーザの耳殻のジオメトリを表す、ヘッドセット７０５のユーザのための幾何学的情報を決定し得る。オーディオサーバ７２５は、決定された幾何学的情報を処理して、ユーザのためのＨＲＴＦを決定し得、および／または幾何学的情報をヘッドセット７０５に提供し得る。

オーディオサーバ７２５は、複数の空間を表す仮想モデルを記憶するデータベースを含み得、仮想モデル中の１つのロケーションが、ヘッドセット７０５のローカルエリアの現在の構成に対応する。オーディオサーバ７２５は、ヘッドセット７０５からネットワーク７２０を介して、ローカルエリアおよび／またはローカルエリアについてのロケーション情報の少なくとも一部分を表す情報を受信する。ユーザは、ヘッドセット７０５が情報をオーディオサーバ７２５に送信するのを可能にするかまたは防ぐように、プライバシー設定を調整し得る。オーディオサーバ７２５は、受信された情報および／またはロケーション情報に基づいて、ヘッドセット７０５のローカルエリアに関連付けられた仮想モデル中のロケーションを決定する。オーディオサーバ７２５は、仮想モデル中の決定されたロケーションおよび決定されたロケーションに関連付けられた任意の音響パラメータに部分的に基づいて、ローカルエリアに関連付けられた１つまたは複数の音響パラメータを決定する（たとえば、取り出す）。オーディオサーバ７２５は、ローカルエリアのロケーションおよびローカルエリアに関連付けられた音響パラメータの任意の値をヘッドセット７０５に送信し得る。

システム７００の１つまたは複数の構成要素は、ユーザデータ要素についての１つまたは複数のプライバシー設定を記憶するプライバシーモジュールを含んでいることがある。ユーザデータ要素は、ユーザまたはヘッドセット７０５を表す。たとえば、ユーザデータ要素は、ユーザの身体的特性、ユーザによって実施されるアクション、ヘッドセット７０５のユーザのロケーション、ヘッドセット７０５のロケーション、ユーザのためのＨＲＴＦなどを表し得る。ユーザデータ要素についてのプライバシー設定（または「アクセス設定」）は、たとえば、ユーザデータ要素に関連して、許可サーバ上のインデックス中で、別の好適な様式で、またはそれらの任意の好適な組合せなど、任意の好適な様式で記憶され得る。

ユーザデータ要素についてのプライバシー設定は、ユーザデータ要素（またはユーザデータ要素に関連付けられた特定の情報）がどのようにアクセスされ、記憶され、または場合によっては使用され（たとえば、観察、共有、修正、コピー、実行、表面化、または識別され）得るかを指定する。いくつかの実施形態では、ユーザデータ要素についてのプライバシー設定は、ユーザデータ要素に関連付けられたある情報にアクセスしてはいけないエンティティの「ブロックリスト（ｂｌｏｃｋｅｄｌｉｓｔ）」を指定し得る。ユーザデータ要素に関連付けられたプライバシー設定は、許諾されるアクセスまたはアクセスの拒否の任意の好適なグラニュラリティを指定し得る。たとえば、一部のエンティティは、特定のユーザデータ要素が存在することを確かめるための許諾を有し得、一部のエンティティは、特定のユーザデータ要素のコンテンツを観察するための許諾を有し得、一部のエンティティは、特定のユーザデータ要素を修正するための許諾を有し得る。プライバシー設定は、他のエンティティが、有限時間期間の間、ユーザデータ要素にアクセスするかまたはユーザデータ要素を記憶することを可能にすることを、ユーザが可能にし得る。

プライバシー設定は、ユーザデータ要素がアクセスされ得る１つまたは複数の地理的ロケーションを、ユーザが指定することを可能にし得る。ユーザデータ要素へのアクセスまたはアクセスの拒否は、ユーザデータ要素にアクセスすることを試みているエンティティの地理的ロケーションに依存し得る。たとえば、ユーザは、ユーザデータ要素へのアクセスを可能にし、ユーザが特定のロケーションにいる間のみ、ユーザデータ要素がエンティティにとってアクセス可能であることを指定し得る。ユーザが特定のロケーションを離れた場合、ユーザデータ要素はエンティティにとって、もはやアクセス可能でないことがある。別の例として、ユーザは、ユーザデータ要素が、ユーザと同じローカルエリア内のヘッドセットの別のユーザなど、ユーザからしきい値距離内のエンティティのみにとってアクセス可能であることを指定し得る。その後、ユーザがロケーションを変更した場合、ユーザデータ要素へのアクセスをもつエンティティはアクセスを失い得るが、エンティティの新しいグループが、ユーザのしきい値距離内に自身が入るので、アクセスを獲得し得る。

システム７００は、プライバシー設定を施行するための１つまたは複数の許可／プライバシーサーバを含み得る。特定のユーザデータ要素についてのエンティティからの要求が、要求に関連付けられたエンティティを識別し得、ユーザデータ要素は、ユーザデータ要素に関連付けられたプライバシー設定に基づいてエンティティがユーザデータ要素にアクセスすることを許可されると許可サーバが決定した場合、そのエンティティのみに送られ得る。要求元エンティティがユーザデータ要素にアクセスすることを許可されない場合、許可サーバは、要求されたユーザデータ要素が取り出されるのを防ぎ得るか、または要求されたユーザデータ要素がエンティティに送られるのを防ぎ得る。本開示は、特定の様式でプライバシー設定を施行することについて説明するが、本開示は、任意の好適な様式でプライバシー設定を施行することを企図する。

追加の構成情報

実施形態の上記の説明は、説明のために提示されており、網羅的であること、または開示される正確な形態に特許権を限定することは意図されない。当業者は、上記の開示を考慮して、多くの修正および変形が可能であることを諒解することができる。

本明細書のいくつかの部分は、情報に関する動作のアルゴリズムおよび記号表現に関して実施形態について説明する。これらのアルゴリズム説明および表現は、データ処理技術分野の当業者が、他の当業者に自身の仕事の本質を効果的に伝えるために通常使用される。これらの動作は、機能的に、計算量的に、または論理的に説明されるが、コンピュータプログラムまたは等価な電気回路、マイクロコードなどによって実装されることが理解される。さらに、一般性の喪失なしに、動作のこれらの仕組みをモジュールと呼ぶことが時々好都合であることも証明された。説明される動作およびそれらの関連付けられたモジュールは、ソフトウェア、ファームウェア、ハードウェア、またはそれらの任意の組合せにおいて具現され得る。

本明細書で説明されるステップ、動作、またはプロセスのいずれも、１つまたは複数のハードウェアまたはソフトウェアモジュールで、単独でまたは他のデバイスとの組合せで実施または実装され得る。一実施形態では、ソフトウェアモジュールは、コンピュータプログラムコードを含んでいるコンピュータ可読媒体を備えるコンピュータプログラム製品で実装され、コンピュータプログラムコードは、説明されるいずれかまたはすべてのステップ、動作、またはプロセスを実施するためにコンピュータプロセッサによって実行され得る。

実施形態はまた、本明細書の動作を実施するための装置に関し得る。この装置は、必要とされる目的のために特別に構築され得、および／あるいは、この装置は、コンピュータに記憶されたコンピュータプログラムによって選択的にアクティブ化または再構成される汎用コンピューティングデバイスを備え得る。そのようなコンピュータプログラムは、非一時的有形コンピュータ可読記憶媒体、または電子命令を記憶するのに好適な任意のタイプの媒体に記憶され得、それらの媒体はコンピュータシステムバスに結合され得る。さらに、本明細書で言及される任意のコンピューティングシステムは、単一のプロセッサを含み得るか、または増加された計算能力のために複数のプロセッサ設計を採用するアーキテクチャであり得る。

実施形態はまた、本明細書で説明されるコンピューティングプロセスによって作り出される製品に関し得る。そのような製品は、コンピューティングプロセスから生じる情報を備え得、その情報は、非一時的有形コンピュータ可読記憶媒体に記憶され、本明細書で説明されるコンピュータプログラム製品または他のデータ組合せの任意の実施形態を含み得る。

最終的に、本明細書において使用される言い回しは、主に読みやすさおよび教育目的で選択されており、本明細書において使用される言い回しは、特許権を定めるかまたは制限するように選択されていないことがある。したがって、特許権の範囲はこの詳細な説明によって限定されるのではなく、むしろ、本明細書に基づく出願に関して生じる請求項によって限定されることが意図される。したがって、実施形態の開示は、以下の特許請求の範囲に記載される特許権の範囲を例示するものであり、限定するものではない。

Claims

オーディオシステムからテスト情報を受信することであって、前記テスト情報が、ユーザのためのオーディオ信号およびテスト音を表し、前記オーディオ信号は、前記ユーザの耳殻に結合された軟骨伝導トランスデューサが前記ユーザに前記テスト音を提示したことに応答した、前記ユーザの耳道への入口における音に対応する、テスト情報を受信することと、
前記テスト情報と、オーディオ信号およびテスト音の組合せを、対応する頭部伝達関数（ＨＲＴＦ）にマッピングするモデルとを使用して、前記ユーザのためのＨＲＴＦを決定することと、
前記ＨＲＴＦを表す情報を前記オーディオシステムに提供することと
を含む、方法。
前記オーディオシステムは、前記軟骨伝導トランスデューサが前記ユーザの耳殻上のテスト位置において前記テスト音を提示したことに応答して、前記オーディオ信号をキャプチャする、請求項１に記載の方法。
前記方法は、
前記軟骨伝導トランスデューサを前記耳殻上の複数のテスト位置に移動するように前記ユーザに促すための命令を生成することであって、各テスト位置において、前記オーディオシステムが、１つまたは複数のそれぞれのテスト音を提示し、１つまたは複数の対応するオーディオ信号をキャプチャする、命令を生成することと、
前記命令を前記オーディオシステムに提供することと
をさらに含む、請求項１に記載の方法。
各テスト位置において、前記オーディオシステムが複数のテスト音を提示し、各テスト音が同じである、請求項３に記載の方法。
各テスト位置において、前記オーディオシステムが複数のテスト音を提示し、前記複数のテスト音のうちの少なくとも１つが、前記複数のテスト音のうちの別のものとは異なる、請求項３に記載の方法。
前記テスト情報は、前記軟骨伝導トランスデューサが前記テスト音を提示した前記ユーザの前記耳殻上の特定のテスト位置に関連付けられ、前記モデルが、前記軟骨伝導トランスデューサの様々なテスト位置について、前記オーディオ信号と前記テスト音との組合せを、前記対応するＨＲＴＦにマッピングする、請求項１に記載の方法。
オーディオシステムからテスト情報を受信することであって、前記テスト情報が、ユーザのためのオーディオ信号およびテスト音を表し、前記オーディオ信号は、前記ユーザの耳殻に結合された軟骨伝導トランスデューサが前記ユーザに前記テスト音を提示したことに応答した、前記ユーザの耳道への入口における音に対応する、テスト情報を受信することと、
前記テスト情報と、オーディオ信号およびテスト音の組合せを、前記ユーザの前記耳殻を表す対応する幾何学的情報にマッピングするモデルとを使用して、前記ユーザの耳殻を表す幾何学的情報を決定することと、
前記幾何学的情報を前記オーディオシステムに提供することと
を含む、方法。
前記オーディオシステムは、前記軟骨伝導トランスデューサが前記ユーザの前記耳殻上のテスト位置において前記テスト音を提示したことに応答して、前記オーディオ信号をキャプチャする、請求項７に記載の方法。
前記方法は、
前記軟骨伝導トランスデューサを前記耳殻上の複数のテスト位置に移動するように前記ユーザに促すための命令を生成することであって、各テスト位置において、前記オーディオシステムが、１つまたは複数のそれぞれのテスト音を提示し、１つまたは複数の対応するオーディオ信号をキャプチャする、命令を生成することと、
前記命令を前記オーディオシステムに提供することと
をさらに含む、請求項７に記載の方法。
各テスト位置において、前記オーディオシステムが複数のテスト音を提示し、各テスト音が同じである、請求項９に記載の方法。
各テスト位置において、前記オーディオシステムが複数のテスト音を提示し、前記複数のテスト音のうちの少なくとも１つが、前記複数のテスト音のうちの別のものとは異なる、請求項９に記載の方法。
前記テスト情報は、前記軟骨伝導トランスデューサが前記テスト音を提示した前記ユーザの耳殻上の特定のテスト位置に関連付けられ、前記モデルが、前記軟骨伝導トランスデューサの様々なテスト位置について、前記オーディオ信号と前記テスト音との組合せを、対応する幾何学的情報にマッピングする、請求項１に記載の方法。
ａ）前記幾何学的情報を使用して、前記ユーザのための頭部伝達関数（ＨＲＴＦ）を決定することと、
前記ＨＲＴＦを表す情報を前記オーディオシステムに提供することであって、その場合、随意に、前記ＨＲＴＦを決定することが、
前記ＨＲＴＦを決定するために、前記幾何学的情報を使用するシミュレーションを実施すること
を含む、前記ＨＲＴＦを表す情報を前記オーディオシステムに提供することと
をさらに含む、または、
ｂ）前記幾何学的情報を使用して、ウェアラブルデバイスを表す設計ファイルを生成することであって、前記設計ファイルが前記ウェアラブルデバイスの作製において使用され、前記ウェアラブルデバイスが、前記ユーザの前記耳殻にフィットするようにカスタマイズされる、設計ファイルを生成すること
をさらに含む、
のうちのいずれか１つである、請求項７に記載の方法。
オーディオシステムからテスト情報を受信することであって、前記テスト情報が、ユーザのためのオーディオ信号およびテスト音を表し、前記オーディオ信号は、前記ユーザの耳殻に結合された軟骨伝導トランスデューサが前記ユーザに前記テスト音を提示したことに応答した、前記ユーザの耳道への入口における音に対応する、テスト情報を受信することと、
前記テスト情報と、オーディオ信号およびテスト音の組合せを、前記ユーザの前記耳殻を表す対応する幾何学的情報にマッピングするモデルとを使用して、前記ユーザの前記耳殻を表す幾何学的情報を決定することと、
前記幾何学的情報を使用して、前記ユーザのための頭部伝達関数（ＨＲＴＦ）を決定することと、
前記ＨＲＴＦを表す情報を前記オーディオシステムに提供することと
を含む、方法。
ａ）前記オーディオシステムは、前記軟骨伝導トランスデューサが前記ユーザの前記耳殻上のテスト位置において前記テスト音を提示したことに応答して、前記オーディオ信号をキャプチャする、または、
ｂ）前記軟骨伝導トランスデューサを前記耳殻上の複数のテスト位置に移動するように前記ユーザに促すための命令を生成することであって、各テスト位置において、前記オーディオシステムが、１つまたは複数のそれぞれのテスト音を提示し、１つまたは複数の対応するオーディオ信号をキャプチャする、命令を生成することと、
前記命令を前記オーディオシステムに提供することと
をさらに含む、または、
ｃ）前記ＨＲＴＦを決定することが、
前記ＨＲＴＦを決定するために、前記幾何学的情報を使用するシミュレーションを実施することを含む、または、
ｄ）前記ＨＲＴＦを決定することが、
前記耳殻の前記幾何学的情報と、耳殻の幾何学的情報を、対応するＨＲＴＦにマッピングするモデルとを使用して、前記ユーザのための前記ＨＲＴＦを決定することを含む、
のうちのいずれか１つである、請求項１４に記載の方法。