JP6596074B2

JP6596074B2 - 聴覚デバイスを介した多数の聴取環境生成技法

Info

Publication number: JP6596074B2
Application number: JP2017510879A
Authority: JP
Inventors: チェンソ，ダヴィデディ; シュテファンマルティ，; アジェイジュネジャ，
Original assignee: ハーマンインターナショナルインダストリーズインコーポレイテッド
Priority date: 2014-09-10
Filing date: 2015-07-23
Publication date: 2019-10-23
Anticipated expiration: 2035-07-23
Also published as: KR20170052586A; EP3192240B2; CN106688225A; EP3192240A1; US10388297B2; US20160071525A1; EP3192240B1; JP2017528990A; WO2016039867A1; KR102503748B1; EP3192240A4

Description

関連出願の相互参照
この出願は、２０１４年９月１０日に出願された、米国特許出願番号第１４／４８３，０４４の利益を主張するものであり、参照により本明細書に組み込まれる。

本発明の実施形態は、一般に、ヒューマンデバイスインターフェースに関し、より詳細には、聴覚デバイスを介して多数の聴取環境を生成するための技法に関する。

様々な状況において、人は、１人または複数の他の人が居ながらプライベートな会話をする必要または要望を認めることがしばしばある。例えば、これに限定されないが、カンファレンスミーティングに参加している或る人物が、ミーティング中に重要な電話の呼び出しを受けることがある。ミーティングを妨害するのを防ぐために、そうした人物は、部屋を物理的に離れるか、その呼び出しを取らないことを選択するかもしれない。別の実施例において、これに限定されないが、乗り物に乗っている或る人物が、他の乗客に対してプライバシーを保ちながら通話を開始することや、他の乗客間の会話を妨害するのを避けることを望むことがある。このような場合、そうした人物は、通話を開始してひそひそ声で話すか、または、通話がプライベートに成され得る後にまで通話を先延ばしにすることがある。さらに別の実施例において、これに限定されないが、グループミーティングにおける主な会話が、グループミーティングの参加者の一部の間での二次的なミーティングの必要性を生じさせることがある。このような場合、そうした参加者の一部は、別のミーティングルームが利用可能な場合には、別のミーティングルームに席を移すことがあり、または、二次的なミーティングを後に先延ばしにすることがある。

これらのアプローチに関する１つの起こり得る問題は、重要または必要な会話が、後にまで不利益に先延ばしにされることがあり、または、主な会話が第２の会話によって妨害されることがあることである。これらのアプローチに関する別の起こり得る問題は、第２の会話が、所望のレベルのプライバシーを享受し得ないことがあり、または、小声で行われて、そうした会話が参加者に理解し辛くなることがあることである。

上記で示したように、多数の会話に同時に対応する新たな技法が有用であろう。

述べられる１つまたは複数の実施形態は、無線ネットワークインターフェース及びプロセッサを含むコンピューティングデバイスを含む。プロセッサは、マイクを介して、第１の複数の音声構成要素を含む第１の聴覚信号を受信するように構成される。プロセッサはさらに、第１の複数の音声構成要素に含まれる、或る第１の音声構成要素を少なくとも部分的に抑制するため、要求を受信するように構成される。プロセッサはさらに、第１の音声構成要素が少なくとも部分的に抑制された状態で、第１の複数の音声構成要素を含む第２の聴覚信号を生成するように構成される。プロセッサはさらに、出力のために、第２の聴覚信号をスピーカへ伝送するように構成される。

他の実施形態は、これに限定されないが、処理ユニットに、開示される方法の１つまたは複数の態様を実施させることを可能にする命令を含むコンピュータ可読媒体を含む。他の実施形態は、これに限定されないが、開示される方法の１つまたは複数の態様を実施する方法、及び、開示される方法の１つまたは複数の態様を実施するように構成されるコンピューティングシステムを含む。
本明細書は、例えば、以下の項目も提供する。
（項目１）
コンピュータにより実施される、第１の聴覚情景コントローラと関連する聴覚情景を生成する方法であって、
マイクから、第１の複数の音声構成要素を含む第１の聴覚信号を受信することと、
前記第１の複数の音声構成要素に含まれる、或る第１の音声構成要素を少なくとも部分的に抑制するため、要求を受信することと、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成することと、
出力のために、前記第２の聴覚信号をスピーカへ伝送すること、
を含む、前記方法。
（項目２）
項目１に記載のコンピュータにより実施される方法であって、さらに、
第２の聴覚情景コントローラと関連する第２の複数の音声構成要素に含まれる、或る第２の音声構成要素を抑制するため、第２の聴覚情景コントローラへ要求を伝送することを含む、前記方法。
（項目３）
項目１に記載のコンピュータにより実施される方法であって、さらに、
前記第１の音声構成要素を抑制するのを中断するため、要求を受信することと、
前記第１の音声構成要素が抑制されていない状態で、前記第１の複数の音声構成要素を含む第３の聴覚信号を生成することと、
出力のために、前記第３の聴覚信号を前記スピーカへ伝送すること、
を含む、前記方法。
（項目４）
項目１に記載のコンピュータにより実施される方法であって、
前記第２の聴覚信号を生成することが、前記第１の音声構成要素が完全に抑制された状態で、前記第１の複数の音声構成要素を含む前記第２の聴覚信号を生成することを含む、
前記方法。
（項目５）
項目１に記載のコンピュータにより実施される方法であって、さらに、
前記第１の複数の音声構成要素に含まれる第２の音声構成要素を抑制するため、要求を受信することを含み、
前記第２の聴覚信号を生成することが、前記第１の聴覚信号に含まれる第２の音声構成要素を部分的に抑制することを含む、前記方法。
（項目６）
項目１に記載のコンピュータにより実施される方法であって、
前記第２の聴覚信号を生成することがさらに、前記マイクにより受信されるバックグラウンドノイズ信号を抑制することを含む、前記方法。
（項目７）
項目１に記載のコンピュータにより実施される方法であって、
前記マイク及び前記スピーカが、インイヤー聴覚デバイスに組み込まれる、前記方法。
（項目８）
項目１に記載のコンピュータにより実施される方法であって、
前記マイク及び前記スピーカが、ヘッドマウント聴覚デバイスに組み込まれる、前記方法。
（項目９）
項目１に記載のコンピュータにより実施される方法であって、
前記マイク及び前記スピーカが、椅子または座席と関連するヘッドレストに組み込まれる、前記方法。
（項目１０）
項目１に記載のコンピュータにより実施される方法であって、
前記スピーカが高指向性スピーカを含む、前記方法。
（項目１１）
無線ネットワークインターフェースと、
プロセッサであって、
マイクを介して、第１の複数の音声構成要素を含む第１の聴覚信号を受信するように、
前記第１の複数の音声構成要素に含まれる、或る第１の音声構成要素を少なくとも部分的に抑制するため、要求を受信するように、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成するように、
出力のために、前記第２の聴覚信号をスピーカへ伝送するように構成される、前記プロセッサと、
を含む、コンピューティングデバイス。
（項目１２）
項目１１に記載のコンピューティングデバイスであって、
前記第１の音声構成要素を抑制するための前記要求が、前記無線ネットワークインターフェースを介して受信される、前記コンピューティングデバイス。
（項目１３）
項目１１に記載のコンピューティングデバイスであって、さらに、
入力デバイスを含み、前記第１の音声構成要素を抑制するための前記要求が、前記入力デバイスの作動を介して受信される、前記コンピューティングデバイス。
（項目１４）
項目１１に記載のコンピューティングデバイスであって、
前記処理ユニットがさらに、第２の音声構成要素を抑制するため、前記無線ネットワークインターフェースを介して、第１の聴覚情景コントローラに向けられた要求を伝送するように構成され、
前記第１の聴覚情景コントローラが、前記第２の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第３の聴覚信号を生成するように構成される、前記コンピューティングデバイス。
（項目１５）
項目１１に記載のコンピューティングデバイスであって、
前記処理ユニットがさらに、前記コンピューティングデバイスと関連する音声構成要素を除いて、全ての音声構成要素を少なくとも部分的に抑制するため、前記無線ネットワークインターフェースを介して、第１の聴覚情景コントローラに向けられた要求を伝送するように構成される、前記コンピューティングデバイス。
（項目１６）
項目１５に記載のコンピューティングデバイスであって、
前記処理ユニットがさらに、前記第１の聴覚情景コントローラと関連する音声構成要素を除いて、全ての音声構成要素を抑制するため、要求を、前記無線ネットワークインターフェースを介して受信するように構成される、前記コンピューティングデバイス。
（項目１７）
項目１５に記載のコンピューティングデバイスであって、
前記処理ユニットがさらに、前記第１の聴覚情景コントローラ及び前記第２の聴覚情景コントローラと関連する音声構成要素を除いて、全ての音声構成要素を抑制するため、要求を、前記無線ネットワークインターフェースを介して受信するように構成される、前記コンピューティングデバイス。
（項目１８）
項目１７に記載のコンピューティングデバイスであって、
前記第１の聴覚情景コントローラが、前記コンピューティングデバイスと関連する前記音声構成要素を除いて、前記第２の聴覚情景コントローラと関連する前記音声構成要素を部分的に抑制するように、及び、全ての他の音声構成要素を完全に抑制するように構成される、前記コンピューティングデバイス。
（項目１９）
プログラム命令を記憶する非一時的なコンピュータ可読媒体であって、当該プログラム命令が、処理ユニットによって実行される場合、
マイクから、第１の複数の音声構成要素を含む第１の聴覚信号を受信するステップと、
前記第１の複数の音声構成要素に含まれる、或る第１の音声構成要素を抑制するため、要求を受信するステップと、
前記第１の音声構成要素が抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成するステップと、
出力のために、前記第２の聴覚信号をスピーカへ伝送するステップ、
を実行することにより、前記処理ユニットに聴覚情景を生成させる、前記非一時的なコンピュータ可読媒体。
（項目２０）
項目１９に記載の非一時的なコンピュータ可読媒体であって、さらに、
第２の聴覚情景コントローラと関連する第２の複数の音声構成要素に含まれる、或る第２の音声構成要素を抑制するため、第２の聴覚情景コントローラへ要求を伝送するステップを含む、前記非一時的なコンピュータ可読媒体。

本明細書で説明されるアプローチの少なくとも１つの利点は、グループにおける参加者が、各会話にとっての適切なプライバシーを保ちながら、且つ、他の会話に対する妨害を軽減または除去しながら、多数の会話に従事し得ることである。結果として、重要な会話が先延ばしにされず、また、各別個の会話に対応するために別個の物理的空間を見つける必要がなく、多数の会話が対応される。

上記で述べられるもう１つの実施形態の列挙される特徴を詳細に理解し得るやり方で、上記で簡単に要約された、１つまたは複数の実施形態のより詳細な説明が、或る一定の特定の実施形態を参照して成されてよく、それらのうちのいくつかが添付の図面に示される。しかし、添付の図面は単に代表的な実施形態を示し、それゆえ、本発明の範囲が他の実施形態も包含するので、いかなるやり方によっても、その範囲を限定すると考えられるべきでないことに留意すべきである。

様々な実施形態に従った、１つまたは複数の聴覚情景を生成するように動作可能な聴覚情景コントローラを示す。様々な実施形態に従った、聴覚情景を生成するための聴覚情景コントローラのピアツーピアネットワークを示す。様々な実施形態に従った、聴覚情景を生成するためのシステムを示す。様々な実施形態に従った、聴覚情景を生成するためのシステムを示す。様々な実施形態に従った、聴覚情景を生成するためのシステムを示す。様々な実施形態に従った、双方向に隔離された聴覚情景に関する例示的な使用事例を示す。様々な実施形態に従った、一方向に外側に隔離された聴覚情景に関する例示的な使用事例を示す。様々な実施形態に従った、一方向に内側に隔離された聴覚情景に関する例示的な使用事例を示す。様々な実施形態に従った、多数のユーザの双方向に隔離された聴覚情景に関する例示的な使用事例を示す。様々な実施形態に従った、多数のユーザの多方向に隔離された聴覚情景に関する例示的な使用事例を示す。様々な実施形態に従った、他の聴覚情景コントローラと通信するために聴覚情景コントローラを初期化及び構成するための方法のステップの流れ図である。様々な実施形態に従った、聴覚情景コントローラを介して聴覚情景を生成するための方法のステップの流れ図である。

以下の説明において、或る一定の特定の実施形態のより十分な理解を提供するために、多数の特定の詳細が述べられる。しかし、これらの特定の詳細の１つまたは複数を伴わず、または、追加の特定の詳細と共に、他の実施形態が実行されてもよいことが当業者に明らかであろう。

システム概要
図１は、様々な実施形態に従った、１つまたは複数の聴覚情景を生成するように動作可能な聴覚情景コントローラを示す。図示するように、聴覚情景コントローラ１００は、これに限定されないが、互いに結合された、マイクモジュール１１０、処理ユニット１２０、無線送受信機１３０、スピーカモジュール１４０、及び、メモリユニット１５０を含む。メモリユニット１５０は、本明細書でさらに説明される様々な聴覚情景構成を生成するためのソフトウェアアプリケーションである、聴覚情景アプリケーション１５２を含む。聴覚情景コントローラ１００は、任意の技術的に実行可能なコンピューティングデバイス内に組み込まれてよい。

マイクモジュール１１０は、マイクを介してオーディオ信号を受信するように、及び、当該オーディオ信号を機械可読の形式に変換するように構成される、任意の技術的に実行可能なタイプのデバイスであってよい。マイクモジュール１１０は、以下でより詳細に説明されるように、物理的環境からオーディオ信号を受信するように、及び、処理のための処理ユニット１２０による更なる処理のために、これらのオーディオ信号を変換するように構成される。オーディオ信号は、ミーティングまたはその他の物理的空間における様々な参加者からの話し声、及び、バックグラウンドノイズ、音楽、街頭の音等などの環境上の音源を含んでよい。

処理ユニット１２０は、例えば、これに限定されないが、中央処理装置（ＣＰＵ）、デジタル信号プロセッサ（ＤＳＰ）、または特定用途向け集積回路（ＡＳＩＣ）を含め、データを処理し、且つ、ソフトウェアアプリケーションを実行するように構成される、任意の技術的に実行可能なユニットであってよい。入力デバイス１２５は、例えば、これに限定されないが、入力を受信するように構成されるデバイス（これに限定されないが、１つまたは複数のボタンなど）を含んでよい。処理ユニット１２０により実行されるアプリケーションと関連する或る一定の機能または特徴が、ボタンを押すことによってなど、入力デバイス１２５を作動させることによってアクセスされてよい。本明細書でさらに説明されるように、処理ユニット１２０は、様々なユーザを互いから完全にまたは部分的に隔離するために、１つまたは複数のオーディオグループまたは会話「バブル（ｂｕｂｂｌｅ）」を生成するように動作可能である。

スピーカモジュール１４０は、オーディオ信号を受信し、１つまたは複数のラウドスピーカまたはスピーカデバイスを駆動可能な対応する信号を生成するように構成される、任意の技術的に実行可能なタイプのデバイスであってよい。オーディオ信号は、マイクモジュール１１０により受信されるオーディオ入力信号であってよく、または、処理ユニット１２０により生成されるオーディオ信号であってよい。処理ユニット１２０から受信されるオーディオ信号は、マイクユニット１１０により受信されるオーディオ入力信号の代替的なバージョンであってもよいが、１つまたは複数の音声が抑制されている。

無線送受信機１３０は、これに限定されないが、ＷｉＦｉ（商標）送受信機、Ｂｌｕｅｔｏｏｔｈ（登録商標）送受信機、ＲＦ送受信機等を含め、他の無線デバイスと無線通信リンクを確立するように構成される、任意の技術的に実行可能なデバイスであってよい。無線送受信機１３０は、本明細書でさらに説明されるように、他の聴覚情景コントローラ及び中央通信コントローラと無線リンクを確立するように構成される。

メモリユニット１５０は、例えば、これに限定されないが、ランダムアクセスメモリ（ＲＡＭ）モジュールまたはハードディスクを含め、これに限定されないが、データ及びプログラムコードを記憶するように構成される、任意の技術的に実行可能なユニットであってよい。メモリユニット１５０内の聴覚情景アプリケーション１５２は、本明細書において聴覚情景とも呼ばれる、１つまたは複数の聴取環境を生成するため、処理ユニット１２０によって実行されてよい。聴覚情景（ａｕｄｉｔｏｒｙｓｃｅｎｅ）とは、特定の人物に対応する少なくとも１つの音声構成要素が抑制されている聴取環境が、聴覚情景の内側の個々人、または、聴覚情景の外側の人々のいずれかによって聴かれることを表す。１つの実施例において、これに限定されないが、１人の人物を含む聴覚情景が、他の誰にもその人物の音声が聴こえないように生成されてよい。別の実施例において、これに限定されないが、１人の人物を含む聴覚情景が、その人物には他の誰かの音声が聴こえないように生成されてよい。別の実施例において、これに限定されないが、１人の人物を含む聴覚情景が、他の誰にもその人物の音声が聴こえないように、また同時に、その人物には同時に他の誰かの音声が聴こえないように生成されてよい。さらに別の実施例において、任意の数の聴覚情景が生成されてよく、各聴覚情景は任意の数の人物を含み、また、各聴覚情景は様々な音声を抑制し、各聴覚情景を離れること、または各聴覚情景に入ることを防止する。このやり方において、聴覚情景は非常にカスタマイズ可能及び構成可能である。従って、本明細書で説明される聴覚情景は単に例示的なものであり、本開示の範囲内で生成され得る、起こり得る聴覚情景の範囲を限定しない。

聴覚情景を生成する際、ソフトウェアアプリケーション１５２は、オーディオ入力信号と関連する周波数及び振幅データを分析及びパースするように、多種多様な異なるオーディオ処理アルゴリズムを実施してよい。このようなアルゴリズムは、１つまたは複数の技法により、入力オーディオ信号から１つまたは複数の音声を抑制するように動作可能である。

１つの実施例において、これに限定されないが、聴覚情景アプリケーション１５２を実行する処理ユニット１２０は、抑制されるべき１つまたは複数の音声に対応するオーディオ入力信号の一部を決定してよく、１つまたは複数の音声に対応する反転信号を表す反転オーディオ信号を生成してよく、反転信号を元のオーディオ入力信号と混合してよい。別の実施例において、これに限定されないが、聴覚情景アプリケーション１５２を実行する処理ユニット１２０は、別のユーザの聴覚情景コントローラから信号をデジタルに受信してよく、受信された信号は、例えば、これに限定されないが、対応するマイクモジュールによりキャプチャされた、関連するユーザの元の、または反転された音声を表す。処理ユニット１２０は、その後、受信された信号を必要に応じて反転し、受信された信号を、マイクモジュール１１０からのオーディオ入力信号と混合する。さらに別の実施例において、これに限定されないが、聴覚情景アプリケーション１５２を実行する処理ユニット１２０は、別のユーザの聴覚情景コントローラからのタイミング情報を受信してよく、関連するユーザが話しているとき、または無言でいるときを識別する。処理ユニット１２０は、処理ユニット１２０ユニットがマイクモジュール１１０からのオーディオ入力信号を抑制する時間間隔を決定するように、受信されたタイミング情報を処理する。聴覚情景アプリケーション１５２は、処理されたオーディオ信号をスピーカモジュール１４０へその後に伝送するように構成される。

図１に示した聴覚情景コントローラ１００の特定の実施態様が、例示的な目的のみのために提供され、本発明の範囲を限定することを意図するものでないことを当業者は理解するであろう。実際には、聴覚情景コントローラ１００は、ハードウェア及びソフトウェアの多種多様な異なる組合せにより実施されてよい。例えば、これに限定されないが、聴覚情景コントローラ１００は、これに限定されないが、上記の機能を実行するように構成される集積回路によって実施されてよい。別の実施例において、これに限定されないが、聴覚情景コントローラ１００は、これに限定されないが、そうした機能を実行するように構成されるシステムオンチップによって実施されてよい。一般的な事項として、本明細書で説明される聴覚情景コントローラ１００の機能を実行するように構成される任意のデバイスは、本発明の範囲内にある。同様に、聴覚情景コントローラ１００は、入力オーディオ信号から１つまたは複数の音声を除去するための、任意の技術的に実行可能なアプローチを実行するように構成されてよい。

図２Ａは、様々な実施形態に従った、聴覚情景を生成するための聴覚情景コントローラ２２０、２２２及び２２４のピアツーピアネットワーク２００を示す。図示するように、ピアツーピアネットワークは、これに限定されないが、それぞれユーザ２１０、２１２及び２１４に対応する聴覚情景コントローラ２２０、２２２及び２２４を含む。聴覚情景コントローラ２２０、２２２及び２２４は、ネットワーク１３０で通信する。

この構成において、聴覚情景コントローラ２２０、２２２及び２２４は、中央通信コントローラを伴わずに、ピアツーピアで、互いに直接通信する。その結果、ボタンを押すなどのユーザ２１０の動作に応答して、聴覚情景コントローラ２２０は、ユーザ２１０の音声を抑制するため、聴覚情景コントローラ２２２及び２２４へ要求を伝送する。これに応じて、聴覚情景コントローラ２２２及び２２４はユーザ２１０の音声を抑制し、この結果、ユーザ２１２及び２１４はユーザ２１０を聴くことができない。別のボタンを押すなどのユーザ２１０の第２の動作に応答して、聴覚情景コントローラ２２０は、ユーザ２１０の音声を抑制するのを中断するため、聴覚情景コントローラ２２２及び２２４へ要求を伝送する。これに応じて、聴覚情景コントローラ２２２及び２２４は、ユーザ２１０の音声を抑制するのを中断し、この結果、ユーザ２１２及び２１４はユーザ２１０を再び聴くことができる。

図２Ｂは、様々な実施形態に従った、聴覚情景を生成するためのシステム２０２を示す。図示するように、システムは、これに限定されないが、中央通信コントローラ２４０、ならびに、それぞれユーザ２１０、２１２及び２１４に対応する聴覚情景コントローラ２２０、２２２及び２２４を含む。聴覚情景コントローラ２２０、２２２及び２２４はネットワーク１３０で通信する。聴覚情景コントローラ２２０、２２２及び２２４ならびにネットワーク２３０は、以下でさらに説明される場合を除いて、図２Ａに関連して説明したのと実質的に同じように機能する。

この構成において、聴覚情景コントローラ２２０、２２２及び２２４は、中央通信コントローラ２４０を介して互いに通信する。中央通信コントローラ２４０は、任意の技術的に実行可能なコンピューティングデバイスに組み込まれてよい。各聴覚情景コントローラ２２０、２２２及び２２４中央通信コントローラ２４０。必要に応じて、中央通信コントローラ２４０は、聴覚情景コントローラ２２０、２２２及び２２４から受信された通信を、他の聴覚情景コントローラ２２０、２２２及び２２４へ転送する。加えて、中央通信コントローラ２４０は、聴覚情景コントローラ２２０、２２２及び２２４に向けられた通信を開始してよい。

その結果、ボタンを押すなどのユーザ２１０の動作に応答して、聴覚情景コントローラ２２０は、ユーザ２１０の音声を抑制するため、通信コントローラ２４０へ要求を伝送する。これに応じて、通信コントローラ２４０は、聴覚情景コントローラ２２２及び２２４へ要求を転送する。聴覚情景コントローラ２２２及び２２４はユーザ２１０の音声を抑制し、この結果、ユーザ２１２及び２１４はユーザ２１０を聴くことができない。別のボタンを押すなどのユーザ２１０の第２の動作に応答して、聴覚情景コントローラ２２０は、ユーザ２１０の音声を抑制するのを中断するため、通信コントローラ２４０へ要求を伝送する。これに応じて、通信コントローラ２４０は、聴覚情景コントローラ２２２及び２２４へ要求を転送する。聴覚情景コントローラ２２２及び２２４は、ユーザ２１０の音声を抑制するのを中断し、この結果、ユーザ２１２及び２１４は、ユーザ２１０を再び聴くことができる。

図２Ｃは、様々な実施形態に従った、聴覚情景を生成するためのシステム２０４を示す。図示するように、システムは、これに限定されないが、中央通信コントローラ２４０、ならびに、それぞれユーザ２１０、２１２及び２１４に対応する聴覚情景コントローラ２２０、２２２及び２２４を含む。さらに図示するように、システムは、それぞれユーザ２１０、２１２及び２１４に対応するユーザインターフェースデバイス２５０、２５２及び２５４を含む。聴覚情景コントローラ２２０、２２２及び２２４はネットワーク１３０で通信する。聴覚情景コントローラ２２０、２２２及び２２４、中央通信コントローラ２４０、ならびにネットワーク２３０は、以下でさらに説明される場合を除いて、図２Ａ〜図２Ｂに関連して説明したのと実質的に同じように機能する。

図示するように、ユーザインターフェースデバイス２５０は、ユーザ２１０と関連するスマートフォンであり、ユーザインターフェースデバイス２５２は、ユーザ２１０と関連するラップトップコンピュータであり、ユーザインターフェースデバイス２５４は、ユーザ２１０と関連するタブレットコンピュータである。あるいは、様々なユーザは、任意の組合せで、任意の技術的に実行可能なユーザインターフェースデバイスと関連してよく、これには、これに限定されないが、着用者の眼鏡に取り付けられるデバイス、着用者のネックレスに取り付けられるデバイスまたは「お守りデバイス（ａｍｕｌｅｔｄｅｖｉｃｅ）」、腕時計または手首用ブレスレット上のデバイス、ヘッドバンドまたはヘッドリングに組み込まれるデバイス、衣類またはベルトのバックルの１点に取り付けられるデバイス、ユーザの身体のどこかに取り付けられるか、または身に着けられるデバイス、ユーザのスマートフォンまたはタブレットコンピュータに取り付けられるアクセサリ、及び、自転車やオートバイなどユーザと関連する乗り物に取り付けられるアクセサリが含まれる。

図２Ｃの構成において、聴覚情景コントローラ２２０、２２２及び２２４は、中央通信コントローラ２４０を介して互いに通信する。各聴覚情景コントローラ２２０、２２２及び２２４中央通信コントローラ２４０。必要に応じて、中央通信コントローラ２４０は、聴覚情景コントローラ２２０、２２２及び２２４から受信された通信を他の聴覚情景コントローラ２２０、２２２及び２２４へ転送する。加えて、中央通信コントローラ２４０は、聴覚情景コントローラ２２０、２２２及び２２４に向けられた通信を開始してよい。中央通信コントローラ２４０はまた、ユーザインターフェースデバイス２５０、２５２及び２５４間の通信を送信及び受信する。ユーザインターフェースデバイス２５０、２５２及び２５４上で実行されるアプリケーションは、聴覚情景コントローラ２２０、２２２及び２２４の、より単純なユーザインターフェースにより可能な、より洗練された聴覚情景を生成可能であってよい。

その結果、ユーザインターフェースデバイス２５０上で実行されるアプリケーションの機能を選択するなどのユーザ２１０の動作に応答して、ユーザインターフェースデバイス２５０は、ユーザ２１０の音声を抑制するため、通信コントローラ２４０へ要求を伝送する。これに応じて、通信コントローラ２４０は、聴覚情景コントローラ２２２及び２２４へ要求を転送する。聴覚情景コントローラ２２２及び２２４は、ユーザ２１０の音声を抑制し、この結果、ユーザ２１２及び２１４はユーザ２１０を聴くことができない。ユーザインターフェースデバイス２５０上で実行されるアプリケーションの機能を選択するなどのユーザ２１０の第２の動作に応答して、ユーザインターフェースデバイス２５０は、ユーザ２１０の音声を抑制するのを中断するため、通信コントローラ２４０へ要求を伝送する。これに応じて、通信コントローラ２４０は、聴覚情景コントローラ２２２及び２２４へ要求を転送する。聴覚情景コントローラ２２２及び２２４は、ユーザ２１０の音声を抑制するのを中断し、この結果、ユーザ２１２及び２１４はユーザ２１０を再び聴くことができる。

図２Ｄは、様々な実施形態に従った、聴覚情景を生成するためのシステム２０６を示す。図示するように、システムは、これに限定されないが、中央通信コントローラ２４０及び一群の高指向性ラウドスピーカ（ＨＤＬ）２６０（０）〜２６０（１３）を含む。中央通信コントローラ２４０は、ネットワーク１３０でＨＤＬ２６０（０）〜２６０（１３）と通信する。あるいは、中央通信コントローラ２４０は、ＨＤＬ２６０（０）〜２６０（１３）に直接接続してもよい。中央通信コントローラ２４０及びネットワーク２３０は、以下でさらに説明される場合を除いて、図２Ａ〜図２Ｃに関連して説明したのと実質的に同じように機能する。

ＨＤＬ２６０は、従来のラウドスピーカにより生成される、より典型的な全指向性の音波パターンではなく、比較的高度な指向性（狭さ）を有する音波パターンを生成するラウドスピーカである。その結果、所与のＨＤＬ２６０は特定の聴取者に音を向けることができ、これにより、聴取者にはＨＤＬ２６０により生成される音が聴こえるが、聴取者のすぐ左またはすぐ右に座っている別の人物にはＨＤＬ２６０により生成される音が聴こえない。例えば、これに限定されないが、ＨＤＬ２６０（１）及びＨＤＬ２６０（２）は、ユーザ２１０のそれぞれ右耳及び左耳に音を向けるように構成されてよい。ＨＤＬ２６０（５）及びＨＤＬ２６０（６）は、ユーザ２１２のそれぞれ右耳及び左耳に音を向けるように構成されてよい。ＨＤＬ２６０（１０）及びＨＤＬ２６０（１１）は、ユーザ２１４のそれぞれ右耳及び左耳に音を向けるように構成されてよい。１４個のＨＤＬ２６０（０）〜２６０（１３）が示されているが、本開示の範囲内で任意の技術的に実行可能な数のユーザ２１０、２１２及び２１４に対応するように、任意の技術的に実行可能な数のＨＤＬ２６０が採用されてよい。

図２Ａ〜図２Ｄの様々な構成要素は、本開示の範囲内で、任意の組合せで使用されてよい。１つの実施例において、これに限定されないが、ユーザは、図２Ｃに示すように、聴覚情景を構成するためのユーザインターフェースデバイスを有してよく、図２Ｄに示すように、高指向性ラウドスピーカからオーディオ信号を受信してよい。別の実施例において、これに限定されないが、聴覚情景コントローラ及びユーザインターフェースデバイスは、図２Ｃに示すような中央通信コントローラの必要がなく、図２Ａに示すように、ピアツーピアネットワークで互いに直接通信してもよい。

図示するように、聴覚情景コントローラ１００の機能は、ユーザにより装着され得る、または携帯され得るウェアラブルデバイスに組み込まれてもよい。１つの実施形態において、聴覚情景コントローラ１００は、ユーザにより装着されるインイヤーデバイスに組み込まれてよい。代替的な実施形態において、聴覚情景コントローラ１００の機能は、例えば、これに限定されないが、Ｂｌｕｅｔｏｏｔｈ（登録商標）ヘッドセット、肩に装着されるスピーカ、ヘッドホン、イヤーバッド、補聴器、インイヤーモニタ、ヘッドレストに組み込まれるスピーカ、または同一の効果または機能を有する任意の他のデバイスを含め、マイク及びスピーカの少なくとも１つを含むヘッドマウント聴覚デバイスに組み込まれてよい。聴覚情景コントローラ１００は、これに限定されないが、スマートフォン、コンピュータ、タブレットコンピュータを含め、聴覚情景を構成するためのユーザインターフェースを含むデバイスに結合されてよい。聴覚情景コントローラ１００は、これに限定されないが、無線リンク、配線による接続、及びネットワーク接続を含め、任意の技術的に実行可能なアプローチを介してそのようなデバイスに結合されてよい。無線リンクは、これに限定されないが、ＷｉＦｉ（商標）リンク、Ｂｌｕｅｔｏｏｔｈ（登録商標）接続、または一般的な無線周波数（ＲＦ）接続を含め、任意の技術的に実行可能な無線通信リンクを介して成されてよい。実際には、聴覚情景コントローラ１００は、例示されたものの他に、広範な異なる無線デバイスと通信リンクを確立してよい。図２Ｃに示した特定のデバイス２５０、２５２及び２５４は、例示的な目的のみのために示され、限定的であることを意図するものでない。

聴覚情景コントローラの動作を示す例示的な使用事例
図３は、様々な実施形態に従った、双方向に隔離された聴覚情景を有する例示的な使用事例３００を示す。図示するように、使用事例は、ユーザ３１０、３１２及び３１４ならびに双方向に隔離された会話バブル３２０を含む。

図３の構成において、ユーザ３１４は、ユーザ３１０及び３１２に聴き取れないこと、また、ユーザ３１０及び３１２の音声が聴こえないことを選択する。一例として、これに限定されないが、ユーザ３１４は、ユーザ３１０及び３１２の注意をそらすことなく、または、ユーザ３１０及び３１２により注意をそらされることなく、プライベートな電話の呼び出しをするためにこの構成を選択するであろう。１つの実施例において、これに限定されないが、ユーザ３１４が、ミーティング中またはバスもしくはタクシーの乗車中に、携帯電話の呼び出しをすること、またはこれを受けることを望む場合に、この構成が生成されてよい。そのような場合、ユーザ３１４と関連する聴覚情景コントローラ１００は、ユーザ３１０及び３１２の音声構成要素を抑制するために、着信オーディオ信号を処理する。ユーザ３１４と関連する聴覚情景コントローラ１００は、ユーザ３１０及び３１２と関連する聴覚情景コントローラ１００のそれぞれの入力オーディオ信号からユーザ３１４の音声構成要素を抑制するため、ユーザ３１０及び３１２と関連する聴覚情景コントローラ１００へ要求を送信する。双方向に隔離された会話バブル３２０がこれにより生成されて、結果的に、ユーザ３１４を含む一方ならびにユーザ３１０及び３１２を含む他方といった、２つの聴覚情景となる。

図４は、様々な実施形態に従った、一方向に外側に隔離された聴覚情景を有する例示的な使用事例４００を示す。図示するように、使用事例４００は、ユーザ４１０、４１２及び４１４ならびに一方向に外側に隔離された会話バブル４２０を含む。

図４の構成において、ユーザ４１４は、ユーザ４１０及び４１２に聴き取れないことを選択するが、ユーザ４１０及び４１２の音声が聴こえることを選択する。１つの実施例において、これに限定されないが、ユーザ４１０がミーティング中またはバスもしくはタクシー乗車中であるときなど、ユーザ４１４は、ユーザ４１０及び４１２の注意をそらすことなくプライベートな電話の呼び出しをするためにこの構成を選択するであろうが、依然として、ユーザ４１０と４１２の間で行われる会話を聴きたいと考えている。そのような場合、ユーザ４１４と関連する聴覚情景コントローラ１００は、ユーザ４１０及び４１２と関連する聴覚情景コントローラ１００のそれぞれの入力オーディオ信号からユーザ４１４の音声構成要素を抑制するため、ユーザ４１０及び４１２と関連する聴覚情景コントローラ１００へ要求を送信する。ユーザ４１４と関連する聴覚情景コントローラ１００は、ユーザ４１４の選好により、最大音量または下げられた音量のいずれかでユーザ４１０及び４１２の音声構成要素を通過させるために、着信オーディオ信号を処理する。一方向に外側に隔離された会話バブル４２０がこれにより生成され、結果的に、ユーザ４１４を含む一方ならびにユーザ４１０及び４１２を含む他方といった、２つの聴覚情景となる。

図５は、様々な実施形態に従った、一方向に内側に隔離された聴覚情景を有する例示的な使用事例５００を示す。図示するように、使用事例５００は、ユーザ５１０、５１２及び５１４ならびに一方向に内側に隔離された会話バブル５２０を含む。

図５の構成において、ユーザ５１４は、ユーザ５１０及び５１２に聴き取れることを選択するが、ユーザ５１０及び５１２の音声が聴こえないことを選択する。１つの実施例において、これに限定されないが、ユーザ５１４は、ユーザ５１０と５１２の間の会話により注意がそらされることを取り除くためにこの構成を選択するであろうが、ユーザ５１０及び５１２が聴くことのできるであろうコメントを差し挟みたいと考えている。別の実施例において、これに限定されないが、ユーザ５１４は、注意がそらされることなく、一時的にＥメールの返信や他の事柄への応対に集中するためにこの構成を選択するであろうが、ユーザ５１０及び５１２が会話をしている場所を離れたくはない。そのような場合、ユーザ５１４と関連する聴覚情景コントローラ１００は、ユーザ５１０及び５１２と関連する聴覚情景コントローラ１００のそれぞれの入力オーディオ信号によりユーザ５１４の音声構成要素を通過させるため、ユーザ５１０及び５１２と関連する聴覚情景コントローラ１００へ要求を送信する。ユーザ５１４と関連する聴覚情景コントローラ１００は、ユーザ５１４の選好により、最大音量または下げられた音量のいずれかでユーザ５１０及び５１２の音声構成要素を抑制するために、着信オーディオ信号を処理する。一方向に内側に隔離された会話バブル５２０がこれにより生成され、結果的に、ユーザ５１４を含む一方ならびにユーザ５１０及び５１２を含む他方といった、２つの聴覚情景となる。

図６は、様々な実施形態に従った、多数のユーザの双方向に隔離された聴覚情景を有する例示的な使用事例６００を示す。図示するように、使用事例６００は、ユーザ６１０、６１２及び６１４ならびに多数のユーザ６２０を有する双方向に隔離された会話バブルを含む。

図６の構成において、ユーザ６１０及び６１４は、ユーザ６１２に聴き取れないこと、また、ユーザ６１２の音声が聴こえないことを選択する。１つの実施例において、これに限定されないが、ユーザ６１０及び６１４は、ユーザ６１２の聴こえる範囲の外側でプライベートな会話をするためにこの構成を選択するであろう。ユーザ６１０及び６１４は、ユーザ６１２の注意をそらすことなく、図書館またはコーヒーショップにおいてプライベートな会話をするために、この構成を選択してよい。そのような場合、ユーザ６１０及び６１４と関連する聴覚情景コントローラ１００の一方または両方が、入力オーディオ信号によりユーザ６１０及び６１４の音声構成要素を抑制するため、ユーザ６１２と関連する聴覚情景コントローラ１００へ要求を送信する。ユーザ６１０及び６１４と関連する聴覚情景コントローラ１００は、ユーザ６１４の選好により、最大音量または下げられた音量のいずれかでユーザ６１２の音声構成要素を完全にまたは部分的に抑制するために、着信オーディオ信号を処理する。ユーザ６１０及び６１４と関連する聴覚情景コントローラ１００は、ユーザ６１０及び６１４が騒がしい環境において会話をしている場合など、バックグラウンドノイズを抑制することを随意に選択してよい。多数のユーザ６２０を有する双方向に隔離された会話バブルがこれにより生成され、結果的に、ユーザ６１２を含む一方ならびにユーザ６１０及び６１４を含む他方といった、２つの聴覚情景となる。

図７は、様々な実施形態に従った、多数のユーザの多方向に隔離された聴覚情景を有する例示的な使用事例７００を示す。図示するように、使用事例は、ユーザ７１０、７１２、７１４及び７１６ならびに多方向に隔離された会話バブル７２０、７２２及び７２４を含む。

図７の構成において、ユーザ７１０及び７１６は互いと会話したいと考えており、一方で、ユーザ７１２及び７１４は互いと会話したいと考えている。加えて、ユーザ７１２は、ユーザ７１０の音声を聴きたいと考えている。一例は、これに限定されないが、ユーザ７１０が１つの言語でスピーチを行っており、一方でユーザ７１２がそのスピーチを第２の言語へ翻訳している状況のユーザ７１０、７１２、７１４及び７１６である。ユーザ７１６は７１０により話される言語でスピーチが聴こえるが、ユーザ７１２または７１４の音声は聴こえない。ユーザ７１４にはユーザ７１２の音声が聴こえるが、ユーザ７１０の音声は、ユーザ７１４の選好で、ユーザ７１４に対し完全にまたは部分的に抑制される。そのような場合、ユーザ７１０、７１２、７１４及び７１６と関連する聴覚情景コントローラ１００は、適切な音声構成要素を抑制するため、互いに要求を送信する。ユーザ７１０、７１２、７１４及び７１６と関連する聴覚情景コントローラ１００は、必要に応じて、最大音量または下げられた音量のいずれかで様々なユーザの音声構成要素を完全にまたは部分的に抑制するために、着信オーディオ信号を処理する。多方向に隔離された会話バブル７２０、７２２及び７２４がこれにより生成され、結果的に、ユーザ７１０及び７１６を含む一方、ユーザ７１０及び７１２を含む他方、ならびに、ユーザ７１２及び７１４を含む他方といった、３つの聴覚情景となる。

図３〜図７に関連して上述した例示的な使用事例のシナリオが、異なる技法を示すために例示的な目的のみのために提供され、聴覚情景コントローラ１００が様々な聴覚情景構成を生成するように実施されてよいことを当業者は理解するであろう。各聴覚情景が任意の数のユーザを含む、任意の数の聴覚情景の多くの他の構成が、本開示の範囲内で、説明された技法を使用して実施されてよい。さらに、上述の実施例は、特定のコマンド、デバイス、及び動作に関連して表されたが、これらの特定性に本発明の範囲を限定することを意図するものでない。

聴覚情景の様々な構成を生成するための様々な使用事例及びシステムを説明してきたが、聴覚情景コントローラ１００により実施され得る例示的なアルゴリズムが次に説明される。ここまで説明した機能を実施することにより、聴覚情景コントローラ１００は、同じ空間において、互いに干渉することなく様々な会話を同時に行う、個々人の能力を改善し得る。

聴覚情景コントローラにより実施される例示的なアルゴリズム
図８は、様々な実施形態に従った、他の聴覚情景コントローラと通信するように聴覚情景コントローラを初期化及び構成するための方法のステップの流れ図である。方法のステップは、図１〜図７のシステムに関連して説明されるが、任意の順番で方法のステップを実行するように構成される任意のシステムが本発明の範囲内にあることを、当業者は理解するであろう。

図示するように、方法８００は、ステップ８０２で始まり、ここで、聴覚情景コントローラ１００は、これに限定されないが、他の聴覚情景コントローラ及び中央通信コントローラを含む近傍の無線デバイスを発見する。これに限定されないが、ＷｉＦｉ（商標）アクセスポイントを検索して、その後、そこに結合された他のデバイスを識別すること、近傍のＢｌｕｅｔｏｏｔｈ（登録商標）デバイスと直接対話すること、または、ＲＦ信号を使用して無線デバイスと一般的なハンドシェイキングを実行することを含め、聴覚情景コントローラ１００は、任意の技術的に実行可能な形のデバイス発見を実行してよい。

ステップ８０４で、聴覚情景コントローラ１００は、各発見されたデバイスから、特にデバイス機能を反映するデバイス情報を取得する。当該機能は、例えば、これに限定されないが、好ましい無線接続プロトコル（例えば、これに限定されないが、ＷｉＦｉ（商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標））、デバイスによりサポートされる最大数の聴覚情景等を含んでよい。他のデバイス情報は、例えば、これに限定されないが、デバイス位置、デバイスバッテリレベル等を含んでよい。

ステップ８０６で、聴覚情景コントローラ１００は、発見されたデバイスの１つまたは複数とペアになる。そうすることで、聴覚情景コントローラ１００は任意の関連したプロトコルに依存し得る。加えて、聴覚情景コントローラ１００は、異なるプロトコルに依存する異なるデバイスとペアになってもよい。

ステップ８０８で、聴覚情景コントローラ１００は、必要に応じて、ペアになったデバイスのためのコマンドルーティングプリファレンスを構成する。そうすることで、聴覚情景コントローラ１００は、ピアツーピアネットワークで他の聴覚情景コントローラと直接通信し得る。あるいは、聴覚情景コントローラ１００は、他の聴覚情景コントローラと共に、中央通信コントローラ２４０のみと直接通信し、中央通信コントローラは、聴覚情景コントローラのそれぞれと別個に通信する。以下で説明される図９は、聴覚情景コントローラ１００の通常動作を段階的に説明する。

図９は、様々な実施形態に従った、聴覚情景コントローラを介して聴覚情景を生成するための方法のステップの流れ図である。方法のステップが図１〜図７のシステムに関連して説明されるが、任意の順番で方法のステップを実行するように構成される任意のシステムが本発明の範囲内にあることを、当業者は理解するであろう。

図示するように、方法９００は９０２で始まり、ここで、マイクモジュール１１０から受信されたオーディオ入力信号が変更なくスピーカモジュール１４０へ伝送される状態に、聴覚情景コントローラ１００が初期化される。ステップ９０４で、聴覚情景コントローラ１００は、例えば、これに限定されないが、別の聴覚情景コントローラから、または、通信モジュール１４０から要求を受信することにより、オーディオ情景要求を受信する。

ステップ９０６で、聴覚情景コントローラ１００は、オーディオ情景要求が、別の聴覚情景コントローラと関連する音声などのオーディオ音声構成要素を抑制するための要求であったかどうかを判定する。オーディオ情景要求が音声抑制要求である場合、方法９００はステップ９０８へ進み、ここで、聴覚情景コントローラ１００は、要求された音声構成要素が抑制された状態で、受信されたオーディオ入力信号を含むオーディオ信号を生成する。ステップ９１０で、聴覚情景コントローラ１００は、生成されたオーディオ信号をラウドスピーカモジュール１４０へ伝送する。方法９００はその後、上記のステップ９０４へ進む。

ステップ９０６で、オーディオ情景要求が音声抑制要求でない場合、方法９００はステップ９１２へ進み、ここで、オーディオ情景要求が、別の聴覚情景コントローラと関連する音声などのオーディオ音声構成要素を抑制するのを中断するための要求であったかどうかを、聴覚情景コントローラ１００が判定する。オーディオ情景要求が停止音声抑制要求である場合、方法９００はステップ９１４へ進み、ここで、受信されたオーディオ入力信号を含み、且つ、要求された音声構成要素が信号に再び混合された状態のオーディオ信号を、聴覚情景コントローラ１００が生成する。ステップ９１６で、聴覚情景コントローラ１００は生成されたオーディオ信号をラウドスピーカモジュール１４０へ伝送する。方法９００はその後、上記のステップ９０４へ進む。

ステップ９０６で、オーディオ情景要求が停止音声抑制要求でない場合、方法９００は上記のステップ９０４へ進む。

要約すれば、聴覚情景コントローラは、物理的環境において多数の聴覚情景を生成するように構成される。着信オーディオ信号における全ての音声を抑制すること、及び、ユーザの音声が他のユーザにより聴くことができないようにユーザの音声を抑制するため、他の聴覚情景コントローラへ要求を送信することにより、聴覚情景コントローラは、聴覚信号のユーザを双方向に隔離してよい。あるいは、着信オーディオ信号における全ての音声を抑制するが、ユーザの声を他のユーザが聴くことを可能にすることにより、聴覚情景コントローラは、聴覚信号のユーザを一方向に隔離してよい。あるいは、着信オーディオ信号における全ての音声を、ユーザが聴くことを可能にするが、ユーザの音声が他のユーザより聴くことができないようにユーザの音声を抑制するため、他の聴覚情景コントローラへ要求を送信することにより、聴覚情景コントローラは、聴覚信号のユーザを一方向に隔離してよい。会話のバブルは、数人のサブグループが、当該サブグループにおいて互いに話すことを可能にするように生成されてよいが、メイングループにおける他のユーザの会話から隔離されてよい。

本発明の１つの実施形態は、コンピュータシステムと共に使用されるためのプログラム製品として実施されてもよい。プログラム製品のプログラムは、実施形態の機能（本明細書で説明される方法を含む）を規定し、種々のコンピュータ可読の記憶媒体に含まれてよい。例示的なコンピュータ可読の記憶媒体は、これに限定されないが、（ｉ）情報が永久に記憶される、書込み不可能な記憶媒体（例えば、ＣＤ‐ＲＯＭドライブにより読取り可能なコンパクトディスクリードオンリメモリ（ＣＤ‐ＲＯＭ）ディスクなど、コンピュータ内のリードオンリメモリデバイス、フラッシュメモリ、リードオンリメモリ（ＲＯＭ）チップ、または、任意のタイプのソリッドステート不揮発性半導体メモリ）、及び、（ｉｉ）変更可能な情報が記憶される、書込み可能な記憶媒体（例えば、ディスケットドライブもしくはハードディスクドライブ内のフロッピー（登録商標）ディスク、または、任意のタイプのソリッドステートランダムアクセス半導体メモリ）を含む。

本発明が、特定の実施形態と関連して上記で説明された。しかし、添付の特許請求の範囲において述べられる本発明のより広範な精神及び範囲から逸脱することなく、本発明に対する様々な修正または変更が成されてもよいことを当業者は理解するであろう。前述の説明及び図面は、従って、限定的な意味ではなく、例示的な意味で考慮される。

それゆえ、本発明の実施形態の範囲は、次の特許請求の範囲において述べられる。

Claims

第１の聴覚情景コントローラと関連する聴覚情景を生成する、コンピュータにより実施される方法であって、
マイクから、第１の複数の音声構成要素を含む第１の聴覚信号を受信することと、
前記第１の複数の音声構成要素に含まれる第１の音声構成要素を少なくとも部分的に抑制するための要求を受信することと、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成することと、
出力のために、前記第２の聴覚信号をスピーカへ伝送することと、
第２の聴覚情景コントローラと関連する第２の複数の音声構成要素に含まれる第２の音声構成要素を抑制するための要求を前記第２の聴覚情景コントローラへ伝送することと
を含む、コンピュータにより実施される方法。
前記第１の音声構成要素を抑制するのを中断するための要求を受信することと、
前記第１の音声構成要素が抑制されていない状態で、前記第１の複数の音声構成要素を含む第３の聴覚信号を生成することと、
出力のために、前記第３の聴覚信号を前記スピーカへ伝送することと
をさらに含む、請求項１に記載のコンピュータにより実施される方法。
前記第２の聴覚信号を生成することが、前記第１の音声構成要素が完全に抑制された状態で、前記第１の複数の音声構成要素を含む前記第２の聴覚信号を生成することを含む、請求項１に記載のコンピュータにより実施される方法。
前記第１の複数の音声構成要素に含まれる第２の音声構成要素を抑制するための要求を受信することをさらに含み、
前記第２の聴覚信号を生成することが、前記第１の聴覚信号に含まれる第２の音声構成要素を部分的に抑制することを含む、請求項１に記載のコンピュータにより実施される方法。
前記第２の聴覚信号を生成することがさらに、前記マイクにより受信されるバックグラウンドノイズ信号を抑制することを含む、請求項１に記載のコンピュータにより実施される方法。
前記マイク及び前記スピーカが、インイヤー聴覚デバイスに組み込まれる、請求項１に記載のコンピュータにより実施される方法。
前記マイク及び前記スピーカが、ヘッドマウント聴覚デバイスに組み込まれる、請求項１に記載のコンピュータにより実施される方法。
前記マイク及び前記スピーカが、椅子または座席と関連するヘッドレストに組み込まれる、請求項１に記載のコンピュータにより実施される方法。
前記スピーカが高指向性スピーカを含む、請求項１に記載のコンピュータにより実施される方法。
無線ネットワークインターフェースと、
プロセッサと
を含むコンピューティングデバイスであって、
前記プロセッサは、
マイクを介して、第１の複数の音声構成要素を含む第１の聴覚信号を受信することと、
前記第１の複数の音声構成要素に含まれる第１の音声構成要素を少なくとも部分的に抑制するための要求を受信することと、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成することと、
出力のために、前記第２の聴覚信号をスピーカへ伝送することと、
第２の聴覚情景コントローラと関連する第２の複数の音声構成要素に含まれる第２の音声構成要素を抑制するための要求を前記第２の聴覚情景コントローラへ伝送することと
を実行するように構成される、コンピューティングデバイス。
無線ネットワークインターフェースと、
プロセッサと
を含むコンピューティングデバイスであって、
前記プロセッサが、
マイクを介して、第１の複数の音声構成要素を含む第１の聴覚信号を受信することと、
前記第１の複数の音声構成要素に含まれる第１の音声構成要素を少なくとも部分的に抑制するための要求を受信することと、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成することと、
出力のために、前記第２の聴覚信号をスピーカへ伝送することと
を実行するように構成され、
前記第１の音声構成要素を抑制するための前記要求が、前記無線ネットワークインターフェースを介して受信される、コンピューティングデバイス。
入力デバイスをさらに含み、前記第１の音声構成要素を抑制するための前記要求が、前記入力デバイスの作動を介して受信される、請求項１０に記載のコンピューティングデバイス。
無線ネットワークインターフェースと、
プロセッサと
を含むコンピューティングデバイスであって、
前記プロセッサが、
マイクを介して、第１の複数の音声構成要素を含む第１の聴覚信号を受信することと、
前記第１の複数の音声構成要素に含まれる第１の音声構成要素を少なくとも部分的に抑制するための要求を受信することと、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成することと、
出力のために、前記第２の聴覚信号をスピーカへ伝送することと
を実行するように構成され、
前記プロセッサがさらに、前記無線ネットワークインターフェースを介して、第２の音声構成要素を抑制するための、第１の聴覚情景コントローラに向けられた要求を伝送するように構成され、
前記第１の聴覚情景コントローラが、前記第２の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第３の聴覚信号を生成するように構成される、コンピューティングデバイス。
無線ネットワークインターフェースと、
プロセッサと
を含むコンピューティングデバイスであって、
前記プロセッサが、
マイクを介して、第１の複数の音声構成要素を含む第１の聴覚信号を受信することと、
前記第１の複数の音声構成要素に含まれる第１の音声構成要素を少なくとも部分的に抑制するための要求を受信することと、
前記第１の音声構成要素が少なくとも部分的に抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成することと、
出力のために、前記第２の聴覚信号をスピーカへ伝送することと
を実行するように構成され、
前記プロセッサがさらに、前記無線ネットワークインターフェースを介して、前記コンピューティングデバイスと関連する音声構成要素を除いて、全ての音声構成要素を少なくとも部分的に抑制するための、第１の聴覚情景コントローラに向けられた要求を伝送するように構成される、コンピューティングデバイス。
前記プロセッサがさらに、前記第１の聴覚情景コントローラと関連する音声構成要素を除いて、全ての音声構成要素を抑制するための要求を、前記無線ネットワークインターフェースを介して受信するように構成される、請求項１４に記載のコンピューティングデバイス。
前記プロセッサがさらに、前記第１の聴覚情景コントローラ及び第２の聴覚情景コントローラと関連する音声構成要素を除いて、全ての音声構成要素を抑制するための要求を、前記無線ネットワークインターフェースを介して受信するように構成される、請求項１４に記載のコンピューティングデバイス。
前記第１の聴覚情景コントローラが、前記コンピューティングデバイスと関連する前記音声構成要素を除いて、前記第２の聴覚情景コントローラと関連する前記音声構成要素を部分的に抑制し全ての他の音声構成要素を完全に抑制するように構成される、請求項１６に記載のコンピューティングデバイス。
プログラム命令を記憶する非一時的なコンピュータ可読媒体であって、前記プログラム命令が、処理ユニットによって実行される場合、
マイクから、第１の複数の音声構成要素を含む第１の聴覚信号を受信するステップと、
前記第１の複数の音声構成要素に含まれる第１の音声構成要素を抑制するための要求を受信するステップと、
前記第１の音声構成要素が抑制された状態で、前記第１の複数の音声構成要素を含む第２の聴覚信号を生成するステップと、
出力のために、前記第２の聴覚信号をスピーカへ伝送するステップと、
第２の聴覚情景コントローラと関連する第２の複数の音声構成要素に含まれる第２の音声構成要素を抑制するための要求を前記第２の聴覚情景コントローラへ伝送するステップと
を実行することにより、前記処理ユニットに聴覚情景を生成させる、非一時的なコンピュータ可読媒体。