JP2014217055A

JP2014217055A - 未知の話し手を識別するシステム

Info

Publication number: JP2014217055A
Application number: JP2014082405A
Authority: JP
Inventors: ルーカス・ウィリアム・パートリッジ; william partridge Lucas; ジョナサン・デイビッド・ペンバージー; David Penberthy Jonathon
Original assignee: GE Aviation Systems Ltd
Current assignee: GE Aviation Systems Ltd
Priority date: 2013-04-22
Filing date: 2014-04-14
Publication date: 2014-11-17
Anticipated expiration: 2034-04-14
Also published as: CN104112449A; GB201307244D0; DE102014105570A1; FR3004880A1; GB2513559A; BR102014009020A2; US9083808B2; JP6200369B2; CA2848692C; GB2513559B8; US20140314216A1; CN110060688A; GB2513559A8; FR3004880B1; GB2513559B; CA2848692A1

Abstract

【課題】誰が話しているかを聞き手が容易には理解できるコミュニケーション装置を提供する。
【解決手段】複数の参加者３０の話し手と聞き手との間での言葉によるコミュニケーションにおいて用いられ、話し手と少なくとも１人の聞き手との間の言葉によるコミュニケーションで使用する識別装置４０を含み、話し手と少なくとも１人の聞き手とが複数の参加者の全て又は一部を形成し、話し手と少なくとも１人の聞き手とが互いに空間的に離れており、識別装置が話し手の識別情報と関連付けられる感覚出力を聞き手に提供するよう動作可能である。
【選択図】図２

Description

本発明は、誰が話しているかを聞き手が容易には理解できない場合における、複数の参加者の話し手と聞き手との間での言葉によるコミュニケーションにおいて用いられ、話し手の識別情報を示す感覚出力を聞き手に提供するよう動作可能である装置、部品キット、及びその関連する方法に関する。

複数の参加者の話し手と聞き手との間で言葉によるコミュニケーションを必要とする多くの状況があるが、この場合、話し手と聞き手が離れていることで、誰が話しているかを１又は複数の聞き手が判断することが難しくなる。

この問題は、話し手と１又は複数の聞き手が直接見通し線から外れた位置にある場合に発生する可能性がある。このような１つの実施例は、異なる地理上の位置にいる複数の参加者間で電気通信ネットワークを介して取り次がれる音声会議通話を使用する例である。これは、商用通信を行う手段として周知である。しかしながら、通話中の参加者の人数が二人よりも多い場合には、ある所与の時間において参加者の誰が話しているのかを判別することが難しい場合がある。この問題は、参加者が直接見通し線に存在せず、従って、電話の向こう側で誰が話しているのかを識別するのに音声信号にのみ依存しなければならないことによって生じた結果である。この問題は、従来のアナログ音声電話サービス（ＰＯＴＳ）ネットワークを介して会議通話を行う場合に更に悪化し、これは、ＰＯＴＳネットワーク上で使用可能な音声周波数帯域が約３００Ｈｚ〜３，４００Ｈｚに制限され、すなわち、人間の聴覚範囲を表す周波数帯域（およそ２０Ｈｚ〜２０，０００Ｈｚ）の僅かな一部に制限される。従って、聴取している参加者は、誰が話しているのかを識別するのに聴覚信号にのみ依存しなければならないことに加えて、圧縮された音声信号に対する識別に基づかなければならない。話し手の識別は、ＰＯＳＴネットワークを介した伝送によって導入される可能性がある、話している参加者の発話における何らかの歪みによって更に妨げられる恐れがある。

誰が話しているかを識別する１又は複数の聞き手の問題はまた、単一の部屋（混雑した講演場など）に複数の参加者がいる会議又は講演において生じる可能性がある。単一の部屋に大勢の参加者がいる場合には、例え話し手が聴いている人と直接見通し線にいたとしても、参加者の中から誰が話しているかを聴いている人が判断することは困難である。

所与の人の声を声紋から認識することに基づいて、誰が話しているかを識別できる音声認識システムを用いることは公知である。しかしながら、このようなシステムは、所与の人を識別するために十分な程の音声プロファイルを確立するためのトレーニングと、所与の電話中の全ての人の音声プロファイルが含まれたデータベースとが必要となる。従って、このようなシステムは、時間とインフラの両方の観点で高価なものとなる。

その結果、誰が話しているかを聞き手が容易には理解できない場合において、話し手と聞き手との間での言葉によるコミュニケーションの状況で誰が話しているかを識別する改善された手段に対する必要性がある。

従って、本発明の第１の態様は、話し手と少なくとも１人の聞き手との間の言葉によるコミュニケーションで使用する装置を提供し、話し手と少なくとも１人の聞き手とが複数の参加者の全て又は一部を形成し、話し手と少なくとも１人の聞き手とが互いに空間的に離れており、装置が、話し手の識別情報と関連付けられる感覚出力を聞き手に提供するよう動作可能であり、本装置が、話し手が装着可能又は携帯可能であり且つ話し手の発話と関連付けられる振動を検出するための振動センサを含む識別装置を備え、識別装置が、話し手及び識別装置の一方又は両方の識別情報を表す識別データを格納するよう構成され、これにより識別装置が話し手の識別情報と関連付けられ、識別装置が、振動センサによる話し手の発話と関連付けられる振動の検出に応答して格納された識別データを含む又は該識別データから生成される識別信号を送信機が送信するように動作可能であり、本装置が更に、聞き手が使用するための表示装置を備え、表示装置が、識別信号を受け取って、話し手及び識別装置の一方又は両方の識別情報を示す感覚出力を受け取った識別信号から生成するように動作可能である。

本発明において「複数の」参加者とは、２又はそれ以上の参加者を意味する。更に「話し手」及び「聞き手」はまた、本明細書内ではそれぞれ、話している参加者と聴いている参加者を指し、これらの用語は同義的に使用される。

本発明は、誰が話しているかを聞き手が容易には理解できず、このため話し手の識別情報を確立する聞き手の能力が妨げられる場合における、話し手と聞き手の間との間での何らかの言葉によるコミュニケーションの用途に適用される。この用途には、限定ではないが、所与の時間において誰が話しているかに関する識別情報を確立するのを助けるために複数の参加者がいる会議又は講演における使用が挙げられる。単一の部屋（混雑した講演場など）に大勢の参加者がいる場合には、例え話し手が聴いている人と直接見通し線にいたとしても、参加者の中から誰が話しているかを聴いている人（すなわち、聞き手）が判断することは困難である。本発明の装置は、混雑したスペースにおいて誰が話しているかに関する識別情報を聞き手が判断することを容易に可能にする手段を提供する。電気通信又は無線アプリケーションでの使用は、話し手と聞き手は互いに直接見通し線にはいない。本発明の装置は、異なるネットワークノードに対応する異なる地理上の位置にいる複数の参加者間で電気通信又は無線ネットワークを介して行われる音声通信会議において特に有用となる。本発明の装置を用いることができる電気通信ネットワークの非限定的な実施例には、アナログ音声電話サービス（ＰＯＴＳ）、セルラー電話ネットワーク、及び／又はボイス・オーバー・インターネット・プロトコル（ＶＯＩＰ）が挙げられる。本発明はまた、航空機のパイロットと航空管制官及び／又は他の航空機との間での無線通信での使用にも有利となる。或いは、本発明は、タクシー会社又は貨物運送会社による使用など、陸上輸送における無線通信の一部として使用される場合に有利となる。

複数の参加者を有するこのような何らかの「言葉によるコミュニケーション」の状況において本発明を用いることを考慮する場合には、各参加者は、異なる時間には話しており、又は聞いていることに特に留意されたい。従って、「話し手」と「聞き手」の役割は必ずしも固定されていない。このことは、複数の異なる参加者の間で電気通信又は無線ネットワークを介した音声通信会議中に本発明を使用することを考慮する場合により明確に理解することができ、すなわち、所与の参加者は、会議においてある場合は「話し手」となり、別の場合には「聞き手」となることがある。従って、本発明の識別装置及び表示装置の使用を説明する場合、本明細書で使用される用語「話し手」及び「聞き手」は、（言葉によるコミュニケーションの間に所与の時点でその人が話しているか又は聞いているかに応じて）同一の人に適用することができる。

話し手及び識別装置の一方又は両方の識別情報を表す識別データを格納するように識別装置を構成させることは、様々な異なる方法で可能にすることができる。非限定的な実施例は、社員ＩＤタグの形態で提供され、タグには所与の社員の識別情報を表す識別データがエンコードされたチップが含まれる識別装置を含むことができる。識別データは、社員の名前及び社員番号の形態をとることができる。或いは、識別データは、所与の識別装置に関連する色及び形状の一方又は両方を含むことができる。異なるネットワークノードに位置する複数の参加者間で電気通信又は無線ネットワークを介して行う非限定的な実施例によれば、会議への参加者の各々には、当該識別装置に一意的にリンク付けされた可視マーキングを表す識別データで構成された固有の識別装置を提供することができる。この一意のリンク付けは、各識別装置が色、形状、又はこれらの組み合わせの形態の一意の可視マーキングを有する形をとることができ、各識別装置には異なる色及び／又は形状が提供され、識別装置は、色及び／又は形状を表す識別データでエンコードされたチップ又は他の記憶手段を含む。このような色及び／又は形状の使用は、格納された識別データが、識別装置自体の識別情報を表すことになり、従って、参加者の何れかの個人情報（例えば、名前、生年月日、及び／又は住所）を含めた識別データを識別装置上に格納する必要性が排除される利点をもたらすことになる一例を提供する。

感覚出力は、好ましくは、視覚出力、触覚出力、及び可聴出力の１つ又はそれ以上を含む。可聴出力は、話し手の名前を提供する聴覚によるボイスオーバの形態をとることができるが、これは、話し手が何を言っているかを聞き取る１又は複数の聞き手の能力を潜在的に妨げる可能性がある。このため、視覚出力が好ましい。視覚出力は、（識別信号に含まれる情報に基づいて）聞き手に対して話し手及び話し手の識別装置の一方又は両方の識別情報を確立するのに十分な何らかの視覚的表現の形態をとる。例えば、視覚出力は、単に、話し手の名前のテキスト表現、又は話し手及び話し手の識別装置の一方又は両方を表す何らかの英数字識別子とすることができる。或いは、視覚出力は、色及び／又は形状の形態をとることができる。例えば、各識別装置は、色、形状、又はこれらの組み合わせの形態の固有の一意の可視マーキングを備え、識別データは色及び／又は形状（前段で概略的に説明したような）を表し、表示装置上に提供される感覚出力は、色及び／又は形状の視覚的表現とすることができる。或いは、触覚出力は、Ｂｒａｉｌｌｅ（点字；視覚障害の参加者に好適）又は振動（異なる識別装置から送信される異なる識別信号に対応する異なる振動信号の出力など）の形態をとることができる。

識別装置は、話し手が識別データで識別装置を事前構成するよう動作可能な入力手段を含むことが好ましい。識別装置を事前構成するためのこのような入力手段の提供により、話し手が、固有の識別情報を表す識別データで識別装置を事前構成できるようになる。使用時には、このような事前構成は、「言葉によるコミュニケーション」を開始する前に行うことが望ましい。更に説明すると、航空機のパイロットと航空管制官との間の空中〜地上通信での使用を考慮した場合、パイロットは、離陸前に識別装置を事前構成するのが好ましく、複数の参加者間で電気通信又は無線ネットワークを介した音声通信会議の実施例を考慮した場合、各参加者は、会議の開始前に識別装置を事前構成するのが好ましいことになる。好都合には、入力手段は、キーパッド及び録音装置の一方又は両方を含む。従って、話し手は、キーパッド入力及び／又は音声入力を用いて名前（又は他の何れかの個人識別子）などの識別データで識別装置を事前構成することができる。

識別装置は、別の人の識別情報で再関連付け可能であるよう構成されることが特に好ましい。本発明のこの特徴は、識別装置が所与の人と恒久的に関連付けられることに制限されないようにし、これにより後で識別装置を別の人が確実に使用できるようにする。多数の社員を有する組織内で本発明の装置を用いることを考慮した場合、「再関連付け」の特徴は、固有の識別装置をそれぞれの社員に提供する必要性を排除し、全社員が同じ「言葉によるコミュニケーション」において同時に参加することは不可能になる。更に、再関連付けの特徴はまた、ある期間にわたり多くの人に所与の識別装置を再使用する能力を提供する。

「言葉によるコミュニケーション」の状況での使用時に、参加者の全てに固有の装着可能又は携帯可能な識別装置を提供することが想定される。これにより、各参加者が、話す際に参加者に一意的に関連付けられた識別信号を生成するのに好適な手段を確実に所有することになる。必要な表示装置の数は、特定の言葉によるコミュニケーション状況によって決まることになる。単一の部屋において多くの参加者がいる会議又は講演中に本発明を使用することを考慮すると、参加者全員が見える単一の共通の表示装置のみそこに存在するので十分とすることができる。しかしながら、異なるネットワークノードに対応する異なる地理上の位置にいる複数の参加者間で電気通信（又は無線）ネットワークを介して行われる音声通信会議中に本発明を使用することを考慮すると、各ネットワークノードにおいて少なくとも１つの表示装置を設けることが想定される。これにより、話している参加者の識別装置からネットワークを介して受け取られる識別情報に基づいて、ネットワークの各ノードにて出席し聞いている参加者が異なるノードにおいて誰が話しているかに関するリアルタイムの感覚表示を得る能力を提供することになる。

好ましくは、識別装置は、話し手からの連続発話の最小持続時間の後にだけ送信機が識別信号を送信するように構成される。本発明のこの特徴は、話し手の咳又はくしゃみに基づいて表示装置が起動するのが回避され、これにより装置の使用中に参加者の話していることの誤った表示を回避できる有益な効果がある。好都合には、最小持続時間は、０．５〜２秒である。最小持続時間が長すぎると、ａ）話し手の発話が１又は複数の聞き手によって最初に聞かれてから、ｂ）表示装置（１又は複数の聞き手に対する）が、識別信号を受け取って誰が話しているかに関する識別情報の感覚出力を生成するまでの間の許容できないタイムラグが生じる恐れがある。

好ましくは、識別装置は、話し手の首又は胸の近くに位置決めされる。本発明のこの特徴は、話し手の声帯の使用による振動を振動センサがより確実に検出できるようにするのを助ける。識別装置は、話し手の首の周りに装着するためにネックレスに好都合に取り付けることができる。好都合には、識別装置は、可搬性があり、話し手が身に着けた衣類品に取付可能であり、又は、話し手の体に（例えば、ストラップ又は接着テープを用いて）直接取り付け可能とすることができ、これら全ては「装着可能」又は「携帯可能」な識別装置の範囲内にある。

識別装置を参加者によって使用時に装着又は携帯されるようにすることにより、当該参加者に識別センサが近接していることが可能となる。これにより、識別装置を装着又は携帯している参加者からの発話だけを検出するように振動センサをより容易に較正することができる利点を提供する。この利点は、特定の識別装置を装着又は携帯している参加者以外の人達からの発話によって識別装置が起動するのが回避されるので、他の人達が特定の参加者と同じ部屋に存在する場合に特に適切である。

識別装置の送信機は、２０Ｈｚ〜２０，０００Ｈｚの間の周波数を有する音声信号として識別信号を送信するよう構成することができる。このような周波数範囲は、人間の聴覚に聞こえる一般に認められる周波数範囲に相当する。好都合には、送信機は、３００Ｈｚ〜３，４００Ｈｚの狭い周波数帯域内にある周波数を有する音声信号として識別信号を送信するよう構成される。この狭い周波数帯域は、送信可能な可聴周波数範囲が人間の聴覚の範囲（２０Ｈｚ〜２０，０００Ｈｚ）と一般に関連付けられる周波数の一部に相当する従来のアナログ音声電話サービス（ＰＯＴＳ）の形態で電気通信ネットワークを介した識別信号の直接送信に特に好適である。

或いは、送信機は、２０，０００Ｈｚを上回る周波数で識別信号を無線送信するよう構成することができ、本装置は更に、識別装置と電気通信又は無線ネットワークとの間を通信可能に結合できる第１のエンコーダを備え、該第１のエンコーダは、送信された識別信号を受け取り、ａ）２０Ｈｚ〜２０，０００Ｈｚの範囲（或いは代替として３００Ｈｚ〜３，４００Ｈｚの範囲）の周波数を有する音声信号、又はｂ）暗号化されたデジタル信号のうちの一方に変換するよう動作可能であり、ｂ）の場合、表示装置は、暗号化されたデジタル信号を復号するデコーダを備え、又はデコーダと通信可能に結合できる。

２０，０００Ｈｚを上回る周波数での識別装置からの識別信号の送信は、話し手に聞こえず、従って、集信を妨げず、発話に影響を及ぼさないことを確実にする有利な効果がある。第１のエンコーダによる２０Ｈｚ〜２０，０００Ｈｚの範囲での可聴周波数への後続の変換は、本装置の識別装置が、人間の聴覚の全範囲に対応する音声信号を送信できる電気通信又は無線ネットワークと共に使用される場合に有利であり、一方、３００Ｈｚ〜３，４００Ｈｚの範囲の周波数を有する音声信号への変換は、本装置がＰＯＴＳの形態の電気通信ネットワークと共に使用される場合に特に有利である。

上記で概説された第１のエンコーダの使用に加えて、識別装置はまた、送信機により無線Ｂｌｕｅｔｏｏｔｈ信号として送信するために識別信号をエンコードするよう動作可能とすることができ、ここで識別装置及び第１のエンコーダは互いにＢｌｕｅｔｏｏｔｈペアリングが可能である。Ｂｌｕｅｔｏｏｔｈプロトコルの使用は、識別装置と第１のエンコーダとの間での無線接続及び情報交換を行うための安全な方法を提供する。

好都合には、第１のエンコーダは、電気通信又は無線ネットワークのノードに接続可能な端末内に一体化され、該端末はネットワークとの間で音声通信をするよう動作可能である。１つの実施例において、端末は、ＰＯＴＳを介して接続可能な電話とすることができ、電話は、近接して位置する１人又はそれ以上の参加者の発話を検出するマイクロフォンと、ＰＯＴＳを介して受け取られる音声信号を聞いている誰かに伝達するためのスピーカーとを有する。

好ましくは、本装置は更に、表示装置内に一体化された、又は表示装置に通信可能に接続できるフィルタを備え、フィルタは、識別信号と話し手の発話の音声信号の両方を含む結合信号を受け取るよう動作可能であり、更に、この結合信号をフィルタ処理し、フィルタ処理された信号を聞き手に音声出力する前に、結合信号から識別信号を抽出するよう動作可能である。このようなフィルタを使用することにより、１又は複数の聞き手が、識別信号からの干渉又は歪みなしでネットワークの別のノードにおいて話している参加者が話した言葉を聞き取ることを確実にすることができる。

好ましくは、表示装置は、電気通信又は無線ネットワークのノードに接続可能な端末内に一体化され、該端末は、ネットワークとの間で音声通信をするよう動作可能である。本発明のこの特徴は、電気通信又は無線ネットワークとの間で音声入力及び音声出力を提供するよう機能すると同時に、ネットワークの別のノードにて誰が話しているかに関する視覚的表示を提供する機能を果たすことができる単一の一体化された端末を提供する利点をもたらす。代替として、又はこれに加えて、識別装置は、電気通信又は無線ネットワークのノードに接続可能な端末内に一体化され、該端末は、ネットワークとの間で音声通信するよう動作可能であり、例えば、端末は、識別装置及び表示装置の両方として機能できるセルラー電話とすることができる。

本発明の別の態様において、電気通信又は無線ネットワークとの間で音声通信するよう動作可能な端末が提供され、該端末は、本発明の識別装置及び表示装置の一方又は両方を含む。本発明の一形態において、端末はセルラー電話とすることができる。

本発明の別の態様において、本発明の識別装置及び表示装置を含む部品キットが提供される。このようなキットは、識別情報に関連付けられる識別信号を生成するのに必要であり、すなわち、言葉によるコミュニケーション中に話し手であるときの当該人が使用するのに好適な手段（すなわち、「識別装置」）と、言葉によるコミュニケーション中に当該人が聞き手であるときに誰が話しているかに関する識別情報を示す視覚的出力を提供するのに必要な手段（すなわち、「表示装置」）との両方を人に提供することになるので、有用となる。

本発明の別の態様において、話し手と少なくとも１人の聞き手との間の言葉によるコミュニケーションにおいて誰が話しているかを識別する方法が提供され、話し手と少なくとも１人の聞き手とが複数の参加者の全て又は一部を形成し、話し手と少なくとも１人の聞き手とが互いに空間的に離れており、方法が、話し手の識別情報と関連付けられる感覚出力を少なくとも１人の聞き手に提供し、本方法が、話し手が装着可能又は携帯可能であり且つ話し手の発話と関連付けられる振動を検出するための振動センサを含む識別装置を提供するステップを含み、識別装置が、話し手及び識別装置の一方又は両方の識別情報を表す識別データを格納し、これにより識別装置が話し手の識別情報と関連付けられ、本方法が更に、話し手が識別装置を装着又は携帯しているときに、話し手の発話と関連付けられる振動を振動センサを用いて検出するステップと、振動の検出に応答して、格納された識別データを含む又は該識別データから生成される識別信号を識別装置から送信するステップと、少なくとも１人の聞き手が使用するための表示装置を提供するステップと、を含み、表示装置が、識別信号を受け取って、話し手及び識別装置の一方又は両方の識別情報を示す感覚出力を受け取った識別信号から生成する。

本発明の方法はまた、上記で概説された装置の種々の実施可能な特徴により提供される機能に相当するステップを組み込むことができる。

以下の図において本発明の実施形態が示されている。

複数の異なるノードを有する電気通信ネットワークの図。図１に示す電気通信ネットワークと共に用いたときの本発明の第１の実施形態を示す図。図１に示す電気通信ネットワークと共に用いたときの本発明の第２の実施形態を示す図。図１に示す電気通信ネットワークと共に用いたときの本発明の第３の実施形態を示す図。３つの異なる識別装置のハウジングが各々固有の可視マーキングを備える本発明の１つの実施形態を示す図。

各図は縮尺通りに描かれておらず、本発明の種々の実施可能な実施形態の非限定的な実施例を意図している点に留意されたい。

図１は、音声通信会議中に使用する電気通信ネットワーク１０の簡略図を示しており、ネットワークは複数の異なるノード１１を有する。ノード１１の各々は、異なる地理上の位置に相当する。図１に示す実施形態において、端末２０は、各それぞれのノード１１にて電気通信ネットワーク１０に接続され、端末は、電気通信ネットワーク１０との間で音声通信を提供する。電気通信ネットワークが従来のアナログ音声電話サービス（ＰＯＴＳ）である場合の本発明の実施例が、図２、３、及び４において説明されており、ＰＯＴＳシステムの使用は音声会議において依然として広範囲に及んでいる。しかしながら、本明細書の前部分により理解できるように、本発明は、電気通信ネットワークの他の形態（例えば、セルラー電話ネットワーク、及び／又はボイス・オーバー・インターネット・プロトコル（ＶＯＩＰ））と共に使用するのにも適用可能である。

図面において示していない代替の実施形態において、ネットワーク１０は、無線通信ネットワークである。このような１つの無線通信ネットワーク１０は、航空機と地上局との間の無線通信システムの一部を形成する無線ネットワークであり、航空機及び地上局はネットワークの異なるノード１１に対応する。

複数の参加者３０間の音声通信会議の間、参加者の１人又はそれ以上は、各ノード位置１１（図１に示すような）に位置する。

図２、３、及び４は、音声通信会議中にある時点では話しており（すなわち、「話して」の役割）、また別の時点では聞いている（すなわち、「聞き手」の役割）参加者の観点からの本発明の例示的な図を示している。本装置は、識別装置４０と表示装置７０とを有する。

請求項において概説される本発明の範囲を限定する意図することなく、識別装置４０及び表示装置７０の形態及び機能について以下で概説する。

図２の実施形態は、ネックレス４１上に設けられた識別装置４０を示している。使用時には、ネックレス４１は、参加者３０の所与の一人の首の周りに身に着けられ、その結果、識別装置は、当該参加者の首及びこれにより声帯の近くに位置付けられるようになる。音声通信会議への各参加者３０は、装着又は携帯されることになる固有の識別装置４０を備えている。識別装置４０は、振動センサ４２、入力手段４３、メモリ４４、プロセッサ４５、及び送信機４６を組み込んだハウジングを含む。

図２はまた、電気通信ネットワーク１０に接続された会議対応型電話の形態の端末２０を示しており、ネットワークは、アナログ音声電話サービス（ＰＯＴＳ）の形態を有する。端末２０は、ネットワーク１０との間で音声通信を可能にするマイクロフォン２１及びスピーカー２２を有する。

音声通信会議を開始する前に、各参加者３０は、入力手段４３を用いて、それぞれの固有の識別装置４０のメモリ４４に識別データを入力することになる。識別データは、当該参加者の識別情報を表している。入力手段４３の形態は図示していないが、本明細書の前部分で概説されたように、キーパッド及び／又は録音装置を含むことができる。識別データは、参加者の名前、又は参加者の識別情報に一意的に関連付けられる別の識別子（例えば、社員スタッフ番号）の形態をとることができる。事前構成の動作により、識別装置４０は、別の人の識別データと事前構成されるまでは所与の参加者３０の識別情報と確実に結び付けられる（すなわち、関連付けられる）ようになる。

参加者３０が話し始める（この時点で本発明における「話し手」になる）と、振動センサ４２が、話し手３０の発話Ｓと関連付けられる振動「Ｖ」（図２を参照）を検出する。話し手３０の声帯への識別装置４０の近接は、振動センサ４２が話し手からの発話Ｓの開始を検出するのに役立つ。しかしながら、図示していない代替の実施形態では、識別装置４０は、参加者３０が手に持っているか、又は参加者が身に着けている衣類品に取り付けられる。

振動センサ４２が話し手３０の発話Ｓを検出したのに応答して、プロセッサ４５及びメモリ４４は、送信機４６と協働して、送信機が識別信号５０を無線送信するようにする。識別信号５０は、上記で概説した事前構成ステップ中に入力された識別データから生成され、該識別データを含む。図２に示す実施形態において、プロセッサ４５は、メモリ４４内に格納されたコンピュータコードを実行し、該コンピュータコードは、識別データが識別信号５０を生成することに基づいて作動する。コンピュータコードは、振動センサ４２が話し手からの連続した発話Ｓの最小持続時間を検出した後にだけ、送信機４６が識別信号５０を送信するのを確実にするようなものである。図２の実施形態において、識別信号５０は、３００Ｈｚ〜３，４００Ｈｚの範囲の周波数を有する「チャープ」の形態の音声信号であり、チャープは、識別データの圧縮形態を表している。

「チャープ」５０（すなわち、「識別信号」）は、端末２０のマイクロフォン２１により検出され、該マイクロフォン２１はまた、話し手３０の発話Ｓを検出する。次いで、端末２０は、ｉ）チャープ５０及びｉｉ）話し手３０の発話Ｓを表す音声信号５００の両方を含む結合信号５５０を、ネットワーク１０を介して該ネットワークの他のノード１１に位置する他の参加者３０の対応する端末２０に送信する。結合信号５５０を受け取る他の参加者３０の各々は、本発明における「聞き手」となる。

便宜上、図２を再度用いて、このような「聞き手」の観点から本発明を説明する。

図２は、端末２０に一体化された表示装置７０を示し、該表示装置は、ディスプレイ画面７１を含む。フィルタ８０もまた、端末２０に一体化される。端末が結合信号５５０を受け取ると、信号は、最初にフィルタ８０を通過し、結合信号５５０を濾波して結合信号５５０から識別信号５０を抽出する。濾波後、抽出された識別信号５０は、表示装置７０に送られる。図２に示すように、表示装置７０は、メモリ７２及びプロセッサ７３を含み、該プロセッサ７３がメモリ７２内に格納されたコンピュータコードを実行する。コンピュータコードは、抽出された識別信号５０が、話し手の識別情報の視覚的表現の形態で間隔出力を生成することに基づいて作動し、該視覚的表現はディスプレイ画面７１に出力される。図２に示す実施形態において、視覚的表現は、話し手の名前である。次いで、発話信号５００は、端末２０のスピーカー２２に送られ、話し手が何を話しているのかを聞き手が聞き取ることを可能にすることができる。

本発明の代替の形態が図３に示され、図２の実施形態と共通の特徴要素は同じ参照符号を有する。図３の実施形態において、表示装置７００は、端末２０とは構造的に別個で且つネットワーク１０と端末２０間にインライン接続されるスタンダローン・モジュールとして提供される。フィルタ８００は、表示装置７００と一体化されて図示されている。フィルタ８００は、図２の実施形態におけるフィルタ８０と同様に機能し、これにより話し手の発話のみを含むクリーンな信号を端末２０に送り、スピーカー２２を介して聞き手に出力することが可能となる。更に、結合信号５５０から抽出された識別信号５０は、表示装置７０内で処理されて、話し手の識別情報に関するディスプレイ画面７１０上に視覚的表現を生成するようになる。表示装置７００のこの代替の形態は、端末２０の修正を必要とせず、これにより従来の会議対応電話を端末として使用できるようにする、図２の実施形態に優る利点を有することになる。

図３の実施形態において、各参加者は、部品キットを備え、該キットは、識別装置４０及び表示装置７００の両方を含み、ここで識別装置及び表示装置は端末２０とは構造的に別個の状態で使用可能である。

本発明の更に別の代替形態が図４に示される。この実施形態は、図３の実施形態の変形形態である。図２及び３の実施形態とは対照的に、図４の実施形態は、エンコーダ６０を含み、該エンコーダ６０は、識別装置６０及び端末２０とは空間的に別個で分離されており、有線接続で端末２０に接続される。図示していない代替の実施形態において、エンコーダ６０は、端末２０自体内に一体化される。図４の実施形態はまた、送信機４６により無線送信される識別信号５０が２０，０００Ｈｚを上回る非可聴信号である点で、図２及び３の実施形態とは異なっている。非可聴識別信号５０は、エンコーダ６０によって受け取られ、エンコーダ６０は、識別信号５０を３００Ｈｚ〜３，４００Ｈｚの範囲の周波数を有する音声信号に変換するよう機能し、次いで、変換された識別信号５０は、有線接続を介して端末２０に送られる。次に、端末２０は、ネットワーク１０を介して話し手３０の発話５００の音声信号と共に変換された識別信号５０を送信する。図２及び３の実施形態に優る図４の実施形態の利点は、識別信号５０を識別装置４０からエンコーダ６０に非可聴信号（すなわち、２０，０００Ｈｚを上回る周波数を有する）として無線送信することにより、識別信号が集信及び話し手３０の発話と干渉するのが回避される。図示していない実施形態において、識別信号５０は、Ｂｌｕｅｔｏｏｔｈ信号として無線送信することができ、識別装置４０及びエンコーダ６０はＢｌｕｅｔｏｏｔｈペアリングが可能である。

図５は、３つの異なる識別装置４０ａ、４０ｂ、４０ｃのハウジングの外観図を示す。識別装置４０ａ、４０ｂ、４０ｃの各々は、ハウジングの外面上に可視マーキング９０ａ、９０ｂ、９０ｃを備える。図５に示す実施形態は、特定の模様又は色を有する形状の形態のこれらの可視マーキング９０ａ、９０ｂ、９０ｃを示している。識別装置４０ａ、４０ｂ、４０ｃの各々は、それぞれの可視マーキング９０ａ、９０ｂ、９０ｃを示す識別データがエンコードされたメモリ４４を有する。使用時には、各識別装置４０ａ、４０ｂ、４０ｃから送信される識別信号５０は、各装置のマーキング９０ａ、９０ｂ、９０ｃに対応する。各図の何れかには明示的に示してはいないが、表示装置７０、７００は、どの参加者３０が話したかに属する識別装置の可視マーキングに対応する視覚的表現を表示することになる。

本明細書は、実施例を用いて本発明を開示し、また、当業者が本発明を実施及び利用できるようにしている。誤解を避けるために、請求項において定義される本発明は、その範囲内で当業者に想起され、本明細書の図面において示される実施例とは異なる他の実施例を含むことができる。

１０電気通信ネットワーク
１１ノード
２０端末
２１マイクロフォン
２２スピーカー
３０参加者
４０識別装置
４２振動センサ
４３入力手段
４４メモリ
４５プロセッサ
４６送信機
５０識別信号
６０エンコーダ
７０表示装置
７２メモリ
７３プロセッサ
８０フィルタ

Claims

話し手と少なくとも１人の聞き手との間の言葉によるコミュニケーションで使用する装置であって、前記話し手と前記少なくとも１人の聞き手とが複数の参加者の全て又は一部を形成し、前記話し手と前記少なくとも１人の聞き手とが互いに空間的に離れており、前記装置が、前記話し手の識別情報と関連付けられる感覚出力を前記聞き手に提供するよう動作可能であり、
前記装置が、前記話し手が装着可能又は携帯可能であり、且つ前記話し手の発話と関連付けられる振動を検出するための振動センサを含む識別装置を備え、前記識別装置が、前記話し手及び前記識別装置の一方又は両方の識別情報を表す識別データを格納するよう構成され、これにより前記識別装置が前記話し手の識別情報と関連付けられ、前記識別装置が、前記振動センサによる前記話し手の発話と関連付けられる振動の検出に応答して前記格納された識別データを含む又は該識別データから生成される識別信号を送信機が送信するように動作可能であり、
前記装置が更に、前記聞き手が使用するための表示装置を備え、前記表示装置が、前記識別信号を受け取って、前記話し手及び前記識別装置の一方又は両方の識別情報を示す感覚出力を前記受け取った識別信号から生成するように動作可能である、装置。
前記識別装置が、前記話し手の識別情報を表す識別データで前記話し手が前記識別装置を事前構成するよう動作可能な入力手段を含む、請求項１に記載の装置。
前記入力手段が、キーパッド及び録音装置の一方又は両方を含む、請求項２に記載の装置。
前記識別装置が、別の人の識別情報と再関連付け可能であるように構成される、請求項１〜３の何れかに記載の装置。
前記感覚出力が、視覚出力、触覚出力、及び可聴出力の１つ又はそれ以上を含む、請求項１〜４の何れかに記載の装置。
前記識別装置が可視マーキングを備え、前記格納された識別データが前記可視マーキングを表す、請求項１〜５の何れかに記載の装置。
前記可視マーキングが、色及び形状の一方又は両方を含む、請求項６に記載の装置。
前記表示装置が、前記可視マーキングの視覚的表現を含む感覚出力を生成するよう動作可能である、請求項６又は７に記載の装置。
前記識別装置は、前記話し手からの連続した発話の最小持続時間後にだけ前記送信機が前記識別信号を送信するように構成されている、請求項１〜８の何れかに記載の装置。
前記最小持続時間が、０．５〜２秒の間である、請求項９に記載の装置。
前記識別装置が、前記話し手の首又は胸の近くに位置決めされる、請求項１〜１０の何れかに記載の装置。
前記識別装置の送信機が、２０Ｈｚ〜２０，０００Ｈｚの間の周波数を有する音声信号として前記識別信号を送信するよう構成される、請求項１〜１１の何れかに記載の装置。
前記送信機が、アナログ音声電話サービス（ＰＯＴＳ）の形態で電気通信ネットワークを介した送信における３００Ｈｚ〜３，４００Ｈｚの周波数を有する音声信号として前記識別信号を送信するよう構成される、請求項１２に記載の装置。
前記送信機が、２０，０００Ｈｚを上回る周波数で前記識別信号を無線送信するよう構成され、前記装置が更に、前記識別装置と電気通信又は無線ネットワークとの間で通信可能に結合できる第１のエンコーダを備え、前記第１のエンコーダが、前記送信された識別信号を受け取って、
ａ）２０Ｈｚ〜２０，０００Ｈｚの範囲の周波数を有する音声信号、
又はｂ）暗号化されたデジタル信号
のうちの一方に変換するよう動作可能であり、
ｂ）の場合、前記表示装置は、前記デジタル信号を復号するデコーダを備え、又は前記デコーダと通信可能に結合できる、請求項１〜１１の何れかに記載の装置。
前記第１のエンコーダが、前記送信された識別信号を受け取って、３００Ｈｚ〜３，４００Ｈｚの範囲の周波数を有する音声信号に変換するよう動作可能である、請求項１４に記載の装置。
前記識別装置が、前記送信機によりＢｌｕｅｔｏｏｔｈ信号として無線送信するために前記識別信号をエンコードするよう動作可能である、請求項１４又は１５の何れかに記載の装置。
前記第１のエンコーダが、電気通信又は無線ネットワークのノードに接続可能な端末内で一体化され、前記端末が、前記ネットワークとの間で音声通信を行うよう動作可能である、請求項１４〜１６の何れかに記載の装置。
前記装置が更に、前記表示装置内に一体化された又は前記表示装置に通信可能に接続できるフィルタを備え、該フィルタは、前記識別信号と前記話し手の発話の音声信号の両方を含む結合信号を受け取るよう動作可能であり、更に前記結合信号をフィルタ処理し、フィルタ処理された信号を前記聞き手に音声出力する前に、前記結合信号から前記識別信号を抽出するよう動作可能である、請求項１〜１７の何れかに記載の装置。
前記表示装置が、電気通信又は無線ネットワークのノードに接続可能な端末内に一体化され、該端末は前記ネットワークとの間で音声通信をするよう動作可能である、請求項１〜１８の何れかに記載の装置。
前記識別装置が、電気通信又は無線ネットワークのノードに接続可能な端末内に一体化され、該端末は前記ネットワークとの間で音声通信をするよう動作可能である、請求項１〜１９の何れかに記載の装置。
前記端末がセルラー電話である、請求項１９又は２０の何れかに記載の装置。
電気通信又は無線ネットワークのノードに接続可能な端末であって、該端末が前記ネットワークとの間で音声通信を行うよう動作可能であり、前記端末が、請求項１から１８の何れかに記載の識別装置及び表示装置の一方又は両方を含む、端末。
前記端末がセルラー電話である、請求項２２に記載の端末。
請求項１から１８の何れかに記載の識別装置及び表示装置を含む、部品キット。
話し手と少なくとも１人の聞き手との間の言葉によるコミュニケーションにおいて誰が話しているかを識別する方法であって、前記話し手と前記少なくとも１人の聞き手とが複数の参加者の全て又は一部を形成し、前記話し手と前記少なくとも１人の聞き手とが互いに空間的に離れており、前記方法が、前記話し手の識別情報と関連付けられる感覚出力を前記少なくとも１人の聞き手に提供し、
前記方法が、
前記話し手が装着可能又は携帯可能であり且つ前記話し手の発話と関連付けられる振動を検出するための振動センサを含む識別装置を提供するステップを含み、前記識別装置が、前記話し手及び前記識別装置の一方又は両方の識別情報を表す識別データを格納し、これにより前記識別装置が前記話し手の識別情報と関連付けられ、
前記方法が更に、
前記話し手が前記識別装置を装着又は携帯しているときに、前記話し手の発話と関連付けられる振動を前記振動センサを用いて検出するステップと、
前記振動の検出に応答して、前記格納された識別データを含む又は該識別データから生成される識別信号を前記識別装置から送信するステップと、
前記少なくとも１人の聞き手が使用するための表示装置を提供するステップと、
を含み、前記表示装置が、前記識別信号を受け取って、前記話し手及び前記識別装置の一方又は両方の識別情報を示す感覚出力を前記受け取った識別信号から生成する、方法。
前記識別装置が、前記識別データで前記話し手が前記識別装置を事前構成するよう動作可能な入力手段を備え、
前記方法が更に、前記識別データの一部又は全てで前記話し手が前記識別装置を事前構成するステップを更に含み、前記事前構成された識別データが前記話し手の識別情報を表す、請求項２５に記載の方法。
前記識別装置が、前記識別装置の事前構成をするためのキーパッド及び録音装置の一方又は両方を備える、請求項２６に記載の方法。
前記識別装置が、別の人の識別情報と再関連付け可能であるように構成される、請求項２５〜２７の何れかに記載の方法。
前記感覚出力が、視覚出力、触覚出力、及び可聴出力の１つ又はそれ以上を含む、請求項２５〜２８の何れかに記載の方法。
前記識別装置が可視マーキングを備え、前記格納された識別データが前記可視マーキングを表す、請求項２５〜２９の何れかに記載の方法。
前記可視マーキングが、色及び形状の一方又は両方を含む、請求項３０に記載の方法。
前記表示装置が、前記可視マーキングの視覚的表現を含む感覚出力を生成するよう動作可能である、請求項３０又は３１の何れかに記載の方法。
前記識別信号の送信が、前記話し手からの連続した発話の最小持続時間後にだけ行われる、請求項２５〜３２の何れかに記載の方法。
前記最小持続時間が、０．５〜２秒の間である、請求項３３に記載の方法。
前記話し手による前記識別装置の装着又は携帯が、前記話し手の首又は胸に隣接して前記識別装置を配置することを含む、請求項２５〜３４の何れかに記載の方法。
前記識別信号の送信が、２０Ｈｚ〜２０，０００Ｈｚの間の周波数を有する音声信号として前記識別信号を送信することを含む、請求項２５〜３５の何れかに記載の方法。
前記音声信号が、３００Ｈｚ〜３，４００Ｈｚの周波数を有する、請求項３６に記載の方法。
前記識別信号の送信が、２０，０００Ｈｚを上回る周波数で前記識別信号を無線送信することを含み、
前記方法が更に、前記識別装置と電気通信又は無線ネットワークとの間で通信可能に結合される第１のエンコーダを提供するステップを含み、前記第１のエンコーダが、前記送信された識別信号を受け取って、
ａ）２０Ｈｚ〜２０，０００Ｈｚの範囲の周波数を有する音声信号、
又はｂ）暗号化されたデジタル信号
のうちの一方に変換し、
ｂ）の場合、前記表示装置は、前記デジタル信号を復号するデコーダを備え又は前記デコーダと通信可能に結合される、請求項２５〜３６の何れかに記載の方法。
前記第１のエンコーダが、前記送信された識別信号を受け取って、３００Ｈｚ〜３，４００Ｈｚの範囲の周波数を有する音声信号に変換する、請求項３８に記載の方法。
前記識別信号がＢｌｕｅｔｏｏｔｈ信号として前記識別装置から無線送信されるように前記識別信号をエンコードするステップを更に含む、請求項３８又は３９の何れかに記載の方法。
前記表示装置内に一体化された又は前記表示装置に通信可能に接続されるフィルタを提供するステップを更に含み、前記フィルタは、前記識別信号と前記話し手の発話の音声信号の両方を含む結合信号を受け取り、前記結合信号をフィルタ処理して、該フィルタ処理された信号を前記聞き手に音声出力する前に、前記結合信号から前記識別信号を抽出する、請求項２５〜４０の何れかに記載の方法。
前記明細書及び図面を参照して本明細書で実質的に定義される装置。
前記明細書及び図面を参照して本明細書で実質的に定義される端末。
前記明細書及び図面を参照して本明細書で実質的に定義されるキット。
前記明細書及び図面を参照して本明細書で実質的に定義される方法。