JP2015531197A

JP2015531197A - ビデオ会議中の参加者の映像ミュートを可能にするための方法および装置

Info

Publication number: JP2015531197A
Application number: JP2015524764A
Authority: JP
Inventors: リーベンス，サミー; ティトガット，ドニー; アーツ，マールテン; ナンブーディリ，ビナイ; シックス，エルウィン
Original assignee: アルカテル−ルーセント
Priority date: 2012-08-03
Filing date: 2013-07-30
Publication date: 2015-10-29
Anticipated expiration: 2033-07-30
Also published as: CN104509096A; US20150208031A1; JP6456286B2; KR20150038065A; KR102056588B1; JP2017195629A; EP2693746A1; EP2693746B1; WO2014020022A1; KR20170118260A

Abstract

ビデオ会議の場所（ルーム１）における参加者の存在を隠すようになど、前記ビデオ会議中の前記場所におけるカメラによって記録されるビデオデータ（ビデオルーム１）を適合させるための方法が、前記場所（ルーム１）における前記ビデオ会議の任意の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップと、前記ジェスチャを検出するステップと、それについて検出すると、前記場所（ルーム１）において前記ジェスチャを行った少なくとも一人の参加者を識別するステップと、前記ジェスチャを行った前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するようになど、前記ビデオデータを適合させるステップと、それにより、他の場所（ルーム２、…、ルームｎ）における前記ビデオ会議の他の参加者に送信されるための、適合させたビデオデータ（ビデオａルーム１）を生成するステップとを含む。

Description

本発明は、ビデオ会議に参加するユーザが、ビデオ会議システムの他のリモートユーザに見えるようになるか否かを制御することについて可能にするための、方法および装置に関する。これは、これらのユーザに、ユーザ自身を「映像ミュート（ｖｉｓｕａｌｍｕｔｅ）」の状態にする可能性を提供することに関する。

この問題を解決するための簡単なソリューションは、単にそのルームを去ることである。しかし、ユーザは、積極的に会合に参加しないまでも、受身的に会合について行くことをなお望むことがあるので、これは常に適当とは限らない。

別のソリューションは、人である全体的な会合先導者が、ビデオ会議通話の特定の参加者ごとに、映像状態を手動で制御することである。しかしながら、これもまた、多くの参加者が出席している、またはシステムへの多くのミュート（ミュート解除）要求がなされる場合には、実現可能なソリューションではない。

したがって、本発明の実施形態の目的は、知られているタイプでありながら、上述された欠点を示さない方法を提示することである。

本発明の実施形態によれば、この目的は、ビデオ会議の場所における参加者の存在を隠すようになど、前記ビデオ会議中の前記場所におけるカメラによって記録されるビデオデータを適合させるための方法によって達成され、前記方法は、前記場所における前記ビデオ会議の任意の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップと、前記ジェスチャを検出するステップと、それについて検出すると、前記場所において前記ジェスチャを行った少なくとも一人の参加者を識別するステップと、前記ジェスチャを行った前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するようになど、前記ビデオデータを適合させるステップと、それにより、他の場所における前記ビデオ会議の他の参加者に送信されるための、適合させたビデオデータを生成するステップとを含む。

このようにして、あらかじめ登録された既定のジェスチャを行う参加者を検出すると、この参加者の映像ミューティングを可能にする、自動化された、簡単なソリューションが提供される。

一変形例において、前記既定のジェスチャは、前記ビデオデータを分析することによって検出される。

この変形例において、ジェスチャ認識は、ビデオデータそれ自体の画像認識、その他などの、ビデオ分析技法を介して行われ得る。

別の変形例において、前記既定のジェスチャは、その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体からの、および物体によって送信される、トリガ検出信号を受信することを用いて検出される。

この変形例は、たとえば、会議場所に存在する物体からの信号を受信することによって、代替的なやり方でジェスチャを検出することを可能にし、そのような物体は、一般に、ビデオ会議クライアントと通信し、参加者によって行われているジェスチャを示す信号を送信するように適合されている。そのような信号を受信すると、このジェスチャを行った会議参加者を認識するために、ビデオデータはさらに分析されてよい。あるいは、他の実施形態において、トリガ検出信号それ自体が既に、ジェスチャを行った参加者に関する情報を含むことができ、その結果、前記場所において前記ジェスチャを行った前記少なくとも一人の参加者の識別が、前記物体からの前記トリガ検出信号を分析することによって行われる。

一実施形態において、ビデオデータは、前記少なくとも一人の参加者に関係するビデオデータを、背景ビデオデータに差し替えることによって、適合されてよい。

これは、参加者の映像ミューティングのための簡単なやり方を提示する。

本発明は加えて、ビデオ会議中の場所におけるカメラによって記録されるビデオデータを適合させるためのビデオ分析および適合デバイスの実施形態に関し、前記ビデオ分析および適合デバイスは、前記ビデオデータを受信し、既定のジェスチャを行った前記場所における前記ビデオ会議の少なくとも一人の参加者を検出するために前記ビデオデータを分析し、前記既定のジェスチャを行った前記少なくとも一人の参加者を検出すると、前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するようになど、前記ビデオデータを適合させるステップを行い、それにより、適合させたビデオデータを生成して、前記適合させたビデオデータを前記ビデオ適合デバイスの出力に提供するように適合されている。

一変形例において、ビデオ適合デバイスは、前記少なくとも一人の参加者に関係するビデオデータを、背景ビデオデータに差し替えることによって、前記ビデオデータを適合させることできる。

別の変形例において、ビデオ分析および適合デバイスは、前記既定のジェスチャの存在を示すトリガ信号を受信し、前記トリガ信号を受信すると、前記既定のジェスチャを行った前記少なくとも一人の参加者の検出を開始するようにさらに適合されている。

別の実施形態において、ビデオ分析および適合デバイスは、前記既定のジェスチャを検出するために前記ビデオデータを分析し、前記既定のジェスチャを検出すると、前記既定のジェスチャを行う前記少なくとも一人の参加者の検出を開始するようにさらに適合されている。

本発明は加えて、場所におけるビデオ会議を記録するカメラからビデオデータを受信するように適合されたビデオ会議クライアントの実施形態に関し、前記ビデオ会議クライアントは、請求項６から８のいずれか一項に記載のビデオ分析および適合デバイスをさらに含み、前記ビデオ会議クライアントは、少なくとも１つの他の場所における前記ビデオ会議の他の参加者にサービス提供する少なくとも１つの他のビデオ会議クライアントに向けて、適合させたビデオデータを送信するようにさらに適合されていることを特徴とする。

一実施形態において、ビデオ会議クライアントは、前記既定のジェスチャに関するユーザ情報を受信し、格納するように適合された登録手段をさらに含む。

一変形例において、前記ユーザ情報は、物体の上で人によって行われるジェスチャ情報を含む。

別の実施形態において、ビデオ会議クライアントは、その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体からの、および物体によって送信される、トリガ検出信号を受信するようにさらに適合されている。

これらの変形例において、ビデオ会議クライアントは、前記既定のジェスチャを検出し、認識するようになど、そのような物体と通信するように適合されている。

本発明は加えて、場所におけるビデオ会議の少なくとも一人の参加者によって行われる既定のジェスチャを検出するように適合された物体の実施形態に関し、前記物体は、前記既定のジェスチャを検出すると、トリガ検出信号を生成し、前記トリガ検出信号を前記場所におけるビデオ会議クライアントに提供するようにさらに適合されている。

一実施形態において、物体は、前記既定のジェスチャに関する登録要求を生成し、前記ビデオ会議クライアントに送信するようにさらに適合されている。

さらに他の実施形態において、前記物体は、ポータブル通信デバイスであり、その結果、前記ビデオ会議クライアントは、ビデオ会議の時間中に前記ポータブル通信デバイスを取り扱う前記ビデオ会議の参加者によって、場合によって行われる前記既定のジェスチャに関する前記ユーザ情報を提供するための登録要求を、前記ポータブル通信デバイスから受信することができる。

いくつかの変形例において、物体は、通信ユニット、および動き検出器またはタッチセンサを含む。

一実施形態において、前記物体は、モバイル電話機、ゲームコンソール、タブレットコンピュータ、ラップトップ、その他などのポータブル通信デバイスであってよい。

あるいは、任意の有形の日用品的な物体、たとえば、トースター、コーヒーマシン・・・で、小型の通信ユニットおよびタッチセンサが装備されたものが、会合ルームなどのそのような場所で使用されてもよい。

本発明は加えて、先の請求項６から８のいずれか一項に記載のビデオ分析および適合デバイスを含むビデオ会議サーバの実施形態に関する。

ビデオ会議サーバは、これらのそれぞれの場所における会議参加者のビデオデータを、それぞれのビデオ会議クライアントから受信することがさらにできてよい。

一変形例において、これらのビデオ会議クライアントはまた、既定のジェスチャ情報をサーバに向けて送信することができる。他の実施形態において、これらの既定のジェスチャは、すべてのクライアントについて同じであってもよく、サーバ内に集中的に格納されてよい。いくつかの実施形態において、会議サーバは、前記既定のジェスチャ情報を、異なる場所におけるビデオ会議クライアントに向けて伝達する。これらの実施形態について、ビデオ会議クライアントの実施形態は、参加者によって行われている既定のジェスチャを検出すると、行われているジェスチャを示す信号を、ビデオ会議サーバに送信するように適合されている。サーバは次いで、この特定のクライアントから受信されたビデオ画像をさらに分析し、ビデオデータをそれに応じて適合させることができる。

本発明は加えて、データ処理装置上で実行されるとき、請求項１から５のいずれか一項に記載の方法ステップを行うように適合されたソフトウェアを含む、コンピュータプログラム製品に関する。

特許請求の範囲において使用される用語「結合される（ｃｏｕｐｌｅｄ）」は、直接接続のみに限定的であるように解釈されるべきではないことに留意されたい。したがって、「デバイスＢに結合されたデバイスＡ」という表現の範囲は、デバイスＡの出力が、デバイスＢの入力に直接結合されるデバイスまたはシステムに限定されるべきではない。それは、Ａの出力とＢの入力との間にパスが存在し、それが他のデバイスまたは手段を含むパスであってもよいことを意味する。

特許請求の範囲において使用される用語「含む（ｃｏｍｐｒｉｓｉｎｇ）」は、そこに挙げられた手段に限定的であるように解釈されるべきではないことに留意されたい。したがって、「手段ＡおよびＢを含むデバイス」という表現の範囲は、構成要素ＡおよびＢのみからなるデバイスに限定されるべきではない。それは、本発明に関して、デバイスのただ関係があるだけの構成要素がＡおよびＢであることを意味する。

本発明の上の、ならびに他の目的および特徴は、添付の図面と併用して一実施形態の以下の説明を参照することによって、より明らかとなり、本発明それ自体が最もよく理解されるだろう。

分散化されたビデオ会議クライアントアーキテクチャによる、ｎ個の場所の間で開催されるビデオ会議の例示的な状況を示す図である。分散化されたビデオ会議クライアントアーキテクチャについて、映像ミュートするための方法の詳細な実施形態を示す図である。クライアント−サーバビデオ会議アーキテクチャについて、映像ミュートするための方法の詳細な実施形態を示す図である。クライアント／サーバビデオ会議アーキテクチャによる、ｎ個の場所の間で開催されるビデオ会議の例示的な状況を示す図である。特定の場所における会議参加者によって行われるジェスチャの登録のための第１の変形例を示す図である。特定の場所におけるｍ人の会議参加者によって行われるジェスチャの登録のための別の変形例を示す図である。図４に図示されたアーキテクチャにおけるビデオ会議サーバの実施形態を示す図である。

図１は、ルーム１、ルーム２からルームｎによって示される、ｎ個の異なる場所の間で開催されるビデオ会議の状況を図示する。これらの場所はルームと表示されている事実に関わらず、そのような場所はまた、屋外のどこかであってもよく、または、たとえば、作業フロア、舞台、ガレージなどの、「ルーム」とは異なり得る屋内の場所にあってもよい。各場所は、その特定の場所におけるビデオ会議の異なる参加者を記録するための１つまたは複数のビデオカメラにより装備されている。図１では、各ルームが、ｃａｍ１、ｃａｍ２からｃａｍｎとそれぞれ表示された、１つのカメラを有する状況が図示されている。しかしながら、他の状況では、１つの場所でいくつかのカメラが、異なる参加者を記録するために使用されてもよい。

場所の各々には、それぞれの場所、ルーム１、ルーム２からルームｎの場合、ＶＣＣ１、ＶＣＣ２からＶＣＣｎとそれぞれ表示された、ビデオ会議クライアントデバイスがさらに装備されている。そのようなビデオ会議クライアントは、そのそれぞれの場所で、ビデオ会議クライアントに結合されたそれぞれのカメラによって記録されるビデオデータを受信して、たとえば、データを圧縮し、符号化することによって、または、いくつかのカメラが１つのビデオ会議クライアントに結合されている場合は、データを１つの作成されたビデオの中にミキシングし、それに続いてこの結果として作成されたビデオを符号化することによって、ビデオデータを処理するように適合されている。１つの場所からの符号化されたビデオは次いで、ビデオ会議クライアントによって、他の場所における他のビデオ会議クライアントに送信される。これはまた、特定のビデオ会議クライアント、たとえばＶＣＣ１が、したがってまた、場所ルーム２からルームｎより処理されたビデオを受信し、これらをディスプレイユニットＤ、たとえば、特定の場所におけるスクリーンに提供することになることを意味する。

本発明の実施形態は、所定のジェスチャを行う参加者を用いて、この参加者によるトリガを受信すると、場所におけるビデオ会議のこの参加者の存在を隠すようになど、この場所におけるこのビデオ会議中に、１つまたは複数のカメラによって記録されるビデオデータを適合させるための方法を提供することを狙いとする。このジェスチャは、たとえば、左手を振る、財布を上下に裏返す、椅子を押す、ゲームコンソール、タブレットコンピュータ、携帯電話機などのなんらかの動き検出および通信能力が装備されたモバイルデバイスをひっくり返す、または回転させるなど、何であってもよい。参加者自身をミュートするために、一定の場所の任意の参加者について１つのみのジェスチャが使用されることになる一実施形態において、この特定のジェスチャは、一定の場所内のすべての参加者によって同意済みであり、この場所におけるビデオ会議クライアントによって登録されている。これらの実施形態において、各場所は、映像ミュートをトリガすることになる、別々の場所固有の同意済みのジェスチャを有することができる。あるいは、より集中化されたアプローチによるビデオ会議システムは、すべての場所にわたって同じである、最初に定義された、または事前構成されたジェスチャを使用することができる。そのような状況において、ビデオ会議クライアントの各々は、このジェスチャによってトリガすることになるように事前構成されてよい。このケースでは、特定の場所におけるビデオ会議の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップは、たとえば、このジェスチャを異なるビデオ会議クライアント内に単に格納することに還元することができる。場所ごとに認識されることになるジェスチャに参加者が最初に同意することができる、先に説明された状況において、このジェスチャの登録は、初期化ステップにおいて行われることになる。

他の、より複雑な実施形態においては、いくつかのジェスチャが登録されて、異なるジェスチャに基づいて、各人物が自分自身をミュートすることを可能にすることができる。しかしながら、これらの実施形態においては、登録手順はより複雑になる。

場所ごとに１つのみの共通のジェスチャが使用される図１の実施形態において、それぞれの場所、ルーム１、ルーム２からルームｎごとに、これらのそれぞれの場所におけるそれぞれのビデオ会議クライアント、ＶＣＣ１、ＶＣＣ２からＶＣＣｎへの、それぞれのジェスチャ情報を表示する異なる入力、Ｇ１、Ｇ２からＧｎを用いて、これらの異なるジェスチャの登録が概略的に表示されている。これは、前記場所におけるカメラによって、任意の参加者によるこのジェスチャを行う行為を記録することを含むことができる。登録中、各人物が自らをミュートするために異なるジェスチャを行うことが可能にされない限り、ジェスチャを行う人物ではなく、ジェスチャのみが登録されることになることが注目されるべきである。１つのみのジェスチャが場所ごとに映像ミュートを可能にするという実施形態において、この場所固有のジェスチャを行う人物により記録されるビデオ情報は、この場所の関連付けられたビデオ会議クライアントに、カメラによって提供されることになる。これは、たとえば図５に図示されており、手を振るジェスチャが記録され、登録されることになる。Ｇ１は、そのとき、その手を振る任意の人物のビデオ情報である。この状況において、ルーム１についてのジェスチャ情報Ｇ１は、したがって、ジェスチャ行う任意の参加者によって最初に提供され、カメラｃａｍ１によって記録され、カメラｃａｍ１は次いで、ジェスチャ情報入力を収容する画像を、ビデオ会議クライアントＶＣＣ１に転送することになる。

各人物がミュートされるために異なるジェスチャを使用することができる、より複雑な実施形態では、これら人物の各々はそのとき、自分の特定のジェスチャで登録しなければならない。

ビデオ会議クライアント内には、ＶＣＣ１の場合、ＧＲ１と表示されたジェスチャ登録手段が存在して、既定のジェスチャＧ１に関するそのような情報を受信し、格納することができる。上述された実施形態において、この登録手段は、したがってまた、後で認識されることになるジェスチャによるカメラからのビデオ情報を受信することができる。しかしながら、他の実施形態においては、そのような別々のジェスチャ登録手段は必要なく、その機能性が、ＶＣＣそれ自体のメモリまたは処理ユニット内に組み込まれていてもよい。

そのジェスチャが既定のジェスチャのビデオを用いてシステムに伝達される、場所ごとに１つのみの共通の登録されたジェスチャを用いる、図１および図５に図示されたこれらの実施形態においては、ビデオ会議は、登録の後で開始されることになる。カメラは、継続的にビデオ会議を記録することになり、画像は、特定のジェスチャを検出するためにＶＣＣ内で継続的に分析されることになる。特定のジェスチャを検出すると、ビデオデータは、実際にこのジェスチャを行っている、特定の場所における前記ビデオ会議の一人または複数の参加者を認識するために、さらに分析される。特定のジェスチャを行っている人物を検出すると、これらの人々の映像ミューティングが行われることになる。この映像ミュートを実現するために、記録されるビデオにおいて、この、もしくはこれらの参加者を削除する、または隠すようになど、カメラによって記録されるビデオデータが適合される。この適合は、これらの参加者に関係する画像ピクセルデータを、適切な背景ビデオデータに差し替えることを含むことができる。

図１で、ビデオルーム１と表示され、ｃａｍ１と表示されたカメラによって記録される会議ビデオデータの分析および適合が、ＶＡＡＳと表示されたビデオ分析および適合デバイス内で行われる。図１の状況において、このビデオ分析および適合デバイスは、それぞれのビデオ会議クライアント内に含まれる。しかしながら、図４に図示されるものなどの他の状況においては、このビデオ分析および適合デバイスはまた、中央ビデオ会議サーバの中に存在することができる。これは、後の段落でより詳細に明らかにされることになる。

ＶＡＡＳと表示されたビデオ分析および適合デバイスは、場合によって符号化され、前記ビデオ会議に参加する他の場所における他の参加者に送信されるための、適合させたビデオデータを生成している。図１に図示された実施形態において、適合させたビデオは、ビデオａルーム１と表示され、ＶＡＡＳによって生成される。

図１に図示された状況では、ルーム１のビデオデータが適合されると、ＶＡＡＳが、ビデオａルーム１と表示されたこのようにして適合させたビデオを、ビデオ会議クライアントＶＣＣ１の送信ユニットＶＴ１に提供することになる。ＶＴ１は、圧縮および符号化を行い、場合によって符号化され、適合させたビデオデータを、他の場所におけるビデオ会議の他の参加者にサービス提供する他のビデオ会議クライアントＶＣＣ２からＶＣＣｎに向けて、送信することができる。

ジェスチャそれ自体に応じて、その検出は、会議ビデオデータの単なる分析によって行われてもよい。これはたとえば、ジェスチャが、たとえば、（図５に図示されたような）手で合図する、頭を下げるなどの、もっぱら人体それ自体によって行われることになるジェスチャに関する場合の、または、木製テーブルの一部をカチカチ鳴らす、革財布の向きを変えるなどの、さらなる通信の手段を有さない物体に関係したケースである。

あるいは、既定のジェスチャは、ビデオ会議の参加者によってタッチされると物体によって送信される、信号の存在によって検出されてもよい。これは、たとえば、ジェスチャが、モバイル電話機、ラップトップなどのなんらかの動き感知および通信能力を有するデバイスの特定のボタンにタッチすること、モバイル電話機またはタブレットコンピュータの向きを変えること、ｂｌｕｅｔｏｏｔｈなどのタッチスクリーンおよび通信能力を有する腕時計にタッチすること、その他に関する場合のケースであってよい。

これらの状況において、既定のジェスチャは、たとえば、物体に動きセンサが装備されたケースにおいて、この物体それ自体によって簡単に検出され得る。このジェスチャを検出すると、物体は次いで、特定のトリガ検出信号を生成し、ビデオ会議クライアントに送信することになる。たとえば、各ビデオ会議クライアントがビデオ分析および適合デバイスＶＡＡＳを含むときのいくつかのケースにおいて、この物体はまた、このトリガ検出信号をこのＶＡＡＳに直接送信することができる。そのような状況において、ジェスチャの登録はそのとき、この特定の物体によるそのような信号をＶＣＣまたはＶＡＡＳに最初に送信することに還元されることになり、ＶＣＣまたはＶＡＡＳは次いで、それに応じてこれを格納することになる。この状況は、これらのそれぞれの参加者１からｍによって、それぞれのモバイル電話機Ｏ１１からＯ１ｍを上下に裏返す場合の図６に示されており、これらのそれぞれのモバイル電話機によって、それぞれのトリガ検出信号Ｇ１１からＧ１ｍを生成することになり、それにより、すべてがこれらのモバイル電話機からＶＣＣへと、最初に伝達されることになる。あるいは、各ビデオ会議クライアントは既に、そのような物体によって送信されているそのような信号を即座に認識するようになど、事前構成されていてもよい。この状況において、各参加者１からｍは、自分の特定のモバイル電話機に結び付けられているので、トリガ検出信号もまた、既定のジェスチャを行った人物についての情報を含むことになる。この状況は、たとえば、会議場所における任意の参加者によってタッチされると、スマートコーヒーマシンがまた、トリガ検出信号を送ることができる場合のケースとは異なっている。これらのケースでは、特定のジェスチャを行った人物の別々の検出が行われることになる。

トリガ検出信号はしたがって、携帯電話機などの物体によって送信される信号であってよく、信号は、この物体による特定の動き（たとえば、ひっくり返す、または上下に裏返す）を検出すると、この物体によって生成される。別の例において、信号は、特定のボタンが押されたことなどが腕時計によって検出されると、物体、たとえばこの腕時計によって送信される信号であってよい。当然ながら、これらの能力を有するすべてのタイプの物体が、この目的に対して使用されてよい。

ジェスチャ検出信号が物体によって生成されるすべてのそのようなケースでは、ビデオ分析および適合デバイスはそのとき、トリガ信号によってトリガされると、カメラからのビデオを単に分析し、適合させることになる。このトリガ信号は、ＶＣＣからＶＡＡＳへと送信されてもどちらでもよく、その信号はそれ自体が、タッチされた物体によってトリガ検出信号が受信されると、ＶＣＣによって生成される。あるいは、トリガ信号は、この物体から、ＶＡＡＳによって直接受信されてもよい。先に言及されたように、図１に図示されるなどの非集中化された状況において、物体はまた、各ＶＣＣに存在するＶＡＡＳと直接通信し、したがって、ＶＡＡＳを直接トリガすることができる。図４に図示されるなどのより集中化された状況において、ＶＣＣはなお非集中化されて場所ごとに存在するので、物体は、ＶＣＣとのみ通信することができる。ＶＣＣは次いで、それに応じて、追加のトリガ信号をサーバにおけるＶＡＡＳに提供することになる。

特定の実装において、ビデオ会議クライアントと通信する物体は、したがって、モバイル電話機、ラップトップ、ゲームコンソール、その他などのポータブル通信デバイスであってよい。そのようなデバイスはそのとき、たとえば、ビデオ会議の開始前に、参加者によって場合によって行われる既定のジェスチャ、たとえば、このデバイスを上下に裏返すことなどのジェスチャに関する、ユーザ情報を提供するための登録要求を生成するように適合されている。そのような登録要求の生成はそのとき、このデバイスによるこの特定の動きの検出を含意し、特定の場所におけるビデオ会議クライアントへの特定のトリガ検出信号の生成がそれに続く。

その場所におけるすべての参加者がこの機能を享受したいと望むケースにおいて、すべてのこれらのデバイスは次いで、それらの登録信号を会議クライアントに送る必要がある。これは、図６に概略的に示されたもので、ここでは、参加者１から参加者ｍが、自分の携帯電話機を上下に裏返すことができ、ｍ個のトリガ信号Ｇ１１からＧ１ｍの生成がそれに続く。

この実施形態において、各人物は、固有のトリガを有する自分の物体に結び付けられているので、ＶＡＡＳはしたがって、ジェスチャを行った人物を即座に認識することになる。

どのモバイル電話機がどのユーザに属するか、および、任意のモバイル電話機からの任意のジェスチャ検出信号がこのモバイル電話機にタッチした人物の映像ミューティングにつながり得るという直接登録が存在しない他の実施形態では、ビデオ会議データの分析を用いた、ジェスチャを行った特定の人物の検出がなおも必要とされる。

図２は、図１の分散化された構成のための方法の高レベル実施形態を概略的に示す。

図４に図示された、ＶＡＡＳがビデオ会議サーバの一部であるより集中化された状況では、方法の実施形態は、図３に図示されたようなステップを有することができる。

他の実施形態において、１つの場所でビデオ会議クライアントがまた、他の場所におけるビデオ会議クライアントのために、ビデオ会議サーバの機能を組み込むことになる、なんらかの混合されたアーキテクチャが存在してもよい。

ビデオ会議サーバの別の実施形態のより詳細な実施形態が、図７に図示されている。ビデオ会議サーバは、ＧＲと表示された中央ジェスチャ登録モジュールと、中央ジェスチャ検出モジュールＧＤと、映像ミュート領域セレクタＶＭＲＳと、出力作成モジュールＯＣとを含む。ジェスチャ登録モジュールＧＲは、登録されたジェスチャを受け入れ、円柱ブロック「ジェスチャ情報」ＧＩによって表示された中央データベースまたはメモリに記憶する。図７に図示された実施形態におけるジェスチャ検出モジュールは、たとえば、物体における通信ユニットに結合されたジャイロスコープ検出器から来る、別々のジェスチャ入力信号を受信するように適合されている。ＧＤは、ジェスチャ入力信号を受信すると、ジェスチャ入力信号が、メモリまたはデータベースからのあらかじめ登録されたジェスチャ情報に対応するかどうかを検査することになる。このジェスチャを行った人物の映像ミュートを可能にする特定のジェスチャが存在することが判明した場合、ＧＤは引き続き、この信号を分析する、および／または、これがジェスチャ入力信号それ自体から明瞭でなかった場合、どの人物がこのジェスチャを実際に行ったのかを検査するために、受信されたビデオを分析することになる。参加者が認識されると、この情報は、映像ミュート領域セレクタＶＭＲＳへと転送されることになり、そのモジュールが、特定の場所から受信されたカメラビデオ入力から、検出された参加者をミュートすることになる。モジュールＯＣ内では、すべてのカメラからのミュートされた、またはミュートされないビデオ入力が再び取りまとめられて、全体の出力を作成されたビデオとし、そのビデオが次いで、異なる個々の場所へと再び分散されることになる。

さらに他の実施形態において、特定の人物の映像ミューティングを、既定のジェスチャを行う別の人物によって可能にすることさえあり得てよい。そのようなケースにおいては、ジェスチャ登録データベースが、どのジェスチャがどの人物をミュートするべくトリガすることになるかについての相互参照情報を収容することになる。

本明細書におけるあらゆるブロック図は、本発明の原理を具体化する説明的な回路の概念的視点を表すことが、当業者によって認められるべきである。同様に、あらゆる流れ図（ｆｌｏｗｃｈａｒｔ）、フロー図（ｆｌｏｗｄｉａｇｒａｍ）、状態遷移図、擬似コード、その他は、コンピュータ可読媒体において実質的に表されてよく、かつコンピュータまたはプロセッサが明示的に示されていても、いなくても、そのようなコンピュータまたはプロセッサによってそのように実行され得る、さまざまなプロセスを表すことが認められるだろう。

本発明の原理が特定の装置と関連して上で説明されてきたが、この説明は、例としてのみなされ、添付の特許請求の範囲において定義されるような、本発明の範囲への限定としてなされたものでないことが明白に理解されるべきである。本発明の特許請求の範囲において、指定された機能を行うための手段として表現されるいずれの要素も、その機能を行うあらゆるやり方をも包含するように意図される。これは、たとえば、その機能を行う電子的もしくは機械的な要素の組合せ、または、機能を行うためにそのソフトウェアを実行するための適切な回路と組み合わされた、したがって、ファームウェア、マイクロコードなどを含む任意の形態のソフトウェア、ならびに、存在すれば、ソフトウェア制御された回路に結合された機械的な要素を含むことができる。そのような特許請求の範囲によって定義される本発明は、さまざまな列挙された手段によって提供される機能性が、特許請求の範囲が求めるやり方で組み合わされ、一緒にされており、別段そのように定義されない限り、いずれの物理的な構造も、特許請求される発明の新規性に対しては、ほとんど、またはまったく重要でないという事実に帰する。したがって出願人は、それらの機能性を提供することができるいずれの手段も、本明細書に示された機能性と均等であるものとみなす。

Claims

ビデオ会議の場所（ルーム１）における参加者の存在を隠すようになど、前記ビデオ会議中の前記場所におけるカメラによって記録されるビデオデータ（ビデオルーム１）を適合させるための方法であって、前記場所（ルーム１）における前記ビデオ会議の任意の参加者によって、場合によって行われることになる既定のジェスチャを登録するステップと、前記ジェスチャを検出するステップと、それについて検出すると、前記場所（ルーム１）において前記ジェスチャを行った少なくとも一人の参加者を識別するステップと、前記ジェスチャを行った前記少なくとも一人の参加者に関するデータを前記ビデオデータから削除するようになど、前記ビデオデータを適合させるステップと、それにより、他の場所（ルーム２、…、ルームｎ）における前記ビデオ会議の他の参加者に送信されるための、適合させたビデオデータ（ビデオａルーム１）を生成するステップとを含む、方法。
前記既定のジェスチャ（Ｇ１）が、前記ビデオデータ（ビデオルーム１）を分析することによって検出される、請求項１に記載の方法。
前記既定のジェスチャが、その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体（Ｏ１１、Ｏ１ｍ）からの、および物体（Ｏ１１、Ｏ１ｍ）によって送信される、トリガ検出（Ｇ１１、Ｇ１ｍ）信号を受信することを用いて検出される、請求項１に記載の方法。
前記場所（ルーム１）において前記ジェスチャを行った前記少なくとも一人の参加者の識別が、前記場所における前記ビデオ会議の前記ビデオデータ（ビデオルーム１）を分析することによって行われる、請求項１から３のいずれか一項に記載の方法。
前記場所（ルーム１）において前記ジェスチャを行った前記少なくとも一人の参加者の識別が、前記物体（Ｏ１１、Ｏ１ｍ）からの前記トリガ検出信号を分析することによって行われる、請求項３に記載の方法。
ビデオ会議中の場所（ルーム１）におけるカメラ（ｃａｍ１）によって記録されるビデオデータ（ビデオルーム１）を適合させるためのビデオ分析および適合デバイス（ＶＡＡＳ）であって、前記ビデオデータ（ビデオルーム１）を受信し、既定のジェスチャを行った前記場所における前記ビデオ会議の少なくとも一人の参加者を検出するために前記ビデオデータ（ビデオルーム１）を分析し、前記既定のジェスチャを行った前記少なくとも一人の参加者を検出すると、前記少なくとも一人の参加者に関するビデオデータを前記ビデオデータから削除するようになど、前記ビデオデータ（ビデオルーム１）を適合させるステップを行い、それにより、適合させたビデオデータ（ビデオａルーム１）を生成して、前記適合させたビデオデータ（ビデオａルーム１）を前記ビデオ適合デバイスの出力に提供するように適合された、ビデオ分析および適合デバイス（ＶＡＡＳ）。
前記既定のジェスチャの存在を示すトリガ信号を受信し、前記トリガ信号を受信すると、前記既定のジェスチャを行った前記少なくとも一人の参加者の検出を開始するようにさらに適合された、請求項６に記載のビデオ分析および適合デバイス（ＶＡＡＳ）。
前記既定のジェスチャ（Ｇ１）を検出するために前記ビデオデータ（ビデオルーム１）を分析し、前記既定のジェスチャを検出すると、前記既定のジェスチャを行う前記少なくとも一人の参加者の検出を開始するようにさらに適合された、請求項６に記載のビデオ分析および適合デバイス（ＶＡＡＳ）。
場所（ルーム１）におけるビデオ会議を記録するカメラ（ｃａｍ１）からビデオデータ（ビデオルーム１）を受信するように適合されたビデオ会議クライアント（ＶＣＣ１）において、前記ビデオ会議クライアント（ＶＣＣ１）が、請求項６から８のいずれか一項に記載のビデオ分析および適合デバイス（ＶＡＡＳ）をさらに含み、前記ビデオ会議クライアント（ＶＣＣ１）が、少なくとも１つの他の場所（ルーム２；ルームｎ）における前記ビデオ会議の他の参加者にサービス提供する少なくとも１つの他のビデオ会議クライアント（ＶＣＣ２；ＶＣＣｎ）に向けて、適合させたビデオデータ（ビデオａルーム１）を送信するようにさらに適合されていることを特徴とする、ビデオ会議クライアント（ＶＣＣ１）。
前記既定のジェスチャに関するユーザ情報を受信し、格納するように適合された登録手段（ＧＲ１）をさらに含む、請求項９に記載のビデオ会議クライアント（ＶＣＣ１）。
その上で前記既定のジェスチャが前記少なくとも一人の参加者によって行われる物体（Ｏ１１、Ｏ１ｍ）からの、および物体（Ｏ１１、Ｏ１ｍ）によって送信される、トリガ検出（Ｇ１１、Ｇ１ｍ）信号を受信するようにさらに適合された、請求項９または１０に記載のビデオ会議クライアント（ＶＣＣ１）。
場所（ルーム１）におけるビデオ会議の少なくとも一人の参加者によって行われる既定のジェスチャを検出するように適合された物体（Ｏ１１、Ｏ１ｍ）であって、前記既定のジェスチャを検出すると、トリガ検出信号（Ｇ１１、Ｇ１ｍ）を生成し、前記トリガ検出信号を前記場所（ルーム１）におけるビデオ会議クライアント（ＶＣＣ１）に提供するようにさらに適合された、物体（Ｏ１１、Ｏ１ｍ）。
前記既定のジェスチャに関する登録要求を生成し、前記ビデオ会議クライアント（ＶＣＣ１）に送信するようにさらに適合された、請求項１２に記載の物体（Ｏ１１、Ｏ１ｍ）。
請求項６から８のいずれか一項に記載のビデオ適合デバイスを含むことを特徴とする、ビデオ会議サーバ。
データ処理装置上で実行されるとき、請求項１から５のいずれか一項に記載の方法ステップを行うように適合されたソフトウェアを含む、コンピュータプログラム製品。