JP6772023B2

JP6772023B2 - ユーザー状態検出による集団相互作用の方法及びシステム

Info

Publication number: JP6772023B2
Application number: JP2016205763A
Authority: JP
Inventors: マリアフランク，; ガッセムトフィギ，; ナンディタエム．ナヤック，; ハイソング，
Original assignee: コニカミノルタラボラトリーユー．エス．エー．，インコーポレイテッド
Priority date: 2015-10-30
Filing date: 2016-10-20
Publication date: 2020-10-21
Anticipated expiration: 2036-10-20
Also published as: EP3163507A1; US20170127021A1; US9800834B2; JP2017123149A

Description

本開示はユーザー状態検出による集団相互作用の方法及びシステムに関し、特に、ユーザー状態を検出し、各ユーザーについて関与スコアを生成し、一以上のユーザーに対して一定の状況でフィードバックを提供することに基づき、ユーザー同士又は人と機械との相互作用を改善する方法及びシステムに関する。

図１に示す集団ミーティングシナリオ１００において、参加者１１０，１１２，１１４，１１６，１１８は、互いに話し合い、交渉し、発表し、考案する。多くのミーティングは、例えば、テーブルの周りに着席する参加者と、ときにディスプレイの前に立って発表する参加者とによって実施される。また、更に多くのミーティングが、例えばビデオ会議によって離れた状況で実施されるようになっている。ビデオ会議では、参加者は二以上の場所におり、発表やミーティングの間すべての参加者が見えるわけではない。例えば、一以上の参加者はミーティングの間いつでも見えなくなる場合がある。

集団力学やミーティングの際に参加者が発現する特定の行動によって、集団活動における様々な精神状態を正確に観察できないことも多い。例えば、各参加者の集団における種々の精神状態は、関与、ストレス、注意、興奮、意見の一致及び／又は不一致などの興味の様子を含みうる。

したがって、ミーティングの質を改善するため、個々のユーザー又は参加者の様々な精神状態又はユーザー状態と、分散して配置された集計集団状態とを理解することが望ましい。

上記の点を考慮して、参加者の隠れた精神状態を計測し、評価し、これにフィードバックを与える方法及びシステムを有することが望ましい。

ミーティングにおける２人以上の参加者間の相互作用を検出する方法であって、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉する工程と、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算する工程と、
前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供する工程と、
を有し、
前記２人以上の参加者の各々についての前記時系列の骨格データを前記複数の体位識別子に基づいて分類する工程は、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出する工程と、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正する工程と、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去する工程と、を有することを特徴とする方法が開示される。

２人以上の参加者間の相互作用を検出するコンピューター読取可能なコードを記憶したコンピュータープログラムであって、前記プログラムはコンピューターにより実行され、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉する工程と、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算する工程と、
前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供する工程と、
を含み、
前記２人以上の参加者の各々についての前記時系列の骨格データを前記複数の体位識別子に基づいて分類する工程は、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出する工程と、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正する工程と、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去する工程と、を含む処理を前記コンピューターに実行させることを特徴とするコンピュータープログラムが開示される。

２人以上の参加者間の相互作用を検出するシステムであって、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉するデータ入力モジュールと、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出するモジュールと、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類し、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算し、
前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供するように構成されたプロセッサーと、
を備え、
前記プロセッサーは、
前記２人以上の参加者の各々についての前記時系列の骨格データを、前記複数の体位識別子に基づいて分類する際に、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出し、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正し、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去することを特徴とするシステムが開示される。

２人以上の参加者が参加するミーティングにおける集団相互作用を改善するシステムであって、
前記２人以上の参加者の各々について、前記参加者の態度に基づき、関与した状態及び離脱した状態を含む前記ミーティングへの前記参加者の関与状態である個別関与状態を計算し、
前記２人以上の参加者の前記態度に基づき、前記ミーティングへの前記２人以上の参加者の関与状態である集団関与状態を計算し、
フィードバックを提供するように構成されたプロセッサーと、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉するデータ入力モジュールと、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出するモジュールと、
を備え、
前記プロセッサーは、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類し、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての個別関与スコアを計算し、
前記フィードバックの提供は、
前記離脱した状態を有する前記参加者の数が第一の閾値を超えた場合は、前記参加者の前記個別関与状態に関わらず、前記参加者のすべてに対して集団警告を与えること、
前記離脱した状態を有する前記参加者の数が第二の閾値を超えない場合は、前記離脱した状態を有する前記参加者にのみ警告を与えること、及び
前記集団関与状態に従って、ミーティング室のシステムに環境的フィードバックを提供することを含み、
前記プロセッサーは、
前記２人以上の参加者の各々についての前記時系列の骨格データを、前記複数の体位識別子に基づいて分類する際に、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出し、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正し、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去することを特徴とするシステムが開示される。

上述した概要及び以下の詳細な説明はともに例示的かつ説明的なものであって、特許請求の範囲に記載された本発明について更なる説明を提供することを意図するものである。

例示的な実施形態によるコラボレーションシナリオを示す図である。例示的な実施形態による関与スケールを示す図である。例示的な実施形態による、特徴を導くために用いる関節の三次元（３Ｄ）位置を示す図である。例示的な実施形態によるシステムアプローチを示す図である。例示的な実施形態による一般的な有限状態機械（ＦＳＭ）遷移図を示す図である。例示的な実施形態による関与検出のフローチャートを示す図である。例示的な実施形態による、一連のフレームの異なる色で示された異なるジェスチャーへのセグメント化の例を示す図である。例示的な実施形態による、関与検出を使ったジェスチャーセグメンテーションのフローチャートを示す図である。例示的な実施形態による、数回のミーティングにわたる個別の例示的関与スコアを示す図である。本明細書に開示する方法及びプロセスによる、未分類ユーザーの個人又は集団が少なくとも一つのサーバーに接続され、該少なくとも一つのサーバーがデータを処理するように構成された遠隔会議シナリオを示す図である。

添付図面に例示される本発明の好ましい実施形態について、ここに詳細に説明する。同じ又は類似する部分に言及する図面及び記載には、可能な限り同じ参照番号を用いる。

添付図面は本発明の更なる理解のために含まれており、本明細書に組み込まれて、その一部をなす。図面は本発明の実施形態を図示し、本明細書とともに本発明の原理を説明する役割を果たす。

例示的な実施形態に従い、本開示は、ユーザー状態検出の方法及びシステムの実施形態として、関与（エンゲージメント）を用いる。関与とは、注意深く傾聴し、観察し、及びフィードバックを提供する状態、又は集団相互作用における主役のようなふるまいと定義することができる。関与レベルは、例えば、集団相互作用の流れや生産性に影響する。したがって、例えば、集団ミーティングの参加者間における協力を改善するため、関与レベルの認識を促すことが興味の対象となる。

図２は、例示的な実施形態による関与スケール２００を示す図である。集団ミーティングシナリオにおいて、例えば、離脱（ディスエンゲージメント）から身を入れた行動に至るまで、各参加者の関与（又はユーザー状態）には種々のレベルがある。例えば、図２に示すように、関与スケールの種々のレベルは下記を含む。
（ａ）離脱、例えば、散漫及び／又は油断
（ｂ）緩やかな関与、例えば、傾聴又は観察
（ｃ）身を入れた関与、例えば、うなずき、傾聴、非言語的フィードバック
（ｄ）行動の意思、例えば、前方に傾く及び／又は口を開くジェスチャー
（ｅ）行動、例えば、話す及び／又は操ること
（ｆ）身を入れた行動、例えば、激しいジェスチャー及び／又は早口での発言

例示的な実施形態によれば、例えば、本明細書に開示するように、集団相互作用におけるユーザー状態及び本明細書でいう関与の尺度を確立することによって、フィードバック生成に関連する実施と、ジェスチャー検出及び行動するユーザーの検出の改善とが可能になる。
（マルチモーダルデータ）

例示的な実施形態によれば、マルチモーダルデータアプローチを用いて関与及びユーザー状態を検出及び評価することができる。
（体位構成要素データ）

例示的な実施形態によれば、一組の分類子は体位及びジェスチャーに基づくものである。図３は、例示的な実施形態による、特徴を導くために用いる関節の三次元（３Ｄ）位置３００を示す。本明細書に開示するシステム及び方法は、２Ｄ画像情報とともに３Ｄ骨格情報を用いることができる。

例示的な実施形態によれば、少なくとも一つのセンサーが、各ユーザーが可視的となる既知の場所に設置される。深度カメラ及びモーションセンサーを使用して、人の上半身の骨格系の９つの主要な関節の３Ｄ位置が検出される（図３）。それ以外に検出された６つの関節、例えば、左右の足、左右の膝、左右の尻は、ミーティングシナリオにおいてデスクに隠れてしまうので、特徴を導くために使用されない。また、それ以外に検出された２つの関節である左右の手も、手首関節に非常に近く重複しかねないため、特徴を導くために使用されない。
（音声データ）

例示的な実施形態によれば、このデータセットは、ユーザー状態検出を特徴づける他の音声解析分類子間の、ピッチ、音声周波数、発言検出及びボリュームの同定を含む。例えば、活発なユーザーの検出を更にサポートするため、ステレオセンサーを用いることができる。
（顔データ）

例示的な実施形態によれば、ユーザー状態検出を特徴づける感情分類子を生成するため他のものと共に使用される顔特徴を識別する２ＤのＲＧＢ画像及び３Ｄ画像を用いて、顔データ解析を行うことができる。
（重みデータ）

例示的な実施形態によれば、椅子における重みセンサーが、重み分布に基づく姿勢の追加的評価を可能とする。椅子に重みセンサーを使用することで、より安定したユーザー状態検出における相互相関が可能となる。
（ユーザー状態検出―関与）

関与レベルの追跡を可能とするため、生体解析を通じた参加者の相互作用関与の追跡、例えば、身体姿勢の解析、音声の解析及び表情の識別を用いることができる。例示的な実施形態によれば、非言語的合図が、話者の内部状態の情報を伝達し、非侵襲的な尺度を作成しうる。このデータに基づき、フィードバックが作成される。

例示的な実施形態は、マルチモーダル関与ユーザー状態検出プロセスを提案する。例示的なシナリオでは、センサーの動作範囲内、例えば、カメラの観測視野に、複数の人々がいる。例えば、このモジュールは、図２に示す離脱から身を入れた行動に至る関与スケールでの参加者の状態を同定することができる。
（分類子）

モジュールは、生体情報を用いて、すべてのカテゴリーの分類子の特定の組合せを示す人を同定する。体位構成要素などの分類子は、それらを注意深さや関与に結びつける調査に基づいて選択することができる。

例示的な実施形態によれば、解析はフレーム単位であってもよい。各フレームはすべての分類子について解析されうる。例えば、各フレームは、（１）手を上げ（３Ｄ）、（２）ディスプレイに顔を向け（２Ｄ）、（３）前方に傾き（３Ｄ）、（４）後方に傾き（３Ｄ）、（５）フィードバックを述べ（音声）、（６）猫背になり（３Ｄ）、又は（７）最後の６０フレームにおいて姿勢（重み）を変更する人である。

例示的な実施形態によれば、分類子は、各フレームにおいて個々の参加者に現れるか否かによって、二値で評価される。例えば、分類子は、特定の姿勢についてのヒューリスティクスや、より複雑な動作パターンについてのサポートベクターマシン（ＳＶＭ）特徴解析（或いは機械学習のアルゴリズム）に基づいて定義される。

図４は、例示的な実施形態によるシステム４００アプローチを示す。図４に示すように、システム４００は、複数の未分類ユーザー（又は参加者）４１２を含むコラボレーションシナリオ４１０を含み、特徴及び骨格抽出モジュール４２０によって特徴及び骨格抽出が行われる。その後、複数の未分類ユーザー（又は参加者）４１２の各々の特徴及び骨格抽出が、分類子検出及び評価モジュール４３０に入力される。分類子検出及び評価モジュール４３０は、身体の構成要素を、例えば、猫背＝０、前傾＝１、後傾＝０、ディスプレイに顔を向ける＝１、上げた手＝１、姿勢変更＝１、及び発言＝１のように分類する。その後、未分類ユーザー４１０の各々について、分類子を用いて０〜１．０の関与スコア４４０の計算結果が生成される。未分類ユーザーの各々には、個別の関与分類子と、集団或いはチーム分類子４５０（例えばチーム＝０．４９）とが割り当てられる。例示的な実施形態によれば、関与スコア４４０を用いて、一以上のユーザー（又は参加者）４１２の各々の関与状態を生成又は判断することができる。

例示的な実施形態によれば、図４に示すように、コラボレーションシナリオ４１０は、例えば、一以上のデータ入力装置（図示せず）を含んでもよい。一以上のデータ入力装置は、例えば、モーション及び／又は深度センサー、ＲＧＢカメラ、ミーティング室における一以上の椅子の各々に対する重みセンサー、及び／又はマイクを含む。例えば、例示的な実施形態によれば、アレイ状のマイクを用いて音声源の方向及び距離を検出してもよい。例示的な実施形態によれば、特徴及び骨格抽出モジュール４２０は、複数の未分類ユーザー４１２の各々について、オーディオデータ、ビデオデータ、深度データ及び／又は重みデータの形式でデータを受信するように構成されてもよい。データは、一以上のモーション及び／又は深度センサーを、例えば、ビデオカメラ、オーディオデバイス及び／又は重みセンサーとの組合せにより用いて生成してもよい。例えば、オーディオ、ビデオ及び／又は深度データは、ビデオカメラ、例えば、時系列のＲＧＢフレーム及び深度フレームを生成するＲＧＢ‐Ｄカメラを用いて取得することができる。例示的な実施形態によれば、リアルタイム骨格抽出を行う深度センサーは、人のジェスチャーの認識に対する興味を生んでおり、深度センサーからの骨格データストリームを使用して入力データを生成することができる。例えば、例示的な実施形態によれば、センサーは未分類ユーザーの非言語的行動を捕捉することができる。

例示的な実施形態によれば、例えば、特徴及び骨格抽出モジュール４２０及び分類子検出及び評価モジュール４３０は、一つのコンピューターデバイス、例えばスタンドアローンコンピューターに組み合わされてもよく、或いは、各々がメモリー、プロセッサー、オペレーティングシステム及び／又はソフトウェア、並びにグラフィカルユーザーインターフェース（ＧＵＩ）又はディスプレイを有する一以上のコンピューターデバイスに含まれてもよい。例示的な実施形態によれば、例えば、骨格関節３Ｄ位置、ＲＧＢ及び深度情報などの生体情報が通信ネットワークを介して転送され、分散プラットホームにおいて解析されてもよい。
（有限状態機械）

関与分類子に対するアルゴリズムの効率性及び正確性を増大させるため、有限状態機械（ＦＳＭ）を実装することができる。例示的な実施形態によれば、状態とは、時間に伴う変化が予想されるユーザーの精神状態又は関与の内容である。遷移は、条件の変化によって、又は状態の変化をもたらす条件の組合せによって初期化される。例えば、ジェスチャー認識システムを用いてユーザーの有意なジェスチャーを見つけ出す場合、スワイピング又はポインティングは、「行動する意思」の状態などいくつかの状態で起こる場合があり、「離脱」状態における類似のジェスチャーは、無視されるか異なる解釈をされる。

例示的な実施形態によれば、有限状態機械の表現は、行動を状態と関連づけることができる。例えば、以下の通りである。
入場動作：その状態に入るときに実行される
状態動作：その状態の間に実行される
退場動作：その状態を抜けるときに実行される

例示的な実施形態によれば、ＦＳＭは、２つの所与のフレーム間の状態変化をもたらす関連分類子の変化をより速く解析することができるように構成される。例示的な実施形態によれば、ＦＳＭを表す遷移図とともに、状態遷移テーブルを用いることもできる。表１は、３つの状態があるＦＳＭの一般的な状態遷移を示している。例えば、現在の状態（例えばＳ_２）及び条件（例えばＣ_２３）の組合せは、次の状態（例えばＳ_３）を示す。状態間の遷移は、テーブルにおいて強調表示されている。

表１の等価遷移図が図５に示されている。

例示的な実施形態によれば、ＦＳＭにおける２つの異なる状態間の遷移は、図５に示すように、等価遷移図で見ることができる。各状態にとどまる条件は、同じ状態から遷移する条件の否定でありうる。

例示的な実施形態によれば、関与ＦＳＭは、６つの要素の組（S，G，S，s_０，d，w）である。ただし、Sは入力アルファベット（記号の有限非空集合）であり、Gは出力アルファベット（記号の有限非空集合）であり、Sは関与状態の有限非空集合、s_０は初期の関与状態であって、Sの要素である。一以上の初期状態がある場合は、s_０は初期状態の集合となる。また、dは状態遷移関数（d：S×S(R) S）、wは出力関数である。

例示的な実施形態によれば、出力関数が状態と入力アルファベットとの関数である場合は（w：S×S(R)G）、その定義はミーリ・モデルと一致し、ミーリ・マシンとしてモデル化することができる。出力関数が状態にのみ依存する場合は（w：S(R)G）、その定義はムーア・モデルと一致し、ムーア・マシンとしてモデル化することができる。出力関数がまったくないＦＳＭは、半オートマトン又は遷移系として知られている。
（重み及び最終関与スコア）

例示的な実施形態によれば、個々の分類子に対する二進値は、トレーニングデータにおける相対的影響に基づいて重みづけされ、合計して関与スコアとされる。したがって、関与スコアは、例えば、０と１の間の値となる。例示的な実施形態によれば、関与スコアはＦＳＭ（w：S×S(R)G）の出力に基づいて計算することができる。

関与スコアは下記の式により計算することができる。

関与スコアの計算は以下のようになる。

例示的な実施形態によれば、関与状態は、関与スコアに関する閾値に基づいて評価することもできる。例えば、関与スコアの増加は関与レベルの増加を構成する。該レベルは、関与スコアの特定の数値的閾値を跨ぐと変化する。例えば、以下の通りである。
離脱 < 非常に低い関与スコア
緩やかな関与 > 低い関与スコア
身を入れた関与 > 低い／中間の関与スコア
行動の意思 > 中間の関与スコア
行動 > 中間の高い関与スコア
身を入れた行動 > 高い関与スコア

個別関与スコアに基づき、合計としてチーム関与スコアが計算される。また、２人の参加者間の関与スコアは、姿勢方向を考慮に入れて計算することができる。例示的な実施形態によれば、関与スコアは、チームの関与レベル、チームメンバー間の力学、オブジェクトとインターフェースとの相互関係を反映しうる。
（関与検出の適用）

例示的な実施形態では、複数の参加者が一つの部屋にいるミーティングで、一人の活発な参加者は、通常、話をし、及び／又は同時にディスプレイと相互作用し、その一方で、他の者は傾聴し、観察する。また、ミーティングを通して、活発な参加者は変化しうる。例示的な実施形態によれば、個々の及び集団の関与レベルを計算することで、集団活動のフィードバックが可能となる。これにより、管理的調整及び環境的調整を可能として、より人を引き付け、生産的な仕事環境を作り、ユーザー検出を改善してジェスチャー認識の正確性を高めることが可能となる。例示的な実施形態によれば、関与スコアの適用は、図６に示すように実現することができる。

図６に示すように、関与スコアは、ステップ６００で初めに参加者又はユーザーの各々を検出することにより計算することができる。ステップ６１０において、参加者又はユーザーの各々が同定される。ステップ６２０において、体位構成要素が同定される。ステップ６３０において、体位構成要素の重みづけが実施される。ステップ６４０において、参加者又はユーザーの各々について、個別関与スコアが計算される。ステップ６５０において、集団関与スコアが計算される。

ステップ６６０において、集団関与スコアの変化が所定の閾値よりも大きいか否かの判断が行われる。集団関与スコアの変化が所定の閾値よりも大きくない場合は、ステップ６６２において、環境的調整は行われない。しかしながら、集団関与スコアの変化が所定の閾値よりも大きい場合は、ステップ６６４において調整が行われる。

例示的な実施形態によれば、環境的調整又は変化にはフィードバックの提供が含まれる。フィードバックの提供には、離脱した状態の参加者の数が第一の閾値を超えた場合に、参加者全員に対して個別関与状態に関わらず集団警告をすること、離脱した状態の参加者の数が第二の閾値を超えない場合に離脱した状態の参加者にのみ警告を与えること、及び／又は集団関与状態に従ってミーティング室のシステムに環境的フィードバックを提供することを含む。例示的な実施形態では、第二の閾値よりも第一の閾値の方が高い。

例示的な実施形態によれば、フィードバックは、一定の時間フレームにおける参加者の態度に基づいて提供される。また、ミーティングをサポートする環境的フィードバックも、離脱した状態の参加者の数が第一の閾値を超えた場合に提供されうる。例えば、環境的フィードバックは、集団関与状態における変化が第三の閾値より大きい場合に提供される。

ステップ６７０において、ジェスチャー検出のためのユーザー選択分類子が実施される。ステップ６７２において、ジェスチャー検出のためのセグメンテーション及び選択分類子の検出がサポートされる。

ステップＳ６８０において、集団の所定の数、例えば４０％が離脱しているか否かが判断される。ステップ６８０で集団が離脱していると判断されると、処理はステップ６８２に進み、集団フィードバックが送信される。集団における数が所定の数を超えないと判断されると、ステップ６８４において、一以上の参加者又はユーザーが離脱しているか否かが判断される。ステップ６８６では、一以上の参加者又はユーザーが離脱していると、参加者又はユーザーの各々は、メッセージ又は信号の形でフィードバックを送られる。ステップ６８８において、いずれの参加者又はユーザーも離脱していない場合は、フィードバックは与えられない。
（ジェスチャー認識の改善）

連続動作が長時間にわたって行われるシステムでは、種々の有意な動作をセグメントに分割し、無意味な動作を無視し、有意な動作の各々に対して求められるタスクを実行する必要がある。例示的な実施形態では、ここに開示する動作セグメンテーション及び認識モジュールによってこれを実行することができる。また、ユーザー関与状態の検出は、現在のジェスチャーセグメンテーション及び認識をサポートし改善することができる。
（ユーザー同定）

広範囲対話型ディスプレイによるミーティングシナリオは、例えばシステムが常にオンとなる「ミダス・タッチ・プロブレム（ＭｉｄａｓＴｏｕｃｈＰｒｏｂｌｅｍ）」を引き起こしうる。例示的な実施形態によれば、関与スコアは、それより下であれば関与及び相互作用の意思の欠如に基づきジェスチャーが排除される閾値を作成できる限りにおいて、ユーザー同定及び関連するジェスチャーの認識をサポートする。また、関与スコアは、種々の参加者の関与レベルを比較して、主たる参加者（又はユーザー）を最も高い関与スコアを有する参加者（又はユーザー）として選択することを可能とする。
（ジェスチャーセグメンテーション）

正確なジェスチャーセグメンテーションは未だジェスチャー検出における課題である。
図７に示すように、例示的な実施形態では、ジェスチャーセグメンテーションは、いつ現在のジェスチャーが終了して新たなジェスチャーが開始されるかを決定するフレーム又はフレームの組の検討を含む。図７に示すように、ジェスチャーセグメンテーションは３つのステップを含みうる。
（１）第一工程は、最大平均差異（ＭａｘｉｍｕｍＭｅａｎＤｉｓｃｒｅｐａｎｃｙ：ＭＭＤ）を適用し、連続するジェスチャーにおける変化点を、ジェスチャー遷移の初期推定切断部として検出する。
（２）第二工程は、運動学的拘束（ｋｉｎｅｍａｔｉｃｃｏｎｓｔｒａｉｎｔｓ）を用いて、初期推定切断部を正確なジェスチャー遷移位置に修正する。
（３）確率密度推定を用いて２つの切断部の間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去する。

例示的な実施形態によれば、ユーザーが相互作用を望まず単に体動を示しているにすぎないことを低い関与スコアが示す限りにおいて、関与状態の評価は関連ジェスチャーと非関連ジェスチャーとを分離するのに役立つため、関与セグメンテーションはジェスチャーセグメンテーションを改善する。したがって、関与スコアは、人がいつシステムと相互作用してジェスチャーセグメンテーションモジュールをオンにするつもりかについて、システムが理解するのを助ける。また、関与のレベルは、動作の強さの示度を提供する。例えば、関与レベルが高いほど、ジェスチャーはより高頻度でスピードも速い。これは、個々のセグメントの想定される長さに付加的な情報を提供しうる。個々の分類子は、体動を特定の姿勢と関連づけることもできる。例えば、分類子がその状態を変化させる場合、ジェスチャーが変化又は開始される可能性が高まる。したがって、分類子の変化は、動作のセグメンテーションをフレームごとのレベルでサポートして、セグメンテーションのトリガとなりうる。

図８は、例示的な実施形態の関与検出を用いたジェスチャーセグメンテーションのフローチャートを示す。図８に示すように、ステップ８１０において、人の検出とユーザーの同定が行われる。ステップ８２０において、人の検出情報及びユーザーの同定情報は、関与検出モジュールに入力される。関与検出モジュールでは、関与レベルが判断され、ステップ８３０のプロセスで、「相互作用の意思」以上が検出されたか判断される。関与レベルが「相互作用の意思」以上でない場合は、ステップ８３２において、いかなる動作も実行されない。プロセスが「相互作用の意思」以上が検出されたと判断した場合は、ステップ８４０に進み、セグメント期間の推定が実行される。ステップ８４２では、推定セグメント期間に、最大平均差異（ＭＭＤ）、運動学的拘束、及び確率密度推定が行われる。ステップ８５０では、ジェスチャー切断部推定が結合され、ステップ８６０でジェスチャーセグメントが出力される。
（ジェスチャー分類）

セグメンテーションが実行されると、有意なジェスチャーを認識することができる。例示的な実施形態によれば、有意なジェスチャーの同じ組を実行する数人の演者からなるトレーニングセットは、特徴の抽出に用いることができ、サポートベクターマシン（ＳＶＭ分類子）を作り上げる。抽出したセグメントからの特徴は、行動を認識するＳＶＭに送り込まれる。

例示的な実施形態によれば、ジェスチャー認識における課題は、セグメント化されたジェスチャーが未知のジェスチャーか否か、又は、それが認識された／有意なジェスチャーの組に属するか否かの判断と、ノイズや姿勢の変化がある場合の有意なジェスチャーの正確な分類とを含む。

例示的な実施形態によれば、関与検出は、これらの課題の双方に役立つ。例えば、個々の体位構成要素分類子は、ジェスチャー分類の正確性を改善する付加的な情報を与えうる。特定のセグメントに対する分類の信頼度が低い場合は、特定のジェスチャーに関係する特定の分類子をサポート変数として使うことができる。分類子は、ジェスチャーに関連する体位に特徴を提供する。例えば、特定のジェスチャーに表れた分類子の特定の組が同定されると、続くフレームにおいてそのジェスチャーの可能性が高まる。関与スコアは、有限状態機械を用いて、見込みがなく無関係の特徴及びジェスチャーを除外することにより、各フレームにおいて可能性があるジェスチャーの数を制限するのに役立つ。また、分類子は、ジェスチャー分類モジュールに追加的な姿勢情報を提供して、ジェスチャーが未知であるか有意であるかを判断する。
（ポインティング精度）

ジェスチャー検出の課題の一つは、ポインティングの精度である。関与レベルは、安定性を高めるために、ポインティング及びトラッキングを検出することができる。例示的な実施形態によれば、ポインティングは２つのセグメントを持ちうる。２つのセグメントには、ユーザーがハイライト／指摘したいスクリーン上のポイントを見つけ出すこと、並びに、ユーザーがポインティングを続ける場合に、ポインティングハンドをトラッキングしてハイライトされたポイントの位置を適切に変更することを含む。

第一の工程では、ユーザーは彼らの動作やターゲットに注目するが、第二の工程では、ユーザーは会話及び他のミーティングの参加者に注目し、目的を失って動揺する。

例示的な実施形態によれば、関与スコア及び特定の分類子は、参加者がディスプレイに関与しているだけか、他の参加者にも関与しているかについて、追加的な情報を提供することができる。ユーザーがディスプレイに集中している場合は、ポインティング及びトラッキングが有効となる。ユーザーがポインティング及び他の参加者との相互作用に移行した場合は、集中点が移る間のポインティングをより安定的にするため、トラッキングは使用不能となりうる。
（ミーティング参加者への関与フィードバック及びインフラストラクチャー管理）

例示的な実施形態によれば、フィードバックシステムは、集団状態と個別のユーザー状態とに基づき、さまざま種類のフィードバックを提供することができる。例えば、関与スコア及び集団関与スコアは、フィードバック信号を作るのに用いられる。フィードバック信号は、機器又は環境の反応だけでなく、ウェアラブルデバイス又はあらゆる集団ベースデバイスを用いたオーディオ、ビジュアル、バイブレーションアラートであってもよい。例示的な実施形態によれば、システムは、フィードバックを送信する前に、十分に長い期間（例えば、約１分）、関与スコア（又はその他のユーザー状態）を監視することができる。例示的な実施形態によれば、時間フレーム（又は期間）が短すぎる場合、例えば秒刻みの場合、フィードバックは中断可能であり、より大きな趨勢の代わりに、余計な変動に応答してもよい。

ミーティング相互作用における関与へのフィードバックを作成するために、例えば、図６の工程を実施することができる。例示的な実施形態によれば、例えば、個別関与を計算する前に、ミーティングの参加者を検出し、同定することができる。個別関与に基づき、集団関与が評価される。これら２つの要素が、フィードバック生成の基礎を形成する。
（ミーティング動的フィードバック）

すべての参加者：集団警告がジョイントディスプレイ上にシンプルなポップアップとして表示され、「集団が離脱している」ことを通知する。これは、集団フィードバックがこの例において離脱に分類されると起こり、所定の数若しくは割合（例えば４０％）より多い個別フィードバックが離脱に分類され、又は集団関与レベルが離脱に分類されたことを意味する。公的フィードバックが、ミーティング活動を変更し、又は再び集中させるため休息させる働きかけとして使用される。

個人：集団スコアが所定の数又は割合（例えば、関与例に関する関与閾値６０％）を上回った場合、個別のデバイスを用いて、離脱した参加者にのみ通知がなされる。個別のデバイスは、例えば、スマートフォン上に「あなたは離脱しています、ミーティングに再関与してください」と表示するロック画面メッセージであってもよい。これにより、集団全体の気が散らなくなる。

管理者：関与レベルの記録は、特定のミーティング時間における全体の関与、参加、ミーティングにおける権勢など、ミーティング力学のより大きな趨勢についての見識を提供しうる（図９）。これらの見識は、ミーティング時間、必要な参加者、インタラクションプロトコルにおいて必要な変更、ミーティングの生産性に関する他の面の調整を可能とする。また、この関与スコアは、ミーティングにおける特定の参加者間の相互作用を評価して力学を解釈するダイアドレベル上にある場合もある。関与レベルを包括的なクロス表に記憶して、すべての参加者の可能な組合せにおける関与レベルをみることもできる。
（環境的フィードバック）

活動：環境的フィードバックは、集団活動及び関与レベルに基づき、ルームシステムに送信される。活動が盛んであるほど、より高い熱負荷及びより多い酸素消費を生む。この情報は、冷却を向上させて気流及び温度快適性を増加することにより、大気質を管理するのに役立つ。このように、システムは診断された負荷により速く反応して、過熱を防ぐことができる。

サポート：集団が離脱した状態は、環境システムに、室温を下げ、又は照明を明るくさせて、ミーティング参加者の目を覚まさせるきっかけとなりうる。緩やかに関与する参加者が多すぎる場合は照明がより明るくされ、離脱している参加者が多すぎる場合は室温が２〜３度下げられる。
（動作意思フィードバック）

オブジェクト固有：関与レベルを用いて、室内の種々の応答可能なオブジェクトと行動を共にするユーザー意思を同定することができる。例示的な実施形態によれば、方向性のある体位、声、動きに基づき、どのユーザーが室内のどのオブジェクトと相互作用したいかについて、応答可能なオブジェクトに追加的な情報を与えることができる。例示的な実施形態によれば、関与テーブルを用いて、各参加者の各オブジェクトとの潜在的な関与レベルを追跡することができる。

図１０は、未分類ユーザーの個人又は集団が、少なくとも一つのサーバー１０３０，１０４０と接続された遠隔会議シナリオ１０００を図示している。少なくとも一つのサーバー１０３０，１０４０は、本明細書に開示する方法及び処理によってデータを処理するように構成されている。図１０に示すように、遠隔会議シナリオ１０００では、２人以上又は集団の未分類ユーザー（参加者）４１２が、異なるオフィス及び／又は場所１００２，１００４に居る。異なるオフィス及び／又は場所１００２，１００４の各々には、一以上のデータ入力装置１０１０，１０１２，１０２０，１０２２が備えられていることが好ましい。一以上のデータ入力装置１０１０，１０１２，１０２０，１０２２には、例えば、モーション及び／若しくは深度センサー、ＲＧＢカメラ、ミーティング室の一以上の椅子の各々に対する重みセンサー、並びに／又は上述したマイクが含まれる。

例示的な実施形態によれば、一以上のデータ入力装置１０１０，１０１２，１０２０，１０２２の各組は、少なくとも一つのサーバー１０３０，１０４０に接続されていることが望ましい。例示的な実施形態によれば、少なくとも一つのサーバー１０３０，１０４０は、通信ネットワーク１０５０を介して接続されうる。或いは、一つのサーバー、例えばサーバー１０３０のみが一以上のデータ入力装置１０１０，１０１２，１０２０，１０２２の双方の組に用いられてもよく、一以上のデータ入力装置１０１０，１０１２，１０２０，１０２２は、通信ネットワーク１０５０を介してサーバー１０３０に接続されうる。

例示的な実施形態によれば、例えば、通信ネットワーク１０５０は公衆通信回線及び／又はネットワーク（例えばＬＡＮ若しくはＷＡＮ）である。通信ネットワーク１０５０の例には、本明細書の実施形態に整合するいかなる通信回線及び／又はネットワークも含まれる。例えば、これらに限定されるものではないが、通信又は電話回線、インターネット、イントラネット、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、並びに／又は、無線周波（ＲＦ）及び／若しくは赤外線（ＩＲ）通信を用いた無線接続が含まれる。

例示的な実施形態によれば、少なくとも一つのサーバー１０３０，１０４０の各々又は一つのサーバー１０３０は、上述のように、特徴及び骨格抽出モジュール４２０並びに／又は分類子検出及び評価モジュール４３０を含む。少なくとも一つのサーバー１０３０，１０４０は、本明細書に開示する処理、例えば、図６に関して記載された関与スコアの計算、及び／又は図８に示したジェスチャーセグメンテーションを実行するように構成することができる。サーバー１０３０，１０４０は、例えば、メモリー、プロセッサー、オペレーティングシステム及び／又はソフトウェア、及びグラフィカルユーザーインターフェース（ＧＵＩ）又はディスプレイを有する。例示的な実施形態によれば、例えば、本明細書に開示するように、骨格関節３Ｄ位置、ＲＧＢ及び深度情報などの生体情報が通信ネットワークを介して転送され、分散プラットホームにおいて解析されてもよい。

例示的な実施形態によれば、２人以上の参加者間の相互作用を検出するコンピューター読取可能なコードを記憶したコンピュータープログラムを含む非一時的コンピューター読取可能な記録媒体が開示され、前記プログラムはコンピューターにより実行され、前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉する工程と、前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出する工程と、前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類する工程と、前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算する工程と、前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供する工程と、を含む処理を前記コンピューターに実行させる。

例示的な実施形態によれば、２人以上の参加者が参加するミーティングにおける集団相互作用を改善するコンピューター読取可能なコードを記憶したコンピュータープログラムを含む非一時的コンピューター読取可能な記録媒体が開示され、前記プログラムはコンピューターにより実行され、前記２人以上の参加者の各々について、前記参加者の態度に基づき、関与した状態及び離脱した状態を含む前記ミーティングへの前記参加者の関与状態である個別関与状態を計算する工程と、前記２人以上の参加者の前記態度に基づき、前記ミーティングへの前記２人以上の参加者の関与状態である集団関与状態を計算する工程と、フィードバックを提供する工程と、を有し、前記フィードバックを提供する工程は、前記離脱した状態を有する前記参加者の数が第一の閾値を超えた場合は、前記参加者の前記個別関与状態に関わらず、前記参加者のすべてに対して集団警告を与える工程と、前記離脱した状態を有する前記参加者の数が第二の閾値を超えない場合は、前記離脱した状態を有する前記参加者にのみ警告を与える工程と、前記集団関与状態に従って、ミーティング室のシステムに環境的フィードバックを提供する工程と、を含む処理を前記コンピューターに実行させる。

コンピューター読取可能な記録媒体は、磁気記録媒体、光磁気記録媒体、又は、今後開発される記録媒体であって、同じ方法で本発明に適用可能と考えられる、いかなる記録媒体であってもよい。一次複製品、二次複製品その他を含む、かかる媒体の複製物が上記の媒体と等価であることは明らかである。更に、本発明の実施形態がソフトウェアとハードウェアとの組合せであったとしても、本発明の概念を逸脱するものではない。本発明は、ソフトウェア部品をあらかじめ記録媒体に書き込んでおき、必要に応じて作動中に読みだされるように実施することができる。

本発明の範囲又は趣旨を逸脱することなく、本発明の構造に種々の修正や変更を加えうることは、当業者において明らかである。このように、本発明は、添付の特許請求の範囲やその等価物の範囲内の変更点や修正点にまで及ぶことが意図されている。

Claims

ミーティングにおける２人以上の参加者間の相互作用を検出する方法であって、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉する工程と、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算する工程と、
前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供する工程と、
を有し、
前記２人以上の参加者の各々についての前記時系列の骨格データを前記複数の体位識別子に基づいて分類する工程は、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出する工程と、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正する工程と、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去する工程と、を有することを特徴とする方法。
前記複数の体位識別子は、手を上げること、ディスプレイに顔を向けること、前方に傾くこと、後方に傾くこと、及び／又は猫背になることのうち一以上を含むことを特徴とする請求項１に記載の方法。
前記２人以上の参加者についてのオーディオデータストリームを捕捉する工程と、
前記２人以上の参加者についての前記オーディオデータストリームにおいて検出された発言に基づき、前記関与スコアに発言識別子を加える工程と、
を有することを特徴とする請求項１に記載の方法。
前記２人以上の参加者についての重みデータストリームであって、椅子の上の前記２人以上の参加者の各々の重み分布に対応する前記重みデータストリームを捕捉する工程と、
前記２人以上の参加者の各々の前記重み分布に基づき、前記関与スコアに重み分布識別子を加える工程と、
を有することを特徴とする請求項１に記載の方法。
前記２人以上の参加者についての集団関与スコアを生成する工程を有することを特徴とする請求項１に記載の方法。
前記２人以上の参加者の各々についての前記関与スコアと、前記集団関与スコアとに基づき、フィードバックを生成する工程であって、前記フィードバックは、ウェアラブルデバイスを用いたオーディオ、ビジュアル、バイブレーションアラート、又はミーティング室における環境的条件の変更のうち一以上を含む工程を有することを特徴とする請求項５に記載の方法。
前記２人以上の参加者の各々についての前記時系列の骨格データに対し、有限状態機械モデルを適用する工程を有することを特徴とする請求項１に記載の方法。
２人以上の参加者間の相互作用を検出するコンピューター読取可能なコードを記憶したコンピュータープログラムであって、前記プログラムはコンピューターにより実行され、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉する工程と、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類する工程と、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算する工程と、
前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供する工程と、
を含み、
前記２人以上の参加者の各々についての前記時系列の骨格データを前記複数の体位識別子に基づいて分類する工程は、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出する工程と、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正する工程と、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去する工程と、を有する処理を前記コンピューターに実行させることを特徴とするコンピュータープログラム。
前記複数の体位識別子は、手を上げること、ディスプレイに顔を向けること、前方に傾くこと、後方に傾くこと、及び／又は猫背になることのうち一以上を含むことを特徴とする請求項８に記載のコンピュータープログラム。
前記２人以上の参加者についてのオーディオデータストリームを捕捉する工程と、
前記２人以上の参加者についての前記オーディオデータストリームにおいて検出された発言に基づき、前記関与スコアに発言識別子を加える工程と、
を有することを特徴とする請求項８に記載のコンピュータープログラム。
前記２人以上の参加者の重み分布についての重みデータストリームであって、椅子の上の前記２人以上の参加者の各々の前記重み分布に対応する前記重みデータストリームを捕捉する工程と、
前記２人以上の参加者の各々の前記重み分布に基づき、前記関与スコアに重み分布識別子を加える工程と、
を有することを特徴とする請求項８に記載のコンピュータープログラム。
前記２人以上の参加者についての集団関与スコアを生成する工程を有することを特徴とする請求項８に記載のコンピュータープログラム。
２人以上の参加者間の相互作用を検出するシステムであって、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉するデータ入力モジュールと、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出するモジュールと、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類し、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての関与スコアを計算し、
前記２人以上の参加者の前記関与スコアの少なくとも一つに従って、フィードバックを提供するように構成されたプロセッサーと、
を備え、
前記プロセッサーは、
前記２人以上の参加者の各々についての前記時系列の骨格データを前記複数の体位識別子に基づいて分類する際に、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出し、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正し、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去することを特徴とするシステム。
前記２人以上の参加者についてのオーディオデータストリームを捕捉するように構成されたオーディオデバイスを備え、
前記プロセッサーは、前記２人以上の参加者についての前記オーディオデータストリームにおいて検出された発言に基づき、前記関与スコアに発言識別子を加えるように構成されていることを特徴とする請求項１３に記載のシステム。
前記２人以上の参加者についての重みデータストリームであって、椅子の上の前記２人以上の参加者の各々の重み分布に対応する前記重みデータストリームを捕捉する重みセンサーを備え、
前記プロセッサーは、前記２人以上の参加者の各々の前記重み分布に基づき、前記関与スコアに重み分布識別子を加えるように構成されていることを特徴とする請求項１３に記載のシステム。
前記プロセッサーは、前記２人以上の参加者についての集団関与スコアを生成するように構成されていることを特徴とする請求項１３に記載のシステム。
前記関与スコア及び／又は前記集団関与スコアが所定の数又は割合を下回った場合に、前記２人以上の参加者の少なくとも１人に、リアルタイムでフィードバックを提供するように構成された、オーディオデバイス、ビジュアルデバイス、又はウェアラブルデバイス
を備えることを特徴とする請求項１６に記載のシステム。
２人以上の参加者が参加するミーティングにおける集団相互作用を改善するシステムであって、
前記２人以上の参加者の各々について、前記参加者の態度に基づき、関与した状態及び離脱した状態を含む前記ミーティングへの前記参加者の関与状態である個別関与状態を計算し、
前記２人以上の参加者の前記態度に基づき、前記ミーティングへの前記２人以上の参加者の関与状態である集団関与状態を計算し、
フィードバックを提供するように構成されたプロセッサーと、
前記２人以上の参加者についての少なくとも一つの三次元（３Ｄ）データストリームを捕捉するデータ入力モジュールと、
前記２人以上の参加者についての前記少なくとも一つの３Ｄデータストリームから、時系列の骨格データを抽出するモジュールと、
を備え、
前記プロセッサーは、
前記２人以上の参加者の各々についての前記時系列の骨格データを、複数の体位識別子に基づいて分類し、
前記２人以上の参加者の各々についての前記時系列の骨格データの前記分類に基づいて、前記２人以上の参加者の各々についての個別関与スコアを計算し、
前記フィードバックの提供は、
前記離脱した状態を有する前記参加者の数が第一の閾値を超えた場合は、前記参加者の前記個別関与状態に関わらず、前記参加者のすべてに対して集団警告を与えること、
前記離脱した状態を有する前記参加者の数が第二の閾値を超えない場合は、前記離脱した状態を有する前記参加者にのみ警告を与えること、及び
前記集団関与状態に従って、ミーティング室のシステムに環境的フィードバックを提供することを含み、
前記プロセッサーは、
前記２人以上の参加者の各々についての前記時系列の骨格データを前記複数の体位識別子に基づいて分類する際に、
前記時系列の骨格データに最大平均差異（ＭＭＤ）基準を適用し、連続するジェスチャーにおける変化点をジェスチャー遷移の初期推定切断部として検出し、
運動学的拘束を用いて前記初期推定切断部を正確なジェスチャー遷移位置に修正し、
確率密度推定を用いて２つの前記切断部間の手の動きを推定し、意図しない動作及び非ジェスチャーセグメントを除去することを特徴とするシステム。
前記フィードバックは、一定の時間フレームの間の前記参加者の前記態度に基づいて与えられることを特徴とする請求項１８に記載のシステム。
前記第一の閾値は前記第二の閾値よりも高いことを特徴とする請求項１８に記載のシステム。
前記離脱した状態を有する前記参加者の数が前記第一の閾値を超えた場合に、前記ミーティングをサポートする環境的フィードバックが提供されることを特徴とする請求項１８に記載のシステム。
前記集団関与状態における変化が第三の閾値よりも大きい場合に前記環境的フィードバックが提供されることを特徴とする請求項１８に記載のシステム。
前記２人以上の参加者についてのオーディオデータストリームを捕捉するように構成さ
れたオーディオデバイスを備え、
前記プロセッサーは、前記２人以上の参加者についての前記オーディオデータストリームにおいて検出された発言に基づき、前記個別関与スコアに発言識別子を加えるように構成されていることを特徴とする請求項１８に記載のシステム。
前記２人以上の参加者についての重みデータストリームであって、椅子の上の前記２人以上の参加者の各々の重み分布に対応する前記重みデータストリームを捕捉する重みセンサーを備え、
前記プロセッサーは、前記２人以上の参加者の各々の前記重み分布に基づき、前記個別関与スコアに重み分布識別子を加えるように構成されていることを特徴とする請求項２３に記載のシステム。
リアルタイムで前記フィードバックを提供するように構成された、オーディオデバイス、ビジュアルデバイス又はウェアラブルデバイスを備えることを特徴とする請求項２４に記載のシステム。