WO2023188217A1

WO2023188217A1 - 情報処理プログラム、情報処理方法、および情報処理装置

Info

Publication number: WO2023188217A1
Application number: PCT/JP2022/016364
Authority: WO
Inventors: 成幸小田嶋; 創輔山尾; 達也鈴木; 帆楊; 昇一桝井; 山姜
Original assignee: 富士通株式会社
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2023-10-05
Also published as: EP4502925A4; EP4502925A1; CN118974771A; US20250014389A1; JPWO2023188217A1

Abstract

情報処理装置（１００）は、時系列データにおける第１時点の骨格情報（１０１）に対応する対象者の動作の種類を特定する。情報処理装置（１００）は、第１時点の骨格情報（１０１）のうち、複数の部位のいずれかの部位の位置の時間変化を、特定した動作の種類に対応するいずれかの部位の動きの傾向に応じて制約する確率分布のモデルを決定する。情報処理装置（１００）は、時点ごとのそれぞれの部位の位置を示すノード（１１１）と、第１エッジ（１１２）と、第２エッジ（１１３）とを含み、第２エッジ（１１３）に、決定したモデルを対応付けたグラフ（１１０）を生成する。情報処理装置（１００）は、生成したグラフ（１１０）に基づいて、時系列データにおける第１時点の骨格情報（１０１）を修正する。

Description

情報処理プログラム、情報処理方法、および情報処理装置

　本発明は、情報処理プログラム、情報処理方法、および情報処理装置に関する。

　従来、スポーツ、ヘルスケア、または、エンターテインメントの分野において、人の動きを認識する技術が望まれる。例えば、深層学習を利用して、異なるアングルから撮像した多視点画像に基づいて、人のそれぞれの関節の３次元座標を特定する技術がある。

　先行技術としては、例えば、第１処理の結果の尤度と、第２処理の結果の尤度と、第３処理の結果の尤度とに基づいて、第１処理の結果、第２処理の結果、第３処理の結果のうち、いずれかの結果を、被写体の骨格認識結果として出力するものがある。また、例えば、被写体の距離画像から、被写体の複数の関節位置の尤度を複数方向から投影したヒートマップ画像を認識する技術がある。また、例えば、特徴点の位置候補と対象の多関節構造を用いた逆運動学に基づく最適化計算を行い、対象の各関節角を取得し、関節角を用いて順運動学計算を行い、対象の関節を含む特徴点の位置を取得する技術がある。また、例えば、リカレントニューラルネットワークを利用する行動検出の技術がある。

国際公開第２０２１／０６４９４２号国際公開第２０２１／００２０２５号特開２０２０－４２４７６号公報米国特許出願公開第２０１７／０３４４８２９号明細書

　しかしながら、従来技術では、人のそれぞれの関節の３次元座標を精度よく特定することが難しい場合がある。例えば、人の右手の関節の３次元座標を、人の左手の関節の３次元座標と誤認することがある。例えば、多視点画像に映った人以外の物体の一部の３次元座標を、人の関節の３次元座標と誤認することがある。

　１つの側面では、本発明は、対象者の部位の位置を精度よく特定可能にすることを目的とする。

　１つの実施態様によれば、対象者の複数の部位のそれぞれの部位の位置を含む骨格情報の時系列データを取得し、取得した前記時系列データにおける骨格情報の特徴量に基づいて、取得した前記時系列データにおける第１時点の骨格情報に対応する前記対象者の動作の種類を特定し、取得した前記時系列データにおける前記第１時点の骨格情報のうち、前記複数の部位のいずれかの部位の位置の時間変化を、特定した前記動作の種類に対応する前記いずれかの部位の動きの傾向に応じて制約する確率分布のモデルを決定し、時点ごとの前記それぞれの部位の位置を示すノードと、前記時点ごとの生体的に連結する異なる部位の位置を示すノード同士を接続する第１エッジと、異なる時点の前記いずれかの部位の位置を示すノード同士を接続する第２エッジとを含み、前記第２エッジに決定した前記モデルを対応付けたグラフを生成し、生成した前記グラフに基づいて、前記時系列データにおける前記第１時点の骨格情報を修正する情報処理プログラム、情報処理方法、および情報処理装置が提案される。

　一態様によれば、対象者の部位の位置を精度よく特定可能にすることが可能になる。

図１は、実施の形態にかかる情報処理方法の一実施例を示す説明図である。図２は、情報処理システム２００の一例を示す説明図である。図３は、情報処理装置１００のハードウェア構成例を示すブロック図である。図４は、画像撮像装置２０１のハードウェア構成例を示すブロック図である。図５は、情報処理装置１００の機能的構成例を示すブロック図である。図６は、情報処理装置１００の動作の流れを示す説明図である。図７は、異常関節を特定する具体例を示す説明図（その１）である。図８は、異常関節を特定する具体例を示す説明図（その２）である。図９は、Ｆａｃｔｏｒ　Ｇｒａｐｈを生成する具体例を示す説明図である。図１０は、「ジャンプ」に対応するＦａｃｔｏｒ　Ｇｒａｐｈの雛型９１１の具体例を示す説明図である。図１１は、「寝そべり」に対応するＦａｃｔｏｒ　Ｇｒａｐｈの雛型９１１の具体例を示す説明図である。図１２は、時系列制約を追加する具体例を示す説明図である。図１３は、３Ｄ骨格推論結果６０２を修正する具体例を示す説明図である。図１４は、動作例におけるデータ処理の流れの具体例を示す説明図（その１）である。図１５は、動作例におけるデータ処理の流れの具体例を示す説明図（その２）である。図１６は、全体処理手順の一例を示すフローチャートである。

　以下に、図面を参照して、本発明にかかる情報処理プログラム、情報処理方法、および情報処理装置の実施の形態を詳細に説明する。

（実施の形態にかかる情報処理方法の一実施例）
　図１は、実施の形態にかかる情報処理方法の一実施例を示す説明図である。情報処理装置１００は、対象者の部位の位置を精度よく特定可能にするためのコンピュータである。対象者は、例えば、人である。部位は、例えば、首、頭、右肩および左肩、右肘および左肘、右手および左手、右膝および左膝、右足および左足などである。部位は、例えば、関節である。位置は、例えば、３次元座標である。

　従来、深層学習を利用して、時点ごとに、異なるアングルから撮像した多視点画像に基づいて、人のそれぞれの関節の３次元座標を特定することにより、人のそれぞれの関節の３次元座標の時間変化を特定するための技術がある。

　具体的には、多視点画像のうち、人が映った領域を検出し、検出した領域に基づいて人のそれぞれの関節の２次元座標を特定し、アングルを考慮して、特定した２次元座標に基づいて、人のそれぞれの関節の３次元座標を特定することが考えられる。具体的には、人のそれぞれの関節の３次元座標を特定するにあたり、深層学習で学習したモデルが利用される。この技術の一例については、具体的には、下記参考文献１および下記参考文献２を参照することができる。

　参考文献１　：　Ｉｓｋａｋｏｖ，　Ｋａｒｉｍ，　ｅｔ　ａｌ．　“Ｌｅａｒｎａｂｌｅ　ｔｒｉａｎｇｕｌａｔｉｏｎ　ｏｆ　ｈｕｍａｎ　ｐｏｓｅ．”　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　ＩＥＥＥ／ＣＶＦ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｃｏｍｐｕｔｅｒ　Ｖｉｓｉｏｎ．　２０１９．

　参考文献２　：　Ｍｏｏｎ，　Ｇｙｅｏｎｇｓｉｋ，　Ｊｕ　Ｙｏｎｇ　Ｃｈａｎｇ，　ａｎｄ　Ｋｙｏｕｎｇ　Ｍｕ　Ｌｅｅ．　“Ｖ２ｖ－ｐｏｓｅｎｅｔ：　Ｖｏｘｅｌ－ｔｏ－ｖｏｘｅｌ　ｐｒｅｄｉｃｔｉｏｎ　ｎｅｔｗｏｒｋ　ｆｏｒ　ａｃｃｕｒａｔｅ　３ｄ　ｈａｎｄ　ａｎｄ　ｈｕｍａｎ　ｐｏｓｅ　ｅｓｔｉｍａｔｉｏｎ　ｆｒｏｍ　ａ　ｓｉｎｇｌｅ　ｄｅｐｔｈ　ｍａｐ．”　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　ＩＥＥＥ　ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　ｃｏｍｐｕｔｅｒ　ｖｉｓｉｏｎ　ａｎｄ　ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ．　２０１８．

　しかしながら、従来技術では、人のそれぞれの関節の３次元座標を精度よく特定することが難しい場合がある。例えば、異なる時点でも同一人のそれぞれの関節間の距離は一定であるものの、深層学習にてモデルを学習する際、人のそれぞれの関節間の距離が一定であることを考慮していない。このため、人のそれぞれの関節の３次元座標を精度よく特定することができず、人のそれぞれの関節の３次元座標の時間変化を精度よく特定することができない。

　人の動きを解析する解析者は、特定した人のそれぞれの関節の３次元座標を参照した際、人のそれぞれの関節の３次元座標が、直感的に誤っているという印象を覚えることになり易い。具体的には、解析者は、人の腕の長さが伸び縮みしているという印象を覚えることになる。また、具体的には、解析者は、人が出し得ない速度で人の腕が動いているという印象を覚えることになる。

　そこで、本実施の形態では、対象者の関節の位置を精度よく特定可能にすることができる情報処理方法について説明する。

　図１において、（１－１）情報処理装置１００は、骨格情報１０１の時系列データを取得する。骨格情報１０１は、例えば、対象者の複数の部位のそれぞれの部位の位置を含む。部位は、例えば、首、頭、右肩および左肩、右肘および左肘、右手および左手、右膝および左膝、右足および左足などである。部位は、例えば、関節である。図１の例では、部位は、具体的には、関節１と、関節２と、関節３となどである。位置は、例えば、３次元座標である。時系列データは、例えば、時点ごとの骨格情報１０１を含む。図１の例では、時系列データは、具体的には、時点Ｔの骨格情報１０１、時点Ｔ－１の骨格情報１０１などを含む。

　（１－２）情報処理装置１００は、取得した時系列データにおける骨格情報１０１の特徴量に基づいて、取得した時系列データにおける第１時点の骨格情報１０１に対応する対象者の動作の種類を特定する。動作の種類は、例えば、歩行、走行、ジャンプ、座り、寝そべり、ターンまたはスピンなどの横回転、あるいは、宙返りまたは鉄棒運動などの縦回転などである。特徴量は、例えば、骨格情報１０１が示す対象者のそれぞれの部位の位置であってもよい。特徴量は、例えば、異なる時点の骨格情報１０１が示す対象者のそれぞれの部位の位置の偏差であってもよい。特徴量は、例えば、骨格情報１０１が示す対象者の異なる部位の位置間の距離であってもよい。

　情報処理装置１００は、例えば、対象者の動作の種類を特定するための第１モデルを有する。第１モデルは、例えば、骨格情報１０１の特徴量の入力に応じて、対象者の動作の種類を判定可能にする機能を有する。情報処理装置１００は、第１モデルを利用して、取得した時系列データにおける第１時点の骨格情報１０１に対応する対象者の動作の種類を特定する。図１の例では、情報処理装置１００は、具体的には、取得した時系列データにおける第１時点の骨格情報１０１に対応する対象者の動作の種類として「寝そべり」を特定する。

　（１－３）情報処理装置１００は、取得した時系列データにおける第１時点の骨格情報１０１のうち、複数の部位のいずれかの部位の位置の時間変化を、特定した動作の種類に対応するいずれかの部位の動きの傾向に応じて制約する確率分布の第２モデルを決定する。動きの傾向は、例えば、等位置運動、等速運動、または、等加速運動の傾向である。図１の例では、情報処理装置１００は、具体的には、時点Ｔの骨格情報１０１において、関節１の位置の時間変化を、寝そべりに対応する等位置運動の傾向に応じて制約する確率分布の第２モデルを決定する。

　（１－４）情報処理装置１００は、時点ごとのそれぞれの部位の位置を示すノード１１１と、ノード１１１同士を接続する第１エッジ１１２と、ノード１１１同士を接続する第２エッジ１１３とを含むグラフ１１０を生成する。第１エッジ１１２は、時点ごとの生体的に連結する異なる部位の位置を示すノード１１１同士を接続する。第２エッジ１１３は、異なる時点のいずれかの部位の位置を示すノード１１１同士を接続する。

　情報処理装置１００は、グラフ１１０を生成する際、第２エッジ１１３に、決定した第２モデルを対応付ける。図１の例では、情報処理装置１００は、具体的には、時点Ｔ－１と時点Ｔとの対象者の関節１の位置を示すノード１１１同士を接続する第２エッジ１１３に、決定した第２モデルを対応付けて、グラフ１１０を生成する。

　（１－５）情報処理装置１００は、生成したグラフ１１０に基づいて、時系列データにおける第１時点の骨格情報１０１を修正する。情報処理装置１００は、例えば、時系列データにおける時点Ｔの骨格情報１０１に含まれる対象者の関節１の位置を修正する。これにより、情報処理装置１００は、対象者のそれぞれの関節の位置を精度よく特定することができる。情報処理装置１００は、対象者のそれぞれの関節の位置の時間変化を精度よく特定することができる。

　ここでは、情報処理装置１００が、第１モデルを利用して、対象者の動作の種類を特定する場合について説明したが、これに限らない。例えば、情報処理装置１００が、第１モデルを利用せずに、対象者の動作の種類を特定する場合があってもよい。

　ここでは、情報処理装置１００が、単独で動作する場合について説明したが、これに限らない。例えば、複数のコンピュータが協働して、情報処理装置１００としての機能を実現する場合があってもよい。具体的には、対象者の動作の種類を特定するコンピュータと、グラフ１１０を生成するコンピュータと、グラフ１１０に基づいて時系列データにおける第１時点の骨格情報１０１を修正するコンピュータとが協働する場合があってもよい。

（情報処理システム２００の一例）
　次に、図２を用いて、図１に示した情報処理装置１００を適用した、情報処理システム２００の一例について説明する。

　図２は、情報処理システム２００の一例を示す説明図である。図２において、情報処理システム２００は、情報処理装置１００と、１以上の画像撮像装置２０１と、１以上のクライアント装置２０２とを含む。

　情報処理システム２００において、情報処理装置１００と画像撮像装置２０１とは、有線または無線のネットワーク２１０を介して接続される。ネットワーク２１０は、例えば、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネットなどである。また、情報処理システム２００において、情報処理装置１００とクライアント装置２０２とは、有線または無線のネットワーク２１０を介して接続される。

　情報処理装置１００は、時点ごとに異なるアングルから対象者を撮像した複数の画像を、１以上の画像撮像装置２０１から取得する。情報処理装置１００は、時点ごとに、取得した複数の画像に基づいて、３次元空間における対象者のそれぞれの部位の存在確率の分布を特定し、対象者のそれぞれの部位の３次元座標を特定する。

　情報処理装置１００は、特定した対象者のそれぞれの部位の３次元座標に基づいて、時点ごとに、対象者の動作の種類を特定する。情報処理装置１００は、時点ごとに、特定した対象者の動作の種類に基づいて、対象者の複数の部位のうち、当該種類に対応するいずれかの部位を特定する。情報処理装置１００は、時点ごとに、特定した対象者の動作の種類に基づいて、特定したいずれかの部位の位置の時間変化を、当該種類に応じて制約する確率分布のモデルを決定する。

　情報処理装置１００は、特定したそれぞれの時点の対象者のそれぞれの部位の３次元座標を示すノードを含むグラフを生成する。情報処理装置１００は、グラフを生成する際、それぞれの時点について、生体的に連結する対象者の異なる部位の３次元座標を示すノード同士を接続する第１エッジがグラフに含まれるよう、グラフを生成する。

　情報処理装置１００は、グラフを生成する際、それぞれの時点について、特定したいずれかの部位に関する、当該時点と当該時点以外の他の時点との３次元座標を示すノード同士を接続する第２エッジがグラフに含まれるよう、グラフを生成する。ある時点以外の他の時点は、例えば、当該ある時点の直前の時点である。情報処理装置１００は、グラフに含まれる第２エッジに、決定したモデルを対応付ける。

　情報処理装置１００は、グラフを参照して、特定した対象者のそれぞれの部位の３次元座標を修正する。情報処理装置１００は、修正した対象者のそれぞれの部位の３次元座標を出力する。出力形式は、例えば、ディスプレイへの表示、プリンタへの印刷出力、他のコンピュータへの送信、または、記憶領域への記憶などである。情報処理装置１００は、例えば、修正した対象者のそれぞれの部位の３次元座標を、クライアント装置２０２に送信する。情報処理装置１００は、例えば、サーバ、または、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）などである。

　画像撮像装置２０１は、対象者を撮像するコンピュータである。画像撮像装置２０１は、複数の撮像素子を有するカメラを含み、カメラによって対象者を撮像する。画像撮像装置２０１は、対象者を撮像した画像を生成し、情報処理装置１００に送信する。画像撮像装置２０１は、例えば、スマートフォンなどである。画像撮像装置２０１は、例えば、定点カメラなどであってもよい。画像撮像装置２０１は、例えば、ドローンなどであってもよい。

　クライアント装置２０２は、対象者のそれぞれの部位の３次元座標を、情報処理装置１００から受信する。クライアント装置２０２は、受信した対象者のそれぞれの部位の３次元座標を、利用者が参照可能に出力する。クライアント装置２０２は、例えば、受信した対象者のそれぞれの部位の３次元座標を、ディスプレイに表示する。クライアント装置２０２は、例えば、ＰＣ、タブレット端末、または、スマートフォンなどである。

　ここでは、情報処理装置１００が、画像撮像装置２０１とは異なる装置である場合について説明したが、これに限らない。例えば、情報処理装置１００が、画像撮像装置２０１としての機能を有し、画像撮像装置２０１としても動作する場合があってもよい。ここでは、情報処理装置１００が、クライアント装置２０２とは異なる装置である場合について説明したが、これに限らない。例えば、情報処理装置１００が、クライアント装置２０２としての機能を有し、クライアント装置２０２としても動作する場合があってもよい。

（情報処理装置１００のハードウェア構成例）
　次に、図３を用いて、情報処理装置１００のハードウェア構成例について説明する。

　図３は、情報処理装置１００のハードウェア構成例を示すブロック図である。図３において、情報処理装置１００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）３０１と、メモリ３０２と、ネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）３０３と、記録媒体Ｉ／Ｆ３０４と、記録媒体３０５とを有する。情報処理装置１００は、さらに、ディスプレイ３０６と、入力装置３０７とを有する。また、各構成部は、バス３００によってそれぞれ接続される。

　ここで、ＣＰＵ３０１は、情報処理装置１００の全体の制御を司る。メモリ３０２は、例えば、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）およびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭやＲＯＭが各種プログラムを記憶し、ＲＡＭがＣＰＵ３０１のワークエリアとして使用される。メモリ３０２に記憶されるプログラムは、ＣＰＵ３０１にロードされることにより、コーディングされている処理をＣＰＵ３０１に実行させる。

　ネットワークＩ／Ｆ３０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して他のコンピュータに接続される。そして、ネットワークＩ／Ｆ３０３は、ネットワーク２１０と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。ネットワークＩ／Ｆ３０３は、例えば、モデムやＬＡＮアダプタなどである。

　記録媒体Ｉ／Ｆ３０４は、ＣＰＵ３０１の制御に従って記録媒体３０５に対するデータのリード／ライトを制御する。記録媒体Ｉ／Ｆ３０４は、例えば、ディスクドライブ、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポートなどである。記録媒体３０５は、記録媒体Ｉ／Ｆ３０４の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体３０５は、例えば、ディスク、半導体メモリ、ＵＳＢメモリなどである。記録媒体３０５は、情報処理装置１００から着脱可能であってもよい。

　ディスプレイ３０６は、カーソル、アイコン、ツールボックス、文書、画像、または、機能情報などのデータを表示する。ディスプレイ３０６は、例えば、ＣＲＴ（Ｃａｔｈｏｄｅ　Ｒａｙ　Ｔｕｂｅ）、液晶ディスプレイ、または、有機ＥＬ（Ｅｌｅｃｔｒｏｌｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイなどである。入力装置３０７は、文字、数字、または、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置３０７は、例えば、キーボード、または、マウスなどである。入力装置３０７は、例えば、タッチパネル式の入力パッド、または、テンキーなどであってもよい。

　情報処理装置１００は、上述した構成部の他、例えば、カメラなどを有してもよい。また、情報処理装置１００は、上述した構成部の他、例えば、プリンタ、スキャナ、マイク、または、スピーカーなどを有してもよい。また、情報処理装置１００は、記録媒体Ｉ／Ｆ３０４および記録媒体３０５を複数有していてもよい。また、情報処理装置１００は、ディスプレイ３０６、または、入力装置３０７などを有していなくてもよい。また、情報処理装置１００は、記録媒体Ｉ／Ｆ３０４および記録媒体３０５を有していなくてもよい。

（画像撮像装置２０１のハードウェア構成例）
　次に、図４を用いて、画像撮像装置２０１のハードウェア構成例について説明する。

　図４は、画像撮像装置２０１のハードウェア構成例を示すブロック図である。図４において、画像撮像装置２０１は、ＣＰＵ４０１と、メモリ４０２と、ネットワークＩ／Ｆ４０３と、記録媒体Ｉ／Ｆ４０４と、記録媒体４０５と、カメラ４０６とを有する。また、各構成部は、バス４００によってそれぞれ接続される。

　ここで、ＣＰＵ４０１は、画像撮像装置２０１の全体の制御を司る。メモリ４０２は、例えば、ＲＯＭ、ＲＡＭおよびフラッシュＲＯＭなどを有する。具体的には、例えば、フラッシュＲＯＭやＲＯＭが各種プログラムを記憶し、ＲＡＭがＣＰＵ４０１のワークエリアとして使用される。メモリ４０２に記憶されるプログラムは、ＣＰＵ４０１にロードされることにより、コーディングされている処理をＣＰＵ４０１に実行させる。

　ネットワークＩ／Ｆ４０３は、通信回線を通じてネットワーク２１０に接続され、ネットワーク２１０を介して他のコンピュータに接続される。そして、ネットワークＩ／Ｆ４０３は、ネットワーク２１０と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。ネットワークＩ／Ｆ４０３は、例えば、モデムやＬＡＮアダプタなどである。

　記録媒体Ｉ／Ｆ４０４は、ＣＰＵ４０１の制御に従って記録媒体４０５に対するデータのリード／ライトを制御する。記録媒体Ｉ／Ｆ４０４は、例えば、ディスクドライブ、ＳＳＤ、ＵＳＢポートなどである。記録媒体４０５は、記録媒体Ｉ／Ｆ４０４の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体４０５は、例えば、ディスク、半導体メモリ、ＵＳＢメモリなどである。記録媒体４０５は、画像撮像装置２０１から着脱可能であってもよい。カメラ４０６は、複数の撮像素子を有し、複数の撮像素子によって対象物を撮像した画像を生成する。カメラ４０６は、例えば、競技用カメラである。カメラ４０６は、例えば、監視カメラである。

　画像撮像装置２０１は、上述した構成部の他、例えば、キーボード、マウス、ディスプレイ、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、画像撮像装置２０１は、記録媒体Ｉ／Ｆ４０４や記録媒体４０５を複数有していてもよい。また、画像撮像装置２０１は、記録媒体Ｉ／Ｆ４０４や記録媒体４０５を有していなくてもよい。

（クライアント装置２０２のハードウェア構成例）
　クライアント装置２０２のハードウェア構成例は、具体的には、図３に示した情報処理装置１００のハードウェア構成例と同様であるため、説明を省略する。

（情報処理装置１００の機能的構成例）
　次に、図５を用いて、情報処理装置１００の機能的構成例について説明する。

　図５は、情報処理装置１００の機能的構成例を示すブロック図である。情報処理装置１００は、記憶部５００と、取得部５０１と、解析部５０２と、学習部５０３と、特定部５０４と、決定部５０５と、生成部５０６と、修正部５０７と、出力部５０８とを含む。

　記憶部５００は、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域によって実現される。以下では、記憶部５００が、情報処理装置１００に含まれる場合について説明するが、これに限らない。例えば、記憶部５００が、情報処理装置１００とは異なる装置に含まれ、記憶部５００の記憶内容が情報処理装置１００から参照可能である場合があってもよい。

　取得部５０１～出力部５０８は、制御部の一例として機能する。取得部５０１～出力部５０８は、具体的には、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域に記憶されたプログラムをＣＰＵ３０１に実行させることにより、または、ネットワークＩ／Ｆ３０３により、その機能を実現する。各機能部の処理結果は、例えば、図３に示したメモリ３０２や記録媒体３０５などの記憶領域に記憶される。

　記憶部５００は、各機能部の処理において参照され、または更新される各種情報を記憶する。記憶部５００は、例えば、連続する複数の時点のそれぞれの時点において特定の者を異なるアングルから撮像した複数の画像を記憶する。アングルは、撮像位置を示す。画像は、例えば、取得部５０１によって取得される。

　記憶部５００は、例えば、骨格情報の時系列データを記憶する。時系列データは、連続する複数の時点のそれぞれの時点における骨格情報を含む。骨格情報は、特定の者の複数の部位のそれぞれの部位の位置を含む。部位は、例えば、関節である。部位は、例えば、首、頭、右肩および左肩、右肘および左肘、右手および左手、右膝および左膝、右足および左足などである。位置は、例えば、３次元座標である。時系列データは、例えば、取得部５０１によって取得される。時系列データは、例えば、解析部５０２によって生成されてもよい。

　取得部５０１は、各機能部の処理に用いられる各種情報を取得する。取得部５０１は、取得した各種情報を、記憶部５００に記憶し、または、各機能部に出力する。また、取得部５０１は、記憶部５００に記憶しておいた各種情報を、各機能部に出力してもよい。取得部５０１は、例えば、利用者の操作入力に基づき、各種情報を取得する。取得部５０１は、例えば、情報処理装置１００とは異なる装置から、各種情報を受信してもよい。

　取得部５０１は、例えば、対象者の骨格情報の時系列データを取得する。対象者の骨格情報は、例えば、対象者の複数の部位のそれぞれの部位の位置を含む。取得部５０１は、具体的には、利用者の操作入力に基づき、対象者の骨格情報の時系列データの入力を受け付けることにより、対象者の骨格情報の時系列データを取得する。取得部５０１は、具体的には、対象者の骨格情報の時系列データを、他のコンピュータから受信することにより取得してもよい。

　取得部５０１は、例えば、過去の被験者の骨格情報の時系列データを取得してもよい。被験者は、例えば、対象者と同一であってもよい。被験者の骨格情報は、例えば、被験者の複数の部位のそれぞれの部位の位置を含む。取得部５０１は、具体的には、利用者の操作入力に基づき、被験者の骨格情報の時系列データの入力を受け付けることにより、被験者の骨格情報の時系列データを取得する。取得部５０１は、具体的には、被験者の骨格情報の時系列データを、他のコンピュータから受信することにより取得してもよい。

　取得部５０１は、例えば、過去の被験者の骨格情報の時系列データにおけるそれぞれの骨格情報に対応する被験者の動作の種類を取得してもよい。動作の種類は、例えば、歩行、走行、ジャンプ、座り、寝そべり、ターンまたはスピンなどの横回転、あるいは、宙返りまたは鉄棒運動などの縦回転などである。取得部５０１は、具体的には、利用者の操作入力に基づき、過去の被験者の骨格情報の時系列データにおけるそれぞれの骨格情報に対応する被験者の動作の種類の入力を受け付けることにより、被験者の動作の種類を取得する。取得部５０１は、具体的には、過去の被験者の骨格情報の時系列データにおけるそれぞれの骨格情報に対応する被験者の動作の種類を、他のコンピュータから受信することにより取得してもよい。

　取得部５０１は、例えば、連続する複数の時点のそれぞれの時点において対象者を異なるアングルから撮像した複数の画像を取得する。取得部５０１は、対象者の骨格情報の時系列データを取得せずに解析部５０２で生成する場合、複数の画像を取得する。これにより、取得部５０１は、対象者の骨格情報の時系列データを解析部５０２で生成可能にすることができる。

　取得部５０１は、例えば、連続する複数の時点のそれぞれの時点において被験者を異なるアングルから撮像した複数の画像を取得してもよい。取得部５０１は、被験者の骨格情報の時系列データを取得せずに解析部５０２で生成する場合、複数の画像を取得する。これにより、取得部５０１は、被験者の骨格情報の時系列データを解析部５０２で生成可能にすることができる。

　取得部５０１は、いずれかの機能部の処理を開始する開始トリガーを受け付けてもよい。開始トリガーは、例えば、利用者による所定の操作入力があったことである。開始トリガーは、例えば、他のコンピュータから、所定の情報を受信したことであってもよい。開始トリガーは、例えば、いずれかの機能部が所定の情報を出力したことであってもよい。

　取得部５０１は、例えば、複数の画像を取得したことを、解析部５０２の処理を開始する開始トリガーとして受け付けてもよい。取得部５０１は、例えば、被験者の骨格情報の時系列データを取得したことを、学習部５０３の処理を開始する開始トリガーとして受け付けてもよい。取得部５０１は、例えば、対象者の骨格情報の時系列データを取得したことを、特定部５０４と決定部５０５と生成部５０６と修正部５０７との処理を開始する開始トリガーとして受け付けてもよい。

　解析部５０２は、所定の者の骨格情報の時系列データを生成する。解析部５０２は、例えば、対象者の骨格情報の時系列データを生成する。解析部５０２は、具体的には、複数の時点のそれぞれの時点において対象者を異なるアングルから撮像した複数の画像に基づいて、それぞれの時点における対象者のそれぞれの部位の位置を推定し、推定した位置を含む対象者の骨格情報を生成する。解析部５０２は、具体的には、生成した対象者の骨格情報に基づいて、対象者の骨格情報の時系列データを生成する。これにより、解析部５０２は、それぞれの時点における対象者のそれぞれの部位の位置を仮に特定することができ、修正対象を得ることができる。

　解析部５０２は、例えば、被験者の骨格情報の時系列データを生成してもよい。解析部５０２は、具体的には、複数の時点のそれぞれの時点において被験者を異なるアングルから撮像した複数の画像に基づいて、それぞれの時点における被験者の骨格情報を生成し、被験者の骨格情報の時系列データを生成する。解析部５０２は、生成した被験者の骨格情報の時系列データにノイズを加えてもよい。解析部５０２は、被験者の骨格情報を、学習モデルを生成するための教師情報に設定する。これにより、解析部５０２は、学習モデルを生成するための教師情報を得ることができる。

　学習部５０３は、被験者の複数の部位のそれぞれの部位の位置を含む教師情報に基づいて、第１学習モデルを学習する。第１学習モデルは、所定の者の骨格情報の時系列データにおける骨格情報に関する特徴量に応じて、所定の者の複数の部位のうち、位置に関して異常な状態であるいずれかの部位を特定可能にする機能を有する。第１学習モデルは、例えば、所定の者のそれぞれの部位が、位置に関して異常な状態であるか否かを判定可能にする機能を有する。

　第１学習モデルは、具体的には、所定の者のそれぞれの部位が、位置に関して異常な状態である確率の大きさを示す指標値を算出する機能を有する。第１学習モデルは、より具体的には、骨格情報に関する特徴量が入力されたことに応じて、所定の者のそれぞれの部位について、当該部位が位置に関して異常な状態である確率の大きさを示す指標値を出力する。第１学習モデルは、具体的には、ニューラルネットワークである。これにより、学習部５０３は、対象者の複数の部位のうち、位置に関して異常な状態であるいずれかの部位を特定可能にすることができる。

　学習部５０３は、被験者の複数の部位のそれぞれの部位の位置を含む教師情報に基づいて、第２学習モデルを学習する。第２学習モデルは、所定の者の骨格情報の時系列データにおける骨格情報に関する特徴量に応じて、所定の者の骨格情報の時系列データにおけるそれぞれの骨格情報に対応する所定の者の動作の種類を特定可能にする機能を有する。

　第２学習モデルは、具体的には、時系列データにおける骨格情報に関する特徴量が入力されたことに応じて、時系列データにおけるいずれかの骨格情報に対応する所定の者の動作の種類となり得る候補ごとの確からしさを示す指標値を出力する。第２学習モデルは、具体的には、ニューラルネットワークである。これにより、学習部５０３は、対象者の動作の種類を特定可能にすることができる。

　特定部５０４は、取得した時系列データにおける骨格情報の特徴量に基づいて、取得した時系列データにおける第１時点の骨格情報に対応する対象者の動作の種類を特定する。特定部５０４は、例えば、学習した第２学習モデルを利用して、取得した対象者の骨格情報の時系列データにおける骨格情報に関する特徴量に基づいて、第１時点の骨格情報に対応する対象者の動作の種類を特定する。

　特定部５０４は、具体的には、第２学習モデルに、対象者の骨格情報の時系列データにおける骨格情報に関する特徴量を入力することにより、第１時点の骨格情報に対応する対象者の動作の種類となり得る候補ごとの確からしさを示す指標値を算出する。特定部５０４は、具体的には、算出した指標値に基づいて、第１時点の骨格情報に対応する対象者の動作の種類を特定する。特定部５０４は、より具体的には、算出した指標値が最も大きい候補を、対象者の動作の種類として特定する。これにより、特定部５０４は、対象者の複数の部位のそれぞれの部位の位置を修正する指針を得ることができる。特定部５０４は、対象者のいずれの部位の位置を修正することが好ましいかを判別可能にすることができる。

　特定部５０４は、対象者の複数の部位のうち、位置に関して異常な状態である異常部位を特定する。特定部５０４は、取得した対象者の骨格情報の時系列データにおける骨格情報に関する特徴量に基づいて、取得した対象者の骨格情報の時系列データにおける第１時点の骨格情報について、位置に関して異常な状態である異常部位を特定する。特定部５０４は、例えば、学習した第１学習モデルを利用して、取得した対象者の骨格情報の時系列データにおける骨格情報に関する特徴量に基づいて、第１時点の骨格情報について、位置に関して異常な状態である異常部位を特定する。

　特定部５０４は、具体的には、第１学習モデルに、対象者の骨格情報の時系列データにおける骨格情報に関する特徴量を入力することにより、第１時点の骨格情報について、対象者のそれぞれの部位の異常な状態である確率の大きさを示す指標値を算出する。特定部５０４は、具体的には、算出した指標値に基づいて、第１時点の骨格情報について、位置に関して異常な状態である異常部位を特定する。特定部５０４は、より具体的には、対象者の複数の部位のうち、算出した指標値が閾値以上である部位を、位置に関して異常な状態である異常部位として特定する。これにより、特定部５０４は、対象者の複数の部位のそれぞれの部位の位置を修正する指針を得ることができる。特定部５０４は、対象者のいずれの部位の位置を修正することが好ましいかを判別可能にすることができる。

　決定部５０５は、取得した時系列データにおける第１時点の骨格情報のうち、複数の部位のうち、特定した動作の種類に対応するいずれかの部位の位置の時間変化を制約する確率分布の分布モデルを決定する。分布モデルは、例えば、特定した動作の種類に対応するいずれかの部位の動きの傾向に応じて、特定した動作の種類に対応するいずれかの部位の位置の時間変化を制約するためのモデルである。動きの傾向は、例えば、等位置運動、等速運動、または、等加速運動などの傾向である。これにより、決定部５０５は、特定部５０４で特定した部位の位置を修正する指針を得ることができる。

　生成部５０６は、時点ごとのそれぞれの部位の位置を示すノードと、第１エッジと、第２エッジとを含むグラフを生成する。第１エッジは、時点ごとの生体的に連結する異なる部位の位置を示すノード同士を接続する。第２エッジは、異なる時点における、特定した動作の種類に対応するいずれかの部位の位置を示すノード同士を接続する。生成部５０６は、グラフを生成する際、第２エッジに、決定した分布モデルを対応付ける。これにより、生成部５０６は、対象者の骨格情報の時系列データにおける第１時点の骨格情報を修正可能にすることができる。

　生成部５０６は、複数の部位のうち、特定した動作の種類に対応するいずれかの部位以外の他の部位の位置を示すノード同士を接続する第３エッジを、さらにグラフに含めるよう、グラフを生成してもよい。生成部５０６は、例えば、異なる時点の他の部位の位置を示すノードそれぞれに接続された第１エッジが１つずつであれば、当該ノード同士を接続する第３エッジを、グラフに含めるよう、グラフを生成する。これにより、生成部５０６は、対象者の骨格情報の時系列データにおける第１時点の骨格情報を精度よく修正可能にすることができる。生成部５０６は、例えば、他の部位の位置を精度よく修正可能にすることができる。

　生成部５０６は、複数の部位のうち、特定した動作の種類に対応するいずれかの部位以外に、異常部位であると特定した他の部位の位置を示すノード同士を接続する第３エッジを、さらにグラフに含めるよう、グラフを生成してもよい。生成部５０６は、例えば、異なる時点の他の部位の位置を示すノードそれぞれに接続された第１エッジが１つずつであれば、当該ノード同士を接続する第３エッジを、グラフに含めるよう、グラフを生成する。これにより、生成部５０６は、対象者の骨格情報の時系列データにおける第１時点の骨格情報を精度よく修正可能にすることができる。生成部５０６は、例えば、異常部位であると判断された他の部位の位置を精度よく修正可能にすることができる。

　修正部５０７は、生成したグラフに基づいて、対象者の骨格情報の時系列データにおける第１時点の骨格情報を修正する。修正部５０７は、例えば、生成したグラフを最適化することにより、対象者の骨格情報の時系列データにおける第１時点の骨格情報を修正する。これにより、修正部５０７は、対象者の動作の種類を考慮して、対象者のそれぞれの部位の位置を精度よく特定可能にすることができる。修正部５０７は、対象者のそれぞれの部位の異常な状態である確率の大きさを考慮して、対象者のそれぞれの部位の位置を精度よく特定可能にすることができる。

　出力部５０８は、少なくともいずれかの機能部の処理結果を出力する。出力形式は、例えば、ディスプレイへの表示、プリンタへの印刷出力、ネットワークＩ／Ｆ３０３による外部装置への送信、または、メモリ３０２や記録媒体３０５などの記憶領域への記憶である。これにより、出力部５０８は、少なくともいずれかの機能部の処理結果を利用者に通知可能にし、情報処理装置１００の利便性の向上を図ることができる。

　出力部５０８は、例えば、修正部５０７で修正した第１時点の骨格情報を出力する。出力部５０８は、具体的には、修正部５０７で修正した第１時点の骨格情報を、クライアント装置２０２に送信する。出力部５０８は、具体的には、修正部５０７で修正した第１時点の骨格情報を、ディスプレイに表示する。これにより、出力部５０８は、対象者のそれぞれの部位の位置を利用可能にすることができる。

（情報処理装置１００の動作例）
　次に、図６～図１５を用いて、情報処理装置１００の動作例について説明する。まず、例えば、図６を用いて、情報処理装置１００の動作の流れについて説明する。

　図６は、情報処理装置１００の動作の流れを示す説明図である。図６において、情報処理装置１００は、異なる時点における対象者を異なるアングルで撮像した複数の多視点画像６００を取得する。情報処理装置１００は、複数の多視点画像６００のそれぞれの多視点画像６００に対して、人検出処理を実施することにより、それぞれの多視点画像６００のうち対象者が映った領域を検出する。

　情報処理装置１００は、時点ごとに、それぞれの多視点画像６００に対して、２Ｄ（Ｄｉｍｅｎｓｉｏｎ）ｐｏｓｅ推定処理を実施する。情報処理装置１００は、時点ごとに、それぞれの多視点画像６００に対して、２Ｄｐｏｓｅ推定処理を実施することにより、それぞれの多視点画像６００における対象者のそれぞれの関節の存在確率の分布を示す２Ｄヒートマップ６０１を生成する。２Ｄヒートマップ６０１は、例えば、多視点画像６００に対応する２Ｄ空間のそれぞれの点における、対象者のいずれかの関節の存在確率を示す関節尤度を含む。

　情報処理装置１００は、時点ごとに、それぞれの多視点画像６００における対象者のそれぞれの関節の存在確率の分布を示す２Ｄヒートマップ６０１に基づいて、当該多視点画像６００における、対象者の当該関節の２Ｄ座標を特定する。２Ｄヒートマップ６０１における、対象者の関節の存在確率を示す関節尤度の分散は、特定した２Ｄ座標の精度を表す指標値として扱うことができる。

　情報処理装置１００は、時点ごとに、それぞれの多視点画像６００のアングルを示す配置情報を取得する。情報処理装置１００は、時点ごとに、配置情報と、それぞれの多視点画像６００における、対象者のそれぞれの関節の２Ｄ座標とに基づいて、３Ｄｐｏｓｅ推定処理を実施することにより、３Ｄ空間における、対象者のそれぞれの関節の３Ｄ座標を特定する。情報処理装置１００は、時点ごとに、特定した対象者のそれぞれの関節の３Ｄ座標を含む３Ｄ骨格推論結果６０２を生成し、３Ｄ骨格推論結果６０２の時系列データを生成する。

　情報処理装置１００は、３Ｄ骨格推論結果６０２の時系列データに対して、修正処理を実施することにより、３Ｄ骨格推論結果６０２を修正する。情報処理装置１００は、修正した後の３Ｄ骨格推論結果６０３の時系列データを利用可能に出力する。情報処理装置１００は、例えば、修正した後の３Ｄ骨格推論結果６０３の時系列データを、利用者が参照可能に出力する。

　利用者は、修正した後の３Ｄ骨格推論結果６０３の時系列データに基づいて、所定の解析処理を実施する。具体的には、対象者が、運動の大会の参加者である場合が考えられる。この場合、解析処理は、例えば、運動の大会の競技における参加者の採点である。利用者は、修正した後の３Ｄ骨格推論結果６０３の時系列データに基づいて、参加者を採点する解析処理を実施する。

　具体的には、対象者が、リハビリテーションを実施する医療機関受診者、または、歩行能力などの運動能力の診断を受ける医療機関受診者などである場合が考えられる。この場合、解析処理は、例えば、リハビリテーションの効果判定、あるいは、運動能力または健康状態の診断などである。利用者は、修正した後の３Ｄ骨格推論結果６０３の時系列データに基づいて、医療機関受診者のリハビリテーションの効果判定を実施し、または、医療機関受診者の運動能力または健康状態の診断を実施する。

　情報処理装置１００は、修正した後の３Ｄ骨格推論結果６０３の時系列データに基づいて、上述した解析処理を実施してもよい。情報処理装置１００は、解析処理を実施した結果を、利用者が参照可能に出力する。情報処理装置１００は、修正した後の３Ｄ骨格推論結果６０３の時系列データを、上述した解析処理を実施する解析部５０２に出力してもよい。解析部５０２は、例えば、情報処理装置１００以外の他のコンピュータが有する。これにより、情報処理装置１００は、解析処理を精度よく実施可能にすることができる。

　次に、図７～図１５を用いて、修正処理の具体例について説明する。具体的には、まず、図７および図８を用いて、情報処理装置１００が、対象者の複数の関節のうち、３Ｄ座標に関して異常な状態であると判断される異常関節を特定する具体例について説明する。

　図７および図８は、異常関節を特定する具体例を示す説明図である。図７において、情報処理装置１００は、複数の元データ７００の時系列データを取得する。元データ７００は、被験者の骨格情報を示す。元データ７００は、被験者の複数の関節のそれぞれの関節の３Ｄ座標を示す。関節の３Ｄ座標は、例えば、図中の●である。

　情報処理装置１００は、元データ７００にノイズを付与することにより、加工データ７０１を生成する。情報処理装置１００は、例えば、元データ７００が示す被験者の複数の関節の少なくともいずれかの関節の３Ｄ座標を、異常な状態であると判断される３Ｄ座標に変更することにより、加工データ７０１を生成する。異常な状態は、例えば、関節の３Ｄ座標を誤って推定した状態に対応する。異常な状態は、具体的には、ｊｉｔｔｅｒ、ｉｎｖｅｒｓｉｏｎ、ｓｗａｐ、または、ｍｉｓｓなどである。これにより、情報処理装置１００は、加工データ７０１の時系列データを取得することができる。

　情報処理装置１００は、加工データ７０１の時系列データを利用して、異常判定ＤＮＮ７１０を学習する。異常判定ＤＮＮ７１０は、例えば、３Ｄ骨格推論結果６０２の時系列データにおける３Ｄ骨格推論結果６０２の特徴量の入力に応じて、少なくともいずれかの３Ｄ骨格推論結果６０２における、対象者のそれぞれの関節の異常確率を出力する機能を有する。異常確率は、対象者の関節の３Ｄ座標が、位置的に異常な状態である確率の大きさを示す。

　異常判定ＤＮＮ７１０は、例えば、３Ｄ骨格推論結果６０２の時系列データにおける３Ｄ骨格推論結果６０２の特徴量の入力に応じて、当該時系列データ全体における、対象者のそれぞれの関節の異常確率を出力する機能を有していてもよい。次に、図８の説明に移行する。

　図８において、情報処理装置１００は、３Ｄ骨格推論結果６０２の時系列データにおける３Ｄ骨格推論結果６０２の特徴量を、異常判定ＤＮＮ７１０に入力する。情報処理装置１００は、入力に応じて異常判定ＤＮＮ７１０が出力した、それぞれの３Ｄ骨格推論結果６０２における、対象者のそれぞれの関節の異常確率を取得する。情報処理装置１００は、取得した対象者のそれぞれの関節の異常確率に基づいて、異常関節を特定する。情報処理装置１００は、例えば、対象者の複数の関節のうち、取得した異常確率が閾値以上であるいずれかの関節を、異常関節として特定する。

　ここでは、情報処理装置１００が、異常判定ＤＮＮ７１０を利用して、異常関節を特定する場合について説明したが、これに限らない。例えば、情報処理装置１００が、ルールベースで異常関節を特定する場合があってもよい。具体的には、情報処理装置１００は、３Ｄ骨格推論結果６０２において、それぞれの関節に関する特徴量と閾値との差分の大きさに応じて、当該関節の異常確率を算出するルールを記憶しておいてもよい。具体的には、情報処理装置１００は、記憶したルールを参照して、それぞれの関節の異常確率を算出し、算出した異常確率が閾値以上であるいずれかの関節を、異常関節であると特定することが考えられる。次に、図９を用いて、情報処理装置１００が、Ｆａｃｔｏｒ　Ｇｒａｐｈを生成する具体例について説明する。

　図９は、Ｆａｃｔｏｒ　Ｇｒａｐｈを生成する具体例を示す説明図である。図９において、情報処理装置１００は、状態推定ＤＮＮ９００を有する。状態推定ＤＮＮ９００は、３Ｄ骨格推論結果６０２の時系列データにおける３Ｄ骨格推論結果６０２の特徴量の入力に応じて、少なくともいずれかの３Ｄ骨格推論結果６０２における対象者の運動の種類を出力する機能を有する。

　状態推定ＤＮＮ９００は、例えば、３Ｄ骨格推論結果６０２の時系列データにおける３Ｄ骨格推論結果６０２の特徴量の入力に応じて、当該時系列データ全体における、対象者の運動の種類を出力する機能を有していてもよい。

　情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ（ＤａｔａＢａｓｅ）９１０を有する。Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ９１０は、対象者の運動の種類ごとに、Ｆａｃｔｏｒ　Ｇｒａｐｈの雛型９１１を記憶する。雛型９１１は、例えば、対象者のそれぞれの関節の位置を示すノードと、生体的に連結する異なる関節の位置を示すノード同士を接続する第１エッジと、異なる時点の同一の関節の位置を示すノード同士を接続する第２エッジとによって形成される。第１エッジは、関節間距離の制約が対応付けられていてもよい。関節間距離は、例えば、骨の長さである。

　Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ９１０は、具体的には、運動の種類「ジャンプ」に対応する雛型９１１と、運動の種類「寝そべり」に対応する雛型９１１となどを記憶する。第２エッジは、例えば、対象者の運動の種類ごとに、対象者の運動の種類に対応するいずれかの関節の位置を示すノード同士を接続する。換言すれば、第２エッジは、例えば、対象者の運動の種類ごとに異なる関節の位置を示すノード同士を接続する。

　第２エッジは、分布モデルが対応付けられる。いずれかの関節の位置を示すノード同士を接続する第２エッジは、運動の種類に対応する当該いずれかの関節の動きの傾向に応じて、当該いずれかの関節の位置の時間変化を制約する確率分布を示す分布モデルが対応付けられる。傾向は、例えば、運動の種類が「ジャンプ」であれば、等速直線運動に対応する。傾向は、例えば、運動の種類が「寝そべり」であれば、等位置運動に対応する。

　情報処理装置１００は、状態推定ＤＮＮ９００を利用して、それぞれの３Ｄ骨格推論結果６０２における、対象者の運動の種類を特定する。情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ９１０を参照して、それぞれの３Ｄ骨格推論結果６０２における、対象者の運動の種類に対応する雛型９１１を、利用するＦａｃｔｏｒ　Ｇｒａｐｈとして選択する。次に、図１０および図１１を用いて、Ｆａｃｔｏｒ　Ｇｒａｐｈの雛型９１１の具体例について説明する。

　図１０は、「ジャンプ」に対応するＦａｃｔｏｒ　Ｇｒａｐｈの雛型９１１の具体例を示す説明図である。雛型９１１は、例えば、対象者のそれぞれの関節の位置を示すノードを含む。雛型９１１は、具体的には、対象者の頭部、上部頸椎、下部頸椎、胸椎、腰椎、左右股関節、左右膝関節、左右脚関節、左右足部、左右肩関節、左右肘関節、左右手首、左右手のそれぞれの位置を示すノードを含む。

　図１０の例では、異なる時点の対象者の下部頸椎の位置を示すノード同士が、第２エッジ１００１で接続される。また、異なる時点の対象者の胸椎の位置を示すノード同士が、第２エッジ１００１で接続される。また、異なる時点の対象者の腰椎の位置を示すノード同士が、第２エッジ１００１で接続される。

　また、異なる時点の対象者の左股関節の位置を示すノード同士が、第２エッジ１００１で接続される。また、異なる時点の対象者の右股関節の位置を示すノード同士が、第２エッジ１００１で接続される。それぞれの第２エッジは、等速直線運動に対応する時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍの分布モデルが対応付けられる。

　Ｐａｉｒｗｉｓｅ　Ｔｅｒｍは、例えば、ｇ_t（ｘ^j,t-1，ｘ^j,t）～Ｎ（｜｜ｘ^j,t-1，ｘ^j,t｜｜┃ｖ_j＾Δｔ，Σ_vj＾）である。ｘ^j,t-1は、時刻ｔ－１の関節の推定位置である。ｘ^j,tは、時刻ｔの関節の推定位置である。ｖ_j＾は、関節の平均速度である。Δｔは、単位時間幅である。Σ_vj＾は、関節の速度分散である。ここで、運動の種類が「ジャンプ」である場合、体幹部分の関節の位置の時間変化が規則的になり易いと考えられる。これに対し、雛型９１１は、運動の種類が「ジャンプ」である場合に、位置の時間変化が予測し易いと考えられる体幹部分の関節について、等速直線運動を仮定して、位置の時間変化を制約することができる。次に、図１１の説明に移行する。

　図１１は、「寝そべり」に対応するＦａｃｔｏｒ　Ｇｒａｐｈの雛型９１１の具体例を示す説明図である。雛型９１１は、例えば、対象者のそれぞれの関節の位置を示すノードを含む。雛型９１１は、具体的には、対象者の頭部、上部頸椎、下部頸椎、胸椎、腰椎、左右股関節、左右膝関節、左右脚関節、左右足部、左右肩関節、左右肘関節、左右手首、左右手のそれぞれの位置を示すノードを含む。

　図１１の例では、異なる時点の対象者の頭部の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の上部頸椎の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の下部頸椎の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の胸椎の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の腰椎の位置を示すノード同士が、第２エッジ１１０１で接続される。

　また、異なる時点の対象者の左股関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右股関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の左膝関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右膝関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の左脚関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右脚関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の左足部の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右足部の位置を示すノード同士が、第２エッジ１１０１で接続される。

　また、異なる時点の対象者の左肩関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右肩関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の左肘関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右肘関節の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の左手首の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右手首の位置を示すノード同士が、第２エッジ１１０１で接続される。

　また、異なる時点の対象者の左手の位置を示すノード同士が、第２エッジ１１０１で接続される。また、異なる時点の対象者の右手の位置を示すノード同士が、第２エッジ１１０１で接続される。図１１の例では、図面の都合上、一部の第２エッジ１１０１の図示を省略する。それぞれの第２エッジは、等位置運動に対応する時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍの分布モデルが対応付けられる。

　Ｐａｉｒｗｉｓｅ　Ｔｅｒｍは、例えば、ｇ_t（ｘ^j,t-1，ｘ^j,t）～Ｎ（｜｜ｘ^j,t-1，ｘ^j,t｜｜┃０，Σ_xj＾）である。Σ_xj＾は、関節の位置分散である。ここで、運動の種類が「寝そべり」である場合、全身の関節の位置の時間変化が規則的になり易いと考えられる。これに対し、雛型９１１は、運動の種類が「寝そべり」である場合に、位置の時間変化が予測し易いと考えられる全身の関節について、等位置運動を仮定して、位置の時間変化を制約することができる。次に、図１２を用いて、情報処理装置１００が、選択したＦａｃｔｏｒ　Ｇｒａｐｈに時系列制約を追加する具体例について説明する。

　図１２は、時系列制約を追加する具体例を示す説明図である。情報処理装置１００は、選択したＦａｃｔｏｒ　Ｇｒａｐｈのうち、第２エッジが接続されず、第１エッジが１つ接続された葉ノードが、特定した異常関節の位置を示すノードであるか否かを判定する。情報処理装置１００は、葉ノードが、特定した異常関節の位置を示すノードであれば、異なる時点の葉ノード同士を、第３エッジ１２０１で接続する。これにより、情報処理装置１００は、異常関節の位置を精度よく修正可能にすることができる。次に、図１３を用いて、情報処理装置１００が、選択したＦａｃｔｏｒ　Ｇｒａｐｈ１３００を利用して、３Ｄ骨格推論結果６０２を修正する具体例について説明する。

　図１３は、３Ｄ骨格推論結果６０２を修正する具体例を示す説明図である。図１３において、情報処理装置１００は、選択したＦａｃｔｏｒ　Ｇｒａｐｈ１３００を利用して、３Ｄ骨格推論結果６０２を修正する。図１３の例では、Ｆａｃｔｏｒ　Ｇｒａｐｈ１３００は、時刻ｔ－１に対応するノード群１３１０と、時刻ｔに対応するノード群１３２０となどを含む。ノード群１３１０は、ノード１３１１～１３１３などを含む。ノード群１３２０は、ノード１３２１～１３２３などを含む。

　例えば、ノード１３１１とノード１３１２とは、第１エッジ１３３１で接続される。例えば、ノード１３１２とノード１３１３とは、第１エッジ１３３２で接続される。例えば、ノード１３２１とノード１３２２とは、第１エッジ１３４１で接続される。例えば、ノード１３２２とノード１３２３とは、第１エッジ１３４２で接続される。例えば、ノード１３２２とノード１３２３とを接続する第１エッジ１３４２は、骨の長さの制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍが対応付けられていてもよい。

　例えば、ノード１３１２とノード１３２２とは、第２エッジ１３５１で接続される。第２エッジ１３５１は、例えば、対象者の動作の種類に対応する、上述した時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍが対応付けられる。例えば、ノード１３１１とノード１３２１とは、第３エッジ１３６１で接続される。第３エッジ１３６１は、例えば、上述した時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍが対応付けられていてもよい。

　情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ１３００の少なくともいずれかの関節の位置を示すノードに、Ｕｎａｒｙ　Ｔｅｒｍを対応付けてもよい。Ｕｎａｒｙ　Ｔｅｒｍは、例えば、ｆ（ｘ^j）～Ｎ（ｘ^j｜ｘ^j＾，Σ_3D ^j＾）である。ｘ^j＾は、複数の２Ｄヒートマップの関節尤度を統合した３Ｄヒートマップの関節尤度の重み付け和である。Σ_3D ^j＾は、複数の２Ｄヒートマップの関節尤度を統合した３Ｄヒートマップの関節尤度の分散である。

　情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ１３００の少なくともいずれかの関節の位置を示すノードに、当該関節の異常確率に応じて当該関節の位置を制約するよう作用する、異常関節の制約を示すＵｎａｒｙ　Ｔｅｒｍを対応付けてもよい。図１３の例では、情報処理装置１００は、例えば、ノード群１３２０のうち、関節１の位置を示すノード１３２１に、関節１の異常確率を含めたＵｎａｒｙ　Ｔｅｒｍを対応付けてもよい。Ｕｎａｒｙ　Ｔｅｒｍは、例えば、ｆ（ｘ^j）～Ｎ（ｘ^j｜ｘ^j＾，Σ_3D ^j＾）・ｐ（ｘ^j）である。ｐ（ｘ^j）は、異常確率である。

　情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ１３００におけるＵｎａｒｙ　Ｔｅｒｍと、Ｐａｉｒｗｉｓｅ　Ｔｅｒｍとに基づいて、それぞれの時点のそれぞれの関節の位置を修正する。情報処理装置１００は、例えば、Ｆａｃｔｏｒ　Ｇｒａｐｈ１３００を最適化することにより、それぞれの時点のそれぞれの関節の位置を修正する。

　これにより、情報処理装置１００は、３Ｄ骨格推論結果６０２を精度よく修正することができる。情報処理装置１００は、それぞれの時点のそれぞれの関節の位置を精度よく特定することができる。情報処理装置１００は、例えば、対象者が、体操などのような比較的高速または比較的複雑な動きをした場合においても、確度が比較的高い、それぞれの時点の対象者のそれぞれの関節の位置を特定することができる。

　ここで、下記参考文献３を参照して、時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを含まないＦａｃｔｏｒ　Ｇｒａｐｈを利用して、対象者の関節の３Ｄ座標を修正する比較例１が考えられる。比較例１では、関節の位置の時間変化を制約することができないため、対象者のそれぞれの関節の３Ｄ座標を精度よく修正することが難しく、対象者のそれぞれの関節の３Ｄ座標の時間変化を精度よく特定することが難しい場合がある。

　参考文献３　：　Ｂｕｌｔｍａｎｎ，　Ｓｉｍｏｎ，　ａｎｄ　Ｓｖｅｎ　Ｂｅｈｎｋｅ．　“Ｒｅａｌ－ｔｉｍｅ　ｍｕｌｔｉ－ｖｉｅｗ　３Ｄ　ｈｕｍａｎ　ｐｏｓｅ　ｅｓｔｉｍａｔｉｏｎ　ｕｓｉｎｇ　ｓｅｍａｎｔｉｃ　ｆｅｅｄｂａｃｋ　ｔｏ　ｓｍａｒｔ　ｅｄｇｅ　ｓｅｎｓｏｒｓ．”　ａｒＸｉｖ　ｐｒｅｐｒｉｎｔ　ａｒＸｉｖ：２１０６．１４７２９　（２０２１）．

　これに対し、情報処理装置１００は、時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを含むＦａｃｔｏｒ　Ｇｒａｐｈ１３００を利用することができる。このため、情報処理装置１００は、対象者のそれぞれの関節３Ｄ座標を適切に修正することができる。情報処理装置１００は、例えば、ある時点の対象者の関節の３Ｄ座標から、次の時点の対象者の関節の３Ｄ座標への時間変化が、人に直感的に誤りと感じさせ難い時間変化になるよう、それぞれの時点の対象者の関節の３Ｄ座標を適切に修正することができる。

　さらに、予め定められた時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを含むＦａｃｔｏｒ　Ｇｒａｐｈを利用して、対象者の関節の３Ｄ座標を修正する比較例２を考えたとする。しかしながら、比較例２でも、対象者のそれぞれの関節の３次元座標を精度よく修正することが難しく、対象者のそれぞれの関節の３次元座標の時間変化を精度よく特定することが難しい場合がある。比較例２では、動作の種類などの対象者の状態に合わせて、時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを動的に変更することができないため、対象者のそれぞれの関節の３次元座標を精度よく修正することが難しい。

　これに対し、情報処理装置１００は、対象者の動作の種類に応じて、異なる時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを含む複数のＦａｃｔｏｒ　Ｇｒａｐｈの雛型９１１を使い分けて、Ｆａｃｔｏｒ　Ｇｒａｐｈ１３００を設定することができる。これにより、情報処理装置１００は、例えば、対象者の動作の種類に応じて、等位置運動、等速直線運動、または、等加速度運動などに対応する時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを使い分けることができる。また、情報処理装置１００は、時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍに対応する第２エッジを、対象者の動作の種類に応じて異なる関節の３Ｄ座標を示すノードに接続することができる。

　このため、情報処理装置１００は、対象者のそれぞれの関節３Ｄ座標を適切に修正することができる。情報処理装置１００は、例えば、ある時点の対象者の関節の３Ｄ座標から、次の時点の対象者の関節の３Ｄ座標への時間変化が、人に直感的に誤りと感じさせ難い時間変化になるよう、それぞれの時点の対象者の関節の３Ｄ座標を適切に修正することができる。次に、図１４および図１５を用いて、動作例におけるデータ処理の流れの具体例について説明する。

　図１４および図１５は、動作例におけるデータ処理の流れの具体例を示す説明図である。図１４に示すように、情報処理装置１００は、時点ごとに、複数のカメラ画像１４０１を取得する。情報処理装置１００は、２Ｄ骨格推論モデル１４１０を記憶する。情報処理装置１００は、例えば、２Ｄ骨格推論モデル１４１０となるニューラルネットワークを定義する重みパラメータを記憶する。

　情報処理装置１００は、時点ごとに、２Ｄ骨格推論モデル１４１０を参照して、複数のカメラ画像１４０１のそれぞれのカメラ画像１４０１に対して、２Ｄ骨格推論処理を実施することにより、２Ｄ骨格推論結果１４０２を生成する。２Ｄ骨格推論結果１４０２は、例えば、関節の位置を示す２Ｄ座標（ｘ［ｐｉｘｅｌ］，ｙ［ｐｉｘｅｌ］）と、関節の位置の確からしさを示す尤度とを含む。

　情報処理装置１００は、３Ｄ骨格推論モデル１４２０を記憶する。情報処理装置１００は、例えば、３Ｄ骨格推論モデル１４２０となるニューラルネットワークを定義する重みパラメータを記憶する。

　情報処理装置１００は、時点ごとに、３Ｄ骨格推論モデル１４２０を参照して、複数の２Ｄ骨格推論結果１４０２に対して、３Ｄ骨格推論処理を実施することにより、３Ｄ骨格推論結果１４０３を生成する。３Ｄ骨格推論結果１４０３は、例えば、関節の位置を示す３Ｄ座標（ｘ［ｍｍ］，ｙ［ｍｍ］，ｚ［ｍｍ］）を含む。情報処理装置１００は、時点ごとの３Ｄ骨格推論結果１４０３を纏めた時系列データ１４０４を生成する。次に、図１５の説明に移行する。

　図１５に示すように、情報処理装置１００は、運動状態推定モデル１５１０を記憶する。情報処理装置１００は、例えば、運動状態推定モデル１５１０となるニューラルネットワークを定義する重みパラメータを記憶する。

　情報処理装置１００は、運動状態推定モデル１５１０を参照して、時系列データ１４０４に対して、運動状態推定処理を実施することにより、対象者の運動の種類を推定し、推定した対象者の運動の種類を含む運動状態推定結果１５０１を生成する。

　情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ１５２０を記憶する。Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ１５２０は、運動の種類ごとに、時系列制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを含む、当該運動の種類に対応するＦａｃｔｏｒ　Ｇｒａｐｈの雛型を記憶する。Ｐａｉｒｗｉｓｅ　Ｔｅｒｍは、例えば、運動の種類に対応する関節の位置の時間変化を、当該運動の種類に対応する対象者の動きの傾向に応じて制約することを示す。

　Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ１５２０は、例えば、運動の種類と、対象者の関節の種類と、当該運動の種類に対応する対象者の当該関節の動きの傾向とを対応付けて示す。動きの傾向は、例えば、等位置運動、等速直線運動、等加速運動などである。情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ１５２０を参照して、運動状態推定結果１５０１に含まれる推定した対象者の運動の種類に対応するＦａｃｔｏｒ　Ｇｒａｐｈの雛型を、利用するＦａｃｔｏｒ　Ｇｒａｐｈとして選択する。

　情報処理装置１００は、骨長さモデル１５３０を記憶する。骨長さモデル１５３０は、骨の長さの制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを定義するパラメータを含む。パラメータは、例えば、骨の長さの平均と分散とである。情報処理装置１００は、骨長さモデル１５３０を参照して、選択したＦａｃｔｏｒ　Ｇｒａｐｈに、骨の長さの制約を示すＰａｉｒｗｉｓｅ　Ｔｅｒｍを付与する。

　情報処理装置１００は、付与後のＦａｃｔｏｒ　Ｇｒａｐｈに対して、最適化処理を実施することにより、それぞれの関節の位置を修正する。情報処理装置１００は、修正したそれぞれの関節の位置を含む修正後３Ｄ骨格推論モデル１５０２を生成する。これにより、情報処理装置１００は、時点ごとの対象者のそれぞれの関節の位置を精度よく特定することができる。

（全体処理手順）
　次に、図１６を用いて、情報処理装置１００が実行する、全体処理手順の一例について説明する。全体処理は、例えば、図３に示したＣＰＵ３０１と、メモリ３０２や記録媒体３０５などの記憶領域と、ネットワークＩ／Ｆ３０３とによって実現される。

　図１６は、全体処理手順の一例を示すフローチャートである。図１６において、情報処理装置１００は、対象者の３次元骨格推論結果の時系列データを取得する（ステップＳ１６０１）。そして、情報処理装置１００は、取得した対象者の３次元骨格推論結果の時系列データに基づいて、対象者のそれぞれの部位の尤度を算出する（ステップＳ１６０２）。

　次に、情報処理装置１００は、取得した対象者の３次元骨格推論結果の時系列データに基づいて、時点ごとに、対象者の運動状態を推定する（ステップＳ１６０３）。そして、情報処理装置１００は、時点ごとに、推定した対象者の運動状態に対応するＦａｃｔｏｒ　Ｇｒａｐｈを選択する（ステップＳ１６０４）。

　次に、情報処理装置１００は、選択したＦａｃｔｏｒ　Ｇｒａｐｈにおいて、尤度が比較的小さい部位に対応する葉ノードについて時間軸に沿ってＰａｉｒｗｉｓｅ　Ｔｅｒｍを設定する（ステップＳ１６０５）。そして、情報処理装置１００は、選択したＦａｃｔｏｒ　Ｇｒａｐｈにおいて、対象者の特定の部位にＵｎａｒｙ　Ｔｅｒｍ＝尤度を設定し、対象者の特定の部位について時間軸に沿ってＰａｉｒｗｉｓｅ　Ｔｅｒｍを設定する（ステップＳ１６０６）。

　次に、情報処理装置１００は、Ｆａｃｔｏｒ　Ｇｒａｐｈを最適化することにより、対象者の３次元骨格推論結果の時系列データを修正する（ステップＳ１６０７）。そして、情報処理装置１００は、修正後の対象者の３次元骨格推論結果の時系列データを出力する（ステップＳ１６０８）。その後、情報処理装置１００は、全体処理を終了する。

　これにより、情報処理装置１００は、対象者の３次元骨格推論結果を精度よく修正することができる。このため、情報処理装置１００は、対象者の３次元骨格推論結果の有用性の向上を図ることができる。情報処理装置１００は、例えば、対象者の３次元骨格推論結果に基づく解析処理の精度の向上を図ることができる。

　ここで、情報処理装置１００は、図１６の一部ステップの処理の順序を入れ替えて実行してもよい。例えば、ステップＳ１６０５，Ｓ１６０６の処理の順序は入れ替え可能である。また、情報処理装置１００は、図１６の一部ステップの処理を省略してもよい。例えば、ステップＳ１６０５の処理は省略可能である。

　以上説明したように、情報処理装置１００によれば、対象者の複数の部位のそれぞれの部位の位置を含む骨格情報の時系列データを取得することができる。情報処理装置１００によれば、取得した時系列データにおける骨格情報の特徴量に基づいて、取得した時系列データにおける第１時点の骨格情報に対応する対象者の動作の種類を特定することができる。情報処理装置１００によれば、取得した時系列データにおける第１時点の骨格情報のうち、複数の部位のいずれかの部位の位置の時間変化を、特定した動作の種類に対応するいずれかの部位の動きの傾向に応じて制約する確率分布のモデルを決定することができる。情報処理装置１００によれば、時点ごとのそれぞれの部位の位置を示すノードを含むグラフを生成することができる。情報処理装置１００によれば、グラフにおいて、時点ごとの生体的に連結する異なる部位の位置を示すノード同士を接続する第１エッジを付与することができる。情報処理装置１００によれば、グラフにおいて、異なる時点のいずれかの部位の位置を示すノード同士を接続する第２エッジを付与することができる。情報処理装置１００によれば、グラフにおいて、第２エッジに、決定したモデルを対応付けることができる。情報処理装置１００によれば、生成したグラフに基づいて、時系列データにおける第１時点の骨格情報を修正することができる。これにより、情報処理装置１００は、第１時点の骨格情報を精度よく修正することができる。

　情報処理装置１００によれば、第１時点の骨格情報のうち、いずれかの部位の位置の時間変化を、特定した動作の種類に対応するいずれかの部位の等位置運動、等速運動、または、等加速運動の傾向に応じて制約する確率分布のモデルを決定することができる。これにより、情報処理装置１００は、動作の種類に合わせて、第１時点の骨格情報を適切に修正可能にするモデルを決定することができる。

　情報処理装置１００によれば、複数の部位のうちいずれかの部位以外の他の部位について、異なる時点の他の部位の位置を示すノードそれぞれに接続された第１エッジが１つずつであるか否かを判定することができる。情報処理装置１００によれば、他の部位について、異なる時点の他の部位の位置を示すノードそれぞれに接続された第１エッジが１つずつであれば、当該ノード同士を接続する第３エッジを、グラフに含めるよう、グラフを生成することができる。これにより、情報処理装置１００は、ノードに接続するエッジの数の増大化を図り、当該ノードが示す他の部位の位置を精度よく修正可能にすることができる。

　情報処理装置１００によれば、複数の部位のうち、いずれかの部位以外であって、位置に関して異常な状態である他の部位を特定することができる。情報処理装置１００によれば、特定した他の部位について、異なる時点の他の部位の位置を示すノードそれぞれに接続された第１エッジが１つずつであれば、当該ノード同士を接続する第３エッジを、グラフに含めるよう、グラフを生成することができる。これにより、情報処理装置１００は、修正することが好ましい他の部位を特定することができ、特定した他の部位の位置を精度よく修正可能にすることができる。

　なお、本実施の形態で説明した情報処理方法は、予め用意されたプログラムをＰＣやワークステーションなどのコンピュータで実行することにより実現することができる。本実施の形態で説明した情報処理プログラムは、コンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。記録媒体は、ハードディスク、フレキシブルディスク、ＣＤ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ）－ＲＯＭ、ＭＯ（Ｍａｇｎｅｔｏ　Ｏｐｔｉｃａｌ　ｄｉｓｃ）、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）などである。また、本実施の形態で説明した情報処理プログラムは、インターネットなどのネットワークを介して配布してもよい。

　１００　情報処理装置
　１０１　骨格情報
　１１０　グラフ
　１１１，１３１１～１３１３，１３２１～１３２３　ノード
　１１２，１３３１，１３３２，１３４１，１３４２　第１エッジ
　１１３，１００１，１１０１，１３５１　第２エッジ
　２００　情報処理システム
　２０１　画像撮像装置
　２０２　クライアント装置
　２１０　ネットワーク
　３００，４００　バス
　３０１，４０１　ＣＰＵ
　３０２，４０２　メモリ
　３０３，４０３　ネットワークＩ／Ｆ
　３０４，４０４　記録媒体Ｉ／Ｆ
　３０５，４０５　記録媒体
　３０６　ディスプレイ
　３０７　入力装置
　４０６　カメラ
　５００　記憶部
　５０１　取得部
　５０２　解析部
　５０３　学習部
　５０４　特定部
　５０５　決定部
　５０６　生成部
　５０７　修正部
　５０８　出力部
　６００　多視点画像
　６０１　２Ｄヒートマップ
　６０２，６０３，１４０３，１５０２　３Ｄ骨格推論結果
　７００　元データ
　７０１　加工データ
　７１０　異常判定ＤＮＮ
　９００　状態推定ＤＮＮ
　９１０，１５２０　Ｆａｃｔｏｒ　Ｇｒａｐｈ定義ＤＢ
　９１１　雛型
　１２０１，１３６１　第３エッジ
　１３００　Ｆａｃｔｏｒ　Ｇｒａｐｈ
　１３１０，１３２０　ノード群
　１４０１　カメラ画像
　１４０２　２Ｄ骨格推論結果
　１４０４　時系列データ
　１４１０　２Ｄ骨格推論モデル
　１４２０　３Ｄ骨格推論モデル
　１５０１　運動状態推定結果
　１５１０　運動状態推定モデル
　１５３０　骨長さモデル

Claims

　対象者の複数の部位のそれぞれの部位の位置を含む骨格情報の時系列データを取得し、
　取得した前記時系列データにおける骨格情報の特徴量に基づいて、取得した前記時系列データにおける第１時点の骨格情報に対応する前記対象者の動作の種類を特定し、
　取得した前記時系列データにおける前記第１時点の骨格情報のうち、前記複数の部位のいずれかの部位の位置の時間変化を、特定した前記動作の種類に対応する前記いずれかの部位の動きの傾向に応じて制約する確率分布のモデルを決定し、
　時点ごとの前記それぞれの部位の位置を示すノードと、前記時点ごとの生体的に連結する異なる部位の位置を示すノード同士を接続する第１エッジと、異なる時点の前記いずれかの部位の位置を示すノード同士を接続する第２エッジとを含み、前記第２エッジに決定した前記モデルを対応付けたグラフを生成し、
　生成した前記グラフに基づいて、前記時系列データにおける前記第１時点の骨格情報を修正する、
　処理をコンピュータに実行させることを特徴とする情報処理プログラム。
　前記決定する処理は、
　取得した前記時系列データにおける前記第１時点の骨格情報のうち、前記いずれかの部位の位置の時間変化を、特定した前記動作の種類に対応する前記いずれかの部位の等位置運動、等速運動、または、等加速運動の傾向に応じて制約する確率分布のモデルを決定する、ことを特徴とする請求項１に記載の情報処理プログラム。
　前記生成する処理は、
　前記複数の部位のうち前記いずれかの部位以外の他の部位について、異なる時点の前記他の部位の位置を示すノードそれぞれに接続された前記第１エッジが１つずつであれば、当該ノード同士を接続する第３エッジを、前記グラフに含めるよう、前記グラフを生成する、ことを特徴とする請求項１または２に記載の情報処理プログラム。
　前記複数の部位のうち、前記いずれかの部位以外であって、位置に関して異常な状態である他の部位を特定する、
　処理を前記コンピュータに実行させ、
　前記生成する処理は、
　特定した前記他の部位について、異なる時点の前記他の部位の位置を示すノードそれぞれに接続された前記第１エッジが１つずつであれば、当該ノード同士を接続する第３エッジを、前記グラフに含めるよう、前記グラフを生成する、ことを特徴とする請求項３に記載の情報処理プログラム。
　対象者の複数の部位のそれぞれの部位の位置を含む骨格情報の時系列データを取得し、
　取得した前記時系列データにおける骨格情報の特徴量に基づいて、取得した前記時系列データにおける第１時点の骨格情報に対応する前記対象者の動作の種類を特定し、
　取得した前記時系列データにおける前記第１時点の骨格情報のうち、前記複数の部位のいずれかの部位の位置の時間変化を、特定した前記動作の種類に対応する前記いずれかの部位の動きの傾向に応じて制約する確率分布のモデルを決定し、
　時点ごとの前記それぞれの部位の位置を示すノードと、前記時点ごとの生体的に連結する異なる部位の位置を示すノード同士を接続する第１エッジと、異なる時点の前記いずれかの部位の位置を示すノード同士を接続する第２エッジとを含み、前記第２エッジに決定した前記モデルを対応付けたグラフを生成し、
　生成した前記グラフに基づいて、前記時系列データにおける前記第１時点の骨格情報を修正する、
　処理をコンピュータが実行することを特徴とする情報処理方法。
　対象者の複数の部位のそれぞれの部位の位置を含む骨格情報の時系列データを取得し、
　取得した前記時系列データにおける骨格情報の特徴量に基づいて、取得した前記時系列データにおける第１時点の骨格情報に対応する前記対象者の動作の種類を特定し、
　取得した前記時系列データにおける前記第１時点の骨格情報のうち、前記複数の部位のいずれかの部位の位置の時間変化を、特定した前記動作の種類に対応する前記いずれかの部位の動きの傾向に応じて制約する確率分布のモデルを決定し、
　時点ごとの前記それぞれの部位の位置を示すノードと、前記時点ごとの生体的に連結する異なる部位の位置を示すノード同士を接続する第１エッジと、異なる時点の前記いずれかの部位の位置を示すノード同士を接続する第２エッジとを含み、前記第２エッジに決定した前記モデルを対応付けたグラフを生成し、
　生成した前記グラフに基づいて、前記時系列データにおける前記第１時点の骨格情報を修正する、
　制御部を有することを特徴とする情報処理装置。