WO2023095667A1

WO2023095667A1 - データ処理装置およびデータ処理方法、並びにプログラム

Info

Publication number: WO2023095667A1
Application number: PCT/JP2022/042322
Authority: WO
Inventors: 正樹柏森
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2021-11-29
Filing date: 2022-11-15
Publication date: 2023-06-01

Abstract

本開示は、姿勢データの利便性を高めることができるようにするデータ処理装置およびデータ処理方法、並びにプログラムに関する。方向ベクトル変換部は、人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、姿勢データを方向ベクトルで表し、モデル適用部は、方向ベクトルで表された姿勢データを、人物のＣＧモデルに適用する。姿勢分類部は、姿勢データを所定の姿勢ごとに分類して、それぞれの姿勢のラベルを付与する。本技術は、例えば、人工知能を活用した学習などの用途を目的とした人物のＣＧモデルを生成するデータ処理装置に適用できる。

Description

データ処理装置およびデータ処理方法、並びにプログラム

　本開示は、データ処理装置およびデータ処理方法、並びにプログラムに関し、特に、姿勢データの利便性を高めることができるようにしたデータ処理装置およびデータ処理方法、並びにプログラムに関する。

　近年、人工知能を活用した学習などの用途を目的として、大量かつ多様な姿勢の人物のＣＧ（Computer Graphics）モデルを用意することが必要とされている。しかしながら、従来、人物のＣＧモデルのモデリングでは、例えば、ＣＧデザイナによる手作業によって人物のＣＧモデルのボーンを操作することで姿勢が設定されており、大量かつ多様な姿勢の人物のＣＧモデルを用意するためには、時間およびコストが増大することが懸念されている。

　そこで、特許文献１に開示されているように、身体の形状の時々刻々の計測値から抽出した制御可能な特徴量を、ＣＧキャラクタの関節の角度ないしは部位の寸法を表す位置姿勢情報に変換するＣＧキャラクタアニメーション作成装置が提案されている。

特開２００８－１７６６９６号公報

　ところで、従来、人物の動きをキャプチャして得られる姿勢データには、その人物を特定できる情報が含まれており、姿勢データを正規化または一般化することは行われていなかった。そのため、より画一的に姿勢データを扱えるようにすることや、よりプライバシーに配慮することなどに対する対応が求められており、それらに対応することで、姿勢データを取り扱う際の利便性を向上させることができると期待されている。

　本開示は、このような状況に鑑みてなされたものであり、姿勢データの利便性を高めることができるようにするものである。

　本開示の一側面のデータ処理装置は、人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを方向ベクトルで表す方向ベクトル変換部と、前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用するモデル適用部とを備える。

　本開示の一側面のデータ処理方法またはプログラムは、人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを方向ベクトルで表すことと、前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用することとを含む。

　本開示の一側面においては、人物の特定の特徴点で表される３Ｄの姿勢データが方向ベクトル化されて、姿勢データが方向ベクトルで表され、方向ベクトルで表された姿勢データが、人物のＣＧモデルに適用される。

本技術を適用したデータ処理装置の一実施の形態の構成例を示すブロック図である。３Ｄの姿勢データの一例を示す図である。時系列処理について説明する図である。姿勢データを表す方向ベクトルの一例を示す図である。方向ベクトルの始点および終点、並びに、名前を対応付けて示す図である。データクレンジング処理の前後におけるLeftLowLegベクトル、RightLowLegベクトル、LeftUpLegベクトル、およびRightUpLegベクトルの分布例を示す図である。データクレンジング処理の前後におけるLeftUpBodyベクトル、RightUpBodyベクトル、RightNeckベクトル、およびHipベクトルの分布例を示す図である。データクレンジング処理の前後におけるShoulderベクトル、LeftArmベクトル、RightArmベクトル、およびRightForeArmベクトルの分布例を示す図である。データクレンジング処理の前後におけるLeftForeArmベクトル、およびLeftNeckベクトルの分布例を示す図である。時系列の制約によって姿勢データを削除するデータクレンジング処理について説明する図である。ウィンドサイズ７での移動標準偏差について説明する図である。足の方向ベクトルの元データおよび移動標準偏差の一例を示す図である。静止姿勢および歩行姿勢の自動分類について説明する図である。姿勢データの拡張について説明する図である。姿勢データのＣＧモデルへの適用について説明する図である。方向ベクトルを回転させる順番の一例を示す図である。データ処理装置が実行するデータ処理を説明するフローチャートである。本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。

　以下、本技術を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。

　＜データ処理装置の構成例＞
　図１は、本技術を適用したデータ処理装置の一実施の形態の構成例を示すブロック図である。

　図１に示すデータ処理装置１１には、例えば、人物を計測して得られる三次元的なデータである３Ｄデータ、または、人物を撮像して得られる二次元的なデータである２Ｄデータが入力される。また、データ処理装置１１において２Ｄデータに対するデータ処理が行われる場合、例えば、ＴＯＦ（Time Of Flight）センサにより取得される人物に対する距離情報を画像化したデータであるＴＯＦデータが、データ処理装置１１に入力される。そして、データ処理装置１１は、それらのデータに対するデータ処理を行った結果として、例えば、データ処理の対象となった人物の姿勢が適用されたＣＧモデルを出力する。

　データ処理装置１１は、３Ｄ姿勢推定部１２、２Ｄ姿勢推定部１３、３Ｄ変換部１４、時系列処理部１５、グローバル座標変換部１６、方向ベクトル変換部１７、データ修正処理部１８、姿勢分類部１９、データ拡張部２０、およびモデル適用部２１を備えて構成される。

　３Ｄ姿勢推定部１２は、データ処理装置１１に入力された３Ｄデータに基づいて、３Ｄデータで表される人物の姿勢をＡＩ（Artificial Intelligence）により推定し、その推定結果として得られる３Ｄの姿勢データを時系列処理部１５に供給する。

　２Ｄ姿勢推定部１３は、データ処理装置１１に入力された２Ｄデータに基づいて、２Ｄデータで表される人物の姿勢をＡＩにより推定し、その推定結果として得られる２Ｄの姿勢データを３Ｄ変換部１４に供給する。

　３Ｄ変換部１４は、ＴＯＦデータを用いて、２Ｄ姿勢推定部１３から供給された２Ｄの姿勢データを三次元的なデータに変換し、その変換結果として得られる３Ｄの姿勢データを時系列処理部１５に供給する。

　ここで、時系列処理部１５に供給される３Ｄの姿勢データは、例えば、図２に示すように、データ処理の対象となっている人物の特定の関節を特徴点として抽出し、それらの特徴点の位置を示す三次元的な座標により表される。

　時系列処理部１５は、３Ｄ姿勢推定部１２または３Ｄ変換部１４から時間の経過に従って連続的に供給される３Ｄの姿勢データについて、同一の人物ごとに関連付けを行う時系列処理を施す。例えば、時系列処理部１５は、時系列処理において、同一の人物を特定する人物ＩＤ（Identification）を、３Ｄの姿勢データごとに付与する。

　例えば、図３に示すように、時系列処理部１５は、同一の人物（人物ＩＤ：person 1）について、時刻ｔ、時刻ｔ＋１、時刻ｔ＋２、・・・それぞれの時刻の３Ｄの姿勢データを関連付けることができる。

　グローバル座標変換部１６は、時系列処理部１５において時系列処理が施された３Ｄの姿勢データの座標（例えば、人物を計測または撮像した装置の位置に応じた座標）を、データ処理装置１１においてＣＧモデルの構築に用いられるグローバル座標に変換する。

　方向ベクトル変換部１７は、グローバル座標変換部１６においてグローバル座標に変換された３Ｄの姿勢データを方向ベクトル化して、方向ベクトルで表される姿勢データに変換する。このように３Ｄの姿勢データを方向ベクトル化することによって、個人を特定できる情報を排除した状態とすることができ、画一的に扱える正規化データとして人物の姿勢を表現することができる。なお、方向ベクトル変換部１７による３Ｄの姿勢データの方向ベクトル化については、図４および図５を参照して後述する。

　データ修正処理部１８は、方向ベクトル変換部１７において方向ベクトル化された姿勢データに対して、データクレンジング処理やデータ補間処理などのデータ修正処理を施す。例えば、データクレンジング処理は、後述の図６乃至図１０を参照して説明するように、人間がとり得ない姿勢データの除去や時系列の制約による姿勢データの削除を行う処理である。データ補間処理は、データクレンジング処理によって除去または削除された姿勢データを、その姿勢データの前後の姿勢データを用いて補間する処理である。

　姿勢分類部１９は、データ修正処理部１８においてデータ修正処理が施された姿勢データを所定の姿勢ごとに分類して、それぞれの姿勢のラベルを付与した姿勢データを、データ拡張部２０およびモデル適用部２１に供給する。例えば、姿勢分類部１９は、後述の図１１乃至図１３を参照して説明するように、姿勢データを静止姿勢および歩行姿勢に自動分類することができる。

　データ拡張部２０は、姿勢分類部１９から供給された姿勢データに対して他の姿勢データを適切に組み合わせることによって、例えば、図１４を参照して後述するように上半身と下半身とを組み合わせることによって、姿勢データを拡張して、新たな姿勢データを生成する。これにより、データ拡張部２０は、データ処理装置１１に入力される３Ｄデータまたは２Ｄデータに基づく姿勢データだけでなく、より多様な姿勢データを大量に生成することができる。そして、データ拡張部２０は、新たに生成した姿勢データをモデル適用部２１に供給する。

　モデル適用部２１は、姿勢分類部１９から供給された姿勢データ、または、データ拡張部２０から供給された姿勢データをＣＧモデルに適用して、姿勢データに従った姿勢のＣＧモデルを出力する。

　このようにデータ処理装置１１は構成されており、より多様な姿勢データが適用されたＣＧモデルを大量に出力することができ、それらの姿勢データが方向ベクトルで表されるようにすることで、姿勢データを取り扱う際の利便性を向上させることができる。

　＜方向ベクトル化する処理の処理例＞
　図４および図５を参照して、方向ベクトル変換部１７が３Ｄの姿勢データを方向ベクトル化する処理について説明する。

　方向ベクトル変換部１７は、例えば、図２に示したような人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、図４に示すように、１６カ所の点を始点または終点とした第１乃至第１９の方向ベクトルで表される姿勢データに変換する。図５には、第１乃至第１９の方向ベクトルについて、それぞれ始点および終点と、それぞれの名前とが対応付けられて示されている。

　例えば、第１の方向ベクトルは、左膝を示す点１４を始点として左踵を示す点１６を終点としたLeftLowLegベクトルである。第２の方向ベクトルは、左腰を示す点１２を始点として左膝を示す点１４を終点としたLeftUpLegベクトルである。第３の方向ベクトルは、右膝を示す点１５を始点として右踵を示す点１７を終点としたRightLowLegベクトルである。第４の方向ベクトルは、右腰を示す点１３を始点として右膝を示す点１５を終点としたRightUpLegベクトルである。第５の方向ベクトルは、左腰を示す点１２を始点として右腰を示す点１３を終点としたHipベクトルである。

　第６の方向ベクトルは、左腰を示す点１２を始点として左肩を示す点６を終点としたLeftUpBodyベクトルである。第７の方向ベクトルは、右腰を示す点１３を始点として右肩を示す点７を終点としたRightUpBodyベクトルである。第８の方向ベクトルは、左肩を示す点６を始点として右肩を示す点７を終点としたShoulderベクトルである。第９の方向ベクトルは、左肩を示す点６を始点として左肘を示す点８を終点としたLeftArmベクトルである。第１０の方向ベクトルは、右肩を示す点７を始点として右肘を示す点９を終点としたRightArmベクトルである。第１１の方向ベクトルは、左肘を示す点８を始点として左手首を示す点１０を終点としたLeftForeArmベクトルである。第１２の方向ベクトルは、右肘を示す点９を始点として右手首を示す点１１を終点としたRightForeArmベクトルである。

　第１３の方向ベクトルは、左目を示す点２を始点として右目を示す点３を終点としたEyesベクトルである。第１４の方向ベクトルは、左目を示す点２を始点として鼻を示す点１を終点としたLeftNoseベクトルである。第１５の方向ベクトルは、右目を示す点３を始点として鼻を示す点１を終点としたRightNoseベクトルである。第１６の方向ベクトルは、左頬を示す点４を始点として左目を示す点２を終点としたRightFaceベクトルである。第１７の方向ベクトルは、右頬を示す点５を始点として右目を示す点３を終点としたLeftFaceベクトルである。第１８の方向ベクトルは、左肩を示す点６を始点として鼻を示す点１を終点としたLeftNeckベクトルである。第１９の方向ベクトルは、右肩を示す点７を始点として鼻を示す点１を終点としたRightNeckベクトルである。

　さらに、第１乃至第１９の方向ベクトルは、第５の方向ベクトルであるHipベクトルで向きを正規化することができる。

　そして、方向ベクトル化された姿勢データは、個人情報を排した数値データとして、次の式（１）に示すような行列で表すことができる。

　このように、方向ベクトル変換部１７は、３Ｄの姿勢データを方向ベクトル化して、複数の方向ベクトルで表される姿勢データに変換することができる。

　＜データクレンジング処理の処理例＞
　図６乃至図１０を参照して、データ修正処理部１８が行う姿勢データのデータクレンジング処理について説明する。

　例えば、実世界からの姿勢推定では誤推定が生じることがあるため、データ処理装置１１では、誤推定された姿勢データを自動的に除去または削除する仕組みとしてデータクレンジング処理が導入される。

　データ修正処理部１８は、人間がとり得ない姿勢データを除去するデータクレンジング処理によって、腰また肩が水平に対して傾き過ぎている方向ベクトルや、上体が後ろに傾き過ぎている方向ベクトルなど、不自然な姿勢データを閾値処理によって除去することができる。

　図６乃至図９では、それぞれの方向ベクトルについて、左側にデータクレンジング処理が行われる前の分布が示されており、右側にデータクレンジング処理が行われた後の分布が示されている。

　図６のＡには、LeftLowLegベクトルについて、データクレンジング処理が行われる前後における分布例が示されている。データクレンジング処理が行われる前（左側）では分布が拡がっているのに対し、データクレンジング処理が行われた後（右側）では分布が狭まっており、人間がとり得ない程に傾き過ぎているLeftLowLegベクトルが閾値処理によって除去されたことが表されている。

　以下、同様に、図６のＢにはRightLowLegベクトル、図６のＣにはLeftUpLegベクトル、図６のＤにはRightUpLegベクトルについて、それぞれデータクレンジング処理が行われる前後における分布例が示されている。図７のＡにはLeftUpBodyベクトル、図７のＢにはRightUpBodyベクトル、図７のＣにはRightNeckベクトル、図７のＤにはHipベクトルについて、それぞれデータクレンジング処理が行われる前後における分布例が示されている。図８のＡにはShoulderベクトル、図８のＢにはLeftArmベクトル、図８のＣにはRightArmベクトル、図８のＤには、RightForeArmベクトルについて、それぞれデータクレンジング処理が行われる前後における分布例が示されている。図９のＡにはLeftForeArmベクトル、図９のＢにはLeftNeckベクトルについて、それぞれデータクレンジング処理が行われる前後における分布例が示されている。

　図１０を参照して、時系列の制約によって姿勢データを削除するデータクレンジング処理について説明する。

　例えば、次の式（２）に示すｃｏｓ類似度に基づいて、ベクトルの類似性を判断することができる。

　ここで、式（２）は、ベクトルａおよびベクトルｂのｃｏｓ類似度を求める式である。ｃｏｓ類似度は、－１から＋１までの値域をとり、ベクトルａおよびベクトルｂが完全に一致したときに＋１となる。

　そして、データ修正処理部１８は、前フレームからの姿勢データの連続性を、次の式（３）に示すように、１２本の方向ベクトルのｃｏｓ類似度により評価する。そして、データ修正処理部１８は、それらのｃｏｓ類似度の平均値が所定の閾値（例えば、0.9）以下となる類似性の低い姿勢データ［x_t y_t z_t］については、誤推定として削除する。

　例えば、図１０のＡに示すように、時刻ｔの姿勢データと時刻ｔ＋１の姿勢データとが類似している場合にはｃｏｓ類似度が大きくなり、時刻ｔ＋１の姿勢データと時刻ｔ＋２の姿勢データとが類似している場合にはｃｏｓ類似度が大きくなる。従って、この場合、データ修正処理部１８は、時刻ｔの姿勢データと時刻ｔ＋１の姿勢データとに連続性があり、時刻ｔ＋１の姿勢データと時刻ｔ＋２の姿勢データとに連続性があると判断することができる。

　一方、図１０のＢに示すように、時刻ｔの姿勢データと時刻ｔ＋１の姿勢データとが類似していない場合にはｃｏｓ類似度が小さくなり、時刻ｔ＋１の姿勢データと時刻ｔ＋２の姿勢データとが類似していない場合にはｃｏｓ類似度が小さくなる。従って、この場合、データ修正処理部１８は、時刻ｔの姿勢データと時刻ｔ＋１の姿勢データとに連続性がなく、時刻ｔ＋１の姿勢データと時刻ｔ＋２の姿勢データとに連続性がないと判断して、時刻ｔ＋１の姿勢データを削除することができる。このように、小さなｃｏｓ類似度が２回連続している場合、削除した姿勢データの前後の姿勢データは、正常であるとして扱われる。

　このように、データ修正処理部１８は、データクレンジング処理によって不自然な姿勢データを除去または削除し、除去または削除された姿勢データをデータ補間処理によって前後の姿勢データから補間することができる。

　＜姿勢データを自動分類する処理の処理例＞
　図１１乃至図１３を参照して、姿勢分類部１９が姿勢データを自動分類する処理について説明する。

　例えば、データ処理装置１１では、後段の処理部で姿勢データを意図的に扱うことができるようにするために、姿勢分類部１９によって、時系列の姿勢データを分類してラベルを付与する仕組みが導入される。ここでは、特定の方向ベクトルの各成分の移動標準偏差に着目し、時系列の姿勢データを静止姿勢と歩行姿勢とにルールベースで自動分類する方法について説明する。

　図１１に示すように、姿勢分類部１９は、時系列の姿勢データに対して所定のウィンドサイズで移動標準偏差を算出する。図１１には、まず時刻ｔ＋１から時刻ｔ＋７までのウィンドサイズ７で標準偏差を算出し、次に時刻ｔ＋２から時刻ｔ＋８までのウィンドサイズ７で標準偏差を算出する処理例が示されている。

　そして、姿勢分類部１９は、静止姿勢と歩行姿勢とに姿勢データを分類する場合、足の方向ベクトルのＹ成分およびＺ成分に着目して移動標準偏差を閾値判定する判定処理を行う。即ち、足の方向ベクトルのＹ成分およびＺ成分が閾値未満である場合、姿勢データは歩行姿勢であると判定され、足の方向ベクトルのＹ成分およびＺ成分が閾値以上である場合、姿勢データは歩行姿勢であると判定される。

　図１２のＡには、人物ＩＤが２である人物の姿勢データにおける足の方向ベクトルの元データ（左側）および移動標準偏差（右側）の一例が示されている。図示するように、移動標準偏差の値が小さいことより、姿勢分類部１９は、この姿勢データを静止姿勢と閾値判定することができる。

　図１２のＢには、人物ＩＤが１１である人物の姿勢データにおける足の方向ベクトルの元データ（左側）および移動標準偏差（右側）の一例が示されている。図示するように、移動標準偏差の値が大きいことより、姿勢分類部１９は、この姿勢データを歩行姿勢と閾値判定することができる。

　このように、姿勢分類部１９は、閾値判定によって、図１３に示すように、人物ＩＤが２である人物の姿勢データを静止姿勢と分類してラベルidleを付与し、人物ＩＤが１１である人物の姿勢データを歩行姿勢と分類してラベルwalkを付与することができる。

　図１４を参照して、データ拡張部２０が新たな姿勢データを生成する処理について説明する。

　例えば、データ処理装置１１では、入力される３Ｄデータまたは２Ｄデータが少量であっても、十分な姿勢データのサンプル数を確保することができるように、データ拡張部２０において姿勢データを拡張する仕組みが導入される。そして、姿勢データを自動生成することによって、ＡＩ学習の汎化性能を向上させることができる。

　例えば、データ拡張部２０は、姿勢分類部１９から供給された元の姿勢データの所定の部位との類似性が高い姿勢データ（ｃｏｓ類似度が閾値以上の姿勢データ）を、取得済みの姿勢データの中から検索し、その部位の類似性の高い姿勢データ群を求める。そして、データ拡張部２０は、姿勢データ群からランダムに１つの姿勢データを拡張用として選択し、元の姿勢データの所定の部位の方向ベクトルに拡張用の姿勢データの他の部位の方向ベクトルを組み合わせることで、新たな姿勢データを生成する。

　図１４には、元データの下半身を所定の部位とした処理の処理例が示されている。

　図１４に示すように、元データの下半身の方向ベクトルの類似度で検索することで、元データの下半身との類似性が高い下半身となっている姿勢データの姿勢データ群が求められる。そして、姿勢データ群からランダムに拡張用の姿勢データが選択される。さらに、元の姿勢データの下半身の方向ベクトルに拡張用の姿勢データの上半身の方向ベクトルを組み合わせることで、新たな姿勢データが生成される。

　このように、データ拡張部２０は、姿勢データを拡張して、新たな姿勢データを生成する。

　＜姿勢データをＣＧモデルに適用する処理の処理例＞
　図１５および図１６を参照して、モデル適用部２１が姿勢データをＣＧモデルに適用する処理について説明する。

　モデル適用部２１は、所定の方向ベクトルについて、姿勢データの方向ベクトルとＣＧモデルの方向ベクトルとの外積で、ＣＧモデルの方向ベクトルの回転軸を算出し、姿勢データの方向ベクトルとＣＧモデルの方向ベクトルとの内積で、ＣＧモデルの方向ベクトルを回転させる回転角を算出する。そして、モデル適用部２１は、ボーンの回転処理により、姿勢データの姿勢と一致するように、ＣＧモデルの姿勢を変形させることができる。

　図１５には、LeftLowLegベクトルに対する処理の処理例が示されている。

　図１５に示すように、第１に、姿勢データのLeftLowLegベクトルとＣＧモデルのLeftLowLegベクトルとの外積で、ＣＧモデルのLeftLowLegベクトルの回転軸を算出する。第２に、姿勢データのLeftLowLegベクトルとＣＧモデルのLeftLowLegベクトルとの内積で、ＣＧモデルのLeftLowLegベクトルを回転させる回転角を算出する。第３に、回転軸および回転角に従って、クォータニオンでＣＧモデルのLeftLowLegベクトル（ボーン）を回転する。

　ここで、クォータニオンｑは、３次元空間における任意回転軸（λ_ｘ，λ_ｙ，λ_ｚ）まわりの角度θの回転を表現し、次の式（４）に示すように、４つのパラメータで表現することができる。

　また、モデル適用部２１は、図１６において黒丸に白抜きの数字に従った順番（フォワードキネマティクス）で、順次、方向ベクトルを回転させる処理を行う。

　即ち、１番目にLeftUpLegベクトルを回転させ、２番目にLeftLowLegベクトルを回転させ、３番目にRightUpLegベクトルを回転させ、４番目にRightLowLegベクトルを回転させる。そして、５番目に、Hipベクトルの中央からShoulderベクトルの中央に向かう方向ベクトルを回転させる。

　同様に、６番目にLeftArmベクトルを回転させ、７番目にLeftForeArmベクトルを回転させ、８番目にRightArmベクトルを回転させ、９番目にRightForeArmベクトルを回転させる。そして、１０番目に、Shoulderベクトルの中央から鼻を示す点１に向かう方向ベクトルを回転させる。

　このように、モデル適用部２１は、姿勢データをＣＧモデルに適用して、その姿勢データに従った姿勢のＣＧモデルを出力することができる。

　＜データ処理の処理例＞
　図１７は、データ処理装置１１が実行するデータ処理を説明するフローチャートである。

　ステップＳ１１において、３Ｄ姿勢推定部１２は、データ処理装置１１に入力された３Ｄデータに基づいて３Ｄの姿勢データを取得して、時系列処理部１５に供給する。または、２Ｄ姿勢推定部１３は、データ処理装置１１に入力された２Ｄデータに基づいて２Ｄの姿勢データを取得して３Ｄ変換部１４に供給し、３Ｄ変換部１４は、ＴＯＦデータを用いて２Ｄの姿勢データから３Ｄの姿勢データを取得して、時系列処理部１５に供給する。

　ステップＳ１２において、時系列処理部１５は、ステップＳ１１で３Ｄ姿勢推定部１２または３Ｄ変換部１４から供給された３Ｄの姿勢データに基づいて、同一の人物ごとに関連付けを行う時系列処理を行って、グローバル座標変換部１６に供給する。

　ステップＳ１３において、グローバル座標変換部１６は、ステップＳ１２で時系列処理部１５から供給された３Ｄの姿勢データの座標をグローバル座標に変換して、方向ベクトル変換部１７に供給する。

　ステップＳ１４において、方向ベクトル変換部１７は、ステップＳ１３でグローバル座標変換部１６から供給された３Ｄの姿勢データを方向ベクトル化し、方向ベクトルで表される姿勢データに変換して、データ修正処理部１８に供給する。

　ステップＳ１５において、データ修正処理部１８は、ステップＳ１４で方向ベクトル変換部１７から供給された方向ベクトルで表される姿勢データに対して、データクレンジング処理およびデータ補間処理を行うデータ修正処理を施し、姿勢分類部１９に供給する。

　ステップＳ１６において、姿勢分類部１９は、ステップＳ１５でデータ修正処理部１８から供給された姿勢データを所定の姿勢ごとに分類し、それぞれの姿勢のラベルを付与した姿勢データを、データ拡張部２０およびモデル適用部２１に供給する。

　ステップＳ１７において、データ拡張部２０は、ステップＳ１６で姿勢分類部１９から供給された姿勢データに対して、拡張用の姿勢データを組み合わせることによって姿勢データを拡張し、新たに生成された姿勢データをモデル適用部２１に供給する。

　ステップＳ１８において、モデル適用部２１は、ステップＳ１６で姿勢分類部１９から供給された姿勢データ、または、ステップＳ１７でデータ拡張部２０から供給された姿勢データを、ＣＧモデルに適用して、姿勢データに従った姿勢のＣＧモデルを出力する。

　以上のようなデータ処理を行うことによって、データ処理装置１１は、より多様な姿勢データが適用されたＣＧモデルを大量に出力することができる。このとき、データ処理装置１１は、３Ｄの姿勢データを方向ベクトルに変換して扱うことで、例えば、データ処理装置１１に入力された３Ｄデータまたは２Ｄデータにおける位置やサイズなどに依存しない正規化された姿勢データとして、ＣＧモデルに自動的に適用することができる。従って、ＣＧモデルに適用される姿勢データは、元の人物に起因するサイズに関する特徴などを失った各関節間の方向のみの情報となり、個人を特定できる情報を排した姿勢データとしてＣＧモデルに適用される。

　従って、データ処理装置１１では、３Ｄ姿勢推定部１２または２Ｄ姿勢推定部１３のＡＩによる姿勢推定などを入力として、現実世界を模した人物の姿勢を、人物のＣＧモデルに自動適用することができる。そして、データ処理装置１１では、個人を特定できる情報を排した姿勢データを用いることで、姿勢データを取り扱う際の利便性を向上させることができる。

　さらに、データ処理装置１１は、方向ベクトルで表される姿勢データの時系列に基づいて、着目した特定の部位（例えば、足）の方向ベクトルのＸ成分、Ｙ成分、およびＺ成分を特徴量として分析することで、所定の姿勢（例えば、静止姿勢や歩行姿勢）ごとに姿勢データを自動的に分類することができる。例えば、分類対象の動作に関連する部位の特徴量を組み合わせることで、姿勢データを分類する精度の向上を図ることができる。

　従って、所定の姿勢ごとに意味付けされた価値の高いデータとして姿勢データを扱うことができ、利便性を向上させることができる。例えば、人間が手作業で姿勢データを分類するのではなく、データ処理装置１１によって自動的に姿勢データを分類することで、大量データの処理を可能とすることができる。また、ＡＩに基づいた姿勢データの分類とは異なり、アノテーション作業などを含むデータセットの準備を不要とすることができる。

　なお、本実施の形態では、３Ｄ姿勢推定部１２または２Ｄ姿勢推定部１３のＡＩによる姿勢推定などを入力としているが、本技術は、例えば、モーションキャプチャ方式により取得された姿勢データに対して適用することができる。また、データ処理装置１１およびＴＯＦセンサをイメージセンサに組み込むことによって、イメージセンサにより撮像された画像に写されている人物の姿勢が適用されたＣＧモデルを、イメージセンサから出力する構成を実現することができる。

　＜コンピュータの構成例＞
　次に、上述した一連の処理（データ処理方法）は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。

　図１８は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示すブロック図である。

　プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク１０５やROM１０３に予め記録しておくことができる。

　あるいはまた、プログラムは、ドライブ１０９によって駆動されるリムーバブル記録媒体１１１に格納（記録）しておくことができる。このようなリムーバブル記録媒体１１１は、いわゆるパッケージソフトウェアとして提供することができる。ここで、リムーバブル記録媒体１１１としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory)，MO(Magneto Optical)ディスク，DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。

　なお、プログラムは、上述したようなリムーバブル記録媒体１１１からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク１０５にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。

　コンピュータは、CPU(Central Processing Unit)１０２を内蔵しており、CPU１０２には、バス１０１を介して、入出力インタフェース１１０が接続されている。

　CPU１０２は、入出力インタフェース１１０を介して、ユーザによって、入力部１０７が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)１０３に格納されているプログラムを実行する。あるいは、CPU１０２は、ハードディスク１０５に格納されたプログラムを、RAM(Random Access Memory)１０４にロードして実行する。

　これにより、CPU１０２は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU１０２は、その処理結果を、必要に応じて、例えば、入出力インタフェース１１０を介して、出力部１０６から出力、あるいは、通信部１０８から送信、さらには、ハードディスク１０５に記録等させる。

　なお、入力部１０７は、キーボードや、マウス、マイク等で構成される。また、出力部１０６は、LCD(Liquid Crystal Display)やスピーカ等で構成される。

　ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理（例えば、並列処理あるいはオブジェクトによる処理）も含む。

　また、プログラムは、１のコンピュータ（プロセッサ）により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。

　さらに、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

　また、例えば、１つの装置（または処理部）として説明した構成を分割し、複数の装置（または処理部）として構成するようにしてもよい。逆に、以上において複数の装置（または処理部）として説明した構成をまとめて１つの装置（または処理部）として構成されるようにしてもよい。また、各装置（または各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（または処理部）の構成の一部を他の装置（または他の処理部）の構成に含めるようにしてもよい。

　また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

　また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。換言するに、１つのステップに含まれる複数の処理を、複数のステップの処理として実行することもできる。逆に、複数のステップとして説明した処理を１つのステップとしてまとめて実行することもできる。

　なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

　なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術の一部または全部を、他の実施の形態において説明した本技術の一部または全部と組み合わせて実施することもできる。また、上述した任意の本技術の一部または全部を、上述していない他の技術と併用して実施することもできる。

　＜構成の組み合わせ例＞
　なお、本技術は以下のような構成も取ることができる。
（１）
　人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを複数の方向ベクトルで表す方向ベクトル変換部と、
　前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用するモデル適用部と
　を備えるデータ処理装置。
（２）
　前記方向ベクトルで表された前記姿勢データから、人間がとり得ない前記姿勢データを除去し、または、時系列の制約によって前記姿勢データを削除するデータクレンジング処理を行うデータ修正処理部
　をさらに備える上記（１）に記載のデータ処理装置。
（３）
　前記データ修正処理部は、除去または削除された前記姿勢データを、その前後の前記姿勢データを用いて補間するデータ補間処理を行う
　上記（２）に記載のデータ処理装置。
（４）
　前記姿勢データを所定の姿勢ごとに分類して、それぞれの姿勢のラベルを付与する姿勢分類部
　をさらに備える上記（１）から（３）までのいずれかに記載のデータ処理装置。
（５）
　前記姿勢分類部は、特定の前記方向ベクトルの移動標準偏差の閾値判定によって、前記姿勢データを分類する
　上記（４）に記載のデータ処理装置。
（６）
　ある前記姿勢データと、その前記姿勢データの所定の部位との類似性が高い他の前記姿勢データとを組み合わせることで、新たな前記姿勢データを生成するデータ拡張部
　をさらに備える上記（１）から（５）までのいずれかに記載のデータ処理装置。
（７）
　データ処理装置が、
　人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを複数の方向ベクトルで表すことと、
　前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用することと
　を含むデータ処理方法。
（８）
　データ処理を行うデータ処理装置のコンピュータに、
　人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを複数の方向ベクトルで表すことと、
　前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用することと
　を含むデータ処理を実行させるためのプログラム。

　なお、本実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　１１　データ処理装置，　１２　３Ｄ姿勢推定部，　１３　２Ｄ姿勢推定部，　１４　３Ｄ変換部，　１５　時系列処理部，　１６　グローバル座標変換部，　１７　方向ベクトル変換部，　１８　データ修正処理部，　１９　姿勢分類部，　２０　データ拡張部，　２１　モデル適用部

Claims

　人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを複数の方向ベクトルで表す方向ベクトル変換部と、
　前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用するモデル適用部と
　を備えるデータ処理装置。
　前記方向ベクトルで表された前記姿勢データから、人間がとり得ない前記姿勢データを除去し、または、時系列の制約によって前記姿勢データを削除するデータクレンジング処理を行うデータ修正処理部
　をさらに備える請求項１に記載のデータ処理装置。
　前記データ修正処理部は、除去または削除された前記姿勢データを、その前後の前記姿勢データを用いて補間するデータ補間処理を行う
　請求項２に記載のデータ処理装置。
　前記姿勢データを所定の姿勢ごとに分類して、それぞれの姿勢のラベルを付与する姿勢分類部
　をさらに備える請求項１に記載のデータ処理装置。
　前記姿勢分類部は、特定の前記方向ベクトルの移動標準偏差の閾値判定によって、前記姿勢データを分類する
　請求項４に記載のデータ処理装置。
　ある前記姿勢データと、その前記姿勢データの所定の部位との類似性が高い他の前記姿勢データとを組み合わせることで、新たな前記姿勢データを生成するデータ拡張部
　をさらに備える請求項１に記載のデータ処理装置。
　データ処理装置が、
　人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを複数の方向ベクトルで表すことと、
　前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用することと
　を含むデータ処理方法。
　データ処理を行うデータ処理装置のコンピュータに、
　人物の特定の特徴点で表される３Ｄの姿勢データを方向ベクトル化して、前記姿勢データを複数の方向ベクトルで表すことと、
　前記方向ベクトルで表された前記姿勢データを、人物のＣＧモデルに適用することと
　を含むデータ処理を実行させるためのプログラム。