JP2022027395A - 姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラム - Google Patents

姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラム Download PDF

Info

Publication number
JP2022027395A
JP2022027395A JP2020199646A JP2020199646A JP2022027395A JP 2022027395 A JP2022027395 A JP 2022027395A JP 2020199646 A JP2020199646 A JP 2020199646A JP 2020199646 A JP2020199646 A JP 2020199646A JP 2022027395 A JP2022027395 A JP 2022027395A
Authority
JP
Japan
Prior art keywords
data
machine learning
model
dimensional
posture estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020199646A
Other languages
English (en)
Other versions
JP6868875B1 (ja
Inventor
英慈 黒田
Eiji Kuroda
将寛 林
Masahiro Hayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
I Enter Corp
Original Assignee
I Enter Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by I Enter Corp filed Critical I Enter Corp
Application granted granted Critical
Publication of JP6868875B1 publication Critical patent/JP6868875B1/ja
Publication of JP2022027395A publication Critical patent/JP2022027395A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】仮想空間上のデータを使用して機械学習用データを効率的に作成し、生体の姿勢推定を実行することができる姿勢推定学習システムを提供する。【解決手段】姿勢推定学習システム1の姿勢推定データ作成装置10Aは、撮像部2と、生体の3次元モデルを用いて機械学習用データを作成する機械学習用データ作成部3を備える。姿勢推定装置10Bは、機械学習用データに基づいて生体の姿勢推定を学習する機械学習部5と、機械学習により得られた姿勢推定学習モデル6に基づいて入力画像中の生体の姿勢を推定する姿勢推定部7を備える。機械学習用データ作成部3は、撮像部2により3次元モデルを撮像して得られる3次元骨格データと、3次元骨格データを2次元座標に射影した2次元骨格データと、撮像された画像から、3次元モデルの部分と背景の部分とを分離したクロマキー背景画像データQとを作成し、これらは、機械学習用データの作成に用いられる。【選択図】図1

Description

本発明は、生体の姿勢を推定する姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラムに関する。
近年、特にスポーツの分野において、競技者の動作の解析が行われている。具体的には、競技者のプレーを高性能カメラで撮像し、コンピュータを用いて単位時間毎の身体(骨格や筋肉)の動作を分析する。
例えば、特許文献1の骨格検出装置は、3次元カメラ、CPU、ROM、RAM等を備えている。ここで、3次元カメラは、人物等が存在する撮像対象空間を撮像し、3次元データを出力する装置である。また、3次元データは、直交する3軸方向に並ぶ各画素に対して、その階調情報(例えば、RGB)を与えた距離画像である。
3次元カメラ(撮像部)の距離画像生成部は、距離画像センサから出力されるセンサ上の画素毎の位相差情報を用いて、当該画素毎にその距離情報を算出する。そして、距離画像生成部は、得られたセンサ上の各画素の階調情報と距離情報に基づき、3次元配列された各画素位置に対してその階調情報を関連付けた距離画像を生成する。
また、距離画像生成部は、距離画像から骨格推定の対象画素を抽出し、骨格推定の対象画素にマークをつけた距離画像を、通信部を介して骨格推定部に送信する。例えば、距離画像生成部は、人物等の撮像対象が撮像対象空間に存在するときに撮像して得られた距離画像と、撮像対象が存在しないときに同一の撮像対象空間を撮像して得られた距離画像との間で対応する画素の距離情報の差分を算出する。そして、距離画像生成部は、距離情報の差分がゼロでない画素を骨格推定の対象画素として抽出する(特許文献1/段落0013,0026,0027、図1-3)。
また、特許文献2の情報処理システムは、情報処理装置、画像出力装置、記憶装置及び表示装置を備えている。情報処理装置は、例えば、画像出力装置から出力された画像(又は入力画像)の画像データから学習データを生成する。その際、情報処理装置は、入力画像のうち特定の部位を表す部分領域の画像データを抽出し、部分領域の画像データに対して、拡大や縮小、回転などの部位変換処理を施す。
情報処理装置は、部位変換処理後の画像データを、部分領域が抽出された元の入力画像の画像データに合成することで、学習データを生成する。この情報処理装置では、1枚の入力画像に対して複数のバリエーションの画像を生成し、複数の画像の画像データを学習データとして生成する。学習データは、例えば、他の装置において、監視カメラで撮像された画像に対して、機械学習により画像認識が行われる際の学習データとして用いられる(特許文献2/段落0023,0024、図1)。
特開2019-211850号公報 特開2020-060883号公報
しかしながら、特許文献1の骨格検出装置は、3次元カメラの画像を大量に必要とし、骨格推定の対象画素を抽出するまでに多数の画像処理を行う必要もある。また、特許文献2の情報処理装置は、1枚の入力画像に対して複数のバリエーションの画像を生成して学習データを生成できるが、入力データの作成までに領域の分割、部位の抽出、変換、合成等の処理が必要となり、作業に手間、時間がかかることが予想される。
さらに、姿勢推定(骨格推定)は、現実画像中の被写体に対して行うのが一般的であるため、仮想空間に配置された3次元モデルの画像を用いて学習するだけでは、単なる置き換えに過ぎず、うまく姿勢の推定が行えない。
本発明は、このような事情に鑑みてなされたものであり、仮想空間上のデータを使用して機械学習用データを効率的に作成し、生体の姿勢推定を実行することができる姿勢推定学習システムを提供することを目的とする。
本発明は、仮想空間に配置した生体の3次元モデルを用いて機械学習により生体の姿勢を推定する姿勢推定学習システムであって、撮像部と、前記3次元モデルを前記撮像部により撮像し、機械学習用データを作成する機械学習用データ作成部と、前記機械学習用データ作成部により作成された前記機械学習用データに基づいて、前記生体の姿勢推定を学習する機械学習部と、前記機械学習部が学習した判断基準を有する学習モデルに基づいて、入力画像中の生体の姿勢を推定する姿勢推定部と、を備え、
前記機械学習用データ作成部は、前記撮像部により前記3次元モデルを撮像して得られる3次元座標空間の前記生体の骨格情報である3次元骨格データと、前記3次元骨格データを2次元座標に射影した2次元骨格データと、前記3次元モデルを撮像して得られる画像から、前記3次元モデルの部分と背景の部分とを前記3次元モデルの輪郭で分離した加工画像データと、を作成することを特徴とする。
本発明の姿勢推定学習システムにおいて、機械学習用データ作成部は、仮想空間に配置した生体の3次元モデル(例えば、マネキン)を用いて、機械学習用データを作成する。3次元モデルを用いることで、従来は取得することが困難であった姿勢を再現したり、撮像が困難なアングルからデータを作成したりすることができる。具体的には、撮像部により当該生体の3次元モデルを撮像し、その3次元骨格データを取得する。なお、骨格データとは、当該生体の肩、肘、腰等の部位の骨格位置(座標)を抽出したデータである。
また、機械学習用データ作成部は、当該3次元骨格データから2次元骨格データを作成し、さらに撮像された画像から3次元モデルの部分と背景の部分とを分離した加工画像データを作成する。2次元骨格データ、3次元骨格データ及び加工画像データは、当該生体の姿勢を機械学習するための機械学習用データの作成に用いることができる。特に、加工画像データは、背景画像を差し替えることができるため、3次元モデルの画像だけではなく、様々な現実の画像を背景画像とすることができる。背景画像の差し替えにより、画像のバリエーションが増加し、現実画像の推論へのギャップが減少するため、結果として精度の高い姿勢推定の実行に繋がる。
前記機械学習部は、作成された機械学習用データに基づいて生体の姿勢推定を学習するので、当該生体の姿勢を推定する学習モデルが得られる。そして、姿勢推定部は、当該学習モデルの判断基準に基づいて入力画像(例えば、RGB画像)中の生体の姿勢を推定する。このように、本システムは、機械学習用データを効率的に作成し、機械学習を行い、生体(被写体)の姿勢推定を実行することができる。
本発明の姿勢推定学習システムにおいて、前記機械学習用データ作成部は、任意のモーションデータを用いて前記3次元モデルを仮想空間上で動作させ、前記3次元モデルの動作に応じた前記3次元骨格データを抽出することが好ましい。
本発明では、生体の3次元モデルと、任意の動作に関するモーションデータとを組み合わせて、当該3次元モデルを仮想的に動作させる。例えば、1つのモーションデータから、様々な体格のデータを複製したりすることも可能となる。機械学習用データ作成部は、当該3次元モデルの動作に応じた3次元骨格データを抽出し、さらに当該3次元骨格データと対になる画像データを取得する。これにより、様々なパターンの機械学習用データを効率的かつ容易に作成することができる。
本発明の姿勢推定学習方法は、仮想空間に配置した生体の3次元モデルを用いて機械学習用データを作成する機械学習用データ作成処理と、前記機械学習用データ作成処理で作成した前記機械学習用データに基づいて、前記生体の姿勢推定を学習する機械学習処理と、前記機械学習処理で学習した判断基準に基づいて、入力画像中の生体の姿勢を推定する姿勢推定処理と、を備え、
前記機械学習用データ作成処理は、撮像装置により前記3次元モデルを撮像する第1のステップと、前記仮想空間上の座標から3次元座標空間の前記生体の骨格情報である3次元骨格データを取得する第2のステップと、前記3次元骨格データを2次元座標に射影した2次元骨格データを作成する第3のステップと、前記仮想空間において前記3次元モデルの背景を変更した状態で前記撮像装置により前記3次元モデルを撮像し、前記3次元モデルの部分と前記背景の部分とを前記3次元モデルの輪郭で分離した加工画像データを作成する第4のステップと、を有し、前記3次元モデルを撮像する方位角又は仰角を変化させながら、前記第1のステップから前記第4のステップを繰り返し実行することを特徴とする。
本発明の姿勢推定学習方法では、機械学習用データ作成処理にて生体の3次元モデルから機械学習用データを作成する。3次元モデルを用いることで、従来は取得することが困難であった姿勢を再現したり、撮像が困難なアングルからデータを作成したりすることができる。加工画像データは、背景画像を差し替えることができるため、3次元モデルの画像だけではなく、様々な現実の画像を背景画像とすることができる。背景画像の差し替えにより、画像のバリエーションが増加し、現実画像の推論へのギャップが減少するため、結果として精度の高い姿勢推定の実行に繋がる。
その後、機械学習用データ作成処理にて作成された機械学習用データに基づいて生体の姿勢推定を学習する。これにより、当該生体の姿勢を推定する判断基準が得られる。さらに、姿勢推定処理にて、当該判断基準に基づいて入力画像中の生体の姿勢を推定する。このように、本方法は、機械学習用データを効率的に作成して機械学習させることで、生体(被写体)の姿勢推定を実行することができる。
機械学習用データ作成処理の第1、第2のステップでは、生体の3次元モデルを撮像装置で撮像して、仮想空間上の座標から3次元座標空間の当該3次元モデルの3次元骨格データを取得する。次に、第3のステップでは、3次元骨格データから2次元骨格データを作成する。2次元骨格データ及び3元骨格データは、当該生体の姿勢を機械学習するための機械学習用データとすることができる。
機械学習用データ作成処理の第4のステップでは、仮想空間において背景を変更(例えば、黒色背景)した状態で、撮像装置により生体の3次元モデルを撮像する。これにより、当該生体の3次元モデルの部分と背景の部分とが明確になるので、当該生体の3次元モデルの輪郭で分離(2値化)した加工画像データを取得する。当該加工画像データは、機械学習用データのパターンを増加させる目的で利用することができる。
本発明の姿勢推定学習方法において、前記機械学習用データを加工する機械学習用データ加工処理をさらに備え、前記機械学習用データ加工処理は、前記加工画像データの前記3次元モデルの部分と所定の背景とを組み合わせた合成画像データを作成する第5のステップと、前記合成画像データのうち前記生体の部分の色調を変更する第6のステップと、前記合成画像データに対してノイズの付与又は境界の平滑化を行う第7のステップと、を有し、前記第5のステップから前記第7のステップの少なくとも1つを実行することが好ましい。
本発明の姿勢推定学習方法は、機械学習用データ加工処理を備えており、第5のステップでは、輪郭で分離した生体の部分と所定の背景を組み合わせた合成画像データを作成する。これにより、機械学習用データのパターンを増加させることができる。また、前記合成画像データのうち生体の部分の色調を変更したり(第6のステップ)、前記合成画像データに対してノイズの付与又は境界の平滑化を行ったり(第7のステップ)して、機械学習用データのパターンを増加させてもよい。
本発明は、仮想空間に配置した生体の3次元モデルを用いて、前記生体の姿勢推定を機械学習させる機械学習用データの作成プログラムであって、
コンピュータにより前記3次元モデルを撮像し、3次元座標空間の前記生体の骨格情報である3次元骨格データを取得するステップと、前記コンピュータにより、前記3次元骨格データを2次元座標に射影して2次元骨格データを作成するステップと、前記3次元モデルを撮像して得られる画像から、前記3次元モデルの部分と背景の部分とを前記3次元モデルの輪郭で分離した加工画像データを作成するステップと、を備えることを特徴とする。
この構成によれば、機械学習用データの作成プログラムは、コンピュータ(撮像機能)により生体の3次元モデルを撮像して、コンピュータの各種処理により3次元骨格データを取得する。さらに、コンピュータにより3次元骨格データを2次元座標に射影することで、2次元骨格データを作成し、撮像された画像から3次元モデルの部分と背景の部分とを分離した加工画像データを作成する。加工画像データは、背景画像を差し替えることができるため、3次元モデルの画像だけではなく、様々な現実の画像を背景画像とすることができる。本プログラムは、機械学習用データとして利用可能な2次元骨格データ、3元骨格データ及び加工画像データを効率的かつ容易に作成することができる。
本発明の姿勢推定学習システムの概要を説明する図。 本発明の姿勢推定学習方法のフローチャート。 姿勢推定学習方法のデータ作成処理のフローチャート。 3次元モデルの撮像ポイントを説明する図。 3次元モデルの画像データの例。 (a)3次元モデルの2次元画像データの例。(b)3次元モデルのクロマキー背景画像データの例。 姿勢推定学習方法の機械学習用データ加工処理のフローチャート。 3次元モデルの背景合成画像データの例。 (a)3次元モデルの色調を変換した合成画像データの例。(b)画像全体にノイズを付与する処理を実行した合成画像データの例。 (a)機械学習用データ作成用の画像データを増強する手法(周辺にオブジェクトを配置)。(b)機械学習用データ作成用の画像データを増強する手法(ライトで照射)。 姿勢推定学習方法の姿勢推定処理のフローチャート。
以下では、図面を参照しながら、本発明に係る姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラムの実施形態について説明する。
初めに、図1は、姿勢推定学習システム1の概要を示している。姿勢推定学習システム1は、主に姿勢推定データ作成装置10Aと姿勢推定装置10Bとで構成されている。姿勢推定データ作成装置10Aは、機械学習に用いる機械学習用データを作成する。また、姿勢推定装置10Bは、実際に機械学習用データを用いて機械学習を行い、判断用の姿勢推定学習モデル6を作成する。
姿勢推定学習モデル6を用いると、生体が映り込んだ入力画像(例えば、RGB画像)を入力することで、当該生体の姿勢を推定した姿勢推定結果データが得られる。ここで、「生体」とは人間に限られず、犬や馬、熊等の動物であってもよい。なお、姿勢を推定する生体に合わせて機械学習用データを準備する必要がある。
まず、姿勢推定データ作成装置10Aは、撮像部2と、機械学習用データ作成部3とで構成されている。機械学習用データ作成部3は、撮像部2により撮像された画像データ(画像ファイル)等に基づいて、機械学習用データを作成する。
撮像部2は、仮想空間を撮像可能なカメラである。いわゆるマネキンのような3次元モデルを仮想空間(ゲームエンジン等)に配置して可視化し、当該3次元モデルを方位角や仰角を変化させながら、撮像部2により複数回、撮像する。例えば、3次元モデルを正面側から撮像した場合、3次元モデルの2次元座標(X軸、Y軸)の画像データが得られるが、斜め45°の角度から撮像した場合、3次元モデルの側面、すなわちZ軸方向まで映り込む。
機械学習用データ作成部3は、3次元モデルの形状を抽出(セグメンテーション)する。そして、機械学習用データ作成部3は、仮想空間上の座標から3次元モデルの肩、肘、腰等の部位の骨格位置(骨格アノテーション)である3次元骨格データと、これと対になる画像データを取得する。さらに、機械学習用データ作成部3は、3次元骨格データを平面に投影した2次元骨格データを作成し、これら各種データを機械学習用データとする。
このように、仮想空間上の3次元モデルを用いると、従来のモーションキャプチャでは取得することが難しかった姿勢を再現したり、1つのモーションデータから様々な体格のデータを複製したりすることが可能となる。また、撮影が難しいアングルの撮像を行う等して、撮影画像やデータのバリエーションを容易に増やすことができる。
次に、姿勢推定装置10Bは、機械学習部5と、姿勢推定学習モデル6と、姿勢推定部7とで構成されている。機械学習部5は、機械学習用データ作成部3により作成された機械学習用データに基づいて、生体の姿勢推定を学習し、姿勢推定学習モデル6(本発明の「学習モデル」)を作成、又は更新する。機械学習は、深層(強化)学習(畳み込みニューラルネットワーク等)を採用することが好ましい。
姿勢推定部7は、作成された姿勢推定学習モデル6の判断基準に基づいて、生体の姿勢推定を行う。すなわち、姿勢推定の際、機械学習の成果として得られた姿勢推定学習モデル6を参照する。
具体的には、姿勢推定を行いたい生体が映り込んだ入力画像を入力すると、当該生体の姿勢を推定した姿勢推定結果データが出力される。なお、姿勢推定結果データは、入力画像の生体に対して骨格の位置を示したデータである。骨格の位置を線で結んで姿勢を表現すれば、姿勢の視認性が向上するが、必須の処理ではない。また、併せて、解析結果画像(解析用の骨格の位置を示したJSONファイル)の出力も可能である。ここで、JSONファイルとは所定の形式のテキストデータであり、機械学習用データとなる。
このように、姿勢推定学習システム1は、機械学習用データの作成から機械学習、実際の姿勢推定までを実行可能であるため、画像処理や機械学習の知識に乏しい者でも、容易に姿勢推定の結果を得ることができる。本実施形態では、姿勢推定データ作成装置10Aと姿勢推定装置10Bとは、それぞれの作業を担当する別個の装置としているが、一体の装置であってもよい。
次に、図2を参照して、姿勢推定データ作成装置10A及び姿勢推定装置10Bを用いた姿勢推定学習方法のデータ作成処理について説明する。
まず、姿勢推定データ作成装置10Aは、機械学習用データ作成処理を実行する(STEP01)。図3は、機械学習用データ作成処理の詳細を示したフローチャートである。以下では、適宜、図4~図6を参照して、説明を補足する。
まず、姿勢推定データ作成装置10A(撮像部2)は、3次元モデルを撮像する(STEP11)。例えば、撮像部2は、仮想空間に置かれた3次元モデルを正面側から撮像する。
図4は、撮像部2による3次元モデルMの撮像ポイントを示している。撮像部2は、3次元モデルMを水平視点(仰角0°)において、ポイント(0)~(7)の8地点(中心O)から撮像する。また、3次元モデルMを仰望視点(仰角45°)において、ポイント(8)~(15)の8地点(中心O’)から撮像し、さらに、俯瞰視点のポイント(16)でも撮像する。俯瞰視点は、3次元モデルMを真上(仰角90°)から見下ろす視点であり、撮像回数は1回である。
図4では、撮像部2が仮想空間内の各ポイントを移動し、3次元モデルMを撮像することを示しているが、撮像部2を固定し、3次元モデルMの方を回転させて撮像してもよい。
図3のフローチャートに戻り、姿勢推定データ作成装置10A(機械学習用データ作成部3)は、3次元骨格データを取得する(STEP12)。例えば、3次元モデルを正面側(図4のポイント(0))から撮像するとXY平面座標の画像データとなるが、3次元モデルを側面側(図4のポイント(2))から撮像すると、YZ平面座標の画像データとなる。このため、当該画像データを撮像すると共に、仮想空間上の座標から体の部位の位置を特定して、3次元骨格データを作成する。
図5は、3次元モデルMを水平視点のポイント(0)から撮像したときの画像データを示している。3次元モデルMが人間の場合、図示するように、下半身に(a)右足首、(b)右膝、(c)右腰(右足の付け根)、(d)左腰(左足の付け根)、(e)左膝、(f)左足首、(g)腰(中心)の部位がある。
また、上半身に(h)胸部、(i)首の付け根、(j)頭頂部、(k)右手首、(l)右肘、(m)右肩、(n)左肩、(о)左肘、(p)左手首の部位がある。これらの3次元モデルMの各部位の位置を示したデータが、3次元骨格データである。なお、3次元モデルMの左右の目、左右の耳、鼻や口の位置を部位に加えてもよい。骨格は任意の場所を指定することが可能であるが、条件として人の目で判断できる部位であることが好ましい。従って、肘は部位として指定できるが、顎関節等は困難である。
図3のフローチャートに戻り、姿勢推定データ作成装置10Aは、2次元骨格データを作成する(STEP13)。2次元骨格データは、上述の3次元骨格データを2次元座標に射影(透視投影)して作成したデータである。2次元骨格データ及び3次元骨格データは、共に機械学習用データとして利用される。このように、姿勢推定データ作成装置10Aは、3次元モデルを撮像部2により撮像して、多くの機械学習用データを効率的かつ短時間で作成することができる。
次に、姿勢推定データ作成装置10Aは、背景変更して3次元モデルを撮像し、クロマキー背景画像データを作成する(STEP14)。
ここで、図6を参照して、STEP14の画像作成の詳細を説明する。まず、図6(a)は、上述のSTEP11にて、撮像部2が3次元モデルを正面側(図4のポイント(0))から撮像したときの2次元画像データPの例であり、クロマキー背景画像データとの比較のため示した。図示するように、2次元画像データPの中央には、3次元モデルMが映り込んでいる。
また、図6(b)は、クロマキー背景画像データQ(本発明の「加工画像データ」)を示している。クロマキー背景画像データQの作成のため、仮想空間上で3次元モデルM以外の背景部分を黒色に変更し、撮像部2により撮像を行う。これにより、3次元モデルMの輪郭が抽出されるので、輪郭データとして保存する。そして、3次元モデルMの部分とその輪郭外側の背景部分とで分離(2値化)し、クロマキー背景画像データQを合成する。
上記処理によって3次元モデルMの輪郭が明確化されるため、さらに、当該輪郭の最大値、最小値を取得して3次元モデルMを囲む矩形枠F(矩形枠データ)を作成する。なお、矩形枠データは数値のデータであり、実際には、クロマキー背景画像データQに描画されない。クロマキー背景画像データQは、姿勢推定装置10Bによる姿勢推定の前処理(機械学習用データ加工処理)にて用いられる。
図3のフローチャートに戻り、3次元モデルを1つの視点で一周撮像したか否かが判定される(STEP15)。例えば、水平視点において、撮像部2によるポイント(0)~(7)(図4参照)の一周撮像が完了していない場合にはSTEPS16に進み、完了した場合にはSTEP17に進む。
一周撮像が完了していない場合(STEP15で「NO」)、方位角を45°回転させ(STEP16)、その後、STEP11にリターンする。例えば、前回のSTEP11における撮像がポイント(0)であった場合には、当該リターン後は、ポイント(1)にて撮像部2が3次元モデルMを撮像し、以降のステップを実行する。
一方、一周の撮像が完了した場合(STEP15で「YES」)、水平視点、仰望視点、俯瞰視点で撮像したか否かが判定される(STEP17)。例えば、水平視点での撮像は完了したが、仰望視点と俯瞰視点での撮像が完了していないような場合にはSTEP18に進み、全て完了した場合にはSTEPS19に進む。
撮像していない視点が残っている場合(STEP17で「NO」)、視点を変更して(STEP18)、その後、STEP11にリターンする。例えば、水平視点での撮像が完了した場合には、当該リターン後は、仰望視点のポイント(8)にて撮像部2が3次元モデルMを撮像し、以降のステップを実行する。もちろん、水平視点の後に俯瞰視点に移行し、最後に仰望視点に移行する順番でもよい。
一方、全視点での撮像が完了した場合(STEP17で「YES」)、画像(2次元画像データ、クロマキー背景画像データ)と、画像情報(骨格データ、輪郭データ、矩形枠データ等)をJSONファイルに出力する(STEP19)。以上で、一連の機械学習用データ作成処理のフローが終了となる。
図2のフローチャートに戻り、その後、姿勢推定データ作成装置10Aは、機械学習用データ加工処理を実行する(STEP02)。これは、既存の機械学習用データを加工して、新たな機械学習用データのパターンを作成する処理である。そして、図7は、機械学習用データ加工処理の詳細を示したフローチャートである。以下では、適宜、図8、図9を参照して、説明を補足する。
まず、姿勢推定データ作成装置10A(機械学習用データ作成部3)は、クロマキー背景画像データから背景合成画像データを作成する(STEP21)。
図8は、背景合成画像データRの例を示している。具体的には、クロマキー背景画像データQ(図6(b)参照)の輪郭データを用いて3次元モデルMの画素を抽出し、異なる背景画像に貼付して背景合成画像データRを作成する。
図7のフローチャートに戻り、姿勢推定データ作成装置10Aは、3次元モデルの色調を変換する(STEP22)。その後、さらに全体の画像処理を実行する(STEP23)。
ここで、図9(a)は、背景合成画像データRのうち、3次元モデルMの部分の色調を変更した合成画像データSを示している。合成画像データSは、新たな機械学習用データとなる。今回、背景合成画像データRを加工したが、2次元画像データP(図6(a)参照)において、3次元モデルMの部分の色調を変更した画像も新たな機械学習用データとなり得る。
また、図9(b)は、背景合成画像データRに対して画像全体にノイズを付与した合成画像データTを示している。合成画像データTについても、新たな機械学習用データとなり得る。背景合成画像データRに対して、平滑化フィルタ等の処理を施した画像であってもよい。以上で、一連の機械学習用データ加工処理のフローが終了となる。
姿勢推定は、現実画像中の被写体に対して行うのが一般的であるため、仮想空間上においても3次元モデルの画像を学習するだけでは、うまく姿勢を推定することができない。本発明では、上述のように背景画像の差し替えを行うことができるため、3次元モデルの画像だけではなく、様々な現実の画像を背景画像とすることができる。背景画像の差し替えにより、画像のバリエーションが増加し、現実画像の推論へのギャップが減少する。
もちろん、現実画像(実際の写真)を使用したり、仮想空間において3次元モデル(オブジェクト)を複数配置したり、それらの色調や大きさをプログラムで変化させる等の方法を採用したりしてもよい。このような画像のバリエーションを増やす作業は、結果として精度の高い姿勢推定の実行に繋がる。
図2のフローチャートに戻り、その後、姿勢推定装置10B(機械学習部5)は、機械学習処理を実行する(STEP03)。上述の機械学習用データ作成処理及び機械学習用データ加工処理により、機械学習用データを多数用意することができるので、姿勢推定の精度向上につながる。また、本処理によって、姿勢推定学習モデル6が作成される(図1参照)。以上で、一連のデータ作成処理のフローが終了となる。
機械学習用データ作成用の画像データの増強は、上記以外の方法で行うこともできる。図10(a)は、仮想空間上でランダムにオブジェクトを配置した状態で、3次元モデルNを撮像した例である。
例えば、実際に、スポーツのシーンを撮像したとき、注目する競技者の周辺に当該競技者を遮蔽する他の競技者や物体が存在することがある。このような場合に対応できるように、3次元モデルNの周辺にランダムに大きさ、形状、色彩等が異なるオブジェクトを配置して画像データUを取得し、新たな機械学習用データを作成する。なお、機械学習用データ加工処理にて、事後的にオブジェクトを追加する作業を行い、新たな機械学習用データを作成してもよい。
また、図10(b)に示すように、仮想空間上で3次元モデルNをライトLで照射し、周辺に光の陰影を付加した状態で3次元モデルNを撮像してもよい。被写体が日光や照明で照射された際の逆光や白光等に対応できるように、光源から様々な光を出射して3次元モデルNの影を付加した画像データVを取得し、新たな機械学習用データを作成する。
3次元モデルと任意のモーションデータとを組み合わせて3次元モデルを仮想空間上で動作させてもよい。これにより、3次元骨格データと、当該3次元骨格データと対になる画像データと、当該3次元骨格データから作成される2次元骨格データとが取得可能である。これらのデータは、限定的な目的(スポーツ、ダンス等の分野)に使用されるが、精度の高い姿勢推定のために必要な機械学習用データとなる。
また、モーションデータとは別に、3次元モデルの関節駆動域を考慮してランダムに関節を曲げる動作をさせてもよい。作成した骨格データは、汎用性の高い姿勢推定を行うための新たな機械学習用データとなり得る。
最後に、図11を参照して、姿勢推定装置10Bを用いた姿勢推定学習方法の姿勢推定処理について説明する。
まず、姿勢推定装置10Bに姿勢を推定する生体が映り込んだ入力画像を入力する(STEP31)。当該入力画像はRGB画像が好ましいが、他のフォーマットでもよい。
次に、姿勢推定装置10B(姿勢推定部7)は、姿勢推定処理を実行する(STEP32)。具体的には、姿勢推定装置10B(姿勢推定部7)が姿勢推定学習モデル6の判断基準に基づいて、入力画像中の生体の姿勢を推定する。最後に、姿勢推定装置10Bは、当該入力画像に骨格情報を付加した結果データを出力する(STEP33)。以上で、一連の姿勢推定処理のフローが終了となる。
以上、本発明を実施するための実施形態を説明したが、本発明は上記の実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において、適宜変更することができる。
上記実施形態では、3次元モデルは人間であったが、人間以外の動物であってもよい。本発明は、人間を含めた様々な生体の骨格データを機械学習させることで、入力画像中の生体の種類を判別したり、入力画像中のピクセルを意味に基づいて分類(いわゆる、セマンティックセグメンテーション)したりする技術に応用することができる。
また、本発明は、物体等の判別にも応用可能である。撮像部が物体を検出した場合、その矩形枠を作成して、機械学習用データを作成する。そして、この機械学習用データに基づいて機械学習させることで、その物体が何であるかの判別を精度良く行うことができる。
1…姿勢推定学習システム、2…撮像部、3…機械学習用データ作成部、5…機械学習部、6…姿勢推定学習モデル、7…姿勢推定部、10A…姿勢推定データ作成装置、10B…姿勢推定装置。
本発明は、仮想空間に配置した生体の3次元モデルを用いて機械学習により生体の姿勢を推定する姿勢推定学習システムであって、撮像部と、前記3次元モデルを前記撮像部により方位角又は仰角を変化させて複数回撮像し、機械学習用データを作成する機械学習用データ作成部と、前記機械学習用データ作成部により作成された前記機械学習用データに基づいて、前記生体の姿勢推定を学習する機械学習部と、前記機械学習部が学習した判断基準を有する学習モデルに基づいて、入力画像中の生体の姿勢を推定する姿勢推定部と、を備え、
前記機械学習用データ作成部は、前記撮像部により前記3次元モデルを撮像して得られる3次元座標空間の前記生体の骨格情報である3次元骨格データと、前記3次元骨格データを2次元座標に射影した2次元骨格データと、前記3次元モデルを撮像して得られる画像から、前記3次元モデルの部分と背景の部分とを前記3次元モデルの輪郭で分離した加工画像データと、を作成することを特徴とする。
本発明の姿勢推定学習システムにおいて、機械学習用データ作成部は、仮想空間に配置した生体の3次元モデル(例えば、マネキン)を用いて、機械学習用データを作成する。3次元モデルを用いることで、従来は取得することが困難であった姿勢を再現したり、撮像が困難なアングルからデータを作成したりすることができる。具体的には、撮像部により当該生体の3次元モデルを方位角又は仰角を変化させて複数回撮像し、その3次元骨格データを取得する。なお、骨格データとは、当該生体の肩、肘、腰等の部位の骨格位置(座標)を抽出したデータである。また、機械学習用データ作成部は、当該3次元骨格データから2次元骨格データを作成し、さらに撮像された画像から3次元モデルの部分と背景の部分とを分離した加工画像データを作成する。2次元骨格データ、3次元骨格データ及び加工画像データは、当該生体の姿勢を機械学習するための機械学習用データの作成に用いることができる。
本発明は、生体の姿勢推定を機械学習させる機械学習用データの作成プログラムであって、
コンピュータにより、仮想空間に配置した前記生体の3次元モデルを方位角又は仰角を変化させて複数回撮像し、3次元座標空間の前記生体の骨格情報である3次元骨格データを取得するステップと、前記コンピュータにより、前記3次元骨格データを2次元座標に射影して2次元骨格データを作成するステップと、前記3次元モデルを撮像して得られる画像から、前記3次元モデルの部分と背景の部分とを前記3次元モデルの輪郭で分離した加工画像データを作成するステップと、を備えることを特徴とする。
この構成によれば、機械学習用データの作成プログラムは、コンピュータ(撮像機能)により生体の3次元モデルを方位角又は仰角を変化させて複数撮像して、コンピュータの各種処理により3次元骨格データを取得する。さらに、コンピュータにより3次元骨格データを2次元座標に射影することで、2次元骨格データを作成し、撮像された画像から3次元モデルの部分と背景の部分とを分離した加工画像データを作成する。本プログラムは、機械学習用データとして利用可能な2次元骨格データ、3元骨格データ及び加工画像データを効率的かつ容易に作成することができる。

Claims (5)

  1. 仮想空間に配置した生体の3次元モデルを用いて機械学習により生体の姿勢を推定する姿勢推定学習システムであって、
    撮像部と、
    前記3次元モデルを前記撮像部により撮像し、機械学習用データを作成する機械学習用データ作成部と、
    前記機械学習用データ作成部により作成された前記機械学習用データに基づいて、前記生体の姿勢推定を学習する機械学習部と、
    前記機械学習部が学習した判断基準を有する学習モデルに基づいて、入力画像中の生体の姿勢を推定する姿勢推定部と、
    を備え、
    前記機械学習用データ作成部は、
    前記撮像部により前記3次元モデルを撮像して得られる3次元座標空間の前記生体の骨格情報である3次元骨格データと、
    前記3次元骨格データを2次元座標に射影した2次元骨格データと、
    前記3次元モデルを撮像して得られる画像から、前記3次元モデルの部分と背景の部分とを前記3次元モデルの輪郭で分離した加工画像データと、
    を作成することを特徴とする姿勢推定学習システム。
  2. 前記機械学習用データ作成部は、任意のモーションデータを用いて前記3次元モデルを仮想空間上で動作させ、前記3次元モデルの動作に応じた前記3次元骨格データを抽出することを特徴とする請求項1に記載の姿勢推定学習システム。
  3. 仮想空間に配置した生体の3次元モデルを用いて機械学習用データを作成する機械学習用データ作成処理と、
    前記機械学習用データ作成処理で作成した前記機械学習用データに基づいて、前記生体の姿勢推定を学習する機械学習処理と、
    前記機械学習処理で学習した判断基準に基づいて、入力画像中の生体の姿勢を推定する姿勢推定処理と、
    を備え、
    前記機械学習用データ作成処理は、
    撮像装置により前記3次元モデルを撮像する第1のステップと、
    前記仮想空間上の座標から3次元座標空間の前記生体の骨格情報である3次元骨格データを取得する第2のステップと、
    前記3次元骨格データを2次元座標に射影した2次元骨格データを作成する第3のステップと、
    前記仮想空間において前記3次元モデルの背景を変更した状態で前記撮像装置により前記3次元モデルを撮像し、前記3次元モデルの部分と前記背景の部分とを前記3次元モデルの輪郭で分離した加工画像データを作成する第4のステップと、を有し、
    前記3次元モデルを撮像する方位角又は仰角を変化させながら、前記第1のステップから前記第4のステップを繰り返し実行することを特徴とする姿勢推定学習方法。
  4. 前記機械学習用データを加工する機械学習用データ加工処理をさらに備え、
    前記機械学習用データ加工処理は、
    前記加工画像データの前記3次元モデルの部分と所定の背景とを組み合わせた合成画像データを作成する第5のステップと、
    前記合成画像データのうち前記生体の部分の色調を変更する第6のステップと、
    前記合成画像データに対してノイズの付与又は境界の平滑化を行う第7のステップと、を有し、
    前記第5のステップから前記第7のステップの少なくとも1つを実行することを特徴とする請求項3に記載の姿勢推定学習方法。
  5. 仮想空間に配置した生体の3次元モデルを用いて、前記生体の姿勢推定を機械学習させる機械学習用データの作成プログラムであって、
    コンピュータにより前記3次元モデルを撮像し、3次元座標空間の前記生体の骨格情報である3次元骨格データを取得するステップと、
    前記コンピュータにより、前記3次元骨格データを2次元座標に射影して2次元骨格データを作成するステップと、
    前記3次元モデルを撮像して得られる画像から、前記3次元モデルの部分と背景の部分とを前記3次元モデルの輪郭で分離した加工画像データを作成するステップと、
    を備えることを特徴とする機械学習用データの作成プログラム。
JP2020199646A 2020-07-31 2020-12-01 姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラム Active JP6868875B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020130959 2020-07-31
JP2020130959 2020-07-31

Publications (2)

Publication Number Publication Date
JP6868875B1 JP6868875B1 (ja) 2021-05-12
JP2022027395A true JP2022027395A (ja) 2022-02-10

Family

ID=75801806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020199646A Active JP6868875B1 (ja) 2020-07-31 2020-12-01 姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラム

Country Status (1)

Country Link
JP (1) JP6868875B1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019032820A (ja) * 2017-06-16 2019-02-28 ダッソー システムズDassault Systemes 画像を入力とする関数を学習するためのデータセット
JPWO2018189796A1 (ja) * 2017-04-10 2020-02-06 富士通株式会社 認識装置、認識システム、認識方法および認識プログラム
US10679046B1 (en) * 2016-11-29 2020-06-09 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Machine learning systems and methods of estimating body shape from images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10679046B1 (en) * 2016-11-29 2020-06-09 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Machine learning systems and methods of estimating body shape from images
JPWO2018189796A1 (ja) * 2017-04-10 2020-02-06 富士通株式会社 認識装置、認識システム、認識方法および認識プログラム
JP2019032820A (ja) * 2017-06-16 2019-02-28 ダッソー システムズDassault Systemes 画像を入力とする関数を学習するためのデータセット

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
G. VAROL ET AL.: "Learning from Synthetic Humans", 2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), JPN6021003904, 2017, US, pages 4627 - 4635, XP033249818, ISSN: 0004440030, DOI: 10.1109/CVPR.2017.492 *

Also Published As

Publication number Publication date
JP6868875B1 (ja) 2021-05-12

Similar Documents

Publication Publication Date Title
Zhu et al. Detailed human shape estimation from a single image by hierarchical mesh deformation
Zhang et al. Detailed, accurate, human shape estimation from clothed 3D scan sequences
US10685454B2 (en) Apparatus and method for generating synthetic training data for motion recognition
JP6302132B2 (ja) 画像処理装置、画像処理システム、画像処理方法及びプログラム
JP7015152B2 (ja) キーポイントデータに関する加工装置、方法及びプログラム
JPH10320588A (ja) 画像処理装置および画像処理方法
JP2006249618A (ja) 仮想試着装置
WO2018075053A1 (en) Object pose based on matching 2.5d depth information to 3d information
CN110147737B (zh) 用于生成视频的方法、装置、设备和存储介质
JP2013120556A (ja) 被写体姿勢推定装置および映像描画装置
JP5503510B2 (ja) 姿勢推定装置および姿勢推定プログラム
JP2010211732A (ja) 物体認識装置および方法
JP6818219B1 (ja) 3次元アバター生成装置、3次元アバター生成方法及び3次元アバター生成プログラム
JP6868875B1 (ja) 姿勢推定学習システム、姿勢推定学習方法及び機械学習用データの作成プログラム
JP2010238134A (ja) 画像処理装置及びプログラム
KR102075079B1 (ko) 하이브리드 카메라 기반 동작 추적 장치 및 그 방법
Wang et al. Im2fit: Fast 3d model fitting and anthropometrics using single consumer depth camera and synthetic data
JP2005339363A (ja) 人体パーツ自動分割装置及び人体パーツ自動分割方法
Haddon et al. Shape representations from shading primitives
CN111368853A (zh) 一种标签的构建方法、系统、装置及存储介质
JP4623320B2 (ja) 三次元形状推定システム及び画像生成システム
WO2023162223A1 (ja) 学習プログラム、生成プログラム、学習方法および生成方法
JP2018113054A (ja) 画像処理装置、画像処理方法及びプログラム
Zherdeva et al. Prediction of human behavior with synthetic data
AU2020474614B2 (en) Three-dimensional mesh generator based on two-dimensional image

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201215

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201221

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210405

R150 Certificate of patent or registration of utility model

Ref document number: 6868875

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250