JP6392478B1 - 情報処理装置、情報処理プログラム、及び、情報処理方法 - Google Patents

情報処理装置、情報処理プログラム、及び、情報処理方法 Download PDF

Info

Publication number
JP6392478B1
JP6392478B1 JP2018084683A JP2018084683A JP6392478B1 JP 6392478 B1 JP6392478 B1 JP 6392478B1 JP 2018084683 A JP2018084683 A JP 2018084683A JP 2018084683 A JP2018084683 A JP 2018084683A JP 6392478 B1 JP6392478 B1 JP 6392478B1
Authority
JP
Japan
Prior art keywords
teacher
image
points
label
teacher label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018084683A
Other languages
English (en)
Other versions
JP2019191974A (ja
Inventor
加藤 直樹
直樹 加藤
祐介 内田
祐介 内田
天▲埼▼ 李
天▲埼▼ 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DeNA Co Ltd
Original Assignee
DeNA Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DeNA Co Ltd filed Critical DeNA Co Ltd
Priority to JP2018084683A priority Critical patent/JP6392478B1/ja
Application granted granted Critical
Publication of JP6392478B1 publication Critical patent/JP6392478B1/ja
Publication of JP2019191974A publication Critical patent/JP2019191974A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】入力画像に含まれる人物像の姿勢を検出する学習器の姿勢検出精度を向上させる。
【解決手段】教師学習器20は、教師画像16及び教師ラベル18を学習データとして用いることで、教師画像16の画素毎に、人物像の基幹点に対応する画素である信頼度(期待度)を示す基幹点信頼度が表された基幹点信頼度マップ52a、及び、入力画像の画素毎に、人物像の基幹点間(Limb)の向き及び基幹点間の関連度の大きさを示すベクトルが表された関連度マップ52bを出力する。補正教師ラベル生成部26は、基幹点信頼度マップ52aを用いて教師ラベル18に含まれる基幹点信頼度マップ18aを補完し、関連度マップ52bを用いて教師ラベル18に含まれる関連度マップ18bを補完して補正教師ラベルを生成する。学習部28は、補正教師ラベルを用いて学習器22を学習させる。
【選択図】図1

Description

本発明は、情報処理装置、情報処理プログラム、及び、情報処理方法に関する。
従来、画像に含まれる人物像の姿勢を検出する技術が提案されている。このような技術としては、教師画像と、教師画像に含まれる人物像の複数の基幹点(眼、鼻、肩など)の位置及び基幹点間の関連度を示す教師ラベルとを用いて学習器(例えば畳み込みニューラルネットワーク)を学習させて、学習済の学習器に入力画像を入力することで、入力画像に含まれる人物像の姿勢を検出するものがある。
そのような技術の例として、非特許文献1には、OpenPoseと呼ばれる技術が開示されている。OpenPoseにおいては、入力画像に含まれる1又は複数の人物像の複数の基幹点(鼻、首、左肩、左肘、左手、右肩、右肘、右手、左腰、左膝、左足、右腰、右足、左眼、右眼、左耳、右耳の18箇所)を検出し、且つ、各基幹点間の関連度を識別することで、入力画像に含まれる各人物像のポーズ(姿勢)を検出している。
Zhe Cao, Tomas Simon, Shih-En Wei, Yaser Sheikh, 「Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields」, arXiv:1611.08050v2.
教師ラベルにおいて人物像の基幹点の位置情報が欠損する場合がある。基幹点の位置情報の欠損は、人物像の基幹点が画像に写っていない場合に生じ得る。例えば、人物像の上半身が画像に含まれているが、当該人物像の右肘が画像の外に位置している場合、右肘の位置情報が欠損することになる。また、人物像のある基幹点が他の物体により隠れてしまっている(オクルージョンが生じた)場合に、当該基幹点の位置情報が欠損する場合がある。さらに、人物像の基幹点が画像に写っている場合であっても、基幹点の位置情報の付与不備などによって基幹点の位置情報が欠損する場合も考えられる。
基幹点の位置情報の欠損が生じると、教師ラベルには、位置情報が欠損した基幹点に係る関連度の情報も定義できないことになる。このように、位置情報が欠損した基幹点に係る関連度の情報を有さない教師ラベルを用いて学習器の学習を行うと、学習器の姿勢検出精度に悪影響を及ぼす場合がある。
本発明の目的は、入力画像に含まれる人物像の姿勢を検出する学習器の姿勢検出精度を向上させることにある。
本発明は、教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、学習済みの前記教師学習器が出力した前記関連度に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点に係る前記関連度が前記教師ラベルの前記関連度を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、を備えることを特徴とする情報処理装置である。
また、本発明は、教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、学習済みの前記教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、を備えることを特徴とする情報処理装置である。
望ましくは、前記補正教師ラベル生成部は、学習済みの前記教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された前記補正教師ラベルを生成する、ことを特徴とする。
望ましくは、前記関連度は、前記基幹点間のベクトルで表現され、前記補正教師ラベル生成部は、学習済みの前記教師学習器が出力した基幹点間の前記ベクトルと、前記教師ラベルにおける当該基幹点間の前記ベクトルとのうち、ノルムが大きい方のベクトルを当該基幹点間の関連度とする、ことを特徴とする。
望ましくは、前記基幹点の位置は、前記教師画像の画素毎の、人物像の基幹点に対応する画素である信頼度を示す基幹点信頼度で表現され、前記補正教師ラベル生成部は、前記補正教師ラベルの各画素の前記基幹点信頼度を、学習済みの前記教師学習器が出力した前記基幹点信頼度と、前記教師ラベルにおける前記基幹点信頼度のうち大きい方とする、ことを特徴とする。
望ましくは、前記教師学習器は、前記補正教師ラベルを用いてさらに学習され、前記補正教師ラベル生成部は、前記補正教師ラベルを用いて学習済みの前記教師学習器の出力に基づいて、前記補正教師ラベルをさらに補完した再補正教師ラベルを生成し、前記学習部は、前記再補正教師ラベルを用いて前記学習器を学習させる、ことを特徴とする。
望ましくは、前記学習部は、前記入力画像に対する前記学習器の出力と前記補正教師ラベルとの間の誤差、及び、前記入力画像に対する前記学習器の出力と前記入力画像に対する学習済みの前記教師学習器の出力との間の誤差に基づいて、前記学習器を学習させる、ことを特徴とする。
望ましくは、前記学習部は、前記入力画像に対する前記学習器の出力と前記再補正教師ラベルとの間の誤差、及び、前記入力画像に対する前記学習器の出力と前記入力画像に対する前記補正教師ラベルを用いて学習済みの前記教師学習器の出力との間の誤差に基づいて、前記学習器を学習させる、ことを特徴とする。
また、本発明は、コンピュータを、教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、学習済みの前記教師学習器が出力した前記関連度に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点に係る前記関連度が前記教師ラベルの前記関連度を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、として機能させることを特徴とする情報処理プログラムである。
また、本発明は、コンピュータを、教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、学習済みの前記教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、として機能させることを特徴とする情報処理プログラムである。
また、本発明は、教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習された教師学習器が出力した前記関連度に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点に係る前記関連度が前記教師ラベルの前記関連度を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成ステップと、前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習ステップと、を含むことを特徴とする情報処理方法である。
また、本発明は、教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習された教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成ステップと、前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習ステップと、を含むことを特徴とする情報処理方法である。
本発明によれば、入力画像に含まれる人物像の姿勢を検出する学習器の姿勢検出精度を向上させる。
本実施形態に係る情報処理装置の構成概略図である。 教師画像及び教師ラベルの例を示す第1の図である。 教師画像及び教師ラベルの例を示す第2の図である。 学習済みの教師学習器が出力した基幹点信頼度マップの例を示す第1の図である。 学習済みの教師学習器が出力した基幹点信頼度マップの例を示す第2の図である。 学習済みの教師学習器が出力した関連度マップの例を示す第1の図である。 学習済みの教師学習器が出力した関連度マップの例を示す第2の図である。 補正教師ラベルの例を示す第1の図である。 補正教師ラベルの例を示す第2の図である。 補正教師ラベルと教師学習器の出力とに基づいて学習器を学習する様子を示す概念図である。 学習器の検出精度に関する実験結果を示す図である。 本実施形態に係る情報処理装置の処理の流れを示すフローチャートである。
以下、本発明の実施形態について説明する。
図1には、本実施形態に係る情報処理装置10の構成概略図が示されている。本実施形態においては、情報処理装置10はサーバコンピュータによって構成されるが、情報処理装置10としては、以下に示す機能を有する限りにおいて、どのような装置であってもよい。
通信部12は、例えばネットワークアダプタなどから構成される。通信部12は、LANあるいはインターネットなどの通信回線を介して、他の装置と通信する機能を発揮する。他の装置としては、例えばユーザが利用するユーザ端末などである。
記憶部14は、例えばROM、RAMあるいはハードディスクなどから構成される。記憶部14には、情報処理装置10の各部を動作させるための情報処理プログラムが記憶される。また、図1に示される通り、記憶部14には、教師画像16、教師ラベル18、教師学習器20、及び学習器22が記憶される。
教師画像16は、教師学習器20及び学習器22の学習に用いる画像である。後述のように、教師学習器20及び学習器22は、入力画像に含まれる人物像の複数の基幹点の位置、及び、基幹点間の関連度を検出することで、当該人物像の姿勢を検出するものである。したがって、教師画像16には人物像が含まれる。図2(a)には、人物像Aを含む教師画像16の例が示されている。
教師ラベル18は、教師画像16に含まれる人物像の複数の基幹点の位置、及び、当該基幹点間の関連度を示す情報を含むものである。教師画像16に対する教師ラベル18は、予め用意されてよい。例えば、教師画像16と教師ラベル18とがセットになった教師データセットが記憶部14に記憶されてよい。教師ラベル18は教師学習器20の学習に用いられる。
本実施形態では、人物像の基幹点として、人物像の鼻、首、左肩、左肘、左手、右肩、右肘、右手、左腰、左膝、左足、右腰、右足、左眼、右眼、左耳、右耳の18箇所を用いる。教師ラベル18には、教師画像16に含まれる人物像の上記18箇所の基幹点の位置を示す情報が含まれる。本実施形態では、教師画像16において人物像の上記各基幹点の位置にアノテーションが付され、当該アノテーションの位置が、教師画像16に含まれる人物像の複数の基幹点の位置を示す情報となる。各アノテーションには、対応する基幹点を示す情報が含まれる。例えば、人物像の鼻に付されたアノテーションには、鼻に対応するものであることを示す情報が含まれる。
図2(b)に、教師画像16に含まれる人物像Aの複数の基幹点上に複数のアノテーション40aが付された様子が示されている。本実施形態では、教師画像16の画素毎に、人物像の各基幹点に対応する画素である信頼度(期待度)を示す基幹点信頼度
が定義される。
ここで、pは教師画像16の2次元座標(画素)を表し、jは基幹点の種類を表す。したがって、基幹点の種類毎に、教師画像16の各座標の基幹点信頼度を示す基幹点信頼度マップ18aが定義されることになる。複数の基幹点に対応する複数の基幹点信頼度マップ18aは教師ラベル18の一部を構成する。
本実施形態では、アノテーション40aが付された画素の基幹点信頼度を最大値とし、その周囲の画素の信頼度は、アノテーション40aが付された画素を中心とした2次元方向の正規分布を形成するように定義される。
教師画像16に人物像の全ての基幹点が写っていない場合がある。この場合、当該基幹点に対応するアノテーション40aを付すことができず、教師ラベル18には当該基幹点の位置を示す位置情報が含まれないこととなる(以後、位置情報を有さない基幹点を欠損基幹点と記載する)。例えば、図2(b)の例では、教師画像16には、人物像Aの基幹点として、鼻、首、左肩、左手、右肩、右手、左眼、右眼、及び右耳が写っているため、これらの基幹点に対応するアノテーション40aが付されているが、それ以外の基幹点(欠損基幹点)に対応するアノテーション40aは付されていない。
人物像の基幹点間(以後「Limb」と記載する場合がある)の関連度は、PAFs(Part Affinity Fields)で表現される。PAFsは、大きさと方向を有する値であり、すなわちベクトル場であるといえる。
本実施形態では、教師画像16に付されたアノテーション40aに基づいて、教師ラベル18において、教師画像16の画素毎に、人物像の各Limbの方向を示す単位ベクトル
が定義される。
ここで、pは教師画像16の2次元座標(画素)を表し、cはLimbの種類を表す。したがって、教師ラベル18においては、Limbの種類毎に、教師画像16の各座標に定義された単位ベクトルを含む関連度マップ18bが定義されることになる。複数のLimbに対応する複数の関連度マップ18bは教師ラベル18の一部を構成する。
図2(c)に、教師画像16に含まれる人物像Aの各Limbについて定義されたベクトル場40bが示されている。なお、各Limbについてのベクトル場40b(ベクトル場40bに含まれる各単位ベクトル)の向きは予め定められていてよい(例えば右眼から右耳へ向かう方向など)。
このようにして、人物像の基幹点間においてベクトル場40bが定義される。なお、本実施形態では、全ての基幹点間にベクトル場40bが定義されているわけではない。例えば、図2(c)の例では、人物像Aの右眼と左眼との間にベクトル場40bが定義されていない。しかし、同一人物像の基幹点間であれば、ベクトル場40bが定義されていてもよい。
一方、教師画像16に複数の人物像が含まれる場合には、ある人物像の基幹点と、他の人物像の基幹点との間にはベクトル場40bは定義されない。これは、異なる人物像の基幹点間には関連がないからである。
上述のように、欠損基幹点が存在する場合、当該欠損基幹点に対応するアノテーション40aが教師画像16に付されない。したがって、欠損基幹点に係るベクトル場40b(欠損基幹点から他の基幹点へ向かうベクトル場40b及び他の基幹点から欠損基幹点へ向かうベクトル場40b)も定義されないことになる。つまり、教師ラベル18には、欠損基幹点に係る関連度を示す情報が含まれないことになる。
図2(c)の例では、人物像Aの右肘が教師画像16の撮影範囲に含まれておらず、右肘が欠損基幹点となっている。したがって、右肘に対応するアノテーション(図2(c)において破線円で示されている)が付されていないために、人物像Aの右肘と右肩との間のベクトル場(図2(c)において破線で示されている)、あるいは、人物像Aの右肘と右手との間のベクトル場(図2(c)において破線で示されている)が定義されていない。
人物像の基幹点が教師画像16の撮影範囲内に含まれている場合であっても、基幹点が他の物体により隠されている(オクルージョンが発生している)場合には、当該基幹点が欠損基幹点となり得る。図2(b)及び(c)の例では、人物像Aの左耳がスマートフォンにより隠されているため欠損基幹点となっている。したがって、図2(b)において、左耳に対応するアノテーション40aが付されておらず、図2(c)において、左耳に係るベクトル場が定義されていない。
また、教師画像16に基幹点が写っている場合であっても、当該基幹点にアノテーション40aが付されない場合がある。例えば、図3に示す教師画像16は、人物像B及びCが含まれており、人物像Cの複数の基幹点が写っているが、人物像Cに関するアノテーション40aが一切付されていない。このような場合、人物像Cに関する基幹点が全て欠損基幹点となり、人物像Cの欠損基幹点に係るベクトル場は定義されないこととなる。
教師学習器20は、畳み込みニューラルネットワークを含んで構成される。一般に、畳み込みニューラルネットワークは、各種パラメータ(層構造、各層のニューロン構造、各層におけるフィルタ数、フィルタサイズ、及び各フィルタの各要素の重みなど)を有している。したがって、記憶部14に教師学習器20が記憶されるとは、畳み込みニューラルネットワークに関する各種パラメータ、及び、入力画像に対して処理を行うための処理実行プログラムが記憶部14に記憶されることを意味する。
教師学習器20は、教師画像16及び教師ラベル18を学習データとして用いることで、入力画像に含まれる人物像の複数の基幹点の位置、及び、当該基幹点間の関連度を出力するように学習される。これにより、学習済みの教師学習器20は、入力画像に含まれる人物像の姿勢を検出することが可能となる。
学習済みの教師学習器20に入力画像を入力すると、教師学習器20は、入力画像の画素毎に、人物像の基幹点に対応する画素である信頼度(期待度)である基幹点信頼度が表された基幹点信頼度マップを出力する。基幹点信頼度マップとしては、基幹点信頼度を色で表したヒートマップであってもよい。
図4に、人物像Aを含む入力画像50に対して教師学習器20が出力した基幹点信頼度マップ52aの例が示されている。図4に示す通り、教師学習器20は、基幹点の種類毎に基幹点信頼度マップ52aを出力する。例えば、ある基幹点信頼度マップ52aは、人物像の左眼に対応する画素である信頼度を示すマップとなる。
ここで、教師画像16の撮影範囲内にあるがアノテーション40aが付されなかった欠損基幹点を有する教師画像16(例えば図3に示す教師画像16)を入力画像50として、学習済みの教師学習器20に入力すると、教師学習器20は、当該教師画像16における欠損基幹点に対応する画素についても高い基幹点信頼度を示す基幹点信頼度マップ52aを出力し得る。例えば、図3に示すように、人物像Cに関するアノテーション40aが付されなかった教師画像16を入力画像50として学習済みの教師学習器20に入力すると、図5に示すように、教師学習器20は、人物像Cの基幹点に対応する画素に高い基幹点信頼度示す基幹点信頼度マップ52aを出力することができる。
また、学習済みの教師学習器20に入力画像を入力すると、教師学習器20は、入力画像の画素毎に、人物像の基幹点間(Limb)の向き及び基幹点間の関連度の大きさを示すベクトルを出力する。これにより、入力画像の画素毎に当該ベクトルが定義され、各Limbに対応するベクトル場を含む関連度マップが出力される。
図6に、人物像Aを含む入力画像50に対して教師学習器20が出力した、ベクトル場54を含む関連度マップ52bの例が示されている。図6に示す通り、教師学習器20は、Limbの種類毎に関連度マップ52bを出力する。例えば、ある関連度マップ52bは、右耳と右肩との間のLimbに対応するマップとなる。
ここで、教師画像16の撮影範囲に含まれてない欠損基幹点に係るベクトル場40bが定義されなかった教師画像16(例えば図2(a)に示す教師画像16)を入力画像として、学習済みの教師学習器20に入力すると、教師学習器20は、当該教師画像16においてベクトル場40bが定義されなかったLimbに関するベクトル場54aを含む関連度マップ52bを出力し得る。例えば、図2(c)に示すように、人物像Aの右肘と右肩との間のベクトル場、あるいは、人物像Aの右肘と右手との間のベクトル場が定義されなかった教師画像16を入力画像50として学習済みの教師学習器20に入力すると、図6の一番下及び下から二番目の関連度マップ52bに示すように、教師学習器20は、人物像Aの右肘と右肩との間のベクトル場54a及び人物像Aの右肘と右手との間のベクトル場54aを含む関連度マップ52bを出力することができる。
また、教師画像16の撮影範囲内にあるものの、アノテーション40aが付されなかった欠損基幹点に係るベクトル場40bが定義されなかった教師画像16(例えば図3に示す教師画像16)を入力画像とした場合にも、学習済みの教師学習器20は、当該教師画像16においてベクトル場40bが定義されなかったLimbに関するベクトル場54aを含む関連度マップ52bを出力し得る。例えば、図3に示すように、人物像Cの各Limbについてベクトル場が定義されなかった画像を入力画像50として学習済みの教師学習器20に入力すると、図7に示す通り、人物像Cの各Limbに関するベクトル場54aを含む関連度マップ52bを出力することができる。
なお、教師学習器20は、後述の学習部28により学習されてもよいが(すなわち情報処理装置10で学習されてもよいが)、予め教師画像16及び教師ラベル18を用いて他の装置で学習され、学習済みの教師学習器20が記憶部14に記憶(インストール)されてもよい。
学習器22は、教師学習器20同様、畳み込みニューラルネットワークを含んで構成される。したがって、記憶部14に学習器22が記憶されるとは、畳み込みニューラルネットワークに関する各種パラメータ、及び、入力画像に対して処理を行うための処理実行プログラムが記憶部14に記憶されることを意味する。
学習器22は、教師学習器20同様、入力画像に含まれる人物像の複数の基幹点の位置、及び、当該基幹点間の関連度を出力するように学習される。これにより、学習済みの学習器22は、入力画像に含まれる人物像の姿勢を検出することが可能となる。学習器22は、後述の学習部28により学習される。学習器22の学習方法の詳細については後述する。
制御部24は、例えばCPUあるいはマイクロコントローラなどを含んで構成される。制御部24は、記憶部14に記憶された情報処理プログラムに従って情報処理装置10の各部を制御する。また、図1に示される通り、制御部24は、補正教師ラベル生成部26及び学習部28としても機能する。
補正教師ラベル生成部26は、教師画像16を学習済みの教師学習器20に入力したときの出力に基づいて、当該教師画像16に係る教師ラベル18を補完することで、補正教師ラベルを生成する。生成した補正教師ラベルは記憶部14に記憶される。以下、補正教師ラベルの生成方法の詳細について説明する。
上述の通り、教師ラベル18(関連度マップ18b)においては、教師画像16の撮影範囲外にある欠損基幹点に係るベクトル場40bは定義されない。例えば、図2(c)に示す教師ラベル18の如くである。一方、当該教師画像16を入力画像50としたときの学習済みの教師学習器20が出力する関連度マップ52bには、当該教師画像16に係る教師ラベル18において欠損していたベクトル場54aが含まれる。例えば、図6の一番下及び下から二番目の関連度マップ52bの如くである。
したがって、補正教師ラベル生成部26は、当該教師画像16を入力画像50としたときの学習済みの教師学習器20が出力する関連度マップ52bで、教師ラベル18の関連度マップ18bを補完することで、補正関連度マップを生成する。補正関連度マップは、教師ラベル18において欠損していたベクトル場が補完されたものとなる。当該補正関連度マップは、補正教師ラベルを構成するものとなる。
具体的には、補正教師ラベル生成部26は、関連度マップ18b及び52bの各画素について、関連度マップ18bにおけるベクトルと、関連度マップ52bにおけるベクトルのうち、L2ノルムすなわち大きさが大きい方を補正関連度マップにおける関連度(ベクトル)とする。上述の通り、関連度マップ18bにおける各画素の関連度は
で表され、関連度マップ52bにおける各画素の関連度を
で表すとすると、補正関連度マップにおける各画素の関連度

で表すことができる。
補正教師ラベル生成部26は、このようにして生成した補正関連度マップと、基幹点信頼度マップ18aとからなる補正教師ラベルを生成することができる。図8に、補正教師ラベル60の例が示されている。図8の補正教師ラベル60は、(補正前の)教師ラベル18(図2(c)参照)に対して、人物像Aの右肘と右肩との間のベクトル場54a及び人物像Aの右肘と右手との間のベクトル場54aが補完されたものとなっている。
また、上述の通り、教師ラベル18においては、教師画像16の撮影範囲内にあるものの、アノテーション40aが付されなかった基幹点は欠損基幹点となり、基幹点信頼度マップ18aにおいては、このような欠損基幹点の位置が示されていなかった。例えば、図2(b)に示す基幹点信頼度マップ18aにおける人物像Aの左耳や、図3に示す人物像Cに関する基幹点の如くである。一方、当該教師画像16を入力画像50としたときの学習済みの教師学習器20が出力する基幹点信頼度マップ52aにおいては、当該教師画像16に係る教師ラベル18における欠損基幹点の位置に対応する画素も基幹点信頼度が高く示される。例えば、図5に示す如くである。
したがって、補正教師ラベル生成部26は、当該教師画像16を入力画像50としたときの学習済みの教師学習器20が出力する基幹点信頼度マップ52aで、教師ラベル18の基幹点信頼度マップ18aを補完することで、補正基幹点信頼度マップを生成する。補正基幹点信頼度マップにおいては、教師ラベル18における欠損基幹点の位置が補完されたものとなる。当該基幹点信頼度マップは、補正教師ラベルを構成するものとなる。
具体的には、補正教師ラベル生成部26は、基幹点信頼度マップ18a及び52aの各画素について、基幹点信頼度マップ18aにおける基幹点信頼度と、基幹点信頼度マップ52aにおける基幹点信頼度のうち、大きい方を補正基幹点信頼度マップにおける基幹点信頼度とする。上述の通り、関連度マップ18bにおける各画素の基幹点関連度は
で表され、関連度マップ52bにおける各画素の基幹点信頼度を
で表すとすると、補正関連度マップにおける各画素の基幹点信頼度

で表すことができる。
補正教師ラベル生成部26は、このようにして生成した補正基幹点信頼度マップと、補正関連度マップとからなる補正教師ラベルを生成してもよい。図9に、補正教師ラベル60の他の例が示されている。図9の補正教師ラベル60は、(補正前の)教師ラベル18(図3参照)に対して、補正基幹点信頼度マップにより人物像Cに関する各基幹点の位置が示され、且つ、補正関連度マップにより人物像Cに関するベクトル場54aが示されている。
また、補正教師ラベル生成部26は、補正基幹点信頼度マップと、(補正していない)関連度マップ18bとからなる補正教師ラベルを生成するようにしてもよい。
学習部28は、補正教師ラベル生成部26が生成した補正教師ラベルを用いて学習器22を学習させる。具体的には、学習器22の出力と補正教師ラベルとの間の誤差(本実施形態では平均二乗誤差)が小さくなるように学習器22の各種パラメータが調整される。本明細書では、
学習器22の出力をP=(H,L
補正教師ラベルをyLC=(HLC,LLC
と表現し、学習器22の出力と補正教師ラベルとの間の平均二乗誤差を
L2(P,yLC
と表す。
上述の通り、補正教師ラベルは、教師ラベル18に比して、基幹点間の関連度を示す情報あるいは人物像の基幹点の位置がより充実したものとなっている。したがって、学習部28は、補正教師ラベルを用いて学習器22を学習させることで、教師ラベル18を用いて学習したときに比して、学習器22は、入力画像に含まれる人物像の基幹点の位置及び基幹点間の関連度をより適切に検出することが可能となり、ひいては、入力画像に含まれる人物像の姿勢をより高精度に検出することが可能となる。
学習部28は、補正教師ラベルを用いて、教師学習器20をさらに学習させてもよい。そして、補正教師ラベル生成部26は、補正教師ラベルを用いて学習済みの教師学習器20に当該補正教師ラベルに係る教師画像16を入力したときの出力に基づいて、当該補正教師ラベルをさらに補完することで再補正教師ラベルを生成するようにしてもよい。再補正教師ラベルの生成処理は、上述の補正教師ラベルの生成処理において教師ラベルを補正教師ラベルに置き換えた処理であるため、再補正教師ラベルの生成処理の詳細な説明は省略する。
その上で、学習部28は、補正教師ラベル生成部26が生成した再補正教師ラベルを用いて学習器22を学習させてもよい。
また、学習部28は、補正教師ラベルのみならず、学習済みの教師学習器20の出力も考慮して学習器22を学習させるようにしてもよい。詳しくは、図10に示すように、学習部28は、入力画像50に対する学習器22の出力と補正教師ラベルとの間の平均二乗誤差、及び、入力画像50に対する学習器22の出力と当該入力画像50に対する学習済みの教師学習器20の出力との間の平均二乗誤差に基づいて学習器22を学習させてもよい。
上述のように、入力画像50に対する学習器22の出力と補正教師ラベルとの間の平均二乗誤差は
L2(P,yLC
で表され、
学習済みの教師学習器20の出力をP=(H,L)と表すとすると、入力画像50に対する学習器22の出力と当該入力画像50に対する学習済みの教師学習器20の出力との間の平均二乗誤差は
L2(P,P
で表される。
好ましくは、学習部28は、EL2(P,yLC)とEL2(P,P)との間の加重平均EKD,LCを算出した上で、当該加重平均EKD,LCが小さくなるように学習器22を学習させる。なお、加重平均EKD,LCは以下の式で算出される。
KD,LC=(1−λ)EL2(P,yLC)+λEL2(P,P
λは重みであり、適宜設定されてよい。
上述のように補正教師ラベル生成部26により、再補正教師ラベルが生成された場合には、学習部28は、入力画像50に対する学習器22の出力と再補正教師ラベルとの間の平均二乗誤差、及び、入力画像50に対する学習器22の出力と当該入力画像50に対する補正教師ラベルを用いて学習済みの教師学習器20の出力との間の平均二乗誤差に基づいて学習器22を学習させてもよい。
図11は、種々の条件で学習させた学習器22の検出精度に関する実験結果が示されている。本実験では、学習器22として、非特許文献1で提案されたモデルであるCMU−Pose(パラメータサイズ52.3M)を用いた。学習器22は、学習率α=10−4で10イテレーション、α=10−5でさらに10イテレーション学習させた。補正教師ラベル生成の際には、教師学習器20としてCMU−Poseを用いた。また、CMU−PoseのベースネットワークであるVGG19は、ImageNet[18]で学習済みの重みを初期値とした。
図11に示された検出精度の指標である各種APは、基幹点の組同士の類似度を示すOKS(Object Keypoint Similarity)に基づいて算出される。OKSは、物体認識におけるIoU(Intersection over Union)と同等の役割を果たし、入力画像50に含まれる人物像のスケール(大きさ)、及び、学習器22の出力と教師ラベルとの誤差に基づいて算出される値である。本実施形態では、OKSの閾値を10段階に変化させたときの各段階の平均精度がAPである。OKOSの閾値を0.5、0.75としたときの制度がAP50、AP75である。また、入力画像50に含まれる人物像のスケールが中サイズ、大サイズである場合のAPがAP、APである。各種APは数値が大きい程精度が高いことを示す。
図11において、「Baseline」の各APは、(補正していない)教師ラベル18を用いて学習器22を学習させた場合の学習器22の検出精度である。「LC」の各APは、補正教師ラベルを用いて学習器22を学習させた場合の学習器22の検出精度である。「Baseline」と「LC」を比較して分かるように、本実験では、補正教師ラベルを用いて学習器22を学習させることで、全ての種類のAPにおいて学習器22の検出精度が向上している。
「LC×2」の各APは、再補正教師ラベルを用いて学習器22を学習させた場合の学習器22の検出精度である。「LC」と「LC×2」を比較すると、本実験では、一部の種類のAP(AP)において検出精度が向上している。つまり、補正教師ラベルを用いるよりも、再補正教師ラベルを用いて学習させた方が、学習器22の検出精度が向上する場合があることが確認できた。
「KD(λ=0.5)+LC」の各APは、学習器22の出力と補正教師ラベルとの間の平均二乗誤差と、学習器22の出力と学習済みの教師学習器20の出力との間の平均二乗誤差との平均値(λ=0.5)に基づいて学習器22を学習させた場合の学習器22の検出精度である。「LC」と「KD(λ=0.5)+LC」を比較すると、本実験では、一部の種類のAP(AP75)において検出精度が向上している。つまり、学習器22の出力と補正教師ラベルとの間の平均二乗誤差のみに基づいて学習させるよりも、さらに、学習器22の出力と教師学習器20の出力との間の平均二乗誤差を考慮して学習させた方が、学習器22の検出精度が向上する場合があることが確認できた。
「KD(λ=0.5)+LC×2」の各APは、学習器22の出力と補正教師ラベルとの間の平均二乗誤差と、学習器22の出力と学習済みの教師学習器20の出力との間の平均二乗誤差との平均値(λ=0.5)に基づいて学習された学習器22を新たな教師学習器とみなし、当該新たな教師学習器の出力を用いて上述の処理で補正した教師ラベルと学習器22の出力との間の平均二乗誤差と、学習器22の出力と当該新たな教師学習器の出力との間の平均二乗誤差との平均値に基づいて学習器22を学習させた場合の学習器22の検出精度である。「KD(λ=0.5)+LC」と「KD(λ=0.5)+LC×2」を比較すると、本実験では、一部の種類のAP(AP50及びAP)において検出精度が向上している。つまり、学習器22の出力と補正教師ラベルとの間の平均二乗誤差と、学習器22の出力と学習済みの教師学習器20の出力との間の平均二乗誤差とに基づいて学習器22を学習させるよりも、学習器22の出力と補正教師ラベルとの間の平均二乗誤差と、学習器22の出力と学習済みの教師学習器20の出力との間の平均二乗誤差とに基づいて学習された学習器22を新たな教師学習器とみなし、当該新たな教師学習器の出力を用いて補正した教師ラベルと学習器22の出力との間の平均二乗誤差と、学習器22の出力と当該新たな教師学習器の出力との間の平均二乗誤差との平均値に基づいて学習器22を学習させた方が、学習器22の検出精度が向上する場合があることが確認できた。
以下、図12に示すフローチャートに従って、本実施形態に係る情報処理装置10の処理の流れを説明する。なお、図12のフローチャートの開始時において、教師学習器20は十分に学習済みであるとする。
ステップS10において、学習部28は、教師画像16を学習済みの教師学習器20に入力する。これにより、教師学習器20は、基幹点信頼度マップ52a(図4参照)及び関連度マップ52b(図6参照)を出力する。
ステップS12において、補正教師ラベル生成部26は、ステップS10で教師学習器20が出力した基幹点信頼度マップ52aを用いて、教師ラベル18に含まれる基幹点信頼度マップ18aを補完することで、補正基幹点信頼度マップを生成する。補正基幹点信頼度マップの生成処理の詳細は上述の通りである。
ステップS14において、補正教師ラベル生成部26は、ステップS10で教師学習器20が出力した関連度マップ52bを用いて、教師ラベル18に含まれる関連度マップ18bを補完することで、補正関連度マップを生成する。補正関連度マップの生成処理の詳細は上述の通りである。
ステップS12及びS14により、補正基幹点信頼度マップ及び補正関連度マップを含む補正教師ラベルが生成される。すなわち、ステップS12及びS14が補正教師ラベル生成ステップに相当する。
ステップS16において、学習部28は、ステップS10で用いた教師画像16を学習器22入力する。
ステップS18において、学習部28は、ステップS16で得た学習器22の出力と、ステップS12及びS14で生成された補正教師ラベルとの間の平均二乗誤差が小さくなるように学習器22を学習させる。ステップS16及びS18が学習ステップに相当する。
以上、本発明に係る実施形態を説明したが、本発明は上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない限りにおいて種々の変更が可能である。
10 情報処理装置、12 通信部、14 記憶部、16 教師画像、18 教師ラベル、20 教師学習器、22 学習器、24 制御部、26 補正教師ラベル生成部、28 学習部。

Claims (12)

  1. 教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、
    学習済みの前記教師学習器が出力した前記関連度に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点に係る前記関連度が前記教師ラベルの前記関連度を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、
    前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、
    を備えることを特徴とする情報処理装置。
  2. 教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、
    学習済みの前記教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、
    前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、
    を備えることを特徴とする情報処理装置。
  3. 前記補正教師ラベル生成部は、学習済みの前記教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された前記補正教師ラベルを生成する、
    ことを特徴とする請求項1に記載の情報処理装置。
  4. 前記関連度は、前記基幹点間のベクトルで表現され、
    前記補正教師ラベル生成部は、学習済みの前記教師学習器が出力した基幹点間の前記ベクトルと、前記教師ラベルにおける当該基幹点間の前記ベクトルとのうち、ノルムが大きい方のベクトルを当該基幹点間の関連度とする、
    ことを特徴とする請求項1又は3に記載の情報処理装置。
  5. 前記基幹点の位置は、前記教師画像の画素毎の、人物像の基幹点に対応する画素である信頼度を示す基幹点信頼度で表現され、
    前記補正教師ラベル生成部は、前記補正教師ラベルの各画素の前記基幹点信頼度を、学習済みの前記教師学習器が出力した前記基幹点信頼度と、前記教師ラベルにおける前記基幹点信頼度のうち大きい方とする、
    ことを特徴とする請求項2又は3に記載の情報処理装置。
  6. 前記教師学習器は、前記補正教師ラベルを用いてさらに学習され、
    前記補正教師ラベル生成部は、前記補正教師ラベルを用いて学習済みの前記教師学習器の出力に基づいて、前記補正教師ラベルをさらに補完した再補正教師ラベルを生成し、
    前記学習部は、前記再補正教師ラベルを用いて前記学習器を学習させる、
    ことを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。
  7. 前記学習部は、前記入力画像に対する前記学習器の出力と前記補正教師ラベルとの間の誤差、及び、前記入力画像に対する前記学習器の出力と前記入力画像に対する学習済みの前記教師学習器の出力との間の誤差に基づいて、前記学習器を学習させる、
    ことを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。
  8. 前記学習部は、前記入力画像に対する前記学習器の出力と前記再補正教師ラベルとの間の誤差、及び、前記入力画像に対する前記学習器の出力と前記入力画像に対する前記補正教師ラベルを用いて学習済みの前記教師学習器の出力との間の誤差に基づいて、前記学習器を学習させる、
    ことを特徴とする請求項6に記載の情報処理装置。
  9. コンピュータを、
    教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、
    学習済みの前記教師学習器が出力した前記関連度に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点に係る前記関連度が前記教師ラベルの前記関連度を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、
    前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、
    として機能させることを特徴とする情報処理プログラム。
  10. コンピュータを、
    教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習される教師学習器と、
    学習済みの前記教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成部と、
    前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習部と、
    として機能させることを特徴とする情報処理プログラム。
  11. 教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習された教師学習器が出力した前記関連度に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点に係る前記関連度が前記教師ラベルの前記関連度を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成ステップと、
    前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習ステップと、
    を含むことを特徴とする情報処理方法。
  12. 教師画像と、前記教師画像に含まれる人物像の複数の基幹点の位置及び前記基幹点間の関連度を示す情報を含む教師ラベルとを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習された教師学習器が出力した前記複数の基幹点に基づいて、前記教師ラベルにおいて欠損している前記人物像の基幹点の位置が前記教師ラベルの前記基幹点の位置を示す情報に補完された補正教師ラベルを生成する補正教師ラベル生成ステップと、
    前記補正教師ラベルを用いて、入力画像に含まれる人物像の複数の基幹点の位置及び当該基幹点間の関連度を出力するように学習器を学習させる学習ステップと、
    を含むことを特徴とする情報処理方法。
JP2018084683A 2018-04-26 2018-04-26 情報処理装置、情報処理プログラム、及び、情報処理方法 Active JP6392478B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018084683A JP6392478B1 (ja) 2018-04-26 2018-04-26 情報処理装置、情報処理プログラム、及び、情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018084683A JP6392478B1 (ja) 2018-04-26 2018-04-26 情報処理装置、情報処理プログラム、及び、情報処理方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018155241A Division JP2019192192A (ja) 2018-08-22 2018-08-22 情報処理装置、情報処理プログラム、及び、情報処理方法

Publications (2)

Publication Number Publication Date
JP6392478B1 true JP6392478B1 (ja) 2018-09-19
JP2019191974A JP2019191974A (ja) 2019-10-31

Family

ID=63580037

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018084683A Active JP6392478B1 (ja) 2018-04-26 2018-04-26 情報処理装置、情報処理プログラム、及び、情報処理方法

Country Status (1)

Country Link
JP (1) JP6392478B1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020121713A (ja) * 2019-01-30 2020-08-13 株式会社ストラドビジョンStradvision,Inc. 人の状態識別のためのイメージ分析により検出された乗客のポイントを利用して車両占有を検出する方法及び装置
JP2020126638A (ja) * 2019-01-31 2020-08-20 株式会社ストラドビジョン 運転者の状態に応じて特化型のキャリブレーションのために運転者補助装置を自動で調整する方法及び装置
JP2020149683A (ja) * 2019-03-13 2020-09-17 株式会社日立製作所 画像解析プログラムの自動ビルドの方法およびシステム
EP3723000A1 (en) 2019-04-09 2020-10-14 Hitachi, Ltd. Object recognition system and object regognition method

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102325072B1 (ko) * 2020-09-18 2021-11-11 주식회사 위딧 포즈 매칭 방법 및 이를 수행하기 위한 장치
JPWO2022113349A1 (ja) * 2020-11-30 2022-06-02
JP2024502122A (ja) * 2021-01-15 2024-01-17 日本電気株式会社 姿勢推定装置、学習モデル生成装置、姿勢推定方法、学習モデル生成方法及び、プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212688A (ja) * 2015-05-11 2016-12-15 日本電信電話株式会社 関節位置推定装置、方法、及びプログラム
JP2017058930A (ja) * 2015-09-16 2017-03-23 日本電信電話株式会社 学習データ生成装置、学習装置、画像評価装置、学習データ生成方法、学習方法、画像評価方法及び画像処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016212688A (ja) * 2015-05-11 2016-12-15 日本電信電話株式会社 関節位置推定装置、方法、及びプログラム
JP2017058930A (ja) * 2015-09-16 2017-03-23 日本電信電話株式会社 学習データ生成装置、学習装置、画像評価装置、学習データ生成方法、学習方法、画像評価方法及び画像処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHE CAO, ET AL.: "Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields", IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR2017), JPN7018002671, 14 April 2017 (2017-04-14), US *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020121713A (ja) * 2019-01-30 2020-08-13 株式会社ストラドビジョンStradvision,Inc. 人の状態識別のためのイメージ分析により検出された乗客のポイントを利用して車両占有を検出する方法及び装置
JP2020126638A (ja) * 2019-01-31 2020-08-20 株式会社ストラドビジョン 運転者の状態に応じて特化型のキャリブレーションのために運転者補助装置を自動で調整する方法及び装置
JP2020149683A (ja) * 2019-03-13 2020-09-17 株式会社日立製作所 画像解析プログラムの自動ビルドの方法およびシステム
EP3723000A1 (en) 2019-04-09 2020-10-14 Hitachi, Ltd. Object recognition system and object regognition method
US11521021B2 (en) 2019-04-09 2022-12-06 Hitachi, Ltd. Object recognition system and object recognition method

Also Published As

Publication number Publication date
JP2019191974A (ja) 2019-10-31

Similar Documents

Publication Publication Date Title
JP6392478B1 (ja) 情報処理装置、情報処理プログラム、及び、情報処理方法
JP6754619B2 (ja) 顔認識方法及び装置
JP6433149B2 (ja) 姿勢推定装置、姿勢推定方法およびプログラム
CN106991388B (zh) 关键点定位方法
JP5772821B2 (ja) 顔特徴点位置補正装置、顔特徴点位置補正方法および顔特徴点位置補正プログラム
US10430650B2 (en) Image processing system
CN109063584B (zh) 基于级联回归的面部特征点定位方法、装置、设备及介质
JP6872044B2 (ja) 対象物の外接枠を決定するための方法、装置、媒体及び機器
CN111832383A (zh) 姿态关键点识别模型的训练方法、姿态识别方法及装置
US20210216759A1 (en) Recognition method, computer-readable recording medium recording recognition program, and learning method
KR20190126857A (ko) 이미지에서 오브젝트 검출 및 표현
WO2022142854A1 (zh) 一种人体姿态识别模型优化方法、装置和终端设备
US20220284652A1 (en) System and method for matching a test frame sequence with a reference frame sequence
JP6381368B2 (ja) 画像処理装置、画像処理方法、およびプログラム
US20230237777A1 (en) Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium
CN114333046A (zh) 舞蹈动作评分方法、装置、设备和存储介质
JP2019192192A (ja) 情報処理装置、情報処理プログラム、及び、情報処理方法
US20220415085A1 (en) Method of machine learning and facial expression recognition apparatus
JP6939608B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラム
JP2011232845A (ja) 特徴点抽出装置および方法
WO2021166181A1 (ja) 被写体別特徴点分離装置、被写体別特徴点分離方法及びコンピュータプログラム
CN111368594B (zh) 用于检测关键点的方法和装置
US20220172457A1 (en) Teaching data correction method for training image, teaching data correction device and program
WO2020183656A1 (ja) データ生成方法、データ生成装置及びプログラム
US20240078832A1 (en) Joint detection apparatus, learning-model generation apparatus, joint detection method, learning-model generation method, and computer readable recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180509

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180724

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180822

R150 Certificate of patent or registration of utility model

Ref document number: 6392478

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250