JPWO2022181252A5 - 関節点検出装置、関節点検出方法、及びプログラム - Google Patents
関節点検出装置、関節点検出方法、及びプログラム Download PDFInfo
- Publication number
- JPWO2022181252A5 JPWO2022181252A5 JP2023502225A JP2023502225A JPWO2022181252A5 JP WO2022181252 A5 JPWO2022181252 A5 JP WO2022181252A5 JP 2023502225 A JP2023502225 A JP 2023502225A JP 2023502225 A JP2023502225 A JP 2023502225A JP WO2022181252 A5 JPWO2022181252 A5 JP WO2022181252A5
- Authority
- JP
- Japan
- Prior art keywords
- joint point
- joint
- target
- feature amount
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims description 20
- 238000010801 machine learning Methods 0.000 claims description 26
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 1
Description
本発明は、画像から生体の関節点を検出するための、関節点検出装置、及び関節点検出方法に関し、更には、これらを実現するためのプログラムに関する。また、本発明は、画像からの生体の関節点の検出用の学習モデルを生成するための、学習モデル生成装置、及び学習モデル生成方法に関し、更には、これらを実現するためのプログラムに関する。
本発明の目的の一例は、関節点の位置の推定精度の向上を図り得る、関節点検出装置、学習モデル生成装置、関節点検出方法、学習モデル生成方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明の一側面における第1のプログラムは、
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、部分特徴量出力ステップと、
を実行させる、ことを特徴とする。
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、部分特徴量出力ステップと、
を実行させる、ことを特徴とする。
上記目的を達成するため、本発明の一側面における第2のプログラムは、
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記特徴量から、特定の関節点の特徴量が存在しない場合の特徴量を訓練用特徴量として生成する、特徴量生成ステップと、
生成された前記訓練用特徴量を含む訓練データを用いて、前記特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習することによって、機械学習モデルを生成する、学習モデル生成ステップと、
を実行させる、ことを特徴とする。
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記特徴量から、特定の関節点の特徴量が存在しない場合の特徴量を訓練用特徴量として生成する、特徴量生成ステップと、
生成された前記訓練用特徴量を含む訓練データを用いて、前記特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習することによって、機械学習モデルを生成する、学習モデル生成ステップと、
を実行させる、ことを特徴とする。
具体的には、全特徴量出力部11は、例えば、画像上の関節点とヒートマップとの関係を学習している機械学習モデルを用い、この機械学習モデルに、画像データを入力することで、ヒートマップ21を出力する。この場合の機械学習モデルとしても、CNNが挙げられる。また、このCNNの機械学習では、関節点の画像データと、正解となるヒートマップとが訓練データとなる。そして、CNNの機械学習は、訓練データとなる画像データの出力結果(ヒートマップ)と正解となるヒートマップとの差分が小さくなるように、パラメータを更新することで行われる。
次に、特徴量生成部12は、所定数の訓練用ヒートマップセット22が生成されているかどうかを判定する(ステップA4)。そして、ステップA4の判定の結果、所定数の訓練用ヒートマップセット22が生成されていない場合(ステップA4:No)は、特徴量生成部12は、再度ステップA2を実行する。
全特徴量出力部31は、実施の形態1と同様の機能を有しており、まず、対象の画像データ40を取得する。そして、全特徴量出力部31は、図8に示すように、画像データ40から、関節点を表す第1の特徴量として、第1のヒートマップ41を出力する。また、図8の例では、第1のヒートマップ41は、画像データ40上の関節点毎に複数出力されている。
CNN16は、実施の形態1において述べたように、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルである。このため、第2のヒートマップ42では、第2の特徴量として、特定の関節点が見えない場合における、それ以外の関節点の位置が適切に示されている。
具体的には、関節点検出部33は、関節点毎に、第2のヒートマップ42の最も濃度の高い箇所を特定し、特定した箇所の画像上の2次元座標を検出する。また、関節点毎に、第2のヒートマップ42が複数存在する場合は、関節点検出部33は、第2のヒートマップ42毎に最も濃度の高い箇所の2次元座標を特定し、更に、特定した各2次元座標の平均を求め、求めた平均の座標を最終的な座標とする。
次に、部分特徴量出力部32は、CNN16に、ステップB1で出力された第1のヒートマップ41を入力し、関節点を表す第2のヒートマップ42を出力させる(ステップB2)。
以上のように、実施の形態2では、画像データから取得された第1のヒートマップ41が、CNN16に入力される。CNN16は、特定の関節点以外の関節点間の位置関係を機械学習しているので、第2のヒートマップ42は、特定の関節点が見えない場合における、それ以外の関節点の位置を適切に示すことができる。このため、実施の形態2によれば、対象の関節点の位置の推定精度の向上が図られることになる。
(付記15)
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、部分特徴量出力ステップと、
を実行させる、プログラム。
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、部分特徴量出力ステップと、
を実行させる、プログラム。
(付記16)
付記15に記載のプログラムであって、
前記コンピュータに、更に、
前記対象の関節点それぞれ毎の前記第2の特徴量を用いて、前記対象の関節点の座標を検出する、関節点検出ステップを実行させる、
ことを特徴とするプログラム。
付記15に記載のプログラムであって、
前記コンピュータに、更に、
前記対象の関節点それぞれ毎の前記第2の特徴量を用いて、前記対象の関節点の座標を検出する、関節点検出ステップを実行させる、
ことを特徴とするプログラム。
(付記17)
付記15または16に記載のプログラムであって、
前記部分特徴量出力ステップにおいて、前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、複数の前記特定の関節点それぞれについて当該特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している、機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、
ことを特徴とするプログラム。
付記15または16に記載のプログラムであって、
前記部分特徴量出力ステップにおいて、前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、複数の前記特定の関節点それぞれについて当該特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している、機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、
ことを特徴とするプログラム。
(付記18)
付記15から17のいずれかに記載のプログラムであって、
前記機械学習モデルが、畳み込みニューラルネットワークによって構築されており、
前記第1の特徴量、及び前記第2の特徴量、それぞれが、画像上の関節点が存在する可能性を表現するヒートマップを含む、
ことを特徴とするプログラム。
付記15から17のいずれかに記載のプログラムであって、
前記機械学習モデルが、畳み込みニューラルネットワークによって構築されており、
前記第1の特徴量、及び前記第2の特徴量、それぞれが、画像上の関節点が存在する可能性を表現するヒートマップを含む、
ことを特徴とするプログラム。
(付記19)
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記特徴量から、特定の関節点の特徴量がゼロに設定された場合の特徴量を訓練用特徴量として生成する、特徴量生成ステップと、
生成された前記訓練用特徴量を含む訓練データを用いて、前記特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習することによって、機械学習モデルを生成する、学習モデル生成ステップと、
を実行させる、プログラム。
コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す特徴量を出力する、全特徴量出力ステップと、
前記対象の関節点それぞれ毎の前記特徴量から、特定の関節点の特徴量がゼロに設定された場合の特徴量を訓練用特徴量として生成する、特徴量生成ステップと、
生成された前記訓練用特徴量を含む訓練データを用いて、前記特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習することによって、機械学習モデルを生成する、学習モデル生成ステップと、
を実行させる、プログラム。
(付記20)
付記19に記載のプログラムであって、
前記特徴量生成ステップにおいて、前記対象の関節点それぞれ毎の前記特徴量から、複数の特定の関節点それぞれ毎に、当該特定の関節点の特徴量のみが存在しない場合の特徴量のセットを、訓練用特徴量セットとして生成し、
前記学習モデル生成ステップにおいて、複数の特定の関節点それぞれ毎に、対応する前記訓練用特徴量セットを含む訓練データを用いて、当該特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習することによって、機械学習モデルを生成する、
ことを特徴とするプログラム。
付記19に記載のプログラムであって、
前記特徴量生成ステップにおいて、前記対象の関節点それぞれ毎の前記特徴量から、複数の特定の関節点それぞれ毎に、当該特定の関節点の特徴量のみが存在しない場合の特徴量のセットを、訓練用特徴量セットとして生成し、
前記学習モデル生成ステップにおいて、複数の特定の関節点それぞれ毎に、対応する前記訓練用特徴量セットを含む訓練データを用いて、当該特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習することによって、機械学習モデルを生成する、
ことを特徴とするプログラム。
(付記21)
付記19または20に記載のプログラムであって、
前記機械学習モデルが、畳み込みニューラルネットワークによって構築されており、
前記特徴量が、画像上の関節点が存在する可能性を表現するヒートマップを含み、
前記特徴量生成ステップにおいて、前記ヒートマップ上のデータをゼロまたは1とすることによって、特徴量を存在しないことに設定する、
ことを特徴とするプログラム。
付記19または20に記載のプログラムであって、
前記機械学習モデルが、畳み込みニューラルネットワークによって構築されており、
前記特徴量が、画像上の関節点が存在する可能性を表現するヒートマップを含み、
前記特徴量生成ステップにおいて、前記ヒートマップ上のデータをゼロまたは1とすることによって、特徴量を存在しないことに設定する、
ことを特徴とするプログラム。
Claims (8)
- 対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力する、全特徴量出力手段と、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、部分特徴量出力手段と、
を備えていることを特徴とする関節点検出装置。 - 請求項1に記載の関節点検出装置であって、
前記対象の関節点それぞれ毎の前記第2の特徴量を用いて、前記対象の関節点の座標を検出する、関節点検出手段を更に備えている、
ことを特徴とする関節点検出装置。 - 請求項1に記載の関節点検出装置であって、
前記部分特徴量出力手段が、前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、複数の前記特定の関節点それぞれについて当該特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している、機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、
ことを特徴とする関節点検出装置。 - 請求項1に記載の関節点検出装置であって、
前記機械学習モデルが、畳み込みニューラルネットワークによって構築されており、
前記第1の特徴量、及び前記第2の特徴量、それぞれが、画像上の関節点が存在する可能性を表現するヒートマップを含む、
ことを特徴とする関節点検出装置。 - 対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力し、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力する、
ことを特徴とする関節点検出方法。 - 請求項5に記載の関節点検出方法であって、
前記対象の関節点それぞれ毎の前記第2の特徴量を用いて、前記対象の関節点の座標を検出する、
ことを特徴とする関節点検出方法。 - コンピュータに、
対象の画像データから、前記対象の関節点それぞれ毎に、当該関節点を表す第1の特徴量を出力させ、
前記対象の関節点それぞれ毎の前記第1の特徴量を入力として、特定の関節点の特徴量が存在しない場合の他の関節点間の位置関係を機械学習している機械学習モデルを用いて、前記対象の関節点それぞれ毎に、当該関節点を表す第2の特徴量を出力させる、
プログラム。 - 請求項7に記載のプログラムであって、
前記コンピュータに、更に、
前記対象の関節点それぞれ毎の前記第2の特徴量を用いて、前記対象の関節点の座標を検出させる、
ことを特徴とするプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021029411 | 2021-02-26 | ||
PCT/JP2022/003766 WO2022181252A1 (ja) | 2021-02-26 | 2022-02-01 | 関節点検出装置、学習モデル生成装置、関節点検出方法、学習モデル生成方法、及びコンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022181252A1 JPWO2022181252A1 (ja) | 2022-09-01 |
JPWO2022181252A5 true JPWO2022181252A5 (ja) | 2023-10-23 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110827383B (zh) | 三维模型的姿态模拟方法、装置、存储介质和电子设备 | |
WO2022027913A1 (zh) | 目标检测模型生成方法、装置、设备及存储介质 | |
JP6392478B1 (ja) | 情報処理装置、情報処理プログラム、及び、情報処理方法 | |
US11080833B2 (en) | Image manipulation using deep learning techniques in a patch matching operation | |
CN111754391A (zh) | 人脸转正方法、设备及计算机可读存储介质 | |
JP2023109570A (ja) | 情報処理装置、学習装置、画像認識装置、情報処理方法、学習方法、画像認識方法 | |
JP2020098588A (ja) | ノイズ先行物を用いる曲線オブジェクトセグメンテーション | |
CN111915676B (zh) | 图像生成方法、装置、计算机设备和存储介质 | |
JP6601825B2 (ja) | 画像処理装置および2次元画像生成用プログラム | |
CN111126566B (zh) | 基于gan模型的异常家具布局数据检测方法 | |
CN110910478B (zh) | Gif图生成方法、装置、电子设备及存储介质 | |
JPWO2022181252A5 (ja) | 関節点検出装置、関節点検出方法、及びプログラム | |
JP6986160B2 (ja) | 画像処理方法および画像処理装置 | |
CN114638921B (zh) | 动作捕捉方法、终端设备及存储介质 | |
US11207773B2 (en) | Action transfer device, action transfer method, and non-transitory computer-readable medium storing action transfer program | |
CN112348069B (zh) | 数据增强方法、装置、计算机可读存储介质及终端设备 | |
CN111523517B (zh) | 动作评分方法、装置、电子设备及可读存储介质 | |
WO2022181252A1 (ja) | 関節点検出装置、学習モデル生成装置、関節点検出方法、学習モデル生成方法、及びコンピュータ読み取り可能な記録媒体 | |
CN116528759A (zh) | 信息处理装置、信息处理方法和程序 | |
WO2024143048A1 (ja) | 学習モデル生成装置、関節点検出装置、学習モデル生成方法、関節点検出方法、及びコンピュータ読み取り可能な記録媒体 | |
WO2022181251A1 (ja) | 関節点検出装置、関節点検出方法、及びコンピュータ読み取り可能な記録媒体 | |
JPWO2022181251A5 (ja) | 関節点検出装置、関節点検出方法、及びプログラム | |
JPWO2021038840A5 (ja) | ||
JPWO2019186833A1 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
CN111382834A (zh) | 一种置信度比较方法及装置 |