JPWO2022009279A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2022009279A5
JPWO2022009279A5 JP2022534508A JP2022534508A JPWO2022009279A5 JP WO2022009279 A5 JPWO2022009279 A5 JP WO2022009279A5 JP 2022534508 A JP2022534508 A JP 2022534508A JP 2022534508 A JP2022534508 A JP 2022534508A JP WO2022009279 A5 JPWO2022009279 A5 JP WO2022009279A5
Authority
JP
Japan
Prior art keywords
image
posture
image selection
classification
skeletal structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022534508A
Other languages
English (en)
Other versions
JP7491380B2 (ja
JPWO2022009279A1 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2020/026450 external-priority patent/WO2022009279A1/ja
Publication of JPWO2022009279A1 publication Critical patent/JPWO2022009279A1/ja
Publication of JPWO2022009279A5 publication Critical patent/JPWO2022009279A5/ja
Application granted granted Critical
Publication of JP7491380B2 publication Critical patent/JP7491380B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

実施の形態に係る画像処理装置の概要を示す構成図である。 実施の形態1に係る画像処理装置の構成を示す構成図である。 実施の形態1に係る画像処理方法を示すフローチャートである。 実施の形態1に係る分類方法を示すフローチャートである。 実施の形態1に係る検索方法を示すフローチャートである。 実施の形態1に係る骨格構造の検出例を示す図である。 実施の形態1に係る人体モデルを示す図である。 実施の形態1に係る骨格構造の検出例を示す図である。 実施の形態1に係る骨格構造の検出例を示す図である。 実施の形態1に係る骨格構造の検出例を示す図である。 実施の形態1に係る分類方法の具体例を示すグラフである。 実施の形態1に係る分類結果の表示例を示す図である。 実施の形態1に係る検索方法を説明するための図である。 実施の形態1に係る検索方法を説明するための図である。 実施の形態1に係る検索方法を説明するための図である。 実施の形態1に係る検索方法を説明するための図である。 実施の形態1に係る検索結果の表示例を示す図である。 実施の形態2に係る画像処理装置の構成を示す構成図である。 実施の形態2に係る画像処理方法を示すフローチャートである。 実施の形態2に係る身長画素数算出方法の具体例1を示すフローチャートである。 実施の形態2に係る身長画素数算出方法の具体例2を示すフローチャートである。 実施の形態2に係る身長画素数算出方法の具体例を示すフローチャートである。 実施の形態2に係る正規化方法を示すフローチャートである。 実施の形態2に係る人体モデルを示す図である。 実施の形態2に係る骨格構造の検出例を示す図である。 実施の形態2に係る骨格構造の検出例を示す図である。 実施の形態2に係る骨格構造の検出例を示す図である。 実施の形態2に係る人体モデルを示す図である。 実施の形態2に係る骨格構造の検出例を示す図である。 実施の形態2に係る身長画素数算出方法を説明するためのヒストグラムである。 実施の形態2に係る骨格構造の検出例を示す図である。 実施の形態2に係る3次元人体モデルを示す図である。 実施の形態2に係る身長画素数算出方法を説明するための図である。 実施の形態2に係る身長画素数算出方法を説明するための図である。 実施の形態2に係る身長画素数算出方法を説明するための図である。 実施の形態2に係る正規化方法を説明するための図である。 実施の形態2に係る正規化方法を説明するための図である。 実施の形態2に係る正規化方法を説明するための図である。 画像処理装置のハードウェア構成例を示す図である。 検索方法6に係る検索部の機能構成の一例を示す図である。 (A)は、基準姿勢情報の一例を示す図であり、(B)は、クエリ情報の一例を示す図である。 検索方法6において検索部が行う処理の第1例を示すフローチャートである。 検索方法6において検索部が行う処理の第2例を示すフローチャートである。 検索方法6において検索部が行う処理の第3例を示すフローチャートである。
このように、実施の形態では、2次元画像から人物の2次元骨格構造を検出し、この2次元骨格構造から算出される特徴量に基づいて人物の状態の分類や検等の認識処理を行うことで、所望の人物の状態を柔軟に認識することができる。
続いて、図3に示すように、画像処理装置100は、分類処理を行う(S104)。分類処理では、図4に示すように、分類部104は、算出された骨格構造の特徴量の類似度を算出し(S111)、算出された類似度に基づいて骨格構造を分類する(S112)。分類部104は、分類対象であるデータベース110に格納されている全ての骨格構造間の特徴量の類似度を求め、最も類似度が高い骨格構造(姿勢)を同じクラスタに分類する(クラスタリングする)。さらに、分類したクラスタ間の類似度を求めて分類し、所定の数のクラスタとなるまで分類を繰り返す。図11は、骨格構造の特徴量の分類結果のイメージを示している。図11は、2次元の分類要素によるクラスタ分析のイメージであり、2つ分類要素は、例えば、骨格領域の高さと骨格領域の面積等である。図11では、分類の結果、複数の骨格構造の特徴量が3つのクラスタC1~C3に分類されている。クラスタC1~C3は、例えば、立っている姿勢、座っている姿勢、寝ている姿勢のように各姿勢に対応し、似ている姿勢ごとに骨格構造(人物)が分類される。
(分類方法1)複数の階層による分類
全身の骨格構造による分類や、上半身や下半身の骨格構造による分類、腕や脚の骨格構造による分類等を階層的に組み合わせて分類する。すなわち、骨格構造の第1の部分や第2の部分の特徴量に基づいて分類し、さらに、第1の部分や第2の部分の特徴量に重みづけを行って分類してもよい。
(分類方法2)時系列に沿った複数枚の画像による分類
時系列に連続する複数の画像における骨格構造の特徴量に基づいて分類する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて分類してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて分類してもよい。
(分類方法3)骨格構造の左右を無視した分類
人物の右側と左側が反対の骨格構造を同じ骨格構造として分類する。
さらに、分類部104は、骨格構造の分類結果を表示する(S113)。分類部104は、データベース110から必要な骨格構造や人物の画像を取得し、分類結果として似ている姿勢(クラスタ)ごとに骨格構造及び人物を表示部107に表示する。図12は、姿勢を3つに分類した場合の表示例を示している。例えば、図12に示すように、表示ウィンドウW1に、姿勢ごとの姿勢領域WA1~WA3を表示し、姿勢領域WA1~WA3にそれぞれ該当する姿勢の骨格構造及び人物(イメージ)を表示する。姿勢領域WA1は、例えば立っている姿勢の表示領域であり、クラスタC1に分類された、立っている姿勢に似た骨格構造及び人物を表示する。姿勢領域WA2は、例えば座っている姿勢の表示領域であり、クラスタC2に分類された、座っている姿勢に似た骨格構造及び人物を表示する。姿勢領域WA3は、例えば寝ている姿勢の表示領域であり、クラスタCに分類された、寝ている姿勢に似た骨格構造及び人物を表示する。
(検索方法1)高さ方向の特徴量のみによる検索
人物の高さ方向の特徴量のみを用いて検索することで、人物の横方向の変化の影響を抑えることができ、人物の向きや人物の体型の変化に対しロバスト性が向上する。例えば、図13の骨格構造501~503のように、人物の向きや体型が異なる場合でも、高さ方向の特徴量は大きく変化しない。このため、骨格構造501~503では、検索時(分類時)に同じ姿勢であると判断することができる。
(検索方法3)骨格構造の左右を無視した検索
人物の右側と左側が反対の骨格構造を同じ骨格構造として検索する。例えば、図16の骨格構造531及び532のように、右手を挙げている姿勢と、左手を挙げている姿勢を同じ姿勢として検索(分類)できる。図16の例では、骨格構造531と骨格構造532は、右手のキーポイントA51、右肘のキーポイントA41、左手のキーポイントA52、左肘のキーポイントA42の位置が異なるものの、その他のキーポイントの位置は同じである。骨格構造531の右手のキーポイントA51及び右肘のキーポイントA41と骨格構造532の左手のキーポイントA52及び左肘のキーポイントA42のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となり、また、骨格構造531の左手のキーポイントA52及び左肘のキーポイントA42と骨格構造532の右手のキーポイントA51及び右肘のキーポイントA41のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となるため、同じ姿勢と判断する。
(検索方法4)縦方向と横方向の特徴量による検索
人物の縦方向(Y軸方向)の特徴量のみで検索を行った後、得られた結果をさらに人物の横方向(X軸方向)の特徴量を用いて検索する。
(検索方法5)時系列に沿った複数枚の画像による検索
時系列に連続する複数の画像における骨格構造の特徴量に基づいて検索する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて検索してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて検索してもよい。
(検索方法6)本検索方法において、検索部105は、検索クエリ(以下、クエリ情報とも記載)として、上記した骨格構造を用いる。この骨格構造は、人の姿勢を示している。そして検索部105は、基準となる姿勢と、クエリ情報との差分を用いて、少なくとも一つのキーポイントの重み付けを決定する。そして検索部105は、この重み付けを用いて、クエリ情報が示す姿勢に類似している姿勢の人を含む画像(以下、目的画像と記載)を選択する。
また、画像選択部620は、基準姿勢情報を生成する場合、例えば画像記憶部630が記憶している複数の選択対象画像を処理することにより基準姿勢情報を生成してもよい。ここで行われる処理は、例えば、少なくとも2つの選択対象画像それぞれの複数のキーポイントの相対位置を統計処理することである。ここで行われる統計処理は例えば平均であるが、これに限定されない。なお、画像選択部620は、基準姿勢情報を生成する際に、画像記憶部630が記憶しているすべての選択対象画像を用いてもよい。
図41(A)は、基準姿勢情報の一例を示す図であり、図41(B)は、クエリ情報の一例を示す図である。図41(A)に示す例において、基姿勢情報が示す姿勢は直立である。一方、図41(B)に示すクエリ情報は、左手を上げている。この場合、クエリ情報と基準姿勢情報との差は、左手のキーポイントやボーンリンクが最も大きい。このため、図41(B)に示すクエリ情報を用いて目的画像を選択する場合、画像選択部620は、左手のキーポイントやボーンリンクの重み付けの値を、他のキーポイントやボーンリンクと比べて大きくする。
そして画像選択部620は、画像記憶部630が記憶している複数の選択対象画像から、クエリ情報に類似する画像を選択する(ステップS320)。この際、上記したように、画像選択部620は、複数の選択対象画像毎に、クエリ情報に対する類似スコアを算出するが、この類似スコアを算出する際に、ステップS310で算出した重み付けを用いる。そして画像選択部620は類似スコアが基準値以上になった画像を、目的画像として選択する。ただし画像選択部620は、類似スコアが大きい順に選択対象画像を並べ、上位から数えて基準数までの選択対象画像を目的画像として選択してもよい。
続いて、身長算出部108は、図21に示すように、身長画素数の最適値を算出する(S223)。身長算出部108は、ボーンごとに求めた身長画素数から身長画素数の最適値を算出する。例えば、図30に示すような、ボーンごとに求めた身長画素数のヒストグラムを生成し、その中で大きい身長画素数を選択する。つまり、複数のボーンに基づいて求められた複数の身長画素数の中で他よりも長い身長画素数を選択する。例えば、上位30%を有効な値とし、図30ではボーンB71、B61、B51による身長画素数を選択する。選択した身長画素数の平均を最適値として求めてもよいし、最も大きい身長画素数を最適値としてもよい。2次元画像のボーンの長さから身長を求めるため、ボーンを正面から撮像できていない場合、すなわち、ボーンがカメラから見て奥行き方向に傾いて撮像された場合、ボーンの長さが正面から撮像した場合よりも短くなる。そうすると、身長画素数が大きい値は、身長画素数が小さい値よりも、正面から撮像された可能性が高く、より尤もらしい値となることから、より大きい値を最適値とする。
上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下に限られない。
1.人の姿勢を示すクエリ情報を取得するクエリ取得手段と、
前記クエリ情報を用いて、複数の選択対象画像から少なくとも一つの目的画像を選択する画像選択手段と、
を備え、
前記クエリ情報は、人の身体の互いに異なる部分を示す複数のキーポイントの相対位置を含んでおり、
前記画像選択手段は、
前記複数のキーポイントの基準相対位置を含む基準姿勢情報と、前記クエリ情報との差分を用いて、少なくとも一つの前記キーポイントの重み付けを決定し、
前記選択対象画像に含まれる人の前記複数のキーポイントの相対位置、前記クエリ情報、及び前記重み付けを用いて、前記少なくとも一つの目的画像を選択する、画像選択装置。
2.上記1に記載の画像選択装置において、
前記画像選択手段は、前記複数のキーポイントのそれぞれにおいて、前記基準姿勢情報における当該キーポイントの前記基準相対位置と、前記クエリ情報における当該キーポイントの相対位置と、の差が大きくなると、当該キーポイントの前記重み付けを大きくする画像選択装置。
3.上記1又は2に記載の画像選択装置において、
前記基準姿勢情報は、人が直立し、かつ両手を体に沿って下げたときの前記複数のキーポイントの相対位置を示す画像選択装置。
4.上記1又は2に記載の画像選択装置において、
前記画像選択手段は、複数の選択対象画像を処理することにより、前記基準姿勢情報を生成する画像選択装置。
5.上記4に記載の画像選択装置において、
前記画像選択手段は、少なくとも2つの前記選択対象画像それぞれの前記複数のキーポイントの相対位置を統計処理することにより、前記基準相対位置を決定する画像選択装置。
6.上記1又は2に記載の画像選択装置において、
前記画像選択手段は、ユーザからの入力に従って前記基準姿勢情報を取得する、画像選択装置。
7.コンピュータが、
人の姿勢を示すクエリ情報を取得するクエリ取得処理と、
前記クエリ情報を用いて、複数の選択対象画像から少なくとも一つの目的画像を選択する画像選択処理と、
を行い
前記クエリ情報は、人の身体の互いに異なる部分を示す複数のキーポイントの相対位置を含んでおり、
前記画像選択処理において、前記コンピュータは、
前記複数のキーポイントの基準相対位置を含む基準姿勢情報と、前記クエリ情報との差分を用いて、少なくとも一つの前記キーポイントの重み付けを決定し、
前記選択対象画像に含まれる人の前記複数のキーポイントの相対位置、前記クエリ情報、及び前記重み付けを用いて、前記少なくとも一つの目的画像を選択する、画像選択方法。

8.上記7に記載の画像選択方法において、
前記画像選択処理において、前記コンピュータは、前記複数のキーポイントのそれぞれにおいて、前記基準姿勢情報における当該キーポイントの前記基準相対位置と、前記クエリ情報における当該キーポイントの相対位置と、の差が大きくなると、当該キーポイントの前記重み付けを大きくする画像選択方法。
9.上記7又は8に記載の画像選択方法において、
前記基準姿勢情報は、人が直立し、かつ両手を体に沿って下げたときの前記複数のキーポイントの相対位置を示す画像選択方法。
10.上記7又は8に記載の画像選択方法において、
前記画像選択処理において、前記コンピュータは、複数の選択対象画像を処理することにより、前記基準姿勢情報を生成する画像選択方法。
11.上記10に記載の画像選択方法において、
前記画像選択処理において、前記コンピュータは、少なくとも2つの前記選択対象画像それぞれの前記複数のキーポイントの相対位置を統計処理することにより、前記基準相対位置を決定する画像選択方法。
12.上記7又は8に記載の画像選択方法において、
前記画像選択処理において、前記コンピュータは、ユーザからの入力に従って前記基準姿勢情報を取得する、画像選択方法。
13.コンピュータに、
人の姿勢を示すクエリ情報を取得するクエリ取得機能と、
前記クエリ情報を用いて、複数の選択対象画像から少なくとも一つの目的画像を選択する画像選択機能と、
を持たせ、
前記クエリ情報は、人の身体の互いに異なる部分を示す複数のキーポイントの相対位置を含んでおり、
前記画像選択機能は、
前記複数のキーポイントの基準相対位置を含む基準姿勢情報と、前記クエリ情報との差分を用いて、少なくとも一つの前記キーポイントの重み付けを決定し、
前記選択対象画像に含まれる人の前記複数のキーポイントの相対位置、前記クエリ情報、及び前記重み付けを用いて、前記少なくとも一つの目的画像を選択する、プログラム。
14.上記13に記載のプログラムにおいて、
前記画像選択機能は、前記複数のキーポイントのそれぞれにおいて、前記基準姿勢情報における当該キーポイントの前記基準相対位置と、前記クエリ情報における当該キーポイントの相対位置と、の差が大きくなると、当該キーポイントの前記重み付けを大きくするプログラム。
15.上記13又は14に記載のプログラムにおいて、
前記基準姿勢情報は、人が直立し、かつ両手を体に沿って下げたときの前記複数のキーポイントの相対位置を示すプログラム。
16.上記13又は14に記載のプログラムにおいて、
前記画像選択機能は、複数の選択対象画像を処理することにより、前記基準姿勢情報を生成するプログラム。
17.上記16に記載のプログラムにおいて、
前記画像選択機能は、少なくとも2つの前記選択対象画像それぞれの前記複数のキーポイントの相対位置を統計処理することにより、前記基準相対位置を決定するプログラム。
18.上記13又は14に記載のプログラムにおいて、
前記画像選択機能は、ユーザからの入力に従って前記基準姿勢情報を取得する、プログラム。
JP2022534508A 2020-07-06 2020-07-06 画像選択装置、画像選択方法、及びプログラム Active JP7491380B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/026450 WO2022009279A1 (ja) 2020-07-06 2020-07-06 画像選択装置、画像選択方法、及びプログラム

Publications (3)

Publication Number Publication Date
JPWO2022009279A1 JPWO2022009279A1 (ja) 2022-01-13
JPWO2022009279A5 true JPWO2022009279A5 (ja) 2023-03-10
JP7491380B2 JP7491380B2 (ja) 2024-05-28

Family

ID=79553087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022534508A Active JP7491380B2 (ja) 2020-07-06 2020-07-06 画像選択装置、画像選択方法、及びプログラム

Country Status (3)

Country Link
US (1) US20230245342A1 (ja)
JP (1) JP7491380B2 (ja)
WO (1) WO2022009279A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115171149B (zh) * 2022-06-09 2023-12-05 广州紫为云科技有限公司 基于单目rgb图像回归的实时人体2d/3d骨骼关键点识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711211B2 (en) 2005-06-08 2010-05-04 Xerox Corporation Method for assembling a collection of digital images
JP6650829B2 (ja) 2016-05-23 2020-02-19 日本電信電話株式会社 画像検索装置、方法、及びプログラム
JP6831769B2 (ja) 2017-11-13 2021-02-17 株式会社日立製作所 画像検索装置、画像検索方法、及び、それに用いる設定画面

Similar Documents

Publication Publication Date Title
Yun et al. Human fall detection in videos by fusing statistical features of shape and motion dynamics on Riemannian manifolds
JP6487642B2 (ja) 手指形状の検出方法、そのプログラム、そのプログラムの記憶媒体、及び、手指の形状を検出するシステム。
JP2014093023A (ja) 物体検出装置、物体検出方法及びプログラム
JPWO2021229751A5 (ja)
JPWO2021250808A5 (ja)
US20230214421A1 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JPWO2022009279A5 (ja)
JP7501622B2 (ja) 画像選択装置、画像選択方法、およびプログラム
JPWO2022079794A5 (ja)
JPWO2022009327A5 (ja)
US11983242B2 (en) Learning data generation device, learning data generation method, and learning data generation program
JP7435781B2 (ja) 画像選択装置、画像選択方法、及びプログラム
JP7491380B2 (ja) 画像選択装置、画像選択方法、及びプログラム
WO2022079794A1 (ja) 画像選択装置、画像選択方法、及びプログラム
JPWO2022079795A5 (ja)
JPWO2021234935A5 (ja)
JPWO2021229750A5 (ja)
WO2022249278A1 (ja) 画像処理装置、画像処理方法、およびプログラム
WO2022249331A1 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7302741B2 (ja) 画像選択装置、画像選択方法、およびプログラム
JPWO2021224994A5 (ja)
JPWO2022249331A5 (ja)
JP7468642B2 (ja) 画像処理装置、画像処理方法、及びプログラム
WO2023152974A1 (ja) 画像処理装置、画像処理方法、およびプログラム
JP7435754B2 (ja) 画像選択装置、画像選択方法、及びプログラム