JPWO2021224994A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021224994A5 JPWO2021224994A5 JP2022519885A JP2022519885A JPWO2021224994A5 JP WO2021224994 A5 JPWO2021224994 A5 JP WO2021224994A5 JP 2022519885 A JP2022519885 A JP 2022519885A JP 2022519885 A JP2022519885 A JP 2022519885A JP WO2021224994 A5 JPWO2021224994 A5 JP WO2021224994A5
- Authority
- JP
- Japan
- Prior art keywords
- exclusion
- image
- search
- selection
- posture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007717 exclusion Effects 0.000 claims description 55
- 230000036544 posture Effects 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000010187 selection method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 33
- 238000000034 method Methods 0.000 description 19
- 238000001514 detection method Methods 0.000 description 9
- 210000000988 bone and bone Anatomy 0.000 description 8
- 238000010606 normalization Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000037237 body shape Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Description
一方、特許文献5には、複数の画像のうち所定の条件を満たした画像を記憶手段から削除することが記載されている。所定の条件の例は、顔がぶれている、顔に対して露出アンダーである、目を閉じている、顔が上を向きすぎている、目の下にクマがある、化粧がされていない、顔が横を向いている、などである。また特許文献5には、削除を望む被写体が写った画像を入力することにより、この人物が撮像された画像を削除候補として設定することができる、と記載されている。さらに特許文献5には、削除候補を表示手段に表示させ、その後、ユーザからの入力に応じて削除候補の画像を記憶手段から削除することも記載されている。
このように、実施の形態では、2次元画像から人物の2次元骨格構造を検出し、この2次元骨格構造から算出される特徴量に基づいて人物の状態の分類や検索等の認識処理を行うことで、所望の人物の状態を柔軟に認識することができる。
続いて、図3に示すように、画像処理装置100は、分類処理を行う(S104)。分類処理では、図4に示すように、分類部104は、算出された骨格構造の特徴量の類似度を算出し(S111)、算出された類似度に基づいて骨格構造を分類する(S112)。分類部104は、分類対象であるデータベース110に格納されている全ての骨格構造間の特徴量の類似度を求め、最も類似度が高い骨格構造(姿勢)を同じクラスタに分類する(クラスタリングする)。さらに、分類したクラスタ間の類似度を求めて分類し、所定の数のクラスタとなるまで分類を繰り返す。図11は、骨格構造の特徴量の分類結果のイメージを示している。図11は、2次元の分類要素によるクラスタ分析のイメージであり、2つ分類要素は、例えば、骨格領域の高さと骨格領域の面積等である。図11では、分類の結果、複数の骨格構造の特徴量が3つのクラスタC1~C3に分類されている。クラスタC1~C3は、例えば、立っている姿勢、座っている姿勢、寝ている姿勢のように各姿勢に対応し、似ている姿勢ごとに骨格構造(人物)が分類される。
(分類方法1)複数の階層による分類
全身の骨格構造による分類や、上半身や下半身の骨格構造による分類、腕や脚の骨格構造による分類等を階層的に組み合わせて分類する。すなわち、骨格構造の第1の部分や第2の部分の特徴量に基づいて分類し、さらに、第1の部分や第2の部分の特徴量に重みづけを行って分類してもよい。
全身の骨格構造による分類や、上半身や下半身の骨格構造による分類、腕や脚の骨格構造による分類等を階層的に組み合わせて分類する。すなわち、骨格構造の第1の部分や第2の部分の特徴量に基づいて分類し、さらに、第1の部分や第2の部分の特徴量に重みづけを行って分類してもよい。
(分類方法2)時系列に沿った複数枚の画像による分類
時系列に連続する複数の画像における骨格構造の特徴量に基づいて分類する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて分類してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて分類してもよい。
時系列に連続する複数の画像における骨格構造の特徴量に基づいて分類する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて分類してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて分類してもよい。
(分類方法3)骨格構造の左右を無視した分類
人物の右側と左側が反対の骨格構造を同じ骨格構造として分類する。
人物の右側と左側が反対の骨格構造を同じ骨格構造として分類する。
さらに、分類部104は、骨格構造の分類結果を表示する(S113)。分類部104は、データベース110から必要な骨格構造や人物の画像を取得し、分類結果として似ている姿勢(クラスタ)ごとに骨格構造及び人物を表示部107に表示する。図12は、姿勢を3つに分類した場合の表示例を示している。例えば、図12に示すように、表示ウィンドウW1に、姿勢ごとの姿勢領域WA1~WA3を表示し、姿勢領域WA1~WA3にそれぞれ該当する姿勢の骨格構造及び人物(イメージ)を表示する。姿勢領域WA1は、例えば立っている姿勢の表示領域であり、クラスタC1に分類された、立っている姿勢に似た骨格構造及び人物を表示する。姿勢領域WA2は、例えば座っている姿勢の表示領域であり、クラスタC2に分類された、座っている姿勢に似た骨格構造及び人物を表示する。姿勢領域WA3は、例えば寝ている姿勢の表示領域であり、クラスタC3に分類された、寝ている姿勢に似た骨格構造及び人物を表示する。
(検索方法1)高さ方向の特徴量のみによる検索
人物の高さ方向の特徴量のみを用いて検索することで、人物の横方向の変化の影響を抑えることができ、人物の向きや人物の体型の変化に対しロバスト性が向上する。例えば、図13の骨格構造501~503のように、人物の向きや体型が異なる場合でも、高さ方向の特徴量は大きく変化しない。このため、骨格構造501~503では、検索時(分類時)に同じ姿勢であると判断することができる。
人物の高さ方向の特徴量のみを用いて検索することで、人物の横方向の変化の影響を抑えることができ、人物の向きや人物の体型の変化に対しロバスト性が向上する。例えば、図13の骨格構造501~503のように、人物の向きや体型が異なる場合でも、高さ方向の特徴量は大きく変化しない。このため、骨格構造501~503では、検索時(分類時)に同じ姿勢であると判断することができる。
(検索方法3)骨格構造の左右を無視した検索
人物の右側と左側が反対の骨格構造を同じ骨格構造として検索する。例えば、図16の骨格構造531及び532のように、右手を挙げている姿勢と、左手を挙げている姿勢を同じ姿勢として検索(分類)できる。図16の例では、骨格構造531と骨格構造532は、右手のキーポイントA51、右肘のキーポイントA41、左手のキーポイントA52、左肘のキーポイントA42の位置が異なるものの、その他のキーポイントの位置は同じである。骨格構造531の右手のキーポイントA51及び右肘のキーポイントA41と骨格構造532の左手のキーポイントA52及び左肘のキーポイントA42のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となり、また、骨格構造531の左手のキーポイントA52及び左肘のキーポイントA42と骨格構造532の右手のキーポイントA51及び右肘のキーポイントA41のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となるため、同じ姿勢と判断する。
人物の右側と左側が反対の骨格構造を同じ骨格構造として検索する。例えば、図16の骨格構造531及び532のように、右手を挙げている姿勢と、左手を挙げている姿勢を同じ姿勢として検索(分類)できる。図16の例では、骨格構造531と骨格構造532は、右手のキーポイントA51、右肘のキーポイントA41、左手のキーポイントA52、左肘のキーポイントA42の位置が異なるものの、その他のキーポイントの位置は同じである。骨格構造531の右手のキーポイントA51及び右肘のキーポイントA41と骨格構造532の左手のキーポイントA52及び左肘のキーポイントA42のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となり、また、骨格構造531の左手のキーポイントA52及び左肘のキーポイントA42と骨格構造532の右手のキーポイントA51及び右肘のキーポイントA41のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となるため、同じ姿勢と判断する。
(検索方法4)縦方向と横方向の特徴量による検索
人物の縦方向(Y軸方向)の特徴量のみで検索を行った後、得られた結果をさらに人物の横方向(X軸方向)の特徴量を用いて検索する。
人物の縦方向(Y軸方向)の特徴量のみで検索を行った後、得られた結果をさらに人物の横方向(X軸方向)の特徴量を用いて検索する。
(検索方法5)時系列に沿った複数枚の画像による検索
時系列に連続する複数の画像における骨格構造の特徴量に基づいて検索する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて検索してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて検索してもよい。
時系列に連続する複数の画像における骨格構造の特徴量に基づいて検索する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて検索してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて検索してもよい。
第2の例において、除外基準はユーザの入力に従って設定されている。そしてユーザは、除外基準を変更しながら、除外用スコア算出部630及び除外画像選択部640に、ステップS308及びステップS310に示した処理を繰り返し行わせている。これにより、除外基準は最適な値に調整される。そして検索用情報取得部610は、選択基準をこの除外基準を用いて更新する。具体的には、図46に示すように、検索用情報取得部610は、選択基準としての特徴量空間における距離を、「「検索クエリ画像から除外クエリ画像までの距離」-「除外基準としての特徴量空間における距離」」に更新する。
そして検索用情報取得部610は、更新後の選択基準及び検索クエリ画像を互いに紐づけてデータベース110に記憶させる。その後、検索用情報取得部610は、ユーザ入力に従ってデータベース110に記憶された検索クエリ画像を用いて画像を検索する場合、この検索クエリ画像に紐づいている選択基準をデータベース110から読み出して使用する。このため、検索クエリ画像を再利用して対象画像を選択する場合、その選択結果の精度は高くなる。
続いて、身長算出部108は、図21に示すように、身長画素数の最適値を算出する(S223)。身長算出部108は、ボーンごとに求めた身長画素数から身長画素数の最適値を算出する。例えば、図30に示すような、ボーンごとに求めた身長画素数のヒストグラムを生成し、その中で大きい身長画素数を選択する。つまり、複数のボーンに基づいて求められた複数の身長画素数の中で他よりも長い身長画素数を選択する。例えば、上位30%を有効な値とし、図30ではボーンB71、B61、B51による身長画素数を選択する。選択した身長画素数の平均を最適値として求めてもよいし、最も大きい身長画素数を最適値としてもよい。2次元画像のボーンの長さから身長を求めるため、ボーンを正面から撮像できていない場合、すなわち、ボーンがカメラから見て奥行き方向に傾いて撮像された場合、ボーンの長さが正面から撮像した場合よりも短くなる。そうすると、身長画素数が大きい値は、身長画素数が小さい値よりも、正面から撮像された可能性が高く、より尤もらしい値となることから、より大きい値を最適値とする。
Claims (10)
- 複数の対象画像毎に生成された情報であって、当該対象画像に含まれる人物の姿勢を示す検索用姿勢情報を複数取得する検索用情報取得手段と、
検索結果から除外すべき画像のクエリとなる除外クエリ画像に含まれる人物の姿勢を示す除外用姿勢情報を取得する除外用情報取得手段と、
前記複数の検索用姿勢情報のそれぞれについて、前記除外用姿勢情報に対する類似度を示す除外用スコアを算出する除外用スコア算出手段と、
前記除外用スコアを用いて、前記複数の対象画像から、検索結果から除外すべき画像である除外画像を選択する除外画像選択手段と、
を備える画像選択装置。 - 請求項1に記載の画像選択装置において、
前記検索用情報取得手段は、前記対象画像に含まれるべき姿勢の人物を含む検索クエリ画像を取得し、当該検索クエリ画像に対する類似度を示す選択用スコアを用いて前記複数の対象画像を選択する画像選択装置。 - 請求項2に記載の画像選択装置において、
前記除外用スコアと前記選択用スコアは同じパラメータによって定義されており、
前記除外画像選択手段は、前記除外画像を選択するための除外基準を、前記複数の対象画像を選択するための選択基準を用いて設定する画像選択装置。 - 請求項3に記載の画像選択装置において、
前記除外画像選択手段は、前記パラメータからなる空間における距離が前記除外基準を満たす前記対象画像を、前記除外画像として選択し、
前記検索用情報取得手段は、前記パラメータからなる空間における距離が前記選択基準を満たす画像を、前記対象画像として選択し、
前記除外基準は前記選択基準未満である画像選択装置。 - 請求項2~4のいずれか一項に記載の画像選択装置において、
前記除外画像選択手段は、少なくとも一つの前記除外画像の選択入力を取得し、当該選択入力によって選択された前記除外画像を前記複数の対象画像から除外し、
前記検索用情報取得手段は、
前記検索クエリ画像を用いて前記複数の対象画像を選択するための選択基準を、前記選択入力によって選択された前記除外画像を用いて更新し、
前記検索クエリ画像及び更新後の前記選択基準を互いに紐づけて記憶手段に記憶させる画像選択装置。 - 請求項2に記載の画像選択装置において、
前記除外用スコアは、少なくとも一つのパラメータによって示されており、
前記除外画像選択手段は、前記除外画像を選択するための除外基準を、ユーザからの入力に従って設定する画像選択装置。 - 請求項6に記載の画像選択装置において、
前記除外用スコアと前記選択用スコアは同じパラメータによって定義されており、
前記除外画像選択手段は、前記除外画像を選択するための除外基準を、前記複数の対象画像を選択するための選択基準を用いて設定し、
前記検索用情報取得手段は、
前記選択基準を、前記除外基準を用いて更新し、
前記検索クエリ画像及び更新後の前記選択基準を互いに紐づけて記憶手段に記憶させる画像選択装置。 - 請求項1~7のいずれか一項に記載の画像選択装置において、
前記除外画像選択手段は、前記複数の対象画像を、前記除外画像を特定可能な状態で表示手段に表示させ、
さらに、所定の入力があったときに、前記複数の対象画像から前記除外画像を除外する除外手段を備える画像選択装置。 - コンピュータが、
複数の対象画像毎に生成された姿勢情報であって、当該対象画像に含まれる人物の姿勢を示す検索用姿勢情報を複数取得し、
検索結果から除外すべき画像のクエリとなる除外クエリ画像に含まれる人物の姿勢を示す除外用姿勢情報を取得し、
前記複数の検索用姿勢情報のそれぞれについて、前記除外用姿勢情報に対する類似度を示す除外用スコアを算出し、
前記除外用スコアを用いて、前記複数の対象画像から、検索結果から除外すべき画像である除外画像を選択する、画像選択方法。 - コンピュータに、
複数の対象画像毎に生成された姿勢情報であって、当該対象画像に含まれる人物の姿勢を示す検索用姿勢情報を複数取得する検索用情報取得機能と、
検索結果から除外すべき画像のクエリとなる除外クエリ画像に含まれる人物の姿勢を示す除外用姿勢情報を取得する除外用情報取得機能と、
前記複数の検索用姿勢情報のそれぞれについて、前記除外用姿勢情報に対する類似度を示す除外用スコアを算出する除外用スコア算出機能と、
前記除外用スコアを用いて、前記複数の対象画像から、検索結果から除外すべき画像である除外画像を選択する除外画像選択機能と、
を持たせるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/018692 WO2021224994A1 (ja) | 2020-05-08 | 2020-05-08 | 画像選択装置、画像選択方法、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021224994A1 JPWO2021224994A1 (ja) | 2021-11-11 |
JPWO2021224994A5 true JPWO2021224994A5 (ja) | 2023-01-24 |
JP7435754B2 JP7435754B2 (ja) | 2024-02-21 |
Family
ID=78468052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022519885A Active JP7435754B2 (ja) | 2020-05-08 | 2020-05-08 | 画像選択装置、画像選択方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230206482A1 (ja) |
JP (1) | JP7435754B2 (ja) |
WO (1) | WO2021224994A1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002007469A (ja) * | 2000-06-23 | 2002-01-11 | Yamaha Motor Co Ltd | 検索方法、検索装置及び画像検索装置 |
JP2005141584A (ja) * | 2003-11-07 | 2005-06-02 | Omron Corp | 画像削除装置,及び画像圧縮装置 |
KR101815975B1 (ko) * | 2011-07-27 | 2018-01-09 | 삼성전자주식회사 | 객체 자세 검색 장치 및 방법 |
JP5970512B2 (ja) * | 2014-09-26 | 2016-08-17 | エヌ・ティ・ティ・コムウェア株式会社 | 情報処理方法、情報処理装置、及びプログラム |
-
2020
- 2020-05-08 US US17/921,415 patent/US20230206482A1/en active Pending
- 2020-05-08 WO PCT/JP2020/018692 patent/WO2021224994A1/ja active Application Filing
- 2020-05-08 JP JP2022519885A patent/JP7435754B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108305283B (zh) | 基于深度相机和基本姿势的人体行为识别方法及装置 | |
US20090097711A1 (en) | Detecting apparatus of human component and method thereof | |
WO2009123354A1 (en) | Method, apparatus, and program for detecting object | |
CN104217192B (zh) | 基于深度图像的手定位方法和设备 | |
JP2006524394A (ja) | 画像における人体輪郭描写 | |
JP5940862B2 (ja) | 画像処理装置 | |
Chan et al. | A 3-D-point-cloud system for human-pose estimation | |
CN113229807A (zh) | 人体康复评估装置、方法、电子设备及存储介质 | |
JPWO2021229751A5 (ja) | ||
CN108876776B (zh) | 一种分类模型生成方法、眼底图像分类方法及装置 | |
CN105608411B (zh) | 为预置监控摄像头的影像分类方法及其装置 | |
JPWO2021250808A5 (ja) | ||
CN117456578A (zh) | 基于双向光流实现快速微表情识别处理的方法、装置、处理器及其计算机可读存储介质 | |
CN113221812A (zh) | 人脸关键点检测模型的训练方法和人脸关键点检测方法 | |
Лобачев et al. | Machine learning models and methods for human gait recognition | |
JPWO2022079794A5 (ja) | ||
JPWO2022009279A5 (ja) | ||
JP2011053952A (ja) | 画像検索装置及び画像検索方法 | |
JPWO2021224994A5 (ja) | ||
JPWO2022009327A5 (ja) | ||
CN110569711A (zh) | 面向人体动作识别方法 | |
CN113657315B (zh) | 人脸图像的质量筛选方法、装置、设备及存储介质 | |
JPWO2022079795A5 (ja) | ||
JPWO2021229750A5 (ja) | ||
JP2018165966A (ja) | 物体検出装置 |