JP7468642B2 - 画像処理装置、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7468642B2 JP7468642B2 JP2022530423A JP2022530423A JP7468642B2 JP 7468642 B2 JP7468642 B2 JP 7468642B2 JP 2022530423 A JP2022530423 A JP 2022530423A JP 2022530423 A JP2022530423 A JP 2022530423A JP 7468642 B2 JP7468642 B2 JP 7468642B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- skeletal structure
- images
- search
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 124
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000004364 calculation method Methods 0.000 claims description 66
- 238000001514 detection method Methods 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 36
- 239000000284 extract Substances 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 3
- 210000000988 bone and bone Anatomy 0.000 description 116
- 238000000034 method Methods 0.000 description 76
- 230000036544 posture Effects 0.000 description 56
- 238000010586 diagram Methods 0.000 description 36
- 230000008569 process Effects 0.000 description 32
- 238000005516 engineering process Methods 0.000 description 21
- 238000010606 normalization Methods 0.000 description 16
- 238000010801 machine learning Methods 0.000 description 11
- 238000009825 accumulation Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 210000003127 knee Anatomy 0.000 description 6
- 238000012937 correction Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000037237 body shape Effects 0.000 description 3
- 210000002411 hand bone Anatomy 0.000 description 3
- 210000002414 leg Anatomy 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 210000000610 foot bone Anatomy 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 235000000332 black box Nutrition 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/34—Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/86—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using syntactic or structural representations of the image or video pattern, e.g. symbolic string recognition; using graph matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/945—User interactive design; Environments; Toolboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
入力されたキーワードに基づきクエリ画像を取得する画像取得手段と、
前記クエリ画像に含まれる人物の2次元骨格構造を検出する骨格構造検出手段と、
前記検出された2次元骨格構造の特徴量を算出する特徴量算出手段と、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する検索手段と、
を備える画像処理装置が提供される。
コンピュータが、
入力されたキーワードに基づきクエリ画像を取得し、
前記クエリ画像に含まれる人物の2次元骨格構造を検出し、
前記検出された2次元骨格構造の特徴量を算出し、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する画像処理方法が提供される。
コンピュータを、
入力されたキーワードに基づきクエリ画像を取得する画像取得手段、
前記クエリ画像に含まれる人物の2次元骨格構造を検出する骨格構造検出手段、
前記検出された2次元骨格構造の特徴量を算出する特徴量算出手段、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する検索手段、
として機能させるプログラムが提供される。
近年、ディープラーニング等の機械学習を活用した画像認識技術が様々なシステムに応用されている。例えば、監視カメラの画像により監視を行う監視システムへの適用が進められている。監視システムに機械学習を活用することで、画像から人物の姿勢や行動等の状態をある程度把握することが可能とされつつある。
図1は、実施の形態に係る画像処理装置10の概要を示している。図1に示すように、画像処理装置10は、骨格検出部11、特徴量算出部12、及び認識部13を備えている。骨格検出部11は、カメラ等から取得される2次元画像に基づいて、複数の人物の2次元骨格構造(以下、単に「骨格構造」という場合がある)を検出する。特徴量算出部12は、骨格検出部11により検出された複数の2次元骨格構造の特徴量を算出する。認識部13は、特徴量算出部12により算出された複数の特徴量の類似度に基づいて、複数の人物の状態の認識処理を行う。認識処理は、人物の状態の分類処理や検索処理等である。
以下、図面を参照して実施の形態1について説明する。図2は、本実施の形態に係る画像処理装置100の構成を示している。画像処理装置100は、カメラ200及び記憶手段(データベース(DB)110)、とともに画像処理システム1を構成する。画像処理装置100を含む画像処理システム1は、画像から推定される人物の骨格構造に基づき、人物の姿勢や行動等の状態を分類及び検索するシステムである。
データ蓄積処理は、解析対象の画像(以下、「解析対象画像」)を取得し、複数の解析対象画像各々から人物の2次元の骨格構造を検出し、検出された2次元の骨格構造の特徴量を算出し、算出した特徴量を各解析対象画像に紐付けてデータベース110に格納する処理である。以下、データ蓄積処理に関わる機能部の構成を説明する。
分類処理は、データ蓄積処理でデータベース110に格納されたデータ(解析対象画像と、各解析対象画像から抽出された2次元の骨格構造の特徴量とを紐付けたデータ)に基づき、解析対象画像から抽出された複数の2次元の骨格構造をその特徴量が類似するもの同士でまとめて分類(グループ分け)する処理である。なお、解析対象画像と、各解析対象画像から抽出された2次元の骨格構造とは互いに紐付けられている。このため、分類処理による複数の2次元の骨格構造の分類は、複数の解析対象画像の分類にもなる。分類処理により、複数の解析対象画像は、類似する2次元の骨格構造を含むもの同士でまとめられる。以下、分類処理に関わる機能部の構成を説明する。
検索処理は、データ蓄積処理でデータベース110に格納されたデータ(解析対象画像と、各解析対象画像から抽出された2次元の骨格構造の特徴量とを紐付けたデータ)に基づき、解析対象画像から抽出された複数の2次元の骨格構造の中から所定の骨格構造を検索する処理である。なお、解析対象画像と、各解析対象画像から抽出された2次元の骨格構造とは互いに紐付けられている。このため、上記「解析対象画像から抽出された複数の2次元の骨格構造の中から所定の骨格構造を検索する処理」により、所定の骨格構造を含む解析対象画像を検索することができる。以下、検索処理に関わる機能部の構成を説明する。
例えば、画像取得部101は、図39に示すようにテキストボックス(GUI)を含む入力受付画面を介して、キーワードの入力を受付けてもよい。テキストの入力には、キーボード、マウス、タッチパネル、マイク、物理ボタン等のあらゆる入力装置を採用できる。
その他、例えば、画像取得部101は、図40に示すように複数のキーワードを選択可能に表示する入力受付画面を介して、キーワードの入力を受付けてもよい。なお、図示しないが、ドロップダウン、チェックボックス等の周知のGUIを利用して、複数のキーワードの中からキーワードの選択を受付けてもよい。当該入力には、キーボード、マウス、タッチパネル、マイク、物理ボタン等のあらゆる入力装置を採用できる。
データベース110には、予め、関連ワード辞書が記憶されていてもよい。図41に、関連ワード辞書の一例を示す。図示するように、関連ワード辞書は、人物の状態毎に、各人物の状態を示す1つ又は複数のキーワードを紐付けた情報である。関連ワード辞書は、図示するように、階層構造で複数のキーワードの関連性を示してもよい。例えば、「座る」の下位には、「正座」、「あぐら」等の下位概念のワードが位置する。
画像取得部101は、キーワード受付処理例1乃至3で説明した手法、及び、周知の手法を利用し、複数のキーワードを論理演算子で接続した検索条件の入力を受付けてもよい。
例えば、予め、図42に示すように、クエリとして利用されるために用意された画像(以下、「クエリ用の画像」)と、キーワード(各画像に含まれる人物の状態を示すワード)とを紐付けた情報が、データベース110に登録される。画像取得部101は、入力されたキーワードが紐付けられたクエリ用の画像を当該情報の中から検索する。そして、画像取得部101は、検索結果に含まれるクエリ用の画像の一部又は全部をクエリ画像として取得する。
その他、画像取得部101は、キーワードに関連する画像を検索する検索エンジンに、入力されたキーワードを送信し、当該検索エンジンから検索結果を取得してもよい。そして、画像取得部101は、検索結果に含まれる画像の一部又は全部をクエリ画像として取得する。
画像取得部101は、検索結果に含まれるすべての画像をクエリ画像として取得することができる。
画像取得部101は、例えば図44に示すように、入力されたキーワードに基づく画像検索の結果に含まれる画像(図中、検索結果として表示されている画像)をユーザに向けて出力する。そして、画像取得部101は、検索結果に含まれる画像の中から少なくとも1つを選択するユーザ入力を受付け、選択された画像をクエリ画像として取得することができる。
画像取得部101は、検索結果に含まれる画像の中から、予め定められた任意のルールで、クエリ画像を取得することができる。例えば、画像取得部101は、検索結果に含まれる画像内の人の数及び人の大きさ(画像内で人が占める領域の大きさ)の少なくとも一方を特定し、特定の結果に基づきクエリ画像を取得してもよい。この場合、人の数が少ないほど、また、人の大きさが大きいほど、取得される優先度が高くなる。例えば、画像取得部101は、人の数が基準値以下の画像をクエリ画像として取得してもよい。その他、画像取得部101は、人の大きさが基準値以上の画像をクエリ画像として取得してもよい。その他、画像取得部101は、人の数が基準値以下であり、かつ、人の大きさが基準値以上の画像をクエリ画像として取得してもよい。その他、画像取得部101は、人の数が基準値以下、及び、人の大きさが基準値以上の少なくとも一方を満たす画像をクエリ画像として取得してもよい。
複数の階層による分類全身の骨格構造による分類や、上半身や下半身の骨格構造による分類、腕や脚の骨格構造による分類等を階層的に組み合わせて分類する。すなわち、骨格構造の第1の部分や第2の部分の特徴量に基づいて分類し、さらに、第1の部分や第2の部分の特徴量に重みづけを行って分類してもよい。
時系列に沿った複数枚の画像による分類時系列に連続する複数の画像における骨格構造の特徴量に基づいて分類する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて分類してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて分類してもよい。
骨格構造の左右を無視した分類人物の右側と左側が反対の骨格構造を同じ骨格構造として分類する。
高さ方向の特徴量のみによる検索人物の高さ方向の特徴量のみを用いて検索することで、人物の横方向の変化の影響を抑えることができ、人物の向きや人物の体型の変化に対しロバスト性が向上する。例えば、図13の骨格構造501~503のように、人物の向きや体型が異なる場合でも、高さ方向の特徴量は大きく変化しない。このため、骨格構造501~503では、検索時(分類時)に同じ姿勢であると判断することができる。
部分検索画像において人物の体の一部が隠れている場合、認識可能な部分の情報のみを用いて検索する。例えば、図14の骨格構造511及び512のように、左足が隠れていることにより、左足のキーポイントが検出できない場合でも、検出されている他のキーポイントの特徴量を使用して検索できる。このため、骨格構造511及び512では、検索時(分類時)に同じ姿勢であると判断することができる。つまり、全てのキーポイントではなく、一部のキーポイントの特徴量を用いて、分類や検索を行うことができる。図15の骨格構造521及び522の例では、両足の向きが異なっているものの、上半身のキーポイント(A1、A2、A31、A32、A41、A42、A51、A52)の特徴量を検索クエリとすることで、同じ姿勢であると判断することができる。また、検索したい部分(特徴点)に対して、重みを付けて検索してもよいし、類似度判定の閾値を変化させてもよい。体の一部が隠れている場合、隠れた部分を無視して検索してもよいし、隠れた部分を加味して検索してもよい。隠れた部分も含めて検索することで、同じ部位が隠れているような姿勢を検索することができる。
骨格構造の左右を無視した検索人物の右側と左側が反対の骨格構造を同じ骨格構造として検索する。例えば、図16の骨格構造531及び532のように、右手を挙げている姿勢と、左手を挙げている姿勢を同じ姿勢として検索(分類)できる。図16の例では、骨格構造531と骨格構造532は、右手のキーポイントA51、右肘のキーポイントA41、左手のキーポイントA52、左肘のキーポイントA42の位置が異なるものの、その他のキーポイントの位置は同じである。骨格構造531の右手のキーポイントA51及び右肘のキーポイントA41と骨格構造532の左手のキーポイントA52及び左肘のキーポイントA42のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となり、また、骨格構造531の左手のキーポイントA52及び左肘のキーポイントA42と骨格構造532の右手のキーポイントA51及び右肘のキーポイントA41のうち、一方の骨格構造のキーポイントを左右反転させると、他方の骨格構造のキーポイントと同じ位置となるため、同じ姿勢と判断する。
縦方向と横方向の特徴量による検索人物の縦方向(Y軸方向)の特徴量のみで検索を行った後、得られた結果をさらに人物の横方向(X軸方向)の特徴量を用いて検索する。
時系列に沿った複数枚の画像による検索時系列に連続する複数の画像における骨格構造の特徴量に基づいて検索する。例えば、時系列方向に特徴量を積み重ねて、累積値に基づいて検索してもよい。さらに、連続する複数の画像における骨格構造の特徴量の変化(変化量)に基づいて検索してもよい。
以下、図面を参照して実施の形態2について説明する。本実施の形態では、実施の形態1における特徴量算出の具体例について説明する。本実施の形態では、人物の身長を用いて正規化することで特徴量を求める。その他については、実施の形態1と同様である。
具体例1では、頭部から足部までのボーンの長さを用いて身長画素数を求める。具体例1では、図20に示すように、身長算出部108は、各ボーンの長さを取得し(S211)、取得した各ボーンの長さを合計する(S212)。
具体例2では、2次元骨格構造に含まれる骨の長さと2次元画像空間上の人物の全身の長さとの関係を示す2次元骨格モデルを用いて身長画素数を求める。
具体例3では、2次元骨格構造を3次元人体モデル(3次元骨格モデル)にフィッティングさせて、フィッティングした3次元人体モデルの身長画素数を用いて全身の骨格ベクトルを求める。
図19に示すように、画像処理装置100は、身長画素数算出処理に続いて、正規化処理(S202)を行う。正規化処理では、図23に示すように、特徴量算出部103は、キーポイント高さを算出する(S241)。特徴量算出部103は、検出された骨格構造に含まれる全てのキーポイントのキーポイント高さ(画素数)を算出する。キーポイント高さは、骨格構造の最下端(例えばいずれかの足のキーポイント)からそのキーポイントまでの高さ方向の長さ(画素数)である。ここでは、一例として、キーポイント高さを、画像におけるキーポイントのY座標から求める。なお、上記のように、キーポイント高さは、カメラパラメータに基づいた鉛直投影軸に沿った方向の長さから求めてもよい。例えば、図24の例で、首のキーポイントA2の高さ(yi)は、キーポイントA2のY座標から右足のキーポイントA81または左足のキーポイントA82のY座標を引いた値である。
1. 入力されたキーワードに基づきクエリ画像を取得する画像取得手段と、
前記クエリ画像に含まれる人物の2次元骨格構造を検出する骨格構造検出手段と、
前記検出された2次元骨格構造の特徴量を算出する特徴量算出手段と、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する検索手段と、
を備える画像処理装置。
2. 前記画像取得手段は、前記入力されたキーワードに基づき、キーワードと画像とを紐付けて記憶している記憶手段を検索し、検索結果に含まれる画像の中から前記クエリ画像を抽出する1に記載の画像処理装置。
3. 前記解析対象画像の一部に前記キーワードが紐付けられており、
前記画像取得手段は、前記入力されたキーワードに基づき、前記キーワードが紐付けられた前記解析対象画像を検索し、検索結果に含まれる前記解析対象画像の中から前記クエリ画像を抽出する2に記載の画像処理装置。
4. 前記画像取得手段は、前記入力されたキーワードを検索エンジンに送信し、前記検索エンジンから検索結果を取得し、前記検索結果に含まれる画像の中から前記クエリ画像を抽出する1に記載の画像処理装置。
5. 前記画像取得手段は、
前記検索結果に含まれる画像を出力し、
前記検索結果に含まれる画像の中から少なくとも1つを選択するユーザ入力を受付け、
前記選択された画像を前記クエリ画像として抽出する2から4のいずれかに記載の画像処理装置。
6. 前記画像取得手段は、
前記検索結果に含まれる画像内の人の数及び人の大きさの少なくとも一方を特定し、
前記特定の結果に基づき決定した出力順で、前記検索結果に含まれる複数の画像を出力する5に記載の画像処理装置。
7. 前記画像取得手段は、関連ワード辞書に基づき、前記入力されたキーワードに関連する関連ワードを抽出し、前記関連ワードに基づき前記クエリ画像を取得する1から6のいずれかに記載の画像処理装置。
8. 前記関連ワード辞書は、階層構造で複数のキーワードの関連性を示し、
前記画像取得手段は、前記入力されたキーワードの下位に位置するキーワードを、前記関連ワードとする7に記載の画像処理装置。
9. コンピュータが、
入力されたキーワードに基づきクエリ画像を取得し、
前記クエリ画像に含まれる人物の2次元骨格構造を検出し、
前記検出された2次元骨格構造の特徴量を算出し、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する画像処理方法。
10. コンピュータを、
入力されたキーワードに基づきクエリ画像を取得する画像取得手段、
前記クエリ画像に含まれる人物の2次元骨格構造を検出する骨格構造検出手段、
前記検出された2次元骨格構造の特徴量を算出する特徴量算出手段、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する検索手段、
として機能させるプログラム。
10 画像処理装置
11 骨格検出部
12 特徴量算出部
13 認識部
100 画像処理装置
101 画像取得部
102 骨格構造検出部
103 特徴量算出部
104 分類部
105 検索部
106 入力部
107 表示部
108 身長算出部
110 データベース
200 カメラ
300、301 人体モデル
401 2次元骨格構造
402 3次元人体モデル
Claims (10)
- 入力されたキーワードに基づき画像を取得し、取得した画像の中から画像内の人の数及び人の大きさの少なくとも一方が所定条件を満たす画像を特定し、特定した画像をクエリ画像として取得する画像取得手段と、
前記クエリ画像に含まれる人物の2次元骨格構造を検出する骨格構造検出手段と、
前記検出された2次元骨格構造の特徴量を算出する特徴量算出手段と、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する検索手段と、
を備える画像処理装置。 - 前記画像取得手段は、前記入力されたキーワードに基づき、キーワードと画像とを紐付けて記憶している記憶手段を検索し、検索結果に含まれる画像の中から前記クエリ画像を抽出する請求項1に記載の画像処理装置。
- 前記解析対象画像の一部に前記キーワードが紐付けられており、
前記画像取得手段は、前記入力されたキーワードに基づき、前記キーワードが紐付けられた前記解析対象画像を検索し、検索結果に含まれる前記解析対象画像の中から前記クエリ画像を抽出する請求項2に記載の画像処理装置。 - 前記画像取得手段は、前記入力されたキーワードを検索エンジンに送信し、前記検索エンジンから検索結果を取得し、前記検索結果に含まれる画像の中から前記クエリ画像を抽出する請求項1に記載の画像処理装置。
- 前記画像取得手段は、
前記検索結果に含まれる画像を出力し、
前記検索結果に含まれる画像の中から少なくとも1つを選択するユーザ入力を受付け、
前記選択された画像を前記クエリ画像として抽出する請求項2から4のいずれか1項に記載の画像処理装置。 - 前記画像取得手段は、
前記検索結果に含まれる画像内の人の数及び人の大きさの少なくとも一方を特定し、
前記特定の結果に基づき決定した出力順で、前記検索結果に含まれる複数の画像を出力する請求項5に記載の画像処理装置。 - 前記画像取得手段は、関連ワード辞書に基づき、前記入力されたキーワードに関連する関連ワードを抽出し、前記関連ワードに基づき前記クエリ画像を取得する請求項1から6のいずれか1項に記載の画像処理装置。
- 前記関連ワード辞書は、階層構造で複数のキーワードの関連性を示し、
前記画像取得手段は、前記入力されたキーワードの下位に位置するキーワードを、前記関連ワードとする請求項7に記載の画像処理装置。 - コンピュータが、
入力されたキーワードに基づき画像を取得し、取得した画像の中から画像内の人の数及び人の大きさの少なくとも一方が所定条件を満たす画像を特定し、特定した画像をクエリ画像として取得し、
前記クエリ画像に含まれる人物の2次元骨格構造を検出し、
前記検出された2次元骨格構造の特徴量を算出し、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する画像処理方法。 - コンピュータを、
入力されたキーワードに基づき画像を取得し、取得した画像の中から画像内の人の数及び人の大きさの少なくとも一方が所定条件を満たす画像を特定し、特定した画像をクエリ画像として取得する画像取得手段、
前記クエリ画像に含まれる人物の2次元骨格構造を検出する骨格構造検出手段、
前記検出された2次元骨格構造の特徴量を算出する特徴量算出手段、
前記算出された特徴量の類似度に基づき、解析対象画像の中から、前記クエリ画像に含まれる人物の状態と類似する状態の人物を含む前記解析対象画像を検索する検索手段、
として機能させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/022816 WO2021250809A1 (ja) | 2020-06-10 | 2020-06-10 | 画像処理装置、画像処理方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021250809A1 JPWO2021250809A1 (ja) | 2021-12-16 |
JP7468642B2 true JP7468642B2 (ja) | 2024-04-16 |
Family
ID=78845570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022530423A Active JP7468642B2 (ja) | 2020-06-10 | 2020-06-10 | 画像処理装置、画像処理方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230215135A1 (ja) |
JP (1) | JP7468642B2 (ja) |
WO (1) | WO2021250809A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010106632A1 (ja) | 2009-03-17 | 2010-09-23 | キーパー=スミス エル・エル・ピー | 画像表示システム、画像表示装置、画像提供装置およびその方法 |
JP2011070412A (ja) | 2009-09-25 | 2011-04-07 | Seiko Epson Corp | 画像検索装置および画像検索方法 |
JP2011237909A (ja) | 2010-05-07 | 2011-11-24 | Seiko Epson Corp | 検索画面表示装置、検索画面表示方法、検索画面表示プログラム |
JP2019091138A (ja) | 2017-11-13 | 2019-06-13 | 株式会社日立製作所 | 画像検索装置、画像検索方法、及び、それに用いる設定画面 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011106632A1 (en) * | 2010-02-26 | 2011-09-01 | Millennium Pharmaceuticals, Inc. | Substituted hydroxamic acids and uses thereof |
-
2020
- 2020-06-10 WO PCT/JP2020/022816 patent/WO2021250809A1/ja active Application Filing
- 2020-06-10 JP JP2022530423A patent/JP7468642B2/ja active Active
- 2020-06-10 US US18/009,160 patent/US20230215135A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010106632A1 (ja) | 2009-03-17 | 2010-09-23 | キーパー=スミス エル・エル・ピー | 画像表示システム、画像表示装置、画像提供装置およびその方法 |
JP2011070412A (ja) | 2009-09-25 | 2011-04-07 | Seiko Epson Corp | 画像検索装置および画像検索方法 |
JP2011237909A (ja) | 2010-05-07 | 2011-11-24 | Seiko Epson Corp | 検索画面表示装置、検索画面表示方法、検索画面表示プログラム |
JP2019091138A (ja) | 2017-11-13 | 2019-06-13 | 株式会社日立製作所 | 画像検索装置、画像検索方法、及び、それに用いる設定画面 |
Non-Patent Citations (1)
Title |
---|
大崎 慎一郎,Web画像検索のためのキーワード特徴の抽出と合成によるクエリ画像生成,映像情報メディア学会誌,日本,(社)映像情報メディア学会,2010年11月01日 |
Also Published As
Publication number | Publication date |
---|---|
WO2021250809A1 (ja) | 2021-12-16 |
US20230215135A1 (en) | 2023-07-06 |
JPWO2021250809A1 (ja) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7556556B2 (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP7409499B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP7416252B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2024103572A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7364077B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP7491380B2 (ja) | 画像選択装置、画像選択方法、及びプログラム | |
JP7435781B2 (ja) | 画像選択装置、画像選択方法、及びプログラム | |
WO2022079794A1 (ja) | 画像選択装置、画像選択方法、及びプログラム | |
JP7468642B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP7485040B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP7302741B2 (ja) | 画像選択装置、画像選択方法、およびプログラム | |
JP7501621B2 (ja) | 画像選択装置、画像選択方法、およびプログラム | |
WO2022249278A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2023152977A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2022249331A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP7375921B2 (ja) | 画像分類装置、画像分類方法、およびプログラム | |
WO2023152974A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP7435754B2 (ja) | 画像選択装置、画像選択方法、及びプログラム | |
CN114641794A (zh) | 图像处理装置、图像处理方法以及存储图像处理程序的非暂时性计算机可读介质 | |
WO2023152971A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2022079795A1 (ja) | 画像選択装置、画像選択方法、及びプログラム | |
WO2023084778A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2023084780A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2023152973A1 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2023112321A1 (ja) | 画像処理システム、画像処理方法及び非一時的なコンピュータ可読媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7468642 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |