JP5768265B2 - 類似画像検索システム - Google Patents
類似画像検索システム Download PDFInfo
- Publication number
- JP5768265B2 JP5768265B2 JP2014516868A JP2014516868A JP5768265B2 JP 5768265 B2 JP5768265 B2 JP 5768265B2 JP 2014516868 A JP2014516868 A JP 2014516868A JP 2014516868 A JP2014516868 A JP 2014516868A JP 5768265 B2 JP5768265 B2 JP 5768265B2
- Authority
- JP
- Japan
- Prior art keywords
- face
- search
- image
- unit
- angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 claims description 145
- 238000001514 detection method Methods 0.000 claims description 92
- 239000002131 composite material Substances 0.000 claims description 87
- 230000001815 facial effect Effects 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 24
- 230000010354 integration Effects 0.000 claims description 12
- 238000000034 method Methods 0.000 description 51
- 238000004891 communication Methods 0.000 description 48
- 238000003384 imaging method Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 11
- 238000012544 monitoring process Methods 0.000 description 9
- 210000000887 face Anatomy 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000004044 response Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 3
- 238000001454 recorded image Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
類似顔画像検索機能とは、監視映像中への人物の出現をイベントとして検索可能とし、さらには、該イベントの内、ユーザが指定した特定個人の登場を、顔の画像特徴量を用いて検索する機能である。
ネットワーク150は、各装置を相互に接続し、データ通信を行う専用線やイントラネット、インターネット、無線LAN(Local Area Network)等の通信線である。
撮像装置101は、CCD(Charge Coupled Device)やCMOS(Complementary Met al Oxide Semiconductor)素子等で撮像した画像にホワイトバランス等の映像処理を施した画像データを、ネットワーク150へ出力するネットワークカメラや監視カメラ等の装置である。
録画装置102は、ネットワーク150を介して入力された画像データをHDD等の記録媒体に記録し、また、外部装置からの要求に応じて、記録媒体に記録された画像データをネットワーク150へ出力するネットワークデジタルレコーダ等の装置である。
検索装置103は、ネットワーク150を介して入力された画像データ中の顔を検出し、その顔に関わる情報をHDD等の記録媒体に記録し、また、外部装置からの要求に応じて、記録媒体に記録された顔に関わる情報を検索し、検索結果をネットワーク150へ出力するサーバやPC(Personal Computer)等の装置である。
端末装置104は、ネットワーク150を介して入力された画像データや検索結果を、液晶ディスプレイやCRT(Cathode Ray Tube)等のモニタに画面表示し、キーボードやマウス等を備え、録画画像の再生操作や人物検索の実行操作を行う操作インタフェースを提供するデスクトップPC等の装置である。
顔登録処理グループ221は、画像入力部201、顔検出部202、顔特徴量算出部203、及び顔特徴量記録部204によって構成される。また、顔検索処理グループ222は、画像入力部211、顔検出部212、顔特徴量算出部213、顔特徴量検索部214、及び検索結果出力部215によって構成される。
顔特徴量算出処理には、例えば、特許文献3や非特許文献1に開示された方法等を用いる。顔特徴量算出部203は、入力された顔検出結果の検出数に応じて処理を繰返す。顔特徴量算出部203は、算出した顔特徴量を、顔検出結果と共に、顔特徴量記録部204に出力する。
本処理部は、入力された顔検出結果の検出数に応じて処理を繰返す。
顔検出部212は、算出した顔検出結果を、画像データと共に、顔特徴量算出部213に出力する。
即ち、正面に映った顔画像を検索キー画像にした場合、検索結果として見付かる録画画像も正面顔画像が多く、同様に斜めに映った顔画像を検索キー画像にした場合、検索結果として見付かる録画画像も近傍角度の斜め顔画像が多い。言い換えると、正面顔画像を検索キー画像にすると、同一人物であっても斜め顔画像を探し損ねる可能性が高く、逆も同様であるということである。また、逆に、本当は他人である人物を誤ってキー画像の人物本人であると判定してしまうこともあり、検索精度、即ち、検索結果に含まれる本人の割合も低いものとなってしまう。
類似顔画像検索システムにおける人物と撮像装置の関係は、ドアの開閉等に使われる一般的な顔認証システムにおけるそれと異なり、人物に撮像装置を意識させない関係である。従って、撮像される顔は、より多様な角度である場合が多く、前記課題の解消は欠かせない。
本発明は、このような状況に鑑みてなされたものであり、上述の課題を解決し、より高精度な類似画像検索システムを提供することを目的とする。
図3に、本発明の第1の実施形態における類似顔画像検索システムの装置構成の一例が示される。図3のシステムは、ネットワーク150に、撮像装置101、録画装置102、検索装置303、及び端末装置104が接続され、互いに通信可能な状態で構成される。図3の装置構成において、図1の装置構成と異なる点は、検索装置103の替りに、検索装置303を設けたことである。
検索装置303は、顔登録処理グループ221、顔検索処理グループ422、及び、顔特徴量データベース205によって構成される。また、顔検索処理グループ422は、画像入力部211、顔検出部212、顔角度算出部411、合成パターン決定部412、合成顔生成部413、顔特徴量算出部213、顔特徴量記録部214、及び検索結果統合出力部415によって構成される。
また、顔検索処理グループ422の処理は、顔角度算出部411、合成パターン決定部412及び合成顔生成部413が追加されたことを除けば、図2の顔検索処理グループ222の処理と同じである。
本例の顔角度算出部411の内部は、顔角度特徴量算出部416と顔角度特徴量データベース417、顔角度特徴量検索部418によって構成される。顔角度特徴量データベース417には、多様な顔の多様な角度に対して予め求めておいた、顔角度特徴量の顔角度が、予め格納されている。
次に、顔角度特徴量検索部418は、顔角度特徴量算出部416が算出した顔角度特徴量を、顔角度特徴量データベース417と照合して、近傍の特徴量を持つ顔角度を数個探し出し、その特徴量と入力画像の特徴量との距離即ち類似度を、その顔角度の確からしさ度とする。そして、顔角度特徴量検索部418は、顔角度と、確からしさ度を、入力された顔画像データ等と共に、顔角度算出結果として、合成パターン決定部412に出力する。なお、出力が含む顔角度の個数は、予め決めた数でも良いが、入力画像の特徴量との最短距離を所定数倍した距離の内にある複数の特徴量の顔角度に絞ると良い。
なお、顔角度算出部411は、顔角度特徴量データベース417に拠らずに、Joint Haar-like特徴量等を用いて、顔角度を直接表す数値を得ても良い。また、顔検出部212が対応するHaar-like識別器を有していれば、その値を流用してよく、顔角度算出部411自体を顔検出部212に内蔵しても良い。
顔特徴量検索部214は、算出した1つ以上の検索結果を、検索結果統合出力部415に出力する。
検索装置303における処理は、主として「顔登録処理」と「顔検索処理」の2つの処理シーケンスにて構成される。顔登録処理は、図4の処理部グループ221にて実施される処理シーケンスであり、顔検索処理は、図4の処理グループ422にて実施される処理シーケンスである。顔登録処理と顔検索処理は、顔特徴量データベース205を共有しつつ、非同期に動作する。
ステップ600では、画像入力部201が、監視画像の着信を待機する(画像受信待機)。例えば、画像入力部201は、定期的にストリーム入力バッファ等にアクセスし、監視画像が入力されたか否かを検査する。そして、画像入力部201は、監視画像の入力を検出した場合には、ステップ601の処理に進む。
次に、ステップ602では、顔検出部202が、受信された画像データに対して公知の方法で顔検出を行う。顔が少なくとも1つ以上検出された場合には、ステップ603の処理を実行し、検出されなかった場合には、ステップ600の処理に戻る。
ステップ603では、顔特徴量算出部203が、ステップ602の顔検出結果に含まれる顔画像夫々に対して、顔特徴量を算出する。
ステップ604では、顔特徴量記録部204が、顔特徴量を、画像データや顔検出結果と共に特徴量データベース205に記録する。この際、ステップ601にて受信した属性情報データも併せて記録するようにしても良い。記録の完了後、ステップ600の処理に戻る。
ステップ700では、画像入力部211が、端末装置104からキー画像を受信するまで待機している(キー画像受信待機)。即ち、画像入力部211は、端末装置104からキー画像が入力されたか否かを検出する。そして、画像入力部211は、キー画像の入力を検出した場合には、ステップ701の処理に進む。また、キー画像の入力を検出しなかった場合には、再度ステップ700の処理を所定時間経過後に実行する。
次に、ステップ702では、顔検出部212が、受信された画像データに対して顔検出を行う。顔が少なくとも1つ以上検出された場合には、ステップ703の処理を実行し、検出されなかった場合には、顔が検出されなかった旨を端末装置104に送信し、ステップ700の処理に戻る。
ステップ703では、顔角度算出部411が、ステップ702の顔検出結果に含まれる顔画像に対して、顔角度算出を行う。
ステップ704では、合成パターン決定部412が、ステップ703の顔角度算出結果を用いて、合成パターンを決定する。
ステップ706では、顔特徴量算出部213が、ステップ705で合成された合成顔画像に対する顔特徴量を算出する。
ステップ707では、顔特徴量検索部214が、ステップ706で算出された顔特徴量を用いて、顔特徴量データベース205に対して、類似検索を行う。
ステップ709では、検索結果統合出力部415が、統合した検索結果を、端末装置104に出力する。送信の完了後、ステップ700の処理に戻る。
次に、画像群402aに領域分割を適用し、画像群402bを得る。ここで分割された領域は、異なる解像度の画像間で共通である。
以下に説明する第2の実施形態は、顔角度に応じて顔特徴量を振り分けてデータベースに登録することで、検索回数の問題を改善したものである。本発明を含む第2の実施形態における類似顔画像検索システムの構成は、検索装置303に代えて検索装置803を備えた点を除き、第1の実施形態と同じである。
検索装置803は、顔登録処理グループ921、顔検索処理グループ922、及び、顔角度別顔特徴量データベース群905によって構成される。顔登録処理グループ921は、画像入力部201、顔検出部202、顔角度算出部911、顔特徴量算出部203、顔特徴量記録先決定部901、及び顔角度別顔特徴量記録部902によって構成される。また、顔検索処理グループ922は、画像入力部211、顔検出部212、顔角度算出部912、合成パターン決定部913、合成顔生成部914、顔特徴量算出部213、顔特徴量検索先決定部915、顔角度別顔特徴量検索部916、検索結果統合出力部917によって構成される。
ただし、本実施例では、顔検出部212は、算出した顔検出結果を、画像データと共に、顔角度算出部912に出力する。
合成顔生成部914は、生成した1つ以上の合成顔画像を、画像データ、顔検出結果、及び顔角度算出結果と共に顔特徴量算出部213に出力する。
顔特徴量検索先決定部915は、顔特徴量算出部213から顔特徴量と共に入力された顔角度算出結果を用いて、顔角度別顔特徴量データベース群905内における検索先を決定する。本処理部では、に応じて(例えば、入力された顔特徴量の数と同数回)、処理を繰返す。顔特徴量検索先決定部915は、ここで決定した検索先情報を、画像データ、顔検出結果、顔角度算出結果、及び顔特徴量と共に、顔角度別顔特徴量検索部916に出力する。
検索結果統合出力部917は、検索結果の統合を、個々の検索結果に含まれる顔画像の類似度を用い、類似度の高い順にマージすることで実施する。
顔登録処理グループ921と顔検索処理グループ922は、それぞれ、図4と同様に、顔登録処理と顔検索処理の処理シーケンスを表す。顔登録処理と顔検索処理については後述する。
検索装置803における処理は、主として「顔登録処理」と「顔検索処理」の2つの処理シーケンスにて構成される。顔登録処理は、図9の処理部グループ921にて実施される処理シーケンスであり、顔検索処理は、図9の処理グループ922にて実施される処理シーケンスである。顔登録処理と顔検索処理は、顔角度別顔特徴量データベース群905を挟んで独立に構成され、非同期に実施可能である。
次のステップ603では、検索装置803の顔特徴量算出部203が、ステップ602の顔検出結果に含まれる顔画像に対して、顔特徴量を算出する。
次のステップ1002では、検索装置803の顔特徴量記録先決定部901が、ステップ1001にて求めた顔角度に従い、顔角度別顔特徴量データベース群905内の記録先データベースを決定する。
そしてステップ1003では、検索装置803の顔角度別顔特徴量記録部902が、算出した顔特徴量を、画像データ及び顔検出結果と共に、顔角度別顔特徴量データベース群905内の記録先データベースに記録する。その際、ステップ601において入力された属性情報データも併せて記録するようにしても良い。記録の完了後、ステップ600の処理に戻る。
ただし、ステップ706の処理後は、ステップ1101の処理を実施する。また、ステップ1102の処理後に、ステップ708の処理を実施する。さらに、顔角度算出部411の替りに顔角度算出部912が動作し、合成パターン部412の替りに合成パターン部913が動作し、合成顔生成部413の替りに合成顔生成部013が動作する。
次に、ステップ1002では、検索装置803の顔角度別顔特徴量検索部916は、算出した顔特徴量を用いて、ステップ1001にて求めた検索先データベースに対して、類似検索を行う。なお、説明を簡単にするため、繰り返しの図示はしないが、本ステップ705、ステップ706、及びステップ707は、ステップ704において決定された合成パターン数回、繰返し実行する。
ステップ709では、検索装置803の検索結果統合出力部415が、統合した検索結果を、端末装置104に出力する。
送信の完了後、ステップ700の処理に戻る。
図12は、本発明を含む第3の実施形態における類似顔画像検索システムの構成の一例を示す図である。第3の実施形態は、検索装置303の替りに検索装置1203を設け、及び端末装置104の替りに端末装置1204を設けた点で、第1の実施形態と異なる。
合成顔生成部914、顔特徴量算出部213、顔特徴量検索先決定部915、顔角度別顔特徴量検索部916、及び検索結果統合出力部917の動作は、図9で説明したとおりである。なお、検索結果統合出力部917は、検索結果の統合を、個々の検索結果に含まれる顔画像の類似度を用い、類似度の高い順にマージすることで実施する。
正面合成顔出力部1312は、正面合成顔生成部1311から入力された1つ以上の正面合成顔、顔検出結果、及び顔角度算出結果を、端末装置1204に出力する。
図14において、端末装置1204に表示される画面は、再生画像表示領域1400、画像再生操作領域1410、検索キー画像指定領域1420、検索絞込パラメータ指定領域1430、検索実行領域1440、及び検索結果表示領域1450によって構成される。
画像再生操作領域1410は、映像の入力元である撮像装置101と録画装置102の切り替えや、録画装置102に記録された画像を再生操作するボタン図形を配置した領域である。本領域に配置した各ボタン(ボタン図形)には、それぞれ固有の再生の操作種類が割当てられている。例えば、左のボタンから、「巻戻し」、「逆再生」、「再生停止」、「順再生」、「早送り」の操作種類が割当てられている。ユーザがGUI操作を行って各ボタンを適宜押下することにより、動画1401がボタン図形に割当てられた機能が動作する。
検索キー画像1421は、検索キー画像を表示する場所である。初期状態においては、検索キー画像は未指定であるので、画像表示はされていない状態となる。若しくは、初期状態において、別途用意した未指定状態を示す画像を表示するようにするか、または、未指定である旨の表記をするようにしても良い。
合成ボタン1423は、押下時に検索キー画像に対して顔画像合成を指示するボタンである。
選択候補画像ボタン1424〜1427は、合成顔画像を表示する場所である。ユーザは、この中から最も真正面に合成されたと思われる合成顔画像を選んで、GUI操作を行って押下する。
検索ボタン1441は、検索キー画像1421による類似人物検索実行を指示するボタンである。検索絞込パラメータ指定領域1430にてパラメータが指定されている場合には、その内容も含めて実行を指示する。
図14における検索結果表示領域1450には、「カメラ1、カメラ2、カメラ4の2009年6月26日15時30分20秒から2009年7月13日12時30分20秒までの画像を検索対象に、類似画像検索」を実施した例を示している。検索結果画像1451〜1457は、例えば、最上段左から右へ、次に下側の2段目左から右へと検索キー画像に対する類似度順に表示する。本例においては、一番上段で、一番左側の位置にある検索結果画像1451が検索キー画像1421に対し最も類似度が高く、検索結果画像1457が最も類似度が低いということを示している。
頭出し再生ボタンは、検索結果画像を先頭とした連続動画再生開始を指示するボタンである。例えば、頭出し再生ボタン1458を押下すると動画1401が検索結果画像1456に切り替わる。検索キー画像指定ボタンは、検索結果画像を検索キー画像に指定するボタンである。例えば、検索キー画像指定ボタン1459を押下すると、検索結果画像1456が、検索キー画像として1421に表示される。これにより、検索結果画像を使っての再検索が実施できる。
図15A、図15B、及び図15Cは、検索キー画像指定領域1420を拡大表示したものである。図16は、本発明に関わる検索キー画像指定操作における通信シーケンスの一例を示す図である。
図16では、紙面上から下に時刻が経過する(ただし、時間は上下の長さとは一致していない)時系列の順番を示している。録画装置102(または、撮像装置101)の通信動作をシーケンス1600上に表示し、端末装置1204の通信動作をシーケンス1602上に表示し、検索装置1203の通信動作をシーケンス1601上に表示する。また、タイミング1620〜1626は、それぞれ時系列上での動作タイミングを表している。さらに、通信1610〜1615は、各装置間の主な通信を示す。通信1610と1611はリクエストとレスポンスの関係にある。通信1612と1613、通信1614と1615も同様である。なお、通信1610〜1615で示した通信は概念的な一例を示し、通信の細かい態様を示したものではない。
即ち、端末装置1204は、ユーザの操作により指定ボタン1422が押下されると、画像要求のための通信1610を録画装置102に出力(送信)する。通信1610は、検索キー画像要求の通信である。録画装置102は、通信1610を受信すると、通信1611を端末装置1204に出力(配信)する。この通信1611は、要求に応じて配信された検索キー画像を含む通信である。端末装置1204は、通信1610を受信すると、タイミング1622の時刻に画面に、通信1611に含まれた検索キー画像を表示する。
端末装置1204は、通信1613を受信すると、タイミング1624の時刻に画面に、通信1613に含まれた検索キー画像を表示する。
以上で、本領域に関連する一連の操作が終了する。
また、上述の第1〜第3の実施例においては、説明を容易にするため、録画装置と検索装置を別個の装置として示したが、同一の装置上に実装される構成であっても良い。また、同様に、検索装置と端末装置も、単一の装置上に実装される構成であっても良い。
また、第3の実施例においては、説明の簡略化のため、正面顔を選ぶ操作を提示・選択を各1回で完了する例を示したが、提示・選択を数回繰り返すようにしても良い。
また、上述の第1〜第3の実施例においては、顔を対象とする類似画像検索を示したが、顔だけでなく、車両等の他のオブジェクトを対象とした類似画像検索にも適用できる。
803:検索装置、901:顔特徴量記録先決定部、 902:顔角度別顔特徴量記録部、 905:顔角度別顔特徴量データベース群、 911,912:顔角度算出部、 913:合成パターン決定部、 914:合成顔生成部、 915:顔特徴量検索先決定部、 916:顔角度別顔特徴量検索部、917:検索結果統合出力部、
1203:検索装置、 1204:端末装置、 1400:再生画像表示領域、 1401:動画、 1410:画像再生操作領域、 1420:検索キー画像指定領域、 1421:検索キー画像、 1422:指定ボタン、 1423:合成ボタン、 1424〜1427:選択候補画像ボタン、 1430:検索絞込パラメータ指定領域、 1431、1432、1433、1434:撮像装置指定チェックボックス、 1435、1436:時刻指定チェックボックス、 1437、1438:時刻指定欄、 1440:検索実行領域、 1450:検索結果表示領域。
Claims (4)
- 検索対象画像を入力する第1の画像入力手段と、入力された検索対象画像から第1の顔を検出する第1の顔検出手段と、検出された第1の顔の特徴量を算出する顔特徴量算出手段と、算出された顔特徴量を記録するデータベース記録手段と、
検索のためのキー画像を入力する第2の画像入力手段と、入力されたキー画像から第2の顔を検出する第2の顔検出手段と、検出された第2の顔の顔角度を算出する顔角度算出手段と、算出された顔角度によって合成パターンを決定する合成パターン決定手段と、決定された合成パターンに応じて合成顔画像を生成する合成顔生成手段と、生成された合成顔画像を用いて第2の顔の特徴量を算出する第2の顔特徴量算出手段と、
前記決定された前記合成パターンの数に応じて、前記合成顔生成手段と前記顔特徴量算出手段を繰り返し、算出された複数個の顔特徴量をクエリとして、データベースから検索を行う顔特徴量検索手段と、検索された複数個の検索結果を統合する検索結果統合手段と、を設けたことを特徴とする類似画像検索システム。 - 検索対象画像を入力する第1の画像入力手段と、入力された検索対象画像から第1の顔を検出する第1の顔検出手段と、検出された第1の顔の顔角度を算出する第1の顔角度算出手段と、前記検出された第1の顔の特徴量を算出する第1の顔特徴量算出手段と、算出された顔角度によって記録先データベースを決定する記録先データベース決定手段と、算出された第1の顔特徴量を決定された記録先データベースに記録するデータベース記録手段と、
検索のためのキー画像を入力する第2の画像入力手段と、入力されたキー画像から第2の顔を検出する第2の顔検出手段と、検出された第2の顔の顔角度を算出する顔角度算出手段と、算出された顔角度によって合成パターンを決定する合成パターン決定手段と、決定された合成パターンに応じて合成顔画像を生成する合成顔生成手段と、生成された合成顔画像を用いて第2の顔の特徴量を算出する第2の顔特徴量算出手段と、
前記算出された前記顔角度によって検索先データベースを決定する検索先データベース決定手段と、前記決定された前記合成パターンの数に応じて、前記合成顔生成手段と前記第2の顔特徴量算出手段と前記検索先データベース決定手段を複数回実施し、算出された複数個の顔特徴量をクエリとして、前記データベースから検索を行う顔特徴量検索手段と、検索された複数個の検索結果を統合する検索結果統合手段と、を設けたことを特徴とする類似画像検索システム。 - 前記顔角度算出手段は、入力顔に対する顔角度特徴量算出手段と、既知角度の顔に対する顔角度特徴量が顔角度情報とともに予め格納されているデータベースと、前記顔角度特徴量算出手段で求めた顔角度特徴量をクエリとして、前記データベースから検索を行う顔角度検索手段と、を設けたことを特徴とする請求項2記載の類似画像検索システム。
- 前記合成パターン決定手段は、前記顔角度算出手段の算出結果の確からしさを使い、その第2候補以降の確からしさを有する顔角度も用いることを特徴とする請求項2記載の類似画像検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014516868A JP5768265B2 (ja) | 2012-05-24 | 2013-05-24 | 類似画像検索システム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012118152 | 2012-05-24 | ||
JP2012118152 | 2012-05-24 | ||
PCT/JP2013/064508 WO2013176263A1 (ja) | 2012-05-24 | 2013-05-24 | 類似画像検索システム |
JP2014516868A JP5768265B2 (ja) | 2012-05-24 | 2013-05-24 | 類似画像検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5768265B2 true JP5768265B2 (ja) | 2015-08-26 |
JPWO2013176263A1 JPWO2013176263A1 (ja) | 2016-01-14 |
Family
ID=49623943
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014516868A Active JP5768265B2 (ja) | 2012-05-24 | 2013-05-24 | 類似画像検索システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9135273B2 (ja) |
JP (1) | JP5768265B2 (ja) |
WO (1) | WO2013176263A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105612513A (zh) * | 2013-10-02 | 2016-05-25 | 株式会社日立制作所 | 图像检索方法、图像检索系统以及信息记录介质 |
JP6410450B2 (ja) * | 2014-03-31 | 2018-10-24 | キヤノン株式会社 | オブジェクト識別装置、オブジェクト識別方法及びプログラム |
JP6362085B2 (ja) * | 2014-05-21 | 2018-07-25 | キヤノン株式会社 | 画像認識システム、画像認識方法およびプログラム |
JP6516832B2 (ja) * | 2015-04-08 | 2019-05-22 | 株式会社日立製作所 | 画像検索装置、システム及び方法 |
EP3355269B1 (en) * | 2015-09-14 | 2023-08-02 | Hitachi Kokusai Electric Inc. | Specific person detection system and specific person detection method |
US11200445B2 (en) | 2020-01-22 | 2021-12-14 | Home Depot Product Authority, Llc | Determining visually similar products |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4238542B2 (ja) | 2002-08-30 | 2009-03-18 | 日本電気株式会社 | 顔向き推定装置および顔向き推定方法ならびに顔向き推定プログラム |
JP4465719B2 (ja) * | 2003-02-13 | 2010-05-19 | 日本電気株式会社 | 成り済まし検出装置、および成り済まし検出方法 |
JP4653606B2 (ja) | 2005-05-23 | 2011-03-16 | 株式会社東芝 | 画像認識装置、方法およびプログラム |
JP4947769B2 (ja) | 2006-05-24 | 2012-06-06 | 富士フイルム株式会社 | 顔照合装置および方法並びにプログラム |
JP4874836B2 (ja) | 2007-03-01 | 2012-02-15 | 株式会社日立製作所 | 画像検索方法及び画像検索システム |
JP5244345B2 (ja) | 2007-08-09 | 2013-07-24 | パナソニック株式会社 | 顔認証装置 |
JP5176572B2 (ja) * | 2008-02-05 | 2013-04-03 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
JP5730518B2 (ja) * | 2010-08-27 | 2015-06-10 | 株式会社日立国際電気 | 特定人物検知システムおよび特定人物検知方法 |
JP5665125B2 (ja) | 2011-04-07 | 2015-02-04 | 株式会社日立製作所 | 画像処理方法、及び、画像処理システム |
-
2013
- 2013-05-24 JP JP2014516868A patent/JP5768265B2/ja active Active
- 2013-05-24 US US14/402,721 patent/US9135273B2/en not_active Expired - Fee Related
- 2013-05-24 WO PCT/JP2013/064508 patent/WO2013176263A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US9135273B2 (en) | 2015-09-15 |
US20150112970A1 (en) | 2015-04-23 |
JPWO2013176263A1 (ja) | 2016-01-14 |
WO2013176263A1 (ja) | 2013-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4541316B2 (ja) | 映像監視検索システム | |
JP5768265B2 (ja) | 類似画像検索システム | |
JP5227911B2 (ja) | 監視映像検索装置及び監視システム | |
JP5863400B2 (ja) | 類似画像検索システム | |
US11670147B2 (en) | Method and apparatus for conducting surveillance | |
JP5707562B1 (ja) | モニタリング装置、モニタリングシステムおよびモニタリング方法 | |
US7203693B2 (en) | Instantly indexed databases for multimedia content analysis and retrieval | |
JP6172551B1 (ja) | 画像検索装置、画像検索システム及び画像検索方法 | |
US20220301317A1 (en) | Method and device for constructing object motion trajectory, and computer storage medium | |
US20020175997A1 (en) | Surveillance recording device and method | |
WO2004006572A1 (ja) | 映像生成処理装置、映像生成処理方法および映像記憶装置 | |
US20040249848A1 (en) | Method and apparatus for intelligent and automatic alert management using multimedia database system | |
JP6203188B2 (ja) | 類似画像検索装置 | |
US10783365B2 (en) | Image processing device and image processing system | |
JP5329130B2 (ja) | 検索結果表示方法 | |
US20190005133A1 (en) | Method, apparatus and arrangement for summarizing and browsing video content | |
JP5826513B2 (ja) | 類似画像検索システム | |
JP3473864B2 (ja) | ビデオ情報検索方法 | |
KR20120050660A (ko) | 얼굴 인식 기반의 얼굴 검색 시스템 및 그 방법 | |
JP5351445B2 (ja) | 画像検索システム | |
JP2006301995A (ja) | 人物検索装置及び人物検索方法 | |
Bamond et al. | Application of an event-sensor to situational awareness | |
CN118590625B (zh) | 监控处理方法、装置、计算机设备、存储介质和程序产品 | |
Chandrasekaran et al. | FAQIVS: Face Query-based Interactive Video Synopsis | |
JP2021103810A (ja) | 映像要約装置、映像要約システム、映像要約方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150526 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5768265 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |