JP6564275B2 - 画像処理装置、及び画像処理方法 - Google Patents

画像処理装置、及び画像処理方法 Download PDF

Info

Publication number
JP6564275B2
JP6564275B2 JP2015163090A JP2015163090A JP6564275B2 JP 6564275 B2 JP6564275 B2 JP 6564275B2 JP 2015163090 A JP2015163090 A JP 2015163090A JP 2015163090 A JP2015163090 A JP 2015163090A JP 6564275 B2 JP6564275 B2 JP 6564275B2
Authority
JP
Japan
Prior art keywords
subject
search
image processing
image
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015163090A
Other languages
English (en)
Other versions
JP2017041795A (ja
Inventor
健一 松橋
健一 松橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015163090A priority Critical patent/JP6564275B2/ja
Priority to US15/233,459 priority patent/US9864899B2/en
Publication of JP2017041795A publication Critical patent/JP2017041795A/ja
Application granted granted Critical
Publication of JP6564275B2 publication Critical patent/JP6564275B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/12Acquisition of 3D measurements of objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Description

本発明は、画像処理装置、及び画像処理方法に関する。
現在、入力された画像データの中から所望の画像データを検索(抽出)する技術が知られている(特許文献1)。特許文献1の画像検索装置は、入力された画像データの所定範囲毎にパターンマッチング処理を行い、その処理結果に基づいて、画像データにおける顔画像に係る特定画像データを抽出する。
特開2005−196542号公報
画像データに含まれる被写体(人物等)の認識処理(個々の被写体が誰又は何であるかを特定する処理)は、計算負荷が比較的高い。そのため、例えばユーザが多数の画像データの中から所望の被写体を含んだ画像データを検索する場合、検索結果が得られるまでに長い時間を要する可能性がある。
ところで、ユーザにとって、画像データに含まれる被写体の重要度は、必ずしも一定ではない。例えば、複数の画像データが存在する場合に、ある画像データに含まれる被写体の重要度が別の画像データに含まれる被写体の重要度よりも高い可能性がある。また、画像データが1つだけの場合でも、この画像データに含まれる複数の被写体間の重要度が異なる可能性がある。しかしながら、従来の技術では、被写体の重要度を考慮せずに被写体の認識処理が行われていた。
本発明はこのような状況に鑑みてなされたものであり、被写体の認識処理を行う際に、ユーザにとって重要度が高いと考えられる被写体の認識処理を優先的に行うための技術を提供することを目的とする。
上記課題を解決するために、本発明は、各々が1以上の被写体を含む複数の画像データを取得する画像データ取得手段と、前記複数の画像データに含まれる複数の被写体それぞれの奥行き方向の位置を取得する位置取得手段と、前記複数の被写体それぞれについて、複数の被写体候補の中から対応する被写体候補を検出する被写体認識処理を行う被写体認識手段と、前記複数の被写体候補のうちの1つに対応する被写体を検索対象とする検索指示を受け付ける受付手段と、前記複数の被写体それぞれについての前記被写体認識処理の結果に基づき、前記複数の画像データから前記検索対象の被写体を含んだ画像データを検索する検索手段と、を備え、前記被写体認識手段は、前記複数の被写体それぞれの前記奥行き方向の位置に基づき、手前の被写体ほど先に前記被写体認識処理を行い、前記検索手段は、前記複数の被写体の全てに対して前記被写体認識処理が完了しているか否かに関わらず、前記検索指示に応じて前記検索を開始し、前記被写体認識処理が完了していない被写体が存在する場合、前記被写体認識処理と並行して前記検索を行うことを特徴とする画像処理装置を提供する。
なお、その他の本発明の特徴は、添付図面及び以下の発明を実施するための形態における記載によって更に明らかになるものである。
本発明によれば、被写体の認識処理を行う際に、ユーザにとって重要度が高いと考えられる被写体の認識処理を優先的に行うことが可能となる。
画像処理システム100の構成を示す図。 画像処理装置101の構成を示すブロック図。 撮像装置102の構成を示すブロック図。 撮像装置102により生成される画像データ401の構成を示す図。 被写体固有情報501の構成を示す図。 図4の本画像情報403が示す二次元画像の一例を示す図。 図4の画像空間情報406の一例である距離マップ画像を示す図。 被写体管理情報802の構成を示す図。 列位置806を記録する処理の概念図。 被写体認識処理の概念図。 検索画面の例を示す図。 画像処理装置101が実行するインデックス化処理のフローチャート。 第1の実施形態に係る画像処理装置101が実行する画像検索処理のフローチャート。 第2の実施形態に係る画像処理装置101が実行する画像検索処理のフローチャート。 第3の実施形態に係る画像処理装置101が実行する画像検索処理のフローチャート。
以下、添付図面を参照して、本発明の実施形態を説明する。なお、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。また、実施形態の中で説明されている特徴の組み合わせすべてが、本発明に必須とは限らない。
[第1の実施形態]
図1は、第1の実施形態に係る画像処理システム100の構成を示す図である。画像処理システム100は、画像処理装置101及び撮像装置102を含む。画像処理装置101は、例えば、スマートフォンやパーソナルコンピュータ(PC)などの情報処理装置により実装される。画像処理装置101は、撮像装置102により撮影された画像データを受信し、ユーザが所望する被写体を含んだ画像データを検索する。画像処理装置101と撮像装置102との間の通信は、有線で行われてもよいし、無線で行われてもよい。
図2は、画像処理装置101の構成を示すブロック図である。なお、図2に示す構成は、画像処理装置101を実装する情報処理装置の種類(スマートフォンやPCなど)などに応じて適宜変更される。例えば、図2に示す画像処理装置101はFDD210を含んでいるが、画像処理装置101が図1に示されるようなスマートフォンにより実装される場合、一般的には、画像処理装置101はFDD210を含まない。
画像処理装置101は、モニタ201、VRAM202、BMU203、キーボード204、PD205、CPU206、ROM207、RAM208、外部記憶装置209、FDD210、及びネットワークI/F211を有する。モニタ201には、例えば、画像処理装置101が保持するデータや、外部から供給されたデータが表示される。VRAM202には、モニタ201に表示するための画像が描画される。このVRAM202に生成された画像データは、所定の規定に従ってモニタ201に転送され、これによりモニタ201に画像が表示される。BMU203(ビットムーブユニット)は、例えば、メモリ間(例えば、VRAM202と他のメモリとの間)のデータ転送や、メモリと各I/Oデバイス(例えば、ネットワークI/F211)との間のデータ転送を制御する。キーボード204は、文字等を入力するための各種キーを有する。PD205(ポインティングデバイス)は、例えば、モニタ201に表示されたアイコン、メニュー、その他のコンテンツを指示するために使用される。CPU206は、ROM207、外部記憶装置209又はFDD210に格納された制御プログラムに基づいて、各デバイスを制御する。ROM207は、各種制御プログラムやデータを保存する。RAM208は、CPU206のワーク領域、エラー処理時のデータの退避領域、制御プログラムのロード領域等を有する。外部記憶装置209は、画像処理装置101内で実行される各制御プログラムやデータを格納する。FDD210は、フロッピー(登録商標)等に代表されるフレキシブルディスクに対するアクセスを制御する。ネットワークI/F211は、インターネット等のネットワーク回線213に接続するためのインタフェースである。CPUバス212は、アドレスバス、データバス及びコントロールバスを含む。CPU206に対する制御プログラムの提供は、ROM207、外部記憶装置209、又はFDD210から行うこともできるし、ネットワークI/F211を介してネットワーク経由で他の情報処理装置等から行うこともできる。
図3は、第1の実施形態に係る撮像装置102の構成を示すブロック図である。図3において、83はフォーカスレンズを含む撮影レンズ、81は絞り機能を備えるシャッター、22は光学像を電気信号に変換するCCDやCMOS素子等で構成される撮像部である。23はA/D変換器であり、アナログ信号をデジタル信号に変換する。A/D変換器23は、撮像部22から出力されるアナログ信号をデジタル信号に変換するために用いられる。82はバリアであり、撮像装置102の、撮影レンズ83を覆うことにより、撮影レンズ83、シャッター81、撮像部22を含む撮像系の汚れや破損を防止する。
24は画像処理部であり、A/D変換器23からのデータ、又は、メモリ制御部15からのデータに対し所定の画素補間、縮小といったリサイズ処理や色変換処理を行う。また、画像処理部24では、撮像した画像データを用いて所定の演算処理が行われ、得られた演算結果に基づいてシステム制御部50が露光制御、測距制御を行う。これにより、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理が行われる。画像処理部24では更に、撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
A/D変換器23からの出力データは、画像処理部24及びメモリ制御部15を介して、或いは、メモリ制御部15を介してメモリ32に直接書き込まれる。メモリ32は、撮像部22によって得られA/D変換器23によりデジタルデータに変換された画像データや、表示部28に表示するための画像データを格納する。メモリ32は、所定枚数の静止画像や所定時間の動画像および音声を格納するのに十分な記憶容量を備えている。
また、メモリ32は画像表示用のメモリ(ビデオメモリ)を兼ねている。13はD/A変換器であり、メモリ32に格納されている画像表示用のデータをアナログ信号に変換して表示部28に供給する。こうして、メモリ32に書き込まれた表示用の画像データはD/A変換器13を介して表示部28により表示される。表示部28は、LCD等の表示器上に、D/A変換器13からのアナログ信号に応じた表示を行う。
不揮発性メモリ56は、電気的に消去・記録可能なメモリであり、例えばEEPROM等が用いられる。不揮発性メモリ56には、システム制御部50の動作用の定数、プログラム等が記憶される。
50はシステム制御部であり、撮像装置102全体を制御する。システム制御部50は、前述した不揮発性メモリ56に記録されたプログラムを実行することで、各種処理を実現する。52はシステムメモリであり、RAMが用いられる。システムメモリ52には、システム制御部50の動作用の定数、変数、不揮発性メモリ56から読み出したプログラム等を展開する。
モード切替スイッチ60、第1シャッタースイッチ62、第2シャッタースイッチ64、操作部70は、システム制御部50に各種の動作指示を入力するために使用される。モード切替スイッチ60は、システム制御部50の動作モードを静止画記録モード、動画記録モード、再生モード等のいずれかに切り替える。第1シャッタースイッチ62は、撮像装置102に設けられたシャッターボタン61の操作途中、いわゆる半押し(撮影準備指示)でONとなり、第1シャッタースイッチ信号SW1を発生する。第1シャッタースイッチ信号SW1により、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理、EF(フラッシュプリ発光)処理等の動作を開始する。第2シャッタースイッチ64は、シャッターボタン61の操作完了、いわゆる全押し(撮影指示)でONとなり、第2シャッタースイッチ信号SW2を発生する。システム制御部50は、第2シャッタースイッチ信号SW2により、撮像部22からの信号読み出しから記録媒体90に画像データを書き込むまでの一連の撮影処理の動作を開始する。操作部70の各操作部材は、表示部28に表示される種々の機能アイコンを選択操作することなどにより、場面ごとに適宜機能が割り当てられ、各種機能ボタンとして作用する。機能ボタンとしては、例えば終了ボタン、戻るボタン、画像送りボタン、ジャンプボタン、絞込みボタン、属性変更ボタン等がある。例えば、メニューボタンが押されると各種の設定可能なメニュー画面が表示部28に表示される。ユーザは、表示部28に表示されたメニュー画面と、4方向ボタンやSETボタンとを用いて直感的に各種設定を行うことができる。
電源スイッチ72は、電源オン、電源オフを切り替える。80は電源制御部であり、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成され、電池の装着の有無、電池の種類、電池残量の検出を行う。また、電源制御部80は、その検出結果及びシステム制御部50の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体90を含む各部へ供給する。30は電源部であり、アルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる。18はメモリカードやハードディスク等の記録媒体90とのインタフェースである。記録媒体90は、半導体メモリや磁気ディスク等から構成される。
図4は、撮像装置102により生成される画像データ401の構成を示す図である。図4において、画像データ401は、画像本体を示す本画像情報403と、本画像情報403に付帯するメタ情報402とを含む。メタ情報402は、撮影日時を含む撮影情報404と、画像毎に固有な画像固有ID405と、画像に含まれる被写体の空間上の位置情報を示す画像空間情報406とを含む。画像空間情報406の詳細については、図7を参照して後述する。
図5は、被写体固有情報501の構成を示す図である。被写体固有情報501は、画像処理装置101が画像データにおいて被写体の認識処理を行う際に使用する情報であり、個々の被写体固有情報501が個々の固有の被写体に対応する。画像処理装置101は、例えば外部記憶装置209の中に、被写体固有情報501を格納する。
図5において、被写体ID502は、被写体を一意に識別するIDを示す。被写体名称503は、被写体の名称(例えば、人物の名前)を示す。被写体属性504は、被写体の種別(例えば、動物、植物、人間などの、被写体の一般的な分類名称)を示す。被写体特徴量505は、被写体の画像の特徴を示す情報であり、画像処理装置101は、この情報を用いた画像処理により被写体を一意に識別することができる。
図6は、図4の本画像情報403が示す二次元画像の一例を示す図である。図6において、画像601は、被写体602、603、604を含む。画像処理装置101は、画像601に基づいて各被写体を検出し、各被写体の二次元上の位置(二次元座標)を検出することができる。なお、本画像情報403は、各被写体の奥行き方向の位置を示す情報は含まない。
図7は、図4の画像空間情報406の一例である距離マップ画像を示す図である。撮像装置102は、任意の公知技術に基づいて距離マップ画像を作成可能であり、一例として、特開2015−73185号公報に記載の技術を使用可能である。本実施形態では、距離マップ画像701は、画像601の奥行き方向の位置(距離)を画像の濃淡で示す。距離マップ画像701において、明るい部分が手前にあり、暗い部分が奥にある。画像処理装置101は、距離マップ画像701に基づき、被写体602、603、604それぞれの奥行き方向の位置702、703、704を検出することができる。
なお、以下の説明においては、画像空間情報406は距離マップ画像であるものとするが、画像処理装置101が各被写体の奥行き方向の位置を検出可能である限り、画像空間情報406はいかなる種類の情報であっても構わない。例えば、撮像装置102は、画像撮影時に被写体の奥行き方向の位置を含む三次元上の位置(三次元座標)を検出し、画像空間情報406として各被写体の三次元座標を記録してもよい。
ここで、図12を参照して、画像処理装置101が実行するインデックス化処理について説明する。本フローチャートの各ステップの処理は、特に断らない限り、画像処理装置101のCPU206が外部記憶装置209に格納されたプログラムを実行することにより実現される。画像処理装置101が1以上の画像データを取得すると、本フローチャートの処理が開始する。画像データ取得処理は、例えば、画像処理装置101が撮像装置102から1以上の画像データを受信することにより行われる。
S1201で、画像処理装置101は、画像データ401の本画像情報403(図4)に基づき、画像中の被写体を検出し、検出した被写体の二次元座標を、図8に示す被写体管理情報802の中に記録する。画像処理装置101は、任意の公知技術を用いて被写体の二次元座標を検出することができる。
被写体管理情報802は、各画像データに含まれる各被写体を管理する情報であり、個々の被写体管理情報802が個々の画像データに含まれる個々の被写体に対応する。同一の被写体であっても、異なる画像データに含まれていれば、異なる被写体管理情報802により管理される。図8の例では、画像601に基づき、被写体602、603、604に対応する3つの被写体管理情報802が生成される。
図8に示すように、被写体管理情報802は、画像固有ID803、被写体ID804、二次元座標805、及び列位置806を含む。画像固有ID803には、画像データ401の画像固有ID405(図4)と同じ情報が記録される。即ち、画像処理装置101は、現在の処理対象の画像データ401から画像固有ID405を取得し、これを被写体管理情報802の画像固有ID803に記録する。被写体ID804は、被写体を一意に識別するIDを示す。S1201においては、被写体の存在は検出されているが認識処理はまだ行われていないので、被写体ID804は空である。二次元座標805は、検出された被写体の二次元座標を示す。列位置806は、被写体の奥行き方向の位置を列単位で示す。S1201においては、被写体の奥行き方向の位置の検出はまだ行われていないので、列位置806は空である。
次に、S1203で、画像処理装置101は、位置取得処理を行う。具体的には、画像処理装置101は、距離マップ画像701から、各被写体の二次元座標に対応する部分の奥行き方向の位置(深度)を取得し、被写体管理情報802の列位置806に格納する(図9参照)。S1205で、画像処理装置101は、列位置806に記録された深度情報を列情報に変換して、列位置806に再格納する。
本実施形態の「列」は、所定の位置範囲(深度範囲)を1つの位置(即ち、1つの列)に対応付けるものである。本実施形態においては、深度情報から列情報への変換は、画像中の列数の上限値を決めて、被写体間の距離の長短を判定することにより行われるものとする。画像処理装置101は、被写体間の距離をまず測定して降順に列挙し、上位から列数上限番目のところまでを列分離基準間隔とし、この間隔以上であれば、別列として被写体を分離し、同間隔未満であれば該当する被写体は同列としてグループ化される。
或いは、画像処理装置101は、深度情報が取り得る値の範囲を複数の区間に分割し、変換対象の深度情報がどの区間に含まれるかに基づき、深度情報を列情報に変換してもよい。
S1206で、画像処理装置101は、全ての画像データに対する処理が完了したか否かを判定する。未処理の画像データが残っている場合、画像処理装置101は、処理をS1213に進め、次の画像データを処理対象にし、S1201乃至S1205の処理を実行する。全ての画像データに対する処理が完了すると、画像処理装置101は、処理をS1207に進める。
S1207で、画像処理装置101は、変数Rmaxに対し、被写体管理情報802の最大列数(S1201乃至S1205の処理により生成された各々の被写体管理情報802の列位置806のうち、最大の値)を格納する。ここで、変数Rmaxは、被写体認識処理の対象とする列数(手前1列目から数えて、後列方向に何列目までの被写体を認識処理の対象とするか)を示す。
なお、被写体管理情報802の最大列数の代わりに、予め設定された列数をRmaxとしてもよい。この場合、予め設定された列数よりも後ろ(奥)の被写体は、認識処理の対象から除外される。
S1208で、画像処理装置101は、列変数Rに1を代入して初期化する。S1209で、画像処理装置101は、R列目の被写体に対して認識処理を行い、認識結果を被写体ID804に記録する(図10参照)。具体的には、画像処理装置101は、画像601の被写体602の被写体特徴量を検出し、検出した被写体特徴量を、外部記憶装置209に格納された複数の被写体固有情報501(図5)それぞれの被写体特徴量505と比較する。被写体特徴量の一致度が閾値以上の被写体固有情報501が検出された場合、画像処理装置101は、この被写体固有情報501の被写体ID502の値を、被写体管理情報802の被写体ID804に記録する。従って、被写体固有情報501は、被写体認識処理においては、未知の被写体が対応する可能性のある被写体候補としての役割を果たす。被写体特徴量の一致度が閾値以上の被写体固有情報501が複数検出された場合、画像処理装置101は、一致度が最大の被写体固有情報501を使用する。この被写体認識処理により、被写体管理情報802に必要な情報が全て格納され、画像検索の検索キーとして被写体管理情報802を利用できるようになる。被写体管理情報802は画像固有ID803及び被写体ID804を含んでいるので、特定の被写体と、この被写体を含んだ画像データとを関連付ける役割を果たす。
S1210で、画像処理装置101は、全画像データについてR列目の認識処理が完了したか否かを判定する。未処理の画像データが残っている場合、画像処理装置101は、処理をS1214に進め、次の画像データを処理対象にし、S1209の処理を実行する。全ての画像データに対する処理が完了すると、画像処理装置101は、処理をS1211に進める。
S1211で、画像処理装置101は、列変数Rに1を加算する。S1212で、画像処理装置101は、R≦Rmaxであるか否かを判定する。R≦Rmaxの場合、画像処理装置101は、処理をS1209に戻し、全画像データの次の列の被写体に対して同様に認識処理を行う。全ての列について認識処理が完了すると(即ち、S1212においてR>Rmaxの場合)、本フローチャートの処理は終了する。
図12から理解できるように、本実施形態のインデックス化処理においては、画像処理装置101は、手前の被写体ほど優先的に認識処理を行う。これは、画像データ中に複数の被写体が含まれる場合、ユーザにとっては、手前の被写体ほど重要度が高いと考えられるからである。被写体認識処理は計算負荷が比較的高く時間がかかる処理であるが、本実施形態では、ユーザにとって重要度が高いと考えられる被写体ほど先に認識処理が完了する。そのため、インデックス化処理の途中であっても、ユーザにとって重要度が高いと考えられる被写体を含む画像データについては、比較的早期に検索可能になることが期待できる。
次に、図13を参照して、画像処理装置101が実行する画像検索処理について説明する。本フローチャートの各ステップの処理は、特に断らない限り、画像処理装置101のCPU206が外部記憶装置209に格納されたプログラムを実行することにより実現される。ユーザが画像処理装置101に対して画像検索モードへの移行指示を入力すると、本フローチャートの処理が開始する。なお、画像処理装置101は、図12のインデックス化処理が完了していなくても、インデックス化処理と並行して図13の画像検索処理を実行可能である。
S1301で、画像処理装置101は、モニタ201に検索画面(図11参照)を表示し、ユーザにより検索欄1101に入力された検索キーを取得する。検索キーは、検索対象の被写体を特定可能な情報であれば、いかなる情報であってもよい。例えば、検索キーは人物の名前である。検索キーの入力は、画像処理装置101に対する検索指示の役割を果たす。検索キーが入力されると(即ち、検索指示の受付が行われると)、画像処理装置101は、インデックス化処理が完了しているか否かに関わらず、画像データの検索を開始する。検索の開始時にインデックス化処理が完了していない場合、インデックス化処理と並行して検索が行われる。
S1302で、画像処理装置101は、検索キーに対応する被写体IDを取得する。具体的には、画像処理装置101は、外部記憶装置209に格納された被写体固有情報501の中から、検索キーに一致する被写体名称503を持つものを検出し、検出した被写体固有情報501の被写体ID502を取得する。
S1303で、画像処理装置101は、S1302において取得した被写体IDが、現在の処理対象の被写体管理情報802の被写体ID804と一致するか否かを判定する。一致する場合、画像処理装置101は処理をS1304に進め、一致しない場合、画像処理装置101は処理をS1305に進める。
S1304で、画像処理装置101は、現在の処理対象の被写体管理情報802の画像固有ID803に対応する画像データ(即ち、検索により発見された画像データ)を示す情報を検索結果としてモニタ201に表示する。本実施形態では、画像処理装置101は、現在の処理対象の被写体管理情報802の画像固有ID803及び列位置806に基づき、モニタ201にサムネイル画像及び列を表示するものとする。例えば、画像処理装置101は、図11に示すように、サムネイル画像1102及び列情報1103を表示する。これにより、ユーザは、サムネイル画像1102が示す画像データの、列情報1103が示す列に、検索対象の被写体が含まれることを認識することができる。インデックス化処理が実行中の場合、検索結果の表示はインデックス化処理と並行して行われる。
S1305で、画像処理装置101は、全ての被写体管理情報802について処理が完了したか否かを判定する。未処理の被写体管理情報802が残っている場合、画像処理装置101は、処理をS1306に進め、次の被写体管理情報802を処理対象にし、S1303の処理を実行する。この繰り返しにより、検索キーに対応する被写体IDを含む全ての被写体管理情報802が検出され、対応するサムネイル画像及び列がモニタ201に表示される。全ての被写体管理情報802について処理が完了すると、画像処理装置101は、処理をS1307に進める。
S1307で、画像処理装置101は、図12のインデックス化処理を実行中であるか否かを判定する。インデックス化処理を実行中の場合、既存の全ての被写体管理情報802について処理が完了しても、新たな被写体管理情報802が生成される可能性がある。そこで、画像処理装置101は、処理をS1306に戻し、新たに生成された被写体管理情報802についても、同様に検索処理を行う。
なお、画像処理装置101は、インデックス化処理を実行中の場合、モニタ201に認識列情報1104(図11)を表示してもよい。ここで表示される列番号は、図12を参照して説明した列変数Rの値に対応する。これにより、ユーザは、インデックス化処理において現在何列目の被写体の認識処理が行われているかを知ることができる。また、ユーザは、認識列情報1104が示す列よりも手前の列については認識処理が完了しており、検索キーに対応する被写体を含む画像データを検出可能な状態であることを認識できる。
S1305において全ての被写体管理情報802について処理が完了したと判定され、S1307においてインデックス化処理を実行中でないと判定された場合、本フローチャートの処理は完了する。
以上説明したように、第1の実施形態によれば、画像処理装置101は、インデックス化処理の際に、手前の被写体ほど優先的に認識処理を行う。これにより、ユーザにとって重要度が高いと考えられる被写体の認識処理が比較的早期に完了し、そのような被写体を含む画像データを効率的に検索することが可能となる。
なお、全体として複数の被写体が存在する限り、インデックス化処理の対象の画像データが単数であっても複数であっても本実施形態の効果が得られる。例えば、複数の被写体を含む1つの画像データがインデックス化処理の対象である場合、手前の被写体ほど優先的に認識処理が行われる。そのため、この画像データにおいて検索対象の被写体が他の被写体よりも手前に位置する場合、ユーザはその事実を比較的早期に認識することができる。
また、本実施形態において、インデックス化処理は必須ではない。例えば、画像処理装置は、検索キーを取得したことに応えて被写体認識処理を開始し、検索対象の被写体を含んだ画像データを検索してもよい。
[第2の実施形態]
第2の実施形態では、画像検索処理の際にユーザが検索対象の列範囲を指定可能にする構成について説明する。本実施形態において、画像処理システム100の基本的な構成は第1の実施形態と同様である。以下、第1の実施形態と異なる点について主に説明する。
図14は、第2の実施形態に係る画像処理装置101が実行する画像検索処理のフローチャートである。本フローチャートの各ステップの処理は、特に断らない限り、画像処理装置101のCPU206が外部記憶装置209に格納されたプログラムを実行することにより実現される。本フローチャートにおいて、図13と同一又は同様の処理が行われるステップには、図13と同一の符号を付す。ユーザが画像処理装置101に対して画像検索モードへの移行指示を入力すると、本フローチャートの処理が開始する。なお、画像処理装置101は、図12のインデックス化処理が完了していなくても、インデックス化処理と並行して図14の画像検索処理を実行可能である。
S1401で、画像処理装置101は、ユーザにより入力された列範囲を取得する。即ち、本実施形態では、検索指示は、検索キーに加えて列範囲(検索範囲)を含む。ユーザによる列範囲の入力を可能にするために、画像処理装置101は、例えば図11に示す検索欄1101の下に列範囲入力欄(不図示)を表示する。列範囲は、例えば「1〜3」のように連続した範囲でもよいし、「3,5」のように離散した範囲でもよい。
S1402で、画像処理装置101は、現在の処理対象の被写体管理情報802の列位置806が、S1401において取得された列範囲に含まれるか否かを判定する。列位置806が列範囲に含まれる場合、画像処理装置101は処理をS1304に進め、そうでない場合、画像処理装置101は処理をS1305に進める。
以上の処理により、画像検索処理における検索対象の列を、ユーザが指定した検索範囲内に制限することができる。
[第3の実施形態]
第3の実施形態では、インデックス化処理の完了後に画像検索処理を行う場合に、検索対象の被写体が手前に位置している画像データほど、検索結果の上位に表示する構成について説明する。本実施形態において、画像処理システム100の基本的な構成は第1の実施形態と同様である。以下、第1の実施形態と異なる点について主に説明する。
図15は、第3の実施形態に係る画像処理装置101が実行する画像検索処理のフローチャートである。本フローチャートの各ステップの処理は、特に断らない限り、画像処理装置101のCPU206が外部記憶装置209に格納されたプログラムを実行することにより実現される。本フローチャートにおいて、図13と同一又は同様の処理が行われるステップには、図13と同一の符号を付す。ユーザが画像処理装置101に対して画像検索モードへの移行指示を入力すると、本フローチャートの処理が開始する。
S1501で、画像処理装置101は、変数Iを0に初期化する。S1502で、画像処理装置101は、現在の処理対象の被写体管理情報802を、配列変数AのI番目に位置に格納する。S1503で、画像処理装置101は、変数Iに1を加算する。
全ての被写体管理情報802について処理が完了した後、S1504で、画像処理装置101は、配列変数Aを、列位置806をソートキーとして用いて、列位置昇順にソートする。S1505で、画像処理装置101は、配列変数Aに格納された被写体管理情報802それぞれに対応する画像及び列を、配列インデックスが小さい順にモニタ201に表示する。
以上の処理により、検索対象の被写体が手前に位置している画像データほど、検索結果の上位に表示することができる。即ち、検索結果が、検索対象の被写体が位置する列について手前から奥の順に並べられて表示される。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101…画像処理装置、201…モニタ、202…VRAM、203…BMU、204…キーボード、205…PD、206…CPU、207…ROM、208…RAM、209…外部記憶装置、210…FDD、211…ネットワークI/F

Claims (9)

  1. 各々が1以上の被写体を含む複数の画像データを取得する画像データ取得手段と、
    前記複数の画像データに含まれる複数の被写体それぞれの奥行き方向の位置を取得する位置取得手段と、
    前記複数の被写体それぞれについて、複数の被写体候補の中から対応する被写体候補を検出する被写体認識処理を行う被写体認識手段と、
    前記複数の被写体候補のうちの1つに対応する被写体を検索対象とする検索指示を受け付ける受付手段と、
    前記複数の被写体それぞれについての前記被写体認識処理の結果に基づき、前記複数の画像データから前記検索対象の被写体を含んだ画像データを検索する検索手段と、
    を備え、
    前記被写体認識手段は、前記複数の被写体それぞれの前記奥行き方向の位置に基づき、手前の被写体ほど先に前記被写体認識処理を行い、
    前記検索手段は、前記複数の被写体の全てに対して前記被写体認識処理が完了しているか否かに関わらず、前記検索指示に応じて前記検索を開始し、前記被写体認識処理が完了していない被写体が存在する場合、前記被写体認識処理と並行して前記検索を行う
    ことを特徴とする画像処理装置。
  2. 前記検索手段により発見された画像データを示す情報を検索結果として表示する表示手段を更に備え、
    前記検索手段が前記被写体認識処理と並行して前記検索を行っている場合、前記表示手段は、前記被写体認識処理と並行して前記表示を行う
    ことを特徴とする請求項に記載の画像処理装置。
  3. 前記検索の開始時に前記複数の被写体の全てに対して前記被写体認識処理が完了している場合、前記表示手段は、前記検索結果を、前記検索対象の被写体の前記奥行き方向の位置について手前から奥の順に並べて表示する
    ことを特徴とする請求項に記載の画像処理装置。
  4. 前記被写体認識手段は、前記被写体認識処理により検出された前記被写体候補と、当該被写体候補に対応する被写体を含んだ画像データとを関連付ける被写体管理情報を生成する
    ことを特徴とする請求項乃至のいずれか1項に記載の画像処理装置。
  5. 前記検索手段は、前記被写体管理情報に基づいて前記検索を行う
    ことを特徴とする請求項に記載の画像処理装置。
  6. 前記検索指示は、奥行き方向の位置についての検索範囲を含み、
    前記検索手段は、前記検索対象の被写体を前記検索範囲内の奥行き方向の位置に含んだ画像データを検索する
    ことを特徴とする請求項乃至のいずれか1項に記載の画像処理装置。
  7. 前記位置取得手段は、前記複数の被写体それぞれの前記奥行き方向の位置を、所定の位置範囲を1つの位置に対応付ける列の単位で取得する
    ことを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  8. 画像処理装置による画像処理方法であって、
    前記画像処理装置の画像データ取得手段が、各々が1以上の被写体を含む複数の画像データを取得する画像データ取得工程と、
    前記画像処理装置の位置取得手段が、前記複数の画像データに含まれる複数の被写体それぞれの奥行き方向の位置を取得する位置取得工程と、
    前記画像処理装置の被写体認識手段が、前記複数の被写体それぞれについて、複数の被写体候補の中から対応する被写体候補を検出する被写体認識処理を行う被写体認識工程と、
    前記複数の被写体候補のうちの1つに対応する被写体を検索対象とする検索指示を受け付ける受付工程と、
    前記複数の被写体それぞれについての前記被写体認識処理の結果に基づき、前記複数の画像データから前記検索対象の被写体を含んだ画像データを検索する検索工程と、
    を備え、
    前記被写体認識工程では、前記複数の被写体それぞれの前記奥行き方向の位置に基づき、手前の被写体ほど先に前記被写体認識処理を行い、
    前記検索工程では、前記複数の被写体の全てに対して前記被写体認識処理が完了しているか否かに関わらず、前記検索指示に応じて前記検索を開始し、前記被写体認識処理が完了していない被写体が存在する場合、前記被写体認識処理と並行して前記検索を行う
    ことを特徴とする画像処理方法。
  9. コンピュータを、請求項1乃至のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
JP2015163090A 2015-08-20 2015-08-20 画像処理装置、及び画像処理方法 Expired - Fee Related JP6564275B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015163090A JP6564275B2 (ja) 2015-08-20 2015-08-20 画像処理装置、及び画像処理方法
US15/233,459 US9864899B2 (en) 2015-08-20 2016-08-10 Image processing apparatus, image processing method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015163090A JP6564275B2 (ja) 2015-08-20 2015-08-20 画像処理装置、及び画像処理方法

Publications (2)

Publication Number Publication Date
JP2017041795A JP2017041795A (ja) 2017-02-23
JP6564275B2 true JP6564275B2 (ja) 2019-08-21

Family

ID=58158455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015163090A Expired - Fee Related JP6564275B2 (ja) 2015-08-20 2015-08-20 画像処理装置、及び画像処理方法

Country Status (2)

Country Link
US (1) US9864899B2 (ja)
JP (1) JP6564275B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10949700B2 (en) * 2018-01-10 2021-03-16 Qualcomm Incorporated Depth based image searching
JPWO2020209097A1 (ja) * 2019-04-10 2020-10-15

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003219926A1 (en) * 2002-02-26 2003-09-09 Canesta, Inc. Method and apparatus for recognizing objects
JP2005196542A (ja) 2004-01-08 2005-07-21 Konica Minolta Holdings Inc 画像検索装置、画像検索方法及びプログラム
US20060291697A1 (en) * 2005-06-21 2006-12-28 Trw Automotive U.S. Llc Method and apparatus for detecting the presence of an occupant within a vehicle
EP2160037A3 (en) * 2006-06-23 2010-11-17 Imax Corporation Methods and systems for converting 2D motion pictures for stereoscopic 3D exhibition
US9171264B2 (en) * 2010-12-15 2015-10-27 Microsoft Technology Licensing, Llc Parallel processing machine learning decision tree training
JP6270325B2 (ja) * 2013-03-15 2018-01-31 キヤノン株式会社 情報処理装置およびその制御方法
US9355334B1 (en) * 2013-09-06 2016-05-31 Toyota Jidosha Kabushiki Kaisha Efficient layer-based object recognition
JP2015073185A (ja) 2013-10-02 2015-04-16 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
US9811756B2 (en) * 2015-02-23 2017-11-07 Mitsubishi Electric Research Laboratories, Inc. Method for labeling images of street scenes

Also Published As

Publication number Publication date
US9864899B2 (en) 2018-01-09
JP2017041795A (ja) 2017-02-23
US20170053183A1 (en) 2017-02-23

Similar Documents

Publication Publication Date Title
JP5268595B2 (ja) 画像処理装置、画像表示方法及び画像表示プログラム
US7847850B2 (en) Image displaying apparatus, image displaying method, and non-transitory computer-readable storage medium
JP5473646B2 (ja) 画像検索装置、制御方法、プログラム及び記憶媒体
JP6132490B2 (ja) 認証装置、認証方法、およびプログラム
JP6024719B2 (ja) 検出装置、検出方法、及びプログラム
US20080069540A1 (en) Image reproducing apparatus, image reproducing method, and computer-readable storage medium
JP5918996B2 (ja) 被写体認識装置および辞書データ登録方法
KR101737301B1 (ko) 포커스 변경가능한 화상을 생성하는 촬상장치, 촬상장치의 제어 방법, 및 기억매체
JP6564275B2 (ja) 画像処理装置、及び画像処理方法
JP2014186580A (ja) 認証装置、撮像装置、認証用データの登録方法、プログラム、および、記憶媒体
JP6521715B2 (ja) 撮像装置、その制御方法、および制御プログラム
JP2018029270A (ja) 画像処理装置およびその制御方法、撮像装置、プログラム
CN104639813B (zh) 摄像装置及摄像方法
US20080068483A1 (en) Image reproducing apparatus and image reproducing method
US8780250B2 (en) Image processing apparatus that processes image data to which a plurality of pieces of classification information are added, method of controlling image processing apparatus, and storage medium
JP2009089046A (ja) 画像データ処理方法及び撮影装置
JP2015041234A (ja) 画像分類装置、撮影装置、画像分類方法、及びプログラム
US8442975B2 (en) Image management apparatus
JP2016075992A (ja) 撮像装置、情報処理装置およびそれらの情報処理方法、並びに、情報処理システム
JP5445648B2 (ja) 画像表示装置、画像表示方法、およびそのプログラム。
US20220277537A1 (en) Apparatus, image apparatus, method for apparatus, and storage medium
JP4227638B2 (ja) 画像処理装置及び方法、並びにプログラム
JP5570325B2 (ja) 画像処理装置及び画像ファイル管理方法
JP2012027678A (ja) 画像表示装置およびプログラム
JP2009265873A (ja) 画像群の標題付与装置、およびカメラ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180807

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190726

R151 Written notification of patent or utility model registration

Ref document number: 6564275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees