JPWO2014061222A1 - 情報処理装置、情報処理方法および情報処理用プログラム - Google Patents

情報処理装置、情報処理方法および情報処理用プログラム Download PDF

Info

Publication number
JPWO2014061222A1
JPWO2014061222A1 JP2014541925A JP2014541925A JPWO2014061222A1 JP WO2014061222 A1 JPWO2014061222 A1 JP WO2014061222A1 JP 2014541925 A JP2014541925 A JP 2014541925A JP 2014541925 A JP2014541925 A JP 2014541925A JP WO2014061222 A1 JPWO2014061222 A1 JP WO2014061222A1
Authority
JP
Japan
Prior art keywords
image
information
partial area
area
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014541925A
Other languages
English (en)
Inventor
達勇 秋山
達勇 秋山
尚司 谷内田
尚司 谷内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2014061222A1 publication Critical patent/JPWO2014061222A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • G06V30/1988Graph matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
    • G06K17/0016Selecting or retrieving of images by means of their associated code-marks, e.g. coded microfilm or microfiche

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)

Abstract

画像照合部81は、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する。アクション情報判定部82は、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、その部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、その部分領域に対応するアクション情報を特定する。アクション情報実行部83は、アクション情報に応じた情報処理を対象装置に実行させる。

Description

画像に応じた情報処理を行う情報処理装置、情報処理方法および情報処理用プログラムに関する。
近年、印刷された紙媒体を画像化することが行われている。このように画像化した情報は、端末等を用いて電子的に扱うことが可能になる。
特許文献1には、少なくとも2種類の媒体(例えば、第1媒体として印刷された用紙、第2媒体としてディジタルコンテンツ)を含む混合メディア書類を形成する混合メディア書類システムが記載されている。特許文献1に記載されたシステムは、インデックステーブルと共に構築されたコンテンツベースの検索データベースを含み、テキストベースのインデックスを用いてコンテンツを探索する。また、特許文献1に記載されたシステムでは、印刷書類から抽出されたオブジェクト間の2次元の幾何学的な位置関係がインデックステーブルに記憶され、書類の候補は、インデックステーブルから所与のデータを元に算出される。
なお、特許文献2には、画像から特徴点を抽出する方法が記載されている。また、特許文献3には、二つの連結領域の面積比がアフィン変換に対する不変量として算出されることが記載されている。
また、特許文献4には、検索キー画像と類似の特徴を持つ領域を含む画像を検索する画像検索装置が記載されている。特許文献4に記載された画像検索装置は、登録画像中の複数の領域について特徴量を抽出し、抽出した特徴量と検索キー画像から抽出した特徴量とを比較して、検索キー画像と類似した領域を含む類似画像を検索する。
特表2009−506394号公報 WO2010/053109号公報 WO2009/110410号公報 特開2002−245048号公報
ところで、画像化して登録された登録画像は、電子的に扱うことができるため、登録画像中の一部を照合することも可能である。しかし、登録画像の一部を検索するために入力される検索画像のバリエーションは膨大であるため、その膨大なバリエーションの画像に基づいて実行する情報処理を一意に特定することは困難であった。
例えば、特許文献1に記載された方法は、印刷媒体及び仮想媒体双方の利点を利用可能にする方法であるが、特許文献1に記載された方法を用いても、検索対象(ドキュメントや画像)の部分的な領域に応じた所定のアクション(例えば、リンク先の表示、動画コンテンツの再生等)を行うことは困難である。
そこで、本発明は、登録画像の一部を示す画像情報が入力されたときに、その入力された画像情報に応じた情報処理を実行できる情報処理装置、情報処理方法および情報処理用プログラムを提供することを目的とする。
本発明による情報処理装置は、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合部と、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、その部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、その部分領域に対応するアクション情報を特定するアクション情報判定部と、アクション情報に応じた情報処理を対象装置に実行させるアクション情報実行部とを備えたことを特徴とする。
本発明による情報処理方法は、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出し、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、その部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、部分領域に対応するアクション情報を特定し、アクション情報に応じた情報処理を対象装置に実行させることを特徴とする。
本発明による情報処理用プログラムは、コンピュータに、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合処理、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、その部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、その部分領域に対応するアクション情報を特定するアクション情報判定処理、および、アクション情報に応じた情報処理を対象装置に実行させるアクション情報実行処理を実行させることを特徴とする。
本発明によれば、登録画像の一部を示す画像情報が入力されたときに、その入力された画像情報に応じた情報処理を実行できる。
本発明による画像部分領域抽出装置の第1の実施形態の構成例を示すブロック図である。 連結領域の例を示す説明図である。 登録処理の動作例を示すフローチャートである。 第1の実施形態の検索処理の動作例を示すフローチャートである。 対応特徴点を検出する動作例を示すフローチャートである。 対応領域を決定する動作例を示すフローチャートである。 連結対象ノードの例を示す説明図である。 連結対象ノード間に付加されたエッジの例を示す説明図である。 出力領域の例を示す説明図である。 画像部分領域抽出装置を実現可能な情報処理システムの構成例を示すブロック図である。 本発明による画像部分領域抽出装置の第2の実施形態の構成例を示すブロック図である。 第2の実施形態の検索処理の動作例を示すフローチャートである。 対応特徴点対を検出する動作例を示すフローチャートである。 特徴点一致履歴を生成する例を示す説明図である。 対応領域を推定する動作例を示すフローチャートである。 出力領域を推定する動作例を示すフローチャートである。 情報処理装置の例を示すブロック図である。 第3の実施形態で示す情報処理装置の動作例を示すフローチャートである。 アクション情報を判定する動作例を示すフローチャートである。 本発明の情報処理装置の概要を示すブロックである。
次に、本発明を実施するための最良の形態を図面を参照して詳細に説明する。
実施形態1.
図1は、本発明による画像部分領域抽出装置の第1の実施形態の構成例を示すブロック図である。本実施形態の画像部分領域抽出装置は、登録画像特徴点生成部R201と、登録画像特徴点配置生成部R202と、登録画像特徴量生成部R203と、検索画像特徴点生成部Q201と、検索画像特徴点配置生成部Q202と、検索画像特徴量生成部Q203と、対応特徴点検出部204と、対応領域判定部205とを備えている。
これらの手段はそれぞれ概略次のように動作する。
登録画像特徴点生成部R201は、登録画像から特徴点を生成する。具体的には、登録画像特徴点生成部R201は、既知の方法を用いて登録画像から特徴点を生成する。登録画像特徴点生成部R201は、例えば、二値化または色空間クラスタリング等の方法を用いて、登録画像から連結領域を抽出し、各連結領域の重心点を抽出して特徴点としてもよい。連結領域とは、互いに同じ色に属すると判定された画素のうち互いに隣接関係にある画素を連結した領域であり、画像処理の分野においては既知の概念である。また、非連結領域とは、連結領域以外の領域である。
図2は、連結領域の例を示す説明図である。図2に示す例では、「A」という文字が記載された画像50から1つの連結領域51が抽出され、その連結領域51の重心点を特徴点52として抽出したことを示す。また、図2に示す例では、「A」という文字を形成する画素の集合が連結領域に相当する。
ただし、登録画像特徴点生成部R201が特徴点を抽出する方法は、上記方法に限定されない。登録画像特徴点生成部R201は、例えば、特許文献2に記載された登録画像特徴点抽出モジュールが特徴点を抽出する方法を利用してもよいし、特徴点を抽出する前にガウシアンフィルタ等のフィルタを適用してもよい。以下、登録画像特徴点生成部R201が連結領域の重心点を特徴点として抽出する方法を例に説明する。
登録画像特徴点配置生成部R202は、登録画像特徴点生成部R201により求められた特徴点から1つ以上の特徴点配置を生成する。具体的には、登録画像特徴点配置生成部R202は、既知の方法を用いて特徴点配置を生成する。ここで、特徴点配置とは、所定の規則に基づいて順序付けされた互いに近傍に存在する特徴点の集合を示す。
登録画像特徴点配置生成部R202は、例えば、特許文献2に記載された方法を用いて特徴点配置を生成してもよい。具体的には、登録画像特徴点配置生成部R202は、登録画像から抽出した各特徴点を注目特徴点とし、以下の手順に従って特徴点配置を生成してもよい。
まず、登録画像特徴点配置生成部R202は、登録画像から得られた特徴点(注目特徴点)の近傍に存在する特徴点群を求める。次に、登録画像特徴点配置生成部R202は、各注目特徴点から最近傍にある特徴点を第1要素として選択する。そして、登録画像特徴点配置生成部R202は、注目特徴点を端点として第1要素とした特徴点を通る半直線を想定し、その半直線を上記端点(注目特徴点)を中心に回転させる。このとき、登録画像特徴点配置生成部R202は、他の特徴点が半直線と交わる順に第2要素以降の特徴点を順次選択する。
登録画像特徴量生成部R203は、登録画像特徴点配置生成部R202によって生成された特徴点配置のそれぞれに対して、特徴量を計算する。ここで算出される特徴量は、幾何学的変換に不変な特徴量である。この特徴量を計算する方法の一例として、特許文献2に記載された不変量の計算方法が利用できる。
登録画像特徴量生成部R203は、特徴点配置内の特徴点に予め付与された順序と、幾何学的不変量を計算するための特徴点の順列とを1つ以上対応付け、対応付けられた各々の特徴点順列から不変量を計算してもよい。また、登録画像特徴量生成部R203は、複数の特徴点を結んで形成される1つ以上の三角形を生成し、各三角形の面積に基づいて算出された不変量を特徴量としてもよい。以下の説明では、上述する各三角形の面積に基づいて特徴量を計算する方法を、三角形に基づく不変量計算法と呼ぶ。
ただし、登録画像特徴量生成部R203が特徴量を計算する方法は、三角形に基づく不変量計算法に限定されない。登録画像特徴量生成部R203は、例えば、特許文献3に記載された方法を用いて特徴量を計算してもよい。具体的には、登録画像特徴量生成部R203は、特徴点を抽出するために登録画像特徴点生成部R201が抽出した各連結領域の面積比を特徴量としてもよい。
特許文献3に記載されているように、二つの連結領域の面積比は、アフィン変換に対する不変量である。例えば、登録画像が二値化されている場合、連結領域は黒画素の領域として表わされる。ここで、特徴点集合に含まれる特徴点の個数をnとすると、以下に示す式aから式aを順に並べたものは、アフィン変換による変形に不変な性質を持つ特徴量になる。
(第1特徴点を計算する元である連結領域の黒画素数)/(第2特徴点を計算する元である連結領域の黒画素数) ・・・式a
(第2特徴点を計算する元である連結領域の黒画素数)/(第3特徴点を計算する元である連結領域の黒画素数) ・・・式a
・・・
(第n−1特徴点を計算する元である連結領域の黒画素数)/(第n特徴点を計算する元である連結領域の黒画素数) ・・・式an−1
(第n特徴点を計算する元である連結領域の黒画素数)/(第1特徴点を計算する元である連結領域の黒画素数) ・・・式a
また、注目特徴点付近において局所的にアフィン変換で近似できる場合、式aから式aを順に並べて算出される特徴量は、射影変換に対しても擬似的に不変な性質を持つ特徴量になる。以下の説明では、連結領域の黒画素数の比により不変量(特徴量)を求める方法を、連結領域面積に基づく不変量計算法と呼ぶ。
なお、ここでは、二値化された登録画像を用いた場合を例示して連結領域面積に基づく不変量計算法を説明したが、用いられる登録画像は、二値化された登録画像に限定されない。例えば、色空間クラスタリング等の方法を用いて登録画像から連結領域が抽出されている場合、登録画像特徴量生成部R203は、クラスタ化された色空間に含まれる画素により連結領域が抽出されていると判断し、各連結領域の画素数の比により不変量(特徴量)を求めてもよい。
以上に述べた特徴量は、単独で用いられてもよいし、2つ以上の特徴量を組み合わせて用いられてもよい。以下の例では、三角形に基づく不変量計算法により求められる特徴量と、連結領域面積に基づく不変量計算法により求められる特徴量とを組み合わせて用いるものとし、両特徴量を組み合わせたものを、特徴点配置に対する特徴量、または、単に特徴量と記す。このように、登録画像について、注目特徴点ごとに特徴点配置に基づいて幾何学的変換に不変な特徴量が算出される。なお、登録画像特徴量生成部R203は、算出された特徴量を記憶する登録画像特徴量記憶装置(図示せず)を含んでいてもよい。この場合、登録画像特徴量生成部R203は、算出された特徴量を登録画像特徴量記憶装置に記憶する。
検索画像特徴点生成部Q201は、検索画像から特徴点を生成する。検索画像特徴点生成部Q201は、例えば、既知の方法で検索画像から特徴点を生成してもよいし、登録画像特徴点生成部R201が登録画像から特徴点を生成する方法と同一の方法を用いて特徴点を生成してもよい。ただし、検索画像特徴点生成部Q201が特徴点を生成する方法は、これらの方法に限定されない。
検索画像特徴点配置生成部Q202は、特徴点配置を生成する。検索画像特徴点配置生成部Q202は、例えば、既知の方法で特徴点配置を生成してもよいし、登録画像特徴点配置生成部R202が特徴点から特徴点配置を生成する方法と同一の方法を用いて特徴点配置を生成してもよい。ただし、検索画像特徴点配置生成部Q202が特徴点配置を生成する方法は、これらの方法に限定されない。
検索画像特徴量生成部Q203は、検索画像特徴点配置生成部Q202によって生成された特徴点配置のそれぞれに対して、特徴量を計算する。検索画像特徴量生成部Q203は、登録画像特徴量生成部R203が特徴量を計算する方法と同一の方法を用いて特徴量を計算してもよい。ただし、検索画像特徴量生成部Q203が特徴量を計算する方法は、この方法に限定されない。このように、検索画像についても、注目特徴点ごとに特徴点配置に基づいて幾何学的変換に不変な特徴量が算出される。
対応特徴点検出部204は、登録画像特徴量生成部R203が生成した特徴量と検索画像特徴量生成部Q203が生成した特徴量を比較することで、各々の特徴量が生成された元となる特徴点配置同士が一致しているかどうかを判定する。
そして、対応特徴点検出部204は、この一致しているかどうかの判定結果を利用して、検索画像の特徴点に対応する特徴点(以下、対応特徴点と記す。)が登録画像のどこにあるか(すなわち、検索画像の特徴点が登録画像から抽出された特徴点のどれであるか)を検出する。この判定は、登録画像特徴量生成部R203で生成された特徴量と検索画像特徴量生成部Q203で生成された特徴量のすべての組み合わせに対して行われるのが一例である。また、全ての特徴量の組合せに対して検出処理を行うのではなく、各特徴点に適切な索引を付与することで、検出処理を高速化してもよい。
対応領域判定部205は、対応特徴点検出部204にて検出された一致する特徴点配置を利用して、検索画像が登録画像中のどこに含まれているかを判定する。具体的には、対応領域判定部205は、対応特徴点により特定される登録画像中の部分領域を抽出する。
なお、対応特徴点検出部204および対応領域判定部205の詳細な動作については、後述される。
登録画像特徴点生成部R201と、登録画像特徴点配置生成部R202と、登録画像特徴量生成部R203と、検索画像特徴点生成部Q201と、検索画像特徴点配置生成部Q202と、検索画像特徴量生成部Q203と、対応特徴点検出部204と、対応領域判定部205とは、プログラム(画像部分領域抽出用プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、画像部分領域抽出装置の記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、登録画像特徴点生成部R201、登録画像特徴点配置生成部R202、登録画像特徴量生成部R203、検索画像特徴点生成部Q201、検索画像特徴点配置生成部Q202、検索画像特徴量生成部Q203、対応特徴点検出部204および対応領域判定部205として動作してもよい。
また、登録画像特徴点生成部R201と、登録画像特徴点配置生成部R202と、登録画像特徴量生成部R203と、検索画像特徴点生成部Q201と、検索画像特徴点配置生成部Q202と、検索画像特徴量生成部Q203と、対応特徴点検出部204と、対応領域判定部205とは、それぞれが専用のハードウェアで実現されていてもよい。
また、本実施形態では、画像部分領域抽出装置で特徴量を算出する構成を例示しているが、他の装置で算出された登録画像の特徴量および検索画像の特徴量を画像部分領域抽出装置の対応特徴点検出部204が受信する構成であってもよい。この場合、画像部分領域抽出装置は、対応特徴点検出部204および対応領域判定部205を備えていればよい。また、予め算出した登録画像の特徴量を、画像部分領域抽出装置の記憶部(図示せず)に記憶しておいてもよい。
次に、本実施形態の動作を説明する。ここでは、画像部分領域抽出装置が行う処理を登録処理と検索処理の大きく2つに分けて説明する。
「登録処理」
図3は、登録処理の動作例を示すフローチャートである。登録処理は、検索処理に先立って行われる処理であり、検索処理に必要な特徴量のデータを生成する処理である。図3を参照すると、登録処理は、登録画像特徴点生成処理(ステップSR201)、登録画像特徴点配置生成処理(ステップSR202)、登録画像特徴量生成処理(ステップSR203)から構成される。
まず、登録画像特徴点生成部R201は、登録画像から特徴点を抽出する(ステップSR201)。次に、登録画像特徴点配置生成部R202は、登録画像特徴点生成部R201が生成した特徴点をもとに1つ以上の特徴点配置を生成する(ステップSR202)。そして、登録画像特徴量生成部R203は、登録画像特徴点配置生成部R202が生成した1つ以上の特徴点配置それぞれの特徴量を計算する(ステップSR203)。
「検索処理」
図4は、本実施形態の検索処理の動作例を示すフローチャートである。検索処理は、検索画像から特徴量を計算し、その特徴量を登録画像から計算された特徴量と比較することにより、登録画像中から検索画像に相当する部分を判定する処理である。図4を参照すると、検索処理は、検索画像特徴点生成処理(ステップSQ201)、検索画像特徴点配置生成処理(ステップSQ202)、検索画像特徴量生成処理(ステップSQ203)、対応特徴点検出処理(ステップSQ204)、対応領域決定処理(ステップSQ205)から構成される。
まず、検索画像特徴点生成部Q201は、検索画像から特徴点を抽出する(ステップSQ201)。次に、検索画像特徴点配置生成部Q202は、検索画像特徴点生成部Q201が生成した特徴点をもとに1つ以上の特徴点配置を生成する(ステップSQ202)。そして、検索画像特徴量生成部Q203は、検索画像特徴点配置生成部Q202が生成した1つ以上の特徴点配置それぞれの特徴量を計算する(ステップSQ203)。
次に、対応特徴点検出部204は、対応特徴点を検出する(ステップSQ204)。具体的には、対応特徴点検出部204は、検索画像中の特徴点に対応する登録画像中の特徴点を検出する。以下、図5を参照し、対応特徴点を検出する処理を詳述する。図5は、対応特徴点を検出するステップSQ204の動作例を示すフローチャートである。
図5を参照すると、対応特徴点を検出する処理は、特徴量比較処理(ステップSQ2041)、特徴量一致判定処理(ステップSQ2042)、特徴点一致回数カウント処理(ステップSQ2043)から構成される。登録画像特徴量生成部R203が生成した特徴量(以下、登録画像特徴量と呼ぶ。)と検索画像特徴量生成部Q203が生成した特徴量(以下、検索画像特徴量と呼ぶ。)のすべての組み合わせについて、以下に述べるステップSQ204の処理が個別に行われる。
ステップSQ204では、まず、対応特徴点検出部204は、登録画像特徴量と検索画像特徴量の組み合わせを比較する。対応特徴点検出部204は、例えば、2乗距離、市街地距離、ベクトル内積などの既知の方法で、登録画像特徴量と検索画像特徴量の距離を求めてもよい(ステップSQ2041)。また、対応特徴点検出部204は、以下に示す方法で登録画像特徴量と検索画像特徴量の距離を求めてもよい。この距離が近いほど、両特徴量の一致度合いが高いと言える。
まず、対応特徴点検出部204は、比較する特徴量を表す対応する要素(例えば、ベクトルの要素)ごとに差分を算出し、差分の絶対値が予め定められた範囲内にある場合には、距離に1を加算し、差分の絶対値が予め定められた範囲内にない場合には、0を加算する。対応特徴点検出部204は、すべての要素についてこれらの処理を繰り返すことで距離を算出する。この場合、算出される値が大きいほど距離が近く、より両特徴量の一致度合いが高いと言える。
対応特徴点検出部204は、上述した方法を複数組み合わせて、登録画像特徴量と検索画像特徴量の距離を算出してもよい。例えば、不変量特徴量と面積比特徴量をあわせて用いる場合、対応特徴点検出部204は、不変量特徴量については2乗距離を計算し、面積比特徴量については要素ごとに差分を取る方法で距離を計算してもよい。
次に、対応特徴点検出部204は、登録画像特徴量と検索画像特徴量が一致しているかどうかを判定する(ステップSQ2042)。すなわち、対応特徴点検出部204は、登録画像特徴量と検索画像特徴量の一致度合いを比較する。登録画像特徴量と検索画像特徴量が一致すると判定された場合(ステップSQ2042における「一致」)、ステップSQ2043の処理が行われ、登録画像特徴量と検索画像特徴量が一致しないと判定された場合(ステップSQ2042における「不一致」)、ステップSQ2043の処理が省略される。
対応特徴点検出部204は、例えば、ステップSQ2041にて計算された距離が予め定められた閾値未満、または閾値以下の値の場合に、特徴量が一致すると判定してもよい。また、特徴量が複数の種類の特徴量から算出されている場合、対応特徴点検出部204は、少なくとも1つまたは予め指定された種類数の特徴量が一致したときに特徴量全体が一致していると判定してもよいし、すべての種類の特徴量が一致したときに特徴量全体が一致していると判定してもよい。
次に、対応特徴点検出部204は、一致した特徴点の一致回数を加算する(ステップSQ2043)。対応特徴点検出部204は、特徴量を求める元となった特徴点配置中の特徴点ごとに一致回数を加算してもよい。また、対応特徴点検出部204は、登録画像特徴量を求める元となった特徴点配置を生成した際の注目特徴点ごとに一致回数を加算してもよい。なお、特徴点の一致回数の初期値は、初期化処理で0に設定しておくこととする。以下の説明では、特徴量を求める元となった特徴点配置中の特徴点ごとに一致回数が加算されるものとする。なお、特徴点は、複数の特徴点配置によって共有されることから、特徴点の一致回数は複数加算されることになる。
次に、対応領域判定部205は、対応領域を決定する(ステップSQ205)。具体的には、対応領域判定部205は、検索画像に対応する登録画像中の領域を対応領域として決定する。以下、図6を参照し、対応領域を決定する処理を詳述する。図6は、対応領域を決定するステップSQ205の動作例を示すフローチャートである。
図6を参照すると、対応領域を決定する処理は、連結対象ノード抽出処理(ステップSQ2051)、特徴点連結処理(ステップSQ2052)、連結グラフ検出処理(ステップSQ2053)、出力領域決定処理(ステップSQ2054)から構成される。
対応領域判定部205は、予め定められた一定以上の一致回数を持つ特徴点を連結対象ノードとして登録画像から抽出する(ステップSQ2051)。ここで、ノードとは、グラフ理論で用いられる用語である。本実施形態では、特徴点がノードとみなされる。また、対応領域判定部205が抽出する連結対象ノードは、対応特徴点の中でも検索画像中の特徴点との一致度合いがより高い特徴点であるといえる。そのため、対応領域判定部205は、対応特徴点のうち、検索画像中の特徴点との一致度合いがより高い対応特徴点を連結対象ノードとして抽出していると言うことができる。
図7は、連結対象ノードの例を示す説明図である。図7に示す例では、黒丸の部分が連結対象ノードを示し、白丸の部分が非連結対象ノードを示す。ここで、非連結対象ノードとは、特徴点(ノード)のうち、連結対象ノードと判定されなかったノードを示す。
次に、対応領域判定部205は、連結対象ノードの間の距離が互いに近い場合に、それらの連結対象ノード間にエッジを付加する(ステップSQ2052)。ここで、エッジとは、グラフ理論で用いられる用語であり、ノード間を結ぶ線のことを意味する。また、以下の説明では、このエッジのことをグラフと称することもある。
対応領域判定部205は、連結対象ノード間の距離が予め定められた閾値よりも小さい場合に、その連結対象ノード間にエッジを付加してもよい。また、対応領域判定部205は、各連結対象ノードが含まれる連結領域の距離が予め定められた閾値よりも小さい場合に、その連結対象ノード間にエッジを付加してもよい。ここで、連結領域C1に属する画素をp1とし、連結領域C2に属する画素をp2としたとき、連結領域C1と連結領域C2の距離dist(p1,p2)は、例えば、以下に示す式1で算出される。なお、p1およびp2は、各連結領域から任意に選択される画素である。
Figure 2014061222
図8は、ノード連結処理によって連結対象ノード間に付加されたエッジの例を示す説明図である。図8に例示するエッジは、図7に例示する連結対象ノード間を結ぶようにそれぞれ付加されている。
次に、対応領域判定部205は、ステップSQ2052で生成されたグラフの中から、連結グラフを1つ以上検出する(ステップSQ2053)。ここで、連結グラフとは、互いにエッジで接続された一続きのノードとエッジの組み合わせを意味する。なお、グラフ理論において既知の方法である深さ優先探索を行うことにより、1つ以上の連結グラフが検出されることが知られている。そこで、対応領域判定部205は、深さ優先探索を行うことで、連結グラフを検出してもよい。図8に示す例では、2つの連結グラフが検出される。
次に、対応領域判定部205は、ステップSQ2053で検出された連結グラフから、出力する領域を決定する(ステップSQ2054)。例えば、連結グラフG(kは1以上の整数)内のノードj(jは整数)を含む連結領域の外接矩形の四隅座標を(xmin_j(k),ymin_j(k))、(xmax_j(k),ymin_j(k))、(xmin_j(k),ymax_j(k))、(xmax_j(k),ymax_j(k))とする。このとき、対応領域判定部205は、出力する領域を(xmin_min(k),ymin_min(k))および(xmax_max(k),ymax_max(k))を対角の頂点とする矩形領域と決定すればよい。ここで、頂点の座標は、以下の条件を満たす。
Figure 2014061222
図9は、出力領域の例を示す説明図である。図9に例示する点線の矩形は、各連結領域の外接矩形を示している。また、図9に例示する破線の矩形は、図8に例示する2つの連結グラフから決定された2つの出力領域を示している。
なお、上記説明では、連結領域に外接する領域を、四隅の座標で特定可能な矩形で表わす場合を例示した。他にも連結領域に外接する領域を、ノードjを中心とした半径r(rは0以上の実数)の円で表わすことも可能である。なお、r=0の場合、上述の説明において、xmin_j(k)=xmax_j(k)かつymin_j(k)ymax_j(k)と同義である。
また、対応領域判定部205が出力領域を決定する方法は、上記方法に限定されない。対応領域判定部205は、連結グラフに属する各ノードを含む連結領域の外接矩形領域の和領域、または、ノードjを中心とした半径r(rは0以上の実数)の円領域の和領域を出力領域としてもよい。
また、複数の出力領域が得られる場合、対応領域判定部205は、各出力領域の確からしさを示す指標を利用して出力領域を決定してもよい。出力領域の確からしさを示す指標として、例えば、出力領域の面積、出力領域に含まれる連結対象ノード数、出力領域に含まれる特徴点数、出力領域中の特徴点(または連結対象ノード)の特徴点一致回数の最大値、出力領域中の特徴点(または連結対象ノード)の特徴点一致回数の総和などが挙げられる。複数の出力領域が得られる場合、対応領域判定部205は、これらの指標がより大きい(多い)ほどより確からしいと判断し、これらの指標に基づいてより確からしい出力領域を選択してもよい。
このように、対応領域判定部205は、エッジにより結ばれる連結対象ノードを特定することによって連結領域を特定し、その連結領域から導かれる領域を登録画像中の部分領域として抽出することになる。
以上のように、本実施形態によれば、対応特徴点検出部204が、登録画像特徴量と検索画像特徴量との一致度合いを比較して対応特徴点を検出し、対応領域判定部205が、検出された対応特徴点のうち、検索画像中の特徴点との一致度合いがより高い対応特徴点により特定される登録画像中の部分領域を抽出する。よって、解像度や撮影角度が登録画像と異なる検索画像を用いても、その検索画像に対応する部分領域を登録画像から抽出できる。
具体的には、対応特徴点検出部204が、検索画像特徴量と登録画像特徴量とが一致すると判断された場合に、検索画像特徴量を算出する元になった特徴点配置中の特徴点と一致する一致回数を対応特徴点ごとに算出し、対応領域判定部205が、一致回数が予め定めた回数以上の対応特徴点を連結対象ノードとし、その連結対象ノードにより特定される登録画像中の部分領域を抽出すればよい。
すなわち、本実施形態では、登録画像と検索画像のそれぞれに対して連結領域の重心から特徴点配置が求められる。また、特徴点およびその特徴点に対応する連結領域の配置から幾何学的変換に不変な特徴量を計算し、登録画像特徴量と検索画像特徴量とを比較する。これにより、登録画像内で検索画像に対応する特徴点が検出され、それら特徴点の情報を統合して出力領域が求められる。
よって、注目窓を設定することなく検索画像に相当する領域を登録画像中から求めることができるので、登録画像と検索画像の間に大きさや撮影角度のバリエーションがあっても、部分的な領域の画像照合が可能になる。
なお、図10は、本実施形態の画像部分領域抽出装置を実現可能な情報処理システムの構成例を示すブロック図である。図10に例示する情報処理システム1は、例えばCPUなどに代表される演算装置6(以下、単にCPU6と呼ぶ。)と、記憶媒体7とから構成されている。また、情報処理システム1は、入出力インターフェイス8や表示デバイス9を備えていても良い。
CPU6は、上述する各種手段を実装した各種ソフトウェア・プログラム(コンピュータ・プログラム)を実行することにより、情報処理システム1の全体的な動作を司る。
記憶媒体7は、各種ソフトウェア・プログラムとその実行に必要なデータを格納するための記憶媒体である。
入出力インターフェイス8は、情報処理システム1の外部とデータ通信を行う際に用いられる。通信されるデータの例としては、情報処理システム1外部で生成された特徴点配置データや、照合結果出力データが挙げられるが、これらに限られない。
入出力インターフェイス8は、少なくともCPU6との通信ができればよく、例えば、外部からの信号を伝達できる通信線を接続するコネクタや、無線信号を受信する機器などが用いられる。または、情報処理システム1の内部の信号伝達経路の一部をそのまま入出力インターフェイス8として用いてもよい。また、入出力インターフェイス8の別の一例として、表示デバイス9またはスピーカ(図示せず)等のユーザインターフェース機器がある。
表示デバイス9は、情報処理システム1が実行する画像照合の結果を表示するためのデバイスであり、例えばディスプレイ装置である。図10には、表示デバイス9を記載しているが、画像部分領域抽出装置に必ずしも必須の構成要素ではない。
実施形態2.
次に、本発明による画像部分領域抽出装置の第2の実施形態を説明する。図11は、本発明による画像部分領域抽出装置の第2の実施形態の構成例を示すブロック図である。本実施形態の画像部分領域抽出装置は、登録画像特徴点生成部R201と、登録画像特徴点配置生成部R202と、登録画像特徴量生成部R203と、検索画像特徴点生成部Q201と、検索画像特徴点配置生成部Q202と、検索画像特徴量生成部Q203と、対応特徴点対検出部304と、対応領域推定部305とを備えている。
すなわち、本実施形態の画像部分領域抽出装置は、対応特徴点検出部204および対応領域判定部205の代わりに、対応特徴点対検出部304および対応領域推定部305を備えている点において、第1の実施形態の画像部分領域抽出装置と異なる。本実施形態の説明では、第1の実施形態と異なる点を中心に説明する。
対応特徴点対検出部304は、対応特徴点検出部204が持つ機能に加えて、一致すると判定された検索画像中の特徴点と登録画像中の特徴点の組み合わせ(ペア)を記憶媒体(図示せず)に格納する機能を有する。以下、一致すると判定された検索画像中の特徴点と登録画像中の特徴点の組み合わせのことを、特徴点一致履歴と記す。
対応領域推定部305は、対応領域判定部205が持つ機能に加え、対応特徴点対検出部304にて検出された一致する特徴点配置から幾何変換パラメータ(ホモグラフィ行列、アフィン変換パラメータなど)を推定し、推定された幾何変換パラメータと検索画像のサイズとから対応領域を推定する。
なお、登録画像特徴点生成部R201と、登録画像特徴点配置生成部R202と、登録画像特徴量生成部R203と、検索画像特徴点生成部Q201と、検索画像特徴点配置生成部Q202と、検索画像特徴量生成部Q203と、対応特徴点対検出部304と、対応領域推定部305とは、プログラム(画像部分領域抽出用プログラム)に従って動作するコンピュータのCPUによって実現される。
また、第1の実施形態と同様、登録画像特徴点生成部R201と、登録画像特徴点配置生成部R202と、登録画像特徴量生成部R203と、検索画像特徴点生成部Q201と、検索画像特徴点配置生成部Q202と、検索画像特徴量生成部Q203と、対応特徴点対検出部304と、対応領域推定部305とは、それぞれが専用のハードウェアで実現されていてもよい。
次に、本実施形態の画像部分領域抽出装置の動作を説明する。本実施形態の画像部分領域抽出装置が行う処理も、登録処理と検索処理の大きく2つに分けられるが、登録処理は第1の実施形態と同様のため、検索処理について説明する。
図12は、本実施形態の検索処理の動作例を示すフローチャートである。図12を参照すると、本実施形態では、対応特徴点検出処理SQ204が対応特徴点対検出処理SQ304に置き換わり、対応領域決定処理SQ205が対応領域推定処理SQ305に置き換わっている点において、第1の実施形態と異なる。
図13は、対応特徴点対を検出するステップSQ304の動作例を示すフローチャートである。図13を参照すると、ステップSQ304が第1の実施形態のステップSQ204と異なっているのは、特徴点一致回数カウント処理SQ2043の後に、特徴点一致履歴格納処理SQ3043が追加されている点である。
対応特徴点対検出部304は、ステップSQ2042で特徴量が一致したと判定された場合に、一致した各特徴量を示す特徴点を用いて特徴点一致履歴を生成する(ステップSQ3043)。対応特徴点対検出部304は、このとき、特徴量を求める元となった特徴点配置の各特徴点が一致したと判断してもよい。そして、対応特徴点対検出部304は、登録画像特徴量を求める元になった特徴点配置に含まれる特徴点と、検索画像特徴量を求める元になった特徴点配置に含まれる特徴点について、対応する各特徴点を対にした特徴点一致履歴を生成してもよい。
図14は、特徴点一致履歴を生成する例を示す説明図である。図14に示す例では、R1、R2、R3、R4、R5、R6の順に順序付けられている特徴点の特徴点配置が登録画像中に存在し、Q1、Q2、Q3、Q4、Q5、Q6の順に順序付けられている特徴点の特徴点配置が検索画像中に存在しているものとする。ここで、両特徴点配置が一致したと判定された場合、対応特徴点対検出部304は、R1とQ1、R2とQ2、R3とQ3、R4とQ4、R5とQ5、R6とQ6をそれぞれ特徴点対として検出して、特徴点一致履歴を生成してもよい。
また、対応特徴点対検出部304は、登録画像特徴量を求める元となった特徴点配置を生成した際の注目特徴点が一致したと判断してもよい。このとき、対応特徴点対検出部304は、登録画像特徴量を求める元となった特徴点配置に含まれる注目特徴点と、検索画像特徴量を求める元となった特徴点配置に含まれる注目特徴点を対にした特徴点一致履歴を生成してもよい。
以下の説明では、対応特徴点対検出部304が特徴量を求める元となった特徴点配置の各特徴点が一致したと判断して特徴点一致履歴を生成する場合を例に説明する。
図15は、対応領域を推定するステップSQ305の動作例を示すフローチャートである。図15を参照すると、ステップSQ305が第1の実施形態のステップSQ205と異なっているのは、出力領域決定処理SQ2054が出力領域推定処理SQ3054に置き換わっている点である。
図16は、出力領域を推定するステップSQ3054の動作例を示すフローチャートである。図16を参照すると、まず、対応領域推定部305は、後述する条件を満たす特徴点対を特徴点一致履歴から複数選択する(ステップSQ30541)。幾何変換パラメータとしてホモグラフィ行列を採用する場合、対応領域推定部305は、特徴点対を4対以上選択すればよく、アフィン変換パラメータを採用する場合は、特徴点対を3対以上選択すればよい。ここでは、幾何変換パラメータとしてホモグラフィ行列を採用し、選択する特徴点対の数を4とする。特徴点を選択する際に満たすべき条件は、以下の条件である。
・特徴点対として選択される特徴点は、それぞれ同一の連結グラフに属している。
・同一の連結グラフにそれぞれ属する特徴点対が5対以上ある場合は、ランダムに4対を選択する。
次に、対応領域推定部305は、幾何変換パラメータを計算する(ステップSQ30542)。ホモグラフィ行列Hは、登録画像の位置(xr,yr)と検索画像の位置(xq,yq)との間の関係を表す3×3行列であり、具体的には以下に示す式2を満たす。
Figure 2014061222
上記に示す式2において、αは、(xr,yr)と(xq,yq)の値に応じて定まる定数である。選択された4つの特徴点対の各特徴点の座標を利用すれば、連立方程式を解くことにより、ホモグラフィ行列が求められる。5つ以上の特徴点対が選択された場合は、最小二乗法などによりホモグラフィ行列を求めることができる。
次に、対応領域推定部305は、幾何変換パラメータの評価値を計算する(ステップSQ30543)。対応領域推定部305は、例えば、検索画像のすべての特徴点をホモグラフィ行列により登録画像に投影する。そして、対応領域推定部305は、投影された特徴点の中で予め定められた値よりも小さい、またはその値以下の距離の中に登録画像から計算された特徴点が存在するかを検出し、検出された特徴点の個数を評価値としてもよい。
また、対応領域推定部305は、検索画像から求められるすべての連結領域またはその外接矩形領域を投影し、投影された位置に存在する登録画像中の部分画像と比較してもよい。このとき、対応領域推定部305は、一致するか否かを既知の方法で判定し、一致した領域の数を評価値としてもよい。
対応領域推定部305は、例えば、特徴量を検出した後で距離の計算等を行い、その距離が一定の値よりも小さいまたは一定の値以下の場合に一致すると判定してもよい。また、対応領域推定部305は、正規化相関を用いて一致するか否かを判定してもよい。以上のことからも、このように算出される評価値は、用いられる幾何変換パラメータの確からしさを示していると言える。
次に、対応領域推定部305は、計算された評価値がこれまでに計算された評価値の中で最大か否かを、過去の計算履歴をもとに判定する(ステップSQ30544)。計算された評価値が過去の最大値を上回っている場合(ステップS30544におけるYes)、対応領域推定部305は、評価値の最大値を置き換えた上でホモグラフィ行列の値を保持する(ステップSQ30545)。一方、計算された評価値が過去の最大値を上回っていない場合(ステップSQ30544におけるNo)、ステップSQ30546の処理に進む。
次に、対応領域推定部305は、評価値の計算を終了するか否かを判定する(ステップSQ30546)。対応領域推定部305は、評価値の計算回数が予め定められた回数を超えた場合に、評価値の計算を終了すると判定してもよい。また、対応領域推定部305は、評価値が予め定められた値を上回ったまたは予め定められた値以上の場合に、評価値の計算を終了すると判定してもよい。ただし、評価値の計算を終了するか否かを判定する方法は、これらの方法に限定されない。このように算出された評価値は、評価値の計算を行う条件のもとに、幾何変換パラメータが検索画像を登録画像に変換する確からしさが最も高いものと言える。
評価値の計算を終了しないと判定した場合(ステップSQ30546におけるNo)、ステップSQ30541以降の処理が繰り返される。一方、評価値の計算を終了すると判定した場合(ステップSQ30546におけるYes)、対応領域推定部305は、検索画像に相当する登録画像中の位置を推定し、出力領域とする(ステップSQ50547)。すなわち、対応領域推定部305は、算出したホモグラフィ行列に基づいて検索画像の領域を登録画像に投影した領域を部分領域として抽出する。具体的には、対応領域推定部305は、評価値が最大になったホモグラフィ行列の値を用いて、検索画像の領域を登録画像中に投影する。例えば、検索画像が長方形の場合は、検索画像の四隅座標をホモグラフィ行列で投影し、投影された4点で決定される四角形が出力領域になる。
以上のように、本実施形態によれば、対応特徴点対検出部304が、検索画像特徴量と登録画像特徴量とが一致すると判断された場合に、一致した各特徴量の特徴点を用いて特徴点一致履歴を生成する。そして、対応領域推定部305が、特徴点一致履歴を用いて幾何変換パラメータ(ホモグラフィ行列)を算出し、算出したパラメータに基づいて検索画像の領域を登録画像に投影した領域を部分領域として抽出する。
すなわち、本実施形態では、推定されたホモグラフィ行列と検索画像の領域を利用して出力領域を求めるように構成されている。よって、第1の実施形態の効果に加え、特徴点一致判定に漏れが多い場合でも、検索画像に相当する大きさの出力領域を安定的に得ることができる。
なお、第1の実施形態および第2の実施形態では、説明の都合上、検索画像と照合する登録画像が決まっている(すなわち登録画像が1枚である)場合を例に説明したが、登録画像が複数枚存在する場合も、容易に拡張が可能である。
例えば、登録画像が複数枚存在する場合、対応領域判定部205は、各登録画像について出力領域を決定し、各出力領域の確からしさを示す指標が最も大きい登録画像をもとに決定した部分領域を選択してもよい。
また、上述した画像部分領域抽出装置の構成や動作は、実施方法の一例を示したものであり、発明の原理を損なわない範囲で、構成や動作の順序を変更することが可能である。また、登録処理と検索処理のすべてを必ずしも同一の装置で行う必要はない。例えば、装置Aで一部の処理を行い、装置Bが装置Aの出力結果を入出力インターフェイスを介して受信し、その後の処理を装置Bで行うように構成することも可能である。
以下、具体的な実施形態により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。ここでは、上述した画像部分領域抽出装置を、情報処理装置に応用する第3の実施形態について説明する。以下に説明する情報処理装置は、予め登録された画像(登録画像)中の部分領域ごとに、対象とする装置に実行させる情報処理を表す情報(以下、アクション情報と記す。)を定義しておき、その部分領域に対応する画像を受けとると、その部分領域に対応する情報処理を実行させるものである。なお、以下の説明では、受け取る画像のことを検索画像と記すこともある。また、対象とする装置は、情報処理装置そのものであってもよく、情報処理装置とは異なる他の装置であってもよい。
図17は、部分領域を抽出して各種情報処理を行う情報処理装置の例を示すブロック図である。本実施形態の情報処理装置は、画像照合部41と、アクション情報判定部42と、アクション情報実行部43とを備えている。なお、情報処理装置は、中間情報記憶部44を備えていてもよい。
中間情報記憶部44は、登録画像中の部分領域を特定する情報(以下、部分領域情報と記す。)と、対象とする装置に実行させる情報処理を表す情報(アクション情報)とを対応付けた情報を記憶する。以下、部分領域情報とアクション情報とを対応付けた情報を中間情報と記すこともある。すなわち、中間情報とは、予め定められた部分領域に関する情報とアクション情報とを関連付けた情報ということもできる。
例えば、部分領域を長方形領域とする場合、部分領域情報には、長方形領域を特定する四隅座標が設定される。また、登録画像を等分割で分割する際の水平方向ブロック幅および垂直方向ブロック幅を部分領域情報として用いてもよい。さらに、登録画像を等分割する際の水平方向ブロック数および垂直方向ブロック数を部分領域情報として用いてもよい。他にも、画像の水平解像度、垂直解像度、分割ブロック数等を部分領域情報として用いることができるが、部分領域情報の内容は、これらの内容に限定されない。
また、アクション情報には、対象とする装置が実行する情報処理を識別できる内容であれば、任意の情報を用いることができる。例えば、対象とする装置に録画予約の機能を実行させる場合、アクション情報には、「録画予約の機能を実行」という情報処理の内容そのものの情報を設定してもよく、「録画予約の機能を実行するための実行ボタンを表示する」といった具体的な機能を示す情報を設定してもよい。
以下、アクション情報の具体例を説明する。ブラウザ表示を実行させる場合、アクション情報には、表示するURLを設定することが考えられる。また、動画や静止画、音声などを出力する処理を実行させる場合、アクション情報には、情報処理装置内部に記憶されたファイル名(動画、静止画、音声を保存するファイル名)を設定することが考えられる。また、アクション情報には、情報処理装置内又は情報処理装置外に存在するアプリケーションの操作や、実行コマンドなどを設定してもよい。
例えば、アクション情報にファイル名が指定された場合、後述するアクション情報実行部43は、拡張子の種類に基づいて使用するアプリケーションを実行してもよい。また、実行するアプリケーションをXMLタグと対応付け、XMLタグとファイル名とを明示的に組み合わせたものをアクション情報としてもよい。
例えば、アクション情報に「<app1> filename.xxx </app1> 」と設定した場合、<app1>に対応付けられたアプリケーションを用いて“filename.xxx”を開く、というアクションを実行できる。同様に、<phone> を電話をかけるアプリケーションと関連付けておけば、例えばアクション情報に「<phone> xx-xxxx-xxxx </phone> 」と設定することで、電話番号“xx-xxxx-xxxx”に電話をかける、というアクションを指定することができる。同様に、<email> をメール作成用アプリケーションと関連付けておけば、例えばアクション情報に「<email> xxx@xxx.xxx.xx </email> 」という形式で電子メールアドレスを設定しておくことで、電子メールを作成するアプリケーションを実行できる。さらに、この場合、宛先フィールドへ宛先メールアドレス(xxx@xxx.xxx.xx)を自動入力するアクションを実行することもできる。
なお、一つの部分領域情報に関連付けられるアクション情報は複数あってもよい。また、一つのアクション情報は、複数の部分領域情報から関連付けられていてもよい。
また、アクション情報には、アクション情報実行部43が情報処理を実行させるための条件を設定しておいてもよい。例えば、処理を実行させる対象の装置が所定の場所(例えば、店舗内など)に存在するときに限って情報処理を実行させることを示す条件をアクション情報に設定してもよい。
中間情報記憶部44は、例えば、磁気ディスク等により実現される。また、情報処理装置自身が、中間情報記憶部44を備えていてもよい。
画像照合部41は、登録画像中から検索画像に相当する部分的な領域を検出する。すなわち、画像照合部41は、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の部分領域を検出する。画像照合部41は、部分領域を1つのみ検出してもよく、複数の部分領域を検出してもよい。
画像照合部41は、第1の実施形態または第2の実施形態で説明した画像部分領域抽出装置を用いて、検索画像に対応する登録画像中の部分領域を検出してもよい。すなわち、画像照合部41は、登録画像特徴量と検索画像特徴量との一致度合いを比較して対応特徴点を検出し、検出された対応特徴点のうち、検索画像中の特徴点との一致度合いがより高い対応特徴点により特定される登録画像中の部分領域を抽出してもよい。
ただし、本実施形態では、画像照合部41は、検索画像に対応する登録画像中の部分領域を、第1の実施形態または第2の実施形態で説明した方法以外を用いて検出してもよい。ただし、第1の実施形態または第2の実施形態で説明した方法を用いる方が、解像度や撮影角度が登録画像と異なる検索画像を用いても、その検索画像に対応する部分領域を登録画像から抽出できるため、より好ましい。
以下の説明では、画像照合部41が、第1の実施形態の画像部分領域抽出装置が部分領域を抽出する方法を用いるものとする。具体的には、画像照合部41は、登録画像特徴量と検索画像特徴量とが一致する場合に対応特徴点の回数を算出して、登録画像から連結対象ノードを抽出する。そして、画像照合部41は、連結対象ノードから連結グラフを生成し、連結グラフ内のノードj(jは整数)を含む連結領域の外接矩形の四隅座標を(xmin_j(k),ymin_j(k))、(xmax_j(k),ymin_j(k))、(xmin_j(k),ymax_j(k))、(xmax_j(k),ymax_j(k))とする。このとき、画像照合部41は、出力する領域を(xmin_min(k),ymin_min(k))および(xmax_max(k),ymax_max(k))を対角の頂点とする矩形領域を出力する。なお、Kmaxを部分領域の個数としたとき、kは1≦k≦Kmaxを満たす整数である。
上述した通り、部分領域を抽出する方法は、第1の実施形態または第2の実施形態の画像部分領域抽出装置が部分領域を抽出する方法に限定されない。画像照合部41は、例えば既知の文書画像レイアウト解析等により自動的に部分領域を指定してもよい。
アクション情報判定部42は、画像照合部41が照合結果として出力した情報と、中間情報(すなわち、部分領域情報及びアクション情報)を利用して、情報処理装置がどのような情報処理を行うかを判定する。具体的には、アクション情報判定部42は、部分領域情報により特定される部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、その部分領域に対応するアクション情報を特定する。なお、アクション情報を特定する処理の詳細は、後述される。
アクション情報実行部43は、アクション情報判定部42によって特定されたアクション情報を実行する。具体的には、アクション情報実行部43は、特定されたアクション情報に応じた処理内容を、対象とする装置に実行させる。
なお、画像照合部41と、アクション情報判定部42と、アクション情報実行部43とはプログラム(情報処理実行プログラム)に従って動作するコンピュータのCPUによって実現されてもよい。また、画像照合部41と、アクション情報判定部42と、アクション情報実行部43とは、それぞれが専用のハードウェアで実現されていてもよい。
次に、本実施形態の動作を説明する。図18は、本実施形態の情報処理装置の動作例を示すフローチャートである。図18を参照すると、本実施形態の情報処理装置の動作は、画像照合処理(ステップS41)、アクション情報判定処理(ステップS42)、アクション情報実行処理(ステップS43)から構成される。
まず、画像照合部41は、検索画像に対応する登録画像中の部分領域を検出する(ステップS41)。画像照合部41は、例えば、第1の実施形態または第2の実施形態の画像部分領域抽出装置が行う処理を流用することができる。
次に、アクション情報判定部42は、アクション情報の判定を行う(ステップS42)。図19は、アクション情報を判定する動作例を示すフローチャートである。アクション情報を判定する処理は、領域一致スコア計算処理(ステップS421)と、最大領域一致スコアが算出された部分領域を特定する部分領域特定処理(ステップS422)とから構成される。
ここで、領域一致スコアとは、中間情報の部分領域情報により特定される部分領域(以下、中間情報部分領域と記すこともある。)と、画像照合部41が検出した領域(以下、画像照合部分領域と記す。)との一致度合いを示す。
まず、アクション情報判定部42は、画像照合部41から入力される部分領域(画像照合部分領域)と、中間情報により特定される部分領域(中間情報部分領域)のすべての組み合わせについて、領域一致スコアを計算する(ステップS421)。
例えば、画像照合部分領域k(1≦k≦Kmax:ただし、Kmaxは、画像照合部分領域の数)と、中間情報部分領域c(1≦c≦Cmax:ただし、Cmaxは、中間情報により特定される部分領域の数)の領域一致度をreg_match(k,c)とすると、領域一致度は、例えば、以下に示す式3で定義される。
reg_match(k,c)
=((画像照合部分領域kと中間情報部分領域cの共通部分の面積)/
(画像照合部分領域kと中間情報部分領域cの和領域の面積)) (式3)
次に、アクション情報判定部42は、reg_match(k,c)が最大になるkとcの値を求める(ステップS422)。このためには、すべてのkとcの組み合わせに関して算出したreg_match(k,c)の値を記憶媒体(図示せず)に保持しておけばよい。reg_match(k,c)が最大になるkとcの値を、それぞれka、caとする。すなわち、アクション情報判定部42は、中間情報部分領域cのうち、画像照合部分領域kとの一致度合いが最も高いものを選択する。
次に、アクション情報実行部43は、中間情報部分領域caに対応するアクション情報によって表わされる情報処理を実行する(ステップS43)。アクション情報実行部43は、アクション情報に従って、例えば、次のような情報処理を行う。
例えば、アクション情報にURLが設定されている場合、アクション情報実行部43は、情報処理装置の内部もしくは外部にインストールされたブラウザ等のソフトウェアを起動し、指定されたURLに存在するコンテンツを呼び出してもよい。
また、例えば、アクション情報に情報処理装置内部または外部のファイル名(動画ファイル、静止画ファイル、音声ファイル、テキストファイルなど)が設定されている場合、アクション情報実行部43は、必要に応じて各種ブラウザ、ビューア等を起動し、適切なソフトウェアを起動し、設定されたファイルを呼び出してもよい。
また、情報処理装置がユーザインターフェース機器を備えている場合、アクション情報実行部43が、その機器を利用して画像を表示したり、音声を出力したりすることも可能である。画像の表示処理や音声の出力処理等をする場合、画像や音声の種類だけでなく、それらの処理範囲を指定する情報(例えば、画像の表示範囲、音声の再生・終了位置など)が関連付けられていれば、アクション情報実行部43は、指定された情報に応じた情報処理を行ってもよい。
また、例えば、アクション情報に情報処理装置内または情報処理装置外に存在するアプリケーションの操作コマンドまたは実行コマンドが設定されている場合、アクション情報実行部43は、その操作コマンドまたは実行コマンドを実行してもよい。
また、アクション情報に情報処理を実行させるための条件が設定されている場合、アクション情報実行部43は、設定された条件を満たしている時に対象の装置に情報処理を実行させてもよい。
以上のように、本実施形態によれば、画像照合部41が、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する。アクション情報判定部42が、中間情報の部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択する。ここで用いられる中間情報は、部分領域情報とアクション情報とを対応付けたものであるため、アクション情報判定部42が、その部分領域に対応するアクション情報を特定する。そして、アクション情報実行部43が、アクション情報に応じた情報処理を対象とする装置に実行させる。よって、登録画像の一部を示す画像情報が入力されたときに、その入力された画像情報に応じた情報処理を実行できる。
例えば、特許文献1に記載されたシステムを用いたとしても、位置に応じて提示する情報を決定することはできない。しかし、本実施形態の情報処理装置は、入力された検索画像に対応する登録画像中の位置を自動で判定するので、判定された位置(すなわち、部分領域)に対応づけられた情報処理を行うことが可能になる。
なお、本実施形態では、第1の実施形態または第2の実施形態で説明した画像部分領域抽出装置が部分領域を検出する方法を用いて、画像照合部41が部分領域(矩形領域)を出力する場合を例に説明した。この場合、アクション情報判定部42は、出力された部分領域と中間情報に含まれる部分領域との重複する割合を比較することになる。
一方、画像照合部41は、部分領域を出力する代わりに、特徴点(連結対象ノード)を出力するようにしてもよい。この場合、アクション情報判定部42は、連結対象ノードの各座標値と各中間情報部分領域cとを比較し、各中間情報部分領域cに連結対象ノードがいくつ存在するかをカウントしてもよい。そして、アクション情報判定部42は、そのカウント値が最も大きい部分領域を選択してもよい。なお、カウント方法は任意であり、例えば、領域に含まれる特徴点ごとにカウント値を1ずつ増加させてもよく、カウント対象とする特徴点を特定してカウントを行ってもよい。
このような構成にした場合、第1の実施形態または第2の実施形態で説明した画像部分領域抽出装置が部分領域を検出する方法を用いる際、少なくとも第1の実施形態におけるステップSQ2052およびステップSQ2053の処理は不要になる。また、領域に含まれる特徴点ごとに1ずつ増加させる場合、対応領域を決定する処理(ステップSQ205の処理)が不要になる。
また、本実施形態では、説明の都合上、検索画像と照合する登録画像が決まっている(すなわち登録画像が1枚である)場合を例に説明したが、登録画像が複数枚存在する場合も、容易に拡張が可能である。
例えば、登録画像が複数枚存在する場合、画像照合部41は、登録画像特徴量と検索画像特徴量との一致度合い(例えば、領域一致スコア)の最大値を各登録画像について算出し、その最大値が最も大きい登録画像から部分領域を出力すればよい。また、検索画像と照合する適切な登録画像を、他の既知の画像認識手法や画像検索手法を利用して判定しておき、適切と判定された登録画像から部分領域を出力してもよい。
次に、第3の実施形態の変形例を説明する。第3の実施形態では、画像照合部41によって出力される部分領域が中間情報記憶部44に格納された中間情報により特定される部分領域のどれであるかを判定する方法を説明した。すなわち、第3の実施形態では、画像照合部41によって出力される情報が部分領域であり、かつ、中間情報記憶部44には部分領域を特定するための中間情報が格納されているため、アクション情報判定部42は、両部分領域の一致度合いを比較してアクション情報を特定していた。
本変形例では、中間情報記憶部44は、登録画像中の部分領域を特定するための識別子を中間情報に格納しておくものとする。以下、登録画像中の部分領域を特定するための識別子を部分領域IDと記す。さらに、画像照合部41は、登録画像から検索画像に相当する領域を検出した際、検出した領域に対応する部分領域IDを出力するものとする。この場合、画像照合部41は、中間情報に含まれる部分領域IDを参照し、登録画像と検索画像とを照合した結果得られた登録画像中の部分領域が、どの部分領域IDに対応するか判定する機構を備えていればよい。
具体的には、画像照合部41は、検出した部分領域から中間情報に含まれる部分領域IDが一意に特定できる場合、その部分領域IDを出力すればよい。また、検出した部分領域から特定される部分領域IDが複数存在する場合、画像照合部41は、例えば、上述する式3に示す方法と同様に、各部分領域との面積の一致度合いを算出し、より一致度合いの高い部分領域の部分領域IDを出力してもよい。
画像照合部41が照合結果として部分領域IDを出力することで、アクション情報判定部42は、その部分領域IDに対応するアクション情報(より詳しくは、その部分領域IDで特定される部分領域情報に対応付けられたアクション情報)を特定できる。
また、中間情報記憶部44は、中間情報の部分領域IDごとに画像または特徴量の少なくともいずれかを分割して格納し、画像照合部41が、これらの画像または特徴量を用いて、画像を照合してもよい。すなわち、画像照合部41が、検索画像と分割画像とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力し、アクション情報判定部42が、その部分領域IDに対応するアクション情報を特定してもよい。以下、登録画像を分割した個々の画像のことを分割画像と記す。分割画像は、登録画像中の部分領域を特定するために用いられる画像であり、部分領域IDにより特定される部分領域と同一の範囲の画像であってもよく、異なっていてもよい。
具体的には、中間情報記憶部44は、部分領域IDで特定される部分領域と同一の領域に含まれる画像を分割画像として格納してもよい。また、中間情報記憶部44は、この分割画像中の一部の画像を分割画像として格納してもよい。なお、特定の部分を抽出する方法として、例えば、既知の文書画像レイアウト解析等の技術を利用することができる。このように登録する画像を小さくすることにより、格納するデータ量を抑えることができる。
また、中間情報記憶部44は、部分領域IDで特定される部分領域を広げた領域に含まれる画像を分割画像として格納してもよい。なお、領域を広げる方法は任意であり、例えば、部分領域を全体的に広げるようにしてもよい。このように、部分領域IDで特定される部分領域に隣接する領域を含む画像を利用することで、照合する精度を向上できる。
また、中間情報記憶部44は、格納する分割画像と同様に、画像照合部41が照合に用いる特徴量を格納しておいてもよい。すなわち、部分領域IDで特定される部分領域と同一の領域に含まれる画像の特徴量を格納しておいてもよく、部分領域よりも大きい領域または小さい領域に含まれる画像の特徴量を格納しておいてもよい。この場合の特徴量は、画像照合部41が照合に用いる特徴量と同様に計算しておけばよい。
この場合、画像照合部41が、格納された特徴量と検索画像中の特徴量とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力し、アクション情報判定部42が、その部分領域IDに対応するアクション情報を特定すればよい。
なお、このような情報を中間情報記憶部44に格納する場合、例えば、中間情報生成部(図示せず)が、中間情報に含まれる部分領域ごとに、画像内を参照しながら分割画像または特徴量を決定し、決定した分割画像または特徴量に部分領域IDを付加して中間情報記憶部44に自動的に格納するようにしてもよい。もしくは、画像照合部41が照合する画像または特徴量の単位を予め定めておき、その単位の画像または特徴量を中間情報の部分領域と対応付けるようにしてもよい。
このように、1枚の大きな登録画像を、例えば、部分領域相当の複数の小さな登録画像に分割して中間情報記憶部44に格納しておき、画像照合部41が分割した各画像またはその画像から算出される特徴量を利用して画像を照合してもよい。なお、第1の実施形態または第2の実施形態で示した方法を用いることで、解像度や撮影角度が登録画像と異なる検索画像を用いても、その検索画像に対応する部分領域を登録画像から抽出できるため、全体の登録画像から位置を特定する方が、より好ましい。
なお、部分領域IDを中間情報に含めて中間情報記憶部44が明示的に記憶しておいてもよい。また、中間情報記憶部44に中間情報を記憶させる順番や、中間情報として格納するファイルの格納順を、部分領域IDとして暗黙のうちに利用してもよい。また、中間情報として記憶する画像または特徴量に付加する部分領域IDについても同様である。
次に、第3の実施形態の情報処理装置を利用する場面の具体例を説明する。
<具体例1>
まず、第3の実施形態の情報処理装置をリモートコントロール装置として動作させる場合の具体例を説明する。第1の具体例では、テレビジョンガイド誌の番組表(以下、単に番組表と記す。)を表わす登録画像の各部分領域にアクション情報を設定したときの動作例を説明する。
番組表を登録画像として利用する場合、番組単位にブロック化したものを部分領域とし、その部分領域を示す部分領域情報に、録画予約やチャンネル変更指示、VoD(Video On Demand )視聴用のコンテンツ購入指示などのアクション情報を対応付けることができる。ここでは、中間情報記憶部44は、録画予約を実行させるアクション情報、ビデオオンデマンド視聴要求を実行させるアクション情報、および、ビデオコンテンツ購入処理を実行させるアクション情報の少なくとも1つ以上のアクション情報を記憶しているものとする。
情報処理装置が番組表の一部を撮影した画像を受け取ると、画像照合部41は、登録画像中の部分領域(すなわち、対象番組)を特定する。アクション情報判定部42は、情報処理装置内部のタイマによる計時時刻と、特定された部分領域内の対象番組の放送時刻を比較する。
対象番組の放送時間が計時時刻内である場合、アクション情報判定部42は、チャンネル変更を行うための操作画面を表示すると判断してもよい。また、対象番組の放送時間が計時時刻より後である場合、アクション情報判定部42は、その対象番組を録画予約するための操作画面を表示すると判断してもよい。また、対象番組の放送時間が計時時刻より後である場合、アクション情報判定部42は、ビデオオンデマンド視聴要求を行うための操作画面を表示すると判断してもよいし、その対象番組のビデオコンテンツの購入や照会を行うための操作画面を表示すると判断してもよい。
このような判定処理を行うためには、アクション情報に、計時時刻と放送時刻との比較処理、および、その比較結果による情報処理内容が含まれていればよい。アクション情報実行部43は、アクション情報判定部42によって判定されたアクション情報に応じて情報処理を実行することになる。
<具体例2>
次に、第3の実施形態の情報処理装置を新聞記事の内容を提示する装置として動作させる場合の具体例を説明する。第2の具体例では、新聞記事を示す登録画像の各部分領域にアクション情報を設定したときの動作例を説明する。新聞記事を登録画像として利用する場合、新聞記事の単位にブロック化したものを部分領域とし、その部分領域を表わす部分領域情報にアクション情報を対応付けることができる。具体的には、アクション情報として、新聞の記事を読みあげることや、動画データの再生指示、web上に存在する関連ページの表示を実行させる情報処理を設定できる。
情報処理装置が新聞記事の一部を撮影した画像を受け取ると、画像照合部41は、登録画像中の部分領域(すなわち、対象記事)を特定する。アクション情報判定部42は、部分領域にブロック化した記事が含まれると判定した場合、その部分領域を表わす部分領域情報に対応するアクション情報を特定する。このとき、アクション情報判定部42は、ユーザに読み上げデータがあることを示す画面を表示すると判断してもよい。この場合、アクション情報実行部43は、画面を表示し、表示されたアクション(読み上げ)の実行をユーザが指示したときに、音声再生を開始して記事の読み上げを行う。
また、アクション情報に動画が指定されている場合、アクション情報判定部42は、ユーザに動画があることを示す画面を表示すると判断してもよい。この場合、アクション情報実行部43は、その動画を再生する。
また、対象記事が広告の場合、アクション情報にショッピングサイトへのリンクを設定しておいてもよい。例えば、その広告を撮影した画像を受け取った場合、アクション情報判定部42は、ショッピングサイトへのリンクを示す画面を表示すると判断し、アクション情報実行部43が、ブラウザを起動してそのショッピングサイトを表示するようにしてもよい。
<具体例3>
次に、第3の実施形態の情報処理装置を、書籍を扱う本屋や図書館などで用いられる端末装置として動作させる場合の具体例を説明する。第3の具体例では、本(雑誌など)の表紙や背表紙を示す登録画像の各部分領域にアクション情報を設定したときの動作例を説明する。本の表紙や背表紙を登録画像として利用する場合、本を識別可能な部分をブロック化したものを部分領域とし、その部分領域を表わす部分領域情報にアクション情報を対応付けることができる。
具体的には、アクション情報として、本の中身を閲覧するための情報処理を設定できる。なお、本具体例では、端末装置が店舗内または施設内の無線エリアで接続されているものとし、アクション情報には、無線エリア内でのみアクション情報に応じた処理を実行可能である旨が設定されているものとする。
例えば、情報処理装置が本の表紙や背表紙の一部を撮影した画像を受け取ると、画像照合部41は、登録画像中の部分領域を特定する。アクション情報判定部42は、部分領域に本の表紙や背表紙の一部が含まれると判定した場合、その部分領域を表わす部分領域情報に対応するアクション情報を特定する。具体的には、アクション情報判定部42は、その画像から本を特定し、その本の中身を表示すると判断してもよい。この場合、アクション情報実行部43は、端末が無線エリア内にある場合にのみ、その本の内容を表示するようにしてもよい。また、情報処理装置が貸出処理または購入処理の完了を確認できた場合、アクション情報実行部43は、端末が無線エリア内から出た場合でも、その本の内容を表示できるようにしてもよい。
<具体例4>
次に、第3の実施形態の情報処理装置を、観光地情報を表示する端末装置として動作させる場合の具体例を説明する。第4の具体例では、観光地に設けられた看板に表示される観光地マップを示す登録画像の各部分領域にアクション情報を設定したときの動作例を説明する。観光地マップを登録画像として利用する場合、観光地を表示しているエリアや説明個所などの部分をブロック化したものを部分領域とし、その部分領域を表わす部分領域情報にアクション情報を対応付けることができる。具体的には、アクション情報として、観光地情報を表示するための情報処理を設定できる。
情報処理装置が観光地マップの一部を撮影した画像を受け取ると、画像照合部41は、登録画像中の部分領域(すなわち、観光地情報)を特定する。アクション情報判定部42は、部分領域にブロック化した記事が含まれると判定した場合、その部分領域を表わす部分領域情報に対応するアクション情報を特定する。このとき、アクション情報判定部42は、観光地情報を提示すると判断してもよい。この場合、アクション情報実行部43は、登録された観光地情報を画面に表示したり、動画データを再生したりする処理を行う。
なお、看板に表示される観光地マップを撮影する場合、看板が大きいことが想定されることから、撮影される画像の解像度や大きさも様々であることが想定される。しかし、第1の実施形態または第2の実施形態の画像部分領域抽出装置を用いることにより、適切に部分領域を特定できるため、その部分領域を利用した情報処理も適切に行うことが可能になる。
図20は、本発明の情報処理装置の概要を示すブロック図である。本発明の情報処理装置は、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合部81(例えば、画像照合部41)と、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、その部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合い(例えば、領域一致スコア)が最も高い部分領域を選択し、その部分領域に対応するアクション情報を特定するアクション情報判定部82(例えば、アクション情報判定部42)と、アクション情報に応じた情報処理を対象装置に実行させるアクション情報実行部83(例えば、アクション情報実行部43)とを備えている。
そのような構成により、登録画像の一部を示す画像情報が入力されたときに、その入力された画像情報に応じた情報処理を実行できる。
具体的には、画像照合部81は、検索画像に対応する登録画像中の領域を出力してもよい。そして、アクション情報判定部82は、特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出し、その一致度合いが最も高い部分領域を選択してもよい。
一方、画像照合部81は、検索画像に対応する登録画像中の特徴点(例えば、連結対象ノード)を出力してもよい。このとき、アクション情報判定部82は、特定された部分領域の中に出力された特徴点が含まれている数を一致度合いとして算出し、その一致度合いが最も高い部分領域を選択してもよい。
また、中間情報が、部分領域情報として部分領域を特定する部分領域IDを含んでいてもよい。このとき、画像照合部81は、検出した登録画像中の領域に対応する部分領域IDを出力し、アクション情報判定部82は、部分領域IDに対応するアクション情報を特定してもよい。
さらに、中間情報が、登録画像を分割した分割画像と部分領域IDとを対応付けた部分領域情報を含んでいてもよい。このとき、画像照合部81は、検索画像と分割画像とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力してもよい。
また、中間情報は、録画予約を実行させるアクション情報、ビデオオンデマンド視聴要求を実行させるアクション情報、および、ビデオコンテンツ購入処理を実行させるアクション情報の少なくとも一つ以上のアクション情報を含んでいてもよい。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合部と、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、当該部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、当該部分領域に対応するアクション情報を特定するアクション情報判定部と、前記アクション情報に応じた情報処理を前記対象装置に実行させるアクション情報実行部とを備えたことを特徴とする情報処理装置。
(付記2)画像照合部は、検索画像に対応する登録画像中の領域を出力し、アクション情報判定部は、特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する付記1記載の情報処理装置。
(付記3)画像照合部は、検索画像に対応する登録画像中の特徴点を出力し、アクション情報判定部は、特定された部分領域の中に出力された特徴点が含まれている数を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する付記1記載の情報処理装置。
(付記4)中間情報は、部分領域情報として部分領域を特定する部分領域IDを含み、画像照合部は、検出した登録画像中の領域に対応する部分領域IDを出力し、アクション情報判定部は、前記部分領域IDに対応するアクション情報を特定する付記1から付記3のうちのいずれか1つに記載の情報処理装置。
(付記5)中間情報は、登録画像を分割した分割画像と部分領域IDとを対応付けた部分領域情報を含み、画像照合部は、検索画像と前記分割画像とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力する付記4記載の情報処理装置。
(付記6)中間情報は、録画予約を実行させるアクション情報、ビデオオンデマンド視聴要求を実行させるアクション情報、および、ビデオコンテンツ購入処理を実行させるアクション情報の少なくとも一つ以上のアクション情報を含む付記1から付記5のうちのいずれか1つに記載の情報処理装置。
(付記7)検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出し、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、当該部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、前記部分領域に対応するアクション情報を特定し、前記アクション情報に応じた情報処理を前記対象装置に実行させることを特徴とする情報処理方法。
(付記8)検索画像に対応する登録画像中の領域を出力し、特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する付記7記載の情報処理方法。
(付記9)検索画像に対応する登録画像中の特徴点を出力し、特定された部分領域の中に出力された特徴点が含まれている数を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する付記7記載の情報処理方法。
(付記10)中間情報は、部分領域情報として部分領域を特定する部分領域IDを含み、検出した登録画像中の領域に対応する部分領域IDを出力し、前記部分領域IDに対応するアクション情報を特定する付記7から付記9のうちのいずれか1つに記載の情報処理方法。
(付記11)中間情報は、登録画像を分割した分割画像と部分領域IDとを対応付けた部分領域情報を含み、検索画像と前記分割画像とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力する付記10記載の情報処理方法。
(付記12)中間情報は、録画予約を実行させるアクション情報、ビデオオンデマンド視聴要求を実行させるアクション情報、および、ビデオコンテンツ購入処理を実行させるアクション情報の少なくとも一つ以上のアクション情報を含む付記7から付記11のうちのいずれか1つに記載の情報処理方法。
(付記13)コンピュータに、検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合処理、登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、当該部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、当該部分領域に対応するアクション情報を特定するアクション情報判定処理、および、前記アクション情報に応じた情報処理を前記対象装置に実行させるアクション情報実行処理を実行させるための情報処理用プログラム。
(付記14)コンピュータに、画像照合処理で、検索画像に対応する登録画像中の領域を出力させ、アクション情報判定処理で、特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出させ、当該一致度合いが最も高い部分領域を選択させる付記13記載の情報処理用プログラム。
(付記15)コンピュータに、画像照合処理で、検索画像に対応する登録画像中の特徴点を出力させ、アクション情報判定処理で、特定された部分領域の中に出力された特徴点が含まれている数を一致度合いとして算出させ、当該一致度合いが最も高い部分領域を選択させる付記13記載の情報処理用プログラム。
(付記16)中間情報は、部分領域情報として部分領域を特定する部分領域IDを含み、画像照合処理で、検出した登録画像中の領域に対応する部分領域IDを出力させ、アクション情報判定処理で、前記部分領域IDに対応するアクション情報を特定させる付記13から付記15のうちのいずれか1つに記載の情報処理用プログラム。
(付記17)中間情報は、登録画像を分割した分割画像と部分領域IDとを対応付けた部分領域情報を含み、画像照合処理で、検索画像と前記分割画像とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力させる付記16記載の情報処理用プログラム。
(付記18)中間情報は、録画予約を実行させるアクション情報、ビデオオンデマンド視聴要求を実行させるアクション情報、および、ビデオコンテンツ購入処理を実行させるアクション情報の少なくとも一つ以上のアクション情報を含む付記13から付記17のうちのいずれか1つに記載の情報処理用プログラム。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2012年10月18日に出願された日本特許出願2012−230886を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明によれば、各種誌面中からユーザが写したコンテンツをキーに情報処理を実行する情報処理装置一般に適用できる。
例えば、新聞や雑誌の記事、各種広告、説明資料等、文字が記載されている実世界中の物体(紙、板など)からデジタル情報を検索する情報処理装置に適用可能である。さらに、テレビガイド誌から録画予約、ビデオ視聴、ビデオコンテンツ購入をしたりする情報処理装置といった用途に適用できる。また、郵便物、宅配便等の画像から郵便物を特定することができる情報処理装置にも適用可能である。さらに、郵便物や宅配便等に記される宛名領域や差出人領域を認識する装置にも利用可能である。
1 情報処理システム
R201 登録画像特徴点生成部
R202 登録画像特徴点配置生成部
R203 登録画像特徴量生成部
Q201 検索画像特徴点生成部
Q202 検索画像特徴点配置生成部
Q203 検索画像特徴量生成部
204 対応特徴点検出部
205 対応領域判定部
304 対応特徴点対検出部
305 対応領域推定部
41 画像照合部
42 アクション情報判定部
43 アクション情報実行部
44 中間情報記憶部

Claims (10)

  1. 検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合部と、
    登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、当該部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、当該部分領域に対応するアクション情報を特定するアクション情報判定部と、
    前記アクション情報に応じた情報処理を前記対象装置に実行させるアクション情報実行部とを備えた
    ことを特徴とする情報処理装置。
  2. 画像照合部は、検索画像に対応する登録画像中の領域を出力し、
    アクション情報判定部は、特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する
    請求項1記載の情報処理装置。
  3. 画像照合部は、検索画像に対応する登録画像中の特徴点を出力し、
    アクション情報判定部は、特定された部分領域の中に出力された特徴点が含まれている数を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する
    請求項1記載の情報処理装置。
  4. 中間情報は、部分領域情報として部分領域を特定する部分領域IDを含み、
    画像照合部は、検出した登録画像中の領域に対応する部分領域IDを出力し、
    アクション情報判定部は、前記部分領域IDに対応するアクション情報を特定する
    請求項1から請求項3のうちのいずれか1項に記載の情報処理装置。
  5. 中間情報は、登録画像を分割した分割画像と部分領域IDとを対応付けた部分領域情報を含み、
    画像照合部は、検索画像と前記分割画像とを照合して、検出した登録画像中の領域に対応する部分領域IDを出力する
    請求項4記載の情報処理装置。
  6. 中間情報は、録画予約を実行させるアクション情報、ビデオオンデマンド視聴要求を実行させるアクション情報、および、ビデオコンテンツ購入処理を実行させるアクション情報の少なくとも一つ以上のアクション情報を含む
    請求項1から請求項5のうちのいずれか1項に記載の情報処理装置。
  7. 検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出し、
    登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、当該部分領域情報をもとに部分領域を特定し、
    特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、
    前記部分領域に対応するアクション情報を特定し、
    前記アクション情報に応じた情報処理を前記対象装置に実行させる
    ことを特徴とする情報処理方法。
  8. 検索画像に対応する登録画像中の領域を出力し、
    特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出し、当該一致度合いが最も高い部分領域を選択する
    請求項7記載の情報処理方法。
  9. コンピュータに、
    検索画像と登録画像とを照合して、検索画像に対応する登録画像中の領域を検出する画像照合処理、
    登録画像中の部分領域を特定する情報である部分領域情報と、対象装置に実行させる情報処理を表すアクション情報とを対応付けた情報である中間情報から、当該部分領域情報をもとに部分領域を特定し、特定された部分領域のうち、検出された領域との一致度合いが最も高い部分領域を選択し、当該部分領域に対応するアクション情報を特定するアクション情報判定処理、および、
    前記アクション情報に応じた情報処理を前記対象装置に実行させるアクション情報実行処理
    を実行させるための情報処理用プログラム。
  10. コンピュータに、
    画像照合処理で、検索画像に対応する登録画像中の領域を出力させ、
    アクション情報判定処理で、特定された部分領域の中に出力された領域が重複する割合を一致度合いとして算出させ、当該一致度合いが最も高い部分領域を選択させる
    請求項9記載の情報処理用プログラム。
JP2014541925A 2012-10-18 2013-10-02 情報処理装置、情報処理方法および情報処理用プログラム Pending JPWO2014061222A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012230886 2012-10-18
JP2012230886 2012-10-18
PCT/JP2013/005878 WO2014061222A1 (ja) 2012-10-18 2013-10-02 情報処理装置、情報処理方法および情報処理用プログラム

Publications (1)

Publication Number Publication Date
JPWO2014061222A1 true JPWO2014061222A1 (ja) 2016-09-05

Family

ID=50487802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014541925A Pending JPWO2014061222A1 (ja) 2012-10-18 2013-10-02 情報処理装置、情報処理方法および情報処理用プログラム

Country Status (3)

Country Link
US (1) US9830336B2 (ja)
JP (1) JPWO2014061222A1 (ja)
WO (1) WO2014061222A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6622124B2 (ja) * 2016-03-17 2019-12-18 株式会社東芝 算出装置及び認識装置
CN110392206B (zh) * 2018-04-18 2021-04-02 株式会社理光 信息处理设备和记录介质
US11941043B2 (en) * 2022-07-25 2024-03-26 Dell Products L.P. System and method for managing use of images using landmarks or areas of interest

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69635101T2 (de) * 1995-11-01 2006-06-01 Canon K.K. Verfahren zur Extraktion von Gegenständen und dieses Verfahren verwendendes Bildaufnahmegerät
JP2002245048A (ja) 2001-02-20 2002-08-30 Mitsubishi Electric Corp 画像検索方法および画像検索装置
US9171202B2 (en) * 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
WO2007023993A1 (en) 2005-08-23 2007-03-01 Ricoh Company, Ltd. Data organization and access for mixed media document system
EP2251830A1 (en) 2008-03-04 2010-11-17 NEC Corporation Image matching device, image matching feature amount storage medium, image matching method, and image matching program
WO2010053109A1 (ja) 2008-11-10 2010-05-14 日本電気株式会社 画像照合装置、画像照合方法および画像照合用プログラム
JP5438436B2 (ja) * 2009-08-27 2014-03-12 株式会社日立国際電気 画像検索装置
JP2011142576A (ja) 2010-01-08 2011-07-21 Sony Corp 電子機器、情報処理方法及びプログラム
JP2012010162A (ja) 2010-06-25 2012-01-12 Kyocera Corp カメラ装置
JP5071539B2 (ja) * 2010-09-13 2012-11-14 コニカミノルタビジネステクノロジーズ株式会社 画像検索装置、画像読取装置、画像検索システム、データベース生成方法およびデータベース生成プログラム
JP2012120143A (ja) * 2010-11-10 2012-06-21 Sony Corp 立体画像データ送信装置、立体画像データ送信方法、立体画像データ受信装置および立体画像データ受信方法
JP5665125B2 (ja) * 2011-04-07 2015-02-04 株式会社日立製作所 画像処理方法、及び、画像処理システム

Also Published As

Publication number Publication date
US9830336B2 (en) 2017-11-28
US20150278249A1 (en) 2015-10-01
WO2014061222A1 (ja) 2014-04-24

Similar Documents

Publication Publication Date Title
US10650264B2 (en) Image recognition apparatus, processing method thereof, and program
US10210423B2 (en) Image match for featureless objects
US9076069B2 (en) Registering metadata apparatus
US20140164927A1 (en) Talk Tags
CN110781823B (zh) 录屏检测方法、装置、可读介质及电子设备
CN110880139B (zh) 一种商品展示方法、装置、终端、服务器及存储介质
JP5863962B2 (ja) 追加を希望する名刺が連絡先リストに存在しているか否かを判断する方法
WO2014061222A1 (ja) 情報処理装置、情報処理方法および情報処理用プログラム
WO2014061221A1 (ja) 画像部分領域抽出装置、画像部分領域抽出方法および画像部分領域抽出用プログラム
JP2014164483A (ja) データベース生成装置、カメラ姿勢推定装置、データベース生成方法、カメラ姿勢推定方法、およびプログラム
WO2007004521A1 (ja) マーカ特定装置及びマーカ特定方法
US20130100296A1 (en) Media content distribution
JP6304815B2 (ja) 画像処理装置ならびにその画像特徴検出方法、プログラムおよび装置
US11798210B2 (en) Neural network based detection of image space suitable for overlaying media content
JP5278093B2 (ja) 記事関連情報提供方法、装置、プログラム、記録媒体
JP2013238987A (ja) 情報表示装置、情報入力装置、情報表示プログラム及び情報入力プログラム
KR101525409B1 (ko) 이미지 인식모듈을 이용한 컨텐츠 증강방법
Swaminathan et al. Localization based object recognition for smart home environments
JP5975484B2 (ja) 画像処理装置
Nguyen et al. Augmented media for traditional magazines
US9245192B2 (en) Ad collateral detection
JP5804430B2 (ja) 書籍情報処理装置、書籍情報処理方法、およびプログラム
JP5967036B2 (ja) 画像検索システム、情報処理装置及びプログラム
CN108363489A (zh) 基于纸质图书封面的数据交互处理方法及装置
US20230144394A1 (en) Systems and methods for managing digital notes