JP5821598B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP5821598B2
JP5821598B2 JP2011271203A JP2011271203A JP5821598B2 JP 5821598 B2 JP5821598 B2 JP 5821598B2 JP 2011271203 A JP2011271203 A JP 2011271203A JP 2011271203 A JP2011271203 A JP 2011271203A JP 5821598 B2 JP5821598 B2 JP 5821598B2
Authority
JP
Japan
Prior art keywords
feature point
feature
candidate
image
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011271203A
Other languages
English (en)
Other versions
JP2013122702A (ja
Inventor
川 王
川 王
大西 健司
健司 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2011271203A priority Critical patent/JP5821598B2/ja
Priority to US13/538,324 priority patent/US9111141B2/en
Priority to CN201210379939.4A priority patent/CN103177438B/zh
Publication of JP2013122702A publication Critical patent/JP2013122702A/ja
Application granted granted Critical
Publication of JP5821598B2 publication Critical patent/JP5821598B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、画像処理装置及びプログラムに関する。
下記特許文献1には、第1の画像から検出された特徴点、に対応する対応特徴点を第2の画像のうちで特定し、特徴点と対応特徴点とに基づいて第1の画像と第2の画像とを合成すること、が記載されている。
特開2011−13890号公報
本発明の目的は、第1画像から抽出された特徴点と類似の特徴を有する特徴点が第2画像に複数存在する場合であっても、第1画像から抽出された特徴点、に対応する第2の画像の特徴点を特定することができるようにすることある。
上記課題を解決するための請求項1の発明は、文字に対応する文字領域を複数含む第1画像から抽出された複数の第1特徴点のうちのいずれかである注目第1特徴点につき、第2画像から抽出された複数の第2特徴点のうちで、前記注目第1特徴点に対応する第2特徴点の候補となる第2特徴点候補を、前記注目第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第1特定手段と、前記複数の第1特徴点のうちの、前記注目第1特徴点とは異なる文字領域に含まれる他の第1特徴点につき、前記複数の第2特徴点のうちで、第2特徴点候補を、前記他の第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第2特定手段と、前記注目第1特徴点に対する前記他の第1特徴点の相対的な位置と、前記注目第1特徴点の第2特徴点候補に対する前記他の第1特徴点の第2特徴点候補の相対的な位置と、の比較結果に基づいて、前記注目第1特徴点の第2特徴点候補の評価に関する評価情報を生成する評価手段と、前記評価情報に応じて、前記注目第1特徴点の第2特徴点候補を、前記注目第1特徴点に対応する第2特徴点として設定する設定手段と、を含むことを特徴とする画像処理装置である。
また、請求項2の発明は、請求項1の発明において、前記評価手段は、前記注目第1特徴点における特徴量が示す代表方向に対して前記注目第1特徴点から前記他の第1特徴点への方向がなす角度と、前記注目第1特徴点の第2特徴点候補における特徴量が示す代表方向に対して前記注目第1特徴点の第2特徴点候補から前記他の第1特徴点の第2特徴点候補への方向がなす角度と、の比較結果に基づいて、前記評価情報を生成することを特徴とする。
また、請求項3の発明は、請求項1又は2の発明において、前記他の第1特徴点は、前記注目第1特徴点を含む文字領域とは異なる行又は列に位置する文字領域に含まれる第1特徴点であることを特徴とする。
また、請求項4の発明は、請求項1又は2の発明において、前記他の第1特徴点は、前記注目第1特徴点を含む文字領域とは別種の文字に対応する文字領域に含まれる第1特徴点であることを特徴とする。
また、上記課題を解決するための請求項5の発明は、文字に対応する文字領域を複数含む第1画像から抽出された複数の第1特徴点のうちのいずれかである注目第1特徴点につき、第2画像から抽出された複数の第2特徴点のうちで、前記注目第1特徴点に対応する第2特徴点の候補となる第2特徴点候補を、前記注目第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第1特定手段、前記複数の第1特徴点のうちの、前記注目第1特徴点とは異なる文字領域に含まれる他の第1特徴点につき、前記複数の第2特徴点のうちで、第2特徴点候補を、前記他の第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第2特定手段、前記注目第1特徴点に対する前記他の第1特徴点の相対的な位置と、前記注目第1特徴点の第2特徴点候補に対する前記他の第1特徴点の第2特徴点候補の相対的な位置と、の比較結果に基づいて、前記注目第1特徴点の第2特徴点候補の評価に関する評価情報を生成する評価手段、前記評価情報に応じて、前記注目第1特徴点の第2特徴点候補を、前記注目第1特徴点に対応する第2特徴点として設定する設定手段、としてコンピュータを機能させるためのプログラムである。
請求項1、5の発明によれば、第1画像から抽出された特徴点と類似の特徴を有する特徴点が第2画像に複数存在する場合であっても、第1画像から抽出された特徴点、に対応する第2の画像の特徴点を特定することができる。
請求項2〜4の発明によれば、本構成を有しない場合と比較して、より高い精度で、第1の画像から抽出された特徴点、に対応する第2の画像の特徴点を特定することができる。
画像処理装置の構成を例示する図である。 第1文書画像を例示する図である。 第2文書画像を例示する図である。 文書を例示する図である。 特徴点を例示する図である。 特徴点同士が対応付けられる様子を例示する図である。 画像処理装置で実行される処理を例示するフロー図である。 画像処理装置で実行される処理を例示するフロー図である。 画像処理装置で実行される処理を例示するフロー図である。 第1特徴点を例示する図である。 第2特徴点を例示する図である。 方向ベクトルvik及び角度θikを例示する図である。 画像処理装置で実現される機能群を示す機能ブロック図である。
以下、本発明の実施形態の例について図面に基づき詳細に説明する。
図1は、本発明の一実施形態に係る画像処理装置2の構成を例示する図である。画像処理装置2は、一般的なコンピュータであり、制御部4、主記憶6、操作入力部8、表示部10、及びハードディスク12等を備える。
制御部4は、マイクロプロセッサであり、主記憶6に記憶されるプログラムに従って各種情報処理を実行する。主記憶6は、上記プログラムを格納している。このプログラムは、DVD(登録商標)−ROM等のコンピュータ読取可能な情報記憶媒体から読み出されて主記憶6に格納されてもよいし、ネットワーク等の通信網から供給されて主記憶6に格納されてもよい。また、主記憶6には、情報処理の過程で必要となる各種データも格納される。
操作入力部8は、ユーザが操作入力を行うためのインタフェースであり、例えば、マウス及びキーボードなどである。操作入力部8は、ユーザにより行われた操作入力を示す信号を制御部4へ出力する。また、表示部10は、CRTディスプレイ及び液晶ディスプレイなどであり、制御部4から入力される情報を出力する。
ハードディスク12は、各種情報を記憶する。本実施形態の場合、ハードディスク12には、ビットマップ画像である第1文書画像14a及び第2文書画像14bが記憶されている。図2Aに第1文書画像14aを例示し、図2Bに第2文書画像14bを例示した。斜線された部分は背景を表している。図2A及び図2Bに示すように、第1文書画像14aには図2Cに示す文書の左部分が写り、第2文書画像14bには文書の右部分が写っている。第1文書画像14aと第2文書画像14bの両方に写っている部分もある。第1文書画像14a及び第2文書画像14bには、座標軸であるX軸とY軸とが設定されている。
この画像処理装置2では、第1文書画像14a及び第2文書画像14bのそれぞれから、特徴点が抽出される。図3Aに、抽出される特徴点の一部を例示した。各点が特徴点を示している。
また、第1文書画像14aと第2文書画像14bとの間で、類似の特徴量が得られる特徴点同士が対応付けられるようになっている。すなわち、第1文書画像14aから抽出された特徴点の一つ一つにつき、その特徴点に対応する一の特徴点が第2文書画像14bのうちで特定されるようになっている。図3Bに、特徴点同士が対応付けられる様子を例示した。
また、互いに対応付けられた特徴点の一方が他方の特徴点と一致するように、第1文書画像14aが変形され、変形された第1文書画像14aと第2文書画像14bとを合成してなる合成文書画像が生成されるようになっている。図2Cに合成文書画像を例示した。
この画像処理装置2では、第1文書画像14aから抽出された特徴点と類似の特徴量を示す特徴点が第2文書画像14bに複数存在する場合(例えば、第1文書画像14aに含まれる文字(例えば文字「F」)が第2文書画像14bに複数含まれる場合)でも、第1文書画像14aから抽出された特徴点、に対応する一の特徴点が高い精度で特定されるようになっている。以下、この点について説明する。
図4A、図4B、及び図4Cは、画像処理装置2で実行される処理を例示するフロー図である。同図の処理は、制御部4が上記プログラムに従って動作することで実行される。
まず、制御部4は、第1文書画像14aから複数の特徴点P(以下、第1特徴点Pと表記する)と、各特徴点Pにおける画像特徴を示す特徴量Cと、を検出し(S101)、第1特徴点Pの座標と特徴量Cとを主記憶6に保存する。本実施形態の場合、制御部4は、SIFT(Scale-Invariant Feature Transform)法により、第1特徴点Pと特徴量Cとを検出する。特徴量CはいわゆるSIFT特徴量であり、128次元の多次元ベクトルとして表される。この多次元ベクトルは画像の回転及び拡縮に対して不変である。また、この多次元ベクトルが示す方向のうち代表的なものはオリエンテーションと呼ばれる。オリエンテーションは、二次元ベクトルとして表される。図5Aに、第1特徴点Pを例示した。なお、矢印は、オリエンテーションを示している。
また、制御部4は、S101のステップと同様にして第2文書画像14bから複数の特徴点P(以下、第2特徴点Pと表記する)と、各特徴点Pにおける画像特徴を示す特徴量Cと、を検出し(S102)、第2特徴点Pの座標と特徴量Cとを主記憶6に保存する。図5Bに、第2特徴点Pを例示した。
また、制御部4は、公知の文字領域検出処理(例えば、Morphology処理)を行って、第1文書画像に含まれる文字一つ一つに対応する文字領域を特定する(S103)。例えば、制御部4は、ある文字の外接矩形が占める領域をその文字に対応する文字領域として特定する。また、制御部4は、第1文書画像に含まれる文字一つ一つを認識する。
また、制御部4は、主記憶6から、いずれかの文字領域に含まれる第1特徴点P i(i=1〜N1)と、その第1特徴点P における特徴量C を読み出す(S104)。第1特徴点P i(i=1〜N1)が「複数の第1特徴点」に相当する。
また、制御部4は、S103のステップと同様にして、第2文書画像14bに含まれる文字一つ一つに対応する文字領域を特定する(S105)。また、制御部4(第2特徴取得手段)は、主記憶6から、いずれかの文字領域に含まれる第2特徴点P l(l=1〜N2)と、その第2特徴点P における特徴量C を読み出す(S106)。第2特徴点P l(l=1〜N2)が「複数の第2特徴点」に相当する。
そして、制御部4は、第1特徴点P の各々を処理対象にして、以下の処理を実行する。なお、処理対象となっている第1特徴点P が「注目第1特徴点」に相当する。
すなわち、制御部4(第1特定手段)は、複数の第2特徴点P のうちで、第1特徴点P に対応する第2特徴点Pの候補となる第2特徴点候補P を特定する(S107)。具体的には、制御部4は、第2特徴点P の一つ一つについて、その第2特徴点P における特徴量C (上記多次元ベクトル)と、特徴量C (上記多次元ベクトル)と、のユークリッド距離を算出し、ユークリッド距離が閾値以下である第2特徴点P を第2特徴点候補P として特定する。
そして、制御部4は、第2特徴点候補P の数N3が「1」であるか否かを判定する(S108)。第2特徴点候補P の数N3が「1」である場合(S108のYes)、制御部4は、第2特徴点候補P を、第1特徴点P に対応する第2特徴点Pとして設定する(S120)。具体的には、制御部4は、第1特徴点P と、第2特徴点候補P と、をグループ化する。
一方、第2特徴点候補P が複数特定された場合(S108のNo)、制御部4は、第1特徴点P を含む文字領域から所定距離内に位置する文字領域のうち、第1特徴点P を含む文字領域とは別種の文字を含む文字領域を特定する(S109)。例えば、図5Aに示す第1文書画像14aの場合において、上方にある文字「F」から検出された第1特徴点Pが処理対象の第1特徴点P である場合を想定する。この場合、第2文書画像14bに含まれる2つの文字「F」それぞれから検出された2つの第2特徴点Pが、第2特徴点候補P として特定される。従って、S109のステップで、上方の文字「F」を囲む文字領域の周辺に位置する文字領域(すなわち、文字「A」、「B」、「C」、「E」、「G」、「I」、「J」、及び「K」のそれぞれを囲む文字領域)のうち、文字「F」とは異なる文字「A」、「B」、「C」、「E」、「G」、「I」、「J」、及び「K」のそれぞれを囲む文字領域が特定されることになる。結果的に、上方の文字「F」を囲む文字領域とは異なる行又は列に位置する文字領域が特定されることにもなる。
そして、制御部4は、複数の第1特徴点P のうちで、S109で特定された文字領域のいずれかに含まれる第1特徴点P k(k=1〜N4)を特定する(S110)。例えば、図5Aに示す場合、文字「C」から検出された第1特徴点Pと文字「C」から検出された第1特徴点Pとが第1特徴点P (他の第1特徴点)として特定される。
そして、制御部4は、第2特徴点候補P j(j=1〜N3)それぞれの評価値Vj(j=1〜N3)を「0」に初期化し(S111)、第1特徴点P の各々につき、以下の処理を実行する。
すなわち、制御部4(第2特定手段)は、S107のステップと同様の処理を行って、複数の第2特徴点P のうちで、第1特徴点P に対応する第2特徴点Pの候補となる第2特徴点候補P m(m=1〜N5)を特定する(S112)。また、制御部4は、第1特徴点P (注目第1特徴点)から第1特徴点P (他の第1特徴点)までの方向ベクトルvikを算出する(S113)。また、制御部4は、S113のステップで、第1特徴点P と第1特徴点P との距離dikも算出する。
そして、制御部4は、第1特徴点P (注目第1特徴点)における特徴量C が示すオリエンテーションに対して方向ベクトルvikがなす時計回りの角度θikを算出する(S114)。図6に、第1文書画像14aの上方の文字「F」が第1特徴点P であり、且つ、文字「F」の右上の文字「C」が第1特徴点P である場合における、方向ベクトルvik及び角度θikを例示した。なお、図6に示す太字の矢印は、オリエンテーションを示している。
そして、制御部4は、第2特徴点候補P j(j=1〜N3)と第2特徴点候補P m(m=1〜N5)との組み合わせの各々につき、以下の処理を実行する。
すなわち、制御部4は、第2特徴点候補P (注目第1特徴点の第2特徴点候補)から第2特徴点候補P (他の第1特徴点の第2特徴点候補)までの方向ベクトルvjmを算出する(S115)。また、制御部4は、S115のステップにおいて、第2特徴点候補P と第2特徴点候補P との距離djmも算出する。
また、制御部4は、第2特徴点P 候補(注目第1特徴点の第2特徴点)における特徴量C が示すオリエンテーションに対して方向ベクトルvjmがなす時計回りの角度θjmを算出する(S116)。
そして、制御部4は、角度θikと角度θjmとの差Δθが閾値角度以下であるか否か、及び、距離dikと距離djmとの差Δdが閾値距離以下であるか否か、を判定する(S117)。差Δθが閾値角度以下であり且つ差Δdが閾値距離以下である場合(S117のYes)、制御部4(評価手段)は、評価値Vを「1」だけインクリメントする(S118)。なお、制御部4は、S117において、角度θikと角度θjmとの差Δθが閾値角度以下であるか否かのみ判定し、角度θikと角度θjmとの差Δθが閾値角度以下である場合に、S118において、評価値Vを「1」だけインクリメントしてもよい。
こうして、第2特徴点候補P j(j=1〜N3)の各々につきその評価値Vを決定すると、制御部4(設定手段)は、評価値Vが最大の第2特徴点候補P を、第1特徴点P に対応する第2特徴点Pとして設定する(S119)。すなわち、制御部4は、第1特徴点P と、評価値Vが最大の第2特徴点候補P と、をグループ化する。
こうして、第1特徴点P の各々につき、対応する第2特徴点Pを設定すると、制御部4は、主記憶6から、いずれの文字領域にも含まれない第1特徴点P n(n=1〜N6)と、その第1特徴点P における特徴量C を読み出す(S121)。また、制御部4は、主記憶6から、いずれの文字領域にも含まれない第2特徴点P q(q=1〜N7)と、その第2特徴点P における特徴量C を読み出す(S122)。なお、S121及びS122のステップは、例えば図形が描かれている領域から抽出された特徴点の取得を意図するものである。
そして、制御部4は、第1特徴点P の各々につき、以下の処理を実行する。
すなわち、制御部4は、S107のステップと同様にして、複数の第2特徴点P のうちで、第1特徴点P の第2特徴点候補Pを特定する(S123)。図形が描かれている領域から類似の画像特徴を示す特徴量が複数抽出されることはないので、S123のステップでは、通常、1つの第1特徴点P につき1つの第2特徴点候補Pが特定される。
そこで、制御部4は、制御部4は、S123のステップで特定した第2特徴点候補Pを、第1特徴点P に対応する第2特徴点Pとして設定する(S124)。
図4A〜図4Cに示す処理により、第1文書画像14aから抽出された第1特徴点Pの一つ一つについて対応する第2特徴点Pが決定されると、制御部4は、各第1特徴点Pが、対応する第2特徴点Pに一致するようにするための変形パラメータを算出する。そして、制御部4は、変形パラメータを用いて第1文書画像14aを変形し、変形した第1文書画像14aと第2文書画像14bとを合成してなる合成文書画像(図2C参照)を生成することになる。
この画像処理装置2では、各第1特徴点Pにつき、その第1特徴点Pと類似の画像特徴を示す第2特徴点Pが第2特徴点候補として特定される。そして、或る第1特徴点P(以下、注目第1特徴点Pと表記する)の第2特徴点候補が複数存在する場合には、注目第1特徴点Pに対する他の第1特徴点Pの相対的位置と、「注目第1特徴点Pの第2特徴点候補」に対する「上記他の第1特徴点Pの第2特徴点候補」の相対的位置と、の比較結果に基づいて、注目第1特徴点Pの第2特徴点候補のうちから注目第1特徴点Pに対応する第2特徴点Pが選択される。そのため、第1文書画像14aから抽出された特徴点と類似の特徴を示す特徴点が第1文書画像14bから複数抽出された場合でも、第1文書画像14aから抽出された特徴点、に対応する一の特徴点が高い精度で特定されるようになる。
また、注目第1特徴点Pに対する他の第1特徴点Pの相対的位置が、「注目第1特徴点Pにおけるオリエンテーション」に対する「注目第1特徴点Pから他の第1特徴点Pまで方向」の回転角度として表現される。また、「注目第1特徴点Pの第2特徴点候補」に対する「上記他の第1特徴点Pの第2特徴点候補」の相対的位置が、「注目第1特徴点Pの第2特徴点候補におけるオリエンテーション」に対する「「注目第1特徴点Pの第2特徴点候補から上記他の第1特徴点Pの第2特徴点候補までの方向」の回転角度として表現される。従って、第1文書画像14aの向きとは無関係に、注目第1特徴点Pに対する他の第1特徴点Pの相対的位置が評価される。同様に、第2文書画像14bの向きとは無関係に、「注目第1特徴点Pの第2特徴点候補」に対する「上記他の第1特徴点Pの第2特徴点候補」の相対的位置が評価される。この点からも、第1文書画像14aから抽出された特徴点、に対応する一の特徴点が高い精度で特定されるようになる。
なお、第1文書画像14aの向きと第2文書画像14bの向きとが同じであるならば、第1特徴点P に対する第1特徴点P の相対的位置を示す情報として方向ベクトルvik(S113参照)を用い、かつ、「第1特徴点P の第2特徴点候補P に対する第1特徴点P の第2特徴点候補P の相対的位置」を示す情報として方向ベクトルvjm(S115参照)を用いてもよい。この場合、制御部4は、S117のステップにおいて方向ベクトルvikと方向ベクトルvjmとがなす角度が閾値以下であるか否かを判定し、方向ベクトルvikと方向ベクトルvjmとがなす角度が閾値以下である場合に、S118のステップの処理を実行すればよい。
図7は、画像処理装置2で実現される機能群を示す機能ブロック図である。同図に示すように、画像処理装置2では、第1特徴点取得部16、第2特徴点取得部18、マッチング20、第2特徴点候補特定部22、相対位置算出部24、評価部26、設定部28、パラメータ算出部30、幾何変換部32、及び合成部34が実現される。これらの機能は、制御部4が上記プログラムに従って動作することで実現される。
第1特徴点取得部16は、第1文書画像14a内のいずれかの文字領域に含まれる複数の第1特徴点P と、これらの第1特徴点P における特徴量C と、を取得する(S104参照)。また、第2特徴点取得部18は、第2文書画像14b内のいずれかの文字領域に含まれる複数の第2特徴点P と、これらの第2特徴点P における特徴量C と、を取得する(S106参照)。
マッチング部20は、第1特徴点P の各々につき、複数の第2特徴点P のうち一の第2特徴点Pを、当該第1特徴点P に対応する一の第2特徴点Pとして設定する。すなわち、マッチング部20は、第1特徴点P の一つ一つを注目第1特徴点P として以下の処理を実行する。
すなわち、第2特徴点候補特定部22は、注目第1特徴点P の第2特徴点候補P を、注目第1特徴点P における特徴量C と各第2特徴点P における特徴量C との比較結果に基づいて特定する(S107参照)。また、第2特徴点候補特定部22は、「複数の第1特徴点P のうちの、注目第1特徴点Pとは異なる文字領域に含まれる第1特徴点P 」の第2特徴点候補P を、第1特徴点P における特徴量C と各第2特徴点P における特徴量C との比較結果に基づいて特定する(S112参照)。
また、相対位置算出部24は、注目第1特徴点P に対する第1特徴点P の相対位置を算出する。また、相対位置算出部24は、「注目第1特徴点P の第2特徴点候補P 」に対する「第1特徴点P の第2特徴点候補P 」の相対位置も算出する。本実施形態の場合、相対位置算出部24は、角度θik及び角度θjmを算出する(S114及びS116参照)。
また、評価部26は、両相対位置の比較結果に基づいて、注目第1特徴点P の第2特徴点候補P の評価に関する評価値Vを生成する(S117及びS118参照)。そして、設定部28が、評価値Vに応じて、第2特徴点候補P を、注目第1特徴点P に対応する第2特徴点Pとして設定する(S119)。
なお、パラメータ算出部30は、各第1特徴点Pが、対応する第2特徴点Pに一致するように第1文書画像14aを変形するための変形パラメータ(幾何変換パラメータ)を算出する。また、幾何変換部32は、変形パラメータを用いて第1文書画像14aを幾何変換し、合成部34が、幾何変換された第1文書画像14aと、第2文書画像14bと、を合成してなる合成文書画像(図2C参照)を生成することとなる。
なお、本発明の実施形態は、上記実施形態だけに限らない。
例えば、特徴量はSURF(Speeded Up Robust Features)法により取得されるSURF特徴量であってもよい。
2 画像処理装置、4 制御部、6 主記憶、8 操作入力部、10 表示部、12 ハードディスク、14a 第1文書画像、14b 第2文書画像、16 第1特徴点取得部、18 第2特徴点取得部、20 マッチング部、22 第2特徴点候補特定部、24 相対位置算出部、26 評価部、28 設定部、30 パラメータ算出部、32 幾何変換部、34 合成部、P 第1特徴点、P 第2特徴点。

Claims (5)

  1. 文字に対応する文字領域を複数含む第1画像から抽出された複数の第1特徴点のうちのいずれかである注目第1特徴点につき、第2画像から抽出された複数の第2特徴点のうちで、前記注目第1特徴点に対応する第2特徴点の候補となる第2特徴点候補を、前記注目第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第1特定手段と、
    前記複数の第1特徴点のうちの、前記注目第1特徴点とは異なる文字領域に含まれる他の第1特徴点につき、前記複数の第2特徴点のうちで、第2特徴点候補を、前記他の第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第2特定手段と、
    前記注目第1特徴点に対する前記他の第1特徴点の相対的な位置と、前記注目第1特徴点の第2特徴点候補に対する前記他の第1特徴点の第2特徴点候補の相対的な位置と、の比較結果に基づいて、前記注目第1特徴点の第2特徴点候補の評価に関する評価情報を生成する評価手段と、
    前記評価情報に応じて、前記注目第1特徴点の第2特徴点候補を、前記注目第1特徴点に対応する第2特徴点として設定する設定手段と、
    を含むことを特徴とする画像処理装置。
  2. 前記評価手段は、
    前記注目第1特徴点における特徴量が示す代表方向に対して前記注目第1特徴点から前記他の第1特徴点への方向がなす角度と、前記注目第1特徴点の第2特徴点候補における特徴量が示す代表方向に対して前記注目第1特徴点の第2特徴点候補から前記他の第1特徴点の第2特徴点候補への方向がなす角度と、の比較結果に基づいて、前記評価情報を生成すること、
    を特徴とする請求項1に記載の画像処理装置。
  3. 前記他の第1特徴点は、前記注目第1特徴点を含む文字領域とは異なる行又は列に位置する文字領域に含まれる第1特徴点であること、
    を特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記他の第1特徴点は、前記注目第1特徴点を含む文字領域とは別種の文字に対応する文字領域に含まれる第1特徴点であること、
    を特徴とする請求項1又は2に記載の画像処理装置。
  5. 文字に対応する文字領域を複数含む第1画像から抽出された複数の第1特徴点のうちのいずれかである注目第1特徴点につき、第2画像から抽出された複数の第2特徴点のうちで、前記注目第1特徴点に対応する第2特徴点の候補となる第2特徴点候補を、前記注目第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第1特定手段、
    前記複数の第1特徴点のうちの、前記注目第1特徴点とは異なる文字領域に含まれる他の第1特徴点につき、前記複数の第2特徴点のうちで、第2特徴点候補を、前記他の第1特徴点における画像特徴を示す特徴量と前記複数の第2特徴点の各々における画像特徴を示す特徴量との比較結果に基づいて特定する第2特定手段、
    前記注目第1特徴点に対する前記他の第1特徴点の相対的な位置と、前記注目第1特徴点の第2特徴点候補に対する前記他の第1特徴点の第2特徴点候補の相対的な位置と、の比較結果に基づいて、前記注目第1特徴点の第2特徴点候補の評価に関する評価情報を生成する評価手段、
    前記評価情報に応じて、前記注目第1特徴点の第2特徴点候補を、前記注目第1特徴点に対応する第2特徴点として設定する設定手段、
    としてコンピュータを機能させるためのプログラム。
JP2011271203A 2011-12-12 2011-12-12 画像処理装置及びプログラム Expired - Fee Related JP5821598B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011271203A JP5821598B2 (ja) 2011-12-12 2011-12-12 画像処理装置及びプログラム
US13/538,324 US9111141B2 (en) 2011-12-12 2012-06-29 Image processing apparatus, non-transitory computer readable medium storing program, and image processing method
CN201210379939.4A CN103177438B (zh) 2011-12-12 2012-10-09 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011271203A JP5821598B2 (ja) 2011-12-12 2011-12-12 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2013122702A JP2013122702A (ja) 2013-06-20
JP5821598B2 true JP5821598B2 (ja) 2015-11-24

Family

ID=48572036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011271203A Expired - Fee Related JP5821598B2 (ja) 2011-12-12 2011-12-12 画像処理装置及びプログラム

Country Status (3)

Country Link
US (1) US9111141B2 (ja)
JP (1) JP5821598B2 (ja)
CN (1) CN103177438B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015004943B4 (de) * 2015-04-17 2017-03-30 Diehl Bgt Defence Gmbh & Co. Kg Verfahren zur Richtungskalibration von Kameras eines Kamerasystems

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3940012B2 (ja) * 2002-03-27 2007-07-04 富士通株式会社 マッチングプログラムおよびマルチメディアコンテンツ編集プログラム
US8036497B2 (en) * 2005-03-01 2011-10-11 Osaka Prefecture University Public Corporation Method, program and apparatus for storing document and/or image using invariant values calculated from feature points and method, program and apparatus for retrieving document based on stored document and/or image
CN101133429B (zh) * 2005-03-01 2010-10-06 公立大学法人大阪府立大学 文档和/或图像检索方法、文档和/或图像存储设备和检索设备
JP2008059546A (ja) * 2006-08-03 2008-03-13 Sharp Corp 画像処理装置、画像読取装置、画像形成装置、画像処理方法、コンピュータプログラム、及び記録媒体
JP4361946B2 (ja) * 2007-08-07 2009-11-11 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体
CN101377847B (zh) * 2007-08-29 2010-06-02 中国科学院自动化研究所 一种文档图像的配准及特征点选取方法
JP5269707B2 (ja) 2009-07-01 2013-08-21 富士フイルム株式会社 画像合成装置及び方法

Also Published As

Publication number Publication date
JP2013122702A (ja) 2013-06-20
US20130148892A1 (en) 2013-06-13
CN103177438B (zh) 2017-03-01
US9111141B2 (en) 2015-08-18
CN103177438A (zh) 2013-06-26

Similar Documents

Publication Publication Date Title
EP2579210A1 (en) Face feature-point position correction device, face feature-point position correction method, and face feature-point position correction program
CN108573471B (zh) 图像处理装置、图像处理方法以及记录介质
Lindblad et al. Linear time distances between fuzzy sets with applications to pattern matching and classification
US20120257833A1 (en) Image processing apparatus, image processing method, and computer readable medium
JP6383189B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5762730B2 (ja) 人検出装置および人検出方法
CN107945221B (zh) 一种基于rgb-d图像的三维场景特征表达与高精度匹配方法
US8923610B2 (en) Image processing apparatus, image processing method, and computer readable medium
JP6054831B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
EP3300025A1 (en) Image processing device and image processing method
JP5914732B2 (ja) 画像検証方法、画像検証装置、およびプログラム
JP2009163682A (ja) 画像識別装置及びプログラム
CN107527348B (zh) 基于多尺度分割的显著性检测方法
JP5988286B1 (ja) プログラム及び画像処理装置
JP6188345B2 (ja) 情報処理装置、情報処理方法
JP5821598B2 (ja) 画像処理装置及びプログラム
JP5764527B2 (ja) 画像検証方法、画像検証装置、およびプログラム
JP6643416B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2006234678A (ja) 目標識別装置
JP2011194105A (ja) 注視点計測装置、注視点計測方法、プログラムおよび記憶媒体
US9633429B2 (en) Pattern outline extraction device, pattern outline extraction method, and computer program product
JP2011150626A (ja) 画像分類方法、装置、及びプログラム
JP6017005B2 (ja) 画像検索装置、画像検索方法及びプログラム
JP6894398B2 (ja) オブジェクト追跡装置、オブジェクト追跡方法、及びオブジェクト追跡プログラム
JP2018526753A (ja) 物体認識装置、物体認識方法及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150921

R150 Certificate of patent or registration of utility model

Ref document number: 5821598

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees