JP6976733B2 - 画像処理装置、画像処理方法、およびプログラム - Google Patents

画像処理装置、画像処理方法、およびプログラム Download PDF

Info

Publication number
JP6976733B2
JP6976733B2 JP2017117235A JP2017117235A JP6976733B2 JP 6976733 B2 JP6976733 B2 JP 6976733B2 JP 2017117235 A JP2017117235 A JP 2017117235A JP 2017117235 A JP2017117235 A JP 2017117235A JP 6976733 B2 JP6976733 B2 JP 6976733B2
Authority
JP
Japan
Prior art keywords
image
feature points
edge
image processing
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017117235A
Other languages
English (en)
Other versions
JP2019004305A (ja
JP2019004305A5 (ja
Inventor
茂雄 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017117235A priority Critical patent/JP6976733B2/ja
Priority to US16/004,989 priority patent/US10970845B2/en
Priority to EP18176947.2A priority patent/EP3416099A1/en
Priority to CN201810615586.0A priority patent/CN109089035B/zh
Publication of JP2019004305A publication Critical patent/JP2019004305A/ja
Publication of JP2019004305A5 publication Critical patent/JP2019004305A5/ja
Application granted granted Critical
Publication of JP6976733B2 publication Critical patent/JP6976733B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3876Recombination of partial images to recreate the original image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • G06T7/337Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、複数の画像を合成して合成画像を生成する画像処理装置に関する。
カメラを使って帳票などの紙文書を撮像し文字認識を行って、紙文書に記載されている情報を抽出することが行われている。しかし、紙文書の用紙サイズやカメラの撮像素子の解像度によっては、撮像された画像から十分な精度で情報を抽出することができない場合がある。そこで、用紙全体を1回で撮像せずに複数回に分けて撮像し、複数回の撮像により得られた各画像を合成することで用紙全体が含まれる1枚の画像を生成し、生成された合成画像を対象に文字認識を行って情報を抽出することが行われている。特許文献1には、重複領域を有する2枚の画像から両画像において対応する特徴点を抽出し、抽出された特徴点から導出した透視投影変換の変換パラメータを用いて画像合成を行う方法が記載されている。特許文献2には、消失点検出によって画像の歪みを補正する方法が記載されている。
特開2004−342067号公報 特開2002−57879号公報
画像を合成するときに用いられる変換パラメータに誤差があると、合成画像において歪みが発生する可能性がある。また、本来は直線として繋がらなければならない部分(例えば、帳票の罫線)が折れ曲がったり繋がらなかったりすることがある。したがって、合成画像に対して十分な精度で情報抽出が行えるように、上記のような画像の歪みや罫線のずれを抑える必要がある。
そこで、本発明は、画像合成に用いる変換パラメータを少ない誤差で算出することができ、最終的に生成される合成画像に現れる歪みを小さくすることができる画像処理装置を提供することを目的とする。
本発明による画像処理装置は、紙文書を撮像して得られる画像であって撮像範囲が各々異なるとともに各画像間に重複領域が存在する第1の画像と第2の画像との各画像から、両画像間で互いに対応する特徴点を抽出する特徴点抽出手段と、各画像から両画像間で互いに対応するエッジを抽出するエッジ抽出手段と、各画像から紙文書が属する平面の消失点を検出する消失点検出手段と、抽出された特徴点と検出された消失点とを結ぶ直線と抽出されたエッジとの交点に対応する座標を用いて、画像合成のための変換パラメータを導出する変換パラメータ導出手段と、導出された変換パラメータを用いて第1の画像と第2の画像とを合成する画像合成手段と、を備えることを特徴とする。
本発明によれば、画像合成に用いる変換パラメータを少ない誤差で算出することができ、最終的に生成される合成画像に現れる歪みを小さくすることができる。
本発明の第1実施形態の画像処理装置の構成を示すブロック図である。 撮像された画像から合成画像が生成されるまでの処理の流れを示すフローチャートである。 処理対象となる帳票が複数回に分けて撮像される様子を示す図である。 消失点の検出方法の一例を示す図である。 合成対象とする画像の組み合わせを説明するための図である。 第1実施形態においてステップS208で行われる4点選択処理を示すフローチャートである。 第1実施形態において透視投影変換のパラメータ算出に使用する4点が選択される様子を示す図である。 第2実施形態においてステップS208で行われる4点選択処理を示すフローチャートである。 第2実施形態において透視投影変換のパラメータ算出に使用する4点が選択される様子を示す図である。 マッチングした特徴点が1点だけである場合に選択される、透視投影変換のパラメータ算出に使用する4点を示す図である。
[実施形態1]
図1は、本発明の第1実施形態の画像処理装置の構成を示すブロック図である。本実施形態における画像処理装置10は、撮像部101、画像記憶部102、特徴点検出部103、消失点検出部104、特徴点マッチング部105、エッジ検出部106、変換パラメータ導出部107、及び画像合成部108を含む。なお、撮像部101及び画像記憶部102は、画像処理装置10の外部に設置されていてもよい。
撮像部101は、被写体を撮像し、画像データを取得する。本実施形態では、紙面の縦横に罫線が描かれているような帳票を被写体とする。画像記憶部102は、撮像部101が取得した画像データを記憶する。画像記憶部102は、例えば、RAMあるいはフラッシュメモリやHDDなどを用いた記憶装置である。特徴点検出部103は、画像記憶部102に記憶されている画像データから特徴点を抽出する。特徴点検出部103は、コーナー検出、SIFTなどの手段を用いて特徴点を検出し、検出した点を中心とした周囲の画素から正規化した特徴量を抽出する。消失点検出部104は、画像記憶部102に記憶されている画像データから消失点を検出する。消失点検出部104は、画像データによって示される画像内にある紙端や、罫線や、1文字の領域を検出しその重心となる座標を複数並べて構成される線などを、消失点へ向かう直線として取得する。そして、消失点検出部104は、それらの直線の交点を消失点として検出する。特徴点マッチング部105は、特徴点検出部103によって画像データから得られた特徴点とその特徴点が有する特徴量を、2つの画像データの間で比較し類似度を算出する。そして、特徴点マッチング部105は、両画像データの間で対応する特徴点を抽出する。エッジ検出部106は、画像記憶部102に記憶されている画像データからエッジを検出し、検出されたエッジに含まれる画素を使ってハフ変換することで、直線を表す関数を得る。そして、エッジ検出部106は、両画像データの間で対応するエッジを抽出する。エッジ検出は、Sobelフィルタ、Laplacian、Cannyなどの手法のいずれかが用いられる。なお、それら複数の手法で得られた結果を組み合わせてエッジを検出するようにしてもよい。変換パラメータ導出部107は、画像合成のための変換パラメータを導出する。より具体的には、変換パラメータ導出部107は、消失点検出部104で取得された消失点と、特徴点マッチング部105で抽出された特徴点と、エッジ検出部106で抽出されたエッジ(直線)とから、透視投影変換の変換パラメータ(変換行列)を算出する。画像合成部108は、撮像部101によって撮像された複数の画像データを、変換パラメータ導出部107で得られた変換パラメータに従って変換し、合成された画像データを生成する。以下、画像データを単に画像と表現する場合がある。
図2は、撮像された画像から合成画像が生成されるまでの処理の流れを示すフローチャートである。
ステップS201では、撮像部101が、被写体を撮像して画像データを取得する。取得された画像データは、画像記憶部102に記憶される。図3は、処理対象となる帳票が複数回に分けて撮像される様子を示す図である。図3(a)には、帳票全体が3回に分けて撮像される様子が示されている。図3(b)には、帳票全体が6回に分けて撮像される様子が示されている。図3(c)には、帳票全体が9回に分けて撮像される様子が示されている。図中における四角い枠は撮像範囲を示し、枠内における数字は何番目の撮像範囲であるかを示す。なお、帳票を撮像する方法は、撮像部の位置を固定して被写体(用紙)の位置を移動させて撮像する据え置き撮像方法であってもよいし、被写体の位置を固定して撮像部の位置を移動させて撮像する手持ち撮影であってもよい。なお、以下では、帳票を手持ち撮影により、図3(b)に示されるように6回に分けて撮像して得られる、撮像範囲が異なる6つの部分画像を合成して、帳票の全体画像を生成する場合を例にする。
ステップS202では、画像合成部108が、処理対象となる画像データが全て取得されたかどうかを判定する。処理対象となる画像データとは、ここでは、図3(b)に示す6つの撮像範囲を撮像して得られる6つの画像データのことである。処理対象となる画像データが全て取得されていれば(ステップS202のYES)、処理はステップS210に進む。一方、処理対象となる画像データが全て取得されていなければ、処理はステップS203に進む。処理対象となる画像データが全て取得されたかどうかは、例えば、撮影完了を示す操作を使用者に行わせることによって判断可能である。また例えば、縮小された画像を対象にして合成した画像を生成し、生成した合成画像に紙面全体が含まれることを検出して判断することもできる。
ステップS203では、特徴点検出部103が、撮像部101により新規に取得された画像データから特徴点を検出する処理を行う。
ステップS204では、消失点検出部104が、ステップS203で処理された画像データから消失点を検出する処理を行う。図4は、消失点の検出方法の一例を示す図である。図4に示すように、消失点検出部104は、画像データからエッジ検出や特徴点検出を行い、ハフ変換で直線を表す関数を得る。そして、消失点検出部104は、それらの関数を大量に集めて、各関数によって表される直線の交点をRANSAC(RANDom SAmple Consensus)を用いてフィッティングすることで、消失点を検出する。
ステップS205では、特徴点マッチング部105が、ステップS203,S204で処理された画像データが2枚目以降の画像データであるかどうかを判定する。2枚目以降であれば(ステップS205のYES)、処理はステップS206に進む。2枚目以降でなければ(ステップS205のNO)、処理はステップS201に戻る。
ステップS206では、特徴点マッチング部105が、特徴点マッチングを行う。具体的には、特徴点マッチング部105は、撮像部101により新規に取得された画像データから検出された特徴点をキーとし、それ以前に取得された画像データから検出された特徴点とのマッチングを行う。そして、特徴点マッチング部105は、特徴量がマッチする特徴点を抽出する。この特徴点抽出処理により多数の特徴点が抽出された場合は、特徴点マッチング部105は、特徴点のフィルタリングを行う。本実施形態では、特徴点マッチング部105は、抽出された特徴点から4組の特徴点を選択し透視投影変換の変換パラメータを求め、RANSACを用いて変換パラメータをフィッティングし、外れ値となる特徴点を除外することで特徴点のフィルタリングを行う。
ステップS207では、変換パラメータ導出部107が、ステップS206で得られた特徴点のマッチング結果によって、透視投影変換の変換パラメータを算出する画像の組み合わせ、すなわち合成対象とする画像の組み合わせを選択する。図5(a)に示すように、3枚目の画像が撮像された場合、ステップS206において1枚目の画像と2枚目の画像とに対して特徴点マッチングが行われる。1枚目の画像と3枚目の画像とにも重複領域があるため、1枚目の画像と3枚目の画像との間でもマッチングする特徴点が得られる。しかし、1枚目の画像と3枚目の画像との重複領域は小さいため、変換パラメータ導出部107は、1枚目の画像と3枚目の画像とを透視投影変換のパラメータ算出の組み合わせとしない。したがって、2枚目の画像と3枚目の画像が透視投影変換のパラメータ算出の組み合わせとして選択される。図5(b)に示すように、4枚目の画像が撮像された場合は、4枚目の画像と、1枚目、2枚目、及び3枚目の各画像との間に重複領域が存在する。しかし、2枚目の画像と4枚目の画像との重複領域が小さいため、1枚目の画像と3枚目の画像とを、4枚目の画像に対する透視投影変換のパラメータ算出の組み合わせとする。
ステップS208では、透視投影変換のパラメータ算出に使用する4点の組み合わせ、すなわち2枚の画像を合成するために必要となる4点の組み合わせが決定される。この処理(以下、4点選択処理という)は、エッジ検出部106及び変換パラメータ導出部107により実行される。4点選択処理の詳細は図6を用いて後述する。
ステップS209では、変換パラメータ導出部107が、ステップS208で決定された4点の組み合わせから、透視投影変換のパラメータを推定(算出)する。ステップS206〜S209の処理によって、ステップS201で撮像部101により新規に取得された画像データについて、それ以前に取得された画像データに対する変換パラメータが求まる。
ステップS210では、画像合成部108が、画像合成を行う。ここでは、画像合成部108は、ステップS201〜S209の処理で求まった変換パラメータを用いて、図3(b)に示す6つの撮像範囲に対応する画像データを合成する。画像合成部108は、合成元となる1枚の画像を選択し、選択した画像に対して他の画像を重ね合わせることで画像を合成する。合成元の画像として、最初に撮像された画像を選択してもよいし、最後に撮像された画像を選択してもよいし、帳票の中心付近を撮像範囲とする画像を選択してもよい。また、合成元の画像を変更しながら合成を行うようにしてもよい。なお、この段階では、合成元の画像が有する透視投影歪みが補正されていない。したがって、画像合成部108は、ステップS204で既に抽出済みである合成元の画像から検出された消失点の情報を用いて、合成画像を正面から撮像された状態に補正する。
以上の処理によって、複数回の撮影によって得られた画像を合成して、1枚の合成画像を生成することができる。
次に、図6を用いて、ステップS208で行われる4点選択処理を説明する。図6は、第1実施形態においてステップS208で行われる4点選択処理を示すフローチャートである。透視投影変換のパラメータ算出に使用する4点間の距離が小さいと、画素を単位としてそれらの点を対応付けした場合に、画素の表現の誤差の影響が算出される変換パラメータに大きく表れてしまう。そのため、以下の処理では、点間の距離がより大きくなうように透視投影変換のパラメータ算出に使用する4点を選択する。
まず、変換パラメータ導出部107は、ステップS207の処理でマッチした特徴点を対象にして、特徴点間の距離が最大となる4つの特徴点の組み合わせを決定し、初期値とする(ステップS601)。特徴点間の距離が最大となる組み合わせとは、各特徴点の間の距離が最大になる組み合わせ、すなわち各特徴点で囲われた面積が最大になる組み合わせである。
次いで、変換パラメータ導出部107は、特徴点間の距離があらかじめ定めた一定値以上あるかを判定する(ステップS602)。例えば、各特徴点がいずれも画像上で1000ピクセル以上離れている場合は(ステップS602のYES)、変換パラメータ導出部107は、透視投影変換のパラメータに与える影響が小さいと判断し、処理を終了する。この場合、それらの特徴点の座標から変換パラメータが算出されることになる。特徴点間の距離があらかじめ定めた一定値に満たない場合は(ステップS602のNO)、処理はステップS603に移行する。ステップS603以降の処理では特徴点の置き換えが行われる。なお、ステップS602の判定処理において、特徴点間の距離で判定する代わりに、各特徴点で囲われた面積があらかじめ定めた一定値以上あるかを判定するようにしてもよい。
次いで、エッジ検出部106が、2枚の画像からエッジを検出する(ステップS603)。このエッジ検出処理によって、エッジ上にある画素が特定され、それらの座標が取得できる。
次いで、エッジ検出部106は、ステップS603で検出されたエッジから、両画像間で対応するエッジを抽出するエッジ抽出処理を行う(ステップS604)。紙面外には特徴点が検出されないことや、エッジを境界に紙面と紙面外の色に違いがあることなどの条件によって、紙端のエッジを特定することができる。また、紙面に含まれる罫線などの直線についても特定可能であり、両画像間で対応づけすることができる。紙端以外の直線については、例えば、紙端のエッジを基準にしたり、直線の周囲にある文字や特徴点などの情報を基準にしたりして、対応付けすることができる。
次いで、エッジ検出部106は、特徴点を再配置させるエッジを、ステップS604の処理で抽出されたエッジの中から選択する(ステップS605)。本実施形態では、エッジ検出部106は、紙端のエッジと紙端のエッジから一番離れたエッジとを選択し、それらのエッジを構成する画素の座標からハフ変換によって直線を表現する関数を得る。なお、図3(c)に示すように、帳票を9回に分けて撮像した場合には中央の画像からは紙端のエッジが検出されない。したがって、そのような画像に対しては、例えば、抽出されたエッジのうち、互いの距離が最も大きい2本のエッジを選択するようにすればよい。
次いで、エッジ検出部106は、ステップS601で得られた4つの特徴点と、図2に示すステップS204で検出済みの消失点とを結ぶ直線を求め、それらの直線とステップS605で選択したエッジの直線との交点を求める(ステップS606)。それぞれの直線は1次関数で表現されるため、交点の座標は小数点以下の座標情報を含んだ状態で得られる。
次いで、変換パラメータ導出部107は、ステップS606で得られた交点の中から、各特徴点を再配置させる交点をそれぞれ選択する(ステップS607)。図7(a)に示す2枚の画像#1,#2を合成するための変換パラメータを求める場合は、図7(b)に示す交点A´,B´,C´,D´が選択される。図7(b)に示す点線で表される線は、特徴点と消失点とを結ぶ直線である。本実施形態では、各エッジのそれぞれについて、エッジから1番目に近い特徴点と2番目に近い特徴点とを、該エッジに再配置させる。したがって、図7(b)において、特徴点A,Bは、上側のエッジ上の交点A´,B´に再配置され、特徴点C,Dは下側のエッジ上の交点C´,D´に再配置される。
このように、特徴点A,B,C,Dを交点A´,B´,C´,D´に再配置させることにより、再配置後における特徴点間の距離を、再配置前における特徴点間の距離よりも大きくすることができる。また、特徴点A,B,C,Dを、直線上にある交点A´,B´,C´,D´に再配置することにより、2枚の画像を合成する際に直線と直線とが重ね合わさるようになる。そのため、帳票の紙端や帳票内の罫線が途切れたり折れ曲がったりすることを防止することができ、合成による画像のずれを目立たなくすることができる。
なお、ステップS604の処理で求められたエッジが1本のみの場合には、当該エッジから1番目と2番目に近い特徴点のみが再配置される。例えば、図7(c)に示すように、2枚の画像で対応するエッジが紙端に対応するエッジのみであった場合には、特徴点C,Dが、交点C´,D´に再配置される。
以上に説明したように、本実施形態によれば、画像合成のための変換パラメータの算出に必要な4点の距離をできる限り大きくすることができ、誤差の少ない変換パラメータを求めることができる。また、本実施形態では、小数点以下の座標情報を有する、エッジ上の点を、変換パラメータの算出に用いる。また、本実施形態では、小数点以下の座標情報を有する交点の座標を変換パラメータの算出に用いるので、変換パラメータの誤差をさらに低減させることができる。この結果最終的に生成される合成画像に現れる歪みを小さくすることができる。
画像は最小単位である画素の集合として表現されるため、合成する2枚の画像において、一方の画像における1画素が、他方の画像においては、複数の画素から構成される領域の一部になってしまうことがある。そのため、合成後の画像において直線(紙文書の紙端や紙文書内の罫線)が途切れたり折れ曲がったりする場合がある。しかし、本実施形態では、エッジ上の点を対応付けているので、帳票などの罫線を含む紙文書を被写体とした場合でも、合成後の画像において直線が途切れたり折れ曲がったりすることを防止することができる。
なお、本実施形態では、画像の合成時に基準となる画像を選択し、選択した画像に対して他の画像を重ね合わせて合成を行っている。しかし、透視投影変換の変換パラメータに誤差が含まれる場合、後段に行くに従いその誤差の影響が大きくなる。そこで、誤差が少ないと考えられる変換パラメータを用いた合成から順番に実行するようにしてもよい。そのような形態によれば、最終的に生成される画像の歪みをより小さくすることができる。例えば、図3(a)において、画像#1と画像#2との重複領域から抽出された4点間の距離が、画像#2と画像#3との重複領域から抽出された4点間の距離よりも大きい場合には、最初に画像#2と画像#3とが合成される。このように、透視投影変換の変換パラメータを求める4点間の距離で合成順をソートすることによって、合成画像に現れる歪みをさらに目立たなくすることが可能となる。
また、ステップS602において特徴点間の距離が一定値に満たないと判断された場合に、表示装置(図示せず)等を介して、合成時に画像が歪む可能性が高いことを使用者に提示して、再撮影を促すようにしてもよい。その際、撮像すべき範囲を使用者に提示するようにしてもよい。例えば、近接する画像との重複領域が不足している場合には、重複領域を増大させるように撮影範囲を移動させるように促すようにしてもよい。
また、本実施形態では、最終段で画像の合成を行っている。しかし、ステップS204において消失点を求めているので、各画像の透視投影歪みを予め補正しておくことが可能である。よって、例えば、各画像を正面から撮像されたような画像になるように補正してから、特徴点検出や特徴点マッチングを行うようにしても良い。なお、この場合、透視投影歪みの補正後における各画像は、撮影距離によってスケールに違いが生じるため、3点の対応によって求まるアフィン変換によって画像を補正して位置合わせを行う必要がある。したがって、ステップS208の処理が、4点を選択する処理から、3点を選択する処理に変わり、ステップS209の処理では、アフィン変換の変換パラメータ(変換行列)が算出されることになる。なお、その他の処理は透視投影の変換パラメータを導出する場合と同様である。
また、本実施形態では、手持ち撮影で撮像された複数枚の画像を合成する場合について説明した。しかし、書画カメラのように撮像部と撮像対象が置かれる平面(対象平面)との関係が固定される据え置き撮影で撮像された複数枚の画像を合成する場合にも本実施形態を適用可能である。その場合において、常に正面から撮像している画像が撮像できるときには、面内回転のパラメータ(回転行列)を求めればよい。このとき、2枚の画像に存在する特徴点2点の対応が解れば回転と位置合わせを行うことができる。なお、正面から撮像された画像からは、ステップS204において消失点を求めることができない。そのため、ステップS606では、紙端のエッジなど選択したエッジに対して垂線を引くなどして交点を求めることになる。
[実施形態2]
第1実施形態では、ステップS208の処理(4点選択処理)が図6に示すフローに従って実行される例を説明した。しかし、撮影対象によっては、ステップS206でマッチする特徴点の数が4点に満たない場合がある。この場合の処理を、図8を用いて説明する。図8は、第2実施形態においてステップS208で行われる4点選択処理を示すフローチャートである。
まず、変換パラメータ導出部107は、ステップS206で抽出された特徴点が4点以上あるかどうかを判定する(ステップS801)。4点以上あれば(ステップS801のYES)、図6に示すフローに従った処理(ステップS601〜S607の処理)が実行される。4点未満であれば(ステップS801のNO)、処理はステップS802に進む。
次いで、エッジ検出部106は、2枚の画像からエッジを検出する(ステップS802)。この処理は、ステップS603の処理と同様である。
次いで、エッジ検出部106は、ステップS802で検出されたエッジから、両画像間で対応するエッジを抽出する(ステップS803)。この処理は、ステップS604の処理と同様である。ただし、第1実施形態では、紙端のエッジと同一方向のエッジだけを求めたが、本実施形態では、マッチングした特徴点が1点だけの場合は、紙端のエッジに対して垂直方向のエッジ(以下、単に、垂直方向のエッジという。)も抽出して対応付けを行う。この場合、互いの画像から抽出されたエッジは、特徴点からの距離と紙端のエッジに対する方向とによって対応付けられる。
次いで、エッジ検出部106は、特徴点を再配置させるエッジを、ステップS803で抽出されたエッジの中から選択する(ステップS804)。この処理は、ステップS605の処理と同様である。ただし、マッチングした特徴点が1点だけである場合は、エッジ検出部106は、紙端のエッジと紙端のエッジから一番離れたエッジとを選択するとともに、ステップS803で抽出された、垂直方向のエッジから2本のエッジをさらに選択する。なお、垂直方向のエッジが3本以上ある場合には、特徴点を挟んで互いに対抗し、且つ互いの距離が最大である2本のエッジを選択すればよい。
次いで、エッジ検出部106は、ステップS206で抽出された特徴点とステップS204で検出された消失点とを結ぶ直線を求め、それらの直線とステップS804で選択したエッジの直線との交点を求める(ステップS805)。この処理は、ステップS606の処理と同様である。
次いで、変換パラメータ導出部107は、ステップS206で抽出された特徴点と、ステップS805で得られた交点の中から、透視投影変換の変換パラメータを求めるために使用する4点を選択する(ステップS806)。図9(a)に示すように、ステップS206でマッチした特徴点が、特徴点A,Bのみで4点に満たない場合には、図9(b)に示す交点A´,B´,A´´,B´´が選択される。図9(b)に示す交点A´,B´は、特徴点と消失点とを結ぶ直線と、紙端のエッジとの交点である。交点A´´,B´´は、特徴点と消失点とを結ぶ直線と、紙端のエッジから一番離れたエッジとの交点である。ステップS803の処理で抽出されたエッジが1本のみである場合、例えば図9(c)に示すように2枚の画像で対応するエッジが紙端のエッジのみである場合には、特徴点A,Bと交点A´,B´とが選択される。
なお、上述したように、本実施形態では、ステップS206でマッチングした特徴点が1点だけである場合は、ステップS803で垂直方向のエッジも抽出するようにしている。それにより、図10に示すように、垂直方向のエッジを含めた4本のエッジと、2点の消失点と特徴点とを結んで得られる2本の直線との4つの交点を、透視投影変換の変換パラメータを求めるための4点として得ることができる。図10に示す点Cは、消失点と特徴点とを結ぶ直線と、紙端のエッジとの交点を表す。図10に示す点Aは、消失点と特徴点とを結ぶ直線と、紙端のエッジと同方向であるエッジとの交点を表す。図10に示す点B,Dは、特徴点と消失点とを結ぶ直線と、垂直方向のエッジとの交点を表す。
このように、本実施形態によれば、マッチングした特徴点が4点に満たない場合においても、透視投影変換の変換パラメータを求める4点を抽出することができるため、第1の実施形態と同様に、誤差の少ない変換パラメータを求めることができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (16)

  1. 紙文書を撮像して得られる画像であって撮像範囲が各々異なるとともに各画像間に重複領域が存在する第1の画像と第2の画像との各画像から、両画像間で互いに対応する特徴点を抽出する特徴点抽出手段と、
    前記各画像から両画像間で互いに対応するエッジを抽出するエッジ抽出手段と、
    前記各画像から前記紙文書が属する平面の消失点を検出する消失点検出手段と、
    前記抽出された特徴点と前記検出された消失点とを結ぶ直線と前記抽出されたエッジとの交点に対応する座標を用いて、画像合成のための変換パラメータを導出する変換パラメータ導出手段と、
    前記導出された変換パラメータを用いて前記第1の画像と前記第2の画像とを合成する画像合成手段と、を備える
    ことを特徴とする画像処理装置。
  2. 前記変換パラメータ導出手段は、
    前記第1の画像と前記第2の画像との各々において、前記抽出された特徴点のうちの少なくとも1つを前記交点に再配置させ、
    前記再配置後における各特徴点の座標を用いて前記画像合成のための変換パラメータを導出する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記変換パラメータ導出手段は、
    前記再配置後における特徴点間の距離が、前記再配置前における特徴点間の距離より大きくなるように、前記抽出された特徴点のうちの少なくとも1つを前記交点に再配置することを特徴とする請求項2に記載の画像処理装置。
  4. 前記変換パラメータ導出手段は、
    前記再配置前における特徴点間の距離が予め定められた一定値に満たない場合に、前記抽出された特徴点のうちの少なくとも1つを前記交点に再配置する
    ことを特徴とする請求項2または請求項3に記載の画像処理装置。
  5. 前記特徴点抽出手段は、
    前記各画像から、両画像間で互いに対応する4つの特徴点を抽出し、
    前記変換パラメータ導出手段は、
    前記再配置後における前記4つの特徴点の座標を用いて、前記画像合成のための変換パラメータとして透視投影変換の変換行列を導出する
    ことを特徴とする請求項2から請求項4のうちのいずれか1項に記載の画像処理装置。
  6. 前記変換パラメータ導出手段は、
    前記特徴点抽出手段によって4つ以上の特徴点が抽出された場合には、前記抽出された特徴点の中から、特徴点間の距離が最大となる4つの特徴点を選択し、前記再配置後における該4つの特徴点の座標を用いて、透視投影変換の変換行列を導出する
    ことを特徴とする請求項5に記載の画像処理装置。
  7. 前記変換パラメータ導出手段は、
    前記特徴点抽出手段によって抽出された特徴点が4つに満たない場合には、前記再配置前における各特徴点と前記再配置後における各特徴点との中から選択した4つの特徴点の座標を用いて、透視投影変換の変換行列を導出する
    ことを特徴とする請求項5または請求項6に記載の画像処理装置。
  8. 前記変換パラメータ導出手段は、
    前記再配置前における各特徴点と前記再配置後における各特徴点との中から4つの特徴点を選択する際に、特徴点間の距離が最大になるように4つの特徴点を選択する
    ことを特徴とする請求項7に記載の画像処理装置。
  9. 前記特徴点抽出手段は、
    前記各画像から、両画像間で互いに対応する3つの特徴点を抽出し、
    前記変換パラメータ導出手段は、
    前記再配置後における前記3つの特徴点の座標を用いて、前記画像合成のための変換パラメータとしてアフィン変換の変換パラメータを導出する
    ことを特徴とする請求項2から請求項4のうちのいずれか1項に記載の画像処理装置。
  10. 前記特徴点抽出手段は、
    前記各画像から、両画像間で互いに対応する2つの特徴点を抽出し、
    前記変換パラメータ導出手段は、
    前記再配置後における前記2つの特徴点の座標を用いて、前記画像合成のための変換パラメータとして回転行列を導出する
    ことを特徴とする請求項2から請求項4のうちのいずれか1項に記載の画像処理装置。
  11. 前記紙文書が帳票である
    ことを特徴とする請求項1から請求項10のうちのいずれか1項に記載の画像処理装置。
  12. 前記第1の画像および前記第2の画像は、前記紙文書の一部を重複して撮像した重複領域を含んでおり、
    前記特徴点抽出手段は、前記第1の画像における重複領域と、前記第2の画像における重複領域とのそれぞれから、両画像間で互いに対応する特徴点を抽出する
    ことを特徴とする請求項1から請求項11のうちのいずれか1項に記載の画像処理装置。
  13. 前記エッジ抽出手段で抽出されるエッジは、前記紙文書の紙端のエッジ、もしくは、前記紙文書内に含まれる直線のエッジであることを特徴とする請求項1から請求項12のうちのいずれか1項に記載の画像処理装置。
  14. 前記画像処理装置は、
    プログラムを格納するメモリと、
    前記プログラムを実行するプロセッサと、を備え、
    前記プロセッサは、前記プログラムを実行して、前記特徴点抽出手段と前記エッジ抽出手段と前記消失点検出手段と前記変換パラメータ導出手段と前記画像合成手段として機能することを特徴とする請求項1から請求項13のうちのいずれか1項に記載の画像処理装置。
  15. 紙文書を撮像して得られる画像であって撮像範囲が各々異なるとともに各画像間に重複領域が存在する第1の画像と第2の画像との各画像から、両画像間で互いに対応する特徴点を抽出する特徴点抽出ステップと、
    前記各画像から両画像間で互いに対応するエッジを抽出するエッジ抽出ステップと、
    前記各画像から前記紙文書が属する平面の消失点を検出する消失点検出ステップと、
    前記抽出された特徴点と前記検出された消失点とを結ぶ直線と前記抽出されたエッジとの交点に対応する座標を用いて、画像合成のための変換パラメータを導出する変換パラメータ導出ステップと、
    前記導出された変換パラメータを用いて前記第1の画像と前記第2の画像とを合成する画像合成ステップと、を含む
    ことを特徴とする画像処理方法。
  16. コンピュータを、請求項1から請求項13のうちのいずれか1項に記載の画像処理装置として機能させるためのプログラム。
JP2017117235A 2017-06-14 2017-06-14 画像処理装置、画像処理方法、およびプログラム Active JP6976733B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017117235A JP6976733B2 (ja) 2017-06-14 2017-06-14 画像処理装置、画像処理方法、およびプログラム
US16/004,989 US10970845B2 (en) 2017-06-14 2018-06-11 Image processing apparatus, image processing method, and storage medium
EP18176947.2A EP3416099A1 (en) 2017-06-14 2018-06-11 Image processing apparatus, image processing method, and a program
CN201810615586.0A CN109089035B (zh) 2017-06-14 2018-06-14 图像处理设备和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017117235A JP6976733B2 (ja) 2017-06-14 2017-06-14 画像処理装置、画像処理方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2019004305A JP2019004305A (ja) 2019-01-10
JP2019004305A5 JP2019004305A5 (ja) 2020-07-30
JP6976733B2 true JP6976733B2 (ja) 2021-12-08

Family

ID=62599461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017117235A Active JP6976733B2 (ja) 2017-06-14 2017-06-14 画像処理装置、画像処理方法、およびプログラム

Country Status (4)

Country Link
US (1) US10970845B2 (ja)
EP (1) EP3416099A1 (ja)
JP (1) JP6976733B2 (ja)
CN (1) CN109089035B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992408B (zh) * 2015-06-30 2018-06-05 百度在线网络技术(北京)有限公司 用于用户终端的全景图像生成方法和装置
CN107480710B (zh) * 2017-08-01 2020-05-22 歌尔股份有限公司 特征点匹配结果处理方法和装置
US11393114B1 (en) * 2017-11-08 2022-07-19 AI Incorporated Method and system for collaborative construction of a map
CN110287854B (zh) * 2019-06-20 2022-06-10 北京百度网讯科技有限公司 表格的提取方法、装置、计算机设备和存储介质
JP7223977B2 (ja) 2019-09-13 2023-02-17 パナソニックIpマネジメント株式会社 収穫ロボットシステム
CN111145124A (zh) * 2019-12-30 2020-05-12 北京华宇信息技术有限公司 一种图像倾斜的校正方法及装置
CN112241714B (zh) * 2020-10-22 2024-04-26 北京字跳网络技术有限公司 图像中指定区域的识别方法、装置、可读介质和电子设备

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3045804A (en) 1959-08-10 1962-07-24 Deere & Co Material-handling apparatus
JP3728040B2 (ja) * 1996-12-27 2005-12-21 キヤノン株式会社 画像形成装置及び方法
US6038074A (en) * 1997-05-20 2000-03-14 Ricoh Company, Ltd. Three-dimensional measuring apparatus and method, image pickup apparatus, and apparatus and method for inputting image
JP4324271B2 (ja) * 1999-04-16 2009-09-02 株式会社リコー 画像処理装置およびその方法
JP4169462B2 (ja) * 1999-08-26 2008-10-22 株式会社リコー 画像処理方法及び装置、デジタルカメラ、画像処理システム、並びに、画像処理プログラムを記録した記録媒体
JP2001128051A (ja) * 1999-10-27 2001-05-11 Ricoh Co Ltd 撮像装置
JP4010754B2 (ja) * 2000-08-10 2007-11-21 株式会社リコー 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体
JP2004342067A (ja) 2003-04-22 2004-12-02 3D Media Co Ltd 画像処理方法、画像処理装置、及びコンピュータプログラム
JP3852934B2 (ja) * 2003-05-20 2006-12-06 株式会社バンダイナムコゲームス 画像処理システム、プログラム及び情報記憶媒体
JP4363151B2 (ja) * 2003-10-14 2009-11-11 カシオ計算機株式会社 撮影装置、その画像処理方法及びプログラム
JP3925521B2 (ja) * 2004-08-19 2007-06-06 セイコーエプソン株式会社 スクリーンの一部の辺を用いたキーストーン補正
WO2007023715A1 (en) * 2005-08-25 2007-03-01 Ricoh Company, Ltd. Image processing method and apparatus, digital camera, and recording medium recording image processing program
US7330604B2 (en) * 2006-03-02 2008-02-12 Compulink Management Center, Inc. Model-based dewarping method and apparatus
JP4757142B2 (ja) * 2006-08-10 2011-08-24 キヤノン株式会社 撮影環境校正方法及び情報処理装置
CN101192269B (zh) 2006-11-29 2012-05-02 佳能株式会社 从图像估计消失点的方法和装置、计算机程序及其存储介质
CN101267493B (zh) 2007-03-16 2011-01-19 富士通株式会社 透视变形文档图像的校正装置和校正方法
CN101789122B (zh) 2009-01-22 2013-06-26 佳能株式会社 用于校正畸变文档图像的方法和系统
CN102194212B (zh) 2010-03-08 2013-09-25 佳能株式会社 图像处理方法、装置及系统
CN102012629B (zh) 2010-11-25 2012-07-04 上海合合信息科技发展有限公司 用于文本图像拼接的拍摄方法
WO2012145822A1 (en) * 2011-04-25 2012-11-01 Magna International Inc. Method and system for dynamically calibrating vehicular cameras
JP5882693B2 (ja) * 2011-11-24 2016-03-09 株式会社トプコン 航空写真撮像方法及び航空写真撮像装置
US10289924B2 (en) * 2011-10-17 2019-05-14 Sharp Laboratories Of America, Inc. System and method for scanned document correction
AU2013222016A1 (en) * 2013-08-30 2015-03-19 Canon Kabushiki Kaisha Method, system and apparatus for determining a property of an image
US9064309B2 (en) * 2013-10-29 2015-06-23 Google Inc. Automatic rectification of distortions in images
KR102225620B1 (ko) * 2014-04-03 2021-03-12 한화테크윈 주식회사 카메라 모델링 시스템
CN104299244B (zh) * 2014-09-26 2017-07-25 东软集团股份有限公司 基于单目相机的障碍物检测方法及装置
US10354364B2 (en) * 2015-09-14 2019-07-16 Intel Corporation Automatic perspective control using vanishing points
RU2631765C1 (ru) * 2016-04-26 2017-09-26 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот
US10332262B2 (en) * 2017-02-16 2019-06-25 Adobe Inc. Removal of background information from digital images

Also Published As

Publication number Publication date
US10970845B2 (en) 2021-04-06
EP3416099A1 (en) 2018-12-19
CN109089035A (zh) 2018-12-25
JP2019004305A (ja) 2019-01-10
CN109089035B (zh) 2021-03-02
US20180365837A1 (en) 2018-12-20

Similar Documents

Publication Publication Date Title
JP6976733B2 (ja) 画像処理装置、画像処理方法、およびプログラム
US8126206B2 (en) Image processing apparatus, image processing method, and program
KR101333871B1 (ko) 멀티-카메라 교정을 위한 방법 및 장치
US9070042B2 (en) Image processing apparatus, image processing method, and program thereof
US10366504B2 (en) Image processing apparatus and image processing method for performing three-dimensional reconstruction of plurality of images
US20150262346A1 (en) Image processing apparatus, image processing method, and image processing program
RU2631765C1 (ru) Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот
EP2650821A1 (en) Text image trimming method
CN108038826B (zh) 透视变形的搁架图像的校正方法和装置
JP2013005258A (ja) ブレ補正装置、ブレ補正方法及び帳票
JP2019012361A (ja) 情報処理装置、プログラム及び情報処理方法
JP6172432B2 (ja) 被写体識別装置、被写体識別方法および被写体識別プログラム
JP2019004305A5 (ja)
US10999513B2 (en) Information processing apparatus having camera function, display control method thereof, and storage medium
JP6086491B2 (ja) 画像処理装置およびそのデータベース構築装置
JP7118729B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6403207B2 (ja) 情報端末装置
JP2019220032A (ja) 原画像を目標画像に基づいて変形した表示画像を生成するプログラム、装置及び方法
KR101718309B1 (ko) 색상 정보를 활용한 자동 정합·파노라믹 영상 생성 장치 및 방법
JP6717769B2 (ja) 情報処理装置及びプログラム
KR102637913B1 (ko) 영상 합성 방법 및 장치
JP5636966B2 (ja) 誤差検出装置及び誤差検出プログラム
JP5887974B2 (ja) 類似画像領域探索装置、類似画像領域探索方法、及び類似画像領域探索プログラム
JP4812743B2 (ja) 顔認識装置、顔認識方法、顔認識プログラムおよびそのプログラムを記録した記録媒体
JP6813440B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200615

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200615

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211110

R151 Written notification of patent or utility model registration

Ref document number: 6976733

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151