JPWO2005041125A1 - 画像歪み補正プログラム,画像歪み補正装置,画像歪み補正方法並びに画像歪み補正プログラムを格納した記録媒体 - Google Patents

画像歪み補正プログラム,画像歪み補正装置,画像歪み補正方法並びに画像歪み補正プログラムを格納した記録媒体 Download PDF

Info

Publication number
JPWO2005041125A1
JPWO2005041125A1 JP2005514903A JP2005514903A JPWO2005041125A1 JP WO2005041125 A1 JPWO2005041125 A1 JP WO2005041125A1 JP 2005514903 A JP2005514903 A JP 2005514903A JP 2005514903 A JP2005514903 A JP 2005514903A JP WO2005041125 A1 JPWO2005041125 A1 JP WO2005041125A1
Authority
JP
Japan
Prior art keywords
projection
paper
geodesic
curved surface
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005514903A
Other languages
English (en)
Other versions
JP4047352B2 (ja
Inventor
藤本 克仁
克仁 藤本
諏訪 美佐子
美佐子 諏訪
武部 浩明
浩明 武部
直井 聡
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2005041125A1 publication Critical patent/JPWO2005041125A1/ja
Application granted granted Critical
Publication of JP4047352B2 publication Critical patent/JP4047352B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • G06T3/608Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

画像撮像装置により紙面を撮像した画像から、紙面内容を手がかりとして、紙面曲面上で互いに平行であった測地線の射影集合を抽出すると共に、測地線の射影集合から紙面曲面に該当する線織面を形成する線織線の射影集合を抽出する。そして、測地線及び線織線の射影集合から紙面曲面を推定し、その紙面曲面に基づいて画像の歪みを補正する。このようにすれば、多様な歪みの種類に対応可能となると共に、画像に紙面の一部しか表れていないときであっても歪み補正を行うことができる。

Description

本発明は、画像の3次元歪みを高精度に補正する技術に関する。
近年、銀行などの金融業界では、入力業務効率化を狙いとして、CCD(Charge Coupled Device)やデジタルカメラなどの非接触型画像撮像装置を用い、紙帳票や紙文書を高速かつ快適に入力する技術が実用化されている。非接触型画像撮像装置を用いると、イメージスキャナなどの接触型画像撮像装置と比較して、画像入力中にも紙面への記入等が可能である、紙面を見たまま高速な画像入力が可能である、などの快適さを享受することができる。
一方、非接触型画像撮像装置により入力された画像には、非接触画像入力に起因する透視変換歪み、紙面曲面の曲がりに起因する画像歪みが存在する。また、接触型画像撮像装置により入力された画像であっても、厚手の本の紙面を撮像したものであれば、その紙面が曲面をなしていることから、同様に画像歪みが存在する。このため、画像撮像装置を用いた画像入力においては、これらの画像歪みを補正する技術が不可欠となる。そこで、本願出願人は、特開2002−150280号公報に開示されるように、画像から抽出された紙面の2次元輪郭の歪みを手がかりとして紙面曲面を推定し、画像の歪みを補正する技術を提案した。
しかしながら、かかる提案技術では、補正対象となる歪みの種類が限定されると共に、その種類を指定する必要があり、歪みの種類が多様である実際の画像には適用が困難であった。また、画像に紙面全体が表れていないときには、その輪郭を抽出できないことから、画像補正には種々の制約が課せられていた。
そこで、本発明は以上のような従来の問題点に鑑み、紙面の内容(コンテンツ)を手がかりとして紙面曲面を推定することで、多様な歪みの種類に対応可能とすると共に、画像に紙面の一部しか表れていないときであっても歪み補正を可能とした、画像歪み補正技術を提供することを目的とする。
このため、本発明に係る画像歪み補正技術では、紙面を撮像した画像から、紙面内容を手がかりとして、紙面曲面上で互いに平行であった測地線の射影集合を抽出すると共に、その測地線の射影集合から、紙面曲面に該当する線織面を形成する線織線の射影集合を抽出する。そして、抽出された測地線及び線織線の射影集合から紙面曲面を推定し、その紙面曲面に基づいて画像の歪みを補正するようにする。
かかる構成によれば、紙面輪郭を手がかりとする歪み補正と比較して、紙面の内容を手がかりとして紙面曲面が推定されることから、多様な歪み種類への対応が可能となると共に、画像に紙面の一部しか表れていない入力画像からでも、高精度な歪み補正を行うことができる。
ここで、線織線の射影集合は、抽出された測地線の射影集合から、線織線射影を測地線射影で切った線分長さの比は一定であるという幾何学的性質を用いて探索することで抽出することが望ましい。このとき、抽出された測地線の射影集合の中から、線織線射影と測地線射影との交点における線織線射影の接線の傾きは一定という幾何学的性質を満たさない測地線射影を除外して、線織線の射影集合を抽出することが望ましい。このようにすれば、抽出した測地線射影の真偽を判定することが可能となり、ノイズに対してロバストな平行測地線の抽出を実現することができる。
また、紙面曲面は、抽出された測地線及び線織線の射影集合から、上端測地線射影と下端測地線射影との幅を推定し、平行測地線の幾何学的性質から数値積分・微分法を用いて導出した線織線本数分の2次方程式を解くことで、推定することが望ましい。このとき、上端測地線射影と下端測地線射影との幅は、紙面曲面上の線織線と画像撮像方向とがなす角度の多数決原理から推定することが望ましい。
さらに、線識線の射影集合は、抽出された測地線の射影集合を用いて、上端と下端との間に位置する内部測地線射影による内分比が一定となる線識線の集合の中から、内分比からのずれの総和が最小となるものを探索して抽出することが望ましい。このとき、紙面曲面は、紙面曲面に対する撮像高さ、及び、1つの線識線と交差する上端及び下端における測地線の接ベクトルは平行という幾何学的性質を用いて、推定される。このようにすれば、デジタルカメラなどの非接触型撮像装置による透視歪みを考慮し、より高精度な歪み補正を行うことができる。
この発明の他の目的と諸相とは、添付図面に関連する実施態様についての次の説明で明白になるであろう。
図1は、本発明を具現化した画像歪み補正装置の構成図である。
図2は、補正対象となる中折り沈み歪みの説明図である。
図3は、補正対象となる中折り浮き歪みの説明図である。
図4は、補正対象となる頂点浮き歪みの説明図である。
図5は、補正対象となる本の歪みの説明図である。
図6は、画像歪み補正装置における処理内容を示すフローチャートである。
図7は、画像歪みを含む入力画像の説明図である。
図8は、測地線の射影集合を抽出したイメージの説明図である。
図9は、線織線の射影集合を抽出したイメージの説明図である。
図10は、画像歪みを補正した補正画像の説明図である。
図11は、紙面曲面のモデルを示す説明図である。
図12は、測地線射影を抽出する方法の説明図である。
図13は、線織線射影を抽出する方法の説明図である。
図14は、測地線射影の対応付けの探索に用いる線織線の性質の説明図である。
図15は、紙面曲面の射影及びこれを平坦に伸ばした展開紙面の説明図である。
図16は、紙面曲面の他のモデルを示す説明図である。
以下、添付された図面を参照して本発明を詳述する。
本発明では、画像に表われた紙面の輪郭ではなく、紙面の内容を手がかりとして、画像歪みを補正する構成が採用される。紙面内容としては、紙面への印刷,記入事項の多様性にかかわらず安定して取得可能な性質である「安定性」と、紙面全体が取得できなくても活用可能な性質である「局所性」と、を共に満たす必要がある。このため、紙面中の文字列や罫線から仮想的な平行線を抽出し、その平行線が歪んだ紙面曲面上で平行な測地線となる性質を活用することで、平行測地線からの形状復元(Shape from Parallel Geodesics)により歪み補正を行うようにした。
平行測地線からの形状復元による歪み補正を実現するため、本発明を具現化した画像歪み補正装置は、図1に示すように、原画像入力部10と、測地線射影抽出部12と、線織線射影抽出部14と、紙面曲面推定部16と、画像歪み補正部18と、補正画像出力部20と、を含んで構成される。なお、画像歪み補正装置は、少なくとも中央処理装置とメモリとを備えたコンピュータシステム上に構築され、メモリにロードされた画像歪み補正プログラムにより、画像歪みを補正するための各種機能が実現される。
原画像入力部10では、デジタルカメラなどの非接触型画像撮像装置又はイメージスキャナなどの接触型画像撮像装置を介して、紙面を撮像した画像を入力する機能が提供される。ここで、画像入力としては、画像撮像装置からリアルタイムに画像を入力する構成に限らず、各種記録媒体に記録された撮像済みの画像の中から指定された画像を入力する構成であってもよい。なお、原画像入力部10から提供される機能により、画像入力機能及び画像入力手段が夫々実現される。
測地線射影抽出部12では、原画像入力部10により入力された画像(以下「入力画像」という)から、紙面曲面上で互いに平行であった測地線の射影集合を抽出する機能が提供される。測地線射影集合の抽出は、例えば、入力画像から、測地線とみなすことができる文字列又は罫線を複数抽出し、これを2次元平面に射影した線の集合を求めることで実現される。なお、測地線射影抽出部12から提供される機能により、測地線射影抽出機能,測地線射影抽出手段及び測地線射影抽出ステップが夫々実現される。
線織線射影抽出部14では、測地線射影抽出部12により抽出された測地線の射影集合から、測地線の幾何学的性質である「線織線射影を測地線射影で切った線分長さの比(比ベクトル)は一定」又は「上端と下端との間に位置する内部測地線射影による線識線射影の内分比は一定」を用いて、線織線の射影集合を探索して抽出する機能が提供される。ここで、紙面を曲げてできる3次元曲面は一般に「線織面」と呼ばれ、その面上の任意の点に対して、その点を通る曲面上の直線(線織線)が存在することは公知である。なお、線織線射影抽出部14から提供される機能により、線織線射影抽出機能,線織線射影抽出手段及び線織線射影抽出ステップが夫々実現される。
紙面曲面推定部16では、測地線射影抽出部12及び線織線射影抽出部14により夫々抽出された測地線及び線織線の射影集合から、入力画像における紙面曲面を推定する機能が提供される。即ち、その紙面曲面を平坦に伸ばしたときの平行測地線の上端と下端との幅を、紙面曲面上の線織線とその画像撮像方向とがなす角度の多数決原理に基づいて推定する。次に、平行測地線の幾何学的性質から数値微分・積分法を用いて導出した線織線本数分の2次方程式を解くことで、紙面曲面を推定する。または、紙面に対する撮像高さ、及び、平行測地線の幾何学的性質である「1つの線識線と交差する上端及び下端における測地線の接ベクトルは平行」から導出された方程式を解くことで、紙面曲面を推定する。なお、紙面曲面推定部16から提供される機能により、紙面曲面推定機能,紙面曲面推定手段及び紙面曲面推定ステップが夫々実現される。
画像歪み補正部18では、紙面曲面推定部16により推定された紙面曲面に基づいて、入力画像に対して画素対応付けを行うことで、画像の歪みを補正する機能が提供される。なお、画像歪み補正部18から提供される機能により、歪み補正機能,歪み補正手段及び歪み補正ステップが夫々実現される。
補正画像出力部20では、画像歪み補正部18により補正された入力画像(以下「補正画像」という)を出力する機能が提供される。ここで、画像出力としては、補正画像を用いて各種画像処理を実行する機能に出力する構成に限らず、各種記録媒体に補正画像を保存する構成であってもよい。
画像歪み補正装置において補正対象となる画像歪みには、図2及び図3に夫々示すような中央部に折り目がある紙面に発生する「中折り沈み歪み」及び「中折り浮き歪み」、図4に示すような紙面頂点付近が浮いている「頂点浮き歪み」、並びに、図5に示すような「本の歪み」などがある。ここで、図4に示す頂点浮き沈みでは、紙面の左上部が浮き上がっている様子が示されている。また、本の歪みは、辞書,専門書,ハンドブックなどの厚手の本を斜め上から非接触型画像撮像装置で撮像したことを起因とする歪みであって、透視変換に起因する歪み(透視変換歪み)と本の紙面自体が元々3次元曲面であることに起因する歪みとの複合歪みである。
次に、画像歪み補正装置における処理内容について、図6に示すフローチャートを参照しつつ説明する。
ステップ1(図では「S1」と略記する。以下同様)では、原画像入力部10により提供される機能を介して、補正対象となる入力画像が入力される。即ち、画像撮像装置又は各種記録媒体から、図7に示すように、紙面が滑らかに歪んだ入力画像が読み込まれる。
ステップ2では、測地線射影抽出部12により提供される機能を介して、原画像入力部10により入力された入力画像から、図8に示すように、紙面曲面上で互いに平行であった測地線の射影集合が抽出される。
ステップ3では、線織線射影抽出部14により提供される機能を介して、測地線射影抽出部12により抽出された測地線の射影集合から、図9に示すように、線織線の射影集合が抽出される。
ステップ4では、紙面曲面推定部16により提供される機能を介して、測地線射影抽出部12及び線織線射影抽出部14により夫々抽出された測地線及び線織線の射影集合から、入力画像における紙面曲面が推定される。
ステップ5では、画像歪み補正部18により提供される機能を介して、紙面曲面推定部16により推定された紙面曲面に基づいて、図10に示すように、入力画像の歪みが補正される。
ステップ6では、補正画像出力部20により提供される機能を介して、画像歪み補正部18により補正された補正画像が出力される。
ステップ1〜ステップ6の処理によれば、入力画像から紙面曲面上で互いに平行であった測地線の射影集合が抽出されると共に、測地線の射影集合から線織線の射影集合が抽出される。そして、測地線及び線織線の射影集合から紙面曲面が推定され、その紙面曲面に基づいて画像の歪みが補正される。このため、紙面輪郭を手がかりとする歪み補正と比較して、紙面内容を手がかりとして紙面曲面が推定されることから、多様な歪み種類への対応が可能となると共に、画像に紙面の一部しか表れていない入力画像からでも、高精度な歪み補正を行うことができる。
次に、画像歪み補正の第1実施形態の詳細原理について説明する。
A.紙面曲面のモデル化
紙面曲面は、曲面上の任意の点に対して、その点を通る曲面上の直線(線織線)が存在する、という性質を満たす線織面である。歪み補正の手がかりとして、紙面中の文字列や罫線から抽出できる仮想的な平行線を用いる。平坦な紙面上の平行線は、紙面曲面上では平行な測地線となる。
そこで、図11に示すように、曲線座標系(s,t)(0≦s≦1,0≦t≦1)を用いて、紙面曲面をx(s,t)=(1−t)p(s)+tq(s)と表現する。ここで、p(s),q(s)は、夫々、紙面曲面における上端及び下端の測地線である。曲面座標系(s,t)は、sを固定することで線織線x(t)=(1−t)p(s)+tq(s)を表わす一方、tを固定することで平行な測地線x(s)=(1−t)p(s)+tq(s)を表わすように設定する。また、紙面曲面x(s,t)は、xyz座標空間中に存在し、z軸に平行な正射影によりその画像が撮像されたと仮定する。
B.平行測地線射影の抽出
図12に示すように、入力画像から抽出した文字列又は罫線に基づいて、測地線の射影集合を抽出する。具体的には、入力画像中の文字を構成する成分(文字成分)又は罫線を構成する線分を抽出した後、互いに近接する文字成分又は線分を結合することで、測地線の射影集合を抽出することができる。
C.線織線射影の抽出
紙面を曲げてできる曲面は一般に「線織面」と呼ばれ、その面上の任意の点に対して、その点を通る曲面上の直線(線織線)が存在する。平行測地線の射影集合から、測地線の幾何学的性質である「線織線射影を測地線射影で切った線分長さの比(比ベクトル)は一定」を用いて、線織線の射影集合を抽出する。
即ち、図13に示すように、紙面曲面における上端及び下端の測地線射影を、夫々、Y=f(X)及びY=f(X)とすると、線織線射影の抽出は、上端及び下端の測地線射影の対応付けX=m(X)を求めることに帰着する。ここで、対応付けX=m(X)は、線織線射影が持つ次の幾何学的性質から探索する。
性質1:線織線射影を測地線射影で切った線分長さの比(比ベクトル)は一定(図14参照)
性質2:各線織線射影について、測地線射影との交点での接線の傾きは一定
対応付けX=m(X)の探索方法として、性質1のみを用い、候補となる測地線の射影集合に対する比ベクトルのずれの総和が最小となる評価基準により、探索対象たる線織線射影の比ベクトル及び最適な線織線の射影集合を探索することができる。また、性質2を併用することで、抽出した測地線射影の真偽を判定することが可能となり、線織線射影の抽出結果からのフィードバックにより、ノイズに対してロバストな平行測地線の抽出を実現することができる。即ち、抽出された測地線の射影集合の中から、性質2を満たさない測地線射影を除外して、線織線の射影集合を抽出する。
D.紙面曲面の推定
入力画像に表れている紙面曲面を平坦に伸ばしたとき、その上端及び下端の測地線射影の幅(未知定数)を推定することで、測地線の幾何学的性質から、紙面曲面を推定する。この方法を採用することで、数値微分・積分法を用いて導出した線織線本数分の2次方程式を解き、紙面曲面を求めることができるようになった。
先ず、上端の測地線射影上の点p(s)のx座標をxとし、その他をxの関数で表わすと、
Figure 2005041125
となる。線織線射影の抽出により、対応付けm(x)並びに上端及び下端の測地線射影f(x)及びf(x)が既知となるので、紙面曲面の推定は、未知関数g(x)及びg(x)を求めることに帰着する。
ところで、画像撮像装置を紙面原稿に正対させ、画像を正射影により撮像したときには、紙面曲面の射影(即ち画像)と、これを平坦に伸ばしたときの展開紙面と、の対応関係は図15に示すようなる。紙面曲面射影上の平行な測地線の射影集合は、展開紙面上でも平行線となる性質がある。そこで、展開紙面において、上端及び下端の平行測地線の幅をhとする。また、紙面曲面射影上の上端測地線射影の任意の一点P(x)=(x,f(x))における接線とその点を通る線織線射影とがなす角度をα(x)、上端測地線射影から下端測地線射影までの線織線射影の長さをl(x)とする。さらに、展開紙面において、左端線織線から、紙面曲面上の上端測地線の任意の一点p(x)=(x,f(x),g(x))に対応する点までの長さをL(x)=L(x)、その点における上端測地線と線織線とがなす角度をβ(x)とする。また、展開紙面において、t=tに対応した測地線を伸ばしたときに、左端線織線との交点から、紙面曲面上の上端測地線の任意の一点p(x)を通る線織線との交点までの長さをL(x)とする。
線織線射影が抽出された後は、角度α(x)及び線織線射影の長さl(x)は計算できるので既知となる。一方、展開紙面における長さL(x)及び角度β(x)は未知である。従って、展開紙面における長さL(x)及び角度β(x)を求めることができれば、紙面曲面の推定、即ち、測地線の高さを示す未知関数g(x)及びg(x)を求めることができる。
紙面曲面上の線織線を含む平面であってxy平面との交線に対して線織線が垂直となる平面と、xy平面と、がなす角度(線織線の傾き)をθとすると、角度α(x)及びβ(x)との間には次の関係が成立する。
Figure 2005041125
また、角度θ,線織線射影の長さl(x)及び平行測地線の幅hと角度β(x)との間には、線織線の傾きの性質により、次の関係が成立する。
Figure 2005041125
これよりθを消去すると、次式が成立する。
Figure 2005041125
ここで、平行測地線の幅hは未知定数であるが、何らかの方法で既知であると仮定すると、この式により、角度β(x)を求めることができる。
紙面曲面上の任意の点は、p(x)=(1−t)p(x)+tq(x)と表わされる。この点を通る線織線と上端測地線との交点はp(x)=(x,f(x),g(x))、下端測地線との交点はq(x)=(m(x),f(x),g(x))であるから、任意の点p(x)は、これらの交点をt:(1−t)に内分する点である。従って、この性質から、任意の点p(x)は次のように表わすことができる。
Figure 2005041125
展開紙面において、左端線織線からの測地線の長さL(x)及びL(x)の間に
Figure 2005041125
上端測地線との交点のx座標(定数)である。
Figure 2005041125
紙面曲面における測地線を伸ばすと、展開紙面における平行測地線を構成する直線となることから、展開紙面における長さL(x)及びL(x)の微分について次式が成立する。
Figure 2005041125
一方、L(x)を微分すると、
Figure 2005041125
となり、これを上式に代入すると、任意のtについて次式が成立する。
Figure 2005041125
この式は、tについての2次式であるので、各次数の係数が0となる。
ここで、r(x)=g(x)−g(x)とおくと、次式が夫々成立する。
Figure 2005041125
これらの式のうち、平行測地線の幅hを何らかの方法で推定すると、数値微分法を用いることで、β’(x)及びm’(x)が既知となり、2次項の式からr’(x)を求めることができる。また、これを1次項の式に代入すると、未知関数g’(x)がL’(x)の1次式となり、これを定数項の式に代入することで、L’(x)の2次方程式を導出することができる。そして、これらを各線織線に対応したxについて解くと共に、数値積分法を適用することによりL(x)を求めることで、紙面曲面を推定することができる。
なお、測地線及び線織線の射影集合から、紙面曲面における測地線の長さ及び角度の同一性からのずれの総和をエネルギ関数とした反復法により、紙面曲面を推定するようにしてもよい。
E.平行測地線の幅hの推定方法
ここでは、展開紙面における上端及び下端の平行測地線の幅hを、紙面曲面上の線織線と画像撮像方向とがなす角度の多数決原理に基づいて推定する手法を提案する。
線織線の傾き角度θ(x),線織線射影の長さl(x)及び平行測地線の幅hと角度β(x)との間には、線織線の傾きの性質から次の関係が成立する。
Figure 2005041125
hを固定すると、線織線の傾き角度θ(x)が求められることから、集合{x}に対して集合{θ(x)}を求めることができる。そして、集合{θ(x)}のばらつきが最小となるhを求め、これを最適のhとして採用することができる。
F.画素対応付けによる歪み補正
図15に示したように、紙面曲面の射影と展開紙面との対応関係を用いると、紙面曲面の推定により求めた平行測地線の幅h,角度β(x)及び長さ
Figure 2005041125
正画像との画素対応付けが可能となり、歪み補正を実現することができる。
次に、画像歪み補正の第2実施形態の詳細原理について説明する。
A.紙面曲面のモデル化
紙面曲面は、曲面上の任意の点に対して、その点を通る曲面上の直線(線識線)が存在する、という性質を満たす線識面である。歪み補正の手がかりとして、紙面中の文字列や罫線から抽出できる仮想的な平行線を用いる。平坦な紙面上の平行線は、紙面曲面上では平行な測地線となる。
そこで、図16に示すように、曲線座標系(s,t)(0≦s≦1,0≦t≦1)を用いて、紙面曲面をx(s,t)=(1−t)x(s)+tx(s)と表現する。ここで、x(s),x(s)は、夫々、紙面曲面における上端及び下端の測地線上の点であり、この2点を通る直線が線識線となるようにsを設定する。曲面座標系(s,t)は、sを固定することで線織線を表わす一方、tを固定することで平行な測地線を表わす。
また、デジタルカメラなどの非接触型画像撮像装置による入力画像は、xyz座標空間における紙面曲面から、撮像位置x=(x,y,z)を中心としたxy平面への透視射影として得られる。ここで、添え字α=U,i,Dに対して、紙面曲面上の測地線xαに対応する入力画像中の曲線を「測地線射影」と呼び、Xα=(Xα,Yα,0)と表現する。そして、紙面に対する撮像高さの内分比をhαとすると、xα=hαα+(1−hα)xが成立する。
B.平行測地線射影の抽出
図12に示すように、入力画像から抽出した文字列又は罫線に基づいて、測地線の射影集合を抽出する。具体的には、入力画像中の文字を構成する文字成分又は罫線を構成する線分を抽出した後、互いに近接する文字成分又は線分を結合することで、測地線の射影集合を表わす点列X,X,Xを夫々抽出することができる。
C.線識線射影の抽出
入力画像及び紙面曲面において、上端と下端との間に位置する内部測地線射影による線識線射影の内分比を夫々T(s)及びt(s)とすると、(1/t(s))−1=(h(s)/h(s))((1/T(s))−1)が成立する。平行測地線の幾何学的性質によれば、内部測地線による線識線の内分比t(s)はsによらず一定であるから、2つの内部測地線射影による線識線の内分比T(s),T(s)について、((1/T(s))−1):((1/T(s))−1)が一定となる。このため、この条件からのずれの総和が最小となるように、線識線の射影集合の探索、即ち、上端測地線射影上の点と下端測地線射影上の点との対応付けの探索を行い、パラメータ表現X(s),X(s)を得る。
D.紙面曲面の推定
平行測地線の幾何学的性質から、1つの線識線と交差する上端及び下端におけ
Figure 2005041125
次式が成立する。
Figure 2005041125
Figure 2005041125
面曲面が定まる。
Figure 2005041125
E.画素対応付けによる歪み補正
紙面曲面と入力画像の対応付けにより、歪み補正を実現することができる。
以上説明したように、本発明に係る画像歪み補正技術は、紙面の内容を手がかりとして紙面曲面を推定することで、多様な歪みの種類に対応可能であると共に、画像に紙面の一部しか表れていないときであっても歪み補正が可能であり、極めて有用なものである。

Claims (8)

  1. 紙面を撮像した画像を入力する画像入力機能と、該画像入力機能により入力された画像から、前記紙面の内容を手がかりとして、紙面曲面上で互いに平行であった測地線の射影集合を抽出する測地線射影抽出機能と、該測地線射影抽出機能により抽出された測地線の射影集合から、前記紙面曲面に該当する線織面を形成する線織線の射影集合を抽出する線織線射影抽出機能と、前記測地線射影抽出機能及び線織線射影抽出機能により夫々抽出された測地線及び線織線の射影集合から、前記紙面曲面を推定する紙面曲面推定機能と、該紙面曲面推定機能により推定された紙面曲面に基づいて、前記画像入力機能により入力された画像の歪みを補正する歪み補正機能と、をコンピュータに実現させるための画像歪み補正プログラム。
  2. 前記線織線射影抽出機能は、前記測地線射影抽出機能により抽出された測地線の射影集合から、線織線射影を測地線射影で切った線分長さの比が一定の線織線の射影集合を探索して抽出することを特徴とする請求の範囲第1項記載の画像歪み補正プログラム。
  3. 前記線織線射影抽出機能は、前記測地線射影抽出機能により抽出された測地線の射影集合の中から、線織線射影と測地線射影との交点における線織線射影の接線の傾きは一定ではない測地線射影を除外して、線織線の射影集合を抽出することを特徴とする請求の範囲第1項記載の画像歪み補正プログラム。
  4. 前記線識線射影抽出機能は、前記測地線射影抽出機能により抽出された測地線の射影集合を用いて、上端と下端との間に位置する測地線射影による内分比が一定となる線識線の集合の中から、内分比からのずれの総和が最小となるものを探索して、線織線の射影集合として抽出することを特徴とする請求の範囲第1項記載の画像歪み補正プログラム。
  5. 前記紙面曲面推定機能は、紙面曲面に対する撮像高さ、及び、1つの線識線と交差する上端及び下端における測地線の接ベクトルは平行という幾何学的性質を用いて、紙面曲面を推定することを特徴とする請求の範囲第4項記載の画像歪み補正プログラム。
  6. 紙面を撮像した画像を入力する画像入力手段と、該画像入力手段により入力された画像から、前記紙面の内容を手がかりとして、紙面曲面上で互いに平行であった測地線の射影集合を抽出する測地線射影抽出手段と、該測地線射影抽出手段により抽出された測地線の射影集合から、前記紙面曲面に該当する線織面を形成する線織線の射影集合を抽出する線織線射影抽出手段と、前記測地線射影抽出手段及び線織線射影抽出手段により夫々抽出された測地線及び線織線の射影集合から、前記紙面曲面を推定する紙面曲面推定手段と、該紙面曲面推定手段により推定された紙面曲面に基づいて、前記画像入力手段により入力された画像の歪みを補正する歪み補正手段と、を含んで構成されたことを特徴とする画像歪み補正装置。
  7. 画像撮像装置により紙面を撮像した画像から、前記紙面の内容を手がかりとして、紙面曲面上で互いに平行であった測地線の射影集合を抽出する測地線射影抽出ステップと、該測地線射影抽出ステップにより抽出された測地線の射影集合から、前記紙面曲面に該当する線織面を形成する線織線の射影集合を抽出する線織線射影抽出ステップと、前記測地線射影抽出ステップ及び線織線射影抽出ステップにより夫々抽出された測地線及び線織線の射影集合から、前記紙面曲面を推定する紙面曲面推定ステップと、該紙面曲面推定ステップにより推定された紙面曲面に基づいて、前記画像入力ステップにより入力された画像の歪みを補正する歪み補正ステップと、をコンピュータに実行させることを特徴とする画像歪み補正方法。
  8. 紙面を撮像した画像を入力する画像入力機能と、該画像入力機能により入力された画像から、前記紙面の内容を手がかりとして、紙面曲面上で互いに平行であった測地線の射影集合を抽出する測地線射影抽出機能と、該測地線射影抽出機能により抽出された測地線の射影集合から、前記紙面曲面に該当する線織面を形成する線織線の射影集合を抽出する線織線射影抽出機能と、前記測地線射影抽出機能及び線織線射影抽出機能により夫々抽出された測地線及び線織線の射影集合から、前記紙面曲面を推定する紙面曲面推定機能と、該紙面曲面推定機能により推定された紙面曲面に基づいて、前記画像入力機能により入力された画像の歪みを補正する歪み補正機能と、をコンピュータに実現させるための画像歪み補正プログラムを格納した記録媒体。
JP2005514903A 2003-10-24 2004-03-05 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法 Expired - Fee Related JP4047352B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/JP2003/013665 WO2005041123A1 (ja) 2003-10-24 2003-10-24 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法
JPPCT/JP03/13665 2003-10-24
PCT/JP2004/002825 WO2005041125A1 (ja) 2003-10-24 2004-03-05 画像歪み補正プログラム, 画像歪み補正装置,画像歪み補正方法並びに画像歪み補正プログラムを格納した記録媒体

Publications (2)

Publication Number Publication Date
JPWO2005041125A1 true JPWO2005041125A1 (ja) 2007-03-29
JP4047352B2 JP4047352B2 (ja) 2008-02-13

Family

ID=34509578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005514903A Expired - Fee Related JP4047352B2 (ja) 2003-10-24 2004-03-05 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法

Country Status (4)

Country Link
US (1) US7471848B2 (ja)
JP (1) JP4047352B2 (ja)
CN (1) CN100412903C (ja)
WO (2) WO2005041123A1 (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7593595B2 (en) * 2004-08-26 2009-09-22 Compulink Management Center, Inc. Photographic document imaging system
CN100363940C (zh) * 2005-12-29 2008-01-23 北大方正集团有限公司 一种文稿图像几何畸变的校正方法
US7330604B2 (en) * 2006-03-02 2008-02-12 Compulink Management Center, Inc. Model-based dewarping method and apparatus
CN100464346C (zh) * 2006-04-29 2009-02-25 北大方正集团有限公司 一种表格图像几何畸变的数字校正方法
JP4946376B2 (ja) * 2006-11-15 2012-06-06 富士通株式会社 線織線射影抽出プログラム、線織線射影抽出装置および線織線射影抽出方法
CN101681432B (zh) * 2007-05-01 2013-11-06 计算机连接管理中心公司 图片文档分割方法和系统
US8244062B2 (en) * 2007-10-22 2012-08-14 Hewlett-Packard Development Company, L.P. Correction of distortion in captured images
US9842331B2 (en) 2008-01-18 2017-12-12 Mitek Systems, Inc. Systems and methods for mobile image capture and processing of checks
US20130085935A1 (en) 2008-01-18 2013-04-04 Mitek Systems Systems and methods for mobile image capture and remittance processing
US10685223B2 (en) 2008-01-18 2020-06-16 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US8582862B2 (en) 2010-05-12 2013-11-12 Mitek Systems Mobile image quality assurance in mobile document image processing applications
US9298979B2 (en) 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US7953268B2 (en) * 2008-01-18 2011-05-31 Mitek Systems, Inc. Methods for mobile image capture and processing of documents
US10102583B2 (en) 2008-01-18 2018-10-16 Mitek Systems, Inc. System and methods for obtaining insurance offers using mobile image capture
US8983170B2 (en) 2008-01-18 2015-03-17 Mitek Systems, Inc. Systems and methods for developing and verifying image processing standards for mobile deposit
US8577118B2 (en) * 2008-01-18 2013-11-05 Mitek Systems Systems for mobile image capture and remittance processing
GB2472179B (en) * 2008-05-06 2013-01-30 Compulink Man Ct Inc Camera-based document imaging
US8437570B2 (en) * 2008-05-23 2013-05-07 Microsoft Corporation Geodesic image and video processing
EP2141617A1 (en) * 2008-07-04 2010-01-06 Dassault Systèmes S.A. A computer-implemented method of design of surfaces defined by guiding curves.
CN101789122B (zh) * 2009-01-22 2013-06-26 佳能株式会社 用于校正畸变文档图像的方法和系统
CN101847202B (zh) * 2009-03-23 2012-11-28 凯迈(洛阳)电子有限公司 光学指纹采集器图像畸变的校正算法
CN102439628A (zh) * 2009-04-27 2012-05-02 意法爱立信(法国)有限公司 变换二维图像的几何方法
US8351654B2 (en) * 2009-04-28 2013-01-08 Microsoft Corporation Image processing using geodesic forests
US8322384B2 (en) * 2010-03-05 2012-12-04 Whirlpool Corporation Select-fill dispensing system
EP2383669B1 (en) * 2010-04-02 2018-07-11 Dassault Systèmes Design of a part modeled by parallel geodesic curves
US9208393B2 (en) 2010-05-12 2015-12-08 Mitek Systems, Inc. Mobile image quality assurance in mobile document image processing applications
US10891475B2 (en) 2010-05-12 2021-01-12 Mitek Systems, Inc. Systems and methods for enrollment and identity management using mobile imaging
US20110299775A1 (en) * 2010-06-08 2011-12-08 International Business Machines Corporation Correcting page curl in scanned books
US8995012B2 (en) 2010-11-05 2015-03-31 Rdm Corporation System for mobile image capture and processing of financial documents
JP5867045B2 (ja) * 2011-12-12 2016-02-24 富士ゼロックス株式会社 画像処理装置及びプログラム
US8781173B2 (en) 2012-02-28 2014-07-15 Microsoft Corporation Computing high dynamic range photographs
CN102780904A (zh) * 2012-05-31 2012-11-14 新奥特(北京)视频技术有限公司 一种通过左右眼图像网格化显示来调节3d图像的方法
JP5949261B2 (ja) * 2012-07-20 2016-07-06 セイコーエプソン株式会社 ラベル作成システム、ラベル作成方法、印刷装置およびプログラム
US8923650B2 (en) 2013-01-07 2014-12-30 Wexenergy Innovations Llc System and method of measuring distances related to an object
US10883303B2 (en) 2013-01-07 2021-01-05 WexEnergy LLC Frameless supplemental window for fenestration
US9691163B2 (en) 2013-01-07 2017-06-27 Wexenergy Innovations Llc System and method of measuring distances related to an object utilizing ancillary objects
US9230339B2 (en) 2013-01-07 2016-01-05 Wexenergy Innovations Llc System and method of measuring distances related to an object
US10196850B2 (en) 2013-01-07 2019-02-05 WexEnergy LLC Frameless supplemental window for fenestration
US9845636B2 (en) 2013-01-07 2017-12-19 WexEnergy LLC Frameless supplemental window for fenestration
US10963535B2 (en) 2013-02-19 2021-03-30 Mitek Systems, Inc. Browser-based mobile image capture
US9095423B2 (en) * 2013-03-15 2015-08-04 OrCam Technologies, Ltd. Apparatus and method for providing failed-attempt feedback using a camera on glasses
US20140279323A1 (en) 2013-03-15 2014-09-18 Mitek Systems, Inc. Systems and methods for capturing critical fields from a mobile image of a credit card bill
KR102082301B1 (ko) * 2013-09-30 2020-02-27 삼성전자주식회사 카메라로 촬영한 문서 영상을 스캔 문서 영상으로 변환하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
CN104657730B (zh) * 2013-11-20 2018-01-05 富士通株式会社 文档图像的校正装置、方法以及扫描仪
JP6194781B2 (ja) * 2013-12-11 2017-09-13 富士ゼロックス株式会社 画像処理装置及びプログラム
JP6010870B2 (ja) * 2013-12-24 2016-10-19 カシオ計算機株式会社 画像補正装置、及び画像補正方法、プログラム
CN103903274B (zh) * 2014-04-22 2016-09-21 四川川大智胜软件股份有限公司 一种小半径大曲率畸变曲面投影校正融合的方法
WO2016024375A1 (ja) * 2014-08-12 2016-02-18 ソニー株式会社 画像処理装置及び画像処理方法
CN105678684B (zh) * 2014-11-18 2020-11-03 中兴通讯股份有限公司 一种截取图像的方法及装置
JP6521481B2 (ja) * 2015-03-19 2019-05-29 カシオ計算機株式会社 画像補正装置、及び画像補正方法、プログラム
JP6728615B2 (ja) * 2015-09-30 2020-07-22 ヤマハ株式会社 画像補正装置、画像補正方法およびプログラム
CN108073924B (zh) * 2016-11-17 2021-06-22 富士通株式会社 图像处理方法和装置
CN111247304B (zh) 2017-05-30 2023-01-13 韦克斯能源有限责任公司 用于窗户配列的无框辅助窗户
CN110027342A (zh) * 2017-12-20 2019-07-19 卡西欧计算机株式会社 对纸面进行拍摄而电子化的装置、图像校正方法、翻页装置以及拍摄方法
CN113747130A (zh) * 2020-05-29 2021-12-03 中强光电股份有限公司 产生遮罩的方法及执行此方法的投影装置
US11030488B1 (en) 2020-12-31 2021-06-08 VoyagerX, Inc. Book scanning using machine-trained model
US10991081B1 (en) 2020-12-31 2021-04-27 VoyagerX, Inc. Book scanning using machine-trained model

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0437968A (ja) * 1990-06-01 1992-02-07 Fuji Electric Co Ltd 図書の文字読取方法
JPH05303635A (ja) 1992-04-28 1993-11-16 Matsushita Electric Ind Co Ltd 画像合成装置
JP3093869B2 (ja) * 1992-04-28 2000-10-03 オリンパス光学工業株式会社 画像取り込み装置
US5497236A (en) * 1993-06-23 1996-03-05 Ricoh Company Ltd. Method and apparatus for distortion correction of scanned images
US6018593A (en) * 1996-09-11 2000-01-25 Ricoh Company, Ltd. Method and system for correcting image position based upon predetermined pattern portions
JP3600380B2 (ja) * 1996-09-11 2004-12-15 株式会社リコー 画像処理方法及びファクス文字認識装置
JPH10173905A (ja) * 1996-12-11 1998-06-26 Minolta Co Ltd 画像読取り装置
US6970592B2 (en) * 2000-09-04 2005-11-29 Fujitsu Limited Apparatus and method for correcting distortion of input image
GB0104664D0 (en) * 2001-02-23 2001-04-11 Hewlett Packard Co Improvements relating to document capture
US6873732B2 (en) * 2001-07-09 2005-03-29 Xerox Corporation Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
US7430065B2 (en) * 2001-08-27 2008-09-30 Ricoh Company, Ltd Method and system for correcting distortions in image data scanned from bound originals
JP4180260B2 (ja) * 2001-08-27 2008-11-12 株式会社リコー 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム

Also Published As

Publication number Publication date
CN100412903C (zh) 2008-08-20
US20060140504A1 (en) 2006-06-29
JP4047352B2 (ja) 2008-02-13
US7471848B2 (en) 2008-12-30
WO2005041125A1 (ja) 2005-05-06
CN1853195A (zh) 2006-10-25
WO2005041123A1 (ja) 2005-05-06

Similar Documents

Publication Publication Date Title
JP4047352B2 (ja) 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法
US10289924B2 (en) System and method for scanned document correction
Yamashita et al. Shape reconstruction and image restoration for non-flat surfaces of documents with a stereo vision system
Liang et al. Geometric rectification of camera-captured document images
US9305211B2 (en) Method, apparatus, and computer-readable recording medium for converting document image captured by using camera to dewarped document image
Cao et al. Rectifying the bound document image captured by the camera: A model based approach
US6671399B1 (en) Fast epipolar line adjustment of stereo pairs
US8355592B1 (en) Generating a modified image with semantic constraint
US20150097827A1 (en) Target Region Fill Utilizing Transformations
JP6716996B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP2010171976A (ja) 歪み文書画像を補正する方法及びシステム
JP4784500B2 (ja) 画像傾き補正装置及び画像傾き補正方法
JP5468824B2 (ja) 3次元における形状の一致を判定する方法および装置
JP6075294B2 (ja) 画像処理システム及び画像処理方法
Dinesh et al. Adaptive nonrigid inpainting of three-dimensional point cloud geometry
JP4867620B2 (ja) 画像処理装置及び画像処理プログラム
JP4456304B2 (ja) 歪み補正方式
JP4946376B2 (ja) 線織線射影抽出プログラム、線織線射影抽出装置および線織線射影抽出方法
JP2006113832A (ja) ステレオ画像処理装置およびプログラム
US11699294B2 (en) Optical character recognition of documents having non-coplanar regions
JP4996585B2 (ja) 画像校正評価装置及び画像校正評価プログラム
JP5563390B2 (ja) 画像処理装置およびその制御方法、及びプログラム
JP2006145419A (ja) 画像処理方法
JP5636966B2 (ja) 誤差検出装置及び誤差検出プログラム
JP3706603B2 (ja) データ特徴抽出装置及びデータ照合装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees