JP4456304B2 - 歪み補正方式 - Google Patents

歪み補正方式 Download PDF

Info

Publication number
JP4456304B2
JP4456304B2 JP2001262207A JP2001262207A JP4456304B2 JP 4456304 B2 JP4456304 B2 JP 4456304B2 JP 2001262207 A JP2001262207 A JP 2001262207A JP 2001262207 A JP2001262207 A JP 2001262207A JP 4456304 B2 JP4456304 B2 JP 4456304B2
Authority
JP
Japan
Prior art keywords
contour
dimensional
curved surface
distortion
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001262207A
Other languages
English (en)
Other versions
JP2002150280A (ja
Inventor
克仁 藤本
敦子 小原
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001262207A priority Critical patent/JP4456304B2/ja
Publication of JP2002150280A publication Critical patent/JP2002150280A/ja
Application granted granted Critical
Publication of JP4456304B2 publication Critical patent/JP4456304B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、入力画像に存在する歪みの補正方式に関する。
【0002】
【従来の技術】
近年、非接触型画像入力装置(OHR:Over Head Reader)を用いた帳票認識技術の向上が金融OCR(Optical Character Reader)商談において重要になってきた。
【0003】
非接触型画像入力装置(OHR)とは、ラインあるいはエリアCCDを撮像素子として備える図18に示すようなスタンド型の画像入力装置である。従来のイメージスキャナなどの接触型画像入力装置と比較して、OHRを用いることによって、ユーザが画像入力を行いながら帳票への記入が行える、帳票の表を見たまま画像入力が行える、といった作業の快適さを享受できる。
【0004】
しかし、OHRにて取得した帳票の画像(以降OHR画像と呼ぶ)には、スキャナにて取得した画像(以降スキャナ画像と呼ぶ)と比較して、濃淡むら、影、画像の歪みなどの画像の劣化が見られる。OHR画像の歪みの主なものとしては3次元歪みがある。
【0005】
OHR画像において発生する3次元歪みを分類すると、主に次の3種類に分類される。
イ)中折り歪み:中央部に折り目のある帳票に発生する歪み。折り目が沈んでいるか、浮いているかにより、中折り沈み歪み、中折り浮き歪みの2種類がある。図19に中折り沈み歪みOHR画像の例を、図20に中折り浮き歪みOHR画像の例を示す。
【0006】
ロ)周辺歪み:帳票周辺に発生する歪み。周辺が沈んでいるか、浮いているかにより、周辺沈み歪み、周辺浮き歪みの2種類がある。図21に周辺沈み歪みのOHR画像の例を、図22に周辺浮き歪みOHR画像の例を示す。
【0007】
ハ)冊子歪み:数枚綴りの冊子に発生する歪み。図23に冊子歪みの例を示す。
OHRを金融OCR商談で用いるためには、これらの画像の3次元歪みを克服する歪み補正方式の開発が重要な課題となってきた。
【0008】
一方、3次元歪みの存在するOHR画像に対して、高精度な文書認識を実現するための歪み補正方式が特開平10−150532にて提案されている。ここに記載の方式は、数枚の紙を一点で止めた文書に発生する一点止め歪みの補正方式を対象としている。また、3次元歪みを計測するために(3次元の形状を求める)上及び横からの複数の視点から撮像した複数枚の画像を用いている。
【0009】
【発明が解決しようとする課題】
しかしながら、3次元歪みを補正する従来方式は、3次元形状を推定するために複数のカメラを用いているため、実現コストが高くなり、広い設置スペースが必要となる。
【0010】
本発明の課題は、上からの視点のみから撮像した画像一枚を用いることにより、実現コスト及び設置スペースを削減させることである。
【0011】
【課題を解決するための手段】
上述した課題を解決するために、本発明では、上から撮像した一枚の画像から取得できる2次元輪郭を手がかりにし、さらに紙が矩形状であるという制約を利用して3次元曲面モデルを推定し、得られた3次元曲面モデルから画像の3次元歪みを補正するようにした。
【0012】
本発明の一態様によれば、輪郭抽出手段と曲面推定手段と歪み補正手段を備えるように構成する。矩形状の紙を撮像した画像を入力画像とし、輪郭抽出手段が入力画像から紙の輪郭を抽出し、曲面推定手段が2次元輪郭を手がかりに紙の3次元曲面モデルを推定し、歪み補正手段が推定された3次元曲面モデルに基づいて、歪みを補正した画像を出力する。
【0013】
このような構成をとることにより、一枚の画像から得られる2次元輪郭の歪みを手がかりに入力画像を補正するので、従来技術と比較してカメラが一台で済み、実現コスト及び設置スペースを削減することができるようになる。
【0014】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら説明する。
図1は、本発明の原理構成を示す図である。輪郭抽出手段101、曲面推定手段102、歪み補正手段103を備える。矩形状の紙を撮像した画像を入力画像とし、輪郭抽出手段101が紙の輪郭を抽出し、曲面推定手段102が輪郭の歪みを手がかりに紙の3次元モデルを推定し、歪み補正手段103が紙の3次元曲面モデルに基づいて歪みを補正した画像を出力する。
【0015】
帳票のOHR画像には折り目などによる影が発生するが、動的な影・濃淡むらのため安定した影の情報の取得は期待できない。従って、影の変化を歪み補正の手がかりに用いることは得策ではない。そこで、図1に示す本発明では比較的安定して取得できる帳票の輪郭を手がかりとして歪みを補正することにした。本方式は、帳票が長方形であることに着目して、帳票の輪郭の変形を手がかりに水平・垂直方向の画像伸縮を行う手法で、shape from contourの一種とも言える。本方式の特徴は、曲面推定手段102が一枚の歪み画像から2次元輪郭の歪みを手がかりに3次元曲面モデルを推定している点である。カメラが一台で済むことにより、実現コストを大きく削減させ、手がかりとして影の変化と比較して安定して抽出できる帳票輪郭の歪みを用いているため、精度の良い歪み補正を実現できる効果がある。
【0016】
図2に、本発明第1の実施例の構成を示す。図2に示す歪み補正方式は、中央部に折り目のある帳票に発生する歪みのうち、中折り沈み歪みを補正する補正方式である。中折り沈み歪みOHR画像は図19に示したように、帳票の上輪郭、下輪郭、中折り輪郭は台などの基準面に接した線分として認識できる。尚、帳票の置き方によっては左輪郭、右輪郭、中折り輪郭が線分と認識される場合があるが、これは画像を90度回転すれば上述したものと同様になる。従って、以下、上輪郭、中折り輪郭、下輪郭が線分として認識できる場合を例に中折り沈み歪みを補正する第1の実施例についてより詳細に説明する。
【0017】
図2において、矩形状の紙を撮像した画像を入力画像とし、輪郭抽出手段201が紙の輪郭を抽出し、中折り沈み曲面推定手段202が中折り沈み帳票の輪郭の歪みを手がかりに3次元曲面モデルを推定し、歪み補正手段203が紙の3次元曲面モデルに基づいて歪みを補正した画像を出力する。
【0018】
輪郭抽出手段201は、まず、ソーベルのエッジ抽出などの何らかのエッジ抽出により得た輪郭を輪郭候補画素とし、各輪郭候補画素が輪郭を構成するか否かを判断する。尚、輪郭抽出手段201は、エッジ抽出で抽出される紙の輪郭だけでなく、紙に付与された直線(水平、垂直)、文字列(水平、垂直)をも抽出し、これらの情報を用いるように構成してもよい。
【0019】
抽出された輪郭候補画素の集合のうち対象画素が、例えば、左輪郭を構成するか否かを判断する場合について説明する(図3参照)。ある画素が左輪郭を構成する場合、その画素の左側は背景色などの低い画素値を持つ画素列で、右側は帳票なので白色などの高い画素値を持つ画素列となる。従って、例えば(−1,−1,−1,0,1,1,1)という線形フィルタ302と輪郭候補画素301との積和を求めると、積和値は大きくなる。よって、ある一定の閾値を定めておき、閾値より大きな積和値を持つ輪郭候補画素を輪郭画素として決定すればよい。このように、各輪郭候補画素に対して積和演算を行い、求めた積和値と閾値を比較して左輪郭を決定する。
【0020】
同様に右輪郭の場合は、左輪郭の逆の構成を持つ線形フィルタ(1,1,1,0,−1,−1,−1)を用いればよく、上・下輪郭も同様に決定することができる。
【0021】
尚、線形フィルタは0を中心に左右または上下対象となる任意の固有ベクトルでよい。すなわち、任意の定数k、−kが0を中心にN個ずつ並ぶ(k,k,…,k,0,−k,…,−k,−k)のような固有ベクトルでよい。
【0022】
上述のようにして輪郭抽出手段201は輪郭二値画像を出力する。さらに、輪郭抽出手段201は、後の処理で必要となる輪郭頂点、サンプル輪郭点を抽出する。尚、輪郭抽出手段201で得るものは2次元の画像中の輪郭に関するものなので、3次元中の帳票輪郭と区別するために、以降では頭に「2次元」とつけ、それぞれ2次元輪郭線、2次元輪郭頂点、2次元サンプル輪郭点と呼ぶことにする。図4は、輪郭抽出手段201で得られる2次元輪郭線、2次元輪郭頂点、2次元サンプル輪郭点の2次元座標に基づく表現を示している。
【0023】
2次元輪郭頂点は、図4に示す上輪郭ABまたは下輪郭EFの中央部付近の輪郭点から左右方向に輪郭線をたどり、急激に傾きの変化する輪郭点(左上輪郭頂点A、右上輪郭頂点B、左下輪郭頂点E、右下輪郭頂点F)を探索して求める。また、輪郭頂点A、B、E、Fを線分で結んで得られた矩形ABFEとの位置関係により、中折り輪郭(帳票中央部)の左右の頂点を抽出する。中折り沈み帳票の場合は、矩形に最も入りこんだ左右の輪郭点を中折り沈み輪郭頂点とする(折線左頂点C及び折線右頂点D)。
【0024】
さらに、抽出した左右の輪郭線を区分線形近似するために用いられる2次元サンプル輪郭点は、図4に示すY軸方向に予め定めた等間隔ごとに選択することで求められる。
【0025】
以下、2次元座標に基づく各点、線分、輪郭線などの表現等は図4に従うとする。
次に、中折り沈み曲面推定手段202について説明する。中折り沈み曲面推定手段202は、中折り沈み帳票に対して、得られた2次元サンプル輪郭点と入力画像の視点であるカメラ中心(スタンド型のOHRを利用するので、カメラ中心は予め決まっている。)とを結ぶ線分と2つの2次元輪郭頂点を結ぶ線分を通り基準面に垂直な平面の交点であると仮定して、3次元サンプル輪郭点の座標を求める。そして求めた3次元サンプル輪郭点を線分でつないだ折線を輪郭線とし、輪郭線の線形補間近似により得た曲面を、歪んだ帳票曲面の3次元曲面モデルとして推定する。
【0026】
中折り沈み曲面は、中折り輪郭(帳票中央部の基準面に接している線分)を境に上下2つの曲面に分割できる。以下、上部の曲面に限定して、中折り沈み曲面推定手段202における処理を詳細に説明する。下部の曲面に対しても上下対象に同様の議論を展開できる。
【0027】
図5に、カメラ中心と2次元輪郭及び3次元輪郭の位置関係を示す。図5に示した各記号の意味は外1の通り。透視変換により2次元サンプル輪郭点と関係づけられた3次元輪郭線上の点を3次元サンプル輪郭点と呼ぶ。カメラ中心及び3次元サンプル輪郭点の座標を図5のように表現することにする。
【0028】
【外1】
Figure 0004456304
【0029】
左輪郭線上の3次元サンプル輪郭点の座標を求める場合、次のように求められる。
2次元左輪郭線上の2次元サンプル輪郭点に対応する3次元左輪郭線上の3次元サンプル輪郭点は、カメラ中心と2次元サンプル輪郭点を結ぶ線分と左輪郭頂点A、Cを結ぶ線分ACを通りxy平面に垂直な平面の交点として求められる。
【0030】
線分ACを含むxy平面に垂直な平面の方程式は(1)式のように表せる。
【0031】
【数1】
Figure 0004456304
【0032】
また、3次元サンプル輪郭点がカメラ中心と2次元サンプル輪郭点を結ぶ線分を(1−t):tに内分する点であるとした場合、(2)式が成立する。
【0033】
【数2】
Figure 0004456304
【0034】
(1)式、(2)式をtについて解くと、(3)式になる。
【0035】
【数3】
Figure 0004456304
【0036】
(3)式で求められるtを代入することにより、各3次元サンプル輪郭点の座標を求めることができる。
右輪郭線上の3次元サンプル輪郭点の座標も同様にして求めることができる。
【0037】
以上のように求めた3次元サンプル輪郭点を線分でつないだ折線を左輪郭線および右輪郭線とし、これらの輪郭線の線形補間近似により得た曲面を歪んだ帳票曲面の3次元曲面モデルとする。
【0038】
線形補間近似として、例えば線形Coons補間などの補間手法を使うことができる。線形Coons補間とは、4つの3次元輪郭がある場合に、その間を線分で補間することである。線形Coons補間を行うための線形Coons曲面とは、曲線座標系(u,w)により定義されるパラメトリックな空間曲面の一種である。曲面が4つの曲面P(u,0)、P(u,1)、P(0,w)、P(1,w)により囲まれているとし、曲面上の点の座標をQ(u,w)とすると、輪郭曲線の式を用いて(4)式のように表現できる(図6)。これにより得られる曲面を3次元曲面モデルとする。
【0039】
【数4】
Figure 0004456304
【0040】
また、中折り沈み曲面推定手段202における3次元輪郭モデルを求める手法として、3次元輪郭線の点を離散的に3次元サンプル輪郭点としてとり、3次元サンプル点の高さあるいはそれに対応する量をモデルパラメータとする手法を説明したが、3次元輪郭モデルを求める手法は、この手法に限られるものではない。すなわち、例えば3次元輪郭モデルとして、スプライン曲線、ベジエ曲線などのパラメータ付曲線モデルを用いてもよい。
【0041】
スプライン曲線、ベジエ曲線はパラメトリックな空間曲線である。一般に、パラメトリックな空間曲線は(5)式で表される。
【0042】
【数5】
Figure 0004456304
【0043】
(5)式より、スプライン曲線は(6) 式で表される。
【0044】
【数6】
Figure 0004456304
【0045】
同様に(5)式より、ベジエ曲線は(7)式で表される。
【0046】
【数7】
Figure 0004456304
【0047】
このようにスプライン曲線、ベジエ曲線はパラメータtによって表現できるため、このパラメータtをモデルパラメータとして3次元輪郭モデルを求めればよい。
【0048】
また更に、中折り曲面推定部(あるいは曲面推定部)は輪郭線を用いるだけでなく、紙に付与された直線(垂直、水平)、文字列(垂直、水平)などの情報を用いて、同様の方法で3次元曲面を推定するように構成することもできる。
【0049】
次に、歪み補正手段203について説明する。歪み補正手段203は、補正後画像の各画素に対応した入力画像中の位置を、輪郭線を座標軸とする曲線座標系を用いて求め、入力画像中の対応画素の値(二値、階調、カラー)を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正後画像を得る。
【0050】
中折り帳票の場合、上輪郭線及び下輪郭線は輪郭頂点を結ぶ線分として得られる。左輪郭線及び右輪郭線は中折り沈み曲面推定手段202により得られた3次元サンプル輪郭点を結ぶ折線として得られる。また、中折り輪郭は中折り沈み曲面推定手段202により得られた中折り部の3次元サンプル輪郭点を結ぶ線分として得られる。
【0051】
中折り帳票を中折り輪郭を境に上部と下部に分割し、それぞれに対する3次元曲面上に曲線座標系を設定して歪み補正を行う。以下、上部の3次元曲面についての歪み補正方法を説明する。下部に対しても同様の処理を実行すればよい。
【0052】
原点を左上輪郭頂点(図4に示す点A)とし、X軸を上輪郭線とし、Y軸を左輪郭線とする。補正後画像の幅W(width)は、上輪郭線及び中折り輪郭線の長さの平均値を用い、補正後画像の高さH(hight)は左輪郭線及び右輪郭線の長さの平均を用いる。すなわち(8)、(9)式のようになる。
【0053】
【数8】
Figure 0004456304
【0054】
左輪郭線上のY座標のメモリ付けをするために、0以上高さH以下の整数値をとるYに対して左輪郭線上の点L(Y)を対応づけ、3次元座標を求める。L(Y)の3次元座標を求めるには、左輪郭線を表す3次元サンプル輪郭点をつないだ折れ線上を左上輪郭頂点からたどり、長さ(H/Ac)ずつ進めることによって行う。
【0055】
同様にして0以上高さH以下の整数値をとるYに対して右輪郭線上の点R(Y)を対応づけ、3次元座標を求める。R(Y)の3次元座標を求めるには、右輪郭線を表す3次元輪郭点をつないだ折線上を右上輪郭頂点からたどり、長さ(H/Bd)ずつ進めることによって行う。L(Y)とR(Y)により曲線座標系を表現していると考えることができる(図7)。
【0056】
このように曲線座標系を定義し、次に歪み補正後の画像の2次元座標(X,Y)に対応した画素の濃度G(X,Y)(0≦X≦W,0≦Y≦H)を求める。
補正後2次元座標(X,Y)に対応する点は、3次元曲面上の曲線座標による2次元座標(X,Y)を持つ点Pである。点Pの3次元座標を(10)式とする。
【0057】
【数9】
Figure 0004456304
【0058】
点Pは、左輪郭線上の点L(Y)と右輪郭線上の点R(Y)を線形補間した点として、線分L(Y)R(Y)をX/W:(1−X/W)に内分する点として表現することができる。従って(11)式より点Pの3次元座標を求めることができる。
【0059】
【数10】
Figure 0004456304
【0060】
次に、カメラ中心から点Pを通る直線とxy基準面との交点の2次元座標を求める。透視変換の条件により、(12)式のようになる。
【0061】
【数11】
Figure 0004456304
【0062】
従って、補正後画像の濃度G(X,Y)は(13)式で求めることができる。
【0063】
【数12】
Figure 0004456304
【0064】
但し、(13)式において、カメラ中心から点Pを通る直線とxy基準面との交点の2次元座標は、実数なので少数部分を丸めるために四捨五入をしている。以上に説明した本発明第1の実施例に従って処理した中折り沈み歪みOHR画像の補正結果を図8に示す。図8は、図19を補正したものである。このように、本発明第1の実施例によれば、中折り沈み歪みOHR画像を良好に補正することができる。
【0065】
図9は本発明第2の実施例を示す図である。図9に示す歪み補正方式は、中央部に折り目のある帳票に発生する歪みのうち、中折り浮き歪みを補正する補正方式である。中折り浮き歪みOHR画像は図20に示したように、帳票の上輪郭及び下輪郭は台などの基準面に接しているが、第1の実施例で対象とした中折り沈み歪みとは異なり、中央部の中折り輪郭は基準面から浮いている。尚、帳票の置き方によっては、左輪郭、右輪郭、中折り輪郭が線分として認識される場合があるが、これは画像を90度回転すれば上述したものと同様になる。従って、以下、上輪郭、中折り輪郭、下輪郭が線分として認識できる場合を例に中折り浮き歪みを補正する第2の実施例についてより詳細に説明する。
【0066】
図9において、矩形状の紙を撮像した画像を入力画像とし、輪郭抽出手段901が紙の輪郭を抽出し、中折り浮き曲面推定手段902が中折り浮き帳票の輪郭の歪みを手がかりに3次元曲面モデルを推定し、歪み補正手段903が紙の3次元曲面モデルに基づいて歪みを補正した画像を出力する。
【0067】
輪郭抽出手段901は、第1の実施例で説明した輪郭抽出手段201とほぼ同様に、エッジ抽出のあと、エッジ抽出された輪郭候補画素に対して線形フィルタとの積和を求めて、求めた積和値から輪郭画素を決定する。また、2次元輪郭線、2次元輪郭頂点、2次元サンプル輪郭点を抽出する。
【0068】
この際、中折り輪郭(帳票中央部)の左右の頂点を抽出するには中折り沈み帳票の場合とは異なり、矩形から最も離れた左右の輪郭点を中折り浮き輪郭頂点として抽出する。
【0069】
輪郭抽出手段901は、図10に示すような2次元座標に基づく2次元輪郭線、2次元サンプル輪郭点、2次元輪郭頂点を抽出する。以下、2次元座標に基づく各点、線分、輪郭線などの表現等は図10に従うとする。
【0070】
次に、中折り浮き曲面推定手段902について説明する。中折り浮き曲面推定手段902では、上輪郭/下輪郭が基準面からの高さ0、中央部の中折り輪郭の高さが未知である中折り浮き帳票に対して、中央部の中折り輪郭の頂点の高さに相当する量を2次元のモデルパラメータとする。そして、モデルパラメータを用いて3次元輪郭長が上下/左右それぞれ等しいという制約を付したエネルギー関数を表現する。このエネルギー関数を最小化する最適化問題として、最適なモデルパラメータを反復法などの方法により求める。求めたモデルパラメータから、各3次元サンプル輪郭点の座標を求め、3次元曲面モデルを推定する。以下、モデルパラメータを求める手法について述べる。
【0071】
尚、中折り浮き曲面は、中折り輪郭(帳票中央部)を境に上下2つの曲面に分割できるので、上部の曲面に限定して中折り浮き曲面推定手段902における処理を詳細に説明する。
【0072】
図11に、カメラ中心と2次元輪郭及び3次元輪郭の位置関係を示す。図11における各記号の意味は外1と同じである。透視変換により2次元サンプル輪郭点と関係付けられた3次元輪郭線上の点を3次元サンプル輪郭点と呼ぶ。カメラ中心及び3次元サンプル輪郭点の座標を図11のように表現することにする。
【0073】
左輪郭線について、3次元サンプル輪郭点がカメラ中心Kと2次元サンプル輪郭点を結ぶ線分を内分する点であるとした場合、(14)式が成り立つ。
【0074】
【数13】
Figure 0004456304
【0075】
また、右輪郭線について3次元サンプル輪郭点がカメラ中心Kと2次元サンプル輪郭点を結ぶ線分を内分する点であるとした場合、(15)式が成り立つ。
【0076】
【数14】
Figure 0004456304
【0077】
中折り浮き輪郭の3次元左頂点cの座標は(16)式、3次元右頂点dの座標は(17)式で表せる。この二つの点の内分比がそれぞれ決まると、各3次元サンプル輪郭点は、カメラ中心Kと2次元サンプル輪郭点を結ぶ線分上にあり、かつ線分Acあるいは線分Bdを含みxy平面に垂直な平面上にある、という条件から、各3次元サンプル輪郭点の座標が求まることになる。
【0078】
【数15】
Figure 0004456304
【0079】
従って、3次元左頂点c、3次元右頂点dの内分比が帳票曲面の3次元モデルの2次元モデルパラメータであると考えることができる。
左輪郭線について、上記の3次元サンプル輪郭点の満たすべき条件から、対応する内分比をモデルパラメータを用いて(18)式のように求めることができる。
【0080】
【数16】
Figure 0004456304
【0081】
同様に、右輪郭線についても3次元サンプル輪郭点の満たすべき条件から対応する内分比をモデルパラメータを用いて(19)式のように求めることができる。
【0082】
【数17】
Figure 0004456304
【0083】
3次元輪郭線が上下/左右それぞれで等しいという制約を表現したエネルギー関数Eを最小化する最適化問題として定式化し、以下に述べるように最適なモデルパラメータを例えば反復法により求める。
【0084】
エネルギー関数Eは、上輪郭線ABと中折り浮き輪郭線cdの長さの差の自乗と左輪郭線Acと右輪郭線Bdの長さの差の自乗の線形和で定義する。帳票曲面のモデルパラメータである内分比により、エネルギー関数Eの値は一意に決まる。従って、エネルギー関数Eは(20)式のようになる。
【0085】
【数18】
Figure 0004456304
【0086】
上輪郭線(線分AB)及び中折り浮き輪郭線(線分cd)は線分であるから、(21)式、(22)式のように3次元頂点座標から長さを求めることができる。
【0087】
【数19】
Figure 0004456304
【0088】
一方、左輪郭線Ac及び右輪郭線Bdの長さは3次元サンプル輪郭点を結ぶ線分の長さの和で近似することとする。すなわち、(23)式、(24) 式のようになる。
【0089】
【数20】
Figure 0004456304
【0090】
エネルギー関数Eを最小にするモデルパラメータを、最急降下法により求める。すなわち、初期値を適当に設定し、(25)式によりモデルパラメータを繰り返し変化させる。εは微小な正の数である。
【0091】
【数21】
Figure 0004456304
【0092】
(20)式のエネルギー関数の定義を用いて展開すると、(26)式、(27)式のようになる。
【0093】
【数22】
Figure 0004456304
【0094】
以上により、モデルパラメータが求められ、各3次元サンプル輪郭点の座標を求めることができる。そして、中折り浮き曲面推定手段902は、求めた各3次元サンプル輪郭点を線分でつないだ折線を輪郭線とし、輪郭線の線形補間近似により得た曲面を歪んだ帳票曲面の3次元曲面モデルとして推定する。線形補間近似としては、中折り沈み曲面推定手段202と同様に線形Coons補間などの補間手法を用いる。
【0095】
尚、エネルギー関数Eについて、中折り浮き曲面上部についてのエネルギー関数Eを定式化したが、曲面上部・下部の全体でエネルギー関数Eを定式化することもできる。曲面全体に対して定式化したエネルギー関数Eは、中折り浮き曲面モデルが図12に示すように表せるとして、(28)式のように表現される。
【0096】
【数23】
Figure 0004456304
【0097】
この場合、曲面全体に対して最適化問題を解くことになるので、曲面上部と下部に分けてモデルパラメータを求めた場合よりも精度が上がることになる。
次に、歪み補正手段903についてであるが、歪み補正手段903は、第1の実施例における歪み補正手段203と同じである。すなわち、歪み補正手段903は、補正後画像の各画素に対応した入力画像中の位置を、輪郭線を座標軸とする曲線座標系を用いて求め、入力画像中の対応画素の値(二値、階調、カラー)を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正後画像を得る。詳細については、第1の実施例の説明を参照とする。
【0098】
本発明第2の実施例に従って処理した中折り浮き歪みOHR画像の補正結果を図13に示す。図13は、図20を補正したものである。このように、本発明第2の実施例によれば、中折り浮き歪みOHR画像を良好に補正することができる。
【0099】
以上のように、帳票のOHR画像における中折り沈み/浮き歪みの補正方式について詳細に説明したが、この方式はこれらの場合に限定されるものではない。すなわち、帳票のOHR画像における線織面歪みについても同様の方式を適用できる。尚、線織面とは紙を歪めた場合にできる曲面の一般的な呼び方である。
【0100】
例えば、線織面歪みの一例として、帳票のOHR画像に周辺浮き歪み(図21)が生じている場合、3次元輪郭が全て曲線となる。従って、中折り浮き歪みの場合に2つのモデルパラメータを求めたが(本発明第2の実施例)、より多くのモデルパラメータ(例えば10〜20個)を設定し、上下/左右の輪郭の長さが等しいというエネルギー関数を定式化し、最適化問題を解くようにすればよい。そして、求めたモデルパラメータから3次元曲面モデルを推定し、推定した曲面モデルに基づいて入力画像における歪みを補正して出力する。同様に、周辺沈み歪み(図22)、冊子歪み(図23)についても、より多くのモデルパラメータを設定することで3次元曲面モデルを推定し、歪み補正を行うことができる。
【0101】
また、上記各実施例の説明では、図1に示した本発明の原理構成に従って、輪郭抽出手段101で輪郭を抽出し、曲面推定手段102で輪郭の歪みを手がかりに3次元モデルを推定し、歪み補正手段103が推定した3次元曲面モデルに基づいて歪みを補正した画像を出力する方式について述べた。しかしながら、図14に示すように、曲面を推定せずに、輪郭抽出手段1401で抽出された輪郭の歪みを手がかりに歪み補正手段1402が歪みを補正した画像を出力するように構成することもできる。
【0102】
輪郭抽出手段1401は、輪郭抽出手段101と同様な処理を行うが、この場合の歪み補正手段1402について、図15のような輪郭1501が得られた場合を例として説明する。まず、歪み補正手段1402では、抽出された輪郭1501の上輪郭1502、中折り輪郭1503、下輪郭1504の線分の長さに合わせて、輪郭を横方向に伸縮させる(▲1▼)。そして次に、図15に示す点線で囲んだ各部分の曲線部(1505−1〜1505−8)を直線で近似して、その直線の傾きを求め、その傾きから縦方向の縮み具合を求める。求められた縮み具合に基づいて、前記横方向に伸縮させた輪郭を更に縦方向に伸縮する(▲2▼)。このように、3次元曲面モデルを推定せずに、2次元のデータ処理だけで歪みを補正するように構成することも可能である。
【0103】
ところで、本発明の歪み補正方式は、図16に示すような情報処理装置(コンピュータ)を用いて実行することができる。図16の情報処理装置は、CPU(中央処理装置)1601、メモリ1602、入力装置1603、出力装置1604、外部記憶装置1605、媒体駆動装置1606、及びネットワーク接続装置1607を備え、それらはバス1608により互いに接続されている。
【0104】
メモリ1602は、例えばROM(read only memory)、RAM(random access memory)等を含み、処理に用いられるプログラムとデータを格納する。CPU1601は、メモリ1602を利用してプログラムを実行することにより、必要な処理を行う。つまり、本発明の輪郭抽出手段101、曲面推定手段102、歪み補正手段103はメモリ1602に格納されたプログラムで実現される。
【0105】
帳票等の画像データは、OHR等の入力装置1603を介して情報処理装置に取り込まれる。また、出力装置1604は例えばディスプレイ、プリンタ等であり、処理結果の出力等に用いられる。
【0106】
外部記憶装置1605は、例えば磁気ディスク装置、光ディスク装置、光磁気ディスク装置などである。情報処理装置はこの外部記憶装置1605に、上述のプログラムとデータを保存しておき、必要に応じて、それらをメモリ1602にロードして使用することができる。
【0107】
媒体駆動装置1606は、可搬型記録媒体1609を駆動し、その記録内容にアクセスする。可搬型記録媒体1609としては、メモリカード、フレキシブルディスク、CD−ROM(compact disk read only memory) 、光ディスク、光磁気ディスク等、任意のコンピュータ読み取り可能な記録媒体が用いられる。この可搬記録媒体1609に上述のプログラムとデータを格納しておき、必要に応じてそれらをメモリ1602にロードして使用することができる。
【0108】
ネットワーク接続装置1607は、LAN(local area network)等の任意のネットワーク( 回線) を介して外部の装置と通信し、通信に伴うデータ変換を行う。情報処理装置は、必要に応じて、ネットワーク接続装置1607を介して上述のプログラムとデータを外部の装置から受け取り、それらをメモリ1602にロードして使用することができる。なお、図16は情報処理装置単体で示してあるが、複数のコンピュータからなる処理装置やネットワークを介した複数の処理装置でも実現が可能である。
【0109】
また、図17は、本発明に係わる情報処理装置で実行されるソフトウェアプログラム等の提供方法を説明する図である。プログラム等は例えば以下の(a)〜(c)の3つの方法の中の任意の方法により提供される。
【0110】
( a) コンピュータ等の情報処理装置1701にインストールされて提供される。この場合、プログラム等は例えば出荷前にプレインストールされる。
( b) 可搬型記録媒体1609に格納されて提供される。この場合、可搬型記憶媒体1609に格納されているプログラム等は、コンピュータ等の情報処理装置1701の外部記憶装置1605にインストールされる。
【0111】
( c) ネットワーク1702上のサーバから提供される。この場合、基本的には、コンピュータなどの情報処理装置1701がサーバ1703に格納されているプログラム等をダウンロードすることによって、そのプログラム等を取得する。
【0112】
(付記1)矩形状の紙を撮像した画像を入力画像とし、前記入力画像から前記紙に付与された規則正しい図形を抽出する輪郭抽出手段と、
前記規則正しい図形の歪みを手がかりに前記紙の3次元曲面モデルを推定する曲面推定手段と、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
を備えることを特徴とする歪み補正装置。
【0113】
(付記2)矩形状の紙を撮像した画像を入力画像とし、前記入力画像から前記紙の輪郭、あるいは紙に書かれている水平線及び垂直線、あるいは紙に書かれている水平文字列及び垂直文字列を抽出する輪郭抽出手段と、
前記輪郭の歪み、あるいは前記紙書かれている水平線及び垂直線の交差の歪み、あるいは前記紙に書かれている水平文字列及び垂直文字列の交差の歪みを手がかりに前記紙の3次元曲面モデルを推定する曲面推定手段と、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
を備えることを特徴とする歪み補正装置。
【0114】
(付記3)矩形状の紙を撮像した画像を入力画像とし、前記入力画像から前記紙の輪郭を抽出する輪郭抽出手段と、
前記輪郭の歪みを手がかりに歪みを補正した画像を出力画像として出力する歪み補正手段と、
を備えることを特徴とする歪み補正装置。
【0115】
(付記4)矩形状の紙の輪郭情報を取得し、前記輪郭情報から得られる輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定する曲面推定手段と、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
を備えることを特徴とする歪み補正装置。
【0116】
(付記5)矩形状の紙を撮像した画像を入力画像とし、前記入力画像から前記紙の輪郭を抽出する輪郭抽出手段と、
前記輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定する曲面推定手段と、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
を備えることを特徴とする歪み補正装置。
【0117】
(付記6)前記入力画像及び出力画像が白黒二値画像または階調画像またはカラー画像であることを特徴とする、付記5記載の歪み補正装置。
(付記7)前記輪郭抽出手段は、前記入力画像に対してエッジ抽出を行って得た輪郭画素候補のうち、水平あるいは垂直方向に対象画素を挟んで前記紙の外部領域の階調あるいはカラーを持つ画素の列の並びと前記紙の内部領域の階調あるいはカラーを持つ画素の列の並びが存在する度合いを表す輪郭らしさを評価し、前記輪郭らしさが強い輪郭画素候補を輪郭画素とすることを特徴とする、付記5記載の歪み補正装置。
【0118】
(付記8)前記輪郭抽出手段は、前記輪郭らしさとして、前記輪郭画素候補を挟んで水平あるいは垂直方向に、前記輪郭画素候補の近傍から任意に抽出された画素の値と適切に設定した固定値ベクトルとの積和演算を行って得た量を用いることを特徴とする、付記7記載の歪み補正装置。
【0119】
(付記9)前記輪郭抽出手段は、前記輪郭らしさとして、前記輪郭画素候補を挟んで水平あるいは垂直方向に、kを正または負の定数として、水平方向の場合は値0を中心とする左右対称のマスク、k,k,k,・・・,k,0,−k,・・・,−k,−k,−k、垂直方向の場合は値0を中心とする上下対称のマスク、k,k,k,・・・,k,0,−k,・・・,−k,−k,−kにより、積和演算を行って得た量を用いることを特徴とする、付記8記載の歪み補正装置。
【0120】
(付記10)前記曲面推定手段は、前記3次元曲面モデルとして、中折り沈み歪みをモデル化した中折り沈み歪み3次元曲面モデルを用いることを特徴とする、付記5記載の歪み補正装置。
【0121】
(付記11)前記曲面推定手段は、前記3次元曲面モデルとして、中折り浮き歪みをモデル化した中折り浮き歪み3次元曲面モデルを用いることを特徴とする、付記5記載の歪み補正装置。
【0122】
(付記12)前記曲面推定手段は、前記3次元曲面モデルとして、周辺浮き歪みをモデル化した周辺浮き歪み3次元曲面モデルを用いることを特徴とする、付記5記載の歪み補正装置。
【0123】
(付記13)前記曲面推定手段は、前記3次元曲面モデルとして、前記紙の3次元輪郭をモデル化して得られる3次元輪郭モデルに線形Coons 補間などの補間手法を施して得られる曲面を用いることを特徴とする、付記5記載の歪み補正装置。
【0124】
(付記14)前記曲面推定手段は、前記3次元輪郭モデルとして、3次元輪郭上の点を離散的に3次元サンプル点として取り、3次元サンプル点の高さあるいはそれに対応した量をモデルパラメータとすることを特徴とする、付記13記載の歪み補正装置。
【0125】
(付記15)前記曲面推定手段は、前記3次元輪郭モデルとして、スプライン曲線またはベジエ曲線などのパラメータ付き曲線モデルを用いることを特徴とする、付記13記載の歪み補正装置。
【0126】
(付記16)前記曲面推定手段は、前記3次元輪郭モデルとして、3次元輪郭の端点2点の高さ、あるいはそれに対応した量をモデルパラメータとして、3次元輪郭上の点は端点2点を結んだ3次元線分を含む垂直平面上に存在するとして位置を制約することを特徴とする、付記13記載の歪み補正装置。
【0127】
(付記17)前記曲面推定手段は、前記3次元輪郭モデルとして、3次元線分を用いることがあることを特徴とする付記13記載の歪み補正装置。
(付記18)前記曲面推定手段は、抽出された輪郭を手がかりに、透視変換を用いて3次元輪郭を推定することにより、3次元曲面を推定することを特徴とする、付記5記載の歪み補正装置。
【0128】
(付記19)前記曲面推定手段は、左右あるいは上下で対となっている3次元輪郭の長さが等しいという制約をエネルギー関数を用いて表現し、エネルギー最小となる前記3次元曲面モデルのパラメータを求める最適化問題を解いて3次元曲面モデルを推定することを特徴とする、付記11記載の歪み補正装置。
【0129】
(付記20)前記曲面推定手段は、輪郭を座標軸とする曲線座標系において、同一のX座標あるいはY座標を持つ曲線がすべて同じ長さを持つという制約をエネルギー関数を用いて表現し、エネルギー最小となる3次元曲面モデルのパラメータを求める最適化問題を解いて3次元曲面モデルを推定することを特徴とする、付記15記載の歪み補正装置。
【0130】
(付記21)前記歪み補正手段は、前記輪郭を座標軸とする曲線座標系を用いて補正後画像の各画素に対応した前記入力画像中の位置を求め、前記入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正後画像を得ることを特徴とする付記5記載の歪み補正装置。
【0131】
(付記22)矩形状の紙を撮像した画像を入力画像とし、
前記入力画像から前記紙に付与された規則正しい図形を抽出し、
前記規則正しい図形の歪みを手がかりに前記紙の3次元曲面モデルを推定し、前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
ことを特徴とする歪み補正方法。
【0132】
(付記23)矩形状の紙を撮像した画像を入力画像とし、
前記入力画像から前記紙の輪郭、あるいは紙に書かれている水平線及び垂直線、あるいは紙に書かれている水平文字列及び垂直文字列を抽出し、
前記輪郭の歪み、あるいは前記紙書かれている水平線及び垂直線の交差の歪み、あるいは前記紙に書かれている水平文字列及び垂直文字列の交差の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
ことを特徴とする歪み補正方法。
【0133】
(付記24)矩形状の紙を撮像した画像を入力画像とし、
前記入力画像から前記紙の輪郭を抽出し、
前記輪郭の歪みを補正した画像を出力画像として出力する、
ことを特徴とする歪み補正方法。
【0134】
(付記25)矩形状の紙の輪郭情報を取得し、
前記輪郭情報から得られる輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
ことを特徴とする歪み補正方法。
【0135】
(付記26)矩形状の紙を撮像した画像を入力画像とし、
前記入力画像から前記紙の輪郭を抽出し、
前記輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
ことを特徴とする歪み補正方法。
【0136】
(付記27)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムを記録した記録媒体であって、
前記入力された画像から前記紙に付与された規則正しい図形を抽出し、
前記規則正しい図形の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0137】
(付記28)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムを記録した記録媒体であって、
前記入力された画像から前記紙の輪郭、あるいは紙に書かれている水平線及び垂直線、あるいは紙に書かれている水平文字列及び垂直文字列を抽出し、
前記輪郭の歪み、あるいは前記紙書かれている水平線及び垂直線の交差の歪み、あるいは前記紙に書かれている水平文字列及び垂直文字列の交差の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0138】
(付記29)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムを記録した記録媒体であって、
前記入力画像から前記紙の輪郭を抽出し、
前記輪郭の歪を補正した画像を出力する、
という処理を含むプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0139】
(付記30)入力された矩形状の紙の輪郭情報に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムを記録した記録媒体であって、
前記輪郭情報から得られる輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0140】
(付記31)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムを記録した記録媒体であって、
前記入力された画像から前記紙の輪郭を抽出し、
前記輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0141】
(付記32)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムであって、
前記入力された画像から前記紙に付与された規則正しい図形を抽出し、
前記規則正しい図形の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラム。
【0142】
(付記33)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムであって、
前記入力された画像から前記紙の輪郭、あるいは紙に書かれている水平線及び垂直線、あるいは紙に書かれている水平文字列及び垂直文字列を抽出し、
前記輪郭の歪み、あるいは前記紙書かれている水平線及び垂直線の交差の歪み、あるいは前記紙に書かれている水平文字列及び垂直文字列の交差の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラム。
【0143】
(付記34)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムであって、
前記入力画像から前記紙の輪郭を抽出し、
前記輪郭の歪を補正した画像を出力する、
という処理を含むプログラム。
【0144】
(付記35)入力された矩形状の紙の輪郭情報に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムであって、
前記輪郭情報から得られる輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラム。
【0145】
(付記36)入力された矩形状の紙を撮像した画像に含まれる紙の輪郭の歪みを補正するという処理をコンピュータに実行させるためのプログラムであって、
前記入力された画像から前記紙の輪郭を抽出し、
前記輪郭の歪みを手がかりに前記紙の3次元曲面モデルを推定し、
前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する、
という処理を含むプログラム。
【0146】
【発明の効果】
以上詳細に説明したように本発明によれば、3次元歪みの存在する帳票について、上から撮像した一枚の画像(OHR画像)から取得できる2次元輪郭を手がかりにし、さらに紙が矩形状であるという制約を利用して3次元モデルを推定し、得られた3次元曲面モデルから画像の3次元歪みを補正することができる。これにより、一枚の画像から得られる2次元輪郭の歪みを手がかりに入力画像を補正するので、従来技術と比較してカメラが一台で済み、実現コスト及び設置スペースを削減することができる。
【図面の簡単な説明】
【図1】本発明の原理構成を示す図である。
【図2】本発明第1の実施例の構成を示す図である。
【図3】輪郭抽出手段における輪郭らしさの評価方法を説明する図である。
【図4】輪郭線、輪郭頂点及びサンプル輪郭点を示す図である。
【図5】中折り沈み曲面モデル(上部)におけるカメラ中心と2次元輪郭及び3次元輪郭の位置関係を示す図である。
【図6】線形Coons曲面を示す図である。
【図7】3次元曲面に対する曲線座標系を示す図である。
【図8】中折り沈み歪み補正結果を示す図である。
【図9】本発明第2の実施例の構成を示す図である。
【図10】輪郭線、輪郭頂点及びサンプル輪郭点を示す図である。
【図11】中折り浮き曲面モデル(上部)におけるカメラ中心と2次元輪郭及び3次元輪郭の位置関係を示す図である。
【図12】中折り浮き曲面モデル(全体)を示す図である。
【図13】中折り浮き歪み補正結果を示す図である。
【図14】曲面を推定せずに歪みを補正する場合の構成を示す図である。
【図15】図14に示す方式を説明する図である。
【図16】情報処理装置を示す図である。
【図17】ソフトウェアプログラム等の提供方法を説明する図である。
【図18】非接触型画像入力装置(OHR)を示す図である。
【図19】中折り沈みOHR画像の例を示す図である。
【図20】中折り浮きOHR画像の例を示す図である。
【図21】周辺歪み(浮き)OHR画像の例を示す図である。
【図22】周辺歪み(沈み)OHR画像の例を示す図である。
【図23】冊子歪みOHR画像の例を示す図である。
【符号の説明】
101 輪郭抽出手段
102 曲面推定手段
103 歪み補正手段
201 輪郭抽出手段
202 中折り沈み曲面推定手段
203 歪み補正手段
301 輪郭候補画素
302 線形フィルタ
901 輪郭抽出手段
902 中折り浮き曲面推定手段
903 歪み補正手段
1401 輪郭抽出手段
1402 歪み補正手段
1501 輪郭
1502 上輪郭
1503 中折り輪郭
1504 下輪郭
1505 輪郭の曲線部
1601 CPU
1602 メモリ
1603 入力装置
1604 出力装置
1605 外部記憶装置
1606 媒体駆動装置
1607 ネットワーク接続装置
1608 バス
1609 可搬記録媒体
1701 情報処理装置
1702 ネットワーク
1703 サーバ

Claims (3)

  1. 矩形状の紙を上から撮像した1枚の画像を入力画像とし、前記入力画像から前記紙の輪郭である2次元輪郭を抽出する輪郭抽出手段と、
    3次元サンプル輪郭点を、カメラ中心と前記2次元輪郭上のサンプル点である2次元サンプル輪郭点を結ぶ線分と、該2次元輪郭頂点を結ぶ線分を通り基準面に垂直な平面の交点として求め、求めた該3次元サンプル輪郭点を線分でつないだ折れ線を輪郭線とし、該輪郭線の線形補間近似により得た曲面を歪んだ紙の3次元曲面モデルとして曲面を推定する曲面推定手段と、
    前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
    を備え、
    前記曲面推定手段は、前記3次元曲面モデルとして、前記紙の3次元輪郭をモデル化して得られる3次元輪郭モデルに線形Coons補間を施して得られる曲面を用い、
    更に、前記曲面推定手段は、前記3次元輪郭モデルとして、3次元輪郭の端点2点の高さ、あるいはそれに対応した量をモデルパラメータとして、3次元輪郭上の点は端点2点を結んだ3次元線分を含む垂直平面上に存在するとして位置を制約することを特徴とする歪み補正装置。
  2. 矩形状の紙を上から撮像した1枚の画像を入力画像とし、前記入力画像から前記紙の輪郭である2次元輪郭を抽出する輪郭抽出手段と、
    3次元サンプル輪郭点を、カメラ中心と前記2次元輪郭上のサンプル点である2次元サンプル輪郭点を結ぶ線分と、該2次元輪郭頂点を結ぶ線分を通り基準面に垂直な平面の交点として求め、求めた該3次元サンプル輪郭点を線分でつないだ折れ線を輪郭線とし、該輪郭線の線形補間近似により得た曲面を歪んだ紙の3次元曲面モデルとして曲面を推定する曲面推定手段と、
    前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
    を備え、
    前記曲面推定手段は、前記3次元曲面モデルとして、中折り浮き歪みをモデル化した中折り浮き歪み3次元曲面モデルを用い、
    更に、前記曲面推定手段は、左右あるいは上下で対となっている3次元輪郭の長さが等しいという制約をエネルギー関数を用いて表現し、エネルギー最小となる前記3次元曲面モデルのパラメータを求める最適化問題を解いて3次元曲面モデルを推定することを特徴とする歪み補正装置。
  3. 矩形状の紙を上から撮像した1枚の画像を入力画像とし、前記入力画像から前記紙の輪郭である2次元輪郭を抽出する輪郭抽出手段と、
    3次元サンプル輪郭点を、カメラ中心と前記2次元輪郭上のサンプル点である2次元サンプル輪郭点を結ぶ線分と、該2次元輪郭頂点を結ぶ線分を通り基準面に垂直な平面の交点として求め、求めた該3次元サンプル輪郭点を線分でつないだ折れ線を輪郭線とし、該輪郭線の線形補間近似により得た曲面を歪んだ紙の3次元曲面モデルとして曲面を推定する曲面推定手段と、
    前記3次元曲面モデルに基づいて前記歪みを補正した画像を出力画像として出力する歪み補正手段と、
    を備え、
    前記曲面推定手段は、前記3次元曲面モデルとして、前記紙の3次元輪郭をモデル化して得られる3次元輪郭モデルに線形Coons補間を施して得られる曲面を用い、
    更に、前記曲面推定手段は、前記3次元輪郭モデルとして、パラメータ付き曲線モデルを用い、
    更に、前記曲面推定手段は、輪郭を座標軸とする曲線座標系において、同一のX座標あるいはY座標を持つ曲線がすべて同じ長さを持つという制約をエネルギー関数を用いて表現し、エネルギー最小となる3次元曲面モデルのパラメータを求める最適化問題を解いて3次元曲面モデルを推定することを特徴とする歪み補正装置。
JP2001262207A 2000-09-04 2001-08-30 歪み補正方式 Expired - Fee Related JP4456304B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001262207A JP4456304B2 (ja) 2000-09-04 2001-08-30 歪み補正方式

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000267511 2000-09-04
JP2000-267511 2000-09-04
JP2001262207A JP4456304B2 (ja) 2000-09-04 2001-08-30 歪み補正方式

Publications (2)

Publication Number Publication Date
JP2002150280A JP2002150280A (ja) 2002-05-24
JP4456304B2 true JP4456304B2 (ja) 2010-04-28

Family

ID=26599198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001262207A Expired - Fee Related JP4456304B2 (ja) 2000-09-04 2001-08-30 歪み補正方式

Country Status (1)

Country Link
JP (1) JP4456304B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004040395A (ja) 2002-07-02 2004-02-05 Fujitsu Ltd 画像歪み補正装置、方法及びプログラム
JP4946376B2 (ja) 2006-11-15 2012-06-06 富士通株式会社 線織線射影抽出プログラム、線織線射影抽出装置および線織線射影抽出方法
CN102439628A (zh) * 2009-04-27 2012-05-02 意法爱立信(法国)有限公司 变换二维图像的几何方法
JP6010870B2 (ja) * 2013-12-24 2016-10-19 カシオ計算機株式会社 画像補正装置、及び画像補正方法、プログラム
WO2016024375A1 (ja) * 2014-08-12 2016-02-18 ソニー株式会社 画像処理装置及び画像処理方法
CN105678684B (zh) 2014-11-18 2020-11-03 中兴通讯股份有限公司 一种截取图像的方法及装置
CN109791687B (zh) * 2018-04-04 2023-01-20 香港应用科技研究院有限公司 在任意曲面上的图像修复
CN112215192B (zh) * 2020-10-22 2024-01-23 常州大学 一种基于机器视觉技术的快速录入试卷成绩的方法
CN112565549A (zh) * 2020-12-25 2021-03-26 深圳太极云软技术有限公司 一种书册图像扫描方法
CN113052777A (zh) * 2021-04-15 2021-06-29 环旭电子股份有限公司 物料盘的校正方法和校正系统
CN113877827B (zh) * 2021-09-14 2023-06-16 深圳玩智商科技有限公司 物流件抓取方法、抓取设备及存储介质

Also Published As

Publication number Publication date
JP2002150280A (ja) 2002-05-24

Similar Documents

Publication Publication Date Title
KR100761641B1 (ko) 왜곡 보정 장치 및 방법
KR101627194B1 (ko) 화상형성장치 및 이미지 모자이크 생성 방법
KR101737338B1 (ko) 주석이 달린 문서 이미지들로부터 클린 문서를 복원하기 위한 시스템 및 방법
JP4047352B2 (ja) 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法
JP4847592B2 (ja) 歪み文書画像を補正する方法及びシステム
US7418126B2 (en) Image distortion correcting method and apparatus, and storage medium
KR101361897B1 (ko) 영상 처리 방법, 영상 처리 장치 및 스캐너
KR100682889B1 (ko) 영상에 기반한 사실감 있는 3차원 얼굴 모델링 방법 및 장치
US8803950B2 (en) Three-dimensional face capturing apparatus and method and computer-readable medium thereof
US7330604B2 (en) Model-based dewarping method and apparatus
JP3883696B2 (ja) 多数の写真をスキャンしかつ検出するとともに人工エッジを除去するための方法
US8311336B2 (en) Compositional analysis method, image apparatus having compositional analysis function, compositional analysis program, and computer-readable recording medium
JP4535584B2 (ja) ディジタル画像処理方法
JP4630777B2 (ja) デジタル文書を変更する方法、装置、コンピュータプログラム及び記憶媒体
JP2012243307A (ja) 入力画像における歪を検出する方法、入力画像における歪を検出する装置およびコンピューター読み取り可能な媒体
JP2001109895A (ja) 複数のディジタル画像の処理方法
JP4456304B2 (ja) 歪み補正方式
JP5541679B2 (ja) 画像処理装置及び方法、並びに、プログラム
US20200274990A1 (en) Extracting a document page image from a electronically scanned image having a non-uniform background content
JP5563390B2 (ja) 画像処理装置およびその制御方法、及びプログラム
JP2022189368A (ja) 物品記録装置及び物品記録方法
Gündüz et al. Feature Extraction from Aerial Photos
JPH04167076A (ja) 二次元画像変形処理装置
JP2010182166A (ja) 画像処理装置および画像処理方法
JP2003303341A (ja) 画像変換装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees