JP2004040395A - 画像歪み補正装置、方法及びプログラム - Google Patents

画像歪み補正装置、方法及びプログラム Download PDF

Info

Publication number
JP2004040395A
JP2004040395A JP2002193707A JP2002193707A JP2004040395A JP 2004040395 A JP2004040395 A JP 2004040395A JP 2002193707 A JP2002193707 A JP 2002193707A JP 2002193707 A JP2002193707 A JP 2002193707A JP 2004040395 A JP2004040395 A JP 2004040395A
Authority
JP
Japan
Prior art keywords
image
paper surface
unit
dimensional
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002193707A
Other languages
English (en)
Inventor
Katsuto Fujimoto
藤本 克仁
Atsuko Obara
小原 敦子
Satoshi Naoi
直井 聡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002193707A priority Critical patent/JP2004040395A/ja
Priority to US10/609,575 priority patent/US7418126B2/en
Priority to CNB031457460A priority patent/CN1270277C/zh
Publication of JP2004040395A publication Critical patent/JP2004040395A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • G06T3/06
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/047Detection, control or error compensation of scanning velocity or position
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/19Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using multi-element arrays
    • H04N1/195Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using multi-element arrays the array comprising a two-dimensional array or a combination of two-dimensional arrays
    • H04N1/19594Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using multi-element arrays the array comprising a two-dimensional array or a combination of two-dimensional arrays using a television camera or a still video camera
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • H04N1/19Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using multi-element arrays
    • H04N1/195Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using multi-element arrays the array comprising a two-dimensional array or a combination of two-dimensional arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0434Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0436Scanning a picture-bearing surface lying face up on a support
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/047Detection, control or error compensation of scanning velocity or position
    • H04N2201/04753Control or error compensation of scanning position or velocity
    • H04N2201/04758Control or error compensation of scanning position or velocity by controlling the position of the scanned image area
    • H04N2201/04787Control or error compensation of scanning position or velocity by controlling the position of the scanned image area by changing or controlling the addresses or values of pixels, e.g. in an array, in a memory, by interpolation

Abstract

【課題】デジタルカメラの撮影位置姿勢が未知であっても、画像した入力画面中の紙面から撮像位置姿勢を推定して歪みが補正された補正画像を出力する。
【解決手段】平坦な紙面の場合は、デジタルカメラ12で撮像した平坦な紙面14の画像を画像入力部15で入力し、カメラ位置姿勢推定部16が画像中の紙面の頂点からデジタルカメラ12の平坦な紙面14に対する相対的なカメラ位置姿勢を推定し、3次元矩形紙面推定部18が撮像位置姿勢に基づいて矩形状紙面の3次元空間中の4頂点を推定し、画像補正部20が撮像位置姿勢と3次元空間中の4頂点位置に基づいて、紙面の透視変換歪みを補正した画像を出力する。本の場合は、3次元曲面モデル推定部50がカメラ位置姿勢と紙面の輪郭情報に基づいて紙面の3次元曲面モデルを推定し、画像補正部52が撮像位置姿勢と紙面の3次元曲面モデルに基づいて本の歪みを補正した画像を出力する。
【選択図】     図1

Description

【0001】
【発明の属する技術分野】
本発明は、デジタルカメラで撮像した書類や本の入力画像中の歪みを補正する画像歪み補正装置、方法及びプログラムに関し、特に、カメラの撮像位置姿勢を推定して入力画像中の歪みを補正する画像歪み補正装置、方法及びプログラムに関する。
【0002】
【従来の技術】
近年、デジタルカメラの高解像度化と低価格化が進展し、急速に普及しており、そこで、デジタルカメラが紙文書情報をコンピュータ入力するために好適な入力部として注目されている。
【0003】
デジタルカメラを紙文書情報のコンピュータ入力に用いると、従来のイメージスキャナなどの接触型画像入力装置と比較して、ユーザーは、紙面の閲覧や記入を行いながら、必要に応じて紙面中の情報のコンピュータ入力を快適に行えるようになる。
【0004】
一方、デジタルカメラにて取得した画像は、スキャナにて取得したスキャナ画像と異なり、画像の3次元歪みが見られる。図18は、平坦な紙面を斜め上からデジタルカメラにて撮像した画像200である。この場合、斜め上から撮像しているため、透視変換に起因した歪みである透視変換歪みが発生している。
【0005】
また図19は、辞典、専門書、ハンドブックなどの厚手の本を斜め上からデジタルカメラにて撮像した画像202である。この場合は、斜め上から撮像しているため、透視変換に起因する透視変換歪みが発生しており、さらに本の紙面自体が元々湾曲した曲面となることに起因する歪みも発生している。この複合的な歪みを以下「本の歪み」と呼ぶこととする。
【0006】
デジタルカメラを用いて紙文書情報のコンピュータ入力を実用化するためには、図18のような透視変換歪みや図19のような本の歪みといった画像歪みを補正して、図20のような歪みのない紙面の画像204を生成する歪み補正技術の開発が重要な課題となる。
【0007】
これに関連する従来技術としては、一点止め文書に発生する一点止め歪みの補正する画像読取り装置が提案されている(特開平10−150532)。この装置は、紙面の3次元歪みを計測するために輪郭線の3次元形状を用いているが、3次元形状を求めるために、CCDアレイを用いたラインセンサの走査で撮影した画像を用いている。
【0008】
また帳票について、上から撮像した一枚の画像に基づいて3次元歪みを補正する方式が提案されている(特開平10−150532)。
【0009】
【発明が解決しようとする課題】
しかしながら、このような従来の文書画像の歪みを補正する特開平10−150532の画像読取り装置にあっては、画像中の紙面の輪郭の3次元形状を推定するために、書類や本を装置の原稿台に載せた状態で、上部に配置したライセンサを主走査方向に電気的に走査しながら主走査方向に直交する副走査方向に機械的に移動して複数位置で紙面のライン画像を撮像して二次元画像を生成しており、専用の装置が必要で実現コストが高過ぎる問題がある。
【0010】
また特開平10−150532の歪み補正方式は、一枚の画像に基づいて補正できる利点を有するが、オーバーヘッドリーダーOHRとしてエリアCCD撮像素子をスタンドに固定して下向きに帳票を撮影しており、カメラ中心が予め決まっていることを前提としている。この点は、特開平10−150532の画像読取り装置も同じである。
【0011】
このため、一般ユーザーがデジタルカメラ等により任意の位置から撮像して得た画像の場合のように、撮影位置姿勢が未知である場合に対応できないという問題があった。
【0012】
本発明は、デジタルカメラの撮影位置姿勢が未知であっても、画像した入力画面中の紙面から撮像位置姿勢を推定して歪みが補正された補正画像を出力する画像歪み補正装置、方法及びプログラムを提供することを目的とする。
【0013】
【課題を解決するための手段】
図1は本発明の原理説明図である。
(紙面の画像歪み補正)
本発明は画像歪み補正装置であって、図1(A)のように、デジタルカメラ12などの撮像部で撮像された平坦な紙面14の画像を入力する画像入力部15と、入力画像中の紙面の4頂点から撮像部の紙面に対する相対位置姿勢を推定する撮像位置姿勢推定部としてのカメラ位置姿勢推定部16と、撮像位置姿勢に基づいて矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定部としての3次元矩形紙面推定部18と、撮像位置姿勢と3次元空間中の4頂点位置に基づいて、入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正部20とを備えたことを特徴とする。
【0014】
このため本発明は、書類などの一枚の紙面をユーザーが情報からデジタルカメラなどの撮像部で撮像した画像一枚のみを用いるだけでよく、画像中の紙面の輪郭を手がかりにして、輪郭4頂点の位置からデジタルカメラの撮像位置姿勢を推定し、紙が矩形状(長方形)であるという制約を活用して紙面の3次元平面モデルを推定し、デジタルカメラの撮像位置姿勢と紙面の3次元平面モデルから画像中の紙面の透視変換歪みを補正する。
【0015】
このように入力画像中の紙面の4頂点からデジタルカメラの撮像位置姿勢を推定している点と、1枚の紙面の歪み画像の4頂点から3次元矩形紙面の4頂点を推定しているのが本発明の大きな特徴であり、撮影位置姿勢が決まっている従来技術と比較して、デジタルカメラの撮像位置姿勢が未知である一般的な場合に対応でき、ユーザーにとって非常使い易い使用環境を提供できる。
【0016】
ここで、デジタルカメラなどの撮像部による入力画像および画像補正部20による出力画像は、白黒2値画像、階調画像もしくはカラー画像である。
【0017】
カメラ位置姿勢推定部15は、入力画像中の紙面4の頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させる。
【0018】
3次元矩形紙面推定部18は、撮像位置姿勢に基づいて、矩形紙面の3次元空間中における4頂点の位置を推定する。
【0019】
画像補正部20は、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする平面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成する。
(本の画像歪み補正)
本発明は画像歪み補正装置であって、図1(B)のように、デジタルカメラ12などの撮像部で撮像された見開きした紙面をもつ本42の画像を入力する画像入力部44と、入力画像中の紙面の4頂点から撮像部の紙面に対する相対位置姿勢を推定する撮像位置姿勢推定部としてのカメラ位置姿勢推定部48と、撮像位置姿勢と入力画像中の紙面の輪郭情報に基づいて、紙面の3次元曲面モデルを推定する曲面推定部としての3次元曲面モデル推定部50と、撮像位置姿勢と紙面の3次元曲面モデルに基づいて本の歪みを補正した画像を出力する画像補正部52とを備えたことを特徴とする。
【0020】
このため本発明は、見開きした本の紙面を斜め上からデジタルカメラなどの撮像部で撮像した画像一枚のみを用いるだけでよく、画像中の紙面の輪郭を手がかりにして、輪郭4頂点の位置からデジタルカメラの撮像位置姿勢を推定し、本かかまぼこ形状をもつという制約を活用して紙面の3次元曲面モデルを推定し、デジタルカメラの撮像位置姿勢と紙面の3次元曲面モデルから画像中の本の歪みを補正する。
【0021】
この場合にも本における紙面の4頂点からデジタルカメラの撮像位置姿勢を推定している点と、1枚の紙面の歪み画像から紙面輪郭の歪みを手がかりに本の3次元曲面モデルを推定しているのが本発明の大きな特徴であり、撮影位置姿勢が決まっている従来技術と比較して、デジタルカメラの撮像位置姿勢が未知である一般的な場合に対応でき、ユーザーにとって非常使い易い使用環境を提供できる。
【0022】
ここで画像入力部44による入力画像および画像補正部52による出力画像は、白黒二値画像、階調画像もしくはカラー画像である。
【0023】
カメラ位置姿勢推定部48は、入力画像中の紙面の4頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させる。
【0024】
3次元曲面モデル推定部50は、撮像位置姿勢と入力画像中の紙面輪郭の歪みに基づいて、3次元空間中で、上面を紙面とするかまぼこ形状を推定する。
【0025】
この画像歪み補正装置は、更に、入力画像中の紙面輪郭を抽出する紙面輪郭抽出部46を備える。紙面輪郭抽出部46は、グラフィックスユーザーインタフェースを用いてユーザーに紙面輪郭のサンプル点を指定させる。また紙面輪郭抽出部46は、グラフィックスユーザーインタフェースを用いてユーザーに入力画像中の紙面の4頂点を指定させ、紙面輪郭情報を画像処理により自動抽出しても良い。更に紙面輪郭抽出部46は、紙面輪郭情報の全てを画像処理により自動抽出するようにしてもよい。
【0026】
紙面輪郭抽出部46は、抽出する紙面輪郭情報として、スプライン曲線、ベジエ曲線を含むパラメータ付き曲線モデルを用いる。紙面輪郭抽出部46は、抽出する紙面輪郭情報として、折れ線モデルを用いる。いずれの場合も紙面の3次元曲面モデルを近似的に用意に求めることができ、3 HYPERLINK mailto:D@ 次元曲面モデルの修正が容易である。
【0027】
3次元曲面モデル推定部50は、紙面の3次元曲面モデルに対し左右及び上下で対となっている3次元輪郭の長さが等しいという制約を所定のエネルギー関数用いて表現し、このエネルギー関数が最小となるパラメータを持つ3次元曲面モデルを推定する。これにより推定された3次元曲面モデルの4頂点が、左右及び上下で対となっている3次元輪郭の長さが等しいという制約から外れた場合の撮像位置姿勢を決めているパラメータの自動調整を可能とし、正確な3曲面モデルが推定されることで、本の歪みの補正が高精度でできる。
【0028】
画像補正部52は、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする曲面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成する。
【0029】
(画像補正方法)
本発明は、書類を対象とした画像歪み補正方法であって、
画像入力部により、撮像部で撮像された平坦な紙面を撮像した画像を入力する画像入力ステップと、
撮像位置姿勢推定部により、入力画像中の紙面の4頂点から撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
矩形紙面推定部により、撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定ステップと、
画像補正部により、撮像位置姿勢と3次元空間中の4頂点位置に基づいて、入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正ステップと、を備えたことを特徴とする。
【0030】
本発明は本を対象とした画像歪み補正方法であって、
画像入力部により、デジタルカメラなどの撮像部で撮像された見開きした紙面をもつ本の画像を入力する撮像ステップと、
撮像位置姿勢推定部により、入力画像中の紙面の4頂点から撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
曲面推定部により、撮像位置姿勢と入力画像中の紙面の輪郭情報に基づいて、紙面の3次元曲面モデルを推定する曲面推定ステップと、
画像補正部により、撮像位置姿勢と紙面の3次元曲面モデルに基づいて本の歪みを補正した画像を出力する画像補正ステップと、
を備えたことを特徴とする。
【0031】
(プログラム)
本発明は、書類を対象とした画像歪み補正のためのプログラムであって、コンピュータに、
撮像部による撮像された平坦な紙面の画像を入力する撮像ステップと、
入力画像中の紙面の4頂点から撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
撮像位置姿勢に基づいて、矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定ステップと、
撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正ステップと、
を実行させることを特徴とする。
【0032】
本発明は、本を対象とした画像歪み補正のためのプログラムであって、コンピュータに、
撮像部で撮像された見開きした紙面をもつ本の画像を入力する撮像ステップと、
入力画像中の紙面の4頂点から撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
撮像位置姿勢と入力画像中の紙面の輪郭情報に基づいて、紙面の3次元曲面モデルを推定する曲面推定ステップと、
撮像位置姿勢と紙面の3次元曲面モデルに基づいて本の歪みを補正した画像を出力する画像補正ステップと、
を実行させることを特徴とする。
【0033】
なお、本発明の画像歪み補正方法及びプログラムの詳細は、画像歪み補正装置の場合と基本的に同じになる。
【0034】
【発明の実施の形態】
図2は、本発明による画像歪み補正装置の実施形態を示したブロック図であり、この実施形態にあっては、平坦な矩形状の紙面をデジタルカメラで撮像し、撮像した画像の持つ透視変換歪みを補正した紙面画像を出力することを特徴とする。
【0035】
図2において、本発明の画像歪み補正装置10は、撮像部となるデジタルカメラ12で撮像した帳票や書類などの平坦な紙面14の矩形状紙面画像を取り込んで、撮影の際に生じた紙面画像における透視変換歪みを補正して出力する。
【0036】
画像歪み補正装置10には、画像入力部15、撮像位置推定部となるカメラ位置姿勢推定部16、矩形紙面推定部となる3次元矩形紙面推定部18、画像補正部20、グラフィックスユーザーインタフェース(以下「GUI」という)22、表示部24及び操作部26が設けられている。
【0037】
図2における本発明の画像歪み補正装置10は、例えば図3のようなコンピュータのハードウェア資源により実現される。
【0038】
図3のコンピュータにおいて、CPU110のバス111にはRAM112、ハードディスクドコントローラ(ソフト)114、フロッピィディスクドライバ(ソフト)120、CD−ROMドライバ(ソフト)124、マウスコントローラ128、キーボードコントローラ132、ディスプレイコントローラ136、通信用ボード140が接続される。
【0039】
ハードディスクコントローラ114はハードディスクドライブ116を接続し、本発明の画像歪み処理を実行するアプリケーションプログラムをローディングしており、コンピュータの起動時にハードディスクドライブ116から必要なプログラムを呼び出して、RAM112上に展開し、CPU110により実行する。
【0040】
フロッピィディスクドライバ120にはフロッピィディスクドライブ(ハード)122が接続され、フロッピィディスク(R)に対する読み書きができる。CD−ROMドライバ124に対しては、CDドライブ(ハード)126が接続され、CDに記憶されたデータやプログラムを読み込むことができる。
【0041】
マウスコントローラ128はマウス130の入力操作をCPU110に伝える。キーボードコントローラ132はキーボード134の入力操作をCPU110に伝える。ディスプレイコントローラ136はディスプレイ138に対して表示を行う。通信用ボード140は無線を含む通信回線142を使用し、インターネット等のネットワークを介して他のコンピュータやサーバとの間で通信を行う。
【0042】
再び図2を参照するに、画像歪み補正装置10の画像入力部15はデジタルカメラ12で撮影された平坦な紙面14の画像を入力する。デジタルカメラ12による入力画像としては、白黒2値画像、階調画像あるいはカラー画像のいずれであっても良い。この点は、画像補正部20により出力する補正済みの紙面画像もデジタルカメラ12からの入力画像に対応して白黒2値画像、階調画像またはカラー画像となる。
【0043】
カメラ位置姿勢推定部16は、画像入力部15で入力した画像中の紙面における4つの頂点の位置情報からデジタルカメラ12の位置姿勢、具体的には紙面14に対するデジタルカメラ12におけるカメラ中心位置(撮像中心位置)の相対的な座標位置を推定する。
【0044】
このカメラ位置姿勢推定部16による画像中の矩形紙面の4頂点は、例えばGUI22により入力画像を表示部24に表示し、この表示画面上でユーザーが操作部26により、紙面画像の4頂点を指定することで行われる。また紙面画像の4頂点の指定は、後の説明で明らかにする紙面画像の輪郭情報の抽出結果を用いても良い。
【0045】
3次元矩形紙面推定部18は、紙面画像の4頂点と推定されたカメラ位置姿勢に基づいて矩形紙面の3次元空間中の4頂点の位置を推定する。
【0046】
更に画像補正部20は、カメラ位置姿勢と推定された3次元空間中の矩形紙面の4頂点の位置に基づいて、透視変換歪みを補正した紙面画像を出力する。
【0047】
図4は、図2の画像歪み補正装置10における処理手順のフローチャートであり、このフローチャートが図3のようなコンピュータのハードウェア資源を利用して図2の画像歪み補正装置10の機能を実現する際のプログラムの処理手順を表している。
【0048】
図4にあっては、まずステップS1で画像入力部15によってデジタルカメラ12で撮影して撮像画像の入力処理を行う。続いてステップS2でカメラ位置姿勢推定部16が入力画像の紙面画像の4頂点に基づいて相対的なカメラ中心座標となる撮像位置姿勢を推定する。
【0049】
続いてステップS3で3次元矩形紙面推定部18が推定されたカメラ位置姿勢と画像紙面の4頂点に基づき3次元空間中の矩形紙面の4頂点を推定する3次元矩形紙面推定処理を行う。最終的にステップS4で画像補正部20が撮像位置姿勢と3次元空間中の4頂点に基づきデジタルカメラ12で撮影した際の、画像紙面における透視変換歪みを補正した画像を出力する透視変換歪み補正処理を行うことになる。
【0050】
次に図2の画像歪み補正装置10におけるカメラ位置姿勢推定部16、3次元矩形紙面推定部18及び画像補正部20による処理の詳細を説明する。
【0051】
図5は、図2の実施形態でカメラ位置姿勢の推定に用いる透視変換歪みの仕組みの説明図である。
【0052】
図5において、矩形状の画像紙面28に対し、その上方にカメラ中心30が位置している。カメラ中心30は座標xを持ち、また画像紙面28は4つの頂点座標X,X,X,Xを持っている。このカメラ中心30と画像紙面28は光軸32で結ばれる。光軸は画像紙面28と直角であり、画像紙面28の中心を通る。
【0053】
ここで3次元座標系をxy平面が画像紙面28と重なり、z軸が光軸32と一致するように設定する。このような3次元座標系において、画像紙面28の大きさと解像度が決まれば、3次元矩形紙面34は頂点x,x,x4,が長方形であるという制約の元に、図示のような位置に存在すると仮想的に考えることができる。
【0054】
ここでカメラ中心30、3次元矩形紙面34の4頂点、画像紙面28の4頂点の座標は次のようになる。
カメラ中心   x=(x,y,z
紙面頂点    x=(x,y,z
画像中の輪郭頂点X=(X,Y,0)
カメラ中心30の高さに対する3次元矩形紙面34の頂点x,x2,,xの高さの内分比率をそれぞれt,t,t,tとする。これらの内分比率t,t,t,tを求めることがカメラ位置姿勢を推定することに対応する。
【0055】
内分の関係により
【0056】
【数1】
Figure 2004040395
【0057】
であることから
【0058】
【数2】
Figure 2004040395
【0059】
が成立する。但しi=1〜4である。また3次元矩形紙面34が長方形であることにより次式が成立する。
【0060】
【数3】
Figure 2004040395
【0061】
この(2)(3)式の条件をとると次の結果が得られる。
【0062】
【数4】
Figure 2004040395
【0063】
ここでk,kは画像紙面28の頂点座標から求められる定数である。またHは紙面の横幅Wは紙面の高さを表す。このため画像紙面28の4つの頂点座標x,x2,,xが与えられると(4)式で算出した定数k,kを用いて(5)式から紙面の縦横比(H/W)を求めることができる。
【0064】
また(6)式から画像紙面28とカメラ中心30との距離zを求めることができる。
【0065】
また定数k,kと内分比率t,t,t,tの間には次の関係が成立する。
【0066】
【数5】
Figure 2004040395
【0067】
ここで内分比率t,t,t,tのうち、最大のものを1とすることにより3次元矩形紙面34の4つの頂点のうちの1つが画像紙面28に設置したユニークな状態となり、これによって内分比率t,t,t,tはそれぞれただひとつに決定できる。
【0068】
例えば(7)式で最大となる内分比率をtとすると、t=1となることで(7)式からΔt=1/kとなり、これによって(7)式における残りの内分比率t,t,tの値が決定する。またカメラ中心30と画像紙面28の距離zによりカメラ中心30の座標x=(x,y,z)が求められる。
【0069】
図2のカメラ位置姿勢推定部16は内分比率t,t,t,tにより、カメラ中心30の座標x=(x,y,z)を(4)〜(6)式から求め、デジタルカメラ12の位置姿勢を推定する。
【0070】
次に図2の3次元矩形紙面推定部18は、図5における内分の関係により
【0071】
【数6】
Figure 2004040395
【0072】
が成立することから、これに(7)式から得られた内分比率t,t,t,tの値と画像紙面28の頂点座標X,X,X,Xを代入にすることで、3次元矩形紙面34の4頂点x,x2,,xの座標を求め、これによって3次元空間中における3次元矩形紙面34の位置を推定する。
【0073】
図2の画像補正部20は、図6のように、歪み補正後の画像紙面36の中の内分比率p,qで決まる点yを歪み補正前の画像紙面28の対応する点Yの位置にある画素の濃度と一致しており、この関係は次式で与えられる。
【0074】
【数7】
Figure 2004040395
【0075】
このため画像補正部20は、(9)(10)式の関係を用いて補正前の画像紙面28から直ちに透視変換歪みを補正した補正後の画像紙面36を得ることができる。
【0076】
ここで通常の透視変換歪みの補正にあっては、図5における補正前の画像紙面28上のY点とカメラ中心30を結ぶ直線の3次元矩形平面34における交点が対応する補正後の画像紙面36の点yであることから、3次元空間中の3次元矩形紙面34への変換を得て2次元的な画像紙面36への濃度変換を行うものであるが、本発明にあっては(9)(10)式の関係が得られることで、補正前の2次元の画像紙面28から直接補正後の2次元画像紙面36への透視変換歪みの補正を行うことができる。
【0077】
図7は、本発明による画像歪み補正装置の他の実施形態を示したブロック図である。この実施形態にあっては、辞書、専門書、ハンドブックなどの厚手の本の見開き紙面をデジタルカメラで撮像し、この撮像画面中の紙面における本の歪みを補正して出力するようにしたことを特徴とする。
【0078】
図7において、画像歪み補正装置40には、デジタルカメラ12で撮像された本42の画像が入力される。画像歪み補正装置40は、画像入力部44、紙面輪郭抽出部46、カメラ位置姿勢推定部48、3次元曲面モデル推定部50、画像補正部52、GUI54、表示部56及び操作部58を備えている。この図7の画像歪み補正装置40の機能も、図2の実施形態と同様、図3に示したコンピュータのハードウェア資源により実現することができる。
【0079】
画像入力部44は、デジタルカメラ12で撮像した本42の画像を入力する。入力画像は白黒2値画像、階調画像、カラー画像のいずれであってもよい。紙面輪郭抽出部46は、画像入力部44で入力したデジタルカメラ12で撮像した本42のかまぼこ状の紙面形状を対象に、紙面輪郭情報の抽出を行う。この紙面輪郭の抽出は、全て自動的に行うようにしてもよいし、GUI54による表示部56上の表示画像に対する操作部58によるユーザ指定を一部利用してもよい。
【0080】
カメラ位置姿勢推定部48は、抽出された紙面輪郭情報から得られた紙面画像の4頂点に基づき、相対的なデジタルカメラ12のカメラ中心の座標をカメラ位置姿勢として推定する。このカメラ位置姿勢推定部48による処理は、基本的に図2の実施形態におけるカメラ位置姿勢推定部16と同じになる。
【0081】
3次元曲面モデル推定部50は、撮影対象とする本42がかまぼこ状の紙面形状を持つという制約の下に、カメラ位置姿勢及び画像紙面の輪郭情報から3次元空間中の形状、即ちかまぼこ状紙面形状を3次元曲面モデルとして推定する。
【0082】
画像補正部52は、推定されたカメラ位置姿勢と推定されたかまぼこ状紙面形状となる3次元曲面モデルに基づいて画像補正を行い、本の歪みを補正した画像を出力する。この画像補正部52から出力される補正済みの画像も、画像入力部44で入力したデジタルカメラ12からの画像に対応して、白黒2値画像、階調画像またはカラー画像のいずれかとなる。
【0083】
図8は、図7の画像歪み補正装置40における処理手順を示したフローチャートであり、このフローチャートは図7の画像歪み補正処理を行うプログラムの処理手順を表わしている。
【0084】
図8において、画像歪み補正処理は、まずステップS1で画像入力部44がデジタルカメラ12で撮像した本42の画像を入力する。続いてステップS2で、紙面輪郭抽出部46により入力画像中のかまぼこ状紙面形状を対象に輪郭抽出を行う。続いてステップS3で、カメラ位置姿勢推定部48が抽出された紙面の輪郭情報から4頂点を取り出し、この4頂点に基づいて3次元空間におけるデジタルカメラ12の相対的な撮像位置姿勢を推定する。
【0085】
続いてステップS4で、3次元曲面モデル推定部50が抽出されたかまぼこ状紙面形状の輪郭線情報と推定されたデジタルカメラ12の撮像位置姿勢に基づいて、3次元空間における本のかまぼこ状紙面形状を3次元曲面モデルとして推定する。最終的にステップS5で、画像補正部52がカメラ位置姿勢とかまぼこ状紙面形状の3次元曲面モデルに基づき、本の歪みを補正した画像を出力する補正処理を行う。
【0086】
次に、図7の画像歪み補正装置40におけるカメラ位置姿勢推定部48、3次元曲面モデル推定部50及び画像補正部52による処理の詳細を説明する。なお紙面輪郭抽出部46については、その詳細は後の説明で明らかにする。
【0087】
図9は、図7の実施形態でカメラ位置姿勢の推定に用いる透視変換歪みの仕組みの説明図である。図7のカメラ位置姿勢推定部48は、紙面輪郭抽出部46で得られた輪郭情報の中の画像紙面の頂点座標を用いて、デジタルカメラの位置姿勢を推定する。
【0088】
図9において、座標xを持つカメラ中心62と画像紙面60の中の紙面輪郭の4つの頂点X,X,X,Xの面は、光軸64で結ばれる。光軸64は画像紙面60と垂直であり、画像紙面60の中心を通る。
【0089】
ここで、3次元座標系をxy平面が画像紙面60と重なり、z軸が光軸64と一致するように設定する。この3次元空間の中にかまぼこ形状の紙面の4つの頂点を通る面x,x,x,xが存在し、この面が長方形であるというごく自然な前提を置くことにする。
【0090】
ここで、かまぼこ形状を持つ紙面の4頂点で構成される3次元空間中の長方形の大きさと解像度が決まれば、図9のように頂点面x,x,x,xを持つ長方形の平面である3次元平面モデル66が図示の位置に存在すると仮想的に考えることができる。
【0091】
ここで、カメラ中心62、3次元平面モデル66の頂点、及び画像紙面60の輪郭頂点の座標は次のようになる。
カメラ中心   x=(x,y,z
紙面頂点    x=(x,y,z
画像中の輪郭頂点X=(X,Y,0)
いまカメラ中心62の高さに対する3次元平面モデル66の頂点x,x,x,xの高さの比率をそれぞれ内分比率t,t,t,tとする。これらのt,t,t,tを求めることが、カメラの位置姿勢を推定することに対応する。
【0092】
ここで、内分の関係により
【0093】
【数8】
Figure 2004040395
【0094】
であることから、
【0095】
【数9】
Figure 2004040395
【0096】
また、3次元平面モデル66が長方形であることにより次式が成立する。
【0097】
【数10】
Figure 2004040395
【0098】
この(12)(13)式の条件を解くと、次の結果が得られる。
【0099】
【数11】
Figure 2004040395
【0100】
ここで、k,kは画像紙面60の頂点座標から求められる定数である。また、Hは紙面の横幅、Wは紙面の高さを表わす。このように画像紙面60の4つの頂点の2次元座標が与えられると、(14)式で求めた定数k,kを用いて、(15)式から3次元平面モデル66の長方形の縦横比(H/W)を求めることができる。
【0101】
また(16)式から、カメラ中心62と画像紙面60との距離zも求めることができる。また定数k,kと内分比率t,t,t,tの間には次の関係が成立する。
【0102】
【数12】
Figure 2004040395
【0103】
ここで内分比率t,t,t,tのうち最大のものを1とすることにより、3次元紙面の頂点のうち1つが画像紙面60に設置したユニークな状態となり、これによって(17)式のΔtが求まることで、内分比率t,t,t,tをそれぞれただ1つに決定できる。更に、カメラ中心62と画像紙面60との距離zによりカメラ中心62の座標x=(x,y,z)が求まる。
【0104】
図7のカメラ位置姿勢推定部48は(14)〜(16)式の関係により、内分比率t,t,t,t及びカメラ中心62の座標を求め、これをデジタルカメラ12の位置姿勢として推定する。
【0105】
図7の3次元曲面モデル推定部50は、推定されたカメラ位置姿勢と画像紙面中の紙面輪郭情報を用いて、かまぼこ状に歪んだ紙面形状を3次元曲面モデルとして推定する。
【0106】
図10は、図7の3次元曲面モデル推定部50で処理する本の歪みを持つ紙面の3次元曲面モデルの説明図である。
【0107】
図10において、2次元的な画像紙面68の輪郭線情報は、2次元上輪郭線70、2次元下輪郭線72、更に左輪郭線80及び右輪郭線82となる。なお左輪郭線80及び右輪郭線82は、画像紙面68においても推定する3次元曲面モデル74においても、一致して同一となる。
【0108】
この画像紙面68における2次元上輪郭線70及び2次元下輪郭線72の紙面輪郭情報は、それぞれ2次元サンプル輪郭点集合
=(X ,Y ) (i=1,…,N)
=(X ,Y ) (j=1,…,M)
により表現されているものとする。
【0109】
このような画像紙面68における紙面輪郭情報を手がかりとして、本の歪みを持つかまぼこ形状の3次元曲面モデル74における3次元上輪郭線76と3次元下輪郭線78のそれぞれにおける3次元サンプル輪郭点
=(x ,y ) (i=1,…,N)
=(x ,y ) (j=1,…,M)
を求めることにより、本のかまぼこ状の紙面形状となる3次元曲面モデル74を推定する。
【0110】
図10にあっては、2次元サンプル上輪郭点X 、2次元サンプル下輪郭点X I のそれぞれと、カメラ中心62を結ぶ線分上に3次元サンプル上輪郭点x 、及び3次元サンプル下輪郭点x が存在する場合を示している。
【0111】
ここで3次元サンプル上輪郭点x i の高さのカメラ中心62の高さに対する内分比率をs、3次元サンプル下輪郭点x の高さのカメラ中心62の高さに対する内分比率をtとする。但し、i=1〜Nである。
【0112】
これら2N個のパラメータを、紙面が上下の輪郭線のサンプル点を結んだ線の集合で構成される線折り面であり且つ輪郭頂点を結んだ形状が長方形であるとする条件を満たすことを用いて求めることで、3次元曲面モデル74の形状を推定する。
【0113】
まず内分の公式により次式が成立する。
【0114】
【数13】
Figure 2004040395
【0115】
ここで本の歪み曲面がかまぼこ形状を持っていることから、3次元空間中の紙面の4つの頂点を通る面x,x,x,xと、3次元サンプル上輪郭点x i と上輪郭線頂点x1及びx2を含む面は垂直になるという条件は、自然なものである。そこで、この前提条件を導入して式で表わすと次のようになる。
【0116】
【数14】
Figure 2004040395
【0117】
この(19)式から内分比率sは次式となる。
【0118】
【数15】
Figure 2004040395
【0119】
(14)式から求めた内分比率sにより、(18)式より3次元サンプル上輪郭点x i と下輪郭線頂点x,xを含む面は垂直になるという条件は自然なものである。そこで、この前提条件を導入して式で表わすと次式となる。
【0120】
【数16】
Figure 2004040395
【0121】
この(21)式から内分比率tは次式となる。
【0122】
【数17】
Figure 2004040395
【0123】
この(22)式から求めた内分比率tにより、(18)式から3次元サンプル下輪郭点x の座標値が具体的に定まる。
【0124】
このように図7の3次元曲面モデル推定部50は、図10のように、3次元サンプル輪郭点をつないだ折れ線を3次元上輪郭線76及び3次元下輪郭線78とし、これらの輪郭線の線形補間近似により得た曲面を、推定した紙面の3次元曲面モデル74とする。
【0125】
続いて図7の画像補正部52を説明する。画像補正部52は、補正後の画像紙面の各画素に対応した入力画像中の位置を、3次元輪郭線を座標軸とする曲面座標系を用いて求め、入力画像中の対応画素の値、即ち白黒2値、階調値、カラー値を補正後の紙面画像の対象画素値として設定することにより、上下輪郭線の長さを横幅W、左右輪郭線の長さを高さHとする補正後の画像を得る。
【0126】
また、かまぼこ形状となる本の歪みを含む紙面の場合、図10に示したように左輪郭線80と右輪郭線82は、紙面の輪郭頂点x,x及びx,xのそれぞれを結ぶ線分として得られる。また3次元上輪郭線76と3次元下輪郭線78は、3次元曲面モデル74の推定により得られた3次元サンプル輪郭点を結ぶ折れ線として得られる。
【0127】
ここで、3次元曲面座標系の原点を左上輪郭頂点x、X軸を3次元上輪郭線76、Y軸を左輪郭線80とする。また補正後の画像の横幅Hは、3次元上輪郭線76と3次元下輪郭線78の長さの平均値を用いる。同様に、補正後の画像の高さWは左輪郭線80と右輪郭線82の長さの平均値を用いる。
【0128】
更に3次元上輪郭線76上のX座標の目盛り付けをするために、0以上で幅W以下の整数値をとる座標Xの値に対し、3次元上輪郭線76上の点U(X)を対応付け、3次元座標を求める。
【0129】
この点U(X)の3次元座標を求めるためには、3次元上輪郭線76を表わす3次元サンプル輪郭点をつないだ折れ線上を左上輪郭頂点x、即ち原点から辿ることによって行う。
【0130】
同様にして、0以上、幅W以下の整数値をとる座標値Xに対し、3次元下輪郭線78上の点D(X)を対応付け、3次元座標を求める。点D(X)の3次元座標を求めるためには、3次元下輪郭線78を表わす3次元サンプル輪郭点をつないだ折れ線を左下輪郭頂点xから辿ることによって行う。この点U(X)とD(X)により曲線座標系を表現していると考えることができる。
【0131】
そこで、本の歪み補正後の画像の2次元座標(X,Y)に対応した画素の濃度をG(X,Y)とすると、
【0132】
【数18】
Figure 2004040395
【0133】
である。
【0134】
補正後の2次元座標(X,Y)に対応する点は、3次元曲面モデル74上の曲線座標系による2次元座標(X,Y)を持つ点Pである。このPの3次元座標を
【0135】
【数19】
Figure 2004040395
【0136】
とする。そして3次元上輪郭線76上の点U(X)と3次元下輪郭線78上の点D(X)を線形補間した点として、次式により点Pの3次元座標を求めることにする。
【0137】
【数20】
Figure 2004040395
【0138】
次に、カメラ中心62から3次元曲面モデル74上の点Pを通る直線とxy基準面との
【0139】
【数21】
Figure 2004040395
【0140】
が成立する。
【0141】
したがって、補正後の画像中の濃度G(X,Y)は次式で求められる。
【0142】
【数22】
Figure 2004040395
【0143】
次に図7の実施形態における紙面輪郭抽出部46の詳細を説明する。紙面輪郭抽出部46は、カメラ位置姿勢推定部48及び3次元曲面モデル推定部50の処理に必要な入力画像中の本のかまぼこ状紙面形状の輪郭線情報を抽出する。
【0144】
図11は、図7の実施形態における紙面輪郭抽出部46の処理手順のフローチャートであり、これは図8のフローチャートにおけるステップS2の紙面輪郭抽出処理の詳細な処理手順を表わしている。
【0145】
図11において、紙面輪郭抽出処理は、ステップS1で本の画像を対象にエッジ抽出を行い、続いてステップS2でエッジ画像から空間周波数に基づいて文字列領域を除去する。続いてステップS3で、文字列領域を除去したエッジ画像について小さな黒画素連結成分の除去によるノイズ除去を行う。
【0146】
続いてステップS4で、ノイズ除去の済んだエッジ画像について、輪郭部分におけるノイズやかすれを含む紙面輪郭画像の抽出を行う。更にステップS5で、左右輪郭線を直線化して抽出する左右輪郭線線分抽出を行う。最終的にステップS6で、輪郭の欠けを保管する上下輪郭線抽出を、例えば折れ線、スプライン曲線、ベジェ曲線などに基づいて行う。
この図11における紙面輪郭抽出処理の詳細を説明すると次のようになる。いま図12のような本の歪みを持つデジタルカメラで撮像された画像84が入力されたとする。この画像84について、図11のステップS1でソーベルのエッジフィルタなどのエッジ抽出用フィルタを使用して本の紙面の輪郭を含むエッジ画像を取得すると、図13のようなエッジ画像85が得られる。
【0147】
このエッジ画像85について、図11のステップS3で空間周波数による文字列領域削除を行う。このエッジ画像中の文字列領域の削除は、文字列領域を空間周波数の高い領域として検出して除去する。
【0148】
この空間周波数を反映する量として、例えば対象画素を中心とした一定幅(一定ドット数)の線上領域について、画素間隔を1〜Sドットの画素同士の濃度差の絶対値の平均を求め、更に1〜Sドットごとの平均値の平均をとった量を使用する。
【0149】
図14の画像86は、図13のエッジ画像85について、一定幅=65ドット、S=8ドットとして得た空間周波数を反映した濃度差画像を2値化して、2値化後の黒画素を10ドット太らせた後、エッジ画像を白画素に変化させて、空間周波数の高い領域を示している。このような空間周波数の高い領域の画像86を図13のエッジ画像85から除去することで、図14の文字列領域を除去したエッジ画像88が得られる。
【0150】
続いて図11のステップS4の処理により、図14の文字列領域を除去したエッジ画像88を対象に、エッジ画像中の小さい黒画素連結成分を除去することによりノイズ除去を行い、紙面中の黒画素をほとんど消すことにより、図15のエッジ画像90を得ることができる。
【0151】
続いて図11のステップS4の処理により、ノイズやかすれを含む紙面輪郭画像を抽出する。即ち、図15の紙面中の黒画素成分をほとんど除去したエッジ画像90に対し、紙面の中心92の一点を支点92とした半直線94を回転させ、半直線94が最初に交わる黒画素を抽出することにより、図16に示す若干のノイズやかすれが存在するが、ほとんど全ての画素が紙面の輪郭画素となった紙面輪郭画像96を抽出する。この紙面輪郭画像96は、2次元上輪郭線70、2次元下輪郭線72、左輪郭線80及び右輪郭線82を持っている。
【0152】
次に図11のステップS5によるハフ変換による左右輪郭線分抽出を行う。即ち、図16のノイズやかすれを含む紙面輪郭画像96に対し、図17のように直線成分のハフ変換によって左輪郭線80及び右輪郭線82を含む2本の直線成分102,104を求める。この直線成分102,104のハフ変換に伴い、紙面輪郭における4つの頂点X,X,X,Xを求める。
【0153】
更に図11のステップS6で輪郭の欠けを補間する上下輪郭点の抽出処理を行う。即ち図17のような紙面輪郭画像100における2次元上輪郭線70と2次元下輪郭線72に対し、例えば10〜50ドット内の所定のドット間隔で2次元サンプル上輪郭点と2次元下輪郭点
=(X ,Y ) (i=1,…,N)
=(X ,Y ) (j=1,…,M)
を抽出し、これを図10に示したような3次元曲面モデル74の推定と、それに基づく本の歪み補正のための輪郭線情報としている。
【0154】
また図11の紙面輪郭抽出処理にあっては、図12のような本の画像84について、ユーザが図7のGUI54の機能を利用して、かまぼこ形状を持つ3次元曲面モデルのサンプル点をポインティングデバイスやマウスカーソルなどにより指定し、これを輪郭線情報としてもよい。
【0155】
また図12の画像84において、紙面の4つの頂点についてユーザが指定し、これに基づいて図11における紙面輪郭抽出処理の自動処理を行うようにしてもよい。
【0156】
また図7の実施形態における3次元曲面モデル推定部50による推定処理としては、3次元曲面モデルを求める手法として3次元サンプル輪郭点を取ってサンプル点を結ぶ折れ線近似を行っているが、これ以外にスプライン曲線やベジェ曲線などのパラメータ付き曲線モデルを用いても良い。
【0157】
更に図7の実施形態にあっては、紙面輪郭抽出処理により得られた例えば図17のような紙面輪郭画像100において、4つの頂点X,X,X,X=x,x,x,xが3次元曲面モデルとして想定したかまぼこ形状から大きくずれる場合がある。
【0158】
このような場合には、かまぼこ形状を持つ紙面の3次元曲面モデルに対し左右及び上下で対となっている3次元輪郭の長さが等しいという制約を所定のエネルギー関数Eを用いて表現し、このエネルギー関数Eが最小となるパラメータ例えば内分比率の定数k,kを持つ3次元曲面モデルを修正的に推定する処理を行えばよい。
【0159】
このためのエネルギー関数Eとしては、例えば図10の3次元曲面モデル74における3次元上輪郭線76と3次元下輪郭線78の長さの差の二乗と、左輪郭線80と右輪郭線82の長さの差の二乗の線形和として定義する。このエネルギー関数Eは内分比による定数k,kにより一義に決まる。
【0160】
したがって、このエネルギ関数Eを最小にするモデルパラメータであるk,kを最急降下法により求める。即ち、モデルパラメータとなる定数k,kの初期値を適当に設定し、急速下降法によりモデルパラメータとなる定数k,kを繰り返し変化させて、エネルギー関数Eを最小とするk,kを求める。
【0161】
もし3次元曲面モデル74における4つの頂点情報x,x,x,xが想定した本のかまぼこ形状の3次元曲面モデル74からずれていたような場合には、頂点x,x,x,xを通る面が予定した3次元座標のxy平面にはなっておらず、このため推定したカメラ中心62そのものに大きな誤差があり、このような誤差のあるカメラ中心62と推定された3次元曲面モデル74を用いると本の歪みが正しく補正されなくなるが、所定のエネルギー関数を最小とする定数k,kを自動的に求めておくことで、想定した本のかまぼこ形状の3次元曲面モデル74が正確に推定されて正しい本の歪み補正が実現できる。
【0162】
また本発明は上記の実施形態に限定されず、その目的と利点を損なうことのない適宜の変形を含む。更に本発明は上記の実施形態に示した数値による限定は受けない。
【0163】
(付記)
(付記1)
撮像部で撮像された平坦な矩形状紙面の画像を入力する画像入力部と、
前記入力画像中の矩形状紙面の4頂点から前記撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定部と、
前記撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定部と、
前記撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、前記入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正部と、
を備えたことを特徴とする画像歪み補正装置。(1)
【0164】
(付記2)
付記1記載の画像歪み補正装置に於いて、前記撮像部による入力画像および前記画像補正部による出力画像は、白黒二値画像、階調画像もしくはカラー画像であることを特徴とする画像歪み補正装置。
【0165】
(付記3)
付記1記載の画像歪み補正装置に於いて、前記撮像位置姿勢推定部は、入力画像中の紙面の4頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させることを特徴とする画像歪み補正装置。
【0166】
(付記4)
付記1記載の画像歪み補正装置に於いて、前記歪み補正部は、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする平面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とする画像歪み補正装置。(2)
【0167】
(付記5)
撮像部により撮像された見開きした紙面をもつ本の画像を入力する画像入力部と、
前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対な撮像位置姿勢を推定する撮像位置姿勢推定部と、
前記撮像位置姿勢と前記入力画像中の紙面の輪郭情報に基づいて、前記紙面の3次元曲面モデルを推定する曲面推定部と、
前記撮像位置姿勢と前記紙面の3次元曲面モデルに基づいて前記本の歪みを補正した画像を出力する画像補正部と、
を備えたことを特徴とする画像歪み補正装置。(3)
【0168】
(付記6)
付記5記載の画像歪み補正装置に於いて、前記撮像手段による入力画像および前記画像補正部による出力画像は、白黒二値画像、階調画像もしくはカラー画像であることを特徴とする画像歪み補正装置。
【0169】
(付記7)
付記5記載の画像歪み補正装置に於いて、前記撮像位置姿勢推定部は、入力画像中の紙面4の頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させることを特徴とする画像歪み補正装置。
【0170】
(付記8)
付記5記載の画像歪み補正装置に於いて、前記曲面推定部は、前記撮像位置姿勢と入力画像中の紙面輪郭の歪みに基づいて、3次元空間中で、上面を紙面とするかまぼこ形状を推定することを特徴とする画像歪み補正装置。(4)
【0171】
(付記9)
付記5記載の画像歪み補正装置に於いて、更に、入力画像中の紙面輪郭を抽出する紙面輪郭抽出部を備えたことを特徴とする画像歪み補正装置。(5)
【0172】
(付記10)
付記9記載の画像歪み補正装置に於いて、前記紙面輪郭抽出部は、グラフィックスユーザーインタフェースを用いてユーザーに紙面輪郭のサンプル点を指定させることを特徴とする画像歪み補正装置。
【0173】
(付記11)
付記9記載の画像歪み補正装置に於いて、前記紙面輪郭抽出部は、グラフィックスユーザーインタフェースを用いてユーザーに入力画像中の紙面の4頂点を指定させ、紙面輪郭情報を画像処理により自動抽出することを特徴とする画像歪み補正装置。
【0174】
(付記12)
付記9記載の画像歪み補正装置に於いて、前記紙面輪郭抽出部は、紙面輪郭情報の全てを画像処理により自動抽出することを特徴とする画像歪み補正装置。
【0175】
(付記13))
付記9記載の画像歪み補正装置に於いて、前記紙面輪郭抽出部は、抽出する紙面輪郭情報として、スプライン曲線、ベジエ曲線を含むパラメータ付き曲線モデルを用いることを特徴とする画像歪み補正装置。
【0176】
(付記14)
付記9記載の画像歪み補正装置に於いて、前記紙面輪郭抽出部は、抽出する紙面輪郭情報として、折れ線モデルを用いることを特徴とする画像歪み補正装置。
【0177】
(付記15)
付記5記載の画像歪み補正装置に於いて、前記曲面推定部は、前記紙面の3次元曲面モデルに対し前記左右及び上下で対となっている3次元輪郭の長さが等しいという制約を所定のエネルギー関数を用いて表現し、前記エネルギー関数が最小となるパラメータを持つ3次元曲面モデルを推定することを特徴とする画像歪み補正装置。(6)
【0178】
(付記16)
付記5記載の画像歪み補正装置に於いて、前記画像補正部は、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする曲面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とするの画像歪み補正装置。(7)
【0179】
(付記17)
画像入力部により、撮像部で撮像された平坦な紙面を撮像した画像を入力する画像入力ステップと、
撮像位置姿勢推定部により、前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
矩形紙面推定部により、前記撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定ステップと、
画像補正部により、前記撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、前記入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正ステップと、
を備えたことを特徴とする画像歪み補正方法。(8)
【0180】
(付記18)
付記17記載の画像歪み補正方法に於いて、前記撮像ステップの入力画像および前記画像補正ステップの出力画像が、白黒二値画像、階調画像もしくはカラー画像であることを特徴とする画像歪み補正方法。
【0181】
(付記19)
付記17記載の画像歪み補正方法に於いて、前記撮像位置姿勢推定ステップは、入力画像中の紙面4頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させることを特徴とする画像歪み補正方法。
【0182】
(付記20)
付記17記載の画像歪み補正方法に於いて、前記画像補正ステップは、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする平面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とする画像歪み補正方法。
【0183】
(付記21)
画像入力部により、撮像部で撮像された見開きした紙面をもつ本の画像を入力する画像入力ステップと、
撮像位置姿勢推定部により、前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対的なさ撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
曲面推定部により、前記撮像位置姿勢と前記入力画像中の紙面の輪郭情報に基づいて、前記紙面の3次元曲面モデルを推定する曲面推定ステップと、
画像補正部により、前記撮像位置姿勢と前記紙面の3次元曲面モデルに基づいて前記本の歪みを補正した画像を出力する画像補正ステップと、
を備えたことを特徴とする画像歪み補正方法。(9)
【0184】
(付記22)
付記21記載の画像歪み補正方法に於いて、前記撮像ステップの入力画像および前記画像補正ステップの出力画像が、白黒二値画像、階調画像もしくはカラー画像であることを特徴とする画像歪み補正方法。
【0185】
(付記23))
付記21記載の画像歪み補正方法に於いて、前記撮像位置姿勢推定ステップは、入力画像中の紙面の4頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させることを特徴とする画像歪み補正方法。
【0186】
(付記24)
付記21記載の画像歪み補正方法に於いて、前記曲面推定ステップは、前記撮像位置姿勢と入力画像中の紙面輪郭の歪みに基づいて、3次元空間中で、上面を紙面とするかまぼこ形状を推定することを特徴とする画像歪み補正方法。
【0187】
(付記25)
付記21記載の画像歪み補正方法に於いて、更に、入力画像中の紙面輪郭を抽出する紙面輪郭抽出ステップを備えたことを特徴とする画像歪み補正方法。
【0188】
(付記26)
付記25記載の画像歪み補正方法に於いて、前記紙面輪郭抽出ステップは、グラフィックスユーザーインタフェースを用いてユーザーに紙面輪郭のサンプル点を指定させることを特徴とする画像歪み補正方法。
【0189】
(付記27)
付記25記載の画像歪み補正方法に於いて、前記紙面輪郭抽出ステップは、グラフィックスユーザーインタフェースを用いてユーザーに入力画像中の紙面の4頂点を指定させ、紙面輪郭情報を画像処理により自動抽出することを特徴とする画像歪み補正方法。
【0190】
(付記28)
付記25記載の画像歪み補正方法に於いて、前記紙面輪郭抽出ステップは、紙面輪郭情報の全てを画像処理により自動抽出することを特徴とする画像歪み補正方法。
【0191】
(付記29)
付記25記載の画像歪み補正方法に於いて、前記紙面輪郭抽出ステップは、抽出する紙面輪郭情報として、スプライン曲線、ベジエ曲線を含むパラメータ付き曲線モデルを用いることを特徴とする画像歪み補正方法。
【0192】
(付記30)
付記24記載の画像歪み補正方法に於いて、前記紙面輪郭抽出ステップは、抽出する紙面輪郭情報として、折れ線モデルを用いることを特徴とする画像歪み補正方法。
【0193】
(付記31)
付記21記載の画像歪み補正方法に於いて、前記曲面推定ステップは、前記紙面の3次元曲面モデルに対し前記左右及び上下で対となっている3次元輪郭の長さが等しいという制約を所定のエネルギー関数を用いて表現し、前記エネルギー関数が最小となるパラメータを持つ3次元曲面モデルを推定することを特徴とする画像歪み補正方法。
【0194】
(付記32)
付記21記載の画像歪み補正方法に於いて、前記歪み補正ステップは、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする曲面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とする画像歪み補正方法。
【0195】
(付記33)
コンピュータに、
撮像部により撮像された平坦な紙面をの画像を入力する画像入力ステップと、
前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
前記撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定ステップと、
前記撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、前記入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正ステップと、
を実行させることを特徴とするプログラム。(10)
【0196】
(付記34)
付記33記載のプログラムに於いて、前記撮像ステップの入力画像および前記画像補正ステップの出力画像は、白黒二値画像、階調画像もしくはカラー画像であることを特徴とするプログラム。
【0197】
(付記35)
付記33記載のプログラムに於いて、前記撮像位置姿勢推定ステップは、入力画像中の紙面の4頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させることを特徴とするのプログラム。
【0198】
(付記36)
付記33記載のプログラムに於いて、前記歪み補正ステップは、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする平面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とするプログラム。
【0199】
(付記37)
コンピュータに、
撮像部で撮像された見開きした紙面をもつ本の画像を入力する画像入力ステップと、
前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
前記撮像位置姿勢と前記入力画像中の紙面の輪郭情報に基づいて、前記紙面の3次元曲面モデルを推定する曲面推定ステップと、
前記撮像位置姿勢と前記紙面の3次元曲面モデルに基づいて前記本の歪みを補正した画像を出力する画像補正ステップと、
を実行させることを特徴とするプログラム。(11)
【0200】
(付記38)
付記37記載のプログラムに於いて、前記画像入力ステップの入力画像および前記画像補正部の出力画像は、白黒二値画像、階調画像もしくはカラー画像であることを特徴とするプログラム。
【0201】
(付記39)
付記37記載のプログラムに於いて、前記撮像位置姿勢推定ステップは、入力画像中の紙面4頂点をグラフィックスユーザーインタフェースを用いてユーザーに指定させることを特徴とするプログラム。
【0202】
(付記40)
付記37記載のプログラムに於いて、前記曲面推定ステップは、前記撮像位置姿勢と入力画像中の紙面輪郭の歪みに基づいて、3次元空間中で、上面を紙面とするかまぼこ形状を推定することを特徴とするプログラム。
【0203】
(付記41)
付記37記載のプログラムに於いて、更に、入力画像中の紙面輪郭を抽出する紙面輪郭抽出ステップを備えたことを特徴とするプログラム。
【0204】
(付記42)
付記41記載のプログラムに於いて、前記紙面輪郭抽出ステップは、グラフィックスユーザーインタフェースを用いてユーザーに紙面輪郭のサンプル点を指定させることを特徴とするプログラム。
【0205】
(付記43)
付記41記載のプログラムに於いて、前記紙面輪郭抽出ステップは、グラフィックスユーザーインタフェースを用いてユーザーに入力画像中の紙面の4頂点を指定させ、紙面輪郭情報を画像処理により自動抽出することを特徴とするプログラム。
【0206】
(付記44)
付記41記載のプログラムに於いて、前記紙面輪郭抽出ステップは、紙面輪郭情報の全てを画像処理により自動抽出することを特徴とするプログラム。
【0207】
(付記45)
付記41記載のプログラムに於いて、前記紙面輪郭抽出ステップは、抽出する紙面輪郭情報として、スプライン曲線、ベジエ曲線を含むパラメータ付き曲線モデルを用いることを特徴とするプログラム。
【0208】
(付記46)
付記41記載のプログラムに於いて、前記紙面輪郭抽出ステップは、抽出する紙面輪郭情報として、折れ線モデルを用いることを特徴とするプログラム。
【0209】
(付記47)
付記37記載のプログラムに於いて、前記曲面推定ステップは、前記紙面の3次元曲面モデルに対し前記左右及び上下で対となっている3次元輪郭の長さが等しいという制約を所定のエネルギー関数を用いて表現し、前記エネルギー関数が最小となるパラメータを持つ3次元曲面モデルを推定することを特徴とするプログラム。
【0210】
(付記48)
付記37記載のプログラムに於いて、前記画像補正ステップは、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする曲面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とするプログラム。
【0211】
【発明の効果】
以上説明してきたように本発明によれば、書類、伝票などの平坦な矩形紙面、あるいは厚みのあるかまぼこ形状となる本について、ユーザーがデジタルカメラを使用して上方から撮像した画像を入力し、この入力画像における矩形紙面の透視変換歪みあるいは本の紙面画像の透視変換歪みと曲面歪みを含む本の歪みにつき、カメラの位置姿勢が未知であっても、1枚の画像からカメラの位置姿勢を推定することによって画像1枚のみから透視変換あるいは本の歪みを補正した画像を出力することができ、カメラによる撮影位置が制限されないことから、ユーザーにとって非常に使い易い使用環境を提供することができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】一枚の書面の撮像画像を対象とした本発明の画像歪み補正装置の実施形態のブロック図
【図3】図2の実施形態が適用されるコンピュータのハードウェア資源の説明図
【図4】図2の実施形態における画像歪み処理のフローチャート
【図5】図2の実施形態でカメラ位置姿勢の推定に用いる透視変換歪みの仕組みの説明図
【図6】図2の実施形態における画像中の紙面と補正後紙面との間の画素の対応関係の説明図
【図7】本の撮像画像を対象とした本発明の画像歪み補正装置の実施形態のブロック図
【図8】図7の実施形態における画像歪み処理のフローチャート
【図9】図7の実施形態でカメラ位置姿勢の推定に用いる透視変換歪みの仕組みの説明図
【図10】図7の実施形態における本の歪みを持つ紙面の3次元曲面モデルの説明図
【図11】図8の紙面輪郭抽出処理のフローチャート
【図12】紙面輪郭抽出処理の対象とする本の入力画像の説明図
【図13】図12から変換されたエッジ画像の説明図
【図14】空間周波数の高い利用域の2値画像と文字領域を除去したエッジ画像の説明図
【図15】図14のエッジ画像について紙面中の黒画素連結成分を除去した画像の説明図
【図16】図15の画像に対し半直線の回転処理で得たノイズやかすれを含む紙面輪郭画像の説明図
【図17】図16の直線成分をハフ変換により求めた輪郭線抽出結果の説明図
【図18】平坦な紙面を斜め上から撮像した透視変換歪みを持った画像の説明図
【図19】厚手の本和斜め上から撮影した本の歪みを持った画像の説明図
【図20】歪みのない画像の説明図
【符号の説明】
10,40:画像歪み補正装置
12:デジタルカメラ
14:平坦な紙面
15,44:画像入力部
16,48:カメラ位置姿勢推定部
18:3次元矩形紙面推定部
20,52:画像補正部
22,54:グラフィックスユーザーインタフェース(GUI)
24,56:表示部
26,58:操作部
28,60,68:画像紙面
30,62:カメラ中心
32,64:光軸
34:3次元矩形紙面
36:補正後の画像紙面
42:本
46:紙面輪郭抽出部
50:3次元曲面モデル推定部
66:三次元平面モデル
70:2次元上輪郭線
72:2次元下輪郭線
74:3次元曲面モデル
76:3次元上輪郭線
78:3次元下輪郭線
80:左輪郭線
82:右輪郭線
85,88,90:エッジ画像
92:回転中心
94:半直線
96,100:紙面輪郭画像
102,104:直線成分

Claims (11)

  1. 撮像部で撮像された平坦な矩形状紙面の画像を入力する画像入力部と、
    前記入力画像中の矩形状紙面の4頂点から前記撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定部と、
    前記撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定部と、
    前記撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、前記入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正部と、
    を備えたことを特徴とする画像歪み補正装置。
  2. 請求項1記載の画像歪み補正装置に於いて、前記画像補正部は、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする平面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とするの画像歪み補正装置。
  3. 撮像部により撮像された見開きした紙面をもつ本の画像を入力する画像入力部と、
    前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対な撮像位置姿勢を推定する撮像位置姿勢推定部と、
    前記撮像位置姿勢と前記入力画像中の紙面の輪郭情報に基づいて、前記紙面の3次元曲面モデルを推定する曲面推定部と、
    前記撮像位置姿勢と前記紙面の3次元曲面モデルに基づいて前記本の歪みを補正した画像を出力する画像補正部と、
    を備えたことを特徴とする画像歪み補正装置。
  4. 請求項3記載の画像歪み補正装置に於いて、前記曲面推定部は、前記撮像位置姿勢と入力画像中の紙面輪郭の歪みに基づいて、3次元空間中で、上面を紙面とするかまぼこ形状を推定することを特徴とする画像歪み補正装置。
  5. 請求項3記載の画像歪み補正装置に於いて、更に、入力画像中の紙面輪郭を抽出する紙面輪郭抽出部を備えたことを特徴とする画像歪み補正装置。
  6. 請求項3記載の画像歪み補正装置に於いて、前記曲面推定部は、前記紙面の3次元曲面モデルに対し前記左右及び上下で対となっている3次元輪郭の長さが等しいという制約を所定のエネルギー関数を用いて表現し、前記エネルギー関数が最小となるパラメータを持つ3次元曲面モデルを推定することを特徴とする画像歪み補正装置。
  7. 請求項3記載の画像歪み補正装置に於いて、前記歪み補正部は、補正後画像の各画素に対応した入力画像中の位置を、輪郭を座標軸とする曲面座標系を用いて求め、入力画像中の対応画素の値を補正後画像の対象画素値として設定することにより、上下輪郭の長さを幅、左右輪郭の長さを高さとする補正画像を生成することを特徴とするの画像歪み補正装置。
  8. 画像入力部により、撮像部で撮像された平坦な紙面を撮像した画像を入力する画像入力ステップと、
    撮像位置姿勢推定部により、前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対的な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
    矩形紙面推定部により、前記撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定ステップと、
    画像補正部により、前記撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、前記入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正ステップと、
    を備えたことを特徴とする画像歪み補正方法。
  9. 画像入力部により、撮像部で撮像された見開きした紙面をもつ本の画像を入力する画像入力ステップと、
    撮像位置姿勢推定部により、前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対的なさ撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
    曲面推定部により、前記撮像位置姿勢と前記入力画像中の紙面の輪郭情報に基づいて、前記紙面の3次元曲面モデルを推定する曲面推定ステップと、
    画像補正部により、前記撮像位置姿勢と前記紙面の3次元曲面モデルに基づいて前記本の歪みを補正した画像を出力する画像補正ステップと、
    を備えたことを特徴とする画像歪み補正方法。
  10. コンピュータに、
    撮像部により撮像された平坦な紙面をの画像を入力する画像入力ステップと、
    前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
    前記撮像位置姿勢に基づいて、前記矩形状紙面の3次元空間中の4頂点を推定する矩形紙面推定ステップと、
    前記撮像位置姿勢と前記3次元空間中の4頂点位置に基づいて、前記入力画像中の紙面の透視変換歪みを補正した画像を出力する画像補正ステップと、
    を実行させることを特徴とするプログラム。
  11. コンピュータに、
    撮像部で撮像された見開きした紙面をもつ本の画像を入力する画像入力ステップと、
    前記入力画像中の紙面の4頂点から前記撮像部の紙面に対する相対な撮像位置姿勢を推定する撮像位置姿勢推定ステップと、
    前記撮像位置姿勢と前記入力画像中の紙面の輪郭情報に基づいて、前記紙面の3次元曲面モデルを推定する曲面推定ステップと、
    、前記撮像位置姿勢と前記紙面の3次元曲面モデルに基づいて前記本の歪みを補正した画像を出力する画像補正ステップと、
    を実行させることを特徴とするプログラム。
JP2002193707A 2002-07-02 2002-07-02 画像歪み補正装置、方法及びプログラム Withdrawn JP2004040395A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2002193707A JP2004040395A (ja) 2002-07-02 2002-07-02 画像歪み補正装置、方法及びプログラム
US10/609,575 US7418126B2 (en) 2002-07-02 2003-07-01 Image distortion correcting method and apparatus, and storage medium
CNB031457460A CN1270277C (zh) 2002-07-02 2003-07-02 图像失真校正方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002193707A JP2004040395A (ja) 2002-07-02 2002-07-02 画像歪み補正装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2004040395A true JP2004040395A (ja) 2004-02-05

Family

ID=30437065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002193707A Withdrawn JP2004040395A (ja) 2002-07-02 2002-07-02 画像歪み補正装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US7418126B2 (ja)
JP (1) JP2004040395A (ja)
CN (1) CN1270277C (ja)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006062325A1 (en) * 2004-12-06 2006-06-15 Electronics And Telecommunications Research Institute Apparatus for correcting image distortion of stereo-camera and method thereof
CN100369471C (zh) * 2004-03-29 2008-02-13 精工爱普生株式会社 图像处理系统、投影机及图像处理方法
US7419268B2 (en) 2003-07-02 2008-09-02 Seiko Epson Corporation Image processing system, projector, and image processing method
JP2010117211A (ja) * 2008-11-12 2010-05-27 East Japan Railway Co レーザレーダ用設置位置検証装置、レーザレーダ用設置位置の検証方法及びレーザレーダ用設置位置検証装置用プログラム
WO2011052276A1 (ja) 2009-10-28 2011-05-05 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP2013110578A (ja) * 2011-11-21 2013-06-06 Pfu Ltd 画像処理装置、画像処理方法、および画像処理プログラム
US8705852B2 (en) 2011-01-27 2014-04-22 Samsung Electronics Co., Ltd. Image processing apparatus and method for defining distortion function for synthesized image of intermediate view
JP2014192901A (ja) * 2013-03-26 2014-10-06 Sharp Corp 画像処理システムおよび画像処理方法
JP2015119431A (ja) * 2013-12-20 2015-06-25 カシオ計算機株式会社 頁画像補正装置、頁画像補正方法及びプログラム
JP2015122614A (ja) * 2013-12-24 2015-07-02 カシオ計算機株式会社 画像補正装置、及び画像補正方法、プログラム
JP2016059001A (ja) * 2014-09-12 2016-04-21 カシオ計算機株式会社 頁画像補正装置、頁画像補正方法及びプログラム
CN105678684A (zh) * 2014-11-18 2016-06-15 中兴通讯股份有限公司 一种截取图像的方法及装置
JP2017219837A (ja) * 2016-06-07 2017-12-14 三星ディスプレイ株式會社Samsung Display Co.,Ltd. 透明表示装置及びその駆動方法
KR102240403B1 (ko) * 2019-12-24 2021-04-14 아주대학교 산학협력단 이미지 평활화 방법 및 이미지 평활화 장치

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005267457A (ja) * 2004-03-19 2005-09-29 Casio Comput Co Ltd 画像処理装置、撮影装置、画像処理方法及びプログラム
FR2868185B1 (fr) * 2004-03-23 2006-06-30 Realeyes3D Sa Procede d'extraction de donnees brutes d'une image resultant d'une prise de vue
FR2868184B1 (fr) * 2004-03-23 2006-06-02 Realeyes3D Sa Procede pour la presentation d'une image selon un angle de vue souhaite, a partir d'une image prise sous incidence quelconque
US7593595B2 (en) * 2004-08-26 2009-09-22 Compulink Management Center, Inc. Photographic document imaging system
US7660458B1 (en) * 2004-12-14 2010-02-09 Google Inc. Three-dimensional model construction using unstructured pattern
US20060210192A1 (en) * 2005-03-17 2006-09-21 Symagery Microsystems Inc. Automatic perspective distortion detection and correction for document imaging
EP1947605B1 (en) 2005-02-25 2019-03-06 Psion Systems Inc. Automatic perspective distortion detection and correction for document imaging
FR2889321B1 (fr) * 2005-07-26 2008-02-01 Sagem Comm Procede de correction automatique de photographies numeriques
JP2007104339A (ja) * 2005-10-04 2007-04-19 Murata Mach Ltd 画像形成装置
US7330604B2 (en) * 2006-03-02 2008-02-12 Compulink Management Center, Inc. Model-based dewarping method and apparatus
US8213687B2 (en) * 2006-04-28 2012-07-03 Hewlett-Packard Development Company, L.P. Image processing methods, image processing systems, and articles of manufacture
WO2008137051A1 (en) * 2007-05-01 2008-11-13 Compulink Management Center, Inc. Photo-document segmentation method and system
CN101520852B (zh) * 2008-02-29 2011-09-07 富士通株式会社 消失点检测装置和检测方法
JP4975679B2 (ja) * 2008-04-18 2012-07-11 株式会社Pfu ノート型情報処理装置、および、射影変換パラメータ算出方法
CN102084378B (zh) * 2008-05-06 2014-08-27 计算机连接管理中心公司 基于照相机的文档成像
US20100013859A1 (en) * 2008-07-15 2010-01-21 Simpatext, Llc Enhanced Human Readability of Text Presented on Displays
US9147174B2 (en) * 2008-08-08 2015-09-29 Snap-On Incorporated Image-based inventory control system using advanced image recognition
US8322384B2 (en) * 2010-03-05 2012-12-04 Whirlpool Corporation Select-fill dispensing system
CN102567981A (zh) * 2010-12-21 2012-07-11 鸿富锦精密工业(深圳)有限公司 影像拍摄偏差修正系统及方法
JP4918167B1 (ja) * 2011-03-31 2012-04-18 パナソニック株式会社 画像処理装置およびこれを備えた原稿読取システム
US8457403B2 (en) 2011-05-19 2013-06-04 Seiko Epson Corporation Method of detecting and correcting digital images of books in the book spine area
CN102831578B (zh) 2011-06-15 2014-12-17 富士通株式会社 图像处理方法和图像处理设备
US10289924B2 (en) 2011-10-17 2019-05-14 Sharp Laboratories Of America, Inc. System and method for scanned document correction
US8774556B2 (en) 2011-11-30 2014-07-08 Microsoft Corporation Perspective correction using a reflection
US8531740B1 (en) 2012-02-23 2013-09-10 Tomasz Wardega Universal scanning stand for devices equipped with a digital camera
EP2864959A2 (en) 2012-06-22 2015-04-29 Steelcase Inc. Document unbending and recoloring systems and methods
US9071785B2 (en) 2013-02-15 2015-06-30 Gradeable, Inc. Adjusting perspective distortion of an image
ITTO20130683A1 (it) 2013-08-08 2015-02-09 Sisvel Technology Srl Apparato e metodo per la correzione delle deformazioni prospettiche delle immagini
JP6434209B2 (ja) * 2013-12-20 2018-12-05 株式会社リコー 画像生成装置、画像生成方法、およびプログラム
US9524445B2 (en) 2015-02-27 2016-12-20 Sharp Laboratories Of America, Inc. Methods and systems for suppressing non-document-boundary contours in an image
CN104867113B (zh) * 2015-03-31 2017-11-17 酷派软件技术(深圳)有限公司 图像透视畸变校正的方法及系统
US9684984B2 (en) * 2015-07-08 2017-06-20 Sage Software, Inc. Nearsighted camera object detection
US9785850B2 (en) 2015-07-08 2017-10-10 Sage Software, Inc. Real time object measurement
CN105894467A (zh) * 2016-03-30 2016-08-24 联想(北京)有限公司 一种图像校正方法及系统
EP3467765A4 (en) * 2016-05-23 2020-02-26 Sony Corporation ELECTRONIC DEVICE, ELECTRONIC DEVICE CONTROL METHOD, AND PROGRAM
US10037459B2 (en) 2016-08-19 2018-07-31 Sage Software, Inc. Real-time font edge focus measurement for optical character recognition (OCR)
CN107333028B (zh) * 2017-06-30 2020-08-25 上海兆芯集成电路有限公司 图像获取方法及其装置
CN107155017B (zh) * 2017-06-30 2021-01-22 上海兆芯集成电路有限公司 图像获取方法及其装置
US10430019B2 (en) * 2017-11-08 2019-10-01 Disney Enterprises, Inc. Cylindrical interface for augmented reality / virtual reality devices
US10949702B2 (en) 2019-04-16 2021-03-16 Cognizant Technology Solutions India Pvt. Ltd. System and a method for semantic level image retrieval
CN110505398B (zh) * 2019-07-16 2021-03-02 北京三快在线科技有限公司 一种图像处理方法、装置、电子设备及存储介质
CN110658215B (zh) * 2019-09-30 2022-04-22 武汉纺织大学 一种基于机器视觉的pcb板自动拼接检测方法与装置
US11030488B1 (en) 2020-12-31 2021-06-08 VoyagerX, Inc. Book scanning using machine-trained model
US10991081B1 (en) 2020-12-31 2021-04-27 VoyagerX, Inc. Book scanning using machine-trained model
CN115760620B (zh) * 2022-11-18 2023-10-20 荣耀终端有限公司 一种文档矫正方法、装置及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3631333B2 (ja) * 1996-08-23 2005-03-23 シャープ株式会社 画像処理装置
JPH10150532A (ja) 1996-11-18 1998-06-02 Minolta Co Ltd 画像読取り装置
US5946645A (en) * 1997-04-09 1999-08-31 National Research Council Of Canada Three dimensional imaging method and device
JP3425366B2 (ja) * 1998-06-30 2003-07-14 シャープ株式会社 画像補正装置
US6970592B2 (en) 2000-09-04 2005-11-29 Fujitsu Limited Apparatus and method for correcting distortion of input image
JP4456304B2 (ja) 2000-09-04 2010-04-28 富士通株式会社 歪み補正方式
US6975352B2 (en) * 2000-12-18 2005-12-13 Xerox Corporation Apparatus and method for capturing a composite digital image with regions of varied focus and magnification

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7695143B2 (en) 2000-03-18 2010-04-13 Seiko Epson Corporation Image processing system, projector, computer-readable medium, and image processing method
US7419268B2 (en) 2003-07-02 2008-09-02 Seiko Epson Corporation Image processing system, projector, and image processing method
CN100369471C (zh) * 2004-03-29 2008-02-13 精工爱普生株式会社 图像处理系统、投影机及图像处理方法
US7537350B2 (en) 2004-03-29 2009-05-26 Seiko Epson Corporation Image processing system, projector, program, information storage medium, and image processing method
WO2006062325A1 (en) * 2004-12-06 2006-06-15 Electronics And Telecommunications Research Institute Apparatus for correcting image distortion of stereo-camera and method thereof
JP2010117211A (ja) * 2008-11-12 2010-05-27 East Japan Railway Co レーザレーダ用設置位置検証装置、レーザレーダ用設置位置の検証方法及びレーザレーダ用設置位置検証装置用プログラム
US8731321B2 (en) 2009-10-28 2014-05-20 Sharp Kabushiki Kaisha Image processing device, image processing method, image processing program, and recording medium with recorded image processing program
WO2011052276A1 (ja) 2009-10-28 2011-05-05 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
US8705852B2 (en) 2011-01-27 2014-04-22 Samsung Electronics Co., Ltd. Image processing apparatus and method for defining distortion function for synthesized image of intermediate view
US9659226B2 (en) 2011-11-21 2017-05-23 Pfu Limited Image processing apparatus, image processing method, and computer-readable recording medium storing image processing program
JP2013110578A (ja) * 2011-11-21 2013-06-06 Pfu Ltd 画像処理装置、画像処理方法、および画像処理プログラム
JP2014192901A (ja) * 2013-03-26 2014-10-06 Sharp Corp 画像処理システムおよび画像処理方法
JP2015119431A (ja) * 2013-12-20 2015-06-25 カシオ計算機株式会社 頁画像補正装置、頁画像補正方法及びプログラム
JP2015122614A (ja) * 2013-12-24 2015-07-02 カシオ計算機株式会社 画像補正装置、及び画像補正方法、プログラム
JP2016059001A (ja) * 2014-09-12 2016-04-21 カシオ計算機株式会社 頁画像補正装置、頁画像補正方法及びプログラム
CN105678684A (zh) * 2014-11-18 2016-06-15 中兴通讯股份有限公司 一种截取图像的方法及装置
JP2018504662A (ja) * 2014-11-18 2018-02-15 ゼットティーイー コーポレイション 画像キャプチャ方法、装置及び記憶媒体
US10419742B2 (en) 2014-11-18 2019-09-17 Xi'an Zhongxing New Software Co. Ltd. Method and device for capturing image and storage medium
JP2017219837A (ja) * 2016-06-07 2017-12-14 三星ディスプレイ株式會社Samsung Display Co.,Ltd. 透明表示装置及びその駆動方法
KR102240403B1 (ko) * 2019-12-24 2021-04-14 아주대학교 산학협력단 이미지 평활화 방법 및 이미지 평활화 장치

Also Published As

Publication number Publication date
CN1270277C (zh) 2006-08-16
US7418126B2 (en) 2008-08-26
CN1471055A (zh) 2004-01-28
US20040022451A1 (en) 2004-02-05

Similar Documents

Publication Publication Date Title
JP2004040395A (ja) 画像歪み補正装置、方法及びプログラム
US6535650B1 (en) Creating high resolution images
JP5153593B2 (ja) 画像処理装置および画像処理方法
KR101399709B1 (ko) 모델-기반 디워핑 방법 및 장치
JP4363151B2 (ja) 撮影装置、その画像処理方法及びプログラム
JP2014131257A (ja) 画像補正システム、画像補正方法及びプログラム
JP4010754B2 (ja) 画像処理装置と画像処理方法及びコンピュータ読み取り可能な記録媒体
JP5387193B2 (ja) 画像処理システム、画像処理装置およびプログラム
US20050196070A1 (en) Image combine apparatus and image combining method
CN102484724A (zh) 投影图像区域检测装置
JP6755787B2 (ja) 画像処理装置、画像処理方法およびプログラム
WO2012029658A1 (ja) 撮像装置、画像処理装置、画像処理方法及び画像処理プログラム
JP5541679B2 (ja) 画像処理装置及び方法、並びに、プログラム
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP2005332177A (ja) 3次元情報処理装置、3次元情報処理方法、及び3次元情報処理プログラム
JP4456304B2 (ja) 歪み補正方式
JPH05161002A (ja) 原稿読み取り装置
JP2002204342A (ja) 画像入力装置および記録媒体、並びに画像合成方法
JPH1115951A (ja) ずれ検出装置および画像合成装置
JP5563390B2 (ja) 画像処理装置およびその制御方法、及びプログラム
JPH11144050A (ja) 画像歪補正方法及び装置
CN107516339B (zh) 一种信息处理方法及信息处理装置
JP4484037B2 (ja) 画像処理装置、画像処理システム、撮像装置および画像処理方法
JP2022189368A (ja) 物品記録装置及び物品記録方法
JP2018032947A (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050906