JP2008077489A - 画像処理装置、方法、プログラムおよび記憶媒体 - Google Patents

画像処理装置、方法、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP2008077489A
JP2008077489A JP2006257345A JP2006257345A JP2008077489A JP 2008077489 A JP2008077489 A JP 2008077489A JP 2006257345 A JP2006257345 A JP 2006257345A JP 2006257345 A JP2006257345 A JP 2006257345A JP 2008077489 A JP2008077489 A JP 2008077489A
Authority
JP
Japan
Prior art keywords
information
partial images
image processing
projection
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006257345A
Other languages
English (en)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006257345A priority Critical patent/JP2008077489A/ja
Publication of JP2008077489A publication Critical patent/JP2008077489A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】 デジカメ等で撮影された、斜めから見た文書画像を自動補正する。
【解決手段】 斜めから見た文書画像から複数の部分画像を決定する手段、複数の部分画像から行射影を取得する手段、取得した射影情報から行高さを決定し、行高さの変化から歪みを補正するための情報を取り出す手段、取り出された補正情報を用いて、文書画像を補正する手段を有する。
【選択図】 図2

Description

本発明は撮影された画像の歪み補正に係わる画像処理装置方法、プログラムおよび記憶媒体に関する。
これまで、イメージスキャナ等から読み取った文書画像を文字認識する場合、行方向の射影を用いて行切り出しを行う際、文書に傾きがあると行の切り出し精度が低下するため、傾き量を自動的に求め、補正することで精度向上を行うようにしている。
一方、近年、デジタルカメラ等の普及が目覚しく、撮像素子の解像度も向上したため、文字認識に使用することも可能になってきた。デジタルカメラ等で撮影された画像は、イメージスキャナで読み取った場合と異なり三次元の歪み、すなわち遠近の歪みが発生する。
特開2002−334327では、文書画像内の小さな画素の塊を取り出し、隣接した画素塊をまとめていくことで細長い画素の塊とし、取り出されたいくつかの細長い塊を文字行束としてから遠近歪みを補正するように構成されている。
また、特開2001−134751では、同一の被写体に視差をつけて撮影し、その違いから斜め撮影による歪みを補正するように構成されている。
また、特開2002−57879では、撮影された画像に対し、補正のための二組の線分を外挿し、これらの線分の交点を算出して得られた変換式により歪みを補正するように構成されている。
特開2002−334327号公報 特開2001−134751号公報 特開2002−57879号公報
しかしながら上記第一の従来例では、大きい文字や文字間隔が大きいと文字行を抽出できず、また画素塊をまとめていく過程で多くのメモリと計算量が必要となる欠点があった。
上記第二の従来例では、複数の画像を撮影する必要がある欠点があった。
上記第三の従来例では、画像の補正にオペレータの操作が必要であり、また、外挿した線分により補正精度が落ちる欠点があった。
本発明は上記の課題を解決するためになされたもので、撮影された文書画像から文字行の高さの変化を用いて、歪みを補正するための情報を自動的に取り出すこと目的とする。
かかる課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、斜めから見た文書画像から複数の部分画像を決定する手段、複数の部分画像から行射影を取得する手段、取得した射影情報から行高さを決定し、行高さの変化から歪みを補正するための情報を取り出す手段、取り出された補正情報を用いて、文書画像を補正する手段を有し、遠近歪みがある文書画像から自動的に補正情報を抽出し、遠近歪みのある画像を補正する。
本発明の請求項1〜5記載の実施形態により、撮影された文書画像の歪みを自動的に補正することが可能となり、文字認識等の精度向上が可能である。
[第1の実施形態]
図1は本発明を実施するための画像処理装置の構成を示すブロック図である。101はROM102に格納されている制御プログラムに従って本装置全体の制御を行うCPU、102はCPU101が実行する後述するフローチャートに示す処理等本装置の制御プログラム等を格納するROM、103は文書画像等を記憶するRAM、104は磁気ディスク等の外部記憶装置であり、105はディスプレイ、106はキーボード、107はマウス等のポインティングデバイスである。108はデジタルカメラ等を接続できる周辺機器インターフェイスである。
本発明は汎用的なコンピュータでも実施可能であり、その場合、媒体等で提供される制御プログラムを外部記憶装置104に記憶し、オペレータの指示等によりCPU101で実行するように構成されてもよい。また、109はネットワークインターフェースであり、図示しない遠隔地に存在する装置と通信し、プログラムやデータなどを読み込んだり、書き込んだりする。
また、ディスプレイ105などがインターフェイスを介して接続された構成でもよい。
画像は周辺機器インターフェイス108、あるいは外部記憶装置104に保存されているあらかじめ読み取られたもの、あるいは、他の画像入力装置からネットワークインターフェース109を介して受信されたものなどである。
図1に示す構成の画像処理装置が実行する、遠近歪み補正のための情報抽出処理を図2のフローチャートを用いて説明する。
S201で、S202以降の処理が所定回数行われたかの判断を行う。所定回数以下ならS202に進む。
S202では文書画像の中から検知位置を決定する。これは事前に決めた方法で決定すればよく、ランダムに決めてもあるいは等間隔としてもよい。
S203で、決定された検知位置での行方向を決定する。例えば画素塊を抽出し、それぞれの画素塊の間隔を求め、左右方向の画素塊同士が近ければ行方向は水平方向とし、上下方向の画素塊同士が近ければ垂直方向とする。
S204で、検知位置付近に後述する処理を行うための検知窓を設定する。検知窓の大きさは事前に決定しておく。
S205で検知窓に含まれる画素を行方向に射影し、行射影を取り出す。射影の大きさから文字サイズを推定することが可能なので、検知窓の大きさを推定された文字サイズで変更してもよい。最初に設定された検知窓に対し行方向に隣接した検知窓を設定する。新たな検知窓からも行射影を取り出し、元の行射影との連続性を確認する。行射影の連続性を確認しながら両方の検知窓を行方向にずらし、できる限り両検知窓を離して配置する。
S206では、2つの検知窓から抽出された行射影の位置と行高さを記憶する。
図3は、検知窓とそこから抽出される行射影の様子を示したものである。撮影された文書画像301に対し、検知窓302、303を取る。検知窓に文字行が含まれると行射影304が抽出される。
すべての検知位置で処理が終了したら、記憶した行射影の位置と高さから、S207で1組の検知窓の、同一行と判断された行高さと位置の変化から、遠近歪みの消失点となる位置を決定する。行は遠方になるほど高さが小さくなっていくため、同一行の2つ以上行射影上部の座標から、行射影上部の座標位置を示す一次式が求まる。同様に行射影下部の座標から同様に一次式が求まる。両一次式の交差する点が消失点となる。同一行の射影上部の座標が3点以上あれば、最小自乗法などにより一次式が求まる。1組の検知窓に複数の行射影が存在し、しかも複数の検知窓の組みを用いているので、平均値などを使用して消失点の位置の精度を向上することができる。
S208では、行と垂直方向の消失点を決定する。同一検知窓内の行であっても、遠方の行の高さが小さくなることを利用して、同一検知窓内の行高さの変化から、行と垂直方向の消失点までの距離を求めることができる。これは、行高さと位置の示す一次式を求め、行高さが0となる位置を求めればよい。S207で、既に行方向の消失点が求まっているため、3次元上に原稿が存在する面が特定できている。行と垂直方向の消失点までの距離により、原稿が存在する行方向の消失点からの距離が決定され、既に求められている行の傾きから水平方向からのずれ量が決定される。その結果、行に垂直方向の消失点も決定される。
このようにS207、S208で得られた情報から、撮影された画像の遠近の歪みを補正する。補正方法については従来例で使用されている公知技術を用いることで可能である。
例えば、被写体におけるあおり歪みを補正するための変換を行う。射影変換行列をBとすると
Figure 2008077489
射影変換式は
Figure 2008077489
射影変換行列Bは以下のように求まる。
焦点距離fとしたとき、消失点1および消失点2を
Figure 2008077489
なるベクトルで表すと、被写体面の向きはベクトルv1、ベクトルv2の両方に直交し、
Figure 2008077489
なる単位ベクトルnで表すことができる。
あおり歪みの補正はベクトルnを法線ベクトルとする平面にすることである。光軸をベクトルnに一致させる座標変換を示す回転行列Rは
Figure 2008077489
が成り立つ。回転行列Rを
Figure 2008077489
と定義する。これは、最初にy軸周りに角度β回転し、回転により得られた新たな座標系のx軸周りに角度α回転する。
ベクトルnを
Figure 2008077489
以上により、回転角は以下のように導かれる。
Figure 2008077489
この回転角より回転行列Rを一意に定めることができる。この回転行列Rを用いて画像面上の任意の点(x,y,f)を被投影面上の点(x’,y’,z’)に変換するには、
Figure 2008077489
ただし、kは補正画像の大きさを示す係数であり、sは変換後のベクトルz’をkにするための定数である。
これらにより、射影変換行列を、
Figure 2008077489
とすればよい。
以上説明したように、本実施形態により、その一部の画像情報を用いることで少ないメモリと計算量で遠近の歪みがある文書画像の補正情報を取得できる効果がある。
なお、上記実施例では、本発明を実施するための最低限の構成要件で説明を行っているが、例えば汎用コンピュータに、本発明を実施する処理を行うプログラム等のデータを外部から提供し、あるいは、あらかじめ外部記憶107に記憶しておき、RAM103に格納するように構成されていてもよい。また、あらかじめ外部記憶107に記憶した入力画像を処理するように構成されていてもよい。
図4は本発明に係る画像処理装置で読みだし可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
本発明の実施形態に係る画像処理装置のブロック図である。 実施形態1に係る遠近歪み画像を自動的に補正する処理を説明するフローチャートである。 実施形態1に係る検知窓とそこから抽出される行射影を説明する図である。 本発明に係る画像処理装置で読みだし可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
符号の説明
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 キーボード
107 ポインティングデバイス
108 スキャナ部
109 ネットワークインターフェース

Claims (12)

  1. 斜めから見た文書画像から複数の部分画像を決定する手段、複数の部分画像から行射影を取得する手段、取得した射影情報から行高さを決定し、行高さの変化から歪みを補正するための情報を取り出す手段、取り出された補正情報を用いて、文書画像を補正する手段を有することを特徴とする画像処理装置。
  2. 複数の部分画像は、行射影取得手段で得られた射影の連続性を検査しながら決定することを特徴とする請求項1に記載の画像処理装置。
  3. 複数の部分画像を決定する手段で得られた部分画像の組を、複数組用いて歪みを補正するための情報を決定することを特徴とする請求項1に記載の画像処理装置。
  4. 複数の部分画像にまたがる同一行の行射影の高さの変化から、歪みを補正するための情報を決定することを特徴とする請求項1に記載の画像処理装置。
  5. 部分画像内にある複数の行射影の高さの変化から、歪みを補正するための情報を決定することを特徴とする請求項1に記載の画像処理装置。
  6. 斜めから見た文書画像から複数の部分画像を決定する工程、複数の部分画像から行射影を取得する工程、取得した射影情報から行高さを決定し、行高さの変化から歪みを補正するための情報を取り出す工程、取り出された補正情報を用いて、文書画像を補正する工程を有することを特徴とする画像処理方法。
  7. 複数の部分画像は、行射影取得工程で得られた射影の連続性を検査しながら決定することを特徴とする請求項6に記載の画像処理方法。
  8. 複数の部分画像を決定する工程で得られた部分画像の組を、複数組用いて歪みを補正するための情報を決定することを特徴とする請求項6に記載の画像処理方法。
  9. 複数の部分画像にまたがる同一行の行射影の高さの変化から、歪みを補正するための情報を決定することを特徴とする請求項6に記載の画像処理方法。
  10. 部分画像内にある複数の行射影の高さの変化から、歪みを補正するための情報を決定することを特徴とする請求項6に記載の画像処理方法。
  11. 請求項6〜10のいずれかに記載の画像処理方法をコンピュータによって実現させるためのコンピュータ実行可能プログラム。
  12. 請求項6〜10のいずれかに記載の画像処理方法をコンピュータによって実現させるためのコンピュータ読取可能なプログラムを格納する記憶媒体。
JP2006257345A 2006-09-22 2006-09-22 画像処理装置、方法、プログラムおよび記憶媒体 Withdrawn JP2008077489A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006257345A JP2008077489A (ja) 2006-09-22 2006-09-22 画像処理装置、方法、プログラムおよび記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006257345A JP2008077489A (ja) 2006-09-22 2006-09-22 画像処理装置、方法、プログラムおよび記憶媒体

Publications (1)

Publication Number Publication Date
JP2008077489A true JP2008077489A (ja) 2008-04-03

Family

ID=39349461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006257345A Withdrawn JP2008077489A (ja) 2006-09-22 2006-09-22 画像処理装置、方法、プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP2008077489A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257713A (ja) * 2007-03-16 2008-10-23 Fujitsu Ltd 透視変換歪み発生文書画像補正装置および方法
JP2010171976A (ja) * 2009-01-22 2010-08-05 Canon Inc 歪み文書画像を補正する方法及びシステム
US9460586B2 (en) 2010-04-27 2016-10-04 Aristocrat Technologies Australia Pty Limited Method of gaming, a gaming system and a game controller

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008257713A (ja) * 2007-03-16 2008-10-23 Fujitsu Ltd 透視変換歪み発生文書画像補正装置および方法
JP2010171976A (ja) * 2009-01-22 2010-08-05 Canon Inc 歪み文書画像を補正する方法及びシステム
US9460586B2 (en) 2010-04-27 2016-10-04 Aristocrat Technologies Australia Pty Limited Method of gaming, a gaming system and a game controller
US10453302B2 (en) 2010-04-27 2019-10-22 Aristocrat Technologies Australia Pty Limited Systems and methods of electronic gaming
US10902700B2 (en) 2010-04-27 2021-01-26 Aristocrat Technologies Australia Pty Limited Systems and methods of electronic gaming

Similar Documents

Publication Publication Date Title
WO2021115071A1 (zh) 单目内窥镜图像的三维重建方法、装置及终端设备
US8417059B2 (en) Image processing device, image processing method, and program
US9760999B2 (en) Image processing apparatus, imaging apparatus, and image processing method
TW201118791A (en) System and method for obtaining camera parameters from a plurality of images, and computer program products thereof
WO2022105415A1 (zh) 关键帧图像的采集方法、装置、系统和三维重建方法
WO2012029658A1 (ja) 撮像装置、画像処理装置、画像処理方法及び画像処理プログラム
JP2021108193A (ja) 画像処理装置、画像処理方法、及びプログラム
CN111598777A (zh) 天空云图的处理方法、计算机设备和可读存储介质
JP5173549B2 (ja) 画像処理装置及び撮像装置
CN108961182B (zh) 针对视频图像的竖直方向灭点检测方法及视频扭正方法
JP2019012360A (ja) 情報処理装置、プログラム及び情報処理方法
JP2008077489A (ja) 画像処理装置、方法、プログラムおよび記憶媒体
KR100942271B1 (ko) 깊이 정보를 이용한 집적 영상 복원 방법 및 장치
JP2005332177A (ja) 3次元情報処理装置、3次元情報処理方法、及び3次元情報処理プログラム
JP2006113832A (ja) ステレオ画像処理装置およびプログラム
JP2004364212A (ja) 物体撮影装置、物体撮影方法及び物体撮影プログラム
KR102076635B1 (ko) 산재된 고정 카메라를 이용한 파노라마 영상 생성 장치 및 방법
JP7118729B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2008224323A (ja) ステレオ写真計測装置、ステレオ写真計測方法及びステレオ写真計測用プログラム
CN109600598B (zh) 影像处理方法、影像处理装置及电脑可读取记录媒体
JP5955003B2 (ja) 画像処理装置および画像処理方法、プログラム
CN114727073B (zh) 一种图像的投影方法、装置、可读存储介质及电子设备
JP5013319B2 (ja) ステレオ画像処理装置及び同画像処理用プログラム
JPWO2017209213A1 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2011171991A (ja) 画像処理装置、電子機器、画像処理方法、および、画像処理プログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20091201