JP2002354230A - 画像処理装置,画像処理方法および画像処理プログラム - Google Patents
画像処理装置,画像処理方法および画像処理プログラムInfo
- Publication number
- JP2002354230A JP2002354230A JP2001320620A JP2001320620A JP2002354230A JP 2002354230 A JP2002354230 A JP 2002354230A JP 2001320620 A JP2001320620 A JP 2001320620A JP 2001320620 A JP2001320620 A JP 2001320620A JP 2002354230 A JP2002354230 A JP 2002354230A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- image
- scanning direction
- line
- inclination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title description 22
- 238000012937 correction Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 156
- 238000004519 manufacturing process Methods 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 65
- 238000009499 grossing Methods 0.000 description 57
- 230000008569 process Effects 0.000 description 37
- 238000001514 detection method Methods 0.000 description 35
- 238000010586 diagram Methods 0.000 description 35
- 238000006073 displacement reaction Methods 0.000 description 28
- 238000004364 calculation method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 230000010365 information processing Effects 0.000 description 20
- 239000013598 vector Substances 0.000 description 17
- 238000000605 extraction Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 5
- 238000003702 image correction Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 101100165547 Caenorhabditis elegans bli-1 gene Proteins 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 102100031658 C-X-C chemokine receptor type 5 Human genes 0.000 description 2
- 101000922405 Homo sapiens C-X-C chemokine receptor type 5 Proteins 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000452 restraining effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/06—Topological mapping of higher dimensional structures onto lower dimensional surfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
- H04N1/047—Detection, control or error compensation of scanning velocity or position
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
- H04N1/10—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces
- H04N1/107—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces with manual scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0081—Image reader
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/04—Scanning arrangements
- H04N2201/047—Detection, control or error compensation of scanning velocity or position
- H04N2201/04701—Detection of scanning velocity or position
- H04N2201/04743—Detection of scanning velocity or position by detecting the image directly
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/04—Scanning arrangements
- H04N2201/047—Detection, control or error compensation of scanning velocity or position
- H04N2201/04753—Control or error compensation of scanning position or velocity
- H04N2201/04758—Control or error compensation of scanning position or velocity by controlling the position of the scanned image area
- H04N2201/04787—Control or error compensation of scanning position or velocity by controlling the position of the scanned image area by changing or controlling the addresses or values of pixels, e.g. in an array, in a memory, by interpolation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
Abstract
画像データのみを用いて画像データの歪みを補正可能に
して、製造コストの増大を招くことなく、歪みの無い高
品質の画像データを得られるようにする。 【解決手段】画像データを成す部分データ間の相互相関
に基づいて部分データ間のずれ量を推定する推定手段
(102〜109)と、この推定手段によって推定され
たずれ量に基づいて画像データにおけるずれを解消する
ようにこの画像データを補正する補正手段111とをそ
なえて構成する。
Description
ド型イメージスキャナなどの画像入力装置から入力され
た画像(特に文書画像)の歪みを補正するための画像処
理装置,画像処理方法および画像処理プログラムに関す
る。
報処理装置に画像を入力するための装置としては、イメ
ージスキャナが利用されている。これまでのイメージス
キャナとしては、据置き型の、いわゆるフラットベッド
型やドラムスキャナ型のイメージスキャナが用いられて
いるが、近年、持ち運びが容易でユーザが手で持って画
像のスキャンを行なうことのできる、簡易型のイメージ
スキャナ(ハンドヘルド型イメージスキャナ)が開発・
製品化されている。
ジスキャナの構成を説明すべく、その原稿接触面を示す
平面図である。この図16に示すように、ハンドヘルド
型イメージスキャナ10は、基本的に、画像を取り込む
ための1次元のラインセンサ11と、ユーザ(操作者)
によるスキャン操作に伴ってその画像原稿に接触しなが
ら回転する複数(図中4個)のローラ12と、スキャン
操作に伴うイメージスキャナ10の移動量を検出すべく
ローラ12の回転数を検出する、一次元のロータリエン
コーダ(図示省略)とをそなえて構成されている。な
お、複数のローラ12は、同一回転軸を有し、一体的に
回転するように構成されている。また、ラインセンサ1
1の主走査方向幅は固定長Wである。
像を取り込む際、ユーザは、イメージスキャナ10を手
で持ってサンプル対象の画像に沿って所定方向(副走査
方向)へ移動させる。このとき、イメージスキャナ10
の移動に伴ってローラ12が回転し、その回転数がエン
コーダにより検出される。そして、検出されたローラ1
2の回転数に応じたタイミングで、ラインセンサ11に
より、主走査方向1ライン分の画像データ(以下、ライ
ン画像データという)が得られ、そのライン画像データ
が1ラインずつイメージスキャナから情報処理装置へ送
信される。これにより、サンプル対象の画像が、主走査
方向に沿う複数列のライン画像データを副走査方向に配
列して成る画像データとして、情報処理装置に取り込ま
れる。
である場合、ユーザによるイメージスキャナ10の操作
方向(副走査方向)が文書の文字列の方向に対して平行
または垂直であることが理想的である。しかし、イメー
ジスキャナ10がサンプル対象の画像に対し一方向のみ
に移動するようにその移動方向を規制するための機構は
特にそなえられていない。ただ、ユーザによる実際のス
キャン操作時には、前述したローラ12により、イメー
ジスキャナ10の移動方向をローラ12の回転方向に沿
わせるような若干の拘束力が作用するが、その拘束力は
弱く、その移動方向を一方向に規制できるほどのもので
はない。
10についてのユーザによる操作自由度は高く、そのた
め、ユーザの意識とは無関係にイメージスキャナ10の
スキャン操作方向(移動方向)が変化し、読み取られた
画像に歪みが発生してしまう場合が多い。
稿を、イメージスキャナ10をユーザ方向へ移動させな
がら読み取る場合を考える。この場合、右利きのユーザ
が右手でイメージスキャナ10を持ってスキャン操作を
行なうと、イメージスキャナ10が手前に近づくにつれ
て右肘を右方向へ逃がすような腕の動きが生じる。この
ような腕の動きに伴って、図17(A)に示すごとく、
イメージスキャナ10の操作方向は無意識のうちに僅か
ながら右方向へずれていく傾向がある。逆にユーザが左
利きの場合、その操作方向は左方向へずれる傾向があ
る。このときイメージスキャナ10によって読み取られ
た画像には、操作方向(副走査方向)の位置に依ってラ
インセンサ方向(主走査方向)へのずれ、つまり歪みが
発生する。
動きに伴い、図17(B)に示すごとく、イメージスキ
ャナ10の操作方向が右方向へずれると同時にイメージ
スキャナ10の一端側〔図17(B)では左側〕で滑り
が生じ、イメージスキャナ10によるスキャン領域が扇
形になることもある。このときイメージスキャナ10に
よって読み取られた画像データには、ラインセンサ方向
(主走査方向)のみならず操作方向(副走査方向)にも
歪みが発生する。
の二次元センサを埋め込んでおき、この二次元センサを
用いて、画像原稿上でイメージスキャナ本体がどのよう
に移動したかを二次元的に検出し、その検出結果に応じ
て、ハンドヘルド型イメージスキャナによって読み取ら
れた画像データを補正するという技術が提案されてい
る。ここで、光学式の二次元センサは、紙等の画像形成
面上の微小な凹凸状態を追うことにより、スキャン操作
開始後、イメージスキャナ本体が二次元的にどのように
移動したかを検出する。
た二次元センサは高価であるため、二次元センサをそな
えた場合、画像データの歪みを補正することはできる
が、イメージスキャナの製造コストが高くなるという課
題がある。このため、二次元センサ等を新たに追加する
ことなく、ラインセンサによって得られた画像データを
用いて、その画像データの歪みを推定し補正できるよう
にすることが望まれている。
たもので、二次元センサを用いることなく、読み取られ
た画像データのみを用いて画像データの歪みを補正可能
にして、製造コストの増大を招くことなく、歪みの無い
高品質の画像データを得られるようにした、画像処理装
置,画像処理方法および画像処理プログラムを提供する
ことを目的とする。
に、本発明の画像処理装置(請求項1)は、画像データ
を成す部分データ間の相互相関に基づいて該部分データ
間のずれ量を推定する推定手段と、該推定手段によって
推定されたずれ量に基づいて該画像データにおけるずれ
を解消するように該画像データを補正する補正手段とを
そなえたことを特徴としている。
画像データを成す部分データ間の相互相関に基づいて該
部分データ間のずれ量を推定する推定ステップと、該推
定ステップで推定されたずれ量に基づいて該画像データ
におけるずれを解消するように該画像データを補正する
補正ステップとを含むことを特徴としている。そして、
本発明の画像処理プログラム(請求項3)は、コンピュ
ータを、上述した本発明の画像処理装置における推定手
段および補正手段として機能させるものである。
の全体的な構造に着目して、距離がそれほど離れていな
い1次元イメージデータ(部分データ)どうしはそれほ
ど大きく変化しないことを利用し、部分データ間の相互
相関に基づいてこれらの部分データ間の所定方向へのず
れ量を推定している。そして、そのずれ量に基づいて画
像データが補正される。これにより、二次元センサを用
いることなく、読み取られた画像データのみを用いて画
像データのずれ(一次元的な歪み)を補正することがで
きる。
は、主走査方向(左右方向)に沿う複数列のライン画像
データを副走査方向(上下方向)に配列してなる画像デ
ータに対する処理を行なうものであって、該複数列のラ
イン画像データを成す部分データ間の相互相関に基づい
て該画像データの左側および右側の主走査方向ずれ量を
それぞれ推定する推定手段と、該画像データに基づいて
該画像データの上下両側における画像の傾きをそれぞれ
検出する検出手段と、該推定手段によって推定された該
主走査方向ずれ量と該検出手段によって検出された該傾
きとに基づいて該画像データを再構成して該画像データ
の歪みを解消する再構成手段とをそなえたことを特徴と
している。
文書画像)の全体的な構造に着目して、距離がそれほど
離れていない1次元イメージデータ(部分データ)どう
しはそれほど大きく変化しない場合が多いことを利用
し、部分データ間の相互相関に基づいて画像データの左
側および右側の主走査方向ずれ量を推定している。そし
て、この画像処理装置においては、画像データの上下両
側における画像の傾きを検出した上で、これらのずれ量
および傾きに基づいて画像データの本来の外形を推定し
て画像データの再構成を行なうことで、画像データの歪
みが解消される。これにより、二次元センサを用いるこ
となく、読み取られた画像データのみを用いて画像デー
タの二次元的な歪みを補正することができる。
5)は、主走査方向(左右方向)に沿う複数列のライン
画像データを副走査方向(上下方向)に配列してなる画
像データに対する処理を行なうものであって、該画像デ
ータを該副走査方向について複数のブロックに分割する
分割手段と、該分割手段により分割されて得られた各ブ
ロックの上下両側における画像の傾きを推定する傾き推
定手段と、該分割手段により分割されて得られた各ブロ
ックの左側および右側の主操作方向ずれ量を、各ブロッ
ク内のライン画像データを成す部分データ間の相互相関
に基づいて推定するずれ量推定手段と、該分割手段によ
り分割されて得られた各ブロックについて、該ずれ量推
定手段によって推定された該主走査方向ずれ量と該傾き
推定手段によって推定された上下両側における該傾きと
に基づいて、当該ブロック内の画像データを再構成して
当該ブロック内の画像データの歪みを解消する再構成手
段とをそなえたことを特徴としている。
データを副走査方向について複数のブロックに分割して
から、各ブロックの上下両側における画像の傾きを推定
しておく。また、各ブロックにおいて、画像(特に文書
画像)の全体的な構造に着目し、距離がそれほど離れて
いない1次元イメージデータ(部分データ)どうしはそ
れほど大きく変化しない場合が多いことを利用し、部分
データ間の相互相関に基づいて画像データの左側および
右側の主走査方向ずれ量を推定する。そして、この画像
処理装置においては、ブロック毎に、推定された傾きと
ずれ量とに基づいて、そのブロックの本来の外形を推定
して画像データの再構成を行ない、各ブロック内の画像
データの歪みが解消される。これにより、例えばハンド
ヘルド型イメージスキャナで画像データを読み取った際
にこのイメージスキャナが蛇行していたとしても、二次
元センサを用いることなく、上記イメージスキャナによ
り読み取られた画像データのみを用いて、蛇行に伴う画
像データの二次元的な歪みを補正することができる。
施の形態を説明する。本実施形態の画像処理装置(符号
100,100A,100B参照)は、例えばハンドヘ
ルド型イメージスキャナ(図16の符号10参照)によ
り読み取られた画像データを処理対象としている。この
ような画像データは、主走査方向(左右方向)に沿う多
数列のライン画像データを副走査方向(上下方向)に配
列して構成されている。
前述したように、画像の全体的な構造に着目して、距離
がそれほど離れていない1次元イメージデータ(ライン
画像データ)どうしはそれほど大きく変化しないことを
利用している。つまり、ライン画像データ(以下、単に
ラインという場合がある)間の相互相関を用いることに
より、各ラインのずれ量を推定している。
ージスキャナの解像度は、およそ200〜1200dpi
であるが、この場合、通常使用されている12ポイント
の大きさの文字は、およそ33〜200画素から構成さ
れる。これだけの画素数で文字が構成されている場合、
10画素程度はなれた2つのラインはほぼ同一であるこ
とが期待される。また、文書には罫線や約物が使用され
ることが多く、これらは、直線で構成されている部分を
多く有しているので、先の2つのラインがほぼ同一にな
るという性質をより一層補強している。
成を示すブロック図であり、この図1に示すように、第
1実施形態の画像処理装置100は、画像バッファ10
1,第1ラインカウンタ102,第2ラインカウンタ1
03,距離メモリ104,相互相関係数演算部105,
最小相互相関係数検出部106,最小相互相関係数メモ
リ107,ずれ量カウンタ108,最小相互相関係数位
置メモリ109,ずれ量メモリ110,線形補間処理部
111および補正画像バッファ112から構成されてい
る。
例えばパーソナルコンピュータ等の情報処理装置によっ
て実現される。つまり、情報処理装置内のメモリ(RA
M,ROM,ハードディスク等)が、画像バッファ10
1,第1ラインカウンタ102,第2ラインカウンタ1
03,距離メモリ104,最小相互相関係数メモリ10
7,ずれ量カウンタ108,最小相互相関係数位置メモ
リ109,ずれ量メモリ110および補正画像バッファ
112としての機能を果たしている。
像処理プログラムを実行することにより、相互相関係数
演算部105,最小相互相関係数検出部106および線
形補間処理部111としての機能(後述する推定手段お
よび補正手段としての機能)が実現されるようになって
いる。このように、本実施形態の画像処理装置100
は、情報処理装置において、画像処理プログラムを起動
・実行することによって実現される。なお、実際には、
画像処理プログラムは、情報処理装置のハードディスク
に記憶されており、ハードディスクからメモリ(RAM
等)に読み出された上で、CPUによって起動・実行さ
れる。
を記録されたコンピュータ読取可能な記録媒体について
説明する。本実施形態では、画像処理プログラムは、ハ
ードディスクに予め記録され、必要に応じてメモリ(R
AM等)に読み出されて起動されるものとして説明する
が、画像処理プログラムは、必ずしもハードディスク上
に記録されている必要はない。
グラムを予め記録された可搬型記録媒体から、画像処理
装置100として機能させるべき情報処理装置にロード
されてもよい。あるいは、情報処理装置が、インターネ
ット等の通信回線を通じて、その画像処理プログラムを
予め記憶したサーバと通信することにより、その画像処
理プログラムを、サーバの記憶装置から情報処理装置に
ダウンロードしてもよい。なお、サーバは、例えばプロ
グラム提供者の所有するものである。また、外部から情
報処理装置にダウンロードされた画像処理プログラム
は、ハードディスクではなく、情報処理装置に接続され
た補助記憶装置に保管してもよい。この場合、画像処理
プログラムは、その補助記憶装置から情報処理装置内の
メモリ(RAM等)に読み出されて実行される。
シブルディスク,CD−ROM等の、コンピュータ読取
可能な記録媒体である。また、上述したサーバの記憶装
置や補助記憶装置は、例えば磁気ディスク,光ディス
ク,光磁気ディスク等の記憶装置(コンピュータ読取可
能な記録媒体)である。さらに、画像処理プログラムを
記録する記録媒体としては、ICカード,ROMカート
リッジ,磁気テープ,パンチカードのほか、バーコード
などの符号を印刷した印刷物等の、コンピュータ読取可
能な種々の媒体を利用することもできる。
ド型イメージスキャナ(図16の符号10参照)によっ
て読み取られた画像データを保持するもので、この画像
データは、主走査方向〔左右方向;一次元ラインセンサ
(図16の符号11参照)の方向〕に沿う多数列のライ
ン画像データを副走査方向(上下方向)に配列して構成
されている。
ンカウンタ103は、相互相関係数の演算対象となる、
所定の間隔をあけた2本のライン(部分データ)を指定
するためのもので、これらのラインカウンタ102,1
03によって示される値に応じたラインが、画像バッフ
ァ101から相互相関係数演算部105へ出力されるよ
うになっている。ここで、ラインカウンタ102,10
3の値は、画像バッファ101から読み出すべきライン
画像データが何ライン目であるかを示す。ただし、本実
施形態では、一番最初のラインを0ライン目としてい
る。
の間隔(つまり副走査方向の距離に対応するライン数)
dが予め設定され、その値dによって、どれだけ離れた
ラインとの相互相関を求めるかが指示される。そして、
第2ラインカウンタ103には、第1ラインカウンタ1
02の値に距離メモリ104の値dを加算した値が設定
される。従って、第1ラインカウンタ102によって指
定されたラインから副走査方向に所定間隔dだけ離れた
ラインが、第2ラインカウンタ103によって指定され
る。なお、間隔dとしては、後述する理由により、5〜
20の値が適当であり、特に本実施形態では10が設定
される。
ンタ102,103に設定されている値に応じた2本の
ライン画像データ(部分データ)を、画像バッファ10
1から読み出し、これら2本のライン画像データ間の相
互相関係数を、後述する式(1)に従って算出するもの
である。その際、相互相関係数演算部105は、上記2
本のライン画像データ間の主走査方向のずれ量がずれ量
カウンタ108に設定された値(画素数)sである時の
相互相関係数を、後述する式(1)に従って演算する。
具体的には、第1ラインカウンタ102によって指定さ
れる第1ラインに対して、第2ラインカウンタ103に
よって指定される第2ラインを、値sだけ主走査方向に
ずらした時の、相互相関係数が算出される。なお、下記
(1)式によって算出される相互相関係数は、第1ライ
ンと第2ラインとが全く同じである時には0となり、第
1ラインと第2ラインとの類似度合いが低くなるにつれ
て大きな値となる。
囲(本実施形態では後述するごとく−1,0,1の3
値)のずれ量のそれぞれについて相互相関係数演算部1
05により算出された複数の相互相関係数の中から、最
小の相互相関係数を検出するものである。この最小相互
相関係数検出部106は、図3を参照しながら後述する
ごとく、最小相互相関係数メモリ107,ずれ量カウン
タ108および最小相互相関係数位置メモリ109を利
用しながら、最小の相互相関係数を検出・決定する。
相互相関係数検出部106により、式(1)に代入すべ
きずれ量(上記所定範囲の値s)が順次設定される。ま
た、最小相互相関係数メモリ107には、相互相関係数
演算部105によって演算された相互相関係数のうち最
小のものが記憶される。つまり、ある一つのずれ量につ
いて相互相関係数が相互相関係数演算部105によって
算出される都度、最小相互相関係数検出部106は、今
回算出された相互相関係数と、最小相互相関係数メモリ
107に記憶されている最小相互相関係数(前回までに
算出された1以上の相互相関係数のうち最小のもの)と
を比較し、今回の相互相関係数の方が小さければ最小相
互相関係数メモリ107の値を今回の相互相関係数に書
き換える一方、そうでなければ最小相互相関係数メモリ
107の値を書き換えることなく維持するようになって
いる。
最小相互相関係数メモリ107の値を新たな相互相関係
数に書き換えた場合、その新たな相互相関係数の算出時
に用いられたずれ量の値(つまり、ずれ量カウンタ10
8の値s)が、最小相互相関係数位置として書き込まれ
るようになっている。従って、この最小相互相関係数位
置メモリ109には、上記所定範囲内の全てのずれ量に
ついての相互相関係数の算出を完了した時点で、上記2
本のライン画像データ間の相互相関係数が最小になった
時のずれ量の値sが記憶されることになる。
相関係数検出部106によって検出・決定されたずれ量
を、第2ラインカウンタ103の値に対応させて記憶す
るものである。本実施形態では、上記所定範囲内の全て
のずれ量についての相互相関係数の算出を完了した時点
で最小相互相関係数位置メモリ109に記憶されている
値s(即ち、第1ラインと第2ラインとの相互相関係数
が最小になる時のずれ量の値s)が、第1ラインに対す
る第2ラインの主走査方向ずれ量の推定結果として、ず
れ量メモリ110に記憶される。なお、以下、本実施形
態においては、単に「ずれ量」という場合、その「ずれ
量」は主走査方向のずれ量を意味している。
相互相関係数の算出を完了すると、第1ラインカウンタ
102には、第2ラインカウンタ103の値が新たに設
定されるとともに、第2ラインカウンタ103には、第
1ラインカウンタ102の新設定値に距離メモリ104
の値を加算した値が新たに設定されるようになってい
る。そして、新たな第1ラインと第2ラインとの組につ
いて主走査方向ずれ量が推定・算出される。このように
して、画像バッファ101に保持された全画像データに
ついて、所定間隔dをあけたライン画像データごとに、
主走査方向のずれ量が推定され、その推定結果がずれ量
メモリ110に記憶される。
ンタ102,第2ラインカウンタ103,距離メモリ1
04,相互相関係数演算部105,最小相互相関係数検
出部106,最小相互相関係数メモリ107,ずれ量カ
ウンタ108および最小相互相関係数位置メモリ109
によって、画像データを成すライン画像データ間の相互
相関に基づいてこれらのライン画像データ間のずれ量を
推定する推定手段が構成されている。
ファ101に保持された画像データから、副走査方向に
所定間隔dをあけてライン画像データを順次抽出し、抽
出されたライン画像データ間の相互相関に基づいて、こ
れらのライン画像データ間の主走査方向ずれ量を推定す
るし、推定された主走査方向ずれ量をずれ量メモリ11
0に書き込むように構成されている。
れ量メモリ110に書き込まれたずれ量、つまり上記推
定手段によって推定された主走査方向ずれ量に基づき、
その主走査方向ずれを解消するように画像データのずれ
を補正するもので、より具体的には、画像バッファ10
1から画像データをなす各ラインを順次読み出し、ずれ
量メモリ110のずれ量に応じて各ラインの主走査方向
位置を調整・変換し、調整後のデータを補正画像バッフ
ァ112に書き込む。
た第1ラインと第2ラインとの間に存在する各ラインの
主走査方向ずれ量を、前記主走査方向ずれ量に基づき線
形補間を行なって求めてから、その線形補間の結果に基
づいて、各ラインの主走査方向位置を調整するようにな
っている。その線形補間の具体的な手法については後述
する。なお、補正画像バッファ112は、前述した通
り、線形補間処理部111によって得られた補正画像を
保持するものである。
(C)を参照しながら、上述した第1実施形態の画像処
理装置100の動作について説明する。図2に示すフロ
ーチャート(ステップS11〜S18)に従って、第1
実施形態の画像処理手順を説明する。まず、本実施形態
では、例えば図16に示したようなハンドヘルド型イメ
ージスキャナ10によって所定の文書画像が読み取ら
れ、読み取られた画像データが画像バッファ101に格
納される(ステップS11)。その際、第1実施形態で
は、操作者のスキャン操作に伴ってイメージスキャナ1
0が左右方向(主走査方向)に滑り、例えば図17
(A)に示すような領域についてスキャンされたものと
する。
データの先頭ラインの番号“0”を設定する(ステップ
S12)。また、距離メモリ104に、相互相関係数の
計算対象である2本のラインの間隔(ライン数)dとし
て“10”を設定する(ステップS13)。さらに、第
2ラインカウンタ103に、第1ラインカウンタ102
の値と距離メモリ104の値とを加算した値(初期値は
“10”)を設定する(ステップS14)。
て、第1ラインカウンタ102および第2ラインカウン
タ103に設定された値に対応する2本のライン(最初
は0番目のラインと10番目のライン)が、画像バッフ
ァ101から読み出される。そして、図3によって後述
する手順に従い、これら2本のラインの相互相関係数が
最小になる時の、第1ラインに対する第2ラインの位置
が、主走査方向のずれ量として算出・推定される(ステ
ップS15;推定ステップ)。
タ102の値に距離メモリ104の値dを加算してから
(ステップS16)、この第1ラインカウンタ102に
新たに設定された値に基づいて、次に相互相関係数の計
算対象になる第2ラインが画像データのサイズ(最終ラ
イン)を超えていないかどうかをチェックする(ステッ
プS17)。このステップS17では、第1ラインカウ
ンタ102の新たな設定値が、画像の最終ライン番号か
ら距離メモリ104の値dを減算した結果よりも小さい
か否かをチェックしている。
い場合(ステップS17のYESルート)、ステップS
14〜S17を繰り返し実行する。次の第2ラインが最
終ラインを超える場合(ステップS17のNOルー
ト)、画像データの全領域に対するずれ量推定を完了し
たものと判断され、線形補間処理部111において、ず
れ量メモリ110に書き込まれたずれ量に基づき、後述
するような一般的な線形補間処理を行ないながら、画像
データにおける主走査方向ずれを解消するように画像デ
ータのずれが補正される(ステップS18;補正ステッ
プ)。
ップS21〜S28)に従って、ステップS15(推定
ステップ)でのずれ量推定手順について説明する。ま
ず、ずれ量カウンタ108に、第1ラインに対する第2
ラインのずれ量の初期値として“−1”を設定する(ス
テップS21)。本実施形態においては、イメージスキ
ャナ10を10ライン前後移動させた時に発生する、主
走査方向の最大ずれ量は、1画素分程度であることを前
提とし、ずれ量カウンタ108に設定される値s(ずれ
量の範囲)を、−1,0,1の3値としている。
に、このメモリ109に設定可能な最大値を設定してか
ら(ステップS22)、相互相関係数演算部105にお
いて、第1ラインカウンタ102によって指定される第
1ラインに対し、第2ラインカウンタ103によって指
定される第2ラインが、ずれ量カウンタに設定されてい
る値sだけずれている場合の、これら2本のラインの相
互相関係数を、下記(1)式を用いて算出する(ステッ
プS23)。この相互相関係数の算出手法は一般的なも
のである。
での総和演算を意味するものとする。Nは1ラインを成
す画素の数である。また、VA(i)は、第1ラインカウン
タ102によって指定される第1ラインにおけるi番目
の画素の値であり、VB(i)は、第2ラインカウンタ10
3によって指定される第2ラインにおけるi番目の画素
の値であり、sは、前述した通り、ずれ量(ずれ量カウ
ンタ108に設定されている値)である。上記(1)式
では、各画素について算出された{VA(i)−VB(i+s)}
2の総和が、相互相関係数として算出される。
れた相互相関係数は、最小相互相関係数検出部106に
おいて、最小相互相関係数メモリ107に設定されてい
る値(過去の最小相互相関係数の値)と比較される(ス
テップS24)。その比較の結果、今回算出された相互
相関係数の値が最小相互相関係数メモリ107の設定値
よりも小さければ(ステップS24のYESルート)、
最小相互相関係数検出部106により、最小相互相関係
数メモリ107の値が今回の相互相関係数に書き換えら
れるとともに、今回の演算に用いたずれ量カウンタ10
8の値sが、最小相互相関係数位置として最小相互相関
係数位置メモリ109に格納される(ステップS2
5)。この後、ずれ量カウンタ108の値に“1”を加
算する(ステップS26)。
最小相互相関係数メモリ107の設定値以上であれば
(ステップS24のNOルート)、最小相互相関係数メ
モリ107の値は、書き換えられることなくそのまま維
持される。この後、ずれ量カウンタ108の値に“1”
を加算する(ステップS26)。そして、ずれ量カウン
タ108の新たな値(1加算後の値)が“2”であるか
否かが判定され(ステップS27)、“2”でなければ
(NOルート)、ステップS23〜S27を繰り返し実
行する。
“2”であると判定された場合(ステップS27のYE
Sルート)、上述した所定範囲のずれ量−1,0,1に
ついての処理が完了したものと判断され、この時点で、
最小相互相関係数位置メモリ109に格納されているず
れ量が、第1ラインに対する第2ラインの主走査方向ず
れ量の推定結果として、ずれ量メモリ110に追加登録
される(ステップS28)。このとき、ずれ量メモリ1
10においては、推定された主走査方向ずれ量と第2ラ
インカウンタ103の値(ライン番号)とが対応付けら
れている。
がら、第1実施形態の画像処理手法を、より具体的に説
明する。図4(A)は、例えば前述したイメージスキャ
ン10によって実際に読み取られた画像データの一部
(ある漢字の下部)を拡大して示すもので、ここでは、
図4(A)に示す画像データに対して、第1実施形態の
画像処理手法を適用した場合について説明する。
(B)に示すように、10ラインごとにライン画像デー
タが切り出される。図4(B)では、図4(A)の画像
データにおける、0番目(0ライン目)のライン画像デ
ータと、10番目(10ライン目)のライン画像データ
と、20番目(20ライン目)の画像データとが示され
ている。この図4(B)において、3つのライン画像デ
ータは、主走査方向および副走査方向のいずれについて
も、図4(A)の画像データにおける位置関係を保持し
た状態で示されている。
れた0番目のラインと10番目のラインとに図3にて説
明した手法を適用した結果、10番目のラインを0番目
のラインに対して右方向に1画素だけ移動させた時に、
相互相関係数が最小になったものとする。同様に、図4
(B)に示すように切り出された10番目のラインと2
0番目のラインとに図3にて説明した手法を適用した結
果は、20番目のラインの10番目のラインに対するず
れ量が0である時に、相互相関係数が最小になったもの
とする。
4(B)に示す3つのライン画像データは、図4(C)
に示すように補正される。つまり、10番目のライン
は、0番目のラインに対して1画素だけ右方向へ移動さ
れ、20番目のラインは、0番目のラインに対して1画
素だけ右方向へ移動される。なお、上記推定結果では、
20番目のラインは、10番目のラインに対してずれが
ないと推定されているので、10番目のラインと20番
目のラインとの相対的な位置関係が変化しないように、
20番目のラインを0番目のラインに対して1画素だけ
右方向へ移動させている。
イン間に存在するライン(1番目〜9番目のラインや1
1番目〜19番目のライン)は、線形補間処理部111
の機能により、以下のような直線補間処理(線形補間処
理)を施されて補正される。例えば、図4(B)および
図4(C)に示す例では、0番目〜10番目のラインの
間で1画素分右にずれているので、0番目〜5番目のラ
インはそのままの位置に配置し、6番目〜10番目のラ
インは1画素ずつ右にずらす。また、10番目〜20番
目のラインの間ではずれが生じていないと推定されたの
で、11番目〜20番目のラインについては、10番目
のラインに対してはそのままの位置、つまり、原画像に
対しては1画素ずつ右にずれた位置に移動する。
算対象となる2本のラインの間隔(距離)dを10ライ
ン(即ち副走査方向に10画素)としている。これは、
以下のような理由による。発明者らが行なった実験によ
ると、人間が、スキャン操作方向が曲がらないように意
識しながらハンドヘルド型イメージスキャナを操作した
場合、このイメージスキャナによって読み取られた画像
データに生じる主走査方向ずれ量が、1画素となるの
は、副走査方向にほぼ10ライン(10画素)だけ離れ
たラインにおいてであった。
対象となる2本のラインの間隔dとして、5〜20の範
囲内の値を設定するものとし、好ましくは10前後の値
を設定する。その間隔dが5未満であれば、主走査方向
へのずれを検出することができなくなる。逆に、その間
隔dが20を超え、例えば100程度になってしまう
と、全く相関関係のない2本のラインどうしについて相
互相関係数が算出される可能性があるため、有効なずれ
量を推定することができなくなってしまう。
の画像処理装置100によれば、二次元センサを用いる
ことなく、読み取られた画像データのみを用いて画像デ
ータのずれ(一次元的な歪み)を確実に補正することが
できる。例えば、ハンドヘルド型イメージスキャナ10
のスキャン操作時に図17(A)に示すような主走査方
向(ラインセンサ方向)への滑りが生じ、画像データに
歪み(主走査方向のずれ)が生じたとしても、その歪み
を解消し、歪みの無い高品質の画像データを得ることが
できる。従って、製造コストの増大を招くことなく、歪
みの無い高品質の画像データを得ることができる。
順次抽出されるライン画像データどうしの相互相関に基
づいて、主走査方向ずれ量を推定することにより、主走
査方向ずれ量を推定するための計算量が削減されて画像
補正処理を効率的に行なえると同時に、主走査方向ずれ
量の計算精度を向上させることができる。
データ間に存在する各ライン画像データのずれ量は、線
形補間処理部111において、主走査方向ずれ量に基づ
く線形補間処理を行なうことにより算出され、その線形
補間の結果に基づいて画像データが補正される。これに
より、適当な間隔dをあけて推定された主走査方向ずれ
量が、各ライン画像データに線形に割り当てられ、画像
データの補正が滑らかに行なわれる。
成を示すブロック図であり、この図5に示すように、第
2実施形態の画像処理装置100Aは、第1実施形態の
画像処理装置100とほぼ同様に構成されているが、こ
の画像処理装置100Aにおいては平滑化処理部113
が新たに追加されている。なお、図中、既述の符号と同
一の符号は同一もしくはほぼ同一の部分を示しているの
で、その説明は省略する。
追加された平滑化処理部(平滑化手段)113は、ずれ
量メモリ110と線形補間処理部111との間に介設さ
れ、前記ステップS15(図2参照)で所定間隔dをあ
けて推定された主走査方向ずれ量が滑らかな曲線に沿う
ように、ずれ量メモリ110の主走査方向ずれ量に対し
て平滑化処理(スムージング処理)を施し、平滑化され
た主走査方向ずれ量を線形補間処理部111へ出力する
ものである。なお、第2実施形態の画像処理装置100
Aも、第1実施形態と同様、例えばパーソナルコンピュ
ータ等の情報処理装置によって実現されるもので、上述
した平滑化処理部113としての機能は、情報処理装置
内のCPUが所定の画像処理プログラムを実行すること
により実現される。
像処理装置100Aも、基本的に前述した第1実施形態
の画像処理装置100と同様に動作するが、この第2実
施形態では、平滑化処理部113によって、推定された
主走査方向ずれ量に対し平滑化処理が施され、線形補間
処理部111では、平滑化された主走査方向ずれ量に基
づいて線形補間および補正が行なわれることになる。
しながら、第2実施形態の平滑化処理(スムージング処
理)について説明する。なお、ずれ量メモリ110に格
納されている主走査方向ずれ量は、所定間隔をあけたラ
インどうしのずれ量であり、“−1”もしくは“0”も
しくは“1”のいずれか一つの値である。図6(A)
は、ずれ量メモリ110に格納された複数の主走査方向
ずれ量を順次積算することにより原画像に対する主走査
方向ずれ量(イメージスキャナ10の動き)を求め、そ
の結果を副走査方向位置に対応させて図示化したもので
ある。また、図6(B)は、図6(A)に示した主走査
方向ずれ量に対して、平滑化処理部113による平滑化
処理を施した結果を示している。
結果は、図6(A)に示すように、細かい凹凸のあるも
のとなることが多い。実際のスキャン動作では、このよ
うな凹凸が発生することはあまり無く、この凹凸の発生
原因の大部分は画像による影響である。
化処理部113により、図6(A)に示す推定結果を、
図6(B)に示すような滑らかな曲線に沿わせるように
修正し、その修正結果を用いて線形補間および補正を行
なっている。平滑化の手法としては、例えば、移動平均
を用いる方法や、ベジェ曲線(Bezier curve)を用いる
方法や、2次関数で近似する方法など、一般的な手法を
用いることができる。
の画像処理装置100Aによれば、第1実施形態と同様
の作用効果が得られるほか、推定された主走査方向ずれ
量が滑らかな曲線に沿うように、その主走査方向ずれ量
に対して平滑化処理を施してから、線形補間処理部11
1による線形補間および補正が行なわれるので、イメー
ジスキャナ10に急峻な動きをさせたために生じた、画
像データにおける急峻なずれを適切に解消することがで
き、より高画質の画像データを得ることが可能になる。
成を示すブロック図であり、この図7に示すように、第
3実施形態の画像処理装置100Bは、第2実施形態の
画像処理装置100Aと同様に構成されているが、この
画像処理装置100Bにおいては、左右領域抽出部11
4,上下領域抽出部115および傾き検出部116が新
たに追加されるとともに、線形補間処理部111に代え
て再構成部117がそなえられている。なお、図中、既
述の符号と同一の符号は同一もしくはほぼ同一の部分を
示しているので、その説明は省略する。また、本実施形
態においても、単に「ずれ量」という場合、その「ずれ
量」は主走査方向のずれ量を意味している。
参照しながら後述するように、画像データの左右両側に
おけるずれ量を推定すべく、画像データの左側領域と右
側領域とを画像バッファ101からそれぞれ抽出するも
ので、具体的には、図9に示すごとく画像データの全体
を主走査方向に3分割し、左側領域W1および右側領域
W2を抽出するものである。
1ラインカウンタ102,第2ラインカウンタ103,
距離メモリ104,相互相関係数演算部105,最小相
互相関係数検出部106,最小相互相関係数メモリ10
7,ずれ量カウンタ108および最小相互相関係数位置
メモリ109とともに、推定手段を構成している。第3
実施形態の推定手段は、複数列のライン画像データを成
す部分データ間の相互相関、つまり左側領域W1および
右側領域W2にそれぞれ属するデータ間の相互相関に基
づいて、画像データの左側および右側の主走査方向ずれ
量をそれぞれ推定するものである。つまり、第3実施形
態では、左右領域抽出部114によって抽出された左右
の領域W1,W2のそれぞれに対して、第1実施形態で
前述したずれ量推定(図3参照)が適用され、ライン画
像データの左右両側のずれ量が、副走査方向に適当な間
隔dをあけたライン毎に推定され、その推定結果がずれ
量メモリ110に格納されるようになっている。
ながら後述するように、画像データの上下両側における
画像(実際には文字列)の傾きをそれぞれ検出すべく、
画像データの上側領域と下側領域とを画像バッファ10
1からそれぞれ抽出するもので、具体的には、図10に
示すごとく、適当な幅を有する上側領域L1および下側
領域L2を抽出するものである。
域抽出部115によって抽出された上側領域L1および
下側領域L2に基づいて、画像データの上下両側におけ
る画像の傾きをそれぞれ検出するものである。第3実施
形態において、画像データが文書画像であるとし、傾き
検出部116は、その文書画像を成す文字列の傾きに基
づいて、上下両側における画像の傾きを検出するが、そ
の際、図10,図15(A)および図15(B)を参照
しながら後述するごとく、特開平11−341259号
公報に開示された技術を用いている。
ごとく推定されずれ量メモリ110に格納された左右両
側のずれ量と、上述のごとく傾き検出部116によって
検出された上下両側の傾きとに基づいて、画像バッファ
101の画像データを再構成し、この画像データの歪み
を解消してから、補正後の画像データを補正画像バッフ
ァ112に書き込むものである。
2実施形態と同様、ずれ量メモリ110のずれ量に対
し、ベジェ曲線(Bezier curve)を用いた平滑化処理を
施し、平滑化後のずれ量を再構成部117へ出力するよ
うに構成されている。そして、再構成部117は、図1
1〜図14を参照しながら後述するごとく、平滑化処理
部113によって得られた左右両側のベジェ曲線(ずれ
量)の媒介変数tを用いて、画像データの再構成を行な
うように構成されている。
Bも、第1や第2実施形態と同様、例えばパーソナルコ
ンピュータ等の情報処理装置によって実現されるもの
で、上述した左右領域抽出部114,上下領域抽出部1
15,傾き検出部116および再構成部117としての
機能は、情報処理装置内のCPUが所定の画像処理プロ
グラムを実行することにより実現される。
ら、上述した第3実施形態の画像処理装置100Bの動
作について説明する。なお、図8〜図14はいずれも第
3実施形態の画像処理手法を説明するための図、図15
(A)および図15(B)はいずれも第3実施形態にお
ける画像の傾きの検出手法を説明するための図である。
ド型イメージスキャナ10によって得られ画像バッファ
101に格納された画像データ(原画像)が、例えば図
8に示すような文書画像(縦書き)で、この文書画像に
対して画像処理装置100Bによる補正処理を施す場合
について説明する。この図8では、二次元的な歪みの生
じた画像データ(頂点P1〜P4をもつ矩形画像)が示
されている。この二次元的な歪みは、例えば、スキャン
操作時にイメージスキャナ10が読取対象原稿に対して
滑って、イメージスキャナ10によるスキャン領域が扇
形になったために生じている。なお、図8,図10,図
14,図15(A)および図15(B)において、
「○」は文字を示している。また、図9,図11および
図12においては、図中の記述を分かりやすくするため
に、「○」による文字の表示を省略している。
定する。即ち、図9に示すように、左右領域抽出部11
4によって抽出された、画像データの左右の領域W1お
よびW2のそれぞれに対して、第1実施形態で前述した
ずれ量推定(図3参照)を適用する。これにより、ライ
ン画像データの左右両側のずれ量が副走査方向に適当な
間隔dをあけたライン毎にそれぞれ推定され、その推定
結果R1およびR2がずれ量メモリ110に格納される
(推定ステップ)。
に格納されている左右両側のずれ量は、所定間隔をあけ
たラインどうしのずれ量で、“−1”もしくは“0”も
しくは“1”のいずれか一つの値である。図9におけ
る、ずれ量の推定結果R1およびR2は、図6(A)と
同様、ずれ量メモリ110に格納された、左右それぞれ
の主走査方向ずれ量を順次積算することにより、原画像
に対するずれ量(イメージスキャナ10の動き)を求
め、その結果を副走査方向位置に対応させて得られたも
のである。
検出部116により、画像データの上下領域における画
像の傾きを検出する。つまり、図10に示すように、上
下領域抽出部115によって抽出された上下領域L1お
よびL2内の画像データ(文字列画像)を用いて、傾き
検出部116により、上下の画像の傾き角度θおよびφ
をそれぞれ検出する(検出ステップ)。傾き角度θは、
スキャン操作開始時にイメージスキャナ10が文字列に
対して成す角度に対応し、傾き角度φは、スキャン操作
終了時にイメージスキャナ10が文字列に対して成す角
度に対応している。
き角度θを検出する手法について、図15(A)および
図15(B)を参照しながら説明する。この傾き検出手
法は特開平11−341259号公報に開示されたもの
である。つまり、傾き検出部116においては、図15
(A)に示すように、上側領域L1から1列分の文字列
〔図15(A)では連続する5文字〕を部分画像として
抽出する。この部分画像は、上記文字列に外接するとと
もに、画像データの主走査方向および副走査方向に平行
な辺をもつ矩形として切り出される。このように切り出
された部分画像のx軸およびy軸を図15(B)に示す
ように設定し、部分画像内において文字を成す黒画素の
座標を直線〔図15(B)中の直線y=a*x+b参
照〕で近似する。その直線の傾き“a”は、例えば黒画
素座標の回帰直線の傾きとして、次式(2)により算出
することができる。
するものとする。また、Nは部分画像内の黒画素の個
数、xi,yiはi番目の黒画素のx座標およびy座標で
ある。この(2)式によって得られた傾きaに基づい
て、上側の傾き角度θが下式(3)によって算出され
る。下側の傾き角度φについても、上述と同様にして算
出される。
もしくは副走査方向に対する傾き角度θ,φ、つまり
は、イメージスキャナ10が文字列に対して成す角度が
算出される。
を一つのみとすると、直線近似の誤差等の影響を受けて
しまい、正しい傾き角度を求めることができなくなる可
能性がある。そのため、上下領域L1,L2から複数の
部分画像を抽出し、各部分画像について、上式(2)お
よび(3)を用いて傾き角度を算出することが望まし
い。その場合、算出された複数の傾き角度のうち有効な
ものを抽出し、抽出された有効な傾き角度の平均値を、
最終的な傾き角度θ,φとして決定するようにする。
に示すごとく得られたずれ量の推定結果R1およびR2
に対し、ベジェ曲線を用いた平滑化処理が施され、図1
1に示すようなベジェ曲線BZ1およびBZ2がそれぞ
れ得られる。これにより、イメージスキャナ10(ライ
ンセンサ11)の両端の動きがベジェ曲線で近似される
(平滑化ステップ)。
れる。 r(t)=A*(1-t)3+3*B*t*(1-t)2+3*C*t2* (1-t)+D*t3 (4) ただし、(4)式において、A,B,C,Dはベクトル
定数、tは媒介変数である。なお、図11においては、
左側の推定結果R1を近似したベジェ曲線BZ1のベク
トル定数A,B,C,Dは、それぞれA1,B1,C
1,D1として表記され、右側の推定結果R2を近似し
たベジェ曲線BZ2のベクトル定数A,B,C,Dは、
それぞれA2,B2,C2,D2として表記されてい
る。
ぞれ画像データの2つの頂点P1,P1(図8参照)を
示すベクトルとして与えられる。また、ベクトルD(D
1,D2)は、それぞれ図9のごとく得られた推定結果
R1,R2の最下点を示すベクトルとして与えられる。
のコントロールポイントB(B1,B2)およびC(C
1,C2)を決める必要がある。今、上端から副走査方
向画像長の1/3の位置k1におけるずれ量の推定結果
をh1、上端から副走査方向画像長の2/3の位置k2に
おけるずれ量の推定結果をh2とする。このとき、ベジェ
曲線の定義から、コントロールポイントB,Cはそれぞ
れ下式(5),(6)のように与えられる。
とにより、推定結果R1,R2をそれぞれ近似するベジ
ェ曲線BZ1,BZ2が上式(4)によって与えられ、
左右両側のずれ量が平滑化されるとともに、イメージス
キャナ10の左右両端の動きを推定することができる。
画像データの左右両側のずれ量を示すベジェ曲線BZ
1,BZ2と、画像データ上下における画像の傾き角度
θ,φとが得られる。次に、これらの曲線BZ1,BZ
2および傾き角度θ,φに基づいて、再構成部117に
よって、イメージスキャナ10によって実際にスキャン
された領域の形状(図13参照)が再構成され、再構成
された領域内に図8に示す画像データを再配置すること
により、最終的に図14に示すような再構成画像データ
(補正画像データ)が補正画像バッファ112に格納さ
れる(再構成ステップ)。
ャンされた領域の形状は、曲線BZ1,BZ2および傾
き角度θ,φに基づいて図13に示すように再構成され
る。ここで、イメージスキャナ10の読取幅および読取
長(副走査方向の画像長)をそれぞれWおよびLとす
る。読取幅Wは、物理的に一定であり、固定された値に
なる。また、読取長Lは、イメージスキャナ10によっ
て読み取られたラインの数から決定される。
より、イメージスキャナ10の読取開始時の位置が直線
m1として与えられる。この直線m1の長さは固定の読
取幅Wである。直線m1の左端と左側のベジェ曲線BZ
1の上端とを一致させて、直線m1とベジェ曲線BZ1
とを重ね合わせる。そして、ベジェ曲線BZ1の下端
と、主走査方向に対する傾き角度φで長さWの直線m2
の左端とを一致させて、ベジェ曲線BZ1と直線m2と
を重ね合わせる。直線m2は、イメージスキャナ10の
読取終了時の位置である。最後に、直線m1の右端と直
線m2の右端との間に、その間隔に応じてベジェ曲線B
Z2を縮小したベジェ曲線BZ2′を重ね合わせる。こ
のようにしてイメージスキャナ10によって実際にスキ
ャンされた領域が再構成される。
幅)の方が右側の移動量(ずれ幅)よりも大きいので、
左側を基準としてスキャン領域を再構成している。そし
て、図13に示すように、x軸を主走査方向、y軸を副
走査方向、再構成領域の左上頂点P1′を原点(0,
0)とした座標系を設定し、左側のベジェ曲線BZ1の
上端と下端とのずれ量をTすると、再構成領域のその他
の3つの頂点P2′,P3′,P4′の座標は、それぞ
れ、(W * cosθ,W * sinθ),(T,L),(T+ W *
cosφ,L - W * sinφ)となる。
領域内に、図8に示す画像データが再配置されて、図1
4に示すように、画像が再構成される。当然、図8に示
す画像データの4頂点P1,P2,P3,P4は、それ
ぞれ、再構成領域の4頂点P1′,P2′,P3′,P
4′に対応することになる。このとき、左右両側のベジ
ェ曲線BZ1,BZ2′の媒介変数tを用いて、画像デ
ータの再構成が行なわれる。ベジェ曲線BZ1,BZ
2′は、上述した通り媒介変数tを使用した関数であ
り、t=0の時にベクトルA(A1,A2)と一致し、
t=1の時にベクトルD(D1,D2)と一致する。
ライン数NLによって0〜1の範囲を分割した媒介変数
を用いて、画素の再配置を行なう。つまり、図8におけ
るj番目のラインを図13に示す再構成領域内に再配置
する場合、媒介変数tをj/NLとし、このj/NLを
ベジェ曲線BZ1,BZ2′のそれぞれに代入して得ら
れた2点が、j番目のラインの再配置後の両端位置とな
る。そして、得られた2点を結んだ直線上に、j番目の
ライン上の画素を再配置する。
像においては、画素データの抜けた部分が生じる可能性
がある。もし画素データの抜けが生じた場合は、その抜
けの生じた部分の周囲における画素の平均値を求め、こ
の平均値を、その部分の画素データとして用いる。
像データが図14に示すごとく再構成され、この画像デ
ータの歪みが解消され、補正後の画像データが補正画像
バッファ112に書き込まれる。なお、本実施形態で
は、上端から副走査方向画像長の1/3の位置と2/3
の位置とにコントロールポイントを置いたが、コントロ
ールポイントはその位置に限定されるものではない。
の画像処理装置100Bによれば、二次元センサを用い
ることなく、読み取られた画像データのみを用いて画像
データの二次元的な歪みを補正することができる。例え
ば、ハンドヘルド型イメージスキャナ10のスキャン操
作時に図17(B)に示すような二次元的な滑りが生
じ、画像データに図8に示すような歪みが生じたとして
も、その歪みを解消し、歪みの無い高品質の画像データ
を得ることができる。従って、製造コストの増大を招く
ことなく、歪みの無い高品質の画像データを得ることが
できる。
像データ領域および右側の画像データ領域のそれぞれか
ら、副走査方向に適当な間隔(5〜20ライン)dをあ
けてライン画像データが順次抽出され、抽出されたライ
ン画像データどうしの相互相関に基づいて、左側および
右側のずれ量がそれぞれ推定されるので、主走査方向ず
れ量を推定するための計算量が削減されて画像補正処理
を効率的に行なえると同時に、主走査方向ずれ量の計算
精度を向上させることができる。
理してから画像の再構成を行なうことにより、イメージ
スキャナ10に急峻な動きをさせたために生じた、画像
データにおける急峻なずれを適切に解消することがで
き、より高画質の画像データを得ることができる。この
とき、平滑化処理にベジェ曲線〔上式(4)参照〕を用
いることにより、そのベジェ曲線の媒介変数tを用い
て、画像データの再構成を容易に行なうことができる。
さらに、第3実施形態では、画像データである文書画像
を成す文字列の傾きに基づいて、画像データの上下両側
における画像の傾き角度θ,φを容易に求めることがで
きる。
構成を示すブロック図であり、この図18に示すよう
に、第4実施形態の画像処理装置100Cは、第3実施
形態の画像処理装置100Bと同様に構成されている
が、この画像処理装置100Cにおいては、上下領域抽
出部115および傾き検出部116に代えてブロック分
割部118,傾き推定部119,傾きリスト120,検
知部121および境界棄却部122がそなえられてい
る。なお、図中、既述の符号と同一の符号は同一もしく
はほぼ同一の部分を示しているので、その説明は省略す
る。また、本実施形態においても、単に「ずれ量」とい
う場合、その「ずれ量」は主走査方向のずれ量を意味し
ている。
8は、予め指定された分割数(第4実施形態では4また
は5)に応じて、画像バッファ101に格納された画像
データを、副走査方向(上下方向)について複数のブロ
ック(例えば図20の符号BL1〜BL4参照)に分割
するものである。傾き推定部(傾き推定手段)119
は、ブロック分割部118により分割されて得られた各
ブロックの上下両側における画像の傾きを推定するもの
である。
(例えば図20の符号BL1〜BL4参照)のうちの隣
接する2つのブロックの境界(例えば図20の符号b1
〜b3参照)における画像の傾きを、その境界に跨る領
域(例えば図20の符号BLR1〜BLR3参照)に存
在する画像データに基づいてその境界の傾きとして推定
し、傾きリスト120に記録する。このように推定され
た境界(境界bi;i=1,2,3)の傾きは、2つの
ブロックのうちの上側ブロック(ブロックBLi)の下
側における画像の傾き、および、2つのブロックのうち
の下側ブロック(ブロックBLi+1)の上側における画
像の傾きの推定結果として採用される。
(図20の符号BL1参照)の上側における画像の傾き
を、画像データの上側領域(例えば図20の符号BLR
0参照)に存在する画像データに基づいて、最上部の境
界つまり最上ブロックの上側境界(図20の符号b0参
照)の傾きとして推定するとともに、最下ブロック(図
20の符号BL4参照)の下側における画像の傾きを、
画像データの下側領域(例えば図20の符号BLR4参
照)に存在する画像データに基づいて、最下部の境界つ
まり最下ブロックの下側境界(図20の符号b4参照)
の傾きとして推定する。
形態と同様、画像データが文書画像であるものとし、傾
き推定部119は、その文書画像を成す文字列の傾きに
基づいて、各ブロックの上下両側における画像の傾きを
検出するが、その際、第3実施形態と同様、特開平11
−341259号公報に開示された技術を用いている。
傾き推定部119による傾き推定手法については、図2
0を参照しながら後述する。
定部119によって推定された各境界の傾きを、各境界
を特定しうる識別情報に対応付けて格納するものであ
る。検知部(検知手段)121は、傾きリスト120に
格納された複数の境界の傾きに基づいて、直近の他の境
界に対して所定角度以上の角度を成す境界や他の境界と
画像領域内で交差する境界を、傾きを誤って推定された
境界として検知するものである。なお、傾きを誤って推
定された境界の具体例については、図21および図22
を参照しながら後述する。
は、検知部121によって検知された境界を挟む2つの
ブロックを1つのブロックに統合するものである。本実
施形態では、境界棄却部122が、検知部121によっ
て検知された境界(傾きを誤って推定された境界)に対
応する傾きを、傾きリスト120から削除・棄却するこ
とにより、その境界を挟む2つのブロックが1つのブロ
ックに統合されるようになっている。そして、本実施形
態では、上述のごとく誤った傾きを棄却された傾きリス
ト120に基づいて、つまり、統合後のブロックに基づ
いて、ずれ量推定手段200および再構成部117が、
それぞれ、推定処理および再構成処理を実行するように
なっている。
推定手段と同様、上述した第1ラインカウンタ102,
第2ラインカウンタ103,距離メモリ104,相互相
関係数演算部105,最小相互相関係数検出部106,
最小相互相関係数メモリ107,ずれ量カウンタ10
8,最小相互相関係数位置メモリ109および左右領域
抽出部114から構成されている。第4実施形態のずれ
量推定手段200も、基本的には第3実施形態の推定手
段と同様の機能を果たすものであるが、第4実施形態で
は、ブロック分割部118により分割されて得られた各
ブロックBLiの左側および右側の主操作方向ずれ量
を、各ブロックBLi内のライン画像データを成す部分
データ間の相互相関、つまり左側領域W1および右側領
域W2(図9参照)にそれぞれ属するデータ間の相互相
関に基づいて推定するものである。
00においては、ブロックBLi毎に、左右領域抽出部
114によって抽出された左右の領域W1,W2のそれ
ぞれに対して、第1実施形態で前述したずれ量推定(図
3参照)が適用され、ライン画像データの左右両側のず
れ量が、副走査方向に適当な間隔d(例えば5〜20ラ
イン)をあけたライン毎に推定され、その推定結果がず
れ量メモリ110に格納されるようになっている。
は、第3実施形態と同様、ずれ量メモリ110のずれ量
に対し、ベジェ曲線(Bezier curve)を用いた平滑化処
理を施し、平滑化後のずれ量を再構成部117へ出力す
るように構成されている。ただし、第4実施形態の平滑
化処理部113においては、第3実施形態とは異なり、
図23を参照しながら後述するごとく、ブロックBLi
毎に、ベジェ曲線を求める際のコントロールポイント
が、傾き推定部119によって推定され傾きリスト12
0に格納された上下両側における傾きを考慮して決定さ
れる。
と同様、平滑化処理部113によって得られた左右両側
のベジェ曲線(ずれ量)の媒介変数tを用いて、画像デ
ータの再構成を行なうように構成されている。ただし、
第4実施形態の平滑化処理部113および再構成部11
7は、ブロックBLi毎に平滑化処理および再構成処理
を行なうようになっている。
17は、各ブロックBLiについて、ずれ量推定手段2
00によって推定されずれ量メモリ110に格納された
左右両側のずれ量(実際には平滑化処理部113によっ
て得られたベジェ曲線)と、傾き推定部119によって
推定され傾きリスト120に格納された上下両側におけ
る傾きとに基づいて、画像バッファ101における各ブ
ロックBLi内の画像データを再構成し、各ブロックB
Li内の画像データの歪みを解消してから、補正後の各
ブロックBLi内の画像データを補正画像バッファ11
2に書き込むものである。
照しながら後述するごとく、各ブロックBLiについ
て、上下両側の左右端における画像領域の副走査方向接
線と傾き推定部119によって推定された上下両側にお
ける傾きとを直交させるように各ブロックBLi内の画
像データを再構成する。このように第4実施形態におけ
るずれ量推定手段200,平滑化処理部113および再
構成手段117は、各ブロックBLiに対して第3実施
形態の推定手段,平滑化処理部113および再構成手段
117と同様の処理を施すものである。
Cも、第1〜第3実施形態と同様、例えばパーソナルコ
ンピュータ等の情報処理装置によって実現されるもの
で、上述したブロック分割部118,傾き推定部11
9,検知部121,境界棄却部122,ずれ量推定手段
200,平滑化処理部113および再構成部117とし
ての機能は、情報処理装置内のCPUが所定の画像処理
プログラムを実行することにより実現される。また、画
像バッファ101,傾きリスト120,ずれ量メモリ1
10および補正画像バッファ112としての機能は、情
報処理装置内のメモリ(RAM,ROM,ハードディス
ク等)により実現される。
述した第4実施形態の画像処理装置100Cの動作につ
いて説明する。なお、図19は第4実施形態の画像処理
手順を説明するためのフローチャート、図20はブロッ
ク上下両側の画像の傾き(境界の傾き)を推定する手法
を説明するための図、図21および図22は、それぞ
れ、傾きを誤って推定された境界の例を説明するための
図、図23はベジェ曲線のコントロールポイントの選択
例を説明するための図、図24は再構成後のブロックど
うしの連結状態(境界の左右端における連結状態)を説
明するための図、図25〜図27はいずれも第4実施形
態の画像処理手法を説明するための図である。
ンドヘルド型イメージスキャナ10によって得られ画像
バッファ101に格納された画像データ(原画像)が、
例えば図25や図26に示すような文書画像(縦書きの
日本語新聞画像)で、この文書画像に対して画像処理装
置100Cによる補正処理を施す場合について説明す
る。第4実施形態では、図25や図26に示すような二
次元的な歪みの生じた文書画像を補正することができ
る。ここに示す二次元的な歪みは、例えば、スキャン操
作時にイメージスキャナ10が読取対象原稿に対して滑
って蛇行することにより生じている。なお、図25〜図
27において、「○」は文字を示している。また、図2
5〜図27においては、見出し以外の小さな文字(新聞
記事を成す文字)について、左右両側の3行分の文字を
「○」で示し、それ以外の小さな文字の「○」による表
示は省略されている。
31〜S41)に従って、第4実施形態の画像処理手順
を説明する。まず、第4実施形態では、例えば図16に
示したようなハンドヘルド型イメージスキャナ10によ
って所定の文書画像が読み取られ、読み取られた画像デ
ータが画像バッファ101に格納される(ステップS3
1)。その際、第4実施形態では、操作者のスキャン操
作に伴ってイメージスキャナ10が蛇行し、例えば図2
5に示すような画像データ(文書画像)がスキャンされ
たものとする。
め指定された分割情報(分割数)に基づいて、画像バッ
ファ101に格納された画像データが、副走査方向(上
下方向)について複数のブロックに分割される(ステッ
プS32,分割ステップ)。図20に示す例では、分割
数として4が指定された例が示されており、画像データ
は、副走査方向に均等な4つのブロックBL1〜BL4
に分割される。なお、図25に示す例では、分割数とし
て5が指定された例が示されており、画像データは、副
走査方向に均等な4つのブロックBL1〜BL5に分割
されている。
ク分割部118により分割されて得られた各ブロックB
Li(i=1〜4もしくは1〜5)の上下両側における
画像の傾きが推定され傾きリスト120に格納される
(ステップS33,傾き推定ステップ)。その際、第3
実施形態と同様、特開平11−341259号公報に開
示された技術を用いて、つまり、図10,図15(A)
および図15(B)を参照しながら前述した手法に従っ
て、文書画像を成す文字列の傾きに基づいて、各ブロッ
クBLiの上下両側における画像の傾きが検出される。
25に示すように、最上ブロックBL1の上側における
画像の傾きは、ブロックBL1の上半分の領域BLR0
に存在する文字列(画像データ)の傾きに基づいて、最
上部の境界b0の傾きθ0として推定される。また、最
上ブロックBL1の下側における画像の傾きは、ブロッ
クBL1の下半分およびブロックBL2の上半分からな
る領域BLR1に存在する文字列(画像データ)の傾き
に基づいて、ブロックBL1とブロックBL2との境界
b1の傾きθ1として推定される。
は、ブロックB2の上側における画像の傾きとしても採
用される。以下、同様にして、各ブロックB2,B3,
B4,B5の上下両側における画像の傾きが、各境界b
2,b3,b4,b5の傾きθ2〜θ5として推定され
る。なお、最下ブロックBL4またはBL5の下側にお
ける画像の傾きは、ブロックBL4またはBL5の下半
分の領域BLR4またはBLR5に存在する文字列(画
像データ)の傾きに基づいて、最下部の境界b4または
b5の傾きθ4またはθ5として推定される。
120に格納された各境界b0〜b5の傾きθ0〜θ5
に基づいて、傾きを誤って推定された境界が、棄却対象
境界として検知される(ステップS34)。棄却対象の
境界は、直近の他の境界に対して所定角度以上の角度を
成す境界、あるいは、他の境界と画像領域内で交差する
境界である。
他の境界b0の傾きに対して所定角度以上の角度を成す
ものと判断され、この境界b1が棄却対象となる。ま
た、図25に示す例では、境界b4が、直近の他の境界
b3に対して所定角度以上の角度を成すものと判断さ
れ、この境界b4が棄却対象となる。さらに、図22に
示す例では、境界b1が、他の境界b2と画像領域内で
交差するものと判断され、この境界b1が棄却対象とな
る。
の境界が検知されると、境界棄却部122により、棄却
対象の境界を挟む2つのブロックが1つのブロックに統
合される。このとき、境界棄却部122により、棄却対
象の境界に関する情報(識別情報や傾きなど)が傾きリ
スト120から削除・棄却され、その棄却対象の境界を
挟む2つのブロックが1つのブロックに統合される(ス
テップS35)。
関する情報を傾きリスト120から削除・棄却すること
により、ブロックBL1とBL2とが統合され、統合さ
れたブロックが例えばブロックBL1として取り扱われ
る。また、図25および図26に示す例では、境界b4
に関する情報を傾きリスト120から削除・棄却するこ
とにより、ブロックBL4とBL5とが統合され、統合
されたブロックが例えばフロックBL4として取り扱わ
れる。
定してから(ステップS36)、ずれ量推定手段200
により、ブロックBLiについて、左右のずれ量が推定
される(ステップS37,ずれ量推定ステップ)。その
際、左右領域抽出部114によって抽出された、ブロッ
クBLiの左右の領域W1およびW2(部分データ;図
9参照)のそれぞれに対し、第1実施形態で前述したず
れ量推定(図3参照)を適用する。これにより、ブロッ
クBLiを成すライン画像データの左右両側のずれ量が
副走査方向に適当な間隔dをあけたライン毎にそれぞれ
推定され、その推定結果R1およびR2がずれ量メモリ
110に格納される。
通り、ずれ量メモリ110に格納されている左右両側の
ずれ量は、所定間隔をあけたラインどうしのずれ量で、
“−1”もしくは“0”もしくは“1”のいずれか一つ
の値である。ずれ量の推定結果R1およびR2は、図6
(A)と同様、ずれ量メモリ110に格納された、左右
それぞれの主走査方向ずれ量を順次積算することによ
り、原画像に対するずれ量(イメージスキャナ10の動
き)を求め、その結果を副走査方向位置に対応させて得
られたものである。
ックBLiについて、上述のごとく得られたずれ量の推
定結果R1およびR2に対し、ベジェ曲線を用いた平滑
化処理が施され、イメージスキャナ10(ラインセンサ
11)の両端の動きがベジェ曲線で近似される(ステッ
プS38,平滑化ステップ)。
り、一般に上式(4)で表される。ここでは、ブロック
BLiの左側の推定結果R1を近似したベジェ曲線BZ
1のベクトル定数A,B,C,Dは、それぞれA1,B
1,C1,D1として表記され、ブロックBLiの右側
の推定結果R2を近似したベジェ曲線BZ2のベクトル
定数A,B,C,Dは、それぞれA2,B2,C2,D
2として表記されるものとする。そして、図23に示す
ように、ベクトル定数A1,A2は、それぞれブロック
BLiの2つの上側頂点を示すベクトルとして与えら
れ、ベクトルD1,D2は、それぞブロックBLiの2
つの下側頂点(推定結果R1,R2の最下点)を示すベ
クトルとして与えられる。
1,A2),D(D1,D2)間に2点のコントロール
ポイントB(B1,B2)およびC(C1,C2)を決
める必要がある。その際、第4実施形態の平滑化処理で
は、図23に示すように、傾き推定部119によって推
定された上下両側における傾き、つまり境界bi-1およ
びbiの傾きθi-1およびθiを考慮して、コントロー
ルポイントB(B1,B2)およびC(C1,C2)が
決定される。
点A1,D1間の副走査方向距離をLiとし、頂点A1
から距離Li/3だけ離れた副走査方向ラインをk1、
頂点A1から距離2・Li/3だけ離れた副走査方向ラ
インをk2とする。同様に、ブロックBLiの右側頂点
A2,D2間の副走査方向距離をLi´とし、頂点A2
から距離Li´/3だけ離れた副走査方向ラインをk1
´、頂点A2から距離2・Li´/3だけ離れた副走査
方向ラインをk2´とする。なお、Wは、前述した通
り、イメージスキャナ10の読取幅(一定)である。ま
た、ここでは、ブロックBLiの頂点間距離Liまたは
Li´の3分の1の位置にコントロールポイントB(B
1,B2)およびC(C1,C2)を設定しているが、
本発明は、これに限定されるものではない。
対する垂線と副走査方向ラインk1との交点がコントロ
ールポイントB1として決定され、頂点D1を通過する
境界biに対する垂線と副走査方向ラインk2との交点
がコントロールポイントC1として決定される。同様
に、頂点A2を通過する境界bi-1に対する垂線と副走
査方向ラインk1´との交点がコントロールポイントB
2として決定され、頂点D2を通過する境界biに対す
る垂線と副走査方向ラインk2´との交点がコントロー
ルポイントC2として決定される。
を決定することにより、推定結果R1,R2をそれぞれ
近似するベジェ曲線BZ1,BZ2が上式(4)によっ
て与えられ、左右両側のずれ量が平滑化されるととも
に、イメージスキャナ10の左右両端の動きが推定さ
れ、ブロックBLiの外形状が決まる。
ックBLiについて、平滑化処理部113での平滑化処
理結果を受け、平滑化処理部113によって得られた左
右両側のベジェ曲線(ずれ量)の媒介変数tを用いて、
且つ、上下両側の境界bi-1およびbiの傾きθi-1およ
びθiに基づいて、ブロックBLi内の画像データが再
構成され、各ブロックBLi内の画像データの歪みが解
消される。そして、その再構成結果、つまり補正後のブ
ロックBLi内の画像データが補正画像バッファ112
に書き込まれる(ステップS39,再構成ステップ)。
トロールポイントB(B1,B2)およびC(C1,C
2)を設定することにより、再構成部117では、図2
4に示すごとく、ブロックBLiについて、上側左右端
A1,A2における画像領域の副走査方向接線と傾き推
定部119によって推定された上下両側における傾きθ
i-1およびθiをもつ境界bi-1とが直交するように、且
つ、下側左右端D1,D2における画像領域の副走査方
向接線と傾き推定部119によって推定された上下両側
における傾きθiをもつ境界biとが直交するように、
ブロックBLi内の画像データが再構成される。
4または5)に達したか否かを判定し(ステップS4
0)、達している場合(YESルート)には処理を終了
する一方、達していない場合(NOルート)にはパラメ
ータiを1だけインクリメントしてから(ステップS4
1)、ステップS37に戻る。なお、パラメータiが、
境界棄却部122によって棄却された境界に対応するも
のである場合、ステップS37〜S39の処理を省略し
てステップS40へ移行する。
例えば、図25に示すごとくイメージスキャナ10によ
って取り込まれ5分割された後、図26に示すごとく境
界棄却部122によって4つのブロックBL1〜BL4
に統合された画像データは、図27に示すように、ブロ
ックBLi(i=1〜4)毎に再構成されることにな
る。
の画像処理装置100Cによれば、画像データを複数の
ブロックBLiに分割し、ブロックBLi毎にそのブロ
ックBLi内の画像データの再構成を行なうことによ
り、例えばハンドヘルド型イメージスキャナ10で画像
データを読み取った際にこのイメージスキャナ10が蛇
行していたとしても、二次元センサを用いることなく、
イメージスキャナ10により読み取られた画像データの
みを用いて、蛇行に伴う画像データの二次元的な歪みを
補正することができるので、製造コストの増大を招くこ
となく、歪みの無い高品質の画像データを得ることがで
きる。
1,BLiの境界bi-1における画像の傾きが、この境界
bi-1に跨って存在する画像データに基づいて、この境
界bi-1の傾きθi-1として推定され、推定された傾きθ
i-1が、上側ブロックBLi-1の下側における画像の傾
き、および、下側ブロックBLiの上側における画像の
傾きの推定結果として採用される。つまり、一つの境界
bi-1の傾きθi-1を推定することで、上側ブロックBL
i-1の下側傾きと下側ブロックBLiの上側傾きとを同
時に推定することができる。また、上側ブロックBLi-
1の下側傾きと下側ブロックBLiの上側傾きとが、別
々に推定されるのではなく、共通の傾きとして推定され
同一の傾きとなるので、再構成後のブロックBLi-1,
BLiどうしが、副走査方向に隙間なく確実に連結され
ることになる。
界に対して所定角度以上の角度を成す境界や、他の境界
と画像領域内で交差する境界は、その傾きを誤って推定
されたものであると判断し、その誤った境界を挟む2つ
のブロックを1つのブロックに統合することにより、傾
きを誤って推定された境界は棄却されるので、誤った傾
きに基づいて画像再構成が行なわれるのを防止でき、誤
りの少ない画像再構成を行なうことができる。
下側ブロックBLiの上側傾きとが同一の傾きとなるよ
うに推定された場合、各ブロックBLiについて、上下
両側の左右端における画像領域の副走査方向接線と上下
両側における傾きとを直交させるように、そのブロック
BLi内の画像データを再構成する。これにより、再構
成後のブロックどうしを連結した際に、境界の左右端に
おける画像領域の副走査方向接線が滑らかになり、より
高品質の画像データを得ることができる。
像データ領域および右側の画像データ領域のそれぞれか
ら、副走査方向に適当な間隔(5〜20ライン)dをあ
けてライン画像データが順次抽出され、抽出されたライ
ン画像データどうしの相互相関に基づいて、左側および
右側のずれ量がそれぞれ推定されるので、主走査方向ず
れ量を推定するための計算量が削減されて画像補正処理
を効率的に行なえると同時に、主走査方向ずれ量の計算
精度を向上させることができる。
でも、主走査方向ずれ量に対して平滑化処理してから画
像の再構成を行なうことにより、イメージスキャナ10
に急峻な動きをさせたために生じた、画像データにおけ
る急峻なずれを適切に解消することができ、より高画質
の画像データを得ることができる。このとき、平滑化処
理にベジェ曲線〔上式(4)参照〕を用いることによ
り、そのベジェ曲線の媒介変数tを用いて、画像データ
の再構成を容易に行なうことができる。さらに、第3実
施形態と同様、第4実施形態でも、画像データである文
書画像を成す文字列の傾きに基づいて、各ブロックBL
iの上下両側における画像の傾きθi-1およびθiを容
易に求めることができる。
なく、本発明の趣旨を逸脱しない範囲で種々変形して実
施することができる。例えば、上述した実施形態では、
処理対象の画像データが文書画像である場合について説
明しているが、本発明は、これに限定されるものではな
く、罫線やグラフや枠付き画像などを含む画像データで
あれば、上述と同様にして画像データの歪みを解消する
ようにその画像データを補正することができる。
ド型イメージスキャナ10によって得られた画像データ
に対して処理を行なう場合について説明したが、本発明
は、これに限定されるものではなく、何らかの理由によ
り歪みの生じた画像データに対しても適用され、上述と
同様の作用効果を得ることができる。
最初に傾き検出部116により上下領域の画像の傾きを
検出し、上下の傾きに差が無い場合には第1または第2
実施形態にて説明した処理を行なう一方、上下の傾きに
差が有る場合には第3実施形態にて説明した処理を行な
うようにしてもよい。また、第4実施形態では、画像デ
ータの分割数が4または5である場合について説明した
が、本発明はこれに限定されるものではない。
に基づいて該部分データ間のずれ量を推定する推定手段
と、該推定手段によって推定されたずれ量に基づいて、
該画像データにおけるずれを解消するように該画像デー
タを補正する補正手段とをそなえたことを特徴とする、
画像処理装置。
に沿う複数列のライン画像データを副走査方向に配列し
たものであり、該推定手段が、該画像データから、前記
部分データとして一列分のライン画像データを順次抽出
し、抽出された該ライン画像データ間の相互相関に基づ
いて、これらのライン画像データ間の主走査方向ずれ量
を前記ずれ量として推定し、該補正手段が、該推定手段
によって推定された該主走査方向ずれ量に基づいて、主
走査方向ずれを解消するように該画像データを補正する
ことを特徴とする、付記1記載の画像処理装置。
向に適当な間隔をあけて該ライン画像データを順次抽出
し、前記間隔をあけた該ライン画像データどうしの相互
相関に基づいて、該主走査方向ずれ量を推定することを
特徴とする、付記2記載の画像処理装置。 (付記4) 前記間隔が5〜20ラインであることを特
徴とする、付記3記載の画像処理装置。
けた該ライン画像データ間に存在する各ライン画像デー
タのずれ量を、該主走査方向ずれ量に基づき線形補間を
行なって求め、該線形補間の結果に基づいて該画像デー
タを補正することを特徴とする、付記3または付記4に
記載の画像処理装置。 (付記6) 該推定手段により前記間隔で推定された該
主走査方向ずれ量が滑らかな曲線に沿うように、該主走
査方向ずれ量に対して平滑化処理を施す平滑化手段をさ
らにそなえ、該補正手段が、該平滑化手段により平滑化
された該主走査方向ずれ量に基づいて、前記線形補間を
行なうことを特徴とする、付記5記載の画像処理装置。
間の相互相関に基づいて該部分データ間のずれ量を推定
する推定ステップと、該推定ステップで推定されたずれ
量に基づいて、該画像データにおけるずれを解消するよ
うに該画像データを補正する補正ステップとを含むこと
を特徴とする、画像処理方法。
間の相互相関に基づいて該部分データ間のずれ量を推定
する推定手段、および、該推定手段によって推定された
ずれ量に基づいて、該画像データにおけるずれを解消す
るように該画像データを補正する補正手段として、コン
ピュータを機能させることを特徴とする、画像処理プロ
グラム。
間の相互相関に基づいて該部分データ間のずれ量を推定
する推定手段、および、該推定手段によって推定された
ずれ量に基づいて、該画像データにおけるずれを解消す
るように該画像データを補正する補正手段として、該コ
ンピュータを機能させることを特徴とする、画像処理プ
ログラムを記録したコンピュータ読取可能な記録媒体。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理装置であって、該複数列のライン画像データを成
す部分データ間の相互相関に基づいて、該画像データの
左側および右側の主走査方向ずれ量をそれぞれ推定する
推定手段と、該画像データに基づいて、該画像データの
上下両側における画像の傾きをそれぞれ検出する検出手
段と、該推定手段によって推定された該主走査方向ずれ
量と該検出手段によって検出された該傾きとに基づい
て、該画像データを再構成して該画像データの歪みを解
消する再構成手段とをそなえたことを特徴とする、画像
処理装置。
画像データ領域および前記右側の画像データ領域のそれ
ぞれから、前記副走査方向に適当な間隔をあけて該ライ
ン画像データを順次抽出し、前記間隔をあけた該ライン
画像データどうしの相互相関に基づいて、前記の左側お
よび右側の主走査方向ずれ量をそれぞれ推定することを
特徴とする、付記10記載の画像処理装置。
であることを特徴とする、付記11記載の画像処理装
置。 (付記13) 前記間隔で推定された該主走査方向ずれ
量が滑らかな曲線に沿うように、該主走査方向ずれ量に
対して平滑化処理を施す平滑化手段をさらにそなえ、該
再構成手段が、該平滑化手段により得られた曲線に基づ
いて、該画像の再構成を行なうことを特徴とする、付記
11または付記12に記載の画像処理装置。
線が用いられ、該再構成手段が、該ベジェ曲線の媒介変
数を用いて、該画像データの再構成を行なうことを特徴
とする、付記13記載の画像処理装置。 (付記15) 該画像データが文書画像にかかるもので
あり、該検出手段が、前記文書画像を成す文字列の傾き
に基づいて該画像の傾きを検出することを特徴とする、
付記10〜付記14のいずれか一つに記載の画像処理装
置。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理方法であって、該複数列のライン画像データを成
す部分データ間の相互相関に基づいて、該画像データの
左側および右側の主走査方向ずれ量をそれぞれ推定する
推定ステップと、該画像データに基づいて、該画像デー
タの上下両側における画像の傾きをそれぞれ検出する検
出ステップと、該推定ステップで推定された該主走査方
向ずれ量と該検出ステップで検出された該傾きとに基づ
いて、該画像データを再構成して該画像データの歪みを
解消する再構成ステップとを含むことを特徴とする、画
像処理方法。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理機能をコンピュータに実行させるための画像処理
プログラムであって、該複数列のライン画像データを成
す部分データ間の相互相関に基づいて、該画像データの
左側および右側の主走査方向ずれ量をそれぞれ推定する
推定手段、該画像データに基づいて、該画像データの上
下両側における画像の傾きをそれぞれ検出する検出手
段、および、該推定手段によって推定された該主走査方
向ずれ量と該検出手段によって検出された該傾きとに基
づいて、該画像データを再構成して該画像データの歪み
を解消する再構成手段として、該コンピュータを機能さ
せることを特徴とする、画像処理プログラム。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理機能をコンピュータに実行させるための画像処理
プログラムを記録したコンピュータ読取可能な記録媒体
であって、該画像処理プログラムが、該複数列のライン
画像データを成す部分データ間の相互相関に基づいて、
該画像データの左側および右側の主走査方向ずれ量をそ
れぞれ推定する推定手段、該画像データに基づいて、該
画像データの上下両側における画像の傾きをそれぞれ検
出する検出手段、および、該推定手段によって推定され
た該主走査方向ずれ量と該検出手段によって検出された
該傾きとに基づいて、該画像データを再構成して該画像
データの歪みを解消する再構成手段として、該コンピュ
ータを機能させることを特徴とする、画像処理プログラ
ムを記録したコンピュータ読取可能な記録媒体。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理装置であって、該画像データを該副走査方向につ
いて複数のブロックに分割する分割手段と、該分割手段
により分割されて得られた各ブロックの上下両側におけ
る画像の傾きを推定する傾き推定手段と、該分割手段に
より分割されて得られた各ブロックの左側および右側の
主操作方向ずれ量を、各ブロック内のライン画像データ
を成す部分データ間の相互相関に基づいて推定するずれ
量推定手段と、該分割手段により分割されて得られた各
ブロックについて、該ずれ量推定手段によって推定され
た該主走査方向ずれ量と該傾き推定手段によって推定さ
れた上下両側における該傾きとに基づいて、当該ブロッ
ク内の画像データを再構成して当該ブロック内の画像デ
ータの歪みを解消する再構成手段とをそなえたことを特
徴とする、画像処理装置。
のブロックのうちの隣接する2つのブロックの境界にお
ける画像の傾きを、該境界に跨って存在する画像データ
に基づいて該境界の傾きとして推定し、推定された該境
界の傾きを、該2つのブロックのうちの上側ブロックの
下側における画像の傾き、および、該2つのブロックの
うちの下側ブロックの上側における画像の傾きの推定結
果として採用することを特徴とする、付記19記載の画
像処理装置。
された複数の境界の傾きに基づいて、該複数の境界のう
ち、直近の他の境界に対して所定角度以上の角度を成す
境界を検知する検知手段と、該検知手段によって検知さ
れた該境界を挟む2つのブロックを1つのブロックに統
合するブロック統合手段とをさらにそなえ、該ブロック
統合手段による統合後のブロックに基づいて、該ずれ量
推定手段および該再構成手段が、それぞれ、上述した推
定処理および再構成処理を実行することを特徴とする、
付記20記載の画像処理装置。
された複数の境界の傾きに基づいて、該複数の境界のう
ち、他の境界と画像領域内で交差する境界を検知する検
知手段と、該検知手段によって検知された該境界を挟む
2つのブロックを1つのブロックに統合するブロック統
合手段とをさらにそなえ、該ブロック統合手段による統
合後のブロックに基づいて、該ずれ量推定手段および該
再構成手段が、それぞれ、上述した推定処理および再構
成処理を実行することを特徴とする、付記20記載の画
像処理装置。
ブロックについて、上下両側の左右端における画像領域
の副走査方向接線と該傾き推定手段によって推定された
上下両側における該傾きとを直交させるように、当該ブ
ロック内の画像データを再構成することを特徴とする、
付記20〜付記22のいずれか一つに記載の画像処理装
置。 (付記24) 該画像データが文書画像にかかるもので
あり、該傾き推定手段が、前記文書画像を成す文字列の
傾きに基づいて該画像の傾きを推定することを特徴とす
る、付記19〜付記23のいずれか一つに記載の画像処
理装置。
左側の画像データ領域および前記右側の画像データ領域
のそれぞれから、前記副走査方向に適当な間隔をあけて
該ライン画像データを順次抽出し、前記間隔をあけた該
ライン画像データどうしの相互相関に基づいて、前記の
左側および右側の主走査方向ずれ量をそれぞれ推定する
ことを特徴とする、付記19〜付記24のいずれか一つ
に記載の画像処理装置。 (付記26) 前記間隔が5〜20ラインであることを
特徴とする、付記25記載の画像処理装置。
走査方向ずれ量が滑らかな曲線に沿うように、該主走査
方向ずれ量に対して平滑化処理を施す平滑化手段をさら
にそなえ、該再構成手段が、該平滑化手段により得られ
た曲線に基づいて、各ブロック内の画像データの再構成
を行なうことを特徴とする、付記25または付記26に
記載の画像処理装置。 (付記28) 前記平滑化処理にベジェ曲線が用いら
れ、該再構成手段が、該ベジェ曲線の媒介変数を用い
て、各ブロック内の画像データの再構成を行なうことを
特徴とする、付記27記載の画像処理装置。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理方法であって、該画像データを該副走査方向につ
いて複数のブロックに分割する分割ステップと、該分割
ステップで分割されて得られた各ブロックの上下両側に
おける画像の傾きを推定する傾き推定ステップと、該分
割ステップで分割されて得られた各ブロックの左側およ
び右側の主操作方向ずれ量を、各ブロック内のライン画
像データを成す部分データ間の相互相関に基づいて推定
するずれ量推定ステップと、該分割ステップで分割され
て得られた各ブロックについて、該ずれ量推定ステップ
で推定された該主走査方向ずれ量と該傾き推定ステップ
で推定された上下両側における該傾きとに基づいて、当
該ブロック内の画像データを再構成して当該ブロック内
の画像データの歪みを解消する再構成ステップとを含む
ことを特徴とする、画像処理方法。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理機能をコンピュータに実行させるための画像処理
プログラムであって、該画像データを該副走査方向につ
いて複数のブロックに分割する分割手段、該分割手段に
より分割されて得られた各ブロックの上下両側における
画像の傾きを推定する傾き推定手段、該分割手段により
分割されて得られた各ブロックの左側および右側の主操
作方向ずれ量を、各ブロック内のライン画像データを成
す部分データ間の相互相関に基づいて推定するずれ量推
定手段、および、該分割手段により分割されて得られた
各ブロックについて、該ずれ量推定手段によって推定さ
れた該主走査方向ずれ量と該傾き推定手段によって推定
された上下両側における該傾きとに基づいて、当該ブロ
ック内の画像データを再構成して当該ブロック内の画像
データの歪みを解消する再構成手段として、該コンピュ
ータを機能させることを特徴とする、画像処理プログラ
ム。
沿う複数列のライン画像データを副走査方向(上下方
向)に配列してなる画像データに対する処理を行なう画
像処理機能をコンピュータに実行させるための画像処理
プログラムを記録したコンピュータ読取可能な記録媒体
であって、該画像処理プログラムが、該画像データを該
副走査方向について複数のブロックに分割する分割手
段、該分割手段により分割されて得られた各ブロックの
上下両側における画像の傾きを推定する傾き推定手段、
該分割手段により分割されて得られた各ブロックの左側
および右側の主操作方向ずれ量を、各ブロック内のライ
ン画像データを成す部分データ間の相互相関に基づいて
推定するずれ量推定手段、および、該分割手段により分
割されて得られた各ブロックについて、該ずれ量推定手
段によって推定された該主走査方向ずれ量と該傾き推定
手段によって推定された上下両側における該傾きとに基
づいて、当該ブロック内の画像データを再構成して当該
ブロック内の画像データの歪みを解消する再構成手段と
して、該コンピュータを機能させることを特徴とする、
画像処理プログラムを記録したコンピュータ読取可能な
記録媒体。
装置(請求項1),画像処理方法(請求項2)および画
像処理プログラム(請求項3)によれば、二次元センサ
を用いることなく、読み取られた画像データのみを用い
て画像データのずれ(一次元的な歪み)を補正すること
ができるので、製造コストの増大を招くことなく、歪み
の無い高品質の画像データを得ることができる。
ド型イメージスキャナ(一次元ラインセンサ)によって
読み取られたもので、主走査方向に沿う複数列のライン
画像データを副走査方向に配列したものであるとする。
この場合、本発明では、その画像データから順次抽出さ
れたライン画像データ間の相互相関に基づいて、これら
のライン画像データ間の主走査方向ずれ量が推定され、
推定された主走査方向ずれ量に基づいて、主走査方向ず
れを解消するように画像データが補正される。従って、
ハンドヘルド型イメージスキャナのスキャン操作時に主
走査方向(ラインセンサ方向)への滑りが生じ、画像デ
ータに歪み(主走査方向のずれ)が生じたとしても、そ
の歪みを解消し、歪みの無い高品質の画像データを得る
ことができる。
隔をあけて順次抽出されたライン画像データどうしの相
互相関に基づき、主走査方向ずれ量が推定される。人間
が、スキャン操作方向が曲がらないように意識しながら
ハンドヘルド型イメージスキャナの操作を行なった場
合、通常、イメージスキャナを10ライン前後移動させ
た時点で、主走査方向へ1画素程度のずれが発生する可
能性がある。従って、上述のごとく、適当な間隔(例え
ば5〜20ライン)だけ離れたライン画像データどうし
の相互相関に基づいて主走査方向ずれ量の推定を行なう
ことにより、主走査方向ずれ量を推定するための計算量
が削減されて画像補正処理を効率的に行なえると同時
に、主走査方向ずれ量の計算精度を向上させることがで
きる。
データ間に存在する各ライン画像データのずれ量が、主
走査方向ずれ量に基づく線形補間を行なって求められ、
その線形補間の結果に基づいて画像データが補正され
る。これにより、適当な間隔をあけて推定された主走査
方向ずれ量が、各ライン画像データに線形に割り当てら
れ、画像データの補正が滑らかに行なわれる。
らかな曲線に沿うように、その主走査方向ずれ量に対し
て平滑化処理を施してから、前記線形補間を行なうこと
により、イメージスキャナに急峻な動きをさせたために
生じた、画像データにおける急峻なずれを適切に解消す
ることができ、より高画質の画像データを得ることが可
能になる。
によれば、二次元センサを用いることなく、読み取られ
た画像データのみを用いて画像データの二次元的な歪み
を補正することができるので、製造コストの増大を招く
ことなく、歪みの無い高品質の画像データを得ることが
できる。
側の画像データ領域のそれぞれから、副走査方向に適当
な間隔(5〜20ライン)をあけてライン画像データが
順次抽出され、抽出されたライン画像データどうしの相
互相関に基づいて、左側および右側の主走査方向ずれ量
がそれぞれ推定されるので、前述したように、主走査方
向ずれ量を推定するための計算量が削減されて画像補正
処理を効率的に行なえると同時に、主走査方向ずれ量の
計算精度を向上させることができる。
かな曲線に沿うように、その主走査方向ずれ量に対して
平滑化処理してから、画像の再構成を行なうことによ
り、イメージスキャナに急峻な動きをさせたために生じ
た、画像データにおける急峻なずれを適切に解消するこ
とができ、より高画質の画像データを得ることが可能に
なる。このとき、平滑化処理にベジェ曲線を用いること
により、そのベジェ曲線の媒介変数を用いて、画像デー
タの再構成を容易に行なうことが可能になる。
のである場合、その文書画像を成す文字列の傾きに基づ
いて、画像データの上下両側における画像の傾きを容易
に求めることが可能である。
5)によれば、画像データを複数のブロックに分割し、
ブロック毎にそのブロック内の画像データの再構成を行
なうことにより、例えばハンドヘルド型イメージスキャ
ナで画像データを読み取った際にこのイメージスキャナ
が蛇行していたとしても、二次元センサを用いることな
く、上記イメージスキャナにより読み取られた画像デー
タのみを用いて、蛇行に伴う画像データの二次元的な歪
みを補正することができるので、製造コストの増大を招
くことなく、歪みの無い高品質の画像データを得ること
ができる。
における画像の傾きが、この境界に跨って存在する画像
データに基づいて、この境界の傾きとして推定され、推
定された境界の傾きが、2つのブロックのうちの上側ブ
ロックの下側における画像の傾き、および、2つのブロ
ックのうちの下側ブロックの上側における画像の傾きの
推定結果として採用される。つまり、一つの境界の傾き
を推定することで、上側ブロックの下側傾きと下側ブロ
ックの上側傾きとを同時に推定することができる。ま
た、上側ブロックの下側傾きと下側ブロックの上側傾き
とが、別々に推定されるのではなく、共通の傾きとして
推定され同一の傾きとなるので、再構成後のブロックど
うしが、副走査方向に隙間なく確実に連結されることに
なる。
他の境界に対して所定角度以上の角度を成す境界や、他
の境界と画像領域内で交差する境界は、その傾きを誤っ
て推定されたものであると判断し、その誤った境界を挟
む2つのブロックを1つのブロックに統合して処理を実
行する。これにより、傾きを誤って推定された境界は棄
却されるので、誤った傾きに基づいて画像再構成が行な
われるのを防止でき、誤りの少ない画像再構成を行なう
ことができる。
ックの上側傾きとが同一の傾きとなるように推定された
場合、各ブロックについて、上下両側の左右端における
画像領域の副走査方向接線と上下両側における傾きとを
直交させるように、そのブロック内の画像データを再構
成する。これにより、再構成後のブロックどうしを連結
した際に、境界の左右端における画像領域の副走査方向
接線が滑らかになり、より高品質の画像データを得るこ
とができる。
のである場合、その文書画像を成す文字列の傾きに基づ
いて、各ブロックの上下両側における画像の傾きを容易
に求めることが可能である。
構成を示すブロック図である。
フローチャートである。
のフローチャートである。
処理手法を具体的に説明するための図である。
構成を示すブロック図である。
平滑化処理を説明するための図である。
構成を示すブロック図である。
図である。
図である。
の図である。
の図である。
の図である。
の図である。
の図である。
における画像の傾きの検出手法を説明するための図であ
る。
構成を説明すべくその原稿接触面を示す平面図である。
ルド型イメージスキャナによるスキャン領域の例を示す
図である。
の構成を示すブロック図である。
のフローチャートである。
画像の傾き(境界の傾き)を推定する手法を説明するた
めの図である。
れた境界の一例を説明するための図である。
れた境界の他例を説明するための図である。
ロールポイントの選択例を説明するための図である。
どうしの連結状態(境界の左右端における連結状態)を
説明するための図である。
の図である。
の図である。
の図である。
段) 103 第2ラインカウンタ(推定手段,ずれ量推定手
段) 104 距離メモリ(推定手段,ずれ量推定手段) 105 相互相関係数演算部(推定手段,ずれ量推定手
段) 106 最小相互相関係数検出部(推定手段,ずれ量推
定手段) 107 最小相互相関係数メモリ(推定手段,ずれ量推
定手段) 108 ずれ量カウンタ(推定手段,ずれ量推定手段) 109 最小相互相関係数位置メモリ(推定手段,ずれ
量推定手段) 110 ずれ量メモリ 111 線形補間処理部(補正手段) 112 補正画像バッファ 113 平滑化処理部(平滑化手段) 114 左右領域抽出部(推定手段,ずれ量推定手段) 115 上下領域抽出部 116 傾き検出部(検出手段) 117 再構成部(再構成手段) 118 ブロック分割部(分割手段) 119 傾き推定部(傾き推定手段) 120 傾きリスト 121 検知部(検知手段) 122 境界棄却部(ブロック統合手段) 200 ずれ量推定手段
Claims (5)
- 【請求項1】 画像データを成す部分データ間の相互相
関に基づいて該部分データ間のずれ量を推定する推定手
段と、 該推定手段によって推定されたずれ量に基づいて、該画
像データにおけるずれを解消するように該画像データを
補正する補正手段とをそなえたことを特徴とする、画像
処理装置。 - 【請求項2】 画像データを成す部分データ間の相互相
関に基づいて該部分データ間のずれ量を推定する推定ス
テップと、 該推定ステップで推定されたずれ量に基づいて、該画像
データにおけるずれを解消するように該画像データを補
正する補正ステップとを含むことを特徴とする、画像処
理方法。 - 【請求項3】 画像データを成す部分データ間の相互相
関に基づいて該部分データ間のずれ量を推定する推定手
段、および、 該推定手段によって推定されたずれ量に基づいて、該画
像データにおけるずれを解消するように該画像データを
補正する補正手段として、コンピュータを機能させるこ
とを特徴とする、画像処理プログラム。 - 【請求項4】 主走査方向(左右方向)に沿う複数列の
ライン画像データを副走査方向(上下方向)に配列して
なる画像データに対する処理を行なう画像処理装置であ
って、 該複数列のライン画像データを成す部分データ間の相互
相関に基づいて、該画像データの左側および右側の主走
査方向ずれ量をそれぞれ推定する推定手段と、 該画像データに基づいて、該画像データの上下両側にお
ける画像の傾きをそれぞれ検出する検出手段と、 該推定手段によって推定された該主走査方向ずれ量と該
検出手段によって検出された該傾きとに基づいて、該画
像データを再構成して該画像データの歪みを解消する再
構成手段とをそなえたことを特徴とする、画像処理装
置。 - 【請求項5】 主走査方向(左右方向)に沿う複数列の
ライン画像データを副走査方向(上下方向)に配列して
なる画像データに対する処理を行なう画像処理装置であ
って、 該画像データを該副走査方向について複数のブロックに
分割する分割手段と、 該分割手段により分割されて得られた各ブロックの上下
両側における画像の傾きを推定する傾き推定手段と、 該分割手段により分割されて得られた各ブロックの左側
および右側の主操作方向ずれ量を、各ブロック内のライ
ン画像データを成す部分データ間の相互相関に基づいて
推定するずれ量推定手段と、 該分割手段により分割されて得られた各ブロックについ
て、該ずれ量推定手段によって推定された該主走査方向
ずれ量と該傾き推定手段によって推定された上下両側に
おける該傾きとに基づいて、当該ブロック内の画像デー
タを再構成して当該ブロック内の画像データの歪みを解
消する再構成手段とをそなえたことを特徴とする、画像
処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001320620A JP3938859B2 (ja) | 2001-03-23 | 2001-10-18 | 画像処理装置および画像処理プログラム |
US10/093,821 US7010178B2 (en) | 2001-03-23 | 2002-03-11 | Image processing apparatus, image processing method and computer-readable medium on which image processing program is recorded |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001-84335 | 2001-03-23 | ||
JP2001084335 | 2001-03-23 | ||
JP2001320620A JP3938859B2 (ja) | 2001-03-23 | 2001-10-18 | 画像処理装置および画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002354230A true JP2002354230A (ja) | 2002-12-06 |
JP3938859B2 JP3938859B2 (ja) | 2007-06-27 |
Family
ID=26611877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001320620A Expired - Fee Related JP3938859B2 (ja) | 2001-03-23 | 2001-10-18 | 画像処理装置および画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7010178B2 (ja) |
JP (1) | JP3938859B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004077356A1 (ja) * | 2003-02-28 | 2004-09-10 | Fujitsu Limited | 画像結合装置、画像結合方法 |
JP2017111011A (ja) * | 2015-12-16 | 2017-06-22 | キヤノン株式会社 | 位置検出方法、プログラム、位置検出装置、リソグラフィ装置、および物品の製造方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4176364B2 (ja) * | 2002-03-22 | 2008-11-05 | 富士通株式会社 | 画像対応付け装置及び画像対応付け方法並びに画像対応付けプログラム |
JP4333269B2 (ja) * | 2002-11-07 | 2009-09-16 | セイコーエプソン株式会社 | 投影装置の監視システム、投影装置 |
US20050196070A1 (en) * | 2003-02-28 | 2005-09-08 | Fujitsu Limited | Image combine apparatus and image combining method |
US20050276454A1 (en) * | 2004-06-14 | 2005-12-15 | Rodney Beatson | System and methods for transforming biometric image data to a consistent angle of inclination |
JP2012095231A (ja) * | 2010-10-28 | 2012-05-17 | Fujitsu Ltd | 帳票画像管理システム、帳票画像管理方法、及びプログラム |
US10424055B2 (en) * | 2016-05-27 | 2019-09-24 | Canon Kabushiki Kaisha | Image processing apparatus and method for controlling the same |
GB201807598D0 (en) * | 2018-05-10 | 2018-06-27 | Univ Oxford Innovation Ltd | Method and apparatus for use with a scanning apparatus |
CN111652230B (zh) * | 2020-05-25 | 2023-05-12 | 浙江大华技术股份有限公司 | 车牌识别方法、电子设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4897880A (en) * | 1987-02-17 | 1990-01-30 | Soricon Corporation | Data acquisition control method and system for a hand held reader |
US5355146A (en) * | 1990-03-05 | 1994-10-11 | Bmc Micro-Industries Ltd. | Multi-directional hand scanner and mouse |
US5155343A (en) * | 1990-03-28 | 1992-10-13 | Chandler Donald G | Omnidirectional bar code reader with method and apparatus for detecting and scanning a bar code symbol |
US5296690A (en) * | 1991-03-28 | 1994-03-22 | Omniplanar, Inc. | System for locating and determining the orientation of bar codes in a two-dimensional image |
US5850486A (en) * | 1996-04-29 | 1998-12-15 | The Mclean Hospital Corporation | Registration of image data |
JP3876531B2 (ja) | 1998-05-28 | 2007-01-31 | 富士通株式会社 | 文書画像の傾き補正方法 |
US6625331B1 (en) * | 1998-07-03 | 2003-09-23 | Minolta Co., Ltd. | Image forming apparatus |
-
2001
- 2001-10-18 JP JP2001320620A patent/JP3938859B2/ja not_active Expired - Fee Related
-
2002
- 2002-03-11 US US10/093,821 patent/US7010178B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004077356A1 (ja) * | 2003-02-28 | 2004-09-10 | Fujitsu Limited | 画像結合装置、画像結合方法 |
JP2017111011A (ja) * | 2015-12-16 | 2017-06-22 | キヤノン株式会社 | 位置検出方法、プログラム、位置検出装置、リソグラフィ装置、および物品の製造方法 |
Also Published As
Publication number | Publication date |
---|---|
US7010178B2 (en) | 2006-03-07 |
US20020136469A1 (en) | 2002-09-26 |
JP3938859B2 (ja) | 2007-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7263212B2 (en) | Generation of reconstructed image data based on moved distance and tilt of slice data | |
Liang et al. | Geometric rectification of camera-captured document images | |
JP4047352B2 (ja) | 画像歪み補正プログラム,画像歪み補正装置並びに画像歪み補正方法 | |
JP4686552B2 (ja) | 画像リサンプリングを用いた指センサ装置及びこれに関連する方法 | |
US8229184B2 (en) | Method and algorithm for accurate finger motion tracking | |
US8582182B2 (en) | Automatic sizing of images acquired by a handheld scanner | |
US8224043B2 (en) | Fingerprint image acquiring device, fingerprint authenticating apparatus, fingerprint image acquiring method, and fingerprint authenticating method | |
JP4327080B2 (ja) | 画像を復元する方法 | |
US20050196070A1 (en) | Image combine apparatus and image combining method | |
US20160173716A1 (en) | Image processing for handheld scanner | |
US8355592B1 (en) | Generating a modified image with semantic constraint | |
US20160050338A1 (en) | Skew detection | |
EP1555158A2 (en) | Pen strokes localization by m-array decoding and fast image matching | |
US20140292802A1 (en) | Methods and Systems for Correcting a Document Image | |
Zappalá et al. | Document mosaicing | |
KR20120037495A (ko) | 부분 프린트의 엔-와이즈 등록 및 모자이킹을 위한 방법 | |
EP0812505A2 (en) | Image scanning device and method | |
JP3938859B2 (ja) | 画像処理装置および画像処理プログラム | |
US5504847A (en) | Range-image processing apparatus and method | |
US20060215913A1 (en) | Maze pattern analysis with image matching | |
US7079265B2 (en) | Distortion correction device for correcting imaged object to produce plane image without distortion | |
JP4411152B2 (ja) | 指紋読取方法、指紋読取システム及びプログラム | |
JP2019179342A (ja) | 画像処理装置および画像処理方法 | |
JPWO2004077356A1 (ja) | 画像結合装置、画像結合方法 | |
JP4454335B2 (ja) | 指紋入力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070320 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110406 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110406 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120406 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130406 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140406 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |