JP2010244351A - 画像処理装置と処理方法、及び処理プログラム - Google Patents
画像処理装置と処理方法、及び処理プログラム Download PDFInfo
- Publication number
- JP2010244351A JP2010244351A JP2009093219A JP2009093219A JP2010244351A JP 2010244351 A JP2010244351 A JP 2010244351A JP 2009093219 A JP2009093219 A JP 2009093219A JP 2009093219 A JP2009093219 A JP 2009093219A JP 2010244351 A JP2010244351 A JP 2010244351A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- input image
- extracted
- hough transform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims description 41
- 238000003672 processing method Methods 0.000 title claims description 5
- 238000001514 detection method Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 18
- 238000009499 grossing Methods 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 7
- 230000010365 information processing Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 abstract description 2
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 238000012937 correction Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000011946 reduction process Methods 0.000 description 5
- 230000007850 degeneration Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
【課題】 入力画像自体の性質から画像の傾斜角を検出すると共に、検出を高速で行えるようにする。
【解決手段】 入力画像を1/nの縮小画像に縮小し、縮小画像をスムージングし、スムージングした画像からエッジを抽出する。抽出したエッジを二値化し、二値化した画像をハフ変換することにより、複数の直線を抽出する。抽出した複数の直線の傾斜から、入力画像の傾斜角を検出する。
【選択図】 図2
【解決手段】 入力画像を1/nの縮小画像に縮小し、縮小画像をスムージングし、スムージングした画像からエッジを抽出する。抽出したエッジを二値化し、二値化した画像をハフ変換することにより、複数の直線を抽出する。抽出した複数の直線の傾斜から、入力画像の傾斜角を検出する。
【選択図】 図2
Description
この発明は入力画像の傾斜角の検出に関する。
スキャナで画像を読み取ると、画像が僅かに傾斜した状態で読み取られることがある。これを補正するため、原稿用紙の辺などを検出することが行われている。原稿用紙が方形であれは、辺の向きは主走査方向あるいは副走査方向に平行なはずで、これらの方向からのずれは原稿用紙の傾斜を表している。この手法で傾斜を検出できるのはスキャン時に限られるので、蓄積済みの画像や外部から転送された画像の傾斜は検出できない。また原稿用紙の傾斜を検出するので、切り抜きのように用紙が定型でないものは、傾斜を検出できない。さらにハードカバーの書籍を見開きでスキャンすると、カバーは傾斜していないものの、見開いたページが傾斜していることがある。この場合も、傾斜の検出は難しい。これらの問題を解決するには、原稿用紙の傾斜を検出するのではなく、画像自体の傾斜を検出する必要がある。
次に傾斜の検出は高速で行う必要があり、好ましくはスキャナでの画像の読み取りと同期して傾斜角を検出する必要がある。画像自体の性質を利用して、しかも高速で傾斜を検出するのは、簡単なことではない。ここで関連する先行技術を示すと、特許文献1:JPH10-283476Aは、画像中の直線をハフ変換により検出することを記載している。しかしながら特許文献1は、画像の傾斜自体をハフ変換により検出することを示していない。例えば画像中に写真や図形があり、これらに斜線が含まれていれば、ハフ変換により斜線が抽出され、斜線を元に画像の傾斜を検出することは難しい。
この発明の課題は、入力画像自体の性質を用いて、画像の傾斜角を検出すると共に、傾斜角の検出を高速で行えるようにすることにある。
この発明での副次的な課題は、入力画像の解像度によって、傾斜角の検出結果が異ならないようにすることにある。
この発明での副次的な課題は、入力画像の写真部分等に含まれる孤立点が、傾斜角の検出に影響しないようにすることにある。
この発明での副次的な課題は、入力画像の解像度によって、傾斜角の検出結果が異ならないようにすることにある。
この発明での副次的な課題は、入力画像の写真部分等に含まれる孤立点が、傾斜角の検出に影響しないようにすることにある。
この発明の画像処理装置は、
入力画像の傾斜角を検出する装置であって、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小する縮小処理部と、
縮小画像をスムージングするスムージング部と、
スムージングした画像からエッジを抽出するエッジ抽出部と、
抽出したエッジを二値化する二値化部と、
二値化した画像をハフ変換することにより、入力画像中の複数の直線を抽出するハフ変換部と、
ハフ変換により抽出した複数の直線の傾斜から、入力画像の傾斜角を検出する傾斜角検出部、とを備えたことを特徴とする。
入力画像の傾斜角を検出する装置であって、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小する縮小処理部と、
縮小画像をスムージングするスムージング部と、
スムージングした画像からエッジを抽出するエッジ抽出部と、
抽出したエッジを二値化する二値化部と、
二値化した画像をハフ変換することにより、入力画像中の複数の直線を抽出するハフ変換部と、
ハフ変換により抽出した複数の直線の傾斜から、入力画像の傾斜角を検出する傾斜角検出部、とを備えたことを特徴とする。
この発明の画像処理方法は、入力画像中の文字からなる行の傾斜角を検出する方法であって、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小し、
縮小画像をスムージングし、
スムージングした画像からエッジを抽出し、
抽出したエッジを二値化し、
二値化した画像をハフ変換することにより、複数の直線を抽出し、
抽出した複数の直線の傾斜から、入力画像の傾斜角を検出することを特徴とする。
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小し、
縮小画像をスムージングし、
スムージングした画像からエッジを抽出し、
抽出したエッジを二値化し、
二値化した画像をハフ変換することにより、複数の直線を抽出し、
抽出した複数の直線の傾斜から、入力画像の傾斜角を検出することを特徴とする。
この発明の画像処理プログラムは、情報処理装置によって入力画像の傾斜角を検出するために、
前記情報処理装置を、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小する縮小処理部と、
縮小画像をスムージングするためのスムージング部と、
スムージングした画像からエッジを抽出するためのエッジ抽出部と、
抽出したエッジを二値化するための二値化部と、
二値化した画像をハフ変換することにより、複数の直線を抽出するためのハフ変換部と、
ハフ変換により抽出した複数の直線の傾斜から、入力画像の傾斜角を検出するための傾斜角検出部、として機能させる。
この明細書において、画像処理装置に関する記載は画像処理方法や画像処理プログラムにもそのまま当てはまり、逆に画像処理方法に関する記載は画像処理装置や画像処理プログラムにもそのまま当てはまる。入力画像は例えばスキャナで読み取った直後の画像であるが、ファクシミリやファイル転送、e-mailなどで受信した画像、あるいはメモリに蓄積済みの画像でも良い。また直線と線分とは同じ意味である。
前記情報処理装置を、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小する縮小処理部と、
縮小画像をスムージングするためのスムージング部と、
スムージングした画像からエッジを抽出するためのエッジ抽出部と、
抽出したエッジを二値化するための二値化部と、
二値化した画像をハフ変換することにより、複数の直線を抽出するためのハフ変換部と、
ハフ変換により抽出した複数の直線の傾斜から、入力画像の傾斜角を検出するための傾斜角検出部、として機能させる。
この明細書において、画像処理装置に関する記載は画像処理方法や画像処理プログラムにもそのまま当てはまり、逆に画像処理方法に関する記載は画像処理装置や画像処理プログラムにもそのまま当てはまる。入力画像は例えばスキャナで読み取った直後の画像であるが、ファクシミリやファイル転送、e-mailなどで受信した画像、あるいはメモリに蓄積済みの画像でも良い。また直線と線分とは同じ意味である。
この発明では、入力画像中の文字の行に対応する直線、あるいは罫線及び表に含まれる直線をハフ変換により抽出し、これらの直線の向きから、入力画像自体の傾斜を検出する。このため原稿が切り抜きや見開きの場合でも、傾斜を検出できる。
1/n縮小により画像のデータ量は1/n2になり、スムージングによりハフ変換でのノイズを減らし、エッジを抽出することにより、地色の影響を除き、かつ白抜き文字にも対応できる。そしてこれらの処理では、文字の行がなす直線、罫線、及び下線などをエッジとして抽出できる。データ量が少ないので高速でハフ変換ができ、かつハフ変換により、文字の行あるいは罫線などから画像本来の向きを求めて、スキャン時あるいはメモリでの、主走査方向あるいは副走査方向に対する画像の傾斜を検出できる。
1/n縮小により画像のデータ量は1/n2になり、スムージングによりハフ変換でのノイズを減らし、エッジを抽出することにより、地色の影響を除き、かつ白抜き文字にも対応できる。そしてこれらの処理では、文字の行がなす直線、罫線、及び下線などをエッジとして抽出できる。データ量が少ないので高速でハフ変換ができ、かつハフ変換により、文字の行あるいは罫線などから画像本来の向きを求めて、スキャン時あるいはメモリでの、主走査方向あるいは副走査方向に対する画像の傾斜を検出できる。
好ましくは、解像度が既知の入力画像に対して、入力画像の解像度に係わらず、前記縮小処理部は一定の解像度に縮小する。
これによって、入力画像の解像度の違いや、同じ解像度の入力画像に対する縮小率の違いが、傾斜角の検出値に影響しないようにできる。
これによって、入力画像の解像度の違いや、同じ解像度の入力画像に対する縮小率の違いが、傾斜角の検出値に影響しないようにできる。
好ましくは、ハフ変換により、少なくとも入力画像中の文字からなる行に対応する直線を抽出する。表や罫線などで、文字部分以外にも画像本来の向きを表す直線が含まれる場合は、これらの傾斜角を検出しても良い。
プリントされた文字の行を直線と見なすと、その方向は画像本来の向きを表す。そして1/n縮小などでフォントを小さくしても、文字の行からなる直線は失われない。また手書きの場合も、文字の行はある程度互いに平行で、画像本来の向きを表している。そこで文字の行がなす直線の向きを検出すると、画像本来の向きとメモリなどでの主走査方向あるいは副走査方向との角を、傾斜角として検出できる。
プリントされた文字の行を直線と見なすと、その方向は画像本来の向きを表す。そして1/n縮小などでフォントを小さくしても、文字の行からなる直線は失われない。また手書きの場合も、文字の行はある程度互いに平行で、画像本来の向きを表している。そこで文字の行がなす直線の向きを検出すると、画像本来の向きとメモリなどでの主走査方向あるいは副走査方向との角を、傾斜角として検出できる。
好ましくは、スキャナを備え、かつ前記ハフ変換部を複数備えて、二値化した画像のハフ変換を複数のハフ変換部で並列に実行することにより、スキャナで読み込んだ画像をリアルタイムにハフ変換する。
このようにすると、画像のスキャンと同時に傾斜の補正ができ、コピー、送信、転送などの処理を送らせることがない。
このようにすると、画像のスキャンと同時に傾斜の補正ができ、コピー、送信、転送などの処理を送らせることがない。
好ましくは、前記抽出したエッジから、もしくは前記二値化した画像からハフ変換前に、孤立点を除く孤立点除去部を設ける。
孤立点は写真などに多く含まれ、ハフ変換で直線を抽出する際のノイズとなる。そこでハフ変換前に孤立点を除去することにより、偽の直線を抽出する可能性を減らすことができる。
孤立点は写真などに多く含まれ、ハフ変換で直線を抽出する際のノイズとなる。そこでハフ変換前に孤立点を除去することにより、偽の直線を抽出する可能性を減らすことができる。
以下に本発明を実施するための最適実施例を示す。
図1〜図20に、複合機2を例に実施例を示す。4はLANで、6はパーソナルコンピュータで、情報処理装置の例であり、8はルータで、インターネット10と複合機2やパーソナルコンピュータ6を接続する。実施例での傾斜角の検出や補正は複合機2で行うが、パーソナルコンピュータ6などで行っても良く、例えば、複合機2のスキャナ20で読み取った画像をパーソナルコンピュータ6へ転送して、パーソナルコンピュータ6で傾斜角を検出して補正しても良い。
複合機2の構造を説明する。12はLANインターフェースで、14はバス、16は画像メモリで、ページメモリとして画像データを記憶する。メモリ18は汎用のメモリで、プログラムや中間的なデータなどを記憶する。スキャナ20は、原稿用紙から画像を、モノクロのグレイスケールあるいはフルカラーで読み取り、プリンタ22は画像をプリントし、G3ファクシミリ部24は画像のG3ファクシミリ送信と受信とを行う。e-mail部26は、e-mailの添付ファイルとして画像の送受信を行い、ネットワークサーバ部28は、文書管理サーバやリモートプリンタなどとして複合機2を動作させる。ユーザインターフェース30はユーザのマニュアル入力などを受け付け、画像処理部32は種々の画像処理を行う。
スキャンした画像あるいは受信画像もしくは蓄積済みの画像の傾斜角を検出するため、前処理部40とハフ変換部50並びに傾斜角検出部60を設ける。そして検出した傾斜角と反対向きに同じ角度だけ、画像回転部70で画像を回転させ、傾斜を補正する。
図2に前処理部40の構成を示す。画像メモリ16から画像データが縮小処理部41へ入力され、画像の解像度を1/n(nは2以上の自然数で、好ましくは4〜8,特に4〜6)に縮小する。これによって画像データの量は1/n2に減少し、縮小は例えばn×n画素のブロック毎に、画素の値の平均値を求めればよい。またより単純に、縮小処理部41では、n×n画素のブロックの内の代表点、例えばブロックの左上の頂点の、1画素のデータをそのまま出力しても良い。このためハフ変換は、n2倍高速になる。
同じ画像データで、データの内容と解像度は一定でも、縮小処理部41での縮小率が異なると、傾斜角の検出結果が異なることがあった。これに対して同じ原稿を400dpi,600dpi,800dpiなどの異なる解像度で読み取り、これを一定の解像度、例えば100dpiへ縮小すると、傾斜角の検出結果は共通であった。そこでスキャン時の解像度によらず、縮小処理部41で一定の解像度まで解像度を低下させると、解像度の違いによる傾斜角の検出値の差を解消できる。
複合機2でスキャンした画像以外でも、ファクシミリの受信データなどのように、スキャン時の解像度が既知の場合、同様に一定の解像度に画像を縮小する。スキャン時の解像度は、通信のプロトコルあるいは画像ファイルのヘッダなどから判明することが多い。このため、スキャン時の解像度が異なれば縮小率は異なり、縮小画像の解像度を一定にする。なおjpeg画像のようにヘッダに解像度が記載されていない場合、1/4あるいは1/8などの一定の縮小率で、画像を縮小する。
スムージング部42は、平滑化フィルタなどにより縮小画像からノイズを除去し、これによって画像中のランダムなデータをハフ変換によって直線として抽出しないようにする。次にエッジ抽出部43は、スムージング済みの画像から、ラプラシアンフィルタあるいはソーベルフィルタなどのエッジ抽出用フィルタにより、エッジを抽出する。これによって地色の影響が解消し、また白抜きの文字などでも、文字の輪郭に対応するエッジを抽出できる。さらにエッジの抽出により画像のデータ量が小さくなり、ハフ変換が容易になる。
二値化部44は抽出したエッジを二値化する。二値化の閾値は、一定でも良く、あるいは抽出したエッジでの明度もしくはカラー値の分布などから定めても良い。さらに全てのエッジを二値化する必要があるのではなく、例えば画像中の文字部分と、写真部分及び図形部分を判別できる場合、文字部分のみを二値化することが好ましい。
扱う画像データは実施例ではモノクロのグレイスケール画像とするが、RGB画像などでもよい。この場合、RGBデータを、明度画像に変換して傾斜角を検出してもよく、またR,G,Bの各成分毎に傾斜角を検出し、その平均値などを用いてもよい。
孤立点除去部45は二値化画像から孤立点を除去し、二値化前のエッジ画像に対して孤立点を除去しても良い。孤立点の除去によりデータ量が減り、かつ偽の傾斜角を検出する確率が減少する。なお孤立点は写真画像中に特に多く、画像本来の傾きとは無関係なデータである。
縮退処理部46は、孤立点を除去した後の二値化画像に対し、縮退処理を行う。ここに縮退処理とは、上下,左右,斜めなどの方向に有効画素が連続して並んでいる場合に、有効画素をカットする処理のことである。なお有効画素とは二値化画像においてデータのある画素をいい、白であるか黒であるかは問題にしない。縮退処理により線分は例えば1点となる。円や方形、及び十字も1点となる。この結果、画像中の図形部分及び写真部分の斜線は、例えば1点に縮小される。これに対して、文字も縮退によって小さなデータになるが、文字の行がなす直線は失われない。縮退は罫線及び下線を1点に単純化するので、罫線及び下線を傾斜角検出に用いる場合には、縮退処理部46は設けなくても良い。
図3は前処理部40の制御アルゴリズムを示し、このアルゴリズムに従ってパーソナルコンピュータ6を動作させると、この発明を実施できる。ステップ1でスキャナ20により画像を読み取り、ステップ2で一定の解像度へ画像を縮小し、これによってハフ変換の処理速度をn2倍に向上させる。ステップ3でスムージングによりノイズを減らし、ステップ4でエッジを抽出して地色の影響などを除き、また白抜き文字なども検出できるようにする。そしてステップ5で二値化し、ステップ6で孤立点を除く。これによって、写真画像中などの孤立点の、傾斜角の検出への影響を小さくできる。なお孤立点の除去は二値化の前に行っても良い。そして好ましくはステップ7で縮退処理によりデータを単純化し、特に写真部分や図形部分の直線を例えば1点まで単純化する。
ステップ2〜ステップ7の前処理は、画像のスキャンと同期して行い、またハフ変換部50でのハフ変換、傾斜角検出部60での傾斜角の検出、画像回転部70での傾斜角の補正も、スキャンと同期して行えるようにする。ここに同期とは、これらの処理速度がスキャナ20の読み込み速度以上であることを意味し、このようにすると画像のスキャンと同時にリアルタイムに画像の傾斜を補正できる。
図4はハフ変換部50〜画像回転部70の構造を示し、ハフ変換部50は例えば16個〜32個の実行ユニット51を備えて、ハフ変換を並列に実行する。実行ユニット51はρ値計算部52とsinやcosに対するテーブル53とから成る。32個のテーブル53で、0°〜180°をカバーできるように、1個のテーブル53が記憶する角度の範囲は例えば5.625°(180/32)で、角度の刻みは例えば0.176°(180°/1024)などである。ρ値計算部52はテーブル53からsinθやcosθの値を読み出し、縮退処理部46もしくは孤立点除去部45から出力された有効画素の位置(x,y)に対し、ρ値を ρ=xcosθ+ysinθ として計算する。投票テーブル54はθとρの2次元のテーブルで、管理部55は複数の実行ユニット51を管理する。
図5に、ρ値計算部52と投票テーブル54との関係を示す。テーブル54の各点はρとθとの組み合わせを示し、これは線分を表している。仮にρとθとがそれぞれ1024レベルに分割されているものとし、x,yの値が入力されると、θ毎にρの値を計算し、表の該当する位置のデータを1加算する。なおθは180°の範囲を例えば256〜4096レベル、好ましくは1024〜2048レベルに分解し、傾斜角を0.05°〜0.3°、好ましくは0.1°〜0.2°程度の精度で検出できるようにする。またρの分解能は、θの分解能よりも低くても良い。実行ユニット51は例えば32ユニット有り、各ρ値計算部52は32レベル(1024/32)分のθを担当する。その結果、例えば左から3つめのカラムに○で示すように、(ρ,θ)値が投票される。また57はマスクで、テーブル54から有効線(抽出する直線)として抽出済みの点の周囲をマスクし、マスク57の外部から次の有効線が抽出されるようにする。
図4に戻り、有効線抽出部61は投票テーブル54から例えば上位m位の点を抽出する。投票テーブル54で投票数の多い点は、画像での有効線である可能性が高い。そして抽出済みの点の周囲にマスク57を施し、マスク57内からの他の点が抽出されないようにする。候補角抽出部62は、抽出した有効線から傾斜角の候補(k個で例えばm/2個以上)を抽出し、決定部63はこれらの候補角に基づいて傾斜角θdを決定する。決定した傾斜角θdを座標計算部71へ入力し、画像メモリ16の記憶画像の各画素に対し、傾斜補正後の座標(アドレス)を計算する。アドレス生成部72は、傾斜補正前の座標に基づいて、画像メモリ16への読み出しアドレスを生成する。bicubic処理部73は読み出したデータを補間し、傾斜補正後の座標に基づいて、補間後のデータを画像メモリ16へ書き戻す。これらの処理によって、画像メモリ16の画像は、傾斜を補正するように回転する。なお回転には単純なアフィン変換などを用いてもよい。
図6に傾斜角検出部60のアルゴリズムを示し、投票テーブルから上位m位、例えば16位あるいは8位の(ρ,θ)からなる点を抽出する(ステップ11)。そして抽出済みの点の近傍、例えば1辺が5〜40レベルの正方形からなる近傍をマスクし(ステップ12)、同じ近傍内から2点以上が抽出されないようにする。なお最大投票数の1/2以上の投票数のある(ρ,θ)のみを抽出する。従ってm位目の点の投票数が最大投票数の1/2未満の場合はエラーとし、傾斜角の検出を行わず、画像回転部70は画像を回転させない(ステップ13)。ステップ12,13はステップ11を実行するための補助的な処理である。このようにして、他の点の近傍に入らず、かつ最大投票数の1/2以上の点をm個抽出する。1/2以上は例であり、例えば2/3以上あるいは0.4以上などとしても良い。ステップ11〜13が、有効線抽出部61の処理に対応する。
次に傾斜角の候補を求めるための角度をθxとし、その直交角をφxとする。ここに φxは正または0で、かつ φx=θx+π/2 もしくは φx=θx−π/2 である。δを許容範囲とし、例えばδは1°あるいは0.5°などであり、θx±δ及びφx±δの範囲に入る点(ρ,θ)の個数が最大となるように、θxを決定する。そしてθx±δ及びφx±δの範囲に入る点を出力する(ステップ14)。言い換えると、m個の点に対し、角度θ成分が±δの範囲で一致する点の数が最大となる角度をθxとする。なお単純にθ成分が±δの範囲で一致する点の数を問題とする代わりに、θx±δ及びφx±δの範囲に入る点に対する、投票数の和が最大となるようにしても良い。そしてこれらの点の数kが閾値未満の場合、例えばm/2未満もしくはm/3未満の場合、ステップ15でエラーとする。エラーの場合、傾斜角の検出を行わず、画像回転部70は画像を回転させない。ステップ14,15が、候補角抽出部62の処理に対応する。
ステップ16は決定部63の処理に対応し、ステップ14で求めたk個の点(ρ,θ)に対し、例えばθの単純平均値を傾斜角θdとして出力する。あるいはk個の点でのθの加重平均を用い、重みには投票数viを用いても良い。これらに代えて、k個のθの候補θ1〜θkの中で、投票数viが最大のθを傾斜角θdとしてもよい。ステップ16ではθdを出力し、θdがπ/2を越える場合、θd−π/2、即ちφdを出力する。
図7〜図20に実施例の動作を示す。図7の上部は原稿画像を示し、画像中の文字の列を直線と見なして、その傾斜を検出する。従って実施例の目的は、図7の上部の画像を図7の下部の画像に変換し、これに対するハフ変換を行うことにある。
図8は入力画像(画像メモリ16の画像)を、縮小もスムージングもエッジ抽出も行わずに、直接二値化した例を示し、円でマークしたように、文字以外の写真部分などの黒画素(この場合の有効画素)が多くなり、ハフ変換の負担が増すと共に、写真中の斜線などの影響が強くなり、検出精度が低下する。そこで入力画像をグレースケールで取り扱い、縮小、スムージング、エッジ抽出等の画像処理を施した後に、二値化する。ハフ変換を高速で行うため、入力画像を1/nに縮小し、これによって以降の計算時間を1/n2に減少させる(図9)。
次にスムージングによりノイズを除去し(図10)、エッジを抽出すると図11の画像が得られる。エッジの抽出により、地色の影響が無くなり、また白抜き文字にも対応でき、さらにデータを単純化して、ハフ変換を容易にする。
図12に、エッジの抽出フィルタ80を示す。被処理画像81に対し、フィルタ80を左上側から適用することにより、被処理画像81の下側と右側のエッジ82を抽出する。これによって被処理画像81のエッジ全体を検出する場合に比べ、エッジの量を1/2にできる。以上のように、好ましくは、上下左右4種類のエッジの内で、下と右、下と左、上と右、上と左のように、2種類のエッジを抽出する。
エッジ抽出後の画像を二値化すると、図13の画像が得られる。図13の画像から孤立点を除去すると、図14の画像が得られる。なお孤立点の除去は、図11のエッジの画像に対して行っても良い。図13,図14のように、図形部分の線あるいは写真部分の線が残っていると、傾斜角の誤検出の原因となる。そこで縮退処理を行うと図15の画像が得られ、写真や図形中の線は単なる点あるいは短い線分などに変換され、文字の列からなる行は基本的に保存される。
そこで縮退処理後の画像に対しハフ変換を行うことにより、文字の行から成る直線のみを検出できる。ただし罫線を伴う画像に対し、罫線の向きを傾斜の検出に用いたいことがある。この場合、縮退処理は不要である。
ハフ変換により投票テーブルにデータが蓄積され、投票テーブルから投票数が最大の点のみを単純に取り出すと、誤った検出が行われることがある。図16はこのような例を示し、図16では画像の一部のみを表示するので、「最大投票直線」がどこから抽出されたのか分かり難いが、画像中の写真部分等から抽出されたものである。このため投票数が上位の点を複数抽出する。ここで単純に上位m位までの点を抽出すると、投票テーブル内での近傍の点が複数抽出されることが多い。そこで投票テーブル54から最上位の点を抽出し、抽出した点の近傍をマスクして次の投票数の点を抽出することにより、抽出済みの点の近傍の点を抽出しないようにする。このようにして、上位m位の点を抽出する。ここで抽出した上位m位のうち、最下位の点が最上位の点の例えば1/2以上の投票数を持たない場合、検出をエラーとする。文字から成る行を抽出している場合、最大投票数の点と、上からm位の点とで、投票数に余り大きな差はないはずである。これにもかかわらず大きな差があるのは、最上位の点が図形中の直線部分などである可能性が高い。あるいはまた、上位m位(例えば16位)のうちから、最上位の点に対して所定の割合以上(例えば1/2以上)の投票数を持つ点を抽出し、抽出した点の数が所定値k(例えば4)以下の場合は、エラーとして傾斜角を未検出としても良い。
図18に投票テーブルの状況を模式的に示し、ここでは投票数を明度で表している。そして選択済みの点の近傍を、黒い四角形のマスクで覆っている。図18では上位8点を抽出済みである。
抽出された上位m位の点に対し、傾斜角を決定する。この手続を図19,図20に模式的に示し、ここではmは例えば8とする。文字の行を検出している場合、文字ブロックの上下の列も同時に検出できるので、傾斜角θdと、その直交角φdとに意味がある。また候補を抽出する際の許容誤差をδ(0.5°あるいは1°程度)とし、角θx±δと φx±δの範囲内に入る点の数kが最大となるように、θxを決定する。ここでどの角度に対してもkの値が閾値(例えばm/2)未満の場合、例えばエラーとする。閾値以上の点を含む角θxが得られた場合、含まれる点の角度の単純加算平均、あるいは加重平均などにより、候補角を決定する。これは図6のステップ16の処理である。
以上のようにして傾斜角θdを例えば±0.1°程度の精度で決定すると、画像回転部70により画像を回転させて傾斜を補正する。画像の回転自身は単純な処理であり、例えばスキャンと同期して実行できる。
実施例では傾斜角の回転と補正とを複合機2の内部で行う例を示したが、パーソナルコンピュータ6などで行っても良い。その場合、実施例の画像処理プログラムをパーソナルコンピュータなどの情報処理装置で実行すると、情報処理装置はこの発明の画像処理装置となる。
本の見開きの傾斜を検出する場合、例えばスキャン前に原稿の種類が見開きであることを入力すると、左右別々の傾斜角を検出できる。あるいは入力画像を左右に分割して、傾斜角を求め、左右の傾斜角が異なると、見開きの画像であると推定しても良い。
本の見開きの傾斜を検出する場合、例えばスキャン前に原稿の種類が見開きであることを入力すると、左右別々の傾斜角を検出できる。あるいは入力画像を左右に分割して、傾斜角を求め、左右の傾斜角が異なると、見開きの画像であると推定しても良い。
2 複合機
4 LAN
6 パーソナルコンピュータ
8 ルータ
10 インターネット
12 LANインターフェース
14 バス
16 画像メモリ
18 メモリ
20 スキャナ
22 プリンタ
24 G3ファクシミリ部
26 e-mail部
28 ネットワークサーバ部
30 ユーザインターフェース
32 画像処理部
40 前処理部
41 縮小処理部
42 スムージング部
43 エッジ抽出部
44 二値化部
45 孤立点除去部
46 縮退処理部
50 ハフ変換部
51 実行ユニット
52 ρ値計算部
53 テーブル
54 投票テーブル
55 管理部
56 データ
57 マスク
60 傾斜角検出部
61 有効線抽出部
62 候補角抽出部
63 決定部
70 画像回転部
71 座標計算部
72 アドレス生成部
73 bicubic処理部
80 フィルタ
81 被処理画像
82 エッジ
4 LAN
6 パーソナルコンピュータ
8 ルータ
10 インターネット
12 LANインターフェース
14 バス
16 画像メモリ
18 メモリ
20 スキャナ
22 プリンタ
24 G3ファクシミリ部
26 e-mail部
28 ネットワークサーバ部
30 ユーザインターフェース
32 画像処理部
40 前処理部
41 縮小処理部
42 スムージング部
43 エッジ抽出部
44 二値化部
45 孤立点除去部
46 縮退処理部
50 ハフ変換部
51 実行ユニット
52 ρ値計算部
53 テーブル
54 投票テーブル
55 管理部
56 データ
57 マスク
60 傾斜角検出部
61 有効線抽出部
62 候補角抽出部
63 決定部
70 画像回転部
71 座標計算部
72 アドレス生成部
73 bicubic処理部
80 フィルタ
81 被処理画像
82 エッジ
Claims (7)
- 入力画像の傾斜角を検出する装置であって、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小する縮小処理部と、
縮小画像をスムージングするスムージング部と、
スムージングした画像からエッジを抽出するエッジ抽出部と、
抽出したエッジを二値化する二値化部と、
二値化した画像をハフ変換することにより、入力画像中の複数の直線を抽出するハフ変換部と、
ハフ変換により抽出した複数の直線の傾斜から、入力画像の傾斜角を検出する傾斜角検出部、とを備えたことを特徴とする画像処理装置。 - 解像度が既知の入力画像に対して、入力画像の解像度に係わらず、前記縮小処理部は一定の解像度に縮小することを特徴とする、請求項1に記載の画像処理装置。
- ハフ変換により、少なくとも入力画像中の文字からなる行に対応する直線を抽出することを特徴とする、請求項1または2に記載の画像処理装置。
- スキャナを備え、かつ前記ハフ変換部を複数備えて、二値化した画像のハフ変換を複数のハフ変換部で並列に実行することにより、スキャナで読み込んだ画像をリアルタイムにハフ変換するようにしたことを特徴とする、請求項1〜3のいずれかに記載の画像処理装置。
- 前記抽出したエッジから、もしくは前記二値化した画像からハフ変換前に、孤立点を除く孤立点除去部を設けたことを特徴とする、請求項1〜4のいずれかに記載の画像処理装置。
- 入力画像中の文字からなる行の傾斜角を検出する方法であって、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小し、
縮小画像をスムージングし、
スムージングした画像からエッジを抽出し、
抽出したエッジを二値化し、
二値化した画像をハフ変換することにより、複数の直線を抽出し、
抽出した複数の直線の傾斜から、入力画像の傾斜角を検出することを特徴とする、画像処理方法。 - 情報処理装置によって入力画像の傾斜角を検出するために、
前記情報処理装置を、
入力画像の解像度を1/n(nは2以上の自然数)に低下させることにより、入力画像を縮小画像に縮小する縮小処理部と、
縮小画像をスムージングするためのスムージング部と、
スムージングした画像からエッジを抽出するためのエッジ抽出部と、
抽出したエッジを二値化するための二値化部と、
二値化した画像をハフ変換することにより、複数の直線を抽出するためのハフ変換部と、
ハフ変換により抽出した複数の直線の傾斜から、入力画像の傾斜角を検出するための傾斜角検出部、として機能させる画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009093219A JP2010244351A (ja) | 2009-04-07 | 2009-04-07 | 画像処理装置と処理方法、及び処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009093219A JP2010244351A (ja) | 2009-04-07 | 2009-04-07 | 画像処理装置と処理方法、及び処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010244351A true JP2010244351A (ja) | 2010-10-28 |
Family
ID=43097298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009093219A Pending JP2010244351A (ja) | 2009-04-07 | 2009-04-07 | 画像処理装置と処理方法、及び処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010244351A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016085763A (ja) * | 2016-02-17 | 2016-05-19 | 株式会社メガチップス | 直線検出装置および直線検出方法 |
-
2009
- 2009-04-07 JP JP2009093219A patent/JP2010244351A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016085763A (ja) * | 2016-02-17 | 2016-05-19 | 株式会社メガチップス | 直線検出装置および直線検出方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2010116774A1 (ja) | 画像処理装置と処理方法、処理プログラム、及び記憶媒体 | |
EP2288135B1 (en) | Deblurring and supervised adaptive thresholding for print-and-scan document image evaluation | |
US7650041B2 (en) | System and method for optical character recognition in an image | |
JP4358193B2 (ja) | 画像対象の自動切抜き方法 | |
US7965894B2 (en) | Method for detecting alterations in printed document using image comparison analyses | |
JP4240107B2 (ja) | 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム | |
RU2631765C1 (ru) | Способ и система исправления перспективных искажений в изображениях, занимающих двухстраничный разворот | |
US20120243785A1 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
JP4419269B2 (ja) | 二次元コード抽出方法 | |
JP5042917B2 (ja) | 画像処理装置およびプログラム | |
JP3698136B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2009015820A (ja) | 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体 | |
US8064636B2 (en) | Image processing apparatus and method of controlling the same | |
JP4362537B2 (ja) | 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体 | |
JP2003099788A (ja) | 画像処理装置 | |
US7715620B2 (en) | Color form dropout using dynamic geometric solid thresholding | |
JP5477541B2 (ja) | 画像処理装置と処理方法、及び処理プログラム | |
JP5477542B2 (ja) | 画像処理装置と処理方法、及び処理プログラム | |
JP2010244351A (ja) | 画像処理装置と処理方法、及び処理プログラム | |
JP4208520B2 (ja) | 画像処理装置および画像処理方法、プログラムおよび記憶媒体 | |
US9886648B2 (en) | Image processing device generating arranged image data representing arranged image in which images are arranged according to determined relative position | |
JP2010244353A (ja) | 画像処理装置と処理方法、及び処理プログラム | |
US20090016613A1 (en) | Image processing apparatus, image processing method, and computer program product | |
CN107680046A (zh) | 影像矫正方法、装置、存储介质和计算机设备 | |
JP2022162474A (ja) | 画像処理システム、画像処理方法、及びプログラム |