JP3303246B2 - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP3303246B2
JP3303246B2 JP36027392A JP36027392A JP3303246B2 JP 3303246 B2 JP3303246 B2 JP 3303246B2 JP 36027392 A JP36027392 A JP 36027392A JP 36027392 A JP36027392 A JP 36027392A JP 3303246 B2 JP3303246 B2 JP 3303246B2
Authority
JP
Japan
Prior art keywords
histogram
skew angle
skew
column
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP36027392A
Other languages
English (en)
Other versions
JPH06203202A (ja
Inventor
公一 江尻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP36027392A priority Critical patent/JP3303246B2/ja
Publication of JPH06203202A publication Critical patent/JPH06203202A/ja
Application granted granted Critical
Publication of JP3303246B2 publication Critical patent/JP3303246B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識などに利用さ
れ、読取った画像に対して切出し処理やスキュー検出,
補正処理等の処理を行なう画像処理装置に関する。
【0002】
【従来の技術】読取った文書画像から領域の切り出しを
行ない文書上の画像の種類や性質を自動判別したりする
OCR装置(光学文字認識装置)などの画像処理装置が
知られている。この種の装置では、領域の切り出しや文
字認識等が正しく行なわれるための前提として、画像が
傾きのない状態,すなわちスキューのない状態である必
要があり、スキューのある状態で読取られたときには、
スキューを補正する必要がある。
【0003】従来では、スキューの検出,補正を行なう
のに種々の技術が提案され開発されてきた。その代表的
なものにフーリエ変換法がある。例えば、文献「電子通
信学会論文誌 Vol.J65-D(2),第298〜299頁」
(以下、従来例1と称す)には、全画面を画素単位で2
次元フーリエ変換しその絶対値のピークが文字行と直交
する方向に存在することを見出している。また、文献
「電子通信学会論文誌 Vol.J66-D(1),第111〜11
8頁」(以下、従来例2と称す)では、いくつかのスキ
ュー補正法が検討されており、その結果、回転と投影を
組み合わせた方法が提案されている。また、文献「電子
通信学会論文誌 Vol.J69-D(11),第1833〜1834
頁」(以下、従来例3と称す)においては、連結要素を
矩形で表現し、これを種々の方向に投影し、そのピーク
値をとることが提案されている。また、文献「IBM Tech
nical Disclosure Bullentin, Vol.28(8),(1986),第
3667頁」(以下、従来例4と称す)においては、微
分などで得た線要素を極座標空間に変換するHough変換
を施した後、極座標上で最大値を見つけるという方法を
利用している。文献「Machine Vision and Application
s,(1989),2;第141〜153頁」(以下、従来例5
と称す)においても、上記従来例4と同様の方法をとっ
ている。これに対し、文献「proceeding of SPSE 40th
Conference Symposium Hybrid Imaging System,第21
〜24頁」(以下、従来例6と称す)では、英語文書中
の文字の中央底点を基準と定義し、角度xの方向にこの
基準点を射影し、この最大値を持つ角度xをスキュー角
度としている。一方、文献「電子通信学会論文誌 D,Vol
J71-D(7),第1296〜1305頁 (1988)」(以下、
従来例7と称す)においては、文書画像中の水平線/垂
直線のランを利用したスキュー検出が提案されている。
また、文献「10th International Conference on Patte
rn Recognition, 1990(June),第8〜13頁」(以下、
従来例8と称す)においては、連結成分抽出後にHough
変換と連結成分の傾斜角度別頻度分布をとり、この最大
値を与える角度によってスキューの検出を試みている。
【0004】
【発明が解決しようとする課題】このように、従来にお
いて、種々のスキュー検出,補正の仕方が提案されてい
るが、現状では、これらのいずれも満足する結果が得ら
れていない。すなわち、従来例1では、行間隔が一定と
いう制約条件があり、また、フーリエ変換を用いるた
め、演算量が多いという欠点があった。また、従来例
2,従来例3では、演算量が多く、また、その精度が最
初の回転変換の最小回転ステップに依存するという問題
があった。また、文字行が画面内のどこにあるかもわか
らない場合が多いので、この方法を自動的に適用するの
は難かしいという欠点があった。また、従来例4,従来
例5では、演算量が多く、また、検出精度が低いという
欠点があった。また、従来例6は、高精度ではあるが、
異なる行間隔のコラムが同一ペ−ジに存在するときは必
ずしも正しい結果を与えず、また、行の方向が不明の場
合も問題があった。また、従来例7では、文字行が少な
過ぎたり、行の間隔が空き過ぎている場合に、検出が困
難になるという欠点があった。また、従来例8の方法
は、従来の各種方法の中で最も実用性が高いが、原画像
が多段組みの場合には、傾斜角度を誤まって検出する可
能性があるのみならず、Hough変換が文字以外の印刷画
像に適用される場合、ノイズの影響を受け易く、これを
排除する特別な処理が必要となるなどの欠点があった。
【0005】本発明は、上述した従来の欠点を克服し、
少ない演算量,データ数でスキュー角の検出,補正を容
易にかつ安定して効率良く確実に行なうことの可能な画
像処理装置を提供することを目的としている。さらに本
発明では、対象とする文書画像が縦書きであるか、ある
いは横書きの文書を90度回転して読み取らせたかどう
かにかかわらず、そのスキュー角を正しく求めることの
可能な画像処理装置を提供することを目的としている。
【0006】
【課題を解決するための手段および作用】上記目的を達
成するために、請求項1,請求項2記載の発明は、所定
の文書画像において所定画素の連結成分に対して矩形領
域を設定する矩形領域設定手段と、文書画像中の前記連
結成分に対してそれぞれ矩形領域を設定した後、文書画
像内で矩形領域の端点の座標値の所定方向への射影をと
、該射影のヒストグラムを求めるヒストグラム算出手
段と、前記射影のヒストグラムのピーク値を求め、該ピ
ーク値文書の欄(コラム)の端点として検出するコラ
ム検出手段と、前記コラム検出手段によって前記射影の
ヒストグラムのピーク値がコラムの端点として検出され
たときに、該コラムの端点からある制限された範囲内の
矩形領域のみを用いてスキュー角を求めるスキュー角検
出手段とを備えていることを特徴としている。これによ
り、文書画像が多段組の場合でも、スキュー角を少ない
演算量,計算コストで容易にかつ安定して確実に検出す
ることができる。
【0007】
【0008】また、請求項3記載の発明は、前記スキュ
ー角に基づき、連結領域を表わす矩形の座標値に所定の
演算を加え、前記矩形領域に前記スキュー角だけ傾いて
内接する新たな矩形を求めることにより、見かけ上、正
規なスキュー補正を行なうことを特徴としている。これ
により、文書画像が多段組の場合でも、スキュー補正を
少ない演算量,計算コストで、容易にかつ安定して効率
良く確実に行なうことができる。
【0009】
【0010】
【0011】また、請求項4記載の発明は、スキュー角
度の算出に際して、矩形の射影ヒストグラムのピーク値
の信頼性を、ヒストグラムの統計量から判定し、ある信
頼度を付してスキュー角度を決定するようになっている
ことを特徴としている。これにより、検出されたスキュ
ー角がどの程度の信頼性を有しているかを客観的に判断
することができる。
【0012】
【実施例】以下、本発明の一実施例を図面に基づいて説
明する。図1は本発明に係る画像処理装置の一実施例の
構成図である。図1を参照すると、本実施例の画像処理
装置は、処理対象となる原画像に2値化処理を施す2値
化処理部1と、2値化画像に所定の倍率変換を施す倍率
変換部2と、倍率変換後の画像において所定画素の連結
性を調べながらパターンの連結成分を抽出する連結成分
抽出部3と、連結成分抽出部3により抽出された連結成
分に対して矩形領域を設定する矩形領域設定部4と、画
像中の各連結成分に対してそれぞれ矩形領域を設定した
、矩形領域の端点の座標値を所定方向にそれぞれ射影
し、射影のヒストグラムを求めるヒストグラム算出部5
と、ヒストグラム算出部5で求めた射影のヒストグラム
に基づき、文書の欄(コラム)を検出するコラム検出処
理部6と、コラム検出処理部6でコラムが検出されたと
きに、該コラムの端点からある制限された範囲内の矩形
領域を用いてスキュー角を検出するスキュー角検出部7
と、スキュー角が検出されたとき、該スキュー角に基づ
いてスキューを補正するスキュー補正部8とを有してい
る。
【0013】ここで、スキュー角検出部17は、上記制
限された範囲内に存在する矩形領域の組について、その
傾斜角についてのヒストグラム(並び)を求め、このヒ
ストグラム(並び)最大となる角度をスキュー角とし
て検出するようになっている。
【0014】また、スキュー補正部8は、スキュー角検
出部7において、スキュー角が検出された後、連結要素
を囲む矩形領域に対して、所定の数学的演算によって、
上記スキュー角だけ傾いて上記矩形領域に内接する矩形
を求め、これをスキュー補正された矩形とみなすように
なっている。すなわち、スキュー補正部8は、前記スキ
ュー角に基づき、連結領域を表わす矩形の座標値に所定
の演算を加え、前記矩形領域に前記スキュー角だけ傾い
て内接する新たな矩形を求めることにより、見かけ上、
正規なスキュー補正を行なうようになっている。しかる
後、必要に応じて、このスキュー補正された矩形の端点
を表わす座標値に例えばアフィン変換等の回転処理を施
して回転補正を行なうことができる。
【0015】次にこのような構成の画像処理装置の処理
動作を図2のフローチャートを用いて説明する。例えば
文書原稿をイメージスキャナなどの読取装置で読取ると
き、原稿送り機構などの調整等が完全でないような場
合、文書原稿は傾いて読取られ、その読取文書画像は一
般に理想状態から所定の傾き角度でスキューしている。
本実施例の画像処理装置では、先づ、読取られた文書画
像に対して2値化処理部1において2値化処理を施し、
これを黒と白の画素からなる2値画像に変換する(ステ
ップS1)。なお、通例、文書原稿等に対する読取密度
は、1インチ当り200乃至400ドット(dpi)で
ある。また、2値画像では、通常、印刷部分が“1”
(黒)、白地部分が“0”(白)で表わされる。
【0016】ところで、200乃至400dpiの読取
密度は文字認識や画像処理には適した密度であるが、領
域識別の目的には多過ぎる。そのため、倍率変換部2で
は、2値画像を例えば縦横1/8に縮小する(ステップ
S2)。すなわち、2値画像をOR論理あるいはサンプ
リング手法によって、水平方向,垂直方向の両方向に1
/8に縮小し、その解像度を1/8にする。なお、この
例では、縮小率を1/8にしたが、他の縮小率で縮小す
ることもできる。但し、縮小率1/8はバイト単位の処
理で容易に実現できるので、処理速度の面からも有利で
ある。
【0017】このようにして、2値画像を縮小した後、
この縮小画像上で、黒画素の連結性を調べながら、パタ
ーンの連結成分を抽出する(ステップS3)。この処理
には既知の種々の方法を用いることができるが、本実施
例においては、黒ランの連結性を調べ、黒ランの連結成
分に同一識別子を付し、同一識別子の中で座標値の最大
/最小値を求める。この座標値が1つの連結成分を囲む
矩形領域の対角点の座標となる。従って、この対角点の
座標値により、1つの連結成分に対して1つの矩形領域
を設定することができる(ステップS4)。このように
して、縮小画像上で、各連結成分に対してそれぞれ矩形
領域を設定した後、矩形領域の端点の座標値を所定方向
に射影し、この射影のヒストグラムを求める(ステップ
S5)。この処理についてより具体的に説明すると、連
結成分を表現する矩形領域は例えば、後述のように図6
に符号Aとして示されている。本実施例では矩形領域を
対角線上の2つの端点で特定するようにしており、従っ
て図6の例では矩形領域は、2つの端点の座標値,すな
わち(Xu,Yu)と(Xd,Yd)とで表わされる。
この例の場合、ステップS5では、矩形の2つの端点の
うちの一方の端点の座標値,例えば(Xu,Yu)を垂
直方向(X座標軸)および/または水平方向(Y座標
軸)に投影し、この射影のヒストグラムを求める。しか
る後、この射影のヒストグラムのピーク値をとる座標値
を文書の欄(コラム)の端点として検出する(ステップ
S6)。
【0018】一般に、傾いて読取られた文書画像は、図
3に示すように、連結成分を示す矩形領域が大きくなる
と同時に、その並び方もずれている。ここで、矩形領域
は図4に示すように、ある場合は文字に対して設定さ
れ、ある場合は単語に対して設定され、またある場合は
複数の単語に対して設定される。矩形領域の行方向の長
さは1行の1/3以下が望ましい。
【0019】次表には文書画像が多段組の欄(コラム)
を含むような場合に、多段組の各欄(コラム)の端点を
検出する処理,スキュー角を求める処理の具体例として
模擬コードを用いたプログラムリストが示されている。
【0020】
【表1】
【0021】表1のプログラムリストにおいて、Buff S
izeは本プログラムで参照する座標値の数(バッファサ
イズ)であり、例えば“200”と仮定される。また、
Column widthは対象とする文書画像の中で考えられうる
最小の段の幅であり、例えば原稿幅の1/5と仮定され
る。また、模擬コード中の行番号“003”と“00
”行とにおけるfind column(Column start)は、欄
(コラム)の端点(この例ではコラムの始まり)を見つ
ける命令であり、この命令によって文書中の段組領域の
左端のx座標“Column start”を見つけることができ
る。すなわち、このfind columnによって、読み取られ
た最新の矩形領域の座標値“Buff Size”個の中で、垂
直方向の射影のヒストグラム(実際のプログラムでは水
平方向の射影のヒストグラムも同時に計算)がピーク値
を示す値を段の端点(この例では段の左端)とみなすこ
とができる。
【0022】なお、原稿の中に文字行が少ないときは、
予め設定したBuff Sizeに矩形の数が足りないことがあ
る。このような場合にも適用させるため、Buff Sizeを
以下のように可変とすることもできる。すなわち、も
し、所定の大きさの画像(通常はA4またはレターサイ
ズ)の半分まで読み取り走査をしても、Buff Sizeがフ
ルにならない場合は、これまで読み込まれた矩形の数を
Buff Sizeと決定し、以後の処理を実行する。これによ
り、原稿の中に文字行が少ないような場合には、より迅
速にかつ効率良くヒストグラムを求めることができる。
【0023】図5(a)は文書画像の矩形表現を示す図
であり、図5(b)は図5(a)の文書画像中の矩形の
2つの端点のうちの一方の端点の座標(この例では矩形
の左上端点の座標値)(図5(a)には図示せず)を垂
直方向(X座標軸)に射影したヒストグラムの一例を示
す図である。図5(a)の例では、文書画像が多段組と
なっており、複数(3つ)のコラムC1,C2,C3を
有している。この場合、図5(a)の文書画像中の矩形
の左上端点の座標を垂直方向,すなわちX座標軸に射影
すると、そのヒストグラムは、図5(b)に示すよう
に、主に4つのピーク値P1,P2,P3,P4が検出
され、このピーク値P1,P2,P3,P4で示す位置
を段の端点,すなわちコラムの端点とみなすことができ
る。換言すれば、これによって、多段組の複数の欄(コ
ラム)C1,C2,C3,より詳しくは、各コラムの幅
Column widthを検出することができる。また、行番号
“006”のsize checkは、読み取られた矩形領域のサ
イズをチェックして、大き過ぎたり、小さ過ぎるものを
計測の対象からはずす命令である。さらに模擬コード中
の行番号“012”は、検出された段組のうちの1つの
段,すなわち1つの欄(コラム)の範囲内の矩形領域の
みを取り出すための条件を与えている。これにより、コ
ラムの端点Column start(図5(a),(b)の例で
は、例えばコラムC1の左端P1)から幅Column width
(コラムC1の範囲内)分の矩形領域のみをスキュ−検
出に必要な上記制限された範囲として取り出すことがで
きる。また、行番号“016”のhist slope[angle]
は、上記のように取り出した所定範囲内で、後述のよう
に所定の条件に合致する矩形領域の組について、その傾
斜角angleについてのヒストグラムを求め、このヒスト
グラムが最大となる角度がスキュー角“a”となる。
【0024】
【0025】ここで、上記プログラムをより詳しく説明
すると、傾斜角は、次のように計測される。すなわち、
新たに読み込まれた矩形の座標値は、それ以前に読み込
まれた座標値の中の最新の“Buff Size”個のデータと
比較され、以下の条件に合致する矩形領域のみ傾斜角が
計測される。すなわち、対象となる矩形領域は、その長
辺または短辺の水平線に対する傾き角度が所定の角度
(本実施例では、90度〜0度の範囲内の所定の角
,例えば分割数が5の場合には±18度以下である
ことを条件とする。これ以上スキューすることは極めて
まれなので、上記所定の角度以上の場合には、この矩形
領域の傾斜角については無視する。また、矩形領域のサ
イズが大き過ぎたり小さ過ぎるものは対象から除外す
る。サイズが小さいものはノイズの可能性が大きく、ま
た、大き過ぎるものは図形の可能性が大きいので、これ
らの矩形領域の傾斜角については無視する。また、対象
となる矩形領域は、隣接する矩形領域と近づきすぎてい
ないと同時に離れすぎていないことを条件とする。近す
ぎているとその矩形領域における傾斜角を正しく検出す
ることができない。また、離れすぎていると、隣のコラ
ムにまたがる可能性がある。異なるコラムは同一の行間
隔とは限らないので、同一コラム内で計測する。
【0026】このように、本実施例では、制限された所
定範囲内で上記の条件を満たす矩形領域の組からのみ、
その傾斜角についてのヒストグラム(並び)を求め、こ
のヒストグラムが最大となる角度をスキュー角“a”と
して求める(ステップS7)。
【0027】スキュー角“a”は、ある信頼度をともな
って決定される。すなわち、ヒストグラムのピーク値と
その前後の頻度の合計値が、ヒストグラム全体の平均値
に比べ、その標準偏差値の2倍以上離れていれば、高い
信頼度とともにaを決定する。もし、その差が1倍程度
なら信頼度はやや低い。もし、その差が十分大きくなけ
れば信頼性が無いものとして、「スキュー検出不能」と
する。このように信頼度を付してスキュー角度を決定す
ることにより、検出されたスキュー角“a”が度の程度
の信頼性を有しているかを客観的に判断することができ
る。
【0028】このようにしてスキュー角“a”が求めら
れた後、スキュー補正部7では、このスキュー角“a”
に基づき、各矩形領域に対してスキュー補正を行なう
(ステップS8)。図6は図4に示すように設定された
各矩形領域のうちの1つの矩形領域の拡大図であり、図
6からわかるように、この矩形領域Aは、連結画像に対
して大き目に設定されている。本来スキューのない状態
で定義される矩形領域をIとすると、図6から次の関係
式が成り立つ。
【0029】
【数1】
【0030】なお、上式は、スキュー角“a”が正の場
合の関係式であり、スキュー角“a”が負の場合には、
次の関係式となる。
【0031】
【数2】
【0032】本実施例においては、各矩形領域に対する
スキュー補正は、スキュー角“a”が求められたとき
に、上記数1または数2に基づいて矩形領域に角度
“a”の傾きで内接する矩形を求め、もし必要があれ
ば、各矩形領域に対して求められた内接する矩形に対し
(この矩形の全座標に対し)アフィン変換を行なうこと
でなされる。なお、上記数1および数2において、W,
Hはそれぞれ外接長方形の幅,高さであり、これらは次
式により定義される。
【0033】
【数3】 W=|Xd−Xu| H=|Yd−Yu|
【0034】次に、実際の読取画像に対して本実施例の
矩形領域の設定処理,スキュー角検出処理,スキューの
補正処理を適用した場合に得られる結果について説明す
る。図7は、ランドスケープに印字された原画をポート
レート方向に(すなわち90度回転した方向に)、か
つ、歪んで(スキューして)読取ったC−言語のプログ
ラム原稿画像から前述した仕方で連結パターンを抽出
し、直結画像単位で矩形表現した結果を示している。す
なわちランドスケープ方向に印刷された文書画像を本発
明を適用したシステムにより、90度回転したポートレ
ート方向に読取り、前述の連結成分の抽出処理,矩形領
域の設定処理を実行した結果を示している。図7の矩形
表現結果に対して、表1に示した処理を行なった結果、
図8に示すように水平方向Hへの傾斜角の射影ヒストグ
ラムを得ることができ、また、図9に示すように、垂直
方向Vへの傾斜角の射影ヒストグラムを得ることができ
た。このとき、それぞれのヒストグラムのピーク値が同
一の値“−1.6度”をもっていることがわかる。この
値をスキュー値“a”と置く。
【0035】ヒストグラムのピーク値は以下のように評
価される。すなわち、先づ、ヒストグラムのピーク値を
例えば隣合う3つの値の合計値によって評価する。な
お、隣合う値の合計値によって評価するのは、以下のた
めである。すなわち、近接する矩形は水平座標値または
垂直座標値のいずれか一方が類似した値をもつことが多
い。ところで、このシステムでは解像度を8分の1に落
しているので、必然的に近接する矩形の端点の座標値が
同一である確率が高くなる(量子化効果)。従って、ヒ
ストグラム上に0度のシャープなピークが生じ易く、こ
のためピークを除く必要があるためである。また、ヒス
トグラムのピーク値がその周囲と比較してどれ程突出し
ているかを判断し、突出が大きいほど安定なピークとみ
なす。また、第1ピークと第2ピークが隣接していれば
安定なピークとみなす。図8,図9のヒストグラムで
は、垂直,水平方向ともスキュー角が−1.6度を示し
ているが、垂直方向のピークの方がより鮮明である。図
10は、検出されたスキュー角をもとに、図7の各矩形
領域に対し、スキュー角の傾きで内接する矩形を求め、
この矩形に対し、スキュー角分だけ回転処理(アフィン
変換)を施した結果を示す図である。図10からスキュ
ーが正しく補正されたことがわかる。
【0036】また、本実施例のスキュー補正処理は、ス
キュー補正のなされるべき対象が全て連結画像を単位と
した矩形で表現されているので、原画に対してのスキュ
ー補正ではなく、矩形表現結果に対してのスキュー補正
である。図10は、矩形表現結果に対してのスキュー補
正によって全ての画像に対して十分満足する結果を得る
ことができ、この処理が安定したものであることを示し
ている。
【0037】また、原画に対してのスキュー補正ではな
く、制限された範囲内の所定の条件を満たす矩形表現結
果に対してスキュー補正を行なうことで、従来に比べて
演算量,計算コストを著しく低減することができる。
【0038】すなわち、この種の画像処理において重要
な評価項目は、演算量,計算コスト,検出精度および結
果の安定性である。現実の文書画像に適用すると、行の
間隔が不揃いであったり、図形の占める割合が大きかっ
たり、あるいは地肌などの画像ノイズが大きいといった
問題を含んでおり、従来の画像処理では、上記の各評価
項目を満足する結果を得ることは困難であった。これに
対し、本実施例の画像処理装置では、50枚の印刷文書
画像に適用し、これら全てにおいて上記各評価項目を満
足する良好な結果を得ることができた。特に、文書画像
が多段組を含む場合に、従来例8と比べて良好な安定し
た正しいスキュ−補正を正しく行なうことができた。ま
た、従来例8に比べてノイズ等の影響の少ない極めて良
好な安定したスキュー補正結果を得ることができた。
【0039】なお、演算量,計算コストに着目すると、
本実施例の演算量,計算コストは対象となるデータサン
プルの数に依存する。次表には本実施例の方式と従来の
方式(FFT、従来例8)とのそれぞれにおける処理
を、利用するサンプルの数で比較している。なお、次表
では、角度分解能が0.2゜、演算方向がx,y両方
向、最小画素単位が8×8画素、原画解像度が300d
pi,A4の条件となっており、FFTは従来のフーリ
エ変換法によるものを示している。
【0040】
【表2】
【0041】表2からもわかるように、本実施例の画像
処理装置では、従来最良とされていた従来例8に比べて
も対象データ数が1/5〜1/10程度で済み、この結
果、演算量,計算コストを大幅に低減することができ
た。また、従来例8に比べてノイズ等の影響の少ない極
めて良好な安定したスキュー補正結果を得ることができ
た。
【0042】このように、本実施例では、多段組を含む
文書画像の中の文字列に着目して矩形領域の設定並びに
コラム検出を行ない、この際にコラムの端点(例えば左
端)からある制限された範囲内(図5の例では1つのコ
ラムC1の範囲内)だけでの矩形領域に基づきスキュー
角の検出を行ない、検出されたスキュー角から、各文字
を囲む矩形の領域を、元の画像情報を使うことなく、矩
形の表現に対してのみで補正することにより、極めて安
定した良好なスキュー補正結果を少ない演算量,計算コ
ストで得ることができる。
【0043】
【発明の効果】以上に説明したように請求項1,請求項
2記載の発明によれば、所定の文書画像において所定画
素の連結成分に対して矩形領域を設定する矩形領域設定
手段と、文書画像中の前記連結成分に対してそれぞれ矩
形領域を設定した後、文書画像内で矩形領域の端点の座
標値の所定方向への射影をとり、該射影のヒストグラム
を求めるヒストグラム算出手段と、前記射影のヒストグ
ラムのピーク値を求め、該ピーク値を文書の欄(コラ
ム)の端点として検出するコラム検出手段と、前記コラ
ム検出手段によって前記射影のヒストグラムのピーク値
がコラムの端点として検出されたときに、該コラムの端
点からある制限された範囲内の矩形領域のみを用いてス
キュー角を求めるスキュー角検出手段とを備えているの
で、文書画像が多段組の場合でも、スキュー角を少ない
演算量,計算コストで容易にかつ安定して確実に検出す
ることができる。
【0044】
【0045】また、請求項3記載の発明によれば、請求
項1記載の画像処理装置において、前記スキュー角に基
づき、連結領域を表わす矩形の座標値に所定の演算を加
え、前記矩形領域に前記スキュー角だけ傾いて内接する
新たな矩形を求めることにより、見かけ上、正規なスキ
ュー補正を行なうようになっているので、文書画像が多
段組の場合でも、スキュー補正を少ない演算量,計算コ
ストで、容易にかつ安定して効率良く確実に行なうこと
ができる。
【0046】
【0047】
【0048】また、請求項4記載の発明によれば、スキ
ュー角検出手段は、スキュー角度の算出に際して、矩形
の射影ヒストグラムのピーク値の信頼性を、ヒストグラ
ムの統計量から判定し、ある信頼度を付してスキュー角
度を決定するようになっているので、検出されたスキュ
ー角がどの程度の信頼性を有しているかを客観的に判断
することができる。
【図面の簡単な説明】
【図1】本発明に係る画像処理装置の一実施例の構成図
である。
【図2】図1の画像処理装置の処理動作を説明するため
のフローチャートである。
【図3】スキューして読み取られた文書画像に対する矩
形表現の一例を示す図である。
【図4】スキューした文字行に対する矩形表現の一例を
示す図である。
【図5】(a)は文書画像の矩形表現の一例を示す図,
(b)は(a)の文書画像中の画素を垂直方向に射影し
たヒストグラムの一例を示す図である。
【図6】図4に示す各矩形のうちの1つの矩形の拡大図
である。
【図7】ランドスケープ方向に印刷されたスキューのあ
るC−言語のプログラム原稿画像を90度回転したポー
トレート方向に読み取り、連結画像単位で矩形処理した
例を示す図である。
【図8】スキュー角を検出するために図7の各矩形の傾
斜角を水平方向に投影した結果のヒストグラムを示す図
である。
【図9】スキュー角を検出するために図7の各矩形の端
点の一方の座標値を垂直方向に投影した結果のヒストグ
ラムを示す図である。
【図10】図8,図9のヒストグラムからスキュー角を
算出し、図7の画像に対しスキューを補正した結果を示
す図である。
【符号の説明】
1 2値化処理部 2 倍率変換部 3 連結成分抽出部 4 矩形領域設定部 5 ヒストグラム算出部 6 検出処理部 8 スキュー補正部 9 スキュー角検出部

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定の文書画像において所定画素の連結
    成分に対して矩形領域を設定する矩形領域設定手段と、
    文書画像中の前記連結成分に対してそれぞれ矩形領域を
    設定した後、文書画像内で矩形領域の端点の座標値の所
    定方向への射影をとり、該射影のヒストグラムを求める
    ヒストグラム算出手段と、前記射影のヒストグラムのピ
    ーク値を求め、該ピーク値を文書の欄(コラム)の端点
    として検出するコラム検出手段と、前記コラム検出手段
    によって前記射影のヒストグラムのピーク値がコラムの
    端点として検出されたときに、該コラムの端点からある
    制限された範囲内の矩形領域のみを用いてスキュー角を
    求めるスキュー角検出手段とを備えていることを特徴と
    する画像処理装置。
  2. 【請求項2】 請求項1記載の画像処理装置において、
    前記スキュー角検出手段は、前記制限された範囲内に存
    在する矩形領域の組について、その傾斜角についてのヒ
    ストグラムを求め、該ヒストグラムが最大となる角度を
    スキュー角として検出するようになっていることを特徴
    とする画像処理装置。
  3. 【請求項3】 請求項1記載の画像処理装置において、
    前記スキュー角に基づき、連結領域を表わす矩形の座標
    値に所定の演算を加え、前記矩形領域に前記スキュー角
    だけ傾いて内接する新たな矩形を求めることにより、見
    かけ上、正規なスキュー補正を行なうことを特徴とする
    画像処理装置。
  4. 【請求項4】 請求項1記載の画像処理装置において、
    前記スキュー角検出手段は、スキュー角の算出に際し
    て、矩形の射影ヒストグラムのピーク値の信頼性を、ヒ
    ストグラムの統計量から判定し、ある信頼度を付してス
    キュー角を決定するようになっていることを特徴とする
    画像処理装置。
JP36027392A 1992-12-28 1992-12-28 画像処理装置 Expired - Lifetime JP3303246B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36027392A JP3303246B2 (ja) 1992-12-28 1992-12-28 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36027392A JP3303246B2 (ja) 1992-12-28 1992-12-28 画像処理装置

Publications (2)

Publication Number Publication Date
JPH06203202A JPH06203202A (ja) 1994-07-22
JP3303246B2 true JP3303246B2 (ja) 2002-07-15

Family

ID=18468682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36027392A Expired - Lifetime JP3303246B2 (ja) 1992-12-28 1992-12-28 画像処理装置

Country Status (1)

Country Link
JP (1) JP3303246B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3443141B2 (ja) * 1993-10-05 2003-09-02 株式会社リコー 画像傾き検出方法及び表処理方法
US6285802B1 (en) * 1999-04-08 2001-09-04 Litton Systems, Inc. Rotational correction and duplicate image identification by fourier transform correlation
JP4219542B2 (ja) 2000-09-07 2009-02-04 富士ゼロックス株式会社 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
JP4738645B2 (ja) * 2001-06-15 2011-08-03 株式会社リコー 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
US7667876B2 (en) 2004-03-03 2010-02-23 Ricoh Company, Ltd. Generating a normalized image from an original image
CN101924856B (zh) * 2009-06-17 2013-06-19 北京大学 文稿倾斜角度检测的方法和装置
JP7196540B2 (ja) 2018-10-31 2022-12-27 株式会社リコー シート材読取装置、原稿読取装置および画像形成装置

Also Published As

Publication number Publication date
JPH06203202A (ja) 1994-07-22

Similar Documents

Publication Publication Date Title
US9805281B2 (en) Model-based dewarping method and apparatus
US7031553B2 (en) Method and apparatus for recognizing text in an image sequence of scene imagery
EP0764308B1 (en) System and method for automatic page registration and automatic zone detection during forms processing
US8144989B2 (en) Methods and systems for identifying text orientation in a digital image
US6400848B1 (en) Method for modifying the perspective of a digital image
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US8208725B2 (en) Methods and systems for identifying text orientation in a digital image
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JPH08241411A (ja) 文書画像を評価するシステムおよびその方法
EP2974261A2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
JPH03201866A (ja) 圧縮形態のデータを含むデータから画像スキュー角度を決定する方法
EP2270746A2 (en) Method for detecting alterations in printed document using image comparison analyses
US9288362B2 (en) Technique for skew detection of printed arabic documents
Kapoor et al. A new algorithm for skew detection and correction
US6771842B1 (en) Document image skew detection method
Konya et al. Fast seamless skew and orientation detection in document images
CN112419207A (zh) 一种图像矫正方法及装置、系统
CN115619656A (zh) 数字化档案纠偏矫正方法及系统
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
JP3303246B2 (ja) 画像処理装置
JP2000251082A (ja) 文書画像傾き検出装置
JP3006466B2 (ja) 文字入力装置
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
KR100603618B1 (ko) 어파인 변환을 이용한 문서 영상의 기하학적 왜곡 보정장치 및 방법
JP2778437B2 (ja) 文書画像傾き検出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080510

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090510

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100510

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110510

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120510

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120510

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130510

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130510

Year of fee payment: 11