JP3443141B2 - 画像傾き検出方法及び表処理方法 - Google Patents

画像傾き検出方法及び表処理方法

Info

Publication number
JP3443141B2
JP3443141B2 JP24891493A JP24891493A JP3443141B2 JP 3443141 B2 JP3443141 B2 JP 3443141B2 JP 24891493 A JP24891493 A JP 24891493A JP 24891493 A JP24891493 A JP 24891493A JP 3443141 B2 JP3443141 B2 JP 3443141B2
Authority
JP
Japan
Prior art keywords
rectangle
integrated
black
ruled line
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24891493A
Other languages
English (en)
Other versions
JPH07105310A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP24891493A priority Critical patent/JP3443141B2/ja
Publication of JPH07105310A publication Critical patent/JPH07105310A/ja
Application granted granted Critical
Publication of JP3443141B2 publication Critical patent/JP3443141B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、イメージスキャナ等の
画像入力機器によって入力した文書もしくは帳票(これ
らを本明細書では文書類と総称する)の画像の処理に係
り、特に、罫線を含む文書類の画像の傾きの検出及び画
像中の表領域の処理に関する。
【0002】
【従来の技術】文字認識装置において文書類の画像を処
理する場合、入力された画像が傾いていると認識率等に
悪い影響がある。複写機やファクシミリ装置、スキャナ
等の画像入力装置一般においても、入力画像の傾きは好
ましくない。
【0003】入力した文書画像の傾きを検出する方法と
して、文書画像より文字塊ブロックを抽出し、文字塊ブ
ロック間の配置関係や中心等の特徴から、傾きを求める
方法が知られている(特開平3−62284号)。
【0004】
【発明が解決しようとする課題】しかし、特開平3−6
2284号の方法は、文字塊を抽出できること、つまり
入力画像中に文字が存在することが前提である。このた
め、罫線のフォーマットデータのみからなる画像の傾き
を検出することができない。
【0005】よって本発明の目的は、罫線を含む入力画
像の傾きを、それに文字が含まれているか否かを問わず
に、検出することができる画像傾き検出方法を提供する
ことにある。本発明のもう一つの目的は、傾いて入力さ
れた画像上の表中の文字を正確に認識できる表処理方法
を提供することにある。
【0006】
【課題を解決するための手段】請求項1の発明は、入力
画像上の一定値以上の長さの黒ランを抽出し、抽出した
黒ランで予め定められた距離内にある黒ランを、それら
全てを包含する矩形に統合し、この黒ランの統合の際に
統合される黒ランの相互の位置関係によって入力画像の
傾きの方向を判定し、さらに、矩形の内部の黒画素数を
該矩形の長手方向のサイズで除した値を、該矩形の短手
方向のサイズより減算し、該減算後のサイズと該矩形の
長手方向のサイズとから、入力画像の傾き角度を求める
ことを特徴とするものである。
【0007】請求項2の発明は、入力画像上の一定値以
上の長さの黒ランを抽出し、抽出した黒ランで予め定め
られた距離内にある黒ランを、それら全てを包含する矩
形に統合し、黒ランを統合した矩形で予め定められた距
離内にあるものを、それら全てを包含する罫線矩形に統
合し、前記矩形の統合の際に統合される矩形の相互の位
置関係によって、入力画像の傾きの方向を判定し、さら
に、罫線矩形の内部の黒画素数を該罫線矩形の長手方向
のサイズで除した値を、該罫線矩形の短手方向のサイズ
より減算し、該減算後のサイズと該罫線矩形の長手方向
のサイズとから、入力画像の傾き角度を求めることを特
徴とするものである。
【0008】請求項3の発明は、入力画像上の一定値以
上の長さの黒ランを抽出し、抽出した黒ランで予め定め
られた距離内にある黒ランを、それら全てを包含する矩
形に統合し、黒ランを統合した矩形で予め定められた距
離内にあるものを、それら全てを包含する罫線矩形に統
合し、前記黒ランの統合の際に統合される黒ランの相互
の位置関係、及び、前記矩形の統合の際に統合される矩
形の相互の位置関係によって、入力画像の傾きの方向を
判定し、さらに、罫線矩形の内部の黒画素数を該罫線矩
形の長手方向のサイズで除した値を、該罫線矩形の短手
方向のサイズより減算し、該減算後のサイズと該罫線矩
形の長手方向のサイズとから、入力画像 の傾き角度を求
めることを特徴とするものである。
【0009】請求項4の発明は、請求項1乃至3のいず
れか1項に記載の画像傾き検出方法によって入力画像の
傾きの方向及び角度を検出し、該検出した傾きの方向及
び角度に基づいて該入力画像の傾きを補正した画像を作
成し、該傾き補正画像より罫線の矩形を抽出し、該抽出
した罫線の矩形の座標より表の枠を認識し、該認識した
枠の内部の文字画像を該傾き補正画像より切り出して文
字認識をすることを特徴とするものである。
【0010】
【作用】請求項1乃至3の発明によれば、入力画像上の
罫線を基準として、画像の傾き方向を検出でき、さらに
入力画像の傾きの角度も検出できる。このように、入力
画像上に罫線が存在すれば、入力画像の傾きを的確に検
出することができるため、例えば、文字が存在しない表
のみの帳票等でも、その画像の傾き検出が可能となる。
【0011】具体的には、請求項1または2の発明で
、黒ランの統合の際に統合される黒ランの位置関係、
または黒ランの統合矩形の統合の際に統合される矩形の
位置関係に基づいて画像の傾きを検出するが、黒ランの
矩形統合や、その矩形の統合処理は表処理で一般に必要
な処理ステップであるため、表処理に適用するのに無駄
のない合理的な方法である。
【0012】請求項3の発明では、罫線を構成する黒ラ
ンの位置関係に加えて、罫線を構成する黒ランの統合矩
形の位置関係を利用して、傾き方向判定に利用する。し
たがって、黒ランの位置関係のみを利用した方法に比
べ、より正確な傾き方向検出が可能である。
【0013】さらに、請求項1乃至3の発明では、黒ラ
ンまたは矩形の始点及び終点の座標の大小関係に基づ
き、極めて単純なルールで傾き方向を判定することがで
きる。また、入力画像の傾きによる黒ラン統合矩形また
はその統合矩形の太りを考慮して、入力画像の傾き角度
を精度よく検出することができる。
【0014】請求項4の発明によれば、入力画像の傾き
を検出して、入力画像の傾きを補正してから罫線を抽出
して表の枠を認識し、枠内の文字画像を傾き補正画像か
ら切り出すので、傾いて入力された画像上の表中の文字
を正確に認識することができる。
【0015】
【実施例】以下、本発明の実施例について図面を用い説
明する。
【0016】<実施例1> 図1は、本実施例を説明するためのブロック図である。
図1において、2値画像入力部(イメージスキャナ等)
101によって、罫線を含む文書類の画像が読み取られ
2値イメージデータとして入力される。入力画像の2値
イメージデータは、2値イメージメモリ102に格納さ
れる。
【0017】黒ラン抽出部103は、2値イメージメモ
リ102内の2値イメージデータをスキャンし、主走査
方向または副走査方向に一定値以上の長さを持つ黒ラン
を抽出する。そして、抽出した黒ランのデータ(始点、
終点の座標)を黒ランメモリ104に格納する。
【0018】矩形統合部105において、黒ランメモリ
104内の黒ランデータを参照し、主走査方向または副
走査方向に長い黒ランに対して、予め定められた距離の
範囲内にある黒ランを、それらを全て包含する矩形に統
合する処理を行ない、黒ランの統合矩形のデータ(頂点
座標等)を矩形メモリ106に格納する。また、統合す
る1対の黒ランのデータ(始点、終点の座標)を矩形メ
モリ106の特定領域へ格納する。
【0019】傾き検出部107は、矩形統合部による黒
ランの統合処理中に、統合される黒ランのペアのデータ
を矩形メモリ106内の特定領域より受け取って、統合
される黒ランのペアの相互の位置関係を調べることによ
って、2値画像入力部101に対する相対的な入力画像
の傾きの方向を判定する。この傾き方向の判定方法の例
を次に示す。
【0020】(例1)主走査方向罫線に着目した方法 主走査方向の黒ランの統合の際に、図2に示すように、
統合される主走査方向の長い2本の黒ランLH1,LH
2の始点または終点のX座標を比較する。図2(a)に
示すように、上側の黒ランLH1の始点のX座標(xs
1)と下側の黒ランLH2の始点のX座標(xs2)と
の関係が xs1<xs2 ならば「右下がり」と判定
し、また図2(b)に示すように 黒ランLH1の終点
のX座標(xe1)と黒ランLH2の終点のX座標(x
e2)が xe1>xe2 ならば「右上がり」と判定す
る。そのいずれでもない場合には、傾きなしと判定す
る。
【0021】なお、この判定を、統合される黒ランの複
数ペアについて行ない、例えば、各ペアの判定結果の多
数決により最終的な判定結果を決めてもよい。あるい
は、右下がり、右上がりのそれぞれの判定回数をカウン
トし、所定値に先に到達した傾き方向を最終的な判定結
果としてもよい。
【0022】(例2)副走査方向罫線に着目した方法 副走査方向の黒ランの統合の際に、図3に示すように、
統合される副走査方向の長い2本の黒ランLV1,LV
2の始点または終点のY座標を比較する。図3(a)に
示すように、右側の黒ランLV1の始点のY座標(Ys
1)と下側の黒ランLV2の始点のY座標(Ys2)と
の関係が Ys1<Ys2 ならば「右下がり」と判定
し、また図3(b)に示すように、黒ランLV1の終点
のY座標(Ye1)と黒ランLV2の終点のY座標(Y
e2)が、 Ye1>Ye2 ならば「右上がり」と判定
する。そのいずれでもない場合には、傾きなしと判定す
る。
【0023】なお、この判定を、統合される黒ランの複
数ペアについて行ない、例えば、各ペアの判定結果の多
数決により最終的な判定結果を決めてもよい。あるい
は、右下がり、右上がりのそれぞれの判定回数をカウン
トし、所定値に先に到達した傾き方向を最終的な判定結
果としてもよい。
【0024】また、主走査方向の黒ランの統合矩形と副
走査方向の黒ランの統合矩形の両方が得られる場合に、
主、副各走査方向の黒ランによる傾き判定の結果が一致
した場合に判定結果を有効とし、不一致の場合に判定不
能とする等の方法を採ることもできる。あるいは、主、
副走査各方向の判定結果の確からしさを求めておき、各
方向の判定結果が不一致のときには、確からしさの高い
方の判定結果を最終判定結果とする等の方法をとること
ができる。
【0025】<実施例2> 図4は、本実施例を説明するためのブロック図である。
図4において、2値画像入力部(イメージスキャナ等)
401によって、罫線を含む文書類の画像が読み取られ
2値イメージデータとして2値イメージメモリ402に
格納される。
【0026】黒ラン抽出部403は、2値イメージメモ
リ402内の2値イメージデータをスキャンし、主走査
方向または副走査方向に一定値以上の長さを持つ黒ラン
を抽出する。そして、抽出した黒ランのデータ(始点、
終点の座標)を黒ランメモリ404に格納する。
【0027】矩形統合部405において、黒ランメモリ
404内の黒ランデータを参照し、主走査方向または副
走査方向に長い黒ランに対して、予め定められた距離の
範囲内にある黒ランを、それらを全て包含する矩形に統
合する処理を行ない、黒ランの統合矩形のデータ(頂点
座標等)を矩形メモリ406に格納する。
【0028】このような主、副各走査方向の黒ランの統
合処理によって、罫線を構成する黒ランの殆どを統合す
ることができる。しかし、イメージスキャナ等で入力し
た文書類の画像では、罫線の交差、罫線のかすれ等によ
って、罫線の切れが生じることが少なからずある。
【0029】このような切れを補正して本来の罫線を抽
出するため、罫線矩形抽出部407において、矩形メモ
リ406内の主走査方向黒ランの統合矩形及び副走査方
向黒ランの統合矩形のそれぞれに対して、罫線矩形統合
を行なう。すなわち、主走査方向の長い黒ランの統合矩
形について、予め定められた距離の範囲内にある矩形
を、それら全て包含する矩形(主走査方向罫線矩形)に
統合する。同様に、副走査方向に長い黒ランの統合矩形
について、予め定められた距離の範囲内にある矩形を、
それら全てを包含する矩形(副走査方向罫線矩形)に統
合する。そして、抽出した罫線矩形のデータ(頂点座標
等)を罫線矩形メモリ408に格納する。また、統合す
る矩形のデータ(頂点座標等)を、罫線矩形メモリ40
8の特定領域に格納する。
【0030】傾き検出部409において、矩形統合部4
04及び罫線矩抽出部407の統合処理の際に、黒ラン
メモリ404内のデータ及び罫線矩形メモリ408内の
特定領域のデータを参照し、統合された黒ランのペアの
位置関係及び統合された矩形のペアの位置関係を調べる
ことによって、2値画像入力部401に対する相対的な
入力画像の傾きの方向を判定する。この傾き方向の判定
方法の例を次に示す。
【0031】(例1)主走査方向罫線に着目した方法 主走査方向の長い黒ランの矩形統合の際、統合される黒
ランのペアについて、前記実施例1におけると同様に、
上側の黒ランの始点または終点のX座標と下側の黒ラン
の始点または終点のX座標との大小関係により、傾きの
方向を判定する(図2参照)。
【0032】また、主走査方向の罫線矩形統合の際に、
図5に示すように、統合される1対の矩形(黒ランの統
合矩形)RH1,RH2それぞれの始点または終点のX
座標の大小関係により、傾きの方向を判定する。上側の
矩形RH1の始点(左上頂点)のX座標(Xs1)と下
側の矩形RH2の始点のX座標(Xs2)が、図5
(a)に示すように、Xs1<Xs2の関係のときに
は、傾きの方向を「右下がり」と判定する。また、図5
(b)に示すように、矩形RH1の終点(右下頂点)の
X座標(xe1)と矩形RH2の終点のX座標(xe
2)が、Xe1>Xe2 の関係のときには、傾きの方
向を「右上がり」と判定する。以上のいずれの関係でも
ないときには、傾きなしと判定する。
【0033】そして、黒ランによる判定結果と、矩形に
よる判定結果とが一致した場合に、その判定結果を最終
的な判定結果とする。
【0034】なお、矩形による判定を統合される矩形の
複数ペアについて行ない、例えば、各ペアの判定結果の
多数決を判定結果としてもよい。あるいは、右下がり、
右上がりのそれぞれの判定回数をカウントし、所定値に
先に到達した傾き方向を判定結果としてもよい。
【0035】(例2)副走査方向罫線に着目した方法 副走査方向の長い黒ランの矩形統合の際、統合される黒
ランのペアについて、前記実施例1におけると同様に、
右側の黒ランの始点のY座標と左側の黒ランの始点のY
座標との大小関係により、傾きの方向を判定する(図3
参照)。
【0036】また、副走査方向の罫線矩形統合の際に、
図6に示すように、統合される1対の矩形(黒ランの統
合矩形)RV1,RV2それぞれの始点または終点のY
座標の大小関係により、傾きの方向を判定する。右側の
矩形RV1の始点(右上頂点)のY座標(Ys1)と左
側の矩形RV2の始点のY座標(Ys2)が、図6
(a)に示すように、Ys1<Ys2の関係のときに
は、傾きの方向を「右下がり」と判定する。また、図6
(b)に示すように、矩形RV1の終点(左下頂点)の
Y座標(Ye1)と矩形RV2の終点のY座標(Ye
2)が、Ye1>Ye2 の関係のときには、傾きの方
向を「右上がり」と判定する。以上のいずれの関係でも
ないときには、傾きなしと判定する。
【0037】そして、黒ランによる判定結果と、矩形に
よる判定結果とが一致した場合に、その判定結果を最終
的な判定結果とする。
【0038】なお、矩形による判定を統合される矩形の
複数ペアについて行ない、例えば、各ペアの判定結果の
多数決を判定結果としてもよい。あるいは、右下がり、
右上がりのそれぞれの判定回数をカウントし、所定値に
先に到達した傾き方向を判定結果としてもよい。
【0039】また、主走査方向罫線と副走査方向罫線の
両方が得られる場合に、主、副各走査方向の罫線に着目
した傾き判定の結果が一致した場合に判定結果を有効と
し、不一致の場合に判定不能とする等の方法を採ること
もできる。あるいは、主、副走査各方向の判定結果の確
からしさを求めておき、各方向の判定結果が不一致のと
きには、確からしさの高い方の判定結果を最終判定結果
とする等の方法をとることもできる。
【0040】<実施例3> 図7は、本実施例を説明するためのブロック図である。
図7において、2値画像入力部(イメージスキャナ等)
701によって、罫線を含む文書類の画像が読み取られ
2値イメージデータとして入力される。入力画像の2値
イメージデータは、2値イメージメモリ702に格納さ
れる。
【0041】黒ラン抽出部703は、2値イメージメモ
リ702内の2値イメージデータをスキャンし、主走査
方向または副走査方向に一定値以上の長さを持つ黒ラン
を抽出する。そして、抽出した黒ランのデータ(始点、
終点の座標)を黒ランメモリ704に格納する。
【0042】矩形統合部705において、黒ランメモリ
704内の黒ランデータを参照し、主走査方向または副
走査方向に長い黒ランに対して、予め定められた距離の
範囲内にある黒ランを、それらを全て包含する矩形に統
合する処理を行ない、黒ランの統合矩形のデータ(頂点
座標等)を矩形メモリ706に格納する。また、統合す
る1対の黒ランのデータ(始点、終点の座標)を矩形メ
モリ706の特定領域へ格納する。
【0043】傾き条件判定部部708は、矩形メモリ7
06内の矩形のデータを参照し、主走査方向及び副走査
方向の統合矩形中で最も長い矩形を抽出する。その矩形
を、本実施例では、最も精度の高い罫線、あるいは文書
類上の表を代表する罫線とみなして、以下に述べるよう
な方法で傾きを判定する。
【0044】まず、最も長い矩形として抽出した罫線の
範囲内について、黒ラン抽出部703で黒ラン抽出を再
度実行し、ここで抽出された黒ランについて矩形統合部
705で矩形統合を実行する。
【0045】この矩形統合処理中に、傾き条件判定部7
08において、矩形メモリ706の特定領域より統合さ
れる黒ランのペアのデータを読み込み、傾き条件に関す
る判定を行なう。この判定条件の例を次に示す。
【0046】(1)注目している矩形が主走査方向の黒
ランの統合矩形(主走査方向罫線)の場合 図2に示すように、統合される黒ランLH1,LH2の
始点または終点のX座標を比較する。図2(a)に示す
ように、上側の黒ランLH1の始点のX座標(xs1)
と下側の黒ランLH2の始点のX座標(xs2)との関
係が xs1<xs2 ならば「右下がり」の条件に合致
すると判定する。また、図2(b)に示すように、黒ラ
ンLH1,LH2の終点のX座標(xe1,xe2)
が、xe1>xe2 ならば「右上がり」の条件に合致
すると判定する。
【0047】(2)注目している矩形が副走査方向の黒
ランの統合矩形(副走査方向罫線)の場合 図3に示すように、統合される黒ランLV1,LV2の
始点または終点のY座標を比較する。図3(a)に示す
ように、右側の黒ランLV1の始点のY座標(Ys1)
と下側の黒ランLV2の始点のY座標(Ys2)との関
係が Ys1<Ys2 ならば「右下がり」の条件に合致
すると判定する。また、それぞれの終点のY座標(Ye
1,Ye2)が、図3(b)に示すように、 Ye1>
Ye2 ならば「右上がり」の条件に合致すると判定す
る。
【0048】そして、傾き条件判定部708は、「右上
がり」条件に合致したときには条件合致回数メモリ70
9(初期値は0)の値を1だけ増加させ、「右下がり」
条件に合致したときは条件合致回数メモリ709の値を
1だけ減少させる。いずれの条件にも合致しない場合に
は、条件合致回数メモリ709の値を更新しない。
【0049】注目した矩形に関する上記の判定が完了す
ると、傾き検出部710において、条件合致回数メモリ
709の値が正値で、絶対値が3を超えるときは、傾き
方向を「右上がり」と判定する。傾き条件合致回数メモ
リ709の値が負値で、絶対値が3を超えるときには、
傾き方向を「右下がり」と判定する。また、その値が±
3の範囲内のときは、「傾きなし」と判定する。なお、
±3の範囲内で「傾きなし」としたのは、入力画像上の
ノイズの影響を考慮したものである。
【0050】<実施例4> 図8は、本実施例を説明するためのブロック図である。
図8において、2値画像入力部(イメージスキャナ等)
801によって、罫線を含む文書類の画像が読み取ら
れ、その2値イメージデータが2値イメージメモリ80
2に格納される。
【0051】黒ラン抽出部803は、2値イメージメモ
リ802内の2値イメージデータをスキャンし、主走査
方向または副走査方向に一定値以上の長さを持つ黒ラン
を抽出し、抽出した黒ランのデータ(始点、終点の座
標)を黒ランメモリ804に格納する。
【0052】矩形統合部805において、黒ランメモリ
804内の黒ランデータを参照し、主走査方向または副
走査方向に長い黒ランに対して、予め定められた距離の
範囲内にある黒ランを、それらを全て包含する矩形に統
合する処理を行ない、黒ランの統合矩形のデータ(頂点
座標等)を矩形メモリ806に格納する。罫線矩形抽出
部807において、矩形メモリ806内の矩形データを
参照し、主走査方向の長い黒ランの統合矩形について、
予め定められた距離の範囲内にある矩形を、それら全て
包含する矩形(主走査方向罫線矩形)に統合する。同様
に、副走査方向に長い黒ランの統合矩形について、予め
定められた距離の範囲内にある矩形を、それら全てを包
含する矩形(副走査方向罫線矩形)に統合する。そし
て、抽出した罫線矩形のデータ(頂点座標等)を罫線矩
形メモリ808に格納する。
【0053】傾き条件判定部部809は、罫線矩形メモ
リ706内のデータを参照し、主走査方向及び副走査方
向の罫線矩形中で最も長い矩形を抽出する。その矩形
を、本実施例では、最も精度の高い罫線、あるいは文書
類上の表を代表する罫線とみなして、以下に述べるよう
な方法で傾きを判定する。
【0054】まず、抽出した最も長い罫線矩形の範囲内
について、黒ラン抽出部803で黒ラン抽出を再度実行
し、ここで抽出された黒ランについて矩形統合部805
で矩形統合を実行し、その矩形の統合を罫線矩形抽出部
807で実行する。
【0055】矩形統合部805による黒ランの統合処理
中に、傾き条件判定部809は、統合される黒ランのペ
アについて傾き条件に関する判定を行なう。この判定条
件の例を次に示す。
【0056】(1)主走査方向の罫線矩形が処理の対象
であるとき 図2に示すように、統合される黒ランLH1,LH2の
始点または終点のX座標を比較する。図2(a)に示す
ように、上側の黒ランLH1の始点のX座標(xs1)
と下側の黒ランLH2の始点のX座標(xs2)との関
係がxs1<xs2 ならば「右下がり」の条件に合致
すると判定する。また、図2(b)に示すように、それ
ぞれの終点のX座標(Xe1,Xe2)が、xe1>x
e2ならば「右上がり」の条件に合致すると判定する。
【0057】(2)副走査方向の罫線矩形が処理の対象
であるとき 図3に示すように、統合される黒ランLV1,LV2の
始点または終点のY座標を比較する。図3(a)に示す
ように、右側の黒ランLV1の始点のY座標(Ys1)
と下側の黒ランLV2の始点のY座標(Ys2)との関
係がYs1<Ys2ならば「右下がり」の条件に合致す
ると判定する。また、図3(b)に示すように、それぞ
れの終点のY座標(Ye1,Ye2)が、Ye1>Ye
2ならば「右上がり」の条件に合致すると判定する。
【0058】そして、傾き条件判定部809は、統合さ
れる黒ランのペアが「右上がり」条件に合致したときに
は条件合致回数メモリ810(初期値は0)の値を1だ
け増加させ、「右下がり」条件に合致したときは条件合
致回数メモリ810の値を1だけ減少させる。いずれの
条件にも合致しない場合には、条件合致回数メモリ81
0の値を更新しない。
【0059】また、罫線矩形抽出部807による罫線統
合処理中に、傾き条件判定部809は、統合される矩形
のペアについて傾き条件に関する判定を行なう。この判
定条件の例を次に示す。
【0060】(1)主走査方向罫線が処理対象であると
き 図5に示すように、統合される1対の矩形(黒ランの統
合矩形)RH1,RH2それぞれの始点または終点のX
座標の大小関係により傾きの方向を判定する。上側の矩
形RH1の始点(左上頂点)のX座標(Xs1)と下側
の矩形RH2の始点のX座標(Xs2)が、図5(a)
に示すように、Xs1<Xs2の関係のときに傾きの方
向を「右下がり」と判定する。また、図5(b)に示す
ように、それぞれの終点のX座標(Xe1,Xe2)
が、Xe1>Xe2の関係のときには、傾きの方向を
「右上がり」と判定する。
【0061】そして、傾き条件判定部809は、統合さ
れる矩形のペアが「右上がり」条件に合致したときには
条件合致回数メモリ810(初期値は0)の値を1だけ
増加させ、「右下がり」条件に合致したときは条件合致
回数メモリ810の値を1だけ減少させる。いずれの条
件にも合致しない場合には、条件合致回数メモリ810
の値を更新しない。
【0062】このようしにて、注目した罫線矩形に関す
る統合処理が終了した段階で、傾き検出部811は、条
件合致回数メモリ810の値が正値で絶対値が5を超え
るときは、傾き方向を「右上がり」と判定する。傾き条
件合致回数メモリ810の値が負値で、絶対値が5を超
えるときには、傾き方向を「右下がり」と判定する。ま
た、その値が±5の範囲内のときは、「傾きなし」と判
定する。なお、±5の範囲内で「傾きなし」としたの
は、入力画像上のノイズの影響を考慮したものである。
【0063】なお、本実施例では、最も長い罫線矩形を
選び、それを代表として、黒ラン抽出、その統合、罫線
矩形統合を改めて行ない、その際に条件判定を行なうこ
とによって傾き方向を検出したが、全ての罫線を対象と
して同様の条件判定を行なって傾きを検出することもで
きることは当然である。
【0064】すなわち、矩形統合部805による黒ラン
統合処理中に、傾き条件判定部809で、すべての統合
される黒ランのペアに関して前述の如き条件判定を行な
い、その結果に応じて条件合致回数メモリ810の更新
を行なう。また、罫線矩形抽出部807による矩形統合
中に、全ての統合される矩形のペアに関して前述の如き
条件判定を行ない、その結果に応じて条件合致回数メモ
リ810の更新を行なう。そして、以上の処理を完了し
た段階での条件合致回数メモリ810の値によって、傾
き検出部811において前述の如き傾き方向の判定を行
なう。
【0065】<実施例5> 前記各実施例では傾きの方向だけを検出したが、本実施
例では傾きの角度も検出する。
【0066】図9は、本実施例の説明のためのブロック
図である。ここに示すシステム構成は前記実施例4に類
似しており、傾きの方向の検出に関しては前記実施例4
と同様である。ただし、前記実施例1,2または3と同
様の方法で傾きの方向を検出してもよい(実施例1また
は3の場合には、黒ランの統合矩形を罫線矩形として扱
う)。
【0067】前記実施例4と全く同様に、2値画像入力
部901によって文書類の2値イメージデータを2値イ
メージメモリ902に入力し、そのイメージ上の主走査
方向及び副走査方向に長い黒ランを黒ラン抽出部903
で抽出し、そのデータを黒ランメモリ906に格納す
る。矩形統合部905で黒ランを矩形に統合し、そのデ
ータを矩形メモリ906に格納する。罫線矩形抽出部9
07で、その矩形の統合をして罫線矩形を抽出し、その
データを罫線矩形メモリ908に格納する。傾き条件判
定部909で最大長の罫線矩形を抽出する。そして、そ
の罫線矩形の範囲について、黒ラン抽出、黒ラン統合、
罫線矩形抽出を実行し、傾き条件判定部909で、黒ラ
ンのペア及び矩形のペアに関する傾きの条件の判定を行
なって条件合致回数メモリ910を更新する。そして、
傾き検出部911で、条件合致回数メモリ910の値よ
り傾きの方向を判定する。
【0068】さて、以上のような傾き方向の検出のため
の動作と並行して、本実施例では次に述べるような傾き
角度検出のための処理を行なう。図10は、その処理の
説明図である。
【0069】黒ラン抽出部903において、注目した罫
線矩形の範囲内の2値イメージをスキャンして黒ランを
抽出する際に、当該罫線矩形の内部の黒画素数(pixe
l)を求め、その値を黒画素数メモリ913に格納す
る。なお、この黒画素数(pixel)を、罫線矩形に包含
される黒ランのデータ(黒ランメモリ904内)より求
めてもよい。
【0070】次に、傾き検出部911において、罫線矩
形メモリ908内のデータより注目した罫線の幅(widt
h)を求め、それと黒画素数(pixel)とから次式によっ
て罫線の太さ(thickness)を計算する。
【0071】thickness=pixel/width 傾き検出部911はまた、罫線矩形メモリ908内のデ
ータより注目した罫線の高さ(height)を求め、これと
罫線の太さ(thickness)とから次式によって罫線のず
れ(tilt)を計算する。
【0072】tilt=height−thickness そして、次式によって、傾きの角度(θ)を求める。
【0073】tanθ=tilt/width <実施例6> 図11は、本実施例を説明するためのブロック図であ
る。図11において、破線の枠1001の内部の構成
は、入力イメージの傾き検出に関しては図9に示した前
記実施例5の構成と同一であるので、その説明を省略す
る。なお、図9中の各部と対応する部分には同一の符号
で示されている。
【0074】図11において、画像補正部1002は、
傾き検出部911より出力された傾きの方向及び角度の
情報に応じて、画像の傾きと逆方向へ、傾きの角度と同
じ角度だけ、2値イメージメモリ902内の2値イメー
ジデータを回転させることによって、傾きを補正した2
値イメージを作成し、それを補正2値イメージメモリ1
003に格納する。
【0075】この補正2値イメージメモリ1003内の
2値イメージデータに対して、黒ラン抽出部903によ
り、主走査方向及び副走査方向に一定値以上の長さを持
つ黒ランを抽出し、黒ランのデータを黒ランメモリ90
4に格納する。黒ランメモリ904内の古いデータ(傾
き検出のための黒ランデータ)は廃棄される。
【0076】矩形統合部905において、黒ランメモリ
904内のデータを参照し、主走査方向の黒ラン及び副
走査方向の黒ランのそれぞれに対して、予め定められた
距離の範囲内の黒ランを、それらを全部包含する矩形に
統合する処理を行ない、その矩形のデータを矩形メモリ
906に格納する。矩形メモリ906内の古いデータは
廃棄される。
【0077】罫線矩形抽出部907において、矩形メモ
リ906内のデータを参照し、主走査方向黒ランの統合
矩形及び副走査方向黒ランの統合矩形のそれぞれに対し
て、予め定められた距離の範囲内の黒ランを、それらを
全部包含する矩形に統合する処理を行ない、統合した矩
形(罫線矩形)のデータを罫線矩形メモリ908に格納
する。罫線矩形メモリ908内の古いデータは廃棄され
る。このようにして、文書類の傾きが補正されたイメー
ジ上の罫線矩形が抽出されたことになる。
【0078】次に、枠認識部1004において、罫線矩
形メモリ908内の罫線矩形のデータを基に、表の枠
(縦横の罫線で囲まれた矩形領域)を認識し、各枠の座
標(対角頂点座標)を枠座標メモリ1005に格納す
る。そして、この枠座標を基に、枠内文字抽出部100
6によって各枠の内部の文字の画像を、補正2値イメー
ジメモリ1003内の補正2値イメージより切り出し、
切り出した文字画像を文字認識部1007へ渡し、文字
認識を行なわせる。かくして、傾いて入力された文書類
上の表の文字を、正確に認識できる。
【0079】
【発明の効果】以上に説明した如く、本発明によれば以
下のような効果を得られる。
【0080】(1)請求項1乃至3の発明によれば、入
力画像上の罫線を基準として、画像の傾き方向を検出で
き、さらに入力画像の傾きの角度も検出できる。このよ
うに、罫線を基準とする方法であるので、例えば、文字
が存在しない表のみの帳票等でも、その画像の傾き検出
が可能となる。
【0081】(2)具体的には、請求項1または2の発
明の方法では、黒ランの統合の際に統合される黒ランの
位置関係、または黒ランの統合矩形の統合の際に統合さ
れる矩形の位置関係に基づいて画像の傾きを検出する
が、黒ランの矩形統合や、その矩形の統合処理は表処理
で一般に必要な処理ステップであるため、表処理に適用
するのに無駄のない合理的な方法である。
【0082】(3)また、請求項3の発明の方法によれ
ば、罫線を構成する黒ランの位置関係に加えて、罫線を
構成する黒ランの統合矩形の位置関係を利用して、傾き
方向判定に利用するため、黒ランの位置関係のみを利用
した方法に比べ、より正確な傾き方向検出が可能であ
る。
【0083】(4)さらに請求項1乃至3の発明の方法
によれば、黒ランまたは矩形の始点及び終点の座標の大
小関係に基づき、極めて単純なルールで傾き方向を判定
することができる。また、入力画像の傾きによる黒ラン
統合矩形またはその統合矩形の太りを考慮して、入力画
像の傾き角度を精度よく検出することができる。
【0084】請求項4の発明によれば、入力画像の傾き
を検出して、入力画像の傾きを補正してから罫線を抽出
して表の枠を認識し、枠内の文字画像を傾き補正画像か
ら切り出すので、傾いて入力された画像上の表中の文字
を正確に認識することができる。
【図面の簡単な説明】
【図1】本発明の実施例1を説明するためのブロック図
である。
【図2】(a)右下がりに傾いた画像上の主走査方向罫
線を構成する黒ランのペアの位置関係の例を示す。 (b)右上がりに傾いた画像上の主走査方向罫線を構成
する黒ランのペアの位置関係の例を示す。
【図3】(a)右下がりに傾いた画像上の副走査方向罫
線を構成する黒ランのペアの位置関係の例を示す。 (b)右上がりに傾いた画像上の副走査方向罫線を構成
する黒ランのペアの位置関係の例を示す。
【図4】本発明の実施例2を説明するためのブロック図
である。
【図5】(a)右下がりに傾いた画像上の主走査方向罫
線を構成する矩形のペアの位置関係の例を示す。 (b)右上がりに傾いた画像上の主走査方向罫線を構成
する矩形のペアの位置関係の例を示す。
【図6】(a)右下がりに傾いた画像上の副走査方向罫
線を構成する矩形のペアの位置関係の例を示す。 (b)右上がりに傾いた画像上の副走査方向罫線を構成
する矩形のペアの位置関係の例を示す。
【図7】本発明の実施例3を説明するためのブロック図
である。
【図8】本発明の実施例4を説明するためのブロック図
である。
【図9】本発明の実施例5を説明するためのブロック図
である。
【図10】主走査方向罫線の場合の傾き角度を検出の説
明図である。
【図11】本発明の実施例6を説明するためのブロック
図である。
【符号の説明】
101,401,701,801,901 2値画像入
力部 102,402,702,802,902 2値イメー
ジメモリ 103,403,703,803,903 黒ラン抽出
部 104,404,704,804,904 黒ランメモ
リ 105,405,705,805,905 矩形統合部 106,406,706,806,906 矩形メモリ 107,409,710,811,911 傾き検出部 407,807,907 罫線矩形抽出部 408,808,908 罫線矩形メモリ 809,909 傾き条件判定部 810,910 条件合致回数メモリ 1002 画像補正部 1003 補正2値イメージメモリ 1004 枠認識部 1005 枠座標メモリ 1006 枠内文字抽出部 1007 文字認識部 LH 主走査方向罫線の黒ラン LV 副走査方向罫線の黒ラン RH 主走査方向罫線の黒ラン統合矩形 RV 副走査方向罫線の黒ラン統合矩形
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−96878(JP,A) 特開 平6−76108(JP,A) 特開 平5−128306(JP,A) 特開 平6−150060(JP,A) 特開 平6−52309(JP,A) 特開 昭59−142678(JP,A) 特開 平6−203202(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力画像上の一定値以上の長さの黒ラン
    を抽出し、抽出した黒ランで予め定められた距離内にあ
    る黒ランを、それら全てを包含する矩形に統合し、この
    黒ランの統合の際に統合される黒ランの相互の位置関係
    によって入力画像の傾きの方向を判定し、 矩形の内部の黒画素数を該矩形の長手方向のサイズで除
    した値を、該矩形の短手方向のサイズより減算し、該減
    算後のサイズと該矩形の長手方向のサイズとから、入力
    画像の傾き角度を求めることを特徴とする画像傾き検出
    方法。
  2. 【請求項2】 入力画像上の一定値以上の長さの黒ラン
    を抽出し、抽出した黒ランで予め定められた距離内にあ
    る黒ランを、それら全てを包含する矩形に統合し、黒ラ
    ンを統合した矩形で予め定められた距離内にあるもの
    を、それら全てを包含する罫線矩形に統合し、前記矩形
    の統合の際に統合される矩形の相互の位置関係によっ
    て、入力画像の傾きの方向を判定し、 罫線矩形の内部の黒画素数を該罫線矩形の長手方向のサ
    イズで除した値を、該罫線矩形の短手方向のサイズより
    減算し、該減算後のサイズと該罫線矩形の長手方向のサ
    イズとから、入力画像の傾き角度を求めることを特徴と
    する画像傾き検出方法。
  3. 【請求項3】 入力画像上の一定値以上の長さの黒ラン
    を抽出し、抽出した黒ランで予め定められた距離内にあ
    る黒ランを、それら全てを包含する矩形に統合し、黒ラ
    ンを統合した矩形で予め定められた距離内にあるもの
    を、それら全てを包含する罫線矩形に統合し、前記黒ラ
    ンの統合の際に統合される黒ランの相互の位置関係、及
    び、前記矩形の統合の際に統合される矩形の相互の位置
    関係によって、入力画像の傾きの方向を判定し、 罫線矩形の内部の黒画素数を該罫線矩形の長手方向のサ
    イズで除した値を、該罫線矩形の短手方向のサイズより
    減算し、該減算後のサイズと該罫線矩形の長手方向のサ
    イズとから、入力画像の傾き角度を求めることを特徴と
    する画像傾き検出方法。
  4. 【請求項4】 請求項1乃至3のいずれか1項に記載の
    画像傾き検出方法によって入力画像の傾きの方向及び角
    度を検出し、該検出した傾きの方向及び角度に基づいて
    該入力画像の傾きを補正した画像を作成し、該傾き補正
    画像より罫線の矩形を抽出し、該抽出した罫線の矩形の
    座標より表の枠を認識し、該認識した枠の内部の文字画
    像を該傾き補正画像より切り出して文字認識をすること
    を特徴とする表処理方法。
JP24891493A 1993-10-05 1993-10-05 画像傾き検出方法及び表処理方法 Expired - Fee Related JP3443141B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24891493A JP3443141B2 (ja) 1993-10-05 1993-10-05 画像傾き検出方法及び表処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24891493A JP3443141B2 (ja) 1993-10-05 1993-10-05 画像傾き検出方法及び表処理方法

Publications (2)

Publication Number Publication Date
JPH07105310A JPH07105310A (ja) 1995-04-21
JP3443141B2 true JP3443141B2 (ja) 2003-09-02

Family

ID=17185305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24891493A Expired - Fee Related JP3443141B2 (ja) 1993-10-05 1993-10-05 画像傾き検出方法及び表処理方法

Country Status (1)

Country Link
JP (1) JP3443141B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2766180A1 (fr) * 1997-07-17 1999-01-22 Rhone Poulenc Rorer Sa Medicaments contenant en tant que principe actif un derive de 2-(1,2,3,4-tetrahydroxybutyl)pyrazine,nouveaux derives de 2-(1,2,3,4-tetrahydroxybutyl) pyrazine et leur preparation
FR2766185B1 (fr) * 1997-07-18 2001-06-15 Rhone Poulenc Rorer Sa Medicaments contenant en tant que principe actif au moins un derive substitue de polyhydroxylalkylpyrazines, les nouveaux derives polyhydroxylalkylpyrazines et leur preparation
JP6208094B2 (ja) 2014-08-26 2017-10-04 株式会社東芝 情報処理装置、情報処理システム、情報処理方法及びそのプログラム
JP6548920B2 (ja) 2015-03-09 2019-07-24 株式会社東芝 情報処理装置、情報処理方法及びプログラム
JP2017021695A (ja) 2015-07-14 2017-01-26 株式会社東芝 情報処理装置および情報処理方法
CN110837796B (zh) * 2019-11-05 2022-08-19 泰康保险集团股份有限公司 图像处理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59142678A (ja) * 1983-02-03 1984-08-15 Ricoh Co Ltd 枠認識方式
JPH0496878A (ja) * 1990-08-15 1992-03-30 Hitachi Ltd 画像傾き検出方式
JP2786355B2 (ja) * 1991-11-08 1998-08-13 沖電気工業株式会社 文章画像の属性判別方法
JP3304404B2 (ja) * 1992-07-31 2002-07-22 株式会社日立製作所 傾き検出方法および画像処理装置
JPH0676108A (ja) * 1992-08-24 1994-03-18 Oki Electric Ind Co Ltd 文書画像の傾き検出方法
JPH06150060A (ja) * 1992-11-12 1994-05-31 Ricoh Co Ltd 画像傾き検出方法及び表処理方法
JP3303246B2 (ja) * 1992-12-28 2002-07-15 株式会社リコー 画像処理装置

Also Published As

Publication number Publication date
JPH07105310A (ja) 1995-04-21

Similar Documents

Publication Publication Date Title
JP2930612B2 (ja) 画像形成装置
US5613016A (en) Area discrimination system for text image
US7194144B1 (en) Document image processing device, document image merging method, and storage medium recording a document image merging program
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US6493470B1 (en) Image processing method and apparatus for detecting the tilt amount of input image data
JP3411472B2 (ja) パターン抽出装置
JP3443141B2 (ja) 画像傾き検出方法及び表処理方法
US8472078B2 (en) Image processing apparatus for determining whether a region based on a combined internal region is a table region
JPH0418351B2 (ja)
JP3378439B2 (ja) 帳票画像作成装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2003115031A (ja) 画像処理装置および方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3187895B2 (ja) 文字領域抽出方法
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
JP3400154B2 (ja) 文書画像の領域抽出方法および装置
JP2008258980A (ja) 画像情報処理装置および画像傾斜角度算出方法
JPH06150060A (ja) 画像傾き検出方法及び表処理方法
JPH05274472A (ja) 画像認識装置
JPH0573718A (ja) 領域属性識別方式
JP2859307B2 (ja) 文字切出し装置
JP2602089B2 (ja) 文字認識装置
JPH0676108A (ja) 文書画像の傾き検出方法
JP4043692B2 (ja) デジタル画像形成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090620

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090620

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100620

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees