JP2851087B2 - 表処理方法 - Google Patents

表処理方法

Info

Publication number
JP2851087B2
JP2851087B2 JP1312868A JP31286889A JP2851087B2 JP 2851087 B2 JP2851087 B2 JP 2851087B2 JP 1312868 A JP1312868 A JP 1312868A JP 31286889 A JP31286889 A JP 31286889A JP 2851087 B2 JP2851087 B2 JP 2851087B2
Authority
JP
Japan
Prior art keywords
frame
rectangle
scanning direction
ruled line
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1312868A
Other languages
English (en)
Other versions
JPH03172983A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1312868A priority Critical patent/JP2851087B2/ja
Publication of JPH03172983A publication Critical patent/JPH03172983A/ja
Application granted granted Critical
Publication of JP2851087B2 publication Critical patent/JP2851087B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置等において、文書や帳票等の
画像中の表の処理方法に関する。
〔従来の技術〕
文字認識装置において文書画像を処理する場合、画像
を文字領域、写真や図等のイメージ領域、表領域等に分
割し、それぞれ別の処理を行うことが多い。
表領域に関しては、罫線の位置座標を用いて、表中の
各枠を認識し、各枠内の画像より文字を切り出して認識
する方法がとられている。
このような表の処理において、従来は、枠を構成する
主走査方向及び副走査方向の罫線の矩形を抽出し、この
矩形の内側(枠内より見て)の座標を用いて枠を認識し
ている。
〔発明が解決しようとする課題〕
しかし、文書画像が傾いて入力された場合に枠内の文
字を正しく切り出すことができなくなるという問題があ
った。
例えば第4図に示すような画像の場合、罫線の矩形
(細線)の内側の座標で枠認識を行うと、罫線の傾きに
よる罫線矩形の太りの分だけ、実際の枠よりかなり狭い
枠61が認識され、その結果、枠内の罫線に接近した文字
が枠からはみ出し、正常に切り出すことができなくなる
場合がある。
本発明の目的は、文書画像が傾いて入力された場合に
おいても、表中の文字を正しく切り出し認識することが
可能な表処理方法を提供することである。
〔課題を解決するための手段〕
本発明の表処理方法は、表領域において主走査方向及
び副走査方向の罫線を包含する矩形を抽出し、罫線によ
って囲まれる枠を罫線の矩形の外側(枠内より見て)の
座標を用いて認識し、枠内の主走査方向及び副走査方向
に対する射影により罫線の存在位置を求め、この位置及
びその外側にある枠内の黒連結の外接矩形を不要矩形と
して除去し、残った枠内の黒連結の外接矩形を用いて文
字を切り出すことを特徴とする。
〔作 用〕
罫線の矩形の外側の座標を用いて枠を認識するため、
文書が傾いている場合においても、認識される枠の幅が
実際より極端に狭くなることがなくなるので、文字欠け
を防止できる。
例えば第4図に示した傾いた表の画像の場合、本発明
によれば、広い枠62が認識される。
他方、罫線の矩形の外側の座標を用いるため、認識さ
れた枠の内部に、枠を構成する罫線の一部が含まれ、文
書画像の傾きが大きい場合には、さらに処理対象として
注目されている枠の隣の枠内の文字も含まれることがあ
る。このような罫線や文字は、注目している枠内の文字
切出しの前に予め除去することが望ましい。
本発明によれば、このような注目枠の罫線や隣接枠内
の文字を構成する黒連結の外接矩形を不要矩形として除
去し、枠内の文字を正確に切り出して認識することがで
きる。
なお、黒連結の外接矩形と枠との接触を調べ、枠に接
した黒連結外接矩形を不要矩形として除去する方法も考
えられ、文書の傾きが大きくない場合には有効である。
しかし、文書画像の傾きが極端な場合に、隣接枠内の枠
に接触しない文字を除去できないことがあり、不完全で
ある。
〔実施例〕
第1図は本発明の一実施例を示すブロック図、第2図
は処理フローチャートである。
スキャナ等の2値画像入力部11によって文書を読取
り、その2値の画像を2値イメージメモリ12に格納する
(処理ステップ41)。この文書画像に対して、表領域認
識部13は表領域を認識し、そのイメージを表領域イメー
ジメモリ14に格納する(処理ステップ42)。この表領域
認識は、ランレングス分布等を利用して自動的に認識す
る方法と、マウス等を用いて外部より領域を指定するこ
とによって認識する方法とがある。
主走査方向線分抽出部15において、表領域イメージに
対して、主走査方向に連結した黒画素を追跡することに
より、第5図に示すように主走査方向の罫線71を囲む矩
形72を抽出し、その始点座標(Xs,Ys)及び終点座標(X
e,Ye)を主走査方向線分座標メモリ16に格納する(処理
ステップ43)。
副走査方向線分抽出部17において、表領域イメージに
対し、同様に副走査方向の罫線の矩形を抽出し、その始
終点座標を副走査方向線分座標メモリ18に格納する(処
理ステップ44)。
次に枠認識部19において、主走査方向罫線と副走査方
向罫線の組合せにより枠の認識を行い、この枠の例えば
対角頂点の座標を枠座標メモリ20に格納する(ステップ
45)。この際、前述の如く、枠を構成する罫線の矩形の
外側の座標(上辺の罫線では上側、下辺の罫線では下
側、左辺の罫線では左側、右辺の罫線では右側の座標)
を用いて、枠の対角頂点の座標を求める。このようにし
て、第4図の枠62のような枠が認識される。
次に枠領域抽出部21において、枠座標に従って表領域
イメージより枠内のイメージを切り出し、それを枠内イ
メージメモリ22に格納する(処理ステップ46)。
黒連結外接矩形抽出部23において、枠内イメージより
黒連結の外接矩形を抽出し、その座標を外接矩形メモリ
24に格納する(処理ステップ47)。
主走査方向射影部25において、枠内イメージの主走査
方向に対する射影を求め、射影値のピーク部分を主走査
方向罫線の存在位置として検出し、その座標を主走査方
向罫線座標メモリ26に格納する(処理ステップ48)。副
走査方向射影部27において同様に枠内イメージの副走査
方向に対する射影を求めて副走査方向罫線の存在位置を
検出し、その座標を副走査方向罫線座標メモリ28に格納
する(処理ステップ49)。
次に不要矩形除去部29において、外接矩形メモリ24及
び各罫線座標メモリ26,28を参照し、各方向罫線の存在
位置にある黒連結外接矩形(枠の罫線に相当)及びその
外側にある黒連結外接矩形(注目枠の外側の文字等)を
不要矩形として除去し、残った黒連結外接矩形の座標の
みを枠内文字矩形メモリ30に格納する(処理ステップ5
0)。
例えば画像の傾きが大きい場合、第3図に示すような
枠内イメージ81が切り出され、これに対して同図に示す
ような主走査方向射影82が得られ、符号83及び84で示さ
れる範囲が主走査方向罫線の存在位置として検出され
る。副走査方向罫線の存在位置も同様に検出される。そ
して、この位置に基づいた不要矩形除去処理によって、
枠の罫線及び隣接枠内の文字行85,86に対応した黒連結
外接矩形が除去され、注目枠内の文字行87に対応した黒
連結外接矩形だけを残すことができる。
さて行切出し部31において、不要矩形除去部29によっ
て除去されずに残った黒連結外接矩形について、文字サ
イズの推定、矩形統合を行って枠内の文字行(文字素を
構成する外接矩形の統合矩形)を生成し、また、その必
要な修正または削除を行い、最終的な文字行のイメージ
を枠内イメージメモリ22より切り出して行イメージメモ
リ32に格納する(処理ステップ51,52,53,54,55)。
次に文字切出し・認識部33において、文字行イメージ
より文字を切出して認識する(処理ステップ56)。
〔発明の効果〕
以上の説明から明らかな如く、本発明によれば、文書
画像が極端に傾いて入力された場合においても、認識さ
れる枠が不適当なほど実際より狭くなることがないた
め、文字画像の欠落を防止することができ、また認識し
た枠内の黒連結による矩形のうちの罫線や隣接枠内文字
を構成する黒連結外接矩形を除去して文字切り出しを行
うため、枠内の文字の切出し及び認識を正確に行うこと
ができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
処理のフローチャート、第3図は画像の傾きが大きい場
合の枠内イメージの不要矩形除去処理の説明図、第4図
は枠認識の説明図、第5図は罫線の矩形の説明図であ
る。 11……2値画像入力部、13……表領域認識部、 15……主走査方向線分抽出部、 17……副走査方向線分抽出部、 19……枠認識部、21……枠領域抽出部、 23……黒連結外接矩形抽出部、 25……主走査方向射影部、 27……副走査方向射影部、 29……不要矩形除去部、31……行切出し部、 33……文字切出し・認識部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】表領域において主走査方向及び副走査方向
    の罫線の矩形を抽出し、罫線によって囲まれる枠を罫線
    の矩形の外側の座標を用いて認識し、枠内の主走査方向
    及び副走査方向に対する射影により罫線の存在位置を求
    め、この位置及びその外側にある枠内の黒連結の外接矩
    形を不要矩形として除去し、残った枠内の黒連結の外接
    矩形を用いて文字を切り出すことを特徴とする表処理方
    法。
JP1312868A 1989-12-01 1989-12-01 表処理方法 Expired - Fee Related JP2851087B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1312868A JP2851087B2 (ja) 1989-12-01 1989-12-01 表処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1312868A JP2851087B2 (ja) 1989-12-01 1989-12-01 表処理方法

Publications (2)

Publication Number Publication Date
JPH03172983A JPH03172983A (ja) 1991-07-26
JP2851087B2 true JP2851087B2 (ja) 1999-01-27

Family

ID=18034404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1312868A Expired - Fee Related JP2851087B2 (ja) 1989-12-01 1989-12-01 表処理方法

Country Status (1)

Country Link
JP (1) JP2851087B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6076128B2 (ja) * 2013-02-21 2017-02-08 三菱電機株式会社 文字認識装置および文字認識方法
CN111563511B (zh) * 2020-04-30 2023-11-14 广东小天才科技有限公司 一种智能框题的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JPH03172983A (ja) 1991-07-26

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2851087B2 (ja) 表処理方法
JP2851089B2 (ja) 表処理方法
US7206463B2 (en) Image processing method, device and system
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP2800192B2 (ja) 高速文字図形分離装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JP2931041B2 (ja) 表内文字認識方法
JPH0728934A (ja) 文書画像処理装置
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH01270107A (ja) 数値制御加工装置のプログラム作成装置
JPH05108880A (ja) 英文字認識装置
JPH03113687A (ja) 文字行検出方式
JPH01116891A (ja) 文字認識装置
JP3149069B2 (ja) 関心領域の自動設定方法
JPH02253386A (ja) 文字認識装置
JP3157534B2 (ja) 表認識方法
JP3635552B2 (ja) 文字パターン切り出し装置および文字パターン切り出しプログラムを記録した記録媒体
JPH05128305A (ja) 領域分割方法
JPH09161007A (ja) 表領域文字認識方法
JP2991761B2 (ja) 行切出し方法
JPH08202824A (ja) 文書画像認識装置
JP3031565B2 (ja) 表領域判定方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071113

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081113

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081113

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091113

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees