JPH03172983A - 表処理方法 - Google Patents

表処理方法

Info

Publication number
JPH03172983A
JPH03172983A JP1312868A JP31286889A JPH03172983A JP H03172983 A JPH03172983 A JP H03172983A JP 1312868 A JP1312868 A JP 1312868A JP 31286889 A JP31286889 A JP 31286889A JP H03172983 A JPH03172983 A JP H03172983A
Authority
JP
Japan
Prior art keywords
frame
rectangle
scanning direction
image
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1312868A
Other languages
English (en)
Other versions
JP2851087B2 (ja
Inventor
Goro Bessho
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1312868A priority Critical patent/JP2851087B2/ja
Publication of JPH03172983A publication Critical patent/JPH03172983A/ja
Application granted granted Critical
Publication of JP2851087B2 publication Critical patent/JP2851087B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は1文字認識装置等において、文書や帳票等の画
像中の表の処理方法に関する。
〔従来の技術〕
文字認識装置において文書画像を処理する場合、画像を
文字領域、写真や図等のイメージ領域1表領域等に分割
し、それぞれ別の処理を行うことが多い。
表領域に関しては、罫線の位置座標を用いて。
表中の各枠を認識し、各枠内の画像より文字を切り出し
てumする方法がとられている。
このような表の処理において、従来は、枠を構成する主
走査方向及び副走査方向の罫線の矩形を抽出し、この矩
形の内側(枠内より見て)の座標を用いて枠を認識して
いる。
〔発明が解決しようとする課題〕
しかし、文書画像が傾いて入力された場合に枠内の文字
を正しく切り出すことができなくなるという問題があっ
た。
例えば第4図に示すような画像の場合、罫線の矩形(細
線)の内側の座標で枠認識を行うと、罫線の傾きによる
罫線矩形の太りの分だけ、実際の枠よりかなり狭い枠6
1が認識され、その結果、枠内の罫線に接近した文字が
枠からはみ出し、正常に切り出すことができなくなる場
合がある。
本発明の1的は1文書画像が傾いて入力された場合にお
いても5表中の文字を正しく切り出し認識することが可
能な表処理方法を提供することである。
〔課題を解決するための手段〕
本発明の表処理方法は1表領域において主走査方向及び
副走査方向の罫線を包含する矩形を抽出し、罫線によっ
て囲まれる枠を罫線の矩形の外側(枠内より見て)の座
標を用いて認識し、枠内の主走査方向及び副走査方向に
対する射影により罫線の存在位置を求め、この位置及び
その外側にある枠内の黒連結の外接矩形を不要矩形とし
て除去し、残った枠内の黒連結の外接矩形を用いて文字
を切り出すことを特徴とする。
(作 用〕 罫線の矩形の外側の座標を用いて枠を認識するため1文
書が傾いている場合においても、認識される枠の幅が実
際より極端に狭くなることがなくなるので1文字欠けを
防止できる。
例えば第4図に示した傾いた表の画像の場合、本発明に
よれば、広い枠62が認識される。
他方、罫線の矩形の外側の座標を用いるため。
認識された枠の内部に、枠を構成する罫線の一部が含ま
れ、文書画像の傾きが大きい場合には、さらに処理対象
として注目している枠の隣の枠内の文字も含まれること
がある。このような罫線や文字は、注目している枠内の
文字切出しの前に予め除去することが望ましい。
本発明によれば、このような注目枠の罫線や隣接枠内の
文字を構成する黒連結の外接矩形を不要矩形として除去
し、枠内の文字を正確に切り出して認識することができ
る。
なお、黒連結の外接矩形と枠との接触を調べ。
枠に接した黒連結外接矩形を不要矩形として除去する方
法も考えられ、文書の傾きが大きくない場合には有効で
ある。しかし1文書画像の傾きが極端な場合に、隣接枠
内の枠に接触しない文字を除去できないことがあり、不
完全である。
〔実施例〕
第1図は本発明の一実施例を示すブロック図、第2図は
処理のフローチャートである。
スキャナ等の2値画像入力部11によって文書を読取り
、その2値の画像を2値イメージメモリ12に格納する
(処理ステップ41)、この文書画像に対して1表領域
!gR部13は表領域を!g識し、そのイメージを表領
域イメージメモリ14に格納する(処理ステップ42)
、この表領域認識は、ランレングス分布等を利用して自
動的に認識する方法と、マウス等を用いて外部より領域
を指定することによって認識する方法とがある。
主走査方向線分抽出部15において1表領域イメージに
対して、主走査方向に連結した黒画素を追跡することに
より、第5図に示すように主走査方向の罫線71を囲む
矩形72を抽出し、その始点座標(Xs、Ys)及び終
点座標(Xe、Ye)を主走査方向線分座標メモリ16
に格納する(処理ステップ43)。
副走査方向線分抽出部17において1表領域イメージに
対し、同様に副走査方向の罫線の矩形を抽出し、その始
終点座標を副走査方向線分座標メモリ18に格納する(
処理ステップ44)。
次に枠認識部19において、主走査方向罫線と副走査方
向罫線の組合せにより枠の認識を行い。
この枠の例えば対角頂点の座標を枠座標メモリ20に格
納する(ステップ45)、この際、前述の如く、枠を構
成する罫線の矩形の外側の座標(上辺の罫線では上側、
下辺の罫線では下側、左辺の罫線では左側、右辺の罫線
では右側の座標)を用いて、枠の対角頂点の座標を求め
る。このようにして、第4図の枠62のような枠が認識
される。
次に枠領域抽出部21において、枠座標に従って表領域
イメージより枠内のイメージを切り出し、それを枠内イ
メージメモリ22に格納する(処理ステップ46)。
黒連結外接矩形抽出部23において、枠内イメージより
黒連結の外接矩形を抽出し、その座標を外接矩形メモリ
24に格納する(処理ステップ47)。
主走査方向射影部25において、枠内イメージの主走査
方向に対する射影を求め、射影値のピーク部分を主走査
方向罫線の存在位置として検出し、その座標を主走査方
向射影部標メモリ26に格納する(処理ステップ48)
。副走査方向射影部27において同様に枠内イメージの
副走査方向に対する射影を求めて副走査方向罫線の存在
位置を検出し、その座標を副走査方向罫線座標メモリ2
8に格納する(処理ステップ49)。
次に不要矩形除去部29において、外接矩形メモリ24
及び各罫線座標メモリ26.28を参照し、各方向罫線
の存在色b′tにある黒連結外接矩形(枠の罫線に相当
)及びその外側にある黒連結外接矩形(注目枠の外側の
文字等)を不要矩形として除去し、残った黒連結外接矩
形の座標のみを枠内文字矩形メモリ30に格納する(処
理ステップ50)。
例えば画像の傾きが大きい場合、第3図に示すような枠
内イメージ81が切り出され、これに対して同図に示す
ような主走査方向射影82が得られ、符号83及び84
で示される範囲が主走査方向罫線の存在位置として検出
される。副走査方向罫線の存在位置も同様に検出される
。そして、この位置に基づいた不要矩形除去処理によっ
て、枠の罫線及び隣接枠内の文字行85.86に対応し
た黒連結外接矩形が除去され、注目枠内の文字行87に
対応した黒連結外接矩形だけを残すことができる。
さて行切出し部31において、不要矩形除去部29によ
って除去されずに残った黒連結外接矩形について、文字
サイズの推定、矩形統合を行って枠内の文字行(文字素
を構成する外接矩形の統合矩形)を生成し、また、その
必要な修正または削除を行い、最終的な文字行のイメー
ジを枠内イメージメモリ22より切り出して行イメージ
メモリ32に格納する(処理ステップ51,52,53
゜54.55)。
次に文字切出し・認識部33において1文字行イメージ
より文字を切出して認識する(処理ステップ56)。
〔発明の効果〕
以上の説明から明らかな如く、本発明によれば、文書画
像が極端に傾いて入力された場合においても、認識され
る枠が不適当なほど実際より狭くなることがないため、
文字画像の欠落を防止することができ、また認識した枠
内の黒連結による矩形のうちの罫線や隣接枠内文字を構
成する黒連結外接矩形を除去して文字切り出しを行うた
め、枠内の文字の切出し及び認識を正確に行うことがで
きる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
処理のフローチャート、第3図は画像の傾きが大きい場
合の枠内イメージの不要矩形除去処理の説明図、第4図
は枠認識の説明図、第5図は罫線の矩形の説明図である
。 11・・・2値画像入力部、 13・・・表領域認識部
、15・・・主走査方向線分抽出部、 17・・・副走査方向線分抽出部、 19・・・枠認識部、 21・・・枠領域抽出部、23
・・・黒連結外接矩形抽出部、 25・・・主走査方向射影部。 27・・・副走査方向射影部、 29・・・不要矩形除去部、 31・・・行切出し部、
33・・・文字切出し・L&識部。 第1図 第2図

Claims (1)

    【特許請求の範囲】
  1. (1)表領域において主走査方向及び副走査方向の罫線
    の矩形を抽出し、罫線によって囲まれる枠を罫線の矩形
    の外側の座標を用いて認識し、枠内の主走査方向及び副
    走査方向に対する射影により罫線の存在位置を求め、こ
    の位置及びその外側にある枠内の黒連結の外接矩形を不
    要矩形として除去し、残った枠内の黒連結の外接矩形を
    用いて文字を切り出すことを特徴とする表処理方法。
JP1312868A 1989-12-01 1989-12-01 表処理方法 Expired - Fee Related JP2851087B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1312868A JP2851087B2 (ja) 1989-12-01 1989-12-01 表処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1312868A JP2851087B2 (ja) 1989-12-01 1989-12-01 表処理方法

Publications (2)

Publication Number Publication Date
JPH03172983A true JPH03172983A (ja) 1991-07-26
JP2851087B2 JP2851087B2 (ja) 1999-01-27

Family

ID=18034404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1312868A Expired - Fee Related JP2851087B2 (ja) 1989-12-01 1989-12-01 表処理方法

Country Status (1)

Country Link
JP (1) JP2851087B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164320A (ja) * 2013-02-21 2014-09-08 Mitsubishi Electric Corp 文字認識装置および文字認識方法
CN111563511A (zh) * 2020-04-30 2020-08-21 广东小天才科技有限公司 一种智能框题的方法、装置、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164320A (ja) * 2013-02-21 2014-09-08 Mitsubishi Electric Corp 文字認識装置および文字認識方法
CN111563511A (zh) * 2020-04-30 2020-08-21 广东小天才科技有限公司 一种智能框题的方法、装置、电子设备及存储介质
CN111563511B (zh) * 2020-04-30 2023-11-14 广东小天才科技有限公司 一种智能框题的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
JP2851087B2 (ja) 1999-01-27

Similar Documents

Publication Publication Date Title
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP3756719B2 (ja) 文書修飾装置及び画像処理装置
CN111414877A (zh) 去除颜色边框的表格裁切方法、图像处理设备和存储介质
JPH03172983A (ja) 表処理方法
JP2851089B2 (ja) 表処理方法
JP4165046B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
JPH08123901A (ja) 文字抽出装置及び該装置を用いた文字認識装置
JP2800192B2 (ja) 高速文字図形分離装置
JPS61193277A (ja) 文書読取装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JPS6337487A (ja) 文字認識装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JPH05128305A (ja) 領域分割方法
JP2931041B2 (ja) 表内文字認識方法
JP2002269547A (ja) 印影読取方法および装置
JP3157534B2 (ja) 表認識方法
JPH08202824A (ja) 文書画像認識装置
JP2926842B2 (ja) 文字切出し回路
JPH03113687A (ja) 文字行検出方式
JPH04167194A (ja) 表処理方式
JP2721415B2 (ja) 文字画像抽出方法
JPH05274472A (ja) 画像認識装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071113

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081113

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081113

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091113

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees