JP3162414B2 - Ruled line recognition method and table processing method - Google Patents

Ruled line recognition method and table processing method

Info

Publication number
JP3162414B2
JP3162414B2 JP08093891A JP8093891A JP3162414B2 JP 3162414 B2 JP3162414 B2 JP 3162414B2 JP 08093891 A JP08093891 A JP 08093891A JP 8093891 A JP8093891 A JP 8093891A JP 3162414 B2 JP3162414 B2 JP 3162414B2
Authority
JP
Japan
Prior art keywords
line
recognized
black pixel
scanning direction
rectangles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08093891A
Other languages
Japanese (ja)
Other versions
JPH04291478A (en
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP08093891A priority Critical patent/JP3162414B2/en
Publication of JPH04291478A publication Critical patent/JPH04291478A/en
Application granted granted Critical
Publication of JP3162414B2 publication Critical patent/JP3162414B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文書や帳票の2値画像
における罫線の認識と表の処理に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to the recognition of ruled lines and the processing of tables in binary images of documents and forms.

【0002】[0002]

【従来の技術】一般に文字認識装置において文書あるい
は帳票を処理する場合、その画像を文字領域、イメージ
領域(写真、図等)、表領域に分割し、それぞれの領域
に別の処理を行なうことが多い。
2. Description of the Related Art In general, when a document or a form is processed by a character recognition device, the image is divided into a character area, an image area (photograph, figure, etc.) and a table area, and each area is subjected to another processing. Many.

【0003】従来、表領域の処理に関しては、表領域の
2値画像より黒画素連結矩形を求め、一定以上の長さの
矩形を罫線として認識している。そして、認識した主走
査方向と副走査方向の罫線で囲まれた領域を表の一つの
枠として認識し、枠内の画像を切り出し、この画像より
文字を切り出し認識している。このような処理方法の例
は、本願出願人による特願平1−314519号、特願
平1−312868号、特願平2−134876号及び
特願平2−134878号等の特許願に添付の明細書及
び図面に述べられている。
Conventionally, in the processing of a table area, a black pixel connection rectangle is obtained from a binary image of the table area, and a rectangle having a certain length or more is recognized as a ruled line. Then, the area surrounded by the ruled lines in the main scanning direction and the sub-scanning direction is recognized as one frame of the table, an image in the frame is cut out, and characters are cut out from this image and recognized. Examples of such processing methods are described in Japanese Patent Application Nos. 1-314519, 1-312868, 2-134876 and 2-14878 by the applicant of the present invention. In the specification and the drawings.

【0004】[0004]

【発明が解決しようとする課題】従来の方法によれば、
一定以上の長さの矩形でないと罫線として認識されない
ため、点線のような実線でない罫線が一本でも表に含ま
れていると、表の枠の認識を正常に行なうことができ
ず、その結果、表内文字認識のエラーが起こるという問
題があった。しかし近年、非実線の罫線を含む表が頻繁
に用いられるため、その正常な処理に対する要求が高ま
っている。
According to the conventional method,
If it is not a rectangle longer than a certain length, it will not be recognized as a ruled line.If even a single ruled line such as a dotted line is included in the table, the table frame cannot be recognized properly. However, there is a problem that an error in character recognition in a table occurs. However, in recent years, since tables including non-solid ruled lines are frequently used, demands for normal processing are increasing.

【0005】したがって本発明の目的は、点線のような
非実線の罫線を含んだ表に対しても正確な処理を可能に
するための罫線認識方法及び表処理方法を提供すること
にある。
Accordingly, an object of the present invention is to provide a ruled line recognition method and a table processing method for enabling accurate processing of a table including a non-solid ruled line such as a dotted line.

【0006】[0006]

【課題を解決するための手段】請求項1の発明によれ
ば、2値画像について、主走査方向及び副走査方向の所
定ライン数毎に、まず黒画素連結矩形を抽出し、幅及び
高さがそれぞれ所定範囲内の黒画素連結矩形を実線の
線候補として抽出し、注目走査方向の距離が所定範囲内
の隣接罫線候補を統合し、実線の罫線として認識する。
さらに、この段階で実線の罫線として認識されなかった
黒画素連結矩形について、幅、高さ及び注目走査方向の
隣接矩形間距離のヒストグラムを生成し、ヒストグラム
値が一定値を越える幅、高さ及び隣接矩形間距離のそれ
ぞれの範囲を求め、実線の罫線として認識されなかった
黒画素連結矩形のうちで幅、高さ及び隣接矩形間距離
のすべてが前記範囲内に含まれる黒画素連結矩形を統合
し、非罫線として認識する。
According to the Summary of the invention of claim 1, with the binary image for every predetermined number of lines in the main scanning direction and the sub-scanning direction, first extracts a black pixel connecting rectangular, width, and height of each extracted black pixel connected rectangles within a predetermined range as a solid line ruled <br/> line candidate, the distance of the target scanning direction integrates adjacent border candidates in the predetermined range, recognized as solid borders.
Further, a histogram of the width, height, and distance between adjacent rectangles in the target scanning direction is generated for black pixel connected rectangles not recognized as solid ruled lines at this stage, and the width, height, and The respective ranges of the distance between adjacent rectangles are obtained, and among the black pixel connection rectangles that are not recognized as the solid ruled lines, the black pixel connection rectangles in which all of the width, the height, and the distance between the adjacent rectangles are included in the range are determined. Integration
Then, it is recognized as a non- ruled line.

【0007】請求項2の発明によれば、文書もしくは帳
票の表領域の2値画像において、請求項1記載の罫線認
識方法によって主走査方向及び副走査方向の罫線を認識
し、認識した罫線の情報より表の枠領域を認識し、そし
て枠領域内の文字を切り出し文字認識する。
According to the second aspect of the present invention, in the binary image of the table area of the document or the form, the ruled lines in the main scanning direction and the sub-scanning direction are recognized by the ruled line recognition method according to the first aspect. The table frame area is recognized from the information, and characters in the frame area are cut out and recognized.

【0008】[0008]

【作用】実線の罫線の部分では、比較的大きな幅(長
さ)と一定範囲内の高さ(太さ)を持つ黒画素連結矩形
が抽出され、また、仮に分断があっても、同一の罫線に
属する隣接した矩形の間の距離は一定範囲以内となる。
したがって、請求項1の発明によれば、連結黒画素矩形
の幅と高さに着目した罫線候補抽出によって実線の罫線
を構成する可能性の高い黒画素連結矩形を抽出し、その
隣接矩形間距離に着目した統合により実線の罫線を認識
することができる。
[Action] In the portion of the solid borders are extracted black pixel connected rectangle with a relatively large width (length) and height within a certain range (thickness) and, even if temporarily interrupted, the same The distance between adjacent rectangles belonging to the ruled line is within a certain range.
Therefore, according to the first aspect of the present invention, by extracting ruled line candidates focusing on the width and height of the connected black pixel rectangle, a black pixel connected rectangle having a high possibility of forming a solid ruled line is extracted, and the distance between adjacent rectangles is extracted. , The solid ruled line can be recognized.

【0009】他方、点線もしくは破線、あるいは鎖線の
罫線の場合、実線の罫線の場合に比べ、抽出される黒画
素連結矩形の幅が小さく、隣接矩形間の距離が大きくな
るとともに、これらの値は線の種類によって異なる。し
かし、点線もしくは破線あるいは鎖線の罫線は、線の種
類に固有の長さの線を固有の間隔で固有の規則に従って
繋いだパターンであるため、黒画素連結矩形の幅、高さ
及び隣接間距離のヒストグラムをとると、線種に固有の
幅、高さ及び距離でピークを示す。そして、有効な一定
長以上の罫線であれば、そのヒストグラムのピーク値は
一定値を越える。したがって、請求項1の発明によれ
ば、そのようなヒストグラムに着目した罫線認識によっ
て、点線や破線あるいは鎖線といった非実線の罫線を認
識することができる。
On the other hand, in the case of a dotted line, a broken line, or a chain line, the width of the extracted black pixel connection rectangle is smaller and the distance between adjacent rectangles is larger than in the case of the solid line. Depends on line type. However, the ruled line of a dotted line, a broken line, or a chain line is a pattern in which lines having a specific length according to the line type are connected at a specific interval according to a specific rule, so that the width, height, and distance between adjacent black pixel connection rectangles are determined. Takes a peak at a width, height and distance unique to the line type. If the ruled line has an effective length greater than a certain length, the peak value of the histogram exceeds the certain value. Therefore, according to the first aspect of the present invention, a non-solid ruled line such as a dotted line, a broken line, or a chain line can be recognized by such ruled line recognition focusing on the histogram.

【0010】また、請求項2の発明によれば、主走査方
向及び副走査方向の罫線を実線または非実線を問わずに
認識し、実線の罫線のみからなる表、非実線の罫線のみ
からなる表、実線と非実線の罫線が混在した表のいずれ
についても、罫線によって囲まれた枠領域内の文字の切
り出しと認識を正常に行なうことができる。
According to the second aspect of the present invention, the ruled lines in the main scanning direction and the sub-scanning direction are recognized irrespective of solid lines or non-solid lines, and a table consisting only of solid lines and a table consisting only of non-solid lines are provided. Regardless of a table or a table in which solid lines and non-solid lines are mixed, characters in a frame area surrounded by the ruled lines can be normally cut out and recognized.

【0011】[0011]

【実施例】図1は本発明の一実施例に係る処理装置のブ
ロック図、図2は処理のフローチャート、図3及び図4
は罫線認識の説明のための図である。
FIG. 1 is a block diagram of a processing apparatus according to an embodiment of the present invention, FIG. 2 is a flowchart of the processing, and FIGS.
Is a diagram for explaining ruled line recognition.

【0012】2値画像入力部1において、スキャナ等に
より文書画像の2値データを入力し2値イメージメモリ
2に格納する(処理ステップ100)。表領域認識部3
において、2値イメージメモリ2内のイメージデータに
対して表領域を自動的に認識するか、あるいはマウス等
を用いて人手により領域指定をすることによって表領域
を認識し、表領域のイメージデータを切り出して表領域
イメージメモリ4に格納する(処理ステップ102)。
In the binary image input unit 1, binary data of a document image is input by a scanner or the like and stored in the binary image memory 2 (processing step 100). Table area recognition unit 3
The table area is automatically recognized for the image data in the binary image memory 2, or the table area is recognized by manually specifying the area using a mouse or the like, and the image data of the table area is recognized. It is cut out and stored in the table area image memory 4 (processing step 102).

【0013】次に、表領域イメージデータに対し、罫線
を抽出するための処理(処理ステップ104〜処理ステ
ップ114)を、主走査方向及び副走査方向のそれぞれ
について予め決められた固定ライン数(数ライン)単位
実行する。この処理の内容は次の通りである。
Next, processing for extracting ruled lines from the table area image data (processing steps 104 to 114) is performed by a predetermined fixed line number (number) in each of the main scanning direction and the sub-scanning direction. (Line) Execute the unit. The contents of this processing are as follows.

【0014】黒画素連結矩形生成部5において、表領域
イメージメモリ4の表領域イメージデータにおける注目
する固定ライン数分について、黒画素を追跡して連結し
た黒画素を、それを包含する矩形(黒画素連結矩形)
して抽出し、この黒画素連結矩形の情報(対角頂点の座
標、高さ、幅など)を黒画素連結矩形メモリ6に格納す
る(処理ステップ104)。
In the black pixel connection rectangle generation unit 5, the table area
Attention in the table area image data of the image memory 4
For the fixed number of lines, black pixels connected by tracking black pixels are extracted as rectangles (black pixel connection rectangles) including the black pixels, and information on the black pixel connection rectangles (coordinates and heights of diagonal vertices) , Width, etc.) are stored in the black pixel connection rectangular memory 6 (processing step 104).

【0015】罫線候補抽出部7において、黒画素連結矩
形メモリ6内のデータを参照し、抽出された黒画素連結
矩形の幅(注目する走査方向のサイズ)及び高さ(注目
走査方向に垂直な方向のサイズ)を、それぞれあらかじ
め定めた所定のパラメータと比較することにより、幅及
び高さが罫線(実線罫線)の候補とみなせる範囲内の黒
画素連結矩形を罫線候補として抽出し、その情報を罫線
候補メモリ8に格納する(処理ステップ106)。
The ruled-line candidate extraction unit 7 refers to the data in the black pixel connection rectangle memory 6 and refers to the width (size in the scanning direction of interest) and height (vertical to the attention scanning direction) of the extracted black pixel connection rectangle. the direction size), respectively beforehand
By comparing a predetermined parameter that defines because extracts black pixel connected rectangles within the width and height can be regarded as a candidate of the ruled line (solid line border) as ruled line candidate, and stores the information in the ruled line candidate memory 8 (Processing step 106).

【0016】次に第一罫線抽出部9において、罫線候補
メモリ8の情報を参照し、注目している走査方向の距離
あらかじめ定めた統合許容パラメータ以内の黒画素連
結矩形を統合し、罫線(実線罫線)として認識し、その
情報を罫線メモリ10に格納する(処理ステップ10
8)。これは、実際の表では、罫線が交差している箇所
において、実線でも罫線が分断されている場合があり、
それを補正するために行うものである。なお、これ以外
の処理ステップ106で罫線候補として抽出された黒画
素連結矩形については、その情報を罫線メモリ10に格
納する。この処理の段階で、実線の罫線が認識されたこ
とになる
Next, the first ruled line extraction unit 9 refers to the information in the ruled line candidate memory 8 and integrates black pixel connection rectangles whose distance in the scanning direction of interest is within a predetermined integration allowable parameter , and forms a ruled line ( It is recognized as a solid ruled line , and the information is stored in the ruled line memory 10 (processing step 10).
8). This is where the ruled lines intersect in the actual table
In, ruled lines may be divided even with solid lines,
This is performed to correct it. Other than this
Black image extracted as a ruled line candidate in the processing step 106
Regarding the element connection rectangle, the information is stored in the ruled line memory 10.
To pay. At this stage of the process, the solid ruled line is recognized.
And

【0017】次に黒画素連結矩形計数部11において、
処理ステップ108で罫線(実線罫線)として抽出され
たものを除いた黒画素連結矩形の情報を黒画素連結矩形
メモリ6より読み込み、また、隣接矩形間の距離を計算
し、それらの幅、高さ及び距離のヒストグラムを計算
し、ヒストグラムデータをヒストグラムメモリ12に格
納する(処理ステップ110)。
Next, in the black pixel connected rectangle counting section 11,
The information of the black pixel connected rectangle except for those extracted as the ruled lines (solid line ruled lines) in the processing step 108 is read from the black pixel connected rectangle memory 6, the distance between adjacent rectangles is calculated, and their width and height are calculated. And a histogram of the distance are calculated, and the histogram data is stored in the histogram memory 12 (processing step 110).

【0018】第二罫線抽出部13において、ヒストグラ
ムメモリ12内の各ヒストグラムデータを参照し、ヒス
トグラム値が一定値を越えた幅、高さ及び距離の範囲を
求める。例えば幅について図4に示すようなヒストグラ
ムが得られた場合、斜線を施した幅の範囲を求める。そ
して、処理ステップ110で対象となった黒画素連結矩
形のうちで、幅、高さ及び距離が全てそれぞれの上記範
囲内に含まれる黒画素連結矩形を統合し、罫線(非実線
罫線)として認識し、その情報を罫線メモリ10に格納
する(処理ステップ112)。このようにして、図3に
示した破線もしくは点線のような非実線の罫線に相当す
る黒画素連結矩形Aを統合し、罫線として認識すること
ができる。
The second ruled line extracting unit 13 refers to each histogram data in the histogram memory 12 to determine a range of the width, height and distance where the histogram value exceeds a certain value. For example, when a histogram as shown in FIG. 4 is obtained for the width, the range of the hatched width is obtained. Then, among the black pixel connection rectangles targeted in the processing step 110, the black pixel connection rectangles whose width, height and distance are all included in the respective ranges are integrated, and a ruled line (non-solid line)
(Ruled line) , and the information is stored in the ruled line memory 10 (processing step 112). In this way, the black pixel connection rectangle A corresponding to a non-solid ruled line such as a broken line or a dotted line shown in FIG. 3 can be integrated and recognized as a ruled line.

【0019】以上の罫線認識の処理ループ(処理ステッ
プ104〜112)を固定ライン数単位に、主走査方向
及び副走査方向のそれぞれについて繰り返し、表領域全
体について終了すると(処理ステップ114)、表認識
の処理(処理ステップ116〜126)に進む。
The above-described ruled line recognition processing loop (processing steps 104 to 112) is repeated for each of the main scanning direction and the sub-scanning direction in units of a fixed number of lines, and when the entire table area is completed (processing step 114), the table recognition is performed. (Processing steps 116 to 126).

【0020】まず枠認識部14において、罫線メモリ1
0内の罫線情報を参照し、認識された主走査方向と副走
査方向の罫線により囲まれた枠を認識し、各枠の座標
(対角2頂点の座標など)を枠座標メモリ15に格納す
る(処理ステップ116)。次に枠領域抽出部16にお
いて、枠座標メモリ15内の情報を参照することによ
り、各枠領域のイメージデータを表領域イメージメモリ
4内の表領域イメージデータより切り出して枠イメージ
メモリ17に格納する(処理ステップ118)。行切り
出し部18において、枠領域イメージメモリ17内のデ
ータより、例えば主走査方向の射影を利用する方法によ
って行(文字列)のイメージデータを切り出し、それを
行イメージメモリ19に格納する(処理ステップ12
0)。次に文字切り出し部20において、この行イメー
ジデータより、例えば副走査方向の射影を利用する方法
によって文字のイメージデータを切り出して文字認識部
21に渡す(処理ステップ122)。文字認識部21に
おいては、この文字イメージデータに対して、例えば特
徴抽出と認識辞書とのマッチングによって文字認識を行
ない、その結果を出力する(処理ステップ124,12
6)。
First, in the frame recognition section 14, the ruled line memory 1
With reference to the ruled line information in 0, the frames surrounded by the recognized ruled lines in the main scanning direction and the sub-scanning direction are recognized, and the coordinates of each frame (such as the coordinates of two diagonal vertices) are stored in the frame coordinate memory 15. (Step 116). Next, the frame area extracting unit 16 cuts out the image data of each frame area from the table area image data in the table area image memory 4 by referring to the information in the frame coordinate memory 15 and stores it in the frame image memory 17. (Processing step 118). The line cutout unit 18 cuts out line (character string) image data from the data in the frame area image memory 17 by, for example, a method using projection in the main scanning direction and stores it in the line image memory 19 (processing step). 12
0). Next, the character cutout unit 20 cuts out character image data from the line image data by, for example, a method using projection in the sub-scanning direction, and transfers it to the character recognition unit 21 (processing step 122). The character recognizing unit 21 performs character recognition on the character image data by, for example, feature extraction and matching with a recognition dictionary, and outputs the result (processing steps 124 and 12).
6).

【0021】[0021]

【発明の効果】以上説明した如く、本発明によれば、黒
画素連結矩形の幅及び高さと隣接矩形間距離に着目した
認識処理と、黒画素連結矩形の幅、高さ及び隣接矩形間
距離についてのヒストグラムを利用した認識処理とによ
って、実線の罫線及び非実線の罫線の両方を認識するこ
とが可能であり、さらに、実線の罫線は途中分断されて
いても認識することが可能であり、また、このような方
法により非実線の罫線が用いられた表についても、その
枠領域を正常に抽出して文字認識を行なうことが可能で
あり、処理可能な表の範囲が大幅に拡張される。
As described above, according to the present invention, recognition processing focusing on the width and height of a black pixel connection rectangle and the distance between adjacent rectangles, and the width, height, and distance between adjacent rectangles of the black pixel connection rectangle are performed. , It is possible to recognize both a solid ruled line and a non-solid ruled line, and the solid ruled line is cut off in the middle.
It is also possible to perform character recognition by extracting the frame area of a table using a non-solid ruled line using such a method. The range of simple tables is greatly expanded.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例に係る処理装置のブロック図
である。
FIG. 1 is a block diagram of a processing apparatus according to an embodiment of the present invention.

【図2】処理の概略フローチャートである。FIG. 2 is a schematic flowchart of a process.

【図3】非実線の罫線に相当する黒画素連結矩形の一例
の説明図である。
FIG. 3 is an explanatory diagram of an example of a black pixel connection rectangle corresponding to a non-solid ruled line;

【図4】黒画素連結矩形の幅のヒストグラムの一例を示
すグラフである。
FIG. 4 is a graph showing an example of a histogram of the width of a black pixel connection rectangle.

【符号の説明】[Explanation of symbols]

1 2値画像入力部 2 2値イメージ
メモリ 3 表領域認識部 4 表領域イメー
ジメモリ 5 黒画素連結矩形生成部 6 黒画素連結矩
形メモリ 7 罫線候補抽出部 8 罫線候補メモ
リ 9 第一罫線抽出部 10 罫線メモリ 11 黒画素連結矩形計数部 12 ヒストグラ
ムメモリ 13 第二罫線抽出部 14 枠認識部 15 枠座標メモリ 16 枠領域抽出
部 17 枠イメージメモリ 18 行切り出し
部 19 行イメージメモリ 20 文字切り出
し部 21 文字認識部
Reference Signs List 1 binary image input unit 2 binary image memory 3 table area recognition unit 4 table area image memory 5 black pixel connection rectangle generation unit 6 black pixel connection rectangle memory 7 ruled line candidate extraction unit 8 ruled line candidate memory 9 first ruled line extraction unit 10 Ruled line memory 11 Black pixel connected rectangle counting unit 12 Histogram memory 13 Second ruled line extraction unit 14 Frame recognition unit 15 Frame coordinate memory 16 Frame region extraction unit 17 Frame image memory 18 Line extraction unit 19 Line image memory 20 Character extraction unit 21 Character recognition Department

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 2値画像について、主走査方向及び副走
査方向の所定ライン数毎に、黒画素連結矩形を抽出し、
幅及び高さがそれぞれ所定範囲内の黒画素連結矩形を
線の罫線候補として抽出し、注目走査方向の距離が所定
範囲内の隣接罫線候補を統合して実線の罫線として認識
し、実線の 罫線として認識されなかった黒画素連結矩形につ
いて幅、高さ及び注目走査方向の隣接矩形間距離のヒ
ストグラムを生成し、ヒストグラム値が一定値を越える
幅、高さ及び隣接矩形間距離のそれぞれの範囲を求め、
実線の罫線として認識されなかった黒画素連結矩形のう
ちで幅、高さ及び隣接矩形間距離のすべてが前記範囲
内に含まれる黒画素連結矩形を統合して実線以外の罫線
として認識する ことを特徴とする罫線認識方法。
About 1. A binary image for every predetermined number of lines in the main scanning direction and the sub-scanning direction, and extracted black pixel connected rectangular,
Width and height are each real black pixel connected rectangles within a predetermined range
Line rule candidates are extracted as line rule candidates, and adjacent rule line candidates whose distance in the scanning direction of interest is within a predetermined range are integrated and recognized as solid rule lines . For black pixel connection rectangles not recognized as solid line rule lines , Generate a histogram of the width, height and distance between adjacent rectangles in the scanning direction of interest, and determine the respective ranges of the width, height, and distance between adjacent rectangles where the histogram value exceeds a certain value,
Among the black pixel connection rectangles not recognized as solid rule lines , the width, height, and distance between adjacent rectangles are all included in the range, and the black pixel connection rectangles are integrated and recognized as rule lines other than the solid line . A ruled line recognition method characterized in that:
【請求項2】 文書もしくは帳票の表領域の2値画像に
おいて、請求項1記載の罫線認識方法によって主走査方
向及び副走査方向の罫線を認識し、罫線の情報より表の
枠領域を認識して、枠領域内の文字を切り出し文字認識
することを特徴とする表処理方法。
2. In a binary image of a table area of a document or a form, ruled lines in the main scanning direction and sub-scanning direction are recognized by the ruled line recognition method according to claim 1, and a table frame area is recognized based on ruled line information. And extracting a character in the frame region and recognizing the character.
JP08093891A 1991-03-19 1991-03-19 Ruled line recognition method and table processing method Expired - Fee Related JP3162414B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08093891A JP3162414B2 (en) 1991-03-19 1991-03-19 Ruled line recognition method and table processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08093891A JP3162414B2 (en) 1991-03-19 1991-03-19 Ruled line recognition method and table processing method

Publications (2)

Publication Number Publication Date
JPH04291478A JPH04291478A (en) 1992-10-15
JP3162414B2 true JP3162414B2 (en) 2001-04-25

Family

ID=13732413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08093891A Expired - Fee Related JP3162414B2 (en) 1991-03-19 1991-03-19 Ruled line recognition method and table processing method

Country Status (1)

Country Link
JP (1) JP3162414B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100657385B1 (en) * 1998-12-16 2006-12-19 후지쯔 가부시끼가이샤 Device processing a table image, a memory medium storing a processing program, and a table management processing method

Also Published As

Publication number Publication date
JPH04291478A (en) 1992-10-15

Similar Documents

Publication Publication Date Title
EP0764308B1 (en) System and method for automatic page registration and automatic zone detection during forms processing
US5335290A (en) Segmentation of text, picture and lines of a document image
KR101399709B1 (en) Model-based dewarping method and apparatus
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP4189506B2 (en) Apparatus, method and recording medium for image processing
JP2001266068A (en) Method and device for recognizing table, character- recognizing device, and storage medium for recording table recognizing program
JP2000207489A (en) Character extracting method and device and record medium
JP3162414B2 (en) Ruled line recognition method and table processing method
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2868134B2 (en) Image processing method and apparatus
JP3140079B2 (en) Ruled line recognition method and table processing method
JP3095470B2 (en) Character recognition device
JP2957729B2 (en) Line direction determination device
JPH05159062A (en) Document recognition device
JPH0660220A (en) Area extracting method for document image
JP2931041B2 (en) Character recognition method in table
JP3074210B2 (en) Paper document image processing device
JPH1049602A (en) Method for recognizing document
JP3100619B2 (en) Photo region extraction device
JP2001143076A (en) Image processor
JP2918363B2 (en) Character classification method and character recognition device
JPH05128305A (en) Area dividing method
JPH03160582A (en) Method for separating ruled line and character in document picture data
JP2004013188A (en) Business form reading device, business form reading method and program therefor
JPH08249421A (en) Recognizing method for reverse character

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080223

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090223

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees