JPH11282957A - Method for deciding recognition object area - Google Patents

Method for deciding recognition object area

Info

Publication number
JPH11282957A
JPH11282957A JP10079262A JP7926298A JPH11282957A JP H11282957 A JPH11282957 A JP H11282957A JP 10079262 A JP10079262 A JP 10079262A JP 7926298 A JP7926298 A JP 7926298A JP H11282957 A JPH11282957 A JP H11282957A
Authority
JP
Japan
Prior art keywords
area
information
recognition target
determining
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10079262A
Other languages
Japanese (ja)
Inventor
Toshio Fujine
俊夫 藤根
Kazuhiro Ishikawa
和弘 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10079262A priority Critical patent/JPH11282957A/en
Publication of JPH11282957A publication Critical patent/JPH11282957A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a new method capable of deciding a specified cell area on the image data of a slip whether it is a fixed form document or a fixed format document in which the position of the cell is shifted by printing slippage or the like. SOLUTION: In deciding one or plural specified cell areas to be a recognition object area from the image data of a slip provided with many cells divided by ruled lines, information for deciding the specified cell area of the slip is stored in a dictionary 21 beforehand. Then, the ruled line is detected for the image data of the slip, a table area turned to a closed area by the detected ruled line is specified and the specified cell area is decided, based on the information for deciding the specified cell area from the area divided by the ruled line in the table area.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、文字認識装置等に
適用して好適な認識対象領域の決定方法に関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for determining a recognition target area suitable for use in a character recognition device or the like.

【0002】[0002]

【従来の技術】文字認識分野では、表形式の帳票に書か
れた文字の認識も行われている。表形式の帳票の典型例
としては、例えば以下の2種類の帳票がある。第1は、
縦横の罫線で区分けされているセルの寸法や、帳票の基
準点(例えば、画像左上端点)に対する各セルの位置
が、所定通りに固定されている帳票(以下、書式固定帳
票とする)である。第2は各セル寸法や各セルの帳票基
準点に対する絶対的な位置は固定されていないが、各セ
ルの並び順等、各セルの論理的な位置関係が所定通りと
されている帳票(以下、様式固定帳票とする)である。
具体的には、○○項目の欄の下には△△項目欄があり、
かつこれらの項目欄の右側にはそれぞれ、記入欄がある
というように論理的な位置関係が所定通りとされている
帳票である。
2. Description of the Related Art In the field of character recognition, the recognition of characters written on a tabular form is also performed. Typical examples of the tabular form include, for example, the following two types of forms. The first is
A form (hereinafter referred to as a fixed form form) in which the dimensions of the cells divided by vertical and horizontal ruled lines and the position of each cell with respect to the reference point of the form (for example, the upper left point of the image) are fixed as predetermined. . Second, although the dimensions of each cell and the absolute position of each cell with respect to the form reference point are not fixed, a form (hereinafter referred to as a form) in which the logical positional relationship of each cell, such as the order in which the cells are arranged, is predetermined. , Style fixed form).
Specifically, there is a △△ item column below the XX item column,
In addition, the form has a logical positional relationship as predetermined such that there is an entry column on the right side of each of these item columns.

【0003】これら表形式の帳票では、該帳票内の1又
は複数の特定のセル領域が文字記入欄とされることが多
い。そのため、文字認識を行うためには、この1又は複
数の特定のセル領域を帳票から検出する必要がある。
In these tabular forms, one or a plurality of specific cell areas in the form are often used as character entry fields. Therefore, in order to perform character recognition, it is necessary to detect one or a plurality of specific cell areas from a form.

【0004】書式固定帳票から特定のセル領域を検出す
る従来方法として、例えば文献1(「文字認識概論」、
橋本新一郎 編著、昭和57年3月20日、オーム社、
P203〜206)に開示の方法がある。
[0004] As a conventional method for detecting a specific cell area from a fixed format form, for example, reference 1 (“Overview of character recognition”,
Edited by Shinichiro Hashimoto, March 20, 1982, Ohmsha,
P203-206).

【0005】この方法では、種々の書式固定帳票ごとの
読み取り制御データを用いて、帳票の画像データから文
字を切り出し、そして文字認識を行っている。具体的に
は、帳票の左上端点からの特定セルの位置等を読み取り
制御データとして用意しておき(文献1の第204
頁)、これに基づいて特定のセル領域を特定し、その特
定したセル領域から文字を切り出して文字認識を行って
いる。上記のように特定した1又は複数のセル領域は、
その後の処理で文字認識対象となる領域であることか
ら、以後、読み取りフィールドという。なお、セル以外
の罫線で囲まれていない場合も、文字認識対象となる領
域は読み取りフィールドという。
In this method, characters are cut out from image data of a form using read control data for various fixed forms, and character recognition is performed. Specifically, the position and the like of a specific cell from the upper left point of the form are prepared as read control data (204th document of Document 1).
Page), a specific cell area is specified based on this, and characters are cut out from the specified cell area to perform character recognition. One or more cell areas identified as above,
Since it is an area to be subjected to character recognition in subsequent processing, it is hereinafter referred to as a reading field. Note that, even when the area is not surrounded by a ruled line other than the cell, the area to be subjected to character recognition is called a read field.

【0006】しかしながら、上述した従来の文字認識方
法では、例えば様式固定帳票上の文字を読み取ることが
できない場合がある。様式固定帳票は既に説明したよう
に、各セルの論理的な位置関係が規定されているのみ
で、各セルの寸法や絶対的な位置関係までは規定さてい
ない。従って、様式は同じであるが各セルの寸法、セル
の絶対的な位置やセル間の距離等が自由に作製される場
合があるので、そのような場合は、上述した従来の文字
認識方法の読み取り制御データを用意しても、文字認識
の対象領域である特定セルを特定できないことになる。
However, in the above-described conventional character recognition method, for example, characters on a fixed form may not be read. As described above, the form fixed form only defines the logical positional relationship of each cell, but does not define the dimensions and the absolute positional relationship of each cell. Therefore, although the style is the same, the dimensions of each cell, the absolute position of the cell, the distance between the cells, and the like may be freely prepared. In such a case, the above-described conventional character recognition method is used. Even if the read control data is prepared, a specific cell which is a target area for character recognition cannot be specified.

【0007】また、上述した従来の文字認識方法では固
定書式帳票であっても、例えば罫線・文字等の印刷ずれ
等が生じてセルの絶対的な位置がずれた場合は、文字を
読み取ることができない場合も生じる。ただし、印刷ず
れ等を補正するために、読み取り対象の特定セルが位置
している行の一端にラインマークを設けておき、このマ
ークによって、読み取り対象の行を特定する方法がある
(文献1の第205頁)。しかし、その場合はラインマ
ークを形成する領域が必要である。また、ラインマーク
の無い帳票はやはり読み取り対象の特定セルを特定する
ことができない。
Further, in the above-described conventional character recognition method, even in a fixed format form, if the absolute position of a cell is shifted due to, for example, a printing shift of a ruled line or a character, the character can be read. Sometimes it is impossible. However, in order to correct a printing shift or the like, there is a method in which a line mark is provided at one end of a line where a specific cell to be read is located, and the line to be read is specified by this mark (see Document 1). Page 205). However, in that case, an area for forming a line mark is required. Also, a form without a line mark cannot specify a specific cell to be read.

【0008】従って、様式固定帳票であっても、また、
セルの位置が印刷ずれ等によってずれている書式固定帳
票であっても、該帳票の画像データ上の特定のセル領域
を決定できる新規な方法が望まれる。
Therefore, even if the form is fixed form,
A new method is desired that can determine a specific cell area on image data of a form even in a fixed form where the cell position is shifted due to printing shift or the like.

【0009】[0009]

【課題を解決するための手段】(1)上記課題を解決す
るために第1の発明は、罫線で区分けされている多数の
セルを含む帳票の画像データから、認識対象領域となる
1又は複数の特定のセル領域を決定するに当たり、帳票
の罫線情報又はセル情報と帳票の特定の認識領域を決定
するための情報を予め辞書に格納しておき、前記帳票の
画像データから罫線を検出し、前記表領域の中の罫線に
より区分される領域から、前記特定のセル領域を決定
し、さらに認識領域を決定するための情報に基づいて、
認識領域を決定することを特徴とする。
Means for Solving the Problems (1) In order to solve the above-mentioned problems, a first aspect of the present invention is to convert one or a plurality of recognition target areas from image data of a form including a large number of cells divided by ruled lines. In determining the specific cell area, the ruled line information or cell information of the form and the information for determining the specific recognition area of the form are stored in a dictionary in advance, and the ruled line is detected from the image data of the form, From the area divided by the ruled line in the table area, the specific cell area is determined, and further, based on information for determining the recognition area,
It is characterized in that a recognition area is determined.

【0010】(2)また、第2の発明は、罫線で区分け
されている多数のセルを含む1又は複数の帳票の画像デ
ータから、認識対象領域となる1又は複数の特定のセル
領域を決定するに当たり、すでに特定のセル領域が決定
された帳票を基準帳票とし、認識処理すべき帳票内の交
差する罫線によって閉領域となっている表領域ごとに、
罫線情報又はセル情報と、前記基準帳票の特定のセル領
域を決定するための情報とを前記辞書に格納し、認識処
理すべき帳票の画像データから、各表領域ごとに、前記
辞書に格納された前記罫線情報又はセル情報と前記基準
帳票の特定のセル領域を決定するための情報に基づい
て、前記特定のセル領域を決定することを特徴とする。
(2) In the second invention, one or a plurality of specific cell areas to be recognized are determined from image data of one or a plurality of forms including a large number of cells divided by ruled lines. In doing so, a form in which a specific cell area has already been determined is used as a reference form, and for each table area closed by an intersecting ruled line in the form to be recognized,
Ruled line information or cell information and information for determining a specific cell area of the reference form are stored in the dictionary, and from image data of a form to be recognized, stored in the dictionary for each table area. The specific cell area is determined based on the ruled line information or cell information and information for determining a specific cell area of the reference form.

【0011】(3)また、第3の発明は、第1又は第2
の発明において、認識処理すべき帳票に特定のセル領域
が複数あり、かつその中に同一の認識対象として統合し
て認識すべき領域がある場合に、前記罫線情報又はセル
情報と、前記基準帳票の特定のセル領域を決定するため
の情報と、同一の認識対象領域を決定するための情報と
を前記辞書に格納し、認識処理すべき帳票の画像データ
から、前記辞書に格納された前記罫線情報又はセル情報
と前記基準帳票の特定のセル領域を決定するための情報
に基づいて、前記特定のセル領域を決定し、前記同一の
認識対象領域を決定するための情報に基づいて、前記特
定のセル領域の中から同一の認識対象領域同士を統合し
て認識対象領域を決定することを特徴とする。
(3) The third invention is the first or second invention.
In the invention of the above, when there are a plurality of specific cell areas in the form to be recognized and there is an area to be integrated and recognized as the same recognition target, the ruled line information or the cell information and the reference form The information for determining the specific cell area and the information for determining the same recognition target area are stored in the dictionary, and the ruled line stored in the dictionary is obtained from image data of a form to be recognized. The specific cell area is determined based on information or cell information and information for determining a specific cell area of the reference form, and the identification is performed based on information for determining the same recognition target area. Are characterized by integrating the same recognition target areas from among the cell areas described above.

【0012】(4)また、第4の発明は、第1又は第2
の発明において、認識処理すべき帳票に含まれる前記特
定のセル領域の中の一部分のみが認識対象領域となる場
合に、前記罫線情報又はセル情報と、前記基準帳票の特
定のセル領域を決定するための情報と、特定のセル領域
の中の認識対象領域を決定するための内部領域位置情報
とを前記辞書に格納し、認識処理すべき帳票の画像デー
タから、前記辞書に格納された前記罫線情報又はセル情
報と前記基準帳票の特定のセル領域を決定するための情
報に基づいて、前記特定のセル領域を決定し、前記内部
領域位置情報に基づいて、前記特定のセル領域の中に含
まれる認識対象領域を決定することを特徴とする。
(4) Further, the fourth invention is the first or second invention.
In the invention, when only a part of the specific cell area included in the form to be recognized is the recognition target area, the ruled line information or the cell information and the specific cell area of the reference form are determined. And the internal area position information for determining the recognition target area in the specific cell area is stored in the dictionary, and the ruled line stored in the dictionary is obtained from image data of a form to be recognized. Based on information or cell information and information for determining a specific cell area of the reference form, determine the specific cell area, based on the internal area position information, included in the specific cell area It is characterized in that a recognition target area to be recognized is determined.

【0013】(5)また、第5の発明は、第4の発明に
おいて、特定のセル領域の中の認識対象領域を決定する
ための内部領域位置情報を前記基準帳票における特定セ
ルと認識対象領域の位置座標を比較するにより決定し、
決定されて辞書に格納された内部領域位置情報と前記特
定したセル情報の位置関係を比較することにより、認識
対象領域を決定することを特徴とする。
(5) In a fifth aspect based on the fourth aspect, the internal area position information for determining the recognition target area in the specific cell area is specified by the specific cell and the recognition target area in the reference form. Is determined by comparing the position coordinates of
The recognition target region is determined by comparing the positional relationship between the determined internal region position information stored in the dictionary and the specified cell information.

【0014】(6)また、第6の発明は、第1又は第2
の発明において、認識処理すべき帳票の中に表の外側に
認識対象領域が存在する場合に、前記罫線情報又はセル
情報と、表の外側の認識対象領域を決定するための表外
認識領域の位置情報を前記辞書に格納し、認識処理すべ
き帳票の画像データから、前記辞書に格納された前記罫
線情報又はセル情報と前記表外認識領域の位置情報に基
づいて、前記表の外側に存在する認識対象領域を決定す
ることを特徴とする。
(6) The sixth aspect of the present invention is directed to the first or second aspect.
In the invention, when the recognition target area exists outside the table in the form to be subjected to the recognition processing, the ruled line information or the cell information and the out-of-line recognition area for determining the recognition target area outside the table. The position information is stored in the dictionary, and based on the ruled line information or cell information stored in the dictionary and the position information of the out-of-line recognition area, based on the image data of the form to be recognized, the position information exists outside the table. It is characterized in that a recognition target region to be performed is determined.

【0015】(7)また、第7の発明は、第6の発明に
おいて、前記基準帳票における罫線情報により表領域を
決定し、その表領域の位置座標と認識対象領域の位置座
標を比較することにより、前記認識対象領域が表領域の
外側にあれば、該認識対象領域の位置座標を表領域の外
側の認識対象領域を決定するための表外認識領域の位置
情報として辞書に格納し、格納された表外認識領域の位
置情報からその位置座標周辺の領域を探索することによ
り認識対象領域を決定することを特徴とする。
(7) In a seventh aspect based on the sixth aspect, the table area is determined based on the ruled line information in the reference form, and the position coordinates of the table area are compared with the position coordinates of the recognition target area. Accordingly, if the recognition target area is outside the table area, the position coordinates of the recognition target area are stored in the dictionary as position information of the out-of-line recognition area for determining the recognition target area outside the table area, and stored. The recognition target area is determined by searching an area around the position coordinates from the position information of the out-of-line recognition area thus obtained.

【0016】(8)また、第8の発明は、第1又は第2
の発明において、認識処理すべき帳票の前記表領域の罫
線による分割が、水平方向の両端又は垂直方向の両端ま
で結ばれた罫線以外によって分割されている場合に、罫
線が分割されたことを示す交差付加情報を前記辞書に格
納し、認識処理すべき帳票の画像データから、前記辞書
に格納された前記交差付加情報に基づいて、罫線を検出
することを特徴とする。
(8) The eighth aspect of the present invention is directed to the first or second aspect.
In the invention according to the above, when the division of the form to be recognized by the ruled line of the table area is divided by a rule other than the ruled line connected to both ends in the horizontal direction or both ends in the vertical direction, it indicates that the ruled line is divided. The intersection additional information is stored in the dictionary, and a ruled line is detected from image data of a form to be recognized based on the intersection additional information stored in the dictionary.

【0017】(9)また、第9の発明は、第8の発明にお
いて、前記辞書に、交差付加情報が付加されていれば、
認識処理すべき帳票の画像データから、水平方向の両端
又は垂直方向の両端まで結ばれた罫線以外の罫線を検出
する罫線検出処理を行うことを特徴とする。
(9) In a ninth aspect based on the eighth aspect, if intersection additional information is added to the dictionary,
A ruled line detecting process for detecting ruled lines other than ruled lines connected to both ends in the horizontal direction or both ends in the vertical direction from image data of a form to be recognized is performed.

【0018】[0018]

【発明の実施の形態】以下、本発明の実施の形態を説明
する。
Embodiments of the present invention will be described below.

【0019】(第1の実施例の構成について)第1の実
施例は、認識処理すべき帳票である決定対象帳票(以
下、単に帳票という)の中に複数の表領域が含まれてい
る場合や各表領域の中の1又は複数の特定のセル領域の
みが読み取りフィールドとなっている場合でも認識処理
できるようにしたものである。なお、第1の実施例は、
特定のセル領域がそのまま認識対象領域となるものとし
て説明する。
(Configuration of First Embodiment) In the first embodiment, a case where a plurality of table areas are included in a form to be determined (hereinafter simply referred to as a form) which is a form to be recognized. And recognition processing can be performed even when only one or a plurality of specific cell regions in each table region are read fields. In the first embodiment,
The description will be made assuming that a specific cell area is a recognition target area as it is.

【0020】図1は、本発明の第1の実施例を示すもの
で、認識対象領域の決定方法を行なう装置の構成を示す
図である。図1には、この実施形態の認識対象領域の決
定方法を行なう認識対象領域決定装置20を備えた文字
認識装置10が示されている。
FIG. 1 shows a first embodiment of the present invention and is a diagram showing a configuration of an apparatus for performing a method of determining a recognition target area. FIG. 1 shows a character recognition device 10 including a recognition target region determination device 20 that performs the recognition target region determination method of this embodiment.

【0021】文字認識装置10は、認識対象領域決定装
置20、文字認識手段40、CPU50とメモリ60と
を備える。
The character recognition device 10 includes a recognition target area determination device 20, character recognition means 40, a CPU 50, and a memory 60.

【0022】前記認識対象領域決定装置20は、帳票の
画像データから罫線に区分けされている多数のセルを含
む1又は複数の表領域を特定し、文字等の認識対象領域
となる1又は複数の特定のセル領域を決定する。
The recognition target area determination device 20 specifies one or a plurality of table areas including a large number of cells divided into ruled lines from image data of a form, and specifies one or a plurality of table areas serving as recognition target areas such as characters. Determine a specific cell area.

【0023】前記認識対象領域決定装置20は、辞書2
1、表別処理制御手段23、罫線検出手段25、対応関
係判定手段27とセル決定手段29とを備える。
The recognition target area determination device 20 includes a dictionary 2
1, a table-specific processing control unit 23, a ruled line detection unit 25, a correspondence determination unit 27, and a cell determination unit 29.

【0024】辞書21は、すでに特定のセル領域が決定
された帳票(以下、基準帳票という)内の表領域の罫線
情報やセル情報、認識対象領域となる特定のセル領域を
決定するための情報を格納している。また、表別処理制
御手段23は、基準帳票内の表領域の数が複数ある場合
に、罫線検出手段25、対応関係判定手段27とセル決
定手段29を制御し、基準帳票内の各表ごとに罫線を検
出させたり、罫線やセル領域の対応関係を判定させる。
この表別処理制御手段23の動作の詳細は後で説明す
る。また、罫線検出手段25は、帳票の画像データから
罫線を検出し、その罫線データを罫線データメモリ61
に格納する。また、対応関係判定手段27は罫線検出手
段25で検出し、罫線データメモリ61に格納されてい
る罫線と辞書21に格納されている罫線情報又はセル情
報を照合し、検出した罫線が正しいか否かを判定して、
各罫線により区分けされた領域を特定する。また、セル
領域決定手段29は、罫線検出手段25が検出した罫線
のうち、対応関係判定手段27が正しいと判定した罫線
により区分けされる画像データ上の各セル領域から、辞
書21に格納されている罫線情報又はセル情報に基づい
て、特定のセル領域を決定し、その領域の位置に関する
情報を認識領域データメモリ63に格納する。
The dictionary 21 includes ruled line information and cell information of a table area in a form in which a specific cell area has already been determined (hereinafter referred to as a reference form), and information for determining a specific cell area to be a recognition target area. Is stored. When there are a plurality of table areas in the reference form, the table-specific processing control means 23 controls the ruled line detection means 25, the correspondence determination means 27 and the cell determination means 29, and To detect a ruled line or determine the correspondence between the ruled line and the cell area.
Details of the operation of the table-based processing control means 23 will be described later. The ruled line detecting means 25 detects a ruled line from the image data of the form and stores the ruled line data in a ruled line data memory 61.
To be stored. The correspondence determination unit 27 detects the ruled line detected by the ruled line detection unit 25, compares the ruled line stored in the ruled line data memory 61 with the ruled line information or cell information stored in the dictionary 21, and determines whether the detected ruled line is correct. And determine
The area divided by each ruled line is specified. In addition, the cell area determination means 29 stores, in the dictionary 21, from the cell areas on the image data which are classified by the ruled lines determined by the correspondence determination means 27 to be correct among the ruled lines detected by the ruled line detection means 25. A specific cell area is determined based on the ruled line information or cell information, and information on the position of that area is stored in the recognition area data memory 63.

【0025】また、文字認識手段40は、帳票上の文字
を認識する。この場合は、認識対象領域決定装置20で
決定され、認識領域データメモリ63に格納されている
特定のセル領域の位置に関する情報に基づいて、後述の
帳票イメージメモリ73に格納されている帳票の画像デ
ータから文字等を切り出し、文字認識する。文字認識装
置40は、公知の手段で構成できる。例えば、認識対象
領域の文字列から文字を切り出し、切り出した文字の特
徴を抽出する。そして、抽出した認識対象の文字の特徴
を、予め用意した辞書内の各文字の特徴と照合して、候
補文字を決定するという手段で構成できる。
The character recognizing means 40 recognizes characters on a form. In this case, a form image stored in a form image memory 73, which will be described later, is determined based on the information on the position of the specific cell area determined by the recognition target area determination device 20 and stored in the recognition area data memory 63. Characters and the like are cut out from the data and characters are recognized. The character recognition device 40 can be configured by known means. For example, a character is cut out from the character string in the recognition target area, and the characteristics of the cut out character are extracted. Then, the feature of the extracted character to be recognized is collated with the feature of each character in a dictionary prepared in advance to determine a candidate character.

【0026】前記CPU50は認識対象領域決定装置2
0および文字認識手段30を制御する。
The CPU 50 is a recognition target area determination device 2
0 and character recognition means 30 are controlled.

【0027】前記メモリ60はハードディスク等の任意
の好適な記憶媒体で構成されている。
The memory 60 is constituted by any suitable storage medium such as a hard disk.

【0028】前記文字認識装置10は、認識処理すべき
帳票から、画像データを読み取り記憶する画像データ入
力装置70と接続されている。図中の71は帳票のイメ
ージを読み取るスキャナであり、73はスキャナ71で
読み取ったイメージを格納する帳票イメージメモリであ
る。
The character recognition device 10 is connected to an image data input device 70 for reading and storing image data from a form to be recognized. In the figure, reference numeral 71 denotes a scanner for reading a form image, and reference numeral 73 denotes a form image memory for storing the image read by the scanner 71.

【0029】(第1の実施例の動作について)以下に、
認識対象領域の決定方法およびそれに付随する辞書21
の動作について図2に示す帳票を用いて説明する。な
お、図2は基準帳票の構成を示す図である。
(Regarding the operation of the first embodiment)
Method for determining recognition target area and dictionary 21 associated therewith
Will be described with reference to the form shown in FIG. FIG. 2 is a diagram showing the configuration of the reference form.

【0030】まず、辞書21に格納される罫線情報、セ
ル情報および認識領域を決定するための情報について説
明する。なお、罫線情報とセル情報は、両方とも辞書2
1に格納されるようにしてもよいが、どちらか一方から
でもセル領域の位置を特定できるので、どちらか一方の
みが辞書21に格納さるものとして、以下に説明する。
First, ruled line information, cell information, and information for determining a recognition area stored in the dictionary 21 will be described. Note that both the ruled line information and the cell information are stored in the dictionary 2
1 may be stored, but since the position of the cell area can be specified from either one, it will be described below that only one of them is stored in the dictionary 21.

【0031】罫線情報は、罫線の数、各罫線の配置関係
等の罫線の位置に関する情報である。セル情報は、セル
の数、各セルの配置関係等のセルの位置に関する情報で
ある。罫線情報とセル情報は、従来のように絶対的な位
置を示す情報とすることができるが、本発明では相対的
な位置を示す情報とする。
The ruled line information is information on the positions of ruled lines, such as the number of ruled lines and the arrangement relationship of each ruled line. The cell information is information on the position of a cell, such as the number of cells and the arrangement of each cell. The ruled line information and the cell information can be information indicating an absolute position as in the related art, but in the present invention, they are information indicating a relative position.

【0032】すなわち、帳票内の交差する罫線によって
形成された表領域の垂直方向の両端又は水平方向の両端
を結ぶ罫線によって分割されている各セル領域を第1階
層の分割領域と称し、該罫線を第1階層の罫線と称し、
該第1階層の各分割領域ごとの、垂直方向の両端又は水
平方向の両端まで結ぶ罫線によって分割されている各セ
ル領域を第2階層の分割領域と称し、該罫線を第2階層
の罫線と称し、以下同様に、第n階層の分割領域および
第n階層の罫線と称するようにすれば、セル情報と罫線
情報はn階層構造の情報として表すことができる。
That is, each cell region divided by a ruled line connecting both ends in the vertical direction or both ends in the horizontal direction of a table region formed by intersecting ruled lines in a form is referred to as a divided region of the first hierarchy. Is called the first level ruled line,
Each cell area divided by a ruled line connecting both ends in the vertical direction or both ends in the horizontal direction in each divided area of the first hierarchy is referred to as a divided area of the second hierarchy. The cell information and the ruled line information can be expressed as information of an n-layer structure by similarly referring to the divided region of the nth layer and the ruled line of the nth layer.

【0033】例えば、図2には、2つの表領域210
a、210bが含まれる基準帳票の例が示されている。
図2中、表領域210aと210bは、罫線220a〜
iによって内部を階層的に分割されている。このような
基準帳票の罫線情報又はセル情報は、帳票の各領域ごと
に、図3に示すように、n階層構造の情報として辞書2
1に格納する。なお、図3は辞書21に格納する罫線情
報又はセル情報の構造を示す図である。図3中、表1は
表領域210aの位置を特定するための情報であり、表
2は表領域210bの位置を特定するための情報、T1
〜T232は罫線220a〜iに関する罫線情報又はセ
ル領域230a〜c及びその他のセル領域のセル情報で
ある。
For example, FIG. 2 shows two table areas 210.
An example of a reference form including “a” and “210b” is shown.
In FIG. 2, table areas 210a and 210b are defined by ruled lines 220a to 220a.
The inside is hierarchically divided by i. As shown in FIG. 3, the ruled line information or cell information of such a reference form is, as shown in FIG.
1 is stored. FIG. 3 is a diagram showing the structure of ruled line information or cell information stored in the dictionary 21. In FIG. 3, Table 1 is information for specifying the position of the table area 210a, Table 2 is information for specifying the position of the table area 210b, T1
T232 is ruled line information relating to the ruled lines 220a to 220i or cell information of the cell regions 230a to 230c and other cell regions.

【0034】認識領域を決定するための情報は、例え
ば、どのセルが文字等の認識対象領域となる特定のセル
領域であるのか否かを示す情報(以下、特定のセル領域
を決定するための情報という)や、後述の内部領域位置
情報、表外認識領域位置情報等のことである。これら認
識領域を決定するための情報は、罫線情報又はセル情報
に対応づけて辞書21に格納されている。認識領域を決
定するための情報は、操作者によってその数値等が基準
帳票を参照して図示せぬキーボード等の入力手段から装
置に入力されたり、又は基準帳票を装置に読み取らせる
ことによって装置に入力される。
The information for determining a recognition area is, for example, information indicating whether or not a cell is a specific cell area to be a recognition target area for characters or the like (hereinafter, information for determining a specific cell area). Information), internal area position information described later, and out-of-line recognition area position information. Information for determining these recognition areas is stored in the dictionary 21 in association with ruled line information or cell information. The information for determining the recognition area is transmitted to the device by the operator by inputting numerical values or the like from an input means such as a keyboard (not shown) with reference to the reference form or by causing the apparatus to read the reference form. Is entered.

【0035】次に表別処理制御手段23の動作について
図4のフローチャートを用いて説明する。なお、図4は
表別処理制御手段23の動作を示すフローチャートであ
る。
Next, the operation of the table-specific processing control means 23 will be described with reference to the flowchart of FIG. FIG. 4 is a flowchart showing the operation of the table-specific processing control means 23.

【0036】まず、ステップS401で初期化を行な
う。すなわち、表別処理制御手段23に格納された、す
でに認識処理を行なった表の番号(以下、処理表番号と
いう)を示す変数iを1にする。
First, initialization is performed in step S401. That is, the variable i, which is stored in the table-specific processing control means 23 and indicates the number of the table that has already undergone the recognition processing (hereinafter referred to as the processing table number), is set to 1.

【0037】次に、ステップS402であらかじめ辞書
21内に格納されている表の数(以下、辞書内格納表数
という)と処理表番号を示す変数iを比較し、変数iが
辞書内格納表数より大きければ、処理を終了する。そう
でなければ、ステップS403へ処理を移す。図2の例
の場合、辞書内格納表数は2、現在の処理表番号は1で
あるから、ステップS403へ処理を移す。
Next, in step S402, the number of tables stored in the dictionary 21 in advance (hereinafter referred to as the number of tables stored in the dictionary) is compared with the variable i indicating the processing table number. If it is larger than the number, the process ends. If not, the process moves to step S403. In the case of the example of FIG. 2, the number of tables stored in the dictionary is 2 and the current processing table number is 1, so the process proceeds to step S403.

【0038】ステップS403では、表iの位置を特定
するとともに、表i内の1又は複数の特定のセル領域を
決定する。その処理は、罫線検出手段25、対応関係判
定手段27とセル決定手段29にて実行する。罫線検出
手段25は、帳票の画像データから罫線を検出する。ま
た、対応関係判定手段27は罫線検出手段25で検出し
た罫線と辞書21に格納されている表iに関する罫線情
報又はセル情報と照合を行い、検出した罫線が正しいか
判定し、表iを区分けする罫線を識別する。
In step S403, the position of Table i is specified, and one or more specific cell areas in Table i are determined. The processing is executed by the ruled line detecting means 25, the correspondence relation determining means 27 and the cell determining means 29. The ruled line detecting means 25 detects ruled lines from the image data of the form. Further, the correspondence determination unit 27 compares the ruled line detected by the ruled line detection unit 25 with ruled line information or cell information related to the table i stored in the dictionary 21, determines whether the detected ruled line is correct, and classifies the table i. Identify the ruled lines you want.

【0039】例えば、罫線検出手段25により、表iの
垂直方向の両端又は水平方向の両端を結ぶ罫線(第1階
層の罫線)を検出し、対応関係判定手段27により、第
1階層の罫線で分割されたセル領域(第1階層の分割領
域)と辞書内の分割領域との照合を行なう。さらに、罫
線検出手段25により、第1階層の分割領域の垂直方向
の両端又は水平方向の両端を結ぶ罫線(第2階層の罫
線)を検出し、対応関係判定手段27により、第2階層
の罫線で分割されたセル領域(第2階層の分割領域)と
辞書内の分割領域との照合を行う。以下同様に、第n階
層の罫線検出および第n階層の分割領域を照合を行な
う。
For example, the ruled line detecting means 25 detects a ruled line (ruled line of the first hierarchy) connecting both ends in the vertical direction or both ends in the horizontal direction of the table i.
The cell area (first-level divided area) divided by the one-level ruled line is compared with the divided area in the dictionary. Further, the ruled line detection means 25 detects a ruled line (ruled line of the second hierarchy) connecting both ends in the vertical direction or both ends in the horizontal direction of the divided area of the first hierarchy, and the correspondence determination means 27 determines a ruled line of the second hierarchy. Then, the cell area (second-level divided area) divided by the above is compared with the divided area in the dictionary. Hereinafter, similarly, the ruled line of the n-th layer is detected and the divided area of the n-th layer is collated.

【0040】その後、セル領域決定手段29は、罫線検
出手段25が検出した罫線のうち、対応関係判定手段2
7が正しいと判定した罫線により区分けされた表iの各
セル領域から、辞書21に格納されている罫線情報又は
セル情報と特定のセル領域を決定するための情報に基づ
いて、特定のセル領域を決定し、特定のセル領域の位置
に関する情報を認識領域データメモリ63に格納する。
この処理が終わると、処理をステップS404に移す。
After that, the cell area determining means 29 selects the correspondence determining means 2 from the ruled lines detected by the ruled line detecting means 25.
7 is determined based on the ruled line information or cell information stored in the dictionary 21 and the information for determining the specific cell region from each cell region of Table i divided by the ruled line determined to be correct. Is determined, and information on the position of the specific cell area is stored in the recognition area data memory 63.
When this process ends, the process moves to step S404.

【0041】ステップS404では、次の表に処理を移
すために変数iを1つ増やす。そして処理をステップS
402へ移す。
In step S404, the variable i is increased by one in order to shift the processing to the next table. Then, the process proceeds to step S
Move to 402.

【0042】以上同様の処理を繰り返し行い、辞書21
内のすべての表に対して処理が終了すると、この表別処
理制御手段23は処理を終了する。
By repeating the same processing as described above, the dictionary 21
When the processing is completed for all the tables in the table, the table-specific processing control unit 23 ends the processing.

【0043】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている特定のセル領域(あ
るいは後述の特定のセル領域の一部分)の位置に関する
情報に基づいて、帳票イメージメモリ73に格納されて
いる帳票の画像データから文字等を切り出し、文字認識
する。
Thereafter, the character recognizing means 40 executes the form image memory 73 based on the information on the position of the specific cell area (or a part of the specific cell area described later) stored in the recognition area data memory 63. Characters and the like are cut out from the image data of the form stored in the document, and the characters are recognized.

【0044】(第1の実施例の効果について)以上のよ
うに、文字等の認識処理において、第1の実施例の認識
対象領域の決定方法を用いることにより、帳票内に複数
の表領域が存在する場合にも表領域が特定でき、かつ、
各表領域ごとに、認識対象領域となる特定のセル領域を
決定できる。そのため、複雑な構成の帳票の認識処理
を、簡略な構成の装置で行なうことができる。
(Effects of the First Embodiment) As described above, in the recognition processing of characters and the like, by using the method of determining the recognition target area of the first embodiment, a plurality of table areas can be included in a form. If it exists, the tablespace can be specified, and
A specific cell area to be a recognition target area can be determined for each table area. Therefore, it is possible to perform a process of recognizing a form having a complicated configuration with a device having a simple configuration.

【0045】(第2の実施例の構成について)文字等の
認識処理において、文字や行の切り出しは同一の認識対
象領域同士を統合して行なった方が良い場合がある。例
えば、「¥100」等の金銭を示す文字は、「¥」,
「1」,「0」,「0」のように分割して認識処理する
よりも、「¥100」のように同一の認識対象として統
一して認識処理した方が、正確に、かつ早く識別するこ
とができる。また、同一の記入欄に記載された文字をま
とめてひとつの情報として出力することもできる。
(Regarding the Configuration of the Second Embodiment) In the recognition processing of characters and the like, it may be better to cut out characters and lines by integrating the same recognition target areas. For example, characters indicating money such as "$ 100" are "@",
Rather than performing divisional recognition processing such as "1", "0", and "0", it is more accurate and faster to perform recognition processing unified as the same recognition target such as "$ 100". can do. Further, characters described in the same entry column can be output collectively as one piece of information.

【0046】そこで、第2の実施例は、同一の認識対象
として統合して認識すべき領域(以下、同一の認識対象
領域という)を統合できるように、第1の実施例におけ
る認識対象の決定方法を具えた認識対象決定装置のセル
決定手段29の後段にセル統合手段31を設けたもので
ある。
Therefore, the second embodiment determines the recognition target in the first embodiment so that regions to be integrated and recognized as the same recognition target (hereinafter, referred to as the same recognition target region) can be integrated. A cell integrating means 31 is provided at a stage subsequent to the cell determining means 29 of the recognition target determining apparatus provided with the method.

【0047】第2の実施例の構成図を図5に示す。認識
領域データメモリ63には、セル決定手段29で決定し
た、認識対象領域である特定のセル領域の情報が格納さ
れている。他方、辞書21には、どの領域が同一の認識
対象領域であるかを示す情報が格納されている。セル統
合手段31は、認識領域データメモリ63の特定のセル
領域の情報を参照するとともに、辞書21を参照し、同
一の認識対象領域であることを示す情報が付加されてい
る特定のセル領域がある場合には、それらのセル領域を
統合して一つの認識対象領域としてそれらの領域の位置
に関する情報を、認識対象領域毎に付加する番号(以
下、認識対象領域番号という)と対応づけて認識領域デ
ータメモリ63に格納する。なお、同一の認識対象領域
であることを示す情報が付加されている特定のセル領域
が全く存在しない場合には、第1の実施例と同様に単独
の特定のセル領域のままで、その特定のセル領域の位置
に関する情報を、認識対象領域番号と対応づけて認識領
域データメモリ63に格納する。
FIG. 5 shows a configuration diagram of the second embodiment. The recognition area data memory 63 stores information on a specific cell area that is a recognition target area determined by the cell determination unit 29. On the other hand, the dictionary 21 stores information indicating which area is the same recognition target area. The cell integrating means 31 refers to the information of the specific cell area in the recognition area data memory 63 and also refers to the dictionary 21 to determine whether the specific cell area to which the information indicating the same recognition target area is added is added. In some cases, the cell areas are integrated into one recognition target area, and information on the positions of those areas is associated with a number added to each recognition target area (hereinafter referred to as a recognition target area number). It is stored in the area data memory 63. If there is no specific cell area to which information indicating that the area is the same recognition target area is added, as in the first embodiment, the specific cell area remains as a single specific cell area. Is stored in the recognition area data memory 63 in association with the recognition target area number.

【0048】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている特定のセル領域(あ
るいは後述の特定のセル領域の一部分)の位置に関する
情報に基づいて、帳票イメージメモリ73に格納されて
いる帳票の画像データから文字等を切り出し、文字認識
する。なお、その他の各手段の処理内容は第1の実施例
と同じである。
Thereafter, the character recognizing means 40 executes the form image memory 73 based on the information on the position of the specific cell area (or a part of the specific cell area described later) stored in the recognition area data memory 63. Characters and the like are cut out from the image data of the form stored in the document, and the characters are recognized. The processing contents of the other units are the same as in the first embodiment.

【0049】(第2の実施例の動作について)以下に、
図6の帳票の構成を示す図および図7の辞書21に格納
される情報の構成を示す図および図8のセル統合手段3
1の動作を示すフローチャートを用いて同一の認識対象
領域を統合処理する方法を説明する。
(Regarding the operation of the second embodiment)
FIG. 6 is a diagram showing the configuration of the form, FIG. 7 is a diagram showing the configuration of information stored in the dictionary 21, and FIG.
A method of integrating the same recognition target area will be described with reference to the flowchart showing the operation 1.

【0050】まず、辞書21に格納する情報について説
明する。第2の実施例では、表領域の位置情報と罫線情
報又はセル情報と1又は複数の特定のセル領域を決定す
るための情報のほかに、同一の認識対象領域となる特定
のセル領域には、図7に示すように、同一の認識対象領
域であることを示す情報を付加して辞書21に格納す
る。この同一の認識対象領域であることを示す情報は、
例えば、それぞれ独立して辞書21に格納された、上記
の階層構造におけるセル領域同士の相対的な関係を示す
情報と、上記の読み取り対象フィールドの位置に関する
情報とを比較し、読み取りフィールドと重なりがある全
ての特定のセル領域に対して、認識対象領域毎に番号を
付加してゆき、そのとき同一の認識対象領域同士に同一
の番号を付与してゆくことによって設定される。
First, information stored in the dictionary 21 will be described. In the second embodiment, in addition to the position information of the table area, the ruled line information or the cell information, and the information for determining one or a plurality of specific cell areas, the specific cell area serving as the same recognition target area has As shown in FIG. 7, information indicating the same recognition target area is added and stored in the dictionary 21. The information indicating the same recognition target area is
For example, the information indicating the relative relationship between the cell regions in the above-described hierarchical structure and the information regarding the position of the field to be read, which are stored in the dictionary 21 independently, are compared with each other. The number is set for all the specific cell areas for each recognition target area, and the same number is assigned to the same recognition target areas at that time.

【0051】図7は、特定のセル領域のうち同一円内で
囲まれているT2221〜T2225が同一の認識対象
領域であることを示している。また、円の左肩に書かれ
ている数字は認識対象領域の番号(以下、認識対象領域
番号という)を示している。
FIG. 7 shows that T2221 to T2225 surrounded by the same circle in the specific cell region are the same recognition target region. The number written on the left shoulder of the circle indicates the number of the recognition target area (hereinafter referred to as the recognition target area number).

【0052】次にセル統合手段31の動作について説明
する。
Next, the operation of the cell integration means 31 will be described.

【0053】まず、ステップS701で初期化を行な
う。すなわち、セル統合手段31に格納された、処理対
象の認識対象領域番号を示す変数iを1にする。
First, initialization is performed in step S701. That is, the variable i, which is stored in the cell integration means 31 and indicates the recognition target area number to be processed, is set to 1.

【0054】次にステップS702で全ての認識対象領
域番号の最大のものと処理対象の認識対象領域番号を示
す変数iを比較し、変数iが全ての認識対象領域番号の
最大にものより大きければ、処理を終了する。そうでな
ければ、ステップS703へ処理を移す。図6の例の場
合、全ての認識対象領域番号の最大のものは2、現在の
処理認識対象領域番号は1であるから、ステップS70
3へ処理を移す。
Next, in step S702, the largest one of all the recognition target region numbers is compared with the variable i indicating the recognition target region number to be processed, and if the variable i is larger than the largest of all the recognition target region numbers. , And the process ends. If not, the process moves to step S703. In the case of the example of FIG. 6, since the maximum of all the recognition target area numbers is 2, and the current processing recognition target area number is 1, step S70 is performed.
Move the process to 3.

【0055】次にステップS703では、全ての特定の
セル領域に対して、その認識対象領域番号を調べ、現在
の処理認識対象領域番号iと同じ番号の特定のセル領域
同士を統合処理する。図6の例の場合、識対象領域番号
が1である特定のセル領域はT11のみであるので統合
処理は行われず、認識対象領域はT11のセル領域その
ものとなる。
In step S703, the recognition target area numbers of all the specific cell areas are checked, and the specific cell areas having the same number as the current processing recognition target area number i are integrated. In the case of the example of FIG. 6, since the specific cell region having the recognition target region number of 1 is only T11, the integration process is not performed, and the recognition target region is the T11 cell region itself.

【0056】次にステップS704では、次の認識対象
領域を統合するために、変数iを1つ増やす。そして、
処理をステップS702へ移す。図6の例の場合、i=
2となる。
Next, in step S704, the variable i is increased by one in order to integrate the next recognition target area. And
The process moves to step S702. In the case of the example of FIG.
It becomes 2.

【0057】次にステップS702で終了判定を行う。
この場合、前記に示した終了判定に当てはまらないの
で、ステップS703に処理を移す。
Next, an end determination is made in step S702.
In this case, since the end determination described above does not apply, the process proceeds to step S703.

【0058】次にステップS703では、全ての特定の
セル領域に対して、その認識対象領域番号を調べ、現在
の処理認識対象領域番号iと同じ番号の特定のセル領域
同士を統合処理する。図6の例の場合、識対象領域番号
が2であるセルは、T2221〜T2225の5つのセ
ルであるのでそれらを統合し、統合した認識対象領域の
位置に関する情報を、認識対象領域番号と対応づけて認
識領域データメモリ63に格納する。
In step S703, the recognition target area numbers of all the specific cell areas are checked, and specific cell areas having the same number as the current processing recognition target area number i are integrated. In the case of the example of FIG. 6, the cell having the recognition target area number 2 is the five cells T2221 to T2225, and these cells are integrated. Then, it is stored in the recognition area data memory 63.

【0059】次にステップS704では、次の認識対象
領域を統合するため、変数iを1つ増やす。そして、処
理をステップS702へ移す。図6の例の場合、i=3
となる。
Next, in step S704, the variable i is increased by one in order to integrate the next recognition target area. Then, the process proceeds to step S702. In the case of the example of FIG. 6, i = 3
Becomes

【0060】次にステップS702で終了判定を行う。
この場合、前記に示した終了判定に該当する。すなわ
ち、全ての認識対象領域に対して統合処理が終わってい
る。そのため、セル統合手段31は動作を終了する。
Next, an end determination is made in step S702.
This case corresponds to the end determination described above. That is, the integration processing has been completed for all the recognition target areas. Therefore, the cell integration means 31 ends the operation.

【0061】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている特定のセル領域(あ
るいは後述の特定のセル領域の一部分)の位置に関する
情報に基づいて、帳票イメージメモリ73に格納されて
いる帳票の画像データから文字等を切り出し、文字認識
する。
Thereafter, the character recognizing means 40 executes the form image memory 73 based on the information on the position of the specific cell area (or a part of the specific cell area described later) stored in the recognition area data memory 63. Characters and the like are cut out from the image data of the form stored in the document, and the characters are recognized.

【0062】(第2の実施例の効果について)以上のよ
うに、文字等の認識処理において、第2の実施例におけ
る認識対象領域の決定方法を用いることにより、同一の
認識対象領域同士を統合して認識することができるの
で、正確に、かつ早く識別することができる。また、同
一の認識対象領域内の文字を同一記入欄の認識結果とし
て出力することもできる。例えば、金額等数字を記入す
る領域で、1又は複数桁づつ罫線で区切られている場合
でも、金額欄に相当するセル同士を統合し、その認識結
果をまとめて出力できる。
(Regarding the effects of the second embodiment) As described above, the same recognition target regions are integrated by using the method for determining the recognition target regions in the second embodiment in the recognition processing of characters and the like. And can be recognized accurately and quickly. Also, characters in the same recognition target area can be output as a recognition result in the same entry field. For example, even in a case where a numeral or the like is entered in a region where a numeral or the like is entered, cells corresponding to the amount column can be integrated with each other, and the recognition results can be output collectively.

【0063】(第3の実施例の構成について)文字等の
認識処理において、特定のセル領域の中の一部分のみが
認識対象領域となる場合がある。第3の実施例は、この
ような認識対象領域に記載された文字等の認識が行なえ
るように、第1の実施例における認識対象の決定方法を
具えた認識対象決定装置のセル決定手段29の後段にセ
ル内部領域決定手段33を設けたものである。
(Regarding the Configuration of the Third Embodiment) In the process of recognizing a character or the like, only a part of a specific cell area may become a recognition target area. In the third embodiment, the cell determination means 29 of the recognition target determination apparatus provided with the recognition target determination method in the first embodiment can perform recognition of characters and the like described in such a recognition target area. A cell internal area determining means 33 is provided at the subsequent stage.

【0064】第3の実施例の構成図を図9に示す。な
お、第3の実施例では、内部領域位置情報は認識対象領
域が一部分のみである特定のセル領域に対して付加する
ものとして説明しているが、全ての特定のセル領域に対
して付加することも可能である。
FIG. 9 shows a configuration diagram of the third embodiment. In the third embodiment, the internal area position information is described as being added to a specific cell area where the recognition target area is only a part, but is added to all the specific cell areas. It is also possible.

【0065】認識領域データメモリ63には、セル決定
手段29で決定した、特定のセル領域の情報が格納され
ている。他方、辞書21には、認識対象領域が一部分の
みである特定のセル領域に対して、特定のセル領域の中
の認識対象領域を決定するための情報が格納されてい
る。この特定のセル領域の中の認識対象領域を決定する
ための情報は、特定のセル領域の中のどこが認識対象領
域となるのかを示す情報であり、以下、内部領域位置情
報という。セル内部領域決定手段33は、認識領域デー
タメモリ63に格納されている特定のセル領域の位置に
関する情報を参照するとともに、辞書21を参照し、特
定のセル領域に内部領域位置情報が付加されている場合
には、内部領域位置情報によって決定される領域のみを
認識対象としてその認識対象領域の位置に関する情報を
認識領域データメモリ63に格納する。なお、特定のセ
ル領域に内部領域位置情報が付加されていない場合に
は、認識対象領域であるその特定のセル領域の位置に関
する情報を認識領域データメモリ63に格納する。
The recognition area data memory 63 stores information on a specific cell area determined by the cell determination means 29. On the other hand, the dictionary 21 stores information for determining a recognition target area in a specific cell area for a specific cell area whose recognition target area is only a part. The information for determining the recognition target area in the specific cell area is information indicating where in the specific cell area the recognition target area is, and hereinafter, is referred to as internal area position information. The cell internal area determining means 33 refers to the information on the position of the specific cell area stored in the recognition area data memory 63 and refers to the dictionary 21 to add the internal area position information to the specific cell area. If there is, only the area determined by the internal area position information is set as a recognition target, and information on the position of the recognition target area is stored in the recognition area data memory 63. When the internal area position information is not added to the specific cell area, information on the position of the specific cell area which is the recognition target area is stored in the recognition area data memory 63.

【0066】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている認識対象領域の位置
に関する情報に基づいて、帳票イメージメモリ73に格
納されている帳票の画像データから文字等を切り出し、
文字認識する。なお、その他の各手段の処理内容は第1
の実施例と同じである。
Thereafter, the character recognizing means 40 converts the image data of the form stored in the form image memory 73 into characters and the like based on the information on the position of the recognition target area stored in the recognition area data memory 63. Cut out
Recognize characters. The processing contents of the other units are the first.
This is the same as the embodiment.

【0067】(第3の実施例の動作について)以下に、
図10の帳票の構成を示す図および図11の辞書21に
格納される情報の構成を示す図および図12のセル内部
領域決定手段の動作を示すフローチャートを用いて特定
のセル領域の中の一部分を認識対象領域として決定し、
認識処理する方法を説明する。
(Regarding the Operation of the Third Embodiment)
A part of a specific cell area is shown by using the figure showing the structure of the form shown in FIG. 10, the figure showing the structure of information stored in the dictionary 21 of FIG. 11, and the flowchart showing the operation of the cell internal area determining means of FIG. Is determined as the recognition target area,
A method of performing the recognition processing will be described.

【0068】まず、辞書21に格納する情報について説
明する。第3の実施例では、表領域の位置情報と罫線情
報又はセル情報と1又は複数の特定のセル領域を決定す
るための情報のほかに、各特定のセル領域に対して内部
領域位置情報を付加して辞書21に格納する。この内部
領域位置情報は、例えば、それぞれ独立して辞書21に
格納された、上記の階層構造におけるセル領域同士の相
対的な関係を示す情報と、上記の読み取りフィールドの
位置を示す情報とを比較し、読み取りフィールドと重な
りがあるセル領域を特定し、その特定のセル領域の中の
どの位置に認識対象領域が存在するのかを示す情報を付
加することによって設定される。
First, information stored in the dictionary 21 will be described. In the third embodiment, in addition to the position information of the table area, the ruled line information or the cell information, and the information for determining one or a plurality of specific cell areas, the internal area position information is specified for each specific cell area. The data is added and stored in the dictionary 21. For example, the internal area position information compares the information indicating the relative relationship between the cell areas in the hierarchical structure and the information indicating the position of the read field, which are stored in the dictionary 21 independently of each other. Then, it is set by specifying a cell area overlapping with the reading field and adding information indicating at which position in the specific cell area the recognition target area exists.

【0069】図11は、円で囲まれている特定のセル領
域T11およびT222が内部領域位置情報が付加され
ていることを示している。
FIG. 11 shows that specific cell regions T11 and T222 surrounded by a circle have internal region position information added thereto.

【0070】次に、セル内部領域決定手段31の動作に
ついて説明する。
Next, the operation of the cell internal area determining means 31 will be described.

【0071】まず、ステップS1001で初期化を行な
う。すなわち、セル内部領域決定手段33に格納され
た、処理対象の特定のセル領域の番号を示す変数iを1
にする。
First, initialization is performed in step S1001. That is, the variable i indicating the number of the specific cell area to be processed, stored in the cell internal area determining means 33, is set to 1
To

【0072】次に、ステップS1002であらかじめ決
定された特定のセル領域の数と処理対象の特定のセル領
域の番号を示す変数iを比較し、変数iがあらかじめ決
定された特定のセル領域の数より大きければ、処理を終
了する。そうでなければ、ステップS1003へ処理を
移す。図10の例の場合、あらかじめ決定された特定の
セル領域の数は2、現在の処理対象の特定のセル領域の
番号は1であるから、ステップS1003へ処理を移
す。
Next, in step S1002, the number of specific cell areas determined in advance is compared with the variable i indicating the number of the specific cell area to be processed, and the variable i is the number of specific cell areas determined in advance. If it is larger, the process ends. If not, the process moves to step S1003. In the case of the example of FIG. 10, since the number of the specific cell areas determined in advance is 2 and the number of the specific cell area to be processed at present is 1, the process proceeds to step S1003.

【0073】次にステップS1003では、処理対象の
特定のセル領域に対して、セル内部の認識対象となる領
域を決定する。具体的には、処理対象の特定のセル領域
が内部領域位置情報を持っていなければ、特定のセル領
域そのものを認識対象領域として決定し、特定のセル領
域の位置に関する情報を認識領域データメモリ63に出
力する。もし、処理対象の特定のセル領域が内部領域位
置情報を持っていれば、内部領域位置情報に基づいて、
特定のセル領域の中の認識対象となる領域を決定し、そ
の領域の位置に関する情報を認識領域データメモリ63
に出力する。図10の例の場合、処理対象の特定のセル
領域の番号が1である特定のセル領域はT11であり、
その内部領域位置情報は「セル上半分」となっているの
で、特定のセル領域T11の中の上半分を認識対象領域
として決定する。
Next, in step S1003, for a specific cell area to be processed, an area to be recognized inside the cell is determined. Specifically, if the specific cell area to be processed does not have the internal area position information, the specific cell area itself is determined as the recognition target area, and the information on the position of the specific cell area is stored in the recognition area data memory 63. Output to If the specific cell area to be processed has internal area position information, based on the internal area position information,
A recognition target area in a specific cell area is determined, and information on the position of the area is stored in a recognition area data memory 63.
Output to In the case of the example of FIG. 10, the specific cell area in which the number of the specific cell area to be processed is 1 is T11,
Since the internal area position information is “upper cell half”, the upper half of the specific cell area T11 is determined as the recognition target area.

【0074】次にステップS1004では、次の処理対
象の特定のセル領域について認識対象領域を決定するた
めに、変数iを1つ増やす。そして、処理をステップS
1002へ移す。図10の例の場合、i=2となる。
Next, in step S1004, the variable i is increased by one in order to determine a recognition target area for a specific cell area to be processed next. Then, the process proceeds to step S
Move to 1002. In the example of FIG. 10, i = 2.

【0075】以上の処理を全ての特定のセル領域に対し
て行い、全ての特定のセル領域の中の認識対象領域が決
定されると、セル内部領域決定手段33は動作を終了す
る。図10の例の場合、T11とT222に対して認識
対象領域が決定されると、セル内部領域決定手段33は
動作を終了する。
The above processing is performed on all the specific cell areas, and when the recognition target area in all the specific cell areas is determined, the operation of the cell internal area determining means 33 ends. In the case of the example of FIG. 10, when the recognition target area is determined for T11 and T222, the cell internal area determination unit 33 ends the operation.

【0076】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている認識対象領域の位置
に関する情報に基づいて、帳票イメージメモリ73に格
納されている帳票の画像データから文字等を切り出し、
文字認識する。
Thereafter, the character recognizing means 40 determines the character or the like from the image data of the form stored in the form image memory 73 based on the information on the position of the recognition target area stored in the recognition area data memory 63. Cut out
Recognize characters.

【0077】なお、上記実施例では、内部領域位置情報
を「セル上半分」というようにセル領域に対する割合で
表現しているが、セル領域の座標とその内部の認識対象
領域となる座標により表現してもよい。
In the above embodiment, the internal area position information is expressed as a ratio with respect to the cell area such as “upper half of the cell”. However, it is expressed by the coordinates of the cell area and the coordinates of the internal recognition target area. May be.

【0078】(第3の実施例の効果について)以上のよ
うに、文字等の認識処理において、第3の実施例におけ
る認識対象領域決定方法を用いることにより、セル内部
の認識を行うべき領域のみ認識処理することができるの
で、不必要な処理を省くことができる。その結果、処理
時間の効率化を計ることができる。また、セル内部で認
識対象とならない不必要な部分の認識結果も出力しない
ようにできる。
(Effects of the Third Embodiment) As described above, in the recognition processing of characters and the like, the recognition target area determination method in the third embodiment is used, so that only the area to be recognized inside the cell is to be recognized. Since recognition processing can be performed, unnecessary processing can be omitted. As a result, the processing time can be made more efficient. In addition, it is possible not to output a recognition result of an unnecessary portion that is not a recognition target inside the cell.

【0079】(第4の実施例の構成について)文字等の
認識処理において、表領域の外側の領域に存在する認識
対象領域に対しても、認識処理できることが望まれる。
(Regarding the Configuration of the Fourth Embodiment) In recognition processing of characters and the like, it is desired that recognition processing can be performed even on a recognition target area existing in an area outside the table area.

【0080】そこで、第4の実施例は、表領域の外側に
存在する認識対象領域についても抽出できるように、第
1の実施例における認識対象の決定方法を具えた認識対
象決定装置のセル決定手段29の後段に表外領域決定手
段35を設けたものである。
Therefore, in the fourth embodiment, the cell determination of the recognition object determination apparatus provided with the recognition object determination method in the first embodiment is performed so that a recognition target area existing outside the table area can be extracted. An out-of-line area determining means 35 is provided at the subsequent stage of the means 29.

【0081】第4の実施例の構成図を図13に示す。第
4の実施例では、帳票の表の内側の領域に対してはセル
決定手段29が認識対象領域を決定して認識対象領域の
位置に関する情報を認識領域データメモリ63に格納
し、帳票の表の外側の領域に対しては表外領域決定手段
35が認識対象領域を決定して認識対象領域の位置に関
する情報を認識領域データメモリ63に格納する。
FIG. 13 shows the configuration of the fourth embodiment. No.
In the fourth embodiment, the cell determination means 29 determines the recognition target area for the area inside the table of the form, stores information on the position of the recognition target area in the recognition area data memory 63, and stores the information in the form table. For the outside area, the out-of-line area determination means 35 determines the recognition target area, and stores information on the position of the recognition target area in the recognition area data memory 63.

【0082】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている認識対象領域の位置
に関する情報に基づいて、帳票イメージメモリ73に格
納されている帳票の画像データから文字等を切り出し、
文字認識する。なお、その他の各手段の処理内容は第1
の実施例と同じである。
Thereafter, the character recognizing means 40 converts the character data or the like from the image data of the form stored in the form image memory 73 based on the information on the position of the recognition target area stored in the recognition area data memory 63. Cut out
Recognize characters. The processing contents of the other units are the first.
This is the same as the embodiment.

【0083】(第4の実施例の動作について)以下に、
図14の帳票の構成を示す図および図15の辞書21に
格納する情報の構成を示す図を用いて表の外側の領域に
存在する認識対象領域を決定し、認識処理する方法を説
明する。
(Regarding the Operation of the Fourth Embodiment)
A method of determining a recognition target region existing in a region outside the table and performing a recognition process will be described with reference to the diagram showing the configuration of the form in FIG. 14 and the diagram showing the configuration of information stored in the dictionary 21 in FIG.

【0084】まず、辞書21に格納する情報について説
明する。第4の実施例では、表の内側の特定のセル領域
を決定するために必要な、表領域の位置情報と罫線情報
又はセル情報と1又は複数の特定のセル領域を決定する
ための情報のほかに、表の外側に存在する認識対象領域
の位置を示す情報(以下、表外認識領域の位置情報とい
う)を付加する。なお、表の外側に存在する認識対象領
域は、例えば、図14では240a〜bとして示される
領域である。
First, information stored in the dictionary 21 will be described. In the fourth embodiment, the position information and the ruled line information or the cell information of the table area and the information for determining one or a plurality of specific cell areas necessary for determining the specific cell area inside the table are determined. In addition, information indicating the position of the recognition target area existing outside the table (hereinafter, position information of the out-of-line recognition area) is added. Note that the recognition target areas existing outside the table are, for example, areas indicated by 240a and 240b in FIG.

【0085】図15には、そのような辞書21に格納さ
れる情報の構成が示されている。図15は、左側の系統
に表の内側の特定のセル領域を決定するための情報が格
納されていることを示しており、右側の系統に表外認識
領域の位置情報が格納されていることを示している。な
お、図14の帳票は、表の外側に存在する認識対象領域
が2個所あるので、図15の右側の系統にはそれに対応
する2つの情報R1、R2が格納されている。
FIG. 15 shows the structure of information stored in such a dictionary 21. FIG. 15 shows that information for determining a specific cell area inside the table is stored in the left system, and that positional information of the out-of-line recognition area is stored in the right system. Is shown. Since the form shown in FIG. 14 has two recognition target areas outside the table, two pieces of information R1 and R2 corresponding to the two areas are stored in the system on the right side of FIG.

【0086】前述の通り、帳票の表の内側の領域に対し
てはセル決定手段29が認識対象領域を決定して認識対
象領域の位置に関する情報を認識領域データメモリ63
に格納し、帳票の表の外側の領域に対しては表外領域決
定手段35が認識対象領域を決定して認識対象領域の位
置に関する情報を認識領域データメモリ63に格納す
る。セル決定手段29の動作については、第1の実施例
と同じであるので、以下は、表外領域決定手段35の動
作について説明する。
As described above, with respect to the area inside the table of the form, the cell determining means 29 determines the recognition target area and stores the information on the position of the recognition target area in the recognition area data memory 63.
The area outside the table of the form is determined by the out-of-line area determination means 35, and information on the position of the recognition target area is stored in the recognition area data memory 63. Since the operation of the cell determining means 29 is the same as that of the first embodiment, the operation of the out-of-line area determining means 35 will be described below.

【0087】表外領域決定手段35は、表の外側に存在
する認識対象領域の各々に対応づけられて辞書21に格
納されている表外認識領域の位置情報に基づいて、認識
対象領域を特定し、その認識対象領域に記載された文字
領域を検出し、その領域の位置に関する情報を認識領域
データメモリ63に格納する。文字領域の検出は、公知
の認識処理技術によって行なうことができる。例えば、
各認識対象領域の近辺内で黒画素の塊を求め、それらの
情報に基づいて文字領域を抽出することによってできる
し、また、各認識対象領域の周辺の白画素分布を調べ、
ある閾値以上白画素が連続する位置を文字領域の境界と
して、文字領域を抽出することによってもできる。さら
には、表の内側の特定のセル領域を検出する際に求めた
罫線の位置情報から、その位置に対しての相対的な位置
関係を用いて、文字領域を抽出することもできる。
The out-of-line area determining means 35 specifies the recognition target area based on the position information of the out-of-line recognition area stored in the dictionary 21 in association with each of the recognition target areas existing outside the table. Then, a character area described in the recognition target area is detected, and information on the position of the area is stored in the recognition area data memory 63. The detection of the character area can be performed by a known recognition processing technique. For example,
It is possible to obtain a lump of black pixels in the vicinity of each recognition target area and extract a character area based on the information, and also examine a white pixel distribution around each recognition target area,
It is also possible to extract a character region by using a position where white pixels continue at a certain threshold or more as a boundary of the character region. Furthermore, a character area can be extracted from position information of a ruled line obtained when a specific cell area inside a table is detected, using a relative positional relationship to the position.

【0088】以上の処理を全ての表外認識領域の位置情
報に対して行うと、表外領域決定手段35は動作を終了
する。
When the above processing is performed on the position information of all the out-of-line recognition areas, the out-of-line area determination means 35 ends the operation.

【0089】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている認識対象領域の位置
に関する情報に基づいて、帳票イメージメモリ73に格
納されている帳票の画像データから文字等を切り出し、
文字認識する。
Thereafter, the character recognizing means 40 uses the information on the position of the recognition target area stored in the recognition area data memory 63 to extract the characters and the like from the image data of the form stored in the form image memory 73. Cut out
Recognize characters.

【0090】(第4の実施例の効果について)以上のよ
うに、文字等の認識処理において、第4の実施例におけ
る認識対象領域の決定方法を用いることにより、表の外
側に認識対象領域がある場合でも、その領域を決定で
き、認識処理を行なうことができる。これにより、帳票
の表領域の内外を問わず、あらゆる場所に記入されてい
る文字等に対して認識処理を行うことができる。
(Effects of the Fourth Embodiment) As described above, in the recognition processing of characters and the like, the recognition target area is determined outside the table by using the method of determining the recognition target area in the fourth embodiment. Even in some cases, the area can be determined, and recognition processing can be performed. As a result, it is possible to perform recognition processing on characters and the like written in all places regardless of the inside and outside of the table area of the form.

【0091】(第5の実施例の構成について)文字等の
認識処理において、例えば、表領域の罫線が表領域の垂
直方向の両端又は水平方向の両端を結ぶ罫線以外の罫線
によって分割され、これによって形成されたセルの中に
認識対象領域となる特定のセル領域が含まれる場合があ
る。第5の実施例は、このような特定のセル領域が決定
できるように、辞書21に罫線が分割されたことを示す
情報(以下、交差罫線付加情報という)を格納するとと
もに、罫線検出手段25に該分割する罫線を検出する機
能を付加したものである。
(Regarding the Configuration of the Fifth Embodiment) In the process of recognizing characters and the like, for example, ruled lines in a table area are divided by ruled lines other than ruled lines connecting both ends in the vertical direction or both ends in the horizontal direction of the table area. There is a case where a specific cell region to be a recognition target region is included in the cells formed by the above. In the fifth embodiment, information indicating that a ruled line has been divided (hereinafter referred to as “intersecting ruled line additional information”) is stored in the dictionary 21 so that such a specific cell area can be determined. Has a function of detecting the ruled line to be divided.

【0092】(第5の実施例の動作について)以下に、
図16の帳票の構成を示す図および図17の辞書21に
格納される情報の構成を示す図を用いて表領域の罫線が
垂直方向の両端又は水平方向の両端を結ぶ罫線以外の罫
線(以下、垂直分割罫線、水平分割罫線という)で分割
されている場合の該垂直分割罫線、水平分割罫線を検出
し、認識対象領域を決定する方法について説明する。
(Operation of Fifth Embodiment)
Ruled lines in the table area other than ruled lines connecting both ends in the vertical direction or both ends in the horizontal direction (hereinafter referred to as ruled lines) using the diagram showing the configuration of the form in FIG. 16 and the diagram showing the configuration of information stored in the dictionary 21 in FIG. The following describes a method of detecting the vertical division rule and the horizontal division rule in the case of division by the vertical division rule and the horizontal division rule, and determining the recognition target area.

【0093】まず、辞書21に格納する情報について説
明する。第5の実施例では、図16に示される基準帳票
内の表210に対応して、表領域の垂直方向の両端又は
水平方向の両端を結ぶ罫線に関する罫線情報、又はこの
罫線によって形成されたセル領域に関するセル情報が階
層的に辞書21に格納されるとともに、図16に220
b、cとして示されるように垂直分割罫線、水平分割罫
線に関する罫線情報、又は垂直分割罫線、水平分割罫線
によって形成されたセル領域に関するセル情報が交差付
加情報と対応づけられて階層的に辞書21に格納されて
いる。
First, information stored in the dictionary 21 will be described. In the fifth embodiment, corresponding to the table 210 in the reference form shown in FIG. 16, ruled line information on a ruled line connecting both ends in the vertical direction or both ends in the horizontal direction of the table area, or a cell formed by this ruled line The cell information relating to the area is hierarchically stored in the dictionary 21 and, in FIG.
As shown by b and c, the rule information on the vertical divided ruled lines and the horizontal divided ruled lines, or the cell information on the cell area formed by the vertical divided ruled lines and the horizontal divided ruled lines is associated with the intersection additional information and hierarchically associated with the dictionary 21. Is stored in

【0094】図17は、セル領域T2が垂直分割罫線、
水平分割罫線によって分割されて、セル領域T21と特
定のセル領域T22を形成していることを示している。
FIG. 17 shows that the cell area T2 has vertical dividing ruled lines,
It is shown that the cell region T21 and the specific cell region T22 are formed by being divided by the horizontal dividing ruled lines.

【0095】なお、辞書21に格納される罫線情報又は
セル情報がそれらの数だけではなく、位置情報も含む場
合は、位置情報から垂直分割罫線、水平分割罫線又はこ
れら罫線によって形成されたセル領域であることが認識
できるので、交差罫線付加情報を付加しないようにする
こともできる。
When the ruled line information or cell information stored in the dictionary 21 includes not only the number but also the position information, the vertical divided ruled line, the horizontal divided ruled line, or the cell area formed by these ruled lines is obtained from the position information. Therefore, it is possible not to add the intersection ruled line additional information.

【0096】次に、特定のセル領域を決定する方法につ
いて説明する。なお、罫線検出手段25を除いて各手段
の処理内容は、本発明の第1の実施例と同じである。
Next, a method for determining a specific cell area will be described. Except for the ruled line detecting means 25, the processing contents of each means are the same as in the first embodiment of the present invention.

【0097】罫線検出手段25は、交差罫線付加情報が
辞書21に付加されていない場合は、表領域の垂直方向
の両端又は水平方向の両端を結ぶ罫線を検出する。も
し、交差罫線付加情報が付加されていれば、交差罫線付
加情報に基づいて、検出すべき罫線が存在する領域を特
定し、その領域の画像データから、例えば、水平方向お
よび垂直方向で連続する黒画素数等から罫線候補を検出
する。そして、それらの罫線の中で水平方向と垂直方向
の両方の罫線が互いに端点で交差する罫線を検出して、
セル領域を特定する。
When the additional ruled line addition information is not added to the dictionary 21, the ruled line detection means 25 detects a ruled line connecting both ends in the vertical direction or both ends in the horizontal direction of the table area. If the intersection ruled line additional information is added, an area in which the ruled line to be detected exists is specified based on the intersection ruled line additional information, and, for example, continuous in the horizontal direction and the vertical direction are determined from the image data of the area. Rule line candidates are detected from the number of black pixels and the like. Then, of those ruled lines, a ruled line in which both horizontal and vertical ruled lines intersect each other at an end point is detected,
Identify the cell area.

【0098】セル決定手段29は、このセル領域が特定
のセル領域である場合はそのセル領域を特定のセル領域
として決定し、そのデータを認識処理対象領域の番号と
共に認識領域データメモリ63に格納する。
If this cell area is a specific cell area, the cell determining means 29 determines that cell area as a specific cell area and stores the data in the recognition area data memory 63 together with the number of the area to be recognized. I do.

【0099】もし、特定のセル領域がそのセル領域の更
に下層にある場合は、同様の手法で、特定のセル領域が
決定されるまで、更に下位の階層の罫線検出に処理を移
す。
If the specific cell region is located further below the cell region, the process is shifted to the detection of a ruled line of a lower hierarchy by a similar method until the specific cell region is determined.

【0100】(第5の実施例の効果について)以上のよ
うに、文字等の認識処理において、第5の実施例におけ
る認識対象領域の決定方法を用いることにより、垂直分
割罫線又は水平分割罫線で構成されているセル領域が存
在しても、罫線交差付加情報に基づいてこれら罫線を検
出でき、正確に特定のセル領域を決定できる。その結
果、それら特定のセル領域の文字等の認識処理を精度良
く行うことができる。
(Effects of the Fifth Embodiment) As described above, in the recognition processing of characters and the like, by using the method of determining a recognition target area in the fifth embodiment, a vertical division rule line or a horizontal division rule line is used. Even if there are configured cell areas, these ruled lines can be detected based on the ruled line intersection additional information, and a specific cell area can be accurately determined. As a result, it is possible to accurately perform recognition processing of characters and the like in those specific cell regions.

【0101】(実施の形態について)以上、実施例1〜
4までを個別に説明をしてきたが、それぞれの実施例を
組み合わせた構成とすることもできる。図18にその構
成を示す。
(Regarding the Embodiment)
Although up to four have been described individually, the respective embodiments may be combined. FIG. 18 shows the configuration.

【0102】図18はそれぞれの実施例を組み合わせた
構成を示す図である。図18の例では、第1の実施例の
構成に、罫線検出手段25に上記垂直分割罫線および水
平分割罫線を検出する機能を付加するとともに、セル決
定手段29の後段にセル統合手段31とセル内部領域決
定手段33と表外領域決定手段35を設けたものであ
る。また、辞書21および認識領域データメモリ63に
上述の認識対象領域番号や表外認識領域の位置情報、そ
の他の情報を格納するようにしたものである。なお、各
手段の処理は実施例1〜5で説明したものと同様であ
る。
FIG. 18 is a diagram showing a configuration obtained by combining the embodiments. In the example of FIG. 18, the function of detecting the vertical division ruled line and the horizontal division ruled line is added to the ruled line detection means 25 to the configuration of the first embodiment, and the cell integration means 31 and the cell An internal area determining means 33 and an out-of-line area determining means 35 are provided. The dictionary 21 and the recognition area data memory 63 store the recognition target area number, the position information of the out-of-line recognition area, and other information. The processing of each means is the same as that described in the first to fifth embodiments.

【0103】このような文字認識装置は、図19に示す
帳票から文字を切り出し、文字認識することができる。
図19は、帳票の構成を示す図であり、1枚の帳票の中
に複数の表領域が存在し、同一の認識対象として統合し
て認識すべき領域が存在し、特定のセル領域の中の一部
分のみが認識対象となる領域が存在し、表領域の外側に
認識対象領域が存在し、また垂直分割罫線や水平分割罫
線で区分けされた領域が存在する帳票を示している。
Such a character recognition device can cut out characters from the form shown in FIG. 19 and recognize the characters.
FIG. 19 is a diagram showing the configuration of a form. In a form, there are a plurality of table areas, an area to be integrated and recognized as the same recognition target exists, and a specific cell area. This shows a form in which there is an area in which only a part is recognized, an area to be recognized exists outside the table area, and an area divided by a vertical division rule or a horizontal division rule.

【0104】図18に示される文字認識装置は、図19
に示される帳票に対して、まず、罫線検出手段25が、
表領域の水平方向の両端又は垂直方向の両端を結ぶ罫
線、さらに垂直分割罫線や水平分割罫線を検出し、セル
決定手段29が辞書21に格納された情報に基づいて、
セル領域を特定する。
The character recognition device shown in FIG.
First, the ruled line detection means 25
A ruled line connecting both ends in the horizontal direction or the vertical direction of the table area, a vertical divided ruled line and a horizontal divided ruled line are detected, and the cell determining means 29 detects the ruled line based on the information stored in the dictionary 21.
Identify the cell area.

【0105】なお、辞書21には、辞書に格納される情
報の構成を示す図である図20に示すような情報が格納
されている。図20には、2つの表領域である表1と表
2に関する情報や、表領域の外側に存在する文字等が記
入された領域を示す表外に関する情報が示されている。
例えば、表1に関する情報としてT1〜T222が示さ
れており、その中で第3階層のセル領域であるT221
が特定のセル領域であることを示さている。また、表2
に関する情報としてT1〜T233が示されており、そ
の中で第3階層のセル領域であるT222とT232と
T233が特定のセル領域であり、さらにT222には
内部領域位置情報として「セル左部3/4」が付加され
ていることが示され、T232〜T233には同一の認
識対象領域であることを示す情報が付加されていること
が示さている。また、表外に関する情報としてR1が示
されている。
The dictionary 21 stores information as shown in FIG. 20, which is a diagram showing the structure of information stored in the dictionary. FIG. 20 shows information about two table areas, Table 1 and Table 2, and information about the outside of the table, which indicates an area where characters and the like existing outside the table area are written.
For example, T1 to T222 are shown as information relating to Table 1, in which T221 which is a cell area of the third hierarchy is shown.
Indicates a specific cell area. Table 2
T1 to T233 are shown as related information, in which T222, T232, and T233, which are cell areas in the third hierarchy, are specific cell areas, and T222 further includes "cell left part 3" as internal area position information. / 4 "is added, and information indicating that the recognition target areas are the same is added to T232 to T233. Also, R1 is shown as information relating to out-of-line.

【0106】次にセル統合手段31が同一の認識対象と
して統合して認識すべき領域を統合し、またセル内部領
域決定手段33は特定のセル領域の中の認識対象領域を
決定し、表外領域決定手段35は表領域の外側に認識対
象領域を決定する。これらによって決定された認識対象
領域の位置を示す情報は認識領域データメモリ63に格
納される。
Next, the cell integration means 31 integrates the areas to be integrated and recognized as the same recognition target, and the cell internal area determination means 33 determines the recognition target area in the specific cell area, and The area determining means 35 determines a recognition target area outside the table area. Information indicating the position of the recognition target area determined by these is stored in the recognition area data memory 63.

【0107】この後は、文字認識手段40が、認識領域
データメモリ63に格納されている認識対象領域の位置
を示す情報に基づいて、帳票イメージメモリ73に格納
されている帳票の画像データから文字を切り出し、文字
認識する。
Thereafter, the character recognizing means 40 converts the character data from the image data of the form stored in the form image memory 73 based on the information indicating the position of the recognition target area stored in the recognition area data memory 63. And character recognition.

【0108】なお、本発明は、上記の実施例に限らず、
辞書等に格納される情報を変更したり、構成や動作を変
更することが可能である。
Note that the present invention is not limited to the above-described embodiment.
It is possible to change information stored in a dictionary or the like, or to change the configuration or operation.

【0109】[0109]

【発明の効果】以上説明した本発明には、次の効果があ
る。
The present invention described above has the following effects.

【0110】文字等の認識処理において、第1の実施例
に記載された第1又は第2の発明を用いることにより、帳
票内に複数の表領域が存在する場合にも表領域が特定で
き、かつ、各表領域ごとに、認識対象領域となる特定の
セル領域を決定できる。そのため、複雑な構成の帳票の
認識処理を、簡略な構成の装置で行なうことができる。
In the recognition processing of characters and the like, by using the first or second invention described in the first embodiment, a table area can be specified even when a plurality of table areas exist in a form. In addition, a specific cell area to be a recognition target area can be determined for each table area. Therefore, it is possible to perform a process of recognizing a form having a complicated configuration with a device having a simple configuration.

【0111】また、文字等の認識処理において、第2の
実施例に記載された第3の発明を用いることにより、同
一の認識対象領域同士を統合して認識することができる
ので、正確に、かつ早く識別することができる。また、
同一の認識対象領域内の文字を同一記入欄の認識結果と
して出力することもできる。例えば、金額等数字を記入
する領域で、1又は複数桁づつ罫線で区切られている場
合でも、金額欄に相当するセル同士を統合し、その認識
結果をまとめて出力できる。
In the recognition processing of characters and the like, by using the third invention described in the second embodiment, the same recognition target areas can be integrated and recognized, so that And can be identified quickly. Also,
Characters in the same recognition target area can be output as a recognition result in the same entry field. For example, even in a case where a numeral or the like is entered in a region where a numeral or the like is entered, cells corresponding to the amount column can be integrated with each other, and the recognition results can be output collectively.

【0112】また、文字等の認識処理において、第3の
実施例に記載された第4又は第5の発明を用いることによ
り、セル内部の認識を行うべき領域のみ認識処理するこ
とができるので、不必要な処理を省くことができる。そ
の結果、処理時間の効率化を計ることができる。また、
セル内部で認識対象とならない不必要な部分の認識結果
も出力しないようにできる。
Further, in the recognition processing of characters and the like, by using the fourth or fifth invention described in the third embodiment, it is possible to perform the recognition processing only on the area in the cell where recognition is to be performed. Unnecessary processing can be omitted. As a result, the processing time can be made more efficient. Also,
Recognition results of unnecessary parts that are not to be recognized inside the cell can also be prevented from being output.

【0113】また、文字等の認識処理において、第4の
実施例に記載された第6又は第7の発明を用いることに
より、表の外側に認識対象領域がある場合でも、その領
域を決定でき、認識処理を行なうことができる。これに
より、帳票の表領域の内外を問わず、あらゆる場所に記
入されている文字等に対して認識処理を行うことができ
る。
Further, by using the sixth or seventh invention described in the fourth embodiment in the recognition processing of characters and the like, even if a recognition target area exists outside the table, the area can be determined. , A recognition process can be performed. As a result, it is possible to perform recognition processing on characters and the like written in all places regardless of the inside and outside of the table area of the form.

【0114】また、文字等の認識処理において、第5の
実施例に記載された第8又は第9の発明を用いることに
より、垂直分割罫線又は水平分割罫線で構成されている
セル領域が存在しても、罫線交差付加情報に基づいてこ
れら罫線を検出でき、正確に特定のセル領域を決定でき
る。その結果、それら特定のセル領域の文字等の認識処
理を精度良く行うことができる。
Further, in the recognition processing of characters and the like, by using the eighth or ninth invention described in the fifth embodiment, a cell area constituted by vertical division ruled lines or horizontal division ruled lines exists. However, these ruled lines can be detected based on the ruled line intersection additional information, and a specific cell region can be accurately determined. As a result, it is possible to accurately perform recognition processing of characters and the like in those specific cell regions.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施例の処理構成図である。FIG. 1 is a processing configuration diagram of a first embodiment of the present invention.

【図2】帳票の構成を示す図である。FIG. 2 is a diagram showing a configuration of a form.

【図3】辞書に格納される情報の構成を示す図である。FIG. 3 is a diagram showing a configuration of information stored in a dictionary.

【図4】表別処理制御手段の動作を示すフローチャート
である。
FIG. 4 is a flowchart illustrating an operation of a table-specific process control unit.

【図5】本発明の第2の実施例の処理構成図である。FIG. 5 is a processing configuration diagram of a second embodiment of the present invention.

【図6】帳票の構成を示す図である。FIG. 6 is a diagram showing a configuration of a form.

【図7】辞書に格納される情報の構成を示す図である。FIG. 7 is a diagram showing a configuration of information stored in a dictionary.

【図8】セル統合手段のフローチャートである。FIG. 8 is a flowchart of the cell integration means.

【図9】本発明の第3の実施例の処理構成図である。FIG. 9 is a processing configuration diagram of a third embodiment of the present invention.

【図10】帳票の構成を示す図である。FIG. 10 is a diagram showing a configuration of a form.

【図11】辞書に格納される情報の構成を示す図であ
る。
FIG. 11 is a diagram showing a configuration of information stored in a dictionary.

【図12】セル内部領域決定手段のフローチャートであ
る。
FIG. 12 is a flowchart of a cell internal area determining unit.

【図13】本発明の第4の実施例の処理構成図である。FIG. 13 is a processing configuration diagram of a fourth embodiment of the present invention.

【図14】帳票の構成を示す図である。FIG. 14 is a diagram showing a configuration of a form.

【図15】辞書に格納される情報の構成を示す図であ
る。
FIG. 15 is a diagram showing a configuration of information stored in a dictionary.

【図16】帳票の構成を示す図である。FIG. 16 is a diagram showing a configuration of a form.

【図17】辞書に格納される情報の構成を示す図であ
る。
FIG. 17 is a diagram showing a configuration of information stored in a dictionary.

【図18】実施形態例におけるの処理構成図である。FIG. 18 is a processing configuration diagram in the embodiment.

【図19】帳票の構成を示す図である。FIG. 19 is a diagram showing a configuration of a form.

【図20】辞書に格納される情報の構成を示す図であ
る。
FIG. 20 is a diagram showing a configuration of information stored in a dictionary.

【符号の説明】[Explanation of symbols]

10 文字認識装置 20 認識対象領域決定装置 21 辞書 23 表別処理制御手段 25 罫線検出手段 27 対応関係判定手段 29 セル決定手段 40 文字認識手段 50 CPU 60 メモリ 61 罫線データメモリ 63 認識領域データメモリ 70 画像データ入力装置 71 スキャナ 73 帳票イメージメモリ REFERENCE SIGNS LIST 10 character recognition device 20 recognition target area determination device 21 dictionary 23 table processing control means 25 ruled line detection means 27 correspondence determination means 29 cell determination means 40 character recognition means 50 CPU 60 memory 61 ruled line data memory 63 recognition area data memory 70 image Data input device 71 Scanner 73 Form image memory

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 罫線で区分けされている多数のセルを含
む帳票の画像データから、認識対象領域となる1又は複
数の特定のセル領域を決定するに当たり、 帳票の罫線情報又はセル情報と帳票の特定の認識領域を
決定するための情報を予め辞書に格納しておき、 前記帳票の画像データから罫線を検出し、 前記表領域の中の罫線により区分される領域から、前記
特定のセル領域を決定し、さらに認識領域を決定するた
めの情報に基づいて、認識領域を決定することを特徴と
する認識対象領域の決定方法。
When determining one or a plurality of specific cell areas to be a recognition target area from image data of a form including a large number of cells partitioned by ruled lines, the ruled line information or cell information of the form and the form information of the form are determined. Information for determining a specific recognition area is stored in a dictionary in advance, a ruled line is detected from the image data of the form, and the specific cell area is determined from an area divided by the ruled line in the table area. A method for determining a recognition target region, comprising determining a recognition region based on information for determining and further determining a recognition region.
【請求項2】 罫線で区分けされている多数のセルを含
む1又は複数の帳票の画像データから、認識対象領域と
なる1又は複数の特定のセル領域を決定するに当たり、 すでに特定のセル領域が決定された帳票を基準帳票と
し、 認識処理すべき帳票内の交差する罫線によって閉領域と
なっている表領域ごとに、罫線情報又はセル情報と、前
記基準帳票の特定のセル領域を決定するための情報とを
前記辞書に格納し、 認識処理すべき帳票の画像データから、各表領域ごと
に、前記辞書に格納された前記罫線情報又はセル情報と
前記基準帳票の特定のセル領域を決定するための情報に
基づいて、前記特定のセル領域を決定することを特徴と
する認識対象領域の決定方法。
2. A method for determining one or a plurality of specific cell areas to be a recognition target area from image data of one or a plurality of forms including a large number of cells divided by ruled lines, wherein a specific cell area has already been determined. The determined form is used as a reference form, and ruled line information or cell information and a specific cell area of the reference form are determined for each table area closed by an intersecting ruled line in the form to be recognized. Is stored in the dictionary, and from the image data of the form to be recognized, the ruled line information or cell information stored in the dictionary and a specific cell area of the reference form are determined for each table area. Determining the specific cell region based on the information for determining the region to be recognized.
【請求項3】 請求項1又は2に記載の認識対象領域の
決定方法において、 認識処理すべき帳票に特定のセル領域が複数あり、かつ
その中に同一の認識対象として統合して認識すべき領域
がある場合に、 前記罫線情報又はセル情報と、前記基準帳票の特定のセ
ル領域を決定するための情報と、同一の認識対象領域を
決定するための情報とを前記辞書に格納し、 認識処理すべき帳票の画像データから、前記辞書に格納
された前記罫線情報又はセル情報と前記基準帳票の特定
のセル領域を決定するための情報に基づいて、前記特定
のセル領域を決定し、 前記同一の認識対象領域を決定するための情報に基づい
て、前記特定のセル領域の中から同一の認識対象領域同
士を統合して認識対象領域を決定することを特徴とする
認識対象領域の決定方法。
3. The method for determining a recognition target area according to claim 1, wherein the form to be recognized has a plurality of specific cell areas, and the specific cell areas are to be integrated and recognized as the same recognition target. When there is an area, the ruled line information or cell information, information for determining a specific cell area of the reference form, and information for determining the same recognition target area are stored in the dictionary. From the image data of the form to be processed, based on the ruled line information or cell information stored in the dictionary and information for determining a specific cell area of the reference form, determine the specific cell area, A method for determining a recognition target area, comprising: integrating the same recognition target areas from the specific cell area based on information for determining the same recognition target area to determine a recognition target area.
【請求項4】 請求項1又は2に記載の認識対象領域の
決定方法において、 認識処理すべき帳票に含まれる前記特定のセル領域の中
の一部分のみが認識対象領域となる場合に、 前記罫線情報又はセル情報と、前記基準帳票の特定のセ
ル領域を決定するための情報と、特定のセル領域の中の
認識対象領域を決定するための内部領域位置情報とを前
記辞書に格納し、 認識処理すべき帳票の画像データから、前記辞書に格納
された前記罫線情報又はセル情報と前記基準帳票の特定
のセル領域を決定するための情報に基づいて、前記特定
のセル領域を決定し、 前記内部領域位置情報に基づいて、前記特定のセル領域
の中に含まれる認識対象領域を決定することを特徴とす
る認識対象領域の決定方法。
4. The method according to claim 1 or 2, wherein only a part of the specific cell area included in the form to be recognized is a recognition target area. Information or cell information, information for determining a specific cell area of the reference form, and internal area position information for determining a recognition target area in the specific cell area are stored in the dictionary; From the image data of the form to be processed, based on the ruled line information or cell information stored in the dictionary and information for determining a specific cell area of the reference form, determine the specific cell area, A method for determining a recognition target area, comprising: determining a recognition target area included in the specific cell area based on internal area position information.
【請求項5】 請求項4に記載の認識対象領域の決定方
法において、 特定のセル領域の中の認識対象領域を決定するための内
部領域位置情報を前記基準帳票における特定セルと認識
対象領域の位置座標を比較するにより決定し、 決定されて辞書に格納された内部領域位置情報と前記特
定したセル情報の位置関係を比較することにより、認識
対象領域を決定することを特徴とする認識対象領域の決
定方法。
5. The method for determining a recognition target area according to claim 4, wherein the internal area position information for determining the recognition target area in the specific cell area is determined based on the specific cell and the recognition target area in the reference form. A recognition target area determined by comparing position coordinates, and comparing the positional relationship between the determined internal area position information stored in the dictionary and the specified cell information to determine a recognition target area; How to determine.
【請求項6】 請求項1又は2に記載の認識対象領域の
決定方法において、 認識処理すべき帳票の中の表領域の外側に認識対象領域
が存在する場合に、 前記罫線情報又はセル情報と、表領域の外側の認識対象
領域を決定するための表外認識領域の位置情報を前記辞
書に格納し、 認識処理すべき帳票の画像データから、前記辞書に格納
された前記罫線情報又はセル情報と前記表外認識領域の
位置情報に基づいて、前記表領域の外側に存在する認識
対象領域を決定することを特徴とする認識対象領域の決
定方法。
6. The method for determining a recognition target area according to claim 1, wherein the ruled line information or the cell information is used when a recognition target area exists outside a table area in a form to be recognized. The position information of the out-of-line recognition area for determining the recognition target area outside the table area is stored in the dictionary, and from the image data of the form to be recognized, the ruled line information or cell information stored in the dictionary is stored. And determining a recognition target area existing outside the table area based on the position information of the outside table recognition area.
【請求項7】 請求項6に記載の認識対象領域の決定方
法において、 前記基準帳票における罫線情報により表領域を決定し、
その表領域の位置座標と認識対象領域の位置座標を比較
することにより、前記認識対象領域が表領域の外側にあ
れば、該認識対象領域の位置座標を表領域の外側の認識
対象領域を決定するための表外認識領域の位置情報とし
て辞書に格納し、 格納された表外認識領域の位置情報からその位置座標周
辺の領域を探索することにより認識対象領域を決定する
ことを特徴とする認識対象領域の決定方法。
7. The method for determining a recognition target area according to claim 6, wherein a table area is determined based on ruled line information in the reference form,
By comparing the position coordinates of the table region with the position coordinates of the recognition target region, if the recognition target region is outside the table region, the position coordinates of the recognition target region are determined as the recognition target region outside the table region. Recognition in a dictionary as position information of an out-of-line recognition area for performing a search, and determining a recognition target area by searching for a region around the position coordinates from the stored position information of the out-of-line recognition area. How to determine the target area.
【請求項8】 請求項1又は2記載の認識対象領域の決
定方法において、 認識処理すべき帳票の前記表領域の罫線による分割が、
水平方向の両端又は垂直方向の両端まで結ばれた罫線以
外によって分割されている場合に、 罫線が分割されたことを示す交差付加情報を前記辞書に
格納し、 認識処理すべき帳票の画像データから、前記辞書に格納
された前記交差付加情報に基づいて、罫線を検出するこ
とを特徴とする認識対象領域の決定方法。
8. The method for determining a recognition target area according to claim 1, wherein the division of the form to be recognized by the ruled line of the table area is performed by:
If it is divided by a rule other than a ruled line connected to both ends in the horizontal direction or both ends in the vertical direction, the intersection additional information indicating that the ruled line is divided is stored in the dictionary, and the image data of the form to be recognized is stored. Detecting a ruled line based on the additional intersection information stored in the dictionary.
【請求項9】 請求項8記載の認識対象領域の決定方法
において、 前記辞書に、交差付加情報が付加されていれば、認識処
理すべき帳票の画像データから、水平方向の両端又は垂
直方向の両端まで結ばれた罫線以外の罫線を検出する罫
線検出処理を行うことを特徴とする認識対象領域の決定
方法。
9. The method for determining a recognition target area according to claim 8, wherein if intersection additional information is added to the dictionary, both ends in the horizontal direction or in the vertical direction are extracted from the image data of the form to be recognized. A method for determining a recognition target area, comprising performing ruled line detection processing for detecting ruled lines other than ruled lines connected to both ends.
JP10079262A 1998-03-26 1998-03-26 Method for deciding recognition object area Withdrawn JPH11282957A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10079262A JPH11282957A (en) 1998-03-26 1998-03-26 Method for deciding recognition object area

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10079262A JPH11282957A (en) 1998-03-26 1998-03-26 Method for deciding recognition object area

Publications (1)

Publication Number Publication Date
JPH11282957A true JPH11282957A (en) 1999-10-15

Family

ID=13684954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10079262A Withdrawn JPH11282957A (en) 1998-03-26 1998-03-26 Method for deciding recognition object area

Country Status (1)

Country Link
JP (1) JPH11282957A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127451A (en) * 2004-09-30 2006-05-18 Oki Electric Ind Co Ltd Form processor
JP2006228106A (en) * 2005-02-21 2006-08-31 Ricoh Co Ltd Image processing method, image processing device, computer program, and storage medium
JP2012190434A (en) * 2011-02-24 2012-10-04 Ricoh Co Ltd Form defining device, form defining method, program and recording medium
CN111709349A (en) * 2020-06-11 2020-09-25 杭州尚尚签网络科技有限公司 OCR recognition method for contract with form

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127451A (en) * 2004-09-30 2006-05-18 Oki Electric Ind Co Ltd Form processor
JP2006228106A (en) * 2005-02-21 2006-08-31 Ricoh Co Ltd Image processing method, image processing device, computer program, and storage medium
JP4651407B2 (en) * 2005-02-21 2011-03-16 株式会社リコー Image processing apparatus, computer program, and storage medium
JP2012190434A (en) * 2011-02-24 2012-10-04 Ricoh Co Ltd Form defining device, form defining method, program and recording medium
CN111709349A (en) * 2020-06-11 2020-09-25 杭州尚尚签网络科技有限公司 OCR recognition method for contract with form
CN111709349B (en) * 2020-06-11 2023-12-01 杭州尚尚签网络科技有限公司 OCR (optical character recognition) method for contract with form

Similar Documents

Publication Publication Date Title
US7257567B2 (en) Document retrieving method and apparatus
US7149347B1 (en) Machine learning of document templates for data extraction
EP2080113B1 (en) Media material analysis of continuing article portions
JP3445394B2 (en) How to compare at least two image sections
US8208737B1 (en) Methods and systems for identifying captions in media material
US20020159639A1 (en) Form identification method
US20060045340A1 (en) Character recognition apparatus and character recognition method
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
JP5103955B2 (en) Image search method, apparatus and program
JP4891013B2 (en) Title extraction apparatus, image reading apparatus, title extraction method, and title extraction program
JP2000099632A (en) Retrieval device, retrieval method and computer readable recording medium recorded with retrieval program
US20230084845A1 (en) Entry detection and recognition for custom forms
CN112541922A (en) Test paper layout segmentation method based on digital image, electronic equipment and storage medium
JP4704601B2 (en) Character recognition method, program, and recording medium
JP3917349B2 (en) Retrieval device and method for retrieving information using character recognition result
JPH11282957A (en) Method for deciding recognition object area
CN117315090A (en) Cross-modal style learning-based image generation method and device
CN112287763A (en) Image processing method, apparatus, device and medium
JP5790820B2 (en) Inconsistency detection apparatus, program and method, correction support apparatus, program and method
JPH08221510A (en) Device and method for processing form document
KR100834602B1 (en) Character recognition apparatus and character recognition method
JPH06215184A (en) Labeling device for extracted area
CN118277600B (en) Automatic size matching method for drawing software
JP3575969B2 (en) Cell area determining method and cell area determining apparatus
KR102673900B1 (en) Table data extraction system and the method of thereof

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050607