JPH02230366A - Slip recognizing device - Google Patents

Slip recognizing device

Info

Publication number
JPH02230366A
JPH02230366A JP1049800A JP4980089A JPH02230366A JP H02230366 A JPH02230366 A JP H02230366A JP 1049800 A JP1049800 A JP 1049800A JP 4980089 A JP4980089 A JP 4980089A JP H02230366 A JPH02230366 A JP H02230366A
Authority
JP
Japan
Prior art keywords
slip
input
white
format
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1049800A
Other languages
Japanese (ja)
Inventor
Osamu Iwaki
岩城 修
Atsumi Tokumasu
徳升 厚美
Hiromi Kida
木田 博巳
Hiroki Arakawa
荒川 弘煕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Group Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP1049800A priority Critical patent/JPH02230366A/en
Publication of JPH02230366A publication Critical patent/JPH02230366A/en
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PURPOSE:To recognize a slip for which the pre-print of an ID number, etc., is hard to preform, by identifying a slip format by the difference of feature of a table field included in the slip generally. CONSTITUTION:A slip input part 11 converts a character and a mark, etc., recorded on the slip to binary image data in black and white, and a white connection rectangular extraction part 12 extracts the connection part of a white picture element in a slip image, and furthermore, outputs the position coordinate of a rectangle(white connection rectangle) in parallel with each side of an input slip circumscribing with each connection part. Also, a feature vector calculation part 14 outputs a feature vector representing a feature with respect to the position and the size of the white connection rectangle included in the input slip. And an identification part 17 selects the minimum distance out of distance outputted from a distance calculation part 15, and recognizes the character in the input slip according to the format obtained at a slip recognition part 18. Thereby, the slip format can be identified without pre-printing the ID number, etc., for the identification of the slip format.

Description

【発明の詳細な説明】 [産業上の利用分野コ 本発明は、画像の認識処理装置、特に、複数のフォーマ
ット情報を記憶するメモリを有し、入力帳票のフォーマ
ットを識別し、該フォーマット情報に基づき帳票を認識
する装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Application Fields] The present invention relates to an image recognition processing device, in particular, an image recognition processing device that has a memory for storing a plurality of format information, identifies the format of an input form, and uses the format information to identify the format of an input form. The present invention relates to a device that recognizes forms based on the following information.

[従来の技術] 計算機による文字認識技術の進歩により、オフィス等に
おけるデータの計算機入力作業を自動化するため、光学
文字読み取り装置(OCR)が開発されている。OCR
によるデータの入力は、予めOCRに登録したフォーマ
ットの用紙(OCR帳票》に文字を記入し、OCRはこ
の帳票を画像として入力し、メモリに記憶されたフォー
マット情報に従って文字を切り出し、認識することによ
り実現される。
[Background Art] With advances in computer-based character recognition technology, optical character readers (OCR) have been developed to automate the work of inputting data into computers in offices and the like. OCR
To input data, write characters on a form (OCR form) in a format registered in advance in OCR, and OCR inputs this form as an image, cuts out the characters according to the format information stored in memory, and recognizes them. Realized.

一方、OCR帳票はその種類によって読み取るべき文字
の位置や認識結果の処理法を示すフォーマットが異なる
ため、認識処理に先だってこれを識別する必要がある。
On the other hand, since OCR forms have different formats indicating the position of characters to be read and the processing method of recognition results depending on the type thereof, it is necessary to identify them prior to recognition processing.

このため、複数の異なるフォーマットの帳票をOCRで
読み取る場合は、登録したフォーマット情報の中から入
力する帳票のフォーマットをマニュアル操作で指定する
か、登録した全ての帳票フォーマットに共通する固定位
置にフォーマットの種別を識別するためのID番号等を
プレ印刷し、これを帳票の認識に先だつて認識するなど
の手法が用いられている。
Therefore, when reading multiple forms with different formats using OCR, either manually specify the format of the form to be input from among the registered format information, or set the format in a fixed position common to all registered form formats. A method is used in which an ID number or the like for identifying the type is pre-printed and this is recognized prior to recognizing the form.

[発明が解決しようとする課題] これまでのOCRに代表される帳票認識装置においては
、入力する帳票の固定位置に識別のためのID番号等を
プレ印刷し、これを帳票の認識に先だって認識するなど
の手法を用い、帳票フォーマットを識別している。しか
しながら、既存の多種多様な帳票を認識しようとする場
合、これらの帳票の特定の位置にID番号等のプレ印刷
を一律に要求することは困難であって、必ずしも実現で
きないこともあり得る。ところが、従来技術に依存する
限り、ID番号等のプレ印刷無しでは、これらの帳票を
認識することができないという問題があった。
[Problem to be solved by the invention] Conventional form recognition devices such as OCR pre-print an ID number for identification at a fixed position on the form to be input, and recognize this before recognizing the form. The document format is identified using methods such as However, when attempting to recognize a wide variety of existing forms, it is difficult to uniformly request pre-printing of ID numbers, etc. at specific positions on these forms, and may not always be possible. However, as long as prior art is relied upon, there is a problem in that these forms cannot be recognized without pre-printing ID numbers and the like.

本発明は、既存のOCR帳票のように、フォーマットの
種別を識別するためID番号等をプレ印刷することが困
難な既存帳票を認識することを目的とする。
An object of the present invention is to recognize existing forms, such as existing OCR forms, in which it is difficult to pre-print an ID number or the like to identify the format type.

[課題を解決するための手段] 本発明は、帳票にこうしたフォーマットを識別するため
のID番号等をプレ印刷することなく、帳票中に一般的
に含まれる表フィールドに関する特徴の違いを用いて帳
票フォーマットを識別することを特徴とし、このために
次の手段を備えている。
[Means for Solving the Problems] The present invention uses differences in characteristics regarding table fields generally included in a form to print a form without pre-printing an ID number or the like for identifying such a format on the form. It is characterized by identifying the format, and has the following means for this purpose.

(a)帳票入力手段。(a) Form input means.

(b)白連結矩形抽出手段。(b) White connected rectangle extraction means.

(c)特徴ベクトル算出手段 (d)距離計算手段 (e)帳票認識手段 [作用] 本発明の装置は、次のように作用する。(c) Feature vector calculation means (d) Distance calculation means (e) Form recognition means [Effect] The device of the invention works as follows.

(a)帳票入力手段は、帳票を走査することにより、白
黒2値の画像をイメージメモリに書き込む。
(a) The form input means writes a black and white binary image into the image memory by scanning the form.

(b)白連結矩形抽出手段は、帳票中の文字データを記
入する表フィールドが帳票の各辺に平行な罫線に囲まれ
た白地の矩形領域であることに着目してこれを抽出する
ため、イメージメモリに書き込まれた帳票画像の白画素
の連結成分を抽出し、さらに各連結成分に外接する入力
帳票の各辺に平行な矩形(以下、白連結矩形と呼ぶ)の
位置座標を出力する。
(b) The white connected rectangle extraction means focuses on the fact that the table field in which character data is written in the form is a white rectangular area surrounded by ruled lines parallel to each side of the form, and extracts this. Connected components of white pixels of the form image written in the image memory are extracted, and the position coordinates of a rectangle (hereinafter referred to as a white connected rectangle) that is circumscribed to each connected component and parallel to each side of the input form are output.

(c)特徴ベクトル算出手段は、白連結矩形抽出手段に
より得られた結果を用いて、入力帳票に含まれる白連結
矩形の数および位置、大きさに関する特徴を表す特徴ベ
クトルを算出する。ここで、入力帳票が学習帳票の場合
は、 特徴ベクトルをフォーマットメモリに記憶する。
(c) The feature vector calculation means uses the results obtained by the white connected rectangle extraction means to calculate a feature vector representing characteristics regarding the number, position, and size of white connected rectangles included in the input form. Here, if the input form is a learning form, the feature vector is stored in the format memory.

(d)距離計算手段は、入力帳票がテスト帳票の場合、
フォーマットメモリに記憶された帳票種別毎の特徴ベク
トルを読み出し、これらと特徴ベクトル算出手段により
得られた特徴ベクトルの距離をそれぞれ求める。
(d) When the input form is a test form, the distance calculation means:
The feature vectors for each type of form stored in the format memory are read out, and the distances between these and the feature vectors obtained by the feature vector calculation means are determined.

(e)帳票認識手段は、距離計算手段により得られた出
力の中で最も近いものを選択し、該フォーマットをフォ
ーマットメモリより読み出し、これに従って入力帳票中
の文字をut識する。
(e) The form recognition means selects the closest one among the outputs obtained by the distance calculation means, reads the format from the format memory, and recognizes the characters in the input form according to the format.

丁実施例] 第1図は、本発明の帳票認識装置の一実施例の構成を示
すブロック図である。 帳票入力部11は、帳票を走査
し、帳票上に記録されている文字記号等を白黒2値の画
像データに変換してイメージメモリ部13に書き込む。
Embodiment] FIG. 1 is a block diagram showing the configuration of an embodiment of a form recognition device of the present invention. The form input unit 11 scans the form, converts characters and symbols recorded on the form into black and white binary image data, and writes the data into the image memory unit 13.

白連結矩形抽出部12では、帳票中の文字データを記入
する表フィールドが帳票の各辺に平行な罫線に囲まれた
白地の矩形領域であることに着目してこれを抽出するた
め、イメージメモリ部に書き込まれた帳票画像の白画素
の連結成分を抽出し、さらに各連結成分に外接する入力
帳票の各辺に平行な矩形(以下、白連結矩形と呼ぶ)の
位置座標を出力する。但し、白連結矩形には表フィール
ドの他に文字中の閉領域から抽出されるものも存在する
ため、しきい値を用いてこれらの小さい白連結矩形を取
り除く。
The white connected rectangle extraction unit 12 extracts this by focusing on the fact that the table field in which character data is written in the form is a white rectangular area surrounded by ruled lines parallel to each side of the form. Connected components of white pixels of the form image written in the section are extracted, and the position coordinates of a rectangle (hereinafter referred to as a white connected rectangle) that is circumscribed to each connected component and parallel to each side of the input form are output. However, since some white connected rectangles are extracted from closed areas in characters in addition to table fields, a threshold value is used to remove these small white connected rectangles.

第2図は入力帳票の一例であり、第3図は第2図の入力
帳票を用いて、白連結矩形抽出部l2より出力された白
連結矩形を示す。
FIG. 2 shows an example of an input form, and FIG. 3 shows a white connected rectangle outputted from the white connected rectangle extraction unit l2 using the input form of FIG.

第1図の特徴ベクトル算出部14においては、白連結矩
形抽出部12の出力を用いて、入力帳票に含まれる白連
結矩形の数および位置、大きさに関する特徴を表す特徴
ベクトルを出力する。以下に、特徴ベクトルの出力手段
の詳細を述べる。
The feature vector calculation unit 14 shown in FIG. 1 uses the output of the white connected rectangle extraction unit 12 to output a feature vector representing features regarding the number, position, and size of white connected rectangles included in the input form. Details of the feature vector output means will be described below.

入力帳票に含まれる各自連結矩形(1例として第2図の
表フィールド2lに対応して抽出された第3図の白連結
矩形31)が、帳票中の上下および左右のどこにあるか
の情報を特徴ベクトルとして出力するため、入力帳票画
像を縦および横にそれぞれ短冊状にM等分する。ここで
、縦方向にM等分した左からi番目(i=1,・・・,
M)の短冊領域をX,、横方向にM等分した上からj番
目(』=1.・・・,M)の短冊領域をY,とラベル付
けする。
Information about where each connected rectangle (for example, the white connected rectangle 31 in FIG. 3 extracted corresponding to the table field 2l in FIG. 2 in FIG. 3) included in the input form is located in the top, bottom, left, and right of the form. In order to output it as a feature vector, the input form image is divided vertically and horizontally into M equal strips. Here, the i-th (i=1,...,
The strip area of M) is labeled X, and the j-th ('=1...,M) strip area from the top, which is divided into M equal parts in the horizontal direction, is labeled Y.

次に、どの程度の大きさの白連結矩形が入力帳票に含ま
れるかの情報を特徴ベクトルとして出力するため、各自
連結矩形の横および縦の長さをそれぞれ入力帳票の横お
よび縦の長さで正規化し、これをN段階に量子化して、
各自連結矩形の縦方向の長さ(高さ)をL(k=1,・
・・.N)、横方向の長さ《幅)をL(]=1,・・・
.N)とラベル付けする。
Next, in order to output information about how large the white connected rectangles are included in the input form as a feature vector, we calculate the horizontal and vertical lengths of each connected rectangle to the horizontal and vertical lengths of the input form, respectively. , and quantize this into N stages,
The length (height) of each connected rectangle in the vertical direction is L(k=1,・
・・・. N), the horizontal length (width) is L(]=1,...
.. Label it N).

特徴ベクトルは、各短冊領域X,およびY,について、
大きさがHkおよびLの白連結矩形の数をそれぞれカウ
ントすることにより算出する。
The feature vector is, for each strip area X and Y,
It is calculated by counting the number of white connected rectangles with sizes Hk and L, respectively.

カウントの方法には、次の3通りの方法が可能である。The following three methods are possible for counting.

■ 白連結矩形の中心を含む領域でカウントする、 ■ 白連結矩形を一部でも含む領域でカウントする、 ■ ■の方法で、領域の大きさに対する白連結矩形が占
める割合に応じた重み付けを行ってカウントする。
■ Counting in the area that includes the center of the white connected rectangle, ■ Counting in the area that includes at least part of the white connected rectangle, ■ Weighting is performed according to the ratio of the white connected rectangle to the size of the area. count.

ここで、特徴ベクトルの次元数Dは D= 2 x (Mx (N x N))となる。第4
図に、M=N=2の場合について、特徴ベクトルの例を
示す。
Here, the number of dimensions D of the feature vector is D=2 x (Mx (N x N)). Fourth
The figure shows an example of a feature vector for the case of M=N=2.

ここで、第1図の特徴ベクトル算出部14は、入力帳票
が学習帳票の場合、予め本装置で処理対象とする帳票の
フォーマットを記憶させたフォーマットメモリ部16に
該フォーマットの特徴ベクトルを記憶させる。
Here, when the input form is a learning form, the feature vector calculation unit 14 in FIG. .

第1図の距離計算部15では、入力帳票がテスト帳票の
場合、特徴ベクトル算出部14の出力結果と、フォーマ
ットメモリ部16に記憶された帳票フォーマットについ
てそれぞれ学習サンプルより得られた平均特徴ベクトル
のユークリッド距離を計算し、結果を出力する。
When the input form is a test form, the distance calculation unit 15 in FIG. Calculate the Euclidean distance and print the result.

第1図の識別部l7では、距離計算部15より出力され
た距離のうち最も近いものを選択し、該フォーマットを
入力帳票のフォーマットとして帳票認識部l8に出力し
、帳票認識部18において、得られたフォーマットに従
って入力帳票中の文字を認識する。
The identification section l7 in FIG. The characters in the input form are recognized according to the specified format.

第5図は、4種類の帳票A,B%C, D (各種類に
つき10枚の帳票を用い、7枚を学習帳票、残り3枚を
テスト帳票とする)について、白連結矩形のカウント方
法として■の方法を用い、M=N=2とした場合の学習
サンプルの平均特徴ベクトル間の距離と、各帳票カテゴ
リ内で平均特徴ベクトルから最も遠いサンプルまでの距
離を求め、各カテゴリ空間が占める範囲を実線で示して
いる。
Figure 5 shows how to count white connected rectangles for four types of forms A, B%C, and D (10 forms are used for each type, 7 are learning forms and the remaining 3 are test forms). Using the method of ■, find the distance between the average feature vectors of the learning samples when M = N = 2, and the distance from the average feature vector to the farthest sample in each form category, and calculate the distance occupied by each category space. The range is shown by a solid line.

第5図に右いて、4種類の帳票ASBSC,及びDのカ
テゴリ空間51,52、53、及び54を示しているが
、これらの間には重なりがなく、正しく識別できること
が分かる。
The right side of FIG. 5 shows the category spaces 51, 52, 53, and 54 of four types of forms ASBSC and D, and it can be seen that there is no overlap between them and that they can be correctly identified.

ここで、分割数M右よび量子化数Nを小さくすると《例
えばM=N=1)、特徴ベクトルの次元数は小さくなり
、計算量が少なくなるが、白連結矩形の位置や大きさを
詳細に表現できなくなることから、帳票が傾いて入力さ
れた場合や、文字中の閉領域が誤って表領域として抽出
された場合、および表領域がノイズ等によって分割され
た場合、識別能力が低下することが予想されるため、M
=N=2以上とすることが望ましい。
Here, if the number of divisions M and the number of quantization N are made smaller (for example, M=N=1), the number of dimensions of the feature vector becomes smaller and the amount of calculation is reduced, but the position and size of the white connected rectangles are Therefore, if a form is input at an angle, if a closed area in text is mistakenly extracted as a table area, or if a table area is divided due to noise, etc., the identification ability will deteriorate. Since it is expected that M
=N=2 or more is desirable.

[発明の効果] 以上述べたように、本発明によれば、これまでのOCR
に代表される帳票認識装置において、帳票フォーマット
を識別するためのID番号等をプレ印刷することなく帳
票フォーマットを識別することが可能となる。
[Effect of the invention] As described above, according to the present invention, the conventional OCR
In a form recognition device typified by , it is possible to identify a form format without pre-printing an ID number or the like for identifying the form format.

このため、従来のOCR帳票に加え、既存の多種多様な
帳票の認識が可能となり、データの自勤入力可能な帳票
の種類が著しく拡大される。
Therefore, in addition to conventional OCR forms, it is possible to recognize a wide variety of existing forms, and the types of forms on which data can be input manually are significantly expanded.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、帳票識別装置の構成例を示すブロック図、第
2図は、入力帳票の例を示す図、第3図は、白連結矩形
の例を示す図、第4図は、特徴ベクトルの例を示す図、
第5図は、4種類の帳票について識別能力の例を示す図
、である。 :帳票入力部 :白連結矩形部 :イメージメモリ部 :特徴ベクトル算出部 :距離計算部 :フォーマットメモリ部 :識別部 :帳票認識部 二表フィールド :白連結矩形 :帳票Aのカテゴリー空間 :帳票Bのカテゴリー空間 :帳票Cのカテゴリー空間 二帳票Dのカテゴリー空間 出願人 エヌ・ティ・ティ・データ通信株式会社代理人
 弁理士  金 平  隆 第1図 第 図 C 第5図 手 続 補 正 書(方式) 平成1年6月22日
FIG. 1 is a block diagram showing an example of the configuration of a form identification device, FIG. 2 is a diagram showing an example of an input form, FIG. 3 is a diagram showing an example of white connected rectangles, and FIG. 4 is a feature vector A diagram showing an example of
FIG. 5 is a diagram showing an example of identification ability for four types of forms. : Form input section: White connected rectangle section: Image memory section: Feature vector calculation section: Distance calculation section: Format memory section: Identification section: Form recognition section Two-table field: White connected rectangle: Category space of form A: Category space of form B Category space: Category space of form C2 Category space of form D Applicant NTT Data Communications Co., Ltd. Agent Patent attorney Takashi Kanehira Figure 1 Figure C Figure 5 Procedural amendment (method) 1999 June 22nd

Claims (4)

【特許請求の範囲】[Claims] (1)複数のフォーマット情報を記憶するメモリを有す
る帳票認識装置において、帳票を白黒2値画像として入
力する手段と、入力画像中の白画素の連結成分に外接す
る矩形枠を求める手段と、これに基づき入力画像に含ま
れる表フィールドの数、位置、大きさを表す特徴ベクト
ルを算出する手段と、この特徴ベクトルとすでに複数の
異なるフォーマットの帳票についてそれぞれ学習サンプ
ルより得られた平均特徴ベクトルとの距離を求める手段
と、この距離が最も近い帳票のフォーマット情報に従っ
て入力帳票を処理する手段を具備したことを特徴とする
帳票認識装置。
(1) In a form recognition device having a memory for storing a plurality of format information, means for inputting a form as a black and white binary image, means for determining a rectangular frame circumscribing a connected component of white pixels in the input image, and Average characteristics vector obtained from the learning sample for the method of calculating the number of table fields included in the input image and the characteristics vector that represents the number, position, and size, and this feature vector and the format forms of multiple different formats. A form recognition device comprising: means for determining a distance; and means for processing an input form according to format information of a form having the closest distance.
(2)特許請求の範囲第1項記載の装置において、前記
特徴ベクトルを算出する手段として、入力帳票画像を小
領域に分割し、表フィールドの中心を含む領域で表フィ
ールド数をカウントすることを特徴とする帳票認識装置
(2) In the apparatus according to claim 1, the means for calculating the feature vector includes dividing the input form image into small areas and counting the number of table fields in the area including the center of the table field. Characteristic form recognition device.
(3)特許請求の範囲第1項記載の装置において、前記
特徴ベクトルを算出する手段として、入力帳票画像を小
領域に分割し、表フィールドを一部でも含む領域で表フ
ィールド数をカウントすることを特徴とする帳票認識装
置。
(3) In the apparatus according to claim 1, the means for calculating the feature vector is to divide an input form image into small areas and count the number of table fields in the area including at least a part of the table fields. A form recognition device featuring:
(4)特許請求の範囲第1項記載の装置において、前記
特徴ベクトルを算出する手段として、入力帳票画像を小
領域に分割し、表フィールドを一部でも含む領域で、領
域の大きさに対する白連結矩形が占める大きさの割合に
応じた重み付けを行って表フィールド数をカウントする
ことを特徴とする帳票認識装置。
(4) In the apparatus according to claim 1, the means for calculating the feature vector divides the input form image into small areas, and in the area including even a part of the table field, the whiteness relative to the size of the area is A form recognition device that counts the number of table fields by weighting according to the proportion of the size occupied by connected rectangles.
JP1049800A 1989-03-03 1989-03-03 Slip recognizing device Pending JPH02230366A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1049800A JPH02230366A (en) 1989-03-03 1989-03-03 Slip recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1049800A JPH02230366A (en) 1989-03-03 1989-03-03 Slip recognizing device

Publications (1)

Publication Number Publication Date
JPH02230366A true JPH02230366A (en) 1990-09-12

Family

ID=12841223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1049800A Pending JPH02230366A (en) 1989-03-03 1989-03-03 Slip recognizing device

Country Status (1)

Country Link
JP (1) JPH02230366A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635930A (en) * 1992-06-23 1994-02-10 Internatl Business Mach Corp <Ibm> System and method of processing table data
JP2019144771A (en) * 2018-02-19 2019-08-29 株式会社ミラボ Business form processing system and business form processing program
JP2021009659A (en) * 2019-06-28 2021-01-28 株式会社ミラボ Information processor and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0635930A (en) * 1992-06-23 1994-02-10 Internatl Business Mach Corp <Ibm> System and method of processing table data
JP2019144771A (en) * 2018-02-19 2019-08-29 株式会社ミラボ Business form processing system and business form processing program
JP2021106054A (en) * 2018-02-19 2021-07-26 株式会社ミラボ Business form processing system and business form processing program
JP2021009659A (en) * 2019-06-28 2021-01-28 株式会社ミラボ Information processor and program

Similar Documents

Publication Publication Date Title
US7295694B2 (en) MICR-based optical character recognition system and method
US5119433A (en) Method and system for locating the amount field on a document
US9158986B2 (en) Character segmentation device and character segmentation method
US7711189B2 (en) Layout analysis program, layout analysis apparatus and layout analysis method
US6014450A (en) Method and apparatus for address block location
CN114663897A (en) Table extraction method and table extraction system
JP2926066B2 (en) Table recognition device
JPH02230366A (en) Slip recognizing device
JPS5991582A (en) Character reader
JPS6316795B2 (en)
JP2788506B2 (en) Character recognition device
CN114202761B (en) Information batch extraction method based on picture information clustering
JPH06131497A (en) Table recognition system
JP2918363B2 (en) Character classification method and character recognition device
JP2909132B2 (en) Optical character reader
US6142374A (en) Optical character reader
JP2580976B2 (en) Character extraction device
JP2917396B2 (en) Character recognition method
JPH06111057A (en) Optical character reader
JPS6227887A (en) Character type separating system
JP2963474B2 (en) Similar character identification method
CN117711004A (en) Form document information extraction method based on image recognition
JP2616995B2 (en) Character recognition device
JPH03282791A (en) Character recognizing method
JPS62295192A (en) Optical character image reader