JP3268084B2 - Form reading system - Google Patents

Form reading system

Info

Publication number
JP3268084B2
JP3268084B2 JP23443593A JP23443593A JP3268084B2 JP 3268084 B2 JP3268084 B2 JP 3268084B2 JP 23443593 A JP23443593 A JP 23443593A JP 23443593 A JP23443593 A JP 23443593A JP 3268084 B2 JP3268084 B2 JP 3268084B2
Authority
JP
Japan
Prior art keywords
error
ocr
layout
data
layout analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP23443593A
Other languages
Japanese (ja)
Other versions
JPH0793469A (en
Inventor
敏浩 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP23443593A priority Critical patent/JP3268084B2/en
Publication of JPH0793469A publication Critical patent/JPH0793469A/en
Application granted granted Critical
Publication of JP3268084B2 publication Critical patent/JP3268084B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、例えばテキストリーダ
タイプのOCR(光学的文字読取装置)を用いて規定外
の帳票の読取りを行う帳票読取システムに関し、特に、
LC(レイアウト情報)に従って帳票のレイアウトを解
析するOCRを用いた帳票読取システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form reading system for reading an irregular form using, for example, a text reader type OCR (optical character reading device).
The present invention relates to a form reading system using OCR that analyzes a form layout according to LC (layout information).

【0002】[0002]

【従来の技術】OCRで帳票上の文字を認識する方法は
大きく次の3通りの方法に分けることができる。 (1)予めOCRに対して、読取領域の座標、読取桁
数、字種等を指定したFC(フォーマットコントロール
情報)を送信しておき、このFCに従ってOCRが文字
を認識する方法。
2. Description of the Related Art A method of recognizing characters on a form by OCR can be roughly divided into the following three methods. (1) A method in which an FC (format control information) designating the coordinates of the reading area, the number of digits to be read, the character type, and the like is transmitted to the OCR in advance, and the OCR recognizes characters according to the FC.

【0003】(2)予めOCRに対して、帳票上の文字
領域のLC(レイアウト情報)を送信しておき、このL
Cに従ってOCRが読取領域の判別を行い、文字を認識
する方法。
(2) The LC (layout information) of the character area on the form is transmitted to the OCR in advance, and the L
A method in which the OCR determines a reading area according to C and recognizes a character.

【0004】(3)スキャンされた帳票イメージからO
CRが文字領域を自動判別して文字を認識する方法。 (1)の方法によるOCRは、帳票OCRと称せられ、
OCR化された帳票を処理するために用いられる。
(3) O from the scanned form image
A method in which a CR automatically recognizes a character area to recognize a character. The OCR by the method (1) is called a form OCR,
Used to process OCR-formatted forms.

【0005】これに対し、(3)の方法によるOCR
は、テキストリーダと称せられ、OCR化されていない
帳票を処理するために用いられる。読取エリアの絶対的
な座標を指定しないため、認識結果はある程度あいまい
になる。
On the other hand, the OCR by the method (3)
Is referred to as a text reader, and is used to process forms that are not converted to OCR. Since the absolute coordinates of the reading area are not specified, the recognition result is somewhat ambiguous.

【0006】また、(2)の方法によるOCRも、テキ
ストリーダと称せられるが、LCを利用して文字認識を
行うため、(3)の方法によるOCRに比べて認識処理
の信頼性が高い。
The OCR according to the method (2) is also called a text reader. However, since character recognition is performed using LC, the reliability of the recognition process is higher than that of the OCR according to the method (3).

【0007】従来の(2)の方法によるOCRを用いた
帳票読取システムでは、OCR化されていない給与振込
依頼書等の既存帳票をLCを用いて以下のように読取処
理を行っていた。
[0007] In the conventional form reading system using OCR according to the method (2), an existing form such as a salary transfer request form that has not been converted to OCR is read using LC as follows.

【0008】テキストリーダタイプOCRは、スキャナ
により取り込んだ帳票イメージに対してLCに含まれる
帳票上のレイアウト情報からレイアウト解析を行い、読
取対象の文字領域を算出する。
The text reader type OCR performs a layout analysis on a form image captured by a scanner from layout information on the form included in the LC, and calculates a character area to be read.

【0009】そして、レイアウト解析により算出した読
取対象の文字領域の認識を行い、認識結果データを上位
制御装置に出力する。上位制御装置上のアプリケーショ
ンは、読取結果データとLCとから読取項目の種類を特
定して修正画面への認識結果データの表示又は出力ファ
イルへの編集データの出力等を行う。
Then, the character area to be read calculated by the layout analysis is recognized, and the recognition result data is output to the host controller. The application on the host controller specifies the type of the read item from the read result data and the LC and displays the recognition result data on the correction screen or outputs the edited data to the output file.

【0010】[0010]

【発明が解決しようとする課題】従来のテキストリーダ
タイプOCRを用いた帳票読取システムでは、LCに従
って既存帳票を簡便に読み取れる反面、帳票上のごみや
罫線のかすれを原因としてレイアウト解析を誤ってしま
った場合に認識結果データと読取項目の対応がうまくい
かず、修正画面や出力データをこわしてしまう等という
問題があった。
In a conventional form reading system using a text reader type OCR, an existing form can be easily read in accordance with the LC, but layout analysis is erroneously performed due to dust on the form and blurring of ruled lines. In such a case, there is a problem that the correspondence between the recognition result data and the read item does not work well, and the correction screen and the output data are broken.

【0011】また、従来のテキストリーダタイプOCR
を用いた帳票読取システムでは、レイアウト解析エラー
が発生した認識結果データについては、その認識結果デ
ータを破棄するか、又は実帳票を参照しながらキーエン
トリで処理するかしかなかった。
A conventional text reader type OCR
In the form reading system using, the recognition result data in which a layout analysis error has occurred has to be either discarded or processed by key entry while referring to the actual form.

【0012】本発明は、上記実情に鑑みてなされたもの
であり、テキストリーダタイプOCRにてOCR化され
ていない給与振込依頼書等の既存帳票を認識させた結
果、レイアウト解析ミスを起こしてしまった場合の認識
結果データに対し、確認及び修正を行うのに好適な帳票
読取システムを提供することを目的とする。
The present invention has been made in view of the above circumstances, and as a result of causing a text reader type OCR to recognize an existing form such as a salary transfer request form that has not been converted into an OCR, a layout analysis error has occurred. It is an object of the present invention to provide a form reading system suitable for confirming and correcting the recognition result data in the case where the recognition result data is obtained.

【0013】[0013]

【課題を解決するための手段】上記目的を達成するため
に、本発明の帳票読取システムは、レイアウト情報記憶
部から得られるレイアウト情報に従って読取帳票イメー
ジのレイアウトを解析し、その解析結果から認識対象の
文字領域を決定して文字認識を行う文字認識装置と、こ
の文字認識装置から出力される認識結果データと上記レ
イアウト情報の表数情報、表内項目数情報、および項目
内行数情報とを比較して、一致していない場合はレイア
ウト解析エラーを出力するエラー検出手段と、このエラ
ー検出手段から出力された上記レイアウト解析エラーの
エラー発生箇所に対応する帳票イメージを表示して、エ
ラー確認および修正を行う修正手段とを具備することを
特徴とする。
To achieve the above object, according to the solution to ## form reading system of the present invention, the layout information storage
Read form image according to layout information obtained from
Analyze the layout of the
A character recognition device that determines a character area and performs character recognition, and recognition result data output from the character recognition device and the number of tables, the number of items in the table, and the items of the layout information
Compare with the inner row number information, and if they do not match, the layer
Error detection means for outputting an error analysis error, and the layout analysis error output from the error detection means .
Display the form image corresponding to the location where the error occurred, and
Correction means for checking and correcting errors .

【0014】[0014]

【作用】上述した構成によれば、OCR化されていない
帳票に対して、文字認識手段が読取対象の帳票のレイア
ウトを指定するレイアウト情報に基づいて前記帳票の帳
票イメージのレイアウトを解析し、このレイアウト解析
によって決定され各読取対象の文字認識を行う。ま
た、エラー検出手段により、この文字認識手段から出力
される認識結果と前記レイアウト情報とから前記文字認
識手段のレイアウト解析エラーを検出する。そして、こ
のエラー検出手段によって前記レイアウト解析エラーが
検出された際、そのエラー発生箇所に対応する帳票イメ
ージが表示される。
According to the above-described structure, for a non-OCR form, the character recognition means analyzes the layout of the form image of the form based on the layout information designating the layout of the form to be read. performing character recognition of the read target that is determined by the layout analysis. Further, the error detection means, for detecting a layout analysis error in the character recognition means and a recognition result and the layout information output from the character recognition means. When the error detecting means detects the layout analysis error, a form image corresponding to the error occurrence location is displayed.

【0015】これにより、オペレータは、レイアウト解
析エラーが発生している認識結果について、帳票イメー
の表示を参照しながらデータ修正をすることが可能と
なる。
[0015] Thus, the operator, with the recognition result of the layout analysis error has occurred, it is possible to a data correction with reference to the display of document images.

【0016】[0016]

【実施例】以下図面を参照して本発明の一実施例を説明
する。図1は同実施例に係る帳票読取システムの構成を
示すブロック図である。本システムは、図1に示すよう
に、OCR1、LC記憶部2及びOCR制御装置3から
構成されている。OCR1は、テキストリーダタイプO
CRであり、イメージスキャナと認識装置から構成され
ている。この認識装置は、イメージスキャナによって読
み取られた帳票イメージのレイアウトを解析し、その解
析結果に従って切り出しおよび認識対象となる文字領域
を決定する。各文字領域の文字認識結果は、認識結果デ
ータとしてOCR制御装置3に転送される。また、認識
装置は、イメージスキャナから受けとった帳票イメージ
をそのままOCR制御装置3に転送する機能も有してい
る。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the form reading system according to the embodiment. This system includes an OCR 1, an LC storage unit 2, and an OCR control device 3, as shown in FIG. OCR1 is a text reader type O
It is a CR and is composed of an image scanner and a recognition device. This recognition apparatus analyzes the layout of a form image read by an image scanner, and determines a character area to be cut out and recognized according to the analysis result. The character recognition result of each character area is transferred to the OCR control device 3 as recognition result data. The recognition device also has a function of transferring the form image received from the image scanner to the OCR control device 3 as it is.

【0017】OCR制御装置3は、OCR1を動作制御
するためのものであり、例えばパーソナルコンピュータ
などによって構成されている。このOCR制御装置3に
は、OCR1を制御するための機構として、図示のよう
に、レイアウト解析エラー検出部4、データ修正部5及
びデータ出力部8を備えている。また、データ修正部5
は、イメージ表示制御部7を備えたエラー修正部6を具
備してなる。
The OCR control device 3 controls the operation of the OCR 1, and is constituted by, for example, a personal computer. The OCR control device 3 includes a layout analysis error detection unit 4, a data correction unit 5, and a data output unit 8 as a mechanism for controlling the OCR 1. The data correction unit 5
Comprises an error correction unit 6 having an image display control unit 7.

【0018】レイアウト解析エラー検出部4は、OCR
1からOCR制御装置3に転送された認識結果データを
もとに、OCR1によるレイアウト解析処理のエラー検
出を行う。このエラー検出は、OCR1の認識結果デー
タとOCR1が使用したLCとの間で各種帳票内情報を
比較することによって行われる。エラー検出部4は、レ
イアウト解析エラーを検出すると、データ修正部5のエ
ラー修正部6にその旨を通知する。
The layout analysis error detecting section 4 has an OCR
1 based on the recognition result data transferred to the OCR control device 3, an error is detected in the layout analysis processing by the OCR 1. This error detection is performed by comparing various in-form information between the OCR1 recognition result data and the LC used by the OCR1. When detecting the layout analysis error, the error detection unit 4 notifies the error correction unit 6 of the data correction unit 5 of the detection.

【0019】データ修正部5は、認識結果データを画面
上に表示し、ユーザからのキー入力などに従って認識結
果データの修正を行う。エラー修正部6は、レイアウト
解析エラーが発生した帳票についてそのエラー修正を行
うためのものであり、レイアウト解析エラー検出部4か
らのエラー通知に応答し、イメージ表示制御部7を制御
して、そのエラー発生箇所に対応する帳票イメージを画
面表示させる。表示制御部7は、表示されている帳票イ
メージの倍率の変更、帳票上の表示対象位置の変更及び
画面上の表示位置の変更をオペレータによるキーボード
操作に応じて制御する機能を有している。
The data correction unit 5 displays the recognition result data on the screen, and corrects the recognition result data according to a key input from the user. The error correction unit 6 is for correcting the error of the form in which the layout analysis error has occurred, responds to the error notification from the layout analysis error detection unit 4, controls the image display control unit 7, and Display the form image corresponding to the error location on the screen. The display control unit 7 has a function of controlling the change of the magnification of the displayed form image, the change of the display target position on the form, and the change of the display position on the screen according to the keyboard operation by the operator.

【0020】オペレータは、画面表示された上記帳票イ
メージを見ながらエラー発生箇所の確認及びキー入力に
よる認識結果データの修正などを行い、これによって修
正されたクリーンデータはデータ出力部8に送られ、そ
こで帳票の読取りデータとして保存等される。
The operator confirms the location of the error and corrects the recognition result data by key input while looking at the form image displayed on the screen. The corrected clean data is sent to the data output unit 8. Then, it is stored as read data of the form.

【0021】次に、同実施例の動作を説明する。OCR
1は、LC記憶部2のLCに従って帳票のレイアウト解
析および文字認識を行うが、ここでは、まず、そのLC
について図2及び図3を参照して説明する。
Next, the operation of the embodiment will be described. OCR
1 performs layout analysis and character recognition of a form in accordance with the LC of the LC storage unit 2, but here, first, the LC
Will be described with reference to FIGS.

【0022】図2は、同実施例に係るLCを説明するた
めの概念図、図3は同実施例に係るLCに含まれる帳票
上の表情報、各表内の項目情報及び各項目内の行情報を
説明するための概念図である。
FIG. 2 is a conceptual diagram for explaining the LC according to the embodiment, and FIG. 3 is table information on a form included in the LC according to the embodiment, item information in each table, and information in each item. It is a conceptual diagram for explaining line information.

【0023】図2の(a)は、OCR1から出力される
OCR化されていない帳票のイメージであり、この帳票
イメージを画面表示した状態でオペレータによってLC
情報2のエントリーが行われる。このとき、同じ属性を
持つ項目の存在するエリアが、マウスなどのポインティ
ングデバイスを利用して画面上で指定される。図2の
(b)はその指定例である。このLCを使用して、OC
R1は帳票の認識を行う。この認識例が図2の(c)で
ある。
FIG. 2A shows an image of a form output from the OCR 1 that has not been converted to an OCR format.
An entry of information 2 is performed. At this time, an area in which an item having the same attribute exists is specified on the screen using a pointing device such as a mouse. FIG. 2B shows an example of the designation. Using this LC, the OC
R1 recognizes the form. An example of this recognition is shown in FIG.

【0024】また、LCには帳票上の表数情報、各表内
の項目数情報及び各項目内の行数情報などが含まるが、
ここでいう帳票上の表、表内の項目及び項目内の行と
は、それぞれ図3に示す10a〜10c(帳票上の
表)、11a〜11b(表内の項目)、12a〜12b
(項目内の行)をいうものとする。
The LC includes information on the number of tables on the form, information on the number of items in each table, information on the number of rows in each item, and the like.
Here, the table on the form, the items in the table, and the rows in the items are 10a to 10c (table on the form), 11a to 11b (items in the table), and 12a to 12b shown in FIG.
(Line in the item).

【0025】次に、OCR1から送信された認識結果デ
ータについてのOCR制御装置3の処理手順の概要を図
5及び図6を参照して説明する。図5は同実施例に係る
OCR制御装置3の処理手順を説明するためのフローチ
ャート、図6は同実施例に係るエラー検出部の処理手順
を説明するためのフローチャートである。
Next, an outline of a processing procedure of the OCR control device 3 for the recognition result data transmitted from the OCR 1 will be described with reference to FIGS. FIG. 5 is a flowchart for explaining a processing procedure of the OCR control device 3 according to the embodiment, and FIG. 6 is a flowchart for explaining a processing procedure of the error detection unit according to the embodiment.

【0026】まず、エラー検出部4がOCR1の認識結
果データとLC記憶部2の該当するLCとからレイアウ
ト解析エラーチェックを行う(図5のステップA1)。
このレイアウト解析エラーチェックは、まず、帳票内の
表数について、認識結果データとLCの表数情報とで一
致しているか否かをチェックする(図6のステップB
1)。次に、表の中の項目数について、認識結果データ
とLC2の表内項目数情報とで一致しているかをチェッ
クする(図6のステップB2)。さらに、項目の中の行
数について、認識結果データとLC2の項目内行数情報
とで一致しているかをチェックする(図6のステップB
3)。これらチェック結果は総合的に判断され、その結
果、レイアウト解析エラーの発生の有無及びエラー発生
箇所の検出が行われる。
First, the error detection unit 4 performs a layout analysis error check on the recognition result data of the OCR 1 and the corresponding LC in the LC storage unit 2 (step A1 in FIG. 5).
In this layout analysis error check, first, it is checked whether or not the number of tables in the form matches the recognition result data with the information on the number of tables in the LC (step B in FIG. 6).
1). Next, it is checked whether the number of items in the table matches the recognition result data and the number of items in the table of the LC2 (step B2 in FIG. 6). Furthermore, it is checked whether the number of lines in the item matches the recognition result data with the number of lines in item of LC2 (step B in FIG. 6).
3). These check results are comprehensively determined, and as a result, the presence / absence of a layout analysis error and the location of the error occurrence are detected.

【0027】以上のチェックの結果、レイアウト解析エ
ラーを検出した場合(図5のステップA2のY)、デー
タ修正部5のエラー修正部6にその旨を通知し、レイア
ウト解析エラーが発生している帳票の修正を行う(図5
のステップA4)。
As a result of the above check, when a layout analysis error is detected (Y in step A2 of FIG. 5), the fact is notified to the error correction unit 6 of the data correction unit 5, and a layout analysis error has occurred. Modify the form (Fig. 5
Step A4).

【0028】エラー修正部6は、まず、イメージ表示制
御部7にてレイアウト解析エラーの発生箇所に対応する
帳票イメージを画面表示する。また、表示制御部7は、
オペレータによるキーボード等からのキー入力データを
もとに、表示されている帳票イメージの倍率の変更、帳
票イメージ上の表示対象位置の変更及び画面上の表示位
置の変更等の制御を行う。
First, the error correction unit 6 causes the image display control unit 7 to display a form image corresponding to the location where the layout analysis error has occurred on the screen. In addition, the display control unit 7
Based on key input data from a keyboard or the like by an operator, control is performed such as changing the magnification of the displayed form image, changing the display target position on the form image, and changing the display position on the screen.

【0029】この動作の概念を図4を参照して説明す
る。図4は、同実施例に係る画面表示の制御を説明する
ための概念図である。図4の(a)は、OCR1のイメ
ージスキャナで読み取られた帳票イメージである。ま
た、図4の(b)は、レイアウト解析エラーを検出した
箇所に対応する帳票イメージを画面表示した状態を示し
ている。ここで、オペレータが倍率変更のオペレーショ
ンをキーボードを介して行った結果が図4の(c)であ
る。また、帳票イメージ上の表示対象位置の変更を示し
た図が図4の(d)である。さらに、オペレーションに
より画面上の任意の箇所に表示位置を変更することが可
能である。
The concept of this operation will be described with reference to FIG. FIG. 4 is a conceptual diagram illustrating control of screen display according to the embodiment. FIG. 4A is a form image read by the OCR1 image scanner. FIG. 4B shows a state in which a form image corresponding to the location where the layout analysis error is detected is displayed on the screen. Here, FIG. 4C shows the result of the operator performing a magnification changing operation via the keyboard. FIG. 4D illustrates a change in the display target position on the form image. Further, the display position can be changed to an arbitrary position on the screen by operation.

【0030】これにより、オペレータは、レイアウト解
析エラーの検出箇所について、帳票イメージを参照しな
がら対処することが可能となる。また、エラー検出部4
のチェック結果がレイアウト解析エラーなしであった場
合(図5のステップA2のN)でも、必要に応じてデー
タ修正部5にて確認及び修正等の任意な処理を行う(図
5のステップA3)ことが可能である。
Thus, the operator can deal with the detected location of the layout analysis error while referring to the form image. The error detection unit 4
If the result of the check is that there is no layout analysis error (N in step A2 in FIG. 5), the data correction unit 5 performs any processing such as confirmation and correction as needed (step A3 in FIG. 5). It is possible.

【0031】データ修正部5にて確認及び修正がされた
認識結果データは、データ出力部8に出力される(図4
のステップA5)。これにより、レイアウト解析エラー
の発生している帳票の認識結果データについて、簡便な
修正が可能となる。
The recognition result data confirmed and corrected by the data correction unit 5 is output to the data output unit 8 (FIG. 4).
Step A5). This makes it possible to easily correct the recognition result data of the form in which the layout analysis error has occurred.

【0032】次に、図7乃至図9を参照して、レイアウ
ト解析エラー検出部4によるエラー検出処理の具体的な
手順及びレイアウト解析エラー発生箇所の表示の一例を
説明する。
Next, with reference to FIGS. 7 to 9, a specific procedure of an error detection process by the layout analysis error detection unit 4 and an example of display of a location where a layout analysis error has occurred will be described.

【0033】図7は同実施例に係るエラー検出部の具体
的な処理手順の一例を示すフローチャート、図8は同実
施例に係るOCRから送信される認識結果データを説明
するための概念図、図9は同実施例に係るレイアウト解
析エラー発生箇所の表示の一例を説明する概念図であ
る。
FIG. 7 is a flowchart showing an example of a specific processing procedure of the error detection unit according to the embodiment. FIG. 8 is a conceptual diagram for explaining recognition result data transmitted from the OCR according to the embodiment. FIG. 9 is a conceptual diagram illustrating an example of display of a layout analysis error occurrence location according to the embodiment.

【0034】まず、認識結果データより帳票上の表数を
取得する(図7のステップC1)。この表数は、図8に
示すような認識結果データの帳票データから取得する。
この認識結果データは、OCR1のレイアウト解析処理
によって得られた値であり、帳票データ、表内データ、
項目行データ、項目データ及び文字データを含んでい
る。また、帳票データには帳票上の表数及び帳票のスタ
ート位置のアドレス、表内データには各表内のトータル
の項目数及び当該表のスタート位置のアドレス、項目行
データには項目行内の項目数及び当該項目行のスタート
位置のアドレス、項目データには項目内の行数及び当該
項目のスタート位置のアドレス、文字データには認識結
果データ及び当該行のスタート位置のアドレスをそれぞ
れ含んでいる。
First, the number of tables on the form is obtained from the recognition result data (step C1 in FIG. 7). The number of tables is obtained from the form data of the recognition result data as shown in FIG.
The recognition result data is a value obtained by the layout analysis processing of the OCR 1 and includes form data, in-table data,
It contains item line data, item data and character data. The form data contains the number of tables on the form and the address of the start position of the form. The data in the table contains the total number of items in each table and the address of the start position of the table. The number and the address of the start position of the item line, the item data include the number of lines in the item and the address of the start position of the item, and the character data include the recognition result data and the address of the start position of the line.

【0035】そして、この取得した帳票上の表数とLC
の表数情報とを比較する(図7のステップC2)。この
比較結果が一致しない場合は(図7のステップC3の
N)、帳票イメージのスタート位置のアドレスをレイア
ウト解析エラー箇所として(図7のステップC11)、
エラー検出処理を終了する。
Then, the number of tables on the obtained form and the LC
(Step C2 in FIG. 7). If the comparison results do not match (N in step C3 in FIG. 7), the address of the start position of the form image is set as a layout analysis error location (step C11 in FIG. 7).
The error detection processing ends.

【0036】これにより、例えば図9の14aに示すよ
うな領域がレイアウト解析エラーとして画面表示される
ことになる。比較結果が一致した場合(図7のステップ
C3のY)、認識結果データより各表内項目数を取得す
る(図7のステップC4)。この表内項目数は、図8に
示すような認識結果データの当該表内データから取得す
る。そして、この取得された表内項目数とLCの表内項
目数情報とを比較する(図7のステップC5)。これ
は、表内のトータルの項目数がLCの表内項目数情報の
整数倍である場合は比較結果が一致したと判断すること
により行う。比較結果が一致しない場合は(図7のステ
ップC6のN)、項目行単位の項目数を図8に示すよう
な認識結果データの当該項目行データの項目数から検査
していき、LCで保持する表内項目数情報と一致しない
項目行のスタート位置をレイアウト解析エラー箇所とし
て(図7のステップC11)、エラー検出処理を終了す
る。ここで、項目行とは、図3に示す13をいう。
As a result, for example, an area as shown at 14a in FIG. 9 is displayed on the screen as a layout analysis error. If the comparison results match (Y in step C3 in FIG. 7), the number of items in each table is obtained from the recognition result data (step C4 in FIG. 7). The number of items in the table is obtained from the data in the table of the recognition result data as shown in FIG. Then, the obtained number of in-table items is compared with the in-table item number information of the LC (step C5 in FIG. 7). This is performed by determining that the comparison result matches when the total number of items in the table is an integral multiple of the number of items in the table of LC. If the comparison results do not match (N in step C6 in FIG. 7), the number of items in item line units is checked from the number of items in the item line data of the recognition result data as shown in FIG. The start position of the item row that does not match the information on the number of items in the table is set as a layout analysis error location (step C11 in FIG. 7), and the error detection process ends. Here, the item row refers to 13 shown in FIG.

【0037】これにより、例えば図9の14bに示すよ
うな領域がレイアウト解析エラーとして画面表示される
ことになる。比較結果が一致した場合(図7のステップ
C6のY)、認識結果データより各項目内の行数を取得
する(図7のステップC7)。この項目内行数は、図8
に示すような認識結果データの当該項目データから取得
する。そして、この取得された行数とLCの項目内行数
情報とを比較する(図7のステップC8)。この比較結
果が一致しない場合は(図7のステップC9のN)、当
該項目スタート位置をレイアウト解析エラー箇所として
(図7のステップC11)、エラー検出処理を終了す
る。
As a result, for example, an area as shown at 14b in FIG. 9 is displayed on the screen as a layout analysis error. If the comparison results match (Y in step C6 in FIG. 7), the number of lines in each item is obtained from the recognition result data (step C7 in FIG. 7). The number of lines in this item is shown in FIG.
Is obtained from the item data of the recognition result data as shown in FIG. Then, the obtained number of lines is compared with the information on the number of lines in the LC item (step C8 in FIG. 7). If the comparison results do not match (N in step C9 in FIG. 7), the item start position is set as a layout analysis error location (step C11 in FIG. 7), and the error detection process ends.

【0038】これにより、例えば図9の14cに示すよ
うな領域がレイアウト解析エラーとして画面表示される
ことになる。全検査項目について比較結果が一致した場
合(図7のステップC9のY)、レイアウト解析エラー
なしとして(図7のステップC10)、エラー検出処理
を終了する。
As a result, an area such as that shown at 14c in FIG. 9 is displayed on the screen as a layout analysis error. If the comparison results match for all inspection items (Y in step C9 in FIG. 7), it is determined that there is no layout analysis error (step C10 in FIG. 7), and the error detection processing ends.

【0039】なお、表内項目数の比較方法として、トー
タルの表内項目数から検査するのではなく、当初から各
項目行単位の検査を実施する方法でもよい。また、レイ
アウト解析エラーを検出した時点でエラー検出処理を終
了するのではなく、一通り表数、表内項目数及び項目内
行数についてチェックした後、レイアウト解析エラーの
有無を判断する方法でもよい。
As a method for comparing the number of items in the table, a method may be employed in which an inspection is performed for each item row from the beginning, instead of checking from the total number of items in the table. Instead of ending the error detection processing when a layout analysis error is detected, a method may be used in which the number of tables, the number of items in a table, and the number of rows in an item are checked and the presence or absence of a layout analysis error is determined.

【0040】[0040]

【発明の効果】テキストリーダタイプOCRでOCR化
されていない給与振込依頼書等の既存帳票を認識した結
果、レイアウト解析エラーが発生した場合でも、レイア
ウト解析エラーとして画面表示される帳票イメージを参
照しながら対処することができるので、従来のように認
識結果データを破棄したり、実帳票を参照してのキーエ
ントリによる対処を行う必要がなくなり、簡便な修正を
可能とするとともに、ペーパレス化を実現可能とする。
According to the present invention, even if a layout analysis error occurs as a result of recognizing an existing form such as a payroll transfer request that has not been converted into an OCR with the text reader type OCR, the form image displayed as a layout analysis error is referred to. This eliminates the need for discarding recognition result data and performing key entry with reference to actual forms as in the past, making it possible to make simple corrections and achieve paperless operation. Make it possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例に係る帳票読取システムの構成
を示すブロック図。
FIG. 1 is a block diagram showing a configuration of a form reading system according to an embodiment of the present invention.

【図2】同実施例に係るLC(レイアウト情報)を説明
するための概念図。
FIG. 2 is a conceptual diagram for explaining LC (layout information) according to the embodiment.

【図3】同実施例に係るLCに含まれる帳票上の表の配
置情報、各表内の項目数情報及び各項目内の行数情報を
説明するための概念図
FIG. 3 is a conceptual diagram for explaining table layout information, item number information in each table, and row number information in each item included in the LC according to the embodiment.

【図4】同実施例に係る画面表示の制御を説明するため
の概念図。
FIG. 4 is an exemplary conceptual diagram for explaining screen display control according to the embodiment.

【図5】同実施例に係るOCR制御装置の処理手順を説
明するためのフローチャート。
FIG. 5 is a flowchart for explaining a processing procedure of the OCR control device according to the embodiment.

【図6】同実施例に係るエラー検出部の処理手順を概念
的に示すフローチャート。
FIG. 6 is a flowchart conceptually showing a processing procedure of an error detection unit according to the embodiment.

【図7】同実施例に係るエラー検出部の具体的な処理手
順の一例を示すフローチャート。
FIG. 7 is an exemplary flowchart illustrating an example of a specific processing procedure of an error detection unit according to the embodiment.

【図8】同実施例に係るOCRから送信される認識結果
データを説明するための概念図。
FIG. 8 is a conceptual diagram for explaining recognition result data transmitted from the OCR according to the embodiment.

【図9】同実施例に係るレイアウト解析エラー発生箇所
の表示の一例を説明する概念図。
FIG. 9 is an exemplary conceptual diagram explaining an example of display of a layout analysis error occurrence location according to the embodiment.

【符号の説明】[Explanation of symbols]

1…OCR、2…LC(レイアウト情報)記憶部、3…
OCR制御装置、4…レイアウト解析エラー検出部、5
…データ修正部、6…エラー修正部、7…イメージ表示
制御部、8…データ出力部、9…帳票、10a〜10c
…帳票上の表、11a〜11b…表内の項目、12a〜
12b…項目内の行、13…項目行、14a〜14c…
画面表示対象領域。
1 ... OCR, 2 ... LC (layout information) storage unit, 3 ...
OCR control device, 4 ... layout analysis error detection unit, 5
... Data correction section, 6 ... Error correction section, 7 ... Image display control section, 8 ... Data output section, 9 ... Form, 10a-10c
... Table on the form, 11a-11b ... Items in the table, 12a-
12b ... line in item, 13 ... item line, 14a-14c ...
Screen display target area.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 レイアウト情報記憶部から得られるレイ
アウト情報に従って読取帳票イメージのレイアウトを解
析し、その解析結果から認識対象の文字領域を決定して
文字認識を行う文字認識装置と、 この文字認識装置から出力される認識結果データと上記
レイアウト情報の表数情報、表内項目数情報、および項
目内行数情報とを比較して、一致していない場合はレイ
アウト解析エラーを出力するエラー検出手段と、 このエラー検出手段から出力された上記レイアウト解析
エラーのエラー発生箇所に対応する帳票イメージを表示
して、エラー確認および修正を行う修正手段とを具備す
ることを特徴とする帳票読取システム。
1. A ray obtained from a layout information storage unit.
The layout of the read form image according to the
A character recognition device that performs character recognition by determining a character area to be recognized from the analysis result, a recognition result data output from the character recognition device, a table number information of the layout information, and a table. Item number information and terms
Compare with the number of rows in the eye and if they do not match,
Error detection means for outputting an out-analysis error, and the layout analysis output from the error detection means
Display the form image corresponding to the error occurrence location of the error
And a correcting means for performing error confirmation and correction .
JP23443593A 1993-09-21 1993-09-21 Form reading system Expired - Lifetime JP3268084B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23443593A JP3268084B2 (en) 1993-09-21 1993-09-21 Form reading system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23443593A JP3268084B2 (en) 1993-09-21 1993-09-21 Form reading system

Publications (2)

Publication Number Publication Date
JPH0793469A JPH0793469A (en) 1995-04-07
JP3268084B2 true JP3268084B2 (en) 2002-03-25

Family

ID=16970968

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23443593A Expired - Lifetime JP3268084B2 (en) 1993-09-21 1993-09-21 Form reading system

Country Status (1)

Country Link
JP (1) JP3268084B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4998219B2 (en) 2007-11-09 2012-08-15 富士通株式会社 Form recognition program, form recognition apparatus, and form recognition method
JP5591578B2 (en) * 2010-04-19 2014-09-17 日本電産サンキョー株式会社 Character string recognition apparatus and character string recognition method

Also Published As

Publication number Publication date
JPH0793469A (en) 1995-04-07

Similar Documents

Publication Publication Date Title
US5889897A (en) Methodology for OCR error checking through text image regeneration
JP3805005B2 (en) Image processing apparatus, optical character recognition apparatus, and methods thereof
JP7013182B2 (en) Information processing equipment, information processing methods and programs
JP2835178B2 (en) Document reading device
JP2006031299A (en) Character recognition method, correction history processing method for character data and system
US20050185858A1 (en) Image processing method and apparatus and storage medium
US10902278B2 (en) Image processing apparatus, image processing system, computer program product, and image processing method
JP3268084B2 (en) Form reading system
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
WO2021220589A1 (en) Ink data modification method, information processing device, and program
JP5251652B2 (en) Form image filing system
JPH1091783A (en) Method for positioning picture and device for recognizing facsimile character and computer storage medium
JP4347675B2 (en) Form OCR program, method and apparatus
JP7206740B2 (en) Information processing device and program
JP2000187705A (en) Document reader, document reading method and storage medium
JP4357226B2 (en) Form definition device, form definition method, and form definition program
JP2008123446A (en) Log information management system, log information management device, log information management method, and log information management program
JPH11250179A (en) Character reocognition device and its method
JPH0388086A (en) Document reader
JP2007011528A (en) Method for searching position of recognition target item in ocr processing
JP2000339407A (en) Picture processor, picture processing method and computer readable storage medium
JP3578526B2 (en) Fax receiving system and method
JPH04199483A (en) Document recognizing and correcting device
JP2002133367A (en) Character recognition device
JPH04302070A (en) Character recognizing device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080111

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100111

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100111

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140111

Year of fee payment: 12