JP2000020639A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP2000020639A
JP2000020639A JP10183656A JP18365698A JP2000020639A JP 2000020639 A JP2000020639 A JP 2000020639A JP 10183656 A JP10183656 A JP 10183656A JP 18365698 A JP18365698 A JP 18365698A JP 2000020639 A JP2000020639 A JP 2000020639A
Authority
JP
Japan
Prior art keywords
control information
format control
sides
read
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10183656A
Other languages
Japanese (ja)
Inventor
Hideharu Hattori
英春 服部
Kazuhiro Kushima
和弘 九嶋
Masatoshi Kurata
正敏 倉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10183656A priority Critical patent/JP2000020639A/en
Publication of JP2000020639A publication Critical patent/JP2000020639A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To reduce operator's correction work by recognizing the images of a document by using format control information for the front and rear sides of the document and printing out the recognized result on the document read. SOLUTION: This optical character reader is provided with a scanner 2 for reading out images from the front and rear sides of a document and outputs from the scanner 2 are respectively stored in a front image storing part 11 and a rear image storing part 12. A field information extraction part 50 finds out the reading field information of the front and rear sides of the document by document analysis and a front/rear decision control part 60 extracts and prepares front format control information and rear format control information from format control information 40. A recognition part 20 reads out the front and rear sides of the document by using the front and rear format control information. A display device 80 displays the read results and a printing part 70 prints out identification characters indicating, whether or not characters to be corrected are included in the document on the document.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、帳票上の両面の文
字を認識し、コンピュータで処理可能なコードデータを
取得する場合に必要なフォーマット制御情報を作成する
システムにおいて、従来の帳票の表(おもて)面のみの
フォーマット制御情報を作成するシステムを変更するこ
となく、且つオペレータに帳票の表裏や大きさの種別の
意識をさせずに帳票の両面のフォーマット制御情報を作
成し、帳票の両面を同時に読取りながら、帳票の表裏の
読取り結果を帳票に印字する光学的文字読取り装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for recognizing characters on both sides of a form and generating format control information necessary for obtaining code data that can be processed by a computer. Front) Create format control information for both sides of a form without changing the system that creates format control information only for the side, and without making the operator aware of the front and back of the form and the type of size. The present invention relates to an optical character reader that prints the results of reading the front and back of a form on a form while simultaneously reading both sides.

【0002】[0002]

【従来の技術】従来の光学的文字読取装置で、各種伝票
や帳票に記載されている文字を高い認識率で読取るため
には、正確な文字の切り出し情報が不可欠であり、その
情報はフォーマット制御情報(以下FCIという)に含
まれる。帳票の両面を同時に読取らせるためのFCI
は、帳票の表面用の表フォーマット制御情報(以下FF
CIという)と裏面用の裏フォーマット制御情報(以下
BFCIという)から構成される。この予め作成してお
いた表面用と裏面用の二つのフォーマット制御情報を帳
票の各面に対して切り替えながら、従来の光学的文字読
取装置は、帳票の両面の読取りを実現していた。上記の
一例として、特開平7−182443号公報の技術があ
る。
2. Description of the Related Art In a conventional optical character reader, accurate character cutout information is indispensable for reading characters written on various slips and forms at a high recognition rate, and the information is format controlled. Information (hereinafter referred to as FCI). FCI for reading both sides of a form simultaneously
Is table format control information (hereinafter FF)
CI) and back format control information for the back side (hereinafter BFCI). The conventional optical character reading device realizes reading of both sides of a form while switching the two format control information for the front side and the back side prepared in advance for each side of the form. As an example of the above, there is a technique disclosed in Japanese Patent Application Laid-Open No. 7-182443.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記従
来の光学的文字読取り装置には、次のような解決すべき
課題があった。従来の光学的文字読取り装置では、帳票
の表面のみのFFCIしか作成できないシステムを、F
FCIとBFCIが作成できるように変更する必要があ
った。また、オペレータが帳票の表裏を意識しながらF
FCIとBFCIを作成しなければならず、さらに、大
きさの異なる帳票や帳票の表裏が逆にセットされている
帳票を混在して読取る場合、帳票の種類や帳票の表裏を
判別する記号を予め帳票に印刷したり、一種類の帳票に
対して一つのFFCIとBFCIを作成しなければなら
ず、多くの労力を必要とするため作業能率が悪いという
問題点があった。また、帳票の裏面に不読や誤読がある
か否か等の読取り結果を印字する手段はなく、どの帳票
やどの帳票の面に修正する文字があるか否かを、帳票一
枚一枚詳細に調べなければならず、帳票の修正確認に多
くの労力を必要とするため作業能率が悪いという問題が
あった。
However, the above-mentioned conventional optical character reader has the following problems to be solved. A conventional optical character reader can create a system that can create only the FFCI of only the surface of a form.
It was necessary to change so that FCI and BFCI could be created. In addition, the operator is aware of the front and back of the form and
FCI and BFCI must be created. In addition, when reading forms with different sizes or forms with the front and back of the forms mixed together, the type of form and the symbol for distinguishing between the front and back of the form must be specified in advance. It is necessary to print on a form, or to create one FFCI and BFCI for one type of form, and there is a problem that work efficiency is poor because a lot of labor is required. In addition, there is no means to print the reading result such as whether there is unread or misreading on the back of the form, and it is necessary to check which form and which form has the character to be corrected on each form. However, there is a problem that work efficiency is poor because a lot of labor is required for confirming the correction of the form.

【0004】本発明の目的は、上記従来の問題点を解決
するものであり、従来のFFCIのみ作成可能なシステ
ムを変更することなく、また、帳票の大きさの種類や表
裏を判別する記号を予め帳票に印刷することなく、複数
の種類の帳票の表面と裏面のFCIを一つの帳票の表面
のFCIとして作成しても、オペレータに帳票の表裏や
大きさの種別を意識させずに、入力された帳票の各面に
対して自動的にFFCIとBFCIを作成し、帳票の両
面を読取ることを可能にする光学的文字読取り装置を提
供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to solve the above-mentioned conventional problems, without changing a conventional system that can create only FFCIs, and changing the type of form size and the symbols for distinguishing front and back. Even if the front and back FCIs of multiple types of forms are created as the front FCI of one form without printing on the form in advance, the input can be made without the operator being aware of the front / back and size of the form. An object of the present invention is to provide an optical character reading device that automatically creates FFCI and BFCI for each side of a completed form and can read both sides of the form.

【0005】また、本発明の他の目的は、読取り文字の
修正を必要とする帳票と必要としない帳票、その修正す
る帳票の面が表面か裏面かを見極めるために、意味付け
した識別文字を帳票に印刷することを可能にする光学的
文字読取り装置を提供することにある。
Another object of the present invention is to provide a form that requires correction of read characters, a form that does not require the form, and an identification character having a meaning to identify whether the form to be corrected is a front side or a back side. An object of the present invention is to provide an optical character reading device that can print on a form.

【0006】[0006]

【課題を解決するための手段】この目的を達成するため
に本発明の光学的文字読取り装置は、帳票の上面(表
面)を走査する上面用センサと、帳票の下面(裏面)を
走査する下面用センサを備えたスキャナと、該上面用、
及び該下面用センサで得た表裏の帳票イメージを格納す
るイメージバッファと、そのイメージバッファからの帳
票の表裏のイメージを格納するメモリと、その帳票イメ
ージから帳票の両面の読取りフィールドの情報を抽出す
る手段と、その抽出した帳票の表面と裏面のフィールド
情報を格納するメモリと、帳票上の文字を読み取るのに
必要なフォーマット制御情報と、該帳票の表面と裏面の
フィールド情報を用いて、フォーマット制御情報の中か
ら帳票の表面のフォーマット制御情報と帳票の裏面のフ
ォーマット制御情報を抽出して作成する手段と、その作
成した帳票の表面と裏面のフォーマット制御情報を格納
するメモリと、帳票の表面と裏面のフォーマット制御情
報を用いて、メモリに貯えられた帳票のイメージを認識
処理する手段と、読取った帳票に印字する手段と、読取
った内容を表示する手段とを備え、帳票の両面を同時に
読み取ることを特徴とする。
In order to achieve this object, an optical character reader according to the present invention comprises an upper surface sensor for scanning the upper surface (front surface) of a document and a lower surface for scanning the lower surface (back surface) of the document. A scanner with a sensor for
And an image buffer for storing the front and back form images obtained by the sensor for the lower surface, a memory for storing the front and back images of the form from the image buffer, and extracting information on both-side read fields of the form from the form image. Means, a memory for storing field information of the front and back surfaces of the extracted form, format control information necessary for reading characters on the form, and format control using the field information of the front and back surfaces of the form. Means for extracting and creating the format control information of the front side of the form and the format control information of the back side of the form from among the information, a memory for storing the format control information of the front side and the back side of the created form, Means for recognizing and processing the image of the form stored in the memory using the format control information on the back side, And means for printing on took form, and means for displaying the read contents, and wherein the scanning both sides of a document at the same time.

【0007】また、本発明による光学的文字読取り装置
は、オペレータが定義するフォーマット制御情報を使用
せずに、抽出した帳票の表面と裏面のフィールド情報か
ら、帳票の表面と裏面のフォーマット制御情報を作成す
る手段を備えていることを特徴とする。
Further, the optical character reading apparatus according to the present invention converts format control information of the front and back sides of a form from the extracted field information of the front and back sides of the form without using format control information defined by the operator. It is characterized by having means for creating.

【0008】また、本発明による光学的文字読取り装置
は、表裏が逆さに挿入された帳票が混在している場合で
も的確に読取るために、一度作成した帳票の表面用のフ
ォーマット制御情報と裏面用のフォーマット制御情報を
切り替える手段を備えることなく、帳票を一枚一枚読取
るたびに、挿入された帳票の各面に対して上面用のフォ
ーマット制御情報と上面に対向する面用のフォーマット
制御情報を作成する手段を備えていることを特徴とす
る。
Further, the optical character reading apparatus according to the present invention provides a format control information for a front side of a form once prepared and a format control information for a back side so as to accurately read even forms mixed upside down. Without providing a means for switching the format control information, each time the form is read one by one, the format control information for the upper surface and the format control information for the surface facing the upper surface for each side of the inserted form are It is characterized by having means for creating.

【0009】また、本発明による光学的文字読取り装置
は、予め一枚の帳票の両面を読取らせて、フォーマット
制御情報から帳票の表面と裏面の二つのフォーマット制
御情報を作成しておく手段を備えていることを特徴とす
る。
Further, the optical character reading apparatus according to the present invention includes means for reading both sides of one form in advance and creating two format control information for the front and back sides of the form from the format control information. It is characterized by having.

【0010】また、本発明による光学的文字読取り装置
は、読取った文字の修正が必要な帳票と必要でない帳
票、またその修正する帳票での修正する面が表面か裏面
かを見極めるために、帳票に意味付けした識別文字を印
字する手段を備えていることを特徴とする。
An optical character reading apparatus according to the present invention is provided with a form for determining whether a read character needs to be corrected and a form for which the read character is not required, and whether the surface to be corrected in the form to be corrected is a front side or a back side. Means for printing an identification character having the meaning described in (1).

【0011】また、本発明による光学的文字読取り装置
は、帳票の大きさが異なる帳票や、帳票の表裏が逆にセ
ットされている帳票が混在している場合でも的確に帳票
の両面を読取るために、大きさの異なる帳票の種類や帳
票の表裏を判別する記号を予め帳票に印刷することな
く、入力された大きさの異なる帳票の各面に対して、フ
ォーマット制御情報の中から、帳票を一枚一枚読取るた
びに表面用のフォーマット制御情報と、裏面用のフォー
マット制御情報を抽出して作成する手段を備えているこ
とを特徴とする。
Further, the optical character reading apparatus according to the present invention can accurately read both sides of a form even when forms having different sizes and forms in which the front and back sides of the forms are mixed are mixed. Then, without printing in advance the types of forms with different sizes and the symbols for distinguishing the front and back of the forms on the form, the form is converted from the format control information for each side of the input forms with different sizes. It is characterized by comprising means for extracting and creating the format control information for the front side and the format control information for the back side every time each page is read.

【0012】[0012]

【発明の実施の形態】以下、本発明の一実施例における
光学的文字読取り装置について、図1により詳細に説明
する。図1は、本発明の一実施例における光学的文字読
取り装置の構成図である。帳票の表面と裏面のイメージ
を読取るスキャナ2を備え、その出力は、イメージバッ
ファ5を経由して認識装置1の表イメージ格納部11と
裏イメージ格納部12に各々格納された後、フィールド
情報抽出部50で帳票解析を行って帳票の表面と裏面の
読取りフィールドの情報を求め、その帳票の表面と裏面
のフィールド情報を表フィールド情報格納部14と裏フ
ィールド情報格納部15に格納する。その解析された結
果生成されるフィールド情報を用いて、表裏判断制御部
60によりフォーマット制御情報40から表フォーマッ
ト制御情報と裏フォーマット制御情報を抽出して作成
し、その表裏のフォーマット制御情報を用いて、認識部
20で帳票の表裏を読取る。表示装置80でその読取り
結果を表示し、印字部70で帳票に修正が必要な文字が
あるか否かを示す意味付けした識別文字を帳票に印字す
る構成になっている。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an optical character reader according to an embodiment of the present invention will be described in detail with reference to FIG. FIG. 1 is a configuration diagram of an optical character reading device according to an embodiment of the present invention. A scanner 2 for reading the front and back images of a form is provided, and its output is stored in a front image storage unit 11 and a back image storage unit 12 of the recognizing device 1 via an image buffer 5, and then field information is extracted. The form analysis is performed by the section 50 to obtain information on the read fields on the front and back sides of the form, and the field information on the front and back sides of the form is stored in the front field information storage section 14 and the back field information storage section 15. Using the field information generated as a result of the analysis, the front and back determination control unit 60 extracts and creates the front format control information and the back format control information from the format control information 40, and uses the front and back format control information. The recognition unit 20 reads the front and back of the form. The reading result is displayed on the display device 80, and the printing unit 70 prints on the form an identification character having a meaning indicating whether or not there is a character that needs to be corrected in the form.

【0013】スキャナ2では、上面用センサ3が帳票の
上面(表面)を走査して帳票データを取得する。さら
に、下面用センサ4が上面用センサ3で走査した帳票の
面と対向した面(裏面)を走査して帳票データを取得す
る。これにより、帳票の表面及び裏面の両面を読取るこ
とが可能となる。その取得した帳票データをイメージバ
ッファ5を経由して表イメージ格納部11と裏イメージ
格納部12に格納する。
In the scanner 2, the upper surface sensor 3 scans the upper surface (front surface) of the form to acquire the form data. Further, the lower surface sensor 4 scans a surface (back surface) opposite to the surface of the form scanned by the upper surface sensor 3 to acquire the form data. This makes it possible to read both the front and back sides of the form. The acquired form data is stored in the front image storage unit 11 and the back image storage unit 12 via the image buffer 5.

【0014】フォーマット制御情報40は、図2に示す
ような帳票でのすべての読取るフィールドに対するフィ
ールドの情報(位置、サイズ)等で構成されている。図
2において、X,Yは帳票の左端上を原点とする位置座
標であり、LとHは読取るフィールドの幅と高さを表
し、Wは読取り文字の文字枠の幅を表している。
The format control information 40 includes field information (position, size) for all fields to be read in the form as shown in FIG. In FIG. 2, X and Y are position coordinates having the origin at the upper left end of the form, L and H represent the width and height of the field to be read, and W represents the width of the character frame of the read character.

【0015】フィールド情報抽出部50は、帳票解析を
行って帳票イメージからフィールドの枠を求め、図2に
示すような帳票での読取るべきフィールドの情報(位
置、サイズ等)を抽出する。抽出した帳票の表面のフィ
ールド情報(以下FFIという)は表フィールド情報格
納部14、帳票の裏面のフィールド情報(以下BFIと
いう)は裏フィールド情報格納部15に各々格納する。
The field information extracting unit 50 performs form analysis to obtain a field frame from the form image, and extracts information (position, size, etc.) of the field to be read in the form as shown in FIG. The extracted field information on the front side of the form (hereinafter, referred to as FFI) is stored in the front field information storage unit 14, and the field information on the back side of the form (hereinafter, referred to as BFI) is stored in the back field information storage unit 15.

【0016】表裏判断制御部60は、FCIからFFI
とBFIを用いて、図3、図4に示すフローチャートに
従い、FFCIとBFCIを抽出して作成する。次に、
表裏判断制御部60の処理について、図3、図4のフロ
ーチャートを用いて説明する。
The front / back determination control unit 60 converts the FFI to the FFI
FFCI and BFCI are extracted and created according to the flowcharts shown in FIGS. next,
The processing of the front / back determination control unit 60 will be described with reference to the flowcharts of FIGS.

【0017】始めにFFIからフィールドを取り出し、
そのフィールドをフィールドAに設定する(S1)。次
に、FCIからフィールドを取り出し、そのフィールド
をフィールドBに設定する(S2)。フィールドBがF
CIの中で最初に取り出されたフィールドならば、フィ
ールドCにフィールドBを設定する(S3,S4)。そ
うでなければ、次のステップへ進む。FCIより取り出
したフィールドBがフィールドCよりフィールドAに類
似していれば、フィールドCにフィールドBを新たに設
定する(S5,S6)。類似していなければ、次のステ
ップへ進む。フィールドBがFCIの最終フィールドか
どうかを判断する(S7)。最終フィールドであれば、
フィールドCをFFCIに格納する(S8)。そうでな
ければ、FCIから次のフィールドBを取り出して前記
操作を繰り返す。次に、フィールドAがFFIの最終フ
ィールドかどうかを判断する(S9)。最終フィールド
であれば、ステップAへ進み、そうでなければ、FFI
から次のフィールドAを取り出し、前記操作を繰り返
す。このステップAの段階までで、帳票の表面の各フィ
ールドに対するFCIのフィールドを求め、FFCIを
作成する。
First, a field is extracted from the FFI,
The field is set to field A (S1). Next, a field is extracted from the FCI, and the field is set as a field B (S2). Field B is F
If the field is the first field extracted from the CI, the field B is set to the field C (S3, S4). Otherwise, go to the next step. If field B extracted from FCI is more similar to field A than field C, field B is newly set in field C (S5, S6). If not, proceed to the next step. It is determined whether the field B is the last field of the FCI (S7). If it is the last field,
The field C is stored in the FFCI (S8). Otherwise, retrieve the next field B from the FCI and repeat the operation. Next, it is determined whether the field A is the last field of the FFI (S9). If it is the last field, go to step A, otherwise, FFI
Then, the next field A is taken out from the above, and the above operation is repeated. Up to the step A, the FCI field for each field on the front surface of the form is obtained, and the FFCI is created.

【0018】BFIからフィールドを取り出し、そのフ
ィールドをフィールドDに設定する(S10)。次に、
FCIからフィールドを取り出し、そのフィールドをフ
ィールドEに設定する(S11)。フィールドEがFC
Iの中で最初に取り出されたフィールドならば、フィー
ルドFにフィールドEを設定する(S12,S13)。
そうでなければ、次のステップへ進む。FCIより取り
出したフィールドEがフィールドFよりフィールドDに
類似していれば、フィールドFにフィールドEを新たに
設定する(S14,S15)。類似していなければ、次
のステップへ進む。フィールドEがFCIの最終フィー
ルドかどうかを判断する(S16)。最終フィールドで
あれば、フィールドFをBFCIに格納する(S1
7)。そうでなければ、FCIから次のフィールドEを
取り出して前記操作を繰り返す。
A field is extracted from the BFI, and the field is set as a field D (S10). next,
The field is extracted from the FCI, and the field is set to the field E (S11). Field E is FC
If it is the first field extracted from I, field E is set to field F (S12, S13).
Otherwise, go to the next step. If the field E extracted from the FCI is more similar to the field D than the field F, the field E is newly set in the field F (S14, S15). If not, proceed to the next step. It is determined whether the field E is the last field of the FCI (S16). If it is the last field, the field F is stored in the BFCI (S1).
7). Otherwise, fetch the next field E from the FCI and repeat the operation.

【0019】次に、フィールドDがBFIの最終フィー
ルドかどうかを判断する(S18)。最終フィールドで
あれば、本処理を終了し、そうでなければ、BFIから
次のフィールドDを取り出し、上記操作を繰り返す。こ
のステップS18でBFIの最終フィールドの処理が終
了した段階までで、帳票の裏面の各フィールドに対する
FCIのフィールドを求め、BFCIを作成する。
Next, it is determined whether the field D is the last field of the BFI (S18). If it is the last field, the process is terminated; otherwise, the next field D is extracted from the BFI and the above operation is repeated. Until the processing of the last field of the BFI is completed in step S18, the field of the FCI for each field on the back side of the form is obtained, and the BFCI is created.

【0020】上記処理を行うことにより、各帳票に対す
るFFCIとBFCIを作成することが可能となる。
By performing the above processing, it is possible to create FFCI and BFCI for each form.

【0021】上記操作における類似の判定は、図2に示
すフィールド情報(位置、サイズ)の各情報の差の絶対
値を求め、その差の値がすべて一番小さいフィールド同
士が一番類似していると判断する。
The similarity determination in the above operation is performed by obtaining the absolute value of the difference between the pieces of information of the field information (position and size) shown in FIG. 2, and the fields having the smallest difference value are the most similar. Judge that there is.

【0022】認識部20では、FFCIを使用して表イ
メージ格納部11に格納された帳票の表面のイメージ
を、またBFCIを使用して裏イメージ格納部12に格
納された帳票の裏面のイメージを公知例の技術により文
字認識し、帳票の両面の読取りを可能とする。
The recognizing unit 20 uses the FFCI to store the image of the front side of the form stored in the front image storage unit 11, and the BFCI to store the back side image of the form stored in the back image storage unit 12. Character recognition is performed by a known technique, and both sides of a form can be read.

【0023】印字部70では、帳票を読取った結果、帳
票に修正する文字があるか否かを判別する意味付けした
識別文字を帳票に印字する。印字の仕方の一例を図5に
示す。図5の(1)は帳票の表面のみに修正する文字を
含む場合である。この場合、帳票の表面に”A”という
識別文字を印字している。(2)は帳票の裏面のみに修
正する文字を含む場合である。この場合、帳票の表面
に”B”という識別文字を印字している。(3)は帳票
の表面と裏面の両面に修正する文字を含む場合である。
この場合、帳票の表面に”AB”という識別文字を印字
している。(4)は帳票に修正する文字を含まない場合
である。この場合、帳票の表面に”○”という識別文字
を印字している。
As a result of reading the form, the printing unit 70 prints a meaningful identification character for determining whether or not there is a character to be corrected in the form on the form. FIG. 5 shows an example of a printing method. FIG. 5A shows a case where a character to be corrected is included only on the surface of the form. In this case, an identification character "A" is printed on the surface of the form. (2) is a case where a character to be corrected is included only on the back side of the form. In this case, the identification character "B" is printed on the surface of the form. (3) is a case where the form includes characters to be corrected on both the front side and the back side.
In this case, an identification character "AB" is printed on the surface of the form. (4) is a case where the form does not include a character to be corrected. In this case, an identification character "O" is printed on the front surface of the form.

【0024】印字する位置、方向、識別文字、印字面
は、図5の例に限定される訳ではない。印字する位置は
帳票のどの位置でも可能であり、印字方向は縦方向、横
方向、斜め方向でも可能である。また、識別文字は、印
字可能な識別できる文字であり、印字面は表面、裏面、
両面のどれでも可能である。
The printing position, direction, identification character, and printing surface are not limited to the example shown in FIG. The printing position can be at any position on the form, and the printing direction can be vertical, horizontal, or oblique. The identification characters are printable and identifiable characters.
Either side is possible.

【0025】従って、本発明により、従来の帳票の表面
のみのフォーマット制御情報しか作成できないシステム
を変更することなく、またオペレータが帳票の表裏や大
きさの種別を意識せずに、あたかも複数の種類の帳票の
すべてのフィールドが一つの帳票の表面のフィールドで
あるかのように帳票の読取りフィールドを自由に定義し
ても、複数の種類の帳票の両面を読取ることが可能とな
る。
Therefore, according to the present invention, it is possible to create a plurality of types of forms without changing the conventional system that can only create format control information for the front side of a form, and without the operator being aware of the type of front and back and size of the form. Even if all the fields of the form are defined as the fields on the surface of one form, it is possible to read both sides of a plurality of types of forms even if the fields for reading the form are freely defined.

【0026】また、従来は帳票の大きさが異なる帳票を
混在して読取る場合、一種類の帳票に対してフォーマッ
ト制御情報を一つ作成しなければならなかったが、本発
明により、帳票の大きさが異なる帳票が混在する場合で
も、各帳票のフォーマット制御情報をまとめて一つのフ
ォーマット制御情報として作成できるので、オペレータ
は帳票の表裏や大きさの種別を意識せずに帳票のフォー
マット制御情報の作成作業を容易に行える。
Conventionally, in the case where forms of different sizes are mixedly read, one format control information has to be created for one type of form. Even when forms with different sizes are mixed, the format control information of each form can be combined and created as one format control information, so that the operator does not need to be aware of the front and back and size of the form, Creation work can be performed easily.

【0027】また、本発明により、表裏が逆さの帳票が
混在している場合でも、一度作成した帳票の表面用のフ
ォーマット制御情報と裏面用のフォーマット制御情報を
切り替える制御手段を備えることなく、帳票一枚一枚読
取るたびにその帳票の各面に合わせて、表裏判断制御部
60でフォーマット制御情報40から帳票の上面用のフ
ォーマット制御情報と上面に対向した面のフォーマット
制御情報を抽出して作成することができるので、その二
つのフォーマット制御情報を用いて、帳票の両面の読取
りが可能となる。
Further, according to the present invention, even in the case where a form in which the front and back sides are upside down is mixed, the form is not provided with a control means for switching between the format control information for the front side and the format control information for the back side of the form once created. Each time the document is read, the format control information for the upper surface of the form and the format control information of the surface facing the upper surface are extracted and created from the format control information 40 by the front / back determination control unit 60 in accordance with each side of the form. Therefore, both sides of the form can be read using the two format control information.

【0028】また、本発明により、予め帳票一枚を読取
らせて、その読取らせた帳票の各面に合わせて、表裏判
断制御部60でフォーマット制御情報40から帳票の上
面用のフォーマット制御情報と上面に対向した面のフォ
ーマット制御情報を抽出して作成しておき、その二つの
フォーマット制御情報を用いて、連続して複数の帳票の
両面の読取りが可能となる。
Further, according to the present invention, one form is read in advance, and the format control information 40 is used by the front / back determination control unit 60 to determine the format control for the top of the form according to each side of the read form. The information and the format control information of the surface facing the upper surface are extracted and created, and the two format control information can be used to continuously read both sides of a plurality of forms.

【0029】また、本発明により、帳票を読取るために
必要なオペレータが定義するFCIを用いなくても、フ
ィールド情報抽出部50で帳票のイメージから帳票解析
して求めたFFIとBFIだけを用いて、表裏判断制御
部60で、FFIから帳票の表面用のフォーマット制御
情報、BFIから帳票の裏面用のフォーマット制御情報
を作成し、その二つのフォーマット制御情報を用いて、
帳票の両面を読取ることが可能である。
According to the present invention, the field information extraction unit 50 uses only the FFI and BFI obtained by analyzing the form from the form image without using the FCI defined by the operator necessary for reading the form. The front / back determination control unit 60 creates format control information for the front side of the form from FFI and format control information for the back side of the form from BFI, and uses the two format control information
It is possible to read both sides of a form.

【0030】また、本発明により、オペレータは、帳票
の面に印字された識別文字により、修正しなければいけ
ない帳票と、その帳票での修正すべき面を容易に判別可
能となる。したがって、帳票に印字した識別文字から直
ちに修正したい画面を表示装置80で選択できる。この
ことにより、オペレータの修正確認の作業能率を向上さ
せることが可能となる。
Further, according to the present invention, the operator can easily determine the form to be corrected and the surface to be corrected in the form based on the identification characters printed on the form surface. Therefore, the display device 80 can select a screen to be immediately corrected from the identification characters printed on the form. This makes it possible to improve the work efficiency of the operator's correction confirmation.

【0031】また、本発明により、大きさの異なる帳票
や帳票の表裏が逆さの帳票を混在して読取る場合でも、
大きさの異なる帳票の種類や帳票の表裏を判別する記号
を予め帳票に印刷することなく、入力された大きさの異
なる帳票の各面にに合わせて、表裏判断制御部60でフ
ォーマット制御情報40から帳票の上面用のフォーマッ
ト制御情報と上面に対向した面のフォーマット制御情報
を抽出して作成することができるので、その二つのフォ
ーマット制御情報を用いて、帳票の両面の読取りが可能
となる。
Further, according to the present invention, even when forms of different sizes or forms with the front and back inverted are mixedly read,
The format control information 40 is determined by the front / back determination control unit 60 in accordance with each side of the input forms having different sizes without printing in advance the types of the forms having different sizes and the symbols for distinguishing between the front and back of the forms. Thus, the format control information for the upper surface of the form and the format control information for the surface facing the upper surface can be extracted and created, so that both sides of the form can be read using the two format control information.

【0032】尚、本発明は本実施例の帳票OCRに限定
される訳ではない。テキストリーダタイプOCRや、帳
票イメージ入力システムでも実施可能である。
The present invention is not limited to the form OCR of the present embodiment. The present invention can be implemented by a text reader type OCR or a form image input system.

【0033】[0033]

【発明の効果】以上のように説明した本発明の光学的文
字読取り装置は、スキャナで走査して得た帳票の両面の
イメージを帳票解析して求めたフィールドの位置情報と
サイズ情報を利用し、表裏判断制御部でオペレータが帳
票の表裏や大きさの種別を意識せずに自由に定義したフ
ォーマット制御情報から帳票の表面用のフォーマット制
御情報と裏面用のフォーマット制御情報を抽出して作成
することにより、その二つの情報を用いて、帳票の大き
さが異なる帳票や帳票の表裏が逆さの帳票が混在する場
合でも、帳票の両面の文字の読取りを可能とする。従っ
て、従来の帳票の表面のフォーマット制御情報のみ作成
可能なシステムを変更することなく、またオペレータが
帳票の表裏や大きさの種別を意識せずに、あたかも複数
の種類の帳票の両面のすべてのフィールドが一つの帳票
の表面のフィールドであるかのように帳票の読取りフィ
ールドを自由に定義できるので、大きさの異なる帳票が
混在している場合でも、一つのフォーマット制御情報を
作成すればよいため、読取りフィールドの定義作業がス
ムーズに行え、オペレータの労力を大幅に軽減させるこ
とが可能となる。また、帳票に印字した識別文字によ
り、オペレータは修正すべき帳票と、その帳票での修正
すべき面を容易に見つけることができるので、修正確認
の作業能率を向上させることが可能となる。
As described above, the optical character reading apparatus of the present invention utilizes field position information and size information obtained by form analysis of both sides of a form obtained by scanning with a scanner. The front and back judgment control unit extracts and creates the format control information for the front side and the back side of the form from the format control information freely defined by the operator without being aware of the front and back and size of the form. By using the two pieces of information, it is possible to read characters on both sides of a form even when forms having different sizes and forms having the opposite sides are mixed. Therefore, without changing the conventional system that can create only the format control information on the front side of the form, and without the operator being aware of the front and back and the type of size of the form, it is as if all Since the fields to read the form can be freely defined as if the fields are the fields on the surface of one form, even if forms of different sizes are mixed, one format control information can be created. Thus, the operation of defining the reading field can be performed smoothly, and the labor of the operator can be greatly reduced. Further, the identification characters printed on the form allow the operator to easily find the form to be corrected and the surface to be corrected in the form, thereby improving the work efficiency of the correction confirmation.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の両面読取りの光学的文字読取り装置の
実施例を示す図である。
FIG. 1 is a diagram showing an embodiment of an optical character reading apparatus for double-sided reading according to the present invention.

【図2】本発明のフィールドの位置、サイズ情報の一例
を示す図である。
FIG. 2 is a diagram showing an example of field position and size information according to the present invention.

【図3】本発明の表示判断制御部の処理の詳細なフロー
チァートの一部である。
FIG. 3 is a part of a detailed flowchart of processing of a display determination control unit of the present invention.

【図4】本発明の表示判断制御部の処理の詳細なフロー
チァートの一部である。
FIG. 4 is a part of a detailed flowchart of processing of a display determination control unit according to the present invention;

【図5】本発明の印字部による帳票への識別文字の印字
の一例を示す図である。
FIG. 5 is a diagram illustrating an example of printing of identification characters on a form by a printing unit according to the present invention.

【符号の説明】[Explanation of symbols]

1…認識装置、 2…スキャナ、 3
…上面用センサ、4…下面用センサ、 5…イメー
ジバッファ、10…メモリ、11…表イメージ格納部、
12…裏イメージ格納部、14…表フィールド情報格納
部、 15…裏フィールド情報格納部、17…表フ
ォーマット制御情報格納部、18…裏フォーマット制御
情報格納部、20…認識部、 30…制御部、 4
0…フォーマット制御情報、50…フィールド情報抽出
部、 60…表裏判断制御部、70…印字部、
80…表示装置。
1. Recognition device 2. Scanner 3.
... Sensor for upper surface, 4 ... Sensor for lower surface, 5 ... Image buffer, 10 ... Memory, 11 ... Table image storage unit,
12: Back image storage unit, 14: Front field information storage unit, 15: Back field information storage unit, 17: Front format control information storage unit, 18: Back format control information storage unit, 20: Recognition unit, 30: Control unit , 4
0: format control information, 50: field information extraction unit, 60: front / back determination control unit, 70: printing unit,
80 ... Display device.

フロントページの続き (72)発明者 倉田 正敏 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 Fターム(参考) 5B029 BB02 CC13 CC26 DD10 Continued on the front page (72) Inventor Masatoshi Kurata 2880 Kozu, Odawara-shi, Kanagawa F-term in Hitachi, Ltd. Storage System Division (Reference) 5B029 BB02 CC13 CC26 DD10

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】帳票上の文字を読み取るのに必要なオペレ
ータが、表裏を意識することなく定義するフォーマット
制御情報と、帳票の表面と裏面のイメージを読取るスキ
ャナと、そのスキャナからの出力を格納するイメージバ
ッファと、そのイメージバッファからの帳票の表面と裏
面のイメージを格納するメモリと、イメージからフィー
ルドのフィールド情報を抽出する手段と、その抽出した
帳票の表面と裏面のフィールド情報を格納するメモリ
と、フォーマット制御情報から帳票の表面と裏面のフィ
ールド情報を用いて帳票の表面と裏面の二つのフォーマ
ット制御情報を作成する手段と、その作成した帳票の表
面と裏面のフォーマット制御情報を格納するメモリと、
帳票の表面と裏面のフォーマット制御情報を用いて上記
メモリに貯えられた帳票イメージを認識処理する手段
と、読取った帳票に印字する手段と、読取った内容を表
示する手段とを備え、帳票の両面を同時に読み取ること
を特徴とする光学的文字読取り装置。
An operator required to read characters on a form stores format control information without being aware of the front and back sides, a scanner for reading images on the front and back sides of the form, and an output from the scanner. Image buffer, a memory for storing front and back images of a form from the image buffer, a unit for extracting field information of a field from the image, and a memory for storing field information of the front and back sides of the extracted form Means for creating two format control information of the front and back sides of the form using the field information of the front and back sides of the form from the format control information, and a memory for storing the format control information of the front and back sides of the created form When,
Means for recognizing and processing the form image stored in the memory using the format control information on the front and back sides of the form, means for printing on the read form, and means for displaying the read content; An optical character reader for reading simultaneously.
【請求項2】フォーマット制御情報を使用することな
く、帳票の表面と裏面のフィールド情報のみ使用して作
成した帳票の表面と裏面のフォーマット制御情報を用い
て、帳票の両面を同時に読み取る請求項1記載の光学的
文字読取り装置。
2. A system according to claim 1, wherein both sides of the form are simultaneously read using format control information of the front and back sides of the form prepared using only the field information of the front and back sides of the form without using the format control information. An optical character reader as described.
【請求項3】帳票の表裏を判別する記号を予め帳票に印
刷することなく、また入力された帳票の各面に対して、
予め作成しておいた表面用のフォーマット制御情報と裏
面用のフォーマット制御情報を切り替える手段を備える
ことなく、帳票の両面を一枚一枚読取るたびに、予め作
成しておいたフォーマット制御情報から表面と裏面の二
つのフォーマット制御情報を作成する手段を備え、その
作成した二つのフォーマット制御情報を用いることによ
り、帳票の表面と裏面が逆にセットされている帳票が混
在している場合でも、的確に帳票の両面を同時に読み取
る請求項1記載の光学的文字読取り装置。
3. A symbol for distinguishing between front and back sides of a form is not printed on the form in advance, and each side of the entered form is
Each time both sides of a form are read, the front-side format control information is read from the front-side format control information without a means for switching between the format control information for the front side and the format control information for the back side prepared in advance. Means for creating two types of format control information, one for the front and the other for the back side. 2. The optical character reader according to claim 1, wherein both sides of the form are read simultaneously.
【請求項4】帳票の表面と裏面のイメージを別々に格納
するバッファと、上記別々に格納されたイメージからフ
ィールドのフィールド情報を抽出する手段と、その抽出
した帳票の表面と裏面のフィールド情報を別々に格納す
るメモリと、フォーマット制御情報から上記別々に格納
された帳票の表面と裏面のフィールド情報を用いて帳票
の表面と裏面の二つのフォーマット制御情報を作成する
手段と、その作成した帳票の表面と裏面のフォーマット
制御情報を別々に格納するメモリと、上記別々に格納さ
れた帳票の表面と裏面のフォーマット制御情報を用いて
上記別々のバッファに貯えられた帳票イメージを認識処
理する手段とを備え、帳票の両面を同時に読み取る請求
項1記載の光学的文字読取り装置。
4. A buffer for separately storing front and back images of a form, means for extracting field information of fields from the separately stored images, and a method for storing the extracted front and back field information of the form. A memory for separately storing, means for creating two format control information of the front and back of the form using the field information of the front and back of the form separately stored from the format control information, A memory for separately storing front and back format control information, and means for recognizing and processing the form images stored in the separate buffers using the separately stored front and back format control information of the form. 2. The optical character reading device according to claim 1, further comprising: reading both sides of the form simultaneously.
【請求項5】予め一枚の帳票の両面を読取らせて、フォ
ーマット制御情報から帳票の表面と裏面の二つのフォー
マット制御情報を作成しておく手段を備え、その作成し
た二つのフォーマット制御情報を用いて、一度に複数の
種類の帳票の両面を同時に読取る請求項1記載の光学的
文字読取り装置。
5. A means for preliminarily reading both sides of one form and preparing two format control information for the front and back sides of the form from the format control information, wherein the two format control information thus prepared are provided. 2. The optical character reading apparatus according to claim 1, wherein both sides of a plurality of types of forms are read at a time by using.
【請求項6】各帳票を読取った結果、読取った文字の修
正が必要な帳票と必要でない帳票、その修正する帳票で
の修正する面が表面か裏面かを見極めるために、帳票に
意味付けした識別文字を印字する手段を備えた請求項1
記載の光学的文字読取り装置。
6. As a result of reading each form, a form is required to correct the read character, a form not requiring the correction, and a form to determine whether the surface to be corrected in the form to be corrected is a front surface or a back surface. 2. A device according to claim 1, further comprising means for printing an identification character.
An optical character reader as described.
【請求項7】大きさの異なる帳票の種類や帳票の表裏を
判別する記号を予め帳票に印刷することなく、入力され
た大きさの異なる帳票の各面に対して、フォーマット制
御情報の中から、帳票を一枚一枚読取るたびに表面用の
フォーマット制御情報と、裏面用のフォーマット制御情
報を抽出して作成する手段を備え、その作成した二つの
フォーマット制御情報を用いることにより、帳票の大き
さが異なる帳票や表裏が逆にセットされている帳票が混
在している場合でも、的確に帳票の両面を同時に読取る
請求項1記載の光学的文字読取装置。
7. The format control information is input to each side of a form having a different size without printing in advance a form for determining the type of the form having a different size or a symbol for distinguishing the front and back of the form. Means for extracting and creating the format control information for the front side and the format control information for the back side each time the form is read, and using the two format control information thus created. 2. The optical character reading apparatus according to claim 1, wherein even when forms having different sizes or forms having opposite sides are mixed, both sides of the form are simultaneously read accurately.
【請求項8】複数の種類の帳票のフォーマット制御情報
をまとめて一つのフォーマット制御情報として作成して
も、その一つのフォーマット制御情報から、複数の種類
の帳票を一枚一枚読取る度に、表面用と裏面用のフォー
マット制御情報を作成する手段を備え、その作成したフ
ォーマット制御情報を用いて、帳票の両面を同時に読取
る請求項1記載の光学的文字読取装置。
8. Even if the format control information of a plurality of types of forms is collectively created as one format control information, each time a plurality of types of forms are read out one by one from the one format control information. 2. The optical character reading device according to claim 1, further comprising means for creating format control information for the front side and the back side, and using the created format control information to simultaneously read both sides of the form.
【請求項9】大きさの異なる帳票の種類や帳票の表裏を
判別する記号を予め帳票に印刷することなく、入力され
た大きさの異なる帳票の各面に対して、フォーマット制
御情報の中から、帳票を一枚一枚読取るたびに表面用の
フォーマット制御情報と、裏面用のフォーマット制御情
報を抽出して作成する手段を有することを特徴とする光
学的文字読取り装置。
9. A method for determining the types of forms having different sizes and symbols for distinguishing the front and back of the forms from the format control information for each side of the forms having different sizes without printing them in advance. An optical character reading apparatus comprising means for extracting and creating format control information for the front side and format control information for the back side each time a form is read one by one.
【請求項10】複数の種類の帳票のフォーマット制御情
報をまとめて一つのフォーマット制御情報として作成し
ても、その一つのフォーマット制御情報から、複数の種
類の帳票を一枚一枚読取る度に、表面用と裏面用のフォ
ーマット制御情報を作成する手段を有することを特徴と
する光学的文字読取り装置。
10. Even when the format control information of a plurality of types of forms is collectively created as one format control information, each time a plurality of types of forms are read out one by one from the one format control information. An optical character reader having means for creating format control information for the front side and the back side.
JP10183656A 1998-06-30 1998-06-30 Optical character reader Pending JP2000020639A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10183656A JP2000020639A (en) 1998-06-30 1998-06-30 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10183656A JP2000020639A (en) 1998-06-30 1998-06-30 Optical character reader

Publications (1)

Publication Number Publication Date
JP2000020639A true JP2000020639A (en) 2000-01-21

Family

ID=16139635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10183656A Pending JP2000020639A (en) 1998-06-30 1998-06-30 Optical character reader

Country Status (1)

Country Link
JP (1) JP2000020639A (en)

Similar Documents

Publication Publication Date Title
JP3962891B2 (en) Document image processing apparatus, document image processing method, and storage medium
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
TW565803B (en) System and method for accurately recognizing text font in a document processing system
EA004418B1 (en) Automatic barcode creation for data transfer and retrieval
JP4574503B2 (en) Image processing apparatus, image processing method, and program
US20080218812A1 (en) Metadata image processing
US7844080B2 (en) Image processing system and image processing method, and computer program
JP2007072642A (en) Image processor and controlling method of image processor
JP2009031937A (en) Form image processing apparatus and form image processing program
US8331736B2 (en) Image processing device and method therefor
US8295602B2 (en) Image processing apparatus and image processing method
JP2000020639A (en) Optical character reader
JP2003046746A (en) Method and apparatus for processing image
JP4501731B2 (en) Image processing device
JPS61253587A (en) Optical character reader
JPH08180133A (en) Image processor
JPH096865A (en) Method and device for generating format information
JPH06111057A (en) Optical character reader
JPH07152856A (en) Optical character reader
JP3006294B2 (en) Optical character reader
JP2022019257A (en) Information processing device, information processing method, and program
JPH03103996A (en) Optical character reader
JPH058670U (en) Optical character reader
JPS6292080A (en) Pattern recognizing device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061023

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070206