JP3154790B2 - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP3154790B2
JP3154790B2 JP05537592A JP5537592A JP3154790B2 JP 3154790 B2 JP3154790 B2 JP 3154790B2 JP 05537592 A JP05537592 A JP 05537592A JP 5537592 A JP5537592 A JP 5537592A JP 3154790 B2 JP3154790 B2 JP 3154790B2
Authority
JP
Japan
Prior art keywords
layout
layout data
data
analysis
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05537592A
Other languages
Japanese (ja)
Other versions
JPH05258098A (en
Inventor
雅也 山成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP05537592A priority Critical patent/JP3154790B2/en
Publication of JPH05258098A publication Critical patent/JPH05258098A/en
Application granted granted Critical
Publication of JP3154790B2 publication Critical patent/JP3154790B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は被読取対象帳票のレイア
ウトを自動解析して得る機能を有する光学的文字読取装
置に係わり、特に自動解析して得たレイアウトデータの
有効利用に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading apparatus having a function of automatically analyzing a layout of a form to be read.
In particular, it relates to effective use of layout data obtained by automatic analysis.

【0002】[0002]

【従来の技術】従来この種の光学的文字読取装置(OC
R)において、被読取帳票のレイアウトデータはフォー
マットコントロールで与えられるのではなく、前記帳票
を読み取って得たイメージデータをレイアウト解析して
求め、こうして求められたレイアウトデータに従って前
記イメージデータから文字を切り出して文字認識するこ
とが行われる。しかも、前記レイアウト解析は被読取対
象帳票毎に行われるため、レイアウト解析によって得ら
れたレイアウトデータは保存されず、被読取対象となる
複数枚の帳票が全て同一のレイアウトを持っていても、
その度ごとに同一のレイアウト解析処理を繰り返してい
た。このため、一度得られたレイアウトデータの有効利
用がなされず、同一レイアウトの帳票の文字認識を行う
場合は、帳票毎に前記レイアウト解析処理をする必要が
あり、この分、前記文字認識処理の効率が悪化するとい
う欠点があった。又、上記のようなレイアウト解析によ
って得られたレイアウトデータを照合したり、或いはコ
ピーしたり、更に一部を変更したりすることにより、新
たなレイアウトデータを作り出してこれを利用する等と
いうことは全く行われておらず、この面からも前記レイ
アウトデータの有効利用はなされていなかった。
2. Description of the Related Art Conventionally, an optical character reader (OC) of this type is used.
In R), the layout data of the form to be read is not given by the format control, but is obtained by analyzing the layout of the image data obtained by reading the form, and characters are cut out from the image data according to the layout data thus obtained. Character recognition. Moreover, since the layout analysis is performed for each form to be read, the layout data obtained by the layout analysis is not stored, and even if a plurality of forms to be read all have the same layout,
The same layout analysis processing was repeated each time. Therefore, when the layout data obtained once is not effectively used, and when character recognition is performed on a form having the same layout, the layout analysis processing needs to be performed for each form, and the efficiency of the character recognition processing is accordingly reduced. However, there was a drawback that it deteriorated. Also, it is not possible to collate or copy the layout data obtained by the layout analysis as described above, or to further modify a part of the layout data to create new layout data and use it. The layout data has not been used at all, and the layout data has not been effectively used from this aspect.

【0003】[0003]

【発明が解決しようとする課題】上記のように被読取対
象帳票のレイアウトを帳票毎に解析して、得られたレイ
アウトデータに基づいて、前記帳票の文字認識を行う従
来の光学的文字読取装置では、一度得られたレイアウト
データを保存することがなく、複数枚の被読取対照帳票
が同一レイアウトを有していても、帳票毎に前記レイア
ウト解析処理を行うため、一度得られたレイアウトデー
タの有効利用がなされず、同一レイアウト帳票の文字認
識を行う場合も、帳票毎にレイアウト解析を行う必要が
あり、この分、処理効率が悪化するという欠点があっ
た。又、上記のようなレイアウト解析によって得られた
レイアウトデータを照合したり、或いはコピーしたり、
更には一部を変更したりすることにより、新たなレイア
ウトデータを作り出してこれを利用する等ということは
全く行われておらず、この面からも前記レイアウトデー
タの有効利用はなされていなかった。
As described above, a conventional optical character reading apparatus which analyzes the layout of a form to be read for each form and performs character recognition of the form based on the obtained layout data. In this case, the layout data obtained once is not stored, and even if a plurality of read-out control forms have the same layout, the layout analysis processing is performed for each form. Even in the case where character recognition of the same layout form is performed without effective use, layout analysis must be performed for each form, and there is a drawback that the processing efficiency deteriorates accordingly. Also, the layout data obtained by the layout analysis as described above can be collated or copied,
Further, no new layout data is created and used by changing a part of the layout data, and the layout data is not effectively used from this aspect.

【0004】そこで本発明は上記の欠点を除去するもの
で、一度レイアウト解析によって得たレイアウトデータ
を保存して他の帳票の読取時に使用できるようにするこ
とができ、或いはレイアウトデータを編集して新たなレ
イアウトデータを作成して、これを文字認識に使用こと
によりレイアウトデータの有効利用を図ることができる
光学的文字読取装置を提供することを目的としている。
Therefore, the present invention eliminates the above-mentioned disadvantages, and can save layout data once obtained by layout analysis so that it can be used when reading another form, or edit layout data. Create new layout data and use it for character recognition
Enables effective use of layout data
It is an object to provide an optical character reading device .

【0005】[0005]

【課題を解決するための手段】本発明に係る光学的文字
読取装置は、帳票上のイメージを光電変換してイメージ
データを出力する光電変換手段と、前記イメージデータ
をレイアウト解析してレイアウトデータを出力するレイ
アウト解析手段と、レイアウトデータを記憶する記憶手
段と、前記光電変換手段から出力されたイメージデータ
を前記記憶手段に記憶されているレイアウトデータを用
いて文字認識するのかまたは前記レイアウト解析手段に
て解析して求めたレイアウトデータを用いて文字認識す
るのかを指定する第1の指定手段と、前記第1の指定手
段の指定結果に基づいて指定されたレイアウトデータを
用いて前記光電変換手段から出力されたイメージデータ
から文字部分を切り出して文字認識する文字認識手段
と、前記レイアウト解析手段から出力されたレイアウト
データを前記記憶手段に記憶することを指定する第2の
指定手段と、この第2の指定手段の指定に基づいて前記
レイアウト解析手段から出力されたレイアウトデータを
前記記憶手段に記憶させるレイアウトデータ記憶制御手
段と、前記記憶手段に記憶されているレイアウトデータ
に対して編集処理を施して新たなレイアウトデータを作
成し前記記憶手段に記憶させる編集手段とを具備したこ
とを特徴とする。
An optical character reading apparatus according to the present invention performs photoelectric conversion of an image on a form and converts the image into an image.
Photoelectric conversion means for outputting data, and the image data
Layout analysis and layout data output
Out analysis means and a storage device for storing layout data
And image data output from the photoelectric conversion means.
Using the layout data stored in the storage means.
To recognize the characters, or to the layout analysis means.
Character recognition using layout data
First designating means for designating whether or not the first designation
Layout data specified based on the result of column specification
Image data output from the photoelectric conversion means using
Character Recognition Method for Recognizing Characters by Cutting Characters from
And the layout output from the layout analysis means.
A second instruction for storing data in the storage means;
Specifying means, based on the specification of the second specifying means,
Layout data output from layout analysis means
Layout data storage control means for storing in the storage means
Steps and layout data stored in the storage means
Edit data to create new layout data.
And editing means for storing the information in the storage means.
And features.

【0006】[0006]

【作用】本発明の光学的文字読取装置においては、光電
変換手段から出力されたイメージデータを、記憶手段に
記憶されているレイアウトデータを用いて文字認識する
のかまたはレイアウト解析手段にて解析して求めたレイ
アウトデータを用いて文字認識するのかを、第1の指定
手段から指定でき、指定されたレイアウトデータを用い
てイメージデータから文字部分を切り出して文字認識が
なされる。また、レイアウト解析手段から出力されたレ
イアウトデータを記憶手段に記憶することを指定する第
2の指定手段の指定に基づいてレイアウト解析手段から
出力されたレイアウトデータが前記記憶手段に記憶れ、
記憶手段に記憶されているレイアウトデータに対して編
集処理を施して新たなレイアウトデータが作成され記憶
手段に記憶される。
According to the optical character reading apparatus of the present invention , the photoelectric
The image data output from the conversion means is stored in the storage means.
Character recognition using stored layout data
Or a ray obtained by analysis using layout analysis means
First designation whether to recognize characters using out data
You can specify from the means, using the specified layout data
Cut out the character part from the image data
Done. Also, the report output from the layout analysis means
No. designating that the layout data is stored in the storage means.
From the layout analysis means based on the specification of the specification means 2
The output layout data is stored in the storage means,
Edit the layout data stored in the storage means
New layout data created and stored
Stored in the means.

【0007】[0007]

【実施例】以下、本発明の一実施例を図面を参照して説
明する。図1は本発明の光学的文字読取装置の一実施例
を示したブロック図である。1は帳票上の文字や図形を
光電変換して前記文字や図形のイメージデータを得る光
学的文字読取部、2は前記イメージデータのレイアウト
解析を行って、被読取帳票のレイアウトデータを得るレ
イアウト解析部、3は被読取帳票のレイアウトデータに
基づいて、前記イメージデータから文字部分を切り出し
て文字認識を行う文字認識処理部、4は文字認識処理部
3の文字認識結果やレイアウトデータ等を表示する表示
装置(CRT等)、5はレイアウト解析部2にて得られ
たレイアウトデータを入力部11からの指示により変更
するレイアウト変更処理部、6はレイアウト解析部2に
て得られたレイアウトデータや編集されたレイアウトデ
ータ等を保存するレイアウトデータファイル、7はレイ
アウトデータファイル6に対するレイアウトデータの読
み書き制御を行うレイアウトデータファイル制御部、8
はレイアウトデータファイル6に保存されているレイア
ウトデータに対して各種編集処理を施すレイアウト編集
部、9は帳票の文字認識結果を保存するデータファイ
ル、10はデータファィル9に対するデータの読み書き
制御を行うデータファイル制御部、11はオペレータに
より各種のデータや動作指示等が入力される入力部であ
る。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing one embodiment of the optical character reading apparatus of the present invention. 1 is an optical character reading unit that photoelectrically converts characters and figures on a form to obtain image data of the characters and figures, and 2 is a layout analysis that performs layout analysis of the image data and obtains layout data of a form to be read. A character recognition processing unit for extracting a character portion from the image data based on the layout data of the form to be read and performing character recognition; and a display unit for displaying a character recognition result of the character recognition processing unit 3 and layout data. A display device (such as a CRT) 5 is a layout change processing unit that changes the layout data obtained by the layout analysis unit 2 according to an instruction from the input unit 11, and 6 is a layout change processing unit that edits the layout data obtained by the layout analysis unit 2. 7 is a layout data file for storing the layout data and the like. The layout data file control unit for controlling reading and writing of data, 8
Reference numeral 9 denotes a layout editing unit for performing various editing processes on layout data stored in the layout data file 6, reference numeral 9 denotes a data file for storing character recognition results of a form, and reference numeral 10 denotes data for controlling reading / writing of data from / to the data file 9. The file control unit 11 is an input unit into which various data and operation instructions are input by an operator.

【0008】次に本実施例の動作について説明する。ま
ず、レイアウトデータファイル6にレイアウトデータが
全く保存されていないものとする。この場合、光学的文
字読取部1は帳票(図示せず)を読み取ってイメージデ
ータを得ると、これをレイアウト解析部2に出力するた
め、レイアウト解析部2は入力されるイメージデータか
ら前記帳票のレイアウトを解析してレイアウトデータを
得る。文字認識処理部3はレイアウト解析部2により得
られたレイアウトデータを表示装置4に表示する。オペ
レータはこれを見て、よければ文字認識処理の指示を入
力部11から与え、前記レイアウトデータではまずい場
合は入力部11を操作してレイアウト変更処理部5によ
り前記レイアウトデータを変更した後、文字認識指示を
出す。その後、文字認識処理部3は前記レイアウトデー
タに基づいて、光学的文字読取部1が読み取ったイメー
ジデータから文字部分を切り出してこれを認識し、その
認識結果を表示装置4に出力すると共に、前記レイアウ
トデータをレイアウトデータファイル制御部7を介して
レイアウトデータファイル6に保存する。表示装置4は
前記帳票の文字認識結果を表示する。尚、文字認識処理
部3はレイアウト解析部2から得られたレイアウトデー
タを表示装置4に表示することなく、前記レイアウトデ
ータを使って直ちに文字認識処理を行うようにすること
もできる。
Next, the operation of this embodiment will be described. First, it is assumed that no layout data is stored in the layout data file 6. In this case, when the optical character reading unit 1 reads a form (not shown) and obtains image data, the image data is output to the layout analyzing unit 2, so that the layout analyzing unit 2 converts the input image data into a form of the form. Analyze the layout to obtain layout data. The character recognition processing unit 3 displays the layout data obtained by the layout analysis unit 2 on the display device 4. The operator sees this, and if so, gives an instruction for character recognition processing from the input unit 11. If the layout data is not good, the operator operates the input unit 11 to change the layout data by the layout change processing unit 5, Give a recognition instruction. Thereafter, based on the layout data, the character recognition processing section 3 cuts out a character portion from the image data read by the optical character reading section 1 and recognizes it, outputs the recognition result to the display device 4, and outputs the recognition result to the display device 4. The layout data is stored in the layout data file 6 via the layout data file control unit 7. The display device 4 displays the character recognition result of the form. Note that the character recognition processing unit 3 can immediately perform a character recognition process using the layout data without displaying the layout data obtained from the layout analysis unit 2 on the display device 4.

【0009】図2は上記したような本例の光学的文字読
取装置による帳票の文字認識処理を示したフローチャー
トである。まず、ステップ201にて入力部11からの
オペレータの指示等に基づいて、レイアウトデータとし
てレイアウト解析を行って得たものを使用するのか、或
いはレイアウトデータファイル6に既に保存されている
レイアウトデータを使用するのかを判断し、レイアウト
解析を行う場合はステップ202に進み、レイアウトデ
ータファイル6のレイアウトデータを使用する場合はス
テップ203へ進む。ステップ202に進んだ場合、上
記したレイアウト解析部2により帳票のイメージデータ
からレイアウトデータが解析されて、これが文字認識処
理部3に与えられる。一方、ステップ203へ進んだ場
合、レイアウトデータファイル6から指定のレイアウト
データがレイアウトデータファイル制御部7を介して読
み出され、これが文字認識処理部3に与えられる。文字
認識処理部3は与えられたレイアウトデータを表示装置
4に表示するため、ステップ204では、表示されたレ
イアウトデータがこれでよいかどうかの確認処理を行
い、よい場合はステップ205に進み、駄目な場合はス
テップ201の処理に戻る。ステップ205にて文字認
識処理部3は与えられたレイアウトデータに基づいて光
学的文字読取部1により得られたイメージデータから文
字部分を切り出して認識処理を行い、ステップ206に
てその結果を表示装置7に表示する。オペレータはこの
表示装置7の表示を見て、現在用いられているレイアウ
トデータを保存するか否かを判断し、その判断結果を入
力部11から入力する。このため、ステップ207では
レイアウトデータを保存するか否かを判断し、保存する
場合はステップ208に進み、保存しない場合はステッ
プ209に進む。ステップ208にて、文字認識処理部
3はレイアウトデータをレイアウトデータファイル制御
部7を介してレイアウトデータファイル6に保存した
後、ステップ209に進む。ステップ209にて文字認
識処理部3は得られた文字認識結果をデータファイル制
御部10を介してデータファイル9に出力した後、ステ
ップ210に進む。ステップ210では次に読み取るべ
き帳票があるかないかを判定し、ない場合は処理を終了
し、ある場合はステップ211へ進む。ステップ211
では入力部11からレイアウトデータの変更指示が入っ
たか否かを判定し、入らない場合はステップ205の処
理へ戻り、入った場合はステップ201の処理へ戻る。
FIG. 2 is a flowchart showing a form character recognition process by the optical character reading apparatus of the present embodiment as described above. First, in step 201, layout data obtained by performing layout analysis is used as the layout data based on an instruction of the operator from the input unit 11, or layout data already stored in the layout data file 6 is used. It is determined whether to perform the layout analysis. If the layout analysis is to be performed, the process proceeds to step 202. If the layout data of the layout data file 6 is used, the process proceeds to step 203. When the process proceeds to step 202, the layout analysis unit 2 analyzes the layout data from the image data of the form, and supplies the layout data to the character recognition processing unit 3. On the other hand, when the process proceeds to step 203, the specified layout data is read out from the layout data file 6 via the layout data file control unit 7 and supplied to the character recognition processing unit 3. In order to display the given layout data on the display device 4, the character recognition processing unit 3 checks in step 204 whether or not the displayed layout data is acceptable. If not, the process returns to step 201. In step 205, the character recognition processing section 3 cuts out a character portion from the image data obtained by the optical character reading section 1 based on the given layout data and performs recognition processing. In step 206, the result is displayed on a display device. 7 is displayed. The operator sees the display on the display device 7 and determines whether or not to save the currently used layout data, and inputs the determination result from the input unit 11. Therefore, in step 207, it is determined whether or not to save the layout data. If so, the process proceeds to step 208; otherwise, the process proceeds to step 209. In step 208, the character recognition processing unit 3 stores the layout data in the layout data file 6 via the layout data file control unit 7, and then proceeds to step 209. In step 209, the character recognition processing unit 3 outputs the obtained character recognition result to the data file 9 via the data file control unit 10, and then proceeds to step 210. In step 210, it is determined whether there is a form to be read next. If not, the process ends. If there is, the process proceeds to step 211. Step 211
Then, it is determined whether or not an instruction to change the layout data has been received from the input unit 11. If not, the process returns to step 205, and if so, the process returns to step 201.

【0010】図3は上記した装置で帳票を読み取ってレ
イアウト解析することにより得られたレイアウトデータ
の編集処理例を示した図である。光学的文字読取部1に
よって読み取った帳票のイメージデータをレイアウト解
析部2にて解析して得たレイアウトデータは、前述した
如く文字認識処理部3を介してレイアウトデータファイ
ル6に保存される。図3(A)、(B)及び(C)はこ
のようにして保存された1枚目の帳票のレイアウト、2
枚目の帳票のレイアウト及び3枚目の帳票のレイアウト
を示している。例えばオペレータが入力部11から図3
(A)に示したレイアウトデータに対してコピー処理を
レイアウト編集部8に指定すると、レイアウト編集部8
はレイアウトデータファイル6からレイアウトデータフ
ァイル制御部7を介して図3(A)に示すようなレイア
ウトデータを読み出し、これを図3(D)の如くコピー
し、このコピーした図3(D)に示したレイアウトデー
タをレイアウトデータファイル制御部7を介してレイア
ウトデータファイル6に書き込む。その際、レイアウト
編集部8はレイアウトデータファイル6から読み出して
図3(A)に示したレイアウトデータを表示装置4に表
示するため、オペレータはこの表示レイアウトを見て上
記したコピー指示を入力部11から出すものとする。
FIG. 3 is a diagram showing an example of editing processing of layout data obtained by reading a form and analyzing the layout by the above-described device. The layout data obtained by analyzing the image data of the form read by the optical character reading unit 1 by the layout analysis unit 2 is stored in the layout data file 6 via the character recognition processing unit 3 as described above. FIGS. 3A, 3B, and 3C show the layout of the first form stored in this manner.
The layout of the third form and the layout of the third form are shown. For example, when the operator inputs the
When a copy process is designated to the layout editing unit 8 for the layout data shown in FIG.
3A reads out the layout data as shown in FIG. 3A from the layout data file 6 via the layout data file control unit 7 and copies it as shown in FIG. 3D. The layout data shown is written to the layout data file 6 via the layout data file control unit 7. At this time, the layout editing unit 8 reads out the layout data from the layout data file 6 and displays the layout data shown in FIG. 3A on the display device 4. Shall be issued from

【0011】次にオペレータは図3(B)、(C)に示
すようなレイアウトデータの表示指示を入力部11から
レイアウト編集部8に与えると、レイアウト編集部8は
上記した図3(B)、(C)に示すようなレイアウトデ
ータをレイアウトデータファイル制御部7を介してレイ
アウトデータファイル6から読み出して、これらレイア
ウトを表示装置4に表示する。オペレータはこの表示装
置4の画面上の2つのレイアウトを見て、図3(B)に
示したレイアウトからロの部分を消去すると共に図3
(C)に示したレイアウトのハの部分を消去する指示を
出し、更にこれらレイアウトデータを合成する指示を入
力部11からレイアウト編集部8に出す。これにより、
レイアウト編集部8は上記した指示を実行し、図3
(E)に示した編集レイアウトを表示装置4に表示す
る。この表示装置4に当初表示されたレイアウトはニの
部分が破線の位置にあるため、オペレータは入力部11
からニの部分を実線の部分に移動させる指示をレイアウ
ト編集部8に出す。これにより、レイアウト編集部8は
表示装置4に図3(E)の実線で示した編集レイアウト
を最終的に表示した後、これをレイアウトデータファイ
ル制御部7を介してレイアウトデータファイル6に保存
する。
Next, when the operator gives a layout data display instruction as shown in FIGS. 3B and 3C from the input unit 11 to the layout editing unit 8, the layout editing unit 8 performs the above-described processing shown in FIG. , (C) are read from the layout data file 6 via the layout data file control unit 7, and these layouts are displayed on the display device 4. The operator looks at the two layouts on the screen of the display device 4 and deletes the part B from the layout shown in FIG.
An instruction to delete the C portion of the layout shown in (C) is issued, and an instruction to combine these layout data is issued from the input unit 11 to the layout editing unit 8. This allows
The layout editing unit 8 executes the above-described instruction, and
The editing layout shown in (E) is displayed on the display device 4. In the layout initially displayed on the display device 4, since the portion of “d” is located at the position indicated by the broken line, the operator inputs
Is issued to the layout editing unit 8. As a result, the layout editing unit 8 finally displays the editing layout indicated by the solid line in FIG. 3E on the display device 4, and then saves the editing layout in the layout data file 6 via the layout data file control unit 7. .

【0012】本実施例によれば、帳票を読み取った後レ
イアウト解析して得たレイアウトデータをレイアウトデ
ータファイル6に保存することができるため、他の帳票
が同一のレイアウトであった場合はこれら帳票の文字認
識に際して、レイアウトデータファイル6に保存した前
記レイアウトデータを繰り返し使用することができ、帳
票を読む度にレイアウト解析を行う必要をなくして、そ
の分、効率的な文字認識処理を行うことができる。又、
上記の如くしてレイアウト解析をして得た複数のレイア
ウトデータの中の任意のレイアウトデータをレイアウト
データファイル6から読み出して、これに編集処理を施
して新たなレイアウトデータを作成した後、これをレイ
アウトデータファイル6に保存できるため、帳票の文字
認識に際して、前記編集処理をして得た新たなレイアウ
トデータを用いることができ、一度レイアウト解析して
得たレイアウトデータの有効利用を図ることができる。
According to this embodiment, the layout data obtained by reading the form and analyzing the layout can be stored in the layout data file 6. Therefore, when other forms have the same layout, In the character recognition described above, the layout data stored in the layout data file 6 can be used repeatedly, eliminating the necessity of performing layout analysis every time the form is read, and performing an efficient character recognition process accordingly. it can. or,
Arbitrary layout data among the plurality of layout data obtained by performing the layout analysis as described above is read from the layout data file 6 and subjected to editing processing to create new layout data. Since the layout data can be stored in the layout data file 6, the new layout data obtained by the editing process can be used for character recognition of the form, and the layout data obtained by the layout analysis once can be effectively used. .

【0013】[0013]

【発明の効果】以上記述した如く本発明の光学的文字読
取装置によれば、一度レイアウト解析によつて得たレイ
アウトデータを保存して他の帳票の読取時に使用できる
ようにすることにより、或いは保存されたレイアウトデ
ータを編集して新たなレイアウトデータを作成して、こ
れを文字認識に使用することにより、レイアウトデータ
の有効利用を図ることができる。
As described above, the optical character reading of the present invention is performed.
According to the reading device, new layout data is created by saving the layout data once obtained by the layout analysis so that it can be used when reading another form , or by editing the saved layout data. Then, by using this for character recognition , the layout data can be effectively used.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の光学的文字読取装置の一実施例を示し
たブロック図。
FIG. 1 is a block diagram showing an embodiment of an optical character reading apparatus according to the present invention.

【図2】図1に示した光学的文字読取装置による帳票の
文字認識処理を示したフローチャート。
FIG. 2 is a flowchart showing a form character recognition process performed by the optical character reading apparatus shown in FIG. 1;

【図3】図1に示した光学的文字読取装置で帳票のレイ
アウト解析することにより得られたレイアウトデータの
編集処理例を示した図。
FIG. 3 is a diagram showing an example of editing processing of layout data obtained by analyzing the layout of a form using the optical character reading apparatus shown in FIG. 1;

【符号の説明】[Explanation of symbols]

1…光学的文字読取部 2…レイアウ
ト解析部 3…文字認識処理部 4…表示装置 5…レイアウト変更処理部 6…レイアウ
トデータファイル 7…レイアウトデータファイル制御部 8…レイアウ
ト編集部 9…データファイル 10…データ
ファイル制御部 11…入力部
REFERENCE SIGNS LIST 1 optical character reading unit 2 layout analysis unit 3 character recognition processing unit 4 display device 5 layout change processing unit 6 layout data file 7 layout data file control unit 8 layout editing unit 9 data file 10 ... data file control unit 11 ... input unit

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 帳票上のイメージを光電変換してイメー
ジデータを出力する光電変換手段と、 前記イメージデータをレイアウト解析してレイアウトデ
ータを出力するレイアウト解析手段と、 レイアウトデータを記憶する記憶手段と、 前記光電変換手段から出力されたイメージデータを前記
記憶手段に記憶されているレイアウトデータを用いて文
字認識するのかまたは前記レイアウト解析手段にて解析
して求めたレイアウトデータを用いて文字認識するのか
を指定する第1の指定手段と、 前記第1の指定手段の指定結果に基づいて指定されたレ
イアウトデータを用いて前記光電変換手段から出力され
たイメージデータから文字部分を切り出して文字認識す
る文字認識手段と、 前記レイアウト解析手段から出力されたレイアウトデー
タを前記記憶手段に記憶することを指定する第2の指定
手段と、 この第2の指定手段の指定に基づいて前記レイアウト解
析手段から出力されたレイアウトデータを前記記憶手段
に記憶させるレイアウトデータ記憶制御手段と、 前記記憶手段に記憶されているレイアウトデータに対し
て編集処理を施して新たなレイアウトデータを作成し前
記記憶手段に記憶させる編集手段と を具備したことを特
徴とする 光学的文字読取装置。
An image on a form is photoelectrically converted to an image.
A photoelectric conversion means for outputting digital data, and a layout data by analyzing the layout of the image data.
Layout analysis means for outputting data, storage means for storing layout data, and image data output from the photoelectric conversion means.
Sentences using layout data stored in the storage means
Character recognition or analysis by the layout analysis means
Character recognition using layout data obtained
A first designating means for designating an item and a report designated on the basis of a designation result of the first designating means.
Output from the photoelectric conversion means using the layout data.
Cut out character parts from image data
Character recognition means, and layout data output from the layout analysis means.
Second specification for specifying that data is stored in the storage means.
Means and the layout solution based on the designation of the second designation means.
Storing the layout data output from the analyzing means in the storage means
And a layout data storage control means for storing the layout data stored in the storage means.
Before editing to create new layout data
JP by comprising a edit unit to be stored in the serial storage means
Optical character reader according to symptoms.
JP05537592A 1992-03-13 1992-03-13 Optical character reader Expired - Fee Related JP3154790B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05537592A JP3154790B2 (en) 1992-03-13 1992-03-13 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05537592A JP3154790B2 (en) 1992-03-13 1992-03-13 Optical character reader

Publications (2)

Publication Number Publication Date
JPH05258098A JPH05258098A (en) 1993-10-08
JP3154790B2 true JP3154790B2 (en) 2001-04-09

Family

ID=12996744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05537592A Expired - Fee Related JP3154790B2 (en) 1992-03-13 1992-03-13 Optical character reader

Country Status (1)

Country Link
JP (1) JP3154790B2 (en)

Also Published As

Publication number Publication date
JPH05258098A (en) 1993-10-08

Similar Documents

Publication Publication Date Title
US4716404A (en) Image retrieval method and apparatus using annotations as guidance information
JPS60134357A (en) Picture file registering and retrieving system
JPS6290753A (en) Documentation device
JP3288460B2 (en) Display data generation apparatus and method
JP3154790B2 (en) Optical character reader
JP2001273509A (en) Method and device for editing document picture
JP2752667B2 (en) Curve editing method of figure editing device
JPH05314108A (en) Document editor
JPH01211072A (en) Form processor
JPH0520495A (en) Image processor
JPH09251547A (en) Document image management device and document image management method
JPH02228726A (en) Picture processing device
JPH08335249A (en) Document reader
JPH06215096A (en) Menu selecting/displaying method in image processing system
JPH08286866A (en) Edit method for presentation board
JPH0512261A (en) Document processor
JPH06236371A (en) Coupling device
JPS63174161A (en) Document processor
JPH0528145A (en) Retrieval/deletion and blank processing method for word processor
JPH05342405A (en) Method and device for editing document
JPH0520493A (en) Image processor
JPS6324367A (en) Image processing method
JPH03266068A (en) Automatic reduction processing system for table block
JPS60247293A (en) Character space specifying system
JPH05110810A (en) Picture editing device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010116

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080202

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090202

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100202

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100202

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110202

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120202

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees