JPH11250177A - Document reader - Google Patents

Document reader

Info

Publication number
JPH11250177A
JPH11250177A JP10049673A JP4967398A JPH11250177A JP H11250177 A JPH11250177 A JP H11250177A JP 10049673 A JP10049673 A JP 10049673A JP 4967398 A JP4967398 A JP 4967398A JP H11250177 A JPH11250177 A JP H11250177A
Authority
JP
Japan
Prior art keywords
image data
character
character frame
input
input image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10049673A
Other languages
Japanese (ja)
Inventor
Motomitsu Kikuchi
基充 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10049673A priority Critical patent/JPH11250177A/en
Publication of JPH11250177A publication Critical patent/JPH11250177A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a document reader capable of easily executing correction processing for a recognition result. SOLUTION: The input image data S1 of a document P are sent from a scanner part 1 to an image input part 22. The data S1 are entered into the input part 22 and stored in a memory 40. An image data recognition part 23 executes character recognition processing for the data S1 stored in the memory 40 and outputs a recognition result. The recognition result is sent to a monitor 51 through a picture display part 26 and displayed on the monitor 51. An operator displays the data S1 on the monitor 51 as a guide for correcting the recognition result. In this case, a character frame extraction part 25 extracts a character frame from the data S1 and a character frame conversion part 25 deletes the character frame. Then an image obtained by removing the character frame from the data S1 is displayed on the monitor 51. The operator executes correction processing by collating each character displayed on the monitor 51 with the recognition result.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、例えば、所定のフ
ォーマットの伝票等のような文字枠中に文字が記載され
た帳票の文書画像を認識し、その認識結果に対する修正
処理が容易にできるようにした文書読取装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention recognizes a document image of a form in which characters are described in a character frame such as a slip of a predetermined format, and makes it possible to easily correct the recognition result. The present invention relates to a document reading apparatus described above.

【0002】[0002]

【従来の技術】図2は、文字枠中に文字が記載された帳
票の文書の例を示す図である。この図では、例えば、所
定のフォーマットの伝票等のように、文字枠F中に文字
(例えば、「0、1、2、…」)が記載されている。更
に、図3は、図2の文書を従来の文書読取装置で読取っ
たときの表示部の表示画面の一例を示す図である。この
図では、図2の文書を従来の文書読取装置で取込んだと
きの入力画像V1と、入力画像V1中の文字の認識結果
R1とが表示されている。
2. Description of the Related Art FIG. 2 is a diagram showing an example of a form document in which characters are described in a character frame. In this figure, characters (for example, “0, 1, 2,...”) Are described in a character frame F, such as a slip in a predetermined format. FIG. 3 is a diagram showing an example of a display screen of the display unit when the document of FIG. 2 is read by a conventional document reading apparatus. In this figure, an input image V1 when the document shown in FIG. 2 is read by a conventional document reading apparatus and a recognition result R1 of characters in the input image V1 are displayed.

【0003】従来の文書読取装置では、図2の文書の入
力画像データが画像入力部に取込まれ、この入力画像デ
ータ中の文字パターンが画像データ認識部で認識され
る。又、入力画像データ中の文字枠Fは、文字枠抽出部
で抽出される。入力画像データ中の文字、文字枠F及び
文字の認識結果は、表示部で表示される。この表示部で
は、図3に示すように、入力画像V1中に各文字と共に
文字枠Fが一緒に表示されている。認識結果R1中に
は、修正処理の対象になる文字の位置にカーソルCが表
示されている。オペレータは、入力画像V1中の文字と
認識結果R1中の文字とをそれぞれ照合し、不一致の場
合には入力部を操作してカーソルCを不一致の文字の位
置に移動させ、修正信号を入力する。修正信号が入力さ
れたとき、不一致の文字を入力画像V1中の文字に一致
させるように修正処理が行われる。
In a conventional document reading apparatus, input image data of the document shown in FIG. 2 is taken into an image input section, and a character pattern in the input image data is recognized by an image data recognition section. The character frame F in the input image data is extracted by the character frame extracting unit. The recognition result of the character, the character frame F, and the character in the input image data is displayed on the display unit. In this display section, as shown in FIG. 3, a character frame F is displayed together with each character in the input image V1. In the recognition result R1, a cursor C is displayed at a position of a character to be corrected. The operator compares the character in the input image V1 with the character in the recognition result R1, and in the case of a mismatch, operates the input unit to move the cursor C to the position of the mismatched character and inputs a correction signal. . When a correction signal is input, a correction process is performed so that a mismatched character matches a character in the input image V1.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
文書読取装置では、認識結果に対する修正作業を行う場
合、図3に示すように、表示画面中の入力画像V1に各
文字と共に文字枠Fが一緒に表示される。そのため、オ
ペレータが入力画像V1中の文字と認識結果R1中の文
字とを照合する場合、入力画像V1が非常に見にくいの
で、修正作業の効率が低下するという課題があった。
However, in the conventional document reading apparatus, when correcting the recognition result, as shown in FIG. 3, a character frame F is put together with each character in the input image V1 on the display screen. Will be displayed. Therefore, when the operator checks the characters in the input image V1 and the characters in the recognition result R1, the input image V1 is very difficult to see, and there is a problem that the efficiency of the correction work is reduced.

【0005】[0005]

【課題を解決するための手段】前記課題を解決するため
に、本発明のうちの請求項1に係る発明は、文書読取装
置において、文字枠中に文字が記載された文書の入力画
像データを取込む画像入力手段と、前記画像入力手段で
取込まれた入力画像データに含まれる1つ又は複数の文
字パターンをそれぞれ囲む文字領域を切出し、該文字パ
ターンを認識して認識結果を出力する画像データ認識手
段と、前記画像入力手段で取込まれた入力画像データか
ら前記文字枠を抽出する文字枠抽出手段と、前記抽出さ
れた文字枠の全部又は任意の部分を該文字枠とは異なる
色の照合用文字枠に変換するか又は該部分を削除して変
換・削除結果を出力する文字枠変換・削除手段と、前記
入力画像データ中の文字、変換・削除結果及び認識結果
を表示する表示手段と、前記表示手段で表示された入力
画像データ中の文字と認識結果とが不一致の場合、オペ
レータの操作に基づいて修正信号を入力する修正入力手
段と、前記修正信号が入力されたとき、前記表示手段で
表示された認識結果を前記入力画像データ中の文字に一
致させる修正処理を行う制御手段とを、備えている。
According to a first aspect of the present invention, there is provided a document reading apparatus for converting input image data of a document in which characters are described in a character frame. An image input unit to be captured, and an image to cut out a character area surrounding each of one or more character patterns included in the input image data captured by the image input unit, recognize the character pattern, and output a recognition result Data recognizing means, character frame extracting means for extracting the character frame from the input image data captured by the image input means, and all or any part of the extracted character frame having a color different from the character frame A character frame conversion / deletion means for converting or deleting the part to output a conversion / deletion result, and a display for displaying characters in the input image data, conversion / deletion result, and recognition result hand When the character in the input image data displayed on the display means and the recognition result do not match, a correction input means for inputting a correction signal based on an operation of an operator, and when the correction signal is input, And control means for performing a correction process for matching the recognition result displayed on the display means with characters in the input image data.

【0006】このような構成を採用したことにより、文
字枠中に文字が記載された文書の入力画像データが画像
入力手段に取込まれる。この入力画像データは、画像デ
ータ認識手段で文字領域が切出され、文字パターンが認
識されて認識結果が出力される。又、前記画像入力手段
で取込まれた入力画像データは、文字枠抽出手段で文字
枠が抽出される。この抽出された文字枠は、文字枠変換
・削除手段でその全部又は任意の部分が該文字枠とは異
なる色の照合用文字枠に変換されるか又は該部分が削除
され、該文字枠変換・削除手段から変換・削除結果が出
力される。前記入力画像データ中の文字、変換・削除結
果及び認識結果は、表示手段に表示される。オペレータ
は、表示手段に表示された入力画像データ中の文字と認
識結果とを照合し、不一致の場合、修正入力手段を操作
して修正信号を制御手段へ入力する。制御手段では、修
正信号が入力されると、表示手段に表示された認識結果
が入力画像データ中の文字に一致するように修正処理が
行われる。
By adopting such a configuration, input image data of a document in which a character is described in a character frame is taken into the image input means. A character area is cut out from the input image data by an image data recognizing means, a character pattern is recognized, and a recognition result is output. Further, a character frame is extracted from the input image data captured by the image input means by a character frame extracting means. The extracted character frame is converted by the character frame conversion / deletion means into a collation character frame of a color different from that of the character frame in its entirety or an arbitrary part, or the part is deleted. -The conversion / deletion result is output from the deletion means. The characters in the input image data, the conversion / deletion result, and the recognition result are displayed on a display unit. The operator compares the character in the input image data displayed on the display means with the recognition result, and when they do not match, operates the correction input means to input a correction signal to the control means. When the correction signal is input, the control unit performs a correction process so that the recognition result displayed on the display unit matches a character in the input image data.

【0007】請求項2に係る発明では、文字枠中に文字
が記載された文書の入力画像データを取込む画像入力手
段と、前記入力画像データを記憶する第1の記憶手段
と、前記第1の記憶手段に記憶された入力画像データに
含まれる1つ又は複数の文字パターンをそれぞれ囲む文
字領域を切出し、該文字パターンを認識して認識結果を
出力する画像データ認識手段と、前記認識結果を記憶す
る第2の記憶手段と、前記第1の記憶手段に記憶された
入力画像データから前記文字枠を抽出する文字枠抽出手
段と、前記抽出された文字枠の全部又は任意の部分を該
文字枠とは異なる色の照合用文字枠に変換するか又は該
部分を削除して変換・削除結果を出力する文字枠変換・
削除手段と、前記第1の記憶手段に記憶された入力画像
データ中の文字、変換・削除結果及び前記第2の記憶手
段に記憶された認識結果を表示する表示手段と、前記表
示手段で表示された入力画像データ中の文字と認識結果
とが不一致の場合、オペレータの操作に基づいて修正信
号を入力する修正入力手段と、前記修正信号が入力され
たとき、前記表示手段で表示された認識結果を入力画像
データ中の文字に一致させる修正処理を行う制御手段と
を、備えている。
In the invention according to claim 2, image input means for inputting input image data of a document in which characters are described in a character frame, first storage means for storing the input image data, Image data recognizing means for extracting a character area surrounding one or more character patterns included in the input image data stored in the storage means, recognizing the character pattern and outputting a recognition result, and recognizing the recognition result. Second storage means for storing; character frame extraction means for extracting the character frame from the input image data stored in the first storage means; and all or any part of the extracted character frame being represented by the character Convert to a collation character frame of a color different from the frame, or delete the part and output the conversion / deletion result.
Deletion means, display means for displaying characters in the input image data stored in the first storage means, conversion / deletion results, and recognition results stored in the second storage means, and display by the display means A correction input unit for inputting a correction signal based on an operation of an operator when the character in the input image data does not match the recognition result, and a recognition unit displayed on the display unit when the correction signal is input. And control means for performing a correction process for matching the result with characters in the input image data.

【0008】このような構成を採用したことにより、文
字枠中に文字が記載された文書の入力画像データが画像
入力手段に取込まれる。この入力画像データは、第1の
記憶手段に記憶される。第1の記憶手段に記憶された入
力画像データは、画像データ認識手段で文字領域が切出
され、文字パターンが認識されて認識結果が出力され
る。この認識結果は、第2の記憶手段に記憶される。第
1の記憶手段に記憶された入力画像データは、文字枠抽
出手段で文字枠が抽出される。この抽出された文字枠
は、文字枠変換・削除手段でその全部又は任意の部分が
該文字枠とは異なる色の照合用文字枠に変換されるか又
は該部分が削除され、該文字枠変換・削除手段から変換
・削除結果が出力される。第1の記憶手段に記憶された
入力画像データ中の文字、変換・削除結果及び第2の記
憶手段に記憶された認識結果は、表示手段に表示され
る。オペレータは、表示手段に表示された入力画像デー
タ中の文字と認識結果とを照合し、不一致の場合、修正
入力手段を操作して修正信号を制御手段へ入力する。制
御手段では、修正信号が入力されると、表示手段に表示
された認識結果が入力画像データ中の文字に一致するよ
うに修正処理が行われる。請求項3に係る発明では、請
求項1又は2に係る発明の画像入力手段は、文字枠中に
文字が記載された帳票を走査するスキャナから入力画像
データを取込む構成にしている。
By adopting such a configuration, input image data of a document in which characters are described in a character frame is taken into the image input means. This input image data is stored in the first storage means. From the input image data stored in the first storage means, a character area is cut out by the image data recognition means, the character pattern is recognized, and the recognition result is output. This recognition result is stored in the second storage means. A character frame is extracted from the input image data stored in the first storage means by the character frame extraction means. The extracted character frame is converted by the character frame conversion / deletion means into a collation character frame of a color different from that of the character frame in its entirety or an arbitrary part, or the part is deleted. -The conversion / deletion result is output from the deletion means. Characters in the input image data stored in the first storage means, conversion / deletion results, and recognition results stored in the second storage means are displayed on the display means. The operator compares the character in the input image data displayed on the display means with the recognition result, and when they do not match, operates the correction input means to input a correction signal to the control means. When the correction signal is input, the control unit performs a correction process so that the recognition result displayed on the display unit matches a character in the input image data. According to a third aspect of the present invention, the image input means of the first or second aspect of the present invention is configured to take in input image data from a scanner that scans a form in which characters are described in a character frame.

【0009】このような構成を採用したことにより、入
力画像データはスキャナから出力されて画像入力手段に
取込まれ、請求項1又は2に係る発明と同様の処理が行
われる。請求項4に係る発明では、請求項1又は2に係
る発明の画像入力手段は、通信網に接続されたファクシ
ミリ装置(以下、FAXという)から該通信網を介して
文字枠中に文字が記載された文書の入力画像データを取
込む構成にしている。このような構成を採用したことに
より、入力画像データはFAXから出力され、通信網を
介して画像入力手段に取込まれる。その後、請求項1又
は2に係る発明と同様の処理が行われる。
By adopting such a configuration, the input image data is output from the scanner and taken into the image input means, and the same processing as in the invention according to claim 1 or 2 is performed. According to a fourth aspect of the present invention, the image input means according to the first or second aspect of the present invention includes a facsimile apparatus (hereinafter, referred to as a facsimile) connected to a communication network for writing characters in a character frame via the communication network. It is configured to take in input image data of a written document. By adopting such a configuration, input image data is output from a facsimile and taken into an image input unit via a communication network. After that, the same processing as in the invention according to claim 1 or 2 is performed.

【0010】[0010]

【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示す文書読取装置の
構成図である。この文書読取装置は、スキャナ部1を備
えている。スキャナ部1は、例えば、電荷結合素子(C
CD)センサやアナログ/ディジタル変換回路等からな
る光電変換部を有し、文字枠中に文字が記載された帳票
Pに光を照射して走査し、その反射光を電気信号の入力
画像データS1に変換して出力する機能を有している。
スキャナ部1の出力側には、入力画像データS1を解析
して文字の読取りを行う読取装置本体10が接続されて
いる。読取装置本体10は、入力画像データS1に対す
る認識処理を行うプロセッサ20と、このプロセッサ2
0にデータバス30を介して接続された第1及び第2の
記憶手段(例えば、メモリ)40とを有している。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS First Embodiment FIG. 1 is a block diagram of a document reading apparatus according to a first embodiment of the present invention. This document reading device includes a scanner unit 1. The scanner unit 1 includes, for example, a charge-coupled device (C
CD) a photoelectric conversion unit including a sensor, an analog / digital conversion circuit, and the like, irradiates and scans a form P on which characters are described in a character frame, and uses the reflected light to input image data S1 of an electric signal. It has the function of converting to and outputting.
The output side of the scanner unit 1 is connected to a reading apparatus main body 10 that analyzes input image data S1 and reads characters. The reading device main body 10 includes a processor 20 for performing a recognition process on the input image data S1,
0 and a first storage means (for example, a memory) 40 connected via a data bus 30.

【0011】プロセッサ20は、文書読取プログラムに
従って該プロセッサ20全体を制御する制御部21と、
入力画像データS1を取込み、データバス30を介して
メモリ40の画像記憶領域に送出する画像入力手段(例
えば、画像入力部)22と、画像入力部22で取込まれ
た入力画像データS1に含まれる文字パターンを囲む文
字領域を切出し、この文字パターンを認識してコード化
した認識結果をデータバス30を介してメモリ40の認
識結果記憶領域に送出する画像データ認識手段(例え
ば、画像データ認識部)23とを有している。又、プロ
セッサ20には、画像入力部22で取込まれた入力画像
データS1から文字枠を抽出する文字枠抽出手段(例え
ば、文字枠抽出部)24と、文字枠抽出部24で抽出さ
れた文字枠の全部又は任意の部分を削除して変換・削除
結果を出力する文字枠変換・削除手段(例えば、文字枠
変換部)25と、入力画像データS1中の文字、文字枠
変換部25から出力された変換・削除結果及び画像デー
タ認識部23から出力された認識結果を表示するための
表示信号を生成する表示手段(例えば、画像表示部)2
6とが設けられている。
The processor 20 includes a control unit 21 for controlling the entire processor 20 according to a document reading program,
Image input means (for example, an image input unit) 22 which takes in the input image data S1 and sends it to the image storage area of the memory 40 via the data bus 30, and is included in the input image data S1 taken in by the image input unit 22 A character area surrounding the character pattern to be extracted is cut out, and image data recognizing means (for example, an image data recognizing unit) for recognizing the character pattern and sending the coded recognition result to the recognition result storage area of the memory 40 via the data bus 30 ) 23. Further, the processor 20 includes a character frame extracting unit (for example, a character frame extracting unit) 24 for extracting a character frame from the input image data S1 captured by the image input unit 22, and a character frame extracting unit 24. A character frame conversion / deletion unit (for example, a character frame conversion unit) 25 that deletes all or an arbitrary part of the character frame and outputs a conversion / deletion result, and a character in the input image data S1 and a character frame conversion unit 25 A display unit (for example, an image display unit) 2 for generating a display signal for displaying the output conversion / deletion result and the recognition result output from the image data recognition unit 23
6 are provided.

【0012】プロセッサ20及びメモリ40には、デー
タバス30を介して、画像表示部26で生成された表示
信号に基づいた画像を表示するモニタ51、オペレータ
の操作によって制御部21に入力信号を送出するマウス
52とキーボード53、メモリ40の認識結果記憶領域
に格納された認識結果を保存するフロッピーディスク5
4、制御部26を動作させるためのプログラムを格納す
るハードディスク55が接続されている。
A monitor 51 for displaying an image based on the display signal generated by the image display unit 26 to the processor 20 and the memory 40 via the data bus 30, and an input signal is sent to the control unit 21 by an operator's operation. Mouse 52 and keyboard 53, and a floppy disk 5 for storing the recognition results stored in the recognition result storage area of the memory 40.
4. A hard disk 55 for storing a program for operating the control unit 26 is connected.

【0013】次に、図1の文書読取装置における読取動
作(1)、及び修正処理動作(2)を説明する (1) 読取動作 図4は、図1の文書読取装置における読取動作を説明す
るためのフローチャートである。
Next, a reading operation (1) and a correction processing operation (2) in the document reading apparatus of FIG. 1 will be described. (1) Reading Operation FIG. 4 describes a reading operation in the document reading apparatus of FIG. It is a flowchart for the.

【0014】読取動作では、先ず、スキャナ部1で帳票
Pに光が照射され、その反射光から帳票Pの画像が読み
込まれ、入力画像データS1に変換されてプロセッサ2
0に送出される(ステップST1)。プロセッサ20に
おいて、入力画像データS1は画像入力部22に取込ま
れ、メモリ40の画像記憶領域に格納される(ステップ
ST2)。メモリ40に格納された入力画像データS1
は、画像データ認識部23で文字領域が切出され、文字
認識処理が行われて認識結果が出力される(ステップS
T3)。文字認識処理が終了した後、認識結果に対する
修正処理が行われる(ステップST4)。修正処理が終
了した後、帳票Pの画像の読み込みが終了したか否かが
判定され、終了していれば、この文書読取装置における
処理動作を終了し、終了していなければ、ステップST
1に戻る。
In the reading operation, first, the form P is irradiated with light by the scanner unit 1, an image of the form P is read from the reflected light, converted into input image data S 1, and
0 (step ST1). In the processor 20, the input image data S1 is taken into the image input unit 22, and stored in the image storage area of the memory 40 (step ST2). Input image data S1 stored in memory 40
Indicates that a character area is cut out by the image data recognizing unit 23, character recognition processing is performed, and a recognition result is output (step S).
T3). After the end of the character recognition process, a correction process for the recognition result is performed (step ST4). After the correction processing is completed, it is determined whether the reading of the image of the form P is completed. If the reading is completed, the processing operation in the document reading apparatus is completed.
Return to 1.

【0015】(2) 修正処理動作 図5は、図4中の認識結果修正処理動作(ステップST
4)を説明するためのフローチャートである。図6は、
図1中のモニタ51の表示画面の例を示す図であり、図
2の文書を図1の文書読取装置で取込んだときの入力画
像V2と、入力画像V2中の文字の認識結果R2とが示
されている。
(2) Correction processing operation FIG. 5 shows the recognition result correction processing operation (step ST) in FIG.
It is a flowchart for demonstrating 4). FIG.
FIG. 3 is a diagram illustrating an example of a display screen of a monitor 51 in FIG. 1, showing an input image V2 when the document in FIG. 2 is captured by the document reading device in FIG. 1, and a recognition result R2 of characters in the input image V2; It is shown.

【0016】修正処理動作では、図5において、画像デ
ータ認識部23から出力された認識結果は画像表示部2
6に送出され、画像表示部26で表示信号が生成され
る。この表示信号はモニタ51に送出され、認識結果が
表示される(ステップST11)。オペレータは、認識
結果を修正する為のガイドとして、入力画像データS1
をモニタ51に表示するか否かを決定する。又は、入力
画像データS1をモニタ51に自動的に表示するように
予め設定しておく(ステップST12)。入力画像デー
タS1をモニタ51に表示する場合、入力画像データS
1から文字枠を抽出する。この場合、文字枠抽出部24
において、例えば入力画像データS1の縦方向及び横方
向の画素数のヒストグラムが算出され、このヒストグラ
ムが予め設定された閾値以上になった場合に文字枠とし
て抽出される(ステップST13)。文字枠変換部25
において、入力画像データS1中の文字枠Fが削除され
る。この場合、例えば、抽出された文字枠の画像データ
をモニタ51に送出しないようにする(ステップST1
4)。図6に示すように、入力画像V2中には各文字の
みが表示され、文字枠は表示されていない。認識結果R
2中には修正処理の対象になる文字の位置にカーソルC
が表示されている。
In the correction processing operation, in FIG. 5, the recognition result output from the image data
6 and a display signal is generated by the image display unit 26. This display signal is sent to the monitor 51, and the recognition result is displayed (step ST11). The operator operates the input image data S1 as a guide for correcting the recognition result.
Is displayed on the monitor 51. Alternatively, it is set in advance so that the input image data S1 is automatically displayed on the monitor 51 (step ST12). When displaying the input image data S1 on the monitor 51, the input image data S1
Extract a character frame from 1. In this case, the character frame extracting unit 24
In, for example, a histogram of the number of pixels in the vertical direction and the horizontal direction of the input image data S1 is calculated, and when the histogram is equal to or larger than a preset threshold, it is extracted as a character frame (step ST13). Character frame conversion unit 25
In, the character frame F in the input image data S1 is deleted. In this case, for example, the image data of the extracted character frame is not sent to the monitor 51 (step ST1).
4). As shown in FIG. 6, only each character is displayed in the input image V2, and no character frame is displayed. Recognition result R
During cursor 2, place the cursor C at the position of the character to be corrected.
Is displayed.

【0017】入力画像データS1から文字枠が除去され
た画像(即ち、入力画像データS1中の文字)がモニタ
51に表示される(ステップST15)。オペレータ
は、モニタ51に表示された入力画像V2中の文字と認
識結果R2とを照合し、不一致の場合、マウス52又は
キーボード53を操作することによって修正信号を制御
部21へ入力する。制御部21では、修正信号が入力さ
れると、認識結果R2が入力画像V2中の文字に一致す
るように修正処理が行われる(ステップST16)。こ
の修正処理の結果は画像表示部26を経てモニタ51へ
送出される。オペレータは、モニタ51の表示画面を見
ることによって修正処理が終了したか否かを判定し(ス
テップST17)、終了していなければステップST1
6に戻り、終了していれば図4中のステップS5へ移
る。前記ステップST12において、入力画像データS
1をモニタ51に表示しない場合は、ステップST16
へ移る。以上のように、この第1の実施形態では、文字
枠変換部25において入力画像データS1から文字枠F
を削除し、モニタ51で文字枠Fが表示されていない入
力画像V2を表示するようにしたので、修正作業におけ
るオペレータの負担を軽くできる。
An image in which the character frame has been removed from the input image data S1 (ie, the characters in the input image data S1) is displayed on the monitor 51 (step ST15). The operator compares the character in the input image V2 displayed on the monitor 51 with the recognition result R2, and inputs a correction signal to the control unit 21 by operating the mouse 52 or the keyboard 53 if they do not match. When the correction signal is input, the control unit 21 performs a correction process so that the recognition result R2 matches a character in the input image V2 (step ST16). The result of the correction process is sent to the monitor 51 via the image display unit 26. The operator determines whether or not the correction process has been completed by looking at the display screen of the monitor 51 (step ST17).
Returning to step S6, if the processing has been completed, the processing moves to step S5 in FIG. In step ST12, the input image data S
If 1 is not displayed on the monitor 51, step ST16
Move to As described above, in the first embodiment, the character frame conversion unit 25 converts the input image data S1 into the character frame F.
Is deleted and the input image V2 without the character frame F is displayed on the monitor 51, so that the burden on the operator in the correction work can be reduced.

【0018】第2の実施形態 本実施形態の文書読取装置では、図1中の文字枠変換部
25に代えて、図示しない異なる構成の文字枠変換部2
5Aが設けられている。この文字枠変換部25Aは、文
字枠抽出部24で抽出された文字枠の全部又は任意の部
分を該文字枠とは異なる色の照合用文字枠に変換して変
換・削除結果を出力する構成になっている。
Second Embodiment In the document reading apparatus of this embodiment, a character frame conversion unit 2 having a different configuration (not shown) is used instead of the character frame conversion unit 25 shown in FIG.
5A is provided. The character frame conversion unit 25A is configured to convert all or any part of the character frame extracted by the character frame extraction unit 24 into a collation character frame of a color different from the character frame and output a conversion / deletion result. It has become.

【0019】図7は、本発明の第2の実施形態を示す修
正処理動作のフローチャートであり、第1の実施形態を
示す図5中の要素と共通の要素には共通の符号が付され
ている。図8は、図7のモニタ51の表示画面の例を示
す図である。この文書読取装置では、読取動作が第1の
実施形態と同様に行われる。修正処理動作では、図7に
示すように、ステップST14Aにおいて、文字枠変換
部25Aで、文字枠抽出部24で抽出された文字枠の全
部又は任意の部分が、例えばカラーパレット等の色変換
手段によって該文字枠とは異なる色の照合用文字枠に変
換される。この照合用文字枠の画像データは、画像表示
部26を経てモニタ51に送出される。図8に示すよう
に、入力画像V3中には、各文字と共に色が変更された
照合用文字枠FAが一緒に表示されている。認識結果R
3中には、修正処理の対象になる文字の位置にカーソル
Cが表示されている。他は、図5と同様の処理が行われ
る。
FIG. 7 is a flowchart of a correction processing operation according to the second embodiment of the present invention. Elements common to those in FIG. 5 according to the first embodiment are denoted by the same reference numerals. I have. FIG. 8 is a diagram showing an example of a display screen of the monitor 51 of FIG. In this document reading apparatus, the reading operation is performed in the same manner as in the first embodiment. In the correction processing operation, as shown in FIG. 7, in step ST14A, in the character frame conversion unit 25A, all or any part of the character frame extracted by the character frame extraction unit 24 is converted to a color conversion unit such as a color palette. Is converted to a collation character frame of a different color from the character frame. The image data of the collation character frame is transmitted to the monitor 51 via the image display unit 26. As shown in FIG. 8, in the input image V3, a collation character frame FA whose color has been changed is displayed together with each character. Recognition result R
In 3, the cursor C is displayed at the position of the character to be corrected. Otherwise, the same processing as in FIG. 5 is performed.

【0020】以上のように、この第2の実施形態では、
文字枠変換部25Aにおいて入力画像データS1中の文
字枠の色を変更し、モニタ51でこの文字枠を含む入力
画像V3を表示するようにしたので、図6中の入力画像
V2よりも見やすくなり、修正作業におけるオペレータ
の負担をより軽くできる。
As described above, in the second embodiment,
Since the color of the character frame in the input image data S1 is changed in the character frame conversion unit 25A and the input image V3 including the character frame is displayed on the monitor 51, it is easier to see than the input image V2 in FIG. Thus, the burden on the operator in the correction work can be reduced.

【0021】第3の実施形態 本実施形態の文書読取装置では、図1中の文字枠変換部
25に代えて、図示しない異なる構成の文字枠変換部2
5Bが設けられている。この文字枠変換部25Bは、文
字枠抽出部24で抽出された文字枠の全部又は任意の部
分を該文字枠とは異なる色の照合用文字枠に変換する
か、該部分を削除するか、又は変更せずに出力するか
を、オペレータの操作によって選択する構成になってい
る。
Third Embodiment In the document reading apparatus of this embodiment, a character frame conversion unit 2 having a different configuration (not shown) is used instead of the character frame conversion unit 25 shown in FIG.
5B is provided. The character frame conversion unit 25B converts all or any part of the character frame extracted by the character frame extraction unit 24 into a collation character frame of a color different from the character frame, deletes the part, Alternatively, whether to output without changing is selected by an operation of the operator.

【0022】図9は、本発明の第3の実施形態を示す修
正処理動作のフローチャートであり、図5及び図7中の
要素と共通の要素には共通の符号が付されている。この
文書読取装置でも、読取動作が第1の実施形態と同様に
行われる。修正処理動作では、図9に示すように、ステ
ップST21において、オペレータによって文字枠を非
表示にするか否かが判定され、非表示にする場合はステ
ップST21aへ進み、文字枠変換部25Bで文字枠が
削除される。その後、ステップST15へ進む。文字枠
を表示する場合はステップST22へ進み、該文字枠の
色を変更するか否かが判定される。文字枠の色を変更す
る場合はステップST22aへ進み、文字枠変換部25
Bで文字枠の色が変更される。その後、ステップST1
5へ進む。文字枠の色を変更しない場合はステップST
23へ進み、文字枠がそのまま表示される。他は、図5
と同様の処理が行われる。
FIG. 9 is a flowchart of a correction processing operation according to the third embodiment of the present invention. Elements common to those in FIGS. 5 and 7 are denoted by the same reference numerals. In this document reading apparatus, the reading operation is performed in the same manner as in the first embodiment. In the correction processing operation, as shown in FIG. 9, in step ST21, it is determined whether or not the character frame is hidden by the operator. The frame is deleted. Thereafter, the process proceeds to step ST15. When displaying the character frame, the process proceeds to step ST22, and it is determined whether or not to change the color of the character frame. When changing the color of the character frame, the process proceeds to step ST22a, where the character frame conversion unit 25
B changes the color of the character frame. Then, step ST1
Go to 5. Step ST when not changing the color of the character frame
Proceeding to 23, the character frame is displayed as it is. The other is FIG.
Is performed.

【0023】以上のように、この第3の実施形態では、
文字枠変換部25Bにおいて入力画像データS1中の文
字枠の色を変更するか又は削除するかを選択できるよう
にしたので、修正作業におけるオペレータの負担を更に
軽くできる。
As described above, in the third embodiment,
Since the character frame conversion unit 25B can select whether to change or delete the color of the character frame in the input image data S1, the burden on the operator in the correction work can be further reduced.

【0024】第4の実施形態 図10は、本発明の第4の実施形態を示す文書読取装置
の構成図であり、第1の実施形態を示す図1中の要素と
共通の要素には共通の符号が付されている。この文書読
取装置では、図1中の読取装置本体10に代えて、異な
る構成の読取装置本体10Aが設けられている。読取装
置本体10Aでは、図1中の画像入力部22がFAX受
信部22Aに変更されたプロセッサ20Aが設けられて
いる。FAX受信部22Aには、通信網(例えば、公衆
網)NWを介してFAX60が接続されている。他は、
図1と同様の構成である。
Fourth Embodiment FIG. 10 is a block diagram of a document reading apparatus showing a fourth embodiment of the present invention, and is common to the elements in FIG. 1 showing the first embodiment and common elements. Are given. In this document reading apparatus, a reading apparatus main body 10A having a different configuration is provided instead of the reading apparatus main body 10 in FIG. In the main body 10A of the reading apparatus, a processor 20A in which the image input section 22 in FIG. 1 is replaced with a FAX receiving section 22A is provided. The FAX 60 is connected to the FAX receiving unit 22A via a communication network (for example, a public network) NW. Others
The configuration is similar to that of FIG.

【0025】この文書読取装置では、FAX60から送
信された送信データS60が、公衆網NWを介してFA
X受信部22Aに取込まれ、メモリ40の画像記憶領域
に格納される。その後、第1、第2又は第3の実施形態
と同様の読取動作及び修正処理動作が行われる。以上の
ように、この第4の実施形態では、第1、第2又は第3
の実施形態と同様に、FAX60から送信された送信デ
ータS60の認識結果に対する修正作業におけるオペレ
ータの負担を軽くできる。
In this document reading apparatus, the transmission data S60 transmitted from the FAX 60 is transmitted to the FA via the public network NW.
The image is taken into the X receiving unit 22A and stored in the image storage area of the memory 40. After that, the same reading operation and correction processing operation as in the first, second, or third embodiment are performed. As described above, in the fourth embodiment, the first, second, or third
As in the embodiment, the burden on the operator in correcting the recognition result of the transmission data S60 transmitted from the FAX 60 can be reduced.

【0026】尚、本発明は上記実施形態に限定されず、
種々の変形が可能である。その変形例としては、例えば
次のようなものがある。 (a) 図1では、入力画像データS1はスキャナ部1
から出力されるようになっているが、他の装置で生成し
た入力画像データを例えばフロッピーディスク等の記憶
手段に保存し、この保存された入力画像データを該記憶
手段の駆動装置で読出すことによって出力するようにし
てもよい。 (b) 図6では、抽出された文字枠の画像データをモ
ニタ51に送出しないようにしたが、この文字枠の画像
データを表示画面の背景と同一の色にしてもよい。これ
により、文字枠が表示画面に表示されなくなり、第1の
実施形態と同様の効果が得られる。
The present invention is not limited to the above embodiment,
Various modifications are possible. For example, there are the following modifications. (A) In FIG. 1, the input image data S1 is the scanner unit 1
The input image data generated by another device is stored in a storage device such as a floppy disk, and the stored input image data is read out by a driving device of the storage device. May be output. (B) In FIG. 6, the extracted image data of the character frame is not sent to the monitor 51. However, the image data of the character frame may have the same color as the background of the display screen. Thereby, the character frame is not displayed on the display screen, and the same effect as in the first embodiment can be obtained.

【0027】(c) 図8中の照合用文字枠FAは、実
線で表示されているが、例えば破線や一点鎖線等で表示
するようにしてもよい。この場合、照合用文字枠FAの
一部を削除する処理を行う。 (d) 実施形態では、第1及び第2の記憶手段をメモ
リ40で構成したが、それぞれ独立したメモリで構成し
てもよい。 (e) 図10中の公衆網NWは、他の通信網で構成し
てもよい。
(C) Although the collating character frame FA in FIG. 8 is displayed by a solid line, it may be displayed by, for example, a dashed line or a dashed line. In this case, a process of deleting a part of the collation character frame FA is performed. (D) In the embodiment, the first and second storage units are configured by the memory 40, but may be configured by independent memories. (E) The public network NW in FIG. 10 may be configured by another communication network.

【0028】[0028]

【発明の効果】以上詳細に説明したように、請求項1に
係る発明によれば、文字枠変換・削除手段において入力
画像データ中の文字枠の全部又は任意の部分を該文字枠
とは異なる色の照合用文字枠に変換するか又は該部分を
削除し、その結果を表示手段で表示するようにしたの
で、修正作業におけるオペレータの負担を軽くできる。
請求項2に係る発明によれば、画像入力手段で取込まれ
た入力画像データを第1の記憶手段で記憶し、画像デー
タ認識手段から出力された認識結果を第2の記憶手段で
記憶するようにしたので、任意の時間で修正処理を行う
ことができる。そのため、請求項1に係る発明の効果に
加え、修正作業におけるオペレータの負担をより軽くで
きる。
As described in detail above, according to the first aspect of the present invention, the character frame conversion / deletion means makes all or any part of the character frame in the input image data different from the character frame. Since the result is converted into a character frame for color comparison or the part is deleted and the result is displayed on the display means, the burden on the operator in the correction work can be reduced.
According to the invention of claim 2, the input image data captured by the image input means is stored in the first storage means, and the recognition result output from the image data recognition means is stored in the second storage means. Thus, the correction process can be performed at an arbitrary time. Therefore, in addition to the effect of the invention according to claim 1, the burden on the operator in the correction work can be further reduced.

【0029】請求項3に係る発明によれば、画像入力手
段をスキャナで構成したので、このスキャナで取込まれ
た入力画像データに対して請求項1又は2に係る発明と
同様の効果がある。請求項4に係る発明によれば、画像
入力手段をFAXで構成したので、このFAXで取込ま
れた入力画像データに対して請求項1又は2に係る発明
と同様の効果がある。
According to the third aspect of the present invention, since the image input means is constituted by a scanner, the same effect as that of the first or second aspect of the present invention can be obtained for input image data taken in by the scanner. . According to the fourth aspect of the present invention, since the image input means is constituted by a facsimile, the same effect as that of the first or second aspect of the invention can be obtained for the input image data captured by the facsimile.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施形態の文書読取装置の構成
図である。
FIG. 1 is a configuration diagram of a document reading device according to a first embodiment of the present invention.

【図2】文字枠中に文字が記載された文書例を示す図で
ある。
FIG. 2 is a diagram illustrating an example of a document in which characters are described in a character frame.

【図3】図2に対応する表示画面を示す図である。FIG. 3 is a view showing a display screen corresponding to FIG. 2;

【図4】図1の読取動作のフローチャートである。FIG. 4 is a flowchart of a reading operation of FIG. 1;

【図5】図4中の修正処理動作のフローチャートであ
る。
FIG. 5 is a flowchart of a correction processing operation in FIG. 4;

【図6】図1中の表示画面例を示す図である。FIG. 6 is a diagram showing an example of a display screen in FIG. 1;

【図7】本発明の第2の実施形態の修正処理動作のフロ
ーチャートである。
FIG. 7 is a flowchart of a correction processing operation according to the second embodiment of the present invention.

【図8】図7の表示画面例を示す図である。FIG. 8 is a diagram showing an example of the display screen of FIG.

【図9】本発明の第3の実施形態の修正処理動作のフロ
ーチャートである。
FIG. 9 is a flowchart of a correction processing operation according to the third embodiment of the present invention.

【図10】本発明の第4の実施形態の文書読取装置の構
成図である。
FIG. 10 is a configuration diagram of a document reading device according to a fourth embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 スキャナ部 10,10A 読取装置本体 21 制御部 22 画像入力部 22A FAX受信部 23 画像データ認識部 24 文字枠抽出部 25 文字枠変換部 26 画像表示部 40 メモリ 51 モニタ 52 マウス 53 キーボード 60 FAX DESCRIPTION OF SYMBOLS 1 Scanner part 10, 10A Reading device main body 21 Control part 22 Image input part 22A FAX receiving part 23 Image data recognition part 24 Character frame extraction part 25 Character frame conversion part 26 Image display part 40 Memory 51 Monitor 52 Mouse 53 Keyboard 60 FAX

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 文字枠中に文字が記載された文書の入力
画像データを取込む画像入力手段と、 前記画像入力手段で取込まれた入力画像データに含まれ
る1つ又は複数の文字パターンをそれぞれ囲む文字領域
を切出し、該文字パターンを認識して認識結果を出力す
る画像データ認識手段と、 前記画像入力手段で取込まれた入力画像データから前記
文字枠を抽出する文字枠抽出手段と、 前記抽出された文字枠の全部又は任意の部分を該文字枠
とは異なる色の照合用文字枠に変換するか又は該部分を
削除して変換・削除結果を出力する文字枠変換・削除手
段と、 前記入力画像データ中の文字、変換・削除結果及び認識
結果を表示する表示手段と、 前記表示手段で表示された入力画像データ中の文字と認
識結果とが不一致の場合、オペレータの操作に基づいて
修正信号を入力する修正入力手段と、 前記修正信号が入力されたとき、前記表示手段で表示さ
れた認識結果を前記入力画像データ中の文字に一致させ
る修正処理を行う制御手段とを、備えたことを特徴とす
る文書読取装置。
1. An image input unit for inputting input image data of a document in which characters are described in a character frame, and one or more character patterns included in the input image data input by the image input unit. An image data recognition unit that cuts out each of the surrounding character regions, recognizes the character pattern and outputs a recognition result, and a character frame extraction unit that extracts the character frame from the input image data captured by the image input unit. A character frame conversion / deletion means for converting all or any part of the extracted character frame to a collation character frame of a color different from the character frame or deleting the part and outputting a conversion / deletion result; A display unit for displaying characters in the input image data, a conversion / deletion result, and a recognition result; and an operation by an operator when the characters in the input image data displayed by the display unit do not match the recognition result. Correction input means for inputting a correction signal based on the correction signal, and when the correction signal is input, a control means for performing correction processing for matching the recognition result displayed on the display means to characters in the input image data, A document reading device comprising:
【請求項2】 文字枠中に文字が記載された文書の入力
画像データを取込む画像入力手段と、 前記入力画像データを記憶する第1の記憶手段と、 前記第1の記憶手段に記憶された入力画像データに含ま
れる1つ又は複数の文字パターンをそれぞれ囲む文字領
域を切出し、該文字パターンを認識して認識結果を出力
する画像データ認識手段と、 前記認識結果を記憶する第2の記憶手段と、 前記第1の記憶手段に記憶された入力画像データから前
記文字枠を抽出する文字枠抽出手段と、 前記抽出された文字枠の全部又は任意の部分を該文字枠
とは異なる色の照合用文字枠に変換するか又は該部分を
削除して変換・削除結果を出力する文字枠変換・削除手
段と、 前記第1の記憶手段に記憶された入力画像データ中の文
字、変換・削除結果及び前記第2の記憶手段に記憶され
た認識結果を表示する表示手段と、 前記表示手段で表示された入力画像データ中の文字と認
識結果とが不一致の場合、オペレータの操作に基づいて
修正信号を入力する修正入力手段と、 前記修正信号が入力されたとき、前記表示手段で表示さ
れた認識結果を前記入力画像データ中の文字に一致させ
る修正処理を行う制御手段とを、備えたことを特徴とす
る文書読取装置。
2. An image input unit for receiving input image data of a document in which characters are described in a character frame, a first storage unit for storing the input image data, and a first storage unit for storing the input image data. Image data recognizing means for extracting a character area surrounding each of one or a plurality of character patterns included in the input image data, recognizing the character pattern and outputting a recognition result, and a second storage for storing the recognition result Means, character frame extracting means for extracting the character frame from the input image data stored in the first storage means, all or any part of the extracted character frame having a different color from the character frame. Character frame conversion / deletion means for converting to a collation character frame or deleting the part and outputting a conversion / deletion result; characters in the input image data stored in the first storage means; Results and said Display means for displaying the recognition result stored in the second storage means; and if a character in the input image data displayed by the display means does not match the recognition result, a correction signal is inputted based on an operation of the operator. Correction input means, and when the correction signal is input, control means for performing correction processing for matching the recognition result displayed on the display means to characters in the input image data, Document reading device.
【請求項3】 前記画像入力手段は、 文字枠中に文字が記載された帳票を走査するスキャナか
ら入力画像データを取込む構成にしたことを特徴とする
請求項1又は2記載の文書読取装置。
3. A document reading apparatus according to claim 1, wherein said image input means takes in input image data from a scanner that scans a form in which characters are described in a character frame. .
【請求項4】 前記画像入力手段は、 通信網に接続されたファクシミリ装置から該通信網を介
して文字枠中に文字が記載された文書の入力画像データ
を取込む構成にしたことを特徴とする請求項1又は2記
載の文書読取装置。
4. The apparatus according to claim 1, wherein said image input means takes in input image data of a document in which a character is written in a character frame from a facsimile apparatus connected to a communication network via the communication network. The document reading device according to claim 1 or 2, wherein
JP10049673A 1998-03-02 1998-03-02 Document reader Withdrawn JPH11250177A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10049673A JPH11250177A (en) 1998-03-02 1998-03-02 Document reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10049673A JPH11250177A (en) 1998-03-02 1998-03-02 Document reader

Publications (1)

Publication Number Publication Date
JPH11250177A true JPH11250177A (en) 1999-09-17

Family

ID=12837701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10049673A Withdrawn JPH11250177A (en) 1998-03-02 1998-03-02 Document reader

Country Status (1)

Country Link
JP (1) JPH11250177A (en)

Similar Documents

Publication Publication Date Title
US6072941A (en) Image processing apparatus and method which classifies images according to attributes
JP4189506B2 (en) Apparatus, method and recording medium for image processing
JP3139521B2 (en) Automatic language determination device
JP3756719B2 (en) Document modification apparatus and image processing apparatus
EP0457546B1 (en) Image processing method and apparatus
JPH11250177A (en) Document reader
JP2000181988A (en) Optical character reader
JP2006259795A (en) Business form for character recognition, and character recognition device, program, and method
JPH0656618B2 (en) Image information character / graphic separation method
JP3058489B2 (en) String extraction method
JP3157534B2 (en) Table recognition method
JP2005050094A (en) Optical character reader
JP2800205B2 (en) Image processing device
JP2926842B2 (en) Character extraction circuit
JP2931041B2 (en) Character recognition method in table
JP3191265B2 (en) Image input device and image input control method thereof
JPS63137383A (en) Character reader
JP3199033B2 (en) Optical character reading method and optical character reading device
JPH0271379A (en) Picture processor
JPH1091722A (en) Picture processor
JP2721415B2 (en) Character image extraction method
JPH1040313A (en) Device for preparing format and method for preparing format control program
JP2006261772A (en) Image forming apparatus and image forming method
JP2015159554A (en) image processing apparatus and program
JPH04167194A (en) Table processing system

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050510