JPH01259470A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH01259470A
JPH01259470A JP63087122A JP8712288A JPH01259470A JP H01259470 A JPH01259470 A JP H01259470A JP 63087122 A JP63087122 A JP 63087122A JP 8712288 A JP8712288 A JP 8712288A JP H01259470 A JPH01259470 A JP H01259470A
Authority
JP
Japan
Prior art keywords
image data
character
character recognition
image
unrecognizable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63087122A
Other languages
Japanese (ja)
Inventor
Yoshihisa Tadokoro
善久 田處
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63087122A priority Critical patent/JPH01259470A/en
Publication of JPH01259470A publication Critical patent/JPH01259470A/en
Priority to US08/380,331 priority patent/US5974203A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To easily discriminate the position of an unrecognizable character with a picture input part by executing the character recognition of image data, which show character information, and transferring a recognized result and the position of the unrecognizable character, etc., to an output side together with the image data when the presence of the unrecognizable character is detected. CONSTITUTION:Original picture data from a picture input part 200 are inputted by the image data and on the basis of the image data, whether the image data are character patterns or not is discriminated. Then, character recognition is executed on the basis of the image data to be decided as the character pattern. At such a time, when the image data can not be recognized by a recognizing means 204, recognized result information are given to the image data and the image data are returned to the picture input part 200. Thus, when the unrecognizable character is detected, the character position or the recognized result is outputted together with an original image. Thus, an erroneous input position or the unrecognizable character position can be easily grasped in an original.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は手書き文字やOCRフォント等を光学的に読取
ったイメージデータを入力し、そのイメージデータな基
に文字認識を行って文字コードに変換して出力する文字
認識装置に関するものである。
[Detailed Description of the Invention] [Industrial Application Field] The present invention inputs image data obtained by optically reading handwritten characters, OCR fonts, etc., performs character recognition based on the image data, and converts it into a character code. This relates to a character recognition device that outputs

[従来の技術] 従来、この種の文字認識装置では、認識不能文字を検出
した場合、OCRシート等への記入誤りや画像読取りエ
ラー等があったものとみなして、イメージデータを送信
した送信側端末や画像入力部等に認識不能文字があった
ことを知らせるようにしていた。このような従来の文字
認識装置の処理を、通信端末の場合で示した第5図のフ
ローチャートで説明する。ステップS60で着呼が発生
すると、ステップS61で相手側端末よりの画像データ
を受信してメモリに蓄積する。ステップS62でこの蓄
積された画像データが、通常の原稿を読取った画像デー
タかOCRシートを読取った画像データかどうかをみる
。OCRシートでなければステップS66で原稿処理を
行うが、OCRシートのときはステップS63に進み、
OCRパターンを基に文字認識を行ってステップS64
に進む。ステップS64で認識不能文字が存在したかど
うかを調べ、認識不能文字が存在するときはステップS
65で送信側端末に認識不能文字があることを知らせて
いた。
[Prior Art] Conventionally, in this type of character recognition device, when an unrecognized character is detected, it is assumed that there was an error in writing on an OCR sheet, an error in reading the image, etc., and the sending side that sent the image data It was designed to notify users that there were unrecognized characters on the terminal or image input section. The processing of such a conventional character recognition device will be explained with reference to the flowchart of FIG. 5, which is shown in the case of a communication terminal. When an incoming call occurs in step S60, image data from the other party's terminal is received and stored in the memory in step S61. In step S62, it is checked whether the accumulated image data is image data obtained by reading a normal document or image data obtained by reading an OCR sheet. If it is not an OCR sheet, the document is processed in step S66, but if it is an OCR sheet, the process advances to step S63.
Character recognition is performed based on the OCR pattern and step S64
Proceed to. It is checked in step S64 whether or not an unrecognized character exists, and if an unrecognized character exists, step S64 is performed.
65, the sending terminal was informed that there were unrecognized characters.

[発明が解決しようとしている課題] しかし上記従来例では、画像入力部や送信側端末は、O
CRシートへの誤記入位置或いは認識不能文字の存在位
置を知ることができず、認識不能文字の訂正や検出に多
くの時間や手間を要するという問題があった。
[Problem to be solved by the invention] However, in the above conventional example, the image input unit and the sending terminal are
There is a problem in that it is not possible to know the location of incorrect entries on the CR sheet or the location of unrecognized characters, and it takes a lot of time and effort to correct or detect unrecognized characters.

本発明は上記従来例に鑑みてなされたもので、認識不能
文字を検出したとき、その文字位置や認識結果を原稿イ
メージととも出力することにより、原稿における誤入力
位置や認識不能な文字位置を容易に把握できる文字認識
装置を提供することを目的とする。
The present invention has been made in view of the above-mentioned conventional example, and when an unrecognized character is detected, the character position and recognition result are output together with the original image, thereby identifying the incorrect input position or unrecognizable character position in the original. The object of the present invention is to provide a character recognition device that can be easily understood.

[課題を解決するための手段] 上記目的を達成するために本発明の文字認識装置は以下
の様な構成からなる。即ち、 画像入力部よりの原稿画像データをイメージデータで入
力し、該イメージデータを基に文字認識を行う文字認識
装置であって、前記イメージデータを基に文字パターン
かどうかを判定する判定手段と、文字パターンと判定さ
れたイメージデータを基に文字認識を行う認識手段と、
該認識手段で認識不能と判断されたイメージデータに認
識結果情報を付与して前記画像入力部に返送する返送手
段とを備える。
[Means for Solving the Problems] In order to achieve the above object, the character recognition device of the present invention has the following configuration. That is, the character recognition device inputs document image data from an image input section as image data and performs character recognition based on the image data, and includes determining means for determining whether or not it is a character pattern based on the image data. , recognition means that performs character recognition based on image data determined to be a character pattern;
and a return means for adding recognition result information to the image data determined to be unrecognizable by the recognition means and returning it to the image input section.

[作用] 以上の構成において、画像入力部よりの原稿画像データ
をイメージデータで入力し、そのイメージデータな基に
文字パターンかどうかを判定し、文字パターンと判定さ
れたイメージデータを基に文字認識を行う。このとき、
この認識手段で認識不能と判断されたときは、イメージ
データに認識結果情報を付与して画像入力部に返送する
ように動作する。
[Operation] In the above configuration, document image data from the image input section is input as image data, it is determined whether it is a character pattern based on the image data, and character recognition is performed based on the image data determined to be a character pattern. I do. At this time,
When the recognition means determines that the image data is unrecognizable, it operates to add recognition result information to the image data and send it back to the image input unit.

[実施例] 以下、添付図面を参照して本発明の好適な実施例を詳細
に説明する。
[Embodiments] Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

[通信端末の説明 (第1図、第2図)]第1図は実施
例の文字認識装置の機能ブロック図である。
[Description of Communication Terminal (FIGS. 1 and 2)] FIG. 1 is a functional block diagram of a character recognition device according to an embodiment.

200は原稿画像201を光学的に読取って入力し、イ
メージデータで出力する画像入力部である。なお、この
画像入力部200は本装置と離反して設置され、この文
字認識装置にイメージデータの型式でデータを伝送する
通信端末であってもよい。202は入力したイメージデ
ータを基に、OCRデータかどうかを判定する判定部で
、この判定は、例えば第3図に示したOCRシートの所
定の位置に記されたマーク等を基に、OCRシートフォ
ーマットを読取ったデータかどうかを判定することによ
り行われる。203は判定部202を通過したイメージ
データを格納するメモリ、204は判定部202よりの
判定結果及びメモリ203に格納されたイメージデータ
を入力して文字認識を行う文字認識部である。
Reference numeral 200 denotes an image input unit that optically reads and inputs the original image 201 and outputs it as image data. Note that this image input section 200 may be a communication terminal that is installed separately from this apparatus and transmits data in the form of image data to this character recognition apparatus. Reference numeral 202 denotes a determination unit that determines whether or not the input image data is OCR data.This determination is made, for example, based on the mark written at a predetermined position on the OCR sheet shown in FIG. This is done by determining whether the format is read data or not. 203 is a memory that stores the image data that has passed through the determination unit 202; 204 is a character recognition unit that inputs the determination result from the determination unit 202 and the image data stored in the memory 203 and performs character recognition.

205は文字認識結果を出力する認識結果出力部で、認
識された文字等がコードデータで出力される。ここで、
もしメモリ203のイメージデータ内に認識不能な文字
が存在しているときは、認識不能情報206として出力
される。そして、この認識不能情報206と、メモリ2
03の入力したイメージデータとが、それぞれ対応付け
られて画像入力部200に返送される。これにより、画
像入力部200側で、出力したイメージデータのうち、
認識不能文字とその存在する位置とを確認することがで
きる。
A recognition result output unit 205 outputs the character recognition results, and the recognized characters are output as code data. here,
If unrecognizable characters exist in the image data in the memory 203, they are output as unrecognizable information 206. Then, this unrecognizable information 206 and the memory 2
The input image data of No. 03 are respectively correlated and sent back to the image input unit 200. As a result, on the image input section 200 side, among the output image data,
Unrecognized characters and their locations can be confirmed.

第2図は実施例の文字認識装置の概略構成を示すブロッ
ク図で、この実施例の通信端末は電話回線網に接続され
、画像情報の送受が可能な文字認識装置を例にして説明
する。
FIG. 2 is a block diagram showing a schematic configuration of a character recognition device according to an embodiment. The communication terminal of this embodiment will be explained by taking as an example a character recognition device that is connected to a telephone line network and is capable of transmitting and receiving image information.

図中、100は実施例の文字認識装置本体を示し、10
1はROM102に格納された制御プログラムや各種デ
ータ等に従って装置100全体を制御するCPUである
。103はCPU101のワークエリアとして使用され
るとともに、後述するモデム105やキーバッド107
等により入力されたイメージデータ等を格納するRAM
である。105は公衆回線108と装置100との間で
入出力制御を行うモデムで、デジタル信号を交流信号に
変換して回線108に出力し、回線108の交流信号を
デジタル信号に変換して装置100に入力している。1
07はオペレータにより操作され各種データの入力を行
うキーボードで、キーボード107より入力されたデー
タは、I10コントローラ106を介してシステムバス
104に入力されている。
In the figure, 100 indicates the character recognition device main body of the embodiment, and 10
Reference numeral 1 denotes a CPU that controls the entire apparatus 100 according to control programs and various data stored in the ROM 102. Reference numeral 103 is used as a work area for the CPU 101, as well as a modem 105 and a keypad 107, which will be described later.
RAM that stores image data etc. input by
It is. A modem 105 performs input/output control between the public line 108 and the device 100, which converts digital signals into AC signals and outputs them to the line 108, converts AC signals on the line 108 into digital signals, and outputs the signals to the device 100. I am typing. 1
A keyboard 07 is operated by an operator to input various data. Data input from the keyboard 107 is input to the system bus 104 via the I10 controller 106.

第3図はOCRシートフォーマットの一例を示す図であ
る。ここでは、シートの記入エリア21に手書きで記入
された文字(数字)列が読取られて認識される。ここで
は、手書きで記入される文字列は、7セグメント表示器
と同様の構成からなる数字列である。
FIG. 3 is a diagram showing an example of an OCR sheet format. Here, a string of characters (numbers) handwritten in the entry area 21 of the sheet is read and recognized. Here, the character string entered by hand is a numeric string having a configuration similar to that of a 7-segment display.

[動作説明 (第1図〜第4図)] 第4図は実施例の文字認識装置におけるCPU101に
よる文字認識動作を示すフローチャートで、このフロー
チャートで示された制御を実行する制御プログラムはR
OM102に格納されている。
[Operation Description (Figures 1 to 4)] Figure 4 is a flowchart showing the character recognition operation by the CPU 101 in the character recognition device of the embodiment, and the control program that executes the control shown in this flowchart is R.
It is stored in OM102.

ステップS1で着呼を検出すると、ステップS2で電話
網の加入者回線108を通して入力された画像信号をモ
デム105で変換した後、バス104を介して入力しR
AM103のデータメモリに格納する。ステップS3で
はRAM103に格納されたイメージデータを基に画像
データの判定を行い、例えば第3図に示したようなOC
Rシートを読取った画像データかどうかを調べる。OC
Rシートの画像データでなければステップS4に進み、
通常の画像データの画像処理を行う。
When an incoming call is detected in step S1, in step S2, the image signal input through the subscriber line 108 of the telephone network is converted by the modem 105, and then input via the bus 104.
Store it in the data memory of AM103. In step S3, image data is determined based on the image data stored in the RAM 103, and, for example, the OC as shown in FIG.
Check whether the image data is the one read from the R sheet. O.C.
If it is not the image data of the R sheet, proceed to step S4;
Performs normal image processing of image data.

ステップS3でOCRシートの読取りデータでなければ
ステップS5に進み、RAM103に格納されたイメー
ジデータを基に文字認識を行う。
In step S3, if the data is not read from the OCR sheet, the process proceeds to step S5, where character recognition is performed based on the image data stored in the RAM 103.

そして、ステップS6で認識不能文字が存在するかどう
かを調べ、認識不能文字が存在するときはステップS7
に進み、RAM103に格納されている受信画像をモデ
ム105を介して通信回線108に出力し、画像データ
を送信してきた送信側の通信端末に返送する。そしてス
テップS8で、認識不能である文字部分を示す位置デー
タ、或いはOCRシート全体の認識結果等を送信側の通
信端末に通知し、ステップS9で空き状態になって処理
を終了する。
Then, in step S6, it is checked whether or not an unrecognized character exists, and if an unrecognized character exists, step S7
Then, the received image stored in the RAM 103 is output to the communication line 108 via the modem 105, and is returned to the transmitting communication terminal that sent the image data. Then, in step S8, the transmitting communication terminal is notified of the position data indicating the unrecognizable character portion or the recognition result of the entire OCR sheet, and in step S9, the communication terminal becomes idle and the process ends.

なお、この実施例では認識できない文字があるときは、
画像データを送信した送信側端末に認識不能文字の位置
や認識結果等を出力するようにしたが、この受信側端末
に表示部等を設け、認識不能部分を示す位置データや認
識結果等を表示してオペレータに知らせ、その後の処置
に関する判断をオペレータに委ねるようにしても良い。
In addition, if there are characters that cannot be recognized in this example,
The location of unrecognized characters, recognition results, etc. are output to the sending terminal that sent the image data, but the receiving terminal is equipped with a display unit to display position data indicating unrecognized parts, recognition results, etc. Alternatively, the operator may be informed of this, and the operator may be allowed to make decisions regarding subsequent treatment.

また、この実施例では通信端末の場合で示したがこれに
限定されるものでなく、オフラインの文字認識装置の場
合にも適用できる。
Furthermore, although this embodiment has been described in the case of a communication terminal, the present invention is not limited thereto, and can also be applied to an offline character recognition device.

また更には、この実施例におけるイメージデー−夕等を
伝送する送信側端末は、実施例のように通信装置であっ
ても良く、またスキャナ等を備えた画像入力装置であっ
ても良い。この場合には、画像入力装置は画像データを
表示するデイスプレィ等の表示部等を備え、認識装置よ
り指示された認識不能位置や認識結果等を表示できる構
成であることが望ましい。
Furthermore, the transmitting terminal for transmitting image data and the like in this embodiment may be a communication device as in the embodiment, or may be an image input device equipped with a scanner or the like. In this case, it is preferable that the image input device is equipped with a display unit such as a display for displaying image data, and is configured to be able to display the unrecognizable position specified by the recognition device, recognition results, and the like.

以上説明したように本実施例によれば、イメージデータ
を受信した受信側の文字認識装置で認識不能文字を検出
すると、その文字位置と認識結果更には入力したイメー
ジデータを送信側に返送することにより、受信側(文字
認識部)と離れた位置にある送信側端末側での誤記入個
所の検出や、訂正にかかる時間を短縮でき、オペレータ
の負担が軽減される効果がある。
As explained above, according to this embodiment, when an unrecognized character is detected by the character recognition device on the receiving side that has received image data, the character position and recognition result as well as the input image data are returned to the sending side. This has the effect of reducing the time required for detecting and correcting erroneous entries on the sending terminal side, which is located far from the receiving side (character recognition unit), and reducing the burden on the operator.

[発明の効果] 以上説明したように本発明によれば、文字情報を示すイ
メージデータの文字認識を行い、認識不能文字の存在が
検知されると、その結果及び認識不能文字位置等をイメ
ージデータとともに出力側に転送することにより、画像
入力部で認識不能文字の位置を容易に判別できる効果が
ある。
[Effects of the Invention] As explained above, according to the present invention, character recognition is performed on image data indicating character information, and when the presence of an unrecognized character is detected, the result and the position of the unrecognized character are transferred to the image data. By transferring the information to the output side, the position of the unrecognizable character can be easily determined by the image input unit.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は実施例の文字認識装置の機能構成を示す機能ブ
ロック図、 第2図は実施例の文字認識装置の概略構成を示すブロッ
ク図、 第3図はOCRシートフォーマットの一例を示す図、 第4図は実施例の文字認識装置における認識処理動作を
示すフローチャート、そして、第5図は従来の文字認識
処理を示すフローチャートである。 図中、100・・・文字認識装置、101・・・CPU
、102 ・・・ROM、  103・・・RAM、1
04 ・・・バス、105・・・モデム、106・・弓
10コントローラ、107・・・キーボード、108・
・・通信回線、200・・・画像入力部、201・・・
原稿、202・・・判定部、203・・・メモリ、20
4・・・文字認識部、205・・・認識結果出力部であ
る。 第1図 第3図 第4図 第5図
FIG. 1 is a functional block diagram showing the functional configuration of a character recognition device according to an embodiment, FIG. 2 is a block diagram showing a schematic configuration of a character recognition device according to an embodiment, and FIG. 3 is a diagram showing an example of an OCR sheet format. FIG. 4 is a flowchart showing the recognition processing operation in the character recognition device of the embodiment, and FIG. 5 is a flowchart showing the conventional character recognition processing. In the figure, 100...Character recognition device, 101...CPU
, 102...ROM, 103...RAM, 1
04... Bus, 105... Modem, 106... Bow 10 controller, 107... Keyboard, 108...
...Communication line, 200...Image input section, 201...
Original, 202... Judgment unit, 203... Memory, 20
4...Character recognition unit, 205...Recognition result output unit. Figure 1 Figure 3 Figure 4 Figure 5

Claims (1)

【特許請求の範囲】 画像入力部よりの原稿画像データをイメージデータで入
力し、該イメージデータを基に文字認識を行う文字認識
装置であつて、 前記イメージデータを基に文字パターンかどうかを判定
する判定手段と、文字パターンと判定されたイメージデ
ータを基に文字認識を行う認識手段と、該認識手段で認
識不能と判断されたイメージデータを含むイメージデー
タに認識結果情報を付与して前記画像入力部に返送する
返送手段とを備えることを特徴とする文字認識装置。
[Scope of Claims] A character recognition device that inputs document image data from an image input section as image data, and performs character recognition based on the image data, and determines whether or not it is a character pattern based on the image data. a recognition means for performing character recognition based on the image data determined to be a character pattern; and a recognition means for performing character recognition on the basis of the image data determined to be a character pattern; 1. A character recognition device comprising a return means for sending a message back to an input section.
JP63087122A 1988-04-11 1988-04-11 Character recognizing device Pending JPH01259470A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63087122A JPH01259470A (en) 1988-04-11 1988-04-11 Character recognizing device
US08/380,331 US5974203A (en) 1988-04-11 1995-01-30 Pattern recognition communication apparatus for transmitting and receiving image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63087122A JPH01259470A (en) 1988-04-11 1988-04-11 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH01259470A true JPH01259470A (en) 1989-10-17

Family

ID=13906151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63087122A Pending JPH01259470A (en) 1988-04-11 1988-04-11 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH01259470A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58169682A (en) * 1982-03-31 1983-10-06 Toshiba Corp Character and picture processor
JPS6121582A (en) * 1985-06-24 1986-01-30 Hitachi Ltd Optical character reader

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58169682A (en) * 1982-03-31 1983-10-06 Toshiba Corp Character and picture processor
JPS6121582A (en) * 1985-06-24 1986-01-30 Hitachi Ltd Optical character reader

Similar Documents

Publication Publication Date Title
JPH09116720A (en) Ocr facsimile equipment and communication system therefor
CA1175934A (en) Facsimile system
JPH01259470A (en) Character recognizing device
JPS58107992A (en) Form recognizing device
US20040105599A1 (en) Automatic identification of destination information in a facsimile transmission device
JP2935860B2 (en) Facsimile machine
JP2706086B2 (en) Character recognition device
JPS6154581A (en) Character recognizer
JPH09163057A (en) Facsimile equipment with character recognition function
JPS62186660A (en) Destination input system for facsimile equipment
JPH06152896A (en) Picture information recorder
JPH07105137A (en) Data processor
JPH1117833A (en) Facsimile equipment and destination sheet preparing device
KR19990074819A (en) How to send a document of a fax
JP2000236426A (en) Facsimile equipment
JPH0737033A (en) Image reading device
JP2000215269A (en) Character recognition system and method therefor
JPH05207256A (en) Facsimile equipment
JPH08195869A (en) Facsimile equipment
JPH10304106A (en) Facsimile equipment
JPH01314468A (en) Facsimile connecting device
JPH04373358A (en) Facsimile
JPH02247788A (en) Reader
JPH01259471A (en) Character recognizing sheet and character recognizing device for sheet concerned
JPH07221786A (en) Mail equipment