JPH04220787A - Character reader - Google Patents

Character reader

Info

Publication number
JPH04220787A
JPH04220787A JP2404804A JP40480490A JPH04220787A JP H04220787 A JPH04220787 A JP H04220787A JP 2404804 A JP2404804 A JP 2404804A JP 40480490 A JP40480490 A JP 40480490A JP H04220787 A JPH04220787 A JP H04220787A
Authority
JP
Japan
Prior art keywords
unit
word
control method
recognition
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2404804A
Other languages
Japanese (ja)
Inventor
Haruo Kondo
春雄 近藤
Takeyuki Sugimoto
建行 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2404804A priority Critical patent/JPH04220787A/en
Publication of JPH04220787A publication Critical patent/JPH04220787A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To prevent a word not registered in a word dictionary from being erroneously checked with another word by preventing the word not registered in the word dictionary from being checked in the word dictionary. CONSTITUTION:According to a control method designated by a control method destination part 17, a data control part 13 transmits recognition result received from a recognition part 10 to a word checking part 14 or correction part 12. By preventing the word not registered in the dictionary from being checked in the dictionary, time for checking a character not required for checking can be saved. Furthermore, since the erroneous checking can be prevented, the character erroneously checked cannot be missed and the time for correcting the erroneously checked character can be saved.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、入力されたイメージデ
ータを文字として認識し、その認識結果を単語辞書と照
合する文字読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character reading device that recognizes input image data as characters and compares the recognition results with a word dictionary.

【0002】0002

【従来の技術】従来の装置は、特開平1−82192号
公報に記載のように、認識結果と単語辞書の単語とを照
合した場合、単語照合出来た文字と単語照合出来なかっ
た文字をオペレータが区別できるよう表示方法を変えて
表示している。
2. Description of the Related Art As described in Japanese Patent Application Laid-Open No. 1-82192, when a recognition result is compared with a word in a word dictionary, a conventional device is used to compare characters that can be matched with words and characters that cannot be matched with words. The display method is changed to make it easier to distinguish between the two.

【0003】0003

【発明が解決しようとする課題】上記従来技術は、オペ
レータが単語照合出来なかった文字に注目して修正を行
なうものであり、単語照合できた文字は正しく照合され
たものとしているので、誤って単語照合された文字は見
過ごされる可能性があるという問題点がある。特に、単
語辞書に登録されていない単語の場合は、誤って照合さ
れる可能性が大きい。
[Problem to be Solved by the Invention] In the above-mentioned conventional technology, the operator pays attention to and corrects the characters that could not be matched with words, and the characters that could be matched with words are assumed to have been correctly matched. The problem is that characters that have been word-matched may be overlooked. In particular, in the case of words that are not registered in the word dictionary, there is a high possibility that the words will be erroneously matched.

【0004】本発明の目的は、誤って照合された結果を
オペレータが見過ごすことを防ぐことにある。
An object of the present invention is to prevent an operator from overlooking erroneously verified results.

【0005】[0005]

【課題を解決するための手段】上記目的を達成するため
に、所定の単位毎に辞書と照合するか否かを予め指定す
る。
[Means for Solving the Problems] In order to achieve the above object, it is specified in advance whether or not to check with a dictionary for each predetermined unit.

【0006】[0006]

【作用】所定の単位毎に辞書と照合するか否かを予め指
定し、辞書に載っていない単語は辞書と照合しないよう
にすることにより、辞書に載っていない単語が、誤って
他の単語に照合されないようにする。
[Operation] By specifying in advance whether or not to check with a dictionary for each predetermined unit, and by preventing words that are not listed in the dictionary from being checked against the dictionary, words that are not listed in the dictionary can be mistakenly compared to other words. to prevent it from being matched against.

【0007】[0007]

【実施例】以下、本発明の一実施例を図面により詳細に
説明する。図1は本発明の一実施例の文字読取装置のブ
ロック図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be explained in detail below with reference to the drawings. FIG. 1 is a block diagram of a character reading device according to an embodiment of the present invention.

【0008】認識部10は、帳票上に記入された文字を
、イメージデータとして読取り、一文字づつ文字コード
として認識し、認識結果を認識結果出力部11へ送る。 認識結果出力部11は、認識部10から送られてくる1
文字毎の認識結果を、オペレータが予め指定した所定の
単位(例えば、行単位、フィールド単位、帳票単位等)
毎にデータ制御部13へ送る。データ制御部13は、制
御方法指定部17によって予め指定された制御方法によ
り、所定の単位毎の認識結果を修正部12または、単語
照合部14へ送る。単語照合部14は、データ制御部1
3から送られてきた認識結果を単語辞書15と照合し、
照合した結果を認識結果としてデータ制御部13へ送り
、データ制御部13は修正部12へ送る。修正部12は
送られてきた認識結果を表示し、オペレータは必要があ
れば認識結果を修正する。そして、オペレータの指示に
従い、認識結果を出力部16へ送る。又、オペレータが
認識結果に対して単語照合を行う指示をした時は、修正
部12は認識結果をデータ制御部13へ送り、データ制
御部13は認識結果を単語照合部14へ送る。 出力部16は、修正部12から送られてきた認識結果を
、磁気ディスク等の記憶装置等に出力する。制御方法指
定部17では、データ制御部13での制御方法を予めオ
ペレータが指定できる。
The recognition unit 10 reads the characters written on the form as image data, recognizes each character as a character code, and sends the recognition results to the recognition result output unit 11. The recognition result output unit 11 receives 1 sent from the recognition unit 10.
The recognition results for each character are determined in a predetermined unit specified by the operator (for example, line by line, field by field, form by form, etc.)
The data is sent to the data control unit 13 every time. The data control section 13 sends the recognition result for each predetermined unit to the correction section 12 or the word matching section 14 according to a control method specified in advance by the control method specification section 17 . The word matching section 14 is connected to the data control section 1
The recognition results sent from 3 are compared with the word dictionary 15,
The collated results are sent as recognition results to the data control section 13, and the data control section 13 sends them to the correction section 12. The correction unit 12 displays the sent recognition results, and the operator corrects the recognition results if necessary. Then, the recognition result is sent to the output section 16 according to the operator's instructions. Further, when the operator instructs to perform word matching on the recognition results, the correction section 12 sends the recognition results to the data control section 13, and the data control section 13 sends the recognition results to the word matching section 14. The output unit 16 outputs the recognition result sent from the correction unit 12 to a storage device such as a magnetic disk. In the control method specifying section 17, the operator can specify the control method in the data control section 13 in advance.

【0009】図2は、データ制御部によって制御される
認識結果の流れを示している。流れには、認識結果出力
部11→修正部12の流れ21と、認識結果出力部11
→単語照合部14→修正部12の流れ22と、修正部1
2→単語照合部14→修正部12の流れ23の3種類の
流れがある。
FIG. 2 shows the flow of recognition results controlled by the data control section. The flow includes a flow 21 from the recognition result output section 11 to the correction section 12, and a flow 21 from the recognition result output section 11 to the correction section 12.
→ Word matching section 14 → Flow 22 of correction section 12 and correction section 1
There are three types of flows: 2 -> word matching section 14 -> correction section 12 flow 23.

【0010】制御方法指定部17は、認識結果の流れを
組合わせて指定できる。組合せは、次の4通りがあり、
流れ21の場合を制御方法1とする。流れ21と流れ2
3の場合を制御方法2とする。流れ22の場合を制御方
法3とする。流れ22と流れ23の場合を制御方法4と
する。制御方法1は所定の単位に記載されている単語が
単語辞書に登録されていない場合に指定する。制御方法
2は、所定の単位に記載されている単語の一部分が単語
辞書に登録されている場合に指定する。制御方法3と4
は、所定の単位に記載されている単語の大部分が単語辞
書に登録されている場合に指定する。
The control method designation section 17 can designate a combination of flows of recognition results. There are four combinations as follows:
The case of flow 21 is defined as control method 1. Flow 21 and Flow 2
Case 3 is defined as control method 2. The case of flow 22 is assumed to be control method 3. The case of flow 22 and flow 23 is assumed to be control method 4. Control method 1 is specified when the word written in a predetermined unit is not registered in the word dictionary. Control method 2 is specified when a part of the word written in a predetermined unit is registered in the word dictionary. Control methods 3 and 4
is specified when most of the words written in a predetermined unit are registered in the word dictionary.

【0011】次に、実際に帳票を文字読取装置に入力し
、文字を読取らせる場合の例について説明する。
Next, an example of actually inputting a form into a character reading device and having the characters read will be explained.

【0012】図3は文字読取装置に入力する帳票の例で
ある。この例では、帳票は、氏名(漢字)のフィールド
31と、氏名(フリガナ)のフィールド32と、郵便番
号のフィールド33と、住所のフィールド34と、商品
コードのフィールド35と商品名のフィールド36から
なる。
FIG. 3 shows an example of a form to be input into a character reading device. In this example, the form consists of a name (Kanji) field 31, a name (furigana) field 32, a postal code field 33, an address field 34, a product code field 35, and a product name field 36. Become.

【0013】図4は制御方法を指定する場合に表示され
る画面の例である。図5は内部テーブルである。まずオ
ペレータは、制御方法指定部17において、帳票を読取
らせる前に、所定の単位を選択し、この例ではフィール
ド単位が選択されているので、フィールド毎に制御方法
を指定し、単語辞書と照合をする場合には、照合方法に
て、照合する辞書を指定する。この例では、フィールド
31とフィールド32の制御方法は制御方法3であり、
照合方法は氏名、つまり氏名の登録されている辞書と照
合する。フィールド33とフィールド34の制御方法は
制御方法4であり、照合方法は住所である。フィールド
35の制御方法は制御方法1であり、照合方法はしない
、つまり辞書とは照合しない。フィールド36の制御方
法は制御方法2であり、照合方法は商品名である。制御
方法と照合方法指定後、制御方法指定部17は内部テー
ブルに変換し、データ制御部へ送る。同一の制御方法と
照合方法を行うものはグループをつくる。この例では、
フィールド31とフィールド32はグループAに属して
いる。フィールド33とフィールド34はグループBに
、フィールド35はグループCに、フィールド36はグ
ループDに属している。
FIG. 4 is an example of a screen displayed when specifying a control method. FIG. 5 is an internal table. First, the operator selects a predetermined unit in the control method specifying section 17 before reading the form, and in this example, since the field unit is selected, the operator specifies the control method for each field, and selects a word dictionary. When performing a check, specify the dictionary to check using the check method. In this example, the control method for fields 31 and 32 is control method 3,
The matching method is to match the name, that is, a dictionary in which the name is registered. The control method for fields 33 and 34 is control method 4, and the verification method is address. The control method for the field 35 is control method 1, which does not perform a checking method, that is, does not check against a dictionary. The control method in field 36 is control method 2, and the verification method is product name. After specifying the control method and verification method, the control method specifying section 17 converts it into an internal table and sends it to the data control section. Items that use the same control method and verification method are grouped. In this example,
Field 31 and field 32 belong to group A. Field 33 and field 34 belong to group B, field 35 belongs to group C, and field 36 belongs to group D.

【0014】図6は読取り時の動作を示すフローチャー
トである。図7は修正時のフローチャートである。デー
タ制御部13は、認識結果出力部11から認識結果が送
られてきたとき(文字読取り時)は、図6のフローチャ
ートに示す動作を行い、修正部12から読取りデータが
送られてきたとき(修正時)は図7のフローチャートに
示す動作を行う。
FIG. 6 is a flowchart showing the operation during reading. FIG. 7 is a flowchart at the time of correction. The data control unit 13 performs the operation shown in the flowchart of FIG. 6 when the recognition result is sent from the recognition result output unit 11 (when reading characters), and when the read data is sent from the correction unit 12 ( (at the time of correction), the operation shown in the flowchart of FIG. 7 is performed.

【0015】図3の帳票を文字読取装置に入力した場合
、認識部10は、帳票上の文字をイメージデータとして
読取り、一文字づつ切り出し、文字コードとして認識し
、認識結果出力部11へ送る。認識結果出力部11は、
この場合所定の単位がフィールド単位なので、フィール
ド毎の認識結果をデータ制御部13へ送る(ステップ6
1)。データ制御部13は、帳票上の全てのフィールド
の認識結果を取得したら(ステップ62)、図5のテー
ブルを参照し、各グループ毎に処理を行う。制御方法が
3又は4のグループは(ステップ64)、当該グループ
の全てのフィールドのデータを単語照合部14へ送り(
ステップ65)、照合方法に従い照合を行う(ステップ
66)。次に、照合結果により、当該グループの認識結
果を照合結果と置換する(ステップ67)。1グループ
の処理終了後、次のグループの処理を実行する(ステッ
プ68)。全てのグループの処理が終了すると(ステッ
プ63)全データを修正部12へ送る(ステップ69)
When the form shown in FIG. 3 is input to the character reading device, the recognition unit 10 reads the characters on the form as image data, cuts out each character one by one, recognizes it as a character code, and sends it to the recognition result output unit 11. The recognition result output unit 11 is
In this case, since the predetermined unit is a field unit, the recognition result for each field is sent to the data control unit 13 (step 6
1). After acquiring the recognition results for all fields on the form (step 62), the data control unit 13 refers to the table in FIG. 5 and performs processing for each group. For groups whose control method is 3 or 4 (step 64), data of all fields of the group is sent to the word matching unit 14 (
Step 65), and verification is performed according to the verification method (Step 66). Next, based on the matching result, the recognition result of the group is replaced with the matching result (step 67). After the processing of one group is completed, the processing of the next group is executed (step 68). When processing for all groups is completed (step 63), all data is sent to the correction unit 12 (step 69).
.

【0016】修正部12では、データ制御部13から受
け取った認識結果を表示し、正解が第一候補の時はそれ
を確定させて、正解が2位以下の時は候補を選択して、
出力部16に認識結果を送る。正解が得られなかった時
、単語辞書と照合しない場合は、認識結果を修正して正
解を得て出力部16に認識結果を送る。単語辞書と照合
する場合は、修正せずに、又は、一部分を修正して辞書
照合する。例えば、オペレータが図3のフィールド36
のデータに単語照合を行う場合には、オペレータは予め
決められた方法(例えば、画面上でカーソルをフィール
ド36に位置付け、予め定められたキーを押す等)で修
正部12に指示を出す。修正部12は、フィールド36
に単語照合をかけることをデータ制御部13に教える。 データ制御部13は、修正部12より教えられたフィー
ルド36を図5のテーブルよりサーチし、当該グループ
の属するグループを取得する(ステップ71)。取得し
たグループの制御方法が、2又は4のとき(ステップ7
2)当該グループの全てのフィールドのデータを単語照
合部14へ送り(ステップ73)、照合方法に従って照
合する(ステップ74)。照合後、照合結果を修正部1
2へ送る(ステップ75)。
The correction unit 12 displays the recognition result received from the data control unit 13, and when the correct answer is the first candidate, confirms it, and when the correct answer is the second or lower candidate, selects the candidate.
The recognition result is sent to the output unit 16. When a correct answer is not obtained and it is not checked against the word dictionary, the recognition result is corrected to obtain the correct answer and the recognition result is sent to the output unit 16. When checking against a word dictionary, the dictionary is checked without modification or with partial modification. For example, if the operator selects field 36 in FIG.
When performing word matching on the data, the operator issues an instruction to the correction unit 12 in a predetermined manner (for example, by positioning the cursor on the screen in the field 36 and pressing a predetermined key). The correction unit 12 corrects the field 36
The data control unit 13 is instructed to apply word matching to the data. The data control unit 13 searches the table of FIG. 5 for the field 36 taught by the modification unit 12, and obtains the group to which the group belongs (step 71). When the control method of the acquired group is 2 or 4 (step 7
2) Send the data of all fields of the group to the word matching unit 14 (step 73) and match according to the matching method (step 74). After verification, modify the verification results in section 1
2 (step 75).

【0017】制御方法2又は4を指定していても、認識
が正しく行われていれば、決められた操作をすることに
より単語照合をやめることもできる。逆に、単語照合し
ないことになっていても、後から単語照合することにで
きる。
Even if control method 2 or 4 is specified, if recognition is performed correctly, word matching can be stopped by performing a predetermined operation. Conversely, even if it is not supposed to match words, it is possible to perform word matching later.

【0018】本実施例では、制御方法を予め制御方法指
定部から指定したが、制御方法の指定は、帳票上に記入
されるデータの内容(例えば、識別ID番号等)を読取
り、制御方法指定部17が判断して、所定の単位毎に制
御方法を切換えるようにすることも可能である。
In this embodiment, the control method is specified in advance from the control method specifying section, but the control method is specified by reading the content of data written on the form (for example, identification ID number, etc.). It is also possible for the unit 17 to make a judgment and switch the control method for each predetermined unit.

【0019】[0019]

【発明の効果】辞書に載っていない単語は、辞書と照合
しないことによって、照合の必要の無い文字を、照合す
る時間が省けるという効果がある。また、誤って照合さ
れることがないので、誤って照合された文字を見過ごす
ことがなく、誤って照合された文字を修正する時間がか
からないという効果がある。
[Effects of the Invention] Words not listed in the dictionary are not checked against the dictionary, thereby saving time for checking characters that do not need to be checked. Furthermore, since there is no chance of erroneous matching, characters that are erroneously matched will not be overlooked, and there is an effect that it will not take time to correct the erroneously matched characters.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明の一実施例の文字読取装置のブロック図
FIG. 1 is a block diagram of a character reading device according to an embodiment of the present invention.

【図2】データ制御部によって制御される認識結果の流
れを示す図
[Figure 2] Diagram showing the flow of recognition results controlled by the data control unit

【図3】帳票の一例を示す図[Figure 3] Diagram showing an example of a form

【図4】制御方法を指定する場合の画面表示の例を示す
[Figure 4] Diagram showing an example of screen display when specifying a control method

【図5】内部テーブルを示す図[Figure 5] Diagram showing an internal table

【図6】文字読取装置の読取り時の処理を示すフローチ
ャート
[Fig. 6] Flowchart showing processing when reading by a character reading device

【図7】文字読取装置の修正時の処理を示すフローチャ
ート
[Figure 7] Flowchart showing processing when correcting the character reading device

【符号の説明】[Explanation of symbols]

10…認識部、11…認識結果出力部、12…修正部、
13…データ制御部、14単語照合部、15…単語辞書
、16…出力部、17…制御方法指定部。
10... Recognition unit, 11... Recognition result output unit, 12... Correction unit,
13... Data control unit, 14 Word matching unit, 15... Word dictionary, 16... Output unit, 17... Control method designation unit.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】入力されたイメージデータを認識し文字コ
ードを認識結果として出力する認識部と、入力された認
識結果を単語辞書と照合し照合結果を認識結果として出
力する単語照合部と、入力された認識結果を表示し、認
識結果の修正を可能とする修正部とを有する文字読取装
置において、認識結果を単語辞書と照合するか否かを所
定の単位毎に指定する制御方法指定部と、該制御方法指
定部によって指定された指示により、認識部から受け取
った認識結果を単語辞書と照合する場合は単語照合部へ
、単語辞書と照合しない場合は修正部へ送るデータ制御
部とを設けたことを特徴とする文字読取装置。
1. A recognition unit that recognizes input image data and outputs a character code as a recognition result; a word matching unit that matches the input recognition result with a word dictionary and outputs the matching result as a recognition result; a control method designation part that designates whether or not to compare the recognition results with a word dictionary for each predetermined unit; , and a data control unit that sends the recognition result received from the recognition unit to the word matching unit when the recognition result received from the recognition unit is checked against the word dictionary, and to the correction unit when the recognition result is not checked against the word dictionary, according to the instruction specified by the control method specifying unit. A character reading device characterized by:
JP2404804A 1990-12-21 1990-12-21 Character reader Pending JPH04220787A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2404804A JPH04220787A (en) 1990-12-21 1990-12-21 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2404804A JPH04220787A (en) 1990-12-21 1990-12-21 Character reader

Publications (1)

Publication Number Publication Date
JPH04220787A true JPH04220787A (en) 1992-08-11

Family

ID=18514465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2404804A Pending JPH04220787A (en) 1990-12-21 1990-12-21 Character reader

Country Status (1)

Country Link
JP (1) JPH04220787A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011237905A (en) * 2010-05-07 2011-11-24 Toshiba Corp Data entry system and data entry method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011237905A (en) * 2010-05-07 2011-11-24 Toshiba Corp Data entry system and data entry method

Similar Documents

Publication Publication Date Title
JPH04220787A (en) Character reader
JPH05274467A (en) Data input device
JPH11213087A (en) Character recognition device
JPH05119896A (en) Character string input system
JPS58144980A (en) Post processing system for character recognition processing
JPH0157837B2 (en)
JPH07210623A (en) Document picture processor
JPH06251187A (en) Method and device for correcting character recognition error
JPH04109379A (en) Ocr system
JPH04218887A (en) Character data connecting device
JPS61175870A (en) Optical character reading device
JPH11232381A (en) Character reader
JPS6385887A (en) Character recognizing system
JPH1115937A (en) Series checking method
JPS60239885A (en) Registering method of post-processing word
JPH03185582A (en) Dictionary correction system for character recognizing device
JPS6055408A (en) Numerical controller
JPH07225763A (en) Document processor
JPH06348886A (en) Optical data reader
JP2000105796A (en) Character reading system and read result correction processing method for the system
JPS626324A (en) Data detector
JPS6252886B2 (en)
JPH0470967A (en) Picture retrieving device
JPH07129651A (en) Input editing method for automatic drawing recognizing device
JPS62247484A (en) Drawing reader