JPH09212577A - Character reader - Google Patents
Character readerInfo
- Publication number
- JPH09212577A JPH09212577A JP8021137A JP2113796A JPH09212577A JP H09212577 A JPH09212577 A JP H09212577A JP 8021137 A JP8021137 A JP 8021137A JP 2113796 A JP2113796 A JP 2113796A JP H09212577 A JPH09212577 A JP H09212577A
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- displayed
- recognition
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】この発明は、文字(記号を含
む。)を表す画像データを得て、この画像データに基づ
いて画像中に含まれる文字を認識し、対応する文字コー
ドを出力する文字読取装置に関し、誤って認識された文
字の修正方式に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention obtains image data representing a character (including a symbol), recognizes a character included in an image based on the image data, and outputs a corresponding character code. The present invention relates to a reading device and a correction method for a character that is erroneously recognized.
【0002】[0002]
【従来の技術】文字読取装置(OCR)では、イメージ
スキャナやファクシミリ装置によって光学的に帳票を読
み取ることにより得られた画像データから、文字画像を
切出し、文字の特徴を認識用辞書の内容と比較・照合し
て、特徴量が最も類似している文字の文字コードが、認
識結果として出力される。さらに、特徴量が一定のレベ
ルで類似している複数の認識候補文字を出力することも
できる。しかし、文字の認識は必ずしも正確に行われる
とは限らないため、誤って認識された認識文字を正しい
文字に修正するための修正作業を事後的に行う必要があ
る。このような修正作業は、認識結果である認識文字を
表示装置に表示させ、キーボードやマウス等の指示入力
装置で修正操作をすることによって行われる。2. Description of the Related Art In a character reading device (OCR), a character image is cut out from image data obtained by optically reading a form by an image scanner or a facsimile device, and the character features are compared with the contents of a recognition dictionary. -By collation, the character code of the character having the most similar feature amount is output as the recognition result. Furthermore, it is possible to output a plurality of recognition candidate characters having similar feature amounts at a certain level. However, since the recognition of characters is not always performed correctly, it is necessary to perform a correction operation to correct a recognition character that is erroneously recognized as a correct character. Such correction work is performed by displaying a recognition character as a recognition result on a display device and performing a correction operation with an instruction input device such as a keyboard or a mouse.
【0003】次に誤認識文字を修正するための動作につ
いて説明する。図7において、表示装置の画面に表示さ
れた各認識結果表示フィールド21a〜21iのうち、
誤認識と思われる文字にカーソル22を合わせてクリッ
ク操作を行うことにより、当該認識文字の認識過程にお
いて抽出された複数の認識候補文字群23が表示され
る。ここの例では、類似度が第1位の文字”E”が認識
結果である文字となり、2番目に大きな類似度の文字”
B”は、第2位の認識候補文字、3番目に大きな類似度
の候補文字”6”は第3位の認識候補文字となる。(以
下4番目以降も同様)Next, the operation for correcting the erroneously recognized character will be described. In FIG. 7, among the recognition result display fields 21a to 21i displayed on the screen of the display device,
A plurality of recognition candidate character groups 23 extracted in the recognition process of the recognized character are displayed by placing the cursor 22 on the character that is considered to be erroneously recognized and performing a click operation. In this example, the character "E" having the first degree of similarity is the character that is the recognition result, and the character "2" having the second highest degree of similarity is "
B "is the second-ranked recognition candidate character, and third is the candidate character with the highest degree of similarity," 6 "is the third-ranked recognition candidate character.
【0004】表示された各認識候補文字は、類似度の大
きな文字であるから、この候補文字群のなかに正しい文
字が含まれている可能性が高い。そこで、認識候補文字
群23を表示させた後、操作者はさらに表示された認識
候補文字の中の正しい認識候補文字の位置にカーソル2
2を移動させ、この位置でクリック操作を行う。候補文
字の中に正しい認識文字が無い場合には、キーボードか
ら正しい文字を入力する。これらの操作により、誤認識
文字の修正を行なう。なお、この従来技術の方式は、例
えば特開平5−324901号公報に示されている。Since each displayed recognition candidate character is a character having a high degree of similarity, there is a high possibility that the correct character is included in this candidate character group. Therefore, after displaying the recognition candidate character group 23, the operator further moves the cursor 2 to the position of the correct recognition candidate character in the displayed recognition candidate characters.
Move 2 and click at this position. If there is no correct recognized character among the candidate characters, enter the correct character from the keyboard. By these operations, the erroneously recognized character is corrected. Note that this conventional technique is disclosed in, for example, Japanese Patent Laid-Open No. 5-324901.
【0005】[0005]
【発明が解決しようとする課題】従来の認識過程におい
て抽出された類似度の高い認識候補文字群のみを表示し
て、その中から正解文字を選択する方法では、認識候補
文字群の中に、正解文字が含まれていない場合には、正
しい文字を選ぶことはできず、別の操作(例えばキ−ボ
−ド操作)によって正しい文字を新規に入力する必要が
あり、修正効率が悪いという問題点があった。According to the method of displaying only the recognition candidate character group having a high degree of similarity extracted in the conventional recognition process and selecting the correct answer character from the group, the recognition candidate character group is If the correct character is not included, the correct character cannot be selected, and the correct character must be newly input by another operation (for example, keyboard operation), resulting in poor correction efficiency. There was a point.
【0006】この発明は、上記のような問題点を解消す
るためになされたもので、常に同じ操作で、認識結果を
正しい文字に修正できるようにする文字読取装置を提供
することを目的とする。The present invention has been made to solve the above problems, and an object of the present invention is to provide a character reading device capable of correcting a recognition result into a correct character by always performing the same operation. .
【0007】[0007]
【課題を解決するための手段】上記目的を達成するため
の請求項1記載の発明は、画像データで表された帳票の
文字を認識して、認識結果である認識文字を出力する認
識処理手段と、この認識処理手段が出力する認識文字を
画面に表示する認識文字表示手段と、この表示手段によ
り表示された認識文字のうち、任意の文字を画面上のカ
ーソルで指示するための文字指示手段とを備えた文字読
取装置において、各文字記入フィ−ルドの文字種情報と
文字種情報に対応した記入される可能性のあるすべての
候補文字群情報とを保持したフォ−マットデ−タ部を設
け、文字指示手段からの指示入力に応答して、当該文字
位置が含まれる文字記入フィ−ルドの文字種に対応した
フォ−マットデ−タ部の全ての候補文字群の少なくとも
一部を上記画面に表示させ、この候補文字群中の任意の
候補文字を上記文字指示手段で選択することにより、上
記文字指示手段で指示された文字位置の文字と置換する
よう構成したものである。In order to achieve the above object, the invention according to claim 1 recognizes a character of a form represented by image data and outputs a recognized character as a recognition result. And a recognition character display means for displaying the recognition character output by the recognition processing means on the screen, and a character designating means for designating an arbitrary character among the recognition characters displayed by the display means with a cursor on the screen. In a character reading device equipped with, a format data section holding character type information of each character entry field and all candidate character group information that may be entered corresponding to the character type information is provided, In response to the instruction input from the character pointing means, at least a part of all the candidate character groups of the format data portion corresponding to the character type of the character entry field including the character position is displayed on the screen. It indicated thereby, by selecting an arbitrary candidate character in the candidate character group in the character indicating means, which is constituted so as to replace the character designated character position the character indicating means.
【0008】また、請求項2記載の発明は、請求項1記
載の発明において、上記文字指示手段により指示された
文字の認識処理において抽出された複数の認識候補文字
群を先ず表示させ、その後上記フォ−マットデ−タ部の
候補文字群の表示を行わせるものである。また、請求項
3記載の発明は、請求項1記載の発明において、上記文
字指示手段により指示された文字の類似度が所定値より
低い場合に、上記候補文字群の表示を行わせるものであ
る。According to a second aspect of the present invention, in the first aspect of the present invention, a plurality of recognition candidate character groups extracted in the recognition process of the character designated by the character designating means are first displayed, and then the above The candidate character group of the format data portion is displayed. In the invention according to claim 3, in the invention according to claim 1, the candidate character group is displayed when the degree of similarity of the characters designated by the character designating means is lower than a predetermined value. .
【0009】[0009]
実施の形態1.図1は帳票の具体的な記入例を示すもの
で、1は帳票を示している。この帳票1は、文字記入フ
ィールド2a、2b、・・・から成り、各文字記入フィ
ールド2a、2b、・・・には文字が記入または印刷さ
れている。図2はこの発明の実施の形態1の文字読取装
置の概略構成図である。11は光電変換部で、図1で示
したような帳票1の表面を光学的に走査し、イメージデ
ータに変換する機能を持っている。文字認識部12で
は、このイメージデータからフォーマットデータ部14
に従って、各文字をそれぞれ切出し、その特徴パラメー
タを抽出して、特徴パラメータで示される各文字毎に、
文字認識辞書13に登録された標準パターンとの類似度
計算を行ない、記入または印刷された文字に対して、そ
れぞれ候補文字を求めている。文字認識部12で求めた
認識結果の第1候補各文字が、表示部15に表示され
る。16は前述の処理を制御するコントローラ、17、
18は、それぞれ、各種の情報を入力する為のキーボー
ドおよびマウスである。なお、上記フォーマットデータ
部14には、図5のように、各文字記入フィード単位に
認識対象文字種の情報51と、文字種情報に対応した候
補文字群情報52とを保持している。Embodiment 1. FIG. 1 shows a concrete entry example of a form, and 1 shows the form. This form 1 is composed of character entry fields 2a, 2b, ..., And characters are entered or printed in each character entry field 2a, 2b ,. FIG. 2 is a schematic configuration diagram of the character reading device according to the first embodiment of the present invention. A photoelectric conversion unit 11 has a function of optically scanning the surface of the form 1 as shown in FIG. 1 and converting it into image data. The character recognition unit 12 converts the image data into the format data unit 14
According to the above, each character is cut out, its characteristic parameter is extracted, and for each character indicated by the characteristic parameter,
Similarity with the standard pattern registered in the character recognition dictionary 13 is calculated, and candidate characters are obtained for each of the written or printed characters. Each character of the first candidate of the recognition result obtained by the character recognition unit 12 is displayed on the display unit 15. 16 is a controller for controlling the above-mentioned processing, 17,
Reference numerals 18 are a keyboard and a mouse for inputting various information. As shown in FIG. 5, the format data section 14 holds the information 51 of the character type to be recognized for each character entry feed and the candidate character group information 52 corresponding to the character type information.
【0010】上記構成による装置において、図1の帳票
を入力し、文字認識部12で認識した類似度の一番高い
文字の集まりを表示部15に表示した例が、図3(A)
である。図3(A)において、21a、21b、21c
・・・・は、それぞれ図1の各文字記入フィールド2
a、2b、2c・・・・の記入文字に対応した認識結果
表示フィールドである。図3(A)において、マウス1
8でマウスカーソル22を移動させ、例えば表示フィー
ルド21g中の修正対象文字”A”をクリックすると、
フォーマットデータ部14に定義されている、文字記入
フィールド2gに対応した認識対象文字種の候補文字群
情報が図3(B)に示すようにウィンドウ23に表示さ
れる。ウィンドウ23の中から正解文字”E”を選択し
てクリックする事により、フィールド21gのカーソル
位置の文字”A”を、ウィンドウ23で選択した文字”
E”に置き換える。以上のように、この実施の形態にお
いては、誤認識文字を常に同じ操作(例えばマウス操
作)によって修正する事ができる。In the apparatus having the above-mentioned configuration, an example in which the form shown in FIG. 1 is input and the group of characters having the highest degree of similarity recognized by the character recognition section 12 is displayed on the display section 15 is shown in FIG.
It is. In FIG. 3A, 21a, 21b, 21c
... indicates each character entry field 2 in Fig. 1
It is a recognition result display field corresponding to the written characters a, 2b, 2c ... In FIG. 3 (A), mouse 1
When the mouse cursor 22 is moved with 8, and the correction target character "A" in the display field 21g is clicked,
The candidate character group information of the recognition target character type corresponding to the character entry field 2g defined in the format data section 14 is displayed in the window 23 as shown in FIG. 3 (B). By selecting the correct letter "E" from the window 23 and clicking it, the letter "A" at the cursor position in the field 21g is changed to the letter "A" selected in the window 23.
Replace with E ″. As described above, in this embodiment, the misrecognized character can always be corrected by the same operation (for example, mouse operation).
【0011】また、マウス18でマウスカーソル22を
移動させ、図4のように、フィールド21hをクリック
したとすると、そのフィールド2hに入力可能な文字種
の候補文字群”A、B、C”のみが表示されるため、簡
単に選択できるだけでなく、入力を許可していない文字
の誤入力を防止することもできる。When the mouse cursor 22 is moved with the mouse 18 and the field 21h is clicked as shown in FIG. 4, only the candidate character groups "A, B, C" of the character types that can be entered in the field 2h are displayed. Since it is displayed, not only can it be easily selected, but it is also possible to prevent erroneous input of characters that are not allowed to be input.
【0012】実施の形態2.図6はこの発明の実施の形
態2のFAXOCR装置の概略構成図で、図2の光電変
換部11にあたる部分をFAX受信部19に置き換えた
ものであり、外部から帳票の情報がFAX情報としてF
AX受信部19に到着した後の動作は、上記実施の形態
1と同様である。Embodiment 2. FIG. 6 is a schematic configuration diagram of a FAXOCR device according to a second embodiment of the present invention, in which a portion corresponding to the photoelectric conversion unit 11 in FIG. 2 is replaced with a FAX receiving unit 19, and information of a form is externally F information as FAX information.
The operation after arriving at the AX receiving unit 19 is the same as that in the first embodiment.
【0013】実施の形態3.実施の形態1及び実施の形
態2では、候補文字の表示ウィンドウ23では、図5の
フォーマットデータ部で定義された順序で表示を行って
いたが、文字の認識過程における類似度の一番高い文字
が、このフォーマットデータに定義された文字の中に含
まれていた場合には、その文字を候補文字の先頭に移動
して表示し、類似度の2番目に高い文字があった場合に
は、2番目に移動して表示し、3番目以降の文字につい
ても同様にする事により、更に選択する文字を選びやす
くすることもできる。Embodiment 3 In the first and second embodiments, the display window 23 for candidate characters is displayed in the order defined in the format data section of FIG. 5, but the character with the highest similarity in the character recognition process is displayed. , Is included in the characters defined in this format data, the character is moved to the beginning of the candidate character and displayed. If there is a character with the second highest similarity, It is possible to make it easier to select a character to be selected by moving the character to the second position and displaying it, and doing the same for the third character and thereafter.
【0014】実施の形態4.文字の認識過程における類
似度の一番高い文字の類似度が、あらかじめ指定した値
よりも高い文字に対しては従来通り、類似度の高い文字
を候補としてウィンドウ23に表示し、類似度の一番高
い文字の類似度が、あらかじめ指定した値よりも低い文
字に対しては、この発明のように、フォーマットデータ
部で定義された文字すべてを表示するというように、候
補文字の表示方法を自動的に切替えて、文字の訂正をし
やすくすることもできる。Embodiment 4 As for the character having the highest similarity in the character recognition process, which is higher than the value designated in advance, the character having the highest similarity is displayed in the window 23 as a candidate as in the conventional case, and the similarity between the characters is displayed. For the character whose similarity of the highest character is lower than the value specified in advance, the method of displaying the candidate characters is automatically performed, such as displaying all the characters defined in the format data section like this invention. It is also possible to make the correction of characters easier by changing the setting.
【0015】実施の形態5.上記文字指示手段により指
示された文字の認識処理において抽出された複数の認識
候補文字群を先ず表示させ、これらの認識候補文字群中
に目的の文字が含まれていない(又はみつからない)場
合に、その後上記フォ−マットデ−タ部の候補文字群の
表示を行わせるよう構成しても差し支えない。このよう
に構成すれば一般的には認識候補文字群中に目的の文字
が含まれている場合が多いことから、第一次の修正を効
率良く行えるとともに、認識候補文字群中に目的の文字
が含まれていない場合の修正入力も効率的に行え、特に
沢山の候補文字群があるフィ−ルドについて有効とな
る。Embodiment 5 When a plurality of recognition candidate character groups extracted in the character recognition process designated by the character designating means are first displayed, and the target character is not included (or found) in these recognition candidate character groups, After that, the candidate character group of the format data portion may be displayed. With such a configuration, in general, the target character is often included in the recognition candidate character group, so the primary correction can be efficiently performed, and the target character in the recognition candidate character group can be efficiently performed. The correction input can also be efficiently performed when no character is included, and is particularly effective for a field having many candidate character groups.
【0016】[0016]
【発明の効果】この発明の文字読取装置によれば、認識
文字を画面に表示させて、誤読または認識不能文字を修
正する際に、当該修正対象文字をクリックする事によ
り、当該位置に記入される可能性のある文字すべてが候
補文字として表示されるため、必ず候補文字の中に正解
文字が存在し、常に同じ操作によって修正を行うことが
可能になる。According to the character reading apparatus of the present invention, when the recognized character is displayed on the screen and the erroneous reading or the unrecognizable character is corrected, the correction target character is clicked to write the character at the position. Since all possible characters are displayed as candidate characters, correct characters always exist in the candidate characters, and it is possible to make corrections by always performing the same operation.
【0017】また、候補文字の選択ミスや、キーボード
からの誤入力により、当該位置に入力してはならない文
字等を入力してしまう事を防止できる。Further, it is possible to prevent input of a character or the like that should not be input to the position due to a selection error of a candidate character or an incorrect input from the keyboard.
【図1】この発明で取り扱う帳票の具体的な記入例を示
す図である。FIG. 1 is a diagram showing a specific example of filling in a form handled in the present invention.
【図2】この発明の実施の形態1の文字読取装置の構成
を示す概略構成図である。FIG. 2 is a schematic configuration diagram showing a configuration of the character reading device according to the first embodiment of the present invention.
【図3】この発明による認識結果表示及び修正指示画面
例を示す図である。FIG. 3 is a diagram showing an example of a recognition result display and correction instruction screen according to the present invention.
【図4】この発明による認識結果表示及び修正指示画面
の別例を示す図である。FIG. 4 is a diagram showing another example of a recognition result display and a correction instruction screen according to the present invention.
【図5】この発明で用いるフォーマットデータ部のデ−
タ例を示す概念図である。FIG. 5 shows the format data section data used in the present invention.
It is a conceptual diagram which shows a data example.
【図6】この発明の実施の形態2のFAXOCR装置の
構成を示す概略構成図である。FIG. 6 is a schematic configuration diagram showing a configuration of a FAXOCR device according to a second embodiment of the present invention.
【図7】従来例の文字読取装置の修正画面を示す画面図
である。FIG. 7 is a screen view showing a correction screen of a conventional character reading device.
1 OCR帳票 2(2a〜2i) 記入フィールド 11 光電変換部 12 文字認識部 13 文字認識辞書 14 フォーマットデータ部 15 表示部 17 キーボード 18 マウス 1 OCR Form 2 (2a to 2i) Entry Field 11 Photoelectric Conversion Section 12 Character Recognition Section 13 Character Recognition Dictionary 14 Format Data Section 15 Display Section 17 Keyboard 18 Mouse
Claims (3)
データを読み取り、認識する認識処理部と、この認識処
理部より出力される認識文字を表示する文字表示手段
と、この表示手段に表示された文字群の中から任意の文
字を指示するための文字指示手段とを備えた文字読取装
置において、各文字記入フィ−ルドの文字種情報と文字
種情報に対応した候補文字群情報とを保持したフォ−マ
ットデ−タ部を設け、上記文字指示手段で指示された文
字位置が含まれる文字記入フィ−ルドの文字種に対応し
たフォ−マットデ−タ部の全ての候補文字の少なくとも
一部を前記画面に表示させ、この候補文字群中の任意の
候補文字を選択することにより、前記文字指示手段で指
示された文字位置の文字と置換するよう構成したことを
特徴とする文字読取装置。1. A recognition processing unit for reading and recognizing handwritten or printed character image data, a character display unit for displaying a recognition character output from this recognition processing unit, and a display unit displayed on this display unit. In a character reading device provided with a character designating means for designating an arbitrary character from a character group, a character holding information holding character type information of each character entry field and candidate character group information corresponding to the character type information. A matte data section is provided, and at least a part of all candidate characters of the format data section corresponding to the character type of the character entry field including the character position designated by the character designating means is displayed on the screen. The character reading device is characterized in that by selecting an arbitrary candidate character from the candidate character group, the character at the character position designated by the character designating means is replaced. Place.
の認識処理において抽出された複数の認識候補文字群を
先ず表示させ、その後上記フォ−マットデ−タ部の候補
文字群の表示を行わせることを特徴とする請求項1記載
の文字読取装置。2. A plurality of recognition candidate character groups extracted in the character recognition processing of the character designated by the character designating means are first displayed, and then the candidate character group of the format data section is displayed. The character reading device according to claim 1, wherein:
の類似度が所定値より低い場合に、上記候補文字群の表
示を行わせることを特徴とする請求項1記載の文字読取
装置。3. The character reading device according to claim 1, wherein the candidate character group is displayed when the similarity of the characters designated by the character designating means is lower than a predetermined value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08021137A JP3077580B2 (en) | 1996-02-07 | 1996-02-07 | Character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08021137A JP3077580B2 (en) | 1996-02-07 | 1996-02-07 | Character reader |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09212577A true JPH09212577A (en) | 1997-08-15 |
JP3077580B2 JP3077580B2 (en) | 2000-08-14 |
Family
ID=12046519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08021137A Expired - Lifetime JP3077580B2 (en) | 1996-02-07 | 1996-02-07 | Character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3077580B2 (en) |
-
1996
- 1996-02-07 JP JP08021137A patent/JP3077580B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3077580B2 (en) | 2000-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5717794A (en) | Document recognition method and system | |
US5022081A (en) | Information recognition system | |
US5903666A (en) | Methods of splitting and joining handwritten input | |
US11836442B2 (en) | Information processing apparatus, method, and storage medium for associating metadata with image data | |
US6504540B1 (en) | Method and apparatus for altering one or more attributes of one or more blocks of image data in a document | |
WO2002003240A1 (en) | Proofreading system of chinese characters by means of one-to-one comparison | |
JP3319203B2 (en) | Document filing method and apparatus | |
JP3077580B2 (en) | Character reader | |
JPH06251187A (en) | Method and device for correcting character recognition error | |
KR100470346B1 (en) | The method for clustering an image of a character and the method for high-speed inputting and correcting a character by using the same | |
JP2829186B2 (en) | Optical character reader | |
JPH06333083A (en) | Optical character reader | |
JP2004341754A (en) | Character recognition result correcting device and its method, and character recognition result correcting program | |
JPS61198376A (en) | Optical character reader | |
JP3221969B2 (en) | Character recognition device | |
JPH08137987A (en) | Optical character reader | |
JPH04199483A (en) | Document recognizing and correcting device | |
JPH01287755A (en) | Information input device with correcting function | |
JPH0520492A (en) | Document recognizing/correcting device | |
JPS63208180A (en) | Character recognizing device | |
JP2001084330A (en) | Mark correction confirming system and method and program recording medium for confirmation | |
JPH08185470A (en) | Document reader | |
JPH0282379A (en) | Character recognizing device | |
JPS6398788A (en) | Recognizing device | |
JPS61198375A (en) | Optical character reader |