JPH02268389A - Post processor for character reader - Google Patents

Post processor for character reader

Info

Publication number
JPH02268389A
JPH02268389A JP1091117A JP9111789A JPH02268389A JP H02268389 A JPH02268389 A JP H02268389A JP 1091117 A JP1091117 A JP 1091117A JP 9111789 A JP9111789 A JP 9111789A JP H02268389 A JPH02268389 A JP H02268389A
Authority
JP
Japan
Prior art keywords
character
character string
output candidate
processing
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1091117A
Other languages
Japanese (ja)
Inventor
Hiroshi Kanzawa
勘沢 浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1091117A priority Critical patent/JPH02268389A/en
Publication of JPH02268389A publication Critical patent/JPH02268389A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To improve the correction efficiency of an output candidate character string by replacing the output candidate character with an erroneously recognized character or inserting a dummy character as the lack part of a character number and executing knowledge processing. CONSTITUTION:Recognition processing is executed by a character read part 11 concerning the character written to a slip as the object of character read processing. The obtained output candidate character is transferred to a knowledge processing part 12 and held in a candidate character storage part 13. A comparison part 15 collates each output candidate character string at every held word with a character string group, which is stored in a knowledge dictionary storage part 14, and selects the character string of highest similarity. Then, the data of the character string converted by a character conversion part 16 are displayed in a display part 18. When the displayed character string is not proper as a final character read result, the displayed character string is replaced with the erroneously recognized character or the specified character is inserted as the lack part of the character number from an input part 19 and the knowledge processing of the output candidate character string is executed. Thus, the correction efficiency of the output candidate character string can be improved.

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文字認識処理の結果得られた出力候補文字列
と、辞書に格納された文字列群との照合を行なうことに
よって、最終的な文字読取結果を出力する文字読取装置
の後処理装置に関する。
[Detailed Description of the Invention] [Object of the Invention] (Industrial Application Field) The present invention compares an output candidate character string obtained as a result of character recognition processing with a group of character strings stored in a dictionary. Accordingly, the present invention relates to a post-processing device for a character reading device that outputs a final character reading result.

(従来の技術) 一般に、光学的文字読取装置における文字認識処理によ
って得られた認識結果(出力候補文字)は、知識処理と
呼ばれる後処理が行なわれて最終的な文字読取結果が決
定される。知識処理は、例えば帳票に記入される文字列
の内容が、地名、人名、法人名等のように予め限られて
いる場合には、これらの文字列群が格納された知識辞書
を用意しておき、この知忠辞書に格納された文字列群と
出力候補文字列との照合を行なうことによって、最終的
な文字読取結果を決定するものである。
(Prior Art) Generally, recognition results (output candidate characters) obtained by character recognition processing in an optical character reading device are subjected to post-processing called knowledge processing to determine the final character reading result. In knowledge processing, for example, when the contents of character strings to be entered in a form are limited in advance, such as place names, personal names, corporate names, etc., a knowledge dictionary containing these character string groups is prepared. Then, the final character reading result is determined by comparing the character string group stored in this Chichu dictionary with the output candidate character string.

通常、知識処理では、出力候補文字列の文字数と辞書に
格納されている照合の対象となる文字列の文字数とを対
応させている。このため、帳票への記入ミス等により出
力候補文字列の文字数が不足している場合には、本来知
識処理に用いられるべき文字列との照合が行なわれず、
正しい文字読取結果を得ることができない。このような
場合には、出力候補文字列に対してキーボード等から正
しい文字データを入力することによって訂正し、再度知
識処理を行ない、正しい文字読取結果を得るようにして
いる。
Normally, in knowledge processing, the number of characters in an output candidate character string is made to correspond to the number of characters in a character string to be compared that is stored in a dictionary. For this reason, if the number of characters in the output candidate character string is insufficient due to an error in filling out a form, etc., matching with the character string that should originally be used for knowledge processing is not performed.
Unable to obtain correct character reading results. In such a case, the output candidate character string is corrected by inputting correct character data from a keyboard or the like, and knowledge processing is performed again to obtain a correct character reading result.

(発明が解決しようとする課題) ところで、出力候補文字列の文字数が不足している場合
や、出力候補文字列と対応する文字列群との照合が行な
われず誤認識した文字が出力候補文字列中に含まれる場
合に行なう訂正は、1文字毎の音訓入力によって行なわ
れていた。このために、出力候補文字列を訂正する効率
が悪かった。
(Problem to be Solved by the Invention) By the way, if the number of characters in the output candidate character string is insufficient, or if the output candidate character string is not matched with the corresponding character string group, erroneously recognized characters may be included in the output candidate character string. Corrections that were made when the words were included in the text were performed by inputting the phonetic phrase for each character. For this reason, the efficiency of correcting output candidate character strings was low.

本発明は前記のような点に鑑みてなされたもので、出力
候補文字列の修正効率を向上させることが可能な文字読
取装置の後処理装置を提供することを目的とする。
The present invention has been made in view of the above points, and an object of the present invention is to provide a post-processing device for a character reading device that can improve the efficiency of modifying output candidate character strings.

[発明の構成] (課題を解決するための手段) 本発明は、認識処理によって得られた出力候補文字列が
最終的な文字読取結果として正当なものでない場合、前
記出力候補文字列に不足している文字、または誤認識さ
れた文字に対応する正当な文字でないことを示す特定の
文字を人力するための入力手段と、この入力手段によっ
て入力された特定の文字を、前記出力候補文字に不足し
ている文字の文字位置に挿入するか、または前記誤認識
された文字に置換えて、前記出力候補文字列を設定する
設定手段とを備えており、前記設定手段によって設定さ
れた出力候補文字列中の前記特定の文字以外の文字と、
同文字に対応する前記辞書に格納された文字列中の文字
とを照合し、この照合結果に基づいて最終的な文字読取
結果を決定するように構成するものである。
[Structure of the Invention] (Means for Solving the Problems) The present invention provides for, when the output candidate character string obtained through recognition processing is not valid as the final character reading result, the output candidate character string is insufficient. an input means for manually inputting a specific character indicating that the character is not a valid character corresponding to a character that has been misrecognized or a character that has been misrecognized; and a setting means for setting the output candidate character string by inserting it into the character position of the character that has been misrecognized or replacing it with the erroneously recognized character, and the output candidate character string set by the setting means. Characters other than the specific characters in
The apparatus is configured to compare characters in a character string stored in the dictionary that correspond to the same character, and determine a final character reading result based on the result of the comparison.

(作用) このようにして構成される文字読取装置の知識処理装置
においては、出力候補文字列に正当な文字でないことを
示す特定の文字が付加されることjこよって、特定の文
字を含む文字数に対応する辞書に格納された文字列群と
の照合が行なわれる。
(Operation) In the knowledge processing device of the character reading device configured in this way, a specific character indicating that the output candidate character string is not a valid character is added to the output candidate character string. A comparison is made with a group of character strings stored in a dictionary corresponding to .

また、出力候補文字列中の誤認識された文字に代えて前
記特定の文字を付加されることにより、特定の文字以外
の正しく認識された文字に基づいて最終的な文字読取結
果を決定することができる。
Further, by adding the specific character in place of the incorrectly recognized character in the output candidate character string, the final character reading result is determined based on the correctly recognized characters other than the specific character. I can do it.

(実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は同実施例に係わる文字読取装置の知識処理装置の
構成を示す図である。同図において、文字読取部11は
、帳票に記入された文字について認識処理を行なうもの
であり、認識処理により得られた出力候補文字について
知識処理を行なう知識処理部12に接続される。知識処
理部12は、候補文字格納部13、知識辞書格納部14
、比較部15、文字変換部18.及び表示制御部17に
より構成されている。候補文字格納部13は、文字読取
部11に接続されており、文字読取部11における認識
処理の結果得られた出力候補文字列を保持する。知識辞
書格納部15には、出力候補文字列の妥当性を判定する
際の比較対象となる文字列群が格納されている。また、
候補文字格納部13、及び知識辞書格納部15は、比較
部14に接続されている。比較部14は、候補文字格納
部13に格納された出力候補文字列と知識辞書格納部1
4に格納された文字列群との照合を行なう。比較部15
には、出力候補文字列中の文字について、他の文字また
はダミー文字(後述する)に置換えを行なう文字変換部
1Bが接続されている。文字変換部1Bには、最終的な
文字読取結果等の表示を制御する表示制御部17が接続
されている。表示制御部17には、表示部18が接続さ
れている。また、文字変換部1Gには、出力候補文字列
に対する修正文字、またはダミー文字等を入力する例え
ばキーボードによって構成される入力部19が接続され
ている。
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing the configuration of a knowledge processing device of a character reading device according to the same embodiment. In the figure, a character reading section 11 performs recognition processing on characters written on a form, and is connected to a knowledge processing section 12 that performs knowledge processing on output candidate characters obtained through the recognition processing. The knowledge processing unit 12 includes a candidate character storage unit 13 and a knowledge dictionary storage unit 14.
, comparison section 15, character conversion section 18. and a display control section 17. The candidate character storage section 13 is connected to the character reading section 11 and holds output candidate character strings obtained as a result of recognition processing in the character reading section 11. The knowledge dictionary storage unit 15 stores a group of character strings to be compared when determining the validity of output candidate character strings. Also,
The candidate character storage section 13 and the knowledge dictionary storage section 15 are connected to the comparison section 14. The comparison unit 14 compares the output candidate character string stored in the candidate character storage unit 13 with the knowledge dictionary storage unit 1.
4 is compared with the string group stored in 4. Comparison section 15
A character conversion unit 1B is connected to the character conversion unit 1B, which replaces characters in the output candidate character string with other characters or dummy characters (described later). A display control section 17 that controls display of final character reading results and the like is connected to the character conversion section 1B. A display section 18 is connected to the display control section 17 . Further, an input unit 19 configured by, for example, a keyboard is connected to the character conversion unit 1G, for inputting corrected characters or dummy characters for the output candidate character string.

次に、同実施例の動作を説明する。Next, the operation of this embodiment will be explained.

まず、文字読取部11によって、文字読取処理の対象と
する帳票に記入された文字について1文字毎に認識処理
が行なわれる。処理対象とする帳票には、記入される単
語(文字列)毎に、文字記入領域が予め設定されている
。文字読取部11は、文字認識処理によって得られた文
字記入領域に記入された各文字について例えば第10位
までの認識結果(出力候補文字)を候補文字格納部13
に転送する。
First, the character reading section 11 performs recognition processing for each character written on a form to be subjected to character reading processing. In the form to be processed, a character entry area is set in advance for each word (character string) to be entered. The character reading unit 11 stores, for example, the top 10 recognition results (output candidate characters) in the candidate character storage unit 13 for each character written in the character entry area obtained by the character recognition process.
Transfer to.

知識処理部12は、文字読取部■1から転送された認識
結果(出力候補文字)を入力すると、第2図に示すフロ
ーチャートに従った知識処理を行なう。
When the knowledge processing section 12 receives the recognition results (output candidate characters) transferred from the character reading section 1, it performs knowledge processing according to the flowchart shown in FIG.

ここで、帳票に記入された文字列は、第3図に示すよう
な、「神奈川県 横浜 線区 美しか丘」という住所名
であるとする。なお、第3図に示す文字列は、本来「横
浜型」と記入されるべきところ誤つて「市」という文字
が記入されなかった例を示すものである。また、帳票に
記入される文字列が、住所名のような関連のある単語(
「神祭)1県」 「横浜型」 「線区」 「美しか丘」
)である場合、知識辞書格納部14に設定される知識辞
書は、確実な認識結果を得るために階層構造となってい
るものとする。すなわち、知識処理によって「神奈川県
」という読取結果が得られた場合には、「神奈川県」に
対応する文字列群(知識辞書)が特定され、2番目の単
語(「横浜型」)について知識処理が行なわれるもので
ある。同様に、知識処理によって「横浜型」という読取
結果が得られた場合には、3番目の単語(「線区」)に
ついて知識処理を行なう際に用いられる知識辞書が特定
されるものである。4番目の単語(「美しが丘」)につ
いても同様である。また、知識処理に用いられる知識辞
書は、処理の対象とする出力候補文字列の文字数と同一
のものが対象となる。
Here, it is assumed that the character string entered in the form is the address name ``Kanagawa Prefecture, Yokohama, Line District, Ukikaoka'' as shown in Figure 3. The character string shown in FIG. 3 shows an example in which the character "city" was not entered by mistake when "Yokohama type" should have been entered. Also, the character strings entered in the form may be changed to related words such as address names (
"God Festival) 1 Prefecture""YokohamaType""LineSection""BeautifulHill"
), it is assumed that the knowledge dictionary set in the knowledge dictionary storage unit 14 has a hierarchical structure in order to obtain reliable recognition results. In other words, if the reading result "Kanagawa Prefecture" is obtained through knowledge processing, the character string group (knowledge dictionary) corresponding to "Kanagawa Prefecture" is identified, and the knowledge processing is performed for the second word ("Yokohama type"). processing is performed. Similarly, when the reading result of "Yokohama type" is obtained through the knowledge processing, the knowledge dictionary to be used when performing the knowledge processing on the third word ("line section") is specified. The same goes for the fourth word (``Utsukushigaoka''). Furthermore, the knowledge dictionary used in the knowledge processing is the same as the number of characters in the output candidate character string to be processed.

まず、候補文字格納部13は、帳票に記入された文字の
認識結果(出力候補文字)を入力すると、この出力候補
文字を各単語毎に保持する(ステップSl)。候補文字
格納部13に格納された第1位の出力候補文字列を第4
図に示している。第4図に示すように、知識処理が行な
われていない出力候補文字列は、図中下線で示す5文字
について誤認識されている。候補文字格納部taに出力
候補文字列が格納されると、比較部15は、候補文字格
納部13に格納された単語毎の各出力候補文字列と、知
識辞書格納部15に格納された各出力候補文字列(単語
)に対応する知識辞書(文字列群)との照合を行なう(
ステップ32)。まず、比較部14は、候補文字格納部
13に格納された文字列「神奈川県」についての第10
位までの出力候補文字列と、知識辞書格納部15に格納
された1番目の単語についての知識辞書(文字数が4文
字に対応するもの)との照合を行ない、最も類似度が高
い文字列を知識辞書から選択する。文字変換部16は、
第1位の出力候補文字列中に、知識辞書から選択した文
字列中の文字と異なるものがある場合、この異なる文字
を知識辞書から選択された文字列中の対応する文字に変
換する。1番目の単語については、誤認識された2番目
の文字「奉」が正しい文字「奈」に変換される。次に、
2番目の単語「横浜」についての知識処理を行なう。2
番目の単語「横浜」は、第4図に示すように「抽圧」と
誤認識されている。本来であれば2番目の単語は、「横
浜型」と3文字で記入されるところが2文字しか記入さ
れてなかったために、知識処理によって正しい文字列に
回復することができない。すなわち、知識辞書格納部1
5に設定されている文字列「神奈川県」に対応した下位
レベルの階層の知識辞書(2番目の単語に対する知識辞
書)には、2文字の「横浜」という文字列に対応するも
の力(設定されていないためである。ここでは、2番目
の単語について第1位の出力候補文字「抽圧」が知識処
理の結果として残るものとする。このように、上位のレ
ベルで正しく知識処理が行なわれなかった場合、知識辞
書が階層構造になっているため3番目、4番目の単語に
ついても正しく知識処理を行なうことができなくなる。
First, when the candidate character storage section 13 receives the recognition results (output candidate characters) of the characters written on the form, it holds the output candidate characters for each word (step Sl). The first output candidate character string stored in the candidate character storage unit 13 is
Shown in the figure. As shown in FIG. 4, in the output candidate character string for which knowledge processing has not been performed, five characters indicated by underlines in the figure are erroneously recognized. When the output candidate character strings are stored in the candidate character storage unit ta, the comparison unit 15 compares each output candidate character string for each word stored in the candidate character storage unit 13 with each output candidate character string stored in the knowledge dictionary storage unit 15. Check the knowledge dictionary (character string group) corresponding to the output candidate character string (word) (
Step 32). First, the comparison unit 14 compares the 10th character string “Kanagawa Prefecture” stored in the candidate character storage unit 13.
The character strings with the highest similarity are compared with the knowledge dictionary (corresponding to 4 characters) for the first word stored in the knowledge dictionary storage unit 15, and the character strings with the highest similarity are selected. Select from knowledge dictionary. The character conversion unit 16 is
If there is a character in the first output candidate character string that is different from a character in the character string selected from the knowledge dictionary, this different character is converted into a corresponding character in the character string selected from the knowledge dictionary. For the first word, the second character "ho" that was incorrectly recognized is converted to the correct character "na". next,
Knowledge processing regarding the second word "Yokohama" is performed. 2
The second word "Yokohama" is erroneously recognized as "Bakuto" as shown in FIG. Normally, the second word should have been written as ``Yokohama type'' with 3 characters, but only 2 characters were written, so knowledge processing cannot restore the correct character string. That is, the knowledge dictionary storage unit 1
The lower level knowledge dictionary (knowledge dictionary for the second word) corresponding to the character string "Kanagawa Prefecture" set in Here, it is assumed that the first output candidate character ``Bukuro'' for the second word remains as a result of knowledge processing.In this way, knowledge processing is performed correctly at the upper level. If this is not the case, it will not be possible to correctly perform knowledge processing on the third and fourth words because the knowledge dictionary has a hierarchical structure.

この結果、1回目の知識処理によって第5図に示すよう
な文字列(「神奈川系 抽圧 組区 美しか丘」)が得
られたものとする。
As a result, it is assumed that the first knowledge processing yields a character string as shown in FIG.

文字変換部16によって変換されて得られた文字列のデ
ータは、表示制御部17に出力される。表示制御部17
は、文字変換部teからの文字列データに基づいて、表
示部18に第5図に示すような文字列を表示する(ステ
ップS3)。
The character string data obtained by conversion by the character conversion section 16 is output to the display control section 17. Display control section 17
displays a character string as shown in FIG. 5 on the display section 18 based on the character string data from the character conversion section te (step S3).

表示部18に文字読取結果が表示されると、この読取結
果を訂正するための文字列訂正モードとなる。ここで、
文字列中に誤認識された文字が存在しないことがオペレ
ータによって判断されて文字列の訂正が不要であること
が通知されると、表示している文字列を最終的な文字読
取結果として確定する(ステップS4)。一方、表示し
た文字列中に誤認識した文字が存在する場合、オペレー
タによって文字列を修正するためのダミー文字を含む文
字データが入力部19から入力される(ステップS5)
。ダミー文字としては、例えば記号「×」のような特定
の文字が予め設定されている。このダミー文字は、表示
部18に表示された文字列に対して、例えば文字数が不
足している場合の不足している文字に対応する文字位置
に挿入したり、誤認識された文字に置換えて入力するこ
とができる。
When the character reading result is displayed on the display unit 18, a character string correction mode is entered for correcting the reading result. here,
When the operator determines that there are no misrecognized characters in the character string and is notified that the character string does not need to be corrected, the displayed character string is determined as the final character reading result. (Step S4). On the other hand, if there are erroneously recognized characters in the displayed character string, character data including dummy characters for correcting the character string is input by the operator from the input unit 19 (step S5).
. As the dummy character, for example, a specific character such as the symbol "x" is set in advance. These dummy characters can be inserted into the character string displayed on the display unit 18, for example, in the character position corresponding to the missing character when the number of characters is insufficient, or can be inserted in place of a character that has been misrecognized. can be entered.

また、入力部19からは、ダミー文字の入力の他にも、
通常の文字データの音訓入力を行なうことができる。文
字変換部1Gは、入力された文字データに応じて出力候
補文字列に不足している文字に対応する位置に挿入した
り、または誤認識された文字に置換えて出力候補文字を
設定する(ステップS6)。
In addition to inputting dummy characters from the input unit 19,
It is possible to input the phonetic lessons of normal character data. The character conversion unit 1G sets output candidate characters by inserting them into the output candidate character string at positions corresponding to missing characters or by replacing them with erroneously recognized characters according to the input character data (step S6).

ここでは、第6図に示すように、2番目の単語について
の読取結果「抽圧」に対して、第1文字を音訓入力によ
って正しい文字「横」に変換し、第2文字をダミー文字
に変換し、さらに1文字分のダミー文字を付加(後付け
)することによって「横XXJという文字列に設定した
ものとする。
Here, as shown in Figure 6, for the reading result of the second word "Bakufu", the first character is converted to the correct character "Yoko" by phonetic input, and the second character is changed to a dummy character. By converting and adding (retrofitting) one dummy character, it is assumed that the character string "Horizontal XXJ" is set.

こうしてダミー文字が付加された文字列に変換された後
に、知識処理が起動されると、文字変換部1Bは、文字
列データを比較部14に転送する。比較部I4は、文字
列データを入力するとダミー文字が付加された文字列に
ついて知識処理を行なう(ステップS2)。比較部14
は、ダミー文字を1文字分として扱い知識処理を行なう
。すなわち、比較部14は、2番目の単語「横xxJに
ついて、知識辞書格納部15に格納された3文字に対応
する知識辞書との照合を行なう。また、ダミー文字は、
比較fi15における知識辞書との類似度を求める際の
対象とはならない。このため、文字列「横××」につい
ての知識処理は、第1文字「横」についての類似度に基
づいて行なわれる。知識辞書格納部!5に格納された「
神奈川系」に対応する下位レベルの知識辞!F(2番目
の単語に対する3文字の知識辞書)中には、「横浜型」
という辞書が含まれる。従って、文字列「横XXJは、
知識辞書「横浜型」と最も類似度が高くなるため、この
知識辞書が比較部15によって選択される。ただし、知
識辞書中に第1文字が「横」である3文字の文字列の辞
書が「横浜型」以外に複数格納されている場合は、「横
浜市j以外の辞書が選択されることがある。このような
場合には、例えば次候補キーの押下に応じて、候補とな
る文字列を順次表示する。
When knowledge processing is activated after the character string is converted into a character string with dummy characters added in this way, the character conversion unit 1B transfers the character string data to the comparison unit 14. When the comparison unit I4 receives the character string data, it performs knowledge processing on the character string to which the dummy characters are added (step S2). Comparison section 14
performs knowledge processing by treating the dummy character as one character. That is, the comparison unit 14 performs a comparison with the knowledge dictionary corresponding to the three characters stored in the knowledge dictionary storage unit 15 for the second word “Horizontal xxJ”.
It is not a target when calculating the degree of similarity with the knowledge dictionary in comparison fi15. Therefore, knowledge processing regarding the character string "horizontal XX" is performed based on the degree of similarity regarding the first character "horizontal". Knowledge dictionary storage! 5 stored in “
Lower level knowledge words corresponding to “Kanagawa-kei”! F (3-letter knowledge dictionary for the second word) contains "Yokohama type"
It includes a dictionary. Therefore, the character string "Horizontal XXJ" is
Since this knowledge dictionary has the highest degree of similarity with the knowledge dictionary "Yokohama type", this knowledge dictionary is selected by the comparison unit 15. However, if the knowledge dictionary contains multiple 3-character string dictionaries whose first character is ``yoko'' other than ``Yokohama type'', ``Dictionaries other than Yokohama city j'' may be selected. In such a case, candidate character strings are sequentially displayed in response to pressing of the next candidate key, for example.

そして、オペレータによって順次表示される文字列から
、正しい文字列が選択されると、これを文字読取結果と
して確定することができる。こうして、知識処理によっ
て2番目の単語が正しい文字列に変換されることによっ
て、3番目、4番目の単語についても、それぞれ上位レ
ベルの階層の単語に対応する知識辞書が特定される。こ
のため、知識処理によって3番目、4番目の単語につい
ても正しい文字列に変換される。こうして得られた文字
列を第7図に示している。
When the correct character string is selected by the operator from the character strings sequentially displayed, this can be determined as the character reading result. In this way, by converting the second word into a correct character string through knowledge processing, the knowledge dictionaries corresponding to the words in the upper level hierarchy are also specified for the third and fourth words. Therefore, the third and fourth words are also converted into correct character strings through knowledge processing. The character string thus obtained is shown in FIG.

このように、誤認諧された全ての文字に対して1文字毎
の音訓入力によって訂正する必要がなく、ダミー文字と
して指定した特定の文字を入力することによって知識処
理行なうことができるので操作が容易になり、作業の能
率を向上させることができる。また、帳票に記入された
文字列が記入ミス等によって本来の文字数と異なる場合
であっても、ダミー文字を挿入することによって、本来
の知識処理に用いられるべき所定の文字列群との照合が
行なわれる。
In this way, there is no need to correct all the misidentified characters by inputting the pronunciation for each character, and knowledge processing can be performed by inputting specific characters designated as dummy characters, making the operation easy. This can improve work efficiency. In addition, even if the number of characters entered in a form differs from the original number due to an entry error, by inserting dummy characters, it is possible to compare it with a predetermined group of character strings that should be used for the original knowledge processing. It is done.

[発明の効果〕 以上のように本発明によれば、出力候補文字に対して誤
認識した文字と置換えて、または文字数の不足分として
ダミー文字を挿入して知識処理を行なうことができるの
で、記入された文字列の文字数が不足している場合であ
っても確実に知識処理を行ない、また出力候補文字の修
正を効率良(行なうことが可能となるものである。
[Effects of the Invention] As described above, according to the present invention, knowledge processing can be performed by replacing erroneously recognized characters with respect to output candidate characters or by inserting dummy characters to fill in the insufficient number of characters. Even when the number of characters in a written character string is insufficient, knowledge processing can be performed reliably and output candidate characters can be corrected efficiently.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例に係わる文字読取装置の知識
処理装置の構成を示すブロック図、第2図は同実施例に
おける知識処理を行なう際の処理手順を示すフローチャ
ート、第3図乃至第7図は同実施例の動作を説明するた
めの図である。 11・・・文字読取部、12・・・知識処理部、13・
・・候補文字格納部、14・・・知識辞書格納部、15
・・・比較部、16・・・文字変換部、17・・・表示
制御部、18・・・表示部、19・・・人力部。 第 図
FIG. 1 is a block diagram showing the configuration of a knowledge processing device of a character reading device according to an embodiment of the present invention, FIG. 2 is a flowchart showing a processing procedure when performing knowledge processing in the same embodiment, and FIGS. FIG. 7 is a diagram for explaining the operation of the same embodiment. 11...Character reading section, 12...Knowledge processing section, 13.
... Candidate character storage section, 14... Knowledge dictionary storage section, 15
... Comparison section, 16... Character conversion section, 17... Display control section, 18... Display section, 19... Human power section. Diagram

Claims (1)

【特許請求の範囲】 文字読取処理の対象とする帳票に記入されている文字に
ついて認識処理を行なうことによって得られる出力候補
文字列と、同出力候補文字列の妥当性を判定する際の比
較対象となる文字列群が格納されている辞書をもとに、
最終的な文字読取結果を決定する文字読取装置の後処理
装置において、 前記出力候補文字列が最終的な文字読取結果として正当
なものでない場合、前記出力候補文字列に不足している
文字、または誤認識された文字に対応する正当な文字で
ないことを示す特定の文字を入力するための入力手段と
、 前記入力手段によって入力された特定の文字を、前記出
力候補文字に不足している文字の文字位置に挿入するか
、または前記誤認識された文字に置換えて、前記出力候
補文字列を設定する設定手段と、 前記設定手段によって設定された出力候補文字列中の前
記特定の文字以外の文字と、同文字に対応する前記辞書
に格納された文字列中の文字とを照合し、この照合結果
に基づいて最終的な文字読取結果を決定する後処理手段
と、 を具備したことを特徴とする文字読取装置の後処理装置
[Claims] An output candidate character string obtained by performing recognition processing on characters written in a form that is subject to character reading processing, and a comparison target when determining the validity of the output candidate character string. Based on the dictionary that stores the strings,
In the post-processing device of the character reading device that determines the final character reading result, if the output candidate character string is not valid as the final character reading result, the missing characters in the output candidate character string, or an input means for inputting a specific character indicating that the incorrectly recognized character is not a valid character; a setting means for setting the output candidate character string by inserting it at a character position or replacing the erroneously recognized character; and a character other than the specific character in the output candidate character string set by the setting means. and post-processing means for collating the characters in the character string stored in the dictionary that correspond to the same character, and determining a final character reading result based on the collation result. A post-processing device for character reading devices.
JP1091117A 1989-04-11 1989-04-11 Post processor for character reader Pending JPH02268389A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1091117A JPH02268389A (en) 1989-04-11 1989-04-11 Post processor for character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1091117A JPH02268389A (en) 1989-04-11 1989-04-11 Post processor for character reader

Publications (1)

Publication Number Publication Date
JPH02268389A true JPH02268389A (en) 1990-11-02

Family

ID=14017577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1091117A Pending JPH02268389A (en) 1989-04-11 1989-04-11 Post processor for character reader

Country Status (1)

Country Link
JP (1) JPH02268389A (en)

Similar Documents

Publication Publication Date Title
CN110489760B (en) Text automatic correction method and device based on deep neural network
US7380203B2 (en) Natural input recognition tool
CN110110334B (en) Remote consultation record text error correction method based on natural language processing
US6804637B1 (en) Method, apparatus, and recording medium for retrieving optimum template pattern
JPS5816488B2 (en) Japanese text input method
CN111401012A (en) Text error correction method, electronic device and computer readable storage medium
KR102117895B1 (en) A composition error proofreading apparatus and method for language learning by using Stand-off annotation
JPH02268389A (en) Post processor for character reader
JP2922365B2 (en) Kanji address data processing method in OCR processing system
AU612263B2 (en) Method of data retrieval from a data base and a system therefor
JPH0498358A (en) Kana address knowledge processing system
JPS60195664A (en) Kana-to-kanji-converting system
JP2731394B2 (en) Character input device
JPH03144850A (en) Back-up system for proofreading of sentence
JP2002351868A (en) Electronic dictionary
JPS62212767A (en) Natural language processing system with dictionary updating function
JPH0458381A (en) Optical character reader
JPH0682366B2 (en) Character string correction method
JPS62279458A (en) Kana/kanji converter
JPH02136959A (en) Extracting device for correction candidate of japanese sentence
JPS62212871A (en) Sentence reading correcting device
JPH0728957A (en) English letter recognition device
JPH0362187A (en) Word collating device
JPH0668261A (en) Pattern recognizing device
JPH02118785A (en) Method for correcting erroneous recognition