JPH06251186A - Method and device for correcting character recognition error - Google Patents

Method and device for correcting character recognition error

Info

Publication number
JPH06251186A
JPH06251186A JP5057701A JP5770193A JPH06251186A JP H06251186 A JPH06251186 A JP H06251186A JP 5057701 A JP5057701 A JP 5057701A JP 5770193 A JP5770193 A JP 5770193A JP H06251186 A JPH06251186 A JP H06251186A
Authority
JP
Japan
Prior art keywords
word
character
unit
candidate
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5057701A
Other languages
Japanese (ja)
Inventor
Yoshitaka Hamaguchi
佳孝 濱口
Sadamasa Hirogaki
節正 広垣
Naohiro Amamoto
直弘 天本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5057701A priority Critical patent/JPH06251186A/en
Publication of JPH06251186A publication Critical patent/JPH06251186A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To easily and quickly perform the correcting work for a character recognition error by collating the error of a character string recognized by image reading with a word dictionary by bracketing in a word unit not in a character unit, and correcting the error comprehensively in the word unit. CONSTITUTION:This device is equipped with a character segmenting part 6 to perform the character recognition reading the image of a document 5, a character recognition part 7, a dictionary collating part 8 to perform the correcting work of a recognized character, a word bracketing part 9, the word dictionary 10, a word bracketing information storage part 11, a candidate word storage part 12, a character string storage part 13, a correction processing part 14, and a word designation part 15. In such constitution, the correction of an already recognized character string is performed in word unit comprehensively. Therefore, a part for which the correction of the already recognized character string is required is bracketed in word unit. Each word is collated with the word dictionary, and a candidate word is displayed by listing on a display part 16. A corresponding part can be corrected comprehensively in word unit by selecting and designating a correct candidate word from the candidate words by an operator.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、帳票等に記入された文
字を光学的に読み取り認識を行って、各種のデータとし
て利用するための文字認識誤り修正方法及び装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition error correction method and apparatus for optically reading and recognizing characters written on a form and using them as various data.

【0002】[0002]

【従来の技術】文字データをコンピュータで処理する場
合に、その入力を容易にするために文書や帳票等に記載
された文字を光学的に読み取って認識し、自動的にデー
タとして取り込む文字認識処理装置が広く採用されてい
る。図2に、従来一般の文字認識装置外観図を示す。こ
の装置は、ディスプレイ1とキーボード2と、イメージ
リーダ3と、マウス4等から構成される。イメージリー
ダ3は、帳票や文書等を光学的に読み取ってイメージデ
ータとして装置に取り込むためのものである。装置の内
部では一定の文字認識処理を行ってディスプレイ1にそ
の結果を表示する。オペレータは、その認識結果と読み
取られた文字とを比較し、認識誤りがあればこれを修正
する。その修正にはキーボード2やマウス4等を使用す
る。
2. Description of the Related Art When processing character data on a computer, a character recognition process for optically reading and recognizing characters written on a document or a form for facilitating the input and automatically capturing the data as data The device is widely adopted. FIG. 2 shows an external view of a conventional general character recognition device. This device comprises a display 1, a keyboard 2, an image reader 3, a mouse 4 and the like. The image reader 3 is for optically reading a form, a document, or the like, and importing them into the device as image data. A certain character recognition process is performed inside the device and the result is displayed on the display 1. The operator compares the recognition result with the read character and corrects any recognition error. The keyboard 2 and mouse 4 are used for the correction.

【0003】図3に、従来の文字認識誤り修正方法説明
図を示す。従来、認識された文字をオペレータが検証し
必要な修正を行う処理は、この図に示すような手順で行
われていた。例えば、この図に示すように、文書に「t
abulate」と記載されていたとする。装置は図2
に示すイメージリーダ3を用いてこのイメージを読み取
る。その認識結果はディスプレイに表示される。ここ
で、例えば文字認識、後処理の誤りにより「hotpl
ate」と誤認識されていた場合、オペレータは図2に
示すキーボード2やマウス4を用いて最初の字の修正を
要求する。この時、図3に示すように、最初の字につい
て認識用候補文字が3個、即ち「n」、「h」、「t」
の3個の文字が列挙されたとする。これらの列挙された
文字も、図2に示すディスプレイ1に表示される。オペ
レータは、これらの候補文字の中から正当なtという文
字をマウス4等を用いて選択指示する。これによって、
最初の文字がtであるというように認識結果が確定す
る。同様の操作を2文字目、3文字目、4文字目にも行
うことにより、修正が完了する。このような技術は、例
えば特開昭58−125183号公報に紹介されてい
る。
FIG. 3 shows an explanatory view of a conventional character recognition error correction method. Conventionally, a process of verifying a recognized character by an operator and making a necessary correction has been performed by the procedure shown in this figure. For example, as shown in this figure, the document has "t
It is assumed that it was described as "acute". Device is Figure 2
This image is read using the image reader 3 shown in FIG. The recognition result is displayed on the display. Here, for example, due to an error in character recognition or post-processing, "hotpl
If it is erroneously recognized as "ate", the operator requests the correction of the first character using the keyboard 2 and the mouse 4 shown in FIG. At this time, as shown in FIG. 3, there are three recognition candidate characters for the first character, that is, “n”, “h”, and “t”.
It is assumed that the three characters of are listed. These listed characters are also displayed on the display 1 shown in FIG. The operator uses the mouse 4 or the like to select and instruct the valid character "t" from these candidate characters. by this,
The recognition result is fixed such that the first character is t. The correction is completed by performing the same operation on the second, third, and fourth characters. Such a technique is introduced, for example, in Japanese Patent Laid-Open No. 58-125183.

【0004】[0004]

【発明が解決しようとする課題】ところで、上記のよう
な文字認識処理を行う場合、認識を誤った文字について
は、それぞれ各文字毎に先に説明した要領で修正作業を
行うことになる。従って、修正対象が多数ある場合に
は、修正作業が煩雑になり長時間を費やすことになる。
本発明は以上の点に着目してなされたもので、文字認識
誤りの修正作業をより容易に迅速に行うことができる文
字認識誤り修正方法及び装置を提供することを目的とす
るものである。
By the way, in the case of performing the character recognition processing as described above, for the characters that are erroneously recognized, the correction work is performed for each character in the manner described above. Therefore, when there are many correction objects, the correction work becomes complicated and takes a long time.
The present invention has been made in view of the above points, and it is an object of the present invention to provide a character recognition error correction method and apparatus that can perform a character recognition error correction operation more easily and quickly.

【0005】[0005]

【課題を解決するための手段】本発明の第1発明は、イ
メージを読み取り文字認識をし、単語単位に予め用意し
た単語辞書との照合を行い、得られる複数の候補単語か
ら1単語を選び、認識結果を修正し読み取り結果とする
後処理が行われた文字列中の、オペレータが指定する任
意の単語について、前記後処理においてあげられた候補
単語を列挙して表示し、前記表示された候補単語の中か
ら正当な候補単語を選択指定して、前記読み取り結果の
修正を行うことを特徴とする文字認識誤り修正方法に関
する。
According to a first aspect of the present invention, an image is read, character recognition is performed, and a word dictionary prepared in advance for each word is collated to select one word from a plurality of obtained candidate words. , In the post-processed character string that corrects the recognition result and becomes the read result, for any word specified by the operator, the candidate words listed in the post-process are enumerated and displayed, and displayed. The present invention relates to a character recognition error correction method characterized by selecting and designating a valid candidate word from candidate words and correcting the read result.

【0006】本発明の第2発明は、文字パターン列から
なるイメージを読み取って、文字パターン毎にその認識
を行い、得られた認識結果を単語単位に切り分け、切り
分けられた単語を予め用意した単語辞書と照合して、得
られた複数の候補単語から1単語を選び、認識結果の修
正をする後処理を行い、符号化された文字列を得る文字
認識部と、前記後処理の過程で得られた候補単語を表示
する表示部と、前記表示部に表示された1個以上の候補
単語の中から、正当な候補単語を選択し指定する単語指
定部と、この単語指定部による指定に従って、前記文字
認識部で得られた前記文字列を構成する単語を、指定さ
れた候補単語に置き換える修正処理部を備えたことを特
徴とする文字認識誤り修正装置に関する。
According to a second aspect of the present invention, an image consisting of a character pattern string is read, recognition is performed for each character pattern, the obtained recognition result is divided into word units, and the divided words are prepared in advance. A character recognition unit that selects one word from the obtained plurality of candidate words by collating with a dictionary, corrects the recognition result, and obtains an encoded character string, and a character recognition unit that is obtained in the process of the post-processing. A display unit that displays the selected candidate words, and a word designating unit that selects and designates a valid candidate word from the one or more candidate words displayed on the display unit, and according to the designation by the word designating unit, The present invention relates to a character recognition error correction device comprising a correction processing unit that replaces the words that form the character string obtained by the character recognition unit with designated candidate words.

【0007】[0007]

【作用】この装置は、文字認識誤りの修正を文字単位で
なく単語単位で一括して行う。このために、既に認識さ
れた文字列の修正を必要とする部分を単語単位に切り分
ける。各単語は単語辞書と照合され、候補単語を列挙し
表示部に表示する。オペレータが、この候補単語の中か
ら正当な候補単語を選択指定すれば、該当部分が一括し
て単語単位で修正され文字単位の修正に比べ迅速な作業
ができる。
This device collectively corrects character recognition errors in word units instead of character units. For this purpose, the already recognized portion of the character string that needs to be corrected is divided into word units. Each word is collated with the word dictionary, and candidate words are listed and displayed on the display unit. If the operator selects and designates a valid candidate word from the candidate words, the corresponding portion is collectively corrected word by word, which enables a quicker work than the correction by character.

【0008】[0008]

【実施例】以下、本発明を図の実施例を用いて詳細に説
明する。図1は、本発明の文字認識処理装置実施例を示
すブロック図である。この装置は、文書5のイメージを
読み取って文字認識を行うための文字切り出し部6、文
字認識部7と、認識された文字の修正作業を行うための
辞書照合部8、単語切り分け部9、単語辞書10、単語
切り分け情報記憶部11、候補単語記憶部12、文字列
記憶部13、修正処理部14及び単語指定部15を備え
ている。なお、このような文字認識内容は表示部16に
表示される構成となっている。また、この表示部16に
は、図に示すような表示画面17が表示される構成とな
っている。
The present invention will be described in detail below with reference to the embodiments shown in the drawings. FIG. 1 is a block diagram showing an embodiment of a character recognition processing device of the present invention. This apparatus includes a character cutout unit 6 for reading an image of a document 5 and performing character recognition, a character recognition unit 7, a dictionary collation unit 8 for correcting the recognized character, a word dividing unit 9, and a word A dictionary 10, a word segmentation information storage unit 11, a candidate word storage unit 12, a character string storage unit 13, a correction processing unit 14, and a word designation unit 15 are provided. The character recognition content is displayed on the display unit 16. A display screen 17 as shown in the figure is displayed on the display unit 16.

【0009】文書5は、例えば帳票等から構成され、こ
の文書5に記入された文字パターン列から成るイメージ
が光学的に読み取られる。文字切り出し部6は、読み取
られたイメージを文字単位で切り分け、文字認識部7に
向け出力するためのよく知られた回路から構成される。
文字認識部7は一定のパターンの辞書を用いて読み取っ
たイメージを解析し、符号化された文字データを出力す
るための回路である。これらの部分は従来の文字認識処
理装置と同一の構成のものである。
The document 5 is composed of, for example, a form, and the image composed of the character pattern string written in the document 5 is optically read. The character slicing unit 6 is composed of a well-known circuit for slicing the read image in character units and outputting the image to the character recognizing unit 7.
The character recognition unit 7 is a circuit for analyzing an image read using a dictionary having a certain pattern and outputting encoded character data. These parts have the same structure as the conventional character recognition processing device.

【0010】文字認識部7の出力側には辞書照合部8が
設けられており、本発明の装置においては、この辞書照
合部8は単語切り分け部9によって切り分けられた1個
の単語を単語辞書10と照合して、一致性の高い1個以
上の候補単語を抽出する部分である。単語辞書10には
読み取られるべき単語が必要なだけ記憶されており、辞
書照合部8は、実際に文字認識部7において認識された
読取り単語と形態上よく似た単語を単語辞書10から抽
出する動作を行う。単語切り分け情報記憶部11は、単
語切り分け部9が切り分けた文字列の境界等に関する情
報を記憶する部分である。なお、単語切り分け部9や辞
書照合部8は、文字認識部7とともに、文字認識結果を
単語単位で自動的に修正するものとして、従来装置に実
装されているものと同様の構成のものである。本発明に
おいては、従来装置において、このような文字認識の後
処理が自動的に行われた結果に誤りがあった場合に、そ
れを単語単位でマニュアル修正しようとするものであ
る。
A dictionary collation unit 8 is provided on the output side of the character recognition unit 7, and in the apparatus of the present invention, the dictionary collation unit 8 converts one word segmented by the word segmentation unit 9 into a word dictionary. This is a part where one or more candidate words having a high degree of matching are extracted by collating with 10. As many words as necessary to be read are stored in the word dictionary 10, and the dictionary matching unit 8 extracts from the word dictionary 10 words that are morphologically similar to the read words actually recognized by the character recognition unit 7. Take action. The word segmentation information storage unit 11 is a unit that stores information regarding the boundaries of the character strings segmented by the word segmentation unit 9. The word segmentation unit 9 and the dictionary matching unit 8 have the same configuration as that installed in the conventional apparatus as the unit for automatically correcting the character recognition result in units of words together with the character recognition unit 7. . In the present invention, in the conventional apparatus, when there is an error in the result of such post-processing of character recognition being automatically performed, it is attempted to manually correct it in word units.

【0011】候補単語記憶部12は、本発明において新
たに設けられたもので、辞書照合部8が上記後処理中に
抽出し列挙した候補単語をそのまま記憶する部分であ
る。修正処理部14も本発明において新たに設けられた
もので、候補単語記憶部12に記憶された候補単語を表
示部16に表示させる他、単語指定部15によってこれ
らの候補単語の内の1個の候補単語が選択指定された場
合に、その選択指定された候補単語を上記後処理によっ
て認識された単語に置き換えて文字列を修正する処理を
行う部分である。その修正結果として得られた文字列は
文字列記憶部13に記憶される。なお、この文字列記憶
部13に記憶された文字列も、必要に応じて表示部16
に表示される。単語指定部15はキーボードやマウス等
から成り、読み取られ認識された文字列から修正対象と
なる単語を指定するため等に用いられる。また、候補単
語の中から正当とされる1個の候補単語を選択指定する
作業にも用いられる。
The candidate word storage unit 12 is newly provided in the present invention, and is a unit that stores the candidate words that the dictionary collation unit 8 has extracted and listed during the above post-processing as they are. The correction processing unit 14 is also newly provided in the present invention. In addition to displaying the candidate word stored in the candidate word storage unit 12 on the display unit 16, one of these candidate words is displayed by the word designating unit 15. When the candidate word is selected and designated, the selected candidate word is replaced with the word recognized by the post-processing to correct the character string. The character string obtained as a result of the correction is stored in the character string storage unit 13. The character string stored in the character string storage unit 13 is also displayed on the display unit 16 as necessary.
Is displayed in. The word designating unit 15 is composed of a keyboard, a mouse and the like, and is used for designating a word to be corrected from a character string read and recognized. It is also used for the work of selecting and designating one valid candidate word from the candidate words.

【0012】表示部16に表示される表示画面17に
は、上記のように候補単語記憶部12に記憶された候補
単語19が表示される。ここには1個又は2以上の候補
単語が列挙される。単語指定部15は、カーソル20を
表示画面17上で移動させ、候補単語19の内の1個の
候補単語を指定するように使用される。こうして指定さ
れた結果は修正処理部14が文字列記憶部13に記憶さ
れた文字列を修正するために使用される。
On the display screen 17 displayed on the display unit 16, the candidate words 19 stored in the candidate word storage unit 12 as described above are displayed. Here, one or more candidate words are listed. The word designation unit 15 is used to move the cursor 20 on the display screen 17 and designate one candidate word out of the candidate words 19. The result designated in this way is used by the correction processing unit 14 to correct the character string stored in the character string storage unit 13.

【0013】図4に、本発明の方法の実施例説明図を示
す。本発明の方法は、上記のような装置によって、この
図に示す例のように実施される。まず、文書からのイメ
ージ読取りによって文字パターン列21を得る。これ
は、図1に示した文字切り出し部6や文字認識部7によ
って認識される。こうして得られた文字認識結果を辞書
照合部8が、自動的に単語を切り分ける単語切り分け部
9により切り分けられた単語毎に、単語辞書10と照合
し、候補単語19が得られる。ここで、いずれかの候補
単語を認識結果とする「後処理」は、従来、自動的に実
行され、例えば第1位候補として得られた「hotpl
ate」が認識結果とされる。この後処理が終了する
と、従来は候補単語もクリアしてしまっていた。
FIG. 4 is an explanatory view of an embodiment of the method of the present invention. The method of the present invention is carried out by the apparatus as described above, as in the example shown in this figure. First, a character pattern string 21 is obtained by reading an image from a document. This is recognized by the character cutout unit 6 and the character recognition unit 7 shown in FIG. The dictionary collation unit 8 collates the thus obtained character recognition result with the word dictionary 10 for each word segmented by the word segmentation unit 9 that automatically segments the word, and the candidate word 19 is obtained. Here, the “post-processing” in which any one of the candidate words is used as the recognition result is conventionally automatically executed, for example, “hotpl” obtained as the first-ranked candidate.
"ate" is set as the recognition result. When this post-processing ends, the candidate words have been cleared in the past.

【0014】しかし、本発明においては、第1位候補と
して得られた「hotplate」を符号化された文字
列23として表示するとともに、残りの候補単語を候補
単語記憶部12に記憶しておく。オペレータが元のイメ
ージである文字パターン列21と表示部16(図1)に
表示された、符号化された文字列23とを見比べ、誤り
を修正するために単語指定部15(図1)で該単語を指
定すると、本発明の装置は指定された単語に対する候補
単語19を候補単語記憶部12から引き出し列挙する。
この例では2個の候補単語が列挙されている。オペレー
タはこの2個の候補単語の中から実際の文字パターン列
と一致する候補単語、この例では「tabulate」
を選び出し、これを指定する。これによって、正しい認
識結果が得られる。
However, in the present invention, “hotplate” obtained as the first-ranked candidate is displayed as the encoded character string 23, and the remaining candidate words are stored in the candidate word storage unit 12. The operator compares the character pattern string 21 that is the original image with the encoded character string 23 displayed on the display unit 16 (FIG. 1), and the word designation unit 15 (FIG. 1) is used to correct the error. When the word is designated, the device of the present invention retrieves and lists the candidate words 19 for the designated word from the candidate word storage unit 12.
In this example, two candidate words are listed. The operator selects a candidate word that matches the actual character pattern string from these two candidate words, in this example, "tabulate".
Select and specify this. As a result, a correct recognition result can be obtained.

【0015】図5に、本発明の文字認識誤り修正方法の
具体的なフローチャートを示す。本発明の方法は具体的
には、この図の手順に示すようにして実施される。ステ
ップS1において、まず図1に示す文字認識部7の認識
結果を表示部16に表示する。次にステップS2におい
て、オペレータは単語指定部15や、あるいは図示しな
いマウス等を使用して修正対象となる単語を指定する。
FIG. 5 shows a specific flowchart of the character recognition error correction method of the present invention. The method of the present invention is specifically carried out as shown in the procedure of this figure. In step S1, the recognition result of the character recognition unit 7 shown in FIG. 1 is first displayed on the display unit 16. Next, in step S2, the operator designates a word to be corrected using the word designating unit 15 or a mouse not shown.

【0016】次にステップS3において、既に上記後処
理において候補単語記憶部12に記憶されている候補単
語を引きだし列挙する。辞書照合が、既に上記後処理に
おいて行われ、候補単語記憶部に記憶されている場合
は、そこより該単語の候補単語を引き出し列挙する。。
修正処理部14は、この候補単語を表示部16に表示さ
せ、図1の表示画面17に示すような内容の画面をオペ
レータに提供する。オペレータは単語指定部15を用い
て、この候補単語の中から正当な候補単語を選択指示す
る(ステップS4)。修正処理部14は、このような指
定があると、ステップS5において、該当する単語をそ
の候補単語に置き換え文字列の修正を行う。この文字列
は文字列記憶部13に格納される。
Next, in step S3, the candidate words already stored in the candidate word storage unit 12 in the above post-processing are extracted and listed. When the dictionary matching is already performed in the above post-processing and is stored in the candidate word storage unit, the candidate words of the word are extracted and listed from there. .
The correction processing unit 14 displays this candidate word on the display unit 16 and provides the operator with a screen having the content as shown in the display screen 17 of FIG. The operator uses the word designating unit 15 to select and instruct a valid candidate word from the candidate words (step S4). When such a designation is made, the correction processing unit 14 replaces the corresponding word with the candidate word and corrects the character string in step S5. This character string is stored in the character string storage unit 13.

【0017】次にステップS6において、読み取られた
文字列の全ての修正が終了したかどうかを判断する。オ
ペレータが文字列記憶部13に記憶された文字列を表示
部16に表示させ、その内容を確認し修正すべき文字が
無いと判断した場合には処理は終了する。また、別の単
語の中に修正すべき文字があると判断した場合には、再
びステップS1に戻り、図5に示すステップS1〜ステ
ップS6の動作が繰り返される。以上の処理によって、
認識された文字列の中に多数の認識誤りが生じた場合に
おいても、その文字1個1個について修正するのでなく
単語単位で一括して認識結果の修正が行える。従って、
例えば図4に示す例では4文字の読み取り誤りを1回の
操作で修正できる。
Next, in step S6, it is determined whether or not all the corrections of the read character string have been completed. If the operator displays the character string stored in the character string storage unit 13 on the display unit 16 and confirms the content, and determines that there is no character to be corrected, the process ends. When it is determined that there is a character to be corrected in another word, the process returns to step S1 and the operations of steps S1 to S6 shown in FIG. 5 are repeated. By the above process,
Even when a large number of recognition errors occur in the recognized character string, the recognition result can be collectively corrected on a word-by-word basis instead of correcting each character. Therefore,
For example, in the example shown in FIG. 4, a reading error of four characters can be corrected by one operation.

【0018】本発明は以上の実施例に限定されない。図
1に示す装置の各ブロックは、それぞれ記憶装置やプロ
セッサあるいは各種のデバイスにより構成され、その具
体的な構成は自由に選択して差し支えない。また、その
表示画面の表示方法や修正作業の手順等についても上記
の主旨の範囲で自由に変更して差し支えない。
The present invention is not limited to the above embodiments. Each block of the apparatus shown in FIG. 1 is configured by a storage device, a processor, or various devices, and its specific configuration can be freely selected. Further, the display method of the display screen, the procedure of the correction work, etc. may be freely changed within the scope of the above-mentioned purpose.

【0019】[0019]

【発明の効果】以上説明した本発明の文字認識誤り修正
方法及び装置によれば、イメージ読取りにより認識され
た文字列の誤りを、文字単位でなく単語単位に切り分け
て単語辞書と照合し、単語単位で一括して修正を行うの
で、文字単位で修正を行う場合に比べ修正作業を迅速に
効率よく行うことができる。
According to the character recognition error correction method and apparatus of the present invention described above, the error of the character string recognized by the image reading is divided into word units instead of character units, and collated with the word dictionary. Since the correction is performed collectively in units, the correction work can be performed quickly and efficiently as compared with the case where correction is performed in character units.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の文字認識処理装置実施例を示すブロッ
ク図である。
FIG. 1 is a block diagram showing an embodiment of a character recognition processing device of the present invention.

【図2】一般の文字認識装置外観図である。FIG. 2 is an external view of a general character recognition device.

【図3】従来の文字認識誤り修正方法説明図である。FIG. 3 is an explanatory diagram of a conventional character recognition error correction method.

【図4】本発明の方法の実施例説明図である。FIG. 4 is an explanatory view of an embodiment of the method of the present invention.

【図5】本発明の文字認識誤り修正方法フローチャート
である。
FIG. 5 is a flowchart of a character recognition error correction method of the present invention.

【符号の説明】[Explanation of symbols]

5 文書 7 文字認識部 8 辞書照合部 9 単語切り分け部 10 単語辞書 14 修正処理部 15 単語指定部 16 表示部 17 表示画面 5 documents 7 character recognition unit 8 dictionary matching unit 9 word segmentation unit 10 word dictionary 14 correction processing unit 15 word designation unit 16 display unit 17 display screen

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 イメージを読み取り文字認識をし、単語
単位に予め用意した単語辞書との照合を行い、得られる
複数の候補単語から1単語を選び、認識結果を修正し読
み取り結果とする後処理が行われた文字列中の、オペレ
ータが指定する任意の単語について、 前記後処理においてあげられた候補単語を列挙して表示
し、 前記表示された候補単語の中から正当な候補単語を選択
指定して、前記読み取り結果の修正を行うことを特徴と
する文字認識誤り修正方法。
1. A post-process for recognizing a character by reading an image, performing collation with a word dictionary prepared in advance on a word-by-word basis, selecting one word from a plurality of obtained candidate words, and correcting the recognition result to obtain a read result. For any word specified by the operator in the character string in which is performed, the candidate words listed in the post-processing are listed and displayed, and a valid candidate word is selected and specified from the displayed candidate words. Then, the character recognition error correction method is characterized in that the read result is corrected.
【請求項2】 文字パターン列からなるイメージを読み
取って、文字パターン毎にその認識を行い、得られた認
識結果を単語単位に切り分け、切り分けられた単語を予
め用意した単語辞書と照合して、得られた複数の候補単
語から1単語を選び、認識結果の修正をする後処理を行
い、符号化された文字列を得る文字認識部と、 前記後処理の過程で得られた候補単語を表示する表示部
と、 前記表示部に表示された1個以上の候補単語の中から、
正当な候補単語を選択し指定する単語指定部と、 この単語指定部による指定に従って、前記文字認識部で
得られた前記文字列を構成する単語を、指定された候補
単語に置き換える修正処理部を備えたことを特徴とする
文字認識誤り修正装置。
2. An image consisting of a character pattern string is read, recognition is performed for each character pattern, the obtained recognition result is divided into word units, and the divided words are collated with a word dictionary prepared in advance, A character recognition unit that selects one word from the obtained plurality of candidate words, performs post-processing to correct the recognition result, obtains an encoded character string, and displays the candidate words obtained in the post-processing process And a display unit for displaying one or more candidate words displayed on the display unit,
A word designating unit that selects and designates a valid candidate word, and a correction processing unit that replaces the words constituting the character string obtained by the character recognition unit with the designated candidate word according to the designation by the word designating unit. A character recognition error correction device characterized by being provided.
JP5057701A 1993-02-23 1993-02-23 Method and device for correcting character recognition error Pending JPH06251186A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5057701A JPH06251186A (en) 1993-02-23 1993-02-23 Method and device for correcting character recognition error

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5057701A JPH06251186A (en) 1993-02-23 1993-02-23 Method and device for correcting character recognition error

Publications (1)

Publication Number Publication Date
JPH06251186A true JPH06251186A (en) 1994-09-09

Family

ID=13063247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5057701A Pending JPH06251186A (en) 1993-02-23 1993-02-23 Method and device for correcting character recognition error

Country Status (1)

Country Link
JP (1) JPH06251186A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08171596A (en) * 1994-12-16 1996-07-02 Nec Corp Character recognition device and character recognition method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08171596A (en) * 1994-12-16 1996-07-02 Nec Corp Character recognition device and character recognition method

Similar Documents

Publication Publication Date Title
US7319799B2 (en) Method of recognizing and indexing documents
JP2726568B2 (en) Character recognition method and device
US6466694B2 (en) Document image processing device and method thereof
JP2005173730A (en) Business form ocr program, method, and device
US7406201B2 (en) Correcting segmentation errors in OCR
US8571262B2 (en) Methods of object search and recognition
JPH06251186A (en) Method and device for correcting character recognition error
JPH08180066A (en) Index preparation method, document retrieval method and document retrieval device
JP3930466B2 (en) Character recognition device, character recognition program
JP3221968B2 (en) Character recognition device
JPH1069494A (en) Image retrieval method and device therefor
JPH06251187A (en) Method and device for correcting character recognition error
JP2984287B2 (en) Optical character reader
JPS6398788A (en) Recognizing device
JPH06333083A (en) Optical character reader
JPH07210623A (en) Document picture processor
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JP2876568B2 (en) Character recognition device
JP2000123116A (en) Character recognition result correction method
JPH01292586A (en) Back-up device for recognition of character
KR20030018519A (en) The Easy Chinese Character Input and Correction Method using Image Retrieval Technologies
JPH05174195A (en) English character recognizing device
JPH0258187A (en) Character recognizing device
JP3077580B2 (en) Character reader
JPH06348889A (en) Character recognizing device