JPS61198383A - Character correcting device - Google Patents

Character correcting device

Info

Publication number
JPS61198383A
JPS61198383A JP60039305A JP3930585A JPS61198383A JP S61198383 A JPS61198383 A JP S61198383A JP 60039305 A JP60039305 A JP 60039305A JP 3930585 A JP3930585 A JP 3930585A JP S61198383 A JPS61198383 A JP S61198383A
Authority
JP
Japan
Prior art keywords
character
corrected
input
characters
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60039305A
Other languages
Japanese (ja)
Inventor
Hiroyuki Harashima
原島 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60039305A priority Critical patent/JPS61198383A/en
Publication of JPS61198383A publication Critical patent/JPS61198383A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To improve remarkably the read processing efficiency by executing correction processing when a character of recognition disable takes place in the recognizing processing. CONSTITUTION:The operator observes the result of recognition displayed on a picture of a display section 24 and it is discriminated that a character 25 differs from a substantial character 26 being read object and the mis-recognition is discriminated, a Kana (Japanese syllabary) for a correcting character to the mis-read character 25 is inputted by operating an input key of an operating section 23 and further, a Kanji (Chinese character converting key is operated. Then a control section 20 reads the corresponding correcting character displayed on the display section 24, the operator operates the operating section 23 to input confirming information and registration indication information for correcting character. The control section 20 gives a label to the inputted correcting character and registers it to a correction character registration buffer 22 in the state of a Kanji code. The control section 20 outputs the character of the inputted correcting character to, e.g., a computer as the final recognition result.

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は、特に漢字OCRに使用される文字修正装置に
関する。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field of the Invention] The present invention relates to a character correction device used particularly for Kanji OCR.

[発明の技術的背景とその問題点] 近年、光学的文字読取装置(OCR)には、読取対重文
字が英数字、仮名文字の字種から漢字まで拡張された高
機能の装置(漢字0CR)が実現されつつある。漢字は
JIS第1水準及び第2水準まで含めると6349字と
膨大であるが、通常の漢字OCRでは認識用辞書メモリ
の容量制限及び文字の出現頻度により、読取対象文字は
2000〜3000字である。
[Technical Background of the Invention and Problems thereof] In recent years, optical character reading devices (OCR) have become highly functional devices whose readable double characters have been expanded from alphanumeric characters and kana characters to kanji (Kanji 0CR). ) is being realized. Kanji is a huge number of characters, 6349 characters including JIS level 1 and level 2, but with normal kanji OCR, the number of characters to be read is 2000 to 3000 characters due to capacity limitations of recognition dictionary memory and character appearance frequency. .

このため、従来の漢字OCRでは、本来の読取対象以外
の漢字、即ち認識用辞書メモリには存在しない文字が入
力されることがある。この場合、漢字OCRではりジェ
クトまたは誤読となる。また、認識用辞園メモリに存在
する漢字の場合でも、手書き文字を読取るOCRでは筆
記者の癖などにより認識不能な文字が出現することがあ
る。
For this reason, in conventional Kanji OCR, a Kanji character other than the original target to be read, that is, a character that does not exist in the recognition dictionary memory, may be input. In this case, the kanji OCR results in a miss or misreading. Furthermore, even in the case of Chinese characters that exist in the recognition dictionary memory, characters that cannot be recognized may appear in OCR, which reads handwritten characters, due to the scribe's habits.

従来では、認識不能が発生すると、オペレータが文字修
正装置により修正文字を入力することになる。具体的に
は、第3図に示すような読取部10で走査された用紙上
の文字が、制御部[11で認識処理された後、認識結果
が表示部12に表示されたとする。オペレータは、表示
部12の画面に表示された認識結果を確認し、誤読また
はりジエクトの場合には操作部13を操作して修正処理
を行なう。
Conventionally, when an unrecognizable character occurs, an operator inputs a corrected character using a character correction device. Specifically, it is assumed that characters on a sheet of paper scanned by the reading unit 10 as shown in FIG. 3 are recognized by the control unit [11], and then the recognition result is displayed on the display unit 12. The operator checks the recognition result displayed on the screen of the display section 12, and in the case of misreading or misreading, operates the operation section 13 to perform correction processing.

この場合、オペレータは、操作部13から仮名文字情報
及び漢字変換を指示する変換指示情報を制御部@11へ
入力する。制御装置11は、入力情報に応じて予め用意
された文字修正用辞書メモリから修正文字を読出し、表
示部12へ表示する。この後、オペレータから確認情報
が入力されると、制御装置11は前記修正文字(漢字コ
ード)を最終的認識結果として出力する。
In this case, the operator inputs kana character information and conversion instruction information for instructing kanji conversion from the operation unit 13 to the control unit @11. The control device 11 reads corrected characters from a character correction dictionary memory prepared in advance according to input information, and displays them on the display unit 12. Thereafter, when confirmation information is input from the operator, the control device 11 outputs the corrected characters (kanji code) as the final recognition result.

しかしながら、前記のような従来の文字修正処理では、
認識不能な文字の出現回数が多くなると、オペレータの
修正操作に要する時間が多大となる。
However, in the conventional character correction processing as described above,
If the number of occurrences of unrecognizable characters increases, the time required for correction operations by the operator increases.

このため、OCRの読取処理効率が低下する問題がある
Therefore, there is a problem that the OCR reading processing efficiency is reduced.

し発明の目的〕 本発明の目的は、認識処理により認識不能な文字が発生
した際、簡単な操作により確実な修正処理を実行できる
ようにして、読取処理効率を大幅に向上することができ
る文字修正装置を提供することにある。
[Object of the Invention] An object of the present invention is to provide a character that, when an unrecognizable character occurs during recognition processing, can be reliably corrected by a simple operation, thereby greatly improving the reading processing efficiency. The purpose of this invention is to provide a correction device.

[発明の概要] 本発明は、認識不能な文字が発生した際、修正文字及び
その修正文字の登録指示用の登録指示情報を入力する入
力手段を備えている。この入力手段から入力される登録
指示情報に応じて、登録制御手段は修正文字を修正文字
用メモリに登録する。
[Summary of the Invention] The present invention includes input means for inputting a corrected character and registration instruction information for instructing registration of the corrected character when an unrecognizable character occurs. The registration control means registers the corrected character in the corrected character memory in accordance with the registration instruction information inputted from the input means.

次に、認識不能な文字が発生した際、登録修正文字の検
索指示用の検索指示情報を入力すると、検索制御手段は
検索指示情報に応じて修正文字用メモリを検索し、その
修正文字を表示手段に表示させる。修正制御手段は、入
力手段から入力される修正文字または検索制御手段によ
り検索された文字の中で特定された修正文字に基づいて
、修正処理を実行する。
Next, when an unrecognized character occurs, if search instruction information for searching for a registered corrected character is input, the search control means searches the corrected character memory according to the search instruction information and displays the corrected character. Display it on the means. The modification control means executes modification processing based on the modification character input from the input means or the modification character specified among the characters searched by the search control means.

このような文字修正装置により、オペレータの簡単な入
力操作で、認識不能な文字を修正することが可能となる
With such a character correction device, unrecognizable characters can be corrected by a simple input operation by an operator.

[発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる文字修正装置の構成を示すブロッ
ク図である。第1図において、制御部20は、OCRの
認識部を備えており、文字修正装置全体の制御を行なう
。文字修正用辞書メモリ21は、予め修正用に必要な漢
字を含む文字コードを記憶している。修正文字登録バッ
ファ22は、制御部20の制御により、特定された修正
文字く文字コード)を登録するメモリである。操作部2
3は、修正文字、修正文字の登録指示用情報及び登録修
正文字の検索指示用情報等を入力するための入カキ−を
備えたキーボードである。表示部24は、制御部20の
制御により、認識結果及び修正文字等を表示する例えば
CRTディスプレイ装置である。
[Embodiment of the Invention] An embodiment of the present invention will be described below with reference to the drawings. 1st
The figure is a block diagram showing the configuration of a character correction device according to an embodiment. In FIG. 1, a control section 20 includes an OCR recognition section and controls the entire character correction apparatus. The character correction dictionary memory 21 stores in advance character codes including kanji characters required for correction. The modified character registration buffer 22 is a memory in which specified modified characters (character codes) are registered under the control of the control unit 20. Operation unit 2
Reference numeral 3 denotes a keyboard provided with input keys for inputting corrected characters, information for instructing registration of corrected characters, information for instructing search for registered corrected characters, and the like. The display unit 24 is, for example, a CRT display device that displays recognition results, corrected characters, etc. under the control of the control unit 20.

このような構成の文字修正装置において、同実施例の動
作を説明する。先ず、読取対象の用紙が読取部(第3図
を参照)で走査されて、用紙に記録された文字が画像デ
ータに変換された後に制御部20に転送されたとする。
In the character correction device having such a configuration, the operation of the same embodiment will be explained. First, it is assumed that a sheet of paper to be read is scanned by a reading section (see FIG. 3), and characters recorded on the sheet are converted into image data and then transferred to the control section 20.

制御部20は、第2図(a)に示すような用紙上の文字
に対するWgl処理を実行し、例えば同図(b)に示す
ような認識結果を出力して表示部24に表示させる。こ
こで、認識処理は通常では1文字毎に実行される。
The control unit 20 executes Wgl processing on the characters on the paper as shown in FIG. 2(a), and outputs a recognition result as shown in FIG. Here, recognition processing is normally executed for each character.

オペレータは、表示部24の画面に表示された認識結果
を見て、第2図(b)に示す文字25が読取対象の本来
の文字26と異なり、誤読されたと判定する。この判定
により、オペレータは文字修正処理を開始する。即ち、
オペレータは、誤読された文字25に対する修正文字の
仮名文字を操作部23の入カキ−を操作して入力し、さ
らに漢字変換キーを操作する。これにより、制御部20
は文字修正用辞書メモリ21から該当する修正文字を読
出し、表示部24にその漢字を表示させる。
The operator looks at the recognition result displayed on the screen of the display unit 24 and determines that the character 25 shown in FIG. 2(b) is different from the original character 26 to be read and has been misread. Based on this determination, the operator starts character correction processing. That is,
The operator inputs the corrected kana character for the misread character 25 by operating the input key on the operation unit 23, and further operates the kanji conversion key. As a result, the control unit 20
reads the corresponding correction character from the character correction dictionary memory 21 and causes the display unit 24 to display the corresponding kanji.

オペレータは表示部24に表示された修正文字を確認す
ると、操作部23を操作して確認情報及び修正文字の登
録指示用情報を入力する。制御部20は、登録指示用情
報に応じて前記のように入力された修正文字をラベル付
をした後に漢字コードの状態で修正文字登録バッファ2
2に登録する。制御部20は、入力された修正文字の文
字コードを最終的認識結果として、例えばコンピュータ
等へ出力する。
After confirming the corrected characters displayed on the display unit 24, the operator operates the operating unit 23 to input confirmation information and information for instructing registration of the corrected characters. The control unit 20 labels the corrected characters input as described above according to the registration instruction information, and then stores them in the corrected character registration buffer 2 in the state of kanji code.
Register for 2. The control unit 20 outputs the character code of the input corrected character to, for example, a computer or the like as a final recognition result.

次に、新たな文字が走査されて認識処理が実行された際
、前記と同様の文字が誤読されたとする。
Next, suppose that when a new character is scanned and recognition processing is performed, the same character as above is misread.

即ち、制御部20により第2図(b)に示す誤読された
文字25が、表示部24に表示されたとする。オペレー
タは、表示部24の画面を見て誤読を確認した後、操作
部23を操作して登録修正文字の検索指示情報を入力す
る。この検索指示情報に応じて、制御部20は修正文字
登録バッファ22内を検索し、登録された修正文字候補
を読出して表示部24に表示させる。このとき、制御部
20は修正文字登録バッファ22に登録された修正文字
の全てを表示することになるが、誤読またはリジェクト
し易い文字は限定されるため、表示される文字数は少な
い。
That is, assume that the control unit 20 displays the misread characters 25 shown in FIG. 2(b) on the display unit 24. After checking the screen of the display unit 24 for misreading, the operator operates the operation unit 23 to input search instruction information for registered correction characters. In response to this search instruction information, the control section 20 searches the corrected character registration buffer 22, reads out the registered corrected character candidates, and displays them on the display section 24. At this time, the control unit 20 displays all of the corrected characters registered in the corrected character registration buffer 22, but the number of displayed characters is small because characters that are likely to be misread or rejected are limited.

オペレータは、表示部24に表示された修正文字候補の
中から、該当する修正文字を選択する。これにより、制
御部20は選択された修正文字を最終的認識結果として
出力することになる。ここで、オペレータから入力され
る検索指示情報に応じて表示部24に表示された登録修
正文字の中に、該当する修正文字が無い場合には前記の
ような修正文字の入力がなされる。即ち、オペレータは
操作部23から修正文字及びその登録指示情報を制御部
20へ入力することになる。この修正文字が、新たに修
正文字登録バッファ22に登録されることになる。
The operator selects the corresponding corrected character from among the corrected character candidates displayed on the display unit 24. Thereby, the control unit 20 outputs the selected corrected character as the final recognition result. Here, if there is no corresponding corrected character among the registered corrected characters displayed on the display section 24 in accordance with search instruction information input by the operator, the above-mentioned corrected character is input. That is, the operator inputs the corrected character and its registration instruction information to the control section 20 from the operation section 23. This modified character will be newly registered in the modified character registration buffer 22.

このようにして、認識処理により誤読またはリジェクト
される認識不能な文字が出現した場合、該当する修正文
字を入力すると共にその修正文字をメモリに登録する。
In this way, when an unrecognizable character that is misread or rejected by the recognition process appears, the corresponding corrected character is input and the corrected character is registered in the memory.

次に、認識不能な文字が出現された際、その該当する修
正文字を登録メモリから検索して出力する。この場合、
オペレータは検索指示情報を入力する入カキ−を操作し
、表示された修正文字の中から該当文字を選択する操作
を行なうだけである。したがって、簡単な入力操作によ
り、認識不能な文字に対する修正処理を実行することが
可能となる。該当する修正文字が登録メモリに登録され
ていない場合、修正文字及び登録指示情報の入力を行な
う必要があるが、通常では認識不能な文字は特定の文字
に限定されていることが多い。このため、所定の文字数
の修正文字が登録メモリに登録されることにより、前記
のような簡単な入力操作のみで文字の修正処理を行なう
ことができる。
Next, when an unrecognizable character appears, the corresponding corrected character is retrieved from the registration memory and output. in this case,
The operator simply operates the input key for inputting search instruction information and selects the corresponding character from among the displayed correction characters. Therefore, it is possible to correct unrecognized characters by a simple input operation. If the corresponding corrected character is not registered in the registration memory, it is necessary to input the corrected character and registration instruction information, but normally unrecognizable characters are often limited to specific characters. Therefore, by registering a predetermined number of corrected characters in the registration memory, character correction processing can be performed with only the simple input operation as described above.

[発明の効果コ 以上詳述したように本発明によれば、読取対象の文字が
認識用辞書に未登録の場合または癖のある手書き文字の
場合などの理由により、I!不能な文字が発生した際、
簡単な入力操作により確実な修正処理を実行できる。し
たがって、読取対象文字が漢字等の場合で認識不能な文
字が比較的発生し易い場合でも、オペレータによる修正
処理の入力操作を簡単化できるため、結果的に従来より
読取処理効率を大幅に向上することができるものである
[Effects of the Invention] As described in detail above, according to the present invention, I! When an invalid character occurs,
Reliable correction processing can be performed with simple input operations. Therefore, even when unrecognized characters are relatively likely to occur when the characters to be read are kanji etc., the input operation for correction processing by the operator can be simplified, resulting in a significant improvement in reading processing efficiency compared to conventional methods. It is something that can be done.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例に係わる文字修正装置の構成
を示すブロック図、第2図(a)は読取対象の文字の一
例で同図(b)は認識結果の一例を示す図、第3図は従
来のOCRの基本的構成を示すブロック図である。 20・・・制御部、21・・・文字修正用辞書メモリ、
22・・・外圧文字登録バッファ、23・・・操作部、
24・・・表示部。
FIG. 1 is a block diagram showing the configuration of a character correction device according to an embodiment of the present invention, FIG. 2(a) is an example of a character to be read, and FIG. 2(b) is a diagram showing an example of a recognition result. FIG. 3 is a block diagram showing the basic configuration of a conventional OCR. 20... Control unit, 21... Dictionary memory for character correction,
22...External pressure character registration buffer, 23...Operation unit,
24...Display section.

Claims (1)

【特許請求の範囲】[Claims] 用紙に記録された文字を認識する光学的文字読取装置に
おいて、認識不能な文字が発生した際にその該当文字に
対応する修正文字及びその修正文字の登録指示用の登録
指示情報を入力する第1の入力手段と、前記第1の入力
手段から入力される登録指示情報に応じて前記修正文字
を修正文字用メモリに登録する登録制御手段と、認識不
能な文字が発生した際に登録修正文字の検索指示用の検
索指示情報を入力する第2の入力手段と、この第2の入
力手段から入力される前記検索指示情報に応じて前記修
正文字用メモリを検索して読出した修正文字を表示手段
に表示させる検索制御手段と、前記第1の入力手段から
入力される修正文字または前記検索制御手段により検索
された文字の中で特定された修正文字に基づいて修正処
理を実行する修正制御手段とを具備してなることを特徴
とする文字修正装置。
In an optical character reading device that recognizes characters recorded on paper, when an unrecognized character occurs, a first step is to input a corrected character corresponding to the corresponding character and registration instruction information for instructing registration of the corrected character. an input means, a registration control means for registering the corrected character in a corrected character memory in accordance with registration instruction information inputted from the first input means, and a registration control means for registering the corrected character to be registered when an unrecognized character occurs. a second input means for inputting search instruction information for a search instruction; and a means for displaying the corrected characters read out by searching the corrected character memory in accordance with the search instruction information input from the second input means. a search control means for performing a correction process based on a correction character input from the first input means or a correction character specified among the characters searched by the search control means; A character correction device comprising:
JP60039305A 1985-02-28 1985-02-28 Character correcting device Pending JPS61198383A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60039305A JPS61198383A (en) 1985-02-28 1985-02-28 Character correcting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60039305A JPS61198383A (en) 1985-02-28 1985-02-28 Character correcting device

Publications (1)

Publication Number Publication Date
JPS61198383A true JPS61198383A (en) 1986-09-02

Family

ID=12549403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60039305A Pending JPS61198383A (en) 1985-02-28 1985-02-28 Character correcting device

Country Status (1)

Country Link
JP (1) JPS61198383A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04155489A (en) * 1990-10-19 1992-05-28 Toyo Ink Mfg Co Ltd Recording object for collation

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04155489A (en) * 1990-10-19 1992-05-28 Toyo Ink Mfg Co Ltd Recording object for collation

Similar Documents

Publication Publication Date Title
US5022081A (en) Information recognition system
JP2000322417A (en) Device and method for filing image and storage medium
JPS61198383A (en) Character correcting device
JP3775133B2 (en) Data processing apparatus and program recording medium thereof
JP2004046388A (en) Information processing system and character correction method
JP3455643B2 (en) Method of updating learning dictionary in character recognition device and character recognition device
JP3221968B2 (en) Character recognition device
JPH05120471A (en) Character recognizing device
JPS61272882A (en) Information recognizing device
JPS61150081A (en) Character recognizing device
JPH0660053A (en) Input device
JPH1021233A (en) Information processor
JPS58125183A (en) Method for displaying unrecognizable character in optical character reader
JP2000132635A (en) Recognizing data confirming method
JPS61226883A (en) Character recognizing device
JPH09138835A (en) Character recognition system
JPS594358Y2 (en) Character control device in character correction
JPH06223221A (en) Character recognizing device
JPH05210635A (en) Input device
JPH06333083A (en) Optical character reader
JP2829186B2 (en) Optical character reader
JPH117492A (en) Method and device for editing key entry
JPS6190282A (en) Input device using optical character reader
JPH07239901A (en) Character correction method for optical reader
JPH0863487A (en) Method and device for document retrieval