JP3221969B2 - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JP3221969B2
JP3221969B2 JP08197693A JP8197693A JP3221969B2 JP 3221969 B2 JP3221969 B2 JP 3221969B2 JP 08197693 A JP08197693 A JP 08197693A JP 8197693 A JP8197693 A JP 8197693A JP 3221969 B2 JP3221969 B2 JP 3221969B2
Authority
JP
Japan
Prior art keywords
character
unit
candidate
recognition
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08197693A
Other languages
Japanese (ja)
Other versions
JPH06295360A (en
Inventor
真 久島
雅寛 桜井
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP08197693A priority Critical patent/JP3221969B2/en
Publication of JPH06295360A publication Critical patent/JPH06295360A/en
Application granted granted Critical
Publication of JP3221969B2 publication Critical patent/JP3221969B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、迅速かつ正確に帳票
または文書を処理できるように操作性を良くした文字認
識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device having improved operability so that a form or a document can be processed quickly and accurately.

【0002】[0002]

【従来の技術】従来より、文字を認識し、その結果を修
正するには以下のような方法が広く知られている。帳票
または文書の所定領域を光学的に走査し紙面からの光信
号を光電変換して帳票または文書の画像データを得て、
この画像データから認識対象となる文字パタンを切り出
し、認識辞書中の文字との間の類似度を算出し、この類
似度が大きい順に候補順位を付して一つまたは複数の候
補文字を出力する。候補順位が1位の文字が誤りであ
り、かつ複数の候補文字を得ている場合は、候補順位が
2位以下の文字も表示してそこから正解文字を選択する
ことにより訂正を行う。もし2位以下の文字にも正解が
含まれていなければ、通常のキーボード入力により正解
文字を入力して訂正する。また、候補文字が1つだけで
あり、かつその文字が誤りである場合は通常のキーボー
ド入力により正解文字を入力して訂正する。
2. Description of the Related Art Conventionally, the following methods have been widely known for recognizing characters and correcting the results. A predetermined area of the form or document is optically scanned and an optical signal from the paper is photoelectrically converted to obtain image data of the form or document,
A character pattern to be recognized is cut out from the image data, a similarity between the character pattern and the character in the recognition dictionary is calculated, and one or more candidate characters are output in a candidate order in descending order of the similarity. . If the first character in the candidate order is erroneous and a plurality of candidate characters are obtained, the characters in the second or lower candidate order are also displayed, and correction is performed by selecting the correct character therefrom. If the second or lower character does not include a correct answer, the correct character is input by a normal keyboard input and corrected. If there is only one candidate character and the character is incorrect, the correct character is input by a normal keyboard input and corrected.

【0003】また、文字認識装置の利用者は認識辞書に
予め用意されていない文字・記号を認識する場合は特開
昭58ー149574号公報に示されたような方法等で
その文字・記号を追加登録していた。
When a user of a character recognition device recognizes a character or symbol that is not prepared in advance in the recognition dictionary, the character or symbol is converted by a method as disclosed in Japanese Patent Laid-Open No. 58-149574. It was registered additionally.

【0004】[0004]

【発明が解決しようとする課題】上記文字認識技術で
は、候補文字を表示する際に、(1)最初から存在した
文字情報の文字が候補文字として出力される場合と、
(2)利用者が登録した文字情報の文字が候補文字とし
て出力される場合が考えられるが、利用者は目的に応じ
て必要性の高い文字情報を登録するのであるから(2)
の場合の文字は(1)の場合の文字より正解である可能
性が高い。それにもかかわらず従来は(1)、(2)の
場合の文字の表示を同一としていた。
According to the above character recognition technology, when displaying candidate characters, (1) a case where a character of character information that originally exists is output as a candidate character;
(2) It is conceivable that the characters of the character information registered by the user are output as candidate characters, but the user registers character information that is highly necessary according to the purpose (2)
The character in case (1) is more likely to be correct than the character in case (1). Nevertheless, conventionally, the display of characters in cases (1) and (2) is the same.

【0005】従って、オペレーターは候補文字の表示を
一瞥しただけでは正解である可能性が高い文字を発見す
ることはできないので、表示されている全ての文字を注
意深く観察して正解文字を選択する必要があり、これが
ため訂正、確認等の編集作業に多くの時間を要し、単位
時間当たりに処理できる帳票または文書の枚数が少なく
なるという問題があった。
[0005] Therefore, since the operator cannot find a character that is likely to be correct only by glance at the display of candidate characters, it is necessary to carefully observe all displayed characters and select a correct character. For this reason, there has been a problem that editing and editing operations such as correction and confirmation require much time, and the number of forms or documents that can be processed per unit time is reduced.

【0006】この発明の目的は上述した従来の問題点を
解決し、表示された候補文字の中から正解文字を選択す
る作業を従来よりも行ない易くして操作性を良くした文
字認識装置を提供することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a character recognizing apparatus which solves the above-mentioned conventional problems and makes it easier to select a correct character from displayed candidate characters than before, thereby improving operability. Is to do.

【0007】[0007]

【課題を解決するための手段】この発明は前記課題を解
決するために、量子化された帳票または文書の画像デー
タから切り出した文字パタン認識結果としての候補文字
を出力する認識部と、文字情報を認識辞書へ登録するた
めの文字登録部と、前記認識部の認識結果を編集する結
果編集部と、前記候補文字を表示する表示部と、正解文
字を入力する入力部を備えて成る文字認識装置におい
て、前記表示部は、当該候補文字が最初から認識辞書に
存在した文字である場合と前記文字登録部で登録された
文字である場合とでその文字の表示方法を変化させるこ
とを特徴とする。
According to the present invention, there is provided a recognition unit for outputting a candidate character as a character pattern recognition result cut out from image data of a quantized form or document; A character registration unit for registering a character in a recognition dictionary, a result editing unit for editing a recognition result of the recognition unit, a display unit for displaying the candidate character, and an input unit for inputting a correct character In the apparatus, the display unit changes a display method of the character depending on whether the candidate character is a character existing in the recognition dictionary from the beginning or a case where the candidate character is a character registered in the character registration unit. I do.

【0008】[0008]

【作用】この発明によれば、候補文字から正解を選択す
る際の表示部の表示は、認識辞書に最初から存在した文
字が候補文字として出力された場合と、文字登録部で登
録された文字が候補文字として出力された場合とで変化
し、候補文字を選択する作業において最初から認識辞書
に存在した文字情報の文字と、利用者が登録した文字情
報の文字とを簡単に見分けることができるので、オペレ
ーターは正解の可能性の高い候補文字を瞬時に発見し訂
正、確認等の作業を行える。従って、前記課題を解決で
きるのである。
According to the present invention, when the correct answer is selected from the candidate characters, the display on the display unit is performed when the character existing from the beginning in the recognition dictionary is output as the candidate character and when the character registered in the character registration unit is output. Is changed as a candidate character, and in the operation of selecting a candidate character, it is possible to easily distinguish the character of the character information that originally existed in the recognition dictionary from the character information registered by the user. Therefore, the operator can instantly find a candidate character having a high possibility of a correct answer, and perform operations such as correction and confirmation. Therefore, the above problem can be solved.

【0009】[0009]

【実施例】以下、図面を参照しこの発明の実施例につき
説明する。尚、図面はこの発明が理解できる程度に概略
的に示されているにすぎず、従って各構成成分の形状、
配設位置、寸法、入出力信号および接続関係を図示例に
限定するものではない。
Embodiments of the present invention will be described below with reference to the drawings. It should be noted that the drawings are only schematically shown to an extent that the present invention can be understood.
The arrangement positions, dimensions, input / output signals, and connection relationships are not limited to the illustrated examples.

【0010】図1はこの発明の一実施例の説明に供する
機能ブロック図である。この実施例の文字認識装置10
は、量子化された帳票または文書の画像データから文字
パタンを切り出し、この切り出した文字パタンの認識結
果を出力する認識部12と、文字認識装置の利用者が希
望する文字情報を登録する文字登録部14と、認識結果
を訂正、確認する結果編集部16と、候補文字を表示す
る表示部18と、正解文字を入力する入力部20を備
え、さらにこれら結果編集部16、表示部18、及び入
力部20の動作を制御する制御部22を備えて成る。ま
た図1において24は帳票または文書の量子化された画
像データを出力する光電変換部であり、26は光電変換
部24からの画像データを格納する画像メモリである。
FIG. 1 is a functional block diagram for explaining one embodiment of the present invention. Character recognition device 10 of this embodiment
Is a recognition unit 12 for extracting a character pattern from quantized form or document image data and outputting a recognition result of the extracted character pattern, and a character registration unit for registering character information desired by a user of the character recognition device. A unit 14, a result editing unit 16 for correcting and confirming a recognition result, a display unit 18 for displaying candidate characters, and an input unit 20 for inputting correct characters. The result editing unit 16, the display unit 18, and A control unit 22 for controlling the operation of the input unit 20 is provided. In FIG. 1, reference numeral 24 denotes a photoelectric conversion unit that outputs quantized image data of a form or document, and 26 denotes an image memory that stores image data from the photoelectric conversion unit 24.

【0011】図2は帳票の一例を示す図であり、同図に
おいて28は住所が記載される帳票の例、30は文字記
載領域を指定する記入枠である。
FIG. 2 is a view showing an example of a form, in which 28 is an example of a form in which an address is described, and 30 is an entry frame for designating a character description area.

【0012】図3は候補文字選択の一例を示す図であ
り、同図において32は表示画面、34は帳票、36は
訂正する文字を含む記入枠、38はカーソル位置、40
は候補文字表示枠、42は表示方法が変化している利用
者登録文字を示す。
FIG. 3 is a view showing an example of selection of candidate characters. In FIG. 3, reference numeral 32 denotes a display screen, reference numeral 34 denotes a form, reference numeral 36 denotes an entry frame containing a character to be corrected, reference numeral 38 denotes a cursor position, reference numeral 40 denotes a cursor position.
Indicates a candidate character display frame, and 42 indicates a user registered character whose display method has changed.

【0013】以下、図1、図2、及び図3を参照し、こ
の実施例につきより詳細に説明する。光電変換部24は
帳票または文書上の所定の読取り範囲を光学的に走査
し、帳票または文書からの光信号Lを光電変換して白黒
2値に量子化された画像データを出力し、画像メモリ2
6はこの画像データを格納する。
Hereinafter, this embodiment will be described in more detail with reference to FIGS. 1, 2 and 3. FIG. The photoelectric conversion unit 24 optically scans a predetermined reading range on the form or document, photoelectrically converts an optical signal L from the form or document, and outputs image data quantized into black and white binary data. 2
6 stores this image data.

【0014】認識部12は画像メモリ26の画像データ
から文字パタンを切り出し、この切り出した文字パタン
から認識対象となる文字に関する各種特徴を抽出する。
そして切り出した文字パタンの特徴を標準文字パタンの
特徴と照合し、候補文字を出力する。ひとつの文字に関
して1個または複数個の候補文字が認識結果として得ら
れ、候補文字が1個の場合には候補順位1を当該候補文
字に付して出力し、また候補文字が複数個の場合には各
候補文字毎に定めた候補順位を候補文字に付して出力す
る。
The recognizing unit 12 extracts a character pattern from the image data in the image memory 26, and extracts various features relating to the character to be recognized from the extracted character pattern.
Then, the features of the extracted character pattern are compared with the features of the standard character pattern, and candidate characters are output. One or more candidate characters are obtained as a recognition result for one character. If there is only one candidate character, candidate rank 1 is added to the candidate character and output. If there is more than one candidate character, Outputs the candidate rank determined for each candidate character to the candidate character.

【0015】文字登録部14は文字認識装置の利用者が
希望する文字情報を認識辞書へ追加登録する。認識辞書
の文字情報には文字登録部で登録された文字情報と、最
初から用意されている一般の文字情報とを区別できるよ
うな情報を付加しておく。以後この情報を文字登録情報
と呼ぶ。
The character registration unit 14 additionally registers character information desired by the user of the character recognition device in the recognition dictionary. The character information of the recognition dictionary is added with information for distinguishing the character information registered by the character registration unit from general character information prepared from the beginning. Hereinafter, this information is referred to as character registration information.

【0016】結果編集部16は認識部12から送出され
た候補順位が1位の文字Aが誤りでありかつ複数の候補
文字が存在する場合は、2位以下の候補文字を制御部2
2へ送出し、さらに制御部22はそれらの候補文字及び
文字登録情報に応じた候補文字の表示指示を表示部18
へ送出する。このとき当該候補文字が文字登録部で登録
された文字情報の文字でない場合は、第一の色で表示す
る指示を、文字登録部で登録された文字情報の文字であ
る場合は第一の色と異なる第二の色で表示する指示を送
出する。さらに表示部18は表示指示で指定された方法
(例えば図3に示す候補文字表示枠40)で当該候補文
字を表示する。さらに入力部20は表示された候補文字
の中から正解文字を選択し、それを制御部22へ送出す
る。さらに結果編集部16はこの正解文字を制御部22
から受取り、誤った1位の文字Aと交換する。
If the character A with the first candidate rank sent from the recognition unit 12 is erroneous and there are a plurality of candidate characters, the result editing unit 16 deletes the second or lower candidate character from the control unit 2.
2, and the control unit 22 sends a display instruction of the candidate character and the candidate character corresponding to the character registration information to the display unit 18.
Send to At this time, if the candidate character is not the character of the character information registered in the character registration unit, the instruction to display in the first color is given. If the candidate character is the character of the character information registered in the character registration unit, the first color is displayed. And an instruction to display in a second color different from. Further, the display unit 18 displays the candidate character by the method designated by the display instruction (for example, the candidate character display frame 40 shown in FIG. 3). Further, the input unit 20 selects a correct character from the displayed candidate characters and sends it to the control unit 22. Further, the result editing unit 16 transmits the correct character to the control unit 22.
And exchanges it for the wrong first letter A.

【0017】また認識部12から送出された候補順位が
1位の文字Aが誤りでありかつ候補文字が1つしか存在
しない場合は、入力部20が正解文字を入力し制御部2
2を通じて結果編集部16へ送出する。さらに結果編集
部16はこの正解文字を制御部22から受取り、誤った
1位の文字Aと交換する。また認識部12から送出され
た文字Aが正解の場合は、文字Aをそのまま出力する。
If the first character in the candidate order sent from the recognition unit 12 is erroneous and there is only one candidate character, the input unit 20 inputs the correct character and the control unit 2
2 to the result editing unit 16. Further, the result editing unit 16 receives this correct character from the control unit 22 and exchanges it with the incorrect first character A. If the character A sent from the recognition unit 12 is correct, the character A is output as it is.

【0018】この発明は上述した実施例にのみ限定され
るものではなく、従って各構成成分の構成、動作、処理
内容、入出力信号及び数値的条件を任意好適に変更して
よい。例えば上述した実施例では文字登録部において利
用者は一般認識辞書に文字情報を追加登録したが、もう
1つの利用者専用の認識辞書を用意してそこに必要な文
字情報を登録するようにしてもよい。
The present invention is not limited to the above-described embodiment, and accordingly, the configuration, operation, processing contents, input / output signals and numerical conditions of each component may be arbitrarily and suitably changed. For example, in the above-described embodiment, the user additionally registers character information in the general recognition dictionary in the character registration unit, but prepares another recognition dictionary dedicated to the user and registers necessary character information there. Is also good.

【0019】また表示部の表示方法を上述のもののほ
か、例えば異なる色、異なる輝度、ブリンキング及びア
ンダーラインのうちのいずれか一つまたは複数を用い
て、表示を変化させるようにしてもよい。
The display method of the display section may be changed by using one or more of different colors, different luminances, blinking, and underlining, for example, in addition to the above-described method.

【0020】[0020]

【発明の効果】上述したようにこの発明によれば、候補
文字から正解を選択する際の表示部の表示は、認識辞書
に最初から存在した文字が候補文字として出力された場
合と、文字登録部で登録された文字が候補文字として出
力された場合とで変化し、候補文字を選択する作業にお
いて最初から認識辞書に存在した文字情報の文字と、利
用者が登録した文字情報の文字とを簡単に見分けること
ができるので、オペレーターは正解の可能性の高い候補
文字を瞬時に発見し訂正、確認等の作業を行える。その
結果、帳票または文書の訂正、確認の処理に要する時間
が短縮される。従って、高速かつ迅速に帳票または文書
を処理できる操作性の良い文字認識装置を提供できる。
As described above, according to the present invention, when the correct answer is selected from the candidate characters, the display on the display unit is performed when the character existing from the beginning in the recognition dictionary is output as the candidate character and when the character registration is performed. When the character registered in the section is output as a candidate character, it changes depending on whether the character of the character information existing in the recognition dictionary from the beginning and the character of the character information registered by the user in the operation of selecting the candidate character. Since the operator can easily identify the candidate character, the operator can instantly find a candidate character having a high possibility of correct answer, and perform operations such as correction and confirmation. As a result, the time required for correcting or confirming the form or document is reduced. Therefore, it is possible to provide a character recognition device with good operability that can process a form or a document quickly and quickly.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例の構成を示す機能ブロック図で
ある。
FIG. 1 is a functional block diagram showing a configuration of an embodiment of the present invention.

【図2】帳票の一例を示す図である。FIG. 2 is a diagram illustrating an example of a form.

【図3】候補文字選択の一例を示す図である。FIG. 3 is a diagram illustrating an example of candidate character selection.

【符号の説明】[Explanation of symbols]

10 文字認識装置 12 認識部 14 文字登録部 16 結果編集部 18 表示部 20 入力部 22 制御部 24 光電変換部 26 画像メモリ Reference Signs List 10 character recognition device 12 recognition unit 14 character registration unit 16 result editing unit 18 display unit 20 input unit 22 control unit 24 photoelectric conversion unit 26 image memory

フロントページの続き (56)参考文献 特開 平1−145789(JP,A) 特開 平1−100686(JP,A) 特開 昭57−73478(JP,A) 特開 平3−291777(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/68 G06K 9/03 Continuation of the front page (56) References JP-A-1-145789 (JP, A) JP-A-1-100686 (JP, A) JP-A-57-73478 (JP, A) JP-A-3-291777 (JP) , A) (58) Field surveyed (Int. Cl. 7 , DB name) G06K 9/68 G06K 9/03

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 量子化された帳票または文書の画像デー
タから切り出した文字パタン認識結果としての候補文字
を出力する認識部と、文字情報を認識辞書へ登録するた
めの文字登録部と、前記認識部の認識結果を編集する結
果編集部と、前記候補文字を表示する表示部と、正解文
字を入力する入力部を備えて成る文字認識装置におい
て、 前記表示部は、当該候補文字が最初から認識辞書に存在
した文字である場合と前記文字登録部で登録された文字
である場合とでその文字の表示方法を変化させることを
特徴とする文字認識装置。
A recognition unit that outputs candidate characters as a character pattern recognition result extracted from image data of a quantized form or document; a character registration unit for registering character information in a recognition dictionary; In a character recognition device comprising: a result editing unit for editing a recognition result of a unit; a display unit for displaying the candidate character; and an input unit for inputting a correct character, the display unit recognizes the candidate character from the beginning. A character recognition apparatus characterized by changing a display method of a character between a case where the character exists in a dictionary and a case where the character is registered in the character registration unit.
JP08197693A 1993-04-08 1993-04-08 Character recognition device Expired - Fee Related JP3221969B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08197693A JP3221969B2 (en) 1993-04-08 1993-04-08 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08197693A JP3221969B2 (en) 1993-04-08 1993-04-08 Character recognition device

Publications (2)

Publication Number Publication Date
JPH06295360A JPH06295360A (en) 1994-10-21
JP3221969B2 true JP3221969B2 (en) 2001-10-22

Family

ID=13761525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08197693A Expired - Fee Related JP3221969B2 (en) 1993-04-08 1993-04-08 Character recognition device

Country Status (1)

Country Link
JP (1) JP3221969B2 (en)

Also Published As

Publication number Publication date
JPH06295360A (en) 1994-10-21

Similar Documents

Publication Publication Date Title
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
US5233672A (en) Character reader and recognizer with a specialized editing function
JP3221969B2 (en) Character recognition device
JPH0373914B2 (en)
JPS62259192A (en) Rejection correction system
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JPH06290308A (en) Character recognizing device
JPS63316285A (en) Character recognizing device
JPH0749557Y2 (en) Character recognition device
JPH103516A (en) Method and device for processing information
JP3077580B2 (en) Character reader
JP2933178B2 (en) Character recognition method for optical character reader
JP2022019257A (en) Information processing device, information processing method, and program
JP2683711B2 (en) How to recognize / correct character / symbol data
JPS63115283A (en) Method for displaying corrected picture of recognition result in character recognition device
JPH09114918A (en) Optical character reader
JPH0132145Y2 (en)
JPH0554178A (en) Character recognizing device and slip for correction
JP2001307020A (en) Character recognizing device
JPH01287755A (en) Information input device with correcting function
JPH07160811A (en) Character recognizing device
JPH02193278A (en) Image processor
JPH0962786A (en) Character recognizer
JPS6292080A (en) Pattern recognizing device
JPH10134120A (en) Method and device for table processing

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010724

LAPS Cancellation because of no payment of annual fees