JPH08287191A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH08287191A
JPH08287191A JP7083657A JP8365795A JPH08287191A JP H08287191 A JPH08287191 A JP H08287191A JP 7083657 A JP7083657 A JP 7083657A JP 8365795 A JP8365795 A JP 8365795A JP H08287191 A JPH08287191 A JP H08287191A
Authority
JP
Japan
Prior art keywords
recognition
character
character pattern
learning
learned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7083657A
Other languages
Japanese (ja)
Inventor
Toshihiro Nakamura
敏浩 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7083657A priority Critical patent/JPH08287191A/en
Publication of JPH08287191A publication Critical patent/JPH08287191A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE: To provide an optical character recognition device which can enables a user himself or herself to register a character pattern corresponding to the use environment in a recognition dictionary. CONSTITUTION: The user generates a sample document into which characters to be learnt are entered, stores an FC information storage part 4 with correct answer information generated by giving correction answer character codes to the sample document through input operation, and then makes this device to read the sample document. A control part 8 after obtaining a recognition result from the sample document registers a learnt character pattern in the recognition dictionary in a dictionary storage part 2 on the basis of the correct answer information.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、光学的文字読取装置に
関し、より詳しくは、ユーザ自身が使用環境に応じた文
字パターンを認識辞書に登録できるカスタマイズ機能を
備えた光学的文字読取装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reading device, and more particularly to an optical character reading device having a customizing function that allows a user to register a character pattern according to a use environment in a recognition dictionary.

【0002】[0002]

【従来の技術】光学的文字読取装置は、従来より標準文
字パターンが登録された認識辞書を用いているため、ユ
ーザ側で認識率の低いフォントの字体が発生する場合が
ある。この場合は、製造元にてユーザ毎に辞書のメンテ
ナンス作業を行っていた。このメンテナンス作業に際し
ては、追加すべき文字パターンの選択、追加文字パター
ン数の決定、文字カテゴリー同士の競合の調整等を行わ
なければならず、専門的な技術を必要としていた。
2. Description of the Related Art Since an optical character reader has conventionally used a recognition dictionary in which standard character patterns are registered, the font of a font having a low recognition rate may occur on the user side. In this case, the manufacturer had to maintain the dictionary for each user. In this maintenance work, it was necessary to select character patterns to be added, determine the number of additional character patterns, adjust competition between character categories, etc., and required specialized technology.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、ユーザ
側で認識辞書を作成したいという要望があるが、従来例
装置では、ユーザ側で高精度の辞書を作成することは困
難であった。
However, although there is a demand for the user to create a recognition dictionary, it has been difficult for the conventional device to create a highly accurate dictionary on the user side.

【0004】そこで、本発明は、上記事情に鑑みてなさ
れたものであり、ユーザ自身が使用環境に応じた文字パ
ターンを認識辞書に登録可能な光学的文字読取装置を提
供することを目的とするものである。
Therefore, the present invention has been made in view of the above circumstances, and an object of the present invention is to provide an optical character reading device in which a user can register a character pattern according to a use environment in a recognition dictionary. It is a thing.

【0005】[0005]

【課題を解決するための手段】上記課題を解決するため
の本発明の手段を説明する。
Means for Solving the Problems The means of the present invention for solving the above problems will be described.

【0006】請求項1記載の発明に係る光学的文字読取
装置は、学習対象の文字が記入されたサンプル文書を読
み取ることで、当該対象の学習文字パターンを認識辞書
に登録する光学的文字読取装置であって、文書のイメー
ジを検出するスキャナ部と、標準文字パターンが文字コ
ードに対応して予め登録された認識辞書を記憶する辞書
記憶部と、前記スキャナ部によって検出された文書のイ
メージから文字パターンを切り出し、前記認識辞書と照
合して認識結果を出力する認識部と、前記サンプル文書
に対し学習対象の文字毎に正解文字コードを与えた正解
情報を入力操作に基づいて記憶する正解情報記憶部と、
前記スキャナ部及び認識部を制御して前記サンプル文書
に対する認識結果を得た後、前記正解情報を基に学習文
字パターンを前記認識辞書に登録する制御部とを有する
ことを特徴とするものである。
The optical character reader according to the first aspect of the present invention is an optical character reader that registers a learned character pattern of a target in a recognition dictionary by reading a sample document in which a character to be learned is written. A scanner unit that detects an image of a document, a dictionary storage unit that stores a recognition dictionary in which standard character patterns are registered in advance corresponding to character codes, and a character from the image of the document detected by the scanner unit. A recognition unit that cuts out a pattern and outputs a recognition result by collating with the recognition dictionary, and a correct answer information storage that stores correct answer information in which a correct answer character code is given to each learning target character in the sample document based on an input operation. Department,
After controlling the scanner unit and the recognition unit to obtain a recognition result for the sample document, a control unit for registering a learning character pattern in the recognition dictionary based on the correct answer information is provided. .

【0007】請求項2記載の発明に係る光学的文字読取
装置は、表示部を備え、前記制御部は、学習文字パター
ンを登録した後、前記認識部を制御して学習文字パター
ンを認識して認識結果を得た後、その認識結果における
学習文字パターンの認識率をサブセット別に求めてそれ
らを前記表示部に表示し、指定されたサブセットの学習
文字パターンを前記認識辞書に重複して登録するもので
ある。
An optical character reading device according to a second aspect of the present invention includes a display unit, and the control unit registers the learned character pattern and then controls the recognition unit to recognize the learned character pattern. After obtaining the recognition result, the recognition rate of the learning character pattern in the recognition result is obtained for each subset and displayed on the display unit, and the learning character pattern of the designated subset is registered in the recognition dictionary in duplicate. Is.

【0008】請求項3記載の発明に係る光学的文字読取
装置は、表示部を備え、前記制御部は、学習文字パター
ンを登録した後、前記認識部を制御して標準文字パター
ン及び学習文字パターンを認識して認識結果を得た後、
その認識結果における文字パターンの認識率をサブセッ
ト別に標準文字パターン及び学習文字パターン毎に求め
てそれらを前記表示部に表示し、指定されたサブセット
の標準文字パターン又は学習文字パターンを前記認識辞
書に重複して登録するものである。
An optical character reader according to a third aspect of the present invention comprises a display unit, and the control unit controls the recognition unit after registering a learned character pattern and controls the standard character pattern and the learned character pattern. After recognizing and getting the recognition result,
The recognition rate of the character pattern in the recognition result is obtained for each standard character pattern and learning character pattern for each subset and displayed on the display unit, and the standard character pattern or learning character pattern of the designated subset is duplicated in the recognition dictionary. And then register.

【0009】請求項4記載の発明に係る光学的文字読取
装置は、表示部を備え、前記制御部は、学習文字パター
ンを登録した後、前記認識部を制御して標準文字パター
ン及び学習文字パターンを認識して認識結果を得た後、
その認識結果における文字パターンの認識率をカテゴリ
毎に求めてそれらを前記表示部に表示し、指定されたカ
テゴリの文字パターンを前記認識辞書に重複して登録す
るものである。
An optical character reading apparatus according to a fourth aspect of the present invention includes a display unit, and the control unit controls the recognition unit after registering the learned character pattern and controls the standard character pattern and the learned character pattern. After recognizing and getting the recognition result,
The recognition rate of the character pattern in the recognition result is obtained for each category, displayed on the display unit, and the character pattern of the designated category is registered in the recognition dictionary in duplicate.

【0010】請求項5記載の発明に係る光学的文字読取
装置は、表示部を備え、前記制御部は、学習文字パター
ンを登録する前に、学習文字パターンを前記表示部に表
示し、指定された学習文字パターン以外の学習文字パタ
ーンを前記認識辞書に登録するものである。
An optical character reading device according to a fifth aspect of the present invention includes a display unit, and the control unit displays the learning character pattern on the display unit before registering the learning character pattern and specifies the learning character pattern. Learning character patterns other than the learned character pattern are registered in the recognition dictionary.

【0011】[0011]

【作用】上記構成の本発明の作用を説明する。The operation of the present invention having the above construction will be described.

【0012】請求項1記載の発明に係る装置によれば、
ユーザは、学習対象の文字を記入したサンプル文書を作
成し、入力操作によってそのサンプル文書に対し正解文
字コードを与えた正解情報を正解情報記憶部に記憶させ
た後、サンプル文書を本装置に読み取らせる。制御部
は、サンプル文書に対する認識結果を得た後、正解情報
を基に学習文字パターンを認識辞書に登録する。
According to the apparatus of the invention as defined in claim 1,
The user creates a sample document in which characters to be learned are entered, stores the correct answer information in which the correct answer character code is given to the sample document in the correct answer information storage unit, and then reads the sample document into this device. Let After obtaining the recognition result for the sample document, the control unit registers the learned character pattern in the recognition dictionary based on the correct answer information.

【0013】請求項2記載の発明に係る装置によれば、
制御部は、学習文字パターンを登録した後、サブセット
別に学習文字パターンの認識率を求めて表示する。学習
文字パターンを登録してもその認識率が目標に達してい
ない場合がある。この場合にユーザは、認識率が目標に
達していないサブセットを指定する。制御部は、指定さ
れたサブセットの学習文字パターンを認識辞書に重複し
て登録する。同一の文字パターンを重複して登録するこ
とにより、認識率が向上する。
According to the device of the invention described in claim 2,
After registering the learning character pattern, the control unit obtains and displays the recognition rate of the learning character pattern for each subset. Even if the learning character pattern is registered, the recognition rate may not reach the target. In this case, the user specifies a subset whose recognition rate does not reach the target. The control unit redundantly registers the learned character patterns of the designated subset in the recognition dictionary. By registering the same character pattern redundantly, the recognition rate is improved.

【0014】請求項3記載の発明に係る装置によれば、
制御部は、学習文字パターンを登録した後、サブセット
別に標準文字パターン及び学習文字パターン毎の認識率
を求めて表示する。学習文字パターンを登録してもその
認識率が目標に達していない場合や学習文字パターンを
登録すると標準文字パターンの認識率が目標より低下す
る場合がある。この場合にユーザは、認識率が目標に達
していないサブセットの文字パターンを指定する。制御
部は、指定されたサブセットの文字パターンを認識辞書
に重複して登録する。
According to the apparatus of the invention described in claim 3,
After registering the learned character pattern, the control unit obtains and displays the recognition rate for each of the standard character pattern and the learned character pattern for each subset. Even if the learning character pattern is registered, the recognition rate may not reach the target, or if the learning character pattern is registered, the recognition rate of the standard character pattern may be lower than the target. In this case, the user specifies a character pattern of the subset whose recognition rate does not reach the target. The control unit redundantly registers the character pattern of the designated subset in the recognition dictionary.

【0015】請求項4記載の発明に係る装置によれば、
制御部は、学習文字パターンを登録した後、カテゴリ毎
に標準文字パターン及び学習文字パターンの認識率を求
めて表示する。ユーザは、認識率が目標に達していない
カテゴリの文字パターンを指定する。制御部は、指定さ
れたカテゴリの文字パターンを認識辞書に重複して登録
する。
According to the apparatus of the invention as defined in claim 4,
After registering the learned character pattern, the control unit obtains and displays the recognition rates of the standard character pattern and the learned character pattern for each category. The user specifies a character pattern of a category whose recognition rate does not reach the target. The control unit redundantly registers the character pattern of the designated category in the recognition dictionary.

【0016】請求項5記載の発明に係る装置によれば、
制御部は、学習文字パターンを登録する前に、学習文字
パターンを表示する。ユーザは、不良の学習文字パター
ンを指定する。制御部は、指定された学習文字パターン
以外の学習文字パターンを登録する。
According to the device of the invention described in claim 5,
The control unit displays the learned character pattern before registering the learned character pattern. The user specifies a learned learning character pattern that is defective. The control unit registers learning character patterns other than the designated learning character pattern.

【0017】[0017]

【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0018】図1は本発明の光学的文字読取装置の第1
の実施例に示すブロック図である。
FIG. 1 shows a first embodiment of the optical character reader of the present invention.
It is a block diagram shown in the Example of.

【0019】本実施例装置は、同図に示すように、帳票
のイメージを検出するスキャナ部1と、認識辞書を記憶
する辞書記憶部2と、スキャナ部1によって検出された
帳票のイメージから文字パターンを切り出し、認識辞書
と照合して認識結果を出力する認識部3と、各種のフォ
ーマットコントロール(FC)情報を記憶するFC情報
記憶部(正解情報記憶部)4と、学習オブジェクト等を
記憶するハードディスク等の学習オブジェクト記憶部5
と、CRTディスプレイ,LED(液晶ディスプレイ)
等の表示部6と、キーボード,マウス等を備えた入力部
7と、本装置各部を制御する制御部8とを有して概略構
成されている。
As shown in FIG. 1, the apparatus of this embodiment has a scanner unit 1 for detecting an image of a form, a dictionary storage unit 2 for storing a recognition dictionary, and a character from the image of the form detected by the scanner unit 1. A recognition unit 3 that cuts out a pattern and outputs a recognition result by collating with a recognition dictionary, an FC information storage unit (correct answer information storage unit) 4 that stores various format control (FC) information, and a learning object and the like are stored. Learning object storage unit 5 such as a hard disk
And CRT display, LED (liquid crystal display)
And the like, a input unit 7 including a keyboard, a mouse, and the like, and a control unit 8 for controlling each unit of the apparatus.

【0020】次に、上記各部の詳細を説明する。Next, the details of each of the above parts will be described.

【0021】前記スキャナ部1は、帳票上に光を照射す
る光源と、帳票からの反射光を受けてその光量に応じた
電気信号に変換する光電変換器とを備え、帳票全体を光
学的に走査して帳票全体のイメージを検出するものであ
る。
The scanner unit 1 is equipped with a light source for irradiating light onto a form and a photoelectric converter for receiving reflected light from the form and converting it into an electric signal according to the amount of light, and the entire form is optically optically. The image of the entire form is detected by scanning.

【0022】前記辞書記憶部2には、英字,数字,カナ
文字等の字種(以下「サブセット」という。)毎に標準
文字パターンが文字コードに対応して予め登録された認
識辞書が記憶されている。また、辞書記憶部2は、1つ
の文字コードに対し、標準文字パターンの他に複数の文
字パターンが同一であるか否かを問わず登録可能となっ
ている。1つの文字コードに対し、同一の文字パターン
を複数登録することにより、その文字パターンの認識率
が向上するという効果が得られる。なお、「認識率」と
は、認識対象となった全パターン数に対する正読パター
ン数の割合をいう。
The dictionary storage unit 2 stores a recognition dictionary in which standard character patterns are registered in advance for each character type (hereinafter referred to as "subset") such as alphabetic characters, numbers, and kana characters in correspondence with character codes. ing. Further, the dictionary storage unit 2 can register one character code regardless of whether or not a plurality of character patterns are the same as the standard character pattern. By registering a plurality of identical character patterns for one character code, the effect of improving the recognition rate of the character patterns can be obtained. The “recognition rate” refers to the ratio of the number of correct reading patterns to the total number of patterns to be recognized.

【0023】前記認識部3は、例えば、複合類似度法を
用いて文字認識処理を行うようになっている。この複合
類似度法では、認識部3は、スキャナ部1によって検出
された帳票のイメージから文字パターンを切り出し、そ
の文字パターンと辞書記憶部2内の認識辞書とを照合し
て類似度値を演算して求め、その類似度値を点数に換算
して、点数の最も大きい第1候補文字から順に第n候補
文字まで複数の候補文字を選択し、認識結果(文字コー
ド)として出力するものである。また、認識部3は、例
えば第1候補文字と第2候補文字との点数が同点となっ
た場合の如く認識結果が誤読となるおそれが高い場合に
は、その文字の認識結果として第1候補文字の代わりに
リジェクト文字(例えば「?」)を出力するようになっ
ている。
The recognition unit 3 is adapted to perform character recognition processing using, for example, the composite similarity method. In this composite similarity method, the recognition unit 3 cuts out a character pattern from the image of a form detected by the scanner unit 1, compares the character pattern with the recognition dictionary in the dictionary storage unit 2, and calculates a similarity value. Then, the similarity value is converted into a score, and a plurality of candidate characters from the first candidate character having the largest score to the nth candidate character are sequentially selected and output as a recognition result (character code). . Further, when there is a high possibility that the recognition result will be misread, such as when the first candidate character and the second candidate character have the same score, the recognition unit 3 determines that the first candidate character is the recognition result. Rejected characters (for example, "?") Are output instead of the characters.

【0024】また、認識部3は、上記文字認識処理の他
に、学習対象として指定された文字フォントに関する学
習オブジェクトを生成し、学習オブジェクト記憶部5に
記憶するようになっている。この「学習オブジェクト」
には、認識結果としての文字コード(候補文字コードを
含む)、学習対象の文字パターン(以下「学習文字パタ
ーン」という。)及び属性情報の他に、認識辞書のうち
認識部3が用いたサブセットの情報等の認識処理の過程
で生成され認識辞書を新たに生成するのに必要十分な情
報が含まれている。
In addition to the above character recognition processing, the recognition section 3 also generates a learning object relating to a character font designated as a learning target and stores it in the learning object storage section 5. This "learning object"
Includes a character code (including a candidate character code) as a recognition result, a character pattern to be learned (hereinafter referred to as “learning character pattern”), and attribute information, as well as a subset used by the recognition unit 3 in the recognition dictionary. Information and the like that are generated in the process of recognition processing and that are necessary and sufficient for newly generating a recognition dictionary.

【0025】前記FC情報記憶部4は、サンプル帳票用
のFC情報及び教師コード付加用のFC情報(正解文字
情報)等の各種のFC情報が記憶される。サンプル帳票
用のFC情報には、サンプル帳票上の文字を読み取るた
めに必要な読取フィールドの位置情報等が含まれてい
る。「サンプル帳票」は、各読取フィールドに学習対象
のフォントの文字が印字又は手書きにより一定の順序で
記入されたものである。教師コード付加用のFC情報に
は、学習オブジェクトにおける読取フィールドの各桁の
学習文字パターンに正解文字コード(以下「教師コー
ド」という。)を付加するための情報が含まれている。
なお、学習対象の文字は、フォントに限らず、癖字等の
手書き文字でもよい。
The FC information storage unit 4 stores various FC information such as FC information for sample forms and FC information for adding teacher code (correct character information). The FC information for the sample form includes the position information of the reading field necessary for reading the characters on the sample form. The “sample form” is one in which the characters of the font to be learned are printed or handwritten in a fixed order in each reading field. The FC information for adding the teacher code includes information for adding the correct character code (hereinafter, referred to as “teacher code”) to the learned character pattern of each digit of the reading field in the learning object.
The learning target character is not limited to the font, and may be a handwritten character such as a habit character.

【0026】前記制御部8は、サンプル帳票用のFC情
報に基づいてスキャナ部1及び認識部3を制御してサン
プル帳票に対する認識結果を得た後、教師コード付加用
のFC情報を基に学習文字パターンを認識辞書に登録す
るものであり、学習文字パターンを登録した後、認識部
3を制御して標準文字パターン及び学習文字パターンを
認識して認識結果を得た後、その認識結果における文字
パターンの認識率をサブセット別に標準文字パターン及
び学習文字パターン毎に求めてそれらを表示部6に表示
し、指定されたサブセットの標準文字パターン又は学習
文字パターンを認識辞書に重複して登録するようになっ
ている。なお、ここでの認識率は、数字のサブセットに
ついていえば、そのサブセットに属する「0」乃至
「9」の文字パターンの数に対する正読パターン数の割
合を意味する。
The control unit 8 controls the scanner unit 1 and the recognition unit 3 based on the FC information for the sample form to obtain a recognition result for the sample form, and then learns based on the FC information for adding the teacher code. A character pattern is registered in the recognition dictionary. After the learned character pattern is registered, the recognition unit 3 is controlled to recognize the standard character pattern and the learned character pattern to obtain a recognition result, and then the characters in the recognition result are recognized. The recognition rate of the pattern is obtained for each standard character pattern and learning character pattern for each subset, and these are displayed on the display unit 6, and the standard character pattern or learning character pattern of the designated subset is registered in the recognition dictionary in duplicate. Has become. It should be noted that the recognition rate here means the ratio of the number of correct reading patterns to the number of character patterns of "0" to "9" that belong to the subset, in the case of a subset of numbers.

【0027】なお、制御部8は、学習文字パターンのみ
について認識率を求めてサブセット別に表示し、指定さ
れたサブセットの学習文字パターンを認識辞書に重複し
て登録するようにしてもよい。
The control unit 8 may obtain the recognition rate only for the learned character pattern and display it for each subset, and register the learned character pattern of the designated subset in the recognition dictionary in an overlapping manner.

【0028】次に、本実施例の動作を図2及び図3をも
参照し、図4に示すフローチャート従って説明する。図
2はサンプル帳票の一例を示す図、図3はシミュレーシ
ョン結果表示画面の一例を示す図である。なお、以下の
動作説明では、認識辞書に予め登録されている標準の文
字パターン以外のフォントの文字パターンを新たに認識
辞書に登録する場合について説明する。
Next, the operation of this embodiment will be described with reference to the flow chart shown in FIG. 4 with reference to FIGS. FIG. 2 is a diagram showing an example of a sample form, and FIG. 3 is a diagram showing an example of a simulation result display screen. In the following description of the operation, a case will be described in which a character pattern of a font other than the standard character pattern registered in advance in the recognition dictionary is newly registered in the recognition dictionary.

【0029】まず、ユーザは、学習対象のフォントの文
字を一定の順序で記入した、例えば図2に示すようなサ
ンプル帳票10を作成する(S1)。図2は各読取フィ
ールド100に学習対象のフォントの文字101が数字
のサブセットについては番号順に又は英字のサブセット
についてはアルファベット順に印字により記入されてい
る場合を示している。
First, the user creates a sample form 10 in which the characters of the font to be learned are entered in a fixed order, for example, as shown in FIG. 2 (S1). FIG. 2 shows a case in which the characters 101 of the font to be learned are printed in each reading field 100 in numerical order for a subset of numbers or in alphabetical order for a subset of English letters.

【0030】次に、ユーザは、サンプル帳票用のFC情
報及び教師コード付加用のFC情報を生成するための定
義シートを作成する(S2)。
Next, the user creates a definition sheet for generating FC information for sample form and FC information for adding teacher code (S2).

【0031】続いてユーザは、その作成した定義シート
を本装置に読取指示を与えて読み取らせる(S3)。制
御部8は、ユーザの読取指示に基づき、スキャナ部1及
び認識部3を制御して定義シートに対する読取処理を実
行する。スキャナ部1は、定義シートのイメージを検出
し、認識部3は、その検出されたイメージから文字パタ
ーンを切り出し、認識辞書と照合して認識結果を制御部
8に出力する。制御部8は、その認識結果からサンプル
帳票用のFC情報及び教師コード付加用のFC情報を生
成してFC情報記憶部4に記憶する。
Next, the user gives a reading instruction to the apparatus to read the created definition sheet (S3). The control unit 8 controls the scanner unit 1 and the recognition unit 3 based on the user's reading instruction to execute the reading process for the definition sheet. The scanner unit 1 detects the image of the definition sheet, and the recognition unit 3 cuts out a character pattern from the detected image, collates it with a recognition dictionary, and outputs the recognition result to the control unit 8. The control unit 8 generates FC information for the sample form and FC information for adding the teacher code from the recognition result, and stores it in the FC information storage unit 4.

【0032】次に、ユーザは、前記ステップS1におい
て作成したサンプル帳票10を本装置に読取指示を与え
て読み取らせる(S4)。制御部8は、サンプル帳票用
のFC情報に基づきスキャナ部1及び認識部3を制御し
てサンプル帳票10に対する読取処理を実行する。スキ
ャナ部1は、サンプル帳票10のイメージを検出する。
認識部3は、サンプル帳票用のFC情報で指示された読
取フィールド100のイメージから文字パターンを切り
出し、認識辞書と照合して認識結果を得る。
Next, the user gives a reading instruction to the apparatus to read the sample form 10 created in step S1 (S4). The control unit 8 controls the scanner unit 1 and the recognition unit 3 based on the FC information for the sample form to execute the reading process for the sample form 10. The scanner unit 1 detects an image of the sample form 10.
The recognition unit 3 cuts out a character pattern from the image of the reading field 100 designated by the FC information for the sample form and collates it with a recognition dictionary to obtain a recognition result.

【0033】続いて、認識部3は、認識結果(文字コー
ド,候補文字コード,文字パターン,属性情報)に、認
識辞書のうち認識部3が用いたサブセットの情報等の認
識処理の過程で生成され認識辞書を新たに生成するのに
必要十分な情報を付加して学習オブジェクトを生成して
学習オブジェクト記憶部5に記憶する(S5)。
Subsequently, the recognition unit 3 generates a recognition result (character code, candidate character code, character pattern, attribute information) in the process of recognition processing of subset information used by the recognition unit 3 in the recognition dictionary. Then, the learning object is generated by adding necessary and sufficient information for newly generating the recognition dictionary, and is stored in the learning object storage unit 5 (S5).

【0034】制御部8は、FC情報記憶部4内の教師コ
ード付加用のFC情報を参照して学習オブジェクトに教
師コードを付加する(S6)。
The control section 8 refers to the FC information for adding the teacher code in the FC information storage section 4 to add the teacher code to the learning object (S6).

【0035】制御部8は、学習オブジェクト記憶部5か
ら学習オブジェクトを取り出し、教師コード付加用のF
C情報を基に教師コードが認識辞書中のどのカテゴリに
対応するかを判断しながら学習文字パターンを認識辞書
に登録する(S7)。
The control unit 8 takes out the learning object from the learning object storage unit 5, and uses F for adding the teacher code.
The learning character pattern is registered in the recognition dictionary while determining which category in the recognition dictionary the teacher code corresponds to based on the C information (S7).

【0036】辞書への登録が終了した後、辞書が正しく
作成されたかどうかの辞書妥当性チェックを行うため
に、制御部8は、認識シミュレーションを行う(S
8)。制御部8は、学習文字パターンが登録された認識
辞書を使って標準文字パターンと学習文字パターンを認
識し、サブセット別に標準文字パターン及び学習文字パ
ターン毎に認識率を求める。なお、制御部8は、学習オ
ブジェクトに含まれる学習文字パターンを認識してもよ
い。
After the registration in the dictionary is completed, the control unit 8 performs a recognition simulation to check the validity of the dictionary whether the dictionary is correctly created (S).
8). The control unit 8 recognizes the standard character pattern and the learned character pattern using the recognition dictionary in which the learned character pattern is registered, and obtains the recognition rate for each standard character pattern and the learned character pattern for each subset. The control unit 8 may recognize the learning character pattern included in the learning object.

【0037】次に、制御部8は、その求めた認識率を基
に例えば図3に示すようなシミュレーション結果表示画
面11を表示部6に表示する(S9)。図3は手書きの
英字、手書きのカナ文字、手書きの数字やJIS−B、
IBM407、JIS−K等のサブセット別に標準文字
パターン及び学習文字パターン毎に認識率113を表示
している場合を示している。このとき、指定された目標
の認識率に達していないサブセットの文字パターンに関
しては赤等の警告色で認識率を表示する。また、この画
面11には、さらに、学習を実行するための「学習」キ
ー110、前回の学習結果に戻すための「学習戻し」キ
ー111、学習を終了するための「終了」キー112が
表示されている。各キー110,111,112は、そ
れがカーソルにて選択されると制御部8によって実行さ
れるようになっている。
Next, the control unit 8 displays a simulation result display screen 11 as shown in FIG. 3 on the display unit 6 based on the obtained recognition rate (S9). Figure 3 shows handwritten English letters, handwritten Kana characters, handwritten numbers and JIS-B,
It shows a case where the recognition rate 113 is displayed for each standard character pattern and learning character pattern for each subset such as IBM407 and JIS-K. At this time, the recognition rate is displayed in a warning color such as red for the character patterns of the subset that does not reach the designated target recognition rate. Further, on this screen 11, a "learning" key 110 for executing learning, a "learning return" key 111 for returning to the previous learning result, and an "end" key 112 for ending learning are further displayed. Has been done. Each key 110, 111, 112 is executed by the control unit 8 when it is selected by the cursor.

【0038】ユーザは、シミュレーション結果表示画面
11を見て、学習を行う必要があるか否かを判断する
(S10)。
The user looks at the simulation result display screen 11 and determines whether or not learning is required (S10).

【0039】全ての認識率が目標の認識率に達している
場合は、画面11上の「終了」キー112をカーソルで
指定して登録処理を終了する。学習文字パターンを登録
してもその認識率が目標に達していない場合や学習文字
パターンを登録すると標準文字パターンの認識率が目標
より低下する場合がある。この場合にユーザは、認識率
が目標に達していないサブセットの標準文字パターン又
は学習文字パターンを学習対象として選択して「学習」
キー110をカーソルで指定する。
When all the recognition rates have reached the target recognition rates, the "end" key 112 on the screen 11 is designated by the cursor to end the registration process. Even if the learning character pattern is registered, the recognition rate may not reach the target, or if the learning character pattern is registered, the recognition rate of the standard character pattern may be lower than the target. In this case, the user selects a standard character pattern or a learning character pattern of a subset whose recognition rate does not reach the target as a learning target, and performs “learning”
The key 110 is designated by the cursor.

【0040】制御部8は、選択されたサブセットの文字
パターンを認識辞書に登録し(S7)、再度認識辞書を
使って標準文字パターンと学習文字パターンを認識し
(S8)。、認識率を求めてシミュレーション結果表示
画面11を表示部6に再び表示する(S9)。全ての認
識率が目標の認識率に達していない場合は(S10)、
目標の認識率に達するまで、学習のための処理(S7,
S8,S9)を繰り返す。全ての認識率が目標の認識率
に達した場合は(S10)、画面11上の「終了」キー
112をカーソルで指定して登録処理が終了する。な
お、ユーザは、前回の学習結果の方が認識率が高い場合
は、「学習戻し」キー111をカーソルで指定する。制
御部8は、前回の学習結果に戻すべく、前回登録した内
容を認識辞書から削除する。
The control unit 8 registers the character pattern of the selected subset in the recognition dictionary (S7), and again recognizes the standard character pattern and the learned character pattern using the recognition dictionary (S8). The recognition result is calculated, and the simulation result display screen 11 is displayed again on the display unit 6 (S9). If all recognition rates do not reach the target recognition rate (S10),
The process for learning (S7,
Repeat S8 and S9). When all the recognition rates have reached the target recognition rate (S10), the "end" key 112 on the screen 11 is designated by the cursor, and the registration process ends. When the recognition rate of the previous learning result is higher, the user designates the “learn back” key 111 with the cursor. The control unit 8 deletes the previously registered content from the recognition dictionary in order to return to the previous learning result.

【0041】このような上記第1の実施例によれば、ユ
ーザは学習対象の文字を記入したサンプル帳票10を本
装置に読み取らせることにより、学習文字パターンが認
識辞書に登録されるので、ユーザ自身が使用環境に応じ
た文字パターンを認識辞書に登録可能となる。また、サ
ブセット単位で学習文字パターンを重複して登録するこ
とができるので、サブセット全体の認識率を向上させる
ことができ、カテゴリ毎の登録の手間を省くことができ
る。さらに、学習文字パターンのみならず標準文字パタ
ーンも認識辞書に重複して登録することができるので、
標準文字パターンを低下させずに学習文字パターンの認
識率を向上させることが可能となる。
According to the first embodiment described above, the user causes the apparatus to read the sample form 10 in which the learning target characters are entered, so that the learning character pattern is registered in the recognition dictionary. It becomes possible for itself to register the character pattern according to the usage environment in the recognition dictionary. Further, since the learned character patterns can be registered in duplicate for each subset, the recognition rate of the entire subset can be improved and the labor for registration for each category can be saved. Furthermore, not only learning character patterns but also standard character patterns can be registered in the recognition dictionary in duplicate,
It is possible to improve the recognition rate of the learning character pattern without lowering the standard character pattern.

【0042】次に、本発明の第2の実施例を図5を参照
して説明する。図5はカテゴリ別シミュレーション結果
表示画面の一例を示す図である。
Next, a second embodiment of the present invention will be described with reference to FIG. FIG. 5 is a diagram showing an example of a category-based simulation result display screen.

【0043】第1の実施例では、前記ステップS9にお
いてサブセット毎に認識率を表示したが、本実施例で
は、制御部8が、カテゴリ毎に認識率を求め、図5に示
すようなカテゴリ別シミュレーション結果表示画面12
を表示部6に表示し、指定されたカテゴリの文字パター
ンを認識辞書に重複して登録するものである。
In the first embodiment, the recognition rate is displayed for each subset in step S9, but in the present embodiment, the control unit 8 obtains the recognition rate for each category, and the recognition rate is classified by category as shown in FIG. Simulation result display screen 12
Is displayed on the display unit 6, and the character patterns of the designated category are registered in the recognition dictionary in an overlapping manner.

【0044】なお、図5は手書き数字のサブセットの0
乃至9のカテゴリの認識率123を表示している場合を
示している。また、図5の画面12には、さらに、学習
を実行するための「学習」キー120、前回の学習結果
に戻すための「学習戻し」キー121、学習を終了する
ための「終了」キー122が表示されている。各キー1
20,121,122は、それがカーソルにて選択され
ると制御部8によって実行されるようになっている。図
5の画面12では、第1の実施例と同様に、指定された
目標の認識率に達していないカテゴリの文字パターンに
関しては赤等の警告色でマーキング12aを表示するよ
うにしてもよい。
Note that FIG. 5 shows 0 as a subset of handwritten numbers.
The case where the recognition rates 123 of the categories 9 to 9 are displayed is shown. Further, on the screen 12 of FIG. 5, a “learning” key 120 for executing learning, a “learning return” key 121 for returning to the previous learning result, and an “end” key 122 for ending learning. Is displayed. Each key 1
20, 121 and 122 are executed by the control unit 8 when they are selected by the cursor. On the screen 12 of FIG. 5, as in the first embodiment, the marking 12a may be displayed in a warning color such as red for a character pattern of a category that does not reach the designated target recognition rate.

【0045】このような第2の実施例によれば、文字パ
ターン毎に重複して登録することができるので、個別的
に文字パターンの認識率を向上させることが可能とな
る。
According to the second embodiment as described above, since the character patterns can be registered redundantly, the recognition rate of the character patterns can be improved individually.

【0046】次に、本発明の第3の実施例を図6及び図
7を参照して説明する。図6は文字パターン表示画面の
一例を示す図、教師コード一覧表表示画面の一例を示す
図である。
Next, a third embodiment of the present invention will be described with reference to FIGS. 6 and 7. FIG. 6 is a diagram showing an example of a character pattern display screen and an example of a teacher code list display screen.

【0047】第1及び第2の実施例では、前記ステップ
S6において教師コードを付加した後、直ちに学習文字
パターンを登録したが、本実施例では、制御部8が、学
習文字パターンを登録する前に、図6に示すような文字
パターン表示画面13を表示部6に表示し、表示した複
数の学習文字パターン130のうち指定された学習文字
パターン以外の学習文字パターンのみを登録するもので
ある。
In the first and second embodiments, the learning character pattern is registered immediately after the teacher code is added in step S6, but in the present embodiment, before the control unit 8 registers the learning character pattern. Further, the character pattern display screen 13 as shown in FIG. 6 is displayed on the display unit 6, and only the learning character patterns other than the designated learning character pattern among the plurality of displayed learning character patterns 130 are registered.

【0048】図6は手書き数字のサブセットの学習文字
パターン130と、その認識結果である文字コード13
1と、学習文字パターン130に与えられた教師コード
132を表示している場合を示している。また、図6の
画面13には、さらに、カーソルによって指定されたパ
ターンを辞書記憶部2内のパターンファイルから削除す
るための「削除」キー133、学習文字パターンの属性
情報をあるパターンからあるパターンへ複写するための
「複写」キー134、指定された条件のパターンをパタ
ーンファイルから検索するための「検索」キー135、
パターンファイルの内容を指定された条件で並べ替える
ための「ソート」キー136、学習オブジェクとの内容
を接続されたプリンタで印刷するための「印刷」キー1
37、現在の状態を学習オブジェクト記憶部5に保管す
るための「保管」キー138、文字パターンの表示を終
了させるための「終了」キー139を表示している。
FIG. 6 shows a learning character pattern 130 of a subset of handwritten numbers and a character code 13 which is the recognition result.
1 and the teacher code 132 given to the learning character pattern 130 are displayed. Further, on the screen 13 of FIG. 6, a “deletion” key 133 for deleting the pattern designated by the cursor from the pattern file in the dictionary storage unit 2, and the attribute information of the learned character pattern is a certain pattern. A "copy" key 134 for copying to, a "search" key 135 for searching a pattern file for a pattern of a specified condition,
A "sort" key 136 for sorting the contents of the pattern file according to the specified conditions, and a "print" key 1 for printing the contents of the learning object on the connected printer.
37, a "save" key 138 for storing the current state in the learning object storage unit 5, and an "end" key 139 for ending the display of the character pattern are displayed.

【0049】この画面13で、カーソルにて削除対象と
する学習文字パターンを指定してマーキング(同図では
黒丸)13aを行い、「削除」キー133を指定するこ
とにより、その学習文字パターンをパターンファイルか
ら削除できる。例えば、同図に示すように、数字4の学
習文字パターン130にごみ130′が付いていた場合
に、上記構成によりそのような学習すべきでない不良文
字パターンを排除することができる。
On this screen 13, a cursor is used to specify a learning character pattern to be deleted and marking (black circle in the figure) 13a is performed, and a "delete" key 133 is specified to pattern the learning character pattern. Can be deleted from the file. For example, as shown in the figure, when the learned character pattern 130 of the numeral 4 has dust 130 ', such a defective character pattern that should not be learned can be eliminated by the above configuration.

【0050】また、この画面13では、教師コード13
2に誤りを発見した場合は、その誤りの教師コード13
2にカーソルを移動し、キーボード入力により又は図7
に示すような教師コード一覧表表示画面14からの選択
により、正しい教師コードを入力し、教師コードを訂正
できるようになっている。図7の画面14では、文字
(同図では「ウ」)をカーソルで指定することにより、
文字コードを直接入力しなくても対応する教師コードを
入力できるようにしている。
On this screen 13, the teacher code 13
If an error is found in 2, the teacher code of that error is 13
Move the cursor to 2 and use keyboard input or
By selecting from the teacher code list display screen 14 as shown in, the correct teacher code can be input and the teacher code can be corrected. In the screen 14 of FIG. 7, by designating a character (“U” in the figure) with the cursor,
The corresponding teacher code can be entered without directly entering the character code.

【0051】このような第3の実施例によれば、指定さ
れた文字パターンについてのみ学習することができるの
で、学習すべきでない不良パターンを排除してより高い
認識率を得ることが可能となる。また、ユーザは、パタ
ーンの複写、教師コードの変更、登録対象とするかどう
かのマーキング、パターンの編集、パターンの並び替え
等を行うこともできる。
According to the third embodiment as described above, since only the designated character pattern can be learned, it is possible to eliminate bad patterns that should not be learned and obtain a higher recognition rate. . Further, the user can also copy the pattern, change the teacher code, mark whether or not to register, edit the pattern, rearrange the pattern, and the like.

【0052】なお、上記各実施例では、読取フィールド
100が設けられたサンプル帳票10に学習対象の文字
101を記入した場合について説明したが、本発明は、
読取フィールドが設けられていないサンプル文書にも適
用できる。すなわち、レイアウト情報を作成しておき、
そのレイアウト情報に基づいて装置側が読取領域を判別
するか、スキャナ部によって検出された文書のイメージ
から読取領域を自動判別することにより、学習対象の文
字を読み取ることができる。
In each of the above-described embodiments, the case where the character 101 to be learned is entered on the sample form 10 provided with the reading field 100 has been described.
It is also applicable to sample documents that do not have a reading field. That is, create layout information,
The character to be learned can be read by the device side discriminating the reading region based on the layout information or by automatically discriminating the reading region from the image of the document detected by the scanner unit.

【0053】また、認識部3の文字認識処理の方式とし
て複合類似度法を採用した場合について説明したが、複
合類似度法の代わりに輪郭構造マッチング法を採用し、
又は複合類似度法及び輪郭構造マッチング法の両方、さ
らに他の方式を採用し、字体等に応じて文字認識処理の
方式を選択するようにし、学習文字パターンに対する学
習が行えるようにしてもよい。例えば、手書きについて
輪郭構造マッチング法を採用するか、又は複合類似度法
及び輪郭構造マッチング法の両方を採用することによ
り、複合類似度法のみの場合と比較してより高い認識率
が得られ、より高い学習効果が得られる。
The case where the composite similarity method is adopted as the character recognition processing method of the recognition section 3 has been described. However, instead of the composite similarity method, the contour structure matching method is adopted.
Alternatively, both the composite similarity method and the contour structure matching method, and another method may be adopted, and the method of character recognition processing may be selected according to the type of character and the like so that learning for the learned character pattern can be performed. For example, by adopting the contour structure matching method for handwriting, or by adopting both the composite similarity method and the contour structure matching method, a higher recognition rate is obtained as compared with the case of only the composite similarity method, Higher learning effect can be obtained.

【0054】[0054]

【発明の効果】以上詳述した本発明によれば、以下の効
果を奏する。
According to the present invention described in detail above, the following effects can be obtained.

【0055】請求項1記載の発明によれば、ユーザは学
習対象の文字を記入したサンプル文書を本装置に読み取
らせることにより、学習文字パターンが認識辞書に登録
されるので、ユーザ自身が使用環境に応じた文字パター
ンを認識辞書に登録可能な光学的文字読取装置を提供す
ることができる。
According to the first aspect of the invention, the user reads the sample document in which the characters to be learned are read by the apparatus, and the learned character pattern is registered in the recognition dictionary. Therefore, the user himself / herself uses the environment. It is possible to provide an optical character reading device capable of registering a character pattern according to the above in a recognition dictionary.

【0056】請求項2記載の発明によれば、サブセット
単位で学習文字パターンを重複して登録することができ
るので、サブセット全体の認識率を向上させることがで
き、カテゴリ毎の登録の手間を省くことができる。
According to the second aspect of the present invention, since the learning character patterns can be registered in duplicate for each subset, the recognition rate of the entire subset can be improved and the labor of registration for each category can be omitted. be able to.

【0057】請求項3記載の発明によれば、学習文字パ
ターンのみならず標準文字パターンも認識辞書に重複し
て登録することができるので、標準文字パターンを低下
させずに学習文字パターンの認識率を向上させることが
可能となる。
According to the third aspect of the present invention, not only the learned character pattern but also the standard character pattern can be registered in the recognition dictionary in an overlapping manner. Therefore, the recognition rate of the learned character pattern can be maintained without lowering the standard character pattern. It becomes possible to improve.

【0058】請求項4記載の発明によれば、文字パター
ン毎に重複して登録することができるので、個別的に文
字パターンの認識率を向上させることが可能となる。
According to the fourth aspect of the invention, since it is possible to register the character patterns in duplicate, it is possible to improve the recognition rate of the character patterns individually.

【0059】請求項5記載の発明によれば、指定された
文字パターンについてのみ学習することができるので、
学習すべきでない不良パターンを排除してより高い認識
率を得ることが可能となる。
According to the fifth aspect of the invention, it is possible to learn only the designated character pattern.
It becomes possible to obtain a higher recognition rate by eliminating bad patterns that should not be learned.

【図面の簡単な説明】[Brief description of drawings]

【図1】本実施例のブロック図FIG. 1 is a block diagram of this embodiment.

【図2】本実施例のサンプル帳票の一例を示す図FIG. 2 is a diagram showing an example of a sample form of the present embodiment.

【図3】本実施例のシミュレーション結果表示画面の一
例を示す図
FIG. 3 is a diagram showing an example of a simulation result display screen of the present embodiment.

【図4】本実施例の登録処理の動作を示すフローチャー
FIG. 4 is a flowchart showing the operation of registration processing of the present embodiment.

【図5】本実施例のカテゴリ別シミュレーション結果表
示画面の一例を示す図
FIG. 5 is a diagram showing an example of a category-based simulation result display screen according to the present embodiment.

【図6】本実施例の文字パターン表示画面の一例を示す
FIG. 6 is a diagram showing an example of a character pattern display screen according to the present embodiment.

【図7】本実施例の教師コード一覧表表示画面の一例を
示す図
FIG. 7 is a diagram showing an example of a teacher code list display screen according to the present embodiment.

【符号の説明】[Explanation of symbols]

1 スキャナ部 2 辞書記憶部 3 認識部 4 FC情報記憶部(正解情報記憶部) 6 表示部 8 制御部 10 サンプル帳票(サンプル文書) 11 シミュレーション結果表示画面 12 カテゴリ別シミュレーション結果表示画面 13 文字パターン表示画面 101 学習対象の文字 113,123 認識率 130 学習文字パターン 131 認識結果 132 教師コード(正解文字コード) 1 Scanner Section 2 Dictionary Storage Section 3 Recognition Section 4 FC Information Storage Section (Correct Answer Information Storage Section) 6 Display Section 8 Control Section 10 Sample Report (Sample Document) 11 Simulation Result Display Screen 12 Category Simulation Result Display Screen 13 Character Pattern Display Screen 101 Learning target characters 113, 123 Recognition rate 130 Learning character pattern 131 Recognition result 132 Teacher code (correct character code)

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 学習対象の文字が記入されたサンプル文
書を読み取ることで、当該対象の学習文字パターンを認
識辞書に登録する光学的文字読取装置であって、 文書のイメージを検出するスキャナ部と、 標準文字パターンが文字コードに対応して予め登録され
た認識辞書を記憶する辞書記憶部と、 前記スキャナ部によって検出された文書のイメージから
文字パターンを切り出し、前記認識辞書と照合して認識
結果を出力する認識部と、 前記サンプル文書に対し学習対象の文字毎に正解文字コ
ードを与えた正解情報を入力操作に基づいて記憶する正
解情報記憶部と、 前記スキャナ部及び認識部を制御して前記サンプル文書
に対する認識結果を得た後、前記正解情報を基に学習文
字パターンを前記認識辞書に登録する制御部とを有する
ことを特徴とする光学的文字読取装置。
1. An optical character reading device for registering a learning character pattern of a target in a recognition dictionary by reading a sample document in which characters to be learned are written, and a scanner unit for detecting an image of the document. , A dictionary storage unit that stores a recognition dictionary in which standard character patterns are registered in advance corresponding to character codes, and a character pattern is cut out from an image of a document detected by the scanner unit and collated with the recognition dictionary to obtain a recognition result. A recognition unit that outputs a correct answer information storage unit that stores correct answer information that gives a correct answer character code for each learning target character to the sample document based on an input operation, and controls the scanner unit and the recognition unit. After the recognition result for the sample document is obtained, the learning character pattern is registered in the recognition dictionary based on the correct answer information. Optical character reader to.
【請求項2】 表示部を備え、前記制御部は、学習文字
パターンを登録した後、前記認識部を制御して学習文字
パターンを認識して認識結果を得た後、その認識結果に
おける学習文字パターンの認識率をサブセット別に求め
てそれらを前記表示部に表示し、指定されたサブセット
の学習文字パターンを前記認識辞書に重複して登録する
ものであることを特徴とする請求項1記載の光学的文字
読取装置。
2. A display unit, wherein the control unit registers the learning character pattern, controls the recognition unit to recognize the learning character pattern to obtain a recognition result, and then learns the learning character in the recognition result. 2. The optical system according to claim 1, wherein the recognition rate of the pattern is obtained for each subset and displayed on the display unit, and the learned character patterns of the designated subset are registered in the recognition dictionary in an overlapping manner. Character reader.
【請求項3】 表示部を備え、前記制御部は、学習文字
パターンを登録した後、前記認識部を制御して標準文字
パターン及び学習文字パターンを認識して認識結果を得
た後、その認識結果における文字パターンの認識率をサ
ブセット別に標準文字パターン及び学習文字パターン毎
に求めてそれらを前記表示部に表示し、指定されたサブ
セットの標準文字パターン又は学習文字パターンを前記
認識辞書に重複して登録するものであることを特徴とす
る請求項1記載の光学的文字読取装置。
3. A display unit, wherein the control unit registers the learned character pattern, controls the recognition unit to recognize the standard character pattern and the learned character pattern, obtains a recognition result, and then recognizes the recognition result. The recognition rate of the character pattern in the result is obtained for each standard character pattern and learning character pattern for each subset and displayed on the display unit, and the standard character pattern or learning character pattern of the designated subset is duplicated in the recognition dictionary. The optical character reader according to claim 1, wherein the optical character reader is registered.
【請求項4】 表示部を備え、前記制御部は、学習文字
パターンを登録した後、前記認識部を制御して標準文字
パターン及び学習文字パターンを認識して認識結果を得
た後、その認識結果における文字パターンの認識率をカ
テゴリ毎に求めてそれらを前記表示部に表示し、指定さ
れたカテゴリの文字パターンを前記認識辞書に重複して
登録するものであることを特徴とする請求項1記載の光
学的文字読取装置。
4. A display unit, wherein the control unit registers the learned character pattern, controls the recognition unit to recognize the standard character pattern and the learned character pattern, obtains a recognition result, and then recognizes the recognition result. The recognition rate of the character pattern in the result is obtained for each category, displayed on the display unit, and the character pattern of the designated category is registered in the recognition dictionary in duplicate. The optical character reading device described.
【請求項5】 表示部を備え、前記制御部は、学習文字
パターンを登録する前に、学習文字パターンを前記表示
部に表示し、指定された学習文字パターン以外の学習文
字パターンを前記認識辞書に登録するものであることを
特徴とする請求項1,2,3又は4記載の光学的文字読
取装置。
5. A display unit is provided, wherein the control unit displays the learned character pattern on the display unit before registering the learned character pattern, and learns a learned character pattern other than the designated learned character pattern in the recognition dictionary. The optical character reader according to claim 1, 2, 3, or 4, wherein the optical character reader is registered in.
JP7083657A 1995-04-10 1995-04-10 Optical character reader Pending JPH08287191A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7083657A JPH08287191A (en) 1995-04-10 1995-04-10 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7083657A JPH08287191A (en) 1995-04-10 1995-04-10 Optical character reader

Publications (1)

Publication Number Publication Date
JPH08287191A true JPH08287191A (en) 1996-11-01

Family

ID=13808533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7083657A Pending JPH08287191A (en) 1995-04-10 1995-04-10 Optical character reader

Country Status (1)

Country Link
JP (1) JPH08287191A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200450B2 (en) 2019-04-17 2021-12-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium for selecting a proper version of a recognition dictionary that is not necessarily a latest version

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200450B2 (en) 2019-04-17 2021-12-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium for selecting a proper version of a recognition dictionary that is not necessarily a latest version

Similar Documents

Publication Publication Date Title
US8015203B2 (en) Document recognizing apparatus and method
JP4742404B2 (en) Image recognition apparatus, image forming apparatus, image recognition method, and computer-readable recording medium storing image recognition program
US20070098263A1 (en) Data entry apparatus and program therefor
US8768241B2 (en) System and method for representing digital assessments
JPH08287191A (en) Optical character reader
CN114511858A (en) AI and RPA-based official document file processing method, device, equipment and medium
JPH0696288A (en) Character recognizing device and machine translation device
JP2020190843A (en) Document conversion device
JP2006234996A (en) Device, method, and program for processing educational material
JPH01243174A (en) System for defining business form data processing
JPH1185899A (en) Character reader, its method and record medium
JP6960646B1 (en) Reading system, reading program and reading method
JP3928739B2 (en) Document filing system
JP7404625B2 (en) Information processing device and program
JP4261831B2 (en) Character recognition processing method, character recognition processing device, character recognition program
JPH0660053A (en) Input device
JPS60217483A (en) Recognizer of character
JPH06251187A (en) Method and device for correcting character recognition error
JPH09138835A (en) Character recognition system
JPH04293185A (en) Filing device
JPH06223221A (en) Character recognizing device
JP3419418B2 (en) Character reading method and device
JP2024003769A (en) Character recognition system, method of recognizing character by computer, and character search system
JP2003099709A (en) Misread character correction method and optical character recognition device
JP4081074B2 (en) Form processing apparatus, form processing method, and form processing program