JP2829002B2 - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JP2829002B2
JP2829002B2 JP63240006A JP24000688A JP2829002B2 JP 2829002 B2 JP2829002 B2 JP 2829002B2 JP 63240006 A JP63240006 A JP 63240006A JP 24000688 A JP24000688 A JP 24000688A JP 2829002 B2 JP2829002 B2 JP 2829002B2
Authority
JP
Japan
Prior art keywords
dictionary
pattern
registered
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63240006A
Other languages
Japanese (ja)
Other versions
JPH0289195A (en
Inventor
勝則 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63240006A priority Critical patent/JP2829002B2/en
Publication of JPH0289195A publication Critical patent/JPH0289195A/en
Application granted granted Critical
Publication of JP2829002B2 publication Critical patent/JP2829002B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は類似パターンの不本意な辞書登録を防いで入
力文字パターンに対する認識性能を高めることのできる
文字認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Industrial application field) The present invention relates to a character recognition device capable of preventing unintentional registration of a similar pattern in a dictionary and improving recognition performance for an input character pattern.

(従来の技術) 情報処理技術の発達に伴い、計算機システムで取扱わ
れるデータ量が膨大化している。これ故、各種のデータ
を如何に効率良く計算機入力するかが大きな課題となっ
ている。
(Prior Art) With the development of information processing technology, the amount of data handled by a computer system has become enormous. Therefore, how to efficiently input various data into a computer has become a major issue.

これに対する解答の1つとして、帳票等に印刷,或い
は手書きされた文字・記号を光学的に読取り、これを文
字認識してデータ入力するOCRや、タブレット等の座標
入力装置を介して筆記入力された文字のストローク情報
から実時間的に文字認識してデータ入力する文字認識装
置が種々開発されている。
As one of the answers to this, a character / symbol printed or handwritten on a form or the like is optically read, and the character is recognized and input as data by OCR or a handwriting input via a coordinate input device such as a tablet. Various character recognition devices have been developed which recognize characters in real time from stroke information of characters and input data.

この種の文字認識装置は、基本的には入力文字パター
ンと認識辞書に予め登録されている各種認識対象文字の
辞書パターンとの類似度を計算する等して辞書照合し、
その照合結果から上記入力文字パターンが示す認識対象
文字を認識結果(認識候補)として求めるものである。
ところか認識辞書として予め準備されている各種認識対
象文字の辞書パターンとの照合だけでは文字パターンの
変形等に十分対処することができず、その認識性能を高
くする上で問題があった。
This type of character recognition apparatus basically performs dictionary matching by calculating the similarity between an input character pattern and a dictionary pattern of various recognition target characters registered in advance in a recognition dictionary,
The recognition target character indicated by the input character pattern is obtained as a recognition result (recognition candidate) from the collation result.
However, it is not possible to sufficiently cope with deformation of a character pattern or the like only by collating various recognition target characters prepared in advance as a recognition dictionary with a dictionary pattern, and there is a problem in improving the recognition performance.

そこで最近では、個人固有な筆記文字パターンを辞書
登録しておくことで、文字パターンの変形に対処し、こ
れによって認識性能を高めることが考えられている。と
ころがこのようにして個人固有な文字パターンを逐次辞
書登録していくと、類似パターンがそれぞれ異なる認識
対象文字(異なるカテゴリ)の辞書パターンとして辞書
登録されることがあり、これらのカテゴリ間で誤認識が
生じ易くなる。つまり類似パターンが認識性能劣化の要
因となってしまう。
Therefore, recently, it has been considered that a personalized writing character pattern is registered in a dictionary to cope with the deformation of the character pattern, thereby improving the recognition performance. However, when character patterns unique to individuals are sequentially registered in the dictionary in this manner, similar patterns may be registered in the dictionary as dictionary patterns of different recognition target characters (different categories), and erroneous recognition may be performed between these categories. Is more likely to occur. That is, the similar pattern becomes a factor of the degradation of the recognition performance.

(発明が解決しようとする課題) このように入力文字パターンを辞書登録して認識辞書
の充実化を図るようにした文字認識装置にあっては、類
似した文字パターンが異なるカテゴリの辞書パターンと
して登録されると、これによって認識性能が劣化すると
云う問題があった。
(Problems to be Solved by the Invention) In a character recognition device in which an input character pattern is registered as a dictionary to enhance a recognition dictionary, similar character patterns are registered as dictionary patterns of different categories. Then, there is a problem that the recognition performance is degraded by this.

本発明はこのような事情を考慮してなされたもので、
その目的とするところは、異なるカテゴリへの類似パタ
ーンの辞書登録を未然に防いで、その認識性能を十分高
く維持し得るようにした文字認識装置を提供することに
ある。
The present invention has been made in view of such circumstances,
An object of the present invention is to provide a character recognition device that prevents a dictionary of similar patterns from being registered in different categories beforehand and maintains its recognition performance at a sufficiently high level.

[発明の構成] (課題を解決するための手段) 本発明に係る文字認識装置は、辞書登録した文字パタ
ーンが別のカテゴリに辞書登録し得る可能性のあること
を示す情報を上記文字パターンの辞書登録時に求められ
る辞書パターンとの照合結果から求め、これを類似パタ
ーン情報として格納した類似パターンテーブルを準備
し、 辞書登録しようとする文字パターンが既に別のカテゴ
リに辞書登録されている文字パターンと類似しているこ
とが上記類似パターンテーブルから求められたとき、上
記辞書登録しようとする文字パターンまたは既に辞書登
録されている文字パターンの一方だけを辞書登録許可す
るようにしたことを特徴とするものである。
[Structure of the Invention] (Means for solving the problem) A character recognition device according to the present invention provides information indicating that a character pattern registered in a dictionary can be registered in another category in a dictionary. A similar pattern table is prepared based on the result of matching with the dictionary pattern obtained at the time of dictionary registration, and this is stored as similar pattern information. When similarity is found from the similar pattern table, only one of the character pattern to be registered in the dictionary or the character pattern already registered in the dictionary is permitted to be registered in the dictionary. It is.

つまり文字パターンの新規辞書登録を禁止するか、或
いは新規辞書登録を許可する場合には既に辞書登録され
ている類似パターンを登録削除するようにし、辞書パタ
ーンとしての類似パターンの存在をなくすようにしたこ
とを特徴とするものである。
That is, when registering a new dictionary of a character pattern is prohibited, or when registering a new dictionary is permitted, a similar pattern already registered in the dictionary is registered and deleted, and the existence of a similar pattern as a dictionary pattern is eliminated. It is characterized by the following.

(作用) このような辞書登録機能を備えた本発明によれば、既
に辞書登録された文字パターンに類似する文字パターン
を別のカテゴリに辞書登録しようとするとき、類似パタ
ーンテーブルの参照によって既に類似パターンが別のカ
テゴリに辞書登録されていることが示され、その一方だ
けが辞書登録許可されるので、類似パターンが異なった
カテゴリにそれぞれ辞書登録されることを未然に防ぐこ
とが可能となる。
(Operation) According to the present invention having such a dictionary registration function, when a character pattern similar to a character pattern already registered in the dictionary is to be registered in another category in a dictionary, the similar pattern is already referred to by referring to the similar pattern table. Since it is indicated that the pattern is registered in the dictionary in another category, and only one of the patterns is permitted to be registered in the dictionary, it is possible to prevent the similar pattern from being registered in the dictionary in a different category.

この結果、類似パターンによる誤認識を防いで、その
認識性能を高めることが可能となる。
As a result, erroneous recognition based on similar patterns can be prevented, and the recognition performance can be improved.

(実施例) 以下、図面を参照して本発明の一実施例に係る文字認
識装置につき説明する。
Embodiment Hereinafter, a character recognition device according to an embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成図であり、1は認識対
象(登録対象)とする文字パターンを入力する文字パタ
ーン入力部である。この文字パターン入力部1は帳票等
に印刷,或いは手書きされた文字・記号を光学的に読取
り、その読取り入力画像を2値化して文字パターンを求
めるOCRや、タブレット等の座標入力装置を介して筆記
入力された文字のストローク情報を文字パターン情報と
装置として実現される。
FIG. 1 is a schematic configuration diagram of an embodiment apparatus, and 1 is a character pattern input unit for inputting a character pattern to be recognized (registered). The character pattern input unit 1 optically reads characters or symbols printed or handwritten on a form or the like, binarizes the read input image to obtain a character pattern, or a coordinate input device such as a tablet. Stroke information of a character input by handwriting is realized as character pattern information and a device.

認識処理部2は上記文字パターン入力部1から入力さ
れた文字パターンについて、文字パターン辞書3に登録
されている複数の認識対象文字(カテゴリ)の各辞書パ
ターンとの類似度を求める等して辞書照合し、最も高い
類似度を得た辞書パターンの認識対象文字(カテゴリ)
名を上記入力文字パターンに対する認識結果(認識候
補)として求めるものである。このようにして求められ
た認識結果(認識候補)が認識結果出力部4から出力さ
れる。
The recognition processing unit 2 obtains a similarity of the character pattern input from the character pattern input unit 1 with each dictionary pattern of a plurality of recognition target characters (categories) registered in the character pattern dictionary 3, and obtains a dictionary. Characters to be recognized (category) of the dictionary pattern that obtained the highest similarity by matching
The name is obtained as a recognition result (recognition candidate) for the input character pattern. The recognition result (recognition candidate) thus determined is output from the recognition result output unit 4.

しかして辞書登録部5は辞書パターンの登録モードが
設定されたとき起動され、前記文字パターン入力部1か
ら与えられる文字パターンを辞書登録対象として入力す
る。この辞書登録部5は上記入力パターンを指定された
カテゴリの辞書パターンとして前記文字パターン辞書3
に登録するものである。しかしてこの辞書登録に際して
上記辞書登録部5は第3図にその処理手続きの流れを示
すように、先ず類似パターンテーブル6を参照し、入力
文字パターンに類似するパターン(類似パターン)が既
に他のカテゴリの辞書パターンとして辞書登録されてい
ないかを調べる(ステップa)。そして既に類似パター
ンが別のカテゴリに辞書登録されていることが示された
場合、例えば登録対象としている入力文字パターンと、
類似パターンが登録されている辞書カテゴリの登録辞書
パターンとを表示し(ステップb)、上記入力文字パタ
ーンの辞書登録を中止するか、或いは既に別のカテゴリ
に辞書登録されている類似パターンをその辞書から抹消
し、上記入力文字パターンを新規に辞書登録するかの選
択を辞書登録者(オペレータ)に促すものとなってい
る。
Thus, the dictionary registration unit 5 is started when the dictionary pattern registration mode is set, and inputs a character pattern given from the character pattern input unit 1 as a dictionary registration target. The dictionary registration unit 5 stores the input pattern as a dictionary pattern of a specified category.
It is to be registered. When the dictionary is registered, the dictionary registration unit 5 first refers to the similar pattern table 6 as shown in FIG. It is checked whether the dictionary is registered as a category dictionary pattern (step a). And when it is indicated that the similar pattern is already registered in the dictionary in another category, for example, the input character pattern to be registered,
The registered dictionary pattern of the dictionary category in which the similar pattern is registered is displayed (step b), and the dictionary registration of the input character pattern is stopped, or the similar pattern already registered in another category is registered in the dictionary. And prompts the dictionary registrant (operator) to select whether to newly register the input character pattern in the dictionary.

この選択指示要求に対して指示入力される情報に従
い、辞書登録部5は上記入力文字パターンを新規に辞書
登録するか否かを決定する(ステップc)。しかる後、
この文字パターンの辞書登録状況に応じて前記類似パタ
ーンテーブル6の登録情報を更新する(ステップd)。
According to the information input in response to the selection instruction request, the dictionary registration unit 5 determines whether or not to newly register the input character pattern in the dictionary (step c). After a while
The registration information of the similar pattern table 6 is updated according to the dictionary registration status of the character pattern (step d).

ここで前記類似パターンテーブル6について説明する
と、この類似パターンテーブル6は辞書登録された文字
パターンが別のカテゴリの辞書パターンとしても登録し
得る可能性を有しているか否かにより、その情報を格納
したものとなっている。具体的には第2図に示すように
数字『1』『2』『3』…について手書きされた数字パ
ターンを辞書登録するものとすると、数字カテゴリ
『2』について手書きされた数字パターン「2」の辞書
登録時に、その数字パターンが数字カテゴリ『3』につ
いても辞書登録し得る可能性を持つことを類似パターン
情報(例えばポインタ)として類似パターンテーブル6
に格納する。このことは上記手書きされた数字パターン
「2」に類似する文字パターンが数字カテゴリ『3』の
辞書パターンとして登録指示される可能性が有ることを
示している。
Here, the similar pattern table 6 will be described. The similar pattern table 6 stores information based on whether or not a dictionary-registered character pattern has a possibility of being registered as a dictionary pattern of another category. It has become. Specifically, as shown in FIG. 2, assuming that a number pattern handwritten for the numbers “1”, “2”, “3”,... Is registered in a dictionary, the number pattern “2” handwritten for the number category “2” is registered. When the similar pattern table 6 is used as similar pattern information (for example, a pointer), the fact that the numeric pattern has the possibility of being registered in the dictionary for the numeric category “3” at the time of registration in the dictionary
To be stored. This indicates that there is a possibility that a character pattern similar to the handwritten number pattern "2" is registered and instructed as a dictionary pattern of the number category "3".

尚、どのカテゴリの辞書パターンとして登録される可
能性があるかは、例えば辞書登録対象としている文字パ
ターンを認識処理し、その認識候補を調べることにより
求められる。この場合にはその認識候補として数字カテ
ゴリ『2』と『3』とが求められることから、数字カテ
ゴリ『3』についても登録可能性があるとして類似パタ
ーン情報が求められる。
Note that which category of dictionary pattern is likely to be registered can be determined, for example, by performing recognition processing on a character pattern to be registered in the dictionary and examining recognition candidates. In this case, since the numeric categories "2" and "3" are obtained as recognition candidates, similar pattern information is obtained assuming that the numeric category "3" may be registered.

しかしてこのようにして数字パターン「2」を数字カ
テゴリ『2』に辞書登録している状態において、数字カ
テゴリ『3』に手書き文字パターン「3」を登録しよう
とした場合、上記類似パターン情報から数字カテゴリ
『2』について辞書登録された文字パターン中に、上記
手書き文字パターン「3」に類似した文字パターンが存
在することが示される。そこでこれらの文字パターンを
提示し、どちらの文字パターンを優先させるかをオペレ
ータに問いかけ、これに対する選択情報の入力を受ける
ことにより、前記入力文字パターンを新規に辞書登録す
るか否かを決定する。そして辞書登録する場合には、既
に辞書登録されている文字パターンを登録抹消する。
In a state where the numeric pattern "2" is registered in the dictionary in the numeric category "2" in this way, if the user tries to register the handwritten character pattern "3" in the numeric category "3", the similar pattern information is used. This indicates that a character pattern similar to the handwritten character pattern "3" exists in the character patterns registered in the dictionary for the number category "2". Therefore, these character patterns are presented, the operator is asked which character pattern is to be prioritized, and selection information corresponding to the character pattern is received, thereby determining whether or not to newly register the input character pattern in the dictionary. When registering a dictionary, the character pattern already registered in the dictionary is deleted.

かくしてこのような機能を備えた本装置によれば、類
似パターンを異なるカテゴリにそれぞれ辞書登録してし
まうことを未然に防ぐことが可能となる。この結果、類
似パターンによる誤認識を防ぎ、その認識性能を十分に
高めることが可能となる。
Thus, according to the present apparatus having such a function, it is possible to prevent a similar pattern from being registered in a dictionary in a different category beforehand. As a result, erroneous recognition based on similar patterns can be prevented, and the recognition performance can be sufficiently improved.

尚、本発明は上述した実施例に限定されるものではな
い。ここでは数字パターンの辞書登録につき例示した
が、他の文字種についての辞書登録にも同様に適用可能
である。また類似パターンテーブル6の構成やその類似
パターンの管理形態も種々変形可能なことは勿論のこと
である。その他、本発明はその要旨を逸脱しない範囲で
種々変形して実施することができる。
Note that the present invention is not limited to the above-described embodiment. Here, the dictionary registration of the number pattern is described as an example, but the present invention can be similarly applied to the dictionary registration of other character types. Further, it is needless to say that the configuration of the similar pattern table 6 and the management form of the similar pattern can be variously modified. In addition, the present invention can be variously modified and implemented without departing from the gist thereof.

[発明の効果] 以上説明したように本発明によれば、異なるカテゴリ
への類似パターンの辞書登録を防いで、その認識性能を
向上させ得る等の実用上多大なる効果が奏せられる。
[Effects of the Invention] As described above, according to the present invention, it is possible to prevent a dictionary from being registered in a similar pattern in a different category, thereby improving the recognition performance of the dictionary.

【図面の簡単な説明】[Brief description of the drawings]

図は本発明の一実施例に係る文字認識装置を示すもの
で、第1図は実施例装置の概略構成図、第2図は類似パ
ターンテーブルの構成例を示す図、第3図は辞書登録処
理の流れを示す図である。 1……文字パターン入力部、2……認識処理部、3……
文字パターン辞書、4……認識結果出力部、5……辞書
登録部、6……類似パターンメモリ。
FIG. 1 shows a character recognition device according to an embodiment of the present invention. FIG. 1 is a schematic configuration diagram of the device of the embodiment, FIG. 2 is a diagram showing a configuration example of a similar pattern table, and FIG. It is a figure showing the flow of processing. 1 ... Character pattern input unit, 2 ... Recognition processing unit, 3 ...
Character pattern dictionary, 4 ... Recognition result output unit, 5 ... Dictionary registration unit, 6 ... Similar pattern memory.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力された文字パターンと認識辞書に予め
登録されている辞書パターンとを照合して上記入力文字
パターンに対する認識結果を求める文字認識装置におい
て、 辞書登録した文字パターンに類似する文字パターンが別
のカテゴリに辞書登録し得る可能性があることを示す情
報を格納した類似パターンテーブルと、 辞書登録しようとする文字パターンに類似する文字パタ
ーンが既に別のカテゴリに辞書登録されていることが上
記類似パターンテーブルから示されるとき、上記辞書登
録しようとする文字パターンと既に辞書登録されている
文字パターンの内の一方だけを辞書登録許可する辞書登
録手段とを具備することを特徴とする文字認識装置。
1. A character recognition apparatus for comparing an input character pattern with a dictionary pattern registered in a recognition dictionary in advance to obtain a recognition result for the input character pattern. A similar pattern table that stores information indicating that there is a possibility that a character pattern may be registered in another category, and a character pattern similar to the character pattern to be registered in the dictionary is already registered in another category. Character recognition characterized by comprising a dictionary registration means for permitting only one of the character pattern to be registered in the dictionary and a character pattern already registered in the dictionary when indicated from the similar pattern table. apparatus.
JP63240006A 1988-09-26 1988-09-26 Character recognition device Expired - Lifetime JP2829002B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63240006A JP2829002B2 (en) 1988-09-26 1988-09-26 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63240006A JP2829002B2 (en) 1988-09-26 1988-09-26 Character recognition device

Publications (2)

Publication Number Publication Date
JPH0289195A JPH0289195A (en) 1990-03-29
JP2829002B2 true JP2829002B2 (en) 1998-11-25

Family

ID=17053063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63240006A Expired - Lifetime JP2829002B2 (en) 1988-09-26 1988-09-26 Character recognition device

Country Status (1)

Country Link
JP (1) JP2829002B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5319721A (en) * 1992-04-14 1994-06-07 International Business Machines Corporation Methods and apparatus for evolving a starter set of handwriting prototypes into a user-specific set
JP2007039946A (en) * 2005-08-02 2007-02-15 Morita Alum Kogyo Kk Flip-up surface lattice

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58182790A (en) * 1982-04-19 1983-10-25 Nec Corp Character discriminator

Also Published As

Publication number Publication date
JPH0289195A (en) 1990-03-29

Similar Documents

Publication Publication Date Title
JPH0773190A (en) Emoji naming for pen-based computer systems
JP3602596B2 (en) Document filing apparatus and method
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
US6212298B1 (en) Character recognition apparatus, method and computer readable memory
JP2829002B2 (en) Character recognition device
JPH05258099A (en) Character recognition processor
JPH0520794B2 (en)
Yamashita et al. A document recognition system and its applications
JPH11143992A (en) Information processing device
JP2932667B2 (en) Information retrieval method and information storage device
JPH10302025A (en) Handwritten character recognition device and program recording medium thereof
JP4261831B2 (en) Character recognition processing method, character recognition processing device, character recognition program
JPH05242224A (en) Fingerprint matching device
JPH06243296A (en) Pen input password system
JPH07152856A (en) Optical character reader
JP2922900B2 (en) Handwritten character recognition device
JPH02195474A (en) Name card information control system
JP2828820B2 (en) Fingerprint collation device
JPH10269321A (en) Character recognition device, character recognition method, and dictionary registration method
JPH04256193A (en) Word register processing system for recognition word
JP2639314B2 (en) Character recognition method
JPH07210623A (en) Document image processing device
JPH10269366A (en) Drawing symbol recognition method
JPH03175592A (en) On-line character recognizing device
JPS6398788A (en) Recognizing device