JPH08101894A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH08101894A
JPH08101894A JP6261935A JP26193594A JPH08101894A JP H08101894 A JPH08101894 A JP H08101894A JP 6261935 A JP6261935 A JP 6261935A JP 26193594 A JP26193594 A JP 26193594A JP H08101894 A JPH08101894 A JP H08101894A
Authority
JP
Japan
Prior art keywords
dictionary
character
additional registration
additional
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6261935A
Other languages
Japanese (ja)
Inventor
Masaki Inoue
雅樹 猪上
Hiroshi Fujimura
浩 藤村
Tamaki Nakada
多磨樹 中田
Takashi Katsuge
孝志 勝毛
Kazuo Ozawa
和男 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Digital Laboratory Co Ltd
Original Assignee
Japan Digital Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Digital Laboratory Co Ltd filed Critical Japan Digital Laboratory Co Ltd
Priority to JP6261935A priority Critical patent/JPH08101894A/en
Publication of JPH08101894A publication Critical patent/JPH08101894A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE: To provide the character recognizing device with which the performance of recognition due to the additional registration of dictionary elements can be more improved. CONSTITUTION: A character recognizing device 10 is provided with a slip input part 101 for reading characters on a slip 100 as quantized data, feature extracting part 102 for extracting the features of character patterns, identifying part 103 for identifying the character patterns, image memory 104 for storing the quantized data, control part 1-5, dictionary part 106 equipped with the dictionary elements registered in advance, additional registration deciding part 107 for deciding whether it is possible to add the dictionary element to the dictionary part 106, dictionary addition processing part 108 and display part 109. The additional registration deciding part 107 decides whether the additional registration candidate character can be registered or not by using the feature data of the additional registration candidate character outputted from the feature extracting part 102 and the feature data stored in the dictionary 106 and when the additional registration deciding part 107 decides the registration is enabled, the dictionary addition processing part 108 additionaly registers the additional registration candidate character onto the dictionary 106 with its feature code and character code as the dictionary elements.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文字認識装置に関し、特
に、辞書に対し辞書要素の追加登録機能を有する文字認
識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device, and more particularly to a character recognition device having a dictionary element additional registration function for a dictionary.

【0002】[0002]

【従来の技術】印字若しくは手書きの文字を読取り、読
取った文字のイメージデータ(量子化データ)を基に抽
出した特徴データ及び文字パターンから文字を認識して
相当するカテゴリ(文字コード)を得る文字認識装置が
開発され、手書き伝票読取り装置を備えた会計処理装置
や文字読取り装置を利用した文字処理など多くの分野で
活用されているが、これら文字認識装置では、通常、読
取った文字とカテゴリを対応づけるための辞書部を有し
ている。
2. Description of the Related Art Characters obtained by reading a printed or handwritten character and recognizing the character from the characteristic data and character pattern extracted based on the image data (quantized data) of the read character to obtain a corresponding category (character code). Recognizers have been developed and are used in many fields such as accounting processors equipped with handwritten slip readers and character processing using character readers. It has a dictionary for associating.

【0003】従来、辞書部としては多くの学習文字から
得られた特徴から特徴系列を抽出し各文字のカテゴリと
対応させた辞書要素からなる標準辞書が用いられてきた
が、手書き文字の場合、読取った文字にくせ字や形状類
似文字が含まれている場合には特徴値に差がなくなり誤
認識や認識不能文字が生ずるという不都合があった。そ
こで、このような不都合の解消を目的として手書き文字
の記入者自身の文字を予め登録した個人用辞書の使用が
考えられた。個人辞書を用いる方式としては古くは特願
昭56ー088674号に開示の技術がある。また、こ
の他に、例えば、次のような技術が開示されている。 特願昭60−220481号(「文字認識装置」) 特願昭60−238989号(「文字認識方式」) 特願昭62−027874号(「文字認識装置」) 特願昭64−44586号(「個人辞書作成機能付
手書き文字認識装置」)
Conventionally, as the dictionary unit, a standard dictionary has been used, which is a dictionary element in which a feature series is extracted from the features obtained from many learning characters and is associated with the category of each character. If the read characters include cursive characters and similar characters, there is a problem in that there is no difference in the feature values and erroneous recognition or unrecognizable characters occur. Therefore, for the purpose of eliminating such inconvenience, it has been considered to use a personal dictionary in which the characters of the person who wrote the handwritten character are registered in advance. As a method of using a personal dictionary, there is a technology disclosed in Japanese Patent Application No. 56-088674. In addition to this, for example, the following techniques are disclosed. Japanese Patent Application No. 60-220481 ("Character Recognition Device") Japanese Patent Application No. 60-238989 ("Character Recognition Method") Japanese Patent Application No. 62-027874 ("Character Recognition Device") Japanese Patent Application No. 64-44586 ( "Handwritten character recognition device with personal dictionary creation function")

【0004】上記の文字認識装置では辞書に対する文
字の追加登録機能を有し、文字の追加登録の際に入力装
置からのカテゴリ名の連続的入力を可能にし、併せて表
示部にサンプル帳票から読取った文字パターンと入力カ
テゴリ名を表示しオペレータによる文字パターンとカテ
ゴリ名の対応づけ作業を容易ならしめることを目的とし
ている。
The above-mentioned character recognition device has a function of additionally registering characters in the dictionary, which enables continuous input of category names from the input device at the time of additional registration of characters, and at the same time, reads the sample form on the display unit. The purpose is to display the character pattern and the input category name and facilitate the operator's work of associating the character pattern with the category name.

【0005】次に、上記の文字認識装置では辞書に対
する文字の追加登録機能を有するが、サンプル帳票によ
る追加登録によらず、帳票読取り時に追加登録モードに
切換えることにより表示部に表示された複数の文字パタ
ーンの中から所望の文字パターンを指定してそのカテゴ
リ名を入力すると共に特徴を抽出して個人辞書に登録す
る事により、サンプル帳票への記入及びサンプル帳票入
力作業を不要としている。なお、上記の文字認識装置
では標準辞書と、標準辞書では認識不能な文字のパター
ンを記憶する副辞書を有し、読取った文字パターンの認
識処理時に認識不能な文字がある場合には副辞書を用い
て認識することにより文字認識率の向上を図っている。
また、上記の文字認識装置では個人の文字パターンを
作成し個人辞書に登録する場合に、既登録の辞書パター
ンと入力した文字パターンの類似度を比較し、この類似
度に基づいて個人パターンの安定度を計算して表示する
ことにより、利用者による文字パターンの個人辞書への
登録の可否を選択させる。
Next, although the above-mentioned character recognition device has a function of additionally registering characters in the dictionary, a plurality of plural characters displayed on the display unit can be displayed by switching to the additional registration mode at the time of reading the form regardless of the additional registration by the sample form. By designating a desired character pattern from the character patterns, inputting its category name, extracting features, and registering them in the personal dictionary, it is not necessary to fill in the sample form and input the sample form. The above character recognition device has a standard dictionary and a sub dictionary that stores patterns of characters that cannot be recognized by the standard dictionary. The character recognition rate is improved by recognizing the characters.
Further, in the above character recognition device, when a personal character pattern is created and registered in a personal dictionary, the similarity between the registered dictionary pattern and the input character pattern is compared, and the personal pattern is stabilized based on this similarity. By calculating and displaying the degree, the user is allowed to select whether or not to register the character pattern in the personal dictionary.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上記の
ような従来技術による文字認識装置においては辞書への
追加登録時に文字を記載した帳票内の文字枠からはみだ
したりずれて書かれた文字が登録できないという問題点
があった。また、上記,,のような文字認識装置
では誤読の場合や、認識不能な字形を単にあるカテゴリ
Aに属するものとして辞書に追加した場合に当該カテゴ
リと字形は異なるが特徴データの類似度が他のカテゴリ
より大きいカテゴリBとの類似度が、認識不能な字形を
カテゴリAに加えたことによりカテゴリBとの特徴の差
が少なくなり認識性能が悪化する可能性が大きく、特
に、個人辞書として追加辞書を用いる場合には認識性能
の悪化が著しいという問題点があった。さらに、標準辞
書と追加辞書の認識を2段階で行う方式の文字認識装置
(例えば前述した特願昭62ー027874号に開示の
文字認識装置)では処理ステップが多くなるため認識速
度が遅いという問題点があった。
However, in the character recognition device according to the prior art as described above, when the character is additionally registered in the dictionary, the character written outside the character frame in the form in which the character is described cannot be registered. There was a problem. Further, when a character recognition device such as the above-mentioned is misread, or when an unrecognizable glyph is simply added to the dictionary as belonging to a category A, the glyph is different from the category but the similarity of the feature data is different. The similarity with category B, which is larger than the category of, is less likely to deteriorate the recognition performance because the feature difference from category B is reduced due to the addition of unrecognizable glyphs to category A. In particular, it is added as a personal dictionary. When using a dictionary, there was a problem that the recognition performance deteriorated significantly. Further, in a character recognition device of a system in which recognition of a standard dictionary and an additional dictionary is performed in two steps (for example, the character recognition device disclosed in Japanese Patent Application No. 62-027874 mentioned above), the number of processing steps is large and the recognition speed is slow. There was a point.

【0007】本発明は従来技術に基づく文字認識装置に
おける上記のような問題点の解消のためになされたもの
であり、辞書に対し辞書要素の追加登録機能を有する文
字認識装置において、辞書要素の追加登録による認識性
能をより向上させ得る文字認識装置の提供を目的とす
る。なお、ここで、個人辞書とは手書き文字の認識の場
合に標準辞書のみの使用では個人の文字が有する癖によ
り認識率が低下することを抑制し認識率を向上するため
に、記入者毎に当該個人の記入した字を登録し当該記入
者の文字認識の場合に用いるよう構成した辞書をいい、
追加辞書とは標準辞書では認識不能な文字を認識するた
めにその認識不能文字の特徴データ及びカテゴリ等の辞
書要素を標準辞書に追加登録することにより全体として
標準辞書の認識不能な部分をカバーして辞書の認識効率
を向上させることを目的として構成した辞書をいう。
The present invention has been made to solve the above-mentioned problems in the character recognition device based on the prior art. In a character recognition device having a dictionary element additional registration function, the dictionary element An object of the present invention is to provide a character recognition device capable of further improving recognition performance by additional registration. It should be noted that here, in the case of recognizing handwritten characters, the personal dictionary is used for each writer in order to prevent the recognition rate from decreasing due to the habit of individual characters and improve the recognition rate when using only the standard dictionary. A dictionary configured to register the characters written by the individual and use it for character recognition by the writer.
The additional dictionary covers unrecognizable parts of the standard dictionary as a whole by recognizing characters that cannot be recognized by the standard dictionary by additionally registering the characteristic data of the unrecognizable characters and dictionary elements such as categories in the standard dictionary. A dictionary constructed for the purpose of improving the recognition efficiency of the dictionary.

【0008】[0008]

【課題を解決するための手段】上記の目的を達成するた
めに第1の発明の文字認識装置は、文字パターンの特徴
データと該文字パターンに対応するカテゴリ名を含む辞
書要素を格納した第1の辞書を備えた文字認識装置であ
って、入力した文字を第1の辞書に基づいて識別する識
別手段と、識別手段による識別の結果、識別不能文字が
ある場合に識別不能文字情報を出力する識別不能文字存
在情報出力手段と、識別不能文字存在情報出力手段から
の識別不能文字情報を検知して少なくとも該識別不能文
字パターンを表示する表示手段と、表示手段により表示
された文字パターンの中から任意の文字パターンを選択
する選択手段と、選択された文字パターンの大きさ及び
/または該文字パターンの位置を調整して調整後の文字
パターンを表示する調整手段と、調整された文字パター
ンを追加登録候補文字として該文字パターンから特徴デ
ータを抽出する特徴データ抽出手段と、追加登録候補文
字の文字パターンから抽出された特徴データと第1の辞
書に登録されている特徴データに基づいて追加登録候補
文字の第1の辞書への追加登録の可否を判定する追加登
録判定手段と、追加登録判定手段による判定結果が登録
可であるとき、追加登録候補文字の特徴データとカテゴ
リ名を含む辞書要素を第1の辞書に追加登録する辞書追
加処理手段と、を有することを特徴とする。
In order to achieve the above object, the character recognition device of the first invention stores a dictionary element containing character pattern feature data and a category name corresponding to the character pattern. A character recognizing device including a dictionary, the identifying means for identifying an input character based on the first dictionary, and the unidentifying character information is output when there is an unidentifying character as a result of identification by the identifying means. Among the character patterns displayed by the unidentifiable character existence information output means, the display means for detecting at least the unidentifiable character information by detecting the unidentifiable character information from the unidentifiable character existence information output means, and the character pattern displayed by the display means. A selection means for selecting an arbitrary character pattern and the size and / or position of the selected character pattern are adjusted to display the adjusted character pattern. The adjusting means, the characteristic data extracting means for extracting the characteristic data from the character pattern by using the adjusted character pattern as the additional registration candidate character, the characteristic data extracted from the character pattern of the additional registration candidate character, and the registration in the first dictionary. The additional registration candidate character that determines whether or not the additional registration candidate character can be additionally registered in the first dictionary based on the registered feature data, and the additional registration candidate character is registered when the determination result by the additional registration determination means is registerable. Dictionary addition processing means for additionally registering a dictionary element including the characteristic data and the category name in the first dictionary.

【0009】第2の発明は上記第1の発明の文字認識装
置において、識別不能文字の文字パターンと共に文字枠
が表示手段により表示されるとき、調整手段が、更に、
文字枠の大きさを調整すると共に調整後の文字パターン
を調整された文字枠内に収める手段を有することを特徴
とする。
According to a second aspect of the present invention, in the character recognition device according to the first aspect, when a character frame is displayed by the display means together with a character pattern of unidentifiable characters, the adjusting means further comprises:
It is characterized in that it has means for adjusting the size of the character frame and for storing the adjusted character pattern in the adjusted character frame.

【0010】第3の発明は上記第1の発明の文字認識装
置において、追加登録判定手段による判定結果が登録不
可であるとき、登録不可と判定された追加登録候補文字
について更に該追加登録候補文字の特徴データとカテゴ
リ名を含む辞書要素の第1の辞書への登録を可能とする
強制追加登録手段を有することを特徴とする。
According to a third aspect of the present invention, in the character recognition device of the first aspect, when the result of determination by the additional registration determining means is that registration is not possible, the additional registration candidate character determined to be unregisterable is further added to the additional registration candidate character. It is characterized by having a forced additional registration means capable of registering a dictionary element including the characteristic data of 1. and the category name in the first dictionary.

【0011】第4の発明は上記第1の発明の文字認識装
置において、更に、標準的な辞書要素を格納した標準辞
書と、追加登録された辞書要素を格納した追加辞書を備
え、追加登録判定手段が、追加登録候補文字の文字パタ
ーンから抽出された特徴データと標準辞書に登録されて
いる特徴データに基づいて追加登録候補文字の追加辞書
への追加登録の可否を判定する手段であり、辞書追加処
理手段が、追加登録判定手段による判定結果が登録可で
あるとき、追加登録候補文字の特徴データとカテゴリ名
を含む辞書要素を追加辞書に追加登録する手段であり、
更に、追加辞書から個人単位に辞書要素を選択抽出し
て、前記標準辞書の辞書要素と共に第1の辞書に格納す
る辞書編集手段を有することを特徴とする。
A fourth invention is the character recognition apparatus of the first invention, further comprising a standard dictionary storing standard dictionary elements and an additional dictionary storing additionally registered dictionary elements. The means is means for determining whether or not additional registration of the additional registration candidate character in the additional dictionary is possible based on the characteristic data extracted from the character pattern of the additional registration candidate character and the characteristic data registered in the standard dictionary. The additional processing means is means for additionally registering a dictionary element including the characteristic data of the additional registration candidate character and the category name in the additional dictionary when the determination result by the additional registration determination means is registerable,
Further, it is characterized by further comprising dictionary editing means for selectively extracting a dictionary element from the additional dictionary for each individual and storing it in the first dictionary together with the dictionary element of the standard dictionary.

【0012】第5の発明は上記第4の発明の文字認識装
置において、追加登録判定手段による判定結果が登録不
可であるとき、登録不可と判定された追加登録候補文字
について更に該追加登録候補文字の特徴データとカテゴ
リ名を含む辞書要素の追加辞書への登録を可能とする強
制追加登録手段を有することを特徴とする。
According to a fifth aspect of the present invention, in the character recognition device according to the fourth aspect of the present invention, when the result of determination by the additional registration determination means is unregisterable, the additional registration candidate character determined to be unregisterable is further the additional registration candidate character. It is characterized by having a forced additional registration means capable of registering a dictionary element including the feature data and the category name in the additional dictionary.

【0013】第6の発明は上記第1ないし第3のいずれ
かの発明の文字認識装置において、追加登録判定手段が
下記ステップからなることを特徴とする。 (1) 追加登録文字候補の特徴データと第1の辞書の
各辞書要素の特徴データとの距離をそれぞれ求める。 (2) 上記ステップ(1)で得られた各要素の距離の
うち追加登録文字と同じカテゴリで最も近い距離を第1
の距離として選択する。 (3) 上記ステップ(1)で得られた各要素の距離の
うちからステップ(2)で選択した第1の距離を除いた
距離の平均を第2の距離として求める。 (4) 前記第1の距離の閾値を第1の閾値、前記第2
の距離の閾値を第2の閾値とするとき、第1の距離が第
1の閾値より近く第2の距離が第2の閾値より遠い場合
にのみ、追加登録候補文字の特徴データとカテゴリ名を
含む辞書要素の第1の辞書への追加登録が可能と判定す
る。
A sixth invention is characterized in that, in the character recognition device according to any one of the first to third inventions, the additional registration judging means comprises the following steps. (1) The distances between the feature data of the additionally registered character candidates and the feature data of each dictionary element of the first dictionary are obtained. (2) Of the distances of the respective elements obtained in the above step (1), the closest distance in the same category as the additionally registered character is first.
Select as the distance. (3) From the distances of the respective elements obtained in step (1) above, the average of the distances excluding the first distance selected in step (2) is obtained as the second distance. (4) The threshold of the first distance is the first threshold, and the second
When the second distance threshold is set as the second threshold, the feature data of the additional registration candidate character and the category name are set only when the first distance is closer than the first threshold and the second distance is farther than the second threshold. It is determined that the dictionary element including the dictionary element can be additionally registered in the first dictionary.

【0014】第7の発明は上記第1ないし第3のいずれ
かの発明の文字認識装置において、追加登録判定手段が
下記ステップからなることを特徴とする。 (1) 追加登録文字候補の特徴データと標準辞書及び
追加辞書の各辞書要素の特徴データとの距離をそれぞれ
求める。 (2) 上記ステップ(1)で得られた各要素の距離の
うち追加登録文字と同じカテゴリで最も近い距離を第1
の距離として選択する。 (3) 上記ステップ(1)で得られた各要素の距離の
うちからステップ(2)で選択した第1の距離を除いた
距離の平均を第2の距離として求める。 (4) 前記第1の距離の閾値を第1の閾値、前記第2
の距離の閾値を第2の閾値とするとき、第1の距離が第
1の閾値より近く第2の距離が第2の閾値より遠い場合
にのみ、追加登録候補文字の特徴データとカテゴリ名を
含む辞書要素の追加辞書への追加登録が可能と判定す
る。
A seventh invention is characterized in that, in the character recognition device of any one of the first to third inventions, the additional registration judging means comprises the following steps. (1) The distances between the feature data of the additionally registered character candidates and the feature data of each dictionary element of the standard dictionary and the additional dictionary are respectively obtained. (2) Of the distances of the respective elements obtained in the above step (1), the closest distance in the same category as the additionally registered character is first.
Select as the distance. (3) From the distances of the respective elements obtained in step (1) above, the average of the distances excluding the first distance selected in step (2) is obtained as the second distance. (4) The threshold of the first distance is the first threshold, and the second
When the second distance threshold is set as the second threshold, the feature data of the additional registration candidate character and the category name are set only when the first distance is closer than the first threshold and the second distance is farther than the second threshold. It is determined that the dictionary element including the dictionary element can be additionally registered in the additional dictionary.

【0015】[0015]

【作用】上記構成によれば、本発明の文字認識装置は位
置ずれ等により認識不可能な文字があっても調整手段に
よりずれた文字の位置及び文字の形状を調整し、更に、
追加登録判定手段により登録可否判定のための識別を行
い、登録可能な文字については辞書に自動的に追加登録
する。また、位置ずれ以外の認識不可能な文字について
も追加登録判定手段により登録可否判定のための識別を
行い、登録可能な文字については辞書に自動的に追加登
録する。すなわち、文字認識装置は(追加登録機能への
切換えをすることなく)認識機能と共に追加登録機能が
機能し、辞書(標準辞書及び追加登録機能の動作時にあ
る追加辞書を含む)による認識不能文字の追加辞書への
登録の可否を自動的に判定する。
According to the above construction, the character recognition device of the present invention adjusts the position and shape of the misaligned characters by the adjusting means even if there are unrecognizable characters due to misalignment.
The additional registration determination means identifies for registration determination, and the characters that can be registered are automatically additionally registered in the dictionary. Further, regarding the unrecognizable characters other than the positional deviation, the additional registration determining means performs the identification for the registration possibility determination, and the registerable characters are automatically additionally registered in the dictionary. That is, the character recognizing device functions as the additional registration function together with the recognition function (without switching to the additional registration function), and recognizes unrecognizable characters in the dictionary (including the standard dictionary and the additional dictionary existing when the additional registration function operates). Whether to register in the additional dictionary is automatically determined.

【0016】また、第3及び第5の発明の文字認識装置
によれば認識不能文字の追加辞書への登録”否”の文字
に関しても一律的なリジェクトでなく、強制登録の手段
を備えたことにより、個人毎の個別ファイル化ができ
る。
Further, according to the character recognition devices of the third and fifth inventions, the registration of unrecognizable characters in the additional dictionary is not rejected uniformly, but means for forced registration is provided. With this, individual files can be created for each individual.

【0017】更に、第4及び第5の発明の文字認識装置
によれば、追加登録には追加辞書を用いて辞書要素の追
加登録を行い、追加登録終了後、辞書編集手段により追
加辞書から個人別の辞書要素を抽出して標準辞書の辞書
要素と共に第1の辞書に格納し、文字の識別時には第1
の辞書を用いて識別を行う。
Further, according to the character recognition device of the fourth and fifth inventions, the additional dictionary is used for the additional registration to register the dictionary elements, and after the additional registration is completed, the dictionary editing means is used to personalize the additional dictionary. Another dictionary element is extracted and stored in the first dictionary together with the dictionary element of the standard dictionary.
Identification is performed using the dictionary.

【0018】[0018]

【実施例】【Example】

<実施例1>図1は本発明に基づく文字認識装置の一実
施例の構成を示すブロック図であり、文字認識装置10
は、帳票100上に記入された(或いは、印字された)
文字を読取って量子化データ(イメージデータ)とする
帳票入力部101と、量子化された文字パターンの特徴
を抽出する特徴抽出部102と、文字パターンを識別す
る識別部103と、量子化データを記憶する画像メモリ
104と、制御部105と、予め登録された文字の特徴
と文字コードを辞書要素として有する辞書部106と、
辞書部106に辞書要素の追加の可否を判定する追加登
録判定部107と、辞書追加処理部108と、表示部1
09と、キー入力部110とを有している。
<Embodiment 1> FIG. 1 is a block diagram showing the configuration of an embodiment of a character recognition device according to the present invention.
Is written (or printed) on the form 100
A form input unit 101 that reads a character into quantized data (image data), a feature extraction unit 102 that extracts a feature of a quantized character pattern, an identification unit 103 that identifies a character pattern, and a quantized data An image memory 104 to be stored, a control unit 105, a dictionary unit 106 having a character feature and a character code registered in advance as dictionary elements,
An additional registration determination unit 107 that determines whether or not a dictionary element can be added to the dictionary unit 106, a dictionary addition processing unit 108, and a display unit 1
09 and a key input unit 110.

【0019】なお、これら文字認識部の各構成要素及び
構成要素間の動作は、実施例では、特徴抽出部102に
あっては特徴データ抽出手段、識別部103にあっては
識別手段及び識別不能文字存在情報出力手段、追加登録
判定部107にあっては追加登録判定手段、辞書追加処
理部108にあっては辞書追加処理手段、表示部109
にあっては表示手段及び強制追加登録手段、キー入力部
にあっては選択手段,調整手段,及び強制追加登録手段
等のプログラムにより実行される。また、これらプログ
ラムは文字認識装置10の起動時に立ち上げられ、制御
部105によりその実行制御が行われるが、これに限ら
れることなく、上記各手段はその全部または一部をファ
ームウエアまたはハードウエアとして構成することもで
きる。
The constituent elements of the character recognizing section and the operations between the constituent elements are, in the embodiment, characteristic data extracting means in the characteristic extracting section 102, identifying means in the identifying section 103, and unidentifiable. Character presence information output means, additional registration determination means in the additional registration determination section 107, dictionary addition processing means in the dictionary addition processing section 108, display section 109
In this case, the program is executed by the display means and the forced additional registration means, and in the key input section, the selection means, the adjusting means, and the forced additional registration means. Further, these programs are started up when the character recognition device 10 is activated and their execution is controlled by the control unit 105. However, the present invention is not limited to this. Can also be configured as.

【0020】以下、文字認識装置10の動作を(1)認
識処理、(2)調整処理、(3)追加登録判定処理の順
序で説明する。 (1) 認識処理 帳票100は入力処理部101によって読取られ、帳票
上に区画される所定位置範囲(例えば文字枠内)に1文
字ずつ記入(或いは印字)された文字が量子化され、量
子化された入力文字パターンは特徴抽出部102及び画
像メモリ104に出力される。特徴抽出部102は帳票
入力部101から出力される1文字単位の文字パターン
から文字の特徴データを抽出する。また、画像メモリ1
04では帳票入力部101からの量子化された文字パタ
ーンを格納する。識別部103は特徴抽出部102から
出力される特徴データと辞書106に格納されている特
徴データとの距離を計算し距離の一番短いカテゴリを文
字候補として制御部105に出力する。ここで、識別部
103でリジェクト判定を行う場合には候補文字の距離
Dと辞書106に格納されている候補文字のリジェクト
閾値Rとを比較し、例えば、D≦Rの場合はリジェクト
なし、D>Rの場合はリジェクトありと判定する。そし
て、リジェクトなしの場合は制御部105へ候補文字を
出力し、リジェクトありの場合は識別不能文字ありとし
て制御部105へリジェクト信号を出力する。リジェク
ト信号を受けた場合、制御部105では識別部103か
ら出力される識別結果とこの結果に対応する画像メモリ
104内の文字パターンを表示部109に表示する。
The operation of the character recognition device 10 will be described below in the order of (1) recognition processing, (2) adjustment processing, and (3) additional registration determination processing. (1) Recognition processing The form 100 is read by the input processing unit 101, and characters written (or printed) one by one in a predetermined position range (for example, in a character frame) partitioned on the form are quantized and quantized. The input character pattern is output to the feature extraction unit 102 and the image memory 104. The feature extraction unit 102 extracts the feature data of characters from the character pattern for each character output from the form input unit 101. Also, the image memory 1
In 04, the quantized character pattern from the form input unit 101 is stored. The identification unit 103 calculates the distance between the feature data output from the feature extraction unit 102 and the feature data stored in the dictionary 106, and outputs the category with the shortest distance to the control unit 105 as a character candidate. Here, when the identification unit 103 performs the rejection determination, the distance D of the candidate character is compared with the rejection threshold R of the candidate character stored in the dictionary 106. For example, when D ≦ R, no rejection, D If> R, it is determined that there is a reject. If there is no reject, the candidate character is output to the control unit 105, and if there is a reject, it is determined that there is an unidentifiable character and a reject signal is output to the control unit 105. When the reject signal is received, the control unit 105 displays the identification result output from the identification unit 103 and the character pattern in the image memory 104 corresponding to the identification result on the display unit 109.

【0021】(2) 調整処理 利用者は表示部109に表示された認識結果を見て辞書
106に追加登録したい文字を指定する。すなわち、利
用者はキー入力部110を用いて辞書106に追加登録
したい文字を指定する。制御部105はキー入力部11
0で指定された文字の画像を表示部109の画面上で拡
大表示する。ここで、図2(a)は拡大表示された文字
の例であり、この例の場合は文字の記入位置のずれによ
り文字が文字枠200の外にずれて一部分がはみ出して
いる。このような場合には、利用者はキー入力部110
を用いて文字の位置を移動させて図2(b)のように文
字が枠200の中に収るように調整する。また、図2
(c)のように文字が大きく枠202からはみ出た場合
にはキー入力部110を用いて(例えば、カーソル移動
キーを操作してカーソルを当該文字近傍に位置させ、枠
拡大キーを操作して)枠を拡大して図2(d)のように
枠内に文字が収るように調整する。なお、実施例ではキ
ー入力部110を用いて文字の位置を移動させている
が、これに限られず、例えば、マウス等のポインティン
グデバイスを用いて文字の位置を移動させてもよい。調
整された文字パターンは調整作業の終了後、追加登録候
補文字として特徴抽出部102に出力され特徴抽出部1
02では追加登録候補文字の特徴データを作成し追加登
録判定部107へ出力する。追加登録判定部107では
特徴抽出部102から出力される追加登録候補文字の特
徴データと辞書106に格納されている特徴データを用
いて追加登録候補文字の登録可否を判定する。そして、
追加登録判定部107は判定結果を辞書追加処理部10
8と制御部105に出力する。追加登録判定部107で
登録可と判定された場合には辞書追加処理部108で追
加登録候補文字の特徴コードと文字コードを辞書要素と
して辞書106に追加登録し、表示部109は登録完了
のメッセージを表示する。また、追加登録判定部107
で登録不可と判定された場合には制御部105は強制追
加登録の可否を問うメッセージ(強制追加登録選択メッ
セージ)を表示部109上に表示する。強制追加登録選
択メッセージが表示された場合には利用者はキー入力部
110から強制追加登録可を意味するコード(例え
ば、”Yes”)或いは強制追加登録不可を意味するコ
ード(例えば、”No”)を入力する。制御部105は
キー入力部110からの入力コードが強制追加登録可を
意味するコードである場合には辞書追加処理部108に
対し追加登録許可信号を出力し、辞書追加処理部108
は追加登録許可信号を受けて追加登録文字候補の特徴デ
ータと文字コードを辞書要素として追加登録する。な
お、辞書106への追加登録後の識別部103における
識別処理は追加登録した辞書要素を含めて行う。
(2) Adjustment process The user looks at the recognition result displayed on the display unit 109 and specifies the character to be additionally registered in the dictionary 106. That is, the user uses the key input unit 110 to specify a character to be additionally registered in the dictionary 106. The control unit 105 uses the key input unit 11
The image of the character designated by 0 is enlarged and displayed on the screen of the display unit 109. Here, FIG. 2A is an example of the enlarged characters, and in this example, the character is shifted out of the character frame 200 due to the shift of the writing position of the character, and a part of it is projected. In such a case, the user may enter the key input unit 110.
The position of the character is moved by using to adjust the character so that the character fits within the frame 200 as shown in FIG. Also, FIG.
When the character is largely out of the frame 202 as shown in (c), the key input unit 110 is used (for example, the cursor movement key is operated to position the cursor near the character, and the frame enlargement key is operated. ) Enlarge the frame and adjust so that the characters fit within the frame as shown in FIG. Although the character position is moved using the key input unit 110 in the embodiment, the present invention is not limited to this, and the character position may be moved using a pointing device such as a mouse. After the adjustment work is completed, the adjusted character pattern is output to the feature extraction unit 102 as an additional registration candidate character and is output to the feature extraction unit 1.
In 02, the feature data of the additional registration candidate character is created and output to the additional registration determination unit 107. The additional registration determination unit 107 determines whether the additional registration candidate character can be registered, using the characteristic data of the additional registration candidate character output from the characteristic extraction unit 102 and the characteristic data stored in the dictionary 106. And
The additional registration determination unit 107 outputs the determination result to the dictionary addition processing unit 10
8 and the control unit 105. When the additional registration determination unit 107 determines that registration is possible, the dictionary addition processing unit 108 additionally registers the feature code and character code of the additional registration candidate character in the dictionary 106 as a dictionary element, and the display unit 109 displays a registration completion message. Is displayed. In addition, the additional registration determination unit 107
When it is determined that the registration is impossible, the control unit 105 displays on the display unit 109 a message (forced additional registration selection message) asking whether the forced additional registration is possible. When the forced additional registration selection message is displayed, the user inputs a code (eg, “Yes”) indicating that forced additional registration is possible or a code indicating that forced additional registration is not possible (for example, “No”) from the key input unit 110. ) Is entered. When the input code from the key input unit 110 is a code indicating that forced additional registration is possible, the control unit 105 outputs an additional registration permission signal to the dictionary addition processing unit 108, and the dictionary addition processing unit 108.
Receives the additional registration permission signal and additionally registers the feature data and character code of the additional registration character candidate as a dictionary element. The identification processing in the identification unit 103 after the additional registration in the dictionary 106 is performed including the additionally registered dictionary element.

【0022】(3) 追加登録判定処理 図3は本発明の文字認識装置における追加登録判定処理
(すなわち、追加登録判定部107における処理)を示
すフローチャートである。また、図4は辞書の一構成例
を示す図であり、この例ではカテゴリA(A1〜A
3),B(B1〜B3),C(C1〜C3)とも3つの
辞書要素で構成されている(通常、辞書は認識率向上の
ため1つのカテゴリに対し複数の文字パターンを用意し
それらの特徴データを対応させて辞書要素として登録し
ている。従って、カテゴリ毎に同一カテゴリ内の辞書要
素の数が異なったり、或いは1カテゴリ1辞書要素の場
合もある)。またここで、1つ1つの辞書要素は10個
のサンプルの平均であり、特徴抽出部102で抽出され
た文字パターンの特徴数は20であるとする。いま、追
加登録候補文字のカテゴリがAであるとする。図3のス
テップS1では追加登録候補文字の特徴データと各辞書
要素の特徴データとの距離を求める。例えば、距離尺度
としてユークリッド距離を用いた場合には追加登録候補
文字と図4の辞書番号iとの距離D[i]は下記数式
(1)で表される。
(3) Additional Registration Judgment Process FIG. 3 is a flowchart showing the additional registration judgment process (that is, the process in the additional registration judgment unit 107) in the character recognition device of the present invention. FIG. 4 is a diagram showing an example of the structure of the dictionary. In this example, categories A (A1 to A
3), B (B1 to B3), and C (C1 to C3) are each composed of three dictionary elements (generally, the dictionary prepares a plurality of character patterns for one category to improve the recognition rate. Feature data is registered as dictionary elements in association with each other.Therefore, the number of dictionary elements in the same category may differ for each category, or there may be one category and one dictionary element). In addition, here, it is assumed that each dictionary element is an average of 10 samples, and the number of features of the character pattern extracted by the feature extraction unit 102 is 20. Now, assume that the category of the additional registration candidate character is A. In step S1 of FIG. 3, the distance between the feature data of the additional registration candidate character and the feature data of each dictionary element is calculated. For example, when the Euclidean distance is used as the distance measure, the distance D [i] between the additional registration candidate character and the dictionary number i in FIG. 4 is expressed by the following mathematical expression (1).

【数1】 D[i]=(Σ(ZjーXij)21/2 (1) ここで、Zjは追加登録候補文字の特徴データのj番目
の要素でありXijは辞書のi番目の辞書要素の特徴デ
ータのj番目の要素であり、Σはj=1〜n(特徴数)
としたときの総和を意味する記号である。したがって、
図4の辞書番号1(辞書要素A1)との特徴データの距
離D[1]は、D[1]=(Σ(ZjーA1j)21/2
となる。
## EQU1 ## D [i] = (Σ (Zj-Xij) 2 ) 1/2 (1) where Zj is the j-th element of the feature data of the additional registration candidate character and Xij is the i-th element of the dictionary. It is the jth element of the feature data of the dictionary element, and Σ is j = 1 to n (number of features)
Is a symbol that means the sum of Therefore,
The distance D [1] between the feature data and the dictionary number 1 (dictionary element A1) in FIG. 4 is D [1] = (Σ (Zj-A1j) 2 ) 1/2
Becomes

【0023】図5は上記数式(1)により求めた追加登
録候補文字の特徴データと図4に示した辞書の特徴デー
タとの距離の算出結果である。ステップS2ではステッ
プS1で求めた距離のうち追加登録候補文字と同じカテ
ゴリで且つ最も近い距離Dclsを選択する。ユークリ
ッド距離を用いた場合には距離が小さいほど近いと定義
されるので、ここでは下記数式(2)に示されるような
最小の距離を求める。
FIG. 5 is a calculation result of the distance between the characteristic data of the additional registration candidate character obtained by the above mathematical expression (1) and the characteristic data of the dictionary shown in FIG. In step S2, the distance Dcls that is in the same category as the additional registration candidate character and is closest is selected from the distances calculated in step S1. When the Euclidean distance is used, the smaller the distance is, the closer the distance is defined. Therefore, the minimum distance as shown in the following mathematical expression (2) is obtained.

【数2】 Dcls=min(D[1],D[2],・・,D[i],・・) (2) ここで、min(D[1],・・,D[i],・・)は
括弧内の要素の最小値を表し、図5の例ではDcls=
D[3]である。ステップS3ではステップS1で求め
た距離の中からステップS2で選択した距離を除いた距
離の平均Daveを求める。Daveは下記数式(3)
で示される。
[Equation 2] Dcls = min (D [1], D [2], ..., D [i], ...) (2) where min (D [1], ..., D [i], ..) represents the minimum value of the elements in parentheses, and in the example of FIG. 5, Dcls =
It is D [3]. In step S3, the average Dave of the distances obtained by removing the distance selected in step S2 from the distances calculated in step S1 is calculated. Dave is the following formula (3)
Indicated by.

【数3】 Dave={(ΣD[i])ーDcls}/(n−1) (3) ここで、Σはi=1〜n(nは特徴数)としたときの総
和を意味する記号である。従って、上記例の場合には平
均Daveは、Dave=(D[1]+D[2]+D
[4]+D[5]+D[6]+D[7]+D[8]+D
[9])/8=2690/8=336.5となる。ステ
ップS4ではDclsとDaveを用いて追加登録可否
の判定を行う。具体的には、例えば、Dclsの閾値を
thcls,Daveの閾値をthaveとした場合、
Dclsがthclsより近く、Daveがthave
より遠い場合には制御部105はステップS5で登録可
の信号を辞書追加処理部に出力する。ユークリッド距離
を用いた場合は下記の条件式で示される。 条件1:登録可 Dcls≦thcls 且つ Da
ve≧thave 条件2:登録不可 条件1以外の場合 そこで、上例の場合にthcls=150,thave
=250とすると、Dcls=100,Dave=33
6.5であるから、Dcls=100<150=thc
ls,Dave=336.5>thave=250とな
り、条件1を満たすので制御部105は登録可の信号を
辞書追加処理部に出力する。なお、ステップS2におけ
る距離は実施例ではユークリッド距離を用いているが、
これに限られることなく、データのばらつきを考慮して
各辞書内の分散で正規化した距離や他の距離尺度を用い
てもよい。
Dave = {(ΣD [i]) − Dcls} / (n−1) (3) where Σ is a symbol that means the sum when i = 1 to n (n is the number of features) Is. Therefore, in the above example, the average Dave is Dave = (D [1] + D [2] + D
[4] + D [5] + D [6] + D [7] + D [8] + D
[9]) / 8 = 2690/8 = 336.5. In step S4, whether or not additional registration is possible is determined using Dcls and Dave. Specifically, for example, when the threshold value of Dcls is thcls and the threshold value of Dave is thave,
Dcls is closer than thcls and Dave is
If it is farther, the control unit 105 outputs a signal indicating that registration is possible to the dictionary addition processing unit in step S5. When the Euclidean distance is used, it is expressed by the following conditional expression. Condition 1: Registration is possible Dcls ≦ thcls and Da
ve ≧ thave Condition 2: Unregisterable Case other than Condition 1 In the above example, thcls = 150, then
= 250, Dcls = 100, Dave = 33
Since it is 6.5, Dcls = 100 <150 = thc
Since ls, Dave = 336.5> thave = 250 and the condition 1 is satisfied, the control unit 105 outputs a registerable signal to the dictionary addition processing unit. Although the Euclidean distance is used as the distance in step S2 in the embodiment,
The distance is not limited to this, and the distance normalized by the variance in each dictionary or another distance measure may be used in consideration of the data variation.

【0024】〈実施例2〉図6は本発明に基づく文字認
識装置の他の実施例の構成を示すブロック図であり、文
字認識装置60は、図1の文字認識装置10の構成に辞
書編集部611,メーカが提供する標準辞書611,及
び追加辞書613とを付加した構成を有している。な
お、これら文字認識部の各構成要素及び構成要素間の動
作は、実施例では、特徴抽出部102にあっては特徴デ
ータ抽出手段、識別部103にあっては識別手段及び識
別不能文字存在情報出力手段、追加登録判定部107に
あっては追加登録判定手段、辞書追加処理部108にあ
っては辞書追加処理手段、表示部109にあっては表示
手段及び強制追加登録手段、キー入力部にあっては選択
手段,調整手段,及び強制追加登録手段、辞書編集部6
11にあっては辞書編集手段等のプログラムにより実行
される。また、これらプログラムは文字認識装置10の
起動時に立ち上げられ、制御部105によりその実行制
御が行われるが、これに限られることなく、上記各手段
はその全部または一部をファームウエアまたはハードウ
エアとして構成することもできる。
<Embodiment 2> FIG. 6 is a block diagram showing the construction of another embodiment of the character recognition apparatus according to the present invention. The character recognition apparatus 60 is a dictionary editing apparatus having the same construction as the character recognition apparatus 10 of FIG. It has a configuration in which a section 611, a standard dictionary 611 provided by the manufacturer, and an additional dictionary 613 are added. The constituent elements of the character recognition section and the operations between the constituent elements are, in the embodiment, characteristic data extraction means in the characteristic extraction section 102, identification means in the identification section 103, and unidentifiable character presence information. The output unit, the additional registration determination unit in the additional registration determination unit 107, the dictionary addition processing unit in the dictionary addition processing unit 108, the display unit and the forced additional registration unit in the display unit 109, and the key input unit. If so, selection means, adjustment means, forced additional registration means, dictionary editing unit 6
11 is executed by a program such as dictionary editing means. Further, these programs are started up when the character recognition device 10 is activated and their execution is controlled by the control unit 105. However, the present invention is not limited to this. Can also be configured as.

【0025】本実施例において認識処理は前述した実施
例1の認識処理と同様であり説明を省略する(実施例1
の(1)認識処理参照)。以下、追加辞書613に対す
る追加登録処理について述べる。利用者は表示部109
に表示された認識結果を見て追加辞書613に追加登録
したい文字を指定する。すなわち、利用者はキー入力部
110を用いて追加辞書613に追加登録したい文字を
指定する。制御部105はキー入力部110で指定され
た文字の画像を表示部109の画面上で拡大表示する。
ここで、図2(a)は拡大表示された文字の例であり、
この例の場合は文字の記入位置のずれにより文字が文字
枠200の外にずれて一部分がはみ出している。このよ
うな場合には、利用者はキー入力部110を用いて文字
の位置を移動または回転させて図2(b)のように文字
が枠200の中に収るように調整する。また、図2
(c)のように文字が大きく枠202からはみ出た場合
にはキー入力部110を用いて(例えば、カーソル移動
キーを操作してカーソルを当該文字近傍に位置させ、枠
拡大キーを操作して)枠を拡大して図2(d)のように
枠内に文字が収るように調整する。なお、実施例ではキ
ー入力部110を用いて文字の位置を移動させている
が、これに限られず、例えば、マウス等のポインティン
グデバイスを用いて文字の位置を移動させてもよい。ま
た、文字パターンの調整は上記例に限られず、細線化や
補間等の処理も行うよう構成できる。調整された文字パ
ターンは追加登録候補文字として特徴抽出部102に出
力され特徴抽出部102では追加登録候補文字の特徴デ
ータを作成し追加登録判定部107へ出力する。追加登
録判定部107では特徴抽出部102から出力される追
加登録候補文字の特徴データと辞書106に格納されて
いる特徴データを用いて追加登録候補文字の追加辞書6
13への登録可否を判定する。そして、追加登録判定部
107は判定結果を辞書追加処理部108と制御部10
5に出力する。追加登録判定部107で登録可と判定さ
れた場合には辞書追加処理部108で追加登録候補文字
の特徴コードと文字コードを辞書要素として追加辞書6
13に追加登録し、表示部109は登録完了のメッセー
ジを表示する。また、追加登録判定部107で登録不可
と判定された場合には制御部105は表示部109上に
強制追加登録の可否を問うメッセージ(強制追加登録選
択メッセージ)を表示する。強制追加登録選択メッセー
ジが表示された場合には利用者はキー入力部110から
強制追加登録可を意味するコード(例えば、“Ye
s”)或いは強制追加登録不可を意味するコード(例え
ば、“No”)を入力する。制御部105はキー入力部
110からの入力コードが強制追加登録可を意味するコ
ードである場合には辞書追加処理部108に対し追加登
録許可信号を出力し、辞書追加処理部108は追加登録
許可信号を受けて追加登録候補文字の特徴データと文字
コードを辞書要素として追加登録する。
The recognition processing in this embodiment is the same as the recognition processing in the above-described first embodiment, and the description thereof will be omitted (first embodiment).
(1) Recognition process). The additional registration process for the additional dictionary 613 will be described below. The user has the display unit 109.
A character to be additionally registered in the additional dictionary 613 is specified by looking at the recognition result displayed in. That is, the user uses the key input unit 110 to specify the character to be additionally registered in the additional dictionary 613. The control unit 105 enlarges and displays the image of the character designated by the key input unit 110 on the screen of the display unit 109.
Here, FIG. 2A is an example of the enlarged characters.
In the case of this example, the character shifts to the outside of the character frame 200 due to the shift of the writing position of the character, and a part of the character protrudes. In such a case, the user uses the key input unit 110 to move or rotate the position of the character so that the character fits within the frame 200 as shown in FIG. 2B. Also, FIG.
When the character is largely out of the frame 202 as shown in (c), the key input unit 110 is used (for example, the cursor movement key is operated to position the cursor near the character, and the frame enlargement key is operated. ) Enlarge the frame and adjust so that the characters fit within the frame as shown in FIG. Although the character position is moved using the key input unit 110 in the embodiment, the present invention is not limited to this, and the character position may be moved using a pointing device such as a mouse. Further, the adjustment of the character pattern is not limited to the above example, and processing such as thinning and interpolation can be performed. The adjusted character pattern is output to the characteristic extraction unit 102 as an additional registration candidate character, and the characteristic extraction unit 102 creates characteristic data of the additional registration candidate character and outputs it to the additional registration determination unit 107. The additional registration determination unit 107 uses the feature data of the additional registration candidate characters output from the feature extraction unit 102 and the feature data stored in the dictionary 106 to add the additional registration candidate character dictionary 6
It is determined whether registration to 13 is possible. Then, the additional registration determination unit 107 outputs the determination result to the dictionary addition processing unit 108 and the control unit 10.
5 is output. When the additional registration determination unit 107 determines that registration is possible, the dictionary addition processing unit 108 adds the feature code and character code of the additional registration candidate character as a dictionary element to the additional dictionary 6
13 is additionally registered, and the display unit 109 displays a registration completion message. When the additional registration determination unit 107 determines that registration is impossible, the control unit 105 displays a message (forced additional registration selection message) on the display unit 109 asking whether the forced additional registration is possible. When the forced additional registration selection message is displayed, the user uses the key input unit 110 to indicate that the forced additional registration is possible (for example, “Ye”).
s ") or a code indicating that forced additional registration is not possible (for example," No "). When the input code from the key input unit 110 is a code indicating that forced additional registration is possible, the control unit 105 outputs a dictionary. The additional registration permission signal is output to the additional processing unit 108, and the dictionary addition processing unit 108 receives the additional registration permission signal and additionally registers the feature data and the character code of the additional registration candidate character as a dictionary element.

【0026】次に追加辞書613及び辞書606の関係
について述べる。追加辞書613は例えば利用者単位で
管理可能であり辞書編集部611により追加辞書613
のなかから利用者単位の辞書要素を選択し標準辞書61
2と併せて辞書106へ格納される。なお、辞書編集部
611では利用者単位の追加辞書のなかで更に追加登録
した辞書の個別選択ができる。従って利用者は追加登録
した文字の中から認識させたい文字を選択すればよい。
図7(a)は利用者単位の辞書の選択テーブルの例であ
り、図7(b)は利用者単位に選択した辞書内の個々の
辞書要素の例であり、図7(a)で、利用者はキー入力
部110或いはポインティングデバイスを用いて出力部
109に表示された選択テーブルから所望の辞書名を選
択する。次に、利用者は表示部109に表示された辞書
要素の属性701〜704(図7(b)参照)を見て使
用する辞書要素をキー入力部110或いはポインティン
グデバイスを用いて選択すればよい。ここで、辞書要素
の属性とは、例えば、文字パターン、その辞書要素を現
在使用中であるか否か(状態フラグ等であらわす)、強
制追加登録した辞書要素か否か(登録種別フラグ等であ
らわす)等をいう。
Next, the relationship between the additional dictionary 613 and the dictionary 606 will be described. The additional dictionary 613 can be managed, for example, on a user-by-user basis, and the dictionary editing unit 611 allows the additional dictionary 613 to be managed.
Select the dictionary element for each user from among the standard dictionary 61
It is stored in the dictionary 106 together with 2. In the dictionary editing unit 611, it is possible to individually select the additionally registered dictionary among the additional dictionaries for each user. Therefore, the user may select a character to be recognized from the additionally registered characters.
FIG. 7A is an example of a dictionary selection table for each user, and FIG. 7B is an example of individual dictionary elements in the dictionary selected for each user. The user uses the key input unit 110 or the pointing device to select a desired dictionary name from the selection table displayed on the output unit 109. Next, the user may use the key input unit 110 or the pointing device to select the dictionary element to be used by looking at the attributes 701 to 704 (see FIG. 7B) of the dictionary element displayed on the display unit 109. . Here, the dictionary element attribute is, for example, a character pattern, whether the dictionary element is currently in use (represented by a status flag or the like), or whether the dictionary element is forcibly additionally registered (registration type flag or the like). Representation) etc.

【0027】[0027]

【発明の効果】以上説明したように本発明の文字認識装
置によれば、追加辞書を作成する場合に文字枠等原稿上
の所定位置範囲内からずれた文字の登録が可能となる。
また、本発明の文字認識装置は(追加登録機能への切換
えをすることなく)認識機能と共に追加登録機能が機能
し、辞書(標準辞書及び追加登録機能の動作時にある追
加辞書を含む)による認識不能文字の追加辞書への登録
の可否を自動的に判定するので、従来の文字認識装置の
ように認識不能文字の追加辞書への登録の可否をオペレ
ータが判断する必要がないので、装置の稼動効率が向上
する。更に、認識不能文字の追加辞書への登録“否”の
文字に関しても一律的なリジェクトでなく、強制登録の
手段を備えたことにより、例えば、くせの強い文字を書
く個人毎の個別ファイル化ができる。
As described above, according to the character recognition apparatus of the present invention, when an additional dictionary is created, it is possible to register characters deviated from the predetermined position range on the original such as character frames.
In addition, the character recognition device of the present invention functions as an additional registration function together with the recognition function (without switching to the additional registration function), and recognizes with a dictionary (including a standard dictionary and an additional dictionary that is present when the additional registration function operates). Since it is automatically determined whether or not unrecognizable characters can be registered in the additional dictionary, it is not necessary for the operator to determine whether or not unrecognizable characters can be registered in the additional dictionary, unlike the conventional character recognition device. Efficiency is improved. Further, registration of unrecognizable characters in the additional dictionary is not a uniform reject for characters that are "not", but by providing a means for compulsory registration, for example, it is possible to create individual files for each person who writes characters with strong habits. it can.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に基づく文字認識装置の一実施例の構成
を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an embodiment of a character recognition device according to the present invention.

【図2】位置調整前・後の追加登録候補文字の表示例を
示す図である。
FIG. 2 is a diagram showing a display example of additional registration candidate characters before and after position adjustment.

【図3】本発明の文字認識装置における追加登録判定処
理を示すフローチャートである。
FIG. 3 is a flowchart showing an additional registration determination process in the character recognition device of the present invention.

【図4】辞書の一構成例を示す図である。FIG. 4 is a diagram showing a configuration example of a dictionary.

【図5】追加登録判定処理における類似度判定のための
追加登録候補文字の特徴データと辞書の特徴データとの
距離の算出結果を示す図である。
FIG. 5 is a diagram showing a calculation result of a distance between the feature data of the additional registration candidate character and the feature data of the dictionary for similarity determination in the additional registration determination processing.

【図6】本発明に基づく文字認識装置の他の実施例の構
成を示すブロック図である。
FIG. 6 is a block diagram showing the configuration of another embodiment of the character recognition device according to the present invention.

【図7】利用者単位の辞書の選択テーブル及び利用者単
位に選択した辞書内の個々の辞書要素の例を示す図であ
る。
FIG. 7 is a diagram showing a dictionary selection table for each user and an example of individual dictionary elements in the dictionary selected for each user.

【符号の説明】[Explanation of symbols]

10,60 文字認識装置 100 帳票 101 帳票入力部 102 特徴抽出部(特徴データ抽出手段) 103 識別部(識別手段、識別不能文字存在情報出力
手段) 104 画像メモリ 105 制御部 106 第1の辞書 107 追加登録判定部(追加登録判定手段) 108 辞書追加処理部(辞書追加処理手段) 109 表示部(画像表示手段、強制追加登録手段) 110 キー入力部(選択手段、画像調整手段、強制追
加登録手段) 611 辞書編集部(辞書編集手段) 612 標準辞書 613 追加辞書
10, 60 Character recognition device 100 Form 101 Form input unit 102 Feature extraction unit (feature data extraction unit) 103 Identification unit (identification unit, unidentifiable character presence information output unit) 104 Image memory 105 Control unit 106 First dictionary 107 Addition Registration determination unit (additional registration determination unit) 108 dictionary addition processing unit (dictionary addition processing unit) 109 display unit (image display unit, forced addition registration unit) 110 key input unit (selection unit, image adjustment unit, forced addition registration unit) 611 dictionary editing unit (dictionary editing means) 612 standard dictionary 613 additional dictionary

───────────────────────────────────────────────────── フロントページの続き (72)発明者 勝毛 孝志 北海道江別市西野幌120番5 株式会社日 本デジタル研究所内 (72)発明者 小澤 和男 北海道江別市西野幌120番5 株式会社日 本デジタル研究所内 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Takashi Katsushi 120-5 Nishinoboro, Ebetsu-shi, Hokkaido Inside Nihon Digital Research Institute (72) Inventor Kazuo Ozawa 120-5 Nishinoboro, Ebetsu-shi, Hokkaido Nihon Digital Co., Ltd. In the laboratory

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 文字パターンの特徴データと該文字パタ
ーンに対応するカテゴリ名を含む辞書要素を格納した第
1の辞書を備えた文字認識装置であって、 入力した文字を前記第1の辞書に基づいて識別する識別
手段と、 前記識別手段による識別の結果、識別不能文字がある場
合に識別不能文字情報を出力する識別不能文字存在情報
出力手段と、 識別不能文字存在情報出力手段からの識別不能文字情報
を検知して少なくとも該識別不能文字パターンを表示す
る表示手段と、 前記表示手段により表示された文字パターンの中から任
意の文字パターンを選択する選択手段と、 前記選択された文字パターンの大きさ及び/または該文
字パターンの位置を調整して調整後の文字パターンを表
示する調整手段と、 前記調整された文字パターンを追加登録候補文字として
該文字パターンから特徴データを抽出する特徴データ抽
出手段と、 前記追加登録候補文字の文字パターンから抽出された特
徴データと前記第1の辞書に登録されている特徴データ
に基づいて追加登録候補文字の前記第1の辞書への追加
登録の可否を判定する追加登録判定手段と、 前記追加登録判定手段による判定結果が登録可であると
き、追加登録候補文字の特徴データとカテゴリ名を含む
辞書要素を前記第1の辞書に追加登録する辞書追加処理
手段と、を有することを特徴とする文字認識装置。
1. A character recognition device comprising a first dictionary storing dictionary data including character pattern feature data and category names corresponding to the character pattern, wherein input characters are stored in the first dictionary. Based on the identification means, based on the result of the identification by the identification means, if there is an unidentifiable character, the unidentifiable character presence information output means for outputting the unidentifiable character information, and the unidentifiable character presence information output means unidentifiable Display means for detecting at least the unidentifiable character pattern by detecting character information, selecting means for selecting an arbitrary character pattern from the character patterns displayed by the display means, and size of the selected character pattern. And / or adjusting means for adjusting the position of the character pattern to display the adjusted character pattern, and additionally registering the adjusted character pattern. Feature data extracting means for extracting feature data from the character pattern as a candidate character; additional registration based on the feature data extracted from the character pattern of the additional registration candidate character and the feature data registered in the first dictionary. Additional registration determining means for determining whether or not the additional registration of the candidate character in the first dictionary is possible, and when the determination result by the additional registration determining means is registerable, the characteristic data of the additional registration candidate character and the category name are included. A character recognition device, further comprising dictionary addition processing means for additionally registering a dictionary element in the first dictionary.
【請求項2】 請求項1記載の文字認識装置において、
識別不能文字の文字パターンと共に文字枠が表示手段に
より表示されるとき、調整手段が、更に、文字枠の大き
さを調整すると共に調整後の文字パターンを調整された
文字枠内に収める手段を有することを特徴とする文字認
識装置。
2. The character recognition device according to claim 1, wherein
When the character box is displayed by the display means together with the character pattern of the unidentifiable character, the adjusting means further has means for adjusting the size of the character box and for storing the adjusted character pattern in the adjusted character frame. A character recognition device characterized by the above.
【請求項3】 請求項1記載の文字認識装置において、
追加登録判定手段による判定結果が登録不可であると
き、登録不可と判定された追加登録候補文字について更
に該追加登録候補文字の特徴データとカテゴリ名を含む
辞書要素の第1の辞書への登録を可能とする強制追加登
録手段を有することを特徴とする文字認識装置。
3. The character recognition device according to claim 1, wherein
When the result of the determination by the additional registration determining means is that registration is not possible, for the additional registration candidate character that is determined to be unregisterable, the dictionary element including the characteristic data of the additional registration candidate character and the category name is further registered in the first dictionary. A character recognition device having a forced additional registration means that enables the character recognition device.
【請求項4】 請求項1記載の文字認識装置において、
更に、標準的な辞書要素を格納した標準辞書と、追加登
録された辞書要素を格納した追加辞書を備え、 追加登録判定手段が、追加登録候補文字の文字パターン
から抽出された特徴データと前記標準辞書に登録されて
いる特徴データに基づいて追加登録候補文字の前記追加
辞書への追加登録の可否を判定する手段であり、 辞書追加処理手段が、前記追加登録判定手段による判定
結果が登録可であるとき、追加登録候補文字の特徴デー
タとカテゴリ名を含む辞書要素を前記追加辞書に追加登
録する手段であり、更に、 前記追加辞書から個人単位に辞書要素を選択抽出して、
前記標準辞書の辞書要素と共に第1の辞書に格納する辞
書編集手段を有することを特徴とする文字認識装置。
4. The character recognition device according to claim 1,
Further, a standard dictionary that stores standard dictionary elements and an additional dictionary that stores the additionally registered dictionary elements are provided, and the additional registration determination means includes the characteristic data extracted from the character pattern of the additional registration candidate character and the standard. Means for determining whether or not additional registration candidate characters can be additionally registered in the additional dictionary based on the feature data registered in the dictionary, and the dictionary addition processing means can register the determination result by the additional registration determination means. At some time, it is a means for additionally registering a dictionary element including the feature data of the additional registration candidate character and the category name in the additional dictionary, and further selecting and extracting the dictionary element for each individual from the additional dictionary,
A character recognition device having dictionary editing means for storing the dictionary elements of the standard dictionary in a first dictionary.
【請求項5】 請求項4記載の文字認識装置において、
追加登録判定手段による判定結果が登録不可であると
き、登録不可と判定された追加登録候補文字について更
に該追加登録候補文字の特徴データとカテゴリ名を含む
辞書要素の追加辞書への登録を可能とする強制追加登録
手段を有することを特徴とする文字認識装置。
5. The character recognition device according to claim 4,
When the result of determination by the additional registration determining means is unregisterable, it is possible to further register a dictionary element including the feature data and category name of the additional registration candidate character determined to be unregisterable in the additional dictionary. A character recognition device having a forced additional registration means for performing.
【請求項6】 請求項1ないし3項のいずれか1項に記
載の文字認識装置において、追加登録判定手段が下記ス
テップからなることを特徴とする文字認識装置。 (1) 追加登録文字候補の特徴データと第1の辞書の
各辞書要素の特徴データとの距離をそれぞれ求める。 (2) 上記ステップ(1)で得られた各要素の距離の
うち追加登録文字と同じカテゴリで最も近い距離を第1
の距離として選択する。 (3) 上記ステップ(1)で得られた各要素の距離の
うちからステップ(2)で選択した第1の距離を除いた
距離の平均を第2の距離として求める。 (4) 前記第1の距離の閾値を第1の閾値、前記第2
の距離の閾値を第2の閾値とするとき、第1の距離が第
1の閾値より近く第2の距離が第2の閾値より遠い場合
にのみ、追加登録候補文字の特徴データとカテゴリ名を
含む辞書要素の第1の辞書への追加登録が可能と判定す
る。
6. The character recognition device according to any one of claims 1 to 3, wherein the additional registration determination means comprises the following steps. (1) The distances between the feature data of the additionally registered character candidates and the feature data of each dictionary element of the first dictionary are obtained. (2) Of the distances of the respective elements obtained in the above step (1), the closest distance in the same category as the additionally registered character is first.
Select as the distance. (3) From the distances of the respective elements obtained in step (1) above, the average of the distances excluding the first distance selected in step (2) is obtained as the second distance. (4) The threshold of the first distance is the first threshold, and the second
When the second distance threshold is set as the second threshold, the feature data of the additional registration candidate character and the category name are set only when the first distance is closer than the first threshold and the second distance is farther than the second threshold. It is determined that the dictionary element including the dictionary element can be additionally registered in the first dictionary.
【請求項7】 請求項4または5項に記載の文字認識装
置において、追加登録判定手段が下記ステップからなる
ことを特徴とする文字認識装置。 (1) 追加登録文字候補の特徴データと標準辞書及び
追加辞書の各辞書要素の特徴データとの距離をそれぞれ
求める。 (2) 上記ステップ(1)で得られた各要素の距離の
うち追加登録文字と同じカテゴリで最も近い距離を第1
の距離として選択する。 (3) 上記ステップ(1)で得られた各要素の距離の
うちからステップ(2)で選択した第1の距離を除いた
距離の平均を第2の距離として求める。 (4) 前記第1の距離の閾値を第1の閾値、前記第2
の距離の閾値を第2の閾値とするとき、第1の距離が第
1の閾値より近く第2の距離が第2の閾値より遠い場合
にのみ、追加登録候補文字の特徴データとカテゴリ名を
含む辞書要素の追加辞書への追加登録が可能と判定す
る。
7. The character recognition device according to claim 4 or 5, wherein the additional registration determination means comprises the following steps. (1) The distances between the feature data of the additionally registered character candidates and the feature data of each dictionary element of the standard dictionary and the additional dictionary are respectively obtained. (2) Of the distances of the respective elements obtained in the above step (1), the closest distance in the same category as the additionally registered character is first.
Select as the distance. (3) From the distances of the respective elements obtained in step (1) above, the average of the distances excluding the first distance selected in step (2) is obtained as the second distance. (4) The threshold of the first distance is the first threshold, and the second
When the second distance threshold is set as the second threshold, the feature data of the additional registration candidate character and the category name are set only when the first distance is closer than the first threshold and the second distance is farther than the second threshold. It is determined that the dictionary element including the dictionary element can be additionally registered in the additional dictionary.
JP6261935A 1994-09-30 1994-09-30 Character recognizing device Pending JPH08101894A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6261935A JPH08101894A (en) 1994-09-30 1994-09-30 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6261935A JPH08101894A (en) 1994-09-30 1994-09-30 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH08101894A true JPH08101894A (en) 1996-04-16

Family

ID=17368737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6261935A Pending JPH08101894A (en) 1994-09-30 1994-09-30 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH08101894A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4734771B2 (en) * 2001-06-12 2011-07-27 ソニー株式会社 Information extraction apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4734771B2 (en) * 2001-06-12 2011-07-27 ソニー株式会社 Information extraction apparatus and method

Similar Documents

Publication Publication Date Title
KR100219786B1 (en) Method of registering a character pattern into a user dictionary and character recognition apparatus having the user dictionary
JP3469345B2 (en) Image filing apparatus and filing method
US20140067631A1 (en) Systems and Methods for Processing Structured Data from a Document Image
US8015203B2 (en) Document recognizing apparatus and method
US20070098263A1 (en) Data entry apparatus and program therefor
KR100412317B1 (en) Character recognizing/correcting system
JP3294995B2 (en) Form reader
CN103838566A (en) Information processing device, and information processing method
JP2007317022A (en) Handwritten character processor and method for processing handwritten character
US6421461B1 (en) Pattern recognition apparatus which compares input pattern feature and size data to registered feature and size pattern data, an apparatus for registering feature and size data, and corresponding methods and memory media therefor
US6035062A (en) Character recognition method and apparatus
JP2001350396A (en) Device and method for teaching writing order and number of strokes and recording medium including the method
JPH08101894A (en) Character recognizing device
JP2003346080A (en) Character recognition method
JP3930466B2 (en) Character recognition device, character recognition program
JPH10177623A (en) Document recognizing device and language processor
US6636636B1 (en) Character recognizing apparatus, method, and storage medium
JP7404625B2 (en) Information processing device and program
JPH10162101A (en) Device and method for recognizing handwritten character
JPH0651900A (en) On-line character input device
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JPH06251187A (en) Method and device for correcting character recognition error
JPH11126236A (en) Device and method for on-line handwritten character recognition, and recording medium where the same method is recorded
JPH09223197A (en) Character recognition device
JP3668657B2 (en) Pattern recognition device and method, pattern registration device and method

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040608

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040608