JPH0488591A - Dictionary preparing method - Google Patents

Dictionary preparing method

Info

Publication number
JPH0488591A
JPH0488591A JP2204838A JP20483890A JPH0488591A JP H0488591 A JPH0488591 A JP H0488591A JP 2204838 A JP2204838 A JP 2204838A JP 20483890 A JP20483890 A JP 20483890A JP H0488591 A JPH0488591 A JP H0488591A
Authority
JP
Japan
Prior art keywords
dictionary
templates
pattern
standard pattern
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2204838A
Other languages
Japanese (ja)
Other versions
JP2991750B2 (en
Inventor
Kenji Fukumizu
健次 福水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2204838A priority Critical patent/JP2991750B2/en
Publication of JPH0488591A publication Critical patent/JPH0488591A/en
Application granted granted Critical
Publication of JP2991750B2 publication Critical patent/JP2991750B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To change the number of dictionary templates corresponding to a feature pattern by providing a step for generating a standard pattern, step for evaluating the distributing condition of feature patterns and step for deciding the number of dictionary templates in the standard pattern, etc. CONSTITUTION:A clustering part 2 is provided to execute clustering into one or two clusters, a standard pattern preparation part 3 an evaluated value calculation part 5 to calculate an evaluated value, a dictionary template number selection part 5 to select the number of dictionary templates in the standard pattern are provided. The feature pattern of an input character is classified into plural clusters, and the standard pattern is generated from the representative vector of each classified cluster. On the other hand, the condition of distributing the feature patterns of the input character is evaluated and according to the evaluated value, the number of dictionary templates in the standard pattern is decided to the input character. Thus, within the range of a prescribed dictionary size, the number of dictionary templates can be changed corresponding to the feature pattern.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、パターン辞書とのマツチング距離によって文
字認識あるいは音声認識を行うパターン認識装置におい
て、所定の辞書サイズの範囲内で効果的な辞書テンプレ
ート数で構成される辞書作成方法に関する。
Detailed Description of the Invention [Field of Industrial Application] The present invention provides a dictionary template that is effective within a predetermined dictionary size range in a pattern recognition device that performs character recognition or speech recognition based on matching distance with a pattern dictionary. Concerning a method for creating a dictionary composed of numbers.

〔従来技術〕[Prior art]

従来のパターン辞書は、認識すべき対象パターンが同一
カテゴリ内にあっても、雑音等の影響によってパターン
にバラツキが生ずるため、通常パターン辞書のテンプレ
ートを複数個備えている。
Conventional pattern dictionaries usually include a plurality of pattern dictionary templates because even if target patterns to be recognized are in the same category, variations occur in the patterns due to the influence of noise and the like.

特に、活字文字認識においては、文字のフォントによる
形状の違いがはっきりしているので、各フォント毎に辞
書テンプレートを設けている。
Particularly in printed character recognition, since there are clear differences in the shapes of characters depending on the font, a dictionary template is provided for each font.

なお、この種の関連する技術として、多数の特徴パター
ンをグループ化してグループを代表する特徴パターンを
標準パターンとする標準パターン作成装置(特開昭59
−163680号公報)がある。
As a related technology of this type, there is a standard pattern creation device (Japanese Patent Laid-Open No. 59-1992) which groups a large number of characteristic patterns and uses a characteristic pattern representing the group as a standard pattern.
-163680).

[発明が解決しようとする課題] しかしながら、上記した技術では辞書サイズが大きくな
り、認識処理速度が遅くなるという問題があり、特に辞
書テンプレートの総数を所定の範囲に抑えつつ最も少な
いテンプレート数で種々のフォントを!8識するための
辞書の構成について、考慮されていなかった。
[Problems to be Solved by the Invention] However, the above technology has the problem that the dictionary size becomes large and the recognition processing speed becomes slow.In particular, it is possible to keep the total number of dictionary templates within a predetermined range and to use the smallest number of templates. font! 8. No consideration was given to the structure of the dictionary for understanding.

本発明の目的は、所定の辞書サイズの範囲内で、特徴パ
ターンに対応して辞書テンプレート数を変化させること
ができる辞書作成方法を提供することにある。
An object of the present invention is to provide a dictionary creation method that can change the number of dictionary templates according to characteristic patterns within a predetermined dictionary size range.

〔課題を解決するための手段〕[Means to solve the problem]

前記目的を達成するために、本発明の辞書作成方法は、
入力文字の特徴パターンを複数のクラスタに分類するス
テップと、前記分類された各クラスタの代表ベクトルか
ら標準パターンを生成するステップと、前記入力文字の
特徴パターンの分布状況を評価するステップと、前記評
価ステップによって評価された値によって、前記入力文
字に対する標準パターンの辞書テンプレート数を決定す
るステップからなる。本発明の他の実施例では、前記評
価ステップで更に文字の出現頻度を評価している。
In order to achieve the above object, the dictionary creation method of the present invention includes:
a step of classifying the characteristic pattern of the input character into a plurality of clusters, a step of generating a standard pattern from a representative vector of each of the classified clusters, a step of evaluating the distribution status of the characteristic pattern of the input character, and the evaluation. The method comprises the step of determining the number of dictionary templates of standard patterns for the input characters according to the values evaluated in the step. In another embodiment of the present invention, the frequency of appearance of characters is further evaluated in the evaluation step.

[作 用] 複数の文字画像データから特徴量を抽出し、N次元の特
徴ベクトルを得、クラスタリング部において、該複数の
特徴ベクトルをクラスタリングする。このようにクラス
タリングされた1個のクラスタをJ、2個のクラスタを
K 、 K、とする。標準パターン作成部では、J、に
、、K、の各クラスタについて、そのクラスタを代表す
るベクトルを計算し、この代表するベクトル、例えばク
ラスタ内の平均ベクトルを標準パターンとして標準パタ
ーン保持部に登録する。そして、評価値計算部では、任
意の文字の特徴ベクトルがどの程度2つのクラスタに分
かれているかの尺度を表す評価値を算出し、その結果を
評価値保持部に登録し、辞書テンプレート数選択部は評
価値保持部に登録されている全ての文字の評価値を読み
だして、その評価値の小さい文字から21種類までの文
字に対しては辞書テンプレート数を1個にし、残りのP
[Operation] Feature quantities are extracted from a plurality of character image data to obtain N-dimensional feature vectors, and the plurality of feature vectors are clustered in a clustering section. Let J be one cluster clustered in this way, and let K be two clusters. The standard pattern creation unit calculates a representative vector for each cluster of J, , , K, and registers this representative vector, for example, the average vector within the cluster, as a standard pattern in the standard pattern holding unit. . Then, the evaluation value calculation section calculates an evaluation value representing the degree to which the feature vector of an arbitrary character is divided into two clusters, registers the result in the evaluation value storage section, and registers the result in the dictionary template number selection section. reads the evaluation values of all the characters registered in the evaluation value holding section, sets the number of dictionary templates to one for the characters with the lowest evaluation value up to 21 types, and uses the remaining P
.

種類の文字については、辞書テンプレート数を2個にす
る。
For type characters, the number of dictionary templates is set to two.

[実施例] 以下、本発明の一実施例を図面を用いて具体的に説明す
る。
[Example] Hereinafter, an example of the present invention will be specifically described using the drawings.

第1図は、本発明の辞書作成装置のブロック構成図を示
す。図において、1は辞書作成用の画像データから特徴
を抽出する特徴抽出部で、2は抽出された複数の特徴ベ
クトルを1個あるいは2個のクラスタにクラスタリング
するクラスタリング部である。3は各クラスタ内の平均
ベクトルを算出することによって標準パターンを作成す
る標準パターン作成部であり、4は該標準パターン作成
部で作成された標準パターンを保持する標準パターン保
持部、5は任意の文字の特徴ベクトルがどの程度2つの
クラスタに分かれているかの尺度を表す評価値を算出す
る評価値計算部、6はその評価値を保持する評価値保持
部、7は評価値保持部6から読み出された評価値に従っ
て、標準パターン保持部に保持された標準パターンの辞
書テンプレート数を選択する辞書テンプレート数選択部
、8は該選択部で選択されたテンプレート数で構成され
たパターン辞書である。
FIG. 1 shows a block diagram of a dictionary creation device according to the present invention. In the figure, 1 is a feature extraction unit that extracts features from image data for dictionary creation, and 2 is a clustering unit that clusters a plurality of extracted feature vectors into one or two clusters. 3 is a standard pattern creation unit that creates a standard pattern by calculating the average vector within each cluster; 4 is a standard pattern holding unit that holds the standard pattern created by the standard pattern creation unit; and 5 is an arbitrary An evaluation value calculation unit that calculates an evaluation value representing a measure of how much the character feature vector is divided into two clusters, 6 an evaluation value holding unit that holds the evaluation value, and 7 reading from the evaluation value holding unit 6. A dictionary template number selection section 8 selects the number of dictionary templates of the standard pattern held in the standard pattern holding section according to the evaluation value provided, and reference numeral 8 represents a pattern dictionary constituted by the number of templates selected by the selection section.

第2図は、本発明の辞書作成動作を説明するためのフロ
ーチャートである。このフローチャートを参照しつつ、
以下本発明の動作を詳細に説明すると、今、各文字の辞
書テンプレート(辞書の特徴パターン)数が1個の辞書
テンプレートからなる文字と、2個の辞書テンプレート
とからなる文字によってパターン辞書を作成すると仮定
し、1個の辞書テンプレートからなる文字を21種類、
2個の辞書テンプレートとからなる文字をP1種類作成
するとき、処理速度の関係から決まるパターン辞書の総
テンプレート数の上限数をTとする。
FIG. 2 is a flowchart for explaining the dictionary creation operation of the present invention. While referring to this flowchart,
To explain the operation of the present invention in detail below, a pattern dictionary is now created using a character whose dictionary template (characteristic pattern of the dictionary) of each character is one dictionary template and a character which is composed of two dictionary templates. Assuming that, there are 21 types of characters in one dictionary template,
When creating P1 types of characters consisting of two dictionary templates, let T be the upper limit of the total number of templates in the pattern dictionary determined from the relationship of processing speed.

また、辞書に登録する字種の数を0個(P、 + P、
)とすると、T=P、+2P、、P、=2C−T。
Also, set the number of character types to be registered in the dictionary to 0 (P, + P,
), then T=P,+2P,,P,=2C-T.

P、=T−C,(CAT<2C)が成立するが、0個の
字種をどのようにして効果的に23種と23種に割り当
てるかを、以下に説明する。
P,=TC,(CAT<2C) holds, but how to effectively allocate 0 character types to 23 types and 23 types will be explained below.

各文字毎に複数の画像データを用意し、特徴抽出部1に
おいて特徴量を抽出し、N次元の特徴ベクトルを得る(
ステップ20)、クラスタリング部2は、複数の特徴ベ
クトルからパターンの塊すなわちクラスタを見つけるこ
とにより、類似した特徴を持つパターンを1つのクラス
として認識し、1個のクラスタと2個のクラスタとに分
類(クラスタリング)する(ステップ21)。このクラ
スタリングの方法としては、例えばに−meanクラス
タリング等の非階層的クラスタリング、あるいは重心法
、Ward法等の階層的クラスタリング法がある。この
ようにクラスタリングされた1個のクラスタをJ (デ
ータ全体)、2個のクラスタをに1、Klとする。第3
図(a)は、1個のクラスタJを表現した図で、各点が
特徴空間における特徴ベクトルを表し、類似した特徴量
を持った点が特徴空間上で塊を形成している。第3図(
b)は、2個のクラスタに1、K、を表現した図で、特
徴空間が2つのカテゴリに分類されている。
Prepare a plurality of image data for each character, extract the feature amount in the feature extraction unit 1, and obtain an N-dimensional feature vector (
Step 20) The clustering unit 2 recognizes patterns with similar features as one class by finding clusters of patterns from a plurality of feature vectors, and classifies them into one cluster and two clusters. (clustering) (step 21). Examples of this clustering method include non-hierarchical clustering such as -mean clustering, and hierarchical clustering methods such as centroid method and Ward method. Let one cluster thus clustered be J (the entire data), and two clusters be 1 and Kl. Third
Figure (a) is a diagram expressing one cluster J, where each point represents a feature vector in the feature space, and points with similar feature amounts form a cluster in the feature space. Figure 3 (
b) is a diagram expressing 1 and K in two clusters, and the feature space is classified into two categories.

標準パターン作成部3では、J、に、、K、の各クラス
タについて、そのクラスタを代表するベクトルを計算す
る。この代表するベクトルとしては、例えばクラスタ内
の平均ベクトルを用いる(ステップ22)。これらの平
均ベクトルを標準パターンとして標準パターン保持部4
に登録する(ステップ23)。
The standard pattern creation unit 3 calculates a vector representing each cluster of J, , , K. As this representative vector, for example, the average vector within the cluster is used (step 22). The standard pattern holding unit 4 uses these average vectors as a standard pattern.
(Step 23).

次いで、評価値計算部5は、任意の文字の特徴ベクトル
がどの程度2つのクラスタに分かれているかの尺度を表
す評価値δを次式によって算出する。
Next, the evaluation value calculation unit 5 calculates an evaluation value δ representing a measure of how much the feature vector of an arbitrary character is divided into two clusters using the following equation.

δ=b−(a、+a、) ここで、al、a、はクラスタが2個の場合、各クラス
タにおける分散を表し、bはクラスタが1個の場合の分
散を表す。すなわち、第4図において、2つのクラスタ
に1、K、に分かれている場合は、クラスタに1の平均
を42の点とすると分散81は、クラスタに、の平均4
2からクラスタK。
δ=b−(a,+a,) Here, al and a represent the variance in each cluster when there are two clusters, and b represents the variance when there is one cluster. That is, in Fig. 4, if the cluster is divided into two clusters, 1, K, and the average of 1 in the cluster is 42 points, then the variance 81 is the average of 4 in the cluster.
2 to cluster K.

内のある特徴ベクトルまでの距離の2乗を、クラスタに
内の全ての特徴ベクトルについて加算したものであり、
クラスタに、についても同様にその分散a、が算出され
る。分散すは、クラスタに1、K、の平均を41の点と
すると、平均41から任意の特徴ベクトルまでの距離の
2乗を、クラスタに3、K、内の全ての特徴ベクトルに
ついて加算することによって算出される。このことから
、2つのクラスタが離れているほどbの値が大きく、つ
まり評価値δが大きくなり、他方2つのクラスタが接近
すればするほど評価値δが小さくなる。
It is the sum of the square of the distance to a certain feature vector in the cluster for all feature vectors in the cluster,
Similarly, the variance a is calculated for the cluster. If the average of 1,K,in a cluster is 41 points, the distribution is,add the square of the distance from the average 41 to any,feature vector for all feature vectors in 3,K,in a cluster. Calculated by From this, the farther two clusters are apart, the larger the value of b, that is, the larger the evaluation value δ, and the closer the two clusters are, the smaller the evaluation value δ becomes.

各文字毎に評価値を計算しくステップ24)、その結果
を評価値保持部6に登録する。以上の処理を全ての文字
に対して行う(ステップ25)。
An evaluation value is calculated for each character (step 24), and the result is registered in the evaluation value holding section 6. The above processing is performed for all characters (step 25).

次いで、辞書テンプレート数選択部7は評価値保持部6
に登録されている全ての文字の評価値を読みだして、そ
の評価値の小さいものから順にソートする(ステップ2
6)。そして、評価値の小さい文字から21種類までの
文字に対しては辞書テンプレート数を1個にし、該文字
に対応する標準パターンを標準パターン保持部4のクラ
スタJから読みだして、辞書テンプレートとして登録す
る(ステップ27.28)。残りの23種類の文字につ
いては、辞書テンプレート数を2個にし、標準パターン
保持部4のクラスタに1、K、から標準パターンを読み
だして、辞書テンプレートとして登録する(ステップ2
7.29)。
Next, the dictionary template number selection section 7 selects the number of dictionary templates from the evaluation value holding section 6.
Read the evaluation values of all characters registered in , and sort them in descending order of evaluation value (Step 2
6). Then, the number of dictionary templates is set to one for characters with the lowest evaluation value to 21 types, and the standard pattern corresponding to the character is read from the cluster J of the standard pattern holding unit 4 and registered as a dictionary template. (steps 27.28). For the remaining 23 types of characters, the number of dictionary templates is set to 2, standard patterns are read from clusters 1 and K in the standard pattern holding unit 4, and registered as dictionary templates (step 2).
7.29).

第5図は、本発明の他の実施例のブロック構成図で、先
の実施例の構成に出現頻度保持部9を付加したものであ
る。他の構成要素は前述したものと同様であるので、説
明を省略する。
FIG. 5 is a block diagram of another embodiment of the present invention, in which an appearance frequency holding section 9 is added to the structure of the previous embodiment. The other components are the same as those described above, so their explanation will be omitted.

この実施例では、評価値保持部6から読みだした値と出
現頻度保持部9から読みだされた出現頻度とを用いて、
その文字についての新たな評価値を評価値計算部5で計
算するようにしたものである。ここでいう出現頻度とは
、実際の文書等においてその文字が統計的にどの程度の
割合で出現するかを表した量であって、例えば出現頻度
Hが0から10までの整数値で与えられ、その値が大き
いほど出現頻度が大きいものとすると、新しい評価値μ
として次の式を用いる。
In this embodiment, using the value read from the evaluation value holding unit 6 and the appearance frequency read from the appearance frequency holding unit 9,
The new evaluation value for that character is calculated by the evaluation value calculation section 5. The frequency of appearance here refers to the amount that represents the statistical rate at which a character appears in an actual document, etc. For example, the frequency of appearance H is given as an integer value from 0 to 10. , the larger the value, the greater the appearance frequency, then the new evaluation value μ
The following formula is used as

μ=α・δ+β・H ただし、α、βはパラメータである。μ=α・δ+β・H However, α and β are parameters.

第6図は、第2の実施例の動作を説明するためのフロー
チャートである。先の実施例の動作と相違する点は、ス
テップ25と26の間に、出現頻度Hと評価値δから新
しい評価値μを算出するステップが加わった点であり、
他のステップは全く同様であるので、その動作説明を省
略する。
FIG. 6 is a flowchart for explaining the operation of the second embodiment. The difference from the operation of the previous embodiment is that a step of calculating a new evaluation value μ from the appearance frequency H and the evaluation value δ is added between steps 25 and 26.
Since the other steps are exactly the same, the explanation of their operation will be omitted.

以上の処理では、各文字の辞書テンプレートが2種類(
1個の辞書テンプレートと、2個の辞書テンプレート)
の場合について説明したが、これを3種類以上にした場
合でも同様にして処理できる。各文字が3種類の辞書テ
ンプレート(1個の辞書テンプレートと、2個の辞書テ
ンプレートと、3個の辞書テンプレート)で構成される
場合は以下のようになる。
In the above process, there are two types of dictionary templates for each character (
1 dictionary template and 2 dictionary templates)
Although the above case has been described, even if there are three or more types, the same process can be performed. If each character is composed of three types of dictionary templates (one dictionary template, two dictionary templates, and three dictionary templates), the following will occur.

辞書テンプレート数が1個である文字が21種類、辞書
テンプレート数が2個である文字が23種類、辞書テン
プレート数が3個である文字がP、種類となるようにパ
ターン辞書を作成すると仮定する。ここで、Pl、Pl
、P5は、P、+2P、+3P、=T、P、+P、+P
、=Cを満たすものとする。
Assume that a pattern dictionary is created such that there are 21 types of characters with 1 dictionary template, 23 types of characters with 2 dictionary templates, and P types of characters with 3 dictionary templates. . Here, Pl, Pl
, P5 is P, +2P, +3P, =T, P, +P, +P
, =C.

各文字について、3個のクラスタにクラスタリングした
結果をLl、Ll、Ll、2個のクラスタにクラスタリ
ングした結果をに1、K8.1個のクラスタにクラスタ
リングした結果をJとする。
For each character, the result of clustering into three clusters is Ll, Ll, Ll, the result of clustering into two clusters is 1, and the result of clustering into K8.1 clusters is J.

Li  (i=1,2.3)のクラスタ内分散をai、
K1のクラスタ内分散をbi、Jのクラスタ内分散をC
とすると、評価値δ1、δ、は次のようになる。
Let the intra-cluster variance of Li (i=1, 2.3) be ai,
Bi is the intra-cluster variance of K1, and C is the intra-cluster variance of J.
Then, the evaluation values δ1, δ are as follows.

δ、=Σbi−Σa 11 δ、=C−Σbi これらの計算結果を前述したと同様にして評価値保持部
に登録する。辞書テンプレート数選択部は、まず評価値
δ1の小さいものから順に21種類までの文字に対して
は辞書テンプレート数を1個にし、次に評価値δ1の小
さいものから順に28種類までの文字に対しては辞書テ
ンプレート数を2個にし、残りの21種類の文字を辞書
テンプレート数3個にする。
δ,=Σbi−Σa 11 δ,=C−Σbi These calculation results are registered in the evaluation value holding unit in the same manner as described above. The dictionary template number selection section first sets the number of dictionary templates to one for up to 21 types of characters in order from the smallest evaluation value δ1, and then sets the number of dictionary templates to one for up to 28 types of characters in order from the smallest evaluation value δ1. In this case, the number of dictionary templates is set to two, and the number of dictionary templates for the remaining 21 types of characters is set to three.

[発明の効果] 以上、説明したように、本発明によれば、特徴パターン
の分布状況あるいはカテゴリの出現頻度に応じて辞書テ
ンプレート数を変えることができるので、外界のパター
ン分布をより忠実にパターン辞書に反映することが可能
となり、認識率を格段に向上させることができる。
[Effects of the Invention] As explained above, according to the present invention, the number of dictionary templates can be changed depending on the distribution of feature patterns or the appearance frequency of categories, so pattern distribution in the external world can be more faithfully reproduced. This can be reflected in the dictionary, and the recognition rate can be significantly improved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の辞書作成装置のブロック構成図、第2
図は本発明の辞書作成動作を説明するためのフローチャ
ート、第3図(a)は1個のクラスタJを表現した図、
第3図(b)は2個のクラスタに、、 K、を表現した
図、第4図は2つのクラスタに1、K、に分かれている
場合の分散を説明するための図、第5図は本発明の他の
実施例のブロック構成図、第6図は第2の実施例の動作
を説明するためのフローチャートである。 1・・・特徴抽出部、  2・・・クラスタリング部、
3・・・標準パターン作成部、 4・・・標準パターン保持部、 5・・・評価値計算部、  6・・・評価値保持部、7
・・・辞書テンプレート数選択部、 8・・・パターン辞書、 9・・・出現頻度保持部。
FIG. 1 is a block diagram of the dictionary creation device of the present invention, and FIG.
The figure is a flowchart for explaining the dictionary creation operation of the present invention, FIG. 3(a) is a diagram expressing one cluster J,
Figure 3(b) is a diagram expressing K in two clusters, Figure 4 is a diagram to explain the variance when divided into two clusters, 1, K, and Figure 5. is a block diagram of another embodiment of the present invention, and FIG. 6 is a flowchart for explaining the operation of the second embodiment. 1...Feature extraction unit, 2...Clustering unit,
3... Standard pattern creation section, 4... Standard pattern holding section, 5... Evaluation value calculation section, 6... Evaluation value holding section, 7
... Dictionary template number selection section, 8. Pattern dictionary, 9. Appearance frequency holding section.

Claims (3)

【特許請求の範囲】[Claims] (1)パターン辞書を作成するパターン辞書作成方法に
おいて、入力文字の特徴パターンを複数のクラスタに分
類するステップと、前記分類された各クラスタの代表ベ
クトルから標準パターンを生成するステップと、前記入
力文字の特徴パターンの分布状況を評価するステップと
、前記評価ステップによって評価された値によって、前
記入力文字に対する標準パターンの辞書テンプレート数
を決定するステップを含むことを特徴とする辞書作成方
法。
(1) A pattern dictionary creation method for creating a pattern dictionary, which includes the steps of classifying characteristic patterns of input characters into a plurality of clusters, generating a standard pattern from representative vectors of each of the classified clusters, and 1. A dictionary creation method comprising: evaluating the distribution of feature patterns; and determining the number of standard pattern dictionary templates for the input characters based on the values evaluated in the evaluation step.
(2)前記評価ステップでは、更に文字の出現頻度を評
価することを特徴とする請求項1記載の辞書作成方法。
(2) The dictionary creation method according to claim 1, wherein in the evaluation step, the frequency of appearance of characters is further evaluated.
(3)前記決定された辞書テンプレートの総数は、予め
決められた上限数内にあることを特徴とする請求項1記
載の辞書作成方法。
(3) The dictionary creation method according to claim 1, wherein the total number of dictionary templates determined is within a predetermined upper limit number.
JP2204838A 1990-08-01 1990-08-01 Dictionary creation method Expired - Fee Related JP2991750B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2204838A JP2991750B2 (en) 1990-08-01 1990-08-01 Dictionary creation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2204838A JP2991750B2 (en) 1990-08-01 1990-08-01 Dictionary creation method

Publications (2)

Publication Number Publication Date
JPH0488591A true JPH0488591A (en) 1992-03-23
JP2991750B2 JP2991750B2 (en) 1999-12-20

Family

ID=16497228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2204838A Expired - Fee Related JP2991750B2 (en) 1990-08-01 1990-08-01 Dictionary creation method

Country Status (1)

Country Link
JP (1) JP2991750B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image
US6064769A (en) * 1995-04-21 2000-05-16 Nakao; Ichiro Character extraction apparatus, dictionary production apparatus and character recognition apparatus, using both apparatuses
US6141443A (en) * 1995-04-21 2000-10-31 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus, dictionary production apparatus, and character recognition apparatus using both apparatuses

Also Published As

Publication number Publication date
JP2991750B2 (en) 1999-12-20

Similar Documents

Publication Publication Date Title
Kraaijveld et al. A nonlinear projection method based on Kohonen's topology preserving maps
US5329596A (en) Automatic clustering method
Abe et al. A fuzzy classifier with ellipsoidal regions
EP1246124B1 (en) Image space display method and apparatus
CN111311702A (en) Image generation and identification module and method based on BlockGAN
CN113378842A (en) Recommendation method based on segmented image feature extraction
Kettaf et al. A comparison study of image segmentation by clustering techniques
Halgamuge Self-evolving neural networks for rule-based data processing
Hess et al. k is the magic number—inferring the number of clusters through nonparametric concentration inequalities
Sahbi et al. Coarse-to-fine support vector classifiers for face detection
CN107729918B (en) Classification method for cellular automaton emerging phenomenon based on cost-sensitive support vector machine
Forczmański et al. Comparative analysis of simple facial features extractors
CN110956177A (en) Hybrid verification code identification method and system
JPH0488591A (en) Dictionary preparing method
Qing et al. Histogram based fuzzy C-mean algorithm for image segmentation
Hwang et al. A fast image retrieval algorithm with automatically extracted discriminant features
Bharathi et al. Segregated handwritten character recognition using GLCM features
Weng et al. Recognition of hand signs from complex backgrounds
JP2890753B2 (en) Feature selection method
Majak et al. Rough Sets and Fuzzy Logic Approach for Handwritten Digits and Letters Recognition
Ramaraj et al. Design and Implementations of Color Pixel Based Image Segmentation using Enhanced Data Clustering Algorithms to Applying on Tiger Image Dataset
Mao et al. Unsupervised style classification of document page images
JP2792063B2 (en) Character recognition dictionary creation method
JP2728117B2 (en) Character recognition device
JP3017325B2 (en) How to create a dictionary for pattern recognition

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees