JPH0467277A - Pattern recognition dictionary generating device - Google Patents

Pattern recognition dictionary generating device

Info

Publication number
JPH0467277A
JPH0467277A JP2178880A JP17888090A JPH0467277A JP H0467277 A JPH0467277 A JP H0467277A JP 2178880 A JP2178880 A JP 2178880A JP 17888090 A JP17888090 A JP 17888090A JP H0467277 A JPH0467277 A JP H0467277A
Authority
JP
Japan
Prior art keywords
pattern
recognition
category
subcategory
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2178880A
Other languages
Japanese (ja)
Inventor
Toru Wakahara
若原 徹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2178880A priority Critical patent/JPH0467277A/en
Publication of JPH0467277A publication Critical patent/JPH0467277A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To easily execute the additional registration of a sub-category, while securing the improvement of a recognition rate by deciding the propriety of the additional registration to a recognition dictionary under the condition of a decrease of the number of erroneous recognition patterns. CONSTITUTION:By an erroneous recognition pattern classifying device 5, an erroneous recognition pattern assembly is classified into each separate assembly by combination of an exact category name and an erroneous recognition category name. From in the erroneous recognition pattern assembly being an assembly of the erroneous recognition category name classified in such a way, one piece each is registered temporarily in a recognition dictionary 2 as a sub- category candidate in a suitable sequence by a sub-category candidate selecting device 6. In the case the erroneous recognition pattern decreases as a whole, the sub-category candidate is registered additionally and formally to the recognition dictionary, and the erroneous recognition pattern assembly is updated. On the other hand, in the case the erroneous recognition pattern increases as a whole, with regard to the next sub-category candidate, as well, whether the number of erroneous recognition patterns decreases or not is decided in the same way.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はパターン認識辞書作成装置に係り、特に計算機
によるパターン認識、例えば文字/音声認識や画像認識
の分野において複数カテゴリ内での認識を各カテゴリの
代表パターンからのパターン間距離もしくは類似度の大
小によって行う際、サブカテゴリの追加登録により誤認
識パターン数が減少する条件を設けることにより認識率
の向上を補償するサブカテゴリ追加登録を与える汎用的
なパターン認識辞書作成装置に関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a pattern recognition dictionary creation device, and is particularly applicable to computer-based pattern recognition, such as recognition within multiple categories, in the field of character/speech recognition and image recognition. A general-purpose method that provides additional registration of subcategories that compensates for the improvement in recognition rate by setting a condition that the number of misrecognized patterns is reduced by additional registration of subcategories when performing the process based on the distance or similarity between patterns from the representative pattern of the category. The present invention relates to a pattern recognition dictionary creation device.

〔従来の技術〕[Conventional technology]

複数カテゴリ内でのパターン認識を計算機で行う場合、
カテゴリ間を識別する判定論理の組合せによる識別ツリ
ーを構成する方法や各カテコリの代表パターンからのバ
タ〜ン間距離もしくは類似度の大小により判定し、代表
パターン登録辞書によるパターンマツチング法か知られ
ている。
When performing pattern recognition within multiple categories using a computer,
A method of constructing an identification tree based on a combination of judgment logic for identifying between categories, or a pattern matching method using a representative pattern registration dictionary, in which judgment is made based on the distance or degree of similarity between patterns from the representative pattern of each category, are known. ing.

また、同一カテゴリ内の学習パターン集合を相互にパタ
ーン間距離が小さいもの同士、あるいは類似度の大きい
もの同士に分けてサブカテゴリを決定する手法である階
層的クラスタリング法やLBG法が知られている。
Also known are the hierarchical clustering method and the LBG method, which are methods for determining subcategories by dividing a set of learning patterns in the same category into patterns with a small distance between them or patterns with a large degree of similarity.

更に、各カテゴリについて誤認識パターンの集合の中か
らサブカテゴリの核となるパターンを選出して認識辞書
に登録する方法等もある。
Furthermore, there is also a method of selecting a core pattern of a subcategory from a set of misrecognition patterns for each category and registering it in a recognition dictionary.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

しかるに、カテゴ1ノ間を識別する判定論理の組合せに
よる識別ツリーを構成する方法は、カテゴリ数か多い場
合、識別ツリーにおける膨大な判定論理を構成すること
か難しい。
However, when the number of categories is large, it is difficult to construct a huge number of decision logics in the discrimination tree using a method of configuring a discrimination tree by combining decision logics for discriminating between categories.

また、代表パターン登録辞書によるパターンマツチング
法は、誤認識パターン数の減少を図るには各カテゴリの
代表パターンの修正のみてなくサブカテゴリの追加登録
が必要となるが、サブカテゴリ追加登録を行うための存
力な手法かない。
In addition, in the pattern matching method using a representative pattern registration dictionary, in order to reduce the number of misrecognized patterns, it is necessary not only to correct the representative pattern of each category but also to register additional subcategories. There is no viable method.

また、前記階層的クラスタリング法やLBG法はサブカ
テゴリの数が未知であるため適用の範囲の把握か困難で
ある。また、パターン認識に用いる場合には類似カテゴ
リを考慮することか必要かあるが、個別カテゴリ内ての
クラスタリングは認識率の向上が保証されない。
Furthermore, since the number of subcategories is unknown in the hierarchical clustering method and the LBG method, it is difficult to grasp the scope of application. Furthermore, when used for pattern recognition, it may be necessary to consider similar categories, but clustering within individual categories does not guarantee improvement in recognition rate.

更に、前記した各カテゴリについて誤認識パターンの集
合の中からサブカテゴリの核となるパターンを選出して
認識辞書に登録する方法においては、サブカテゴリの選
出を工夫して自カテゴリの誤認識パターンは救済できて
も、類似カテゴリの正しい認識パターンが誤認識に転じ
る危険性を回避する育力な手法かない。
Furthermore, in the above-mentioned method of selecting the core pattern of a subcategory from a set of misrecognition patterns for each category and registering it in the recognition dictionary, it is not possible to remedy the misrecognition pattern of the own category by devising the selection of subcategories. However, there is no efficient method to avoid the risk that correct recognition patterns for similar categories turn into incorrect recognition.

以上述べたように、各カテゴリの代表パターンからのパ
ターン間距離もしくは類似度の大小により認識を行う場
合のサブカテゴリ追加登録手法としては、各カテゴリ内
をクラスタリングしてサブカテゴリを構成する手法や誤
認識パターン集合からサブカテゴリの各となるパターン
を選出してくる手法か考えられてきた。しかし、それぞ
れに欠点かあり、サブカテゴリの追加登録により必ずし
も認識率の向上が保証されていなかった。
As mentioned above, methods for registering additional subcategories when performing recognition based on the distance or similarity between patterns from the representative pattern of each category include a method of clustering within each category to form subcategories, and a method of forming subcategories by clustering within each category. A method has been considered that selects patterns for each subcategory from a set. However, each method has its own drawbacks, and adding additional subcategories does not necessarily guarantee improved recognition rates.

本発明は上記の点に鑑みなされたもので誤認識パターン
数が必ず減少するように逐次サブカテゴリの追加登録を
行う汎用的なパターン認識辞書作成装置を提供すること
を目的とする。
The present invention has been made in view of the above points, and an object of the present invention is to provide a general-purpose pattern recognition dictionary creation device that sequentially registers additional subcategories so that the number of erroneously recognized patterns is definitely reduced.

〔課題を解決するための手段〕[Means to solve the problem]

複数のカテゴリを含む学習パターン集合からサブカテゴ
リを含む認識辞書を作成するパターン認識辞書作成装置
において、学習パターン集合を格納する学習パターン格
納装置と、各カテゴリの代表パターンを格納する認識辞
書格納装置と、学習パターン格納装置に格納さている各
学習パターンと認識辞書格納装置に格納された各代表パ
ターンとのパターン間距離を算出する第1の算出装置と
、第1の算出装置により算出されたパターン間距離か最
小となるカテゴリ名とその最小パターン間距離及び正解
カテゴリ名を格納する認識結果格納装置と、誤認識パタ
ーンを正解カテゴリ名と誤認識カテゴリ名の組合せによ
り複数の誤認識パターン集合に分類する誤認識パターン
分類装置と、前記分類された誤認識パターン集合を任意
の順序で一つずつ取り出してその中の代表パターンをあ
るカテゴリ名のサブカテゴリ候補として選出するサブカ
テゴリ候補選出装置と、サブカテゴリ候補の代表パター
ンと各学習パターンとの間のパターン間距離を算出する
第2の算出装置と、各学習パターンについて認識結果格
納装置に格納さている最小パターンのパターン間距離値
と前記第2の算出装置で算出されたパターン間距離値と
を比較し学習パターンの認識カテゴリ名を修正する認識
結果修正装置と、認識結果修正装置による修正結果に基
づいて誤認識パターン数の減少分を計算しその計算結果
から認識辞書に追加登録するかどうかを判定するカテゴ
リ登録判定装置とを備え、前記サブカテゴリ候補選出装
置においてすべての学習パターンか正認識となってサブ
カテゴリ候補か出現しなくなるか、またはすへてのサブ
カテゴリ候補か登録不可と判定されるまで、逐次サブカ
テゴリの追加登録を行って認識辞書を更新する。
A pattern recognition dictionary creation device that creates a recognition dictionary including subcategories from a learning pattern set including a plurality of categories, comprising: a learning pattern storage device that stores the learning pattern set; a recognition dictionary storage device that stores representative patterns of each category; a first calculation device that calculates an inter-pattern distance between each learning pattern stored in the learning pattern storage device and each representative pattern stored in the recognition dictionary storage device; and an inter-pattern distance calculated by the first calculation device. a recognition result storage device that stores the minimum category name, its minimum distance between patterns, and the correct category name; a recognition pattern classification device, a subcategory candidate selection device that extracts the classified misrecognition pattern set one by one in an arbitrary order and selects a representative pattern therein as a subcategory candidate of a certain category name, and a representative pattern of the subcategory candidate. and each learning pattern, and a second calculation device that calculates the inter-pattern distance between each learning pattern and the inter-pattern distance value of the minimum pattern stored in the recognition result storage device for each learning pattern. A recognition result correction device that corrects the recognition category name of the learning pattern by comparing the inter-pattern distance values calculated, and a recognition dictionary that calculates the reduction in the number of erroneously recognized patterns based on the correction results by the recognition result correction device. and a category registration determination device that determines whether or not to additionally register the subcategory candidate, and the subcategory candidate selection device determines whether all learned patterns are correctly recognized and no subcategory candidates appear, or whether all subcategory candidates are registered. The recognition dictionary is updated by sequentially adding subcategories until it is determined that it is not possible.

〔作用〕[Effect]

本発明では、前記誤認識パターン分類装置により、誤認
識パターン集合を正解カテゴリ名と誤認識カテゴリ名の
組合せでそれぞれ別々の集合に分類しておく。このよう
に分類された誤認識カテゴリ名の集合である誤認識パタ
ーン集合の中から前記サブカテゴリ候補選出装置により
、適当な順序で一つずつサブカテゴリ候補として認識辞
書に仮登録する。全体として誤認識パターンか減少する
場合は当該サブカテゴリ候補を正式に認識辞書に追加登
録し、誤認識パターン集合を更新する。また、全体とし
て誤認識パターンが増加する場合は次のサブカテゴリ候
補についても誤認識パターン数か減少するかどうかを同
様に判定する。
In the present invention, the misrecognition pattern classification device classifies misrecognition pattern sets into separate sets based on combinations of correct category names and misrecognition category names. The subcategory candidate selection device tentatively registers one subcategory candidate as a subcategory candidate in the recognition dictionary in an appropriate order from among the misrecognition pattern set, which is a set of misrecognition category names classified in this way. If the number of misrecognized patterns decreases as a whole, the subcategory candidate is formally added to the recognition dictionary and the misrecognition pattern set is updated. Furthermore, if the number of misrecognized patterns increases as a whole, it is similarly determined whether the number of misrecognized patterns decreases for the next subcategory candidate.

サブカテゴリの追加登録により誤認識パターン数か零に
なった場合、もしくは、すへてのサブカテゴリ候補か登
録不可と判定されてサブカテゴリの追加登録かなされな
かった場合にその時点て得られている認識辞書を最終的
なパターン認識辞書として出力し、動作を終了する。こ
のように、本発明では認識率の向上を保証をしなから。
If the number of misrecognized patterns becomes zero due to additional registration of a subcategory, or if it is determined that all subcategory candidates cannot be registered and the subcategory is not additionally registered, the recognition dictionary obtained at that point. is output as the final pattern recognition dictionary, and the operation ends. In this way, the present invention does not guarantee an improvement in the recognition rate.

サブカテゴリの登録を簡便に行える。You can easily register subcategories.

〔実施例〕〔Example〕

第1図は本発明の一実施例の構成を示すブロック図であ
る。同図中、■は学習パターンを格納する学習パターン
格納装置である。2は各カテゴリおよび追加登録される
サブカテゴリの代表パターンを格納する認識辞書格納装
置である。3は認識の尺度としてパターン間距離を算出
するパターン間距離算出装置aである。4は各学習パタ
ーンについてパターン間距離か最小となる認識カテゴリ
名と当該最小パターン間距離を格納しておく認識結果格
納装置である。5は誤認識パターン集合を正解カテゴリ
名と誤認識カテゴリ名の組合せて別々の集合に分類する
誤認識パターン分類装置である。6は誤認識パターン分
類装置5て分類された誤認識パターン集合の中から適当
な順序で一つずつサブカテゴリ候補として選出してくる
サブカテゴリ候補選出装置である。7は各学習パターン
と当該サブカテゴリ候補の代表パターンとの間でパター
ン間距離を算出するパターン間距離算出装置である。8
は各学習パターンについて認識結果格納装置4に格納さ
れている最小パターン間距離値とパターン間距離算出装
置7で算出されたバタン間距離と比較し、パターン間距
離算出装置b7か小さければ学習パターンの認識カテゴ
リ名を修正する認識結果修正装置である。9は認識結果
修正による全体としての誤認識パターン数の減少分Δを
計数してΔか正の場合に当該サブカテゴリ候補を認識辞
書に追加登録し、Δが負の場合には次のサブカテゴリ候
補に対する処理へ移行することを判定するサブカテゴリ
登録判定装置である。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention. In the figure, ■ is a learning pattern storage device that stores learning patterns. 2 is a recognition dictionary storage device that stores representative patterns of each category and additionally registered subcategories. 3 is an inter-pattern distance calculation device a that calculates an inter-pattern distance as a recognition measure. Reference numeral 4 denotes a recognition result storage device that stores the recognition category name and the minimum inter-pattern distance for each learning pattern. Reference numeral 5 denotes a misrecognition pattern classification device that classifies misrecognition pattern sets into separate sets by combining correct category names and misrecognition category names. Reference numeral 6 denotes a subcategory candidate selection device that selects subcategory candidates one by one in an appropriate order from the set of misrecognition patterns classified by the misrecognition pattern classification device 5. 7 is an inter-pattern distance calculation device that calculates an inter-pattern distance between each learning pattern and the representative pattern of the subcategory candidate. 8
compares the minimum inter-pattern distance value stored in the recognition result storage device 4 with the inter-pattern distance calculated by the inter-pattern distance calculation device 7 for each learning pattern, and if the inter-pattern distance calculation device b7 is smaller, the learning pattern is This is a recognition result modification device that modifies recognition category names. 9 counts the decrease Δ in the number of incorrectly recognized patterns as a whole due to correction of recognition results, and if Δ is positive, the subcategory candidate is additionally registered in the recognition dictionary, and if Δ is negative, the next subcategory candidate is This is a subcategory registration determination device that determines whether to proceed to processing.

学習パターン格納装置lは認識対象をに個のカテゴリ総
数として各カテゴリについて一定数のパターン集合を格
納する。格納される各パターンは認識処理に適した表現
、例えば認識に有効な複数の認識特徴の値を並へたベク
トル表現により格納されているものとする(学習パター
ン集合)。
The learning pattern storage device 1 stores a certain number of pattern sets for each category, with the total number of categories being recognized. It is assumed that each pattern to be stored is stored as an expression suitable for recognition processing, for example, a vector expression in which values of a plurality of recognition features effective for recognition are arranged (learning pattern set).

認識辞書格納装置2は予め学習パターン格納装置1に格
納されている各カテゴリについての一定数の学習パター
ン集合からある代表パターンMn(l≦n≦K)を作成
する。この代表パターンMnは初期認識辞書として認識
辞書格納装置2に格納されている。代表パターンMnは
例えば平均パターンを用いればよく、各パターンがベク
トルで表現されていれば平均ベクトルを用いる。
The recognition dictionary storage device 2 creates a certain representative pattern Mn (l≦n≦K) from a fixed number of learning pattern sets for each category stored in the learning pattern storage device 1 in advance. This representative pattern Mn is stored in the recognition dictionary storage device 2 as an initial recognition dictionary. For example, an average pattern may be used as the representative pattern Mn, and if each pattern is expressed by a vector, an average vector is used.

パターン間距離算出装置a3は認識辞書格納装置2に格
納された各カテゴリの代表パターン及び当該カテゴリに
対して追加登録されたサブカテゴリ群の各代表パターン
との間でパターン間距離を算出する。算出されたパター
ン間距離の最小値は当該カテゴリに対するパターン間距
離値として認識結果格納装置4に送出される。また、カ
テゴリ総数かKであるから、各学習パターンに対してに
個のパターン間距離値か8力されることになる。
The inter-pattern distance calculation device a3 calculates the inter-pattern distance between the representative pattern of each category stored in the recognition dictionary storage device 2 and each representative pattern of the subcategory group additionally registered for the category. The calculated minimum value of the inter-pattern distance is sent to the recognition result storage device 4 as the inter-pattern distance value for the category. Also, since the total number of categories is K, eight inter-pattern distance values are applied to each learning pattern.

また、パターン間距離は例えばベクトル空間における汎
用的なユークリッド距離を用いればよい。
Further, as the distance between patterns, for example, a general-purpose Euclidean distance in a vector space may be used.

また、認識尺度としてパターン間距離ではなく類似度を
用いる場合は本実施例中の「パターン間距離」を「類似
度」、「最小パターン間距離」を「最大類似度」と置き
換えることにより表すことかできる。
In addition, when using similarity instead of inter-pattern distance as a recognition measure, it can be expressed by replacing "inter-pattern distance" with "similarity" and "minimum inter-pattern distance" with "maximum similarity" in this example. I can do it.

認識結果格納装置4はパターン間距離算出装置a3から
送出された各学習パターンに対するに個のパターン間距
離値の最小値と、当該認識カテゴリ名及び正解カテゴリ
名を格納する。
The recognition result storage device 4 stores the minimum value of the inter-pattern distance values for each learning pattern sent from the inter-pattern distance calculation device a3, the recognition category name, and the correct category name.

誤認識パターン分類装置5は、認識結果格納装置4に格
納された各学習パターンの認識カテゴリ名か正解カテゴ
リ名と異なるものを誤認識パターンとして抽出し、正解
カテゴリ名と誤認識カテゴリ名の組合せにより複数の誤
認識パターン集合に分類する。この誤認識パターン分類
装置5の動作を第2図の概念図と共に説明する。抽出さ
れた全誤認識パターン20は正解カテゴリ名1と誤認識
カテゴリ名jの組合せて表現する。これにより、複数の
パターンの集合を5ij(1≦L  j≦k、j≠1)
21a、21b、21c、21dのように分類し、各S
ijに属する誤認識パターンを学習パターン格納装置l
から読み込み格納する。ここで分類数はC(k、2)=
k (k−1)/2程度である。
The misrecognition pattern classification device 5 extracts the recognition category name of each learning pattern stored in the recognition result storage device 4 or those different from the correct category name as misrecognition patterns, and uses the combination of the correct category name and the misrecognition category name. Classify into multiple misrecognition pattern sets. The operation of this misrecognition pattern classification device 5 will be explained with reference to the conceptual diagram of FIG. The extracted total erroneous recognition patterns 20 are expressed by a combination of the correct category name 1 and the erroneous recognition category name j. This reduces the set of multiple patterns to 5ij (1≦L j≦k, j≠1)
21a, 21b, 21c, 21d, and each S
The erroneous recognition patterns belonging to ij are stored in the learning pattern storage device l.
Read from and store. Here, the number of classifications is C(k, 2)=
It is about k(k-1)/2.

サブカテゴリ候補選出装置6は、誤認識バタン分類装置
5て分類された複数の誤認識パターン集合を適当な順序
に並べてその順に一つずつサブカテゴリ候補として選出
する。また、当該サブカテゴリ候補の代表パターンはパ
ターン間距離算出装置b7へ送出される。送出されたサ
ブカテゴリ候補は後述のパターン間距離算出装置b7〜
サブカテゴリ登録判定装置9て認識辞書への追加登録の
可否を判定される。このときサブカテゴリ候補選出装置
6は、登録可能のサブカテゴリか出現するまてサブカテ
ゴリ候補の送出を続行する。全てのサブカテゴリ候補か
登録不可と判定され、サブカテゴリ候補か尽きた場合、
或いは誤認識バタン数か零となりサブカテゴリ候補数も
零となった場合に、その時点で得られている認識辞書を
最終的なパターン認識辞書として8力し、動作を終了す
る。
The subcategory candidate selection device 6 arranges the plurality of misrecognition pattern sets classified by the misrecognition slam classification device 5 in an appropriate order and selects them one by one as a subcategory candidate in that order. Further, the representative pattern of the subcategory candidate is sent to the inter-pattern distance calculation device b7. The sent subcategory candidates are sent to inter-pattern distance calculation devices b7 to be described later.
The subcategory registration determination device 9 determines whether additional registration to the recognition dictionary is possible. At this time, the subcategory candidate selection device 6 continues sending subcategory candidates until a registrable subcategory appears. If it is determined that all subcategory candidates cannot be registered and the subcategory candidates are exhausted,
Alternatively, when the number of erroneously recognized slams becomes zero and the number of subcategory candidates also becomes zero, the recognition dictionary obtained at that time is used as the final pattern recognition dictionary, and the operation ends.

パターン、間距離算出装置b7は、サブカテゴリ候補選
出装置6から送出されたサブカテゴリ候補の誤認識パタ
ーン集合Sijについて代表パターンM′を作成する。
The pattern/distance calculation device b7 creates a representative pattern M' for the set of misrecognized patterns Sij of subcategory candidates sent from the subcategory candidate selection device 6.

学習パターン格納装置lから読み込んだ各学習パターン
に対して前記M′とで算出されたパターン間距離は認識
結果修正装置8へ送出される。但し、誤認識パターンS
iJはカテゴリ名iのサブカテゴリ候補であるから上記
算出さたパターン間距離はカテゴリ名iに対するパター
ン間距離を修正するものとなる。
The inter-pattern distance calculated with M' for each learning pattern read from the learning pattern storage device 1 is sent to the recognition result correction device 8. However, incorrect recognition pattern S
Since iJ is a subcategory candidate of category name i, the inter-pattern distance calculated above corrects the inter-pattern distance for category name i.

認識結果修正装置8は各学習パターンについて認識結果
格納装置4に格納されている最小パターン間距離値と前
記パターン間距離算出装置b7から送出されたパターン
間距離値を比較し、後者のパターン間距離値か小さい場
合に当該学習パタンの新認識カテゴリ名をiとして旧認
識カテゴリ名、正解カテゴリ名とともに格納する。それ
ら格納された認識結果の修正された内容はサブカテゴリ
登録判定装置9へ送出される。
The recognition result correction device 8 compares the minimum inter-pattern distance value stored in the recognition result storage device 4 for each learning pattern with the inter-pattern distance value sent from the inter-pattern distance calculation device b7, and calculates the latter inter-pattern distance. If the value is small, the new recognition category name of the learning pattern is stored as i along with the old recognition category name and the correct category name. The corrected contents of the stored recognition results are sent to the subcategory registration determination device 9.

第3図はサブカテゴリ登録判定装置9の動作を説明する
ための概念図を示す。サブカテゴリ登録判定装置9は認
識結果修正装置8から送出された認識結果修正内容から
各学習パターンの新旧の認識カテゴリ名と正解カテゴリ
名を照合する。同図において、カテゴリlのパターン集
合の正認識パターン31からサブカテゴリ候補M′へ認
識されたパターン集合35へ移動したものをP、とし、
カテゴリ2のパターン集合の正認識パターン32からサ
ブカテゴリ候補M′へ認識されたパターン集合35へ移
動したものをP2とし、カテゴリ1のパターン集合の誤
認識パターン33からM′へ認識されたパターン集合3
5へ移動したものをQ、とし、カテゴリにのパターン集
合の誤認識パターン34からM′へ認識されたパターン
集合35へ移動したものをPKとする。
FIG. 3 shows a conceptual diagram for explaining the operation of the subcategory registration determination device 9. The subcategory registration determination device 9 compares the old and new recognition category names of each learning pattern with the correct category name from the recognition result modification contents sent from the recognition result modification device 8. In the figure, let P be the pattern set 35 of the pattern set of category l that has been moved from the correct recognition pattern 31 to the pattern set 35 recognized as subcategory candidate M'.
The movement from the correctly recognized pattern 32 of the category 2 pattern set to the recognized pattern set 35 to subcategory candidate M' is designated as P2, and the movement from the incorrectly recognized pattern 33 of the category 1 pattern set to M' is the recognized pattern set 3.
Let Q be the pattern that has moved to M', and let PK be the pattern that has moved from the misrecognized pattern 34 of the pattern set in the category to the pattern set 35 that has been recognized to M'.

これによりカテゴリ名j(≠i)の正認識パタンて認識
カテゴリ名かiとなり誤認識パターンに転したものの数
をPjとし、また、カテコリ名1の誤認識パターンから
正認識パターンに転じたものの数をQiとして計数して
誤認識パターン数の減少分Δを以下の式で求める。
As a result, the number of correct recognition patterns for category name j (≠i) that become the recognized category name i, and the number of cases that changed to incorrect recognition patterns, is Pj, and the number of cases that changed from incorrect recognition patterns for category name 1 to correct recognition patterns. is counted as Qi, and the decrease Δ in the number of misrecognized patterns is calculated using the following formula.

Δ=Qi−ΣPj     式(lj 誤認識パターン数の減少分Δか正であればサブカテゴリ
の登録を可と判定する。即ちΔか正の場合はM′をカテ
ゴリ名iのサブカテゴリとして認識辞書格納装置2に追
加登録し、パターン間距離算量装置a3以下での処理を
繰り返す。また、式(1)のΔの値か負の場合にはサブ
カテゴリ候補選出装置6へ動作を戻し、次のサブカテゴ
リ候補を順に一つ選出してきてパターン間距離算出装置
b7以下の処理を繰り返す。
Δ=Qi−ΣPj formula (lj If the decrease in the number of misrecognized patterns Δ is positive, it is determined that the subcategory can be registered. In other words, if Δ is positive, M′ is recognized as a subcategory of category name i. 2, and repeat the processing in inter-pattern distance calculating device a3 and below. Also, if the value of Δ in equation (1) is negative, the operation is returned to subcategory candidate selection device 6, and the next subcategory candidate is selected. are selected one after another, and the processes from the inter-pattern distance calculation device b7 onward are repeated.

〔発明の効果〕〔Effect of the invention〕

上記のように本発明によれば計算機による広くパターン
認識を各カテゴリの代表パターンからのパターン間距離
もしくは類似度の大小によって行う際、誤認識パターン
を正解カテゴリ名と誤認識カテゴリ名の組合せで分類し
てサブカテゴリ候補を作成し、誤認識パターン数の減少
を条件に認識辞書への追加登録の可否を判定する手段を
与えることにより、認識率の向上を保証するパターン認
識辞書の作成を可能としている。また、処理の大部分か
パターン間距離もしくは類似度の算出からなり、内容は
単純でかつ演算量も少ない。
As described above, according to the present invention, when pattern recognition is widely performed by a computer based on the distance between patterns or the degree of similarity from the representative pattern of each category, misrecognized patterns are classified by a combination of correct category name and incorrect recognition category name. By creating subcategory candidates based on the above criteria and providing a means to determine whether or not to add them to the recognition dictionary on the condition that the number of misrecognized patterns is reduced, it is possible to create a pattern recognition dictionary that guarantees an improvement in the recognition rate. . Furthermore, most of the processing consists of calculating the distance or similarity between patterns, and the content is simple and the amount of calculation is small.

このように認識率の向上を保証しなからサブカテゴリの
追加登録を容易に行えることから、本発明はパターン認
識の辞書作成における汎用的且つ有効な技術を提供して
いる。このため、特に統計的クラスタリング理論か無効
となるようなカテコリ数か多く、各カテゴリに属するパ
ターン数か十分てない認識対象に適応される場合に利点
か極めて大きい。
As described above, the present invention provides a general-purpose and effective technique for creating a dictionary for pattern recognition because additional registration of subcategories can be easily performed without guaranteeing an improvement in the recognition rate. For this reason, it is particularly advantageous when applied to recognition targets where the number of categories is large and the number of patterns belonging to each category is insufficient, such that statistical clustering theory would be invalidated.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例の構成を示すブロック図、 第2図は本発明の一実施例の誤認識パターン分類装置の
動作を説明するための概念図、第3図は本発明の一実施
例のサブカテゴリ登録判定装置の動作を説明するための
概念図。 l・・・学習パターン格納装置、2・・・認識辞書格納
装置、3・・・パターン間距離算出装置a、4・・・認
識結果格納装置、5・・・誤認識パターン分類装置、6
・・・サブカテゴリ候補選出装置、7・・・パターン間
距離算出装置、8・・・認識結果修正装置、9・・・サ
ブカテゴリ登録判定装置。 特許出願人 日本電信電話株式会社 本発明の一実施例の構成を示すブロック図N1 図 誤認識バタ ン分類装置5の動作を説明するための概念図第2vA
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention, FIG. 2 is a conceptual diagram for explaining the operation of an erroneous recognition pattern classification device according to an embodiment of the present invention, and FIG. 3 is a block diagram showing the configuration of an embodiment of the present invention. FIG. 2 is a conceptual diagram for explaining the operation of the subcategory registration determination device of one embodiment. l... Learning pattern storage device, 2... Recognition dictionary storage device, 3... Inter-pattern distance calculation device a, 4... Recognition result storage device, 5... Erroneous recognition pattern classification device, 6
...Subcategory candidate selection device, 7. Inter-pattern distance calculation device, 8. Recognition result correction device, 9. Subcategory registration determination device. Patent applicant: Nippon Telegraph and Telephone Corporation Block diagram N1 showing the configuration of an embodiment of the present invention Figure 2vA Conceptual diagram for explaining the operation of the misrecognition slam classification device 5

Claims (1)

【特許請求の範囲】 複数のカテゴリを含む学習パターン集合からサブカテゴ
リを含む認識辞書を作成するパターン認識辞書作成装置
において、 学習パターン集合を格納する学習パターン格納装置と、 各カテゴリの代表パターンを格納する認識辞書格納装置
と、 該学習パターン格納装置に格納さている各学習パターン
と該認識辞書格納装置に格納された各代表パターンとの
パターン間距離を算出する第1の算出装置と、 前記第1の算出装置により算出されたパターン間距離が
最小となるカテゴリ名とその最小パターン間距離及び正
解カテゴリ名を格納する認識結果格納装置と、 誤認識パターンを前記正解カテゴリ名と誤認識カテゴリ
名の組合せにより複数の誤認識パターン集合に分類する
誤認識パターン分類装置と、前記分類された誤認識パタ
ーン集合を任意の順序で一つずつ取り出してその中の代
表パターンをあるカテゴリ名のサブカテゴリ候補として
選出するサブカテゴリ候補選出装置と、 前記サブカテゴリ候補の代表パターンと各学習パターン
との、間のパターン間距離を算出する第2の算出装置と
、 各学習パターンについて該認識結果格納装置に格納さて
いる最小パターンのパターン間距離値と前記第2の算出
装置で算出されたパターン間距離値とを比較し学習パタ
ーンの認識カテゴリ名を修正する認識結果修正装置と、 該認識結果修正装置による修正結果に基づいて誤認識パ
ターン数の減少分を計算しその計算結果から認識辞書に
追加登録するかどうかを判定するカテゴリ登録判定装置
とを備え、前記サブカテゴリ候補選出装置においてすべ
ての学習パターンが正認識となってサブカテゴリ候補が
出現しなくなるか、またはすべてのサブカテゴリ候補が
登録不可と判定されるまで、逐次サブカテゴリの追加登
録を行って認識辞書を更新することを特徴とするパター
ン認識辞書作成装置。
[Scope of Claim] A pattern recognition dictionary creation device that creates a recognition dictionary including subcategories from a learning pattern set including a plurality of categories, comprising: a learning pattern storage device that stores the learning pattern set; and a learning pattern storage device that stores representative patterns of each category. a recognition dictionary storage device; a first calculation device that calculates an inter-pattern distance between each learning pattern stored in the learning pattern storage device and each representative pattern stored in the recognition dictionary storage device; a recognition result storage device that stores the category name for which the inter-pattern distance calculated by the calculation device is the minimum, the minimum inter-pattern distance, and the correct category name; A misrecognition pattern classification device that classifies into a plurality of misrecognition pattern sets, and a subcategory that extracts the classified misrecognition pattern sets one by one in an arbitrary order and selects a representative pattern among them as a subcategory candidate of a certain category name. a candidate selection device; a second calculation device that calculates an inter-pattern distance between the representative pattern of the subcategory candidate and each learning pattern; and a minimum pattern stored in the recognition result storage device for each learning pattern. a recognition result correction device that corrects the recognition category name of the learning pattern by comparing the inter-pattern distance value and the pattern-to-pattern distance value calculated by the second calculation device; and a category registration determination device that calculates a decrease in the number of patterns and determines whether to be additionally registered in the recognition dictionary based on the calculation result, and the subcategory candidate selection device has a category registration determination device that calculates a decrease in the number of patterns and determines whether or not to additionally register the patterns in the recognition dictionary. A pattern recognition dictionary creation device that updates a recognition dictionary by sequentially registering additional subcategories until no subcategories appear or it is determined that all subcategory candidates cannot be registered.
JP2178880A 1990-07-06 1990-07-06 Pattern recognition dictionary generating device Pending JPH0467277A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2178880A JPH0467277A (en) 1990-07-06 1990-07-06 Pattern recognition dictionary generating device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2178880A JPH0467277A (en) 1990-07-06 1990-07-06 Pattern recognition dictionary generating device

Publications (1)

Publication Number Publication Date
JPH0467277A true JPH0467277A (en) 1992-03-03

Family

ID=16056315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2178880A Pending JPH0467277A (en) 1990-07-06 1990-07-06 Pattern recognition dictionary generating device

Country Status (1)

Country Link
JP (1) JPH0467277A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020053084A (en) * 2013-06-28 2020-04-02 コグネックス・コーポレイション Semi-supervised method for training multiple pattern recognition and registration tool models

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020053084A (en) * 2013-06-28 2020-04-02 コグネックス・コーポレイション Semi-supervised method for training multiple pattern recognition and registration tool models

Similar Documents

Publication Publication Date Title
Hosang et al. Learning non-maximum suppression
Senior A combination fingerprint classifier
Tulyakov et al. Review of classifier combination methods
US4972499A (en) Pattern recognition apparatus
JP3088171B2 (en) Self-organizing pattern classification system and classification method
US5982929A (en) Pattern recognition method and system
US5862259A (en) Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
Gattal et al. Segmentation and recognition system for unknown-length handwritten digit strings
US20200193225A1 (en) System and method for detecting objects in a digital image, and system and method for rescoring object detections
US9101961B2 (en) Word recognition apparatus, word recognition method, non-transitory computer readable medium storing word recognition program, and delivery item sorting apparatus
JP5003051B2 (en) Automatic mail sorting machine and automatic mail sorting method
JP5989576B2 (en) Pattern identification device, pattern identification method, program, learning device, and learning method
US6047079A (en) Method of and an apparatus for pre-selecting fingerprint cards
JP4802176B2 (en) Pattern recognition apparatus, pattern recognition program, and pattern recognition method
Mahkamov et al. Using AdaBoost to improve the performance of simple classifiers
JPH0467277A (en) Pattern recognition dictionary generating device
US20200387691A1 (en) A quick match algorithm for biometric data
Koga et al. Segmentation of Japanese handwritten characters using peripheral feature analysis
JPH0638276B2 (en) Pattern identification device
Ali Arabic handwritten characters classification using learning vector quantization algorithm
Dai et al. Self-supervised pairing image clustering and its application in cyber manufacturing
Xia et al. An efficient off-line handwritten Japanese address recognition system
Senior et al. Fingerprint classification by decision fusion
JPH1011541A (en) Character recognition device
JPS646514B2 (en)