JPH07121709A - パターン識別装置 - Google Patents

パターン識別装置

Info

Publication number
JPH07121709A
JPH07121709A JP5287626A JP28762693A JPH07121709A JP H07121709 A JPH07121709 A JP H07121709A JP 5287626 A JP5287626 A JP 5287626A JP 28762693 A JP28762693 A JP 28762693A JP H07121709 A JPH07121709 A JP H07121709A
Authority
JP
Japan
Prior art keywords
identification
space
pattern
recognition
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5287626A
Other languages
English (en)
Inventor
Kenji Wakamatsu
健司 若松
Hiroshi Tomiyasu
寛 富安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP5287626A priority Critical patent/JPH07121709A/ja
Publication of JPH07121709A publication Critical patent/JPH07121709A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】大規模カテゴリを扱うパターン識別装置におい
て、参照パターンのクラスタリングに新規な方式を採用
することにより、精度の高いパターン識別を可能にす
る。 【構成】辞書蓄積部6には、予め用意された識別空間が
蓄積されている。パターン識別部1は、予め用意された
識別空間を参照して、文字や音声などの識別対象を最短
距離法によってパターン識別する。識別確信度計算部2
は、パターン識別により得られた識別距離数列に基づい
て識別信度を求める。階層化部3は、この識別確信度に
基づいて、パターン識別の際に参照した識別空間が識別
対象に関して良い識別空間であるか否かを判断する。良
い識別空間であると判断されると、最終識別部5がパタ
ーン識別の結果を最終識別結果として出力する。一方、
判断結果が悪い識別空間であることを示す場合は、階層
化制御部4が別の特徴量による識別空間を用いて、パタ
ーン識別を再度行って同様の検証を行うよう、パターン
識別部1、識別確信度計算部2及び階層化部3を制御す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識や音声認識な
どのパターン識別装置に関し、特に、類似した対象が多
く含まれる大規模カテゴリを扱う際に高い識別精度が得
られるように改良したパターン識別装置に関する。
【0002】
【従来の技術】現在、コンピュータを利用して、イメー
ジデータから、対象となる文字の識別を行なうOCR
(光学式文字読取装置)や、音声データから音声の識別
を行なう音声認識装置などの識別システムが開発されて
いる。これらの識別システムでは、パターン識別装置を
用いて、識別の対象となる文字や音声の入力パターンか
ら、そのパターンを表現する特徴を抽出し、あらかじめ
登録してある参照パターンの特徴を照合することによ
り、入力パターンに類似する参照パターンを検索して、
識別を行なう。
【0003】このパターン識別において、カテゴリの種
類の多い大規模カテゴリを識別する場合には、参照パタ
ーンに類似のものが多くなり、識別精度が下がるため、
全体の参照パターン群を複数の類似パターン群(クラス
タ)毎に分類(クラスタリング)した後、そのクラスタ
内で詳細な識別を行なうという手段が取られている。こ
の際、クラスタリングには例えば統計的な手法の一つで
あるクラスタ分析や、ニューラルネットを応用した手法
については堀田健一他「大規模ニューラルネット“Co
mbNET−II”」(電子情報通信学会論文誌D−I
I)などを参照されたい。
【0004】
【発明が解決しようとする課題】上記の文献などに見ら
れる従来のパターン識別装置においては、大規模カテゴ
リの識別に対応するためのクラスタリングを行う際に、
参照パターンの類似度などを用いる。したがって、類似
した参照パターンを一つのクラスタに分類されることに
なるが、そのようなクラスタリングが必ずしも実際の識
別に良い影響を与えるとは限らず、識別精度の向上につ
ながるとは限らない。
【0005】本発明は、上記事情に鑑みてなされたもの
で、その目的とするところは、大規模カテゴリを扱うパ
ターン識別装置において、参照パターンのクラスタリン
グに新規な方式を採用することにより、精度の高いパタ
ーン識別を可能にすることにある。
【0006】尚、以下の説明から明らかなように、本発
明が採用するクラスタリングの新方式は、類似パターン
群毎に分類する従来のクラスタリングとは本質的に異な
り、異なる特徴量の参照パターン群を階層構造又はトリ
ー構造に組み合わせるものである。そこで、この明細書
では、この新規な方式を従来のクラスタリングと区別す
るために「階層化」と呼ぶことにする。
【0007】
【課題を解決するための手段】本発明のパターン識別装
置は、予め用意された識別空間を参照して、文字や音声
などの識別対象を最短距離法によってパターン識別する
手段と、このパターン識別により得られた識別距離数列
に基づいて識別信度を求める手段と、この識別確信度に
基づいて、前記参照した識別空間が対象の識別に関して
良い識別空間であるか否かを判断する手段とを有するこ
とを特徴とする。
【0008】
【作用】本発明のパターン識別装置においては、入力さ
れた対象を最短距離識別法によりパターン識別し、その
際の識別距離数列から識別確信度を求め、この識別確信
度から識別に用いた識別空間が入力対象の識別に関して
良い識別空間(つまり、精度の高い識別を可能にする識
別空間)か否かを判断する。
【0009】この装置を用いて、全ての識別対象に関し
て良い識別空間を提供できる階層構造の識別辞書を作成
することが可能である。即ち、カテゴリが既知である多
数の識別対象を本装置に入力して、予め用意した識別空
間を用いてこれをパターン認識し、その結果から識別確
信度を求めることにより、その予め用意した識別空間が
その入力対象のカテゴリに関して良い空間なのか否かが
判断できる。そして、その予め用意した識別空間が或カ
テゴリ群に関しては良い識別空間であるが、他のカテゴ
リ群に関しては悪い空間であるとの判断結果が出たなら
ば、他のカテゴリ群に関して、別の特徴量の識別空間を
新たに用意して、上記と同様の検証を行う。このような
動作を繰り返して、カテゴリ群を絞り込みつつ次々と新
たな識別空間を用意て階層状に関係づけていくことによ
り、最終的に、全てのカテゴリに対して何れかの階層が
良い識別空間を提供できる階層構造の識別辞書が出来上
がる。
【0010】また、このように作成した識別辞書を用い
て、本装置で未知の対象のパターン識別を行うことによ
り、高い精度でのパターン識別が可能である。即ち、辞
書の中の或階層の識別空間を用いて識別を行い、その結
果からその識別空間が未知対象に対して良い空間か否か
を判断し、悪い空間で有れば、別の階層の識別空間を用
いて再度識別を行って、その結果を同様に検証する。こ
のような動作の繰り返しにより、その未知対象に対する
良い識別空間を辞書内から検索することが出来る。そし
て、検索した良い識別空間を用いた識別結果を最終的な
識別結果として出力することにより、高い精度の最終識
別結果が得られる。
【0011】
【実施例】以下、本発明の実施例を図面により詳細に説
明する。
【0012】図1は、本発明に従うパターン識別装置の
一実施例ブロック構成を示す。
【0013】図1に示すように、本実施例装置はパター
ン識別部1、識別確信度計算部2、階層化部3、階層化
制御部4、最終識別部5及び辞書蓄積部6から構成され
る。
【0014】この装置の動作は学習モードと識別モード
の2つに分けることができる。学習モードでは、辞書蓄
積部6内に階層構造をもった識別辞書を構築するための
処理が行なわれる。この処理のために、主として、パタ
ーン識別部1、識別確信度計算部2、階層化部及び階層
化制御部4が動作する。
【0015】識別モードでは、蓄積部6内の辞書を用い
て、入力された未知のパターン識別が行なわれる。この
処理では、主として、パターン識別部1、識別確信度計
算部2、階層化部3及び最終識別部5が動作する。
【0016】以下、図1に示す各部の機能を説明する。
【0017】パターン識別部1は、識別すべきサンプル
パターンを入力して、このサンプルパターンと蓄積部6
内の参照パターンとの間の距離を計算し、最短距離法に
よりサンプルパターンを識別する。ここでのパターン識
別法は公知の方法が採用でき、これについては例えば舟
久保登著「視覚パターンの処理と認識」(哲学出版)を
参照されたい。
【0018】図2及び図3は、パターン識別部1内の最
短距離法による識別の様子を示すものである。パターン
識別部1は、最短距離法を行う際に、図2や図3のよう
に識別距離を昇順に整列し、距離が小さい方から第一候
補、第二候補、第三候補……と識別する。
【0019】ところで、図2の例は、サンプルパターン
に近接する3つの参照パターンA,B,Cが存在したと
きに、それら参照パターンA,B,Cの識別距離dA,d
B,dCに有意な差が存在しない場合を示している。この
場合には、必ずしも第一候補が正解パターンであるとは
限らず、第二候補又は第三候補が正解パターンである場
合が少なからず存在する。このような参照パターンの空
間(識別空間)を「悪い識別空間」と呼ぶことにする。
一方、図3の例は参照パターンA,B,Cの識別距離d
A,dB,dCに有意な相違が存在しない場合であり、この
場合は、ほぼ確実に第一候補が正解パターンである。こ
のような識別空間を「良い識別空間」と呼ぶことにす
る。
【0020】さて、学習モードにおいて作成しようとす
る識別辞書の目標像は、すべてのカテゴリに対して良い
識別空間を提供できる辞書である。そこで学習モードで
は、予め用意した参照パターンが良い識別空間を提供す
るものであるか否かをカテゴリ毎に検証し、最初の参照
パターンでは良い識別空間が得られないカテゴリに関し
ては、別の特徴量の参照パターンを用意して同様に検証
を行い、それでもまだ良い識別空間が得られないカテゴ
リに関しては、更に別の特徴量の参照パターンを用意し
て検証する、……という作業を繰り返していく。それに
より、複数種類の異なる特徴量の参照パターン群が階層
構造をなした辞書が構築されることになる。そして、ど
のカテゴリに対しても、この辞書内の何れかの階層(何
れかの特徴量の参照パターン群)が良い識別空間を提供
することになる。
【0021】この学習モードでは、パターン識別装置1
は、上記の検証を行うために、各カテゴリに関して予め
用意された多数の既知の学習用サンプルパターンを入力
し、各サンプルパターンについて蓄積部6内の参照パタ
ーンを参照して最短距離法による識別を行う。この識別
の結果、第1候補が正解パターンとなる頻度が非常に高
かったカテゴリについては、良い識別空間が既に得られ
ていると判断することができる。一方、第2候補や第3
候補が正解パターンとなる頻度が相当にあったカテゴリ
については、良い識別空間がまだ得られてないと判断す
ることができ、その場合には、更に別の参照パターンを
辞書に組み込み、同様な検証を行う必要がある。このよ
うな判断と検証の繰り返しのための制御は、後述する識
別確信度計算部2、階層化部3及び階層化制御部4によ
って行われる。
【0022】一方、識別モードでは、パターン識別装置
1は未知のサンプルパターンを入力し、蓄積部6内の階
層構造の辞書を参照してこれを識別する。その場合、そ
の未知パターンに対して良い識別空間を提供する階層を
辞書内から選別して、その選別した階層を用いて識別を
行うことが必要である。そのために、後述する識別確信
度計算部2、階層化部3及び階層化制御部4が、パター
ン識別部1の識別結果を受けて、それが適切な階層を用
いた識別結果であるか否かを判断し、否の場合には別の
階層を用いて再度識別を行うようパターン識別部1にフ
ィードバックする。それにより、最終的に、パターン識
別装置4は、辞書内の良い識別空間を用いて未知パター
ンを識別することが可能となる。
【0023】識別確信度計算部2は、パターン識別部1
によって得られた、図2に示すdB,dA,dC,……や
図3に示すdC,dA,dB……のような昇順に整列され
た識別距離数列(昇順識別距離数列という)を受け、識
別確信度を計算する。この識別確信度は、例えば、判別
分析によって計算することができる。判別分析について
は、奥野忠一他「多変量解析法」(日科技連)を参照さ
れたい。
【0024】学習モードでは、識別確信度計算部2は、
多数の学習サンプルパターンの識別結果(昇順識別距離
数列)をパターン識別部1より受けて、説明変数として
この昇順識別距離数列を用い、目的変数として正解パタ
ーンが第何候補であったかを示す候補番号を用いて判別
分析を行う。
【0025】判別分析は、例えばS言語の関数disc
rを用いて行なうことができる。S言語についてはR.
A、ベッカー等著「S言語〜データ解析とグラフィック
スのためのプログラミング環境〜II」(共立出版)を
参照されたい。一例として、第p位までの昇順識別距離
数列d1,d2,…dpを用い、p群に分ける(正解パタ
ーンが第一位、第二位…第(p−1)位の各群とそれ以
降の群とに分ける)こととすると、この判別分析によっ
て、パターン識別部1が識別に用いた参照パターン群
(階層)に固有のp個の判別関数が得られる。これら判
別関数は蓄積部6内の辞書に登録される。
【0026】p個の各判別関数は、識別距離数列d1,
d2,…dpの関数(例えば、線形一次関数)である。こ
のp個の判別関数を用いて、或サンプルパターンを識別
して得た識別距離数列d1,d2,…dpについて後述す
るような演算処理を行なうことにより、その階層を用い
てそのサンプルパターンを識別した場合の識別結果の精
度を示す「識別確信度」が得られる。
【0027】この識別確信度は、図4に例示するような
意味合いを持つ(p=3の場合を例示する)。すなわち
図4(A)は、識別確信度=1の場合を示し、この場合
は各正解候補の識別距離間に有意な差がある良い識別空
間を用いて識別を行なったことを意味する。図4(B)
は、識別確信度=2の場合を示し、これは第1候補と第
2候補の識別距離間に有意な差がない悪い識別空間を用
いて識別したことを意味する。図4(C)は、識別確信
度=3の場合を示し、これは第1候補から第3候補まで
の識別距離間に有意な差がない更に悪い識別空間を用い
て識別したことを意味する。
【0028】このように、識別確信度は識別空間の良し
悪しの程度を示す指標となる。
【0029】学習モードでは、蓄積部6内の参照パター
ン群に関して各カテゴリの識別確信度を計算して、識別
確信度が2以上であったカテゴリについては、別の特徴
量の参照パターンを新たに用意して、それについて識別
確信度を再度計算し、その結果識別確信度が2以上であ
ったカテゴリについては、更に別の特徴量の参照パター
ンを新たに用意して同様の計算を行なう、…という作業
が繰り返し行なわれる。
【0030】この作業を行なうために、識別確信度計算
部2は、各カテゴリ毎に、多数の学習サンプルパターン
の識別結果(昇順識別距離d1,d2,…dp)を受けて、
先に計算した判別関数にその識別結果を代入して計算す
ることにより、各カテゴリ毎の識別確信度を計算する。
具体的には以下のように行なう。
【0031】即ち、判別分析によって求まったp個の判
別関数(S言語ではvars)を用いて、識別確信度を
求める際、予めp個の各群毎に、判別得点ベクトル(z
1,z2,…zp)の平均を求めておく。その方法は、p個
の判別関数をsを要素とする行列で表わすと、
【数1】 のように計算する。尚、上式の左辺は、p個の各群の判
別得点ベクトル(z1,z2,…zp)の平均を意味し、右
辺は、p個の判別関数に各群の識別距離数列d1,d2,…
dpの平均を代入して関数値を計算することを意味し、
添数字(1),(2),…(p)は群番号を意味する。このように
して、各群毎の判別得点ベクトルの平均を得た上で、個
々のサンプルパターンの識別確信度を求める。その方法
は、個々のサンプルパターンの昇順識別距離をd1,d2,
…dpをp個の判別関数に代入して、上記と同様の判別
得点ベクトル(z1,z2,…zp)を計算した後、これに
最も距離が近い平均判別得点ベクトルを持つ群を選択
し、その群番号をそのサンプルパターンの識別確信度と
して決定する。学習モードでは、1つのカテゴリについ
て多数のサンプルパターンを入力してそれぞれの識別確
信度を上記の方法で求め、それらの識別確信度の例えば
平均値を、そのカテゴリの識別確信度とする。
【0032】このようにして求めた各カテゴリの識別確
信度は、蓄積部6内の参照パターン群がそのカテゴリに
対して良い識別空間であるかどうかを示している。つま
り、識別確信度=1であれば蓄積部6内の辞書がそのカ
テゴリに対して良い識別空間を提供していることを意味
する。しかし、識別確信度=2以上であれば、そのカテ
ゴリに対しては更に別の特徴量の参照パターン群(階
層)を辞書に加えなくてはならないことを意味する。
【0033】一方、識別モードでは、識別確信度計算部
2は、未知パターンの識別結果を識別部1より受けて、
識別部1が用いた辞書の階層に固有の判別関数を用い
て、その識別結果についての識別確信度を計算する。こ
の方法は、既に述べたように、その未知パターンの昇順
識別距離d1,d2,…dpをp個の判別関数に代入して判
別得点ベクトル(z1,z2,…zp)を求め、これに最も
距離の近い平均判別得点ベクトルを持つ群の群番号をそ
の未知パターンの識別確信度とする。
【0034】この識別確信度は、識別部1が識別に用い
た階層がその未知パターンに対して良い識別空間である
かどうかを示す。即ち、識別確信度=1であれば、その
識別結果は精度の高いものであることを意味し、一方、
識別確信度=2以上であれば、別の階層を用いて再度識
別し直す必要があることを意味する。
【0035】階層化部3は、識別確信度計算部2によっ
て得られた識別確信度によって、さらなる階層の加入
(学習モードの場合)又は別の階層による再度の識別
(識別モードの場合)が必要かどうかを判断する。
【0036】即ち、学習モードでは、階層化部3は、識
別確信度が2以上のカテゴリを集め、これを新たに辞書
に加入される階層の適用対象となるカテゴリ集団とし
て、そのカテゴリ名を蓄積部6内の辞書に書込む。これ
によって大規模なカテゴリであっても、辞書内の一つの
階層が適用されるカテゴリ数を減少させることが可能と
なる。一方、識別モードでは、階層化部3は、識別確信
度が2以上である場合は、異なる階層による再度の識別
が必要であると判断する。
【0037】階層化制御部4は、階層化部3の判断結果
を受けて、学習モードでは、新たな階層の適用対象と判
定されたカテゴリ集団に関し、新たな階層の構築を行な
うための処理をパターン識別部1、識別確信度計算部2
及び階層化部3に実行させる。また、識別モードでは、
階層化制御部4は、再度の識別が必要と判定された場
合、再度の識別を行なうための処理をパターン識別部
1、識別確信度計算部2及び階層化部3に実行させる。
【0038】最終識別部5は、識別モードにおいて、前
段までの結果を受け、識別確信度が1である場合の識別
結果を最終的な識別結果として出力する。
【0039】次に、本実施例の動作を説明する。
【0040】図5(A)は、学習モードにおける動作流
れを示す。
【0041】まず、蓄積部6内に或一種類の特徴量の参
照パターン群(第1の階層)から成る識別空間を辞書と
して用意する(ステップS1)。
【0042】次に、正解パターンが既知の多数の学習パ
ターンを入力して、第1の階層を用いて識別を行ない、
その結果から第1の階層についての判別関数を求める
(ステップS2)。
【0043】続いて、各カテゴリ毎に、多数の学習パタ
ーンを再度入力して第1の階層による識別を行ない、そ
の識別結果と、先に求めた判別関数とから、第1の階層
の各カテゴリに対する識別確信度を演算する(ステップ
S3)。
【0044】そして、各カテゴリについて、識別確信度
=1か否かをチェックする(ステップS4)。このチェ
ックの結果、識別確信度=1となったカテゴリについて
は、第1の階層が十分に良い識別空間であると判断する
(ステップS5)。
【0045】一方、識別確信度=2以上となったカテゴ
リについては、第1の階層が悪い識別空間であると判断
する。この場合は、それらのカテゴリに関して、新たな
特徴量による参照パターン群(識別空間)を第2の階層
として辞書に加入する(ステップS1)。そして、この
第2の階層に関して、判別関数の計算(ステップS
2)、識別確信度の計算(ステップS3)及び識別確信
度のチェック(ステップS4)を行なう。
【0046】その結果、第2の階層に関して識別確信度
=2以上となるカテゴリがあれば、それらのカテゴリに
関して、ステップS1に戻って更に別の特徴量による識
別空間を第3の階層として辞書に加入する。
【0047】以上の様な処理を、識別確信度=2以上と
なるカテゴリがなくなるまで繰り返す。これにより、全
てのカテゴリに対して良い識別空間を与える階層状の識
別辞書が最終的に構築される。
【0048】図6は、この様にして構築された階層構造
の辞書の一例を示す。
【0049】図6の例では、第1階層は全てのカテゴリ
A,B,C,D,E,F,Gの参照パターンを含んだ識
別空間であり、カテゴリCとEについてのみ良い識別空
間である。第2階層は、第1階層では良い識別空間が得
られなかったカテゴリA,B,Dの参照パターン(第1
階層とは異なる特徴量のもの)から成る識別空間であ
り、カテゴリDに対しては未だ良い識別空間ではない。
第3階層はカテゴリDの参照パターン(第1及び第2階
層とは異なる特徴量のもの)から成る識別空間であり、
カテゴリDに対して良い識別空間である。
【0050】なお、カテゴリF,Gについては、カテゴ
リA,B,Dと同様に図示の第2階層、第3階層によっ
て対応させてもよいが、第1階層から図示の第2階層、
第3階層の枝とは別に分枝した図示してない階層を用意
してこれにより対応してもよい。
【0051】このような階層構造の辞書によって全ての
カテゴリA,B,C,D,E,F,Gに対して良い識別
空間が提供できる。
【0052】図5(B)は、識別モードでの動作を示
す。
【0053】まず、未知パターンを入力して、第1階層
に対応する特徴量を抽出する(ステップS11)。そし
て、この特徴量を用い、第1階層の参照パターンを参照
して最短距離法による識別を行ない、この識別結果と第
1階層についての判別関数とから、識別確信度を求める
(ステップS12)。
【0054】次に、その識別確信度が1か否かチェック
して(ステップS13)、1であれば、第1階層が十分
に良い識別空間であることを意味するから、その識別結
果を最終的な識別結果として出力する(ステップS1
4)。
【0055】一方、識別確信度が2以上の場合は、ステ
ップS1に戻り、未知パターンから第2階層に対応する
特徴量を抽出し、これを用いて第2階層を参照して再度
の識別を行ない、その結果を同様にチェックする(ステ
ップS12、13)。
【0056】このチェックの結果、識別確信度=1なら
第2階層での識別結果を最終識別結果として出力し、識
別確信度=2以上なら第3階層での識別を同様に行な
う。
【0057】このようにして、階層構造の辞書の中から
識別確信度=1が得られる階層、つまり良い識別空間を
選別して、これを用いて未知パターンの識別を行なうた
め、高い精度での識別が可能となる。
【0058】以上、本発明の一実施例を示したが、本発
明はこれに限定されるものではなく、他の種々の態様で
も実施できることは言うまでもない。
【0059】
【発明の効果】以上、詳細に説明した如く、本発明によ
れば、識別確信度に基づいて階層構造の識別辞書を構築
し、この辞書の中から識別確信度の高い階層を選択して
未知パターンの識別を行なっているため、大規模のカテ
ゴリを扱う場合でも識別精度の高いパターン識別が可能
となる。
【0060】また、その際に用いるパターン識別手段
は、通常の最短距離法を用いたパターン識別手段を流用
することが可能である。
【図面の簡単な説明】
【図1】本発明に従うパターン識別装置の一実施例の構
成を示すブロック図である。
【図2】同実施例におけるパターン識別部内の最短識別
法による識別結果の一例を示す図である。
【図3】同実施例におけるパターン識別部内の最短識別
法による識別結果の別の例を示す図である。
【図4】同実施例により計算された識別確信度の意味を
説明するための説明図である。
【図5】同実施例の動作を示すフローチャートである。
【図6】同実施例により得られた階層構造を持つ識別辞
書の一例を示す説明図である。
【符号の説明】
1 パターン識別部 2 識別確信度計算部 3 階層化部 4 階層化制御部 5 最終識別部 6 辞書蓄積部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 予め用意された識別空間を参照して、サ
    ンプルパターンを最短距離法によってパターン識別する
    手段と、 前記パターン識別により得られる識別距離数列に基づい
    て識別確信度を求める手段と、 前記識別確信度に基づいて、前記参照した識別空間が前
    記サンプルパターンの識別に関して良い識別空間である
    か否かを判断する手段と、 を有することを特徴とするパターン識別装置。
  2. 【請求項2】 請求項1記載の装置において、 前記サンプルパターンのとり得るカテゴリに関して識別
    空間を用意する手段と、 既に用意された識別空間を参照して既知のサンプルパタ
    ーンをパターン識別したことにより得られた識別確信度
    に基づいて前記判断手段が下した判断結果を受けて、こ
    の判断結果が良くない識別空間である旨を示す場合に、
    前記作成手段を制御して、前記予め用意された識別空間
    とは異なる特徴量を用いた新たな識別空間を、前記既知
    のサンプルパターンのカテゴリに関して用意させる制御
    手段と、 前記予め用意された識別空間と前記新たに用意された識
    別空間とを階層状に関係づけて蓄積する手段と、を更に
    有することを特徴とするパターン識別装置。
  3. 【請求項3】 請求項1記載のパターン識別装置におい
    て、 階層状に関係づけられた、異なる特徴量を用いた複数の
    識別空間が予め用意されており、そして、 或識別空間を参照して未知のサンプルパターンをパター
    ン識別したことにより得られた識別確信度に基づいて前
    記判断手段が下した判断結果を受けて、この判断結果が
    良くない識別空間である旨を示す場合、前記識別手段を
    制御して、前記或識別空間とは異なる階層の識別空間を
    参照して前記未知のサンプルパターンの識別を再度行わ
    せる制御手段と、 前記判断結果を受けて、この判断結果が良い識別空間で
    ある旨を示す場合、この判断結果の基となったパターン
    識別の結果を最終的な識別結果として出力する手段と、
    を有することを特徴とするパターン識別装置。
  4. 【請求項4】 最短距離法によるパターン識別に用いら
    れる辞書を作成する方法において、 (a) 識別辞書内に予め蓄積された所定のカテゴリ集合
    に関する所定の識別空間を参照して、前記カテゴリ集合
    に属する多数の既知サンプルパターンを最短距離法によ
    りパターン識別する過程と、 (b) 前記過程(a)より得られた識別距離数列を用いて判
    別分析を行なうことにより、前記所定の識別空間の判別
    関数を求める過程と、 (c) 前記所定の識別関数を参照して、前記カテゴリ集
    合の各カテゴリに属する既知のサンプルパターンを最短
    距離法によりパターン識別する過程と、 (d) 前記過程(c)より得られた各カテゴリに属するサン
    プルパターンの識別距離数列に対して前記判別関数を適
    用することにより、前記各カテゴリ毎の識別確信度を求
    める過程と、 (e) 前記各カテゴリ毎の識別確信度に基づき、前記所
    定の識別空間が各カテゴリの識別に関して良い識別空間
    であるか否か判断する過程と、 (f) 前記過程(e)により良くない識別空間との判断結果
    を得た部分的カテゴリ集合に関して、前記識別空間とは
    異なる特徴量を用いた新しい識別空間を用意する過程
    と、 (g) 前記新しい識別空間を、前記所定の識別空間に階
    層状に関係づけて前記識別辞書に蓄積する過程と、 (h) 前記部分的カテゴリ集合を前記所定のカテゴリと
    し、前記新しい識別空間を前記所定の識別空間として、
    前記過程(a)から(e)までを再度繰り返す過程と、 (i) 何れのカテゴリに関しても前記過程(e)により良く
    ない識別空間との判断結果が得られなくなるまで、前記
    過程(f)から(g)までを繰り返す過程と、を有することを
    特徴とする識別辞書作成方法。
  5. 【請求項5】 未知のサンプルパターンを最短距離法に
    よりパターン識別する方法において、 (a) 互いに階層状に関係づけられ、各々異なる特徴量
    を用い、かつ各々固有の判別関数を有する複数の識別空
    間を蓄積してなる識別辞書内から、1つの識別空間を選
    択する過程と、 (b) 前記選択した識別空間を参照して、前記未知パタ
    ーンを最短距離法によりパターン識別する過程と、 (c) 前記過程(b)より得られた識別距離数列を前記選択
    した識別空間の判別関数に適用することにより、前記未
    知パターンに関する識別確信度を求める過程と、 (d) 前記識別確信度に基づき、前記選択した識別空間
    が前記未知パターンの識別に関して良い識別空間である
    か否かを判断する過程と、 (e) 前記過程(d)により良くない識別空間との判断結果
    を得た場合、前記選択した識別空間とは別の識別空間を
    新たに選択して、前記過程(b)から(d)までを繰り返す過
    程と、 (f) 前記過程(d)により良い識別空間との判断結果を得
    た場合、前記過程(b)より得られた識別結果を最終的な
    識別結果として出力する過程と、を有することを特徴と
    するパターン識別方法。
JP5287626A 1993-10-22 1993-10-22 パターン識別装置 Pending JPH07121709A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5287626A JPH07121709A (ja) 1993-10-22 1993-10-22 パターン識別装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5287626A JPH07121709A (ja) 1993-10-22 1993-10-22 パターン識別装置

Publications (1)

Publication Number Publication Date
JPH07121709A true JPH07121709A (ja) 1995-05-12

Family

ID=17719685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5287626A Pending JPH07121709A (ja) 1993-10-22 1993-10-22 パターン識別装置

Country Status (1)

Country Link
JP (1) JPH07121709A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013001893A1 (ja) 2011-06-28 2013-01-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 主観的な階層クラスタリングにおける特徴量ごとの重みを求める情報処理装置、方法、およびプログラム
US8972407B2 (en) 2007-05-30 2015-03-03 International Business Machines Corporation Information processing method for determining weight of each feature in subjective hierarchical clustering

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972407B2 (en) 2007-05-30 2015-03-03 International Business Machines Corporation Information processing method for determining weight of each feature in subjective hierarchical clustering
WO2013001893A1 (ja) 2011-06-28 2013-01-03 インターナショナル・ビジネス・マシーンズ・コーポレーション 主観的な階層クラスタリングにおける特徴量ごとの重みを求める情報処理装置、方法、およびプログラム
US8918396B2 (en) 2011-06-28 2014-12-23 International Business Machines Corporation Information processing apparatus, method and program for determining weight of each feature in subjective hierarchical clustering

Similar Documents

Publication Publication Date Title
US6191792B1 (en) Scheme for automatic data conversion definition generation according to data feature in visual multidimensional data analysis tool
US5329596A (en) Automatic clustering method
US6654744B2 (en) Method and apparatus for categorizing information, and a computer product
KR101276602B1 (ko) 표의문자적 내용을 가지는 데이터를 서치하고 매칭하기위한 시스템 및 방법
US5659731A (en) Method for rating a match for a given entity found in a list of entities
US5555320A (en) Pattern recognition system with improved recognition rate using nonlinear transformation
US20040181526A1 (en) Robust system for interactively learning a record similarity measurement
CN110990576B (zh) 基于主动学习的意图分类方法、计算机设备和存储介质
CN113344019A (zh) 一种决策值选取初始聚类中心改进的K-means算法
CN114638234B (zh) 应用于线上业务办理的大数据挖掘方法及系统
JP2000099632A (ja) 検索装置、検索方法及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体
CN114741603A (zh) 基于用户聚类和商品聚类的混合协同过滤推荐算法
US5640488A (en) System and method for constructing clustered dictionary for speech and text recognition
WO2008062822A1 (fr) Dispositif d'exploration de texte, procédé d'exploration de texte et programme d'exploration de texte
KR102560276B1 (ko) 이미지 검색 기반 감성 색채 배색 추천 장치 및 방법
CN114117038A (zh) 一种文档分类方法、装置、系统及电子设备
CN117078960A (zh) 一种基于图像特征提取的近红外光谱分析方法及系统
JPH07121709A (ja) パターン識別装置
JP2003346080A (ja) 文字認識方法
US20070124300A1 (en) Method and System for Constructing a Classifier
Siregar et al. Implementation Of The Data Mining Cart Algorithm In The Characteristic Pattern Of New Student Admissions
CN116932487B (zh) 一种基于数据段落划分的量化式数据分析方法及系统
JP2002183667A (ja) 文字認識装置及び記録媒体
JP2003108576A (ja) データベース管理装置およびデータベース管理方法
US20220207416A1 (en) System and method of providing correction assistance on machine learning workflow predictions