JPH1011543A - パターン認識用辞書作成装置及びパターン認識装置 - Google Patents

パターン認識用辞書作成装置及びパターン認識装置

Info

Publication number
JPH1011543A
JPH1011543A JP8167364A JP16736496A JPH1011543A JP H1011543 A JPH1011543 A JP H1011543A JP 8167364 A JP8167364 A JP 8167364A JP 16736496 A JP16736496 A JP 16736496A JP H1011543 A JPH1011543 A JP H1011543A
Authority
JP
Japan
Prior art keywords
cluster
category
feature amount
standard feature
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8167364A
Other languages
English (en)
Inventor
Ichiro Nakao
一郎 中尾
Minoru Takakura
穂 高倉
Mariko Takenouchi
磨理子 竹之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8167364A priority Critical patent/JPH1011543A/ja
Publication of JPH1011543A publication Critical patent/JPH1011543A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 従来のパターン認識装置においては、、入力
パターンの特徴ベクトルと全てのカテゴリとの標準特徴
ベクトルとの照合処理を行うためカテゴリが多数の場合
照合処理に長時間かかる。 【解決手段】 階層化認識辞書104は、クラスタに分
類したカテゴリを代表するクラスタ標準特徴ベクトル
と、クラスタに分類されたカテゴリとその標準特徴ベク
トルとを対応付けて登録している。特徴抽出部1601
は、入力パターンから特徴ベクトルを抽出し、クラスタ
一致度計算部1602は特徴ベクトルとクラスタ標準特
徴ベクトルとの一致度を計算する。クラスタ選択部16
03は一致度の高い候補クラスタを選択し、クラスタ内
カテゴリ照合部1604は、候補クラスタ内のカテゴリ
の標準特徴ベクトルと特徴ベクトルとの一致度を計算す
る。カテゴリ決定部1605は一致度の高いカテゴリを
認識結果として決定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字・図形等のパ
ターン認識に用いる辞書の作成装置及びパターン認識装
置に関する。
【0002】
【従来の技術】従来からのパターン認識装置は、入力さ
れたパターンから特徴ベクトルと呼ばれるパターンを認
識するための特徴量である複数の数値データを抽出す
る。次に抽出した特徴ベクトルと、予め用意された各カ
テゴリの標準特徴ベクトルとを照合し、その一致度(距
離、類似度等)を求める。ここで、カテゴリとは、例え
ば、文字認識の場合には識別字種をいい、認識対象の入
力パターンの認識結果となる区分種類をいう。一致度の
最も高い標準特徴ベクトルに対応するカテゴリを入力パ
ターンの認識結果としている。このため、各カテゴリの
標準特徴ベクトルを用意するため、各カテゴリごとに多
数の学習用パターンから特徴ベクトルを抽出し、各カテ
ゴリごとにその特徴ベクトルの平均値等を求めている。
【0003】
【発明が解決しようとする課題】ところが、上記のよう
なパターン認識装置では、入力パターンから抽出された
特徴ベクトルと認識結果となる全てのカテゴリの標準特
徴ベクトルとを逐一照合しなければならないため、照合
処理に長時間を要する不都合がある。特に、日本語文字
認識では、漢字を含む多くのカテゴリがあるため、その
照合処理に要する時間の短縮がパターン認識装置の実用
上の課題となっている。
【0004】本発明は、上記課題に鑑み、照合処理に要
する時間を大幅に短縮できるパターン認識装置及びその
装置に用いるパターン認識辞書を作成する装置を提供す
ることを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、カテゴリごとに入力される複数の学習用
パターンからそのカテゴリの認識に用いる特徴量を抽出
する特徴量抽出手段と、前記特徴量抽出手段で抽出され
た特徴量に基づいて各カテゴリごとの標準特徴量を計算
する標準特徴量計算手段と、前記標準特徴量計算手段で
計算された標準特徴量をクラスタ分析して、複数のクタ
スタに各カテゴリを分類するカテゴリ分類手段とを有す
るパターン認識用辞書作成装置であって、前記カテゴリ
分類手段で分類された各カテゴリの標準特徴量に基づい
てクラスタのクラスタ標準特徴量を計算するクラスタ標
準特徴量計算手段と、前記クラスタ標準特徴量計算手段
で計算されたクラスタのクラスタ標準特徴量と、前記カ
テゴリ分類手段で該クラスタに分類されたカテゴリと、
前記標準特徴量計算手段で計算されたそのカテゴリの標
準特徴量とを対応して階層化認識辞書に登録する登録手
段とを備えることとしている。これによって、階層化認
識辞書には、クラスタごとのクラスタ標準特徴量と、カ
テゴリと該カテゴリの標準特徴量とを対応して登録する
ので、この階層化認識辞書を用いたパターン認識装置で
は、先ず認識対象の入力パターンから抽出したパターン
特徴量とクラスタ標準特徴量とを照合し、その一致度の
高いクラスタに含まれるカテゴリの標準特徴量とパター
ン特徴量とを照合するだけで、全てのカテゴリの標準特
徴量との照合をする必要がなくなるので、照合時間を短
縮して、認識結果となるカテゴリを選択することができ
る。
【0006】
【発明の実施の形態】以下、本発明に係るパターン認識
用辞書作成装置及びパターン認識装置の実施の形態を図
面を用いて説明する。 (実施の形態1)図1は、本発明に係るパターン認識用
辞書作成装置の実施の形態1の構成図である。
【0007】パターン認識用辞書作成装置は、特徴抽出
部101と、標準特徴計算部102と、クラスタ代表辞
書作成部103と、階層化認識辞書104と、クラスタ
内カテゴリ設定部105と、クラスタ内辞書作成部10
6とを備えている。特徴抽出部101は、認識結果とな
る各カテゴリごとに複数の学習用パターン入力を受ける
と、各学習用パターンからカテゴリの認識に用いる特徴
量である複数個の数値データからなる特徴ベクトルを抽
出し、カテゴリに対応して特徴ベクトルを記憶する。
【0008】図2は、文字を認識結果とする入力された
学習用パターンの一例を示す図である。このように文字
を認識結果とする場合には、カテゴリは、各文字に対応
する文字コードで示される。文字「あ」の文字コード2
01に対応して複数の文字画像「あ」202、203、
…、204が学習用パターンとして入力されている。な
お、本実施の形態では、文字を認識結果としているけれ
ども、他の図形等を認識結果とする場合でも同様であ
る。
【0009】文字コード201に対応する学習用パター
ンである文字画像「あ」202、203、…、204の
特徴ベクトルを抽出すると、図3に示すようになる。な
お、特徴ベクトルの抽出については、特開昭63−34
682号公報に記載されている。ここで、文字コード2
01に対応する学習用パターンがM個あるとすると、特
徴ベクトルもF1、F2、…、FMのM個が抽出され
る。また特徴ベクトルがn個の数値データからなるとき
は、例えば、文字画像204から抽出された特徴ベクト
ルFMは、 FM=(fM−1,fM−2,…,fM−n) となる。
【0010】認識結果となるカテゴリである文字コード
の総数がNである場合には、各カテゴリごとの特徴ベク
トルの一覧301、302、303、…の総数はNとな
る。特徴抽出部101は、N個のカテゴリについて、特
徴ベクトルを全て抽出すると、標準特徴計算部102を
起動する。標準特徴計算部102には、特徴抽出部10
1に起動されると、特徴抽出部101に記憶されている
図3に示したような、各カテゴリごとの特徴ベクトルを
読み出し、各カテゴリの標準特徴ベクトルを計算する。
例えば、図2に示した文字コード201の文字「あ」の
標準特徴ベクトルD=(d1,d2,…,dn)は、次
式の(数1)によってその要素djが求められる。
【0011】
【数1】 同様に、認識結果となる全てのカテゴリについて標準特
徴ベクトルを計算して記憶すると、クラスタ代表辞書作
成部103を起動する。クラスタ代表辞書作成部103
は、標準特徴計算部102に起動されると、標準特徴計
算部102に記憶されているカテゴリの数Nと、N個の
カテゴリの標準特徴ベクトルとを読み出してクラスタ分
析の手法(「多変量統計解析法」田中豊、脇本和昌著、
現代数学社 等に記載されている。)によって、複数の
クラスタに各標準特徴ベクトルを分類する。次に各クラ
スタに分類された標準特徴ベクトルに基づいてクラスタ
の代表となるクラスタ標準特徴ベクトルを計算する。こ
のクラスタ標準特徴ベクトルは、上記標準特徴計算部1
02と同様に、クラスタ標準特徴ベクトルの各要素を次
式の(数2)によって計算し、クラスタ標準特徴ベクト
ルC=(c1,c2,…,cn)を階層化認識辞書10
4にそのクラスタ番号とともに書き込む。
【0012】
【数2】 ここで、このクラスタに含まれるカテゴリの数は、R個
であるものとする。全て(例えばP個)のクラスタにつ
いて、クラスタ標準特徴ベクトルが求められると、クラ
スタ内カテゴリ設定部105を起動する。階層化認識辞
書104は、RAM等からなり、クラスタ代表辞書作成
部103によって、クラスタ番号とクラスタ標準特徴ベ
クトルとを書き込まれる。
【0013】更に、クラスタ内カテゴリ設定部105に
よって、各クラスタに分類される各カテゴリが、追加分
類されるものを含めて書き込まれ、クラスタ内辞書作成
部106によって、クラスタに分類されているカテゴリ
に対応付けてその標準特徴ベクトルが書き込まれる。ク
ラスタ内カテゴリ設定部105は、図4にその詳細な構
成図を示すように、クラスタ一致度計算部401と、ク
ラスタ内カテゴリ登録部402と、クラスタ範囲設定部
403と、クラスタ拡張部404とを備えている。
【0014】クラスタ一致度計算部401は、クラスタ
代表辞書作成部103に起動されると、標準特徴計算部
102に記憶されている各カテゴリの標準特徴ベクトル
D=(d1,d2,…,dn)を1つずつ読み出し、階
層化認識辞書104から各クラスタ標準特徴ベクトルC
=(c1,c2,…,cm)を読み出して、両者の特徴
ベクトルの一致度を式(数3)、(数4)、(数5)の
いずれかを用いて計算する。
【0015】
【数3】
【0016】
【数4】
【0017】
【数5】 式(数3)は市街化距離L1を一致度に用いるものであ
り、L1の値の小さいもの程一致度が高くなる。式(数
4)は、二乗距離L2を用いるものであり、L2の値の
小さいもの程一致度が高くなる。式(数5)は、類似度
Sを用いるものであり、Sの値の大きいもの程一致度が
高くなる。本実施の形態では、式(数3)の市街化距離
L1を用いて一致度を計算する。得られた一致度をクラ
スタ内カテゴリ登録部402に通知する。
【0018】クラスタ内カテゴリ登録部402は、クラ
スタ一致度計算部401から通知された一致度の最も高
い(市街化距離L1の最小の)クラスタに標準特徴ベク
トルを有するカテゴリを分類する。即ち、標準特徴ベク
トルで特徴付けられるカテゴリを例えばp個のクラスタ
のいずれかに分類して、階層化認識辞書104に登録す
るとともに、そのカテゴリと一致度とをクラスタに対応
付けて記憶する。図5は、クラスタ内カテゴリ登録部4
02に記憶されているクラスタ501と分類されたカテ
ゴリ502とその一致度503とを示している。例え
ば、クラスタ1の場合には、文字コード「あ」、
「お」、…、「め」のm1個のカテゴリが分類されて、
各カテゴリのクラスタ1のクラスタ標準特徴との一致度
H1−1,H1−2,…,H1−m1が記憶されてい
る。なお、ここでは市街化距離L1として計算された値
の最小値を一致度Hとしている。全てのカテゴリをクラ
スタに分類すると、クラスタ範囲設定部403を起動す
る。
【0019】クラスタ範囲設定部403は、クラスタ内
カテゴリ登録部402に起動されると、クラスタ内カテ
ゴリ登録部402に記憶されている各クラスタに分類さ
れたカテゴリの一致度の最も低いカテゴリとの一致度を
クラスタ範囲として設定する。上述したクラスタ1の場
合には、クラスタ範囲r1は、H1−1,H1−2,
…,H1−m1の最大値(市街化距離であるので最大値
が一致度の最も低いものとなる。) r1=max(H1−1,H1−2,…,H1−m1) に設定される。同様にクラスタ2,…,クラスタpにつ
いてもクラスタ範囲r2,…,rpが設定される。
【0020】全てのクラスタについてクラスタ範囲rを
設定すると、クラスタ拡張部404に各クラスタのクラ
スタ範囲rを通知する。クラスタ拡張部404は、クラ
スタ範囲設定部403からクラスタ範囲rの通知を受け
ると、階層化認識辞書104からクラスタ標準特徴ベク
トルCを読み出す。読み出した各クラスタ標準特徴ベク
トルCと、標準特徴計算部102に記憶されている全て
のカテゴリの標準特徴ベクトルDとの一致度を式(数
3)を用いて計算し、L1≦rとなるカテゴリを階層化
認識辞書104のクラスタに分類して追加記憶させる。
【0021】即ち、図6に示すように、クラスタ内カテ
ゴリ登録部402において、クラスタjに分類されてい
たカテゴリである文字コード「軍」は、クラスタiのク
ラスタ範囲ri内に存在するので、クラスタiにも重複
して分類する。これによって、後述する図7に示すよう
に、クラスタiとクラスタjのクラスタ内カテゴリ欄7
01に文字コード「軍」が重複して登録される。全て
(P個)のクラスタについて、全て(N個)のカテゴリ
がクラスタ範囲r内に存在するか否かの判断が終了する
と、クラスタ内辞書作成部106を起動する。
【0022】クラスタ内辞書作成部106は、クラスタ
拡張部404に起動されると、階層化認識辞書104に
記憶されているクラスタに分類されたカテゴリを読み出
し、各カテゴリの標準特徴ベクトルを標準特徴計算部1
02から読み出して、階層化認識辞書104にクラスタ
内カテゴリに対応付けて記憶させる。図7は、このよう
にして階層化認識辞書104に記憶された記憶内容を示
す説明図である。
【0023】この階層化認識辞書104は、クラスタ欄
702とクラスタ標準特徴ベクトル欄703とクラスタ
内カテゴリ欄701と標準特徴ベクトル欄704とを含
んでいる。クラスタ欄702にはクラスタ番号「1」〜
「p」を付されたクラスタが記憶され、クラスタ標準特
徴ベクトル欄703にはそのクラスタを代表するクラス
タ標準特徴ベクトルCが記憶されている。クラスタ標準
特徴ベクトルCのサフィックスは、クラスタ番号を示
し、クラスタ標準特徴ベクトルCの要素cの()内の第
1文字はクラスタ番号を示し、第2文字は特徴要素の番
号を示している。
【0024】クラスタ内カテゴリ欄701には、各クラ
スタごとにクラスタに分類されるカテゴリが対応付けて
記憶されている。ここでカテゴリは、上述したように文
字コードで示されている。標準特徴ベクトル欄704に
は、クラスタ内カテゴリ欄701のカテゴリと対応付け
て(矢符で示すように)カテゴリの標準特徴ベクトルD
が記憶されている。この標準特徴ベクトルDのサフィッ
クスはカテゴリの番号であり、カテゴリがD1〜DNま
でN個あることを示している。標準特徴ベクトルDの要
素であるdの( )内の第1文字はカテゴリの番号を示
し、第2文字は特徴要素の番号を示している。
【0025】次に、本実施の形態の動作を図8、図9、
図10のフローチャートを用いて説明する。先ず、特徴
抽出部101は、カウンタKに「1」を設定し、変数N
に全カテゴリ(文字コード)数を設定する(S80
2)。次に、入力された学習用パターンから特徴ベクト
ルFK i =(fK i-1,K i-2,…,fK i-n )を抽出す
る。ここで上付きのサフィックスは、カテゴリ番号を示
す。下付きのサフィックスは、学習用パターンの同一カ
テゴリのi番目であることを示す。カテゴリ番号Kの学
習用パターン数がM個あるときには特徴ベクトルFK M
まで抽出する(S804)。
【0026】次に標準特徴計算部102は、カテゴリ番
号Kの標準特徴ベクトルDK =(d K 1,K 2,…,dK
n )を式(数1)を用いて計算する(S806)。次
に、カウンタKの値が変数N以下か否か判定し(S80
8)、肯定であれば、カウンタKに「1」を加えて(S
810)、S804に戻り、否定であればS812に移
る。
【0027】S812において、クラスタ代表辞書作成
部103は、標準特徴ベクトルD1, D2 , …,DN
クラスタ分析を行う。P個のクラスタCl1={DC1.1 ,
C1 .2, …,DC1.n1 }、…、Clp={DCp.1 ,DCp.2
, …,DCp.np }に分類し(S814)、カウンタK
に「1」を設定し(S816)、クラスタCl K のクラ
スタ標準特徴CK =(cK 1,K 2,…,cK n )を式
(数2)を用いて計算する(S902)。次に、カウン
タKの値が全クラスタ数P以下か否かを判定し、肯定で
あればカウンタKに「1」を加えて(S906)、S9
02に戻り、否定であればクラスタ標準特徴C1
2 , …,Cp を階層化認識辞書104に書き込む(S
908)。
【0028】次に、クラスタ一致度計算部401は、カ
ウンタKに「1」を設定し(S910)、カウンタlに
「1」を設定する(S912)。カテゴリ標準特徴ベク
トルDk とクラスタ標準特徴ベクトルCl との一致度L
1lを式(数3)を用いて計算する(S914)。カウ
ンタlの値がP以下であるか否かを判定し(S91
6)、肯定であればカウンタlに「1」を加えて(S9
18)、S914に戻る。
【0029】否定であれば、クラスタ内カテゴリ登録部
402は、一致度Hの最大値、即ち、距離L1の最小値
となるHi =min(L1l,L12,…,L1P)を
求め(S920)、階層認識辞書104のそのクラスタ
番号iのクラスタCli にカテゴリと標準特徴ベクトル
K と、併せて一致度Hを書き込む(S922)。カウ
ンタKの値がカテゴリ数N以下であるか否かを判定し
(S924)、肯定であればカウンタKに「1」を加え
て(S926)、S912に戻る。
【0030】否定であれば、クラスタ範囲設定部403
は、カウンタKに「1」を設定し(S1002)、クラ
スタC1 K に分類されているカテゴリDCK.1 ,…,D
CK.mKとそれぞれの一致度HK.1 , …,HK.mKを読み出
し(S1004)、一致度の最小値、即ち市街化距離の
最大値をクラスタ範囲rK =max(HK.1 , …,HK.
mK)を求めクラスタ範囲を設定する(S1006)。次
にカウンタKの値がP以下か否かを判定し(S100
8)、肯定であればカウンタKに「1」を加えて(S1
010)、S1004に戻る。
【0031】否定であれば、クラスタ拡張部404は、
カウンタKに「1」を設定し(S1012)、クラスタ
標準特徴ベクトルCK を読み出し(S1014)、カウ
ンタjに「1」を設定する(S1016)。次に、カテ
ゴリの標準特徴ベクトルDjを読み出し(S101
8)、両特徴ベクトルCK とDj との市街化距離L1 を
式(数3)を用いて計算する(S1020)。次に、市
街化距離L1 がクラスタ設定範囲rK 以下か否かを判定
し(S1022)、肯定のときはクラスタC1 K にカテ
ゴリを書き込み(S1024)、S1026に移る。こ
れによって2つのクラスタの境界付近にあるカテゴリを
2つのクラスタに重複して分類することができる。
【0032】否定のときは、S1026において、カウ
ンタjの値がN以下か否かを判定し(S1026)、肯
定のときはカウンタjに「1」を加えて(S102
8)、S1018に戻る。否定のときはカウンタKの値
がクラスタ数P以下であるか否かを判定し(S103
0)、否定のときはカウンタKに「1」を加えて(S1
032)、S1014に戻る。
【0033】肯定のときは、クラスタ内辞書作成部10
6は、階層化認識辞書104に記憶されているクラスタ
に分類されているカテゴリの標準特徴ベクトルを全て書
き込み(S1034)、処理を終了する。なお、本実施
の形態において、クラスタ範囲設定部403は各クラス
タに対し、クラスタに登録されたカテゴリの中で最も一
致度の低いカテゴリとの一致度をクラスタ範囲として定
めたが、クラスタの範囲は予め定めた他の数値でもよ
い。
【0034】以上のように本実施の形態によれば、パタ
ーン認識用辞書作成装置において、複数のカテゴリをグ
ループ化し、クラスタ標準特徴ベクトルを計算してクラ
スタの代表とし、各クラスタ内に属するカテゴリを設定
することにより高速なパターン認識装置を実現するため
の階層化辞書104を作成することができる。また、パ
ターン認識用辞書作成装置のクラスタ内カテゴリ登録部
105において、クラスタ内カテゴリの追加登録を行う
ことによりクラスタ境界付近のカテゴリが複数のクラス
タへ登録されることとなり、パターン認識装置における
クラスタ選択部によって選択されたクラスタ内に正解と
なるカテゴリが含まれない事を防止し、認識率の低下を
防ぐことができる。 (実施の形態2)図11は、本発明に係るパターン認識
用辞書作成装置の実施の形態2の構成図である。このパ
ターン認識用辞書作成装置は、特徴抽出部101と、標
準特徴計算部102と、クラスタ代表辞書作成部103
と、クラスタ一致度計算部1101と、クラスタ内カテ
ゴリ登録部1102と、カテゴリ標準特徴ベクトル計算
部1103と、階層化認識辞書1104とを備える。上
記実施の形態1と同一の構成部分には実施の形態1と同
一の符号を付してその説明を省略し、本実施の形態固有
の構成部分についてのみ説明する。
【0035】クラスタ一致度計算部1101は、クラス
タ代表辞書作成部103に起動されると、階層化認識辞
書1104に記憶されているクラスタ標準特徴ベクトル
Cを読み出す。次に、特徴抽出部101に記憶されてい
る学習用パターンの特徴ベクトルFを1つ読み出し、ク
ラスタ標準特徴ベクトルCと照合し、式(数6)によっ
て一致度を順次計算する。
【0036】
【数6】 ここでiはクラスタ番号を示す。計算した一致度LCi
をクラスタ内カテゴリ登録部1102にカテゴリ(文字
コード)と特徴ベクトルFとともに通知する。更に、ク
ラスタ内カテゴリ登録部1102から学習用パターンの
特徴ベクトルの登録終了の通知を受けると、特徴抽出部
101から学習用パターンの特徴ベクトルFを更に1つ
読み出し、一致度を計算し、計算した一致度をクラスタ
内カテゴリ登録部1102に上記と同様通知する。この
処理を入力された学習用パターンがなくなるまで繰り返
しする。
【0037】クラスタ内カテゴリ登録部1102は、ク
ラスタ一致度計算部1101から一致度LCiの通知を
受けると、一致度LCiの最も高いクラスタに特徴ベク
トルを分類する。この分類に基づき、階層化認識辞書1
104のクラスタにその特徴ベクトルのカテゴリを書き
込むとともに、そのカテゴリに対応付けて特徴ベクトル
Fを書き込む。書き込みが終了すると、クラスタ一致度
計算部1101に登録終了を通知する。全ての処理が終
了するとカテゴリ標準特徴ベクトル計算部1103を起
動する。
【0038】例えば、図3に示した文字コード「あ」の
特徴ベクトルの一覧301が特徴抽出部101に記憶さ
れている場合に、m1個の文字画像「あ」がクラスタx
に一致度が最も高く、m2個の文字画像「あ」がクラス
タyに一致度が最も高いとクラスタ一致度計算部110
1で計算され、クラスタ内カテゴリ登録部1102で分
類されたときは、図12に示すように、階層化認識辞書
1104に書き込まれる。
【0039】図12は、作成途中の階層化認識辞書11
04を示し、階層化認識辞書1104は、クラスタ欄1
201とクラスタ標準特徴ベクトル欄1202とクラス
タ内カテゴリ欄1203と特徴ベクトル欄1204、1
205とを有する。特徴ベクトル欄1204には、クラ
スタxに分類されたカテゴリ(文字コード「あ」)のm
1個の特徴ベクトルFx−1,…,Fx−m1が記憶さ
れ、特徴ベクトル欄1205には、クラスタyに分類さ
れたカテゴリ(文字コード「あ」)のm2個の特徴ベク
トルFy−1,…,Fy−m2が記憶されている。同一
カテゴリ(文字コード)であっても、2つのクラスタに
分類されている。
【0040】カテゴリ標準特徴ベクトル計算部1103
は、クラスタ内カテゴリ登録部1102に起動される
と、階層化認識辞書1104に記憶されている特徴ベク
トル欄1204、1205等を順次読み出し、同一欄
(同一のクラスタに分類されたカテゴリ)のカテゴリ標
準特徴ベクトルを式(数1)を用いて計算する。なお、
カテゴリ標準特徴ベクトル計算部1103で計算された
カテゴリ標準特徴ベクトルは、クラスタに分類されたカ
テゴリの標準特徴ベクトルであり、標準特徴計算部10
2で計算された標準特徴ベクトルが同一カテゴリ全ての
標準特徴ベクトルであるのと異なる。
【0041】カテゴリ標準特徴ベクトル計算部1103
は、階層化認識辞書1104の個々の特徴ベクトル欄1
204、1205等のカテゴリ標準特徴ベクトルを計算
すると、計算した特徴ベクトル欄を削除して、新たにカ
テゴリ標準特徴ベクトル欄1301(図13参照)を設
けて、カテゴリ(文字コード)に対応付けてカテゴリ標
準特徴ベクトルを書き込む。
【0042】階層化認識辞書1104は、RAM等から
なり、図13に示すように、クラスタ欄1201とクラ
スタ標準特徴ベクトル欄1202とクラスタ内カテゴリ
欄1203とカテゴリ標準特徴ベクトル欄1301とを
有する。クラスタ欄1201には、各クラスタのクラス
タ番号が記憶されている。クラスタ標準特徴ベクトル欄
1202には、クラスタ番号に対応したクラスタ標準特
徴ベクトルが記憶されている。以上の欄1201、12
02は、クラスタ代表辞書作成部103により書き込ま
れる。クラスタ内カテゴリ欄1203には、クラスタ標
準特徴ベクトルに代表されて分類されるカテゴリ(文字
コード)が記憶されている。この欄1203は、クラス
タ内カテゴリ登録部1102により書き込まれる。
【0043】カテゴリ標準特徴ベクトル欄1301に
は、クラスタに分類された学習パターンの特徴ベクトル
の算術平均であるクラスタ内のカテゴリ標準特徴ベクト
ルが記憶されている。この欄1301は、カテゴリ標準
特徴ベクトル計算部1103により書き込まれる。上述
(文字コード「あ」がクラスタxとクラスタyとの2つ
のクラスタに重複して分類される。)したように、クラ
スタiとクラスタjとに文字コード「軍」が分類され、
それらのカテゴリ標準特徴ベクトルはDk=(d(k,
1),…,d(k,n))、Ds=(d(s,1),…
d(s,n))とそれぞれ別の値として記憶されてい
る。
【0044】次に、本実施の形態固有の動作を図14、
図15のフローチャートを用いて説明する。先ず、クラ
スタ一致度計算部1101は、カウンタlに「1」を設
定し(S1402)、カテゴリlの学習パターンの特徴
ベクトルFl =(fl 1-1,…,fl 1-n )を全て読み出
す(S1404)。カウンタmに「1」を設定し(S1
406)、カウンタKに「1」を設定する(S140
8)。特徴ベクトルFmとクラスタ標準特徴ベクトルC
K との一致度(市街化距離)LCK を式(数6)を用い
て計算する(S1410)。カウンタKの値がクラスタ
数P以下か否かを判定する(S1412)。肯定であれ
ばカウンタKの値に「1」を加えて(S1413)、S
1410に戻る。
【0045】否定であれば、クラスタ内カテゴリ登録部
1102は、S1410で求めた市街化距離LCK が最
小値となるクラスタ番号qを求める(S1414)。ク
ラスタClqにカテゴリlを書き込み(S1416)、
カテゴリlの学習用パターンの特徴ベクトルFmをカテ
ゴリlに対応付けて書き込む(S1418)。次にカウ
ンタmの値がカテゴリlの学習用パターンの総数Ml以
下か否かを判定し(S1420)肯定であればカウンタ
mに「1」を加えて(S1422)、S1408に戻
る。否定であれば、カウンタlの値がカテゴリの総数N
未満であれば、カウンタlの値がカテゴリの総数N未満
であるか否かを判定し(S1424)、肯定であればカ
ウンタlに「1」を加えて(S1426)、1404に
戻る。
【0046】否定であればカテゴリ標準特徴ベクトル計
算部1103は、カウンタKに「1」を設定し1(S1
502)、クラスタClK に分類されているカテゴリを
読み出し(S1504)、カウンタmに「1」を設定す
る(S1506)。次に、カテゴリDClK.m に対応する
特徴ベクトルFClK.m 1,…,FClK.m nK 読み出し(S
1508)、クラスタK内のカテゴリ標準特徴ベクトル
ClK.m を式(数1)を用いて計算し、階層化認識辞書
1104に書き込む(S1510)。カウンタmの値が
クラスタClK に分類されているカテゴリの総数nK
下か否かを判断し(S1512)、肯定のときはカウン
タmに「1」を加えて(S1514)、S1508に戻
り、否定のときはカウンタKの値がクラスタ総数P以下
か否かを判定し(S1516)、肯定であればカウンタ
Kに「1」を加えて(S1518)、S1504に戻
り、否定であれば処理を終了する。以上のように本実施
の形態によれば、同一カテゴリの学習用パターンが2個
以上のクラスタに登録された場合には、各クラスタ毎に
カテゴリ標準特徴ベクトルがそれぞれ計算され、カテゴ
リ標準特徴ベクトル欄1301に書き込まれる。そのた
め1つのカテゴリであってもクラスタが複数に亘ること
となり認識精度を向上させることができる。
【0047】なお、本実施の形態では、カテゴリ特徴ベ
クトル計算部1103において、各クラスタに分類され
た同一カテゴリの特徴ベクトルに基づいて、各クラスタ
ごとのカテゴリの標準特徴ベクトルを求めたけれども、
本発明の他の実施の形態として、標準特徴計算部102
で計算された標準特徴ベクトルを複数のクラスタの同一
カテゴリの標準特徴ベクトルとしてもよい。
【0048】(実施の形態3)図16は、本発明に係る
パターン認識装置の実施の形態3の構成図である。この
パターン認識装置は、階層化認識辞書104と、特徴抽
出部1601と、クラスタ一致度計算部1602と、ク
ラスタ選択部1603と、クラスタ内カテゴリ照合部1
603と、クラスタ内カテゴリ照合部1604と、カテ
ゴリ決定部1605とを備えている。
【0049】階層化認識辞書104は、ROM等からな
り、実施の形態1のパターン認識用辞書作成装置で作成
されたものである。図7に示すように、クラスタ705
とカテゴリ706とが階層的に構成され、クラスタを代
表するクラスタ標準特徴ベクトル707とカテゴリを代
表する標準特徴ベクトル708とがそれぞれクラスタと
カテゴリとに対応付けられている。
【0050】特徴抽出部1601は、入力された未知の
パターンから特徴ベクトルF=(f 1,2,…,fn )を
抽出して、クラスタ一致度計算部1604に通知する。
クラスタ一致度計算部1602は、階層化認識辞書10
4からクラスタ欄702に示されるP個のクラスタのク
ラスタ標準特徴ベクトル707との一致度を市街化距離
LCi の式(数6)を用いて計算する。P個のクラスタ
について一致度を求めると、クラスタ選択部1603を
起動する。
【0051】クラスタ選択部1603は、クラスタ一致
度計算部1603に起動されると、クラスタ一致度計算
部1602で求められた各クラスタとの市街化距離LC
i をソートし、値の小さい方から並べ、例えば予め定め
たs個のクラスタを候補クラスタとして選択する。この
とき、クラスタ総数の5〜10%のクラスタを候補クラ
スタとして選択してもよい。候補クラスタの選択が終了
するとクラスタ内カテゴリ照合部1604を起動する。
【0052】クラスタ内カテゴリ照合部1604は、ク
ラスタ選択部1603に起動されると、候補クラスタと
されたs個のクラスタに分類された各カテゴリの標準特
徴ベクトルDを順次読み出して、特徴ベクトルFと市街
化距離LDを式(数7)を用いて計算する。
【0053】
【数7】 候補クラスタに選択された全てのカテゴリとの一致度の
計算が終了するとカテゴリ決定部1605を起動する。
カテゴリ決定部1605は、クラスタ内カテゴリ照合部
1604に起動されるとクラスタ内カテゴリ照合部16
04で得られた市街化距離LDの最小となる(一致度の
最も高い)標準特徴ベクトルに対応するカテゴリを階層
化認識辞書104から読み出し、認識結果と決定して出
力する。
【0054】例えば、クラスタ選択部1603で、予め
定められたSが「2」の場合に、クラスタiとクラスタ
jとが候補クラスタとして選択されたときには(図7参
照)、クラスタ内カテゴリ欄701に登録されているク
ラスタiの文字「責」、「草」、…、「軍」の標準特徴
ベクトル「Dh」…「Dk」及びクラスタjの文字コー
ド「軍」、「間」、…、「開」の標準特徴ベクトルとの
一致度が計算される。
【0055】次に、本実施の形態の動作を図17、図1
8のフローチャートを用いて説明する。先ず、特徴抽出
部1601は、入力パターンを受け取ると、特徴ベクト
ルF=(f1 ,….fn )を抽出する(S1702)。
クラスタ一致度計算部1602は、階層化認識化辞書1
04からクラスタ数をP読み出し、カウンタKに「1」
を設定する(S1704)。次にクラスタKのクラスタ
標準特徴ベクトルを読み出し、特徴ベクトルFとの市街
化距離LCK を式(数6)を用いて計算する(S170
6)。カウンタKの値がクラスタ総数P以下か否かを判
定し(S1708)、肯定のときはS1706に戻る。
【0056】否定であるときは、S1706で求めた市
街化距離LCK をソートし(1712)、距離の小さい
方から並べる(S1716)。値の小さい方からクラス
タをs個選択する(S1716)。次に、クラスタ内カ
テゴリ照合部1604は、カウンタKに「1」を設定し
(1806)、カウンタtに「0」を設定する(S18
02)。選択されたクラスタCk 内のカテゴリの標準特
徴ベクトルDk.l ,…,Dk.mk,を読み出し(mkはク
ラスタCk 内のカテゴリの総数である。)(S180
4)、カウンタjに「1」を設定し(S1806)、カ
テゴリDk.j との市街化距離LD(t+j)を式(数
7)を用いて計算する。次にカウンタjの値がカテゴリ
の総数mk以下であるか否かを判定し(S1810)、
肯定のときはカウンタjに1を加えて(1812)、S
1808に戻る。否定のときはカウンタKの値が選択数
S以下であるか否かを判定し(S1814)、肯定のと
きはカウンタtに「mK」を加え、(S1816)、カ
ウンタKに「1」を加えて(S1818)、S1804
に戻る。
【0057】否定のときは、カテゴリ決定部1605
は、S1808で得られた市街化距離LD1、LD2、
…、LDtの最小値に対応するカテゴリを選択する(S
1820)。選択されたカテゴリを認識結果として出力
する(S1822)。なお、本実施の形態のクラスタ選
択部1603において一致度の高いものから一定個数の
クラスタを選択するとしたが、一致度が予め定めた一定
値以上(距離値LCが一定値以下)のクラスタを選択す
ることもできる。
【0058】また、本実施の形態のクラスタ選択部16
03においては、一致度の高いものから順次クラスタを
選択し、選択されたクラスタ内カテゴリ数を順次計算
し、カテゴリ数が予め定めた一定個数例えば、全カテゴ
リ数の20%に到達するまでクラスタ数を選択してクラ
スタ選択をすることもできる。これによって、カテゴリ
の標準特徴との照合数を規制して処理時間を適正とする
ことができる。
【0059】更に、本実施の形態のカテゴリ決定部16
05は、クラスタ内カテゴリ照合部1604によって求
められた各カテゴリに対する一致度の中で最も一致度の
高いカテゴリを認識結果としたけれども、他の実施の形
態として、クラスタ一致度計算部1602で求められた
クラスタ標準特徴ベクトルとの一致度LCとクラスタ内
カテゴリ照合部1604で求められたカテゴリの標準特
徴ベクトルとの一致度LDとの両方を統合して、以下の
ように認識結果を決定することもできる。
【0060】例えば、入力パターンの特徴ベクトルを
F、クラスタ選択部1603において選択されたクラス
タiとの距離値をLC、クラスタi内のカテゴリである
文字コード「責」に対する距離値をLDhとすると、ク
ラスタi内のカテゴリである文字コード「責」に対する
一致度Wを W=LC+a×LD (aは予め定めた定数) のように定義することにより、クラスタとの一致度と各
カテゴリとの一致度を統合した総合一致度を計算し、最
も総合一致度の高いカテゴリを認識結果とする。
【0061】以上のように本実施の形態によれば、入力
パターンの特徴ベクトルと階層化認識辞書104に記憶
されているクラスタ標準特徴ベクトルとの照合を行い、
クラスタ選択部1603によって選択されたクラスタ内
のカテゴリの標準特徴ベクトルのみとの照合処理を行う
ことによって、不要なカテゴリとの照合処理を減少させ
ることができるため高速なパターン認識装置を実現でき
る。
【0062】なお、本実施の形態では、図16に示した
ような構成で本発明に係るパターン認識装置を実現した
けれども、本発明はプログラムによって実現し、これを
フロッピーディスク等の記録媒体に記録して移送するこ
とにより、独立した他のコンピュータ・システムで容易
に実施することができる。図19は、これをフロッピー
ディスクで実施する場合を説明する図である。
【0063】記録媒体本体であるフロッピーディスク1
901の物理フォーマットは、同心円状に外周から内周
に向かってトラック1、2、…、80を作成し、角度方
向に16のセクタに分割している。このように割り当て
られた領域に従って、プログラムを記録する。このフロ
ッピーディスク1901は、ケース1902に収納さ
れ、これによって、ディスクを埃や外部からの衝撃から
守り、安全に移送することができる。
【0064】図20は、フロッピーディスク1901に
プログラムの記録再生を行うことを説明する図である。
図示のようにコンピュータ・システム2003にフロッ
ピーディスクドライブ2001を接続することにより、
ディスク1901に対してプログラムを記録再生するこ
とが可能となる。ディスク1901はフロッピーディス
クドライブ2001に、挿入口2002を介して組込
み、および取り出しがなされる。記録する場合はコンピ
ュータ・システム2003からプログラムをフロッピー
ディスクドライブ2001によってディスク1901に
記録する。再生する場合は、フロッピーディスクドライ
ブ2001がプログラムをディスク1901から読み出
し、コンピュータ・システム2003に転送する。
【0065】なお、この実施の形態においては、記録媒
体としてフロッピーディスクを用いて説明を行ったが、
光ディスクを用いても同様に行うことができる。また記
録媒体はこれらに限られず、ICカード、ROMカセッ
ト等、プログラムを記録できるものであれば、同様に実
施することができる。
【0066】
【発明の効果】以上のように、本発明によれば、カテゴ
リごとに入力される複数の学習用パターンからそのカテ
ゴリの認識に用いる特徴量を抽出する特徴量抽出手段
と、前記特徴量抽出手段で抽出された特徴量に基づいて
各カテゴリごとの標準特徴量を計算する標準特徴量計算
手段と、前記標準特徴量計算手段で計算された標準特徴
量をクラスタ分析して、複数のクタスタに各カテゴリを
分類するカテゴリ分類手段とを有するパターン認識用辞
書作成装置であって、前記カテゴリ分類手段で分類され
た各カテゴリの標準特徴量に基づいてクラスタのクラス
タ標準特徴量を計算するクラスタ標準特徴量計算手段
と、前記クラスタ標準特徴量計算手段で計算されたクラ
スタのクラスタ標準特徴量と、前記カテゴリ分類手段で
該クラスタに分類されたカテゴリと、前記標準特徴量計
算手段で計算されたそのカテゴリの標準特徴量とを対応
して階層化認識辞書に登録する登録手段とを備えるよう
構成したので、各カテゴリの標準特徴量を分類した複数
のクラスタの各クラスタの標準特徴量をカテゴリ決定の
ための第1次の被認識対象とすることができる階層化認
識辞書が得られる。これによって、照合対象数を減らす
ことができ、認識結果たるカテゴリを短時間で決定でき
るパターン認識装置が実現できる。
【0067】また、本発明によれば、カテゴリごとに入
力される複数の学習用パターンからそのカテゴリの認識
に用いる特徴量を抽出する特徴量抽出手段と、前記特徴
量抽出手段で抽出された特徴量に基づいて各カテゴリご
との標準特徴量を計算する標準特徴量計算手段と、前記
標準特徴量計算手段で計算された標準特徴量をクラスタ
分析して、複数のクラスタに分類する分類手段とを有す
るパターン認識用辞書作成装置であって、前記分類手段
で分類された標準特徴量に基づいて、各クラスタごとの
クラスタ標準特徴量を計算するクラスタ標準特徴量計算
手段と、前記標準特徴量計算手段で計算されたカテゴリ
の標準特徴量と前記クラスタ標準特徴量計算手段で計算
された各クラスタのクラスタ標準特徴量との一致度を計
算する一致度計算手段と、前記一致度計算手段で計算さ
れた一致度の値の最も高いクラスタにカテゴリを分類す
るカテゴリ分類手段と、前記カテゴリ分類手段で分類さ
れたカテゴリと該カテゴリの標準特徴量とを前記クラス
タ標準特徴量とに対応して階層化認識辞書に登録する登
録手段とを備えるよう構成したので、各クラスタに一致
度の高いカテゴリを分類するので、カテゴリ決定のため
の第1次の被認識対象たるクラスタ標準特徴量からクラ
スタ候補を選択すると、第2次の被認識対象たるカテゴ
リを標準特徴量から精度よく決定することが可能な階層
化認識辞書を作成できる。
【0068】また、本発明によれば、前記階層化認識辞
書に登録されているクラスタ内のカテゴリのうち一致度
の値の最も低い値を該クラスタのクラスタ範囲と設定す
るクラスタ範囲設定手段と、前記クラスタ範囲設定手段
で設定されたクラスタのクラスタ範囲内に前記カテゴリ
分類手段で他のクラスタに分類されたカテゴリがあると
きには、階層化認識辞書の該クラスタに重複して該カテ
ゴリとその標準特徴量とを対応付けて追加登録する追加
登録手段とを備えるよう構成したので、クラスタに重複
してカテゴリを分類するので、クラスタ境界領域付近に
あるカテゴリを他のクラスタ候補からも認識結果とする
階層化認識辞書を得ることができる。記載のパターン認
識用辞書作成装置。
【0069】また、本発明によれば、前記追加登録手段
は、前記クラスタ標準特徴量計算手段で計算されたクラ
スタの標準特徴量と、前記標準特徴量計算手段で計算さ
れた各標準特徴量との一致度を計算する一致度計算部
と、前記一致度計算部で計算された一致度が当該クラス
タのクラスタ範囲内に前記カテゴリ分類手段で他のクラ
スタに分類された標準特徴量を有するカテゴリがあるか
否かを判定するクラスタ範囲判定部と、前記クラスタ範
囲判定部があると判定したとき、当該カテゴリとその標
準特徴量とを対応付けて当該クラスタに登録する重複登
録部とを有するよう構成しているので、カテゴリを確実
に複数クラスタに重複登録した階層化認識辞書を得るこ
とができる。
【0070】また、本発明によれば、カテゴリごとに入
力される複数の学習用パターンからそのカテゴリの認識
に用いる特徴量を抽出する特徴量抽出手段と、前記特徴
量抽出手段で抽出された特徴量に基づいて各カテゴリご
との標準特徴量を計算する標準特徴量計算手段と、前記
標準特徴量計算手段で計算された標準特徴量をクラスタ
分析して、複数のクラスタに分類する分類手段とを有す
るパターン認識用辞書作成装置であって、前記分類手段
で分類された標準特徴量に基づいて、各クラスタごとの
クラスタ標準特徴量を計算するクラスタ標準特徴量計算
手段と、前記特徴量抽出手段で抽出された特徴量と前記
クラスタ標準特徴量計算手段で計算された各クラスタの
クラスタ標準特徴量との一致度を計算する学習パターン
−クラスタ一致度計算手段と、前記学習パターン−クラ
スタ一致度計算手段で計算された一致度の最も高いクラ
スタに当該カテゴリと特徴量とを分類する特徴量分類手
段と、前記特徴量分類手段で分類された同一カテゴリの
特徴量に基づいて各カテゴリごとの当該クラスタにおけ
るクラスタ内標準特徴量を計算するクラスタ内標準特徴
量計算手段と、前記カテゴリ分類手段で分類されたカテ
ゴリと前記クラスタ内標準特徴量計算手段で計算された
該カテゴリのクラスタ内標準特徴量とを前記クラスタ標
準特徴量とに対応付けて階層化認識辞書に登録する登録
手段とを備えるよう構成しているので、分類されたクラ
スタにカテゴリを分類する際に、個々の学習用パターン
から抽出された特徴量との一致度を用いるので、学習用
パターンに拡がり(多様なパターン)がある場合にも、
十分その特徴量を代表するクラスタにカテゴリを分類
し、またその分類したクラスタのカテゴリごとの特徴量
に基づいて第2次の被認識対象たる標準特徴量を精度よ
く得ることができる。
【0071】また、本発明によれば、カテゴリごとに入
力される複数の学習用パターンからそのカテゴリの認識
に用いる特徴量を抽出する特徴量抽出手段と、前記特徴
量抽出手段で抽出された特徴量に基づいて各カテゴリご
との標準特徴量を計算する標準特徴量計算手段と、前記
標準特徴量計算手段で計算された標準特徴量をクラスタ
分析して、複数のクラスタに分類する分類手段とを有す
るパターン認識用辞書作成装置であって、前記分類手段
で分類された標準特徴量に基づいて、各クラスタごとの
クラスタ標準特徴量を計算するクラスタ標準特徴量計算
手段と、前記特徴量抽出手段で抽出された特徴量と前記
クラスタ標準特徴量計算手段で計算された各クラスタの
クラスタ標準特徴量との一致度を計算する学習パターン
−クラスタ一致度計算手段と、前記学習パターン−クラ
スタ一致度計算手段で計算された一致度の最も高いクラ
スタに当該カテゴリを分類する特徴量分類手段と、前記
特徴量分類手段で分類されたカテゴリと、該カテゴリの
前記標準特徴量計算手段で計算された標準特徴量とを前
記クラスタ標準特徴量に対応付けて階層化認識辞書に登
録する登録手段とを備えるよう構成しているので、分類
されたクラスタにカテゴリを分類する際に、個々の学習
用パターンから抽出された特徴量との一致度を用いるの
で、学習用パターンに拡がりがある場合にも、十分その
特徴量を代表するクラスタにカテゴリを分類することが
できる。
【0072】また、本発明によれば、前記クラスタ標準
特徴量計算手段は、同一クラスタ内の全カテゴリの標準
特徴量の各要素を算術平均してクラスタ標準特徴量の各
要素とするようしているので、クラスタを代表する特徴
量を正しく把えることができる。また、本発明によれ
ば、上記一致度の計算は、市街化距離、二乗距離又は類
似度のいずれか一により計算されるようしているので、
一致度を正確に把えることができる。
【0073】また、本発明によれば、入力パターンをカ
テゴリとして認識するパターン認識装置であって、各カ
テゴリの学習用パターンの特徴量に基づいて計算された
標準特徴量とカテゴリとを、当該標準特徴量のクラスタ
分析によって複数のクラスタに分類して、分類したクラ
スタと、クラスタに属するカテゴリの標準特徴量に基づ
いて計算されたクラスタ標準特徴量とに対応付けて登録
している階層化認識辞書と、入力パターンから認識に用
いる特徴量を抽出する特徴量抽出手段と、前記特徴量抽
出手段で抽出された特徴量と前記階層化認識辞書に登録
されているクラスタ標準特徴量との一致度を計算するク
ラスタ一致度計算手段と、前記クラスタ一致度計算手段
で計算された一致度に基づいて候補クラスタを選択する
候補クラスタ選択手段と、前記候補クラスタ選択手段で
選択された候補クラスタに対応付けられた標準特徴量と
前記特徴量抽出手段で抽出された特徴量との一致度を計
算するカテゴリ一致度計算手段と、前記カテゴリ一致度
計算手段で計算された一致度に基づいて認識結果である
カテゴリを決定するカテゴリ決定手段とを備えるよう構
成しているので、第1の被認識対象としてクラスタ標準
特徴量と入力パターンの特徴量とから計算した一致度に
基づいて候補クラスタを選択して、選択されたクラスタ
内の第2の被認識対象として標準特徴量と入力パターン
の特徴量とから計算した一致度に基づいて認識結果たる
カテゴリを決定できるので、照合に要する時間を短縮し
た効率的なパターン認識装置を得ることができる。
【0074】また、本発明によれば、前記候補クラスタ
選択手段は、前記クラスタ一致度計算手段で計算された
一致度に基づいて、一致度の高いクラスタから順に所定
個数のクラスタを候補クラスタとして選択する所定数候
補クラスタ選択部を有するよう構成しているので、所定
個数の候補クラスタに分類されたクラスタ内のカテゴリ
の標準特徴量と入力パターンの特徴量との一致度だけを
計算することで、認識結果たるカテゴリを精度よく決定
できるので、認識処理に要する処理時間を短縮すること
ができる。
【0075】また、本発明によれば、前記候補クラスタ
選択手段は、前記クラスタ一致度計算手段で計算された
一致度に基づいて、一致度が予め定めたしきい値以上の
クラスタを候補クラスタとして選択するしきい値候補ク
ラスタ選択部を有するよう構成しているので、少ないカ
テゴリの標準特徴量との一致度の計算により、精度よく
カテゴリを決定することができる。
【0076】また、本発明によれば、前記候補クラスタ
選択手段は、前記クラスタ一致度計算手段で計算された
一致度に基づいて、一致度の最も高いクラスタの一致度
を基準値として基準値との差又は比が一定値以内の一致
度を有するクラスタを候補クラスタとして選択する基準
値候補クラスタ選択部を有するよう構成しているので、
候補クラスタの選択漏れが防止され、精度のよいカテゴ
リの決定が短時間でできる。
【0077】また、本発明によれば、前記候補クラスタ
選択手段は、前記クラスタ一致度計算手段で計算された
一致度の高いクラスタから順にクラスタ内に登録されて
いるカテゴリ数が予め定めたカテゴリ数に到達するまで
のクラスタを候補クラスタとして選択するカテゴリ数候
補クラスタ選択部を有するよう構成しているので、入力
パターンの特徴量と一致度を計算するカテゴリの標準特
徴量の数を規制することによって、処理時間を短縮して
認識の効率化を図ることができる。
【0078】また、本発明によれば、前記カテゴリ決定
手段は、前記クラスタ選択手段で選択された候補クラス
タの前記クラスタ一致度計算手段で計算された一致度
と、前記カテゴリ一致度計算手段で計算された一致度と
に基づいて総合一致度を計算する総合一致度計算部と、
前記総合一致度計算部で計算された総合一致度に基づい
てカテゴリを決定する総合カテゴリ決定部とを有するよ
う構成しているので、クラスタの一致度とカテゴリの一
致度との両方を加味してカテゴリを決定し、更に精度よ
く短時間にカテゴリを決定できる。
【0079】更に、本発明によれば、階層化認識辞書を
用いて入力パターンをカテゴリとして認識するパターン
認識方法が記録された記録媒体であって、各カテゴリの
学習用パターンの特徴量に基づいて計算された標準特徴
量とカテゴリとを、当該標準特徴量のクラスタ分析によ
って複数のクラスタに分類して、分類したクラスタと、
クラスタに属するカテゴリの標準特徴量に基づいて計算
されたクラスタ標準特徴量とに対応付けて登録している
階層化認識辞書と、以下の特定ステップを実行するプロ
グラムとが記録され、特定ステップには、入力パターン
から認識に用いる特徴量を抽出する特徴量抽出ステップ
と、前記特徴量抽出ステップで抽出された特徴量と前記
階層化認識辞書に登録されているクラスタ標準特徴量と
の一致度を計算するクラスタ一致度計算ステップと、前
記クラスタ一致度計算ステップで計算された一致度に基
づいて候補クラスタを選択する候補クラスタ選択ステッ
プと、前記候補クラスタ選択ステップで選択された候補
クラスタに対応付けられた標準特徴量と前記特徴量抽出
ステップで抽出された特徴量との一致度を計算するカテ
ゴリ一致度計算ステップと、前記カテゴリ一致度計算ス
テップで計算された一致度に基づいて認識結果であるカ
テゴリを決定するカテゴリ決定ステップとを含むことと
しているので、パターン認識機能を有しない他のパーソ
ナルコンピュータと相俟って、上記パターン認識装置と
同様の効果を容易に得ることができる。
【図面の簡単な説明】
【図1】本発明に係るパターン認識用辞書作成装置の実
施の形態1の構成図である。
【図2】上記実施の形態において入力される学習用パタ
ーンの一例を示す説明図である。
【図3】上記実施の形態の特徴抽出部で抽出された特徴
ベクトルの一例を示す説明図である。
【図4】上記実施の形態のクラスタ内のカテゴリ設定部
の詳細な構成図である。
【図5】上記実施の形態のクラスタ内カテゴリ登録部の
処理内容の説明図である。
【図6】上記実施の形態のクラスタ範囲設定部でのクラ
スタ範囲の設定の説明図である。
【図7】上記実施の形態の階層化認識辞書の一例を示す
説明図である。
【図8】上記実施の形態の動作を説明するフローチャー
トである。
【図9】上記実施の形態の動作を説明するフローチャー
トである。
【図10】上記実施の形態の動作を説明するフローチャ
ートである。
【図11】本発明に係るパターン認識用辞書作成装置の
実施の形態2の構成図である。
【図12】上記実施の形態の階層化認識辞書の作成途中
の状態を示す説明図である。
【図13】上記実施の形態の階層化認識辞書の記憶内容
の説明図である。
【図14】上記実施の形態の動作を説明するフローチャ
ートである。
【図15】上記実施の形態の動作を説明するフローチャ
ートである。
【図16】本発明に係るパターン認識装置の実施の形態
3の構成図である。
【図17】上記実施の形態の動作を説明するフローチャ
ートである。
【図18】上記実施の形態の動作を説明するフローチャ
ートである。
【図19】本発明に係るパターン認識方法のプログラム
を記録した記録媒体の構成を示す説明図である。
【図20】上記記録媒体のコンピュータシステムへの装
脱着を説明する図である。
【符号の説明】
101 特徴抽出部 102 標準特徴計算部 103 クラスタ代表辞書作成部 104、1104 階層化認識辞書 105 クラスタ内カテゴリ設定部 106 クラスタ内辞書作成部 401、1101 クラスタ一致度計算部 402、1102 クラスタ内カテゴリ登録部 403 クラスタ範囲設定部 404 クラスタ拡張部 702、1201 クラスタ欄 703、1202 クラスタ標準特徴ベクトル欄 1103 カテゴリ標準特徴計算部 701、1203 クラスタ内カテゴリ欄 704 標準特徴ベクトル欄 1204、1205 特徴ベクトル欄 1301 カテゴリ標準特徴ベクトル欄 1601 特徴抽出部 1602 クラスタ一致度計算部 1603 クラスタ選択部 1604 クラスタ内カテゴリ一致度計算部 1605 カテゴリ決定部

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 カテゴリごとに入力される複数の学習用
    パターンからそのカテゴリの認識に用いる特徴量を抽出
    する特徴量抽出手段と、 前記特徴量抽出手段で抽出された特徴量に基づいて各カ
    テゴリごとの標準特徴量を計算する標準特徴量計算手段
    と、 前記標準特徴量計算手段で計算された標準特徴量をクラ
    スタ分析して、複数のクタスタに各カテゴリを分類する
    カテゴリ分類手段とを有するパターン認識用辞書作成装
    置であって、 前記カテゴリ分類手段で分類された各カテゴリの標準特
    徴量に基づいてクラスタのクラスタ標準特徴量を計算す
    るクラスタ標準特徴量計算手段と、 前記クラスタ標準特徴量計算手段で計算されたクラスタ
    のクラスタ標準特徴量と、前記カテゴリ分類手段で該ク
    ラスタに分類されたカテゴリと、前記標準特徴量計算手
    段で計算されたそのカテゴリの標準特徴量とを対応して
    階層化認識辞書に登録する登録手段とを備えることを特
    徴とするパターン認識用辞書作成装置。
  2. 【請求項2】 カテゴリごとに入力される複数の学習用
    パターンからそのカテゴリの認識に用いる特徴量を抽出
    する特徴量抽出手段と、 前記特徴量抽出手段で抽出された特徴量に基づいて各カ
    テゴリごとの標準特徴量を計算する標準特徴量計算手段
    と、 前記標準特徴量計算手段で計算された標準特徴量をクラ
    スタ分析して、複数のクラスタに分類する分類手段とを
    有するパターン認識用辞書作成装置であって、 前記分類手段で分類された標準特徴量に基づいて、各ク
    ラスタごとのクラスタ標準特徴量を計算するクラスタ標
    準特徴量計算手段と、 前記標準特徴量計算手段で計算されたカテゴリの標準特
    徴量と前記クラスタ標準特徴量計算手段で計算された各
    クラスタのクラスタ標準特徴量との一致度を計算する一
    致度計算手段と、 前記一致度計算手段で計算された一致度の値の最も高い
    クラスタにカテゴリを分類するカテゴリ分類手段と、 前記カテゴリ分類手段で分類されたカテゴリと該カテゴ
    リの標準特徴量とを前記クラスタ標準特徴量とに対応し
    て階層化認識辞書に登録する登録手段とを備えることを
    特徴とするパターン認識用辞書作成装置。
  3. 【請求項3】 前記階層化認識辞書に登録されているク
    ラスタ内のカテゴリのうち一致度の値の最も低い値を該
    クラスタのクラスタ範囲と設定するクラスタ範囲設定手
    段と、 前記クラスタ範囲設定手段で設定されたクラスタのクラ
    スタ範囲内に前記カテゴリ分類手段で他のクラスタに分
    類されたカテゴリがあるときには、階層化認識辞書の該
    クラスタに重複して該カテゴリとその標準特徴量とを対
    応付けて追加登録する追加登録手段とを備えることを特
    徴とする請求項2記載のパターン認識用辞書作成装置。
  4. 【請求項4】 前記追加登録手段は、 前記クラスタ標準特徴量計算手段で計算されたクラスタ
    の標準特徴量と、前記標準特徴量計算手段で計算された
    各標準特徴量との一致度を計算する一致度計算部と、 前記一致度計算部で計算された一致度が当該クラスタの
    クラスタ範囲内に前記カテゴリ分類手段で他のクラスタ
    に分類された標準特徴量を有するカテゴリがあるか否か
    を判定するクラスタ範囲判定部と、 前記クラスタ範囲判定部があると判定したとき、当該カ
    テゴリとその標準特徴量とを対応付けて当該クラスタに
    登録する重複登録部とを有することを特徴とする請求項
    3記載のパターン認識用辞書作成装置。
  5. 【請求項5】 カテゴリごとに入力される複数の学習用
    パターンからそのカテゴリの認識に用いる特徴量を抽出
    する特徴量抽出手段と、 前記特徴量抽出手段で抽出された特徴量に基づいて各カ
    テゴリごとの標準特徴量を計算する標準特徴量計算手段
    と、 前記標準特徴量計算手段で計算された標準特徴量をクラ
    スタ分析して、複数のクラスタに分類する分類手段とを
    有するパターン認識用辞書作成装置であって、 前記分類手段で分類された標準特徴量に基づいて、各ク
    ラスタごとのクラスタ標準特徴量を計算するクラスタ標
    準特徴量計算手段と、 前記特徴量抽出手段で抽出された特徴量と前記クラスタ
    標準特徴量計算手段で計算された各クラスタのクラスタ
    標準特徴量との一致度を計算する学習パターン−クラス
    タ一致度計算手段と、 前記学習パターン−クラスタ一致度計算手段で計算され
    た一致度の最も高いクラスタに当該カテゴリと特徴量と
    を分類する特徴量分類手段と、 前記特徴量分類手段で分類された同一カテゴリの特徴量
    に基づいて各カテゴリごとの当該クラスタにおけるクラ
    スタ内標準特徴量を計算するクラスタ内標準特徴量計算
    手段と、 前記カテゴリ分類手段で分類されたカテゴリと前記クラ
    スタ内標準特徴量計算手段で計算された該カテゴリのク
    ラスタ内標準特徴量とを前記クラスタ標準特徴量とに対
    応付けて階層化認識辞書に登録する登録手段とを備える
    ことを特徴とするパターン認識用辞書作成装置。
  6. 【請求項6】 カテゴリごとに入力される複数の学習用
    パターンからそのカテゴリの認識に用いる特徴量を抽出
    する特徴量抽出手段と、 前記特徴量抽出手段で抽出された特徴量に基づいて各カ
    テゴリごとの標準特徴量を計算する標準特徴量計算手段
    と、 前記標準特徴量計算手段で計算された標準特徴量をクラ
    スタ分析して、複数のクラスタに分類する分類手段とを
    有するパターン認識用辞書作成装置であって、 前記分類手段で分類された標準特徴量に基づいて、各ク
    ラスタごとのクラスタ標準特徴量を計算するクラスタ標
    準特徴量計算手段と、 前記特徴量抽出手段で抽出された特徴量と前記クラスタ
    標準特徴量計算手段で計算された各クラスタのクラスタ
    標準特徴量との一致度を計算する学習パターン−クラス
    タ一致度計算手段と、 前記学習パターン−クラスタ一致度計算手段で計算され
    た一致度の最も高いクラスタに当該カテゴリを分類する
    特徴量分類手段と、 前記特徴量分類手段で分類されたカテゴリと、該カテゴ
    リの前記標準特徴量計算手段で計算された標準特徴量と
    を前記クラスタ標準特徴量に対応付けて階層化認識辞書
    に登録する登録手段とを備えることを特徴とするパター
    ン認識用辞書作成装置。
  7. 【請求項7】 前記クラスタ標準特徴量計算手段は、同
    一クラスタ内の全カテゴリの標準特徴量の各要素を算術
    平均してクラスタ標準特徴量の各要素とすることを特徴
    とする請求項1、2、3、4、5又は6記載のパターン
    認識用辞書作成装置。
  8. 【請求項8】 上記一致度の計算は、市街化距離、二乗
    距離又は類似度のいずれか一により計算されることを特
    徴とする請求項2、3、4、5、6又は7記載のパター
    ン認識用辞書作成装置。
  9. 【請求項9】 入力パターンをカテゴリとして認識する
    パターン認識装置であって、 各カテゴリの学習用パターンの特徴量に基づいて計算さ
    れた標準特徴量とカテゴリとを、当該標準特徴量のクラ
    スタ分析によって複数のクラスタに分類して、分類した
    クラスタと、クラスタに属するカテゴリの標準特徴量に
    基づいて計算されたクラスタ標準特徴量とに対応付けて
    登録している階層化認識辞書と、 入力パターンから認識に用いる特徴量を抽出する特徴量
    抽出手段と、 前記特徴量抽出手段で抽出された特徴量と前記階層化認
    識辞書に登録されているクラスタ標準特徴量との一致度
    を計算するクラスタ一致度計算手段と、 前記クラスタ一致度計算手段で計算された一致度に基づ
    いて候補クラスタを選択する候補クラスタ選択手段と、 前記候補クラスタ選択手段で選択された候補クラスタに
    対応付けられた標準特徴量と前記特徴量抽出手段で抽出
    された特徴量との一致度を計算するカテゴリ一致度計算
    手段と、 前記カテゴリ一致度計算手段で計算された一致度に基づ
    いて認識結果であるカテゴリを決定するカテゴリ決定手
    段とを備えることを特徴とするパターン認識装置。
  10. 【請求項10】 前記候補クラスタ選択手段は、 前記クラスタ一致度計算手段で計算された一致度に基づ
    いて、一致度の高いクラスタから順に所定個数のクラス
    タを候補クラスタとして選択する所定数候補クラスタ選
    択部を有することを特徴とする請求項9記載のパターン
    認識装置。
  11. 【請求項11】 前記候補クラスタ選択手段は、 前記クラスタ一致度計算手段で計算された一致度に基づ
    いて、一致度が予め定めたしきい値以上のクラスタを候
    補クラスタとして選択するしきい値候補クラスタ選択部
    を有することを特徴とする請求項9記載のパターン認識
    装置。
  12. 【請求項12】 前記候補クラスタ選択手段は、 前記クラスタ一致度計算手段で計算された一致度に基づ
    いて、一致度の最も高いクラスタの一致度を基準値とし
    て基準値との差又は比が一定値以内の一致度を有するク
    ラスタを候補クラスタとして選択する基準値候補クラス
    タ選択部を有することを特徴とする請求項9記載のパタ
    ーン認識装置。
  13. 【請求項13】 前記候補クラスタ選択手段は、 前記クラスタ一致度計算手段で計算された一致度の高い
    クラスタから順にクラスタ内に登録されているカテゴリ
    数が予め定めたカテゴリ数に到達するまでのクラスタを
    候補クラスタとして選択するカテゴリ数候補クラスタ選
    択部を有することを特徴とする請求項9記載のパターン
    認識装置。
  14. 【請求項14】 前記カテゴリ決定手段は、 前記クラスタ選択手段で選択された候補クラスタの前記
    クラスタ一致度計算手段で計算された一致度と、前記カ
    テゴリ一致度計算手段で計算された一致度とに基づいて
    総合一致度を計算する総合一致度計算部と、 前記総合一致度計算部で計算された総合一致度に基づい
    てカテゴリを決定する総合カテゴリ決定部とを有するこ
    とを特徴とする請求項9、10、11、12又は13記
    載のパターン認識装置。
  15. 【請求項15】 階層化認識辞書を用いて入力パターン
    をカテゴリとして認識するパターン認識方法が記録され
    た記録媒体であって、 各カテゴリの学習用パターンの特徴量に基づいて計算さ
    れた標準特徴量とカテゴリとを、当該標準特徴量のクラ
    スタ分析によって複数のクラスタに分類して、分類した
    クラスタと、クラスタに属するカテゴリの標準特徴量に
    基づいて計算されたクラスタ標準特徴量とに対応付けて
    登録している階層化認識辞書と、 以下の特定ステップを実行するプログラムとが記録さ
    れ、 特定ステップには、 入力パターンから認識に用いる特徴量を抽出する特徴量
    抽出ステップと、 前記特徴量抽出ステップで抽出された特徴量と前記階層
    化認識辞書に登録されているクラスタ標準特徴量との一
    致度を計算するクラスタ一致度計算ステップと、 前記クラスタ一致度計算ステップで計算された一致度に
    基づいて候補クラスタを選択する候補クラスタ選択ステ
    ップと、 前記候補クラスタ選択ステップで選択された候補クラス
    タに対応付けられた標準特徴量と前記特徴量抽出ステッ
    プで抽出された特徴量との一致度を計算するカテゴリ一
    致度計算ステップと、 前記カテゴリ一致度計算ステップで計算された一致度に
    基づいて認識結果であるカテゴリを決定するカテゴリ決
    定ステップとを含むことを特徴とする記録媒体。
JP8167364A 1996-06-27 1996-06-27 パターン認識用辞書作成装置及びパターン認識装置 Pending JPH1011543A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8167364A JPH1011543A (ja) 1996-06-27 1996-06-27 パターン認識用辞書作成装置及びパターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8167364A JPH1011543A (ja) 1996-06-27 1996-06-27 パターン認識用辞書作成装置及びパターン認識装置

Publications (1)

Publication Number Publication Date
JPH1011543A true JPH1011543A (ja) 1998-01-16

Family

ID=15848353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8167364A Pending JPH1011543A (ja) 1996-06-27 1996-06-27 パターン認識用辞書作成装置及びパターン認識装置

Country Status (1)

Country Link
JP (1) JPH1011543A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7577297B2 (en) 2002-12-16 2009-08-18 Canon Kabushiki Kaisha Pattern identification method, device thereof, and program thereof
WO2011081192A1 (ja) * 2009-12-28 2011-07-07 サイバーアイ・エンタテインメント株式会社 画像認識システム
JP2016009363A (ja) * 2014-06-25 2016-01-18 株式会社日立製作所 生体情報を利用する認証システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7577297B2 (en) 2002-12-16 2009-08-18 Canon Kabushiki Kaisha Pattern identification method, device thereof, and program thereof
WO2011081192A1 (ja) * 2009-12-28 2011-07-07 サイバーアイ・エンタテインメント株式会社 画像認識システム
JP5721233B2 (ja) * 2009-12-28 2015-05-20 サイバーアイ・エンタテインメント株式会社 画像認識システム
JP2016009363A (ja) * 2014-06-25 2016-01-18 株式会社日立製作所 生体情報を利用する認証システム

Similar Documents

Publication Publication Date Title
US4685142A (en) Method and device for handwritten letter recognition
US9141853B1 (en) System and method for extracting information from documents
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
US20150199567A1 (en) Document classification assisting apparatus, method and program
US8103099B2 (en) Method and system for recognizing characters and character groups in electronically represented text
CN110019913A (zh) 图片匹配方法、用户设备、存储介质及装置
US6560359B2 (en) Data processing method and apparatus
JPH1011543A (ja) パターン認識用辞書作成装置及びパターン認識装置
JP4861730B2 (ja) 文字認識装置、その文字認識方法及び文字認識プログラムならびに集積回路
JPH0729003A (ja) 指紋照合装置
JP2002183667A (ja) 文字認識装置及び記録媒体
JPH0766423B2 (ja) 文字認識装置
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JP2019096118A (ja) パターン認識プログラム、装置、及び方法
JP3487400B2 (ja) 文字認識装置、文字認識方法、及び、記憶媒体
JP2868770B2 (ja) パターン辞書の構成方式
JP2766205B2 (ja) 文字認識装置
JP3812779B2 (ja) 統合性能評価方法及びシステム並びに情報記録媒体
JPH07114622A (ja) 文字認識装置の後処理方法
CN118467606A (zh) 基于多策略和多大语言模型组合的实体匹配方法及系统
JPS646514B2 (ja)
JP2023021946A (ja) データ検索方法及びシステム
JP3720405B2 (ja) 領域識別装置及び方法
JPS63118993A (ja) 文字認識方法
JP2923295B2 (ja) パターン同定処理方式