JP3264242B2 - 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 - Google Patents

認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Info

Publication number
JP3264242B2
JP3264242B2 JP03385598A JP3385598A JP3264242B2 JP 3264242 B2 JP3264242 B2 JP 3264242B2 JP 03385598 A JP03385598 A JP 03385598A JP 3385598 A JP3385598 A JP 3385598A JP 3264242 B2 JP3264242 B2 JP 3264242B2
Authority
JP
Japan
Prior art keywords
vector
subspace
input
correcting
input vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03385598A
Other languages
English (en)
Other versions
JPH10301917A (ja
Inventor
敦 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP03385598A priority Critical patent/JP3264242B2/ja
Publication of JPH10301917A publication Critical patent/JPH10301917A/ja
Application granted granted Critical
Publication of JP3264242B2 publication Critical patent/JP3264242B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、パターン認識装置
で用いられる認識辞書を学習により生成する技術に関す
る。
【0002】
【従来の技術】入力パターンから抽出された特徴ベクト
ルと予め用意されている認識辞書とを照合することによ
り入力パターンがどのカテゴリに属するかを判定し、そ
の判定結果に基づいてパターン認識を行うということは
従来から行われている。また、パターン認識に使用する
認識辞書を生成する際、学習用に用意された入力ベクト
ル群に対して統計処理等を行い、属すべきでないカテゴ
リに誤認識される率が少なくなるような認識辞書を自動
的に生成するということも従来から行われている。
【0003】ところで、認識辞書を学習により生成する
認識辞書学習方法としては、距離尺度としてユークリッ
ド距離を用いた学習ベクトル量子化(LVQ)と呼ばれ
るものが、従来から良く知られている(例えば、T.K
ohonen:”The Neural Phonet
ic Typewriter”,IEEE Compu
ter,Vol.21,No.3,pp.11〜2
2)。しかし、この方法は、認識辞書として用いられる
参照ベクトルが発散する問題があり、必ずしも誤認識の
少ない認識辞書を得られないことが指摘されている。こ
の参照ベクトルの発散を解決する方法として、距離のべ
き乗項を修正係数に含める方法(例えば、特願平7−1
58069号公報)も提案されているが、そもそもユー
クリッド距離を使用する場合は、分布の広がりを一点で
表現しているため、パターンの変動に弱いという問題が
ある。
【0004】そこで、パターンの変動に対しても高い識
別能力を得られるようにするために、分布の広がりを
線,面等の部分空間で表現し、入力ベクトルと各カテゴ
リの部分空間との投影距離を距離尺度として用いるよう
にした投影距離法と呼ばれる方法が提案されている(例
えば、池田,田中,元岡:「手書き文字認識における投
影距離法」,情報処理学会論文誌,Vol.24,N
o.1,pp.106〜112,1983)。
【0005】投影距離法では、部分空間の原点に、その
部分空間と同一カテゴリに属する入力ベクトルの平均値
を用いている。また、部分空間の基底ベクトルは、カテ
ゴリ毎に主成分分析を用いて決定している。即ち、共分
散行列の固有ベクトルの固有値の大きいものから順にp
個を選ぶようにしている。投影距離法は、分布の広がり
を線,面で表現しているので、ユークリッド距離を用い
た場合に比べてパターン変動に強いが、上記したよう
に、主成分分析を用いて部分空間の基底ベクトルを決定
しているため、出現頻度の高い分布中心の入力ベクトル
の影響が大きく、誤認識されやすいカテゴリ境界付近の
入力ベクトルが反映されにくい問題がある。
【0006】ここで、入力ベクトルと部分空間との投影
距離の求め方について簡単に説明しておく。
【0007】入力ベクトルをx、部分空間の原点をφ
0 、部分空間の正規直交基底ベクトルをφ1,…,φp
すると、入力ベクトルxの部分空間への射影ベクトルy
は次式(1)に示すものとなる。尚、式(1)に於い
て、pは部分空間の次元数を表し、a・bは2つのベク
トルa,bの内積を表す。
【0008】
【数1】
【0009】この結果、入力ベクトルxと部分空間との
投影距離Dp は、次式(2)を用いることにより求める
ことができる。
【0010】
【数2】
【0011】尚、p=2とした場合の投影距離Dp は、
図16に示すものとなる。
【0012】上記した投影距離法の問題点を解決するた
めに、学習部分空間法(LSM)と呼ばれる方法が従来
から提案されている(例えば、エルッキ・オヤ:「パタ
ーン認識と部分空間法」,産業図書,1986、或いは
T.Kohonen,“Self−Organizin
g Maps”,Springer−Verlag,1
995)。
【0013】学習部分空間法では、部分空間の原点φ0
を0として、投影距離の代わりに部分空間への射影長が
用いられているが、φ0 ≠0の場合にも容易に適用でき
る。この方法は、誤認識となった入力ベクトルについ
て、正解となるべきカテゴリの部分空間との距離が小さ
くなるように、また、誤認識先である競合カテゴリの部
分空間との距離が大きくなるように、各部分空間を回転
させることにより、誤認識を減少させるようにしてい
る。具体的には、着目した部分空間について、基底ベク
トルの1つを(y−x)に置き換えて正規直交化した
後、各基底ベクトルについて次式(3)に示す修正を行
った後、大きさを1に正規化する。
【0014】 φj ←φj +θ{(x−φ0 )・φj }(x−φ0 ) … (3)
【0015】ここで、θは回転の大きさを制御するパラ
メータであり、正の場合には入力ベクトルとの距離が小
さくなり、負の場合には入力ベクトルとの距離は大きく
なる。従って、正解カテゴリの部分空間についてはθ>
0で、競合カテゴリの部分空間についてはθ<0で回転
させれば、誤認識数を減らすことができる。しかし、学
習部分空間法は、部分空間の回転しか行っておらず、部
分空間の原点は固定のため、誤認識数低減には限界があ
る。
【0016】このような問題を解決するため、部分空間
を回転させた後、部分空間の原点を移動させる方法も提
案されている(例えば、特開平7−311846号公
報)。この方法では、射影ベクトルyを用いて、次式
(4)に示すように、部分空間の原点φ0 を、その部分
空間に直交する方向に平行移動させる。
【0017】 φ0 ←φ0 +τ(x−y)/‖x−y‖ … (4)
【0018】ここで、‖a‖はベクトルaのノルムを表
し、τは移動量の大きさを制御するパラメータである。
τが正の場合には、入力ベクトルとの距離が小さくなる
ため、部分空間の回転だけでは限界となる誤認識数を更
に減らすことができる。この方法の具体的な手順は、以
下の通りである。
【0019】先ず、或る着目カテゴリについて、誤認識
となる頻度の高い競合カテゴリを選定すると共に、学習
用誤認識パターン(着目カテゴリに誤認識された競合カ
テゴリに属するパターン,競合カテゴリに誤認識された
着目カテゴリに属するパターン)を求めておく。
【0020】次に、学習用誤認識パターンの中から1つ
のパターンを選択する。そして、選択したパターンが、
着目カテゴリに誤認識された競合カテゴリに属するパタ
ーンであった場合は、そのパターンと着目カテゴリの部
分空間との間の距離が大きくなる方向に部分空間を回転
させ、選択したパターンが、競合カテゴリに誤認識され
た着目カテゴリに属するパターンであった場合は、その
パターンと着目カテゴリの部分空間との間の距離が小さ
くなる方向に部分空間を回転させるという処理を、誤認
識パターンの総数が減少から増加に転じるまで行う。そ
の後、学習用誤認識パターンの中から別のパターンを1
つ選択し、上述したと同様の処理を行う。
【0021】このような処理を予め定められた回数行う
と、学習用誤認識パターンの中からパターンを1つ選択
する。そして、選択したパターンが、着目カテゴリに誤
認識された競合カテゴリに属するパターンであった場合
は、そのパターンと着目カテゴリの部分空間との間の距
離が大きくなる方向に部分空間を平行移動させ、選択し
たパターンが、競合カテゴリに誤認識された着目カテゴ
リに属するパターンであった場合は、そのパターンと着
目カテゴリの部分空間との間の距離が小さくなる方向に
部分空間を平行移動させるという処理を、誤認識パター
ンの総数が減少から増加に転じるまで行う。その後、学
習用誤認識パターンの中から別のパターンを1つ選択
し、上述したと同様の処理を行う。そして、このような
処理を予め定められた回数行うと、別のカテゴリを着目
カテゴリにして前述したと同様の処理を行う。以上の処
理を全てのカテゴリについて行う。上記したように、こ
の方法は、部分空間の修正を着目カテゴリの部分空間に
ついてのみ行っているので、処理量を削減することがで
きる。
【0022】一方、部分空間に対する投影距離に重みを
付けた次式(5)に示す距離尺度が既に提案されている
(例えば、黒沢:「部分空間法とベイズ識別の関係から
導かれる新しいパターン認識方式」,電子情報通信学会
技術報告,PRMU96−104,1996)。
【0023】
【数3】
【0024】nをベクトルの次元数,λi を固有値, δ
を任意の値をとるパラメータとし、wj ,w0 をそれぞ
れ次式(6),(7)とした場合は、疑似ベイズの距離
としてして知られる(若林,鶴岡,木村,三宅:「手書
き数字認識における特徴選択に関する考察」,電子情報
通信学会論文誌D−II,Vol.J78−D−II,N
o.11,pp.1627〜1638,1995)。
【0025】
【数4】
【0026】単なる投影距離を用いた場合は部分空間が
無限に広がるため、固有ベクトルの向く方向に他のカテ
ゴリが存在する場合は誤認識が多く発生する問題がある
が、重み付き投影距離を用いると、部分空間の広がりを
抑える効果があるため、誤認識を低減することができ
る。これを図17を用いて説明する。
【0027】入力空間を2次元,カテゴリをA,Bの2
つとし、それぞれ斜線に示すようにデータが分布してい
るとする。各カテゴリに1つの部分空間を用意し、原点
を×で示した位置に、基底ベクトルを矢印で示した向き
に設定した場合、単なる投影距離を用いた時の識別面
は、図に破線で示すように設定される。この場合の部分
空間は1次元(直線)であるが、基底ベクトルが作る直
線上は投影距離が0になるため、カテゴリAについては
カテゴリBに誤認識されるデータが多く存在する。重み
付き投影距離を用いた場合は、識別面は図に実線で示し
たようになるため、誤認識が低減される効果がある。
【0028】
【発明が解決しようとする課題】しかしながら、特開平
7−311846号公報に記載されている技術は、着目
カテゴリについてのみ部分空間を修正し、誤認識先の競
合カテゴリについては修正を行わないため、誤認識率の
低減に限界があるという問題があった。更に、誤認識率
を学習の基準としているため、学習パターンに依存した
認識辞書ができやすいという問題もあった。以下、これ
らの問題点を詳細に説明する。
【0029】図18に示すように、4つのカテゴリA,
B,C,Dに属するパターンがそれぞれ実線で囲ったよ
うに分布しており、それぞれの部分空間がSA,B,C,
Dのように設定されているとする。この場合の識別面
は、破線で示すものになるため、カテゴリBの斜線で示
した部分のパターンは誤認識されることになる。この誤
認識を減らすため、従来の技術では、カテゴリBの部分
空間SB を回転させたり、平行移動させたりして誤認識
となる領域(斜線部分)に近づけようとするが、それに
伴いカテゴリC, Dとの識別面も左側へ移動し、図19
に示すように、カテゴリBに属するパターンについて新
たな誤認識が発生し、部分空間SB は右方向に戻されて
しまう。競合カテゴリであるカテゴリAの部分空間SA
も修正すれば、誤認識率を容易に低減させることができ
るが、従来の技術ではこのことが考慮されていないた
め、誤認識率を十分に低減させることは難しかった。
【0030】また、誤認識率を学習の基準とした場合、
図20に示すように、誤認識がなくなった時点で学習が
終了してしまい、破線で示すように、学習パターンのす
ぐ近くに識別面が設定されてしまう。学習は有限個のサ
ンプル数で行われるので、未学習パターンの分布は学習
パターンの分布とは必ずしも一致せず、このような識別
面では、未学習パターンに対して誤認識が起こりやす
い。つまり、誤認識率を学習の基準とした場合は、学習
パターンに依存した認識辞書ができてしまい、未学習パ
ターンに対する認識性能が低下してしまう。
【0031】また、「部分空間法とベイズ識別の関係か
ら導かれる新しいパターン認識方式」に記載されている
技術は、他カテゴリを考慮せずに部分空間を求めている
ため、誤認識低減に限界があるという問題があった。こ
れについて、以下に簡単に説明する。
【0032】疑似ベイズでは、カテゴリ毎に部分空間の
固有値と固有ベクトルを求めており、その後、更に誤読
が減るようなパラメータδの値を試行錯誤によって求め
ている。δ=0の場合は投影距離と一致し、部分空間が
無限に広がる問題があるが、δを大きくすることによっ
て部分空間の広がりが抑えられ、誤読が低減される。し
かし、カテゴリ毎に部分空間を求めているため、δの調
整による誤認識の低減には限界がある。
【0033】そこで、本発明の目的は、学習パターンに
対する誤認識率を十分に低減することができ、且つ未学
習パターンについても高い認識性能を有する認識辞書を
生成する技術を提供することにある。
【0034】
【課題を解決するための手段】本発明の認識辞書学習方
法は、学習パターンに対する誤認識率を十分に低減でき
る認識辞書を生成できるようにするため、学習パターン
から抽出された特徴ベクトルを入力ベクトルとして用
い、認識辞書となる部分空間を決定する認識辞書学習方
法であって、各カテゴリに属する部分空間群の初期設定
を行う初期値設定段階と、学習用に用意された入力ベク
トル群の中から1つの入力ベクトルを選択する入力段階
と、該選択した入力ベクトルと同じカテゴリに属する部
分空間群の中から、前記入力ベクトルとの距離が最小と
なる第1の部分空間を求めると共に、前記入力ベクトル
と異なるカテゴリに属する部分空間群の中から前記入力
ベクトルとの距離が最小となる第2の部分空間を求める
辞書検索段階と、前記第1の部分空間が前記入力ベクト
ルに近づくように、前記第1の部分空間の原点を表す第
1の位置ベクトルを、前記第1の部分空間と直交する方
向に修正する第1の原点修正段階と、前記第2の部分空
間が前記入力ベクトルから遠ざかるように、前記第2の
部分空間の原点を表す第2の位置ベクトルを、前記第2
の部分空間と直交する方向に修正する第2の原点修正段
階と、前記入力ベクトルから前記第1の位置ベクトルを
引いたベクトルとの内積の絶対値が大きくなるように、
前記第1の部分空間の各基底ベクトルを修正する第1の
基底ベクトル修正段階と、前記入力ベクトルから前記第
2の位置ベクトルを引いたベクトルとの内積の絶対値が
小さくなるように、前記第2の部分空間の各基底ベクト
ルを修正する第2の基底ベクトル修正段階と、前記第1
の基底ベクトル修正段階に於いて修正が行われた各基底
ベクトルを、それらが正規直交系をなすように修正する
と共に、前記第2の基底ベクトル修正段階に於いて修正
が行われた各基底ベクトルを、それらが正規直交系をな
すように修正する基底ベクトル直交化段階とを含む。
【0035】また、本発明の認識辞書学習方法は、未学
習パターンに対しても高い認識性能を有する認識辞書を
生成できるようにするため、前記辞書検索段階に於い
て、前記入力ベクトルと前記第1の部分空間との距離値
である第1の距離値を求めると共に、前記入力ベクトル
と前記第2の部分空間との距離値である第2の距離値を
求め、前記第1の原点修正段階,前記第2の原点修正段
階,前記第1の基底ベクトル修正段階及び前記第2の基
底ベクトル修正段階に於いて、前記第1の距離値と前記
第2の距離値との差が少ない場合ほど、修正量を多くす
る。
【0036】また、本発明の認識辞書学習方法は、学習
パターンに対する誤認識率を更に低減できる認識辞書を
作成できるようにするため、学習パターンから抽出され
た特徴ベクトルを入力ベクトルとして用い、認識辞書と
なる部分空間とその重みパラメータを決定する認識辞書
学習方法であって、各カテゴリに属する部分空間群とそ
の重みパラメータの初期設定を行う初期値設定段階と、
学習用に用意された入力ベクトル群の中から1つの入力
ベクトルを選択する入力段階と、該選択した入力ベクト
ルと同じカテゴリに属する部分空間群の中から、前記入
力ベクトルとの重み付き投影距離が最小となる第1の部
分空間を求めると共に、前記選択した入力ベクトルと異
なるカテゴリに属する部分空間群の中から、前記入力ベ
クトルとの重み付き投影距離が最小となる第2の部分空
間を求める辞書検索段階と、前記第1の部分空間と前記
入力ベクトルとの重み付き投影距離が短くなるように、
前記第1の部分空間の原点を表す第1の位置ベクトルを
修正する第1の原点修正段階と、前記第2の部分空間と
前記入力ベクトルとの重み付き投影距離が長くなるよう
に、前記第2の部分空間の原点を表す第2の位置ベクト
ルを修正する第2の原点修正段階と、前記第1の部分空
間の各基底ベクトルを、前記入力ベクトルから前記第1
の位置ベクトルを引いたベクトルとの内積の絶対値が大
きくなるように修正する第1の基底ベクトル修正段階
と、前記第2の部分空間の各基底ベクトルを、前記入力
ベクトルから前記第2の位置ベクトルを引いたベクトル
との内積の絶対値が小さくなるように修正する第2の基
底ベクトル修正段階と、前記第1の基底ベクトル修正段
階に於いて修正が行われた各基底ベクトルを、それらが
正規直交系をなすように修正すると共に、前記第2の基
底ベクトル修正段階に於いて修正が行われた各基底ベク
トルを、それらが正規直交系をなすように修正する基底
ベクトル直交化段階と、前記第1の部分空間の第1の重
みパラメータを値が大きくなるように修正する第1の重
みパラメータ修正段階と、前記第2の部分空間の第2の
重みパラメータを値が小さくなるように修正する第2の
重みパラメータ修正段階とを含む。
【0037】また、本発明の認識辞書学習装置は、学習
パターンに対する誤認識率を十分に低減できる認識辞書
を生成できるようにするため、学習パターンから抽出さ
れた特徴ベクトルを入力ベクトルとして用い、認識辞書
となる部分空間を決定する認識辞書学習装置であって、
各カテゴリに属する部分空間群の初期設定を行う初期値
設定手段と、学習用に用意された入力ベクトル群の中か
ら1つの入力ベクトルを選択する入力手段と、該入力手
段が選択した入力ベクトルと同じカテゴリに属する部分
空間群の中から、前記入力ベクトルとの距離が最小とな
る第1の部分空間を求めると共に、前記入力ベクトルと
異なるカテゴリに属する部分空間群の中から前記入力ベ
クトルとの距離が最小となる第2の部分空間を求める辞
書検索手段と、前記第1の部分空間が前記入力ベクトル
に近づくように、前記第1の部分空間の原点を表す第1
の位置ベクトルを、前記第1の部分空間と直交する方向
に修正する第1の原点修正手段と、前記第2の部分空間
が前記入力ベクトルから遠ざかるように、前記第2の部
分空間の原点を表す第2の位置ベクトルを、前記第2の
部分空間と直交する方向に修正する第2の原点修正手段
と、前記入力ベクトルから前記第1の位置ベクトルを引
いたベクトルとの内積の絶対値が大きくなるように、前
記第1の部分空間の各基底ベクトルを修正する第1の基
底ベクトル修正手段と、前記入力ベクトルから前記第2
の位置ベクトルを引いたベクトルとの内積の絶対値が小
さくなるように、前記第2の部分空間の各基底ベクトル
を修正する第2の基底ベクトル修正手段と、前記第1の
基底ベクトル修正手段に於いて修正が行われた各基底ベ
クトルを、それらが正規直交系をなすように修正すると
共に、前記第2の基底ベクトル修正手段に於いて修正が
行われた各基底ベクトルを、それらが正規直交系をなす
ように修正する基底ベクトル直交化手段とを備えてい
る。
【0038】上記した構成に於いては、初期値設定手段
が、各カテゴリに属する部分空間群の初期設定を行い、
入力手段が、学習用に用意された入力ベクトル群の中か
ら1つの入力ベクトルを選択する。入力手段によって、
入力ベクトルが選択されると、辞書検索手段が、選択さ
れた入力ベクトルと同じカテゴリに属する部分空間群の
中から、入力ベクトルとの距離が最小となる第1の部分
空間を求めると共に、入力ベクトルと異なるカテゴリに
属する部分空間群の中から入力ベクトルとの距離が最小
となる第2の部分空間を求める。
【0039】辞書検索手段によって、第1,第2の部分
空間が求められると、第1の原点修正手段が、第1の部
分空間が入力ベクトルに近づくように、第1の部分空間
の原点を表す第1の位置ベクトルを、第1の部分空間と
直交する方向に修正し、第2の原点修正手段が、第2の
部分空間が入力ベクトルから遠ざかるように、第2の部
分空間の原点を表す第2の位置ベクトルを、第2の部分
空間と直交する方向に修正する。更に、第1の基底ベク
トル修正手段が、入力ベクトルから第1の位置ベクトル
を引いたベクトルとの内積の絶対値が大きくなるよう
に、第1の部分空間の各基底ベクトルを修正し、第2の
基底ベクトル修正手段が、入力ベクトルから第2の位置
ベクトルを引いたベクトルとの内積の絶対値が小さくな
るように、第2の部分空間の各基底ベクトルを修正す
る。
【0040】その後、基底ベクトル直交化手段が、第1
の基底ベクトル修正手段に於いて修正が行われた各基底
ベクトルを、それらが正規直交系をなすように修正する
と共に、第2の基底ベクトル修正手段に於いて修正が行
われた各基底ベクトルを、それらが正規直交系をなすよ
うに修正する。
【0041】更に、本発明の認識辞書学習装置は、未学
習パターンに対しても高い認識性能を有する認識辞書を
生成できるようにするため、前記辞書検索手段は、前記
入力ベクトルと前記第1の部分空間との距離値である第
1の距離値を求めると共に、前記入力ベクトルと前記第
2の部分空間との距離値である第2の距離値を求める構
成を備え、前記第1の原点修正手段,前記第2の原点修
正手段,前記第1の基底ベクトル修正手段及び前記第2
の基底ベクトル修正手段は、前記辞書検索手段で求めら
れた前記第1の距離値と前記第2の距離値との差が少な
い場合ほど、修正量を多くする構成を備えている。
【0042】この構成に於いては、辞書検索手段が、入
力ベクトルと第1の部分空間との距離値である第1の距
離値を求めると共に、入力ベクトルと第2の部分空間と
の距離値である第2の距離値を求める。そして、第1の
原点修正手段,第2の原点修正手段,第1の基底ベクト
ル修正手段及び第2の基底ベクトル修正手段は、辞書検
索手段で求められた前記第1の距離値と前記第2の距離
値との差が少ない場合ほど、修正量を多くする。
【0043】また、本発明の認識辞書学習装置は、学習
パターンに対する誤認識率を更に低減できる認識辞書を
生成できるようにするため、学習パターンから抽出され
た特徴ベクトルを入力ベクトルとして用い、認識辞書と
なる部分空間とその重みパラメータを決定する認識辞書
学習装置であって、各カテゴリに属する部分空間群とそ
の重みパラメータの初期設定を行う初期値設定手段と、
学習用に用意された入力ベクトル群の中から1つの入力
ベクトルを選択する入力手段と、該入力手段が選択した
入力ベクトルと同じカテゴリに属する部分空間群の中か
ら、前記入力ベクトルとの重み付き投影距離が最小とな
る第1の部分空間を求めると共に、前記選択した入力ベ
クトルと異なるカテゴリに属する部分空間群の中から、
前記入力ベクトルとの重み付き投影距離が最小となる第
2の部分空間を求める辞書検索手段と、前記第1の部分
空間と前記入力ベクトルとの重み付き投影距離が短くな
るように、前記第1の部分空間の原点を表す第1の位置
ベクトルを修正する第1の原点修正手段と、前記第2の
部分空間と前記入力ベクトルとの重み付き投影距離が長
くなるように、前記第2の部分空間の原点を表す第2の
位置ベクトルを修正する第2の原点修正手段と、前記第
1の部分空間の各基底ベクトルを、前記入力ベクトルか
ら前記第1の位置ベクトルを引いたベクトルとの内積の
絶対値が大きくなるように修正する第1の基底ベクトル
修正手段と、前記第2の部分空間の各基底ベクトルを、
前記入力ベクトルから前記第2の位置ベクトルを引いた
ベクトルとの内積の絶対値が小さくなるように修正する
第2の基底ベクトル修正手段と、前記第1の基底ベクト
ル修正手段に於いて修正が行われた各基底ベクトルを、
それらが正規直交系をなすように修正すると共に、前記
第2の基底ベクトル修正手段に於いて修正が行われた各
基底ベクトルを、それらが正規直交系をなすように修正
する基底ベクトル直交化手段と、前記第1の部分空間の
第1の重みパラメータを値が大きくなるように修正する
第1の重みパラメータ修正手段と、前記第2の部分空間
の第2の重みパラメータを値が小さくなるように修正す
る第2の重みパラメータ修正手段とを備えている。
【0044】上記した構成に於いては、初期値設定手段
が、各カテゴリに属する部分空間群とその重みパラメー
タとの初期設定を行い、入力手段が、学習用に用意され
た入力ベクトル群の中から1つの入力ベクトルを選択す
る。入力手段によって、入力ベクトルが選択されると、
辞書検索手段が、選択された入力ベクトルと同じカテゴ
リに属する部分空間群の中から、入力ベクトルとの重み
付き投影距離が最小となる第1の部分空間を求めると共
に、選択した入力ベクトルと異なるカテゴリに属する部
分空間群の中から、入力ベクトルとの重み付き投影距離
が最小となる第2の部分空間を求める。
【0045】辞書検索手段によって、第1,第2の部分
空間が求められると、第1の原点修正手段が、第1の部
分空間と入力ベクトルとの重み付き投影距離が短くなる
ように、第1の部分空間の原点を表す第1の位置ベクト
ルを修正し、第2の原点修正手段が、第2の部分空間と
入力ベクトルとの重み付き投影距離が長くなるように、
第2の部分空間の原点を表す第2の位置ベクトルを修正
する。更に、第1の基底ベクトル修正手段が、第1の部
分空間の各基底ベクトルを、入力ベクトルから第1の位
置ベクトルを引いたベクトルとの内積の絶対値が大きく
なるように修正し、第2の基底ベクトル修正手段が、第
2の部分空間の各基底ベクトルを、入力ベクトルから第
2の位置ベクトルを引いたベクトルとの内積の絶対値が
小さくなるように修正する。
【0046】その後、基底ベクトル直交化手段が、第1
の基底ベクトル修正手段に於いて修正が行われた各基底
ベクトルを、それらが正規直交系をなすように修正する
と共に、第2の基底ベクトル修正手段に於いて修正が行
われた各基底ベクトルを、それらが正規直交系をなすよ
うに修正する。更に、第1の重みパラメータ修正手段
が、第1の部分空間の第1の重みパラメータを値が大き
くなるように修正し、第2の重みパラメータ修正手段
が、第2の部分空間の第2の重みパラメータを値が小さ
くなるように修正する。
【0047】次に、請求項1に係る発明の原理について
説明する。この発明は、入力パターンが誤認識される危
険度を表す量が減るように、正解カテゴリの部分空間の
回転と平行移動ばかりでなく、競合カテゴリの部分空間
の回転と平行移動も行うことを最も主要な特徴とする。
【0048】先ず、入力ベクトルxと部分空間との投影
距離の2乗を用いて、距離尺度dを次式(8)に示すよ
うに定義する。尚、式(8)に於いて、φ0 は部分空間
の原点の位置ベクトル、φj は部分空間の正規直交基底
ベクトル、pは部分空間の次元数を表す。
【0049】
【数5】
【0050】次に、入力ベクトルと同じカテゴリの部分
空間群(1カテゴリ当たり、M個の部分空間が用意され
ている)の中でdが最小となる部分空間をS1 とし、そ
の距離値をd1 とする。同様に、入力ベクトルと異なる
カテゴリの部分空間群の中でdが最小となる部分空間を
2 とし、その距離値をd2 とする。これらの距離値d
1,2 を用いて、入力ベクトルが誤認識となる危険度μ
を次式(9)に示すように定義すると、μ<0の場合は
入力ベクトルは正しく認識され、μ>0の場合は誤認識
されることになる。
【0051】 μ=(d1 −d2 )/(d1 +d2 ) … (9)
【0052】従って、N個の学習パターンの全てについ
て誤認識される危険度を減らすためには、次式(10)
に示すEの値が減少するように部分空間を修正すれば良
い。尚、式(10)に於いて、f(μ)はμに関する単
調増加関数である。
【0053】
【数6】
【0054】部分空間S1 については、その原点を表す
位置ベクトルをφ10、基底ベクトルをφ11, , φ1p
すると、次式(11)に示すような修正を行うことによ
り、Eの値は必ず減少する。なお、式(11)に於い
て、αは正の微小な実数である。
【0055】
【数7】
【0056】部分空間S2 についても同様で、原点を表
す位置ベクトルをφ20、基底ベクトルをφ21, , φ2p
とすると、次式(12)に示すような修正を行うことに
より、Eの値は必ず減少する。
【0057】
【数8】
【0058】具体的に修正内容を求めると、次式(1
3)〜(16)に示すものとなる。但し、何の制約条件
もなしに基底ベクトルを修正すると、必ずしも正規直交
系をなさないので、基底ベクトルの修正後に、グラムシ
ュミットの直交化などで修正を行う必要がある。
【0059】
【数9】
【0060】今、入力ベクトルの部分空間S1 への射影
ベクトルをy1 、部分空間S2 への射影ベクトルをy
2 、θ1,θ2 をそれぞれ次式(17),(18)に示す
ものとする。
【0061】
【数10】
【0062】このようにすると、本発明による部分空間
の原点に関する修正式は次式(19),(20)に示す
ものとなる。
【0063】 φ10←φ10+θ1 (x−y1 ) …(19) φ20←φ20−θ2 (x−y2 ) …(20)
【0064】この式(19),(20)は、従来技術
(特開平7−311846号公報)にに於ける原点の修
正式と類似の式となっている。しかし、従来技術は、着
目カテゴリの部分空間S1 についてのみ修正を行ってお
り、競合カテゴリの部分空間S2 についても修正を行っ
ている本発明とは異なる。
【0065】また、基底ベクトルに関する本発明の修正
式は次式(21),(22)に示すものとなり、学習部
分空間法(LSM)と同等の式になっていることが判
る。
【0066】 φ1j←φ1j+θ1 {(x−φ10)・φ1j}(x−φ10) …(21) φ2j←φ2j−θ2 {(x−φ20)・φ2j}(x−φ20) …(22)
【0067】しかし、LSMでは部分空間の回転だけを
行い、原点の修正を行っておらず、この点が原点の修正
も行う本発明と相違する。
【0068】更に、特開平7−311846号公報やL
SMでは、修正係数θ1,θ2 の値をパラメータとして与
えているが、本発明では学習パターン全体について誤認
識される危険度が減るように求めている点が相違する。
【0069】また、特開平7−311846号公報やL
SMでは、誤認識したパターンについてのみ学習を行っ
ているが、本発明ではdf/dμの定義によって、どの
パターンに重みを置いて学習するのかを柔軟に指定する
ことができる。即ち、μ>0の時はdf/dμ=1、μ
<0の時はdf/dμ=0と定義すれば、誤認識したパ
ターンについてのみ学習を行うことになる。また、df
/dμをμ=0でピークを持つ単峰性の関数とすれば、
μが0に近いパターン、即ちカテゴリの境界付近のパタ
ーンに重みを置いた学習を行うことになる。誤認識を起
こしやすいパターンは、主にカテゴリ境界付近に存在す
るため、これらを重点的に学習することにより、未学習
パターンに対しても高い認識性能を有する辞書を作成す
ることが可能となる。
【0070】次に、請求項3に係る発明の原理について
説明する。この発明は、入力パターンが誤認識される危
険度を表す量が減るように、正解カテゴリの部分空間の
回転,平行移動と重みの変更を行うと共に、競合カテゴ
リの部分空間の回転,平行移動と重みの変更を行うこと
を最も主要な特徴とする。
【0071】先ず、入力ベクトルxと部分空間との重み
付き投影距離の2乗を用いて、距離尺度dを次式(2
3)に示すように定義する。
【0072】
【数11】
【0073】次に、入力ベクトルxと同じカテゴリの部
分空間群の中でdが最小となる部分空間をS1 とし、そ
の距離値をd1 とする。同様に、入力ベクトルと異なる
カテゴリの部分空間群の中でdが最小となる部分空間を
2 とし、その距離値をd2とする。これらの距離値d
1,2 を用いて、入力ベクトルが誤認識となる危険度μ
を次式(24)に示すように定義すると、μ<0の場合
は入力ベクトルは正しく認識され、μ>0の場合は誤認
識されることになる。
【0074】 μ=(d1 −d2 )/(d1 +d2 ) …… (24)
【0075】従って、N個の学習パターン全てについて
誤認識される危険度を減らすためには次式(25)に示
すEの値が減少するように部分空間を修正すれば良い。
尚、式(25)に於いて、f(μ)は、μに関する単調
増加関数である。
【0076】
【数12】
【0077】部分空間S1 の原点を表す位置ベクトルを
φ10、基底ベクトルをφ11, ……,φ1p、重みをw10,
……, w1pとすると、次式(26),(27)に示すよ
うな修正を行うことにより、Eの値は必ず減少する。但
し、式(26),(27)に於いて、αは正の微小な実
数である。
【0078】
【数13】
【0079】部分空間S2 についても同様で、原点を表
す位置ベクトルをφ20、基底ベクトルをφ21, ……, φ
2P、重みをw20, ……, w2pとすると、次式(28),
(29)に示すような修正を行うことにより、Eの値は
必ず減少する。
【0080】
【数14】
【0081】具体的に修正内容を求めると、次式(3
0)〜(37)に示すものとなる。
【0082】
【数15】
【0083】但し、何の制約もなしに基底ベクトルを修
正すると、必ずしも正規直交系をなさないので、上記し
た式によって修正した後、グラムシュミットの直交化な
どで修正する必要がある。また、距離値が負になる場合
も生じるので、重みパラメータの値に制限を加えても良
い。
【0084】疑似ベイズでは正解カテゴリのサンプルの
みを使って部分空間が求められ、試行錯誤によってパラ
メータδが決定されるが、本発明では正解カテゴリと競
合カテゴリの両方のサンプルを使い、学習パターン全体
について誤認識される危険度が減るように部分空間と重
みパラメータが求められる点が異なる。
【0085】
【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
【0086】図1は本発明の認識辞書学習装置の第1の
実施例のブロック図であり、初期値設定手段101と、
入力手段102と、辞書検索手段103と、第1辞書修
正手段104と、第2辞書修正手段108と、終了判定
手段112と、認識辞書113と、入力ベクトル群記憶
部114とを備えている。
【0087】入力ベクトル群記憶部114には、各学習
パターンそれぞれについて、何らかの特徴抽出法を用い
て作成したn次元の入力ベクトルが格納される。尚、本
実施例では、カテゴリ数をK、学習パターンの総数をN
とする。また、学習パターンは、各カテゴリについて少
なくとも1つは用意されている。
【0088】認識辞書113には、各部分空間の原点を
表すn次元の位置ベクトルとn次元のp個の基底ベクト
ルとが格納される。尚、本実施例に於いては、1カテゴ
リ当たりM個の部分空間が用意されているとする。
【0089】初期値設定手段101は、認識辞書113
に各部分空間の中心の位置ベクトル,基底ベクトルを格
納することにより、各部分空間を初期設定する機能を有
する。
【0090】入力手段102は、学習用に用意された入
力ベクトル群の中から1つの入力ベクトルを選択する機
能を有する。
【0091】辞書検索手段103は、入力手段102に
よって選択された入力ベクトルと同じカテゴリに属する
部分空間群の中から入力ベクトルとの投影距離が最小と
なる第1の部分空間を求めると共にその投影距離を2乗
した値(第1の距離値)を求め、更に、上記入力ベクト
ルと異なるカテゴリに属する部分空間群の中から入力ベ
クトルとの距離値が最小となる第2の部分空間を求める
と共にその投影距離を2乗した値(第2の距離値)を求
める機能を有する。
【0092】第1辞書修正手段104は、第1原点修正
手段105,第1基底ベクトル修正手段106及び第1
基底ベクトル直交化手段107を備えており、それらを
用いて辞書検索手段103によって求められた第1の部
分空間を修正する機能を有する。
【0093】第1原点修正手段105は、辞書検索手段
103で求められた第1の部分空間が入力手段102で
選択された入力ベクトルに近づくように、第1の部分空
間の原点を表す位置ベクトルを、第1の部分空間と直交
する方向に修正する機能を有する。つまり、第1原点修
正手段105は、第1の部分空間を、それが入力ベクト
ルに近づくように平行移動させる機能を有する。
【0094】第1基底ベクトル修正手段106は、入力
手段102で選択された入力ベクトルから第1の部分空
間の原点の位置ベクトルを引いたベクトルとの内積の絶
対値が大きくなる方向に、第1の部分空間の各基底ベク
トルを修正する機能を有する。つまり、第1基底ベクト
ル修正手段106は、第1の部分空間を、それが入力ベ
クトルに近づくように、回転させる機能を有する。
【0095】第1基底ベクトル直交化手段107は、第
1基底ベクトル修正手段106によって修正された第1
の部分空間の各基底ベクトルを、それが正規直交系をな
すように修正する機能を有する。
【0096】第2辞書修正手段108は、第2原点修正
手段109,第2基底ベクトル修正手段110,第2基
底ベクトル直交化手段111を備えており、それらを用
いて辞書検索手段103によって求められた第2の部分
空間を修正する機能を有する。
【0097】第2原点修正手段109は、辞書検索手段
103で求められた第2の部分空間が入力手段102で
選択された入力ベクトルから遠ざかるように、第2の部
分空間の原点の位置ベクトルを、部分空間と直交する方
向に修正する機能を有する。つまり、第2原点修正手段
109は、第2の部分空間を、それが入力ベクトルから
遠ざかる方向に平行移動させる機能を有する。
【0098】第2基底ベクトル修正手段110は、入力
手段102で選択された入力ベクトルから第2の部分空
間の原点の位置ベクトルを引いたベクトルとの内積の絶
対値が小さくなる方向に、第2の部分空間の各基底ベク
トルを修正する機能を有する。つまり、第2基底ベクト
ル修正手段110は、第2の部分空間を、それが入力ベ
クトルから遠ざかる方向に、回転させる機能を有する。
【0099】第2基底ベクトル直交化手段111は、第
2基底ベクトル修正手段110によって修正された第2
の部分空間の各基底ベクトルを、それらが正規直交系を
なすように修正する機能を有する。
【0100】終了判定手段112は、学習が終了したか
否かを判定する機能を有する。
【0101】図2は初期値設定手段101の処理例を示
す流れ図、図3は入力手段102,辞書検索手段10
3,第1辞書修正手段104,第2辞書修正手段10
8,終了判定手段112の処理例を示す流れ図、図4は
第1辞書修正手段104の詳細な処理例を示す流れ図、
図5は第2辞書修正手段108の詳細な処理内容を示す
流れ図であり、以下各図を参照して本実施例の動作につ
いて説明する。
【0102】図1に示した認識辞書学習装置に於いて
は、先ず、初期値設定手段101が図2の流れ図に示す
ステップS201〜S209の処理を行う。
【0103】S201に於いては、カテゴリ番号を表す
変数cに「1」を設定する。次のステップS202に於
いては、K平均アルゴリズムによって、カテゴリ番号
「1」のカテゴリに属するM個の部分空間の原点の位置
ベクトルφ0 1〔1〕,…,φ0 1〔M〕を求め、それらを
認識辞書113に設定する。
【0104】その後、ステップS203に於いて、部分
空間番号を表す変数iに「1」を設定する。次のステッ
プS204に於いて、一様乱数により、カテゴリ番号
「1」のカテゴリに属するM個の部分空間の内の、部分
空間番号「1」の部分空間の各基底ベクトルφ
1 1〔1〕,…,φp 1 〔1〕を求め、それらを認識辞書
113に設定する。
【0105】その後、ステップS205に於いて、グラ
ムシュミットの直交化によって、ステップS204で設
定したp個の基底ベクトルφ1 1〔1〕,…,φp 1
〔1〕が正規直交系をなすように、それらを修正する。
【0106】次のステップS206では、部分空間番号
を表す変数iの値と部分空間の個数Mとを比較する。そ
して、両者が等しくない場合(ステップS206がN
O)は、ステップS207で変数iの値を1加算した
後、ステップS204に帰還し、等しい場合(ステップ
S206がYES)は、ステップS208に進む。
【0107】ステップS208では、カテゴリ番号を表
す変数cの値とカテゴリ数Kとを比較する。そして、両
者が等しくない場合(ステップS208がNO)は、ス
テップS209で変数cの値を1加算した後、ステップ
S202に帰還し、両者が等しい場合(ステップS20
8がYES)は、初期設定手段101はその処理を終了
し、制御を入力手段102に渡す。
【0108】入力手段102は、制御を渡されると、図
3の流れ図に示すように、ステップS301に於いて、
学習回数を表す変数tに「1」を設定し、次のステップ
S302に於いて学習パターン番号を表す変数qに
「1」を設定する。
【0109】その後、ステップS303に於いて、入力
ベクトル群記憶部114に格納されている入力ベクトル
群の中から学習パターン番号が「1」の学習パターンに
対応する入力ベクトルxを選択し、選択した入力ベクト
ルxを辞書検索手段103,第1辞書修正手段104,
第2辞書修正手段108に渡す。
【0110】辞書検索手段103は、入力手段102か
ら入力ベクトルxが渡されると、ステップS304に於
いて、認識辞書113を参照することにより、入力ベク
トルxと同じカテゴリに属する部分空間の中から入力ベ
クトルxとの間の投影距離が最も短い第1の部分空間を
探し出し、その部分空間の原点の位置ベクトルφ10と、
基底ベクトルφ11, , φ1pと、第1の部分空間と入力
ベクトルxとの間の投影距離を2乗した第1の距離値d
1 とを第1辞書修正手段104に渡すと共に、第1の距
離値d1 を第2辞書修正手段108に渡す。
【0111】ここで、第1の距離値d1 は次式(38)
に示すものとなる。
【0112】
【数16】
【0113】その後、辞書検索手段103は、ステップ
S305に於いて、認識辞書113を参照することによ
り、入力ベクトルxと異なるカテゴリに属する部分空間
の中から入力ベクトルxとの間の投影距離が最も短い第
2の部分空間を探し出し、その部分空間の原点の位置ベ
クトルφ20と、基底ベクトルφ21, , φ2pと、第2の
部分空間と入力ベクトルxとの間の投影距離を2乗した
第2の距離値d2 とを第2辞書修正手段108に渡すと
共に、第2の距離値d2 を第1辞書修正手段104に渡
す。
【0114】ここで、第2の距離値d2 は次式(39)
に示すものとなる。
【0115】
【数17】
【0116】第1,第2辞書修正手段104,108
は、辞書検索手段103から上記した情報が渡される
と、それぞれステップS306,S307に於いて、認
識辞書113に格納されている上記第1,第2の部分空
間の原点の位置ベクトル,基底ベクトルを修正する。
尚、第1,第2辞書修正手段104,108がステップ
S306,S307で行う処理については、後で図4,
図5を参照して詳細に説明する。
【0117】第1,第2辞書修正手段104,108
で、学習パターン番号qの学習パターンについての処理
が終了すると、終了判定手段112が、ステップS30
8に於いて、学習パターン番号を表す変数qの値と学習
パターン数Nとを比較する。そして、両者が等しくない
場合(ステップS308がNO)は、ステップS309
に於いて学習パターン番号を表す変数qの値を1加算し
た後、ステップS303に帰還し、両者が等しい場合
(ステップS308がYES)はステップS310に進
む。
【0118】ステップS310に於いては、終了判定手
段112は、学習回数を示す変数tの値と予め設定され
ている学習回数Tとを比較する。そして、両者が等しく
ない場合(ステップS310がNO)は、ステップS3
11で変数tの値を1加算した後、入力手段102に制
御を戻し、両者が等しい場合(ステップS310がYE
S)は、学習を終了させる。
【0119】次に、図4の流れ図を参照して、第1辞書
修正手段104で行われる図3に示したステップS30
6の処理を詳細に説明する。
【0120】第1辞書修正手段104は、先ず、ステッ
プS401に於いて、辞書検索手段103から渡された
第1,第2の距離値d1,2 を用いて、入力ベクトルx
が誤認識される危険度μ=(d1 −d2 )/(d1 +d
2 )を計算する。
【0121】次いで、ステップS402に於いて、次式
(40)に示す演算を行う。尚、式(40)に於いて、
tは学習回数を表す。
【0122】
【数18】
【0123】その後、ステップS403に於いて、次式
(41)に示す演算を行うことにより、補正係数Fを求
める。
【0124】F=f×(1−f) … (41)
【0125】ここで、補正係数Fは、μ=0でピークを
持つ、μについての関数であるので、このような補正係
数Fを用いることにより、μが0に近いパターン、即ち
カテゴリ境界付近のパターンに重みを置いた学習を行う
ことができる。また、補正係数Fは、学習回数tが多く
なるほど、その値は小さくなる。
【0126】更に、ステップS404に於いて、次式
(42)に示す演算を行うことにより補正係数D2 を求
める。尚、式(42)に於いて、k,mは任意の定数で
あり、具体的な値の例としては、k=1,m=2等が考
えられる。
【0127】 D2 =d2 k /(d1 +d2m … (42)
【0128】修正係数F,D2 を求めると、第1辞書修
正手段104は、ステップS405に於いて、第1原点
修正手段105を用いて、現在処理対象にしている第1
の部分空間の、原点の位置ベクトルφ10を修正する。
【0129】つまり、第1辞書修正手段104は、第1
原点修正手段105を用いて、認識辞書113に格納さ
れている第1の部分空間の原点の位置ベクトルφ10を次
式(43)に示すように修正する。尚、式(43)に於
いて、αは正の微小な実数であり、具体的な例として
は、0.01などが考えられる。
【0130】
【数19】
【0131】その後、第1辞書修正手段104は、ステ
ップS406に於いて、基底ベクトルの番号を表す変数
jに「1」を設定する。
【0132】次いで、第1辞書修正手段104は、ステ
ップS407に於いて、第1基底ベクトル修正手段10
6を用いて、現在処理対象にしている第1の部分空間
の、基底ベクトル番号が「1」の基底ベクトルφ11を修
正する。
【0133】つまり、第1辞書修正手段104は、第1
基底ベクトル修正手段106を用いて、認識辞書113
に格納されている第1の部分空間の、基底ベクトル番号
が「1」の基底ベクトルφ11を次式(44)に示すよう
に修正する。
【0134】
【数20】
【0135】その後、第1辞書修正手段104は、ステ
ップS408に於いて、jの値と基底ベクトル数pとを
比較し、両者が等しくない場合(S408がNO)は、
ステップS409でjの値を1加算した後、ステップS
407に帰還し、両者が等しい場合(S408がYE
S)は、ステップS410に進む。
【0136】ステップS410では、第1辞書修正手段
104は、第1基底ベクトル直交化手段107を用い、
グラムシュミットの直交化により、認識辞書113に格
納されている第1の部分空間の基底ベクトルφ11, ,
φ1pを、それらが正規直交系をなすように修正する。
【0137】次に、図5の流れ図を参照して、第2辞書
修正手段108で行われる図3に示したステップS30
7の処理を詳細に説明する。
【0138】第2辞書修正手段108は、先ず、ステッ
プS501に於いて、辞書検索手段103から渡された
第1の距離値d1 と第2の距離値d2 とを用いて、入力
ベクトルが誤認識される危険度μを計算し、次にステッ
プS502,S503に於いて、補正係数Fを計算す
る。但し、tは学習回数を表す。
【0139】その後、第2辞書修正手段108は、次式
(45)に示す演算を行うことにより、補正係数D1
求める。尚、式(45)に於いて、k,mは任意の定数
であり、具体的な例としては、k=1,m=2等が考え
られる。
【0140】 D1 =d1 k /(d1 +d2m … (45)
【0141】修正係数F,D1 を求めると、第2辞書修
正手段108は、S505に於いて、第2原点修正手段
109を用いて、現在処理対象にしている第2の部分空
間の、原点の位置ベクトルφ20を修正する。
【0142】つまり、第2辞書修正手段108は、第2
原点修正手段109を用いて、認識辞書113に格納さ
れている第2の部分空間の原点の位置ベクトルφ20を次
式(46)に示すように修正する。尚、式(46)に於
いて、αは正の微小な実数であり、具体的な例として
は、0.01等が考えられる。
【0143】
【数21】
【0144】その後、第2辞書修正手段108は、ステ
ップS506に於いて、基底ベクトルの番号を表す変数
jに「1」を設定する。
【0145】次いで、第2辞書修正手段108は、ステ
ップS507に於いて、第2基底ベクトル修正手段11
0を用いて、現在処理対象にしている第2の部分空間
の、基底ベクトル番号が「1」の基底ベクトルφ21を修
正する。
【0146】つまり、第2辞書修正手段108は、第2
基底ベクトル修正手段110を用いて、認識辞書113
に格納されている第2の部分空間の、基底ベクトル番号
が「1」の基底ベクトルφ21を次式(47)に示すよう
に修正する。
【0147】
【数22】
【0148】その後、第2辞書修正手段108は、ステ
ップS508に於いて、jの値と基底ベクトル数pとを
比較し、両者が等しくない場合(S508がNO)は、
ステップS509でjの値を1加算した後、ステップS
507に帰還し、両者が等しい場合(S508がYE
S)は、ステップS510に進む。
【0149】ステップS510では、第2辞書修正手段
108は、第2基底ベクトル直交化手段111を用い、
グラムシュミットの直交化により、認識辞書113に格
納されている第2の部分空間の基底ベクトルφ21, ,
φ2pを、それらが正規直交系をなすように修正する。
【0150】尚、上述した実施例に於いては、図2のス
テップS202に於いて、K平均アルゴリズムを用いて
部分空間の原点の位置ベクトルを設定するようにした
が、その他のクラスタリング手法を用いたり、或いは学
習ベクトル量子化の結果を用いるようにしても構わな
い。また、図2のステップS204では、一様乱数を用
いて基底ベクトルを設定しているが、部分空間の原点を
母点として空間をボロノイ分割した時の、各領域内に含
まれる入力ベクトルを主成分分析して求めても構わな
い。また、図4のステップS403,S404及び図5
のステップS503,S504に於いて、修正係数F,
1,2 を具体的に定義したが、これ以外の定義を用い
るようにしても構わない。更に、距離尺度として投影距
離の2乗を用いたが、射影長の2乗, その他の距離定義
を用いるようにしても構わない。
【0151】図7は本発明の第2の実施例のブロック図
であり、認識辞書として用いられる部分空間と重みパラ
メータに初期設定を行う初期値設定手段101aと、入
力ベクトル群記憶部114に格納されている学習用に用
意した入力ベクトル群の中から1つの入力ベクトルを選
択する入力手段102と、上記入力ベクトルと同じカテ
ゴリに属する部分空間の中から上記入力ベクトルとの重
み付き投影距離が最小となる第1の部分空間と第1の重
みパラメータとその第1の距離とを求めると共に、上記
入力ベクトルと異なるカテゴリに属する部分空間の中か
ら上記入力ベクトルとの重み付き投影距離が最小となる
第2の部分空間と第2の重みパラメータとその第2の距
離を求める辞書検索手段103aと、第1原点修正手段
105と第1基底ベクトル修正手段106と第1基底ベ
クトル直交化手段107とによって第1の部分空間を修
正すると共に第1重みパラメータ修正手段115によっ
て第1の重みパラメータを修正する第1辞書修正手段1
04aと、第2原点修正手段109と第2基底ベクトル
修正手段110と第2基底ベクトル直交化手段111に
よって第2の部分空間を修正し、第2重みパラメータ修
正手段116によって第2の重みパラメータを修正する
第2辞書修正手段108aと、学習の終了を判定する終
了判定手段112と、認識辞書113とから構成され
る。
【0152】第1原点修正手段105では、第1の距離
値が小さくなるように、第1の部分空間の原点が修正さ
れる。
【0153】第1基底ベクトル修正手段106では、入
力ベクトルから第1の部分空間の原点を表す位置ベクト
ルを引いたベクトルとの内積の絶対値が大きくなる方向
に、第1の部分空間の各基底ベクトルが修正される。
【0154】第1基底ベクトル直交化手段107では、
第1基底ベクトル修正手段106によって修正された第
1の部分空間の基底ベクトルが、正規直交系をなすよう
に修正される。
【0155】第1重みパラメータ修正手段115では、
各重みパラメータの値が大きくなるように第1の重みパ
ラメータが修正される。
【0156】第2原点修正手段109では、第2の距離
値が大きくなるように、第2の部分空間の原点が修正さ
れる。
【0157】第2基底ベクトル修正手段110では、入
力ベクトルから第2の部分空間の原点を表す位置ベクト
ルを引いたベクトルとの内積の絶対値が小さくなる方向
に、第2の部分空間の各基底ベクトルが修正される。
【0158】第2基底ベクトル直交化手段111では、
第2基底ベクトル修正手段110によって修正された第
2の部分空間の基底ベクトルが、正規直交系をなすよう
に修正される。
【0159】第2重みパラメータ修正手段116では、
各重みパラメータの値が小さくなるように第2の重みパ
ラメータが修正される。
【0160】図7に示した実施例の動作を、図8から図
13の流れ図を用いて説明する。
【0161】カテゴリ数をK、学習パターンの総数をN
とし、何らかの特徴抽出法を用いて各パターンについて
n次元の入力ベクトルを予め作成しておくと共に、1カ
テゴリ当たりM個の重み付き部分空間を用意しておく。
重み付き部分空間とは、原点を表すn次元の位置ベクト
ルと、n次元のp個の基底ベクトルと、p+1個の重み
パラメータから構成されるものである。
【0162】図8は初期値設定手段101aの処理例を
示す流れ図である。
【0163】ステップS201aに於いて、カテゴリの
番号を表す変数cを1に設定する。
【0164】ステップS202aに於いて、K平均アル
ゴリズムによって、M個の部分空間の原点φ
0 c 〔1〕,…,φ0 c 〔M〕を求める。
【0165】ステップS203aに於いて、部分空間の
番号を表す変数iに1を設定する。
【0166】ステップS204aに於いて、一様乱数に
より各基底ベクトルの値φ1 c 〔i〕,…,φ
p c 〔i〕を設定する。
【0167】ステップS205aに於いて、グラムシュ
ミットの直交化により、p個の基底ベクトルが正規直交
系をなすように、各基底ベクトルを修正する。
【0168】ステップS206aに於いて、重みパラメ
ータw0 c 〔i〕,…,wp c 〔i〕それぞれの値を設
定する。例えば、全てを0に設定すれば良い。
【0169】ステップS207aに於いて、iの値と部
分空間の数Mとが比較され、等しくない場合はステップ
S208aでiの値が1加算された後、ステップS20
4aに帰還し、等しい場合はステップS209aに進
む。
【0170】ステップS209aに於いて、cの値とカ
テゴリ数Kとが比較され、等しくない場合はステップS
210aでcの値が1加算された後、ステップS202
aに帰還し、等しい場合は初期値設定手段101aの処
理を終了し、入力手段102に制御を渡す。
【0171】入力手段102は、制御が渡されると、図
9の流れ図に示すように、ステップS301aに於い
て、学習回数を表す変数tに1を設定し、ステップS3
02aに於いて学習パターンの番号を表す変数qに1を
設定する。
【0172】その後、ステップS303aに於いて、入
力ベクトル群記憶部114に格納されている入力ベクト
ル群の中からq番目の学習パターンに対応する入力ベク
トルxを選択する。
【0173】辞書検索手段103aは、ステップS30
4aに於いて、入力ベクトルと同じカテゴリに属する部
分空間の中で、重み付き投影距離が最も小さい第1の部
分空間と第1の重みパラメータとを探し、その原点をφ
10、基底ベクトルをφ11,…, φ1p、重みパラメータを
10, …w1p、その重み付き投影距離の2乗の値をd1
とする。ここで、d1 は次式(48)に示すものとな
る。
【0174】
【数23】
【0175】その後、辞書検索手段103aは、ステッ
プS305aに於いて、入力ベクトルと異なるカテゴリ
に属する部分空間の中で、重み付き投影距離が最も小さ
い第2の部分空間と第2の重みパラメータを探し、その
原点をφ20、基底ベクトルをφ21, , φ2p、重みパラ
メータをw20, …,w2p、その時の重み付き投影距離の
2乗の値をd2 とする。ここで、d2 は次式(49)に
示すものとなる。
【0176】
【数24】
【0177】第1辞書修正手段104aは、ステップS
306aに於いて、第1の部分空間の修正を行い、ステ
ップS307aに於いて、第1の重みパラメータの修正
を行う。
【0178】また、第2辞書修正手段108aは、ステ
ップS308aに於いて、第2の部分空間の修正を行
い、ステップS309aに於いて、第2の重みパラメー
タの修正を行う。
【0179】終了判定手段112は、ステップS310
aに於いてqの値と学習パターン数Nとを比較し、等し
くない場合はステップS311aでqの値を1加算した
後ステップS303aに帰還し、等しい場合はステップ
S312aに進む。
【0180】ステップS312aに於いては、tの値と
予め設定されている学習回数Tとを比較し、等しくない
場合はステップS313aでtの値を1加算した後ステ
ップS302aに帰還し、等しい場合は学習を終了す
る。
【0181】図10は、図9のステップS306aに示
した第1部分空間の修正処理の詳細な処理例を示す流れ
図である。
【0182】ステップS401aに於いて、第1の距離
1 と第2の距離d2 とを用いて、入力ベクトルが誤認
識される危険度を表す量μを計算する。
【0183】ステップS402aとステップS403a
に於いて、修正係数Fを計算する。但し、tは学習回数
を表す。
【0184】ステップS404aに於いて、修正係数D
2 を計算する。ここで、k, mは任意の定数であり、具
体的な値の例としてはk=1,m=2などが考えられ
る。
【0185】ステップS405aに於いて、第1の部分
空間の原点φ10を修正する。ここで、αは正の微小な実
数であり、具体的な値の例としては、0.01などが考
えられる。
【0186】ステップS406aに於いて、基底ベクト
ルの番号を表す変数jに1を設定する。
【0187】ステップS407aに於いて、第1の部分
空間に於けるj番目の基底ベクトルを修正する。
【0188】ステップS408aに於いて、jの値と基
底ベクトル数pとを比較し、等しくない場合はステップ
S409aでjの値に1を加算した後、ステップS40
7aへ帰還し、等しい場合はステップS410aへ進
む。
【0189】ステップS410aに於いて、グラムシュ
ミットの直交化により、第1の部分空間の基底ベクトル
φ11, …,φ1pが正規直交系をなすように修正する。
【0190】図11は、図9のステップS308aで行
う第2部分空間の修正処理の詳細な処理例を示した流れ
図である。
【0191】ステップS501aに於いて、第1の距離
1 と第2の距離d2 とを用いて、入力ベクトルが誤認
識される危険度を表す量μを計算する。
【0192】ステップS502aとステップS503a
とに於いて、修正係数Fを計算する。但し、tは学習回
数を表す。
【0193】ステップS504aに於いて、修正係数D
1 を計算する。ここで、k,mは任意の定数であり、具
体的な値の例としてはk=1,m=2などが考えられ
る。
【0194】ステップS505aに於いて、第2の部分
空間の原点φ20を修正する。ここで、αはステップS4
05a及びステップS407aで用いた値と同じもので
ある。
【0195】ステップS506aに於いて、基底ベクト
ルの番号を表す変数jに1を設定する。
【0196】ステップS507aに於いて、第2の部分
空間に於けるj番目の基底ベクトルを修正する。
【0197】ステップS508aに於いて、jの値と基
底ベクトル数pとを比較し、等しくない場合はステップ
S509aでjの値を1加算した後、ステップS507
aへ帰還し、等しい場合はステップS510aに進む。
【0198】ステップS510aに於いて、グラムシュ
ミットの直交化により、第2の部分空間の基底ベクトル
φ21, , φ2pが正規直交系をなすように修正する。
【0199】図12は図9のステップS307aに示し
た第1の重みパラメータの修正処理の詳細な処理例を示
した流れ図である。
【0200】ステップS601aに於いて、第1の重み
パラメータの1つであるw10を修正する。
【0201】ステップS602aに於いて、重みパラメ
ータの番号を表す変数jに1を設定する。
【0202】ステップS603aに於いて、第1の重み
パラメータに於けるj番目の重みパラメータを修正す
る。
【0203】ステップS604aに於いて、jの値と基
底ベクトル数pとを比較し、等しくない場合は、ステッ
プS605aでjの値を1加算した後、ステップS60
3aに帰還し、等しい場合は処理を終了する。ステップ
S603aで用いられるF,D2 は、ステップS403
a及びステップS404aで得られた値と同じもので、
αはステップS405a及びステップS407aで用い
た値と同じ値である。
【0204】図13は図9のステップS309aに示し
た第2の重みパラメータの修正処理の詳細な処理例を示
した流れ図である。
【0205】ステップS701aに於いて、第2の重み
パラメータの1つであるw20を修正する。
【0206】ステップS702aに於いて、重みパラメ
ータの番号を表す変数jに1を設定する。
【0207】ステップS703aに於いて、第2の重み
パラメータに於けるj番目の重みパラメータを修正す
る。
【0208】ステップS704aに於いて、jの値と基
底ベクトル数pとが比較され、等しくない場合は、ステ
ップS705aでjの値を1加算された後、ステップS
703aに帰還し、等しい場合は処理を終了する。
【0209】ステップS701a及びステップS703
aで用いられるF,D1 は、ステップS503a及びス
テップS504aで得られた値と同じものであり、αは
ステップS505a及びステップS507aで用いた値
と同じものである。
【0210】第2の実施例では、ステップS202aに
於いてK平均アルゴリズムを用いて部分空間の原点を設
定したが、その他のクラスタリング手法を用いても、或
いは学習ベクトル量子化の結果を用いても構わない。
【0211】また、ステップS204aでは一様乱数を
用いて基底ベクトルを設定しているが、部分空間の原点
を母点として空間をボロノイ分割した時の、各領域内に
含まれる入力ベクトルを主成分分析して求めても構わな
い。
【0212】更に、ステップS403a,S404a,
S503a,S504aに於いて、F,D1,2 を具体
的に定義しているが、これ以外の定義を用いた場合にも
本発明は有効である。
【0213】次に、本発明の第3の実施例について説明
する。本実施例は、図9に示すステップS307a,S
309aに於いて、図14,図15に示す処理を行うこ
とにより実現される。
【0214】図14はステップS307aに於ける第1
の重みパラメータの修正処理の一例を示した流れ図であ
る。
【0215】ステップS801aに於いて、第1の重み
パラメータの1つであるw10を0に設定する。
【0216】ステップS802aに於いて、重みパラメ
ータの番号を表す変数jに1を設定する。
【0217】ステップS803aに於いて、第1の重み
パラメータに於けるj番目の重みパラメータw1jを修正
する。
【0218】ステップS804aに於いて、w1jの値が
1以下であると判定された場合は、ステップS806a
に進み、そうでない場合はステップS805aに於いて
1jに1を設定した後、ステップS806aに進む。
【0219】ステップS806aに於いて、jの値と基
底ベクトル数pとが比較され、等しくない場合はステッ
プS807aでjの値が1加算された後、ステップS8
03aへ帰還し、等しい場合は処理を終了する。
【0220】ステップS803aで用いられるF,D2
は、ステップS403a及びステップS404aで得ら
れた値と同じもので、αはステップS405a及びステ
ップS407aで用いた値と同じものである。
【0221】図15はステップS309aに於ける第2
の重みパラメータの修正処理の一例を示した流れ図であ
る。
【0222】ステップS901aに於いて、第2の重み
パラメータの1つであるw20に0を設定する。
【0223】ステップS902aに於いて、重みパラメ
ータの番号を表す変数jに1を設定する。
【0224】ステップS903aに於いて、第2の重み
パラメータに於けるj番目の重みパラメータw2jを修正
する。
【0225】ステップS904aに於いて、w2jの値が
0以上であると判定された場合はステップS906aに
進み、そうでない場合はステップS905aに於いてw
2jに0を設定した後、ステップS906aに進む。
【0226】ステップS906aに於いて、jの値と基
底ベクトル数pとが比較され、等しくない場合はステッ
プS907aでjの値が1加算された後、ステップS9
03aへ帰還し、等しい場合は処理を終了する。ステッ
プS903aで用いられるF,D1 は、ステップS50
3a及びステップS504aで得られた値と同じもの
で、αはステップS505a及びステップS507aで
用いた値と同じものである。
【0227】第2の実施例は重み付き投影距離が負にな
る場合があるが、第3の実施例では重み付き投影距離は
常に正の値となる。
【0228】以上、本発明の実施例について述べた。本
実施例では、カテゴリ当たりの部分空間数を同じ値Mと
して、部分空間の基底ベクトル数も全てp個としたが、
カテゴリ毎に異なる部分空間数を用いても、部分空間毎
に異なる数の基底ベクトルを用いても構わない。従っ
て、本発明は実施例に限定されるものではない。
【0229】図6は図1,図7に示した第1,第2の実
施例の認識辞書学習装置を実現するハードウェア構成の
一例を示したブロック図であり、コンピュータによって
構成されるデータ処理装置601と、認識辞書学習プロ
グラムを記録した記録媒体602と、記憶装置603と
を備えている。記録媒体602は、磁気ディスク,半導
体メモリ, その他の記録媒体である。
【0230】図1に示した認識辞書学習装置の実現時に
は、記録媒体602に記録された認識辞書学習プログラ
ムは、データ処理装置601によって読み取られ、デー
タ処理装置601上に、図1に示した初期値設定手段1
01,入力手段102,辞書検索手段103,第1原点
修正手段105,第1基底ベクトル修正手段106,第
1基底ベクトル直交化手段107,第2原点修正手段1
09,第2基底ベクトル修正手段110,第2基底ベク
トル直交化手段111,終了判定手段112を実現す
る。記憶装置603は、図1に示した認識辞書113,
入力ベクトル群記憶部114に対応するものである。
【0231】また、図7に示した認識辞書学習装置の実
現時には、記録媒体602に記録された認識辞書学習プ
ログラムは、データ処理装置601によって読み取ら
れ、データ処理装置601上に、図7に示した初期値設
定手段101a,入力手段102,辞書検索手段103
a,第1原点修正手段105,第1基底ベクトル修正手
段106,第1基底ベクトル直交化手段107,第1重
みパラメータ修正手段115,第2原点修正手段10
9,第2基底ベクトル修正手段110,第2基底ベクト
ル直交化手段111,第2重みパラメータ修正手段11
6,終了判定手段112を実現する。記憶装置603
は、図1に示した認識辞書113,入力ベクトル群記憶
部114に対応するものである。
【0232】
【発明の効果】以上説明したように、本発明は、正解カ
テゴリの部分空間の原点の位置ベクトル,基底ベクトル
の修正だけでなく、競合カテゴリの部分空間の原点の位
置ベクトル,基底ベクトルも修正するので、学習パター
ンに対する誤認識を十分に低減させることができる。
【0233】また、本発明は、第1の部分空間と入力ベ
クトルとの間の距離と、第2の部分空間と入力ベクトル
との間の距離との差が少ない時ほど、原点の位置ベクト
ル,基底ベクトルに対する修正量を多くするので、カテ
ゴリ境界付近のパターンに重みを置いた学習を行うこと
ができ、その結果、未学習パターンに対しても高い認識
性能を有する認識辞書を生成することができる。更に、
本発明では、基底ベクトルの設定に主成分分析を必ずし
も必要としないため、設計を容易にすることができる。
【0234】また、本発明は、部分空間の原点と基底ベ
クトルの修正ばかりでなく、部分空間に対する重みも修
正するので、学習パターンに対する誤認識を更に低減さ
せることができると共に、未学習パターンに対しても更
に高い認識性能を有する認識辞書を生成することができ
る。
【図面の簡単な説明】
【図1】本発明の認識辞書学習装置の第1の実施例のブ
ロック図である。
【図2】初期値設定手段101の処理例を示す流れ図で
ある。
【図3】入力手段102,辞書検索手段103,第1辞
書修正手段104,第2辞書修正手段108,終了判定
手段112の処理例を示す流れ図である。
【図4】第1辞書修正手段104の詳細な処理例を示す
流れ図である。
【図5】第2辞書修正手段108の詳細な処理内容を示
す流れ図である。
【図6】認識辞書学習装置のハードウェア構成の一例を
示すブロック図である。
【図7】本発明の認識辞書学習装置の第2の実施例のブ
ロック図である。
【図8】初期値設定手段101aの処理例を示す流れ図
である。
【図9】入力手段102,辞書検索手段103a,第1
辞書修正手段104a,第2辞書修正手段108a,終
了判定手段112の処理例を示す流れ図である。
【図10】第1辞書修正手段104aの詳細な処理例を
示す流れ図である。
【図11】第2辞書修正手段108aの詳細な処理内容
を示す流れ図である。
【図12】第1重みパラメータ修正手段115の処理例
を示す流れ図である。
【図13】第2重みパラメータ修正手段116の処理例
を示す流れ図である。
【図14】第1重みパラメータ修正手段115の他の処
理例を示す流れ図である。
【図15】第2重みパラメータ修正手段116の他の処
理例を示す流れ図である。
【図16】従来技術の問題点を説明するための図であ
る。
【図17】重み付き投影距離の効果を説明するための図
である。
【図18】従来技術の問題点を説明するための図であ
る。
【図19】従来技術の問題点を説明するための図であ
る。
【図20】従来技術の問題点を説明するための図であ
る。
【符号の説明】
101,101a…初期値設定手段 102…入力手段 103,103a…辞書検索手段 104,104a…第1辞書修正手段 105…第1原点修正手段 106…第1基底ベクトル修正手段 107…第1基底ベクトル直交化手段 108,108a…第2辞書修正手段 109…第2原点修正手段 110…第2基底ベクトル修正手段 111…第2基底ベクトル直交化手段 112…終了判定手段 113…認識辞書 114…入力ベクトル群記憶部 115…第1重みパラメータ修正手段 116…第2重みパラメータ修正手段 601…データ処理装置 602…記録媒体 603…記憶装置
フロントページの続き (56)参考文献 特開 平7−311846(JP,A) 佐藤、山田,「一般学習ベクトル量子 化による文字認識」,電子情報通信学会 技術研究報告,社団法人電子情報通信学 会・発行,1996年 3月14日,Vol. 95,No.583(PRU95−216〜234), pp.23−30,特許庁CSDB文献番 号:CSNT199900771004 佐藤、山田,「一般学習ベクトル量子 化の提案」,電子情報通信学会技術研究 報告,社団法人電子情報通信学会・発 行,1995年10月28日,Vol.95,N o.346(NC95−49〜64),pp.87 −94,特許庁CSDB文献番号:CSN T200000108010 佐藤、津雲,「改良ベクトル量子化と 文字認識への応用」,電子情報通信学会 技術研究報告,社団法人電子情報通信学 会・発行,1993年12月14日,Vol. 93,No.376(NC93−55〜67),p p.41−49,特許庁CSDB文献番号: CSNT200000097004 (58)調査した分野(Int.Cl.7,DB名) G06N 1/00 - 7/00 G06G 7/60 G06T 7/00 G06K 9/00 G10L 15/00 - 17/00 CSDB(日本国特許庁) JICSTファイル(JOIS)

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 学習パターンから抽出された特徴ベクト
    ルを入力ベクトルとして用い、認識辞書となる部分空間
    を決定する認識辞書学習方法であって、 各カテゴリに属する部分空間群の初期設定を行う初期値
    設定段階と、 学習用に用意された入力ベクトル群の中から1つの入力
    ベクトルを選択する入力段階と、 該選択した入力ベクトルと同じカテゴリに属する部分空
    間群の中から、前記入力ベクトルとの距離が最小となる
    第1の部分空間を求めると共に、前記入力ベクトルと異
    なるカテゴリに属する部分空間群の中から前記入力ベク
    トルとの距離が最小となる第2の部分空間を求める辞書
    検索段階と、 前記第1の部分空間が前記入力ベクトルに近づくよう
    に、前記第1の部分空間の原点を表す第1の位置ベクト
    ルを、前記第1の部分空間と直交する方向に修正する第
    1の原点修正段階と、 前記第2の部分空間が前記入力ベクトルから遠ざかるよ
    うに、前記第2の部分空間の原点を表す第2の位置ベク
    トルを、前記第2の部分空間と直交する方向に修正する
    第2の原点修正段階と、 前記入力ベクトルから前記第1の位置ベクトルを引いた
    ベクトルとの内積の絶対値が大きくなるように、前記第
    1の部分空間の各基底ベクトルを修正する第1の基底ベ
    クトル修正段階と、 前記入力ベクトルから前記第2の位置ベクトルを引いた
    ベクトルとの内積の絶対値が小さくなるように、前記第
    2の部分空間の各基底ベクトルを修正する第2の基底ベ
    クトル修正段階と、 前記第1の基底ベクトル修正段階に於いて修正が行われ
    た各基底ベクトルを、それらが正規直交系をなすように
    修正すると共に、前記第2の基底ベクトル修正段階に於
    いて修正が行われた各基底ベクトルを、それらが正規直
    交系をなすように修正する基底ベクトル直交化段階とを
    含むことを特徴とする認識辞書学習方法。
  2. 【請求項2】 前記辞書検索段階に於いて、前記入力ベ
    クトルと前記第1の部分空間との距離値である第1の距
    離値を求めると共に、前記入力ベクトルと前記第2の部
    分空間との距離値である第2の距離値を求め、 前記第1の原点修正段階,前記第2の原点修正段階,前
    記第1の基底ベクトル修正段階及び前記第2の基底ベク
    トル修正段階に於いて、前記第1の距離値と前記第2の
    距離値との差が少ない場合ほど、修正量を多くすること
    を特徴とする請求項1記載の認識辞書学習方法。
  3. 【請求項3】 学習パターンから抽出された特徴ベクト
    ルを入力ベクトルとして用い、認識辞書となる部分空間
    とその重みパラメータを決定する認識辞書学習方法であ
    って、 各カテゴリに属する部分空間群とその重みパラメータの
    初期設定を行う初期値設定段階と、 学習用に用意された入力ベクトル群の中から1つの入力
    ベクトルを選択する入力段階と、 該選択した入力ベクトルと同じカテゴリに属する部分空
    間群の中から、前記入力ベクトルとの重み付き投影距離
    が最小となる第1の部分空間を求めると共に、前記選択
    した入力ベクトルと異なるカテゴリに属する部分空間群
    の中から、前記入力ベクトルとの重み付き投影距離が最
    小となる第2の部分空間を求める辞書検索段階と、 前記第1の部分空間と前記入力ベクトルとの重み付き投
    影距離が短くなるように、前記第1の部分空間の原点を
    表す第1の位置ベクトルを修正する第1の原点修正段階
    と、 前記第2の部分空間と前記入力ベクトルとの重み付き投
    影距離が長くなるように、前記第2の部分空間の原点を
    表す第2の位置ベクトルを修正する第2の原点修正段階
    と、 前記第1の部分空間の各基底ベクトルを、前記入力ベク
    トルから前記第1の位置ベクトルを引いたベクトルとの
    内積の絶対値が大きくなるように修正する第1の基底ベ
    クトル修正段階と、 前記第2の部分空間の各基底ベクトルを、前記入力ベク
    トルから前記第2の位置ベクトルを引いたベクトルとの
    内積の絶対値が小さくなるように修正する第2の基底ベ
    クトル修正段階と、 前記第1の基底ベクトル修正段階に於いて修正が行われ
    た各基底ベクトルを、それらが正規直交系をなすように
    修正すると共に、前記第2の基底ベクトル修正段階に於
    いて修正が行われた各基底ベクトルを、それらが正規直
    交系をなすように修正する基底ベクトル直交化段階と、 前記第1の部分空間の第1の重みパラメータを値が大き
    くなるように修正する第1の重みパラメータ修正段階
    と、 前記第2の部分空間の第2の重みパラメータを値が小さ
    くなるように修正する第2の重みパラメータ修正段階と
    を含むことを特徴とする認識辞書学習方法。
  4. 【請求項4】 前記辞書検索段階に於いて、前記入力ベ
    クトルと前記第1の部分空間との重み付き投影距離値で
    ある第1の距離値を求めると共に、前記入力ベクトルと
    前記第2の部分空間との重み付き投影距離値である第2
    の距離値を求め、 前記第1の原点修正段階,前記第2の原点修正段階,前
    記第1の基底ベクトル修正段階,前記第2の基底ベクト
    ル修正段階,前記第1の重みパラメータ修正段階および
    前記第2の重みパラメータ修正段階に於いて、前記第1
    の距離値と前記第2の距離値との差が小さい場合ほど、
    修正量を多くすることを特徴とする請求項3記載の認識
    辞書学習方法。
  5. 【請求項5】 学習パターンから抽出された特徴ベクト
    ルを入力ベクトルとして用い、認識辞書となる部分空間
    を決定する認識辞書学習装置であって、 各カテゴリに属する部分空間群の初期設定を行う初期値
    設定手段と、 学習用に用意された入力ベクトル群の中から1つの入力
    ベクトルを選択する入力手段と、 該入力手段が選択した入力ベクトルと同じカテゴリに属
    する部分空間群の中から、前記入力ベクトルとの距離が
    最小となる第1の部分空間を求めると共に、前記入力ベ
    クトルと異なるカテゴリに属する部分空間群の中から前
    記入力ベクトルとの距離が最小となる第2の部分空間を
    求める辞書検索手段と、 前記第1の部分空間が前記入力ベクトルに近づくよう
    に、前記第1の部分空間の原点を表す第1の位置ベクト
    ルを、前記第1の部分空間と直交する方向に修正する第
    1の原点修正手段と、 前記第2の部分空間が前記入力ベクトルから遠ざかるよ
    うに、前記第2の部分空間の原点を表す第2の位置ベク
    トルを、前記第2の部分空間と直交する方向に修正する
    第2の原点修正手段と、 前記入力ベクトルから前記第1の位置ベクトルを引いた
    ベクトルとの内積の絶対値が大きくなるように、前記第
    1の部分空間の各基底ベクトルを修正する第1の基底ベ
    クトル修正手段と、 前記入力ベクトルから前記第2の位置ベクトルを引いた
    ベクトルとの内積の絶対値が小さくなるように、前記第
    2の部分空間の各基底ベクトルを修正する第2の基底ベ
    クトル修正手段と、 前記第1の基底ベクトル修正手段に於いて修正が行われ
    た各基底ベクトルを、それらが正規直交系をなすように
    修正すると共に、前記第2の基底ベクトル修正手段に於
    いて修正が行われた各基底ベクトルを、それらが正規直
    交系をなすように修正する基底ベクトル直交化手段とを
    備えたことを特徴とする認識辞書学習装置。
  6. 【請求項6】 前記辞書検索手段は、前記入力ベクトル
    と前記第1の部分空間との距離値である第1の距離値を
    求めると共に、前記入力ベクトルと前記第2の部分空間
    との距離値である第2の距離値を求める構成を備え、 前記第1の原点修正手段,前記第2の原点修正手段,前
    記第1の基底ベクトル修正手段及び前記第2の基底ベク
    トル修正手段は、前記辞書検索手段で求められた前記第
    1の距離値と前記第2の距離値との差が少ない場合ほ
    ど、修正量を多くする構成を備えたことを特徴とする請
    求項5記載の認識辞書学習装置。
  7. 【請求項7】 学習パターンから抽出された特徴ベクト
    ルを入力ベクトルとして用い、認識辞書となる部分空間
    とその重みパラメータを決定する認識辞書学習装置であ
    って、 各カテゴリに属する部分空間群とその重みパラメータの
    初期設定を行う初期値設定手段と、 学習用に用意された入力ベクトル群の中から1つの入力
    ベクトルを選択する入力手段と、 該入力手段が選択した入力ベクトルと同じカテゴリに属
    する部分空間群の中から、前記入力ベクトルとの重み付
    き投影距離が最小となる第1の部分空間を求めると共
    に、前記選択した入力ベクトルと異なるカテゴリに属す
    る部分空間群の中から、前記入力ベクトルとの重み付き
    投影距離が最小となる第2の部分空間を求める辞書検索
    手段と、 前記第1の部分空間と前記入力ベクトルとの重み付き投
    影距離が短くなるように、前記第1の部分空間の原点を
    表す第1の位置ベクトルを修正する第1の原点修正手段
    と、 前記第2の部分空間と前記入力ベクトルとの重み付き投
    影距離が長くなるように、前記第2の部分空間の原点を
    表す第2の位置ベクトルを修正する第2の原点修正手段
    と、 前記第1の部分空間の各基底ベクトルを、前記入力ベク
    トルから前記第1の位置ベクトルを引いたベクトルとの
    内積の絶対値が大きくなるように修正する第1の基底ベ
    クトル修正手段と、 前記第2の部分空間の各基底ベクトルを、前記入力ベク
    トルから前記第2の位置ベクトルを引いたベクトルとの
    内積の絶対値が小さくなるように修正する第2の基底ベ
    クトル修正手段と、 前記第1の基底ベクトル修正手段に於いて修正が行われ
    た各基底ベクトルを、それらが正規直交系をなすように
    修正すると共に、前記第2の基底ベクトル修正手段に於
    いて修正が行われた各基底ベクトルを、それらが正規直
    交系をなすように修正する基底ベクトル直交化手段と、 前記第1の部分空間の第1の重みパラメータを値が大き
    くなるように修正する第1の重みパラメータ修正手段
    と、 前記第2の部分空間の第2の重みパラメータを値が小さ
    くなるように修正する第2の重みパラメータ修正手段と
    を備えたことを特徴とする認識辞書学習装置。
  8. 【請求項8】 前記辞書検索手段は、前記入力ベクトル
    と前記第1の部分空間との重み付き投影距離値である第
    1の距離値を求めると共に、前記入力ベクトルと前記第
    2の部分空間との重み付き投影距離値である第2の距離
    値を求める構成を備え、 前記第1の原点修正手段,前記第2の原点修正手段,前
    記第1の基底ベクトル修正手段,前記第2に基底ベクト
    ル修正手段,前記第1の重みパラメータ修正手段および
    前記第2の重みパラメータ修正手段は、前記第1の距離
    値と前記第2の距離値との差が小さい場合ほど、修正量
    を多くする構成を備えたことを特徴とする請求項7記載
    の認識辞書学習装置。
  9. 【請求項9】 コンピュータを、 各カテゴリに属する部分空間群の初期設定を行う初期値
    設定手段、 学習用に用意された入力ベクトル群の中から1つの入力
    ベクトルを選択する入力手段、 該入力手段が選択した入力ベクトルと同じカテゴリに属
    する部分空間群の中から、前記入力ベクトルとの距離が
    最小となる第1の部分空間を求めると共に、前記入力ベ
    クトルと異なるカテゴリに属する部分空間群の中から前
    記入力ベクトルとの距離が最小となる第2の部分空間を
    求める辞書検索手段、 前記第1の部分空間が前記入力ベクトルに近づくよう
    に、前記第1の部分空間の原点を表す第1の位置ベクト
    ルを、前記第1の部分空間と直交する方向に修正する第
    1の原点修正手段、 前記第2の部分空間が前記入力ベクトルから遠ざかるよ
    うに、前記第2の部分空間の原点を表す第2の位置ベク
    トルを、前記第2の部分空間と直交する方向に修正する
    第2の原点修正手段、 前記入力ベクトルから前記第1の位置ベクトルを引いた
    ベクトルとの内積の絶対値が大きくなるように、前記第
    1の部分空間の各基底ベクトルを修正する第1の基底ベ
    クトル修正手段、 前記入力ベクトルから前記第2の位置ベクトルを引いた
    ベクトルとの内積の絶対値が小さくなるように、前記第
    2の部分空間の各基底ベクトルを修正する第2の基底ベ
    クトル修正手段、 前記第1の基底ベクトル修正手段に於いて修正が行われ
    た各基底ベクトルを、それらが正規直交系をなすように
    修正すると共に、前記第2の基底ベクトル修正手段に於
    いて修正が行われた各基底ベクトルを、それらが正規直
    交系をなすように修正する基底ベクトル直交化手段、と
    して機能させるプログラムを記録した機械読み取り可能
    な記録媒体。
  10. 【請求項10】 コンピュータを、 各カテゴリに属する部分空間群とその重みパラメータの
    初期設定を行う初期値設定手段、 学習用に用意された入力ベクトル群の中から1つの入力
    ベクトルを選択する入力手段、 該入力手段が選択した入力ベクトルと同じカテゴリに属
    する部分空間群の中から、前記入力ベクトルとの重み付
    き投影距離が最小となる第1の部分空間を求めると共
    に、前記選択した入力ベクトルと異なるカテゴリに属す
    る部分空間群の中から、前記入力ベクトルとの重み付き
    投影距離が最小となる第2の部分空間を求める辞書検索
    手段、 前記第1の部分空間と前記入力ベクトルとの重み付き投
    影距離が短くなるように、前記第1の部分空間の原点を
    表す第1の位置ベクトルを修正する第1の原点修正手
    段、 前記第2の部分空間と前記入力ベクトルとの重み付き投
    影距離が長くなるように、前記第2の部分空間の原点を
    表す第2の位置ベクトルを修正する第2の原点修正手
    段、 前記第1の部分空間の各基底ベクトルを、前記入力ベク
    トルから前記第1の位置ベクトルを引いたベクトルとの
    内積の絶対値が大きくなるように修正する第1の基底ベ
    クトル修正手段、 前記第2の部分空間の各基底ベクトルを、前記入力ベク
    トルから前記第2の位置ベクトルを引いたベクトルとの
    内積の絶対値が小さくなるように修正する第2の基底ベ
    クトル修正手段、 前記第1の基底ベクトル修正手段に於いて修正が行われ
    た各基底ベクトルを、それらが正規直交系をなすように
    修正すると共に、前記第2の基底ベクトル修正手段に於
    いて修正が行われた各基底ベクトルを、それらが正規直
    交系をなすように修正する基底ベクトル直交化手段、 前記第1の部分空間の第1の重みパラメータを値が大き
    くなるように修正する第1の重みパラメータ修正手段、 前記第2の部分空間の第2の重みパラメータを値が小さ
    くなるように修正する第2の重みパラメータ修正手段、
    として機能させるためのプログラムを記録した機械読み
    取り可能な記録媒体。
JP03385598A 1997-02-28 1998-01-30 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 Expired - Lifetime JP3264242B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03385598A JP3264242B2 (ja) 1997-02-28 1998-01-30 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP6224697 1997-02-28
JP9-62246 1997-02-28
JP03385598A JP3264242B2 (ja) 1997-02-28 1998-01-30 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH10301917A JPH10301917A (ja) 1998-11-13
JP3264242B2 true JP3264242B2 (ja) 2002-03-11

Family

ID=26372626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03385598A Expired - Lifetime JP3264242B2 (ja) 1997-02-28 1998-01-30 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3264242B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009146245A (ja) * 2007-12-17 2009-07-02 Nec Corp 画像照合方法及び画像照合装置並びに画像照合プログラム
JP7370296B2 (ja) 2020-04-22 2023-10-27 オークマ株式会社 工作機械におけるすべり案内の診断方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3480563B2 (ja) 1999-10-04 2003-12-22 日本電気株式会社 パターン識別のための特徴抽出装置
JP5471367B2 (ja) * 2009-11-30 2014-04-16 株式会社島津製作所 膜厚測定方法及び膜厚測定装置
JP5486569B2 (ja) * 2011-09-05 2014-05-07 日本電信電話株式会社 パターン識別方法、パターン識別装置、およびプログラム
JPWO2014115362A1 (ja) * 2013-01-28 2017-01-26 日本電気株式会社 識別器学習装置及び識別器学習方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
佐藤、山田,「一般学習ベクトル量子化による文字認識」,電子情報通信学会技術研究報告,社団法人電子情報通信学会・発行,1996年 3月14日,Vol.95,No.583(PRU95−216〜234),pp.23−30,特許庁CSDB文献番号:CSNT199900771004
佐藤、山田,「一般学習ベクトル量子化の提案」,電子情報通信学会技術研究報告,社団法人電子情報通信学会・発行,1995年10月28日,Vol.95,No.346(NC95−49〜64),pp.87−94,特許庁CSDB文献番号:CSNT200000108010
佐藤、津雲,「改良ベクトル量子化と文字認識への応用」,電子情報通信学会技術研究報告,社団法人電子情報通信学会・発行,1993年12月14日,Vol.93,No.376(NC93−55〜67),pp.41−49,特許庁CSDB文献番号:CSNT200000097004

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009146245A (ja) * 2007-12-17 2009-07-02 Nec Corp 画像照合方法及び画像照合装置並びに画像照合プログラム
JP4518141B2 (ja) * 2007-12-17 2010-08-04 日本電気株式会社 画像照合方法及び画像照合装置並びに画像照合プログラム
US8401310B2 (en) 2007-12-17 2013-03-19 Nec Corporation Image comparing method, apparatus and program
JP7370296B2 (ja) 2020-04-22 2023-10-27 オークマ株式会社 工作機械におけるすべり案内の診断方法

Also Published As

Publication number Publication date
JPH10301917A (ja) 1998-11-13

Similar Documents

Publication Publication Date Title
US5901244A (en) Feature extraction system and face image recognition system
US7593551B2 (en) Face meta-data generation and face similarity calculation
US6128410A (en) Pattern matching apparatus and method that considers distance and direction
US8744144B2 (en) Feature point generation system, feature point generation method, and feature point generation program
EP0550865A2 (en) A continuous parameter hidden Markov model approach to automatic handwriting recognition
US6915260B2 (en) Method of determining an eigenspace for representing a plurality of training speakers
WO2020186951A1 (en) Adaptive image cropping for face recognition
KR20040037180A (ko) 학습 모델 부분들을 사용하는 안면 인식 시스템 및 방법
US20220254095A1 (en) Apparatus and method for searching for global minimum of point cloud registration error
JP4393720B2 (ja) パターン認識装置および方法
JP3264242B2 (ja) 認識辞書学習方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
KR20040037179A (ko) 얼굴 이미지들의 시간적 시퀀스로부터의 얼굴 인식
US20020120444A1 (en) Speech recognition method
CN110378414B (zh) 基于进化策略的多模态生物特征融合的身份识别方法
US5828998A (en) Identification-function calculator, identification-function calculating method, identification unit, identification method, and speech recognition system
CN107657223B (zh) 一种基于快速处理多距离度量学习的人脸认证方法
Dahmen et al. Discriminative training of Gaussian mixtures for image object recognition
KR20230127509A (ko) 콘셉트 기반의 퓨샷 학습 방법 및 장치
JP3945971B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100441706B1 (ko) 인식사전최적화방법
JP4350228B2 (ja) パターン認識方法および装置
US6795804B1 (en) System and method for enhancing speech and pattern recognition using multiple transforms
Hahmann et al. Model interpolation for eye localization using the Discriminative Generalized Hough Transform
Hüsken et al. Evaluation of implicit 3D modeling for pose-invariant face recognition
JP2009032046A (ja) 分類装置、分類方法、ならびに、プログラム

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071228

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081228

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091228

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091228

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101228

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101228

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111228

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111228

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121228

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131228

Year of fee payment: 12

EXPY Cancellation because of completion of term