JPH1055412A - 特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置及び方法 - Google Patents
特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置及び方法Info
- Publication number
- JPH1055412A JPH1055412A JP9146600A JP14660097A JPH1055412A JP H1055412 A JPH1055412 A JP H1055412A JP 9146600 A JP9146600 A JP 9146600A JP 14660097 A JP14660097 A JP 14660097A JP H1055412 A JPH1055412 A JP H1055412A
- Authority
- JP
- Japan
- Prior art keywords
- feature vector
- pattern
- input
- feature
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
て、特徴選択の手法を用いて特徴ベクトルの次元数を削
減することにより認識処理の高速化を図りながらも、認
識精度を維持できるパターン認識装置を実現することに
ある。 【解決手段】 特徴抽出部101は、入力文字パターン
から入力特徴ベクトルを抽出する。学習処理部102
は、学習文字パターンの学習特徴ベクトルから元特徴空
間の部分固有空間の正規直交基底を算出し、それらを部
分固有空間の正規直交基底記憶部103に記憶させ、ま
た、各認識対象文字パターンに対応し部分固有空間上で
規定される各辞書選択特徴ベクトルを算出し、それらを
認識辞書部104に記憶させる。特徴選択部105は、
上記正規直交基底を用い、特徴抽出部101が抽出した
入力特徴ベクトルの部分固有空間への射影である入力選
択特徴ベクトルを算出する。照合部106は、上記入力
選択特徴ベクトルと各辞書選択特徴ベクトルとを照合す
ることにより、入力文字パターンの種類を推定する。
Description
特徴ベクトルの次元数を効率的に削減する特徴選択の手
法を用いて文字等のパターンを認識する技術に関する。
オフィスにおけるワークフローの効率化のために文書を
電子的にファイリングして、必要に応じてコード化する
ための文書認識技術が強く求められている。特に、文書
認識技術の一形態である文字認識技術は、文字列情報の
コード化のために必須の技術である。この技術において
は、実用化と広範囲にわたる普及のために、認識精度を
維持したまま高速に文字種を推定する技術が求められて
いる。統計的手法により入力文字の特徴ベクトルの次元
数を削減する特徴選択の手法は、認識辞書との照合のた
めの計算量の削減に効果的である。このため、特徴選択
の手法を用いた文字認識技術は、実用的な文書認識装置
を構築する上での重要な要素としての役割を果たしてい
ると共に、文字以外の種々のパターンを認識するための
装置を構築する上でも非常に重要な技術である。
て、文字認識の一般概念について説明する。まず、文字
パターンが入力されると、その大きさが正規化される。
の文字領域が、複数の部分的な矩形領域に分割される。
例えば、1つの矩形の文字領域が、縦3行×横3列又は
縦6行×横6列に等分割されることにより、9個又は3
6個程度の部分矩形領域に分割される。
在する文字の輪郭を示す画素(輪郭画素)が抽出され、
各輪郭画素毎にその画素を含む輪郭線の方向が決定され
る。なお、輪郭画素は、文字領域そのものに対応する画
素、或いは、文字領域を細線化することによって得られ
る画素である。また、上記方向としては、例えば上下左
右斜めの方向からなる8方向、又は更に細かい36方向
程度が採用される。その後、部分矩形領域毎に、その領
域内の各方向毎の輪郭画素数が集計される。この結果、
1つの部分矩形領域について、方向数に等しい次元数を
有し、各要素値がその要素に対応する方向の輪郭画素数
に対応する値である部分特徴ベクトルが得られる。そし
て、1つの入力文字パターンについて、それに対応する
矩形文字領域に含まれる各部分矩形領域に対応する各部
分特徴ベクトルの全要素からなる特徴ベクトルが得られ
る。
特徴ベクトルを認識対象となる文字種毎に分類すると、
その特徴ベクトルの要素数に対応する次元を有する多次
元空間上で、文字種が同一である文字パターンの特徴ベ
クトル同士が集合することにより、文字種毎にクラスタ
が形成される。この性質を利用することにより、まず学
習用文字パターンの特徴ベクトルが分類され、その結果
得られるクラスタ毎にそのクラスタに含まれる特徴ベク
トルからそのクラスタに対応する文字種を代表する平均
特徴ベクトルが計算される。平均特徴ベクトルは、例え
ば各特徴ベクトルの要素毎に平均値が計算されることに
よって算出される。そして、これらの文字種毎の平均特
徴ベクトルが、辞書として登録される。
徴ベクトルが計算された後、その特徴ベクトルと辞書に
登録されている各平均特徴ベクトルとの距離が計算さ
れ、距離が最も小さかった平均特徴ベクトルに対応する
文字種が入力文字の文字種として推定される。距離とし
ては、ユークリッド距離やシティブロック距離を計算す
る方法が良く知られている。
場合に、その特徴空間の次元数に応じた時間が必要にな
ってしまう。そこで、計算の高速化を図るために、特徴
空間の次元数を削減した上で(例えば384次元から6
4次元への削減)、距離を計算する技術が知られてい
る。このような、特徴空間の次元数を削減する手法は、
特徴選択と呼ばれ、特徴選択のための具体的な手法とし
て、正準判別分析や主成分分析が知られている。特徴選
択による次元数の削減割合が元の次元数の1/8程度ま
では認識率はほとんど低下しないことが実験的に確かめ
られており、むしろ、特徴選択によって有意でないノイ
ズ的な特徴ベクトルが削減されることによる認識率の増
加の効果も期待できる。
いた文字認識の従来技術について、図9の構成図に基づ
いて説明する。まず、特徴抽出部901は、g種類から
なる文字種i(1≦i≦g)毎に、その文字種iに含ま
れるni サンプルの文字パターンから、前述したように
して、下記数1式に示されるni 組の学習用の特徴ベク
トルx j (i) (1≦j≦ni )を抽出する。ここで、上
付き添字“T ”は、行列(又はベクトル)の転置を表わ
す。
号を示しており、その範囲は1≦k≦Nである。なお、
以後の説明において、下線が付加されている記号は、ベ
クトル量を示すものとし、上述のように要素番号が付加
されて下線が付加されていない記号は、ベクトルの要素
値を示すものとする。
る文字種i(1≦i≦g)毎に、その文字種iに対応す
る上記特徴ベクトルx j (i) (1≦j≦ni )から、そ
の文字種iに対応し下記数2式に示される平均特徴ベク
トルm (i) を計算する。
サンプル数ni と上記平均特徴ベクトルm (i) とから、
下記数3式に示される全文字種についての平均特徴ベク
トル(全体平均特徴ベクトル)mを計算する。
式〜数7式として示されるようにして、文字種i毎の特
徴ベクトルx j (i) 、サンプル数ni 、及び上述のよう
にして計算される平均特徴ベクトルm (i) と、全体平均
特徴ベクトルmとに基づき、文字種間分散行列Sb と文
字種内分散行列Sw とを計算する。ここで、添字p及び
qは、それぞれ特徴ベクトルの要素番号を示しており、
その範囲は1≦p,q≦Nである。
して計算した文字種間分散行列Sbと文字種内分散行列
Sw とを用いて、下記数8式を満たし、N組からなる固
有ベクトルφ k (それぞれの次元はNで長さは1)と固
有値λk の組(1≦k≦N)を計算する。
にして計算したN本の固有ベクトルφ k のうちそれぞれ
に対応する固有値λk の大きいものからM本(M<N)
の固有ベクトルφ h (1≦h≦M)を選択し、それらを
固有ベクトル記憶部903に記憶させる。
に、上記M本の固有ベクトルφ h (1≦h≦M)と、N
次元の平均特徴ベクトルm (i) との内積を下記数9式に
示されるようにして計算することにより、文字種i毎
に、M次元の平均選択特徴ベクトルm (i) ′を算出し、
それらを認識辞書部904に記憶させる。
素番号を示しており、その範囲は1≦h≦Mである。こ
のようにして、辞書を構成する文字種毎の平均特徴ベク
トルにつき、N次元からM次元への次元の削減処理であ
る特徴選択処理が実行される。この特徴選択処理は、言
い換えれば、文字種間分散を大きくさせかつ文字種内分
散を小さくさせるように、即ちM本の固有ベクトルφ h
によって規定される特徴選択後の空間において、異なる
種類の文字がなるべく離れかつ同じ種類の文字がなるべ
くまとまるように、N次元の平均特徴ベクトルをM本の
固有ベクトルφ hによって規定されるM本の座標軸へ射
影させる処理に等価である。即ち、この正準判別分析に
おいては、対象となる全文字種に対応する元の特徴空間
上の全てのクラスタが、1つの新たな空間に変換される
ことになる。
部901が、文字種が未知である入力文字パターンか
ら、下記数10式に示されるN次元の特徴ベクトルxを
抽出する。
トルの要素番号を示しており、その範囲は1≦k≦Nで
ある。次に、特徴選択部905は、固有ベクトル記憶部
903に記憶されているM本の固有ベクトルφ h (1≦
h≦M)と、N次元の特徴ベクトルxとの内積を下記数
11式に示されるようにして計算することにより、M次
元の選択特徴ベクトルyを算出する。
て、N次元からM次元への次元の削減処理である特徴選
択処理が実行される。最後に、照合部906は、文字種
i毎に、M次元の選択特徴ベクトルyと認識辞書部90
4に記憶されている平均選択特徴ベクトルm (i) ′との
間の例えばユークリッド距離d(i) を、下記数12式に
示されるようにして計算する。
が最も小さかった平均選択特徴ベクトルm (i) ′に対応
する文字種iを、入力文字パターンに対する推定文字種
として出力する。
の従来技術によれば、距離計算における要素数がN項か
らM項に削減されるため、MをNの1/8程度に設定す
ることにより、認識速度を大幅に向上させることが可能
となる。
いた上述の従来技術では、M本の固有ベクトルφ h (1
≦h≦M)は、相互に直交することは保証されていな
い。従って、これらの固有ベクトルφ h に基づいて新た
な特徴空間が定義された場合、認識対象文字の特徴ベク
トルxを上記M本の固有ベクトルφ h に対応するM本の
座標軸に射影させ、その射影結果である選択特徴ベクト
ルyと文字種i毎の平均選択特徴ベクトルm (i) ′との
ユークリッド距離等を計算した場合、その距離は元のN
次元の特徴空間上での距離と大きく異なってしまう場合
が生ずる。
れるように、特徴選択前の次元数が3次元で特徴選択後
の次元数が2次元である場合を考える。特徴選択前の3
次元の特徴空間上での特徴ベクトルx 2 の特徴ベクトル
x 1 に対するユークリッド距離dorg は、下記数13式
によって与えられる。
の特徴ベクトルx 2 の特徴ベクトルx 1 に対する近似的
なユークリッド距離dnew は、下記数14式によって与
えられる。
は図10に示される通りである。図10を見ると明らか
なように、数14式はピタゴラスの定理に従ってなく、
特徴選択後の2次元の特徴空間上でのユークリッド距離
dnew は、特徴選択前の3次元の特徴空間上でのユーク
リッド距離dorg からは大きくかけ離れてしまう。
用いた上述の従来技術では、正準判別分析によって求ま
るM本の固有ベクトルφ h (1≦h≦M)への特徴ベク
トルxの射影の組合せは、元の特徴空間に対する部分固
有空間への特徴ベクトルxの射影を示していることには
ならず、文字認識精度の低下を招いてしまい、実用的な
認識精度を有する文字認識装置等を実現することが困難
であるという問題点を有していた。
成分分析では、各文字種が相互に離れるような主成分ベ
クトルの組が各文字種毎に計算される。この分析法は、
複数種類の文字の判別を目的とした文字分類のためとい
うよりは、特徴空間内の近接した領域で類似する文字種
が存在するときに、認識対象文字の特徴ベクトルをそれ
ぞれの文字種に対応する主成分ベクトルに射影させるこ
とによってより正確な認識結果を得るという目的で適用
される。即ち、主成分分析では、各文字種毎に主成分ベ
クトルを座標軸とする個別の新たな空間が生成されるこ
とになる。そして、認識対象文字と各文字種との距離
は、認識対象文字の特徴ベクトルが各文字種の主成分ベ
クトルに射影させられた上で計算されるため、文字種が
多いと膨大な計算量が必要となる。従って、この分析法
は、数字とか文字種が少なく似通った文字の判別等に主
に用いられている。
して、マハラノビス距離やベイズ距離が知られている。
これらの距離を用いて認識装置が構成された場合には、
距離計算が行われる座標軸が直交するように制約が加え
られた上で距離が計算されるため、正準判別分析におけ
るような問題点は発生しないが、計算が非常に複雑で膨
大な計算量を必要とするという問題点を有している。
限られるものではなく、画像パターンや音声パターン等
の様々なパターンを特徴ベクトルを介して認識する技術
に共通の問題点である。
を目的として、特徴選択の手法を用いて特徴ベクトルの
次元数を削減することにより認識処理の高速化を図りな
がらも、認識精度を維持できるパターン認識装置を実現
することにある。
入力文字パターン等の入力パターンの特徴を表現する入
力特徴ベクトルを用いてその入力パターンを認識するパ
ターン認識装置を前提とする。
る入力特徴ベクトルを抽出する入力特徴ベクトル抽出手
段を有する。次に、元特徴空間の部分固有空間の正規直
交基底を保持する正規直交基底記憶手段を有する。
応し部分固有空間上で規定される各辞書選択特徴ベクト
ルを記憶する認識辞書手段を有する。更に、正規直交基
底記憶手段が記憶する正規直交基底を用い、入力特徴ベ
クトル抽出手段が抽出した入力特徴ベクトルの部分固有
空間への射影である入力選択特徴ベクトルを算出する特
徴選択手段を有する。
選択特徴ベクトルと認識辞書手段が記憶する各辞書選択
特徴ベクトルとを照合することによって、その入力選択
特徴ベクトルに対応する入力パターンの種類を認識する
照合手段を有する。この手段における照合は、例えば、
入力選択特徴ベクトルと各辞書選択特徴ベクトルとの各
距離を計算し、その各距離の値を比較する処理である。
そして、この距離としては、例えば、ユークリッド距離
に基づく距離、市街区距離に基づく距離、又はチェス盤
距離に基づく距離等を採用することができる。
様によるパターン認識装置における正規直交基底と各辞
書選択特徴ベクトルを算出するパターン学習装置を前提
とする。
る学習特徴ベクトルを抽出する学習特徴ベクトル抽出手
段を有する。次に、その学習特徴ベクトル抽出手段が抽
出した学習特徴ベクトルに基づき、部分固有空間の正規
直交基底を算出する正規直交基底算出手段を有する。
た学習特徴ベクトルに基づき、各認識対象パターンに対
応し元特徴空間上で規定される各辞書特徴ベクトルを算
出する辞書特徴ベクトル算出手段を有する。
正規直交基底を用い、辞書特徴ベクトル算出手段が算出
した各辞書特徴ベクトルの部分固有空間への各射影であ
る各辞書選択特徴ベクトルを算出する辞書選択特徴ベク
トル算出手段を有する。
において、正規直交基底は、例えば、学習パターンの学
習特徴ベクトルに対して正準判別分析を実行することに
よって、固有値の大きい順に元特徴空間の次元数よりも
少ない所定数の固有ベクトルを算出し、その所定数の固
有ベクトルを固有値の大きい順に順次直交化させること
により所定数の正規直交基底ベクトルを算出する、こと
によって算出することができる。
の構成において、入力特徴ベクトル又は辞書特徴ベクト
ルの部分固有空間への射影の結果得られる入力選択特徴
ベクトル又は各辞書選択特徴ベクトルは、その入力特徴
ベクトル又はその辞書特徴ベクトルの正規直交基底ベク
トルへの射影の結果得られるものであるように構成する
ことができる。更にその射影の結果得られる入力選択特
徴ベクトル又は各辞書選択特徴ベクトルは、その入力特
徴ベクトル又はその辞書特徴ベクトルと正規直交基底ベ
クトルとの内積を演算した結果得られるものであるよう
に構成することができる。
の構成において、辞書選択特徴ベクトルは、各認識対象
パターンの種類毎の特徴ベクトルの平均である平均特徴
ベクトルに基づくものであるように構成することができ
る。
態様の構成によって実現される機能と同様の機能を有す
る方法発明として構成することもできる。また、本発明
は、コンピュータにより使用されたときに、上述の本発
明の第1又は第2の態様の構成によって実現される機能
と同様の機能をコンピュータに行わせるためのコンピュ
ータ読出し可能記録媒体として構成することもできる。
は、従来技術の場合と同様に、距離計算における要素数
が削減されるため認識速度を大幅に向上させることが可
能となると同時に、本発明に関連する独自の特徴とし
て、特徴ベクトルが元の特徴空間の部分固有空間へ射影
させられることにより距離の保存が実現され、実用的な
認識精度を有する文字認識装置を実現することが可能と
なる。
の手法によって固有ベクトルを算出した後、直交化のた
めの簡単な漸化式によって正規直交基底ベクトルを算出
することにより、正規直交基底を簡単な処理で算出する
ことが可能となる。
って、文字種内分散を最小にし文字種間分散を最大にす
るという正準判別分析の性質が若干失われることが予想
されたが、実験によれば、そのことによる認識率の低下
よりも、距離計算が直交化によって正常化されることに
よる認識率の向上の方が大幅に上回る結果が得られ、本
発明の有効性が確認できた。
明の実施の形態について順次説明する。本発明の実施の
形態では、正準判別分析によって固有値の大きい順にM
本の固有ベクトルφ h (1≦h≦M)が算出された後、
シュミットの直交化法に基づいてそれらの固有ベクトル
φ h が直交化させられることによって、M本の正規直交
基底ベクトルψ h (1≦h≦M)が算出される。その
後、N次元の特徴ベクトルが上記M本の正規直交基底ベ
クトルψ h へ射影させられることによって、選択特徴ベ
クトルが算出される。そして、このような選択特徴ベク
トルを用いて認識処理が実行されることにより、特徴選
択の手法を用いて特徴ベクトルの次元数を削減すること
により認識処理の高速化を図りながらも、高い認識精度
を維持できることが、本発明に関連する大きな特徴であ
る。
るように、特徴選択前の次元数が3次元で特徴選択後の
次元数が2次元である場合を考える。まず、正準判別分
析によって固有値の大きい順に2本の固有ベクトルφ 1
及びφ 2 が算出された後、シュミットの直交化法に基づ
いてそれらの固有ベクトルが直交化させられることによ
って、2本の正規直交基底ベクトルψ 1 (=φ 1 )及び
ψ 2 が算出される。
ベクトルx 2 の特徴ベクトルx 1 に対するユークリッド
距離dorg は、前述した数13式によって与えられる。
一方、特徴選択後の2次元の特徴空間上での特徴ベクト
ルx 2 の特徴ベクトルx 1 に対する近似的なユークリッ
ド距離dnew は、下記数15式によって与えられる。
は図2に示される通りである。図2を見ると明らかなよ
うに、数15式はピタゴラスの定理に従っており、特徴
選択後の2次元の特徴空間上でのユークリッド距離d
new は、特徴選択前の3次元の特徴空間上でのユークリ
ッド距離dorg を良く近似するものとなる。
同様に適用できる。そして、これから具体的に説明する
本実施の形態では、正規直交基底ベクトルψ h への特徴
ベクトルxの射影の組合せは、元の特徴空間に対する部
分固有空間への特徴ベクトルxの射影に等価となる。こ
の結果、特徴選択後においても充分な文字認識精度を確
保することができる。
構成図である。まず、学習処理時において、特徴抽出部
101及び学習処理部102は、図3の動作フローチャ
ートによって表現される学習処理を実行する。
3で、1つの文字種iについて、その文字種iに含まれ
るni サンプルの文字パターンから、前述した数1式に
示されるni 組の学習用の特徴ベクトルx j (i) (1≦
j≦ni )を抽出する。ここで、ステップ302におい
てサンプル番号jが1にセットされた後、ステップ30
5でサンプル番号jが文字種iのサンプル数ni を超え
たと判定されるまで、ステップ304でサンプル番号j
が+1ずつ順次インクリメントされながら、ステップ3
03の処理が繰り返し実行されることにより、文字種i
に対応するni組の学習用の特徴ベクトルx j (i) の抽
出処理が実現される。
iについて、上記ステップ302〜305によって得ら
れたその文字種iに対応するni 組の学習用の特徴ベク
トルx j (i) を用いて、それらのベクトルの各要素毎に
平均値を計算することによって、その文字種iに対応し
前述した数2式に示される平均特徴ベクトルm (i) を計
算する。
1にセットされた後、ステップ308で文字種番号iが
総文字種数gを超えたと判定されるまで、ステップ30
7で文字種番号iが+1ずつ順次インクリメントされな
がら、上記ステップ302〜306の処理が実行される
ことにより、g種類からなる文字種i(1≦i≦g)毎
に、ni 組の学習用の特徴ベクトルx j (i) と1つの平
均特徴ベクトルm (i)の計算処理が順次実行される。
09において、文字種i毎のサンプル数ni 及び上記平
均特徴ベクトルm (i) の各要素mk (i) とから、下記数
16式に示されるようにして、前述した数3式に示され
る全文字種についての平均特徴ベクトル(全体平均特徴
ベクトル)mの各要素mk を計算する。
10で、文字種i毎の特徴ベクトルx j (i) 、サンプル
数ni 、及び平均特徴ベクトルm (i) と、全体平均特徴
ベクトルmとに基づいて、文字種間分散行列Sb を計算
する。この処理の詳細は、図4の動作フローチャートに
よって示される。
1で1にセットされた後、ステップ411で番号Nを超
えたと判定されるまで、ステップ410で+1ずつイン
クリメントされる。また、第2の要素番号qは、ステッ
プ402で1にセットされた後、ステップ409で番号
Nを超えたと判定されるまで、ステップ408で+1ず
つインクリメントされる。そして、これらの制御ループ
によって決定される第1の要素番号pと第2の要素番号
qの組毎に、ステップ403〜ステップ407によっ
て、前述した数5式が計算される。
p及び第2の要素番号qによって決定される文字種間分
散行列Sb の1つの要素値bpqがクリアされ、文字種番
号iがステップ403で1にセットされた後ステップ4
07で総文字種数gを超えたと判定されるまでステップ
406で+1ずつ順次インクリメントされながら、ステ
ップ405において、下記数17式で示される計算処理
が繰り返し実行されることにより、要素値bpqが計算さ
れる。
処理が、ステップ401、402、408〜411の制
御ループによって繰り返し実行されることにより、第1
の要素番号pと第2の要素番号qの全ての組合せによっ
て決定される文字種間分散行列Sb の全ての要素値bpq
が計算される。
式で示されるようにして、上記計算された全要素値bpq
の集合として、文字種間分散行列Sb が出力される。学
習処理部102は、以上のようにして図3のステップ3
10で文字種間分散行列Sb を計算した後、ステップ3
11で、文字種i毎の特徴ベクトルx j (i)と、サンプ
ル数ni と、平均特徴ベクトルm (i) とに基づいて、文
字種内分散行列Sw を計算する。この処理の詳細は、図
5の動作フローチャートによって示される。
1で1にセットされた後、ステップ514で番号Nを超
えたと判定されるまで、ステップ513で+1ずつイン
クリメントされる。また、第2の要素番号qは、ステッ
プ502で1にセットされた後、ステップ512で番号
Nを超えたと判定されるまで、ステップ511で+1ず
つインクリメントされる。そして、これらの制御ループ
によって決定される第1の要素番号pと第2の要素番号
qの組毎に、ステップ503〜ステップ510によっ
て、前述した数7式が計算される。
p及び第2の要素番号qによって決定される文字種内分
散行列Sw の1つの要素値wpqがクリアされ、まず、文
字種番号iがステップ503で1にセットされた後ステ
ップ510で総文字種数gを超えたと判定されるまでス
テップ509で+1ずつ順次インクリメントされなが
ら、ステップ506〜508のループが繰り返し実行さ
れる。このループでは更に、サンプル番号jがステップ
504で1にセットされた後ステップ508で総サンプ
ル数ni を超えたと判定されるまでステップ507で+
1ずつ順次インクリメントされながら、ステップ506
において、下記数18式で示される計算処理が繰り返し
実行されることにより、要素値wpqが計算される。
処理が、ステップ501、502、511〜514の制
御ループによって繰り返し実行されることにより、第1
の要素番号pと第2の要素番号qの全ての組合せによっ
て決定される文字種内分散行列Sw の全ての要素値wpq
が計算される。
式で示されるようにして、上記計算された全要素値wpq
の集合として、文字種内分散行列Sw が出力される。学
習処理部102は、上述のようにして図3のステップ3
10で計算した文字種間分散行列Sb とステップ311
で計算した文字種内分散行列Sw とを用いることによ
り、ステップ312で、前述した数8式を満たし、N組
からなる固有ベクトルφ k と固有値λk の組(1≦k≦
N)を計算する。この計算処理は、周知の処理であるた
め、その詳細は省略する。そして、学習処理部102
は、ステップ312で、上述のようにして計算したN本
の固有ベクトルφ k のうちそれぞれに対応する固有値λ
k の大きいものからM本(M<N)の固有ベクトルφ h
(1≦h≦M)を選択する。
3で、上記固有ベクトルφ h (1≦h≦M)を直交化さ
せる処理を実行することにより、M本の正規直交基底ベ
クトルψ h (1≦h≦M)を算出する。直交化の手法と
しては、シュミットの直交化法を使用する。この直交化
法においては、固有値λh の大きい固有ベクトルφ hか
ら順に、下記数19式及び数20式で示される漸化式及
び数21式で示される正規化式が実行されることによ
り、M本の正規直交基底ベクトルψ h (1≦h≦M)が
順次算出される。
るように、固有値の大きい固有ベクトルから順次、現在
処理対象とされる固有ベクトルφh よりも固有値の大き
い固有ベクトルφi (1≦i≦h−1)に基づいて現在
までに得られている正規直交基底ベクトルψi (1≦i
≦h−1)の全てに直交し、固有ベクトルφh に対応す
るベクトルth が計算される。そして、数21式によっ
て、そのベクトルth の長さが1に正規化されることに
より、固有ベクトルφh に対応する正規直交基底ベクト
ルψh が算出される。
6の動作フローチャートにより示される。まず、学習処
理部102は、ステップ601で、数19式を計算す
る。
を、ステップ602で2にセットした後、ステップ60
6で特徴選択後の次元数Mを超えたと判定するまで、ス
テップ605で順次+1ずつインクリメントしながら、
数20式に対応するステップ603の計算処理と、数2
1式に対応するステップ604の計算処理を繰り返し実
行する。
来と同様の正準判別分析の手法によって固有ベクトルφ
h が算出された後、直交化のための簡単な漸化式によっ
て正規直交基底ベクトルψh が算出されることが、本発
明に関連する大きな特徴である。
3において、上述のようにして算出したM本の正規直交
基底ベクトルψh (1≦h≦M)を、部分固有空間の正
規直交基底記憶部103に記憶させる。
ップ314で、文字種i毎に、上記M本の正規直交基底
ベクトルψh (1≦h≦M)と、ステップ306で算出
したN次元の平均特徴ベクトルm (i) との内積を下記数
22式に示されるようにして計算することにより、文字
種i毎に、M次元の平均選択特徴ベクトルm (i) ′を算
出し、それらを認識辞書部104に記憶させる。
素番号を示しており、その範囲は1≦h≦Mである。こ
のようにして、辞書を構成する文字種毎の平均特徴ベク
トルにつき、N次元からM次元への次元の削減処理であ
る特徴選択処理が実行される。本実施の形態における特
徴選択処理は、言い換えれば、従来技術の場合と同様に
文字種間分散を大きくさせかつ文字種内分散を小さくさ
せるように、N次元の平均特徴ベクトルをM本の正規直
交基底ベクトルψh によって規定されるM本の座標軸に
射影させる処理に等価である。ここで、M本の正規直交
基底ベクトルψhは相互に直交するため、上記射影処理
は、N次元の平均特徴ベクトルを、元の特徴空間の部分
固有空間へ射影させる処理に等価となる。この結果、図
2を用いて前述したように、元の特徴空間上でのベクト
ル間の距離と、M本の正規直交基底ベクトルψh によっ
て規定される部分固有空間上でのベクトル間の距離とが
良く対応することになる。以上説明したようにして、学
習処理部102が、図3の動作フローチャートに基づく
学習処理を実行する。
部101が、文字種が未知である入力文字パターンか
ら、前述した数10式に示されるN次元の特徴ベクトル
xを抽出する。
の正規直交基底記憶部103に記憶されているM本の正
規直交基底ベクトルψh (1≦h≦M)と、N次元の特
徴ベクトルxとの内積を下記数23式に示されるように
して計算することにより、M次元の選択特徴ベクトルz
を算出する。
き、M次元の部分固有空間への射影(特徴選択)が実行
される。最後に、照合部106は、文字種i毎に、M次
元の選択特徴ベクトルzと認識辞書部104に記憶され
ている平均選択特徴ベクトルm (i) ′との間の例えばユ
ークリッド距離d(i) を、下記数24式に示されるよう
にして計算する。
が最も小さかった平均選択特徴ベクトルm (i) ′に対応
する文字種iを、入力文字パターンに対する推定文字種
として出力する。
術の場合と同様に、距離計算における要素数がN項から
M項に削減されるため認識速度を大幅に向上させること
が可能となると同時に、本発明に関連する独自の特徴と
して、特徴ベクトルが元の特徴空間の部分固有空間へ射
影させられることにより距離の保存が実現され、実用的
な認識精度を有する文字認識装置を実現することが可能
となる。
って、文字種内分散を最小にし文字種間分散を最大にす
るという正準判別分析の性質が若干失われることが予想
されたが、実験によれば、そのことによる認識率の低下
よりも、距離計算が直交化によって正常化されることに
よる認識率の向上の方が大幅に上回る結果が得られ、本
発明の有効性が確認できた。
の距離としてユークリッド距離を用いたが、本発明はこ
れに限られるものではなく、ユークリッド距離に基づく
他の距離や、市街区(シティブロック)距離、チェス盤
距離等も採用することができる。ここで、ベクトルx1
とベクトルx2 間の市街区距離dは、次式によって定義
される。但し、x1h及びx2hは、それぞれベクトルx1
及びx2 の各要素である。この距離は、座標軸に沿って
縦又は横の何れかの方向にのみ計測される状況下での距
離である。
ェス盤距離dは、次式によって定義される。この距離
は、座標軸に沿って縦、横、又は斜めの何れかの方向に
のみ計測される状況下での最短距離である。
字認識装置に限定されるものではなく、種々のパターン
認識装置に適用できることは言うまでもない。また、本
発明は、コンピュータにより使用されたときに、上述の
本発明の実施の形態の構成によって実現される機能と同
様の機能をコンピュータに行わせるためのコンピュータ
読出し可能記録媒体として構成することもできる。
ばフロッピィディスク、CD−ROMディスク、光ディ
スク、リムーバブルハードディスク等の可搬型記憶媒体
802や、ネットワーク回線803経由で、本発明の実
施の形態の各種機能を実現するプログラムが、コンピュ
ータ801の本体804内のメモリ(RAM又はハード
ディスク等)805にロードされて、実行される。
に、距離計算における要素数が削減されるため認識速度
を大幅に向上させることが可能となると同時に、本発明
に関連する独自の特徴として、特徴ベクトルが元の特徴
空間の部分固有空間へ射影させられることにより距離の
保存が実現され、実用的な認識精度を有する文字認識装
置を実現することが可能となる。
の手法によって固有ベクトルを算出した後、直交化のた
めの簡単な漸化式によって正規直交基底ベクトルを算出
することにより、正規直交基底を簡単な処理で算出する
ことが可能となる。
って、文字種内分散を最小にし文字種間分散を最大にす
るという正準判別分析の性質が若干失われることが予想
されたが、実験によれば、そのことによる認識率の低下
よりも、距離計算が直交化によって正常化されることに
よる認識率の向上の方が大幅に上回る結果が得られ、本
発明の有効性が確認できた。
ャートである。
チャートである。
チャートである。
チャートである。
た記録媒体の説明図である。
Claims (16)
- 【請求項1】 入力パターンの特徴を表現する特徴ベク
トルを用いて該入力パターンを認識するパターン認識装
置であって、 前記入力パターンの特徴を表現する入力特徴ベクトルを
抽出する入力特徴ベクトル抽出手段と、 元特徴空間の部分固有空間の正規直交基底を保持する正
規直交基底記憶手段と、 1つ以上の各認識対象パターンに対応し前記部分固有空
間上で規定される各辞書選択特徴ベクトルを記憶する認
識辞書手段と、 前記正規直交基底記憶手段が記憶する正規直交基底を用
い、前記入力特徴ベクトル抽出手段が抽出した入力特徴
ベクトルの前記部分固有空間への射影である入力選択特
徴ベクトルを算出する特徴選択手段と、 該特徴選択手段が算出した入力選択特徴ベクトルと前記
認識辞書手段が記憶する各辞書選択特徴ベクトルとを照
合することによって、該入力選択特徴ベクトルに対応す
る入力パターンの種類を認識する照合手段と、 を含むことを特徴とするパターン認識装置。 - 【請求項2】 入力パターンの特徴を表現する入力特徴
ベクトルを用いて該入力パターンを認識するパターン認
識方法であって、 前記入力パターンの特徴を表現する入力特徴ベクトルを
抽出し、 元特徴空間の部分固有空間の正規直交基底を保持し、 1つ以上の各認識対象パターンに対応し前記部分固有空
間上で規定される各辞書選択特徴ベクトルを記憶し、 前記正規直交基底を用い、前記入力パターンに対して抽
出された入力特徴ベクトルの前記部分固有空間への射影
である入力選択特徴ベクトルを算出し、 該入力選択特徴ベクトルと前記各辞書選択特徴ベクトル
とを照合することによって、該入力選択特徴ベクトルに
対応する入力パターンの種類を認識する、 過程を含むことを特徴とするパターン認識方法。 - 【請求項3】 請求項1に記載のパターン認識装置又は
請求項2に記載のパターン認識方法における前記正規直
交基底と前記各辞書選択特徴ベクトルを算出するパター
ン学習装置であって、 学習パターンの特徴を表現する学習特徴ベクトルを抽出
する学習特徴ベクトル抽出手段と、 該学習特徴ベクトル抽出手段が抽出した学習特徴ベクト
ルに基づき、前記部分固有空間の正規直交基底を算出す
る正規直交基底算出手段と、 前記学習特徴ベクトル抽出手段が抽出した学習特徴ベク
トルに基づき、前記各認識対象パターンに対応し前記元
特徴空間上で規定される各辞書特徴ベクトルを算出する
辞書特徴ベクトル算出手段と、 前記正規直交基底算出手段が算出した正規直交基底を用
い、前記辞書特徴ベクトル算出手段が算出した各辞書特
徴ベクトルの前記部分固有空間への各射影である前記各
辞書選択特徴ベクトルを算出する辞書選択特徴ベクトル
算出手段と、 を含むことを特徴とするパターン学習装置。 - 【請求項4】 請求項1に記載のパターン認識装置又は
請求項2に記載のパターン認識方法における前記正規直
交基底と前記各辞書選択特徴ベクトルを算出するパター
ン学習方法であって、 学習パターンの特徴を表現する学習特徴ベクトルを抽出
し、 該学習特徴ベクトルに基づき、前記部分固有空間の正規
直交基底を算出し、 前記学習パターンの学習特徴ベクトルに基づき、前記各
認識対象パターンに対応し前記元特徴空間上で規定され
る各辞書特徴ベクトルを算出し、 前記正規直交基底を用い、前記各辞書特徴ベクトルの前
記部分固有空間への射影である前記辞書選択特徴ベクト
ルを算出する、 過程を含むことを特徴とするパターン学習方法。 - 【請求項5】 入力パターンの特徴を表現する入力特徴
ベクトルを用いて該入力パターンを認識するパターン認
識装置であって、 前記入力パターンの特徴を表現する入力特徴ベクトル又
は学習パターンの特徴を表現する学習特徴ベクトルを抽
出する特徴ベクトル抽出手段と、 元特徴空間の部分固有空間の正規直交基底を保持する正
規直交基底記憶手段と、 1つ以上の各認識対象パターンに対応し前記部分固有空
間上で規定される各辞書選択特徴ベクトルを記憶する認
識辞書手段と、 前記特徴ベクトル抽出手段が抽出した学習パターンの学
習特徴ベクトルに基づき、前記部分固有空間の正規直交
基底を算出し、それらを前記正規直交基底記憶手段に記
憶させる正規直交基底算出手段と、 前記特徴ベクトル抽出手段が抽出した学習パターンの学
習特徴ベクトルに基づき、前記各認識対象パターンに対
応し前記元特徴空間上で規定される各辞書特徴ベクトル
を算出する辞書特徴ベクトル算出手段と、 前記正規直交基底算出手段が算出した正規直交基底を用
い、前記辞書特徴ベクトル算出手段が算出した各辞書特
徴ベクトルの前記部分固有空間への各射影である前記各
辞書選択特徴ベクトルを算出し、それらを前記認識辞書
手段に記憶させる辞書選択特徴ベクトル算出手段と、 前記正規直交基底記憶手段が記憶する正規直交基底を用
い、前記特徴ベクトル抽出手段が抽出した入力パターン
の入力特徴ベクトルの前記部分固有空間への射影である
入力選択特徴ベクトルを算出する特徴選択手段と、 該特徴選択手段が算出した入力選択特徴ベクトルと前記
認識辞書手段が記憶する各辞書選択特徴ベクトルとを照
合することによって、該入力選択特徴ベクトルに対応す
る入力パターンの種類を認識する照合手段と、 を含むことを特徴とするパターン認識装置。 - 【請求項6】 コンピュータにより使用されたときにそ
れによって読み出される記録媒体であって、 入力パターンの特徴を表現する入力特徴ベクトルを抽出
する機能と、 元特徴空間の部分固有空間の正規直交基底を保持する機
能と、 1つ以上の各認識対象パターンに対応し前記部分固有空
間上で規定される各辞書選択特徴ベクトルを記憶する機
能と、 前記正規直交基底を用い、前記入力パターンに対して抽
出された入力特徴ベクトルの前記部分固有空間への射影
である入力選択特徴ベクトルを算出する機能と、 該入力選択特徴ベクトルと前記各辞書選択特徴ベクトル
とを照合することによって、該入力選択特徴ベクトルに
対応する入力パターンの種類を認識する機能と、 を前記コンピュータに行わせるためのコンピュータ読出
し可能記録媒体。 - 【請求項7】 コンピュータにより使用されたときにそ
れによって読み出される記録媒体であって、 学習パターンの特徴を表現する学習特徴ベクトルを抽出
する機能と、 該学習特徴ベクトルに基づき、前記部分固有空間の正規
直交基底を算出する機能と、 前記学習パターンの学習特徴ベクトルに基づき、前記各
認識対象パターンに対応し前記元特徴空間上で規定され
る各辞書特徴ベクトルを算出する機能と、 前記正規直交基底を用い、前記各辞書特徴ベクトルの前
記部分固有空間への射影である前記辞書選択特徴ベクト
ルを算出する機能と、 を前記コンピュータに行わせるためのコンピュータ読出
し可能記録媒体。 - 【請求項8】 前記正規直交基底は、 前記学習パターンの学習特徴ベクトルに対して正準判別
分析を実行することによって、固有値の大きい順に前記
元特徴空間の次元数よりも少ない所定数の固有ベクトル
を算出し、 該所定数の固有ベクトルを固有値の大きい順に順次直交
化させることにより所定数の正規直交基底ベクトルを算
出する、 ことによって算出することを特徴とする請求項1乃至7
の何れか1項に記載のパターン認識装置、パターン認識
方法、パターン学習装置、パターン学習方法、又はコン
ピュータ読出し可能記録媒体。 - 【請求項9】 前記入力特徴ベクトル又は前記辞書特徴
ベクトルの前記部分固有空間への射影の結果得られる前
記入力選択特徴ベクトル又は前記各辞書選択特徴ベクト
ルは、該入力特徴ベクトル又は該辞書特徴ベクトルの前
記正規直交基底ベクトルへの射影の結果得られるもので
ある、 ことを特徴とする請求項8に記載のパターン認識装置、
パターン認識方法、パターン学習装置、パターン学習方
法、又はコンピュータ読出し可能記録媒体。 - 【請求項10】 前記入力特徴ベクトル又は前記辞書特
徴ベクトルの前記正規直交基底ベクトルへの射影の結果
得られる前記入力選択特徴ベクトル又は前記各辞書選択
特徴ベクトルは、該入力特徴ベクトル又は該辞書特徴ベ
クトルと前記正規直交基底ベクトルとの内積を演算した
結果得られるものである、 ことを特徴とする請求項9に記載のパターン認識装置、
パターン認識方法、パターン学習装置、パターン学習方
法、又はコンピュータ読出し可能記録媒体。 - 【請求項11】 前記辞書選択特徴ベクトルは、前記各
認識対象パターンの種類毎の特徴ベクトルの平均である
平均特徴ベクトルに基づくものである、 ことを特徴とする請求項1乃至10の何れか1項に記載
のパターン認識装置、パターン認識方法、パターン学習
装置、パターン学習方法、又はコンピュータ読出し可能
記録媒体。 - 【請求項12】 前記入力選択特徴ベクトルと前記各辞
書選択特徴ベクトルとの照合は、前記入力選択特徴ベク
トルと前記各辞書選択特徴ベクトルとの各距離を計算
し、該各距離の値を比較する処理である、 ことを特徴とする請求項1、2、5、6、8、9、1
0、又は11の何れか1項に記載のパターン認識装置、
パターン認識方法、又はコンピュータ読出し可能記録媒
体。 - 【請求項13】 前記距離は、ユークリッド距離に基づ
く距離であることを特徴とする請求項12に記載のパタ
ーン認識装置、パターン認識方法、又はコンピュータ読
出し可能記録媒体。 - 【請求項14】 前記距離は市街区距離に基づく距離で
あることを特徴とする請求項12に記載のパターン認識
装置、パターン認識方法、又はコンピュータ読出し可能
記録媒体。 - 【請求項15】 前記距離はチェス盤距離に基づく距離
であることを特徴とする請求項12に記載のパターン認
識装置、パターン認識方法、又はコンピュータ読出し可
能記録媒体。 - 【請求項16】 前記パターンは文字パターンであるこ
とを特徴とする請求項1乃至15の何れか1項に記載の
パターン認識装置、パターン学習装置、パターン認識方
法、パターン学習方法、又はコンピュータ読出し可能記
録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9146600A JPH1055412A (ja) | 1996-06-06 | 1997-06-04 | 特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置及び方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-144109 | 1996-06-06 | ||
JP14410996 | 1996-06-06 | ||
JP9146600A JPH1055412A (ja) | 1996-06-06 | 1997-06-04 | 特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1055412A true JPH1055412A (ja) | 1998-02-24 |
Family
ID=26475635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9146600A Pending JPH1055412A (ja) | 1996-06-06 | 1997-06-04 | 特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1055412A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006209353A (ja) * | 2005-01-26 | 2006-08-10 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
EP2017770A2 (en) | 2001-12-14 | 2009-01-21 | NEC Corporation | Face meta-data generation and face similarity calculation |
JP2011028459A (ja) * | 2009-07-23 | 2011-02-10 | Canon Inc | 画像処理方法および画像処理装置およびプログラム |
JP2021524686A (ja) * | 2018-05-18 | 2021-09-13 | スーズ,インコーポレイテッド | 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習 |
-
1997
- 1997-06-04 JP JP9146600A patent/JPH1055412A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2017770A2 (en) | 2001-12-14 | 2009-01-21 | NEC Corporation | Face meta-data generation and face similarity calculation |
US7593551B2 (en) | 2001-12-14 | 2009-09-22 | Nec Corporation | Face meta-data generation and face similarity calculation |
JP2006209353A (ja) * | 2005-01-26 | 2006-08-10 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
JP2011028459A (ja) * | 2009-07-23 | 2011-02-10 | Canon Inc | 画像処理方法および画像処理装置およびプログラム |
JP2021524686A (ja) * | 2018-05-18 | 2021-09-13 | スーズ,インコーポレイテッド | 埋め込まれた情報カードコンテンツを認識および解釈するための機械学習 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6192010B2 (ja) | 重み設定装置および方法 | |
CN108596154B (zh) | 基于高维特征选择与多级融合的遥感图像分类方法 | |
Su et al. | Order-preserving wasserstein distance for sequence matching | |
JP4292837B2 (ja) | パターン特徴抽出方法及びその装置 | |
Khalifa et al. | Off-line writer identification using an ensemble of grapheme codebook features | |
JP5202148B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
US9025864B2 (en) | Image clustering using a personal clothing model | |
US8744144B2 (en) | Feature point generation system, feature point generation method, and feature point generation program | |
CN106570521B (zh) | 多语言场景字符识别方法及识别系统 | |
US8861873B2 (en) | Image clustering a personal clothing model | |
JP2005535017A (ja) | フィッシャー線形識別関数およびカーネルフィッシャー線形識別関数を用いた拡張Isomap | |
JP5777380B2 (ja) | 画像認識装置、画像認識方法、及びプログラム | |
CN104239856A (zh) | 基于Gabor特征和自适应线性回归的人脸识别方法 | |
KR100305977B1 (ko) | 특징벡터의부분고유공간으로의사영에의한특징선택을이용한패턴인식장치및방법 | |
Sisodia et al. | ISVM for face recognition | |
CN109886281A (zh) | 一种基于四元数超限学习机彩色图像识别方法 | |
CN101877065A (zh) | 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法 | |
JP2004178569A (ja) | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 | |
Roy et al. | HMM-based writer identification in music score documents without staff-line removal | |
JPH1055412A (ja) | 特徴ベクトルの部分固有空間への射影による特徴選択を用いたパターン認識装置及び方法 | |
Deepa et al. | Challenging aspects for facial feature extraction and age estimation | |
JP5030235B2 (ja) | パターン認識装置及びパターン認識方法 | |
Riesen et al. | Reducing the dimensionality of vector space embeddings of graphs | |
JP2009295130A (ja) | 画像解析装置、画像登録装置および画像検索装置 | |
Yankov et al. | Locally constrained support vector clustering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040525 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20071204 |