JPH10240930A - パターン認識方法およびパターン認識装置 - Google Patents
パターン認識方法およびパターン認識装置Info
- Publication number
- JPH10240930A JPH10240930A JP9030202A JP3020297A JPH10240930A JP H10240930 A JPH10240930 A JP H10240930A JP 9030202 A JP9030202 A JP 9030202A JP 3020297 A JP3020297 A JP 3020297A JP H10240930 A JPH10240930 A JP H10240930A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- vector
- class
- feature
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 40
- 239000013598 vector Substances 0.000 claims abstract description 271
- 238000006243 chemical reaction Methods 0.000 claims description 122
- 238000012549 training Methods 0.000 claims description 67
- 238000003909 pattern recognition Methods 0.000 claims description 23
- 238000012567 pattern recognition method Methods 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000006835 compression Effects 0.000 claims description 8
- 238000007906 compression Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 47
- 238000000605 extraction Methods 0.000 description 24
- 238000007781 pre-processing Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 15
- 230000009466 transformation Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000005452 bending Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
特徴ベクトルに関連する第1の照合用ベクトルを第1の
識別手段の識別辞書と照合し第1の相異値を得る。次に
第1の相異値で定まる各クラスのライバルパターンと該
クラスに属する訓練パターンにより変換用ベクトルを決
定する。特徴ベクトルに変換用ベクトルにより変換した
変換特徴ベクトルに関連する第2の照合用ベクトルを第
2の識別手段の識別辞書と照合して第2の相異値を求め
る。ついで、第1、第2の相異値から前記訓練パターン
のクラスを決定する。以上を繰り返し所定のクラスに属
する全訓練パターンのクラスを決定する。全訓練パター
ンの認識率を高くするように第2の識別手段の識別辞書
を最適化する。この学習で得られた変換用ベクトルと識
別辞書によりクラスが未知のパターンのクラスの決定を
おこなう。
Description
ターン認識方法に関し、特に相異なる認識系を組み合わ
せて認識精度を向上させるパターン認識方法に関するも
のである。
理、音声処理等のパターン認識を含む情報処理の需要は
多くかつ急速に増加している。従って、パターン認識技
術の改良が切望されている。パターンを処理しようとす
る場合、パターン自身をそのまま取扱うかわりに、その
パターンの特徴を抽出して、これを処理するほうが速
度、コスト、精度等で有利な場合が多い。非常に情報量
が多いパターンの処理などでは、特徴を抽出して 、そ
の特徴を処理せざるをえない場合もある。特徴によって
パターンを表現して(概念との対応を損なわない)情報
の圧縮をおこなうこともパターン認識のひとつの目的で
ある。
M個)の特徴成分x(p;m)の組:{x(p;m);m=1,2,3,....,
M}で構成され、パターンが全体として持つ特有の性質
を、具体的かつ定量的に表現したものである。従って、
特徴fは特徴成分x(p;m)を第m次の成分としてもつM次
元のベクトルとして表わされるので、特徴fのベクトル
表現を特徴ベクトルX(p)=( x(p;1), x(p;2),.......,
x(p;M))tと表わす事にする。ここで、引数pはパター
ンpの特徴ベクトルであることを、上添え字tはベクト
ルの転置を示す。特徴成分が質的なものであっても数量
化して用いることが可能である。
特徴成分x(p;m)の値がかわり、従って特徴ベクトルX
(p)が変化する。変形したパターンも同一クラスに属す
る限り、そのクラスに属すると認識されなければならな
い。ある特定のパターンをあるクラスに属するパターン
の代表、あるいはクラスの特徴として指定した場合、指
定されたパターンをそのクラスの参照パターン(以下単
に参照パターンと呼称する)、その特徴ベクトルを参照
特徴ベクトルと呼ぶことにする。参照パターンは、クラ
スのなかの特定のパターンとする外にクラス内のパター
ンの平均等の仮想のパターンでもよい。
ターンqに類似している否か、あるいはどの既知クラス
に属するのか識別するのがパターン認識であり、パター
ン認識は、図形や文字、記号、画像、音声等の情報処理
に欠くことができない機能である。パターン認識の一般
的な知識や問題点については文献1(中田和男編:パタ
ーン認識とその応用、コロナ社(1978))や文献2(小
川英光編:パターン認識・理解の新たな展開ー挑戦すべ
き課題ー、電子情報通信学会(1992))から得るこ
とができる。以下に一般性を失うことなく、パターンが
文字パターンである文字認識を例に説明する。
のおそれがないときには単に文字ともいう)において、
その特徴成分は種々のものが考えられている。文字の縦
横比、画数、横線の数、ループの数、パターンを網上に
描いたときの網目の白黒、特定の向きの直線との交点の
数、フーリエ変換等の変換係数等々が特徴成分となり得
る。これら特徴成分の組が文字を最も良く表わすように
特徴ベクトルが構成される。各特徴成分の値域は後述の
識別の精度を改善するように選択される。特徴成分は、
必要に応じてその標準偏差等で標準化される。
る。例えば、文字“A”をクラスAと呼ぶ。クラスの参
照文字パターンはそのクラスに属する文字パターンの平
均文字パターンや特定の文字パターンが選ばれる。参照
文字パターンの特徴ベクトルは参照特徴ベクトルであ
る。文字認識系は最終的に、文字“A”に属する文字パ
ターンとその変形文字パターンが全てクラスAに属し、
かつクラスA以外のクラスには属さないと判定すること
を目的としている。
れた後の文字認識系は、通常、文字パターンの前処理工
程、特徴抽出工程、識別工程という一連の部分処理工程
に分けられる。いずれの部分処理工程も主に計算機上で
実施できるのであり、計算機が処理する一群のプロセス
に対応する。文字パターンの観測を含め全ての部分処理
工程が文字認識系の結果である認識結果に影響を及ぼ
す。そしてクラスAに属すべき文字パターンをクラスA
に属すると正しく認識する確率、即ち認識率を向上する
(精度をあげる)ため、あるいはクラスAに属すべきで
ない文字パターンをクラスAに属すると誤って認識する
確率、即ち誤認識率の低減(一般的には0とすること)
の工夫がほどこされている。特に、クラスAに属さない
文字パターンをクラスAに属すると判定すること(誤認
識)のないことをより強く望む用途が多い。
なパターンが変形等の“歪み”あるいは“修飾”処理工
程を経由したものとも考えられる。修飾処理工程は負の
前処理工程であり文字パターンの認識系全体の性能向上
には考察の対象としなければならない。なお、認識結果
により各処理工程の調整をおこなう等の帰還制御機能を
付加したり、文字認識系には種々の変更を施すことが可
能である。
入力文字パターンの大きさ、傾き、位置や線の密度等の
正規化と、しみやかすれ等の雑音の除去を行う。特徴抽
出工程では、入力文字パターンから文字の形状を表わす
特徴成分の値を決定し、特徴ベクトルを作成する。特徴
成分の個数は数 [百] 十から数千にもおよぶことがあ
り、例えば380や500である。一例として、64×
64の網目のにクラスAに属する一つの[要素である]文
字パターンA書き、文字パターンAの線が網目に入って
いれば1、入っていなければ0を与える。これら網目を
特徴成分とすると、その値1、0を要素とする4096
次元の特徴ベクトルが文字パターンAにあたえられる。
成分、たとえばストロークの端点の数(Aでは2)やル
ープの数(Aでは1)、屈曲点数(Aでは1)、分岐点
数(Aでは2)、交差点数(Aでは0)、それらの位置
などを組み合わせる。そしてなるべく識別を容易にする
ような特徴成分をできるだけ小数選んで次元の低い特徴
ベクトルを構成し、所定の認識率を得るようにしてい
る。特徴ベクトルの次元が高ければ高いほど精度は高く
なる(認識率があがる)傾向があるが、処理時間や所要
記憶装置の容量が増加するからである。
された特徴ベクトルと、文字識別辞書(一般的にはパタ
ーン識別辞書)に前もって格納されている各クラス毎の
参照特徴ベクトルを特定の識別関数に基づいて照合し、
入力文字パターンの属するクラスを決定する。文字識別
辞書は参照特徴ベクトルの集合を含む。識別関数には類
似度関数や距離関数が用いられることが多い。文字パタ
ーンと参照パターンとの距離を文字パターンと(該参照
パターンが代表する)クラスとの距離ともいうことにす
る。
は、文字パターン間の距離を定義し、その距離が測定さ
れる。一般に距離が小さいほど類似しており、参照特徴
ベクトルから一定の距離以内のパターンは同一クラスに
認識される。あるいは、ある文字パターンは最も近い参
照特徴ベクトルの属するクラスに認識される。上述の例
で1、0を要素とする4096次元の特徴ベクトル間に
ハミング距離(互いに相異なる要素の数)を算出する識
別関数を与える。あるクラスの参照特徴ベクトルからハ
ミング距離が100以内にある特徴ベクトルを抽出され
た文字はそのクラスに属するとする。あるいは、入力文
字パターンから抽出された特徴ベクトルと全ての参照特
徴ベクトルとのハミング距離を算出して、最短距離の参
照特徴ベクトルの属するクラスが入力文字の属するクラ
スであると決定する。さらに別の例ではさらに、最短距
離であり、それがある一定値以下であるとともに、二番
目に短い距離との差がある一定値以上のときのみ最短距
離の参照特徴ベクトルが属するクラスが入力文字の属す
るクラスであるとする。
として、ユークリッド距離を与える距離関数、重み付き
ユークリッド距離を与える距離関数、2次識別関数等が
用いられる。そして、これらの関数を用いる識別工程に
おいて、識別関数や文字識別辞書が学習により改良され
認識率を向上できる事が知られている。以下に概略を述
べる川谷のLDA法(Learning by Discriminant Analys
is Method)は識別工程が学習により文字パターンの変形
を吸収する方法である(参考文献3:川谷;”距離関数
の学習による手書き数字認識(Handprinted Numerals R
ecognition byLearning Distance Function)”信学論Vo
L.J76-D-II No.9 pp.1851-1859、)。なお、参考文献3
には文字認識系の従来技術が具体的に説明されているの
で、本明細書の理解の助けとなる。
析を応用したパターン認識方法の一つであるLDA法が
いくつかの異なる識別関数を用いた場合について述べら
れている。以下に参考文献で使用の記号表示とは異なる
記号表示を用いてLDA法の一部を紹介する。
リッド距離を与える距離関数が学習され文字識別辞書に
格納される。即ち距離関数の重みと定数項及び参照ベク
トル(本明細書でいう参照特徴ベクトル)からなるパラ
メータが学習されるのである。既知の入力文字パターン
pが訓練文字パターンとして文字認識系に入力される
と、前処理工程を経て特徴抽出がおこなわれ特徴ベクト
ルX(p)=( x(p;1), x(p;2),..., x(p;m),...., x(p;M)
)tが得られる。この時点までに、各クラスKの参照特徴
ベクトルR(K)=( r(K;1), r(K;2),..., r(K;m), ....,r
(K;M))tがあたえられ、X(p)とR(K)の間の重み付きユー
クリッド距離D(p,K)=D(X(p),R(K))=Σmω(K;m)( x(p;
m)ーr(K;m) )2が算出される。D(p,K)は正確には2乗距
離を与えるものであるが、ここでは単に距離とよぶこと
にする。
までかえて合計する関数である。ω(K;m)は重みであり
重みベクトルW(K)=( ω(K;1), ω(K;2),......, ω(K;
m),...., ω(K;M) )tの要素である。参照特徴ベクトル
R(K)や重みベクトルW(K)など識別に必要な情報を格納
するのが文字識別辞書L({K})である。{K}は照合に供さ
れる全てのクラスKの集合を表わし、{K}に関する文字識
別辞書をL({K})とした。上記の距離関数形は全クラス共
通であるが、そのパラメータはクラス毎に特有の値に定
められる。なお、LDA法による学習後の距離関数は距離
公式を満たす通常の定義による距離関数とは異なるもの
となるが、パターンの相異の度合を与えることができる
関数であることには違いが無い。
し、例えば上記D(p,K)をクラスKを変えて測定し「最も
小さなD(p,K)を与えるクラスK1=K1(p)」をパターンpの
属するクラスと決定する。ところが、場合によりK1(p)
が本来pが属するクラスK(p)と異なり誤認識が生ず
る。また別の場合には、クラスK1,とクラスK1とは異な
るクラスK2に対して距離D(p,K1)とD(p,K2)との差が小
さく、確信をもって何れかをK(p)とする認識結果を出力
することができない。クラスKに着目した場合クラスKに
紛らわしい文字パターンを次のように分類できる。 (1)Kとは異なるクラスのパターンでKに属すると誤認
識されたパターンすなわちKへのエラーパターンpoe; (2)Kとは異なるクラスのパターンでKに属すると誤認
識されそうになったパターンすなわちKへのニアミスパ
ターンpon。 文献3では上記poeとponを総称してクラスKのライバル
パターンporと呼び、ライバルパターンporをクラスKか
ら遠ざけるように距離関数の重みと定数項及び参照ベク
トルからなるパラメータを学習する。この学習を全ての
クラスについておこなってもよいし誤認識を引き起こし
やすいいくつかのクラスについておこなってもよい。
し、着目クラスKのパターンの集合をΩ0(K)(即ちクラ
スKそのもの)として、下式の判別関数F(X(p),R(K))
がΩ0(K)上で負にΩr(K)上で正になるように、係数{a
(m);m=1乃至M}、{b(m);m=1乃至M}、cが決
定される。但し着目クラスKの参照特徴ベクトルR(K)に
はクラスKのパターンの特徴ベクトルの平均ベクトルを
用いる。ここに、 F(X(p),R(K))=Σma(m)( x(p;m)ーr(K;m) )2+Σmb(m)
(x(p;m)ーr(K;m) )+c(K)。F(X(p),R(K))はΩ0(K)に
対して負なので、F(R(K),R(K))=c<0となる。次に元
の距離D(p,K)=D(X(p), R(K))=Σmω(K;m)(x(p;m)ーr
(K;m ))2に判別関数F(X(p),R(K))を加重加算する。そ
の結果、距離D(X(p),R(K))は新しい距離G(X(p),R
(K))となる。 G(X(p),R(K))=G(p,K)=D(X(p),R(K))+γF(X(p),R(K)) =Σm( ω(K;m)+Δω(K;m) ){ x(p;m)ー( r(K;m)+Δr(K;m) ) }2+d(K)。
る認識精度が最大になるように、実験的に決定される。
実験は公開されている文字データベースや独自に収集し
た文字データベースを用いて行う。文字データベースに
含まれる文字パターンの一部を訓練用に、残りを訓練結
果の確認用に用いることが多い。このようにして、定数
項d(K)が付加された形で重みベクトル、参照ベクトルと
定数項がが学習される。新しい重みベクトルと参照特徴
ベクトルとはそれぞれU(K)=( ω(K;1)+Δω(K;
1),......,ω(K;M)+Δω(K;M) )tとT(K)=( r(K;1)+
Δr(K;1),..., r(K;M)+Δr(K;M) )tとになる。定数項d
(K)と重みベクトルU(K)、参照特徴ベクトルT(K)とが
識別辞書に格納される。次に定数項を含むG(X(p),R
(K))により識別した結果新たに生じたライバルパター
ンをライバルパターンの集合に追加して学習を繰り返
す。
種類をもとのままとしているので、識別工程(識別辞書
も含む)の一部の学習に限られている。ところで、これ
までに文字認識精度向上のため複数の認識系を結合する
手法もあった。具体的には、抽出される特徴の内容(特
徴成分の種類や数)が異なる認識系の組み合わせ、識別
関数の異なる認識系の組み合わせなどが試みられてい
る。何れの組み合わせも認識精度を向上するうえで有効
なことが確かめられている。しかし、従来の方法は独立
に作成した認識系を単に組み合わせるのみであり、例え
ば2つの認識系を組み合わせる時、一方の認識系は他方
の認識系で認識できなかった文字を出来るだけ高い精度
で認識できるように構成しておくなどの積極的な措置は
講じられていなかった。そのため、認識精度の向上には
自ずと限界があった。
解決を図り、第1の認識系で信頼度高く認識できなかっ
たパターンを第2の認識系で出来るだけ高い精度で認識
できるように構成し、2つの認識系を結合して認識精度
を向上することを目的とする。さらに、第1の認識系で
正しく認識されたが、2つの認識系を結合した認識系
(統合認識系)では誤認識されるパターンの割合をでき
るだけ低く抑えることをも目的とする。さらに別の目的
は、統合認識系の学習が容易に実施されるようにするこ
とにある。
示するために、以下において、特にことわらない限り、
例えば距離関数の距離値、類似度関数の値、2次識別関
数の値、判別関数の値、その他の識別関数の値、それら
の組み合わせ等の値を相異値とよぶことにする。LDA法
における2乗距離の値等も相異値の一例である。また、
識別工程で識別辞書と照合される特徴ベクトルは必ずし
も入力パターンから抽出されたままではなく、特徴変換
を受けたり、次元の圧縮を受けたりするので、それらを
照合用特徴ベクトルと総称する。そして、訓練パターン
によりパターン認識装置の学習をおこなうため、実際の
パターン認識に用いる装置をそのまま用いる他に、その
シミュレーションをおこない、その装置のモデルにより
学習をし、学習結果を実際のパターン認識に用いる装置
に移すようにしている。本発明の説明では、特に混同し
ない限り、実際のパターン認識に用いる装置と、その装
置のモデルとを区別しない。
れぞれの識別辞書を備えた第1、第2の識別手段を有す
る装置において、下記の工程によりパターン認識装置の
学習をおこなうことを基本にしている。即ち、パターン
認識装置は(イ)所定のクラスの訓練パターンから抽出
した特徴ベクトルに関連する第1の照合用ベクトルを第
1の識別手段の識別辞書と照合し第1の相異値を得る工
程と、(ロ)一つあるいは複数のクラスの第1の相異値
で定まるライバルパターンと該クラスに属する訓練パタ
ーンにより変換用ベクトルを決定する工程と、(ハ)前
記特徴ベクトルの少なくとも一部分に前記変換用ベクト
ルによる特徴変換を施した変換特徴ベクトルを含む前記
特徴ベクトルに関連する第2の照合用ベクトルを第2の
識別手段の識別辞書と照合して第2の相異値を求める工
程と、(ニ)前記第1、第2の相異値から前記訓練パタ
ーンのクラスを決定する工程と、(ホ)所定のクラスに
属する全訓練パターンのクラスを決定するため、前記
(イ)乃至(ニ)の工程を繰り返す工程と、(ヘ)前記
訓練パターンの属するクラスと前記決定されたクラスと
からの前記訓練パターン集合の認識率求める工程と、
(ト)前記認識率を高くするため第2の識別手段の識別
辞書を変更して前記(ハ)乃至(へ)の工程を含む工程
により学習をおこなうものである。
合用ベクトルが前記訓練パターンから抽出した特徴ベク
トルの特徴成分のすべてを含むベクトルで、前記第2の
照合用ベクトルが前記訓練パターンから抽出した特徴ベ
クトルの特徴成分のすべてを含むベクトルを特徴変換し
た変換特徴ベクトルを含むようにもできる。また、 前
記第1の照合用ベクトルが前記訓練パターンから抽出し
た特徴ベクトルの特徴成分の第1の組からなるベクトル
で、前記第2の照合用ベクトルが前記訓練パターンから
抽出した特徴ベクトルの特徴成分の前記第1の組とは異
なる第2の組からなるベクトルを特徴変換した変換特徴
ベクトルを含むようにもできる。そして、必要に応じ、
計算機の資源節約のため前記第1の照合用ベクトルが前
記訓練パターンから抽出した特徴ベクトルの特徴成分の
第1の組からなるベクトルに次元圧縮を施したベクトル
とすることができる。そして、実際のクラスが未知の入
力パターンの認識をおこなうばあいは、前記所定のクラ
スの訓練パターンに変えて該入力パターンが前記
(イ)、(ハ)、(ニ)の工程を順次通過するようにす
ればよい。
われるのが普通であるから、計算機に上記(イ)乃至
(ト)の工程を指令すべく構成された記憶装置も本発明
のひとつの実施態様である。本発明のパターン認識を実
施できるシステムの一例では、学習センターと通信可能
な端末装置とからなる認識システムがある。端末装置は
識別辞書と変換用ベクトルとを格納し、該識別辞書と該
変換用ベクトルとにより入力パターンのクラスの決定を
おこなう機能を有している。該端末装置で生じたライバ
ルパターンの通知に応じて前記学習センターが前記識別
辞書を更新しと該端末が前記変換用ベクトルの更新する
ようにしたパターン認識システム。 そして、訓練パタ
ーンの変化や誤認識割合の増加に応じて容易に再学習
し、認識率の変動から自動的に学習できる機能を有する
計算機上に構築された統合認識システムが与えられる。
段結合した構成とすることもできる。 そのような装置
は、それぞれの入力と出力と識別辞書とを有する複数の
識別単位とクラス決定手段とを含む。そして、少なくと
もひとつの識別単位が入力パターンを受け取り、少なく
ともひとつの前記識別単位は自身とは別の前記識別単位
の出力を入力しさらに別の識別単位に自身の出力を送
る。そして、少なくともひとつの前記識別単位は入力パ
ターンの特徴ベクトルに関連するベクトルを入力して変
換用ベクトルで特徴変換し、少なくともひとつの識別単
位がクラス決定手段にその出力を送出する。クラス決定
手段は入力パターンの決定をおこない、前記変換用ベク
トルは該変換用ベクトルの入力側に接続された識別単位
で決定されるライバルパターンに基づいて決定される。
したがって、各識別単位はそのまえの識別単位が識別し
にくいパターンについて識別しやすいように動作させら
れるので、識別精度をさらに改善できる。
文字パターンの処理工程図である。図中、11は文字パタ
ーンの入力処理工程をおこなう文字入力手段11、12は前
処理工程をおこなう前処理手段12、13は特徴抽出工程を
実行する特徴抽出手段13、14は第1の識別工程を実行す
る第1識別手段14、15は確からしさ検出をおこなう確か
らしさ検出手段15、16は特徴変換をおこなうための特徴
変換手段16、17は第2の識別工程を実行する第2識別手
段17、18は入力文字パターンのクラス決定の処理工程を
実行するクラス決定手段18である。以下、各手段の工程
の詳細を処理の進行の一例に沿って説明する。
力されると、前処理手段12でパターンの大きさ、位置な
どが正規化され、特徴抽出手段13で識別に用いる特徴が
抽出されて特徴ベクトルX(p)が決定される。
ベクトルである求められた特徴ベクトルと識別辞書141
との照合をおこなう。すなわち、別途作成された識別辞
書141に格納されている各クラスKmの参照特徴ベクトル
R(Km)、重みベクトルW(Km)をもとに入力パターンの特
徴ベクトルと参照特徴ベクトルとの相異値(即ち入力文
字パターンとクラスとの相異値)がクラス毎に求められ
る。
スと入力文字パターンとの相異値をもとに認識結果の確
からしさの検出をおこなう。確からしさの尺度として
は、各クラスに対する入力文字パターンの相異値の中で
最も小さな値と次に小さな値との差を用いることができ
る。所定の値より大きな(あるいは小さくない)差を有
する文字パターンは確からしさが高いと判定される。そ
して全ての相異値のうち最も小さな相異値を与えるクラ
スが入力パターンの属するクラスとの認識結果がクラス
決定手段18により与えられる。一方、所定の値より小さ
な差を有する文字パターンは確からしさが低いと判定さ
れる。そして、特徴変換手段16、第2識別手段17による
処理は確からしさ検出手段15により認識結果の確からし
さが低いと判定された場合にのみ実行される。
持しておいた特徴ベクトルを変換するための特徴変換用
ベクトルΦ(K)(以下変換用ベクトルと呼称する)を用
いて(確からしさが低い)-----入力文字パターンpの特
徴ベクトルX(p)の変換即ち特徴変換を行う。変換用ベク
トルΦ(K)の決定については後述する。特徴ベクトルX
(p)はクラスKの変換用ベクトルΦ(K)で変換されて変換
特徴ベクトルY(p;K)が得られる。変換特徴ベクトルY(p;
K)の第m次特徴成分y(p;K;m)は次式で与えられる。 y(p;K;m)=X(p)φ(K;m) ここで、φ(K;m)はクラスKのm次の変換用ベクトルであ
る。
用ベクトルである変換特徴ベクトルを例えばLDA法によ
り学習された変換特徴用識別辞書L({K})171と照合して
識別処理をおこなう。変換特徴ベクトルY(p;K)による識
別のための各クラスの変換特徴参照ベクトルR(Φ(K))、
変換特徴重みベクトルT(Φ(K))、必要に応じて定数項d
(Φ(K))は変換特徴用識別辞書L({K};Φ(K))171に格納さ
れている。ここでL({K};Φ(K))はクラスKの集合{K}に関
する辞書で変換用ベクトルΦ(K)で変換された特徴ベク
トルの照合用辞書である。変換特徴用識別辞書L({K};Φ
(K))171をもとに入力パターンの変換特徴ベクトルY(p;
K)と参照変換特徴ベクトルR(Φ(K))との間の相異値がク
ラス毎に求められる。 換特徴用識別辞書L({K};Φ(K))
の構成については後述する。
段15により確からしさが低いと判定された入力パターン
毎に、各クラスに対して第1識別手段14で求められた相
異値に、第2識別手段17で求めた値を一定倍して加え合
わせて得られた値をもとに入力パターンのクラスの決定
を行う。その倍率は、別途全クラスにわたる認識精度が
高くなるように実験的に選ばれる。実験は公開された文
字データベースを用いて、収録された文字パターンのデ
ータの一部を訓練パターンのデータ(訓練データ)とし
て用い、残りをテストパターンのデータ(テストデー
タ)として用い全体としての認識精度が高くなるように
倍率を選ぶようにすればよい。例えば、全体の4/5を
訓練データに、残りをテストデータにしてもよい。公開
の文字データベースを用いるほかに独自に収集した文字
データベースを用いて、特定の領域の文字の認識をより
高精度にすることもできる。また、えられる文字をすべ
て訓練データとすることもできる。多くの場合、えられ
る文字をすべて訓練データとする。しかし一部を訓練デ
ータとして用い、残りをテストデータとして用いるとき
は、認識性能の安定性あるいは堅固性も評価できよう。
そのため訓練データとする文字を変えて実験することも
効果的である。
の文字パターンの処理工程図である。文字入力手段21は
文字入力手段11と同様に文字パターンの入力処理工程を
実行する。前処理手段22は文字入力手段21からの文字パ
ターンに前処理手段12がすると同様な前処理を施し特徴
抽出手段23と第2の特徴抽出手段26に出力する。特徴抽
出手段23は特徴抽出手段13ですると同様に前処理された
文字パターンから特徴抽出をおこなう。第1識別手段24
は,識別辞書141と同様な識別辞書241と抽出された特徴
とを照合して第1識別手段14がすると同様に抽出された
特徴の識別をおこなう。その識別結果の確からしさは、
確からしさ検出手段15がすると同様にして確からしさ検
出手段25によって検出される。特徴抽出手段26は、特徴
抽出手段13、23ですると同様に、しかし特徴抽出手段23
がおこなう特徴抽出とは異なる内容(特徴成分)の特徴
抽出を確からしさの低いパターンにたいしておこなう。
抽出された特徴にたいして特徴変換手段16がおこなうと
同様に変換用ベクトルΦ(K)による特徴変換をおこな
う。第2識別手段28は特徴変換手段27で変換された特徴
にたいして、変換特徴識別辞書281に基づき第2識別手
段17がおこなうと同様の識別工程を実行する。クラス決
定手段29はクラス決定手段18がすると同様に各クラスに
対して第1識別手段24で求められた相異値に、第2識別
手段28で求めた値を一定倍して加え合わせて得られた値
をもとに入力パターンのクラスの決定を行う。この倍率
も、全クラスにわたる認識精度が高くなるように、前述
のように実験的に選択される。
本質的な違いは、第2の実施例では特徴変換手段27での
特徴変換を特徴抽出手段23で求められた特徴にではな
く、特徴抽出手段26で求められた別の特徴に対して行う
点にある。このように、異なる特徴を用いるため第2識
別手段28での識別が容易になる可能性が生じる。前述の
ように実験により第2の実施例あるいは第1の実施例を
選択することもできる。ここで、特徴抽出手段23で抽出
され求められた特徴ベクトルを第1部分特徴ベクトル、
特徴抽出手段26で求められた別の特徴ベクトルを第2部
分特徴ベクトルと呼ぶことにする。第1部分特徴ベクト
ルと第2部分特徴ベクトルとは、上述のように好もしく
は共通成分を持たないが、認識精度の改善が明らかな場
合には、必要に応じて共通成分を持つようにもできる。
上記の第1、第2の実施例では第1識別手段14,、24が
文献3のLDA法に例示の識別関数により記載されている
が、その他の識別関数を用いてもよいことは前述したと
おりである。
記第1の実施例において、特徴変換手段16がおこなう特
徴変換で用いる変換用ベクトルΦ(K)を別の変換用ベク
トルΦ({K}')とし、第2識別手段17で用いる変換特徴用
識別辞書L({K};Φ(K))171を変換特徴用識別辞書L({K};
Φ({K}'))としたものである。Φ({K}')は変換用ベクト
ルがクラスの集合{K}'のライバルパターンに基づいて決
定されたことを示している。そして、L({K};Φ({K}'))
は、クラスKの集合{K}に関する辞書で変換用ベクトルΦ
({K}')で変換された特徴ベクトルの照合用辞書であるこ
とを示す。{K}'はクラス集合でただひとつのクラスのみ
を有する場合は、{K}'をKとおく。
は、前記第2の実施例において、特徴変換手段27がおこ
なう特徴変換で用いる変換用ベクトルΦ(K)を別の変換
用ベクトルΦ({K}')とし、第2識別手段28で用いる変換
特徴用識別辞書L({K};Φ(K))281を変換特徴用識別辞書L
({K};Φ({K}'))としたものである。変換用ベクトルΦ
({K}')と変換特徴用識別辞書L({K};Φ({K}'))の構成
については後述する。{K}や{K}'はクラス集合でただひ
とつのクラスのみを有する場合は、{K}',{K}をKとおく
ことにより前述の説明が適用される。{K}'は最大で全て
の対象クラスを含むことができる。変換用ベクトルΦ
({K}')による変換を{K}'に属するクラスに対する識別に
のみ用いるか、{K}'に属さないクラスに対する識別にも
用いるかを選択することができる。前者は識別の精度が
高めやすいが速度や記憶容量の要求の点で後者に劣る傾
向がある。
記第3の実施例において、第1識別手段14、と確からし
さ検出手段15とを短絡除去したものである。特徴抽出手
段13で抽出された特徴ベクトルX(p)がそのまま特徴変換
手段16に入力される。
記第4の実施例において、確からしさ検出手段25が全て
の入力パターンを確からしさが低いと判断するように設
定されたものである。本実施例ではすべての入力パター
ンの特徴ベクトルが変換され第2識別手段28で変換特徴
用識別辞書L({K};Φ(K))281と照合される。
記第6の実施例において、入力特徴ベクトルの第1部分
特徴ベクトルと第2部分特徴ベクトルとをそれぞれ抽出
しておき、それらを結合した特徴ベクトルを用いるもの
である。第7の実施例を図5を参照して説明する。文字
入力手段51は文字入力手段11と同様に文字パターンの入
力処理工程を実行する。前処理手段52は文字入力手段51
からの文字パターンに前処理手段12がすると同様な前処
理を施し特徴抽出手段53に出力する。特徴抽出手段53は
特徴抽出手段13ですると同様に、前処理された文字パタ
ーンから特徴抽出をおこない、第1部分特徴ベクトルX1
(p)を次元圧縮手段541へ第2部分特徴ベクトルX2(p)を
特徴変換手段542へ送出する。
1(p)を周知のカルフーネン・レーヴ展開等を用いて次元
圧縮し圧縮特徴ベクトルZ1(p)を出力する。次元圧縮を
おこなわない場合にも適用できるので、Z1(p)=X1(p)な
る値をとる場合もZ1(p)に許容することにする。圧縮を
おこなう場合、圧縮特徴ベクトルZ1(p)の第m次成分z
1(p;m)は次式で与えられる。 z1(p;m)=X1(p)ψ($;m) ここで、ψ($;m)はm次の次元圧縮用ベクトルであり、本
実施例の学習に用いる訓練パターン全体の共分散行列の
固有ベクトルを用いることができる。その他の次元圧縮
も可能であるが、周知のため説明は省略する。なお、ψ
($;m)中の"$"記号は訓練パターン全体を用いることを示
す。
なうと同様に変換用ベクトルΦ( Z1;{K})により第2
部分特徴ベクトルX2(p)の特徴変換をおこなう。Φ(
Z1;{K}')は Z1(p)を識別してクラス集合{K}'のライバ
ルパターンに基づき決定された変換用ベクトルであるこ
とを示す。. 特徴ベクトルX2(p)は変換用ベクトルΦ(
Z1;{K}')で変換されて変換特徴ベクトル Y1( p;Z1;
{K}')得られる。変換特徴ベクトルY1( Z1;{K}')の第
m次特徴成分y1( p;Z1;{K}';m)は次式で与えられる。 y1( p;Z1;{K}';m)= X2(p)φ( Z1;{K}';m) ここで、φ( Z1;{K}';m)はΦ( Z1;{K}')のm次の変換
用ベクトルである。
1(p)と変換特徴ベクトルY1( Z1;{K}')の全ての成分、
あるいはそれらベクトル各々から所定の成分のみを取り
出して、取り出した成分を成分とする結合特徴ベクトル
C( Z1;Y1)を生成して識別手段56に入力する。識別
手段56は結合特徴用識別辞書561と照合用ベクトルで
ある結合特徴ベクトルC( Z1;Y1)を照合し第2識別手
段17がおこなうと同様の識別工程を実行する。クラス決
定手段57は識別手段56の識別結果に基づき入力パター
ンのクラスを決定する。本実施例では、識別辞書(結合
特徴用識別辞書561)のサイズと識別処理時間の増加を
抑えつつ認識精度を改善できる。結合特徴用識別辞書L
({C})は訓練パターンの結合特徴ベクトルC( Z1;Y1)か
らLDA法等で構成することができる。実施例7におい
て、第1部分特徴ベクトルと第2部分特徴ベクトルとは
同一のものであってもよい。
ルΦ(K)の決定の手順を示す工程図である。まず、ステ
ップ31で訓練(文字)パターンを用意する。ステップ32
で訓練パターンは文字入力手段11、前処理手段12、特徴
抽出手段13、第1識別手段14、検出手段15がおこなうと
同等の処理工程を経験する。あるいは、訓練パターンは
文字入力手段21、前処理手段22、特徴抽出手段23、第1
識別手段24、検出手段25がおこなうと同等の処理工程を
経験する。その結果入力訓練パターンqの各クラスKと
の相異値が決定され、クラスの決定が行われる。
パターンの編集を行う。ライバルパターンは、クラス毎
に求められ、2種類のパターンからなる。以下クラスK
に着目して述べる。第1の種類のパターンは、クラスK
とは異なるクラスのパターンでクラスKに属すると誤認
識されたパターンすなわちKへのエラーパターンpe(K)と
である。第2の種類のパターンは、Kとは異なるクラス
のパターンでKに属すると誤認識されそうになったパタ
ーンすなわちKへのニアミスパターンpn(K)である。
と決定された訓練パターンで、その属するクラスがクラ
スKと異なる訓練パターンとして同定される。ニアミス
パターンpn(K)を次のようにして選択する。K以外のクラ
スに属する訓練パターンについて、着目クラスKとの相
異値とそのパターンが帰属するクラスとの相異値との差
をもとめる。次にその差が所定値より小さく、かつ好も
しくはより小さい訓練パターンから一定個を選択する。
ライバルパターン全体はライバルパターン集合Λ(K)を
構成する。ライバルパターン集合Λ(K)をエラーパター
ンpe(K)のみで構成し、ニアミスパターンpn(K)を含まな
いようしてもよい。経験的には、ニアミスパターンp
n(K)を含めた方がよいことがわかっている。特にエラー
パターンpe(K)が少ない場合にその効果が大きい。
スK毎に、平均特徴ベクトルRm(K)と各ライバルパター
ンの特徴ベクトルの差分特徴ベクトルを求める。ついで
差分特徴ベクトルの自己相関行列を求める。まず、着目
クラスKのn番目のライバルパターンpr,nの特徴ベクトル
をX(K;r;n)とし、差分特徴ベクトルをΞ(K;r;n)とする
と、Ξ(K;r;n)=X(K;r;n)ーRm(K)となり、差分特徴ベク
トルΞ(K;r;n)の自己相関行列Q(K;r)は次式で表わされ
る。 Q(K;r)=Σn Ξ(K;r;n)Ξ(K;r;n)t/N(K;r) ここでN(K;r)はライバルパターンの総数である。tは差
分特徴ベクトルの転置を指示する。
(K;m)を求め変換用ベクトルとする。変換用ベクトルの
数は最大で特徴ベクトルの次元数Mである。m次の特徴変
換用ベクトルはm番目に大きい固有値に対する固有ベク
トルである。差分特徴ベクトルは各ライバルパターンと
着目クラスとの違いを表わし、Q(K;r)の固有ベクトルは
着目クラスとライバルパターンとの違いを直交展開した
ものと見なせる。従って、Q(K;r)の固有ベクトルには着
目クラスとライバルパターンとの違いの主たる成分が的
確に反映されている。このようなQ(K;r)の固有ベクトル
への入力特徴ベクトルの射影は着目クラスのパターン集
合とライバルパターン集合とを分離するうえで非常に有
効であることがわかった。
着目クラスに属する訓練パターンの共分散行列S(K)を求
め、ステップ35において行列S(K)-1Q(K;r)の固有ベクト
ルを求め、変換用ベクトルとしてもよい。Q(K;r)の固有
ベクトルは各ライバルパターンの差分特徴ベクトルを射
影した時の自乗平均が最も大きくなる軸を表わす。これ
に対し、行列S(K)-1Q(K;r)の固有ベクトルは各ライバル
パターンの差分特徴ベクトルを射影した時の自乗平均が
大きく、かつ着目クラスのパターン集合を射影した時の
広がりが相対的に小さくなる(射影したときの値の[自
乗平均]----分散-----が相対的に小さい)軸を表わして
おり、これも着目クラスとライバルパターン集合とを分
離するうえで非常に有効と考えられる。変換用ベクトル
としては最も大きい固有値に対応する固有ベクトルから
選択し、次第に小さい固有値に対応する固有ベクトルを
選び、全体で一定個数を選択する。この個数は、大きい
方の固有値から固有値の和をもとめ、その和の固有値の
総和に対する比がある値、例えば0.9を超えるまでの固
有値の個数とする。あるいはこの個数を実験的に決定す
ることもできる。
を求め、それを特徴変換用の変換用ベクトルとしたが、
いくつかのクラスからなるクラス集合{K}'の各クラスの
ライバルパターンの集合に基づいた変換用ベクトルを用
い、より多くのクラスを考慮した特徴変換がおこなえ
る。{K}'はエラーパターンの多い順とライバルパターン
の多い順で前者を優先して選んだ上位のクラスを所望の
数だけあつめて構成する。全クラスを集めて{K}'を構成
してもよい。クラス集合{K}'に属するクラスKに対するQ
(K;r)=Σn Ξ(K;r;n)Ξ(K;r;n)t/N(K;r)からクラス集合
{K}'に対する差分ベクトルの自己相関行列Q({K}';r)を
次式により計算する。 Q({K}';r)=(Σ{K}Σn Ξ(K;r;n)Ξ(K;r;n)t)/Σ{K}N(K;r) =Σ{K} N(K;r)Q(K;r)/Σ{K}N(K;r) 但し、Σ{K}はそれ以下の項をクラス集合{K}'の成分ク
ラス全体にわたって加えることを指示する。
用ベクトルφ({K}';m)が与えられる。同様に、クラス集
合{K}の平均共分散行列S({K})を求めS({K})-1 Q({K}';
r)の固有ベクトルで変換用ベクトルφ({K}';m)を置き換
えれば、上述の固有ベクトルφ(K;m)におけると同様の
効果をうることができる。前記第7の実施例では、第1
部分特徴ベクトルを次元圧縮したが、変換用ベクトルΦ
( Z1;{K})を求めるには、まず圧縮特徴ベクトルZ1(p)
(圧縮されていない場合はX1(p))を最適化された識別
辞書を有する学習用識別手段により識別する。識別結果
から、ライバルパターンの編集をおこない、前記変換用
ベクトルφ({K}';m)の場合と同様にして変換用ベクトル
Φ( Z1;{K}')を求める。
構成する手順を示す図である。変換特徴用識別辞書L
({K};Φ({K}'))を構成するには、Φ(K)をΦ({K}')で置
き換えて同様のステップを踏めばよい。ステップ41〜43
は図3のステップ31〜33と全く同様である。従って、ラ
イバルパターン集合Λ(K)として、図1の14、図2の24で
の識別で誤認識した、または誤認識しそうになったパタ
ーンが得られる。ステップ44ではクラス毎に、着目する
クラスのパターン集合とライバルパターン集合との間で
着目クラス用に求められた変換特徴を変数として用いて
判別分析を行う。これによりライバルパターン集合と着
目するクラスのパターン集合を最適に分離する関数を見
い出すことができる。この手順には文献3に開示されて
いる方法を適用することができる。
クラス毎の相異値にステップ44で求められるクラス毎の
判別関数の値を一定倍して加えた値により、全訓練パタ
ーンのクラスを決定する。ステップ46でライバルパター
ン集合に含まれてない新しいエラーパターンが発生して
いるか否かをチェックし、なければステップ48に移行す
る。また、新エラーパターンが発生していれば、ステッ
プ47でライバルパターン集合に追加し、ステップ44から
処理を繰り返す。ステップ48では判別関数をもとに識別
辞書を作成する。
ベクトルRm(Φ(K))の第m次成分をrm(Φ(K);m)としてク
ラスKに対する判別関数F(Y(K;p), Rm(Φ(K)))が次のよ
うに与えられる。 F(Y(K;p), Rm(Φ(K)))=Σma(m)( y(p;m)ーrm(Φ(K);m) )2+Σmb(m)(y(p;m)ーrm ( Φ(K));m) )+c(Φ(K))=Σma(m)( y(p;m)ー(rm(Φ(K));m)ーb(m)/(2a(m)))) 2 ーΣmb(m)2/(4a(m))+c(Φ(K))。 そして、変換特徴用識別辞書には、クラスK用識別辞書
として、a(m)をm次成分とする重みベクトル、rm(Φ
(K);m)ーb(m)/(2a(m))をm次成分とする参照特徴ベク
トル、およびーΣmb(m)2/(4a(m))+c(Φ(K))c(Φ
(K))の値を持つ定数項が格納される。この手順により、
42で用いられる識別関数と組み合わせた時の認識精度
(正読率)が最高となるような判別関数を求めることが
できる。前記実施例7で用いる識別辞書561は、まづ結
合特徴ベクトルC( Z1;Y1)にLDA法を用いて作成でき
る。
により始めのうちは認識精度(正読率)が増加するが、
次第に学習の効果が小さくなり、かえって、学習により
認識精度が低下することを見出した。この事を利用し
て、次のいずれかのときに学習を自動的に打ち切ること
ができる。 (1)認識精度が所定値に達したとき、学習を停止す
る。 (2)認識精度の向上が学習により上昇しなかったと
き、学習を停止する。 上記(2)の方法を採用する場合は、学習前の識別辞書
の内容や特徴変換用ベクトルを記憶装置に格納してお
き、それらを使用する。そして本発明のパターン認識装
置では、打ち切りを知らせるための表示を行い、到達認
識率や学習での(辞書更新の)繰り返し数等をも表示す
ることができる。
おこなうことができる。訓練パターンやテストパターン
としてはそのクラスと文字パターンがえられ、エラーパ
ターンやニアミスパターンが摘出される。この時エラー
パターンは前述のように自動的に決定される。ニアミス
パターンについては最大個数を与えておけば自動的に決
定される。エラーパターンの個数が与えられた個数より
少ない場合のみ該与えられた個数に達するまでの個数の
ニアミスパターンを選定することも効果がある。上記の
ように、計算機上に構築された統合認識システムに訓練
パターンを(必要な場合はテストパターンも)与えて、
自動的に学習が行われる。従って、本発明を実施する統
合認識システムは、実施が容易であり、その用途に応じ
て用意された訓練パターンにより、容易にその種用途に
適合できる。
である。学習センター61は内臓のあるいは外部に接続さ
れた資源の支援の元に、制御/訓練ソフトウェアを走ら
せて訓練パターン611から複数の変換用ベクトル613
や識別辞書612を作製する。学習センター61において作
製され、記憶媒体に格納され、記憶媒体が実際にパター
ン認識をおこなうOCR(光学文字認識装置)等の端末
装置62に送られる。あるいは直接通信回線63により
変換用ベクトルや識別辞書がひとつあるいは複数の端末
装置62に送信される。直接通信回線63を用いる場合
は、端末装置からエラーパターンの提供を受けて変換用
ベクトルや識別辞書の更新を効率的におこなうこともで
きる。学習センター61は図示しない表示装置に認識率等
の表示なメッセージの表示をおこない、また図示しない
入力装置からコマンドやデータの入力をおこなう。
れた資源の支援の元に、制御/認識ソフトウェア624を
走らせてパターン入力手段621から入力したパターン
を変換用ベクトル623で変換したり、識別辞書622と照合
したりしてクラスの決定をおこなう。これら変換用ベク
トル613や識別辞書612の作製には計算機資源の多くを要
するので上述の構成をとるのであるが、計算機の性能・
価格と変換用ベクトル613や識別辞書612のサイズ等の兼
ね合いで選択の自由度があり、いずれか一方の装置で訓
練と認識の全てをおこなうようにすることもできる。
に、上述した実施例のひとつの拡張例である第8の実施
例を図7を参照して説明する。図7において、文字入力
・前処理・特徴抽出手段71は図1に示す入力手段1
1、前処理手段12と特徴抽出手段13の機能を併せ持
ち、入力パターンから特徴を抽出する。第1識別手段7
2とその識別辞書721とは第1識別手段14とその識
別辞書141と同様の機能を発揮する。確からしさ検出
手段73は確からしさ検出手段15と同様に第1識別手
段14の出力結果である相異値に基づき、確からしさが
高い場合はクラス決定手段80にクラス名を出力する。
確からしさが低い場合は、その特徴ベクトルは特徴変換
手段74により特徴変換され、その結果の変換特徴ベク
トルが第2識別手段75に入力されて各クラスとの相異
値が求められる。特徴変換手段74と第2識別手段75
とは、動作上、特徴変換手段16と第2識別手段17と
にそれぞれ等価である。第2識別手段75は識別辞書1
41と等価な識別辞書751と変換特徴ベクトルを照合
してクラス毎の相異値を求める。
手段15と同様に第2識別手段75の出力結果である相
異値に基づき、確からしさが高い場合はクラス決定手段
80にクラス名を出力する。確からしさが低い場合は、
図2の特徴抽出手段26と等価な特徴抽出手段77に結
果を通知する。特徴抽出手段77は前記文字入力・前処
理・特徴抽出手段71が抽出した特徴とは異なる特徴を
入力パターンから抽出し、特徴変換手段78により特徴
変換した後第2の変換特徴ベクトルとして第3識別手段
79に入力する。特徴変換手段78と第3識別手段79
とはそれぞれ特徴変換手段27と第2識別手段28と同
様の工程を第2の変換特徴ベクトルに経験させる。第3
識別手段79は識別辞書281と等価な識別辞書791
と第2の変換特徴ベクトルを照合してクラス毎の相異値
を求めクラス決定手段80に送る。クラス決定手段80
は第1、第2、第3識別手段から出力される相異値と確
からしさ検出手段73、76からのクラス名通知のいず
れか一つあるいは複数に基づき、入力パターンのクラス
を決定する。
識別辞書の作成は、実施例1乃至7に関連して説明され
た方法を用いることができる。例えば、特徴変換手段7
4、78で用いる変換用ベクトルを第1識別手段72の
出力に基づくライバルパターンから決定してもよい。識
別辞書721、751、791はそれぞれが所属する第
1、第2、第3識別手段72、75、79出力段階まで
の(好もしくは)全訓練パターンに対する認識率が最大
になるように決定するのがよい。変換用ベクトルの決定
は、識別辞書の決定に比べより多様である。特徴変換手
段78で用いる変換用ベクトルを第2識別手段の出力に
基づくライバルパターンから決定してもよい。
文字入力・前処理・特徴抽出手段71や特徴変換手段7
4により出力される特徴ベクトルや変換特徴ベクトルを
第3識別手段に入力する様にしてもよい。図7には3段
の特徴抽出手段(あるいは特徴変換手段)と識別手段の
対(以下識別単位と称する)が従属接続されているが、
さらに入力パターンを受け取る上流側にもクラス決定手
段に近い下流側にも識別単位の段数を増加せしめること
が可能である。またある単位の結果に基づいて複数の単
位に入力パターンから導かれたパターンが入力されるよ
うにもできる。
力パターンそのものや入力パターンの特徴ベクトルから
線形変換により導かれたにベクトルが入力され、識別結
果(相異値やクラス名の指示)が出力されるようにし、
最終的にクラス決定手段が識別単位の出力からクラスの
決定をおこなえるようにしている。そのため、識別単位
の変換用ベクトルは、その上流の識別単位の識別結果か
ら得られるライバルパターンに基づいて決定し。その識
別辞書は該識別単位までの訓練パターンの認識率が最大
になるように(あるいは十分大きくなるように)決定し
ている。
つの認識系を結合するときに、各クラスに対しそのクラ
スのパターン集合と一方の認識系でそのクラスに誤認識
されたパターン集合とを有効に分離するベクトルを見い
出し、他方の認識系は特徴ベクトルをそのベクトルに射
影した値を特徴として用いると同時に、一方の認識系で
誤認識されたパターンをできるだけ正しく認識できるよ
うに識別辞書を構成するので、2つの認識系を組み合わ
せた時の認識率を著しく向上させることができる。そし
て、パターンの種類に応じて用意された訓練パターンに
より、容易に、かつ自動的にその種類に適合できる。
る。
る。
ある。
る。
る。
Claims (12)
- 【請求項1】それぞれの識別辞書を備えた第1、第2の
識別手段を有する装置において、 (イ)所定のクラスの訓練パターンから抽出した特徴ベ
クトルに関連する第1の照合用ベクトルを第1の識別手
段の識別辞書と照合し第1の相異値を得る工程と、 (ロ)一つあるいは複数のクラスの第1の相異値で定ま
るライバルパターンと該クラスに属する訓練パターンに
より変換用ベクトルを決定する工程と、 (ハ)前記特徴ベクトルの少なくとも一部分に前記変換
用ベクトルによる特徴変換を施した変換特徴ベクトルを
含む前記特徴ベクトルに関連する第2の照合用ベクトル
を第2の識別手段の識別辞書と照合して第2の相異値を
求める工程と、 (ニ)前記第1、第2の相異値から前記訓練パターンの
クラスを決定する工程と、 (ホ)所定のクラスに属する全訓練パターンのクラスを
決定するため、前記(イ)乃至(ニ)の工程を繰り返す
工程と、 (ヘ)前記訓練パターンの属するクラスと前記決定され
たクラスとからの前記訓練パターン集合の認識率求める
工程と、 (ト)前記認識率を高くするため第2の識別手段の識別
辞書を変更して前記(ハ)乃至(へ)の工程を繰り返す
工程とを有するパターン認識方法。 - 【請求項2】前記(ロ)の工程において各クラスの変換
用ベクトルは該クラスのライバルパターンに基づいて決
定されることを特徴とする請求項1に記載のパターン認
識方法。 - 【請求項3】前記第1の照合用ベクトルが前記訓練パタ
ーンから抽出した特徴ベクトルの特徴成分のすべてを含
むベクトルで、前記第2の照合用ベクトルが前記訓練パ
ターンから抽出した特徴ベクトルの特徴成分のすべてを
含むベクトルを特徴変換した変換特徴ベクトルを含むこ
とを特徴とする請求項1または請求項2に記載のパター
ン認識方法。 - 【請求項4】前記第1の照合用ベクトルが前記訓練パタ
ーンから抽出した特徴ベクトルの特徴成分の第1の組か
らなるベクトルで、前記第2の照合用ベクトルが前記訓
練パターンから抽出した特徴ベクトルの特徴成分の前記
第1の組とは異なる第2の組からなるベクトルを特徴変
換した変換特徴ベクトルを含むことを特徴とする請求項
1または請求項2に記載のパターン認識方法。 - 【請求項5】前記第1の照合用ベクトルが前記訓練パタ
ーンから抽出した特徴ベクトルの特徴成分の第1の組か
らなるベクトルに次元圧縮を施したベクトルであること
を特徴とする請求項4に記載のパターン認識方法。 - 【請求項6】(チ)前記所定のクラスの訓練パターンに
変えて入力パターンが前記(イ)、(ハ)、(ニ)の工
程を順次通過する工程を追加してなる請求項1乃至請求
項5に記載のパターン認識方法 - 【請求項7】前記変換用ベクトルは前記ライバルパター
ンとそれに対応するクラスで定まる該ライバルパターン
の差分特徴ベクトルの自己相関行列の固有ベクトルであ
ることを特徴とする請求項1乃至請求項6に記載のパタ
ーン認識方法。 - 【請求項8】前記変換用ベクトルはさらに前記ライバル
パターンが対応するクラスに属する訓練パターンの特徴
ベクトルの共分散行列にも応じたベクトルであることを
特徴とする請求項6に記載のパターン認識方法。 - 【請求項9】前記(ト)の工程においてはじめて認識率
が大きくならない場合に前記繰り返しを終了することを
特徴とする請求項1乃至請求項9に記載のパターン認識
方法。 - 【請求項10】それぞれの識別辞書を備えた第1、第2
の識別手段を有する計算機を備えた装置において該計算
機に下記の(イ)乃至(ト)の工程により変換用ベクト
ルと第2の識別手段の識別辞書の決定をおこなうように
指令すべく構成された該計算機に読み取り可能な記憶装
置。 (イ)所定のクラスの訓練パターンから抽出した特徴ベ
クトルに関連する第1の照合用ベクトルを第1の識別手
段の識別辞書と照合し第1の相異値を得る工程と、 (ロ)第1の相異値で定まる所定のクラスのライバルパ
ターンと該クラスに属する訓練パターンにより変換用ベ
クトルを決定する工程と、 (ハ)前記特徴ベクトルの少なくとも一部分に前記変換
用ベクトルによる特徴変換を施した変換特徴ベクトルを
含む前記特徴ベクトルに関連する第2の照合用ベクトル
を第2の識別手段の識別辞書と照合して第2の相異値を
求める工程と 、(ニ)前記第1、第2の相異値から前記訓練パターン
のクラスを決定する工程と、 (ホ)所定の訓練パターン集合属する全訓練パターンの
クラスを決定するため、前記(イ)乃至(ニ)の工程を
繰り返す工程と、 (ヘ)前記訓練パターンの所定のクラスと前記決定され
たクラスとからの前記訓練パターン集合の認識率求める
工程と、 (ト)前記認識率を大きくするため第2の識別手段の識
別辞書を変更して前記(ハ)乃至(へ)の工程を含む工
程。 - 【請求項11】それぞれの識別辞書を備えた第1、第2
の識別手段を有する装置であって、 (イ)請求項1に記載の装置から変換用ベクトルと第2
の識別手段の識別辞書とを受信する手段と、 (ロ)入力パターンから抽出した特徴ベクトルに関連す
る第1の照合用ベクトルを第1の識別手段の識別辞書と
照合し第1の相異値を得る手段と、 (ハ)前記特徴ベクトルの少なくとも一部分に前記変換
用ベクトルによる特徴変換を施した変換特徴ベクトルを
含む前記特徴ベクトルに関連する第2の照合用ベクトル
を第2の識別手段の識別辞書と照合して第2の相異値を
求める手段と、 (ニ)前記第1、第2の相異値から前記訓練パターンの
クラスを決定する手段とを備えたパターン認識装置。 - 【請求項12】それぞれの入力と出力と識別辞書とを有
する複数の識別単位とクラス決定手段とを含むパターン
の認識装置において、 少なくともひとつの識別単位がその入力で入力パターン
を受け取り、 少なくともひとつの前記識別単位は自身とは別の前記識
別単位の出力を入力しさらに別の識別単位に自身の出力
を送り、 少なくともひとつの前記識別単位は入力パターンの特徴
ベクトルに関連するベクトルを入力して変換用ベクトル
で特徴変換し、 少なくともひとつの識別単位がクラス決定手段にその出
力を送出し、 クラス決定手段が入力パターンの決定をおこなうように
構成され前記変換用ベクトルは該変換用ベクトルの入力
側に接続された識別単位で決定されるライバルパターン
に基づいて決定されることを特徴とするパターン認識装
置。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03020297A JP4039708B2 (ja) | 1997-02-14 | 1997-02-14 | パターン認識方法およびパターン認識装置 |
CN98802531A CN1247615A (zh) | 1997-02-14 | 1998-02-13 | 模式识别方法和装置 |
PCT/US1998/002660 WO1998036372A1 (en) | 1997-02-14 | 1998-02-13 | Method and apparatus for recognizing patterns |
KR10-1999-7007381A KR100494261B1 (ko) | 1997-02-14 | 1998-02-13 | 패턴 인식 장치 및 방법 |
EP98906332A EP0960381B1 (en) | 1997-02-14 | 1998-02-13 | Method and apparatus for recognizing patterns |
DE69805280T DE69805280T2 (de) | 1997-02-14 | 1998-02-13 | Gerät und verfahren zur mustererkennung. |
US09/403,680 US6671404B1 (en) | 1997-02-14 | 1998-02-13 | Method and apparatus for recognizing patterns |
TW087102143A TW399188B (en) | 1997-02-14 | 1998-04-16 | Method and apparatus for recognizing patterns |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03020297A JP4039708B2 (ja) | 1997-02-14 | 1997-02-14 | パターン認識方法およびパターン認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10240930A true JPH10240930A (ja) | 1998-09-11 |
JP4039708B2 JP4039708B2 (ja) | 2008-01-30 |
Family
ID=12297165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03020297A Expired - Fee Related JP4039708B2 (ja) | 1997-02-14 | 1997-02-14 | パターン認識方法およびパターン認識装置 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP0960381B1 (ja) |
JP (1) | JP4039708B2 (ja) |
KR (1) | KR100494261B1 (ja) |
CN (1) | CN1247615A (ja) |
DE (1) | DE69805280T2 (ja) |
TW (1) | TW399188B (ja) |
WO (1) | WO1998036372A1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099777A (ja) * | 2001-09-21 | 2003-04-04 | Victor Co Of Japan Ltd | 顔画像検索装置 |
JP2009193417A (ja) * | 2008-02-15 | 2009-08-27 | Toshiba Corp | パターン認識装置、パターン認識プログラム及びパターン認識方法 |
JP2014153846A (ja) * | 2013-02-07 | 2014-08-25 | Mitsubishi Electric Corp | パターン認識装置 |
JP2015099616A (ja) * | 2015-02-26 | 2015-05-28 | カシオ計算機株式会社 | 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム |
JP2020533702A (ja) * | 2017-09-13 | 2020-11-19 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 対象者識別システム及び方法 |
US10915799B2 (en) | 2017-01-10 | 2021-02-09 | Fujitsu Limited | Image processing apparatus and image recognition apparatus |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
RU2160467C1 (ru) * | 1999-07-08 | 2000-12-10 | Яхно Владимир Григорьевич | Способ адаптивного распознавания информационных образов и система для его осуществления |
JP2002099916A (ja) * | 2000-09-25 | 2002-04-05 | Olympus Optical Co Ltd | パターン分類方法及びその装置、コンピュータにより読み取り可能な記憶媒体 |
US7031530B2 (en) * | 2001-11-27 | 2006-04-18 | Lockheed Martin Corporation | Compound classifier for pattern recognition applications |
CN100421127C (zh) * | 2002-07-16 | 2008-09-24 | 日本电气株式会社 | 模式特征提取方法及用于执行该方法的设备 |
CN1894703B (zh) * | 2003-12-16 | 2011-04-20 | 佳能株式会社 | 模式识别方法和设备 |
EP1883040A1 (en) * | 2006-07-28 | 2008-01-30 | IEE International Electronics & Engineering S.A.R.L. | Pattern classification method |
WO2016181468A1 (ja) * | 2015-05-11 | 2016-11-17 | 株式会社東芝 | パターン認識装置、パターン認識方法およびプログラム |
WO2018153469A1 (en) * | 2017-02-24 | 2018-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Classifying an instance using machine learning |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2690027B2 (ja) * | 1994-10-05 | 1997-12-10 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | パターン認識方法及び装置 |
-
1997
- 1997-02-14 JP JP03020297A patent/JP4039708B2/ja not_active Expired - Fee Related
-
1998
- 1998-02-13 CN CN98802531A patent/CN1247615A/zh active Pending
- 1998-02-13 DE DE69805280T patent/DE69805280T2/de not_active Expired - Lifetime
- 1998-02-13 WO PCT/US1998/002660 patent/WO1998036372A1/en active IP Right Grant
- 1998-02-13 EP EP98906332A patent/EP0960381B1/en not_active Expired - Lifetime
- 1998-02-13 KR KR10-1999-7007381A patent/KR100494261B1/ko not_active IP Right Cessation
- 1998-04-16 TW TW087102143A patent/TW399188B/zh not_active IP Right Cessation
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003099777A (ja) * | 2001-09-21 | 2003-04-04 | Victor Co Of Japan Ltd | 顔画像検索装置 |
JP2009193417A (ja) * | 2008-02-15 | 2009-08-27 | Toshiba Corp | パターン認識装置、パターン認識プログラム及びパターン認識方法 |
JP2014153846A (ja) * | 2013-02-07 | 2014-08-25 | Mitsubishi Electric Corp | パターン認識装置 |
JP2015099616A (ja) * | 2015-02-26 | 2015-05-28 | カシオ計算機株式会社 | 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム |
US10915799B2 (en) | 2017-01-10 | 2021-02-09 | Fujitsu Limited | Image processing apparatus and image recognition apparatus |
JP2020533702A (ja) * | 2017-09-13 | 2020-11-19 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 対象者識別システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4039708B2 (ja) | 2008-01-30 |
KR20000071094A (ko) | 2000-11-25 |
WO1998036372A1 (en) | 1998-08-20 |
DE69805280T2 (de) | 2002-10-02 |
EP0960381B1 (en) | 2002-05-08 |
DE69805280D1 (de) | 2002-06-13 |
TW399188B (en) | 2000-07-21 |
EP0960381A1 (en) | 1999-12-01 |
CN1247615A (zh) | 2000-03-15 |
KR100494261B1 (ko) | 2005-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6671404B1 (en) | Method and apparatus for recognizing patterns | |
US7362892B2 (en) | Self-optimizing classifier | |
US7447338B2 (en) | Method and system for face detection using pattern classifier | |
JP4039708B2 (ja) | パターン認識方法およびパターン認識装置 | |
EP0355748A2 (en) | A pattern recognition apparatus and method for doing the same | |
JP5207870B2 (ja) | 次元削減方法、パターン認識用辞書生成装置、及びパターン認識装置 | |
WO2003046818A1 (en) | Compound classifier for pattern recognition applications | |
JPH0634185B2 (ja) | 入力語認識装置 | |
Justino et al. | The interpersonal and intrapersonal variability influences on off-line signature verification using HMM | |
KR19990010210A (ko) | 대용량 패턴 정합 장치 및 방법 | |
JP4300098B2 (ja) | オブジェクト識別方法とその装置、プログラム及び記録媒体 | |
US20040096100A1 (en) | Method and computer program product for identifying output classes with multi-modal dispersion in feature space and incorporating multi-modal structure into a pattern recognition system | |
CN116912796A (zh) | 一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置 | |
JP5989576B2 (ja) | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 | |
JP4802176B2 (ja) | パターン認識装置、パターン認識プログラム及びパターン認識方法 | |
US7181062B2 (en) | Modular classification architecture for a pattern recognition application | |
US7164791B2 (en) | Method and computer program product for identifying and incorporating new output classes in a pattern recognition system during system operation | |
US7313267B2 (en) | Automatic encoding of a complex system architecture in a pattern recognition classifier | |
JP5365065B2 (ja) | 辞書作成装置 | |
JP5353482B2 (ja) | パターン認識用辞書生成装置、パターン認識装置、及びパターン認識用辞書生成方法 | |
JP5683287B2 (ja) | パターン認識装置及びパターン認識方法 | |
KR20020074330A (ko) | 계층적 주요 성분 분석에 기반한 얼굴 인식 방법 및 장치 | |
JP4199594B2 (ja) | オブジェクト識別装置およびそのプログラムとそのプログラムを記録した記録媒体 | |
CN109146002B (zh) | 一种gmm识别器的快速识别方法 | |
JP2001092924A (ja) | パターン認識方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060921 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060925 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060926 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061215 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071106 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |