JPH06251156A

JPH06251156A - パターン認識装置

Info

Publication number: JPH06251156A
Application number: JP5038208A
Authority: JP
Inventors: Toru Futaki; 徹二木
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1993-02-26
Filing date: 1993-02-26
Publication date: 1994-09-09

Abstract

(57)【要約】【目的】多数の候補カテゴリの中から、入力ベクトル
の属すると推定されるカテゴリだけ、効率良く絞り込む
ようにすること。【構成】この装置は、特徴抽出部１２と大分類演算部
１５との間に、予め定めた変換行列を入力ベクトルにか
けて変換する変換部１３、およびその変換行列を記憶し
ておく変換行列記憶部１４とを有する。変換部１３にお
いて、各カテゴリ内共分散行列の平均共分散行列Ｓ_w が
単位行列になるような変換を入力ベクトル（特徴ベクト
ル）に施した後に、大分類演算部１５においてその変換
されたベクトルに対して予め定めた基底ベクトルとの内
積を計算する。カテゴリテーブル参照部１７では、その
計算結果に基づいて予め定められたカテゴリテーブル１
８を参照し、超平面分離により上記入力パターンの属す
るカテゴリ群を選択出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はパターン認識装置に関
し、特に未知の入力ベクトルに対してその属するカテゴ
リ群を出力することにより、入力ベクトルの属する候補
カテゴリ数を減らす機能を有するパターン認識装置に関
する。

【０００２】

【従来の技術】従来のパターン認識装置においては、認
識対象となるカテゴリ数が非常に多い場合に、入力ベク
トルに対してすべての候補となる標準パターンと比較を
行うのではなく、最初に計算量の少ない所定の演算を行
い、その演算結果の値に応じてテーブルを参照して入力
ベクトルの属すると判定できるカテゴリ群を選び出し、
そのカテゴリ群に含まれるカテゴリを候補として出力す
る処理が行われている。この処理を一般に候補の絞り込
みあるいは大分類と呼ぶ。この大分類の処理により候補
カテゴリの数が減るので、全体の処理時間を短縮するこ
とができる。

【０００３】次に、この大分類に関して、例を挙げて詳
しく説明する。図１は、文字認識を行う従来例の装置構
成を示す。ここで、１１は認識対象となる文書画像を電
気信号に変換する入力部、１２は入力部１１からの入力
信号から１文字ごとに文字固有の特徴を抽出し、特徴ベ
クトルを生成する特徴抽出部である。なお、入力部１１
および特徴抽出部１２の構成は周知の技術なのでその詳
細は省略する。１５〜１８の部分が大分類の処理を司
る。１６は大分類演算のためのパラメータが記憶されて
いるパラメータ記憶部、１５は大分類演算部、１８はカ
テゴリテーブル、１７は大分類演算の結果からカテゴリ
テーブル１８を参照するカテゴリテーブル参照部、２０
は認識対象となるすべての候補カテゴリの標準パターン
が平均ベクトルとして記憶されている認識辞書、１９は
認識辞書２０の標準ベクトルと入力ベクトルとの距離計
算を最も小さい距離を与えるカテゴリを認識結果として
選択する照合部、２１は照合部１９で最終的に選択され
た候補カテゴリを出力する出力部である。

【０００４】大分類の目的は、候補となりうるカテゴリ
の数をなるべく少ない計算量で減らすことである。図２
は、特徴ベクトルの次元数を２としたときの各カテゴリ
分布の様子を模式的に表した図である。学習データは、
Ｃ１，Ｃ２，…のようにちらばりをもちながら、カテゴ
リ平均ベクトルのまわりに分布する。この分布は次式の
共分散行列

【０００５】

【数１】

【０００６】で近似的に表される。ここで、

【０００７】

【外１】

【０００８】ｎ（ｊ）はカテゴリｊの学習データ数であ
る。

【０００９】カテゴリ数を絞るために、図２の空間にお
いて直交する平面（一般には特徴ベクトルの次元数をＮ
とするとＮ次元の超平面となる）でカテゴリを分割する
ことを考える。超平面で分離することを考えた場合、な
るべくちらばりの大きい方向に垂直に平面を設定するの
が効率的なので、まずカテゴリごとの平均ベクトルに対
する主成分分析を行い、その結果えら得る固有ベクトル
の上位Ｌ個を超平面の基底ｅ_i （ｉ＝１，２，…，Ｌ）
とする。なお上記固有ベクトルはカテゴリ間共分散行列
Ｓ_B の固有ベクトルと言ってもよい。カテゴリ間共分散
行列Ｓ_B の定義は次式で与えられる。

【００１０】

【数２】

【００１１】図３の例では、上位２個の基底ベクトルｅ
₁ ，ｅ₂ によって４つの空間Ｅ１，Ｅ２，Ｅ３，Ｅ４が
得られる。各空間において少しでも学習データが含まれ
る場合は、その空間に学習データの属するカテゴリが含
まれるとする。

【００１２】未知の特徴ベクトルｘの入力に対して、大
分類演算部１５での大分類演算では、次のような内積演
算を行い、ｐ₁ ，ｐ₂ ，…，ｐ_L という値を得る。

【００１３】

【数３】 e_i・(x−μ) ≧0 ならば p₁＝1 e_i・(x−μ）＜0 ならば p_i＝0 (i＝1,2,…,L) 候補カテゴリを減らすためには、Ｌを大きくとった方が
効率がよいが、Ｌを大きくするほど後に説明するカテゴ
リテーブルが大きくなるので、Ｌは適当な値を実験的に
定める。そのＬの値の目安としては、特徴ベクトルの次
元数に比べて数分の１〜１０数分の１程度が妥当であ
る。ｅ_i とμは予め学習データを用いて計算し、パラメ
ータ記憶部１６にあらかじめ記憶しておいたパラメータ
であり、μはすべてデータの全平均ベクトル、ｅ_i はす
でに説明した基底ベクトルである。

【００１４】次に、上記内積演算結果のｐ_i を用いてカ
テゴリテーブルを参照するための値γを次式の通り計算
する。

【００１５】

【数４】

【００１６】γは、０〜２^L-1 の値をとることになる。
図４は図１のカテゴリテーブル１８を説明するためのメ
モリ構成を示す。このγの値からまずアドレステーブル
ＡＴ〔γ〕を参照する。そして、アドレステーブルＡＴ
〔γ〕の値からカテゴリテーブルＣＴ

〔０〕の位置７１
を参照し、その位置から後に記憶されているカテゴリを
候補カテゴリとする。ただし、最初の位置７１には個数
ｍが記憶されており、続いて位置７２以下に候補カテゴ
リの部類コードが順にｍ個記憶されている。個数ｍは一
定ではなく各グループによって異なる。図１の構成にお
いては上記アドレステーブルＡＴもカテゴリテーブル１
８の所定領域に記憶されている。なお、カテゴリテーブ
ルＣＴに含まれるカテゴリは学習データに対して参照値
γを計算し、そのγが属する空間を調べることにより得
ることができる。

【００１７】ｍ個に絞られた候補カテゴリに対しての
み、照合部１９では特徴ベクトルと認識辞書２０に記憶
された標準パターンとを比較し、最も小さい距離を与え
るカテゴリを最終的な候補カテゴリとして選び出し、出
力部２１から出力する。

【００１８】

【発明が解決しようとする課題】しかしながら、上記の
ような従来例において、カテゴリ間共分散行列に比べて
カテゴリ内共分散行列が大きく、かつカテゴリ内共分散
の異方性が強い場合には、分割された空間に含まれるカ
テゴリの数が多くなり、そのため効率的なカテゴリ数の
絞り込みが達成できないという欠点があった。図５は、
そのような場合の一例を表す模式図で、カテゴリ間の重
なり合いが大きいため、これらを超平面で効率よく分離
することは困難であった。

【００１９】本発明の目的は、上述の点に鑑み、どのよ
うな場合でも効率良くカテゴリ数の絞り込みができるパ
ターン認識装置を提供することにある。

【００２０】

【課題を解決するための手段】上記目的を達成するた
め、本発明は、未知の入力パターンの特徴ベクトルを入
力する特徴ベクトル入力手段と、入力ベクトルに作用さ
せる行列演算として各カテゴリごとの共分散行列の平均
共分散行列が単位行列になるような変換を、前記特徴ベ
クトル入力手段から入力した前記特徴ベクトルに対して
施す変換手段と、該変換手段での前記変換を行った後、
変換されたベクトルに対して予め定めた基底ベクトルと
の内積を計算する大分類演算手段と、該大分類演算手段
での前記計算の結果に基づいて予め定められたカテゴリ
テーブルを参照し、前記入力パターンの属するカテゴリ
群を選択出力するカテゴリ選択手段とを具備したことを
特徴とする。

【００２１】

【作用】本発明では、カテゴリ内共分散行列の平均が単
位行列になるような変換を特徴ベクトルに施した後、所
定の基底ベクトルとの内積演算を行い、カテゴリテーブ
ルを参照するようにしている。これにより、前述した従
来の問題点が解消され、図５に示すような場合にも効率
良くカテゴリ数の絞り込みが達成できる。

【００２２】

【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。

【００２３】図６は本発明の一実施例のパターン認識装
置の構成を示す。同図において、１３は予め定めた変換
行列を入力ベクトルにかけて変換する変換部、および１
４は上記変換行列を記憶しておく変換行列記憶部であ
る。その他の構成部分は図１の従来例と同様なので同一
符号を付してその詳細な説明は省略する。

【００２４】変換行列の求め方について説明する。図５
のような場合では、カテゴリ間共分散行列に比べてカテ
ゴリ内共分散行列が大きいこと、およびカテゴリ内共分
散の異方性が強いため、従来技術では各カテゴリを超平
面で分離することが困難であった。そこで、本発明では
各カテゴリ内共分散行列の平均共分散行列Ｓ_w が単位行
列になるような変換を施した後に、超平面分離すること
にする。

【００２５】カテゴリｊの共分散行列Ｓ_j （ｊ＝１，
…，Ｋ；ただしＫはカテゴリ数）に対して、平均カテゴ
リ共分散行列Ｓ_w を次式で定義する。

【００２６】

【数５】

【００２７】ここで、次のような変換を行う。

【００２８】

【数６】

【００２９】

【外２】

【００３０】Ｍ，Ｕは、それぞれＳ_w の固有値行列，固
有ベクトル行列である。すなわち、平均カテゴリ共分散
行列Ｓ_w の固有値をμ₁ ，…，μ_N 、その固有ベクトル
をφ₁，…，φ_N とすると、

【００３１】

【数７】

【００３２】である。このとき、

【００３３】

【数８】

【００３４】で定義しておく。固有値行列，固有ベクト
ル行列の定義から明らかに、

【００３５】

【数９】

【００３６】である。このとき、

【００３７】

【数１０】

【００３８】となり、これにより変換後の平均共分散行
列が図７に示すような単位行列になることがわかる。

【００３９】図８は、図５に示すような分布の変換後を
表す模式図であり、本発明によればカテゴリごとのまと
まりがよくなるため、超平面による分離がより効率的に
行えることがわかる。なお、共分散行列の単位行列への
正規化自体は白色化と呼ばれる公知の技術である（参考
文献：大津展之「パターン認識における特徴抽出に関す
る数理的研究」１９８１．７電総研研究報告）。

【００４０】図８のカテゴリ分布に対する大分類の処理
は従来例と同じである。すなわち、

【００４１】

【外３】

【００４２】大分類演算部１５で次のような演算を行
い、ｐ₁ ，ｐ₂ ，…，ｐ_L という値を得る。

【００４３】

【数１１】

【００４４】ここで、ｘは入力ベクトルである。ｅ_i と
μは予め学習データを用いて計算し、パラメータ記憶部
１６に記憶しておいたパラメータであり、μはすべての
データの全平均ベクトル、ｅ_i は基底ベクトルである。
この基底ベクトルｅ_i の求め方はすべての学習データに
対して、予め上記Ａの変換を施しておく以外は従来例と
同じである。その演算の結果、図８に示すように新たな
超平面によって分割された空間Ｅ１，Ｅ２，Ｅ３，Ｅ４
が得られる。

【００４５】これ以降の処理は、すべての学習データに
対して予め上記Ａの変換を施しておいてから、カテゴリ
テーブル１８を作っておくこと以外は従来例と同じであ
る。

【００４６】（他の実施例）本発明は、入力された特徴
ベクトルに対してその属するカテゴリを絞り込む働きを
するものであり、入力ベクトルやカテゴリの種類によら
ない。したがって、文字・音声・画像等さまざまな認識
に適用可能である。

【００４７】

【発明の効果】以上説明したように、本発明によれば、
各カテゴリ内共分散行列の平均分散行列Ｓ_w が単位行列
になるような変換を施した後に、超平面分離するように
したので、多数の候補カテゴリの中から入力ベクトルの
属すると推定されるカテゴリだけ効率よく絞り込むこと
ができるので、より少ない計算量でパターン認識が可能
であるという効果が得られる。

【図面の簡単な説明】

【図１】従来例のパターン認識装置の構成を示すブロッ
ク図である。

【図２】従来例のカテゴリの分離を説明するための模式
図である。

【図３】従来例のカテゴリの分離を説明するための模式
図である。

【図４】図１のカテゴリテーブルの構造を示すメモリマ
ップである。

【図５】カテゴリの分離が困難な例を示す模式図であ
る。

【図６】本発明の一実施例のパターン認識装置の構成を
示すブロック図である。

【図７】本発明実施例における変換の様子を説明するた
めの概念図である。

【図８】本発明実施例によるカテゴリの分離を説明する
ための模式図である。

【符号の説明】

１１入力部１２特徴抽出部１３変換部１４変換行列記憶部１５大分類演算部１６パラメータ記憶部１７カテゴリテーブル参照部１８カテゴリテーブル１９照合部２０認識辞書２１出力部

Claims

【特許請求の範囲】

【請求項１】未知の入力パターンの特徴ベクトルを入
力する特徴ベクトル入力手段と、入力ベクトルに作用させる行列演算として各カテゴリご
との共分散行列の平均共分散行列が単位行列になるよう
な変換を、前記特徴ベクトル入力手段から入力した前記
特徴ベクトルに対して施す変換手段と、該変換手段での前記変換を行った後、変換されたベクト
ルに対して予め定めた基底ベクトルとの内積を計算する
大分類演算手段と、該大分類演算手段での前記計算の結果に基づいて予め定
められたカテゴリテーブルを参照し、前記入力パターン
の属するカテゴリ群を選択出力するカテゴリ選択手段と
を具備したことを特徴とするパターン認識装置。