JP3943223B2 - 候補テーブルを用いて分類を行うパターン認識装置および方法 - Google Patents

候補テーブルを用いて分類を行うパターン認識装置および方法 Download PDF

Info

Publication number
JP3943223B2
JP3943223B2 JP02794098A JP2794098A JP3943223B2 JP 3943223 B2 JP3943223 B2 JP 3943223B2 JP 02794098 A JP02794098 A JP 02794098A JP 2794098 A JP2794098 A JP 2794098A JP 3943223 B2 JP3943223 B2 JP 3943223B2
Authority
JP
Japan
Prior art keywords
reference feature
candidate
category
feature vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02794098A
Other languages
English (en)
Other versions
JPH10289320A (ja
Inventor
克仁 藤本
洋 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP02794098A priority Critical patent/JP3943223B2/ja
Publication of JPH10289320A publication Critical patent/JPH10289320A/ja
Application granted granted Critical
Publication of JP3943223B2 publication Critical patent/JP3943223B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、パターン認識に係り、入力パターンあるいはその特徴ベクトルの属するカテゴリを推定してパターンを認識するパターン認識装置およびその方法に関する。
【0002】
【従来の技術】
近年、オフィスにおけるワークフローの効率化のために、文書を電子的にファイリングし、必要に応じてコード化するシステムが開発されつつあり、そのために、FAX文書等を認識する文書認識装置が強く求められている。特に、文字認識装置は文字列情報のコード化のために必須であり、その実用化と広範囲にわたる普及のためには、高い認識精度を維持したままで、より高速に文字カテゴリを推定することが重要となる。
【0003】
また、人間の顔の認識技術は、電子会議、セキュリティシステムの技術要素として重要になってきており、リアルタイムで人間の顔の同定ができるような、高速かつ高精度の顔認識技術が求められている。
【0004】
また、3次元物体あるいは2次元図形の認識技術は、コンピュータグラフィックス、CAD(computer aided design )、DTP(desk top publishing )等の普及に伴い、現実に存在する3次元物体あるいは2次元図形を効率的にコンピュータに入力し、再利用するための手段として重要になってきている。したがって、高速かつ高精度な物体あるいは図形の認識技術は、これらのシステムにとって実用上必須の技術となる。
【0005】
このように、高速かつ高精度なパターン認識は、各種の実用的なパターン認識装置を構築する上での技術要素として、重要な役割を果している。ここで、パターン認識においてよく用いられる用語を、簡単に定義しておく。
【0006】
認識対象のことをパターンと呼び、すべてのパターンの作る集合のことをパターン空間と呼ぶ。パターンを特徴抽出することにより得られる1つ以上の特徴量の組を特徴ベクトルと呼び、特徴ベクトルの要素の数を特徴ベクトルの次元と呼ぶ。
【0007】
特徴ベクトルのそれぞれの要素の値の組を特徴ベクトルの値と呼び、すべての特徴ベクトルの値の作る集合のことを特徴空間と呼ぶ。特徴空間の次元は、特徴空間の要素である特徴ベクトルの次元と等しい。
【0008】
特徴ベクトルの要素の部分集合を部分特徴ベクトルと呼び、部分特徴ベクトルのそれぞれの要素の値の組を、部分特徴ベクトルの値と呼ぶ。すべての部分特徴ベクトルの値の作る集合のことを部分特徴空間と呼ぶ。部分特徴空間の次元は、部分特徴空間の要素である部分特徴ベクトルの次元と等しい。
【0009】
同一種類とみなすことのできるパターンあるいは特徴ベクトルの集合をカテゴリと呼ぶ。特に、同一種類とみなすことのできるパターンの集合を、カテゴリパターン集合、同一種類とみなすことのできる特徴ベクトルの集合を、カテゴリ特徴集合と呼ぶ。
【0010】
入力されたパターンあるいは特徴べクトルがどのカテゴリ(カテゴリパターン集合あるいはカテゴリ特徴集合)に属するのかを決定することを、パターン認識と呼ぶ。特に、入力されたパターンあるいは特徴ベクトルが、カテゴリ集合の中のあるカテゴリに属する可能性があると推定される場合、そのカテゴリ集合のことを候補カテゴリ集合と呼ぶ。
【0011】
従来より、高速なパターン認識方法として、特徴圧縮を行い、照合時の距離計算に用いる特徴ベクトルの次元数を大きく減らすことにより、処理時間を大幅に短縮する方法がある。図23は、このような特徴圧縮による高速分類を用いたパターン認識装置の構成図である。
【0012】
図23のパターン認識装置においては、特徴抽出部1が、入力パターンから特徴ベクトルを抽出し、特徴圧縮部2が、特徴ベクトルの線型変換を行って、次元数のより低い圧縮特徴ベクトルを求める。圧縮特徴辞書4には、それぞれのカテゴリに対応する圧縮特徴ベクトルが保持されており、大分類部3は、特徴圧縮部2が求めた圧縮特徴ベクトルと圧縮特徴辞書4内の各圧縮特徴ベクトルとの距離を求める。そして、距離の小さな順にカテゴリを並び換えて、最短距離のものから指定された数だけのカテゴリの列を候補カテゴリ集合として出力する。
【0013】
【発明が解決しようとする課題】
しかしながら、従来のパターン認識には次のような問題がある。
特徴圧縮による高速分類を用いたパターン認識では、特徴ベクトルを圧縮してより次元の低い圧縮特徴ベクトルに変換する時に情報の欠落が発生する。このため、入力パターンの圧縮特徴ベクトルとの距離が小さい圧縮特徴ベクトルを含むカテゴリが、必ずしも前者を含むとは限らず、正しい候補カテゴリ集合が得られないことがある。したがって、低品質な入力パターンに対しては、認識精度が大幅に低下してしまい、高品質な入力パターンに対しても、認識精度が若干低下するという問題がある。
【0014】
本発明の課題は、認識精度の低下を抑えながら候補カテゴリ集合の算出を高速化することのできるパターン認識装置およびその方法を提供することである。
【0015】
【課題を解決するための手段】
図1は、本発明のパターン認識装置の原理図である。図1のパターン認識装置は、テーブル記憶手段11と候補カテゴリ計算手段12を備える。
【0016】
テーブル記憶手段11は、パターンの特徴ベクトルから計算される参照特徴ベクトルの値を入力とし、候補カテゴリ集合を出力とする写像を形成するために必要な情報を記述した候補テーブル13を記憶する。
【0017】
候補カテゴリ計算手段12は、候補テーブル13を用いて、与えられた参照特徴ベクトルの値に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合を出力する。
【0018】
参照特徴ベクトルとは、候補カテゴリ計算手段12が参照する特徴ベクトルのことであり、参照特徴ベクトルの要素の数を参照特徴ベクトルの次元と呼び、参照特徴ベクトルの値の集合のことを参照特徴空間と呼ぶ。参照特徴空間の次元は、参照特徴空間の要素である参照特徴ベクトルの次元と等しい。例えば、特徴ベクトルの要素の一部から成る部分特徴ベクトルが、参照特徴ベクトルとして用いられる。
【0019】
候補テーブル13は、参照特徴ベクトルの個々の値と候補カテゴリ集合の対応関係を表す写像情報を保持している。したがって、この候補テーブル13を参照すれば、特定の参照特徴ベクトルの値に対応する候補カテゴリ集合を直ちに求めることができる。候補カテゴリ計算手段12は、参照特徴ベクトルの値を与えられたとき、その値を候補テーブル13の写像に入力して、対応する候補カテゴリ集合を求め、それを出力する。
【0020】
このようなパターン認識装置においては、複雑な特徴ベクトル間の距離計算を行うことなく、簡単なテーブル引きの操作だけで候補カテゴリ集合を出力することができ、パターン認識処理が格段に高速化される。また、候補テーブル13の写像を適切に設定しておくことで、本発明を用いない場合と同程度の認識精度を維持することが可能である。
【0021】
例えば、図1のテーブル記憶手段11は、後述する図4のメモリ32に対応し、候補カテゴリ計算手段12はCPU(中央処理装置)31とメモリ32に対応する。
本発明の別のパターン認識装置は、テーブル記憶手段11と候補カテゴリ計算手段12を備える。テーブル記憶手段11は、パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、その参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブル13を記憶する。候補カテゴリ計算手段12は、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、候補テーブル13を用いて、得られた参照特徴分割要素に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合を出力する。学習用パターン集合から得られる参照特徴ベクトルの値の分布を用いて、各カテゴリに対応する特徴ベクトルの集合を参照特徴空間へ射影したときの射影範囲の推定を行い、得られた推定値を用いて、候補テーブル13が作成される。
本発明のさらに別のパターン認識装置は、テーブル記憶手段11と候補カテゴリ計算手段12を備える。テーブル記憶手段11は、パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、その参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブル13を記憶する。候補カテゴリ計算手段12は、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、候補テーブル13を用いて、得られた参照特徴分割要素に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合を出力する。辞書に登録されている各カテゴリの代表特徴ベクトルに基づく特徴空間のボロノイ分割要素を、参照特徴空間へ射影したときの射影範囲の推定を行い、得られた推定値を用いて、候補テーブル13が作成される。
【0022】
【発明の実施の形態】
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
本発明においては、あらかじめ用意された候補テーブルを参照することにより、特徴ベクトル間の距離計算を行うことなく、候補カテゴリ集合を出力する候補カテゴリ計算部を設ける。候補テーブルには、特徴ベクトルから計算されるある参照特徴ベクトルの値を入力とし、ある候補カテゴリ集合を出力とする写像を構成するために必要な情報が記述されている。
【0023】
候補カテゴリ計算部は、入力された参照特徴ベクトルの値をもとに、候補テーブルから候補カテゴリ集合を求めて、それを出力する。候補テーブルに、参照特徴ベクトルの値とカテゴリ集合の写像として適切なものを保持しておけば、本発明の高速分類手法を用いない場合とほぼ同程度の精度を維持しつつ、格段に高速な分類を実現することができる。
【0024】
図2は、候補テーブルのレコードの例を示している。図2の参照特徴分割要素xは、参照特徴ベクトルの特定の値または値の範囲を表し、参照特徴空間内の特定の点または領域に対応する。候補カテゴリ計算部に与えられた参照特徴ベクトルの値が参照特徴分割要素xに含まれるとき、対応する候補カテゴリ集合(B,C,G,H,K)が分類結果として出力される。
【0025】
図3は、カテゴリと参照特徴空間の関係を示している。候補テーブルの作成時には、参照特徴空間22を適当な基準に従って複数の参照特徴分割要素に分割し、特徴空間21に対応する各カテゴリA,B,C,D,E,F,G,H,I,J,K,L,Mから参照特徴空間22への射影(参照特徴射影)の推定を行う。そして、例えば、各参照特徴分割要素に対して、その領域と各カテゴリの参照特徴射影との共通部分を求め、共通部分が存在するカテゴリの集合を、対応する候補カテゴリ集合とする。
【0026】
ここでは、カテゴリB,C,G,H,Kの射影が参照特徴分割要素xと共通部分を持つので、これらを要素とする集合(B,C,G,H,K)が、図2に示すように、参照特徴分割要素xに対応する候補カテゴリ集合となる。他の参照特徴分割要素yに対応する候補カテゴリ集合も、同様にして求められる。
【0027】
このように、参照特徴射影が参照特徴分割要素と共通部分を持つカテゴリを候補カテゴリ集合の要素とし、参照特徴分割要素と候補カテゴリ集合の組を候補テーブルとして保持しておく。そして、候補カテゴリ計算部は、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、候補テーブルを用いて対応する候補カテゴリ集合を求める。これにより、精度を低下させることなく、高速な分類を実現することができる。
【0028】
図4は、このようなパターン認識装置に用いられる情報処理装置(コンピュータ)の構成図である。図4の情報処理装置は、CPU(中央処理装置)31、メモリ32、入力装置33、出力装置34、外部記憶装置35、媒体駆動装置36、ネットワーク接続装置37、光電変換装置38を備え、それらの各装置はバス39により互いに結合されている。
【0029】
CPU31は、メモリ32に格納されたプログラムと候補テーブルを用いて、パターン認識装置の処理を実現する。メモリ32には、処理に用いられるプログラムとデータが格納されている。このメモリ32は、例えばROM(read only memory)、RAM(random access memory)等を含む。
【0030】
入力装置33は、例えばキーボード、ポインティングデバイス等に相当し、ユーザからの要求や指示の入力に用いられる。また、出力装置34は、表示装置やプリンタ等に相当し、ユーザへの問い合せや処理結果等の出力に用いられる。
【0031】
外部記憶装置35は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置等である。この外部記憶装置35に、上述のプログラムとデータを保存しておき、必要に応じて、それらをメモリ32にロードして使用することができる。また、外部記憶装置35は、パターン、特徴ベクトル、候補テーブル等を保存するデータベースとしても使用される。
【0032】
媒体駆動装置36は、可搬記録媒体40を駆動し、その記憶内容にアクセスすることができる。可搬記録媒体40としては、メモリカード、フロッピーディスク、CD−ROM(compact disk read only memory )、光ディスク、光磁気ディスク等、任意のコンピュータ読み取り可能な記録媒体を使用することができる。この可搬記録媒体40に、上述のプログラムとデータを格納しておき、必要に応じて、それらをメモリ32にロードして使用することができる。
【0033】
ネットワーク接続装置37は、LAN(local area network)等の任意の通信ネットワークに接続され、通信に伴うデータ変換等を行う。パターン認識装置は、ネットワーク接続装置37を介して、外部の情報提供者の装置40′(データベース等)と通信する。これにより、必要に応じて、上述のプログラムとデータを装置40′からネットワークを介して受け取り、それらをメモリ32にロードして使用することができる。光電変換装置38は、例えばイメージスキャナであり、処理対象となるパターンの入力に用いられる。
【0034】
次に、図5から図14までを参照しながら、参照特徴ベクトルと候補テーブルの具体例およびパターン認識装置の機能構成について説明する。図5は、本実施形態で用いられる候補テーブルの構造を示している。図5の候補テーブルには、複数の参照特徴分割要素と候補カテゴリ集合の組が格納され、参照特徴ベクトルの分類に用いられる。
【0035】
図6は、入力された特徴ベクトルの部分特徴ベクトルを用いて高速分類を行う候補テーブルを有する第1のパターン認識装置の構成図である。図6のパターン認識装置は、特徴ベクトルから計算される参照特徴ベクトルの値とカテゴリ集合の組を保持した候補テーブル41と、候補カテゴリ計算部42を備える。
【0036】
候補カテゴリ計算部42は、入力された特徴ベクトルのある部分特徴ベクトルを参照特徴ベクトルとして、その参照特徴ベクトルの値と候補テーブル41を用いて候補カテゴリ集合を求め、それを出力する。
【0037】
ここで、特徴ベクトルの成す特徴空間は、互いに交わらないK個のカテゴリ特徴集合(カテゴリ)C1 ,C2 ,・・・,CK で覆われているとする。このとき、すべてのカテゴリ特徴集合の集合をCSET とすると、
SET ={C1 ,C2 ,・・・,CK
と書ける。また、特徴空間の次元数をNとすると、特徴ベクトルfは、その要素を用いて、
f=(f1 ,f2 ,・・・,fN
と書ける。このとき、候補カテゴリ計算部42は、入力特徴ベクトルfINの属するカテゴリCIN∈CSET を含む候補カテゴリ集合CCANDを推定して、それを出力する。参照特徴ベクトルとしては、特徴ベクトルの任意の部分特徴ベクトルを用いることができる。
【0038】
例えば、2次元の部分特徴ベクトルg=(f1 ,f2 )を参照特徴ベクトルとすると、候補テーブル41は、2次元の部分特徴ベクトルの値と候補カテゴリ集合の組により構成される。そして、2次元の部分特徴ベクトルのとり得るすべての値が候補テーブルに登録される。ここで、特徴ベクトルfの各要素は、それぞれ3種類の値0,1,2のいずれかをとり得るものとすると、候補テーブル41は次のようになる。
((0,0),C(0 )
((0,1),C(0 )
((0,2),C(0 )
((1,0),C(1 )
((1,1),C(1 )
((1,2),C(1 )
((2,0),C(2 )
((2,1),C(2 )
((2,2),C(2 )
ここで、C(p ) ⊂CSET は、参照特徴ベクトルの値(p,q)(p=0,1,2;q=0,1,2)に対応する候補カテゴリ集合である。この場合、参照特徴空間における点(p,q)が参照特徴分割要素となる。
【0039】
候補カテゴリ計算部42は、入力された特徴ベクトルから2次元の参照特徴ベクトルの値(p,q)を求めて、候補テーブル41の中から(p,q)を左要素に持つ組を求め、その右要素の候補カテゴリ集合C(p ) を出力する。
【0040】
このようなパターン認識装置を用いると、距離計算を行うことなくテーブル引きにより高速に候補カテゴリ集合を求めることができる。また、候補テーブル41に保持している候補カテゴリ集合がそれぞれ適切なものであれば、高精度かつ高速にパターン認識を実行するパターン認識装置が実現できる。
【0041】
図7は、入力されたパターンから特徴ベクトルを求め、特徴ベクトルの部分特徴ベクトルを参照特徴ベクトルとして、候補テーブルを用いた高速分類を行う第2のパターン認識装置の構成図である。
【0042】
図7のパターン認識装置は、入力された文字パターンから特徴ベクトルを抽出する特徴抽出部51と、候補カテゴリ計算部52と、候補テーブル53とを備えている。候補テーブル53は、例えば、学習用文字パターン集合を用いて作成される。
【0043】
ここで、文字パターンのカテゴリはK個あるものとし、対応する特徴ベクトルの成す特徴空間は、互いに交わらないK個のカテゴリ特徴集合C1 ,C2 ,・・・,CK で覆われているとする。このとき、すべてのカテゴリ特徴集合の集合CSET は、
SET ={C1 ,C2 ,・・・,CK
と書ける。候補カテゴリ計算部52は、入力文字パターンPINの属するカテゴリCIN∈CSET を含む候補カテゴリ集合CCANDを推定して、それを出力する。
【0044】
まず、特徴抽出部51による特徴抽出処理について説明する。文字パターンからの特徴抽出によく用いられている特徴量として、方向線素特徴量がある。これは、文字パターンを2次元の格子状に分割し、各升目内の文字パターンの輪郭方向成分の数を数えて、それを特徴量としたものである。
【0045】
例えば、縦7×横7の格子を用いた場合、升目の数は合計49個になる。輪郭方向成分を大まかに、横・縦・右斜め・左斜めの4方向とすると、49×4=196個の特徴量を得ることができる。これにより、入力された文字パターンから196次元の特徴ベクトルが抽出されることになる。
【0046】
一般に、特徴空間の次元数をNとすると、特徴ベクトルfは、その要素を用いて、
f=(f1 ,f2 ,・・・,fN
と書ける。特徴ベクトルfの各要素の値は、特定の升目に含まれる輪郭画素のうち、特定の方向成分を持つ画素の数に対応しており、例えば、0以上の整数値で表される。
【0047】
さらに、特徴ベクトルの1つの要素f1 を1次元の参照特徴ベクトルrとし、参照特徴ベクトルのとり得る値の範囲をA≦r<Bとすると、区間[A,B)が、参照特徴空間となる。
【0048】
候補テーブルの要素となる参照特徴分割要素として、参照特徴空間[A,B)を、格子状に分割したものを用いることにする。この場合、参照特徴空間が1次元であるから、区間[A,B)を、
A=s-1<s0 <s1 <s2 <・・・<sL =B
のようにL+1個の区間Ri =[si-1,i )(i=0,1,・・・,L)に分割すると、それぞれの区間Ri が参照特徴分割要素となる。参照特徴空間を無限空間として定義する場合は、A=−∞、B=+∞とすればよい。
【0049】
例えば、図8に示す1次元の参照特徴空間55の場合は、L=6として、R0=(−∞,s0 ),R1 =[s0 ,s1 ),R2 =[s1 ,s2 ),R3 =[s2 ,s3 ),R4 =[s3 ,s4 ),R5 =[s4 ,s5 ),R6 =[s5 ,+∞)の7つの参照特徴分割要素に分割されている。
【0050】
それぞれの参照特徴分割要素Ri に対する候補カテゴリ集合は、学習用文字パターン集合の各文字カテゴリに対する参照特徴射影を推定することにより求められる。そして、それらの候補カテゴリ集合を用いて、候補テーブル53が作成される。
【0051】
ただし、学習用文字パターン集合は、各文字カテゴリに属する文字パターンを十分な数だけ含んでいるものとする。特定の文字カテゴリCk に対する参照特徴射影の推定は、次のようにして行われる。
【0052】
まず、学習用文字パターン集合から文字カテゴリCk に属する文字パターンを取り出し、それぞれの文字パターンを特徴抽出して、対応する特徴ベクトルを求める。次に、得られた特徴ベクトルの集合から、各特徴ベクトルの第1要素f1の集合Fk を求めると、集合Fk は文字カテゴリCk の参照特徴射影を近似する分布を形成する。この集合Fk の要素の最小値MINk と最大値MAXk を求め、さらに特定のマージンMを考慮して、文字カテゴリCk の参照特徴射影の推定値Qk を、
k =[MINk −M,MAXk +M]
のような閉区間とすることができる。
【0053】
以上のようにして求めた参照特徴分割要素Ri と、各文字カテゴリCk に対する参照特徴射影Qk とから、それぞれの参照特徴分割要素Ri と組にするべき候補カテゴリ集合Di が求められる。
【0054】
ここでは、ある参照特徴分割要素Ri と参照特徴射影Qk が共通部分を持つ(積集合が空集合でない)ような文字カテゴリCk の集合を、その参照特徴分割要素Ri に対する候補カテゴリ集合Di とすることにする。これにより、候補カテゴリ集合Di は、参照特徴分割要素Ri に属する参照特徴ベクトルの値を持つ文字パターンが属する可能性のある文字カテゴリを列挙したものとなる。
【0055】
したがって、認識精度を保つために十分なだけの文字カテゴリを含む候補カテゴリ集合Di が得られ、候補テーブル53は、参照特徴分割要素Ri と候補カテゴリ集合Di の組により構成される。
【0056】
図8の特徴空間54においては、カテゴリB,C,G,H,Kの射影が参照特徴分割要素R3 と共通部分を持つので、これらを要素とする集合(B,C,G,H,K)が参照特徴分割要素R3 に対応する候補カテゴリ集合となる。他の参照特徴分割要素に対応する候補カテゴリ集合も同様にして求められ、候補テーブル53は、例えば、図9に示すようになる。
【0057】
候補カテゴリ計算部52は、入力された特徴ベクトルの第1要素の値がrである場合、これを参照特徴ベクトルの値とし、まず、この値rの属する参照特徴分割要素Ri を求める。ここでは、参照特徴分割要素Ri は1次元の区間であるから、値rがどの区間に属するのかを判定することは容易である。次に、候補テーブル53を用いて、参照特徴分割要素Ri に対応する候補カテゴリDiを求め、これを文字認識結果として出力する。出力された候補カテゴリ集合には、入力文字パターンの属する文字カテゴリが属していることが期待できる。
【0058】
このようなパターン認識装置を用いると、距離計算を行うことなくテーブル引きにより入力文字パターンが属すると推定できる候補カテゴリを、非常に高速にかつ精度を低下させることなく求めることができる。
【0059】
図10は、入力された文字パターンから特徴ベクトルを求め、特徴ベクトルの部分特徴ベクトルを参照特徴ベクトルとして、候補テーブルを用いた詳細な高速分類を行う第3のパターン認識装置の構成図である。
【0060】
図10のパターン認識装置は、特徴抽出部61、候補カテゴリ計算部62、詳細分類部63、候補テーブル64、および詳細分類のための辞書65を備える。
特徴抽出部61は、入力した文字パターンから特徴ベクトルを抽出する。
【0061】
ここでは、候補テーブル64を作成するために、辞書65に登録されている各文字カテゴリに対する代表特徴ベクトルの作るボロノイ( 外1 )分割を用い
【0062】
【外1】
Figure 0003943223
【0063】
る。ボロノイ分割とは、任意の空間内において複数の点が与えられたとき、それらの点からの距離に基づいて定義される領域の一種であり、ボロノイ領域とも呼ばれる。
【0064】
カテゴリ特徴集合の集合CSET 、特徴ベクトルf、参照特徴空間、参照特徴分割要素Ri 等の表記法と特徴抽出処理の内容については、第2のパターン認識装置の場合と同様である。候補カテゴリ計算部62は、入力文字パターンPINの属するカテゴリCIN∈CSET を含む候補カテゴリ集合CCANDを推定して、それを出力する。
【0065】
詳細分類部63は、候補カテゴリ計算部62が出力した候補カテゴリを入力として、辞書65を用いて距離計算を行う。辞書65は、各文字カテゴリに対する代表特徴ベクトルを保持しており、詳細分類部63は、入力文字パターンに対応する特徴ベクトルからの距離が最小であるような代表特徴ベクトルを求めて、それに対応する文字カテゴリを推定文字カテゴリとして出力する。
【0066】
ここでは、各文字カテゴリCk に対する参照特徴射影の推定値Qk を、学習用文字パターン集合を用いて求めるのではなく、詳細分類のための辞書65に登録されている各文字カテゴリCj に対する代表特徴ベクトルEj の集合から得られるボロノイ分割Vk を用いて求める。
【0067】
ここで、文字カテゴリCk に対するボロノイ分割Vk とは、特徴空間において、任意の特徴ベクトルfと辞書65に登録されているすべての代表特徴ベクトルとの距離を求めたとき、文字カテゴリCk に対する代表特徴ベクトルEk との距離が最小となるような特徴ベクトルfの集合のことである。距離計算に基づく詳細分類によって特徴空間を分割すると、ボロノイ分割が得られることが知られている。
【0068】
例えば、2次元の特徴空間において、カテゴリC1 ,C2 ,C3 ,C4 ,C5,C6 に対する代表特徴ベクトルE1 ,E2 ,E3 ,E4 ,E5 ,E6 が与えられたとき、対応するボロノイ分割V1 ,V2 ,V3 ,V4 ,V5 ,V6 は、図11に示すようになる。図11において、ボロノイ分割V3 とボロノイ分割V5 の境界上の特徴ベクトルf=(f1 ,f2 )は、代表特徴ベクトルE3 とE5 から等距離の位置にある。他の境界上の点についても同様である。
【0069】
一般に、N次元の特徴空間において、ユークリッド距離を用いた場合には、ボロノイ分割は特徴空間内の超平面で囲まれた超凸多面体となり、市街区距離(シティブロック距離)を用いた場合には、ボロノイ分割は超多面体となる。また、マハラノビス(Mahalanobis )距離のような非線形な距離を用いた場合には、ボロノイ分割は超曲面で囲まれた有界な部分集合となる。
【0070】
ここで、N次元空間の超曲面とはN−1次元の曲面を意味し、超平面とはその特殊な場合を意味する。シティブロック距離等の様々な距離の定義とその意味については、後述することにする。
特徴ベクトルfの1つの要素f1 を参照特徴ベクトルとすると、参照特徴空間へのボロノイ分割Vk の参照特徴射影の推定値Qk は、ボロノイ分割Vk に属する特徴ベクトルfの要素f1 の値の範囲として与えられる。距離がユークリッド距離の場合は、線型計画法によりボロノイ分割Vk の参照特徴ベクトルの最小値・最大値を求めることができ、それらの値から参照特徴射影の推定値Qk が得られる。
【0071】
また、より一般的な距離の場合でも、1次元の参照特徴ベクトルを用いていれば、非線形計画法によりボロノイ分割Vk から参照特徴射影の推定値Qk を求めることができる。線型計画法および非線形計画法による参照特徴射影の推定方法については、後述することにする。
【0072】
以上のようにして求めた参照特徴分割要素Ri と、各文字カテゴリCk に対する参照特徴射影Qk とを用いて、それぞれの参照特徴分割要素Ri と組にすべき候補カテゴリ集合Di が求められる。
【0073】
例えば、第2のパターン認識装置の場合と同様に、参照特徴分割要素Ri と参照特徴射影Qk が共通部分を持つような文字カテゴリCk の集合を、その参照特徴分割要素Riに対する候補カテゴリ集合Di とすればよい。これにより、候補カテゴリ集合Di は、参照特徴分割要素Ri に属する参照特徴ベクトルの値を持つ文字パターンが属する可能性のある文字カテゴリを列挙したものとなる。
【0074】
図12は、カテゴリのボロノイ分割と2次元の参照特徴空間の関係を示している。図12の特徴空間71において、各カテゴリに対するボロノイ分割A,B,C,D,E,F,G,H,I,J,K,L,Mを参照特徴空間72へ射影することにより、参照特徴空間72における各ボロノイ分割の射影領域が得られる。この領域が参照特徴射影の推定値となる。
【0075】
そして、各参照特徴分割要素に対して、その領域と各カテゴリの参照特徴射影との共通部分を求め、共通部分が存在するカテゴリの集合を、対応する候補カテゴリ集合とする。
【0076】
ここでは、カテゴリB,C,G,H,Kの射影が参照特徴分割要素xと共通部分を持つので、図2のレコードと同様に、これらを要素とする集合(B,C,G,H,K)が参照特徴分割要素xに対応する候補カテゴリ集合となる。他の参照特徴分割要素yに対応する候補カテゴリ集合も、同様にして求められる。
【0077】
候補テーブル64は、参照特徴分割要素Ri と候補カテゴリ集合Di の組により構成され、候補カテゴリ計算部62は、第2のパターン認識装置の場合と同様に、候補テーブル64を用いて、入力された特徴ベクトルから候補カテゴリ集合を求め、それを詳細分類部63に渡す。
【0078】
詳細分類部63は、辞書65を参照して、候補カテゴリ計算部62により絞り込まれた候補カテゴリ集合に属する各文字カテゴリの代表特徴ベクトルを取り出す。そして、それらの各代表特徴ベクトルと入力された文字パターンに対する特徴ベクトルとの距離を計算し、距離が最小となるような文字カテゴリを推定文字カテゴリとして出力する。
【0079】
このように、詳細分類で用いられる各文字カテゴリに対するボロノイ分割の参照特徴射影を求め、参照特徴分割要素と共通部分を持つ参照特徴射影に対応する文字カテゴリを候補カテゴリとすることで、詳細分類のために必要かつ十分な文字カテゴリから成る候補カテゴリ集合を求めることができる。
【0080】
これにより、入力文字パターンが属すると推定できる候補カテゴリを、詳細分類の精度を保証しつつ、テーブル引きにより非常に高速に絞り込むことができ、詳細分類の対象文字カテゴリを大幅に削減することができる。したがって、高精度かつ高速にパターン認識を実行するパターン認識装置が実現される。
次に、図10のパターン認識装置において、特徴ベクトルfの2つの要素(f1 ,f2 )を2次元の参照特徴ベクトルrとする場合を考えてみる。参照特徴ベクトルrの各要素のとり得る値の範囲を、f1 ∈[A1 ,B1 ),f2 ∈[A2,B2 )とすると、矩形領域[A1 ,B1 )×[A2 ,B2 )が参照特徴空間となる。
【0081】
候補テーブル64の要素となる参照特徴分割要素として、参照特徴空間[A1,B1 )×[A2 ,B2 )を、格子状に分割したものを用いる。このため、次に示すように、区間[A1 ,B1 )をL1 +1個の区間に分割し、区間[A2 ,B2 )をL2 +1個の区間に分割する。
1 =s-1<s0 <s1 <s2 <・・・<sL1=B1
2 =t-1<t0 <t1 <t2 <・・・<tL2=B2
インデックスi,jを用いると、参照特徴分割要素R(i ) は、
(i ) =矩形[si-1 ,si )×[tj-1 ,tj
のように定義される。ここで、i=0,1,・・・,L1 、j=0,1,・・・,L2 である。これにより、参照特徴分割要素R(i ) は2次元の矩形領域となる。例えば、図13に示す2次元の参照特徴空間74の場合は、L1 =5、L2=3として、(5+1)×(3+1)=24個の参照特徴分割要素に分割されている。
【0082】
次に、各文字カテゴリCk に対するボロノイ分割Vk に属するすべての特徴ベクトルを取り出し、それらの参照特徴ベクトル(f1 ,f2 )の値の範囲を、参照特徴射影の推定値Qk とする。そして、参照特徴分割要素R(i ) と参照特徴射影Qk が共通部分を持つような文字カテゴリCk の集合を、その参照特徴分割要素R(i ) に対する候補カテゴリ集合D(i ) とする。
【0083】
この場合、候補テーブル64は、参照特徴分割要素R(i ) と候補カテゴリ集合D(i ) の組により構成される。特徴抽出部61および詳細分類部63の処理については、上述した通りである。
【0084】
図13の特徴空間73においては、カテゴリB,C,Kの射影が参照特徴分割要素X=[s2 ,s3 )×[t0 ,t1 )と共通部分を持つので、これらを要素とする集合(B,C,K)が参照特徴分割要素Xに対応する候補カテゴリ集合となる。また、カテゴリG,H,Kの射影が参照特徴分割要素Y=[s2 ,s3 )×[t1 ,t2 )と共通部分を持つので、これらを要素とする集合(G,H,K)が参照特徴分割要素Yに対応する候補カテゴリ集合となる。したがって、候補テーブル64は、例えば、図14に示すようになる。
【0085】
候補カテゴリ計算部62は、入力された特徴ベクトルの第1要素、第2要素の値がそれぞれr1 、r2 である場合、r=(r1 ,r2 )を参照特徴ベクトルの値とし、まず、この値の属する参照特徴分割要素R(i ) を求める。参照特徴分割要素R(i ) は2次元の矩形領域であるから、値rがどの領域に属するかを判定するのは容易である。次に、候補テーブル64を用いて、参照特徴分割要素R(i ) に対応する候補カテゴリ集合D(i ) を求めて、それを詳細分類部63に渡す。
【0086】
このように、参照特徴空間は1次元空間に限られず、一般に任意の次元の空間に設定することが可能である。ここで、参照特徴空間が2次元以上の場合の候補テーブルの作成方法をまとめておく。以下の例は、参照特徴空間が2次元の場合であるが、3次元以上の場合も同様にして候補テーブルを作成できる。
【0087】
まず、参照特徴空間を各座標軸に垂直な直線で区切って格子状に分割し、各格子(升目)を参照特徴分割要素とする場合を考える。この場合、各格子の2次元インデックスを(i,j)として、対応する格子をK(i,j)で表すことにする。カテゴリCの参照特徴空間への射影が、格子K(i,j)と共通部分を持つ場合には、カテゴリCを、格子K(i,j)に対する候補カテゴリ集合S(i,j)の要素とする。
【0088】
こうしてできた参照特徴空間の各格子K(i,j)と候補カテゴリ集合S(i,j)の組を、格子のインデックス(i,j)と候補カテゴリ集合に属する各カテゴリのインデックスを用いて表現し、候補テーブルとして保持する。
【0089】
次に、参照特徴空間を量子化点を用いてボロノイ分割し、各ボロノイ領域を参照特徴分割要素とする場合を考える。この場合、参照特徴空間の各ボロノイ領域を代表する量子化点のインデックスをiとして、各量子化点を(xi ,yi )で表すことにする。カテゴリCの参照特徴空間への射影が、量子化点(xi ,yi)のボロノイ領域Vi と共通部分を持つ場合には、カテゴリCを、ボロノイ領域Vi に対する候補カテゴリ集合S(i)の要素とする。
【0090】
こうしてできた参照特徴空間の各ボロノイ領域Vi と候補カテゴリ集合S(i)の組を、ボロノイ領域Vi を代表する量子化点のインデックスと候補カテゴリ集合に属する各カテゴリのインデックスを用いて表現し、候補テーブルとして保持する。
【0091】
これらの例において、あるカテゴリの参照特徴空間への射影を求める方法としては、例えば、上述した2つの方法がある。1つは、学習用パターン集合(学習パターン)に対応する特徴ベクトルをそれぞれ参照特徴空間に射影することにより、参照特徴射影を推定する方法であり、もう1つは、詳細分類時の辞書に登録されている代表特徴ベクトルを用いたボロノイ分割をもとに、参照特徴射影を推定する方法である。
【0092】
ここで、図15から図19までを参照しながら、これらの各推定方法を用いた候補テーブル作成処理のフローを説明する。
図15は、学習パターンを用いた候補テーブル作成処理のフローチャートである。図15のフローチャートは、1次元の参照特徴空間の場合について記述されているが、より高次元の参照特徴空間の場合についても同様である。
【0093】
処理が開始されると、パターン認識装置は、まず、参照特徴空間における参照特徴分割要素Ri =[si-1,i )をi=0,1,・・・,Lについて求める(ステップS1)。次に、各カテゴリCk (k=1,・・・,K)に対する参照特徴射影の推定値Qk =[MINk ,MAXk ]を、学習パターンの参照特徴空間への射影を用いて求める(ステップS2)。
【0094】
次に、各参照特徴分割要素Ri に対する候補カテゴリ集合Di を、推定値Qk(k=1,・・・,K)から求める(ステップS3)。そして、各参照特徴分割要素Ri と候補カテゴリ集合Di の組を候補テーブルに格納し(ステップS4)、処理を終了する。
【0095】
図16は、図15のステップS2における参照特徴射影の推定処理のフローチャートである。処理が開始されると、パターン認識装置は、まず、カテゴリCkに属する各学習パターンに対する参照特徴ベクトルrを求め、それらの参照特徴ベクトルの集合Fk を生成する(ステップS11)。
【0096】
次に、集合Fk の要素の最小値MINk と最大値MAXk を求め(ステップS12)、閉区間[MINk ,MAXk ]を推定値Qk として(ステップS13)、図15の処理に戻る。ここで、マージンMを考慮する場合は、閉区間[MINk −M,MAXk +M]を推定値Qk とすればよい。
【0097】
図17は、図15のステップS3における候補カテゴリ集合生成処理のフローチャートである。処理が開始されると、パターン認識装置は、まず、候補カテゴリ集合Di の初期値を空集合Φとし(ステップS21)、制御変数kを1とおいて(ステップS22)、参照特徴射影Qk と参照特徴分割要素Ri の積集合Xを求める(ステップS23)。
【0098】
次に、積集合Xが空集合かどうかを調べ(ステップS24)、それが空集合でなければ、推定値Qk に対応するカテゴリCk を候補カテゴリ集合Di に加え(ステップS25)、kの値をKと比較する(ステップS26)。kの値がKより小さければ、kを1だけインクリメントし(ステップS27)、ステップS23以降の処理を繰り返す。
【0099】
ステップS24において積集合Xが空集合であれば、カテゴリCk を候補カテゴリ集合Di に加えずに、直ちにステップS26の処理を行う。そして、ステップS26においてkの値がKに達すると、図15の処理に戻る。これにより、参照特徴分割要素Ri と参照特徴射影Qk が共通部分を持つようなカテゴリCk が、もれなく候補カテゴリ集合Di に加えられる。この処理は、各参照特徴分割要素Ri について行われる。
【0100】
次に、図18は、ボロノイ分割を用いた候補テーブル作成処理のフローチャートである。図18のフローチャートは、1次元の参照特徴空間の場合について記述されているが、より高次元の参照特徴空間の場合についても同様である。
【0101】
処理が開始されると、パターン認識装置は、まず、参照特徴空間における参照特徴分割要素Ri =[si-1,i )をi=0,1,・・・,Lについて求める(ステップS31)。次に、各カテゴリCk (k=1,・・・,K)に対する参照特徴射影の推定値Qk =[MINk ,MAXk ]を、特徴空間のボロノイ分割をもとに線形計画法を用いて求める(ステップS32)。
【0102】
次に、図17の候補カテゴリ集合生成処理と同様にして、各参照特徴分割要素Ri に対する候補カテゴリ集合Di を、推定値Qk (k=1,・・・,K)から求める(ステップS33)。そして、各参照特徴分割要素Ri と候補カテゴリ集合Di の組を候補テーブルに格納し(ステップS34)、処理を終了する。
【0103】
図19は、図18のステップS32における参照特徴射影の推定処理のフローチャートである。処理が開始されると、パターン認識装置は、まず、辞書に登録されたカテゴリCk に対する代表特徴ベクトルEk と、それ以外のカテゴリCj(j=1,・・・,K;j≠k)に対する代表特徴ベクトルEj とから等距離にある平面(等距離面)の方程式を求める(ステップS41)。ただし、特徴空間はN次元空間であるものとする。
【0104】
特徴空間における距離としてユークリッド距離を用いる場合には、ボロノイ分割Vk は特徴空間内の超凸多面体となり、複数の超平面により囲まれた特徴空間内の部分集合であるといえる。したがって、2つの代表ベクトルからの等距離面である超平面は、それぞれ、特徴ベクトルf=(f1 ,f2 ,・・・,fN )を変数とする線形方程式で記述される。
【0105】
次に、得られた超平面の方程式を用いて、カテゴリCk に対するボロノイ分割Vk の満たす連立線形不等式を求める(ステップS42)。この連立線形不等式は、例えば、次式のように記述される。
【0106】
【数1】
Figure 0003943223
【0107】
次に、特徴ベクトルfとある方向ベクトルh=(h1 ,h2 ,・・・,hN )との内積を、1次元の参照特徴ベクトル(参照特徴)rとする(ステップS43)。このとき、
r=h1 1 +h2 2 +・・・+hN N
となり、参照特徴rは、特徴ベクトルfの各要素の線形結合で表現される。
【0108】
したがって、参照特徴射影Qk を求める問題は、上記連立線形不等式を満たすような線形結合rの最小値・最大値を求める線形計画問題に帰着される。この問題は、公知の線形計画法で解くことができる。
【0109】
そこで、線形計画法を用いて、得られた連立不等式の制約のもとで、参照特徴rの最小値MINk と最大値MAXk を求め(ステップS44)、閉区間[MINk ,MAXk ]を参照特徴射影の推定値Qk として(ステップS45)、図18の処理に戻る。
【0110】
ここでは、推定処理に線形計画法を用いるものとしたが、より一般的には、非線形計画法を用いて、1次元区間の最小値・最大値を求めることができる。この場合は、特徴ベクトルの要素からある非線形関数Rにより得られる次のような値を、参照特徴rとする。
r=R(f1 ,f2 ,・・・,fN
このとき、ボロノイ分割は特徴空間内の超凸曲面で囲まれた特徴空間内の部分集合となる。したがって、文字カテゴリCk に対するボロノイ分割Vk は、次のような連立非線形不等式により記述できる。
【0111】
【数2】
Figure 0003943223
【0112】
したがって、参照特徴射影Qk を求める問題は、上記連立不等式を満たすような参照特徴rの最小値・最大値を求める非線形計画問題に帰着される。非線形計画問題のコンピュータによる数値計算手法は数理計画法の一分野として広く知られており、それを用いてこの問題を解くことができる。
【0113】
以上説明した実施形態においては、候補カテゴリを求めるために1種類の参照特徴ベクトルを用いているが、1つの特徴ベクトルから計算される複数の参照特徴ベクトルを用いて、対応する複数の候補カテゴリ集合を求め、それらの論理積を出力する構成も考えられる。
【0114】
この場合、様々な参照特徴ベクトルに対応する複数の候補テーブルを用意し、各候補テーブル毎に候補カテゴリ計算部を設ける。各候補カテゴリ計算部は、特定の種類の参照特徴ベクトルの値を入力とし、対応する候補テーブルを参照して、対応する候補カテゴリ集合を出力する。さらに、これらの候補カテゴリ集合の論理積を計算する候補カテゴリ絞り込み部を設け、候補カテゴリ集合を段階的に絞り込んで出力する。
【0115】
図20は、2種類の参照特徴ベクトルを用いて、2段階の候補カテゴリ計算を実行する第4のパターン認識装置の構成図である。図20のパターン認識装置は、参照特徴ベクトル計算部81、候補テーブル82、83、候補カテゴリ計算部84、85、および候補カテゴリ絞り込み部86を備える。
【0116】
参照特徴ベクトル計算部81は、入力されたN次元の特徴ベクトルfから、2つの参照特徴ベクトルr1 ,r2 を計算する。第1段階の候補カテゴリ計算部84は、参照特徴ベクトルr1 を入力とし、あらかじめ保持された候補テーブル82を用いて、候補カテゴリ集合D1 (r1 )を出力する。また、第2段階の候補カテゴリ計算部85は、参照特徴ベクトルr2 を入力とし、あらかじめ保持された候補テーブル83を用いて、候補カテゴリ集合D2 (r2 )を出力する。
【0117】
候補カテゴリ絞り込み部86は、2つの候補カテゴリ集合D1 (r1 ),D2(r2 )を入力として、それらの積集合D1 (r1 )∩D2 (r2 )を求め、それを最終的な候補カテゴリ集合として出力する。
【0118】
参照特徴ベクトル計算部81は、例えば、特徴ベクトルfの第1の要素f1 を1次元の参照特徴ベクトルr1 として、特徴ベクトルfの第2の要素f2 を1次元の参照特徴ベクトルr2 として出力する。各参照特徴ベクトルのとり得る値の範囲をA1 ≦r1 <B1 ,A2 ≦r2 <B2 とすると、区間[A1 ,B1 )が第1の参照特徴空間、区間[A2 ,B2 )が第2の参照特徴空間となる。
【0119】
ここでは、候補テーブルの要素となる参照特徴分割要素として、各参照特徴空間を格子状に分割したものを用いることにする。参照特徴空間[A1 ,B1 )および[A2 ,B2 )はともに1次元であるから、それらを、それぞれ次のようにL1 個、L2 個の区間に分割し、各区間を参照特徴分割要素とする。
1 =s0 <s1 <s2 <・・・<sL1=B1
2 =t0 <t1 <t2 <・・・<tL2=B2
これにより、参照特徴空間[A1 ,B1 )のそれぞれの区間[si-1 ,si )が、参照特徴ベクトルr1 に対する参照特徴分割要素R1iとなる。ここで、i=1,・・・,L1 である。また、参照特徴空間[A2 ,B2 )のそれぞれの区間[tj-1 ,tj )が、参照特徴ベクトルr2 に対する参照特徴分割要素R2jとなる。ここで、j=1,・・・,L2 である。
【0120】
それぞれの参照特徴分割要素R1iあるいはR2jに対する候補カテゴリ集合は、学習用特徴ベクトル集合を用いて各カテゴリに対する参照特徴射影を推定することにより求められる。学習用特徴ベクトル集合は、各カテゴリに属する特徴ベクトルを十分な数だけ含んでいるものとする。特定のカテゴリCk に対する参照特徴射影の推定方法は、以下の通りである。
【0121】
まず、学習用特徴ベクトル集合に属するカテゴリCk に対する特徴ベクトルの集合から、特徴ベクトルの第1の要素f1 の集合F1kを求める。この集合F1kは、カテゴリCk の第1の参照特徴射影を近似する分布を形成する。この集合F1kの要素の最小値MIN(F1k)および最大値MAX(F1k)を求め、さらに特定のマージンMを考慮して、カテゴリCk の第1の参照特徴射影の推定値Q1kを、Q1k=[MIN(F1k)−M,MAX(F1k)+M]
とする。
【0122】
第2の参照特徴射影の推定も同様にして行う。まず、学習用特徴ベクトル集合に属するカテゴリCk に対する特徴ベクトルの集合から、特徴ベクトルの第2の要素f2 の集合F2kを求める。この集合F2kは、カテゴリCk の第2の参照特徴射影を近似する分布を形成する。この集合F2kの要素の最小値MIN(F2k)および最大値MAX(F2k)を求め、さらに特定のマージンMを考慮して、カテゴリCk の第2の参照特徴射影の推定値Q2kを、
2k=[MIN(F2k)−M,MAX(F2k)+M]
とする。
【0123】
そして、このようにして得られた参照特徴分割要素R1i,R2jと、各カテゴリCk に対する参照特徴射影Q1k,Q2kとを用いて、参照特徴分割要素R1i,R2jとそれぞれ組にすべき候補カテゴリ集合D1 (r1 )=D1i,D2 (r2 )=D2jを、次のようにして求める。
【0124】
参照特徴分割要素R1iと、対応する参照特徴射影Q1kが共通部分を持つようなカテゴリCk の集合を、その参照特徴分割要素R1iに対する候補カテゴリ集合D1iとする。これにより、参照特徴分割要素R1iに属する参照特徴ベクトルの値を持つ特徴ベクトルが属する可能性のあるカテゴリを列挙したものが、候補カテゴリ集合D1iとなる。
【0125】
同様にして、参照特徴分割要素R2jと、対応する参照特徴射影Q2kが共通部分を持つようなカテゴリCk の集合を、その参照特徴分割要素R2jに対する候補カテゴリ集合D2jとする。これにより、参照特徴分割要素R2jに属する参照特徴ベクトルの値を持つ特徴ベクトルが属する可能性のあるカテゴリを列挙したものが、候補カテゴリ集合D2jとなる。
【0126】
候補カテゴリ計算部84が参照する候補テーブル82は、参照特徴分割要素R1iと候補カテゴリ集合D1iの組により構成される。同様にして、候補カテゴリ計算部85が参照する候補テーブル83は、参照特徴分割要素R2jと候補カテゴリ集合D2jの組により構成される。
【0127】
候補カテゴリ計算部84は、与えられた参照特徴ベクトルの値がr1 である場合、まず、この値r1 の属する参照特徴分割要素R1iを求める。次に、候補テーブル82を用いて、参照特徴分割要素R1iに対応する候補カテゴリ集合D1iを求めて、それを出力する。出力された候補カテゴリ集合D1iには、入力特徴ベクトルの属するカテゴリが含まれていることが期待できる。
【0128】
同様にして、候補カテゴリ計算部85は、与えられた参照特徴ベクトルの値がr2 である場合、まず、この値r2 の属する参照特徴分割要素R2jを求める。次に、候補テーブル83を用いて、参照特徴分割要素R2jに対応する候補カテゴリ集合D2jを求めて、それを出力する。出力された候補カテゴリ集合D2jには、入力特徴ベクトルの属するカテゴリが含まれていることが期待できる。
【0129】
そして、候補カテゴリ絞り込み部86は、2つの候補カテゴリ集合D1i,D2jの積集合D1i∩D2jを求めて、それを最終的な候補カテゴリ集合とする。候補カテゴリ絞り込み部86から出力された候補カテゴリ集合には、入力特徴ベクトルの属するカテゴリが依然属していると推定でき、かつ、その要素数は元の2つの候補カテゴリ集合D1i,D2jよりも少なくなっている。したがって、候補カテゴリ絞り込み部86は、候補カテゴリ集合を段階的に絞り込む役割を果たしていることが分かる。
【0130】
このようなパターン認識装置によれば、1次元の参照特徴ベクトルを2つ用いているために、1次元の参照特徴ベクトルが1つの場合より、候補カテゴリ数を減らすことができる。また、2次元の参照特徴ベクトルを1つ用いる場合に比べて、参照特徴分割要素の数が大幅に低減されるため、候補テーブルを保持するために必要な記憶容量を節約することができる。
【0131】
このように、比較的低次元の参照特徴ベクトルを複数用いることで、高精度かつ高速にパターン認識を実行するパターン認識装置を、十分実用的な記憶容量で実現することが可能である。このような複数の候補カテゴリ集合を求める処理は、逐次的に行ってもよいが、並列に行えばさらに処理時間が軽減される。
【0132】
ところで、本発明のパターン認識装置が認識精度をほとんど低下させないといえる理由を説明しておく。本発明による高速分類を行った後には、通常、元の特徴ベクトルの距離計算を用いた詳細分類をさらに行って、入力パターンのカテゴリを特定する。
【0133】
認識精度の低下がゼロであるとは、出力された候補カテゴリ集合の累積認識精度が、後段で行うであろう詳細分類の精度を保証する(落とさない)という意味である。ここで、累積認識精度とは、候補カテゴリ集合のどれか一つに入力パターンの真のカテゴリが含まれている確率を指す。したがって、理想的には、累積認識精度は常に100%であることが望ましい。
【0134】
実際には、出力された候補カテゴリ集合の累積認識精度が100%であることは必ずしも要求されず、後段で行われる詳細分類の精度以上であればよい。したがって、十分な数の候補カテゴリを含む候補カテゴリ集合を候補テーブルに登録しておくことで、実用上は精度低下がゼロであるようなパターン認識装置が実現される。
【0135】
もし、候補カテゴリ集合の中に真のカテゴリが存在しない場合、つまり分類誤りを起こした場合には、詳細分類でも同様の分類誤りを起こすであろうから、最終的な累積認識精度は変わらないと考えられる。この意味において、本発明による高速分類は、与えられた詳細分類の制約をうまく利用して、精度低下なしの高速化を実現している。
【0136】
本発明で用いる参照特徴ベクトルは、必ずしも上述したような特徴ベクトルの部分ベクトルである必要はなく、特徴ベクトルから計算可能な任意のベクトルを参照特徴ベクトルとして用いることができる。例えば、図23に示したパターン認識装置で用いている圧縮特徴ベクトルもその1つである。
【0137】
図21は、圧縮特徴ベクトルを参照特徴ベクトルとして候補カテゴリ集合を求め、それに対して詳細分類を行う第5のパターン認識装置の構成図である。図21のパターン認識装置は、特徴抽出部91、特徴圧縮部92、候補カテゴリ計算部93、詳細分類部94、候補テーブル95、および辞書96を備える。
【0138】
特徴抽出部91は、入力パターンから特徴ベクトルを抽出し、特徴圧縮部92は、特徴ベクトルに適当な変換を施して、次元数のより小さな圧縮特徴ベクトルを生成する。次に、候補カテゴリ計算部93は、候補テーブル95を参照して、与えられた圧縮特徴ベクトルに対応する候補カテゴリ集合を求める。
【0139】
詳細分類部94は、候補カテゴリ計算部93により出力された候補カテゴリ集合のそれぞれの候補カテゴリに対して、辞書96に保持された代表特徴ベクトルと、入力パターンの特徴ベクトルとの距離を計算する。そして、距離の小さな順に候補カテゴリを並び換えて、最短距離のものから指定された数だけのカテゴリの列を出力する。
【0140】
このようなパターン認識装置によれば、特徴圧縮に用いる変換を適当に選ぶことで、所望の参照特徴ベクトルを生成することができ、それに対応した候補テーブルを用いて、より効果的に候補カテゴリ集合を絞り込むことができる。また、特徴圧縮の結果得られた圧縮特徴ベクトルを直接用いて距離計算を行うのではなく、それを候補テーブルを引くための参照値として用いるため、原理的には処理精度の低下を招かない。
【0141】
次に、図22は、圧縮特徴ベクトルを参照特徴ベクトルとして候補カテゴリ集合を求め、それに対して大分類および詳細分類を行う第6のパターン認識装置の構成図である。図22のパターン認識装置は、特徴抽出部101、特徴圧縮部102、候補カテゴリ計算部103、大分類部104、詳細分類部105、候補テーブル106、圧縮特徴辞書107、および辞書108を備える。
【0142】
特徴抽出部101、特徴圧縮部102、候補カテゴリ計算部103、および候補テーブル106の機能については、それぞれ、図21の特徴抽出部91、特徴圧縮部92、候補カテゴリ計算部93、および候補テーブル95と同様である。
【0143】
大分類部104は、候補カテゴリ計算部103により出力された候補カテゴリ集合のそれぞれの候補カテゴリに対して、圧縮特徴辞書107に保持された圧縮特徴ベクトルと、入力パターンの圧縮特徴ベクトルとの距離を計算する。そして、距離の小さな順に候補カテゴリを並び換えて、最短距離のものから指定された数だけのカテゴリの列を候補カテゴリ集合として出力する。
【0144】
詳細分類部105は、大分類部104により出力された候補カテゴリ集合のそれぞれの候補カテゴリに対して、辞書108に保持された代表特徴ベクトルと、入力パターンの特徴ベクトルとの距離を計算する。そして、距離の小さな順に候補カテゴリを並び換えて、最短距離のものから指定された数だけのカテゴリの列を出力する。
【0145】
このようなパターン認識装置によれば、候補カテゴリ計算部103により出力された候補カテゴリ集合を、大分類部104がさらに絞り込んで詳細分類部105に渡すため、詳細分類の対象となる候補カテゴリがより限定され、処理が高速化される。
【0146】
図21および図22のパターン認識装置においては、圧縮特徴ベクトルをそのまま参照特徴ベクトルとしているが、代わりに圧縮特徴ベクトルの部分特徴ベクトルを参照特徴ベクトルとして用いてもよい。この場合、参照特徴ベクトルの次元数がさらに削減され、処理が高速化される。
【0147】
特徴ベクトルから圧縮特徴ベクトルを生成する変換としては、線形変換を用いることができる。線形変換は、変換行列とベクトルとの積という比較的単純な計算により特徴ベクトルを圧縮するため、非線形変換と比較して、計算効率が良い。線形変換を用いた特徴圧縮方法としては、正準判別分析、主成分分析等が知られている。
【0148】
正準判別分析では、カテゴリ毎に与えられたサンプルパターンのN次元の特徴ベクトルから、カテゴリ間分散行列とカテゴリ内分散行列を計算し、それらの分散行列を用いて固有ベクトルを求めておく。そして、それらのうちM個(M<N)の固有ベクトルを選択して、M次元の空間を定義する。未知のパターンが入力されると、その特徴ベクトルと各固有ベクトルの内積を計算し、それらの値を要素とするM次元の圧縮特徴ベクトルを生成する。
【0149】
この分析法では、カテゴリ間分散を大きくし、かつ、カテゴリ内分散を小さくするように、N次元の平均特徴ベクトルが、M個の固有ベクトルによって規定されるM本の座標軸へ射影される。これにより、特徴圧縮後のM次元の空間において、異なる種類のパターン同士は離れ、同じ種類のパターン同士は近付くような変換が行われる。
【0150】
一方、主成分分析では、各カテゴリが相互に離れるような主成分ベクトルの組が、各カテゴリ毎に計算される。そして、各カテゴリ毎に主成分ベクトルを座標軸とする個別の新たな空間が生成され、入力パターンの特徴ベクトルを各カテゴリの主成分ベクトルに射影することで、圧縮特徴ベクトルが生成される。入力パターンと各カテゴリとの距離は、圧縮特徴ベクトルを用いて計算される。
【0151】
この分析法によれば、特徴空間内の近接した領域で類似するカテゴリが存在するときに、認識対象パターンの特徴ベクトルをそれぞれのカテゴリに対応する主成分ベクトルに射影させることで、より正確な認識結果が得られる。この分析法は、主として、カテゴリが少なく似通った文字パターンの判別等に用いられている。
【0152】
以上説明した実施形態において、ボロノイ分割の生成処理、候補カテゴリの大分類処理および詳細分類処理では、ベクトル間の距離計算を必要とする。このとき、一般的なユークリッド距離のほかにも、任意の距離を定義して用いることが可能である。例えば、公知のシティブロック距離、マハラノビス距離、疑似マハラノビス距離、ベイズ識別関数(Bayes discriminant function )、疑似ベイズ識別関数(Modified Bayes discriminant function)等を用いてもよい。
【0153】
ここで、ベクトルg=(g1 ,g2 ,・・・,gn )とベクトルp=(p1 ,p2 ,・・・,pn )の間の各距離は、次のように定義される。
[シティブロック距離]
【0154】
【数3】
Figure 0003943223
【0155】
[マハラノビス距離]
m (g,p)=(g−p)T Σj -1(g−p)
ここで、pは特定のカテゴリの学習パターンpi (i=1,2,3,・・・,N)の平均であり、Σj -1は次式で定義される共分散行列(分散共分散行列ともいう)である。
Σj =(1/N)Σ(pi −p)(pi −p)T
Σj の固有値をλ1 ,λ2 ,・・・,λn (λ1 >λ2 >・・・>λn )とし、対応する固有ベクトルをそれぞれφ1 ,φ2 ,・・・,φn とし、
Φ=(φ1 ,φ2 ,・・・,φn
とすると、Dm (g,p)は、次のように書ける。
【0156】
【数4】
Figure 0003943223
【0157】
[疑似マハラノビス距離]
【0158】
【数5】
Figure 0003943223
【0159】
ただし、
λi =λ(一定) (m<<n, m+1≦i≦n)
この疑似マハラノビス距離は、マハラノビス距離の実用上の問題(計算量と計算精度)を解決するために提案されたものであり、後述する疑似ベイズ識別関数の考え方に基づくものである。
[ベイズ識別関数]
f(g)=(g−p)T Σ-1(g−p)+ln|Σ|
このベイズ識別関数(2次識別関数)はベクトルgとベクトルpの距離を表しており、対象が正規分布に従い、特徴ベクトルの平均と共分散行列が既知の場合、最適識別関数となる。
[疑似ベイズ識別関数]
【0160】
【数6】
Figure 0003943223
【0161】
この疑似ベイズ識別関数は、複雑な文字パターン等の識別において、高次の固有ベクトルに関する計算精度の問題を解決するために考え出された関数である。
これらの距離は、カテゴリ特徴集合が正規分布に従って分布しており、各カテゴリの出現確率が同一の場合を仮定している。各カテゴリの分布の共分散行列の行列式が同一の場合には、マハラノビス距離または疑似マハラノビス距離に基づいて詳細分類が行われ、それらが同一でない一般的な場合には、疑似ベイズ識別関数に基づいて詳細分類が行われる。
【0162】
また、本発明は、文字パターンのみならず、2次元図形、3次元物体、人間の顔の画像を含む任意のパターンを認識する技術に適用可能である。
【0163】
【発明の効果】
本発明によれば、任意のパターンの認識処理において候補テーブルを用いることで、認識精度の低下を最小限に抑えつつ、カテゴリ分類の高速化を果たすことができる。特に、詳細分類用の辞書に登録された各カテゴリと同様の分割に基づいて候補テーブルを作成すれば、詳細分類の精度を低下させないようにすることが可能である。
【図面の簡単な説明】
【図1】本発明のパターン認識装置の原理図である。
【図2】候補テーブルのレコードを示す図である。
【図3】カテゴリと参照特徴空間を示す図である。
【図4】情報処理装置の構成図である。
【図5】候補テーブルの構造を示す図である。
【図6】第1のパターン認識装置の構成図である。
【図7】第2のパターン認識装置の構成図である。
【図8】第1の参照特徴空間を示す図である。
【図9】第1の候補テーブルを示す図である。
【図10】第3のパターン認識装置の構成図である。
【図11】ボロノイ分割を示す図である。
【図12】第2の参照特徴空間を示す図である。
【図13】第3の参照特徴空間を示す図である。
【図14】第2の候補テーブルを示す図である。
【図15】学習パターンを用いた候補テーブル作成処理のフローチャートである。
【図16】学習パターンを用いた推定処理のフローチャートである。
【図17】候補カテゴリ集合生成処理のフローチャートである。
【図18】ボロノイ分割を用いた候補テーブル作成処理のフローチャートである。
【図19】ボロノイ分割を用いた推定処理のフローチャートである。
【図20】第4のパターン認識装置の構成図である。
【図21】第5のパターン認識装置の構成図である。
【図22】第6のパターン認識装置の構成図である。
【図23】従来のパターン認識装置の構成図である。
【符号の説明】
1、51、61、91、101 特徴抽出部
2、92、102 特徴圧縮部
3、104 大分類部
4、107 圧縮特徴辞書
11 テーブル記憶手段
12 候補カテゴリ計算手段
13、41、53、64、82、83、95、106 候補テーブル
21、54、71、73 特徴空間
22、55、72、74 参照特徴空間
31 CPU
32 メモリ
33 入力装置
34 出力装置
35 外部記憶装置
36 媒体駆動装置
37 ネットワーク接続装置
38 光電変換装置
39 バス
40 可搬記録媒体
40′ 外部の装置
42、52、62、84、85、93、103 候補カテゴリ計算部
63、94、105 詳細分類部
65、96、108 辞書
81 参照特徴ベクトル計算部
86 候補カテゴリ絞り込み部

Claims (28)

  1. パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、該参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルを記憶するテーブル記憶手段と、
    与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、前記候補テーブルを用いて、得られた参照特徴分割要素に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合を出力する候補カテゴリ計算手段とを備え
    学習用パターン集合から得られる参照特徴ベクトルの値の分布を用いて、各カテゴリに対応する特徴ベクトルの集合を前記参照特徴空間へ射影したときの射影範囲の推定を行い、得られた推定値を用いて、前記候補テーブルが作成されることを特徴とするパターン認識装置。
  2. パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、該参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルを記憶するテーブル記憶手段と、
    与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、前記候補テーブルを用いて、得られた参照特徴分割要素に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合を出力する候補カテゴリ計算手段とを備え、
    辞書に登録されている各カテゴリの代表特徴ベクトルに基づく特徴空間のボロノイ分割要素を、前記参照特徴空間へ射影したときの射影範囲の推定を行い、得られた推定値を用いて、前記候補テーブルが作成されることを特徴とするパターン認識装置。
  3. 前記パターンの特徴ベクトルから前記参照特徴ベクトルを計算する参照特徴ベクトル計算手段をさらに備えることを特徴とする請求項1または2記載のパターン認識装置。
  4. 前記参照特徴ベクトル計算手段は、前記パターンの特徴ベクトルの1つ以上の部分特徴ベクトルを、1つ以上の参照特徴ベクトルとして出力することを特徴とする請求項記載のパターン認識装置。
  5. 前記テーブル記憶手段は、前記参照特徴空間を格子状に区切って得られる前記参照特徴分割要素の情報を保持することを特徴とする請求項1または2記載のパターン認識装置。
  6. 前記候補テーブルは、前記参照特徴分割要素と前記推定値の共通部分が存在するとき、該推定値に対応するカテゴリを、該参照特徴分割要素に対応する候補カテゴリ集合の要素として、作成されることを特徴とする請求項1または2記載のパターン認識装置。
  7. 前記候補テーブルは、各カテゴリに対応する1次元の参照特徴空間への射影の推定値として、1次元の参照特徴ベクトルの値の最小値および最大値を求めることで、作成されることを特徴とする請求項1または2記載のパターン認識装置。
  8. 前記候補テーブルは、前記ボロノイ分割要素の満たす連立線形不等式を用いて求められた前記推定値に基づいて、作成されることを特徴とする請求項記載のパターン認識装置。
  9. 前記候補テーブルは、前記ボロノイ分割要素の満たす連立非線形不等式を用いて求められた前記推定値に基づいて、作成されることを特徴とする請求項記載のパターン認識装置。
  10. 入力パターンから前記パターンの特徴ベクトルを生成する特徴抽出手段をさらに備えることを特徴とする請求項1または2記載のパターン認識装置。
  11. 各カテゴリの代表特徴ベクトルを登録した詳細分類辞書を記憶する辞書記憶手段と、前記候補カテゴリ集合に含まれる各候補カテゴリの代表特徴ベクトルを前記詳細分類辞書を用いて求め、該候補カテゴリの代表特徴ベクトルと前記パターンの特徴ベクトルとの距離を求め、該距離の小さな順に所定数の候補カテゴリを出力する詳細分類手段とをさらに備えることを特徴とする請求項1または2記載のパターン認識装置。
  12. 前記パターンの特徴ベクトルにあらかじめ決められた変換を施して、次元数のより小さな圧縮特徴ベクトルを生成する特徴圧縮手段をさらに備え、前記候補カテゴリ計算手段は、与えられた圧縮特徴ベクトルの値から計算される前記参照特徴ベクトルの値を用いて、前記候補カテゴリ集合を求めることを特徴とする請求項1または2記載のパターン認識装置。
  13. 前記候補カテゴリ計算手段は、前記圧縮特徴ベクトルの部分特徴ベクトルを前記参照特徴ベクトルとして用いることを特徴とする請求項12記載のパターン認識装置。
  14. 各カテゴリの圧縮特徴ベクトルを登録した圧縮特徴辞書を記憶する辞書記憶手段と、前記候補カテゴリ集合に含まれる各候補カテゴリの圧縮特徴ベクトルを前記圧縮特徴辞書を用いて求め、該候補カテゴリの圧縮特徴ベクトルと前記特徴圧縮手段から出力される圧縮特徴ベクトルとの距離を求め、該距離の小さな順に所定数の候補カテゴリを出力する大分類手段とをさらに備えることを特徴とする請求項12記載のパターン認識装置。
  15. 前記大分類手段は、前記距離の定義として、ユークリッド距離、シティブロック距離、マハラノビス距離、疑似マハラノビス距離、ベイズ識別関数、および疑似ベイズ識別関数のうちの1つを用いることを特徴とする請求項14記載のパターン認識装置。
  16. 各カテゴリの代表特徴ベクトルを登録した詳細分類辞書を記憶する辞書記憶手段と、前記大分類手段により出力される各候補カテゴリの代表特徴ベクトルを前記詳細分類辞書を用いて求め、該候補カテゴリの代表特徴ベクトルと前記パターンの特徴ベクトルとの距離を求め、該距離の小さな順に所定数の候補カテゴリを出力する詳細分類手段とをさらに備えることを特徴とする請求項14記載のパターン認識装置。
  17. 前記詳細分類手段は、前記距離の定義として、ユークリッド距離、シティブロック距離、マハラノビス距離、疑似マハラノビス距離、ベイズ識別関数、および疑似ベイズ識別関数のうちの1つを用いることを特徴とする請求項16記載のパターン認識装置。
  18. 前記特徴圧縮手段は、線形変換を用いて前記圧縮特徴ベクトルを生成することを特徴とする請求項12記載のパターン認識装置。
  19. 前記特徴圧縮手段は、特徴空間の主成分分析により前記線形変換を求めることを特徴とする請求項18記載のパターン認識装置。
  20. 前記特徴圧縮手段は、特徴空間の正準判別分析により前記線形変換を求めることを特徴とする請求項18記載のパターン認識装置。
  21. 前記パターンは、文字、人間の顔、3次元物体、および2次元図形のうち少なくとも1つの情報に対応することを特徴とする請求項1または2記載のパターン認識装置。
  22. パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、該参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルをそれぞれ記憶する複数のテーブル記憶手段と、
    前記複数のテーブル記憶手段のそれぞれに対応して設けられ、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、前記候補テーブルを用いて、得られた参照特徴分割要素に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合をそれぞれ出力する複数の候補カテゴリ計算手段と、
    前記複数の候補カテゴリ計算手段から出力された複数の候補カテゴリ集合を絞り込んで出力するカテゴリ絞り込み手段とを備え
    学習用パターン集合から得られる参照特徴ベクトルの値の分布を用いて、各カテゴリに対応する特徴ベクトルの集合を前記参照特徴空間へ射影したときの射影範囲の推定を行い、得られた推定値を用いて、前記候補テーブルが作成されることを特徴とするパターン認識装置。
  23. パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、該参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルをそれぞれ記憶する複数のテーブル記憶手段と、
    前記複数のテーブル記憶手段のそれぞれに対応して設けられ、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、前記候補テーブルを用いて、得られた参照特徴分割要素に対応する候補カテゴリ集合を求め、得られた候補カテゴリ集合をそれぞれ出力する複数の候補カテゴリ計算手段と、
    前記複数の候補カテゴリ計算手段から出力された複数の候補カテゴリ集合を絞り込んで出力するカテゴリ絞り込み手段とを備え、
    辞書に登録されている各カテゴリの代表特徴ベクトルに基づく特徴空間のボロノイ分割要素を、前記参照特徴空間へ射影したときの射影範囲の推定を行い、得られた推定値を用いて、前記候補テーブルが作成されることを特徴とするパターン認識装置。
  24. 前記カテゴリ絞り込み手段は、複数の候補カテゴリ集合の論理積を計算して、該複数の候補カテゴリ集合を絞り込むことを特徴とする請求項22または23記載のパターン認識装置。
  25. コンピュータのためのプログラムを記録した記録媒体であって、
    パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求める機能と、
    学習用パターン集合から得られる参照特徴ベクトルの値の分布を用いて、各カテゴリに対応する特徴ベクトルの集合を前記参照特徴空間へ射影したときの射影範囲の推定を行うことで、得られた推定値を用いて作成され、参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルを用いて、前記与えられた参照特徴ベクトルの値を含む参照特徴分割要素に対応する候補カテゴリ集合を求める機能と、
    得られた候補カテゴリ集合を出力する機能と
    を前記コンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  26. コンピュータのためのプログラムを記録した記録媒体であって、
    パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求める機能と、
    辞書に登録されている各カテゴリの代表特徴ベクトルに基づく特徴空間のボロノイ分割要素を、前記参照特徴空間へ射影したときの射影範囲の推定を行うことで、得られた推定値を用いて作成され、参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルを用いて、前記与えられた参照特徴ベクトルの値を含む参照特徴分割要素に対応する候補カテゴリ集合を求める機能と、
    得られた候補カテゴリ集合を出力する機能と
    を前記コンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  27. パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、
    学習用パターン集合から得られる参照特徴ベクトルの値の分布を用いて、各カテゴリに対応する特徴ベクトルの集合を前記参照特徴空間へ射影したときの射影範囲の推定を行うことで、得られた推定値を用いて作成され、参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルを用いて、前記与えられた参照特徴ベクトルの値を含む参照特徴分割要素に対応する候補カテゴリ集合を求め、
    得られた候補カテゴリ集合を出力する
    ことを特徴とするパターン認識方法。
  28. パターンの特徴ベクトルから計算される参照特徴ベクトルの値の集合から成る参照特徴空間を2つ以上に分割して得られる各部分集合を参照特徴分割要素として、与えられた参照特徴ベクトルの値を含む参照特徴分割要素を求め、
    辞書に登録されている各カテゴリの代表特徴ベクトルに基づく特徴空間のボロノイ分割要素を、前記参照特徴空間へ射影したときの射影範囲の推定を行うことで、得られた推定値を用いて作成され、参照特徴分割要素と候補カテゴリ集合の組の情報を含む候補テーブルを用いて、前記与えられた参照特徴ベクトルの値を含む参照特徴分割要素に対応する候補カテゴリ集合を求め、
    得られた候補カテゴリ集合を出力する
    ことを特徴とするパターン認識方法。
JP02794098A 1997-02-12 1998-02-10 候補テーブルを用いて分類を行うパターン認識装置および方法 Expired - Fee Related JP3943223B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02794098A JP3943223B2 (ja) 1997-02-12 1998-02-10 候補テーブルを用いて分類を行うパターン認識装置および方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2752197 1997-02-12
JP9-27521 1997-02-12
JP02794098A JP3943223B2 (ja) 1997-02-12 1998-02-10 候補テーブルを用いて分類を行うパターン認識装置および方法

Publications (2)

Publication Number Publication Date
JPH10289320A JPH10289320A (ja) 1998-10-27
JP3943223B2 true JP3943223B2 (ja) 2007-07-11

Family

ID=26365447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02794098A Expired - Fee Related JP3943223B2 (ja) 1997-02-12 1998-02-10 候補テーブルを用いて分類を行うパターン認識装置および方法

Country Status (1)

Country Link
JP (1) JP3943223B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004042539A2 (en) * 2002-11-07 2004-05-21 Honda Motor Co., Ltd. Video-based face recognition using probabilistic appearance manifolds
WO2005069213A1 (ja) * 2004-01-13 2005-07-28 Nec Corporation 特徴変化画像作成方法、特徴変化画像作成装置および特徴変化画像作成プログラム
DE602005026661D1 (de) 2004-07-09 2011-04-14 Nippon Telegraph & Telephone Ur detektion eines bildsignals
JP4514680B2 (ja) * 2005-09-12 2010-07-28 株式会社東芝 パターン認識装置およびその方法
JP4771887B2 (ja) * 2006-08-09 2011-09-14 ▲うぇ▼▲ちん▼科技股▲ふん▼有限公司 受動式及びインタラクティブ式の即時影像認識方法
WO2009013818A1 (ja) 2007-07-25 2009-01-29 Fujitsu Limited 文字認識処理方法及び装置
JP4844606B2 (ja) * 2008-09-11 2011-12-28 富士ゼロックス株式会社 画像分類装置及びプログラム
JP5521497B2 (ja) * 2009-11-05 2014-06-11 富士通株式会社 パターン認識装置、パターン認識プログラム、パターン認識方法

Also Published As

Publication number Publication date
JPH10289320A (ja) 1998-10-27

Similar Documents

Publication Publication Date Title
KR100263808B1 (ko) 후보테이블을이용하여분류를행하는패턴인식장치및방법
Jégou et al. On the burstiness of visual elements
US20180336405A1 (en) Method of digitizing and extracting meaning from graphic objects
JP3815704B2 (ja) 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
JP5565190B2 (ja) 学習モデル作成プログラム、画像識別情報付与プログラム、学習モデル作成装置及び画像識別情報付与装置
JP4332129B2 (ja) 文書分類プログラム、文書分類方法および文書分類装置
EP1418507A2 (en) Method and system for multiple cue integration
CN113378710B (zh) 图像文件的版面分析方法、装置、计算机设备和存储介质
Guillamet et al. Evaluation of distance metrics for recognition based on non-negative matrix factorization
JP3943223B2 (ja) 候補テーブルを用いて分類を行うパターン認識装置および方法
US5696844A (en) Outline pattern data extraction device for extracting outline pattern of a pattern distribution in a multi-dimensional feature vector space and its applications
Luo et al. Tree-structured nuclear norm approximation with applications to robust face recognition
JP3475886B2 (ja) パターン認識装置及び方法並びに記録媒体
CN112001231A (zh) 加权多任务稀疏表示的三维人脸识别方法、系统及介质
CN111461257B (zh) 一种流形空间中多视点视频的共享-差异表示及聚类方法
Zhang et al. A new approach of color image quantization based on Normalized Cut algorithm
CN117217172B (zh) 表格信息获取方法、装置、计算机设备、存储介质
JP5083162B2 (ja) 画像データ判定装置、画像データ判定システム、及びプログラム
CN110569386A (zh) 基于手绘草图集成描述子的三维模型检索方法
CN111062419B (zh) 一种深度学习数据集的压缩和恢复方法
CN117408259B (zh) 一种信息提取方法、装置、计算机设备和存储介质
Fang et al. Optimization strategy of computer programming for mathematical algorithm of facial recognition model
Feng et al. The framework of learnable kernel function and its application to dictionary learning of SPD data
Bouchaffra et al. Exploring topological data analysis for information extraction: application to recognition of Arabic machine-printed numerals
CN111597375A (zh) 基于相似图片组代表特征向量的图片检索方法及相关设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070405

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130413

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140413

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees