JP2002259911A - パターン認識装置、パターン認識方法及びプログラム - Google Patents
パターン認識装置、パターン認識方法及びプログラムInfo
- Publication number
- JP2002259911A JP2002259911A JP2001058107A JP2001058107A JP2002259911A JP 2002259911 A JP2002259911 A JP 2002259911A JP 2001058107 A JP2001058107 A JP 2001058107A JP 2001058107 A JP2001058107 A JP 2001058107A JP 2002259911 A JP2002259911 A JP 2002259911A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- dimensional
- pattern
- learning
- dimensional feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
習パターンからn次元特徴を抽出する。特徴選択部10
3は、非線形関数によってn次元特徴からh次元特徴を
選択する第1次特徴変換部110と、線形関数もしくは
非線形関数によってh次元特徴からm次元特徴を選択す
る第2次特徴変換部111とからなる。認識辞書106
はm次元参照パターンの集合からなる。識別部105
は、m次元参照パターンと入力パターンのm次元特徴と
を照合して入力パターンの認識結果を出力する。認識辞
書修正部108は、辞書学習時に認識辞書106を修正
し、特徴選択辞書修正部109は、辞書学習時に特徴選
択辞書を修正する。
Description
識等を行うためのパターン認識装置、パターン認識方法
及びプログラムに関するものである。
象となる入力パターンから特徴ベクトルを選択する特徴
選択部と、選択された特徴ベクトルと予め用意された参
照ベクトルとを照合してパターン認識を行う識別部とを
有していた。従来のパターン認識装置では、この特徴選
択部と識別部とを独立に設計することが多かったが、近
年これらを同時に学習させることにより、より少ない計
算量で同等以上のパターン認識性能を実現した報告例が
ある。
(以下、文献(イ)と呼ぶ)に開示されたパターン認識
装置によれば、入力パターンから抽出した原特徴の次元
数をn、このn次元特徴から選択した特徴の次元数をm
とすると、n次元特徴からm次元特徴への線形変換のた
めの特徴変換辞書であるm×n行列の各係数と、認識の
ための参照ベクトルとを最急降下法を用いて同時に学習
させることにより、部分空間法よりも遙かに少ない計算
量で同等以上の認識性能を実現することができる。
適用し、認識性能の向上を確認した例(以下、文献
(ロ)と呼ぶ)が、電子情報通信学会英論文誌1999
年3月号687〜692頁(FEATURE TRANSFORMATION W
ITH GENERALIZED LEARNING VECTOR QUANTIZATION FOR H
AND-WRITTEN CHINESE CHARACTER RECOGNITION, IEICE T
RANS. INF. & SYST., VOL.E82-D, NO.3, pp.687-692, M
ARCH 1999 )で報告されている。
ターンと特徴選択辞書とを同時に修正する機能を持った
従来のパターン認識装置では、n次元特徴からm次元特
徴への特徴選択を実行する特徴選択部において線形変換
を用いる方法しか開示されておらず、このことが更なる
認識精度向上を妨げる要因となっていた。本発明は、上
記課題を解決するためになされたもので、特徴選択部の
特徴選択機能を非線形変換に拡張することにより、より
少ない次元数の特徴で高い認識精度を実現可能なパター
ン認識装置、パターン認識方法及びプログラムを提供す
ることを目的とする。
置は、認識対象となる入力パターン又は辞書学習のため
の学習パターンからn(nは正の整数)次元特徴を抽出
する特徴抽出部(102)と、特徴選択のための関数が
記述された特徴選択辞書(104)と、前記抽出された
n次元特徴から前記特徴選択辞書に基づいてm(mは正
の整数、m<n)次元特徴を選択する特徴選択部(10
3)と、パターン認識のために予め用意されたm次元参
照パターンの集合からなる認識辞書(106)と、前記
m次元参照パターンと前記入力パターンのm次元特徴と
を照合して、前記入力パターンの認識結果を出力する識
別部(105)とを有し、前記特徴選択部は、非線形な
入出力応答を有するh(hは正の整数)個の微分可能な
関数によって前記n次元特徴からh次元特徴を選択する
第1次特徴変換部(110)と、微分可能なm個の線形
関数もしくは非線形関数によって前記h次元特徴から前
記m次元特徴を選択する第2次特徴変換部(111)と
からなり、前記特徴選択辞書は、前記第1次特徴変換部
で必要とされる非線形関数が記述された第1の特徴変換
係数集合(112)と、前記第2次特徴変換部で必要と
される線形関数もしくは非線形関数が記述された第2の
特徴変換係数集合(113)とからなるものである。入
力パターン及び学習パターンとしては、例えば文字パタ
ーンがある。また、本発明のパターン認識装置は、辞書
学習時に前記認識辞書を修正する認識辞書修正部(10
8)と、辞書学習時に前記特徴選択辞書を修正する特徴
選択辞書修正部(109)とを有し、前記認識辞書修正
部は、前記学習パターンのm次元特徴と前記m次元参照
パターンとを照合し、前記学習パターンと同じカテゴリ
に属するm次元参照パターンと前記学習パターンのm次
元特徴との距離が減少し、かつ前記学習パターンと異な
るカテゴリに属するm次元参照パターンのうち前記m次
元特徴の最近傍に存在するm次元参照パターンと前記学
習パターンのm次元特徴との距離が増加するように前記
認識辞書を修正し、前記特徴選択辞書修正部は、前記学
習パターンと同じカテゴリに属するm次元参照パターン
と前記学習パターンのm次元特徴との距離が減少し、か
つ前記学習パターンと異なるカテゴリに属するm次元参
照パターンと前記学習パターンのm次元特徴との距離が
増加するように前記第1の特徴変換係数集合及び前記第
2の特徴変換係数集合を修正するものである。
例において、前記特徴選択部の第1次特徴変換部は、前
記n次元特徴と前記第1の特徴変換係数集合との積和演
算を行う第1の積和演算部と、この第1の積和演算部の
出力を非線形な入出力応答特性を有する単調関数によっ
て変換する非線形変換部とからなり、前記特徴選択部の
第2次特徴変換部は、前記h次元特徴と前記第2の特徴
変換係数集合との積和演算を行う第2の積和演算部から
なるものである。また、本発明のパターン認識装置の1
構成例において、前記特徴選択辞書修正部は、前記学習
パターンから抽出される前記n次元特徴を主成分分析も
しくは正準判別分析して得られる軸のなかからh個を抽
出して前記第1の特徴変換係数集合の初期値とし、前記
学習パターンから抽出される前記m次元特徴のk次元目
の値xk (k=1,2,3,...,m)と前記h次元
特徴のk次元目の値zk との関係がxk=zkとなるよう
な係数を前記第2の特徴変換係数集合の初期値とし、前
記認識辞書修正部は、前記学習パターンから抽出される
n次元特徴の平均値をカテゴリ毎に求め、この平均値を
前記第1の特徴変換係数集合の初期値を用いてh次元に
変換し、このh次元に変換した値を前記第2の特徴変換
係数集合の初期値を用いてm次元に変換した値を各カテ
ゴリの前記m次元参照パターンの初期値とするものであ
る。
学習時に、辞書学習のための学習パターンからn(nは
正の整数)次元特徴を抽出する学習パターン特徴抽出手
順(S502)と、非線形な入出力応答を有するh(h
は正の整数)個の微分可能な非線形関数が記述された第
1の特徴変換係数集合に基づいて、前記学習パターンの
n次元特徴からh次元特徴を選択する学習パターンh次
元特徴選択手順(S503)と、微分可能なm個の線形
関数もしくは非線形関数が記述された第2の特徴変換係
数集合に基づいて、前記学習パターンのh次元特徴から
m(mは正の整数、m<n)次元特徴を選択する学習パ
ターンm次元特徴選択手順(S504)と、前記m次元
特徴とパターン認識のために予め用意された認識辞書中
のm次元参照パターンとを照合し、前記学習パターンと
同じカテゴリに属するm次元参照パターンと前記m次元
特徴との距離が減少し、かつ前記学習パターンと異なる
カテゴリに属するm次元参照パターンのうち前記m次元
特徴の最近傍に存在するm次元参照パターンと前記m次
元特徴との距離が増加するように前記認識辞書を修正す
る認識辞書修正手順(S505)と、前記学習パターン
と同じカテゴリに属するm次元参照パターンと前記m次
元特徴との距離が減少し、かつ前記学習パターンと異な
るカテゴリに属するm次元参照パターンと前記m次元特
徴との距離が増加するように前記第1の特徴変換係数集
合及び前記第2の特徴変換係数集合を修正する特徴選択
辞書修正手順(S506)とを実行するようにしたもの
である。また、本発明のパターン認識方法は、パターン
認識時に、認識対象となる入力パターンからn次元特徴
を抽出する入力パターン特徴抽出手順(S904)と、
非線形な入出力応答を有するh個の微分可能な非線形関
数が記述された第1の特徴変換係数集合に基づいて、前
記入力パターンのn次元特徴からh次元特徴を選択する
入力パターンh次元特徴選択手順(S905)と、微分
可能なm個の線形関数もしくは非線形関数が記述された
第2の特徴変換係数集合に基づいて、前記入力パターン
のh次元特徴からm次元特徴を選択する入力パターンm
次元特徴選択手順(S906)と、パターン認識のため
に予め用意されたm次元参照パターンの集合からなる認
識辞書と前記入力パターンのm次元特徴とを照合して認
識結果を出力する識別手順(S907,S908)とを
実行するようにしたものである。
例として、前記学習パターンh次元特徴選択手順及び前
記入力パターンh次元特徴選択手順は、前記第1の特徴
変換係数集合を構成するh組の変換係数と前記n次元特
徴との積和演算をそれぞれ行い、その各出力を非線形な
入出力応答特性を有する単調関数によって変換して前記
h次元特徴を選択し、前記学習パターンm次元特徴選択
手順及び前記入力パターンm次元特徴選択手順は、前記
第2の特徴変換係数集合を構成するm組の変換係数と前
記h次元特徴との積和演算をそれぞれ行って前記m次元
特徴を選択するようにしたものである。また、本発明の
パターン認識方法の1構成例は、前記学習パターンから
抽出される前記n次元特徴を主成分分析もしくは正準判
別分析して得られる軸のなかからh個を抽出して前記第
1の特徴変換係数集合の初期値とし、前記学習パターン
から抽出される前記m次元特徴のk次元目の値xk (k
=1,2,3,...,m)と前記h次元特徴のk次元
目の値zk との関係がxk=zkとなるような係数を前記
第2の特徴変換係数集合の初期値とし、前記学習パター
ンから抽出されるn次元特徴の平均値をカテゴリ毎に求
め、この平均値を前記第1の特徴変換係数集合の初期値
を用いてh次元に変換し、このh次元に変換した値を前
記第2の特徴変換係数集合の初期値を用いてm次元に変
換した値を各カテゴリの参照パターンの初期値とするも
のである。
は、辞書学習時に、辞書学習のための学習パターンから
n(nは正の整数)次元特徴を抽出する学習パターン特
徴抽出手順(S502)と、非線形な入出力応答を有す
るh(hは正の整数)個の微分可能な非線形関数が記述
された第1の特徴変換係数集合に基づいて、前記学習パ
ターンのn次元特徴からh次元特徴を選択する学習パタ
ーンh次元特徴選択手順(S503)と、微分可能なm
個の線形関数もしくは非線形関数が記述された第2の特
徴変換係数集合に基づいて、前記学習パターンのh次元
特徴からm(mは正の整数、m<n)次元特徴を選択す
る学習パターンm次元特徴選択手順(S504)と、前
記m次元特徴とパターン認識のために予め用意された認
識辞書中のm次元参照パターンとを照合し、前記学習パ
ターンと同じカテゴリに属するm次元参照パターンと前
記m次元特徴との距離が減少し、かつ前記学習パターン
と異なるカテゴリに属するm次元参照パターンのうち前
記m次元特徴の最近傍に存在するm次元参照パターンと
前記m次元特徴との距離が増加するように前記認識辞書
を修正する認識辞書修正手順(S505)と、前記学習
パターンと同じカテゴリに属するm次元参照パターンと
前記m次元特徴との距離が減少し、かつ前記学習パター
ンと異なるカテゴリに属するm次元参照パターンと前記
m次元特徴との距離が増加するように前記第1の特徴変
換係数集合及び前記第2の特徴変換係数集合を修正する
特徴選択辞書修正手順(S506)とをコンピュータに
実行させるようにしたものである。また、本発明のパタ
ーン認識プログラムは、パターン認識時に、認識対象と
なる入力パターンからn次元特徴を抽出する入力パター
ン特徴抽出手順(S904)と、非線形な入出力応答を
有するh個の微分可能な非線形関数が記述された第1の
特徴変換係数集合に基づいて、前記入力パターンのn次
元特徴からh次元特徴を選択する入力パターンh次元特
徴選択手順(S905)と、微分可能なm個の線形関数
もしくは非線形関数が記述された第2の特徴変換係数集
合に基づいて、前記入力パターンのh次元特徴からm次
元特徴を選択する入力パターンm次元特徴選択手順(S
906)と、パターン認識のために予め用意されたm次
元参照パターンの集合からなる認識辞書と前記入力パタ
ーンのm次元特徴とを照合して認識結果を出力する識別
手順(S907,S908)とをコンピュータに実行さ
せるようにしたものである。
1構成例において、前記学習パターンh次元特徴選択手
順及び前記入力パターンh次元特徴選択手順は、前記第
1の特徴変換係数集合を構成するh組の変換係数と前記
n次元特徴との積和演算をそれぞれ行い、その各出力を
非線形な入出力応答特性を有する単調関数によって変換
して前記h次元特徴を選択し、前記学習パターンm次元
特徴選択手順及び前記入力パターンm次元特徴選択手順
は、前記第2の特徴変換係数集合を構成するm組の変換
係数と前記h次元特徴との積和演算をそれぞれ行って前
記m次元特徴を選択するものである。また、本発明のパ
ターン認識プログラムの1構成例は、前記学習パターン
から抽出される前記n次元特徴を主成分分析もしくは正
準判別分析して得られる軸のなかからh個を抽出して前
記第1の特徴変換係数集合の初期値とし、前記学習パタ
ーンから抽出される前記m次元特徴のk次元目の値xk
(k=1,2,3,...,m)と前記h次元特徴のk
次元目の値zk との関係がxk=zkとなるような係数を
前記第2の特徴変換係数集合の初期値とし、前記学習パ
ターンから抽出されるn次元特徴の平均値をカテゴリ毎
に求め、この平均値を前記第1の特徴変換係数集合の初
期値を用いてh次元に変換し、このh次元に変換した値
を前記第2の特徴変換係数集合の初期値を用いてm次元
に変換した値を各カテゴリの参照パターンの初期値とす
るようにしたものである。
の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の第1の実施形態にかかるパターン認識
装置の構成を示すブロック図である。図1に示すパター
ン認識装置は、データ入力部101、特徴抽出部10
2、特徴選択部103、特徴選択辞書104、識別部1
05、認識辞書106、認識結果出力部107、認識辞
書修正部108及び特徴選択辞書修正部109から構成
される。
ータを取り込んで特徴抽出部102に出力する。認識対
象のデータとしては、例えば画像データや音声データな
どが挙げられる。特徴抽出部102は、データ入力部1
01より入力されたデータ(入力パターン又は学習パタ
ーン)から認識に有効なn(nは正の整数)次元の特徴
を抽出して、特徴選択部103に出力する。本実施の形
態では、n次元の特徴はベクトル形式で表現されるもの
とし、特徴抽出部102はn次元特徴ベクトルを出力す
るものとする。
10と第2次特徴変換部111とからなる。特徴選択部
103は、特徴選択辞書104を参照して、特徴抽出部
102から入力されたn次元特徴ベクトルをm(mは正
の整数、m<n)次元特徴ベクトルに変換し、特徴選択
辞書104及び認識辞書106を用いて入力パターンを
認識する認識モード時は、変換後のm次元特徴ベクトル
を識別部107へ出力し、特徴選択辞書104及び認識
辞書106を修正する学習モード時は、変換後のm次元
特徴ベクトルを認識辞書修正部108へ出力する。
104に含まれる第1の特徴変換係数集合112を参照
して、n次元特徴ベクトルをh(hは正の整数)次元特
徴ベクトルに非線形変換する処理部である。第2次特徴
変換部111は、特徴選択辞書104に含まれる第2の
特徴変換係数集合113を参照して、第1次特徴変換部
110から出力されたh次元特徴ベクトルをm次元特徴
ベクトルに線形変換する処理部である。本実施の形態で
は、第1次特徴変換部110の非線形変換処理を次式に
より定義する。
処理を次式により定義する。
合112に該当し、w(2) kj は第2の特徴変換係数集合
113に該当する。また、関数gはシグモイド関数を表
すものとする。Xi はn次元特徴Xのi次元目の値、z
j はh次元特徴zのj次元目の値、xk はm次元特徴x
のk次元目の値である。
関数が記述された辞書であり、第1の特徴変換係数集合
112と第2の特徴変換係数集合113とからなる。特
徴選択辞書104は、特徴選択辞書修正部109によっ
て学習モード時にのみ修正される。第1の特徴変換係数
集合112は、式(1)中のパラメータw(1) ji を構成
要素とし、第2の特徴変換係数集合113は、式(2)
中のパラメータw(2) k j を構成要素とする。
し、特徴選択部103から出力されたm次元特徴ベクト
ルと認識辞書106中のm次元参照ベクトル(参照パタ
ーン)とを照合し、m次元特徴ベクトルとm次元参照ベ
クトルとの距離に基づいて、m次元参照ベクトルの中か
ら認識候補を出力する。
参照ベクトルの集合が記述された辞書であり、学習モー
ド時には認識辞書修正部108によって修正される。認
識結果出力部107は、識別部105から入力された認
識候補のカテゴリコード(例えばASCIIコード)や
距離値を図示しない記憶装置に記憶させたり、ディスプ
レイ装置に表示させたりする。
のみ動作し、特徴選択部103から出力されたm次元特
徴ベクトルと認識辞書106中のm次元参照ベクトルと
を照合し、入力パターンと同じカテゴリに属するm次元
参照ベクトルrc と、入力パターンと異なるカテゴリに
属するm次元参照ベクトルのうちm次元特徴ベクトルの
最近傍に存在する参照ベクトルre とを抽出して、m次
元参照ベクトルrc とm次元特徴ベクトルとの距離d
c 、及びm次元参照ベクトルre とm次元特徴ベクトル
との距離de を計算する。そして、認識辞書修正部10
8は、距離dc が減少し、かつ距離de が増大するよう
に以下の修正式により認識辞書106を修正する。
照ベクトルrc,re及びm次元参照ベクトルrc,reと
m次元特徴ベクトルとの距離dc,deを特徴選択辞書修
正部109へ出力する。特徴選択辞書修正部109は、
認識辞書修正部108によって抽出されたm次元参照ベ
クトルrc,re及びm次元参照ベクトルrc,reとm次
元特徴ベクトルとの距離dc,deに基づいて、特徴選択
辞書104を修正する。本実施の形態では、認識辞書修
正部108は、以下の修正式によって特徴選択辞書10
4の第1の特徴変換係数集合112(w(1) ji )及び第
2の特徴変換係数集合113(w(2) kj )を修正する。
パターン認識方法の原理について図2を用いて説明す
る。図2(a)はn次元特徴空間におけるデータ分布
を、図2(b)は現時刻におけるh次元特徴空間におけ
るデータ分布を、図2(c)は特徴変換係数集合11
2,113の修正を行った後のh次元特徴空間における
データ分布を示す。
徴軸、303はn次元特徴空間のカテゴリAに属するデ
ータが分布する領域、304は同空間のカテゴリBに属
するデータが分布する領域、305はh次元特徴空間の
カテゴリAに属するデータが分布する領域、306はカ
テゴリBに属するデータが分布する領域、307はカテ
ゴリAに属する学習パターン、311,312はh次元
特徴軸、313は現時刻におけるm次元特徴軸、314
は修正後のm次元特徴軸、315,316は修正後のh
次元特徴軸、317はm次元特徴軸314に写像された
カテゴリAの学習パターン、318はm次元特徴軸31
4に写像されたカテゴリAの参照パターンである。
可能であるが(ただし、m<n)、図2では、理解を容
易にするためにn=2、h=2、m=1の場合を例にと
って図示している。軸301及び軸302は、n次元特
徴空間を構成する2次元の軸であり、このn次元特徴空
間中にカテゴリAに属するデータが分布303の領域に
存在し、カテゴリBに属するデータが分布304の領域
に存在する。
変換して得た、軸311及び軸312によって構成され
る現時刻のh次元特徴空間を示している。h次元特徴空
間上ではカテゴリAのデータは分布305の領域に写像
され、カテゴリBのデータは分布306の領域に写像さ
れているものとする。さらに、カテゴリAに属する学習
パターン307を現時刻のm(=1)次元特徴軸313
上に写像した点をm次元パターン310とし、カテゴリ
A,Bの参照パターンをそれぞれm次元参照パターン3
08,309とする。
ン310は、カテゴリAの参照パターン308よりもカ
テゴリBの参照パターン309により近いため、カテゴ
リBに誤識別されてしまう。本発明の学習モードでは、
このような状況において、正解カテゴリの参照パターン
と学習パターンとの距離が減少し、不正解であるカテゴ
リの参照パターンと学習パターンとの距離が増大するよ
うに、第1の特徴変換係数集合112(w(1) ji )及び
第2の特徴変換係数集合113(w(2) kj )が修正され
る。
正について述べる。図2(b)において、第2の特徴変
換係数集合113を修正することは、m次元特徴軸31
3が移動することに相当する。第2の特徴変換係数集合
113の機能を簡単のために線形変換であると仮定すれ
ば、図2(b)に示す状況において、m次元特徴軸31
3は、正解カテゴリの参照パターンと学習パターンとの
距離が減少し、不正解カテゴリの参照パターンと学習パ
ターンとの距離が増大するように原点を中心として右回
りに若干回転し、新たなm次元特徴軸314へと変化す
る(図2(c))。
正について述べる。図2(b)において、第1の特徴変
換係数集合112を修正することは、h次元特徴軸31
1,312を変化させることに相当する。たとえば、第
1次特徴変換部110により特徴軸311,312の局
所的伸縮が可能であるならば、正解カテゴリの参照パタ
ーンと学習パターンとの距離が減少し、不正解であるカ
テゴリの参照パターンと学習パターンとの距離が増大す
るように特徴軸312を局所的に引き延ばし、新たなh
次元特徴軸315,316を得る。
2及び第2の特徴変換係数集合113を修正した後の、
h次元特徴空間におけるパターンの分布及びm次元特徴
軸は図2(c)に示す状態となる。m次元特徴軸314
上では、m次元特徴軸314に写像されたカテゴリAの
学習パターン317が、正解カテゴリAの参照パターン
318に接近し、正しく識別されるように変化してい
る。
例にあげたが、mが2以上である場合やnまたはhが3
以上である場合も軸の数が増えるだけで、全く同じ原理
で動作する。したがって、このような修正を各学習パタ
ーンに対して繰り返し適用することにより、従来法では
抽出不能だったm次元特徴空間が得られることとなり、
従来法よりも優れたパターン認識装置を構成することが
できる。
第2の特徴変換係数集合113及び認識辞書106中の
参照パターン(参照ベクトル)は、具体的に以下の方法
によって修正することが可能である。入力パターンから
抽出したn次元特徴をX={X1,X2,X3,...,
Xn}、バイアスのための入力X0(=1) 、h次元特
徴をz={z1,z2,z3,...,zh}、m次元特徴
をx={x1,x2,x3,...,xm}とし、n次元特
徴Xからh次元特徴zのj次元目の値zj を抽出する非
線形関数f(1) jを次式のように表す。
k次元目の値xk を抽出する線形関数もしくは非線形関
数f(2) kを次式のように表す。
パラメータの集合を示し、Λ(2) kは関数f(2) kに用いら
れるパラメータの集合を示す。Xi,zj,xk の依存関
係を図に示すと図3のような2層の関係になる。
元参照パターンrc ={rc,1,rc ,2,
rc,3,....rc,m}とm次元特徴x={x1,x2,
x3,...,xm}との距離dc と、正解カテゴリ以外
のカテゴリに対応するm次元参照パターンr e ={r
e,1,re,2,re,3,....re,m}とm次元特徴xと
の距離de をそれぞれユークリッド距離の2乗、すなわ
ち次式のように定義する。
対する認識の確実性をより高めるためには、入力パター
ンから抽出したm次元特徴xと正解カテゴリのm次元参
照パターンrc との距離dc が現在よりも小さくなり、
かつm次元特徴xと不正解カテゴリに属するm次元参照
パターンre との距離de が現在よりも大きくなればよ
い。
方法について述べる。距離dc を減少させ、距離de を
増大させるには、各距離dc,deをm次元参照パターン
rc,reで偏微分し、m次元参照パターンrc を負の勾
配方向に、m次元参照パターンre を正の勾配方向に修
正すればよい。距離dc,deの偏微分は次式により与え
られる。
照パターンrc,reを修正することができる。
1(t) は小さな正の実数値をとり、時間の経過ととも
に0に収束するよう制御される。次に、第2の特徴変換
係数集合Λ(2) kの修正方法について述べる。Λ(2) kの変
化に対する距離dc,deの変化はチェインルールを用い
て次式のように表される。
微分可能なので、これら2つの式を統合して以下の式に
よりΛ(2) kを修正することが可能である。
小さな正の実数値をとる。最後に、第1の特徴変換係数
集合Λ(1) jの修正方法について述べる。図2からわかる
ように、Λ(1) jの変化はh次元特徴zのj次元目の値z
j に影響を与え、zj の変化はm次元特徴xのk次元目
の値xk (k=1,2,3,..,m)に影響を与え
る。よって、第1の特徴変換係数集合Λ(1) jに対する距
離dc,deの偏微分はチェインルールを用いて次式のよ
うに表される。
微分可能なので、これら2つの式を統合して以下の式に
よりΛ(1) jを修正することが可能である。
小さな正の実数値をとる。以上の修正式に基づいて、m
次元参照パターンrc,re、第1の特徴変換係数集合Λ
(1) j及び第2の特徴変換係数集合Λ(2) kを修正すること
により、入力パターンから抽出したm次元特徴xと正解
カテゴリのm次元参照パターンrc との距離dc を減少
させ、かつm次元特徴xと不正解カテゴリのm次元参照
パターンre との距離de を増大させることができ、高
い認識精度を有するパターン認識装置を構成することが
できる。
法の原理に基づいているため、学習結果がパラメータの
初期値に依存する。そこで、最急降下をできるだけ認識
精度の高いパラメータから開始することにより、学習後
の認識精度がより高くなるものと期待できる。つまり、
参照パターン及び第1,2の特徴変換係数集合の初期値
には、ある程度の認識が可能な値を使用することが望ま
しい。今、第1次特徴変換部110による変換を次式で
定義する。
を次式で定義する。
は単調な非線形関数(シグモイド関数)である。w(1)
ji は第1の特徴変換係数集合112(Λ(1) j)を構成
するパラメータ(集合の要素)、w(2) kj は第2の特徴
変換係数集合113(Λ(2) k)を構成するパラメータで
ある。
くは正準判別分析して得られるh個の軸をφ1 =
{φ11,φ12,....,φ1n},φ2 ={φ21,
φ22,....,φ2n},....,φh ={φh1,φ
h2,....,φhn},φj0=0(j=1,2,
3,...,h)として、第1の特徴変換係数集合11
2(Λ(1) j)のパラメータw(1) ji を次式で定義する。
(2) k)のパラメータw(2) kj を次式で定義する。
デルタを示す。式(20)、式(21)のように定義す
ると、第1次特徴変換部110は、入力パターンから抽
出されたn次元特徴をh個の主成分軸もしくは正準判別
軸に投影した値を非線形関数gで変換したh次元の値を
抽出していると解釈することができる。また、第2次特
徴変換部111は、h次元の値の中からm個を単純に抜
き出しているものと解釈することができる。
する上で最良の軸であり、正準判別軸はパターンを識別
する上で良好な軸である。よって、第2次特徴変換部1
11の出力であるm次元特徴空間は、単調な非線形関数
gにより多少伸縮されているものの、ある程度識別に適
した特徴であると考えられる。
出したn次元の平均ベクトルを上記変換によってm次元
参照ベクトルとすれば、m次元特徴空間においても平均
ベクトルの周囲に同カテゴリのパターンが分布すること
になる。したがって、本実施の形態の初期設定法を用い
れば、初期状態のパラメータである程度の識別が可能で
あり、この値をもとに学習を開始すれば、乱数によって
初期化する場合などに比べ、優れたパターン認識装置を
構築できる可能性が高まる。
作例を説明する。パターン認識装置の動作モードとして
は、特徴選択辞書104及び認識辞書106を修正する
学習モードと、学習モードによって構築された辞書10
4,106を用いて入力パターンを次々と認識する認識
モードの2つのモードがある。
参照しつつ説明する。図4は学習モードのフローチャー
トを示す図である。本学習はいわゆる逐次学習であり、
認識辞書修正部108、特徴選択辞書修正部109は、
最初に認識辞書106及び特徴選択辞書104の初期化
を行う(図4ステップS401)。
ンから抽出したn次元特徴ベクトルに関する主成分軸h
個もしくは正準判別軸h個をφ1 ={φ11,
φ12,....,φ1n}、φ2 ={φ21,
φ22,....,φ2n}、....、φh ={φh1,φ
h2,....,φhn}で表すとすると、特徴選択辞書1
04の第1の特徴変換係数集合112のパラメータw
(1) ji を次式により初期化する。
選択辞書104の第2の特徴変換係数集合113のパラ
メータw(2) kj を次式により修正する。
が成立するならば、第1の特徴変換係数集合112(w
(1) ji )を正準判別分析で求めることができるが、そう
でない場合は主成分分析を用いるのがよい。
辞書修正部109は、学習サイクル数及び学習パターン
数を設定する(ステップS402)。学習サイクル数と
は全学習パターンに対する学習作業を1サイクルと数え
たときに、その作業を何回繰り返すかを指定する変数で
ある。
辞書修正部109は、次学習サイクル数を記憶するカウ
ンタLCの値を1に初期化する(ステップS403)。
この後、カウンタLCが示す学習サイクル数が規定回数
を超えたか否かをチェックし(ステップS404)、規
定回数を超えたならば(ステップS404においてN
O)、学習を終了する。カウンタLCが示す学習サイク
ル数が規定回数以下の場合(ステップS404において
YES)は、以下の処理を行う。
辞書修正部109は、次学習パターンの番号を記憶する
カウンタPNの値を1に初期化し(ステップS40
5)、カウンタPNが示す学習パターン数が規定数を超
えたか否かをチェックする(ステップS406)。規定
数を超えたならば(ステップS406においてNO)、
次学習サイクル数を数えるカウンタLCの値を1増加さ
せ(ステップS408)、ステップS404に戻る。
数以下であれば(ステップS406においてYES)、
PN番目の学習パターンを1つ読み込んで特徴ベクトル
を抽出し、参照ベクトルとの照合結果に基づいて認識辞
書106及び特徴選択辞書104の修正を行う(ステッ
プS407)。
徴選択辞書修正部109は、次学習パターン番号を記憶
するカウンタPNの値を1増加させ(ステップS40
9)、ステップS406に戻る。以上の手続きにより、
各学習パターンに対してステップS402で設定した回
数の修正手続きが実行され、修正手続きの実行後、学習
モードは終了する。
ここで学習モードにおける要の処理である辞書修正ステ
ップ(ステップS407)について図5を参照しつつ更
に詳細に説明する。辞書修正ステップでは、入力データ
読み込み(ステップS501)、特徴抽出(ステップS
502)、h次元特徴選択(ステップS503)、m次
元特徴選択(ステップS504)、認識辞書の修正(ス
テップS505)、特徴選択辞書の修正(ステップS5
06)の各ステップが実行される。
明する。まず、データ入力部101が読み込んだ学習パ
ターンは、特徴抽出部102に入力され(図5ステップ
S501)、特徴抽出部102によってn次元の特徴ベ
クトルが抽出される(ステップS502)。
る第1の特徴変換係数集合112に基づいてn次元特徴
ベクトルからh次元特徴ベクトルを抽出し(ステップS
503)、続いて第2次特徴変換部111は、現時刻に
おける第2の特徴変換係数集合113に基づいてh次元
特徴ベクトルからm次元特徴ベクトルを抽出する(ステ
ップS504)。
3から出力されたm次元特徴ベクトルと認識辞書106
中のm次元参照ベクトルとを照合し、このm次元特徴ベ
クトルの最近傍に存在する不正解カテゴリのm次元参照
ベクトルre と、正解カテゴリのm次元参照ベクトルr
c とを抽出して、m次元参照ベクトルrc とm次元特徴
ベクトルとの距離dc が減少し、かつm次元参照ベクト
ルre とm次元特徴ベクトルとの距離de が増大するよ
うに認識辞書106を最急降下法によって修正する(ス
テップS505)。
テップS505で抽出された情報を利用して、m次元参
照ベクトルrc とm次元特徴ベクトルとの距離dc が減
少し、かつm次元参照ベクトルre とm次元特徴ベクト
ルとの距離de が増大するように特徴選択辞書104を
修正する(ステップS506)。
にとってより好適なm次元特徴及び認識辞書が構成され
ることとなり、より認識精度の高いパターン認識装置を
構築することが可能となる。
いて説明する。図6は認識モードのフローチャートを示
す図である。認識モードでは、認識辞書106及び特徴
選択辞書104の初期化(ステップS901)、各入力
パターン読み込み(ステップS902,S903)、特
徴抽出(ステップS904)、h次元特徴選択(ステッ
プS905)、m次元特徴選択(ステップS906)、
識別(ステップS907)、結果出力(ステップS90
8)の各ステップが実行される。
明する。まず、学習モードで生成した認識辞書106及
び特徴選択辞書104を読み込む(ステップS90
1)。次に、データ入力部101は、入力パターンを読
み込む(ステップS902)。特徴抽出部102は、デ
ータ入力部101における入力パターン読み込みが終了
して、データ入力部101から入力パターンが出力され
た場合(ステップS903においてYES)、この入力
パターンからn次元特徴ベクトルを抽出して、特徴選択
部103に出力する(ステップS904)。
0は、特徴選択辞書104の第1の特徴変換係数集合1
12に基づいてn次元特徴ベクトルからh次元特徴ベク
トルを選択する(ステップS905)。また、特徴選択
部103の第2次特徴変換部111は、特徴選択辞書1
04の第2の特徴変換係数集合113に基づいてh次元
特徴ベクトルからm次元特徴ベクトルを選択する(ステ
ップS906)。
れたm次元参照ベクトルのうちm次元特徴ベクトルとの
距離が近いものを認識候補とし、これらの認識候補のう
ち距離が近いものから順にC個抽出する(ステップS9
07)。そして、識別部105は、抽出した各認識候補
が属するカテゴリの番号であるカテゴリコードと、これ
ら認識候補とm次元特徴ベクトルとの距離を認識結果出
力部107に出力する。
ら入力された認識候補のカテゴリコードや距離値を図示
しない記憶装置に記憶させたり、ディスプレイ装置に表
示させたりする(ステップS908)。ステップS90
8の終了後、読み込みステップS902に戻って、入力
パターンがなくなるまでステップS902〜S908の
処理を繰り返す。
て、図7に示すような2次元平面上に分布する2つのカ
テゴリの入力パターンの識別実験を行った結果について
説明する。図7において、601はカテゴリAのデー
タ、602はカテゴリBのデータを示す。
(x,y)=(100cosθ,100sinθ)を満
たす2次元データを0≦θ≦π/2の範囲でランダムに
1000個発生させ、カテゴリBの入力パターンについ
ても同様に(x,y)=(85cosθ,85sin
θ)を満たすデータ1000個を発生させた後、x,y
座標値の平均値が0,分散が1になるように正規化した
データを各カテゴリのデータとした。
線形な特徴選択機能を持つ手法と、本実施の形態のパタ
ーン認識方法を用いて学習し、1次元軸上で識別する実
験を行った。参照ベクトルの数はいずれも1個/カテゴ
リとした。また、本実施の形態の第1次特徴変換部11
0が出力する特徴の次元数hを2とし、第2次特徴変換
部111による変換を線形変換とした。識別実験の結果
を表1に示す。
従来の方法では13.75%(2000件中275件)
誤識別したのに対し、本実施の形態のパターン認識方法
では誤識別が0件となった。このとき、本実施の形態の
第1次特徴変換部110が出力する2次元の特徴によっ
て形成される2次元平面上でのデータ分布を図8に示
す。
タ、802はカテゴリBのデータを示す。図8から、原
特徴空間(n=2)では線形分離不能であったデータが
第1次特徴変換部110によって線形分離可能な空間に
非線形に変換され、認識性能が向上したことがわかる。
次元参照ベクトルを1つであると仮定していたが、1つ
のカテゴリに複数のm次元参照ベクトルが存在してもよ
い。1つのカテゴリに複数のm次元参照ベクトルが存在
する場合、m次元参照ベクトルrc は入力パターンから
抽出したm次元特徴ベクトルの最近傍に存在する正解カ
テゴリの参照ベクトルとすればよい。
習パターンに対してk−meansクラスタリングなど
で抽出した複数の代表ベクトルを、本実施の形態で示し
た特徴変換係数集合112,113の初期値を用いてm
次元に変換したベクトルを用いればよい。
おけるm次元参照ベクトルとm次元特徴ベクトルとの照
合を認識辞書修正部108にて行うものとしたが、特徴
選択辞書修正部109で行ってもよい。この場合は、特
徴選択辞書修正部109で抽出した情報を認識辞書修正
部108に出力すればよい。
03を第1次特徴変換部110と第2次特徴変換部11
1とから構成されるものとしたが、第1次特徴変換部1
10と同様の機能を有する処理部を第1次特徴変換部と
第2次特徴変換部の間に1個以上追加してもよく、同様
の方法によって従来法よりも優れたパターン認識装置を
構築することができる。
識装置はコンピュータによって実現することができる。
このコンピュータは、中央処理装置(CPU)と、リー
ドオンリメモリ(ROM)と、ランダムアクセスメモリ
(RAM)と、表示装置やキーボード、外部記憶装置と
のインタフェースをとるための回路などを備えた周知の
構成のものでよい。
れたプログラム、又はキーボードから入力されたコマン
ドに従って処理を実行する。また、CPUは、外部記憶
装置にデータを書き込んだり、外部記憶装置からデータ
を読み出したりすることができる。
のパターン認識方法を実現させるためのパターン認識プ
ログラムは、フレキシブルディスク、CD−ROM、D
VD−ROM、メモリカードなどの記録媒体に記録され
た状態で提供される。この記録媒体を外部記憶装置に挿
入すると、記録媒体に書き込まれたプログラムが読み取
られ、コンピュータに転送される。そして、CPUは、
読み込んだプログラムをRAM等に書き込む。しかる後
に、CPUは、図4〜図6で説明した前述の処理を実行
する。
特徴を選択する特徴選択部の特徴選択機能を非線形変換
に拡張し、非線形変換を行うための特徴選択辞書(第
1、第2の特徴変換係数集合)と認識のための識別辞書
とを学習プロセスによって同時に最適化することが可能
であるため、従来法よりもより少ない次元数の特徴を用
いて高精度なパターン認識を実現することができる。
て得られる軸のなかからh個を抽出して第1の特徴変換
係数集合の初期値とし、学習パターンのm次元特徴のk
次元目の値xk とh次元特徴のk次元目の値zk との関
係がxk=zkとなるような係数を第2の特徴変換係数集
合の初期値とし、学習パターンのn次元特徴の平均値を
カテゴリ毎に求め、この平均値を第1の特徴変換係数集
合の初期値を用いてh次元に変換し、このh次元に変換
した値を第2の特徴変換係数集合の初期値を用いてm次
元に変換した値を各カテゴリのm次元参照パターンの初
期値とすることにより、m次元参照パターン及び第1、
第2の特徴変換係数集合の初期値をある程度のパターン
認識が可能な値に設定可能であるため、乱数などで初期
値設定を行う場合に比べて、良好な初期値設定を行うこ
とができる。
識装置の構成を示すブロック図である。
クによって模式化した図である。
存関係を示す図である。
のフローチャートを示す図である。
ートを示す図である。
のフローチャートを示す図である。
用いた人工データの分布を示す図である。
によって出力された2つの特徴が構成する空間に入力デ
ータを写像した図である。
特徴選択部、104…特徴選択辞書、105…識別部、
106…認識辞書、107…認識結果出力部、108…
特徴選択辞書修正部、109…認識辞書修正部、110
…第1次特徴変換部、111…第2次特徴変換部、11
2…第1の特徴変換係数集合、113…第2の特徴変換
係数集合、X…n次元特徴、z…h次元特徴、x…m次
元特徴。
Claims (12)
- 【請求項1】 認識対象となる入力パターン又は辞書学
習のための学習パターンからn(nは正の整数)次元特
徴を抽出する特徴抽出部と、 特徴選択のための関数が記述された特徴選択辞書と、 前記抽出されたn次元特徴から前記特徴選択辞書に基づ
いてm(mは正の整数、m<n)次元特徴を選択する特
徴選択部と、 パターン認識のために予め用意されたm次元参照パター
ンの集合からなる認識辞書と、 前記m次元参照パターンと前記入力パターンのm次元特
徴とを照合して、前記入力パターンの認識結果を出力す
る識別部とを有し、 前記特徴選択部は、非線形な入出力応答を有するh(h
は正の整数)個の微分可能な関数によって前記n次元特
徴からh次元特徴を選択する第1次特徴変換部と、微分
可能なm個の線形関数もしくは非線形関数によって前記
h次元特徴から前記m次元特徴を選択する第2次特徴変
換部とからなり、 前記特徴選択辞書は、前記第1次特徴変換部で必要とさ
れる非線形関数が記述された第1の特徴変換係数集合
と、前記第2次特徴変換部で必要とされる線形関数もし
くは非線形関数が記述された第2の特徴変換係数集合と
からなることを特徴とするパターン認識装置。 - 【請求項2】 請求項1記載のパターン認識装置におい
て、 辞書学習時に前記認識辞書を修正する認識辞書修正部
と、 辞書学習時に前記特徴選択辞書を修正する特徴選択辞書
修正部とを有し、 前記認識辞書修正部は、前記学習パターンのm次元特徴
と前記m次元参照パターンとを照合し、前記学習パター
ンと同じカテゴリに属するm次元参照パターンと前記学
習パターンのm次元特徴との距離が減少し、かつ前記学
習パターンと異なるカテゴリに属するm次元参照パター
ンのうち前記m次元特徴の最近傍に存在するm次元参照
パターンと前記学習パターンのm次元特徴との距離が増
加するように前記認識辞書を修正し、 前記特徴選択辞書修正部は、前記学習パターンと同じカ
テゴリに属するm次元参照パターンと前記学習パターン
のm次元特徴との距離が減少し、かつ前記学習パターン
と異なるカテゴリに属するm次元参照パターンと前記学
習パターンのm次元特徴との距離が増加するように前記
第1の特徴変換係数集合及び前記第2の特徴変換係数集
合を修正することを特徴とするパターン認識装置。 - 【請求項3】 請求項1記載のパターン認識装置におい
て、 前記特徴選択部の第1次特徴変換部は、前記n次元特徴
と前記第1の特徴変換係数集合との積和演算を行う第1
の積和演算部と、この第1の積和演算部の出力を非線形
な入出力応答特性を有する単調関数によって変換する非
線形変換部とからなり、 前記特徴選択部の第2次特徴変換部は、前記h次元特徴
と前記第2の特徴変換係数集合との積和演算を行う第2
の積和演算部からなることを特徴とするパターン認識装
置。 - 【請求項4】 請求項2記載のパターン認識装置におい
て、 前記特徴選択辞書修正部は、前記学習パターンから抽出
される前記n次元特徴を主成分分析もしくは正準判別分
析して得られる軸のなかからh個を抽出して前記第1の
特徴変換係数集合の初期値とし、前記学習パターンから
抽出される前記m次元特徴のk次元目の値xk (k=
1,2,3,...,m)と前記h次元特徴のk次元目
の値zk との関係がxk=zkとなるような係数を前記第
2の特徴変換係数集合の初期値とし、 前記認識辞書修正部は、前記学習パターンから抽出され
るn次元特徴の平均値をカテゴリ毎に求め、この平均値
を前記第1の特徴変換係数集合の初期値を用いてh次元
に変換し、このh次元に変換した値を前記第2の特徴変
換係数集合の初期値を用いてm次元に変換した値を各カ
テゴリの前記m次元参照パターンの初期値とすることを
特徴としたパターン認識装置。 - 【請求項5】 辞書学習時に、 辞書学習のための学習パターンからn(nは正の整数)
次元特徴を抽出する学習パターン特徴抽出手順と、 非線形な入出力応答を有するh(hは正の整数)個の微
分可能な非線形関数が記述された第1の特徴変換係数集
合に基づいて、前記学習パターンのn次元特徴からh次
元特徴を選択する学習パターンh次元特徴選択手順と、 微分可能なm個の線形関数もしくは非線形関数が記述さ
れた第2の特徴変換係数集合に基づいて、前記学習パタ
ーンのh次元特徴からm(mは正の整数、m<n)次元
特徴を選択する学習パターンm次元特徴選択手順と、 前記m次元特徴とパターン認識のために予め用意された
認識辞書中のm次元参照パターンとを照合し、前記学習
パターンと同じカテゴリに属するm次元参照パターンと
前記m次元特徴との距離が減少し、かつ前記学習パター
ンと異なるカテゴリに属するm次元参照パターンのうち
前記m次元特徴の最近傍に存在するm次元参照パターン
と前記m次元特徴との距離が増加するように前記認識辞
書を修正する認識辞書修正手順と、 前記学習パターンと同じカテゴリに属するm次元参照パ
ターンと前記m次元特徴との距離が減少し、かつ前記学
習パターンと異なるカテゴリに属するm次元参照パター
ンと前記m次元特徴との距離が増加するように前記第1
の特徴変換係数集合及び前記第2の特徴変換係数集合を
修正する特徴選択辞書修正手順とを実行することを特徴
とするパターン認識方法。 - 【請求項6】 請求項5記載のパターン認識方法におい
て、 パターン認識時に、 認識対象となる入力パターンからn次元特徴を抽出する
入力パターン特徴抽出手順と、 非線形な入出力応答を有するh個の微分可能な非線形関
数が記述された第1の特徴変換係数集合に基づいて、前
記入力パターンのn次元特徴からh次元特徴を選択する
入力パターンh次元特徴選択手順と、 微分可能なm個の線形関数もしくは非線形関数が記述さ
れた第2の特徴変換係数集合に基づいて、前記入力パタ
ーンのh次元特徴からm次元特徴を選択する入力パター
ンm次元特徴選択手順と、 パターン認識のために予め用意されたm次元参照パター
ンの集合からなる認識辞書と前記入力パターンのm次元
特徴とを照合して認識結果を出力する識別手順とを実行
することを特徴とするパターン認識方法。 - 【請求項7】 請求項6記載のパターン認識方法におい
て、 前記学習パターンh次元特徴選択手順及び前記入力パタ
ーンh次元特徴選択手順は、前記第1の特徴変換係数集
合を構成するh組の変換係数と前記n次元特徴との積和
演算をそれぞれ行い、その各出力を非線形な入出力応答
特性を有する単調関数によって変換して前記h次元特徴
を選択し、 前記学習パターンm次元特徴選択手順及び前記入力パタ
ーンm次元特徴選択手順は、前記第2の特徴変換係数集
合を構成するm組の変換係数と前記h次元特徴との積和
演算をそれぞれ行って前記m次元特徴を選択することを
特徴とするパターン認識方法。 - 【請求項8】 請求項5記載のパターン認識方法におい
て、 前記学習パターンから抽出される前記n次元特徴を主成
分分析もしくは正準判別分析して得られる軸のなかから
h個を抽出して前記第1の特徴変換係数集合の初期値と
し、前記学習パターンから抽出される前記m次元特徴の
k次元目の値x k (k=1,2,3,...,m)と前
記h次元特徴のk次元目の値zk との関係がxk=zkと
なるような係数を前記第2の特徴変換係数集合の初期値
とし、前記学習パターンから抽出されるn次元特徴の平
均値をカテゴリ毎に求め、この平均値を前記第1の特徴
変換係数集合の初期値を用いてh次元に変換し、このh
次元に変換した値を前記第2の特徴変換係数集合の初期
値を用いてm次元に変換した値を各カテゴリの参照パタ
ーンの初期値とすることを特徴としたパターン認識方
法。 - 【請求項9】 辞書学習時に、 辞書学習のための学習パターンからn(nは正の整数)
次元特徴を抽出する学習パターン特徴抽出手順と、 非線形な入出力応答を有するh(hは正の整数)個の微
分可能な非線形関数が記述された第1の特徴変換係数集
合に基づいて、前記学習パターンのn次元特徴からh次
元特徴を選択する学習パターンh次元特徴選択手順と、 微分可能なm個の線形関数もしくは非線形関数が記述さ
れた第2の特徴変換係数集合に基づいて、前記学習パタ
ーンのh次元特徴からm(mは正の整数、m<n)次元
特徴を選択する学習パターンm次元特徴選択手順と、 前記m次元特徴とパターン認識のために予め用意された
認識辞書中のm次元参照パターンとを照合し、前記学習
パターンと同じカテゴリに属するm次元参照パターンと
前記m次元特徴との距離が減少し、かつ前記学習パター
ンと異なるカテゴリに属するm次元参照パターンのうち
前記m次元特徴の最近傍に存在するm次元参照パターン
と前記m次元特徴との距離が増加するように前記認識辞
書を修正する認識辞書修正手順と、 前記学習パターンと同じカテゴリに属するm次元参照パ
ターンと前記m次元特徴との距離が減少し、かつ前記学
習パターンと異なるカテゴリに属するm次元参照パター
ンと前記m次元特徴との距離が増加するように前記第1
の特徴変換係数集合及び前記第2の特徴変換係数集合を
修正する特徴選択辞書修正手順とをコンピュータに実行
させるためのパターン認識プログラム。 - 【請求項10】 請求項9記載のパターン認識プログラ
ムにおいて、 パターン認識時に、 認識対象となる入力パターンからn次元特徴を抽出する
入力パターン特徴抽出手順と、 非線形な入出力応答を有するh個の微分可能な非線形関
数が記述された第1の特徴変換係数集合に基づいて、前
記入力パターンのn次元特徴からh次元特徴を選択する
入力パターンh次元特徴選択手順と、 微分可能なm個の線形関数もしくは非線形関数が記述さ
れた第2の特徴変換係数集合に基づいて、前記入力パタ
ーンのh次元特徴からm次元特徴を選択する入力パター
ンm次元特徴選択手順と、 パターン認識のために予め用意されたm次元参照パター
ンの集合からなる認識辞書と前記入力パターンのm次元
特徴とを照合して認識結果を出力する識別手順とをコン
ピュータに実行させるためのパターン認識プログラム。 - 【請求項11】 請求項10記載のパターン認識プログ
ラムにおいて、 前記学習パターンh次元特徴選択手順及び前記入力パタ
ーンh次元特徴選択手順は、前記第1の特徴変換係数集
合を構成するh組の変換係数と前記n次元特徴との積和
演算をそれぞれ行い、その各出力を非線形な入出力応答
特性を有する単調関数によって変換して前記h次元特徴
を選択し、 前記学習パターンm次元特徴選択手順及び前記入力パタ
ーンm次元特徴選択手順は、前記第2の特徴変換係数集
合を構成するm組の変換係数と前記h次元特徴との積和
演算をそれぞれ行って前記m次元特徴を選択することを
特徴とするパターン認識プログラム。 - 【請求項12】 請求項9記載のパターン認識プログラ
ムにおいて、 前記学習パターンから抽出される前記n次元特徴を主成
分分析もしくは正準判別分析して得られる軸のなかから
h個を抽出して前記第1の特徴変換係数集合の初期値と
し、前記学習パターンから抽出される前記m次元特徴の
k次元目の値x k (k=1,2,3,...,m)と前
記h次元特徴のk次元目の値zk との関係がxk=zkと
なるような係数を前記第2の特徴変換係数集合の初期値
とし、前記学習パターンから抽出されるn次元特徴の平
均値をカテゴリ毎に求め、この平均値を前記第1の特徴
変換係数集合の初期値を用いてh次元に変換し、このh
次元に変換した値を前記第2の特徴変換係数集合の初期
値を用いてm次元に変換した値を各カテゴリの参照パタ
ーンの初期値とすることを特徴としたパターン認識プロ
グラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001058107A JP4701518B2 (ja) | 2001-03-02 | 2001-03-02 | パターン認識装置、パターン認識方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001058107A JP4701518B2 (ja) | 2001-03-02 | 2001-03-02 | パターン認識装置、パターン認識方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002259911A true JP2002259911A (ja) | 2002-09-13 |
JP4701518B2 JP4701518B2 (ja) | 2011-06-15 |
Family
ID=18917886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001058107A Expired - Fee Related JP4701518B2 (ja) | 2001-03-02 | 2001-03-02 | パターン認識装置、パターン認識方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4701518B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282940A (ja) * | 2008-05-26 | 2009-12-03 | Toshiba Corp | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 |
JP2010182013A (ja) * | 2009-02-04 | 2010-08-19 | Toshiba Corp | 線形変換行列算出装置、その方法、及び、そのプログラム |
US8943005B2 (en) | 2009-11-12 | 2015-01-27 | Kabushiki Kaisha Toshiba | Metric learning apparatus |
WO2016098495A1 (ja) * | 2014-12-15 | 2016-06-23 | 株式会社Screenホールディングス | 画像分類装置および画像分類方法 |
JP2021101390A (ja) * | 2017-10-13 | 2021-07-08 | 日本電気株式会社 | 生体認証装置及び生体認証方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63177285A (ja) * | 1987-01-17 | 1988-07-21 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識処理装置 |
JPH01267789A (ja) * | 1988-04-19 | 1989-10-25 | Nec Corp | 認識辞書作成機能を備えた文字認識装置 |
JPH09245125A (ja) * | 1996-03-06 | 1997-09-19 | Toshiba Corp | パターン認識装置及び同装置における辞書修正方法 |
-
2001
- 2001-03-02 JP JP2001058107A patent/JP4701518B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63177285A (ja) * | 1987-01-17 | 1988-07-21 | Nippon Telegr & Teleph Corp <Ntt> | 文字認識処理装置 |
JPH01267789A (ja) * | 1988-04-19 | 1989-10-25 | Nec Corp | 認識辞書作成機能を備えた文字認識装置 |
JPH09245125A (ja) * | 1996-03-06 | 1997-09-19 | Toshiba Corp | パターン認識装置及び同装置における辞書修正方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009282940A (ja) * | 2008-05-26 | 2009-12-03 | Toshiba Corp | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 |
JP2010182013A (ja) * | 2009-02-04 | 2010-08-19 | Toshiba Corp | 線形変換行列算出装置、その方法、及び、そのプログラム |
US8943005B2 (en) | 2009-11-12 | 2015-01-27 | Kabushiki Kaisha Toshiba | Metric learning apparatus |
WO2016098495A1 (ja) * | 2014-12-15 | 2016-06-23 | 株式会社Screenホールディングス | 画像分類装置および画像分類方法 |
JP2016115115A (ja) * | 2014-12-15 | 2016-06-23 | 株式会社Screenホールディングス | 画像分類装置および画像分類方法 |
TWI601098B (zh) * | 2014-12-15 | 2017-10-01 | 思可林集團股份有限公司 | 影像分類裝置及影像分類方法 |
JP2021101390A (ja) * | 2017-10-13 | 2021-07-08 | 日本電気株式会社 | 生体認証装置及び生体認証方法 |
JP7143915B2 (ja) | 2017-10-13 | 2022-09-29 | 日本電気株式会社 | 生体認証装置及び生体認証方法 |
US11776302B2 (en) | 2017-10-13 | 2023-10-03 | Nec Corporation | Biometric recognition apparatus and biometric recognition method |
Also Published As
Publication number | Publication date |
---|---|
JP4701518B2 (ja) | 2011-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Learning image representations from the pixel level via hierarchical sparse coding | |
Yang et al. | Multilayer extreme learning machine with subnetwork nodes for representation learning | |
EP0539749B1 (en) | Handwriting recognition system and method | |
US6424746B1 (en) | Figure classifying method, figure classifying system, feature extracting method for figure classification, method for producing table for figure classification, information recording medium, method for evaluating degree of similarity or degree of difference between figures, figure normalizing method, and method for determining correspondence between figures | |
Laaksonen | Subspace classifiers in recognition of handwritten digits | |
US7593566B2 (en) | Data recognition device | |
Laparra et al. | Principal polynomial analysis | |
KR100494261B1 (ko) | 패턴 인식 장치 및 방법 | |
KR100370220B1 (ko) | 직선 기반의 영상 정합 방법 | |
JP3475886B2 (ja) | パターン認識装置及び方法並びに記録媒体 | |
Arafat et al. | Two stream deep neural network for sequence-based Urdu ligature recognition | |
JP4701518B2 (ja) | パターン認識装置、パターン認識方法及びプログラム | |
CN109032383B (zh) | 基于手写识别的输入方法 | |
JP4834693B2 (ja) | パターン認識パラメータ学習装置、パターン認識装置、パターン認識パラメータ学習方法 | |
JPH09245125A (ja) | パターン認識装置及び同装置における辞書修正方法 | |
JP5030235B2 (ja) | パターン認識装置及びパターン認識方法 | |
CN112560712A (zh) | 基于时间增强图卷积网络的行为识别方法、装置及介质 | |
Jain et al. | Learning graph quantization | |
Zoizou et al. | A study of feature extraction for Arabic calligraphy characters recognition | |
JP7561379B2 (ja) | 学習装置、学習方法及びプログラム | |
An et al. | Independent Gabor analysis of multiscale total variation-based quotient image | |
Hosseinzadeh et al. | Voting among virtually generated versions of a classification problem | |
JP3249676B2 (ja) | パターン認識辞書作成方法 | |
JP3019911B2 (ja) | パタン認識方法 | |
Sýkora | State-space dimensionality reduction in Markov decision processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4701518 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |