JP2003030655A - 画像認識システム及び画像認識プログラム - Google Patents
画像認識システム及び画像認識プログラムInfo
- Publication number
- JP2003030655A JP2003030655A JP2001212102A JP2001212102A JP2003030655A JP 2003030655 A JP2003030655 A JP 2003030655A JP 2001212102 A JP2001212102 A JP 2001212102A JP 2001212102 A JP2001212102 A JP 2001212102A JP 2003030655 A JP2003030655 A JP 2003030655A
- Authority
- JP
- Japan
- Prior art keywords
- image recognition
- input
- matrix
- image
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 辞書の生成に用いられる画像データに大きく
依存することなく、未知の入力画像群を正しく分類す
る。 【解決手段】 入力画像特徴データ群からK個(Kは自
然数)の入力代表ベクトルを生成する入力代表ベクトル
生成手段3と、C個(Cは自然数)のクラスそれぞれの
補空間基底データを辞書データと格納する辞書データ格
納手段4と、K個の入力代表ベクトルによって規定され
る空間と前記クラスとの統合距離をC個のクラスそれぞ
れに対し補空間基底データを用いて算出する統合距離算
出手段5と、この統合距離算出手段5によって算出され
たC個の統合距離に基づいて入力画像特徴データ群に対
する認識結果を出力する識別手段6とを備えている。
依存することなく、未知の入力画像群を正しく分類す
る。 【解決手段】 入力画像特徴データ群からK個(Kは自
然数)の入力代表ベクトルを生成する入力代表ベクトル
生成手段3と、C個(Cは自然数)のクラスそれぞれの
補空間基底データを辞書データと格納する辞書データ格
納手段4と、K個の入力代表ベクトルによって規定され
る空間と前記クラスとの統合距離をC個のクラスそれぞ
れに対し補空間基底データを用いて算出する統合距離算
出手段5と、この統合距離算出手段5によって算出され
たC個の統合距離に基づいて入力画像特徴データ群に対
する認識結果を出力する識別手段6とを備えている。
Description
【0001】
【発明の属する技術分野】本発明は、画像認識システム
及び画像認識プログラムに関し、特に、画像に写った対
象を、辞書に登録された物体かどうかを識別する、また
は辞書に登録された複数のカテゴリ中の一つに分類する
画像認識システム及び画像認識プログラムに関する。
及び画像認識プログラムに関し、特に、画像に写った対
象を、辞書に登録された物体かどうかを識別する、また
は辞書に登録された複数のカテゴリ中の一つに分類する
画像認識システム及び画像認識プログラムに関する。
【0002】
【従来の技術】従来の画像認識システムの一例が、特開
平11−265452号公報(物体認識装置および物体
認識方法)に記載されている。図14は、この従来の画
像認識システムの構成を示すブロック図である。この図
に示すように、従来の画像認識システムは、画像入力部
201と、辞書記憶部202と、部分空間間の角度計算
部203と、認識部204とから構成されている。
平11−265452号公報(物体認識装置および物体
認識方法)に記載されている。図14は、この従来の画
像認識システムの構成を示すブロック図である。この図
に示すように、従来の画像認識システムは、画像入力部
201と、辞書記憶部202と、部分空間間の角度計算
部203と、認識部204とから構成されている。
【0003】画像入力部201は、複数方向から撮影さ
れた複数の画像を獲得する。辞書記憶部202には、あ
らかじめM次元の部分空間で表現された辞書データが、
カテゴリごとに用意されている。部分空間間の角度計算
部203は、まず画像入力部201によって獲得された
入力画像群をN次元部分空間で表現する。具体的には、
画像を1次元特徴データとみなして主成分分析し、N個
の固有ベクトルを抽出する。部分空間間の角度計算部2
03は、さらに入力画像のN次元部分空間と辞書のM次
元部分空間との角度Θを、辞書のカテゴリごとに計算す
る。認識部204は、部分空間間の角度計算部203に
おいて算出された角度Θを比較し、角度Θが最も小さい
カテゴリを認識結果として出力する。
れた複数の画像を獲得する。辞書記憶部202には、あ
らかじめM次元の部分空間で表現された辞書データが、
カテゴリごとに用意されている。部分空間間の角度計算
部203は、まず画像入力部201によって獲得された
入力画像群をN次元部分空間で表現する。具体的には、
画像を1次元特徴データとみなして主成分分析し、N個
の固有ベクトルを抽出する。部分空間間の角度計算部2
03は、さらに入力画像のN次元部分空間と辞書のM次
元部分空間との角度Θを、辞書のカテゴリごとに計算す
る。認識部204は、部分空間間の角度計算部203に
おいて算出された角度Θを比較し、角度Θが最も小さい
カテゴリを認識結果として出力する。
【0004】従来の画像認識システムによる認識原理に
ついて、さらに説明する。図15は、辞書部分空間と入
力部分空間との関係を示す概念図である。辞書部分空間
211の基底ベクトルをΦm (m=1,2,…,M)と
し、入力部分空間212の基底ベクトルをΨn (n=
1,2,…,N)とすると、部分空間間の角度計算部2
03によって式(1)又は式(2)のxijを要素にもつ行列
Xを計算する。
ついて、さらに説明する。図15は、辞書部分空間と入
力部分空間との関係を示す概念図である。辞書部分空間
211の基底ベクトルをΦm (m=1,2,…,M)と
し、入力部分空間212の基底ベクトルをΨn (n=
1,2,…,N)とすると、部分空間間の角度計算部2
03によって式(1)又は式(2)のxijを要素にもつ行列
Xを計算する。
【0005】
【数1】
【0006】
【数2】
【0007】行列Xの最大固有値として、部分空間21
1,212間の角度Θの余弦の二乗が求められる。角度
Θの余弦の二乗が大きい(または、小さい)とき、角度
Θは小さく(または、大きく)なり、また角度Θが小さ
い(または、大きい)とき、部分空間211,212間
の類似度が大きく(または、小さく)なる。したがっ
て、部分空間211,212間の角度Θの余弦の二乗
は、部分空間211,212間の類似度と言い換えるこ
とができる。よって、図14に示した従来の画像認識シ
ステムでは、行列Xの最大固有値を類似度とし、認識部
204によって入力画像を類似度が最大のカテゴリに分
類する。この従来の画像認識システムは、入力画像とし
て複数の画像を用いるので、1枚の入力画像を用いて認
識するシステムに比べると、誤分類が少ないという特徴
がある。
1,212間の角度Θの余弦の二乗が求められる。角度
Θの余弦の二乗が大きい(または、小さい)とき、角度
Θは小さく(または、大きく)なり、また角度Θが小さ
い(または、大きい)とき、部分空間211,212間
の類似度が大きく(または、小さく)なる。したがっ
て、部分空間211,212間の角度Θの余弦の二乗
は、部分空間211,212間の類似度と言い換えるこ
とができる。よって、図14に示した従来の画像認識シ
ステムでは、行列Xの最大固有値を類似度とし、認識部
204によって入力画像を類似度が最大のカテゴリに分
類する。この従来の画像認識システムは、入力画像とし
て複数の画像を用いるので、1枚の入力画像を用いて認
識するシステムに比べると、誤分類が少ないという特徴
がある。
【0008】
【発明が解決しようとする課題】同一物体であっても、
その物体への照明や物体の向き・変形によって、カメラ
等によって撮像された画像データが大きく影響を受ける
場合がある。ところが、図14に示した従来の画像認識
システムでは、限られた次元(ここではM次元)の辞書
部分空間211がパターン認識に用いられるため、同一
物体であっても辞書部分空間211の生成に用いられた
画像データと大きく異なるような入力画像群が入力され
ると、誤分類される虞があった。本発明はこのような課
題を解決するためになされたものであり、その目的は、
辞書の生成に用いられる画像データに大きく依存するこ
となく、未知の入力画像群を正しく分類することにあ
る。
その物体への照明や物体の向き・変形によって、カメラ
等によって撮像された画像データが大きく影響を受ける
場合がある。ところが、図14に示した従来の画像認識
システムでは、限られた次元(ここではM次元)の辞書
部分空間211がパターン認識に用いられるため、同一
物体であっても辞書部分空間211の生成に用いられた
画像データと大きく異なるような入力画像群が入力され
ると、誤分類される虞があった。本発明はこのような課
題を解決するためになされたものであり、その目的は、
辞書の生成に用いられる画像データに大きく依存するこ
となく、未知の入力画像群を正しく分類することにあ
る。
【0009】
【課題を解決するための手段】このような目的を達成す
るために、本発明の画像認識システムは、少なくとも1
個の入力画像特徴データからなる入力画像特徴データ群
からこの入力画像特徴データ群の特徴を表すK個(Kは
自然数)の入力代表ベクトルを生成する入力代表ベクト
ル生成手段と、C個(Cは自然数)のクラスそれぞれの
補空間基底データであるそのクラス以外のデータを表す
部分空間の基底ベクトルを辞書データとして格納する辞
書データ格納手段と、K個の入力代表ベクトルによって
規定される空間と前記クラスとの距離を示す統合距離を
C個のクラスそれぞれに対し補空間基底データを用いて
算出する統合距離算出手段と、この統合距離算出手段に
よって算出されたC個の統合距離に基づいて入力画像特
徴データ群に対する認識結果を出力する識別手段とを備
えたことを特徴とする。辞書に含まれない空間である辞
書部分空間の補空間は、辞書部分空間に比べて一般に遥
かに大きい空間である。この辞書部分空間の補空間を利
用することにより、辞書部分空間に対する誤差の影響が
少なくなり、辞書部分空間の生成に用いられる画像デー
タへの依存度が減少する。
るために、本発明の画像認識システムは、少なくとも1
個の入力画像特徴データからなる入力画像特徴データ群
からこの入力画像特徴データ群の特徴を表すK個(Kは
自然数)の入力代表ベクトルを生成する入力代表ベクト
ル生成手段と、C個(Cは自然数)のクラスそれぞれの
補空間基底データであるそのクラス以外のデータを表す
部分空間の基底ベクトルを辞書データとして格納する辞
書データ格納手段と、K個の入力代表ベクトルによって
規定される空間と前記クラスとの距離を示す統合距離を
C個のクラスそれぞれに対し補空間基底データを用いて
算出する統合距離算出手段と、この統合距離算出手段に
よって算出されたC個の統合距離に基づいて入力画像特
徴データ群に対する認識結果を出力する識別手段とを備
えたことを特徴とする。辞書に含まれない空間である辞
書部分空間の補空間は、辞書部分空間に比べて一般に遥
かに大きい空間である。この辞書部分空間の補空間を利
用することにより、辞書部分空間に対する誤差の影響が
少なくなり、辞書部分空間の生成に用いられる画像デー
タへの依存度が減少する。
【0010】上述した画像認識システムは、さらに、前
記クラスに属する複数の学習用画像特徴データから補空
間基底データを算出し辞書データ格納手段に出力する辞
書生成手段を備えていてもよい。これにより、辞書デー
タの内容を随時更新することができる。この辞書生成手
段は、複数の学習用画像特徴データから固有ベクトルを
求めるクラス内固有ベクトル算出手段と、このクラス内
固有ベクトル算出手段によって求められた固有ベクトル
のうち対応する固有値の小さい方からKc個(Kcは自
然数)の固有ベクトルを補空間基底データとして抽出す
る補空間基底ベクトル抽出手段とから構成されていても
よい。
記クラスに属する複数の学習用画像特徴データから補空
間基底データを算出し辞書データ格納手段に出力する辞
書生成手段を備えていてもよい。これにより、辞書デー
タの内容を随時更新することができる。この辞書生成手
段は、複数の学習用画像特徴データから固有ベクトルを
求めるクラス内固有ベクトル算出手段と、このクラス内
固有ベクトル算出手段によって求められた固有ベクトル
のうち対応する固有値の小さい方からKc個(Kcは自
然数)の固有ベクトルを補空間基底データとして抽出す
る補空間基底ベクトル抽出手段とから構成されていても
よい。
【0011】また、上述した画像認識システムにおい
て、入力代表ベクトル生成手段は、入力画像特徴データ
群から固有ベクトルを求める固有ベクトル算出手段と、
この固有ベクトル算出手段によって求められた固有ベク
トルのうち対応する固有値が大きいK個の固有ベクトル
を入力代表ベクトルとして抽出する代表ベクトル選択手
段とから構成されていてもよい。あるいは、入力代表ベ
クトル生成手段は、入力画像特徴データ群に対してK平
均アルゴリズムを実行しK個の入力代表ベクトルを得る
K平均ベクトル算出手段から構成されていてもよい。
て、入力代表ベクトル生成手段は、入力画像特徴データ
群から固有ベクトルを求める固有ベクトル算出手段と、
この固有ベクトル算出手段によって求められた固有ベク
トルのうち対応する固有値が大きいK個の固有ベクトル
を入力代表ベクトルとして抽出する代表ベクトル選択手
段とから構成されていてもよい。あるいは、入力代表ベ
クトル生成手段は、入力画像特徴データ群に対してK平
均アルゴリズムを実行しK個の入力代表ベクトルを得る
K平均ベクトル算出手段から構成されていてもよい。
【0012】また、行列Wをその各行がそれぞれ1つの
入力代表ベクトルからなるK×Dの行列とし、行列Fを
1つのクラスの補空間基底データを示しその各行がそれ
ぞれ1つの基底ベクトルからなるKc×Dの行列とする
と、上述した画像認識システムにおいて、統合距離算出
手段は、少なくとも、行列Wと行列Fとから下記の式
(3)によって行列Zを算出する行列演算手段と、この
行列演算手段によって算出された行列Zの固有値を算出
する固有値算出手段とを有する構成としてもよい。 X=W・Ft , Z=X・Xt ・・・(3) (右上の添え字tは転置を表す) また、統合距離算出手段は、さらに、行列Zの固有値の
最小値を算出して統合距離とする最小値算出手段を有し
ていてもよい。
入力代表ベクトルからなるK×Dの行列とし、行列Fを
1つのクラスの補空間基底データを示しその各行がそれ
ぞれ1つの基底ベクトルからなるKc×Dの行列とする
と、上述した画像認識システムにおいて、統合距離算出
手段は、少なくとも、行列Wと行列Fとから下記の式
(3)によって行列Zを算出する行列演算手段と、この
行列演算手段によって算出された行列Zの固有値を算出
する固有値算出手段とを有する構成としてもよい。 X=W・Ft , Z=X・Xt ・・・(3) (右上の添え字tは転置を表す) また、統合距離算出手段は、さらに、行列Zの固有値の
最小値を算出して統合距離とする最小値算出手段を有し
ていてもよい。
【0013】また、上述した画像認識システムにおい
て、識別手段は、少なくとも、統合距離算出手段によっ
て算出されたC個の統合距離の最小値を求める最小値算
出手段を有する構成としてもよい。この統合距離が最小
のクラスを認識結果として出力してもよい。また、識別
手段は、最小値算出手段によって求められた最小値が閾
値より小さければ統合距離が最小のクラスを認識結果と
して出力し、閾値以上であれば該当クラスなしと判定す
る閾値処理手段を更に有していてもよい。なお、最小値
算出手段によって求められた最小値が閾値以下であれば
統合距離が最小のクラスを認識結果として出力し、閾値
より大きければ該当クラスなしと判定するようにしても
よいことは言うまでもない。
て、識別手段は、少なくとも、統合距離算出手段によっ
て算出されたC個の統合距離の最小値を求める最小値算
出手段を有する構成としてもよい。この統合距離が最小
のクラスを認識結果として出力してもよい。また、識別
手段は、最小値算出手段によって求められた最小値が閾
値より小さければ統合距離が最小のクラスを認識結果と
して出力し、閾値以上であれば該当クラスなしと判定す
る閾値処理手段を更に有していてもよい。なお、最小値
算出手段によって求められた最小値が閾値以下であれば
統合距離が最小のクラスを認識結果として出力し、閾値
より大きければ該当クラスなしと判定するようにしても
よいことは言うまでもない。
【0014】また、本発明の画像認識プログラムは、少
なくとも1個の入力画像特徴データからなる入力画像特
徴データ群からこの入力画像特徴データ群の特徴を表す
K個(Kは自然数)の入力代表ベクトルを生成する第1
の処理と、K個の入力代表ベクトルによって規定される
空間と登録されているC個のクラスそれぞれとの統合距
離をC個のクラスそれぞれの補空間基底データを用いて
算出する第2の処理と、算出したC個の統合距離に基づ
いて入力画像特徴データ群に対する認識結果を出力する
第3の処理とをコンピュータに実行させるためのプログ
ラムである。
なくとも1個の入力画像特徴データからなる入力画像特
徴データ群からこの入力画像特徴データ群の特徴を表す
K個(Kは自然数)の入力代表ベクトルを生成する第1
の処理と、K個の入力代表ベクトルによって規定される
空間と登録されているC個のクラスそれぞれとの統合距
離をC個のクラスそれぞれの補空間基底データを用いて
算出する第2の処理と、算出したC個の統合距離に基づ
いて入力画像特徴データ群に対する認識結果を出力する
第3の処理とをコンピュータに実行させるためのプログ
ラムである。
【0015】この画像認識プログラムは、さらに、前記
クラスに属する複数の学習用画像特徴データから補空間
基底データを算出して辞書を生成する処理をコンピュー
タに実行させるためのプログラムを有していてもよい。
この辞書を生成する処理として、複数の学習用画像特徴
データから固有ベクトルを求める処理と、この処理によ
って求められた固有ベクトルのうち対応する固有値の小
さい方からKc個(Kcは自然数)の固有ベクトルを補
空間基底データとして抽出する処理とをコンピュータに
実行させるためのプログラムであってもよい。
クラスに属する複数の学習用画像特徴データから補空間
基底データを算出して辞書を生成する処理をコンピュー
タに実行させるためのプログラムを有していてもよい。
この辞書を生成する処理として、複数の学習用画像特徴
データから固有ベクトルを求める処理と、この処理によ
って求められた固有ベクトルのうち対応する固有値の小
さい方からKc個(Kcは自然数)の固有ベクトルを補
空間基底データとして抽出する処理とをコンピュータに
実行させるためのプログラムであってもよい。
【0016】また、上述した画像認識プログラムは、第
1の処理として、入力画像特徴データ群から固有ベクト
ルを求める処理と、この処理によって求められた固有ベ
クトルのうち対応する固有値が大きいK個の固有ベクト
ルを入力代表ベクトルとして抽出する処理とをコンピュ
ータに実行させるためのプログラムであってもよい。あ
るいは、第1の処理として、入力画像特徴データ群に対
してK平均アルゴリズムを実行しK個の入力代表ベクト
ルを得る処理をコンピュータに実行させるためのプログ
ラムであってもよい。
1の処理として、入力画像特徴データ群から固有ベクト
ルを求める処理と、この処理によって求められた固有ベ
クトルのうち対応する固有値が大きいK個の固有ベクト
ルを入力代表ベクトルとして抽出する処理とをコンピュ
ータに実行させるためのプログラムであってもよい。あ
るいは、第1の処理として、入力画像特徴データ群に対
してK平均アルゴリズムを実行しK個の入力代表ベクト
ルを得る処理をコンピュータに実行させるためのプログ
ラムであってもよい。
【0017】また、行列Wをその各行がそれぞれ1つの
入力代表ベクトルからなるK×Dの行列とし、行列Fを
1つのクラスの補空間基底データを示しその各行がそれ
ぞれ1つの基底ベクトルからなるKc×Dの行列とする
と、上述した画像認識プログラムは、第2の処理とし
て、少なくとも、行列Wと行列Fとから下記の式(4)
によって行列Zを算出する処理と、この処理によって算
出された行列Zの固有値を算出する処理とをコンピュー
タに実行させるためのプログラムであってもよい。 X=W・Ft , Z=X・Xt ・・・(4) (右上の添え字tは転置を表す) また、第2の処理として、さらに、行列Zの固有値の最
小値を算出して統合距離とする処理をコンピュータに実
行させるためのプログラムであってもよい。
入力代表ベクトルからなるK×Dの行列とし、行列Fを
1つのクラスの補空間基底データを示しその各行がそれ
ぞれ1つの基底ベクトルからなるKc×Dの行列とする
と、上述した画像認識プログラムは、第2の処理とし
て、少なくとも、行列Wと行列Fとから下記の式(4)
によって行列Zを算出する処理と、この処理によって算
出された行列Zの固有値を算出する処理とをコンピュー
タに実行させるためのプログラムであってもよい。 X=W・Ft , Z=X・Xt ・・・(4) (右上の添え字tは転置を表す) また、第2の処理として、さらに、行列Zの固有値の最
小値を算出して統合距離とする処理をコンピュータに実
行させるためのプログラムであってもよい。
【0018】また、上述した画像認識プログラムは、第
3の処理として、少なくとも、第2の処理によって算出
されたC個の統合距離の最小値を求める処理をコンピュ
ータに実行させるためのプログラムであってもよい。こ
の統合距離が最小のクラスを認識結果として出力するよ
うにしてもよい。また、第3の処理として、さらに、C
個の統合距離の最小値が閾値より小さければ統合距離が
最小のクラスを認識結果として出力し、閾値以上であれ
ば該当クラスなしと判定する処理をコンピュータに実行
させるためのプログラムであってもよい。なお、最小値
が閾値以下であれば統合距離が最小のクラスを認識結果
として出力し、閾値より大きければ該当クラスなしと判
定するようにしてもよいことは言うまでもない。
3の処理として、少なくとも、第2の処理によって算出
されたC個の統合距離の最小値を求める処理をコンピュ
ータに実行させるためのプログラムであってもよい。こ
の統合距離が最小のクラスを認識結果として出力するよ
うにしてもよい。また、第3の処理として、さらに、C
個の統合距離の最小値が閾値より小さければ統合距離が
最小のクラスを認識結果として出力し、閾値以上であれ
ば該当クラスなしと判定する処理をコンピュータに実行
させるためのプログラムであってもよい。なお、最小値
が閾値以下であれば統合距離が最小のクラスを認識結果
として出力し、閾値より大きければ該当クラスなしと判
定するようにしてもよいことは言うまでもない。
【0019】
【発明の実施の形態】次に、図面を参照して、本発明の
実施の形態について詳細に説明する。
実施の形態について詳細に説明する。
【0020】(第1の実施の形態)図1は、本発明の画
像認識システムの第1の実施の形態の構成を示すブロッ
ク図である。図2は、画像認識システムが有する入力代
表ベクトル生成手段の一構成例を示すブロック図であ
る。図3は、画像認識システムが有する入力代表ベクト
ル生成手段の他の構成例を示すブロック図である。図4
は、画像認識システムが有する辞書データ格納手段の構
成を示すブロック図である。図5は、統合距離について
説明するための概念図である。図6は、画像認識システ
ムが有する統合距離算出手段の構成を示すブロック図で
ある。図7は、画像認識システムが有する識別手段の構
成を示すブロック図である。図8は、画像認識システム
が有する辞書生成手段の構成を示すブロック図である。
像認識システムの第1の実施の形態の構成を示すブロッ
ク図である。図2は、画像認識システムが有する入力代
表ベクトル生成手段の一構成例を示すブロック図であ
る。図3は、画像認識システムが有する入力代表ベクト
ル生成手段の他の構成例を示すブロック図である。図4
は、画像認識システムが有する辞書データ格納手段の構
成を示すブロック図である。図5は、統合距離について
説明するための概念図である。図6は、画像認識システ
ムが有する統合距離算出手段の構成を示すブロック図で
ある。図7は、画像認識システムが有する識別手段の構
成を示すブロック図である。図8は、画像認識システム
が有する辞書生成手段の構成を示すブロック図である。
【0021】図1に示されている画像認識システムは、
少なくとも1個の入力画像データが入力される識別対象
画像群入力手段1と、特徴抽出手段2と、入力代表ベク
トル生成手段3と、辞書データ格納手段4と、統合距離
算出手段5と、識別手段6と、学習画像群入力手段7
と、辞書生成手段8とから構成されている。識別対象画
像群入力手段1は、ビデオカメラ等によって同一物体を
撮影したN枚(Nは自然数)の静止画像を獲得する。
少なくとも1個の入力画像データが入力される識別対象
画像群入力手段1と、特徴抽出手段2と、入力代表ベク
トル生成手段3と、辞書データ格納手段4と、統合距離
算出手段5と、識別手段6と、学習画像群入力手段7
と、辞書生成手段8とから構成されている。識別対象画
像群入力手段1は、ビデオカメラ等によって同一物体を
撮影したN枚(Nは自然数)の静止画像を獲得する。
【0022】特徴抽出手段2は、識別対象画像群入力手
段1より入力されたN枚の画像データから、認識に用い
る入力画像特徴データを特徴抽出し、入力代表ベクトル
生成手段に出力する。また、学習画像群入力手段7より
入力された複数の学習用画像データから、辞書データの
作成に用いる学習用画像特徴データを特徴抽出し、辞書
生成手段8に出力する。特徴抽出手段2の一例として、
元の画像データに1次微分、2次微分フィルタを作用さ
せた出力を、ラスタースキャンして1次元特徴データと
して出力するものがある。また特徴抽出手段2の他の例
として、元の画像データをラスタースキャンして1次元
特徴データとし、その平均を0、分散を1.0とするよ
うに、平均と分散を一定値に正規化するものがある。
段1より入力されたN枚の画像データから、認識に用い
る入力画像特徴データを特徴抽出し、入力代表ベクトル
生成手段に出力する。また、学習画像群入力手段7より
入力された複数の学習用画像データから、辞書データの
作成に用いる学習用画像特徴データを特徴抽出し、辞書
生成手段8に出力する。特徴抽出手段2の一例として、
元の画像データに1次微分、2次微分フィルタを作用さ
せた出力を、ラスタースキャンして1次元特徴データと
して出力するものがある。また特徴抽出手段2の他の例
として、元の画像データをラスタースキャンして1次元
特徴データとし、その平均を0、分散を1.0とするよ
うに、平均と分散を一定値に正規化するものがある。
【0023】入力代表ベクトル生成手段3は、特徴抽出
手段2より入力されたN個の入力画像特徴データからな
る入力画像特徴データ群を基に、この入力画像特徴デー
タ群の特徴を表現する規格化されたK個の特徴ベクトル
である入力代表ベクトルを抽出する。入力画像特徴デー
タの特徴次元数をDとすると、Kは1より大きく、mi
n(N,D)以下の自然数である。min(N,D)
は、NとDの小さい方の数を表す。
手段2より入力されたN個の入力画像特徴データからな
る入力画像特徴データ群を基に、この入力画像特徴デー
タ群の特徴を表現する規格化されたK個の特徴ベクトル
である入力代表ベクトルを抽出する。入力画像特徴デー
タの特徴次元数をDとすると、Kは1より大きく、mi
n(N,D)以下の自然数である。min(N,D)
は、NとDの小さい方の数を表す。
【0024】入力代表ベクトル生成手段3の一例とし
て、図2に示す入力代表ベクトル生成手段3Aがある。
この入力代表ベクトル生成手段3Aは、固有ベクトル算
出手段31と、代表ベクトル選択手段32とから構成さ
れている。固有ベクトル算出手段31は、入力画像特徴
データ群を主成分分析し、固有値と固有ベクトルを求め
る。固有ベクトルは、入力画像特徴データの特徴次元数
をD、データ個数をNとすると、min(N,D)個求
められる。固有ベクトルの求め方は、一般的な多変量解
析の文献に述べられており、例えば文献1(田中、脇本
著、「多変量統計解析法」、現代数学社、pp.71-79, 19
83)がある。
て、図2に示す入力代表ベクトル生成手段3Aがある。
この入力代表ベクトル生成手段3Aは、固有ベクトル算
出手段31と、代表ベクトル選択手段32とから構成さ
れている。固有ベクトル算出手段31は、入力画像特徴
データ群を主成分分析し、固有値と固有ベクトルを求め
る。固有ベクトルは、入力画像特徴データの特徴次元数
をD、データ個数をNとすると、min(N,D)個求
められる。固有ベクトルの求め方は、一般的な多変量解
析の文献に述べられており、例えば文献1(田中、脇本
著、「多変量統計解析法」、現代数学社、pp.71-79, 19
83)がある。
【0025】代表ベクトル選択手段32は、固有ベクト
ル算出手段31によって求められた固有ベクトルのう
ち、対応する固有値が大きいK個の固有ベクトルを選択
し、入力代表ベクトルとして出力する。Kの値はあらか
じめ与えられることもあるが、以下のように動的に求め
ることもできる。まず、累積寄与率を、(選択したK個
の固有値の和)/(全固有値の和)と定義する。固有値
の大きいものから選択してKを増加させていき、累積寄
与率がα%を超えたときのK値と、K個の固有ベクトル
を採用する。また、Kの値をあらかじめ決めておき、累
積寄与率がα%以上となるようにK個の固有ベクトルを
任意に選択する方法もある。αの値は実験的に60%程
度で十分である。
ル算出手段31によって求められた固有ベクトルのう
ち、対応する固有値が大きいK個の固有ベクトルを選択
し、入力代表ベクトルとして出力する。Kの値はあらか
じめ与えられることもあるが、以下のように動的に求め
ることもできる。まず、累積寄与率を、(選択したK個
の固有値の和)/(全固有値の和)と定義する。固有値
の大きいものから選択してKを増加させていき、累積寄
与率がα%を超えたときのK値と、K個の固有ベクトル
を採用する。また、Kの値をあらかじめ決めておき、累
積寄与率がα%以上となるようにK個の固有ベクトルを
任意に選択する方法もある。αの値は実験的に60%程
度で十分である。
【0026】入力代表ベクトル生成手段3の他の例とし
て、図3に示す入力代表ベクトル生成手段3Bがある。
この入力代表ベクトル生成手段3Bは、K平均ベクトル
算出手段34から構成されている。K平均ベクトル算出
手段34は、パターン認識の分野で知られているK平均
アルゴリズムによって、入力画像特徴データ群からK個
の入力代表ベクトルを計算する。K平均アルゴリズムは
代表的なクラスタリング手法であり、文献2(長尾、
「パターン情報処理」、コロナ社, pp.117-118,1983)
などに述べられている。この場合、Kの値は事前に与え
られる。
て、図3に示す入力代表ベクトル生成手段3Bがある。
この入力代表ベクトル生成手段3Bは、K平均ベクトル
算出手段34から構成されている。K平均ベクトル算出
手段34は、パターン認識の分野で知られているK平均
アルゴリズムによって、入力画像特徴データ群からK個
の入力代表ベクトルを計算する。K平均アルゴリズムは
代表的なクラスタリング手法であり、文献2(長尾、
「パターン情報処理」、コロナ社, pp.117-118,1983)
などに述べられている。この場合、Kの値は事前に与え
られる。
【0027】図1において、辞書データ格納手段4は、
統合距離算出に用いられる辞書データを格納するもので
あり、例えば図4に示すようにC個(Cは自然数)の補
空間基底データ、すなわちクラス1の補空間基底データ
41と、クラス2の補空間基底データ42と、クラス3
の補空間基底データ43と、・・・、クラスCの補空間
基底データ4Cとを格納している。クラスCの補空間基
底データ4Cは、Kc個(Kcは自然数)の補空間基底
ベクトルを含んでおり、そのKc個の補空間基底ベクト
ルは、クラスC以外のデータを表す部分空間の基底ベク
トルである。
統合距離算出に用いられる辞書データを格納するもので
あり、例えば図4に示すようにC個(Cは自然数)の補
空間基底データ、すなわちクラス1の補空間基底データ
41と、クラス2の補空間基底データ42と、クラス3
の補空間基底データ43と、・・・、クラスCの補空間
基底データ4Cとを格納している。クラスCの補空間基
底データ4Cは、Kc個(Kcは自然数)の補空間基底
ベクトルを含んでおり、そのKc個の補空間基底ベクト
ルは、クラスC以外のデータを表す部分空間の基底ベク
トルである。
【0028】統合距離算出手段5は、入力代表ベクトル
生成手段3より入力されたK個の入力代表ベクトルによ
って規定される空間と、辞書データによって表される部
分空間との距離を示す数値である統合距離を、C個のク
ラスそれぞれに対して算出する。ここで、この統合距離
について図5を参照して説明する。入力画像特徴データ
群は、入力特徴ベクトル分布91に分布している。この
入力特徴ベクトル分布91と辞書部分空間93との距離
が、統合距離95である。入力特徴ベクトルの中から選
択された入力代表ベクトル921 ,922 と辞書部分空
間93との距離はそれぞれD1 ,D2 で表されるが、こ
れらの距離は入力代表ベクトル921 ,922 を辞書部
分空間93に直交する空間である直交補空間94へ射影
したときの射影ベクトルの長さである。統合距離95は
入力代表ベクトル921 ,922 それぞれの直交補空間
94への射影を元に計算することができる。
生成手段3より入力されたK個の入力代表ベクトルによ
って規定される空間と、辞書データによって表される部
分空間との距離を示す数値である統合距離を、C個のク
ラスそれぞれに対して算出する。ここで、この統合距離
について図5を参照して説明する。入力画像特徴データ
群は、入力特徴ベクトル分布91に分布している。この
入力特徴ベクトル分布91と辞書部分空間93との距離
が、統合距離95である。入力特徴ベクトルの中から選
択された入力代表ベクトル921 ,922 と辞書部分空
間93との距離はそれぞれD1 ,D2 で表されるが、こ
れらの距離は入力代表ベクトル921 ,922 を辞書部
分空間93に直交する空間である直交補空間94へ射影
したときの射影ベクトルの長さである。統合距離95は
入力代表ベクトル921 ,922 それぞれの直交補空間
94への射影を元に計算することができる。
【0029】統合距離算出手段5は、例えば図6に示す
ように、行列演算手段51と、固有値算出手段52と、
最小値算出手段53とから構成される。統合距離算出手
段5の各構成要素の機能を説明するために、以下のよう
に定義する。すなわち、K個の入力代表ベクトルを行列
Wで表す。行列Wの各行はそれぞれ1つの入力代表ベク
トルからなり、入力代表ベクトルの特徴次元数がDであ
るとき、行列WはK×Dの行列である。また、クラスC
の補空間基底データ4Cを行列Fで表す。行列Fの各行
はそれぞれ1つの補空間基底ベクトル(要素数は特徴次
元数D)からなり、行列FはKc×Dの行列である。ま
た、行列Zを式(3)で定義する。ただし、右上の添え
字tは転置を表す。 X=W・Ft , Z=X・Xt ・・・(5)
ように、行列演算手段51と、固有値算出手段52と、
最小値算出手段53とから構成される。統合距離算出手
段5の各構成要素の機能を説明するために、以下のよう
に定義する。すなわち、K個の入力代表ベクトルを行列
Wで表す。行列Wの各行はそれぞれ1つの入力代表ベク
トルからなり、入力代表ベクトルの特徴次元数がDであ
るとき、行列WはK×Dの行列である。また、クラスC
の補空間基底データ4Cを行列Fで表す。行列Fの各行
はそれぞれ1つの補空間基底ベクトル(要素数は特徴次
元数D)からなり、行列FはKc×Dの行列である。ま
た、行列Zを式(3)で定義する。ただし、右上の添え
字tは転置を表す。 X=W・Ft , Z=X・Xt ・・・(5)
【0030】上述した統合距離算出手段5における行列
演算手段51は、式(5)によって行列Zを算出する。
固有値算出手段52は、行列演算手段51によって算出
された行列ZのK個の固有値を求める。行列Zの固有値
は補空間基底への射影の長さを統合したものとなり、図
5における統合距離95と意味的に等価となる。最小値
算出手段53は、固有値算出手段52によって求められ
たK個の固有値の中の最小値を求め、この最小値を統合
距離として出力する。なお、統合距離として行列Zの固
有値の最大値を選ぶようにしてもよい。また、統合距離
として、行列Zの各種ノルムを用いることもできる。行
列Zのノルムの例としては、Zの要素をaijとすると、
以下のものがある。
演算手段51は、式(5)によって行列Zを算出する。
固有値算出手段52は、行列演算手段51によって算出
された行列ZのK個の固有値を求める。行列Zの固有値
は補空間基底への射影の長さを統合したものとなり、図
5における統合距離95と意味的に等価となる。最小値
算出手段53は、固有値算出手段52によって求められ
たK個の固有値の中の最小値を求め、この最小値を統合
距離として出力する。なお、統合距離として行列Zの固
有値の最大値を選ぶようにしてもよい。また、統合距離
として、行列Zの各種ノルムを用いることもできる。行
列Zのノルムの例としては、Zの要素をaijとすると、
以下のものがある。
【0031】
【数3】
【0032】
【数4】
【0033】
【数5】
【0034】図1において、識別手段6は、統合距離算
出手段5によって算出されたC個の統合距離の値に基づ
いて、入力画像データに対する認識結果を出力する。こ
の識別手段6は、例えば図7に示すように、最小値算出
手段61と、閾値処理手段62とから構成される。最小
値算出手段61は、C個のクラスそれぞれへの統合距離
が入力されると、その中の最小値を求める。閾値処理手
段62は、最小値算出手段61によって求められた最小
値が、あらかじめ決められた閾値より小さければ、該当
するクラス番号を認識結果として出力する。逆に、閾値
以上であれば、入力パターンはどのクラスからも遠い距
離にあると考え、辞書には存在しないパターンという認
識結果を出力する。
出手段5によって算出されたC個の統合距離の値に基づ
いて、入力画像データに対する認識結果を出力する。こ
の識別手段6は、例えば図7に示すように、最小値算出
手段61と、閾値処理手段62とから構成される。最小
値算出手段61は、C個のクラスそれぞれへの統合距離
が入力されると、その中の最小値を求める。閾値処理手
段62は、最小値算出手段61によって求められた最小
値が、あらかじめ決められた閾値より小さければ、該当
するクラス番号を認識結果として出力する。逆に、閾値
以上であれば、入力パターンはどのクラスからも遠い距
離にあると考え、辞書には存在しないパターンという認
識結果を出力する。
【0035】学習画像群入力手段7は、辞書データの作
成に用いる複数の学習用画像をビデオカメラ等から獲得
する。この学習画像群入力手段7によって獲得された学
習用画像は特徴抽出手段2に出力され、上述したように
学習用画像特徴データが特徴抽出される。辞書生成手段
8は、特徴抽出手段2より入力された複数の学習用画像
特徴データからなる学習用画像特徴データ群を基に、辞
書データを生成し、辞書データ格納手段4に出力する。
辞書データを構成するクラスCの補空間基底ベクトル
は、クラスCではない特徴データを収集して主成分分析
し、固有ベクトルを求めることによっても得ることがで
きるが、クラスCではない特徴データは無限に存在する
ので、これらを収集することは現実的に不可能である。
よってクラスCに属する特徴データを用いて、クラスC
の補空間基底ベクトルを推定する。
成に用いる複数の学習用画像をビデオカメラ等から獲得
する。この学習画像群入力手段7によって獲得された学
習用画像は特徴抽出手段2に出力され、上述したように
学習用画像特徴データが特徴抽出される。辞書生成手段
8は、特徴抽出手段2より入力された複数の学習用画像
特徴データからなる学習用画像特徴データ群を基に、辞
書データを生成し、辞書データ格納手段4に出力する。
辞書データを構成するクラスCの補空間基底ベクトル
は、クラスCではない特徴データを収集して主成分分析
し、固有ベクトルを求めることによっても得ることがで
きるが、クラスCではない特徴データは無限に存在する
ので、これらを収集することは現実的に不可能である。
よってクラスCに属する特徴データを用いて、クラスC
の補空間基底ベクトルを推定する。
【0036】クラスCに属する特徴データを用いる辞書
生成手段8は、例えば図8に示すように、クラス内固有
ベクトル算出手段81と、補空間基底ベクトル抽出手段
82とから構成される。クラス内固有ベクトル算出手段
81は、クラスCに属する学習用画像特徴データを主成
分分析し、固有値と固有ベクトルを算出する。補空間基
底ベクトル抽出手段82は、クラス内固有ベクトル算出
手段81によって算出された固有ベクトルのうち、対応
する固有値の小さい方からKc個の固有ベクトルを補空
間基底ベクトルとして出力する。すなわち、クラスC内
において寄与率の低い成分を、クラスCに属さない空間
とみなすことによって、クラスCの補空間基底ベクトル
を得るのである。
生成手段8は、例えば図8に示すように、クラス内固有
ベクトル算出手段81と、補空間基底ベクトル抽出手段
82とから構成される。クラス内固有ベクトル算出手段
81は、クラスCに属する学習用画像特徴データを主成
分分析し、固有値と固有ベクトルを算出する。補空間基
底ベクトル抽出手段82は、クラス内固有ベクトル算出
手段81によって算出された固有ベクトルのうち、対応
する固有値の小さい方からKc個の固有ベクトルを補空
間基底ベクトルとして出力する。すなわち、クラスC内
において寄与率の低い成分を、クラスCに属さない空間
とみなすことによって、クラスCの補空間基底ベクトル
を得るのである。
【0037】具体的には、まず累積寄与率を(Kc個の
固有値の和)/(全固有値の和)と定義する。固有値の
小さい順にKc個の固有値を使って累積寄与率を計算す
る。Kcを1から順に増加させていき、累積寄与率があ
らかじめ決められたβ%以下となる最大のKcを求め
る。同時に対応する固有ベクトルを求め、これを補空間
基底ベクトルとする。βの値は実験的に20%あれば十
分である。
固有値の和)/(全固有値の和)と定義する。固有値の
小さい順にKc個の固有値を使って累積寄与率を計算す
る。Kcを1から順に増加させていき、累積寄与率があ
らかじめ決められたβ%以下となる最大のKcを求め
る。同時に対応する固有ベクトルを求め、これを補空間
基底ベクトルとする。βの値は実験的に20%あれば十
分である。
【0038】次に、図1に示した画像認識システムの認
識動作について説明する。図9は、この認識動作の流れ
を示すフローチャートである。また、図10は、認識対
象の入力画像の一例を示す概念図である。まず、識別対
象の画像データが入力される(図9のステップA1)。
この画像データは、図10に示す識別対象入力画像群の
ように、同じ物体を撮影した複数(N個)の画像データ
100からなる。つぎに、入力されたN個の画像データ
のそれぞれに対して特徴抽出を行い、N個の入力画像特
徴データを得る(図9のステップA2)。つぎに、得ら
れた入力画像特徴データ群から、その特徴を表現するK
個の入力代表ベクトルを生成する(図9のステップA
3)。
識動作について説明する。図9は、この認識動作の流れ
を示すフローチャートである。また、図10は、認識対
象の入力画像の一例を示す概念図である。まず、識別対
象の画像データが入力される(図9のステップA1)。
この画像データは、図10に示す識別対象入力画像群の
ように、同じ物体を撮影した複数(N個)の画像データ
100からなる。つぎに、入力されたN個の画像データ
のそれぞれに対して特徴抽出を行い、N個の入力画像特
徴データを得る(図9のステップA2)。つぎに、得ら
れた入力画像特徴データ群から、その特徴を表現するK
個の入力代表ベクトルを生成する(図9のステップA
3)。
【0039】つぎに、入力代表ベクトル群によって規定
される空間と、辞書内の1つのクラスの部分空間との統
合距離を計算する(図9のステップA4)。全クラスの
統合距離計算が終了したかどうかを判断し(図9のステ
ップA5)、終了していなければ次のクラスとの統合距
離を計算する。全クラスとの統合距離が算出されると、
それらの中で最小の距離を求める(図9のステップA
6)。つぎに、最小距離が閾値よりも小さいかどうかを
判断する(図9のステップA7)。最小距離が閾値より
も小さいときは、最小距離を持つクラス番号を認識結果
として出力して終了する(図9のステップA8)。逆
に、最小距離が閾値以上であるときは、該当クラスなし
を出力して終了する(図9のステップA9)。ここで
は、最小距離が閾値と等しい場合、ステップA8に移行
することとしたが、ステップA9に移行するようにして
もよいことは言うまでもない。
される空間と、辞書内の1つのクラスの部分空間との統
合距離を計算する(図9のステップA4)。全クラスの
統合距離計算が終了したかどうかを判断し(図9のステ
ップA5)、終了していなければ次のクラスとの統合距
離を計算する。全クラスとの統合距離が算出されると、
それらの中で最小の距離を求める(図9のステップA
6)。つぎに、最小距離が閾値よりも小さいかどうかを
判断する(図9のステップA7)。最小距離が閾値より
も小さいときは、最小距離を持つクラス番号を認識結果
として出力して終了する(図9のステップA8)。逆
に、最小距離が閾値以上であるときは、該当クラスなし
を出力して終了する(図9のステップA9)。ここで
は、最小距離が閾値と等しい場合、ステップA8に移行
することとしたが、ステップA9に移行するようにして
もよいことは言うまでもない。
【0040】次に、図1に示した画像認識システムの辞
書データ学習の動作について説明する。図11は、この
辞書データ学習の動作の流れを示すフローチャートであ
る。また、図12は、辞書作成に用いる学習用画像の例
を示す概念図である。まず、辞書作成に用いる学習用画
像データが入力される(図11のステップB1)。この
学習用画像データは、図12に示すように、クラス1の
学習データ101、クラス2の学習データ102、クラ
ス3の学習データ103のように、特定のクラスに属す
る画像群からなる。
書データ学習の動作について説明する。図11は、この
辞書データ学習の動作の流れを示すフローチャートであ
る。また、図12は、辞書作成に用いる学習用画像の例
を示す概念図である。まず、辞書作成に用いる学習用画
像データが入力される(図11のステップB1)。この
学習用画像データは、図12に示すように、クラス1の
学習データ101、クラス2の学習データ102、クラ
ス3の学習データ103のように、特定のクラスに属す
る画像群からなる。
【0041】つぎに、入力されたN′個の学習用画像デ
ータのそれぞれに対して特徴抽出を行い、N′個の学習
用画像特徴データを得る(図11のステップB2)。つ
ぎに、得られた学習用画像特徴データ群から補空間基底
データを生成する(図11のステップB3)。つぎに、
この補空間基底データを辞書データとして辞書データ格
納手段に格納する(図11のステップB4)。他のクラ
スの辞書を作成するかどうかを判断し(図11のステッ
プB5)、作成する場合は学習用画像データの入力(図
11のステップB1)から作業を続ける。作成が終了し
たら学習動作を終了する。
ータのそれぞれに対して特徴抽出を行い、N′個の学習
用画像特徴データを得る(図11のステップB2)。つ
ぎに、得られた学習用画像特徴データ群から補空間基底
データを生成する(図11のステップB3)。つぎに、
この補空間基底データを辞書データとして辞書データ格
納手段に格納する(図11のステップB4)。他のクラ
スの辞書を作成するかどうかを判断し(図11のステッ
プB5)、作成する場合は学習用画像データの入力(図
11のステップB1)から作業を続ける。作成が終了し
たら学習動作を終了する。
【0042】(第2の実施の形態)図13は、本発明の
画像認識システムの第2の実施の形態の構成を示すブロ
ック図である。この画像認識システムは、プログラム制
御により動作するコンピュータ110と、識別対象画像
及び学習用画像を取り込みコンピュータ110に出力す
るカメラ121と、コンピュータ110に対してオペレ
ータが認識の指示及び学習の指示を与えるための操作卓
122と、コンピュータ110から出力された認識結果
を表示する表示装置123とから構成されている。コン
ピュータ110は、演算処理部111と記憶部112と
インタフェース部(以下、I/F部という)1131 〜
1134 とがバス114に接続された構成となってい
る。I/F部1131 〜1133 は、コンピュータ11
0の外部装置であるカメラ121、操作卓122、表示
装置123とインタフェースをとる。
画像認識システムの第2の実施の形態の構成を示すブロ
ック図である。この画像認識システムは、プログラム制
御により動作するコンピュータ110と、識別対象画像
及び学習用画像を取り込みコンピュータ110に出力す
るカメラ121と、コンピュータ110に対してオペレ
ータが認識の指示及び学習の指示を与えるための操作卓
122と、コンピュータ110から出力された認識結果
を表示する表示装置123とから構成されている。コン
ピュータ110は、演算処理部111と記憶部112と
インタフェース部(以下、I/F部という)1131 〜
1134 とがバス114に接続された構成となってい
る。I/F部1131 〜1133 は、コンピュータ11
0の外部装置であるカメラ121、操作卓122、表示
装置123とインタフェースをとる。
【0043】コンピュータ110の動作を制御する画像
認識プログラムは、磁気ディスク、半導体メモリその他
の記録媒体124に記録された状態で提供される。この
記録媒体124をI/F部1134 に接続すると、演算
処理部111は記録媒体124に書き込まれた画像認識
プログラムを読み出し、記憶部112に格納する。しか
る後、操作卓122からの指示に基づき、演算処理部1
11が記憶部112に格納された画像認識プログラムを
実行し、図1に示した識別対象画像群入力手段1と、特
徴抽出手段2と、入力代表ベクトル生成手段3と、辞書
データ格納手段4と、統合距離算出手段5と、識別手段
6と、学習画像群入力手段7と、辞書生成手段8とを実
現する。なお、画像認識プログラムは、インターネット
などの電気通信回線を介して提供されてもよい。
認識プログラムは、磁気ディスク、半導体メモリその他
の記録媒体124に記録された状態で提供される。この
記録媒体124をI/F部1134 に接続すると、演算
処理部111は記録媒体124に書き込まれた画像認識
プログラムを読み出し、記憶部112に格納する。しか
る後、操作卓122からの指示に基づき、演算処理部1
11が記憶部112に格納された画像認識プログラムを
実行し、図1に示した識別対象画像群入力手段1と、特
徴抽出手段2と、入力代表ベクトル生成手段3と、辞書
データ格納手段4と、統合距離算出手段5と、識別手段
6と、学習画像群入力手段7と、辞書生成手段8とを実
現する。なお、画像認識プログラムは、インターネット
などの電気通信回線を介して提供されてもよい。
【0044】コンピュータ110は、図9及び図11の
フローチャートに示す動作を行う。すなわち、操作卓1
22より認識の指示があり、カメラ121から識別対象
の画像データが入力されると、特徴抽出を行い、得られ
た入力画像特徴データ群から入力代表ベクトル群を生成
する。つぎに、入力代表ベクトル群によって規定される
空間と、辞書内の1つのクラスの部分空間との統合距離
を計算する。全クラスの統合距離計算が終了したかどう
かを判断し、終了していなければ次のクラスとの統合距
離を計算する。全クラスとの統合距離が算出されると、
それらの中で最小の距離を求め、最小距離が閾値よりも
小さいかどうかを判断する。最小距離が閾値よりも小さ
いときは、最小距離を持つクラス番号を認識結果として
表示装置123に表示し、逆に最小距離が閾値以上であ
るときは、該当クラスがない旨を表示装置123に表示
する。
フローチャートに示す動作を行う。すなわち、操作卓1
22より認識の指示があり、カメラ121から識別対象
の画像データが入力されると、特徴抽出を行い、得られ
た入力画像特徴データ群から入力代表ベクトル群を生成
する。つぎに、入力代表ベクトル群によって規定される
空間と、辞書内の1つのクラスの部分空間との統合距離
を計算する。全クラスの統合距離計算が終了したかどう
かを判断し、終了していなければ次のクラスとの統合距
離を計算する。全クラスとの統合距離が算出されると、
それらの中で最小の距離を求め、最小距離が閾値よりも
小さいかどうかを判断する。最小距離が閾値よりも小さ
いときは、最小距離を持つクラス番号を認識結果として
表示装置123に表示し、逆に最小距離が閾値以上であ
るときは、該当クラスがない旨を表示装置123に表示
する。
【0045】また、操作卓122より学習の指示があ
り、カメラ121から学習用画像データが入力される
と、特徴抽出を行い、得られた学習用画像特徴データ群
から補空間基底データを生成し、記憶部112によって
構成される辞書データ格納手段に辞書データとして格納
する。つぎに、他のクラスの辞書を作成するかどうかを
判断し、作成する場合は学習用画像データの入力から作
業を続ける。作成が終了したら学習動作を終了する。
り、カメラ121から学習用画像データが入力される
と、特徴抽出を行い、得られた学習用画像特徴データ群
から補空間基底データを生成し、記憶部112によって
構成される辞書データ格納手段に辞書データとして格納
する。つぎに、他のクラスの辞書を作成するかどうかを
判断し、作成する場合は学習用画像データの入力から作
業を続ける。作成が終了したら学習動作を終了する。
【0046】
【発明の効果】以上説明したように、本発明の本発明の
画像認識システムは、K個の入力代表ベクトルによって
規定される空間と登録されているC個のクラスそれぞれ
との統合距離をC個のクラスそれぞれの補空間基底デー
タを用いて算出し、算出したC個の統合距離に基づいて
認識結果を出力するものである。また、本発明の画像認
識プログラムは、上記の処理をコンピュータに実行させ
るためのプログラムである。辞書に含まれない空間であ
る辞書部分空間の補空間は、辞書部分空間に比べて一般
に遥かに大きい空間である。この辞書部分空間の補空間
を利用することにより、辞書部分空間に対する誤差の影
響が少なくなり、辞書部分空間の生成に用いられる画像
データへの依存度が減少する。このため、同一物体の照
明による変動、向きによる変動、変形などを吸収し、頑
強な認識システムを構築することができる。
画像認識システムは、K個の入力代表ベクトルによって
規定される空間と登録されているC個のクラスそれぞれ
との統合距離をC個のクラスそれぞれの補空間基底デー
タを用いて算出し、算出したC個の統合距離に基づいて
認識結果を出力するものである。また、本発明の画像認
識プログラムは、上記の処理をコンピュータに実行させ
るためのプログラムである。辞書に含まれない空間であ
る辞書部分空間の補空間は、辞書部分空間に比べて一般
に遥かに大きい空間である。この辞書部分空間の補空間
を利用することにより、辞書部分空間に対する誤差の影
響が少なくなり、辞書部分空間の生成に用いられる画像
データへの依存度が減少する。このため、同一物体の照
明による変動、向きによる変動、変形などを吸収し、頑
強な認識システムを構築することができる。
【0047】また、前記クラスに属する複数の学習用画
像特徴データから補空間基底データを算出し辞書データ
格納手段に出力することにより、辞書データの内容を随
時更新し、急激な環境変化に対応することができる。ま
た、算出したC個の統合距離の最小値を求め、この最小
値が閾値より小さければ統合距離が最小のクラスを認識
結果として出力し、閾値以上であれば該当クラスなしと
判定することにより、例えば辞書に登録されているどの
クラスにも属しない物体を誤認識することを防止でき
る。
像特徴データから補空間基底データを算出し辞書データ
格納手段に出力することにより、辞書データの内容を随
時更新し、急激な環境変化に対応することができる。ま
た、算出したC個の統合距離の最小値を求め、この最小
値が閾値より小さければ統合距離が最小のクラスを認識
結果として出力し、閾値以上であれば該当クラスなしと
判定することにより、例えば辞書に登録されているどの
クラスにも属しない物体を誤認識することを防止でき
る。
【図1】 本発明の画像認識システムの第1の実施の形
態の構成を示すブロック図である。
態の構成を示すブロック図である。
【図2】 図1に示した画像認識システムが有する入力
代表ベクトル生成手段の一構成例を示すブロック図であ
る。
代表ベクトル生成手段の一構成例を示すブロック図であ
る。
【図3】 図1に示した画像認識システムが有する入力
代表ベクトル生成手段の他の構成例を示すブロック図で
ある。
代表ベクトル生成手段の他の構成例を示すブロック図で
ある。
【図4】 図1に示した画像認識システムが有する辞書
データ格納手段の構成を示すブロック図である。
データ格納手段の構成を示すブロック図である。
【図5】 統合距離について説明するための概念図であ
る。
る。
【図6】 図1に示した画像認識システムが有する統合
距離算出手段の構成を示すブロック図である。
距離算出手段の構成を示すブロック図である。
【図7】 図1に示した画像認識システムが有する識別
手段の構成を示すブロック図である。
手段の構成を示すブロック図である。
【図8】 図1に示した画像認識システムが有する辞書
生成手段の構成を示すブロック図である。
生成手段の構成を示すブロック図である。
【図9】 図1に示した画像認識システムの認識動作の
流れを示すフローチャートである。
流れを示すフローチャートである。
【図10】 認識対象の入力画像の一例を示す概念図で
ある。
ある。
【図11】 図1に示した画像認識システムの辞書デー
タ学習の動作の流れを示すフローチャートである。
タ学習の動作の流れを示すフローチャートである。
【図12】 辞書作成に用いる学習用画像の例を示す概
念図である。
念図である。
【図13】 本発明の画像認識システムの第2の実施の
形態の構成を示すブロック図である。
形態の構成を示すブロック図である。
【図14】 従来の画像認識システムの構成を示すブロ
ック図である。
ック図である。
【図15】 辞書部分空間と入力部分空間との関係を示
す概念図である。
す概念図である。
1…識別対象画像群入力手段、2…特徴抽出手段、3,
3A,3B…入力代表ベクトル生成手段、4…辞書デー
タ格納手段、5…統合距離算出手段、6…識別手段、7
…学習画像群入力手段、8…辞書生成手段、31…固有
ベクトル算出手段、32…代表ベクトル選択手段、34
…K平均ベクトル算出手段、41…クラス1の補空間基
底データ、42…クラス2の補空間基底データ、43…
クラス3の補空間基底データ、4C…クラスCの補空間
基底データ、51…行列演算手段、52…固有値算出手
段、53…最小値算出手段、61…最小値算出手段、6
2…閾値処理手段、81…クラス内固有ベクトル算出手
段、82…補空間基底ベクトル抽出手段、91…入力特
徴ベクトル分布、92…入力代表ベクトル、93…辞書
部分空間、94…直交補空間、95…統合距離、100
…識別対象の入力画像データ、101…クラス1の学習
用画像データ、102…クラス2の学習用画像データ、
103…クラス3の学習用画像データ、110…コンピ
ュータ、111…演算処理部、112…記憶部、113
…インタフェース部、114…バス、121…カメラ、
122…操作卓、123…表示装置、124…記憶媒
体、201…画像入力部、202…辞書記憶部、203
…部分空間間の角度計算部、204…認識部、211…
辞書部分空間、212…入力部分空間、Θ…角度、A1
〜A9…認識動作のステップ、B1〜B5…学習動作の
ステップ。
3A,3B…入力代表ベクトル生成手段、4…辞書デー
タ格納手段、5…統合距離算出手段、6…識別手段、7
…学習画像群入力手段、8…辞書生成手段、31…固有
ベクトル算出手段、32…代表ベクトル選択手段、34
…K平均ベクトル算出手段、41…クラス1の補空間基
底データ、42…クラス2の補空間基底データ、43…
クラス3の補空間基底データ、4C…クラスCの補空間
基底データ、51…行列演算手段、52…固有値算出手
段、53…最小値算出手段、61…最小値算出手段、6
2…閾値処理手段、81…クラス内固有ベクトル算出手
段、82…補空間基底ベクトル抽出手段、91…入力特
徴ベクトル分布、92…入力代表ベクトル、93…辞書
部分空間、94…直交補空間、95…統合距離、100
…識別対象の入力画像データ、101…クラス1の学習
用画像データ、102…クラス2の学習用画像データ、
103…クラス3の学習用画像データ、110…コンピ
ュータ、111…演算処理部、112…記憶部、113
…インタフェース部、114…バス、121…カメラ、
122…操作卓、123…表示装置、124…記憶媒
体、201…画像入力部、202…辞書記憶部、203
…部分空間間の角度計算部、204…認識部、211…
辞書部分空間、212…入力部分空間、Θ…角度、A1
〜A9…認識動作のステップ、B1〜B5…学習動作の
ステップ。
Claims (18)
- 【請求項1】 少なくとも1個の入力画像特徴データか
らなる入力画像特徴データ群からこの入力画像特徴デー
タ群の特徴を表すK個(Kは自然数)の入力代表ベクト
ルを生成する入力代表ベクトル生成手段と、 C個(Cは自然数)のクラスそれぞれの補空間基底デー
タであるそのクラス以外のデータを表す部分空間の基底
ベクトルを辞書データとして格納する辞書データ格納手
段と、 前記K個の入力代表ベクトルによって規定される空間と
前記クラスとの距離を示す統合距離を前記C個のクラス
それぞれに対し前記補空間基底データを用いて算出する
統合距離算出手段と、 この統合距離算出手段によって算出されたC個の統合距
離に基づいて前記入力画像特徴データ群に対する認識結
果を出力する識別手段とを備えたことを特徴とする画像
認識システム。 - 【請求項2】 請求項1記載の画像認識システムにおい
て、 前記クラスに属する複数の学習用画像特徴データから前
記補空間基底データを算出し前記辞書データ格納手段に
出力する辞書生成手段を備えたことを特徴とする画像認
識システム。 - 【請求項3】 請求項2記載の画像認識システムにおい
て、 前記辞書生成手段は、 前記複数の学習用画像特徴データから固有ベクトルを求
めるクラス内固有ベクトル算出手段と、 このクラス内固有ベクトル算出手段によって求められた
前記固有ベクトルのうち対応する固有値の小さい方から
Kc個(Kcは自然数)の固有ベクトルを前記補空間基
底データとして抽出する補空間基底ベクトル抽出手段と
を備えたことを特徴とする画像認識システム。 - 【請求項4】 請求項1〜3何れか1項記載の画像認識
システムにおいて、 前記入力代表ベクトル生成手段は、 前記入力画像特徴データ群から固有ベクトルを求める固
有ベクトル算出手段と、 この固有ベクトル算出手段によって求められた前記固有
ベクトルのうち対応する固有値が大きいK個の固有ベク
トルを前記入力代表ベクトルとして抽出する代表ベクト
ル選択手段とを備えたことを特徴とする画像認識システ
ム。 - 【請求項5】 請求項1〜3何れか1項記載の画像認識
システムにおいて、 前記入力代表ベクトル生成手段は、前記入力画像特徴デ
ータ群に対してK平均アルゴリズムを実行し前記K個の
入力代表ベクトルを得るK平均ベクトル算出手段を備え
たことを特徴とする画像認識システム。 - 【請求項6】 請求項1〜5何れか1項記載の画像認識
システムにおいて、 行列Wを、その各行がそれぞれ1つの入力代表ベクトル
からなるK×Dの行列とし、行列Fを、1つのクラスの
補空間基底データを示しその各行がそれぞれ1つの基底
ベクトルからなるKc×Dの行列とすると、 前記統合距離算出手段は、少なくとも、 行列Wと行列Fとから下記の式によって行列Zを算出す
る行列演算手段と、 この行列演算手段によって算出された行列Zの固有値を
算出する固有値算出手段とを有すことを特徴とする画像
認識システム。 X=W・Ft Z=X・Xt (右上の添え字tは転置を表す) - 【請求項7】 請求項6記載の画像認識システムにおい
て、 前記統合距離算出手段は、さらに、行列Zの固有値の最
小値を算出して前記統合距離とする最小値算出手段を有
することを特徴とする画像認識システム。 - 【請求項8】 請求項1〜7何れか1項記載の画像認識
システムにおいて、 前記識別手段は、少なくとも、前記統合距離算出手段に
よって算出された前記C個の統合距離の最小値を求める
最小値算出手段を有することを特徴とする画像認識シス
テム。 - 【請求項9】 請求項8記載の画像認識システムにおい
て、 前記識別手段は、前記最小値算出手段によって求められ
た前記最小値が閾値より小さければ統合距離が最小のク
ラスを前記認識結果として出力し、閾値以上であれば該
当クラスなしと判定する閾値処理手段を更に有すること
を特徴とする画像認識システム。 - 【請求項10】 少なくとも1個の入力画像特徴データ
からなる入力画像特徴データ群からこの入力画像特徴デ
ータ群の特徴を表すK個(Kは自然数)の入力代表ベク
トルを生成する第1の処理と、 前記K個の入力代表ベクトルによって規定される空間と
登録されているC個のクラスそれぞれとの統合距離を前
記C個のクラスそれぞれの補空間基底データを用いて算
出する第2の処理と、 算出したC個の統合距離に基づいて前記入力画像特徴デ
ータ群に対する認識結果を出力する第3の処理とをコン
ピュータに実行させるための画像認識プログラム。 - 【請求項11】 請求項10記載の画像認識プログラム
において、 さらに、前記クラスに属する複数の学習用画像特徴デー
タから前記補空間基底データを算出して辞書を生成する
処理をコンピュータに実行させるための画像認識プログ
ラム。 - 【請求項12】 請求項11記載の画像認識プログラム
において、 前記辞書を生成する処理として、 前記複数の学習用画像特徴データから固有ベクトルを求
める処理と、 この処理によって求められた前記固有ベクトルのうち対
応する固有値の小さい方からKc個(Kcは自然数)の
固有ベクトルを前記補空間基底データとして抽出する処
理とをコンピュータに実行させるための画像認識プログ
ラム。 - 【請求項13】 請求項10〜12何れか1項記載の画
像認識プログラムにおいて、 前記第1の処理として、 前記入力画像特徴データ群から固有ベクトルを求める処
理と、 この処理によって求められた前記固有ベクトルのうち対
応する固有値が大きいK個の固有ベクトルを前記入力代
表ベクトルとして抽出する処理とをコンピュータに実行
させるための画像認識プログラム。 - 【請求項14】 請求項10〜12何れか1項記載の画
像認識プログラムにおいて、 前記第1の処理として、前記入力画像特徴データ群に対
してK平均アルゴリズムを実行し前記K個の入力代表ベ
クトルを得る処理をコンピュータに実行させるための画
像認識プログラム。 - 【請求項15】 請求項10〜14何れか1項記載の画
像認識プログラムにおいて、 行列Wを、その各行がそれぞれ1つの入力代表ベクトル
からなるK×Dの行列とし、行列Fを、1つのクラスの
補空間基底データを示しその各行がそれぞれ1つの基底
ベクトルからなるKc×Dの行列とすると、 前記第2の処理として、少なくとも、 行列Wと行列Fとから下記の式によって行列Zを算出す
る処理と、 この処理によって算出された行列Zの固有値を算出する
処理とをコンピュータに実行させるための画像認識プロ
グラム。 X=W・Ft Z=X・Xt (右上の添え字tは転置を表す) - 【請求項16】 請求項15記載の画像認識プログラム
において、 前記第2の処理として、さらに、行列Zの固有値の最小
値を算出して前記統合距離とする処理をコンピュータに
実行させるための画像認識プログラム。 - 【請求項17】 請求項10〜16何れか1項記載の画
像認識プログラムにおいて、 前記第3の処理として、少なくとも、前記第2の処理に
よって算出された前記C個の統合距離の最小値を求める
処理をコンピュータに実行させるための画像認識プログ
ラム。 - 【請求項18】 請求項17何れか1項記載の画像認識
プログラムにおいて、 前記第3の処理として、さらに、前記C個の統合距離の
最小値が閾値より小さければ統合距離が最小のクラスを
前記認識結果として出力し、閾値以上であれば該当クラ
スなしと判定する処理をコンピュータに実行させるため
の画像認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001212102A JP2003030655A (ja) | 2001-07-12 | 2001-07-12 | 画像認識システム及び画像認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001212102A JP2003030655A (ja) | 2001-07-12 | 2001-07-12 | 画像認識システム及び画像認識プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003030655A true JP2003030655A (ja) | 2003-01-31 |
Family
ID=19047312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001212102A Pending JP2003030655A (ja) | 2001-07-12 | 2001-07-12 | 画像認識システム及び画像認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003030655A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119566A (ja) * | 2019-01-28 | 2020-08-06 | ネイバー コーポレーションNAVER Corporation | イメージ検索装置及びその方法 |
WO2020192736A1 (zh) * | 2019-03-26 | 2020-10-01 | 华为技术有限公司 | 物体识别方法及装置 |
-
2001
- 2001-07-12 JP JP2001212102A patent/JP2003030655A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020119566A (ja) * | 2019-01-28 | 2020-08-06 | ネイバー コーポレーションNAVER Corporation | イメージ検索装置及びその方法 |
JP2022044687A (ja) * | 2019-01-28 | 2022-03-17 | ネイバー コーポレーション | イメージ検索方法及び装置 |
WO2020192736A1 (zh) * | 2019-03-26 | 2020-10-01 | 华为技术有限公司 | 物体识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5406705B2 (ja) | データ補正装置及び方法 | |
US6430307B1 (en) | Feature extraction system and face image recognition system | |
JP5214760B2 (ja) | 学習装置、方法及びプログラム | |
JP4514687B2 (ja) | パターン認識装置 | |
JP6943291B2 (ja) | 学習装置、学習方法、及び、プログラム | |
JP2004054956A (ja) | 顔/類似顔映像で学習されたパターン分類器を利用した顔検出方法及びシステム | |
JP4376145B2 (ja) | 画像分類学習処理システム及び画像識別処理システム | |
WO2018154709A1 (ja) | 動作学習装置、技能判別装置および技能判別システム | |
JP6756406B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2007072620A (ja) | 画像認識装置及びその方法 | |
JP2005327076A (ja) | パラメタ推定方法、パラメタ推定装置および照合方法 | |
JP2017076287A (ja) | データ解析装置、データ解析方法及びプログラム | |
US20110103652A1 (en) | Image processing apparatus and image processing method | |
JP6128910B2 (ja) | 学習装置、学習方法及びプログラム | |
JP5214679B2 (ja) | 学習装置、方法及びプログラム | |
JP2018106618A (ja) | 画像データ分類装置、オブジェクト検出装置及びこれらのプログラム | |
JP5776694B2 (ja) | 物体識別向けの学習装置、学習システム、学習方法、及び学習プログラム | |
CN111639517A (zh) | 人脸图像筛选方法及装置 | |
JP5382786B2 (ja) | 特徴量生成装置、特徴量生成方法および特徴量生成プログラム、ならびにクラス判別装置、クラス判別方法およびクラス判別プログラム | |
US8879804B1 (en) | System and method for automatic detection and recognition of facial features | |
JP2004178569A (ja) | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 | |
JP4099981B2 (ja) | 画像認識システム、画像認識方法および画像認識プログラム | |
JP2017084006A (ja) | 画像処理装置およびその方法 | |
JP2003030655A (ja) | 画像認識システム及び画像認識プログラム | |
JP2015187769A (ja) | 物体検出装置、物体検出方法及びプログラム |