JPH0689344A

JPH0689344A - パターン認識装置

Info

Publication number: JPH0689344A
Application number: JP4265506A
Authority: JP
Inventors: Masahiro Fujita; 雅博藤田; Shigeru Arisawa; 繁有沢
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1992-09-08
Filing date: 1992-09-08
Publication date: 1994-03-29
Anticipated expiration: 2017-02-04
Also published as: JP3252381B2; EP0587349A3; EP0587349B1; DE69332397T2; US5469512A; KR100320063B1; DE69332397D1; EP0587349A2; KR940008423A

Abstract

(57)【要約】【目的】認識率を向上させる。【構成】前処理部３において、ビデオカメラ１により
取り込まれた画像から入力パターンＰが作成される。そ
して、比較処理部４において、この入力パターンＰと、
関数学習記憶部５に記憶されている基本パターンＦ_iが
比較され、基本パターンＦ_iに対する入力パターンＰの
変形量Ｍが算出される。そして、変形量分析部６におい
て、この変形量Ｍが分析され、その分析結果に基づい
て、人物情報学習記憶部７においてそこに記憶されてい
る標準パターンが更新される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、例えば画像を認識する
場合などに用いて好適なパターン認識装置に関する。

【０００２】

【従来の技術】図８は、従来の画像認識装置の一例の構
成を示すブロック図である。例えばビデオカメラ（図示
せず）などで撮影された画像データとしての、例えば人
物の顔の画像などのｘｙ平面上の輝度レベルＩ（ｘ，
ｙ）が、前処理部２１に入力されると、そこで、画像デ
ータＩ（ｘ，ｙ）の特徴量としての、例えば画像のエッ
ジＰ（ｘ，ｙ）が検出され、分析部２２に出力される。

【０００３】分析部２２は、前処理部２１より出力され
た人物の画像の特徴量Ｐ（ｘ，ｙ）に対して、例えば主
成分分析を施し、関数記憶部２３にあらかじめ記憶され
ている、例えばｒ個の関数Ｆ_i（ｘ，ｙ）（ｉ＝１，
２，・・・，ｒ）それぞれに対する人物の画像の特徴量
Ｐ（ｘ，ｙ）の寄与度Ｘ_iを算出してパターン分類部２
４に出力する。

【０００４】パターン分類部２４は、装置のモードが学
習モードである場合、分析部２２より出力された人物の
画像の特徴量Ｐ（ｘ，ｙ）の寄与度Ｘ_iを、認識結果と
しての、例えば人物に付けられた番号ｔ（ｔ＝１，２，
・・・，Ｔ：Ｔは人物の顔の数）の関数である人物情報
Ｋ（ｔ）と対応付けて（例えば、同じ人物ｔの画像にお
ける、複数の寄与度Ｘ_i，Ｘ_i'，Ｘ_i''，Ｘ_i'''，・・・
の平均値などを、その人物情報Ｋ（ｔ）として）、その
内蔵するメモリ（図示せず）に記憶する。

【０００５】さらに、パターン分類部２４は、装置のモ
ードが認識モードである場合、分析部２２より出力され
た人物の画像の特徴量Ｐ（ｘ，ｙ）の寄与度Ｘ_iと、そ
の内蔵するメモリにあらかじめ記憶されている各人物情
報Ｋ（ｔ）との、例えばユークリッド距離をそれぞれ算
出し、その距離を最も短くする人物情報Ｋ（ｔ）におけ
る番号ｔを認識結果として出力する。

【０００６】以上のようにして、画像としての人物の顔
の認識が行われる。

【０００７】また、人物の顔を認識する方法としては、
例えばモデルベーストコーディング（Model-Based Codi
ng）と呼ばれる画像圧縮方法を用いたものがある。この
モデルベーストコーディングでは、符号化側において、
例えば図９に示すような、いわゆるワイヤーフレームを
用いたモデルと、入力された人物の顔とが対応付けら
れ、その差異（モデルに対する人物の顔の特徴）情報が
取り出されて送信される。そして、復号化側において、
符号化側で用いたモデルと同一のものが差異情報にした
がって変形され、人物の顔が再現されるようになってい
る。

【０００８】従って、このモデルベーストコーディング
を用いて人物の顔の認識が行われる場合には、まずモデ
ル（図１０（ｂ））に対する、入力された人物の顔画像
（図１０（ａ））の差異情報が取り出される。

【０００９】即ち、ビデオカメラなどで撮影された人物
の顔画像（図１０（ａ））が、例えばコンピュータに取
り込まれ、ＣＲＴに表示される。そして、モデルとして
のワイヤーフレーム（図１０（ｂ））にあらかじめ設定
された所定の位置としての、例えば目や口の両端など
（図１０（ｂ）において、×印で示す）に対応する、Ｃ
ＲＴに表示された人物の顔画像の位置（図１０（ｃ）に
おいて、×印で示す）が、例えばマウスなどでクリック
されることにより指定される。すると、この人物の顔画
像に対して指定された位置（図１０（ｃ））と、モデル
としてのワイヤーフレームにあらかじめ設定された所定
の位置（図１０（ｂ））とが重なるように、モデルとし
てのワイヤーフレームが、図１０（ｄ）に示すように変
形され、このときの変形量が差異情報として取り出され
る。

【００１０】以上のようにして取り出された差異情報
は、人物情報と対応付けられ、コンピュータの内蔵する
メモリに認識情報として記憶される。

【００１１】そして、人物の顔を認識する場合には、入
力された人物の顔画像に対する差異情報と最も類似する
認識情報が検出され、その認識情報と対応付けられた人
物情報が認識結果として出力される。

【００１２】

【発明が解決しようとする課題】ところで、上述したよ
うな画像認識においては、人物の顔がビデオカメラなど
で撮影されるので、その画像には、画面上、左右、もし
くは上下のずれや、傾きが生じ、さらにその大きさが異
なる場合があった。

【００１３】従って、この場合、例えば図８の分析部２
２においては、人物の顔画像に関する情報だけでなく、
画面における人物の顔画像の上下もしくは左右のずれ、
回転による位置ずれ、またはビデオカメラの拡大縮小率
による大きさのずれに関する情報、即ち不要な情報も主
成分分析されることになり、認識率が劣化する課題があ
った。

【００１４】さらに、図１０（ｂ）に示すようなモデル
は、認識対象に基づいて用意しなけらばならなかった。
即ち、例えば人物の顔を認識する場合には、人物の顔の
モデルを用意し、また人物の手を認識する場合には、人
物の手のモデルを用意しなければならなかった。また、
例えば、これらのモデルすべてを用意してメモリに記憶
させておく場合には、多くのメモリが必要になり、装置
が大型化する課題があった。

【００１５】一方、上述したモデルベーストコーディン
グを用いた人物の顔の認識においては、例えばコンピュ
ータの操作者が、ＣＲＴに表示された人物の顔画像の位
置（図１０（ｃ）において、×印で示す）を、マウスで
クリックしなければならず、不便であった。

【００１６】本発明は、このような状況に鑑みてなされ
たものであり、装置を小型に構成するとともに、認識率
を向上させるものである。

【００１７】

【課題を解決するための手段】請求項１に記載のパター
ン認識装置は、例えば関数Ｆ_iなどの基本パターンを記
憶している基本パターン記憶手段としての関数学習記憶
部５と、入力された、例えば画像データＩ（ｘ，ｙ）な
どの情報から入力パターンＰ（ｘ，ｙ）を作成する作成
手段としての前処理部３と、前処理部３により作成され
た入力パターンＰ（ｘ，ｙ）と、関数学習記憶部５に記
憶されている基本パターンＦ_i（ｘ，ｙ）を比較し、基
本パターンＦ_i（ｘ，ｙ）に対する入力パターンＰ
（ｘ，ｙ）の変形量Ｍ（ｘ，ｙ）を算出する比較手段と
しての比較処理部４と、比較処理部４より出力された変
形量Ｍ（ｘ，ｙ）にしたがって、関数学習記憶部５に記
憶されている基本パターンＦ_i（ｘ，ｙ）、または前処
理部３により作成された入力パターンＰ（ｘ，ｙ）をそ
れぞれ変形する変形手段としてのプログラムの処理ステ
ップＳ１４と、プログラムの処理ステップＳ１４により
変形された基本パターンＦ_i（ｘ，ｙ）および入力パタ
ーンＰ（ｘ，ｙ）に基づいて、関数学習記憶部５に記憶
されている基本パターンＦ_i（ｘ，ｙ）を更新する基本
パターン更新手段としてのプログラムの処理ステップＳ
１５とを備えることを特徴とする。

【００１８】請求項２に記載のパターン認識装置は、例
えば関数Ｆ_i（ｘ，ｙ）などの基本パターンを記憶して
いる基本パターン記憶手段としての関数学習記憶部５
と、標準パターンを記憶している標準パターン記憶手段
としての人物情報学習記憶部７と、入力された、例えば
画像データＩ（ｘ，ｙ）などの情報から入力パターンＰ
（ｘ，ｙ）を作成する作成手段としての前処理部３と、
前処理部３により作成された入力パターンＰ（ｘ，ｙ）
と、関数学習記憶部５に記憶されている基本パターンＦ
_i（ｘ，ｙ）を比較し、基本パターンＦ_i（ｘ，ｙ）に対
する入力パターンＰ（ｘ，ｙ）の変形量Ｍ（ｘ，ｙ）、
および、例えば寄与率Ｘ_iなどの相関量のうち、少なく
とも変形量Ｍ（ｘ，ｙ）を算出する比較手段としての比
較処理部４と、比較処理部４により算出された変形量Ｍ
（ｘ，ｙ）を分析する分析手段としての変形量分析部６
と、変形量分析部６の分析結果Ｍｔｄｒ（ｘ，ｙ）、お
よび比較処理部４により算出された寄与率Ｘ_iのうち、
少なくとも変形量分析部６の分析結果Ｍｔｄｒ（ｘ，
ｙ）に基づいて、人物情報学習記憶部７に記憶されてい
る標準パターンを更新する標準パターン更新手段として
のプログラムの処理ステップＳ３１乃至Ｓ３５とを備え
ることを特徴とする。

【００１９】請求項３に記載のパターン認識装置は、前
処理部３に、画像データＩ（ｘ，ｙ）に対してＬＯＧ
（Laplacean Of Gaussian）フィルタをかけさせ、ゼロ
クロス点を検出させた後、ローパスフィルタをかけさせ
ることを特徴とする。

【００２０】請求項４に記載のパターン認識装置は、プ
ログラムの処理ステップＳ１５に、基本パターンＦ
_i（ｘ，ｙ）に対する入力パターンＰ（ｘ，ｙ）の寄与
度Ｘ_iのうち、最大寄与度Ｘ_MAXを与える基本パターンＦ
_MAX（ｘ，ｙ）を変形させることを特徴とする。

【００２１】請求項５に記載のパターン認識装置は、比
較処理部４に、入力パターンＰ（ｘ，ｙ）と、基本パタ
ーンＦ_i（ｘ，ｙ）とを、ブロックごとにマッチングさ
せ、ブロックの移動量を変形量Ｍ（ｘ，ｙ）として算出
させることを特徴とする。

【００２２】請求項６に記載のパターン認識装置は、人
物情報学習記憶部７は、ニューラルネットワークにより
構成されていることを特徴とする。

【００２３】請求項７に記載のパターン認識装置は、プ
ログラムの処理ステップＳ３１乃至Ｓ３５に、人物情報
学習記憶部７におけるニューラルネットワークの重み係
数を誤差逆伝播法にしたがって更新させることを特徴と
する。

【００２４】請求項８に記載のパターン認識装置は、前
処理部３に、顔画像から入力パターンＩ（ｘ，ｙ）を作
成させることを特徴とする。

【００２５】

【作用】本発明のパターン認識装置においては、画像デ
ータＩ（ｘ，ｙ）から入力パターンＰ（ｘ，ｙ）を作成
し、この入力パターンＰ（ｘ，ｙ）と、関数学習記憶部
５に記憶されている基本パターンＦ_i（ｘ，ｙ）を比較
して、基本パターンＦ_i（ｘ，ｙ）に対する入力パター
ンＰ（ｘ，ｙ）の変形量Ｍ（ｘ，ｙ）を算出する。そし
て、この変形量Ｍ（ｘ，ｙ）にしたがって、関数学習記
憶部５に記憶されている基本パターンＦ_i（ｘ，ｙ）、
または前処理部３により作成された入力パターンＰ
（ｘ，ｙ）をそれぞれ変形し、変形された基本パターン
Ｆ_i（ｘ，ｙ）および入力パターンＰ（ｘ，ｙ）に基づ
いて、関数学習記憶部５に記憶されている基本パターン
Ｆ_i（ｘ，ｙ）を更新する。従って、基本パターンＦ
_i（ｘ，ｙ）が、入力パターンＰ（ｘ，ｙ）に類似する
ように更新されるため、認識対象に基づいて基本パター
ンＦ_i（ｘ，ｙ）を用意する必要がないので、それを記
憶している関数学習記憶部５の記憶容量を少なくするこ
とができ、装置を小型に構成することができる。さら
に、認識率を向上させることができる。

【００２６】また、本発明のパターン認識装置において
は、入力パターンＰ（ｘ，ｙ）と、関数学習記憶部５に
記憶されている基本パターンＦ_i（ｘ，ｙ）を比較し、
基本パターンＦ_i（ｘ，ｙ）に対する入力パターンＰ
（ｘ，ｙ）の変形量Ｍ（ｘ，ｙ）を算出する。そして、
この変形量Ｍ（ｘ，ｙ）を分析して、変形量Ｍ（ｘ，
ｙ）に含まれる入力パターンＰ（ｘ，ｙ）の、例えば平
行移動成分、回転移動成分、拡大縮小成分を取り除き、
いわば新たな変形量Ｍｔｄｒ（ｘ，ｙ）に基づいて、人
物情報学習記憶部７に記憶されている標準パターンを更
新する。従って、認識率を向上させることができる。

【００２７】

【実施例】図１は、本発明のパターン認識装置を応用し
た画像認識装置の一実施例の構成を示すブロック図であ
る。ビデオカメラ１は、ＣＣＤを有し、例えば人物の顔
などを撮影した光を電気信号としての顔画像信号に変換
する。メモリ部２は、ＲＡＭおよびＡ／Ｄコンバータ
（いずれも図示せず）より構成され、Ａ／Ｄコンバータ
により、ビデオカメラ１から出力される顔画像信号を、
例えば８ビットで量子化し、ディジタル信号（顔画像デ
ータ）としての、例えばｘｙ平面上の２次元輝度情報Ｉ
（ｘ，ｙ）を、例えば１フレーム分ずつＲＡＭに一時記
憶する。

【００２８】前処理部３は、メモリ部２に記憶された顔
画像データＩ（ｘ，ｙ）に対して、例えばエッジの検出
などを行うことにより、顔画像（顔画像データＩ（ｘ，
ｙ））の特徴量としての入力パターンＰ（ｘ，ｙ）を取
り出し、比較処理部４に出力する。

【００２９】比較処理部４は、関数学習記憶部５に記憶
されている、顔画像データＩ（ｘ，ｙ）の特徴量Ｐ
（ｘ，ｙ）の基本モデルとなる、例えばｒ個の関数Ｆ_i
（ｘ，ｙ）（ｉ＝１，２，・・・，ｒ）それぞれに対す
る、前処理部３より出力された顔画像データＩ（ｘ，
ｙ）の入力パターンＰ（ｘ，ｙ）の相関量としての、例
えば寄与度Ｘ_iを算出し、そのうちの最大値としての最
大寄与度Ｘ_MAXを検出するとともに、この最大寄与度Ｘ
_MAXを与える関数Ｆ_MAX（ｘ，ｙ）（ＭＡＸは、１乃至ｒ
のいずれかの値）と、入力パターンＰ（ｘ，ｙ）との差
異情報としての変形量Ｍ（ｘ，ｙ）を算出し、関数学習
記憶部５および変形量分析部６に供給する。

【００３０】関数学習記憶部５は、例えばニューラルネ
ットワークにより構成されており、顔画像データＩ
（ｘ，ｙ）の特徴量Ｐ（ｘ，ｙ）の基本モデルとなる、
例えばｒ個の関数Ｆ_i（ｘ，ｙ）（ｉ＝１，２，・・
・，ｒ）をあらかじめ記憶している。

【００３１】さらに、関数学習記憶部５は、比較処理部
４で算出された変形量Ｍ（ｘ，ｙ）を用いて、同じく比
較処理部４で検出された最大寄与度Ｘ_MAXを与える関数
Ｆ_MAX（ｘ，ｙ）、または入力パターンＰ（ｘ，ｙ）を
変形し、ｘｙ平面上における、変形した関数Ｆ_MAX'
（ｘ，ｙ）と、変形した入力パターンＰ'（ｘ，ｙ）と
から、そこに記憶されている関数Ｆ_MAX（ｘ，ｙ）を更
新する。

【００３２】変形量分析部６は、比較処理部４により算
出された変形量Ｍ（ｘ，ｙ）を分析し、この変形量Ｍ
（ｘ，ｙ）に含まれる、入力パターンＰ（ｘ，ｙ）とし
ての、ビデオカメラ１で取り込んだ人物の顔画像の、画
面における上下もしくは左右のずれ、回転による位置ず
れ、またはビデオカメラ１の拡大縮小率などによる大き
さの違いに関する成分を取り除き、あらたな変形量Ｍｔ
ｄｒ（ｘ，ｙ）を人物情報学習記憶部７に出力する。

【００３３】人物情報学習記憶部７は、装置のモードが
学習モードである場合、変形量分析部６より出力される
新たな変形量Ｍｔｄｒ（ｘ，ｙ）を、認識結果として
の、例えば人物（顔）に付けられた番号ｔ（ｔ＝１，
２，・・・，Ｔ：Ｔは人物の顔の数）の関数である人物
情報Ｋ（ｔ）と対応付けて（例えば、同じ人物ｔの顔画
像における、複数の変形量Ｍｔｄｒ（ｘ，ｙ），Ｍｔｄ
ｒ'（ｘ，ｙ），Ｍｔｄｒ''（ｘ，ｙ），Ｍｔｄｒ'''
（ｘ，ｙ），・・・の平均値などを、その人物情報Ｋ
（ｔ）として）、その内蔵するメモリ（図示せず）に記
憶する。

【００３４】即ち、人物情報学習記憶部７は、装置のモ
ードが学習モードである場合、変形量分析部６より出力
される、人物ｔの変形量Ｍｔｄｒ（ｘ，ｙ）そのものを
人物情報として記憶し、同一人物ｔの変形量Ｍｔｄｒ
（ｘ，ｙ）が、さらにそこに入力されるたびに、その変
形量Ｍｔｄｒ（ｘ，ｙ）に基づいて、人物情報Ｋ（ｔ）
を更新する。

【００３５】さらに、人物情報学習記憶部７は、装置の
モードが認識モードである場合、変形量分析部６より出
力された変形量Ｍｔｄｒ（ｘ，ｙ）と、その内蔵するメ
モリにあらかじめ記憶されている各人物情報Ｋ（ｔ）と
の、例えばユークリッド距離をそれぞれ算出し、その距
離を最も短くする人物情報Ｋ（ｔ）における番号ｔを認
識結果として出力する。

【００３６】次に、その動作について説明する。装置の
モードが学習モードの場合、ビデオカメラ１において、
例えば人物の顔などを撮影した光が電気信号としての顔
画像信号に変換され、メモリ部２に出力される。メモリ
部２では、その内蔵するＡ／Ｄコンバータにおいて、ビ
デオカメラ１から出力された顔画像信号（アナログ信
号）が、例えば８ビットで量子化され、ディジタル信号
（顔画像データ）としてのｘｙ平面上の２次元輝度情報
Ｉ（ｘ，ｙ）が、１フレーム分ずつ、内蔵するＲＡＭに
一時記憶される。

【００３７】そして、前処理部３において、メモリ部２
に記憶された顔画像データＩ（ｘ，ｙ）が読み出され、
エッジの検出などが行われ、顔画像（顔画像データＩ
（ｘ，ｙ））の特徴量としての入力パターンＰ（ｘ，
ｙ）が取り出される。

【００３８】即ち、前処理部３では、例えば図２のフロ
ーチャートに示すように、まずステップＳ１において、
顔画像データＩ（ｘ，ｙ）に、例えばＬＯＧ（Laplacea
n OfGaussian）フィルタがかけられ、顔画像のエッジ部
分を取り出したエッジ信号Ｉ_E（ｘ，ｙ）が算出される
（エッジの検出が行われる）。

【００３９】なお、ステップＳ１での処理は、顔画像デ
ータＩ（ｘ，ｙ）の周波数特性と、ＬＯＧフィルタの周
波数特性とを乗算し、エッジ信号Ｉ_E（ｘ，ｙ）を求め
るようにしても良いが、本実施例では、顔画像データＩ
（ｘ，ｙ）と、式(1-1)に示すＬＯＧフィルタのインパ
ルス応答Ｆ_LOG（ｘ，ｙ）との２次元畳込みを行い、エ
ッジ信号Ｉ_E（ｘ，ｙ）を求めるようにしている。

【００４０】

【数１】

【００４１】なお、σはＬＯＧフィルタの大きさに対応
して設定される所定の定数である。

【００４２】そして、ステップＳ２に進み、ビデオカメ
ラ１より出力された顔画像の画面の範囲、即ちｘｙ平面
上におけるＸ０≦ｘ_i≦Ｘ１，Ｙ０≦ｙ_j≦Ｙ１の範囲で
の、点（ｘ_i，ｙ_j）におけるエッジ信号Ｉ_E（ｘ_i，
ｙ_j）と、その点（ｘ_i，ｙ_j）からｘ軸方向に１画素分
だけ移動した点（ｘ_i+1，ｙ_j）におけるエッジ信号Ｉ_E
（ｘ_i ₊₁，ｙ_j）との積が、負であるか否かが判定され
る。

【００４３】ここで、説明を簡単にするために、以下、
ビデオカメラ１からメモリ部２を介して前処理部３に出
力された顔画像は、縦横ともＮ個の画素から構成される
ものとする。さらに、ｘｙ平面上における点（Ｘ０，Ｙ
０）を原点（０，０）とし、従ってＸ１＝Ｙ１＝Ｎ−１
とする。

【００４４】ステップＳ２において、点（ｘ_i，ｙ_j）に
おけるエッジ信号Ｉ_E（ｘ_i，ｙ_j）と、その点（ｘ_i，ｙ
_j）からｘ軸方向に１画素分だけ移動した点（ｘ_i+1，ｙ
_j）におけるエッジ信号Ｉ_E（ｘ_i+1，ｙ_j）との積が、負
であると判定された場合、即ち点（ｘ_i，ｙ_j）における
エッジ信号Ｉ_E（ｘ_i，ｙ_j）の符号と、その点（ｘ_i，ｙ
_j）からｘ軸方向に１画素分だけ移動した点（ｘ_i+1，ｙ
_j）におけるエッジ信号Ｉ_E（ｘ_i+1，ｙ_j）の符号とが異
なる場合、ステップＳ７に進み、点（ｘ_i，ｙ_j）から点
（ｘ_i+1，ｙ_j）にかけてゼロクロスが生じているものと
みなし、ゼロクロス関数Ｐ_C（ｘ_i，ｙ_j）に、ゼロクロ
スが生じていることを示す、例えば１がセットされ、ス
テップＳ５に進む。

【００４５】ステップＳ２において、点（ｘ_i，ｙ_j）に
おけるエッジ信号Ｉ_E（ｘ_i，ｙ_j）と、その点（ｘ_i，ｙ
_j）からｘ軸方向に１画素分だけ移動した点（ｘ_i+1，ｙ
_j）におけるエッジ信号Ｉ_E（ｘ_i+1，ｙ_j）との積が、負
でないと判定された場合、ステップＳ３に進み、点（ｘ
_i，ｙ_j）におけるエッジ信号Ｉ_E（ｘ_i，ｙ_j）と、その
点（ｘ_i，ｙ_j）からｙ軸方向に１画素分だけ移動した点
（ｘ_i，ｙ_j+1）におけるエッジ信号Ｉ_E（ｘ_i，ｙ_j+1）
との積が、負であるか否かが判定される。

【００４６】ステップＳ３において、点（ｘ_i，ｙ_j）に
おけるエッジ信号Ｉ_E（ｘ_i，ｙ_j）と、その点（ｘ_i，ｙ
_j）からｙ軸方向に１画素分だけ移動した点（ｘ_i，ｙ
_j+1）におけるエッジ信号Ｉ_E（ｘ_i，ｙ_j+1）との積が、
負であると判定された場合、即ち点（ｘ_i，ｙ_j）におけ
るエッジ信号Ｉ_E（ｘ_i，ｙ_j）の符号と、その点（ｘ_i，
ｙ_j）からｙ軸方向に１画素分だけ移動した点（ｘ_i，ｙ
_j+1）におけるエッジ信号Ｉ_E（ｘ_i，ｙ_j+1）の符号とが
異なる場合、ステップＳ７に進み、上述したようにゼロ
クロス関数Ｐ_C（ｘ_i，ｙ_j）に１がセットされ、ステッ
プＳ５に進む。

【００４７】ステップＳ３において、点（ｘ_i，ｙ_j）に
おけるエッジ信号Ｉ_E（ｘ_i，ｙ_j）と、その点（ｘ_i，ｙ
_j）からｙ軸方向に１画素分だけ移動した点（ｘ_i，ｙ
_j+1）におけるエッジ信号Ｉ_E（ｘ_i，ｙ_j+1）との積が、
負でないと判定された場合、ステップＳ４に進み、点
（ｘ_i，ｙ_j）から点（ｘ_i+1，ｙ_j）または点（ｘ_i，ｙ_j
₊₁）にかけてそれぞれゼロクロスが生じていないものと
みなし、ゼロクロス関数Ｐ_C（ｘ_i，ｙ_j）に、ゼロクロ
スが生じていないことを示す、例えば０がセットされ、
ステップＳ５に進む。

【００４８】なお、ステップＳ２乃至Ｓ４およびＳ７の
処理は、ｘｙ平面上における顔画像画面の範囲の画素に
対応する点（０≦ｘ_i≦Ｎ−１，０≦ｙ_j≦Ｎ−１の範囲
の点（ｘ_i，ｙ_j））すべてに対して行われる。

【００４９】以上のようにして、顔画像のエッジのゼロ
クロス点を示す関数Ｐ_C（ｘ_i，ｙ_j）を算出することに
より、即ち顔画像のエッジのゼロクロス点を検出するこ
とにより、ビデオカメラ１で顔画像を撮影したときの、
例えば照明などの影響を取り除くことができる。

【００５０】そして、ステップＳ５に進み、ゼロクロス
関数Ｐ_C（ｘ，ｙ）に、例えばガウスフィルタなどのロ
ーパスフィルタがかけられ、ゼロクロス関数Ｐ_C（ｘ，
ｙ）で表現された顔画像パターンが、いわばぼけた顔画
像パターンに変換され、ビデオカメラ１で撮影された顔
画像の特徴量としての入力パターンＰ（ｘ，ｙ）が算出
される。

【００５１】なお、ステップＳ５での処理は、ゼロクロ
ス関数Ｐ_C（ｘ，ｙ）の周波数特性と、ガウスフィルタ
の周波数特性とを乗算し、ビデオカメラ１で撮影された
顔画像の特徴量としての入力パターンＰ（ｘ，ｙ）を求
めるようにしても良いが、本実施例では、ゼロクロス関
数Ｐ_C（ｘ，ｙ）と、式(1-2)に示すガウスフィルタのイ
ンパルス応答Ｆ_G（ｘ，ｙ）との２次元畳込みを行い、
入力パターンＰ（ｘ，ｙ）を求めるようにしている。

【００５２】

【数２】

【００５３】なお、σは上述したステップＳ１でのＬＯ
Ｇフィルタにおける場合と同様に、ガウスフィルタの大
きさに対応して設定される所定の定数である。

【００５４】ステップＳ５の処理により、後述する比較
処理部４で検出される、関数学習記憶部５に記憶された
関数Ｆ_i（ｘ，ｙ）それぞれに対する、入力パターンＰ
（ｘ，ｙ）の寄与度Ｘ_iの変化がなだらかになり、従っ
て最大寄与度Ｘ_MAXを与える関数Ｆ_MAX（ｘ，ｙ）を容易
に検出することができるようになる。

【００５５】ステップＳ５で算出された入力パターンＰ
（ｘ，ｙ）は、ステップＳ６において比較処理部４に出
力され、処理を終了する。

【００５６】以上のようにして、前処理部３では、顔画
像データＩ（ｘ，ｙ）から、その顔画像の特徴量として
の入力パターンＰ（ｘ，ｙ）が作成される。

【００５７】そして、比較処理部４において、まず関数
学習記憶部５に記憶されている基本パターンとしての関
数Ｆ_i（ｘ，ｙ）（ｉ＝１，２，・・・，ｒ：ｒは所定
の数）それぞれに対する、前処理部３で作成された入力
パターンＰ（ｘ，ｙ）の相関量としての、例えば寄与度
Ｘ_iが算出され、そのうちの最大値としての最大寄与度
Ｘ_MAXが検出される。

【００５８】ここで、関数Ｆ_i（ｘ，ｙ）に対する、入
力パターンＰ（ｘ，ｙ）の寄与度Ｘ_iとは、関数Ｆ
_i（ｘ，ｙ）への、入力パターンＰ（ｘ，ｙ）の正射影
であり、式(2-1)にしたがって計算される関数Ｆ_i（ｘ，
ｙ）と、入力パターンＰ（ｘ，ｙ）との内積を意味す
る。

【００５９】

【数３】

【００６０】なお、Ｎは、前述したように、ビデオカメ
ラ１よりメモリ部２を介して前処理部３に出力された顔
画像の画面の縦および横の画素数である。

【００６１】さらに、比較処理部４において、前処理部
３より出力された入力パターンＰ（ｘ，ｙ）と、最大寄
与度Ｘ_MAXを与える関数Ｆ_MAX（ｘ，ｙ）（ＭＡＸは、１
乃至ｒのいずれかの値）とがブロックマッチングされ、
入力パターンＰ（ｘ，ｙ）を関数Ｆ_MAX（ｘ，ｙ）と
（関数Ｆ_MAX（ｘ，ｙ）を入力パターンＰ（ｘ，ｙ）
と）、いわば最も類似させる場合の、入力パターンＰ
（ｘ，ｙ）（関数Ｆ_MAX（ｘ，ｙ））の変形量Ｍ（ｘ，
ｙ）（Ｍ'（ｘ，ｙ））が算出される。

【００６２】即ち、比較処理部４において、まず関数Ｆ
_MAX（ｘ，ｙ）が、縦横ともｂ個の画素からなるＢ個の
ブロックＦＢ_k（ｘ_k，ｙ_k）（ｋ＝０，１，・・・，Ｂ
−１）に分割される（図３（ａ））。なお、点（ｘ_k，
ｙ_k）は、ブロックＦＢ_k（ｘ_k，ｙ_k）の中心の座標点を
示す。

【００６３】そして、入力パターンＰ（ｘ，ｙ）上に、
縦横とも、同じくｂ個の画素からなる、中心の座標が点
（ｘ_i，ｙ_j）であるブロックＰＢ（ｘ_i，ｙ_j）を考え、
ブロックＦＢ_k（ｘ_k，ｙ_k）が、入力パターンＰ（ｘ，
ｙ）における、点（ｘ_k，ｙ_k）を中心とした位置から、
ｘ軸またはｙ軸方向に±Ｓ画素分の範囲で移動され（図
３（ｂ））、ブロックＦＢ_k（ｘ_k，ｙ_k）が、入力パタ
ーンＰ（ｘ，ｙ）上におけるブロックＰＢ（ｘ_i，ｙ_j）
と最も類似する場合の、ブロックＦＢ_k（ｘ_k，ｙ_k）の
移動量（ｍ_xk，ｍ_yk）が検出される。

【００６４】つまり、比較処理部４では、式(2-2)に示
す、各ブロックＦＢ_k（ｘ_k，ｙ_k）に対する、ブロック
ＰＢ（ｘ_k＋ｍ_xk，ｙ_k＋ｍ_yk）の寄与率Ｘ_MAX（ｋ）そ
れぞれが、極大値、あるいは最大値となる移動量
（ｍ_xk，ｍ_yk）としての変形量Ｍ（ｘ，ｙ）が算出（検
出）されることになる。

【００６５】

【数４】

【００６６】なお、以下点（ｘ_k，ｙ_k）を中心とするブ
ロックＦＢ_k（ｘ_k，ｙ_k）が、入力パターンＰ（ｘ，
ｙ）上におけるブロックＰＢ（ｘ_i，ｙ_j）と最も類似す
る場合の、ブロックＦＢ_k（ｘ_k，ｙ_k）の移動量
（ｍ_xk，ｍ_yk）を、変形量Ｍ（ｘ_k，ｙ_k）と表し、変形
量Ｍ（ｘ_k，ｙ_k）の集合を、変形量Ｍ（ｘ，ｙ）と表
す。

【００６７】以上のようにして比較処理部４で算出され
た変形量Ｍ（ｘ，ｙ）は、関数学習記憶部５および変形
量分析部６に供給される。

【００６８】関数学習記憶部５において、比較処理部４
で算出された変形量Ｍ（ｘ，ｙ）を用いて、同じく比較
処理部４で検出された最大寄与度Ｘ_MAXを与える関数Ｆ
_MAX（ｘ，ｙ）、または入力パターンＰ（ｘ，ｙ）が変
形され、ｘｙ平面上における、変形した関数Ｆ_MAX'
（ｘ，ｙ）と、変形した入力パターンＰ'（ｘ，ｙ）と
から、そこに記憶されている関数Ｆ_MAX（ｘ，ｙ）が更
新される。

【００６９】即ち、関数学習記憶部５では、図４のフロ
ーチャートに示すように、まずステップＳ１１におい
て、ブロックＦＢ_k（ｘ_k，ｙ_k）が、入力パターンＰ
（ｘ，ｙ）上におけるブロックＰＢ（ｘ_i，ｙ_j）と最も
類似する場合の、ブロックＦＢ_k（ｘ_k，ｙ_k）の移動量
（ｍ_xk，ｍ_yk）の集合としての変形量Ｍ（ｘ，ｙ）（Ｍ
（ｘ_k，ｙ_k）（＝（ｍ_xk，ｍ_yk））の集合）が、比較処
理部４より入力されると、ステップＳ１２において、入
力パターンＰ（ｘ，ｙ）上におけるブロックＰＢ
（ｘ_i，ｙ_j）を、ブロックＦＢ_k（ｘ_k，ｙ_k）と最も類
似させる場合の、ブロックＰＢ（ｘ_i，ｙ_j）（＝ＰＢ
（ｘ_k＋ｍ_xk，ｙ_k＋ｍ_yk））の移動量（−ｍ_xk，−
ｍ_yk）が算出され、移動量（−ｍ_xk，−ｍ_yk）を示す変
数Ｍ'（ｘ_k＋ｍ_xk，ｙ_k＋ｍ_yk）にセットされる。

【００７０】そして、ステップＳ１３に進み、入力パタ
ーンＰ（ｘ，ｙ）、または関数Ｆ_MA _X（ｘ，ｙ）を変形
する変形作用素Ｍ_P（ｘ_k，ｙ_k）の集合Ｍ_P（ｘ，ｙ）、
またはＭ_F（ｘ_k＋ｍ_xk，ｙ_k＋ｍ_yk）の集合Ｍ_F（ｘ，
ｙ）が、それぞれ次式にしたがって算出され、ステップ
Ｓ１４に進む。Ｍ_P（ｘ_k，ｙ_k）＝Ａ×Ｍ（ｘ_k，ｙ_k）Ｍ_F（ｘ_k＋ｍ_xk，ｙ_k＋ｍ_yk）＝（１−Ａ）×Ｍ'（ｘ_k＋ｍ_xk，ｙ_k＋ｍ_yk）但し、Ａは、０≦Ａ≦１の範囲の定数で、関数学習記憶
部５での関数Ｆ_iの学習が進むにしたがって小さい値か
ら大きい値へ更新される。

【００７１】ステップＳ１４において、変形作用素Ｍ_P
（ｘ，ｙ）、またはＭ_F（ｘ，ｙ）をそれぞれＭ_P（ｘ，ｙ）＝（ｄ１ｘ，ｄ１ｙ）、またはＭ_F（ｘ，ｙ）＝（ｄ２ｘ，ｄ２ｙ）とすると、入力パターンＰ（ｘ，ｙ）、または関数Ｆ
_MAX（ｘ，ｙ）が、式Ｐ'（ｘ，ｙ）＝Ｐ（ｘ＋ｄ１ｘ，ｙ＋ｄ１ｙ）、また
はＦ_MAX'（ｘ，ｙ）＝Ｆ_MAX（ｘ＋ｄ２ｘ，ｙ＋ｄ２ｙ）にしたがって変形され、即ち変形された入力パターン
Ｐ'（ｘ，ｙ）（図５（ａ））、または変形された関数
Ｆ_MAX'（ｘ，ｙ）（図５（ｂ））が算出されてステップ
Ｓ１５に進む。

【００７２】ステップＳ１５において、新たな入力パタ
ーンＰ'（ｘ，ｙ）と、新たな関数Ｆ_MAX'（ｘ，ｙ）と
から、式(2-3)にしたがって学習が行われた関数Ｆ
_MAX（ｘ，ｙ）としての新たな関数Ｆ_i（ｘ，ｙ）が算出
され、関数Ｆ_MAX（ｘ，ｙ）に代わって関数学習記憶部
５に記憶されて処理を終了する。

【００７３】

【数５】

【００７４】一方、比較処理部４より変形量分析部６に
入力された変形量Ｍ（ｘ，ｙ）は、そこで分析され、こ
の変形量Ｍ（ｘ，ｙ）に含まれる、入力パターンＰ
（ｘ，ｙ）としての、ビデオカメラ１で取り込んだ人物
の顔画像の、画面における上下もしくは左右のずれ（平
行移動成分）、回転による位置ずれ（回転移動成分）
（傾き成分）、またはビデオカメラ１の拡大縮小率など
による大きさの違いに関する成分が取り除かれ、あらた
な変形量Ｍｔｄｒ（ｘ，ｙ）が人物情報学習記憶部７に
出力される。

【００７５】即ち、変形量分析部６では、図６のフロー
チャートに示すように、まずステップＳ２１において、
入力パターンＰ（ｘ，ｙ）に含まれる平行移動成分Ｔ
が、式

【数６】にしたがって算出され、ステップＳ２２に進み、変形量
Ｍ（ｘ，ｙ）から、平行移動成分Ｔが取り除かれた変形
量Ｍｔ（ｘ，ｙ）が次式にしたがって求められてステッ
プＳ２３に進む。Ｍｔ（ｘ，ｙ）＝Ｍ（ｘ，ｙ）−Ｔ (3-2)

【００７６】ステップＳ２３において、入力パターンＰ
（ｘ，ｙ）に含まれる大きさの違いに関する成分（拡大
縮小率に関する成分）Ｄが、式

【数７】にしたがって算出され、ステップＳ２４に進み、変形量
Ｍｔ（ｘ，ｙ）から、拡大縮小率に関する成分Ｄが取り
除かれた変形量Ｍｔｄ（ｘ，ｙ）が次式にしたがって求
められてステップＳ２５に進む。Ｍｔｄ（ｘ，ｙ）＝Ｍｔ（ｘ，ｙ）＋δＭｄ（ｘ，ｙ） (3-4)

【００７７】但し、δＭｄ（ｘ，ｙ）は次式で定義され
るものである。

【００７８】

【数８】

【００７９】なお、δＭｄ（ｘ，ｙ）は、これが、式 δＭｄ（ｘ，ｙ）＝αｒ（ｘ，ｙ）（αは、０≦α≦１の範囲の数）と表すことのできるものとして、拡大縮小率に関する成
分Ｄが０になるように、式(3-3)のＭ（ｘ，ｙ）を、Ｍ
（ｘ，ｙ）＋δＭｄ（ｘ，ｙ）に代えるとともに、拡大
縮小率に関する成分Ｄを０に代え、δＭｄ（ｘ，ｙ）に
ついて解いたものである。

【００８０】ステップＳ２５において、入力パターンＰ
（ｘ，ｙ）に含まれる回転移動成分（傾き成分）Ｒが、
式

【数９】にしたがって算出され、ステップＳ２６に進み、変形量
Ｍｔｄ（ｘ，ｙ）から、回転移動成分Ｒが取り除かれた
変形量Ｍｔｄｒ（ｘ，ｙ）が次式にしたがって求められ
てステップＳ２７に進む。Ｍｔｄｒ（ｘ，ｙ）＝Ｍｔｄ（ｘ，ｙ）＋δＭｒ（ｘ，ｙ） (3-6)

【００８１】但し、δＭｒ（ｘ，ｙ）は次式で定義され
るものである。

【００８２】

【数１０】

【００８３】なお、δＭｒ（ｘ，ｙ）は、これが、式 δＭｒ（ｘ，ｙ）＝αｓ（ｘ，ｙ）で表すことのできるものとして、回転移動成分Ｒが０に
なるように、式(3-5)のＭ（ｘ，ｙ）を、Ｍ（ｘ，ｙ）
＋δＭｒ（ｘ，ｙ）に代えるとともに、回転移動成分Ｒ
を０に代え、δＭｒ（ｘ，ｙ）について解いたものであ
る。

【００８４】以上のようにして、平行移動成分Ｔ、拡大
縮小率に関する成分Ｄ、および回転移動成分Ｒが取り除
かれた、新たな変形量Ｍｔｄｒ（ｘ，ｙ）は、ステップ
Ｓ２７において人物情報学習記憶部７に出力され、処理
を終了する。

【００８５】なお、以上の処理は、変形量Ｍ（ｘ，ｙ）
の構成要素としての、比較処理部４でＢ個に分割された
関数Ｆ_i（ｘ，ｙ）（Ｆ_MAX（ｘ，ｙ））の各ブロックに
対する変形量Ｍ（ｘ_k，ｙ_k）（ｋ＝０，１，・・・，Ｂ
−１）すべてに対して行われる。

【００８６】従って、変形量分析部６においては、比較
処理部４でＢ個に分割された関数Ｆ_i（ｘ，ｙ）（Ｆ_MAX
（ｘ，ｙ））の各ブロックｋ（ｋ＝０，１，・・・，Ｂ
−１）における変形量Ｍ（ｘ_k，ｙ_k）に対する新たな変
形量Ｍｔｄｒ（ｘ_k，ｙ_k）がそれぞれ算出されることに
なる。

【００８７】つまり、本明細書中では、比較処理部４で
Ｂ個に分割された関数Ｆ_i（ｘ，ｙ）（Ｆ_MAX（ｘ，
ｙ））の各ブロックｋにおける変形量Ｍ（ｘ_k，ｙ_k）に
対する新たな変形量Ｍｔｄｒ（ｘ_k，ｙ_k）の集合を、新
たな変形量Ｍｔｄｒ（ｘ，ｙ）と記載してある。

【００８８】また、変形量Ｍｔｄｒ（ｘ_k，ｙ_k）は２次
元のベクトルであるから、その集合である新たな変形量
Ｍｔｄｒ（ｘ，ｙ）は、２Ｂ次元のベクトルとみなすこ
とができる。

【００８９】変形量分析部６の処理が終了すると、人物
情報学習記憶部７において、変形量分析部６により算出
された新たな変形量Ｍｔｄｒ（ｘ，ｙ）が、認識結果と
しての人物（顔）に付けられた番号ｔ（ｔ＝１，２，・
・・，Ｔ：Ｔは人物の顔の数）の関数である人物情報
（標準パターン）Ｋ（ｔ）と対応付けられ、その内蔵す
るメモリに記憶される。

【００９０】即ち、人物情報学習記憶部７では、図７の
フローチャートに示すように、まずステップＳ３１にお
いて、人物（顔）に付けられた番号ｔが入力されると、
ステップＳ３２において、人物情報学習記憶部７の内蔵
するメモリから、標準パターンとしての人物情報Ｋ
（ｔ）が読み出され、ステップＳ３３に進む。

【００９１】ステップＳ３３において、変形量分析部６
から人物情報学習部７に変形量Ｍｔｄｒ（ｘ，ｙ）が入
力されると、ステップＳ３４において、変形量Ｍｔｄｒ
（ｘ，ｙ）により、次式にしたがって人物情報Ｋ（ｔ）
が更新される。Ｋ（ｔ：２ｋ）＝Ｋ（ｔ：２ｋ）＋ａ×Ｍｔｄｒ_x（ｘ_k，ｙ_k）Ｋ（ｔ：２ｋ＋１）＝Ｋ（ｔ：２ｋ＋１）＋ａ×Ｍｔｄｒ_y（ｘ_k，ｙ_k）但し、ｋ＝０，１，・・・，Ｂ−１。

【００９２】ここで、Ｍｔｄｒ_x（ｘ_k，ｙ_k）、または
Ｍｔｄｒ_y（ｘ_k，ｙ_k）は、点（ｘ_k，ｙ_k）を中心とす
る関数Ｆ_i（ｘ，ｙ）のブロック（図３（ａ））におけ
る新たな変形量Ｍｔｄｒ（ｘ_k，ｙ_k）の、ｘｙ平面上に
おけるｘ成分、またはｙ成分をそれぞれ示す。

【００９３】さらに、新たな変形量Ｍｔｄｒ（ｘ，ｙ）
は、上述したように２Ｂ次元のベクトルであるから、人
物情報Ｋ（ｔ）も同様に２Ｂ次元のベクトルであり、Ｋ
（ｔ：２ｋ）、またはＫ（ｔ：２ｋ＋１）は、人物情報
Ｋ（ｔ）の第２ｋ次元、または第２ｋ＋１次元の要素を
それぞれ示す。

【００９４】また、ａは、０＜ａ＜１の範囲の所定の数
である。

【００９５】そして、ステップＳ３５に進み、ステップ
Ｓ３４で更新されたＫ（ｔ）が人物情報学習記憶部７の
内蔵するメモリに記憶され、処理を終了する。

【００９６】次に、装置のモードが認識モードである場
合、ビデオカメラ１、メモリ部２、前処理部３、比較処
理部４、関数学習記憶部５、または変形量分析部６にお
いて、上述した場合と同様の処理が行われ、人物情報学
習記憶部７に新たな変形量Ｍｔｄｒ（ｘ，ｙ）が入力さ
れる。すると、人物情報学習記憶部７において、この変
形量Ｍｔｄｒ（ｘ，ｙ）と、その内蔵するメモリに記憶
された各人物情報Ｋ（ｔ）とのユークリッド距離がそれ
ぞれ算出され、その距離を最も短くする人物情報Ｋ
（ｔ）における番号ｔが認識結果として出力される。

【００９７】なお、本実施例においては、前処理部３で
画像データにＬＯＧフィルタをかけて画像のエッジを検
出するようにしたが、画像のエッジを検出方法はこれに
限定されるものではない。さらに、前処理部３では、画
像のエッジを検出するのではなく、他の特徴量を取り出
すようにすることができる。また、画像の対応点問題
は、比較処理部４で解決されるので、前処処理部３にお
いて、画像データに対してフィルタリングを行わず比較
処理部４に出力するようにすることができる。

【００９８】さらに、比較処理部４では、ブロックマッ
チングして変形量Ｍ（ｘ，ｙ）を算出するようにした
が、例えば特願平３−１５０５２０号に開示されている
ような、動画像の動き検出に一般的に用いられているオ
プティカルフローによる方法で、変形量Ｍ（ｘ，ｙ）を
算出するようにすることができる。

【００９９】また、関数学習記憶部５においては、最大
寄与度Ｘ_MAXを与える関数Ｆ_MAX（ｘ，ｙ）のみ変形（学
習）させるようにしたが、２番目に大きい寄与度や３番
目に大きい寄与度を与える関数も変形（学習）させるよ
うにすることができる。

【０１００】さらに、人物情報学習記憶部７を関数学習
記憶部５と同様に、ニューラルネットワークにより構成
し、比較処理部４で算出される寄与度Ｘ_iを人物情報学
習記憶部７に入力するようにして（図１において、点線
で示す）、変形量Ｍｔｄｒ（ｘ，ｙ）とともに、寄与度
Ｘ_iを用いて、いわゆる誤差逆伝播法などにより人物情
報Ｋ（ｔ）の学習を行うように、即ちニューラルネット
ワークの重み係数を更新するようにすることができる。
また、変形量分析部６で算出される平行移動成分Ｔ、拡
大縮小率に関する成分Ｄ、または回転移動成分Ｒを人物
情報学習記憶部７に入力するようにして、人物情報Ｋ
（ｔ）の学習を行うようにすることもできる。このよう
にすれば、認識しようとする物体（画像）の位置、大き
さ、または傾きを判定することができるようになる。

【０１０１】さらに、人物情報学習記憶部７では、いわ
ゆる主成分分析法により学習を行うようにすることがで
きる。

【０１０２】また、関数学習記憶部５、または人物情報
学習記憶部７においては、例えばいわゆるボルツマンマ
シンの学習方法や、シミュレーティッドアニーリングに
よる学習方法などを用いるようにしても良い。

【０１０３】

【発明の効果】以上のように、本発明のパターン認識装
置によれば、入力された、例えば画像などの情報から入
力パターンを作成し、この入力パターンと、基本パター
ン記憶手段に記憶されている基本パターンを比較して、
基本パターンに対する入力パターンの変形量を算出す
る。そして、この変形量にしたがって、基本パターン記
憶手段に記憶されている基本パターン、または作成手段
により作成された入力パターンをそれぞれ変形し、変形
された基本パターンおよび入力パターンに基づいて、基
本パターン記憶手段に記憶されている基本パターンを更
新する。従って、基本パターンが、入力パターンに類似
するように更新されるため、認識対象に基づいて基本パ
ターンを用意する必要がないので、それを記憶している
基本パターン記憶手段の記憶容量を少なくすることがで
き、装置を小型に構成することができる。さらに、認識
率を向上させることができる。

【０１０４】また、本発明のパターン認識装置によれ
ば、入力パターンと、基本パターン記憶手段に記憶され
ている基本パターンを比較し、基本パターンに対する入
力パターンの変形量を算出する。そして、この変形量を
分析し、その分析結果に基づいて、標準パターン記憶手
段に記憶されている標準パターンを更新する。従って、
認識率を向上させるように、自動的に標準パターンの更
新（学習）を行うことができる。

【図面の簡単な説明】

【図１】本発明のパターン認識装置を応用した画像認識
装置の一実施例の構成を示すブロック図である。

【図２】図１の実施例の前処理部３の動作を説明するた
めのフローチャートである。

【図３】図１の実施例の比較処理部４での変形量Ｍ
（ｘ，ｙ）の算出方法を説明するための図である。

【図４】図１の実施例の関数学習記憶部５の動作を説明
するためのフローチャートである。

【図５】図１の実施例の関数学習記憶部５で変形された
入力パターンＰ（ｘ，ｙ）と、関数Ｆ_i（ｘ，ｙ）を示
す図である。

【図６】図１の実施例の変形量分析部６の動作を説明す
るためのフローチャートである。

【図７】図１の実施例の人物情報学習記憶部７の動作を
説明するためのフローチャートである。

【図８】従来の画像認識装置の一例の構成を示すブロッ
ク図である。

【図９】ワイヤーフレームを用いたモデルを示す図であ
る。

【図１０】モデルベーストコーディングによる人物の顔
の認識方法を説明するための図である。

【符号の説明】

１ビデオカメラ２メモリ部３前処理部４比較処理部５関数学習記憶部６変形量分析部７人物情報学習記憶部２１前処理部２２分析部２３関数記憶部２４パターン分類部

Claims

【特許請求の範囲】

【請求項１】基本パターンを記憶している基本パター
ン記憶手段と、入力された情報から入力パターンを作成する作成手段
と、前記作成手段により作成された入力パターンと、前記基
本パターン記憶手段に記憶されている基本パターンを比
較し、前記基本パターンに対する前記入力パターンの変
形量を算出する比較手段と、前記比較手段より出力された前記変形量にしたがって、
前記基本パターン記憶手段に記憶されている基本パター
ン、または前記作成手段により作成された入力パターン
をそれぞれ変形する変形手段と、前記変形手段により変形された前記基本パターンおよび
入力パターンに基づいて、前記基本パターン記憶手段に
記憶されている基本パターンを更新する基本パターン更
新手段とを備えることを特徴とするパターン認識装置。
【請求項２】基本パターンを記憶している基本パター
ン記憶手段と、標準パターンを記憶している標準パターン記憶手段と、入力された情報から入力パターンを作成する作成手段
と、前記作成手段により作成された入力パターンと、前記基
本パターン記憶手段に記憶されている基本パターンを比
較し、前記基本パターンに対する前記入力パターンの変
形量、および相関量のうち、少なくとも前記変形量を算
出する比較手段と、前記比較手段により算出された前記変形量を分析する分
析手段と、前記分析手段の分析結果、および前記比較手段により算
出された前記相関量のうち、少なくとも前記分析手段の
分析結果に基づいて、前記標準パターン記憶手段に記憶
されている標準パターンを更新する標準パターン更新手
段とを備えることを特徴とするパターン認識装置。
【請求項３】前記作成手段は、入力された情報に対し
てＬＯＧフィルタをかけ、ゼロクロス点を検出した後、
ローパスフィルタをかけることを特徴とする請求項１ま
たは２のいずれかに記載のパターン認識装置。
【請求項４】前記基本パターン更新手段は、前記基本
パターンに対する前記入力パターンの寄与度のうち、最
大寄与度を与える前記基本パターンを更新することを特
徴とする請求項１に記載のパターン認識装置。
【請求項５】前記比較手段は、前記入力パターンと、
前記基本パターンとを、ブロックごとにマッチングし、
前記ブロックの移動量を前記変形量として算出すること
を特徴とする請求項１または２のいずれかに記載のパタ
ーン認識装置。
【請求項６】前記標準パターン記憶手段は、ニューラ
ルネットワークにより構成されていることを特徴とする
請求項２に記載のパターン認識装置。
【請求項７】前記標準パターン更新手段は、前記標準
パターン記憶手段における前記ニューラルネットワーク
の重み係数を誤差逆伝播法にしたがって更新することを
特徴とする請求項６に記載のパターン認識装置。
【請求項８】前記作成手段は、顔画像から前記入力パ
ターンを作成することを特徴とする請求項１または２の
いずれかに記載のパターン認識装置。