JPH0887589A - パターン学習方法 - Google Patents

パターン学習方法

Info

Publication number
JPH0887589A
JPH0887589A JP6223435A JP22343594A JPH0887589A JP H0887589 A JPH0887589 A JP H0887589A JP 6223435 A JP6223435 A JP 6223435A JP 22343594 A JP22343594 A JP 22343594A JP H0887589 A JPH0887589 A JP H0887589A
Authority
JP
Japan
Prior art keywords
learning
pattern
cells
cell
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6223435A
Other languages
English (en)
Inventor
Satoru Osawa
哲 大沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP6223435A priority Critical patent/JPH0887589A/ja
Publication of JPH0887589A publication Critical patent/JPH0887589A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 対象物の角度の変化や回転にも対応した判別
を行うことができるように、対象となるパターンをView
-Invariantに学習することができる方法を提供する。 【構成】 ステップ1において画像中の全ての画素を均
等に学習対象とするために、画像中の画素を一つずつラ
ンダムに選び、ステップ2において選ばれた画素の座標
値を2次元状に分布するニューラルネットワークに呈示
して、この座標値と最も近い値を結合重み値として持つ
最適マッチング細胞を探し、ステップ3において隣接細
胞について各細胞の担当する特徴の抽出を行う。ステッ
プ4において最適マッチング細胞とその隣接細胞の持つ
結合重み値を、選ばれた画素の座標値に近づけるように
学習を行う。次に、ステップ5において学習が収束した
か否かの判断がなされ、収束してしない場合は再度ステ
ップ1からステップ4を繰り返し、収束している場合
は、学習を終了させる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ニューラルネットワー
クのパターン学習方法に関し、特に詳細にはニューラル
ネットワークの多数の細胞に、所定の特徴部分を有する
顔等のパターンをその角度や回転に対して不変に(View
-Invariant)学習させる方法に関するものである。
【0002】
【従来の技術】物体の判別を行うモデルの研究において
従来的な手法では実現が難しかった課題として、対象と
する物体の角度や回転に不変(View-Invariant)な判別
がある。このようなView-Invariantな判別を行うことが
できれば、対象とする物体がいかなる方向を向いていて
も良好な物体の判別を行うことができるが、従来の画像
処理の手法(例えばテンプレートマッチングによる手
法)では、対象物のモデルが固定されているため、物体
の様々な変化に対応することができなかった(高木、下
田、画像処理ハンドブック、pp172-205 、1991、東京大
学出版)。
【0003】このような問題を解決するための手段とし
て、近年人間の脳の仕組みを人工的に模倣したモデルが
提案されている。例えば、ガボール関数を利用した手法
による歪みに強いモデル(J.Buhmann,J.Lange,and C.vo
n dor Malaburg,DistortionInvariant Object Recognit
ion by Matching Hierarchically labeled Graphs.IJCN
N 1989,Vol.1,Jun.1989,155-159 )、高次ネットを用い
た位置、尺度、回転に対してインバリアントなモデル
(MAX B Reid,Lilly Spirkovska,and Ellen Ochoa,Simu
ltaneous position scale and rotation invariant pat
tern classification using third-order networks,Ne
ural Networks,voll,NO.3,July1989)が提案されてい
る。
【0004】また、学習モデルとして、コホーネンの自
己組織化マッピング(T.Kohonen Self-Organization an
d Associative Memory, Spriger-Verlag 1984)が挙げら
れる。コホーネンの自己組織化マッピングとはトポロジ
カルなマッピングを自己組織化で学習するモデルであ
る。ここでトポロジカルなマッピングとは、例えば、人
間が外界から受け取った信号、すなわち、あるパターン
を、その序列を反映しながらある種の規則に従って、皮
質上の神経細胞に割り当てていることを意味している。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
たBuhmann のモデルは対象物の回転に対応しておらず、
さらにReidらのモデルは入力パターンの次元が増加する
と結合爆発が起きてしまう欠点があった。また、脳の持
つ自己組織化的な能力を忠実に模倣したモデルではな
く、脳にこのような仕組みが実際に存在するか否かも疑
問である。また、上述したコホーネンの自己組織化マッ
ピングにおいては、対象とするパターンのトポロジカル
なマッピングを行うことができるものの対象とするパタ
ーンを View-Invariant に学習する課題への適応はほと
んどなされていなかった。
【0006】本発明は上記事情に鑑み、対象物の角度の
変化や回転にも対応した判別を行うことができるよう
に、対象となるパターンをView-Invariantに学習するこ
とができるパターン学習方法を提供することを目的とす
るものである。
【0007】
【課題を解決するための手段】本発明によるパターン学
習方法は、複数の画素からなる所定の特徴部分を有する
パターンを、該所定の特徴部分の学習を担当するととも
に、該特徴部分の座標値を記憶する結合重みを有する複
数の細胞からなるニューラルネットワークに学習させる
パターン学習方法であって、前記パターンの画素をラン
ダムに一つ選択し、該選択された画素の座標値を前記ニ
ューラルネットワークに呈示し、該呈示された画素の座
標値に最も近い結合重み値を有する細胞と該細胞に隣接
する所定範囲の隣接領域内に存在する細胞とを選択し、
該選択された各細胞が有する前記結合重み値を、前記呈
示された画素の座標値に近づくように該各細胞に学習さ
せ、前記パターンの画素の選択、前記画素の座標値のニ
ューラルネットワークへの呈示、前記細胞の選択、およ
び前記学習を前記ニューラルネットワークの各細胞が学
習を終了するまで繰り返し行うことを特徴とするもので
ある。
【0008】また、前記選択された細胞に前記画素の座
標値の学習を、前記選択された各細胞が担当する前記所
定の特徴部分の候補を前記パターンから回転、角度に対
して不変に抽出し、該抽出された特徴部分候補と前記呈
示された画素が表す前記所定の特徴部分との反応値が大
きいほど、前記選択された各細胞の結合重み値が前記座
標値により近い値となるように行うことが好ましい。
【0009】さらに、前記所定の特徴部分の学習を担当
する前記ニューラルネットワークの細胞の分布位置が、
該特徴部分の相対的位置関係に基づいて予め定められて
いることが好ましい。
【0010】また、前記ニューラルネットワークの細胞
が有する結合重み値の初期値として、前記パターンの中
心の画素の座標値に所定値を加えた値を用いることが好
ましい。
【0011】さらに、前記パターンが顔画像であって、
前記所定の特徴部分が目、輪郭および口であるようにし
てもよい。
【0012】さらに、前記輪郭の学習を担当する細胞
が、前記ニューラルネットワークの細胞の周方向に弾性
力を持って結合されていることが好ましい。
【0013】また、前記学習の初期の段階において、ニ
ューラルネットワークの細胞に前記目および前記輪郭の
み学習させ、前記パターンの画素の選択、前記画素の座
標値のニューラルネットワークへの呈示、前記細胞の選
択、および前記学習を所定回数繰り返した後に、前記輪
郭の学習を担当する細胞の一部を前記口の学習を担当す
る細胞に変化させることが好ましい。
【0014】
【作用】本発明によるパターン学習方法は、所定の特徴
部分の学習を担当する細胞を持つニューラルネットワー
クに、入力されるパターン(画像)の画素を一つずつラ
ンダムに選択してその画素の座標値を呈示し、この値に
最も近い結合重み値を有する最適マッチング細胞に学習
させるとともに、この細胞に隣接する所定範囲内に存在
する隣接細胞にもこの画素の座標値を学習させるという
コホーネンの自己組織化のアルゴリズムを利用したもの
である。
【0015】そして、このコホーネンの自己組織化のア
ルゴリズムに加えて、学習の際には、入力されるパター
ンから学習を行う細胞が担当する特徴部分を回転や角度
に不変に抽出し、その呈示された画素が表す特徴部分と
の反応値が大きいほど、呈示された画素の座標値をこの
細胞に強く学習させることとした。このように、ニュー
ラルネットワークの細胞に呈示された画素の座標値を、
その担当する特徴部分への反応値が大きいほど強く学習
させることは、その特徴部分が呈示される頻度(出現確
率)が大きいほど強く学習することと等価な手続きを与
えることとなる。そしてこのような学習の結果、各細胞
は呈示されるパターンにおいて担当する特徴部分の位置
に対応した結合重み値を持つこととなる。しかも、ニュ
ーラルネットワークは学習の際に相対位置関係のみによ
り拘束されるため、パターンが回転していたり、角度が
変化している場合であっても、その回転、角度に拘らず
特徴部分の位置を学習する、ビューインバリアント(Vie
w Invariant )な学習を行うことができる。
【0016】また、特徴部分を学習するニューラルネッ
トワークの細胞の分布位置を、担当する特徴部分の相対
的位置関係に基づいて予め定めておくことによりニュー
ラルネットワークの学習を効率よく行うことができる。
【0017】さらに、学習毎に特徴部分を抽出するので
はなく、特徴部分を学習前に予め抽出しておき、学習時
にはその抽出された結果のみを用いて学習することによ
り、計算時間を節約することができる。
【0018】また、各細胞が学習前に有する座標値の初
期値として、パターンの中心の画素位置の座標値に所定
値を加えた座標値を用いることにより、全ての細胞に学
習の機会が均等に与えられることとなり、呈示されるパ
ターンの回転や角度の変化に拘らずビューインバリアン
トにパターンの特徴部分を学習できる。
【0019】さらに、パターンを顔画像とし、特徴部分
を顔画像中の目、輪郭および口とすることにより、これ
ら特徴部分の学習を顔の回転や角度の変化に拘りなくビ
ューインバリアントに行うことができる。
【0020】また、目および輪郭の学習を担当するニュ
ーラルネットワークの細胞の分布位置を、目および輪郭
の相対的位置関係に基づいて定めることにより、入力パ
ターンの特徴部分の位置関係を反映したニューラルネッ
トワークに対してパターンの特徴部分の位置関係を学習
させることとなるため、ニューラルネットワークの学習
を効率よく行うことができる。
【0021】さらに、この場合、パターンの呈示および
学習を所定回数繰り返した後に輪郭を担当する細胞の一
部を口を担当する細胞に変化させることにより、予め口
を担当する細胞が定められている場合と比べて、ニュー
ラルネットワークの各細胞の学習の自由度が大きなもの
となり、学習されたニューラルネットワークの細胞の結
合関係が複雑になる(ねじれる)ことを防止することが
できる。
【0022】さらに、輪郭を担当する細胞が、ニューラ
ルネットワークの周方向に弾性力を持って結合されてい
るものとすることにより、輪郭の位置を学習するにつれ
て各細胞が均等な間隔で輪郭の位置を学習するようにな
り、背景の影響を受けにくく、かつより滑らかな輪郭の
学習を行うことができる。
【0023】
【実施例】以下図面を参照して本発明の実施例について
説明する。
【0024】図1は本発明によるパターン学習方法の基
本的概念を表すフローチャートである。図1に示すよう
に、本発明によるパターン学習方法は、ステップ1にお
いて画像中の全ての画素を均等に学習対象とするため、
画像中の画素を一つずつランダムに選択し、次いでステ
ップ2において選択された画素の座標値をニューラルネ
ットワークに呈示して、この座標値と最も近い値を結合
重み値として持つ最適マッチング細胞を探し、ステップ
3において最適マッチング細胞とその隣接細胞について
各細胞が担当する特徴の抽出を行う。そして、ステップ
4において最適マッチング細胞とその隣接細胞の持つ結
合重み値を、選ばれた画素の座標値に近づけるように学
習を行う。この際、選ばれた画素が表す特徴部分と細胞
が担当する特徴部分との反応値が大きいほど強く学習が
行われることとする。次に、ステップ5において学習が
収束したか否かの判断がなされ、収束してしない場合は
再度ステップ1からステップ4を繰り返し、収束してい
る場合は、ステップ6において学習を終了させるもので
ある。
【0025】ここで、上記フローチャートにおいては、
各細胞の担当する特徴の抽出を学習毎に行っているが、
これは学習前に予め行い、学習時にはその抽出結果のみ
を用いて学習を行うようにしてもよい。以下の実施例に
おいては後者の手法を用いることとする。
【0026】なお、本発明による実施例においては、以
下に説明するニューラルネットワークに画像1が学習さ
れるものである。
【0027】図2は本発明によるパターン学習方法によ
り学習がなされるニューラルネットワークを表す図であ
る。なお、本実施例においては、学習がなされる画像は
人間の顔であり、顔の特徴部分として、目、顔の輪郭お
よび口を用いるものとする。図2に示すように本発明に
よるパターン学習方法により学習がなされるニューラル
ネットワーク2は、16×16個の計256 個の細胞が2次元
状に結合してなるものであり、その中心付近の6 ×6 個
の細胞が目の学習を担当する細胞3であり、その周囲の
全ての細胞が輪郭の学習を担当する細胞4である。
【0028】ここで、輪郭の学習を担当する細胞4は、
ニューラルネットワーク2の周方向に弾性力によりリン
グ状に抑制し合いリングネットを構成している。したが
って、本実施例においては、図2において破線で示すよ
うに、輪郭を学習する5重のリングネット4A〜4Eが
目を担当する細胞3の周囲を取り囲む構成となってい
る。また、ニューラルネットワーク2の各細胞の結合重
み初期値は、学習すべき与えられた画像1の中心位置の
画素値に、小さなランダム値を加えた値に設定される。
【0029】次いで、特徴部分の抽出について説明す
る。
【0030】まず、与えられた画像1において目と考え
られる小塊成分の検出がなされる。図3は、与えられた
画像1から目と考えられる小塊成分の検出を行うための
ステップを表す図である。まず、与えられた画像1か
ら、複数の方向性を有する目の形状と適合する成分を複
数の方向毎に抽出する。これは、図4に示すような目と
考えられる小塊成分に反応しやすい、小塊成分検出マス
ク10と、与えられた画像1とのコンボリューションおよ
び非線形処理により得られる。以下、その詳細について
説明する。
【0031】図4に示すような小塊成分検出マスク10
は、目の形の強度変化に反応し易いように、マスク10の
負の部分が目の形に合うように楕円形をなしており、こ
の楕円の長手方向が、図4の状態を0度としたときに、
30度,60度,90度,120 度,150 度の6方向を向いた6
つの小塊成分検出マスク10A〜10Fを用いて、与えられ
た学習すべき画像1をコンボリューションするものであ
る。ここで、この小塊成分検出マスク10は、人間の脳の
網膜神経節細胞または外側膝状体の細胞に相当するもの
であり、DOG関数により作成されるものである。この
DOG関数は、以下の式で表される。
【0032】
【数1】
【0033】ここで、式(1) におけるθの初期値を0,
30,60,90,120 ,150 度の各値に設定することによ
り、楕円の長手方向が、0,30,60,90,120 ,150 度
傾いた小塊成分検出マスク10A〜10Fを作成することが
できるものである(便宜上、各マスクをそれぞれ0度方
向のマスク,30度方向のマスク……150 度方向のマスク
と呼ぶ)。
【0034】このような小塊成分検出マスク10A〜10F
で与えられた画像1をコンボリューションおよび非線形
処理することにより、与えられた画像1からそれぞれの
小塊成分検出マスク10A〜10Fに適合した成分11A〜11
Fが検出される。
【0035】なお、与えられた画像1において、目と考
えられる小塊成分は与えられた画像1の中心付近に存在
することが多く、また与えられた画像1の中心付近の情
報がより重視されるため、検出された成分11A〜11Fの
中心付近の情報を強調するマスクにより成分11A〜11F
の中心付近の情報が強調されるとともに、方向的競合が
なされ、中心付近が強調された成分が得られる。ここで
方向的競合とは各特定角度の成分11A〜11Fの同じ位置
の画素同志を競合させ、最も大きい値を有する画素のみ
を勝ち残らせることをいう。例えば、特定の角度の成分
の左下角を原点としたx−y座標を考えたとき、画素
(0,0)について考えると、各成分11A〜11Fの画素(0,
0)のうち、最も大きい値を有する小塊成分の画素が選択
されるのである。この方向的競合を各成分11A〜11Fの
すべての画素について行うとともに中心付近の情報の強
調を行うと、中心付近が強調された成分13が得られるこ
ととなるここで、中心を強調するマスクとしては図5に
示すマスク12のように、以下の式に示すような中心に向
って単調増加する関数が考えられる。
【0036】
【数2】
【0037】ここで、上述したようにして抽出された中
心付近が強調された成分13は、目と考えられる小塊成分
のみならず、与えられた画像1の輪郭成分をも含んでい
るものであるため、この成分13から輪郭成分の除去が行
われる。この輪郭成分の除去は、成分13から輪郭成分が
抽出され、この輪郭成分を成分13から除去することによ
って行われる。
【0038】図6は、本発明の実施例における輪郭成分
の検出を説明するための図である。まず、図3における
中心を強調された成分13から、6方向の角度の輪郭の直
線が各方向毎に抽出される。これは、図7に示すような
特定角度の直線検出マスク14と成分13とのコンボリュー
ションおよび非線形処理によって得られる。以下、その
詳細について説明する。
【0039】図7に示すような特定角度の直線検出マス
ク14は、直線に反応し易いように、マスク14の正の部分
が直線に適合するように細長楕円形状をなしており、さ
らに、負の部分が正の部分の両側に分布するように選択
されている。このマスク14に十分な方位選択性を持たせ
るにはこのような負の部分が不可欠である。そしてこの
細長楕円の長手方向が、図7の状態を0度としたとき
に、30度,60度,90度,120 度,150 度の6方向を向い
た6つの特定の角度の直線検出マスク14A〜14Fを用い
て、成分13をコンボリューションするものである。ここ
で、このマスクは、大脳視覚野の単純型細胞に相当する
ものであり、ガボール関数により作成されるものであ
る。このガボール関数は以下の式で表される。
【0040】
【数3】
【0041】ここで、式(3) における実数部分である
【0042】
【数4】
【0043】を用いて特定の角度の直線検出マスク14を
作成するものである。さらに、この式(4) における
x ,ky の初期値により、細長楕円の長手方向が0,
30,60,90,120 ,150 度傾いたマスク14A〜14Fを作
成することができるのである。
【0044】なお、特定の角度の直線検出マスク14A〜
14Fの受容野サイズは、成分13のうち、必要とされる輪
郭成分以外の細い輪郭成分には反応しにくいように定め
られている。すなわち、マスク14A〜14Fは成分13のう
ち、目と考えられる小塊成分には反応し難く、かつ、必
要な輪郭成分には反応し易いのである。このようにマス
ク14A〜14Fの受容野サイズを定めることにより、背景
の存在にかかわらず良好に目と考えられる小塊成分を検
出できるのである。
【0045】このような特定の角度の直線検出マスク14
A〜14Fで成分13をコンボリューションすることによ
り、成分13から各マスク14A〜14Fに適合した特定角度
の輪郭成分15A〜15Fが抽出される。
【0046】ここで、前述した小塊検出マスク10A〜10
Fおよび特定の角度の直線検出マスク14A〜14Fによ
る、与えられた画像1および成分11A〜11Fのコンボリ
ューションおよび非線形処理は以下の式により行われて
いる。
【0047】
【数5】
【0048】次いで、各特定角度の輪郭成分15A〜15F
の同じ位置の画素同志を競合させ、最も大きい値を有す
る画素のみを勝ち残らせる方向的競合を行う。例えば、
特定の角度の輪郭成分の左下角を原点としたx−y座標
を考えたとき、画素(0,0)について考えると、各輪郭成
分15A〜15Fの画素(0,0)のうち、最も大きい値を有す
る輪郭成分の画素が選択されるのである。この方向的競
合を各輪郭成分15A〜15Fのすべての画素について行う
と、輪郭成分16が勝ち残り、これにより与えられた画像
1の輪郭成分が抽出されたこととなる。
【0049】しかしながら、各輪郭成分15A〜15Fは6
つの方向毎に検出されているため、方向的競合により勝
ち残った輪郭成分16における輪郭は滑らかにつながって
いないものである。そこで、ボカしマスクにより輪郭成
分16をコンボリューションし、輪郭成分16をボカした成
分18を作成し、輪郭を滑らかにする。
【0050】このようにして、輪郭成分をボカした成分
18を作成し、次いで作成された成分18が図3に示すよう
に成分13から減算されることにより、成分13より輪郭成
分が除去されて、目の形に反応していると思われる小塊
成分19が抽出される。なお、成分13から成分18を減算す
る際には、対応する成分の最大値が等しい値となるよう
に正規化されて減算が行われる。
【0051】この段階において、抽出された特徴部分
は、目の形に反応していると思われる小塊成分19および
画像1の輪郭成分16である。
【0052】次いで、口領域の抽出について説明する。
【0053】図8は与えられた画像1の口領域を抽出す
るステップを表す図である。図8に示すように、まず与
えられた画像1を、YIQ基底に変換する。ここでYI
Q基底とは、R(赤)、G(緑)、B(青)カラー画像
に対し、
【0054】
【数6】
【0055】なる変換を行った結果がYIQ基底となる
ものであり、テレビの色信号と輝度信号とを分けるよう
な場合に用いられているものである。
【0056】ここで、このYIQ基底において、Q成分
画像中では顔の唇部分が最も明るく反応することが知ら
れている(小林,中村,森島,原島,“顔画像からの唇
の特徴点抽出法”,信学全大春,D-329,Mar.1990.)。す
なわち、YIQ基底のQ成分は、色空間の中で赤みのあ
るような紫色の部分に最も反応し易く、緑の部分に反応
し難いものである。したがって、YIQ基底のQ成分は
顔の中で唇の部分に最も明るく反応するのである。この
ように、与えられた画像1をYIQ基底に変換し、Q成
分画像20を得る。
【0057】このようにして得られた画像19,16,20,
では、各特徴部分が存在すると考えられる画素が明るく
反応する結果となる。(便宜上、今後の説明では画像19
を目画像、画像16を輪郭画像、画像20を口画像と呼ぶこ
ととする。) 次いで抽出された特徴部分の学習について説明する。図
2に示すニューラルネットワーク2の各細胞は、前述し
た目画像19、輪郭画像16、口画像20の3つの画像の反応
値に応じて、与えられた画像1の特徴部分の座標値を学
習する。すなわち、目の学習を担当する目担当細胞3は
目画像19に従い、輪郭(口)の学習を担当する輪郭
(口)担当細胞4は輪郭画像16および口画像20に従い学
習を行う。
【0058】ここで、図2に示すニューラルネットワー
ク2の各細胞は、コホーネンの自己組織化にしたがって
学習されるものであり、自己組織化の過程で細胞が相対
的な位置関係でのみ抑制されるものである。したがっ
て、これにより本発明の特徴であるビューインバリアン
トなマッピングが実現可能となる。そして各細胞は入力
された画像の選ばれた画素の座標値を学習する結合重み
値を有しており、その値が学習に従い変化していくもの
である。すなわち、入力される画像1の左下角を原点と
したx−y座標を考えたとき、画像1が128 ×128 の画
素からなるとすると、(0 ,0)〜(128 ,128 )を学習
する結合重み値をニューラルネットワーク2の各細胞は
有するのである。そして、入力された画像において、特
徴部分への反応が大きい、すなわち、特徴部分の出現確
率が高い画素の座標値をより強く学習していくのであ
る。
【0059】図9はニューラルネットワークの学習の過
程を説明するための図である。図9においては、図2に
示すニューラルネットワーク2の各細胞が結合重み値と
して学習した値を画像上にプロットし、隣同士に分布す
る細胞を結んで示している。
【0060】まず、学習前の段階では、ニューラルネッ
トワーク2の各細胞の結合重みは入力される画像1の中
央の画素の座標値に小さなランダム値を加えた初期値を
有しているため、各細胞は画像1の略中心の画素の座標
値を学習していることと同一の状態にある。
【0061】そして、ニューラルネットワーク2に画像
1が入力されると以下のようにニューラルネットワーク
2の各細胞は学習を進める。
【0062】ニューラルネットワーク2の各細胞に入力
画像中の画素のうちランダムに選ばれた1つの画素の座
標値が呈示される。そして、呈示された画素の座標値と
一番近い値の結合重み値を有する細胞が最適マッチング
細胞として選択され、最適マッチング細胞とその隣接細
胞が呈示された画素の座標値を学習する。最適マッチン
グ細胞を探す計算は、以下の式により行われる。
【0063】 Xc (t) =min i {‖Xi (t) −I(t) ‖} …(7) 但し、X:細胞の結合重み値 I:呈示された画素の座標値 c:最適マッチング位置 t:離散時間 式(7) により選択された最適マッチング細胞とその隣接
細胞は、以下の式(8)により、現在有する結合重み値を
画素の座標値に近づけるように学習を行う。
【0064】
【数7】
【0065】また、隣接細胞は最適マッチング細胞を中
心とした所定内の細胞(例えば最適マッチング細胞を中
心とする5×5個の細胞の範囲内)である。このように
式(8),(9) および(10)に従って各細胞が有する結合重
み値を更新することにより、その値が少しずつ担当する
特徴部分の座標値に近づいていく。
【0066】そして、上述した入力画像中の画素の座標
値の呈示を複数回繰り返して行うことにより、画像中の
全ての画素の座標値が均等に各細胞に呈示され、さら
に、式(7) 〜(10)により各細胞が有する重みが更新され
ていく。
【0067】ここで、式(9) が式(8) に与える影響につ
いて説明する。式(8) により、呈示された画素の座標値
が最適マッチング細胞とその隣接細胞に学習されていく
が、このときに前述した細胞が担当する特徴部分への反
応値の大きさ、すなわち、担当する特徴の出現確率の大
きさを、呈示された画素の座標値の学習にどう反映する
かが式(9) によって定められる。すなわち、呈示された
画素が表す特徴部分と、学習を行う細胞が担当する特徴
との反応値(出現確率)が高いほど式(9) の値を大きく
し、反応値(出現確率)が低いほど式(9) の値を小さく
する。このようにすることにより、例えば学習を行う細
胞が担当する特徴が目で、呈示される画素が表す目画像
19との反応値が高いとき、その選択された細胞について
は、呈示される画素の座標値における担当する特徴の反
応値が大きいから、この場合式(9) の値は大きくなる。
式(9) の値が大きくなると、選択された細胞の結合重み
値が選ばれた画素の座標値に大きく近づくように学習さ
れるため、これを繰り返し行うことにより、担当する特
徴部分への反応値が大きい画素の座標値を細胞が強く学
習することとなる。
【0068】ここで、式(9) のprob(i) は、図10に示す
ようなシグモイド関数となる。したがって、例えば反応
値が大きい画素が学習すべき画素として選ばれた場合、
この画素の座標値を学習する細胞は大きく結合重み値が
更新され、反応値が小さい画素が選択された場合、この
画素の座標値を学習する細胞はほとんど結合重み値が更
新されない。このように式(9) のprob(i) の値を定める
ことにより、効率良く各細胞の学習を進めていくことが
できる。
【0069】次いで式(8) におけるk(t) ・ΔWの項に
ついて説明する。ニューラルネットワーク2の輪郭担当
細胞は、前述したようにニューラルネットワーク2の周
方向に弾性力を有するように抑制し合って結合している
が、この弾性力が式(8) におけるk(t) ・ΔWの項によ
り与えられる。ここで、式(10)はいわゆる2次微分の形
を表す式となっているため、項k(t) ・ΔWを加えて細
胞の学習を進めていくと、リングネット4A〜4E上の
各細胞は、入力される画像の画素の座標値を等間隔で滑
らかに学習していくこととなる。そして、この項k(t)
・ΔWを30万回学習を行った後に加えるようにすること
により、学習回数40万回以降では図9に示すようにリン
グネット4A〜4E上の各細胞は等間隔で滑らかになる
ように学習すべき画像1の画素の座標値を学習してい
く。
【0070】ここで、図9においては、学習回数85万回
後に口を担当する細胞が発生するが、以下この口の学習
を担当する細胞について説明する。口担当細胞は前述し
た輪郭担当細胞4が変化することにより発生するもので
あり、学習の最初の段階においては存在しないものであ
る。これは、学習の最初の段階から口担当細胞を定めて
おくと輪郭担当細胞の分布が回転に対して非対称になっ
てしまい、細胞の初期重み値によっては学習結果がねじ
れた形になってしまうことが起きてしまうからである。
したがって、学習の途中から輪郭担当細胞を口担当細胞
に変化させるようにしたものである。
【0071】口担当細胞は以下のようにして発生する。
ニューラルネットワーク2の学習が行われている際、輪
郭担当細胞4は、輪郭画像とともに口画像20も担当する
こととする。そして、学習の段階で、輪郭担当細胞4
は、学習には使用しないが口画像20のprob(i) も計算す
ることとする。そして、その計算結果を記憶しておき、
学習85万回目にそれ以前の所定の学習回数間において最
もprob(i) の総和が大きかった輪郭担当細胞を中心とし
て、所定範囲内の細胞を口担当細胞に変化させるのであ
る。そして口担当細胞が発生する85万回目以降の学習で
は、口担当細胞が口画像20に従い、選ばれた画素の座標
値を学習して行くのである。
【0072】そして、上述したように目画像19を担当す
る目担当細胞3、輪郭画像16および口画像20の学習を担
当する輪郭(口)担当細胞4の学習を進め、100 万回学
習後には、図9に示すように目担当細胞3は入力される
画像1の目の位置に対応する画素の座標値を学習し、輪
郭担当細胞4は輪郭の位置に対応する画素の座標値を学
習し、口担当細胞は口の位置に対応する画素の座標値を
学習し、この段階で各細胞の学習は収束し、学習が終了
する。
【0073】このようにして学習した結果を利用するこ
とにより、ビューインバリアントな、すなわち対象物の
角度の変化や回転にも対応できる様々な判別、識別シス
テムを構築することができる。例えば、与えられたパタ
ーンが顔である場合、顔であるか否かの判別、あるいは
個人個人の顔の認識、さらには様々な表情の顔の認識を
もビューインバリアントに行うことが可能となる。
【0074】なお、上記実施例についてはパターンを顔
として顔の目、輪郭および口を学習させる場合について
説明したが、これに限定されるものではなく、特徴部分
を有する他のいかなるパターンをも学習させることがで
きるものである。
【0075】
【発明の効果】以上詳細に説明したように、本発明によ
るパターン学習方法は、学習をすべきパターンの回転や
角度の変化に拘らず、ビューインバリアントにパターン
の特徴部分の位置関係を学習することができる。このた
め、この学習結果を用いて入力されたパターンの判別や
認識、例えば入力パターンが顔画像である場合は顔であ
るか否かの判別、表情の認識、個人個人の顔の認識等を
ビューインバリアントに行うことが可能となる。
【図面の簡単な説明】
【図1】本発明によるパターン学習方法の基本的概念を
表すフローチャート
【図2】本発明によるパターン学習方法により学習がな
されるニューラルネットワークを表す図
【図3】与えられた画像から目の形状と適合する小塊成
分の検出を行うためのステップを表す図
【図4】目の形状と適合する小塊成分の検出を行うため
のマスクを表す図
【図5】中心を強調するマスクを表す図
【図6】与えられた画像から輪郭成分の検出を行うため
のステップを表す図
【図7】特定角度の輪郭成分の検出を行うためのマスク
を表す図
【図8】与えられた画像から口成分の検出を行うための
ステップを表す図
【図9】顔の特徴を表すマップの学習段階を説明するた
めの図
【図10】シグモイド関数を表す図
【図11】顔の特徴を表すマップの学習段階を説明する
ための図
【符号の説明】
1 与えられた画像 2 ニューラルネットワーク 3 目の学習を担当する細胞 4 輪郭(口)の学習を担当する細胞 4A〜4E リングネット 10 目と考えられる小塊成分検出マスク(小塊成分検
出マスク) 14 特定の角度の輪郭成分検出マスク 16′,18 輪郭成分 20 口と考えられる小塊成分検出マスク
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06T 7/00

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数の画素からなる所定の特徴部分を有
    するパターンを、該所定の特徴部分の学習を担当すると
    ともに、該特徴部分の座標値を記憶する結合重みを有す
    る複数の細胞からなるニューラルネットワークに学習さ
    せるパターン学習方法であって、 前記パターンの画素をランダムに一つ選択し、 該選択された画素の座標値を前記ニューラルネットワー
    クに呈示し、 該呈示された画素の座標値に最も近い結合重み値を有す
    る細胞と該細胞に隣接する所定範囲の隣接領域内に存在
    する細胞とを選択し、 該選択された各細胞が有する前記結合重み値を、前記呈
    示された画素の座標値に近づくように該各細胞に学習さ
    せ、 前記パターンの画素の選択、前記画素の座標値のニュー
    ラルネットワークへの呈示、前記細胞の選択、および前
    記学習を前記ニューラルネットワークの各細胞が学習を
    終了するまで繰り返し行うことを特徴とするパターン学
    習方法。
  2. 【請求項2】 前記選択された細胞に前記画素の座標値
    の学習を、 前記選択された各細胞が担当する前記所定の特徴部分の
    候補を前記パターンから回転、角度に対して不変に抽出
    し、 該抽出された特徴部分候補と前記呈示された画素が表す
    前記所定の特徴部分との反応値が大きいほど、前記選択
    された各細胞の結合重み値が前記座標値により近い値と
    なるように行うことを特徴とする請求項1記載のパター
    ン学習方法。
  3. 【請求項3】 前記所定の特徴部分の学習を担当する前
    記ニューラルネットワークの細胞の分布位置が、該特徴
    部分の相対的位置関係に基づいて予め定められているこ
    とを特徴とする請求項1または2記載のパターン学習方
    法。
  4. 【請求項4】 前記ニューラルネットワークの細胞が有
    する結合重み値の初期値として、前記パターンの中心の
    画素の座標値に所定値を加えた値を用いることを特徴と
    する請求項1、2または3記載のパターン学習方法。
  5. 【請求項5】 前記パターンが顔画像であって、前記所
    定の特徴部分が目、輪郭および口であることを特徴とす
    る請求項1から4のいずれか1項記載のパターン学習方
    法。
  6. 【請求項6】 前記輪郭の学習を担当する細胞が、前記
    ニューラルネットワークの細胞の周方向に弾性力を持っ
    て結合されていることを特徴とする請求項5記載のパタ
    ーン学習方法。
  7. 【請求項7】 前記学習の初期の段階において、ニュー
    ラルネットワークの細胞に前記目および前記輪郭のみ学
    習させ、前記パターンの画素の選択、前記画素の座標値
    のニューラルネットワークへの呈示、前記細胞の選択、
    および前記学習を所定回数繰り返した後に、前記輪郭の
    学習を担当する細胞の一部を前記口の学習を担当する細
    胞に変化させることを特徴とする請求項5または6記載
    のパターン学習方法。
JP6223435A 1994-09-19 1994-09-19 パターン学習方法 Withdrawn JPH0887589A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6223435A JPH0887589A (ja) 1994-09-19 1994-09-19 パターン学習方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6223435A JPH0887589A (ja) 1994-09-19 1994-09-19 パターン学習方法

Publications (1)

Publication Number Publication Date
JPH0887589A true JPH0887589A (ja) 1996-04-02

Family

ID=16798106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6223435A Withdrawn JPH0887589A (ja) 1994-09-19 1994-09-19 パターン学習方法

Country Status (1)

Country Link
JP (1) JPH0887589A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217606A (ja) * 2008-03-11 2009-09-24 Osaka Prefecture Univ 塗り絵用線画の生成方法および生成プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009217606A (ja) * 2008-03-11 2009-09-24 Osaka Prefecture Univ 塗り絵用線画の生成方法および生成プログラム

Similar Documents

Publication Publication Date Title
CN106372581B (zh) 构建及训练人脸识别特征提取网络的方法
CN110363183B (zh) 基于生成式对抗网络的服务机器人视觉图片隐私保护方法
CN108256456B (zh) 一种基于多特征阈值融合的手指静脉识别方法
CN106980852B (zh) 基于角点检测与匹配的药品识别系统及其识别方法
US6208758B1 (en) Method for learning by a neural network including extracting a target object image for which learning operations are to be carried out
CN108268859A (zh) 一种基于深度学习的人脸表情识别方法
CN111274916A (zh) 人脸识别方法和人脸识别装置
CN113537099B (zh) 一种公路隧道火灾烟雾动态检测方法
US7852377B2 (en) Automatic red eye removal
CN110909618B (zh) 一种宠物身份的识别方法及装置
Moreira et al. Neural-based color image segmentation and classification using self-organizing maps
CN111784747A (zh) 一种基于关键点检测和校正的车辆多目标跟踪系统及方法
CN111158491A (zh) 一种应用于车载hud的手势识别人机交互方法
CN108875623B (zh) 一种基于图像特征融合对比技术的人脸识别方法
WO2023116565A1 (zh) 智能设计网络安全架构图的方法
CN111158457A (zh) 一种基于手势识别的车载hud人机交互系统
CN108960093A (zh) 脸部转动角度的识别方法及设备
CN110895802A (zh) 一种图像处理方法及装置
CN111353325A (zh) 关键点检测模型训练方法及装置
JP2009211490A (ja) 画像認識方法および装置
CN112036253B (zh) 一种基于深度学习的人脸关键点定位方法
Kim et al. Facial landmark extraction scheme based on semantic segmentation
CN111553217A (zh) 一种驾驶员打电话监测方法与系统
CN109165551B (zh) 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法
CN206363347U (zh) 基于角点检测与匹配的药品识别系统

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011120