JPH06231258A - ニューラルネットワークを用いた画像認識装置 - Google Patents

ニューラルネットワークを用いた画像認識装置

Info

Publication number
JPH06231258A
JPH06231258A JP5034639A JP3463993A JPH06231258A JP H06231258 A JPH06231258 A JP H06231258A JP 5034639 A JP5034639 A JP 5034639A JP 3463993 A JP3463993 A JP 3463993A JP H06231258 A JPH06231258 A JP H06231258A
Authority
JP
Japan
Prior art keywords
image
face
neural network
learning
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5034639A
Other languages
English (en)
Inventor
Hiroyuki Inoue
浩之 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Video Research Co Ltd
Original Assignee
Video Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Video Research Co Ltd filed Critical Video Research Co Ltd
Priority to JP5034639A priority Critical patent/JPH06231258A/ja
Publication of JPH06231258A publication Critical patent/JPH06231258A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 認識対象の種類が増加してもニューラルネッ
トワークを再構築する必要性を無くす。 【構成】 ニューラルネットワーク1は、出力層14に16
×16個のセルを備え、人物A〜Eの正面顔画像,上向き
顔画像等予め用意された32×32画素の画像が入力層11に
入力されたとき、出力層14から、入力された人物A〜E
の正面顔画像を16×16にモザイク化した画像が得られる
ように学習されている。認識対象の32×32画素の画像が
入力層11に入力された画像認識時、信号比較部7は、ニ
ューラルネットワーク1の出力層14から得られた16×16
画素の画像と、基本画像記憶メモリ6に記憶されている
学習時に使用した人物A〜Eの正面顔画像を16×16にモ
ザイク化した画像とを比較し、認識結果を制御部8を通
じて表示装置9bに出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、学習則にバックプロパ
ゲーション則を採用したニューラルネットワークを用い
た画像認識装置に関する。
【0002】
【従来の技術】従来、この種の画像認識装置において
は、ニューラルネットワークを構成する出力層に、認識
しようとする特定の画像に1対1に対応付けたセルを備
え、認識対象の画像をニューラルネットワークに入力し
たときに対応するセルの出力値が最大値,それ以外のセ
ルの出力値が最小値となるように学習せしめられ、実際
の認識時には出力層のセルのうち最大値を持つセルに対
応して学習せしめられた認識対象画像を認識結果として
いる。
【0003】即ち、印刷或いは手書きされた例えば0か
ら9の数字を認識する装置においては、出力層に0から
9までの10種の数字に1対1に対応付けて学習せしめ
られた合計10個のセルを設け、また顔画像から例えば
5人の人物を同定する装置においては、出力層にその5
人に1対1に対応付けて学習せしめられた合計5個のセ
ルを設け、実際の認識時には出力層のセルの出力値に基
づいて認識結果を決定するものであった。
【0004】
【発明が解決しようとする課題】上述のような構成の従
来の画像認識装置は、認識対象の種類が初期と同じであ
ればニューラルネットワークを一度構築しておけば以後
使用できる。しかし、初期と比べて認識対象の種類が増
加した場合には、増加した認識対象分だけ出力層に新た
なセルを追加する必要があるため、ニューラルネットワ
ークの再構築が必要になるという問題がある。
【0005】本発明はこのような従来の問題点を解決し
たもので、その目的は、認識対象の種類が増加してもニ
ューラルネットワークを再構築する必要のない画像認識
装置を提供することにある。
【0006】
【課題を解決するための手段】本発明は上記の目的を達
成するために、以下の(A),(B)のような構成を採
用している。
【0007】構成A;入力層,中間層,出力層の少なく
とも3層以上で構成され、学習則にバックプロパゲーシ
ョン則を採用したニューラルネットワークを用いた画像
認識装置において、前記ニューラルネットワークは、出
力層にN×M個のセルを備え、且つ、各認識対象毎に複
数種用意された学習用画像のそれぞれを前記入力層に入
力したときに前記出力層から前記認識対象毎の複数種の
学習用画像のうちの予め定められた特定の画像をN×M
にモザイク化した画像が得られるように学習されてお
り、且つ、前記特定の画像をN×Mにモザイク化した画
像を認識対象毎に記憶する基本画像記憶メモリと、画像
認識時、前記ニューラルネットワークの出力層から得ら
れた画像と前記基本画像記憶メモリに記憶された画像と
を比較して認識結果を出力する比較手段を備える構成。
【0008】構成B;入力層,中間層,出力層の少なく
とも3層以上で構成され、学習則にバックプロパゲーシ
ョン則を採用したニューラルネットワークを用いた画像
認識装置において、前記ニューラルネットワークは、出
力層にN×M個のセルを備え、且つ、学習用画像を前記
入力層に入力したときに前記出力層から前記学習用画像
をN×Mにモザイク化した画像が得られるように学習さ
れており、且つ、前記学習用画像をN×Mにモザイク化
した画像を記憶する基本画像記憶メモリと、画像認識
時、前記ニューラルネットワークの出力層から得られた
画像と前記基本画像記憶メモリに記憶された画像とを比
較して認識結果を出力する比較手段を備える構成。な
お、この構成の好ましい実施例においては、前記学習用
画像は各認識対象毎に複数種用いられる。
【0009】
【作用】構成Aにおいては、各認識対象について複数種
用意された学習用画像のそれぞれを入力層に入力したと
きに出力層から前記複数種のうちの予め定められた特定
の画像をN×Mにモザイク化した画像が得られるように
ニューラルネットワークが学習されているため、画像認
識時、認識対象とする画像を入力層に入力すると、その
画像が学習用画像の何れかに類似する場合には、出力層
のN×M個のセルからは入力された画像と最も類似して
いる前記特定の画像をN×Mにモザイク化した画像が出
力される。よって、それと前記複数の特定の画像をN×
Mにモザイク化した画像とを比較手段が比較することに
より、画像の認識が行える。
【0010】構成Bにおいては、学習用の画像を入力層
に入力したときに出力層からその学習用の画像をN×M
にモザイク化した画像が得られるようにニューラルネッ
トワークが学習されているため、画像認識時、認識対象
とする画像を入力層に入力すると、その画像が学習用の
画像の何れかに類似する場合には、出力層のN×M個の
セルからは入力された画像と最も類似している学習用の
画像をN×Mにモザイク化した画像が出力される。よっ
て、それと前記複数の学習用の画像をN×Mにモザイク
化した画像とを比較手段が比較することにより、画像の
認識が行える。
【0011】
【実施例】次に本発明の実施例について図面を参照して
詳細に説明する。
【0012】図1は本発明のニューラルネットワークを
用いた画像認識装置の一実施例のブロック図であり、顔
画像から人物を同定する装置に本発明を適用したもので
ある。
【0013】この実施例の画像認識装置は、ニューラル
ネットワーク1と、画像入力装置2と、前処理部3と、
入力画像記憶メモリ4と、出力画像記憶メモリ5と、基
本画像記憶メモリ6と、信号比較部7と、制御部8と、
入出力装置9とを備えている。
【0014】制御部8は画像認識装置全体の制御を司る
部分であり、ニューラルネットワーク1,出力画像記憶
メモリ5,基本画像記憶メモリ6,信号比較部7および
入出力装置9に接続されている。
【0015】入出力装置9はキーボード等の入力装置9
aとディスプレイ等の表示装置9bとを備え、利用者か
らの指示を受け付けたり、装置側からの出力を表示す
る。
【0016】画像入力装置2は、学習用画像および認識
対象とする画像を入力する装置であり、ビデオカメラ等
で構成されている。
【0017】前処理部3は、画像入力装置2から出力さ
れた画像に対してヒストグラム伸張を行った後に、ニュ
ーラルネットワーク1に入力できるサイズにモザイク化
する部分である。ヒストグラム伸張はコントラスト強調
とも呼ばれており、例えば濃度階調変換を最大階調が2
55のレベルになるように、最小階調が0のレベルにな
るように画像のコントラストを強調する。このような前
処理を行うことで、画像入力時の照明の変化等による濃
度変化に対して強い認識が可能となる。なお、画像のモ
ザイク化は、ニューラルネットワーク1の入力が32×
32というように、メモリの関係から制限されている為
に行うものである。
【0018】入力画像記憶メモリ4は、前処理部3から
出力されたヒストグラム伸張,モザイク化後の入力画像
を保持するメモリであり、保持した32×32画素の値
をニューラルネットワーク1に入力する。
【0019】ニューラルネットワーク1は、32×32
=1024個のセルを持つ入力層11と、60個のセル
を持つ第1中間層12と、同じく60個のセルを持つ第
2中間層13と、16×16=256個のセルを持つ出
力層14とを有する4層構造になっており、学習則とし
てバックプロパゲーション則の機能を備えている。
【0020】ここで、入力層11の各セルには1画素=
1セル入力となるように入力画像記憶メモリ4に保持さ
れた画素の値が入力され、入力層11の各セルの出力は
第1中間層12の全セルに入力され、第1中間層12の
各セルの出力は第2中間層13の全セルに入力され、第
2中間層13の各セルの出力は出力層14の全セルに入
力され、出力層14の各セルの出力は出力画像記憶メモ
リ5に入力される。
【0021】出力画像記憶メモリ5は、出力層14から
出力された16×16個の信号を、16×16画素の画
像として記憶するメモリであり、その画像は信号比較部
7および制御部8に出力される。
【0022】基本画像記憶メモリ6は、学習時には教師
用画像として、また実際の認識時には比較用画像として
使用される基本画像を記憶するメモリである。この基本
画像は、実際の人物の顔を画像入力装置2で撮像し前処
理部3でヒストグラム伸張,モザイク化した32×32
画素の画像を、別途の手段により16×16画素に更に
モザイク化した画像である。
【0023】ここで、モザイク化した画像を採用するの
は、原画像をモザイク化することで局所の特徴がぼやけ
て比較的大きな特徴のみが残り、位置ずれに強い認識が
可能となるからである。
【0024】なお、32×32画素を16×16画素に
モザイク化すると、隣接する4画素がモザイク化後の1
画素に対応するが、モザイク化後の1画素の濃度として
は例えば元の4画素の濃度の平均値がとられる。勿論、
4画素のうちの最大濃度を持つ画素など特定の画素の濃
度をモザイク化後の画素の濃度とするようにしても良
い。また、モザイク化の度合すなわち原画像の何画素を
1つの画素とするかは認識対象物の種類に応じて決定さ
れる。
【0025】信号比較部7は、認識時に、出力画像記憶
メモリ5に取り出されたニューラルネットワーク1の1
6×16画素の出力画像と、基本画像記憶メモリ6に記
憶された全ての基本画像との比較を行い、認識結果を制
御部8に出力する部分である。
【0026】この信号比較部7における画像の比較方法
としては、誤差2乗和による方法,誤差絶対値和による
方法等の任意の方法が採用される。
【0027】誤差2乗和による方法は、ニューラルネッ
トワーク1の出力画像の第i行,第j列目(i,j=1
〜16。以下同じ)の画素の濃度をOi,j とし、基本画
像の第i行,第j列目の画素の濃度をBi,j とすると、 (O1,1 −B1,1 2 +(O1,2 −B1,2 2 +…+(O16,16 −B16,16 2 によって誤差2乗和を求め、この値が最小値となる基本
画像が最も類似する画像と判断するものである。
【0028】誤差絶対値和による方法は、 |O1,1 −B1,1 |+|O1,2 −B1,2 |+…+|O16,16 −B16,16 | によって誤差絶対値和を求め、この値が最小値となる基
本画像が最も類似する画像と判断するものである。
【0029】以下、上述のように構成された本実施例の
ニューラルネットワークを用いた画像認識装置の動作を
説明する。
【0030】先ず、認識対象とする人物(A,B,C,
D,Eの5人とする)の正面,右向き,左向き,上向
き,下向きの顔画像を、同一人物の顔の正面画像を教師
用画像として学習し、実際の認識時においても正面画像
を比較用画像として使用する実施例について説明する。
【0031】この場合、認識対象となるA〜Eの5人の
人物の顔をその正面から画像入力装置2で撮像し、前処
理部3でヒストグラム伸張,モザイク化して32×32
画素の画像を作成し、これを別途の手段で更に16×1
6画素にモザイク化した画像(従って、合計5個のモザ
イク化画像)を、基本画像として基本画像記憶メモリ6
に記憶しておく。
【0032】〔学習時〕入力装置9aから学習モードが
指示されると、制御部8はニューラルネットワーク1を
学習モードに切り替え、自身も学習モードとなる。この
学習モードにおいては、制御部8は入力装置9aから指
示された基本画像を基本画像記憶メモリ6から読み出
し、教師信号としてニューラルネットワーク1に与えて
学習させると共に、出力画像記憶メモリ5に出力された
ニューラルネットワーク1の出力画像と基本画像とを対
にして表示装置9bに表示する処理を行う。
【0033】ここで学習は、同一人物の顔画像が連続し
ないような例えば以下の順序で、人物の顔画像を画像入
力装置2から入力すると共に、制御部8によって、基本
画像記憶メモリ6に記憶された基本画像を教師信号とし
てニューラルネットワーク1に与えることで行う。
【0034】 学習画像 基本画像(教師信号) (1) Aの正面の顔画像 Aの正面の顔画像のモザイク化画像 (2) Bの正面の顔画像 Bの正面の顔画像のモザイク化画像 (3) Cの正面の顔画像 Cの正面の顔画像のモザイク化画像 (4) Dの正面の顔画像 Dの正面の顔画像のモザイク化画像 (5) Eの正面の顔画像 Eの正面の顔画像のモザイク化画像 (6) Aの右向きの顔画像 Aの正面の顔画像のモザイク化画像 (7) Bの右向きの顔画像 Bの正面の顔画像のモザイク化画像 (8) Cの右向きの顔画像 Cの正面の顔画像のモザイク化画像 (9) Dの右向きの顔画像 Dの正面の顔画像のモザイク化画像 (10) Eの右向きの顔画像 Eの正面の顔画像のモザイク化画像 (11) Aの左向きの顔画像 Aの正面の顔画像のモザイク化画像 (12) Bの左向きの顔画像 Bの正面の顔画像のモザイク化画像 (13) Cの左向きの顔画像 Cの正面の顔画像のモザイク化画像 (14) Dの左向きの顔画像 Dの正面の顔画像のモザイク化画像 (15) Eの左向きの顔画像 Eの正面の顔画像のモザイク化画像 (16) Aの下向きの顔画像 Aの正面の顔画像のモザイク化画像 (17) Bの下向きの顔画像 Bの正面の顔画像のモザイク化画像 (18) Cの下向きの顔画像 Cの正面の顔画像のモザイク化画像 (19) Dの下向きの顔画像 Dの正面の顔画像のモザイク化画像 (20) Eの下向きの顔画像 Eの正面の顔画像のモザイク化画像 (21) Aの上向きの顔画像 Aの正面の顔画像のモザイク化画像 (22) Bの上向きの顔画像 Bの正面の顔画像のモザイク化画像 (23) Cの上向きの顔画像 Cの正面の顔画像のモザイク化画像 (24) Dの上向きの顔画像 Dの正面の顔画像のモザイク化画像 (25) Eの上向きの顔画像 Eの正面の顔画像のモザイク化画像
【0035】利用者は、各画像の学習時、制御部8によ
って表示装置9bに表示されたニューラルネットワーク
1の出力画像と基本画像とから学習の効果を把握し、満
足した結果が得られるまで、すなわち、人物Xの顔画像
を入力したときにニューラルネットワーク1の出力層1
4から同じ人物Xの正面画像を16×16画素にモザイ
ク化した画像とほぼ同様な画像が得られるまで繰り返し
学習を進める。
【0036】ここで、正面以外の顔画像を学習させるの
は、次の理由による。即ち、本実施例では、実際の認識
時、画像入力装置2で人の顔を正面から撮像することを
前提としている。この前提が常に成立する場合には、正
面の顔画像だけ学習させれば足りる。しかし、実際の撮
像においては正面から多少ずれた方向から撮像される場
合があり、その場合には正面画像だけでは誤認率が高く
なる。そこで、本実施例では、正面だけでなく右向き,
左向き,下向き,上向きの方向からの顔画像も正面画像
として学習させておくことにより、モザイク化と相俟っ
て撮像時の顔画像の位置ずれに対して強い画像認識を行
えるようにしている。なお、このようなことから、ここ
に述べた正面以外の顔画像は完全な右向き,左向き,下
向き,上向きではなく、多少右向き,左向き,下向き,
上向きの顔画像のことである。
【0037】また、画像を学習させる時に、Aの正面,
Aの右向き,Aの左向き,Aの上向き,Aの下向き,B
の正面,Bの右向き,Bの左向き,…といった具合に同
じ人の画像を連続して学習させないのは、このような方
法に比べ上述したように同一人物の顔画像が連続しない
ように学習させた方が学習効率が高く、従って同程度の
学習回数では認識率が高まることが、実験により確かめ
られたからである。なお、その理由は未だ解明されてい
ないが、同じ人物の画像を連続して学習させると、最後
に連続して学習させた人物の画像の影響がニューラルネ
ットワーク1に強く残っているためと考えられる。
【0038】以上のような学習が完了すると、ニューラ
ルネットワーク1は、人物A〜Eの正面,右向き,左向
き,上向き,下向きの顔画像が画像入力装置2から入力
されると、出力層14から同じ人物の顔の正面画像を1
6×16画素にモザイク化した画像を出力する状態とな
る。
【0039】〔認識時〕入力装置9aから認識モードが
入力されると、制御部8はニューラルネットワーク1を
認識モードに切り替え、自身も認識モードとなる。
【0040】この認識モードにおいて、認識させようと
する人物の顔の画像が画像入力装置2で入力されると、
前処理部3でヒストグラム伸張,モザイク化された32
×32画素の画像が入力画像記憶メモリ4を通じてニュ
ーラルネットワーク1の入力層11に入力され、出力層
14から16×16画素の出力画像が出力されて出力画
像記憶メモリ5に記憶される。
【0041】信号比較部7は、この出力画像記憶メモリ
5に記憶されたニューラルネットワーク1の出力画像
と、基本画像記憶メモリ6に記憶された全ての基本画像
つまり本実施例の場合はA,B,C,D,Eの正面の顔
画像を16×16画素にモザイク化した合計5個の画像
とを順次比較し、その比較結果に基づき認識結果を決定
して制御部8を通じて表示装置9bに出力する。
【0042】なお、認識結果を決定する方法としては、
前述した誤差2乗和や誤差絶対値和が最小となる比較用
画像に対応する人物を認識結果とする方法以外に、認識
対象者A〜E以外の第三者を誤ってA〜Eの何れかであ
ると認識するのを防止するために、閾値を設け、最小の
誤差2乗和や誤差絶対値和の値がその閾値以上でなけれ
ば認識結果を出力しない方法等が採用される。
【0043】次に認識対象とする人物の正面,右向き,
左向き,上向き,下向きの顔画像を、同一人物の同一向
きの顔画像を教師用画像として学習し、実際の認識時に
おいても同一人物の全ての向きの顔画像を比較用画像と
して使用する実施例について説明する。
【0044】この場合、認識対象となる人物A,B,
C,D,Eの顔をその正面,右向き,左向き,上向き,
下向きに画像入力装置2で撮像し、前処理部3でヒスト
グラム伸張,モザイク化して32×32画素の画像を作
成し、これを別途の手段で16×16画素に更にモザイ
ク化した画像(従って、合計25個のモザイク化画像)
を、基本画像として基本画像記憶メモリ6に記憶してお
く。
【0045】〔学習時〕学習は、同一人物の顔画像が連
続しないような例えば以下の順序で、人物の顔画像を画
像入力装置2から入力すると共に制御部8によって基本
画像記憶メモリ6に記憶された基本画像を教師信号とし
てニューラルネットワーク1に与えることで行う。
【0046】 学習画像 基本画像(教師信号) (1) Aの正面の顔画像 Aの正面の顔画像のモザイク化画像 (2) Bの正面の顔画像 Bの正面の顔画像のモザイク化画像 (3) Cの正面の顔画像 Cの正面の顔画像のモザイク化画像 (4) Dの正面の顔画像 Dの正面の顔画像のモザイク化画像 (5) Eの正面の顔画像 Eの正面の顔画像のモザイク化画像 (6) Aの右向きの顔画像 Aの右向きの顔画像のモザイク化画像 (7) Bの右向きの顔画像 Bの右向きの顔画像のモザイク化画像 (8) Cの右向きの顔画像 Cの右向きの顔画像のモザイク化画像 (9) Dの右向きの顔画像 Dの右向きの顔画像のモザイク化画像 (10) Eの右向きの顔画像 Eの右向きの顔画像のモザイク化画像 (11) Aの左向きの顔画像 Aの左向きの顔画像のモザイク化画像 (12) Bの左向きの顔画像 Bの左向きの顔画像のモザイク化画像 (13) Cの左向きの顔画像 Cの左向きの顔画像のモザイク化画像 (14) Dの左向きの顔画像 Dの左向きの顔画像のモザイク化画像 (15) Eの左向きの顔画像 Eの左向きの顔画像のモザイク化画像 (16) Aの下向きの顔画像 Aの下向きの顔画像のモザイク化画像 (17) Bの下向きの顔画像 Bの下向きの顔画像のモザイク化画像 (18) Cの下向きの顔画像 Cの下向きの顔画像のモザイク化画像 (19) Dの下向きの顔画像 Dの下向きの顔画像のモザイク化画像 (20) Eの下向きの顔画像 Eの下向きの顔画像のモザイク化画像 (21) Aの上向きの顔画像 Aの上向きの顔画像のモザイク化画像 (22) Bの上向きの顔画像 Bの上向きの顔画像のモザイク化画像 (23) Cの上向きの顔画像 Cの上向きの顔画像のモザイク化画像 (24) Dの上向きの顔画像 Dの上向きの顔画像のモザイク化画像 (25) Eの上向きの顔画像 Eの上向きの顔画像のモザイク化画像
【0047】なお、利用者は、各画像の学習時、制御部
8によって表示装置9bに表示されたニューラルネット
ワーク1の出力画像と教師用画像とから学習の効果を把
握し、満足する結果が得られるまで、すなわち、人物X
の顔画像を入力したときにニューラルネットワーク1の
出力層14から同じ人物Xの同じ向きの顔画像を16×
16画素にモザイク化した画像とほぼ同様な画像が得ら
れまで繰り返し学習を進める。
【0048】以上のような学習が完了すると、ニューラ
ルネットワーク1は、人物A〜Eの正面,右向き,左向
き,上向き,下向きの顔画像が画像入力装置2から入力
されると、出力層14から同じ人物の正面,右向き,左
向き,上向き,下向きの顔画像を16×16画素にモザ
イク化した画像を出力する状態となる。
【0049】〔認識時〕認識モードにおいて、認識させ
ようとする人物の顔の画像が画像入力装置2で入力され
ると、前処理部3でヒストグラム伸張,モザイク化され
た32×32画素の画像が入力画像記憶メモリ4を通じ
てニューラルネットワーク1の入力層11に入力され、
出力層14から16×16画素の出力画像が出力されて
出力画像記憶メモリ5に記憶される。
【0050】信号比較部7は、この出力画像記憶メモリ
5に記憶されたニューラルネットワーク1の出力画像
と、基本画像記憶メモリ6に記憶された全ての基本画像
つまり本実施例の場合はA,B,C,D,Eの正面,右
向き,左向き,上向き,下向きの顔画像を16×16画
素にモザイク化した合計25個の画像とを順次比較し、
その比較結果に基づき認識結果を決定して制御部8を通
じて表示装置9bに出力する。
【0051】なお、認識結果を決定する方法としては、
前述した誤差2乗和や誤差絶対値和が最小となる基本画
像に対応する人物を認識結果とする方法以外に、認識対
象者A〜E以外の第三者を誤ってA〜Eの何れかである
と認識するのを防止するために、閾値を設け、最小の誤
差2乗和や誤差絶対値和の値がその閾値以上でなければ
認識結果を出力しない方法が採用可能である。また、同
一人物について複数の基本画像があることを利用して、
より有効に誤認識を防止し得るようにするために、誤差
2乗和や誤差絶対値和が最小となる基本画像とその次に
最小となる基本画像とが同じ人物に対応している場合に
限りその人物を認識結果として出力する方法も採用可能
である。
【0052】以上の実施例は、人物の顔画像から人物を
同定する装置に本発明を適用したものであるが、本発明
はそれら以外に手書き文字認識等,他の画像認識に広く
適用することができる。また、実施例では4層構造のニ
ューラルネットワークを使用したが、3層以上のニュー
ラルネットワークであれば良く、また各層のセル数も上
記実施例のものに限定されるものではない。
【0053】
【発明の効果】以上説明した本発明のニューラルネット
ワークを用いた画像認識装置によれば、以下のような効
果を得ることができる。
【0054】出力層の各セルが認識しようとする特定の
画像に1対1に対応していないため、認識対象画像の種
類が増加しても新たな学習が必要となるだけで出力層の
セル数を含めてニューラルネットワーク全体の構成を変
更する必要がない。
【0055】出力層の各セルを特定の画像に1対1に対
応付ける構成では、認識対象の種類数の上限は出力層の
セル数で制限されるが、本発明ではこのような制限がな
く、認識対象の種類数を原理的にN×M個以上とするこ
とができる。
【0056】モザイク化画像を使用したことにより、位
置ずれに強い画像認識が行える。
【図面の簡単な説明】
【図1】本発明のニューラルネットワークを用いた画像
認識装置の一実施例の機能ブロック図である。
【符号の説明】 1…ニューラルネットワーク 11…入力層 12…第1中間層 13…第2中間層 14…出力層 2…画像入力装置 3…前処理部 4…入力画像記憶メモリ 5…出力画像記憶メモリ 6…基本画像記憶メモリ 7…信号比較部 8…制御部 9…入出力装置 9a…入力装置 9b…表示装置

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力層,中間層,出力層の少なくとも3
    層以上で構成され、学習則にバックプロパゲーション則
    を採用したニューラルネットワークを用いた画像認識装
    置において、 前記ニューラルネットワークは、出力層にN×M個のセ
    ルを備え、且つ、各認識対象毎に複数種用意された学習
    用画像のそれぞれを前記入力層に入力したときに前記出
    力層から前記認識対象毎の複数種の学習用画像のうちの
    予め定められた特定の画像をN×Mにモザイク化した画
    像が得られるように学習されており、且つ、 前記特定の画像をN×Mにモザイク化した画像を認識対
    象毎に記憶する基本画像記憶メモリと、 画像認識時、前記ニューラルネットワークの出力層から
    得られた画像と前記基本画像記憶メモリに記憶された画
    像とを比較して認識結果を出力する比較手段を備えたこ
    とを特徴とするニューラルネットワークを用いた画像認
    識装置。
  2. 【請求項2】 入力層,中間層,出力層の少なくとも3
    層以上で構成され、学習則にバックプロパゲーション則
    を採用したニューラルネットワークを用いた画像認識装
    置において、 前記ニューラルネットワークは、出力層にN×M個のセ
    ルを備え、且つ、学習用画像を前記入力層に入力したと
    きに前記出力層から前記学習用画像をN×Mにモザイク
    化した画像が得られるように学習されており、且つ、 前記学習用画像をN×Mにモザイク化した画像を記憶す
    る基本画像記憶メモリと、 画像認識時、前記ニューラルネットワークの出力層から
    得られた画像と前記基本画像記憶メモリに記憶された画
    像とを比較して認識結果を出力する比較手段を備えたこ
    とを特徴とするニューラルネットワークを用いた画像認
    識装置。
  3. 【請求項3】 請求項2記載のニューラルネットワーク
    を用いた画像認識装置において、前記学習用画像を各認
    識対象毎に複数種用いることを特徴とするニューラルネ
    ットワークを用いた画像認識装置。
JP5034639A 1993-01-29 1993-01-29 ニューラルネットワークを用いた画像認識装置 Withdrawn JPH06231258A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5034639A JPH06231258A (ja) 1993-01-29 1993-01-29 ニューラルネットワークを用いた画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5034639A JPH06231258A (ja) 1993-01-29 1993-01-29 ニューラルネットワークを用いた画像認識装置

Publications (1)

Publication Number Publication Date
JPH06231258A true JPH06231258A (ja) 1994-08-19

Family

ID=12419997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5034639A Withdrawn JPH06231258A (ja) 1993-01-29 1993-01-29 ニューラルネットワークを用いた画像認識装置

Country Status (1)

Country Link
JP (1) JPH06231258A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007520010A (ja) * 2004-02-02 2007-07-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オンライン学習を用いた連続的な顔認識
JP2019532387A (ja) * 2016-08-15 2019-11-07 エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. 電子ゲート環境のための乳幼児検出
CN111401453A (zh) * 2020-03-18 2020-07-10 西安电子科技大学 一种马赛克图像分类识别方法及系统
JP2021513167A (ja) * 2018-05-16 2021-05-20 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド 画像認識方法、記憶媒体及びコンピュータ装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007520010A (ja) * 2004-02-02 2007-07-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オンライン学習を用いた連続的な顔認識
JP2019532387A (ja) * 2016-08-15 2019-11-07 エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. 電子ゲート環境のための乳幼児検出
JP2021513167A (ja) * 2018-05-16 2021-05-20 テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド 画像認識方法、記憶媒体及びコンピュータ装置
CN111401453A (zh) * 2020-03-18 2020-07-10 西安电子科技大学 一种马赛克图像分类识别方法及系统

Similar Documents

Publication Publication Date Title
Anwar et al. Image colorization: A survey and dataset
US5425108A (en) Mobile type of automatic identification system for a car plate
US5239593A (en) Optical pattern recognition using detector and locator neural networks
CN111401117B (zh) 基于双流卷积神经网络的新生儿疼痛表情识别方法
CN113673354B (zh) 一种基于上下文信息与联合嵌入的人体关键点检测方法
JPS5911152B2 (ja) パタ−ンマツチング方法及びその実施装置
JPH0695192A (ja) 画像認識装置及び画像入力方法
CN109360179A (zh) 一种图像融合方法、装置及可读存储介质
JPH08237535A (ja) 追尾領域設定装置,動きベクトル検出回路およびそれを用いた被写体追尾装置
JPH11331693A (ja) 画像処理方法及びその装置
JP2008198078A (ja) 画像検出装置
JPH06231258A (ja) ニューラルネットワークを用いた画像認識装置
KR100390569B1 (ko) 크기와 회전에 무관한 지능형 얼굴검출 방법
Nie Research on facial expression recognition of robot based on CNN convolution neural network
JP3263253B2 (ja) 顔方向判定装置及びそれを用いた画像表示装置
US20220157077A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
JPH04205284A (ja) ナンバープレート認識装置
JP2000187733A (ja) 画像処理装置及び方法並びに記憶媒体
JPH08235359A (ja) パターンマッチング方法およびパターンマッチング装置
JP2020201880A (ja) 画像処理装置、および、画像処理プログラム
JPH0367381A (ja) 文字認識装置
JP7394542B2 (ja) 撮像装置、通知装置、通知方法、及びプログラム
CN113784077B (zh) 一种信息处理方法、装置和电子设备
TWI689872B (zh) 影像辨識方法
JPH10255058A (ja) 動作検出装置および動作検出方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20000404