JPH05128250A - 画像認識装置 - Google Patents

画像認識装置

Info

Publication number
JPH05128250A
JPH05128250A JP3292587A JP29258791A JPH05128250A JP H05128250 A JPH05128250 A JP H05128250A JP 3292587 A JP3292587 A JP 3292587A JP 29258791 A JP29258791 A JP 29258791A JP H05128250 A JPH05128250 A JP H05128250A
Authority
JP
Japan
Prior art keywords
image
picture
learning
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3292587A
Other languages
English (en)
Inventor
Yutaka Fuwa
裕 不破
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3292587A priority Critical patent/JPH05128250A/ja
Publication of JPH05128250A publication Critical patent/JPH05128250A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 画像認識を自己学習によって最適化を行い、
ノイズ及び周囲条件の影響を軽減し、対象を正確に認識
・分類する画像認識装置を得ること。 【構成】 入力画像(1)の座標空間を位置によらない
画像空間に変換する画像空間変換手段(2)と、該画像
空間に変換された画像からノイズ及び周囲条件の影響を
軽減した画像に復元する自己学習可能な画像復元手段
(3)と、復元された画像から対象の有無・対象の種別
・対象の良否等を判定する自己学習可能な画像認識手段
(5)を設けたもの。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像情報の認識処理に関
し、特に自己最適化・学習が可能な画像認識装置に関す
る。
【0002】
【従来の技術】従来から画像認識分野では対象の認識の
さまざまな手法の研究・開発・実用化がなされてきた。
しかし、汎用に用いることのできる認識手法はなく、対
象ごとに最適な認識手法を開発・適用してきた。
【0003】画像認識の手順としては一般にノイズなど
を含んだ変形された画像をもとの画像に復元する画像復
元過程と、画像を分類認識する画像認識過程から成って
いる。
【0004】画像認識過程では画像の特徴値の範囲を学
習データによって自動設定するなどの手法があるが、複
数の特徴項目を自動的に連結するのがむずかしい欠点が
ある。
【0005】画像復元過程では画像のイイズ状況などを
みて対象の画像特徴成分を減衰させないようにフィルタ
をかける手法が一般的で自動的に画像復元を行なう最適
なフィルタを生成する方法がなかった。
【0006】近年、生体の神経回路網を模擬したニュー
ラルネットワークの研究・開発が盛んである。ニューラ
ルネットワークでは対象の特徴などが不明であっても認
識方法を自動的に最適化する自己学習機能を持ってお
り、画像の認識などの分野への適用が期待されている。
【0007】ニューラルネットワークには様々な型のも
のが提案されている。代表的なものは層状のパーセプト
ロン型ニューラルネットワーク(学習方法はバックプロ
パゲーション法)と連想記憶型ニューラルネットワーク
がある。
【0008】バックプロパゲーション型ニューラルネッ
トワークは入力データと教師信号(期待する出力)を与
えて学習を行なうもので、教示した入力データと類似し
た入力に対してはほぼ期待通りの出力を得ることができ
る。しかし、入力にノイズが多い場合や、背景形状が大
幅に変化すると期待通りの出力を得られない欠点があ
る。
【0009】連想記憶型ニューラルネットワークは入力
データだけで学習を行うもので、入力の形状が大幅に変
化しても最も近い学習した形状の出力を得ることができ
る。しかし、入力データの分類能力がない欠点がある。
【0010】
【発明が解決しようとする課題】従来の画像認識技術で
は対象ごとに認識手法は開発しなくてはならない。その
ため対象の認識手法の開発はオフラインで試行錯誤しな
がら行なっていた。
【0011】ニューラルネットワークは自己学習が可能
であるが、バックプロパゲーション型ニューラルネット
ワークではノイズや形状変化に弱い欠点が、連想記憶型
ニューラルネットワークでは同一対象の見え方がいくつ
かあると同一物と認識できない欠点がある。
【0012】本発明は上記問題に鑑みてなされもので、
画像認識において、認識手法を自己学習機能によって最
適化を行い、さらにノイズ・周囲の形状変化に関わらず
対象を正確に認識・分類できる画像認識装置を提供する
ことを目的とする。
【0013】
【課題を解決するための手段】上述目的を達するため、
本発明は、図1に示すように、入力画像(1)の座標空
間を位置によらない画像空間に変換する画像空間変換手
段(2)と、該画像空間に変換された画像からノイズ及
び周囲条件の影響を軽減した画像に復元する自己学習可
能な画像復元手段(3)と、復元された画像から対象の
有無・対象の種別・対象の良否等を判定する自己学習可
能な画像認識手段(5)を設けた画像認識装置とする。
【0014】
【作用】一般に対象の位置が不定の場合、認識のために
は位置決め、または位置の正規化が必要である。図1の
画像空間変換手段(2)では入力画像(1)を適当な画
像空間に変換することによって対象の位置を正規化す
る。以下、認識時の作用と学習時の作用について説明す
る。
【0015】認識時は画像空間変換手段(2)で空間を
変換された画像が画像復元手段(3)に入力され背景・
形状変化・ノイズなどによる画像の変形を、最も近い学
習時の画像形状に変換する。これによって画像の復元が
行なわれる。復元された画像は画像データセレクタ
(4)を介して画像認識手段(5)に入力され、復元さ
れきらない部分や複数形状から統合された認識結果を得
る。
【0016】学習時は画像空間変換手段(2)で空間を
変換された画像が画像復元手段(3)と画像認識手段
(5)の両方に入力される。画像復元手段(3)では入
力画像(1)にもとづいて自己学習が行なわれる。画像
認識手段(5)では教師信号(7)として期待する出力
値を入力して自己学習を行なう。
【0017】
【実施例】本発明の実施例を図2に示す。図2におい
て、入力画像(1)は認識の対象となる画像である。画
像空間変換部(2)は2次元フーリエ変換部(2a)と
パワースペクトル変換部(2b)から成り、入力画像
(1)の座標空間を位置によらない画像空間に変換す
る。画像復元部(3)は連想記憶型ニューラルネットワ
ーク(3a)を備え、自己学習によりノイズや周囲条件
の影響を軽減した画像を復元する。画像データセレクタ
(4)は画像空間変換部(2)および画像復元部(3)
のいずれかの画像を選択出力する。画像認識部(5)は
バックプロパゲーション型層状ニューラルネットワーク
(5a)を備え、入力画像データと教師信号入力(7)
から認識結果出力(7)を得るものである。以下、本実
施例の作用を詳述する。 〈画像認識装置全体の作用〉 [1]学習時の作用
【0018】学習時は外部から代表的な画像を入力画像
(1)として用い、入力画像(1)に対応した種別(望
ましい出力)を教師信号(7)として用いる。入力画像
(1)は画像空間変換部(2)の2次元フーリエ変換部
(2a)でフーリエ周波数画像に変換されさらにパワー
スペクトル変換部(2b)でパワースペクトル周波数画
像(以下単に周波数画像という)に変換される。周波数
画像は対象の位置に依存しないで対象の特徴を持ってい
る。周波数画像は画像復元部(3)に入力されると同時
に画像データセレクタ(4)を介して画像認識部(5)
に入力される。本実施例では連想記憶型ニューラルネッ
トワーク(3a)の学習では教師信号(7)は用いない
で、相関学習を行なう。バックプロパゲーション型ニュ
ーラルネットワーク(5a)は周波数画像と教師信号
(7)の両方を用いて誤差逆伝播法(バックプロパゲー
ション)学習を行なう。 [2]認識時の作用
【0019】認識時は教師信号(7)を用いない。ノイ
ズなどを含んだ入力画像(1)は、学習時と同様に画像
変換部(2)で周波数画像に変換され画像復元部(3)
に入力される。画像復元部(3)は同一の連想記憶型ニ
ューラルネットワーク(3a)が複数段接続されてい
る。画像復元部(3)で復元された画像は画像データセ
レクタ(4)を経て画像認識部(5)の3層構造を持っ
たバックプロパゲーション型ニューラルネットワーク
(5a)で認識され種別を認識結果(6)として出力す
る。 〈画像空間変換部の作用〉
【0020】入力画像(1)における認識対象の対象の
位置は不定である。このとき対象の形状特徴などを認識
するためには一般的には対象位置の正規化を行なう必要
がある。ニューラルネットワークによる認識装置では必
ずしも対象位置の正規化は必要ではないが、装置構成の
小型化,学習の簡素化・容易さなどの点からはやはり対
象位置の正規化を行なった方が得策である。
【0021】入力画像(1)は画像空間変換部(2)の
うち2次元フーリエ変換部(2a)で周波数空間に変換
される。入力画像(1)の画像空間の位置(x,y)に
おける画素の濃淡値をp(x,y)とすると、2次元フ
ーリエ変換部(2a)の周波数(Fx ,Fy )における
周波数画像は実部成分をPr (Fx ,Fy ),虚部成分
をPi(Fx ,Fy )として
【0022】
【数1】 となる。さらにパワースペクトル変換部(2b)では、
cos2 θ+ sin2 θ=1であることから、その出力Ps
(Fx ,Fy )は Ps (Fx ,Fy )=Pr (Fx ,Fy 2 +Pi (Fx ,Fy 2 (2) は入力画像(1)の対象位置(x,y)に依存しない。
すなわち、対象の位置を正規化して対象の形状特徴を表
わしている。 〈画像復元部の作用〉
【0023】連想記憶型ニューラルネットワーク(3
a)は図3の構成を持っている。学習時は図3のセレク
タ(9)によって画像空間変換部(2)の出力を使用す
る。図3のニューロン群は、入力をIj として出力をO
k とすると結合係数をwjkとして である。ここでSは適当な非線形関数で一般的にはジグ
モイド関数 を用いる。学習時は結合係数wjkをΔwjkずつ変えてい
く。 Δwjk=σIj S[0k ] (5) ここでσは適当な正の定数である。認識時に適当な入力
データIを与えると、学習したデータ群から最も入力デ
ータに近いものを出力しようとする。入力データにノイ
ズなどの変形が大きい場合は1段の連想記憶型ニューラ
ルネットワークでは画像の復元が完全には行えないが、
同じ連想記憶型ニューラルネットワークを適当な複数段
従続接続して繰り返し復元動作を行なうことでノイズな
どが多い画像の復元を実現することができる。 〈画像認識部の作用〉バックプロパゲーション型層状ニ
ューラルネットワーク(5a)は図4の構成をしてお
り、入力Ij に対して出力Ol は中間層出力Hk として で示されるwko,wjoはオフセット項である。学習時期
待する出力Yl を教師信号(7)として与えると で出力層の学習が で中間層の学習が行なわれる。
【0024】バックプロパゲーション型ニューラルネッ
トワークでは学習は、入力データの分類アルゴリズムを
自動生成することに相当する。学習データに比較的近い
入力データを与えるとバックプロパゲーション型ニュー
ラルネットワークはほぼ期待通りの認識結果を出力す
る。
【0025】上述の実施例によれば、入力画像にノイズ
などの変形成分を多く含んだ画像の認識を行うことが可
能となる。ニューラルネットワークでは位置が変化する
と認識が困難となるため図2では画像空間変換部(2)
で対象の位置を正規化する。画像復元部(3)の連想記
憶型ニューラルネットワーク(3a)によって画像のノ
イズ成分の大部分を除去し画像認識部(5)で最適な認
識結果を出力することができる。さらに本実施例では代
表的な画像と望むべき出力を与えて学習を行なわせるこ
とによって画像復元部(3)と画像認識部(5)を自動
的に対象に応じた最適な状態に設定することが可能であ
る。
【0026】他の実施例として、ニューラルネットワー
クのかわりに相関演算手法をもちいた実施例を説明す
る。相関演算手段は入力画像pとテンプレート画像rの
類似状況を相関値cで評価するもので認識領域aにおけ
る入力画像とテンプレート画像の各々の平均値をAp,
Arとして で示される。ここで入力画像pとテンプレート画像rが
一致する場合はc=1に不一致の場合は不一致の程度に
応じて−1≦c<1となる。
【0027】図5にその実施例を示す。画像空間変換部
(2)は図2の実施例と同様である。画像復元部(3)
は、テンプレート画像ごとに相関演算を行なう相関演算
部(3b)、画像記憶部(3c)と、相関値に応じた割
合で画像を出力する画像出力部(3d)からなる。画像
認識部(5)はテンプレート画像毎に相関演算を行なう
相関演算部(5b)、画像記憶部(5c)からなる。入
力画像(1)、画像データセレクタ(4)、結果出力
(6)、教師信号(7)は図2の実施例とほぼ同様であ
る。
【0028】図5の実施例の作用を説明する。図2と同
様に画像空間変換部(2)は作用する。画像データセレ
クタ(4)により図5は学習時は図6のように、認識時
は図7のように接続される。
【0029】学習時は図6のように画像空間変換部
(2)の出力が画像復元部(3)と画像認識部(5)に
同時に入力される。画像復元部(3)、画像認識部
(5)とも教師信号(7)に従って画像を画像記憶部
(3c)と画像記憶部(5b)に格納される。
【0030】認識時は図7のように画像空間変換部
(2)の出力が画像復元部(3)に入力され、画像復元
部(3)の出力が画像認識部(5)に入力される。その
出力が結果出力(6)となる。図2と同様に認識時は教
師信号(7)は使用されない。画像復元部(3)では、
入力された画像と画像記憶部(3c)の画像の相関演算
を相関演算部(3b)で行い、画像記憶部(3c)の画
像r(i)ごとの相関値c(i)によって画像出力部
(3d)の出力画像poは となる。これによって、画像のノイズを除去し、画像を
復元することができる。画像認識部(5)では画像復元
部(3)の出力画像と画像記憶部(5c)の相関演算を
相関演算部(5b)でおこない、相関値に応じた認識結
果を結果出力(6)とする。
【0031】図5の実施例でも同様に、入力画像にノイ
ズなどの変形成分を多く含んだ画像の認識を行うことが
できる。位置が変化すると認識が複雑となるため図5で
は画像空間変換部(2)で対象の位置を正規化する。画
像復元部(3)によって画像のノイズ成分の大部分を除
去し画像認識部(5)で最適な認識結果を出力すること
ができる。さらに本実施例では代表的な画像と望むべき
出力を与えて学習を行なわせることによって画像復元部
(3)と画像認識部(5)を自動的に対象に応じた最適
な状態に設定することが可能となる。
【0032】
【発明の効果】本発明によれば、入力画像にノイズなど
の変形成分を多く含んだ画像の認識を行うことができ
る。図1で画像空間変換部(2)で対象の位置を正規化
した画像を画像復元部(3)で画像のノイズ成分の大部
分を除去し画像認識部(5)で最適な認識結果を出力す
ることができ、さらに代表的な画像と望むべき出力を与
えて学習を行なわせることによって画像復元部(3)と
画像認識部(5)を自動的に対象に応じた最適な状態に
設定することの可能な画像認識装置が得られる。
【図面の簡単な説明】
【図1】本発明の構成図。
【図2】ニューラルネットワークによる本発明の実施
例。
【図3】図2の画像復元部(3)の詳細部。
【図4】図2の画像認識部(5)の詳細部。
【図5】相関演算による本発明の実施例。
【図6】図5の学習時の作用図。
【図7】図5の認識時の作用図。
【符号の説明】
(1)入力画像,(2)画像空間の変換手段,(3)自
己学習機能を持った画像復元手段,(4)画像データセ
レクタ,(5)自己学習機能を持った画像認識手段,
(6)認識結果出力,(7)教師信号入力。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力画像の座標空間を位置によらない画
    像空間に変換する画像空間変換手段と、該画像空間に変
    換された画像からノイズ及び周囲条件の影響を軽減した
    画像に復元する自己学習可能な画像復元手段と、復元さ
    れた画像から対象の有無・対象の種別・対象の良否等を
    判定する自己学習可能な画像認識手段を設けたことを特
    徴とする画像認識装置。
JP3292587A 1991-11-08 1991-11-08 画像認識装置 Pending JPH05128250A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3292587A JPH05128250A (ja) 1991-11-08 1991-11-08 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3292587A JPH05128250A (ja) 1991-11-08 1991-11-08 画像認識装置

Publications (1)

Publication Number Publication Date
JPH05128250A true JPH05128250A (ja) 1993-05-25

Family

ID=17783708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3292587A Pending JPH05128250A (ja) 1991-11-08 1991-11-08 画像認識装置

Country Status (1)

Country Link
JP (1) JPH05128250A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020031984A1 (ja) * 2018-08-08 2020-02-13 Blue Tag株式会社 部品の検査方法及び検査システム
KR20200039049A (ko) * 2018-10-02 2020-04-16 (주)지엘테크 외관불량 검사방법 및 외관불량 검사 시스템
JP2022521448A (ja) * 2019-02-25 2022-04-08 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 交通画像認識方法、装置、コンピュータデバイスおよび媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020031984A1 (ja) * 2018-08-08 2020-02-13 Blue Tag株式会社 部品の検査方法及び検査システム
JPWO2020031984A1 (ja) * 2018-08-08 2021-08-10 Blue Tag株式会社 部品の検査方法及び検査システム
KR20200039049A (ko) * 2018-10-02 2020-04-16 (주)지엘테크 외관불량 검사방법 및 외관불량 검사 시스템
JP2022521448A (ja) * 2019-02-25 2022-04-08 バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド 交通画像認識方法、装置、コンピュータデバイスおよび媒体

Similar Documents

Publication Publication Date Title
US11645835B2 (en) Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
Bendjillali et al. Illumination-robust face recognition based on deep convolutional neural networks architectures
Ma et al. Facial expression recognition using constructive feedforward neural networks
Hurtik et al. Data preprocessing technique for neural networks based on image represented by a fuzzy function
US7308134B2 (en) Pattern recognition with hierarchical networks
CN106295694B (zh) 一种迭代重约束组稀疏表示分类的人脸识别方法
US6917703B1 (en) Method and apparatus for image analysis of a gabor-wavelet transformed image using a neural network
US7512571B2 (en) Associative memory device and method based on wave propagation
Liu et al. Quaternion locality-constrained coding for color face hallucination
WO2005022343A2 (en) System and methods for incrementally augmenting a classifier
CN111967361A (zh) 一种基于婴儿表情识别与哭声的情绪检测方法
Kersten Statistical limits to image understanding
JPH05128250A (ja) 画像認識装置
Chartier et al. FEBAM: A feature-extracting bidirectional associative memory
Kumar et al. A comprehensive review on the advancement of high-dimensional neural networks in quaternionic domain with relevant applications
Saeedi et al. Fisher classifier and fuzzy logic based multi-focus image fusion
CN113469116A (zh) 一种结合lbp特征和轻量级神经网络的人脸表情识别方法
Chandankhede Soft computing based texture classification with Matlab tool
JPH0458943A (ja) デジタル放射線画像の画像認識装置
Anjum et al. A new approach to face recognition using dual dimension reduction
de Ridder Adaptive methods of image processing
Routray et al. Comparative Study of CNN And QCNN for Image Recognition in Heterogeneous Image Processing
Zidan Face Recognition using Neural Network
Huang et al. Blur Identification of the Degraded Images Based on Convolutional Neural Network
Burman et al. Face Recognition using Wavelet Transform and ANN