JPH06176159A - カラー画像対応型物体認識装置 - Google Patents

カラー画像対応型物体認識装置

Info

Publication number
JPH06176159A
JPH06176159A JP4330438A JP33043892A JPH06176159A JP H06176159 A JPH06176159 A JP H06176159A JP 4330438 A JP4330438 A JP 4330438A JP 33043892 A JP33043892 A JP 33043892A JP H06176159 A JPH06176159 A JP H06176159A
Authority
JP
Japan
Prior art keywords
model
neocognitron
image data
data
back propagation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4330438A
Other languages
English (en)
Inventor
Ryuichi Iimori
竜一 飯守
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4330438A priority Critical patent/JPH06176159A/ja
Publication of JPH06176159A publication Critical patent/JPH06176159A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 学習結果の収束性が良く、かつ汎化能力が高
く、カラー画像から物体を認識することができる物体認
識装置を提供する。 【構成】 撮像データをR、G、及びB成分に分割する
デコーダ11と、各成分ごとにデータを2値化する2値
化処理部12と、それぞれの成分毎に特徴抽出及び位置
ずれ補正を行うネオコグニトロンモデル13と、物体認
識を行うバックプロパゲーションモデル14と、ネオコ
グニトロンモデル13の出力に基づいて2値か処理部で
使用するしきい値を制御するバックプロパゲーションモ
デル15とを有している。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は物体認識装置に関し、特
にニューラルネットワークを用いてカラー画像データか
ら物体を認識する物体認識装置に関する。
【0002】
【従来の技術】一般に、画像認識装置として基本パター
ンと入力パターンを比較し、予め定められた基準のもと
で類似していれば、所定の出力パターンを出力するパタ
ーンマッチング法が知られている。ところが、この方法
では、撮像データ(入力パターン)に含まれるノイズ、
被撮像物体の位置及び大きさ等が認識結果に大きな影響
を与える。また、基準パターンとまったく異なるデータ
に対しては出力が得られない(汎化能力がない)。そこ
で、ニューラルネットワークを用いて撮像データから物
体を認識する技術の研究が(特に軍用目的等において)
進められている。
【0003】従来、この種の物体認識装置として、バッ
クプロパゲーションモデルやネオコグニトロンモデルを
利用したものが知られている。
【0004】バックプロパゲーションモデルは、入力層
と出力層との間に、少なくとも1層の中間層を有するニ
ューラルネットワークである。このバックプロパゲーシ
ョンモデルでは、特定の入力パターンに対して望ましい
出力パターンが得られるように層間の結合の強さを変更
して学習を行っている。従って、学習結果の収束性が良
く、また、汎化能力が高いという特徴を有している。ま
た、出力パターンを使用者が決定できるので信号処理な
どにも使用することができる。
【0005】また、ネオコグニトロンモデルは、人の視
覚神経系の構造からヒント得て作成されたアルゴリズム
を実現した神経回路モデルである。このネオコグニトロ
ンモデルは、複数の段で構成されており、各段間の結合
は、入力されるパターンによって次第に強化され、基本
パターンを繰り返し入力すると、特定の出力パターンが
得られるようになる。ネオコグニトロンは、特徴抽出に
優れ、パターンの位置、大きさ、形状の変化、及び雑音
の影響を受けにくいという特徴を有している。
【0006】
【発明が解決しようとする課題】従来のバックプロパゲ
ーションモデル及びネオコグニトロンモデルは、白黒ま
たは2値画像については、入力される撮像データが、カ
ラー画像の認識ができないという問題点がある。また、
これらバックプロパゲーションモデル及びネオコグニト
ロンモデルはそれぞれ次のような問題点がある。
【0007】バックプロパゲーションモデルは、学習結
果の収束性が良く、汎化能力が高い反面、パターンに位
置ずれが生じた場合、正確に認識できないという問題点
がある。
【0008】また、ネオコグニトロンモデルは、位置ず
れや変形に影響されず正確にそのパターンを認識するこ
とができる反面、汎化能力に欠け、パターンによって、
学習結果が収束しにくという問題点がある。
【0009】本発明は、学習結果の収束性が良く、かつ
汎化能力が高く、カラー画像から物体を認識することが
できる物体認識装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明によれば、認識対
象物体を撮像して得られたカラー撮像データをR
(赤)、G(緑)、及びB(青)の3成分に分離し、そ
れぞれ2値化を行ってR画像データ、G画像データ、及
びB画像データを出力する2値化手段と、前記R画像デ
ータ、前記G画像データ、及び前記B画像データをそれ
ぞれ入力とし、特徴抽出及び位置ずれ補正を行う3つの
ネオコグニトロンモデルと、該3つのネオコグニトロン
モデルの出力を入力とし前記認識対象物体を認識するバ
ックプロパゲーションモデルとを備えたことを特徴とす
るカラー画像対応型物体認識装置が得られる。
【0011】
【実施例】以下に図面を参照して本発明の実施例を説明
する。図1に本発明の一実施例を示す。本実施例の物体
認識装置は、撮像データをR(赤)、G(緑)、及びB
(青)の3成分に分離するデコーダ11と、R、G、及
びB成分をそれぞれ2値化してR、G、及びB画像デー
タを出力する2値化処理部12と、R、G、及びB画像
データをそれぞれ入力とするネオコグニトロンモデル1
3と、物体を認識するバックプロパゲーションモデル1
4と、2値化処理部のしきい値を制御するバックプロパ
ゲーションモデル15とを有している。
【0012】図2に、ネオコグニトロンモデル13とバ
ックプロパゲーションモデル14の詳細を示す。ネオコ
グニトロンモデル13は、入力段21〜出力段22まで
の複数の段で構成されている。各段はそれぞれ特徴抽出
層aと位置ずれ補正層bとを有している。また、特徴抽
出層a及び位置ずれ補正層bは、抽出する特徴の種類に
応じて複数の面を有している。入力段21の特徴抽出層
aを構成するユニット(ニューロンに相当)は、1ユニ
ットで、所定の領域(図の長円)をカバーする。また、
位置ずれ補正層bの各ユニットは、特徴抽出層aの複数
のユニットに接続されている。以降、出力段22まで、
各ユニットは前段或いは前層の複数のユニットに接続さ
れている。もちろん、接続の強さは、面によって異なっ
ている。そして、出力段22の補正層bは、複数の領域
(図では3×3個)に分割され、その代表として選択さ
れたユニットの出力が、バックプロパゲーションモデル
14に入力される。
【0013】なお、ネオコグニトロンモデル13の段数
は、原理的には何段であってもよい。即ち、認識しよう
とする物体の複雑度、認識精度、及び認識速度などを検
討して適宜決められる。
【0014】バックプロパゲーションモデル15は、入
力層23、中間層24、及び出力層25を有している。
このバックプロパゲーションモデルでは、ネオコグニト
ロンモデル13からの出力信号はR、G、及びBの区別
なく入力される。入力層23、中間層24、及び出力層
25の各層は、それぞれ複数のユニットで構成されてお
り、各層間において接続されている。
【0015】なお、バックプロパゲーションモデル15
の中間層24は、1層ではなく、さらに多くの中間層を
設けてもよい。ただし、中間層の数が多いほど認識精度
が向上するというものではないので、認識しようとする
物体に応じて適宜選択される。
【0016】以下、図1及び図2を参照して本実施例の
物体認識装置の動作を説明する。デコーダ11は、入力
された撮像データをR、G、及びBの3成分に分離し、
R撮像データ、G撮像データ、及びB撮像データを出力
する。2値化処理部12は、R、G、及びBの3成分に
それぞれ対応する3つのしきい値を有しており、入力さ
れたR撮像データ、G撮像データ、及びB撮像データを
それぞれ2値化してR画像データ、G画像データ、及び
B画像データを使用したしきい値と共に出力する。な
お、3つのしきい値は、後述のように独立制御される。
【0017】ネオコグニトロンモデル13及びバックプ
ロパゲーションモデル14は、予め学習を済ませてあ
る。ネオコグニトロンモデル13は、R画像データ、G
画像データ、及びB画像データについてそれぞれ特徴抽
出と位置ずれ補正を各段毎に繰り返す。そして、出力段
22では、しきい値を参照して出力信号を出力する。
【0018】ネオコグニトロンモデル13からの出力信
号としきい値とが入力されたバックプロパゲーションモ
デル14は、学習結果に従った処理を行って、認識結果
を出力する。
【0019】また、ネオコグニトロンモデル13からの
出力信号としきい値は、バックプロパゲーションモデル
15にも入力される。このバックプロパゲーションモデ
ル15は、先に述べたバックプロパゲーションモデル1
4とは、異なる学習を終えている。つまり、このバック
プロパゲーションモデル15は、入力信号に対して望ま
しいしきい値を出力するように学習させてある。従っ
て、このバックプロパゲーションモデル15は、ネオコ
グニトロンモデル13からの出力信号としきい値とに基
づいて新たなしきい値を求めて、2値化処理部12へ出
力(フィードバック)する。2値化処理部12は入力さ
れた新たなしきい値に従って、以後2値化処理を行う。
【0020】
【発明の効果】本発明によれば、カラー撮像データを
R、G、及びB成分に分割し、各成分をそれぞれネオコ
グニトロンモデルに入力し、その出力をバックプロパゲ
ーションモデルに入力して撮像された物体を認識するよ
うにしたことで、学習の収束性が良く、かつ汎化能力の
高い、カラー画像を精度良く認識することができる物体
認識装置が得られる。
【0021】また、2値化に使用する各しきい値をネオ
コグニトロンモデル及びバックプロパゲーションモデル
の少なくとも一方に供給するようにしたことでカラー画
像の持つ情報量をそのまま認識結果に反映することがで
きる。
【0022】さらに、各しきい値をネオコグニトロンモ
デルの出力に基づいて独立制御するようにしたので、精
度の良い認識結果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】図1のネオコグニトロンモデル及びバックプロ
パゲーションモデルを説明するための図である。
【符号の説明】
11 デコーダ 12 2値化処理部 13 ネオコグニトロンモデル 14 バックプロパゲーションモデル 15 バックプロパゲーションモデル 21 入力段 22 出力段 23 入力層 24 中間層 25 出力層

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 認識対象物体を撮像して得られたカラー
    撮像データをR(赤)、G(緑)、及びB(青)の3成
    分に分離し、それぞれ2値化を行ってR画像データ、G
    画像データ、及びB画像データを出力する2値化手段
    と、前記R画像データ、前記G画像データ、及び前記B
    画像データをそれぞれ入力とし、特徴抽出及び位置ずれ
    補正を行う3つのネオコグニトロンモデルと、該3つの
    ネオコグニトロンモデルの出力を入力とし前記認識対象
    物体を認識するバックプロパゲーションモデルとを備え
    たことを特徴とするカラー画像対応型物体認識装置。
  2. 【請求項2】 前記2値化手段が前記撮像データのR、
    G、及びB成分をそれぞれ2値化する際に使用する3つ
    のしきい値を前記ネオコグニトロンモデル及び前記バッ
    クプロパゲーションモデルの少なくとも一方に供給し、
    該しきい値に基づいて前記認識対象物体を認識するよう
    にしたことを特徴とする請求項1のカラー画像対応型物
    体認識装置。
  3. 【請求項3】 前記3つのネオコグニトロンモデルの出
    力と前記2値化手段が前記撮像データのR、G、及びB
    成分をそれぞれ2値化する際に使用する3つのしきい値
    とをそれぞれ入力とし、該3つのしきい値を独立制御す
    る前記バックプロパゲーションモデルとは異なる3つの
    バックプロパゲーションモデルを備えたことを特徴とす
    る請求項1のカラー画像対応型物体認識装置。
JP4330438A 1992-12-10 1992-12-10 カラー画像対応型物体認識装置 Pending JPH06176159A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4330438A JPH06176159A (ja) 1992-12-10 1992-12-10 カラー画像対応型物体認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4330438A JPH06176159A (ja) 1992-12-10 1992-12-10 カラー画像対応型物体認識装置

Publications (1)

Publication Number Publication Date
JPH06176159A true JPH06176159A (ja) 1994-06-24

Family

ID=18232620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4330438A Pending JPH06176159A (ja) 1992-12-10 1992-12-10 カラー画像対応型物体認識装置

Country Status (1)

Country Link
JP (1) JPH06176159A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08190623A (ja) * 1995-01-10 1996-07-23 Mitsubishi Agricult Mach Co Ltd 農作物の画像処理測定法
WO2008087316A2 (fr) * 2006-12-22 2008-07-24 France Telecom Procede et systeme de binarisation d'une image comprenant un texte

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239684A (ja) * 1988-03-19 1989-09-25 Fujitsu Ltd パターン認識装置
JPH02242405A (ja) * 1989-03-16 1990-09-26 Yanmar Agricult Equip Co Ltd カラー情報による境界線の検出方法
JPH03225482A (ja) * 1990-01-31 1991-10-04 Univ Nagoya 目標物体の位置と大きさを表現するニューラルネットワーク
JPH04250578A (ja) * 1990-07-31 1992-09-07 Siemens Ag 二次元または三次元像の視覚的検査方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239684A (ja) * 1988-03-19 1989-09-25 Fujitsu Ltd パターン認識装置
JPH02242405A (ja) * 1989-03-16 1990-09-26 Yanmar Agricult Equip Co Ltd カラー情報による境界線の検出方法
JPH03225482A (ja) * 1990-01-31 1991-10-04 Univ Nagoya 目標物体の位置と大きさを表現するニューラルネットワーク
JPH04250578A (ja) * 1990-07-31 1992-09-07 Siemens Ag 二次元または三次元像の視覚的検査方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08190623A (ja) * 1995-01-10 1996-07-23 Mitsubishi Agricult Mach Co Ltd 農作物の画像処理測定法
WO2008087316A2 (fr) * 2006-12-22 2008-07-24 France Telecom Procede et systeme de binarisation d'une image comprenant un texte
WO2008087316A3 (fr) * 2006-12-22 2008-10-02 France Telecom Procede et systeme de binarisation d'une image comprenant un texte

Similar Documents

Publication Publication Date Title
CN111091824B (zh) 一种语音匹配方法及相关设备
CN109598268B (zh) 一种基于单流深度网络的rgb-d显著目标检测方法
CN104268583B (zh) 基于颜色区域特征的行人重识别方法及系统
CN108596197A (zh) 一种印章匹配方法及装置
JP7490359B2 (ja) 情報処理装置、情報処理方法及びプログラム
CN115699082A (zh) 缺陷检测方法及装置、存储介质及电子设备
JP2010160793A (ja) 赤目を検出する方法、赤目検出システム、赤目検出装置、コンピューター読み取り可能な媒体および画像処理装置
CN110032932B (zh) 一种基于视频处理和决策树设定阈值的人体姿态识别方法
CN110046544A (zh) 基于卷积神经网络的数字手势识别方法
CN112149500A (zh) 一种部分遮挡的人脸识别小样本学习方法
CN107909020A (zh) 一种基于滤波器设计的光流向量微表情发生阶段检测方法
CN110287990A (zh) 微型藻类图像分类方法、系统、设备及存储介质
CN106407906A (zh) 人脸面部识别方法
JPH06176159A (ja) カラー画像対応型物体認識装置
Aziz et al. Evaluation of visual attention models for robots
CN113420582A (zh) 用于掌静脉识别的防伪检测方法及其系统
JPH08221567A (ja) 色領域分離方法
JPH05101187A (ja) 画像認識装置及びその学習方法
CN113837236A (zh) 图像中目标对象的识别方法、装置、终端设备及存储介质
Cai et al. Multi-view joint learning network for pedestrian gender classification
CN112270220A (zh) 一种基于深度学习的缝纫手势识别方法
JPH06231257A (ja) 学習データ生成装置
JP3264121B2 (ja) 対象認識方法
JPH0478972A (ja) 濃淡画像識別装置
JPH04250578A (ja) 二次元または三次元像の視覚的検査方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19950523