JP2000036047A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JP2000036047A
JP2000036047A JP10204809A JP20480998A JP2000036047A JP 2000036047 A JP2000036047 A JP 2000036047A JP 10204809 A JP10204809 A JP 10204809A JP 20480998 A JP20480998 A JP 20480998A JP 2000036047 A JP2000036047 A JP 2000036047A
Authority
JP
Japan
Prior art keywords
layer
cell
image
input
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10204809A
Other languages
English (en)
Inventor
Akihiro Watanabe
章弘 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP10204809A priority Critical patent/JP2000036047A/ja
Publication of JP2000036047A publication Critical patent/JP2000036047A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Length Measuring Devices By Optical Means (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】ネオコグニトロンを利用し、画像中の認識対象
物及び認識対象物の位置を特定する。 【解決手段】画像入力部10は、対象物を撮像しエッジ
抽出を行なって対象物の輪郭画像データを出力する。物
体検出部12は、ネオコグニトロンを用いて、画像入力
部10で得られた輪郭画像データに基づいて対象物を検
出する。位置同定部14は、物体検出部12で用いたネ
オコグニトロンの階層を出力層から入力層方向にバック
トレースすることによって、検出された対象物の輪郭画
像中の位置を同定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像処理装置に係
り、特に、ネオコグニトロンを用いて認識対象物を検出
する画像処理装置に関する。
【0002】
【従来の技術及び発明が解決しようとする課題】特開平
4−24670号公報には、ネオコグニトロンを用いて
入力として与えられた画像中に認識すべき物体が存在す
るか否かを判別する技術が記載されている。
【0003】しかしながら、上記従来の技術では、画像
中に認識すべき物体が存在するか否かは判別できるもの
の、物体が画像中のどの位置に存在するかを特定するこ
とができない、という問題がある。
【0004】本発明は上記問題点を解消するためになさ
れたもので、画像中に認識対象物が存在するか否かだけ
でなく、認識対象物の位置まで特定することができるネ
オコグニトロンを利用した画像処理装置を提供すること
を目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、認識対象物を撮像するための撮像手段
と、画像の部分特徴を抽出するS細胞から構成されたS
層、及び抽出された部分特徴の位置ずれを吸収するC細
胞から構成されたC層で各々構成された複数の階層を備
えたネオコグニトロンを用いて、前記撮像手段で撮像さ
れた画像から認識対象物を検出する認識対象物検出手段
と、前記認識対象物検出手段で用いたネオコグニトロン
の階層をバックトレースすることによって、前記認識対
象物検出手段によって検出された認識対象物の画像中の
位置を同定する位置同定手段と、を含んで構成したもの
である。
【0006】本発明によれば、ネオコグニトロンを用い
て、撮像手段で撮像された画像から認識対象物が検出さ
れる。そして、位置同定手段は、認識対象物の検出に用
いたネオコグニトロンの階層をバックトレースすること
によって、検出された認識対象物の画像中の位置を同定
する。従って、本発明によれば、画像中の認識対象物の
検出と検出された認識対象物の位置の同定との両方を行
なうことができる。
【0007】上記バックトレースは、同じ階層内におい
て、出力があったC細胞から結合可能領域内で出力最大
のS細胞へ投影するS細胞投影処理と、投影されたS細
胞から前階層との入力結合係数に応じて前階層のC細胞
へ投影するC細胞投影処理とを、順次出力層側から入力
層側へ行うことによって実現することができる。ここ
で、投影とは、認識した対象物を構成する部分特徴の存
在を表す値を投影元の細胞に付与し、この値から投影先
の細胞が持つ部分特徴の存在を表す値を決定することで
ある。
【0008】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
【0009】本実施の形態の画像処理装置は、図1に示
すように、カメラ、スキャナ等で構成されると共に、対
象物を撮像してカラーまたはグレイの多階調の画像デー
タを出力する撮像部10Aと、撮像部10Aで得られた
画像データのエッジ抽出を行なって対象物の輪郭画像
(線画像)を生成して輪郭画像データを出力する輪郭画
像生成部10Bとから構成された画像入力部10を備え
ている。
【0010】画像入力部10は、ネオコグニトロンを用
いて、画像入力部10で得られた輪郭画像データに基づ
いて対象物を検出する物体検出部12に接続されてい
る。この物体検出部12は、物体検出部12で用いたネ
オコグニトロンの階層を出力層から入力層方向にバック
トレースすることによって、物体検出部12で検出され
た対象物の輪郭画像中の位置を同定する位置同定部14
に接続されている。
【0011】物体検出部12は、図2に示すように、入
力層20、複数の中間層22、及び出力層24から構成
されると共に、物体の存在を検知するように学習された
階層型の神経回路網であるネオコグニトロンで構成され
ている。この入力層20には、輪郭画像データが入力さ
れ、複数の中間層22では画像の予め記憶された部分特
徴を抽出し、出力層24では形状のカテゴリーに対応す
る細胞から信号が出力される。
【0012】ネオコグニトロンの入力層は1つの細胞面
で構成されているが、中間層及び出力層の各層は、図3
に示すように、部分特徴等の予め定められた画像を抽出
するS細胞を2次元状に配列して構成された細胞面から
なるS層30、及び抽出された画像の位置ずれを吸収す
るC細胞を2次元状に配列して構成された細胞面からな
るC層32で構成されている。
【0013】ネオコグニトロンの中間層の各層には、認
識対象とする対象物の形状のカテゴリーに応じた画像の
部分特徴が、上記の予め定められた画像として記憶され
ている。この部分特徴を3層の中間層を備えたネオコグ
ニトロンによって、カテゴリーが四角形の対象物を検出
する場合を例にとって説明する。図4に示すように、第
1中間層22Aには短い線分(水平方向の線分L1、及
び鉛直方向の線分L2)が部分特徴として記憶され、第
2中間層22Bには短い線分を組み合わせた四角形の4
つのコーナーR1〜R4が部分特徴として記憶されてい
る。また、出力層24には4つのコーナーを組み合わせ
た四角形全体Dが予め定められた画像として記憶されて
いる。すなわち、各中間層には、入力層に近い中間層か
ら出力層に近い中間層に向かって最小単位の部分特徴
(短い線分)の数が徐々に増加した部分特徴が予め記憶
される。
【0014】なお、認識対象とする物体の形状が三角
形、円等の他のカテゴリーの場合についても、上記で説
明したのと同様に、入力層に近い中間層から出力層に近
い中間層に向かって最小単位の部分特徴の数が徐々に増
加した部分特徴が各中間層に記憶される。
【0015】そして、学習パターンを入力層に入力し、
出力層24のC層における入力された学習パターンの形
状と同じカテゴリーの細胞が発火する(出力がある)よ
うに学習することによって、各層間の各細胞の入力結合
係数を決定する。
【0016】次に本実施の形態の作用について説明す
る。撮像部10Aで得られた画像データは輪郭画像生成
部10Bに入力され、輪郭画像生成部10Bによってエ
ッジ抽出が行なわれ、輪郭画像データが生成される。生
成された輪郭画像データは、ネオコグニトロンで構成さ
れた物体検出部12に入力されて認識対象とする物体の
形状が認識される。例えば、物体検出部12に輪郭画像
データとして四角形の図形データを入力すると、図2に
示すように、入力層20の結合可能領域(入力を受け取
る範囲)内の細胞が発火し、中間層22の部分特徴が存
在する位置の細胞が発火し、部分特徴が抽出され、最終
的に出力層24の四角形に対応する細胞が発火する。図
5に、細胞の発火状態を拡大して示した。なお、このと
き、各層のS層によって画像の部分特徴が抽出され、C
層によって抽出された部分特徴の位置ずれが吸収され
る。
【0017】位置同定部14では、後段の層の各細胞か
ら前段に存在する層の結合可能領域内の細胞への投影を
繰り返すことによって、バックトレースを行い、物体の
位置同定を行なう。ここで、投影とは、後段の層の各細
胞に認識した物体を構成する部分特徴の存在を表す値
(以下、B値という)を付与し、このB値から前段の細
胞が持つ部分特徴の存在を表すB値を決定することであ
る。中間層及び出力層の各層は、C層とS層とから構成
されているので、同じ層のC細胞からS細胞へは、図6
(1)に示すように、S層の結合可能領域中で最大の出
力を持つS細胞を選択し、選択したS細胞にC細胞のB
値を付与することによって投影する。また、隣り合う層
間のS細胞からC細胞へは、図6(2)に示すように、
S細胞のB値、及びC細胞からS細胞への入力結合係数
を用い、入力結合係数の大きさに比例したB値をC細胞
に付与することによって投影する。
【0018】そして、物体のカテゴリーを出力した出力
層のC細胞にB値を設定した後、このC細胞から結合可
能領域中での出力最大のS細胞への投影と、このS細胞
から入力結合係数に応じたC細胞への投影とを出力層か
ら入力層へ順次行なうことによって、バックトレースを
行い、物体の位置同定を行なう。
【0019】このバックトレースの処理ルーチンを図7
を参照して詳細に説明する。なお、以下では、ネオコグ
ニトロンの階層数をM、m(m=1〜M)層の細胞面の
数をNm、m層のn番目のC細胞面をCmn、m層のn番
目のS細胞面をSmn、C細胞面Cmnのi,j(i,jは
細胞面の縦方向及び横方向の位置を示す)の位置の細胞
をCmn(i,j) 、S細胞面Smnのi,jの位置の細胞をS
mn(i,j) とする。
【0020】ステップS1では、物体検出部12から物
体検出後のネオコグニトロンの細胞の出力結果を入力す
る。ステップS2では、ネオコグニトロンの全ての細胞
について物体を構成する部分特徴の存在を表すB値を0
に設定する。
【0021】次のステップS3では、出力層のC層の出
力が最大のC細胞CMn(1,1) のB値を所定値(本実施の
形態では1)に設定し、ステップS4でmをMとする。
【0022】次のステップS4ではm≠1かを判断する
ことにより、入力層までの処理が終了したか否かを判断
し、m=1の場合は入力層までB値を設定する処理が終
了しているので、このルーチンを終了する。
【0023】ステップS6、S7では、同じ層のC細胞
からS細胞への投影を行う。すなわち、ステップS6
で、B値が0でない全ての細胞Cmn(i,j) (最初に処理
を行なう出力層では細胞CMn(1,1) )に対し、対象とな
っている層のS層の結合可能領域中で最大の出力を持つ
S細胞Smn(i,j) を検索し、ステップS7で、S細胞S
mn(i,j) のB値にC細胞Cmn(i,j) のB値を設定する。
なお、出力層の場合には、CMn(1,1) のB値がS細胞S
mn(i,j) のB値に設定される。
【0024】次のステップS8では、隣り合う層間のS
細胞からC細胞への投影を行う。すなわち、B値が0で
ない全てのS細胞Smn(i,j) に対し、m−1層の結合可
能領域中の全てのC細胞Cmn(i,j) のB値に入力結合係
数に比例した値を設定する。
【0025】そして、ステップS9でmを1だけデクリ
メントした後、ステップS5に戻って上記の同じ層のC
細胞からS細胞への投影、及び隣り合う層のS細胞から
C細胞への投影を出力層から入力層に向かって順次行
い、入力層への投影が終了した時点でこのルーチンを終
了する。
【0026】このときのバックトレースのトレース経過
を図8を参照して説明する。出力層のC層24Cのカテ
ゴリーを示す細胞のB値が、出力層のS層24Sの結合
可能領域内の出力最大の細胞のB値として設定される。
出力層のS層24Sの結合可能領域内の出力最大の細胞
のB値に基づいて、第2中間層と出力層との入力結合係
数に比例したB値が第2中間層のC層22BCの発火し
た細胞に設定される。第2中間層のC層22BCの発火
した細胞のB値が、第2中間層のS層22BSの結合可
能領域内の出力最大の細胞のB値として設定される。第
2中間層のS層22BSの結合可能領域内の出力最大の
細胞のB値に基づいて、第1中間層と第2中間層との入
力結合係数に比例したB値が第1中間層のC層22AC
の発火した細胞に設定される。第1中間層のC層22A
Cの発火した細胞のB値が、第1中間層のS層22AS
の結合可能領域内の出力最大の細胞のB値として設定さ
れる。そして、第1中間層のS層22ASの結合可能領
域内の出力最大の細胞のB値に基づいて、入力層と第1
中間層との入力結合係数に比例したB値が入力層の発火
した細胞に設定される。
【0027】この結果、カテゴリーに対応する最終段の
C細胞に対応する入力層の細胞にB値が設定され、B値
が設定された細胞の位置から物体の位置を同定すること
ができる。位置同定部14は、物体検出部12で検出さ
れた物体の形状と同定した物体の位置とを示すデータを
出力する。
【0028】次に図9を参照して複数の物体を認識する
画像処理装置の実施の形態について説明する。本実施の
形態の画像処理装置は、N個の物体検出部121 〜12
N と、N個の位置同定部141 〜14N とを並列に設け
たものである。物体検出部及び位置同定部は上記で説明
した物体検出部及び位置同定部と同様の構成であり、位
置同定部141 〜14N-1 の各々は、輪郭画像データと
検出された物体のデータとの差分を演算する演算回路1
1 〜16N-1 に接続されている。演算回路161
は、輪郭画像生成部10Bからの輪郭画像データが入力
されように接続され、演算回路161 〜16N-1 の各々
は直列に接続され、輪郭画像データと検出された物体の
データとの差分から検出された物体のデータが順次減算
されるように接続されている。
【0029】演算回路161 は、位置同定部141 から
入力された同定した物体の形状及び位置を示すデータに
基づいて、入力された輪郭画像データから位置同定部1
1から入力された物体の形状を示すデータを減算して
出力する。この減算データは、物体検出部122 に入力
され、物体検出部122 及び位置同定部142 によって
他の物体の認識が行なわれ、以下同様にして認識した物
体のデータを順次減算したデータに基づいて物体の認識
が行なわれる。
【0030】これによって、本実施の形態では、複数の
物体を効率よく認識することができる。
【0031】
【発明の効果】以上説明したように、本発明によれば、
ネオコグニトロンを利用して、画像中の認識対象物を検
出することができるだけでなく、認識対象物の位置まで
特定することができる画像処理装置を提供することがで
きる、という効果が得られる。
【図面の簡単な説明】
【図1】本発明の画像処理装置の実施の形態を示すブロ
ック図である。
【図2】ネオコグニトロンの詳細を示す概略図である。
【図3】ネオコグニトロンの各層の詳細を示す概略図で
ある。
【図4】各層の部分特徴を示す概略図ある。
【図5】各層間の結合を拡大して示す概略図である。
【図6】(1)はC細胞からS細胞への投影を説明する
ための説明図、(2)はS細胞からC細胞への投影を説
明するための説明図である。
【図7】本発明の実施の形態のバックトレースの処理ル
ーチンを示す流れ図である。
【図8】本発明の実施の形態のバックトレースのトレー
ス経過を示す説明図である。
【図9】本発明を複数の物体の認識に適用した他の実施
の形態を示すブロック図である。
【符号の説明】
10 画像入力部 12 物体検出部 14 位置同定部
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 2F065 AA03 AA12 DD03 FF01 FF04 JJ03 JJ26 QQ00 QQ08 QQ24 QQ29 QQ32 5B057 AA10 BA02 CA01 CC01 CE20 DA07 DA11 DB02 DB06 DC38 5L096 AA02 BA06 BA13 CA02 DA01 EA45 FA76

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】認識対象物を撮像するための撮像手段と、 画像の部分特徴を抽出するS細胞から構成されたS層、
    及び抽出された部分特徴の位置ずれを吸収するC細胞か
    ら構成されたC層で各々構成された複数の階層を備えた
    ネオコグニトロンを用いて、前記撮像手段で撮像された
    画像から認識対象物を検出する認識対象物検出手段と、 前記認識対象物検出手段で用いたネオコグニトロンの階
    層をバックトレースすることによって、前記認識対象物
    検出手段によって検出された認識対象物の画像中の位置
    を同定する位置同定手段と、 を含む画像処理装置。
  2. 【請求項2】同じ階層内において、出力があったC細胞
    から結合可能領域内で出力最大のS細胞へ投影するS細
    胞投影処理と、前記投影されたS細胞から前階層との入
    力結合係数に応じて前階層のC細胞へ投影するC細胞投
    影処理とを、順次出力層側から入力層側へ行ってバック
    トレースする請求項1記載の画像処理装置。
JP10204809A 1998-07-21 1998-07-21 画像処理装置 Pending JP2000036047A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10204809A JP2000036047A (ja) 1998-07-21 1998-07-21 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10204809A JP2000036047A (ja) 1998-07-21 1998-07-21 画像処理装置

Publications (1)

Publication Number Publication Date
JP2000036047A true JP2000036047A (ja) 2000-02-02

Family

ID=16496736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10204809A Pending JP2000036047A (ja) 1998-07-21 1998-07-21 画像処理装置

Country Status (1)

Country Link
JP (1) JP2000036047A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075311A2 (en) * 2008-12-26 2010-07-01 Five Apes, Inc. Multi-stage image pattern recognizer
US8229209B2 (en) 2008-12-26 2012-07-24 Five Apes, Inc. Neural network based pattern recognizer
US8290250B2 (en) 2008-12-26 2012-10-16 Five Apes, Inc. Method and apparatus for creating a pattern recognizer
JP2016115248A (ja) * 2014-12-17 2016-06-23 株式会社デンソー 演算処理装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075311A2 (en) * 2008-12-26 2010-07-01 Five Apes, Inc. Multi-stage image pattern recognizer
WO2010075311A3 (en) * 2008-12-26 2010-10-28 Five Apes, Inc. Multi-stage image pattern recognizer
US8160354B2 (en) 2008-12-26 2012-04-17 Five Apes, Inc. Multi-stage image pattern recognizer
US8229209B2 (en) 2008-12-26 2012-07-24 Five Apes, Inc. Neural network based pattern recognizer
US8290250B2 (en) 2008-12-26 2012-10-16 Five Apes, Inc. Method and apparatus for creating a pattern recognizer
JP2016115248A (ja) * 2014-12-17 2016-06-23 株式会社デンソー 演算処理装置

Similar Documents

Publication Publication Date Title
CN102197412B (zh) 伪装检测系统和伪装检测方法
JP6197340B2 (ja) 画像処理装置、画像処理方法、およびプログラム
CN113688820A (zh) 频闪条带信息识别方法、装置和电子设备
JPH06231252A (ja) 監視画像の移動物体追跡方法
CN108572734A (zh) 一种基于红外激光辅助成像的手势控制系统
WO2022111461A1 (zh) 识别方法、装置及电子设备
CN113567550A (zh) 地面材质检测方法、装置、电子设备、芯片和存储介质
JP2000036047A (ja) 画像処理装置
JPH11312243A (ja) 顔領域検出装置
CN114708582B (zh) 基于ai和rpa的电力数据智慧稽查方法及装置
CN110516094A (zh) 门类兴趣点数据的去重方法、装置、电子设备及存储介质
JP2007140729A (ja) 物品の位置及び姿勢を検出する方法および装置
JP3371614B2 (ja) 認識装置
JP2000207554A (ja) 画像処理装置
JP2003203218A (ja) 外観検査装置および方法
WO2023191312A1 (ko) 전자 기기의 외관 상태 평가 및 가치 평가 방법과 전자 기기 가치 평가 장치
JP2000193420A (ja) 眼の位置検出装置
JPH05108800A (ja) 画像欠陥判別処理装置
JP7349288B2 (ja) 対象物認識装置、対象物認識方法、及び対象物認識プログラム
JP3074691B2 (ja) 文字認識装置
WO2021049119A1 (ja) 学習装置、学習方法及び学習プログラムが格納された非一時的なコンピュータ可読媒体
JP2000285237A (ja) 画像処理装置、画像処理方法及び画像処理プログラムを記録した記録媒体
JPH0991425A (ja) 画像処理装置
JPH0844844A (ja) 物体検出装置
JPH09245166A (ja) パターンマッチング装置