JP2001101405A - 画像認識方法及び画像認識装置 - Google Patents

画像認識方法及び画像認識装置

Info

Publication number
JP2001101405A
JP2001101405A JP27870899A JP27870899A JP2001101405A JP 2001101405 A JP2001101405 A JP 2001101405A JP 27870899 A JP27870899 A JP 27870899A JP 27870899 A JP27870899 A JP 27870899A JP 2001101405 A JP2001101405 A JP 2001101405A
Authority
JP
Japan
Prior art keywords
learning
image
input
local
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP27870899A
Other languages
English (en)
Other versions
JP3680658B2 (ja
Inventor
Megumi Yamaoka
めぐみ 山岡
Kenji Nagao
健司 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP27870899A priority Critical patent/JP3680658B2/ja
Priority to EP00121115A priority patent/EP1089214A3/en
Priority to US09/676,680 priority patent/US6999623B1/en
Publication of JP2001101405A publication Critical patent/JP2001101405A/ja
Priority to US10/677,866 priority patent/US7054489B2/en
Application granted granted Critical
Publication of JP3680658B2 publication Critical patent/JP3680658B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Length Measuring Devices By Optical Means (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 学習画像を用いて入力画像中の物体を認識す
る際、入力画像中の各局所領域が異なる類似した学習画
像の各局所領域と一致する場合にも、正しく物体を認識
することを目的とする。 【解決手段】 画像入力手段1から入力した画像を局所
領域に分割する画像分割手段2と、各入力局所領域に対
して学習画像データベースから類似する局所領域を抽出
する類似ウィンドウ抽出手段3と、入力局所領域の入力
画像における座標と対応する学習局所領域の学習画像に
おける座標から入力画像中の物体の位置を推定する対象
位置推定手段5と、各入力局所領域と対応する学習局所
領域から推定した位置が一致するものの数を集計する集
計手段6と、集計値がある一定値より大きくなるときに
対象が存在すると判断する対象決定手段7を備えること
により、入力画像中の物体とその位置を高精度に推定す
ることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力画像が、予め
作成済の学習画像データベース中のどの画像と近いかを
判定することにより、入力画像上に表示されている物体
が何であるかを認識する画像認識方法及び画像認識装置
並びに画像認識プログラムを記録した記録媒体に関する
ものである。
【0002】
【従来の技術】従来の画像認識装置は、特開平9−21
610号公報に記載されたものが知られている。
【0003】図16は、従来の画像認識装置のブロック
構成図を示しており、画像を入力する画像入力手段11
と、抽出対象物の局所モデルを予め格納しているモデル
記憶手段12と、入力画像の各手段分画像について各局
所モデルとのマッチングを行うマッチング処理手段13
と、入力画像の各手段分画像がどの程度局所モデルに一
致しているかによって画像の位置情報も含めたパラメー
タ空間で抽出対象物の位置を確率的に表示し統合する局
所情報統合手段14と、パラメータ空間内で最も確立の
高い手段分を抽出して入力画像内での抽出対象物の位置
を判別して出力する物体位置決定手段15から構成され
ている。
【0004】
【発明が解決しようとする課題】このような従来の画像
認識装置は、異なるモデル間で類似した局所モデルが多
くなればなるほど認識が困難になるという課題を有して
いた。
【0005】本発明は、上記従来の課題を解決するもの
で、異なるモデル間で類似した局所モデルが多数ある場
合にも入力画像中の対象を検出し、その位置と対象物体
の種類を高精度に推定することを目的とする。
【0006】
【課題を解決するための手段】この課題を解決するため
に本発明は、画像を入力する画像入力手段と、前記画像
入力手段から入力した画像をウィンドウに分割する画像
分割手段と、前記画像分割手段で分割したそれぞれの入
力ウィンドウに対して類似した学習ウィンドウを抽出す
る類似ウィンドウ抽出手段と、前記類似ウィンドウ抽出
手段から入力した入力ウィンドウと学習ウィンドウそれ
ぞれの座標から対象の入力画像中の位置を算出する対象
位置推定手段と、前記対象位置推定手段で算出した座標
の一致するものの数を集計する集計手段を備えたもので
ある。
【0007】これにより、本発明は、入力ウィンドウと
類似する学習ウィンドウを抽出し、学習ウィンドウの学
習画像上の座標と、対応する入力ウィンドウの入力画像
上の座標から、学習画像中のモデルの入力画像における
位置を推定し、ウィンドウごとに算出した位置が一致す
るものの数を集計することにより、集計値が一定値以上
になった場合に入力画像中に学習画像で表された種類の
物体が存在すると決定でき、更に、その位置を高精度に
推定することができる。
【0008】
【発明の実施の形態】本発明の請求項1に記載の発明
は、入力した画像を局所領域に分割し、各入力局所領域
に対して予め学習画像を登録した学習画像データベース
から類似する学習局所領域を抽出して入力局所領域と対
応づけ、前記各入力局所領域の座標と対応する学習局所
領域の座標から入力画像中の対象物体の位置を推定し
て、前記推定位置が一致する入力局所領域・学習局所領
域の数の集計値を求め、前記集計値が一定値以上である
場合に対象があると判断するもので、入力画像中に物体
が存在するとき、物体の一部を含む各入力局所領域と対
応する各学習局所領域の座標から算出した入力画像中の
物体の各推定位置が、それぞれ一致することを利用し
て、入力画像中の物体とその位置を高精度に推定するこ
とができるという作用を有する。
【0009】請求項2に記載の発明は、入力した画像を
局所領域に分割し、各入力局所領域に対して、予め類似
した学習画像をグループ化しその各グループの代表学習
局所領域とそのグループの全ての学習局所領域の座標を
登録した同種ウィンドウ情報データベースから類似する
代表学習局所領域を抽出して、入力局所領域と抽出され
たグループの学習局所領域とを対応づけ、前記各入力局
所領域の座標と対応づけされた学習局所領域の座標から
入力画像中の対象物体の位置を推定して、前記推定位置
が一致する入力局所領域と学習局所領域の数の集計値を
求め、前記集計値が一定値以上である場合に対象がある
と判断するもので、類似した各グループの代表の学習局
所領域と各入力局所領域とを画素値で対応づけることに
より、学習局所領域中に類似ウィンドウが多数ある場合
にも、対応づけが早くでき、入力画像中の物体とその位
置を高精度に推定するという作用を有する。
【0010】請求項3に記載の発明は、請求項1記載の
画像認識方法において、各入力局所領域に対して予め学
習画像を種類ごとに登録した学習画像データベースから
種類ごとに類似する学習局所領域をそれぞれ抽出して入
力局所領域と対応づけ、前記各入力局所領域の座標と対
応する学習局所領域の座標から入力画像中の対象物体の
位置を推定して、前記推定位置が一致する入力局所領域
と学習局所領域の数の集計値を種類ごと求めるもので、
同規格で同種の複数の学習画像によって認識すべき一つ
の対象のモデルを構成することで、各入力局所領域に対
応する各学習局所領域が、それぞれ、同規格・同種の異
なる学習画像に属するものであっても、そこから推定す
る入力画像中の物体の位置が等しくなり、物体とその位
置を高精度で推定することができるという作用を有す
る。
【0011】請求項4に記載の発明は、請求項2記載の
画像認識方法において、同種ウィンドウ情報データベー
スは、学習画像データベースから予め類似した学習局所
領域を抽出し、各グループの中からその代表の学習局所
領域の画像データとそのグループの全ての学習局所領域
の座標およびその種別を登録するもので、学習局所領域
と入力局所領域との対応づけする際に代表の学習局所領
域とのみ画素値と演算するために効率の良い対応付けが
できるという作用を有する。
【0012】請求項5に記載の発明は、請求項1乃至4
のいずれかに記載の画像認識方法において、入力局所領
域と学習局所領域または代表学習局所領域との対応づけ
は、各画素値の差の二乗の和または各画素値の差の絶対
値の累積値を算出して、最も差の小さいものを抽出する
もので、入力局所領域と学習局所領域との対応付けが高
精度にできるという作用を有する。
【0013】請求項6に記載の発明は、入力した画像を
局所領域に分割する画像分割手段と、予め学習画像を学
習画像データベースに登録しておく学習手段と、各入力
局所領域に対して前記学習データベースから類似する学
習局所領域を抽出して入力局所領域と対応づける類似ウ
ィンドウ抽出手段と、前記各入力局所領域についてその
座標と対応する学習局所領域の座標から入力画像中の対
象物体の位置を推定する対象位置推定手段と、前記推定
位置が一致する入力局所領域と学習局所領域の数を集計
する集計手段と、前記集計値が一定値以上である場合に
対象があると判断する対象判定手段とを備えるもので、
入力画像中に物体が存在するとき、物体の一部を含む各
入力局所領域と対応する各学習局所領域の座標から算出
した入力画像中の物体の各推定位置が、それぞれ一致す
ることを利用して、入力画像中の物体とその位置を高精
度に推定するという作用を有する。
【0014】請求項7に記載の発明は、入力した画像を
局所領域に分割する画像分割手段と、予め類似した学習
画像をグループ化しその各グループの代表学習局所領域
とそのグループの全ての学習局所領域の座標を同種ウィ
ンドウ情報データベースに登録する学習手段と、各入力
局所領域に対して前記同種ウィンドウ情報データベース
から類似する代表学習局所領域を抽出して入力局所領域
と抽出されたグループの学習局所領域とを対応づける類
似ウィンドウ抽出手段と、前記各入力局所領域の座標と
対応づけられた学習局所領域の座標から入力画像中の対
象物体の位置を推定する対象位置推定手段と、前記推定
位置が一致する入力局所領域と学習局所領域の数の集計
値を求める集計手段と、前記集計値が一定値以上である
場合に対象があると判断する対象判定手段とを備えるも
ので、類似した各グループの代表の学習局所領域と各入
力局所領域とを画素値で対応づけることにより、学習局
所領域中に類似ウィンドウが多数ある場合にも、対応づ
けが早くでき、入力画像中の物体とその位置を高精度に
推定するという作用を有する。
【0015】請求項8に記載の発明は、入力した画像を
局所領域に分割する画像分割手段と、予め学習画像を種
類ごとに学習画像データベースに登録する学習手段と、
各入力局所領域に対して前記学習画像データベースから
種類ごとに類似する学習局所領域をそれぞれ抽出して入
力局所領域と対応づる類似ウィンドウ抽出手段と、前記
各入力局所領域の座標と対応する学習局所領域の座標か
ら入力画像中の対象物体の位置を推定する対象位置推定
手段と、前記推定位置が一致する入力局所領域と学習局
所領域の数の集計値を種類ごと求める求める集計手段
と、前記集計値が一定値以上である場合に対象があると
判断する対象判定手段とを備えるもので、同規格で同種
の複数の学習画像によって認識すべき一つの対象のモデ
ルを構成することで、各入力局所領域に対応する各学習
局所領域が、それぞれ、同規格・同種の異なる学習画像
に属するものであっても、そこから推定する入力画像中
の物体の位置が等しくなり、物体とその位置を高精度で
推定することができるという作用を有する。
【0016】請求項9に記載の発明は、請求項7記載の
画像認識装置において、学習手段は、学習画像データベ
ースから類似した学習局所領域をグループ化し、その各
グループの代表学習局所領域の画像データとそのグルー
プの全ての学習局所領域の座標を出力する類似ウィンド
ウ統合手段と、前記類似ウィンドウ統合手段から各グル
ープの代表学習局所領域の画像データとそのグループの
全ての学習局所領域の座標およびその種別を格納してい
る同種ウィンドウ情報データベースを有するもので、学
習局所領域と入力局所領域との対応づけする際に代表の
学習局所領域とのみ画素値と演算するために効率の良い
対応付けができるという作用を有する。
【0017】請求項10に記載の発明は、コンピュータ
により画像認識を行うプログラムであって、入力した画
像を局所領域に分割し、各入力局所領域に対して予め学
習画像を登録した学習画像データベースから類似する局
所領域を抽出して入力局所領域と対応付け、前記各入力
局所領域についてその座標と対応する学習局所領域の座
標から入力画像中の対象物体の位置を推定して、前記推
定位置が一致する前記入力局所領域・学習局所領域の数
の集計値を求め、前記集計値が一定の値以上である場合
に対象があると判断する画像認識プログラムを記録した
記録媒体から、コンピュータに読み込み実行することに
より、入力画像中に物体が存在するとき、物体の一部を
含む各入力局所領域と対応する各学習局所領域の座標か
ら算出した入力画像中の物体の各推定位置が、それぞれ
一致することを利用して、入力画像中の物体とその位置
を高精度に推定することができるという作用を有する。
【0018】以下、本発明の実施の形態について、図1
から図16を用いて説明する。
【0019】(実施の形態1)図1は、本発明の実施の
形態1における画像認識装置のブロック構成図を示して
いる。図1において、1は認識したい対象物の画像デー
タを入力する画像入力手段、2は画像入力手段1で入力
した画像を局所ウィンドウに分割して出力する画像分割
手段、3は画像分割手段2で分割した各入力ウィンドウ
に対して類似する学習ウィンドウをデータベースから抽
出して、対応する入力ウィンドウと共に出力する類似ウ
ィンドウ抽出手段、4は認識したい物体のモデルを予め
作成しておく学習手段、41は認識したい種々の物体の
モデル画像である学習画像を、画像分割手段2で作成す
る局所ウィンドウと同じサイズに分割して学習ウィンド
ウとして格納している学習画像データベース、5は類似
ウィンドウ抽出手段3で抽出した学習ウィンドウの学習
画像上での位置と、それに対応する入力ウィンドウの入
力画像上での位置から、対象の入力画像中の位置を算出
する対象位置推定手段、6は対象位置推定手段5から入
力した各入力ウインドウと学習ウィンドウの推定位置の
うち一致するものの数を集計する集計手段、7は集計手
段6の集計結果を受けて入力画像中の対象物の有無と対
象物の位置を決定する対象決定手段である。
【0020】また、図2はコンピュータにより画像認識
装置を実現した場合のブロック構成図であり、201は
コンピュータ、202はCPU、203はメモリ、20
4はキーボード及びディスプレイ、205は画像認識プ
ログラムを読み込むためのFD、PD、MOなどの蓄積
媒体ユニット、206〜208はI/Fユニット、20
9はCPUバス、210は画像を取り込むためのカメ
ラ、211は予め蓄積されている画像を取り込むための
画像データベース、212は種々の物体のモデル画像で
ある学習画像を局所ウィンドウに分割して学習ウィンド
ウとして格納している学習画像データベース、213は
得られた物体の種類と位置をI/Fユニットを介して出
力する出力端子で構成されている。
【0021】以上のように構成された画像認識装置につ
いて、以下その動作を図3のフローチャートを用いて説
明する。図4は、入力画像の一例、図5は、学習画像の
例、図6は、類似ウィンドウ抽出手段3が出力するデー
タの一例、図7は、集計手段6が出力する集計結果の一
例である。
【0022】なお、学習画像データベース41(学習画
像データベース212)には、予め、認識したい対象の
種々の画像が、図5に示すように、学習ウインドウ画像
データとして入力ウィンドウと同じサイズのウィンドウ
に区切られ、学習画像とウィンドウの中心点の位置座標
とともに格納されている。ここで、図5は、学習画像
1、2で示した向き・大きさのセダンを認識するための
学習ウインドウの例である。
【0023】認識対象となる画像データを画像入力手段
1(カメラ210または画像データベース211)から
入力する(ステップ301)。画像分割手段2は、図4
に示すように、その画像から一定サイズの局所ウィンド
ウを任意画素移動させて順次抽出し、各入力ウィンドウ
をウィンドウの中心点の座標とともに出力する(ステッ
プ302)。
【0024】類似ウィンドウ抽出手段3は、画像分割手
段2から入力された入力ウィンドウと、学習画像データ
ベース41(学習画像データベース212)に蓄積され
ている全ての学習ウィンドウとの差(例えば、各画素値
の差の二乗の和または各画素値の差の絶対値の累積値)
を算出して、最も差の小さいものを抽出する。類似ウィ
ンドウ抽出手段3は、全ての入力ウィンドウに対してそ
れぞれ最も類似した学習ウィンドウを学習画像データベ
ース41から抽出すると、図6に示すように、学習ウィ
ンドウの中心座標と、対応する入力ウィンドウの中心座
標の対で出力する(ステップ303)。
【0025】対象位置推定手段5は、一組の入力ウィン
ドウと学習ウィンドウの座標を入力すると(ステップ3
04)、入力画像中の物体の位置(例えば、物体に外接
する矩形の左上隅座標すなわち、図5で示した学習画像
の原点)を算出し出力する(ステップ305)。図6に
示すような、任意の入力ウィンドウの座標(α,β)と
学習ウィンドウの座標(γ,θ)を入力すると、対象位
置推定手段5は物体の位置として(α-γ,β-θ)を出
力する。
【0026】集計手段6は、ステップ305で算出され
た座標(α-γ,β-θ)を入力すると、その座標への得
点として1点加算する(ステップ306)。全ての対応
する入力ィンドウと学習ウィンドウの組について、ステ
ップ304からステップ306までの処理が終了したら
(ステップ307)、集計手段6は図7に示すような位
置座標と得点からなる集計データを出力する。
【0027】対象画像判定手段7は、座標ごとの得点の
うち一定値Tより大きいものがあるか否かを判定し(ス
テップ309)、ある場合は入力画像中に対象物体が存
在すると判断し、T以上の得点を持つ物体の位置座標を
出力する(ステップ310)。また、一定値T以上の得
点のものが無ければ、入力画像中に対象物体は存在しな
いと判断する(ステップ311)。
【0028】なお、得られた物体の位置座標は、I/F
ユニット208を介して出力端子213から出力される
(ステップ312)。
【0029】(実施の形態2)図8は、本発明の実施の
形態2における画像認識装置のブロック構成図を示す。
図8において、1は認識したい対象物の画像データを入
力する画像入力手段、2は画像入力手段1で入力した画
像を局所ウィンドウに分割して出力する画像分割手段、
3は画像分割手段2で分割した各入力ウィンドウに対し
て類似する学習ウィンドウをデータベースから抽出し
て、対応する入力ウィンドウと共に出力する類似ウィン
ドウ抽出手段、4は認識したい物体のモデルを予め作成
しておく学習手段、41は種々の物体のモデル画像であ
る学習画像を、画像分割手段2で作成する局所ウィンド
ウと同じサイズに分割して学習ウィンドウとして格納し
ている学習画像データベース、42は学習画像データベ
ースに格納されている学習ウィンドウの中から相互に類
似する学習ウィンドウをグループ化し、その各グループ
の代表学習ウィンドウの画像データとそのグループに登
録されている他の全ての学習ウィンドウの座標を出力
し、また類似するウィンドウが無い学習ウィンドウはそ
の画像データと座標を出力する類似ウィンドウ統合部、
43は類似ウィンドウ統合部42から入力した各グルー
プの代表学習ウィンドウの画像データとその座標データ
を格納している同種ウィンドウ情報データベース、5は
類似ウィンドウ抽出手段3で抽出した学習ウィンドウの
学習画像上での位置と、それに対応する入力ウィンドウ
の入力画像上での位置から、対象の入力画像中の位置を
算出する対象位置推定手段、6は対象位置推定手段5か
ら入力した各入力ウインドウと学習ウィンドウの推定位
置のうち一致するものの数を集計する集計手段、7は集
計手段6の集計結果を受けて入力画像中の対象物の有無
と対象物の位置を決定する対象決定手段である。
【0030】以上のように構成された画像認識装置につ
いて、以下その動作を図9に示すフローチャートを用い
て説明する。
【0031】図4は入力画像の一例、図5は学習画像の
一例、図10は学習画像データベース41に格納されて
いる類似ウィンドウの一例、図11は同種ウィンドウ情
報データベース43に格納されている同種ウィンドウ情
報の一例、図12は類似ウィンドウ抽出手段3が出力す
るデータの一例、図13は集計手段6が出力する集計結
果の一例である。
【0032】なお、学習画像データベース41は、予
め、種々の物体の画像が、図5に示すように、入力ウィ
ンドウと同じサイズのウィンドウに区切られ、ウィンド
ウ番号とウィンドウの中心点の位置座標とともに格納さ
れている。ここで、図5は、学習画像1、2で示した向
き・大きさのセダンを認識するための学習ウインドウの
例である。また、同種ウィンドウ情報データベース43
には、図10に示すような類似ウィンドウの各グループ
を代表学習ウィンドウとしてその画像データと、そのグ
ループに登録された全ての学習ウィンドウの座標が、類
似ウィンドウ統合部42で学習画像データベース41か
ら抽出され、図11のように格納されている。
【0033】認識対象となる画像データが画像入力手段
1から入力する(ステップ901)。画像分割手段2
は、図4に示すように、その画像から一定サイズの局所
ウィンドウを順次抽出して、各入力ウィンドウとその中
心点の座標とともに出力する(ステップ902)。
【0034】類似ウィンドウ抽出手段3は、画像分割手
段2から入力された各入力ウィンドウと、同種ウィンド
ウ情報データベース43の全てグループの代表学習ウィ
ンドウとの差(例えば、各画素値の差の二乗の和または
各画素値の差の絶対値の累積値)を算出して、最も差の
小さいグループを抽出する。類似ウィンドウ抽出手段3
は、全ての入力ウィンドウに対してそれぞれ最も類似し
たグループの学習ウィンドウを抽出することにより、そ
のグループに登録されている学習ウィンドウも類似(対
応)していると見なしその座標を同種ウィンドウ情報デ
ータベース43から抽出し、図12に示すように、入力
ウィンドウの中心座標と、対応する学習ウィンドウの中
心座標と、学習ウィンドウが属する車種の対で出力する
(ステップ903)。
【0035】対象位置推定手段5は、一組の入力ウィン
ドウと学習ウィンドウの座標を入力すると(ステップ9
04)、入力画像中の物体の位置、例えば、物体に外接
する矩形の左上隅座標、すなわち、図5で示した学習画
像の原点、を算出し車種情報と共に出力する(ステップ
905)。図12に示すような、任意の入力ウィンドウ
座標(α,β)と学習ウィンドウ座標(γ,θ)を入力す
ると、対象位置推定手段5は、入力画像中の物体の位置
として座標(α-γ,β-θ)を出力する。
【0036】集計手段6は、ステップ905で算出され
た入力画像中の物体の座標(α-γ,β-θ)と車種情報
を入力すると、その座標・車種への得点として1点加算
する(ステップ906)。
【0037】全ての対応する入力ウインドウと学習ウィ
ンドウについて、ステップ904からステップ906ま
での処理が終了したかを判断し(ステップ907)、終
了した場合は集計手段6から対象画像決定手段7へ、図
12に示すような位置座標・得点・車種別得点の組を出
力する。
【0038】対象判定手段7は、座標の得点のうち一定
値Tより大きいものがあるかどうかを判断し(ステップ
909)、入力画像中に対象物体が存在する場合はT以
上の得点を持つ位置座標とその座標の得点の中で最も高
得点の車種を出力する(ステップ910)。また、一定
値T以上の得点のものが無ければ、入力画像中に対象物
体は存在しないと判断する(ステップ911)。
【0039】なお、得られた物体の位置座標と車種は、
I/Fユニット208を介して出力端子213から出力
される(ステップ912)。
【0040】(実施の形態3)図14は本発明の実施の
形態3における画像認識装置のブロック構成図を示す。
図14において、1は認識したい対象物の画像データを
入力する画像入力手段、2は画像入力手段1で入力した
画像を局所ウィンドウに分割して出力する画像分割手
段、3は画像分割手段2で分割した各入力ウィンドウに
対して類似する学習ウィンドウを各種類の学習データベ
ースからそれぞれ一つ抽出して対応する入力ウィンドウ
と共に出力する類似ウィンドウ抽出手段、4は認識した
い物体のモデルを予め認識したい種類ごとに分類して作
成しておく学習手段、41、42…は認識したい種々の
物体のモデル画像である学習画像を、画像分割手段2で
作成する局所ウィンドウと同じサイズに分割して学習ウ
ィンドウとして認識したい種類ごとに格納している種類
別学習画像データベース、5は類似ウィンドウ抽出手段
3で抽出した各種類の学習ウィンドウの学習画像上での
位置と、それに対応する入力ウィンドウの入力画像上で
の位置から、対象の入力画像中の位置を算出する対象位
置推定手段、6は対象位置推定手段5から入力した各種
類の入力ウインドウと学習ウィンドウの推定位置のうち
一致するものの数を集計する集計手段、7は集計手段6
の各種類別の集計結果を受けて入力画像中の対象物の有
無と対象物の位置を決定する対象決定手段である。
【0041】以上のように構成された画像認識装置につ
いて、以下その動作を図15のフローチャートを用いて
説明する。図4は入力画像の一例、図5は種類1学習画
像の一例、図6は類似ウィンドウ抽出手段3が出力する
データの一例、図16は種類2学習画像の一例である。
【0042】なお、学習手段4の各種類の学習画像デー
タベースには、予め、認識したい種類の対象の画像が、
図5に示すように、入力ウィンドウ画像と同じサイズの
ウィンドウに区切られ、ウィンドウ番号とウィンドウの
中心点の位置座標とともに格納されている。ここで、図
5は、種類1学習データベースに格納されている学習画
像で、学習画像1,2で示した向き・大きさのセダンを
認識するための学習画像の例である。また、図16は、
種類2学習データベースに格納されている、図5と同じ
位置・同じ向きのバスを認識するための学習画像の例で
ある。
【0043】認識対象となる画像データを画像入力手段
1から入力する(ステップ1501)。画像分割手段2
は、図4に示すように、その画像から一定サイズの局所
ウィンドウを任意画素移動させて順次抽出し、各入力ウ
ィンドウをウィンドウの中心点の座標とともに出力する
(ステップ1502)。
【0044】類似ウィンドウ抽出手段3は、画像分割手
段2から入力ウィンドウを入力すると、学習手段4の全
ての学習データベースの学習ウィンドウとの差(例え
ば、各画素値の差の二乗の和または各画素値の差の絶対
値の累積値)を算出して、各学習データベースごとに最
も差の小さいものを抽出する。類似ウィンドウ抽出手段
3は、全ての入力ウィンドウに対してそれぞれ最も類似
した学習ウィンドウを学習手段4から抽出すると、各種
類ごとに、図6に示すような学習ウィンドウの中心座標
と、それに対応する入力ウィンドウの中心座標の対で出
力する(ステップ1503)。
【0045】対象位置推定手段5は、種類ごとに、一組
の入力ウィンドウと学習ウィンドウの座標を入力すると
(ステップ1504)、入力画像中の物体の位置、例え
ば、物体に外接する矩形の左上隅座標、すなわち、図5
で示した学習画像の原点、を算出し出力する(ステップ
1505)。図6に示すような、任意の入力ウィンドウ
座標(α,β)と学習ウィンドウ座標(γ,θ)を入力す
ると、対象位置推定手段5は、物体の位置として(α-
γ,β-θ)を出力する。
【0046】集計手段6は、ステップ1505で算出さ
れた座標(α-γ,β-θ)を入力すると、種類別にその
座標への得点として1点加算する(ステップ150
6)。
【0047】ある種類の全ての対応する入力ウインドウ
と学習ウィンドウについてステップ1504からステッ
プ1506までの処理が終了したかを判断し(ステップ
1507)、次の種類についてステップ1504からス
テップ1506までの処理を行い、全ての種類の全ての
入力ウインドウと学習ウィンドウについてステップ15
04からステップ1506までの処理が終了したら、集
計手段6は対象画像決定手段7へ、各種類ごとに図7に
示すような位置座標と得点の組を出力する(ステップ1
508)。
【0048】対象判定手段7は、座標ごとの得点のうち
一定値Tより大きいものがあ留火を判断し(ステップ1
509)、入力画像中にその種類の物体が存在すると判
断した場合は、さらに、同じ座標の得点で一定値T以上
のものが複数あれば、そのうち最高得点をもつ種類の物
体が入力画像中に存在すると判断し、その物体の種類と
位置座標を出力する(ステップ1510)。また、一定
値T以上の得点のものが無ければ、入力画像中に対象物
体は存在しないと判断する(ステップ1511)。
【0049】なお、得られた物体の位置座標と車種は、
I/Fユニット208を介して出力端子213から出力
される(ステップ1512)。
【0050】
【発明の効果】以上のように本発明によれば、各学習画
像間で類似した局所ウィンドウが多数ある場合にも、入
力画像中の対象の有無や対象の種類を認識でき、かつ、
対象の入力画像中の位置を高精度に推定することができ
る。
【図面の簡単な説明】
【図1】本発明の実施の形態1における画像認識装置の
ブロック構成図
【図2】本発明の実施の形態1におけるコンピュータに
よる画像認識装置のブロック構成図
【図3】本発明の実施の形態1における処理の流れを示
すフローチャート
【図4】本発明の実施の形態1における入力画像の一例
を示す図
【図5】本発明の実施の形態1における学習画像データ
ベースが保管している学習画像データの一例を示す図
【図6】本発明の実施の形態1における類似ウィンドウ
抽出手段が出力する入力ウィンドウと学習ウィンドウの
対応の一例を示す図
【図7】集計手段が出力する集計の一例を示す図
【図8】本発明の実施の形態2における画像認識装置の
ブロック構成図
【図9】本発明の実施の形態2における処理の流れを示
すフローチャート
【図10】本発明の実施の形態2における画像データベ
ース中の同種画像の一例を示す図
【図11】本発明の実施の形態2における同種ウィンド
ウ情報データベースが保管している同種ウィンドウ情報
の一例を示す図
【図12】本発明の実施の形態2における類似ウィンド
ウ抽出手段が出力する入力ウィンドウと学習ウィンドウ
の対応の一例を示す図
【図13】本発明の実施の形態2における集計手段が出
力する集計の一例を示す図
【図14】本発明の実施の形態3における画像認識装置
のブロック構成図
【図15】本発明の実施の形態3における処理の流れを
示すフローチャート
【図16】本発明の実施の形態3における種類Xの学習
画像データベースが保管している学習画像データの一例
を示す図
【図17】従来の画像認識装置の一例を示すブロック図
【符号の説明】
1 画像入力手段 2 画像分割手段 3 類似ウインドウ抽出手段 4 学習手段 5 対象位置推定手段 6 集計手段 7 対象判定手段 41 学習画像データベース 42 類似ウインドウ統合部 43 同種ウインドウ情報データベース 201 コンピュータ 202 CPU 203 メモリ 204 キーボード/ディスプレイ 205 蓄積媒体ユニット 206〜208 I/Fユニット 209 CPUバス 210 カメラ 211 画像データベース 212 学習画像データベース 213 出力端子
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 2F065 AA00 AA01 AA61 DD03 FF04 FF61 JJ03 JJ19 JJ26 QQ13 QQ14 QQ18 QQ24 QQ25 QQ31 QQ36 QQ39 QQ41 QQ42 RR07 5L096 FA53 FA69 GA17 GA32 HA09 KA04

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力した画像を局所領域に分割し、各入
    力局所領域に対して予め学習画像を登録した学習画像デ
    ータベースから類似する学習局所領域をそれぞれ抽出し
    て入力局所領域と対応づけ、前記各入力局所領域の座標
    と対応する学習局所領域の座標から入力画像中の対象物
    体の位置を推定して、前記推定位置が一致する入力局所
    領域と学習局所領域の数の集計値を求め、前記集計値が
    一定値以上である場合に対象があると判断することを特
    徴とする画像認識方法。
  2. 【請求項2】 入力した画像を局所領域に分割し、各入
    力局所領域に対して、予め類似した学習画像をグループ
    化しその各グループの代表学習局所領域とそのグループ
    の全ての学習局所領域の座標を登録した同種ウィンドウ
    情報データベースから類似する代表学習局所領域を抽出
    して、入力局所領域と抽出されたグループの学習局所領
    域とを対応づけ、前記各入力局所領域の座標と対応づけ
    された学習局所領域の座標から入力画像中の対象物体の
    位置を推定して、前記推定位置が一致する入力局所領域
    と学習局所領域の数の集計値を求め、前記集計値が一定
    値以上である場合に対象があると判断することを特徴と
    する画像認識方法。
  3. 【請求項3】 各入力局所領域に対して予め学習画像を
    種類ごとに登録した学習画像データベースから種類ごと
    に類似する学習局所領域をそれぞれ抽出して入力局所領
    域と対応づけ、前記各入力局所領域の座標と対応する学
    習局所領域の座標から入力画像中の対象物体の位置を推
    定して、前記推定位置が一致する入力局所領域と学習局
    所領域の数の集計値を種類ごと求めることを特徴とする
    請求項1記載の画像認識方法。
  4. 【請求項4】 同種ウィンドウ情報データベースは、学
    習画像データベースから予め類似した学習局所領域を抽
    出し、各グループの中からその代表の学習局所領域の画
    像データとそのグループの全ての学習局所領域の座標お
    よびその種別を登録することを特徴とする請求項2記載
    の画像認識方法。
  5. 【請求項5】 入力局所領域と学習局所領域または代表
    学習局所領域との対応づけは、各画素値の差の二乗の和
    または各画素値の差の絶対値の累積値を算出して、最も
    差の小さいものを抽出することを特徴とする請求項1乃
    至4のいずれかに記載の画像認識方法。
  6. 【請求項6】 入力した画像を局所領域に分割する画像
    分割手段と、予め学習画像を学習画像データベースに登
    録しておく学習手段と、各入力局所領域に対して前記学
    習データベースから類似する学習局所領域を抽出して入
    力局所領域と対応づける類似ウィンドウ抽出手段と、前
    記各入力局所領域についてその座標と対応する学習局所
    領域の座標から入力画像中の対象物体の位置を推定する
    対象位置推定手段と、前記推定位置が一致する入力局所
    領域と学習局所領域の数を集計する集計手段と、前記集
    計値が一定値以上である場合に対象があると判断する対
    象判定手段とを備えることを特徴とする画像認識装置。
  7. 【請求項7】 入力した画像を局所領域に分割する画像
    分割手段と、予め類似した学習画像をグループ化しその
    各グループの代表学習局所領域とそのグループの全ての
    学習局所領域の座標を同種ウィンドウ情報データベース
    に登録する学習手段と、各入力局所領域に対して前記同
    種ウィンドウ情報データベースから類似する代表学習局
    所領域を抽出して入力局所領域と抽出されたグループの
    学習局所領域とを対応づける類似ウィンドウ抽出手段
    と、前記各入力局所領域の座標と対応づけられた学習局
    所領域の座標から入力画像中の対象物体の位置を推定す
    る対象位置推定手段と、前記推定位置が一致する入力局
    所領域と学習局所領域の数の集計値を求める集計手段
    と、前記集計値が一定値以上である場合に対象があると
    判断する対象判定手段とを備えることを特徴とする画像
    認識装置。
  8. 【請求項8】 入力した画像を局所領域に分割する画像
    分割手段と、予め学習画像を種類ごとに学習画像データ
    ベースに登録する学習手段と、各入力局所領域に対して
    前記学習画像データベースから種類ごとに類似する学習
    局所領域をそれぞれ抽出して入力局所領域と対応づる類
    似ウィンドウ抽出手段と、前記各入力局所領域の座標と
    対応する学習局所領域の座標から入力画像中の対象物体
    の位置を推定する対象位置推定手段と、前記推定位置が
    一致する入力局所領域と学習局所領域の数の集計値を種
    類ごと求める求める集計手段と、前記集計値が一定値以
    上である場合に対象があると判断する対象判定手段とを
    備えることを特徴とする画像認識装置。
  9. 【請求項9】 学習手段は、学習画像データベースから
    類似した学習局所領域をグループ化し、その各グループ
    の代表学習局所領域の画像データとそのグループの全て
    の学習局所領域の座標を出力する類似ウィンドウ統合手
    段と、前記類似ウィンドウ統合手段から各グループの代
    表学習局所領域の画像データとそのグループの全ての学
    習局所領域の座標およびその種別を格納している同種ウ
    ィンドウ情報データベースを有することを特徴とする請
    求項7記載の画像認識装置。
  10. 【請求項10】 コンピュータにより画像認識を行うプ
    ログラムであって、入力した画像を局所領域に分割し、
    各入力局所領域に対して予め学習画像を登録した学習画
    像データベースから類似する局所領域を抽出して入力局
    所領域と対応付け、前記各入力局所領域についてその座
    標と対応する学習局所領域の座標から入力画像中の対象
    物体の位置を推定して、前記推定位置が一致する前記入
    力局所領域・学習局所領域の数の集計値を求め、前記集
    計値が一定の値以上である場合に対象があると判断する
    画像認識プログラムを記録した記録媒体。
JP27870899A 1999-09-30 1999-09-30 画像認識方法及び画像認識装置 Expired - Fee Related JP3680658B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP27870899A JP3680658B2 (ja) 1999-09-30 1999-09-30 画像認識方法及び画像認識装置
EP00121115A EP1089214A3 (en) 1999-09-30 2000-09-28 Apparatus and method for image recognition
US09/676,680 US6999623B1 (en) 1999-09-30 2000-09-29 Apparatus and method for recognizing an object and determining its position and shape
US10/677,866 US7054489B2 (en) 1999-09-30 2003-10-02 Apparatus and method for image recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27870899A JP3680658B2 (ja) 1999-09-30 1999-09-30 画像認識方法及び画像認識装置

Publications (2)

Publication Number Publication Date
JP2001101405A true JP2001101405A (ja) 2001-04-13
JP3680658B2 JP3680658B2 (ja) 2005-08-10

Family

ID=17601092

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27870899A Expired - Fee Related JP3680658B2 (ja) 1999-09-30 1999-09-30 画像認識方法及び画像認識装置

Country Status (1)

Country Link
JP (1) JP3680658B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1291668A2 (en) * 2001-09-07 2003-03-12 Matsushita Electric Industrial Co., Ltd. Vehicle surroundings display device and image providing system
CN104204847A (zh) * 2012-01-19 2014-12-10 罗伯特·博世有限公司 用于可视化车辆的周围环境的方法和装置
KR20150104857A (ko) * 2014-03-06 2015-09-16 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20150108567A (ko) * 2014-03-18 2015-09-30 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
JP2020091828A (ja) * 2018-11-27 2020-06-11 豪洋 石崎 情報処理装置及び類似画像検索プログラム
CN112685080A (zh) * 2021-01-08 2021-04-20 深圳开源互联网安全技术有限公司 开源组件查重方法、系统、装置及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212329A (ja) * 1995-02-06 1996-08-20 Fujitsu Ltd 適応的認識システム
JPH0921610A (ja) * 1995-07-04 1997-01-21 N T T Data Tsushin Kk 画像処理装置及び画像処理方法
JPH10339607A (ja) * 1997-06-06 1998-12-22 Hitachi Ltd 画像間位置ずれ解析法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08212329A (ja) * 1995-02-06 1996-08-20 Fujitsu Ltd 適応的認識システム
JPH0921610A (ja) * 1995-07-04 1997-01-21 N T T Data Tsushin Kk 画像処理装置及び画像処理方法
JPH10339607A (ja) * 1997-06-06 1998-12-22 Hitachi Ltd 画像間位置ずれ解析法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1291668A2 (en) * 2001-09-07 2003-03-12 Matsushita Electric Industrial Co., Ltd. Vehicle surroundings display device and image providing system
EP1291668A3 (en) * 2001-09-07 2004-12-01 Matsushita Electric Industrial Co., Ltd. Vehicle surroundings display device and image providing system
US7176959B2 (en) 2001-09-07 2007-02-13 Matsushita Electric Industrial Co., Ltd. Vehicle surroundings display device and image providing system
US9862316B2 (en) 2012-01-19 2018-01-09 Robert Bosch Gmbh Method and device for visualizing the surroundings of a vehicle
CN104204847A (zh) * 2012-01-19 2014-12-10 罗伯特·博世有限公司 用于可视化车辆的周围环境的方法和装置
KR20150104857A (ko) * 2014-03-06 2015-09-16 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR102203000B1 (ko) * 2014-03-06 2021-01-14 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR20150108567A (ko) * 2014-03-18 2015-09-30 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
KR102223684B1 (ko) * 2014-03-18 2021-03-04 에스케이플래닛 주식회사 객체 식별 장치, 그 방법 및 컴퓨터 프로그램이 기록된 기록매체
JP2020091828A (ja) * 2018-11-27 2020-06-11 豪洋 石崎 情報処理装置及び類似画像検索プログラム
JP7097329B2 (ja) 2018-11-27 2022-07-07 豪洋 石崎 情報処理装置及び類似画像検索プログラム
CN112685080A (zh) * 2021-01-08 2021-04-20 深圳开源互联网安全技术有限公司 开源组件查重方法、系统、装置及可读存储介质
CN112685080B (zh) * 2021-01-08 2023-08-11 深圳开源互联网安全技术有限公司 开源组件查重方法、系统、装置及可读存储介质

Also Published As

Publication number Publication date
JP3680658B2 (ja) 2005-08-10

Similar Documents

Publication Publication Date Title
CN110232311B (zh) 手部图像的分割方法、装置及计算机设备
CN109829398B (zh) 一种基于三维卷积网络的视频中的目标检测方法
WO2018028546A1 (zh) 一种关键点的定位方法及终端、计算机存储介质
CN1977286B (zh) 对象识别方法及其设备
CN113239982A (zh) 检测模型的训练方法、目标检测方法、装置和电子系统
CN109886223B (zh) 人脸识别方法、底库录入方法、装置及电子设备
CN107292302B (zh) 检测图片中兴趣点的方法和系统
CN111640089A (zh) 一种基于特征图中心点的缺陷检测方法及装置
CN111340023B (zh) 文本识别方法及装置、电子设备、存储介质
CN112509011B (zh) 一种静止商品统计方法、终端设备及其存储介质
CN113963147B (zh) 一种基于语义分割的关键信息提取方法及系统
CN111160395A (zh) 图像识别方法、装置、电子设备和存储介质
CN111428743B (zh) 商品识别方法、商品处理方法、装置及电子设备
CN109508716B (zh) 一种图像文字的定位方法及装置
JP2001101405A (ja) 画像認識方法及び画像認識装置
CN113486715A (zh) 图像翻拍识别方法、智能终端以及计算机存储介质
CN111062388B (zh) 基于深度学习的广告文字的识别方法、系统、介质及设备
CN111753766A (zh) 一种图像处理方法、装置、设备及介质
JP2002032766A (ja) 画像認識装置及びその方法
CN114842198A (zh) 车辆智能定损方法、装置、设备及存储介质
CN114926829A (zh) 一种证件检测方法、装置、电子设备及存储介质
CN114387648A (zh) 异常图像检测方法、装置、计算机设备及存储介质
CN111325194B (zh) 一种文字识别方法、装置及设备、存储介质
JP6717769B2 (ja) 情報処理装置及びプログラム
JPH11306354A (ja) 画像認識方法及び画像認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041102

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050318

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090527

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100527

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees