JP3438580B2 - 画像認識方法及び画像認識装置 - Google Patents

画像認識方法及び画像認識装置

Info

Publication number
JP3438580B2
JP3438580B2 JP11045498A JP11045498A JP3438580B2 JP 3438580 B2 JP3438580 B2 JP 3438580B2 JP 11045498 A JP11045498 A JP 11045498A JP 11045498 A JP11045498 A JP 11045498A JP 3438580 B2 JP3438580 B2 JP 3438580B2
Authority
JP
Japan
Prior art keywords
image
learning
window
input
windows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11045498A
Other languages
English (en)
Other versions
JPH11306354A (ja
Inventor
めぐみ 山岡
健司 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP11045498A priority Critical patent/JP3438580B2/ja
Publication of JPH11306354A publication Critical patent/JPH11306354A/ja
Application granted granted Critical
Publication of JP3438580B2 publication Critical patent/JP3438580B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力画像が、予め
作成済の学習画像データベース中のどの画像と近いかを
判定することにより、入力画像上に表示されている物体
が何であるかを認識する画像認識方法及び画像認識装置
並びに画像認識プログラムを記録した記録媒体に関する
ものである。
【0002】
【従来の技術】従来の画像認識装置は、特開平9−21
610号公報に記載されたものが知られている。
【0003】図16は、従来の画像認識装置のブロック
構成図を示しており、画像を入力する画像入力部11
と、抽出対象物の局所モデルを予め格納しているモデル
記憶部12と、入力画像の各部分画像について各局所モ
デルとのマッチングを行うマッチング処理部13と、入
力画像の各部分画像がどの程度局所モデルに一致してい
るかによって画像の位置情報も含めたパラメータ空間で
抽出対象物の位置を確率的に表示し統合する局所情報統
合部14と、パラメータ空間内で最も確立の高い部分を
抽出して入力画像内での抽出対象物の位置を判別して出
力する物体位置決定部15から構成されている。
【0004】
【発明が解決しようとする課題】このような従来の画像
認識装置は、抽出対象物が入力画像と学習画像の間で画
像面内平行移動している場合には適用できるが、平行移
動と画像面内回転移動が同時に生じている場合は認識で
きないという課題を有していた。
【0005】本発明は、上記従来の課題を解決するもの
で、入力画像の対象物体がモデルと比べて画像面内で回
転している場合にも対象物体を認識し、その位置とモデ
ルに対する回転角を推定することを目的とする。
【0006】
【課題を解決するための手段】この課題を解決するため
に本発明は、第1に画像を入力する画像入力部と、前記
画像入力部から入力した画像をウィンドウに分割する画
像分割部と、前記画像分割部で分割したそれぞれの入力
ウィンドウに対して類似した学習ウィンドウを抽出する
類似ウィンドウ抽出部と、前記類似ウィンドウ抽出部か
ら入力した同じ学習画像に属する学習ウィンドウについ
て基底となる3ウィンドウを選択した後入力画像上での
位置関係から基底以外のウィンドウを基底が張る空間座
標で求める入力ウィンドウ座標算出部と、前記入力ウィ
ンドウ座標算出部で算出した座標と同じ基底・ウィンド
ウの座標を学習画像上での位置関係から算出したものを
前記入力ウィンドウ座標算出部で算出した座標と比較し
て一致するものの数を学習画像ごとに集計する集計部を
備えたものである。
【0007】これにより、まず、入力ウィンドウと類似
する学習ウィンドウを抽出し、次に、同じ学習画像に属
する学習ウィンドウの学習画像上での相対座標と、対応
する入力ウィンドウの入力画像上での相対座標を比較し
て、一致するものの数を学習画像ごとに集計することに
よって、入力画像に最も一致する学習画像を決定し、更
に、その学習画像に属する学習ウィンドウと対応する入
力ウィンドウの絶対座標の差から入力画像中の物体の回
転角と入力画像上での位置を推定することができる。
【0008】
【0009】
【0010】
【発明の実施の形態】 請求項に記載の発明は、予め採
取しておいた大量の学習画像データの中から、入力画像
に近い画像を探索して、入力画像中の対象物体を認識す
る装置おいて、入力した画像を局所領域に分割する画像
分割手段と、様々な物体の画像を前記画像分割手段での
分割サイズと同じサイズのウィンドウに分割して画像上
での位置情報と共に学習ウィンドウとして格納している
学習画像データベースと、前記画像分割手段で分割した
それぞれの入力ウィンドウに対して類似した学習ウィン
ドウを抽出して入力ウィンドウと学習ウィンドウの対を
学習ウィンドウが属する学習画像ごとにまとめて出力す
る類似ウィンドウ抽出手段と、前記学習画像データベー
スに格納されている同じ学習画像に属するウィンドウに
ついて任意の3ウィンドウを基底とし学習画像上での位
置関係から算出した座標と基底の組を学習画像ごとに学
習ウィンドウ座標データベースへ格納する学習手段と、
前記類似ウィンドウ抽出手段から入力した同じ学習画像
に属する学習ウィンドウについて基底となる3ウィンド
ウの組み合わせを全て抽出し、入力した基底と同じ学習
画像に属するウィンドウの基底が張る空間での座標を基
底とウィンドウの入力画像上での位置関係から求め、算
出した座標と同じ基底・ウィンドウによる前記学習ウィ
ンドウデータベースでの座標とを比べて一致するものの
数を集計する投票手段と、前記集計値の最も高い学習画
像を選択する対象決定手段とを含む画像認識装置とした
ものであり、入力画像中の各局所領域の相対座標と、入
力画像局所領域と類似する学習画像局所領域の学習画像
上の相対座標を比較して、相対座標が一致する学習画像
を入力画像の物体であるとし、学習画像と入力画像の対
応する局所領域の絶対座標の違いから、入力画像中の物
体の平行移動量と回転角を算出するという作用を有す
る。
【0011】請求項に記載の発明は、学習手段は、予
め同種の物体の学習画像が複数ある場合にそれらの各学
習ウィンドウをその中の代表的な1つの学習画像中の学
習ウィンドウと対応付けて格納している同種画像情報デ
ータベースを有し、投票手段は前記同種画像情報データ
ベースの同種画像情報に基いて前記類似ウィンドウ抽
出手段から入力した同種の物体の学習画像に属する学習
ウィンドウを代表的な一つの学習画像の学習ウィンドウ
に変換し、入力した同種の画像に属する学習ウィンドウ
について基底となる3ウィンドウの組み合わせを全て抽
出する請求項1記載の画像認識装置としたものであり
同種の学習画像が複数ある場合に、それを一つの学習画
像で代表させた後入力画像中の各局所領域の相対座標
と、入力画像局所領域と類似する学習画像局所領域の学
習画像上の相対座標を比較して、相対座標が一致する学
習画像を入力画像の物体の種類を表す画像であるとし、
学習画像と入力画像の対応する局所領域の絶対座標の違
いから、入力画像中の物体の平行移動量と回転角を算出
するという作用を有する。
【0012】請求項に記載の発明は、予め採取してお
いた大量の学習画像データの中から、入力画像に近い画
像を探索して、入力画像中の対象物体を認識する装置
あって、入力した画像を局所領域に分割する画像分割手
段と、前記画像分割手段で分割したそれぞれの入力ウィ
ンドウに対して類似した学習ウィンドウを抽出して入力
ウィンドウと学習ウィンドウの対を学習ウィンドウが属
する学習画像ごとにまとめて出力する類似ウィンドウ抽
出手段と、様々な物体の画像を前記画像分割部での分割
サイズと同じサイズのウィンドウに分割して画像上での
位置情報と共に学習ウィンドウとして格納し同時に学習
画像ごとに任意の一点を画像中の物体の位置を示す注目
点としてその位置情報を格納している学習画像データベ
ースを持つ学習手段と、前記類似ウィンドウ抽出手段か
ら入力した同じ学習画像に属する学習ウィンドウについ
て2ウィンドウの組み合わせを全て抽出するウィンドウ
選択部と、前記ウィンドウ選択部で抽出したウィンドウ
の組ごとに注目点の入力画像上での位置座標を2入力ウ
ィンドウの位置座標と前記学習画像データベースから入
力した同じウィンドウ・注目点の学習画像上での位置関
係から推定し、抽出した各ウィンドウの組について入力
画像上での位置座標から求めた2ウィンドウが成すベク
トル前記学習画像データベースに格納されている同じ
ウィンドウの学習画像上での位置座標から求めたベクト
とのなす角を算出し、入力した座標値と前記角度と
を1つの組にして同じ値を持つウィンドウの組の数を学
習画像ごとに集計する投票手段と、前記集計値の最も高
い学習画像を選択する対象決定手段とを含む画像認識装
置としたものであり、入力画像中の各2局所領域が作る
ベクトルと、その局所領域と類似する同じ学習画像に属
する2学習画像局所領域が作るベクトルのなす角を算出
して、各2局所領域のなす角が一定であり、かつ、各入
力局所領域と類似した学習局所領域が推定する入力画像
中の物体の位置が最も一定となる学習画像を入力画像の
物体であると推定するという作用を有する。
【0013】請求項に記載の発明は、学習部は、同種
の物体の学習画像が複数ある場合にそれらの各学習ウィ
ンドウをその中の代表的な一つの学習画像中の学習ウィ
ンドウと対応付けて格納している同種画像情報データベ
ースを有し、投票手段は前記同種画像情報データベース
の同種画像情報に基いて前記類似ウィンドウ抽出部か
ら入力した同種の物体の学習画像に属する学習ウィンド
ウを代表的な一つの学習画像に属する学習ウィンドウに
変換して出力する同種画像混合部と、前記同種画像混合
部から入力した同種の画像に属する学習ウィンドウにつ
いて2ウィンドウの組み合わせを全て抽出する請求項3
記載の画像認識装置としたものであり、同種の学習画像
が複数ある場合に、それを一つの学習画像で代表させた
後、入力画像中の各2局所領域が作るベクトルと、その
局所領域と類似する同じ学習画像に属する2学習画像局
所領域が作るベクトルのなす角を算出して、各2局所領
域のなす角が一定であり、かつ、各入力局所領域と類似
した学習局所領域が推定する入力画像中の物体の位置が
最も一定となる学習画像を入力画像の物体であると推定
するという作用を有する。請求項5に記載の発明は、予
め採取しておいた大量の学習画像データの中から、入力
画像に近い画像を探索して、入力画像中の対象物体を認
識する方法であって、入力した画像を局所領域に分割す
る画像分割ステップと、様々な物体の画像を前記画像分
割手段での分割サイズと同じサイズのウィンドウに分割
して画像上での位置情報と共に学習ウィンドウとして学
習画像データベースに格納する学習画像データベース格
納ステップと、前記画像分割ステップで分割したそれぞ
れの入力ウィンドウに対して類似した学習ウィンドウを
抽出して入力ウィンドウと学習ウィンドウの対を学習ウ
ィンドウが属する学習画像ごとにまとめて出力する類似
ウィンドウ抽出ステップと、前記学習画像データベース
に格納されている同じ学習画像に属するウィンドウにつ
いて任意の3ウィンドウを基底とし学習画像上での位置
関係から算出した座標と基底の組を学習画像ごとに学習
ウィンドウ座標データベースへ格納する学習ステップ
と、前記類似ウィンドウ抽出ステップから入力した同じ
学習画像に属する学習ウィンドウについて基底となる3
ウィンドウの組み合わせを全て抽出し、入力した基底と
同じ学習画像に属するウィンドウの 基底が張る空間での
座標を基底とウィンドウの入力画像上での位置関係から
求め、算出した座標と同じ基底・ウィンドウによる前記
学習ウィンドウデータベースでの座標とを比べて一致す
るものの数を集計する投票ステップと、前記集計値の最
も高い学習画像を選択する対象決定ステップとを含む画
像認識方法としたものであり、入力画像中の各局所領域
の相対座標と、入力画像局所領域と類似する学習画像局
所領域の学習画像上の相対座標を比較して、相対座標が
一致する学習画像を入力画像の物体であるとし、学習画
像と入力画像の対応する局所領域の絶対座標の違いか
ら、入力画像中の物体の平行移動量と回転角を算出する
という作用を有する。請求項6に記載の発明は、予め採
取しておいた大量の学習画像データの中から、入力画像
に近い画像を探索して、入力画像中の対象物体を認識す
る方法であって、入力した画像を局所領域に分割する画
像分割ステップと、前記画像分割手段で分割したそれぞ
れの入力ウィンドウに対して類似した学習ウィンドウを
抽出して入力ウィンドウと学習ウィンドウの対を学習ウ
ィンドウが属する学習画像ごとにまとめて出力する類似
ウィンドウ抽出ステップと、様々な物体の画像を前記画
像分割部での分割サイズと同じサイズのウィンドウに分
割して画像上での位置情報と共に学習ウィンドウとして
格納し同時に学習画像ごとに任意の一点を画像中の物体
の位置を示す注目点としてその位置情報を格納している
学習画像データベースを持つ学習ステップと、前記類似
ウィンドウ抽出ステップから入力した同じ学習画像に属
する学習ウィンドウについて2ウィンドウの組み合わせ
を全て抽出するウィンドウ選択ステップと、前記ウィン
ドウ選択ステップで抽出したウィンドウの組ごとに注目
点の入力画像上での位置座標を2入力ウィンドウの位置
座標と前記学習画像データベースから入力した同じウィ
ンドウ・注目点の学習画像上での位置関係から推定し、
抽出した各ウィンドウの組について入力画像上での位置
座標から求めた2ウィンドウが成すベクトルと前記学習
画像データベースに格納されている同じウィンドウの学
習画像上での位置座標から求めたベクトルとのなす角度
を算出し、入力した座標値と前記角度とを1つの組にし
て同じ値を持つウィンドウの組の数を学習画像ごとに集
計する投票ステップと、前記集計値の最も高い学習画像
を選択する対象決定ステップとを含む画像認識装置とし
たもので あり、同種の学習画像が複数ある場合に、それ
を一つの学習画像で代表させた後入力画像中の各局所領
域の相対座標と、入力画像局所領域と類似する学習画像
局所領域の学習画像上の相対座標を比較して、相対座標
が一致する学習画像を入力画像の物体の種類を表す画像
であるとし、学習画像と入力画像の対応する局所領域の
絶対座標の違いから、入力画像中の物体の平行移動量と
回転角を算出するという作用を有する。
【0014】請求項7に記載の発明は、コンピュータに
より画像認識を行うプログラムであって、入力した画像
を局所領域に分割する画像分割ステップと、様々な物体
の画像を前記画像分割手段での分割サイズと同じサイズ
のウィンドウに分割して画像上での位置情報と共に学習
ウィンドウとして学習画像データベースに格納する学習
画像データベース格納ステップと、前記画像分割ステッ
プで分割したそれぞれの入力ウィンドウに対して類似し
た学習ウィンドウを抽出して入力ウィンドウと学習ウィ
ンドウの対を学習ウィンドウが属する学習画像ごとにま
とめて出力する類似ウィンドウ抽出ステップと、前記学
習画像データベースに格納されている同じ学習画像に属
するウィンドウについて任意の3ウィンドウを基底とし
学習画像上での位置関係から算出した座標と基底の組を
学習画像ごとに学習ウィンドウ座標データベースへ格納
する学習ステップと、前記類似ウィンドウ抽出ステップ
から入力した同じ学習画像に属する学習ウィンドウにつ
いて基底となる3ウィンドウの組み合わせを全て抽出
し、入力した基底と同じ学習画像に属するウィンドウの
基底が張る空間での座標を基底とウィンドウの入力画像
上での位置関係から求め、算出した座標と同じ基底・ウ
ィンドウによる前記学習ウィンドウデータベースでの座
標とを比べて一致するものの数を集計する投票ステップ
と、前記集計値の最も高い学習画像を選択する対象決定
ステップとを含む画像認識プログラムを記録した記録媒
体から、コンピュータに読み込み実行することにより、
入力画像中の各局所領域の相対座標と、入力画像局所領
域と類似する学習画像局所領域の学習画像上の相対座標
を比較して、相対座標が一致する学習画像を入力画像の
物体であるとし、学習画像と入力画像の対応する局所領
域の絶対座標の違いから、入力画像中の物体の平行移動
量と回転角を算出するという作用を有する。
【0015】以下、本発明の実施の形態について、図1
から図14を用いて説明する。 (実施の形態1)図1は、本発明の実施の形態1におけ
る画像認識装置のブロック構成図を示している。図1に
おいて、1は認識したい対象物の画像データを入力する
画像入力部、2は画像入力部1で入力した画像を局所ウ
ィンドウに分割して出力する画像分割部、3は画像分割
部2で分割した各入力ウィンドウ画像に対して類似する
学習ウィンドウをデータベースから抽出して学習ウィン
ドウが属する画像ごとにまとめて、対応する入力ウィン
ドウと共に出力する類似ウィンドウ抽出部、4は認識し
たい物体のモデルを予め作成しておく学習手段、41は
種々の物体のモデル画像である学習画像を、画像分割部
2で作成する局所ウィンドウと同じサイズの局所ウィン
ドウに分割して学習ウィンドウとして格納している学習
画像データベース、42は学習画像データベースに格納
されている各学習画像ごとに、任意の3つの学習ウィン
ドウを抽出して、その3学習ウィンドウの位置座標を基
底としたときのそれ以外の学習ウィンドウの相対座標を
求める学習ウィンドウ座標算出部、43は学習ウィンド
ウ座標算出部42で求めた相対座標データを格納してい
る学習ウィンドウ座標データベース、5は類似ウィンド
ウ抽出部3で抽出した学習ウィンドウの、学習画像上で
の相対位置と、対応する入力ウィンドウの入力画像上で
の相対位置を比較して、一致するものの数を集計する投
票手段、51は類似ウィンドウ抽出部3が出力する同一
学習画像に属する学習ウィンドウの中から、基底となる
3つの学習ウィンドウの組み合わせを全て抽出して、対
応する入力ウィンドウと共に基底学習ウィンドウ・基底
入力ウィンドウとして出力する基底選択部、52は基底
選択部51から入力した各基底について、同じ学習画像
に属する他の学習ウィンドウの相対座標を、対応する入
力ウィンドウの対応する基底入力ウィンドウに対する入
力画像上での相対座標で表して、座標値と、学習ウィン
ドウ・基底学習ウィンドウと、対応する入力ウィンドウ
・基底入力ウィンドウを出力する入力ウィンドウ座標算
出部、53は入力ウィンドウ座標算出部52から入力し
た学習ウィンドウ・基底学習ウィンドウに対して学習ウ
ィンドウ座標データベース43に格納されている相対座
標と入力ウィンドウ座標算出部52から入力した座標と
を比較して、一致するものの数を基底ごとに集計して基
底と集計値を出力する集計部、6は投票手段5の集計結
果を受けて入力画像中の対象物とその姿勢を決定する対
象決定手段、61は集計部53から入力した集計値のう
ち最大の値を持つ基底を出力し、その基底が属する学習
画像中の物体を入力画像の物体であるとみなす対象画像
決定部、62は対象画像決定部61が選択した基底につ
いて、基底学習ウィンドウの学習画像上での位置と、基
底入力ウィンドウの入力画像上での位置とを比較して、
入力画像中の対象の位置と回転角を算出する姿勢算出部
である。
【0016】また、図2はコンピュータにより画像認識
装置を実現した場合のブロック構成図であり、201は
コンピュータ、202はCPU、203はメモリ、20
4はキーボード及びディスプレイ、205は画像認識プ
ログラムを読み込むためのFDユニット、206〜20
8はI/Fユニット、209はCPUバス、210は画
像を取り込むためのカメラ、211は予め蓄積されてい
る画像を取り込むための画像データベース、212は種
々の物体のモデル画像である学習画像を局所ウィンドウ
に分割して学習ウィンドウとして格納している学習画像
データベース、213は相対座標データを格納している
学習ウィンドウ座標データベース、215は得られた物
体の平行移動量と回転角はI/Fユニットを介して出力
する出力端子で構成されている。
【0017】以上のように構成された画像認識装置につ
いて、以下その動作を図3のフローチャートを用いて説
明する。図4は、入力画像の一例、図5は、学習画像の
一例、図6は、類似ウィンドウ抽出部3が出力するデー
タの一例、図7は、集計部53が出力する集計結果の一
例である。
【0018】認識対象となる画像データを画像入力部1
(カメラ210または画像データベース211)から入
力する(601)。画像分割部2は、図4に示すよう
に、その画像から一定サイズのウィンドウを任意画素移
動させて順次抽出し、ウィンドウ画像データをウィンド
ウの中心点の座標とともに出力する(602)。
【0019】学習画像データベース41(学習画像デー
タベース212)には、予め、種々の物体の画像が、図
5に示すように、入力ウィンドウ画像と同じサイズのウ
ィンドウに区切られ、ウィンドウ番号とウィンドウの中
心点の位置座標とともに格納されている。
【0020】類似ウィンドウ抽出部3は、画像分割部2
からウィンドウ画像データを入力すると、学習画像デー
タベース41(学習画像データベース212)の全ての
学習ウィンドウ画像データと差、例えば、各画素値の差
の二乗の和、を算出して、最も差の小さいものを抽出す
る。類似ウィンドウ抽出部3は、全ての入力ウィンドウ
に対してそれぞれ最も類似した学習ウィンドウを学習画
像データベース41から抽出すると、学習ウィンドウが
属する学習画像ごとにまとめて、図6に示すように、学
習ウィンドウ識別番号と、対応する入力ウィンドウの中
心座標の対で出力する(603)。ここで、学習ウィン
ドウ識別番号は、図5に示すように、属する学習画像番
号と学習画像中の位置を示す番号から成り、また、入力
ウィンドウの座標と対応付けることにより、各学習ウィ
ンドウは、ベクトルとみなすことができる。
【0021】基底選択部51は、学習ウィンドウ識別番
号と座標を入力すると、まず、同じ学習画像に属する学
習ウィンドウを抽出する(604)。次に、抽出した学
習ウィンドウから基底とする3つのウィンドウの組み合
わせを全て作る(605)。例えば、図7の画像3に属
する基底は、(3-3, 3-4, 3-11), (3-3, 3-4, 3-12),…
となる。
【0022】次に、各基底ウィンドウの組に対して、基
底ウィンドウが張る空間での基底以外のウィンドウの座
標を求める(606)。例えば、図7の基底(3-3, 3-4,
3-11)の基底ベクトルは、3-3を原点とすると、3-3, 3-
4から成るベクトル(119-40,86-100)=(79, -14)(ベクト
ルe1)と3-3, 3-11から成るベクトル(54-40, 179-100)=
(14, 79)(ベクトルe2)である。よって、基底以外のウ
ィンドウ3-5(198, 72)の3-3を原点としたときの座標(19
8-40, 72-100)=(158, -28)をベクトルe1とベクトルe2
で表すと、(2*ベクトルe1)+(0*ベクトルe2)とな
り、3-5の相対座標は、(2, 0)となる。
【0023】ここで、学習ウィンドウ座標算出部42
は、予め、全ての学習画像の全ての基底に対する各学習
ウィンドウの学習画像上での相対座標を、各ウィンドウ
の中心点の座標から算出して、学習ウィンドウ座標デー
タベース43(学習ウィンドウ座標データベース21
3)に格納している。例えば、図6における3-3と3-4と
3-5と3-11の学習画像上での中心座標は、図5に示した
ように、それぞれ(200, 40)(280, 40)(360, 40)(200, 1
20)であるので、3-3, 3-4, 3-11を基底としたときの基
底ベクトルは、3-3を原点とすると(80, 0)=ベクトルe
1, (0, 80)=ベクトルe2となる。よって、3-5:(360, 4
0)の、3-3を原点としたときの座標は(160, 0)となり、
相対座標は、(2*ベクトルe1)+(0*ベクトルe2)す
なわち、(2, 0)となる。
【0024】集計部53は、(606)で算出した座標
(座標A)と同じ基底・同じウィンドウによる座標を学習
ウィンドウ座標データベース43から抽出して(座標
B)、座標Aが座標Bの近傍にあれば(607)、その
基底の得点として1点加算する(608)。例えば、上
記の、基底(3-3, 3-4, 3-11)・ウィンドウ3-5の場合
は、座標Aと座標Bが一致するので、基底(3-3, 3-4, 3
-11)の得点に1点加算する。
【0025】図7に示すように、全ての画像の全ての基
底について(604)から(608)までの処理が終了
したら、その学習画像の全ての学習ウインドウについて
処理が終了したかを判定する(609)。次に、その学
習画像の全ての基底について処理が終了したかを判定す
る(610)。次に、全ての学習画像について処理が終
了したかを判定する(611)。
【0026】対象画像決定部6は、学習画像ごとに得点
を合計して最も高得点の学習画像の物体を入力画像の対
象物体とする(612)。
【0027】更に、姿勢算出部62は、その学習画像に
属する高得点の基底の入力画像上の座標と、学習画像デ
ータベース41に格納されている学習画像上の座標か
ら、物体の平行移動量と回転角を求める(613)。例
えば、図7の高得点の基底(3-3, 3-4, 3-11)の場合、3-
3の学習画像上の座標(200, 40)(図5)と、入力画像上の
座標(40, 100)(図4)から、平行移動量を(-160, 60)と
求め、回転角θは、3-4の学習画像上の座標(280, 40)
(図9)と入力画像上の座標(119, 86)(図10)から、
(数1)を解いて、θ=10度と求めることができる。
【0028】
【数1】
【0029】なお、得られた物体の平行移動量と回転角
は、I/Fユニットを介して出力端子215から出力さ
れる。
【0030】(実施の形態2)図8は、本発明の実施の
形態2における画像認識装置のブロック構成図を示す。
図8において、1は認識したい対象物の画像データを入
力する画像入力部、2は画像入力部1で入力した画像を
局所ウィンドウに分割して出力する画像分割部、3は画
像分割部2で分割した各入力ウィンドウ画像に対して類
似する学習ウィンドウをデータベースから抽出して学習
ウィンドウが属する画像ごとにまとめて、対応する入力
ウィンドウと共に出力する類似ウィンドウ抽出部、4は
認識したい物体のモデルを予め作成しておく学習手段、
41は種々の物体のモデル画像である学習画像を、画像
分割部2で作成する局所ウィンドウと同じサイズの局所
ウィンドウに分割して学習ウィンドウとして格納してい
る学習画像データベース、42は学習画像データベース
に格納されている各学習画像ごとに、任意の3つの学習
ウィンドウを抽出して、その3学習ウィンドウの位置座
標を基底としたときのそれ以外の学習ウィンドウの相対
座標を求める学習ウィンドウ座標算出部、43は学習ウ
ィンドウ座標算出部42で求めた相対座標データを格納
している学習ウィンドウ座標データベース、44は学習
画像データベース41中の同じ種類の複数の学習画像に
ついてそれらに属する各学習ウィンドウを代表的な一つ
の学習画像の同じ部分の学習ウィンドウと対応づけて格
納している同種画像情報データベース、5は類似ウィン
ドウ抽出部3で抽出した学習ウィンドウの、学習画像上
での相対位置と、対応する入力ウィンドウの入力画像上
での相対位置を比較して、一致するものの数を集計する
投票手段、50は同種画像情報データベース44に格納
されている同種画像情報に基いて類似ウィンドウ抽出部
3が出力する同一学習画像に属する学習ウィンドウを同
じ種類の代表的な1学習画像に含まれる学習ウィンドウ
に変換して出力する同種画像混合部、51は同種画像混
合部50が出力する同一種類の学習画像に属する学習ウ
ィンドウの中から、基底となる3つの学習ウィンドウの
組み合わせを全て抽出して、対応する入力ウィンドウと
共に基底学習ウィンドウ・基底入力ウィンドウとして出
力する基底選択部、52は基底選択部51から入力した
各基底について、同じ学習画像に属する他の学習ウィン
ドウの相対座標を、対応する入力ウィンドウの対応する
基底入力ウィンドウに対する入力画像上での相対座標で
表して、座標値と、学習ウィンドウ・基底学習ウィンド
ウと、対応する入力ウィンドウ・基底入力ウィンドウを
出力する入力ウィンドウ座標算出部、53は入力ウィン
ドウ座標算出部52から入力した学習ウィンドウ・基底
学習ウィンドウに対して学習ウィンドウ座標データベー
ス43に格納されている相対座標と入力ウィンドウ座標
算出部52から入力した座標とを比較して、一致するも
のの数を基底ごとに集計して基底と集計値を出力する集
計部、6は投票手段5の集計結果を受けて入力画像中の
対象物とその姿勢を決定する対象決定手段、61は集計
部53から入力した集計値のうち最大の値を持つ基底を
出力し、その基底が属する学習画像中の物体を入力画像
の物体であるとみなす対象画像決定部、62は対象画像
決定部61が選択した基底について、基底学習ウィンド
ウの学習画像上での位置と、基底入力ウィンドウの入力
画像上での位置とを比較して、入力画像中の対象の位置
と回転角を算出する姿勢算出部である。
【0031】以上のように構成された画像認識装置につ
いて、以下その動作を図9に示すフローチャートを用い
て説明する。
【0032】図4は入力画像の一例、図5は学習画像の
一例、図6は類似ウィンドウ抽出部3が出力するデータ
の一例、図7は集計部53が出力する集計結果の一例、
図10は学習画像データベース41に格納されている同
種画像の一例図、11は同種画像情報データベース44
に格納されている同種画像情報の一例である。
【0033】認識対象となる画像データが画像入力部1
から入力する(1101)。画像分割部2は、図4に示
すように、その画像から一定サイズのウィンドウを順次
抽出して、ウィンドウ画像データをウィンドウの中心点
の座標とともに出力する(1102)。
【0034】類似ウィンドウ抽出部3は、画像分割部2
からウィンドウ画像データを入力すると、学習画像デー
タベース41の全ての学習ウィンドウ画像データと差、
例えば、各画素値の差の二乗の和、を算出して、最も差
の小さいものを抽出する。学習画像データベース41に
は予め、種々の物体の画像が、図5に示すように、入力
ウィンドウ画像と同じサイズのウィンドウに区切られ、
ウィンドウ番号とウィンドウの中心点の位置座標ととも
に格納されている。類似ウィンドウ抽出部3は、全ての
入力ウィンドウに対してそれぞれ最も類似した学習ウィ
ンドウを学習画像データベース41から抽出すると、学
習ウィンドウが属する学習画像ごとにまとめて、図6に
示すように、学習ウィンドウ識別番号と、対応する入力
ウィンドウの中心座標の対で出力する(1103)。こ
こで、学習ウィンドウ識別番号は、図5に示すように、
属する学習画像番号と学習画像中の位置を示す番号から
成り、また、入力ウィンドウの座標と対応付けることに
より、各学習ウィンドウは、ベクトルとみなすことがで
きる。同種画像情報データベース44には、学習画像デ
ータベース41に格納されている同じ種類の物体の学習
画像について、各物体の同じ部分を含む学習ウィンドウ
同士を対応付けて、同種画像情報として格納してある。
例えば、図5に示す学習画像3と図10に示す学習画像
29は、横向のセダンの学習画像であり、学習画像3の
学習ウィンドウ3と学習画像29の学習ウィンドウ27
は、両方のセダンの後部ウィンドウを含む画像であるの
で、対応する学習ウィンドウとみなす。同様にして同種
画像情報データベース44には、図11に示すように、
学習画像3と学習画像29の学習ウィンドウの対応と、
同種の学習画像3、29、62・・・の代表画像が学習
画像3であるという情報が格納されている。
【0035】同種画像混合部50は、類似ウィンドウ抽
出部3から学習ウィンドウ識別番号と入力ウィンドウ座
標を入力すると、同種画像情報データベース44を検索
して、同種類の学習画像に属する学習ウィンドウを全
て、代表的な1つの学習画像に属する学習ウィンドウで
置換する(1104−1)。例えば、学習画像29の学
習ウィンドウ29-28は、図11の表に基づいて学習ウィ
ンドウ3-4に変換して、対応する入力ウィンドウ座標と
ともに出力する。基底選択部51は、学習ウィンドウ識
別番号と座標を入力すると、まず、同じ学習画像に属す
る学習ウィンドウを抽出する(1104−2)。
【0036】次に、抽出した学習ウィンドウから基底と
する3つのウィンドウの組み合わせを全て作る(110
5)。例えば、図6の画像3に属する基底は、(3-3, 3-
4, 3-11), (3-3, 3-4, 3-12), ・・・となる。
【0037】次に、各基底ウィンドウの組に対して、基
底ウィンドウが張る空間での基底以外のウィンドウの座
標を求める(1106)。例えば、図6の基底(3-3, 3-
4, 3-11)の基底ベクトルは、3-3を原点とすると、3-3,
3-4から成るベクトル(119-40, 86-100)=(79, -14)(=ベ
クトルe1)と3-3, 3-11から成るベクトル(54-40, 179-1
00)=(14, 79)(=ベクトルe2)である。よって、基底以外
のウィンドウ3-5(198,72)の3-3を原点としたときの座標
(198-40, 72-100)=(158, -28)をベクトルe1とベクトル
e2で表すと、(2*ベクトルe1)+(0*ベクトルe2)と
なり、3-5の相対座標は、(2, 0)となる。ここで学習ウ
ィンドウ座標算出部42は、予め、全ての学習画像の全
ての基底に対する各学習ウィンドウの学習画像上での相
対座標を、各ウィンドウの中心点の座標から算出して、
学習ウィンドウ座標データベース43に格納している。
例えば、図6における3-3と3-4と3-5と3-11の学習画像
上での中心座標は、図5に示したように、それぞれ(20
0, 40)(280, 40)(360, 40)(200, 120)であるので、3-3,
3-4, 3-11を基底としたときの基底ベクトルは、3-3を
原点とすると(80, 0)=1, (0, 80)=2となる。よって、3-
5:(360, 40)の、3-3を原点としたときの座標は(160, 0)
となり、相対座標は、(2*ベクトルe1)+(0*ベクトル
e2すなわち、(2, 0)となる。
【0038】集計部53は、(1106)で算出した座
標(座標A)と同じ基底・同じウィンドウによる座標を学
習ウィンドウ座標データベース43から抽出して(座標
B)、座標Aが座標Bの近傍にあれば(1107)、そ
の基底の得点として1点加算する(1108)。例え
ば、上記の、基底(3-3, 3-4, 3-11)・ウィンドウ3-5の
場合は、座標Aと座標Bが一致するので、基底(3-3, 3-
4, 3-11)の得点に1点加算する。図7に示すように、全
ての画像の全ての基底について(1104)から(11
08)までの処理が終了したら、、その学習画像の全て
の学習ウインドウについて処理が終了したかを判定する
(1109)。次に、その学習画像の全ての基底につい
て処理が終了したかを判定する(1110)。次に、全
ての学習画像について処理が終了したかを判定する(1
111)。
【0039】対象画像決定部6は、学習画像ごとに得点
を合計して最も高得点の学習画像の物体を入力画像の対
象物体とする(1112)。
【0040】更に、姿勢算出部62は、その学習画像に
属する高得点の基底の入力画像上の座標と、学習画像デ
ータベース41に格納されている学習画像上の座標か
ら、物体の平行移動量と回転角を求める(1113)。
例えば、図7の高得点の基底(3-3, 3-4, 3-11)の場合、
3-3の学習画像上の座標(200, 40)(図5)と、入力画像
上の座標(40, 100)(図4)から、平行移動量を(-160,
60)とすると、回転角θは、3-4の学習画像上の座標(28
0, 40)(図5)と入力画像上の座標(119, 86)(図4)
から、(数2)を解いて、θ=10度となる。
【0041】
【数2】
【0042】(実施の形態3)図12は本発明の実施の
形態3における画像認識装置のブロック構成図を示す。
図12において、1は認識したい対象物の画像データを
入力する画像入力部、2は画像入力部1で入力した画像
を局所ウィンドウに分割して出力する画像分割部、3は
画像分割部2で分割した各入力ウィンドウ画像に対して
類似する学習ウィンドウをデータベースから抽出して学
習ウィンドウが属する画像ごとにまとめて、それらの位
置座標を対応する入力ウィンドウの座標と共に出力する
類似ウィンドウ抽出部、4は認識したい物体のモデルを
予め作成しておく学習手段、41は種々の物体のモデル
画像である学習画像を、画像分割部2で作成する局所ウ
ィンドウと同じサイズの局所ウィンドウに分割して学習
ウィンドウとして格納するとともに、物体上の1点の座
標を注目点座標として格納している学習画像データベー
ス、5は類似ウィンドウ抽出部3で抽出した学習ウィン
ドウの、学習画像上での相対位置と、対応する入力ウィ
ンドウの入力画像上での相対位置を比較して、一致する
ものの数を集計する投票手段、54は類似ウィンドウ抽
出部3が出力する同一学習画像に属する学習ウィンドウ
の中から、2つの学習ウィンドウの組み合わせを全て抽
出して、対応する入力ウィンドウ座標と共に出力するウ
ィンドウ選択部、52−1はウィンドウ選択部54から
入力した各2学習ウィンドウについて、それが属する学
習画像の注目点座標を学習画像データベース41から入
力して、2学習ウィンドウの座標と注目点座標との位置
関係と対応する2入力ウィンドウの座標から入力画像中
の物体の注目点座標を算出して、学習画像の注目点座標
と共に出力する注目点座標算出部、52−2はウィンド
ウ選択部54から入力した2学習ウィンドウの座標が作
るベクトルと、対応する2入力ウィンドウの座標が作る
ベクトルとのなす角を算出して出力するベクトル角算出
部、53は注目点座標算出部52−1から入力した座標
と、ベクトル角算出部52−2から入力した座標を組に
して同じ値を持つ組の数を画像ごとに集計して出力する
集計部、6は投票手段5の集計結果を受けて入力画像中
の対象物とその姿勢を決定する対象決定手段、63は集
計部53から入力した集計値のうち最大の値を持つもの
の学習画像中の物体を入力画像の物体であるとして、そ
の組の座標となす角から入力画像中の対象の位置と回転
角を決定する対象姿勢決定部である。
【0043】以上のように構成された画像認識装置につ
いて、以下その動作を図12のフローチャートを用いて
説明する。図4は入力画像の一例、図5は学習画像の一
例、図6は類似ウィンドウ抽出部3が出力するデータの
一例である。
【0044】認識対象となる画像データが画像入力部1
から入力されると(1401)、画像分割部2は図4に
示すように、その画像から一定サイズのウィンドウを順
次抽出して、ウィンドウ画像データをウィンドウの中心
点の座標とともに出力する(1402)。
【0045】類似ウィンドウ抽出部3は、画像分割部2
からウィンドウ画像データを入力すると、学習画像デー
タベース41の全ての学習ウィンドウ画像データと差、
例えば、各画素値の差の二乗の和、を算出して、最も差
の小さいものを抽出する。学習画像データベース41に
は予め、種々の物体の画像が、図5に示すように、入力
ウィンドウ画像と同じサイズのウィンドウに区切られ、
ウィンドウ番号とウィンドウの中心点の位置座標ととも
に格納されている。また同時に、学習画像ごとに物体上
の任意の1点の座標が注目点座標として格納されてい
る。類似ウィンドウ抽出部3は、全ての入力ウィンドウ
に対してそれぞれ最も類似した学習ウィンドウを学習画
像データベース41から抽出すると、学習ウィンドウが
属する学習画像ごとにまとめて、図6に示すように、学
習ウィンドウ識別番号と、対応する入力ウィンドウの中
心座標の対で出力する(1403)。ここで、学習ウィ
ンドウ識別番号は、図5に示すように、属する学習画像
番号と学習画像中の位置を示す番号から成っている。
【0046】ウィンドウ選択部54は、学習ウィンドウ
識別番号と座標を入力すると、まず、同じ学習画像に属
する学習ウィンドウを抽出する(1404)。次に、抽
出した学習ウィンドウから2つのウィンドウの組み合わ
せを全て作る(1405)。例えば、図6の画像3から
は、(3-3, 3-4), (3-3, 3-5), (3-3, 3-11) ・・を抽出
する。注目点座標算出部52−1は、ウィンドウ選択部
51から入力した各2ウィンドウに対して、2学習ウィ
ンドウの座標と学習画像の注目点座標を学習画像データ
ベース41から抽出して、それらの座標間の関係と、対
応する入力ウィンドウの座標から入力画像の注目点座標
を求める(1406)。例えば、図7のウィンドウ(3-
3, 3-4)について、画像3の注目点座標を(320, 160)と
すると、図5より、3-3の学習画像上の座標は(200, 4
0)、3-4の学習画像上の座標は(280, 40)であるから、3-
3と注目点の距離の二乗は(320-200)2+(160-40)2=2880
0、3-4と注目点の距離の二乗は(320-280)2+(160-40)2=1
6000、となる。図6より、3-3と対応する入力ウィンド
ウの入力画像上の座標は(40, 100)、3-4と対応する入力
ウィンドウの入力画像上の座標は(119, 86)であるか
ら、以上より、入力画像の注目点をx, yとすると、x, y
は、
【0047】
【数3】
【0048】より求めることができる。ベクトル角算出
部52−2は、ウィンドウ選択部54から2ウィンドウ
の組を入力すると、まず、その2ウィンドウの学習画像
上の座標を学習画像データベース41から抽出して、ベ
クトルを作成する。次に、対応する入力画像上の座標か
ら作ったベクトルとのなす角を算出して出力する(14
07)。例えば、図7の(3-3, 3-4)の組の場合、学習画
像上の座標(200, 40)(280, 40)(図5)からベクトル(8
0, 0)入力画像上の座標(40, 100)(119, 86)(図4)か
らベクトル(79, -14)を得て、なす角
【0049】
【数4】
【0050】より、θ=10度を得る。集計部53は、注
目点座標算出部52−1から入力した座標と、ベクトル
角算出部52−2から入力した角度を1つの組にして、
同じ値を持つ組の数を画像ごとに集計する(140
8)。
【0051】全ての画像の全てのウィンドウについて
(1404)から(1408)までの処理が終了したら
(1409, 1411)、対象姿勢決定部63は、最
も高得点の学習画像の物体を入力画像の対象物体とし、
高得点となった値の組の座標と角度を入力画像中の物体
の位置と回転角とする(1412, 1413)。
【0052】(実施の形態4)図14は、本発明の実施
の形態4における画像認識装置のブロック構成図を示
す。図14において、1は認識したい対象物の画像デー
タを入力する画像入力部、2は画像入力部1で入力した
画像を局所ウィンドウに分割して出力する画像分割部、
3は画像分割部2で分割した各入力ウィンドウ画像に対
して類似する学習ウィンドウをデータベースから抽出し
て学習ウィンドウが属する画像ごとにまとめて、それら
の位置座標を対応する入力ウィンドウの座標と共に出力
する類似ウィンドウ抽出部、4は認識したい物体のモデ
ルを予め作成しておく学習手段、41は種々の物体のモ
デル画像である学習画像を、画像分割部2で作成する局
所ウィンドウと同じサイズの局所ウィンドウに分割して
学習ウィンドウとして格納するとともに、物体上の1点
の座標を注目点座標として格納している学習画像データ
ベース、44は学習画像データベース41中の同じ種類
の複数の学習画像についてそれらに属する各学習ウィン
ドウを代表的な一つの学習画像の同じ部分の学習ウィン
ドウと対応づけて格納している同種画像情報データベー
ス、5は類似ウィンドウ抽出部3で抽出した学習ウィン
ドウの、学習画像上での相対位置と、対応する入力ウィ
ンドウの入力画像上での相対位置を比較して、一致する
ものの数を集計する投票手段、50は同種画像情報デー
タベース44に格納されている同種画像情報に基いて類
似ウィンドウ抽出部3が出力する同一学習画像に属する
学習ウィンドウを同じ種類の代表的な1学習画像に含ま
れる学習ウィンドウに変換して出力する同種画像混合
部、54は類似ウィンドウ抽出部3が出力する同一学習
画像に属する学習ウィンドウの中から、2つの学習ウィ
ンドウの組み合わせを全て抽出して、対応する入力ウィ
ンドウ座標と共に出力するウィンドウ選択部、52−1
はウィンドウ選択部54から入力した各2学習ウィンド
ウについて、それが属する学習画像の注目点座標を学習
画像データベース41から入力して、2学習ウィンドウ
の座標と注目点座標との位置関係と対応する2入力ウィ
ンドウの座標から入力画像中の物体の注目点座標を算出
して、学習画像の注目点座標と共に出力する注目点座標
算出部、52−2はウィンドウ選択部54から入力した
2学習ウィンドウの座標が作るベクトルと、2入力ウィ
ンドウの座標が作るベクトルとのなす角を算出して出力
するベクトル角算出部、53は注目点座標算出部52−
1から入力した座標と、ベクトル角算出部52−2から
入力した座標を組にして同じ値を持つ組の数を画像ごと
に集計して出力する集計部、6は投票手段5の集計結果
を受けて入力画像中の対象物とその姿勢を決定する対象
決定手段で、63は集計部53から入力した集計値のう
ち最大の値を持つものの学習画像中の物体を入力画像の
物体であるとして、その組の座標となす角から入力画像
中の対象の位置と回転角を決定する対象姿勢決定部であ
る。
【0053】以上のように構成された画像認識装置につ
いて、以下その動作を図15のフローチャートを用いて
説明する。図4は入力画像の一例、図5は学習画像の一
例、図7は類似ウィンドウ抽出部3が出力するデータの
一例、図10は学習画像データベース41に格納されて
いる同種画像の一例、図11は同種画像情報データベー
ス44に格納されている同種画像情報の一例である。
【0054】認識対象となる画像データが画像入力部1
から入力される(1501)。画像分割部2は、図4に
示すように、その画像から一定サイズのウィンドウを順
次抽出して、ウィンドウ画像データをウィンドウの中心
点の座標とともに出力する(1502)。
【0055】類似ウィンドウ抽出部3は、画像分割部2
からウィンドウ画像データを入力すると、学習画像デー
タベース41の全ての学習ウィンドウ画像データと差、
例えば、各画素値の差の二乗の和、を算出して、最も差
の小さいものを抽出する。学習画像データベース41に
は予め、種々の物体の画像が、図5に示すように、入力
ウィンドウ画像と同じサイズのウィンドウに区切られ、
ウィンドウ番号とウィンドウの中心点の位置座標ととも
に格納されている。また同時に、学習画像ごとに物体上
の任意の1点の座標が注目点座標として格納されてい
る。類似ウィンドウ抽出部3は、全ての入力ウィンドウ
に対してそれぞれ最も類似した学習ウィンドウを学習画
像データベース41から抽出すると、学習ウィンドウが
属する学習画像ごとにまとめて、図7に示すように、学
習ウィンドウ識別番号と、対応する入力ウィンドウの中
心座標の対で出力する(1503)。ここで、学習ウィ
ンドウ識別番号は、図5に示すように、属する学習画像
番号と学習画像中の位置を示す番号から成っている。同
種画像情報データベース44には、学習画像データベー
ス41に格納されている同じ種類の物体の学習画像につ
いて、各物体の同じ部分を含む学習ウィンドウ同士を対
応付けて、同種画像情報として格納してある。例えば、
図5に示す学習画像3と図12に示す学習画像29は、
横向のセダンの学習画像であり、学習画像3の学習ウィ
ンドウ3と学習画像29の学習ウィンドウ27は、両方
のセダンの後部ウィンドウを含む画像であるので、対応
する学習ウィンドウとみなす。同様にして同種画像情報
データベース44には、図11に示すように、学習画像
3と学習画像29の学習ウィンドウの対応と、同種の学
習画像3、29、62・・ の代表画像が学習画像3で
あるという情報が格納されている。
【0056】同種画像混合部50は、類似ウィンドウ抽
出部3から学習ウィンドウ識別番号と入力ウィンドウ座
標を入力すると、同種画像情報データベース44を検索
して、同種類の学習画像に属する学習ウィンドウを全
て、代表的な1つの学習画像に属する学習ウィンドウで
置換する(1504−1)。例えば、学習画像29の学
習ウィンドウ29-28は、図11に基づいて学習ウィンド
ウ3-4に変換して、対応する入力ウィンドウ座標ととも
に出力する。
【0057】ウィンドウ選択部54は、学習ウィンドウ
識別番号と座標を入力すると、まず、同じ学習画像に属
する学習ウィンドウを抽出する(1504−2)。
【0058】次に、抽出した学習ウィンドウから2つの
ウィンドウの組み合わせを全て作る(1505)。例え
ば、図7の画像3からは、(3-3, 3-4), (3-3, 3-5), (3
-3,3-11) ・・を抽出する。
【0059】注目点座標算出部52−1は、ウィンドウ
選択部54から入力した各2ウィンドウに対して、2学
習ウィンドウの座標と学習画像の注目点座標を学習画像
データベース41から抽出して、それらの座標間の関係
と、対応する入力ウィンドウの座標から入力画像の注目
点座標を求める(1506)。例えば、図6のウィンド
ウ(3-3, 3-4)について、画像3の注目点座標を(320, 16
0)とすると、図5より、3-3の学習画像上の座標は(200,
40)、3-4の学習画像上の座標は(280, 40)であるから、
3-3と注目点の距離の二乗は(320-200)2+(160-40)2=2880
0、3-4と注目点の距離の二乗は(320-280)2+(160-40)2=1
6000、となる。図6より、3-3と対応する入力ウィンド
ウの入力画像上の座標は(40, 100)、3-4と対応する入力
ウィンドウの入力画像上の座標は(119, 86)であるか
ら、以上より、入力画像の注目点をx, yとすると、x, y
は、
【0060】
【数5】
【0061】より求めることができる。ベクトル角算出
部52−2は、ウィンドウ選択部54から2ウィンドウ
の組を入力すると、まず、その2ウィンドウの学習画像
上の座標を学習画像データベース41から抽出して、ベ
クトルを作成する。次に、対応する入力画像上の座標か
ら作ったベクトルとのなす角を算出して出力する。(150
7)例えば、図7の(3-3,3-4)の組の場合、学習画像上の
座標(200, 40)(280, 40)(図5)からベクトル(80,0)入力
画像上の座標(40, 100)(119, 86)(図4)からベクトル(7
9, -14)を得て、なす角
【0062】
【数6】
【0063】より、θ=10度を得る。集計部53は、注
目点座標算出部52−1から入力した座標と、ベクトル
角算出部52−2から入力した角度を1つの組にして、
同じ値を持つ組の数を画像ごとに集計する(150
8)。
【0064】全ての画像の全てのウィンドウについて
(1504)から(1508)までの処理が終了したら
(1509, 1511)、対象姿勢決定部63は、最
も高得点の学習画像の物体を入力画像の対象物体とし、
高得点となった値の組の座標と角度を入力画像中の物体
の位置と回転角とする(1512, 1513)。
【0065】
【発明の効果】以上のように本発明によれば、入力画像
中の物体が、学習画像の物体と比較して平行移動や画像
面内回転移動している場合にも、対象を認識でき、その
平行移動量や回転角を算出することができる。
【0066】また、学習画像に同種の物体の画像が複数
ある場合でも、入力画像中の物体の種類や平行移動量・
回転角を推定することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における画像認識装置の
ブロック構成図
【図2】本発明の実施の形態1におけるコンピュータに
よる画像認識装置のブロック構成図
【図3】本発明の実施の形態1における処理の流れを示
すフローチャート
【図4】本発明の実施の形態における入力画像の一例を
示す図
【図5】本発明の実施の形態における学習画像データベ
ースが保管している学習画像データの一例を示す図
【図6】本発明の実施の形態における類似ウィンドウ抽
出部が出力する入力ウィンドウと学習ウィンドウの対応
の一例を示す図
【図7】集計部が出力する集計の一例を示す図
【図8】本発明の実施の形態2における画像認識装置の
ブロック構成図
【図9】本発明の実施の形態2における処理の流れを示
すフローチャート
【図10】本発明の実施の形態における画像データベー
ス中の同種画像の一例を示す図
【図11】本発明の実施の形態における同種画像情報デ
ータベースが保管している同種画像情報の一例を示す図
【図12】本発明の実施の形態3における画像認識装置
のブロック構成図
【図13】本発明の実施の形態3における処理の流れを
示すフローチャート
【図14】本発明の実施の形態4における画像認識装置
のブロック構成図
【図15】本発明の実施の形態4における処理の流れを
示すフローチャート
【図16】従来の画像認識装置の一例を示すブロック図
【符号の説明】
1 画像入力部 2 画像分割部 3 類似ウインドウ抽出部 4 学習手段 5 投票手段 6 対象決定手段 41 学習画像データベース 42 学習ウインドウ座標計算部 43 学習ウインドウ座標データベース 44 同種画像情報データベース 50 同種画像混合部 51 基底選択部 52 入力ウインドウ座標算出部 52−1 注目点座標算出部 52−2 ベクトル角算出部 53 集計部 54 ウインドウ選択部 61 対象画像決定部 62 姿勢算出部 63 対象姿勢決定部 201 コンピュータ 202 CPU 203 メモリ 204 キーボード/ディスプレイ 205 FDユニット 206〜208 I/Fユニット 209 CPUバス 210 カメラ 211 画像データベース 212 学習画像データベース 213 学習ウインドウ座標データベース 214 同種画像情報データベース 215 出力端子
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平11−306353(JP,A) 局所固有空間手法による金属物体の安 定認識,電子情報通信学会論文誌,日 本,1997年12月,Vol.J80−D−I I No.12,pp.3147−3154 NC95−26 ダイナミックリンクによ る画像の部分どうしのマッチング,電子 情報通信学会技術研究報告,日本,1995 年 6月30日,Vol.95 No.135, pp.53−60 (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 G06T 1/00

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 予め採取しておいた大量の学習画像デー
    タの中から、入力画像に近い画像を探索して、入力画像
    中の対象物体を認識する装置であって、入力した画像を
    局所領域に分割する画像分割手段と、様々な物体の画像
    を前記画像分割手段での分割サイズと同じサイズのウィ
    ンドウに分割して画像上での位置情報と共に学習ウィン
    ドウとして格納している学習画像データベースと、前記
    画像分割手段で分割したそれぞれの入力ウィンドウに対
    して類似した学習ウィンドウを抽出して入力ウィンドウ
    と学習ウィンドウの対を学習ウィンドウが属する学習画
    像ごとにまとめて出力する類似ウィンドウ抽出手段と、
    前記学習画像データベースに格納されている同じ学習画
    像に属するウィンドウについて任意の3ウィンドウを基
    底とし学習画像上での位置関係から算出した座標と基底
    の組を学習画像ごとに学習ウィンドウ座標データベース
    へ格納する学習手段と、前記類似ウィンドウ抽出手段か
    ら入力した同じ学習画像に属する学習ウィンドウについ
    て基底となる3ウィンドウの組み合わせを全て抽出し、
    入力した基底と同じ学習画像に属するウィンドウの基底
    が張る空間での座標を基底とウィンドウの入力画像上で
    の位置関係から求め、算出した座標と同じ基底・ウィン
    ドウによる前記学習ウィンドウデータベースでの座標と
    を比べて一致するものの数を集計する投票手段と、前記
    集計値の最も高い学習画像を選択する対象決定手段とを
    含む画像認識装置。
  2. 【請求項2】 学習手段は、予め同種の物体の学習画像
    が複数ある場合にそれらの各学習ウィンドウをその中の
    代表的な1つの学習画像中の学習ウィンドウと対応付け
    て格納している同種画像情報データベースを有し、投票
    手段は前記同種画像情報データベースの同種画像情報に
    いて前記類似ウィンドウ抽出手段から入力した同種
    の物体の学習画像に属する学習ウィンドウを代表的な一
    つの学習画像の学習ウィンドウに変換し、入力した同種
    の画像に属する学習ウィンドウについて基底となる3ウ
    ィンドウの組み合わせを全て抽出する請求項1記載の画
    像認識装置。
  3. 【請求項3】 予め採取しておいた大量の学習画像デー
    タの中から、入力画像に近い画像を探索して、入力画像
    中の対象物体を認識する装置であって、入力した画像を
    局所領域に分割する画像分割手段と、前記画像分割手段
    で分割したそれぞれの入力ウィンドウに対して類似した
    学習ウィンドウを抽出して入力ウィンドウと学習ウィン
    ドウの対を学習ウィンドウが属する学習画像ごとにまと
    めて出力する類似ウィンドウ抽出手段と、様々な物体の
    画像を前記画像分割部での分割サイズと同じサイズのウ
    ィンドウに分割して画像上での位置情報と共に学習ウィ
    ンドウとして格納し同時に学習画像ごとに任意の一点を
    画像中の物体の位置を示す注目点としてその位置情報を
    格納している学習画像データベースを持つ学習手段と、
    前記類似ウィンドウ抽出手段から入力した同じ学習画像
    に属する学習ウィンドウについて2ウィンドウの組み合
    わせを全て抽出するウィンドウ選択部と、前記ウィンド
    ウ選択部で抽出したウィンドウの組ごとに注目点の入力
    画像上での位置座標を2入力ウィンドウの位置座標と前
    記学習画像データベースから入力した同じウィンドウ・
    注目点の学習画像上での位置関係から推定し、抽出した
    各ウィンドウの組について入力画像上での位置座標から
    求めた2ウィンドウが成すベクトル前記学習画像デー
    タベースに格納されている同じウィンドウの学習画像上
    での位置座標から求めたベクトとのなす角を算出
    し、入力した座標値と前記角度とを1つの組にして同じ
    値を持つウィンドウの組の数を学習画像ごとに集計する
    投票手段と、前記集計値の最も高い学習画像を選択する
    対象決定手段とを含む画像認識装置。
  4. 【請求項4】 学習部は、同種の物体の学習画像が複数
    ある場合にそれらの各学習ウィンドウをその中の代表的
    な一つの学習画像中の学習ウィンドウと対応付けて格納
    している同種画像情報データベースを有し、投票手段は
    前記同種画像情報データベースの同種画像情報に基
    て前記類似ウィンドウ抽出部から入力した同種の物体の
    学習画像に属する学習ウィンドウを代表的な一つの学習
    画像に属する学習ウィンドウに変換して出力する同種画
    像混合部と、前記同種画像混合部から入力した同種の画
    像に属する学習ウィンドウについて2ウィンドウの組み
    合わせを全て抽出する請求項3記載の画像認識装置。
  5. 【請求項5】 予め採取しておいた大量の学習画像デー
    タの中から、入力画像に近い画像を探索して、入力画像
    中の対象物体を認識する方法であって、入力した画像を
    局所領域に分割する画像分割ステップと、様々な物体の
    画像を前記画像分割手段での分割サイズと同じサイズの
    ウィンドウに分割して画像上での位置情 報と共に学習ウ
    ィンドウとして学習画像データベースに格納する学習画
    像データベース格納ステップと、前記画像分割ステップ
    で分割したそれぞれの入力ウィンドウに対して類似した
    学習ウィンドウを抽出して入力ウィンドウと学習ウィン
    ドウの対を学習ウィンドウが属する学習画像ごとにまと
    めて出力する類似ウィンドウ抽出ステップと、前記学習
    画像データベースに格納されている同じ学習画像に属す
    るウィンドウについて任意の3ウィンドウを基底とし学
    習画像上での位置関係から算出した座標と基底の組を学
    習画像ごとに学習ウィンドウ座標データベースへ格納す
    る学習ステップと、前記類似ウィンドウ抽出ステップか
    ら入力した同じ学習画像に属する学習ウィンドウについ
    て基底となる3ウィンドウの組み合わせを全て抽出し、
    入力した基底と同じ学習画像に属するウィンドウの基底
    が張る空間での座標を基底とウィンドウの入力画像上で
    の位置関係から求め、算出した座標と同じ基底・ウィン
    ドウによる前記学習ウィンドウデータベースでの座標と
    を比べて一致するものの数を集計する投票ステップと、
    前記集計値の最も高い学習画像を選択する対象決定ステ
    ップとを含む画像認識方法。
  6. 【請求項6】 予め採取しておいた大量の学習画像デー
    タの中から、入力画像に近い画像を探索して、入力画像
    中の対象物体を認識する方法であって、入力した画像を
    局所領域に分割する画像分割ステップと、前記画像分割
    手段で分割したそれぞれの入力ウィンドウに対して類似
    した学習ウィンドウを抽出して入力ウィンドウと学習ウ
    ィンドウの対を学習ウィンドウが属する学習画像ごとに
    まとめて出力する類似ウィンドウ抽出ステップと、様々
    な物体の画像を前記画像分割部での分割サイズと同じサ
    イズのウィンドウに分割して画像上での位置情報と共に
    学習ウィンドウとして格納し同時に学習画像ごとに任意
    の一点を画像中の物体の位置を示す注目点としてその位
    置情報を格納している学習画像データベースを持つ学習
    ステップと、前記類似ウィンドウ抽出ステップから入力
    した同じ学習画像に属する学習ウィンドウについて2ウ
    ィンドウの組み合わせを全て抽出するウィンドウ選択ス
    テップと、前記ウィンドウ選択ステップで抽出したウィ
    ンドウの組ごとに注目点の入力画像上での位置座標を2
    入力ウィンドウの位置座標と前記学習画像データベース
    から入力した同じウィンドウ・注目点の学習画像上での
    位置関係から推定し、抽出した各ウィンドウの組につい
    て入力画像上での位置座標から 求めた2ウィンドウが成
    すベクトルと前記学習画像データベースに格納されてい
    る同じウィンドウの学習画像上での位置座標から求めた
    ベクトルとのなす角度を算出し、入力した座標値と前記
    角度とを1つの組にして同じ値を持つウィンドウの組の
    数を学習画像ごとに集計する投票ステップと、前記集計
    値の最も高い学習画像を選択する対象決定ステップとを
    含む画像認識装置。
  7. 【請求項7】 コンピュータにより画像認識を行うプロ
    グラムであって、入力した画像を局所領域に分割する画
    像分割ステップと、様々な物体の画像を前記画像分割手
    段での分割サイズと同じサイズのウィンドウに分割して
    画像上での位置情報と共に学習ウィンドウとして学習画
    像データベースに格納する学習画像データベース格納ス
    テップと、前記画像分割ステップで分割したそれぞれの
    入力ウィンドウに対して類似した学習ウィンドウを抽出
    して入力ウィンドウと学習ウィンドウの対を学習ウィン
    ドウが属する学習画像ごとにまとめて出力する類似ウィ
    ンドウ抽出ステップと、前記学習画像データベースに格
    納されている同じ学習画像に属するウィンドウについて
    任意の3ウィンドウを基底とし学習画像上での位置関係
    から算出した座標と基底の組を学習画像ごとに学習ウィ
    ンドウ座標データベースへ格納する学習ステップと、前
    記類似ウィンドウ抽出ステップから入力した同じ学習画
    像に属する学習ウィンドウについて基底となる3ウィン
    ドウの組み合わせを全て抽出し、入力した基底と同じ学
    習画像に属するウィンドウの基底が張る空間での座標を
    基底とウィンドウの入力画像上での位置関係から求め、
    算出した座標と同じ基底・ウィンドウによる前記学習ウ
    ィンドウデータベースでの座標とを比べて一致するもの
    の数を集計する投票ステップと、前記集計値の最も高い
    学習画像を選択する対象決定ステップとを含む画像認識
    プログラムを記録した記録媒体。
JP11045498A 1998-04-21 1998-04-21 画像認識方法及び画像認識装置 Expired - Fee Related JP3438580B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11045498A JP3438580B2 (ja) 1998-04-21 1998-04-21 画像認識方法及び画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11045498A JP3438580B2 (ja) 1998-04-21 1998-04-21 画像認識方法及び画像認識装置

Publications (2)

Publication Number Publication Date
JPH11306354A JPH11306354A (ja) 1999-11-05
JP3438580B2 true JP3438580B2 (ja) 2003-08-18

Family

ID=14536131

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11045498A Expired - Fee Related JP3438580B2 (ja) 1998-04-21 1998-04-21 画像認識方法及び画像認識装置

Country Status (1)

Country Link
JP (1) JP3438580B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4387552B2 (ja) 2000-04-27 2009-12-16 富士通株式会社 画像照合処理システム
JP5759161B2 (ja) * 2010-12-16 2015-08-05 キヤノン株式会社 物体認識装置、物体認識方法、学習装置、学習方法、プログラム、および情報処理システム
US9600745B2 (en) * 2011-03-17 2017-03-21 Nec Corporation Image recognition system, image recognition method, and non-transitory computer readable medium storing image recognition program
CN110062269A (zh) 2018-01-18 2019-07-26 腾讯科技(深圳)有限公司 附加对象显示方法、装置及计算机设备
JP6872670B2 (ja) * 2019-07-04 2021-05-19 株式会社日立ハイテク 寸法計測装置、寸法計測プログラム及び半導体製造システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NC95−26 ダイナミックリンクによる画像の部分どうしのマッチング,電子情報通信学会技術研究報告,日本,1995年 6月30日,Vol.95 No.135,pp.53−60
局所固有空間手法による金属物体の安定認識,電子情報通信学会論文誌,日本,1997年12月,Vol.J80−D−II No.12,pp.3147−3154

Also Published As

Publication number Publication date
JPH11306354A (ja) 1999-11-05

Similar Documents

Publication Publication Date Title
EP3028184B1 (en) Method and system for searching images
US20060029276A1 (en) Object image detecting apparatus, face image detecting program and face image detecting method
JP5963609B2 (ja) 画像処理装置、画像処理方法
CN110069989B (zh) 人脸图像处理方法及装置、计算机可读存储介质
WO2020007177A1 (zh) 计算机执行的报价方法、报价装置、电子设备及存储介质
CN111696080B (zh) 一种基于静态纹理的人脸欺诈检测方法、系统及存储介质
WO2006129791A1 (ja) 画像処理システム、3次元形状推定システム、物体位置姿勢推定システム及び画像生成システム
JPH09134432A (ja) パターン認識方法
CN108304476A (zh) 一种基于不确定数据表的用户画像数据整合方法及系统
CN109934129B (zh) 一种人脸特征点定位方法、装置、计算机设备及存储介质
JP3438580B2 (ja) 画像認識方法及び画像認識装置
CN109657083B (zh) 纺织品图片特征库的建立方法和装置
CN117523271A (zh) 一种基于度量学习的大规模家纺图像检索方法、装置、设备及介质
Sameki et al. ICORD: Intelligent Collection of Redundant Data-A Dynamic System for Crowdsourcing Cell Segmentations Accurately and Efficiently.
CN116563588A (zh) 图像聚类方法、装置、电子设备及存储介质
CN103020631A (zh) 基于星型模型的人体运动识别方法
CN103034859B (zh) 一种获取姿势模型的方法及装置
US11748451B2 (en) Machine learning techniques for differentiability scoring of digital images
CN114677423A (zh) 一种室内空间全景深度确定方法及相关设备
JP3680658B2 (ja) 画像認識方法及び画像認識装置
Zhang et al. Multi-scale template matching with scalable diversity similarity in an unconstrained environment
CN113763313A (zh) 文本图像的质量检测方法、装置、介质及电子设备
CN114119506B (zh) 基于背景信息的图像显著性检测方法
JP2018156544A (ja) 情報処理装置及びプログラム
Huang et al. Adaptive pixel pair evaluation method for image matting

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080613

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090613

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100613

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees