JP2005063307A - 画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム - Google Patents

画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム Download PDF

Info

Publication number
JP2005063307A
JP2005063307A JP2003295358A JP2003295358A JP2005063307A JP 2005063307 A JP2005063307 A JP 2005063307A JP 2003295358 A JP2003295358 A JP 2003295358A JP 2003295358 A JP2003295358 A JP 2003295358A JP 2005063307 A JP2005063307 A JP 2005063307A
Authority
JP
Japan
Prior art keywords
type
image
feature
vector
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003295358A
Other languages
English (en)
Inventor
Sadataka Akahori
貞登 赤堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2003295358A priority Critical patent/JP2005063307A/ja
Publication of JP2005063307A publication Critical patent/JP2005063307A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】 画像に含まれるオブジェクトの種類を自動的に精度よく識別する。
【解決手段】 全体画像Pをオブジェクト毎に領域分割した複数のオブジェクト領域ORと、全体画像Pを設定画素数からなる、オブジェクト領域ORより小さい多数の領域に分割した複数のブロック領域BRとを生成する。そして、生成した各ブロック領域BRから複数の特徴量を抽出して、複数の特徴量をベクトル成分とする複数の特徴ベクトルCB1〜CB3を生成する。その後、生成された複数の特徴ベクトルCB1〜CB3毎にブロック領域BRの種類の候補を識別し、種類の候補に基づいてブロック領域BRの種類を決定する。そして、決定したブロック領域BRの種類をオブジェクト領域OR毎に集計し、集計された結果を用いてオブジェクトの種類を識別する。
【識別図】 図1

Description

本発明は、画像の種類を自動的に識別する画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラムに関するものである。
情報の内容識別、分類、検索等の手法として、従来からのクラスタリング法等に代わるものとして、自己組織化マップを利用した手法が用いられている。自己組織化マップとは、複数の多次元ベクトル(結合荷重ベクトル)が2次元的に配されたマップであり、この自己組織化マップでは、予め多数の情報を学習することにより、互いに類似する各多次元ベクトルがそれぞれ近い位置に配置されるように構成されている。
学習後の自己組織化マップを用いれば、複数の入力情報について、その各々の特徴を示すベクトルと最も類似度の高い結合荷重ベクトル(勝者ベクトル)を自己組織化マップ上から探索し、該入力情報を自己組織化マップ上のその勝者ベクトルの位置に写像することにより、情報を2次元マップ状に一覧表示すること等が可能となる(たとえば特許文献1および2参照。)。このような一覧表示では、類似の特徴を有する情報(たとえば類似の画像や類似の商品情報等)が互いに近くに配置され表示されることになるので、視覚的に捉え易く一覧性がよい。
また、学習後の自己組織化マップにおいて特に類似の傾向が強いベクトルが集まった複数の島状の領域をクラスタとして定め、入力情報の特徴を示すベクトルと最も類似度の高い勝者ベクトルがいずれのクラスタに属するかを調べることにより、入力情報の分類や優先順位付けを行う手法も提案されている(たとえば特許文献3参照。)。
また、予めクラス分けされいずれのクラスに属するかがわかっている情報を学習させる「教師あり学習」と自己組織化マップを組み合せた「修正対向伝搬ネットワーク(Modified CounterPropagation;MCP)」という手法も知られている(たとえば、非特許文献1参照。)。この手法では、自己組織化マップと同じ大きさの2次元の「頻度マップ」がクラスごとに用意され、自己組織化マップの学習と並行して、各クラスごとに、自己組織化マップ上の各点に勝者ベクトルが現れる頻度を示す頻度マップの学習が行われる。これにより、学習終了後には、互いに類似するベクトルに対応する点が互いに近い位置に配置された自己組織化マップと、自己組織化マップ上の各点における各クラス情報の出現確率を示した確率分布マップとが得られることとなるので、入力情報の特徴を示すベクトルと最も類似度の高い勝者ベクトルを自己組織化マップ上から探索し、さらに確率分布マップにおける対応点を参照することにより、入力情報がいずれのクラスに属する情報であるのかを識別することが可能となる。
特開2002−41545号公報 特開2001−337953号公報 特開2001−306612号公報 徳高、岸田、藤村、「自己組織化マップの応用−多次元情報の2次元可視化」、海文堂、1999年、p.63−73
ところで、上述した自己組織化マップ等の使用は、画像の種類識別にも応用することができる。たとえば、上記の修正対向伝搬ネットワークの手法を用いれば、予め画像の種類(上記の「クラス」に相当)、すなわち「空」や「木」の画像であることがわかっている多数の画像の特徴ベクトルを学習して、自己組織化マップと対応する種類のマップ(すなわち各種類の確率分布マップ)とを作成しておくことにより、未知の入力画像の種類を識別することができる。
このように、画像を自己組織化マップにより分類するときには、画像から複数の特徴量を抽出し、抽出した特徴量を自己組織化マップに入力することにより、画像の種類を識別することが考えられる。一般的に画像には多くの情報を含むものであるため、正確に画像の識別を行うためには、画像から多くの特徴量を抽出することが好ましいが、1つの自己組織化マップで分類しようとすると、様々な特徴量が詰め込まれすぎて逆に混乱を招いてしまう。たとえば、色の特徴だけで自己組織化マップを作成した場合、色だけが類似度の尺度となるため、「空」や「草木」などの画像はある程度まとまった位置にマップされるが、色とテクスチャの特徴で自己組織化マップを作成した場合、色が似ていてテクスチャが異なるものと、テクスチャが似ていて色が異なるものとが等価に扱われることになるため、「青空」と「海」との違い(色が似ていてテクスチャが異なるもの)と、「青空」と「壁」との違い(テクスチャが似ていて色が異なるもの)とを区別することができず、結果として「青空」「海」「壁」は互いに近い位置にマップされることになる。特徴量が増えれば増えるほど、このように混同されるものが多くなり、分類の精度の低下を招いてしまうという問題がある。
そこで、本発明は、自動的に画像の種類の識別を精度よく効率的に行うことができる画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラムを提供することを目的とするものである。
本発明の画像識別方法は、画像から複数の特徴量を抽出し、抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて前記画像の種類を決定することを特徴とするものである。
本発明の画像識別装置は、画像から複数の特徴量を抽出する特徴量抽出手段と、該特徴量抽出手段により抽出された前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成する特徴ベクトル生成手段と、該特徴ベクトル生成手段により生成された前記特徴ベクトルから前記画像の種類の候補を識別して出力する、該複数の特徴ベクトル毎に設けられた種類候補識別手段と、該複数の種類候補識別手段においてそれぞれ識別された前記画像の種類の候補に基づいて、前記画像の種類を決定する種類決定手段とを有することを特徴とするものである。
本発明のオブジェクト識別方法は、画像に含まれるオブジェクトの種類を識別するオブジェクト識別方法において、前記画像を前記オブジェクト毎に領域分割したオブジェクト領域と、前記画像を設定画素数からなる、前記オブジェクト領域より小さい多数の領域に分割した複数のブロック領域とを生成し、生成した前記ブロック領域から複数の特徴量を抽出し、抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて、前記ブロック領域の種類を決定し、決定した前記ブロック領域の種類を前記各オブジェクト領域毎に集計し、集計した結果を用いて前記オブジェクト領域の種類を識別することを特徴とするものである。
本発明のオブジェクト識別装置は、画像に含まれるオブジェクトの種類を識別するオブジェクト識別装置において、前記画像を前記オブジェクト毎に領域分割して複数のオブジェクト領域を生成するオブジェクト領域生成手段と、前記画像を設定画素数からなる、前記オブジェクト領域より小さい多数の領域に分割して複数のブロック領域を生成するブロック領域生成手段と、該ブロック領域生成手段により生成された前記各ブロック領域から複数の特徴量を抽出する特徴量抽出手段と、該特徴量抽出手段により抽出された前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成する特徴ベクトル生成手段と、該特徴ベクトル生成手段により生成された前記特徴ベクトルから前記ブロック領域の種類の候補を識別する、前記複数の特徴ベクトル毎に設けられた複数の種類候補識別手段と、該各種類候補識別手段において識別された前記ブロック領域の複数の種類の候補に基づいて、前記ブロック領域の種類を決定する種類決定手段と、前記各ブロック領域毎に識別された前記ブロック領域の種類を前記オブジェクト領域毎に集計し、集計した結果を用いて前記オブジェクトの種類を識別するオブジェクト識別手段とを有することを特徴とするものである。
本発明の画像識別プログラムは、コンピュータに、画像から複数の特徴量を抽出し、抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて、前記画像の種類を決定することを実行させることを特徴とするものである。
ここで、「画像」は、撮影された1枚分全体の全体画像であってもよいし、全体画像をブロック状に分割した画像であってもよい。
また、「画像の種類を識別する」とは、たとえば「山」、「海」、「花」、「空」等の種類であることを特定することを意味し、さらに画像の種類がわからない場合に「不明」であることを特定することも含む。
さらに、「特徴量抽出手段」は、画像の特徴を示す複数の特徴量を抽出するものであればよく、たとえば画像の各画素に割り当てられた成分信号値の1方向に沿った変化の規則性の程度を示す相関特徴量を抽出する相関特徴量抽出手段の他に、画像のエッジの特徴を示すエッジ特徴量を抽出するエッジ特徴量抽出手段や画像の色の特徴を示す色特徴量を抽出する色特徴量抽出手段を含むものであってもよい。
なお、相関特徴量抽出手段は、たとえば画像の縦方向に沿った相関特徴量、画像の横方向に沿った相関特徴量、もしくは画像の斜め方向に沿った相関特徴量を抽出する等の画像の少なくとも1方向の相関特徴量を抽出するものであってもよい。
さらに、相関特徴量抽出手段は、画像において同一方向に形成された2つの画素ラインを構成する複数の画素の成分信号値から、2つの画素ラインの相関関係を示す相関値を出力する所定の相互相関関数を有し、2つの画素ラインのいずれか一方を1画素ずつ画素ラインの形成方向にずらしながら画素の成分信号値を相互相関関数に入力することにより複数の相関値を取得し、取得した複数の相関値から最も大きい最大相関値を算出するものであり、画像の同一方向に形成された画素ラインのすべての組み合わせについて最大相関値を算出し、算出されたすべての最大相関値の平均値および標準偏差を相関特徴量として抽出するものであってもよい。
種類候補識別手段は、画像の種類の候補として1つの種類を識別するようにしてもよいし、画像の種類として可能性のある複数の種類を識別するようにしてもよい。
なお、種類候補識別手段は、複数の結合荷重ベクトルを備えた自己組織化マップと、自己組織化マップの複数の結合荷重ベクトルのうち、特徴ベクトルに最も類似する勝者ベクトルの自己組織化マップ上の座標を検出する座標検出手段と、自己組織化マップ上の座標毎に画像の種類の指標を定めた種類頻度分布マップと、座標検出手段により検出された自己組織化マップ上の座標が種類頻度分布マップ上で示す種類を特定し出力する種類候補出力手段とを備えたものであってもよい。
なお、座標検出手段は、特徴ベクトルと勝者ベクトルとの距離を検出し、検出された距離が設定しきい値よりも小さいときには勝者ベクトルがない旨の出力を行い、種類候補識別手段が、座標検出手段から勝者ベクトルがない旨を受け取ると、種類が不明である旨の出力を行うものであってもよい。
また、設定しきい値は、一定の値のものであってもよいし、勝者ベクトルの自己組織化マップ上における位置によって異なるように定められたものであってもよい。
さらに、設定しきい値は、勝者ベクトルの近傍領域内にある複数の結合荷重ベクトルのうち勝者ベクトルとの距離が最も大きい結合荷重ベクトルと勝者ベクトルとの距離であってもよい。
また、種類候補識別手段は、自己組織化マップの座標毎に種類の頻度値を種類の指標として定めた種類頻度分布マップを種類毎に有し、種類候補出力手段が、座標検出手段により検出された座標が各種類頻度分布マップ上で示す複数の頻度値をベクトル成分とした種類ベクトルを出力するものであってもよい。
さらに、「種類決定手段」は、各特徴ベクトル毎に出力される複数の種類ベクトルのすべての成分のうち、最も大きい最大成分となる種類を画像の種類であると識別するものであってもよい。
また、種類決定手段は、最大成分が所定の最大成分しきい値よりも小さいときには、画像の種類は不明である旨の出力を行うものであってもよい。
さらに、種類決定手段は、各特徴ベクトル毎に出力される複数の種類ベクトルのすべての成分のうち、2番目に大きい成分値を検出する機能を有し、最大ベクトル成分の示す種類と2番目に大きい成分の示す種類が一致せず、最大となる成分値と2番目に大きい成分値との差が差分しきい値よりも小さいときには、画像の種類は不明である旨の出力を行うものであってもよい。
本発明の画像識別方法および装置ならびにプログラムによれば、各特徴ベクトル毎に画像の種類を識別し、識別した種類を参照して画像の種類を識別することにより、次元数を低く抑えた特徴ベクトルにより画像の種類の識別が行われることになるため、オブジェクトの種類を精度よく識別することができる。
さらに、この画像識別方法及び装置を用いたオブジェクト識別方法および装置によれば、また、各ブロック領域毎にそれぞれ種類を識別し、ブロック領域の種類を各オブジェクト領域毎に集計してオブジェクト領域の種類を識別することにより、オブジェクト領域の一部のブロック領域に本来の種類に識別されなかったものがあったとしても、その誤った認識を吸収してオブジェクトの種類を正確かつ自動的に識別することができる。
なお、特徴量抽出手段が、画像の各画素に割り当てられた成分信号値の1方向に沿った変化の規則性の程度を示す相関特徴量を抽出する相関特徴量抽出手段を含む構成にすれば、相関特徴量により人工物に多く見られる規則的なパターンを有する画像と、自然物に多く見られるランダムなパターンを有する画像とを区別する指標となる特徴量を抽出することができるため、適切な種類の識別を行うことができる。
また、相関特徴量抽出手段が、画像の縦方向に沿った相関特徴量と、画像の横方向に沿った相関特徴量とを抽出するようにすれば、縦方向および横方向に向かって規則的なパターンが形成されたものと、縦方向もしくは横方向のいずれか一方に向かって規則的なパターンが形成されたものとを区別することができる。
さらに、相関特徴量抽出手段が、2つの画素ラインのいずれか一方を1画素ずつ画素ラインの形成方向にずらしながら画素の成分信号値を所定の相互相関関数に入力することにより算出される複数の相関値のうち最も大きい最大相関値を用いて相関特徴量を算出するようにすれば、画像の縦方向もしくは横方向に向かって形成された規則的なパターンのみならず、画像の斜め方向に向かって形成されている規則的なパターンについても相関特徴量として抽出することができるため、画像の縦方向、横方向および斜め方向に向かって形成される規則的なパターンを相関特徴量として抽出することができる。
さらに、エッジ特徴量抽出手段が、画像の縦方向および横方向のエッジ成分の平均値および標準偏差をそれぞれ算出するようにすれば、たとえば「水(波)」のように縦方向と横方向によってエッジが異なるものと、「植物(花畑等)」のように縦方向と横方向とで比較的均質なエッジのものとがエッジ特徴量によって区別することができる。
また、種類候補識別手段が、複数の結合荷重ベクトルを備えた自己組織化マップと、自己組織化マップの複数の結合荷重ベクトルのうち、特徴ベクトルに最も類似する勝者ベクトルの自己組織化マップ上の座標を検出する座標検出手段と、自己組織化マップ上の座標毎に画像の種類の指標を定めた種類頻度分布マップと、座標検出手段により検出された自己組織化マップ上の座標が種類頻度分布マップ上で示す種類を特定して種類の候補として出力する種類候補出力手段とを備えた構成にすれば、種類の候補を精度よく識別することができる。さらに、各特徴ベクトル毎に種類候補識別手段が用意されるため、特徴ベクトルの低次元化に合わせて自己組織化マップを構成する結合荷重ベクトルの次元を低く抑えることができ、種類識別の精度を向上させることできる。
また、座標検出手段が、特徴ベクトルと勝者ベクトルとの距離を検出し、検出された距離が設定しきい値よりも小さいときには勝者ベクトルがない旨の出力を行い、種類候補識別手段が、座標検出手段から勝者ベクトルがない旨を受け取ると、種類が不明である旨の出力を行うようにすれば、自己組織化マップが予め学習していない種類の識別を、無理に行うことなく不明とすることができるため、種類識別結果に対する信頼性を高めることができる。
また、設定しきい値が、勝者ベクトルの近傍領域内にある複数の結合荷重ベクトルのうち勝者ベクトルとの距離が最も大きい結合荷重ベクトルと勝者ベクトルとの距離であるときには、学習内容の偏りや各種類の画像の多様性の違いによって生じる勝者ベクトルの各位置における種類識別の信頼性の相違を設定しきい値に反映させることができる。
さらに、種類候補識別手段が、自己組織化マップの座標毎に種類の頻度値を種類の指標として定めた種類頻度分布マップを種類毎に有し、種類候補出力手段が、座標検出手段により検出された座標が各種類頻度分布マップ上で示す複数の頻度値をベクトル成分とした種類ベクトルを出力するようにすれば、各特徴ベクトル毎に識別された種類の候補を1つだけ種類決定手段に出力するのではなく、画像の種類として可能性のある複数の種類を候補として種類決定手段に出力することができるため、画像の種類の決定を精度よく行うことができる。
また、種類決定手段が、各特徴ベクトル毎に出力される複数の種類ベクトルのすべての成分のうち、最も大きい最大ベクトル成分となる種類を画像の種類であると決定すれば、複数の特徴ベクトルから識別された複数の種類の中から確率の高い種類を画像の種類として決定することができる。
さらに、種類決定手段が、最大ベクトル成分が所定の最大成分しきい値よりも小さいときには、画像の種類は不明である旨の出力を行うと、最大成分が低い種類の識別の信頼度が低いものは、種類の識別を行わずに不明とすることができるため、種類識別の信頼性を高めることができる。
また、種類決定手段が、各特徴ベクトル毎に出力される複数の種類ベクトルのすべての成分のうち、2番目に大きいベクトル成分を検出する機能を有し、最大成分の示す種類と2番目に大きい成分の示す種類が一致せず、最大ベクトル成分と2番目に大きいベクトル成分との差が差分しきい値よりも小さいときには、画像の種類は不明である旨の出力を行うようにすれば、画像の種類が最大ベクトル成分の示す種類であるか2番目に大きいベクトル成分の示す種類であるか疑わしいときには不明である旨の出力が行われるため、種類識別の信頼性を高めることができる。
以下、本発明のオブジェクト識別装置の実施の形態について図面を参照しながら説明する。図1は本発明のオブジェクト識別装置の好ましい実施の形態を示すブロック図である。なお、図1のようなオブジェクト識別装置1の構成は、補助記憶装置に読み込まれたオブジェクト識別プログラムをコンピュータ(たとえばパーソナルコンピュータ等)上で実行することにより実現される。また、このオブジェクト識別プログラムは、CD−ROM等の情報記憶媒体に記憶され、もしくはインターネット等のネットワークを介して配布され、コンピュータにインストールされることになる。
図1のオブジェクト識別装置1は画像に含まれるオブジェクト毎の種類を識別するものであって、ブロック領域生成手段10、オブジェクト領域生成手段20、ブロック領域識別手段(画像識別装置)30、オブジェクト識別手段95等を有する。図1のブロック領域生成手段10は、画像を設定画素数からなる、オブジェクト領域より小さい多数の領域に分割して複数のブロック領域を生成するものである。具体的には、図2(a)に示すように、ブロック領域生成手段10は、設定画素数が32画素×32画素に設定されている場合、全体画像Pを32×32画素からなる複数のブロック領域BRに分割するようになっている。
オブジェクト領域生成手段20は、全体画像に含まれるオブジェクト毎に領域分割して複数のオブジェクト領域を生成する機能を有する。たとえば、図2(b)に示すような複数のオブジェクトを含む画像の場合、全体画像Pを各オブジェクト毎に領域分割してオブジェクト領域ORを生成するようになっている。ここで、オブジェクトとはたとえば人物、空、海、木、建物等の画像に含まれる被写体を意味し、オブジェクト領域は被写体が画像内に占める領域を意味する。
ブロック領域識別手段30は生成された各ブロック領域BR毎に種類を識別するものであって、たとえばブロック領域BRは「山」、「海」、「花」、「空」の種類であることを特定するものである。
オブジェクト識別手段95は、ブロック領域識別手段(画像識別装置)30により識別されたブロック領域BRの種類を、オブジェクト領域生成手段20により生成されたオブジェクト領域OR毎に集計し、オブジェクトの種類を識別するものである。
具体的には、オブジェクト識別手段95は、オブジェクト領域OR内の各ブロック領域BRの種類の数を集計する。このとき、オブジェクト識別手段95は、複数のオブジェクト領域ORにまたがっているブロック領域BRは、カウントしないようになっている。このように、2つのオブジェクト領域にまたがっているブロック領域は2つの種類を含むブロック領域BRを集計から外すことにより、種類識別の信頼性が低くなってしまうのを防止することができる。
そして、オブジェクト識別手段95は、あるオブジェクト領域ORにおいて集計されたブロック領域BRの種類のうち、最も多いブロック領域BRの種類をオブジェクトの種類であると識別する。すると、図2(c)に示すように、各オブジェクト領域ORに種類が識別される。
なお、図1のオブジェクト識別手段95において、オブジェクトの種類を多数決により決定するようにしているが、集計された種類のうち最も多い最大の種類の割合(最大の種類の数/オブジェクトを構成する全ブロック領域数)が種類情報しきい値より小さい場合、オブジェクト識別手段95がオブジェクトの種類として「不明」を出力する機能を有していてもよい。あるいは、最大の種類の割合と2番目に多い種類の割合との差が小さい場合、オブジェクト識別手段95がオブジェクトの種類として「不明」を出力するようにしてもよい。これは、オブジェクトの種類を誤って識別するよりも、「不明」と判断された方がユーザーにとって好ましい場合があるためである。
図3はオブジェクト領域生成手段20の一例を示すブロック図であり、図3を参照してオブジェクト領域生成手段20について説明する。なお、以下に示すオブジェクト領域生成手段20は一例であり、たとえばエッジ検出により各オブジェクト領域ORを生成する手法等により行うようにしてもよい。
オブジェクト領域生成手段20は、画像を構成する各画素から複数の特徴量を抽出し、類似した画素特徴量毎に画素を分類する画像の特徴量分類手段100と、画素の分類毎に領域分割して複数のクラスタリング領域を生成する領域分割手段101と、生成されたクラスタリング領域のうち最も画素数の少ない最小クラスタリング領域を抽出する最小クラスタ領域抽出手段112と、抽出された最小クラスタリング領域と隣接する隣接クラスタリング領域を抽出する統合領域判断手段113と、生成されたクラスタリング領域を統合してオブジェクト領域を抽出する領域統合手段110とを有する。
ここで、図4と図5は画像を各オブジェクト領域毎に分割する過程を示す模式図であり、図4を参照してオブジェクト領域生成手段20の動作例について説明する。まず、図4(a)に示すように、類似した特徴を有する画素が並んだ画像があると仮定する。このとき、特徴量分類手段100において、各画素から複数の特徴量が抽出されて、各特徴量を要素とした複数の特徴ベクトルが生成される。その後、図4(b)に示すように、複数の特徴ベクトルが類似する特徴ベクトル毎に分類される(クラスタリング)。
その後、領域分割手段101により、特徴量分類手段100によりクラスタリングされた結果が実際の画像に写像される。すると、図5(a)に示すように、類似した画素からなる複数のクラスタリング領域が形成されて、ラベルを付したラベル画像としてデータベース111に記憶される。
次に、領域統合の一例について説明する。まず、最小クラスタ領域抽出手段112により、データベースに記憶されたクラスタリング領域の中から最も小さい最小クラスタリング領域が抽出される。また、統合領域判断手段113において抽出された最小クラスタリング領域と隣接する隣接クラスタリング領域が抽出する。
ここで、最小クラスタリング領域が所定の微小画素しきい値以下の画素数(たとえば全画素数の1/100)の場合、領域統合手段110において、最小クラスタリング領域が境界画素数(周囲長)の最も多い隣接クラスタリング領域と統合される。具体的には、図5(a)のクラスタリング領域Aが所定の微小画素しきい値以下の画素数を有する最小クラスタリング領域であるとする。クラスタリング領域Aは、クラスタリング領域C、Dと隣接しているため、クラスタリング領域C、Dが隣接クラスタリング領域となる。
そこで、領域統合手段110において、最小クラスタリング領域Aとクラスタリング領域C、Dとが接している隣接画素数がそれぞれ算出される。図5(a)においては隣接クラスタリング領域Dとの境界画素数の方が隣接クラスタリング領域Cとの境界画素数よりも多い。このためクラスタリング領域Aは図5(b)のようにクラスタリング領域Dと統合する。
一方、最小クラスタリング領域が所定の小画素しきい値以下の画素数(たとえば全画素数の1/10)の場合、領域統合手段110において、最小クラスタリング領域が特徴空間での距離が近い隣接クラスタリング領域と統合される。具体的には、図5(b)において、クラスタリング領域Bが所定の小画素しきい値以下の最小クラスタリング領域であるとする。すると、クラスタリング領域Bの隣接クラスタリング領域はクラスタリング領域C、Dである。そこで、たとえばテクスチャ情報を距離を基準とした場合、どちらのクラスタリング領域C、Dのテクスチャがクラスタリング領域Bのテクスチャに近いかが判断される。そして、図5(c)のように、クラスタリング領域Bが特徴空間での最も近い距離であるクラスタリング領域Dと統合される。
領域統合手段110において、上述した作業がたとえば最小クラスタ領域抽出手段112により抽出される最小クラスタリング領域が所定の小画素しきい値よりも大きい画素数になるまで行われて、画像が各オブジェクト領域OR毎に領域分割される(図2(c)参照)。
次に、図1を参照してブロック領域識別手段(画像識別装置)30について説明する。ブロック領域識別手段30は、各ブロック領域BRを1つの画像としてとらえてこの各ブロック領域BRの種類を識別するものであって、各ブロック領域BRから複数の特徴量を抽出する特徴量抽出手段40と、抽出された複数の特徴量をベクトル成分とする特徴ベクトルを複数生成する特徴ベクトル生成手段50と、生成された特徴ベクトルからブロック領域の種類の候補を識別して出力する種類候補識別手段60と、識別されたブロック領域の種類の候補に基づいて、ブロック領域BRの種類を決定する種類決定手段90とを有する。以下にブロック領域識別手段(画像識別装置)30の各構成について具体的に説明していく。
図6は特徴量抽出手段40および特徴ベクトル生成手段50の一例を示すブロック図であり、図6を参照して特徴量抽出手段40について説明する。特徴量抽出手段40は、画像変換手段41、エッジ画像生成手段42、相関特徴量抽出手段43、エッジ特徴量抽出手段44、色特徴量抽出手段45等を有する。
画像変換手段41は、RGB表色系により表現されているブロック領域をYCC表色系に変換するものである。このとき、画像変換手段41は、画像を構成する複数のブロック領域BRのうち、1つのオブジェクト領域ORに含まれるブロック領域を識別する。なお、画像を構成する複数のブロック領域BRのうち、オブジェクト領域OR間の境界にまたがるブロック領域BRは、オブジェクト領域ORの種類の判断には使用しないため、特徴量の抽出を行わないようになっている。
エッジ画像生成手段42は、画像変換手段41から送られたY成分を用いてエッジ画像を生成し、生成したエッジ画像を相関特徴量抽出手段43およびエッジ特徴量抽出手段44に送る機能を有する。ここで、エッジ画像生成手段42は、図7(a)に示す縦エッジ検出用フィルターを用いて縦エッジ画像を生成するとともに、図7(b)に示す横エッジ検出用フィルターを用いて横エッジ画像を生成するようになっている。
なお、エッジ画像生成手段42は、図7に示すようなエッジ検出用フィルター(prewittフィルター)を用いているが、たとえば上下左右の画素には対角線上のものより大きな重みを与えたエッジ検出用フィルター(Sobelフィルター)を用いたエッジ検出方法やその他の公知のエッジ検出方法を用いることができる。
図6の相関特徴量抽出手段43は、ブロック領域BRの各画素に割り当てられた成分信号値の1方向に沿った変化の規則性の程度を示す相関特徴量を抽出するものである。ここで、図8は相関特徴量抽出手段43における相関特徴量の算出方法の一例を示すフローチャートを示しており、図8を参照して相関特徴量の算出方法について説明する。
なお、図8において横方向に沿った変化に関する相関特徴量の抽出について説明するが、同様の手法により縦方向に沿った変化に対する相関特徴量も抽出される。また、以下に示すF(x)は、第i行における第x画素(i=0〜31、x=0〜31)の成分信号値を示し、F(x)は第j行における第x画素(i=0〜31、x=0〜31)の成分信号値を示すものとする。
最初に、画像変換手段41により変換された縦エッジ画像を用いて、縦エッジ画像の各行に沿った成分信号値F(x)、F(x)の変化を規格化する(ステップST1)。具体的には、成分信号値F(x)と平均値Fとの差分を標準偏差δで割り、規格化された成分信号値F’(x)が求められる。
’(x)=(F(x)−F)/δ
同様に、j行の成分信号値F(x)と平均値Fとの差分を標準偏差δで割り、規格化された成分信号値F’(x)が求められる。
’(x)=(F(x)−F)/δ
このように、成分信号値を規格化して相関特徴量を求めるのは、各行間における変動幅や平均値の違いを排除して、変動パターン自体の相互相関性を示す相関特徴量を導出するためである。なお、F(x)、F(x)が一定値であり標準偏差が0の場合は、F’(x)=0(一定)、F’(x)=0(一定)とする。
そして、異なる2行(第i行と第j行)の組み合わせについて、これら2行に関する規格化された成分信号値F’(x)およびF’(x)を用いて、相互相関関数
Figure 2005063307
が導出される(ステップST2)。この相互相関関数は、概念的に言えば、図9の(a)に示すように、2行の規格化された成分信号値F’(x)およびF’(x)をd画素分だけずらして掛け合わせ、その総和を取るものである。すると、図9の(b)に示すような、dの関数としての相互相関関数Gij(d)が得られる。
次に、算出した相互相関関数Gij(d)にd=0〜31に代入したときの相関値の中から最大相関値が算出される(ステップST3)。
Figure 2005063307
この作業をすべての2行の組み合わせについて繰り返し最大相関値が算出される(ステップST1〜ステップST4)。ここでは、32画素×32画素のブロック領域においては、0行〜31行のすべての組み合わせの最大相関値が算出される。そして、算出されたすべての最大相関値の平均値および標準偏差が算出されて、この平均値および標準偏差が相関特徴量とされる(ステップST5)。
同様に、縦方向に沿った変化に関する最大相関値の平均値および標準偏差が相関特徴量として算出される(ステップST1〜ステップST5)。そして、図6の特徴ベクトル生成手段50は抽出された合計4つの相関特徴量を用いて、相関特徴ベクトルCB1を生成するようになっている。
上述したように算出された相関特徴量は、オブジェクトを構成するブロック領域BRに規則的なパターンがあるかどうかを示すものであり、最大相関値の平均値が大きく標準偏差の小さくなればなるほど、規則的なパターンが形成されていることを意味する。一般的に撮影された画像に含まれる自然物は規則的なパターン、連続的なパターン、周期的なパターンは少なく、ランダムなパターンにより構成されていることが多い。一方、ビルや石畳等の人工物は規則的なパターン等により構成されていることが多い。そこで、オブジェクトを構成するブロック領域BRが規則的なパターンを構成しているか否かを示す相関特徴量を抽出することにより、ブロック領域BRが人工的に作られた建造物等の画像の一部であるのか、自然物の画像の一部であるのかを判断することができる。
なお、相関特徴量抽出手段43は、単に規格化された成分信号値F’(x)、F’(x)の積の総和の平均値および標準偏差を相関特徴量として抽出してもよいが、上述のように、相互相関関数の最大値の平均値および標準偏差を相関特徴量として用いれば、たとえば斜め方向に規則的な模様や波紋が撮影されたブロック領域BRについても、そのパターンの規則性を示す適当な相関特徴量を導出できるようになり、ブロック領域BRの相関に関する特徴量を正確に表した相関特徴量の抽出を行うことができる。ここで、1画素ずつ画素ライン画素ラインをずらした場合(d=0,1,2,・・・31)について言及しているが、2画素分ずらす等の複数画素ずらしながら最大相関値を算出するようにしてもよい。
エッジ特徴量抽出手段44は、ブロック領域BRのエッジ成分の特徴量を抽出するものである。具体的には、エッジ特徴量抽出手段44は、エッジ検出フィルター(図7参照)を用いて生成された縦エッジ画像および横エッジ画像について、それぞれの成分信号値の平均値および標準偏差を算出し、4個のエッジ特徴量を出力するものである。そして、特徴ベクトル生成手段50は算出された合計4つのエッジ特徴量を用いて、エッジ特徴ベクトルCB2を生成するようになっている。
このように、エッジ成分の特徴量としてエッジ成分の平均値を用いることにより、自然物の中でもエッジの少ない「空」と自然物の中でもエッジの多い「水」や「植物」とを分類することができる。また、エッジ特徴量としてブロック領域BRの縦方向のエッジ成分と横方向のエッジ成分とを抽出することにより、たとえば「水」のように方向によってエッジ成分の特徴が異なるオブジェクトと、「植物」「花畑」等の縦方向および横方向において比較的均一なエッジを形成するオブジェクトとを分類することができる。
色特徴量抽出手段45は、ブロック領域BRの色特徴を示す色特徴量を抽出するものである。具体的には、色特徴量抽出手段45は、YCC表色系で表されたブロック領域BRを構成する32×32画素分の輝度成分(Y成分)および2つの色差成分(Cr、Cb)の各成分信号値の平均値および標準偏差を算出し、1のブロック領域から6個の色特徴量を抽出するものである。そして、特徴ベクトル生成手段50は抽出された合計6つの色特徴量を用いて、色特徴ベクトルCB3を生成するようになっている。
なお、色特徴量抽出手段45は、RGB表色系からYCC表色系に変換された後に色特徴量が抽出するようにしているが、たとえばRGB表色系のまま各成分(RGB)について色特徴量を抽出するようにしてもよいし、画像変換手段41において、RGB表色系のブロック領域BRをLab表色系に変換して、Labの各成分について色特徴量を抽出するようにしてもよい。また、色特徴量抽出手段45は、各成分信号値の平均値と標準偏差とを色特徴量として抽出しているが、たとえば最大値や最小値、分位点等その他の代表値を色特徴量として用いてもよい。
次に、図10は種類候補識別手段60の一例を示すブロック図である。図10の種類候補識別手段60は、特徴ベクトル生成手段50により生成された複数の特徴ベクトル毎に種類の候補の識別を行うものであって、相関特徴ベクトルCB1から種類の候補を識別する相関種類候補識別手段61、エッジ特徴ベクトルCB2から種類の候補を識別するエッジ種類候補識別手段62、色特徴ベクトルCB3から種類の候補を識別する色種類候補識別手段63の3つの種類候補識別手段を備えている。
以下に、相関種類候補識別手段61の構成について説明する。なお、エッジ種類候補識別手段62、色種類候補識別手段63が相関種類候補識別手段61と同一の構成を有する部位には同一の符号を付してその説明を省略する。この相関種類候補識別手段61、エッジ種類候補識別手段62、色種類候補識別手段63において、自己組織化マップを用いた修正対向伝搬ネットワーク(参考文献:徳高、岸田、藤村「自己組織化マップの応用−多次元情報の2次元可視化」海文堂、1999)が用いられる。
相関種類候補識別手段61は、複数の結合荷重ベクトルを備えた自己組織化マップSOM1と、自己組織化マップの複数の結合荷重ベクトルのうち、前記特徴ベクトルに最も類似する勝者ベクトルの自己組織化マップ上の座標CIを検出する座標検出手段70と、自己組織化マップSOM1上の座標CI毎にブロック領域BRの種類の指標を定めた種類頻度分布マップKDM1と、検出された自己組織化マップSOM1上の座標CIが種類頻度分布マップKDM1上で示す種類を特定して種類の候補として出力する種類候補出力手段80とを備えている。
ここで、自己組織化マップSOM1の結合荷重ベクトルは、マトリックス状に配置されており、入力される相関特徴ベクトルCB1と同一の次元、すなわち4次元のベクトルからなっている。そして、座標検出手段70は、相関特徴ベクトルCB1と自己組織化マップSOM1のすべての結合荷重ベクトルとの距離(たとえばユークリッド距離)を算出し、その中からたとえば最も距離の近い(最も類似した)結合荷重ベクトル(以下「勝者ベクトル」という)を検索する。そして、座標検出手段70は勝者ベクトルの自己組織化マップSOM1上での座標CIを取得するようになっている。
図11に示すように、相関種類候補識別手段61において、種類毎に複数の種類頻度分布マップKDM1が用意されており、各種類頻度分布マップKDM1は、2次元空間上に種類の指標となる頻度値(信頼度)の分布が形成されている。具体的には、図11(a)は種類が「空」の種類頻度分布マップKDM1であり、図11(b)は種類が「建物」の種類頻度分布マップKDM、図11(c)は種類が「木」の種類頻度分布マップKDM、図11(d)の種類が「海」の種類頻度分布マップKDM1をそれぞれ示している。図11において、白の範囲が0.8〜1.0の頻度値(信頼度)、グレーの範囲が0.2〜0.8の頻度値(信頼度)、黒の範囲が0.0〜0.2の頻度値(信頼度)を示している。そして、種類候補出力手段80は、座標検出手段70により検出された自己組織化マップSOM1上の座標CIが各種類頻度分布マップKDM1上で示す複数の頻度値をベクトル成分とした種類ベクトルKI1を種類の候補として出力するようになっている。
ここで、上述した自己組織化マップSOM1および種類頻度分布マップKDM1の学習について説明する。自己組織化マップSOM1の結合荷重ベクトルは、初期状態においてランダムな結合荷重ベクトルに設定されている。そして、予め種類のわかっている学習用入力データが座標検出手段70に入力される。すると、座標検出手段70において学習用入力データと最も近似した結合荷重ベクトル(勝者ベクトル)が識別される。同時に、識別された結合荷重ベクトル(勝者ベクトル)を取り囲むたとえば3×3個の結合荷重ベクトルが識別される。そして、勝者ベクトルおよびその近傍にある結合荷重ベクトルの結合荷重ベクトルが学習用入力データに近づく方向に更新されて、自己組織化マップSOM1の結合荷重ベクトルが学習される。
この作業が複数の学習用入力データを用いて行われる。さらに、この学習用入力データが複数回繰り返し自己組織化マップSOMに入力される。ここで、複数の学習用入力データの入力が繰り返されるにつれて、結合荷重ベクトルが更新される結合荷重ベクトルの近傍領域の範囲が狭くなっていき、最後には識別された勝者ベクトルのみの結合荷重ベクトルが更新されるようになる。
次に、種類頻度分布マップKDM1の学習について説明する。種類頻度分布マップKDM1においてすべての座標の初期値は0になっている。上述したように、自己組織化マップSOM1に学習用入力データが写像された際に、自己組織化マップSOM上の座標CIが出力される。すると、学習用入力データの種類に対応する種類頻度分布マップKDM1内の座標CIに当たる部位およびそれを取り囲む領域(たとえば3×3個)に正の整数値(たとえば「1」)が加算される。
そして、学習用入力データが入力されて行くにつれて、種類頻度分布マップKDM1上の特定の領域ついて学習用入力データの入力により数値が加算されて大きくなっていく。つまり、同じ種類のブロック領域BRであれば、特徴量が類似していることになる。特徴量が類似していれば、自己組織化マップSOM1上の近くの座標に写像されることが多くなるため、種類頻度分布マップKDM1においても特定の座標の数値が大きくなっていく。
最後に、種類頻度分布マップKDM1の各座標にある数値を全入力学習データ数×学習回数で割ると、各座標に0.0から1.0までの確率が入力された種類頻度分布マップKDMが生成される。この確率が大きければ大きいほど、その種類である確率が大きくなることを意味する。図11の種類頻度分布マップKDMにおいては、白の範囲が0.8〜1.0の信頼度(確率)、グレーの範囲が0.2〜0.8の信頼度(確率)、黒の範囲が0.0〜0.2の信頼度(確率)を示している。このように種類頻度分布マップKDMがたとえば「空」、「建物」、「木」、「海」等の種類毎にそれぞれ形成されていく。
なお、上述した自己組織化マップSOM1および種類頻度分布マップKDM1の学習には相関特徴ベクトルCB1を用いられているが、エッジ種類候補識別手段62の自己組織化マップSOM2および種類頻度分布マップKDM2の学習にはエッジ特徴ベクトルCB2が用いられ、色種類候補識別手段63の自己組織化マップSOM3および種類頻度分布マップKDM3の学習には色特徴ベクトルCB3が用いられることになる。
このように、各特徴ベクトルCB1〜CB3毎に種類の候補を修正対向伝搬ネットワーク(MCP)を用いて識別することにより、自己組織化マップを構成する結合荷重ベクトルの次元を低く抑えることができるため、種類の候補の識別の精度を向上させることできる。
さらに、座標検出手段70〜73は、特徴ベクトルCB1〜CB3と勝者ベクトルとの距離を検出し、検出された距離が設定しきい値よりも小さいときには勝者ベクトルがないと判断する機能を有する。そして、座標検出手段70〜73は、勝者ベクトルがないと判断したときには種類が不明である旨の出力を行うようになっている。
つまり、座標検出手段70〜73は、特徴ベクトルCB1〜CB3に最も距離の近い結合荷重ベクトルの座標を抽出するものであるため、入力された特徴ベクトルが自己組織化マップ上のいずれの結合荷重ベクトルとの距離が離れている(類似していない)ときであっても、その中から最も距離の近い結合荷重ベクトルを抽出する。
一方、自己組織化マップSOM1〜SOM3は予め所定の種類の画像を用いて学習されたものであるため、学習された種類の画像から生成した特徴ベクトルCB1〜CB3であれば、自己組織化マップSOM1〜SOM3のいずれかの結合荷重ベクトルに類似するものである。つまり、特徴ベクトルCB1〜CB3と結合荷重ベクトルとの距離が大きい場合ときには、学習していない種類であり、学習範囲を超えた特徴ベクトルが入力されたことになる。
この場合には、自己組織化マップSOM上の最も類似した結合荷重ベクトルを検索し種類の判別を行うよりも、種類が不明である旨を出力した方がブロック領域BRの種類の候補の識別およびオブジェクト領域ORの種類の識別の精度が向上する。したがって、特徴ベクトルと結合荷重ベクトルとの距離がしきい値以上である場合には、「不明」を示す種類ベクトルを出力するようになっている。
ここで、図12は座標検出手段70〜73において種類ベクトルの出力方法の一例を示すフローチャートであり、図12を参照して説明する。図12において、学習済の自己組織化マップSOM上の各々の結合荷重ベクトルと特徴ベクトルとが比較されて、特徴ベクトルとのユークリッド距離が最も小さい結合荷重ベクトルが勝者ベクトルとして特定される(ステップST10)。
次に、勝者ベクトルと特徴ベクトルとのユークリッド距離が算出されて(ステップST11)、算出された距離が所定のしきい値と比較される(ステップST12)。その結果、このユークリッド距離がしきい値以下である場合には勝者ベクトルの位置に対応する種類のマップ上の対応点が参照され、「空」、「木」等の種類のうち、対応点において最も高い確率を示している種類が、現在のブロック領域の種類として特定される(ステップST13)。
一方、勝者ベクトルと特徴ベクトルとのユークリッド距離がしきい値より大きい場合には、ブロック領域の種類は不明であると判断されて、たとえばベクトル成分がすべて「0」の不明を示す種類ベクトルが出力される(ステップST14)。このように、設定しきい値を用いることにより、自己組織化マップSOM1〜SOM3が予め学習していないような画像が入力された場合にもいわばむりやりに種類を識別する事態を回避できるので、種類の候補の識別結果に対する信頼性を高めることができる。つまり、種類の候補が「不明」ではなく所定の種類として識別されたことは、一定の確実性をもって識別されたことを意味するため、種類の候補の識別の信頼性を高める結果となる。
ここで、設定しきい値には、一定の設定しきい値を定めてもよいが、好ましくは勝者ベクトルの近傍領域内にある複数の結合荷重ベクトルのうち勝者ベクトルとの距離が最も大きい結合荷重ベクトルと勝者ベクトルとの距離が用いられる。これは、学習内容の偏りや各種類の画像の多様性の違いによって生じる各結合荷重ベクトルの「守備範囲」の相違をしきい値に反映させるためである。
つまり、自己組織化マップ上の位置によって近傍の結合荷重ベクトルとの類似度が異なっているため、勝者ベクトルとの類似度がある値であっても、その勝者ベクトルと近傍の結合荷重ベクトルのとの類似度が高い場合と低い場合とでは、勝者が妥当であるか否か、つまり本当に似ているためその勝者ベクトルが選ばれたのか、偶然にその勝者ベクトルが選ばれたのかを判断する基準は異なってくる。
そこで、自己組織化マップ上の結合荷重ベクトルの位置により各結合荷重ベクトルの守備範囲が異なるように各結合荷重ベクトルの守備範囲を勝者ベクトルとその近傍領域の結合荷重ベクトルとの距離に基づいて設定し、写像された結合荷重ベクトルの位置に応じた、すなわち特徴ベクトルの値に応じた「不明」の判断を行うようにする。これにより、「不明」の判断の精度を向上させることができるようになる。
たとえば、図13(a)に示すように、特徴ベクトルが「建物」の部分であるブロック領域BRから抽出され、図13(b)に示す座標検出手段70により勝者ベクトルが勝者ベクトルに決定され、図13(c)に示す種類頻度分布マップKDMにおいて「土」示す種類が最もベクトル成分の大きい種類の候補として出力される場合について考える。このとき、設定しきい値を考慮しなければ、「建物」の種類のブロック領域BRが「土」であると決定されてしまう。
一方、勝者ベクトルと自己組織化マップ上において勝者ベクトルの周辺5×5の近傍領域内にある他の24個の結合荷重ベクトルとのユークリッド距離の最大値をしきい値として用いれば、各勝者ベクトルの守備範囲を超えるような場合には、特徴ベクトルと勝者ベクトルとの距離はしきい値より大きくなり、種類の候補が「不明」であると判断される。
なお、上述した最大値に代えて平均値等をしきい値として用いてもよいし、近傍領域の大きさも5×5に限られず、たとえば3×3の近傍領域からしきい値を算出するようにしてもよい。あるいは、近傍領域内にある結合荷重ベクトルのベクトル長の標準偏差等を基準にしてもよい。
次に、図10を参照して種類決定手段90について説明する。種類決定手段90は、複数の種類候補識別手段60から出力される種類ベクトルKIに基づいてブロック領域BRの種類を決定するものである。ここで、種類候補識別手段60は、各種類候補識別手段61〜63から出力される複数の種類ベクトルKI1〜KI3のすべてのベクトル成分のうち、最も大きい最大ベクトル成分となる種類をブロック領域BRの種類であると決定するようになっている。
たとえば、図14に示すように、種類候補識別手段60からそれぞれ5つのベクトル成分からなる3つの種類ベクトルKI1、KI2、KI3が出力されたとする。すると、種類決定手段90は、3つの種類ベクトルKI1〜KI3の15個のベクトル成分のうち、最も頻度値の大きいベクトル成分である「空」をブロック領域BRの種類であると識別する。
なお、上述のように、複数の種類ベクトルKI1〜KI3のすべてのベクトル成分の最大値により種類を識別するのではなく、3つの種類ベクトルの各成分の平均値を算出して、最も大きい平均値となった種類をブロック領域BRの種類であると識別してもよい。さらに、種類によって識別に適する特徴は異なるものであるため、3つの種類ベクトルKI1〜KI3の各ベクトル成分毎に異なる重み付けをして平均するようにしてもよい。
また、種類決定手段90は、最大ベクトル成分が所定の最大成分しきい値(たとえば0.6)よりも小さいときには、ブロック領域BRの種類は「不明」である旨の決定を行う機能を有している。これにより、ブロック領域BRがその種類であることの信頼性が低いときには、オブジェクト領域ORの種類の集計において信頼性の低い種類はカウントされることがなくなるため、オブジェクト領域ORの識別の精度を向上させることができる。
さらに、種類決定手段90は、2番目に大きい成分の示す種類が最大成分の示す種類と一致せず複数の種類ベクトルKI1〜KI3のすべてのベクトル成分のうち、2番目に大きいベクトル成分を検出する機能を有する。そして、種類決定手段90は、最大ベクトル成分と2番目に大きいベクトル成分との差が差分しきい値(たとえば0.2)よりも小さいときには、ブロック領域BRの種類は不明である旨の出力を行うようになっている。これにより、ブロック領域BRが2番目に大きいベクトル成分の種類である可能性も高いときには、オブジェクト領域ORの種類の集計において信頼性の低い種類はカウントされることがなくなるため、オブジェクト領域ORの識別の精度を向上させることができる。
したがって、種類決定手段90において、図15に示すように、まず複数の種類ベクトルKI1〜KI3のすべてのベクトル成分から最大ベクトル成分が検出される(ステップST20)。そして、その最大ベクトル成分が最大成分しきい値と比較される(ステップST21)。そして、最大ベクトル成分が最大成分しきい値よりも小さい場合には、種類識別の信頼度が低いと判断されて、種類が不明である旨の決定がなされる(ステップST24)。
一方、最大ベクトル成分が最大成分しきい値よりも大きい場合であっても、最大ベクトル成分と2番目に大きいベクトル成分との差が差分ベクトルしきい値と比較されて(ステップST25)、差分ベクトルしきい値よりも小さい場合には種類識別の信頼度が低いと判断されて、種類が不明である旨の決定がなされる。さらに、最大ベクトル成分と2番目に大きいベクトル成分との差が差分ベクトルしきい値よりも大きいときに、ブロック領域BRがその最大ベクトル成分が示す種類であると決定されるようになっている。このように、各ブロック領域BRの種類の識別の信頼性を高めることにより、オブジェクト識別手段95における種類の集計をした後のオブジェクト領域ORの種類識別の信頼度を高めることができる。
図16は本発明のオブジェクト識別方法および画像識別方法の好ましい実施の形態を示すフローチャート図であり、図1から図16を参照してオブジェクト識別方法(ステップST30〜ステップST37)および画像識別方法(ステップST31〜ステップST34)について説明する。
まず、オブジェクト領域生成手段20により入力された画像をオブジェクト毎に領域分割したオブジェクト領域ORが生成される(図2〜図5参照)。一方、ブロック領域生成手段10により入力された画像を設定画素数(たとえば32×32画素)からなる、オブジェクト領域ORより小さい複数のブロック領域BRが生成される(ステップST30)。
次に、特徴量抽出手段40により、ブロック領域BRから複数の特徴量が抽出されて(図6〜図9参照)(ステップST31)、特徴ベクトル生成手段50により複数の特徴量から相関特徴ベクトルCB1、エッジ特徴ベクトルCB2および色特徴ベクトルCB3が生成される(ステップST32)。
その後、種類候補識別手段60において、生成した複数の特徴ベクトルCB1〜CB3毎に、それぞれブロック領域BRの種類の候補が識別される(図10〜図13)(ステップST33)。すると、種類決定手段90において、各特徴ベクトル毎に識別された種類の候補に基づいて、ブロック領域BRの種類が決定される(図14、図15参照)(ステップST34)。この作業がすべてのブロック領域BRについて行われる(ステップST31〜ステップST35)。
その後、オブジェクト識別手段95において、各オブジェクト領域OR毎に付与された種類を集計する(ステップST36)。そして、最も多い種類がそのオブジェクト領域ORの種類として出力される(ステップST37)。
上記実施の形態によれば、各特徴ベクトルCB1〜CB3毎にブロック領域BRの種類の候補を識別し、識別した種類の候補を参照してブロック領域BRの種類を識別することにより、次元数を低く抑えた特徴ベクトルによりブロック領域BRの種類の識別が行われることになるため、オブジェクトの種類を精度よく識別することができる。
また、各ブロック領域BR毎にそれぞれ種類を決定し、ブロック領域BRの種類を各オブジェクト領域OR毎に集計してオブジェクト領域ORの種類を識別することにより、オブジェクト領域ORの一部のブロック領域BRに本来の種類に識別されなかったものがあったとしても、その誤った認識を吸収してオブジェクトの種類を正確かつ自動的に識別することができる。
さらに、図6に示すように、特徴量抽出手段40が、ブロック領域BRの各画素に割り当てられた成分信号値の1方向に沿った変化の規則性の程度を示す相関特徴量を抽出する相関特徴量抽出手段43を含む構成にすれば、相関特徴量により人工物に多く見られる規則的なパターンを有する画像と、自然物に多く見られるランダムなパターンを有する画像とを区別する指標となる特徴量を抽出することができるため、適切な種類の識別を行うことができる。
また、図6の相関特徴量抽出手段43が、ブロック領域BRの縦方向に沿った相関特徴量と、ブロック領域BRの横方向に沿った相関特徴量とを抽出するようにすれば、縦方向および横方向に向かって規則的なパターンが形成されたものと、縦方向もしくは横方向のいずれか一方に向かって規則的なパターンが形成されたものとを区別することができる。
さらに、相関特徴量抽出手段43が、2つの画素ラインのいずれか一方を1画素ずつ画素ラインの形成方向にずらしながら画素の成分信号値を所定の相互相関関数に入力することにより算出される複数の相関値のうち最も大きい最大相関値を用いて相関特徴量を算出するようにすれば、ブロック領域BRの縦方向もしくは横方向に向かって形成された規則的なパターンのみならず、ブロック領域BRの斜め方向に向かって形成されている規則的なパターンについても相関特徴量として抽出することができるため、ブロック領域BRの縦方向、横方向および斜め方向に向かって形成される規則的なパターンを相関特徴量として抽出することができる。
さらに、エッジ特徴量抽出手段44が、ブロック領域BRの縦方向および横方向のエッジ成分の平均値および標準偏差をそれぞれ算出するようにすれば、たとえば「水(波)」のように縦方向と横方向によってエッジが異なるものと、「植物(花畑等)」の縦方向と横方向とで比較的均質なエッジのものとがエッジ特徴量によって区別することができる。
また、各種類候補識別手段61〜63が、複数の結合荷重ベクトルを備えた自己組織化マップSOM1〜SOM3と、自己組織化マップSOM1〜SOM3の複数の結合荷重ベクトルのうち、特徴ベクトルCB1〜CB3に最も類似する勝者ベクトルの自己組織化マップSOM1〜SOM3上の座標を検出する座標検出手段70と、自己組織化マップSOM1〜SOM3上の座標毎にブロック領域BRの種類の指標を定めた種類頻度分布マップKDM1〜KDM3と、座標検出手段70により検出された自己組織化マップSOM1〜SOM3上の座標が種類頻度分布マップKDM1〜KDM3上で示す種類を特定して種類の候補として出力する種類候補出力手段80とを備えた構成にすれば、種類の候補を精度よく識別することができる。
さらに、各特徴ベクトルCB1〜CB3毎に各種類候補識別手段61〜63が用意されるため、特徴ベクトルCB1〜CB3の低次元化に合わせて自己組織化マップSOM1〜SOM3を構成する結合荷重ベクトルの次元を低く抑えることができ、種類識別の精度を向上させることできる。
また、座標検出手段70が、特徴ベクトルCB1〜CB3と勝者ベクトルとの距離を検出し、検出された距離が設定しきい値よりも小さいときには勝者ベクトルがない旨の出力を行い、種類候補出力手段80が、座標検出手段70から勝者ベクトルがない旨を受け取ると、種類が不明である旨の出力を行うようにすれば、自己組織化マップSOM1〜SOM3が予め学習していない種類の識別を、無理に行うことなく不明とすることができるため、種類識別結果に対する信頼性を高めることができる。
また、設定しきい値が、勝者ベクトルの近傍領域内にある複数の結合荷重ベクトルのうち勝者ベクトルとの距離が最も大きい結合荷重ベクトルと勝者ベクトルとの距離であるときには、学習内容の偏りや各種類の画像の多様性の違いによって生じる勝者ベクトルの各位置における種類識別の信頼性の相違を設定しきい値に反映させることができる。
さらに、各種類候補識別手段61〜63が、自己組織化マップSOM1〜SOM3の座標毎に種類の頻度値を種類の指標として定めた種類頻度分布マップKDM1〜KDM3を種類毎に有し、種類候補出力手段80が、座標検出手段70により検出された座標が各種類頻度分布マップKDM1〜KDM3上で示す複数の頻度値をベクトル成分とした種類ベクトルKI1〜KI3を出力するようにすれば、各特徴ベクトルCB1〜CB3毎に識別された種類の候補を1つだけ種類決定手段90に出力するのではなく、ブロック領域BRの種類として可能性のある複数の種類を候補として種類決定手段90に出力することができるため、ブロック領域BRの種類の決定を精度よく行うことができる。
また、種類決定手段90が、各特徴ベクトルCB1〜CB3毎に出力される複数の種類ベクトルKI1〜KI3のすべての成分のうち、最も大きい最大ベクトル成分となる種類をブロック領域BRの種類であると決定すれば、複数の特徴ベクトルから識別された複数の種類の中から確率の高い種類の識別を行うことができる。
さらに、種類決定手段90が、最大ベクトル成分が所定の最大成分しきい値よりも小さいときには、ブロック領域BRの種類は不明である旨の出力を行うと、最大ベクトル成分が低い種類の識別の信頼度が低いものは、種類の識別を行わずに不明とすることができるため、種類識別の信頼性を高めることができる。
また、種類決定手段90が、各特徴ベクトル毎に出力される複数の種類ベクトルKI1〜KI3のすべての成分のうち、2番目に大きいベクトル成分を検出する機能を有し、最大成分の示す種類と2番目に大きい成分の示す種類が一致せず、最大ベクトル成分と2番目に大きいベクトル成分との差が差分しきい値よりも小さいときには、ブロック領域BRの種類は不明である旨の出力を行うようにすれば、ブロック領域BRの種類が最大ベクトル成分の示す種類であるか2番目に大きいベクトル成分の示す種類であるか疑わしいときには不明である旨の出力が行われるため、種類識別の信頼性を高めることができる。
なお、本発明の実施の形態は上記実施の形態に限定されない。たとえば、図の特徴量抽出手段において相関特徴量、エッジ特徴量および色特徴量の3種類の特徴量を抽出しているが、たとえばテクスチャ成分や画素の高周波成分等その他の特徴量をブロック領域BRから抽出するようにしてもよい。この場合であっても、抽出した特徴量をベクトル成分とする各特徴ベクトル毎に種類の候補が識別されることになる。
また、上記実施の形態における各種類候補識別手段61〜63において、複数の種類の信頼度をベクトル成分とする種類ベクトルを出力するようにしているが、各特徴ベクトルから1つの種類を識別するようにしてもよい。具体的には、各種類候補識別手段61〜63が、複数の種類頻度分布マップKDMからそれぞれ座標CIの信頼度を複数抽出する。そして、種類候補識別手段60は最も大きい確率を有する種類をブロック領域BRの種類情報であると識別して、種類をオブジェクト識別手段95に送るようにしてもよい。このとき、オブジェクト識別手段95において、各種類候補識別手段61〜63により識別された複数の種類から多数決によりブロック領域BRの種類を決定してもよいし、種類の候補のうち最も信頼度の高い種類をブロック領域の種類であると決定してもよい。
さらに、図10に示す種類候補識別手段において、各種類毎に複数の種類頻度分布マップKDMを用意した場合について例示しているが、図17に示すように、自己組織化マップSOM1〜SOM3の座標にそれぞれ対応して1つの種類を定義した1つの種類頻度分布マップKDM1〜KDM3により種類の候補を識別するようにしてもよい。
また、図15のブロック領域識別手段30において、5つのベクトル成分を有する種類ベクトルKI1〜KI3に基づいてブロック領域BRの種類の識別を行う場合ついて例示しているが、識別する種類の数はこれに限定されない。
さらに、本発明の画像識別方法および装置の実施の一形態として、ブロック領域BRの識別について例示しているが、全体画像P(図2(a)参照)から複数の特徴量を抽出して複数の特徴ベクトルを生成し、各特徴ベクトル毎に画像の種類の候補を識別して、種類の候補から全体画像の種類を決定するようにしてもよい。このとき、識別する種類の候補は、「空」や「海」等だけでなく、画像のシーンを種類の候補として識別するようにしてもよい。
本発明のオブジェクト識別装置の第1の実施の形態を示すブロック図 本発明のオブジェクト識別装置において、画像に含まれるオブジェクト毎に種類が識別される様子を示す図 本発明のオブジェクト識別装置におけるオブジェクト領域生成手段の一例を示すブロック図 図2のオブジェクト領域生成手段により画像が領域分割される様子を示す図 図2のオブジェクト領域生成手段によりクラスタリング領域が統合されてオブジェクト領域が形成される様子を示す図 本発明のオブジェクト識別装置における特徴量抽出手段の一例を示すブロック図 図6のエッジ画像生成手段において使用されるエッジフィルターの一例を示す図 図6の相関特徴量抽出手段の動作例を示すフローチャート 図6の相関特徴量抽出手段における相互相関関数の一例を示すグラフ図 本発明のオブジェクト識別装置における種類候補識別手段の一例を示すブロック図 図10の種類候補識別手段における種類頻度分布マップの一例を示す模式図 図10の種類候補識別手段における種類候補出力手段の動作例を示すフローチャート 図10の種類候補識別手段における種類候補出力手段の動作例を示す模式図 図10の種類決定手段の動作例を示す模式図 本発明のオブジェクト識別装置における種類決定手段の動作例を示すフローチャート 本発明のオブジェクト識別方法の好ましい実施の形態を示すフローチャート 本発明の種類候補識別手段における自己組織化マップおよび種類頻度分布マップの別の実施の形態を示す模式図
符号の説明
1 オブジェクト識別装置
10 ブロック領域生成手段
20 オブジェクト領域生成手段
40 特徴量抽出手段
43 相関特徴量抽出手段
44 エッジ特徴量抽出手段
45 色特徴量抽出手段
50 特徴ベクトル生成手段
60 種類候補識別手段
70 座標検出手段
80 種類候補出力手段
90 種類決定手段
95 オブジェクト識別手段
BR ブロック領域
CB 特徴ベクトル
CI 座標
KDM 種類頻度分布マップ
KI 種類ベクトル
OR オブジェクト領域
P 画像
SOM 自己組織化マップ

Claims (18)

  1. 画像から複数の特徴量を抽出し、
    抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、
    生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、
    前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて前記画像の種類を決定する
    ことを特徴とする画像識別方法。
  2. 画像から複数の特徴量を抽出する特徴量抽出手段と、
    該特徴量抽出手段により抽出された前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成する特徴ベクトル生成手段と、
    該特徴ベクトル生成手段により生成された前記特徴ベクトルから前記画像の種類の候補を識別して出力する、該複数の特徴ベクトル毎に設けられた種類候補識別手段と、
    該複数の種類候補識別手段においてそれぞれ識別された前記画像の種類の候補に基づいて、前記画像の種類を決定する種類決定手段と
    を有することを特徴とする画像識別装置。
  3. 前記特徴量抽出手段が、前記画像の各画素に割り当てられた成分信号値の1方向に沿った変化の規則性の程度を示す相関特徴量を抽出する相関特徴量抽出手段を含むものであることを特徴とする請求項2に記載の画像識別装置。
  4. 前記相関特徴量抽出手段が、前記画像の縦方向に沿った前記相関特徴量と、前記画像の横方向に沿った前記相関特徴量とを抽出するものであることを特徴とする請求項3に記載の画像識別装置。
  5. 前記相関特徴量抽出手段が、前記画像において同一方向に形成された2つの画素ラインを構成する複数の画素の成分信号値から、前記2つの画素ラインの相関関係を示す相関値を出力する所定の相互相関関数を有し、
    前記2つの画素ラインのいずれか一方を1画素ずつ前記画素ラインの形成方向にずらしながら前記画素の成分信号値を前記相互相関関数に入力することにより複数の前記相関値を取得し、取得した前記複数の相関値から最も大きい最大相関値を算出するものであり、
    前記画像の同一方向に形成された前記画素ラインのすべての組み合わせについて前記最大相関値を算出し、算出されたすべての前記最大相関値の平均値および標準偏差を相関特徴量として抽出するものであることを特徴とする請求項3または請求項4に記載の画像識別装置。
  6. 前記特徴量抽出手段が、前記画像の縦方向および横方向のエッジ成分の特徴を示すエッジ特徴量を抽出するエッジ特徴量抽出手段を含むものであることを特徴とする請求項2から請求項5のいずれか1項に記載の画像識別装置。
  7. 前記特徴量抽出手段が、前記画像の色成分の特徴を示す色特徴量を抽出する色特徴量抽出手段を含むものであることを特徴とする請求項2から請求項6のいずれか1項に記載の画像識別装置。
  8. 前記種類候補識別手段が、
    複数の結合荷重ベクトルを備えた自己組織化マップと、
    該自己組織化マップの前記複数の結合荷重ベクトルのうち、前記特徴ベクトルに最も類似する前記結合荷重ベクトルを勝者ベクトルとして検出し、前記自己組織化マップにおける検出した該勝者ベクトルの座標を検出する座標検出手段と、
    前記自己組織化マップ上の座標毎に前記画像の種類の指標を定めた種類頻度分布マップと、
    前記座標検出手段により検出された前記自己組織化マップ上の座標が該種類頻度分布マップ上で示す種類を特定して種類の候補として出力する種類候補出力手段と
    を備えたものであることを特徴とする請求項2から請求項7のいずれか1項に記載の画像識別装置。
  9. 前記座標検出手段が、前記特徴ベクトルと前記勝者ベクトルとの距離を検出し、検出された距離が設定しきい値よりも小さいときには前記勝者ベクトルがないと判断するものであり、前記種類候補識別手段が、前記勝者ベクトルがないと判断されたには前記種類が不明である旨の出力を行うものであることを特徴とする請求項8に記載の画像識別装置。
  10. 前記設定しきい値が、前記勝者ベクトルの近傍領域内にある複数の前記結合荷重ベクトルのうち前記勝者ベクトルとの距離が最も大きい前記結合荷重ベクトルと前記勝者ベクトルとの距離であることを特徴とする請求項9に記載の画像識別装置。
  11. 前記種類候補識別手段が、前記自己組織化マップの座標毎に前記種類の頻度値を前記種類の指標として定めた前記種類頻度分布マップを前記種類毎に有し、前記種類候補出力手段が、前記座標検出手段により検出された座標が前記各種類頻度分布マップ上で示す複数の頻度値をベクトル成分とした種類ベクトルを出力するものであることを特徴とする請求項8から請求項10のいずれか1項に記載の画像識別装置。
  12. 前記種類決定手段が、前記各種類候補識別手段から出力される前記複数の種類ベクトルのすべてのベクトル成分のうち、最も大きい最大ベクトル成分となる種類を前記画像の種類であると決定するものであることを特徴とする請求項11に記載の画像識別装置。
  13. 前記種類決定手段が、前記最大ベクトル成分が所定の最大成分しきい値よりも小さいときには、前記画像の種類は不明である旨の出力を行うものであることを特徴とする請求項12に記載の画像識別装置。
  14. 前記種類決定手段が、前記各特徴ベクトル毎に出力される前記複数の種類ベクトルのすべての成分のうち、2番目に大きいベクトル成分を検出する機能を有し、前記最大ベクトル成分の示す種類と2番目に大きいベクトル成分の示す種類が一致せず、前記最大ベクトル成分と2番目に大きいベクトル成分との差が差分しきい値よりも小さいときには、前記画像の種類は不明である旨の出力を行うものであることを特徴とする請求項12または請求項13に記載の画像識別装置。
  15. コンピュータに、
    画像から複数の特徴量を抽出し、
    抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、
    生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、
    前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて、前記画像の種類を決定する
    ことを実行させるための画像識別プログラム。
  16. 画像に含まれるオブジェクトの種類を識別するオブジェクト識別方法において、
    前記画像を前記オブジェクト毎に領域分割したオブジェクト領域と、前記画像を設定画素数からなる、前記オブジェクト領域より小さい多数の領域に分割した複数のブロック領域とを生成し、
    生成した前記ブロック領域から複数の特徴量を抽出し、
    抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、
    生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、
    前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて、前記ブロック領域の種類を決定し、
    決定した前記ブロック領域の種類を前記各オブジェクト領域毎に集計し、
    集計した結果を用いて前記オブジェクト領域の種類を識別する
    ことを特徴とするオブジェクト識別方法。
  17. 画像に含まれるオブジェクトの種類を識別するオブジェクト識別装置において、
    前記画像を前記オブジェクト毎に領域分割して複数のオブジェクト領域を生成するオブジェクト領域生成手段と、
    前記画像を設定画素数からなる、前記オブジェクト領域より小さい多数の領域に分割して複数のブロック領域を生成するブロック領域生成手段と、
    該ブロック領域生成手段により生成された前記各ブロック領域から複数の特徴量を抽出する特徴量抽出手段と、
    該特徴量抽出手段により抽出された前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成する特徴ベクトル生成手段と、
    該特徴ベクトル生成手段により生成された前記特徴ベクトルから前記ブロック領域の種類の候補を識別する、前記複数の特徴ベクトル毎に設けられた複数の種類候補識別手段と、
    該各種類候補識別手段において識別された前記ブロック領域の複数の種類の候補に基づいて、前記ブロック領域の種類を決定する種類決定手段と、
    前記各ブロック領域毎に識別された前記ブロック領域の種類を前記オブジェクト領域毎に集計し、集計した結果を用いて前記オブジェクトの種類を識別するオブジェクト識別手段と
    を有することを特徴とするオブジェクト識別装置。
  18. コンピュータに、
    画像をオブジェクト毎に領域分割したオブジェクト領域と、前記画像を設定画素数からなる、前記オブジェクト領域より小さい多数の領域に分割した複数のブロック領域とを生成し、
    生成した前記ブロック領域から複数の特徴量を抽出し、
    抽出した前記複数の特徴量をベクトル成分とする特徴ベクトルを複数生成し、
    生成した前記複数の特徴ベクトル毎に前記画像の種類の候補を識別し、
    前記複数の特徴ベクトル毎に識別された前記種類の候補に基づいて、前記ブロック領域の種類を決定し、
    決定した前記ブロック領域の種類を前記各オブジェクト領域毎に集計し、
    集計した結果を用いて前記オブジェクト領域の種類を識別する
    ことを実行させるためのオブジェクト識別プログラム。
JP2003295358A 2003-08-19 2003-08-19 画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム Withdrawn JP2005063307A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003295358A JP2005063307A (ja) 2003-08-19 2003-08-19 画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003295358A JP2005063307A (ja) 2003-08-19 2003-08-19 画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム

Publications (1)

Publication Number Publication Date
JP2005063307A true JP2005063307A (ja) 2005-03-10

Family

ID=34371638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003295358A Withdrawn JP2005063307A (ja) 2003-08-19 2003-08-19 画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム

Country Status (1)

Country Link
JP (1) JP2005063307A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006344155A (ja) * 2005-06-10 2006-12-21 Hokkaido Univ 画像表示位置決定装置、画像表示位置決定方法、画像表示位置決定プログラム、及びこれを記録したコンピュータ読取可能な記録媒体
WO2007000999A1 (ja) * 2005-06-27 2007-01-04 Pioneer Corporation 画像分析装置および画像分析方法
WO2007029455A1 (ja) * 2005-09-07 2007-03-15 Pioneer Corporation 風景単調度演算装置及び方法
JP2011083932A (ja) * 2009-10-14 2011-04-28 Canon Inc 画像処理装置及び画像処理方法
WO2012111236A1 (ja) * 2011-02-17 2012-08-23 三洋電機株式会社 画像識別装置およびプログラム
KR101336736B1 (ko) 2008-08-22 2013-12-04 정태우 영상에 포함된 객체를 식별하는 방법
JP2020060407A (ja) * 2018-10-09 2020-04-16 三井金属計測機工株式会社 学習機能を有する加工食品検査装置及び加工食品検査方法並びに加工食品検査プログラム

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4565187B2 (ja) * 2005-06-10 2010-10-20 国立大学法人北海道大学 画像表示位置決定装置、画像表示位置決定方法、画像表示位置決定プログラム、及びこれを記録したコンピュータ読取可能な記録媒体
JP2006344155A (ja) * 2005-06-10 2006-12-21 Hokkaido Univ 画像表示位置決定装置、画像表示位置決定方法、画像表示位置決定プログラム、及びこれを記録したコンピュータ読取可能な記録媒体
WO2007000999A1 (ja) * 2005-06-27 2007-01-04 Pioneer Corporation 画像分析装置および画像分析方法
JPWO2007000999A1 (ja) * 2005-06-27 2009-01-22 パイオニア株式会社 画像分析装置および画像分析方法
JP4493050B2 (ja) * 2005-06-27 2010-06-30 パイオニア株式会社 画像分析装置および画像分析方法
US8086046B2 (en) 2005-06-27 2011-12-27 Pioneer Corporation Image analysis device and image analysis method
WO2007029455A1 (ja) * 2005-09-07 2007-03-15 Pioneer Corporation 風景単調度演算装置及び方法
KR101336736B1 (ko) 2008-08-22 2013-12-04 정태우 영상에 포함된 객체를 식별하는 방법
JP2011083932A (ja) * 2009-10-14 2011-04-28 Canon Inc 画像処理装置及び画像処理方法
US8830530B2 (en) 2009-10-14 2014-09-09 Canon Kabushiki Kaisha Image processor and image processing method generating first and second multi-value density data or performing quantization based on an image characteristic
JP5167442B2 (ja) * 2011-02-17 2013-03-21 三洋電機株式会社 画像識別装置およびプログラム
WO2012111236A1 (ja) * 2011-02-17 2012-08-23 三洋電機株式会社 画像識別装置およびプログラム
JP2020060407A (ja) * 2018-10-09 2020-04-16 三井金属計測機工株式会社 学習機能を有する加工食品検査装置及び加工食品検査方法並びに加工食品検査プログラム

Similar Documents

Publication Publication Date Title
Xu et al. Multiple-entity based classification of airborne laser scanning data in urban areas
CN110309781B (zh) 基于多尺度光谱纹理自适应融合的房屋损毁遥感识别方法
US8345974B2 (en) Hierarchical recursive image segmentation
JP4098021B2 (ja) シーン識別方法および装置ならびにプログラム
JPWO2006082979A1 (ja) 画像処理装置および画像処理方法
JP5180922B2 (ja) 画像検索システム及び画像検索方法
US11804025B2 (en) Methods and systems for identifying topographic features
JP2005092346A (ja) 3次元データからの特徴抽出方法および装置
JP4506409B2 (ja) 領域分割方法及び装置、画像認識処理装置、プログラム、記録媒体
Taherzadeh et al. Development of a generic model for the detection of roof materials based on an object-based approach using WorldView-2 satellite imagery
JP4926266B2 (ja) 学習データ作成装置、学習データ作成方法及びプログラム
JP2008242508A (ja) 特定領域自動抽出システム、特定領域自動抽出方法、および、プログラム
CN110334628B (zh) 一种基于结构化随机森林的室外单目图像深度估计方法
JP2005063307A (ja) 画像識別方法および装置、オブジェクト識別方法および装置ならびにプログラム
JP2009123234A (ja) オブジェクト識別方法および装置ならびにプログラム
Xiao et al. Multiresolution-Based Rough Fuzzy Possibilistic C-Means Clustering Method for Land Cover Change Detection
CN107563296A (zh) 基岩海岸岸线的提取方法及系统
JP4285640B2 (ja) オブジェクト識別方法および装置ならびにプログラム
CN111160292B (zh) 人眼检测方法
CN106228553B (zh) 高分辨率遥感图像阴影检测装置与方法
JP4285644B2 (ja) オブジェクト識別方法および装置ならびにプログラム
JP6546385B2 (ja) 画像処理装置及びその制御方法、プログラム
Lucas et al. Land cover classification based on general type-2 fuzzy classifiers
Fisette et al. Methodology for a Canadian agricultural land cover classification
Kezia et al. A color-texture based segmentation method to extract object from background

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061107