JP3530363B2 - 認識モデル生成方法および画像認識方法 - Google Patents

認識モデル生成方法および画像認識方法

Info

Publication number
JP3530363B2
JP3530363B2 JP32495797A JP32495797A JP3530363B2 JP 3530363 B2 JP3530363 B2 JP 3530363B2 JP 32495797 A JP32495797 A JP 32495797A JP 32495797 A JP32495797 A JP 32495797A JP 3530363 B2 JP3530363 B2 JP 3530363B2
Authority
JP
Japan
Prior art keywords
image
recognition model
cluster
images
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32495797A
Other languages
English (en)
Other versions
JPH11161788A (ja
Inventor
悦郎 藤田
伸治 安部
健司 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP32495797A priority Critical patent/JP3530363B2/ja
Publication of JPH11161788A publication Critical patent/JPH11161788A/ja
Application granted granted Critical
Publication of JP3530363B2 publication Critical patent/JP3530363B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像中の対象物を
認識するための認識モデル生成方法および、生成した認
識モデルに基づく画像認識方法に関するものである。
【0002】
【従来の技術】画像中の対象物を認識するための認識モ
デルの生成に関する手法は、近年多くの手法が提案され
ている。その中の一つに、認識モデル生成の対象である
対象物が写された画像から直接その対象物の認識モデル
を生成する手法がある。この従来の手法は、対象物が写
された画像に対して、人手により、画像中のどこに対象
物が写っているかを指定することにより、対象物の色ま
たはテクスチャに関する画像特徴を学習し、学習した画
像特徴と対象物を特徴付ける言語表現とを対応付けるこ
とで対象物の認識モデルを生成するというものである
(参考文献1:R.W.Picard and T.P.Minka,
“Vision texture for annotation”,J.Multimedi
a Systems 3,pp.3−14(1995))。例え
ば、対象物「空」が写された画像から対象物「空」の認
識モデルを生成する場合、人手により画像中の対象物
「空」の領域を空間的に指定することにより、対象物
「空」の画像特徴を学習し、学習した画像特徴と言語表
現「空」とを対応付けることで認識モデルを生成してい
る。
【0003】参考文献1では、風景画像を部分メッシュ
画像に分解し、次に、人手により、画像中の認識モデル
生成対象の対象物の領域に含まれる部分メッシュ画像を
複数指定することにより、対象物の画像特徴を学習し、
学習した画像特徴と対象物を特徴付ける言語表現とを対
応付けることで対象物の認識モデルを生成する方法を提
案している。例えば、対象物「空」が写された風景画像
から対象物「空」の認識モデルを生成する場合は、まず
風景画像を部分メッシュ画像に分解し、風景画像中の対
象物「空」の領域に含まれる部分メッシュ画像を人手に
より複数指定することにより、対象物「空」の画像特徴
を学習し、学習した画像特徴と言語表現「空」とを対応
付けることで対象物「空」の認識モデルを生成してい
る。
【0004】
【発明が解決しようとする課題】認識モデル生成対象の
対象物が写された画像に対して、人手により画像中のど
こに対象物が写っているかを指定することにより、対象
物の認識モデルを生成する従来の手法においては、認識
モデル生成対象の対象物の種類が多くなると、画像中の
対象物の領域を指定する作業量が増大するという問題が
ある。
【0005】本発明が解決しようとする課題は、画像中
のどこに対象物が写っているかを人手により指定するこ
となく、認識モデル生成対象の対象物が写された複数枚
の画像から、対象物の領域を自動的に見い出して対象物
の画像特徴を学習し、対象物の認識モデルを生成する方
法を提案することにある。
【0006】また、本発明は、生成した認識モデルを使
用して、未知画像に目的の対象物が写っているかどうか
を認識する方法を提案することにある。
【0007】
【課題を解決するための手段】本発明に係る認識モデル
生成方法は、認識モデル生成の対象物が共通に写された
複数枚の画像(認識モデル生成用画像)と該対象物を特
徴付ける言語表現を入力して、該入力された各画像を、
例えば等間隔メッシュに分割し、部分メッシュ画像に分
解する段階と、各部分メッシュ画像から色あるいはテク
スチャなどに関する特徴ベクトルを抽出する段階と、該
抽出された特徴ベクトルの集合を、階層構造を持つクラ
スタ群に分類する段階と、該得られたクラスタ群の各ク
ラスタに対して、クラスタを構成する各特徴ベクトルの
抽出元の部分メッシュ画像の集合が、認識モデル生成用
画像のすべての画像の少なくとも1つの部分メッシュ画
像を含むかどうかを調べて、含む場合には、このクラス
タを対象物の画像特徴を特徴付けるクラスタの候補とし
て登録する段階と、該登録された候補クラスタの中で、
クラスタを構成する特徴ベクトルの個数が最も少ないク
ラスタを選び、個数最小クラスタを構成する各特徴ベク
トルに対して、抽出元の部分メッシュ画像が認識モデル
生成対象である対象物の領域に含まれているかどうかを
調べて、抽出元の部分メッシュ画像がすべて、対象物領
域に含まれている場合には、そのクラスタを対象物の画
像特徴を特徴付けるクラスタ(対象物クラスタ)として
判定し獲得する段階と、該獲得した対象物クラスタの重
心を中心とする特徴ベクトル空間の超球でかつ、対象物
クラスタのすべての特徴ベクトルを含む超球を対象物の
画像特徴を特徴付ける領域として生成する段階と、該特
徴ベクトル空間の超球に対して、入力された言語表現を
対応付けることで対象物の認識モデルを生成する段階と
を有することを特徴とする。
【0008】また、本発明に係る画像認識方法は、入力
された未知画像を、例えば等間隔メッシュに分割し部分
メッシュ画像に分解する段階と、該未知画像の各部分メ
ッシュ画像から特徴ベクトルを抽出する段階と、該抽出
された各特徴ベクトルと前記認識モデル生成方法で生成
した対象物の認識モデルとの照合計算によって、未知画
像に対象物が写っているか否かを判定する段階を有する
ことを特徴とする。
【0009】ここで、認識モデル生成の対象である対象
物が共通に写された複数枚の画像は、次の2条件(条件
1)、(条件2)が満たされるようにする。 (条件1) 認識モデル生成用画像中の認識モデル生成
対象である対象物の領域は、認識モデル生成用のすべて
の画像間で、色あるいはテクスチャに関して類似した画
像特徴を持つ。 (条件2) 認識モデル生成用画像中の認識モデル生成
対象である対象物の領域以外の背景領域あるいはその一
部の領域は、認識モデル生成用のすべての画像間で、色
あるいはテクスチャに関して類似した画像特徴を持たな
い。
【0010】認識モデル生成対象の対象物の領域に含ま
れる部分メッシュ画像から抽出した特徴ベクトル群は、
(条件1)のため、特徴ベクトル空間内で近接し一つの
クラスタを形成する。したがって、階層的クラスタリン
グ段階で得られたクラスタ群の中から、このクラスタを
獲得することができれば、画像中の対象物の領域を人手
により指定することなく、対象物の画像特徴を学習する
ことが可能となり、対象物の認識モデルの生成が可能と
なる。
【0011】ところで、この所望のクラスタは、(条件
1)、(条件2)のため、次の(特徴1)、(特徴2)
を満たすクラスタとして特徴付けて良い。 (特徴1) クラスタは、認識モデル生成用画像のすべ
ての画像の少なくとも一つの部分メッシュ画像から抽出
した特徴ベクトルを含む。 (特徴2) クラスタは、特徴1を満たすクラスタの中
で階層が最も低い。すなわち、階層構造をデンドログラ
ムにより表現した場合、このクラスタは、特徴1を満た
すクラスタの中で、デンドログラム上最も末端に位置す
る。
【0012】したがって、これら2つの特徴を同時に満
たすクラスタを、階層的クラスタリング段階において得
られたクラスタ群の中より、探し出すことで所望のクラ
スタを獲得できる。このような方法で獲得したクラスタ
を、特徴付け領域生成段階において、クラスタを含むよ
り大きな超球に領域を一般化し、次いで、この超球に対
して、入力された言語表現を対応付けることで対象物の
認識モデルを生成する。生成された認識モデルは認識用
辞書として保持し、未知画像中の対象物の認識に利用す
る。
【0013】
【発明の実施の形態】以下に、本発明の実施の形態につ
いて図面を参照して説明する。図1は本発明の認識モデ
ル生成方法を実施する処理の流れを示す図である。この
処理は、キーボード、イメージスキャナ、ディスプレ
ィ、CPU及びメモリ装置などからなる所謂コンピュー
タシステムを使用して実現されるが、その構成は周知で
あるので図示は省略する。
【0014】まず、イメージスキャナなどを利用して、
あらかじめ認識モデル生成対象である対象物が共通に写
された複数毎の画像(認識モデル生成用画像)を入力
し、メモリ等に格納する(ステップ101)。また、キ
ーボードなどを使用して、この認識モデル生成対象であ
る対象物を特徴付ける言語表現を入力し、レジスタ等に
設定する(ステップ102)。ここで、認識モデル生成
対象である対象物が共通に写された複数毎の画像には、
先の2条件(条件1)、(条件2)が満たされるように
する。
【0015】次いで、CPU上で以下の処理を実行し
て、対象物の認識モデルを自動生成する。最初、入力さ
れた各画像を等間隔メッシュに分割し、部分メッシュ画
像に分解する(ステップ111)。次に、各画像につい
て、各部分メッシュ画像から色またはテクスチャなどに
関する特徴ベクトルを抽出し(ステップ112)、この
抽出された特徴ベクトルの集合を、階層構造を持つクラ
スタ群に分類する(ステップ113)。この得られたク
ラスタ群の各クラスタに対して、クラスタを構成する各
特徴ベクトルの抽出元の部分メッシュ画像の集合が、認
識モデル生成用画像のすべての画像の少なくとも1つの
部分メッシュ画像を含むかどうかを調べて、含む場合に
は、このクラスタを対象物の画像特徴を特徴付けるクラ
スタの候補として登録する(ステップ114)。次に、
この登録された候補クラスタの中で、クラスタを構成す
る特徴ベクトルの個数が最も少ないクラスタを選び、個
数最小クラスタを構成する各特徴ベクトルに対して、抽
出元の部分メッシュ画像が認識モデル生成対象である対
象物の領域に含まれているかどうかを調べて、抽出元の
部分メッシュ画像がすべて、対象物領域に含まれている
場合には、そのクラスタを対象物の画像特徴を特徴付け
るクラスタ(対象物クラスタ)として判定し獲得する
(ステップ115)。次に、この獲得した対象物クラス
タの重心を中心とする特徴ベクトル空間の超球でかつ、
対象物クラスタのすべての特徴ベクトルを含む超球を、
対象物の画像特徴を特徴付ける領域として生成する(ス
テップ116)。最後に、この生成された特徴ベクトル
空間の超球に対して、入力された言語表現を対応付ける
ことで認識モデルを生成する(ステップ117)。な
お、生成した認識モデルは認識用辞書として辞書メモリ
に保存する。
【0016】次に、本発明による認識モデル生成に関す
る具体的な処理例を図2,図3,図4を参照して説明す
る。
【0017】まず、認識モデル生成対象である対象物が
共通に写された画像1,・・・,画像Nを入力する。た
だし、各画像には次の2条件が満たされるようにする。 (条件1) 認識モデル生成用画像中の認識モデル生成
対象である対象物の領域は、認識モデル生成用のすべて
の画像間で、色あるいはテクスチャに関して類似した画
像特徴を持つ。 (条件2) 認識モデル生成用画像中の認識モデル生成
対象である対象物の領域以外の背景領域あるいはその一
部の領域は、認識モデル生成用のすべての画像間で、色
あるいはテクスチャに関して類似した画像特徴を持たな
い。
【0018】ここでは、例えば「青く晴れた空」という
対象物の認識モデルを生成することを想定し、対象物
「青く晴れた空」が共通に写された画像1,・・・,画
像Nを、(条件1)、(条件2)が満たされるように選
んで入力するものとする。(条件1)により、画像1,
・・・,画像Nにはそれぞれ、対象物「青く晴れた空」
の領域内にあってかつ、互いに類似した画像特徴を持つ
矩型領域が含まれていることになる。図2に、認識モデ
ル生成対象の対象物の領域を斜線部分で示す。この例で
は、a(1,1),a(2,1),a(N,K)など
が、互いに類似した画像特徴を持つ矩型領域である。こ
こで、矩型のサイズを最小のものにそろえることによっ
て、矩型領域のサイズを同一とすることができる。一
方、(条件2)により、このような性質を持つ矩型領域
は、それぞれ元の画像の対象物「青く晴れた空」の領域
に含まれるものに限られることになる。したがって、認
識モデル生成用画像の各画像中から、互いに類似した画
像特徴を持つサイズ同一の矩型領域を自動的に見い出す
ことができれば、その矩型領域の画像特徴を学習するこ
とにより、対象物「青く晴れた空」の画像特徴を、領域
を人手により指定することなく学習することが可能とな
る。ただし、この時点では、入力された各画像のどの位
置にその矩型領域が存在するかが処理系には分からない
ので、とりあえず、入力された各画像を適当なサイズの
等間隔メッシュに分割する。すなわち、入力された画像
1,・・・,画像Nを、画像分割処理(ステップ11
1)において、図2のように、適当なサイズの部分メッ
シュ画像a(1,1),・・・,a(N,K)に分解す
る。図2は4×4のメッシュに分割した例を示してい
る。なお、以下の一連の処理を行っても、対象物「青く
晴れた空」の画像特徴の学習が達成できない場合には、
等間隔メッシュの分割サイズをより小さいものに自動的
に変更して初めから処理をやり直すこととする。
【0019】次に、特徴ベクトル抽出処理(ステップ1
12)において、各部分メッシュ画像から色またはテク
スチャに関する特徴ベクトルv(1,1),・・・,v
(N,K)を抽出する。これを、同じく図2に示す。図
2では特徴ベクトル空間の次元を2次元としている。次
に、階層的クラスタリング処理(ステップ113)にお
いて、特徴ベクトルの集合{v(1、1)、・・・、v
(N、K)}を、図3のように、階層構造を持つクラス
タ群に分類する。図3は、3回統合処理を繰り返した後
のクラスタ形成の様子を表わし、クラスタに付けられた
数字は、そのクラスタが何回目の統合処理で形成された
かを表わしている。
【0020】なお、特徴ベクトル抽出に関しては、例え
ば、「Y-I Ohta T.Kanadeand T.Sakai,“Co
lor information for region segmentation”,Comp.
and Img.Proc.,13:222−241(198
0)」(参考文献2)や「J.Mao and A.K.Jai
n,“Texture classification and segmentationusing
multiresolution simultaneous autoregressive model
s”,Patt.Rec.,25(2):173−188(1
992)」(参考文献3)に詳述されており、階層的ク
ラスタリングに関しては、例えば、「高木幹男、下田陽
久、“画像解析ハンドブック”、東京大学出版会(19
91)」(参考文献4)に詳述されている。
【0021】次に、候補クラスタ登録処理(ステップ1
14)において、得られた各クラス夕に対して、図4に
示すように、クラスタを構成する特徴ベクトルの抽出元
の部分メッシュ画像の集合が、入力されたすべての画像
の少なくとも1つの部分メッシュ画像を含むかどうかを
調べて、含む場合には、このクラスタを対象物の画像特
徴を特徴付けるクラスタの候補として登録する。すなわ
ち、着目するクラスタCが、 C={v(i1,j1),v(i2,j2),・・・,v(ip,jp)} の特徴ベクトルで構成されるなら、これらp個の特徴ベ
クトルの抽出元の部分メッシュ画像で構成される集合C
^は C^={a(i1,j1),a(i2,j2),・・・,a(ip,jp)} と表わされるが、ここで、集合C^が、入力されたN枚
すべての画像の少なくとも一つの部分メッシュ画像を含
む場合には、このクラスタCを、対象物の画像特徴を特
徴付けるクラスタの候補として登録する。図4は、クラ
スタCがN枚すべての画像の少なくとも一つの部分メッ
シュ画像から抽出された特徴ベクトルを含んでいること
を表わしている。
【0022】次に、対象物クラスタ獲得処理(ステップ
115)において、登録した候補クラスタの中でクラス
タを構成する特徴ベクトルの個数が最も少ないクラスタ
minを選択し、次いで、クラスタCminを構成する各特
徴ベクトルの抽出元の部分メッシュ画像が、認識モデル
生成対象である対象物の領域に含まれているか否かを調
べて、抽出元の部分メッシュ画像がすべて対象物領域に
含まれている場合には、クラスタCminを対象物の画像
特徴を特徴付けるクラスタとして判定し獲得する。すな
わち、クラスタCminが、 Cmin={v(i1min,j1min),v(i2min,j2min),・・・, v(iqmin,jqmin)} と表わされるなら、クラスタCminの抽出元の部分メッ
シュ画像で構成される集合Cmin^は、 Cmin^={a(i1min,j1min),a(i2min,j2min),・・・, a(iqmin、jqmin)} と表わされるが、このとき、各部分メッシュ画像a(i
min,jkmin)が、対象物「青く晴れた空」の領域に
含まれているか否かを、図4のように、各部分メッシュ
画像a(ikmin,jkmin)にアウトラインを付けて元
の画像中で強調表示して調べて、各部分メッシュ画像a
(ikmin,jkmin)がすべて対象物「青く晴れた空」
の領域に含まれている場合には、クラスタCminを対象
物の画像特徴を特徴付けるクラスタとして判定し獲得す
る。
【0023】階層的クラスタリング処理(ステップ11
3)は類似した特徴ベクトル同士を順次統合してクラス
タを成長させる処理である。したがって、各部分メッシ
ュ画像から抽出したすべての特徴ベクトルは、最終的に
は一つのクラスタCmaxに統合される。ゆえに、候補ク
ラスタ登録処理(ステップ114)において登録した候
補クラスタの中には、クラスタCmaxも含まれることに
なる。ところが、入力された認識モデル生成用画像の中
には、一般に、対象物「青く晴れた空」の領域以外の別
の領域も存在するため、クラスタCmaxには、対象物
「青く晴れた空」の領域以外の別の領域に含まれる部分
メッシュ画像から抽出された特徴ベクトルも含まれる。
例えば、入力された画像1に、対象物「青く晴れた空」
以外に、例えば対象物「アスファルトの道路」が写って
いるとすると、対象物「アスファルトの道路」の領域に
含まれる部分メッシュ画像から抽出された特徴ベクトル
もCmaxに含まれる。候補クラスタ登録処理において登
録した候補クラスタの中から、クラスタを構成する特徴
ベクトルの個数が最も少ないクラスタを選択する理由
は、クラスタCmaxのように過剰成長し、対象物とは無
関係な特徴ベクトルを含む可能性のあるクラスタを除外
するためである。
【0024】なお、クラスタCminを構成するすべての
特徴ベクトルのうちで一つでも、特徴ベクトルの抽出元
の部分メッシュ画像が、認識モデル生成対象である対象
物の領域に含まれない場合には、使用した特徴量とは別
の特徴量を用いて再度、特徴ベクトル抽出処理(ステッ
プ112)の処理から一連の処理を繰り返すようにす
る。
【0025】次に、特徴付け領域生成処理(ステップ1
16)において、対象物クラスタの重心を中心とし、重
心と対象物クラスタの各特徴ベクトルとの距離の最大値
を半径とする特徴ベクトル空間の超球を、対象物「青く
晴れた空」の画像特徴を特徴付ける領域として生成す
る。そして、人手によって、「青く晴れた空」という言
語表現を入力する(ステップ102)。最後に、認識モ
デル生成処理(ステップ117)において、対象物「青
く晴れた空」を特徴付ける特徴ベクトル空間の超球に対
して、入力された言語表現「青く晴れた空」を対応付け
ることで、対象物「青く晴れた空」の認識モデルを生成
する。
【0026】図5は、上述のようにして生成した認識モ
デルに基づく本発明の画像認識方法を実施する処理の流
れを示す図である。この処理も実際にはコンピュータシ
ステム上で実現される。
【0027】まず、カメラや画像記録媒体などの未知画
像を入力する(ステップ201)。この入力された未知
画像を等間隔メッシュに分割して複数の部分メッシュ画
像に分解し(ステップ211)、該未知画像の各部分メ
ッシュ画像から特徴ベクトルを抽出する(ステップ21
2)。これらは、基本的に図1のステップ111,11
2と同様である。この抽出された各特徴ベクトルと上述
の認識モデル生成方法を用いて生成されて保存しておい
て認識モデルとの照合計算によって、未知画像中に対象
物が写っているか否かを判定する(ステップ213)。
【0028】次に、本発明の認識モデルに基づいた画像
認識方法の具体的な処理例を図6を参照して説明する。
ここでは、未知画像Xに対象物「青く晴れた空」が写っ
ているか否かを判定するとする。
【0029】未知画像Xを入力し、まず、画像分割処理
(ステップ211)において、未知画像Xを部分メッシ
ュ画像b(1),・・・,b(K)に分解する。次に、
特徴ベクトル抽出処理(ステップ212)において、未
知画像Xの各部分メッシュ画像b(j)(1≦j≦K)
から、対象物「青く晴れた空」の認識モデルを生成した
特徴量と同じ特徴量を用いて、特徴ベクトルw(1),
・・・,w(K)を抽出する。このように、各部分メッ
シュ画像b(j)から抽出する特徴量は、判定対象とな
る対象物の認識モデルを生成した特徴量と同一のものに
する必要がある。最後に、認識モデル照合処理(ステッ
プ213)において、対象物「青く晴れた空」の認識モ
デルとの照合計算によって、未知画像Xに対象物「青く
晴れた空」が写っているか否かを判定する。すなわち、
図6に示すように、抽出した特徴ベクトルw(1),・
・・,w(K)のうちで少なくとも一つの特徴ベクトル
が対象物の画像特徴を特徴付ける特徴ベクトル空間の超
球に含まれるかどうかを調べて、一つでも特徴ベクトル
が含まれる場合には、未知画像Xには対象物「青く晴れ
た空」が写っていると判定し、言語表現「青く晴れた
空」を未知画像Xに付与する。
【0030】
【発明の効果】以上説明したように、本発明によれば、
認識モデル生成対象である対象物が共通に写された複数
枚の画像を与えることによって、対象物の領域が画像中
のどこにあるかを人手により指定することなく、処理系
で対象物の領域を自動的に見い出して対象物の画像特徴
を学習し、対象物の認識モデルを生成することが可能と
なる。これにより、対象物の領域を人間が指定する従来
の手法と比較して認識モデルの生成に係る作業量を軽減
できる。また、このようにして生成された認識モデルに
基づいて、未知画像中から目的の対象物を容易に認識す
ることができる。
【図面の簡単な説明】
【図1】本発明の認識モデル生成方法に係る処理の流れ
を示す図である。
【図2】認識モデル生成用画像を等間隔メッシュに分割
した例及び各部分メッシュ画像から特徴ベクトルを抽出
した例を示す図である。
【図3】抽出した特徴ベクトルの集合を階層構造を持つ
クラスタ群に分類する過程を示す図である。
【図4】一つのクラスタを構成する各特徴ベクトルが、
どの部分メッシュ画像から抽出されたかを調べる過程を
示す図である。
【図5】本発明の画像認識方法に係る処理の流れを示す
図である。
【図6】未知画像X中の対象物を判定する処理の流れを
具体的に説明する図である。
【符号の説明】
101 認識モデル生成用画像入力 102 言語表現入力 111 認識モデル生成用画像に関する画像分割処理 112 認識モデル生成用画像に関する特徴ベクトル
抽出処理 113 階層的クラスタリング処理 114 候補クラスタ登録処理 115 対象物クラスタ獲得処理 116 特徴付け領域生成処理 117 認識モデル生成処理 201 未知画像入力 211 未知画像に関する画像分割処理 212 未知画像に関する特徴ベクトル抽出処理 213 認識モデル照合処理
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平7−160885(JP,A) 画像処理標準テキストブック編集委員 会,イメージプロセッシング<画像処理 標準テキストブック>,日本,財団法人 画像情報教育振興協会,1997年 2月25 日,pp.239−245 (58)調査した分野(Int.Cl.7,DB名) G06T 7/00 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 認識モデル生成の対象物が共通に写され
    た複数枚の画像(以下、認識モデル生成用画像)と前記
    対象物を特徴付ける言語表現を入力して認識モデルを生
    成する方法であって、 前記入力された各認識モデル生成用画像を部分画像に分
    解する段階と、 前記分解された各部分画像から特徴ベクトルを抽出する
    段階と、 前記抽出された特徴ベクトルの集合を、階層構造を持つ
    クラスタ群に分類する段階と、 前記分類されたクラスタ群の各クラスタに対して、クラ
    スタを構成する各特徴ベクトルの抽出元の部分画像の集
    合が、前記入力された認識モデル生成用画像のすべての
    画像の少なくとも1つの部分画像を含むかどうかを調べ
    て、含む場合に、当該クラスタを対象物の画像特徴を特
    徴付けるクラスタの候補として登録する段階と、 前記登録された候補クラスタの中で、クラスタを構成す
    る特徴ベクトルの個数が最も少ないクラスタを選び、個
    数最小クラスタを構成する各特徴ベクトルに対して、抽
    出元の部分画像が認識モデル生成対象である対象物の領
    域に含まれているかどうかを調べて、抽出元の部分画像
    がすべて、対象物領域に含まれている場合に、当該クラ
    スタを対象物の画像特徴を特徴付ける対象物クラスタと
    して判定し獲得する段階と、 前記獲得した対象物クラスタの重心を中心とする特徴ベ
    クトル空間の超球でかつ、対象物クラスタのすべての特
    徴ベクトルを含む超球を、対象物を特徴付ける領域とし
    て生成する段階と、 前記生成された特徴ベクトル空間の超球に対して前記入
    力された言語表現を対応付けることで対象物の認識モデ
    ルを生成する段階と、 を有することを特徴とする認識モデル生成方法。
  2. 【請求項2】 請求項1記載の認識モデル生成方法によ
    って生成された認識モデルに基づいて、入力された未知
    画像の対象物を認識する方法であって、 入力された未知画像を部分画像に分解する段階と、 未知画像の各部分画像から特徴ベクトルを抽出する段階
    と、 前記抽出された各特徴ベクトルと前記生成した対象物の
    認識モデルとの照合計算によって、未知画像に対象物が
    写っているか否かを判定する段階と、 を有することを特徴とする画像認識方法。
JP32495797A 1997-11-26 1997-11-26 認識モデル生成方法および画像認識方法 Expired - Fee Related JP3530363B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32495797A JP3530363B2 (ja) 1997-11-26 1997-11-26 認識モデル生成方法および画像認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32495797A JP3530363B2 (ja) 1997-11-26 1997-11-26 認識モデル生成方法および画像認識方法

Publications (2)

Publication Number Publication Date
JPH11161788A JPH11161788A (ja) 1999-06-18
JP3530363B2 true JP3530363B2 (ja) 2004-05-24

Family

ID=18171524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32495797A Expired - Fee Related JP3530363B2 (ja) 1997-11-26 1997-11-26 認識モデル生成方法および画像認識方法

Country Status (1)

Country Link
JP (1) JP3530363B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100870724B1 (ko) 2007-05-25 2008-11-27 인하대학교 산학협력단 t―test를 이용한 영상 인식시스템 및 그 방법
KR102286571B1 (ko) * 2016-03-17 2021-08-06 한국전자통신연구원 영상에서 다수의 객체를 인식하는 방법
US11048976B2 (en) * 2019-11-11 2021-06-29 Midea Group Co., Ltd. Method and system for controlling machines based on object recognition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
画像処理標準テキストブック編集委員会,イメージプロセッシング<画像処理標準テキストブック>,日本,財団法人画像情報教育振興協会,1997年 2月25日,pp.239−245

Also Published As

Publication number Publication date
JPH11161788A (ja) 1999-06-18

Similar Documents

Publication Publication Date Title
US8165410B2 (en) Bags of visual context-dependent words for generic visual categorization
US6738494B1 (en) Method for varying an image processing path based on image emphasis and appeal
US7440638B2 (en) Image retrieving system, image classifying system, image retrieving program, image classifying program, image retrieving method and image classifying method
US20020168108A1 (en) Event clustering of images using foreground/background segmentation
EP0944018B1 (en) Method and apparatus for recognizing image pattern, method and apparatus for judging identity of image patterns, recording medium for recording the pattern recognizing method and recording medium for recording the pattern identity judging method
EP2023288A1 (en) Object recognition device, object recognition program, and image search service providing method
CN111340701A (zh) 一种基于聚类法筛选匹配点的电路板图像拼接方法
CN105956631A (zh) 一种面向电子图库的在线渐进式图像分类方法
CN113221956B (zh) 基于改进的多尺度深度模型的目标识别方法及装置
US8170332B2 (en) Automatic red-eye object classification in digital images using a boosting-based framework
CN112580480A (zh) 一种高光谱遥感影像分类方法及装置
CN114331946A (zh) 一种图像数据处理方法、设备以及介质
CN116503622A (zh) 基于计算机视觉图像的数据采集读取方法
CN115203408A (zh) 一种多模态试验数据智能标注方法
CN111444816A (zh) 一种基于Faster RCNN的多尺度密集行人检测方法
Sahbi et al. From coarse to fine skin and face detection
CN113628181A (zh) 图像处理方法、装置、电子设备及存储介质
JP3530363B2 (ja) 認識モデル生成方法および画像認識方法
JPH09171552A (ja) 画像認識装置
CN112232221A (zh) 用于人物图像处理的方法、系统和程序载体
Raihan et al. CNN modeling for recognizing local fish
JP6778625B2 (ja) 画像検索システム、画像検索方法及び画像検索プログラム
CN114445916A (zh) 一种活体检测方法、终端设备及存储介质
CN107545261A (zh) 文本检测的方法及装置
JP2000090113A (ja) マルチメディア・クラスタリング装置、マルチメディア・クラスタリング方法および記録媒体

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040227

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080305

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100305

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees