JP5188290B2 - アノテーション装置、アノテーション方法およびプログラム - Google Patents

アノテーション装置、アノテーション方法およびプログラム Download PDF

Info

Publication number
JP5188290B2
JP5188290B2 JP2008168267A JP2008168267A JP5188290B2 JP 5188290 B2 JP5188290 B2 JP 5188290B2 JP 2008168267 A JP2008168267 A JP 2008168267A JP 2008168267 A JP2008168267 A JP 2008168267A JP 5188290 B2 JP5188290 B2 JP 5188290B2
Authority
JP
Japan
Prior art keywords
image
region
metadata
database
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008168267A
Other languages
English (en)
Other versions
JP2010009337A (ja
Inventor
悠一 吉田
満 安倍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso IT Laboratory Inc
Original Assignee
Denso IT Laboratory Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso IT Laboratory Inc filed Critical Denso IT Laboratory Inc
Priority to JP2008168267A priority Critical patent/JP5188290B2/ja
Publication of JP2010009337A publication Critical patent/JP2010009337A/ja
Application granted granted Critical
Publication of JP5188290B2 publication Critical patent/JP5188290B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、画像に含まれる領域にメタデータを付与するアノテーション装置に関する。
近年、インターネット等のネットワーク上に多くの画像が公開されるようになり、その画像をテキストで検索できるようにする技術が提案されている。画像をテキストで検索するためには、画像にキーワード(例えば東京タワーや富士山など)を付与する必要がある。従来、画像にキーワードを付与する方法として、データベースに画像を登録する際にユーザが手でキーワードを入力する方法が知られている(例えば特許文献1参照)。
特開平11−175556号公報
ところで、これらの画像には、被写体として様々な対象物が含まれている。例えば、ある画像には「東京タワー」という対象物が含まれており、他の画像には「富士山」という対象物が含まれている。しかしながら、このような画像に含まれる領域にキーワードを付与することについては、従来、何ら提案がなされていない。
一般に、ネットワーク上には無数の画像が存在しており、また、これらの画像は、日々、アップロードされる。したがって、これらの大量の画像から対象物を探し出してキーワードを付与するには多大な作業量が必要であり、ユーザが手でキーワードを入力することは容易ではない。また、キーワードを付与する対象物は、そのときの流行に応じて様々に変化する。そして、新たな対象物が追加されると、その対象物を大量の画像から探し出してキーワードを付与することになり、その都度、ユーザが手でキーワードを入力することは現実的でない。
本発明は、上記の課題に鑑みてなされたもので、画像に含まれる領域にメタデータを容易に付与することのできるアノテーション装置を提供することを目的とする。
本発明のアノテーション装置は、複数の画像が記憶された画像データベースから少なくとも一つの画像を選択する画像選択手段と、選択された前記画像から少なくとも一つの領域を抽出する領域抽出手段と、抽出された前記領域に含まれる特徴点と前記画像データベースに記憶された前記複数の画像に含まれる特徴点との照合を行う特徴点照合手段と、前記照合の結果、前記領域と特徴点が一致すると判定された画像のメタデータを、前記領域のメタデータとして付与する領域メタデータ付与手段と、を備えている。
この装置によれば、画像から抽出した領域と画像データベースの画像との特徴量の照合を行うことにより、その領域と類似する部分が含まれる画像を見つけ出し、その画像に付与されているメタデータをその領域のメタデータとして付与する。これにより、画像データベースに記憶されている大量の画像に付与されているメタデータを利用して、ある画像から抽出した領域にメタデータを自動的に付与することができる。
また、本発明のアノテーション装置では、前記領域抽出手段は、選択された前記画像に含まれる特徴点に基づいて、前記画像から抽出する前記領域を決定してもよい。
これにより、画像に含まれる特徴点に基づいて、その画像から抽出する領域が決定されるので、適切な領域を画像から抽出することができる。
また、本発明のアノテーション装置では、前記領域メタデータ付与手段は、選択された前記画像に複数の前記領域が含まれており、前記複数の領域に同一の前記メタデータが付与される場合には、前記複数の領域をまとめて一つの領域を生成する。
これにより、一つの画像から複数の領域が抽出され、それら複数の領域に同一のメタデータが付与される場合に、それらの複数の領域をまとめて一つの領域が生成される。すなわち、領域の抽出が完全ではなかった場合に、それを補正することができる。
本発明のアノテーション方法は、複数の画像が記憶された画像データベースから少なくとも一つの画像を選択し、選択された前記画像から少なくとも一つの領域を抽出し、抽出された前記領域に含まれる特徴点と前記画像データベースに記憶された前記複数の画像に含まれる特徴点との照合を行い、前記照合の結果、前記領域と特徴点が一致すると判定された画像のメタデータを、前記領域のメタデータとして付与する。
この方法によれば、画像データベースに記憶されている大量の画像に付与されているメタデータを利用して、ある画像から抽出した領域にメタデータを自動的に付与することができる。
本発明のアノテーションプログラムは、コンピュータに、複数の画像が記憶された画像データベースから少なくとも一つの画像を選択する処理と、選択された前記画像から少なくとも一つの領域を抽出する処理と、抽出された前記領域に含まれる特徴点と前記画像データベースに記憶された前記複数の画像に含まれる特徴点との照合を行う処理と、前記照合の結果、前記領域と特徴点が一致すると判定された画像のメタデータを、前記領域のメタデータとして付与する処理と、を実行させる。
このプログラムによっても、画像データベースに記憶されている大量の画像に付与されているメタデータを利用して、ある画像から抽出した領域にメタデータを自動的に付与することができる。
本発明によれば、画像のメタデータを領域のメタデータとして付与する領域メタデータ付与手段を設けることにより、画像に含まれる領域にメタデータを容易に付与することができる。
以下、本発明の実施の形態のアノテーション装置について、図面を用いて説明する。本実施の形態では、画像検索システム等のためのメタデータ付与に用いられるアノテーション装置の場合を例示する。本実施の形態のアノテーション装置は、アノテーション処理を行う機能を備えているともいえる。この機能は、装置のHDDやメモリ等に記憶されたプログラムによって実行される。
本発明の実施の形態のアノテーション装置の構成を、図1〜図3を用いて説明する。図1は、アノテーション装置の構成を示すブロック図である。図1に示すように、アノテーション装置1は、複数の画像が記憶された画像データベース2から画像を選択する画像選択部3と、選択した画像から特徴点を抽出する特徴点抽出部4と、選択した画像から領域を抽出する領域抽出部5を備えている。
特徴点抽出部4は、画像から抽出した特徴点(特徴的な点)のSIFT特徴量を算出する。SIFT特徴量は、画像中の特徴点の特徴量を、128次元のベクトル(特徴量ベクトルともいう)で表したものである。例えば、特徴点抽出部4は、1つの画像から2000個の特徴点を抽出し、その特徴点ごとに128次元の特徴量ベクトルを算出する。
領域抽出部5は、上記の特徴点抽出部4が画像から抽出した特徴点の集合を、その画像に含まれる領域として抽出する。この領域は、被写体として画像中に含まれる対象物(東京タワーや富士山など)に対応する。この場合、領域は、画像に含まれる特徴点の点列で表される(図3参照)。
また、アノテーション装置1は、抽出した領域に含まれる特徴点と画像データベース2内の画像に含まれる特徴点との照合を行う特徴点照合部6を備えている。この特徴点照合部6は、抽出した領域と画像データベース2内の画像で一致する特徴点の計算を行い、領域と画像とで一致した特徴点の数が所定の閾値以上であるか否かを判定する。領域と画像とで一致した特徴点の数が閾値以上であれば、領域と画像は一致すると判定される。例えば、特徴点の数の閾値は50である。
一致する特徴点の計算は、領域と画像のすべての特徴点の組合せについて、128次元の特徴量ベクトルの内積角度を算出し、最も小さい内積角度と二番目に小さい内積角度に十分な差がある場合には、その領域と画像の特徴点は一致したとみなされる。例えば、二番目に小さい内積角度が、最も小さい内積角度の50%より小さい場合には、十分な差があるとして、領域と画像の特徴点は一致したとみなされる。
また、このアノテーション装置1は、特徴点照合部6による照合の結果、領域と特徴点が一致すると判定された画像のメタデータを、領域のメタデータとして付与する領域メタデータ付与部7を備えている。また、この領域メタデータ付与部7は、メタデータを付与した領域のデータを領域データベース8に書き込む機能を備えている。なお、メタデータには、キーワードやコメント、タグなどの情報が含まれる。
さらに、領域メタデータ付与部7は、選択された画像に複数の領域が含まれており、複数の領域に同一のメタデータが付与される場合には、複数の領域をまとめて一つの領域を生成する機能を備えている。つまり、この領域メタデータ付与部7は、領域の抽出が完全ではなかった場合に、それを補正する機能を有している。この機能については、図面を用いて後述する。
画像データベース2には、インターネット上から収集された複数の画像のデータが保存されており、各画像には、画像IDとキーワードが付与されている。図2は、画像データベース2の一例を示す図である。図2の例では、画像データベース2に、「東京タワー」というキーワードが付与された画像A、「富士山」というキーワードが付与された画像B、「東京タワー」というキーワードが付与された画像Cが記憶されている。
領域データベース8には、画像から抽出された複数の領域のデータが保存されており、各領域には、領域IDとキーワードが付与される。領域データは、画像に含まれる領域を示す点列(座標列)である。この点列は、特徴点抽出部4によって画像から抽出された特徴点の集合である。すなわち、画像から抽出する領域は、その画像に含まれる特徴点に基づいて決定されているともいえる。
図3は、領域データベース8の一例を示す図である。図3の上段には、アノテーション処理前の領域データが示されている。この領域データベース8には、「(0、0)(1、0)(2、0)・・・」という点列の領域aと、「(0、2)(1、2)(2、2)・・・」という点列の領域bが記憶されている。図3の下段には、アノテーション処理後の領域データが示されている。この例では、アノテーション処理によって、領域aに「東京タワー」というキーワードが付与され、領域bに「富士山」というキーワードが付与されている。
以上のように構成されたアノテーション装置1について、図4を用いてその動作を説明する。ここでは、本発明の特徴である領域へのメタデータ付与(アノテーション処理)の動作を中心に説明する。
本実施の形態のアノテーション装置1を用いて領域にメタデータを付与するときには、図4に示すように、まず、画像データベース2から画像(例えば画像A)を一つ選択する。つぎに、この選択された画像Aから領域を一つ選択する。
例えば、画像Aには、被写体として「東京タワー」が写っており、この「東京タワー」に対応する領域aが、画像Aから抽出される。そして、この領域aに含まれる特徴点と画像データベース2の複数の画像(画像A、B、C・・・)に含まれる特徴点との照合が行われる。その結果、領域aは画像Cと一致すると判定される。この画像Cには、「東京タワー」という画像のキーワードが付与されている。そのため、この場合には、画像Aから抽出した領域aのキーワードとして、画像Cのキーワードである「東京タワー」が付与される。そして、このようにして領域のキーワード「東京タワー」が付与された領域aのデータが、領域データベース8に記憶される。
また、画像Aには、被写体として「富士山」が写っており、画像Aからは、この「富士山」に対応する領域bも抽出される。そして、上記と同様にして、この領域bに含まれる特徴点と画像データベース2の複数の画像(画像A、B、C・・・)に含まれる特徴点との照合が行われる。その結果、領域bは画像Bと一致すると判定される。この画像Bには、「富士山」という画像のキーワードが付与されている。そのため、この場合には、画像Aから抽出した領域bのキーワードとして、画像Bのキーワードである「富士山」が付与される。そして、このようにして領域のキーワード「富士山」が付与された領域bのデータが、領域データベース8に記憶される。
つぎに、図5を参照して、アノテーション処理における領域抽出の補正機能を説明する。図5に示すように、画像データベース2から選択した画像Bから領域の抽出を行った結果、本来ひとつの領域として抽出されるべき領域c「富士山」が、二つの領域c1、c2に分かれて抽出されることがある。そのような場合、これら二つの領域c1、c2について特徴点の照合を行うと、二つの領域c1、c2はいずれも「富士山」の画像と特徴点が一致し、二つの領域c1、c2に「富士山」というキーワードが付与されることになる。
このような場合に、領域メタデータ付与部7は、これらの二つの領域c1、c2を統合(合成)した領域cを生成し、その領域cに「富士山」というキーワードを付与して領域データベース8に記憶する。このようにして、不完全な領域抽出が補正される。
このような本実施の形態のアノテーション装置1によれば、画像のメタデータを領域のメタデータとして付与する領域メタデータ付与部7を設けることにより、画像に含まれる領域にメタデータを容易に付与することができる。
すなわち、本実施の形態では、画像から抽出した領域と画像データベース2の画像との特徴量の照合を行うことにより、その領域と類似する部分が含まれる画像を見つけ出し、その画像に付与されているメタデータをその領域のメタデータとして付与する。これにより、画像データベース2に記憶されている大量の画像に付与されているメタデータを利用して、ある画像から抽出した領域にメタデータを自動的に付与することができる。
また、本実施の形態では、画像に含まれる特徴点に基づいて、その画像から抽出する領域が決定されるので、適切な領域を画像から抽出することができる。
また、本実施の形態では、一つの画像から複数の領域が抽出され、それら複数の領域に同一のメタデータが付与される場合に、それらの複数の領域をまとめて一つの領域が生成される。すなわち、領域の抽出が完全ではなかった場合に、それを補正することができる。
以上、本発明の実施の形態を例示により説明したが、本発明の範囲はこれらに限定されるものではなく、請求項に記載された範囲内において目的に応じて変更・変形することが可能である。
以上のように、本発明にかかるアノテーション装置は、画像に含まれる領域にメタデータを容易に付与することができるという効果を有し、画像のテキスト検索システム等に用いられ、有用である。
本実施の形態におけるアノテーション装置の構成を説明するためのブロック図である。 本実施の形態における画像データベースの説明図である。 本実施の形態における領域データベースの説明図である。 本実施の形態におけるアノテーション処理の流れを説明するための図である。 アノテーション処理における領域抽出の補正機能を説明するための図である。
符号の説明
1 アノテーション装置
2 画像データベース(画像DB)
3 画像選択部
4 特徴点抽出部
5 領域抽出部
6 特徴点照合部
7 領域メタデータ付与部
8 領域データベース(領域DB)

Claims (5)

  1. 複数の画像が記憶される画像データベースと、
    前記画像から抽出される複数の領域のデータが記憶される領域データベースと、
    前記画像データベースから少なくとも一つの画像を選択する画像選択手段と、
    選択された前記画像から少なくとも一つの領域を抽出する領域抽出手段と、
    抽出された前記領域に含まれる特徴点と前記画像データベースに記憶された前記複数の画像に含まれる特徴点との照合を行う特徴点照合手段と、
    前記照合の結果、前記領域と特徴点が一致すると判定された画像のメタデータを、前記領域のメタデータとして付与して、前記領域のメタデータが付与された領域のデータを前記領域データベースに登録する領域メタデータ付与手段と、
    を備えたことを特徴とするアノテーション装置。
  2. 前記領域抽出手段は、
    選択された前記画像に含まれる特徴点に基づいて、前記画像から抽出する前記領域を決定することを特徴とする請求項1に記載のアノテーション装置。
  3. 前記領域メタデータ付与手段は、
    選択された前記画像に複数の前記領域が含まれており、前記複数の領域に同一の前記メタデータが付与される場合には、前記複数の領域をまとめて一つの領域を生成することを特徴とする請求項1または請求項2に記載のアノテーション装置。
  4. 画像データベースと領域データベースを備えるアノテーション装置で実行されるアノテーション方法であって、
    前記画像データベースには、複数の画像が記憶されており、
    前記領域データベースには、前記画像から抽出される複数の領域のデータが記憶されており、
    前記アノテーション方法は、
    前記画像データベースから少なくとも一つの画像を選択し、
    選択された前記画像から少なくとも一つの領域を抽出し、
    抽出された前記領域に含まれる特徴点と前記画像データベースに記憶された前記複数の画像に含まれる特徴点との照合を行い、
    前記照合の結果、前記領域と特徴点が一致すると判定された画像のメタデータを、前記領域のメタデータとして付与して、前記領域のメタデータが付与された領域のデータを前記領域データベースに登録することを特徴とするアノテーション方法。
  5. 画像データベースと領域データベースを備えるアノテーション装置で実行されるアノテーションプログラムであって、
    前記画像データベースには、複数の画像が記憶されており、
    前記領域データベースには、前記画像から抽出される複数の領域のデータが記憶されており、
    前記アノテーションプログラムは、コンピュータに、
    前記画像データベースから少なくとも一つの画像を選択する処理と、
    選択された前記画像から少なくとも一つの領域を抽出する処理と、
    抽出された前記領域に含まれる特徴点と前記画像データベースに記憶された前記複数の画像に含まれる特徴点との照合を行う処理と、
    前記照合の結果、前記領域と特徴点が一致すると判定された画像のメタデータを、前記領域のメタデータとして付与して、前記領域のメタデータが付与された領域のデータを前記領域データベースに登録する処理と、
    を実行させることを特徴とするアノテーションプログラム。
JP2008168267A 2008-06-27 2008-06-27 アノテーション装置、アノテーション方法およびプログラム Active JP5188290B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008168267A JP5188290B2 (ja) 2008-06-27 2008-06-27 アノテーション装置、アノテーション方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008168267A JP5188290B2 (ja) 2008-06-27 2008-06-27 アノテーション装置、アノテーション方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2010009337A JP2010009337A (ja) 2010-01-14
JP5188290B2 true JP5188290B2 (ja) 2013-04-24

Family

ID=41589751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008168267A Active JP5188290B2 (ja) 2008-06-27 2008-06-27 アノテーション装置、アノテーション方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5188290B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012017599A1 (ja) * 2010-08-03 2012-02-09 パナソニック株式会社 情報処理装置、処理方法、コンピュータプログラム及び集積回路
JP5134664B2 (ja) * 2010-09-14 2013-01-30 株式会社東芝 アノテーション装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3334949B2 (ja) * 1993-06-22 2002-10-15 キヤノン株式会社 画像処理装置及びその方法
JP2004336466A (ja) * 2003-05-08 2004-11-25 Canon Inc メタデータ登録方法
JP2008148183A (ja) * 2006-12-13 2008-06-26 Seiko Epson Corp 画像処理装置、画像処理方法、および画像処理プログラム

Also Published As

Publication number Publication date
JP2010009337A (ja) 2010-01-14

Similar Documents

Publication Publication Date Title
KR101729195B1 (ko) 질의동작기반 안무 검색 시스템 및 방법
CN106446816B (zh) 人脸识别方法及装置
JP4337064B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US8483440B2 (en) Methods and systems for verifying automatic license plate recognition results
JP6590355B1 (ja) 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム
JP4457988B2 (ja) 画像管理装置、画像管理方法およびコンピュータプログラム
US9286526B1 (en) Cohort-based learning from user edits
JP2015512095A (ja) 画像データベースにおける画像管理のための方法、装置、および、コンピュータで読取り可能な記録媒体
JP6729553B2 (ja) システム、画像認識方法、および、プログラム
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
JP5808371B2 (ja) 画像認識装置、画像認識方法及び画像認識プログラム
JP6492880B2 (ja) 機械学習装置、機械学習方法、および機械学習プログラム
JP2017004252A (ja) 画像情報処理システム
CN106156794B (zh) 基于文字风格识别的文字识别方法及装置
JP6377917B2 (ja) 画像検索装置及び画像検索プログラム
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
JP2019212034A5 (ja)
JP2007058603A (ja) パターン認識方法及び装置及びプログラム
JP5004082B2 (ja) 文書画像検索方法、文書画像登録方法、そのプログラムおよび装置
JP2014142783A (ja) 情報処理装置及びプログラム
CN110688995A (zh) 地图查询的处理方法,计算机可读存储介质和移动终端
JP2007041762A5 (ja)
JP5169648B2 (ja) 原画像探索装置及び原画像探索プログラム
JP6175904B2 (ja) 照合対象抽出システム、照合対象抽出方法、照合対象抽出プログラム
CN113592881A (zh) 图片指代性分割方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120510

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5188290

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250