JP5430636B2 - データ取得装置、方法及びプログラム - Google Patents

データ取得装置、方法及びプログラム Download PDF

Info

Publication number
JP5430636B2
JP5430636B2 JP2011249676A JP2011249676A JP5430636B2 JP 5430636 B2 JP5430636 B2 JP 5430636B2 JP 2011249676 A JP2011249676 A JP 2011249676A JP 2011249676 A JP2011249676 A JP 2011249676A JP 5430636 B2 JP5430636 B2 JP 5430636B2
Authority
JP
Japan
Prior art keywords
cluster
image
data
feature value
local feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011249676A
Other languages
English (en)
Other versions
JP2013105373A (ja
Inventor
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2011249676A priority Critical patent/JP5430636B2/ja
Publication of JP2013105373A publication Critical patent/JP2013105373A/ja
Application granted granted Critical
Publication of JP5430636B2 publication Critical patent/JP5430636B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、対象物の認識に関する。
コンピュータにより画像からオブジェクト(例えば、建物、物品、人物、顔、動植物その他、各種の対象物)を認識する、いわゆるオブジェクト認識の分野において、認識対象とするオブジェクトを含む画像を複数用意して、学習しておくことで認識の精度を改善できることが知られている。そして、学習データとして、目的のオブジェクトを含む大量の画像を収集するには、対象とするオブジェクトの名称をクエリすなわち検索キーワードとした「Yahoo!検索(画像)」(非特許文献1参照)などの画像検索が利用可能である。また、特許文献1のように、検索キーとしてキーワードではなく画像すなわちクエリ画像を用い、類似画像検索により学習事例すなわち学習データを収集する技術も知られている。
特開2010−92413号
ヤフー株式会社、「Yahoo!検索(画像)」、[online]、[2011年10月14日検索]、インターネット〈URL: http://image-search.yahoo.co.jp/>
しかし、キーワードに基づく画像検索等により収集した画像集合には、必ずしも目的のオブジェクトが適切に写っていない画像がしばしば含まれる。不適切な画像の例は、話題は関連するがまったく異なる対象を写した画像、オブジェクトが明確に写っていない夜景、景色の他の要素が目立つ画像、部分拡大画像、特別な視点や手法、特殊映像効果による画像など多岐に亘る。これら不適切な画像を含んだままの画像集合を学習データとすると、オブジェクト認識の精度が低下するので、精度のよい学習データの獲得が重要な課題である。
この点、特許文献1の技術では、収集の基準となる特徴量が固定的となり、収集される画像はクエリ画像に依存してしまうため学習データの精度に限界があった。
上記の課題に対し、本発明の目的は、オブジェクト認識の精度を向上させる学習データを得ることである。
上記の目的をふまえ、本発明の一態様(1)であるデータ取得装置は、画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出手段と、前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成手段と、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定手段と、前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新手段と、要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得手段と、を備えたことを特徴とする。
本発明の他の態様(7)であるデータ取得方法は、上記態様を方法のカテゴリで捉えたもので、画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出処理と、前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成処理と、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定処理と、前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新処理と、要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得処理と、をコンピュータが実行することを特徴とする。
本発明の他の態様(8)であるデータ取得用コンピュータ・プログラムは、上記態様をコンピュータ・プログラムのカテゴリで捉えたもので、コンピュータに、画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出させ、前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成させ、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定させ、前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新させ、要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得させることを特徴とする。
本発明の上記態様では、目的のオブジェクトに係るものとして与えられた画像集合から最初に選択した画像を基準としその局所特徴量ごとにクラスタを生成し、以降に選択された画像の局所特徴量を、近似した特徴値のクラスタに分類してクラスタを更新してゆき、要素数の多いクラスタを基に抽出元の画像や特徴値をオブジェクト認識用のデータとして得る。
これにより、多くの画像に共通の一般的特徴が重視され少数派の特徴は無視されるので、目的とするオブジェクトの認識に適したデータを画像集合から得ることが可能となる。特に、適切な画像を最初に選択すれば、クラスタへの分類を正しく方向づけ、オブジェクト認識の精度が改善できる。
本発明の他の態様(2)は、上記いずれかの態様において、前記クラスタ更新手段は、2回目以降に選択された前記画像から抽出された前記局所特徴量に近似する前記特徴値が存在しない場合は、その局所特徴量に対応するクラスタを生成することを特徴とする。
本発明の他の態様(3)は、上記いずれかの態様において、前記クラスタ更新手段は、前記画像集合の画像に基づいて更新した前記クラスタを、再度、同じ画像集合の画像に基づいて更新することを特徴とする。
本発明の他の態様(4)は、上記いずれかの態様において、前記データ取得手段により取得されたデータを候補データとし、この候補データに基づく画像を前記画像集合から除いた新たな画像集合に対して、前記特徴量抽出手段、前記クラスタ生成手段、前記特徴値設定手段、前記クラスタ更新手段及びデータ取得手段により新たな候補データを取得させる再実行手段と、前記取得される候補データを比較し、画像数の多いものを最終的なオブジェクト認識用のデータとして選択する結果選択手段と、を備えたことを特徴とする。
本発明の他の態様(5)は、上記いずれかの態様において、前記データ取得手段は、前記要素数の多い前記クラスタに分類された前記局所特徴量を抽出した抽出元の前記画像を、オブジェクト認識のための学習用データとして取得することを特徴とする。
本発明の他の態様(6)は、上記いずれかの態様において、前記データ取得手段は、前記要素数の多い前記クラスタの前記特徴値を前記オブジェクト認識用のデータとして取得することを特徴とする。
なお、上記の各態様は、明記しない他のカテゴリ(方法、プログラム、システムなど)としても把握することができ、方法やプログラムのカテゴリについては、装置のカテゴリで示した「手段」を、「処理」や「ステップ」のように適宜読み替えるものとする。また、処理やステップの順序は、本出願に直接明記のものに限定されず、順序を変更したり、一部の処理をまとめてもしくは随時一部分ずつ実行するなど、変更可能である。
また、個々の手段、処理やステップを実現、実行する端末などのコンピュータは共通でもよいし、手段、処理やステップごとにもしくはタイミングごとに異なってもよい。また、上記「手段」の全部又は任意の一部を「部」(ユニット、セクション、モジュール等)と読み替えることができる。
本発明によれば、オブジェクト認識の精度を向上させる学習データを得ることが可能となる。
本発明の実施形態について構成を示す機能ブロック図。 本発明の実施形態におけるデータ例を示す図。 本発明の実施形態における処理手順を示すフローチャート。 本発明の実施形態における画像集合を示す概念図。 本発明の実施形態におけるクラスタへの分類を示す概念図。
次に、本発明を実施するための形態(「実施形態」と呼ぶ)について図に沿って例示する。なお、背景技術や課題などで既に述べた内容と共通の前提事項は適宜省略する。
〔1.構成〕
本実施形態は、図1の構成図に示すデータ取得装置1(以下「本装置1」や「本装置」とも呼ぶ)に関するもので、本装置1は、コンピュータの構成として少なくとも、CPUなどの演算制御部6と、主メモリや補助記憶装置等の記憶装置7と、通信ネットワークN(例えば、携帯電話、PHS、公衆無線LANなどの移動通信網、インターネットなど)との通信手段8(移動通信網との通信回路、無線LANアダプタなど)と、を有する。
本装置1では、記憶装置7に記憶した所定のコンピュータ・プログラムを演算制御部6が実行することで、図1に示す各手段などの要素(20,30ほか)を実現する。実現される要素のうち情報の記憶手段の態様は自由で、記憶装置7上のファイルなど任意のデータ形式で実現できるほか、ネットワーク・コンピューティング(クラウド)によるリモート記憶などでもよい。
また、記憶手段は、データの格納領域だけでなく、データの入出力や管理などの機能を含んでもよい。また、本出願に示す記憶手段の単位は説明上の便宜によるもので、適宜、構成を分けたり一体化できるほか、明示する記憶手段以外にも、各手段の処理データや処理結果などを記憶する記憶手段を適宜用いるものとする。
なお、本願のフロー図などにおいて、記憶手段を表す円筒型の図形は、直接アクセス記憶への限定は意味せず、また、六角形は準備ではなく判断を表すものとする。また、図中(例えば図1)の矢印は、データや制御などの流れについて主要な方向を補助的に示すもので、他の流れを否定するものでも、方向の限定を意味するものでもない。例えばある方向のデータ取得の前後に、データ要求や確認応答(ACK)が逆方向に発生し得る。
また、記憶手段以外の各手段は、以下に説明するような情報処理の機能・作用を実現・実行する処理手段であるが、これらは説明のために整理した機能単位であり、実際のハードウェア要素やソフトウェアモジュールとの一致は問わない。
〔2.作用効果〕
上記のように構成された本装置1での処理手順を図3のフローチャートに示す。
〔2−1.概要〕
まず、図3から概要のみ抽出して述べると、特徴量抽出手段20が、画像集合記憶手段15に記憶されている画像集合から画像を順次選択し、その画像から複数の局所特徴量を抽出する(ステップS11)。そして、クラスタ生成手段30は、画像集合から最初に選択された画像から抽出された局所特徴量ごとに、クラスタを生成する(ステップS12)。また、特徴値設定手段40は、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する(ステップS19)。
そして、クラスタ更新手段50は、画像集合Sから画像が選択される都度、その画像から抽出された局所特徴量(ステップS13)について、クラスタの特徴値に近似する局所特徴量が所定数以上であれば(ステップS15:「YES」)、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新する(ステップS16)。その更新の結果、最終的にデータ取得手段60が、要素数の多い(例えば所定割合以上の)クラスタを基に、オブジェクト認識用のデータを取得する(ステップS22)。
以下、各処理について具体的に説明する。
〔2−2.画像の選択とクラスタの生成〕
まず、与えられた画像集合Sに対する処理の最初において、特徴量抽出手段20は、画像集合Sからある画像(例えば画像aとする)を一つ選択し、その画像aから局所特徴量(例えばSIFT)を抽出する(ステップS11)。ここで、画像集合Sは、操作者が記憶媒体などで本装置1に与えてもよいが、本装置1が画像検索サーバ2などへ目的物の名称(例えば「東京タワー」など)を送信し、検索結果の画像を受信して画像集合Sとしてもよい。
そして、クラスタ生成手段30は、画像集合Sから最初に選択された画像aから抽出された局所特徴量ごとに、クラスタを生成する(ステップS12)。クラスタは局所特徴量の集合により構成され、クラスタを表すデータはクラスタ記憶手段35に記憶されるが(例えば図2)、具体的なデータ構成や登録内容の実現態様は自由である。
例えば、図2の例のようにクラスタごとに要素数すなわちそのクラスタに分類された局所特徴量の数(「要素数」)を記憶しておけば、要素数の多寡に応じたクラスタ単位の削除やデータの取得が容易になる。なお、クラスタと、クラスタに分類された局所特徴量との対応付けの態様も自由で、例えば、クラスタごとに局所特徴量のリストを持つ形でもよいし、逆に、抽出された局所特徴量ごとに、分類されたクラスタを示すクラスタIDなどのデータを持つ形でもよい。
また、図5(概念図)の例では、各クラスタ01,02,03にそれぞれ、画像aから抽出した例えば「上向きの尖頭部がある」(図4において破線の円で示す局所特徴量a1)、「右向きの凸部がある」(図4において破線の円で示す局所特徴量a2)といった局所特徴量が分類されているが、実際には、局所特徴量毎に抽出元の画像を示す識別情報などもクラスタのデータに含めることが考えられる。クラスタの生成直後は、各クラスタに1つの局所特徴量が分類され、その局所特徴量がクラスタの特徴値を兼ねる。抽出された局所特徴量とクラスタの特徴値については、画像上における座標の位置を考慮して照合などの処理が行われる。座標の位置の照合に、値が略一致する特徴量の座標上での位置関係を用いることにより、オブジェクトが画像に写っている角度やサイズの相違にも対応できる。
また、クラスタの生成は、単一の画像から抽出した局所特徴量ごとでもよいが、画像集合Sから最初に二つの画像a,bを選択し、それら二つの画像a,b間から抽出した類似する局所特徴量をransacなどのマッチング手法で座標の照合を行って対応づけ、照合により対応付けられた局所特徴量ごとにクラスタを作成することが望ましい。この場合、クラスタに対応付けられた局所特徴量の数が多ければ同一オブジェクトが存在すると判断でき、その局所特徴量の分布する座標の領域にオブジェクトが存在すると推定できる。
なお、最初に選択した画像a,b間で対応付けることができた局所特徴量の数がゼロ又は所定以下で同一オブジェクトが存在しないと考えられる場合、画像a又はbに代えて、画像集合Sから別の画像cを選択し、局所特徴量の抽出と対応付けをやり直す。又は、集合Sに含まれる画像全体に対して局所特徴量のマッチングを行ってもよい。
〔2−3.分類とクラスの新規生成〕
上記のように処理の最初にクラスタを生成した後、クラスタ更新手段50は、画像集合Sから画像が選択される都度、その画像から抽出された局所特徴量(ステップS13)と、全てのクラスタの特徴値とを、座標の比較を用いて照合する(ステップS14)。すなわち、ransacなどのマッチング手法によれば、局所特徴量のある座標の位置関係でオブジェクトの有無を判定でき、このransacなどのマッチング手法を用いて、画像から抽出した各局所特徴量と、各クラスタの特徴値との間で、座標と値の照合を行う。
照合の結果、画像から抽出された局所特徴量のうち、クラスタの特徴値に近似していて座標の位置関係も一致している局所特徴量が所定数(一つでもよい)以上であれば(ステップS15:「YES」)、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新する(ステップS16)。近似の判断に、局所特徴量の座標と、クラスタの特徴値である画像上での座標の重心との位置関係を考慮することにより、同一のオブジェクトの存在する画像の判定精度が向上する。
なお、最初に選択された画像a(ステップS11)からはクラスタが生成されるが(ステップS12)、クラスタ更新手段50は、その後、2回目以降に選択された画像から抽出された局所特徴量(ステップS13)のなかでクラスタに分類されなかったものについては(ステップS17:「NO」)、その局所特徴量に対応するクラスタを新たに生成する(ステップS18)。
〔2−4.特徴値の設定ほか〕
また、特徴値設定手段40は、各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する(ステップS19)。具体的には、クラスタごとに分類された局所特徴量について、特徴量空間上での重心と画像上での座標位置での重心を算出し、各クラスタの新たな特徴値として設定する。画像上での座標位置での重心は、多様な画像サイズや画像中におけるオブジェクトの回転や縮小拡大に対応するために、最初の画像の座標位置を基に、各画像ごとに回転角度や縮小拡大率を算出した後に座標を正規化する。
クラスタの特徴値としてこれら重心を用いることで、どのような局所特徴量(特徴量空間上での重心)が、画像のどのあたり(画像上での座標位置での重心)にあるか、に基づいてクラスタへの分類が可能となる。特に、局所特徴量について画像上での座標位置を判断に含めることで処理精度が高まる。
以上の処理を、未処理の画像が尽きる(ステップS20:「NO」)まで繰り返した後、オブジェクト認識用のデータの取得に進むが(ステップS22)、それに先立ってクラスタ内の要素数が所定以下のクラスタを削除してもよい(ステップS21)。これにより、例えば下記のようにクラスタの再更新をする際、少数しか存在しない特徴を分類対象から排除することで、主要な特徴に処理能力を集中できる。
〔2−5.クラスタの再更新〕
また、ステップS13での画像の選択順序により、クラスタの特徴値は変動するため、図3に示したステップS13からの処理を、一旦処理済となったクラスタ群に対して再度繰り返して再更新すれば、オブジェクトの特質を精度よく表した特徴値を生成することができる。この場合、クラスタ更新手段50は、画像集合の画像に基づいて更新したクラスタを、再度、同じ画像集合の画像に基づいて更新する。
〔2−6.データ取得の態様〕
以上のようにクラスタを更新した結果、最終的に、データ取得手段60は、要素数の多い(例えば所定割合以上の)クラスタを基に、オブジェクト認識用のデータを取得する(ステップS22)。
オブジェクト認識用のデータについて、具体的な内容や形式は自由であるが、その第一の例は、データ取得手段60が、要素数の多いクラスタに分類された局所特徴量を抽出した抽出元の画像を、オブジェクト認識のための学習用データとして取得することである。
例えば、図4の画像集合Sのうち、最初に画像aを選択すれば、目的のオブジェクト(例えば「○○タワー」)が明瞭に写っている画像a,c,fが取得の対象となり、「○○タワー」が一部のみ写っている画像b、夜景により不明瞭に写っている画像d、景色の一部として写っている画像e、他のオブジェクトの方が目立つ画像gは取得の対象とならない(説明上、×印で示している)。
オブジェクト認識用のデータに関する第二の例は、データ取得手段60が、要素数の多いクラスタの特徴値又はそのクラスタに分類された局所特徴量をオブジェクト認識用のデータとして取得することである。図5の例の状態では、例えば、要素数が最多(3つ)であるクラスタ02の特徴値(例えば特徴量空間上での重心と画像上での座標位置での重心)がオブジェクト認識用のデータとなる。
〔2−7.候補データの複数取得〕
また、オブジェクトの認識精度をさらに改善するには、オブジェクト認識用のデータを、複数取得することも考えられる。この場合、再実行手段70が、データ取得手段により取得されたデータを候補データとし、この候補データに基づく画像を画像集合から除いた新たな画像集合に対して、特徴量抽出手段20、クラスタ生成手段30、特徴値設定手段40、クラスタ更新手段50及びデータ取得手段60により新たな候補データを取得させる。
そのうえで、結果選択手段80が、最初に取得された候補データと、新たに取得された候補データと、を比較し、画像数の多いものを最終的なオブジェクト認識用のデータとして選択する。
〔3.効果〕
(1) 以上のように本実施形態では、目的のオブジェクトに係るものとして与えられた画像集合から最初に選択した画像を基準としその局所特徴量ごとにクラスタ(例えば図5、図2)を生成し(例えば図3のステップS12)、以降に選択された画像の局所特徴量を(ステップS13)、近似した特徴値のクラスタに分類してクラスタを更新してゆき(ステップS14〜S16)、要素数の多いクラスタを基に抽出元の画像や特徴値をオブジェクト認識用のデータとして得る(ステップS22)。
これにより、オブジェクトに共通する特徴が重視され、少数派の特徴は無視されて、認識用のデータが収集されていくので、オブジェクトの認識に適したデータを画像集合から得ることが可能となる。特に、適切な画像を最初に選択すれば、クラスタへの分類を正しく方向づけ、オブジェクト認識に用いるデータの精度が改善できる。
(2) 特に、本実施形態では、2つ目以降に選択された画像の局所特徴量に対応するクラスタがない場合に(ステップS17:「NO」)対応するクラスタを新たに生成することにより(ステップS18)、他の画像に含まれている可能性がある特徴も以降のクラスタ分類の対象とすることができ、オブジェクトの特徴を表すクラスタの生成漏れを防止できるので、オブジェクト認識の精度が改善できる。
(3) また、本実施形態では、画像集合に基づく1巡目で分類されたクラスタに対しさらに、同じ画像集合に基づいて2巡目としてクラスタを更新する。これにより、局所特徴量の近似性判断の基準としたクラスタごとの特徴量空間での重心や画像座標上での重心について、1巡目である程度整った状態を活用して、そのクラスタの特徴値を補正していくことにより、さらに高精度なクラスタ分類に反映できるので、オブジェクトの認識精度がさらに改善できる。
(4) さらに、本実施形態では、再実行手段70により、候補データを除いた画像集合から、更なる処理で別の候補データを取得し、結果選択手段80により、2つの候補データを比較し画像数の多いものを最終的なオブジェクト認識のデータとして選択する。
これにより、最初に選択された画像に偶然、目的のオブジェクトとは別のオブジェクトが写っていても、より目的のオブジェクトを写した画像が多く残る候補データを最終的なオブジェクト認識用のデータとすることができる。このため、画像数の多いほうの候補データを選択することで正しい処理結果が得られ、オブジェクトの認識性が改善できる。
(5) 加えて、本実施形態では、要素数の多いクラスタに追加された局所特徴量の抽出元である画像(例えば図7の画像a,c,f)を、オブジェクト認識のための学習用データとして取得することにより、実際のオブジェクト認識にはそれら画像に基づいて、用途などの事情に応じた任意のアルゴリズムを柔軟に適用可能となる。
(6) とりわけ、本実施形態では、要素数の多いクラスタ(例えば図5のクラスタ02)の特徴値をオブジェクト認識用のデータとして取得することにより、そのデータを実際のオブジェクト認識における認識対象として円滑に活用可能となる。
〔4.他の実施形態〕
なお、上記実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、本出願における構成図、データの図、フローチャートなどは例示に過ぎず、各要素の有無、その配置や処理実行などの順序、具体的内容などは適宜変更可能である。例えば、ステップS11で最初に選択する画像については、複数の画像を候補とし、その中から選択してもよい。具体的には、候補として選定した画像を基準画像とし、その基準画像と、集合S内の各画像との局所特徴量の照合を行い(ステップS15の処理)、マッチングする画像が多い基準の画像を最初の画像とすれば、より標準的なオブジェクトが存在する画像を用いて学習データを得ることができる。
また、本装置1を構成する個々の手段を実現する態様は自由で、外部のサーバが提供している機能をAPI(アプリケーション・プログラム・インタフェース)やネットワーク・コンピューティング(いわゆるクラウドなど)で呼び出して実現するなど、本発明の構成は柔軟に変更できる。さらに、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず物理的な電子回路など他の情報処理機構で実現してもよい。
01,02,03 各クラスタ
1 データ取得装置
2 画像検索サーバ
6 演算制御部
7 記憶装置
8 通信手段
15 画像集合記憶手段
20 特徴量抽出手段
30 クラスタ生成手段
35 クラスタ記憶手段
40 特徴値設定手段
50 クラスタ更新手段
60 データ取得手段
70 再実行手段
80 結果選択手段
a〜g 画像
a1,a2,a3,c1,c2,d2,d3 局所特徴量
N 通信ネットワーク
S 画像集合

Claims (8)

  1. 画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出手段と、
    前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成手段と、
    各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定手段と、
    前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似し且つ座標の位置関係が一致する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新手段と、
    要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得手段と、
    を備えたことを特徴とするデータ取得装置。
  2. 前記クラスタ更新手段は、
    2回目以降に選択された前記画像から抽出された前記局所特徴量に近似する前記特徴値が存在しない場合は、その局所特徴量に対応するクラスタを生成することを特徴とする請求項1記載のデータ取得装置。
  3. 前記クラスタ更新手段は、前記画像集合の画像に基づいて更新した前記クラスタを、再度、同じ画像集合の画像に基づいて更新することを特徴とする請求項1又は2記載のデータ取得装置。
  4. 前記データ取得手段により取得されたデータを候補データとし、この候補データに基づく画像を前記画像集合から除いた新たな画像集合に対して、前記特徴量抽出手段、前記クラスタ生成手段、前記特徴値設定手段、前記クラスタ更新手段及びデータ取得手段により新たな候補データを取得させる再実行手段と、
    前記取得される候補データを比較し、画像数の多いものを最終的なオブジェクト認識用のデータとして選択する結果選択手段と、
    を備えたことを特徴とする請求項1から3のいずれか一項に記載のデータ取得装置。
  5. 前記データ取得手段は、前記要素数の多い前記クラスタに分類された前記局所特徴量を抽出した抽出元の前記画像を、オブジェクト認識のための学習用データとして取得することを特徴とする請求項1から4のいずれか一項に記載のデータ取得装置。
  6. 前記データ取得手段は、前記要素数の多い前記クラスタの前記特徴値を前記オブジェクト認識用のデータとして取得することを特徴とする請求項1から5のいずれか一項に記載のデータ取得装置。
  7. 画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出する特徴量抽出処理と、
    前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成するクラスタ生成処理と、
    各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定する特徴値設定処理と、
    前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似し且つ座標の位置関係が一致する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新するクラスタ更新処理と、
    要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得するデータ取得処理と、
    をコンピュータが実行することを特徴とするデータ取得方法。
  8. コンピュータに、
    画像集合から画像を順次選択しその画像から複数の局所特徴量を抽出させ、
    前記画像集合から最初に選択された前記画像から抽出された前記局所特徴量ごとに、クラスタを生成させ、
    各クラスタに分類された全要素から該クラスタの特徴値を算出して、各クラスタに設定させ、
    前記画像集合から画像が前記選択される都度、その画像から抽出された前記局所特徴量のうち、前記クラスタの特徴値に近似し且つ座標の位置関係が一致する局所特徴量が所定数以上であれば、その局所特徴量を該近似する特徴値が設定されたクラスタに分類することでクラスタを更新させ、
    要素数の多い前記クラスタを基に、オブジェクト認識用のデータを取得させる
    ことを特徴とするデータ取得用コンピュータ・プログラム。
JP2011249676A 2011-11-15 2011-11-15 データ取得装置、方法及びプログラム Active JP5430636B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011249676A JP5430636B2 (ja) 2011-11-15 2011-11-15 データ取得装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011249676A JP5430636B2 (ja) 2011-11-15 2011-11-15 データ取得装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013105373A JP2013105373A (ja) 2013-05-30
JP5430636B2 true JP5430636B2 (ja) 2014-03-05

Family

ID=48624847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011249676A Active JP5430636B2 (ja) 2011-11-15 2011-11-15 データ取得装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5430636B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105203456A (zh) * 2015-10-28 2015-12-30 小米科技有限责任公司 植物品种识别方法及装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101439037B1 (ko) 2013-06-25 2014-09-15 주식회사 에스원 영상에서 객체를 추적하는 방법 및 장치
CN104133807B (zh) * 2014-07-29 2017-06-23 中国科学院自动化研究所 学习跨平台多模态媒体数据共同特征表示的方法及装置
JP6516531B2 (ja) * 2015-03-30 2019-05-22 株式会社メガチップス クラスタリング装置及び機械学習装置
CN106874936B (zh) * 2017-01-17 2023-07-11 腾讯科技(上海)有限公司 图像传播监测方法及装置
JP2020140488A (ja) * 2019-02-28 2020-09-03 大日本印刷株式会社 情報処理装置、情報処理方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4917575B2 (ja) * 2008-06-27 2012-04-18 株式会社デンソーアイティーラボラトリ 画像検索用データベース装置、画像検索用データベース管理方法およびプログラム
US8649614B2 (en) * 2009-03-04 2014-02-11 Osaka Prefecture University Public Corporation Method of compiling image database, image database compilation program, image retrieval method
JP5346756B2 (ja) * 2009-09-25 2013-11-20 Kddi株式会社 画像分類装置
JP5094830B2 (ja) * 2009-12-16 2012-12-12 ヤフー株式会社 画像検索装置、画像検索方法及びプログラム
JP2011210111A (ja) * 2010-03-30 2011-10-20 Nippon Telegr & Teleph Corp <Ntt> 画像特徴量生成装置及び方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105203456A (zh) * 2015-10-28 2015-12-30 小米科技有限责任公司 植物品种识别方法及装置

Also Published As

Publication number Publication date
JP2013105373A (ja) 2013-05-30

Similar Documents

Publication Publication Date Title
US20210192202A1 (en) Recognizing text in image data
US10936911B2 (en) Logo detection
WO2020199484A1 (zh) 基于视频的轨迹跟踪方法、装置、计算机设备及存储介质
JP5430636B2 (ja) データ取得装置、方法及びプログラム
CN110348441B (zh) 增值税发票识别方法、装置、计算机设备及存储介质
US8483440B2 (en) Methods and systems for verifying automatic license plate recognition results
CN111126125A (zh) 证件中的目标文本提取方法、装置、设备及可读存储介质
WO2019042419A1 (zh) 图像跟踪点获取方法、设备及存储介质
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
JPWO2009060975A1 (ja) 特徴点配置照合装置及び画像照合装置、その方法及びプログラム
WO2021189827A1 (zh) 识别模糊图像的方法、装置、设备及计算机可读存储介质
WO2020020047A1 (zh) 关键点匹配方法、装置、终端设备以及存储介质
JP6990880B2 (ja) 改善された画像分析または処理ワークフローあるいはその両方のための先を見越した入力選択
CN112132812B (zh) 证件校验方法、装置、电子设备及介质
WO2020230244A1 (ja) 学習方法、学習プログラム、および、学習装置
CN102637255A (zh) 用于处理图像中包含的面部的方法和设备
CN111914775A (zh) 活体检测方法、装置、电子设备及存储介质
CN111091106A (zh) 图像聚类方法及装置、存储介质、电子装置
CN110672102B (zh) 视觉辅助机器人初始化定位方法、机器人及可读存储介质
CN110633733A (zh) 图像智能匹配方法、装置及计算机可读存储介质
US10354409B2 (en) Image processing device, image processing method, and non-transitory computer-readable recording medium
JP4967045B2 (ja) 背景判別装置、方法及びプログラム
JP6365117B2 (ja) 情報処理装置、画像判定方法、及びプログラム
JP6143462B2 (ja) 画像検索装置、画像検索方法、検索元画像提供装置、検索元画像提供方法、及びプログラム
JP6244887B2 (ja) 情報処理装置、画像探索方法、及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130815

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131203

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5430636

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350