JP2013161295A - ラベル付加装置、ラベル付加方法及びプログラム - Google Patents

ラベル付加装置、ラベル付加方法及びプログラム Download PDF

Info

Publication number
JP2013161295A
JP2013161295A JP2012023310A JP2012023310A JP2013161295A JP 2013161295 A JP2013161295 A JP 2013161295A JP 2012023310 A JP2012023310 A JP 2012023310A JP 2012023310 A JP2012023310 A JP 2012023310A JP 2013161295 A JP2013161295 A JP 2013161295A
Authority
JP
Japan
Prior art keywords
image data
label
cluster
feature amount
added
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012023310A
Other languages
English (en)
Other versions
JP5889019B2 (ja
Inventor
Tomoki Fujimori
友貴 藤森
Katsuhiko Mori
克彦 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012023310A priority Critical patent/JP5889019B2/ja
Publication of JP2013161295A publication Critical patent/JP2013161295A/ja
Application granted granted Critical
Publication of JP5889019B2 publication Critical patent/JP5889019B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】精度の高い効率的なラベリングを行う。
【解決手段】ラベル付加装置は、画像データの特徴量を算出し(ステップS301)、特徴量に基づいて、画像データをクラスタに分類する(ステップS302)。次にラベル付加装置は、クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる(ステップS303)。次にラベル付加装置は、表示された画像データに対して付加されるラベルの指定を受け付け、指定を受け付けたラベルを、表示手段に表示された画像データと同一クラスタ内の画像データに対して付加する
(ステップS305)。
【選択図】図3

Description

本発明は、画像データに対してラベリングを行う技術に関するものである。
認識技術において、学習データのラベルが予め教示されている教師付き学習では、教師なし学習と比べて、一般的に高い精度が見込まれている。但し、この教師付き学習の精度を高めるために、予め教示されるべきラベルの正確性は重要である。ラベルの付加を誤って行えば、評価時に正確な認識率を算出することができなくなり、結果として誤った評価をしてしまう。また、学習時では学習データに誤ったラベルが含まれることにより、適切なモデルを生成することができず、認識性能を落としてしまうことがある。よって、正確にラベルを付加することは重要である。
ラベルを付加する際の主な手法として、手動でラベルを付加する手法と自動でラベルを付加する手法との2種類がある。非特許文献1には、手動でラベルを付加する手法が開示されている。非特許文献1に開示される手法においては、手動でラベルを付加することでラベルの信頼度は増すが、非常に手間がかかり、コストがかかる。
非特許文献2には、自動でデータセットを作成する手法が開示されている。即ち、非特許文献2に開示される手法では、予めラベルが付加されたデータを学習データとして利用し、Nearest Neighborを用いてデータを分類し、分類したデータにラベルを付加してデータセットを作成する。ここでNearest Neighborとは、特徴空間上で距離の近いデータに、学習データの代表点に近いデータのラベルを自動で付加する手法である。
Caltech-101/256、インターネット<URL:http://www.vision.caltech.edu/Image_Datasets/Caltech101/> Yanai K. :Generic Image Classification Using Visual Knowledge on the Web, Proc. ACM International Conference Multimedia, pp.67-76 (2003).
しかしながら、非特許文献2に開示される手法では、手動でラベルを付加する手間を省くことができるが、ラベルの付加の際に使用される識別装置次第で性能が劣化し、手動でラベルを付加する手法と比べると、付加されるラベルの精度が落ちる。
ここで、ラベルを付加する際の評価基準について説明する。一般的な物体認識のように対象となる物体をカテゴリで認識する場合、当該物体に合わせて適切な名前を決定することは容易である。例えば、トラの画像に対してはトラのラベルが付加され、サルの画像に対してはサルのラベルが付加されるが、サルかトラかの微妙な判定に迷うことはない。ところが、外観検査における部品の画像を対象とした良否判定や身体の画像を対象とした病変有無の判定では、ラベルを付加すべき各状態に対してラベルに対応する値が連続で変化することから、ラベルを決定するのは容易ではない。また、手動でラベルを付加する手法を用いても、多数のデータに対してラベルを順次付加していくにつれて判定基準が変わり、誤ったラベルを判定してしまうこともある。
そこで、本発明の目的は、精度の高い効率的なラベリングを行うことにある。
本発明のラベル付加装置は、画像データの特徴量を算出する算出手段と、前記算出手段により算出された特徴量に基づいて、画像データをクラスタに分類する分類手段と、前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御手段と、前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付手段と、前記受付手段により指定を受け付けたラベルを、前記表示手段に表示された画像データと同一クラスタ内の画像データに対して付加する付加手段とを有することを特徴とする。
本発明によれば、精度の高い効率的なラベリングが可能となる。
本発明の実施形態に係るラベル付加システムの構成を示す図である。 表示装置における画面の表示例に示す図である。 本発明の第1の実施形態に係るラベル付加装置の処理を示すフローチャートである。 Haar Wavelet変換を概略的に示す図である。 本発明の第2の実施形態に係るラベル付加装置の処理を示すフローチャートである。 本発明の第3の実施形態に係るラベル付加装置の処理を示すフローチャートである。 図6のステップS606における再クラスタリング処理の詳細を示すフローチャートである。 本発明の第4の実施形態に係るラベル付加装置の処理を示すフローチャートである。 同じラベルが付加されたクラスタとの距離と異なるラベルが付加されたクラスタとの距離とを説明するための図である。 同じラベルが付加されたクラスタとの距離より小さい値の、異なるラベルが付加されたクラスタの代表画像データの表示例を示す図である。
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。
先ず、本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態に係るラベル付加システムの構成を示す図である。図1において、101は、ラベル付加装置である。ラベル付加装置101は、CPU(セントラルプロセッシングユニット)1011、RAM(ランダムアクセスメモリ)1012及びHDD(ハードディスクドライブ)1013を備える。なお、HDD1013には、CPU1011によって実行されるコンピュータプログラムが格納されており、CPU1011は、必要に応じてHDD1013からRAM1012にコンピュータプログラムを読み込んで実行する。
102は、画像データ入力装置である。画像データ入力装置102は、画像データを入力し、ラベル付加装置101に対して出力する。ラベル付加装置101は、画像データ入力装置102から入力した画像データに対してラベルを付加する。103は、モニタ等から構成され、ラベルが付加される前の画像データやラベルが付加された後の画像データを表示する表示装置103である。
図2は、表示装置103における画面の表示例に示す図である。図2において、201は、ラベルが付加された画像データを表示する代表画像データ表示領域である。オペレータは、ラベルが付加された画像データを代表画像データ表示領域201上で確認することができる。オペレータは、画像データに対してラベルを付加する際に、新たなラベルを今回付加すべきか、今まで付加されたラベルから今回付加すべきラベルを選択するかを判断する。203は、今まで付加された各ラベルに対応する画像データを表示する対応代表画像データ表示領域である。オペレータは、今までどのようなラベルが付加されてきたのかを対応代表画像データ表示領域203上で確認することができる。202は、対応代表画像データ表示領域203に対応して設けられたラベル選択ボタンである。オペレータは、対応代表画像データ表示領域203から所望のラベルを選択する際、該当するラベル候補ボタンを操作する。
図3は、第1の実施形態に係るラベル付加装置101の処理を示すフローチャートである。図3に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。以下、図3を参照しながら、ラベル付加装置101の処理について説明する。
ステップS301において、ラベル付加装置101は、画像データ入力装置102から入力された各画像データについて特徴量を算出する。ここで算出される特徴量としては、複数の統計的特徴量やHOGといった高次元の特徴量等が挙げられる。なお、HOGは、輝度の勾配をヒストグラムで表した特徴量である。HOGの詳細については下記の文献を参照されたい。
(文献)Navneet D.: Histograms of Oriented Gradients for Human Detection, Proc. CVPR 2005.
複数の統計的特徴量を算出する際には、画像データに対してHaar Wavelet変換が施されることにより、階層的に画像データが生成される。なお、Haar Wavelet変換は、位置情報を保持したまま周波数変換を行うことが可能な処理である。図4は、Haar Wavelet変換を概略的に示す図である。
Haar Wavelet変換においては、先ず画像データに対して4種類のフィルタ401〜404が用意される。一つ目のフィルタは縦方向高周波成分フィルタ401である。二つ目のフィルタは対角方向高周波成分フィルタ402である。三つ目のフィルタは低周波成分フィルタ403である。四つ目のフィルタは横方向高周波成分フィルタ404である。
そして、画像データの2×2の領域に対して上記フィルタで内積がとられる。2×2の領域を重ね合わせることなく移動させて、解像度が2分の1になるように、縦方向高周波成分画像データ405、対角方向高周波成分画像データ406、低周波成分画像データ407、及び、横方向高周波成分画像データ408の4種類の画像データが生成される。この際、解像度は2分の1となるため、画像データのサイズは2のn乗に設定しておくのが好ましい。算出された低周波成分画像データ407に対して上記4種類のフィルタ401〜404を用いてフィルタリングが施され、さらに解像度が2分の1となるような、次の階層に当たる縦方向高周波成分画像データ405、対角方向高周波成分画像データ406、低周波成分画像データ407、及び、横方向高周波成分画像データ408の4種類の画像データが生成される。さらに低周波成分画像データ407に対してフィルタリングが施され続けることにより、階層的に画像データが生成される。ここでは、1階層から7階層までの28種類の画像データに原画像データを加えた29種類の画像データが生成される。
次に、生成された29種類の画像データそれぞれから、全画素値の最大値、平均、分散、尖度、歪度及び相乗平均といった6種類のマクロな特徴量が算出される。次の式1は、画素値の最大値をマクロな特徴量として算出する方法を示している。式2は、画素値の平均をマクロな特徴量として算出する方法を示している。式3は、画素値の分散をマクロな特徴量として算出する方法を示している。式4は、画素値の尖度をマクロな特徴量として算出する方法を示している。式5は、画素値の歪度をマクロな特徴量として算出する方法を示している。式6は、画素値の相乗平均をマクロな特徴量として算出する方法を示している。但し、画像データのサイズは縦a画素、横b画素であり、画像データの縦i番目、横j番目の画素値をp(i,j)と表記している。
Figure 2013161295
以上のように、Haar Wavelet変換が行われていない原画像データと、Haar Wavelet変換によって生成された各階層の画像データとの29種類の画像データから、式1〜式6によって特徴量が算出される。このように29種類の画像データからマクロな特徴量が6種類ずつ算出されるため、画像データ入力装置102から入力された各画像データについて、29×6=174種類(以下、N種類とする)の特徴量が算出されることになる。
但し、次元数が多くなることにより、認識精度が落ちる次元の呪いと呼ばれる現象が生じることがあるため、N種類の特徴量が適当であるか否かは特徴選択を用いて評価してもよい。特徴選択には、大きく分けてラッパー法とフィルタ法との2種類が存在する。ラッパー法とは、訓練データを訓練用と評価用とに分け、認識結果が最もよくなるような特徴量が決定される。一般的に、ラッパー法では、最適な特徴量を求めることができるが、画像識別処理が行われるため、特徴量を選択するのに膨大な計算時間がかかる。一方、フィルタ法とは、特徴量一つ一つに対し、どれだけデータを分類することができるかを定量的に評価し、評価が高い特徴量から順に選択する方法である。例えば2クラス問題の場合、ベイズ誤り確率推定値が求められる。ここで2つのクラスをw1、w2とし、特徴の値をxとするとき、xがw1、w2に属する確率をそれぞれP(w1|x)、P(w2|x)と表す。ここで、ベイズ誤り確率推定値は次の式7で表され、ベイズ誤り確率推定値が低いほどよい。
Figure 2013161295
なお、ここでは2クラス問題の場合について説明したが、ベイズ誤り確率推定値は多クラスについても適用可能である。ラッパー法に比べて計算時間はかからないが、最適な特徴量が算出されにくい。本実施形態においては、特徴選択を用いず、N種類の特徴量を全て用いるものとする。
ステップS302において、ラベル付加装置101は、ステップS301にて算出した特徴量に基づいて各画像データをクラスタリングし、クラスタ毎に代表画像データを決定する。ここで、画像データのクラスタリング処理の前段において、N種類の特徴量の分布に偏りが生じないように、それぞれの特徴量の標準偏差で正規化され、N次元の特徴空間上に画像データが分類される。そして、画像データのクラスタリング処理が実行されるが、クラスタリング処理の手法としてはどの手法を用いてもよい。以下では、k-means法を用いた場合について説明する。k-means法とは、特徴量のユークリッド距離が最も近いクラスタに画像データを分類する手法である。具体的には、先ずk個のクラスタに画像データがランダムに分類される。そして、各クラスタ内の画像データの特徴量の平均値が求められ、各画像データについて、当該画像データの特徴量からユークリッド距離が最も近い特徴量の平均値を持つクラスタに対して当該画像データが再分類される。この再分類がなされなくなったときに、クラスタリング処理が完了する。また、クラスタ毎の代表画像データを決定する際には、ラベル付加装置101は、画像データをクラスタリングした結果、各クラスタ内における画像データの特徴量の平均値に最も近い特徴量の画像データを代表画像データとして決定する。
ステップS303において、ラベル付加装置101は、ステップS302にて決定した代表画像データを表示装置103に表示させる。ステップS304において、ラベル付加装置101は、ステップS303にて表示装置103で表示された代表画像データに付加されるラベルの指定をオペレータから受け付け、当該ラベルを代表画像データに付加する。なお、オペレータからの指定に応じてラベルを付加する他、遠隔監視システム又はコンピュータプログラムによって自動的にラベルを付加するようにしてもよい。これにより、図2の代表画像データ表示領域201においてラベルが付加された代表画像データが表示される。なお、ステップS303は、表示制御手段の処理例であり、ステップS304は、受付手段の処理例である。
ステップS305において、ラベル付加装置101は、ステップS304においてラベルが付加された代表画像データと同一クラスタ内の全ての画像データに対して、代表画像データと同じラベルを付加する。
第1の実施形態においては、代表画像データに対してラベルを付加することにより、代表画像データと同一クラスタ内の全ての画像データに同じラベルが自動的に付加される。ところで、クラスタ数kが減少するにつれて、画像データに対して誤ったラベルが付加される可能性が高くなる。従って、クラスタ数kは、各クラスタに分類される画像データをオペレータが容易に確認することができる程度の値に設定することが好ましい。
第1の実施形態によれば、画像データに対して自動でラベリングを行うことにより、手動でラベリングするに比べて手間が省け、精度の高い効率的なラベリングが可能となる。
次に、第2の実施形態について説明する。第2の実施形態では、同一のクラスタに分類された画像データであるが、代表画像データの特徴量からユークリッド距離から離れている特徴量の画像データであるため、当該画像データに誤ったラベルが付加されてしまうことを防止する方法について説明する。
図5は、第2の実施形態に係るラベル付加装置の処理を示すフローチャートである。以下、図5を参照しながら、第2の実施形態に係るラベル付加装置の処理について説明する。なお、図5におけるステップS301〜S304は、図3におけるステップS301〜S304と同じ処理である。即ち、ステップS304の処理を終えた時点で、クラスタ毎に画像データが分類され、各クラスタの代表画像データに対してラベルが付加されている。また、第2の実施形態に係るラベル付加装置は、図1に示した第1の実施形態に係るラベル付加装置の構成と同様であるため、図1の符号を用いて第2の実施形態を説明するものとする。図5に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。
ステップS505において、ラベル付加装置101は、或るクラスタ内の画像データの平均ベクトルmと標準偏差σとを算出する。ステップS506において、ラベル付加装置101は、クラスタ内の或る画像データについて、平均ベクトルmからの距離が所定の閾値(ここでは、3σ)未満であるか否かを判定する。平均ベクトルmからの距離が所定の閾値未満である場合、処理はステップS507に移行する。一方、平均ベクトルmからの距離が所定の閾値以上である場合、処理はステップS508に移行する。
ステップS507において、ラベル付加装置101は、画像データに対して代表画像データと同じラベルを付加する。そして、処理はステップS511に移行する。ステップS508において、ラベル付加装置101は、画像データを表示装置103に表示させる。オペレータは、画像データを表示装置103で確認した上で、その画像データに対して代表画像データと同じラベルを付加すると判断した場合、ラベル付加装置101に対してその旨を指示する。
ステップS509において、ラベル付加装置101は、代表画像データと同じラベルを付加する指示があったか否かを判定する。代表画像データと同じラベルを付加する指示があった場合、処理はステップS510に移行する。一方、代表画像データとは異なるラベルを付加する指示があった場合、処理はステップS513に移行する。ステップS510において、ラベル付加装置101は、代表画像データと同じラベルを画像データに対して付加する。そして、処理はステップS511に移行する。ステップS513において、ラベル付加装置101は、オペレータの指示に応じたラベルを画像データに対して付加する。そして、処理はステップS511に移行する。
ステップS511において、ラベル付加装置101は、クラスタ内の全ての画像データについてステップS506以降の処理を実行したか否かを判定する。全ての画像データについてステップS506以降の処理を実行した場合、処理はステップS512に移行する。一方、ステップS506以降の処理を実行していない画像データが存在する場合、処理はステップS506に戻り、残りの画像データについて処理が実行される。ステップS512において、ラベル付加装置101は、全てのクラスタについてステップS505以降の処理を実行したか否かを判定する。全てのクラスタについてステップS505以降の処理を実行した場合、処理は終了する。一方、ステップS505以降の処理を実行していないクラスタが存在する場合、処理はステップS505に戻る。ここでは、ステップS506の判定処理に用いられる閾値を3σとしたが、この閾値はオペレータの指示に応じて任意の値に変更することが可能な値である。
以上により、第2の実施形態においては、同一のクラスタに分類された画像データであるが、代表画像データの特徴量からユークリッド距離から離れている特徴量の画像データであるため、当該画像データに誤ったラベルが付加されてしまうことを防止することができる。
次に、本発明の第3の実施形態について説明する。第3の実施形態は、画像データが分類されたクラスタ数が比較的少なく、同一クラスタ内に様々なラベルが付加された画像データが存在する場合、再クラスタリング処理を実行することにより、画像データを適切に分類する方法について説明する。
図6は、本発明の第3の実施形態に係るラベル付加装置の処理を示すフローチャートである。以下、図6を参照しながら、第3の実施形態に係るラベル付加装置の処理について説明する。なお、図6におけるステップS301及びS302は、図3のステップS301及びS302と同様の処理である。即ち、ステップS302の処理を終えた時点で、クラスタ毎に画像データが分類されている。但し、本実施形態においては、画像データ入力装置102からラベル付加装置101に入力される各画像データにはラベルが付加されているものとする。従って、ステップS302においてクラスタ毎に分類された画像データにもラベルが付加されている。なお、第3の実施形態に係るラベル付加装置は、図1に示した第1の実施形態に係るラベル付加装置の構成と同様であるため、図1の符号を用いて第3の実施形態を説明するものとする。図6に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。
ステップS603において、ラベル付加装置101は、或るクラスタから画像データをランダムにM個抽出する。ステップS604において、ラベル付加装置101は、抽出したM個の画像データを表示装置103に表示させる。オペレータは、表示装置103に表示された画像データを確認することにより、M個の画像データに対して同一のラベルが付加されているか否かを判断し、その判断結果をラベル付加装置101に対して入力する。このとき、オペレータが確認する画像データの個数であるM個の値が大きい場合、オペレータの判断基準がゆらぐ虞があるため、M=設定すべきラベルの数+5程度に設定されることが好ましい。
ステップS605において、ラベル付加装置101は、表示された全て(M個)の画像データには同一のラベルが付加されていることが入力されたか否かを判定する。同一のラベルがM個の付加されていることが入力された場合、処理はステップS608に移行する。一方、表示された画像データのうちの一部の画像データに異なるラベルが付加されていることが入力された場合、処理はステップS606に移行する。なお、一部の画像データに異なるラベルが付加されていることが入力される際には、どの画像データに対して異なるラベルが付加されているのかもオペレータによって入力される。
ステップS606において、ラベル付加装置101は、異なるラベルが付加された画像データが他のクラスタに分類されるように、再クラスタリング処理を行う。なお、再クラスタリング処理の詳細については後述する。ステップS607において、ラベル付加装置101は、再クラスタリング処理によって生成された或るクラスタからM個の画像データをランダムに抽出する。このとき、既に抽出された画像データが再び抽出されてもよい。そして、処理はステップS604に戻る。即ち、本実施形態においては、同一クラスタ内に異なるラベルが付加された画像データが存在しなくなるまで、ステップS606の再クラスタリング処理が繰り返し実行される。
ステップS608において、ラベル付加装置101は、画像データに付加されているラベルが確認されていないクラスタが存在するか否かを判定する。ラベルが確認されていないクラスタが存在する場合、処理はステップS609に移行する。一方、全てのクラスタについてラベルが確認された場合、処理は終了する。
ステップS609において、ラベル付加装置101は、ラベルが確認されていないクラスタのうちの或るクラスタからM個の画像データをランダムに抽出する。このとき、既に抽出された画像データが再び抽出されてもよい。そして、処理はステップS604に戻る。
図7は、図6のステップS606における再クラスタリング処理の詳細を示すフローチャートである。以下、図7を参照しながら、図6のステップS606における再クラスタリング処理について詳細に説明する。
ここでは、対象のクラスタ内にL(L>M)個の画像データが存在しているものとする。ステップS701において、ラベル付加装置101は、クラスタ一つあたりに画像データが一つ分類される状態に設定する。ここではL個の画像データが存在するため、L個のクラスタを持つ状態に設定される。
ステップS702において、ラベル付加装置101は、異なるクラスタに存在する画像データ1(x1)と画像データ2(x2)との間のユークリッド距離d(x1,x2)が最も近いクラスタ同士を逐次併合する。
ステップS703において、ラベル付加装置101は、ステップS605において指定された異なるラベルが付加された画像データを含むクラスタが併合される前に、クラスタの併合処理を中断する。その後、再クラスタリング処理の結果をオペレータに確認させるために、処理はステップS607に移行する。
以上により、第3の実施形態においては、同一クラスタ内に様々なラベルが付加された画像データが存在する場合、再クラスタリング処理を実行することにより、画像データを適切に分類することができる。
次に、本発明の第4の実施形態について説明する。第4の実施形態では、例えばクラスタ数が多めに設定される等の理由により、オペレータの評価基準にゆらぎが生じ、付加されているラベルに誤りが生じている可能性のある画像データを再表示し、オペレータに確認させる方法について説明する。
図8は、本発明の第4の実施形態に係るラベル付加装置の処理を示すフローチャートである。以下、図8を参照しながら、第4の実施形態に係るラベル付加装置の処理について説明する。なお、図8におけるステップS301〜S305は、図3のステップS301〜S305と同様の処理である。即ち、ステップS305の処理を終えた時点で、クラスタ毎に画像データが分類され、各クラスタ内の画像データには代表画像データと同一のラベルが付加されている。なお、第4の実施形態に係るラベル付加装置は、図1に示した第1の実施形態に係るラベル付加装置の構成と同様であるため、図1の符号を用いて第4の実施形態を説明するものとする。図8に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。
ステップS803において、ラベル付加装置101は、各クラスタの代表画像データに対応する特徴空間上の点を代表点として決定する。ステップS804において、ラベル付加装置101は或るクラスタを設定する。ステップS805において、ラベル付加装置101は、ステップS804で設定したクラスタの代表点と、クラスタと同じラベルが付加された他のクラスタの代表点とのユークリッド距離を全て算出する。そして、図9に示すように、ラベル付加装置101は、算出したユークリッド距離のうち、最も値が大きい(最も離れている)ユークリッド距離を第1の距離d1として設定する。
ステップS806において、ラベル付加装置101は、ステップS803で設定したクラスタの代表点と、当該クラスタと異なるラベルが付加された他のクラスタの代表点とのユークリッド距離を全て算出する。そして、図9に示すように、ラベル付加装置は、ここで算出された各ユークリッド距離を第2の距離d2(1)、d2(2)、・・・として設定する。
ステップS807において、ラベル付加装置101はd1とd2(d2(1)、d2(2)、・・・)とを比較する。そして、ラベル付加装置101は、d1より小さい値のd2に該当するクラスタの代表画像データを表示装置103に表示させる。このように、ラベル付加装置101は、d1より小さい値のd2に該当するクラスタの代表画像データを表示させ、オペレータに確認させることにより、当該代表画像データに対して付加されているラベルの妥当性を判断させる。
ステップS808において、ラベル付加装置101は、全てのクラスタについてステップS804以降の処理を実行したか否かを判定する。全てのクラスタについてステップS804以降の処理を実行した場合、処理は終了する。一方、全てのクラスタについてステップS804以降の処理を実行していない場合、処理はステップS804に戻り、残りのクラスタについてステップS804以降の処理が実行される。
図10は、d1より小さい値のd2に該当するクラスタの代表画像データの表示例を示す図である。図10に示すように、オペレータによって当該代表画像データにはラベル4が付加されているが、ステップS804において設定されたクラスタと同じラベル(ラベル1)の方が適切である可能性があることが通知される。
第4の実施形態においては、例えばクラスタ数が多めに設定される等の理由により、オペレータの評価基準にゆらぎが生じ、付加されているラベルに誤りが生じた場合でも、その可能性がある代表画像データを再表示させ、オペレータに確認させることができる。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101:ラベル付加装置、102:画像データ入力装置、103:表示装置、1011:CPU、1012:RAM、1013:HDD

Claims (13)

  1. 画像データの特徴量を算出する算出手段と、
    前記算出手段により算出された特徴量に基づいて、画像データをクラスタに分類する分類手段と、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御手段と、
    前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付手段と、
    前記受付手段により指定を受け付けたラベルを、前記表示手段に表示された画像データと同一クラスタ内の画像データに対して付加する付加手段とを有することを特徴とするラベル付加装置。
  2. クラスタと、当該クラスタと同じラベルが付加された他のクラスタとの特徴量の距離である第1の距離を算出するとともに、前記クラスタ毎に、当該クラスタと、当該クラスタと異なるラベルが付加された他のクラスタとの特徴量の距離である第2の距離を算出する距離算出手段を更に有し、
    前記表示制御手段は、前記第1の距離未満の前記第2の距離に対応するクラスタ内の画像データを前記表示手段に表示させることを特徴とする請求項1に記載のラベル付加装置。
  3. 画像データの特徴量を算出する算出手段と、
    前記算出手段により算出された特徴量に基づいて、画像データをクラスタに分類する分類手段と、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御手段と、
    前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付手段と、
    同一クラスタ内の画像データ毎に、当該画像データと、前記同一クラスタに分類された画像データに係る所定の値との距離について判定を行う判定手段と、
    前記判定手段により当該画像データについて判定された距離に応じて、前記受付手段により指定を受け付けたラベルを当該画像データに対して付加する付加手段とを有することを特徴とするラベル付加装置。
  4. 前記判定手段は、前記同一クラスタ内の画像データ毎に、当該画像データと前記所定の値との距離が所定の閾値未満であるか否かを判定し、前記付加手段は、前記判定手段により前記所定の値との距離が前記所定の閾値未満であると判定された当該画像データに対して、前記受付手段により指定を受け付けたラベルを付加することを特徴とする請求項3に記載のラベル付加装置。
  5. 前記表示制御手段は、前記判定手段により前記所定の値との距離が前記所定の閾値以上であると判定された画像データを前記表示手段に表示させ、前記受付手段は、前記表示手段に表示された当該画像データに対して付加されるラベルの指定を受け付け、前記付加手段は、前記受付手段により指定を受け付けたラベルを当該画像データに対して付加することを特徴とする請求項4に記載のラベル付加装置。
  6. ラベルが付加された画像データの特徴量を算出する算出手段と、
    前記算出手段により算出された特徴量に基づいて、画像データをクラスタに分類する分類手段と、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御手段と、
    前記表示手段に表示された画像データのうち、当該クラスタ内の他の画像データとは異なるラベルが付加されている画像データの指定を受け付ける受付手段と、
    前記受付手段により指定を受け付けた画像データを、前記他の画像データとは異なるクラスタに再分類する再分類手段とを有することを特徴とするラベル付加装置。
  7. 前記再分類手段は、クラスタ一つあたりに所定の数の画像データを分類し、最も距離が近いクラスタ同士を併合していく併合処理を実行し、前記異なるラベルが付加されている画像データが分類されたクラスタを併合する前に、前記併合処理を中断することを特徴とする請求項6に記載のラベル付加装置。
  8. ラベル付加装置によって実行されるラベル付加方法であって、
    画像データの特徴量を算出する算出ステップと、
    前記算出ステップにより算出された特徴量に基づいて、画像データをクラスタに分類する分類ステップと、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御ステップと、
    前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付ステップと、
    前記受付ステップにより指定を受け付けたラベルを、前記表示手段に表示された画像データと同一クラスタ内の画像データに対して付加する付加ステップとを有することを特徴とするラベル付加方法。
  9. ラベル付加装置によって実行されるラベル付加方法であって、
    画像データの特徴量を算出する算出ステップと、
    前記算出ステップにより算出された特徴量に基づいて、画像データをクラスタに分類する分類ステップと、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御ステップと、
    前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付ステップと、
    同一クラスタ内の画像データ毎に、当該画像データと、前記同一クラスタに分類された画像データに係る所定の値との距離について判定を行う判定ステップと、
    前記判定ステップにより当該画像データについて判定された距離に応じて、前記受付ステップにより指定を受け付けたラベルを当該画像データに対して付加する付加ステップとを有することを特徴とするラベル付加方法。
  10. ラベル付加装置によって実行されるラベル付加方法であって、
    ラベルが付加された画像データの特徴量を算出する算出ステップと、
    前記算出ステップにより算出された特徴量に基づいて、画像データをクラスタに分類する分類ステップと、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御ステップと、
    前記表示手段に表示された画像データのうち、当該クラスタ内の他の画像データとは異なるラベルが付加されている画像データの指定を受け付ける受付ステップと、
    前記受付ステップにより指定を受け付けた画像データを、前記他の画像データとは異なるクラスタに再分類する再分類ステップとを有することを特徴とするラベル付加方法。
  11. 画像データの特徴量を算出する算出ステップと、
    前記算出ステップにより算出された特徴量に基づいて、画像データをクラスタに分類する分類ステップと、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御ステップと、
    前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付ステップと、
    前記受付ステップにより指定を受け付けたラベルを、前記表示手段に表示された画像データと同一クラスタ内の画像データに対して付加する付加ステップとをコンピュータに実行させるためのプログラム。
  12. 画像データの特徴量を算出する算出ステップと、
    前記算出ステップにより算出された特徴量に基づいて、画像データをクラスタに分類する分類ステップと、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御ステップと、
    前記表示手段に表示された画像データに対して付加されるラベルの指定を受け付ける受付ステップと、
    同一クラスタ内の画像データ毎に、当該画像データと、前記同一クラスタに分類された画像データに係る所定の値との距離について判定を行う判定ステップと、
    前記判定ステップにより当該画像データについて判定された距離に応じて、前記受付ステップにより指定を受け付けたラベルを当該画像データに対して付加する付加ステップとをコンピュータに実行させるためのプログラム。
  13. ラベルが付加された画像データの特徴量を算出する算出ステップと、
    前記算出ステップにより算出された特徴量に基づいて、画像データをクラスタに分類する分類ステップと、
    前記クラスタ毎に、当該クラスタに分類された画像データのうちの少なくとも一部の画像データを表示手段に表示させる表示制御ステップと、
    前記表示手段に表示された画像データのうち、当該クラスタ内の他の画像データとは異なるラベルが付加されている画像データの指定を受け付ける受付ステップと、
    前記受付ステップにより指定を受け付けた画像データを、前記他の画像データとは異なるクラスタに再分類する再分類ステップとをコンピュータに実行させるためのプログラム。
JP2012023310A 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム Active JP5889019B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012023310A JP5889019B2 (ja) 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012023310A JP5889019B2 (ja) 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013161295A true JP2013161295A (ja) 2013-08-19
JP5889019B2 JP5889019B2 (ja) 2016-03-22

Family

ID=49173476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012023310A Active JP5889019B2 (ja) 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5889019B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018537798A (ja) * 2015-10-02 2018-12-20 トラクタブル リミテッドTractable Ltd. データセットの半自動ラベル付け
CN110399430A (zh) * 2019-06-14 2019-11-01 平安科技(深圳)有限公司 用户特征确定方法、装置、设备及计算机可读存储介质
WO2020004867A1 (ko) * 2018-06-29 2020-01-02 주식회사 디플리 자동 레이블링이 가능한 머신 러닝 방법 및 장치
JP2020042737A (ja) * 2018-09-13 2020-03-19 株式会社東芝 モデル更新支援システム
KR20200042629A (ko) * 2018-10-16 2020-04-24 주식회사 키센스 인공지능 학습을 위한 모바일 기기의 터치 기반 어노테이션과 이미지 생성 방법 및 그 장치
WO2021144938A1 (ja) * 2020-01-16 2021-07-22 富士通株式会社 学習支援プログラム、学習支援方法及び学習支援装置
US11113531B2 (en) 2019-02-01 2021-09-07 Panasonic Intellectual Property Corporation Of America Annotation device, annotation method, and non-transitory computer-readable storage medium
WO2021192028A1 (ja) 2020-03-24 2021-09-30 ソニーグループ株式会社 学習装置及び学習方法
US11244438B2 (en) 2020-01-03 2022-02-08 Tractable Ltd Auxiliary parts damage determination
JP2022040352A (ja) * 2018-09-13 2022-03-10 株式会社東芝 モデル更新支援システム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282456A (ja) * 1996-04-18 1997-10-31 Matsushita Electric Ind Co Ltd 画像ラベリング装置および画像検索装置
US20040135815A1 (en) * 2002-12-16 2004-07-15 Canon Kabushiki Kaisha Method and apparatus for image metadata entry
JP2009282660A (ja) * 2008-05-21 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム
JP2010211785A (ja) * 2009-03-06 2010-09-24 Cyberlink Corp 顔によって画像をグループ化する方法
JP2010257409A (ja) * 2009-04-28 2010-11-11 Nec Soft Ltd 年齢推定装置、年齢推定方法及びプログラム
JP2011070408A (ja) * 2009-09-25 2011-04-07 Kddi Corp サンプル画像取得方法、サンプル画像取得装置及び画像分類装置
JP2011145791A (ja) * 2010-01-13 2011-07-28 Hitachi Ltd 識別器学習画像生成プログラム、方法、及びシステム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282456A (ja) * 1996-04-18 1997-10-31 Matsushita Electric Ind Co Ltd 画像ラベリング装置および画像検索装置
US20040135815A1 (en) * 2002-12-16 2004-07-15 Canon Kabushiki Kaisha Method and apparatus for image metadata entry
JP2009282660A (ja) * 2008-05-21 2009-12-03 Nippon Telegr & Teleph Corp <Ntt> 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム
JP2010211785A (ja) * 2009-03-06 2010-09-24 Cyberlink Corp 顔によって画像をグループ化する方法
JP2010257409A (ja) * 2009-04-28 2010-11-11 Nec Soft Ltd 年齢推定装置、年齢推定方法及びプログラム
JP2011070408A (ja) * 2009-09-25 2011-04-07 Kddi Corp サンプル画像取得方法、サンプル画像取得装置及び画像分類装置
JP2011145791A (ja) * 2010-01-13 2011-07-28 Hitachi Ltd 識別器学習画像生成プログラム、方法、及びシステム

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018537798A (ja) * 2015-10-02 2018-12-20 トラクタブル リミテッドTractable Ltd. データセットの半自動ラベル付け
JP7048499B2 (ja) 2015-10-02 2022-04-05 トラクタブル リミテッド データセットの半自動ラベル付け
WO2020004867A1 (ko) * 2018-06-29 2020-01-02 주식회사 디플리 자동 레이블링이 가능한 머신 러닝 방법 및 장치
KR20200002149A (ko) * 2018-06-29 2020-01-08 주식회사 디플리 자동 레이블링이 가능한 머신 러닝 방법 및 장치
KR102189362B1 (ko) * 2018-06-29 2020-12-11 주식회사 디플리 자동 레이블링이 가능한 머신 러닝 방법 및 장치
JP2020042737A (ja) * 2018-09-13 2020-03-19 株式会社東芝 モデル更新支援システム
JP7225444B2 (ja) 2018-09-13 2023-02-20 株式会社東芝 モデル更新支援システム
JP2022040352A (ja) * 2018-09-13 2022-03-10 株式会社東芝 モデル更新支援システム
KR20200042629A (ko) * 2018-10-16 2020-04-24 주식회사 키센스 인공지능 학습을 위한 모바일 기기의 터치 기반 어노테이션과 이미지 생성 방법 및 그 장치
KR102144707B1 (ko) 2018-10-16 2020-08-14 주식회사 키센스 인공지능 학습을 위한 모바일 기기의 터치 기반 어노테이션과 이미지 생성 방법 및 그 장치
US11113531B2 (en) 2019-02-01 2021-09-07 Panasonic Intellectual Property Corporation Of America Annotation device, annotation method, and non-transitory computer-readable storage medium
CN110399430A (zh) * 2019-06-14 2019-11-01 平安科技(深圳)有限公司 用户特征确定方法、装置、设备及计算机可读存储介质
US11244438B2 (en) 2020-01-03 2022-02-08 Tractable Ltd Auxiliary parts damage determination
US11250554B2 (en) 2020-01-03 2022-02-15 Tractable Ltd Repair/replace and labour hours determination
US11257203B2 (en) 2020-01-03 2022-02-22 Tractable Ltd Inconsistent damage determination
US11257204B2 (en) 2020-01-03 2022-02-22 Tractable Ltd Detailed damage determination with image segmentation
US11361426B2 (en) 2020-01-03 2022-06-14 Tractable Ltd Paint blending determination
US11386543B2 (en) 2020-01-03 2022-07-12 Tractable Ltd Universal car damage determination with make/model invariance
US11587221B2 (en) 2020-01-03 2023-02-21 Tractable Limited Detailed damage determination with image cropping
US11636581B2 (en) 2020-01-03 2023-04-25 Tractable Limited Undamaged/damaged determination
JPWO2021144938A1 (ja) * 2020-01-16 2021-07-22
WO2021144938A1 (ja) * 2020-01-16 2021-07-22 富士通株式会社 学習支援プログラム、学習支援方法及び学習支援装置
JP7287505B2 (ja) 2020-01-16 2023-06-06 富士通株式会社 学習支援プログラム、学習支援方法及び学習支援装置
WO2021192028A1 (ja) 2020-03-24 2021-09-30 ソニーグループ株式会社 学習装置及び学習方法

Also Published As

Publication number Publication date
JP5889019B2 (ja) 2016-03-22

Similar Documents

Publication Publication Date Title
JP5889019B2 (ja) ラベル付加装置、ラベル付加方法及びプログラム
CN108805170B (zh) 形成用于全监督式学习的数据集
JP5414416B2 (ja) 情報処理装置及び方法
JP5647627B2 (ja) 異常パターンの発見
US9286693B2 (en) Method and apparatus for detecting abnormal movement
US9002072B2 (en) System for detection of non-uniformities in web-based materials
EP2704060A2 (en) Crowd density estimation
JP7058941B2 (ja) 辞書生成装置、辞書生成方法、及びプログラム
JP2015041164A (ja) 画像処理装置、画像処理方法およびプログラム
US11532036B2 (en) Digital image ordering using object position and aesthetics
Siddalingappa et al. Anomaly detection on medical images using autoencoder and convolutional neural network
US20210365771A1 (en) Out-of-distribution (ood) detection by perturbation
JP6930195B2 (ja) モデル同定装置、予測装置、監視システム、モデル同定方法および予測方法
US20220405299A1 (en) Visualizing feature variation effects on computer model prediction
Vahora et al. Comprehensive analysis of crowd behavior techniques: A thorough exploration
Modi et al. An intelligent unsupervised anomaly detection in videos using inception capsule auto encoder
CN115049889A (zh) 存储介质和推理方法
CN111860070A (zh) 识别发生改变的对象的方法和装置
Chong et al. Modeling video-based anomaly detection using deep architectures: Challenges and possibilities
Balachandran et al. Machine learning based video segmentation of moving scene by motion index using IO detector and shot segmentation
Nishath et al. An Adaptive Classifier Based Approach for Crowd Anomaly Detection.
JP2020098521A (ja) 情報処理装置、データ抽出方法およびデータ抽出プログラム
Minguell et al. TrackSafe: A comparative study of data-driven techniques for automated railway track fault detection using image datasets
Sharet et al. Analyzing data changes using mean shift clustering
CN117058470B (zh) 一种基于小样本学习的三维点云分类的方法和系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160216

R151 Written notification of patent or utility model registration

Ref document number: 5889019

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151