JP5889019B2 - ラベル付加装置、ラベル付加方法及びプログラム - Google Patents

ラベル付加装置、ラベル付加方法及びプログラム Download PDF

Info

Publication number
JP5889019B2
JP5889019B2 JP2012023310A JP2012023310A JP5889019B2 JP 5889019 B2 JP5889019 B2 JP 5889019B2 JP 2012023310 A JP2012023310 A JP 2012023310A JP 2012023310 A JP2012023310 A JP 2012023310A JP 5889019 B2 JP5889019 B2 JP 5889019B2
Authority
JP
Japan
Prior art keywords
label
image
images
cluster
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012023310A
Other languages
English (en)
Other versions
JP2013161295A (ja
Inventor
友貴 藤森
友貴 藤森
克彦 森
克彦 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012023310A priority Critical patent/JP5889019B2/ja
Publication of JP2013161295A publication Critical patent/JP2013161295A/ja
Application granted granted Critical
Publication of JP5889019B2 publication Critical patent/JP5889019B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本発明は、画像データに対してラベリングを行う技術に関するものである。
認識技術において、学習データのラベルが予め教示されている教師付き学習では、教師なし学習と比べて、一般的に高い精度が見込まれている。但し、この教師付き学習の精度を高めるために、予め教示されるべきラベルの正確性は重要である。ラベルの付加を誤って行えば、評価時に正確な認識率を算出することができなくなり、結果として誤った評価をしてしまう。また、学習時では学習データに誤ったラベルが含まれることにより、適切なモデルを生成することができず、認識性能を落としてしまうことがある。よって、正確にラベルを付加することは重要である。
ラベルを付加する際の主な手法として、手動でラベルを付加する手法と自動でラベルを付加する手法との2種類がある。非特許文献1には、手動でラベルを付加する手法が開示されている。非特許文献1に開示される手法においては、手動でラベルを付加することでラベルの信頼度は増すが、非常に手間がかかり、コストがかかる。
非特許文献2には、自動でデータセットを作成する手法が開示されている。即ち、非特許文献2に開示される手法では、予めラベルが付加されたデータを学習データとして利用し、Nearest Neighborを用いてデータを分類し、分類したデータにラベルを付加してデータセットを作成する。ここでNearest Neighborとは、特徴空間上で距離の近いデータに、学習データの代表点に近いデータのラベルを自動で付加する手法である。
Caltech-101/256、インターネット<URL:http://www.vision.caltech.edu/Image_Datasets/Caltech101/> Yanai K. :Generic Image Classification Using Visual Knowledge on the Web, Proc. ACM International Conference Multimedia, pp.67-76 (2003).
しかしながら、非特許文献2に開示される手法では、手動でラベルを付加する手間を省くことができるが、ラベルの付加の際に使用される識別装置次第で性能が劣化し、手動でラベルを付加する手法と比べると、付加されるラベルの精度が落ちる。
ここで、ラベルを付加する際の評価基準について説明する。一般的な物体認識のように対象となる物体をカテゴリで認識する場合、当該物体に合わせて適切な名前を決定することは容易である。例えば、トラの画像に対してはトラのラベルが付加され、サルの画像に対してはサルのラベルが付加されるが、サルかトラかの微妙な判定に迷うことはない。ところが、外観検査における部品の画像を対象とした良否判定や身体の画像を対象とした病変有無の判定では、ラベルを付加すべき各状態に対してラベルに対応する値が連続で変化することから、ラベルを決定するのは容易ではない。また、手動でラベルを付加する手法を用いても、多数のデータに対してラベルを順次付加していくにつれて判定基準が変わり、誤ったラベルを判定してしまうこともある。
そこで、本発明の目的は、精度の高い効率的なラベリングを行うことにある。
本発明のラベル付加装置は、複数の画像から取得された特徴量に基づいて、複数の画像を複数のクラスタに分類する分類手段と、前記クラスタ毎に、前記クラスタに分類された画像うちの少なくとも一の画像表示装置に表示させる表示制御手段と、前記表示装置に表示された画像に対するラベルの指定を受け付ける受付手段と、前記受付手段により指定を受け付けたラベルを、前記表示装置に表示された画像同一クラスタ内に分類された画像対して付加する付加手段と、前記付加手段により第1のラベルが付加された画像に基づいて、前記第1のラベルと異なる第2のラベルが付加された画像へのラベルの付加が妥当でない可能性があるかを判断する判断手段と、前記判断手段の結果を出力する出力手段と、を有することを特徴とする。
本発明によれば、精度の高い効率的なラベリングが可能となる。
本発明の実施形態に係るラベル付加システムの構成を示す図である。 表示装置における画面の表示例に示す図である。 本発明の第1の実施形態に係るラベル付加装置の処理を示すフローチャートである。 Haar Wavelet変換を概略的に示す図である。 本発明の第2の実施形態に係るラベル付加装置の処理を示すフローチャートである。 本発明の第3の実施形態に係るラベル付加装置の処理を示すフローチャートである。 図6のステップS606における再クラスタリング処理の詳細を示すフローチャートである。 本発明の第4の実施形態に係るラベル付加装置の処理を示すフローチャートである。 同じラベルが付加されたクラスタとの距離と異なるラベルが付加されたクラスタとの距離とを説明するための図である。 同じラベルが付加されたクラスタとの距離より小さい値の、異なるラベルが付加されたクラスタの代表画像データの表示例を示す図である。
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。
先ず、本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態に係るラベル付加システムの構成を示す図である。図1において、101は、ラベル付加装置である。ラベル付加装置101は、CPU(セントラルプロセッシングユニット)1011、RAM(ランダムアクセスメモリ)1012及びHDD(ハードディスクドライブ)1013を備える。なお、HDD1013には、CPU1011によって実行されるコンピュータプログラムが格納されており、CPU1011は、必要に応じてHDD1013からRAM1012にコンピュータプログラムを読み込んで実行する。
102は、画像データ入力装置である。画像データ入力装置102は、画像データを入力し、ラベル付加装置101に対して出力する。ラベル付加装置101は、画像データ入力装置102から入力した画像データに対してラベルを付加する。103は、モニタ等から構成され、ラベルが付加される前の画像データやラベルが付加された後の画像データを表示する表示装置103である。
図2は、表示装置103における画面の表示例に示す図である。図2において、201は、ラベルが付加された画像データを表示する代表画像データ表示領域である。オペレータは、ラベルが付加された画像データを代表画像データ表示領域201上で確認することができる。オペレータは、画像データに対してラベルを付加する際に、新たなラベルを今回付加すべきか、今まで付加されたラベルから今回付加すべきラベルを選択するかを判断する。203は、今まで付加された各ラベルに対応する画像データを表示する対応代表画像データ表示領域である。オペレータは、今までどのようなラベルが付加されてきたのかを対応代表画像データ表示領域203上で確認することができる。202は、対応代表画像データ表示領域203に対応して設けられたラベル選択ボタンである。オペレータは、対応代表画像データ表示領域203から所望のラベルを選択する際、該当するラベル候補ボタンを操作する。
図3は、第1の実施形態に係るラベル付加装置101の処理を示すフローチャートである。図3に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。以下、図3を参照しながら、ラベル付加装置101の処理について説明する。
ステップS301において、ラベル付加装置101は、画像データ入力装置102から入力された各画像データについて特徴量を算出する。ここで算出される特徴量としては、複数の統計的特徴量やHOGといった高次元の特徴量等が挙げられる。なお、HOGは、輝度の勾配をヒストグラムで表した特徴量である。HOGの詳細については下記の文献を参照されたい。
(文献)Navneet D.: Histograms of Oriented Gradients for Human Detection, Proc. CVPR 2005.
複数の統計的特徴量を算出する際には、画像データに対してHaar Wavelet変換が施されることにより、階層的に画像データが生成される。なお、Haar Wavelet変換は、位置情報を保持したまま周波数変換を行うことが可能な処理である。図4は、Haar Wavelet変換を概略的に示す図である。
Haar Wavelet変換においては、先ず画像データに対して4種類のフィルタ401〜404が用意される。一つ目のフィルタは縦方向高周波成分フィルタ401である。二つ目のフィルタは対角方向高周波成分フィルタ402である。三つ目のフィルタは低周波成分フィルタ403である。四つ目のフィルタは横方向高周波成分フィルタ404である。
そして、画像データの2×2の領域に対して上記フィルタで内積がとられる。2×2の領域を重ね合わせることなく移動させて、解像度が2分の1になるように、縦方向高周波成分画像データ405、対角方向高周波成分画像データ406、低周波成分画像データ407、及び、横方向高周波成分画像データ408の4種類の画像データが生成される。この際、解像度は2分の1となるため、画像データのサイズは2のn乗に設定しておくのが好ましい。算出された低周波成分画像データ407に対して上記4種類のフィルタ401〜404を用いてフィルタリングが施され、さらに解像度が2分の1となるような、次の階層に当たる縦方向高周波成分画像データ405、対角方向高周波成分画像データ406、低周波成分画像データ407、及び、横方向高周波成分画像データ408の4種類の画像データが生成される。さらに低周波成分画像データ407に対してフィルタリングが施され続けることにより、階層的に画像データが生成される。ここでは、1階層から7階層までの28種類の画像データに原画像データを加えた29種類の画像データが生成される。
次に、生成された29種類の画像データそれぞれから、全画素値の最大値、平均、分散、尖度、歪度及び相乗平均といった6種類のマクロな特徴量が算出される。次の式1は、画素値の最大値をマクロな特徴量として算出する方法を示している。式2は、画素値の平均をマクロな特徴量として算出する方法を示している。式3は、画素値の分散をマクロな特徴量として算出する方法を示している。式4は、画素値の尖度をマクロな特徴量として算出する方法を示している。式5は、画素値の歪度をマクロな特徴量として算出する方法を示している。式6は、画素値の相乗平均をマクロな特徴量として算出する方法を示している。但し、画像データのサイズは縦a画素、横b画素であり、画像データの縦i番目、横j番目の画素値をp(i,j)と表記している。
Figure 0005889019
以上のように、Haar Wavelet変換が行われていない原画像データと、Haar Wavelet変換によって生成された各階層の画像データとの29種類の画像データから、式1〜式6によって特徴量が算出される。このように29種類の画像データからマクロな特徴量が6種類ずつ算出されるため、画像データ入力装置102から入力された各画像データについて、29×6=174種類(以下、N種類とする)の特徴量が算出されることになる。
但し、次元数が多くなることにより、認識精度が落ちる次元の呪いと呼ばれる現象が生じることがあるため、N種類の特徴量が適当であるか否かは特徴選択を用いて評価してもよい。特徴選択には、大きく分けてラッパー法とフィルタ法との2種類が存在する。ラッパー法とは、訓練データを訓練用と評価用とに分け、認識結果が最もよくなるような特徴量が決定される。一般的に、ラッパー法では、最適な特徴量を求めることができるが、画像識別処理が行われるため、特徴量を選択するのに膨大な計算時間がかかる。一方、フィルタ法とは、特徴量一つ一つに対し、どれだけデータを分類することができるかを定量的に評価し、評価が高い特徴量から順に選択する方法である。例えば2クラス問題の場合、ベイズ誤り確率推定値が求められる。ここで2つのクラスをw1、w2とし、特徴の値をxとするとき、xがw1、w2に属する確率をそれぞれP(w1|x)、P(w2|x)と表す。ここで、ベイズ誤り確率推定値は次の式7で表され、ベイズ誤り確率推定値が低いほどよい。
Figure 0005889019
なお、ここでは2クラス問題の場合について説明したが、ベイズ誤り確率推定値は多クラスについても適用可能である。ラッパー法に比べて計算時間はかからないが、最適な特徴量が算出されにくい。本実施形態においては、特徴選択を用いず、N種類の特徴量を全て用いるものとする。
ステップS302において、ラベル付加装置101は、ステップS301にて算出した特徴量に基づいて各画像データをクラスタリングし、クラスタ毎に代表画像データを決定する。ここで、画像データのクラスタリング処理の前段において、N種類の特徴量の分布に偏りが生じないように、それぞれの特徴量の標準偏差で正規化され、N次元の特徴空間上に画像データが分類される。そして、画像データのクラスタリング処理が実行されるが、クラスタリング処理の手法としてはどの手法を用いてもよい。以下では、k-means法を用いた場合について説明する。k-means法とは、特徴量のユークリッド距離が最も近いクラスタに画像データを分類する手法である。具体的には、先ずk個のクラスタに画像データがランダムに分類される。そして、各クラスタ内の画像データの特徴量の平均値が求められ、各画像データについて、当該画像データの特徴量からユークリッド距離が最も近い特徴量の平均値を持つクラスタに対して当該画像データが再分類される。この再分類がなされなくなったときに、クラスタリング処理が完了する。また、クラスタ毎の代表画像データを決定する際には、ラベル付加装置101は、画像データをクラスタリングした結果、各クラスタ内における画像データの特徴量の平均値に最も近い特徴量の画像データを代表画像データとして決定する。
ステップS303において、ラベル付加装置101は、ステップS302にて決定した代表画像データを表示装置103に表示させる。ステップS304において、ラベル付加装置101は、ステップS303にて表示装置103で表示された代表画像データに付加されるラベルの指定をオペレータから受け付け、当該ラベルを代表画像データに付加する。なお、オペレータからの指定に応じてラベルを付加する他、遠隔監視システム又はコンピュータプログラムによって自動的にラベルを付加するようにしてもよい。これにより、図2の代表画像データ表示領域201においてラベルが付加された代表画像データが表示される。なお、ステップS303は、表示制御手段の処理例であり、ステップS304は、受付手段の処理例である。
ステップS305において、ラベル付加装置101は、ステップS304においてラベルが付加された代表画像データと同一クラスタ内の全ての画像データに対して、代表画像データと同じラベルを付加する。
第1の実施形態においては、代表画像データに対してラベルを付加することにより、代表画像データと同一クラスタ内の全ての画像データに同じラベルが自動的に付加される。ところで、クラスタ数kが減少するにつれて、画像データに対して誤ったラベルが付加される可能性が高くなる。従って、クラスタ数kは、各クラスタに分類される画像データをオペレータが容易に確認することができる程度の値に設定することが好ましい。
第1の実施形態によれば、画像データに対して自動でラベリングを行うことにより、手動でラベリングするに比べて手間が省け、精度の高い効率的なラベリングが可能となる。
次に、第2の実施形態について説明する。第2の実施形態では、同一のクラスタに分類された画像データであるが、代表画像データの特徴量からユークリッド距離から離れている特徴量の画像データであるため、当該画像データに誤ったラベルが付加されてしまうことを防止する方法について説明する。
図5は、第2の実施形態に係るラベル付加装置の処理を示すフローチャートである。以下、図5を参照しながら、第2の実施形態に係るラベル付加装置の処理について説明する。なお、図5におけるステップS301〜S304は、図3におけるステップS301〜S304と同じ処理である。即ち、ステップS304の処理を終えた時点で、クラスタ毎に画像データが分類され、各クラスタの代表画像データに対してラベルが付加されている。また、第2の実施形態に係るラベル付加装置は、図1に示した第1の実施形態に係るラベル付加装置の構成と同様であるため、図1の符号を用いて第2の実施形態を説明するものとする。図5に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。
ステップS505において、ラベル付加装置101は、或るクラスタ内の画像データの平均ベクトルmと標準偏差σとを算出する。ステップS506において、ラベル付加装置101は、クラスタ内の或る画像データについて、平均ベクトルmからの距離が所定の閾値(ここでは、3σ)未満であるか否かを判定する。平均ベクトルmからの距離が所定の閾値未満である場合、処理はステップS507に移行する。一方、平均ベクトルmからの距離が所定の閾値以上である場合、処理はステップS508に移行する。
ステップS507において、ラベル付加装置101は、画像データに対して代表画像データと同じラベルを付加する。そして、処理はステップS511に移行する。ステップS508において、ラベル付加装置101は、画像データを表示装置103に表示させる。オペレータは、画像データを表示装置103で確認した上で、その画像データに対して代表画像データと同じラベルを付加すると判断した場合、ラベル付加装置101に対してその旨を指示する。
ステップS509において、ラベル付加装置101は、代表画像データと同じラベルを付加する指示があったか否かを判定する。代表画像データと同じラベルを付加する指示があった場合、処理はステップS510に移行する。一方、代表画像データとは異なるラベルを付加する指示があった場合、処理はステップS513に移行する。ステップS510において、ラベル付加装置101は、代表画像データと同じラベルを画像データに対して付加する。そして、処理はステップS511に移行する。ステップS513において、ラベル付加装置101は、オペレータの指示に応じたラベルを画像データに対して付加する。そして、処理はステップS511に移行する。
ステップS511において、ラベル付加装置101は、クラスタ内の全ての画像データについてステップS506以降の処理を実行したか否かを判定する。全ての画像データについてステップS506以降の処理を実行した場合、処理はステップS512に移行する。一方、ステップS506以降の処理を実行していない画像データが存在する場合、処理はステップS506に戻り、残りの画像データについて処理が実行される。ステップS512において、ラベル付加装置101は、全てのクラスタについてステップS505以降の処理を実行したか否かを判定する。全てのクラスタについてステップS505以降の処理を実行した場合、処理は終了する。一方、ステップS505以降の処理を実行していないクラスタが存在する場合、処理はステップS505に戻る。ここでは、ステップS506の判定処理に用いられる閾値を3σとしたが、この閾値はオペレータの指示に応じて任意の値に変更することが可能な値である。
以上により、第2の実施形態においては、同一のクラスタに分類された画像データであるが、代表画像データの特徴量からユークリッド距離から離れている特徴量の画像データであるため、当該画像データに誤ったラベルが付加されてしまうことを防止することができる。
次に、本発明の第3の実施形態について説明する。第3の実施形態は、画像データが分類されたクラスタ数が比較的少なく、同一クラスタ内に様々なラベルが付加された画像データが存在する場合、再クラスタリング処理を実行することにより、画像データを適切に分類する方法について説明する。
図6は、本発明の第3の実施形態に係るラベル付加装置の処理を示すフローチャートである。以下、図6を参照しながら、第3の実施形態に係るラベル付加装置の処理について説明する。なお、図6におけるステップS301及びS302は、図3のステップS301及びS302と同様の処理である。即ち、ステップS302の処理を終えた時点で、クラスタ毎に画像データが分類されている。但し、本実施形態においては、画像データ入力装置102からラベル付加装置101に入力される各画像データにはラベルが付加されているものとする。従って、ステップS302においてクラスタ毎に分類された画像データにもラベルが付加されている。なお、第3の実施形態に係るラベル付加装置は、図1に示した第1の実施形態に係るラベル付加装置の構成と同様であるため、図1の符号を用いて第3の実施形態を説明するものとする。図6に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。
ステップS603において、ラベル付加装置101は、或るクラスタから画像データをランダムにM個抽出する。ステップS604において、ラベル付加装置101は、抽出したM個の画像データを表示装置103に表示させる。オペレータは、表示装置103に表示された画像データを確認することにより、M個の画像データに対して同一のラベルが付加されているか否かを判断し、その判断結果をラベル付加装置101に対して入力する。このとき、オペレータが確認する画像データの個数であるM個の値が大きい場合、オペレータの判断基準がゆらぐ虞があるため、M=設定すべきラベルの数+5程度に設定されることが好ましい。
ステップS605において、ラベル付加装置101は、表示された全て(M個)の画像データには同一のラベルが付加されていることが入力されたか否かを判定する。同一のラベルがM個の付加されていることが入力された場合、処理はステップS608に移行する。一方、表示された画像データのうちの一部の画像データに異なるラベルが付加されていることが入力された場合、処理はステップS606に移行する。なお、一部の画像データに異なるラベルが付加されていることが入力される際には、どの画像データに対して異なるラベルが付加されているのかもオペレータによって入力される。
ステップS606において、ラベル付加装置101は、異なるラベルが付加された画像データが他のクラスタに分類されるように、再クラスタリング処理を行う。なお、再クラスタリング処理の詳細については後述する。ステップS607において、ラベル付加装置101は、再クラスタリング処理によって生成された或るクラスタからM個の画像データをランダムに抽出する。このとき、既に抽出された画像データが再び抽出されてもよい。そして、処理はステップS604に戻る。即ち、本実施形態においては、同一クラスタ内に異なるラベルが付加された画像データが存在しなくなるまで、ステップS606の再クラスタリング処理が繰り返し実行される。
ステップS608において、ラベル付加装置101は、画像データに付加されているラベルが確認されていないクラスタが存在するか否かを判定する。ラベルが確認されていないクラスタが存在する場合、処理はステップS609に移行する。一方、全てのクラスタについてラベルが確認された場合、処理は終了する。
ステップS609において、ラベル付加装置101は、ラベルが確認されていないクラスタのうちの或るクラスタからM個の画像データをランダムに抽出する。このとき、既に抽出された画像データが再び抽出されてもよい。そして、処理はステップS604に戻る。
図7は、図6のステップS606における再クラスタリング処理の詳細を示すフローチャートである。以下、図7を参照しながら、図6のステップS606における再クラスタリング処理について詳細に説明する。
ここでは、対象のクラスタ内にL(L>M)個の画像データが存在しているものとする。ステップS701において、ラベル付加装置101は、クラスタ一つあたりに画像データが一つ分類される状態に設定する。ここではL個の画像データが存在するため、L個のクラスタを持つ状態に設定される。
ステップS702において、ラベル付加装置101は、異なるクラスタに存在する画像データ1(x1)と画像データ2(x2)との間のユークリッド距離d(x1,x2)が最も近いクラスタ同士を逐次併合する。
ステップS703において、ラベル付加装置101は、ステップS605において指定された異なるラベルが付加された画像データを含むクラスタが併合される前に、クラスタの併合処理を中断する。その後、再クラスタリング処理の結果をオペレータに確認させるために、処理はステップS607に移行する。
以上により、第3の実施形態においては、同一クラスタ内に様々なラベルが付加された画像データが存在する場合、再クラスタリング処理を実行することにより、画像データを適切に分類することができる。
次に、本発明の第4の実施形態について説明する。第4の実施形態では、例えばクラスタ数が多めに設定される等の理由により、オペレータの評価基準にゆらぎが生じ、付加されているラベルに誤りが生じている可能性のある画像データを再表示し、オペレータに確認させる方法について説明する。
図8は、本発明の第4の実施形態に係るラベル付加装置の処理を示すフローチャートである。以下、図8を参照しながら、第4の実施形態に係るラベル付加装置の処理について説明する。なお、図8におけるステップS301〜S305は、図3のステップS301〜S305と同様の処理である。即ち、ステップS305の処理を終えた時点で、クラスタ毎に画像データが分類され、各クラスタ内の画像データには代表画像データと同一のラベルが付加されている。なお、第4の実施形態に係るラベル付加装置は、図1に示した第1の実施形態に係るラベル付加装置の構成と同様であるため、図1の符号を用いて第4の実施形態を説明するものとする。図8に示す処理は、CPU1011がHDD1013から必要なプログラム及びデータをRAM1012に読み込んで実行することにより実現する処理である。
ステップS803において、ラベル付加装置101は、各クラスタの代表画像データに対応する特徴空間上の点を代表点として決定する。ステップS804において、ラベル付加装置101は或るクラスタを設定する。ステップS805において、ラベル付加装置101は、ステップS804で設定したクラスタの代表点と、クラスタと同じラベルが付加された他のクラスタの代表点とのユークリッド距離を全て算出する。そして、図9に示すように、ラベル付加装置101は、算出したユークリッド距離のうち、最も値が大きい(最も離れている)ユークリッド距離を第1の距離d1として設定する。
ステップS806において、ラベル付加装置101は、ステップS803で設定したクラスタの代表点と、当該クラスタと異なるラベルが付加された他のクラスタの代表点とのユークリッド距離を全て算出する。そして、図9に示すように、ラベル付加装置は、ここで算出された各ユークリッド距離を第2の距離d2(1)、d2(2)、・・・として設定する。
ステップS807において、ラベル付加装置101はd1とd2(d2(1)、d2(2)、・・・)とを比較する。そして、ラベル付加装置101は、d1より小さい値のd2に該当するクラスタの代表画像データを表示装置103に表示させる。このように、ラベル付加装置101は、d1より小さい値のd2に該当するクラスタの代表画像データを表示させ、オペレータに確認させることにより、当該代表画像データに対して付加されているラベルの妥当性を判断させる。
ステップS808において、ラベル付加装置101は、全てのクラスタについてステップS804以降の処理を実行したか否かを判定する。全てのクラスタについてステップS804以降の処理を実行した場合、処理は終了する。一方、全てのクラスタについてステップS804以降の処理を実行していない場合、処理はステップS804に戻り、残りのクラスタについてステップS804以降の処理が実行される。
図10は、d1より小さい値のd2に該当するクラスタの代表画像データの表示例を示す図である。図10に示すように、オペレータによって当該代表画像データにはラベル4が付加されているが、ステップS804において設定されたクラスタと同じラベル(ラベル1)の方が適切である可能性があることが通知される。
第4の実施形態においては、例えばクラスタ数が多めに設定される等の理由により、オペレータの評価基準にゆらぎが生じ、付加されているラベルに誤りが生じた場合でも、その可能性がある代表画像データを再表示させ、オペレータに確認させることができる。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101:ラベル付加装置、102:画像データ入力装置、103:表示装置、1011:CPU、1012:RAM、1013:HDD

Claims (12)

  1. 複数の画像から取得された特徴量に基づいて、複数の画像を複数のクラスタに分類する分類手段と、
    前記クラスタ毎に、前記クラスタに分類された画像うちの少なくとも一の画像表示装置に表示させる表示制御手段と、
    前記表示装置に表示された画像に対するラベルの指定を受け付ける受付手段と、
    前記受付手段により指定を受け付けたラベルを、前記表示装置に表示された画像同一クラスタ内に分類された画像対して付加する付加手段と
    前記付加手段により第1のラベルが付加された画像に基づいて、前記第1のラベルと異なる第2のラベルが付加された画像へのラベルの付加が妥当でない可能性があるかを判断する判断手段と、
    前記判断手段の結果を出力する出力手段と、
    を有することを特徴とするラベル付加装置。
  2. 前記出力手段は、前記判断手段により前記第2のラベルが付加された画像へのラベルの付加が妥当でない可能性があると判断された画像と、ユーザに前記第2のラベルを確認させるための報知情報とを出力することを特徴とする請求項1に記載のラベル付加装置。
  3. 前記判断手段は、更に、前記第1のラベルが付加された画像が分類された第1のクラスタと、前記第2のラベルが付加された画像が分類された第2のクラスタとの間の距離が、前記第1のクラスタと、前記第1のクラスタ以外のクラスタであって、前記第1のラベルが付加された画像が分類された第3のクラスタとの間の距離よりも小さい場合に、前記第2のラベルが付加された画像へのラベルの付加が妥当でない可能性があると判断することを特徴とする請求項1又は2に記載のラベル付加装置。
  4. 複数の画像から取得された特徴量に基づいて、前記複数の画像を複数のクラスタに分類する分類手段と、
    前記複数のクラスタの一つに分類された画像のうちの少なくとも一つの画像を表示装置に表示させる表示制御手段と、
    前記表示装置に表示された画像に対するラベルの指定を受け付ける受付手段と、
    前記表示装置に表示された画像の特徴量と、前記表示された画像と同一クラスタに分類された他の画像の特徴量とに基づき決定される距離に基づいて、前記他の画像に対するラベルを付加する付加手段と、
    を有することを特徴とするラベル付加装置。
  5. 前記付加手段は、前記距離が所定の値よりも小さい場合には、前記指定を受け付けたラベルを前記他の画像に付加することを特徴とする請求項4に記載のラベル付加装置。
  6. 前記付加手段は、
    前記距離が所定の値よりも大きい場合には、前記他の画像を前記表示装置に表示させるように前記表示制御手段を制御し、
    前記他の画像に対するラベルの指定を受け付けるように前記受付手段を制御し、
    前記他の画像に対して受け付けたラベルを、前記他の画像に付加することを特徴とする請求項4又は5に記載のラベル付加装置。
  7. ラベルが付加された複数の画像から取得された特徴量に基づいて、前記複数の画像を複数のクラスタに分類する分類手段と、
    前記複数のクラスタの一つに分類された画像のうちの少なくとも一つの画像を表示装置に表示させる表示制御手段と、
    前記表示装置に表示された画像のうち、前記クラスタ内の他の画像とは異なるラベルが付加されている画像の指定を受け付ける受付手段と、
    前記受付手段により指定を受け付けた画像を、前記他の画像とは異なるクラスタに再分類する再分類手段と、
    を有することを特徴とするラベル付加装置。
  8. 前記再分類手段は、クラスタ一つあたりに所定の数の画像データを分類し、最も距離が近いクラスタ同士を併合していく併合処理を実行し、前記異なるラベルが付加されている画像が分類されたクラスタを併合する前に、前記併合処理を中断することを特徴とする請求項7に記載のラベル付加装置。
  9. ラベル付加装置によって実行されるラベル付加方法であって、
    複数の画像から取得された特徴量に基づいて、複数の画像を複数のクラスタに分類する分類ステップと、
    前記クラスタ毎に、前記クラスタに分類された画像うちの少なくとも一の画像表示装置に表示させる表示制御ステップと、
    前記表示装置に表示された画像に対するラベルの指定を受け付ける受付ステップと、
    前記受付ステップにより指定を受け付けたラベルを、前記表示装置に表示された画像と同一クラスタ内に分類された画像に対して付加する付加ステップと
    前記付加ステップにより第1のラベルが付加された画像に基づいて、前記第1のラベルと異なる第2のラベルが付加された画像へのラベルの付加が妥当でない可能性があるかを判断する判断ステップと、
    前記判断ステップの結果を出力する出力ステップと、
    含むことを特徴とするラベル付加方法。
  10. ラベル付加装置によって実行されるラベル付加方法であって、
    複数の画像から取得された特徴量に基づいて、前記複数の画像を複数のクラスタに分類する分類ステップと、
    前記複数のクラスタの一つに分類された画像うちの少なくとも一の画像表示装置に表示させる表示制御ステップと、
    前記表示装置に表示された画像に対するラベルの指定を受け付ける受付ステップと、
    前記表示装置に表示された画像の特徴量と、前記表示された画像と同一クラスタに分類された他の画像の特徴量とに基づき決定される距離に基づいて、前記他の画像に対するラベルを付加する付加ステップと、
    含むことを特徴とするラベル付加方法。
  11. ラベル付加装置によって実行されるラベル付加方法であって、
    ラベルが付加された複数の画像から取得された特徴量に基づいて、前記複数の画像を複数のクラスタに分類する分類ステップと、
    前記複数のクラスタの一つに分類された画像のうちの少なくとも一つの画像を表示装置に表示させる表示制御ステップと、
    前記表示装置に表示された画像のうち、前記クラスタ内の他の画像とは異なるラベルが付加されている画像の指定を受け付ける受付ステップと、
    前記受付ステップにより指定を受け付けた画像を、前記他の画像とは異なるクラスタに再分類する再分類ステップと、
    を含むことを特徴とするラベル付加方法。
  12. コンピュータを、請求項1乃至8の何れか1項に記載のラベル付加装置の各手段として機能させるためのプログラム。
JP2012023310A 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム Active JP5889019B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012023310A JP5889019B2 (ja) 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012023310A JP5889019B2 (ja) 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013161295A JP2013161295A (ja) 2013-08-19
JP5889019B2 true JP5889019B2 (ja) 2016-03-22

Family

ID=49173476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012023310A Active JP5889019B2 (ja) 2012-02-06 2012-02-06 ラベル付加装置、ラベル付加方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5889019B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201517462D0 (en) * 2015-10-02 2015-11-18 Tractable Ltd Semi-automatic labelling of datasets
JP2018142097A (ja) * 2017-02-27 2018-09-13 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
KR102189362B1 (ko) * 2018-06-29 2020-12-11 주식회사 디플리 자동 레이블링이 가능한 머신 러닝 방법 및 장치
JP2020042737A (ja) * 2018-09-13 2020-03-19 株式会社東芝 モデル更新支援システム
JP7225444B2 (ja) * 2018-09-13 2023-02-20 株式会社東芝 モデル更新支援システム
KR102144707B1 (ko) * 2018-10-16 2020-08-14 주식회사 키센스 인공지능 학습을 위한 모바일 기기의 터치 기반 어노테이션과 이미지 생성 방법 및 그 장치
JP7229795B2 (ja) 2019-02-01 2023-02-28 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ アノテーション装置、アノテーション方法、及び、プログラム
CN110399430A (zh) * 2019-06-14 2019-11-01 平安科技(深圳)有限公司 用户特征确定方法、装置、设备及计算机可读存储介质
WO2021136944A1 (en) 2020-01-03 2021-07-08 Tractable Ltd Method of universal automated verification of vehicle damage
WO2021144938A1 (ja) * 2020-01-16 2021-07-22 富士通株式会社 学習支援プログラム、学習支援方法及び学習支援装置
EP4099264B1 (en) 2020-03-24 2024-04-24 Sony Group Corporation Learning device and learning method
JP7521775B2 (ja) * 2020-04-13 2024-07-24 カラクリ株式会社 情報処理装置、アノテーション評価プログラム、及びアノテーション評価方法
JP2024136053A (ja) 2023-03-23 2024-10-04 株式会社リコー 情報処理装置、情報処理方法、プログラムおよび情報処理システム
JP7537724B1 (ja) 2023-05-23 2024-08-21 株式会社マーケットヴィジョン 情報処理システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09282456A (ja) * 1996-04-18 1997-10-31 Matsushita Electric Ind Co Ltd 画像ラベリング装置および画像検索装置
AU2002953384A0 (en) * 2002-12-16 2003-01-09 Canon Kabushiki Kaisha Method and apparatus for image metadata entry
JP4995770B2 (ja) * 2008-05-21 2012-08-08 日本電信電話株式会社 画像辞書生成装置,画像辞書生成方法,および画像辞書生成プログラム
US8121358B2 (en) * 2009-03-06 2012-02-21 Cyberlink Corp. Method of grouping images by face
JP4742193B2 (ja) * 2009-04-28 2011-08-10 Necソフト株式会社 年齢推定装置、年齢推定方法及びプログラム
JP5346756B2 (ja) * 2009-09-25 2013-11-20 Kddi株式会社 画像分類装置
JP5075924B2 (ja) * 2010-01-13 2012-11-21 株式会社日立製作所 識別器学習画像生成プログラム、方法、及びシステム

Also Published As

Publication number Publication date
JP2013161295A (ja) 2013-08-19

Similar Documents

Publication Publication Date Title
JP5889019B2 (ja) ラベル付加装置、ラベル付加方法及びプログラム
US10650518B2 (en) Computer aided diagnosis (CAD) apparatus and method
US11113842B2 (en) Method and apparatus with gaze estimation
JP6547069B2 (ja) 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク
Pennisi et al. Online real-time crowd behavior detection in video sequences
JP5414416B2 (ja) 情報処理装置及び方法
US20200272823A1 (en) Weakly-Supervised Action Localization by Sparse Temporal Pooling Network
JP6708385B2 (ja) 識別器作成装置、識別器作成方法、およびプログラム
JP5647627B2 (ja) 異常パターンの発見
US10460232B2 (en) Method and apparatus for classifying data, and method and apparatus for segmenting region of interest (ROI)
JP7058941B2 (ja) 辞書生成装置、辞書生成方法、及びプログラム
US9152926B2 (en) Systems, methods, and media for updating a classifier
EP2704060A2 (en) Crowd density estimation
US20140241619A1 (en) Method and apparatus for detecting abnormal movement
US9330336B2 (en) Systems, methods, and media for on-line boosting of a classifier
JP2016085704A (ja) 情報処理システム、情報処理装置、情報処理方法、及びプログラム
CN108664986B (zh) 基于lp范数正则化的多任务学习图像分类方法及系统
Siddalingappa et al. Anomaly detection on medical images using autoencoder and convolutional neural network
US20230334868A1 (en) Surgical phase recognition with sufficient statistical model
JP6930195B2 (ja) モデル同定装置、予測装置、監視システム、モデル同定方法および予測方法
KR20170028571A (ko) 이상 가축을 탐지하는 장치 및 방법
Balachandran et al. Machine learning based video segmentation of moving scene by motion index using IO detector and shot segmentation
Vahora et al. Comprehensive analysis of crowd behavior techniques: A thorough exploration
CN115049889A (zh) 存储介质和推理方法
Nishath et al. An Adaptive Classifier Based Approach for Crowd Anomaly Detection.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160216

R151 Written notification of patent or utility model registration

Ref document number: 5889019

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151