JP2017102865A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2017102865A
JP2017102865A JP2015237982A JP2015237982A JP2017102865A JP 2017102865 A JP2017102865 A JP 2017102865A JP 2015237982 A JP2015237982 A JP 2015237982A JP 2015237982 A JP2015237982 A JP 2015237982A JP 2017102865 A JP2017102865 A JP 2017102865A
Authority
JP
Japan
Prior art keywords
data
label
information processing
processing apparatus
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015237982A
Other languages
English (en)
Inventor
友貴 藤森
Tomoki Fujimori
友貴 藤森
裕輔 御手洗
Hirosuke Mitarai
裕輔 御手洗
克彦 森
Katsuhiko Mori
克彦 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015237982A priority Critical patent/JP2017102865A/ja
Publication of JP2017102865A publication Critical patent/JP2017102865A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Analysis (AREA)

Abstract

【課題】ラベルが付与されていないデータを学習データとして利用した、外れデータの影響を受け難い反教師学習を行うことを目的とする。【解決手段】学習データとしての正事例又は負事例のラベルが付与されていない、ラベルなしの複数のデータそれぞれの特徴量を抽出する特徴量抽出部201と、複数のデータそれぞれの特徴量に基づいて、複数のデータから外れデータを検出する検出処理を行い、外れデータを除いた複数のデータの特徴量を対象として検出処理を繰り返す外れ点検出部202と、外れ点検出部202による外れデータの検出結果に基づいて、外れデータの異常度を決定する異常度決定部203と、異常度に基づいて、データにラベルを付与するラベル判定部204とを有する。【選択図】図2

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
従来、工場におけるキズ検査等に用いられるマシンビジョンにおいて、検査対象物を撮影した画像に対して、画素値の平均等の多様な特徴量群を用いた、検査対象物の良否判定(良品と不良品の2クラス判別)を行うものが知られている。この方法では、予めラベルが付いたデータ(学習データ)を用意する必要がある。
一方、テキスト分析の分野で半教師付き学習、つまりラベルが付いたデータに加えて、ラベルが付いていないデータを有効に使う手法が提案されている。このような技術として、特許文献1には、ラベル付きの学習データを利用して、ラベルが付いていないデータの予測を行って確信度を求め、確信度の上位のデータを学習に加えることにより、再学習を繰り返す手法が開示されている。また、非特許文献1には、想定外のデータ、つまり外れ点(外れデータ)に対応する技術が開示されている。この技術は、1クラスの識別器を用いて、認識スコアを算出し、はずれ度合いを算出する手法が提案されている。
米国特許第5541836号明細書
Scholkopf, B., J. Platt, J.Shawe-Taylor, A. Smola, and R.C. Williamson. Estimating the support of a high-dimensional distribution. Neural Computation 13(7), 1433-1471, 2001.
しかしながら、特許文献1の技術では、特徴空間上において、ラベルが付いていないデータの近傍にラベルが付いているデータが存在することが前提となっている。このため、ラベルが付いていないデータの中に、想定外の不良が現れた場合には、必ずしも正しい良否判定が行えるとは限らない。また、非特許文献1の技術では、ラベルの付いていないデータを良品データであると仮定して、モデルを生成しているため、正常データのみを使ってモデルを作る手法と比べて、精度が落ちることが予想される。
本発明はこのような問題点に鑑みなされたもので、ラベルが付与されていないデータを学習データとして利用した、外れデータの影響を受け難い反教師学習を行うことを目的とする。
そこで、本発明は、情報処理装置であって、学習データとしての正事例又は負事例のラベルが付与されていない、ラベルなしの複数のデータそれぞれの特徴量を抽出する抽出手段と、前記複数のデータそれぞれの特徴量に基づいて、複数のデータから外れデータを検出する検出処理を行い、前記外れデータを除いた複数のデータの特徴量を対象として検出処理を繰り返す検出手段と、前記検出手段による外れデータの検出結果に基づいて、外れデータの異常度を決定する異常度決定手段と、前記異常度に基づいて、前記データにラベルを付与する付与手段とを有することを特徴とする。
本発明によれば、ラベルが付与されていないデータを学習データとして利用した、外れデータの影響を受け難い反教師学習を行うことができる。
情報処理装置と、撮影装置と、を示す図である。 情報処理装置のソフトウェア構成を示す図である。 学習処理を示すフローチャートである。 Haar Wavelet変換の説明図である。 T(x)の関数を示す図である。
以下、本発明の実施形態について図面に基づいて説明する。
図1は、第1の実施形態に係る情報処理装置100と、撮影装置110と、を示す図である。本実施形態においては、情報処理装置100は、検査対象物の外観検査において、検査対象物の撮影画像に基づいて、良品(正事例)であるか不良品(負事例)であるかの良否判定を行うものとする。ここで、検査対象物は、例えば検査部品等である。撮影装置110は、予め設定された撮影パラメータに基づいて、検査対象物120の画像を撮影する。撮影装置110により撮影された撮影画像は、情報処理装置100に入力される。情報処理装置100は、撮影装置110により撮影された撮影画像で、ラベルが付与されていない撮影画像に対し、ラベルを推定する。なお、情報処理装置100は、ラベルを推定する際には、ラベルが付与されていない撮影画像だけでなく、ラベルが付与されている撮影画像も学習データとして利用する。但し、他の例としては、情報処理装置100は、ラベルを推定する際に、ラベルが付与されていない撮影画像のみを利用してもよい。また、ラベルとしては、良品(正事例)であることを示す良品のラベルと、不良品(負事例)であることを示す不良品のラベルがある。
情報処理装置100は、CPU101と、ROM102と、RAM103と、HDD104と、表示部105と、入力部106と、通信部107とを有している。CPU101は、ROM102に記憶された制御プログラムを読み出して各種処理を実行する。RAM103は、CPU101の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD104は、画像データや各種プログラム等各種情報を記憶する。なお、後述する情報処理装置100の機能や処理は、CPU101がROM102又はHDD104に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。
表示部105は、各種情報を表示する。表示部105は例えば、良品判定の結果を表示する。入力部106は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。通信部107は、ネットワークを介して外部装置との通信処理を行う。なお、撮影装置110は、情報処理装置100と一体に設けられていてもよい。
図2は、情報処理装置100のソフトウェア構成を示す図である。情報処理装置100は、特徴量抽出部201と、外れ点検出部202と、異常度決定部203と、ラベル判定部204と、ラベル識別部205と、を有している。前述の通り、本実施形態に係る情報処理装置100においては、ラベルが付与されている撮影画像及びラベルが付与されていない撮影画像の両方を処理対象として処理を行う。以下、ラベルが付与されている撮影画像をラベル付きデータ、ラベルが付与されていない撮影画像をラベルなしデータと、称することとする。また、良品のラベルが付与されたラベル付きデータ、不良品のラベルが付与されたラベル付きデータをそれぞれ良品ラベル付きデータ、不良品ラベル付きデータと称することとする。また、処理対象となるラベル付きデータ及びラベルなしデータを、対象データと称することとする。対象データは、撮影装置110から入力されてもよく、また、情報処理装置100のHDD104等の記憶部に予め記録されていてもよい。
特徴量抽出部201は、複数の対象データそれぞれから所定の特徴量を抽出する。外れ点検出部202は、特徴量に基づいて、複数の対象データの中から、外れデータである外れ点を検出する。異常度決定部203は、外れ点検出部202により外れ点として検出された対象データそれぞれの異常度を決定する。ラベル判定部204は、異常度に基づいて、確信度の高いラベルなしデータに対し、良品又は不良品のラベルを推定し、ラベルを付与する。ラベル識別部205は、ラベル判定部204によりラベルが付与されたラベルなしデータ及びラベル付きデータを学習データとして利用し、ラベルが付与されていないラベルなしデータのラベルを識別し、ラベルを付与する。なお、各部の処理については、図3を参照しつつ詳述する。
図3は、情報処理装置100による学習処理を示すフローチャートである。なお、本実施形態においては、処理対象のデータ群は、良品ラベル付きデータN_ok個、不良品ラベル付きデータN_ng個、ラベルなしデータN_u個を含むものとする。S301において、特徴量抽出部201は、処理対象のデータ群を、良品ラベル付きデータ、不良品ラベル付きデータ、ラベルなしデータの3つに分類し、各データの特徴量を抽出する(抽出処理)。
ここで、特徴量抽出処理について説明する。特徴量抽出処理において、統計的特徴量を用いる場合は、良品ラベル付きデータN_ok個、不良品ラベル付きデータN_ng個、ラベルなしデータN_u個、それぞれから特徴量を算出する。特徴量算出方法として、画像の注目領域に対して、Haar Wavelet変換をかけて、階層的に画像を生成し、統計量を算出する方法を説明する。Haar Wavelet変換は、簡単に述べると、位置情報を保持したまま周波数変換できる処理である。
図4は、Haar Wavelet変換の説明図である。まず、対象画像に対して、4種類のフィルタ
Figure 2017102865
を用意する。ここで、一つ目のフィルタは縦方向高周波数成分フィルタを示す。二つ目のフィルタは、横方向高周波数成分フィルタを示す。三つ目のフィルタは、対角方向高周波数成分フィルタを示す。四つ目のフィルタは、低周波数成分フィルタを示す。対象画像の2×2の領域に対して、上記のフィルタで内積をとる。2×2の領域を重ね合わせることなく、移動させて、解像度が2分の1になるように、縦方向高周波成分画像、横方向高周波成分画像、対角方向高周波成分画像、低周波成分画像の四種類の画像を生成する。この際、解像度を2分の1するので、例えば、Haar Wavelet変換を7回するのであれば、画像サイズは2の7乗の倍数に設定しておくのが好ましい。
算出された低周波成分画像から四種類のフィルタを用意して、さらに解像度が2分の1となるような、次の階層に当たる縦方向高周波成分画像、横方向高周波成分画像、対角方向高周波成分画像、低周波成分画像の四種類の画像を生成する。さらに低周波数成分画像にフィルタをかけ続けることにより、階層的に画像を生成する。ここでは1階層から7階層までの28画像と原画像を加えた29画像を用意する。
Haar Wavelet変換を行っていない変換前の画像、Haar Wavelet変換をかけた各階層画像の29種類の画像から、max(p)、(式1)で示されるmean(p)、(式2)で示されるvar(p)の3つの特徴量を算出する。
Figure 2017102865
ここで、画像のサイズは縦a画素、横b画素の画像の縦i番目、横j番目の画素値をp(i,j)で表す。画像データから算出された29種類の画像に対して、マクロな特徴量を3種類算出する。よって、特徴量を29×3=87個(以下N_f個とする)抽出する。良品ラベル付きデータN_ok個、不良品ラベル付きデータN_ng個、ラベルなしデータN_u個、それぞれからN_f個の特徴量を算出する。
良品ラベル付きデータから得られる特徴量の特徴ベクトル、不良品ラベル付きデータから得られる特徴量の特徴ベクトル、ラベルなしデータから得られる特徴量の特徴ベクトルは、それぞれ以下の通りである。

良品ラベル付きデータ : x_o1,…,x_oN_ok∈R^N_f
不良品ラベル付きデータ : x_n1,…,x_nN_ng∈R^N_f
ラベルなしデータ : x_u1,…,x_uN_u∈R^N_f

また、max(p)、mean(p)及びvar(p)を要素とする特徴ベクトルxを用いて、特徴ベクトルが算出される。
次に、S302において、外れ点検出部202は、外れ点検出処理を行う。ここで、外れ点検出処理とは、処理対象のデータ群から得られた特徴量を利用して、1クラス識別器を用いて外れ点を検出する処理である。すなわち、外れ点検出部202は、良品ラベル付きデータの特徴量、不良品ラベル付きデータの特徴量、ラベルなしデータの特徴量、すべてを用いて、1クラス識別器により、外れ点を検出する。
次に、S303において、外れ点検出部202は、外れ点検出処理において外れ点が検出されたか否かを確認する。外れ点検出部202は、外れ点が検出された場合には(S303でYes)、処理をS304へ進める。S304において、外れ点検出部202は、検出された外れ点を処理対象のデータ群から除外する。そして、外れ点検出部202は、処理をS302へ進める。この場合、S302において、外れ点検出部202は、外れ値として検出されたデータが除外されたデータ群を新たな処理対象として、外れ点検出処理を行う。すなわち、S302〜S304の処理は、外れ点検出処理を繰り返す検出処理の一例である。
ここで、S302〜S304において、処理対象のデータ群から求めた特徴ベクトルに対し、外れ点検出処理を繰り返す処理の詳細について説明する。外れ点検出の手法として、カーネル法を用いた1クラスSVMを用いる手法を説明する。
特徴ベクトルをx_1,…,x_nとしたときの、カーネル法の線形結合により、1クラスSVM(Support Vector Machine)の識別関数は、以下のように示せる。
Figure 2017102865
この2次計画問題を解くと、
Figure 2017102865
この学習をカーネルトリックを用いて、非線形拡張すると、識別関数は、
Figure 2017102865
となり、
Figure 2017102865
と変形できる。
また、この学習問題に対して、外れ点検出部202は。外れ点(原点側にあるサンプル)の割合の上限νを0.1程度に設定し、ラベルなしデータから、外れ点を順に検出する。そして、外れ点検出部202は、外れ点として選ばれたデータを処理対象のデータ群から除外して得られた新たな処理対象のデータ群に対し外れ点検出処理を繰り返す。すなわち、外れ点検出部202は、1クラスSVMを複数回繰り返す。そして、外れ点検出部202は、ラベルなしデータ及び不良品ラベル付きデータに関しては、外れ点として検出された場合に、処理対象のデータ群から除外する。一方で、外れ点検出部202は、良品ラベル付きデータについては、外れ点として検出された場合でも、処理対象のデータ群から除外しない。
処理対象のデータ群から、f(x)の値が−1のデータが外れ点として検出され、処理対象のデータ群から除外される処理が繰り返される。このため、νの値が0.1と小さすぎると、検出できなくなる。よって、外れ点検出部202は、外れ点検出処理を繰り返すにつれて、νの値を徐々に大きく設定することとする。外れ点検出を繰り返すことにより、外れ点によらないモデルが生成され、より正確に外れ点を検出できるようになる。
一方で、S303において、外れ点検出部202は、外れ点が検出されなかった場合には(S303でNo)、処理をS305へ進める。S305において、異常度決定部203は、外れ点検出処理における検出結果に基づいて、S302〜S304の繰り返し処理において得られた複数の外れ点それぞれの異常度を決定する(異常度決定処理)。具体的には、異常度決定部203は、まず複数の外れ点を外れ点検出部202による検出順に並べ、検出順が先の外れ点に対し、より大きい異常度を割り当てる。なお、同じ外れ点検出処理において複数の外れ点が検出された場合には、H(xi,x)の値がより低いデータに対し、より高い異常度を割り当てる。
次に、S306において、ラベル判定部204は、各データの異常度に基づいて、良品及び不良品のデータを選択する。そして、ラベル判定部204は、良品として選択したデータに良品のラベルを付与する(付与処理)。ラベル判定部204はまた、不良品として選択したデータに不良品のラベルを付与する。具体的には、ラベル判定部204は、異常度が低い順に第1の個数のデータを良品として選択し、異常度が高い順に第2の個数のデータを不良品として選択する。ここで、第1の個数及び第2の個数は予めHDD104等に設定されているものとする。また、第1の個数及び第2の個数は、等しい数でもよく異なる数でもよい。
次に、S307において、ラベル識別部205は、S306においてラベルが付与されたデータと、予めラベルが付与されているラベル付きデータと、を学習データとして設定する。そして、ラベル識別部205は、学習データを利用し、S306においてラベルが付与されていないデータを処理対象として、2クラス識別を行う(識別処理)。2クラス判別の識別器に関しては、SVMを利用する。SVMについては、以下の文献を参照することができる。

Vapnik, V.N., The nature of statistical learning theory. Springer, 1995.
以上のように、情報処理装置100は、外れ点検出処理を繰り返し行うことにより、外れ点を検出し、各外れ点の異常度に基づいて、ラベルなしデータに対しラベルを付与する。さらに、情報処理装置100は、異常度に基づく処理においてラベルが付与されなかった、ラベルなしデータに対しては、ラベルの識別によりラベルを付与する。このように、情報処理装置100は、外れ点に対応した正確な半教師学習を行うことができる。
なお、第1の実施形態の第1の変更例としては、外れ点検出部202は、1クラスSVMを用いることとしたが、これに替えて部分空間法等の1クラス識別器を用いてもよい。
第2の変更例としては、第1の個数及び第2の個数は、検査対象物が安定して生産された際の良品と不良品の発生比率に応じて決定されてもよい。例えば、発生比率と、良品の第1の個数と、に基づいて、不良品の第2の個数を決定し、管理者等がこれらの値を情報処理装置100に登録してもよい。また、他の例としては、管理者等が入力部106を介して、発生比率と第1の個数と、を入力し、CPU101が、発生比率と第1の個数とに基づいて、不良品の第2の個数を算出し、第1の個数と第2の個数を記憶部に登録してもよい。このように、発生比率を加味することにより、適切な学習データを生成することができる。
第3の変更例としては、情報処理装置100は、異常度に基づいて、ラベルなしデータの中から良品及び不良品のデータを選択すればよく、そのための処理は、実施形態に限定されるものではない。例えば、ラベル判定部204は、不良品ラベル付きデータの異常度のうち最も小さい値を閾値として決定してもよい(閾値決定処理)。この場合、ラベル判定部204は、異常度が閾値以上のデータを不良品として選択する(データ選択処理)。一方で、ラベル判定部204は、外れ点として検出されなかった、ラベルなしデータを、良品データとして選択する。このように、不良品ラベル付きデータを利用することにより、適切な学習データを生成することができる。
第4の変更例について説明する。本実施形態に係る情報処理装置100は、図3を参照しつつ説明したS307の処理において、学習データを用いた教師あり学習により、ラベルなしデータのラベルの識別を行った。ラベル識別部205は、本処理に替えて、半教師学習により、ラベルなしデータのラベルの識別を行ってもよい。すなわち、ラベル識別部205は、S306において、SVMに替えて、Transductive SVM(TSVM)を利用する。TSVMは、半教師学習に対応するために、SVMを改良したものであり、ラベルがついていないテストデータの情報をすべて使ってモデルを生成し、テストデータのラベルを付加する手法である。TSVMについては、以下の文献を参照することができる。

Thorsten Joachims, Transductive Inference for Text Classification using Support Vector Machines. International Conference on Machine Learning (ICML), 1999.
(式4)は、TSVMの学習問題である。
Figure 2017102865
(式4)で示された学習問題のうち、第1項と第2項は2クラスSVMの学習問題と同一問題でラベルが付いているデータにのみ関係する。また、第3項は、ラベルが付いていないデータにのみに関係する項で、マージンにラベル付いていないデータがあったときのペナルティを示す。
Figure 2017102865
に関しては、値を固定し、徐々に値を増加させながら、最適解を算出する。
また、図5は、T(x)の関数を示す図である。T(x)はマージンに対するペナルティに対する関数である。T(x)のx=1は、正のサポートベクトルを示し、T(x)のx=−1は、負のサポートベクトルを示す。x=0はマージンの中央を示し、ペナルティが最大となるように値が最大となる線形の関数となっている。なお、その他にもマージンに対する損失関数は存在するが、今回はこの損失関数を用いる。
通常TSVMは、ラベルが付いているデータで(式4)の第1項と第2項を算出し、ラベル付いていないデータで(式4)の第3項を算出する。これに対し、本変更例においては、S306において、ラベル識別部205は、ラベルが付与されたデータについては、第1項と第2項の算出に利用することとする。ラベル識別部205はまた、ラベルが付与されなかった、ラベルなしデータについては、(式4)の第3項の算出に利用することとする。
これにより、ラベルなしデータのうち、S306においてラベルが付与されたデータについては、教師データとして利用することができる。したがって、より精度の高いTSVMでラベルの識別を行うことができる。このように、本変更例においては、異常度に基づいて、ラベルなしデータのラベルをある程度決定した上で、半教師識別器に適用することにより精度の高い識別を行うことができる。
以上、上述した各実施形態によれば、ラベルが付与されていないデータを学習データとして利用した、外れ点の影響を受け難い反教師学習を行うことができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 情報処理装置
110 撮影装置

Claims (19)

  1. 学習データとしての正事例又は負事例のラベルが付与されていない、ラベルなしの複数のデータそれぞれの特徴量を抽出する抽出手段と、
    前記複数のデータそれぞれの特徴量に基づいて、複数のデータから外れデータを検出する検出処理を行い、前記外れデータを除いた複数のデータの特徴量を対象として検出処理を繰り返す検出手段と、
    前記検出手段による外れデータの検出結果に基づいて、外れデータの異常度を決定する異常度決定手段と、
    前記異常度に基づいて、前記ラベルなしの複数のデータにラベルを付与する付与手段と
    を有することを特徴とする情報処理装置。
  2. 前記異常度決定手段は、前記外れデータとしての検出順に応じて前記異常度を決定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記付与手段は、前記異常度が高い順に第1の個数のデータに対し、負事例のラベルを付与することを特徴とする請求項2に記載の情報処理装置。
  4. 前記付与手段は、前記異常度が低い順に第2の個数のデータに対し、正事例のラベルを付与することを特徴とする請求項2又は3に記載の情報処理装置。
  5. 前記データは、外観検査において利用される検査対象物のデータであることを特徴とする請求項1乃至4何れか1項に記載の情報処理装置。
  6. 前記データは、外観検査において利用される検査対象物のデータであり、
    前記付与手段は、前記外観検査における正事例と負事例の発生比率に応じた数の前記データに対し、正事例及び負事例のラベルを付与することを特徴とする請求項1に記載の情報処理装置。
  7. 前記抽出手段は、予め正事例又は負事例のラベルが付与されているラベル付きのデータをさらに処理対象とし、前記ラベル付きのデータの特徴量を抽出し、
    前記検出手段は、前記ラベルなしのデータ及び前記ラベル付きのデータそれぞれの特徴量に基づいて前記検出処理を行うことを特徴とする請求項1乃至6何れか1項に記載の情報処理装置。
  8. 前記抽出手段は、予め負事例のラベルが付与されているラベル付きのデータの特徴量をさらに抽出し、
    前記検出手段は、前記ラベルなしのデータ及び前記ラベル付きのデータそれぞれの特徴量に基づいて前記検出処理を行い、
    前記外れデータとして検出された前記ラベルなしのデータ及び前記ラベル付きのデータの異常度に基づいて、前記ラベルなしのデータの中から、負事例のデータを選択するデータ選択手段をさらに有し、
    前記付与手段は、前記データ選択手段により選択された前記ラベルなしのデータに対し、負事例のラベルを付与することを特徴とする請求項1又は2に記載の情報処理装置。
  9. 前記ラベルなしのデータ及びラベル付きのデータの異常度に基づいて、前記異常度の閾値を決定する閾値決定手段をさらに有し、
    前記データ選択手段は、前記閾値以上の異常度の前記データを負事例として選択することを特徴とする請求項8に記載の情報処理装置。
  10. 前記付与手段は、前記外れデータとして検出されなかったラベルなしのデータに対し、正事例のラベルを付与することを特徴とする請求項8又は9に記載の情報処理装置。
  11. 前記付与手段によりラベルが付与された対象データを学習データとして利用することにより、前記付与手段により前記ラベルが付与されなかったラベルなしのデータの識別を行う識別手段をさらに有することを特徴とする請求項1乃至10何れか1項に記載の情報処理装置。
  12. 前記検出手段は、1クラス識別器を用いて前記検出処理を行うことを特徴とする請求項1乃至11何れか1項に記載の情報処理装置。
  13. 前記1クラス識別器は、1クラスSVM(Support Vector Machine)であることを特徴とする請求項12に記載の情報処理装置。
  14. 前記1クラス識別器は、部分空間法であることを特徴とする請求項12に記載の情報処理装置。
  15. 前記識別手段は、2クラス判別の識別器を用いた識別を行うことを特徴とする請求項11に記載の情報処理装置。
  16. 前記識別手段は、半教師学習を用いて識別を行うことを特徴とする請求項11に記載の情報処理装置。
  17. 前記識別手段は、Transductive SVMで識別を行うことを特徴とする請求項16に記載の情報処理装置。
  18. 情報処理装置が実行する情報処理方法であって、
    学習データとしての正事例又は負事例のラベルが付与されていない、ラベルなしの複数のデータそれぞれの特徴量を抽出する抽出ステップと、
    前記複数のデータそれぞれの特徴量に基づいて、複数のデータから外れデータを検出する検出処理を行い、前記外れデータを除いた複数のデータの特徴量を対象として検出処理を繰り返す検出ステップと、
    前記検出ステップにおける外れデータの検出結果に基づいて、外れデータの異常度を決定する異常度決定ステップと、
    前記異常度に基づいて、前記データにラベルを付与する付与ステップと
    を含むことを特徴とする情報処理方法。
  19. コンピュータを、
    学習データとしての正事例又は負事例のラベルが付与されていない、ラベルなしの複数のデータそれぞれの特徴量を抽出する抽出手段と、
    前記複数のデータそれぞれの特徴量に基づいて、複数のデータから外れデータを検出する検出処理を行い、前記外れデータを除いた複数のデータの特徴量を対象として検出処理を繰り返す検出手段と、
    前記検出手段による外れデータの検出結果に基づいて、外れデータの異常度を決定する異常度決定手段と、
    前記異常度に基づいて、前記データにラベルを付与する付与手段と
    として機能させるためのプログラム。
JP2015237982A 2015-12-04 2015-12-04 情報処理装置、情報処理方法及びプログラム Pending JP2017102865A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015237982A JP2017102865A (ja) 2015-12-04 2015-12-04 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015237982A JP2017102865A (ja) 2015-12-04 2015-12-04 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2017102865A true JP2017102865A (ja) 2017-06-08

Family

ID=59017458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015237982A Pending JP2017102865A (ja) 2015-12-04 2015-12-04 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2017102865A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242820A (zh) * 2017-07-10 2019-01-18 发那科株式会社 机器学习装置、检查装置以及机器学习方法
CN110599441A (zh) * 2018-06-11 2019-12-20 发那科株式会社 接缝检查装置
JP2020030752A (ja) * 2018-08-24 2020-02-27 株式会社東芝 情報処理装置、情報処理方法およびプログラム
WO2020101036A1 (ja) * 2018-11-16 2020-05-22 株式会社 Preferred Networks 教師信号生成装置、モデル生成装置、物体検出装置、教師信号生成方法、モデル生成方法、およびプログラム
JPWO2020225923A1 (ja) * 2019-05-09 2020-11-12
JPWO2019230356A1 (ja) * 2018-05-31 2021-06-24 パナソニックIpマネジメント株式会社 学習装置、検査装置、学習方法および検査方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109242820A (zh) * 2017-07-10 2019-01-18 发那科株式会社 机器学习装置、检查装置以及机器学习方法
JP2019015654A (ja) * 2017-07-10 2019-01-31 ファナック株式会社 機械学習装置、検査装置及び機械学習方法
US10891520B2 (en) 2017-07-10 2021-01-12 Fanuc Corporation Machine learning device, inspection device and machine learning method
CN109242820B (zh) * 2017-07-10 2021-06-08 发那科株式会社 机器学习装置、检查装置以及机器学习方法
JPWO2019230356A1 (ja) * 2018-05-31 2021-06-24 パナソニックIpマネジメント株式会社 学習装置、検査装置、学習方法および検査方法
JP7320704B2 (ja) 2018-05-31 2023-08-04 パナソニックIpマネジメント株式会社 学習装置、検査装置、学習方法および検査方法
CN110599441A (zh) * 2018-06-11 2019-12-20 发那科株式会社 接缝检查装置
CN110599441B (zh) * 2018-06-11 2023-11-07 发那科株式会社 接缝检查装置
JP2020030752A (ja) * 2018-08-24 2020-02-27 株式会社東芝 情報処理装置、情報処理方法およびプログラム
WO2020101036A1 (ja) * 2018-11-16 2020-05-22 株式会社 Preferred Networks 教師信号生成装置、モデル生成装置、物体検出装置、教師信号生成方法、モデル生成方法、およびプログラム
JPWO2020225923A1 (ja) * 2019-05-09 2020-11-12
JP7424373B2 (ja) 2019-05-09 2024-01-30 日本電信電話株式会社 分析装置、分析方法及び分析プログラム

Similar Documents

Publication Publication Date Title
US10896351B2 (en) Active machine learning for training an event classification
JP2017102865A (ja) 情報処理装置、情報処理方法及びプログラム
Jiang et al. Saliency in crowd
US10657281B2 (en) Information processing apparatus and method for specifying learning data
AU2014278408B2 (en) Method for detecting a plurality of instances of an object
US9002101B2 (en) Recognition device, recognition method, and computer program product
EP2854053A1 (en) Defect prediction method and device
JP6632288B2 (ja) 情報処理装置、情報処理方法、プログラム
EP2919153A1 (en) Event detection apparatus and event detection method
US20190095742A1 (en) Image processing apparatus, method, and non-transitory computer-readable storage medium
US20110103652A1 (en) Image processing apparatus and image processing method
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
JP2013161295A (ja) ラベル付加装置、ラベル付加方法及びプログラム
JP2006323507A (ja) 属性識別システムおよび属性識別方法
CN105654109B (zh) 分类方法、检查方法和检查装置
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
Davis et al. Automated bone age assessment using feature extraction
US11455489B2 (en) Device that updates recognition model and method of updating recognition model
JP6623851B2 (ja) 学習方法、情報処理装置および学習プログラム
Sayin et al. The science of rejection: A research area for human computation
JP2020170252A (ja) 画像処理装置、情報処理方法及びプログラム
Mayo et al. How hard are computer vision datasets? Calibrating dataset difficulty to viewing time
US9104450B2 (en) Graphical user interface component classification
Guraya et al. Neural networks based visual attention model for surveillance videos
JP2016170518A (ja) 情報処理装置、情報処理方法及びプログラム