JP5809663B2 - 分類精度推定装置、分類精度推定方法、およびプログラム - Google Patents

分類精度推定装置、分類精度推定方法、およびプログラム Download PDF

Info

Publication number
JP5809663B2
JP5809663B2 JP2013121852A JP2013121852A JP5809663B2 JP 5809663 B2 JP5809663 B2 JP 5809663B2 JP 2013121852 A JP2013121852 A JP 2013121852A JP 2013121852 A JP2013121852 A JP 2013121852A JP 5809663 B2 JP5809663 B2 JP 5809663B2
Authority
JP
Japan
Prior art keywords
data
correct
auc
accuracy
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013121852A
Other languages
English (en)
Other versions
JP2014238763A (ja
Inventor
伸幸 清水
伸幸 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013121852A priority Critical patent/JP5809663B2/ja
Publication of JP2014238763A publication Critical patent/JP2014238763A/ja
Application granted granted Critical
Publication of JP5809663B2 publication Critical patent/JP5809663B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、機械学習を行った結果を用いた分類の精度を推定する分類精度推定装置等に関するものである。
従来、正例のデータ、および負例のデータに基づいて、機械学習を行う装置が開発されている。(例えば、特許文献1参照)。そして、その機械学習を行った結果を用いた分類の精度を算出する装置も開発されている。
特開2013−025398号公報(第1頁、第1図等)
しかしながら、従来は、正例のデータと、正例か負例かが不明なデータとに基づいて行った機械学習の学習結果を用いてデータを分類したとしても、正例のデータと負例のデータとを分類する分類精度を正確に算出する方法がないという課題があった。
上記課題に対し、本発明の目的は、正例のデータと、正例か負例かが不明なデータとに基づいて行った機械学習の学習結果を用いて、正例のデータと負例のデータとを分類する分類精度を推定できるようにすることである。
本第一の発明の分類精度推定装置は、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置であって、PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、分類の結果である分類結果情報を取得する分類結果情報取得手段と、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、U集合に含まれる正解データp’とU集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段と、割合情報と、U集合と、P集合とを用いて、U集合に含まれる正解データp’が、U集合に含まれる不正解データnよりも少なく、かつ、P集合に含まれる正解データpが、U集合に含まれる不正解データnよりも少ないほど高い値であり、AUC推定手段が推定した結果の確からしさを示す値である確度情報を算出する確度情報取得手段と、AUC推定手段によって推定されたAUCp∪p’,nと、確度情報とを出力する出力手段とを具備する分類精度推定装置である。
また、本第二の発明の分類精度推定装置は、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置であって、PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、分類の結果である分類結果情報を取得する分類結果情報取得手段と、U集合に含まれる正解データp’とU集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段と、割合情報とP集合とU集合とを用いて、U集合に含まれる正解データp’、および、P集合に含まれる正解データpが、U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、AUC推定手段によって推定されたAUCp∪p’,nを出力する出力手段とを具備する分類精度推定装置である。
また、本第三の発明の分類精度推定装置は、第一または二の発明に対して、分類結果情報取得手段は、PU分類器が用いている学習結果を作成する際の学習に用いたデータの少なくとも一部が異なるデータを含むP集合とU集合とに含まれる各データを正例、または負例に分類した結果である分類結果情報を取得する、分類精度推定装置である。
また、本第四の発明の分類精度推定装置は、第一または二の発明に対して、分類結果情報取得手段は、PU分類器が用いている学習結果を作成する際の学習に用いた正解データの集合であるP集合と、学習に用いた不明データの集合であるU集合とに含まれる各データを正例、または負例に分類した結果である分類結果情報を取得する、分類精度推定装置である。
本発明による分類精度推定装置等によれば、正例のデータと、正例か負例かが不明なデータとに基づいて行った機械学習の学習結果を用いて、正例のデータと負例のデータとを分類する分類精度を推定できる。
実施の形態1における分類精度推定装置のブロック図 同実施の形態における分類精度推定装置の動作の一例を示すフローチャート 同実施の形態における分類精度推定装置の動作の一例を示すフローチャート 同実施の形態におけるコンピュータシステムの外観の一例を示す図 同実施の形態におけるコンピュータシステムの構成の一例を示す図
以下、分類精度推定装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器における、正解データと不正解データとを分類する分類精度を、AUCを用いて推定する分類精度推定装置1について説明する。
図1は、本実施の形態における分類精度推定装置1等のブロック図である。分類精度推定装置1は、PU分類器101が分類した分類結果を取得して、その分類精度の分類精度を推定する。その分類精度推定装置1は、テスト集合取得手段102、分類結果情報取得手段103、受付手段104、AUC推定手段105、確度情報取得手段106、および出力手段107を備える。
PU分類器101は、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いた分類器である。正例および負例は、二値分類を学習する機械学習において、二値の一方、および他方を示す概念である。正例および負例は、二値に分けるために便宜上用いられている名称であるため、学習されるデータの内容とは関係しても良く、しなくても良い。なお、正例は、正解、Positive、またはTrue等と記載される。負例は、不正解、Negative、またはFalse等と記載される。正解データ、および不正解データが示す内容は、学習の事例によって異なる。例えば、ユーザに対して有効な広告を学習する機械学習の場合は、ユーザにクリックされた広告を示す情報を正解データとし、クリックされなかった広告を示す情報を不明データとしても良い。なお、この場合の不明データは、正解データ、または不正解データのどちらのデータか分からないデータである。例えば、不明データの正解データは、ユーザにとって興味のある広告を示す情報であるのに、何かの事情でクリックされなかった広告を示す情報であっても良い。また、不明データの不正解データは、ユーザにとって興味の無い広告を示す情報であっても良い。
PU分類器101が用いる学習結果は、機械学習の結果、作成されたものである。その機械学習は、入力データが正例か負例かを学習できる機械学習であれば、どのような種類の機械学習であっても良い。例えば、機械学習の種類は、ランキング学習であっても良く、SVM(Support Vector Machine)を用いた学習であっても良く、ニューラルネットワークを用いた学習であっても良く、ベイズ確率モデルを用いた学習等であっても良い。上述のランキング学習等は、公知技術であるため、詳細な説明を省略する。機械学習に用いるデータは、正例の正解データと負例の正解データとが、負例の不正解データに比べて非常に少ないデータであることが好適である。そのため、機械学習に用いるデータは、例えば、「正例のデータに含まれる正解データの数/負例のデータに含まれる不正解データの数」が閾値Rより小さく、かつ「負例のデータに含まれる正解データの数/負例のデータに含まれる不正解データの数」が閾値R’より小さいデータであっても良い。なお、RおよびR’は、例えば「0.01」等の非常に値の小さい正の実数であるものとし、RおよびR’は同じ値であっても良い。「正例の正解データと負例の正解データとが、負例の不正解データに比べて非常に少ない」は、具体的には、後述する数式5の式において、「p×p’/((p+p’)×n)」の値が、「p/(p+p’)」および「p’/(p+p’)」に比べて充分に小さく、数式5の計算上、「p×p’/((p+p’)×n)」が係数となっている項が、無視できるほど、pとp’とに比べnが大きいことである。なお、上記式のpは正例の正解データの数を示し、p’は負例の正解データの数を示し、nは不正解データの数を示している。PU分類器101は、テストに用いるデータが与えられた際に、機械学習の学習結果を用いて、そのデータが正例なのか、負例なのかを判断する。
テスト集合取得手段102は、PU分類器101で分類するP集合とU集合とを取得する。P集合は、正解データpの集合である。また、U集合は、正解データp’および不正解データnが混在した不明データuの集合である。以下、P集合とU集合とを合わせた集合を、テスト集合とも記載する。また、テスト集合に含まれる正解データp、正解データp’、または不正解データnのいずれかを示すデータをテストデータとも記載する。テスト集合取得手段102が取得するテスト集合は、P集合に含まれる正解データpの数と、U集合に含まれる不明データuの数とが分かるデータである。また、そのテスト集合は、U集合に含まれる正解データp’の数と、不正解データnの数とが分かる集合であっても良いが、分からない集合であっても良い。なお、P集合には、不正解データは含まれていないものとする。
テスト集合取得手段102は、PU分類器101が用いている学習結果を作成する際の学習に用いたデータの少なくとも一部が異なるデータを取得しても良く、その学習に用いたデータとすべてが異なるデータであっても良く、その学習に用いた正解データの集合であるP集合と、その学習に用いた不明データの集合であるU集合とに含まれる各データを取得しても良い。この際の「その学習に用いた正解データ(不明データ)の集合」は、完全に一致する集合であっても良く、一部が一致する集合であっても良い。具体的には、テスト集合取得手段102が取得するテスト集合に含まれるテストデータは、機械学習の際に用いられたデータそのものであっても良く、機械学習の際に用いられたデータと異なるデータであっても良い。なお、機械学習の際に用いられたデータと異なるデータは、機械学習の際に用いられたデータと同じ手法、またはルール等を用いて作成されたデータでなければならない。つまり、機械学習の際に用いられたデータとテストデータの素性は、同じ方法で取得しなければならない。例えば、テスト集合取得手段102は、学習に用いることができるデータを分割して、一方を実際に学習に用いるデータの集合、他方をテストデータの集合であるテスト集合と扱っても良い。
テスト集合取得手段102は、図示しない格納手段や外部の格納装置からテスト集合を取得しても良い。なお、テスト集合取得手段102は、外部からテスト集合を受け付ける受付手段として機能しても良い。
分類結果情報取得手段103は、PU分類器101を用いて、分類の結果である分類結果情報を取得する。分類結果情報取得手段103が分類結果情報を取得することは、テストデータをPU分類器101に入力し、PU分類器101が分類した結果を受け取ることである。分類結果情報は、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データをPU分類器101が正例、または負例に分類した結果を示す情報である。また、分類結果情報は、P集合に含まれる正解データp、または、U集合に含まれる不明データuが、PU分類器101によって、正例、または負例のどちらに分類されたかを示す情報を、そのデータに関する情報に対応付けた情報である。なお、分類結果情報が対応付けるデータに関する情報は、データそのものであっても良く、データを識別するID等の情報であっても良く、P集合、またはU集合のどちらに属するデータかを示す情報であっても良い。また、分類結果情報は、正例、または負例のどちらに分類されたかを示す情報に対して、さらにスコアを対応付けていても良い。スコアは、PU分類器101が算出する数値である。また、スコアは、例えば、正例である可能性が高いほど高い値が算出される数値であっても良く、そうでなくても良い。スコアは、例えば、実数であっても良く、正例、または負例を示す情報であっても良い。スコアが実数の場合は、例えば、ランキング学習を用いた分類を行ったときの、ランキングに用いる値であっても良く、SVMを用いた分類を行ったときの、分離境界からの距離を示す値等であっても良い。なお、ランキングに用いる値は、PU分類器101がテストデータをランキング(並び替え)する際に用いる数値である。分類結果情報取得手段103は、P集合とU集合とを、テスト集合取得手段102から取得しても良く、図示しない格納手段から取得しても良く、外部から受け付けて取得しても良い。分類結果情報取得手段103が、P集合とU集合とを外部から受け付けて取得する場合は、分類結果情報取得手段103は、受付手段として機能しても良い。
受付手段104は、U集合に含まれる正解データp’とU集合に含まれる不正解データnとの割合に関する割合情報を受け付ける。割合情報は、割合の値の範囲を示す情報であっても良く、割合の値を示す情報であっても良い。割合情報は、正解データp’と不正解データnとの割合を示す情報であれば良い。例えば、割合情報は、正解データp’と不正解データnとの割合そのものを示す情報であっても良く、正解データp’の数と不正解データnの数とを示す情報であっても良く、一方が他方よりも非常に多い、または非常に少ないことを示す情報であっても良く、正解データp’と、不正解データnとを指定する情報であっても良い。なお、受付手段104は、人の手によって設定された割合情報を受け付けても良く、割合情報を算出できる情報から、割合情報を算出した結果を受け付けても良い。割合情報を算出できる情報は、例えば、U集合に含まれる正解データp’と不正解データnとの数が分かっている場合のテスト集合等である。
AUC推定手段105は、分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定する。AUCは、Area under the curve(曲線下面積)の略であり、分類器が分類した際の精度を示す指標である。なお、AUCは、0.0から1.0の間の値をとり、1.0に近いほど分類精度が高いことを示す。なお、AUCの値は、テストデータをランダムに分類する分類器の場合は、0.5となる。AUCは公知であるため、その詳細な説明は省略する。AUC推定手段105が推定するAUCは、AUCp∪p’,nである。AUCp∪p’,nは、正解データが正例に、不正解データが負例に分類されたかどうかの精度を示す指標である。AUC推定手段105が推定するAUCp∪p’,nは、機械学習の精度改善のために利用される情報である。例えば、AUCp∪p’,nは、その値が最適化されるまで学習方法を試行しながら繰り返す場合等に用いられる。AUCp∪p’,nは、例えば、数式1で算出できる。なお、数式では、AUCp∪p’,nは、AUCQ,Nと表記するものとする。
Figure 0005809663
数式1において、QはQ集合に含まれる正解データpと正解データp’との集合を示し、NはN集合に含まれる不正解データnの集合を示し、pはP集合に含まれる正解データpの数を示し、p’はU集合に含まれる正解データp’の数を示し、nはN集合に含まれる不正解データnの数を示し、xはテストデータを示し、iは正解データpの数と正解データp’の数との合計値の数だけ値が変化する変数を示し、jは不正解データuの数だけ値が変化する変数を示し、xは正解データpおよび正解データp’の集合に含まれるi番目のテストデータを示し、xは不正解データnのうちのj番目のテストデータを示し、f(x)はテストデータxのスコアを示し、Iは引数の値が正しい場合は1を、間違っている場合は0を返すインジケータ変数を示している。なお、Q集合は、P集合に含まれる正解データpとU集合に含まれる正解データp’との集合であり、N集合は、U集合に含まれる不正解データnの集合である。また、分類結果情報にスコアが含まれない場合は、数式1等の計算では、正例のスコアを1、負例のスコアを0または−1等のように、正例、または負例を示す情報をスコアに置き換えて用いても良い。
AUC推定手段105は、受付手段104が受け付けた割合情報によって、U集合に含まれる正解データp’と、不正解データnとが分かる場合は、数式1を用いてAUCp∪p’,nを算出しても良い。「U集合に含まれる正解データp’と、不正解データnとが分かる場合」とは、例えば、割合情報が、正解データp’と、不正解データnとを指定する情報であった場合である。また、テスト集合取得手段102が取得したテスト集合を取得する段階で、U集合に含まれる正解データp’と、不正解データnとが分かる場合も、数式1を用いてAUCp∪p’,nを算出しても良い。なお、この場合は、受付手段104は、テスト集合に含まれる正解データp’と不正解データnとを識別する情報を受け付けるようにしても良い。正解データp’の数と、不正解データnの数とが分からない場合は、AUC推定手段105は、AUCp∪p’,nを展開することで得たAUCP,Uを含む式からAUCp∪p’,nを推定する。AUCP,Uは、例えば、次の数式2で算出できる。なお、AUCP,Uは、AUCp,p’∪nと同じものである。
Figure 0005809663
数式2において、PはP集合に含まれる正解データpの集合を示し、UはU集合に含まれる不明データuの集合を示し、iは正解データpの添え字を示し、jは不明データuの添え字を示す。数式2における正解データp’と不正解データnのそれぞれの数は不明だが、(p’+n)の値は、不明データuの数であるため、AUCP,Uは算出できる。そして、AUCp∪p’,nの式は、AUCP,U を含む式に展開できる。例えば、AUCp∪p’,nは、AUCP,U を数式3のように展開することで、数式4のようにAUCP,U を含む式展開できる。
Figure 0005809663
Figure 0005809663
数式3および数式4において、x(テストデータ)は、分類器が算出したスコアが低い順に並んでいるものとし、Aは、二重総和に係る計算式を省略したものとした。なお、数式3において、iはP集合に含まれているデータの数だけ値が変化する変数を示し、jはU集合に含まれているデータの数だけ値が変化する変数を示し、xはP集合に含まれるi番目のテストデータを示し、xはU集合に含まれるj番目のテストデータを示しているものとする。数式4の式をさらに展開し、AUCP’,NおよびAUCP,P’を含むように展開すると、数式5のようになる。
Figure 0005809663
数式5において、P’はU集合に含まれる正解データp’の集合を示し、Nは、U集合に含まれる不正解データnの集合を示しているものとする。数式5について、AUC推定手段105は、AUCP’,NおよびAUCP,P’を算出できないが、例えば、「p<<n かつ p’<<n」の限定を加える場合では、AUCp∪p’,nをある程度正確に推定できる。具体的には、正解データp、正解データp’、不正解データnの数が「p:p’:n=1:1:100」である場合、数式5は数式6のように、係数が小さいため、AUCp∪p’,nの値にあまり影響しないと考え、省略できるものとした。
Figure 0005809663
AUCP’,Nは、U集合に含まれる正解データp’を正例、およびU集合に含まれる不正解データnを負例に判断できたかどうかを示す指標である。AUCP’,Nは、学習時に正解データp’と不正解データnとが負例であると学習するため、AUCP,Uを改善したとしても、あまり変化がないと考えられるから、AUCP’,Nは、定数のように考えられる。よって、この場合、AUCP,U の値を最適化した場合、AUCp∪p’,nをも最適化されると考えられる。これにより、AUCP,U は、PU分類器101の分類精度の傾向を見ることができると考えられる。なお、AUC推定手段105は、AUCP’,Nが1.0までの値を示すことを用いて、数式6の式から、AUCp∪p’,nの概数を推定しても良い。そのAUCp∪p’,nの概数を推定する場合は、AUC推定手段105は、例えば、AUCP’,Nを、ランダム時の値である0.5と定義して計算しても良く、最大値である1.0と定義して計算しても良く、ランダム時の値と最大値の中間値である0.75と定義して計算しても良く、AUCP,Uと同じ値等と定義して計算しても良い。
以上の方法の場合にAUC推定手段105が推定するAUCp∪p’,nは、「p<<n かつ p’<<n」であるほど正確な値であるといえる。そのため、AUC推定手段105は、割合情報とP集合とU集合とを用いて、U集合に含まれる正解データp’、および、P集合に含まれる正解データpが、U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合にのみ、AUCp∪p’,nを推定しても良い。所定の条件とは、U集合に含まれる正解データp’、および、P集合に含まれる正解データpが、U集合に含まれる不正解データnより非常に少ないことである。ここでの「非常に少ない」は、数式1の「p×p’/((p+p’)×n)」の値が、「p/(p+p’)」および「p’/(p+p’)」に比べて充分に小さく、数式5の計算上、「p×p’/((p+p’)×n)」が係数となっている項が、無視できるほど、pとp’とに比べnが大きいことである。つまり、所定の条件は、「p/n」が閾値Rより小さく、かつ「p’/n」が閾値R’より小さいことであっても良い。なお、RおよびR’は、例えば「0.01」等の非常に小さい正の実数であるものとし、RおよびR’は同じ値であっても良い。AUC推定手段105は、割合情報とP集合とU集合とを用いて、U集合に含まれる正解データp’、P集合に含まれる正解データp、およびU集合に含まれる不正解データnの数を取得、または算出し、所定の条件を満たすかどうか判断しても良い。例えば、AUC推定手段105は、割合情報が、正解データp’の数と不正解データnの数とを示す情報である場合に、上記それぞれのデータの数を取得しても良い。また、AUC推定手段105は、割合情報が、正解データp’と不正解データnとの割合そのものを示す情報、または正解データp’と、不正解データnとを指定する情報である場合に、上記それぞれのデータの数を算出しても良い。なお、AUC推定手段105は、「正解データpの数/不明データu」の値が閾値R’’より小さい場合で、割合情報が、正解データp’の数が不正解データnの数よりも非常に少ないことを示す情報であるときは、所定の条件を満たしていると判断しても良い。なお、R’’は、例えば「0.01」等の非常に小さい正の実数であるものとする。
確度情報取得手段106は、AUC推定手段105が推定した結果の確からしさを示す値である確度情報を算出する。確度情報取得手段106は、確度情報を算出する際に割合情報と、U集合と、P集合とを用いて、算出しても良い。確度情報は、U集合に含まれる正解データp’が、U集合に含まれる不正解データnよりも少なく、かつ、P集合に含まれる正解データpが、U集合に含まれる不正解データnよりも少ないほど高い値になる。つまり、確度情報は、「正解データpの数/不正解データnの数」の値と、「正解データp’の数/不正解データnの数」の値とが小さいほど高い値になる。なお、確度情報は、U集合に含まれる正解データp’が、U集合に含まれる不正解データnよりも少なくなく、かつ、P集合に含まれる正解データpが、U集合に含まれる不正解データnよりも少ない場合に比べ、どちらか一方のみが少ない場合の方が高い値になっても良い。具体的には、割合情報によって正解データp’と不正解データnとの数が分かる場合は、確度情報は、例えば、「1−p×p’/((p+p’)×n)」で算出される値等であっても良い。また、割合情報によって、正解データp’、および、正解データpが、不正解データnより非常に少ないことが示されている場合は、確度情報は、「確からしい」ことを示す情報であっても良い。また、割合情報によって、正解データp’、および、正解データpが、不正解データnより非常に少ないことが示されていない場合は、「不確かである」ことを示す情報であっても良い。
出力手段107は、AUC推定手段105によって推定されたAUCp∪p’,nを出力する。また、出力手段107は、AUC推定手段105によって確度情報が取得されている場合は、推定されたAUCp∪p’,nと、確度情報とを出力しても良い出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を含む概念である。
PU分類器101、テスト集合取得手段102、分類結果情報取得手段103、受付手段104、AUC推定手段105、および確度情報取得手段106は、通常、MPUやメモリ等から実現され得る。PU分類器101の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。なお、PU分類器101は、装置の中に含まれる一個の処理手段であっても良く、一個の装置であっても良い。また、テスト集合取得手段102、および受付手段104は、テンキーやキーボードやマウスや記録媒体等から情報を受け付けても良い。テスト集合取得手段102、および受付手段104は、テンキーやキーボード等の入力する手段のデバイスドライバ等で実現されていても良い。また、出力手段107は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力手段107は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
次に、分類精度推定装置1の動作の一例を図2のフローチャートを用いて説明する。図2のフローチャートは、確度情報取得手段106が確度情報を取得する場合のフローチャートである。
(ステップS201)テスト集合取得手段102は、テスト集合を取得する。
(ステップS202)受付手段104は、割合情報を受け付けたかどうかを判断する。受け付けた場合は、ステップS203へ進み、受け付けなかった場合は、ステップS202を繰り返す。
(ステップS203)分類結果情報取得手段103は、ステップS201で取得したテスト集合をPU分類器101で分類した分類結果情報を取得する。
(ステップS204)AUC推定手段105は、ステップS203で取得した分類結果情報を用いてAUCP,Uを算出し、AUCp∪p’,nを推定する。
(ステップS205)確度情報取得手段106は、ステップS201で取得したテスト集合と、ステップS202で受け付けた割合情報を用いて、確度情報を取得する。
(ステップS206)出力部107は、ステップS204で推定したAUCp∪p’,nと、ステップS205で取得した確度情報とを出力する。そして、処理を終了する。
次に、分類精度推定装置1の動作の一例を図3のフローチャートを用いて説明する。図3のフローチャートは、AUC推定手段105が所定の条件に合致する場合にのみAUCを推定する場合のフローチャートである。なお、図3のフローチャートにおける図2のフローチャート同じステップ番号は、図2のフローチャートと同じ処理であるものとする。
(ステップS301)AUC推定手段105は、ステップS201で取得したテスト集合と、ステップS202で受け付けた割合情報を用いて、「p<<n かつ p’<<n」が成り立つかどうかを判断する。成り立つ場合は、ステップS203へ進み、成り立たない場合は、処理を終了する。
(ステップS302)出力部107は、ステップS204で推定したAUCp∪p’,nを出力する。そして、処理を終了する。
以上、本実施の形態によれば、AUC推定手段105が、正例のデータと、正例か負例かが不明なデータとに基づいて行った機械学習の学習結果を用いて、正例のデータと負例のデータとを分類する分類精度の傾向を推定できる。これにより、使用者は、推定した分類精度、またはその傾向を用いて、機械学習を用いた分類の分類精度を推定し、その分類精度を改善の際の指標に用いることができる。なお、AUC推定手段105が、分類精度を推定することは、機械学習の学習結果の精度を推定することと考えることもできる。これにより、使用者は、機械学習の学習結果の精度を評価することができる。また、AUC推定手段105がAUCp∪p’,n の傾向を推定することで、正例のデータと、正例か負例かが不明なデータとに基づいて行った機械学習における、正例のデータと負例のデータとを分類する分類精度を推定できる。また、AUC推定手段105が、不明なデータに含まれない正例のデータ、および、不明なデータに含まれる正例のデータが、不明なデータに含まれる負例のデータに比べて非常に少ない場合にのみAUCを推定することで、不確かなAUCの値を推定しないようにできる。これにより、使用者は、確実性の高い分類精度、またはその傾向のみを用いて、機械学習を用いた分類の分類精度を推定し、その分類精度を改善の際の指標に用いることができる。また、分類結果情報取得手段103は、機械学習時に用いた正解データおよび不正解データを用いて、分類結果情報を取得できる。これにより、新たにテストデータを用意しなくても分類精度の傾向を推定できる。また、分類結果情報取得手段103は、機械学習時に用いた正解データおよび不正解データと異なるデータを用いて、分類結果情報を取得できる。これにより、学習データと異なるデータを用いて分類精度の傾向を推定できる。
本実施の形態では、PU分類器101は、分類精度推定装置1に含まれない処理手段として説明したが、分類精度推定装置1は、PU分類器101を含んでいても良い。その場合のPU分類器101は、テスト集合取得手段102からテスト集合を取得し、そのテスト集合に含まれるテストデータを分類した結果を、分類結果情報取得手段103に渡すようにしても良く、分類結果情報取得手段103からテスト集合を取得し、そのテスト集合に含まれるテストデータを分類した結果を、分類結果情報取得手段103に返すようにしても良い。
本実施の形態では、テスト集合取得手段102を含む場合について説明したが、分類精度推定装置1は、テスト集合取得手段102を含んでいなくても良い。分類精度推定装置1が、テスト集合取得手段102を含んでいない場合は、分類結果情報取得手段103が、テスト集合を取得しても良く、PU分類器101がテスト集合を取得しても良い。その際、テスト集合は、図示しない格納手段に格納されているテスト集合であっても良く、図示しない受付手段が受け付けたテスト集合であっても良い。また、分類精度推定装置1が、テスト集合取得手段102を含んでいない場合で、PU分類器101が用いている学習結果に学習時に学習に用いたデータを分類した分類結果情報が格納されているときは、分類結果情報取得手段103は、テスト集合を用いずに、PU分類器101から、学習時に学習に用いたデータを分類した分類結果情報を取得しても良い。
本実施の形態では、PU分類器101は、分類結果情報取得手段103からテスト集合を取得する場合について説明したが、PU分類器101は、分類結果情報取得手段103からテスト集合を取得しなくても良い。PU分類器101は、分類結果情報取得手段103からテスト集合を取得しない場合は、PU分類器101は、テスト集合を取得しても良い。その際、テスト集合は、図示しない格納手段に格納されているテスト集合であっても良く、図示しない受付手段が受け付けたテスト集合であっても良い。
また、本実施の形態における分類精度推定装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、プログラムは、コンピュータを、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置として機能させるためのプログラムであって、PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、分類の結果である分類結果情報を取得する分類結果情報取得手段、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、U集合に含まれる正解データp’とU集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段、割合情報と、U集合と、P集合とを用いて、U集合に含まれる正解データp’が、U集合に含まれる不正解データnよりも少なく、かつ、P集合に含まれる正解データpが、U集合に含まれる不正解データnよりも少ないほど高い値であり、AUC推定手段が推定した結果の確からしさを示す値である確度情報を算出する確度情報取得手段、AUC推定手段によって推定されたAUCp∪p’,nと、確度情報とを出力する出力手段として機能させるためのプログラムである。
また、本実施の形態における分類精度推定装置1を実現するソフトウェアは、以下のようなプログラムであっても良い。つまり、プログラムは、コンピュータを、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置として機能させるためのプログラムであって、PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、分類の結果である分類結果情報を取得する分類結果情報取得手段、U集合に含まれる正解データp’とU集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段、割合情報とP集合とU集合とを用いて、U集合に含まれる正解データp’、および、P集合に含まれる正解データpが、U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段、AUC推定手段によって推定されたAUCp∪p’,nを出力する出力手段として機能させるためのプログラムである。
なお、本実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されても良く、または、複数の装置によって分散処理されることによって実現されても良い。また、本実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の手段で実現されても良いことは言うまでもない。
また、本実施の形態において、各構成要素は、専用のハードウェアにより構成されても良く、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されても良い。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行手段が読み出して実行することによって、各構成要素が実現され得る。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得手段や、情報を出力する出力手段等におけるモデムやインターフェースカード等のハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
図4は、上記プログラムを実行して、上記実施の形態による本発明を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。
図4において、コンピュータシステム1100は、CD−ROMドライブ1105、FDドライブ1106を含むコンピュータ1101と、キーボード1102と、マウス1103と、モニタ1104とを備える。
図5は、コンピュータシステム1100の内部構成を示す図である。図5において、コンピュータ1101は、CD−ROMドライブ1105、FDドライブ1106に加えて、MPU1111と、ブートアッププログラム等のプログラムを蓄積するためのROM1112と、MPU1111に接続され、アプリケーションプログラムの命令を一時的に蓄積すると共に、一時記憶空間を提供するRAM1113と、アプリケーションプログラム、システムプログラム、およびデータを蓄積するハードディスク1114と、MPU1111と、ROM1112等を相互に接続するバス1115とを備える。なお、コンピュータ1101は、LANへの接続を提供する図示しないネットワークカードを含んでいても良い。
コンピュータシステム1100に、上記実施の形態による本発明等の機能を実行させるプログラムは、CD−ROM1121、またはFD1122に蓄積されて、CD−ROMドライブ1105、またはFDドライブ1106に挿入され、ハードディスク1114に転送されても良い。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ1101に送信され、ハードディスク1114に蓄積されても良い。プログラムは実行の際にRAM1113にロードされる。なお、プログラムは、CD−ROM1121やFD1122、またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ1101に、上記実施の形態による本発明の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいても良い。コンピュータシステム1100がどのように動作するのかについては周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。また、本発明における各手段の「手段」は、「部」や「回路」等と読み替えても良い。
以上のように、本発明にかかる分類精度推定装置等は、正例のデータと、正例か負例かが不明なデータとに基づいて行った機械学習の学習結果を用いて、正例のデータと負例のデータとを分類する分類精度を推定できるという効果を有し、分類精度推定装置等として有用である。
1 分類精度推定装置
101 PU分類器
102 テスト集合取得手段
103 分類結果情報取得手段
104 受付手段
105 AUC推定手段
106 確度情報取得手段
107 出力手段

Claims (8)

  1. 正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置であって、
    前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段と、
    分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、
    前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段と、
    前記割合情報と、前記U集合と、前記P集合とを用いて、当該U集合に含まれる正解データp’が、当該U集合に含まれる不正解データnよりも少なく、かつ、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnよりも少ないほど高い値であり、前記AUC推定手段が推定した結果の確からしさを示す値である確度情報を算出する確度情報取得手段と、
    前記AUC推定手段によって推定されたAUCp∪p’,nと、前記確度情報とを出力する出力手段とを具備する分類精度推定装置。
  2. 正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置であって、
    前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段と、
    前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段と、
    前記割合情報と前記P集合と前記U集合とを用いて、当該U集合に含まれる正解データp’、および、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、
    前記AUC推定手段によって推定されたAUCp∪p’,nを出力する出力手段とを具備する分類精度推定装置。
  3. 前記分類結果情報取得手段は、
    前記PU分類器が用いている学習結果を作成する際の学習に用いたデータの少なくとも一部が異なるデータを含むP集合とU集合とに含まれる各データを正例、または負例に分類した結果である分類結果情報を取得する、請求項1または2記載の分類精度推定装置。
  4. 前記分類結果情報取得手段は、
    前記PU分類器が用いている学習結果を作成する際の学習に用いた正解データの集合であるP集合と、当該学習に用いた不明データの集合であるU集合とに含まれる各データを正例、または負例に分類した結果である分類結果情報を取得する、請求項1または2記載の分類精度推定装置。
  5. 分類結果情報取得手段と、AUC推定手段と、受付手段と、確度情報取得手段と、出力手段とを用いて処理される、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定方法であって、
    前記分類結果情報取得手段が、前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得ステップと、
    前記AUC推定手段が、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定ステップと、
    前記受付手段が、前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付ステップと、
    前記確度情報取得手段が、前記割合情報と、前記U集合と、前記P集合とを用いて、当該U集合に含まれる正解データp’が、当該U集合に含まれる不正解データnよりも少なp∪p’,nよりも少ないほど高い値であり、前記AUC推定ステップで推定された結果の確からしさを示す値である確度情報を算出する確度情報取得ステップと、
    前記出力手段が、前記AUC推定ステップによって推定されたAUCp∪p’,nと、前記確度情報とを出力する出力ステップとを具備する分類精度推定方法。
  6. 分類結果情報取得手段と、受付手段と、AUC推定手段と、出力手段とを用いて処理される、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定方法であり、
    前記分類結果情報取得手段が、前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得ステップと、
    前記受付手段が、前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付ステップと、
    前記AUC推定手段が、前記割合情報と前記P集合と前記U集合とを用いて、当該U集合に含まれる正解データp’、および、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定ステップと、
    前記出力手段が、前記AUC推定ステップによって推定されたAUCp∪p’,nを出力する出力ステップとを具備する分類精度推定方法。
  7. コンピュータを、
    正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置として機能させるためのプログラムであって、
    前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段、
    分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段、
    前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段、
    前記割合情報と、前記U集合と、前記P集合とを用いて、当該U集合に含まれる正解データp’が、当該U集合に含まれる不正解データnよりも少なく、かつ、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnよりも少ないほど高い値であり、前記AUC推定手段が推定した結果の確からしさを示す値である確度情報を算出する確度情報取得手段、
    前記AUC推定手段によって推定されたAUCp∪p’,nと、前記確度情報とを出力する出力手段として機能させるためのプログラム。
  8. コンピュータを、
    正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置として機能させるためのプログラムであって、
    前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段、
    前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段、
    前記割合情報と前記P集合と前記U集合とを用いて、当該U集合に含まれる正解データp’、および、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段、
    前記AUC推定手段によって推定されたAUCp∪p’,nを出力する出力手段として機能させるためのプログラム。
JP2013121852A 2013-06-10 2013-06-10 分類精度推定装置、分類精度推定方法、およびプログラム Expired - Fee Related JP5809663B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013121852A JP5809663B2 (ja) 2013-06-10 2013-06-10 分類精度推定装置、分類精度推定方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013121852A JP5809663B2 (ja) 2013-06-10 2013-06-10 分類精度推定装置、分類精度推定方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2014238763A JP2014238763A (ja) 2014-12-18
JP5809663B2 true JP5809663B2 (ja) 2015-11-11

Family

ID=52135861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013121852A Expired - Fee Related JP5809663B2 (ja) 2013-06-10 2013-06-10 分類精度推定装置、分類精度推定方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5809663B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102114564B1 (ko) * 2015-10-30 2020-05-22 가부시키가이샤 모르포 학습 시스템, 학습 장치, 학습 방법, 학습 프로그램, 교사 데이터 작성 장치, 교사 데이터 작성 방법, 교사 데이터 작성 프로그램, 단말 장치 및 임계치 변경 장치
CN107103071B (zh) * 2017-04-21 2019-08-02 安徽大学 一种基于直接优化pauc算法的新闻信息分类方法

Also Published As

Publication number Publication date
JP2014238763A (ja) 2014-12-18

Similar Documents

Publication Publication Date Title
TWI677852B (zh) 一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質
US10474827B2 (en) Application recommendation method and application recommendation apparatus
US9842279B2 (en) Data processing method for learning discriminator, and data processing apparatus therefor
JP6158882B2 (ja) 生成装置、生成方法、及び生成プログラム
JP5676692B2 (ja) 機械学習装置、機械学習方法、およびプログラム
JP5821590B2 (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
CN109615080B (zh) 无监督模型评估方法、装置、服务器及可读存储介质
JP2018032340A (ja) 属性推定装置、属性推定方法および属性推定プログラム
WO2020179378A1 (ja) 情報処理システム、情報処理方法および記録媒体
JP2019105871A (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
JP5809663B2 (ja) 分類精度推定装置、分類精度推定方法、およびプログラム
CN110288668B (zh) 图像生成方法、装置、计算机设备及存储介质
JP2019185121A (ja) 学習装置、学習方法及びプログラム
US20230237436A1 (en) Methods and apparatus for assessing diversity bias in algorithmic matching of job candidates with job opportunities
JP2020027604A (ja) 情報処理方法、及び情報処理システム
CN115049843A (zh) 一种对抗样本生成方法、装置、电子设备及存储介质
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes
EP3848939A1 (en) Processing a classifier
JP6973733B2 (ja) 特許情報処理装置、特許情報処理方法およびプログラム
JP6453618B2 (ja) 算出装置、方法及びプログラム
CN112183714A (zh) 基于人工神经网络的自动化数据切片
Kobyz et al. Conditional probability density estimation using artificial neural network
US9277891B2 (en) Image diagnosis assistance apparatus, processing method thereof, and storage medium
WO2017159523A1 (ja) 推論システム、推論方法、及び、記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150911

R150 Certificate of patent or registration of utility model

Ref document number: 5809663

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350