JP5809663B2 - 分類精度推定装置、分類精度推定方法、およびプログラム - Google Patents
分類精度推定装置、分類精度推定方法、およびプログラム Download PDFInfo
- Publication number
- JP5809663B2 JP5809663B2 JP2013121852A JP2013121852A JP5809663B2 JP 5809663 B2 JP5809663 B2 JP 5809663B2 JP 2013121852 A JP2013121852 A JP 2013121852A JP 2013121852 A JP2013121852 A JP 2013121852A JP 5809663 B2 JP5809663 B2 JP 5809663B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- correct
- auc
- accuracy
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 18
- 238000010801 machine learning Methods 0.000 claims description 42
- 230000010365 information processing Effects 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 70
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本実施の形態において、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器における、正解データと不正解データとを分類する分類精度を、AUCを用いて推定する分類精度推定装置1について説明する。
101 PU分類器
102 テスト集合取得手段
103 分類結果情報取得手段
104 受付手段
105 AUC推定手段
106 確度情報取得手段
107 出力手段
Claims (8)
- 正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置であって、
前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段と、
分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、
前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段と、
前記割合情報と、前記U集合と、前記P集合とを用いて、当該U集合に含まれる正解データp’が、当該U集合に含まれる不正解データnよりも少なく、かつ、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnよりも少ないほど高い値であり、前記AUC推定手段が推定した結果の確からしさを示す値である確度情報を算出する確度情報取得手段と、
前記AUC推定手段によって推定されたAUCp∪p’,nと、前記確度情報とを出力する出力手段とを具備する分類精度推定装置。 - 正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置であって、
前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段と、
前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段と、
前記割合情報と前記P集合と前記U集合とを用いて、当該U集合に含まれる正解データp’、および、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段と、
前記AUC推定手段によって推定されたAUCp∪p’,nを出力する出力手段とを具備する分類精度推定装置。 - 前記分類結果情報取得手段は、
前記PU分類器が用いている学習結果を作成する際の学習に用いたデータの少なくとも一部が異なるデータを含むP集合とU集合とに含まれる各データを正例、または負例に分類した結果である分類結果情報を取得する、請求項1または2記載の分類精度推定装置。 - 前記分類結果情報取得手段は、
前記PU分類器が用いている学習結果を作成する際の学習に用いた正解データの集合であるP集合と、当該学習に用いた不明データの集合であるU集合とに含まれる各データを正例、または負例に分類した結果である分類結果情報を取得する、請求項1または2記載の分類精度推定装置。 - 分類結果情報取得手段と、AUC推定手段と、受付手段と、確度情報取得手段と、出力手段とを用いて処理される、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定方法であって、
前記分類結果情報取得手段が、前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得ステップと、
前記AUC推定手段が、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定ステップと、
前記受付手段が、前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付ステップと、
前記確度情報取得手段が、前記割合情報と、前記U集合と、前記P集合とを用いて、当該U集合に含まれる正解データp’が、当該U集合に含まれる不正解データnよりも少なp∪p’,nよりも少ないほど高い値であり、前記AUC推定ステップで推定された結果の確からしさを示す値である確度情報を算出する確度情報取得ステップと、
前記出力手段が、前記AUC推定ステップによって推定されたAUCp∪p’,nと、前記確度情報とを出力する出力ステップとを具備する分類精度推定方法。 - 分類結果情報取得手段と、受付手段と、AUC推定手段と、出力手段とを用いて処理される、正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定方法であり、
前記分類結果情報取得手段が、前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得ステップと、
前記受付手段が、前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付ステップと、
前記AUC推定手段が、前記割合情報と前記P集合と前記U集合とを用いて、当該U集合に含まれる正解データp’、および、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定ステップと、
前記出力手段が、前記AUC推定ステップによって推定されたAUCp∪p’,nを出力する出力ステップとを具備する分類精度推定方法。 - コンピュータを、
正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置として機能させるためのプログラムであって、
前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段、
分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段、
前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段、
前記割合情報と、前記U集合と、前記P集合とを用いて、当該U集合に含まれる正解データp’が、当該U集合に含まれる不正解データnよりも少なく、かつ、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnよりも少ないほど高い値であり、前記AUC推定手段が推定した結果の確からしさを示す値である確度情報を算出する確度情報取得手段、
前記AUC推定手段によって推定されたAUCp∪p’,nと、前記確度情報とを出力する出力手段として機能させるためのプログラム。 - コンピュータを、
正解データを正例のデータとして扱い、正解データおよび不正解データが混在した不明データを負例のデータとして扱う機械学習を行った学習結果を用いたPU分類器の分類精度を推定する分類精度推定装置として機能させるためのプログラムであって、
前記PU分類器を用いて、正解データpの集合であるP集合と、正解データp’および不正解データnが混在した、不明データuの集合であるU集合とに含まれている各データを正例、または負例に分類し、当該分類の結果である分類結果情報を取得する分類結果情報取得手段、
前記U集合に含まれる正解データp’と当該U集合に含まれる不正解データnとの割合に関する割合情報を受け付ける受付手段、
前記割合情報と前記P集合と前記U集合とを用いて、当該U集合に含まれる正解データp’、および、当該P集合に含まれる正解データpが、当該U集合に含まれる不正解データnより所定の条件を満たすほど少ないと判断できる場合に、分類器の分類した際の精度を示す指標であるAUC(Area under the curve:曲線下面積)を用いて、前記分類結果情報から正解データpと、不明データuとを分類した際の精度であるAUCP,Uを算出することによって、正解データpおよび正解データp’と、不正解データnとを分類した際の精度であるAUCp∪p’,nを推定するAUC推定手段、
前記AUC推定手段によって推定されたAUCp∪p’,nを出力する出力手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013121852A JP5809663B2 (ja) | 2013-06-10 | 2013-06-10 | 分類精度推定装置、分類精度推定方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013121852A JP5809663B2 (ja) | 2013-06-10 | 2013-06-10 | 分類精度推定装置、分類精度推定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014238763A JP2014238763A (ja) | 2014-12-18 |
JP5809663B2 true JP5809663B2 (ja) | 2015-11-11 |
Family
ID=52135861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013121852A Expired - Fee Related JP5809663B2 (ja) | 2013-06-10 | 2013-06-10 | 分類精度推定装置、分類精度推定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5809663B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102114564B1 (ko) * | 2015-10-30 | 2020-05-22 | 가부시키가이샤 모르포 | 학습 시스템, 학습 장치, 학습 방법, 학습 프로그램, 교사 데이터 작성 장치, 교사 데이터 작성 방법, 교사 데이터 작성 프로그램, 단말 장치 및 임계치 변경 장치 |
CN107103071B (zh) * | 2017-04-21 | 2019-08-02 | 安徽大学 | 一种基于直接优化pauc算法的新闻信息分类方法 |
-
2013
- 2013-06-10 JP JP2013121852A patent/JP5809663B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014238763A (ja) | 2014-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI677852B (zh) | 一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質 | |
US10474827B2 (en) | Application recommendation method and application recommendation apparatus | |
US9842279B2 (en) | Data processing method for learning discriminator, and data processing apparatus therefor | |
JP6158882B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
JP5676692B2 (ja) | 機械学習装置、機械学習方法、およびプログラム | |
JP5821590B2 (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
CN109615080B (zh) | 无监督模型评估方法、装置、服务器及可读存储介质 | |
JP2018032340A (ja) | 属性推定装置、属性推定方法および属性推定プログラム | |
WO2020179378A1 (ja) | 情報処理システム、情報処理方法および記録媒体 | |
JP2019105871A (ja) | 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置 | |
JPWO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム | |
JP5809663B2 (ja) | 分類精度推定装置、分類精度推定方法、およびプログラム | |
CN110288668B (zh) | 图像生成方法、装置、计算机设备及存储介质 | |
JP2019185121A (ja) | 学習装置、学習方法及びプログラム | |
US20230237436A1 (en) | Methods and apparatus for assessing diversity bias in algorithmic matching of job candidates with job opportunities | |
JP2020027604A (ja) | 情報処理方法、及び情報処理システム | |
CN115049843A (zh) | 一种对抗样本生成方法、装置、电子设备及存储介质 | |
US11676050B2 (en) | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes | |
EP3848939A1 (en) | Processing a classifier | |
JP6973733B2 (ja) | 特許情報処理装置、特許情報処理方法およびプログラム | |
JP6453618B2 (ja) | 算出装置、方法及びプログラム | |
CN112183714A (zh) | 基于人工神经网络的自动化数据切片 | |
Kobyz et al. | Conditional probability density estimation using artificial neural network | |
US9277891B2 (en) | Image diagnosis assistance apparatus, processing method thereof, and storage medium | |
WO2017159523A1 (ja) | 推論システム、推論方法、及び、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150911 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5809663 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees | ||
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |