JP5676692B2 - 機械学習装置、機械学習方法、およびプログラム - Google Patents
機械学習装置、機械学習方法、およびプログラム Download PDFInfo
- Publication number
- JP5676692B2 JP5676692B2 JP2013127850A JP2013127850A JP5676692B2 JP 5676692 B2 JP5676692 B2 JP 5676692B2 JP 2013127850 A JP2013127850 A JP 2013127850A JP 2013127850 A JP2013127850 A JP 2013127850A JP 5676692 B2 JP5676692 B2 JP 5676692B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- learning
- weight
- information
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims description 131
- 230000006870 function Effects 0.000 claims description 11
- 238000000034 method Methods 0.000 description 25
- 238000013500 data storage Methods 0.000 description 20
- 238000012545 processing Methods 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 10
- 238000002790 cross-validation Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Description
本実施の形態において、正解データを正例のデータと扱い、正解か不正解かが不明なデータを負例と扱う機械学習であるPU学習(Positive Unlabeled学習)時に,学習データに含まれていなかった素性の要素を有するデータを分類する場合に、そのデータの分類に使用する値であるスコアを下げる調整を行う機械学習装置1について説明する。なお、本実施の形態では、PU学習は、正例のデータより、負例のデータの方が多い学習である。
(ステップS201)図示しない処理手段は、学習データ格納手段101に格納されている学習データ集合を分類対象データの集合と学習に用いるデータの集合とに分割する。そして、分類対象データ受付手段105は、分割された集合の一方を受け付ける。なお、図示しない処理手段は、分割した集合の情報を記憶することで、2回目以降の受け付けの際には、少なくとも一部が異なる集合に分割するようにする。
101 学習データ格納手段
102 制限情報設定手段
103 学習結果情報格納手段
104 機械学習手段
105 分類対象データ受付手段
106 設定手段
107 分類手段
Claims (11)
- 正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習装置であって、
前記学習データ集合に含まれる学習データを用いて学習した学習結果情報を用いた分類時に、正例または負例の分類で用いられるスコアを、前記学習に用いた、いずれの学習データにも含まれない素性の要素である非共通素性要素を有する分類対象データである未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習装置。 - 前記学習結果情報は、
前記学習に用いた各学習データが有する素性の要素に対応する重みを示す重み情報の集合である重み集合を有し、
前記スコアは、
前記分類対象データに含まれる素性のすべての要素の値と、前記学習結果情報に含まれる重み集合とを用いて算出される値であり、
学習に用いるそれぞれの正解データpの素性の0でない各要素の値と、当該要素に対応する重み情報とを掛け合わせて算出される正例部分スコアの符号が、正例と判断されるスコアと同じ符号になるように、重み集合を作成するための制限である制限情報を設定する制限情報設定手段と、
前記制限情報と前記学習データ集合に含まれる学習データとを用いて、前記学習結果情報を作成する機械学習手段とを具備する、請求項1記載の機械学習装置。 - 前記ランキング学習は、
所定の値よりスコアが大きい場合に正例と分類されるようにする機械学習であり、
前記制限情報設定手段は、
前記正例部分スコアが正の値になるように、前記制限情報を設定する、請求項2記載の機械学習装置。 - 前記学習データ集合に含まれる各学習データが有する素性の要素の値は、
すべて0以上であり、
前記制限情報設定手段は、
学習に用いるそれぞれの正解データpの素性の0でない各要素の値と、当該要素に対応するすべての重み情報が正の値になるように制限情報を設定する、請求項3記載の機械学習装置。 - 前記学習結果情報は、
前記学習に用いた各学習データが有する素性の要素に対応する重みを示す重み情報の集合である重み集合と、すべての非共通素性要素に対応する重みを示す非共通素性要素重み情報とを含み、
前記分類対象データを受け付ける分類対象データ受付手段と、
前記非共通素性要素重み情報を、前記学習結果情報に含まれる重み集合の代表値に設定する重み設定手段と、
前記分類対象データ受付手段が受け付けた分類対象データに含まれる素性のすべての要素の値と、前記学習結果情報に含まれる重み集合と、当該学習結果情報に含まれる非共通素性要素重み情報とを用いてスコアを算出し、当該分類対象データを分類する分類手段とを具備する、請求項1から請求項4のいずれか一項記載の機械学習装置。 - 前記重み設定手段は、
前記非共通素性要素重み情報を、前記学習結果情報に含まれる重み集合の中央値に設定する、請求項5記載の機械学習装置。 - 前記重み設定手段は、
前記非共通素性要素重み情報を、前記学習結果情報に含まれる重み情報の平均値に設定する、請求項5記載の機械学習装置。 - 前記重み設定手段は、
前記分類手段によって正例に分類された未学習要素保有データのスコアが負例寄りになるように、前記非共通素性要素重み情報を調整する、請求項5から請求項7記載のいずれか一項記載の機械学習装置。 - 前記分類対象データ受付手段は、
前記学習データ集合に含まれる一部の学習データである分類対象データの集合である分類対象データ集合を、少なくとも1以上の分類対象データが異なるように繰り返し受け付け、
前記分類手段は、
前記分類対象データ受付手段が受け付けた分類対象データ集合ごとに、当該分類対象データ集合に含まれる分類対象データを、前記学習データ集合に含まれる学習データのうち、当該分類対象データ集合に含まれる分類対象データ以外の学習データを用いて作成された前記学習結果情報を用いて分類し、
前記重み設定手段は、
前記分類手段によって、未学習要素保有データが正例に分類されるごとに、前記非共通素性要素重み情報を調整する、請求項8記載の機械学習装置。 - 正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習方法であって、
前記学習データ集合に含まれる学習データを用いて学習した学習結果情報を用いた分類時に、正例または負例の分類で用いられるスコアを、前記学習に用いた、いずれの学習データにも含まれない素性の要素である非共通素性要素を有する分類対象データである未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習方法。 - コンピュータを、
正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習装置として機能させるためのプログラムであって、
前記学習データ集合に含まれる学習データを用いて学習した学習結果情報を用いた分類時に、正例または負例の分類で用いられるスコアを、前記学習に用いた、いずれの学習データにも含まれない素性の要素である非共通素性要素を有する分類対象データである未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013127850A JP5676692B2 (ja) | 2013-06-18 | 2013-06-18 | 機械学習装置、機械学習方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013127850A JP5676692B2 (ja) | 2013-06-18 | 2013-06-18 | 機械学習装置、機械学習方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015001968A JP2015001968A (ja) | 2015-01-05 |
JP5676692B2 true JP5676692B2 (ja) | 2015-02-25 |
Family
ID=52296425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013127850A Active JP5676692B2 (ja) | 2013-06-18 | 2013-06-18 | 機械学習装置、機械学習方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5676692B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6377050B2 (ja) | 2015-12-18 | 2018-08-22 | ヤフー株式会社 | 学習装置、学習方法および学習プログラム |
CN113610240A (zh) * | 2017-05-05 | 2021-11-05 | 第四范式(北京)技术有限公司 | 利用嵌套机器学习模型来执行预测的方法及系统 |
CN113570064A (zh) * | 2017-05-05 | 2021-10-29 | 第四范式(北京)技术有限公司 | 利用复合机器学习模型来执行预测的方法及系统 |
KR102189761B1 (ko) * | 2018-12-21 | 2020-12-11 | 주식회사 엘지씨엔에스 | 딥러닝 학습 방법 및 서버 |
-
2013
- 2013-06-18 JP JP2013127850A patent/JP5676692B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015001968A (ja) | 2015-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6537340B2 (ja) | 要約生成装置、要約生成方法、及び要約生成プログラム | |
US8699789B2 (en) | Document classification using multiple views | |
US9025889B2 (en) | Method, apparatus and computer program product for providing pattern detection with unknown noise levels | |
US10783402B2 (en) | Information processing apparatus, information processing method, and storage medium for generating teacher information | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
JP5676692B2 (ja) | 機械学習装置、機械学習方法、およびプログラム | |
JP5862413B2 (ja) | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 | |
CN112257738A (zh) | 机器学习模型的训练方法、装置和图像的分类方法、装置 | |
JP6365024B2 (ja) | サービス提供装置、方法、及びプログラム | |
JP2016095640A (ja) | 密度計測装置、密度計測方法、およびプログラム | |
JP2013120441A (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
CN110910325B (zh) | 一种基于人工蝴蝶优化算法的医疗影像处理方法及装置 | |
JP2008204374A (ja) | クラスタ生成装置およびクラスタ生成プログラム | |
US9189693B2 (en) | Information processing apparatus and information processing method | |
JP6478301B2 (ja) | 画像判別装置、画像判別方法、及びプログラム | |
JP5809663B2 (ja) | 分類精度推定装置、分類精度推定方法、およびプログラム | |
JP5764094B2 (ja) | 画像検索装置、画像検索方法、及び画像検索プログラム | |
JP2018160165A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5490859B2 (ja) | ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 | |
JP6453618B2 (ja) | 算出装置、方法及びプログラム | |
JP6719229B2 (ja) | コンテンツ収集装置、コンテンツ収集方法およびコンテンツ収集プログラム | |
JP2016212684A (ja) | パラメータ推定方法、対応割当方法、装置、及びプログラム | |
CN111597220B (zh) | 数据挖掘方法和装置 | |
JP2019109662A (ja) | 分類装置、データ構造、分類方法、およびプログラム | |
JP5418052B2 (ja) | 遺伝的処理装置、遺伝的処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5676692 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |