JP2015001968A - 機械学習装置、機械学習方法、およびプログラム - Google Patents
機械学習装置、機械学習方法、およびプログラム Download PDFInfo
- Publication number
- JP2015001968A JP2015001968A JP2013127850A JP2013127850A JP2015001968A JP 2015001968 A JP2015001968 A JP 2015001968A JP 2013127850 A JP2013127850 A JP 2013127850A JP 2013127850 A JP2013127850 A JP 2013127850A JP 2015001968 A JP2015001968 A JP 2015001968A
- Authority
- JP
- Japan
- Prior art keywords
- data
- learning
- information
- weight
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 138
- 230000006870 function Effects 0.000 claims description 11
- 238000000034 method Methods 0.000 description 25
- 238000013500 data storage Methods 0.000 description 20
- 238000012545 processing Methods 0.000 description 14
- 238000002474 experimental method Methods 0.000 description 10
- 238000002790 cross-validation Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習装置1であって、未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習装置1により、機械学習に用いるデータに含まれない特徴を有する分類対象のデータであっても、機械学習によって得られた情報を用いて、より適切に分類できる。
【選択図】図1
Description
本実施の形態において、正解データを正例のデータと扱い、正解か不正解かが不明なデータを負例と扱う機械学習であるPU学習(Positive Unlabeled学習)時に,学習データに含まれていなかった素性の要素を有するデータを分類する場合に、そのデータの分類に使用する値であるスコアを下げる調整を行う機械学習装置1について説明する。なお、本実施の形態では、PU学習は、正例のデータより、負例のデータの方が多い学習である。
(ステップS201)図示しない処理手段は、学習データ格納手段101に格納されている学習データ集合を分類対象データの集合と学習に用いるデータの集合とに分割する。そして、分類対象データ受付手段105は、分割された集合の一方を受け付ける。なお、図示しない処理手段は、分割した集合の情報を記憶することで、2回目以降の受け付けの際には、少なくとも一部が異なる集合に分割するようにする。
101 学習データ格納手段
102 制限情報設定手段
103 学習結果情報格納手段
104 機械学習手段
105 分類対象データ受付手段
106 設定手段
107 分類手段
Claims (11)
- 正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習装置であって、
前記学習データ集合に含まれる学習データを用いて学習した学習結果情報を用いた分類時に、正例または負例の分類で用いられるスコアを、前記学習に用いた、いずれの学習データにも含まれない素性の要素である非共通素性要素を有する分類対象データである未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習装置。 - 前記学習結果情報は、
前記学習に用いた各学習データが有する素性の要素に対応する重みを示す重み情報の集合である重み集合を有し、
前記スコアは、
前記分類対象データに含まれる素性のすべての要素の値と、前記学習結果情報に含まれる重み集合とを用いて算出される値であり、
学習に用いるそれぞれの正解データpの素性の0でない各要素の値と、当該要素に対応する重み情報とを掛け合わせて算出される正例部分スコアの符号が、正例と判断されるスコアと同じ符号になるように、重み集合を作成するための制限である制限情報を設定する制限情報設定手段と、
前記制限情報と前記学習データ集合に含まれる学習データとを用いて、前記学習結果情報を作成する機械学習手段とを具備する、請求項1記載の機械学習装置。 - 前記ランキング学習は、
所定の値よりスコアが大きい場合に正例と分類されるようにする機械学習であり、
前記制限情報設定手段は、
前記正例部分スコアが正の値になるように、前記制限情報を設定する、請求項2記載の機械学習装置。 - 前記学習データ集合に含まれる各学習データが有する素性の要素の値は、
すべて0以上であり、
前記制限情報設定手段は、
学習に用いるそれぞれの正解データpの素性の0でない各要素の値と、当該要素に対応するすべての重み情報が正の値になるように制限情報を設定する、請求項3記載の機械学習装置。 - 前記学習結果情報は、
前記学習に用いた各学習データが有する素性の要素に対応する重みを示す重み情報の集合である重み集合と、すべての非共通素性要素に対応する重みを示す非共通素性要素重み情報とを含み、
前記分類対象データを受け付ける分類対象データ受付手段と、
前記非共通素性要素重み情報を、前記学習結果情報に含まれる重み集合の代表値に設定する重み設定手段と、
前記分類対象データ受付手段が受け付けた分類対象データに含まれる素性のすべての要素の値と、前記学習結果情報に含まれる重み集合と、当該学習結果情報に含まれる非共通素性要素重み情報とを用いてスコアを算出し、当該分類対象データを分類する分類手段とを具備する、請求項1から請求項4のいずれか一項記載の機械学習装置。 - 前記重み設定手段は、
前記非共通素性要素重み情報を、前記学習結果情報に含まれる重み集合の中央値に設定する、請求項5記載の機械学習装置。 - 前記重み設定手段は、
前記非共通素性要素重み情報を、前記学習結果情報に含まれる重み情報の平均値に設定する、請求項5記載の機械学習装置。 - 前記重み設定手段は、
前記分類手段によって正例に分類された未学習要素保有データのスコアが負例寄りになるように、前記非共通素性要素重み情報を調整する、請求項5から請求項7記載のいずれか一項記載の機械学習装置。 - 前記分類対象データ受付手段は、
前記学習データ集合に含まれる一部の学習データである分類対象データの集合である分類対象データ集合を、少なくとも1以上の分類対象データが異なるように繰り返し受け付け、
前記分類手段は、
前記分類対象データ受付手段が受け付けた分類対象データ集合ごとに、当該分類対象データ集合に含まれる分類対象データを、前記学習データ集合に含まれる学習データのうち、当該分類対象データ集合に含まれる分類対象データ以外の学習データを用いて作成された前記学習結果情報を用いて分類し、
前記重み設定手段は、
前記分類手段によって、未学習要素保有データが正例に分類されるごとに、前記非共通素性要素重み情報を調整する、請求項8記載の機械学習装置。 - 正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習方法であって、
前記学習データ集合に含まれる学習データを用いて学習した学習結果情報を用いた分類時に、正例または負例の分類で用いられるスコアを、前記学習に用いた、いずれの学習データにも含まれない素性の要素である非共通素性要素を有する分類対象データである未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習方法。 - コンピュータを、
正解データ集合Pに含まれる正解データpを正例のデータとして扱い、正解データ集合P’に含まれる正解データp’および不正解データ集合Nに含まれる不正解データnが混在した不明データを負例のデータとして扱い、かつ、正例のデータの数が負例のデータの数よりも少ない学習データ集合に含まれる学習データを用いてランキング学習を行う機械学習装置として機能させるためのプログラムであって、
前記学習データ集合に含まれる学習データを用いて学習した学習結果情報を用いた分類時に、正例または負例の分類で用いられるスコアを、前記学習に用いた、いずれの学習データにも含まれない素性の要素である非共通素性要素を有する分類対象データである未学習要素保有データの場合に、負例寄りになるよう所定の調整を行った学習結果情報を作成する機械学習装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013127850A JP5676692B2 (ja) | 2013-06-18 | 2013-06-18 | 機械学習装置、機械学習方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013127850A JP5676692B2 (ja) | 2013-06-18 | 2013-06-18 | 機械学習装置、機械学習方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015001968A true JP2015001968A (ja) | 2015-01-05 |
JP5676692B2 JP5676692B2 (ja) | 2015-02-25 |
Family
ID=52296425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013127850A Active JP5676692B2 (ja) | 2013-06-18 | 2013-06-18 | 機械学習装置、機械学習方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5676692B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107169574A (zh) * | 2017-05-05 | 2017-09-15 | 第四范式(北京)技术有限公司 | 利用嵌套机器学习模型来执行预测的方法及系统 |
CN107169573A (zh) * | 2017-05-05 | 2017-09-15 | 第四范式(北京)技术有限公司 | 利用复合机器学习模型来执行预测的方法及系统 |
US10599998B2 (en) | 2015-12-18 | 2020-03-24 | Yahoo Japan Corporation | Feature selection using a large deviation principle |
KR20200084411A (ko) * | 2018-12-21 | 2020-07-13 | 주식회사 엘지씨엔에스 | 딥러닝 학습 방법 및 서버 |
-
2013
- 2013-06-18 JP JP2013127850A patent/JP5676692B2/ja active Active
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10599998B2 (en) | 2015-12-18 | 2020-03-24 | Yahoo Japan Corporation | Feature selection using a large deviation principle |
CN107169574A (zh) * | 2017-05-05 | 2017-09-15 | 第四范式(北京)技术有限公司 | 利用嵌套机器学习模型来执行预测的方法及系统 |
CN107169573A (zh) * | 2017-05-05 | 2017-09-15 | 第四范式(北京)技术有限公司 | 利用复合机器学习模型来执行预测的方法及系统 |
KR20200084411A (ko) * | 2018-12-21 | 2020-07-13 | 주식회사 엘지씨엔에스 | 딥러닝 학습 방법 및 서버 |
KR102189761B1 (ko) | 2018-12-21 | 2020-12-11 | 주식회사 엘지씨엔에스 | 딥러닝 학습 방법 및 서버 |
Also Published As
Publication number | Publication date |
---|---|
JP5676692B2 (ja) | 2015-02-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6537340B2 (ja) | 要約生成装置、要約生成方法、及び要約生成プログラム | |
US9025889B2 (en) | Method, apparatus and computer program product for providing pattern detection with unknown noise levels | |
JP5862413B2 (ja) | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 | |
JP5676692B2 (ja) | 機械学習装置、機械学習方法、およびプログラム | |
JPWO2009139161A1 (ja) | 画像処理装置、画像処理方法、処理装置、処理方法およびプログラム | |
JP2006252333A (ja) | データ処理方法、データ処理装置およびそのプログラム | |
JP6365024B2 (ja) | サービス提供装置、方法、及びプログラム | |
WO2020090413A1 (ja) | 分類装置、分類方法および分類プログラム | |
US20180260737A1 (en) | Information processing device, information processing method, and computer-readable medium | |
JP5821590B2 (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
JP2016095640A (ja) | 密度計測装置、密度計測方法、およびプログラム | |
JP2014215685A (ja) | レコメンドサーバおよびレコメンドコンテンツ決定方法 | |
WO2020179378A1 (ja) | 情報処理システム、情報処理方法および記録媒体 | |
JP2008204374A (ja) | クラスタ生成装置およびクラスタ生成プログラム | |
JP5184464B2 (ja) | 単語クラスタリング装置及び方法及びプログラム及びプログラムを格納した記録媒体 | |
US9189693B2 (en) | Information processing apparatus and information processing method | |
JP5809663B2 (ja) | 分類精度推定装置、分類精度推定方法、およびプログラム | |
JP5572120B2 (ja) | 構図データ生成装置及び構図データ生成プログラム | |
JP2018160165A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2022151502A (ja) | プログラム、情報処理装置、及び方法 | |
JP5490859B2 (ja) | ビジュアルキーワード抽出装置、これを用いたBoF表現生成装置、及びビジュアルキーワード抽出方法 | |
JP6453618B2 (ja) | 算出装置、方法及びプログラム | |
JPWO2017006648A1 (ja) | 画像判別装置、画像判別方法、及びコンピュータ読み取り可能な記録媒体 | |
JP2016212684A (ja) | パラメータ推定方法、対応割当方法、装置、及びプログラム | |
JP6719229B2 (ja) | コンテンツ収集装置、コンテンツ収集方法およびコンテンツ収集プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5676692 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |