JP7456512B2 - 学習装置、学習方法および学習プログラム - Google Patents
学習装置、学習方法および学習プログラム Download PDFInfo
- Publication number
- JP7456512B2 JP7456512B2 JP2022545247A JP2022545247A JP7456512B2 JP 7456512 B2 JP7456512 B2 JP 7456512B2 JP 2022545247 A JP2022545247 A JP 2022545247A JP 2022545247 A JP2022545247 A JP 2022545247A JP 7456512 B2 JP7456512 B2 JP 7456512B2
- Authority
- JP
- Japan
- Prior art keywords
- objective function
- learning
- discrimination result
- parameter
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000006870 function Effects 0.000 claims description 140
- 238000007477 logistic regression Methods 0.000 claims description 40
- 230000002787 reinforcement Effects 0.000 claims description 29
- 238000004458 analytical method Methods 0.000 claims description 25
- 238000005457 optimization Methods 0.000 claims description 13
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 14
- 230000002159 abnormal effect Effects 0.000 description 10
- 230000005856 abnormality Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000007429 general method Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
20 入力部
30 学習部
40 出力部
100 学習装置
Claims (9)
- 判別分析の目的関数における各判別結果のスコアを示す各項に、当該各判別結果のスコアの偏重度合いを示すパラメータである偏重パラメータを乗じた拡張目的関数の入力を受け付ける入力手段と、
前記拡張目的関数のロジスティック回帰の重みを最適化する最適化手段と、
最適化された重みが設定された前記ロジスティック回帰の拡張目的関数を用いて、逆強化学習により、前記偏重パラメータを推定する推定手段とを備えた
ことを特徴とする学習装置。 - 入力手段は、拡張目的関数として、二値判別分析の目的関数における第一の判別結果に基づくスコアを算出する項と、第二の判別結果に基づくスコアを算出する項のそれぞれに、偏重パラメータを乗じた拡張目的関数の入力を受け付ける
請求項1記載の学習装置。 - 入力手段は、拡張目的関数として、交差エントロピー誤差関数における各判別結果のスコアを示す各項に偏重パラメータを乗じた拡張目的関数の入力を受け付ける
請求項1または請求項2記載の学習装置。 - 最適化手段は、拡張目的関数のロジスティック回帰の重みを、当該ロジスティック回帰の重みの偏微分を用いた勾配降下法で更新して最適化する
請求項1から請求項3のうちのいずれか1項に記載の学習装置。 - 推定手段は、意思決定履歴データから意思決定内容を推定し、逆強化学習により、推定された意思決定内容を前記意思決定履歴データに近づけるように偏重パラメータを推定する
請求項1から請求項4のうちのいずれか1項に記載の学習装置。 - コンピュータが、判別分析の目的関数における各判別結果のスコアを示す各項に、当該各判別結果のスコアの偏重度合いを示すパラメータである偏重パラメータを乗じた拡張目的関数の入力を受け付け、
前記コンピュータが、前記拡張目的関数のロジスティック回帰の重みを最適化し、
前記コンピュータが、最適化された重みが設定された前記ロジスティック回帰の拡張目的関数を用いて、逆強化学習により、前記偏重パラメータを推定する
ことを特徴とする学習方法。 - コンピュータが、拡張目的関数として、二値判別分析の目的関数における第一の判別結果に基づくスコアを算出する項と、第二の判別結果に基づくスコアを算出する項のそれぞれに、偏重パラメータを乗じた拡張目的関数の入力を受け付ける
請求項6記載の学習方法。 - コンピュータに、
判別分析の目的関数における各判別結果のスコアを示す各項に、当該各判別結果のスコアの偏重度合いを示すパラメータである偏重パラメータを乗じた拡張目的関数の入力を受け付ける入力処理、
前記拡張目的関数のロジスティック回帰の重みを最適化する最適化処理、および、
最適化された重みが設定された前記ロジスティック回帰の拡張目的関数を用いて、逆強化学習により、前記偏重パラメータを推定する推定処理
を実行させるための学習プログラム。 - コンピュータに、
入力処理で、拡張目的関数として、二値判別分析の目的関数における第一の判別結果に基づくスコアを算出する項と、第二の判別結果に基づくスコアを算出する項のそれぞれに、偏重パラメータを乗じた拡張目的関数の入力を受け付けさせる
請求項8記載の学習プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/032849 WO2022044315A1 (ja) | 2020-08-31 | 2020-08-31 | 学習装置、学習方法および学習プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2022044315A1 JPWO2022044315A1 (ja) | 2022-03-03 |
JPWO2022044315A5 JPWO2022044315A5 (ja) | 2023-04-28 |
JP7456512B2 true JP7456512B2 (ja) | 2024-03-27 |
Family
ID=80354994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022545247A Active JP7456512B2 (ja) | 2020-08-31 | 2020-08-31 | 学習装置、学習方法および学習プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230316132A1 (ja) |
JP (1) | JP7456512B2 (ja) |
WO (1) | WO2022044315A1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102132375B1 (ko) | 2019-07-05 | 2020-07-09 | 한국과학기술원 | 딥 러닝 모델을 활용한 영상 진단 장치 및 그 방법 |
WO2020158609A1 (ja) | 2019-01-31 | 2020-08-06 | 国立大学法人東京工業大学 | 立体構造判定装置、立体構造判定方法、立体構造の判別器学習装置、立体構造の判別器学習方法及びプログラム |
-
2020
- 2020-08-31 US US18/023,532 patent/US20230316132A1/en active Pending
- 2020-08-31 JP JP2022545247A patent/JP7456512B2/ja active Active
- 2020-08-31 WO PCT/JP2020/032849 patent/WO2022044315A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020158609A1 (ja) | 2019-01-31 | 2020-08-06 | 国立大学法人東京工業大学 | 立体構造判定装置、立体構造判定方法、立体構造の判別器学習装置、立体構造の判別器学習方法及びプログラム |
KR102132375B1 (ko) | 2019-07-05 | 2020-07-09 | 한국과학기술원 | 딥 러닝 모델을 활용한 영상 진단 장치 및 그 방법 |
Non-Patent Citations (1)
Title |
---|
今井 拓司,「専門家の意図が分かる模倣学習を逆強化学習でNECが単発の意思決定問題から実用へ」,NIKKEI Robotics,日経BP,2019年09月10日,第51号,pp.22-26,ISSN 2189-5783 |
Also Published As
Publication number | Publication date |
---|---|
WO2022044315A1 (ja) | 2022-03-03 |
JPWO2022044315A1 (ja) | 2022-03-03 |
US20230316132A1 (en) | 2023-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dejaeger et al. | Data mining techniques for software effort estimation: a comparative study | |
TWI631518B (zh) | 具有一或多個計算裝置的電腦伺服系統及訓練事件分類器模型的電腦實作方法 | |
WO2017159403A1 (ja) | 予測システム、方法およびプログラム | |
EP3371764A1 (en) | Systems and methods for pricing optimization with competitive influence effects | |
JP6821614B2 (ja) | モデル学習装置、モデル学習方法、プログラム | |
CA3088689C (en) | Finite rank deep kernel learning for robust time series forecasting and regression | |
JP6311851B2 (ja) | 共クラスタリングシステム、方法およびプログラム | |
WO2017070558A1 (en) | Systems and methods for analytics based pricing optimization with competitive influence effects | |
US20140379310A1 (en) | Methods and Systems for Evaluating Predictive Models | |
US20200265307A1 (en) | Apparatus and method with multi-task neural network | |
US20210117840A1 (en) | Causation learning apparatus, causation estimation apparatus, causation learning method, causation estimation method and program | |
Toyama et al. | Reinforcement learning with parsimonious computation and a forgetting process | |
CN113537630A (zh) | 业务预测模型的训练方法及装置 | |
WO2018088277A1 (ja) | 予測モデル生成システム、方法およびプログラム | |
JP7207540B2 (ja) | 学習支援装置、学習支援方法、及びプログラム | |
Rath et al. | Modern approach for loan sanctioning in banks using machine learning | |
JP7456512B2 (ja) | 学習装置、学習方法および学習プログラム | |
CA3119351C (en) | Extending finite rank deep kernel learning to forecasting over long time horizons | |
JP7044153B2 (ja) | 評価システム、評価方法および評価用プログラム | |
WO2018088276A1 (ja) | 予測モデル生成システム、方法およびプログラム | |
US20220366101A1 (en) | Information processing device, information processing method, and computer program product | |
JP7231027B2 (ja) | 異常度推定装置、異常度推定方法、プログラム | |
JP6947229B2 (ja) | 最適化装置、最適化方法および最適化プログラム | |
JP2021174330A (ja) | 異種機械学習のアンサンブル学習による予測装置 | |
JP7283548B2 (ja) | 学習装置、予測システム、方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230215 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7456512 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |