JP7350587B2 - 能動学習装置、能動学習方法及びプログラム - Google Patents
能動学習装置、能動学習方法及びプログラム Download PDFInfo
- Publication number
- JP7350587B2 JP7350587B2 JP2019171017A JP2019171017A JP7350587B2 JP 7350587 B2 JP7350587 B2 JP 7350587B2 JP 2019171017 A JP2019171017 A JP 2019171017A JP 2019171017 A JP2019171017 A JP 2019171017A JP 7350587 B2 JP7350587 B2 JP 7350587B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- data
- cluster
- active
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
能動学習装置100は、能動学習によって機械学習モデルのパラメータを好適に調整する。機械学習モデルのパラメータを好適に調整することが能動学習装置100による学習である。能動学習装置100が学習する機械学習モデルは、分類問題の解を取得可能な機械学習モデルであればどのような機械学習モデルであってもよい。機械学習モデルは、例えば、サポートベクターマシン(SVM:Support Vector Machine)であってもよいし、ニューラルネットワークであってもよい。ニューラルネットワークとしては、例えば、エンコーダとデコーダとからなるモデルであってもよい。ニューラルネットワークは、全結合型のパーセプトロンであってもよいし、畳み込みニューラルネットワークであってもよい。機械学習モデルのパラメータは、誤差逆伝搬法のアルゴリズムによって調整されてもよい。以下、機械学習モデルがサポートベクターマシンである場合を例に説明する。
能動学習装置100は能動学習において、まず複数の教師有りの学習データ(以下「教師有りデータ」という。)に基づいて学習する。教師有りデータは、互いに対応付けられたモデル入力データと、特徴量と、教師データとを含むデータである。教師データは、具体的には、分類先を示す情報である。能動学習装置100は、この学習によって識別境界の位置も学習する。識別境界の位置とは、具体的には、特徴量空間における識別境界を表す関数である。
このようにして能動学習装置100は能動学習する。
ここまでで能動学習装置100の動作の概要の説明を終了する。
記憶部12は、磁気ハードディスク装置や半導体記憶装置等の記憶装置を用いて構成される。記憶部12は、能動学習装置100の動作に関する各種情報を記憶する。記憶部12は、モデル情報を記憶する。モデル情報は、機械学習モデルと、機械学習モデルのハイパーパラメータの値と、機械学習モデルのパラメータの値とを含む。記憶部12は、複数の教師有りデータと、複数の教師無しデータとを予め記憶している。記憶部12は、識別境界を示す情報を記憶する。記憶部12は、選択済み集合に属する要素を記憶する。選択済み集合は、他の要素との類似度が所定の類似度(以下「類似度閾値」という。)未満であるという条件を満たす教師無しデータを要素とする集合である。類似度とは、特徴量空間における2つの教師無しデータ間の距離の近さを示す値である。複数のクエリ対象データ間の類似度が低いほどクエリの内容が異なる。そのため、クエリ対象データ間の類似度が低いほど、オラクルの回答が得られた場合の能動学習装置100の学習効率が高い。
制御部11は、学習モデル更新部111、解析部112、選択部113、出力制御部114、回答取得部115、学習データ更新部116及び推定部117を備える。
回答取得部115は、クエリに対するオラクルの回答を取得する。
図4は、実施形態におけるクエリ対象選択処理の流れの一例を示すフローチャートである。
選択部113は、まず教師無しデータの特徴量に基づき教師無しデータを複数のクラスタにクラスタリングする(ステップS101)。以下、説明の簡単のためクラスタの数がK個(Kは2以上の整数)である場合を例に説明する。クラスタリングの方法は、例えば、k-means法であってもよいし、k-means++法であってもよい。クラスリングにおけるクラスタ数は、予め定められていてもよいし定められていなくてもよい。クラスタ数は予めユーザが定めてもよい。
学習モデル更新部111が、記憶部12に記憶されている教師有りデータに基づいて学習する(ステップS201)。次に、学習データ更新部116は、クエリ対象選択処理の実行に関する終了条件が満たされるか否かを判定する(ステップS202)。クエリ対象選択処理の実行に関する終了条件が満たされる場合、学習済みモデルの更新の処理が終了する。終了条件は、例えば、記憶部12に記憶されている教師無しデータの数が0という条件であってもよい。終了条件が満たされない場合、解析部112が、記憶部12に記憶されている教師無しデータをステップS201で学習された学習済みモデルに入力し、各教師無しデータの分類先を推定する(ステップS203)。次に、解析部112は、ステップS203の推定結果と、各教師無しデータの特徴量と識別境界とに基づいて、各教師無しデータの信頼度を算出する(ステップS204)。次に、選択部113が、クエリ対象選択処理を実行する(ステップS205)。クエリ対象選択処理の終了後、出力制御部114は、選択済み集合に含まれる全ての教師無しデータを、出力部14によって出力する(ステップS206)。ステップS206において、出力部14によって出力される情報がクエリである。ステップS206においては、選択済み集合に含まれる全ての教師無しデータが出力部14によって出力されるため、オラクルは一度に複数のクエリを知ることができ、オラクルの負担が軽減される。また、選択済み集合に含まれる要素は、クラスタリングされた教師無しデータの中から、同じクラスタのデータが一定数以上にならないように選択されたデータであり、かつ他の要素との類似度が類似度閾値未満である要素である。そのため、選択済み集合の要素に対する教師データを要求する複数のクエリは、類似度の低いクエリであり、似たような内容のクエリに回答しなければならないというオラクルの負担が軽減される。
一方、ステップS202において、終了条件が満たされる場合、学習済みモデルの更新が終了する。
比較例の能動学習装置では、ステップS101のクラスタリングの実行後に、各クラスタについて識別境界との近さを示す指標を算出する。算出した指標に基づき、識別境界に近い順に所定の数以下のクラスタを選択する。クラスタを選択した後、選択したクラスタ内の教師無しの学習データのうち信頼度の低い学習データを所定の数だけ選択する。このような比較例の能動学習装置では、信頼度に基づいてクエリ対象データを選択する前にクラスタを選択しているので、選択されなかったクラスタに属する信頼度の低い学習データはクエリ対象データとして選択されない。そのため、識別境界に近いにも関わらずクエリ対象データに選択されない教師無しデータが生じる場合がある。
なお、能動学習装置100は、教師有りデータを予め記憶部12に記憶していたが、教師有りデータは予め記憶部12に記憶されている必要は無い。教師有りデータは学習モデル更新部111による処理の実行前に入力部13を介して入力されてもよい。
Claims (5)
- 予め定められた複数の分類先のうち入力された複数の教師無しの学習データが属する分類先をそれぞれ推定する機械学習モデルの各推定結果の信頼度を算出する解析部と、
前記学習データを複数のクラスタにクラスタリングし、クラスタリングした後に前記信頼度が低いものから優先的に1つ以上の学習データを選択する選択部と、
前記選択部が選択した前記学習データの教師データを回答することをオラクルに要求するクエリを出力する出力部と、
前記回答を取得する入力部と、
前記回答に基づいて前記機械学習モデルの学習を進める学習モデル更新部と、
を備え、
前記選択部は、前記クラスタを選択していない状態で前記学習データの選択を行った後、1つのクラスタから所定の数以上の前記学習データを選択しないように前記学習データを選択する、
能動学習装置。 - 前記選択部は、前記学習データを選択する前に、クラスタ内分散が所定の大きさ以上である前記クラスタが含む前記学習データを、さらに複数のクラスタにクラスタリングする、
請求項1に記載の能動学習装置。 - 前記選択部は、既に選択した前記学習データとの類似度が所定の類似度以上である学習データは選択しない、
請求項1又は2に記載の能動学習装置。 - 能動学習装置が、予め定められた複数の分類先のうち入力された複数の教師無しの学習データが属する分類先をそれぞれ推定する機械学習モデルの各推定結果の信頼度を算出する解析ステップと、
能動学習装置が、前記学習データを複数のクラスタにクラスタリングし、クラスタリングした後に前記信頼度が低いものから優先的に1つ以上の学習データを選択する選択ステップと、
能動学習装置が、前記選択ステップにおいて選択された前記学習データの教師データを回答することをオラクルに要求するクエリを出力する出力ステップと、
能動学習装置が、前記回答を取得する入力ステップと、
能動学習装置が、前記回答に基づいて前記機械学習モデルの学習を進める学習モデル更新ステップと、
を有し、
前記選択ステップにおいては、前記クラスタを選択していない状態で前記学習データが選択された後、1つのクラスタから所定の数以上の前記学習データを選択しないように前記学習データが選択される、
能動学習方法。 - 能動学習装置が、予め定められた複数の分類先のうち入力された複数の教師無しの学習データが属する分類先をそれぞれ推定する機械学習モデルの各推定結果の信頼度を算出する解析ステップと、
能動学習装置が、前記学習データを複数のクラスタにクラスタリングし、クラスタリングした後に前記信頼度が低いものから優先的に1つ以上の学習データを選択する選択ステップと、
能動学習装置が、前記選択ステップにおいて選択された前記学習データの教師データを回答することをオラクルに要求するクエリを出力する出力ステップと、
能動学習装置が、前記回答を取得する入力ステップと、
能動学習装置が、前記回答に基づいて前記機械学習モデルの学習を進める学習モデル更新ステップと、
前記選択ステップにおいて、前記クラスタを選択していない状態で前記学習データが選択された後、1つのクラスタから所定の数以上の前記学習データを選択しないように前記学習データが選択されるステップと、
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019171017A JP7350587B2 (ja) | 2019-09-20 | 2019-09-20 | 能動学習装置、能動学習方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019171017A JP7350587B2 (ja) | 2019-09-20 | 2019-09-20 | 能動学習装置、能動学習方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021047751A JP2021047751A (ja) | 2021-03-25 |
JP7350587B2 true JP7350587B2 (ja) | 2023-09-26 |
Family
ID=74876428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019171017A Active JP7350587B2 (ja) | 2019-09-20 | 2019-09-20 | 能動学習装置、能動学習方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7350587B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117062957A (zh) | 2021-03-22 | 2023-11-14 | 住友建机株式会社 | 挖土机及挖土机用控制装置 |
KR20230032459A (ko) * | 2021-08-31 | 2023-03-07 | 디어젠 주식회사 | 능동적 학습을 위한 데이터 샘플링 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017505937A (ja) | 2013-12-02 | 2017-02-23 | ラクテン ユーエスエー インコーポレイテッド | オブジェクトネットワークをモデル化するシステム及び方法 |
JP2017167834A (ja) | 2016-03-16 | 2017-09-21 | セコム株式会社 | 学習データ選択装置 |
JP2018101914A (ja) | 2016-12-20 | 2018-06-28 | キヤノン株式会社 | 画像処理装置、画像処理方法、及び、プログラム |
-
2019
- 2019-09-20 JP JP2019171017A patent/JP7350587B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017505937A (ja) | 2013-12-02 | 2017-02-23 | ラクテン ユーエスエー インコーポレイテッド | オブジェクトネットワークをモデル化するシステム及び方法 |
JP2017167834A (ja) | 2016-03-16 | 2017-09-21 | セコム株式会社 | 学習データ選択装置 |
JP2018101914A (ja) | 2016-12-20 | 2018-06-28 | キヤノン株式会社 | 画像処理装置、画像処理方法、及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021047751A (ja) | 2021-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190378044A1 (en) | Processing dynamic data within an adaptive oracle-trained learning system using curated training data for incremental re-training of a predictive model | |
JP6364037B2 (ja) | 学習データ選択装置 | |
Domeniconi et al. | Large margin nearest neighbor classifiers | |
JP2021077377A (ja) | 物体認識モデルを学習するための方法および装置 | |
Wang et al. | A Training Data Set Cleaning Method by Classification Ability Ranking for the $ k $-Nearest Neighbor Classifier | |
WO2018072351A1 (zh) | 一种基于粒子群优化算法对支持向量机的优化方法 | |
WO2019011093A1 (zh) | 机器学习模型训练方法和装置、表情图像分类方法和装置 | |
Liu et al. | Sequential compact code learning for unsupervised image hashing | |
Yu et al. | A re-balancing strategy for class-imbalanced classification based on instance difficulty | |
JP2010231768A (ja) | マルチクラス分類器をトレーニングする方法 | |
JP7350587B2 (ja) | 能動学習装置、能動学習方法及びプログラム | |
WO2022166380A1 (zh) | 一种基于meanshift优化的数据处理方法和装置 | |
Christen et al. | Efficient entity resolution with adaptive and interactive training data selection | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN111460234A (zh) | 图查询方法、装置、电子设备及计算机可读存储介质 | |
WO2018036547A1 (zh) | 一种数据处理的方法以及装置 | |
Yang et al. | Learning from imbalanced data in relational domains: A soft margin approach | |
Joo et al. | Real‐Time Depth‐Based Hand Detection and Tracking | |
Nayini et al. | A novel threshold-based clustering method to solve K-means weaknesses | |
Nguyen et al. | Online feature selection based on fuzzy clustering and its applications | |
Zhai et al. | Direct 0-1 loss minimization and margin maximization with boosting | |
CN116431458B (zh) | 一种平板电脑智能管理系统与方法 | |
JP2012155394A (ja) | 文書分類学習制御装置、文書分類装置およびコンピュータプログラム | |
JP6233432B2 (ja) | 混合モデルの選択方法及び装置 | |
US20220083913A1 (en) | Learning apparatus, learning method, and a non-transitory computer-readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230125 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230320 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230518 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7350587 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |