JP7024515B2 - 学習プログラム、学習方法および学習装置 - Google Patents
学習プログラム、学習方法および学習装置 Download PDFInfo
- Publication number
- JP7024515B2 JP7024515B2 JP2018043328A JP2018043328A JP7024515B2 JP 7024515 B2 JP7024515 B2 JP 7024515B2 JP 2018043328 A JP2018043328 A JP 2018043328A JP 2018043328 A JP2018043328 A JP 2018043328A JP 7024515 B2 JP7024515 B2 JP 7024515B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- learning
- label
- unlabeled
- labeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
Description
図1は、実施例1にかかる学習装置の全体例を説明する図である。図1に示すように、実施例1にかかる学習装置10は、学習データのラベルに対してスコアを付与した後に、機械学習や深層学習(ディープラーニング・Deep Learning;DL)などを用いた判別処理(学習処理)を実行して、学習データを事象ごとに正しく判別(分類)できるように、スコアを用いてニューラルネットワーク(NN:Neural Network)などを学習する。その後、学習結果を適用した学習モデルを用いることで、判別対象データの正確な事象(ラベル)の推定を実現する。なお、学習データには、画像、動画、文書、グラフなど様々なデータを採用することができる。
図3は、実施例1にかかる学習装置の機能構成を示す機能ブロック図である。図3に示すように、学習装置10は、通信部11と記憶部12と制御部20を有する。
次に、上述したラベルベクトルの設定処理について説明する。ここでは、一例として、入力データから学習データを生成した後に学習処理を実行する一連の流れを説明するが、これに限定されず、別々のフローで処理することもできる。
上述したように、学習装置10は、ラベルの分離性や分布の既知性を仮定することなく、大量のラベル無しデータに対して、各ラベルである可能性の確率が設定されるラベルベクトルを付加して、学習データとすることができる。したがって、学習装置10は、ラベル有りデータが少なくても、学習データを増やすことができ、DLの学習効率を向上させることができる。つまり、学習装置10は、分離性のないラベルによる半教師あり学習による学習モデルの判定精度を向上させることができる。
上記実施例では、ラベルがもともと付加されているラベル有りデータに対してもラベルベクトルを設定する例を説明したが、これに限定されるわけではない。例えば、ラベルがもともと付加されているラベル有りデータについては、一般的なNNによる学習を実行し、ラベルがもともと付加されていないラベル無しデータについて、上記実施例1による手法を用いたスコア設定を実行することもできる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値などは、あくまで一例であり、任意に変更することができる。
図9は、ハードウェア構成例を説明する図である。図9に示すように、学習装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図9に示した各部は、バス等で相互に接続される。
11 通信部
12 記憶部
13 入力データDB
14 学習データDB
15 学習結果DB
20 制御部
21 選別部
22 設定部
23 学習部
Claims (9)
- コンピュータに、
複数のラベル無しデータそれぞれの、複数のラベル有りデータに用いられる複数のラベルそれぞれに対する距離に基づき、前記複数のラベル無しデータそれぞれに前記複数のラベルそれぞれに対するスコアを設定し、
前記複数のラベル有りデータおよび前記複数のラベル有りデータ各々のラベルと、前記複数のラベル無しデータおよび前記複数のラベル無しデータそれぞれの前記複数のラベルに対するスコアを用いて、ニューラルネットワークを用いた学習モデルを学習させる
処理を実行させる学習プログラム。 - 請求項1に記載の学習プログラムであって、前記コンピュータに、
前記複数のラベル無しデータおよび前記複数のラベル有りデータのそれぞれについて、前記複数のラベル有りデータ各々のラベルと前記スコアとを用いたラベルベクトルを生成し、
生成したラベルベクトルを用いて、前記学習モデルを学習させる処理を実行させる学習プログラム。 - 請求項1に記載の学習プログラムであって、前記コンピュータに、
前記複数のラベル無しデータそれぞれについて、各ラベル無しデータから所定の距離に位置する複数のラベル有りデータそれぞれにもともと付加されている各ラベルの割合を、前記スコアとして設定する処理を実行させる学習プログラム。 - 請求項3に記載の学習プログラムであって、前記コンピュータに、
前記複数のラベル無しデータそれぞれについて、前記所定の距離に位置する複数のラベル有りデータのうち距離が近いほど値を大きくする重みを用いて前記各ラベルの割合を算出する処理を実行させる学習プログラム。 - 請求項3または4に記載の学習プログラムであって、前記コンピュータに、
前記複数のラベル有りデータそれぞれについて、該当するラベルに1を設定し、その他のラベルに0を設定したラベルベクトルを前記スコアとして設定し、
前記複数のラベル無しデータそれぞれについて、前記各ラベルの割合を設定したラベルベクトルを前記スコアとして設定し、
前記ラベルベクトルを用いて前記学習モデルを学習させる処理を実行させる学習プログラム。 - 請求項1に記載の学習プログラムであって、前記コンピュータに、
前記複数のラベル無しデータそれぞれの、前記複数のラベル有りデータそれぞれに対する距離として、前記ラベル無しデータに含まれる各要素と、前記ラベル有りデータに含まれる各要素との類似性を数値化した、ベクトル空間上の距離または各要素によって特定されるデータ間の距離に基づく類似度を算出する処理を実行させる学習プログラム。 - 請求項1に記載の学習プログラムであって、前記コンピュータに、
前記複数のラベル無しデータそれぞれの、前記複数のラベル有りデータそれぞれに対する距離として、前記ラベル無しデータに含まれる各要素と、前記ラベル有りデータに含まれる各要素と一致性または相関性である関連度を算出する処理を実行させる学習プログラム。 - コンピュータが、
複数のラベル無しデータそれぞれの、複数のラベル有りデータに用いられる複数のラベルそれぞれに対する距離に基づき、前記複数のラベル無しデータそれぞれに前記複数のラベルそれぞれに対するスコアを設定し、
前記複数のラベル有りデータおよび前記複数のラベル有りデータ各々のラベルと、前記複数のラベル無しデータおよび前記複数のラベル無しデータそれぞれの前記複数のラベルに対するスコアを用いて、ニューラルネットワークを用いた学習モデルを学習させる
処理を実行する学習方法。 - 複数のラベル無しデータそれぞれの、複数のラベル有りデータに用いられる複数のラベルそれぞれに対する距離に基づき、前記複数のラベル無しデータそれぞれに前記複数のラベルそれぞれに対するスコアを設定する設定部と、
前記複数のラベル有りデータおよび前記複数のラベル有りデータ各々のラベルと、前記複数のラベル無しデータおよび前記複数のラベル無しデータそれぞれの前記複数のラベルに対するスコアを用いて、ニューラルネットワークを用いた学習モデルを学習させる学習部と
を有する学習装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043328A JP7024515B2 (ja) | 2018-03-09 | 2018-03-09 | 学習プログラム、学習方法および学習装置 |
US16/285,222 US11574147B2 (en) | 2018-03-09 | 2019-02-26 | Machine learning method, machine learning apparatus, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018043328A JP7024515B2 (ja) | 2018-03-09 | 2018-03-09 | 学習プログラム、学習方法および学習装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159576A JP2019159576A (ja) | 2019-09-19 |
JP7024515B2 true JP7024515B2 (ja) | 2022-02-24 |
Family
ID=67842640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018043328A Active JP7024515B2 (ja) | 2018-03-09 | 2018-03-09 | 学習プログラム、学習方法および学習装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11574147B2 (ja) |
JP (1) | JP7024515B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7024515B2 (ja) * | 2018-03-09 | 2022-02-24 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
CN110851596B (zh) * | 2019-10-11 | 2023-06-27 | 平安科技(深圳)有限公司 | 文本分类方法、装置及计算机可读存储介质 |
JP7464903B2 (ja) | 2020-02-19 | 2024-04-10 | 京セラドキュメントソリューションズ株式会社 | 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム |
US11615330B2 (en) * | 2020-03-18 | 2023-03-28 | Kyndryl, Inc. | Virtual subject matter expert provisioning |
CN113496277A (zh) | 2020-04-03 | 2021-10-12 | 三星电子株式会社 | 用于检索图像的神经网络装置及其操作方法 |
JP7041374B2 (ja) * | 2020-09-04 | 2022-03-24 | ダイキン工業株式会社 | 生成方法、プログラム、情報処理装置、情報処理方法、及び学習済みモデル |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211693A (ja) | 2008-02-29 | 2009-09-17 | Fujitsu Ltd | パターン識別装置およびパターン識別方法 |
US20130346346A1 (en) | 2012-06-21 | 2013-12-26 | Microsoft Corporation | Semi-supervised random decision forests for machine learning |
JP2017126158A (ja) | 2016-01-13 | 2017-07-20 | 日本電信電話株式会社 | 2値分類学習装置、2値分類装置、方法、及びプログラム |
JP2017167834A (ja) | 2016-03-16 | 2017-09-21 | セコム株式会社 | 学習データ選択装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5364578B2 (ja) | 2006-07-12 | 2013-12-11 | コファックス, インコーポレイテッド | トランスダクティブデータ分類のための方法およびシステム、ならびに機械学習手法を用いたデータ分類方法 |
US8112421B2 (en) * | 2007-07-20 | 2012-02-07 | Microsoft Corporation | Query selection for effectively learning ranking functions |
US7860813B2 (en) * | 2008-01-24 | 2010-12-28 | Nec Laboratories America, Inc. | Monitoring driving safety using semi-supervised sequential learning |
JP6000767B2 (ja) | 2012-09-04 | 2016-10-05 | 公立大学法人公立はこだて未来大学 | 学習装置、判別装置、行動状態判別システム、および判別方法 |
US10262272B2 (en) * | 2014-12-07 | 2019-04-16 | Microsoft Technology Licensing, Llc | Active machine learning |
US10535017B2 (en) * | 2015-10-27 | 2020-01-14 | Legility Data Solutions, Llc | Apparatus and method of implementing enhanced batch-mode active learning for technology-assisted review of documents |
US10699215B2 (en) * | 2016-11-16 | 2020-06-30 | International Business Machines Corporation | Self-training of question answering system using question profiles |
CN108154198B (zh) * | 2018-01-25 | 2021-07-13 | 北京百度网讯科技有限公司 | 知识库实体归一方法、系统、终端和计算机可读存储介质 |
JP7024515B2 (ja) * | 2018-03-09 | 2022-02-24 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
US10726313B2 (en) * | 2018-04-19 | 2020-07-28 | Adobe Inc. | Active learning method for temporal action localization in untrimmed videos |
US10861064B2 (en) * | 2018-06-12 | 2020-12-08 | Exxonmobil Upstream Research Company | Method and system for generating contradiction scores for petroleum geoscience entities within text using associative topic sentiment analysis |
US10839394B2 (en) * | 2018-10-26 | 2020-11-17 | Microsoft Technology Licensing, Llc | Machine learning system for taking control actions |
US10885388B1 (en) * | 2020-08-04 | 2021-01-05 | Superb Ai Co., Ltd. | Method for generating training data to be used for training deep learning network capable of analyzing images and auto labeling device using the same |
US11113574B1 (en) * | 2021-03-26 | 2021-09-07 | StradVision, Inc. | Methods for performing self-supervised learning of deep-learning based detection network by using deep Q-network and devices using the same |
-
2018
- 2018-03-09 JP JP2018043328A patent/JP7024515B2/ja active Active
-
2019
- 2019-02-26 US US16/285,222 patent/US11574147B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009211693A (ja) | 2008-02-29 | 2009-09-17 | Fujitsu Ltd | パターン識別装置およびパターン識別方法 |
US20130346346A1 (en) | 2012-06-21 | 2013-12-26 | Microsoft Corporation | Semi-supervised random decision forests for machine learning |
JP2017126158A (ja) | 2016-01-13 | 2017-07-20 | 日本電信電話株式会社 | 2値分類学習装置、2値分類装置、方法、及びプログラム |
JP2017167834A (ja) | 2016-03-16 | 2017-09-21 | セコム株式会社 | 学習データ選択装置 |
Also Published As
Publication number | Publication date |
---|---|
US20190279039A1 (en) | 2019-09-12 |
US11574147B2 (en) | 2023-02-07 |
JP2019159576A (ja) | 2019-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7024515B2 (ja) | 学習プログラム、学習方法および学習装置 | |
JP6781415B2 (ja) | ニューラルネットワーク学習装置、方法、プログラム、およびパターン認識装置 | |
US8620837B2 (en) | Determination of a basis for a new domain model based on a plurality of learned models | |
KR20170016231A (ko) | 사용자 인증을 위한 멀티-모달 퓨전 방법 및 사용자 인증 방법 | |
JP7040104B2 (ja) | 学習プログラム、学習方法および学習装置 | |
CN110046634B (zh) | 聚类结果的解释方法和装置 | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
US11741363B2 (en) | Computer-readable recording medium, method for learning, and learning device | |
CN108877947B (zh) | 基于迭代均值聚类的深度样本学习方法 | |
US20230195851A1 (en) | Data classification system, data classification method, and recording medium | |
US20210224647A1 (en) | Model training apparatus and method | |
Long et al. | Learning to recognise unseen classes by a few similes | |
CN114048729A (zh) | 医学文献评价方法、电子设备、存储介质和程序产品 | |
CN111340057A (zh) | 一种分类模型训练的方法及装置 | |
JP7389389B2 (ja) | 処理装置、処理方法および処理プログラム | |
AU2021304283A1 (en) | Dataset-aware and invariant learning for face recognition | |
US20190286703A1 (en) | Clustering program, clustering method, and clustering device for generating distributed representation of words | |
US20150332173A1 (en) | Learning method, information conversion device, and recording medium | |
US20220366142A1 (en) | Method of machine learning and information processing apparatus | |
JP7172067B2 (ja) | 学習プログラム、学習方法および学習装置 | |
CN114547264A (zh) | 一种基于马氏距离和对比学习的新意图数据识别方法 | |
Fu et al. | Genetic programming based transfer learning for document classification with self-taught and ensemble learning | |
Xu et al. | Robust bounded logistic regression in the class imbalance problem | |
CN109918905B (zh) | 行为推论模型生成装置及其行为推论模型生成方法 | |
CN111783088A (zh) | 一种恶意代码家族聚类方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7024515 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |