JPWO2020161935A1 - 学習装置、学習方法、及び、プログラム - Google Patents
学習装置、学習方法、及び、プログラム Download PDFInfo
- Publication number
- JPWO2020161935A1 JPWO2020161935A1 JP2020570350A JP2020570350A JPWO2020161935A1 JP WO2020161935 A1 JPWO2020161935 A1 JP WO2020161935A1 JP 2020570350 A JP2020570350 A JP 2020570350A JP 2020570350 A JP2020570350 A JP 2020570350A JP WO2020161935 A1 JPWO2020161935 A1 JP WO2020161935A1
- Authority
- JP
- Japan
- Prior art keywords
- estimation
- temperature
- estimation unit
- unit
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Feedback Control In General (AREA)
- Air Conditioning Control Device (AREA)
Abstract
Description
[装置構成]
図1は、実施形態に係る学習装置のハードウェア構成を示すブロック図である。学習装置1は、コンピュータにより構成され、プロセッサ1と、メモリ2とを備える。学習装置1には、正解ラベル付きの学習データが入力される。学習装置1は蒸留を用いた学習を行う装置であり、学習データ及び教師モデルを用いて生徒モデルの学習を行う。
図2は、実施形態に係る学習装置の基本的な機能構成を示すブロック図である。図示のように、学習装置1は、推定部5と、推定部6と、温度計算部7とを備える。推定部5は、生徒モデルを構成する推定部であり、温度パラメータTを用いて学習データの推定処理を行って推定情報を出力する。一方、推定部6は、教師モデルを構成する推定部であり、温度パラメータTを用いて学習データの推定処理を行って推定情報を出力する。温度計算部7は、推定部5が生成する推定情報、及び、推定部6が生成する推定情報に基づいて、温度パラメータTを計算し、推定部5及び6に供給する。こうして、推定部5及び6が用いる温度パラメータTが自動的に更新される。一例では、推定情報として、生徒モデル及び教師モデルにより生成されるロジットもしくは推定結果が用いられる。他の例では、推定情報として、生徒モデルの推定結果の正解ラベルに対する損失、及び、生徒モデルの推定結果の教師モデルの推定結果に対する損失が用いられる。
次に、第1実施形態について説明する。第1実施形態は、生徒モデルにより生成される推定結果の正解ラベルに対する損失、及び、生徒モデルにより生成される推定結果の教師モデルにより生成される推定結果に対する損失に基づいて温度パラメータを更新するものである。損失は本発明の推定情報の一例である。
図3は、第1実施形態に係る学習装置100の機能構成を示すブロック図である。学習装置100には、学習データが入力される。学習データは、文字列や画像など、学習すべき特徴を示す学習データXと、その正解ラベルYとの組からなる。例えば、画像に写っているのが犬か猫かを判定するDNNを学習させる場合、学習データXは犬の画像であり、正解ラベルYは(犬クラス1,猫クラス0)といった、その画像の属する正解クラスに「1」を、その他の不正解クラスに「0」を持つバイナリ値のベクトルである。
次に、第1実施形態による学習処理の流れについて説明する。図4は、第1実施形態による学習処理のフローチャートである。この処理は、図1に示すプロセッサ1が予め用意されたプログラムを実行することにより実現される。
上記の第1実施形態では、温度更新器34は、正解ラベルYに対する推定結果Yaの損失La、及び、推定結果Ybに対する推定結果Yaの損失Lbの両方を用いて温度パラメータTを更新している。その代わりに、温度更新器34は、正解ラベルYに対する推定結果Yaの損失La、及び、推定結果Ybに対する推定結果Yaの損失Lbのいずれか一方を用いて温度パラメータTを更新しても良い。
第1実施形態の1つの実施例では、温度パラメータTの初期値を「1」に設定する。温度更新器34は、パラメータ更新器33がロジット計算器11aの内部パラメータPAを更新するのと同じタイミングで、温度パラメータTを更新する。温度更新器34は、確率的勾配降下法を用いて温度パラメータTを更新し、学習率はε=1.0×10−4とする。
次に、第2実施形態について説明する。第2実施形態は、推定部内のロジット計算器により計算されるロジットに基づいて温度パラメータを更新するものである。ロジットは、本発明の推定情報の一例である。なお、第2実施形態に係る学習装置200のハードウェア構成は、図1に示す第1実施形態の学習装置100と同様である。
図5は、第2実施形態に係る学習装置200の機能構成を示すブロック図である。図3と比較するとわかるように、学習装置200は、基本的構成は第1実施形態の学習装置100と同様であり、推定部10aと、推定部10bと、最適化部30とを備える。但し、第2実施形態の学習装置200は、第1実施形態における温度更新器34の代わりに、温度計算器21を備える。
次に、第2実施形態による学習処理の流れについて説明する。図6は、第2実施形態による学習処理のフローチャートである。この処理は、図1に示すプロセッサ1が予め用意されたプログラムを実行することにより実現される。
上記の第2実施形態では、温度計算器21は、生徒モデルに相当する推定部10aが生成するロジットya、及び、教師モデルに相当する推定部10bが生成するロジットybの両方を用いて温度パラメータTを計算している。その代わりに、温度計算器21は、生徒モデルに相当する推定部10aが生成するロジットya、及び、教師モデルに相当する推定部10bが生成するロジットybのいずれか一方を用いて温度パラメータTを計算しても良い。
第2実施形態の1つの実施例では、温度パラメータTは、生徒モデルに相当する推定部10a又は教師モデルに相当する推定部10bが出力するロジットの値が正のときに正の値に設定され、負のときに負の値に設定される。例えば、ロジットの値が負の場合には温度パラメータT=−5とし、ロジットの値が正の場合には温度パラメータT=1とする。好適には、温度パラメータTは、−100〜100の範囲で決定される。例えば、温度計算器21は、生徒モデルに相当する推定部10aが出力するロジットが正のときに温度パラメータTを0〜100の値に設定し、負のときに温度パラメータTを−100〜0の値に設定する。活性化器12a及び12bの活性化関数にはシグモイド関数を用いる。
次に、第3実施形態について説明する。第3実施形態は、推定部により計算される推定結果に基づいて温度パラメータを更新するものである。推定結果は、本発明の推定情報の一例である。なお、第3実施形態に係る学習装置300のハードウェア構成は、図1に示す第1実施形態の学習装置100と同様である。
(機能構成)
次に、第3実施形態による学習処理の流れについて説明する。図8は、第3実施形態による学習処理のフローチャートである。この処理は、図1に示すプロセッサ1が予め用意されたプログラムを実行することにより実現される。
上記の第3実施形態では、温度計算器21は、生徒モデルに相当する推定部10aが生成する推定結果Ya、及び、教師モデルに相当する推定部10bが生成する推定結果Ybの両方を用いて温度パラメータTを計算している。その代わりに、温度計算器21は、生徒モデルに相当する推定部10aが生成する推定結果Ya、及び、教師モデルに相当する推定部10bが生成する推定結果Ybのいずれか一方を用いて温度パラメータTを計算しても良い。
第3実施形態の第1の実施例では、温度計算器21は、推定部10bから出力される推定結果Ybの各クラスの確率推定値の大小バランスを補正するように、具体的には、各クラスの推定結果のオーダーが揃うように温度パラメータTを設定する。例えば、温度計算器21は、確率推定値の最大値/最小値が105以上の場合には温度パラメータT=5とし、それ以下の場合は温度パラメータT=1とする。好適には、温度パラメータTは1〜100の範囲で決定される。活性化器22a及び22bの活性化関数にはソフトマックス関数を用いる。
T=2/(1+e(−r+4))+1
と定める。
上記の第1実施形態と、第2実施形態又は第3実施形態とを組み合わせてもよい。例えば、第1実施形態と第2実施形態とを組み合わせた場合、第2実施形態の手法によりロジットに基づいて温度パラメータTの初期値を決定し、その後は第1実施形態の手法により損失に基づいて温度パラメータTを更新すればよい。また、第1実施形態と第3実施形態とを組み合わせた場合、第3実施形態の手法により推定結果に基づいて温度パラメータTの初期値を決定し、その後は第1実施形態の手法により損失に基づいて温度パラメータTを更新すればよい。
生徒モデルに基づき、温度パラメータを用いて推定を行う第1の推定部と、
教師モデルに基づき、温度パラメータを用いて推定を行う第2の推定部と、
前記第1の推定部及び前記第2の推定部が生成する推定情報に基づいて、前記温度パラメータを計算する温度計算部と、
を備える学習装置。
前記温度計算部は、正解ラベルに対する前記第1の推定部が生成する第1の推定結果の損失、及び、前記第2の推定部が生成する第2の推定結果に対する前記第1の推定結果の損失の少なくとも一方に基づいて前記温度パラメータを計算する付記1に記載の学習装置。
前記温度計算部は、正解ラベルに対する前記第1の推定部が生成する第1の推定結果の損失と、前記第2の推定部が生成する第2の推定結果に対する前記第1の推定結果の損失との加重平均に基づいて前記温度パラメータを計算する付記1に記載の学習装置。
前記温度計算部は、前記第1の推定部が生成するロジット、及び、前記第2の推定部が生成するロジットの少なくとも一方に基づいて、前記温度パラメータを計算する付記1に記載の学習装置。
前記温度計算部は、前記第1の推定部又は第2の推定部が生成するロジットの正負に応じて前記温度パラメータを計算する付記1に記載の学習装置。
前記温度計算部は、前記第1の推定部が生成する推定結果、及び、前記第2の推定部が生成する推定結果の少なくとも一方に基づいて前記温度パラメータを計算する付記1に記載の学習装置。
前記温度計算部は、前記第2の推定部が生成する推定結果のエントロピーに基づいて前記温度パラメータを計算する付記6に記載の学習装置。
前記温度計算部は、前記第2の推定部が生成する推定結果のエントロピーに関する単調減少関数として温度パラメータを計算する付記6に記載の学習装置。
前記温度計算部は、前記第1の推定部又は前記第2の推定部が生成する各クラスの推定結果の大小バランスが補正されるように前記温度パラメータを計算する付記6に記載の学習装置。
前記温度計算部は、前記第1の推定部又は前記第2の推定部が生成する各クラスの推定結果のオーダーが揃うように前記温度パラメータを計算する付記6に記載の学習装置。
前記温度計算部は、前記第2の推定部が生成する各クラスの推定結果のうち、最も確率の高いクラスの値と、次に確率の高いクラスの値との比に基づいて、前記温度パラメータを計算する付記6に記載の学習装置。
学習装置により実行される学習方法であって、
生徒モデルに基づき、温度パラメータを用いて推定を行い、
教師モデルに基づき、温度パラメータを用いて推定を行い、
前記第1の推定部及び前記第2の推定部が生成する推定情報に基づいて、前記温度パラメータを計算する学習方法。
コンピュータを備える学習装置により実行されるプログラムであって、
生徒モデルに基づき、温度パラメータを用いて推定を行う第1の推定部、
教師モデルに基づき、温度パラメータを用いて推定を行う第2の推定部、
前記第1の推定部及び前記第2の推定部が生成する推定情報に基づいて、前記温度パラメータを計算する温度計算部、
として前記コンピュータを機能させるプログラム。
2 メモリ
5、6、10a、10b 推定部
7、21 温度計算器
11a、11b ロジット計算器
12a、12b、22a、22b 活性化器
30 最適化部
31 損失計算器
32 加重平均計算器
33 パラメータ更新器
34 温度更新器
Claims (13)
- 生徒モデルに基づき、温度パラメータを用いて推定を行う第1の推定部と、
教師モデルに基づき、温度パラメータを用いて推定を行う第2の推定部と、
前記第1の推定部及び前記第2の推定部が生成する推定情報に基づいて、前記温度パラメータを計算する温度計算部と、
を備える学習装置。 - 前記温度計算部は、正解ラベルに対する前記第1の推定部が生成する第1の推定結果の損失、及び、前記第2の推定部が生成する第2の推定結果に対する前記第1の推定結果の損失の少なくとも一方に基づいて前記温度パラメータを計算する請求項1に記載の学習装置。
- 前記温度計算部は、正解ラベルに対する前記第1の推定部が生成する第1の推定結果の損失と、前記第2の推定部が生成する第2の推定結果に対する前記第1の推定結果の損失との加重平均に基づいて前記温度パラメータを計算する請求項1に記載の学習装置。
- 前記温度計算部は、前記第1の推定部が生成するロジット、及び、前記第2の推定部が生成するロジットの少なくとも一方に基づいて、前記温度パラメータを計算する請求項1に記載の学習装置。
- 前記温度計算部は、前記第1の推定部又は第2の推定部が生成するロジットの正負に応じて前記温度パラメータを計算する請求項1に記載の学習装置。
- 前記温度計算部は、前記第1の推定部が生成する推定結果、及び、前記第2の推定部が生成する推定結果の少なくとも一方に基づいて前記温度パラメータを計算する請求項1に記載の学習装置。
- 前記温度計算部は、前記第2の推定部が生成する推定結果のエントロピーに基づいて前記温度パラメータを計算する請求項6に記載の学習装置。
- 前記温度計算部は、前記第2の推定部が生成する推定結果のエントロピーに関する単調減少関数として温度パラメータを計算する請求項6に記載の学習装置。
- 前記温度計算部は、前記第1の推定部又は前記第2の推定部が生成する各クラスの推定結果の大小バランスが補正されるように前記温度パラメータを計算する請求項6に記載の学習装置。
- 前記温度計算部は、前記第1の推定部又は前記第2の推定部が生成する各クラスの推定結果のオーダーが揃うように前記温度パラメータを計算する請求項6に記載の学習装置。
- 前記温度計算部は、前記第2の推定部が生成する各クラスの推定結果のうち、最も確率の高いクラスの値と、次に確率の高いクラスの値との比に基づいて、前記温度パラメータを計算する請求項6に記載の学習装置。
- 学習装置により実行される学習方法であって、
生徒モデルに基づき、温度パラメータを用いて推定を行い、
教師モデルに基づき、温度パラメータを用いて推定を行い、
前記第1の推定部及び前記第2の推定部が生成する推定情報に基づいて、前記温度パラメータを計算する学習方法。 - コンピュータを備える学習装置により実行されるプログラムであって、
生徒モデルに基づき、温度パラメータを用いて推定を行う第1の推定部、
教師モデルに基づき、温度パラメータを用いて推定を行う第2の推定部、
前記第1の推定部及び前記第2の推定部が生成する推定情報に基づいて、前記温度パラメータを計算する温度計算部、
として前記コンピュータを機能させるプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/004032 WO2020161797A1 (ja) | 2019-02-05 | 2019-02-05 | 学習装置、学習方法、及び、プログラム |
JPPCT/JP2019/004032 | 2019-02-05 | ||
PCT/JP2019/026672 WO2020161935A1 (ja) | 2019-02-05 | 2019-07-04 | 学習装置、学習方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020161935A1 true JPWO2020161935A1 (ja) | 2021-11-25 |
JP7180697B2 JP7180697B2 (ja) | 2022-11-30 |
Family
ID=71947438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570350A Active JP7180697B2 (ja) | 2019-02-05 | 2019-07-04 | 学習装置、学習方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220122349A1 (ja) |
JP (1) | JP7180697B2 (ja) |
WO (2) | WO2020161797A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11551083B2 (en) | 2019-12-17 | 2023-01-10 | Soundhound, Inc. | Neural network training from private data |
CN112556107B (zh) * | 2020-11-23 | 2022-10-28 | 北京新欧绿色建筑设计院有限公司 | 一种宜温宜湿宜氧室内环境智能控制系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150356461A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Training distilled machine learning models |
WO2018051841A1 (ja) * | 2016-09-16 | 2018-03-22 | 日本電信電話株式会社 | モデル学習装置、その方法、及びプログラム |
CN107977707A (zh) * | 2017-11-23 | 2018-05-01 | 厦门美图之家科技有限公司 | 一种对抗蒸馏神经网络模型的方法及计算设备 |
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2996374B1 (fr) * | 2012-10-03 | 2016-10-28 | Valeo Systemes De Controle Moteur | Reseau electrique pour vehicule automobile |
JP6712644B2 (ja) * | 2016-09-30 | 2020-06-24 | 日本電信電話株式会社 | 音響モデル学習装置、その方法、及びプログラム |
-
2019
- 2019-02-05 WO PCT/JP2019/004032 patent/WO2020161797A1/ja active Application Filing
- 2019-07-04 JP JP2020570350A patent/JP7180697B2/ja active Active
- 2019-07-04 WO PCT/JP2019/026672 patent/WO2020161935A1/ja active Application Filing
- 2019-07-04 US US17/427,257 patent/US20220122349A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150356461A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Training distilled machine learning models |
WO2018051841A1 (ja) * | 2016-09-16 | 2018-03-22 | 日本電信電話株式会社 | モデル学習装置、その方法、及びプログラム |
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
CN107977707A (zh) * | 2017-11-23 | 2018-05-01 | 厦门美图之家科技有限公司 | 一种对抗蒸馏神经网络模型的方法及计算设备 |
Non-Patent Citations (1)
Title |
---|
MOSNER, LADISLAV ET AL.: "IMPROVING NOISE ROBUSTNESS OF AUTOMATIC SPEECH RECOGNITION VIA PARALLEL DATA AND TEACHER-STUDENT LEA", ARXIV, JPN6019015624, 11 January 2019 (2019-01-11), ISSN: 0004846094 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020161797A1 (ja) | 2020-08-13 |
US20220122349A1 (en) | 2022-04-21 |
WO2020161935A1 (ja) | 2020-08-13 |
JP7180697B2 (ja) | 2022-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11544573B2 (en) | Projection neural networks | |
US10929744B2 (en) | Fixed-point training method for deep neural networks based on dynamic fixed-point conversion scheme | |
US20190034796A1 (en) | Fixed-point training method for deep neural networks based on static fixed-point conversion scheme | |
JP3743247B2 (ja) | ニューラルネットワークによる予測装置 | |
Bai et al. | Prediction of SARS epidemic by BP neural networks with online prediction strategy | |
CN107729999A (zh) | 考虑矩阵相关性的深度神经网络压缩方法 | |
JP6055058B1 (ja) | 機械学習器及び組み立て・試験器を備えた生産設備 | |
JP2017037392A (ja) | ニューラルネットワーク学習装置 | |
US20210027147A1 (en) | Forward propagation of secondary objective for deep learning | |
CN113361685B (zh) | 一种基于学习者知识状态演化表示的知识追踪方法及系统 | |
EP3502978A1 (en) | Meta-learning system | |
CN109934330A (zh) | 基于多样化种群的果蝇优化算法来构建预测模型的方法 | |
CN109885667A (zh) | 文本生成方法、装置、计算机设备及介质 | |
JP7180697B2 (ja) | 学習装置、学習方法、及び、プログラム | |
CN111159419A (zh) | 基于图卷积的知识追踪数据处理方法、系统和存储介质 | |
JP2023519770A (ja) | マルチタスク向けの予めトレーニング言語モデルの自動圧縮方法及びプラットフォーム | |
CN114971066A (zh) | 融合遗忘因素和学习能力的知识追踪方法及系统 | |
CN112381591A (zh) | 基于lstm深度学习模型的销售预测优化方法 | |
JP7256378B2 (ja) | 最適化システムおよび最適化システムの制御方法 | |
CN113868113B (zh) | 一种基于Actor-Critic算法的类集成测试序列生成方法 | |
JP2020119108A (ja) | データ処理装置、データ処理方法、データ処理プログラム | |
CN111563548B (zh) | 一种基于强化学习的数据预处理方法、系统及相关设备 | |
US12055934B2 (en) | Machine learning for trajectory planning | |
CN115952838B (zh) | 一种基于自适应学习推荐系统生成方法及系统 | |
US20240086678A1 (en) | Method and information processing apparatus for performing transfer learning while suppressing occurrence of catastrophic forgetting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210716 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7180697 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |