JP2020060838A - 学習方法および学習システム - Google Patents
学習方法および学習システム Download PDFInfo
- Publication number
- JP2020060838A JP2020060838A JP2018189818A JP2018189818A JP2020060838A JP 2020060838 A JP2020060838 A JP 2020060838A JP 2018189818 A JP2018189818 A JP 2018189818A JP 2018189818 A JP2018189818 A JP 2018189818A JP 2020060838 A JP2020060838 A JP 2020060838A
- Authority
- JP
- Japan
- Prior art keywords
- weight
- learning
- discriminator
- mini
- batch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
第1の実施形態は、識別器2を弱識別器として動作させる複数の重みθを用意し、各重みθを固定して(すなわち、更新することなく)特徴抽出器1の重みφの更新を反復することで、特定の識別器2に過度に適合しない、汎用性がある重みφが得られるようにするものである。
まず、予め重みφを初期化しておく。続いて、真値が予め用意された多数の学習データから所定数の学習データをサンプリングしてミニバッチを作成する(ステップS100)。
学習データ記憶部11は複数の学習データ(入力xとその真値tとの組)を予め多数記憶している。
これらの適用により、単一のデータセットへの過適合を抑制できる。
次に説明する第2の実施形態は第1の実施形態の変形例である。具体的には、図6のステップS5cにおけるコスト関数Lの平均値である損失関数Jに代えて、コスト関数Lの重みφに対する勾配dL/dφの平均値である勾配平均値EdL/dφを算出する。そして、複数の重みθ1〜θk(すなわちk個の弱識別器)における勾配平均値EdL/dφの平均値EEdL/dφを用いて重みφを更新する。以下、具体的に説明する。
上述した第1および第2の実施形態は、識別器2の重みθを固定して、特徴抽出器1の重みφを更新するものであった。これに対し、以下に説明する第3の実施形態は、重みθ,φを同時に更新しつつも、特定の識別器2に過度に適合しないようにするものである。
以下の第4および第5の実施形態では、上述した学習手法の応用例を示す。まずは、「転移学習」への応用を説明する。
続いて、マルチタスク学習への応用について説明する。ここでのマルチタスクとは、図15に示すように、1つの特徴抽出器1が、互いに識別タスクが異なる複数の識別器2(図15では2つの識別器2a,2bを描いている)に接続される構成を指し、1つのネットワークでありながら複数の識別タスクを解くものである。
2,2a,2b 識別器
3 畳み込み層
4 全結合層
11,11a,11b 学習データ記憶部
12,12a,12b ミニバッチ作成部
13,13a,13b,200 重み設定部
100,101,10k 学習システム
Claims (19)
- 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みを学習する方法であって、
前記識別器が弱識別器として動作するよう前記第2の重みを設定する第1ステップと、
前記設定された前記第2の重みを固定して前記第1の重みを更新する第2ステップと、を備える、学習方法。 - 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みを学習する方法であって、
前記第1の重みを固定して前記第2の重みを更新することにより前記第2の重みを設定する第1ステップと、
前記設定された前記第2の重みを固定して前記第1の重みを更新する第2ステップと、を備える、学習方法。 - 前記第1ステップでは、前記識別器が弱識別器として動作するよう前記第2の重みを設定する、請求項2に記載の学習方法。
- 反復ごとに初期化
前記第2ステップは、複数の学習データを含むミニバッチを用いて行われ、
特定のミニバッチを用いて前記第2ステップを行った後、
前回の前記第2ステップで固定されていた前記第2の重みを用いることなく、新たに前記第2の重みを設定する前記第1ステップを行い、さらに、
別のミニバッチを用いて前記第2ステップを行うことを反復する、請求項1乃至3のいずれかに記載の学習方法。 - 前記第2ステップは、複数の学習データを含むミニバッチを用いて行われ、
用いるミニバッチを変えながら前記第2ステップを複数回反復した後、
前回の前記第2ステップで固定されていた前記第2の重みを用いることなく、新たに前記第2の重みを設定する前記第1ステップを行い、さらに、
別のミニバッチを用いて前記第2ステップを行うことを反復する、請求項1乃至3のいずれかに記載の学習方法。 - ある反復では、第1タスク用のデータセットからサンプリングされたミニバッチが用いられ、
別のある反復では、前記第1タスクとは異なる第2タスク用のデータセットからサンプリングされたミニバッチが用いられる、請求項4または5に記載の学習方法。 - 1回の反復において、第1タスク用のデータセットからサンプリングされたミニバッチと、前記第1タスクとは異なる第2タスク用のデータセットからサンプリングされたミニバッチと、が用いられる、請求項4または5に記載の学習方法。
- 前記第1ステップでは、複数とおりの前記第2の重みを設定し、
前記第2ステップは、複数とおりの前記第2の重みについての平均値に基づく目的関数を利用して前記第1の重みを更新する、請求項1乃至7のいずれかに記載の学習方法。 - 前記第1ステップでは、複数とおりの前記第2の重みを設定し、
前記第2ステップでは、
複数の学習用の入力のそれぞれに対して、前記第1の重みおよび前記複数のとおりの前記第2の重みをそれぞれ適用して、複数の出力を生成し、
前記複数の出力のそれぞれと、各入力と対応する真値と、がどの程度離れているかを示すコスト関数を算出し、
前記コスト関数の前記複数の学習用の入力についての第1平均値を算出し、
前記第1平均値の前記複数とおりの前記第2の重みについての第2平均値を算出し、
前記第2平均値に基づく目的関数が小さくなるよう前記第1の重みを更新する、請求項1乃至8のいずれかに記載の学習方法。 - 前記第1ステップでは、複数とおりの前記第2の重みを設定し、
前記第2ステップでは、
複数の学習用の入力のそれぞれに対して、前記第1の重みおよび前記複数のとおりの前記第2の重みをそれぞれ適用して、複数の出力を生成し、
前記複数の出力のそれぞれと、各入力と対応する真値と、がどの程度離れているかを示すコスト関数を算出し、
前記コスト関数の前記第1の重みに対する勾配を算出し、
前記勾配の前記複数の学習用の入力についての第1平均値を算出し、
前記第1平均値の前記複数とおりの前記第2の重みについての第2平均値を算出し、
前記第2平均値に基づく目的関数が小さくなるよう前記第1の重みを更新する、請求項1乃至8のいずれかに記載の学習方法。 - 複数のノードのそれぞれが、前記特徴抽出器および前記識別器を有し、
前記第1ステップにおいて、各ノードが互いに異なる前記第2の重みを設定し、
前記第2ステップにおいて、
各ノードが、
複数の学習用の入力のそれぞれに対して、前記第1の重みおよび前記第2の重みを適用して、複数の出力を生成し、
前記複数の出力のそれぞれと、各入力と対応する真値と、がどの程度離れているかを示すコスト関数を算出し、
前記コスト関数の前記第1の重みに対する勾配を算出し、
前記勾配の前記複数の学習用の入力についての第1平均値を算出し、
各ノードから前記第1平均値を受信して足し合わせた結果を用いて、前記第1の重みを更新する、請求項10に記載の学習方法。 - 前記第1ステップでは、前記第2の重みを乱数で初期化し、次いで、
前記初期化された前記第2の重みを所定回更新することにより、
前記識別器が弱識別器として動作するよう前記初期化された前記第2の重みを更新することにより、または、
識別力の評価指標が所定範囲内になるよう前記初期化された前記第2の重みを更新することにより、
前記第2の重みを設定する、請求項1乃至11のいずれかに記載の学習方法。 - 前記第1ステップでは、
前記第2の重みを乱数で初期化し、
特定のミニバッチに含まれる複数の学習データの少なくとも一部の真値を変更し、
真値が変更された学習データを含む前記複数の学習データを用いて、前記第2の重みを設定する、請求項1ないし11のいずれかに記載の学習方法。 - 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みを学習する方法であって、
前記第2の重みを初期化する第1ステップと、
1回の更新において、前記第1の重みおよび前記第2の重みの両方を更新する処理を1または複数回行う第2ステップと、を備え、
前記第1ステップおよび前記第2ステップを反復して行う、学習方法。 - 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みおよび第2の重みを学習する方法であって、
第1ドメインでの第1学習データを用いて、請求項1乃至14のいずれかに記載の学習方法により前記第1の重みを学習するステップと、その後に、
得られた前記第1の重みを固定して、前記第1ドメインとは異なる第2ドメインでの第2学習データを用いて前記第2の重みを初期値から更新するステップと、を備える、学習方法。 - 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みおよび第2の重みを学習する方法であって、
所定ドメインでの学習データを用いて、請求項1乃至14のいずれかに記載の学習方法により前記第1の重みを学習するステップと、その後に、
得られた前記第1の重みを固定して、前記所定ドメインでの学習データを用いて前記第2の重みを初期値から更新するステップと、を備える、学習方法。 - 第1の重みによって規定される特徴抽出器と、それぞれが第2の重みによって規定される2以上の識別器と、を有するニューラルネットワークにおける前記第1の重みおよび第2の重みを学習する方法であって、
前記2以上の識別器は、1つの前記特徴抽出器からの特徴量を用いて識別を行うが、識別タスクは互いに異なっており、
所定の学習データを用いて、請求項1乃至14のいずれかに記載の学習方法により前記第1の重みを学習するステップと、その後に、
得られた前記第1の重みを固定して、各識別タスクに応じた学習データを用いて各識別器における前記第2の重みを初期値から更新するステップと、を備える、学習方法。 - 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みを学習するシステムであって、
前記識別器が弱識別器として動作するよう前記第2の重みを設定し、前記設定された前記第2の重みを固定して前記第1の重みを更新する重み設定部を備える学習システム。 - 第1の重みによって規定される特徴抽出器と、第2の重みによって規定される識別器と、を有するニューラルネットワークにおける前記第1の重みを学習するシステムであって、
前記第1の重みを固定して前記第2の重みを更新することにより前記第2の重みを設定し、前記設定された前記第2の重みを固定して前記第1の重みを更新する重み設定部を備える学習システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018189818A JP7208758B2 (ja) | 2018-10-05 | 2018-10-05 | 学習方法および学習システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018189818A JP7208758B2 (ja) | 2018-10-05 | 2018-10-05 | 学習方法および学習システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020060838A true JP2020060838A (ja) | 2020-04-16 |
JP7208758B2 JP7208758B2 (ja) | 2023-01-19 |
Family
ID=70219859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018189818A Active JP7208758B2 (ja) | 2018-10-05 | 2018-10-05 | 学習方法および学習システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7208758B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022196227A1 (ja) * | 2021-03-18 | 2022-09-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理システム、および、プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08297495A (ja) * | 1995-04-26 | 1996-11-12 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 信号パターン認識装置の学習方法及び学習装置 |
JP2016197389A (ja) * | 2015-04-03 | 2016-11-24 | 株式会社デンソーアイティーラボラトリ | 学習システム、学習プログラムおよび学習方法 |
JP2017129990A (ja) * | 2016-01-19 | 2017-07-27 | 国立大学法人豊橋技術科学大学 | 画像認識装置、画像認識方法、及び画像認識プログラム |
WO2018047225A1 (ja) * | 2016-09-06 | 2018-03-15 | 三菱電機株式会社 | 学習装置、信号処理装置および学習方法 |
JP2018106489A (ja) * | 2016-12-27 | 2018-07-05 | 株式会社デンソーアイティーラボラトリ | 学習システムおよび学習方法 |
JP2018128897A (ja) * | 2017-02-09 | 2018-08-16 | 国立大学法人名古屋大学 | 対象物の姿勢等を検出する検出方法、検出プログラム |
-
2018
- 2018-10-05 JP JP2018189818A patent/JP7208758B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08297495A (ja) * | 1995-04-26 | 1996-11-12 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 信号パターン認識装置の学習方法及び学習装置 |
JP2016197389A (ja) * | 2015-04-03 | 2016-11-24 | 株式会社デンソーアイティーラボラトリ | 学習システム、学習プログラムおよび学習方法 |
JP2017129990A (ja) * | 2016-01-19 | 2017-07-27 | 国立大学法人豊橋技術科学大学 | 画像認識装置、画像認識方法、及び画像認識プログラム |
WO2018047225A1 (ja) * | 2016-09-06 | 2018-03-15 | 三菱電機株式会社 | 学習装置、信号処理装置および学習方法 |
JP2018106489A (ja) * | 2016-12-27 | 2018-07-05 | 株式会社デンソーアイティーラボラトリ | 学習システムおよび学習方法 |
JP2018128897A (ja) * | 2017-02-09 | 2018-08-16 | 国立大学法人名古屋大学 | 対象物の姿勢等を検出する検出方法、検出プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022196227A1 (ja) * | 2021-03-18 | 2022-09-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理システム、および、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7208758B2 (ja) | 2023-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110084296B (zh) | 一种基于特定语义的图表示学习框架及其多标签分类方法 | |
CN107506761B (zh) | 基于显著性学习卷积神经网络的脑部图像分割方法及系统 | |
CN110852447B (zh) | 元学习方法和装置、初始化方法、计算设备和存储介质 | |
CN109754078A (zh) | 用于优化神经网络的方法 | |
CN112598643B (zh) | 深度伪造图像检测及模型训练方法、装置、设备、介质 | |
CN108427921A (zh) | 一种基于卷积神经网络的人脸识别方法 | |
Brakel et al. | Training energy-based models for time-series imputation | |
CN110874590B (zh) | 基于适配器互学习模型的训练及可见光红外视觉跟踪方法 | |
CN105930834A (zh) | 基于球哈希二值编码的人脸识别方法及装置 | |
CN109034186B (zh) | 基于da-rbm分类器模型的手写数据识别方法 | |
Yin et al. | Sparse representation over discriminative dictionary for stereo matching | |
Liu et al. | Bi-level probabilistic feature learning for deformable image registration | |
CN114444600A (zh) | 基于记忆增强原型网络的小样本图像分类方法 | |
CN111739017A (zh) | 一种在样本不平衡条件下显微图像的细胞识别方法及系统 | |
CN105809200B (zh) | 一种生物启发式自主抽取图像语义信息的方法及装置 | |
CN110163206B (zh) | 车牌识别方法、系统、存储介质和装置 | |
JP2019067299A (ja) | ラベル推定装置及びラベル推定プログラム | |
CN112364881A (zh) | 一种进阶采样一致性图像匹配算法 | |
CN105630739A (zh) | 用于执行随机梯度下降的装置和方法 | |
JP2020060838A (ja) | 学習方法および学習システム | |
CN111241326B (zh) | 基于注意力金字塔图网络的图像视觉关系指代定位方法 | |
CN112509017A (zh) | 一种基于可学习差分算法的遥感影像变化检测方法 | |
CN112529057A (zh) | 一种基于图卷积网络的图相似性计算方法及装置 | |
Karlupia et al. | A genetic algorithm based optimized convolutional neural network for face recognition | |
Padhy et al. | Image classification in artificial neural network using fractal dimension |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210727 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220712 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7208758 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |