JP6954219B2 - Machine learning device - Google Patents
Machine learning device Download PDFInfo
- Publication number
- JP6954219B2 JP6954219B2 JP2018075014A JP2018075014A JP6954219B2 JP 6954219 B2 JP6954219 B2 JP 6954219B2 JP 2018075014 A JP2018075014 A JP 2018075014A JP 2018075014 A JP2018075014 A JP 2018075014A JP 6954219 B2 JP6954219 B2 JP 6954219B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- machine learning
- unit
- degree
- correlation coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Testing And Monitoring For Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、複数の学習データを用いて機械学習を実行する機械学習装置の技術分野に関する。 The present invention relates to a technical field of a machine learning device that executes machine learning using a plurality of learning data.
この種の装置として、過学習の発生を検出するものが知られている。例えば特許文献1では、学習用入力サンプル及び評価用入力サンプルを夫々入力した際の出力と、対応する出力サンプルの誤差とを比較することにより、多層パーセプトロンにおける過学習の発生を検出するという技術が開示されている。
As a device of this type, a device that detects the occurrence of overfitting is known. For example, in
上述した特許文献1に記載された技術では、学習後の出力に基づいているため、過学習の検出精度が低くなってしまうという技術的問題点がある。また、検出できるのは過学習のみであり、学習不全については検出できないという技術的問題点もある。
Since the technique described in
本発明は、例えば上記問題点に鑑みてなされたものであり、学習不全や過学習を好適に検出することが可能な機械学習装置を提供することを課題とする。 The present invention has been made in view of the above problems, for example, and an object of the present invention is to provide a machine learning device capable of suitably detecting learning failure and overfitting.
本発明に係る機械学習装置の一態様では、学習データを複数のグループに分割する分割手段と、前記複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段と、前記複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段と、前記記憶手段に記憶された前記学習ループ回数及び前記残差を用いて、前記複数の層の各々における前記残差同士の相関係数を算出する算出手段と、前記相関係数に基づいて、前記学習手段における学習度を判定する判定手段とを備える。 In one aspect of the machine learning device according to the present invention, a dividing means for dividing learning data into a plurality of groups, a learning means for executing machine learning using a plurality of layers for each of the plurality of groups, and the plurality of learning means. Using the storage means for storing the number of learning loops and the residuals in each of the layers, and the number of learning loops and the residuals stored in the storage means, the phases of the residuals in each of the plurality of layers. A calculation means for calculating the number of relationships and a determination means for determining the learning degree in the learning means based on the correlation coefficient are provided.
以下、図面を参照して機械学習装置の実施形態について説明する。 Hereinafter, embodiments of the machine learning device will be described with reference to the drawings.
<装置構成>
まず、本実施形態に係る機械学習装置の全体構成について、図1を参照して説明する。図1は、本実施形態に係る機械学習装置の構成を示すブロック図である。
<Device configuration>
First, the overall configuration of the machine learning device according to the present embodiment will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of a machine learning device according to the present embodiment.
図1に示すように、本実施形態に係る機械学習装置10は、入力される複数の学習データを用いて機械学習を行い、その学習結果を出力する構成となっている。機械学習装置10は、その機能を実現するための処理ブロック又は物理的な処理回路として、データ分割部110、学習部120、記憶部130、相関係数算出部140、及び学習度判定部150を備えて構成されている。
As shown in FIG. 1, the
データ分割部110は、機械学習装置10に入力される複数の学習データを、複数のグループに分割することが可能に構成されている。なお、複数の学習データを具体的にどのように分割するのかについては特に限定されないが、複数のグループに概ね同じ数の学習データが属するように分割するのが好ましい。データ分割部110において分割された複数グループの学習データは、学習部120に出力される構成となっている。データ分割部110は、後述する付記における「分割手段」の一具体例である。
The
学習部120は、多層構造のニューラルネットワークを利用したディープラーニングによって機械学習を実行することが可能に構成されている。学習部120は、データ分割部110で分割された複数グループの学習データを用いて、グループごとに機械学習を実行する。学習部120からの出力は、機械学習装置10の学習結果として装置外部に出力される構成となっている。また、学習部120における学習時の学習パラメータ(具体的には、各層における学習ループ回数及び残差)は、記憶部130に出力される構成となっている。学習部120は、後述する付記における「学習手段」の一具体例である。
The
記憶部130は、学習部120において実行される機械学習の各層における学習ループ回数及び残差を夫々記憶することが可能に構成されている。より具体的には、記憶部130は、複数グループの各々に対応する各層について、学習ループ回数及び残差を別々に記憶することが可能とされている。記憶部130に記憶された学習ループ回数及び残差については、相関係数算出部140によって適宜読み出し可能となっている。記憶部130は、後述する付記における「記憶手段」の一具体例である。
The
相関係数算出部140は、記憶部130から読み出した学習ループ回数及び残差を用いて、機械学習における各層の残差同士の相関を示す値である相関係数を算出することが可能に構成されている。相関係数算出部140による相関係数の具体的な算出方法については、後に詳述する。相関係数算出部140で算出された相関関数は、学習度判定部150に出力される構成となっている。相関係数算出部140は、後述する付記における「算出手段」の一具体例である。
The correlation
学習度判定部150は、相関係数算出部140で算出された相関関数に基づいて、学習部120における学習の進行度合いを示す値である学習度(具体的には、過学習や学習不全を判定するためのパラメータ)を判定することが可能に構成されている。学習度判定部150は更に、判定した学習度に応じて、学習部120に対する各種措置(例えば、層追加や層削除)を実行可能に構成されている。学習度判定部150は、後述する付記における「判定手段」の一具体例である。
The learning
<動作説明>
次に、本実施形態に係る機械学習装置10の動作の流れについて、図2を参照して説明する。図2は、本実施形態に係る機械学習装置の動作の流れを示すフローチャートである。
<Operation explanation>
Next, the operation flow of the
図2に示すように、本実施形態に係る機械学習装置10の動作時には、まずデータ分割部110が、学習データを複数のグループに分割する(ステップS101)。続いて、学習部120が、分割された複数グループの学習データを用いて、グループ毎に機械学習を実行する(ステップS102)。なお、学習部120による学習時には、各層における学習パラメータ(即ち、学習ループ回数及び残差)を記憶部130が記憶する。
As shown in FIG. 2, when the
ここで、ステップS102における学習パラメータの記憶について、図3及び図4を参照して具体的に説明する。図3は、中間層における学習パラメータの変動を示すグラフである。図4は、記憶部に記憶される残差の一例を示す表である。 Here, the storage of the learning parameters in step S102 will be specifically described with reference to FIGS. 3 and 4. FIG. 3 is a graph showing fluctuations in learning parameters in the intermediate layer. FIG. 4 is a table showing an example of the residuals stored in the storage unit.
図3に示すように、学習データがグループA、グループB、及びグループCの3つに分割されているとする。この時、ある層における学習ループ回数と残差との関係は図のように変動する。記憶部130は、このようなグループ毎の学習パラメータの変動の違いを逐次記憶していく。
As shown in FIG. 3, it is assumed that the learning data is divided into three groups, Group A, Group B, and Group C. At this time, the relationship between the number of learning loops and the residual in a certain layer fluctuates as shown in the figure. The
図4に示すように、学習データのグループをMx(M1〜Mmax)、学習における各層(レイヤ)をLx(L1〜Lmax)、学習ループ回数をIx(I1〜Imax)とすると、記憶部130には、グループMx、レイヤLx、及び学習ループ回数Ix別に、複数の残差Loss(Mx[Lx[Ix]])が記憶される。例えば、図に示すケースでは、グループM1、レイヤL1、学習ループ回数I1の時の残差Lossの値として“1”が記憶されており、グループM1、レイヤL2、学習ループ回数I2の時の残差Lossの値として“0.44”が記憶されている。
As shown in FIG. 4, assuming that the group of learning data is Mx (M1 to Mmax), each layer in learning is Lx (L1 to Lmax), and the number of learning loops is Ix (I1 to Imax), the
図2に戻り、続いて、相関係数算出部140が、記憶部130に記憶された学習ループ回数Ix及び残差Lossを用いて、相関係数Rを算出する(ステップS103)。相関係数Rは、例えば対象となる2つの値の共分散を、2つの値の標準偏差の積で除した値として算出することができる。より具体的には、グループMaとMbとの相関関数R[Lx][a,b]は、学習ループ回数Ixの任意区間における残差の平均値をLoss(Mx[Lx_average_I])とすると、下記式(1)を用いて算出できる。
ここで、ステップS103において算出される相関関数Rについて、図5を参照して具体的に説明する。図5は、学習ループ回数及び残差に基づいて算出される相関係数の一例を示す表である。 Here, the correlation function R calculated in step S103 will be specifically described with reference to FIG. FIG. 5 is a table showing an example of the correlation coefficient calculated based on the number of learning loops and the residuals.
図5に示すように、相関関数Rは、グループMaとMbとの組み合わせに応じて複数算出される。例えば、図に示すケースでは、M1及びM2(即ち、a=1、b=2)の相関関数Rは“0.6”、M2及びM3(即ち、a=2、b=3)の相関関数Rは“0.2”と算出されている。 As shown in FIG. 5, a plurality of correlation functions R are calculated according to the combination of the groups Ma and Mb. For example, in the case shown in the figure, the correlation function R of M1 and M2 (that is, a = 1, b = 2) is "0.6", and the correlation function of M2 and M3 (that is, a = 2, b = 3). R is calculated as "0.2".
再び図2に戻り、続いて、学習度判定部150が、相関関数Rの標準偏差Score_div[Lx]を求めて、その値を閾値A及び閾値Bと比較することで学習度を判定する(ステップS104)。なお、閾値Aは学習不全(アンダーフィッティング)を判定するための閾値であり、標準偏差Score_div[Lx]が閾値Aより大きい場合、学習度判定部150は学習不全が生じていると判定する。一方、閾値Bは過学習(オーバーフィッティング)を判定するための閾値であり、標準偏差Score_div[Lx]が閾値Bより小さい場合、学習度判定部150は過学習が生じていると判定する。閾値A及びBは、例えば事前のシミュレーション等によって最適な値を決定すればよい。
Returning to FIG. 2 again, the learning
ここで、ステップS104における学習度の判定方法について、図6を参照して具体的に説明する。図6は、本実施形態に係る機械学習装置による学習度の判定方法を示す表である。 Here, the method of determining the learning degree in step S104 will be specifically described with reference to FIG. FIG. 6 is a table showing a method of determining the learning degree by the machine learning device according to the present embodiment.
図6に示すように、閾値Aが“0.3”、閾値Bが“0.2”として設定されているとする。この時、レイヤL1の学習度については、Score_div[L1]が“0.21”として算出されているため、ちょうどよい学習度である(即ち、学習不全も過学習も発生していない状態である)と判定される。レイヤL2の学習度については、Score_div[L1]が“0.2”として算出されているため、同じくちょうどよい学習度であると判定される。レイヤL3の学習度については、Score_div[L3]が“0.4”として算出されているため、学習不全が発生していると判定される。レイヤLmaxの学習度については、Score_div[Lmax]が“0.1”として算出されているため、過学習が発生していると判定される。 As shown in FIG. 6, it is assumed that the threshold value A is set as “0.3” and the threshold value B is set as “0.2”. At this time, the learning degree of the layer L1 is calculated as “0.21” for Score_div [L1], so that the learning degree is just right (that is, neither learning failure nor overfitting has occurred). ) Is determined. As for the learning degree of the layer L2, since Score_div [L1] is calculated as “0.2”, it is also determined that the learning degree is just right. Regarding the learning degree of layer L3, since Score_div [L3] is calculated as “0.4”, it is determined that learning failure has occurred. Regarding the learning degree of the layer Lmax, since Score_div [Lmax] is calculated as “0.1”, it is determined that overfitting has occurred.
再び図2に戻り、学習度判定部150は、学習不全及び過学習を解消するために、判定した学習度に応じた処理を実行する(ステップS105)。具体的には、学習不全が生じている(即ち、標準偏差Score_div[Lx]が閾値Aより大きい)と判定した場合、学習度判定部150は、該当するレイヤLxを削除する処理を実行する。これにより、以降の学習では、学習不全が解消される方向に進む。一方で、過学習が生じている(即ち、標準偏差Score_div[Lx]が閾値Bより小さい)と判定した場合、学習度判定部150は、該当するレイヤLxの前後に新規レイヤを追加する処理を実行する。これにより、以降の学習では、過学習が解消される方向に進む。なお、学習度がちょうどよいと判定された場合には、ステップS105の処理は省略されてよい。
Returning to FIG. 2 again, the learning
<技術的効果>
次に、本実施形態に係る機械学習装置10によって得られる技術的効果について説明する。
<Technical effect>
Next, the technical effect obtained by the
図1から図6を参照して説明したように、本実施形態に係る機械学習装置10によれば、機械学習の各層における学習ループ回数Ix及び残差Lossを用いて算出される相関係数Rに基づいて、学習度が適切なものであるのか、それとも学習不全又は過学習が生じているのかを好適に判定することができる。このように、機械学習装置10は、複数のグループ間で学習パラメータの類似度を解析することで、学習不全及び過学習の発生を容易かつ的確に検出している。よって、学習度の判定結果に応じた処理を実行すれば、学習不全及び過学習を解消することができ、その結果として、より適切な学習結果を得ることが可能となる。既存の学習作業では、学習度を適切に判定することが難しい故に、属人性(作業熟練度)が必要とされてきたが、本実施形態に係る機械学習装置10を用いれば、属人性の必要性をなくし、好適に学習作業を進めることができる。
As described with reference to FIGS. 1 to 6, according to the
<付記>
以上説明した実施形態から導き出される発明の各種態様を以下に説明する。
<Additional notes>
Various aspects of the invention derived from the embodiments described above will be described below.
(付記1)
付記1に記載の機械学習装置は、学習データを複数のグループに分割する分割手段と、前記複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段と、前記複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段と、前記記憶手段に記憶された前記学習ループ回数及び前記残差を用いて、前記複数の層の各々における前記残差同士の相関係数を算出する算出手段と、前記相関係数に基づいて、前記学習手段における学習度を判定する判定手段とを備える。
(Appendix 1)
The machine learning device according to
付記1に記載の機械学習装置によれば、学習ループ回数及び残差を用いて算出される相関係数(具体的には、学習における複数の層の各々の残差同士の相関係数)に基づいて、学習度(言い換えれば、学習が適切に進んでいるかを示す度合い)が判定される。本願発明者の研究するところによれば、上記のようにして算出された相関係数を利用すれば、例えば学習結果を利用する場合と比較して、より高い精度で学習度を判定できることが判明している。よって、学習不全や過学習を精度よく検出することが可能である。
According to the machine learning device described in
本発明は、上述した実施形態に限られるものではなく、請求の範囲及び明細書全体から読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う機械学習装置もまた本発明の技術的範囲に含まれるものである。 The present invention is not limited to the above-described embodiment, and can be appropriately modified within the scope of claims and within a range not contrary to the gist or idea of the invention that can be read from the entire specification. It is also included in the technical scope of the present invention.
10 機械学習装置
110 データ分割部
120 学習部
130 記憶部
140 相関係数算出部
150 学習度判定部
10
Claims (1)
前記複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段と、
前記複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段と、
前記記憶手段に記憶された前記学習ループ回数及び前記残差を用いて、前記複数の層の各々における前記残差同士の相関係数を算出する算出手段と、
前記相関係数に基づいて、前記学習手段における学習度を判定する判定手段と
を備えることを特徴とする機械学習装置。 A division means for dividing the training data into multiple groups,
A learning means for executing machine learning using a plurality of layers for each of the plurality of groups,
A storage means for storing the number of learning loops and the residuals in each of the plurality of layers, respectively.
Using the number of learning loops and the residuals stored in the storage means, a calculation means for calculating the correlation coefficient between the residuals in each of the plurality of layers, and a calculation means.
A machine learning device including a determination means for determining a learning degree in the learning means based on the correlation coefficient.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018075014A JP6954219B2 (en) | 2018-04-09 | 2018-04-09 | Machine learning device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018075014A JP6954219B2 (en) | 2018-04-09 | 2018-04-09 | Machine learning device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019185359A JP2019185359A (en) | 2019-10-24 |
JP6954219B2 true JP6954219B2 (en) | 2021-10-27 |
Family
ID=68341307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018075014A Active JP6954219B2 (en) | 2018-04-09 | 2018-04-09 | Machine learning device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6954219B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7441107B2 (en) | 2020-04-21 | 2024-02-29 | 日本放送協会 | Learning device, representative image extraction device and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002257689A (en) * | 2001-02-28 | 2002-09-11 | Shinobu Yoshimura | System for predicting corrosion phenomenon in vehicle, method used for the same, program used for the same, and computer-readable recording medium with program for the same stored therein |
JP2003058863A (en) * | 2001-08-21 | 2003-02-28 | Bridgestone Corp | Learning method for neural network |
JP5513960B2 (en) * | 2010-04-12 | 2014-06-04 | 株式会社メガチップス | Image processing device |
JP6236296B2 (en) * | 2013-11-14 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | Learning device, learning program, and learning method |
-
2018
- 2018-04-09 JP JP2018075014A patent/JP6954219B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019185359A (en) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dulhare et al. | Extraction of action rules for chronic kidney disease using Naïve bayes classifier | |
JP6137938B2 (en) | Method for detecting anomalies in time series data | |
EP3358508A1 (en) | Abnormality detection apparatus, abnormality detection method, and program | |
US20050149297A1 (en) | Principal component analysis based fault classification | |
TWI634443B (en) | Methods and systems for selection and use of representative target subsets | |
US20050141782A1 (en) | Principal component analysis based fault classification | |
JP2006527488A5 (en) | ||
US10699969B2 (en) | Quick adjustment of metrology measurement parameters according to process variation | |
JPWO2013105164A1 (en) | Abnormal signal determination device, abnormal signal determination method, and abnormal signal determination program | |
CN105930257B (en) | A kind of method and device of determining target detection use-case | |
US10496056B2 (en) | Measured value analysis apparatus and measured value analysis method | |
EP3629019A3 (en) | Blood coagulation analyzing method, blood coagulation analyzing apparatus, and non-transitory comupter-readable storage medium | |
JP6954219B2 (en) | Machine learning device | |
KR102425936B1 (en) | Device diagnostic device, plasma processing device and device diagnostic method | |
CN115526641A (en) | Flexible board product production quality tracing method, system, device and storage medium | |
JP2009288854A (en) | Damage probability calculating apparatus, damage probability calculating method, maintenance method and damage probability calculating program | |
JP2018180799A5 (en) | ||
KR20110114191A (en) | Minutia structure based matching algorithm | |
JP7047283B2 (en) | Information processing equipment, methods, and programs | |
JP6728830B2 (en) | Information processing device, information processing method, and program | |
JP2015085437A (en) | Determination device, determination method, and determination program | |
US20180121794A1 (en) | Method and system for machine failure prediction | |
JP2019200650A5 (en) | ||
KR20110056046A (en) | Method for evaluating performance of tire | |
KR101562623B1 (en) | Apparatus and method for fault detection in semiconductor manufacturing process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210728 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210913 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6954219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |