JP2019185359A - 機械学習装置 - Google Patents

機械学習装置 Download PDF

Info

Publication number
JP2019185359A
JP2019185359A JP2018075014A JP2018075014A JP2019185359A JP 2019185359 A JP2019185359 A JP 2019185359A JP 2018075014 A JP2018075014 A JP 2018075014A JP 2018075014 A JP2018075014 A JP 2018075014A JP 2019185359 A JP2019185359 A JP 2019185359A
Authority
JP
Japan
Prior art keywords
learning
machine learning
correlation coefficient
unit
groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018075014A
Other languages
English (en)
Other versions
JP6954219B2 (ja
Inventor
将幸 山崎
Masayuki Yamazaki
将幸 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018075014A priority Critical patent/JP6954219B2/ja
Publication of JP2019185359A publication Critical patent/JP2019185359A/ja
Application granted granted Critical
Publication of JP6954219B2 publication Critical patent/JP6954219B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】学習不全や過学習を好適に検出する。【解決手段】機械学習装置(10)は、学習データを複数のグループに分割する分割手段(110)と、複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段(120)と、複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段(130)と、記憶手段に記憶された学習ループ回数及び残差を用いて、複数の層の各々における残差同士の相関係数を算出する算出手段(140)と、相関係数に基づいて、学習手段における学習度を判定する判定手段(150)とを備える。【選択図】図1

Description

本発明は、複数の学習データを用いて機械学習を実行する機械学習装置の技術分野に関する。
この種の装置として、過学習の発生を検出するものが知られている。例えば特許文献1では、学習用入力サンプル及び評価用入力サンプルを夫々入力した際の出力と、対応する出力サンプルの誤差とを比較することにより、多層パーセプトロンにおける過学習の発生を検出するという技術が開示されている。
特開平06−075935号公報
上述した特許文献1に記載された技術では、学習後の出力に基づいているため、過学習の検出精度が低くなってしまうという技術的問題点がある。また、検出できるのは過学習のみであり、学習不全については検出できないという技術的問題点もある。
本発明は、例えば上記問題点に鑑みてなされたものであり、学習不全や過学習を好適に検出することが可能な機械学習装置を提供することを課題とする。
本発明に係る機械学習装置の一態様では、学習データを複数のグループに分割する分割手段と、前記複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段と、前記複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段と、前記記憶手段に記憶された前記学習ループ回数及び前記残差を用いて、前記複数の層の各々における前記残差同士の相関係数を算出する算出手段と、前記相関係数に基づいて、前記学習手段における学習度を判定する判定手段とを備える。
本実施形態に係る機械学習装置の構成を示すブロック図である。 本実施形態に係る機械学習装置の動作の流れを示すフローチャートである。 中間層における学習パラメータの変動を示すグラフである。 記憶部に記憶される残差の一例を示す表である。 学習ループ回数及び残差に基づいて算出される相関係数の一例を示す表である。 本実施形態に係る機械学習装置による学習度の判定方法を示す表である。
以下、図面を参照して機械学習装置の実施形態について説明する。
<装置構成>
まず、本実施形態に係る機械学習装置の全体構成について、図1を参照して説明する。図1は、本実施形態に係る機械学習装置の構成を示すブロック図である。
図1に示すように、本実施形態に係る機械学習装置10は、入力される複数の学習データを用いて機械学習を行い、その学習結果を出力する構成となっている。機械学習装置10は、その機能を実現するための処理ブロック又は物理的な処理回路として、データ分割部110、学習部120、記憶部130、相関係数算出部140、及び学習度判定部150を備えて構成されている。
データ分割部110は、機械学習装置10に入力される複数の学習データを、複数のグループに分割することが可能に構成されている。なお、複数の学習データを具体的にどのように分割するのかについては特に限定されないが、複数のグループに概ね同じ数の学習データが属するように分割するのが好ましい。データ分割部110において分割された複数グループの学習データは、学習部120に出力される構成となっている。データ分割部110は、後述する付記における「分割手段」の一具体例である。
学習部120は、多層構造のニューラルネットワークを利用したディープラーニングによって機械学習を実行することが可能に構成されている。学習部120は、データ分割部110で分割された複数グループの学習データを用いて、グループごとに機械学習を実行する。学習部120からの出力は、機械学習装置10の学習結果として装置外部に出力される構成となっている。また、学習部120における学習時の学習パラメータ(具体的には、各層における学習ループ回数及び残差)は、記憶部130に出力される構成となっている。学習部120は、後述する付記における「学習手段」の一具体例である。
記憶部130は、学習部120において実行される機械学習の各層における学習ループ回数及び残差を夫々記憶することが可能に構成されている。より具体的には、記憶部130は、複数グループの各々に対応する各層について、学習ループ回数及び残差を別々に記憶することが可能とされている。記憶部130に記憶された学習ループ回数及び残差については、相関係数算出部140によって適宜読み出し可能となっている。記憶部130は、後述する付記における「記憶手段」の一具体例である。
相関係数算出部140は、記憶部130から読み出した学習ループ回数及び残差を用いて、機械学習における各層の残差同士の相関を示す値である相関係数を算出することが可能に構成されている。相関係数算出部140による相関係数の具体的な算出方法については、後に詳述する。相関係数算出部140で算出された相関関数は、学習度判定部150に出力される構成となっている。相関係数算出部140は、後述する付記における「算出手段」の一具体例である。
学習度判定部150は、相関係数算出部140で算出された相関関数に基づいて、学習部120における学習の進行度合いを示す値である学習度(具体的には、過学習や学習不全を判定するためのパラメータ)を判定することが可能に構成されている。学習度判定部150は更に、判定した学習度に応じて、学習部120に対する各種措置(例えば、層追加や層削除)を実行可能に構成されている。学習度判定部150は、後述する付記における「判定手段」の一具体例である。
<動作説明>
次に、本実施形態に係る機械学習装置10の動作の流れについて、図2を参照して説明する。図2は、本実施形態に係る機械学習装置の動作の流れを示すフローチャートである。
図2に示すように、本実施形態に係る機械学習装置10の動作時には、まずデータ分割部110が、学習データを複数のグループに分割する(ステップS101)。続いて、学習部120が、分割された複数グループの学習データを用いて、グループ毎に機械学習を実行する(ステップS102)。なお、学習部120による学習時には、各層における学習パラメータ(即ち、学習ループ回数及び残差)を記憶部130が記憶する。
ここで、ステップS102における学習パラメータの記憶について、図3及び図4を参照して具体的に説明する。図3は、中間層における学習パラメータの変動を示すグラフである。図4は、記憶部に記憶される残差の一例を示す表である。
図3に示すように、学習データがグループA、グループB、及びグループCの3つに分割されているとする。この時、ある層における学習ループ回数と残差との関係は図のように変動する。記憶部130は、このようなグループ毎の学習パラメータの変動の違いを逐次記憶していく。
図4に示すように、学習データのグループをMx(M1〜Mmax)、学習における各層(レイヤ)をLx(L1〜Lmax)、学習ループ回数をIx(I1〜Imax)とすると、記憶部130には、グループMx、レイヤLx、及び学習ループ回数Ix別に、複数の残差Loss(Mx[Lx[Ix]])が記憶される。例えば、図に示すケースでは、グループM1、レイヤL1、学習ループ回数I1の時の残差Lossの値として“1”が記憶されており、グループM1、レイヤL2、学習ループ回数I2の時の残差Lossの値として“0.44”が記憶されている。
図2に戻り、続いて、相関係数算出部140が、記憶部130に記憶された学習ループ回数Ix及び残差Lossを用いて、相関係数Rを算出する(ステップS103)。相関係数Rは、例えば対象となる2つの値の共分散を、2つの値の標準偏差の積で除した値として算出することができる。より具体的には、グループMaとMbとの相関関数R[Lx][a,b]は、学習ループ回数Ixの任意区間における残差の平均値をLoss(Mx[Lx_average_I])とすると、下記式(1)を用いて算出できる。
なお、a:1〜Mmax、b:2〜Mmax、a<b、Lx:1〜Lmax、Ix:Imin〜Imaxである。
ここで、ステップS103において算出される相関関数Rについて、図5を参照して具体的に説明する。図5は、学習ループ回数及び残差に基づいて算出される相関係数の一例を示す表である。
図5に示すように、相関関数Rは、グループMaとMbとの組み合わせに応じて複数算出される。例えば、図に示すケースでは、M1及びM2(即ち、a=1、b=2)の相関関数Rは“0.6”、M2及びM3(即ち、a=2、b=3)の相関関数Rは“0.2”と算出されている。
再び図2に戻り、続いて、学習度判定部150が、相関関数Rの標準偏差Score_div[Lx]を求めて、その値を閾値A及び閾値Bと比較することで学習度を判定する(ステップS104)。なお、閾値Aは学習不全(アンダーフィッティング)を判定するための閾値であり、標準偏差Score_div[Lx]が閾値Aより大きい場合、学習度判定部150は学習不全が生じていると判定する。一方、閾値Bは過学習(オーバーフィッティング)を判定するための閾値であり、標準偏差Score_div[Lx]が閾値Bより小さい場合、学習度判定部150は過学習が生じていると判定する。閾値A及びBは、例えば事前のシミュレーション等によって最適な値を決定すればよい。
ここで、ステップS104における学習度の判定方法について、図6を参照して具体的に説明する。図6は、本実施形態に係る機械学習装置による学習度の判定方法を示す表である。
図6に示すように、閾値Aが“0.3”、閾値Bが“0.2”として設定されているとする。この時、レイヤL1の学習度については、Score_div[L1]が“0.21”として算出されているため、ちょうどよい学習度である(即ち、学習不全も過学習も発生していない状態である)と判定される。レイヤL2の学習度については、Score_div[L1]が“0.2”として算出されているため、同じくちょうどよい学習度であると判定される。レイヤL3の学習度については、Score_div[L3]が“0.4”として算出されているため、学習不全が発生していると判定される。レイヤLmaxの学習度については、Score_div[Lmax]が“0.1”として算出されているため、過学習が発生していると判定される。
再び図2に戻り、学習度判定部150は、学習不全及び過学習を解消するために、判定した学習度に応じた処理を実行する(ステップS105)。具体的には、学習不全が生じている(即ち、標準偏差Score_div[Lx]が閾値Aより大きい)と判定した場合、学習度判定部150は、該当するレイヤLxを削除する処理を実行する。これにより、以降の学習では、学習不全が解消される方向に進む。一方で、過学習が生じている(即ち、標準偏差Score_div[Lx]が閾値Bより小さい)と判定した場合、学習度判定部150は、該当するレイヤLxの前後に新規レイヤを追加する処理を実行する。これにより、以降の学習では、過学習が解消される方向に進む。なお、学習度がちょうどよいと判定された場合には、ステップS105の処理は省略されてよい。
<技術的効果>
次に、本実施形態に係る機械学習装置10によって得られる技術的効果について説明する。
図1から図6を参照して説明したように、本実施形態に係る機械学習装置10によれば、機械学習の各層における学習ループ回数Ix及び残差Lossを用いて算出される相関係数Rに基づいて、学習度が適切なものであるのか、それとも学習不全又は過学習が生じているのかを好適に判定することができる。このように、機械学習装置10は、複数のグループ間で学習パラメータの類似度を解析することで、学習不全及び過学習の発生を容易かつ的確に検出している。よって、学習度の判定結果に応じた処理を実行すれば、学習不全及び過学習を解消することができ、その結果として、より適切な学習結果を得ることが可能となる。既存の学習作業では、学習度を適切に判定することが難しい故に、属人性(作業熟練度)が必要とされてきたが、本実施形態に係る機械学習装置10を用いれば、属人性の必要性をなくし、好適に学習作業を進めることができる。
<付記>
以上説明した実施形態から導き出される発明の各種態様を以下に説明する。
(付記1)
付記1に記載の機械学習装置は、学習データを複数のグループに分割する分割手段と、前記複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段と、前記複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段と、前記記憶手段に記憶された前記学習ループ回数及び前記残差を用いて、前記複数の層の各々における前記残差同士の相関係数を算出する算出手段と、前記相関係数に基づいて、前記学習手段における学習度を判定する判定手段とを備える。
付記1に記載の機械学習装置によれば、学習ループ回数及び残差を用いて算出される相関係数(具体的には、学習における複数の層の各々の残差同士の相関係数)に基づいて、学習度(言い換えれば、学習が適切に進んでいるかを示す度合い)が判定される。本願発明者の研究するところによれば、上記のようにして算出された相関係数を利用すれば、例えば学習結果を利用する場合と比較して、より高い精度で学習度を判定できることが判明している。よって、学習不全や過学習を精度よく検出することが可能である。
本発明は、上述した実施形態に限られるものではなく、請求の範囲及び明細書全体から読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う機械学習装置もまた本発明の技術的範囲に含まれるものである。
10 機械学習装置
110 データ分割部
120 学習部
130 記憶部
140 相関係数算出部
150 学習度判定部

Claims (1)

  1. 学習データを複数のグループに分割する分割手段と、
    前記複数のグループ毎に、複数の層を用いた機械学習を実行する学習手段と、
    前記複数の層の各々における学習ループ回数及び残差を夫々記憶する記憶手段と、
    前記記憶手段に記憶された前記学習ループ回数及び前記残差を用いて、前記複数の層の各々における前記残差同士の相関係数を算出する算出手段と、
    前記相関係数に基づいて、前記学習手段における学習度を判定する判定手段と
    を備えることを特徴とする機械学習装置。
JP2018075014A 2018-04-09 2018-04-09 機械学習装置 Active JP6954219B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018075014A JP6954219B2 (ja) 2018-04-09 2018-04-09 機械学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018075014A JP6954219B2 (ja) 2018-04-09 2018-04-09 機械学習装置

Publications (2)

Publication Number Publication Date
JP2019185359A true JP2019185359A (ja) 2019-10-24
JP6954219B2 JP6954219B2 (ja) 2021-10-27

Family

ID=68341307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018075014A Active JP6954219B2 (ja) 2018-04-09 2018-04-09 機械学習装置

Country Status (1)

Country Link
JP (1) JP6954219B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7441107B2 (ja) 2020-04-21 2024-02-29 日本放送協会 学習装置、代表画像抽出装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002257689A (ja) * 2001-02-28 2002-09-11 Shinobu Yoshimura 自動車用腐食現象予測装置、自動車用腐食現象予測方法、自動車用腐食現象予測プログラム、および自動車用腐食現象予測プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2003058863A (ja) * 2001-08-21 2003-02-28 Bridgestone Corp ニューラルネットワークにおける学習方法
JP2011221840A (ja) * 2010-04-12 2011-11-04 Mega Chips Corp 画像処理装置
US20150134583A1 (en) * 2013-11-14 2015-05-14 Denso Corporation Learning apparatus, learning program, and learning method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002257689A (ja) * 2001-02-28 2002-09-11 Shinobu Yoshimura 自動車用腐食現象予測装置、自動車用腐食現象予測方法、自動車用腐食現象予測プログラム、および自動車用腐食現象予測プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP2003058863A (ja) * 2001-08-21 2003-02-28 Bridgestone Corp ニューラルネットワークにおける学習方法
JP2011221840A (ja) * 2010-04-12 2011-11-04 Mega Chips Corp 画像処理装置
US20150134583A1 (en) * 2013-11-14 2015-05-14 Denso Corporation Learning apparatus, learning program, and learning method
JP2015095215A (ja) * 2013-11-14 2015-05-18 株式会社デンソーアイティーラボラトリ 学習装置、学習プログラム、及び学習方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7441107B2 (ja) 2020-04-21 2024-02-29 日本放送協会 学習装置、代表画像抽出装置及びプログラム

Also Published As

Publication number Publication date
JP6954219B2 (ja) 2021-10-27

Similar Documents

Publication Publication Date Title
CN110378052B (zh) 基于循环神经网络考虑未来工况的设备剩余寿命预测方法
Dulhare et al. Extraction of action rules for chronic kidney disease using Naïve bayes classifier
US10121107B2 (en) Machine learning device and method for optimizing frequency of tool compensation of machine tool, and machine tool having the machine learning device
TWI672599B (zh) 探索裝置及探索方法
CN112640380B (zh) 用于对事件的输入流进行异常检测的设备和方法
US20200150159A1 (en) Anomaly detection device, anomaly detection method, and storage medium
JP2018124937A (ja) 異常検出装置、異常検出方法およびプログラム
Lo et al. Efficient sensor fault detection using combinatorial group testing
KR102320706B1 (ko) 설비 모니터링 시스템의 모델 임계값 설정 방법
KR20200072169A (ko) 머신러닝을 이용한 이상징후 탐지 방법 및 시스템
US11984334B2 (en) Anomaly detection method and system for manufacturing processes
Bashir et al. Enhancing software defect prediction using supervised-learning based framework
US20200395042A1 (en) Learning device, voice activity detector, and method for detecting voice activity
US20190087248A1 (en) Anomaly detection and automated analysis using weighted directed graphs
JP2019185359A (ja) 機械学習装置
JP2015190970A (ja) 計測値解析装置及び計測値解析方法
Song et al. Novel application of deep learning for adaptive testing based on long short-term memory
CN111061581B (zh) 一种故障检测方法、装置及设备
CN111986313A (zh) 回环检测方法及装置、电子设备和存储介质
CN109657452A (zh) 一种移动应用行为动态可信评估方法及装置
Kumar et al. Data analysis and prediction of hepatitis using support vector machine (SVM)
CN116383048A (zh) 软件质量信息处理方法及装置
US20180121794A1 (en) Method and system for machine failure prediction
CN112100919B (zh) 一种基于re-cf-ekf算法的滚动轴承剩余寿命预测方法
KR102320707B1 (ko) 설비 모니터링 시스템의 설비 고장 분류 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210913

R151 Written notification of patent or utility model registration

Ref document number: 6954219

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151