JP2020204909A - 機械学習装置 - Google Patents

機械学習装置 Download PDF

Info

Publication number
JP2020204909A
JP2020204909A JP2019112260A JP2019112260A JP2020204909A JP 2020204909 A JP2020204909 A JP 2020204909A JP 2019112260 A JP2019112260 A JP 2019112260A JP 2019112260 A JP2019112260 A JP 2019112260A JP 2020204909 A JP2020204909 A JP 2020204909A
Authority
JP
Japan
Prior art keywords
likelihood
class
machine learning
weight
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019112260A
Other languages
English (en)
Inventor
嘉人 小久保
Yoshihito Kokubo
嘉人 小久保
恵久 末次
Shigehisa Suetsugu
恵久 末次
足立 淳
Atsushi Adachi
淳 足立
康貴 上田
Koki Ueda
康貴 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin Corp
Original Assignee
Aisin Seiki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin Seiki Co Ltd filed Critical Aisin Seiki Co Ltd
Priority to JP2019112260A priority Critical patent/JP2020204909A/ja
Priority to US16/896,770 priority patent/US20200394563A1/en
Priority to CN202010553059.9A priority patent/CN112101513A/zh
Publication of JP2020204909A publication Critical patent/JP2020204909A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Image Analysis (AREA)

Abstract

【課題】学習モデルのフィードバック効率を向上させる。【解決手段】実施形態の機械学習装置は、学習モデルに基づいて、学習用のデータに含まれている要素について、要素を分類する複数のクラス毎に、当該クラスに分類される確からしさを示した尤度を推定する推定部と、推定部によって推定されたクラス毎の尤度と、所定の損失関数と、に基づいて、尤度の誤りの度合いを示した損失値を算出する損失値算出部と、クラス毎に算出された尤度のうち、要素が真として分類されるべき第1クラスの第1の尤度と、要素が真として分類されるべきではない他のクラスの第2の尤度と、の比較結果に基づいて重みを算出する重み算出部と、損失値と、重みと、に基づいて、学習モデルを機械学習させる機械学習部と、を備える。【選択図】図2

Description

本発明の実施形態は、機械学習装置に関する。
従来から、機械学習で生成された学習モデルを用いて、データに含まれている要素を分類する技術が提案されている。
そして、学習モデルを用いた分類結果に対して、損失関数を用いて損失値を計算し、当該損失値を用いて学習モデルの学習を行う技術が提案されている。近年、損失値の計算手法は、技術の発展とともに複雑化する傾向にある。特許文献1に記載された従来技術においては、各クラス毎の真値と推定値の尤度を比較して損失値を算出し、フィードバック効率を向上させる技術が提案されている。
特開2015−1968号公報
しかしながら、従来技術においては、推定値のうち最も尤度が高いクラスと、それ以外のクラスとの関係性が考慮されておらず、当該関係性を用いたフィードバック効率の向上にさらなる改善の余地が残されていた。
実施形態の機械学習装置は、例えば、学習モデルに基づいて、学習用のデータに含まれている要素について、要素を分類する複数のクラス毎に、当該クラスに分類される確からしさを示した尤度を推定する推定部と、推定部によって推定されたクラス毎の尤度と、所定の損失関数と、に基づいて、尤度の誤りの度合いを示した損失値を算出する損失値算出部と、クラス毎に算出された尤度のうち、要素が真として分類されるべき第1クラスの第1の尤度と、要素が真として分類されるべきではない他のクラスの第2の尤度と、の比較結果に基づいて重みを算出する重み算出部と、損失値と、重みと、に基づいて、学習モデルを機械学習させる機械学習部と、を備える。この構成によれば、例えば、学習モデルを機械学習させる際に、損失値だけではなく、第1の尤度と第2の尤度との比較結果に基づいた重みを機械学習に用いることで、要素が真として分類されるべきではない他のクラスの尤度も考慮されるため、フィードバック効率を向上させることができる。
実施形態の機械学習装置は、例えば、重み算出部は、第1の尤度と、他のクラスの尤度のうち最も高い第2の尤度と、の比較結果に基づいて重みを算出する。この構成によれば、例えば、他のクラスの尤度のうち最も高い第2の尤度を用いることで、フィードバック効率を向上させることができる。
実施形態の機械学習装置は、例えば、重み算出部は、さらに、第1の尤度と、第2の尤度と、の差分に基づいて、重みを算出する。この構成によれば、例えば、第1の尤度と第2の尤度との差分に基づいた重みを機械学習に用いることで、推定値のうち最も尤度が高いクラスとそれ以外のクラスとの関係性も考慮されるため、フィードバック効率を向上させることができる。
実施形態の機械学習装置は、例えば、重み算出部は、第1の尤度と第2の尤度との差分値pと、所定値γと、を、“W=−(1−p)γlog(p)”に代入することで、重みWを算出する。この構成によれば、例えば、式から重みを算出することで、第1の尤度と第2の尤度との差分が小さくなるにしたがって重みが大きくなるため、フィードバック効率を向上させることができる。
実施形態の機械学習装置は、例えば、損失値算出部は、さらに、第1の尤度より第2の尤度が大きい場合、第1の尤度が第2の尤度より大きい場合に算出される重みと比べて大きい値を、重みとして設定する。この構成によれば、例えば、第1の尤度より第2の尤度が大きい場合には、重みが大きく設定されるので、フィードバック効率を向上させることができる。
図1は、実施形態の機械学習装置のハードウェア構成の一例を示す図である。 図2は、実施形態の機械学習装置のソフトウェア構成を示したブロック図である。 図3は、実施形態の学習用の画像データの例を示した図である。 図4は、実施形態の推定部が学習モデルを用いて要素を分類する際の推定手法を例示した図である。 図5は、実施形態の重み算出部において、差分値に基づいて算出される重みを示したグラフである。 図6は、実施形態の機械学習装置によって実行される処理手順を示したフローチャートである。
以下、本発明の例示的な実施形態が開示される。以下に示される実施形態の構成、ならびに当該構成によってもたらされる作用、結果、および効果は、一例である。本発明は、以下の実施形態に開示される構成以外によっても実現可能であるとともに、基本的な構成に基づく種々の効果や、派生的な効果のうち、少なくとも一つを得ることが可能である。
図1は、機械学習装置100のハードウェア構成の一例を示す図である。図1に示すように、機械学習装置100は、プロセッサ101、ROM102、RAM103、入力部104、表示部105、通信I/F106、HDD109を備える。この例では、機械学習装置100は、通常のコンピュータと同様のハードウェア構成を有している。なお、機械学習装置100が有するハードウェア要素は図1に例示したハードウェア要素に限られるものではなく、例えばカメラなどをさらに備える形態であっても構わない。
プロセッサ101は、例えば、CPU、GPU、MPU、ASIC等で構成されるハードウェア回路であって、プログラムを実行することにより、機械学習装置100の動作を統括的に制御し、機械学習装置100が有する各種の機能を実現する。機械学習装置100が有する各種の機能については後述する。
ROM102は、不揮発性のメモリであり、機械学習装置100を起動させるためのプログラムを含む各種データを記憶する。RAM103は、プロセッサ101の作業領域を有する揮発性のメモリである。
入力部104は、機械学習装置100を使用するユーザが各種の操作を行うためのデバイスである。入力部104は、例えばマウス、キーボード、タッチパネル又はハードウェアキーで構成される。
表示部105は、各種の情報を表示する。表示部105は、例えば液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイなどで構成される。なお、例えばタッチパネルのような形態で、入力部104と表示部105とが一体に構成されてもよい。通信I/F106はネットワークと接続するためのインタフェースとする。HDD(Hard Disk Drive)109は、様々なデータを格納する。
図2は、本実施形態の機械学習装置100のソフトウェア構成を示したブロック図である。図2に示されるように機械学習装置100は、ROM102又はHDD109に記憶されているプログラムをプロセッサ101が実行することで、機械学習部201と、データ受付部202と、推定部203と、損失値算出部204と、重み設定部205と、が実現される。また、学習用データ記憶部206は、HDD109上に格納されている。
学習用データ記憶部206は、学習用のデータが格納されている。学習用のデータは、当該データに含まれる要素(本実施形態では画素)をクラス毎に分類するための学習に用いられる。学習用のデータには、画像データの他に、画像データに含まれる各要素(本実施形態では画素)が、どのクラスに属しているのかを示す情報(以下に真値として示す)が含まれている。
本実施形態は、学習用のデータが画像データの場合について説明するが、波形などの他のデータであってもよい。また、本実施形態は、分類対象となる要素が、画素の場合について説明するが、画素以外であってもよい。
データ受付部202は、学習用データ記憶部206に記憶されている学習用のデータを受け付けるとともに、機械学習部201で機械学習された学習モデル210を受け付ける。
学習モデル210は、どのような学習モデルを用いてもよく、例えば、画像解析用には、学習済みCNN(Convolutional Neural Network)モデルを用いることが考えられる。
図3は、本実施形態の学習用の画像データの例を示した図である。図3に示される画像データは、空401と、路面402と、車両403と、人404と、地面405との5個のクラスで構成されている例とする。本実施形態は、例として、5クラス分類した場合について説明する。なお、本実施形態は、クラスの数を制限するものではなく、4クラス以下でも6クラス以上であってもよい。
推定部203は、機械学習部201で機械学習された学習モデル210に基づいて、学習用のデータに含まれている各要素について、要素を分類するための複数のクラス毎に、当該クラスに分類される確からしさを示した推定尤度を算出する。
具体的には、本実施形態の推定部203は、学習用の画像データの画素ごとに、5クラスの各々について推定尤度を算出する。本実施形態は、複数のクラスに分類する活性化関数として、ソフトマックス関数を用いる例とする。なお、本実施形態は、ソフトマックス関数を用いる手法に制限するものではなく、他の活性化関数を用いてもよい。ソフトマックス関数は、クラス毎にそれが真である確率(本実施形態の推定尤度)を出力する関数である。
本実施形態の推定尤度は、0〜1の範囲に収まる値とし、“1”に近づくほど当該クラスである可能性が高いことを示している。具体的には、推定尤度が“0”であれば当該クラスである可能性が0パーセントであることを示し、推定尤度が“1”であれば当該クラスである可能性が100パーセントとして推定されたことを示している。
図4は、本実施形態の推定部203が学習モデル210を用いて要素を分類する際の推定手法を例示した図である。図4に示されるように、推定部203が、学習用のデータに含まれる要素を分類するために、入力層301として、複数の入力パラメータが入力される。学習用のデータが画像データの場合には、入力パラメータとして、例えば、分類対象となる要素(画素)の値の他に、当該要素周辺の画素の値も入力される。
図4に示されるように、複数の中間層302において、ニューロンが相互接続されている。本実施形態においては、学習モデル210に従って各ニューロンのパラメータ(例えば、重み、バイアス)が設定される。図4に示される例では、入力層301に入力された入力パラメータが複数の中間層302で相互接続されているニューロンを経由して、出力層303に存在する複数の出力パラメータとして出力する。本実施形態の出力パラメータの数は、要素を分類するクラスの数と一致する。換言すれば、出力層303の出力パラメータとして、クラス毎の推定尤度が算出される。
また、本実施形態は多クラス分類を行う例について説明するが、多クラス分類に制限するものではなく、2値分類を行う場合に適用してもよい。
本実施形態の推定部203によって出力された確率ベクトル(推定尤度の配列)を、[クラス1,クラス2,クラス3,クラス4,クラス5]と表すことができる。例えば、クラス1を“空”、クラス2を“路面”、クラス3を“車両”、クラス4を“人”、クラス5を“地面”とした場合、学習用データ記憶部206に記憶されている、図3の画素411は“空”を表しているため、当該画素411の真値は、[1、0、0、0、0]となる。
そして、画素411の第1の推定例として、[0.40、0.50、0.05、0.05、0.00]を算出されたものとする。
機械学習においては、第1の推定例に基づいた再学習が行われる。その結果、画素411の第2の推定例として、[0.40、0.30、0.10、0.10、0.10]が算出される。さらに、第2の推定例に基づいた再学習が行われる。その結果、画素411の第3の推定例として、[0.40、0.25、0.20、0.15、0.00]が算出される。なお、第1の推定例〜第3の推定例は、以下に示す説明のための一例であって、従来の機械学習又は本実施形態で算出されたか否かについて制限を行うものではない。
第1の推定例では、真であるクラス1の推定尤度よりも、偽であるクラス2の推定尤度が大きくなっている。このため、第1の推定例は、真値と不一致となる。
一方、第2の推定例、及び第3の推定例は、真であるクラス1の推定尤度が最も大きくなる点で真値と一致する。しかしながら、クラス2の推定尤度は、第2の推定例が“0.30”であり、第3の推定例が“0.25”である。このため、第2の推定例より、第3の推定例の方がより適切な分類が行われていると考えられる。
ところで、従来の機械学習による損失値の演算、例えばクロスエントロピー関数では、真であるクラスの推定尤度のみを利用している。換言すれば、上述した第1の推定例〜第3の推定例においては、クラス1の“0.40”のみが機械学習用の損失値の演算に用いられる。つまり、真値と不一致か否かにかかわらず、同じ値で機械学習が行われるため、十分なフィードバックができないという問題があった。一方、全てのクラスの推定尤度を利用して機械学習を行う場合にはノイズが大きいという問題がある。
そこで、本実施形態は、要素が真として分類されるべきクラスの推定尤度と、要素が偽として分類される他のクラスの推定尤度のうち最も高い推定尤度と、に基づいた重みづけを、損失値に対して行うこととした。
損失値算出部204は、推定部203によって推定されたクラス毎の推定尤度と、所定の損失関数と、に基づいて、推定尤度の誤りの度合いを示した損失値を算出する。本実施形態では、所定の損失関数として、下記の式(1)に示したクロスエントロピー関数を用いて損失値Lを算出する。なお、変数iはクラスを示す数値とする。このため、本実施形態ではクラスが5個の場合のため、変数i=0〜4となる。tiは、クラスが真の場合に“1”となり、クラスが偽の場合に“0”とする。yiは、クラス(i)毎の推定尤度とする。
Figure 2020204909
重み設定部205は、損失値の重みを算出する。具体的には、重み設定部205は、各画素(要素)について、クラス毎に算出された推定尤度のうち、画素(要素)が真に分類されるべきクラス(真クラス)の推定尤度と、当該画素(要素)が偽である(真に分類されるべきではない)他のクラス(偽クラス)の推定尤度のうち最も高い推定尤度と、の比較結果に基づいて重みWを算出する。本実施形態では、比較結果として、真クラスの推定尤度と、偽クラスの最も高い推定尤度と、の差分から重みWを算出する。
ただし、真クラスの推定尤度より、偽クラスの推定尤度が大きい場合、重み設定部205は、所定値を重みとして設定する。所定値は、実施態様に応じて適切な値を設定すればよいが、例えば、真クラスの推定尤度が、偽クラスの最も高い推定尤度より大きい場合に算出される重みより大きい値とする。
具体的には、下記の式(2)を用いて、差分値pを算出する。なお、真クラスの推定尤度Vtargetとし、偽クラスの最も高い推定尤度Vrem_maxとする。
p=max(0.01、Vtarget−Vrem_max)……(2)
式(2)によって、真クラスの推定尤度より、偽クラスの最も高い推定尤度が大きい場合、差分値p=0.01となり、真クラスの推定尤度が、偽クラスの最も高い推定尤度より大きい場合、差分値p=Vtarget−Vrem_maxとなる。
そして、重み設定部205は、算出した差分値pを、下記の式(3)に代入し、重みWを算出する。なお、所定値γは、実施態様に応じて適切な値が設定されるものとし、例えば、0〜5.0の間の数値を割り当られることが考えられる。
W=−(1−p)γlog(p)……(3)
図5は、重み設定部205において、差分値pに基づいて式(3)で算出される重みWを示したグラフである。図5に示されるように、差分値pは、0〜1の間の値をとる。そして、0に近づくほど重みWは大きくなる。
例えば、第1の推定例[0.40、0.50、0.05、0.05、0.00]の場合、真クラスの推定尤度より、偽クラスの最も高い推定尤度が大きいため、差分値p1=0.01となる。この場合、重み設定部205は、座標503に対応する重みW3を算出する。
一方、第2の推定例[0.40、0.30、0.10、0.10、0.10]の場合、差分値p2=0.1となる。この場合、重み設定部205は、座標502に対応する重みW2を算出する。第3の推定例[0.40、0.25、0.20、0.15、0.00]の場合、差分値p3=0.15となる。この場合、重み設定部205は、座標501に対応する重みW1を算出する。
図5に示されるように、W3>W2>W1となる。つまり、本実施形態では、真クラスの推定尤度より、偽クラスの推定尤度が大きい場合に、大きい重みW3が設定される。そして、真クラスの推定尤度が、偽クラスの最も高い推定尤度より大きい場合には、図5に示されるように、推定尤度間の差分値が大きくなるに従って、重みWが小さくなるように設定される。換言すれば、推定尤度間の差分値が小さい場合には、大きな重みWが設定される。これによって、機械学習の効率を向上させることができる。
このように、本実施形態においては、真クラスの推定尤度が同じであっても、差分値pに応じて異なる重みWが算出される。
機械学習部201は、損失値Lと、重みWと、に基づいた機械学習を行って、学習モデル210へのフィードバックを行う。具体的には、本実施形態では、損失値Lと重みWとに基づいた機械学習として、従来のように損失値Lを用いる代わりに、下記の式(4)から算出される総合損失値LLを用いることとした。なお、総合損失値LLを用いて学習モデル210に機械学習を行わせるための手法は、従来と同様の手法を用いてもよいものとして、説明を省略する。
L=L×W……(4)
次に、本実施形態の機械学習装置100が実行する処理手順について説明する。図6は、本実施形態の機械学習装置100によって実行される処理手順を示したフローチャートである。
本実施形態の機械学習装置100のデータ受付部202は、学習用データ記憶部206から学習用のデータ(画像データ)とともに、機械学習部201で機械学習された学習モデル210を受け付ける(S601)。
次に、推定部203は、学習モデル210に基づいて、学習用のデータの各画素(要素)について、クラス毎に、推定尤度を算出する(S602)。
そして、損失値算出部204は、画素(要素)毎に、推定部203によって推定された推定尤度と、所定の損失関数(例えばクロスエントロピー関数)と、に基づいて、損失値を算出する(S603)。
さらに、重み設定部205は、画素(要素)毎に、真クラスの推定尤度と、偽クラスの最も高い推定尤度と、に基づいて、損失値の重みを算出する(S604)。
そして、機械学習部201が、損失値及び重みを用いて機械学習を行うことで、学習モデル210へのフィードバックを行う(S605)。
その後、機械学習部201が、機械学習が終了したか否かを判定する(S606)。機械学習が終了したか否かの判断基準は、どのような基準であってもよく、例えば、指定の学習回数に到達した場合や、学習モデル210が目標精度を超えた場合であってもよいし、全ての学習用のデータによる機械学習が完了した場合であってもよい。
機械学習部201が、機械学習が終了していないと判断した場合(S606:No)、再びS601から処理を行う。一方、機械学習が終了したと判断した場合(S606:Yes)、処理を終了する。
また、本実施形態においては、図6に示されるようなフローチャートで説明したが、学習モデル210を用いた機械学習について並列処理を行ってもよい。
本実施形態は、損失値の算出手法として、クロスエントロピー関数を用いた例について説明したが、クロスエントロピー関数以外の損失関数を用いてもよい。例えば、最小二乗誤差等の手法を用いてもよい。さらに、損失値を算出するための算出手法を一つのみ用いる手法に制限するものではなく、複数の損失値の算出手法を組み合わせてもよい。
また、複数の算出手法を用いて、画素(要素)毎に複数の損失値を算出した場合には、要素全体の損失値を1つに統合したうえで、機械学習を行ってもよい。このような場合に、損失値を統合するために平均や総和を用いることが考えられる。
上述した実施形態においては、偽のクラスの推定尤度のうち最も高い推定尤度を、真のクラスの推定尤度と比較する例について説明した。しかしながら、本実施形態は、真のクラスの推定尤度との比較対象を、偽のクラスの推定尤度のうち最も高い推定尤度に制限するものではなく、偽のクラスの推定尤度の平均や、2番目に高い推定尤度等と比較してもよい。
本実施形態においては、従来の損失値Lによる機械学習を行った場合と比べて、真クラスの推定尤度と、偽クラスの最も高い推定尤度と、に基づいた重みが設定されているため、学習モデル210へのフィードバック効率を向上させることができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100…機械学習装置、201…機械学習部、202…データ受付部、203…推定部、204…損失値算出部、205…重み設定部、206…学習用データ記憶部。

Claims (5)

  1. 学習モデルに基づいて、学習用のデータに含まれている要素について、要素を分類する複数のクラス毎に、当該クラスに分類される確からしさを示した尤度を推定する推定部と、
    前記推定部によって推定されたクラス毎の尤度と、所定の損失関数と、に基づいて、前記尤度の誤りの度合いを示した損失値を算出する損失値算出部と、
    前記クラス毎に算出された尤度のうち、前記要素が真として分類されるべき第1クラスの第1の尤度と、前記要素が真として分類されるべきではない他のクラスの第2の尤度と、の比較結果に基づいて重みを算出する重み算出部と、
    前記損失値と、前記重みと、に基づいて、前記学習モデルを機械学習させる機械学習部と、
    を備える機械学習装置。
  2. 前記重み算出部は、前記第1の尤度と、前記他のクラスの尤度のうち最も高い前記第2の尤度と、の比較結果に基づいて重みを算出する、
    請求項1に記載の機械学習装置。
  3. 前記重み算出部は、さらに、前記第1の尤度と、前記第2の尤度と、の差分に基づいて、前記重みを算出する、
    請求項1又は2に記載の機械学習装置。
  4. 前記重み算出部は、前記第1の尤度と前記第2の尤度との差分値pと、所定値γと、を下記式(1)に代入することで、重みWを算出する、
    請求項3に記載の機械学習装置。
    W=−(1−p)γlog(p)……(1)
  5. 前記損失値算出部は、さらに、前記第1の尤度より前記第2の尤度が大きい場合、前記第1の尤度が前記第2の尤度より大きい場合に算出される重みと比べて大きい値を、重みとして設定する、
    請求項1乃至4のいずれか一つに記載の機械学習装置。
JP2019112260A 2019-06-17 2019-06-17 機械学習装置 Pending JP2020204909A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019112260A JP2020204909A (ja) 2019-06-17 2019-06-17 機械学習装置
US16/896,770 US20200394563A1 (en) 2019-06-17 2020-06-09 Machine learning apparatus
CN202010553059.9A CN112101513A (zh) 2019-06-17 2020-06-17 机器学习装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019112260A JP2020204909A (ja) 2019-06-17 2019-06-17 機械学習装置

Publications (1)

Publication Number Publication Date
JP2020204909A true JP2020204909A (ja) 2020-12-24

Family

ID=73746287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019112260A Pending JP2020204909A (ja) 2019-06-17 2019-06-17 機械学習装置

Country Status (3)

Country Link
US (1) US20200394563A1 (ja)
JP (1) JP2020204909A (ja)
CN (1) CN112101513A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11394774B2 (en) * 2020-02-10 2022-07-19 Subash Sundaresan System and method of certification for incremental training of machine learning models at edge devices in a peer to peer network
US20230195851A1 (en) * 2020-05-28 2023-06-22 Nec Corporation Data classification system, data classification method, and recording medium
WO2023092349A1 (en) * 2021-11-24 2023-06-01 Nec Corporation Methods, devices, and medium for communication

Also Published As

Publication number Publication date
US20200394563A1 (en) 2020-12-17
CN112101513A (zh) 2020-12-18

Similar Documents

Publication Publication Date Title
US11816183B2 (en) Methods and systems for mining minority-class data samples for training a neural network
CN111126574B (zh) 基于内镜图像对机器学习模型进行训练的方法、装置和存储介质
US20170147921A1 (en) Learning apparatus, recording medium, and learning method
WO2018170454A2 (en) Using different data sources for a predictive model
JP2020021496A (ja) データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法
JP2020204909A (ja) 機械学習装置
CN107292097B (zh) 基于特征组的中医主症选择方法
US20200372325A1 (en) Neural network reduction device, neural network reduction method, and storage medium
CN112633309A (zh) 基于贝叶斯优化的查询高效的黑盒对抗攻击
CN113496247A (zh) 估计生成对抗网络的隐含似然
KR20200132727A (ko) 다수의 섭동 유형들에 대해 강건한 분류
WO2019102984A1 (ja) 学習装置及び学習方法、識別装置及び識別方法、プログラム並びに記録媒体
Maktabdar Oghaz et al. A hybrid color space for skin detection using genetic algorithm heuristic search and principal component analysis technique
JP7384217B2 (ja) 学習装置、学習方法、及び、プログラム
WO2020168796A1 (zh) 一种基于高维空间采样的数据增强方法
JP7172677B2 (ja) 学習方法、学習プログラムおよび学習装置
WO2018196676A1 (en) Non-convex optimization by gradient-accelerated simulated annealing
EP3683734A1 (en) Learning method, learning program, and learning apparatus
US11676027B2 (en) Classification using hyper-opinions
KR102093079B1 (ko) 레이블 데이터를 이용한 생성적 적대 신경망 기반의 분류 시스템 및 방법
US11670403B2 (en) Method and apparatus for generating chemical structure using neural network
US20230086727A1 (en) Method and information processing apparatus that perform transfer learning while suppressing occurrence of catastrophic forgetting
KR101963556B1 (ko) 인공 신경망을 이용한 시계열적 자세 예측 장치
KR20200052411A (ko) 영상 분류 장치 및 방법
US20220044125A1 (en) Training in neural networks