WO2023053216A1

WO2023053216A1 - 機械学習プログラム、機械学習方法および機械学習装置

Info

Publication number: WO2023053216A1
Application number: PCT/JP2021/035678
Authority: WO
Inventors: 佳寛大川; 泰斗横田
Original assignee: 富士通株式会社
Priority date: 2021-09-28
Filing date: 2021-09-28
Publication date: 2023-04-06
Also published as: JPWO2023053216A1

Abstract

機械学習装置は、複数のデータを機械学習モデルに入力して、複数のデータの複数の予測結果を取得する。機械学習装置は、複数のデータのうち予測結果が第１のグループを示す第１のデータに基づいて、一又は複数のデータを生成する。機械学習装置は、機械学習モデルのパラメータに基づいて得られた、複数のデータと一又は複数のデータとのそれぞれの複数の特徴量に基づいて、複数のデータと一又は複数のデータとのクラスタリングを実行する。機械学習装置は、クラスタリングの結果を正解ラベルとする複数のデータと一又は複数のデータとを含む訓練データに基づいて、機械学習モデルのパラメータを更新する。

Description

機械学習プログラム、機械学習方法および機械学習装置

　本発明は、訓練データを用いた機械学習の技術に関する。

　企業等の情報システムでは、データの判定や分類を行う場合に、機械学習モデルを利用する。機械学習モデルは、機械学習に利用した訓練データに基づいて判定や分類を行うため、運用中にデータの傾向が変化すると、機械学習モデルの性能か低下する。

　機械学習モデルの性能を維持するため、機械学習モデルの正解率等が低下した場合には、正解ラベル付けを行ったデータを生成し、機械学習モデルの機械学習を再度実行している。

　図１８および図１９は、自動で正解ラベルをデータに付与する従来技術を説明するための図である。従来技術を実行する装置を「従来装置」と表記する。

　運用を開始する前の処理を、図１８について説明する。図１８の縦軸は、特徴空間のデータの密度に対応する軸である。横軸は、特徴量（特徴空間の座標）に対応する軸である。線１は、特徴空間の座標と、座標に対応するデータの密度との関係を示す。従来装置は、傾向が変化する前のデータを特徴空間に写像して、写像した各データの密度を計算する。従来装置は、クラスタリングを実行し、クラスタ数と、各クラスタ中で密度が閾値Ｄ_ｔｈ以上となる領域の中心座標を記録する。

　図１８に示す例では、特徴空間のデータが、クラスタＡおよびクラスタＢに分類されている。クラスタＡについて、密度が閾値Ｄ_ｔｈ以上となる領域の中心座標をＸ_Ａとする。クラスタＢについて、密度が閾値Ｄ_ｔｈ以上となる領域の中心座標をＸ_Ｂとする。この場合には、従来装置は、クラスタ数「２」と、クラスタＡの中心座標Ｘ_Ａと、クラスタ_Ｂの中心座標Ｘ_Ｂとを記録する。

　運用を開始した後の処理を、図１９について説明する。図１９の縦軸は、特徴空間のデータの密度に対応する軸である。横軸は、特徴量（特徴空間の座標）に対応する軸である。線２は、特徴空間の座標と、座標に対応するデータの密度との関係を示す。従来装置は、運用を開始した後に、運用で使用しているデータを特徴空間に写像し、写像した各データの密度を計算する。従来装置は、密度の閾値を下げていき、クラスタ数が、運用を開始する前に記録したクラスタ数と同じになる最小の閾値を探索する。

　図１８で説明した例を用いて、運用を開始する前のクラスタ数を「２」とする。従来装置は、密度の閾値を徐々に下げていき、閾値をＤに設定することで、運用で使用しているデータ（特徴空間に写像したデータ）のクラスタ数を「２」に調整する。従来装置は、領域２－１に含まれるデータと、領域２－２に含まれるデータとをそれぞれ抽出（クラスタリング）する。

　従来装置は、運用前に記憶しておいた中心座標と、運用を開始した後のクラスタの中心座標との移動距離の合計等に基づくマッチングを行うことで、データに正解ラベルを付与する。たとえば、かかるマッチングによって、領域２－１のクラスタが、クラスタＡに対応付けられ、領域２－２のクラスタが、クラスタＢに対応付けられる。この場合、従来装置は、領域２－１の各データに、正解ラベル「クラスＡ」を付与し、領域２－２の各データに、正解ラベル「クラスＢ」を付与する。

国際公開第２０２１／０７９４４２号

　しかしながら、上述した従来技術では、あるクラスに属するデータの数が少ない場合には、自動的に正解ラベルを付与することができないという問題がある。

　図２０は、従来技術の課題を説明するための図である。図２０の縦軸は、特徴空間のデータの密度に対応する軸である。横軸は、特徴量（特徴空間の座標）に対応する軸である。線３は、特徴空間の座標と、座標に対応するデータの密度との関係を示す。図２０に示す例では、データを機械学習モデルに入力した場合に、データが「正常データ」または「異常データ」のいずれかのクラスに分類されるものとする。

　図２０では、領域３－１に含まれるデータが「正常データ」のクラスに属し、領域３－２に含まれるデータが「異常データ」のクラスに属するものとする。領域３－２に含まれるデータが極端に少ないと、図１９で説明したように、閾値を下げても、クラスタ数が、運用を開始する前に記録したクラスタ数と同じにならず、クラスタリングを正しく行うことができない。このため、あるクラスに属するデータ数が少ない場合には、自動的に正解ラベルを付与することができない。

　なお、運用中のデータを機械学習モデルに入力した際に分類されるクラス間のサンプル数が極端に異なる場合も、クラスタリングを正しく行えず、自動的に正解ラベルを付与することができない。

　１つの側面では、本発明は、あるクラスに属するデータの数が少ない場合でも、自動的に正解ラベルを付与することができる機械学習プログラム、機械学習方法および機械学習装置を提供することを目的とする。

　第１の案では、機械学習プログラムは、複数のデータを機械学習モデルに入力して、複数のデータの複数の予測結果を取得する処理をコンピュータに実行させる。機械学習プログラムは、複数のデータのうち予測結果が第１のグループを示す第１のデータに基づいて、一又は複数のデータを生成する処理をコンピュータに実行させる。機械学習プログラムは、機械学習モデルのパラメータに基づいて得られた、複数のデータと一又は複数のデータとのそれぞれの複数の特徴量に基づいて、複数のデータと一又は複数のデータとのクラスタリングを実行する処理をコンピュータに実行させる。機械学習プログラムは、クラスタリングの結果を正解ラベルとする複数のデータと一又は複数のデータとを含む訓練データに基づいて、機械学習モデルのパラメータを更新する処理をコンピュータに実行させる。

　あるクラスに属するデータの数が少ない場合でも、自動的に正解ラベルを付与することができる。

図１は、疑似異常データを生成する際のアプローチと課題を説明するための図である。図２は、疑似異常データを生成する処理を説明するための図である。図３は、本実施例に係る機械学習装置の構成を示す機能ブロック図である。図４は、訓練データのデータ構造の一例を示す図である。図５は、ラベル付与部の処理を説明するための図（１）である。図６は、ラベル付与部の処理を説明するための図（２）である。図７は、ラベル付与部の処理を説明するための図（３）である。図８は、ラベル付与部の処理を説明するための図（４）である。図９は、ラベル付与部の処理を説明するための図（５）である。図１０は、劣化検出部の劣化判定を説明するための図である。図１１は、本実施例に係る機械学習装置の処理手順を示すフローチャートである。図１２は、外部環境の変化によるデータの傾向の変化を示す図である。図１３は、検証結果を示す図（１）である。図１４は、カメラのＡＵＣスコアの推移の一例を示す図である。図１５は、異なる生成方法によって生成したデータの一例を示す図である。図１６は、検証結果を示す図（２）である。図１７は、実施例の機械学習装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。図１８は、自動で正解ラベルをデータに付与する従来技術を説明するための図（１）である。図１９は、自動で正解ラベルをデータに付与する従来技術を説明するための図（２）である。図２０は、従来技術の課題を説明するための図である。

　以下に、本願の開示する機械学習プログラム、機械学習方法および機械学習装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

　本実施例に係る機械学習装置は、入力されたデータを異常クラスまたは正常クラスのうちいずれかのクラスに分類する機械学習モデルを利用するものとする。たとえば、機械学習モデルに入力するデータは、画像データ等である。機械学習モデルは、ＤＮＮ（Deep　Neural　Network）等である。正常クラスに分類されたデータを「正常データ」と表記する。異常クラスに分類されたデータを「異常データ」と表記する。

　機械学習装置は、運用時に分類した異常データと正常データとを用いて疑似的な異常データを生成し、疑似的な異常データを含めてクラスタリングを実行することで、自動的にデータに正解ラベルを付与する。以下の説明では、疑似的な異常データを「疑似異常データ」と表記する。

　図１は、疑似異常データを生成する際のアプローチと課題を説明するための図である。疑似異常データを生成する場合に、生成方法によっては、自動的に正解ラベルを付与することができない場合がある。

　図１において、グラフＧ１，Ｇ２，Ｇ３の縦軸はデータの特徴空間のデータの密度に対応する軸である。横軸は、特徴量（特徴空間の座標）に対応する軸である。たとえば、データを機械学習モデルに入力し、機械学習モデルの出力層よりも所定数前の層から出力されるベクトルが特徴量となる。特徴量に応じて、データの特徴空間上の座標が決まる。

　グラフＧ１において、分布ｄｉｓ１ａは、「正常データの分布」を示す。特徴空間における正常データの図示を省略する。分布ｄｉｓ１ｂは、「真の異常データの分布」を示す。たとえば、特徴空間における異常データを、異常データ１０，１１，１２，１３，１４とする。異常データの数が少ないと、異常データの分布は、分布ｄｉｓ１ｂのようにならず、図２０で説明したように、自動的に正解ラベルを付与することができない。

　ここで、異常データの数を増やすために、単純に、異常データ１０，１１，１２，１３，１４に対応するデータ（画像データ）と同一の画像データを複製すると、異常データの分布は、グラフＧ２に示す、分布ｄｉｓ２ａ，ｄｉｓ２ｂ，ｄｉｓ２ｃ，ｄｉｓ２ｄ，ｄｉｓ２ｅとなる。分布ｄｉｓ２ａ，ｄｉｓ２ｂ，ｄｉｓ２ｃ，ｄｉｓ２ｄ，ｄｉｓ２ｅは、真の異常データの分布ｄｉｓ１ｂとは異なるため、クラスタリングが失敗し、自動的にデータに正解ラベルを付与することができない。

　一方、機械学習装置は、図１のグラフＧ３に示すように、異常データの分布が、真の異常データの分布ｄｉｓ１ｂに近づくように、疑似異常データを生成する。たとえば、後述する図２で説明する処理を、機械学習装置が実行し、疑似異常データを生成することで、異常データの分布は、分布ｄｉｓ３となる。

　図２は、疑似異常データを生成する処理を説明するための図である。たとえば、機械学習装置は、疑似異常データを生成する場合に、ステップＳ１、Ｓ２の順に処理を実行する。

　機械学習装置が実行するステップＳ１の処理について説明する。機械学習装置は、運用データに含まれる複数のデータを、特徴空間Ｆに写像する。たとえば、機械学習装置は、データを機械学習モデルに入力し、機械学習モデルの出力層よりも所定数前の層から出力される特徴量を、データを写像した値とする。特徴量により、特徴空間Ｆの座標が決まる。特徴空間Ｆに写像された異常データを、異常データ２０，２１とする。特徴空間Ｆの写像された正常データを、正常データ３１，３２，３３，３４，３５，３６，３７，３８，３９とする。異常データ２０，２１、正常データ３０～３９を用いて、機械学習装置の処理について説明する。

　機械学習装置は、特徴空間Ｆにおいて、異常データと類似する正常データを選択する。特徴空間Ｆにおいて、異常データとの距離が閾値未満となる正常データを、異常データに類似する正常データとする。

　機械学習装置は、異常データ２０と、正常データ３０～３９とを比較して、異常データ２０に類似する正常データ３０，３１，３２，３４を選択する。機械学習装置は、異常データ２１と、正常データ３０～３９とを比較して、異常データ２１に類似する正常データ３０，３２，３３，３５を選択する。

　機械学習装置が実行するステップＳ２の処理について説明する。機械学習装置は、ステップＳ１で選択した正常データそれぞれに対し、割合αを一様乱数とし、異常データと正常データとの線形結合により合成して、疑似異常データを生成する。たとえば、機械学習装置は、αブレンディング等を用いて、疑似異常データを生成する。

　機械学習装置は、異常データ２０と、正常データ３０とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５１を生成する。機械学習装置は、異常データ２０と、正常データ３４とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５２を生成する。機械学習装置は、異常データ２０と、正常データ３２とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５３を生成する。機械学習装置は、異常データ２０と、正常データ３１とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５４を生成する。

　機械学習装置は、異常データ２１と、正常データ３０とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５５を生成する。機械学習装置は、異常データ２１と、正常データ３２とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５６を生成する。機械学習装置は、異常データ２１と、正常データ３５とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５７を生成する。機械学習装置は、異常データ２１と、正常データ３３とを結ぶ線分を「１－α：α」で分割した座標（特徴量）に対応する、疑似異常データ５８を生成する。

　機械学習装置が、図２で説明した処理を実行して疑似異常データを生成すると、疑似異常データを含む異常データの分布が、図１で説明した分布ｄｉｓ３となる。このため、機械学習装置は、正常データ、異常データ、疑似異常データの各特徴量を基にして、クラスタリングを実行すると、訓練データの特徴量に基づくクラスタリング結果と対応付けることができる。したがって、あるクラスに属するデータ（たとえば、異常データ）の数が少ない場合でも、自動的に正解ラベルを付与することができる。

　次に、本実施例に係る機械学習装置の構成の一例について説明する。図３は、本実施例に係る機械学習装置の構成を示す機能ブロック図である。図３に示すように、この機械学習装置１００は、通信部１１０と、入力部１２０と、表示部１３０と、記憶部１４０と、制御部１５０を有する。

　通信部１１０は、ネットワークを介して、外部装置との間でデータ通信を行う。通信部１１０は、外部装置から、訓練データ１４１、運用データ１４３等を受信する。機械学習装置１００は、訓練データ１４１、運用データ１４３を、後述する入力部１２０から受け付けてもよい。

　入力部１２０は、データを入力するためのインタフェースである。入力部１２０は、マウス、およびキーボードなどの入力装置を介してデータの入力を受け付ける。

　表示部１３０は、データを出力するためのインタフェースである。たとえば、表示部１３０は、ディスプレイなどの出力装置にデータを出力する。

　記憶部１４０は、訓練データ１４１、機械学習モデル１４２、運用データ１４３、再訓練データ１４４、クラスタ関連データ１４５を有する。記憶部１４０は、メモリ等の記憶装置の一例である。

　訓練データ１４１は、機械学習モデル１４２の機械学習を実行する場合に用いられる。図４は、訓練データのデータ構造の一例を示す図である。図４に示すように、訓練データは、項番と、データと、正解ラベルとを対応付ける。項番は、訓練データ１４１のレコードを識別する番号である。データは、画像データである。正解ラベルは、データが正常であるか、異常であるかを示すラベルである。

　たとえば、項番「１」のデータの正解ラベルは「正常」であるため、項番「１」のデータは、正常データである。項番「３」のデータの正解ラベルは「異常」であるため、項番「３」のデータは、異常データである。

　機械学習モデル１４２は、ＤＮＮ等であり、入力層、隠れ層、出力層を有する。機械学習モデル１４２は、誤差逆伝播法等に基づいて機械学習が実行される。

　機械学習モデル１４２に、データを入力すると、入力されたデータが正常であるか異常であるかの分類結果が出力される。

　運用データ１４３は、運用時に利用する複数のデータを含むデータセットである。

　再訓練データ１４４は、機械学習モデル１４２の機械学習を再度実行する場合に用いられる訓練データである。

　クラスタ関連データ１４５は、訓練データ１４１に含まれる各データを特徴空間に写像した場合における、クラスタ数と、各クラスタ中で密度が閾値以上となる領域の中心座標とを有する。また、クラスタ関連データ１４５は、後述するラベル付与部１５６のクラスタリング結果に基づく各クラスタの中心座標を有する。

　制御部１５０は、取得部１５１、機械学習部１５２、事前処理部１５３、推論部１５４、生成部１５５、ラベル付与部１５６、劣化検出部１５７を有する。

　取得部１５１は、外部装置または入力部１２０から、訓練データ１４１を取得し、訓練データ１４１を記憶部１４０に格納する。取得部１５１は、外部装置または入力部１２０から、運用データ１４３を取得し、運用データ１４３を記憶部１４０に格納する。

　機械学習部１５２は、訓練データ１４１を用いて、誤差逆伝播法により、機械学習モデル１４２の機械学習を実行する。機械学習部１５２は、訓練データ１４１の各データを、機械学習モデル１４２の入力層に入力した場合に、出力層から出力される出力結果が、入力したデータの正解ラベルに近づくように、機械学習モデル１４２を訓練する。機械学習部１５２は、検証データを用いて、機械学習モデル１４２の検証を行う。

　事前処理部１５３は、訓練データ１４１のデータを特徴空間に写像して、クラスタリングを実行することで、運用を開始する前のデータのクラスタ数と、クラスタ中で密度が閾値以上となる領域の中心座標を特定する。事前処理部１５３は、クラスタ数と、各クラスタの中心座標を、クラスタ関連データ１４５に記録する。

　事前処理部１５３は、訓練データ１４１に含まれる各データを、特徴空間に写像する。たとえば、事前処理部１５３は、訓練データ１４１の各データを、機械学習モデル１４２に入力し、機械学習モデル１４２の出力層よりも所定数前の層から出力される特徴量を、データを写像した値とする。この特徴量は、訓練された機械学習モデル１４２のパラメータに基づいて得られる値である。特徴量により、特徴空間Ｆの座標が決まる。

　事前処理部１５３は、式（１）を用いて、特徴空間におけるデータの密度を算出する。式（１）において、Ｎはデータの総数を示し、σは標準偏差を示す。ｘは、データの特徴量の期待値（平均値）であり、ｘ_ｊは、ｊ番目のデータの特徴量を示す。

　ここでは、事前処理部１５３は、データの密度として、ガウス密度を算出する場合について説明したが、これに限定されるものではなく、eccentricityや、ＫＮＮ距離（K-Nearest　Neighbor　Algorithm）等を用いて密度を計算してもよい。

　事前処理部１５３は、縦軸を密度、横軸を特徴量とするグラフを生成する。事前処理部１５３によって生成されるグラフは、図１８で説明したグラフに対応する。事前処理部１５３は、クラスタリングを実行し、クラスタ数と、各クラスタ中で密度が閾値Ｄ_ｔｈ以上となる領域の中心座標を記録する。

　図１８に示す例では、特徴空間のデータが、クラスタＡおよびクラスタＢに分類されている。たとえば、クラスタＡは、正常データの属するクラスタである。クラスタＢは、異常データの属するクラスタである。クラスタＡについて、密度が閾値Ｄ_ｔｈ以上となる領域の中心座標をＸ_Ａとする。クラスタＢについて、密度が閾値Ｄ_ｔｈ以上となる領域の中心座標をＸ_Ｂとする。この場合には、事前処理部１５３は、クラスタ数「２」と、クラスタＡの中心座標Ｘ_Ａと、クラスタ_Ｂの中心座標Ｘ_Ｂとを、クラスタ関連データ１４５に記録する。

　ここでは、事前処理部１５３が、クラスタ数と、各クラスタの中心座標を特定する場合について説明したが、クラスタ数および各クラスタの中心座標を、外部装置から事前に取得しておいてもよい。

　推論部１５４は、運用データ１４３からデータを取得し、取得したデータを機械学習モデル１４２に入力することで、入力したデータが、正常データであるか、異常データであるかを推論する。推論部１５４は、運用データ１４３に含まる各データについて、上記処理を繰り返し実行する。推論部１５４は、運用データ１４３の各データについて、データが正常データであるか異常データであるかの推定結果を設定し、生成部１５５に出力する。推論部１５４は、推論結果を、表示部１３０に出力して、推論結果を表示させてもよい。

　生成部１５５は、図２で説明した処理を実行することで、疑似異常データを生成する。以下において、生成部１５５の処理の一例について説明する。

　生成部１５５は、運用データ１４３に含まれる複数のデータを、特徴空間Ｆに写像する。たとえば、生成部１５５は、データを機械学習モデル１４２に入力し、機械学習モデル１４２の出力層よりも所定数前の層から出力される特徴量を、データを写像した値とする。この特徴量は、訓練された機械学習モデル１４２のパラメータに基づいて得られる値である。たとえば、特徴空間に写像された異常データ、正常データは、図２に示す、異常データ２０，２１、正常データ３０～３９となる。生成部１５５は、データが異常データであるか、正常データであるかを、推論部１５４の推論結果を基にして特定する。

　生成部１５５は、特徴空間Ｆにおいて、異常データと類似する正常データを選択する。特徴空間Ｆにおいて、異常データとの距離が閾値未満となる正常データを、異常データに類似する正常データとする。たとえば、生成部１５５は、図２において、異常データ２０に類似する正常データとして、正常データ３０，３１，３２，３４を選択する。生成部１５５は、異常データ２１に類似する正常データとして、正常データ３０，３２，３３，３５を選択する。

　生成部１５５は、上記処理によって選択した正常データそれぞれに対し、割合αを一様乱数とし、異常データと正常データとの線形結合により合成して、疑似異常データを生成する。たとえば、生成部１５５は、αブレンディング等を用いて、疑似異常データを生成する。生成部１５５は、図２で説明した処理を実行することで、疑似異常データ５１～５８を生成する。

　生成部１５５は、異常データの特徴量、正常データの特徴量、疑似異常データの特徴量を、ラベル付与部１５６に出力する。

　ラベル付与部１５６は、異常データの特徴量、正常データの特徴量、疑似異常データの特徴量に基づいて、クラスタリングを実行し、クラスタリング結果に応じて、データに正解ラベルを付与する。ラベル付与部１５６は、正解ラベルを付与した各データを、再訓練データ１４４として、記憶部１４０に登録する。以下において、ラベル付与部１５６の処理の一例について説明する。ラベル付与部１５６は、αブレンディングによって生成した疑似異常データについても、正解ラベルを付与して、再訓練データ１４４に登録する。

　ラベル付与部１５６が実行するクラスタリング処理を実行する。図５は、ラベル付与部の処理を説明するための図（１）である。ラベル付与部１５６は、異常データの特徴量、正常データの特徴量、疑似異常データの特徴量に基づいて、縦軸を密度、横軸を特徴量とするグラフＧ１０を生成する（ステップＳ１０）。ラベル付与部１５６は、事前処理部１５３と同様にして、式（１）を基にして、データ（正常データ、異常データおよび疑似異常データ）の密度を算出する。

　ラベル付与部１５６は、密度に対応する閾値を所定値ごとに下げていき、クラスタ関連データ１４５に記録された事前のクラスタ数と同じになる最小の閾値を探索する（ステップＳ１１）。ここでは、クラスタ関連データ１４５に記録された事前のクラスタ数を「２」とする。

　ラベル付与部１５６は、閾値以上であるデータの特徴量に対してパーシステントホモロジ変換（ＰＨ変換）を実行して、０次元の連結成分を参照する。ラベル付与部１５６は、予め定めた閾値以上の半径を有するバー（ｂａｒ）の数が事前に設定したクラスタ数と一致するか否かにより、クラスタの計算および特定を実行する（ステップＳ１２）。

　ラベル付与部１５６は、閾値を超えるバーの数が事前のクラスタ数と一致しない場合は、閾値を所定値下げて、処理を繰り返す（ステップＳ１３）。

　上記のように、ラベル付与部１５６は、密度の閾値を下げて密度が閾値以上のデータを抽出する処理と、抽出されたデータに対するＰＨ変換処理によりクラスタ数を計算する処理とを、事前のクラスタ数と一致するまで繰り返す。ラベル付与部１５６は、クラスタ数が一致した場合に、その時の閾値（密度）以上の密度を有するデータ領域の中心座標Ｃ１、Ｃ２を特定し、クラスタ関連データ１４５に記録する。ラベル付与部１５６は、クラスタリング処理を行うたびに、中心座標を、クラスタ関連データ１４５に記録する。

　ラベル付与部１５６が実行するＰＨ変換は、たとえば、特許文献１（国際公開第２０２１／０７９４４２号）に記載されたＰＨ変換である。

　ラベル付与部１５６は、上記のクラスタリング処理の結果を基にして、運用データ１４３に含まれる各データに正解ラベルを付与する。ラベル付与部１５６は、クラスタリング処理によって決定された密度が閾値以上のデータに対して、それぞれが属するクラスタに基づく正解ラベル付けを行うことで、再訓練データ１４４を生成する。

　図６は、ラベル付与部の処理を説明するための図（２）である。図６のグラフＧ１０に関する説明は、図５のグラフＧ１０に関する説明と同様である。ラベル付与部１５６は、上記のクラスタリング処理を実行することで、クラスタ数が２の状態で最小となった閾値以上となったデータと、２つの中心座標Ｃ１、Ｃ２を特定する。ラベル付与部１５６は、クラスタ関連データ１４５に記録された中心座標の履歴と、マッチング処理に基づき、２つの中心座標それぞれが属するクラスタを決定する。

　図７は、ラベル付与部の処理を説明するための図（３）である。図７を用いて、マッチング処理の一例について説明する。ラベル付与部１５６は、機械学習モデル１４２の訓練が完了してから、現在に至るまでに特定された各クラスタの中心座標を特徴空間にマッピングし、進行方向を推定して、現在抽出された２つの中心座標（Ｃ１，Ｃ２）それぞれのクラスタを決定する。

　単に一番近い中心座標のマッチングでは、中心座標の変動を加味すると妥当でないことがある。図７の（ａ）のように、中心座標が変動していて、新しい２点を新たにマッチングする場合、近い点でマッチングすると図７の（ｂ）のようになるが、これは変動の方向からは不自然な動きである。図７の（ｃ）のように、変動する方が自然である。

　このため、ラベル付与部１５６は、補正距離を導入する。たとえば、進行方向に進む場合はより近い点と判定する仕組みを導入し、前回の座標からの進行方向ベクトルと、前回の座標から今回の座標を結ぶベクトルとの内積を計算することで、進行方向を特定する。ラベル付与部１５６は、内積の値をｃとして、（ｔａｎ（ｃ）＋１）／２を重みとして２点間の距離に乗算した値を補正距離として、最近傍点を選択する。たとえば、中心座標Ｃｂ１および中心座標Ｃ１の距離に、ベクトルｖ１およびベクトルｖ２の内積ｃに基づく重み（（ｔａｎ（ｃ）＋１）／２）を乗算した値が、補正距離となる。

　ラベル付与部１５６は、クラスタの中心座標が特定される度に、中心座標間の補正距離を算出し、補正距離の近い中心座標同士をマッチングする処理を繰り返し実行する。

　たとえば、事前処理部１５３のクラスタリング結果により特定されたクラスタＡの中心座標をＣｂ３－１とし、クラスタＢの中心座標をＣｂ３－２とする。ラベル付与部１５６によって、中心座標Ｃｂ３－１とＣｂ２－１とがマッチングされ、中心座標Ｃｂ２－１とＣｂ１－１とがマッチングされ、中心座標Ｃｂ１－１とＣ１とがマッチングされたとすると、中心座標Ｃ１は、クラスタＡに対応付けられる。本実施例では、クラスタＡに対応するクラスを「正常クラス」とする。

　ラベル付与部１５６によって、中心座標Ｃｂ３－２とＣｂ２－２とがマッチングされ、中心座標Ｃｂ２－２とＣｂ１－２とがマッチングされ、中心座標Ｃｂ１－２とＣ２とがマッチングされたとすると、中心座標Ｃ２は、クラスタＢに対応付けられる。本実施例では、クラスタＢに対応するクラスを「異常クラス」とする。

　図６の説明に戻る。図６に示す例では、中心座標Ｃ１にクラスタＡ（正常クラス）が対応付けられる。中心座標Ｃ２にクラスタＢ（異常クラス）が対応付けられる。この場合、ラベル付与部１５６は、運用データ１４３に含まれるデータのうち、密度が閾値以上かつ、中心座標Ｃ１と同じクラスタに属するデータに、正解ラベル「正常」を設定する。一方、ラベル付与部１５６は、運用データ１４３に含まれるデータのうち、密度が閾値以上かつ、中心座標Ｃ２と同じクラスタに属するデータに、正解ラベル「異常」を設定する。

　続いて、ラベル付与部１５６は、クラスタリング処理によって抽出されなかった閾値未満のデータそれぞれに正解ラベルを付与する。図８は、ラベル付与部の処理を説明するための図（４）である。ラベル付与部１５６は、抽出されなかった各データについて、各クラスタの中心座標Ｃ１との距離およびＣ２との距離をそれぞれ計測し、２番目に近い距離が各クラスタの中心間の距離の最大値より大きい場合は、一番近いクラスタに属するデータと決定する。

　図８の例の場合、ラベル付与部１５６は、上記手法によりクラスタが決定された領域Ｘ（クラスタＡ）と領域Ｙ（クラスタＢ）以外の領域のうち、領域Ｘよりも外側の領域Ｐのデータについては、クラスタＡと決定する。ラベル付与部１５６は、領域Ｙよりも外側の領域Ｑのデータについては、クラスタＢと決定する。

　ラベル付与部１５６は、２番目に近い距離が各クラスタの中心間の距離の最大値より小さい（複数のクラスタの中間にある）領域Ｚのデータについては、近くにある複数のクラスタのデータが混在していると判定する。この場合、ラベル付与部１５６は、各データに関して各クラスタの確率を測定して付与する。たとえば、ラベル付与部１５６は、ｋ近傍法、一様確率法、分布比率保持法などを用いて、領域Ｚに属する各データについて、各クラスタに属する確率を算出し、確率的なラベル（正常クラスの確率、異常クラスの確率、他のクラスの確率）を生成して付与する。

　ラベル付与部１５６は、領域Ｚに属する各入力データに対して、そのデータに近傍に位置するすでにラベル付けされたデータをｋ個抽出し、その割合が正常クラス＝０．６、異常クラス＝０．４、他のクラス＝０であれば、その割合をラベルとして付与する。

　ラベル付与部１５６は、領域Ｚに属する各データに対して、各クラスタにすべて同じ確率を付与する。例えば、ラベル付与部１５６は、２クラス分類の場合には、正常クラス＝０．５、異常クラス＝０．５をラベルとして付与し、３クラス分類の場合には、正常クラス＝０．３、異常クラス＝０．３、他のクラス＝０．３などをラベルとして付与する。

　上述した手法により推定して、ラベル付与部１５６が、各データに付与する正解ラベルの情報が図９である。図９は、ラベル付与部の処理を説明するための図（５）である。推定された正解ラベルは、各クラスタに属する確率（正常クラスに属する確率，異常クラスに属する確率，他のクラスに属する確率）で付与される。図９に示すように、領域Ｘと領域Ｐの各データには、推定ラベル（正解ラベル）［１，０，０］が付与され、領域Ｙと領域Ｑの各入力データには、推定ラベル［０，１，０］が付与され、領域Ｚの各入力データには、推定ラベル［ａ，ｂ，ｃ］が付与される。なお、ａ，ｂ，ｃは、ｋ近傍法などの手法により算出される確率である。そして、ラベル付与部１５６は、各データと推定ラベルとの対応付けた再訓練データ１４４を、記憶部１４０に格納する。

　図３の説明に戻る。劣化検出部１５７は、機械学習モデル１４２の精度劣化を検出する。たとえば、劣化検出部１５７は、機械学習モデル１４２の判定結果と、ラベル付与部１５６により生成された推定結果（再訓練データ１４４）とを比較して、機械学習モデル１４２の精度劣化を検出する。

　図１０は、劣化検出部の劣化判定を説明するための図である。図１０に示すように、劣化検出部１５７は、データ（運用データ１４３のデータ）を機械学習モデル１４２に入力した場合の出力結果（正常クラス）に基づき、判定結果［１，０，０］を生成する。一方で、劣化検出部１５７は、データに対する上記推定処理により、領域Ｘまたは領域Ｐに属した場合の推定結果［１，０，０］、領域Ｙまたは領域Ｑに属した場合の推定結果［０，１，０］、または、領域Ｚに属した場合の推定結果［ａ，ｂ，ｃ］を取得する。

　劣化検出部１５７は、各入力データについて、判定結果と推定結果とを取得し、これらの比較により劣化判定を実行する。例えば、劣化検出部１５７は、各推定結果で示される各データ（各点）の確率ベクトルに対し、機械学習モデル１４２による判定結果のベクトル表示の成分積の和（内積）をその点のスコアとし、そのスコアの合計をデータ数で割った値と閾値との比較により、劣化判定を実行する。

　なお、劣化検出部１５７は、次の処理を実行して、機械学習モデル１４２の精度劣化を検出してもよい。劣化検出部１５７は、クラスタ関連データ１４５を参照し、訓練データ１４１のクラスタリング処理によって特定されるクラスタＡの中心座標と、現在の運用データ１４３のクラスタリング処理によって特定されるクラスタＡの中心座標との距離の反数を、スコアとして算出する。劣化検出部１５７は、かかるスコアが閾値未満である場合に、機械学習モデル１４２の精度が劣化したと判定する。

　劣化検出部１５７は、機械学習モデル１４２の精度劣化を検出した場合に、機械学習部１５２に対して、機械学習の再実行依頼を出力する。機械学習部１５２は、劣化検出部１５７から、機械学習の再実行依頼を受け付けた場合、再訓練データ１４４を用いて、機械学習モデル１４２の機械学習を再度実行する。

　次に、本実施例に係る機械学習装置１００の処理手順について説明する。図１１は、本実施例に係る機械学習装置の処理手順を示すフローチャートである。図１１に示すように、機械学習装置１００の機械学習部１５２は、訓練データ１４１を用いて、機械学習モデル１４２の機械学習を実行する（ステップＳ１０１）。

　機械学習装置１００の事前処理部１５３は、訓練データ１４１を基にして、クラスタ数、各クラスタの中心座標を特定し、クラスタ関連データ１４５に記録する（ステップＳ１０２）。機械学習装置１００の取得部１５１は、運用データ１４３を取得し、記憶部１４０に格納する（ステップＳ１０３）。

　機械学習装置１００の推論部１５４は、運用データ１４３のデータを、機械学習モデル１４２に入力し、データのクラスを推定する（ステップＳ１０４）。機械学習装置１００の生成部１５５は、正常データの特徴量、異常データの特徴量を基にして、異常疑似データを生成する（ステップＳ１０５）。

　機械学習装置１００のラベル付与部１５６は、正常データ、異常データ、疑似異常データの各特徴量を基にして、クラスタリング処理を実行する（ステップＳ１０６）。ラベル付与部１５６は、クラスタリング処理の結果を基にして、データに正解ラベルを付与し、再訓練データ１４４を生成する（ステップＳ１０７）。

　機械学習装置１００の劣化検出部１５７は、機械学習モデル１４２の性能に関するスコアを算出する（ステップＳ１０８）。機械学習装置１００は、スコアが閾値未満でない場合には（ステップＳ１０９，Ｎｏ）、ステップＳ１０３に移行する。一方、機械学習装置１００は、スコアが閾値未満である場合には（ステップＳ１０９，Ｙｅｓ）、ステップＳ１１０に移行する。

　機械学習部１５２は、再訓練データ１４４を基にして、機械学習モデル１４２の機械学習を再度実行し（ステップＳ１１０）、ステップＳ１０３に移行する。

　次に、本実施例に係る機械学習装置１００の効果について説明する。機械学習装置１００は、訓練済みの機械学習モデル１４２に、運用データ１４３のデータを入力することで、正常データおよび異常データの特徴量を特定する。機械学習装置１００は、正常データおよび異常データの特徴量を基にして、疑似異常データを生成し、正常データ、異常データ、疑似異常データの各特徴量を基にして、クラスタリングを実行する。機械学習装置１００は、クラスタリング結果に基づく正解ラベルを、運用データおよび疑似異常データの各データに付与することで、再訓練データ１４４を生成し、再訓練データ１４４を基にして、機械学習モデルのパラメータを更新する。上記のように、正常データおよび異常データの特徴量を基にして、疑似異常データを生成することで、あるクラスに属するデータの数が少ない場合には、自動的に正解ラベルを付与することができる。

　機械学習装置１００は、上記のように、自動的に正解ラベルを付与することで、自動的に再訓練データ１４４を生成でき、再訓練データ１４４を用いて、機械学習モデル１４２の機械学習を再度実行して、機械学習モデル１４２の精度劣化を抑止することができる。

　機械学習装置１００は、特徴空間において、異常データに類似する正常データを選択し、異常データと選択した正常データとの間に、疑似異常データを生成する。これによって、特徴空間のデータの分布を、自動的に正解ラベルを付与することが可能な分布とすることができる。

　次に、機械学習装置１００が実行するその他の処理（１）、（２）について説明する。

　その他の処理（１）について説明する。上述した機械学習装置１００は、特徴空間において、正常データと異常データの特徴量を基にして、疑似異常データを生成していたが、これに限定されるものではない。たとえば、機械学習装置１００の生成部１５５は、運用データ１４３に含まれるデータのうち、異常データを複製し、複製した異常データに、ガウシアンノイズ等のノイズを付与した異常データを生成してもよい。以下の説明では、ノイズを付与した異常データを、ノイズデータと表記する。

　機械学習装置１００のラベル付与部１５６は、異常データの特徴量、ノイズデータの特徴量、正常データの特徴量に基づいて、クラスタリング処理を実行し、クラスタリング結果に応じて、データに正解ラベルを付与する。ノイズデータの特徴量は、ノイズデータを、訓練済みの機械学習モデル１４２に入力した場合に、機械学習モデル１４２の出力層よりも所定数前の層から出力される特徴量である。

　その他の処理（２）について説明する。上述した機械学習装置１００は、運用データ１４３について、異常データの数と、正常データの数とに差異がある場合に、疑似異常データを生成していたが、これに限定されるものではない。機械学習装置１００の生成部１５５は、訓練データ１４１について、異常データの数と、正常データの数とに差異がある場合でも、訓練データ１４１の異常データの特徴量と、正常データの特徴量とを用いて、疑似異常データを生成し、機械学習モデル１４２の機械学習に利用してもよい。

　次に、本実施例に係る機械学習装置１００を、ある工場における異常検知ＡＩ（Artificial　Intelligence）に適用して性能を検証した結果について説明する。検証条件として、機械学習モデルをＤＮＮとし、データを異常データまたは正常データに分類するように、機械学習モデル１４２を事前に訓練する。

　運用時想定シナリオとして、証明器具の寿命により、徐々に暗くなることを想定する。バッチ（batch）毎に１０％ずつ明度が低下する。各バッチにおいて、運用データとして、正常データを８０枚、異常データを５枚取得する。

　図１２は、外部環境の変化によるデータの傾向の変化を示す図である。正常データを、Ｉｍ１－０～Ｉｍ１－８とする。異常データを、Ｉｍ２－０～Ｉｍ２－８とする。正常データＩｍ１－０は、０バッチ目の正常なデータ（元画像データ）である。異常データＩｍ２－０は、０バッチ目の異常なデータ（元画像データ）である。

　正常データＩｍ１－１は、１バッチ目の正常なデータ（明度９０％の画像）である。異常データＩｍ２－１は、１バッチ目の異常なデータ（明度９０％の画像データ）である。正常データＩｍ１－２は、２バッチ目の正常なデータ（明度８０％の画像）である。異常データＩｍ２－２は、２バッチ目の異常なデータ（明度８０％の画像データ）である。

　正常データＩｍ１－３は、３バッチ目の正常なデータ（明度７０％の画像）である。異常データＩｍ２－３は、３バッチ目の異常なデータ（明度７０％の画像データ）である。正常データＩｍ１－４は、４バッチ目の正常なデータ（明度６０％の画像）である。異常データＩｍ２－４は、４バッチ目の異常なデータ（明度６０％の画像データ）である。

　図示を省略するが、正常データＩｍ１－５は、５バッチ目の正常なデータ（明度５０％の画像）である。異常データＩｍ２－５は、５バッチ目の異常なデータ（明度５０％の画像データ）である。図示を省略するが、正常データＩｍ１－６は、６バッチ目の正常なデータ（明度４０％の画像）である。異常データＩｍ２－６は、６バッチ目の異常なデータ（明度４０％の画像データ）である。

　正常データＩｍ１－７は、７バッチ目の正常なデータ（明度３０％の画像）である。異常データＩｍ２－７は、７バッチ目の異常なデータ（明度３０％の画像データ）である。正常データＩｍ１－８は、８バッチ目の正常なデータ（明度２０％の画像）である。異常データＩｍ２－８は、８バッチ目の異常なデータ（明度２０％の画像データ）である。

　評価指標として、データを機械学習モデルに入力し、入力したデータが正常データであるか異常データであるかを判定し、各バッチにおけるＡＵＣ（Area　Under　Curve）スコアを算出する。ＡＵＣスコアが高いほど、機械学習モデルの検知性能が維持されていることを示す。工場の７か所のカメラ（カメラＩＤ１～７）の異常検知データセット（運用データ）に対して、本実施例の機械学習装置１００を適用した異常検知ＡＩと、再訓練を行わない異常検知ＡＩとのＡＵＣスコアは、図１３に示す検証結果となった。

　図１３は、検証結果を示す図（１）である。図１３の検証結果は、最終バッチ（８バッチ目）におけるＡＵＣスコアを示す。ベースラインは、再訓練を行わない異常検知ＡＩを示す。提案手法は、本実施例の機械学習装置１００を適用した異常検知ＡＩを示す。図１３に示すように、全てのカメラにおいて、提案手法のＡＵＣスコアは、ベースラインのＡＵＣスコアを上回っており、暗い状態（データの傾向が変化）でも、検知性能を維持している。

　図１４は、カメラのＡＵＣスコアの推移の一例を示す図である。図１４のグラフＧ２０は、カメラＩＤ「３」のＡＵＣスコアの推移を表す。グラフＧ２０の縦軸は、ＡＵＣスコアに対応する軸であり、横軸はバッチ（batch　number）に対応する軸である。線分２０ａは、ベースラインの各バッチにおけるＡＵＣスコアの推移を示す。線分２０ｂは、提案手法の各バッチにおけるＡＵＣスコアの推移を示す。

　図１４のグラフＧ２１は、カメラＩＤ「６」のＡＵＣスコアの推移を表す。グラフＧ２１の縦軸は、ＡＵＣスコアに対応する軸であり、横軸はバッチ（batch　number）に対応する軸である。線分２１ａは、ベースラインの各バッチにおけるＡＵＣスコアの推移を示す。線分２１ｂは、提案手法の各バッチにおけるＡＵＣスコアの推移を示す。

　図１４のグラフＧ２０、Ｇ２１に示すように、本実施例の機械学習装置１００を適用した異常検知ＡＩは、暗い状態でも検知性能を維持している。

　続いて、生成方法（１）～（５）によって、疑似異常データを生成し、機械学習モデル１４２の性能を検証した結果について説明する。前提条件として、データは、異常データまたは正常データに分類され、異常データの数が、正常データの数と比較して少ないものとする。

（１）同一の異常データを複製する。
（２）（１）で複製した異常データにガウシアンノイズ（ノイズ強度：弱＜標準偏差σ＝０．０１＞）を付加したノイズデータを生成する。
（３）（１）で複製した異常データにガウシアンノイズ（ノイズ強度：中＜標準偏差σ＝０．１＞）を付加したノイズデータを生成する。
（４）（１）で複製した異常データにガウシアンノイズ（ノイズ強度：強＜標準偏差σ＝１＞）を付加したノイズデータを生成する。
（５）機械学習装置１００のαブレンディングにより、異常データと、異常データに類似の正常データとを合成した疑似異常データを生成する。

　図１５は、異なる生成方法によって生成したデータの一例を示す図である。データＤ１－１は、正常データである。データＤ１－２は、異常データである。データＤ（１）は、生成方法（１）により生成したデータである。データＤ（２）は、生成方法（２）により生成したデータである。データＤ（３）は、生成方法（３）により生成したデータである。データＤ（４）は、生成方法（４）により生成したデータである。データＤ（５）は、生成方法（５）により生成したデータである。

　図１６は、検証結果を示す図（２）である。図１６の検証結果は、生成方法（１）～（５）を用いた場合において、全バッチのカメラＩＤ別の平均ＡＵＣスコアを示す。図１６に示すように、生成方法（５）は、他の生成方法（１）～（４）と比較して、ＡＵＣスコアが、最高値または次点の性能維持を達成している。

　なお、本実施例では一例として、データが異常データまたは正常データに分類され、異常データの数が、正常データの数と比較して少ない場合について説明したが、正常データの数が、異常データの数と比較して少ない場合も同様に適用可能である。また、本実施例では、データが、異常データまたは正常データに分類される場合について説明したが、これに限定されるものではなく、他のクラスに分類されてもよい。

　次に、上記実施例に示した機械学習装置１００と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図１７は、実施例の機械学習装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

　図１７に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０１と、ユーザからのデータの入力を受け付ける入力装置２０２と、ディスプレイ２０３とを有する。また、コンピュータ２００は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置２０４と、インタフェース装置２０５とを有する。また、コンピュータ２００は、各種情報を一時記憶するＲＡＭ２０６と、ハードディスク装置２０７とを有する。そして、各装置２０１～２０７は、バス２０８に接続される。

　ハードディスク装置２０７は、取得プログラム２０７ａ、機械学習プログラム２０７ｂ、事前処理プログラム２０７ｃ、推論プログラム２０７ｄ、生成プログラム２０７ｅ、ラベル付与プログラム２０７ｆ、劣化検出プログラム２０７ｇを有する。また、ＣＰＵ２０１は、各プログラム２０７ａ～２０７ｇを読み出してＲＡＭ２０６に展開する。

　取得プログラム２０７ａは、取得プロセス２０６ａとして機能する。機械学習プログラム２０７ｂは、機械学習プロセス２０６ｂとして機能する。事前処理プログラム２０７ｃは、事前処理プロセス２０６ｃとして機能する。推論プログラム２０７ｄは、推論プロセス２０６ｄとして機能する。生成プログラム２０７ｅは、生成プロセス２０６ｅとして機能する。ラベル付与プログラム２０７ｆは、ラベル付与プロセス２０６ｆとして機能する。劣化検出プログラム２０７ｇは、劣化検出プロセス２０６ｇとして機能する。

　取得プロセス２０６ａの処理は、取得部１５１の処理に対応する。機械学習プロセス２０６ｂの処理は、機械学習部１５２の処理に対応する。事前処理プロセス２０６ｃの処理は、事前処理部１５３の処理に対応する。推論プロセス２０６ｄの処理は、推論部１５４の処理に対応する。生成プロセス２０６ｅの処理は、生成部１５５の処理に対応する。ラベル付与プロセス２０６ｆの処理は、ラベル付与部１５６の処理に対応する。劣化検出プロセス２０６ｇの処理は、劣化検出部１５７の処理に対応する。

　なお、各プログラム２０７ａ～２０７ｇについては、必ずしも最初からハードディスク装置２０７に記憶させておかなくても良い。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤ、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ２００が各プログラム２０７ａ～２０７ｇを読み出して実行するようにしてもよい。

　１００　　機械学習装置
　１１０　　通信部
　１２０　　入力部
　１３０　　表示部
　１４０　　記憶部
　１４１　　訓練データ
　１４２　　機械学習モデル
　１４３　　運用データ
　１４４　　再訓練データ
　１４５　　クラスタ関連データ
　１５０　　制御部
　１５１　　取得部
　１５２　　機械学習部
　１５３　　事前処理部
　１５４　　推論部
　１５５　　生成部
　１５６　　ラベル付与部
　１５７　　劣化検出部

Claims

　複数のデータを機械学習モデルに入力して、前記複数のデータの複数の予測結果を取得し、
　前記複数のデータのうち予測結果が第１のグループを示す第１のデータに基づいて、一又は複数のデータを生成し、
　前記機械学習モデルのパラメータに基づいて得られた、前記複数のデータと前記一又は複数のデータとのそれぞれの複数の特徴量に基づいて、前記複数のデータと前記一又は複数のデータとのクラスタリングを実行し、
　前記クラスタリングの結果を正解ラベルとする前記複数のデータと前記一又は複数のデータとを含む訓練データに基づいて、前記機械学習モデルのパラメータを更新する、
　処理をコンピュータに実行させることを特徴とする機械学習プログラム。
　前記生成する処理は、前記複数のデータのうち前記複数の予測結果が第２のグループを示す第１の複数のデータのうち、前記第１のデータに類似する第２のデータを選択し、前記第１のデータの特徴量と前記第２のデータの特徴量との間の特徴量に対応する前記一又は複数のデータを生成する処理を含む、
　ことを特徴とする請求項１に記載の機械学習プログラム。
　前記生成する処理は、前記第１のデータを複製することによって得られた第３のデータにノイズを付加することで、前記一又は複数のデータを生成する処理を含む、
　ことを特徴とする請求項１に記載の機械学習プログラム。
　前記予測結果と、前記訓練データに含まれる正解ラベルとを基にして、前記機械学習モデルのパラメータを更新するか否かを判定する処理を更にコンピュータに実行させることを特徴とする請求項１に記載の機械学習プログラム。
　複数のデータを機械学習モデルに入力して、前記複数のデータの複数の予測結果を取得し、
　前記複数のデータのうち予測結果が第１のグループを示す第１のデータに基づいて、一又は複数のデータを生成し、
　前記機械学習モデルのパラメータに基づいて得られた、前記複数のデータと前記一又は複数のデータとのそれぞれの複数の特徴量に基づいて、前記複数のデータと前記一又は複数のデータとのクラスタリングを実行し、
　前記クラスタリングの結果を正解ラベルとする前記複数のデータと前記一又は複数のデータとを含む訓練データに基づいて、前記機械学習モデルのパラメータを更新する、
　処理をコンピュータが実行することを特徴とする機械学習方法。
　前記生成する処理は、前記複数のデータのうち前記複数の予測結果が第２のグループを示す第１の複数のデータのうち、前記第１のデータに類似する第２のデータを選択し、前記第１のデータの特徴量と前記第２のデータの特徴量との間の特徴量に対応する前記一又は複数のデータを生成する処理を含む、
　ことを特徴とする請求項５に記載の機械学習方法。
　前記生成する処理は、前記第１のデータを複製することによって得られた第３のデータにノイズを付加することで、前記一又は複数のデータを生成する処理を含む、
　ことを特徴とする請求項５に記載の機械学習方法。
　前記予測結果と、前記訓練データに含まれる正解ラベルとを基にして、前記機械学習モデルのパラメータを更新するか否かを判定する処理を更にコンピュータが実行することを特徴とする請求項５に記載の機械学習方法。
　複数のデータを機械学習モデルに入力して、前記複数のデータの複数の予測結果を取得し、
　前記複数のデータのうち予測結果が第１のグループを示す第１のデータに基づいて、一又は複数のデータを生成し、
　前記機械学習モデルのパラメータに基づいて得られた、前記複数のデータと前記一又は複数のデータとのそれぞれの複数の特徴量に基づいて、前記複数のデータと前記一又は複数のデータとのクラスタリングを実行し、
　前記クラスタリングの結果を正解ラベルとする前記複数のデータと前記一又は複数のデータとを含む訓練データに基づいて、前記機械学習モデルのパラメータを更新する、
　処理を実行する制御部を有する機械学習装置。
　前記生成する処理は、前記複数のデータのうち前記複数の予測結果が第２のグループを示す第１の複数のデータのうち、前記第１のデータに類似する第２のデータを選択し、前記第１のデータの特徴量と前記第２のデータの特徴量との間の特徴量に対応する前記一又は複数のデータを生成する処理を含む、
　ことを特徴とする請求項９に記載の機械学習装置。
　前記生成する処理は、前記第１のデータを複製することによって得られた第３のデータにノイズを付加することで、前記一又は複数のデータを生成する処理を含む、
　ことを特徴とする請求項９に記載の機械学習装置。
　前記制御部は、前記予測結果と、前記訓練データに含まれる正解ラベルとを基にして、前記機械学習モデルのパラメータを更新するか否かを判定する処理を更に実行することを特徴とする請求項９に記載の機械学習装置。