WO2021079425A1

WO2021079425A1 - データ前処理方法、データ前処理装置およびデータ前処理プログラム

Info

Publication number: WO2021079425A1
Application number: PCT/JP2019/041466
Authority: WO
Inventors: 佳寛大川; 井出　勝
Original assignee: 富士通株式会社
Priority date: 2019-10-23
Filing date: 2019-10-23
Publication date: 2021-04-29
Also published as: US20220230076A1; JPWO2021079425A1; JP7273344B2

Abstract

データ傾向の変化に対してモデルの再学習を抑制する。　計測データ（１５）に、パラメータ（１３ａ）に応じた前処理（１３）を実行して訓練データ（１７）を生成する。訓練データ（１７）を用いてモデル（１４）を学習する。計測データ（１６）に前処理（１３）を実行して入力データ（１８）を生成する。入力データ（１８）をモデル（１４）に入力して予測結果（１９）を生成し、計測データ（１６）に対応付けられた教師ラベル（１６ａ）と予測結果（１９）とから予測精度を算出する。予測精度が閾値未満である場合、訓練データ（１７）と計測データ（１６）から生成される入力データ（１８）との比較に基づいて、前処理（１３）のパラメータ（１３ａ）を変更する。

Description

データ前処理方法、データ前処理装置およびデータ前処理プログラム

　本発明はデータ前処理方法、データ前処理装置およびデータ前処理プログラムに関する。

　コンピュータを利用したデータ分析の１つとして、機械学習が行われることがある。機械学習では、既知の事例を示す訓練データをコンピュータに入力する。コンピュータは、訓練データを分析して、要因（説明変数や独立変数と言うことがある）と結果（目的変数や従属変数と言うことがある）との間の関係を一般化したモデルを学習する。学習されたモデルを用いることで、未知の事例についての結果を予測することができる。

　機械学習を利用したデータ分析の一連の流れは、過去のデータを収集してモデルを学習する学習フェーズと、学習後に発生したデータをモデルに入力して結果を予測する運用フェーズとに分けることができる。ただし、時の経過に伴い、運用フェーズにおいてモデルに入力されるデータの傾向が、学習フェーズで使用したデータから変化してしまうことがある。これにより、モデルの予測精度が事後的に低下することがある。その場合、予測精度を回復する１つの方法として、モデルを再学習することが考えられる。

　例えば、過去の風力発電量と気象予報から今後の風力発電量を予測する風力発電予測方法が提案されている。提案の風力発電予測方法では、機械学習によってモデルを学習し、最新のデータを利用して定期的にモデルを再学習する。また、入力データのトレンドの変化に適合できるように継続的にモデルを更新する継続的機械学習方法が提案されている。提案の継続的機械学習方法では、最新のデータがモデルに反映されるまでの遅延と機械学習コストとのトレードオフを考慮して、モデルを更新するタイミングを決定する。

Mariam Barque, Simon Martin, Jeremie Etienne Norbert Vianin, Dominique Genoud and David Wannier, "Improving wind power prediction with retraining machine learning algorithms", Proc. of the 2018 International Workshop on Big Data and Information Security (IWBIS 2018), pp. 43-48, 2018-05-12 Huangshi Tian, Minchen Yu and Wei Wang, "Continuum: A Platform for Cost-Aware, Low-Latency Continual Learning", Proc. of the ACM Symposium on Cloud Computing 2018 (SoCC'18), pp. 26-40, 2018-10-11

　機械学習に利用されるデータが、時系列信号データや画像データなど、計測デバイスによって計測された計測データであることもある。計測データは、計測デバイスの特性やその使用環境に起因するノイズを含むことがある。そのため、データ傾向の変化の１つとして、ノイズ傾向の変化が生じることがある。例えば、計測デバイスの経年劣化や使用環境の変化によって、学習フェーズでは存在していなかったパターンのノイズが計測データに含まれるようになることがある。しかし、そのようなデータ傾向の変化が生じる毎にモデルを再学習することは、計算量や学習時間の観点からコストが高いという問題がある。

　１つの側面では、本発明は、データ傾向の変化に対してモデルの再学習を抑制するデータ前処理方法、データ前処理装置およびデータ前処理プログラムを提供することを目的とする。

　１つの態様では、コンピュータが実行するデータ前処理方法が提供される。第１の計測データに、パラメータに応じた前処理を実行して訓練データを生成する。訓練データを用いてモデルを学習する。第２の計測データに前処理を実行して入力データを生成する。入力データをモデルに入力して予測結果を生成し、第２の計測データに対応付けられた教師ラベルと予測結果とから予測精度を算出する。予測精度が閾値未満である場合、訓練データと第２の計測データから生成される入力データとの比較に基づいて、前処理のパラメータを変更する。

　また、１つの態様では、記憶部と処理部とを有するデータ前処理装置が提供される。また、１つの態様では、コンピュータに実行させるデータ前処理プログラムが提供される。

　１つの側面では、データ傾向の変化に対してモデルの再学習を抑制できる。
　本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態のデータ前処理装置の例を説明する図である。第２の実施の形態の機械学習装置のハードウェア例を示す図である。モデルの学習および運用の流れの例を示す図である。ノイズによる予測精度の低下および回復の流れの例を示す図である。前処理フィルタのパラメータの探索例を示す図である。訓練データの生成例を示す図である。ｋ近傍法モデルによる異常検出の例を示す図である。ノイズを含む入力サンプルに対する誤検出の例を示す図である。ローパスフィルタのパラメータの探索例を示す図である。第１のローパスフィルタの適用例を示す図である。第２のローパスフィルタの適用例を示す図である。第３のローパスフィルタの適用例を示す図である。機械学習装置の機能例を示すブロック図である。計測データテーブルの例を示す図である。フィルタテーブルの例を示す図である。学習時処理の手順例を示すフローチャートである。運用時処理の手順例を示すフローチャートである。

　以下、本実施の形態を図面を参照して説明する。
　［第１の実施の形態］
　第１の実施の形態を説明する。

　図１は、第１の実施の形態のデータ前処理装置の例を説明する図である。
　第１の実施の形態のデータ前処理装置１０は、機械学習によりモデルを学習し、学習したモデルを用いて入力データに対応する結果を予測する。モデルの学習に用いる訓練データやモデルに入力する入力データに対しては、前処理が行われる。データ前処理装置１０は、クライアント装置でもよいしサーバ装置でもよい。データ前処理装置１０を、コンピュータ、情報処理装置、機械学習装置などと言うこともできる。また、第１の実施の形態では、モデルを学習する学習フェーズとモデルを使用する運用フェーズの両方をデータ前処理装置１０が実行しているが、両者を異なる装置が実行するようにしてもよい。

　データ前処理装置１０は、記憶部１１および処理部１２を有する。記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性半導体メモリでもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性ストレージでもよい。処理部１２は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサである。ただし、処理部１２は、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの特定用途の電子回路を含んでもよい。プロセッサは、ＲＡＭなどのメモリ（記憶部１１でもよい）に記憶されたプログラムを実行する。複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うこともある。

　記憶部１１は、パラメータ１３ａ、モデル１４、計測データ１５（第１の計測データ）、計測データ１６（第２の計測データ）、計測データ１６に対応付けられた教師ラベル１６ａ、訓練データ１７、入力データ１８および予測結果１９を記憶する。

　パラメータ１３ａは、前処理１３の挙動を制御する制御パラメータである。前処理１３は、モデル１４を学習する際に計測データ１５を訓練データ１７に変換する。また、前処理１３は、モデル１４を使用する際に計測データ１６を入力データ１８に変換する。

　前処理１３は、例えば、計測データ１５，１６に含まれるノイズを除去するノイズフィルタとして動作する。前処理１３は、高周波数成分をカットするローパスフィルタとして動作してもよいし、低周波数成分をカットするハイパスフィルタとして動作してもよいし、所定周波数以外の周波数成分をカットするバンドパスフィルタとして動作してもよい。パラメータ１３ａは、カットする周波数の境界を示すカットオフ周波数を指定するものであってもよい。また、パラメータ１３ａは、有限インパルス応答（ＦＩＲ：Finite Impulse Response）フィルタや無限インパルス応答（ＩＩＲ：Infinite Impulse Response）フィルタなどのフィルタを実現する係数を指定するものであってもよい。

　モデル１４は、説明変数と目的変数との間の関係を一般化した機械学習モデルである。モデル１４は、訓練データ１７を用いて所定の機械学習アルゴリズムによって生成される。学習されたモデル１４は、説明変数に相当する入力データ１８の入力を受け付け、目的変数に相当する予測結果１９を出力する。第１の実施の形態では、機械学習アルゴリズムとして様々なものを使用することができる。例えば、モデル１４は、ニューラルネットワーク（ＮＮ：Neural Network）、サポートベクタマシン（ＳＶＭ：Support Vector Machine）、回帰分析モデル、ランダムフォレストなどであってもよい。また、モデル１４は、ｋ近傍法によって入力データ１８の分類を判定するｋ近傍法モデルでもよい。

　計測データ１５は、計測デバイスによって計測されたデータである。計測データ１５は、計測デバイスの特性や計測デバイスの使用環境に応じたノイズを含むことがある。計測データ１５は、モデル１４の学習にあたって収集される。データ前処理装置１０は、データ前処理装置１０に接続された計測デバイスから計測データ１５を直接受信してもよい。また、データ前処理装置１０は、ストレージ装置や他の情報処理装置からネットワーク経由で計測データ１５を受信してもよい。また、データ前処理装置１０は、データ前処理装置１０に接続された記録媒体から計測データ１５を読み出してもよい。

　計測データ１５は、加速度計によって計測された加速度データ、心電計によって計測された心電図データ、マイクロフォンによって計測された音声データなど、時系列の振幅変動を示す時系列信号データであってもよい。また、計測データ１５は、イメージセンサによって計測された画像データであってもよい。計測データ１５は、特定の目的変数の値に対応するものであってもよい。例えば、モデル１４に正常／異常の二値分類を行わせる場合、計測データ１５は正常を表す計測データであってもよい。また、計測データ１５に、目的変数の正解値である教師ラベルが対応付けられていてもよい。

　計測データ１６は、計測デバイスによって計測されたデータであって、計測データ１５と同じ種類のデータである。ただし、計測データ１６は、モデル１４の学習後に収集される。計測データ１６は、計測データ１５と同様の方法で収集されてもよいし、異なる方法で収集されてもよい。計測データ１６は、計測データ１５とは異なる傾向のノイズを含むことがある。例えば、計測デバイスの経年劣化、計測デバイスの交換、計測デバイスの設置場所の変更、計測デバイスの周辺に存在する電子機器や構築物の変化などの各種要因によって、ノイズの傾向が変化することがある。ノイズの傾向の変化として、例えば、ノイズの周波数が変化することが挙げられる。

　教師ラベル１６ａは、計測データ１６に対応する目的変数の正解値を表す。モデル１４に正常／異常の二値分類を行わせる場合、教師ラベル１６ａは正常または異常を表す。教師ラベル１６ａは、例えば、計測デバイスによって計測された計測データ１６を人が確認することで、計測データ１６に対して人によって付与される。教師ラベル１６ａは、計測データ１６が計測される毎にフィードバックされるものであってもよいし、計測データ１６が蓄積されて後日纏めてフィードバックされるものであってもよい。

　訓練データ１７は、モデル１４の学習に使用される。訓練データ１７は、計測データ１５に対して前処理１３を実行することで生成される。訓練データ１７は、例えば、ローパスフィルタによって計測データ１５から高周波ノイズが除去されたものである。ただし、パラメータ１３ａを調整することで、実質的に前処理１３がノイズ除去を行わないようにすることもでき、計測データ１５と訓練データ１７とを一致させることも可能である。モデル１４を学習する際に使用するパラメータ１３ａは、訓練データ１７がモデル１４の学習に適したものとなるように、人によって試行錯誤的に決定されてもよいし、モデル１４の予測精度が高くなるように機械学習を通じて自動的に探索されてもよい。例えば、計測データ１５に含まれるノイズが十分に除去され、計測データ１５がもつ本質的特徴が訓練データ１７に残るように、パラメータ１３ａが調整される。

　入力データ１８は、計測データ１６に対して前処理１３を実行することで生成される。入力データ１８は、例えば、ローパスフィルタによって計測データ１６から高周波ノイズが除去されたものである。計測データ１６を入力データ１８に変換する前処理１３には、原則として、モデル１４の学習時と同じパラメータ１３ａが使用される。ただし、計測データ１６のノイズの傾向が計測データ１５から変化することで、学習時と同じパラメータ１３ａでは計測データ１６のノイズが十分に除去されないことがある。そこで、後述するように、データ前処理装置１０はパラメータ１３ａを変更することがある。

　予測結果１９は、入力データ１８をモデル１４に入力することでモデル１４から出力される。入力データ１８が説明変数に相当し、予測結果１９が目的変数に相当する。目的変数の正解値である教師ラベル１６ａが与えられていることから、教師ラベル１６ａと予測結果１９とを比較することで、モデル１４の予測精度を評価することができる。予測精度の評価値として、例えば、正答率（Accuracy）が用いられる。正答率は、例えば、サンプル総数に対する、教師ラベル１６ａと予測結果１９とが一致したサンプルの割合である。データ前処理装置１０は、予測精度が低下した場合に予測精度を回復する措置を行う。

　処理部１２は、学習フェーズおよび運用フェーズを実行する。学習フェーズとして、処理部１２は、計測データ１５に対してパラメータ１３ａに応じた前処理１３を実行して訓練データ１７を生成する。訓練データ１７は、後述するように運用フェーズでも使用する可能性があるため、保存しておく。処理部１２は、訓練データ１７を用いてモデル１４を学習する。モデル１４が二値分類を行うｋ近傍法モデルである場合、例えば、モデル１４は、受け付けた入力データと訓練データ１７との間の距離を算出し、距離が閾値以下の場合に正常と判定し、距離が閾値を超える場合に異常と判定するものである。

　運用フェーズとして、処理部１２は、計測データ１６に対して、学習フェーズと同じパラメータ１３ａに応じた前処理１３を実行して入力データ１８を生成する。処理部１２は、入力データ１８をモデル１４に入力して予測結果１９を生成する。予測結果１９は、例えば、計測データ１６が正常か異常かを示す。処理部１２は、計測データ１６に対応付けられた教師ラベル１６ａと予測結果１９とを比較して、モデル１４の予測精度を算出する。例えば、処理部１２は、計測データ１６としての複数のサンプルそれぞれについて、教師ラベル１６ａと予測結果１９とが一致している場合に正解と判定し、教師ラベル１６ａと予測結果１９とが一致していない場合に不正解と判定する。処理部１２は、全てのサンプルのうち予測結果１９が正解であったサンプルの割合を予測精度として算出する。

　処理部１２は、算出した予測精度と閾値とを比較する。閾値は９０％など予め決めておく。予測精度が閾値以上である場合、処理部１２は、予測精度の回復処理を実行せず、前処理１３のパラメータ１３ａを維持する。一方、予測精度が閾値未満となった場合、処理部１２は、予測精度の回復処理を実行する。予測精度の回復処理では、処理部１２は、学習フェーズで保存しておいた訓練データ１７と、計測データ１６から生成される入力データとを比較し、比較結果に基づいて前処理１３のパラメータ１３ａを変更する。

　例えば、処理部１２は、パラメータ１３ａを変えながら計測データ１６に対して前処理１３を実行し、生成された入力データが訓練データ１７に近付くようにパラメータ１３ａを調整する。例えば、処理部１２は、生成された入力データと訓練データ１７との間の距離を算出し、距離が最小になるパラメータ１３ａを採用する。処理部１２は、最急降下法などの最適化アルゴリズムを用いて最適なパラメータ１３ａを探索してもよい。また、処理部１２は、幾つかのパラメータ１３ａの候補値を試して、それら候補値の中から、訓練データ１７に最も近い入力データを生成できる候補値を採用してもよい。

　パラメータ１３ａを変更することで、ノイズの傾向の変化を吸収することができる。例えば、カットオフ周波数を変更することで、学習フェーズとは異なる周波数のノイズを除去することができる。このとき、処理部１２は、モデル１４を再学習しなくてよい。処理部１２は、以降の運用フェーズにおいて、変更されたパラメータ１３ａを用いて前処理１３を実行する。例えば、処理部１２は、新たな計測データに対して、変更後のパラメータ１３ａに応じた前処理１３を実行して入力データを生成し、生成した入力データをモデル１４に入力して、その計測データに対応する予測結果を生成する。

　第１の実施の形態のデータ前処理装置１０によれば、学習フェーズにおいて、計測データ１５に対して前処理１３が実行されて訓練データ１７が生成され、訓練データ１７を用いてモデル１４が学習される。運用フェーズにおいて、計測データ１６に対して前処理１３が実行されて入力データ１８が生成され、入力データ１８がモデル１４に入力されて予測結果１９が生成される。予測結果１９の予測精度が低下した場合、保存しておいた訓練データ１７と入力データ１８との比較に基づいて、パラメータ１３ａが変更される。

　これにより、計測デバイスの特性の変化や使用環境の変化などの要因によって計測データ１６の傾向が学習フェーズから変化した場合であっても、モデル１４に入力される入力データ１８への影響を抑制することができる。よって、モデル１４の予測精度を回復することが可能となる。また、モデル１４を再学習せずモデル１４をそのまま使用し続けることが可能となり、機械学習の計算量や学習時間などのコストを抑制することができる。

　［第２の実施の形態］
　次に、第２の実施の形態を説明する。
　第２の実施の形態の機械学習装置は、機械学習によってモデルを学習し、学習したモデルを利用して入力データに対応する結果を予測する。第２の実施の形態の機械学習装置は、クライアント装置でもよいしサーバ装置でもよい。機械学習装置を、コンピュータや情報処理装置などと言うこともできる。

　図２は、第２の実施の形態の機械学習装置のハードウェア例を示す図である。
　機械学習装置１００は、ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、画像インタフェース１０４、入力インタフェース１０５、媒体リーダ１０６および通信インタフェース１０７を有する。機械学習装置１００が有するこれらのユニットは、バスに接続されている。機械学習装置１００は、第１の実施の形態のデータ前処理装置１０に対応する。ＣＰＵ１０１は、第１の実施の形態の処理部１２に対応する。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１に対応する。

　ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。ＣＰＵ１０１は複数のプロセッサコアを備えてもよく、機械学習装置１００は複数のプロセッサを備えてもよい。複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

　ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に使用するデータを一時的に記憶する揮発性半導体メモリである。機械学習装置１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数のメモリを備えてもよい。

　ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性ストレージである。機械学習装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）など他の種類のストレージを備えてもよく、複数のストレージを備えてもよい。

　画像インタフェース１０４は、ＣＰＵ１０１からの命令に従って、機械学習装置１００に接続された表示装置１１１に画像を出力する。表示装置１１１として、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイ、プロジェクタなど、任意の種類の表示装置を使用することができる。機械学習装置１００に、プリンタなど表示装置１１１以外の出力デバイスが接続されてもよい。

　入力インタフェース１０５は、機械学習装置１００に接続された入力デバイス１１２から入力信号を受け付ける。入力デバイス１１２として、マウス、タッチパネル、タッチパッド、キーボードなど、任意の種類の入力デバイスを使用することができる。機械学習装置１００に複数種類の入力デバイスが接続されてもよい。

　媒体リーダ１０６は、記録媒体１１３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体１１３として、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤなどの磁気ディスク、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）などの光ディスク、半導体メモリなど、任意の種類の記録媒体を使用することができる。媒体リーダ１０６は、例えば、記録媒体１１３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体１１３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体１１３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

　通信インタフェース１０７は、ネットワーク１１４に接続され、ネットワーク１１４を介して他の情報処理装置と通信する。通信インタフェース１０７は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。

　次に、モデルの学習および運用の流れを説明する。
　図３は、モデルの学習および運用の流れの例を示す図である。
　機械学習装置１００は、計測データ１５１を収集する。計測データ１５１は、過去に計測デバイスによって計測されたものである。計測データ１５１は、計測デバイスの特性や計測デバイスの使用環境に応じたノイズを含んでいる。ノイズは、計測デバイス自体の構造に起因して発生することもあるし、周辺に存在する電子機器の電磁波に起因して発生することもある。計測データ１５１として、異なる対象から計測された複数のサンプルが収集される。後述するように第２の実施の形態では、計測データ１５１として主に、心電計によって計測された心電図データを想定する。過去に異なる患者から計測された複数の心電図サンプルが収集される。計測データ１５１として収集される心電図サンプルは、人によって正常な心電図と判断された正常サンプルである。

　機械学習装置１００は、計測データ１５１を前処理フィルタ１４１に入力して、訓練データ１５２を生成する。前処理フィルタ１４１は、計測データ１５１に含まれるノイズを除去することを意図する。後述するように第２の実施の形態では、前処理フィルタ１４１として主に、高周波ノイズを除去するローパスフィルタを想定する。ローパスフィルタの挙動は、通過させる周波数の上限を示すカットオフ周波数によって変わる。カットオフ周波数は、学習時に作業者によって試行錯誤的に調整される。訓練データ１５２として主に、高周波ノイズが除去された複数の心電図サンプルが想定される。

　機械学習装置１００は、訓練データ１５２を用いてモデル１４２を学習する。モデル１４２は、入力データを複数のクラスに分類する分類器である。モデル１４２は、ニューラルネットワーク、サポートベクタマシン、回帰分析モデル、ランダムフォレストなどであってもよい。後述するように第２の実施の形態では、モデル１４２として主に、ｋ近傍法に基づいて入力データを正常または異常に分類するｋ近傍法モデルを想定する。このｋ近傍法モデルは、入力された心電図サンプルと訓練データ１５２である正常サンプルとの間の距離を算出し、距離が閾値以下の心電図サンプルを正常と判定し、距離が閾値を超える心電図サンプルを異常と判定する。このようなモデル１４２は、医療現場で使用され得る。心電図が正常か異常かは、患者の病気の診断において参照される。

　モデル１４２が学習されると、機械学習装置１００は、計測データ１５３を取得する。計測データ１５３は、モデル１４２の学習後に計測デバイスによって計測されたものである。計測データ１５３は、計測デバイスの特性や計測デバイスの使用環境に応じたノイズを含んでいる。また、機械学習装置１００は、計測データ１５３の計測後に、計測データ１５３に対してフィードバックされた教師ラベルを取得する。教師ラベルは、計測データ１５３が属するクラスの正解を示す。計測データ１５１と同様に、計測データ１５３として主に、心電計によって計測された心電図データを想定する。教師ラベルは、心電図が正常か異常かを人によって判断した結果を示す。

　機械学習装置１００は、計測データ１５３を前処理フィルタ１４１に入力して、入力データ１５４を生成する。前処理フィルタ１４１は、計測データ１５３に含まれるノイズを除去することを意図する。ここで使用する前処理フィルタ１４１は、学習時と同じものであり、例えば、学習時と同じカットオフ周波数をもつローパスフィルタである。入力データ１５４として主に、高周波ノイズが除去された心電図サンプルが想定される。機械学習装置１００は、入力データ１５４をモデル１４２に入力し、入力データ１５４が属するクラスの予測結果を出力する。例えば、モデル１４２は、入力データ１５４である心電図サンプルと訓練データ１５２である正常サンプルとの間の距離を算出し、距離が閾値以下の場合は正常と判定し、距離が閾値を超える場合は異常と判定する。予測結果と教師ラベルを比較することで、モデル１４２の予測精度を評価できる。

　ここで、第２の実施の形態では、学習時と運用時とで、ノイズを含まない理想的な計測データがもつ特徴の分布が変化しない、すなわち、「コンセプトドリフト」が生じないことを想定する。または、コンセプトドリフトが生じるとしても、その変化が十分に緩やかで変化傾向が既知であることを想定する。例えば、ノイズを含まない心電図の波形と正常／異常の分類との間の関係が、学習時と運用時とで変化しないことを想定する。

　ただし、計測デバイスの交換、計測デバイスの経年劣化、計測デバイスの設置位置の変更、計測デバイスの周辺に存在する電子機器の変化などの要因により、学習時と運用時とで、計測データに含まれるノイズの分布が変化してしまうことがある。その場合、前処理後の入力データの特徴が変化し、モデルの予測精度が低下することがある。

　図４は、ノイズによる予測精度の低下および回復の流れの例を示す図である。
　モデル１４２が学習された後、機械学習装置１００は、計測データ１５５を取得する。計測データ１５５は、計測デバイスの特性や計測デバイスの使用環境に応じたノイズを含んでいる。計測データ１５５が含むノイズの傾向は、学習時に使用された計測データ１５１から変化している。例えば、心電図データに含まれるノイズの周波数が変化している。

　すると、学習時と同じ前処理フィルタ１４１に計測データ１５５を入力しても、計測データ１５５に含まれるノイズが適切に除去されない可能性がある。そのため、計測データ１５５から前処理フィルタ１４１を通して生成された入力データ１５６は、モデル１４２の学習に使用された訓練データ１５２の分布に適合しない可能性がある。例えば、カットオフ周波数の設定が不適切であるために、入力データ１５６に大きいノイズが残っているか、または、入力データ１５６の信号波形が過剰に平準化されている可能性がある。

　その結果、入力データ１５６をモデル１４２に入力することでモデル１４２から出力される予測結果の予測精度が、モデル１４２の学習当初の予測精度よりも低下する可能性がある。例えば、入力データ１５６に大きいノイズが残っていることで、正常な心電図データを誤って異常と判定してしまうリスクが高くなる。ここで、予測精度を回復する１つの方法として、計測データ１５１よりも新しい計測データを収集し、新しい計測データを用いてモデル１４２に代わる新しいモデルを学習する方法が考えられる。しかし、モデルの再学習は、計算量や学習時間の観点からコストが高い。

　そこで、機械学習装置１００は、モデルを再学習する代わりに、前処理フィルタを変更することでノイズの傾向の変化に対処する。具体的には、機械学習装置１００は、モデル１４２の学習に使用した前処理後の訓練データ１５２を保存しておく。機械学習装置１００は、計測データ１５５から変換される入力データが、保存しておいた訓練データ１５２に近付くように前処理フィルタのパラメータを変更する。例えば、機械学習装置１００は、前処理フィルタを通過した入力データと訓練データ１５２との間の距離を算出し、距離が最小になるように前処理フィルタのパラメータを最適化する。

　これにより、前処理フィルタ１４１が、前処理フィルタ１４１と異なるパラメータをもつ前処理フィルタ１４３に変更される。例えば、ローパスフィルタのカットオフ周波数が変更される。その後、機械学習装置１００は、計測データ１５７を取得する。計測データ１５７は、計測データ１５５と同じ傾向のノイズを含む。機械学習装置１００は、計測データ１５７を前処理フィルタ１４３に入力して、計測データ１５７を入力データ１５８に変換する。入力データ１５８は、計測データ１５７からノイズを除去したものであると期待される。入力データ１５８の特徴は、訓練データ１５２の特徴と整合する。

　機械学習装置１００は、入力データ１５８をモデル１４２に入力して予測結果を取得する。これにより、モデル１４２の予測精度がモデル１４２の学習当初と同程度まで回復することが期待される。これは、モデル１４２に入力される入力データ１５８の特徴が、モデル１４２の学習に使用した訓練データ１５２に十分近いためである。

　なお、ノイズの傾向の変化が大きい場合、前処理フィルタのパラメータをどの様に調整しても、計測データ１５５から変換される入力データが訓練データ１５２に十分近付かない可能性がある。その場合、機械学習装置１００は、モデルの再学習を推奨する旨の警告を出力するようにしてもよい。例えば、機械学習装置１００は、最適化後の前処理フィルタ１４３を通過した入力データと訓練データ１５２との間の距離を算出し、算出した距離が所定の閾値を超える場合に警告を出力することが考えられる。

　図５は、前処理フィルタのパラメータの探索例を示す図である。
　前処理フィルタのパラメータを探索するにあたり、機械学習装置１００は、最急降下法などの最適化アルゴリズムを使用してもよい。また、機械学習装置１００は、幾つかのパラメータを試行し、それらパラメータの中から距離が最も小さくなるパラメータを採用してもよい。ここでは、後者の方法について説明する。

　機械学習装置１００は、パラメータの異なる前処理フィルタ１４３－１，１４３－２，１４３－３を生成する。前処理フィルタ１４３－１はパラメータａをもち、前処理フィルタ１４３－２はパラメータｂをもち、前処理フィルタ１４３－３はパラメータｃをもつ。例えば、前処理フィルタ１４３－１，１４３－２，１４３－３は、カットオフ周波数の異なるローパスフィルタである。例えば、前処理フィルタ１４３－１はカットオフ周波数が低い強フィルタであり、前処理フィルタ１４３－２はカットオフ周波数が中程度の中フィルタであり、前処理フィルタ１４３－３はカットオフ周波数が高い弱フィルタである。機械学習装置１００は、２５Ｈｚ，３５Ｈｚ，７５Ｈｚ，１００Ｈｚ，１５０Ｈｚなどの所定のカットオフ周波数の中から３つを選択するようにしてもよい。

　機械学習装置１００は、計測データ１５５を前処理フィルタ１４３－１に入力して入力データ１５６－１を生成する。また、機械学習装置１００は、計測データ１５５を前処理フィルタ１４３－２に入力して入力データ１５６－２を生成する。また、機械学習装置１００は、計測データ１５５を前処理フィルタ１４３－３に入力して入力データ１５６－３を生成する。そして、機械学習装置１００は、入力データ１５６－１，１５６－２，１５６－３それぞれに対して、訓練データ１５２との距離を算出する。訓練データ１５２として複数のサンプルがある場合、入力データ１５６－１と訓練データ１５２との間の距離を、それら複数のサンプルのうち入力データ１５６－１に最も近いサンプルとの間の距離と定義してもよい。同様に、入力データ１５６－２と訓練データ１５２との間の距離を、入力データ１５６－２に最も近いサンプルとの間の距離と定義してもよい。

　機械学習装置１００は、入力データ１５６－１，１５６－２，１５６－３のうち、訓練データ１５２との間の距離が最も小さい入力データを特定する。ここでは、入力データ１５６－２の距離が最も小さいとする。すると、機械学習装置１００は、入力データ１５６－２の生成に用いられた前処理フィルタ１４３－２を採用する。すなわち、機械学習装置１００は、前処理フィルタのパラメータをパラメータｂに変更する。以降に入力される計測データに対しては、パラメータｂをもつ前処理フィルタ１４３－２が使用される。

　次に、計測データとして心電図データを使用する例について説明する。
　図６は、訓練データの生成例を示す図である。
　機械学習装置１００は、モデルの学習にあたり、過去に計測された心電図データ１６１を取得する。心電図データ１６１は、正常な心電図を表している。心電図データ１６１では、心臓の鼓動を示す所定パターンの波形が繰り返されている。機械学習装置１００は、２周期など所定周期の波形を心電図データ１６１から抽出し、抽出した波形を示す正常サンプル１６１－１，１６１－２，１６１－３，…を生成する。これら複数の正常サンプルが、モデルを学習するための訓練データとして使用される。訓練データには、異なる患者から計測された正常サンプルが混在していることが好ましい。

　心電図データ１６１から正常サンプル１６１－１，１６１－２，１６１－３，…を生成するにあたり、時間幅と振幅が正規化される。例えば、機械学習装置１００は、心電図データ１６１から抽出した所定周期の波形を時間方向に伸縮して、正常サンプル１６１－１，１６１－２，１６１－３，…の時間幅を統一する。また、例えば、機械学習装置１００は、抽出した所定周期の波形を振幅方向に伸縮し、正常サンプル１６１－１，１６１－２，１６１－３，…の信号レベルの変動幅を統一する。時間幅および振幅の正規化は、前処理の中で行われる。ただし、正常サンプルと入力サンプルとの間の距離を、時間幅や振幅の差異を自動的に調整しながら算出することができるモデルを学習する場合、訓練データの生成時に時間幅および振幅を正規化しなくてもよい。

　また、心電図データ１６１から正常サンプル１６１－１，１６１－２，１６１－３，…を生成するにあたり、ローパスフィルタを用いて高周波ノイズが除去される。高周波ノイズの除去は、前処理の中で行われる。ローパスフィルタのカットオフ周波数は、モデル学習の作業者によって試行錯誤的に決定される。ただし、以下では説明を簡単にするため、心電図データ１６１のノイズが十分に小さい場合を想定し、ローパスフィルタを用いた高周波ノイズの除去を行わずに訓練データを生成するとする。高周波ノイズの除去を省略することは、カットオフ周波数を十分に大きく設定することに相当する。

　図７は、ｋ近傍法モデルによる異常検出の例を示す図である。
　機械学習装置１００は、訓練データである正常サンプル１６１－１，１６１－２，１６１－３，…を用いて、ｋ近傍法によって入力サンプルを正常または異常に分類するｋ近傍法モデルを生成する。第２の実施の形態では入力サンプルに最も近い正常サンプルのみが判定結果に影響することから、第２の実施の形態のｋ近傍法モデルを、最近傍法によって入力サンプルの分類を判定する最近傍モデルと言うこともできる。

　具体的には、機械学習装置１００は、訓練データである正常サンプル１６１－１，１６１－２，１６１－３，…を配置した特徴空間１６２を形成する。特徴空間１６２においてｋ近傍法モデルは、ある入力サンプルが与えられると、その入力サンプルからの距離が所定の閾値（例えば、０．３）以下である正常サンプルを検索する。入力サンプルから所定の距離以内に少なくとも１つの正常サンプルが存在する場合、ｋ近傍法モデルは、その入力サンプルを正常と判定する。入力サンプルから所定の距離以内に正常サンプルが存在しない場合、ｋ近傍法モデルは、その入力サンプルを異常と判定する。

　例えば、図７の入力サンプル１６２－１は、所定の距離以内に１以上の正常サンプルが存在するため、正常と判定される。一方、図７の入力サンプル１６２－２は、所定の距離以内に正常サンプルが存在しないため、異常と判定される。ｋ近傍法モデルは、例えば、入力サンプルに対して、複数の正常サンプルそれぞれとの間の距離を算出し、算出した距離が閾値以下であるか判断する。ｋ近傍法モデルは、最短距離が閾値以下である場合に入力サンプルを正常と判定し、最短距離が閾値を超える場合に入力サンプルを異常と判定する。ただし、機械学習装置１００は、入力サンプルとの距離を概算できるようなインデックスを生成しておき、入力サンプルとの距離が閾値以下である可能性がある正常サンプルを効率的に絞り込めるようにしてもよい。これにより、ｋ近傍法モデルは、全ての正常サンプルに対して距離を算出しなくてもよい。

　入力サンプルおよび正常サンプルはそれぞれ、信号波形を示す時系列データである。１つの入力サンプルと１つの正常サンプルとの間の距離は、両者の信号波形の類似度を表す。距離が小さいほど２つの信号波形が類似しており、距離が大きいほど２つの信号波形が異なる。例えば、ｋ近傍法モデルは、時間軸に沿って、２つの信号波形の間で各時刻の信号レベルの差の絶対値を算出し、その平均値を距離と定義する。また、例えば、ｋ近傍法モデルは、時間軸に沿って、２つの信号波形の間で各時刻の信号レベルの差の二乗を算出し、その平均値の平方根（二乗平均平方根）を距離と定義する。また、ｋ近傍法モデルは、動的時間伸縮法（ＤＴＷ：Dynamic Time Warping）などの動的計画法を用いて、２つの信号波形の間の時間方向のずれを修正しながら両者の距離を算出するようにしてもよい。

　図８は、ノイズを含む入力サンプルに対する誤検出の例を示す図である。
　ｋ近傍法モデルを学習すると、機械学習装置１００は、ｋ近傍法モデルの学習後に計測された心電図データ１６３を取得する。心電図データ１６３は、正常な心電図を表していることもあるし、異常な心電図を表していることもある。また、心電図データ１６３は、ｋ近傍法モデルの学習に使用した心電図データ１６１とは異なる周波数のノイズを含んでいる可能性がある。ノイズの傾向の変化は、心電計の交換、心電計の経年劣化、心電計の設置場所の変更、心電計の周辺環境の変化などの要因によって生じ得る。

　機械学習装置１００は、２周期など所定周期の波形を心電図データ１６３から抽出し、抽出した波形に対して学習時と同様の前処理を行って、入力サンプル１６３－１，１６３－２，１６３－３，…を生成する。入力サンプル１６３－１，１６３－２，１６３－３，…は、時間幅と振幅が正規化される。例えば、機械学習装置１００は、抽出した所定周期の波形を時間方向に伸縮して、時間幅を正常サンプル１６１－１，１６１－２，１６１－３，…と同一にする。また、例えば、機械学習装置１００は、抽出した所定周期の波形を振幅方向に伸縮し、信号レベルの変動幅を正常サンプル１６１－１，１６１－２，１６１－３，…と同一にする。ただし、使用するモデルによっては、入力サンプル１６３－１，１６３－２，１６３－３，…の時間幅や振幅を正規化しなくてもよい。

　また、入力サンプル１６３－１，１６３－２，１６３－３，…は、ローパスフィルタを用いて高周波ノイズが除去される。ローパスフィルタのカットオフ周波数は、モデル学習時のものが使用される。ただし、前述のように説明を簡単にするため、モデル学習時においてローパスフィルタによる高周波ノイズの除去を行っておらず、ここでもローパスフィルタによる高周波ノイズの除去を行わない。高周波ノイズの除去を省略することは、カットオフ周波数を十分に大きく設定することに相当する。

　機械学習装置１００は、生成した入力サンプル１６３－１，１６３－２，１６３－３，…それぞれを、ｋ近傍法モデルに入力することで正常か異常かを判定する。機械学習装置１００は、入力サンプル１６３－１を正常と判定し、入力サンプル１６３－２を異常と判定し、入力サンプル１６３－３を異常と判定する。機械学習装置１００は、入力サンプル１６３－１，１６３－２，１６３－３，…に対するこれらの予測結果を出力する。例えば、機械学習装置１００は、予測結果を表示装置１１１に表示する。

　これに対して、入力サンプル１６３－１は正常が正解であり、入力サンプル１６３－２は異常が正解であり、入力サンプル１６３－３は正常が正解である。入力サンプル１６３－１はモデル学習時に想定されていないノイズを含まないため、ｋ近傍法モデルは正常な心電波形を正常と正しく判定している。同様に、入力サンプル１６３－２はモデル学習時に想定されていないノイズを含まないため、ｋ近傍法モデルは異常な心電波形を異常と正しく判定している。一方、入力サンプル１６３－３はモデル学習時に想定されていない高周波ノイズを含むため、ｋ近傍法モデルは正常な心電波形を異常と誤って判定している。

　入力サンプル１６３－３の判定を誤ることで、ｋ近傍法モデルの正答率が低くなり、予測精度が低下する。正答率は、ｋ近傍法モデルに入力した入力サンプルの個数に対する、正常／異常の予測結果が正しかった入力サンプルの個数の割合である。最新の予測精度は、例えば、直近の所定個の入力サンプルの中で正答率を算出することで評価する。ｋ近傍法モデルの予測精度が閾値（例えば、９０％）未満に低下すると、機械学習装置１００は、ローパスフィルタのパラメータを変更することで予測精度を回復することを試みる。

　図９は、ローパスフィルタのパラメータの探索例を示す図である。
　機械学習装置１００は、ｋ近傍法モデルに入力した入力サンプルの中から、予測精度の低下の原因となった１以上の入力サンプルを選択する。予測精度の低下の原因となった入力サンプルは、前述の入力サンプル１６３－３のように、正常を示す教師ラベルが付与された入力サンプルのうち、ｋ近傍法モデルによって異常と判定されたものである。このような入力サンプルは、ローパスフィルタによって高周波ノイズが適切に除去されることで、正常であると正しく判定されるようになる可能性が高いためである。

　予測精度の低下の原因となった入力サンプルは、ローパスフィルタ通過後の入力サンプルとローパスフィルタ通過後の訓練データである正常サンプルとの間の比較に基づいて判定されると言うこともできる。ローパスフィルタ通過後の正常サンプルとローパスフィルタ通過後の入力サンプルであって正常なものとの間の距離が閾値を超える場合、その入力サンプルが予測精度の低下の原因となっているとみなすことができる。

　直近の所定個の入力サンプルの中に、誤って異常と判定された入力サンプルが２以上ある場合、機械学習装置１００は、何れか１つの入力サンプルを選択してもよい。１つの入力サンプルは、ランダムに選択してもよいし、所定の基準で選択するようにしてもよい。例えば、機械学習装置１００は、ｋ近傍法モデルにおいて算出される訓練データとの距離、すなわち、最も類似する正常サンプルとの間の最短距離が最大である入力サンプルを選択してもよい。このような入力サンプルは、最も大きいノイズを含んでいると言える。また、機械学習装置１００は、該当する２以上の入力サンプルの全てを選択してもよい。

　また、機械学習装置１００は、カットオフ周波数の異なる複数のローパスフィルタを生成する。例えば、機械学習装置１００は、ローパスフィルタ１６４－１，１６４－２，１６４－３のような数個のローパスフィルタを生成する。ローパスフィルタ１６４－１は、カットオフ周波数が低く通過可能な周波数成分が少ない強フィルタである。ローパスフィルタ１６４－２は、カットオフ周波数が中程度であり通過可能な周波数成分が中程度である中フィルタである。ローパスフィルタ１６４－３は、カットオフ周波数が高く通過可能な周波数成分が多い弱フィルタである。カットオフ周波数は、２５Ｈｚ，３５Ｈｚ，７５Ｈｚ，１００Ｈｚ，１５０Ｈｚなどのように設定される。

　時系列信号データに対するローパスフィルタは、ＦＩＲフィルタまたはＩＩＲフィルタとして実装されることがある。ＦＩＲフィルタは、直近の所定個の入力信号を保持しておき、最新の入力信号と過去の所定個の入力信号にそれぞれフィルタ係数を乗じて合算したものを、最新の出力信号として出力する。保持する入力信号の個数、すなわち、記憶時間を、フィルタ次数として指定することができる。フィルタ次数やフィルタ係数を調整することで、異なる周波数特性をもつローパスフィルタを生成することができる。ＩＩＲフィルタは、過去の所定個の入力信号に加えて、過去の所定個の出力信号を保持する。ＩＩＲフィルタは、最新の入力信号と過去の所定個の入力信号と過去の所定個の出力信号にそれぞれフィルタ係数を乗じて合算したものを、最新の出力信号として出力する。

　機械学習装置１００は、数式処理ライブラリを利用して、ローパスフィルタとして動作するＦＩＲフィルタまたはＩＩＲフィルタを生成することもできる。例えば、数式処理ライブラリは、フィルタ次数とカットオフ周波数の指定を受け付けることで、適切なフィルタ係数をもつＦＩＲフィルタまたはＩＩＲフィルタを自動的に生成することがある。フィルタ次数やカットオフ周波数に加えて、カットオフ周波数の周辺の周波数における振幅が、振幅減衰特性を示す情報として指定されることもある。

　機械学習装置１００は、選択した入力サンプルに対応するローパスフィルタ通過前のものを、ローパスフィルタ１６４－１，１６４－２，１６４－３にそれぞれ入力する。ここでは予測精度が低下した時点で、ローパスフィルタ未適用の入力サンプルがｋ近傍法モデルに入力されていることから、入力サンプル１６３－３がそのままローパスフィルタ１６４－１，１６４－２，１６４－３に入力される。機械学習装置１００は、入力サンプル１６３－３をローパスフィルタ１６４－１に入力して、サンプル１６５－１を生成する。また、機械学習装置１００は、入力サンプル１６３－３をローパスフィルタ１６４－２に入力して、サンプル１６５－２を生成する。また、機械学習装置１００は、入力サンプル１６３－３をローパスフィルタ１６４－３に入力して、サンプル１６５－３を生成する。

　機械学習装置１００は、生成されたサンプル１６５－１，１６５－２，１６５－３それぞれに対して、正常サンプル１６１－１，１６１－２，１６１－３，…を含む訓練データとの間の距離を算出する。ここで算出される距離は、サンプル１６５－１，１６５－２，１６５－３それぞれをｋ近傍法モデルに対する入力サンプルとみなして、ｋ近傍法モデルにおいて算出される距離に相当する。すなわち、あるサンプルに対して算出される距離は、正常サンプル１６１－１，１６１－２，１６１－３，…のうち当該サンプルと最も類似する正常サンプルとの間で算出される最短距離である。

　機械学習装置１００は、サンプル１６５－１，１６５－２，１６５－３のうち訓練データとの距離が最小のサンプルを判定する。そして、機械学習装置１００は、判定したサンプルの生成に使用したローパスフィルタを、それ以降の心電図データに対して適用するローパスフィルタとして採用する。ここでは、サンプル１６５－１，１６５－２，１６５－３のうちサンプル１６５－２が、訓練データとの距離が最小であるとする。そこで、機械学習装置１００は、ローパスフィルタ１６４－１，１６４－２，１６４－３のうちローパスフィルタ１６４－２を選択する。これは、ローパスフィルタ１６４－２のカットオフ周波数やフィルタ次数などのパラメータを選択することを意味する。

　なお、予測精度の低下の原因となった入力サンプルを２以上選択した場合、機械学習装置１００は、それら２以上の入力サンプルに対して算出される２以上の距離の平均（平均距離）が最小化されるように、ローパスフィルタを選択するようにしてもよい。また、機械学習装置１００は、それら２以上の入力サンプルに対して算出される２以上の距離の最悪値（最長距離）が最小化されるように、ローパスフィルタを選択するようにしてもよい。また、機械学習装置１００は、最急降下法などの最適化アルゴリズムを用いて、ローパスフィルタのパラメータを変えながらフィルタ通過後サンプルと訓練データとの距離の算出を繰り返し、距離が最小になるパラメータを探索するようにしてもよい。

　図１０は、第１のローパスフィルタの適用例を示す図である。
　前述のように、機械学習装置１００は、ローパスフィルタ１６４－２を採用する。ここでは、ローパスフィルタ１６４－２を採用することで、ｋ近傍法モデルを再学習せずに、心電図データ１６３に対する予測精度が改善することを説明する。

　機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－１をローパスフィルタ１６４－２に入力して、入力サンプル１６６－１に変換する。また、機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－２をローパスフィルタ１６４－２に入力して、入力サンプル１６６－２に変換する。また、機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－３をローパスフィルタ１６４－２に入力して、入力サンプル１６６－３に変換する。機械学習装置１００は、入力サンプル１６６－１，１６６－２，１６６－３をｋ近傍法モデルに入力することで、入力サンプル１６６－１，１６６－２，１６６－３それぞれが正常か異常か判定する。

　入力サンプル１６３－１は高周波ノイズを含んでおらず、入力サンプル１６６－１も高周波ノイズを含んでいない。入力サンプル１６６－１は正常な心電波形を示しており、その特徴は訓練データと整合する。よって、機械学習装置１００は、正常な入力サンプル１６６－１を正しく正常と判定することができる。また、入力サンプル１６３－２は高周波ノイズを含んでおらず、入力サンプル１６６－２も高周波ノイズを含んでいない。入力サンプル１６６－２は異常な心電波形を示している。よって、機械学習装置１００は、異常な入力サンプル１６６－２を正しく異常と判定することができる。

　また、入力サンプル１６３－３は高周波ノイズを含んでいるものの、ローパスフィルタ１６４－２によって高周波ノイズが適切に除去され、入力サンプル１６６－３は高周波ノイズを含んでいない。入力サンプル１６６－３は正常な心電波形を示しており、その特徴は訓練データと整合する。よって、機械学習装置１００は、正常な入力サンプル１６６－３を正しく正常と判定することができる。このように、ローパスフィルタ通過後の入力サンプルが、ｋ近傍法モデルの学習に使用した訓練データに近付くようにパラメータを調整することで、ｋ近傍法モデルの予測精度を回復することができる。

　図１１は、第２のローパスフィルタの適用例を示す図である。
　ここでは仮に、ローパスフィルタ１６４－１を採用した場合を考える。ローパスフィルタ１６４－１はカットオフ周波数が過度に小さいため、ローパスフィルタ１６４－１を通過した入力サンプルの特徴が訓練データとは大きく変わってしまう。このため、ｋ近傍法モデルの予測精度が十分に回復されない。

　機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－１をローパスフィルタ１６４－１に入力して、入力サンプル１６７－１に変換する。また、機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－２をローパスフィルタ１６４－１に入力して、入力サンプル１６７－２に変換する。また、機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－３をローパスフィルタ１６４－１に入力して、入力サンプル１６７－３に変換する。機械学習装置１００は、入力サンプル１６７－１，１６７－２，１６７－３をｋ近傍法モデルに入力することで、入力サンプル１６７－１，１６７－２，１６７－３それぞれが正常か異常か判定する。

　入力サンプル１６７－１は高周波ノイズを含んでおらず、機械学習装置１００は正常な入力サンプル１６７－１を正しく正常と判定している。また、入力サンプル１６７－３は高周波ノイズが除去されており、機械学習装置１００は正常な入力サンプル１６７－３を正しく正常と判定している。一方、入力サンプル１６７－２は高周波ノイズを含んでいないものの、過剰なフィルタリングによって異常な心電波形の特徴を失っている。よって、機械学習装置１００は、異常な入力サンプル１６７－２を誤って正常と判定している。このように、ローパスフィルタのパラメータの調整次第では予測精度が十分に回復しない。

　図１２は、第３のローパスフィルタの適用例を示す図である。
　ここでは仮に、ローパスフィルタ１６４－３を採用した場合を考える。ローパスフィルタ１６４－３はカットオフ周波数が過度に大きいため、ローパスフィルタ１６４－３を通過した入力サンプルに高周波ノイズが残ってしまう。

　機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－１をローパスフィルタ１６４－３に入力して、入力サンプル１６８－１に変換する。また、機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－２をローパスフィルタ１６４－３に入力して、入力サンプル１６８－２に変換する。また、機械学習装置１００は、ローパスフィルタ未適用の入力サンプル１６３－３をローパスフィルタ１６４－３に入力して、入力サンプル１６８－３に変換する。機械学習装置１００は、入力サンプル１６８－１，１６８－２，１６８－３をｋ近傍法モデルに入力することで、入力サンプル１６８－１，１６８－２，１６８－３それぞれが正常か異常か判定する。

　入力サンプル１６８－１は高周波ノイズを含んでおらず、機械学習装置１００は正常な入力サンプル１６８－１を正しく正常と判定している。また、入力サンプル１６８－２は高周波ノイズを含んでいないと共に異常な心電波形の特徴を維持しており、機械学習装置１００は異常な入力サンプル１６８－２を正しく異常と判定している。一方、入力サンプル１６８－３には高周波ノイズが残っており、機械学習装置１００は正常な入力サンプル１６８－３を誤って異常と判定している。このように、ローパスフィルタのパラメータの調整次第では予測精度が十分に回復しない。

　次に、機械学習装置１００の機能について説明する。
　図１３は、機械学習装置の機能例を示すブロック図である。
　機械学習装置１００は、計測データ記憶部１２１，１２２、フィルタ記憶部１２３、訓練データ記憶部１２４、モデル記憶部１２５および予測結果記憶部１２６を有する。これらの記憶部は、例えば、ＲＡＭ１０２またはＨＤＤ１０３の記憶領域を用いて実装される。また、機械学習装置１００は、前処理部１３１，１３３、モデル学習部１３２、予測部１３４およびフィルタ更新部１３５を有する。これらの処理部は、例えば、ＣＰＵ１０１が実行するプログラムを用いて実装される。

　計測データ記憶部１２１は、モデルの学習に使用する計測データを記憶する。計測データは、計測デバイスによって計測され、計測デバイスのハードウェア特性や使用環境に応じたノイズを含むことがある。計測データは、時系列データであることもあるし一時点の空間データであることもある。例えば、計測データは、撮像デバイスを用いて撮像された画像データ、マイクロフォンを用いて録音された音声データ、加速度計を用いて計測された歩行データ、心電計を用いて計測された心電図データなどである。計測データには、正解のクラス分類を示す教師ラベルが付与されていることがある。ただし、所定のクラスに属する計測データのみが訓練データとして使用される場合、教師ラベルが無くてもよい。

　計測データ記憶部１２２は、計測データ記憶部１２１の計測データよりも後に計測された計測データを記憶する。計測データ記憶部１２２の計測データは、計測データ記憶部１２１と同種のデータであって、モデルの運用開始後に計測されたものである。ただし、計測データ記憶部１２２の計測データは、計測デバイスのハードウェア特性の変化や使用環境の変化によって、学習用の計測データとは異なる傾向のノイズを含むことがある。計測データには、正解のクラス分類を示す教師ラベルが付与される。この教師ラベルは、モデル運用時の計測データに対するフィードバックである。

　なお、計測デバイスを機械学習装置１００に接続し、機械学習装置１００が計測デバイスから計測データを直接受信するようにしてもよい。また、計測デバイスと機械学習装置１００とをローカルネットワークまたは広域ネットワークを介して接続し、機械学習装置１００がネットワーク経由で計測データを受信するようにしてもよい。また、計測デバイスから他の情報処理装置に計測データを一旦転送し、機械学習装置１００が他の情報処理装置から計測データを収集するようにしてもよい。また、計測データを記録媒体に保存し、機械学習装置１００が記録媒体から計測データを読み出すようにしてもよい。また、計測データに対する教師ラベルは、ユーザによって機械学習装置１００に入力されてもよい。また、教師ラベルは、他の情報処理装置から計測データと併せて受信してもよいし、記録媒体から計測データと併せて読み出されてもよい。

　フィルタ記憶部１２３は、計測データに対する前処理に使用されるフィルタを記憶する。フィルタは、高周波ノイズを除去するローパスフィルタであることがある。フィルタ記憶部１２３は、カットオフ周波数やフィルタ次数を記憶してもよく、ＦＩＲフィルタまたはＩＩＲフィルタのフィルタ係数を記憶してもよい。また、フィルタ記憶部１２３に予め複数のフィルタを定義しておき、前処理部１３１，１３３がそれら複数のフィルタの中から１つを選択するようにしてもよい。また、フィルタ更新部１３５が新たなフィルタを生成してフィルタ記憶部１２３に追加するようにしてもよい。

　訓練データ記憶部１２４は、モデルの学習に使用した訓練データを記憶する。訓練データは、計測データ記憶部１２１に記憶された計測データに対して前処理を行ったものである。前処理には、ローパスフィルタを用いたノイズ除去が含まれることがある。また、前処理には、時系列信号の時間幅の調整や振幅の調整が含まれることがある。ただし、前処理を実質的に行わないことで、計測データそのものを訓練データとしてもよい。

　モデル記憶部１２５は、訓練データを用いて学習されたモデルを記憶する。モデルは、入力データを複数のクラスに分類する分類器である。例えば、モデルは、入力データが正常か異常かを判定する。モデルは、例えば、ニューラルネットワーク、サポートベクタマシン、回帰分析モデル、ランダムフォレスト、ｋ近傍法モデルなどである。

　予測結果記憶部１２６は、計測データ記憶部１２２に記憶された計測データに対して、モデル記憶部１２５に記憶されたモデルが予測した予測結果を記憶する。予測結果は、例えば、計測データが正常か異常かを示す。予測結果は、教師ラベルと一致した場合に正解となり、教師ラベルと一致しない場合に不正解となる。予測結果に対しては、評価値として予測精度を算出することができる。予測精度は、例えば、直近の所定個の入力サンプルのうち予測結果が正解であった入力サンプルの割合を示す正答率によって表現される。ただし、正答率以外の指標を予測精度として用いてもよい。

　前処理部１３１は、計測データ記憶部１２１に記憶された学習用の計測データに対して前処理を行い、前処理された訓練データを生成する。前処理部１３１は、訓練データを訓練データ記憶部１２４に保存すると共に、訓練データをモデル学習部１３２に提供する。前処理として、前処理部１３１は、フィルタ記憶部１２３に記憶されたフィルタを使用することがある。例えば、前処理部１３１は、ローパスフィルタを用いて計測データに含まれる高周波ノイズを除去する。前処理部１３１が使用するフィルタは、モデルの予測精度が上がるようにユーザによって試行錯誤的に決定される。ただし、適切な前処理フィルタの探索を機械学習の中で行うようにしてもよい。また、前処理として、前処理部１３１は、時系列信号の時間幅の調整や振幅の調整を行うことがある。

　モデル学習部１３２は、前処理部１３１を通過した訓練データを用いて機械学習によりモデルを生成し、生成したモデルをモデル記憶部１２５に保存する。例えば、モデル学習部１３２は、訓練データである複数の正常サンプルを含むｋ近傍法モデルを生成する。ｋ近傍法モデルは、例えば、入力サンプルに最も類似する正常サンプルと当該入力サンプルとの間の距離（最短距離）を算出し、距離が閾値以下の場合は正常と判定し、距離が閾値を超える場合は異常と判定するモデルとして学習される。

　前処理部１３３は、計測データ記憶部１２２に新しい計測データが到着すると、新しい計測データに対して前処理を行い、前処理された入力データを生成する。前処理部１３３は、入力データを予測部１３４に提供する。前処理として、前処理部１３３は、フィルタ記憶部１２３に記憶されたフィルタを使用することがある。前処理部１３３が使用するフィルタは、原則として、前処理部１３１がモデル学習時に使用したフィルタと同一である。ただし、フィルタ更新部１３５によって、モデル学習時と異なるフィルタに変更されることがある。また、前処理として、前処理部１３３は、時系列信号の時間幅の調整や振幅の調整を行うことがある。時間幅や振幅の調整方法は、モデル学習時と同じである。また、前処理部１３３は、フィルタ更新部１３５からの要求に応じて、フィルタ通過後の入力データおよびフィルタ通過前の入力データをフィルタ更新部１３５に提供する。

　予測部１３４は、前処理部１３３を通過した入力データを、モデル記憶部１２５に記憶されたモデルに入力して、入力データの属するクラスを予測する。例えば、予測部１３４は、入力データが正常か異常かを予測する。予測部１３４は、入力データの属するクラスを示す予測結果を生成して予測結果記憶部１２６に保存する。更に、予測部１３４は、予測結果を表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

　フィルタ更新部１３５は、運用開始後にモデルの予測精度が低下した場合に、前処理部１３３が使用するフィルタを更新する。具体的には、フィルタ更新部１３５は、予測部１３４が出力した予測結果を予測結果記憶部１２６から読み出し、計測データに付加されている教師ラベルと予測結果とを比較する。フィルタ更新部１３５は、教師ラベルと予測結果とが同一のクラス分類を示している場合は正解と判断し、教師ラベルと予測結果とが異なるクラス分類を示している場合は不正解と判断する。フィルタ更新部１３５は、直近の所定個の入力サンプルに対する比較結果から、正答率などの予測精度を算出する。最新の予測精度が閾値未満に低下した場合、フィルタ更新部１３５は、前処理フィルタを更新すると決定する。予測精度の閾値は、予め固定的に決めておいてもよいし、モデルが学習された当初の予測精度を基準にして決めるようにしてもよい。

　フィルタを更新する場合、フィルタ更新部１３５は、最近のフィルタ通過後の入力データを前処理部１３３から取得し、その中から予測精度の低下の原因となった入力データを特定する。予測精度の低下の原因となった入力データは、例えば、訓練データとの距離が閾値を超える入力データである。フィルタ更新部１３５は、訓練データ記憶部１２４に記憶された訓練データを参照して、予測精度の低下の原因を特定してもよい。また、フィルタ更新部１３５は、正常を示す教師ラベルが対応付けられた入力サンプルのうち、誤って異常と判定された入力サンプルを、予測精度の低下の原因として特定してもよい。

　予測精度の低下の原因となった入力データが特定されると、フィルタ更新部１３５は、当該原因に対応するフィルタ通過前の入力データを前処理部１３３から取得する。フィルタ更新部１３５は、パラメータを変更したフィルタを生成し、生成したフィルタに当該入力データを入力し、フィルタ通過後の入力データと訓練データとの間の距離を算出する。例えば、フィルタ更新部１３５は、カットオフ周波数やフィルタ次数を変更したローパスフィルタを生成し、生成したローパスフィルタに当該入力データを入力する。フィルタ更新部１３５は、距離が小さくなるようにフィルタのパラメータを調整する。これにより、前処理部１３３が使用するフィルタが更新される。フィルタ更新部１３５は、生成したフィルタをフィルタ記憶部１２３に保存してもよい。

　なお、フィルタ更新部１３５は、フィルタ最適化後の入力データと訓練データとの間の距離が、所定の閾値以下であるか判断し、距離が閾値を超える場合にはフィルタ最適化が失敗したと判断してもよい。計測データに含まれるノイズの傾向がモデル学習時と大きく異なる場合、フィルタ最適化のみではモデルの予測精度が十分に回復されない可能性があるためである。この場合、最新の計測データを用いてモデルを再学習することが好ましい。そこで、例えば、フィルタ更新部１３５は、フィルタ最適化後の入力データと訓練データとの間の距離が閾値を超える場合、モデルの再学習を促す警告を出力してもよい。この閾値は、ｋ近傍法モデルで正常／異常の分類に使用する閾値と同一でもよい。警告は、表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

　図１４は、計測データテーブルの例を示す図である。
　計測データテーブル１２７は、計測データ記憶部１２２に記憶される。計測データ記憶部１２１に、計測データテーブル１２７と同様のテーブルが記憶されてもよい。計測データテーブル１２７は、ＩＤ、時系列データおよび教師ラベルの項目を含む。ＩＤは、時系列データのサンプルを識別する。時系列データは、心電図データや歩行データなど、時間軸に沿って信号レベルが変動する一次元データである。時系列データの信号レベルは、所定のサンプリングレートで計測される。教師ラベルは、時系列データが属する分類クラスの正解を示す。例えば、教師ラベルは、正常または異常を表す。

　図１５は、フィルタテーブルの例を示す図である。
　フィルタテーブル１２８は、フィルタ記憶部１２３に記憶される。フィルタテーブル１２８は、ＩＤ、カットオフ周波数、ＦＩＲフィルタの項目を含む。ＩＤは、ローパスフィルタを識別する。カットオフ周波数は、通過させる周波数と遮断する周波数との境界を示す。ローパスフィルタとして動作するＦＩＲフィルタは、最新の入力信号および過去の所定個の入力信号それぞれに乗ずるフィルタ係数を含む線形式によって表現される。ただし、ローパスフィルタをＩＩＲフィルタなど他のフィルタ形式で実装してもよい。カットオフ周波数は、ローパスフィルタのパラメータの一種である。ローパスフィルタのパラメータに、フィルタ次数が含まれてもよい。また、ローパスフィルタにパラメータに、カットオフ周波数の周辺の減衰率を示す振幅が含まれてもよい。また、フィルタ係数を、ローパスフィルタのパラメータの一種として調整できるようにしてもよい。

　次に、機械学習装置１００の処理手順について説明する。以下の説明では、ｋ近傍法に基づいて心電図データの正常／異常を判定する場合を想定する。
　図１６は、学習時処理の手順例を示すフローチャートである。

　（Ｓ１０）前処理部１３１は、正常な計測データを取得する。異常な計測データは取得しなくてよく、計測データに教師ラベルが明示的に付加されていなくてもよい。
　（Ｓ１１）前処理部１３１は、計測データから所定周期の複数の正常サンプルを抽出し、各正常サンプルの時間幅および振幅を正規化する。

　（Ｓ１２）前処理部１３１は、複数の正常サンプルそれぞれをローパスフィルタに通す。ローパスフィルタに対して設定されるカットオフ周波数やフィルタ次数などのパラメータは、ユーザから指定される。ただし、正常サンプルをローパスフィルタに通さないようにしてもよい。また、カットオフ周波数を十分に大きくするなどローパスフィルタのパラメータを調整することで、ローパスフィルタを実質的に無効化してもよい。

　（Ｓ１３）前処理部１３１は、ステップＳ１１，Ｓ１２を含む前処理を行った後の正常サンプルの集合を訓練データとして生成し、訓練データ記憶部１２４に保存する。
　（Ｓ１４）モデル学習部１３２は、訓練データからｋ近傍法モデルを学習する。ここで学習されるｋ近傍法モデルは、入力サンプルと複数の正常サンプルそれぞれとの間の距離のうち最短距離を求め、最短距離が閾値以下であれば正常と判定し、最短距離が閾値を超えれば異常と判定する最近傍法モデルである。閾値はユーザから指定されてもよい。モデル学習部１３２は、ｋ近傍法モデルをモデル記憶部１２５に保存する。

　図１７は、運用時処理の手順例を示すフローチャートである。
　（Ｓ２０）前処理部１３３は、モデル学習後に計測された計測データを取得する。この計測データには、正常または異常を示す教師ラベルが付加される。教師ラベルは、例えば、医療関係者などの専門家が計測データに対してフィードバックしたものである。

　（Ｓ２１）前処理部１３３は、計測データから所定周期の複数の入力サンプルを抽出し、各入力サンプルの時間幅および振幅を正規化する。
　（Ｓ２２）前処理部１３３は、複数の入力サンプルそれぞれをローパスフィルタに通す。ローパスフィルタに対して設定されるカットオフ周波数やフィルタ次数などのパラメータは、原則としてモデル学習に用いたものと同一である。ただし、後述するようにモデル学習後にパラメータを変更した場合、直近の変更後のパラメータが使用される。

　（Ｓ２３）予測部１３４は、モデル記憶部１２５に保存されたｋ近傍法モデルを読み出す。予測部１３４は、ステップＳ２１，Ｓ２２を含む前処理を行った後の入力サンプルをｋ近傍法モデルに入力し、その入力サンプルの正常／異常を予測する。予測部１３４は、正常または異常を示す予測結果を予測結果記憶部１２６に保存する。予測部１３４は、予測結果を表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

　（Ｓ２４）フィルタ更新部１３５は、ｋ近傍法モデルの最新の予測精度を算出する。例えば、フィルタ更新部１３５は、直近の複数の入力サンプルそれぞれについて予測結果と教師ラベルとを比較し、予測結果と教師ラベルとが一致する入力サンプルの割合を示す正答率を算出する。例えば、正答率が予測精度の指標として使用される。

　（Ｓ２５）フィルタ更新部１３５は、予測精度が閾値未満であるか判断する。閾値は、モデル学習時または運用開始後にユーザから指定されてもよい。また、閾値は、学習当初のｋ近傍法モデルの予測精度から自動的に決定されてもよい。予測精度が閾値未満の場合はステップＳ２６に進み、それ以外の場合は取得した計測データの処理を終了する。

　（Ｓ２６）フィルタ更新部１３５は、正常を示す教師ラベルが対応付けられた入力サンプルのうち、ｋ近傍法モデルによって誤って異常と判定されたものを、予測精度の低下の原因として選択する。選択する入力サンプルは、正常な入力サンプルであって、かつ、訓練データとの距離（複数の正常サンプルそれぞれとの距離のうちの最短距離）が閾値を超えるものである。この距離は、ローパスフィルタ通過後の入力サンプルと訓練データとの間で算出されるものである。ただし、ｋ近傍法モデルの閾値とは異なる閾値を用いて、正常な入力サンプルのうち訓練データとの距離が閾値を超えるものを選択してもよい。

　（Ｓ２７）フィルタ更新部１３５は、ステップＳ２６で選択した入力サンプルに対応するローパスフィルタ通過前の入力サンプルを使用して、ローパスフィルタのパラメータを探索する。フィルタ更新部１３５は、カットオフ周波数やフィルタ次数などのパラメータを変更したローパスフィルタに入力サンプルを入力し、ローパスフィルタ通過後の入力サンプルと訓練データとの距離を算出する。フィルタ更新部１３５は、この距離が最小になるようにローパスフィルタのパラメータを調整する。なお、距離が最小になるパラメータの探索には、幾つかのパラメータを試行する簡易的な探索方法を用いてもよいし、最急降下法などの最適化アルゴリズムを用いてもよい。

　（Ｓ２８）フィルタ更新部１３５は、ローパスフィルタのパラメータを更新する。更新後のパラメータは、ステップＳ２７において距離が最小になるパラメータである。更新後のパラメータは、以降に取得される計測データに対して適用される。

　第２の実施の形態の機械学習装置１００によれば、モデル学習時には前処理された訓練データを用いてモデルが学習され、モデル運用時には前処理された入力データがモデルに入力される。これにより、ノイズを含む計測データから予測精度の高いモデルを学習することができ、モデル運用時にもその予測精度を維持することができる。よって、例えば、正常／異常の分類など入力データのクラス分類を高精度に行うことが可能となる。

　また、計測デバイスのハードウェア特性の変化や使用環境の変化によってノイズの傾向が事後的に変化した場合、前処理のパラメータが更新される。よって、前処理された入力データへの影響が抑制され、モデルを再学習しなくても予測精度がモデル学習時と同程度に回復することが期待される。また、モデルを再学習しないため、機械学習の計算量や学習時間などのコストを抑制することが可能となる。また、モデル学習時に訓練データが保存され、前処理された入力データの傾向がモデル学習時の訓練データに近付くように前処理のパラメータが自動的に調整される。よって、過剰なフィルタリングやノイズ除去不足を抑制して適度なフィルタリングが行われ、予測精度が改善する可能性が高くなる。

　上記については単に本発明の原理を示すものである。更に、多数の変形や変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応する全ての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

　１０　データ前処理装置
　１１　記憶部
　１２　処理部
　１３　前処理
　１３ａ　パラメータ
　１４　モデル
　１５，１６　計測データ
　１６ａ　教師ラベル
　１７　訓練データ
　１８　入力データ
　１９　予測結果

Claims

　コンピュータが、
　第１の計測データに、パラメータに応じた前処理を実行して訓練データを生成し、
　前記訓練データを用いてモデルを学習し、
　第２の計測データに前記前処理を実行して入力データを生成し、
　前記入力データを前記モデルに入力して予測結果を生成し、前記第２の計測データに対応付けられた教師ラベルと前記予測結果とから予測精度を算出し、
　前記予測精度が閾値未満である場合、前記訓練データと前記第２の計測データから生成される前記入力データとの比較に基づいて、前記前処理の前記パラメータを変更する、
　データ前処理方法。
　前記コンピュータが更に、
　第３の計測データに、変更後の前記パラメータに応じた前記前処理を実行して他の入力データを生成し、前記他の入力データを前記モデルに入力して他の予測結果を生成する、
　請求項１記載のデータ前処理方法。
　前記パラメータは、カットオフ周波数を含み、前記前処理は、前記カットオフ周波数より高い周波数の成分を減少させる低域通過処理を含む、
　請求項１記載のデータ前処理方法。
　前記モデルは、入力された前記入力データと前記訓練データとの間の距離を算出し、前記距離に基づいて前記入力データを正常または異常に分類する分類モデルである、
　請求項１記載のデータ前処理方法。
　前記パラメータの変更では、前記訓練データと前記入力データとの間の距離を算出し、前記距離が小さくなるように前記パラメータを探索する、
　請求項１記載のデータ前処理方法。
　第１の計測データと、訓練データと、モデルと、第２の計測データと、前記第２の計測データに対応付けられた教師ラベルとを記憶する記憶部と、
　前記第１の計測データに、パラメータに応じた前処理を実行して前記訓練データを生成し、前記訓練データを用いて前記モデルを学習し、前記第２の計測データに前記前処理を実行して入力データを生成し、前記入力データを前記モデルに入力して予測結果を生成し、前記教師ラベルと前記予測結果とから予測精度を算出し、前記予測精度が閾値未満である場合、前記訓練データと前記第２の計測データから生成される前記入力データとの比較に基づいて、前記前処理の前記パラメータを変更する処理部と、
　を有するデータ前処理装置。
　コンピュータに、
　第１の計測データに、パラメータに応じた前処理を実行して訓練データを生成し、
　前記訓練データを用いてモデルを学習し、
　第２の計測データに前記前処理を実行して入力データを生成し、
　前記入力データを前記モデルに入力して予測結果を生成し、前記第２の計測データに対応付けられた教師ラベルと前記予測結果とから予測精度を算出し、
　前記予測精度が閾値未満である場合、前記訓練データと前記第２の計測データから生成される前記入力データとの比較に基づいて、前記前処理の前記パラメータを変更する、
　処理を実行させるデータ前処理プログラム。