JP7352070B2 - データ処理方法、データ処理装置、及びプログラム - Google Patents
データ処理方法、データ処理装置、及びプログラム Download PDFInfo
- Publication number
- JP7352070B2 JP7352070B2 JP2019139622A JP2019139622A JP7352070B2 JP 7352070 B2 JP7352070 B2 JP 7352070B2 JP 2019139622 A JP2019139622 A JP 2019139622A JP 2019139622 A JP2019139622 A JP 2019139622A JP 7352070 B2 JP7352070 B2 JP 7352070B2
- Authority
- JP
- Japan
- Prior art keywords
- missing
- explanatory variables
- sub
- data set
- prediction module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Tires In General (AREA)
Description
このような処理を行ったオリジナルデータを予測モジュールに機械学習をさせると、上記調整処理した非欠損データは、ノイズ成分となり易く、また、上記除去処理により、説明変数の数が少なくなるので、要因条件から特性値を予測する予測精度が低下し易い。
複数の説明変数の値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持し、前記説明変数の値に欠損情報がない複数の非欠損データと、前記説明変数の一部において前記欠損情報を含むが前記説明変数の残りの部分には値がある、該値及び該欠損情報と、前記特徴量の値とをセットにして保持する複数の欠損データと、を含むオリジナルデータセットを、コンピュータが、学習用データセットと、検証用データセットとに分離するステップと、
前記コンピュータが、前記オリジナルデータセットから前記欠損情報を持つ前記説明変数を欠損説明変数として複数個抽出するステップと、
抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した前記欠損情報を含む欠損データを、前記コンピュータが前記学習用データセット及び前記検証用データセットから削除し、さらに、前記選択欠損説明変数を前記説明変数として維持しつつ、前記コンピュータが、残りの欠損説明変数を前記学習用データセット及び前記検証用データセットから削除することにより、前記学習用データセット及び前記検証用データセットの一部分のデータセットである、前記欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理を行い、前記処理において、前記選択欠損説明変数を変更することにより、前記コンピュータが、複数のサブ学習用データセット及びサブ検証用データセットを作成するステップと、
前記コンピュータが、前記サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成するステップと、
前記コンピュータが、前記サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、前記サブ検証用データセットを用いて、前記特徴量の値の予測精度を評価するステップと、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定するステップと、を備える。
前記予測精度の評価に用いるサブ検証用データセットは、前記複数の予測モジュール候補のそれぞれにおいて定義される複数の説明変数の種類に対応した説明変数を少なくとも有するサブ検証用データセットをすべて用いて予測精度の評価をする、ことが好ましい。
前記説明変数は、前記タイヤが備える異なる構造によって規定される構造特有の構造説明変数と、前記構造説明変数とは異なる前記タイヤに共通する共通説明変数と、を含み、
前記構造説明変数は、少なくとも第1構造及び第2構造それぞれに関する構造説明変数を含み、
前記サブ学習用データセット及び前記サブ検証用データセットの少なくとも一部のサブ学習用データセット及びサブ検証用データセットにおける説明変数は、前記共通説明変数と前記第1構造及び第2構造のいずれか一方の構造に関する構造説明変数であり、他方の構造に関する構造説明変数を含まない、ことが好ましい。
前記最適値を算出するステップでは、前記予測モジュールに入力される前記説明変数の値に応じて前記予測モジュールが予測する前記特徴量の値に基づいて、前記説明変数に関する前記最適値を算出する、ことが好ましい。
複数の説明変数の値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持し、前記説明変数の値に欠損情報がない複数の非欠損データと、前記説明変数の一部において前記欠損情報を含むが前記説明変数の残りの部分には値がある、該値及び該欠損情報と、前記特徴量の値とをセットにして保持する複数の欠損データと、を含むオリジナルデータセットを、学習用データセットと、検証用データセットとに分離する分離処理部と、
前記オリジナルデータセットから前記欠損情報を持つ前記説明変数を欠損説明変数として複数個抽出する説明変数抽出処理部と、
抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した前記欠損情報を含む欠損データを、前記コンピュータが前記学習用データセット及び前記検証用データセットから削除し、さらに、前記選択欠損説明変数を前記説明変数として維持しつつ、前記コンピュータが、残りの欠損説明変数を前記学習用データセット及び前記検証用データセットから削除することにより、前記学習用データセット及び前記検証用データセットの一部分のデータセットである、前記欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理を行い、前記処理において、前記選択欠損説明変数を変更することにより、前記コンピュータが、複数のサブ学習用データセット及びサブ検証用データセットを作成するサブデータセット作成部と、
前記サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成する予測モジュール候補作成部と、
前記サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、前記サブ検証用データセットを用いて、前記特徴量の値の予測精度を評価をする予測モジュール候補評価部と、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定する予測モジュール決定部と、を備える。
複数の説明変数の値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持し、前記説明変数の値に欠損情報がない複数の非欠損データと、前記説明変数の一部において前記欠損情報を含むが前記説明変数の残りの部分には値がある、該値及び該欠損情報と、前記特徴量の値とをセットにして保持する複数の欠損データと、を含むオリジナルデータセットから、コンピュータに、学習用データセットと、検証用データセットとに分離させる手順と、
前記コンピュータに、前記オリジナルデータセットから前記欠損情報を持つ前記説明変数を欠損説明変数として複数個抽出させる手順と、
抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した前記欠損情報を含む欠損データを前記学習用データセット及び前記検証用データセットから削除し、さらに、前記選択欠損説明変数を前記説明変数として維持しつつ、残りの欠損説明変数を前記学習用データセット及び前記検証用データセットから削除することにより、前記学習用データセット及び前記検証用データセットの一部分のデータセットである、前記欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理を前記コンピュータに行わせ、前記処理において、前記コンピュータに、前記選択欠損説明変数を変更させることにより、前記コンピュータに、複数のサブ学習用データセット及びサブ検証用データセットを作成させる手順と、
前記コンピュータに、前記サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成させる手順と、
前記コンピュータに、前記サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、前記サブ検証用データセットを用いて、前記特徴量の値の予測精度を評価させる手順と、
前記コンピュータに、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定させる手順と、を備える。
一実施形態のデータ処理方法は、コンピュータにより実行される方法であり、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを作成する方法である。
予測モジュールは、オリジナルデータセットから作成される複数のサブ学習用データセットを用いて作成された複数の予測モジュール候補の中から、サブ検証用データセットを用いて評価した評価結果に基づいて定められる。
入力操作デバイス32は、操作者がデータ処理装置10に所望の指示入力をするために用いられる。例えば、予測モジュール候補を作成するための条件を設定するために入力操作デバイス32から操作者は入力する。
ディスプレイ30は、設定された情報を表示するために用いられ、例えば、データ処理方法で用いるオリジナルデータセット、学習用データセット、検証用データセット、サブ学習用データセット、サブ検証用データセット等におけるデータの数値、説明変数、欠損説明変数、予測モジュール候補を作成するための条件設定画面、及び、予測モジュール候補における予測精度の評価結果等を表示する。
オリジナルデータセットには、欠損データが含まれているので、さらに、サブデータセット作成部16は、オリジナルデータセットから欠損情報を持つ説明変数を欠損説明変数として複数個抽出する(図1のST13)。欠損説明変数は、後述するように、複数種類のサブ学習用データセット及びサブ検証用学習データセットを作成するために用いられる。
図3に示すオリジナルデータセットは、説明変数として、説明変数X1~Xn(nは自然数)を含み、説明変数それぞれに対するデータとして、データ1~データm(mは自然数)を含む。図3に示すオリジナルデータセットでは、説明変数の欄のみが図示されており、特徴量の欄の図示は省略されている。
ここで、図中の「・・・」は、実際の数値があることを示し、「NA」は、値が欠損していること、すなわち欠損情報を示している。例えば、データ1では、説明変数X21,Xnの値が欠損し、それ以外の説明変数は値を有する。データ3では、説明変数X11の値が欠損し、それ以外の説明変数は値を有する。データmでは、説明変数X1及びX21の値が欠損し、それ以外の説明変数は値を有する。したがって、欠損説明変数は、説明変数X1,X11,X21,Xnである。
図5に示すサブ学習用データセット2は、選択欠損説明変数を欠損説明変数X1とし、この欠損説明変数X1を説明変数として維持しつつ、残りの欠損説明変数X11,X21,Xnを学習用データセットから削除することにより、欠損情報がないデータセットとしたものである。この場合、欠損説明変数X1を維持するので、説明変数X1の値が欠損しているデータmが学習用データセットから削除される。
図6に示すサブ学習用データセット3は、選択欠損説明変数を欠損説明変数X1,X11とし、この欠損説明変数X1,X11を説明変数として維持しつつ、残りの欠損説明変数X21,Xnを学習用データセットから削除することにより、欠損情報がないデータセットとしたものである。この場合、欠損説明変数X1,X11を維持するので、説明変数X1,X11の値が欠損しているデータ3及びデータmが学習用データセットから削除される。
図7に示すサブ学習用データセットNは、選択欠損説明変数を全ての欠損説明変数X1,X11,X21,Xnとし、このすべての欠損説明変数X1,X11,X21,Xnを説明変数として維持することにより、欠損情報がないデータセットとしたものである。この場合、欠損説明変数X1,X11,X21,Xnを維持するので、説明変数X1,X11,X21,Xnの値が欠損しているデータ1、データ3、及びデータmが学習用データセットから削除される。
同様に、欠損説明変数が4つの場合、同様に、15(=4C1+4C2+4C3+4C4)のサブ学習用データセットができる。
このようなサブ学習用データセットを組み合わせ可能な数だけ作成することが、予測モジュールの予測精度を向上させる点から好ましい。
このようなサブ学習用データセットと同様に、サブ検証用データセットも作成される。
図8に示すように、予測モジュール候補1~Nの中で、予測モジュール候補1において定義される説明変数が最も少なく、説明変数X2~X10~Xn-1である。予測モジュール候補1における特徴量の予測精度の評価には、説明変数X2~X10~Xn-1を説明変数として持つサブ検証用データセット1の他に、説明変数X2~X10~Xn-1を少なくとも一部の説明変数として持つサブ検証用データセット2~Nも用いることができる。
同様に、予測モジュール候補2における特徴量の予測精度の評価には、サブ検証用データセット2の他に、サブ検証用データセット3~Nも用いることができ、予測モジュール候補3における特徴量の予測精度の評価には、サブ検証用データセット3の他に、サブ検証用データセット4~Nも用いることができる。
したがって、これらの検証用データセットを効率よく用いることにより、予測モジュール候補1~nを広い範囲のサブ検証用データセットによって、特徴量の予測精度を把握することができる。
なお、複数の予測モジュールを決定する場合、説明変数の組み合わせが異なっているものを決定することが好ましい。例えば、特徴量を予測するために値を入力する説明変数が、予測モジュールにおいて定義される説明変数と一致しない場合、値を入力する説明変数の一部を削除して定義される説明変数と一致するような予測モジュールを取り揃えていることが好ましい。このような場合、予測精度の評価結果の情報を、特徴量の予測値に加えて付加して、ディスプレイ30に画面表示されることが好ましい。
この場合、構造説明変数は、少なくとも第1構造及び第2構造それぞれに関する構造説明変数を含み、サブ学習用データセット及びサブ検証用データセットの少なくとも一部のサブ学習用データセット及びサブ検証用データセットにおける説明変数は、共通説明変数と第1構造及び第2構造のいずれか一方の構造に関する構造説明変数であり、他方の構造に関する構造説明変数を含まない、ことが好ましい。
図11に示すサブ学習用データセットは、共通説明変数のみを説明変数としたサブ学習用データセットであり、共通説明変数のうち、欠損説明変数である説明変数X1を維持し、データmを学習用データセットから除去している。
図12に示すサブ学習用データセットは、共通説明変数と第1構造の説明変数を説明変数としたサブ学習用データセットであり、欠損説明変数である説明変数X1,X11を維持し、データm及びデータ3を学習用データセットから除去している。
図13に示すサブ学習用データセットは、共通説明変数と第2構造の説明変数を説6明変数としたサブ学習用データセットであり、共通説明変数と第2構造の説明変数のうち、欠損説明変数である説明変数X1,X21,Xnを維持し、データ1及びデータmを学習用データセットから除去している。
図14に示すサブ学習用データセットは、共通説明変数と第1構造と第2構造の説明変数を説明変数としたサブ学習用データセットであり、共通説明変数と第1構造と第2構造の説明変数のうち、欠損説明変数である説明変数X1,X11,X21,Xnを維持し、データ1、データ3、及びデータmを学習用データセットから除去している。
予測モジュールにおいて定義される説明変数が、オリジナルデータセットが持つオリジナルデータセットの説明変数の一部である場合、例えば、Genetic Algorithmを用いて最適値を算出するときの試行途中の世代におけるデータの生成において説明変数が、オリジナルデータセットの説明変数ではありが、予測モジュールにおいて定義された説明変数を超えた説明変数を含む場合もある。このような場合でも特徴量の予測ができるように、異なる説明変数の組み合わせが定義された複数の予測モジュールを定めておくことが好ましい。
説明変数の値と特徴量の値の関係は、ディスプレイ30に表示される。説明変数の値と特徴量の値の関係は、例えば自己組織化マップにより表される。あるいは、自己組織化マップに代えて、散布図を用いて、説明変数と特徴量の値の関係を可視化してもよい。
(1)オリジナルデータセットから、コンピュータに、学習用データセットと、検証用データセットとに分離させる手順と、
(2)コンピュータに、オリジナルデータセットから上述の欠損情報を持つ説明変数を欠損説明変数として複数個抽出させる手順と、
(3)抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した欠損情報を含む欠損データを学習用データセット及び検証用データセットから削除し、さらに、選択欠損説明変数を説明変数として維持しつつ、残りの欠損説明変数を学習用データセット及び検証用データセットから削除することにより、学習用データセット及び検証用データセットの一部分のデータセットである、欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理をコンピュータに行わせ、上記処理において、コンピュータに、選択欠損説明変数を変更させることにより、コンピュータに、複数のサブ学習用データセット及びサブ検証用データセットを作成させる手順と、
(4)コンピュータに、サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成させる手順と、
(5)コンピュータに、サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、サブ検証用データセットを用いて、特徴量の値の予測精度を評価させる手順と、
(6)コンピュータに、予測精度の評価結果に基づいて、複数の予測モジュール候補から予測モジュールを決定させる手順と、を備える。
12 CPU
14 メモリ
16 サブデータセット作成部
18 予測モジュール候補作成部
20 予測モジュール候補作成部
22 予測モジュール決定部
24 予測部
30 ディスプレイ
32 入力操作デバイス
Claims (10)
- 複数の説明変数の値を入力することにより予め定めた特徴量に関する値を、コンピュータが予測して出力する予測モジュールを作成するためのデータ処理方法であって、
複数の説明変数の値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持し、前記説明変数の値に欠損情報がない複数の非欠損データと、前記説明変数の一部において前記欠損情報を含むが前記説明変数の残りの部分には値がある、該値及び該欠損情報と、前記特徴量の値とをセットにして保持する複数の欠損データと、を含むオリジナルデータセットを、コンピュータが、学習用データセットと、検証用データセットとに分離するステップと、
前記コンピュータが、前記オリジナルデータセットから前記欠損情報を持つ前記説明変数を欠損説明変数として複数個抽出するステップと、
抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した前記欠損情報を含む欠損データを、前記コンピュータが前記学習用データセット及び前記検証用データセットから削除し、さらに、前記選択欠損説明変数を前記説明変数として維持しつつ、前記コンピュータが、残りの欠損説明変数を前記学習用データセット及び前記検証用データセットから削除することにより、前記学習用データセット及び前記検証用データセットの一部分のデータセットである、前記欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理を行い、前記処理において、前記選択欠損説明変数を変更することにより、前記コンピュータが、複数のサブ学習用データセット及びサブ検証用データセットを作成するステップと、
前記コンピュータが、前記サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成するステップと、
前記コンピュータが、前記サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、前記サブ検証用データセットを用いて、前記特徴量の値の予測精度を評価するステップと、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定するステップと、を備えることを特徴とするデータ処理方法。 - 前記サブ学習用データセット及び前記サブ検証用データセットを作成するときに用いる、選択する前記欠損説明変数の組合せは、2つの欠損説明変数の組み合わせの他に、3つ以上の欠損説明変数の組み合わせを含み、
前記予測精度の評価に用いるサブ検証用データセットは、前記複数の予測モジュール候補のそれぞれにおいて定義される複数の説明変数の種類に対応した説明変数を少なくとも有するサブ検証用データセットをすべて用いて予測精度の評価をする、請求項1に記載のデータ処理方法。 - 前記オリジナルデータセットを前記学習用データセットと前記検証用データセットとに分割するとき、前記検証用データセットを前記オリジナルデータセットの異なる部分から取り出し、残りの部分を前記学習用データセットとする分割を複数回行い、前記分割の度に、前記学習用データセットを用いて作成した前記複数の予測モジュール候補の予測精度の評価を行い、複数回行った予測精度の評価結果の平均値に基づいて前記複数の予測モジュール候補から前記予測モジュールを決定する、請求項1又は2に記載のデータ処理方法。
- 前記サブ学習用データセット及び前記サブ検証用データセットを作成するとき、前記抽出した前記欠損説明変数全てを、前記コンピュータが前記学習用データセット及び前記検証用データセットから削除することにより作成したデータセットを、前記サブ学習用データセット及び前記サブ検証用データセットとして作成する、請求項1~3のいずれか1項に記載のデータ処理方法。
- 前記サブ学習用データセット及び前記サブ検証用データセットを作成するとき、前記抽出した複数の欠損説明変数の全ての組み合わせに対応したサブ学習用データセット及びサブ検証用データセットを作成する、請求項1~4のいずれか1項に記載のデータ処理方法。
- 前記特徴量は、タイヤに作用する物理量であり、
前記説明変数は、前記タイヤが備える異なる構造によって規定される構造特有の構造説明変数と、前記構造説明変数とは異なる前記タイヤに共通する共通説明変数と、を含み、
前記構造説明変数は、少なくとも第1構造及び第2構造それぞれに関する構造説明変数を含み、
前記サブ学習用データセット及び前記サブ検証用データセットの少なくとも一部のサブ学習用データセット及びサブ検証用データセットにおける説明変数は、前記共通説明変数と前記第1構造及び第2構造のいずれか一方の構造に関する構造説明変数であり、他方の構造に関する構造説明変数を含まない、請求項1~5のいずれか1項に記載のデータ処理方法。 - さらに、前記特徴量に関する目標値の入力に応じて、前記コンピュータが、前記予測モジュールを用いて前記目標値を再現する前記説明変数に関する最適値を算出するステップを備え、
前記最適値を算出するステップでは、前記予測モジュールに入力される前記説明変数の値に応じて前記予測モジュールが予測する前記特徴量の値に基づいて、前記説明変数に関する前記最適値を算出する、請求項1~6のいずれか1項に記載のデータ処理方法。 - 前記説明変数の値と前記特徴量の値の関係を可視化するステップを、さらに備える、請求項1~7のいずれか1項に記載のデータ処理方法。
- 複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを作成する、コンピュータで構成されたデータ処理装置であって、
複数の説明変数の値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持し、前記説明変数の値に欠損情報がない複数の非欠損データと、前記説明変数の一部において前記欠損情報を含むが前記説明変数の残りの部分には値がある、該値及び該欠損情報と、前記特徴量の値とをセットにして保持する複数の欠損データと、を含むオリジナルデータセットを、学習用データセットと、検証用データセットとに分離する分離処理部と、
前記オリジナルデータセットから前記欠損情報を持つ前記説明変数を欠損説明変数として複数個抽出する説明変数抽出処理部と、
抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した前記欠損情報を含む欠損データを、前記コンピュータが前記学習用データセット及び前記検証用データセットから削除し、さらに、前記選択欠損説明変数を前記説明変数として維持しつつ、前記コンピュータが、残りの欠損説明変数を前記学習用データセット及び前記検証用データセットから削除することにより、前記学習用データセット及び前記検証用データセットの一部分のデータセットである、前記欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理を行い、前記処理において、前記選択欠損説明変数を変更することにより、前記コンピュータが、複数のサブ学習用データセット及びサブ検証用データセットを作成するサブデータセット作成部と、
前記サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成する予測モジュール候補作成部と、
前記サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、前記サブ検証用データセットを用いて、前記特徴量の値の予測精度を評価をする予測モジュール候補評価部と、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定する予測モジュール決定部と、を備えることを特徴とするデータ処理装置。 - 複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを作成するためのデータ処理方法を、コンピュータに実行させるプログラムであって、
複数の説明変数の値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持し、前記説明変数の値に欠損情報がない複数の非欠損データと、前記説明変数の一部において前記欠損情報を含むが前記説明変数の残りの部分には値がある、該値及び該欠損情報と、前記特徴量の値とをセットにして保持する複数の欠損データと、を含むオリジナルデータセットから、コンピュータに、学習用データセットと、検証用データセットとに分離させる手順と、
前記コンピュータに、前記オリジナルデータセットから前記欠損情報を持つ前記説明変数を欠損説明変数として複数個抽出させる手順と、
抽出した複数の欠損説明変数のいずれか1つ、あるいは少なくとも2つ以上の欠損説明変数を組み合わせた欠損説明変数の組を選択し、選択した選択欠損説明変数に対応した前記欠損情報を含む欠損データを前記学習用データセット及び前記検証用データセットから削除し、さらに、前記選択欠損説明変数を前記説明変数として維持しつつ、残りの欠損説明変数を前記学習用データセット及び前記検証用データセットから削除することにより、前記学習用データセット及び前記検証用データセットの一部分のデータセットである、前記欠損情報がないサブ学習用データセット及びサブ検証用データセットを作成する処理を前記コンピュータに行わせ、前記処理において、前記コンピュータに、前記選択欠損説明変数を変更させることにより、前記コンピュータに、複数のサブ学習用データセット及びサブ検証用データセットを作成させる手順と、
前記コンピュータに、前記サブ学習用データセットのそれぞれを用いて機械学習させた予測モジュール候補を作成させる手順と、
前記コンピュータに、前記サブ学習用データセット別に機械学習した複数の予測モジュール候補のそれぞれに対して、前記サブ検証用データセットを用いて、前記特徴量の値の予測精度を評価させる手順と、
前記コンピュータに、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定させる手順と、を備えることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019139622A JP7352070B2 (ja) | 2019-07-30 | 2019-07-30 | データ処理方法、データ処理装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019139622A JP7352070B2 (ja) | 2019-07-30 | 2019-07-30 | データ処理方法、データ処理装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022275A JP2021022275A (ja) | 2021-02-18 |
JP7352070B2 true JP7352070B2 (ja) | 2023-09-28 |
Family
ID=74574291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019139622A Active JP7352070B2 (ja) | 2019-07-30 | 2019-07-30 | データ処理方法、データ処理装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7352070B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012162226A (ja) | 2011-02-09 | 2012-08-30 | Honda Motor Co Ltd | 関係式推定支援方法および関係式推定支援装置 |
JP2014063432A (ja) | 2012-09-24 | 2014-04-10 | Nippon Telegr & Teleph Corp <Ntt> | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム |
WO2014199920A1 (ja) | 2013-06-12 | 2014-12-18 | 日本電気株式会社 | 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体 |
JP2017090947A (ja) | 2015-11-02 | 2017-05-25 | オムロン株式会社 | 製造プロセスの予測システムおよび予測制御システム |
JP2018173813A (ja) | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 比較プログラム、比較方法および比較装置 |
-
2019
- 2019-07-30 JP JP2019139622A patent/JP7352070B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012162226A (ja) | 2011-02-09 | 2012-08-30 | Honda Motor Co Ltd | 関係式推定支援方法および関係式推定支援装置 |
JP2014063432A (ja) | 2012-09-24 | 2014-04-10 | Nippon Telegr & Teleph Corp <Ntt> | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム |
WO2014199920A1 (ja) | 2013-06-12 | 2014-12-18 | 日本電気株式会社 | 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体 |
JP2017090947A (ja) | 2015-11-02 | 2017-05-25 | オムロン株式会社 | 製造プロセスの予測システムおよび予測制御システム |
JP2018173813A (ja) | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 比較プログラム、比較方法および比較装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2021022275A (ja) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6561455B2 (ja) | データの分析方法およびデータの表示方法 | |
JP4888227B2 (ja) | データ解析プログラム、データ解析装置、構造体の設計プログラム、および構造体の設計装置 | |
AU2006234877A1 (en) | Mahalanobis distance genetic algorithm method and system | |
JP6263883B2 (ja) | データ処理方法および構造体の設計方法 | |
EP2064630A2 (en) | Forecasting petroleum reservoir production using genetic algorithms | |
JP2006285381A (ja) | 構造体の設計方法 | |
CN105183928A (zh) | 铸铝构件中的残余应力和变形的快速分析 | |
JP6589285B2 (ja) | データの分析方法およびデータの表示方法 | |
CN106991212A (zh) | 一种基于ga_pso优化grnn网络算法的叶根强度安全特性预测方法 | |
CN106067029A (zh) | 面向数据空间的实体分类方法 | |
JP2020030683A (ja) | ゴム材料設計方法、ゴム材料設計装置、及びプログラム | |
JP5966836B2 (ja) | 評価支援方法、情報処理装置、及びプログラム | |
JP6544005B2 (ja) | 構造体の近似モデル作成方法、構造体の近似モデル作成装置、およびプログラム | |
JP6349723B2 (ja) | シミュレーション方法、その装置およびプログラム | |
JP5889759B2 (ja) | 欠損値予測装置、欠損値予測方法、欠損値予測プログラム | |
JP5236301B2 (ja) | タイヤの設計方法 | |
JP7352070B2 (ja) | データ処理方法、データ処理装置、及びプログラム | |
JP2001287516A (ja) | タイヤの設計方法、タイヤ用加硫金型の設計方法、タイヤ用加硫金型の製造方法、タイヤの製造方法、タイヤの最適化解析装置及びタイヤの最適化解析プログラムを記録した記憶媒体 | |
CN111782904B (zh) | 一种基于改进smote算法的非平衡数据集处理方法及系统 | |
JP7152938B2 (ja) | 機械学習モデル構築装置および機械学習モデル構築方法 | |
JP7360016B2 (ja) | データ処理方法、データ処理装置、及びプログラム | |
JP6544006B2 (ja) | 構造体の近似モデル作成方法、構造体の近似モデル作成装置、およびプログラム | |
Bartz-Beielstein | Stacked generalization of surrogate models-a practical approach | |
JP2008059106A (ja) | サンプリング生成装置、サンプリング生成プログラムが記録された媒体及びサンプリング生成方法 | |
JP6565285B2 (ja) | 構造体の近似モデル作成方法、構造体の近似モデル作成装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220617 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230523 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230706 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7352070 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |