JP2018147280A - Data analysis device and data analysis method - Google Patents
Data analysis device and data analysis method Download PDFInfo
- Publication number
- JP2018147280A JP2018147280A JP2017042472A JP2017042472A JP2018147280A JP 2018147280 A JP2018147280 A JP 2018147280A JP 2017042472 A JP2017042472 A JP 2017042472A JP 2017042472 A JP2017042472 A JP 2017042472A JP 2018147280 A JP2018147280 A JP 2018147280A
- Authority
- JP
- Japan
- Prior art keywords
- data
- variable
- explanatory
- explanatory variable
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 20
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims abstract description 54
- 238000010801 machine learning Methods 0.000 claims abstract description 46
- 238000000611 regression analysis Methods 0.000 claims description 7
- 238000004088 simulation Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 10
- 238000013210 evaluation model Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012854 evaluation process Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本開示は、機械学習における入力データ及び出力データの関係性を分析するデータ分析装置及びデータ分析方法に関する。 The present disclosure relates to a data analysis apparatus and a data analysis method for analyzing the relationship between input data and output data in machine learning.
従来、ニューラルネットワーク等の機械学習技術が注目を集めている。機械学習により得られた機械学習モデルを利用して様々な問題を解決することが行われている。 Conventionally, machine learning techniques such as neural networks have attracted attention. Various problems are solved by using a machine learning model obtained by machine learning.
特許文献1においては、機械学習手法を通じて、金融与信問題、クレジットカードの不正顧客の発見、ネットワークにおける不正アクセスの発見等の用途に活用できる技術が提案されている。特許文献1に記載された手法は、類似事例に基づく予測結果の確信度に、その確信度の信頼度を示す信頼性尺度を付加することにより、予測結果に対するユーザのその後の判断を支援する仕組みを持っている。
しかしながら、特許文献1に記載された手法を用いた場合、ユーザは個別の説明変数が予測結果に対して寄与している度合いを知ることができない。すなわち、ユーザはどのような要因により入力データから予測結果が導かれたかを知ることができない。換言すると、ユーザは、ニューラルネットワークにおいて説明変数と予測結果である目的変数との関連性が未知のまま機械学習モデルを利用していた。このため、ユーザは予測結果に基づいてどのような判断をすべきか知ることが困難であった。
However, when the method described in
本開示はこのような状況に鑑みてなされたものであり、予測結果に基づいてどのような判断をすべきかをユーザが容易に知ることができる技術を提供する。 The present disclosure has been made in view of such a situation, and provides a technique by which a user can easily know what judgment should be made based on a prediction result.
上記課題を解決するために、代表的な本開示のデータ分析装置の一つは、機械学習モデルに入力する説明変数のデータを生成し、生成した前記説明変数のデータを前記機械学習モデルに入力して目的変数のデータを得るデータセット生成部と、前記データセット生成部が生成した前記説明変数のデータと前記目的変数のデータとに基づいて、前記説明変数と前記目的変数との関係性を算出するモデル評価部と、を備える。 In order to solve the above problem, one of the representative data analysis devices of the present disclosure generates data of explanatory variables to be input to a machine learning model, and inputs the generated data of the explanatory variables to the machine learning model. Based on the data of the explanatory variable generated by the data set generating unit and the data of the objective variable, the relationship between the explanatory variable and the objective variable is obtained. A model evaluation unit for calculating.
また、代表的な本開示のデータ分析方法の一つは、機械学習モデルに入力する説明変数のデータを生成し、生成した前記説明変数のデータを前記機械学習モデルに入力して目的変数のデータを得るステップと、生成した前記説明変数のデータと前記目的変数のデータとに基づいて、前記説明変数と前記目的変数との関係性を算出するステップと、を含む。 Also, one of the representative data analysis methods of the present disclosure is to generate data of explanatory variables to be input to a machine learning model, and input the generated data of the explanatory variables to the machine learning model to obtain data of objective variables. And calculating the relationship between the explanatory variable and the objective variable based on the generated data of the explanatory variable and the data of the objective variable.
本開示によれば、学習済の機械学習モデルに対し、説明変数毎に目的変数に対する影響の度合いを算出することが可能となる。これにより、機械学習モデルがどのような要因で出力結果を求めたのかを推測することが容易になり、ユーザがその後の施策を行う際の判断が容易になる。
なお、上述した以外の課題、構成及び効果は、以下の本発明を実施するための形態及び添付図面によって明らかになるものである。
According to the present disclosure, it is possible to calculate the degree of influence on an objective variable for each explanatory variable with respect to a learned machine learning model. As a result, it is easy to infer what factor the machine learning model has obtained the output result, and it is easy for the user to make a determination when performing subsequent measures.
Problems, configurations, and effects other than those described above will become apparent from the following embodiments for implementing the present invention and the accompanying drawings.
以下、添付図面を参照して本発明の実施形態について説明する。ただし、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。また、各図において共通の構成については同一の参照番号が付されている。なお、本願明細書において学習済みモデルとは機械学習によって得られたモデルのことであり、機械学習モデルとも称する。 Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. However, it should be noted that this embodiment is merely an example for realizing the present invention, and does not limit the technical scope of the present invention. In each drawing, the same reference numerals are assigned to common components. In the present specification, the learned model is a model obtained by machine learning, and is also referred to as a machine learning model.
<データ分析装置の構成>
図1は、実施形態に係るデータ分析装置1の概略構成を示す機能ブロック図である。このデータ分析装置1は、必要な演算処理及び制御処理等を行う中央処理装置(プロセッサ)100と、データの入出力を行うための入出力装置110と、中央処理装置100による処理に必要なプログラムを格納するプログラムメモリ120と、中央処理装置100による処理の対象となるデータ又は中央処理装置100によって処理した後のデータを格納する記憶装置130と、を有している。
<Configuration of data analyzer>
FIG. 1 is a functional block diagram illustrating a schematic configuration of a
入出力装置110は、データを表示するための表示部111やプリンタ(図示せず)等で構成される出力デバイスと、表示されたデータに対してメニューを選択するなどの操作を行うためのキーボード112、マウスなどのポインティングデバイス113と、を有している。
The input /
プログラムメモリ120は、機械学習によって生成された学習済みモデルに対し、様々な入力データを入力して出力結果を得るシミュレーションプログラム121と、シミュレーション処理の結果を分析する評価プログラム122と、シミュレーション処理の分析結果を表示部111に表示する出力プログラム123と、を格納している。各処理プログラムは、プログラムコードとしてプログラムメモリ120に格納されており、中央処理装置100が各プログラムコードを実行することによって各処理が実現される。
The
中央処理装置100は、シミュレーションプログラム121を実行することによりデータセット生成部124として機能し、評価プログラム122を実行することによりモデル評価部125として機能し、出力プログラム123を実行することにより評価出力部126として機能する。
The
データセット生成部124は、機械学習モデルに入力する説明変数のデータを生成し、当該機械学習モデルに生成した上記データを入力して目的変数のデータを得る。モデル評価部125は、データセット生成部124が生成した説明変数のデータと目的変数のデータとに基づいて、説明変数と目的変数との関係性を算出する。説明変数と目的変数との関係性とは、例えば、説明変数と目的変数との統計的な相関関係を指す。評価出力部126は、モデル評価部125が算出した説明変数と目的変数との関係性を、機械学習モデルの説明変数を入力するインターフェースと併せて表示部111に表示する。
The data
記憶装置130は、あらかじめ機械学習によって生成された学習済みモデルのデータであるモデルデータ131と、モデルデータ131の生成時に使用した機械学習の教師データの入出力形式である入出力データ132と、入出力データ132をもとにシミュレーション用に生成したシミュレーションデータ133と、シミュレーションデータ133を分析処理した後に得られる評価データ134と、を格納している。なお、記憶装置130は、ネットワークを介して遠隔的に配置されていているストレージシステムであってもよい。
The
以上に述べた処理プログラム・データ・各プログラム等は、CD−ROM、DVD−ROM、USBメモリ等の種々の記録媒体に格納して提供することもできる。 The processing programs, data, programs, and the like described above can be provided by being stored in various recording media such as a CD-ROM, a DVD-ROM, and a USB memory.
<モデルデータ>
図2は、記憶装置130内のモデルデータ131の一例を示す図である。モデルデータには、機械学習により得られた学習済みモデルの設定データ及び学習済モデルで構成されるデータ種類201がある。設定データ及び学習済モデルは、それぞれデータ項目202及びその値203で構成される。
<Model data>
FIG. 2 is a diagram illustrating an example of the
設定データのデータ項目には、例えば、入力次元数や出力次元数等がある。入力次元数とは、機械学習のモデルに入力する際の説明変数の数である。また、出力次元数とは、機械学習のモデルが出力する目的変数の数である。例えば、ある日の売上、次の日の降水確率及び曜日を説明変数とし、次の日の売上を目的変数とする機械学習モデルの場合、入力次元数は3、出力次元数は1となる。 The data items of the setting data include, for example, the number of input dimensions and the number of output dimensions. The number of input dimensions is the number of explanatory variables when inputting to a machine learning model. The number of output dimensions is the number of objective variables output by the machine learning model. For example, in the case of a machine learning model in which sales on a certain day, probability of precipitation on the next day and day of the week are explanatory variables and sales on the next day are objective variables, the number of input dimensions is 3 and the number of output dimensions is 1.
学習済モデルのデータ項目には、前述のような入力データを入力して出力データを得るための学習済みモデルを特徴づけるパラメータが含まれる。なお、学習済みモデルのパラメータはユーザが把握しておく必要はなく、機械学習モデルを呼び出した際にプログラム内で自動的に使用される。 The data item of the learned model includes parameters that characterize the learned model for obtaining output data by inputting the input data as described above. Note that the parameters of the learned model do not need to be grasped by the user, and are automatically used in the program when the machine learning model is called.
<入出力データ>
図3は、記憶装置130内の入出力データ132の一例を示す図である。入出力データは、モデルの入力と出力、すなわち説明変数と目的変数を格納するデータ項目301と、データ項目301に格納された各変数のデータの種類を表すデータ型302と、データ項目301に格納された各変数のデータの値の範囲を表す値範囲303で構成される。
<Input / output data>
FIG. 3 is a diagram illustrating an example of the input /
データ型302には、例えば、浮動小数点型や2値型といった値が格納される。浮動小数点型とは、値に実数値を持つデータ型であり、例えば0.1といった値が格納される。2値型とは、男女、購入/非購入等のように2種類の値のみが格納されるデータ型であり、2種類を区別するために0又は1といった値が格納される。値範囲303には、取り得る値の範囲が格納される。例えば、データタイプが浮動小数点型で、0−1であれば、0から1の範囲の実数値が格納される。
The
<シミュレーションデータ>
図4は、記憶装置130内のシミュレーションデータ133の一例を示す図である。シミュレーションデータは、説明変数群401、402、403と、説明変数をモデルに入力した時に出力される目的変数404の組み合わせを格納するデータで構成される。説明変数及び目的変数の数はモデルデータ131における、入力次元数及び出力次元数で決定される。説明変数群の数値は、入出力データ132における、各説明変数の値範囲に含まれる値の中から重複がないように決定される。
<Simulation data>
FIG. 4 is a diagram illustrating an example of the
図4に示した例では、図3に示した入出力データに基づいてシミュレーションを行った場合のデータセットが示されている。図4に示すシミュレーションの例では、例えば、説明変数1及び3は0−1の範囲からランダムに値が生成され、説明変数2は0か1のどちらかの数値がランダムに生成される。目的変数1には、生成した説明変数1〜3を機械学習モデルに入力して得られた値が記録されている。
In the example shown in FIG. 4, a data set when a simulation is performed based on the input / output data shown in FIG. 3 is shown. In the simulation example shown in FIG. 4, for example, the
<評価データ>
図5は、記憶装置130内の評価データ134の表示画面の例を示す図である。評価データは、評価対象のモデルにおける、各説明変数に対する評価値と、モデル全体に対する評価値で構成される。具体的には、評価データ134には、各説明変数のIDである説明変数501と、各説明変数に対する評価項目が1つ以上格納される。図5では、評価項目1として標準偏回帰係数502が、評価項目2として有意確率p値が格納されている。また、モデル全体に対する評価値として、モデル評価項目504と、その値であるモデル評価値505が格納される。
<Evaluation data>
FIG. 5 is a diagram illustrating an example of a display screen of the
図5に示した評価データ表示画面は、例えば、ユーザが利用したい機械学習モデルを選択した際に、評価出力部126が当該機械学習モデルに関する評価データ134を読み込み、機械学習モデルに説明変数の値を入力するインターフェースと併せて出力することによって表示部111に表示する。
In the evaluation data display screen shown in FIG. 5, for example, when the user selects a machine learning model that the user wants to use, the
<データ分析装置における処理概要>
上述の構成を有するデータ分析装置1において行われる処理について説明する。まず、中央処理装置100は、シミュレーションプログラム121を実行してデータセット生成部124として機能する。データセット生成部124は、記憶装置130に格納されたモデルデータ131、入出力データ132を読み込み、シミュレーションを行う。中央処理装置100は、シミュレーションによって得られたシミュレーションデータ133を記憶装置130に格納する。
<Outline of processing in data analyzer>
Processing performed in the
次に、中央処理装置100は、評価プログラム122を実行してモデル評価部125として機能する。モデル評価部125は、記憶装置130からシミュレーションデータ133を読み込み、機械学習モデルの各説明変数に対する評価値と機械学習モデル全体に対する評価値を算出し、算出した評価値を評価データ134として記憶装置130に格納する。
Next, the
中央処理装置100は、出力プログラム123を実行して評価出力部126として機能する。そして評価出力部126が、評価データ134の内容を表示部111に表示する。上記それぞれの処理について、以下に詳細を説明する。
The
<シミュレーション処理>
図6は、データセット生成部124が実行するシミュレーション処理を説明するためのフローチャートである。データセット生成部124は、シミュレーション処理において、図4に示すような説明変数の値の組を生成する。データセット生成部124は、上記説明変数の値と、生成した説明変数の値を機械学習のモデルに入力した場合に得られる目的変数の値と、の組み合わせのパターンを求める処理を行う。説明変数と目的変数との組み合わせのパターンは、例えば数百万〜数億のパターンを生成する。
<Simulation process>
FIG. 6 is a flowchart for explaining the simulation processing executed by the data set
ステップ601では、データセット生成部124が、モデルデータ131と入出力データ132とを読み込む。
In
ステップ602では、データセット生成部124が、まずモデルデータ131から入力次元数と出力次元数を読み込み、入出力データ132から各説明変数のデータタイプと値範囲を読み込む。次にそれらのデータに基づいて、各説明変数の値範囲において網羅的に説明変数の組み合わせのパターンを生成する。
In
例えば、図3の入出力データの例では、説明変数1、説明変数2、説明変数3の値の組み合わせを、(説明変数1の値、説明変数2の値、説明変数3の値)のように表す時、図4のように、(0.1、0、0.2)、(0.1、0、0.3)、(0.1、1、0.2)等のような組み合わせパターンが出力される。この時点では、目的変数1の値は設定されない。組み合わせパターンをどの程度の網羅性、すなわちデータの粒度にするかは任意に設定可能である。一般的に、網羅性が高いほどモデルの評価精度が良くなるが、処理時間は多くなる。逆に網羅性が低いほどモデルの評価精度は悪くなるが、処理時間は短くなる。
For example, in the example of the input / output data in FIG. 3, the combination of the values of the
ステップ603では、データセット生成部124が、モデルデータから学習済モデルを読み込み、ステップ602で生成したシミュレーションデータを学習済モデルに入力し、出力結果すなわち目的変数を求める。
In
ステップ604では、データセット生成部124が、ステップ603で得られた目的変数の値を、対応する説明変数群のレコードに格納し、シミュレーションデータを更新する。
In
<評価処理>
図7は、モデル評価部125及び評価出力部126が実行する評価処理を説明するためのフローチャートである。評価処理では、図4のようなシミュレーションデータに基づいて、例えば図5に示す評価結果を出力する。
<Evaluation process>
FIG. 7 is a flowchart for explaining an evaluation process executed by the
ステップ701では、モデル評価部125がシミュレーションデータ133を読み込む。
In
ステップ702では、モデル評価部125がシミュレーションデータ133に対し、評価モデルを適用する。評価モデルとは、目的変数に対する影響の度合いを説明変数毎に求めるために使用するものであり、例えば重回帰分析が評価モデルに使用できる。この目的を実現できれば任意の評価モデルを適用可能である。
In
以下、評価モデルに重回帰分析を用いた場合で説明する。シミュレーションデータのレコードに対し重回帰分析を適用すると、説明変数毎に標準偏回帰係数や有意確率p値を算出することができる。標準偏回帰係数とは、その説明変数が目的変数に与える影響度の強さを表し、かつ各説明変数のスケールを統一したものである。すなわち、説明変数毎の標準偏回帰係数を比較することによって説明変数の影響の大きさを把握することができる。また、有意確率p値とは、重回帰分析によって算出された標準偏回帰係数の確からしさを表す。一般に、有意確率p値が5%を下回っていると、その説明変数は目的変数に対して「関係性がある」と判断できる。 Hereinafter, the case where multiple regression analysis is used for the evaluation model will be described. When multiple regression analysis is applied to a record of simulation data, a standard partial regression coefficient and a significance probability p value can be calculated for each explanatory variable. The standard partial regression coefficient represents the strength of the influence of the explanatory variable on the objective variable, and the scale of each explanatory variable is unified. That is, the magnitude of the influence of the explanatory variable can be grasped by comparing the standard partial regression coefficients for each explanatory variable. In addition, the significance probability p-value represents the probability of the standard partial regression coefficient calculated by multiple regression analysis. In general, when the significance probability p-value is less than 5%, it can be determined that the explanatory variable is “related” to the objective variable.
また、シミュレーションデータのレコードに対し重回帰分析を適用すると、モデル全体に対する評価項目として、決定係数や自由度調整済決定係数が算出できる。決定係数とは、目的変数の全変動のうち、全ての説明変数によって説明できる割合を表し、回帰方程式とサンプルデータとのあてはまりの良さを示す値である。また、自由度調整済決定係数とは、説明変数の数を考慮した決定係数であり、通常の決定係数が説明変数の数が増えるほど大きくなってしまう欠点を補ったものである。このようにして得られた各出力値は、評価データ134として記憶装置130に格納される。
Further, when multiple regression analysis is applied to simulation data records, determination coefficients and determination coefficients with adjusted degrees of freedom can be calculated as evaluation items for the entire model. The coefficient of determination represents the ratio that can be explained by all explanatory variables out of the total variation of the objective variable, and is a value indicating the goodness of fit between the regression equation and the sample data. The degree-of-freedom-adjusted determination coefficient is a determination coefficient that takes into account the number of explanatory variables, and compensates for the disadvantage that the normal determination coefficient increases as the number of explanatory variables increases. Each output value obtained in this way is stored in the
ステップ703では、評価出力部126が評価データ134を表示部111に表示する。このように画面表示することで、機械学習による学習済モデルにおいて、目的変数に影響を与える度合いを定量化し把握することが可能となる。
In
<まとめ>
以上説明したように、本実施形態によれば、説明変数の値を網羅的に又は十分に大きな数だけ機械学習モデルに入力し、対応する目的変数を求め、その結果に対して評価モデルを適用することにより、目的変数に影響を与える度合いを説明変数毎に定量化することが可能となる。これにより、ある説明変数群に対して出力される目的変数が、どの説明変数の影響を強く受けて出力されたかを把握することが容易になる。また、モデルの学習時に使用した教師データと正解データのみを用いて、学習済みモデルに評価モデルを適用した場合と比較して、本実施形態にように網羅的にシミュレーションを行うことにより、学習済みモデルの評価を精密に行うことが可能となる。
<Summary>
As described above, according to the present embodiment, the values of the explanatory variables are input to the machine learning model in a comprehensive or sufficiently large number, the corresponding objective variable is obtained, and the evaluation model is applied to the result. By doing so, it becomes possible to quantify the degree of influence on the objective variable for each explanatory variable. Thereby, it becomes easy to grasp which explanatory variable is strongly influenced by the objective variable output for a certain explanatory variable group. In addition, compared to the case where the evaluation model is applied to the learned model using only the teacher data and correct answer data used when learning the model, it has already been learned by performing a comprehensive simulation as in this embodiment. The model can be evaluated accurately.
また、実施形態のデータ分析装置1は、例えば、説明変数と目的変数との関係性を機械学習モデルの説明変数を入力するインターフェースと併せて表示部111に表示する。そのため、ユーザが機械学習モデルの使用時に、表示部111に表示された当該機械学習モデルの評価を確認しながら、説明変数の値を入力することができる。それ故、ユーザは機械学習モデルの出力に対する信頼性についてより定量的に検証することが可能となる。
In addition, the
なお、本発明は、実施形態そのままに限定されるものではなく、実施段階では、その要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 Note that the present invention is not limited to the embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiments. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
また、実施形態で示された各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現しても良い。また、上記各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現しても良い。各機能等を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録或いは記憶装置、又はICカード、SDカード、DVD等の記録或いは記憶媒体に格納することができる。また、本実施形態のデータ分析装置1が実行するプログラムの一部または全ては、専用ハードウェアで実現してもよく、また、モジュール化されていても良い。各種プログラムはプログラム配布サーバや記憶メディアによって各計算機にインストールされてもよい。
In addition, each configuration, function, processing unit, processing unit, and the like described in the embodiments may be realized in hardware by designing a part or all of them with, for example, an integrated circuit. Further, each of the above-described configurations, functions, etc. may be realized by software by the processor interpreting and executing a program that realizes each function. Information such as programs, tables, and files for realizing each function is stored in a recording or storage device such as a memory, a hard disk, or an SSD (Solid State Drive), or a recording or storage medium such as an IC card, SD card, or DVD. be able to. In addition, a part or all of the program executed by the
さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。 Furthermore, in the above-described embodiment, control lines and information lines are those that are considered necessary for explanation, and not all control lines and information lines on the product are necessarily shown. All the components may be connected to each other.
100…中央処理装置(プロセッサ)
110…入出力装置
111…表示部
112…キーボード
113…マウス
120…プログラムメモリ
121…シミュレーションプログラム
122…評価プログラム
123…出力プログラム
124…データセット生成部
125…モデル評価部
126…評価出力部
130…記憶装置
131…モデルデータ
132…入出力データ
133…シミュレーションデータ
134…評価データ
100: Central processing unit (processor)
DESCRIPTION OF
Claims (8)
前記データセット生成部が生成した前記説明変数のデータと前記目的変数のデータとに基づいて、前記説明変数と前記目的変数との関係性を算出するモデル評価部と、
を備えるデータ分析装置。 A data set generation unit that generates data of explanatory variables to be input to the machine learning model, inputs the generated data of the explanatory variables to the machine learning model, and obtains data of the objective variable;
A model evaluation unit that calculates the relationship between the explanatory variable and the objective variable based on the explanatory variable data and the objective variable data generated by the data set generation unit;
A data analysis apparatus comprising:
請求項1に記載のデータ分析装置。 An evaluation output unit for displaying the relationship between the explanatory variable calculated by the model evaluation unit and the objective variable together with an interface for inputting the explanatory variable of the machine learning model on a display unit;
The data analysis apparatus according to claim 1.
請求項1に記載のデータ分析装置。 The model evaluation unit calculates at least one of a significance probability or a standard partial regression coefficient for each explanatory variable by performing multiple regression analysis on a data set of the data of the explanatory variable and the data of the objective variable.
The data analysis apparatus according to claim 1.
請求項1に記載のデータ分析装置。 The model evaluation unit calculates a determination coefficient indicating a degree by which the objective variable can be explained by the explanatory variable;
The data analysis apparatus according to claim 1.
生成した前記説明変数のデータと前記目的変数のデータとに基づいて、前記説明変数と前記目的変数との関係性を算出するステップと、
を含むデータ分析方法。 Generating explanatory variable data to be input to the machine learning model, inputting the generated explanatory variable data to the machine learning model to obtain target variable data; and
Calculating a relationship between the explanatory variable and the objective variable based on the generated explanatory variable data and the objective variable data;
Data analysis method including.
請求項5に記載のデータ分析方法。 A step of displaying the relationship between the calculated explanatory variable and the objective variable on a display unit together with an interface for inputting the explanatory variable of the machine learning model;
The data analysis method according to claim 5.
請求項5に記載のデータ分析方法。 The step of calculating the relationship between the explanatory variable and the objective variable includes performing a multiple regression analysis on a data set of the explanatory variable data and the objective variable data to obtain a significant probability or Calculating at least one of the standard partial regression coefficients,
The data analysis method according to claim 5.
請求項5に記載のデータ分析方法。 The step of calculating the relationship between the explanatory variable and the objective variable is a step of calculating a determination coefficient indicating a degree that the objective variable can be explained by the explanatory variable.
The data analysis method according to claim 5.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017042472A JP2018147280A (en) | 2017-03-07 | 2017-03-07 | Data analysis device and data analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017042472A JP2018147280A (en) | 2017-03-07 | 2017-03-07 | Data analysis device and data analysis method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018147280A true JP2018147280A (en) | 2018-09-20 |
Family
ID=63591260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017042472A Pending JP2018147280A (en) | 2017-03-07 | 2017-03-07 | Data analysis device and data analysis method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018147280A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020047230A (en) * | 2018-09-21 | 2020-03-26 | 株式会社 日立産業制御ソリューションズ | Remodeling assistance device and remodeling assistance method |
JP2020077361A (en) * | 2018-11-05 | 2020-05-21 | 株式会社トランス | Learning model building device, after-employment evaluation predicting device, learning model building method, and after-employment evaluation prediction method |
WO2020110201A1 (en) * | 2018-11-27 | 2020-06-04 | 日本電気株式会社 | Information processing device |
EP3690889A1 (en) | 2019-01-30 | 2020-08-05 | Hitachi, Ltd. | Computer system and method of presenting information on basis of prediction result for input data |
WO2020170849A1 (en) * | 2019-02-19 | 2020-08-27 | Jfeスチール株式会社 | Method for predicting operating results, method for learning learning model, device for predicting operating results, and device for learning learning model |
JP2021022276A (en) * | 2019-07-30 | 2021-02-18 | 横浜ゴム株式会社 | Data processing method, data processing apparatus, and program |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06290163A (en) * | 1993-04-06 | 1994-10-18 | Hitachi Ltd | Method and system for simulation |
JPH1185857A (en) * | 1997-09-04 | 1999-03-30 | Hitachi Ltd | Dynamic mutual relation evaluating system |
JP2004110470A (en) * | 2002-09-19 | 2004-04-08 | Fujitsu Ltd | Optimal design calculating device and program storing medium therefor |
JP2006163465A (en) * | 2004-12-02 | 2006-06-22 | Fujitsu Ltd | Medical treatment information analysis apparatus, method, and program |
JP2007122418A (en) * | 2005-10-28 | 2007-05-17 | Bioinformatics Institute For Global Good Inc | Prediction method, prediction device, and prediction program |
US20140344193A1 (en) * | 2013-05-15 | 2014-11-20 | Microsoft Corporation | Tuning hyper-parameters of a computer-executable learning algorithm |
WO2016129218A1 (en) * | 2015-02-09 | 2016-08-18 | 日本電気株式会社 | Display system for displaying analytical information, method, and program |
WO2018142753A1 (en) * | 2017-02-02 | 2018-08-09 | 日本電気株式会社 | Information processing device, method, and program that use deep learning |
-
2017
- 2017-03-07 JP JP2017042472A patent/JP2018147280A/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06290163A (en) * | 1993-04-06 | 1994-10-18 | Hitachi Ltd | Method and system for simulation |
JPH1185857A (en) * | 1997-09-04 | 1999-03-30 | Hitachi Ltd | Dynamic mutual relation evaluating system |
JP2004110470A (en) * | 2002-09-19 | 2004-04-08 | Fujitsu Ltd | Optimal design calculating device and program storing medium therefor |
JP2006163465A (en) * | 2004-12-02 | 2006-06-22 | Fujitsu Ltd | Medical treatment information analysis apparatus, method, and program |
JP2007122418A (en) * | 2005-10-28 | 2007-05-17 | Bioinformatics Institute For Global Good Inc | Prediction method, prediction device, and prediction program |
US20140344193A1 (en) * | 2013-05-15 | 2014-11-20 | Microsoft Corporation | Tuning hyper-parameters of a computer-executable learning algorithm |
WO2016129218A1 (en) * | 2015-02-09 | 2016-08-18 | 日本電気株式会社 | Display system for displaying analytical information, method, and program |
WO2018142753A1 (en) * | 2017-02-02 | 2018-08-09 | 日本電気株式会社 | Information processing device, method, and program that use deep learning |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020047230A (en) * | 2018-09-21 | 2020-03-26 | 株式会社 日立産業制御ソリューションズ | Remodeling assistance device and remodeling assistance method |
JP2020077361A (en) * | 2018-11-05 | 2020-05-21 | 株式会社トランス | Learning model building device, after-employment evaluation predicting device, learning model building method, and after-employment evaluation prediction method |
WO2020110201A1 (en) * | 2018-11-27 | 2020-06-04 | 日本電気株式会社 | Information processing device |
JPWO2020110201A1 (en) * | 2018-11-27 | 2021-11-11 | 日本電気株式会社 | Information processing device |
JP7107386B2 (en) | 2018-11-27 | 2022-07-27 | 日本電気株式会社 | Information processing equipment |
EP3690889A1 (en) | 2019-01-30 | 2020-08-05 | Hitachi, Ltd. | Computer system and method of presenting information on basis of prediction result for input data |
US11443204B2 (en) | 2019-01-30 | 2022-09-13 | Hitachi, Ltd. | Computer system and method of presenting information on basis of prediction result for input data |
WO2020170849A1 (en) * | 2019-02-19 | 2020-08-27 | Jfeスチール株式会社 | Method for predicting operating results, method for learning learning model, device for predicting operating results, and device for learning learning model |
JPWO2020170849A1 (en) * | 2019-02-19 | 2021-03-11 | Jfeスチール株式会社 | Operation result prediction method, learning model learning method, operation result prediction device and learning model learning device |
JP2021022276A (en) * | 2019-07-30 | 2021-02-18 | 横浜ゴム株式会社 | Data processing method, data processing apparatus, and program |
JP7360016B2 (en) | 2019-07-30 | 2023-10-12 | 横浜ゴム株式会社 | Data processing method, data processing device, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018147280A (en) | Data analysis device and data analysis method | |
Felix et al. | Integrated approach to software defect prediction | |
Moeyersoms et al. | Comprehensible software fault and effort prediction: A data mining approach | |
Data et al. | Sensitivity analysis and model validation | |
JP2022031709A (en) | System and computer implementation method for measuring industrial process performance for industrial process facilities | |
CN113822440A (en) | Method and system for determining feature importance of machine learning samples | |
KR101312446B1 (en) | Analysis apparatus and method for usability of mobile application using user bebavior log | |
CN108292380B (en) | Factor analysis device, factor analysis method, and recording medium | |
JP2017091329A (en) | Database analysis device and database analysis method | |
US20170178149A1 (en) | Method and system for purchase pattern extraction from point of sale data | |
JP2015106340A (en) | Information processing apparatus and information processing program | |
WO2021049365A1 (en) | Information processing device, information processing method, and program | |
Rummel | Probability Plotting: A Tool for Analyzing Task Completion Times. | |
US10867249B1 (en) | Method for deriving variable importance on case level for predictive modeling techniques | |
US20150134704A1 (en) | Real Time Analysis of Big Data | |
JP5672165B2 (en) | Test data generation program, test data generation method, test data generation device | |
JP6497267B2 (en) | Test case generation method, test case generation program, and test case generation apparatus | |
JP2014164385A (en) | Requirement detection device and requirement detection program | |
JP6568488B2 (en) | Calculator and calculation method of analysis index | |
US11429748B2 (en) | Device and method for analyzing performances of a web application | |
WO2022130650A1 (en) | Analysis assistance program, analysis assistance device, and analysis assistance method | |
JP2013148968A (en) | Test data generation device, test data generation program and test data generation method | |
JP2013218381A (en) | Software evaluation support device and program | |
JP2013218607A (en) | Software quality evaluation apparatus, software quality evaluation method and program | |
JP6841667B2 (en) | Software performance measurement system and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190911 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200710 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200728 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210316 |