JP2016091343A - Information processing system, information processing method, and program - Google Patents
Information processing system, information processing method, and program Download PDFInfo
- Publication number
- JP2016091343A JP2016091343A JP2014225791A JP2014225791A JP2016091343A JP 2016091343 A JP2016091343 A JP 2016091343A JP 2014225791 A JP2014225791 A JP 2014225791A JP 2014225791 A JP2014225791 A JP 2014225791A JP 2016091343 A JP2016091343 A JP 2016091343A
- Authority
- JP
- Japan
- Prior art keywords
- attributes
- attribute
- selection
- statistic
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理システム、情報処理方法、及び、プログラムに関し、特に、データ分析を行う情報処理システム、情報処理装置、情報処理方法、及び、プログラムに関する。 The present invention relates to an information processing system, an information processing method, and a program, and more particularly, to an information processing system, an information processing apparatus, an information processing method, and a program that perform data analysis.
統計的モデルを用いたデータ分析においては、データを表現する多くの属性から、分析に利用する属性を選択する必要がある。ここでは、このような属性の選択を属性選択と呼ぶ。 In data analysis using a statistical model, it is necessary to select an attribute to be used for analysis from many attributes that represent data. Here, such attribute selection is referred to as attribute selection.
図5は、データ分析において用いられるデータの例を示す図である。図5のデータは、地域毎の家賃に係るデータの例である。図5の例では、データは、属性として、地域ID(Identifier)、人ロ、世帯数、平均年齢、男性比率、既婚率、物件数、空室率、平均年収、及び、平均家賃を含む。 FIG. 5 is a diagram illustrating an example of data used in data analysis. The data in FIG. 5 is an example of data related to rent for each region. In the example of FIG. 5, the data includes the region ID (Identifier), the number of people, the number of households, the average age, the male ratio, the marriage rate, the number of properties, the vacancy rate, the average annual income, and the average rent as attributes.
このようなデータに対する統計的モデルとして、回帰分析モデルが用いられる場合、例えば、属性の内の平均家賃を予測する一次関数式が、他の属性(人ロ、世帯数、平均年齢、男性比率、既婚率、物件数、空室率、平均年収)を変数として表現される。 When a regression analysis model is used as a statistical model for such data, for example, a linear function formula that predicts the average rent among the attributes is the other attributes (people, households, average age, male ratio, Marriage rate, number of properties, vacancy rate, average annual income) are expressed as variables.
統計的モデルの生成のために用いたデータ(学習データ)の数が属性数より少ない場合、生成された統計的モデルが未知のデータ(テストデータ)に対しては適合しない状態である、過学習が起こることがある。過学習を避けるためには、BIC(Bayesian Information Criterion:ベイズ情報量規準)等の様々な情報量規準、及び、情報量規準に基づいて属性の集合の最適解を推定するアルゴリズムが提案されている。このようなアルゴリズムを用いて、多数の属性の内の一部の属性を選択することにより、過学習のない統計的モデルを得ることができる。 If the number of data (learning data) used to generate the statistical model is less than the number of attributes, the generated statistical model is not suitable for unknown data (test data). May happen. In order to avoid over-learning, various information criteria such as BIC (Bayesian Information Criterion) and algorithms for estimating an optimal solution of a set of attributes based on the information criterion have been proposed. . A statistical model without overlearning can be obtained by selecting some of the many attributes using such an algorithm.
ところが、上述のような、アルゴリズムによる属性選択で得られた属性の集合は、分析者の意向に沿わないこともある。すなわち、アルゴリズムでは、与えられた学習データに基づいて属性選択を行うが、分析者は、その他の知識として一般知識や、領域知識、直観等を持つため、アルゴリズムにより得られた属性の組を不適切と判断することがある。例えば、属性が特定の領域に係る特性であり、分析者が当該特定の領域に精通している場合に、分析者は、属性の値の取得の難易度等をもとに、アルゴリズムにより得られた属性の削除、或いは、他の属性の追加をすることがある。 However, the attribute set obtained by the attribute selection by the algorithm as described above may not conform to the intention of the analyst. In other words, the algorithm selects attributes based on given learning data, but the analyst has general knowledge, domain knowledge, intuition, etc. as other knowledge. May be considered appropriate. For example, if an attribute is a characteristic related to a specific area and the analyst is familiar with the specific area, the analyst can obtain the algorithm based on the difficulty of acquiring the attribute value. Attribute may be deleted, or other attributes may be added.
一般的に、上述のような分析者の知識を、事前に全属性について表現できれば、それらをアルゴリズムによる属性選択に反映することができる。しかしながら、例えば、分析者が知識を表現する方法を知らない場合、分析者の知識を反映することはできない。また、属性数が多い場合は、全属性に対する知識を反映できるとは限らない。さらに、分析者がアルゴリズムによる属性選択の結果を見たときに、新たな知識が生まれるような場合も、事前に、分析者の知識を反映することはできない。 Generally, if the analyst's knowledge as described above can be expressed in advance for all attributes, they can be reflected in attribute selection by an algorithm. However, for example, if the analyst does not know how to express knowledge, the knowledge of the analyst cannot be reflected. In addition, when the number of attributes is large, it is not always possible to reflect knowledge about all attributes. Furthermore, even when new knowledge is born when the analyst sees the result of attribute selection by the algorithm, the knowledge of the analyst cannot be reflected in advance.
したがって、アルゴリズムによる属性選択で得られる属性の集合に対して、分析者による属性の追加、削除等の操作が要求される。 Therefore, operations such as addition and deletion of attributes by an analyst are required for a set of attributes obtained by attribute selection by an algorithm.
統計的モデルを用いたデータ分析における、このような分析者による属性の操作に係る技術が、例えば、特許文献1、特許文献2に開示されている。
For example,
特許文献1に記載の入力変数選択支援装置は、各入力候補変数の出力変数に対する感度を生成し、生成した感度に基づいて入力変数を選択し、提示する。特許文献2に記載のデータ解析方法は、回帰分析において、説明属性、及び、目的属性を選択したときに、説明属性と目的属性との関係を解析結果として提示する。
The input variable selection support device described in
なお、関連技術として、非特許文献1には、近似アルゴリズムであるグリーディ法を用いた技術が開示されている。
As a related technique, Non-Patent
上述した特許文献1や特許文献2の技術では、入力変数の出力変数に対する感度や、説明属性と目的属性間の関係は提示される。しかしながら、特許文献1や特許文献2の技術では、分析者は、現在選択されている入力変数や説明属性に対して、入力変数や説明属性の追加、削除等の操作を行った場合に、生成される統計的モデルがどのように変化するかを把握することはできない。
In the techniques of
本発明の目的は、上述の課題を解決し、統計的モデルを用いたデータ分析における属性に対する操作を効率的に実行できる、情報処理システム、情報処理方法、及び、プログラムを提供することである。 An object of the present invention is to provide an information processing system, an information processing method, and a program capable of solving the above-described problems and efficiently executing operations on attributes in data analysis using a statistical model.
本発明の情報処理システムは、複数の属性の内の現在の選択属性の集合を用いて生成される所定のモデルに係る所定の統計量からの、前記複数の属性の各々に対する選択操作により得られる選択属性の集合を用いて生成される前記所定のモデルに係る前記所定の統計量の変化を算出する、算出手段と、前記複数の属性の各々に対応づけて、前記算出された前記所定の統計量の変化を出力する出力手段と、を備える。 The information processing system according to the present invention is obtained by a selection operation for each of the plurality of attributes from a predetermined statistic based on a predetermined model generated using a set of currently selected attributes among the plurality of attributes. A calculating means for calculating a change in the predetermined statistic relating to the predetermined model generated using a set of selection attributes; and the calculated predetermined statistic in association with each of the plurality of attributes. Output means for outputting a change in quantity.
本発明の情報処理方法は、複数の属性の内の現在の選択属性の集合を用いて生成される所定のモデルに係る所定の統計量からの、前記複数の属性の各々に対する選択操作により得られる選択属性の集合を用いて生成される前記所定のモデルに係る前記所定の統計量の変化を算出し、前記複数の属性の各々に対応づけて、前記算出された前記所定の統計量の変化を出力する。 The information processing method of the present invention is obtained by a selection operation for each of the plurality of attributes from a predetermined statistic based on a predetermined model generated using a set of currently selected attributes among the plurality of attributes. A change in the predetermined statistic relating to the predetermined model generated using a set of selection attributes is calculated, and the calculated change in the predetermined statistic is associated with each of the plurality of attributes. Output.
本発明のプログラムは、コンピュータに、複数の属性の内の現在の選択属性の集合を用いて生成される所定のモデルに係る所定の統計量からの、前記複数の属性の各々に対する選択操作により得られる選択属性の集合を用いて生成される前記所定のモデルに係る前記所定の統計量の変化を算出し、前記複数の属性の各々に対応づけて、前記算出された前記所定の統計量の変化を出力する、処理を実行させる。 The program of the present invention is obtained by a selection operation for each of the plurality of attributes from a predetermined statistic associated with a predetermined model generated using a set of currently selected attributes among the plurality of attributes. A change in the predetermined statistic related to the predetermined model generated using a set of selected attributes, and the calculated change in the predetermined statistic in association with each of the plurality of attributes. Is output and the process is executed.
本発明の効果は、統計的モデルを用いたデータ分析において、属性に対する操作を効率的に実行できることである。 An effect of the present invention is that operations on attributes can be efficiently executed in data analysis using a statistical model.
(第1の実施の形態)
本発明の第1の実施の形態について説明する。
(First embodiment)
A first embodiment of the present invention will be described.
はじめに、本発明の第1の実施の形態の構成を説明する。図2は、本発明の第1の実施の形態における、データ分析システム100の構成を示す図である。データ分析システム100は、本発明の情報処理システムの一実施形態である。
First, the configuration of the first exemplary embodiment of the present invention will be described. FIG. 2 is a diagram showing a configuration of the
図2を参照すると、データ分析システム100は、データ記憶部110、初期属性選択部120、選択属性記憶部130、統計量変化算出部140(または、算出部)、モデル生成部150、分析部160、入力部170、及び、出力部180を含む。
Referring to FIG. 2, the
データ記憶部110は、分析対象のデータ(学習データ、及び、テストデータ)を記憶する。データ記憶部110は、例えば、図5のようなデータを記憶する。なお、データは、例えばCSV(Comma-Separated Values)形式で表現されてもよい。この場合、典型的には1行目に属性名が付与される。
The
初期属性選択部120は、分析対象データの複数の属性の中から、アルゴリズムにより属性選択を行う。ここで、アルゴリズムでは、属性を用いて生成される所定の統計的モデル(以下、単にモデルと記載する)の「良さ」を表す所定の種別の統計量をもとに、属性が選択される。統計量の種別としては、モデルに係る情報量基準や、尤度、モデルによる予測誤差(以下、単に誤差と記載する)等が用いられる。
The initial
モデルとしては、例えば、回帰モデルが用いられる。この場合、選択された属性が説明変数として用いられる。なお、複数の属性の値を用いてある属性の値を予測するモデルであれば、モデルは、自己回帰モデルやニューラルネットワークモデル等、他のモデルでもよい。 As the model, for example, a regression model is used. In this case, the selected attribute is used as an explanatory variable. Note that the model may be another model such as an autoregressive model or a neural network model as long as it is a model that predicts the value of a certain attribute using a plurality of attribute values.
選択属性記憶部130は、現在選択されている属性を記憶する。以下、分析対象のデータの複数の属性の内、選択されている属性を選択属性、選択されていない属性(選択属性以外の属性)を非選択属性と呼ぶ。
The selection
統計量変化算出部140は、分析対象データの複数の属性の各々について、当該属性に対する選択操作により得られる選択属性の集合を用いて生成されるモデルの統計量の、現在の選択属性の集合を用いて生成されるモデルの統計量からの変化を算出する。ここで、選択操作は、現在の選択属性の非選択属性への変更(属性削除)、現在の非選択属性の選択属性への変更(属性追加)を含む。
The statistic
各属性について算出される統計量の変化の大きさは、当該属性に対する選択操作の価値を示す。本発明の第1の実施の形態では、統計量の変化の大きさを表す関数を、選択操作の評価関数と呼ぶ。統計量変化算出部140は、当該評価関数により、統計量の変化を算出する。評価関数としては、例えば、統計量の差分や、割合等が用いられる。
The magnitude of the change in statistic calculated for each attribute indicates the value of the selection operation for that attribute. In the first embodiment of the present invention, a function representing the magnitude of a change in statistics is referred to as an evaluation function for selection operation. The statistic
なお、初期属性選択部120が、アルゴリズムによる属性選択で用いる統計量の種別と、統計量変化算出部140が、評価関数の算出に用いる統計量の種別とは、同じであっても、異なっていてもよい。また、統計量変化算出部140は、分析者等からの要求等に応じて、評価関数の算出に用いる統計量の種別を変更してもよい。
Note that the statistic type used by the initial
モデル生成部150は、学習データを用いて、統計量変化算出部140により指示されたモデルを生成し、生成したモデルの統計量を算出する。
The
分析部160は、モデルを用いた、新たな分析対象データに対する予測等、所定の分析を行う。
The
入力部170は、分析者等から、選択操作の入力を受け付ける。
The
出力部180は、統計量変化算出部140において算出された評価関数の値を、各属性に対応づけて出力(表示)する。
The
なお、データ分析システム100は、それぞれ、CPU(Central Processing Unit)とプログラムを記憶した記憶媒体を含み、プログラムに基づく制御によって動作するコンピュータであってもよい。
Each of the
図3は、本発明の第1の実施の形態における、コンピュータにより実現されたデータ分析システム100の構成を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a
図3を参照すると、データ分析システム100は、CPU101、ハードディスクやメモリ等の記憶デバイス(記憶媒体)102、他の装置等と通信を行う通信デバイス103、マウスやキーボード等の入力デバイス104、及び、ディスプレイ等の出力デバイス105を含む。
Referring to FIG. 3, a
CPU101は、初期属性選択部120、統計量変化算出部140、モデル生成部150、分析部160、入力部170、及び、出力部180の機能を実現するためのコンピュータプログラムを実行する。記憶デバイス102は、データ記憶部110、及び、選択属性記憶部130のデータを記憶する。入力デバイス104は、分析者等から、選択操作の入力を受け付ける。出力デバイス105は、分析者等へ、評価関数の値を出力する。なお、入力デバイス104に代わって、通信デバイス103が、他の装置から選択操作の入力を受け付けてもよい。また、出力デバイス105に代わって、通信デバイス103が、他の装置へ評価関数の値を出力してもよい。
The
また、データ分析システム100は、図2に示された各構成要素が、有線または無線で接続された複数の物理的な装置に分散的に配置されることより構成されていてもよい。
In addition, the
次に、本発明の第1の実施の形態の動作を説明する。図4は、本発明の第1の実施の形態における、データ分析システム100の動作を示すフローチャートである。
Next, the operation of the first exemplary embodiment of the present invention will be described. FIG. 4 is a flowchart showing the operation of the
ここでは、分析対象のデータとして、図5に示すデータがデータ記憶部110に記憶されていると仮定する。またモデルとして、図5における属性「平均家賃」を目的変数、属性「地域ID」「平均家賃」以外の属性から選択された属性を説明変数とした、数1式のような回帰モデルを生成すると仮定する。
Here, it is assumed that data shown in FIG. 5 is stored in the
ここで、y’iは、i番目のデータにおける目的変数の推定値、xji、はi番目のデータにおけるj番目の説明変数の値、Aj(j=1、…、M)は、j番目の説明変数に対する係数、Mは、説明変数の数である。 Here, y′i is the estimated value of the objective variable in the i th data, x ji is the value of the j th explanatory variable in the i th data, and Aj (j = 1,..., M) is the j th The coefficient, M, for the explanatory variable is the number of explanatory variables.
はじめに、初期属性選択部120は、データ記憶部110に記憶されている分析対象のデータに含まれる複数の属性の中から、アルゴリズムによる属性選択を行う(ステップS101)。
First, the initial
例えば、初期属性選択部120は情報量基準をもとにしたアルゴリズムにより、属性「人口」、「男性比率」、「空室率」を選択する。
For example, the initial
初期属性選択部120は、選択された属性を選択属性記憶部130に保存する(ステップS102)。
The initial
統計量変化算出部140は、モデル生成部150に対して、現在の選択属性の集合を用いたモデルの生成、及び、生成されたモデルの統計量の算出を指示する(ステップS103)。
The statistic
モデル生成部150は、データ記憶部110に記憶されている学習データをもとに、現在の選択属性の集合を用いてモデルを生成する。そして、モデル生成部150は、データ記憶部110に記憶されているデータを用いて、生成したモデルの統計量を算出する。
The
例えば、モデル生成部150は、現在の選択属性の集合{「人口」、「男性比率」、「空室率」}を用いて、回帰モデルを生成する。ここで、統計量として誤差を用いる場合、モデル生成部150は、例えば、数2式により示される、回帰モデルの平均誤差二乗誤差の根(RMSE: Root Mean Square Error)を、生成したモデルの誤差として算出する。
For example, the
ここで、Nは、誤差の算出に用いるデータの数、yiは、i番目のデータにおける目的変数の観測値である。なお、誤差の算出には、例えば、学習データが用いられる。また、誤差の算出に、テストデータ、または、学習データとテストデータの両方が用いられてもよい。また、モデル生成部150は、数1式に限らず、誤差の絶対値の最大値(MAE: Max Absolute Error)等、他の方法により、生成したモデルの誤差を算出してもよい。
Here, N is the number of data used for error calculation, and yi is the observed value of the objective variable in the i-th data. For example, learning data is used to calculate the error. In addition, test data or both learning data and test data may be used for calculating the error. In addition, the
次に、統計量変化算出部140は、現在の選択属性の内の1つ抽出する(ステップS104)。
Next, the statistic
例えば、統計量変化算出部140は、現在の選択属性から属性「人口」を抽出する。
For example, the statistic
統計量変化算出部140は、モデル生成部150に対して、現在の選択属性の集合から、抽出した属性を削除して得られる選択属性の集合を用いたモデルの生成、及び、当該生成したモデルに係る統計量の算出を指示する(ステップS105)。
The statistic
例えば、モデル生成部150は、現在の選択属性の集合から属性「人口」を削除した選択属性の集合{「男性比率」、「空室率」}を用いて、回帰モデルを生成する。モデル生成部150は、数2式により、生成した回帰モデルの誤差を算出する。
For example, the
統計量変化算出部140は、抽出した属性に係る評価関数の値を算出する(ステップS106)。
The statistic
ここで、評価関数として統計量(誤差)の差分を用いる場合、統計量変化算出部140は、ステップS106で算出された誤差からステップS103で算出された誤差を減算することにより、評価関数の値を算出する。
Here, in the case of using a statistic (error) difference as the evaluation function, the statistic
統計量変化算出部140は、現在の選択属性の全てについて、ステップS104からの処理を繰り返す(ステップS107)。
The statistic
例えば、モデル生成部150は、現在の選択属性から「男性比率」、「空室率」の各々を削除して得られる選択属性の集合を用いて、回帰モデルの生成、誤差の算出、及び、評価関数の値の算出を行う。
For example, the
次に、統計量変化算出部140は、現在の非選択属性の内の1つ抽出する(ステップS108)。
Next, the statistic
例えば、統計量変化算出部140は、現在の非選択属性から属性「世帯数」を抽出する。
For example, the statistic
統計量変化算出部140は、モデル生成部150に対して、現在の選択属性に、抽出した属性を追加して得られる選択属性の集合を用いたモデルの生成、及び、当該生成したモデルに係る統計量の算出を指示する(ステップS109)。
The statistic
例えば、モデル生成部150は、現在の選択属性に属性「世帯数」を追加した選択属性の集合{「人口」、「男性比率」、「空室率」、「世帯数」}を用いて、回帰モデルを生成する。モデル生成部150は、数2式により、生成した回帰モデルの誤差を算出する。
For example, the
統計量変化算出部140は、抽出した属性に係る評価関数の値を算出する(ステップS110)。
The statistic
ここで、統計量変化算出部140は、ステップS110で算出された誤差からステップS103で算出された誤差を減算することにより、評価関数の値を算出する。
Here, the statistic
統計量変化算出部140は、現在の非選択属性の全てについて、ステップS108からの処理を繰り返す(ステップS111)。
The statistic
例えば、モデル生成部150は、現在の選択属性に「平均年齢」、「既婚率」、「物件数」、「平均年収」の各々を追加して得られる選択属性の集合を用いて、回帰モデルの生成、誤差の算出、及び、評価関数の値の算出を行う。
For example, the
図6は、本発明の第1の実施の形態における、評価関数の値の算出結果の例を示す図である。例えば、図6のように、現在の選択属性、及び、非選択属性の各々について評価関数の値が算出される。 FIG. 6 is a diagram illustrating an example of the calculation result of the value of the evaluation function in the first embodiment of the present invention. For example, as shown in FIG. 6, the value of the evaluation function is calculated for each of the currently selected attribute and the non-selected attribute.
次に、出力部180は、分析データに含まれる属性を、選択状態(選択属性、または、非選択属性)、及び、算出された評価関数の値に応じた順番で配置された属性表示画面200を生成し、分析者等に出力(表示)する(ステップS112)。
Next, the
ここで、各属性は、以下のような第1のルール、及び、第2のルールに従った順番で、属性表示画面200上に配置される。
Here, each attribute is arranged on the
第1のルールは、選択状態(選択属性、または、非選択属性)による順番である。すなわち、属性表示画面200において、属性は、選択属性、非選択属性の順に配置される。
The first rule is the order according to the selection state (selected attribute or non-selected attribute). That is, on the
第2のルールは、評価関数の値の大きさの順番である。すなわち、属性表示画面200において、選択属性、及び、非選択属性は、評価関数の値の大きい順(降順)、または、小さい順(昇順)に並べて配置される。
The second rule is the order of the magnitudes of the evaluation function values. That is, on the
ここで、統計量が小さいほど良いモデルを表す場合、選択属性は評価関数の値の大きい順に、非選択属性は評価関数の値の小さい順に配置される。一方、統計量が大きいほど良いモデルを表す場合、選択属性は評価関数の値の小さい順に、非選択属性は評価関数の値の大きい順に配置される。 Here, when a smaller model represents a better model, selection attributes are arranged in descending order of evaluation function values, and non-selection attributes are arranged in ascending order of evaluation function values. On the other hand, when a larger model represents a better model, selection attributes are arranged in ascending order of evaluation function values, and non-selection attributes are arranged in descending order of evaluation function values.
これにより、選択属性と非選択属性の境目で、現在の選択属性の集合を用いて生成されたモデルの統計量からの、選択操作による統計量の変化が最小となる(ピークを示す)ように、選択属性と非選択属性とが配置される。この場合、選択属性と非選択属性の境目に近い属性に対する選択操作を行っても、当該選択操作により得られる選択属性の集合を用いて生成されるモデルの良さは、現在の選択属性の集合を用いて生成されたモデルからあまり低下しない。一方、選択属性と非選択属性の境目から遠い属性に対する選択操作を行った場合は、モデルの良さは大きく低下する。 As a result, the change in the statistic due to the selection operation from the statistic of the model generated using the current set of selected attributes at the boundary between the selected attribute and the non-selected attribute is minimized (indicating a peak). The selection attribute and the non-selection attribute are arranged. In this case, even if a selection operation is performed on an attribute close to the boundary between the selection attribute and the non-selection attribute, the goodness of the model generated using the set of selection attributes obtained by the selection operation is determined based on the current set of selection attributes. It does not drop much from the model generated using it. On the other hand, when a selection operation is performed on an attribute far from the boundary between the selected attribute and the non-selected attribute, the goodness of the model is greatly reduced.
図7は、本発明の第1の実施の形態における、属性表示画面200の例を示す図である。
FIG. 7 is a diagram showing an example of the
例えば、出力部180は、図6の評価関数の値をもとに、図7のような属性表示画面200を表示する。
For example, the
図7では、属性表示画面200における上部を第一優先、かつ、左側を第二優先として、各属性の属性名を示す矩形が、グリッド状に、順番に配置されている。現在の選択属性は、太線で区別されている。そして、上述の第1のルールに従って、属性が、現在の選択属性、非選択属性の順番に表示されている。また、上述の第2のルールに従って、現在の選択属性である、「人口」、「男性比率」、「空室率」は、評価関数の値(誤差の差分)の大きい順に配置されている。また、非選択属性である、「世帯数」、「平均年齢」、「既婚率」、「物件数」、「平均年収」は、評価関数の値(誤差の差分)の小さい順に配置されている。
In FIG. 7, rectangles indicating the attribute names of the respective attributes are arranged in order in the form of a grid, with the top of the
分析者等は、図7の属性表示画面200を参照し、削除すべき属性、追加すべき属性を判断する。このとき、分析者等は、属性の配置された順番により、各属性に対する選択操作を行った場合の、モデルの良さの低下の度合いを把握できる。すなわち、分析者等は、選択属性と非選択属性の境目に近い属性を削除、追加することで、現在の選択属性に対するモデルからモデルの良さを大きく低下させることなく、新たな選択属性の集合を得ることができる。
An analyst or the like refers to the
次に、入力部170は、分析者等から、属性表示画面200上で、属性に対する選択操作の入力を受け付ける(ステップS113)。
Next, the
ここで、入力部170は、例えば、選択属性がマウスによりクリックされた場合、当該選択属性を非選択属性へ変更(属性削除)と判断する。また、非選択属性がマウスによりクリックされた場合、当該非選択属性を選択属性へ変更(属性追加)と判断する。
Here, for example, when the selection attribute is clicked with the mouse, the
入力部170は、選択操作に従って、現在の選択属性を更新し、選択属性記憶部130に保存する(ステップS114)。また、出力部180は、選択操作の結果を、属性表示画面200上に反映する。
In accordance with the selection operation, the
以降、ステップS103からの処理が繰り返し実行されることにより、新たな選択状態、及び、評価関数の値に応じて、属性表示画面200における属性が再配置される。
Thereafter, by repeatedly executing the processing from step S103, the attributes on the
図8、図10は、本発明の第1の実施の形態における、属性表示画面200の遷移の例を示す図である。図9、図11は、本発明の第1の実施の形態における、評価関数の値の算出結果の他の例を示す図である。
8 and 10 are diagrams showing an example of transition of the
例えば、図8の状態(a)の属性表示画面200上で、選択属性「人口」がクリック(削除)された場合、出力部180は、図8の状態(b)の属性表示画面200を表示する。
For example, when the selected attribute “population” is clicked (deleted) on the
モデル生成部150は、新たな選択属性の集合{「男性比率」、「空室率」}を用いて、回帰モデルを生成し、誤差を算出する。また、モデル生成部150は、新たな選択属性「男性比率」、「空室率」の各々を削除して得られる選択属性の集合を用いて、回帰モデルの生成、誤差の算出、及び、評価関数の値の算出を行う。さらに、モデル生成部150は、新たな選択属性に非選択属性「人口」、「世帯数」、「平均年齢」、「既婚率」、「物件数」、「平均年収」の各々を追加して得られる選択属性の集合を用いて、回帰モデルの生成、誤差の算出、及び、評価関数の値の算出を行う。統計量変化算出部140は、図9のように、新たな選択属性、及び、非選択属性の各々について評価関数の値を算出する。そして、出力部180は、図9の評価関数の値をもとに、図8の状態(c)のように、属性表示画面200上の属性を再配置する。
The
同様に、例えば、図10の状態(a)の属性表示画面200上で、非選択属性「平均年齢」がクリック(追加)された場合、出力部180は、図10の状態(b)の属性表示画面200を表示する。
Similarly, for example, when the non-selected attribute “average age” is clicked (added) on the
モデル生成部150は、新たな選択属性の集合{「人口」、「男性比率」、「空室率」、「平均年齢」}を用いて、回帰モデルを生成し、誤差を算出する。また、モデル生成部150は、新たな選択属性「人口」、「男性比率」、「空室率」、「平均年齢」の各々を削除して得られる選択属性の集合を用いて、回帰モデルの生成、誤差の算出、及び、評価関数の値の算出を行う。さらに、モデル生成部150は、新たな選択属性に非選択属性「世帯数」、「既婚率」、「物件数」、「平均年収」の各々を追加して得られる選択属性の集合を用いて、回帰モデルの生成、誤差の算出、及び、評価関数の値の算出を行う。統計量変化算出部140は、図11のように、新たな選択属性、及び、非選択属性の各々について評価関数の値を算出する。そして、出力部180は、図11の評価関数の値をもとに、図10の状態(c)のように、属性表示画面200上の属性を再配置する。
The
以上により、本発明の第1の実施の形態の動作が完了する。 Thus, the operation of the first exemplary embodiment of the present invention is completed.
なお、上述の説明では、属性表示画面200において、属性が、評価関数の値に応じた順番で配置された。しかしながら、これに限らず、属性は、各属性に係る評価関数の値が識別可能なように配置されてもよい。
In the above description, the attributes are arranged in the order according to the value of the evaluation function on the
図12、図13、図14、図15、図16、及び、図17は、本発明の第1の実施の形態における、属性表示画面200の他の例を示す図である。
12, 13, 14, 15, 16, and 17 are diagrams showing another example of the
例えば、出力部180は、属性表示画面200において、図12のように、属性間の評価関数の値の差分に応じた間隔で各属性を配置してもよい。
For example, in the
また、出力部180は、属性表示画面200において、図13のように、1次元のスケール上の評価関数の値に応じた位置に各属性を配置してもよい。この場合、1次元のスケールは、直線状である必要はなく、例えば、螺旋状であってもよい。
Further, the
また、出力部180は、属性表示画面200において、図14のように、2次元の平面上で中心からの距離が評価関数の絶対値に対応するように各属性を配置してもよい。この場合、出力部180は、各属性の位置を、ばねモデルにより調整してもよい。
Further, the
また、出力部180は、属性表示画面200において、図15のように、各属性の評価関数の値とともに、当該評価関数の値の算出に用いられた統計量を示してもよい。ここで、例えば「RMSE:0.7->1.1(+0.4)」は、現在の選択属性の集合を用いて生成されるモデルのRMSEが「0.7」、選択操作により得られる選択属性の集合を用いて生成されるモデルのRMSEが「1.1」、RMSEの差分が「+0.4」であることを示す。この場合、図16のように、マウス201が属性にオーバラップされたときに、当該属性に係る統計量がポップアップ領域202で表示されてもよい。また、図17のように、マウス201が属性にオーバラップされたときに、当該属性に係る統計量が共通の表示領域203に表示されてもよい。
Moreover, the
また、各属性は、当該属性に係る評価関数の値が識別可能なように、評価関数の値に応じた色(評価関数の値に応じた色相や明度、彩度等)で表示されてもよい。また、各属性は、評価関数の値に応じた形状、大きさ等で表示されてもよい。 Each attribute may be displayed in a color corresponding to the value of the evaluation function (hue, brightness, saturation, etc. depending on the value of the evaluation function) so that the value of the evaluation function related to the attribute can be identified. Good. Each attribute may be displayed in a shape, size, or the like according to the value of the evaluation function.
また、出力部180は、各属性に係る評価関数の値や当該評価関数の値の算出に用いられた統計量を示す代わりに、モデルによる予測値を出力してもよい。
Further, the
図18は、本発明の第1の実施の形態における、属性表示画面200のさらに他の例を示す図である。
FIG. 18 is a diagram showing still another example of the
図18の例では、属性表示画面200に、横軸がデータの識別子(「地域ID」)、縦軸が目的変数「平均家賃」である2次元のグラフ204が配置されている。グラフ204では、データに含まれる目的変数「平均家賃」の観測値、及び、回帰モデルによる予測値が示されている。この場合、例えば、図18の状態(a)のように、マウス201がどの属性にもオーバラップされていないときは、現在の選択属性の集合を用いて生成される回帰モデルによる目的変数「平均家賃」の予測値が表示される。また、図18の状態(b)のように、マウス201が属性にオーバラップされたときは、当該属性に対する選択操作により得られる選択属性の集合を用いて生成される回帰モデルによる目的変数「平均家賃」の予測値が表示される。これにより、分析者等は、属性に対する選択操作に伴う、モデルによる予測値の変化を視覚的に把握できる。
In the example of FIG. 18, a two-
また、上述の説明では、各属性は、第1のルール、及び、第2のルールに従った順番で、属性表示画面200上に配置された。しかしながら、これに限らず、出力部180は、第1のルールを適用する代わりに、選択属性と非選択属性を、例えば、属性表示画面200の左半分と右半分のように、属性表示画面200上の異なる領域に配置してもよい。
In the above description, the attributes are arranged on the
また、上述の説明では、アルゴリズムによる属性選択の後で分析者等による属性選択が行われた。しかしながら、これに限らず、分析者等による属性選択の後でアルゴリズムによる属性選択を行う、アルゴリズムによる属性選択の途中で分析者等による属性選択を行う等、アルゴリズムによる属性選択と分析者等他による属性選択とを他の順序で実行してもよい。 In the above description, attribute selection by an analyst or the like is performed after attribute selection by an algorithm. However, not limited to this, attribute selection by the algorithm after the attribute selection by the analyst, etc., attribute selection by the analyst etc. during attribute selection by the algorithm, etc. The attribute selection may be performed in another order.
また、上述の説明では、選択操作として、現在の選択属性の非選択属性への変更(属性削除)、及び、現在の非選択属性の選択属性への変更(属性追加)が行われた。しかしながら、これに限らず、選択操作として、現在の選択属性の非選択属性への変更と同時に現在の非選択属性の選択属性への変更(属性置換)が行われてもよい。 In the above description, as the selection operation, the current selection attribute is changed to a non-selection attribute (attribute deletion), and the current non-selection attribute is changed to a selection attribute (attribute addition). However, the present invention is not limited to this, and as a selection operation, a change (attribute replacement) of the current non-selection attribute to the selection attribute may be performed simultaneously with the change of the current selection attribute to the non-selection attribute.
この場合、入力部170は、例えば、モードの切り替え(トグルボタン等の利用)や、キーボードコンビネーション(シフトキー等を押下しながらマウスをクリック)により、属性置換を、属性削除や属性追加と区別する。
In this case, for example, the
入力部170は、属性置換が指定された場合に、クリックされた選択属性(置換元属性)を非選択属性へ変更し、クリックされた非選択属性(置換先属性)を選択属性へ変更する。
When attribute replacement is designated, the
属性置換が指定された場合は、選択属性や非選択属性がクリックされる度に、上述のステップS103〜S112と同様の処理により、属性表示画面200上の属性の配置が更新されてもよい。また、属性がクリックされる度に属性の配置を更新する代わりに、置換元属性と置換先属性の組み合わせが決定された後で、属性表示画面200上の属性の配置が更新されてもよい。
When attribute replacement is designated, the arrangement of attributes on the
図19は、本発明の第1の実施の形態における、属性表示画面200の遷移の他の例を示す図である。
FIG. 19 is a diagram showing another example of the transition of the
例えば、図19の状態(a)の属性表示画面200上で、属性置換を指定して、選択属性「人口」と非選択属性「平均年齢が」がクリックされた場合、出力部180は、図19の状態(b)の属性表示画面200を表示する。統計量変化算出部140は、新たな選択属性「男性比率」、「空室率」、「平均年齢」、及び、非選択属性「人口」、「世帯数」、「平均年齢」、「既婚率」、「物件数」、「平均年収」の各々について評価関数の値を算出する。そして、出力部180は、算出された評価関数の値をもとに、例えば、図19の状態(c)のように、属性表示画面200上の属性を再配置する。
For example, when the attribute replacement is designated on the
次に、本発明の第1の実施の形態の特徴的な構成を説明する。図1は、本発明の第1の実施の形態の特徴的な構成を示すブロック図である。 Next, a characteristic configuration of the first exemplary embodiment of the present invention will be described. FIG. 1 is a block diagram showing a characteristic configuration of the first embodiment of the present invention.
図1を参照すると、データ分析システム100(情報処理システム)は、統計量変化算出部140(算出部)、及び、出力部180を含む。統計量変化算出部140は、複数の属性の内の現在の選択属性の集合を用いて生成されるモデルに係る統計量からの、複数の属性の各々に対する選択操作により得られる選択属性の集合を用いて生成されるモデルに係る統計量の変化を算出する。出力部180は、複数の属性の各々に対応づけて、算出された統計量の変化を出力する。
Referring to FIG. 1, the data analysis system 100 (information processing system) includes a statistic change calculation unit 140 (calculation unit) and an
本発明の第1の実施の形態によれば、統計的モデルを用いたデータ分析において、属性に対する操作を効率的に実行できる。その理由は、統計量変化算出部140が、現在の選択属性に対して生成されるモデルに係る統計量からの、選択操作後の選択属性に対して生成されるモデルの統計量の変化を算出し、出力部180が、複数の属性の各々について、統計量の変化を出力するためである。これにより、分析者等に対して、属性の選択操作を支援するための情報(各属性に対する選択操作後のモデルの統計量の変化)が提供され、分析者等は、アルゴリズムによる属性選択の結果を容易に操作できる。
According to the first embodiment of the present invention, it is possible to efficiently perform operations on attributes in data analysis using a statistical model. The reason is that the statistic
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described.
本発明の第1の実施の形態では、分析者等により属性に対する選択操作が行われると、新たな選択属性の集合や、選択操作によって得られる選択属性の集合について、評価関数の値が再計算され、属性表示画面200が更新された。しかしながら、評価関数の再計算では、これらの選択属性の集合についてのモデルの生成、統計量の算出を繰り返し実行する必要がある。このため、属性数やデータ数によっては計算時間が膨大となり、分析者に負担が生じる。
In the first embodiment of the present invention, when an attribute selection operation is performed by an analyst or the like, the value of the evaluation function is recalculated for a new selection attribute set or a selection attribute set obtained by the selection operation. The
本発明の第2の実施の形態では、上述のステップS103、S105、S109の統計量の算出において、統計量変化算出部140が、選択属性の集合と算出された統計量との組を、統計量記憶部(図示せず)にキャッシュする。そして、統計量変化算出部140は、分析者等による選択操作後の評価関数の再計算において、当該キャッシュを用いる。すなわち、統計量変化算出部140は、評価関数の再計算(ステップS103〜S111)において、統計量を算出すべき選択属性の集合をキーとして、統計量記憶部にキャッシュされた統計量を検索する。統計量が存在する場合、統計量変化算出部140は、当該統計量を用いて、評価関数の値を再計算する。
In the second embodiment of the present invention, in the calculation of the statistic in the above-described steps S103, S105, and S109, the statistic
本発明の第2の実施の形態によれば、分析者等による選択操作後の評価関数の再計算の時間を低減できる。その理由は、統計量変化算出部140が、モデルを生成するために用いた属性の集合と算出された統計量との組をキャッシュし、分析者等による選択操作後の評価関数の再計算で、キャッシュされた統計量を利用するためである。これにより、分析者等の選択操作後の評価関数の再計算に伴う負担が軽減される。
According to the second embodiment of the present invention, it is possible to reduce the time for recalculating the evaluation function after the selection operation by an analyst or the like. The reason is that the statistic
(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。
(Third embodiment)
Next, a third embodiment of the present invention will be described.
本発明の第3の実施の形態では、分析者の再計算に伴う負担を軽減する他の方法として、出力部180が、分析者に対して、再計算の課程を提示する。
In the third embodiment of the present invention, the
出力部180は、上述のステップS103〜S111により、評価関数の値の再計算が行われているときに、評価関数の値の算出が完了した属性について、その旨を表示する。
When the recalculation of the evaluation function value is performed in steps S103 to S111 described above, the
例えば、出力部180は、評価関数の値の算出が完了した属性については、属性名を示す矩形の色や枠の太さを、完了していない属性と異なる色や枠の太さで表示する。また、出力部180は、評価関数の値の算出が完了した属性に、旗マーク等のアイコンを付与してもよい。
For example, for the attribute for which the calculation of the value of the evaluation function has been completed, the
また、出力部180は、評価関数の値の算出が完了した属性から、上述の第1のルール、及び、第2のルールに従った順番に従って再配置(並べ替え)を行った後で、完了していない属性を、完了した属性とは別の位置に再配置してもよい。この場合、属性の評価関数の値の算出が完了する毎に属性の並び替えが発生する。また、並び替えによる各属性の順番の変更が視覚的に把握できるように、属性表示画面200上での属性の位置の移動がアニメーションで表示されてもよい。
The
また、入力部170は、評価関数の値の算出が完了していない属性があっても、完了した属性から、選択操作を受け付けてもよい。上述の第1のルール、及び、第2のルールに従って属性が配置されている場合、上述のように、選択属性と非選択属性の境目(統計量の変化が最小となる位置)に近い属性に対して選択操作が行われることが多い。したがって、統計量変化算出部140は、統計量の変化が最小となる属性を予測し、当該属性から順番に、評価関数の値を算出することが望ましい。
Further, the
ここで、統計量によっては、より計算時間の小さい近似計算によって、統計量を算出できることが知られている。例えば、統計量としてモデルの尤度を用いる場合、尤度は、ベクトルの勾配を用いて近似できることが、非特許文献1に開示されている。統計量変化算出部140は、このような近似計算を用いて評価関数の値を算出する。そして、統計量変化算出部140は、近似計算により算出された評価関数の値から、選択属性と非選択属性の境目に近い属性を推定し、当該境目に近いと推定された属性から、上述のステップS103〜S111による評価関数の算出を行う。
Here, depending on the statistic, it is known that the statistic can be calculated by an approximate calculation with a shorter calculation time. For example,
本発明の第3の実施の形態によれば、分析者等による選択操作後の評価関数の再計算に伴う、分析者等の負担を低減できる。その理由は、評価関数の値の再計算が行われているときに、出力部180が、評価関数の値の算出が完了した属性の提示や、評価関数の値の算出が完了した属性からの再配置を行うためである。
According to the third embodiment of the present invention, it is possible to reduce the burden on the analyst and the like due to recalculation of the evaluation function after the selection operation by the analyst and the like. The reason is that when the evaluation function value is being recalculated, the
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。 While the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
100 データ分析システム
101 CPU
102 記憶デバイス
103 通信デバイス
104 入力デバイス
105 出力デバイス
110 データ記憶部
120 初期属性選択部
130 選択属性記憶部
140 統計量変化算出部
150 モデル生成部
160 分析部
170 入力部
180 出力部
200 属性表示画面
201 マウス
202 ポップアップ領域
203 表示領域
204 グラフ
100
102
Claims (13)
前記複数の属性の各々に対応づけて、前記算出された前記所定の統計量の変化を出力する出力手段と、
を備えた情報処理システム。 Generated using a set of selection attributes obtained by a selection operation for each of the plurality of attributes from a predetermined statistic based on a predetermined model generated using a set of currently selected attributes among the plurality of attributes Calculating means for calculating a change in the predetermined statistic relating to the predetermined model to be performed;
Output means for outputting the calculated change in the predetermined statistic in association with each of the plurality of attributes;
Information processing system with
請求項1に記載の情報処理システム。 The output means outputs, on the output screen, the change in the predetermined statistic using at least one of a position, a size, a color, and a shape according to the amount of the change;
The information processing system according to claim 1.
請求項1または2に記載の情報処理システム。 The selection operation for each of the plurality of attributes includes at least one of a change of the current selection attribute to each non-selection attribute and a change of the current non-selection attribute to each selection attribute.
The information processing system according to claim 1 or 2.
請求項3に記載の情報処理システム。 The selection operation for each of the plurality of attributes further includes changing the current non-selected attribute to each selected attribute when any of the current selected attributes is changed to a non-selected attribute, and the current Including at least one of changes to each non-selected attribute of the current selected attribute when any non-selected attribute is changed to a selected attribute;
The information processing system according to claim 3.
請求項3または4に記載の情報処理システム。 The output means changes the predetermined statistic with respect to each of the currently selected attributes, and changes the predetermined statistic with respect to each of the current non-selected attributes in ascending or descending order of the amount of the change. Are arranged on the output screen in the opposite order of the current selection attribute of the amount of the change,
The information processing system according to claim 3 or 4.
請求項1に記載の情報処理システム。 The output means is generated using a predicted value based on the predetermined model generated using the current set of selected attributes and a set of selected attributes obtained by a selection operation for each of the plurality of attributes. Outputting a predicted value according to the predetermined model;
The information processing system according to claim 1.
請求項1乃至6のいずれかに記載の情報処理システム。 Furthermore, an input unit that receives a selection operation for each of the plurality of attributes and updates the current set of selection attributes with a set of selection attributes obtained by the selection operation;
The information processing system according to claim 1.
請求項1乃至7のいずれかに記載の情報処理システム。 The current selection attribute is selected in advance by an algorithm based on the predetermined statistic.
The information processing system according to claim 1.
請求項1乃至8のいずれかに記載の情報処理システム。 The predetermined statistic is one of an information criterion value related to the predetermined model, a likelihood related to the predetermined model, and a prediction error due to the predetermined model.
The information processing system according to claim 1.
前記算出手段は、前記記憶手段に記憶された、前記複数の属性の各々に対する選択操作により得られる選択属性の集合、または、前記現在の選択属性の集合、に対応する前記所定の統計量を用いて、前記所定の統計量の変化を算出する、
請求項1乃至9のいずれかに記載の情報処理システム。 Furthermore, the storage unit stores the predetermined statistic related to the predetermined model calculated by the calculation unit in association with a set of selection attributes used for the calculation of the statistic.
The calculation means uses the predetermined statistic corresponding to a set of selection attributes obtained by a selection operation for each of the plurality of attributes, or the set of current selection attributes, stored in the storage means. Calculating a change in the predetermined statistic,
The information processing system according to claim 1.
請求項1乃至10のいずれかに記載の情報処理システム。 The output means displays, on the output screen, whether or not the calculation of the predetermined statistic change by the calculation means has been completed for each of the plurality of attributes.
The information processing system according to claim 1.
前記複数の属性の各々に対応づけて、前記算出された前記所定の統計量の変化を出力する、
情報処理方法。 Generated using a set of selection attributes obtained by a selection operation for each of the plurality of attributes from a predetermined statistic based on a predetermined model generated using a set of currently selected attributes among the plurality of attributes Calculating a change in the predetermined statistic relating to the predetermined model to be performed;
Outputting the calculated change in the predetermined statistic in association with each of the plurality of attributes;
Information processing method.
複数の属性の内の現在の選択属性の集合を用いて生成される所定のモデルに係る所定の統計量からの、前記複数の属性の各々に対する選択操作により得られる選択属性の集合を用いて生成される前記所定のモデルに係る前記所定の統計量の変化を算出し、
前記複数の属性の各々に対応づけて、前記算出された前記所定の統計量の変化を出力する、
処理を実行させるプログラム。 On the computer,
Generated using a set of selection attributes obtained by a selection operation for each of the plurality of attributes from a predetermined statistic based on a predetermined model generated using a set of currently selected attributes among the plurality of attributes Calculating a change in the predetermined statistic relating to the predetermined model to be performed;
Outputting the calculated change in the predetermined statistic in association with each of the plurality of attributes;
A program that executes processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014225791A JP2016091343A (en) | 2014-11-06 | 2014-11-06 | Information processing system, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014225791A JP2016091343A (en) | 2014-11-06 | 2014-11-06 | Information processing system, information processing method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016091343A true JP2016091343A (en) | 2016-05-23 |
Family
ID=56019681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014225791A Pending JP2016091343A (en) | 2014-11-06 | 2014-11-06 | Information processing system, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016091343A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020024542A (en) * | 2018-08-07 | 2020-02-13 | 株式会社キーエンス | Data analysis device and data analysis method |
JP2020024541A (en) * | 2018-08-07 | 2020-02-13 | 株式会社キーエンス | Data analysis device and data analysis method |
JP2020088959A (en) * | 2018-11-19 | 2020-06-04 | 株式会社東芝 | Train information processing device and train information processing method |
JP2020135068A (en) * | 2019-02-13 | 2020-08-31 | 株式会社キーエンス | Data analysis device |
-
2014
- 2014-11-06 JP JP2014225791A patent/JP2016091343A/en active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020024542A (en) * | 2018-08-07 | 2020-02-13 | 株式会社キーエンス | Data analysis device and data analysis method |
JP2020024541A (en) * | 2018-08-07 | 2020-02-13 | 株式会社キーエンス | Data analysis device and data analysis method |
JP7049210B2 (en) | 2018-08-07 | 2022-04-06 | 株式会社キーエンス | Data analyzer and data analysis method |
JP7049211B2 (en) | 2018-08-07 | 2022-04-06 | 株式会社キーエンス | Data analyzer and data analysis method |
JP2020088959A (en) * | 2018-11-19 | 2020-06-04 | 株式会社東芝 | Train information processing device and train information processing method |
JP7232017B2 (en) | 2018-11-19 | 2023-03-02 | 株式会社東芝 | Train information processing device and train information processing method |
JP2020135068A (en) * | 2019-02-13 | 2020-08-31 | 株式会社キーエンス | Data analysis device |
JP7257169B2 (en) | 2019-02-13 | 2023-04-13 | 株式会社キーエンス | data analyzer |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9361666B2 (en) | Learning user preferences for photo adjustments | |
JP2016004525A (en) | Data analysis system and data analysis method | |
JP2016091343A (en) | Information processing system, information processing method, and program | |
JPWO2016151618A1 (en) | Prediction model update system, prediction model update method, and prediction model update program | |
US10867251B2 (en) | Estimation results display system, estimation results display method, and estimation results display program | |
JP2020027370A (en) | Optimization device, simulation system and optimization method | |
JP4591794B2 (en) | Information processing apparatus and method, and program | |
WO2022082848A1 (en) | Hyperspectral image classification method and related device | |
JP6181134B2 (en) | Factor analysis device, factor analysis method, and program | |
JPWO2018079225A1 (en) | Automatic prediction system, automatic prediction method, and automatic prediction program | |
JP6760084B2 (en) | Information display system, method and program for analysis | |
WO2018025707A1 (en) | Table-meaning estimating system, method, and program | |
US10885684B2 (en) | Estimation results display system, estimation results display method, and estimation results display program | |
JP2017120638A (en) | Result prediction apparatus and result prediction method | |
US20170337259A1 (en) | Visualizing device, visualizing method and visualizing program | |
JPWO2020121378A1 (en) | Learning device and learning method | |
JPWO2016132684A1 (en) | Impact visualization system, method and program | |
JP4591793B2 (en) | Estimation apparatus and method, and program | |
JP6268322B1 (en) | Learning data accuracy visualization system, learning data accuracy visualization method, and program | |
JP2016126771A (en) | Designing choropleth map | |
US10909177B1 (en) | Percentile determination system | |
KR101609292B1 (en) | Apparatus and method for managing a research and development project | |
JP6418537B1 (en) | Data prediction system, data prediction method, and data prediction program by regression analysis applying probability density function to explanatory variables | |
WO2015141157A1 (en) | Information processing device and clustering method | |
JPWO2016178312A1 (en) | Information processing apparatus, information processing method, and program |