JP2020086614A - データ分析装置、データ分析方法及びデータ分析プログラム - Google Patents
データ分析装置、データ分析方法及びデータ分析プログラム Download PDFInfo
- Publication number
- JP2020086614A JP2020086614A JP2018215971A JP2018215971A JP2020086614A JP 2020086614 A JP2020086614 A JP 2020086614A JP 2018215971 A JP2018215971 A JP 2018215971A JP 2018215971 A JP2018215971 A JP 2018215971A JP 2020086614 A JP2020086614 A JP 2020086614A
- Authority
- JP
- Japan
- Prior art keywords
- variable
- causal relationship
- variables
- relationship diagram
- causal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】目的変数に影響を与える変数を設定することにより、より精度の高いデータ分析を実現するデータ分析装置、データ分析方法及びプログラムを提供する。【解決手段】データ分析システム100において、データ分析装置120は、各事象を示す変数の入力と、各変数間の因果方向の入力とを受け付けることで、変数間の因果関係を示す因果関係図を生成する生成部と、因果関係図において目的変数として指定された変数と、因果関係図において、該目的変数よりも原因側にある変数とを、該目的変数に影響を与える変数を分析する分析ツールに設定する設定部と、を有する因果関係図生成部123を備える。【選択図】図1
Description
本発明は、データ分析装置、データ分析方法及びデータ分析プログラムに関する。
従来より、データ分析技術の分野においては様々な分析ツールが提案されており、それぞれの手法に基づく分析が行われている。
例えば、重回帰分析や深層学習等のような汎用的な手法を用いた分析ツールの場合、複数の説明変数(原因となる事象を示すデータ)と、1つの目的変数(結果となる事象を示すデータ)との組を設定し、説明変数と目的変数との関係性についてデータ分析を行う。かかる分析ツールによれば、複数の説明変数の中から、目的変数に影響を与える説明変数を導き出すことができる。
また、ベイジアンネットワーク等のような非汎用的な手法を用いた分析ツールの場合、全ての変数間において因果関係を設定し、変数間の関係性についてデータ分析を行う。かかる分析ツールによれば、因果関係が設定された全ての変数の中から、影響を与えている変数と影響を受けている変数の対を導き出すことができる。その際、変数の1つを目的変数として設定することもできる。
ここで、汎用的な手法を用いた分析ツールにおいては、例えば、どのような変数を説明変数に含めるべきか、あるいは、何を目的変数とするかによって、分析結果が大きく変わってくる。同様に、非汎用的な手法を用いた分析ツールの場合も、例えば、どのような変数を分析対象に含めるべきか、どの変数間に因果関係を設定するかによって、分析結果が大きく変わってくる。
つまり、いずれの手法を用いた分析ツールであっても、データ分析を行う前に、変数間の因果関係を正確かつ詳細に検討することが重要となってくる。このようなことから、変数間の因果関係を詳細に検討でき、かつ、検討結果を分析ツールに過不足なく反映させることができるツールを提供できれば、より精度の高いデータ分析が実現できると考えられる。
本発明は上記課題に鑑みてなされたものであり、より精度の高いデータ分析を実現することを目的とする。
一態様によれば、データ分析装置は、
各事象を示す変数の入力と、各変数間の因果方向の入力とを受け付けることで、変数間の因果関係を示す因果関係図を生成する生成部と、
前記因果関係図において目的変数として指定された変数と、前記因果関係図において、該目的変数よりも原因側にある変数とを、該目的変数に影響を与える変数を分析する分析ツールに設定する設定部とを有する。
各事象を示す変数の入力と、各変数間の因果方向の入力とを受け付けることで、変数間の因果関係を示す因果関係図を生成する生成部と、
前記因果関係図において目的変数として指定された変数と、前記因果関係図において、該目的変数よりも原因側にある変数とを、該目的変数に影響を与える変数を分析する分析ツールに設定する設定部とを有する。
本発明によれば、より精度の高いデータ分析を実現することができる。
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
[第1の実施形態]
<システム構成及び機能構成>
はじめに、第1の実施形態に係るデータ分析装置を含むデータ分析システム全体のシステム構成及び該データ分析装置の機能構成について説明する。図1は、データ分析装置を含むデータ分析システム全体のシステム構成及びデータ分析装置の機能構成の一例を示す第1の図である。
<システム構成及び機能構成>
はじめに、第1の実施形態に係るデータ分析装置を含むデータ分析システム全体のシステム構成及び該データ分析装置の機能構成について説明する。図1は、データ分析装置を含むデータ分析システム全体のシステム構成及びデータ分析装置の機能構成の一例を示す第1の図である。
図1に示すように、データ分析システム100は、データサーバ110_1〜110_nと、データ分析装置120とを有する。データ分析システム100において、データサーバ110_1〜110_nと、データ分析装置120とは、ネットワーク140を介して通信可能に接続される。
データサーバ110_1〜110_nは、それぞれ、データ分析装置120によるデータ分析処理に用いられるデータ(所定の事象を示すデータ)をダウンロード可能に保持する。データサーバ110_1〜110_nに保持されたデータは、データ分析装置120からの要求に応じてダウンロードされ、変数情報格納部127に格納される。
なお、変数情報格納部127に格納されるデータは、データサーバ110_1〜110_nからダウンロードされたものに限定されず、例えば、所定の記録媒体130に記録されたデータを読み出したものであってもよい。
データ分析装置120には、データ分析プログラムがインストールされている。当該データ分析プログラムが実行されることで、データ分析装置120は、変数名入力部121、目的変数指定部122、因果関係図生成部123、ベイジアンネットワーク分析部124、未知変数候補出力部125として機能する。
変数名入力部121は、ベイジアンネットワーク分析部124においてデータ分析されるデータに対応付けられた変数名の入力を受け付け、受け付けた変数名を因果関係図生成部123に通知する。
目的変数指定部122は、因果関係図生成部123において生成された因果関係図において、目的変数となる変数の指定を受け付け、受け付けた変数を因果関係図生成部123に通知する。
因果関係図生成部123は生成部の一例である。因果関係図生成部123は、変数名入力部121より通知された変数名が付された変数のブロックを因果関係図生成画面に表示するとともに、各変数のブロック間を接続する矢印の入力を受け付けることで、各変数間の因果関係を示す因果関係図を生成する。また、因果関係図生成部123は、生成した因果関係図において、目的変数指定部122より通知された変数のブロックを、所定の表示態様で表示する。
また、因果関係図生成部123は設定部の一例でもある。因果関係図生成部123は、目的変数となる変数をベイジアンネットワーク分析部124に設定する。また、因果関係図生成部123は、因果関係図において、目的変数よりも原因側にある変数を判定する。更に、因果関係図生成部123は、原因側にあると判定した変数であって、変数情報格納部127にデータが格納されている変数についての「因果関係情報」をベイジアンネットワーク分析部124に設定する。なお、因果関係情報とは、変数間の因果関係を規定した情報であって、他の変数に影響を与えることを示す情報または他の変数から影響を受けることを示す情報が各変数と対応付けられている情報を指す。
ベイジアンネットワーク分析部124は、第1の分析ツールの一例であり、ベイジアンネットワーク分析処理を実行し、各変数ならびに目的変数に影響を与える変数を導き出す。なお、ベイジアンネットワーク分析部124は、因果関係図生成部123により設定された目的変数及び因果関係情報のもとで、変数情報格納部127より読み出したデータを分析する。
未知変数候補出力部125は、変数名入力部121において入力を受け付けた変数名以外の変数名を一覧表示する。これにより、データ分析装置120のユーザは、一覧表示された変数名を参照し、参照した変数名の中から選択した変数名を、変数名入力部121を介して追加入力することができる。なお、変数名入力部121では、追加入力された変数名を受け付け、因果関係図生成部123に通知する。
<データ分析装置のハードウェア構成>
次に、データ分析装置120のハードウェア構成について説明する。図2は、データ分析装置のハードウェア構成の一例を示す図である。図2に示すように、データ分析装置120は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。CPU201、ROM202、RAM203は、いわゆるコンピュータを形成する。
次に、データ分析装置120のハードウェア構成について説明する。図2は、データ分析装置のハードウェア構成の一例を示す図である。図2に示すように、データ分析装置120は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203を有する。CPU201、ROM202、RAM203は、いわゆるコンピュータを形成する。
また、データ分析装置120は、補助記憶装置204、表示装置205、操作装置206、I/F(Interface)装置207、ドライブ装置208を有する。なお、データ分析装置120の各ハードウェアは、バス209を介して相互に接続されている。
CPU201は、補助記憶装置204にインストールされている各種プログラム(例えば、データ分析プログラム等)を実行する演算デバイスである。
ROM202は、不揮発性メモリである。ROM202は、補助記憶装置204にインストールされている各種プログラムをCPU201が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM202はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
RAM203は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM203は、補助記憶装置204にインストールされている各種プログラムがCPU201によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
補助記憶装置204は、各種プログラムや、各種プログラムが実行される際に用いられるデータを格納する補助記憶デバイスである。例えば、変数情報格納部127は、補助記憶装置204において実現される。
表示装置205は、例えば、因果関係図生成画面等を表示する表示デバイスである。操作装置206は、データ分析装置120のユーザがデータ分析装置120に対して各種指示を入力する入力デバイスである。
I/F装置207は、ネットワーク140に接続し、データサーバ110_1〜110_n等と通信を行うための通信デバイスである。
ドライブ装置208は記録媒体130をセットするためのデバイスである。ここでいう記録媒体130には、CD−ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体130には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
なお、補助記憶装置204にインストールされる各種プログラムは、例えば、配布された記録媒体130がドライブ装置208にセットされ、該記録媒体130に記録された各種プログラムがドライブ装置208により読み出されることでインストールされる。あるいは、補助記憶装置204にインストールされる各種プログラムは、I/F装置207を介して、ネットワーク140よりダウンロードされることでインストールされてもよい。
<変数情報格納部に格納される変数情報の具体例>
次に、変数情報格納部127に格納される変数情報の具体例について説明する。図3は、変数情報の具体例を示す図である。図3に示すように、変数情報300には、情報の項目として、"変数名"と"データ"とが含まれる。
次に、変数情報格納部127に格納される変数情報の具体例について説明する。図3は、変数情報の具体例を示す図である。図3に示すように、変数情報300には、情報の項目として、"変数名"と"データ"とが含まれる。
"変数名"には、変数情報格納部127に格納されたデータに対応付けられた変数名が格納される。"データ"には、変数の値(具体的なデータ)が、それぞれの事象に対応した"データID"ごとに分けて格納される。
<データ分析処理の流れ>
次に、データ分析装置120によるデータ分析処理の流れについて説明する。図4は、データ分析処理の流れを示すフローチャートである。
次に、データ分析装置120によるデータ分析処理の流れについて説明する。図4は、データ分析処理の流れを示すフローチャートである。
ステップS401において、変数名入力部121、目的変数指定部122、因果関係図生成部123は、因果関係図生成処理を実行する。なお、因果関係図生成処理の詳細は後述する。
ステップS402において、ベイジアンネットワーク分析部124は、ベイジアンネットワーク分析処理を実行し、各変数ならびに目的変数に影響を与える変数を導き出す。
ステップS403において、変数名入力部121は、データ分析処理を終了するか否かを判定する。ステップS403において終了しないと判定した場合には(ステップS403においてNoの場合には)、ステップS404に進む。
ステップS404において、未知変数候補出力部125は、未知変数を追加するか否かを判定する。未知変数とは、ステップS401の因果関係図生成処理において、現時点で因果関係図に表示されていない任意の変数を指すものとする。ユーザにより未知変数の変数名の一覧表示が要求された場合には、未知変数を追加すると判定し(ステップS404においてYesと判定し)、ステップS405に進む。
ステップS405において、未知変数候補出力部125は、未知変数追加処理を実行した後、ステップS401に戻る。なお、未知変数追加処理の詳細は後述する。一方、ステップS404において、ユーザにより未知変数の変数名の一覧表示が要求されなかった場合には、未知変数を追加しないと判定し(ステップS404においてNoと判定し)、直接、ステップS401に戻る。
一方、ステップS403において終了すると判定した場合には(ステップS403においてYesの場合には)、データ分析処理を終了する。
<データ分析処理の各工程の詳細>
次に、データ分析処理(図4)の各工程(ここでは、因果関係図生成処理(ステップS401)、未知変数追加処理(ステップS407))の詳細について説明する。
次に、データ分析処理(図4)の各工程(ここでは、因果関係図生成処理(ステップS401)、未知変数追加処理(ステップS407))の詳細について説明する。
(1)因果関係図生成処理の詳細
はじめに、因果関係図生成処理(ステップS401)の詳細について、図6〜図11を参照しながら、図5に沿って説明する。図5は、因果関係図生成処理の流れを示す第1のフローチャートであり、図6、図8、図10は、因果関係図生成画面の一例を示す第1乃至第3の図である。また、図7、図9、図11は、因果関係情報の一例を示す第1乃至第3の図である。
はじめに、因果関係図生成処理(ステップS401)の詳細について、図6〜図11を参照しながら、図5に沿って説明する。図5は、因果関係図生成処理の流れを示す第1のフローチャートであり、図6、図8、図10は、因果関係図生成画面の一例を示す第1乃至第3の図である。また、図7、図9、図11は、因果関係情報の一例を示す第1乃至第3の図である。
図5に示すように、ステップS501において、変数名入力部121は、因果関係図生成画面において入力された変数名を受け付ける。
ステップS502において、因果関係図生成部123は、因果関係図生成画面に変数名が付された変数のブロックを表示する。
図6において、因果関係図生成画面610は、変数名入力部121が変数名入力欄611を介して入力された変数名("材料A投入量"、"材料B投入量"、"材料C投入量")を受け付けた様子を示している。また、因果関係図生成部123が、受け付けた変数名が付された変数のブロック611_1〜611_3を表示した様子を示している。
なお、図6に示すように、因果関係図生成画面610は、更に、中継変数入力欄612を有しており、因果関係図に、例えば、工程のブロック612_1を含めることができるものとする。中継変数とは、データの実態を伴わない抽象的な概念を表すものであり、変数間の因果関係を中継して伝達する役目を負う。
ステップS503において、因果関係図生成部123は、各変数のブロック間を接続する矢印の入力を受け付ける。また、目的変数指定部122は、目的変数となる変数のブロックの指定を受け付ける。
図6において、因果関係図生成画面620は、各変数のブロック間を接続する矢印の入力を受け付けた様子を示している。図6に示すように、因果関係図生成画面620は、矢印入力ボタン621を有している。因果関係図生成画面620において矢印入力ボタン621が押圧されることで、因果関係図生成画面620のブロック間(または、ブロックと処理ブロックとの間、または、処理ブロック間)を接続する矢印(因果方向を示す矢印)を入力することが可能となる。
なお、矢印の後端に接続されたブロックの変数は、矢印の先端に接続されたブロックの変数に影響を与えることを表している。例えば、原因側にある変数である"材料A投入量"〜"運転パラメータF"は、"工程1"を介して、"運転パラメータL"に影響を与えることを表している。
また、図6において、因果関係図生成画面620は、目的変数となる変数のブロックの指定を受け付けた様子を示している。図6に示すように、因果関係図生成画面620は、目的変数指定ボタン622を有している。因果関係図生成画面620において、目的変数指定ボタン622が押圧されることで、因果関係図生成画面620のブロックの中から、目的変数となる変数のブロックを指定することが可能となる。図6の例は、"総合判定"のブロック622_1が、目的変数となる変数のブロックとして指定されたことを示している。
図5の説明に戻る。ステップS504において、因果関係図生成部123は、因果関係図生成処理を終了するか否かを判定する。ステップS504において、因果関係図生成処理を終了すると判定した場合には(ステップS504においてYesの場合には)、ステップS508に進む。
ステップS508において、因果関係図生成部123は、設定指示を受け付けたか否かを判定する。因果関係図生成画面620において設定ボタン623が押圧された場合には、設定指示を受け付けたと判定し(ステップS508においてYesと判定し)、ステップS509に進む。
ステップS509において、因果関係図生成部123は、因果関係図に含まれる変数のうち、目的変数として指定された変数よりも原因側にある変数を判定する。また、因果関係図生成部123は、原因側にあると判定した変数であって、変数情報格納部127にデータが格納されている変数について、因果関係情報を生成する。また、因果関係図生成部123は、目的変数となる変数及び因果関係情報を、ベイジアンネットワーク分析部124に引き渡す。
具体的には、因果関係図生成画面620によれば、目的変数となる変数として"総合判定"がベイジアンネットワーク分析部124に引き渡される。
また、因果関係図生成画面620によれば、図7に示す因果関係情報700がベイジアンネットワーク分析部124に引き渡される。図7に示すように、因果関係情報700には、行方向に、影響を与える側の変数名が配列されており、列方向に、影響を受ける側の変数名が配列されている。そして、行方向と列方向とが交錯する領域には、因果関係があることを示す情報(「因果候補」)が格納される。図7の因果関係情報700は、図6の因果関係図生成画面620において生成された因果関係図に基づいて生成された因果関係情報であるため、図6の因果関係図生成画面620の因果関係図と一致している。
一方、ステップS504において、因果関係図生成処理を終了しないと判定した場合には(ステップS504においてNoの場合には)、ステップS505に進む。ステップS505において、因果関係図生成部123は、同一階層の変数が属するグループ間を接続する矢印の入力を受け付ける。
図8において、因果関係図生成画面800は、同一階層の変数が属するグループ間を接続する矢印の入力を受け付けた様子を示している。図8に示すように、因果関係図生成画面800は、グループボタン801を有している。因果関係図生成画面800においてグループボタン801が押圧されることで、因果関係図生成画面800において、同一階層の変数が属するグループを指定することが可能となる。図8の例は、"材料A投入量"〜"材料C投入量"の各変数が同一のグループ801_1として指定されたことを示している。
また、図8に示すように、因果関係図生成画面800は、矢印入力ボタン621を有している。図8の例は、矢印入力ボタン621が押圧されたことで、グループ801_1と"総合判定"のブロックとを接続する矢印が入力されたことを示している。
ステップS506において、因果関係図生成部123は、因果関係図生成処理を終了するか否かを判定する。ステップS506において、因果関係図生成処理を終了すると判定した場合には(ステップS506においてYesの場合には)、ステップS508に進む。
ステップS508において、因果関係図生成部123は、設定指示を受け付けたか否かを判定する。因果関係図生成画面800において設定ボタン623が押圧された場合には、設定指示を受け付けたと判定し(ステップS508においてYesと判定し)、ステップS509に進む。
ステップS509において、因果関係図生成部123は、因果関係図に含まれる変数のうち、目的変数として指定された変数よりも原因側にある変数を判定する。また、因果関係図生成部123は、原因側にあると判定した変数であって、変数情報格納部127にデータが格納されている変数について、因果関係情報を生成する。また、因果関係図生成部123は、目的変数となる変数及び因果関係情報を、ベイジアンネットワーク分析部124に引き渡す。
具体的には、因果関係図生成画面800によれば、目的変数となる変数として"総合判定"がベイジアンネットワーク分析部124に引き渡される。
また、因果関係図生成画面800によれば、図9に示す因果関係情報900がベイジアンネットワーク分析部124に引き渡される。図7との相違点は、グループ801_1に属する各変数("材料A投入量"、"材料B投入量"、"材料C投入量")と、"総合判定"との間に、因果関係を示す情報が格納されている点である。
一方、ステップS506において、因果関係図生成処理を終了しないと判定した場合には(ステップS506においてNoの場合には)、ステップS507に進む。ステップS507において、因果関係図生成部123は、同一階層の変数が属するグループ内の各変数のブロック間を接続する矢印の入力を受け付ける。
図10において、因果関係図生成画面1000は、同一階層の変数が属するグループ内の各変数のブロック間を接続する矢印の入力を受け付けた様子を示している。図10に示すように、因果関係図生成画面1000は、矢印入力ボタン621を有している。
図10の例は、矢印入力ボタン621が押圧されることで、グループ801_1に属する各変数("材料A投入量"、"材料B投入量"、"材料C投入量")のブロック間を接続する矢印が入力されたことを示している。また、図10の例は、矢印入力ボタン621が押圧されることで、グループ801_2に属する各変数("材料G投入量"、"材料H投入量"、"材料I投入量")のブロック間を接続する矢印が入力されたことを示している。なお、図10に示すように、接続されたブロックの各変数間において相互に影響を及ぼし合う場合には、両端矢印が入力されることになる。
ステップS508において、因果関係図生成部123は、設定指示を受け付けたか否かを判定する。因果関係図生成画面1000において設定ボタン623が押圧された場合には、設定指示を受け付けたと判定し(ステップS508においてYesと判定し)、ステップS509に進む。
ステップS509において、因果関係図生成部123は、因果関係図に含まれる変数のうち、目的変数として指定された変数よりも原因側にある変数を判定する。また、因果関係図生成部123は、原因側にあると判定した変数であって、変数情報格納部127にデータが格納されている変数について、因果関係情報を生成する。また、因果関係図生成部123は、目的変数となる変数及び因果関係情報を、ベイジアンネットワーク分析部124に引き渡す。
具体的には、因果関係図生成画面1000によれば、目的変数となる変数として"総合判定"がベイジアンネットワーク分析部124に引き渡される。
また、因果関係図生成画面1000によれば、図11に示す因果関係情報1100がベイジアンネットワーク分析部124に引き渡される。図9との相違点は、同一階層のグループに属する各変数("材料A投入量"、"材料B投入量"、"材料C投入量")間に、因果関係を示す情報が格納されている点である。また、図9との相違点は、同一階層のグループに属する各変数("材料G投入量"、"材料H投入量"、"材表I投入量")間に、因果関係を示す情報が格納されている点である。
一方、ステップS508において、設定指示を受け付けていないと判定した場合には(ステップS508においてNoと判定した場合には)、ステップS510に進む。ステップS510において、変数名入力部121は、因果関係図生成処理を終了するか否かを判定する。
ステップS510において、因果関係図生成処理を終了しないと判定した場合には(ステップS510においてNoの場合には)、ステップS501に戻る。一方、ステップS510において終了すると判定した場合には(ステップS510においてYesの場合には)、因果関係図生成処理を終了する。
(2)未知変数追加処理の詳細
次に、未知変数追加処理(ステップS407)の詳細について、図13〜図14を参照しながら、図12に沿って説明する。図12は、未知変数追加処理の流れを示すフローチャートであり、図4を用いて説明したとおり、ユーザにより未知変数の変数名の一覧表示が要求された場合に実行される。また、図13は未知変数の一例を示す図であり、図14は、因果関係図生成画面の一例を示す第4の図である。
次に、未知変数追加処理(ステップS407)の詳細について、図13〜図14を参照しながら、図12に沿って説明する。図12は、未知変数追加処理の流れを示すフローチャートであり、図4を用いて説明したとおり、ユーザにより未知変数の変数名の一覧表示が要求された場合に実行される。また、図13は未知変数の一例を示す図であり、図14は、因果関係図生成画面の一例を示す第4の図である。
なお、図12(a)は、未知変数のうち、関連データ一覧に含まれる変数のブロックを追加する場合の未知変数追加処理を表している。また、図12(b)は、未知変数のうち、非関連データ一覧に含まれる変数のブロックを追加する場合の未知変数追加処理を表している。更に、図12(c)は、未知変数のうち、取得不可データ一覧に含まれる変数のブロックを追加する場合の未知変数追加処理を表している。図12(a)〜(c)に示す各フローチャートは、全てが実行されてもよいし、ユーザの選択に基づき、いずれか1つまたは2つが実行されてもよい。
図12(a)のステップS1201において、未知変数候補出力部125は、現在の変数に関連する変数の変数名の一覧を表示する。具体的には、現在、変数情報格納部127にデータが格納されている変数であって、現在、因果関係図生成画面に表示されていない変数の変数名を、現在の変数に関連する変数の変数名の一覧として表示する。
ステップS1202において、変数名入力部121は、ステップS1201において表示された一覧からユーザが選択して入力した変数名を受け付ける。これにより、当該変数名が付された変数のブロックが、現在の因果関係図生成画面に表示される。
図13において、関連データ一覧1300は、変数情報格納部127にデータが格納されている変数(変数情報300参照)であって、現在の因果関係図生成画面1000に表示されていない変数の変数名の一覧である。図12(a)に示す未知変数追加処理によれば、関連データ一覧1300に含まれる変数のブロックが追加されることになる。
一方、図12(b)のステップS1211において、未知変数候補出力部125は、現在の変数に関連しないが、取得可能な変数の変数名の一覧を表示する。具体的には、変数情報格納部127にデータが格納されていないが、ネットワーク140を介して、あるいは、記録媒体130を介して取得可能な変数の変数名の一覧を表示する。
ステップS1212において、変数名入力部121は、ステップS1211において表示された一覧からユーザが選択して入力した変数名を受け付ける。これにより、当該変数名が付された変数のブロックが、現在の因果関係図生成画面に表示される。
図13において、非関連データ一覧1310は、変数情報格納部127にデータが格納されていないが、ネットワーク140を介して、あるいは、記録媒体130を介して取得可能な変数の変数名の一覧である。図12(b)に示す未知変数追加処理によれば、非関連データ一覧1310に含まれる変数のブロックが追加されることになる。なお、図14に示す因果関係図生成画面1400において、ブロック611_4は、非関連データ一覧1310において"湿度"が選択されたことで追加されたブロックを示している。
一方、図12(c)のステップS1221において、未知変数候補出力部125は、現在の変数に関連せず、かつ、取得が不可能な変数の変数名の一覧を表示する。具体的には、変数情報格納部127にデータが格納されておらず、かつ、ネットワーク140を介して、あるいは、記録媒体130を介して取得が不可能な変数の変数名の一覧を表示する。
ステップS1222において、変数名入力部121は、ステップS1221において表示された一覧からユーザが選択して入力した変数のブロックを、現在の因果関係図生成画面に表示する。なお、因果関係図生成画面において、取得が不可能な変数のブロックは、取得が可能な変数のブロックとは異なる表示態様で表示されるものとする。
ステップS1223において、変数名入力部121は、ステップS1222において追加された変数に影響を与える変数であって、現在の変数に関連する変数または現在の変数に関連しないが取得可能な変数の変数名の入力を受け付ける。また、因果関係図生成部123は、入力を受け付けた変数名が付された変数のブロックを、現在の因果関係図生成画面に表示する。
図13において、取得不可データ一覧1320は、変数情報格納部127にデータが格納されておらず、かつ、ネットワーク140を介して、あるいは、記録媒体130を介して取得が不可能な変数の変数名の一覧である。図12(c)に示す未知変数追加処理によれば、取得不可データ一覧1320に含まれる変数のブロックが追加されることになる。
図14に示す因果関係図生成画面1400において、ブロック611_5は、取得不可データ一覧1320において、ユーザが"測定値S"を選択して入力したことで追加されたブロックを示している。また、図14に示す因果関係図生成画面1400において、ブロック611_6は、"測定値S"に影響を与える変数であって、関連データ一覧1300からユーザが"測定値T"を選択して入力したことで追加されたブロックを示している。
<まとめ>
以上の説明から明らかなように、第1の実施形態に係るデータ分析装置120では、
・変数の入力と、変数間の因果方向を示す矢印の入力とを受け付け、因果関係図を生成する。
・設定指示に応じて、因果関係図において目的変数として指定された変数をベイジアンネットワーク分析部に設定する。また、目的変数よりも原因側にある変数であって、変数情報格納部にデータが格納されている変数を、ベイジアンネットワーク分析部に設定する。更に、変数間の因果関係を示す情報を、ベイジアンネットワーク分析部124に設定する。
以上の説明から明らかなように、第1の実施形態に係るデータ分析装置120では、
・変数の入力と、変数間の因果方向を示す矢印の入力とを受け付け、因果関係図を生成する。
・設定指示に応じて、因果関係図において目的変数として指定された変数をベイジアンネットワーク分析部に設定する。また、目的変数よりも原因側にある変数であって、変数情報格納部にデータが格納されている変数を、ベイジアンネットワーク分析部に設定する。更に、変数間の因果関係を示す情報を、ベイジアンネットワーク分析部124に設定する。
このように、因果関係図を生成するためのツールを提供するとともに、因果関係図に基づいて、ベイジアンネットワーク分析部124に、目的変数と因果関係情報とを設定する構成とすることで、因果関係についての検討結果を過不足なく反映させることができる。
この結果、第1の実施形態によれば、より精度の高いデータ分析を実現することができる。
[第2の実施形態]
上記第1の実施形態では、生成した因果関係図をベイジアンネットワーク分析部124に反映させる場合について説明した。しかしながら、因果関係図を反映させる分析ツールは、ベイジアンネットワーク分析部124に限定されない。例えば、汎用的な手法を用いた分析ツールに反映させてもよい。なお、ここでいう汎用的な手法を用いた分析ツールとは、複数の説明変数と1つの目的変数との組を設定することで、説明変数と目的変数との関係性を分析する分析ツールを指す。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
上記第1の実施形態では、生成した因果関係図をベイジアンネットワーク分析部124に反映させる場合について説明した。しかしながら、因果関係図を反映させる分析ツールは、ベイジアンネットワーク分析部124に限定されない。例えば、汎用的な手法を用いた分析ツールに反映させてもよい。なお、ここでいう汎用的な手法を用いた分析ツールとは、複数の説明変数と1つの目的変数との組を設定することで、説明変数と目的変数との関係性を分析する分析ツールを指す。以下、第2の実施形態について、上記第1の実施形態との相違点を中心に説明する。
<システム構成及び機能構成>
はじめに、第2の実施形態に係るデータ分析装置を含むデータ分析システム全体のシステム構成及び該データ分析装置の機能構成について説明する。図15は、データ分析装置を含むデータ分析システム全体のシステム構成及びデータ分析装置の機能構成の一例を示す第2の図である。
はじめに、第2の実施形態に係るデータ分析装置を含むデータ分析システム全体のシステム構成及び該データ分析装置の機能構成について説明する。図15は、データ分析装置を含むデータ分析システム全体のシステム構成及びデータ分析装置の機能構成の一例を示す第2の図である。
図1との相違点は、データ分析装置1500が、因果関係図生成部1501、汎用分析部1502及び目的変数候補選択部1503を有する点である。
因果関係図生成部1501は、変数名入力部121より通知された変数名が付された変数のブロックを因果関係図生成画面に表示するとともに、各変数のブロック間を接続する矢印の入力を受け付けることで、各変数間の因果関係を示す因果関係図を生成する。また、因果関係図生成部1501は、生成した因果関係図において、目的変数指定部122より通知された変数のブロックを、所定の表示態様で表示する。
また、因果関係図生成部1501は、目的変数となる変数を汎用分析部1502に設定する。更に、因果関係図生成部123は、因果関係図において、目的変数よりも原因側にある変数を判定し、原因側にあると判定した変数であって、変数情報格納部127にデータが格納された変数を、説明変数として、汎用分析部1502に設定する。
汎用分析部1502は、説明変数と目的変数との関係性を分析することで、目的変数に影響を与える説明変数を導き出す。なお、汎用分析部1502は、因果関係図生成部1501により設定された目的変数及び説明変数のもとで、変数情報格納部127より読み出したデータを分析する。
目的変数候補選択部1503は、因果関係図生成部1501において生成された因果関係図に含まれる各変数のうち、目的変数の候補となる変数を絞り込み、絞り込まれた変数のブロックの表示態様を変更する。これにより、データ分析装置1500のユーザは、因果関係図に表示された各変数のブロックのうち、表示態様が変更されたブロックの中から、目的変数を指定することが可能となる。この結果、データ分析装置1500のユーザは、適切な変数を目的変数として指定することが可能となり、より精度の高いデータ分析を実現することが可能となる。
なお、目的変数候補選択部1503は、目的変数の候補となる変数を絞り込むにあたり、所定の指標に基づいて生成された分岐図(例えば、管理会計データに基づいて生成された分岐図等)を取得する。そして、目的変数候補選択部1503は、取得した分岐図における各変数の位置関係に基づいて、因果関係図に含まれる変数の中から、目的変数の候補となる変数を絞り込む。
<因果関係図生成処理の詳細>
次に、因果関係図生成処理の詳細について説明する。図16は、因果関係図生成処理の流れを示す第2のフローチャートである。図5との相違点は、ステップS1601とステップS1602である。
次に、因果関係図生成処理の詳細について説明する。図16は、因果関係図生成処理の流れを示す第2のフローチャートである。図5との相違点は、ステップS1601とステップS1602である。
ステップS1601において、目的変数候補選択部1503、目的変数指定部122、因果関係図生成部1501は、目的変数指定処理を実行する。なお、目的変数指定処理の詳細は、後述する。
ステップS1602において、因果関係図生成部1501は、目的変数となる変数及び説明変数を汎用分析部1502に引き渡す。これにより、汎用分析部1502には、因果関係図生成部1501より引き渡された目的変数及び説明変数が設定される。
なお、因果関係図生成部1501は、説明変数と判定した変数のうち、変数情報格納部127にデータが格納されている変数を、最終的に、説明変数として汎用分析部1502に引き渡すものとする。
<目的変数指定処理の詳細>
次に、目的変数指定処理(図16のステップS1601)の詳細について図18〜図20を参照しながら、図17に沿って説明する。図17は、目的変数指定処理の流れを示すフローチャートであり、図18及び図19は、因果関係図生成画面の一例を示す第5及び第6の図である。また、図20は、目的変数及び説明変数情報の一例を示す図である。
次に、目的変数指定処理(図16のステップS1601)の詳細について図18〜図20を参照しながら、図17に沿って説明する。図17は、目的変数指定処理の流れを示すフローチャートであり、図18及び図19は、因果関係図生成画面の一例を示す第5及び第6の図である。また、図20は、目的変数及び説明変数情報の一例を示す図である。
図17のステップS1701において、目的変数候補選択部1503は、管理会計データの分岐図を取得する。図18において、因果関係図生成画面1810は、メニューから管理会計データの分岐図を読み出す様子を示している。なお、管理会計データの分岐図は、予め生成されているものとする。また、図18において、因果関係図生成画面1820は、管理会計データの分岐図が読み出された様子を示している。
ステップS1702において、目的変数候補選択部1503は、管理会計データの分岐図における各変数の位置関係に基づいて、因果関係図に含まれる変数の中から、目的変数の候補となる変数を絞り込む。
図19の因果関係図生成画面1910は、因果関係図に含まれる変数の中から、"変数A"及び"変数D"が目的変数の候補として絞り込まれた様子を示している。
ステップS1703において、目的変数指定部122は、目的変数となる変数の候補の中から、ユーザにより指定された変数を目的変数として受け付ける。図19に示すように、因果関係図生成画面1920は、目的変数指定ボタン622を有している。因果関係図生成画面1920において目的変数指定ボタン622が押圧されることで、因果関係図生成画面1920のブロック(目的変数となる変数の候補のブロック)の中から、目的変数となる変数のブロックを指定することが可能になる。図19の例は、目的変数となる変数の候補("変数A"、"変数D")の中から、"変数A"のブロック622_2が、目的変数となる変数のブロックとして指定された様子を示している。
ステップS1704において、因果関係図生成部1501は、因果関係図において目的変数として指定された変数よりも原因側にある変数を判定し、原因側にあると判定した変数を説明変数として選択する。図20の目的変数及び説明変数情報2000は、因果関係図生成画面1920に示す因果関係図に基づいて生成された、目的変数及び説明変数情報の一例を示している。
因果関係図生成画面1920に示す因果関係図の場合、"変数A"が目的変数として指定されたため、目的変数及び説明変数情報2000の"区分"には、"変数A"に対応付けて、「目的変数」が格納される。
また、因果関係図生成画面1920に示す因果関係図の場合、"変数A"よりも原因側には、"変数B"、"変数C"、"変数G"、"変数H"が含まれる。このうち、"変数G"は、変数情報格納部127にデータが格納されていない変数であるため、一旦、説明変数として取り扱われるが、汎用分析部1502に引き渡される際には(図16のステップS1602においては)、説明変数から除外される。この結果、図20に示すように、最終的に、目的変数及び説明変数情報2000の"区分"には、"変数B"、"変数C"、"変数H"に対応付けて、「説明変数」が格納されることになる。
<まとめ>
以上の説明から明らかなように、第2の実施形態に係るデータ分析装置1500では、
・変数の入力と、変数間の因果方向を示す矢印の入力とを受け付け、因果関係図を生成する。
・設定指示に応じて、因果関係図において目的変数として指定された変数を汎用分析部に設定する。また、目的変数よりも原因側にある変数であって、変数情報格納部にデータが格納されている変数を、説明変数として、汎用分析部に設定する。
・目的変数を指定するにあたり、所定の管理会計データの分岐図を取得し、変数の位置関係に基づいて、目的変数の候補となる変数を絞り込む。
以上の説明から明らかなように、第2の実施形態に係るデータ分析装置1500では、
・変数の入力と、変数間の因果方向を示す矢印の入力とを受け付け、因果関係図を生成する。
・設定指示に応じて、因果関係図において目的変数として指定された変数を汎用分析部に設定する。また、目的変数よりも原因側にある変数であって、変数情報格納部にデータが格納されている変数を、説明変数として、汎用分析部に設定する。
・目的変数を指定するにあたり、所定の管理会計データの分岐図を取得し、変数の位置関係に基づいて、目的変数の候補となる変数を絞り込む。
このように、因果関係図を生成するためのツールを提供するとともに、因果関係図に基づいて、汎用分析部1502に、適切な目的変数と説明変数とを設定する構成とすることで、因果関係についての検討結果を過不足なく反映させることができる。
この結果、第2の実施形態によれば、より精度の高いデータ分析を実現することができる。
[その他の実施形態]
上記第1及び第2の実施形態では、因果関係図において、変数間の因果方向を矢印により入力するものとして説明したが、変数間の因果方向の入力方法はこれに限定されず、矢印以外の方法により入力してもよい。
上記第1及び第2の実施形態では、因果関係図において、変数間の因果方向を矢印により入力するものとして説明したが、変数間の因果方向の入力方法はこれに限定されず、矢印以外の方法により入力してもよい。
また、上記第1及び第2の実施形態の因果関係図生成処理では、因果関係の指定(ステップS503)、グループ間因果関係の指定(ステップS505)、グループ内因果関係の指定(ステップS507)の順で各工程を実行するものとして説明した。しかしながら、各工程の実行順序は、これに限定されない。
また、上記第2の実施形態では、管理会計データの分岐図を予め生成しておき、因果関係図生成画面1810において読み出すものとして説明したが、因果関係図生成画面1810において、管理会計データの分岐図を新たに生成するように構成してもよい。
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
100 :データ分析システム
120 :データ分析装置
121 :変数名入力部
122 :目的変数指定部
123 :因果関係図生成部
124 :ベイジアンネットワーク分析部
125 :未知変数候補出力部
127 :変数情報格納部
300 :変数情報
610 :因果関係図生成画面
611 :変数名入力欄
612 :中継変数入力欄
620 :因果関係図生成画面
621 :矢印入力ボタン
622 :目的変数指定ボタン
623 :設定ボタン
700 :因果関係情報
800 :因果関係図生成画面
801 :グループボタン
900 :因果関係情報
1000 :因果関係図生成画面
1100 :因果関係情報
1300 :関連データ一覧
1310 :非関連データ一覧
1320 :取得不可データ一覧
1400 :因果関係図生成画面
1500 :データ分析装置
1501 :因果関係図生成部
1502 :汎用分析部
1503 :目的変数候補選択部
1810、1820 :因果関係図生成画面
1910、1920 :因果関係図生成画面
2000 :目的変数及び説明変数情報
120 :データ分析装置
121 :変数名入力部
122 :目的変数指定部
123 :因果関係図生成部
124 :ベイジアンネットワーク分析部
125 :未知変数候補出力部
127 :変数情報格納部
300 :変数情報
610 :因果関係図生成画面
611 :変数名入力欄
612 :中継変数入力欄
620 :因果関係図生成画面
621 :矢印入力ボタン
622 :目的変数指定ボタン
623 :設定ボタン
700 :因果関係情報
800 :因果関係図生成画面
801 :グループボタン
900 :因果関係情報
1000 :因果関係図生成画面
1100 :因果関係情報
1300 :関連データ一覧
1310 :非関連データ一覧
1320 :取得不可データ一覧
1400 :因果関係図生成画面
1500 :データ分析装置
1501 :因果関係図生成部
1502 :汎用分析部
1503 :目的変数候補選択部
1810、1820 :因果関係図生成画面
1910、1920 :因果関係図生成画面
2000 :目的変数及び説明変数情報
Claims (9)
- 各事象を示す変数の入力と、各変数間の因果方向の入力とを受け付けることで、変数間の因果関係を示す因果関係図を生成する生成部と、
前記因果関係図において目的変数として指定された変数と、前記因果関係図において、該目的変数よりも原因側にある変数とを、該目的変数に影響を与える変数を分析する分析ツールに設定する設定部と
を有するデータ分析装置。 - 前記生成部は、任意の変数の入力を受け付け、
前記設定部は、前記目的変数よりも原因側にある変数のうち、所定の格納部にデータが格納されている変数を、前記分析ツールに設定する、請求項1に記載のデータ分析装置。 - 前記分析ツールは、ベイジアンネットワークを用いた第1の分析ツールであり、
前記設定部は、前記変数間の因果関係を示す情報を、前記第1の分析ツールに設定する、請求項1または2に記載のデータ分析装置。 - 前記生成部は、同一階層の変数が属するグループ間の因果方向の入力を受け付けることで、第1のグループに属する各変数と、第2のグループに属する各変数との間の因果関係を示す因果関係図を生成する、請求項3に記載のデータ分析装置。
- 前記生成部は、同一階層の変数が属するグループ内の各変数の因果方向の入力を受け付けることで、同一階層のグループに属する各変数間の因果関係を示す因果関係図を生成する、請求項3または4に記載のデータ分析装置。
- 前記分析ツールは、複数の説明変数と1の目的変数とを設定する第2の分析ツールであり、
前記設定部は、前記目的変数よりも原因側にある変数を、前記説明変数として、前記第2の分析ツールに設定する、請求項1または2に記載のデータ分析装置。 - 所定の管理会計データに基づいて生成された分岐図における変数の位置関係に基づいて、前記因果関係図に含まれる変数の中から、前記目的変数の候補となる変数を絞り込み、絞り込まれた変数の中から、前記目的変数となる変数の指定を受け付ける指定部を更に有することを特徴とする請求項6に記載のデータ分析装置。
- 各事象を示す変数の入力と、各変数間の因果方向の入力とを受け付けることで、変数間の因果関係を示す因果関係図を生成する生成工程と、
前記因果関係図において目的変数として指定された変数と、前記因果関係図において、該目的変数よりも原因側にある変数とを、該目的変数に影響を与える変数を分析する分析ツールに設定する設定工程と
を有するデータ分析方法。 - 各事象を示す変数の入力と、各変数間の因果方向の入力とを受け付けることで、変数間の因果関係を示す因果関係図を生成する生成工程と、
前記因果関係図において目的変数として指定された変数と、前記因果関係図において、該目的変数よりも原因側にある変数とを、該目的変数に影響を与える変数を分析する分析ツールに設定する設定工程と
をコンピュータに実行させるためのデータ分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018215971A JP2020086614A (ja) | 2018-11-16 | 2018-11-16 | データ分析装置、データ分析方法及びデータ分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018215971A JP2020086614A (ja) | 2018-11-16 | 2018-11-16 | データ分析装置、データ分析方法及びデータ分析プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020086614A true JP2020086614A (ja) | 2020-06-04 |
Family
ID=70909937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018215971A Pending JP2020086614A (ja) | 2018-11-16 | 2018-11-16 | データ分析装置、データ分析方法及びデータ分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020086614A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113113141A (zh) * | 2021-04-02 | 2021-07-13 | 北京果壳生物科技有限公司 | 一种基于孟德尔随机化评估微量营养素与精神类疾病因果关系的方法 |
-
2018
- 2018-11-16 JP JP2018215971A patent/JP2020086614A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113113141A (zh) * | 2021-04-02 | 2021-07-13 | 北京果壳生物科技有限公司 | 一种基于孟德尔随机化评估微量营养素与精神类疾病因果关系的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108959059B (zh) | 一种测试方法以及测试平台 | |
US10127129B2 (en) | Non-invasive time-based profiling tool | |
CN110249300B (zh) | 内置于数据集成工作流编辑器中的测试用例生成器 | |
US11106460B2 (en) | Software change tracking and analysis | |
CN106095866A (zh) | 应用程序推荐方法、程序启动速度的优化方法和装置 | |
CN109308254A (zh) | 一种测试方法、装置及测试设备 | |
Jung et al. | Slim BIM charts for rapidly visualizing and quantifying levels of BIM adoption and implementation | |
CN111026647A (zh) | 代码覆盖率的获取方法、装置、计算机设备和存储介质 | |
CN105868956A (zh) | 一种数据处理方法及装置 | |
CN111190814B (zh) | 软件测试用例的生成方法、装置、存储介质及终端 | |
CN114691506A (zh) | 压力测试方法、装置、设备、介质和程序产品 | |
JP2020086614A (ja) | データ分析装置、データ分析方法及びデータ分析プログラム | |
US20210209013A1 (en) | Method, apparatus, device and storage medium for map retrieval test | |
Castro et al. | Automated tools for usability evaluation: a systematic mapping study | |
CN105009056A (zh) | 确定图形用户界面控制实例的事件覆盖度量和输入覆盖度量 | |
CN111949845A (zh) | 处理测绘信息的方法、装置、计算机设备和存储介质 | |
US20160209908A1 (en) | Cloud-based integrated system for developing and evaluating energy efficient software | |
Rothlisberger et al. | Supporting task-oriented navigation in IDEs with configurable HeatMaps | |
CN116225690A (zh) | 基于docker的内存多维数据库计算负载均衡方法及系统 | |
CN110347577B (zh) | 一种页面测试方法、装置及其设备 | |
CN109582676B (zh) | 电力数据处理方法、装置、计算机设备和存储介质 | |
Mamtora et al. | Australian academic libraries and research support | |
CN109697141B (zh) | 用于可视化测试的方法及装置 | |
Dimech et al. | Comprehensive quality control programme for serology and nucleic acid testing using an internet-based application | |
CN115348195B (zh) | 地球系统模式数据的传输测速方法及系统 |