JP5918368B2 - Data analysis support method and system - Google Patents
Data analysis support method and system Download PDFInfo
- Publication number
- JP5918368B2 JP5918368B2 JP2014524563A JP2014524563A JP5918368B2 JP 5918368 B2 JP5918368 B2 JP 5918368B2 JP 2014524563 A JP2014524563 A JP 2014524563A JP 2014524563 A JP2014524563 A JP 2014524563A JP 5918368 B2 JP5918368 B2 JP 5918368B2
- Authority
- JP
- Japan
- Prior art keywords
- template
- data
- function
- processing
- visualization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 216
- 238000007405 data analysis Methods 0.000 title claims description 41
- 230000008569 process Effects 0.000 claims description 152
- 238000004458 analytical method Methods 0.000 claims description 107
- 238000013079 data visualisation Methods 0.000 claims description 73
- 238000010586 diagram Methods 0.000 claims description 46
- 238000000605 extraction Methods 0.000 claims 1
- 238000012800 visualization Methods 0.000 description 49
- 239000000284 extract Substances 0.000 description 27
- 230000008859 change Effects 0.000 description 21
- 230000006870 function Effects 0.000 description 13
- 230000010354 integration Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013386 optimize process Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、データ分析を支援するデータ分析支援方法及びシステムに係り、特に分析対象データやデータに対する処理が固定で無い場合の分析支援技術に関する。 The present invention relates to a data analysis support method and system for supporting data analysis, and more particularly, to an analysis support technology when analysis target data and processing for data are not fixed.
業務システムなどから蓄積される企業内の膨大なデータを、蓄積、分析、加工して、企業の意思決定に活用するビジネスインテリジェンスという手法がある。この手法は、複数のデータベース(DB)を横断し、多種、大量のデータを高速に分析可能である。この手法は、高速化のために、高度に構造化された分析対象データを分析の目的に応じて予め構築する必要があり、分析内容と必要なデータが決まっている定型分析に強い。 There is a method called business intelligence that stores, analyzes, and processes a large amount of corporate data accumulated from business systems, etc., and uses it for corporate decision making. This method can analyze a large amount of data at a high speed across a plurality of databases (DB). This method is highly resistant to routine analysis in which highly structured analysis target data needs to be constructed in advance according to the purpose of analysis in order to increase the speed, and analysis contents and necessary data are determined.
一方、分析対象データやデータに対する分析処理や可視化処理が固定ではない場合には、試行錯誤のたびに,分析対象データを作り変えると共に、分析処理、可視化処理を変更しなければならない。このようなデータ分析に関連する背景技術として、特許文献1や特許文献2がある。特許文献1には、コンピュータ側で検知した分析手順を管理サーバのデータベースに記録し、記録した分析手順を第三者が共有・再利用することが記載されている。また、特許文献2には、最適化されたプロセス定義を提供すること、言い換えると、既存プロセスを再利用し、新しいプロセスを作る際に、既存プロセス前後関係を利用し、実行可能な新しいプロセスを提示することが開示されている。
On the other hand, when the analysis process and the visualization process for the analysis target data and data are not fixed, the analysis target data must be regenerated and the analysis process and the visualization process must be changed every time trial and error. As background art related to such data analysis, there are
上述の背景技術に見るように、分析手順を記録し、編集や再構築することにより再利用する技術では、過去の分析手順の再現は可能である。また過去の分析手順を編集することにより、部分的に再利用し、新たな分析を行うことも可能である。しかしその編集により、編集した部分より後の部分は再現不可能となるため、その編集が他の処理を自動的に変更、あるいは他の処理を変更するための候補を提示するような技術が、求められている。 As seen in the background art described above, the analysis procedure is recorded and can be reproduced by editing or reconstructing the past analysis procedure. In addition, by editing the past analysis procedure, it is possible to partially reuse and perform a new analysis. However, because the editing makes it impossible to reproduce the part after the edited part, the technology that automatically changes other processes or presents candidates for changing other processes, It has been demanded.
本発明の目的は、上記の課題を解決し、過去の分析手順を編集し、他の処理を自動的に変更、或いは他の処理を変更するための候補を提示することが可能なデータ分析支援方法及びシステムを提供することにある。 An object of the present invention is to provide a data analysis support capable of solving the above-described problems, editing past analysis procedures, automatically changing other processes, or presenting candidates for changing other processes. It is to provide a method and system.
本発明においては、上記の目的を達成するため、計算機を用いたデータ分析支援方法であって、計算機は、抽出したデータに入力データ作成処理を施すことにより分析対象データを作成する入力データ作成機能と、データにデータ処理を施し処理結果データを作成するデータ処理機能と、データに可視化処理を施し可視化するデータ可視化機能を実行することによりデータ分析支援の作業を行うデータ分析支援方法を提供する。 In the present invention, in order to achieve the above object, a data analysis support method using a computer, wherein the computer performs input data creation processing on the extracted data to create analysis target data And a data analysis support method for performing data analysis support work by executing a data processing function for performing data processing on the data to generate processing result data and a data visualization function for performing visualization processing on the data for visualization.
また、本発明においては、上記の目的を達成するため、データ分析支援システムであって、複数のテンプレートを蓄積するテンプレートデータベースを記憶する記憶部と、テンプレートを実行する処理部とを備え、処理部は、データに入力データ作成処理を施すことにより分析対象データを作成する入力データ作成機能と、データにデータ処理を施し処理結果データを作成するデータ処理機能と、データに可視化処理を施し可視化するデータ可視化機能を実行することによりデータ分析支援の作業を行う構成のデータ分析支援システムを提供する。 In the present invention, in order to achieve the above object, the data analysis support system includes a storage unit that stores a template database that accumulates a plurality of templates, and a processing unit that executes the templates. Is an input data creation function that creates data to be analyzed by applying input data creation processing to the data, a data processing function that performs data processing on the data and creates processing result data, and data that is visualized and visualized Provided is a data analysis support system configured to perform data analysis support work by executing a visualization function.
本発明によれば、利用者の分析作業に要する手間を削減することが可能となる。 According to the present invention, it is possible to reduce the labor required for the user's analysis work.
以下、本発明のデータ分析支援方法、及び装置の各種の実施の形態について、図面を参照しながら説明する。なお、本明細書において、計算機等が実現する各種の機能を、作業或いは部と称する場合がある。例えば、分析対象データを作成するデータ作成機能を、データ作成作業、或いはデータ作成部、分析対象データにデータ処理を施し処理結果データを作成するデータ処理機能を、データ処理作業、或いはデータ処理部、処理結果データに可視化処理を施すデータ可視化機能をデータ可視化作業、或いはデータ可視化部等と呼ぶ場合がある。 Hereinafter, various embodiments of a data analysis support method and apparatus according to the present invention will be described with reference to the drawings. In the present specification, various functions realized by a computer or the like may be referred to as operations or units. For example, a data creation function for creating analysis target data is a data creation work or data creation unit, a data processing function for performing data processing on analysis target data and creating process result data is a data processing work or data processing unit, A data visualization function that performs a visualization process on the processing result data may be referred to as a data visualization operation or a data visualization unit.
図1は、本実施例の分析支援システムの一構成例のブロック図である。同図のシステムは、計算機101、表示部として機能するディスプレイ102、入力装置103、及びデータベース(DB)104を備える。計算機101、DB104は、ネットワーク105を介して互いに接続される。
FIG. 1 is a block diagram of a configuration example of the analysis support system according to the present embodiment. The system shown in FIG. 1 includes a
計算機101は、利用者100が分析作業を行う際に利用する。さらに、分析作業に関わる種々の機能を提供し、機能実行時のログを収集し、テンプレートを状況に合わせて抽出・推奨することにより利用者100の分析作業を支援する。
The
計算機101は、一般的なPC(Personal Computer)が想定されている。計算機101は、図示を省略した中央処理部(Central Processing Unit:CPU)となるプロセッサ、記憶部であるメモリ、及びインターフェース部であるインターフェースを備える。プロセッサは、メモリに記憶されたプログラムを処理することによって、各種処理を実行する。メモリは、処理を実行するためのプログラム、及びデータを記憶する。インターフェースとしては、キーボード、マウスなどの入力装置103に接続するもの、ディスプレイ102に接続するもの、ネットワーク105を介して、DB104などに接続するもの、などを備える。
The
DB104は、例えば、企業に関わる情報、各種統計データ、センサ等の時系列データ、Webアクセスログなどの各種データを保持するデータベースである。DB104は、図1に見るように、図示を省略した外部のストレージ装置に格納され、ネットワーク105を介して計算機101に接続されるように構成してもよいし、計算機101内に含まれるように構成してもよい。
The
計算機101は、入力データ作成部110、データ処理部120、データ可視化部130、ログ記録部140、ログDB141、テンプレート実行部150、テンプレート処理部160、テンプレート推奨部170、テンプレートDB180を備える。入力データ作成部110、データ処理部120、データ可視化部130、ログ記録部140、ログDB141、テンプレート実行部150、テンプレート処理部160、テンプレート推奨部170、テンプレートDB180は例えば、プログラムであってメモリに記憶され、プロセッサによって実行される機能ブロックである。ログDB141、テンプレートDB180は、それぞれログの、テンプレートのデータベースを示し、省略されたPC内の記憶部であるメモリに蓄積される。
The
入力データ作成部110は、利用者100あるいはテンプレート実行部150の指示によりDB104から必要なデータを抽出し、抽出したデータに入力データ作成処理を施すことにより、分析対象データを作成する。
The input
データ処理部120は、利用者100あるいはテンプレート実行部150の指示により、入力データ作成部110が作成した分析対象データにデータ処理を施し、処理結果データを作成する。
The
データ可視化部130は、利用者100あるいはテンプレート実行部150の指示により、データ処理部120が作成した処理結果データに可視化処理を施し、可視化する。
The
ログ記録部140は、入力データ作成部110、データ処理部120、データ可視化部130の各処理をログDB141に記録する。
The
テンプレート実行部150は、利用者100の指示により、テンプレートDB180からテンプレートを取り出し、テンプレートの内容に従って入力データ作成部110、データ処理部120、データ可視化部130に指示し、分析処理を実行する。
The
テンプレート処理部160は、テンプレートからパラメータに関わる情報の抽出、入力データ作成部110が作成した分析対象データやデータ処理部120が作成した処理結果データに対してテンプレートが実行可能かどうかの判定を行う。
The
テンプレート推奨部170は、予め定められた基準でテンプレートDB180からテンプレートを抽出し、利用者100に提示する、また、入力データ作成部110が作成した分析対象データやデータ処理部120が作成した処理結果データに対して適用可能なテンプレートをテンプレートDB180から抽出し、利用者100に提示する。
The
次に、第一の実施例の分析支援システムの計算機101での処理について、具体例を参照しながら説明する。本実施例では、利用者100が、作業1「DBから必要なデータを抽出し、抽出したデータに入力データ作成処理を施すことにより分析対象データを作成」、作業2「分析対象データにデータ処理を施し処理結果データを作成」、作業3「処理結果データに可視化処理を施し可視化」、作業4「作業1からやり直す」という順番で分析作業を行う場面を想定する。
Next, processing in the
図2は、第一の実施例の上記作業1の手順の一例を示すフローチャートである。
まず、プロセッサは、テンプレート推奨部170が指定された基準に従い、テンプレートDB180から入力データ作成部110で実行できるテンプレートを抽出し、リストLiに登録する(S201)。ここで基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などのテンプレートの推奨基準を意味する。FIG. 2 is a flowchart showing an example of the procedure of the
First, the processor extracts a template that can be executed by the input
次に、抽出したリストLiを表示部であるディスプレイ102に表示する(S202)。ディスプレイ102への表示例を図3Aに示す。利用者100がテンプレートTiを選択した場合、テンプレート実行部150が入力データ作成部用のテンプレートTiを実行する(S203、S204)。図3Bはテンプレートのデータ構造、及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。同図の上段は、テンプレートのデータ構造を、同図の下段は、テンプレートの一例を示している。同図の上段に見るように、テンプレートのデータ構造は、その項目名に見るように、パラメータ、処理名、引数からなり、図示する内容のデータが記載される。
Next, the extracted list Li is displayed on the
利用者100がテンプレートを選択しなかった場合は、テンプレートによる分析作業の支援は行わず、GUI(Graphical User Interface)操作などによる通常の分析作業を実施する(S205)。S204やS205で指示され、入力データ作成部110で実行された入力データ作成処理が正常に終了した場合、その結果作成される分析対象データをDaとする。またログ記録部140が入力データ作成部110で実行した処理内容を記録し、ログDB141に登録する(S206、S207)。また、S204でテンプレートを選択した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S207)。
When the user 100 does not select a template, the analysis work is not supported by the template, and a normal analysis work by a GUI (Graphical User Interface) operation or the like is performed (S205). When the input data creation process instructed in S204 or S205 and executed by the input
図3Cの上段、下段にそれぞれログのデータ構造及びログの一例を示す。同図のログ構造に見るように、項目名としてデータ列名、時刻、処理名、引数がある。また、図3Dの上段、下段にそれぞれテンプレートログのデータ構造及びテンプレートログの一例を示す。テンプレートログ構造の項目としては、図示の通り、時刻、処理種別、テンプレート名、パラメータ値、入力データ列名、出力データ列名、可視化結果図がある。図3Eには、可視化結果図のディスプレイ102の表示画面上の表示例を、図3Fにはパラメータ変更用のダイアログの表示画面上の表示例を示したが、これら図3E、図3Fについては後で詳述する。図2の作業1の処理フローチャートに戻り、正常に終了しなかった場合は、ディスプレイ102に問題発生箇所を表示し、終了する(S206、S220)。
An example of the log data structure and log is shown in the upper and lower parts of FIG. 3C, respectively. As can be seen from the log structure in the figure, there are data string names, times, process names, and arguments as item names. 3D shows an example of the data structure of the template log and an example of the template log. As shown in the figure, the template log structure items include time, process type, template name, parameter value, input data string name, output data string name, and visualization result diagram. FIG. 3E shows a display example of the visualization result diagram on the display screen of the
さらに、テンプレートDB180からテンプレート推奨部170が入力データ作成部の処理の結果出力される分析対象データDaに適用可能であり、かつデータ処理部120で実行可能なテンプレートを抽出し、リストLdに登録する(S208)。S208の内容については後で図5を用いて詳述する。
Further, the
図4A、図4Bは、第一の実施例の作業1の具体例を示す図である。具体例としては、選択テンプレートTiの内容が、「指定された二つのテーブルを、指定した列をキー列として統合し、指定した値にキー列名を変更する」の場合に、選択テンプレートTiを実行した結果作成される分析対象データDaの一例を示す。
4A and 4B are diagrams showing a specific example of the
図4Aは、テンプレートTiの例である。この例でのTiのパラメータは5つあり、パラメータ1は、種別がE(その他)で値が「テーブル1」、パラメータ2は種別がE(その他)で値が「テーブル2」、パラメータ3は種別がN(列名)で値が「列A」、パラメータ4は種別がN(列名)で値が「列X」、パラメータ5は、種別がE(その他)で値が「KEY」である。Tiで行う処理はパラメータ1〜5を引数として、「指定された2つのテーブル(パラメータ1,2)を、指定した2つの列(パラメータ3、パラメータ4)をキー列として統合し、指定した値(パラメータ5)にキー列名を変更する」を行う。図4Bは「テーブル統合」のイメージを示す図である。
FIG. 4A is an example of the template Ti. In this example, there are five Ti parameters,
入力データ作成部110で実行可能な処理は図4A、図4Bで示した「テーブル統合」に限ったものではなく、フィルタリングや文字列の置換などSQLやプログラミング言語等で実現可能な処理を複数組み合わせたものを対象とする。
The processing that can be executed by the input
図5は、図2のフローチャートで示したS208の処理について詳述するフローチャート図である。
まず、テンプレートログから処理種別が「データ処理用」であるログを全て抽出し、リストL2に登録する。空のリストLdを用意する。分析対象データDaの列名リストをC1とする(S501)。L2の要素数をN2、 K2=0とする(S502)。L2のK2番目のログから入力データ列名リストC2を取得し、C2⊆C1である場合、リストLdにL2のK2番目のテンプレートを追加する。この処理をL2の要素全てに実行する(S503〜S507)。以上が、本実施例における作業1の手順の説明である。FIG. 5 is a flowchart detailing the process of S208 shown in the flowchart of FIG.
First, all logs whose processing type is “for data processing” are extracted from the template log and registered in the list L2. An empty list Ld is prepared. The column name list of the analysis target data Da is set to C1 (S501). The number of elements of L2 is set to N2 and K2 = 0 (S502). The input data string name list C2 is acquired from the K2th log of L2, and if it is C2⊆C1, the K2th template of L2 is added to the list Ld. This process is executed for all elements of L2 (S503 to S507). The above is the description of the procedure of the
図6は、第一の実施例の作業2の手順の一例を示すフローチャートである。
まず、ディスプレイにS208で作成したデータ処理テンプレートリストLdを表示する(S601)。ディスプレイ102への表示例は図3Aに示すものと同様である。利用者100がテンプレートを選択した場合、テンプレート実行部150がデータ処理部用のテンプレートTdを実行する(S602、S603)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。FIG. 6 is a flowchart illustrating an example of the procedure of the
First, the data processing template list Ld created in S208 is displayed on the display (S601). A display example on the
利用者100がテンプレートを選択しなかった場合は、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施する(S604)。S603やS604で指示され、データ処理部120で実行された分析処理が正常に終了した場合、その結果作成される処理結果データをDrとする。また、ログ記録部140がデータ処理部120で実行した処理内容を記録し、ログDB141に登録する(S605、S606)。また、S603でテンプレートを選択した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S606)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S605、S220)。
When the user 100 does not select the template, the analysis work is not supported by the template, and the normal analysis work by the GUI operation or the like is performed (S604). When the analysis process instructed in S603 or S604 and executed by the
さらに、テンプレートDB180からテンプレート推奨部170がデータ処理部の処理の結果出力される処理結果データDrに適用可能でありかつデータ可視化部130で実行可能なテンプレートを抽出し、リストLvに登録する(S607)。S607の内容については図8で詳述する。
Further, templates that can be applied to the processing result data Dr output from the
図7は、第一の実施例の前記作業2の具体例を示す図である。具体例としては、選択テンプレートTdの内容が「指定した列の要素の出現数を数える」の場合に、選択テンプレートTdを実行した結果作成される処理結果データDrの一例を示す。
FIG. 7 is a diagram showing a specific example of the
図7Aは、テンプレートTdの例である。この例でのTdのパラメータは1つあり、パラメータ1は、種別がN(列名)で値が「KEY」である。Tdで行う処理はパラメータ1を引数として、「指定した列(パラメータ1)の要素の出現数を数える」を行う。図7Bは「要素の出現数を数える」のイメージを示す図である。
FIG. 7A is an example of the template Td. In this example, there is one parameter of Td, and
データ処理部で実行可能な処理は図7で示した「要素の出現数を数える」に限ったものではなく、フィルタリングや文字列の置換、四則演算、統計演算などSQLやプログラミング言語等で実現可能な処理を複数組み合わせたものを対象とする。 The processing that can be executed by the data processing unit is not limited to “counting the number of occurrences of elements” shown in FIG. 7, but can be realized by SQL, programming language, etc. such as filtering, character string replacement, four arithmetic operations, and statistical operations. Targeting a combination of multiple processes.
図8は、図6のフローチャート中のS607の処理について詳述する図である。
まず、テンプレートログから処理種別が「可視化用」であるログを全て抽出し、リストL2に登録する。空のリストLvを用意する。処理結果データDrの列名リストをC1とする(S801)。L2の要素数をN2、 K2=0とする(S802)。L2のK2番目のログから入力データ列名リストC2を取得し、C2⊆C1である場合、リストLvにL2のK2番目のテンプレートを追加する。この処理をL2の要素全てに実行する(S803〜S807)。以上が、本実施例における作業2の手順の説明である。FIG. 8 is a diagram illustrating in detail the processing of S607 in the flowchart of FIG.
First, all logs whose processing type is “for visualization” are extracted from the template log and registered in the list L2. An empty list Lv is prepared. The column name list of the processing result data Dr is set to C1 (S801). The number of elements of L2 is set to N2 and K2 = 0 (S802). The input data string name list C2 is acquired from the K2th log of L2, and when it is C2⊆C1, the K2th template of L2 is added to the list Lv. This process is executed for all elements of L2 (S803 to S807). The above is the description of the procedure of the
図9は、第一の実施例の前記作業3の手順の一例を示すフローチャートである。
まず、ディスプレイにS607で作成したデータ可視化テンプレートリストLv及びLvに含まれる各テンプレートの可視化例を表示する(S901)。ディスプレイ102への表示例を図3A、図3Eに示す。図3Eの310はLvの一覧、311には、310に表示されているテンプレート名を選択すると過去にこのデータ可視化テンプレートの可視化結果が表示される。FIG. 9 is a flowchart showing an example of the procedure of the
First, a visualization example of each template included in the data visualization template lists Lv and Lv created in S607 is displayed on the display (S901). Examples of display on the
利用者100がテンプレートを選択した場合、テンプレート実行部150がデータ可視化部用のテンプレートTvを実行する(S902、S903)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。
When the user 100 selects a template, the
利用者100がテンプレートを選択しなかった場合は、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施する(S904)。S903やS904で指示され、データ可視化部130で実行された分析処理が正常に終了した場合、可視化結果をディスプレイ102に表示する。また、ログ記録部140がデータ可視化部130で実行した処理内容を記録し、ログDB141に登録する(S905、S906)。また、S903でテンプレートを選択した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S906)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S905、S220)。
When the user 100 does not select the template, the analysis work is not supported by the template, and the normal analysis work by the GUI operation or the like is performed (S904). When the analysis process instructed in S903 or S904 and executed by the
さらに、可視化結果が利用者100の所望のものではなかった場合、利用者100が前記作業1〜3の処理を改変して再実行する(S907)。S907の内容については図11で詳述する。
Furthermore, when the visualization result is not what the user 100 desires, the user 100 modifies and re-executes the
図10A、図10Bは、第一の実施例の前記作業3の具体例を示す図である。具体例としては、選択テンプレートTvの内容が「指定した列を棒グラフで表示し、指定した列を横軸の項目名とする」の場合に、選択テンプレートTvを実行した結果作成される可視化の一例を示す。
10A and 10B are diagrams showing a specific example of the
図10Aは、テンプレートTvの例である。この例でのTvのパラメータは2つあり、パラメータ1は、種別がN(列名)で値が「要素の出現数」、パラメータ2は、種別がN(列名)で値が「KEY」である。Tvで行う処理はパラメータ1、2を引数として、「指定した列(パラメータ1)を棒グラフで表示し、指定した列(パラメータ2)を横軸の項目名とする」を行う。図10Bは「棒グラフ」のイメージを示す図である。
FIG. 10A is an example of the template Tv. In this example, there are two parameters of Tv,
データ可視化部で実行可能な処理は図10で示した「指定した列を棒グラフで表示し、指定した列を横軸の項目名とする」に限ったものではなく、グラフ化、アニメーション、などプログラミング言語等で実現可能な処理を複数組み合わせたものを対象とする。 The processing that can be executed by the data visualization unit is not limited to “display the specified column as a bar graph and use the specified column as the item name on the horizontal axis” shown in FIG. The target is a combination of multiple processes that can be implemented in a language or the like.
図11は、図9のフローチャートのS907の内容について詳述する図であり、第一の実施例の前記作業4の手順の一例を示すフローチャートである。
まず、入力データ作成部用のテンプレートTiのパラメータを変更するか、入力データ作成部用のテンプレートTiを選択しなおすか、選択する(S1101,S1102)。入力データ作成部用のテンプレートTiを選択しなおす場合、S201に進む。この処理については前述の通りであるため、ここでは割愛する。FIG. 11 is a diagram for explaining in detail the contents of S907 in the flowchart of FIG. 9, and is a flowchart showing an example of the procedure of the
First, the parameter of the template Ti for the input data creation unit is changed, or the template Ti for the input data creation unit is selected again (S1101, S1102). When the template Ti for the input data creation unit is selected again, the process proceeds to S201. Since this process is as described above, it is omitted here.
入力データ作成部用のテンプレートTiのパラメータを変更する場合、テンプレート処理部160が Tiからパラメータを抽出し、ディスプレイにパラメータ一覧を表示する(S1103)。利用者100により変更するパラメータが選択された場合、ディスプレイにパラメータ編集用のウィンドウを表示し、利用者100により変更されたパラメータ及びその値を取得し、変更されたパラメータを反映させた入力データ作成部用のテンプレートTiを実行する(S1104〜S1107)。
When changing the parameters of the template Ti for the input data creation unit, the
パラメータ編集用のウィンドウの一例を図3Fに示す。図3Fの301にはパラメータ名、302には値の候補、303には、302で選択された値が表示され、利用者100はこの値を採用してもよいし、この値を編集してもよい。302に表示される値の候補は、自動的に取得される。例えば、パラメータの種別が「T」である場合、アクセス可能なテーブル名一覧が302に表示される。 An example of a parameter editing window is shown in FIG. 3F. In FIG. 3F, 301 is a parameter name, 302 is a value candidate, 303 is the value selected in 302, and the user 100 may adopt this value or edit this value. Also good. The value candidates displayed in 302 are automatically acquired. For example, when the parameter type is “T”, an accessible table name list is displayed in 302.
入力データ作成部110で実行された入力データ作成処理が正常に終了した場合、その結果作成される分析対象データをDaとする。またログ記録部140が入力データ作成部110で実行した処理内容を記録し、ログDB141に登録する(S1108、S1109)。また、実行したテンプレートTiに関するログも併せて記録し、ログDB141に登録する(S1109)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1108、S220)。
When the input data creation process executed by the input
さらに、テンプレート処理部160が分析対象データDaに対してTdが実行可能かどうか判定し、判定結果からTdが実行可能な場合、テンプレート実行部150がTdを実行する(S1110、S1111、S1113)。S1110の内容については図12で詳述する。
Further, the
データ処理部120で実行されたデータ処理が正常に終了した場合、その結果作成される処理結果データをDrとする。またログ記録部140がデータ処理部120で実行した処理内容を記録し、ログDB141に登録する(S1114、S1115)。また、実行したテンプレートTdに関するログも併せて記録し、ログDB141に登録する(S1115)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。
When the data processing executed by the
S1111で実行不可能である場合、またはS1114で正常終了しなかった場合、テンプレート推奨部170が分析対象データDaに適用可能なデータ処理部用のテンプレートを抽出し、リストLdに登録し(S1112)、S601に進む。
If the execution is not possible in S1111, or if the process did not end normally in S1114, the
さらに、テンプレート処理部160が処理結果データDrに対してTvが実行可能かどうか判定し、判定結果からTvが実行可能な場合、テンプレート実行部150がTvを実行する(S1116、S1117、S1119)。S1116の内容については図13で詳述する。
Furthermore, the
データ可視化部130で実行された可視化処理が正常に終了した場合、可視化結果をディスプレイに表示する。またログ記録部140がデータ可視化部130で実行した処理内容を記録し、ログDB141に登録する(S1120、S1121)。また、実行したテンプレートTvに関するログも併せて記録し、ログDB141に登録する(S1121)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。
When the visualization process executed by the
S1117で実行不可能である場合、またはS1120で正常終了しなかった場合、テンプレート推奨部170が処理結果データDrに適用可能なデータ可視化部用のテンプレートを抽出し、リストLvに登録し(S1118)、S901に進む。
If execution is not possible in S1117, or if the process did not end normally in S1120, the
図12は、S1110の処理について詳述する図である。 FIG. 12 is a diagram detailing the processing of S1110.
まず、テンプレート処理部160が、テンプレートログからデータ処理部用のテンプレートTdを実行したログを全て抽出し、リストL2に登録する(S1201)。L2の要素数をN2、K2=0とする、分析対象データDaの列名リストをC1とする(S1202)。L2のK2番目のログから入力データ列名リストC2を取得し、C2⊆C1である場合、判定結果を「実行可能」とし、Tdに与えるパラメータをL2のK2番目のログのパラメータ値として、終了する。この処理をL2の要素全てに実行し(S1203〜S1207)、判定結果が「実行可能」にならない場合、判定結果を「実行不可能」として終了する(S1203、S1208)。
First, the
図13は、S1116の処理について詳述する図である。 FIG. 13 is a diagram illustrating in detail the processing of S1116.
まず、テンプレート処理部160が、テンプレートログからデータ可視化部用のテンプレートTvを実行したログを全て抽出し、リストL2に登録する(S1301)。L2の要素数をN2、K2=0とする、処理結果データDrの列名リストをC1とする(S1302)。L2のK2番目のログから入力データ列名リストC2を取得し、C2⊆C1である場合、判定結果を「実行可能」とし、Tvに与えるパラメータをL2のK2番目のログのパラメータ値として、終了する。この処理をL2の要素全てに実行し(S1303〜S1307)、判定結果が「実行可能」にならない場合、判定結果を「実行不可能」として終了する(S1303、S1308)。
First, the
図14A〜図4Fは、第一の実施例の前記作業4の具体例を示す図である。具体例としては、図4、図7、図10の作業1〜作業3の分析処理では、「列A」及び「列X」をキー列として入力データ作成処理を行ったが、図14A〜図4Fの例ではS1103〜S1105で入力データ作成部用のテンプレートTiのパラメータ3を「列C」に、パラメータ4を「列Z」にそれぞれ変更し、「列C」及び「列Z」をキー列として入力データ作成処理を行った場合に、テンプレートTd、Tvを用いてデータ処理、可視化処理を実行する場面を想定する。
FIGS. 14A to 4F are diagrams showing specific examples of the
図14Aは、S1103〜S1106で入力データ作成部用のテンプレートTiのパラメータ3を「列C」に、パラメータ4を「列Z」にそれぞれ変更し「指定された2つのテーブル(パラメータ1,2)を、指定した2つの列(パラメータ3、パラメータ4)をキー列として統合し、指定した値(パラメータ5)にキー列名を変更する」を行う。図14Bは「テーブル統合」のイメージを示す図である。
In FIG. 14A, in S1103 to S1106, the
図14Cは、選択テンプレートTdの例である。この例では選択テンプレートTdはテンプレートTiの実行の結果の分析対象データDaに適用可能であるため、パラメータの変更などは行わない。図14Dは「要素の出現数を数える」のイメージを示す図である。 FIG. 14C is an example of the selection template Td. In this example, since the selected template Td can be applied to the analysis target data Da as a result of executing the template Ti, no parameter change or the like is performed. FIG. 14D is a diagram illustrating an image of “counting the number of appearances of elements”.
図14Eは、テンプレートTvの例である。この例ではテンプレートTvはテンプレートTdの実行の結果の処理結果データDrに適用可能であるため、パラメータの変更などは行わない。図14Fは「棒グラフ」のイメージを示す図である。 FIG. 14E is an example of the template Tv. In this example, the template Tv can be applied to the processing result data Dr as a result of the execution of the template Td, so that no parameter change or the like is performed. FIG. 14F is a diagram illustrating an image of a “bar graph”.
以上説明した第一の実施例によれば、分析作業の入力データ作成処理の変更が可能となり、また入力データ作成処理の変更に伴う、データ処理、可視化処理の変更もテンプレートを用いて支援することが可能となるため、利用者100の分析作業の手間を削減することが可能となる。 According to the first embodiment described above, it is possible to change the input data creation process of the analysis work, and also support the change of the data process and the visualization process accompanying the change of the input data creation process using the template. Therefore, it is possible to reduce the labor of analysis work of the user 100.
以上説明した第一の実施例では、具体例としては、利用者100が作業1「DB104から必要なデータを抽出し、抽出したデータに入力データ作成処理を施すことにより分析対象データを作成」、作業2「分析対象データにデータ処理を施し処理結果データを作成」、作業3「処理結果データに可視化処理を施し可視化」、作業4「作業1からやり直す」という順番で分析作業を行う場面を想定したが、第二の実施例では、作業2、作業1、作業3、作業4の順番で分析作業を行う場面を想定したデータ分析支援システムの実施例である。
In the first embodiment described above, as a specific example, as a specific example, the user 100 performs
図15は、第二の実施例の、前記作業2の手順の一例を示すフローチャートである。
まず、テンプレート推奨部170が指定された基準に従い、テンプレートDB180からデータ処理部120で実行できるテンプレートを抽出し、リストLdに登録する(S1501)。ここで指定された基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などを意味する。FIG. 15 is a flowchart illustrating an example of the procedure of the
First, a template that can be executed by the
次に、抽出したリストLdをディスプレイ102に表示する(S1502)。ディスプレイ102への表示例を図3Aに示す。利用者100がテンプレートを選択した場合、テンプレート推奨部が選択されたデータ処理テンプレートTdの実行に必要な分析対象データを作成できる入力データ作成テンプレートを抽出し、リストLiに登録する(S1503,S1504)。
Next, the extracted list Ld is displayed on the display 102 (S1502). A display example on the
図16はS1504の処理を詳述する図である。
テンプレートログからTdを実行したログを全て抽出しL1とする。テンプレートログから処理種別が「入力データ作成用」であるログを全て抽出し、L2とする。空のリストをLiとする(S1601)。L1の要素数をN1、L2の要素数をN2、K1=0、K2=0とする(S1602)。L1のK1番目のログから入力データ列名リストC1を取得する(S1603)。L2のK2番目のログから出力データ列名リストC2取得し、C2⊆C1である場合、リストLiにL2のK2番目のテンプレートを追加する。この処理をL1及びL2の要素全てに実行する(S1603〜S1610)。FIG. 16 is a diagram detailing the processing of S1504.
All the logs that executed Td are extracted from the template log and set to L1. All the logs whose processing type is “for input data creation” are extracted from the template log and are set as L2. Let the empty list be Li (S1601). The number of elements in L1 is N1, the number of elements in L2 is N2, K1 = 0, and K2 = 0 (S1602). The input data string name list C1 is acquired from the K1th log of L1 (S1603). The output data string name list C2 is acquired from the K2 log of L2, and if it is C2⊆C1, the K2 template of L2 is added to the list Li. This process is executed for all elements of L1 and L2 (S1603 to S1610).
図17は、第二の実施例の前記作業1の手順の一例を示すフローチャートである。
まず、ディスプレイにS1504で作成した入力データ作成テンプレートリストLiを表示する(S1701)。ディスプレイ102への表示例は図3Aに示すものと同様である。利用者100がテンプレートを選択した場合、テンプレート実行部150が入力データ作成部用のテンプレートTiを実行する(S1702、S1703)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。FIG. 17 is a flowchart illustrating an example of the procedure of the
First, the input data creation template list Li created in S1504 is displayed on the display (S1701). A display example on the
利用者100がテンプレートを選択しなかった場合は、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施する(S1704)。S1703やS1704で指示され、入力データ作成部110で実行された入力データ作成処理が正常に終了した場合、その結果作成される分析対象データをDaとする。また、ログ記録部140が入力データ作成部110で実行した処理内容を記録し、ログDB141に登録する(S1705、S1706)。また、S1703でテンプレートを選択した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S1706)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1705、S220)。
When the user 100 does not select the template, the analysis work is not supported by the template, and the normal analysis work by the GUI operation or the like is performed (S1704). When the input data creation process instructed in S1703 or S1704 and executed by the input
次に、テンプレート実行部150がデータ処理部用のテンプレートTdを実行する(S1707)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。
Next, the
データ処理部120で実行された分析処理が正常に終了した場合、その結果作成される処理結果データをDrとする。また、ログ記録部140がデータ処理部120で実行した処理内容を記録し、ログDB141に登録する(S1708、S1709)。また、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S1709)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1708、S220)。
When the analysis process executed by the
さらに、テンプレートDB180からテンプレート推奨部170がデータ処理部の処理の結果出力される処理結果データDrに適用可能でありかつデータ可視化部130で実行可能なテンプレートを抽出し、リストLvに登録する(S1710)。S1710の内容についてはS607と同様である。
Further, templates that can be applied to the processing result data Dr output by the
図18は、第二の実施例の前記作業3の手順の一例を示すフローチャートである。
FIG. 18 is a flowchart showing an example of the procedure of the
まず、ディスプレイにS1710で作成した可視化テンプレートリストLv及びLvに含まれる各テンプレートの可視化例を表示する(S1801)。ディスプレイ102への表示例は図3A、3Eに示すものと同様である。利用者100がテンプレートを選択した場合、テンプレート実行部150がデータ可視化部用のテンプレートTvを実行する(S1802、S1803)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。
First, a visualization example of each template included in the visualization template lists Lv and Lv created in S1710 is displayed on the display (S1801). Display examples on the
利用者100がテンプレートを選択しなかった場合は、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施する(S1804)。S1803やS1804で指示され、データ可視化部130で実行された分析処理が正常に終了した場合、可視化結果をディスプレイ102に表示する。また、ログ記録部140がデータ可視化部130で実行した処理内容を記録し、ログDB141に登録する(S1805、S1806)。また、S1803でテンプレートを選択した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S1806)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1805、S220)。
When the user 100 does not select the template, the analysis work is not supported by the template, and the normal analysis work by the GUI operation or the like is performed (S1804). When the analysis process instructed in S1803 or S1804 and executed by the
さらに、可視化結果が利用者100の所望のものではなかった場合、前記作業1〜3の処理を改変して再実行する(S1807)。S1807の内容については図19で詳述する。
Furthermore, when the visualization result is not what the user 100 desires, the processes of the
図19、図20A、図20Bは、S1807の内容について詳述する図であり、第二の実施例の前記作業4の手順の一例を示すフローチャートである。
まず、データ処理部用のテンプレートTdを変更するかどうか、選択する(S1901)。データ処理部用のテンプレートTdを変更する場合、テンプレート推奨部170が指定された基準に従い、テンプレートDB180からデータ処理部120で実行できるテンプレートを抽出し、利用者100に提示し、利用者100の選択を受けて、S1903に進む(S1902)。ここで指定された基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などを意味する。19, 20A, and 20B are diagrams illustrating the details of S1807, and are a flowchart illustrating an example of the procedure of the
First, it is selected whether or not to change the template Td for the data processing unit (S1901). When changing the template Td for the data processing unit, the
次に、テンプレート処理部160が Tdからパラメータを抽出し、ディスプレイにパラメータ一覧を表示する(S1903)。利用者100によりパラメータが変更された場合、利用者100により変更されたパラメータ及びその値を取得し、S2001に進む(S1904、S1905)。パラメータ編集用のウィンドウの一例を図3Fに示す。図3Fの302に表示される値の候補は、選択されたパラメータに応じてTiの実行の結果得られるデータDaなどから自動的に入手する。
Next, the
次に、分析対象データDaの列名リストをC0とし、データ処理部用のテンプレートTdから種別が「N」であるパラメータ及び引数の値を取り出し列名リストC2に登録する(S2001、S2002)。C2⊆C0の場合、S1907に進む(S2003)。C2⊆C0ではない場合、Tiの行数をR0、K0=0とする(S2004)。 Next, the column name list of the analysis target data Da is set to C0, and the parameter and argument values of the type “N” are extracted from the template Td for the data processing unit and registered in the column name list C2 (S2001, S2002). In the case of C2 の C0, the process proceeds to S1907 (S2003). If it is not C20C0, the number of rows of Ti is set to R0 and K0 = 0 (S2004).
Tiの1〜K0行目までを実行し、その結果作成されるデータの列名リストをC0’とし、C2⊆C0 ’である場合、TiのK0行目までをTiとし、S1907に進む。この処理をK0=R0になるまで続け、K0=R0となったらS2010に進む(S2005〜S2009)。
次に、テンプレートログから処理種別が「入力データ作成用」であるログを全て抽出し、リストL1に登録する(S2010)。L1の要素数をN1、K1=0とする(S2011)。L1のK1番目のログから出力データ列名リストC1取得し、C2⊆C1の場合、L1のK1番目のテンプレートをTiとし、S1907に進む。この処理をK1=R1になるまで続け、K1=R1となったらS2017に進む(S2012〜S2016)。 Next, all the logs whose processing type is “for creating input data” are extracted from the template log and registered in the list L1 (S2010). The number of elements of L1 is set to N1 and K1 = 0 (S2011). The output data string name list C1 is obtained from the K1 log of L1, and in the case of C2⊆C1, the K1 template of L1 is set to Ti, and the process proceeds to S1907. This process is continued until K1 = R1, and when K1 = R1, the process proceeds to S2017 (S2012 to S2016).
次に、L1の要素数をN1、K1=0とする(S2017)。L1のK1番目のテンプレートをTK1とする。TK1の行数をR3、K3=0とする。TK1の1〜K3行目までを実行し、その結果作成されるデータの列名リストをC3’とする。C2⊆C3 ’の場合、TiのK3行目までをTiとし、S1907に進む。この処理をTK1の全行とL1の全要素に適用し、K1=N1となった場合、Tiを空にし、S1907に進む(S2018〜S2025)。
Next, the number of elements in L1 is set to N1 and K1 = 0 (S2017). The K1th template of L1 is set as TK1. The number of rows of TK1 is R3 and K3 = 0.
次に、Tiが空の場合、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施する(S1907、S1908)。Tiが空ではない場合、テンプレート実行部150が入力データ作成部用のテンプレートTiを実行する(S1907、S1909)。S1908やS1909で指示され、入力データ作成部110で実行された入力データ作成処理が正常に終了した場合、ログ記録部140が入力データ作成部110で実行した処理内容を記録し、ログDB141に登録する(S1910、S1911)。また、S1909でテンプレートTiを実行した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S1911)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1910、S220)。
Next, when Ti is empty, the analysis work is not supported by the template, and the normal analysis work by GUI operation or the like is performed (S1907, S1908). If Ti is not empty, the
テンプレート実行部150がTdを実行する(S1912)。データ処理部120で実行されたデータ処理が正常に終了した場合、その結果作成される処理結果データをDrとする。またログ記録部140がデータ処理部120で実行した処理内容を記録し、ログDB141に登録する(S1913、S1914)。また、実行したテンプレートTdに関するログも併せて記録し、ログDB141に登録する(S1914)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1913、S220)。
The
さらに、テンプレート処理部160が処理結果データDrに対してTvが実行可能かどうか判定し、判定結果からTvが実行可能な場合、テンプレート実行部150がTvを実行する(S1915、S1916、S1917)。S1915の内容については図13で既述のためここでは割愛する。
Further, the
データ可視化部130で実行された可視化処理が正常に終了した場合、可視化結果をディスプレイに表示する。またログ記録部140がデータ可視化部130で実行した処理内容を記録し、ログDB141に登録する(S1918、S1919)。また、実行したテンプレートTvに関するログも併せて記録し、ログDB141に登録する(S1919)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S1918、S220)。
When the visualization process executed by the
S1916で実行不可能である場合、テンプレート推奨部170が処理結果データDrに適用可能なデータ可視化部用のテンプレートを抽出し、リストLvに登録しS1801に進む(S1920)。
If the execution is not possible in S1916, the
図21A〜図21Fは、第二の実施例の前記作業4の具体例を示す図である。具体例としては、図4、図7、図10の作業1〜作業3の分析処理では、「要素数を数える」としてデータ処理を行ったが、図21の例ではS1902〜S1906でデータ処理部用のテンプレートTdを「指定した二列のクロス集計を行う」を選択し、パラメータ1を「KEY」、パラメータ2を「列A」とし、テンプレートTi、Tvを用いてデータ処理、可視化処理を実行する場面を想定する。
21A to 21F are diagrams illustrating specific examples of the
図21Aは、テンプレートTdの例である。この例でのTdのパラメータは2つあり、パラメータ1は、種別がN(列名)で値が「KEY」、パラメータ2は、種別がN(列名)で値が「列A」である。Tdで行う処理はパラメータ1、2を引数として、「指定した二列(パラメータ1、パラメータ2)のクロス集計を行う」を行う。図21Bは「クロス集計」のイメージを示す図である。
FIG. 21A is an example of the template Td. In this example, there are two parameters of Td, the
図21Cは、テンプレートTiの例である。テンプレートTdの変更では、テンプレートTiに影響が無いためパラメータの変更などは行わない。図21Dは「テーブル統合」のイメージを示す図である。 FIG. 21C is an example of the template Ti. The change of the template Td does not affect the template Ti, so the parameter is not changed. FIG. 21D is a diagram showing an image of “table integration”.
図21Eは、テンプレートTvの例である。この例では処理結果データDrの変更に伴い、適用可能なテンプレートTvを抽出する。図21Eは抽出されたTvの内容が「指定した2列を棒グラフで表示し、指定した列を横軸の項目名とする」の場合を示し、図21Fは「棒グラフ」のイメージを示す図である。 FIG. 21E is an example of the template Tv. In this example, an applicable template Tv is extracted along with the change of the processing result data Dr. FIG. 21E shows a case where the extracted Tv content is “display two specified columns as a bar graph and use the specified columns as item names on the horizontal axis”, and FIG. 21F shows an image of the “bar graph”. is there.
以上説明した第二の実施例によれば、分析作業のデータ処理の変更が可能となり、またデータ処理の変更に伴う、入力データ作成処理、可視化処理の変更もテンプレートを用いて支援することが可能となるため、利用者100の分析作業の手間を削減することが可能となる。 According to the second embodiment described above, it is possible to change the data processing of the analysis work, and it is possible to support the change of the input data creation processing and the visualization processing accompanying the change of the data processing using the template. Therefore, it is possible to reduce the labor of the analysis work of the user 100.
第一の実施例では、利用者100が作業1「DB104から必要なデータを抽出し、抽出したデータに入力データ作成処理を施すことにより分析対象データを作成」、作業2「分析対象データにデータ処理を施し処理結果データを作成」、作業3「処理結果データに可視化処理を施し可視化」、作業4「作業1からやり直す」を実行する際、作業3、作業2、作業1、作業4の順番で分析作業を行う場面を想定した実施例である。
In the first embodiment, the user 100 operates the
図22は、第三の実施例の前記作業3の手順の一例を示すフローチャートである。
まず、テンプレート推奨部170が指定された基準に従い、テンプレートDB180から入力データ作成部110で実行できるテンプレートを抽出し、リストLvに登録する(S2201)。ここで指定された基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などを意味する。FIG. 22 is a flowchart showing an example of the procedure of the
First, the
次に、抽出したリストLv及びLvに含まれる各テンプレートの可視化例をディスプレイ102に表示する(S2202)。ディスプレイ102への表示例を図3A、図3Eに示す。利用者100がテンプレートを選択した場合、テンプレート推奨部が選択された可視化テンプレートTvの実行に必要な処理結果データを作成できるデータ処理テンプレートを抽出しリストLdに登録する(S2203,S2204)。
Next, a visualization example of each template included in the extracted lists Lv and Lv is displayed on the display 102 (S2202). Examples of display on the
図23はS2204の処理を詳述する図である。
テンプレート処理部がテンプレートログからTvを実行したログを全て抽出しL1とする。テンプレートログから処理種別が「データ処理用」であるログを全て抽出し、L2とする。空のリストをLdとする(S2301)。L1の要素数をN1、L2の要素数をN2、K1=0、K2=0とする(S2302)。L1のK1番目のログから入力データ列名リストC1を取得する(S2303)。L2のK2番目のログから出力データ列名リストC2取得し、C2⊆C1である場合、リストLdにL2のK2番目のテンプレートを追加する。この処理をL1及びL2の要素全てに実行する(S2303〜S2310)。FIG. 23 is a diagram detailing the processing of S2204.
All the logs in which the template processing unit has executed Tv from the template log are extracted as L1. All logs whose processing type is “for data processing” are extracted from the template log and are set as L2. Let Ld be an empty list (S2301). The number of elements in L1 is N1, the number of elements in L2 is N2, K1 = 0, and K2 = 0 (S2302). The input data string name list C1 is acquired from the K1th log of L1 (S2303). The output data string name list C2 is acquired from the K2 log of L2, and if it is C2⊆C1, the K2 template of L2 is added to the list Ld. This process is executed for all elements of L1 and L2 (S2303 to S2310).
図24は、第三の実施例の前記作業2の手順の一例を示すフローチャートである。
まず、ディスプレイにS2204で作成したデータ処理テンプレートリストLdを表示する(S2401)。ディスプレイ102への表示例は図3Aに示すものと同様である。利用者100がテンプレートを選択した場合、テンプレート推奨部がテンプレート推奨部が選択されたデータ処理テンプレートTdの実行に必要な分析対象データを作成できる入力データ作成テンプレートを抽出し、リストLiに登録する(S2403)。S2403の内容についてはS1504と同様である。FIG. 24 is a flowchart showing an example of the procedure of the
First, the data processing template list Ld created in S2204 is displayed on the display (S2401). A display example on the
図25は、第三の実施例の前記作業1の手順の一例を示すフローチャートである。
まず、ディスプレイにS2403で作成した入力データ作成テンプレートリストLiを表示する(S2501)。ディスプレイ102への表示例は図3Aに示すものと同様である。利用者100がテンプレートを選択した場合、テンプレート実行部150が入力データ作成部用のテンプレートTiを実行する(S2502、S2503)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。FIG. 25 is a flowchart illustrating an example of the procedure of the
First, the input data creation template list Li created in S2403 is displayed on the display (S2501). A display example on the
入力データ作成部110で実行された入力データ作成処理が正常に終了した場合、その結果作成される分析対象データをDaとする。また、ログ記録部140が入力データ作成部110で実行した処理内容を記録し、ログDB141に登録する(S2504、S2505)。また、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S2505)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S2504、S220)。
When the input data creation process executed by the input
次に、テンプレート実行部150がデータ処理部用のテンプレートTdを実行する(S2506)。図3Bはテンプレートのデータ構造及びテンプレートの一例を示す図である。ここで示すテンプレートは、入力データ作成部用、データ処理部用、データ可視化部用で同じ構造を想定しているが、各部で実行可能であれば異なる構造であっても構わない。
Next, the
データ処理部120で実行された分析処理が正常に終了した場合、その結果作成される処理結果データをDrとする。また、ログ記録部140がデータ処理部120で実行した処理内容を記録し、ログDB141に登録する(S2507、S2508)。また、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S2508)。図3Cにログのデータ構造及びログの一例を示す。図3Dにテンプレートログのデータ構造及びテンプレートログの一例を示す。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S2507、S220)。
When the analysis process executed by the
次に、テンプレート実行部150がデータ可視化部用のテンプレートTvを実行する(S2509)。データ可視化部130で実行された分析処理が正常に終了した場合、可視化結果をディスプレイ102に表示する。また、ログ記録部140がデータ可視化部130で実行した処理内容を記録し、ログDB141に登録する(S2510、S2511)。また、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S2511)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S2510、S220)。
Next, the
さらに、可視化結果が利用者100の所望のものではなかった場合、前記作業1〜3の処理を改変して再実行する(S2512)。S2512の内容については図26A〜図26Dで詳述する。
Further, if the visualization result is not the one desired by the user 100, the
図26A〜図26Dは、S2512の内容について詳述する図であり、第三の実施例の前記作業4の手順の一例を示すフローチャートである。
まず、データ可視化部用のテンプレートTvを変更するかどうか、選択する(S2601)。データ可視化部用のテンプレートTvを変更する場合、テンプレート推奨部170が指定された基準に従い、テンプレートDB180からデータ可視化部130で実行できるテンプレートを抽出し、利用者100に提示し、利用者100の選択を受けて、S2603に進む(S2602)。ここで指定された基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などを意味する。FIGS. 26A to 26D are diagrams illustrating the details of S2512 and are flowcharts illustrating an example of the procedure of the
First, it is selected whether or not to change the template Tv for the data visualization unit (S2601). When changing the template Tv for the data visualization unit, the
次に、テンプレート処理部160が Tvからパラメータを抽出し、ディスプレイにパラメータ一覧を表示する(S2603)。利用者100によりパラメータが選択された場合、ディスプレイにパラメータ編集用のウィンドウを表示し、利用者100により変更されたパラメータ及びその値を取得し、S2701に進む(S2604、S2605)。パラメータ編集用のウィンドウの一例を図3Fに示す。図3Fの302に表示される値の候補は、選択されたパラメータに応じてTdの実行の結果得られるデータDrなどから自動的に入手する。
Next, the
次に、処理結果データDrの列名リストをC0とし、データ可視化部用のテンプレートTvから種別が「N」であるパラメータ及び引数の値を取り出し列名リストC2に登録する(S2701、S2702)。C2⊆C0の場合、S2607に進む(S2703)。C2⊆C0ではない場合、Tdの行数をR0、K0=0とする(S2704)。 Next, the column name list of the processing result data Dr is set to C0, and the parameter and argument values of the type “N” are extracted from the template Tv for the data visualization unit and registered in the column name list C2 (S2701 and S2702). In the case of C2 の C0, the process proceeds to S2607 (S2703). If it is not C2⊆C0, the number of rows of Td is set to R0 and K0 = 0 (S2704).
Tdの1〜K0行目までを実行し、その結果作成されるデータの列名リストをC0’とし、C2⊆C0 ’である場合、TdのK0行目までをTdとし、S2607に進む。この処理をK0=R0になるまで続け、K0=R0となったらS2710に進む(S2705〜S2709)。 The first to K0th rows of Td are executed, and the column name list of the data created as a result is C0 '. If C2⊆C0', Td is taken to the K0th row of Td, and the process proceeds to S2607. This process is continued until K0 = R0, and if K0 = R0, the process proceeds to S2710 (S2705 to S2709).
次に、テンプレートログから処理種別が「データ処理用」であるログを全て抽出し、リストL1に登録する(S2710)。L1の要素数をN1、K1=0とする(S2711)。L1のK1番目のログから出力データ列名リストC1取得し、C2⊆C1の場合、L1のK1番目のテンプレートをTiとし、S2607に進む。この処理をK1=R1になるまで続け、K1=R1となったらS2717に進む(S2712〜S2716)。 Next, all logs whose processing type is “for data processing” are extracted from the template log and registered in the list L1 (S2710). The number of elements of L1 is set to N1 and K1 = 0 (S2711). The output data string name list C1 is acquired from the K1 log of L1, and in the case of C2⊆C1, the K1 template of L1 is set to Ti, and the process proceeds to S2607. This process is continued until K1 = R1, and when K1 = R1, the process proceeds to S2717 (S2712 to S2716).
次に、L1の要素数をN1、K1=0とする(S2717)。L1のK1番目のテンプレートをTK1とする。TK1の行数をR3、K3=0とする。TK1の1〜K3行目までを実行し、その結果作成されるデータの列名リストをC3’とする。C2⊆C3 ’の場合、TiのK3行目までをTiとし、S2607に進む。この処理をTK1の全行とL1の全要素に適用し、K1=N1となった場合、Tdを空にし、S2607に進む(S2718〜S2725)。
Next, the number of elements of L1 is set to N1 and K1 = 0 (S2717). The K1th template of L1 is set as TK1. The number of rows of TK1 is R3 and K3 = 0.
次に、Tdが空の場合、ディスプレイに問題発生箇所を表示し、終了する(S2507、S220)。Tdが空ではない場合、S2001に進む(S2507)。
分析対象データDaの列名リストをC0とし、データ処理部用のテンプレートTdから種別が「N」であるパラメータ及び引数の値を取り出し列名リストC2に登録する(S2001、S2002)。C2⊆C0の場合、S2608に進む(S2003)。C2⊆C0ではない場合、Tiの行数をR0、K0=0とする(S2004)。Next, when Td is empty, the problem location is displayed on the display, and the process ends (S2507, S220). If Td is not empty, the process proceeds to S2001 (S2507).
The column name list of the analysis target data Da is set to C0, and the parameter and argument values of the type “N” are extracted from the template Td for the data processing unit and registered in the column name list C2 (S2001, S2002). In the case of C2 の C0, the process proceeds to S2608 (S2003). If it is not C20C0, the number of rows of Ti is set to R0 and K0 = 0 (S2004).
Tiの1〜K0行目までを実行し、その結果作成されるデータの列名リストをC0’とし、C2⊆C0 ’である場合、TiのK0行目までをTiとし、S1907に進む。この処理をK0=R0になるまで続け、K0=R0となったらS2010に進む(S2005〜S2009)。
次に、テンプレートログから処理種別が「入力データ作成用」であるログを全て抽出し、リストL1に登録する(S2010)。L1の要素数をN1、K1=0とする(S2011)。L1のK1番目のログから出力データ列名リストC1取得し、C2⊆C1の場合、L1のK1番目のテンプレートをTiとし、S2608に進む。この処理をK1=R1になるまで続け、K1=R1となったらS2017に進む(S2012〜S2016)。 Next, all the logs whose processing type is “for creating input data” are extracted from the template log and registered in the list L1 (S2010). The number of elements of L1 is set to N1 and K1 = 0 (S2011). The output data string name list C1 is acquired from the K1 log of L1, and in the case of C2⊆C1, the K1 template of L1 is set to Ti, and the process proceeds to S2608. This process is continued until K1 = R1, and when K1 = R1, the process proceeds to S2017 (S2012 to S2016).
次に、L1の要素数をN1、K1=0とする(S2017)。L1のK1番目のテンプレートをTK1とする。TK1の行数をR3、K3=0とする。TK1の1〜K3行目までを実行し、その結果作成されるデータの列名リストをC3’とする。C2⊆C3 ’の場合、TiのK3行目までをTiとし、S2608に進む。この処理をTK1の全行とL1の全要素に適用し、K1=N1となった場合、Tiを空にし、S2608に進む(S2018〜S2025)。
Next, the number of elements in L1 is set to N1 and K1 = 0 (S2017). The K1th template of L1 is set as TK1. The number of rows of TK1 is R3 and K3 = 0.
次に、Tiが空の場合、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施する(S2608、S2609)。Tiが空ではない場合、テンプレート実行部150が入力データ作成部用のテンプレートTiを実行する(S2608、S2610)。S2609やS2610で指示され、入力データ作成部110で実行された入力データ作成処理が正常に終了した場合、ログ記録部140が入力データ作成部110で実行した処理内容を記録し、ログDB141に登録する(S2611、S2612)。また、S2610でテンプレートTiを実行した場合、実行したテンプレートに関するログも併せて記録し、ログDB141に登録する(S2612)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S2611、S220)。
Next, when Ti is empty, the analysis work is not supported by the template, and the normal analysis work by GUI operation or the like is performed (S2608, S2609). If Ti is not empty, the
次に、テンプレート実行部150がTdを実行する(S2613)。データ処理部120で実行されたデータ処理が正常に終了した場合、ログ記録部140がデータ処理部120で実行した処理内容を記録し、ログDB141に登録する(S2614、S2615)。また、実行したテンプレートTdに関するログも併せて記録し、ログDB141に登録する(S2615)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S2614、S220)。
Next, the
次に、テンプレート実行部150がTvを実行する(S2616)。データ可視化部130で実行された可視化処理が正常に終了した場合、可視化結果をディスプレイに表示する。またログ記録部140がデータ可視化部130で実行した処理内容を記録し、ログDB141に登録する(S2617、S2618)。また、実行したテンプレートTvに関するログも併せて記録し、ログDB141に登録する(S2618)。正常に終了しなかった場合、ディスプレイに問題発生箇所を表示し、終了する(S2617、S220)。
Next, the
図27A、図27Bは、第三の実施例の前記作業4の具体例を示す図である。具体例としては、図4、図7、図10の作業1〜作業3の分析処理では、「指定した列を棒グラフで表示し、指定した列を横軸の項目名とする」として可視化を行ったが、図27A、図27Bの例ではS2602〜S2606でデータ可視化部用のテンプレートTvを「指定した列を円グラフで表示し、指定した列を項目名とする」を選択し、パラメータ1を「要素の出現数」、パラメータ2を「KEY」とし、テンプレートTi、Tdを用いて入力データ作成処理、データ処理を実行する場面を想定する。
27A and 27B are diagrams showing a specific example of the
図27Aは、テンプレートTvの例である。この例でのTvのパラメータは2つあり、パラメータ1は、種別がN(列名)で値が「要素の出現数」、パラメータ2は、種別がN(列名)で値が「KEY」である。Tvで行う処理はパラメータ1、2を引数として、「指定した列(パラメータ1)を円グラフで表示し、指定した列(パラメータ2)を項目名とする」である。図21Bは「円グラフ」のイメージを示す図である。テンプレートTi及びTdによる処理それぞれ図4、図7と同様のため、ここでは割愛する。
FIG. 27A is an example of the template Tv. In this example, there are two parameters of Tv,
第三の実施例によれば、分析作業の可視化処理の変更が可能となり、また可視化処理の変更に伴う、入力データ作成処理、データ処理の変更もテンプレートを用いて支援することが可能となるため、利用者100の分析作業の手間を削減することが可能となる。 According to the third embodiment, the analysis process visualization process can be changed, and the input data creation process and the data process change accompanying the change in the visualization process can be supported using the template. Thus, it is possible to reduce the labor of analysis of the user 100.
第四の実施例では、利用者100が作業1「DB104から必要なデータを抽出し、抽出したデータに入力データ作成処理を施すことにより分析対象データを作成」、作業2「分析対象データにデータ処理を施し処理結果データを作成」、作業3「処理結果データに可視化処理を施し可視化」、作業4「作業1からやり直す」を実行する際、作業3、作業1、作業2、作業4の順番で分析作業を行う場面を想定した実施例である。
In the fourth embodiment, the user 100 operates the
図28A、図28Bは第四の実施例の手順の一例を示すフローチャートである。
まず、テンプレート推奨部170が指定された基準に従い、テンプレートDB180からデータ可視化部130で実行できるテンプレートを抽出し、リストLvに登録する(S2801)。ここで指定された基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などを意味する。28A and 28B are flowcharts showing an example of the procedure of the fourth embodiment.
First, a template that can be executed by the
次に、抽出したリストLv及びLvに含まれる各テンプレートの可視化例をディスプレイ102に表示する(S2802)。ディスプレイ102への表示例を図3A、図3Eに示す。利用者100がテンプレートを選択した場合、テンプレート推奨部がテンプレートログから選択された可視化テンプレートTvの直前に実行した入力データ作成テンプレートを全て抽出し、リストLiに登録し、ディスプレイにLiを表示する(S2803〜S2805)。入力データ作成用テンプレートTiが選択された場合、Tiを実行する(S2806、S2807)。テンプレート推奨部170がテンプレートログからTiとTvの間にあるデータ処理テンプレートを全て抽出し、リストLdに登録し、ディスプレイにLdを表示する(S2808、S2809)。
Next, a visualization example of each template included in the extracted lists Lv and Lv is displayed on the display 102 (S2802). Examples of display on the
データ処理用テンプレートTdが選択された場合、Tdのパラメータを変更するかどうか選択する(S2810、S2811)。パラメータを変更する場合、テンプレート処理部170がTdからパラメータを抽出し、ディスプレイにパラメータ一覧を表示する(S2812)。パラメータが選択された場合、ディスプレイにパラメータ編集用のウィンドウを表示する(S2813、S2814)。パラメータ編集が終了した場合、Tdを実行する(S2815、S2816)。パラメータ変更をしない場合、Tdを実行する(S2816)。パラメータ編集用のウィンドウの例は図3Fに示す。図3Fの302に表示される値の候補は、選択されたパラメータに応じてTiの実行の結果得られるデータなどから自動的に入手する。
When the data processing template Td is selected, it is selected whether to change the Td parameter (S2810, S2811). When changing the parameter, the
次に、Tdのパラメータ変更や可視化のための要素の変更のために、Tvのパラメータを変更する。テンプレート処理部170がTvからパラメータを抽出し、ディスプレイにパラメータ一覧を表示する(S2817)。パラメータが選択された場合、ディスプレイにパラメータ編集用のウィンドウを表示する(S2818)。パラメータ編集用のウィンドウの例は図3Fに示す。図3Fの302に表示される値の候補は、選択されたパラメータに応じてTdの実行の結果得られるデータなどから自動的に入手する。
Next, the Tv parameter is changed in order to change the Td parameter or change the element for visualization. The
パラメータ編集が終了した場合Tvを実行し、可視化結果をディスプレイに表示し、ログ記録部140が入力データ作成部110、データ処理部120、データ可視化部130でそれぞれ実行した処理内容を記録し、ログDB141に登録する(S2820〜S2822)。
When the parameter editing is completed, Tv is executed, the visualization result is displayed on the display, and the
S2804〜S2806では、入力データ作成用テンプレートを選択しているが、図2のS205のように、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施しても構わない。 In S2804 to S2806, the input data creation template is selected. However, as in S205 of FIG. 2, the analysis work is not supported by the template, and a normal analysis work by a GUI operation or the like may be performed. .
S2806で入力データ作成用テンプレートTiを選択した後、Tiのパラメータ変更が可能であるが、その場合、それ以降の処理は実施例1と同様となる。 After selecting the input data creation template Ti in step S2806, the Ti parameter can be changed. In this case, the subsequent processing is the same as in the first embodiment.
S2807〜S2809では、データ処理用テンプレートを選択しているが、図6のS604のように、テンプレートによる分析作業の支援は行わず、GUI操作などによる通常の分析作業を実施しても構わない。 In S2807 to S2809, the data processing template is selected. However, as in S604 of FIG. 6, the analysis work is not supported by the template, and a normal analysis work by a GUI operation or the like may be performed.
第四の実施例によれば、分析作業の可視化結果から分析作業の開始が可能となる。つまり可視化結果を実現するために必要な入力データ作成処理、データ処理の構築をテンプレートを利用して支援することが可能となるため、利用者100の分析作業の手間を削減することが可能となる。 According to the fourth embodiment, the analysis work can be started from the visualization result of the analysis work. That is, input data creation processing necessary for realizing the visualization result and construction of the data processing can be supported using the template, so that it is possible to reduce the labor of analysis of the user 100. .
第五の実施例では、利用者100が作業1「DB104から必要なデータを抽出し、抽出したデータに入力データ作成処理を施すことにより分析対象データを作成」、作業2「分析対象データにデータ処理を施し処理結果データを作成」、作業3「処理結果データに可視化処理を施し可視化」、作業4「作業1からやり直す」という作業を、作業1、作業3、作業2、作業4の順番で分析作業を行う場面を想定した実施例である。
In the fifth embodiment, the user 100 operates the
図29は第五の実施例の手順の一例を示すフローチャートである。
まず、テンプレート推奨部170が指定された基準に従い、テンプレートDB180から入力データ作成部110で実行できるテンプレートを抽出し、リストLiに登録する。また、テンプレートログからLiに含まれる入力データ作成テンプレートの直後に実行されているデータ可視化テンプレートを全て抽出し、リストLeに登録する(S2901)。ここで指定された基準とは、最近利用者100が使ったテンプレート、全利用者がよく使うテンプレート、利用者100以外の特定の利用者がよく使うテンプレート、部署別によく使われるテンプレート、過去この時期によく使われたテンプレート、などを意味する。FIG. 29 is a flowchart showing an example of the procedure of the fifth embodiment.
First, a template that can be executed by the input
次に、抽出したリストLiをディスプレイ102に表示する。このとき、ユーザの操作によりLiからテンプレートが選択された場合、選択されたテンプレートに対応するデータ可視化テンプレートの可視化結果図をLeから抽出し、ディスプレイに表示する(S2902)。ディスプレイ102への表示例を図30に示す。3001はLiの一覧、3002には、3001に表示されているテンプレート名を選択すると過去にこの入力データ作成テンプレートを実行した直後に実行されたデータ可視化テンプレートの可視化結果が表示される。
Next, the extracted list Li is displayed on the
利用者100がテンプレートを選択した場合、選択されたテンプレートTiを実行する(S2903,S2904).テンプレート推奨部がテンプレートログから選択された入力データ作成テンプレートTiの直後に実行したデータ可視化テンプレートを全て抽出し、リストLvに登録し、ディスプレイにLvを表示する(S2905,S2906)。データ可視化テンプレートTvが選択された場合、テンプレート推奨部170がテンプレートログからTiとTvの間にあるデータ処理テンプレートを全て抽出し、リストLdに登録し、ディスプレイにLdを表示する(S2907、図28BのS2808,S2809)。
これ以降の処理手順は、図28Bで説明済みであるため、割愛する。When the user 100 selects a template, the selected template Ti is executed (S2903, S2904). The template recommendation unit extracts all the data visualization templates executed immediately after the input data creation template Ti selected from the template log, registers it in the list Lv, and displays Lv on the display (S2905, S2906). When the data visualization template Tv is selected, the
Since the subsequent processing procedures have already been described with reference to FIG. 28B, they are omitted.
第五の実施例によれば、分析作業を開始する際に、分析の対象としたいデータと、そのデータを用いて可視化可能な図を提示することにより、ユーザの分析結果イメージを実現する分析の実施が可能となる。つまり可視化結果を実現するために必要な入力データ作成処理、データ処理の構築をテンプレートを利用して支援することが可能となるため、利用者100の分析作業の手間を削減することが可能となる。 According to the fifth embodiment, when starting the analysis work, the analysis result that realizes the user's analysis result image by presenting the data to be analyzed and the figure that can be visualized using the data is presented. Implementation becomes possible. That is, input data creation processing necessary for realizing the visualization result and construction of the data processing can be supported using the template, so that it is possible to reduce the labor of analysis of the user 100. .
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明のより良い理解のために詳細に説明したのであり、必ずしも説明の全ての構成を備えるものに限定されものではない。 In addition, this invention is not limited to an above-described Example, Various modifications are included. For example, the above-described embodiments have been described in detail for better understanding of the present invention, and are not necessarily limited to those having all the configurations described.
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることが可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. Further, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment.
更に、上述した各構成、機能、処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現しても良いし、それらの一部又は全部を実現するプログラムを作成することによりソフトウェアで実現しても良いことは言うまでもない。 Further, each of the above-described configurations, functions, processing units, and the like may be realized by hardware, for example, by designing them with an integrated circuit, or a program that realizes part or all of them. It goes without saying that it may be realized by software by creating the above.
100 利用者
101 計算機
102 ディスプレイ
103 入力装置
104 データベース(DB)
110 入力データ作成部
120 データ処理部
130 データ可視化部
140 ログ記録部
141 ログDB
150 テンプレート実行部
160 テンプレート処理部
170 テンプレート推奨部
180 テンプレートDB
301 パラメータ名
302 値の候補
303 選択された値
310、3001 テンプレートリスト一覧
311、3002 可視化結果100
110 Input
150
301
Claims (13)
前記計算機は、
データに入力データ作成処理を施すことにより分析対象データを作成する入力データ作成機能と、データにデータ処理を施し処理結果データを作成するデータ処理機能と、データに可視化処理を施し可視化するデータ可視化機能を実行することによりデータ分析支援の作業を行い、
前記入力データ作成機能、前記データ処理機能、或いは前記データ可視化機能を実行するためのテンプレートを蓄積するテンプレートデータベースを利用し、
利用者に対して次作業についてのテンプレートを推奨するテンプレート推奨機能と、前記テンプレートを実行するテンプレート実行機能を実行し、
指定された基準に従い、前記テンプレート推奨機能を実行して得られたデータ可視化テンプレートリストから、選択された前記データ可視化テンプレートの直前に実行された入力データ作成テンプレートを抽出して得られた入力データ作成テンプレートリストから、選択された前記入力データ作成テンプレートを、前記テンプレート実行機能により実行する
ことを特徴とするデータ分析支援方法。 A data analysis support method using a computer,
The calculator is
An input data creation function that creates data to be analyzed by applying input data creation processing to data, a data processing function that performs data processing on data and creates processing result data, and a data visualization function that visualizes and visualizes data There line the work of data analysis support by the execution,
Using a template database that stores templates for executing the input data creation function, the data processing function, or the data visualization function,
Execute a template recommendation function that recommends a template for the next work for the user and a template execution function that executes the template,
Input data creation obtained by extracting the input data creation template executed immediately before the selected data visualization template from the data visualization template list obtained by executing the template recommendation function according to the specified standard A data analysis support method , wherein the input data creation template selected from a template list is executed by the template execution function .
前記計算機は、
データに入力データ作成処理を施すことにより分析対象データを作成する入力データ作成機能と、データにデータ処理を施し処理結果データを作成するデータ処理機能と、データに可視化処理を施し可視化するデータ可視化機能を実行することによりデータ分析支援の作業を行い、
前記入力データ作成機能、前記データ処理機能、或いは前記データ可視化機能を実行するためのテンプレートを蓄積するテンプレートデータベースを利用し、
利用者に対して次作業についてのテンプレートを推奨するテンプレート推奨機能と、前記テンプレートを実行するテンプレート実行機能を実行し、
指定された基準に従い、前記テンプレート推奨機能を実行して抽出した入力データ作成テンプレートリストから、選択された前記入力データ作成テンプレートの直後に実行されたデータ可視化テンプレートを抽出して得られたデータ可視化テンプレートリストから、選択された前記データ可視化テンプレートと、選択された前記入力データ作成テンプレートとの間で実行されたデータ処理テンプレートを抽出して得られるデータ処理テンプレートリストから、選択された前記データ処理テンプレートを、前記テンプレート実行機能により実行する
ことを特徴とするデータ分析支援方法。 A data analysis support method using a computer,
The calculator is
An input data creation function that creates data to be analyzed by applying input data creation processing to data, a data processing function that performs data processing on data and creates processing result data, and a data visualization function that visualizes and visualizes data Execute data analysis support work by executing
Using a template database that stores templates for executing the input data creation function, the data processing function, or the data visualization function,
Execute a template recommendation function that recommends a template for the next work for the user and a template execution function that executes the template ,
A data visualization template obtained by extracting a data visualization template executed immediately after the selected input data creation template from the input data creation template list extracted by executing the template recommendation function according to the specified standard The data processing template selected from the data processing template list obtained by extracting the data processing template executed between the selected data visualization template and the selected input data creation template from the list. The data analysis support method is executed by the template execution function .
前記計算機は
利用者が部分的に変更した前記テンプレートに対して、前記テンプレート推奨機能を用いて、前記テンプレートデータベースに蓄積されたテンプレートの中から、適用可能なテンプレートを推奨する
ことを特徴とするデータ分析支援方法。 The data analysis support method according to claim 1 or 2,
The computer recommends an applicable template from the templates stored in the template database using the template recommendation function for the template partially changed by a user. Analysis support method.
前記計算機は、
前記テンプレート実行機能により、前記入力データ作成機能、前記データ処理機能、前記データ可視化機能を用いて、前記テンプレートを実行する
ことを特徴とするデータ分析支援方法。 The data analysis support method according to claim 1 or 2,
The calculator is
The template execution function executes the template using the input data creation function, the data processing function, and the data visualization function.
前記計算機は、
指定された基準に従い、前記テンプレート推奨機能を実行して得られた入力データ作成テンプレートのリストから、選択された前記入力データ作成テンプレートを、前記テンプレート実行機能により実行する
ことを特徴とするデータ分析支援方法。 The data analysis support method according to claim 1 or 2,
The calculator is
Data analysis support characterized in that the input data creation template selected from the list of input data creation templates obtained by executing the template recommendation function is executed by the template execution function according to a specified standard. Method.
前記計算機は、
指定された基準に従い、前記テンプレート推奨機能を実行して得られたデータ処理テンプレートのリストから、選択された前記データ処理テンプレートの実行に必要な前記分析対象データを作成できる、前記入力データ作成テンプレートを抽出する
ことを特徴とするデータ分析支援方法。 The data analysis support method according to claim 1 or 2,
The calculator is
The input data creation template capable of creating the analysis target data necessary for the execution of the selected data processing template from the list of data processing templates obtained by executing the template recommendation function according to the specified standard. A data analysis support method characterized by extraction.
前記計算機は、
指定された基準に従い、前記テンプレート推奨機能を実行して得られたデータ可視化テンプレートリストから、選択された前記データ可視化テンプレートの実行に必要な前記処理結果データを作成できる、データ処理テンプレートを抽出する
ことを特徴とするデータ分析支援方法。 The data analysis support method according to claim 1 or 2,
The calculator is
Extracted according the specified criteria, the data visualization template list obtained by performing the template recommended features, that can create the process result data necessary for the execution of said selected data visualization template, the data processing template A data analysis support method characterized by
前記処理部は、The processor is
データに入力データ作成処理を施すことにより分析対象データを作成する入力データ作成機能と、データにデータ処理を施し処理結果データを作成するデータ処理機能と、データに可視化処理を施し可視化するデータ可視化機能を実行することによりデータ分析支援の作業を行い、An input data creation function that creates data to be analyzed by applying input data creation processing to data, a data processing function that performs data processing on data and creates processing result data, and a data visualization function that visualizes and visualizes data Execute data analysis support work by executing
前記記憶部は、 The storage unit
前記入力データ作成機能、前記データ処理機能、或いは前記データ可視化機能を実行するためのテンプレートを蓄積するテンプレートデータベースを記憶し、Storing a template database for storing templates for executing the input data creation function, the data processing function, or the data visualization function;
前記処理部は、 The processor is
利用者に対して次作業についてのテンプレートを推奨するテンプレート推奨機能と、前記テンプレートを実行するテンプレート実行機能を実行し、 Execute a template recommendation function that recommends a template for the next work for the user and a template execution function that executes the template,
前記処理部は、 The processor is
指定された基準に従い、前記テンプレート推奨機能を実行して得られたデータ可視化テンプレートリストから、選択された前記データ可視化テンプレートの直前に実行された入力データ作成テンプレートを抽出して得られた入力データ作成テンプレートリストから、選択された前記入力データ作成テンプレートを、前記テンプレート実行機能により実行するInput data creation obtained by extracting the input data creation template executed immediately before the selected data visualization template from the data visualization template list obtained by executing the template recommendation function according to the specified standard The input data creation template selected from the template list is executed by the template execution function.
ことを特徴とするデータ分析支援システム。A data analysis support system characterized by this.
前記処理部は、The processor is
データに入力データ作成処理を施すことにより分析対象データを作成する入力データ作成機能と、データにデータ処理を施し処理結果データを作成するデータ処理機能と、データに可視化処理を施し可視化するデータ可視化機能を実行することによりデータ分析支援の作業を行い、An input data creation function that creates data to be analyzed by applying input data creation processing to data, a data processing function that performs data processing on data and creates processing result data, and a data visualization function that visualizes and visualizes data Execute data analysis support work by executing
前記記憶部は、 The storage unit
前記入力データ作成機能、前記データ処理機能、或いは前記データ可視化機能を実行するためのテンプレートを蓄積するテンプレートデータベースを記憶し、Storing a template database for storing templates for executing the input data creation function, the data processing function, or the data visualization function;
前記処理部は、 The processor is
利用者に対して次作業についてのテンプレートを推奨するテンプレート推奨機能と、前記テンプレートを実行するテンプレート実行機能を実行し、Execute a template recommendation function that recommends a template for the next work for the user and a template execution function that executes the template,
前記処理部は、 The processor is
指定された基準に従い、前記テンプレート推奨機能を実行して抽出した入力データ作成テンプレートリストから、選択された前記入力データ作成テンプレートの直後に実行されたデータ可視化テンプレートを抽出して得られたデータ可視化テンプレートリストから、選択された前記データ可視化テンプレートと、選択された前記入力データ作成テンプレートとの間で実行されたデータ処理テンプレートを抽出して得られるデータ処理テンプレートリストから、選択された前記データ処理テンプレートを、前記テンプレート実行機能により実行するA data visualization template obtained by extracting a data visualization template executed immediately after the selected input data creation template from the input data creation template list extracted by executing the template recommendation function according to the specified standard The data processing template selected from the data processing template list obtained by extracting the data processing template executed between the selected data visualization template and the selected input data creation template from the list. Execute by the template execution function
ことを特徴とするデータ分析支援システム。A data analysis support system characterized by this.
前記処理部はThe processing unit
利用者が部分的に変更した前記テンプレートに対して、前記テンプレート推奨機能により、前記テンプレートデータベースに蓄積されたテンプレートの中から、適用可能なテンプレートを推奨するFor the template partially changed by the user, the template recommendation function recommends an applicable template from the templates stored in the template database.
ことを特徴とするデータ分析支援システム。A data analysis support system characterized by this.
前記処理部は、The processor is
前記入力データ作成機能、前記データ処理機能、前記データ可視化機能を用いて、選択された前記テンプレートを実行するExecuting the selected template using the input data creation function, the data processing function, and the data visualization function
ことを特徴とするデータ分析支援システム。A data analysis support system characterized by this.
表示部を更に備え、A display unit;
前記処理部は、The processor is
指定された基準に従い、前記テンプレート推奨機能を実行して得られた前記テンプレートを前記表示部に表示するThe template obtained by executing the template recommendation function is displayed on the display unit according to a specified standard.
ことを特徴とするデータ分析支援システム。A data analysis support system characterized by this.
前記処理部は、The processor is
前記表示部に表示された前記テンプレートから、選択された前記テンプレートを前記データ可視化機能で実行した得られた図例を前記表示部に同時に表示するAn example of a diagram obtained by executing the selected template from the template displayed on the display unit with the data visualization function is simultaneously displayed on the display unit.
ことを特徴とするデータ分析支援システム。A data analysis support system characterized by this.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/067887 WO2014010071A1 (en) | 2012-07-13 | 2012-07-13 | Data analysis assistance method and system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5918368B2 true JP5918368B2 (en) | 2016-05-18 |
JPWO2014010071A1 JPWO2014010071A1 (en) | 2016-06-20 |
Family
ID=49915573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014524563A Expired - Fee Related JP5918368B2 (en) | 2012-07-13 | 2012-07-13 | Data analysis support method and system |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5918368B2 (en) |
WO (1) | WO2014010071A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11886842B2 (en) | 2019-01-28 | 2024-01-30 | Mitsubishi Electric Corporation | Development assistance device, development assistance system, and development assistance method |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6419525B2 (en) * | 2014-10-15 | 2018-11-07 | 株式会社日立製作所 | Visualization means selection support system, visualization means selection support method, and visualization means selection support program |
WO2018011985A1 (en) * | 2016-07-15 | 2018-01-18 | 株式会社日立製作所 | Management system and platform construction supporting method |
JP6873868B2 (en) | 2017-08-23 | 2021-05-19 | 株式会社日立製作所 | Data analysis processing support device and data analysis processing support method |
JP6886111B2 (en) * | 2017-09-06 | 2021-06-16 | 富士通株式会社 | Data analysis support program, data analysis support device and data analysis support method |
US10705861B1 (en) | 2019-03-28 | 2020-07-07 | Tableau Software, LLC | Providing user interfaces based on data source semantics |
CA3143216A1 (en) | 2019-06-17 | 2020-12-24 | Tableau Software, LLC | Analyzing marks in visualizations based on dataset characteristics |
US11783266B2 (en) | 2019-09-18 | 2023-10-10 | Tableau Software, LLC | Surfacing visualization mirages |
US11397746B2 (en) * | 2020-07-30 | 2022-07-26 | Tableau Software, LLC | Interactive interface for data analysis and report generation |
US11550815B2 (en) | 2020-07-30 | 2023-01-10 | Tableau Software, LLC | Providing and surfacing metrics for visualizations |
US11579760B2 (en) | 2020-09-08 | 2023-02-14 | Tableau Software, LLC | Automatic data model generation |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058697A (en) * | 2001-08-02 | 2003-02-28 | Ncr Internatl Inc | Integrating method using computer of prediction model in analytic environment of business |
JP2003058562A (en) * | 2001-08-02 | 2003-02-28 | Ncr Internatl Inc | Method for dynamically constructing analysis by utilizing predictive model computer under analysis environment of interactive business |
JP2003150650A (en) * | 2001-11-13 | 2003-05-23 | Hitachi Ltd | Analysis work support device, and program for realizing analysis work support function |
JP2006344211A (en) * | 2005-05-26 | 2006-12-21 | Computer Patent Annuities Lp | Intellectual property analysis/report generation system and method |
JP2011258097A (en) * | 2010-06-11 | 2011-12-22 | Hitachi Ltd | Data processing apparatus |
JP2012073812A (en) * | 2010-09-29 | 2012-04-12 | Hitachi Ltd | Data analysis support system and method |
JP2012118968A (en) * | 2010-12-01 | 2012-06-21 | Internatl Business Mach Corp <Ibm> | Method, computer program, and device for providing support type business analysis for user |
-
2012
- 2012-07-13 WO PCT/JP2012/067887 patent/WO2014010071A1/en active Application Filing
- 2012-07-13 JP JP2014524563A patent/JP5918368B2/en not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058697A (en) * | 2001-08-02 | 2003-02-28 | Ncr Internatl Inc | Integrating method using computer of prediction model in analytic environment of business |
JP2003058562A (en) * | 2001-08-02 | 2003-02-28 | Ncr Internatl Inc | Method for dynamically constructing analysis by utilizing predictive model computer under analysis environment of interactive business |
JP2003150650A (en) * | 2001-11-13 | 2003-05-23 | Hitachi Ltd | Analysis work support device, and program for realizing analysis work support function |
JP2006344211A (en) * | 2005-05-26 | 2006-12-21 | Computer Patent Annuities Lp | Intellectual property analysis/report generation system and method |
JP2011258097A (en) * | 2010-06-11 | 2011-12-22 | Hitachi Ltd | Data processing apparatus |
JP2012073812A (en) * | 2010-09-29 | 2012-04-12 | Hitachi Ltd | Data analysis support system and method |
JP2012118968A (en) * | 2010-12-01 | 2012-06-21 | Internatl Business Mach Corp <Ibm> | Method, computer program, and device for providing support type business analysis for user |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11886842B2 (en) | 2019-01-28 | 2024-01-30 | Mitsubishi Electric Corporation | Development assistance device, development assistance system, and development assistance method |
Also Published As
Publication number | Publication date |
---|---|
WO2014010071A1 (en) | 2014-01-16 |
JPWO2014010071A1 (en) | 2016-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5918368B2 (en) | Data analysis support method and system | |
Taibi et al. | From monolithic systems to microservices: A decomposition framework based on process mining | |
Lizano-Mora et al. | The evolution of business process management: A bibliometric analysis | |
EP2573699B1 (en) | Identity information de-identification device | |
Van der Aalst et al. | Workflow Mining: Which processes can be rediscovered? | |
US10354002B2 (en) | Interaction relationship building and explorer for dashboard | |
US20140067836A1 (en) | Visualizing reporting data using system models | |
US20090006430A1 (en) | Scheduling application allowing freeform data entry | |
US20110137939A1 (en) | Data Supervision Based on the Configuration Rule of All Operational Indicators | |
Niedermann et al. | Deep business optimization: Making business process optimization theory work in practice | |
KR20140041452A (en) | Methods for electronic document searching and graphically representing electronic document searches | |
JP6326886B2 (en) | Software division program, software division apparatus, and software division method | |
Majiwala et al. | A bibliometric review of a decade’research on industry 4.0 & supply chain management | |
Mamaliga | Realizing a process cube allowing for the comparison of event data | |
Hsu et al. | Digital twins for industry 4.0 and beyond | |
Berschik et al. | MBSE WITHIN THE ENGINEERING DESIGN COMMUNITY–AN EXPLORATORY STUDY | |
JP4069701B2 (en) | Work support device | |
Omitola et al. | Capturing interactive data transformation operations using provenance workflows | |
JP5772607B2 (en) | Generating device, generating method, and generating program | |
Kourla et al. | REBD: A Conceptual Framework for Big Data Requirements Engineering | |
Madhikerrni et al. | Data discovery method for Extract-Transform-Load | |
Basole et al. | Understanding failure mode effect analysis data using interactive visual analytics | |
Rossi et al. | Towards Model-Driven Dashboard Generation for Systems-of-Systems | |
Ferdous et al. | Workflow provenance for big data: from modelling to reporting | |
Hostos et al. | A Literature Review of Evaluation Approaches for Cyber-Physical Production Systems. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160407 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5918368 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |