JP7131620B2 - データ解析支援装置、データ解析支援方法、及びプログラム - Google Patents

データ解析支援装置、データ解析支援方法、及びプログラム Download PDF

Info

Publication number
JP7131620B2
JP7131620B2 JP2020547502A JP2020547502A JP7131620B2 JP 7131620 B2 JP7131620 B2 JP 7131620B2 JP 2020547502 A JP2020547502 A JP 2020547502A JP 2020547502 A JP2020547502 A JP 2020547502A JP 7131620 B2 JP7131620 B2 JP 7131620B2
Authority
JP
Japan
Prior art keywords
feedback
visualization
combination
score
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020547502A
Other languages
English (en)
Other versions
JPWO2020059025A1 (ja
Inventor
将平 蛭田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020059025A1 publication Critical patent/JPWO2020059025A1/ja
Application granted granted Critical
Publication of JP7131620B2 publication Critical patent/JP7131620B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/168Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2393Updating materialised views
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、データの解析をするデータ解析支援装置、データ解析支援方法に関し、更には、これらを実現するためのプログラムに関する。
大規模データに対してデータ解析をするには、多大な労力と時間とを必要とする。そこで、大規模データの解析を支援するために、対象データを可視化する可視化手法が提案されている。ところが、近年においては、多種多様な可視化手法が提案されているため、解析者が、対象データの解析に適した可視化手法を選択するのに時間がかかる場合がある。
そこで、対象データの解析を行う解析者に対し、可視化手法を提示する技術が知られている。その技術によれば、対象データの解析に適した可視化手法を選択し、選択した可視化手法を解析者に提示する。
関連する技術として、特許文献1には、解析者に可視化手法を提示するデータ解析支援装置が開示されている。そのデータ解析支援装置によれば、まず、対象データから予め設定された情報(語彙)を抽出し、抽出した情報に対応する属性を特定する。次に、データ解析支援装置は、特定した属性の組み合わせを用いて、予め作成した、属性の組み合わせと可視化手法と有効度とが関連付けられたテーブルを参照し、有効度が高い可視化手法を候補として抽出する。そして、データ解析支援装置は、抽出した有効度が高い可視化手法を解析者に提示する。
特開2016-081213号公報
しかしながら、特許文献1に開示されているデータ解析支援装置では、属性の組み合わせと可視化手法とその有効度とが関連付けられたテーブルが予め作成されている。そのため、特許文献1に開示されているデータ解析支援装置を用いた場合には、属性の組み合わせに対して、いつも同じ可視化手法しか解析者に提示できない。また、特定した属性と一致する属性がテーブルにない場合、可視化手法を抽出することができない。
なお、対象データを解析する効率を向上させるには、上述したように対象データの解析に適した可視化手法を解析者に提示することも重要であるが、解析者に適した可視化手法を提示することも重要である。
本発明の目的の一例は、解析に適した可視化手法を提示することで、対象データを解析する効率を向上させるデータ解析支援装置、データ解析支援方法、及びプログラムを提供することにある。
上記目的を達成するため、本発明の一側面におけるデータ解析支援装置は、
対象データから抽出した特徴の組み合わせに対して、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、関係性スコア算出部と、
前記組み合わせに対応する前記関係性スコアを用いて、前記組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する、可視化スコア算出部と、
前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、表示情報生成部と、
を有することを特徴とする。
また、上記目的を達成するため、本発明の一側面におけるデータ解析支援方法は、
(a)対象データから抽出した特徴の組み合わせに対して、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、ステップと、
(b)前記組み合わせに対応する前記関係性スコアを用いて、前記組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する、ステップと、
(c)前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、ステップと、
を有することを特徴とする。
更に、上記目的を達成するため、本発明の一側面におけるプログラムは
コンピュータに、
(a)対象データから抽出した特徴の組み合わせに対して、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、ステップと、
(b)前記組み合わせに対応する前記関係性スコアを用いて、前記組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する、ステップと、
(c)前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、ステップと、
を実行させることを特徴とする。
以上のように本発明によれば、解析に適した可視化手法を提示することで、対象データを解析する効率を向上させることができる。
図1は、データ解析支援装置の一例を示す図である。 図2は、データ解析支援装置を有するシステムの一例を示す図である。 図3は、送信バイト数と受信バイト数との関係を示す散布図である。 図4は、フィードバック管理情報のデータ構造の一例を示す図である。 図5は、部分フィードバック管理情報のデータ構造の一例を示す図である。 図6は、可視化手法情報のデータ構造の一例を示す図である。 図7は、可視化手法に対応する表示の一例を示す図である。 図8は、可視化手法に対応する表示の一例を示す図である。 図9は、可視化手法に対応する表示を表示させる動作の一例を示す図である。 図10は、フィードバックスコアを算出する動作の一例を示す図である。 図11は、データ解析支援装置を実現するコンピュータの一例を示す図である。
(実施の形態)
以下、本発明の実施の形態について、図1から図11を参照しながら説明する。
[装置構成]
最初に、図1を用いて、本実施の形態におけるデータ解析支援装置1の構成について説明する。図1は、データ解析支援装置の一例を示す図である。
図1に示すデータ解析支援装置1は、解析に適した可視化手法を提示することで、解析する効率を向上させる装置である。また、図1に示すように、データ解析支援装置1は、関係性スコア算出部2と、可視化スコア算出部3と、表示情報生成部4とを有する。
このうち、関係性スコア算出部2は、対象データから抽出した特徴の組み合わせに対して、組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する。可視化スコア算出部3は、組み合わせに対応する関係性スコアを用いて、組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する。表示情報生成部4は、可視化スコアに応じて可視化手法を選択し、選択した可視化手法に対応する表示を、表示装置に出力するための可視化表示情報を生成する。
このように、本実施の形態においては、可視化スコアに応じて可視化手法を選択し、解析者に、解析に適した、選択した可視化手法を提示する。そのため、解析者が、解析に適した可視化手法を選択するために要する時間を短縮できる。
[システム構成]
続いて、図2を用いて、本実施の形態におけるデータ解析支援装置1の構成をより具体的に説明する。図2は、データ解析支援装置を有するシステムの一例を示す図である。
図2に示すように、本実施の形態におけるシステムは、データ解析支援装置1と、入力装置21と、表示装置22と、記憶装置23とを有する。入力装置21は、データ解析支援装置1に情報を入力する装置である。表示装置22は、データ解析支援装置1が出力する情報を出力する装置である。記憶装置23は、図2に示すようにデータ解析支援装置1の外部に設けてもよいし、データ解析支援装置1の内部に設けてもよい。
入力装置21は、例えば、キーボード、マウス、タッチパネルなどを用いて、解析者が入力した情報を、データ解析支援装置1に入力する装置である。
表示装置22は、例えば、液晶、有機EL(Electro Luminescence)、CRT(Cathode Ray Tube)を用いた画像表示装置である。更に、スピーカなどの音声出力装置などを有していてもよい。なお、表示装置22は、プリンタなどの印刷装置でもよい。また、図2の例では、入力装置21と表示装置22とを別々に示したが、入出力装置(図2の破線範囲)としてもよい。その場合、入出力装置は、例えば、モニタと接続されたパーソナルコンピュータ、サーバコンピュータなどの装置である。
次に、データ解析支援装置1は、関係性スコア算出部2、可視化スコア算出部3、表示情報生成部4に加えて、特徴抽出部24と、フィードバックスコア算出部25とを有する。
特徴抽出部24は、解析対象となる対象データから特徴の組み合わせを抽出する。具体的には、まず、特徴抽出部24は、解析対象となる対象データの傾向を把握するために、対象データが記憶されている記憶装置23から対象データを取得する。
続いて、特徴抽出部24は、取得した対象データから複数の特徴(特徴1、特徴2……特徴n:nは正の整数)を抽出する。通信トラフィックを解析する場合、特徴抽出部24は、例えば、対象データから、送信元IP(Internet Protocol)アドレス、送信先IPアドレスについて、日時(Time)、送信元ポート番号(SrcPort)、送信先ポート番号(DstPort)、送信バイト数(SrcByte)、受信バイト数(DstByte)、通信時間(Duration)、送信パケット数、受信パケット数などの特徴を表す情報を抽出する。
その後、特徴抽出部24は、抽出した特徴(特徴1、特徴2……特徴n)を組み合わせて組み合わせ情報を生成する。例えば、通信トラフィックの解析において、対象データから六種類の特徴を抽出し、そのうち二つの特徴を組み合わせて、組み合わせ情報を生成する場合、特徴抽出部24は、(特徴1,特徴2)、(特徴1,特徴3)、(特徴1,特徴4)、(特徴1,特徴5)、(特徴1,特徴6)、(特徴2,特徴3)、(特徴2,特徴4)、(特徴2,特徴5)、(特徴2,特徴6)、(特徴3,特徴4)、(特徴3,特徴5)、(特徴3,特徴6)、(特徴4,特徴5)、(特徴4,特徴6)、(特徴5,特徴6)を生成する。
関係性スコア算出部2は、組み合わせ情報に含まれる特徴に対応するデータ間の関係性を表す指標を算出する。具体的には、関係性スコア算出部2は、まず、組み合わせ情報を取得する。続いて、関係性スコア算出部2は、組み合わせ情報に含まれる特徴それぞれに対応するデータを用いて、可視化手法ごとに、特徴に対応するデータ間の関係性を表す関係性スコアSを算出する。可視化手法として、例えば、散布図、折れ線グラフ、棒グラフなどを用いた手法がある。また、可視化手法として尺度を変更する手法を含めてもよい。
関係性スコアSの算出について詳細に説明をする。可視化手法には、例えば、(A)散布図を用いて相関係数の絶対値を表示する手法、(B)散布図を用いてクラスタリング結果(定量評価尺度)を表示する手法、(C)折れ線グラフを用いてデータ分布を表示する手法、(D)棒グラフを用いてデータ評価を表示する手法などがある。
(A)の可視化手法における、関係性スコアSを算出する場合、例えば、式(1)を用いて関係性スコアSを算出する。
Figure 0007131620000001
式(1)において、図3の散布図を用いて、関係性スコアSを算出する場合について説明する。図3は、送信バイト数と受信バイト数との関係を示す散布図である。図3においては、通信トラフィックの解析における、送信バイト数(SrcByte)と、受信バイト数(DstByte)とをそれぞれ式(1)の特徴f,fとし、関係性スコアSを算出する。
なお、対象データdは、解析の対象となるデータを示す。また、特徴f,fは、特徴抽出部24が生成した組み合わせ情報を示す。例えば、対象データdが、(SrcIP, DstIP, SrcByte, DstByte, SrcPacket, DstPacket)により表されるデータである場合、特徴の組み合わせ情報が(SrcIP, DstIP)、(SrcIP, SrcByte)……となり、特徴f,fは、組み合わせ情報それぞれに対応する。
なお、図3に示す散布図31は、通信トラフィックの解析における、送信バイト数(SrcByte)と、受信バイト数(DstByte)とを、そのままプロットした図である。対して、図3に示す散布図32は、送信バイト数(SrcByte)と、受信バイト数(DstByte)とを、対数変換してプロットした図である。
また、散布図31、散布図32それぞれに対して、式(1)を用いて関係性スコアSを算出すると、散布図31の関係性スコアSより散布図32の関係性スコアSの方が大きい値となる。すなわち、図3から明らかなように、散布図32の可視化手法は、散布図31の可視化手法より、送信バイトと受信バイトとの関係性を解析者に分かり易く表示できる。言い換えれば、散布図31は、対象データが散在しているため相関傾向が分かり難いが、散布図32は、対象データが密集しているので相関傾向が分かり易く表示できている。
(B)の可視化手法における、関係性スコアSを算出する場合、例えば、PseudoFなどを用いて関係性スコアSを算出する。PseudoFにおいては、生成したクラスタ同士が疎であり、クラスタ内の要素が密であるほど、関係性スコアSが大きな値となる。式(2)を参照。
Figure 0007131620000002
(C)の可視化手法における、関係性スコアSを算出する場合、例えば、正規分布を用い、帰無仮説として正規分布に従うこととし、有意水準を5[%]に設定する。そして、検定手法として、例えば、コルモゴロフ・スミルノフ検定、シャピロ・ウィルク検定などを用いて、関係性スコアSを算出する。式(3)を参照。
Figure 0007131620000003
(D)の可視化手法における、関係性スコアSを算出する場合、例えば、式(4)を用いて関係性スコアSを算出する。
Figure 0007131620000004
なお、関係性スコアSは、算出した関係性スコアSが大きい値であるほど、対象データの解析に適した可視化手法となるようにする。
フィードバックスコア算出部25は、特徴の組み合わせに対応する可視化手法を用いて、解析者が対象データの解析を実施した際に、解析者が、その特徴の組み合わせに対応する可視化手法を利用した場合、解析者が感じた解析のし易さ(ユーザフレンドリー)、解析に適しているかなどを表す指標を算出する。
具体的には、フィードバックスコア算出部25は、まず、特徴の組み合わせに対する可視化手法に対する、解析者の評価度を表すフィードバック情報を、入力装置21から取得する。フィードバック情報は、例えば、入力装置21を用いて、解析者により入力される。又は、解析者が利用した可視化手法の利用履歴を入力してもよい。
また、評価度は、例えば、解析者が組み合わせに対する可視化手法に対して感じた印象などを、定量化した値である。また、評価度の入力方法は、例えば、解析に利用した可視化手法が、解析に適していたと判定した場合に、解析者に「良い」か否かを選択させ、選択した内容を評価度として入力する方法がある。又は、「良い」「悪い」などを二者択一させる方法でもよいし、又は、あらかじめ設定されている三つ以上の異なるランクから択一させる方法でもよい。又は、評価度を表す数値又は文字を入力する方法でもよいし、又は、それらを組み合わせた入力方法でもよい。
続いて、フィードバックスコア算出部25は、取得したフィードバック情報に基づいて、上述した指標となるフィードバックスコアを算出する。
具体的には、フィードバックスコア算出部25は、解析者ごとに、特徴の組み合わせと、可視化手法と、特徴の組み合わせと可視化手法との組み合わせに対するフィードバック情報を取得したフィードバック回数(第一のフィードバック回数)と、フィードバック情報が表す評価度とを関連付けたフィードバック管理情報(第一のフィードバック管理情報)を生成する。
図4は、フィードバック管理情報のデータ構造の一例を示す図である。フィードバック管理情報41は、例えば、記憶装置23、又はデータ解析支援装置1に設けられている記憶部、又はデータ解析支援装置1の外部に設けられている記憶部に記憶される。フィードバック管理情報41は、特徴の組み合わせを表す「特徴識別情報1」「特徴識別情報2」と、可視化手法を表す「可視化手法」と、フィードバック回数を表す「フィードバック回数」と、評価度を表す「有効性あり」「有効性なし」とが関連付けられた情報である。
また、「特徴識別情報1」「特徴識別情報2」には、特徴を表す情報「特徴1」「特徴2」「特徴3」などが記憶される。「可視化手法」には、可視化手法を表す情報「可視化1」「可視化2」「可視化3」などが記憶される。「フィードバック回数」には、フィードバックスコア算出部25がフィードバック情報を取得した回数(フィードバック回数)が記憶される。「有効性あり」には、例えば、上述した「良い」を有するフィードバック情報を取得した回数が記憶され、「有効性なし」には、例えば、上述した「悪い」を取得した回数が記憶される。
また、フィードバックスコア算出部25は、解析者ごとに、特徴と、可視化手法と、特徴と可視化手法との組み合わせに対する部分フィードバック情報を取得した部分フィードバック回数(第二のフィードバック回数)と、フィードバック情報が示す評価度と、評価度を用いて算出した評価情報とを関連付けた部分フィードバック管理情報(第二のフィードバック管理情報)を生成する。
図5は、部分フィードバック管理情報のデータ構造の一例を示す図である。部分フィードバック管理情報51は、例えば、記憶装置23、又はデータ解析支援装置1に設けられている記憶部、又はデータ解析支援装置1の外部に設けられている記憶部に記憶される。部分フィードバック管理情報51は、特徴を表す「特徴識別情報」と、可視化手法を表す「可視化手法」と、特徴ごとのフィードバック回数を表す「部分フィードバック回数」と、評価度を表す「有効性あり」「有効性なし」と、評価情報を表す「評価情報」とが関連付けられた情報である。
また、「特徴識別情報」には、特徴を表す「特徴1」「特徴2」などが記憶される。「可視化手法」には、可視化手法を表す情報「可視化手法1」「可視化手法2」「可視化手法3」などが記憶される。「部分フィードバック回数」には、特徴ごとにフィードバック情報を取得した回数が記憶される。「有効性あり」には、例えば、特徴に対して上述した「良い」を取得した回数が記憶され、「有効性なし」には、例えば、特徴に対して上述した「悪い」を取得した回数が記憶される。「評価情報」には、「有効性あり」から「有効性なし」を差し引いた値が記憶される。
続いて、フィードバックスコア算出部25は、評価情報と、部分フィードバック回数と、特徴を組み合わせた数(次元数)とを用いて、フィードバックスコアSを算出する。具体的には、フィードバックスコア算出部25は、式(5)を用いて、フィードバックスコアSを算出する。
Figure 0007131620000005
なお、部分フィードバック情報を求める関数freqは、例えば、図5に示した部分フィードバック管理情報51の場合、「特徴2」と「可視化1」との組み合わせであれば、freq(特徴2,可視化1)=4/10=0.4となる。
また、フィードバックスコアSは、算出したフィードバックスコアSが大きい値ほど、解析者に適した可視化手法となる。
可視化スコア算出部3は、解析者ごとに、特徴の組み合わせに対応する可視化手法について算出した関係性スコアSを用いて、組み合わせに対応する可視化手法の有効度を表す可視化スコアSを算出する。又は、可視化スコア算出部3は、解析者ごとに、特徴の組み合わせに対応する可視化手法について算出した、関係性スコアSとフィードバックスコアSとを用いて、可視化スコアSを算出する。
具体的には、可視化スコア算出部3は、式(6)を用いて可視化スコアSを算出する。
Figure 0007131620000006
例えば、関数Fは、組み合わせに対応する関係性スコアSだけを用いて可視化スコアSを算出してもよい。また、関数Fは、関係性スコアSとフィードバックスコアSとを加算する関数でもよい。更には、関数Fは、式(7)を用いて可視化スコアSを算出してもよい。
Figure 0007131620000007
重み付係数wは、関係性スコアSとフィードバックスコアSとのどちらを重視するかを決めるための係数である。重み付係数w(0<w<1)は、例えば、実験、シミュレーションなどにより求める。
続いて、可視化スコア算出部3は、特徴の組み合わせと、組み合わせに対応する可視化手法と、算出した可視化スコアSとを関連付けて、記憶装置23、又はデータ解析支援装置1に設けられている記憶部、又はデータ解析支援装置1の外部に設けられている記憶部に記憶される。図6は、可視化手法情報のデータ構造の一例を示す図である。可視化手法情報61は、例えば、記憶装置23、又はデータ解析支援装置1に設けられている記憶部、又はデータ解析支援装置1の外部に設けられている記憶部に記憶される。
可視化手法情報61は、特徴の組み合わせを表す「特徴識別情報1」「特徴識別情報2」と、可視化手法を表す「可視化手法」と、可視化スコアを表す「可視化スコア」とが関連付けられた情報である。
また、「特徴識別情報1」「特徴識別情報2」には、特徴を表す「特徴1」「特徴2」などが記憶される。「可視化手法」には、可視化手法を表す「可視化手法1」「可視化手法2」「可視化手法3」などが記憶される。「可視化スコア」には、可視化スコアを示す「SV1」から「SV9」などが記憶される。
表示情報生成部4は、特徴の組み合わせごとに、可視化スコアSに応じて可視化手法を選択し、選択した可視化手法に対応する表示を、表示装置22に表示するための可視化表示情報を生成する。また、表示情報生成部4は、可視化スコアSに応じて、可視化手法に対応する表示を変化させる。
具体的には、表示情報生成部4は、まず、特徴の組み合わせに対応する可視化手法に関連付けられた可視化スコアSを参照して、特徴の組み合わせごとに、可視化スコアSが最も大きい値を選択する。図6の例において、特徴の組み合わせを「特徴1」「特徴2」に適した可視化手法を選択する場合、可視化スコアが「SV1」>「SV2」>「SV3」の順に大きければ、表示情報生成部4は、特徴の組み合わせ「特徴1」「特徴2」を解析するのに適した可視化手法として、「SV1」に対応する「可視化手法1」を選択する。
又は、表示情報生成部4は、特徴の組み合わせに対応する可視化手法に関連付けられた可視化スコアSを参照して、特徴の組み合わせごとに、閾値以上の可視化スコアSを選択する。図6の例において、特徴の組み合わせとして「特徴1」「特徴2」に適した可視化手法を選択する場合、閾値以上の可視化スコアが「SV1」だけであれば、表示情報生成部4は、特徴の組み合わせ「特徴1」「特徴2」を解析するのに適した可視化手法として、「SV1」に対応する「可視化手法1」を選択する。なお、閾値は、実験、シミュレーションなどにより求める。
続いて、表示情報生成部4は、特徴の組み合わせごとに選択した可視化手法を、表示装置22に表示させるための可視化表示情報を生成する。具体的には、表示情報生成部4は、図7に示すような表示を、表示装置22に表示させる情報を生成する。
図7は、可視化手法に対応する表示の一例を示す図である。図7に示す表示は、例えば、通信トラフィックを解析する場合における、送信元IP(Internet Protocol)アドレス、送信先IPアドレスについて、日時(Time)、送信元ポート番号(SrcPort)、送信先ポート番号(DstPort)、送信バイト数(SrcByte)、受信バイト数(DstByte)、通信時間(Duration)、送信パケット数、受信パケット数などの特徴があると仮定した場合に、可視化手法に対応する表示「D12」から「D16」、「D21」「D23」から「D26」、「D31」「D32」から「D34から」「D36」、「D41」から「D43」「D45」「D46」、「D51」から「D54」「D56」、「D61」から「D65」などを表示した例である。
図7の例では、表示情報生成部4は、特徴の組み合わせごとに、可視化スコアSが最大値となる可視化手法に対応する表示を、表示装置22に表示させている。例えば、日時(Time)と送信元ポート番号(SrcPort)との組み合わせの場合、可視化スコアSが最大値となる可視化手法に対応する表示「D21」を、表示装置22に表示させる。
また、表示情報生成部4は、特徴の組み合わせごとに、可視化スコアSが閾値以上となる可視化手法に対応する一つ以上の表示を、表示装置22に表示してもよい。表示方法としては、例えば、可視化スコアSが大きいことが解析者に分かるように、閾値以上の可視化手法に対応する表示を、表示装置22に表示する。
解析者に分かるように表示する例として、可視化スコアSが最大値となる可視化手法の表示は、通常の表示とし、可視化スコアSが最大値より小さく、閾値以上となる可視化手法の表示は、半透明にするなど、通常の表示と異なる表示をする。
更に、表示情報生成部4は、表示装置22に表示させている、特徴の組み合わせに対応する可視化手法の表示が、入力装置21を用いて、解析者により選択されると、当該特徴の組み合わせに対応する他の可視化手法の表示を、表示装置22に表示させる情報を生成する。
図8は、可視化手法に対応する表示の一例を示す図である。図8に示すように、例えば、日時(Time)、送信先ポート番号(DstPort)の組み合わせに対応する可視化手法の表示「D31」(図8の81)が、解析者により入力装置21を用いて選択されると、表示「D31」に加えて、当該特徴の組み合わせに対応する他の可視化手法の表示「D312」「D313」が表示される。
なお、特徴の組み合わせに対応する可視化手法の表示は、可視化手法が、散布図、折れ線グラフ、棒グラフなどであることが分かるようなアイコンなどの表示である。また、実際に対象データに対して、可視化手法を用いて、解析をした結果をアイコンとして表示してもよい。
[装置動作]
次に、本発明の実施の形態におけるデータ解析支援装置1の動作について図9、図10を用いて説明する。図9は、可視化手法に対応する表示を表示させる動作の一例を示す図である。図10は、フィードバックスコアを算出する動作の一例を示す図である。以下の説明においては、適宜図2から図8を参酌する。また、本実施の形態では、データ解析支援装置1を動作させることによって、データ解析支援方法が実施される。よって、本実施の形態におけるデータ解析支援方法の説明は、以下のデータ解析支援装置1の動作説明に代える。
図9を用いて、可視化手法に対応する表示を、表示装置22に表示させる動作について説明する。図9に示すように、最初に、特徴抽出部24は、解析対象となる対象データから特徴の組み合わせを抽出する(ステップA1)。具体的には、ステップA1において、特徴抽出部24は、解析対象となる対象データの傾向を把握するために、対象データが記憶されている記憶装置23から対象データを取得する。続いて、ステップA1において、特徴抽出部24は、取得した対象データから複数の特徴を抽出する。
次に、関係性スコア算出部2は、対象データから抽出した特徴の組み合わせに対して、組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する(ステップA2)。具体的には、ステップA2において、関係性スコア算出部2は、組み合わせ情報を取得する。続いて、ステップA2において、関係性スコア算出部2は、組み合わせ情報に含まれる特徴に対応するデータ間の関係性を表す指標を算出する。すなわち、ステップA2において、関係性スコア算出部2は、組み合わせ情報に含まれる特徴それぞれに対応するデータを用いて、可視化手法ごとに、特徴に対応するデータ間の関係性を表す関係性スコアSを算出する。
例えば、関係性スコアSは、上述した(A)から(D)に示した可視化手法などについて、式(1)から(4)などを用いて算出する。
続いて、可視化スコア算出部3は、記憶装置23、又はデータ解析支援装置1に設けられている記憶部、又はデータ解析支援装置1の外部に設けられている記憶部に記憶されている、あらかじめ算出されたフィードバックスコアSを取得する(ステップA3)。
続いて、可視化スコア算出部3は、フィードバックスコアSがない場合、解析者ごとに、特徴の組み合わせに対応する可視化手法について算出した、関係性スコアSを用いて、組み合わせに対応する可視化手法の有効度を表す可視化スコアSを算出する(ステップA4)。また、フィードバックスコアSがある場合、可視化スコア算出部3は、解析者ごとに、特徴の組み合わせに対応する可視化手法について算出した、関係性スコアSと取得したフィードバックスコアSとを用いて、可視化スコアSを算出する(ステップA4)。具体的には、ステップA4において、可視化スコア算出部3は、式(6)又は式(7)などを用いて可視化スコアSを算出する。
続いて、表示情報生成部4は、特徴の組み合わせごとに、可視化スコアSに応じて可視化手法を選択し、選択した可視化手法に対応する表示を、表示装置22に表示するための可視化表示情報を生成する(ステップA5)。また、ステップA4において、表示情報生成部4は、可視化スコアSが変化した場合、可視化手法に対応する表示を変化させる。
具体的には、ステップA5において、表示情報生成部4は、図6に示すような、特徴の組み合わせに対応する可視化手法に関連付けられた可視化スコアSを参照して、特徴の組み合わせごとに、可視化スコアSが最も大きい値を選択する。又は、ステップA5において、表示情報生成部4は、図6に示すような、特徴の組み合わせに対応する可視化手法に関連付けられた可視化スコアSを参照して、特徴の組み合わせごとに、閾値以上の可視化スコアSを選択する。
続いて、ステップA5において、表示情報生成部4は、特徴の組み合わせごとに選択した可視化手法を、表示装置22に表示させるための可視化表示情報を生成する。具体的には、表示情報生成部4は、図7に示すような表示を、表示装置22に表示させる情報を生成する。
次に、図10を用いて、フィードバックスコアを算出する動作について説明する。解析者は、対象データについて可視化手法を用いて解析をした場合、解析者が利用した可視化手法が、解析者に適した可視化手法であったか否かをフィードバックする。
フィードバックスコア算出部25は、まず、特徴の組み合わせに対する可視化手法に対する、解析者の評価度を表すフィードバック情報を、入力装置21から取得する(ステップB1)。具体的には、フィードバック情報は、例えば、入力装置21を用いて、解析者により入力される。又は、解析者が利用した可視化手法の利用履歴を入力してもよい。
フィードバックスコア算出部25は、特徴の組み合わせに対する可視化手法について、解析者の評価度を表すフィードバック情報を取得したか否かを判定する(ステップB2)。フィードバック情報を取得した場合(ステップB2:Yes)、フィードバックスコア算出部25は、特徴の組み合わせに対する可視化手法について、取得したフィードバック情報に基づいてフィードバックスコアSを算出する(ステップB3)。なお、フィードバックスコア算出部25が、フィードバック情報を取得していないと判定した場合(ステップB2:No)、データ解析支援装置1はフィードバックスコアSを算出する処理を終了する。
具体的には、ステップB3において、フィードバックスコア算出部25は、解析者ごとに、特徴の組み合わせと、可視化手法と、特徴の組み合わせと可視化手法との組み合わせに対するフィードバック情報を取得したフィードバック回数と、フィードバック情報が表す評価度とを関連付けたフィードバック管理情報41を生成する。
また、ステップB3において、フィードバックスコア算出部25は、解析者ごとに、特徴と、可視化手法と、特徴と可視化手法との組み合わせに対する部分フィードバック情報を取得した部分フィードバック回数と、フィードバック情報が示す評価度と、評価度を用いて算出した評価情報とを関連付けた部分フィードバック管理情報51を生成する。
続いて、ステップB3において、フィードバックスコア算出部25は、評価情報と、部分フィードバック回数と、特徴を組み合わせた数を表す次元数とを用いて、フィードバックスコアSを算出する。例えば、フィードバックスコア算出部25は、式(5)を用いて、フィードバックスコアSを算出する。
[本実施の形態の効果]
以上のように本実施の形態によれば、可視化スコアに応じて可視化手法を選択し、解析者に、解析に適した選択した可視化手法を提示する。そのため、解析者が、解析に適した可視化手法を選択するために要する時間を短縮できる。
また、従来において、解析者は、対象データを解析するために可視化手法を用いるが、解析者が、対象データに適した可視化手法を選択するためには、選択するための時間を要する。ところが、対象データに適した可視化手法には、解析者に適した手法もあれば、不向きな手法もある。そうすると、単に対象データに適した可視化手法を選択するだけでは、解析の効率を向上させるには不十分である。
しかし、本実施の形態においては、解析データに適した可視化手法を提示できるのに加えて、解析者に適した可視化手法も提示できるので、従来と比べて、更に、解析に適した可視化手法を選択する時間を短縮できる。従って、解析に要する解析時間のうち、可視化手法を選択する時間を短縮できるので、解析時間を全体的に短縮できる。
更に、特徴同士に関係性がある可視化手法、又は解析者からよくフィードバックを受ける可視化手法のみに対応する表示を、表示装置22に表示するため、表示装置22の画面が小さくてもよい。
[プログラム]
本発明の実施の形態におけるプログラムは、コンピュータに、図9に示すステップA1からA5、図10に示すステップB1からB3を実行させるプログラムであればよい。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態におけるデータ解析支援装置とデータ解析支援方法とを実現することができる。この場合、コンピュータのプロセッサは、特徴抽出部24、関係性スコア算出部2、フィードバックスコア算出部25、可視化スコア算出部3、表示情報生成部4として機能し、処理を行なう。
また、本実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されてもよい。この場合は、例えば、各コンピュータが、それぞれ、特徴抽出部24、関係性スコア算出部2、フィードバックスコア算出部25、可視化スコア算出部3、表示情報生成部4のいずれかとして機能してもよい。
[物理構成]
ここで、実施の形態におけるプログラムを実行することによって、データ解析支援装置を実現するコンピュータについて図11を用いて説明する。図11は、本発明の実施の形態におけるデータ解析支援装置を実現するコンピュータの一例を示すブロック図である。
図11に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。なお、コンピュータ110は、CPU111に加えて、又はCPU111に代えて、GPU(Graphics Processing Unit)、又はFPGA(Field-Programmable Gate Array)を備えていてもよい。
CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記録媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであってもよい。
また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置があげられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
データリーダ/ライタ116は、CPU111と記録媒体120との間のデータ伝送を仲介し、記録媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記録媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
また、記録媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記録媒体、又はCD-ROM(Compact Disk Read Only Memory)などの光学記録媒体があげられる。
なお、本実施の形態におけるデータ解析支援装置1は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、データ解析支援装置1は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
[付記]
以上の実施の形態に関し、更に以下の付記を開示する。上述した実施の形態の一部又は全部は、以下に記載する(付記1)から(付記18)により表現することができるが、以下の記載に限定されるものではない。
(付記1)
対象データから抽出した特徴の組み合わせに対して、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、関係性スコア算出部と、
前記組み合わせに対応する前記関係性スコアを用いて、前記組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する、可視化スコア算出部と、
前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、表示情報生成部と、
を有することを特徴とするデータ解析支援装置。
(付記2)
付記1に記載のデータ解析支援装置であって、
前記組み合わせに対する前記可視化手法について、解析者の評価度を表すフィードバック情報を取得し、取得した前記フィードバック情報に基づいてフィードバックスコアを算出する、フィードバックスコア算出部を有し、
前記可視化スコア算出部は、前記組み合わせごとに、前記組み合わせに対応する前記関係性スコアと前記フィードバックスコアとを用いて、前記可視化スコアを算出する、
ことを特徴とするデータ解析支援装置。
(付記3)
付記2に記載のデータ解析支援装置であって、
前記フィードバックスコア算出部は、前記解析者ごとに、前記特徴の組み合わせと、前記可視化手法と、前記特徴の組み合わせと前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第一のフィードバック回数と、前記フィードバック情報が表す評価度とを関連付けた第一のフィードバック管理情報を生成する、
ことを特徴とするデータ解析支援装置。
(付記4)
付記3に記載のデータ解析支援装置であって、
前記フィードバックスコア算出部は、前記解析者ごとに、前記特徴と、前記可視化手法と、前記特徴と前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第二のフィードバック回数と、前記フィードバック情報が示す評価度と、前記評価度を用いて算出した評価情報とを関連付けた第二のフィードバック管理情報を生成する、
ことを特徴とするデータ解析支援装置。
(付記5)
付記4に記載のデータ解析支援装置であって、
前記フィードバックスコア算出部は、前記評価情報と、前記第二のフィードバック回数と、前記特徴の組み合わせにおける次元数とを用いて、前記フィードバックスコアを算出する、
ことを特徴とするデータ解析支援装置。
(付記6)
付記1から5のいずれか一つに記載のデータ解析支援装置であって、
前記表示情報生成部は、前記可視化スコアに応じて、前記可視化手法に対応する表示を変化させる、
ことを特徴とするデータ解析支援装置。
(付記7)
(a)対象データから抽出した特徴の組み合わせに対して、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、ステップと、
(b)前記組み合わせに対応する前記関係性スコアを用いて、前記組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する、ステップと、
(c)前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、ステップと、
を有することを特徴とするデータ解析支援方法。
(付記8)
付記7に記載のデータ解析支援方法であって、
(d)前記組み合わせに対する前記可視化手法について、解析者の評価度を表すフィードバック情報を取得し、取得した前記フィードバック情報に基づいてフィードバックスコアを算出する、ステップを有し、
前記(b)のステップにおいて、前記組み合わせごとに、前記組み合わせに対応する前記関係性スコアと前記フィードバックスコアとを用いて、前記可視化スコアを算出する、
ことを特徴とするデータ解析支援方法。
(付記9)
付記8に記載のデータ解析支援方法であって、
前記(d)のステップにおいて、前記解析者ごとに、前記特徴の組み合わせと、前記可視化手法と、前記特徴の組み合わせと前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第一のフィードバック回数と、前記フィードバック情報が表す評価度とを関連付けた第一のフィードバック管理情報を生成する、
ことを特徴とするデータ解析支援方法。
(付記10)
付記9に記載のデータ解析支援方法であって、
前記(d)のステップにおいて、前記解析者ごとに、前記特徴と、前記可視化手法と、前記特徴と前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第二のフィードバック回数と、前記フィードバック情報が示す評価度と、前記評価度を用いて算出した評価情報とを関連付けた第二のフィードバック管理情報を生成する、
ことを特徴とするデータ解析支援方法。
(付記11)
付記10に記載のデータ解析支援方法であって、
前記(d)のステップにおいて、前記評価情報と、前記第二のフィードバック回数と、前記特徴の組み合わせにおける次元数とを用いて、前記フィードバックスコアを算出する、
ことを特徴とするデータ解析支援方法。
(付記12)
付記7から11のいずれか一つに記載のデータ解析支援方法であって、
前記(c)のステップにおいて、前記可視化スコアに応じて、前記可視化手法に対応する表示を変化させる、
ことを特徴とするデータ解析支援方法。
(付記13)
コンピュータに、
(a)対象データから抽出した特徴の組み合わせに対して、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、ステップと、
(b)前記組み合わせに対応する前記関係性スコアを用いて、前記組み合わせに対応する可視化手法の有効度を表す可視化スコアを算出する、ステップと、
(c)前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、ステップと、
を実行させるプログラム。
(付記14)
付記13に記載のプログラムであって、
前記プログラムが、前記コンピュータに、
(d)前記組み合わせに対する前記可視化手法について、解析者の評価度を表すフィードバック情報を取得し、取得した前記フィードバック情報に基づいてフィードバックスコアを算出する、ステップを実行させる命令を更に含み、
前記(b)のステップにおいて、前記組み合わせごとに、前記組み合わせに対応する前記関係性スコアと前記フィードバックスコアとを用いて、前記可視化スコアを算出する、
ことを特徴とするプログラム
(付記15)
付記14に記載のプログラムであって、
前記(d)のステップにおいて、前記解析者ごとに、前記特徴の組み合わせと、前記可視化手法と、前記特徴の組み合わせと前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第一のフィードバック回数と、前記フィードバック情報が表す評価度とを関連付けた第一のフィードバック管理情報を生成する、
ことを特徴とするプログラム
(付記16)
付記15に記載のプログラムであって、
前記(d)のステップにおいて、前記解析者ごとに、前記特徴と、前記可視化手法と、前記特徴と前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第二のフィードバック回数と、前記フィードバック情報が示す評価度と、前記評価度を用いて算出した評価情報とを関連付けた第二のフィードバック管理情報を生成する、
ことを特徴とするプログラム
(付記17)
付記16に記載のプログラムであって、
前記(d)のステップにおいて、前記評価情報と、前記第二のフィードバック回数と、前記特徴の組み合わせにおける次元数とを用いて、前記フィードバックスコアを算出する、
ことを特徴とするプログラム
(付記18)
付記13から17のいずれか一つに記載のプログラムであって、
前記(c)のステップにおいて、前記可視化スコアに応じて、前記可視化手法に対応する表示を変化させる、
ことを特徴とするプログラム
以上、実施の形態を参照して本願発明を説明したが、本願発明は上記実施の形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
以上のように本発明によれば、可視化スコアに応じて可視化手法を選択し、解析者に、解析に適した選択した可視化手法を提示できるので、データ解析に適した可視化手法を選択するために要する時間を短縮できる。本発明は、データ解析が必要な分野において有用である。
1 データ解析支援装置
2 関係性スコア算出部
3 可視化スコア算出部
4 表示情報生成部
21 入力装置
22 表示装置
23 記憶装置
24 特徴抽出部
25 フィードバックスコア算出部
41 フィードバック管理情報
51 部分フィードバック管理情報
61 可視化手法情報
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス

Claims (15)

  1. 対象データから抽出した特徴の組み合わせに対し、可視化手法ごとに、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、関係性スコア算出手段と、
    前記組み合わせに対する前記可視化手法について、解析者の評価度を表すフィードバック情報を取得し、取得した前記フィードバック情報に基づいてフィードバックスコアを算出する、フィードバックスコア算出手段と、
    前記組み合わせに対応する可視化手法ごとに、前記関係性スコアと前記フィードバックスコアを用いて、前記組み合わせに対応する可視化手法ごとの有効度を表す可視化スコアを算出する、可視化スコア算出手段と、
    前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、表示情報生成手段と、
    を有することを特徴とするデータ解析支援装置。
  2. 請求項に記載のデータ解析支援装置であって、
    前記フィードバックスコア算出手段は、前記解析者ごとに、前記特徴のみ合わせと、前記可視化手法と、前記特徴の組み合わせと前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第一のフィードバック回数と、前記フィードバック情報が表す評価度とを関連付けた第一のフィードバック管理情報を生成する、
    ことを特徴とするデータ解析支援装置。
  3. 請求項に記載のデータ解析支援装置であって、
    前記フィードバックスコア算出手段は、前記解析者ごとに、前記特徴と、前記可視化手法と、前記特徴と前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第二のフィードバック回数と、前記フィードバック情報が示す評価度と、前記評価度を用いて算出した評価情報とを関連付けた第二のフィードバック管理情報を生成する、
    ことを特徴とするデータ解析支援装置。
  4. 請求項に記載のデータ解析支援装置であって、
    前記フィードバックスコア算出手段は、前記評価情報と、前記第二のフィードバック回数と、前記特徴組み合わせた数を表す次元数とを用いて、前記フィードバックスコアを算出する、
    ことを特徴とするデータ解析支援装置。
  5. 請求項1からのいずれか一つに記載のデータ解析支援装置であって、
    前記表示情報生成手段は、前記可視化スコアに応じて、前記可視化手法に対応する表示を変化させる、
    ことを特徴とするデータ解析支援装置。
  6. コンピュータが、
    (a)対象データから抽出した特徴の組み合わせに対し、可視化手法ごとに、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、ステップと、
    (d)前記組み合わせに対する前記可視化手法について、解析者の評価度を表すフィードバック情報を取得し、取得した前記フィードバック情報に基づいてフィードバックスコアを算出する、ステップと、
    (b)前記組み合わせに対応する可視化手法ごとに、前記関係性スコアと前記フィードバックスコアを用いて、前記組み合わせに対応する可視化手法ごとの有効度を表す可視化スコアを算出する、ステップと、
    (c)前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、ステップと、
    実行することを特徴とするデータ解析支援方法。
  7. 請求項に記載のデータ解析支援方法であって、
    前記(d)のステップにおいて、前記解析者ごとに、前記特徴の組み合わせと、前記可視化手法と、前記特徴の組み合わせと前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第一のフィードバック回数と、前記フィードバック情報が表す評価度とを関連付けた第一のフィードバック管理情報を生成する、
    ことを特徴とするデータ解析支援方法。
  8. 請求項に記載のデータ解析支援方法であって、
    前記(d)のステップにおいて、前記解析者ごとに、前記特徴と、前記可視化手法と、前記特徴と前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第二のフィードバック回数と、前記フィードバック情報が示す評価度と、前記評価度を用いて算出した評価情報とを関連付けた第二のフィードバック管理情報を生成する、
    ことを特徴とするデータ解析支援方法。
  9. 請求項に記載のデータ解析支援方法であって、
    前記(d)のステップにおいて、前記評価情報と、前記第二のフィードバック回数と、前記特徴組み合わせた数を表す次元数とを用いて、前記フィードバックスコアを算出する、
    ことを特徴とするデータ解析支援方法。
  10. 請求項からのいずれか一つに記載のデータ解析支援方法であって、
    前記(c)のステップにおいて、前記可視化スコアに応じて、前記可視化手法に対応する表示を変化させる、
    ことを特徴とするデータ解析支援方法。
  11. コンピュータに、
    (a)対象データから抽出した特徴の組み合わせに対し、可視化手法ごとに、前記組み合わせに含まれる特徴に対応するデータ間の関係性を表す関係性スコアを算出する、ステップと、
    (d)前記組み合わせに対する前記可視化手法について、解析者の評価度を表すフィードバック情報を取得し、取得した前記フィードバック情報に基づいてフィードバックスコアを算出する、ステップと、
    (b)前記組み合わせに対応する可視化手法ごとに、前記関係性スコアと前記フィードバックスコアを用いて、前記組み合わせに対応する可視化手法ごとの有効度を表す可視化スコアを算出する、ステップと、
    (c)前記可視化スコアに応じて前記可視化手法を選択し、選択した前記可視化手法に対応する表示を、表示装置に表示するための可視化表示情報を生成する、ステップと、
    を実行させるプログラム。
  12. 請求項11に記載のプログラムであって、
    前記(d)のステップにおいて、前記解析者ごとに、前記特徴の組み合わせと、前記可視化手法と、前記特徴の組み合わせと前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第一のフィードバック回数と、前記フィードバック情報が表す評価度とを関連付けた第一のフィードバック管理情報を生成する、
    ことを特徴とするプログラム。
  13. 請求項12に記載のプログラムであって、
    前記(d)のステップにおいて、前記解析者ごとに、前記特徴と、前記可視化手法と、前記特徴と前記可視化手法との組み合わせに対する前記フィードバック情報を取得した第二のフィードバック回数と、前記フィードバック情報が示す評価度と、前記評価度を用いて算出した評価情報とを関連付けた第二のフィードバック管理情報を生成する、
    ことを特徴とするプログラム。
  14. 請求項13に記載のプログラムであって、
    前記(d)のステップにおいて、前記評価情報と、前記第二のフィードバック回数と、前記特徴組み合わせた数を表す次元数とを用いて、前記フィードバックスコアを算出する、
    ことを特徴とするプログラム。
  15. 請求項11から14のいずれか一つに記載のプログラムであって、
    前記(c)のステップにおいて、前記可視化スコアに応じて、前記可視化手法に対応する表示を変化させる、
    ことを特徴とするプログラム。
JP2020547502A 2018-09-18 2018-09-18 データ解析支援装置、データ解析支援方法、及びプログラム Active JP7131620B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/034492 WO2020059025A1 (ja) 2018-09-18 2018-09-18 データ解析支援装置、データ解析支援方法、及びコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPWO2020059025A1 JPWO2020059025A1 (ja) 2021-08-30
JP7131620B2 true JP7131620B2 (ja) 2022-09-06

Family

ID=69887050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020547502A Active JP7131620B2 (ja) 2018-09-18 2018-09-18 データ解析支援装置、データ解析支援方法、及びプログラム

Country Status (3)

Country Link
US (1) US20220035798A1 (ja)
JP (1) JP7131620B2 (ja)
WO (1) WO2020059025A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117034125B (zh) * 2023-10-08 2024-01-16 江苏臻云技术有限公司 一种用于大数据融合的分类管理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021052A (ja) 2006-07-12 2008-01-31 National Institute Of Information & Communication Technology 情報抽出装置、情報抽出方法及び情報抽出プログラム
JP2013528860A (ja) 2010-04-30 2013-07-11 マイクロソフト コーポレーション 選択したデータの一時的な書式設定とグラフ化
JP2016081213A (ja) 2014-10-15 2016-05-16 株式会社日立製作所 可視化手段選択支援システム、可視化手段選択支援方法、および可視化手段選択支援プログラム
JP2017182474A (ja) 2016-03-30 2017-10-05 株式会社日本デジタル研究所 図表生成システム、図表処理システム、図表生成方法及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170124576A1 (en) * 2015-10-29 2017-05-04 Fuelcomm Inc. Systems, processes, and methods for estimating sales values

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008021052A (ja) 2006-07-12 2008-01-31 National Institute Of Information & Communication Technology 情報抽出装置、情報抽出方法及び情報抽出プログラム
JP2013528860A (ja) 2010-04-30 2013-07-11 マイクロソフト コーポレーション 選択したデータの一時的な書式設定とグラフ化
JP2016081213A (ja) 2014-10-15 2016-05-16 株式会社日立製作所 可視化手段選択支援システム、可視化手段選択支援方法、および可視化手段選択支援プログラム
JP2017182474A (ja) 2016-03-30 2017-10-05 株式会社日本デジタル研究所 図表生成システム、図表処理システム、図表生成方法及びプログラム

Also Published As

Publication number Publication date
US20220035798A1 (en) 2022-02-03
JPWO2020059025A1 (ja) 2021-08-30
WO2020059025A1 (ja) 2020-03-26

Similar Documents

Publication Publication Date Title
US20130050217A1 (en) Method and system for generating a columnar tree map
JP6888019B2 (ja) メモリアクセスコマンドの転送記述子
US20110109632A1 (en) Rule based visualization mechanism
JP2016062544A (ja) 情報処理装置、プログラム、及び情報処理方法
US8843432B2 (en) Data analyzing computer product, data analyzing method, and data analyzing apparatus
US20180253414A1 (en) Determining output presentation type
US9767465B2 (en) Methods and systems for facilitating caching of advertisements
CN107451272B (zh) 信息展示方法、介质、装置和计算设备
US20150026582A1 (en) Graphical representation of classification of workloads
US20180267964A1 (en) Causal analysis device, causal analysis method, and non-transitory computer readable storage medium
US10367839B2 (en) Graphical user interface programmed to display complex indicators based on structured threat expressions
KR20220064398A (ko) 강화 학습을 사용한 데이터 평가
US9619364B2 (en) Grouping and analysis of data access hazard reports
JP7131620B2 (ja) データ解析支援装置、データ解析支援方法、及びプログラム
JP6644767B2 (ja) 相互相関に基づかれる階層的なデータ分析に関する方法及び装置
JP5899364B1 (ja) プレイヤの意図を予測してレンダリングするためのリソース配分を決定するプログラム、電子装置、システム及び方法
CN109643209B (zh) 在客户端应用中动态地呈现大数据集
JP5576544B1 (ja) 情報処理装置
JP2017037494A (ja) テストケース生成方法、テストケース生成プログラムおよびテストケース生成装置
EP4145327A1 (en) System for estimating characteristic value of material
JP6852004B2 (ja) データ解析システム、データ解析方法、及びプログラム
US11177018B2 (en) Stable genes in comparative transcriptomics
JP6570501B2 (ja) 情報提供装置、情報提供方法、および情報提供プログラム
JP7497734B2 (ja) グラフ探索装置、グラフ探索方法、及びプログラム
US10304224B2 (en) Dynamic graphic entity determination

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220808

R151 Written notification of patent or utility model registration

Ref document number: 7131620

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151