JP7003504B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP7003504B2
JP7003504B2 JP2017170125A JP2017170125A JP7003504B2 JP 7003504 B2 JP7003504 B2 JP 7003504B2 JP 2017170125 A JP2017170125 A JP 2017170125A JP 2017170125 A JP2017170125 A JP 2017170125A JP 7003504 B2 JP7003504 B2 JP 7003504B2
Authority
JP
Japan
Prior art keywords
data set
attribute
visualization method
determination means
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017170125A
Other languages
English (en)
Other versions
JP2019046285A (ja
Inventor
川 王
健司 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2017170125A priority Critical patent/JP7003504B2/ja
Publication of JP2019046285A publication Critical patent/JP2019046285A/ja
Application granted granted Critical
Publication of JP7003504B2 publication Critical patent/JP7003504B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置及びプログラムに関する。
コンピュータに蓄積される情報は、膨大化、多様化、複雑化の一途をたどっているが、これらの情報を分析するために種々の可視化手法が提案されている。
例えば、特許文献1では、データベースのデータ要素が階層構造を構成する、階層型多変数データを可視化するための手法が提案されている。
特開2008-299363号公報 特開2014-056573号公報
本発明は、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化できるようにすることを目的とする。
本発明に係る情報処理装置は、入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、を有し、前記抽出手段は、データセットの各属性の属性値から得られる、前記各属性において異なる属性値を持つデータの数を前記データセットの特徴として抽出することを特徴とする。
本発明に係る情報処理装置は、入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、を有し、また、前記決定手段は、データセットに時間を示す属性が含まれている場合、他の属性の属性値に応じて可視化手法を決定することを特徴とする。
本発明に係る情報処理装置は、入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、を有し、前記決定手段は、データセットに予め定義された属性名の属性が含まれている場合、当該データセットの属性の組合せで示される次元数に応じて可視化手法を決定することを特徴とする。
本発明に係る情報処理装置は、入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、を有し、前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法に決定することを特徴とする。
本発明に係る情報処理装置は、入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、を有し、前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法か否かをユーザに指定させ、その指定された可視化手法に決定することを特徴とする。
本発明に係る情報処理装置は、入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、を有し、前記決定手段は、データセットの属性の一の属性値に対して異なる属性値が対応付けられている属性が含まれている場合、階層関係を示す可視化手法に決定することを特徴とする。
本発明に係るプログラムは、コンピュータを、入力されたデータセットから当該データセットの特徴を抽出する抽出手段、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、として機能させ、前記抽出手段は、データセットの各属性の属性値から得られる、前記各属性において異なる属性値を持つデータの数を前記データセットの特徴として抽出することを特徴とする
本発明に係るプログラムは、コンピュータを、入力されたデータセットから当該データセットの特徴を抽出する抽出手段、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、として機能させ、前記決定手段は、データセットに時間を示す属性が含まれている場合、他の属性の属性値に応じて可視化手法を決定することを特徴とする。
本発明に係るプログラムは、コンピュータを、入力されたデータセットから当該データセットの特徴を抽出する抽出手段、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、として機能させ、前記決定手段は、データセットに予め定義された属性名の属性が含まれている場合、当該データセットの属性の組合せで示される次元数に応じて可視化手法を決定することを特徴とする。
本発明に係るプログラムは、コンピュータを、入力されたデータセットから当該データセットの特徴を抽出する抽出手段、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、として機能させ、前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法に決定することを特徴とする。
本発明に係るプログラムは、コンピュータを、入力されたデータセットから当該データセットの特徴を抽出する抽出手段、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、として機能させ、前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法か否かをユーザに指定させ、その指定された可視化手法に決定することを特徴とする。
本発明に係るプログラムは、コンピュータを、入力されたデータセットから当該データセットの特徴を抽出する抽出手段、前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、として機能させ、前記決定手段は、データセットの属性の一の属性値に対して異なる属性値が対応付けられている属性が含まれている場合、階層関係を示す可視化手法に決定することを特徴とする。
請求項1,7に記載の発明によれば、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化することができる。特に、異なる属性値を持つデータの数に基づいてデータセットを表示する可視化手法を決定することができる。
請求項2,8に記載の発明によれば、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化することができる。特に、他の属性の属性値に応じてデータセットを表示する可視化手法を決定することができる。
請求項3,9に記載の発明によれば、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化することができる。特に、属性の次元数に応じてデータセットを表示する可視化手法を決定することができる。
請求項4,10に記載の発明によれば、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化することができる。特に、他の属性と同じ属性値が重複して設定されている属性を含むデータセットに対して、有向性を表現可能な可視化手法に決定することができる。
請求項5,11に記載の発明によれば、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化することができる。特に、ユーザ指定に応じた可視化手法に決定することができる。
請求項6,12に記載の発明によれば、可視化のパターンを一律に決める場合と比較して、データセットの特徴が把握しやすい可視化手法を用いて可視化することができる。特に、属性の一の属性値に対して異なる属性値が対応付けられている属性を含むデータセットに対して、階層関係を表現可能な可視化手法に決定することができる。
本発明に係る情報処理装置の一実施の形態を示したブロック構成図である。 本実施の形態における情報処理装置を形成するコンピュータのハードウェア構成図である。 本実施の形態におけるデータセットの可視化手法の決定処理を示すフローチャートである。 図3Aに続くフローチャートである。 本実施の形態において、可視化手法を利用してデータセットを表示する際の具体的な表示方法の一例を示す図である。 本実施の形態において、可視化手法の決定の対象となるデータセットの一例を示す図である。 本実施の形態において、可視化手法の決定の対象となるデータセットの他の例を示す図である。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
図1は、本発明に係る情報処理装置10の一実施の形態を示したブロック構成図である。また、図2は、本実施の形態における情報処理装置10を形成するコンピュータのハードウェア構成図である。本実施の形態において情報処理装置10を形成するコンピュータは、従前から存在する汎用的なハードウェア構成で実現できる。すなわち、情報処理装置10は、図2に示したようにCPU21、ROM22、RAM23、ハードディスクドライブ(HDD)24、入力手段として設けられたマウス25とキーボード26、及び表示装置として設けられたディスプレイ27をそれぞれ接続する入出力コントローラ28、通信手段として設けられたネットワークインターフェース(IF)29を内部バス30に接続して構成される。
図1に戻り、本実施の形態における情報処理装置10は、特徴抽出部11、可視化手法決定部12、表示制御部13、表示部14及び属性名情報記憶部15を有している。なお、本実施の形態の説明に用いない構成要素については、図から省略している。
特徴抽出部11は、入力されたデータセットから当該データセットの特徴を抽出する。可視化手法決定部12は、特徴抽出部11により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する。表示制御部13は、可視化手法決定部12により決定された可視化手法にて当該データセットの表示を制御する。表示部14は、表示制御部13による表示制御のもと、特徴抽出部11が受け付けたデータセットを、可視化手法決定部12により決定された可視化手法にてディスプレイ27に表示する。
ところで、「データセット」というのは、プログラムで処理されるデータのまとまりのことをいう。本実施の形態において、データセットに含まれるデータは、例えばCSV(Comma Separated Value)形式やJSON(Java Script(登録商標) Object Notation)形式で記述されていることを想定している。もちろん、このデータ形式に限定する必要はない。各データは、例えば、氏名、住所、座標値、宛先、送信元などの1又は複数のデータ項目を含んでいるが、本実施の形態では、各データに含まれる項目のことを「属性」、各属性に設定されているデータ値のことを「属性値」と称することにする。具体例を上げるとすると、「氏名」が属性、「山田太郎」が属性値に該当する。なお、データセットに含まれるデータは、全て同じデータ構成なので、データの属性とデータセットの属性は同義である。
属性名情報記憶部15には、予め定義されている特別な属性名が設定登録されている。特別な属性名は、単独若しくは他の属性名と組み合わせることで何らかの意味を持つ用語や記号等である。例えば、「経度」、「緯度」、「longitude」、「latitude」などは、地球上の位置を特定する情報として特別な意味を持つ属性名となり得る。また、「送信元」、「宛先」、「from」、「to」なども組み合わせて使用することで特別な意味を持つ属性名となり得る。
情報処理装置10における各構成要素11~14は、情報処理装置10を形成するコンピュータと、コンピュータに搭載されたCPU21で動作するプログラムとの協調動作により実現される。また、属性名情報記憶部15は、情報処理装置10に搭載されたHDD24にて実現される。あるいは、RAM23又は外部にある記憶手段をネットワーク経由で利用してもよい。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD-ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがプログラムを順次実行することで各種処理が実現される。
次に、本実施の形態における動作について説明する。
特徴抽出部11は、ユーザにより指定され入力されたデータセットを受け付けると、そのデータセットに含まれるデータの属性又は属性値を抽出し、更に解析することによってデータセットの特徴を抽出する。本実施の形態における特徴抽出部11は、データセットの特徴として、データセットに含まれている属性の種類を抽出する。本実施の形態では、氏名や住所などのテキスト、得点や座標値などの数値(数字)、日時などの時間という3種類の属性を抽出する。各属性の種類は、属性名から判断したり、属性値を分析したりすることで判別できる。また、特徴抽出部11は、各属性の属性名を抽出する。
更に、特徴抽出部11は、属性値を解析することで指標値をデータセットの特徴として求める。本実施の形態では、データセットに含まれているユニークな属性値(以下、「ユニーク値という」)の数(以下、「ユニーク値数という」)という指標値をデータセットの特徴として抽出する。例えば、0,1,2,3,2,1,2,0というデータ数が8のデータセットを受け付けた場合、このデータセットにおいては、異なる属性値(ユニーク値)は0,1,2,3、ユニーク値数は4となる。更に、特徴抽出部11は、ユニーク値の範囲という指標値をデータセットの特徴として抽出する。上記例示したデータセットにおけるユニーク値の範囲は、0を最小値、3を最大値とする0~3である。
ところで、例えば、テストにおける得点という属性の場合、属性値の取り得る範囲は、0点から100点であるが、実際の得点(属性値)は48点から92点というように取り得る範囲とずれる場合が少なくない。従って、属性によっては、ユニーク値の範囲(48~92)ではなくユニーク値の取り得る範囲(0~100)をデータセットの特徴として抽出するようにしてもよい。なお、ユニーク値の取り得る範囲は、属性名、属性値、あるいは他の属性との関係から推定してもよい。
本実施の形態における特徴抽出部11は、前述したようにテキスト、数値、時間という属性の種類、属性名、ユニーク値数及びユニーク値の範囲をデータセットの特徴として抽出する。もちろん、これらは、データセットの特徴の一例であって、これに限る必要はない。また、属性又は属性値の少なくとも一方に基づきデータセットの特徴を抽出するようにしてもよい。
次に、可視化手法決定部12におけるデータセットの可視化手法の決定処理について図3A及び図3Bに示すフローチャートを用いて説明する。
まず、可視化手法決定部12は、データセットに時間という属性(時間属性)が含まれている場合(ステップ101でY)、データセットが、テキスト又は数値の属性における同じ属性値に対応して所定数の範囲(例えば2個から50個)の時間属性の属性値が対応しているという条件に合致するかどうかを判定する(ステップ102)。詳細は後述するが、図5に例示したデータセットによると、活動ID“act-13125”というテキスト属性の属性値に対応して4個の時間属性が対応付けられている。従って、このデータセットは、前述した条件に合致している。
前述した条件に合致する場合(ステップ103でY)、続いて、可視化手法決定部12は、時間属性のユニーク値数を取得する(ステップ104)。時間属性のユニーク値数が所定の閾値以下、例えば20個以下の場合(ステップ105でY)、このデータセットの可視化手法としてサンキーダイアグラム(Sankey Diagram)を用いると決定する(ステップ106)。一方、時間属性のユニーク値数が所定の閾値を超える場合(ステップ105でN)、可視化手法決定部12は、Sankey Diagramでは、取り扱う属性の数を多すぎると判断し、このデータセットの可視化手法としてIcicle Treeを用いると決定する(ステップ107)。
なお、前述した条件に合致しない場合(ステップ103でN)、このデータセットのために最適な可視化手法は自動的に決定できないものとして処理を終了する。
データセットに時間属性が含まれていない場合(ステップ101でN)、可視化手法決定部12は、データセットに含まれている属性の属性名を、属性名情報記憶部15に設定登録されている特別な属性名と照合することで、データセットに含まれている属性の属性名に特別な属性名が含まれているかどうかを判定する。特別な属性名が含まれている場合(ステップ108でY)、続いて、可視化手法決定部12は、その特別な属性名が有向性のある属性名であるかどうかを判定する。有向性のある属性名というのは、例えば「source」と「target」、あるいは「from」と「to」というように、属性の関係上、有向性があると判断できる属性名の組のことを意味する。
データセットに含まれている特別な属性名が有向性のある属性名の場合(ステップ109でY)、更に、可視化手法決定部12は、属性値を解析することで属性値を非環式で表現できるかどうかを判定する。非環式で表現できると判断した場合(ステップ110でY)、可視化手法決定部12は、このデータセットの可視化手法として有向非巡回グラフ(Directed Acyclic Graph)を用いると決定する(ステップ111)。一方、そうでない場合(ステップ110でN)、可視化手法決定部12は、このデータセットの可視化手法としてTreeを用いると決定する(ステップ112)。
データセットに含まれている特別な属性名が有向性のある属性名でない場合(ステップ109でN)、続いて、可視化手法決定部12は、データセットに含まれている特別な属性名が経度及び緯度を示す属性名であるかどうかを判定する。経度及び緯度を示す属性名というのは、「longitude」若しくはこの省略形の「lon」、また「latitude」若しくはこの省略形の「lat」等のように経度又は緯度を表す名称のことをいう。データセットに含まれている特別な属性名が経緯度(経度と緯度)を表す属性名の場合(ステップ113でY)、可視化手法決定部12は、このデータセットの可視化手法としてGeospatialを用いると決定する(ステップ114)。
一方、データセットに含まれている特別な属性名が経緯度を表す属性名でない場合(ステップ113でN)、続いて、可視化手法決定部12は、その特別な属性名が、2次元データ又は3次元データを表す属性名かどうかを判定する。2次元データ又は3次元データを表す属性名というのは、例えば座標データを一般に表す「x」、「y」、「z」等の属性名である。データセットに「x」、「y」及び「z」という特別な属性名の組が含まれている場合は、データセットに3次元データが含まれていると判定する。また、データセットに「z」は存在しないものの「x」及び「y」という特別な属性名の組が含まれている場合は、データセットに2次元データが含まれていると判定する。
このように、 データセットに含まれている特別な属性名が2次元データ又は3次元データを表す属性名の場合(ステップ115でY)、可視化手法決定部12は、このデータセットの可視化手法としてGeometricを用いると決定する(ステップ116)。一方、データセットに含まれている特別な属性名が2次元データ又は3次元データを表す属性名でない場合(ステップ115でN)、このデータセットは、特別な属性名は含むものの、最適な可視化手法は自動的に決定できないものとして処理を終了する。
なお、本実施の形態では、データセットに特別な属性名が含まれている場合、その特別な属性名が有向性、経緯度、2,3次元データを表す属性名であるかどうかを、上記の順番で処理したが、この順番は一例であって上記処理順に限る必要はない。また、全ての判定処理(ステップ109,113,115)を実施して、複数に該当する場合は、該当した複数の可視化手法をユーザに提示するようにしてもよい。
次に、データセットに含まれている属性の属性名に特別な属性名が含まれていない場合(ステップ108でN)、可視化手法決定部12は、データセットに含まれる属性の中から2つの属性を選択し抽出する(ステップ117)。例えば、4個の属性で構成されるデータセットの場合、6通りの属性の組合せがある。前述したように、本実施の形態では、可視化手法が決定できない場合がある。従って、1組目の属性の組に対して以下に説明する処理を実施しても可視化手法が決定できない場合に2組目の属性の組に処理を移すようにしてもよい。あるいは、1組目の属性の組で可視化手法が決定できた場合は、そこで処理を終了し、その可視化手法をユーザに提示するようにしてもよい。あるいは、全ての属性の組合せに対して以下に説明する処理を実施して、複数の可視化手法をユーザに提示するようにしてもよい。ただ、いずれの組に対しても以下に説明する処理手順に従って同じ処理を行えばよいので、全ての組合せに対して繰り返し同じ説明はしない。
まず、選択した2つの属性が経緯度を表す属性名と判断した場合(ステップ118でY)、可視化手法決定部12は、ステップ113,114で説明したように、このデータセットの可視化手法としてGeospatialを用いると決定する(ステップ119)。
選択した2つの属性が経緯度を表す属性名でないと判断した場合(ステップ118でN)、可視化手法決定部12は、各属性のユニーク値数が所定の閾値以内、例えば2個から2000個と相対的に大きい範囲であって、かつユニーク値の範囲が重複(オーバーラップ)しているという条件に合致するかどうかを判定する(ステップ120)。ここで、「オーバーラップ」というのは、2つの属性のユニーク値の範囲が部分的に重なっている場合、又は包含関係にある場合をいう。この条件に合致する場合(ステップ121でY)、可視化手法決定部12は、有向性が表現可能な可視化手法とそうでない可視化手法の双方が選択できる可能性があるので、有向性を表現の有無をユーザに選択させるようにする。
すなわち、ステップ109においては、特別な属性名(“source”と“target”等)に該当することで、有向性があることを自動的に判断できた。ここでは、特別な属性名に該当しないため、データセットの属性名をユーザに提示することによって問い合わせ、有向性が表現可能な可視化手法を用いるかどうかをユーザに指定させる。そして、可視化手法決定部12は、ユーザによる指定内容を取得する(ステップ122)。なお、本実施の形態では、ユーザに指定させるようにしたが、ユーザに問い合わせることなく、いずれか一方をデフォルトとしてもよいし、双方の可視化手法を採用するものとしてユーザに提示するようにしてもよい。
ユーザが、有向性が表現可能な可視化手法を指定した場合(ステップ123でY)、更に、可視化手法決定部12は、属性値を解析することで属性値を非環式で表現できるかどうかを判定する。非環式で表現できると判断した場合(ステップ124でY)、可視化手法決定部12は、このデータセットの可視化手法として有向非巡回グラフ(Directed Acyclic Graph)を用いると決定する(ステップ125)。一方、そうでない場合(ステップ124でN)、可視化手法決定部12は、このデータセットの可視化手法としてTreeを用いると決定する(ステップ126)。
ユーザが、有向性が表現可能な可視化手法を指定しなかった場合(ステップ123でN)、可視化手法決定部12は、このデータセットの可視化手法としてUndirected Graphを用いると決定する(ステップ127)。
前述した条件に合致しない場合(ステップ121でN)、続いて、可視化手法決定部12は、選択した2つの属性の各ユニーク値が1対多の関係にあるかどうかを判定する(ステップ128)。1対多の関係というのは、例えば、住所の場合、港区は東京都であり、渋谷区や新宿区も東京都である。これに対し、東京都だからといって港区とは限らない。渋谷区かもしれないし新宿区かもしれない。このように、一の属性値(東京都)に対して異なる属性値(港区、渋谷区、新宿区)が対応付けられている場合を1対多の関係にあるという。
選択した2つの属性の属性値に1対多の関係がある場合(ステップ129でY)、可視化手法決定部12は、このデータセットの可視化手法としてTree-mapを用いると決定する(ステップ130)。その一方、1対多の関係にない場合(ステップ129でN)、可視化手法決定部12は、このデータセットのために最適な可視化手法は自動的に決定できないものとして処理を終了する。
以上説明したように、本実施の形態によれば、データセットの属性及び属性値から得られる指標値に基づき、データセットの可視化に用いる可視化手法を絞り込んでいき、最終的に、そのデータセットの特徴が把握しやすい可視化手法を決定する。
以上のようにして、入力されたデータセットを表示すべき可視化手法が決定されると、表示制御部13は、決定された可視化手法にてデータセットを表示部14に表示させる。なお、本実施の形態では、データセットの表示先を情報処理装置10のディスプレイ27としたが、これに限らず、例えばネットワーク接続された他の端末に表示させるよう制御してもよい。
図4には、本実施の形態において取り扱う可視化手法と各可視化手法においてどのように属性値を表示するかという表示方法の一例が示されている。
次に、前述した可視化手法の決定方法について、図5及び図6に示す具体例を用いて説明する。
図5に示したデータセットには、「活動時間」という時間属性が含まれている(ステップ101でY)。そして、「活動ID」における“act-13125”というテキスト属性の属性値に対応して4個の時間属性が対応付けられている。更に、「活動種類」における“A”及び“B”というテキスト属性の属性値に対応してそれぞれ4,2個の時間属性が対応付けられている(ステップ103でY)。そして、時間属性においては、図5では表し切れていないが、「活動時間」は、閾値を超える40個のユニーク値が存在するとしたならば(ステップ107でN)、このデータセットの特徴を把握するには、可視化手法としてIcicle Treeを用いるのが最適であると認定される(ステップ107)。
図6に示したデータセットには、時間属性が含まれていない(ステップ101でN)。また、「Name1」、「Name2」及び「Value」は、いずれも特別な属性名ではなく(ステップ108でN)、更に経緯度を示す属性名でもない(ステップ118でN)。ここで、属性「Name1」及び「Name2」に着目すると、それぞれのユニーク値数はそれぞれ10個程度であり、かつ属性値“Blacheville”が双方に含まれている。つまり、複数の属性「Name1」,「Name2」に“Blacheville”という属性値が重複して設定されている(ステップ121でY)。そして、有向性を表現することがユーザによって指定されると(ステップ123でY)、可視化手法決定部12は、属性値を解析することで属性値を非環式で表現できるかどうかを判定する。この例では、非環式で表現できるため(ステップ124でY)、このデータセットの特徴を把握するには、可視化手法として有向非巡回グラフ(Directed Acyclic Graph)を用いるのが最適であると認定される(ステップ125)。
本実施の形態によれば、以上のようにしてデータセットに関するデータ構造等を事前に把握していなくても、データセットから当該データセットの特徴を抽出し解析することによって、データセットそれぞれに最適な可視化手法を決定することが可能となる。
なお、可視化手法決定処理の過程において複数の可視化手法が決定された場合、一のデータセットを複数の可視化手法にて表示するようにしてもよいし、複数の可視化手法の中から表示に使用する可視化手法をユーザに選択させるようにしてもよい。
10 情報処理装置、11 特徴抽出部、12 可視化手法決定部、13 表示制御部、14 表示部、15 属性名情報記憶部、21 CPU、22 ROM、23 RAM、24 ハードディスクドライブ(HDD)、25 マウス、26 キーボード、27 ディスプレイ、28 入出力コントローラ、29 ネットワークインターフェース(IF)、30 内部バス。

Claims (12)

  1. 入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、
    を有し、
    前記抽出手段は、データセットの各属性の属性値から得られる、前記各属性において異なる属性値を持つデータの数を前記データセットの特徴として抽出することを特徴とする情報処理装置。
  2. 入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、
    を有し、
    前記決定手段は、データセットに時間を示す属性が含まれている場合、他の属性の属性値に応じて可視化手法を決定することを特徴とする情報処理装置。
  3. 入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、
    を有し、
    前記決定手段は、データセットに予め定義された属性名の属性が含まれている場合、当該データセットの属性の組合せで示される次元数に応じて可視化手法を決定することを特徴とする情報処理装置。
  4. 入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、
    を有し、
    前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法に決定することを特徴とする情報処理装置。
  5. 入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、
    を有し、
    前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法か否かをユーザに指定させ、その指定された可視化手法に決定することを特徴とする情報処理装置。
  6. 入力されたデータセットから当該データセットの特徴を抽出する抽出手段と、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段と、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段と、
    を有し、
    前記決定手段は、データセットの属性の一の属性値に対して異なる属性値が対応付けられている属性が含まれている場合、階層関係を示す可視化手法に決定することを特徴とする情報処理装置。
  7. コンピュータを、
    入力されたデータセットから当該データセットの特徴を抽出する抽出手段、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、
    として機能させ
    前記抽出手段は、データセットの各属性の属性値から得られる、前記各属性において異なる属性値を持つデータの数を前記データセットの特徴として抽出することを特徴とするプログラム。
  8. コンピュータを、
    入力されたデータセットから当該データセットの特徴を抽出する抽出手段、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、
    として機能させ、
    前記決定手段は、データセットに時間を示す属性が含まれている場合、他の属性の属性値に応じて可視化手法を決定することを特徴とするプログラム。
  9. コンピュータを、
    入力されたデータセットから当該データセットの特徴を抽出する抽出手段、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、
    として機能させ、
    前記決定手段は、データセットに予め定義された属性名の属性が含まれている場合、当該データセットの属性の組合せで示される次元数に応じて可視化手法を決定することを特徴とするプログラム。
  10. コンピュータを、
    入力されたデータセットから当該データセットの特徴を抽出する抽出手段、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、
    として機能させ、
    前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法に決定することを特徴とするプログラム。
  11. コンピュータを、
    入力されたデータセットから当該データセットの特徴を抽出する抽出手段、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、
    として機能させ、
    前記決定手段は、データセットに他の属性と同じ属性値が重複して設定されている属性が含まれている場合、有向性を表現可能な可視化手法か否かをユーザに指定させ、その指定された可視化手法に決定することを特徴とするプログラム。
  12. コンピュータを、
    入力されたデータセットから当該データセットの特徴を抽出する抽出手段、
    前記抽出手段により抽出されたデータセットの特徴を解析することによって当該データセットを表示する可視化手法を自動的に決定する決定手段、
    前記決定手段により決定された可視化手法にて当該データセットの表示を制御する表示制御手段、
    として機能させ、
    前記決定手段は、データセットの属性の一の属性値に対して異なる属性値が対応付けられている属性が含まれている場合、階層関係を示す可視化手法に決定することを特徴とするプログラム。
JP2017170125A 2017-09-05 2017-09-05 情報処理装置及びプログラム Active JP7003504B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017170125A JP7003504B2 (ja) 2017-09-05 2017-09-05 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017170125A JP7003504B2 (ja) 2017-09-05 2017-09-05 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2019046285A JP2019046285A (ja) 2019-03-22
JP7003504B2 true JP7003504B2 (ja) 2022-01-20

Family

ID=65812917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017170125A Active JP7003504B2 (ja) 2017-09-05 2017-09-05 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7003504B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015774B (zh) 2020-09-25 2023-08-29 北京百度网讯科技有限公司 一种图表推荐方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014109901A (ja) 2012-11-30 2014-06-12 Fujitsu Ltd 管理支援プログラム、管理支援装置および管理支援方法
JP2014130408A (ja) 2012-12-28 2014-07-10 Fujitsu Ltd グラフ作成プログラム、情報処理装置、およびグラフ作成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0493896A (ja) * 1990-08-03 1992-03-26 Shimizu Corp グラフ表示システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014109901A (ja) 2012-11-30 2014-06-12 Fujitsu Ltd 管理支援プログラム、管理支援装置および管理支援方法
JP2014130408A (ja) 2012-12-28 2014-07-10 Fujitsu Ltd グラフ作成プログラム、情報処理装置、およびグラフ作成方法

Also Published As

Publication number Publication date
JP2019046285A (ja) 2019-03-22

Similar Documents

Publication Publication Date Title
KR101773574B1 (ko) 데이터 테이블의 차트 시각화 방법
US11954536B2 (en) Data engine
CN113728308B (zh) 用于会话机器人的训练对话的可视化
JP2017004123A (ja) 判定装置、判定方法および判定プログラム
JP7003504B2 (ja) 情報処理装置及びプログラム
US9779151B2 (en) Visualizing relationships in data sets
AU2014202622A1 (en) Information processing apparatus and program
US10861201B2 (en) Information generation system, method, and computer program product
JP6851765B2 (ja) 情報生成システム、装置、方法、及びプログラム
US9864585B2 (en) Rapid prototyping of backend services
JP6780326B2 (ja) 情報処理装置及びプログラム
JP2014222806A5 (ja)
JP7440352B2 (ja) 教育コンテンツ作成システム及び方法
JP6601888B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN107239343A (zh) 数据处理方法及装置
JP6167942B2 (ja) デザイン編集装置及びプログラム
JP6996360B2 (ja) レポート作成プログラム、およびレポート作成方法
JP6844143B2 (ja) 情報処理装置
US20170206290A1 (en) Simulation system and simulation method
KR101234136B1 (ko) 플러터 비행시험 데이터를 분석하는 방법 및 그 방법에대한 프로그램을 저장한 기록매체
WO2021210414A1 (ja) 可視化方法、これに用いるプログラム、および、可視化装置、並びに、これを備える判別装置
JP6483580B2 (ja) 画像処理装置,画像処理方法,画像処理プログラムおよびそのプログラムを格納した記録媒体
JP6609190B2 (ja) 情報処理装置、及びプログラム
EP4290426A1 (en) Accuracy calculation program, accuracy calculation method, and information processing device
KR102658967B1 (ko) 인공지능 기반 솔루션을 제공하기 위한 방법, 전자 장치, 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200717

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211213

R150 Certificate of patent or registration of utility model

Ref document number: 7003504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150