JP2016021144A - グラフ表示方法、グラフ表示装置およびグラフ表示プログラム - Google Patents

グラフ表示方法、グラフ表示装置およびグラフ表示プログラム Download PDF

Info

Publication number
JP2016021144A
JP2016021144A JP2014144494A JP2014144494A JP2016021144A JP 2016021144 A JP2016021144 A JP 2016021144A JP 2014144494 A JP2014144494 A JP 2014144494A JP 2014144494 A JP2014144494 A JP 2014144494A JP 2016021144 A JP2016021144 A JP 2016021144A
Authority
JP
Japan
Prior art keywords
graph
bar
group
display
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014144494A
Other languages
English (en)
Inventor
洋之 松下
Hiroyuki Matsushita
洋之 松下
克利 城所
Katsutoshi Kidokoro
克利 城所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014144494A priority Critical patent/JP2016021144A/ja
Publication of JP2016021144A publication Critical patent/JP2016021144A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】グラフを厳選表示する。
【解決手段】抽出部111は、データ領域121に格納されている各データに基づくグラフを生成する。抽出部111は、生成した各グラフの特徴を格納したグラフ情報テーブルを生成する。抽出部111は、グラフ情報テーブルを基にしてbar変動係数Cbとdif変動係数Cdとを求める。抽出部111は、グラフの1つのバーに90%以上の標本が集まっているグラフに所定のラベルを付す。抽出部111は、bar変動係数Cbとdif変動係数Cdに応じたラベルを各グラフに付す。表示部112は、指定されたラベルが付されたグラフを出力部130の画面に表示する表示データ領域122を生成する。
【選択図】図1

Description

本発明は、グラフ表示方法、グラフ表示装置およびグラフ表示プログラムに関する。
大量のデータを分析する技術がある。かかる技術では、例えば、データの分析に用いる項目をx軸およびy軸に設定し、データの各レコードをプロットしたグラフを生成して表示する。
特開平09−69107号公報
しかしながら、上述の従来技術では、データ分析に用いるグラフを厳選表示できないという問題がある。
すなわち、データ分析では、分析対象のデータの全項目についてグラフを生成すると、データ分析に有意なグラフが得られにくい。そこで、例えば、データの各項目の基本統計量、相関係数、グラフ等を参考にしてデータの項目を取捨選択することがある。しかし、可視的イメージであるグラフに基づいてデータの項目を取捨選択し、データ分析に有意なグラフを厳選表示することは困難である。
また、データの可視化を目的として、データの全項目についてグラフを生成すると、データ分析に有意でないグラフも大量に生成されてしまい、データ分析に有意なグラフが厳選表示できないという問題がある。
一つの側面では、グラフを厳選表示できるグラフ表示方法、グラフ表示装置およびグラフ表示プログラムを提供することを目的とする。
第1の案では、データ解析結果のグラフ表示方法は、コンピュータを用いてデータ解析して得られる第1のグラフ群のうち、形状に関する基準に基づいて第2のグラフ群を抽出する。グラフ表示方法は、第1のグラフ群のうち抽出された第2のグラフ群のみを表示部に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に表示部に表示する。
本発明の一実施態様によれば、グラフを厳選表示できるという効果を奏する。
図1は、実施例1のシステムの全体構成の例を示す図である。 図2は、グラフ情報テーブルの第1の例を示す図である。 図3は、変動係数を説明するための図である。 図4は、ラベル一覧表の一例を示す図である。 図5は、第一のラベル付け処理を説明するための図である。 図6は、第二のラベル付け処理を説明するための第1の図である。 図7は、第二のラベル付け処理を説明するための第2の図である。 図8Aは、第二のラベル付け処理を説明するための第3の図である。 図8Bは、第二のラベル付け処理を説明するための第4の図である。 図9は、表示部への第1の表示例を示す図である。 図10は、表示部への第2の表示例を示す図である。 図11は、実施例1のグラフ表示装置の処理フローの例を示す図である。 図12は、グラフの表示処理のフローの一例を示す図である。 図13は、実施例2のシステムの全体構成の例を示す図である。 図14は、グラフ情報テーブルの第2の例を示す図である。 図15は、再生成処理を説明するための第1の図である。 図16は、再生成処理を説明するための第2の図である。 図17は、再生成処理について説明するための第3の図である。 図18は、再生成処理について説明するための第4の図である。 図19は、再生成の基準を説明するための図である。 図20は、実施例2のグラフ表示装置の処理フローの例を示す図である。 図21は、再生成処理のフローの一例を示す図である。 図22は、実施例1のグラフ表示装置のハードウェア構成を示す図である。 図23は、コンピュータで動作するプログラムの構成例を示す図である。
以下に、本願の開示するグラフ表示装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの権利範囲が限定されるものではない。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
(実施例1のシステム全体の構成)
図1は、実施例1のシステムの全体構成の例を示す図である。図1の例に示すように、グラフ表示装置100は、通信部101と、制御部110と、記憶部120と、出力部130とを有する。出力部130は、制御部110と通信可能に接続される。通信部101は、外部の機器との接続に使用される通信インターフェースである。通信部101は、例えば、USB(Universal Serial Bus)ポート等である。記憶部120は、データ領域121と、表示データ領域122と、ラベル一覧表(図4参照)と、グラフ情報テーブル(図2参照)とを有する。記憶部120は例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリなどの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。以下、記憶部120の各構成について詳細に説明する。
(記憶部の各構成)
データ領域121は、グラフのもとになるデータを格納する。データは、例えば、CSV(Comma-Separated Values)形式のファイルでデータ領域121へ格納される。すなわち、データ領域121に格納されるデータは、複数の項目に対応する値が、レコード単位で、カンマで区切られて格納される。なお、データの格納形式は、CSV形式以外の格納形式であってもよい。
表示データ領域122は、グラフを出力部130へ表示する際に用いるグラフの画像データを格納する。出力部130へグラフの画像データが出力される例については、後述する。
グラフ情報テーブルは、図2に示すようなデータ構造を有する。図2は、グラフ情報テーブルの第1の例を示す図である。グラフ情報テーブルは、グラフデータを基に生成された各々のグラフの形状に関する情報を有するテーブルである。図2の例のように、グラフ情報テーブルは、グラフ名と、バーの高さの平均値と、バーの高さの標準偏差と、バーの高さの変動係数と、隣接するバーの高さの差の平均値と、隣接するバーの高さの差の標準偏差と、隣接するバーの高さの差の変動係数とを対応付ける。さらに、グラフ情報テーブルは、判定結果と、スコア1と、スコア2とを対応付ける。
「グラフ名」は、グラフデータの名称である。「バーの高さの平均値」は、棒グラフのバーの高さの平均値である。即ち、グラフ中の各要素が示す値の平均値である。「バーの高さの標準偏差」は、棒グラフのバーの高さの標準偏差である。即ち、グラフ中の各要素が示す値の即ち、グラフ中の各要素が示す値の標準偏差である。である。「バーの高さの変動係数」は、バーの高さの平均値で標準偏差を除算して算出される係数である。なお、以下では、バーの高さの変動係数をbar変動係数Cbと呼ぶ。bar変動係数Cbの算出方法については、後述する。
「隣接するバーの高さの差の平均値」は、棒グラフの隣接するバーの高さの差の平均値である。即ち、グラフ中で隣り合って表示される要素間の値の差分の平均値である。「隣接するバーの高さの差の標準偏差」は、棒グラフの隣接するバーの高さの差の標準偏差である。即ち、グラフ中で隣り合って表示される要素間の値の差分の標準偏差である。「隣接するバーの高さの差の変動係数」は、隣接するバーの高さの差の平均値で隣接するバーの高さの差の標準偏差を除算して算出される係数である。なお、以下では、隣接するバーの高さの差の変動係数をdif変動係数Cdと呼ぶ。dif変動係数Cdの算出方法については、後述する。
「判定結果」は、グラフデータに係るグラフが起伏に富んだグラフであるか、単調なグラフであるかを判定した結果である。例えば、「判定結果」が「normal graph」の場合、単調な形状のグラフであることを表す。即ち、グラフ中の要素間で、各要素が示す値が、全体的に似た値であることを表す。一方、「判定結果」が「distinctive graph」の場合、起伏に富んだ形状のグラフであることを表す。即ち、グラフ中の要素間で、各要素が示す値のばらつきが大きいことを表す。
「スコア1」は、グラフの形状の分類を表す。例えば、スコア1が「一部」の場合、棒グラフの一部に高さの大きいバーが存在することを表す。即ち、グラフ中の要素間で、一部の要素が、他の要素が示す値と比較して、突出して大きい値を示すことを表す。また、スコア1が「特凹」の場合、棒グラフの一部のバーが他のバーよりも低い部分があり、また、棒グラフが特徴的な形状であることを表す。即ち、グラフ中の要素間で、一部の要素が、他の要素が示す値と比較して、突出して小さい値を示すことを表す。
「スコア2」は、例えば、1つのバーに標本が90%以上集まっているか否かの判定結果である。例えば、スコア2が「○」の場合、棒グラフの1つのバーに標本が90%以上集まっていないことを表す。また、スコア2が「×」の場合、棒グラフの1つのバーに標本が90%以上集まっていることを表す。即ち、スコア2が「×」の場合、そのグラフにおける要素では、グラフに表されている標本をうまく分解できないことを意味する。なお、図2の例では、各項目のデータがレコードとして関連づけられて記憶されている例を示したが、上記説明において互いに関連づけられた項目どうしの関係が保たれれば、データは他の記憶のされ方をしても構わない。グラフ情報テーブルのデータ構造に関する説明は、以上の通りである。
(制御部の各構成)
制御部110は、抽出部111と、表示部112とを有する。制御部110の機能は例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。また、制御部110の機能は例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現することができる。
抽出部111は、データ領域121に格納されるデータに基づくグラフを生成する。抽出部111は、データ領域121に格納されるデータの項目をx軸およびy軸へ配置したグラフを生成する。そして、抽出部111は、生成したグラフを表示データ領域122へ第1のグラフ群として格納する。そして、抽出部111は、生成した第1のグラフ群のグラフから形状に関する情報を抽出し、各々のグラフの形状に関する情報を、上述したグラフ情報テーブルに格納する。
そして、抽出部111は、グラフ情報テーブルを参照し、第1のグラフ群のグラフの形状に関する情報と、グラフの形状に関する基準とに基づいて、第1のグラフ群から第2のグラフ群を抽出する。表示部112は、第1のグラフ群から抽出された第2のグラフ群のみを出力部130に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に出力部130へ出力する。なお、グラフ群は、例えば、複数の棒グラフである。
また、形状に関する基準は、グラフに含まれる各要素の高さのばらつきに基づいて算出される基準を含んでもよい。また、形状に関する基準は、グラフに含まれる各要素間の高さの差分のばらつきに基づいて算出される基準を含んでもよい。形状に関する基準については、後述する。なお、要素とは、例えば、棒グラフのバーである。
抽出部111は、先ず変動係数を算出する処理を実行し、次にグラフの形状を判定する処理を実行することによってグラフ情報テーブルを作成する。
先ず、変動係数を算出する処理について説明する。抽出部111は、例えば、データを基に棒グラフを生成し、生成された棒グラフに基づいてbar変動係数Cbとdif変動係数Cdとを算出する。
bar変動係数Cbとは、例えば、グラフデータを基に表示される棒グラフのバーの高さに関する変動係数である。抽出部111は、棒グラフのバーの高さの平均値γbを算出し、グラフ情報テーブルに格納する。また、抽出部111は、棒グラフのバー高さの標準偏差δbを算出し、グラフ情報テーブルに格納する。抽出部111は、グラフ情報テーブルに格納されたバーの高さの標準偏差δbをバーの高さの平均値γbで除算し、bar変動係数Cbを算出する。すなわち、下記の式(1)に基づいてbar変動係数Cbを算出する。抽出部111は、算出したbar変動係数Cbをグラフ情報テーブルに格納する。
Cb=δb/γb ・・・(1)
dif変動係数Cdとは、例えば、グラフデータを基に表示される棒グラフの隣接するバーの高さの差に関する変動係数である。dif変動係数Cdの算出手順について説明する。まず、抽出部111は、棒グラフの隣接するバーの高さの差の平均値γdを算出し、グラフ情報テーブルに格納する。また、抽出部111は、棒グラフの隣接するバーの高さの差の標準偏差δdを算出し、グラフ情報テーブルに格納する。抽出部111は、グラフ情報テーブルに格納された隣接するバーの高さの差の標準偏差δdを隣接するバーの高さの差の平均値γdで除算し、dif変動係数Cdを算出する。すなわち、下記の式(2)に基づいてdif変動係数Cdを算出する。抽出部111は、算出したdif変動係数Cdをグラフ情報テーブルに格納する。
Cd=δd/γd ・・・(2)
図3を用いてbar変動係数Cbおよびdif変動係数Cdについて説明する。図3は、変動係数を説明するための図である。図3の例に示される棒グラフ10aは、日本国内で住みたい県についてのアンケート結果を各県別に表す。棒グラフ10aの縦軸は、それぞれの県(A県〜G県)を選択した人数を表す。また、棒グラフ10aの横軸には、A県からG県までの県名が列挙される。
棒グラフ10aの点線で示される矢印は、バーの高さを表す。例えば、抽出部111は、点線で示される矢印に基づいて棒グラフ10aのバーの高さの平均値γdおよび標準偏差δdを算出する。抽出部111は、バーの高さの平均値γdおよび標準偏差δdを式(1)に代入することで棒グラフ10aのbar変動係数Cbを算出する。
棒グラフ10aの実線で示される矢印は、隣接するバーの高さの差を表す。例えば、抽出部111は、実線で示される矢印に基づいて棒グラフ10aの隣接するバーの高さの差の平均値γdおよび標準偏差δdを算出する。抽出部111は、棒グラフ10aの隣接するバーの高さの差の平均値γdおよび標準偏差δdを式(2)に代入することで棒グラフ10aのdif変動係数Cdを算出する。
なお、棒グラフのばらつき度合いを表現する場合に標準偏差を用いる場合があるが、標準偏差は、母集団の平均値の大きさに影響を受けやすいので、異なる母集団間でばらつき度合いを比較することができない。このため、実施例1のグラフ表示装置100は、母集団の標準偏差を平均値で除算した変動係数を用いて、母集団間のばらつき度合いを比較する。これにより、グラフ表示装置100は、異なる母集団間でばらつき度合いを比較することができる。第一の変動係数を算出する処理の説明は、以上の通りである。
抽出部111は、後述する第一のラベル付け処理および第二のラベル付け処理によって各グラフにラベルを付与する。抽出部111は、ラベル一覧表を参照し、bar変動係数Cbおよび/またはdif変動係数Cdに応じたラベルを付与する。図4は、ラベル一覧表の一例を示す図である。図4の例に示すように、ラベル一覧表は、ラベルと、ラベルの付与条件とを対応付ける。ラベルの付与条件は、bar変動係数Cbの上限および下限と、dif変動係数Cdの上限および下限とで表される。
図4の例に示されるラベル一覧表において、No.1のラベルは「全て同じ値」であり、bar変動係数Cbおよびdif変動係数Cdがすべて0であるグラフに付与される。また、No.2のラベルは「一部集中」であり、3.0≦bar変動係数Cbであるグラフに付与される。なお、「Inf」は、上限値が無限大であることを表す。
また、No.3のラベルは「一部集中」であり、0.5≦bar変動係数Cbかつ2.5≦dif変動係数Cdであるグラフに付与される。また、No.4のラベルは「一部集中 or 一部欠落」であり、0<bar変動係数Cb<0.5かつ2.5≦dif変動係数Cdであるグラフに付与される。
また、No.5のラベルは「特徴的」であり、0.5≦bar変動係数Cb<2.5かつ0<dif変動係数Cd<0.8であるグラフに付与される。また、No.6のラベルは「特徴的(一部集中 or 欠落あり)」であり、0.5≦bar変動係数Cb<2.5かつ0.8≦dif変動係数Cd<2.5であるグラフに付与される。
また、No.7のラベルは「満遍なく」であり、0<bar変動係数Cb<0.5かつ0<dif変動係数Cd<0.8であるグラフに付与される。また、No.8のラベルは「満遍なく(一部集中 or 欠落あり)」であり、0<bar変動係数Cb<0.5かつ0.8<dif変動係数Cd≦2.5であるグラフに付与される。
また、No.9の「一つに集中」のラベルは、bar変動係数Cbおよびdif変動係数Cdに依存せず、生成したグラフにおいて、1つのバーに、例えば90%以上の標本が集中するグラフに付与される。また、No.10のラベルは「特徴少ない」であり、2.5≦bar変動係数Cb<3.0かつ0<dif変動係数Cd<2.5であるグラフに付与される。
例えば、どの因子が目的変数にどのように影響するのかを、人間の知見によらずデータに示される数値から導きだす場合、目的変数に少しでも影響を及ぼす可能性がある因子は分析対象に含めることになるため、大量のデータが分析対象となる。例えば、ある商品Aの売上額を目的変数として、売上額に影響する因子が何であるかを分析する場合、売上があった日の天気や気温、曜日や時間帯はもとより、その時期の物価指数や、円相場、さらには、商品Aと関係の深い商品Bの値段、店舗が存在する地域で行われたイベントの有無など、因子の数は膨大になる。
このような多数の因子の中から、分析に有効な因子、さらには、その因子の値を見つけ出すためには、全ての因子についての総当りで売上額との関係をグラフ化し、分析に有効そうな形状を示すグラフに着目することが考えられる。そして着目したグラフで用いられた因子と、そのグラフの形状から読み取れる因子の値に着目することが考えられる。
グラフで表されたデータを分析に役立てることを考えると、一つのバーに標本が集中していたり、反対に、複数のバーに同程度の標本が存在していたりするようなグラフは望ましくない。なぜならば、そのようなグラフからは、標本を分解するための情報を得られないからである。一方、x軸方向に標本が散らばって存在し、またy軸方向でもデータが散らばって存在しているようなグラフは、分析の観点からは望ましい。さらには、x軸方向で散らばったデータが、y軸方向で1箇所のピークを持ち、全体としてバーが山型の並びになっているようなグラフは分析に利用しやすい。なぜならば、ピークを示しているx軸の値が、標本を分解する、すなわち、標本全体を複数にグルーピングする際の区切りにできる可能性が大きいからである。
このような考え方から、図4のラベル一覧表では、bar変動係数とdif変動係数との関係でグラフの形状が山型に類するような形状になるグラフは、分析に役立てやすい情報を示したグラフと言えるので、「特徴的」というラベルを付与している。
次に、グラフの形状を判定する処理について説明する。抽出部111は、第二のグラフの形状を判定する処理において、第一のラベル付け処理と第二のラベル付け処理とを実行する。
第一のラベル付け処理について説明する。抽出部111は、棒グラフの1つのバーに90%以上の標本が集まっているグラフを抽出し、「一つに集中」のラベルを付す。図5は、第一のラベル付け処理を説明するための図である。図5の例に示す棒グラフ10bは、縦軸が頻度(Frequency)を表し、横軸が各過程のデータ(process Data)を表す。例えば、棒グラフ10bは、横軸の値が0.2〜0.4のバーに、90%以上の標本が集中している。抽出部111は、棒グラフ10bに「一つに集中」のラベルを付す。
ここで、図5の例に示されるように、棒グラフ10bには、横軸の値が0.0〜0.8付近に分布するデータの他、横軸の値が2.5付近にもデータが分布する。このように、他のデータと乖離した部分に分布するデータを外れ値と呼ぶ。例えば、テストデータとして棒グラフに混入させたデータが、外れ値として棒グラフに表される。棒グラフ10bは、外れ値を含むので横軸のスケールが大きくなっている。このため、棒グラフ10bにおいて、横軸の値が0.2〜0.4付近で縦軸の頻度がどのように変化するかが不明確となっている。
抽出部111は、「一つに集中」のラベルを付した棒グラフに関し、グラフ情報テーブルのスコア1に「一つに集中」のラベルを格納する。なお、「一つに集中」のラベルは、図2のグラフ情報テーブルのスコア1において、「一つ」に対応する。また、抽出部111は、「一つに集中」のラベルを付した棒グラフに関し、グラフ情報テーブルのスコア2に「×」を格納する。なお、抽出部111は、「×」を格納した棒グラフ以外の棒グラフのスコア2に「○」を格納する。抽出部111は、スコア2に「○」を格納した棒グラフを第二のラベル付け処理の対象とし、「×」を格納した棒グラフを第二のラベル付け処理の対象から除外する。このように抽出部111は、第一のラベル付け処理を実行する。
次に、第二のラベル付け処理について説明する。抽出部111は、スコア2に「○」を格納した棒グラフに関し、算出したbar変動係数Cbおよびdif変動係数Cdに基づいて棒グラフの形状を判定する。図6を用いて、bar変動係数Cbの大きさに応じたグラフの形状について説明する。図6は、第二のラベル付け処理を説明するための第1の図である。図6の例に示すように、例えば、bar変動係数Cbが0〜0.5の範囲にある場合、グラフの形状は、各バーの高さが満遍なく同じ高さとなる。例えば、グラフの形状は、棒グラフ10cのような形状になる。また、bar変動係数Cbが0.5〜2.5の範囲にある場合、グラフの形状は、一部の範囲に標本が集中し、バーの一部の高さが大きくなる。例えば、グラフの形状は、グラフ10dのような形状になる。
また、bar変動係数Cbが2.5〜3.0の範囲にある場合、グラフの形状は、少数のバーの高さが大きくなり、特徴が少ないものとなる。例えば、グラフの形状は、グラフ10eのような形状になる。また、bar変動係数Cbが3.0以上にある場合、グラフの形状は、1つのバーの高さが大きくなる。例えば、グラフの形状は、グラフ10fのような形状になる。
次に、図7を用いて、dif変動係数Cdの大きさに応じたグラフの形状について説明する。図7は、第二のラベル付け処理を説明するための第2の図である。図7の例に示すように、例えば、0≦dif変動係数Cd<0.8の場合、グラフの形状は、各バーの高さが満遍なく同じ程度の高さとなるか、各バーの高さが滑らかに変化する。例えば、グラフの形状は、各バーの高さが満遍なく同じ程度の高さとなる場合、グラフ10gのような形状になる。また、グラフの形状は、各バーの高さが滑らかに変化する場合、グラフ10hのような形状になる。
また、0.8≦dif変動係数Cd<2.5の場合、グラフの形状は、バーの一部の高さが大きくなるか、バーの一部に凹みが生じる。例えば、グラフの形状は、バーの一部の高さが大きくなる場合、グラフ10iのような形状になる。また、グラフの形状は、バーの一部に凹みが生じる場合、グラフ10jのような形状になる。
また、2.5≦dif変動係数Cdの場合、グラフの形状は、1つのバーの高さが大きくなるか、1つのバーの高さが小さくなる。例えば、グラフの形状は、1つのバーの高さが大きくなる場合、グラフ10kのような形状になる。また、グラフの形状は、1つのバーの高さが小さくなる場合、グラフ10lのような形状になる。
抽出部111は、各棒グラフのbar変動係数Cbおよびdif変動係数Cdに基づいて各棒グラフをラベル付けする処理を行う。図8を用いて、第二のラベル付け処理について説明する。図8(A)は、第二のラベル付け処理を説明するための第3の図である。図8(B)は、第二のラベル付け処理を説明するための第4の図である。図8(A)および図8(B)の例に示す表50の縦軸は、dif変動係数Cdである。また、表50の横軸は、bar変動係数Cbである。図8に示す[*]の数字は、図4の例に示されるラベル一覧表に保持されている各ラベルのNo.に対応する。
抽出部111は、例えば、図8(A)において棒グラフの変動係数が[2]および[3]の領域に属する場合、「一部集中」のラベルを付す。「一部集中」のラベルが付された棒グラフは、一部のバーの高さが大きい形状である。なお、「一部集中」のラベルは、図2のグラフ情報テーブルのスコア1において、「一部」に対応する。棒グラフの変動係数が[2]に属するグラフの例としては、図8(B)に示したグラフ(2−1)、グラフ(2−2)およびグラフ(2−3)が挙げられる。また、棒グラフの変動係数が[3]に属するグラフの例としては、図8(B)に示したグラフ(3−1)が挙げられる。グラフ(2−1)、グラフ(2−2)、グラフ(2−3)およびグラフ(3−1)は、グラフ中のバーのうち、一本のバーの高さが他のバーと比較して突出して大きくなっている。なお、グラフの各バーのサイズによっては、複数のバーの高さが大きくなる場合もある。
抽出部111は、例えば、棒グラフの各変動係数が[4]の領域に属する場合、「一部集中or一部欠落」のラベルを付す。「一部集中or一部欠落」のラベルが付された棒グラフは、一部のバーの高さが大きいか、一部のバーの高さが小さい形状である。棒グラフの変動係数が[4]に属するグラフの例としては、図8(B)に示した(4−1)が挙げられる。グラフ(4−1)は、グラフ中のバーのうち、一部のバーの高さが他のバーと比較して突出して小さくなっている。
また、抽出部111は、棒グラフの変動係数が[5]の領域に属する場合、「特徴的」のラベルを付す。「特徴的」のラベルが付された棒グラフは、各バーの凹凸が大きく特徴的な形状である。棒グラフの変動係数が[5]に属するグラフの例としては、図8(B)に示した(5−1)が挙げられる。グラフ(5−1)は、グラフ中の各バーの間でバーの凹凸が大きく、各バーの高さのばらつきが大きくなっている。
また、抽出部111は、棒グラフの変動係数が[6]の領域に属する場合、「特徴的(一部集中あり)」のラベルを付す。「特徴的(一部集中あり)」のラベルが付された棒グラフは、高さの大きいバーが一部にあり、特徴的な形状である。棒グラフの変動係数が[6]に属するグラフの例としては、図8(B)に示した(6−1)、(6−2)、(6−3)、(6−4)および(6−5)が挙げられる。グラフ(6−1)、(6−2)、(6−3)、(6−4)および(6−5)は、グラフ全体として一部に高さが大きいバーが集中しており、各バーの高さのばらつきが大きくなっている。
また、他のバーの凹凸が大きく特徴的な形状である。また、抽出部111は、棒グラフの変動係数が[7]の領域に属する場合、「満遍なく」のラベルを付す。「満遍なく」のラベルが付された棒グラフは、各バーの高さが満遍なく同じ高さとなる。棒グラフの変動係数が[7]に属するグラフの例としては、図8(B)に示した(7−1)が挙げられる。グラフ(7−1)は、グラフ中の各バーの間でバーの凹凸が小さく、各バーの高さが全体的に似た大きさとなっている。
また、抽出部111は、棒グラフの各変動係数が[8]の領域に属する場合、「満遍なく(一部集中or一部欠落)」のラベルを付す。「満遍なく(一部集中or一部欠落)」のラベルが付された棒グラフは、高さが大きいバーまたは高さが小さいバーを一部に有するが、その他のバーは満遍なく同じ高さとなる。棒グラフの変動係数が[8]に属するグラフの例としては、図8(B)に示した(8−1)が挙げられる。グラフ(8−1)は、グラフの一部に高さが大きいバーもしくは高さが小さいバーがあるが、グラフ全体としてはバーの凹凸が小さく、各バーの高さが全体的に似た大きさとなっている。
また、抽出部111は、棒グラフの変動係数が[10]の領域に属する場合、「特徴が少ない」のラベルを付す。「特徴が少ない」のラベルが付された棒グラフは、少数のバーの高さが大きいが、他のバーの高さの変化が少なく特徴が少ない形状である。棒グラフの変動係数が[10]に属するグラフの例としては、図8(B)に示した(10−1)および(10−2)が挙げられる。グラフ(10−1)および(10−2)は、グラフの一部に高さが突出して大きいバーがあるが、他の各バーの凹凸が小さく特徴が少ない形状である。
そして、抽出部111は、各棒グラフに付したラベルをグラフ情報テーブルの「スコア1」に格納する。
このように、抽出部111は、棒グラフの変動が大きく凹凸が多い形状の場合に、棒グラフの形状が特徴的であると判定する。すなわち、抽出部111は、棒グラフに「特徴的(一部集中あり)」または「特徴的」のラベルが付された場合に、棒グラフの形状が特徴的であると判定する。変動が大きく凹凸が多い形状の棒グラフは、データ分析に有用なグラフであることが多い。抽出部111は、棒グラフの形状が特徴的であると判定した場合に、グラフ情報テーブルの「判定結果」の項目に「distinctive graph」を格納する。
一方、極端に1つまたは少数のバーに標本が集中し、1つまたは少数のバーの高さが大きくなる場合や、バーの高さが均一でバーの高さが変動しない場合、棒グラフの形状が特徴的でないと判定する。すなわち、抽出部111は、「一つに集中」、「一部集中or一部欠落」、「満遍なく(一部集中or一部欠落)」、「満遍なく」、「特徴が少ない」、「一部集中」等のラベルが付された場合に、棒グラフの形状が特徴的でないと判定する。抽出部111は、棒グラフの形状が特徴的でないと判定した場合に、グラフ情報テーブルの「判定結果」の項目に「normal graph」を格納する。グラフ情報テーブルの生成手順に関する説明は、以上の通りである。
上述したように、抽出部111は、第一のラベル付与処理と第二のラベル付与処理とを実行する。第二のラベル付与処理においては、棒グラフに含まれる標本数が少ない場合に、特徴的でないグラフを分類できない場合がある。一方、第一のラベル付与処理においては、棒グラフに含まれる標本数が少ない場合でも、一つのバーに標本が集中する特徴的でないグラフを分類することができる。すなわち、抽出部111は、第二のラベル付与処理に加えて第一のラベル付け処理を実行するので、棒グラフに含まれる標本数が少ない場合でも、一つのバーに標本が集中するような、データ分析に利用できる標本の特徴を現していないグラフを分類することができる。
表示部112は、第1のグラフ群のうち抽出された第2のグラフ群のみを出力部130に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に出力部130に表示する。すなわち、表示部112は、ユーザによって指定されたラベルが付された棒グラフを列挙した表示データを生成する処理部である。表示部112は、ユーザによって指定されたラベルが付された棒グラフを収集し、収集した棒グラフを列挙した表示データを生成し、表示データ領域に格納する。表示部112は、生成した表示データに基づいて出力部130に各々の棒グラフを列挙して表示する。
図9を用いて、出力部130における棒グラフの表示例について説明する。図9は、表示部への第1の表示例を示す図である。図9の例に示すように、画面150aは、ラベル選択部151とグラフ表示部152とを含む。
ラベル選択部151は、例えば、ラベル毎にチェックボックスを有する。チェックボックスがクリックされると、チェックボックスに係るラベルが選択状態となる。また、ラベル選択部151は、選択ボタン160を有する。選択ボタン160は、ラベルの選択を確定させるボタンである。表示部112は、選択ボタン160がクリックされた場合に、選択状態となっているラベルに対応する棒グラフを列挙した表示データ領域122を生成する。そして、表示部112は、生成した表示データ領域122をグラフ表示部152に列挙して表示する。なお、グラフ表示部152は、スクロールバー153を有する。グラフ表示装置100は、例えば、スクロールバー153がユーザによって操作された場合に、操作された方向に隠れている棒グラフをグラフ表示部152に表示する。
図9の例のように表示部112は、ラベル選択部151において「一部集中」と「特徴あり」とが選択された状態で選択ボタン160がクリックされた場合、例えば「一部集中」および「特徴的」のラベルが付された棒グラフを収集して表示データを生成する。表示部112は、生成した表示データを表示データ領域122に格納する。
表示部112は、表示データ領域122に格納されている表示データに基づいて各棒グラフをグラフ表示部152に列挙して表示する。例えば、図9の例に示すように表示部112は、縮小化した棒グラフを列挙してグラフ表示部152に表示する。これにより、複数の棒グラフを一度に確認することができるようになり、分析作業が効率化する。
また、表示部112は、表示データ領域122が全て完成する前に、完成した部分の表示データ領域122をグラフ表示部152に表示してもよい。すなわち、表示部112は、表示データ領域122の完成した部分から順次、各棒グラフを列挙してグラフ表示部152に表示してもよい。これにより、表示部112が表示データ領域122を生成している際に、分析作業を進めることが可能となる。
また、表示部112は、グラフ表示部152に列挙された棒グラフが選択された場合に、棒グラフを拡大して表示してもよい。図10を用いて、棒グラフを拡大して表示する場合の出力部130への表示例について説明する。図10は、表示部への第2の表示例を示す図である。例えば、表示部112は、図9の例に示される棒グラフ20aがクリックされた場合に、図10の例に示される画面150bに棒グラフ20aを拡大した棒グラフ20bを表示する。
(実施例1の全体の処理の流れ)
図11を用いて、実施例1のグラフ表示装置100の全体の処理フローについて説明する。図11は、実施例1のグラフ表示装置の処理フローの例を示す図である。抽出部111は、グラフデータ領域121に含まれる各グラフデータに基づいてグラフを生成する(ステップS10)。抽出部111は、描画されたグラフ毎にbar変動係数Cbを求める(ステップS11)。例えば、抽出部111は、棒グラフのバーの高さの標準偏差δbをバーの高さの平均値γbで除算し、bar変動係数Cbを算出する。抽出部111は、算出したbar変動係数Cbをグラフ情報テーブルに格納する。
抽出部111は、描画されたグラフ毎にdif変動係数Cdを求める(ステップS12)。例えば、抽出部111は、棒グラフの隣接するバーの高さの差の標準偏差δbを、隣接するバーの高さの差の平均値γbで除算し、dif変動係数Cdを算出する。抽出部111は、算出したdif変動係数Cdをグラフ情報テーブルに格納する。
抽出部111は、STEP1に係るラベル付け処理1を実行する(ステップS13)。例えば、抽出部111は、棒グラフの1つのバーに90%以上の標本が集まっているグラフに「一つに集中」のラベルを付す。
抽出部111は、STEP2に係るラベル付け処理2を実行する(ステップS14)。例えば、抽出部111は、各棒グラフのbar変動係数Cbおよびdif変動係数Cdに基づいて各棒グラフにラベル付けする。例えば、抽出部111は、各棒グラフが図8に係る表50のどの領域に属するかに基づいてラベル付けする。
表示部112は、選択されたラベルに対応する各グラフを出力部130の画面に列挙して表示する(ステップS15)。例えば、表示部112は、縮小化した棒グラフを列挙してグラフ表示部152に表示する。
(グラフの表示処理のフロー)
次に、図12を用いて、ステップS15に係るグラフの表示処理について説明する。図12は、グラフの表示処理のフローの一例を示す図である。表示部112は、選択ボタン160がクリックされたか否かを判定する(ステップS20)。表示部112は、選択ボタン160がクリックされていない場合(ステップS20No)、ステップS20を再度実行する。一方、表示部112は、選択ボタン160がクリックされた場合(ステップS20Yes)、ステップS21の処理に移行する。
表示部112は、描画されたグラフのうち選択されたチェックボックスに対応するラベルのグラフを収集する(ステップS21)。表示部112は、収集されたグラフから表示データを生成して表示データ領域122に格納し、表示データ領域122に格納された表示データに基づいてグラフ表示部152にグラフの一覧を表示する。なお、表示部112は、表示データが全て完成される前に、表示データ領域122の一部分をグラフ表示部152に表示してもよい。
表示部122は、全てのグラフが表示されたか否かを判定する(ステップS23)。表示部122は、全てのグラフが表示された場合(ステップS23Yes)、グラフの表示処理を終了する。一方、表示部122は、表示データ領域122が完成される前に表示データの一部分を表示した場合(ステップS23No)、ステップS21の処理に戻る。
なお、図12に示すグラフの表示処理において、チェックボックスにチェックが入れられたラベルに対応するグラフのみを表示するとしたが、これに限られるのものではない。すなわち、グラフの表示処理において、チェックボックスにチェックが入れられたラベルに対応するグラフと、チェックボックスのチェックが外されたラベルに対応するグラフとを、識別可能に表示してもよい。
(実施例1の効果)
グラフ表示装置100は、データ解析して得られる第1のグラフ群のうち、形状に関する基準に基づいて第2のグラフ群を抽出する抽出部111を有する。グラフ表示装置100は、第1のグラフ群のうち抽出された第2のグラフ群のみを出力部130に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に出力部130に表示する表示部112を有する。これにより、グラフ表示装置100は、見る価値のあるグラフを効率的に厳選して表示できる。
また、形状に関する基準は、グラフに含まれる各要素の高さのばらつきに基づいて算出される基準を含んでもよい。また、形状に関する基準は、グラフに含まれる各要素間の高さの差分のばらつきに基づいて算出される基準を含んでもよい。これにより、グラフ表示装置100は、グラフの形状を効率的に判定することができる。
(実施例2のシステム全体の構成)
図13は、実施例2のシステムの全体構成の例を示す図である。図13の例に示すように、グラフ表示装置200は、通信部201と、制御部210と、記憶部220とを有する。制御部210は、出力部230と通信可能に接続される。記憶部220は、グラフデータ221と、表示データ領域222とを有する。記憶部220は例えば、RAM、ROM、フラッシュメモリなどの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。なお、実施例1のグラフ表示装置100と同様の構成については、符号の下二桁を同じとし、説明を適宜省略する。
制御部210は、抽出部211と、第一表示部212と、第二表示部213とを有する。制御部210の機能は例えば、CPUが所定のプログラムを実行することで実現することができる。また、制御部210の機能は例えば、ASICやFPGAなどの集積回路により実現することができる。なお、第一表示部212は、実施例1の表示部112の一例である。また、制御部210は、実施例1の制御部110と比べて第二表示部213を有する点で相違する。
グラフ表示装置200は、データ解析して得られる複数のグラフのうち、形状に関する第1の基準に基づいて1又は複数のグラフを抽出する抽出部211を有する。グラフ表示装置200は、抽出した1又は複数のグラフについて、所定のスケール変換処理を施し、所定のスケール変換後のグラフを表示する第二表示部213を有する。
第二表示部213は、グラフのデータが集中する要素が描画された範囲のスケールを拡大して再生成再生成してもよい。また、第二表示部213は、グラフの1以上の軸を対数軸に変更して再生成再生成してもよい。
第二表示部213は、複数のグラフのうち、所定のスケール変換処理が施された1又は複数のグラフと、所定のスケール変換処理が施されていないグラフとを識別可能に表示してもよい。また、第二表示部213によって所定のスケール変換処理が施された1又は複数のグラフは、所定のスケール変換処理が施された1又は複数のグラフの形状に応じた分類処理がなされて表示されてもよい。
また、分類処理は、第1の基準に基づいて行われてもよい。第1の基準は、グラフに含まれる各要素の高さのばらつきが所定以上であるか否かに関する基準を含んでもよい。また、第1の基準は、グラフに含まれる各要素間の高さの差分のばらつきが所定以上であるか否かに関する基準を含んでもよい。また、第1の基準は、グラフの1要素のデータの分布割合が所定以上であるか否かに関する基準を含んでもよい。以下、第二表示部213の処理について詳細に説明する。
第二表示部213は、抽出した1又は複数のグラフについて、所定のスケール変換処理を施し、所定のスケール変換後のグラフを表示する。すなわち、第二表示部213は、抽出部211によって所定のラベルが付されたグラフに対し、縦軸または横軸のスケールを変換し、グラフを再生成再生成する処理部である。
まず、第二表示部213は、グラフに付されたラベルに応じて再生成するグラフを決定する。例えば、第二表示部213は、「一つに集中」「一部集中」のラベルが付されたグラフに対して再生成することを決定する。
第二表示部213は、各グラフに付されたラベルに応じて再生成する方法を決定し、再生成する方法をグラフ情報テーブルに格納する。実施例2に係るグラフ情報テーブルのデータ構造について説明する。図14は、グラフ情報テーブルの第2の例を示す図である。図14の例のようにグラフ情報テーブルは、グラフ名と、バーの高さの平均値と、バーの高さの標準偏差と、バーの高さの変動係数と、隣接するバーの高さの差の平均値と、隣接するバーの高さの差の標準偏差と、隣接するバーの高さの差の変動係数とを対応付ける。さらに、グラフ情報テーブルは、判定結果と、スコア1と、スコア2と、再生成方法とを対応付ける。なお、実施例2に係るグラフ情報テーブルは、実施例1のグラフ情報テーブルと比べて、「再生成方法」を項目に有する点で相違する。
「再生成方法」は、グラフを再生成する場合の方法を表す。「再生成方法」には、x軸またはy軸を対数軸に変更してグラフを再生成する方法、または描画範囲を限定してグラフを再生成する方法が指定される。例えば、再生成方法が「xlog」の場合、x軸を対数軸に変更してグラフを再生成することを表す。また、再生成方法が「ylog」の場合、y軸を対数軸に変更してグラフを再生成することを表す。また、再生成方法が「0&20」の場合、x軸またはy軸が0〜20の描画範囲に限定してグラフを再生成することを表す。グラフ情報テーブルのデータ構造に関する説明は、以上の通りである。
第二表示部213は、描画範囲を限定してグラフを再生成する方法、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法のいずれかを選定する。以下、各再生成の方法について説明する。
描画範囲を限定してグラフを再生成する方法について説明する。第二表示部213は、1つまたは少数のバーに標本が集中する場合、例えば、標本が集中するバーのX軸またはY軸のレンジに描画範囲を限定してグラフを再生成する。例えば、第二表示部213は、「一つに集中」のラベルが付されたグラフに対し、90%以上の標本が集中するバーのレンジに描画範囲を限定してグラフを再生成する。
図15および図16を用いて、描画範囲を限定してグラフを再生成する方法の再生成処理について説明する。図15は、再生成処理を説明するための第1の図である。また、図16は、再生成処理を説明するための第2の図である。図15の例に示すグラフ13aは、縦軸(y軸)が頻度(Frequency)を表し、横軸(x軸)が各過程のデータ(process Data)を表す。例えば、グラフ13aは、x軸のレンジが0〜8のバー13a(1)に、90%以上の標本が集中している。抽出部211は、グラフ13aに「一つに集中」のラベルを付し、ラベル情報をグラフ情報テーブルの「スコア1」に格納する。
第二表示部213は、グラフ13aに「一つに集中」のラベルが付されたので、グラフ13aの再生成方法に関し、描画範囲を限定してグラフを再生成する方法を選定する。抽出部211は、グラフ情報テーブルの再生成方法に「0&8」を格納する。第二表示部213は、グラフ13a(1)の0〜8のレンジを拡大して再生成することで、図16の例に示されるグラフ13bを生成する。このように、第二表示部213は、描画範囲を限定してグラフを再生成することによって、標本が集中する範囲における標本の分布が明確となり、グラフの形状を把握しやすくすることができる。
なお、再生成処理の対象となる描画範囲は、標本の90%以上が集中しているx軸のレンジのみに範囲を限る必要は無い。例えば、データが集中しているバーと、隣接する左右のバーとを含めた3本分のバーが示すx軸の値の範囲の範囲としても良い。データが集中しているバーが、例えば、図15のグラフでx軸の値が20〜30のレンジであれば、ソレに隣り合う、10〜20のレンジ、30〜40のレンジを含めて、10〜40のレンジが描画範囲となる。
ここで、データが集中するバーがグラフのx軸で一番左もしくは一番右にあたる場合は、再描画の指定範囲、即ち、集中するバーに隣接する左または右のバーに相当するx軸の値の範囲は、元のグラフのx軸で表された描画範囲を逸脱することになる。その場合、はみ出した範囲は切り捨ててもよい。例えば、図15のグラフではx軸のレンジが0〜10の範囲のバーにデータが集中している。従って、単純に考えると、再描画範囲は左右のバーの範囲を含めた「-10&20」と指定することになる。元のグラフのx軸の描画範囲は0〜140であるので、−10〜0の範囲は切り捨て、再描画範囲は「0&20」とする。
次に、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法について説明する。例えば、第二表示部213は、1つのバーに60%〜90%の標本が集中しているグラフに対して、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法を適用する。また、第二表示部213は、bar変動係数Cbが2.5以上またはdif変動係数Cdが2.0以上のグラフに対して、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法を適用する。
また、第二表示部213は、例えば、左端のバーに標本が集中している場合に、x軸を対数軸に置き換える。また、第二表示部213は、左端のバー以外に標本が集中している場合に、y軸を対数軸に置き換える。なお、上述の再描画方法は、一例であり、適宜設計変更することが可能である。
図17および図18を用いて、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法の再生成処理について説明する。図17は、再生成処理について説明するための第3の図である。また、図18は、再生成処理を説明するための第4の図である。図17の例に示すグラフ14aは、縦軸(y軸)が観測された標本数を表し、横軸(x軸)がテストデータ(test data)の数値を表す。例えばグラフ14aは、テストデータの数値が2.5付近のバーに60%〜90%の標本が集中している。
第二表示部213は、グラフ14aのテストデータの数値が2.5付近のバーに60%〜90%の標本が集中しているので、グラフ13aの再生成方法に関し、グラフのy軸を対数軸に置き換えて再生成する方法を選定する。抽出部211は、グラフ情報テーブルの再生成方法に「ylog」を格納する。第二表示部213は、グラフ14aのY軸を対数軸に置き換えて再生成し、図18の例に示されるグラフ14bを生成する。このように、第二表示部213は、グラフのx軸またはy軸を対数軸に置き換えて再生成することで、標本が集中するバー以外のバーの高さの差異が明確になり、グラフの形状を把握しやすくすることができる。
なお、第二表示部213は、再生成したグラフを他のグラフと識別可能に表示してもよい。例えば、第二表示部213は、再生成したグラフの背景に色を付し、再生成したグラフと再生成していないグラフとをひと目で識別できるように表示する。
(再生成の対象となるグラフの判定基準)
図19を用いて、再生成の対象となるグラフの判定基準について説明する。図19は、再生成の基準を説明するための図である。図19の例に示す表60の縦軸は、dif変動係数Cdである。また、表60の横軸は、bar変動係数Cbである。表60には、領域11aと領域11bが存在する。また、表60には、線分12aと線分12bとが存在する。
第二表示部213は、例えば、線分12aおよび線分12bの上側にグラフが位置する場合、再生成することでグラフの形状が明確になる可能性が高いので、グラフを再生成の対象とする。一方、第二表示部213は、線分12aの下側で、線分12bの上側にグラフが位置する場合、再生成してもグラフの形状が明確になる可能性が低いので、グラフを再生成の対象から除外する。なお、経験則上、線分12bの下側にグラフが位置することは少ない。
例えば、第二表示部213は、グラフが領域11aに位置する場合、線分12aの下側で、線分12bの上側にグラフが位置することになるので、再生成の対象から除外する。また、第二表示部213は、グラフが領域11bに位置する場合、再生成しなくてもグラフの形状が明確であることが多いので、再生成の対象としなくてもよい。
(実施例2の全体の処理の流れ)
図20を用いて、実施例2のグラフ表示装置200の全体の処理フローについて説明する。図20は、実施例2のグラフ表示装置の処理フローの例を示す図である。抽出部211は、グラフデータ領域221に含まれる各グラフデータに基づいてグラフを生成する(ステップS30)。抽出部211は、生成されたグラフ毎にbar変動係数Cbを求める(ステップS31)。抽出部211は、生成されたグラフ毎にdif変動係数Cdを求める(ステップS32)。抽出部211は、STEP1に係るラベル付け処理1を実行する(ステップS33)。抽出部211は、STEP2に係るラベル付け処理2を実行する(ステップS34)。
第二表示部213は、所定の基準を満たすグラフに対して再生成処理を実行する(ステップS35)。第二表示部112は、選択されたラベルに対応する各グラフを、再生成されたグラフを含めて出力部130の画面に列挙して表示する(ステップS36)。ステップS36の処理は、ステップS15の処理と同一である。
(再生成処理の流れ)
図21を用いて、再生成処理のフローについて説明する。図21は、再生成処理のフローの一例を示す図である。第二表示部213は、全てのグラフが処理済みであるか否かを判定する(ステップS40)。第二表示部213は、全てのグラフが処理済みである場合(ステップS40Yes)、再生成処理を終了する。一方、第二表示部213は、処理していないグラフが残っている場合(ステップS40No)、ステップS41の処理に移行する。
第二表示部213は、第一表示部212によって描画されたグラフを1つ取得する(ステップS41)。第二表示部213は、1つのバーに90%以上の標本が集中しているか否かを判定する(ステップS42)。第二表示部213は、1つのバーに90%以上の標本が集中している場合(ステップS42Yes)、標本が集中する1つのバーに描画範囲を限定してグラフを再生成する(ステップS43)。第二表示部213は、再生成したグラフを表示データ領域222に格納し(ステップS48)、ステップS40に戻る。一方、第二表示部213は、1つのバーに90%以上の標本が集中していない場合(ステップS42No)、ステップS44の処理に移行する。
第二表示部213は、1つのバーに60%以上の標本が集中しているか、または、bar変動係数Cbが2.5以上もしくはdif変動係数Cdが2.0以上であるか否かを判定する(ステップS44)。第二表示部213は、1つのバーに60%以上の標本が集中している場合、または、bar変動係数Cbが2.5以上もしくはdif変動係数Cdが2.0以上である場合(ステップS44Yes)、ステップS45の処理に移行する。一方、第二表示部213は、1つのバーに60%以上の標本が集中しておらず、かつ、bar変動係数Cbが2.5未満でdif変動係数Cdが2.0未満である場合(ステップS44No)、グラフを再生成処理の対象から除外し、ステップS40の処理に戻る。
第二表示部213は、グラフの左端のバーに標本が集中しているか否かを判定する(ステップS45)。第二表示部213は、グラフの左端のバー標本が集中している場合(ステップS45Yes)、グラフのx軸を対数軸に置き換えて再生成をする(ステップS46)。一方、第二表示部213は、グラフの左端のバー以外に標本が集中している場合(ステップS45No)、グラフのy軸を対数軸に置き換えて再生成をする(ステップS47)。第二表示部213は、再生成したグラフを表示データ領域222に格納し(ステップS48)、ステップS40に戻る。
(実施例2の効果)
グラフ表示装置200は、データ解析して得られる複数のグラフのうち、形状に関する第1の基準に基づいて1又は複数のグラフを抽出する抽出部211を有する。グラフ表示装置200は、抽出した1又は複数のグラフについて、所定のスケール変換処理を施し、所定のスケール変換後のグラフを表示する第二表示部213を有する。これにより、グラフの変化を分析しやすく表示できる。
第二表示部213は、複数のグラフのうち、所定のスケール変換処理が施された1又は複数のグラフと、所定のスケール変換処理が施されていないグラフとを識別可能に表示する。これにより、スケール変換前のグラフとスケール変換後のグラフを比較しやすく表示できる。
第二表示部213によって、所定のスケール変換処理が施された1又は複数のグラフは、所定のスケール変換処理が施された1又は複数のグラフの形状に応じた分類処理がなされて表示される。また、第二表示部213によって分類処理は、第1の基準に基づいて行われる。第1の基準は、グラフに含まれる各要素の高さのばらつきが所定以上であるか否かに関する基準を含んでもよい。第1の基準は、グラフに含まれる各要素間の高さの差分のばらつきが所定以上であるか否かに関する基準を含んでもよい。第1の基準は、グラフの1要素のデータの分布割合が所定以上であるか否かに関する基準を含んでもよい。これにより、グラフ表示装置200は、スケール変換処理を施すグラフの領域を精度よく特定することができる。
スケール変換処理は、グラフのデータが集中する要素が描画された範囲のスケールを拡大して再生成するものであってもよい。スケール変換処理は、グラフの1以上の軸を対数軸に変更して再生成するものであってもよい。これにより、グラフの変化を分析しやすく表示できる。
(実施例1および実施例2に関連する他の態様)
以下、上述の実施形態における変形例の一部を説明する。下記の変形例のみでなく、本開示の技術の本旨を逸脱しない範囲の設計変更は適宜行われうる。
実施例1のグラフ表示装置100は、グラフの変動が大きく凹凸が多い形状の場合に、グラフの形状が適切であると判定し、分類対象とする旨を説明したが、これに限定されない。例えば、グラフ表示装置100は、バーの高さが満遍なく同じ高さのグラフを分類対象としてもよい。これにより、例えば、工場で製造された製品の中で良質な製品のグラフを分類することができる。また、グラフ表示装置100は、「一つに集中」のラベルが付されたグラフのように外れ値が入ったグラフを分類対象としてもよい。これにより、例えば、工場で製造された製品に含まれる不良品に係るグラフを分類することができる。
実施例1のグラフ表示装置100は、グラフ情報テーブルにおいてスコア2に「○」を格納したグラフを第二のラベル付け処理の対象とし、「×」を格納したグラフを第二のラベル付け処理の対象から除外する旨説明したが、これに限定されない。例えば、グラフ表示装置100は、グラフ情報テーブルにおいてスコア2に「×」を格納したグラフを第二のラベル付け処理の対象としてもよい。すなわち、グラフ表示装置100は、第1のラベル付け処理または第2のラベル付け処理を独立して実行してグラフを分類してもよい。
実施例2のグラフ表示装置200は、再生成後のグラフを表示する際に、再生成前のグラフを表示データ領域222に残してもよい。これにより、再生成前のグラフと再生成後のグラフとを比較することができる。例えば、再生成後にデータ分析に有用なグラフとなった場合に、再生成前のグラフを参考にして、グラフを次回描画する際の描画方法を検討することができる。
実施例2の抽出部211は、第二表示部213によって再生成されたグラフを分類対象としてもよい。これにより、例えば、再生成された棒グラフが多数あった場合に、グラフを効率的に分類できる。
実施例2の第二表示部213は、「一つに集中」「一部集中」のラベルが付されたグラフに対して再生成することを決定する旨を説明したが、これに限定されない。第二表示部213は、再生成するグラフの条件を適宜変更することができる。
実施例1のグラフ表示装置100および実施例2のグラフ表示装置200は、グラフを形状に応じて分類する旨を説明したが、これに限定されない。例えば、グラフ表示装置100および実施例2のグラフ表示装置200は、折れ線グラフ、ヒストグラム等を形状に応じて分類してもよい。
すなわち、以上の実施例では、グラフは、例えばデータを各項目の出現回数を示す棒グラフであるバープロット、もしくは、データ区間ごとに該当するデータの分布を示す棒グラフであるヒストグラムである。しかし、グラフは、データを多次元で視覚的に表示するものであれば、いずれであってもよい。
上述したグラフ表示装置100は、1台のコンピュータに実装されてもよく、また、複数台のコンピュータによるクラウドに実装されてもよい。例えば、グラフ表示装置100は、クラウドシステムに含まれる複数台のコンピュータが、図1に示した抽出部111および表示部112と同様の機能を発揮する。
また、実施例1および実施例2に示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
(グラフ表示装置のハードウェア構成)
図22は、実施例1のグラフ表示装置のハードウェア構成を示す図である。図22の例が示すように、コンピュータ300は、各種演算処理を実行するCPU301と、ユーザからのデータ入力を受け付ける入力装置302と、モニタ303とを有する。また、コンピュータ300は、記憶媒体からプログラム等を読み取る媒体読取装置304と、他の装置と接続するためのインターフェース装置305と、他の装置と無線により接続するための無線通信装置306とを有する。また、コンピュータ300は、各種情報を一時記憶するRAM307と、ハードディスク装置308とを有する。また、各装置301〜308は、バス309に接続される。
ハードディスク装置308には、例えば図1に示した抽出部111および表示部112の各処理部と同様の機能を有するグラフ表示プログラムが記憶される。また、ハードディスク装置308には、グラフ表示プログラムを実現するための各種データが記憶される。
CPU301は、ハードディスク装置308に記憶された各プログラムを読み出して、RAM307に展開して実行することで各種の処理を行う。これらのプログラムは、コンピュータ300を、例えば図1に示した抽出部111および表示部112として機能させることができる。
なお、上記の情報処理プログラムは、必ずしもハードディスク装置308に記憶されている必要はない。例えば、コンピュータ300が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ300が読み出して実行するようにしてもよい。コンピュータ300が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN(Local Area Network)等に接続された装置にこのプログラムを記憶させておき、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。なお、実施例2のグラフ表示装置200は、図22の例に示される実施例1のグラフ表示装置100と同様のハードウェア構成を有してもよい。
図23は、コンピュータで動作するプログラムの構成例を示す。コンピュータ300において、図23に示すハードウェア群26(301〜309)の制御を行なうOS(オペレーティング・システム)27が動作する。OS27に従った手順でCPU301が動作して、ハードウェア群26の制御・管理が行なわれることにより、アプリケーションプログラム29やミドルウェア28に従った処理がハードウェア群26で実行される。さらに、コンピュータ300において、ミドルウェア28またはアプリケーションプログラム29が、RAM307に読み出されてCPU301により実行される。
CPU301により情報処理機能が呼び出された場合、ミドルウェア28またはアプリケーションプログラム29の少なくとも一部に基づく処理を行なうことで、制御部110の機能が実現される。情報処理機能は、それぞれアプリケーションプログラム29自体に含まれてもよいし、アプリケーションプログラム29に従って呼び出されることで実行されるミドルウェア28の一部であってもよい。
100 グラフ表示装置
101 通信部
110 制御部
111 抽出部
112 表示部
120 記憶部
121 グラフデータ領域
122 表示データ
130 表示部

Claims (14)

  1. データ解析して得られる第1のグラフ群のうち、形状に関する基準に基づいて第2のグラフ群を抽出し、
    前記第1のグラフ群のうち抽出された前記第2のグラフ群のみを表示部に表示する、又は、前記第1のグラフ群のうち前記第2のグラフ群と前記第1のグラフ群のうち前記第2のグラフ群を除くグラフ群とを識別可能に出力部に表示する、
    ことを特徴とするコンピュータを用いたデータ解析結果のグラフ表示方法。
  2. 前記形状に関する基準は、グラフに含まれる各要素の高さのばらつきに基づいて算出される基準を含む、ことを特徴とする請求項1に記載のグラフ表示方法。
  3. 前記形状に関する基準は、グラフに含まれる各要素間の高さの差分のばらつきに基づいて算出される基準を含む、ことを特徴とする請求項1または2に記載のグラフ表示方法。
  4. データ解析して得られる複数のグラフのうち、形状に関する第1の基準に基づいて1又は複数のグラフを抽出し、
    抽出した前記1又は複数のグラフについて、所定のスケール変換処理を施し、
    前記所定のスケール変換後のグラフを表示する、
    ことを特徴とするコンピュータを用いたデータ解析結果のグラフ表示方法。
  5. 前記複数のグラフのうち、前記所定のスケール変換処理が施された前記1又は複数のグラフと、前記所定のスケール変換処理が施されていないグラフとを識別可能に表示する、ことを特徴とする請求項4に記載のグラフ表示方法。
  6. 前記所定のスケール変換処理が施された前記1又は複数のグラフは、前記所定のスケール変換処理が施された前記1又は複数のグラフの形状に応じた分類処理がなされて表示される、ことを特徴とする請求項5に記載のグラフ表示方法。
  7. 前記分類処理は、前記第1の基準に基づいて行われる、ことを特徴とする請求項6記載のグラフ表示方法。
  8. 前記第1の基準は、グラフに含まれる各要素の高さのばらつきが所定以上であるか否かに関する基準を含む、ことを特徴とする請求項7に記載のグラフ表示方法。
  9. 前記第1の基準は、グラフに含まれる各要素間の高さの差分のばらつきが所定以上であるか否かに関する基準を含む、ことを特徴とする請求項7または8に記載のグラフ表示方法。
  10. 前記第1の基準は、グラフの1要素のデータの分布割合が所定以上であるか否かに関する基準を含む、ことを特徴とする請求項7〜9のいずれか一に記載のグラフ表示方法。
  11. 前記スケール変換処理は、グラフのデータが集中する要素が描画された範囲のスケールを拡大して再生成する、ことを特徴とする請求項4〜10のいずれか一に記載のグラフ表示方法。
  12. 前記スケール変換処理は、グラフの1以上の軸を対数軸に変更して再生成する、ことを特徴とする請求項4〜11のいずれか一に記載のグラフ表示方法。
  13. データ解析して得られる第1のグラフ群のうち、形状に関する基準に基づいて第2のグラフ群を抽出する抽出部と、
    前記第1のグラフ群のうち抽出された前記第2のグラフ群のみを表示部に表示する、又は、前記第1のグラフ群のうち前記第2のグラフ群と前記第1のグラフ群のうち前記第2のグラフ群を除くグラフ群とを識別可能に出力部に表示する表示部と、
    を有することを特徴とするデータ解析結果のグラフ表示装置。
  14. データ解析して得られる第1のグラフ群のうち、形状に関する基準に基づいて第2のグラフ群を抽出し、
    前記第1のグラフ群のうち抽出された前記第2のグラフ群のみを表示部に表示する、又は、前記第1のグラフ群のうち前記第2のグラフ群と前記第1のグラフ群のうち前記第2のグラフ群を除くグラフ群とを識別可能に出力部に表示する、
    処理を実行させることを特徴とするコンピュータを用いたデータ解析結果のグラフ表示プログラム。
JP2014144494A 2014-07-14 2014-07-14 グラフ表示方法、グラフ表示装置およびグラフ表示プログラム Pending JP2016021144A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014144494A JP2016021144A (ja) 2014-07-14 2014-07-14 グラフ表示方法、グラフ表示装置およびグラフ表示プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014144494A JP2016021144A (ja) 2014-07-14 2014-07-14 グラフ表示方法、グラフ表示装置およびグラフ表示プログラム

Publications (1)

Publication Number Publication Date
JP2016021144A true JP2016021144A (ja) 2016-02-04

Family

ID=55265946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014144494A Pending JP2016021144A (ja) 2014-07-14 2014-07-14 グラフ表示方法、グラフ表示装置およびグラフ表示プログラム

Country Status (1)

Country Link
JP (1) JP2016021144A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019160110A (ja) * 2018-03-16 2019-09-19 カシオ計算機株式会社 情報処理装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07230446A (ja) * 1993-12-22 1995-08-29 Toshiba Corp パターン抽出方法及び装置
JPH11272760A (ja) * 1998-03-26 1999-10-08 Sharp Corp 情報処理装置
JP2007538261A (ja) * 2004-05-20 2007-12-27 ウオーターズ・インベストメンツ・リミテツド 選択されたイオンクロマトグラムを使用して先駆物質および断片イオンをグループ化するシステムおよび方法
JP2008008708A (ja) * 2006-06-28 2008-01-17 Omron Corp 判定知識作成装置、判定知識作成方法、プログラムおよび記録媒体
JP2010224760A (ja) * 2009-03-23 2010-10-07 Fujitsu Ten Ltd データ表示装置
JP2011000210A (ja) * 2009-06-17 2011-01-06 Sri Sports Ltd ゴルフスイングの分析方法
JP2011028483A (ja) * 2009-07-24 2011-02-10 Mitsubishi Electric Corp 多次元データ選択装置及び多次元データ選択方法及び多次元データ選択プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07230446A (ja) * 1993-12-22 1995-08-29 Toshiba Corp パターン抽出方法及び装置
JPH11272760A (ja) * 1998-03-26 1999-10-08 Sharp Corp 情報処理装置
JP2007538261A (ja) * 2004-05-20 2007-12-27 ウオーターズ・インベストメンツ・リミテツド 選択されたイオンクロマトグラムを使用して先駆物質および断片イオンをグループ化するシステムおよび方法
JP2008008708A (ja) * 2006-06-28 2008-01-17 Omron Corp 判定知識作成装置、判定知識作成方法、プログラムおよび記録媒体
JP2010224760A (ja) * 2009-03-23 2010-10-07 Fujitsu Ten Ltd データ表示装置
JP2011000210A (ja) * 2009-06-17 2011-01-06 Sri Sports Ltd ゴルフスイングの分析方法
JP2011028483A (ja) * 2009-07-24 2011-02-10 Mitsubishi Electric Corp 多次元データ選択装置及び多次元データ選択方法及び多次元データ選択プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019160110A (ja) * 2018-03-16 2019-09-19 カシオ計算機株式会社 情報処理装置及びプログラム
JP7031394B2 (ja) 2018-03-16 2022-03-08 カシオ計算機株式会社 情報処理装置、人事分析支援方法及びプログラム

Similar Documents

Publication Publication Date Title
US8959003B2 (en) Interactive data visualization for trend analysis
US10884891B2 (en) Interactive detection of system anomalies
CN108090032B (zh) 逻辑回归模型的可视化解释方法及装置
US11436617B2 (en) Behavior pattern search system and behavior pattern search method
JP2007034700A (ja) 予測プログラムおよび予測装置
JP2018147280A (ja) データ分析装置及びデータ分析方法
JP6696568B2 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
US9460477B2 (en) Information processing apparatus and method and non-transitory computer readable medium
JP2018081550A (ja) 営業活動支援装置、営業活動支援方法および営業活動支援プログラム
JPWO2016063446A1 (ja) 説明変数表示優先順位決定システム、方法およびプログラム
JP6268000B2 (ja) 未観測因子推定支援装置、未観測因子推定支援方法および未観測因子推定支援プログラム
EP3223168A1 (en) Visualizing device, visualizing method and visualizing program
JP7019339B2 (ja) 不良原因抽出システム及びその方法
JP2010250864A (ja) 情報処理装置およびプログラム
JP2011018263A (ja) 生産指標情報生成装置、プログラム及び生産情報生成方法
JP2016021144A (ja) グラフ表示方法、グラフ表示装置およびグラフ表示プログラム
US10776969B2 (en) Concentric data visualization structures
JP6676993B2 (ja) 情報提供装置、情報提供方法、及び、プログラム
JP5160670B2 (ja) マーケティング支援システム
US10504254B2 (en) Predictor visualization system, predictor visualization method, and predictor visualization program
JP6784062B2 (ja) 情報処理装置、情報処理方法およびプログラム
US9195951B2 (en) Displaying a visualization of a portion of a rolling horizon time series
JP6211194B2 (ja) シミュレーションシステム、及び、シミュレーション方法
JP2009009342A (ja) 情報処理装置およびプログラム
US20190278871A1 (en) Data analysis system, data analysis method, and computer program product

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181204