以下に、本願の開示するグラフ表示装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの権利範囲が限定されるものではない。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
(実施例1のシステム全体の構成)
図1は、実施例1のシステムの全体構成の例を示す図である。図1の例に示すように、グラフ表示装置100は、通信部101と、制御部110と、記憶部120と、出力部130とを有する。出力部130は、制御部110と通信可能に接続される。通信部101は、外部の機器との接続に使用される通信インターフェースである。通信部101は、例えば、USB(Universal Serial Bus)ポート等である。記憶部120は、データ領域121と、表示データ領域122と、ラベル一覧表(図4参照)と、グラフ情報テーブル(図2参照)とを有する。記憶部120は例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリなどの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。以下、記憶部120の各構成について詳細に説明する。
(記憶部の各構成)
データ領域121は、グラフのもとになるデータを格納する。データは、例えば、CSV(Comma-Separated Values)形式のファイルでデータ領域121へ格納される。すなわち、データ領域121に格納されるデータは、複数の項目に対応する値が、レコード単位で、カンマで区切られて格納される。なお、データの格納形式は、CSV形式以外の格納形式であってもよい。
表示データ領域122は、グラフを出力部130へ表示する際に用いるグラフの画像データを格納する。出力部130へグラフの画像データが出力される例については、後述する。
グラフ情報テーブルは、図2に示すようなデータ構造を有する。図2は、グラフ情報テーブルの第1の例を示す図である。グラフ情報テーブルは、グラフデータを基に生成された各々のグラフの形状に関する情報を有するテーブルである。図2の例のように、グラフ情報テーブルは、グラフ名と、バーの高さの平均値と、バーの高さの標準偏差と、バーの高さの変動係数と、隣接するバーの高さの差の平均値と、隣接するバーの高さの差の標準偏差と、隣接するバーの高さの差の変動係数とを対応付ける。さらに、グラフ情報テーブルは、判定結果と、スコア1と、スコア2とを対応付ける。
「グラフ名」は、グラフデータの名称である。「バーの高さの平均値」は、棒グラフのバーの高さの平均値である。即ち、グラフ中の各要素が示す値の平均値である。「バーの高さの標準偏差」は、棒グラフのバーの高さの標準偏差である。即ち、グラフ中の各要素が示す値の即ち、グラフ中の各要素が示す値の標準偏差である。である。「バーの高さの変動係数」は、バーの高さの平均値で標準偏差を除算して算出される係数である。なお、以下では、バーの高さの変動係数をbar変動係数Cbと呼ぶ。bar変動係数Cbの算出方法については、後述する。
「隣接するバーの高さの差の平均値」は、棒グラフの隣接するバーの高さの差の平均値である。即ち、グラフ中で隣り合って表示される要素間の値の差分の平均値である。「隣接するバーの高さの差の標準偏差」は、棒グラフの隣接するバーの高さの差の標準偏差である。即ち、グラフ中で隣り合って表示される要素間の値の差分の標準偏差である。「隣接するバーの高さの差の変動係数」は、隣接するバーの高さの差の平均値で隣接するバーの高さの差の標準偏差を除算して算出される係数である。なお、以下では、隣接するバーの高さの差の変動係数をdif変動係数Cdと呼ぶ。dif変動係数Cdの算出方法については、後述する。
「判定結果」は、グラフデータに係るグラフが起伏に富んだグラフであるか、単調なグラフであるかを判定した結果である。例えば、「判定結果」が「normal graph」の場合、単調な形状のグラフであることを表す。即ち、グラフ中の要素間で、各要素が示す値が、全体的に似た値であることを表す。一方、「判定結果」が「distinctive graph」の場合、起伏に富んだ形状のグラフであることを表す。即ち、グラフ中の要素間で、各要素が示す値のばらつきが大きいことを表す。
「スコア1」は、グラフの形状の分類を表す。例えば、スコア1が「一部」の場合、棒グラフの一部に高さの大きいバーが存在することを表す。即ち、グラフ中の要素間で、一部の要素が、他の要素が示す値と比較して、突出して大きい値を示すことを表す。また、スコア1が「特凹」の場合、棒グラフの一部のバーが他のバーよりも低い部分があり、また、棒グラフが特徴的な形状であることを表す。即ち、グラフ中の要素間で、一部の要素が、他の要素が示す値と比較して、突出して小さい値を示すことを表す。
「スコア2」は、例えば、1つのバーに標本が90%以上集まっているか否かの判定結果である。例えば、スコア2が「○」の場合、棒グラフの1つのバーに標本が90%以上集まっていないことを表す。また、スコア2が「×」の場合、棒グラフの1つのバーに標本が90%以上集まっていることを表す。即ち、スコア2が「×」の場合、そのグラフにおける要素では、グラフに表されている標本をうまく分解できないことを意味する。なお、図2の例では、各項目のデータがレコードとして関連づけられて記憶されている例を示したが、上記説明において互いに関連づけられた項目どうしの関係が保たれれば、データは他の記憶のされ方をしても構わない。グラフ情報テーブルのデータ構造に関する説明は、以上の通りである。
(制御部の各構成)
制御部110は、抽出部111と、表示部112とを有する。制御部110の機能は例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。また、制御部110の機能は例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現することができる。
抽出部111は、データ領域121に格納されるデータに基づくグラフを生成する。抽出部111は、データ領域121に格納されるデータの項目をx軸およびy軸へ配置したグラフを生成する。そして、抽出部111は、生成したグラフを表示データ領域122へ第1のグラフ群として格納する。そして、抽出部111は、生成した第1のグラフ群のグラフから形状に関する情報を抽出し、各々のグラフの形状に関する情報を、上述したグラフ情報テーブルに格納する。
そして、抽出部111は、グラフ情報テーブルを参照し、第1のグラフ群のグラフの形状に関する情報と、グラフの形状に関する基準とに基づいて、第1のグラフ群から第2のグラフ群を抽出する。表示部112は、第1のグラフ群から抽出された第2のグラフ群のみを出力部130に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に出力部130へ出力する。なお、グラフ群は、例えば、複数の棒グラフである。
また、形状に関する基準は、グラフに含まれる各要素の高さのばらつきに基づいて算出される基準を含んでもよい。また、形状に関する基準は、グラフに含まれる各要素間の高さの差分のばらつきに基づいて算出される基準を含んでもよい。形状に関する基準については、後述する。なお、要素とは、例えば、棒グラフのバーである。
抽出部111は、先ず変動係数を算出する処理を実行し、次にグラフの形状を判定する処理を実行することによってグラフ情報テーブルを作成する。
先ず、変動係数を算出する処理について説明する。抽出部111は、例えば、データを基に棒グラフを生成し、生成された棒グラフに基づいてbar変動係数Cbとdif変動係数Cdとを算出する。
bar変動係数Cbとは、例えば、グラフデータを基に表示される棒グラフのバーの高さに関する変動係数である。抽出部111は、棒グラフのバーの高さの平均値γbを算出し、グラフ情報テーブルに格納する。また、抽出部111は、棒グラフのバー高さの標準偏差δbを算出し、グラフ情報テーブルに格納する。抽出部111は、グラフ情報テーブルに格納されたバーの高さの標準偏差δbをバーの高さの平均値γbで除算し、bar変動係数Cbを算出する。すなわち、下記の式(1)に基づいてbar変動係数Cbを算出する。抽出部111は、算出したbar変動係数Cbをグラフ情報テーブルに格納する。
Cb=δb/γb ・・・(1)
dif変動係数Cdとは、例えば、グラフデータを基に表示される棒グラフの隣接するバーの高さの差に関する変動係数である。dif変動係数Cdの算出手順について説明する。まず、抽出部111は、棒グラフの隣接するバーの高さの差の平均値γdを算出し、グラフ情報テーブルに格納する。また、抽出部111は、棒グラフの隣接するバーの高さの差の標準偏差δdを算出し、グラフ情報テーブルに格納する。抽出部111は、グラフ情報テーブルに格納された隣接するバーの高さの差の標準偏差δdを隣接するバーの高さの差の平均値γdで除算し、dif変動係数Cdを算出する。すなわち、下記の式(2)に基づいてdif変動係数Cdを算出する。抽出部111は、算出したdif変動係数Cdをグラフ情報テーブルに格納する。
Cd=δd/γd ・・・(2)
図3を用いてbar変動係数Cbおよびdif変動係数Cdについて説明する。図3は、変動係数を説明するための図である。図3の例に示される棒グラフ10aは、日本国内で住みたい県についてのアンケート結果を各県別に表す。棒グラフ10aの縦軸は、それぞれの県(A県〜G県)を選択した人数を表す。また、棒グラフ10aの横軸には、A県からG県までの県名が列挙される。
棒グラフ10aの点線で示される矢印は、バーの高さを表す。例えば、抽出部111は、点線で示される矢印に基づいて棒グラフ10aのバーの高さの平均値γdおよび標準偏差δdを算出する。抽出部111は、バーの高さの平均値γdおよび標準偏差δdを式(1)に代入することで棒グラフ10aのbar変動係数Cbを算出する。
棒グラフ10aの実線で示される矢印は、隣接するバーの高さの差を表す。例えば、抽出部111は、実線で示される矢印に基づいて棒グラフ10aの隣接するバーの高さの差の平均値γdおよび標準偏差δdを算出する。抽出部111は、棒グラフ10aの隣接するバーの高さの差の平均値γdおよび標準偏差δdを式(2)に代入することで棒グラフ10aのdif変動係数Cdを算出する。
なお、棒グラフのばらつき度合いを表現する場合に標準偏差を用いる場合があるが、標準偏差は、母集団の平均値の大きさに影響を受けやすいので、異なる母集団間でばらつき度合いを比較することができない。このため、実施例1のグラフ表示装置100は、母集団の標準偏差を平均値で除算した変動係数を用いて、母集団間のばらつき度合いを比較する。これにより、グラフ表示装置100は、異なる母集団間でばらつき度合いを比較することができる。第一の変動係数を算出する処理の説明は、以上の通りである。
抽出部111は、後述する第一のラベル付け処理および第二のラベル付け処理によって各グラフにラベルを付与する。抽出部111は、ラベル一覧表を参照し、bar変動係数Cbおよび/またはdif変動係数Cdに応じたラベルを付与する。図4は、ラベル一覧表の一例を示す図である。図4の例に示すように、ラベル一覧表は、ラベルと、ラベルの付与条件とを対応付ける。ラベルの付与条件は、bar変動係数Cbの上限および下限と、dif変動係数Cdの上限および下限とで表される。
図4の例に示されるラベル一覧表において、No.1のラベルは「全て同じ値」であり、bar変動係数Cbおよびdif変動係数Cdがすべて0であるグラフに付与される。また、No.2のラベルは「一部集中」であり、3.0≦bar変動係数Cbであるグラフに付与される。なお、「Inf」は、上限値が無限大であることを表す。
また、No.3のラベルは「一部集中」であり、0.5≦bar変動係数Cbかつ2.5≦dif変動係数Cdであるグラフに付与される。また、No.4のラベルは「一部集中 or 一部欠落」であり、0<bar変動係数Cb<0.5かつ2.5≦dif変動係数Cdであるグラフに付与される。
また、No.5のラベルは「特徴的」であり、0.5≦bar変動係数Cb<2.5かつ0<dif変動係数Cd<0.8であるグラフに付与される。また、No.6のラベルは「特徴的(一部集中 or 欠落あり)」であり、0.5≦bar変動係数Cb<2.5かつ0.8≦dif変動係数Cd<2.5であるグラフに付与される。
また、No.7のラベルは「満遍なく」であり、0<bar変動係数Cb<0.5かつ0<dif変動係数Cd<0.8であるグラフに付与される。また、No.8のラベルは「満遍なく(一部集中 or 欠落あり)」であり、0<bar変動係数Cb<0.5かつ0.8<dif変動係数Cd≦2.5であるグラフに付与される。
また、No.9の「一つに集中」のラベルは、bar変動係数Cbおよびdif変動係数Cdに依存せず、生成したグラフにおいて、1つのバーに、例えば90%以上の標本が集中するグラフに付与される。また、No.10のラベルは「特徴少ない」であり、2.5≦bar変動係数Cb<3.0かつ0<dif変動係数Cd<2.5であるグラフに付与される。
例えば、どの因子が目的変数にどのように影響するのかを、人間の知見によらずデータに示される数値から導きだす場合、目的変数に少しでも影響を及ぼす可能性がある因子は分析対象に含めることになるため、大量のデータが分析対象となる。例えば、ある商品Aの売上額を目的変数として、売上額に影響する因子が何であるかを分析する場合、売上があった日の天気や気温、曜日や時間帯はもとより、その時期の物価指数や、円相場、さらには、商品Aと関係の深い商品Bの値段、店舗が存在する地域で行われたイベントの有無など、因子の数は膨大になる。
このような多数の因子の中から、分析に有効な因子、さらには、その因子の値を見つけ出すためには、全ての因子についての総当りで売上額との関係をグラフ化し、分析に有効そうな形状を示すグラフに着目することが考えられる。そして着目したグラフで用いられた因子と、そのグラフの形状から読み取れる因子の値に着目することが考えられる。
グラフで表されたデータを分析に役立てることを考えると、一つのバーに標本が集中していたり、反対に、複数のバーに同程度の標本が存在していたりするようなグラフは望ましくない。なぜならば、そのようなグラフからは、標本を分解するための情報を得られないからである。一方、x軸方向に標本が散らばって存在し、またy軸方向でもデータが散らばって存在しているようなグラフは、分析の観点からは望ましい。さらには、x軸方向で散らばったデータが、y軸方向で1箇所のピークを持ち、全体としてバーが山型の並びになっているようなグラフは分析に利用しやすい。なぜならば、ピークを示しているx軸の値が、標本を分解する、すなわち、標本全体を複数にグルーピングする際の区切りにできる可能性が大きいからである。
このような考え方から、図4のラベル一覧表では、bar変動係数とdif変動係数との関係でグラフの形状が山型に類するような形状になるグラフは、分析に役立てやすい情報を示したグラフと言えるので、「特徴的」というラベルを付与している。
次に、グラフの形状を判定する処理について説明する。抽出部111は、第二のグラフの形状を判定する処理において、第一のラベル付け処理と第二のラベル付け処理とを実行する。
第一のラベル付け処理について説明する。抽出部111は、棒グラフの1つのバーに90%以上の標本が集まっているグラフを抽出し、「一つに集中」のラベルを付す。図5は、第一のラベル付け処理を説明するための図である。図5の例に示す棒グラフ10bは、縦軸が頻度(Frequency)を表し、横軸が各過程のデータ(process Data)を表す。例えば、棒グラフ10bは、横軸の値が0.2〜0.4のバーに、90%以上の標本が集中している。抽出部111は、棒グラフ10bに「一つに集中」のラベルを付す。
ここで、図5の例に示されるように、棒グラフ10bには、横軸の値が0.0〜0.8付近に分布するデータの他、横軸の値が2.5付近にもデータが分布する。このように、他のデータと乖離した部分に分布するデータを外れ値と呼ぶ。例えば、テストデータとして棒グラフに混入させたデータが、外れ値として棒グラフに表される。棒グラフ10bは、外れ値を含むので横軸のスケールが大きくなっている。このため、棒グラフ10bにおいて、横軸の値が0.2〜0.4付近で縦軸の頻度がどのように変化するかが不明確となっている。
抽出部111は、「一つに集中」のラベルを付した棒グラフに関し、グラフ情報テーブルのスコア1に「一つに集中」のラベルを格納する。なお、「一つに集中」のラベルは、図2のグラフ情報テーブルのスコア1において、「一つ」に対応する。また、抽出部111は、「一つに集中」のラベルを付した棒グラフに関し、グラフ情報テーブルのスコア2に「×」を格納する。なお、抽出部111は、「×」を格納した棒グラフ以外の棒グラフのスコア2に「○」を格納する。抽出部111は、スコア2に「○」を格納した棒グラフを第二のラベル付け処理の対象とし、「×」を格納した棒グラフを第二のラベル付け処理の対象から除外する。このように抽出部111は、第一のラベル付け処理を実行する。
次に、第二のラベル付け処理について説明する。抽出部111は、スコア2に「○」を格納した棒グラフに関し、算出したbar変動係数Cbおよびdif変動係数Cdに基づいて棒グラフの形状を判定する。図6を用いて、bar変動係数Cbの大きさに応じたグラフの形状について説明する。図6は、第二のラベル付け処理を説明するための第1の図である。図6の例に示すように、例えば、bar変動係数Cbが0〜0.5の範囲にある場合、グラフの形状は、各バーの高さが満遍なく同じ高さとなる。例えば、グラフの形状は、棒グラフ10cのような形状になる。また、bar変動係数Cbが0.5〜2.5の範囲にある場合、グラフの形状は、一部の範囲に標本が集中し、バーの一部の高さが大きくなる。例えば、グラフの形状は、グラフ10dのような形状になる。
また、bar変動係数Cbが2.5〜3.0の範囲にある場合、グラフの形状は、少数のバーの高さが大きくなり、特徴が少ないものとなる。例えば、グラフの形状は、グラフ10eのような形状になる。また、bar変動係数Cbが3.0以上にある場合、グラフの形状は、1つのバーの高さが大きくなる。例えば、グラフの形状は、グラフ10fのような形状になる。
次に、図7を用いて、dif変動係数Cdの大きさに応じたグラフの形状について説明する。図7は、第二のラベル付け処理を説明するための第2の図である。図7の例に示すように、例えば、0≦dif変動係数Cd<0.8の場合、グラフの形状は、各バーの高さが満遍なく同じ程度の高さとなるか、各バーの高さが滑らかに変化する。例えば、グラフの形状は、各バーの高さが満遍なく同じ程度の高さとなる場合、グラフ10gのような形状になる。また、グラフの形状は、各バーの高さが滑らかに変化する場合、グラフ10hのような形状になる。
また、0.8≦dif変動係数Cd<2.5の場合、グラフの形状は、バーの一部の高さが大きくなるか、バーの一部に凹みが生じる。例えば、グラフの形状は、バーの一部の高さが大きくなる場合、グラフ10iのような形状になる。また、グラフの形状は、バーの一部に凹みが生じる場合、グラフ10jのような形状になる。
また、2.5≦dif変動係数Cdの場合、グラフの形状は、1つのバーの高さが大きくなるか、1つのバーの高さが小さくなる。例えば、グラフの形状は、1つのバーの高さが大きくなる場合、グラフ10kのような形状になる。また、グラフの形状は、1つのバーの高さが小さくなる場合、グラフ10lのような形状になる。
抽出部111は、各棒グラフのbar変動係数Cbおよびdif変動係数Cdに基づいて各棒グラフをラベル付けする処理を行う。図8を用いて、第二のラベル付け処理について説明する。図8(A)は、第二のラベル付け処理を説明するための第3の図である。図8(B)は、第二のラベル付け処理を説明するための第4の図である。図8(A)および図8(B)の例に示す表50の縦軸は、dif変動係数Cdである。また、表50の横軸は、bar変動係数Cbである。図8に示す[*]の数字は、図4の例に示されるラベル一覧表に保持されている各ラベルのNo.に対応する。
抽出部111は、例えば、図8(A)において棒グラフの変動係数が[2]および[3]の領域に属する場合、「一部集中」のラベルを付す。「一部集中」のラベルが付された棒グラフは、一部のバーの高さが大きい形状である。なお、「一部集中」のラベルは、図2のグラフ情報テーブルのスコア1において、「一部」に対応する。棒グラフの変動係数が[2]に属するグラフの例としては、図8(B)に示したグラフ(2−1)、グラフ(2−2)およびグラフ(2−3)が挙げられる。また、棒グラフの変動係数が[3]に属するグラフの例としては、図8(B)に示したグラフ(3−1)が挙げられる。グラフ(2−1)、グラフ(2−2)、グラフ(2−3)およびグラフ(3−1)は、グラフ中のバーのうち、一本のバーの高さが他のバーと比較して突出して大きくなっている。なお、グラフの各バーのサイズによっては、複数のバーの高さが大きくなる場合もある。
抽出部111は、例えば、棒グラフの各変動係数が[4]の領域に属する場合、「一部集中or一部欠落」のラベルを付す。「一部集中or一部欠落」のラベルが付された棒グラフは、一部のバーの高さが大きいか、一部のバーの高さが小さい形状である。棒グラフの変動係数が[4]に属するグラフの例としては、図8(B)に示した(4−1)が挙げられる。グラフ(4−1)は、グラフ中のバーのうち、一部のバーの高さが他のバーと比較して突出して小さくなっている。
また、抽出部111は、棒グラフの変動係数が[5]の領域に属する場合、「特徴的」のラベルを付す。「特徴的」のラベルが付された棒グラフは、各バーの凹凸が大きく特徴的な形状である。棒グラフの変動係数が[5]に属するグラフの例としては、図8(B)に示した(5−1)が挙げられる。グラフ(5−1)は、グラフ中の各バーの間でバーの凹凸が大きく、各バーの高さのばらつきが大きくなっている。
また、抽出部111は、棒グラフの変動係数が[6]の領域に属する場合、「特徴的(一部集中あり)」のラベルを付す。「特徴的(一部集中あり)」のラベルが付された棒グラフは、高さの大きいバーが一部にあり、特徴的な形状である。棒グラフの変動係数が[6]に属するグラフの例としては、図8(B)に示した(6−1)、(6−2)、(6−3)、(6−4)および(6−5)が挙げられる。グラフ(6−1)、(6−2)、(6−3)、(6−4)および(6−5)は、グラフ全体として一部に高さが大きいバーが集中しており、各バーの高さのばらつきが大きくなっている。
また、他のバーの凹凸が大きく特徴的な形状である。また、抽出部111は、棒グラフの変動係数が[7]の領域に属する場合、「満遍なく」のラベルを付す。「満遍なく」のラベルが付された棒グラフは、各バーの高さが満遍なく同じ高さとなる。棒グラフの変動係数が[7]に属するグラフの例としては、図8(B)に示した(7−1)が挙げられる。グラフ(7−1)は、グラフ中の各バーの間でバーの凹凸が小さく、各バーの高さが全体的に似た大きさとなっている。
また、抽出部111は、棒グラフの各変動係数が[8]の領域に属する場合、「満遍なく(一部集中or一部欠落)」のラベルを付す。「満遍なく(一部集中or一部欠落)」のラベルが付された棒グラフは、高さが大きいバーまたは高さが小さいバーを一部に有するが、その他のバーは満遍なく同じ高さとなる。棒グラフの変動係数が[8]に属するグラフの例としては、図8(B)に示した(8−1)が挙げられる。グラフ(8−1)は、グラフの一部に高さが大きいバーもしくは高さが小さいバーがあるが、グラフ全体としてはバーの凹凸が小さく、各バーの高さが全体的に似た大きさとなっている。
また、抽出部111は、棒グラフの変動係数が[10]の領域に属する場合、「特徴が少ない」のラベルを付す。「特徴が少ない」のラベルが付された棒グラフは、少数のバーの高さが大きいが、他のバーの高さの変化が少なく特徴が少ない形状である。棒グラフの変動係数が[10]に属するグラフの例としては、図8(B)に示した(10−1)および(10−2)が挙げられる。グラフ(10−1)および(10−2)は、グラフの一部に高さが突出して大きいバーがあるが、他の各バーの凹凸が小さく特徴が少ない形状である。
そして、抽出部111は、各棒グラフに付したラベルをグラフ情報テーブルの「スコア1」に格納する。
このように、抽出部111は、棒グラフの変動が大きく凹凸が多い形状の場合に、棒グラフの形状が特徴的であると判定する。すなわち、抽出部111は、棒グラフに「特徴的(一部集中あり)」または「特徴的」のラベルが付された場合に、棒グラフの形状が特徴的であると判定する。変動が大きく凹凸が多い形状の棒グラフは、データ分析に有用なグラフであることが多い。抽出部111は、棒グラフの形状が特徴的であると判定した場合に、グラフ情報テーブルの「判定結果」の項目に「distinctive graph」を格納する。
一方、極端に1つまたは少数のバーに標本が集中し、1つまたは少数のバーの高さが大きくなる場合や、バーの高さが均一でバーの高さが変動しない場合、棒グラフの形状が特徴的でないと判定する。すなわち、抽出部111は、「一つに集中」、「一部集中or一部欠落」、「満遍なく(一部集中or一部欠落)」、「満遍なく」、「特徴が少ない」、「一部集中」等のラベルが付された場合に、棒グラフの形状が特徴的でないと判定する。抽出部111は、棒グラフの形状が特徴的でないと判定した場合に、グラフ情報テーブルの「判定結果」の項目に「normal graph」を格納する。グラフ情報テーブルの生成手順に関する説明は、以上の通りである。
上述したように、抽出部111は、第一のラベル付与処理と第二のラベル付与処理とを実行する。第二のラベル付与処理においては、棒グラフに含まれる標本数が少ない場合に、特徴的でないグラフを分類できない場合がある。一方、第一のラベル付与処理においては、棒グラフに含まれる標本数が少ない場合でも、一つのバーに標本が集中する特徴的でないグラフを分類することができる。すなわち、抽出部111は、第二のラベル付与処理に加えて第一のラベル付け処理を実行するので、棒グラフに含まれる標本数が少ない場合でも、一つのバーに標本が集中するような、データ分析に利用できる標本の特徴を現していないグラフを分類することができる。
表示部112は、第1のグラフ群のうち抽出された第2のグラフ群のみを出力部130に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に出力部130に表示する。すなわち、表示部112は、ユーザによって指定されたラベルが付された棒グラフを列挙した表示データを生成する処理部である。表示部112は、ユーザによって指定されたラベルが付された棒グラフを収集し、収集した棒グラフを列挙した表示データを生成し、表示データ領域に格納する。表示部112は、生成した表示データに基づいて出力部130に各々の棒グラフを列挙して表示する。
図9を用いて、出力部130における棒グラフの表示例について説明する。図9は、表示部への第1の表示例を示す図である。図9の例に示すように、画面150aは、ラベル選択部151とグラフ表示部152とを含む。
ラベル選択部151は、例えば、ラベル毎にチェックボックスを有する。チェックボックスがクリックされると、チェックボックスに係るラベルが選択状態となる。また、ラベル選択部151は、選択ボタン160を有する。選択ボタン160は、ラベルの選択を確定させるボタンである。表示部112は、選択ボタン160がクリックされた場合に、選択状態となっているラベルに対応する棒グラフを列挙した表示データ領域122を生成する。そして、表示部112は、生成した表示データ領域122をグラフ表示部152に列挙して表示する。なお、グラフ表示部152は、スクロールバー153を有する。グラフ表示装置100は、例えば、スクロールバー153がユーザによって操作された場合に、操作された方向に隠れている棒グラフをグラフ表示部152に表示する。
図9の例のように表示部112は、ラベル選択部151において「一部集中」と「特徴あり」とが選択された状態で選択ボタン160がクリックされた場合、例えば「一部集中」および「特徴的」のラベルが付された棒グラフを収集して表示データを生成する。表示部112は、生成した表示データを表示データ領域122に格納する。
表示部112は、表示データ領域122に格納されている表示データに基づいて各棒グラフをグラフ表示部152に列挙して表示する。例えば、図9の例に示すように表示部112は、縮小化した棒グラフを列挙してグラフ表示部152に表示する。これにより、複数の棒グラフを一度に確認することができるようになり、分析作業が効率化する。
また、表示部112は、表示データ領域122が全て完成する前に、完成した部分の表示データ領域122をグラフ表示部152に表示してもよい。すなわち、表示部112は、表示データ領域122の完成した部分から順次、各棒グラフを列挙してグラフ表示部152に表示してもよい。これにより、表示部112が表示データ領域122を生成している際に、分析作業を進めることが可能となる。
また、表示部112は、グラフ表示部152に列挙された棒グラフが選択された場合に、棒グラフを拡大して表示してもよい。図10を用いて、棒グラフを拡大して表示する場合の出力部130への表示例について説明する。図10は、表示部への第2の表示例を示す図である。例えば、表示部112は、図9の例に示される棒グラフ20aがクリックされた場合に、図10の例に示される画面150bに棒グラフ20aを拡大した棒グラフ20bを表示する。
(実施例1の全体の処理の流れ)
図11を用いて、実施例1のグラフ表示装置100の全体の処理フローについて説明する。図11は、実施例1のグラフ表示装置の処理フローの例を示す図である。抽出部111は、グラフデータ領域121に含まれる各グラフデータに基づいてグラフを生成する(ステップS10)。抽出部111は、描画されたグラフ毎にbar変動係数Cbを求める(ステップS11)。例えば、抽出部111は、棒グラフのバーの高さの標準偏差δbをバーの高さの平均値γbで除算し、bar変動係数Cbを算出する。抽出部111は、算出したbar変動係数Cbをグラフ情報テーブルに格納する。
抽出部111は、描画されたグラフ毎にdif変動係数Cdを求める(ステップS12)。例えば、抽出部111は、棒グラフの隣接するバーの高さの差の標準偏差δbを、隣接するバーの高さの差の平均値γbで除算し、dif変動係数Cdを算出する。抽出部111は、算出したdif変動係数Cdをグラフ情報テーブルに格納する。
抽出部111は、STEP1に係るラベル付け処理1を実行する(ステップS13)。例えば、抽出部111は、棒グラフの1つのバーに90%以上の標本が集まっているグラフに「一つに集中」のラベルを付す。
抽出部111は、STEP2に係るラベル付け処理2を実行する(ステップS14)。例えば、抽出部111は、各棒グラフのbar変動係数Cbおよびdif変動係数Cdに基づいて各棒グラフにラベル付けする。例えば、抽出部111は、各棒グラフが図8に係る表50のどの領域に属するかに基づいてラベル付けする。
表示部112は、選択されたラベルに対応する各グラフを出力部130の画面に列挙して表示する(ステップS15)。例えば、表示部112は、縮小化した棒グラフを列挙してグラフ表示部152に表示する。
(グラフの表示処理のフロー)
次に、図12を用いて、ステップS15に係るグラフの表示処理について説明する。図12は、グラフの表示処理のフローの一例を示す図である。表示部112は、選択ボタン160がクリックされたか否かを判定する(ステップS20)。表示部112は、選択ボタン160がクリックされていない場合(ステップS20No)、ステップS20を再度実行する。一方、表示部112は、選択ボタン160がクリックされた場合(ステップS20Yes)、ステップS21の処理に移行する。
表示部112は、描画されたグラフのうち選択されたチェックボックスに対応するラベルのグラフを収集する(ステップS21)。表示部112は、収集されたグラフから表示データを生成して表示データ領域122に格納し、表示データ領域122に格納された表示データに基づいてグラフ表示部152にグラフの一覧を表示する。なお、表示部112は、表示データが全て完成される前に、表示データ領域122の一部分をグラフ表示部152に表示してもよい。
表示部122は、全てのグラフが表示されたか否かを判定する(ステップS23)。表示部122は、全てのグラフが表示された場合(ステップS23Yes)、グラフの表示処理を終了する。一方、表示部122は、表示データ領域122が完成される前に表示データの一部分を表示した場合(ステップS23No)、ステップS21の処理に戻る。
なお、図12に示すグラフの表示処理において、チェックボックスにチェックが入れられたラベルに対応するグラフのみを表示するとしたが、これに限られるのものではない。すなわち、グラフの表示処理において、チェックボックスにチェックが入れられたラベルに対応するグラフと、チェックボックスのチェックが外されたラベルに対応するグラフとを、識別可能に表示してもよい。
(実施例1の効果)
グラフ表示装置100は、データ解析して得られる第1のグラフ群のうち、形状に関する基準に基づいて第2のグラフ群を抽出する抽出部111を有する。グラフ表示装置100は、第1のグラフ群のうち抽出された第2のグラフ群のみを出力部130に表示する、又は、第1のグラフ群のうち第2のグラフ群と第1のグラフ群のうち第2のグラフ群を除くグラフ群とを識別可能に出力部130に表示する表示部112を有する。これにより、グラフ表示装置100は、見る価値のあるグラフを効率的に厳選して表示できる。
また、形状に関する基準は、グラフに含まれる各要素の高さのばらつきに基づいて算出される基準を含んでもよい。また、形状に関する基準は、グラフに含まれる各要素間の高さの差分のばらつきに基づいて算出される基準を含んでもよい。これにより、グラフ表示装置100は、グラフの形状を効率的に判定することができる。
(実施例2のシステム全体の構成)
図13は、実施例2のシステムの全体構成の例を示す図である。図13の例に示すように、グラフ表示装置200は、通信部201と、制御部210と、記憶部220とを有する。制御部210は、出力部230と通信可能に接続される。記憶部220は、グラフデータ221と、表示データ領域222とを有する。記憶部220は例えば、RAM、ROM、フラッシュメモリなどの半導体メモリ素子、ハードディスクや光ディスクなどの記憶装置に対応する。なお、実施例1のグラフ表示装置100と同様の構成については、符号の下二桁を同じとし、説明を適宜省略する。
制御部210は、抽出部211と、第一表示部212と、第二表示部213とを有する。制御部210の機能は例えば、CPUが所定のプログラムを実行することで実現することができる。また、制御部210の機能は例えば、ASICやFPGAなどの集積回路により実現することができる。なお、第一表示部212は、実施例1の表示部112の一例である。また、制御部210は、実施例1の制御部110と比べて第二表示部213を有する点で相違する。
グラフ表示装置200は、データ解析して得られる複数のグラフのうち、形状に関する第1の基準に基づいて1又は複数のグラフを抽出する抽出部211を有する。グラフ表示装置200は、抽出した1又は複数のグラフについて、所定のスケール変換処理を施し、所定のスケール変換後のグラフを表示する第二表示部213を有する。
第二表示部213は、グラフのデータが集中する要素が描画された範囲のスケールを拡大して再生成再生成してもよい。また、第二表示部213は、グラフの1以上の軸を対数軸に変更して再生成再生成してもよい。
第二表示部213は、複数のグラフのうち、所定のスケール変換処理が施された1又は複数のグラフと、所定のスケール変換処理が施されていないグラフとを識別可能に表示してもよい。また、第二表示部213によって所定のスケール変換処理が施された1又は複数のグラフは、所定のスケール変換処理が施された1又は複数のグラフの形状に応じた分類処理がなされて表示されてもよい。
また、分類処理は、第1の基準に基づいて行われてもよい。第1の基準は、グラフに含まれる各要素の高さのばらつきが所定以上であるか否かに関する基準を含んでもよい。また、第1の基準は、グラフに含まれる各要素間の高さの差分のばらつきが所定以上であるか否かに関する基準を含んでもよい。また、第1の基準は、グラフの1要素のデータの分布割合が所定以上であるか否かに関する基準を含んでもよい。以下、第二表示部213の処理について詳細に説明する。
第二表示部213は、抽出した1又は複数のグラフについて、所定のスケール変換処理を施し、所定のスケール変換後のグラフを表示する。すなわち、第二表示部213は、抽出部211によって所定のラベルが付されたグラフに対し、縦軸または横軸のスケールを変換し、グラフを再生成再生成する処理部である。
まず、第二表示部213は、グラフに付されたラベルに応じて再生成するグラフを決定する。例えば、第二表示部213は、「一つに集中」「一部集中」のラベルが付されたグラフに対して再生成することを決定する。
第二表示部213は、各グラフに付されたラベルに応じて再生成する方法を決定し、再生成する方法をグラフ情報テーブルに格納する。実施例2に係るグラフ情報テーブルのデータ構造について説明する。図14は、グラフ情報テーブルの第2の例を示す図である。図14の例のようにグラフ情報テーブルは、グラフ名と、バーの高さの平均値と、バーの高さの標準偏差と、バーの高さの変動係数と、隣接するバーの高さの差の平均値と、隣接するバーの高さの差の標準偏差と、隣接するバーの高さの差の変動係数とを対応付ける。さらに、グラフ情報テーブルは、判定結果と、スコア1と、スコア2と、再生成方法とを対応付ける。なお、実施例2に係るグラフ情報テーブルは、実施例1のグラフ情報テーブルと比べて、「再生成方法」を項目に有する点で相違する。
「再生成方法」は、グラフを再生成する場合の方法を表す。「再生成方法」には、x軸またはy軸を対数軸に変更してグラフを再生成する方法、または描画範囲を限定してグラフを再生成する方法が指定される。例えば、再生成方法が「xlog」の場合、x軸を対数軸に変更してグラフを再生成することを表す。また、再生成方法が「ylog」の場合、y軸を対数軸に変更してグラフを再生成することを表す。また、再生成方法が「0&20」の場合、x軸またはy軸が0〜20の描画範囲に限定してグラフを再生成することを表す。グラフ情報テーブルのデータ構造に関する説明は、以上の通りである。
第二表示部213は、描画範囲を限定してグラフを再生成する方法、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法のいずれかを選定する。以下、各再生成の方法について説明する。
描画範囲を限定してグラフを再生成する方法について説明する。第二表示部213は、1つまたは少数のバーに標本が集中する場合、例えば、標本が集中するバーのX軸またはY軸のレンジに描画範囲を限定してグラフを再生成する。例えば、第二表示部213は、「一つに集中」のラベルが付されたグラフに対し、90%以上の標本が集中するバーのレンジに描画範囲を限定してグラフを再生成する。
図15および図16を用いて、描画範囲を限定してグラフを再生成する方法の再生成処理について説明する。図15は、再生成処理を説明するための第1の図である。また、図16は、再生成処理を説明するための第2の図である。図15の例に示すグラフ13aは、縦軸(y軸)が頻度(Frequency)を表し、横軸(x軸)が各過程のデータ(process Data)を表す。例えば、グラフ13aは、x軸のレンジが0〜8のバー13a(1)に、90%以上の標本が集中している。抽出部211は、グラフ13aに「一つに集中」のラベルを付し、ラベル情報をグラフ情報テーブルの「スコア1」に格納する。
第二表示部213は、グラフ13aに「一つに集中」のラベルが付されたので、グラフ13aの再生成方法に関し、描画範囲を限定してグラフを再生成する方法を選定する。抽出部211は、グラフ情報テーブルの再生成方法に「0&8」を格納する。第二表示部213は、グラフ13a(1)の0〜8のレンジを拡大して再生成することで、図16の例に示されるグラフ13bを生成する。このように、第二表示部213は、描画範囲を限定してグラフを再生成することによって、標本が集中する範囲における標本の分布が明確となり、グラフの形状を把握しやすくすることができる。
なお、再生成処理の対象となる描画範囲は、標本の90%以上が集中しているx軸のレンジのみに範囲を限る必要は無い。例えば、データが集中しているバーと、隣接する左右のバーとを含めた3本分のバーが示すx軸の値の範囲の範囲としても良い。データが集中しているバーが、例えば、図15のグラフでx軸の値が20〜30のレンジであれば、ソレに隣り合う、10〜20のレンジ、30〜40のレンジを含めて、10〜40のレンジが描画範囲となる。
ここで、データが集中するバーがグラフのx軸で一番左もしくは一番右にあたる場合は、再描画の指定範囲、即ち、集中するバーに隣接する左または右のバーに相当するx軸の値の範囲は、元のグラフのx軸で表された描画範囲を逸脱することになる。その場合、はみ出した範囲は切り捨ててもよい。例えば、図15のグラフではx軸のレンジが0〜10の範囲のバーにデータが集中している。従って、単純に考えると、再描画範囲は左右のバーの範囲を含めた「-10&20」と指定することになる。元のグラフのx軸の描画範囲は0〜140であるので、−10〜0の範囲は切り捨て、再描画範囲は「0&20」とする。
次に、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法について説明する。例えば、第二表示部213は、1つのバーに60%〜90%の標本が集中しているグラフに対して、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法を適用する。また、第二表示部213は、bar変動係数Cbが2.5以上またはdif変動係数Cdが2.0以上のグラフに対して、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法を適用する。
また、第二表示部213は、例えば、左端のバーに標本が集中している場合に、x軸を対数軸に置き換える。また、第二表示部213は、左端のバー以外に標本が集中している場合に、y軸を対数軸に置き換える。なお、上述の再描画方法は、一例であり、適宜設計変更することが可能である。
図17および図18を用いて、グラフのx軸またはy軸を対数軸に置き換えて再生成する方法の再生成処理について説明する。図17は、再生成処理について説明するための第3の図である。また、図18は、再生成処理を説明するための第4の図である。図17の例に示すグラフ14aは、縦軸(y軸)が観測された標本数を表し、横軸(x軸)がテストデータ(test data)の数値を表す。例えばグラフ14aは、テストデータの数値が2.5付近のバーに60%〜90%の標本が集中している。
第二表示部213は、グラフ14aのテストデータの数値が2.5付近のバーに60%〜90%の標本が集中しているので、グラフ13aの再生成方法に関し、グラフのy軸を対数軸に置き換えて再生成する方法を選定する。抽出部211は、グラフ情報テーブルの再生成方法に「ylog」を格納する。第二表示部213は、グラフ14aのY軸を対数軸に置き換えて再生成し、図18の例に示されるグラフ14bを生成する。このように、第二表示部213は、グラフのx軸またはy軸を対数軸に置き換えて再生成することで、標本が集中するバー以外のバーの高さの差異が明確になり、グラフの形状を把握しやすくすることができる。
なお、第二表示部213は、再生成したグラフを他のグラフと識別可能に表示してもよい。例えば、第二表示部213は、再生成したグラフの背景に色を付し、再生成したグラフと再生成していないグラフとをひと目で識別できるように表示する。
(再生成の対象となるグラフの判定基準)
図19を用いて、再生成の対象となるグラフの判定基準について説明する。図19は、再生成の基準を説明するための図である。図19の例に示す表60の縦軸は、dif変動係数Cdである。また、表60の横軸は、bar変動係数Cbである。表60には、領域11aと領域11bが存在する。また、表60には、線分12aと線分12bとが存在する。
第二表示部213は、例えば、線分12aおよび線分12bの上側にグラフが位置する場合、再生成することでグラフの形状が明確になる可能性が高いので、グラフを再生成の対象とする。一方、第二表示部213は、線分12aの下側で、線分12bの上側にグラフが位置する場合、再生成してもグラフの形状が明確になる可能性が低いので、グラフを再生成の対象から除外する。なお、経験則上、線分12bの下側にグラフが位置することは少ない。
例えば、第二表示部213は、グラフが領域11aに位置する場合、線分12aの下側で、線分12bの上側にグラフが位置することになるので、再生成の対象から除外する。また、第二表示部213は、グラフが領域11bに位置する場合、再生成しなくてもグラフの形状が明確であることが多いので、再生成の対象としなくてもよい。
(実施例2の全体の処理の流れ)
図20を用いて、実施例2のグラフ表示装置200の全体の処理フローについて説明する。図20は、実施例2のグラフ表示装置の処理フローの例を示す図である。抽出部211は、グラフデータ領域221に含まれる各グラフデータに基づいてグラフを生成する(ステップS30)。抽出部211は、生成されたグラフ毎にbar変動係数Cbを求める(ステップS31)。抽出部211は、生成されたグラフ毎にdif変動係数Cdを求める(ステップS32)。抽出部211は、STEP1に係るラベル付け処理1を実行する(ステップS33)。抽出部211は、STEP2に係るラベル付け処理2を実行する(ステップS34)。
第二表示部213は、所定の基準を満たすグラフに対して再生成処理を実行する(ステップS35)。第二表示部112は、選択されたラベルに対応する各グラフを、再生成されたグラフを含めて出力部130の画面に列挙して表示する(ステップS36)。ステップS36の処理は、ステップS15の処理と同一である。
(再生成処理の流れ)
図21を用いて、再生成処理のフローについて説明する。図21は、再生成処理のフローの一例を示す図である。第二表示部213は、全てのグラフが処理済みであるか否かを判定する(ステップS40)。第二表示部213は、全てのグラフが処理済みである場合(ステップS40Yes)、再生成処理を終了する。一方、第二表示部213は、処理していないグラフが残っている場合(ステップS40No)、ステップS41の処理に移行する。
第二表示部213は、第一表示部212によって描画されたグラフを1つ取得する(ステップS41)。第二表示部213は、1つのバーに90%以上の標本が集中しているか否かを判定する(ステップS42)。第二表示部213は、1つのバーに90%以上の標本が集中している場合(ステップS42Yes)、標本が集中する1つのバーに描画範囲を限定してグラフを再生成する(ステップS43)。第二表示部213は、再生成したグラフを表示データ領域222に格納し(ステップS48)、ステップS40に戻る。一方、第二表示部213は、1つのバーに90%以上の標本が集中していない場合(ステップS42No)、ステップS44の処理に移行する。
第二表示部213は、1つのバーに60%以上の標本が集中しているか、または、bar変動係数Cbが2.5以上もしくはdif変動係数Cdが2.0以上であるか否かを判定する(ステップS44)。第二表示部213は、1つのバーに60%以上の標本が集中している場合、または、bar変動係数Cbが2.5以上もしくはdif変動係数Cdが2.0以上である場合(ステップS44Yes)、ステップS45の処理に移行する。一方、第二表示部213は、1つのバーに60%以上の標本が集中しておらず、かつ、bar変動係数Cbが2.5未満でdif変動係数Cdが2.0未満である場合(ステップS44No)、グラフを再生成処理の対象から除外し、ステップS40の処理に戻る。
第二表示部213は、グラフの左端のバーに標本が集中しているか否かを判定する(ステップS45)。第二表示部213は、グラフの左端のバー標本が集中している場合(ステップS45Yes)、グラフのx軸を対数軸に置き換えて再生成をする(ステップS46)。一方、第二表示部213は、グラフの左端のバー以外に標本が集中している場合(ステップS45No)、グラフのy軸を対数軸に置き換えて再生成をする(ステップS47)。第二表示部213は、再生成したグラフを表示データ領域222に格納し(ステップS48)、ステップS40に戻る。
(実施例2の効果)
グラフ表示装置200は、データ解析して得られる複数のグラフのうち、形状に関する第1の基準に基づいて1又は複数のグラフを抽出する抽出部211を有する。グラフ表示装置200は、抽出した1又は複数のグラフについて、所定のスケール変換処理を施し、所定のスケール変換後のグラフを表示する第二表示部213を有する。これにより、グラフの変化を分析しやすく表示できる。
第二表示部213は、複数のグラフのうち、所定のスケール変換処理が施された1又は複数のグラフと、所定のスケール変換処理が施されていないグラフとを識別可能に表示する。これにより、スケール変換前のグラフとスケール変換後のグラフを比較しやすく表示できる。
第二表示部213によって、所定のスケール変換処理が施された1又は複数のグラフは、所定のスケール変換処理が施された1又は複数のグラフの形状に応じた分類処理がなされて表示される。また、第二表示部213によって分類処理は、第1の基準に基づいて行われる。第1の基準は、グラフに含まれる各要素の高さのばらつきが所定以上であるか否かに関する基準を含んでもよい。第1の基準は、グラフに含まれる各要素間の高さの差分のばらつきが所定以上であるか否かに関する基準を含んでもよい。第1の基準は、グラフの1要素のデータの分布割合が所定以上であるか否かに関する基準を含んでもよい。これにより、グラフ表示装置200は、スケール変換処理を施すグラフの領域を精度よく特定することができる。
スケール変換処理は、グラフのデータが集中する要素が描画された範囲のスケールを拡大して再生成するものであってもよい。スケール変換処理は、グラフの1以上の軸を対数軸に変更して再生成するものであってもよい。これにより、グラフの変化を分析しやすく表示できる。
(実施例1および実施例2に関連する他の態様)
以下、上述の実施形態における変形例の一部を説明する。下記の変形例のみでなく、本開示の技術の本旨を逸脱しない範囲の設計変更は適宜行われうる。
実施例1のグラフ表示装置100は、グラフの変動が大きく凹凸が多い形状の場合に、グラフの形状が適切であると判定し、分類対象とする旨を説明したが、これに限定されない。例えば、グラフ表示装置100は、バーの高さが満遍なく同じ高さのグラフを分類対象としてもよい。これにより、例えば、工場で製造された製品の中で良質な製品のグラフを分類することができる。また、グラフ表示装置100は、「一つに集中」のラベルが付されたグラフのように外れ値が入ったグラフを分類対象としてもよい。これにより、例えば、工場で製造された製品に含まれる不良品に係るグラフを分類することができる。
実施例1のグラフ表示装置100は、グラフ情報テーブルにおいてスコア2に「○」を格納したグラフを第二のラベル付け処理の対象とし、「×」を格納したグラフを第二のラベル付け処理の対象から除外する旨説明したが、これに限定されない。例えば、グラフ表示装置100は、グラフ情報テーブルにおいてスコア2に「×」を格納したグラフを第二のラベル付け処理の対象としてもよい。すなわち、グラフ表示装置100は、第1のラベル付け処理または第2のラベル付け処理を独立して実行してグラフを分類してもよい。
実施例2のグラフ表示装置200は、再生成後のグラフを表示する際に、再生成前のグラフを表示データ領域222に残してもよい。これにより、再生成前のグラフと再生成後のグラフとを比較することができる。例えば、再生成後にデータ分析に有用なグラフとなった場合に、再生成前のグラフを参考にして、グラフを次回描画する際の描画方法を検討することができる。
実施例2の抽出部211は、第二表示部213によって再生成されたグラフを分類対象としてもよい。これにより、例えば、再生成された棒グラフが多数あった場合に、グラフを効率的に分類できる。
実施例2の第二表示部213は、「一つに集中」「一部集中」のラベルが付されたグラフに対して再生成することを決定する旨を説明したが、これに限定されない。第二表示部213は、再生成するグラフの条件を適宜変更することができる。
実施例1のグラフ表示装置100および実施例2のグラフ表示装置200は、グラフを形状に応じて分類する旨を説明したが、これに限定されない。例えば、グラフ表示装置100および実施例2のグラフ表示装置200は、折れ線グラフ、ヒストグラム等を形状に応じて分類してもよい。
すなわち、以上の実施例では、グラフは、例えばデータを各項目の出現回数を示す棒グラフであるバープロット、もしくは、データ区間ごとに該当するデータの分布を示す棒グラフであるヒストグラムである。しかし、グラフは、データを多次元で視覚的に表示するものであれば、いずれであってもよい。
上述したグラフ表示装置100は、1台のコンピュータに実装されてもよく、また、複数台のコンピュータによるクラウドに実装されてもよい。例えば、グラフ表示装置100は、クラウドシステムに含まれる複数台のコンピュータが、図1に示した抽出部111および表示部112と同様の機能を発揮する。
また、実施例1および実施例2に示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
(グラフ表示装置のハードウェア構成)
図22は、実施例1のグラフ表示装置のハードウェア構成を示す図である。図22の例が示すように、コンピュータ300は、各種演算処理を実行するCPU301と、ユーザからのデータ入力を受け付ける入力装置302と、モニタ303とを有する。また、コンピュータ300は、記憶媒体からプログラム等を読み取る媒体読取装置304と、他の装置と接続するためのインターフェース装置305と、他の装置と無線により接続するための無線通信装置306とを有する。また、コンピュータ300は、各種情報を一時記憶するRAM307と、ハードディスク装置308とを有する。また、各装置301〜308は、バス309に接続される。
ハードディスク装置308には、例えば図1に示した抽出部111および表示部112の各処理部と同様の機能を有するグラフ表示プログラムが記憶される。また、ハードディスク装置308には、グラフ表示プログラムを実現するための各種データが記憶される。
CPU301は、ハードディスク装置308に記憶された各プログラムを読み出して、RAM307に展開して実行することで各種の処理を行う。これらのプログラムは、コンピュータ300を、例えば図1に示した抽出部111および表示部112として機能させることができる。
なお、上記の情報処理プログラムは、必ずしもハードディスク装置308に記憶されている必要はない。例えば、コンピュータ300が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ300が読み出して実行するようにしてもよい。コンピュータ300が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN(Local Area Network)等に接続された装置にこのプログラムを記憶させておき、コンピュータ300がこれらからプログラムを読み出して実行するようにしてもよい。なお、実施例2のグラフ表示装置200は、図22の例に示される実施例1のグラフ表示装置100と同様のハードウェア構成を有してもよい。
図23は、コンピュータで動作するプログラムの構成例を示す。コンピュータ300において、図23に示すハードウェア群26(301〜309)の制御を行なうOS(オペレーティング・システム)27が動作する。OS27に従った手順でCPU301が動作して、ハードウェア群26の制御・管理が行なわれることにより、アプリケーションプログラム29やミドルウェア28に従った処理がハードウェア群26で実行される。さらに、コンピュータ300において、ミドルウェア28またはアプリケーションプログラム29が、RAM307に読み出されてCPU301により実行される。
CPU301により情報処理機能が呼び出された場合、ミドルウェア28またはアプリケーションプログラム29の少なくとも一部に基づく処理を行なうことで、制御部110の機能が実現される。情報処理機能は、それぞれアプリケーションプログラム29自体に含まれてもよいし、アプリケーションプログラム29に従って呼び出されることで実行されるミドルウェア28の一部であってもよい。