JP2020149498A - データ処理装置、表示制御システム、データ処理方法およびプログラム - Google Patents
データ処理装置、表示制御システム、データ処理方法およびプログラム Download PDFInfo
- Publication number
- JP2020149498A JP2020149498A JP2019047659A JP2019047659A JP2020149498A JP 2020149498 A JP2020149498 A JP 2020149498A JP 2019047659 A JP2019047659 A JP 2019047659A JP 2019047659 A JP2019047659 A JP 2019047659A JP 2020149498 A JP2020149498 A JP 2020149498A
- Authority
- JP
- Japan
- Prior art keywords
- data
- dimension
- dimensions
- display
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/20—Drawing from basic elements, e.g. lines or circles
- G06T11/206—Drawing of charts or graphs
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】平行座標により多次元データを可視化する場合、データの次元数が多い、または、次元数およびサンプル数の両方が多いデータを対象に、データ転送および描画の処理負荷を低減させながら、インタラクティブな操作により高速なレスポンス性能を実現するデータ処理装置、表示制御システム、データ処理方法及びプログラムを提供する。【解決手段】データ処理装置200は、生成部204を備える。生成部204は、N次元(Nは自然数)のうちユーザがインタラクティブな操作で指定したM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成する。生成部204は、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する。【選択図】図1
Description
本発明の実施形態は、データ処理装置、表示制御システム、データ処理方法およびプログラムに関する。
例えばセンサーなどで収集したデータを記憶装置に転送し、記憶装置に記憶された多数のデータを表示装置(ディスプレイ)に可視化する技術が知られている。センサーの多様化およびストレージ技術の進化に伴い、データが容易に収集される一方、描画するデータ量が増えると、データの転送および描画の処理負荷が増大し、インタラクティブな可視化システムのボトルネックになっている。
収集するデータは、データの次元(項目、種類などに相当)を列とし、各次元のデータのサンプルを行とするテーブルデータとして解釈することができる。データ量の増大は、次元数の増加、および、データのサンプル数の増加の両方を含む。
Gregorio Palmas et al., "An Edge-Bundling Layout for Interactive Parallel Coordinates", 2014 IEEE Pacific Visualization Symposium, 57-64.
Gurminder Kaur et al., "Bifocal Parallel Coordinates Plot for Multivariate Data Visualization",Proceedings of the 13th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications - Volume 3: IVAPP, pages 176-183.
データの次元数が多い、または、次元数およびサンプル数の両方が多いデータを対象に、データ転送および描画の処理負荷を低減させながら、インタラクティブな操作により高速なレスポンス性能を実現可能な平行座標可視化技術が求められている。
実施形態のデータ処理装置は、生成部を備える。生成部は、N次元(Nは自然数)のうちユーザがインタラクティブな操作で指定したM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成する。生成部は、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する。
以下に添付図面を参照して、この発明にかかるデータ処理装置の好適な実施形態を詳細に説明する。
データの可視化技術としては、例えば、2次元(X軸+Y軸)の表示空間上に、1次元または2次元のデータを可視化する方法が比較的簡単である。3次元データの可視化は、X軸およびY軸にZ軸を加えることで、視点を変えながら、2次元のディスプレイ平面上に可視化結果を表示する方法である。このような方法は、物理の実体解析の可視化、および、科学的シミュレーションデータの可視化などに使われる。
3次元以上の多次元データの可視化技術としては、例えば、平行座標(Parallel Coordinates)および散布図行列(Scatter Matrix)が使われる。平行座標は、複数の次元に対応する複数の平行軸を一定間隔に配置して、データのサンプルを折れ線で表現する。平行座標は、多次元データをわかりやすく表現できる。
平行座標による可視化では、主にサンプル数の増加による視認性の悪化、および、次元の増加による描画性能の低下が問題になる。一般的に、平行座標は、折れ線グラフ、散布図、および、バーチャートなどより描画性能が低い。例えば、SVG(Scalable Vector Graphics)フォーマットで、汎用のコンピュータ等のブラウザ上に平行座標のグラフを描画する場合、20〜30次元でサンプル数が数百の多次元データであっても、操作レスポンスの遅延が顕著になる。
次元数が多い場合の対処方法として、データの次元を削減する方法がある。ただし、次元を削減すると、ヒントとなる重要な次元が可視化されなくなるおそれがある。特に、サンプル数と次元数の両方が多いデータを平行座標で可視化する場合、リサンプリングまたはクラスタリングでサンプルを一定量以下に限定してデータを削減する方法は、計算量が大きいほか、元のデータを忠実に可視化できるかが問題となる。
また、機械学習などの方法で重要な次元を探す方法もある。しかしこのような自動化方法は、ユーザのドメイン知識を入れ難く、ユーザにとって効率的なデータ分析が実現できないかもしれない。データの傾向を把握するような初期的なデータ分析を目的とする可視化は、データを加工して可視化するより、可能な限りデータをそのまま可視化し、俯瞰による確認および詳細の確認を共に実現可能とすることが重要である。
本実施形態にかかるデータ処理装置は、N次元(Nは自然数)のうち指定されたM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成し、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する。これにより、次元数の多いデータ、または、次元数とサンプル数の両方が多いデータに対して、インタラクティブな平行座標の可視化を実現することが可能となる。
以下では、次元を列に対応させ、各次元のデータのサンプルを行に対応させたテーブルデータとして多次元データを扱う。また、M次元のデータの抽出元となるN次元の多次元データを高次元データと呼び、高次元データから抽出されたM次元のデータを低次元データと呼ぶ場合がある。多次元データを用いて機械学習を行うときに、次元が変数として扱われる場合がある。また、平行座標では、複数の軸それぞれが多次元のいずれかの次元に対応し、各軸では対応する次元のデータが表示される。
例えば、平行座標による可視化が可能な変数は、連続変数(continuous variable)と順序変数(ordinal variable)である。名義変数(nominal variable)は、何らかの順序(例えば、データのインデックス順)を決めて順序変数として平行座標で可視化することができる。汎用のパーソナルコンピュータではインタラクティブな平行座標による可視化は、数十次元、かつ、数百サンプル数が限界になる。本実施形態によれば、この次元数およびサンプル数より大きい多次元データを対象として平行座標を可視化することが可能となる。
図1は、本実施形態にかかる表示制御システムの構成の一例を示すブロック図である。図1に示すように、本実施形態にかかる表示制御システムは、表示処理装置100と、データ処理装置200とが、インターネットおよびLAN(ローカルエリアネットワーク)等のネットワーク300で接続された構成となっている。ネットワーク300は、無線および有線などのどのような接続形態のネットワークであってもよい。
表示処理装置100は、例えばパーソナルコンピュータなどのクライアント装置である。データ処理装置200は、例えばサーバ装置である。表示処理装置100およびデータ処理装置200は、それぞれ物理的に1つの装置によって構成されてもよいし、物理的に複数の装置によって構成されてもよい。例えばデータ処理装置200は、クラウド環境上のサーバ装置として構築されてもよい。
また、図1に示す表示制御システムの構成は一例であり、これに限られるものではない。例えば、表示処理装置100の各部とデータ処理装置200の各部とを1つの装置(例えばデータ処理装置200)内に備える構成としてもよい。この場合、共通化できる機能(例えば、記憶部121と記憶部221)は共通化してもよい。
表示処理装置100は、表示部111と、記憶部121と、受付部101と、通信制御部102と、表示制御部103と、を備えている。
表示部111は、データを表示する液晶ディスプレイなどの表示装置である。表示部111は、表示制御部103の制御に従い、例えば、データ処理装置200から受信した多次元データを平行座標により表示する。
記憶部121は、表示処理装置100による各種処理で用いられる各種データを記憶する。例えば記憶部121は、データ処理装置200から受信した、表示部111に表示するためのデータを記憶する。記憶部121は、フラッシュメモリ、メモリカード、RAM(Random Access Memory)、HDD(Hard Disk Drive)、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
受付部101は、ユーザ等による各種データの入力を受け付ける。例えば受付部101は、N次元のうち表示するM次元の指定、および、各次元の絞り込み条件の指定などのユーザ操作を受け付ける。ユーザ等によるデータの入力方法はどのような方法であってもよいが、例えば、マウス、キーボード、および、タッチパネルなどの入力装置により入力する方法を用いることができる。表示部111が、データを入力するためのタッチパネルを備えるように構成してもよい。
通信制御部102は、データ処理装置200などの外部装置との間の通信を制御する。例えば通信制御部102は、受付部101により受け付けられた情報(指定されたM次元、絞り込み条件など)を、データ処理装置200に送信する。また通信制御部102は、データ処理装置200から、平行座標により表示するためのデータを受信する。
表示制御部103は、表示部111に対するデータの表示を制御する。例えば表示制御部103は、データ処理装置200で生成された、平行座標により表示するためのデータを表示部111に表示させる。
上記各部(受付部101、通信制御部102、および、表示制御部103)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPU(Central Processing Unit)などのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のIC(Integrated Circuit)などのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
次に、データ処理装置200の構成例について説明する。図1に示しように、データ処理装置200は、記憶部221と、通信制御部201と、算出部202と、ソート部203と、生成部204と、を備えている。
記憶部221は、データ処理装置200による各種処理で用いられる各種データを記憶する。例えば記憶部221は、表示対象となる多次元データ、および、表示処理装置100から送信されたデータ(指定されたM次元、絞り込み条件など)を記憶する。記憶部221は、フラッシュメモリ、メモリカード、RAM、HDD、および、光ディスクなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
通信制御部201は、表示処理装置100などの外部装置との間の通信を制御する。例えば通信制御部201は、表示処理装置100から送信された情報(指定されたM次元、絞り込み条件など)を受信する。また通信制御部201は、平行座標により表示するためのデータを表示処理装置100に送信する。
算出部202は、N次元のデータから表示するために抽出する次元(抽出次元)の個数を表す抽出次元数Mを算出する。例えば算出部202は、平行座標の表示領域の幅に基づいて、表示領域に表示したときにデータが視認しやすいような個数の次元数を抽出次元数Mとして算出する。
ソート部203は、N次元のデータの各次元を予め定められた規則に従った順序となるように並べ替えた次元リストを生成する(ソーティング)。予め定められた規則は、どのような規則であってもよいが、例えば、データ値の分散または欠損値に基づく規則、次元間の相関に基づく規則、および、機械学習により得られるモデルを用いる規則などを適用できる。
生成部204は、指定されたM次元のデータを平行座標により表示するためのデータを生成する。また生成部204は、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する。さらに生成部204は、M次元の各次元の複数のデータを、より少ない個数の変換データに変換するリサンプリングを行ってもよい。リサンプリングを行った場合、生成部204は、変換データを平行座標により表示するためのデータを生成する。
上記各部(通信制御部201、算出部202、ソート部203、および、生成部204)は、例えば、1または複数のプロセッサにより実現される。例えば上記各部は、CPUなどのプロセッサにプログラムを実行させること、すなわちソフトウェアにより実現してもよい。上記各部は、専用のICなどのプロセッサ、すなわちハードウェアにより実現してもよい。上記各部は、ソフトウェアおよびハードウェアを併用して実現してもよい。複数のプロセッサを用いる場合、各プロセッサは、各部のうち1つを実現してもよいし、各部のうち2以上を実現してもよい。
次に、このように構成された本実施形態にかかる表示制御システムによるデータ可視化処理についてさらに詳細に説明する。図2は、本実施形態におけるデータ可視化処理の一例を示すフローチャートである。
データ処理装置200の算出部202は、平行座標の表示領域の幅から、抽出次元数Mを算出する(ステップS101)。表示領域の幅は、固定値であってもよいし、ユーザが指定可能としてもよい。
図3は、平行座標の表示領域の一例を示す図である。縦線が軸に相当する。各軸には、ラベル301が表示される。平行座標では、軸が多くなると、軸間の距離(軸間スペース)が小さくなり、軸間の折れ線の相関関係が見えにくくなる。表示する軸の数は、軸を垂直に描く場合は平行座標の表示領域の幅が上限となる。例えば、幅が1000ピクセルの表示領域では、1000個以上の軸を描画しても軸が重なり、平行座標の軸および折れ線が見えにくくなる。また、軸のラベル、および、隣接する複数の軸間の折れ線を見やすくするために、軸間スペースは軸の高さの3分の1以上にすることが望ましい。
このため、算出部202は、表示領域の幅から、同時に表示する軸の数、すなわち抽出次元数Mを算出する。算出部202は、例えば、表示領域の幅を、軸間スペース(軸間の距離)で除算した値(割り切れない場合は自然数に丸め込んだ値を用いてもよい)を、抽出次元数Mとして算出する。例えば、平行座標の表示領域の幅が1000ピクセルであり、軸間スペースが50ピクセルである場合、算出部202は、Mを20(=1000/50)と算出する。軸間スペースは、固定値であってもよいし、ユーザが指定可能としてもよい。例えばユーザの操作で表示領域の幅や高さの変動により軸間スペースの値が変更された場合は、ステップS101に戻り、算出部202はMの値を再計算する。
図2に戻り、ソート部203は、予め定められた規則に従った順序となるように、すべての次元を並べ替える(ステップS102)。次元を並べ替えるのは、ユーザが所望の次元を効率的に探すことができるようにするためである。
図4は、平行座標による表示画面400の一例を示す図である。表示画面400は、フォーカス指定画面410とともに表示されてもよい。フォーカス指定画面410は、並べ替えられたすべての次元のうち抽出次元の位置(フォーカス位置)を指定するための画面である。なおフォーカス指定画面410は、表示処理装置100とは別の装置上に表示されてもよい。図4のフォーカス指定画面410では、左から右に向けて、重要度に応じて並べ替えられたすべての次元がスライドバーにマッピングされる。ユーザは、すべての次元のうち、スライドバーのノブ411により抽出次元を指定することができる。
なお図4は、各サンプルに対応する折れ線の太さが相互に異なるように表示されているが、通常は、折れ線の色が相互に異なるように表示される。折れ線の色を割り当てる次元がカラーリング次元401である(詳細は後述)。図4では、カラーリング次元401の軸の色の変化がハッチングの変化で表現されている。
ノブ411の幅を変更することにより、抽出次元数Mをユーザが指定できるようにしてもよい。この場合、算出部202は、指定された抽出次元数Mを表示できるような軸間スペースの値を算出してもよい。例えば算出部202は、表示領域の幅を、指定された抽出次元数Mで除算した値を軸間スペースの値として算出してもよい。
次元の順序は、例えば、次元の重要度の降順とする。すなわち、ソート部203は、次元の重要度の順に並べ替えるという規則に従い、次元を並べ替える。これにより、ユーザは、重要度の高い次元から重要度の低い次元をスライドしながら確認可能となる。
次元ごとの重要度の算出方法はどのような方法であってもよい。簡単な方法として、例えば、次元ごとのデータ値の分散の大きさを重要度として算出する方法、および、次元ごとのデータ値の欠損値のカウント数を重要度として算出する方法などを用いることができる。分散(欠損値のカウント数)が大きい方、および、分散(欠損値のカウント数)が小さい方のいずれを重要度が高いとするかは、用途に応じて決定してよい。
複雑な方法としては、従属変数として指定された次元y(第1次元の一例)に対する、説明変数としての他の次元xの相関度または感度を重要度として算出する方法を適応できる。例えば、従属変数である次元yと、説明変数である複数の次元xそれぞれとのペア相関の相関度を重要度として算出してもよい。
また、ソート部203は、相関ルール(Association Rule)データマイニング、決定木、および、ランダムフォリストなどの機械学習モデルを用いてもよい。機械学習モデルは、指定された次元yに対する複数の次元xそれぞれの重要度を算出するように予め学習により構築される。ソート部203は、このような機械学習モデルを用いて、指定された次元yに対する各次元xの重要度を算出する。
ユーザが、ソート部203による並び替えの規則を変更可能としてもよい。規則が変更された場合は、ステップS102に戻り、ソート部203は、変更後の規則に従った並べ替えを実行する。これにより、ユーザの意図を反映した重要度の算出が可能となる。
図2に戻り、生成部204は、すべての次元から常時表示する次元(常時表示次元)を抽出する(ステップS103)。常時表示次元は、例えばユーザが興味を有する次元である。常時表示次元は、ユーザの意図が反映された重要な情報として、次元の順序に関わらず、平行座標で表示される。
常時表示次元は、ユーザが明示的に指定してもよいし、各種のユーザ操作から生成部204が推定してもよい。常時表示次元(第1次元の一例)は、少なくともカラーリング次元および絞り込み条件が設定された次元(絞り込み次元)を含む。
カラーリング次元は、平行座標のカラーリングに使われる次元である。カラーリング次元のデータの範囲(最小値〜最大値)が、指定された連続するカラー範囲にマッピングされる。すなわち、各サンプルについて、カラーリング次元の値が、あるカラー値に対応づけられる。カラーリング次元の設定により各サンプルに対応する折れ線の色が決められる。
なお、色以外の方法で折れ線の表示態様が決定されてもよい。例えば生成部204は、折れ線の太さ、形状、および、点滅の有無などの表示態様を、データの値に応じて決定してもよい。
絞り込み次元は、絞り込み条件が指定された次元である。絞り込み条件は、ある次元のデータの範囲を絞り込むために指定される条件である。絞り込み条件の指定方法はどのような方法であってもよいが、例えば表示画面上でデータの範囲を指定する方法などを適用できる。図4では、矩形404、405が、絞り込み条件として指定されたデータの範囲を示す。ユーザは、例えば矩形404、405の位置または高さを変更することで絞り込み条件を変更できる。また図4では、矩形404、405などのように絞り込み条件が指定された次元402が、絞り込み次元に相当する。
平行座標の各次元のデフォルトの表示範囲は、例えば各次元のデータの全範囲となる。すなわち、次元の絞り込み条件が設定される前は、データの全範囲が可視化対象である。絞り込み次元は、その次元の全範囲のデータのうち一部が絞り込み条件に応じて選択され、選択されたデータが可視化対象となる。なお、絞り込み条件は複数指定されてもよい。同一次元の複数の絞り込み条件は論理和が取られて適用される。異なる次元の絞り込み条件は論理積が取られて適用される。
絞り込み条件が変更された場合は、ステップS102に戻り、ソート部203は、変更後の絞り込み条件に従った並べ替えを実行する。
図2に戻り、生成部204は、平行座標に表示する次元(表示次元)を決定する(ステップS104)。表示次元は、常時表示次元と、抽出次元と、を含む。生成部204は、次元リストから、フォーカス指定画面410などにより指定されたフォーカス位置に基づきM個の抽出次元を決定することができる。常時表示次元の個数をKとすると、生成部204は、M’個(M’<=M+K)の表示次元を決定する。なお、生成部204は、常時表示次元と重複しないように、常時表示次元を除いた次元を抽出する。
ここで、フォーカス位置を指定するユーザインタフェースの例について説明する。フォーカス位置を指定するユーザインタフェースとしては、例えば、上述の図4のフォーカス指定画面410を用いる方法、および、図5に示す表示画面500を用いる方法がある。
図4の例では、上述のように、フォーカス指定画面410によりフォーカス位置が指定される。なお図4に示すように、表示画面400は、抽出次元403以外に、常時表示次元であるカラーリング次元401および絞り込み次元402を含む。抽出次元数Mは、表示領域の幅および軸間スペースに基づいて算出される。従って、表示次元の個数M’<=M+Kの軸を表示するために必要な幅は、表示領域の幅より大きくなる。図4では、表示できない軸を確認可能とするためにスライドバーを用いる表示画面400の例が示されている。スライドバーを用いる代わりに、M’<=M+K個の表示次元(軸)を表示可能とするために軸間スペースを再計算するように構成してもよい。
図5に示す表示画面500は、表示領域の幅の中に、M’<=M+K個の表示次元のすべてを表示する画面の例である。ユーザは、下部のスクロールバーのノブ501により、表示領域に表示する抽出次元の位置(フォーカス位置)を指定することができる。図5では、折れ線の色が黒とされているが、通常は、カラーリング次元(例えば左端の次元)のデータの各サンプルに割り当てられた色の折れ線が表示される。また、下部のスライドバーは、高次元のすべての範囲を示しているが、上部の平行座標可視化表示は、M’次元のみが表示される。すなわち、図1の表示処理装置100は、低次元(M’次元)データを取得して、平行座標を描画する。また、スライドバーが移動された場合は、表示処理装置100は、移動後のスライドバーの位置に対応する低次元データ(および常時表示次元のデータ)を抽出し、平行座標表示を更新する。
また、上述の抽出次元および絞り込み次元以外にも、ユーザが順序とともに表示する次元を指定可能としてもよい。ユーザは、例えば平行座標の表示画面上で、次元Aと次元Bの重要度の順序に関わらず、ある次元Aを次元Bの前または後ろに配置することを指定する。例えば記憶部121は、指定された次元Aと次元Bのペア(ペア次元)を記憶する。生成部204は、ペア次元の一方が表示次元に含まれれば、他方の次元を表示次元へ追加する。次元リスト内の次元の順序(重要度の順序)に関わらず、平行座標では、ペア次元で指定された各次元の前後の順序が優先して保持される。
図2に戻り、生成部204は、決定したM’<=(M+K)個の表示次元のデータを、高次元(N次元)データから抽出する(ステップS105)。例えば高次元データの記憶方式として列指向データベースを用いれば、次元数およびサンプル数が多い大規模データであっても、低次元データを高速に抽出可能となる。
これまでの処理(ステップS101〜ステップS105)で、高次元データから低次元データが抽出される。しかし低次元データであっても、サンプル数(テーブルデータの行数)が多くなると、転送および描画コストが大きくなり、また、平行座標の折れ線のクラッター(Clutter)が生じる場合がある。
そこで、生成部204は、サンプル数が多いデータに対してリサンプリングを実行し、データ量を減らしてもよい(ステップS106)。データのリサンプリングは、全サンプル(レコード)から代表的なサンプルを抽出または算出する処理である。平行座標を効率的に可視化するためには、生成部204は、重なる折れ線を検出して代表的な折れ線のみを表示する。厳密に計算する方法は、計算量が増大するため、インタラクティブな平行座標の可視化に不向きである。
リサンプリングの1つの方法として、サンプル間の距離に応じて多次元データをグループに分けて、各グループの次元ごとの代表値(最大値、最小値、平均値、中間値、または、ランダムに抽出された値など)を求める方法がある。
リサンプリング後のサンプル数は、次元数の増加に対して大よそ指数的に増加する。従って、N次元データのリサンプリングと比較して、M’個の表示次元のデータのリサンプリングは、リサンプリング後のサンプル数が格段に少なくなる。
図6は、データキューブを用いたリサンプリングの一例を説明するための図である。図6は、説明の便宜上、3次元データをリサンプリングする例を示すが、本実施形態は、3次元より多い次元のデータを対象とすることができる。
各次元に対して例えば平行座標の表示領域の高さを示すピクセル数と同じ個数のセルを有するようなデータキューブが用いられる。図6では、表示領域の高さが5ピクセルであり、各次元に対応するセルの個数が5である例が示されている。通常は、表示領域の高さは5ピクセルより大きい。5つのセルそれぞれは、平行座標の高さを5分割した範囲のいずれかに対応づけられる。各セルに対して、対応する範囲のデータの代表値(最大値、最小値、平均値、中間値、または、ランダムに抽出された値など)が算出される。
ユーザ操作により、平行座標の表示領域の高さが変更された場合は、生成部204は、再びデータをリサンプリングする。
リサンプリングを実行するか否かは、ユーザ等が指定してもよいし、サンプル数が閾値を超えたか否かにより判断してもよい。サンプル数が少ないデータを対象とする場合等であれば、リサンプリングを実行しなくてもよい。
図2に戻り、通信制御部201は、生成部204により生成されたデータ(低次元データまたはリサンプリング後のデータ)を、表示処理装置100に送信する(ステップS107)。
表示処理装置100の通信制御部102は、データ処理装置200からデータを受信する。表示制御部103は、受信されたデータを、平行座標により可視化する(ステップS108)。表示制御部103は、例えば、上述の図4または図5の表示画面のようにして、平行座標により可視化したデータを表示する。
表示処理装置100は、ユーザにより操作可能な入力装置(マウス、キーボード、タッチパネルなど)を備える。ユーザは、平行座標の表示を確認しながら、入力装置を用いて、平行座標の表示上で、各次元の絞り込み条件の設定、および、カラーリング次元の変更などの操作が可能である。これにより、インタラクティブな平行座標の可視化が実現できる。
このように本実施形態では、計算パワーとストレージ容量が大きいデータ処理装置200が、次元数およびサンプル数の多いデータの処理を実行し、その処理結果をユーザが容易にアクセスできる端末装置である表示処理装置100に送信し、表示処理装置100が描画処理を実行する。このようにデータ処理と可視化(表示処理)を分散して実行することにより、ユーザ操作に対するレスポンスの遅延を低減し、表示制御システム全体としてのパフォーマンスの向上を図ることができる。
処理の分散方法はこれに限られるものではない。例えばデータ処理装置200が平行座標の描画処理まで実行して、描画処理結果を示すデータ(画面データ)を表示処理装置100に送信してもよい。この場合、表示処理装置100の表示制御部103は、受信した画面データを表示部111に表示する処理のみを実行すればよい。また、データ処理装置200および表示処理装置100が、それぞれ描画処理の一部を実行し、最終的な描画処理の結果(画面データ)を表示処理装置100が表示するように構成してもよい。
ステップS101からステップS108までが、平行座標の可視化のメインフローである。ステップS109からステップS113までが、ユーザ操作をフィードバックする処理に相当する。
例えば、表示処理装置100の受付部101は、入力装置によるユーザの操作を受け付けた場合、受け付けた操作を示す操作情報を、通信制御部102を介してデータ処理装置200に送信する(ステップS109)。
例えばデータ処理装置200の生成部204は、操作情報に基づいて、ユーザの操作が表示領域の高さの変更を示すか否かを判定する(ステップS110)。ユーザの操作が表示領域の高さの変更を示す場合(ステップS110:Yes)、生成部204は、変更後の高さに基づいてデータのリサンプリングを実行し(ステップS106)、以降の処理が繰り返される。例えば生成部204は、変更後の表示領域の高さ(ピクセル数)に対応する個数のセルを有するデータキューブによりデータをリサンプリングする。
ユーザの操作が表示領域の高さの変更を示さない場合(ステップS110:No)、生成部204は、ユーザの操作がフォーカス位置の変更を示すか否かを判定する(ステップS111)。ユーザの操作がフォーカス位置の変更を示す場合(ステップS111:Yes)、生成部204は、変更後のフォーカス位置に基づいてM個の抽出次元を決定し、決定した抽出次元を含むように表示次元を新たに決定し(ステップS104)、以降の処理が繰り返される。
ユーザの操作がフォーカス位置の変更を示さない場合(ステップS111:No)、生成部204は、ユーザの操作が、絞り込み条件、カラーリング次元、または、並び替えの規則の変更を示すか否かを判定する(ステップS112)。ユーザの操作が、絞り込み条件、カラーリング次元、または、並び替えの規則の変更を示す場合(ステップS112:Yes)、ソート部203による並べ替えの処理(ステップS102)から処理が繰り返される。
ユーザの操作が絞り込み条件、カラーリング次元、または、並び替えの規則の変更を示さない場合(ステップS112:No)、生成部204は、ユーザの操作が、表示領域の幅の変更を示すか否かを判定する(ステップS113)。ユーザの操作が、表示領域の幅の変更を示す場合(ステップS113:Yes)、算出部202による抽出次元数Mの算出処理(ステップS101)から処理が繰り返される。
ユーザの操作が、表示領域の幅の変更を示さない場合(ステップS113:No)、ステップS110に戻り、次のユーザ操作が受け付けられるまで待機する。このようにして、ユーザ操作がフィードバックされ、ユーザ操作に応じて平行座標の表示が更新される。
なお、ステップS110〜ステップS113の判定処理の順序はこれに限られず、どのような順序であってもよい。また、ユーザは、ステップS110〜ステップS113に対応する各操作の一部または全部をまとめて指定することができる。この場合、表示処理装置100は、複数の操作を示す操作情報をデータ処理装置200に送信してもよい。データ処理装置200は、例えば操作情報に基づいて、ステップS110〜ステップS113の判定処理の一部または全部をまとめて実行してもよい。複数の判定処理で条件が満たされる場合、複数の判定処理の結果に応じて遷移する複数のステップのうち、最初に実行されるステップに戻り、処理が繰り返される。
図7は、平行座標による表示画面の他の例を示す図である。図7に示す表示画面700は、次元701を従属変数yであるカラーリング次元とし、カラーリング次元に対する説明変数である他の次元とともに平行座標に表示する例である。次元701は、平行座標の左端の次元として表示される。次元702は、他の次元のうち絞り込み条件703が設定された次元(常時表示次元)である。カラーリング次元(次元701)以外の表示次元(常時表示次元および抽出次元)は、カラーリング次元に対する重要度の順、またはペア次元の順に平行座標の中に表示される。カラーリング次元701が常に左端に表示していることは、他の次元xより、次元yが自身との関連度が一番高いとの意味合いを含んでいる。
例えばユーザがカラーリング次元として次元701を選択すると、次元701を従属変数yとして、機械学習モデルなどにより、説明変数xとなる他の次元の重要度が新たに算出される。他の次元は、重要度の順に並べ替えられる。並べ替えられた次元のうち、ユーザが指定したフォーカス位置に対応する次元(抽出次元)が抽出される。
本実施形態では、スクロールバーのノブ704によりフォーカス位置が変更されたとしても、常時表示次元である次元701(カラーリング次元)および次元702(絞り込み次元)は常に表示される。例えば、図7の状態からノブ704が右に移動された場合、次元701および次元702はそのまま表示が維持され、次元701と次元702以外の表示次元のみが、新たなフォーカス位置に対応して更新される。ただし、各次元702は、重要度順に従って表示されるため、順番が更新される。このような構成により、ユーザが興味を有する次元を常に表示するとともに、重要度の順で各次元のデータを平行座標により表示することができる。
以上のように、本実施形態にかかるデータ処理装置は、多次元データ(N次元データ)のすべての次元を平行座標に表示せず、より低次元のデータを抽出して平行座標に表示する。また、ユーザの操作に応じて、重要度の順に並べられた異なる次元のデータで平行座標の表示を更新する。これにより、データの次元数が多い、または、次元数およびサンプル数の両方が多いデータであっても、データ転送および描画の処理負荷を低減させながら、インタラクティブな操作により高速なレスポンス性能を実現可能となる。
次に、本実施形態にかかる各装置(表示処理装置、データ処理装置)のハードウェア構成について図8を用いて説明する。図8は、本実施形態にかかる装置のハードウェア構成例を示す説明図である。
本実施形態にかかる装置は、CPU51などの制御装置と、ROM(Read Only Memory)52およびRAM53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
本実施形態にかかる装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
本実施形態にかかる装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
さらに、本実施形態にかかる装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施形態にかかる装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
本実施形態にかかる装置で実行されるプログラムは、コンピュータを上述した装置の各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100 表示処理装置
101 受付部
102 通信制御部
103 表示制御部
111 表示部
121 記憶部
200 データ処理装置
201 通信制御部
202 算出部
203 ソート部
204 生成部
221 記憶部
300 ネットワーク
101 受付部
102 通信制御部
103 表示制御部
111 表示部
121 記憶部
200 データ処理装置
201 通信制御部
202 算出部
203 ソート部
204 生成部
221 記憶部
300 ネットワーク
Claims (12)
- N次元(Nは自然数)のうち指定されたM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成する生成部を備え、
前記生成部は、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する、
データ処理装置。 - N次元のデータの各次元を予め定められた規則に従った順序となるように並べ替えるソート部をさらに備え、
前記生成部は、
N次元のうち指定されたM次元(MはNより小さい自然数)のデータを前記順序に従って並べて平行座標により表示するためのデータを生成し、
M次元の指定が変更された場合は、変更後のM次元のデータを前記順序に従って並べて平行座標により表示するためのデータを生成する、
請求項1に記載のデータ処理装置。 - 前記ソート部は、N次元のうち指定された第1次元に対する感度が大きい順に各次元を並べ替える、
請求項2に記載のデータ処理装置。 - 前記ソート部は、N次元のうち前記平行座標の折れ線の表示態様の決定に用いる第1次元に対する感度が大きい順に各次元を並べ替える、
請求項2に記載のデータ処理装置。 - 前記ソート部は、N次元のうち1以上の次元に絞り込み条件が指定された場合、前記絞り込み条件に従い絞り込んでN次元のデータを更新し、更新後のN次元のデータの各次元を前記規則に従った順序で並べ替える、
請求項2に記載のデータ処理装置。 - 前記生成部は、N次元のうち指定された第1次元、または1以上の絞り込み条件を指定された次元を、M次元に加えてを平行座標により表示するためのデータを生成する、
請求項4または請求項5に記載のデータ処理装置。 - 前記生成部は、N次元のうち、次元の表示順が指定された場合、表示順が指定されたすべての次元を更新後のM次元に加えて、前記順序より指定された前記表示順を優先して保持するように、平行座標により表示するためのデータを生成する、
請求項4または請求項5に記載のデータ処理装置。 - 前記生成部は、N次元のうち、次元の表示順が指定された場合、表示順が指定されたすべての次元をM次元のデータに加えて、前記表示順を保持するように、平行座標により表示するためのデータを生成する、
請求項1に記載のデータ処理装置。 - 前記生成部は、N次元からM次元のデータを生成した後、各次元の複数のデータを、複数の前記データの個数より少ない個数の変換データに変換し、前記変換データを平行座標により表示するためのデータを生成する、
請求項1に記載のデータ処理装置。 - データ処理装置と表示処理装置とを備える表示制御システムであって、
前記データ処理装置は、
N次元(Nは自然数)のうち指定されたM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成する生成部を備え、
前記生成部は、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する、
前記表示処理装置は、
生成された前記データを表示装置に表示する表示制御部と、
N次元のうち表示するM次元の指定を受け付ける受付部と、を備える、
表示制御システム。 - N次元(Nは自然数)のうち指定されたM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成するステップと、
M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成するステップと、
を含むデータ処理方法。 - コンピュータを、
N次元(Nは自然数)のうち指定されたM次元(MはNより小さい自然数)のデータを平行座標により表示するためのデータを生成する生成部として機能させ、
前記生成部は、M次元の指定が変更された場合は、変更後のM次元のデータを平行座標により表示するためのデータを生成する、
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019047659A JP2020149498A (ja) | 2019-03-14 | 2019-03-14 | データ処理装置、表示制御システム、データ処理方法およびプログラム |
US16/555,542 US20200294292A1 (en) | 2019-03-14 | 2019-08-29 | Data processing apparatus, display control system, data processing method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019047659A JP2020149498A (ja) | 2019-03-14 | 2019-03-14 | データ処理装置、表示制御システム、データ処理方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020149498A true JP2020149498A (ja) | 2020-09-17 |
Family
ID=72422690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019047659A Abandoned JP2020149498A (ja) | 2019-03-14 | 2019-03-14 | データ処理装置、表示制御システム、データ処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20200294292A1 (ja) |
JP (1) | JP2020149498A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022269960A1 (ja) * | 2021-06-23 | 2022-12-29 | ソニーグループ株式会社 | 粒子解析システム、情報処理装置、及び分取装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4348445A1 (en) * | 2021-05-28 | 2024-04-10 | Imply Data, Inc. | Dynamic query engine for data visualization |
-
2019
- 2019-03-14 JP JP2019047659A patent/JP2020149498A/ja not_active Abandoned
- 2019-08-29 US US16/555,542 patent/US20200294292A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022269960A1 (ja) * | 2021-06-23 | 2022-12-29 | ソニーグループ株式会社 | 粒子解析システム、情報処理装置、及び分取装置 |
Also Published As
Publication number | Publication date |
---|---|
US20200294292A1 (en) | 2020-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10872446B2 (en) | Systems and methods for high dimensional 3D data visualization | |
US11670021B1 (en) | Enhanced graphical user interface for representing events | |
US9972105B2 (en) | Visualization of data clusters | |
US6304260B1 (en) | Method and apparatus for generating and displaying views of hierarchically clustered data | |
CN101268462A (zh) | 根据图形操作来构建数据库查询 | |
CN108846066B (zh) | 一种可视化的数据分析方法及系统 | |
CN112149737A (zh) | 选择模型训练方法、模型选择方法、装置及电子设备 | |
JP2019082874A (ja) | 設計支援装置及び設計支援システム | |
JP2020149498A (ja) | データ処理装置、表示制御システム、データ処理方法およびプログラム | |
CN103853809A (zh) | 用于业务对象的有效空间分配 | |
Cao et al. | Untangle map: Visual analysis of probabilistic multi-label data | |
JP6714268B1 (ja) | 質問文出力方法、コンピュータプログラム及び情報処理装置 | |
US20170124455A1 (en) | Generating business intelligence analytics data visualizations with genomically defined genetic selection | |
US20240054385A1 (en) | Experiment point recommendation device, experiment point recommendation method, and semiconductor device manufacturing device | |
Marszałkowski et al. | Fast algorithms for online construction of web tag clouds | |
US10839571B2 (en) | Displaying large data sets in a heat map | |
JP2010224625A (ja) | キーワード二次元可視化方法およびキーワード二次元可視化プログラム | |
JP2003203090A (ja) | 画像空間表示方法 | |
JP2009252185A (ja) | 情報検索装置、情報検索方法、制御プログラム及び記録媒体 | |
JP7490241B2 (ja) | クラスタ解析方法、クラスタ解析システム、及びクラスタ解析プログラム | |
US20160275707A1 (en) | Graph processing system, graph processing method, and non-transitory computer readable medium | |
JP5714472B2 (ja) | 製品情報管理装置、方法、及びプログラム | |
Alnjar | Data visualization metrics between theoretic view and real implementations: A review | |
JP5368900B2 (ja) | 情報提示装置、情報提示方法およびプログラム | |
US11782576B2 (en) | Configuration of user interface for intuitive selection of insight visualizations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200826 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20210531 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210528 |