JP2019174947A

JP2019174947A - 視覚化装置、方法およびプログラム

Info

Publication number: JP2019174947A
Application number: JP2018059929A
Authority: JP
Inventors: 浩嗣玉野; Koji Tamano
Original assignee: NEC Solution Innovators Ltd
Current assignee: NEC Solution Innovators Ltd
Priority date: 2018-03-27
Filing date: 2018-03-27
Publication date: 2019-10-10

Abstract

【課題】２次元バイナリデータが示す内容であって２つの次元にまたがる要素間の関係性を含む内容を、人が容易に把握できるようにする。【解決手段】本発明の視覚化装置６０は、２次元バイナリデータを入力するデータ入力手段６１と、２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成するクラスタリング手段６２と、クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成するグラフ作成手段６３とを備える。【選択図】図１７

Description

本発明は、２次元バイナリデータを視覚化するための視覚化装置、２次元バイナリデータの視覚化方法および２次元バイナリデータの視覚化プログラムに関する。

世の中には、０と１で表される２次元バイナリデータが数多く存在している。図１８は、２次元バイナリデータの一例を示す説明図である。なお、図１８では、２次元バイナリデータの表記方法として、バイナリ行列データを利用している。

図１８（ａ）に示す例は、学習者（人）と問題（事柄）の２つの次元を有するテストの正解／不正解データである。また、図１８（ｂ）に示す例は、ユーザ（人）と商品（物）の２つの次元を有する、商品の購入履歴データである。この他にも、ユーザの視聴履歴データのように、ユーザと対象物（映像、楽曲、番組、レンタルＤＶＤ等）の２つの次元を有する２次元バイナリデータや、旅行先の統計データのように、人（またはその属性）と場所（国や地域）の２つの次元を有する２次元バイナリデータなども一例として挙げられる。なお、２次元バイナリデータは、バイナリ行列としたときに要素に欠損があってもよい。その際、欠損位置は特に限定されない。以下、このような２つの物事の掛け合わせ（組み合わせ）で示される現象が０と１のような二値のみで表現されるデータを、２次元バイナリデータと呼ぶ。

このような多種多様な２次元バイナリデータを、人が容易に理解できるように視覚的に表現する（視覚化する）ことが望まれている。特に、２次元バイナリデータ全体が示す内容（例えば、２つの次元の各要素の組み合わせからなる現象全体における物事（要素）間の関係性（類否関係や相関関係等））を、人が理解できるように視覚化することが望まれている。

２次元バイナリデータの視覚化方法のうち簡易な方法としては、各次元で統計情報を取り、それらを２次元バイナリデータに付与して表示する方法や（図１９参照）、２次元マッピングして表示する方法がある。また、他の方法としては、各次元に対応した単層または階層型のクラスタリングを行い、その結果を表示する方法（図２０参照）が挙げられる。

また、多次元データの可視化技術に関して、例えば、特許文献１には、複数の文書の分類結果を、文書集合全体に対する一貫性を損なうことなく表示するための方法が記載されている。特許文献１に記載の方法は、例えば、２つの文書ユニットの集合がある場合に、それぞれの集合から抽出される単語に基づく関連度の強さに応じて、二つの軸に各文書集合の要素（文書）を二次元配置する際、各文書間の関連度の強さをプロットしてグラフ表示する。このとき、縦軸方向、横軸方向のどちらか一方、あるいは両方についてクラスタリングして並び替えを行った結果、関連度の高い文書を近くにまとめて２次元座標上に表示（配置）する例が示されている。

また、特許文献２には、階層型多変数データの可視化方法として、階層構造のデータベース中の各データのアイコンを、再帰的な入れ子構造となるように二次元平面に配置する方法が記載されている。特許文献２に記載の方法は、葉ノードに対応する長方形または正方形のアイコンを、葉ノード数に応じて定められる格子状の小領域に分割しつつ、少領域のそれぞれに互いに異なる色を割り当てる。

特開２００６−１２７５２３号公報特開２００８−２９９３６３号公報

特許文献１に記載の方法は、並び順から複数のクラスタ間の関係性の強弱は把握できても、強弱以外のクラスタ間の関係性（各クラスタに含まれる文書群の特徴の違いなど）は各軸上の要素間の関係性から個別に把握するしかなく、その２次元配置から、縦軸方向と横軸方向の２つの次元にまたがるクラスタ間の関係性を把握するのは困難である。また、特許文献２に記載の方法も、木構造における親子関係は把握できても、同じ階層にあるノード（クラスタ）間の違いなどは把握できず、やはりその２次元配置から、人が、木構造におけるノード配置の縦方向の関係性における特徴の他に、横方向の関係性における特徴等、２つの次元にまたがるノード間の関係性を把握するのは困難である。

なお、図１９や図２０に示す方法も同様である。例えば、図１９に示す方法によれば、学習者ごとの正解率や問題ごとの正解率等の次元ごとの統計データを表示することにより、各次元（学習者または問題）における大まかな特徴を把握することはできる。しかし、例えば、正解率の多かった問題群と正解率の少なかった問題群との間でそれらに属する学習者群にどのような特徴の違いがあるかや、正解率の多かった学習者群と正解率の少なかった学習者群との間でそれらに属する問題群にどのような特徴の違いがあるかまでを、人が、表示された内容から把握するのは困難である。図２０に示す方法も同様、クラスタの分類に用いた次元における要素間の関係性は把握できても、それらクラスタに属する要素間における他の次元の関係性までは把握できない。このように、２次元配置の多くでは、各次元における要素間の特徴（クラスタ等）を個別に表示することは比較的容易に実現できる。しかし、それら次元別の要素の特徴間の関係性といった２つの次元にまたがる全体的な特徴を人が容易に理解可能なように視覚化することを考えた場合、次元ごとに軸を割り当てる一般的な２次元配置や、階層の上下方向の関係性のみが具体的に表現される一般的な木構造や入れ子構造を適用するだけでは困難である。

そこで、本発明は、２次元バイナリデータが示す内容であって２つの次元のそれぞれにおける要素間の関係性だけでなく、２つの次元にまたがる要素間の関係性を含む内容を、人が容易に把握できるように２次元バイナリデータを視覚化する視覚化装置、２次元バイナリデータの視覚化方法および２次元バイナリデータの視覚化プログラムを提供することを目的とする。

本発明による視覚化装置は、２次元バイナリデータを入力するデータ入力手段と、２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成するクラスタリング手段と、クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成するグラフ作成手段とを備えたことを特徴とする。

本発明による２次元バイナリデータの視覚化方法は、情報処理装置が、２次元バイナリデータを入力し、２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成し、クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成することを特徴とする。

本発明による２次元バイナリデータの視覚化プログラムは、コンピュータに、２次元バイナリデータを入力する処理、２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成する処理、およびクラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成する処理を実行させることを特徴とする。

本発明によれば、２次元バイナリデータが示す内容であって２つの次元にまたがる要素間の関係性を含む内容を、人が容易に把握できる。

第１の実施形態の視覚化装置の構成例を示すブロック図である。行列分解の例を示す説明図である。要約グラフの例を示す説明図である。具体的なバイナリ行列データおよびその要約グラフの例を示す説明図である。要約グラフの他の例を示す説明図である。要約グラフの他の例を示す説明図である。補助情報が追加された要約グラフの例を示す説明図である。補助情報が追加された要約グラフの具体例を示す説明図である。補助情報が追加された要約グラフの他の例を示す説明図である。第１の実施形態の視覚化装置の動作例を示すフローチャートである。グラフ作成部の要約グラフ作成処理の一例を示すフローチャートである。要約グラフの作成手順を模式的に示す説明図である。次元グループの特徴値に制約を加えた場合の要約グラフのグラフ形状の例を示す説明図である。次元グループの特徴値に制約を加えた場合の要約グラフのグラフ形状の例を示す説明図である。次元グループの特徴値に制約を加えた場合の要約グラフのグラフ形状の例を示す説明図である。本発明の実施形態にかかるコンピュータの構成例を示す概略ブロック図である。本発明の視覚化装置の概要を示すブロック図である。２次元バイナリデータの一例を示す説明図である。２次元バイナリデータの視覚化方法の一例を示す説明図である。２次元バイナリデータの視覚化方法の一例を示す説明図である。

以下、図面を参照して本発明の実施形態について説明する。図１は、第１の実施形態の視覚化装置の構成例を示すブロック図である。図１に示す視覚化装置１０は、データ入力部１１と、次元別要素分類部１２と、グラフ作成部１３と、グラフ表示部１４とを備える。

データ入力部１１は、視覚化対象とする２次元バイナリデータを入力する。例えば、データ入力部１１は、ユーザ等から２次元バイナリデータとして行列形式のデータを受け付けてもよい。また、データ入力部１１は、所定のデータベースから指定された行データと列データとを読み出し、読み出した行データと列データとに基づいて、自身で２次元バイナリデータを生成することも可能である。本例では、データ入力部１１は、そのようにして取得された２次元バイナリデータを、ｎ×ｍの行列形式に変換した上で、後段の次元別要素分類部１２に出力する。以下では、行列形式の２次元バイナリデータを、バイナリ行列データという。

次元別要素分類部１２は、データ入力部１１により入力されたバイナリ行列データに対して、行方向と列方向のそれぞれでクラスタリングを行い、行クラスタと列クラスタとを求める。より具体的に、次元別要素分類部１２は、バイナリ行列データにおける行の次元の要素集合（例えば、学習者集合）に対して、各要素と対応づけられた成分組（各行ベクトル）の値に基づきクラスタリングを行って、第１の次元グループ（行クラスタ）を求めるとともに、列の次元の要素集合（例えば、問題集合）に対して、各要素と対応づけられた成分組（各列ベクトル）の値に基づきクラスタリングを行って、第２の次元グループ（列クラスタ）を求める。

また、次元別要素分類部１２は、少なくとも後述する要約グラフにおいてノードに関連付ける次元の次元グループの各々を対象に、特徴値を決定する。ここで、特徴値は、その次元グループの識別子を与えるものであればよく、さらに、ノードに関連付ける次元の次元グループに対しては、その次元グループに属する要素群が備える特徴を表すものである。例えば、図２に示す例において、行列Ｒの各行ベクトルの成分組（ＲＣ_１であれば“０１０”、ＲＣ_２であれば“０１１”、ＲＣ_３であれば“１１０”等）や、行列Ｃの各列ベクトルの成分組（ＣＣ_１であれば“１００”、ＣＣ_２であれば“０１０”、ＣＣ_３であれば“００１”等）をそのまま、それらベクトルが属する次元グループの特徴値としてもよい。以下に示す例では、特徴値は、図２に示す例と同様、行列表記したときのその次元の要素の成分組における成分の数（すなわち他方の次元の要素数）と同じまたはそれ以下の桁の数値で表現されるものとする。具体的に、特徴値は、各桁によりクラスタの識別子を与えるものや、単にクラスタの識別子を与えるものだけでなく、さらに、図２に示すような、各桁が他方の次元の各クラスタに対応するなど、他方の次元の各クラスタに対応する成分の集合で表されるものであってもよい。例えば、図２に示す例では、行列Ｒの各行クラスタ（ＲＣ_１，ＲＣ_２，ＲＣ_３）の特徴値の各桁は、行列Ｃの各列クラスタ（ＣＣ_１，ＣＣ_２，ＣＣ_３）のいずれかに対応している。

このような行クラスタおよび列クラスタは、バイナリ行列データを２つのバイナリ行列の積に分解する行列分解を行うことにより求めることができる。例えば、図２に示すように、元のバイナリ行列であるｎ行ｍ列の行列Ｘを、ｎ行ｋ列の小行列Ｒとｋ行ｍ列の小行列Ｃの積に分解することにより、行クラスタおよび列クラスタを求めてもよい。ここで、ｋ≦ｍｉｎ（ｎ，ｍ）とする。

図２に示す例において、行列分解後のｎ行ｋ列の小行列Ｒにおける行ベクトルの種類数（要素の並びが一致しない行ベクトルの数）が分類後の行クラスタの数に対応し、ｋ行ｍ列の小行列Ｃにおける列ベクトルの種類数（要素の並びが一致しない列ベクトルの数）が分類後の列クラスタの数に対応している。なお、図２には、４×４の行列Ｘが、４×３の小行列Ｒと３×４の小行列Ｃの積に分解された例が示されている。なお、小行列Ｒにおける行ベクトルの種類数＝３、小行列Ｃにおける列ベクトルの種類数＝３である。図２では、小行列Ｒにおけるそれら３種の行ベクトルを行クラスタＲＣ_１〜ＲＣ_３とし、小行列Ｃにおけるそれら３種の列ベクトルを列クラスタＣＣ_１〜ＣＣ_３としている。なお、行クラスタＲＣ_１〜ＲＣ_３が、２次元バイナリデータの行の次元でのグループ分けの結果得られた次元グループに相当する。また、列クラスタＣＣ_１〜ＣＣ_３が、２次元バイナリデータの列の次元でのグループ分けの結果得られた次元グループに相当する。

行列積への分解方法は、特に限定されないが、例えば、以下の式（１）に示す最適化問題を解くことにより求めてもよい。式（１）において、Ｒはｎ行ｋ列の任意の小行列、Ｃはｋ行ｍ列の任意の小行列を表す。また、ハット付きのＣ，Ｒは上記任意の小行列のうち式（１）を満たすＣ，Ｒ（すなわち最適解）を表す。また、“｜｜_Ｆ”は行列のフロべニウスノルムを取ることを表す。

式（１）に示す最適化問題を解くにあたり、例えば、次元別要素分類部１２は、ＲとＣをランダムに初期化し、Ｃを固定してＲを最適化する処理と、Ｒを固定してＣを最適化する処理とを繰り返して、ＣとＲについての最適解を得てもよい。

また、行列積への分解方法の他の例として、特願２０１７−１９９７９６号明細書に記載の方法を用いることも可能である。このとき、以下の２つの設定を行った上でスキル推定を行って、行列積を得てもよい。

・（１）スキル遷移確率μ_ｋを表すβ分布のパラメータξ_ｋ、ζ_ｋをスキル遷移が起きない設定にする。
・（２）各問題のスキルパタンの出方の確率ｖを表すディリクレ分布のパラメータαを各問題について１つしかスキルがない設定にする。

上記（１）に関して
例えば、ξ_ｋを非常に大きく、かつζ_ｋを非常に小さくしてもよい。また、上記（２）に関して、例えば、二以上のスキルを必要とする問題がでる確率を０に設定してもよい。

なお、上記文献の方法は、学習者が問題を解いた回答の正誤を２値のデータで示す正誤データについて、事後確率を最大化する解探索を行うことにより、問題を解くために必要なスキルおよび学習者が保持しているスキルを推定する方法である。なお、本発明では、当該方法における正誤データを２次元バイナリデータと読み替え、各学習者および各問題を２次元バイナリデータの各次元の要素（以下、次元要素という）と読み替えればよい。また、問題を解くために必要なスキルの推定が、図２の例でいう列ベクトルのクラスタリング（列クラスタＣＣ_１〜ＣＣ_３へのグループ分け）と各列クラスタの特徴値の決定に相当し、学習者が保持しているスキルの推定が、図２の例でいう行ベクトルのクラスタリング（行クラスタＲＣ_１〜ＲＣ_３へのグループ分け）と各行クラスタの特徴値の決定に相当する。

行列積への分解は上記２つの方法以外の方法で行ってもよく、具体的な方法は特に限定されない。例えば、欠損がある場合、式（１）は、以下の式（２）に示すように、欠損願ないところだけで計算してもよい。なお、式（２）において、＜Ｒ_ｉ＊，Ｃ_＊ｊ＞は、行列Ｒのｉ行目と行列Ｃのｊ列目との内積を表す。

また、次元別要素分類部１２は、バイナリ行列の要素群に対して行クラスタと列クラスタを求める際、後段のグラフ作成部１３が作成する要約グラフの構造を限定するための制約（以下、グラフ構造制約という）を与えてもよい。なお、グラフ構造制約については後述する。

グラフ作成部１３は、次元別要素分類部１２による分類結果（各行クラスタおよび各列クラスタとそれらの特徴値）または該分類結果を表現した２つのバイナリ行列ＣおよびＲを受け取ると、該分類結果に基づいて要約グラフを生成する。ここで、要約グラフは、ノードに一方の次元の次元グループに関する情報を関連付け、ノードの接続関係を示すエッジに他方の次元の次元グループに関する情報を関連付けたグラフである。ここで、エッジに関連付けられる他方の次元の次元グループに関する情報は、接続元ノードと接続先ノードの違いを示す情報として用いられる。

なお、ノードおよびエッジに対して、いずれの次元の次元グループに関する情報を関連付けるかは特に限定されない。以下では、式（１）に示す行列分解を行って行次元と列次元の次元グループを得た場合を例に用いて、ノードに行次元の次元グループ（行クラスタ）に関する情報を関連付け、エッジに列次元の次元グループ（列クラスタ）に関する情報を関連付ける例を示す。上記の行列分解でＲＣ分解した際、Ｃに制約をつけて分解したためである。この場合、ノードには必ずＲの行クラスタを対応づけ、エッジにはＣの列クラスタを対応づける。なお、Ｘの行をエッジ、列をノードに対応づけたい場合には、Ｘを置換してから行列分解を行えばよい。

グラフ作成部１３は、例えば、一方の次元（第１の次元）の次元グループのうち全てが０の成分の特徴値をもつ次元グループに対応するノードをルートノードとして、当該ルートノードから徐々に特徴値における１の成分が増える方向に、そのような成分の組合せを示す特徴値を有する次元グループに対応するノードを追加していく増加グラフ方式で要約グラフを作成してもよい（図３参照）。このとき、各エッジには、接続元ノードの次元グループと接続先ノードの次元グループとの差分（違い）を示す情報として、接続先ノードにおいて新たに増えた１の成分に対応する第２の次元の次元グループに関する情報が付加される。

図３は、要約グラフの例を示す説明図である。図３に示す例において、ＲＣ_０は、全ての要素が０の行クラスタを表している。図３に示す例では、行クラスタＲＣ_０に対応するノードをルートノードとし、そこから行クラスタＲＣ_１に対応するノードが派生している。このとき、ルートノードと行クラスタＲＣ_１に対応するノードとを結ぶエッジには、接続元ノードが対応する行クラスタと接続先ノードが対応する行クラスタ間の違いを示す情報として、列クラスタＣＣ_２が示されている。これは、接続先ノードが対応する行クラスタＲＣ_１（特徴値は０１０）が、接続元ノードが対応する行クラスタＲＣ_０（特徴値は０００）に対し、特徴値において左から２ビット目に１があるため、列クラスタＣＣ_２の特徴をさらに具備する行クラスタであることを表している。

また、図３に示す例では、行クラスタＲＣ_１に対応するノードから、行クラスタＲＣ_２に対応するノードと行クラスタＲＣ_３に対応するノードとが派生するとともに、それらのエッジには、列クラスタＣＣ_３、列クラスタＣＣ_１がそれぞれ付されている。なお、これらエッジに付された情報により、例えば、行クラスタＲＣ_２（特徴値は０１１）が、行クラスタＲＣ_１（特徴値は０１０）に属する行ベクトルが有する特徴に対してさらに列クラスタＣＣ_３の特徴を具備する行ベクトルが主に属するクラスタであることがわかる。また、例えば、行クラスタＲＣ_３（特徴値は１１０）が、行クラスタＲＣ_１（特徴値は０１０）に属する行ベクトルが有する特徴に対してさらに列クラスタＣＣ_１の特徴を具備する行ベクトルが主に属するクラスタであることがわかる。

また、各ノードには、対応する行クラスタの識別子とともに、当該ノードが対応する行クラスタに属する要素数（行ベクトル数）が付与されてもよい。

また、要約グラフにおける各階層は、ノードが対応するクラスタの特徴値が有する１の数または０の数に対応するレベルに基づいて定められてもよい。なお、特徴値が有する１の数または０の数は、特徴値が示す当該クラスタに属する要素群が具備する特徴または具備しない特徴としての他方の次元のクラスタの数と読み替えることができる。

次に、要約グラフの具体例を示す。図４は、具体的なバイナリ行列データおよびその要約グラフの例を示す説明図である。図４に示す例は、４人の学習者それぞれの４つの問題に対する正誤データを表現した４×４のバイナリ行列に対する要約グラフの作成例である。今、そのような４×４のバイナリ行列に対して、図４（ａ）に示すような行列分解がなされたとする。図４（ａ）には、行方向の分類の結果、学習者１〜４は３つの学習者グループ学Ｇ１〜学Ｇ３のいずれかに分類され、問題１〜４は３つの問題グループ問Ｇ１〜Ｇ３のいずれかに分類されたことが示されている。具体的には、学習者１は学Ｇ１に分類され、学習者２は学Ｇ２に分類され、学習者３および４は学Ｇ３に分類されている。また、問題１は問Ｇ１に分類され、問題２および３は問Ｇ２に分類され、問題４は問Ｇ３に分類されている。このとき、学習者の次元グループの特徴値は次に示す通りである。

すなわち、
・学Ｇ１＝｛＠問Ｇ１，＠問Ｇ２，＠問Ｇ３｝＝｛０，１，０｝
・学Ｇ２＝｛＠問Ｇ１，＠問Ｇ２，＠問Ｇ３｝＝｛０，１，１｝
・学Ｇ３＝｛＠問Ｇ１，＠問Ｇ２，＠問Ｇ３｝＝｛１，１，０｝
である。

ここで、“＠問Ｇｘ”は、その学習者グループに属する学習者群の特徴の１つとして、問Ｇｘに属する問題群に対する当該学習者群の正誤（１：正解／０：不正解）を表している。

例えば、上記の分類結果により、学Ｇ１は、問Ｇ１に属する問題（本例では問題１）に対する正誤が主に不正解（０）であり、かつ問Ｇ２に属する問題（本例では問題２，３）に対する正誤が主に正解（１）であり、かつ問Ｇ３に属する問題（本例では問題４）に対する正誤が主に不正解（０）である学習者（本例では、学習者１）が主に属するグループであることがわかる。

そのような分類結果を基に、グラフ作成部１３は、例えば、図４（ｂ）に示すような要約グラフを作成してもよい。図４（ｂ）は、ノードに、学習者の次元のグループ情報を割り当て、エッジに、対応する学習者の次元のグループ間の差分を表現する問題の次元のグループ情報を割り当てた例である。

図４（ｂ）によれば、ユーザは、各学習者が各問題の正解／不正解に応じて４つのグループに分けられ、全問不正解の学習者グループ学Ｇ０に属する学習者が０人であることがわかる。加えて、学Ｇ０よりもさらに問題グループ問Ｇ２に属する問題の正解率が高い学習者グループである学Ｇ１があり、それに属する学習者が１人であることがわかる。加えて、学Ｇ１よりもさらに問題グループ問Ｇ３に属する問題の正解率が高い学習者グループである学Ｇ２があり、それに属する学習者が１人であることがわかる。また、学Ｇ１よりもさらに問題グループ問Ｇ１に属する問題の正解率が高い学習者グループである学Ｇ３があり、それに属する学習者が２人であることがわかる。

なお、ノードに付す情報は、当該ノードが対応する次元グループの情報であれば、特に限定されない。また、エッジに付す情報は、接続ノードの違いを表す情報であって、他方の次元グループから得られる情報であれば、特に限定されない。他方の次元のグループの識別子以外に、例えば、該グループの特徴や、該グループに属する要素の情報や要素数などを付すことも可能である。

なお、図３および図４では、増加方向のグラフ化方式で要約グラフを作成する例を示したが、要約グラフは、例えば、一方の次元（第１の次元）の次元グループのうち全てが１の成分の特徴値をもつ次元グループに対応するノードをルートノードとして、当該ルートノードから徐々に特徴値における１の成分が減る方向に、そのような成分の組合せを示す特徴値を有する次元グループに対応するノードを追加していく減少グラフ方式で要約グラフを作成してもよい（図５参照）。このとき、各エッジには、接続元ノードの次元グループと接続先ノードの次元グループとの差分（違い）を示す情報として、接続先ノードにおいて新たに減った１の成分に対応する第２の次元の次元グループに関する情報が付加される。グラフ作成部１３は、減少グラフ方式の要約グラフにエッジを追加する際、増加グラフ方式でのエッジの向きと逆向きにしてエッジを追加してもよいし、エッジに付す情報に追加または減少かがわかる情報（プラス符号やマイナス符号等）を付してもよい。

また、グラフ作成部１３は、ノード数が少ない場合や表示中の要約グラフの一部を切り出して表示する場合など、エッジに増加方向と減少方向の両方の差分情報を待たせた双方向グラフ方式で要約グラフを作成してもよい（図６参照）。なお、図５および図６では、各ノードに、当該ノードが対応するクラスタの特徴値として、対応する小行列における要素集合（図中のＲ＝［０００］等）を付しているが、これらの有無は特に限定されない。なお、以下では、行クラスタの特徴値をＲ値という場合がある。

グラフ表示部１４は、グラフ作成部１３が作成した要約グラフを表示する。グラフ表示部１４は、要約グラフを表示する際、図７に示すように、ノードやエッジにさらに補助情報を追加して表示してもよい。

ここで、補足情報は、追加先のノードやエッジが対応する次元グループに関する情報であって、２次元バイナリデータから直接得られる情報以外の情報であれば特に限定されない。補足情報は、例えば、所定のデータベースにおいて、各次元要素に対応づけられている情報であってもよい。図７に示す例は、行ベクトルおよび列ベクトルの各要素である次元要素の各々に、予め属性情報として１つまたは複数のキーワードが付されている場合に、当該キーワードを補助情報として追加した例である。このとき、追加先のノードやエッジが対応する次元グループに属する各次元要素に付されたキーワードを、それらの重複度合いに応じた強弱を付けた表示態様で表示してもよい。図７には、グループ内の要素間での重複度合いが高いキーワードほど大きな文字で表示する例が示されている。なお、例えば、テキスト形式で各次元要素の属性情報が付されている場合に、当該テキスト形式の属性情報に対して構文解析や単語解析等を行うことにより、各次元要素のキーワードを抽出することも可能である。なお、このような属性情報は、例えば、データ入力部１１が、２次元バイナリデータと併せて取得してもよい。

図８に、強弱を付けたキーワードが補助情報として追加された要約グラフの具体的な表示例を示す。図８に示す例では、学習者次元の次元要素である各学習者の属性情報として当該学習者が属する学部名が取得可能な場合に、該学部名を学習者次元の次元グループ（行クラスタ）の補助情報として利用している。また、図８に示す例では、問題次元の次元要素である各問題の属性情報として当該問題が属する分野等を表すキーワードが取得可能な場合に、当該キーワードを問題次元の次元グループ（列クラスタ）の補助情報として利用している。

また、各次元に対して２以上の項目が対応づけられた関係データを取得可能な場合、次元グループごとに関係データの項目別の統計情報を生成して、それらをグラフ化したものを補助情報として対応するノードやエッジに追加して表示してもよい。補助情報のグラフは、特に限定されず、例えば、円グラフ、棒グラフ、散布図等でもよい。

図９は、そのような関係データを基に統計情報をグラフ化して追加表示した例である。図９に示す例は、ユーザと商品の掛け合わせで示される購入履歴データとしての２次元バイナリデータに対して要約グラフを作成・表示した例である。本例では、図９（ａ）および（ｂ）に示すように、一方の次元である「ユーザ」に関する属性情報として、「性別」と「住所」の２つの項目を含む関係データが取得可能であるとともに、他方の次元である「商品」に関する属性情報として、「カテゴリ」と「メーカー」の２つの項目を含む関係データが取得可能であったとする。グラフ表示部１４は、例えば、これら関係データを用いてユーザ次元の各次元グループ（本例では、ユーザＧ１、ユーザＧ２）に対して「性別」と「住所」に関する統計情報を生成し、該統計情報をグラフ化したものを、対応するノードの補助情報として追加してもよい。また、グラフ表示部１４は、例えば、これら関係データを用いて商品次元の各次元グループ（本例では、商品Ｇ１、商品Ｇ２）に対して「カテゴリ」と「メーカー」に関する統計情報を生成し、該統計情報をグラフ化したものを、対応するエッジの補助情報として追加してもよい。

次に、本実施形態の動作を説明する。図１０は、本実施形態の視覚化装置の動作例を示すフローチャートである。

図１０に示すように、まず、データ入力部１１が、可視化の対象とする２次元バイナリデータを入力する（ステップＳ１１）。

次いで、次元別要素分類部１２が、次元ごとに当該次元要素をグループ分けする（ステップＳ１２）。次元別要素分類部１２は、グループ分けの結果、次元要素数以下の次元グループ（上記の行クラスタおよび列クラスタ）を生成する。

次いで、グラフ作成部１３が、各次元の次元グループの特徴を基に、ノードに一方の次元の次元グループに関する情報を関連づけ、エッジに他方の次元の次元グループに関する情報を関連づけることにより、要約グラフを作成する（ステップＳ１３）。

最後に、グラフ表示部１４が、作成された要約グラフを表示する（ステップＳ１４）。このとき、グラフ表示部１４は必要に応じてノードやエッジに補助情報を追加して表示してもよい。

また、図１１は、グラフ作成部１３における要約グラフ作成処理の一例を示すフローチャートである。図１１に示す例では、グラフ作成部１３は、まず、２次元のグラフ領域に、行クラスタ（行次元の次元グループ）の各々に対応したノードを配置する（ステップＳ１０１）。

図１２（ａ）に、２次元のグラフ領域に各行クラスタに対応するノードを配置した例を示す。図１２（ａ）に示す例では、図２に示す行列分解後の小行列Ｒの各行の値でのクラスタリングの結果得られた３つの行クラスタＲＣ_１〜ＲＣ_３に、全ての要素が０の行クラスタＲＣ_０を加えた計４つの行クラスタＲＣ_０〜ＲＣ_３のそれぞれに対応するノードｎ０〜ｎ３を配置している。グラフ作成部１３は、例えば、各行クラスタの特徴値（Ｒ値）における１の個数をそのノードのレベルとして、レベル別に階層化して各ノードを配置してもよい。また、グラフ作成部１３は、各ノードに、当該ノードが対応する行クラスタの識別子とともに、当該行クラスタに属する行ベクトルの数（要素数）を付与してもよい。

次いで、グラフ作成部１３は、２つのノード間を接続するエッジを追加する（ステップＳ１０２）。

図１２（ｂ）に、図１２（ａ）のノード配置に対するエッジの追加例を示す。グラフ作成部１３は、まずレベル０のノードから始めて、当該ノード（接続元ノード）のレベル＋１のノードを接続先候補ノードとする。そして、接続先候補ノードのうちＲ値が当該接続元ノードの特徴値における値“１”を全て包含している、すなわち少なくとも接続元ノードの特徴値で“１”となっている位置と同じ位置で“１”となっているノードがあれば、そのノードを全て接続先ノードとし、接続先ノードのそれぞれにエッジを配置する。ここで、仮に＋１レベルのノードに、上記条件すなわち接続元のノードの特徴値に含まれる全ての”１”を包含するとの条件）を満たすノードがない場合、接続先候補ノードとするレベルを上げていき、接続先ノードが見つかるまで当該接続元ノードにおける接続先ノードの探索処理を繰り返す。１つの接続元ノードに対する接続先ノードの探索処理を終えると、同じレベルに属する他のノードがあれば、当該他のノードを次の接続元ノードに設定して同様の処理を繰り返す。同じレベルに属する全てのノードについて接続先ノードの探索処理が完了すると、次のレベルのノードの中から接続元ノードを設定して、以降、最上位レベルのノードが全て接続されるまで同様の処理を繰り返す。なお、いずれのノードとも接続されていないノードがあれば、レベルを一つずつ下げていきながら、当該ノードの特徴値において値が“０”となっている位置に少なくとも値“１”を有しない特徴値を有するノードを探索して、それを接続元ノード（始点ノード）とすればよい。例えば、当該ノードの特徴値が［００１１］であれば、［００ｘｘ］（ｘは０でも１でも可）を特徴値として有するノードを探索する。

図１２（ｂ）に示す例では、まず、レベル０の行クラスタＲＣ_０に対応するノードｎ０を接続元ノードとして、接続先ノードとしてレベル１のノードｎ１（行クラスタＲＣ_１に対応するノード）が発見され、ノードｎ０とノードｎ１を接続するエッジｅ０１が追加される。また、レベル１のノードｎ１を接続元ノードとして、接続先ノードとして、レベル２のノードｎ２（行クラスタＲＣ_２に対応するノード）およびノードｎ３（行クラスタＲＣ_３に対応するノード）がそれぞれ発見される。それにより、ノードｎ１とノードｎ２を接続するエッジｅ１２およびノードｎ１とノードｎ３を接続するエッジｅ１３が追加される。

次いで、グラフ作成部１３は、追加したエッジの各々に、列クラスタ（列次元の次元グループ）を対応づける（ステップＳ１０３）。

図１２（ｃ）に、図１２（ａ）で追加された各エッジに列クラスタを対応づけた例を示す。図１２（ｃ）に示す例では、エッジｅ０１に列クラスタＣ_２が対応づけられ、エッジｅ１２に列クラスタＣ_３が対応づけられ、エッジｅ１３に列クラスタＣ_１が対応づけられている。グラフ作成部１３は、このような対応づけを、例えば、エッジの始点（接続先）と終点（接続元）に配置されたノードの特徴値（Ｒ値）を比べて、新たに“１”となった位置から求めることができる。すなわち、エッジの両端ノードの特徴値において新たに“１”となった位置に対応する列クラスタが、当該エッジに対応する列クラスタとされる。なお、新たに値“１”となった位置が複数ある場合は、それぞれの位置に対応する列クラスタすなわち複数の列クラスタが当該エッジに対応する列クラスタとなる。なお、本例では、行クラスタの特徴値において、左から１番目の値が列クラスタＣＣ_１に対応し、２番目の値が列クラスタＣＣ_２に対応し、３番目の値が列クラスタＣＣ_３に対応する。

グラフ作成部１３は、各エッジについて、対応する列クラスタが特定されると、当該エッジに、対応する列クラスタの識別子を付与する。これにより、エッジが接続する２つのノード間の違いが別次元の特徴を用いて表される。

次に、次元別要素分類部１２が、次元ごとに要素をグループ化する際に与えるグラフ構造制約について説明する。次元別要素分類部１２は、上述したように、行クラスタと列クラスタを求める際、グラフ構造制約を与えることができる。グラフ構造制約の例としては、直線制約や木制約が挙げられる。なお、（１）制約なし、（２）直線制約、（３）木制約の３つのパターンのそれぞれに対して、さらにサンプル数の少ないクラスタを収縮（Shrink）させる拡張が可能である。

上記の（２）直線制約は、要約グラフが、図１３に示すような直線状になるように、ノードに対応する次元の次元グループへの分類の際、各次元グループがとり得る特徴値に対して制約を与えるものである。具体的には、ノードに対応づける次元グループ間において、包含関係が必ず１対１で成立するような制約を与えればよい。図１３に示す例は、行クラスタの特徴値となる小行列Ｒの行ベクトルの成分組が取り得る値（Ｒ値）に対して［０００］、［１００］、［１１０］、［１１１］のみを取るように制限を加えた例である。例えば、次元別要素分類部１２は、行列分解を行う際に、Ｒ値に対して与えられた制約の下で最適解を推定することで、要約グラフのグラフ構造を直線構造に制限できる。

このようにして、要約グラフを直線状に制限することにより、ノードに対応する次元グループ間の関係性が単純になるため、わかりやすいという利点がある。ただし、行列分解後のデータＲＣと元のバイナリ行列データＸとの乖離が大きくなるおそれがある。なお、当該制約は、元々の２次元バイナリデータがおおよそそのような性質を有するものである場合にのみ適用してもよい。その場合、もし２次元バイナリデータの一部に外れ値が含まれていた場合でも、その外れ値によって次元グループ間の関係性が崩れることを防止できる。

また、上記の（３）木制約は、図１４および図１５に示すような木構造になるように、ノードに対応する次元の次元グループへの分類の際、各次元グループがとり得る特徴値に対して制約を与えるものである。具体的には、ノードに対応づける次元グループ間において、包含関係が成立する接続元ノードが必ず１つになるような制約を与えればよい。図１４および図１５は、そのような制約として、各行クラスタの特徴値となる小行列Ｒの行ベクトルの成分組が取り得る値（Ｒ値）に対して図示するような制限を加えた例である。本例においても、次元別要素分類部１２は、行列分解を行う際に、Ｒ値に対して与えられた制約の下で最適解を推定することで、要約グラフのグラフ形状を木構造に制限できる。なお、図１４は、増加グラフ方式で作成される木構造の要約グラフの例であるが、減少グラフ方式で作成する場合はエッジの向きを反対にし、かつエッジに対応づける次元グループの識別子等に付す符号の正負を入れ替えればよい。図１５も同様に、増加グラフ方式で作成される木構造の要約グラフの例であるが、減少グラフ方式で作成する場合は図１４と同様の変換を行えばよい。

このようにして、要約グラフを木構造に制限することにより、ノードに対応する次元グループ間の関係性が単純になるため、わかりやすいという利点がある。ただし、行列分解後のデータＲＣと元のバイナリ行列データＸとの乖離が大きくなるおそれがある。なお、当該制約は、元々の２次元バイナリデータがおおよそそのような性質を有するものである場合にのみ適用してもよい。その場合、もし２次元バイナリデータの一部に外れ値が含まれていた場合でも、その外れ値によって次元グループ間の関係性が崩れることを防止できる。

また、グラフ形状に関連する他の制約として、次元別要素分類部１２は、ノードに対応づける次元のグループ化の際、属する要素数が少ないグループを除外する制約を入れてもよい。例えば、次元別要素分類部１２は、行列分解した結果、行ベクトルの種類数が少ない小行列Ｒが生成された場合、その小行列Ｒのパターンを除外する制約を入れて、再度行列分解を行ってもよい。ノードに対応づける次元の次元グループ化において、属する要素数が少ないグループを許すと、グラフ形状が複雑になりやすく、人が理解しにくくなるおそれがある。そこで、属する要素数が少ないグループが生成されないよう、そのようなグループが生成された場合は該グループを収縮（Shrink）させてもよい。

以上のように、本実施形態によれば、２次元バイナリデータが示す２つの次元のそれぞれにおける要素の特徴だけでなく、それら特徴間の関係性など、２次元バイナリデータが示す２つの次元にまたがる全体的な特徴を人が容易に把握できる。

また、図１６は、本発明の実施形態にかかるコンピュータの構成例を示す概略ブロック図である。コンピュータ１０００は、ＣＰＵ１００１と、主記憶装置１００２と、補助記憶装置１００３と、インタフェース１００４と、ディスプレイ装置１００５と、入力デバイス１００６とを備える。

上述の実施形態の視覚化装置は、コンピュータ１０００に実装されてもよい。その場合、該装置の動作は、プログラムの形式で補助記憶装置１００３に記憶されていてもよい。ＣＰＵ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、そのプログラムに従って実施形態における所定の処理を実施する。なお、ＣＰＵ１００１は、プログラムに従って動作する情報処理装置の一例であり、ＣＰＵ（Central Processing Unit）以外にも、例えば、ＭＰＵ（Micro Processing Unit）やＭＣＵ（Memory Control Unit）やＧＰＵ（Graphics Processing Unit）などを備えていてもよい。

補助記憶装置１００３は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータは１０００がそのプログラムを主記憶装置１００２に展開し、各実施形態における所定の処理を実行してもよい。

また、プログラムは、実施形態における所定の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置１００３に既に記憶されている他のプログラムとの組み合わせで実施形態における所定の処理を実現する差分プログラムであってもよい。

インタフェース１００４は、他の装置との間で情報の送受信を行う。また、ディスプレイ装置１００５は、ユーザに情報を提示する。また、入力デバイス１００６は、ユーザからの情報の入力を受け付ける。

また、実施形態における処理内容によっては、コンピュータ１０００の一部の要素は省略可能である。例えば、コンピュータ１０００がユーザに情報を提示しないのであれば、ディスプレイ装置１００５は省略可能である。例えば、コンピュータ１０００がユーザから情報入力を受け付けないのであれば、入力デバイス１００６は省略可能である。

また、上記の各構成要素の一部または全部は、汎用または専用の回路（Circuitry）、プロセッサ等やこれらの組み合わせによって実施される。これらは単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、上記の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。

上記の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

次に、本発明の概要を説明する。図１７は、本発明の視覚化装置の概要を示すブロック図である。図１７に示す視覚化装置６０は、データ入力手段６１と、クラスタリング手段６２と、グラフ作成手段６３とを備える。

データ入力手段６１（例えば、データ入力部１１）は、２次元バイナリデータを入力する。

クラスタリング手段６２（例えば、次元別要素分類部１２）は、２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成する。

グラフ作成手段６３（例えば、グラフ作成部１３）は、クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成する。

このような構成によれば、２次元バイナリデータが示す内容であって２つの次元にまたがる要素間の関係性を含む内容を、人が容易に把握できる。

なお、上記の実施形態は以下の付記のようにも記載できる。

（付記１）２次元バイナリデータを入力するデータ入力手段と、前記２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成するクラスタリング手段と、前記クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつ前記ノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成するグラフ作成手段とを備えることを特徴とする視覚化装置。

（付記２）前記クラスタリング手段は、少なくとも第１の次元のクラスタの各々に対して、当該第１の次元のクラスタに属する要素群が備える特徴が第２の次元のクラスタに対応する成分の集合で表現された特徴値を決定し、前記グラフ作成手段は、各ノードを、第１の次元のクラスタの特徴値が示す、当該第１の次元のクラスタに属する要素群が具備する特徴とされる第２の次元のクラスタの数に応じてレベル分けし、前記レベルに基づいて各ノードが階層化された要約グラフを作成する付記１に記載の視覚化装置。

（付記３）前記グラフ作成手段は、第２の次元のいずれのクラスタに対応する特徴をも具備しないクラスタに対応するノードをルートノードとして、前記ルートノードから、対応する第１の次元のクラスタにおいて要素群が特徴として具備する第２の次元のクラスタが増加する方向にノードが伸びていく増加グラフ方式の要約グラフを作成し、前記グラフ作成手段は、前記増加グラフ方式の要約グラフにおいて、各エッジに、接続元ノードに対応する第１の次元のクラスタと比較して接続先ノードに対応する第１の次元のクラスタの要素群における特徴として増加した第２の次元のクラスタに関する情報を関連付ける付記２に記載の視覚化装置。

（付記４）前記グラフ作成手段は、第２の次元の全てのクラスタに対応する特徴を具備するクラスタに対応するノードをルートノードとして、前記ルートノードから、対応する第１の次元のクラスタにおいて要素群が特徴として具備する第２の次元のクラスタが減少する方向にノードが伸びていく減少グラフ方式の要約グラフを作成し、前記グラフ作成手段は、前記減少グラフ方式の要約グラフにおいて、各エッジに、接続元ノードに対応する第１の次元のクラスタと比較して接続先ノードに対応する第１の次元のクラスタの要素群における特徴として減少した第２の次元のクラスタに関する情報を関連付ける付記２に記載の視覚化装置。

（付記５）前記グラフ作成手段は、あるノード集合に対して、対応する第１の次元のクラスタにおいて要素群が特徴として具備する第２の次元のクラスタが増加する方向と減少する方向の双方向でノード同士を接続させる双方向グラフ方式の要約グラフを作成し、前記グラフ作成手段は、前記双方向グラフ方式の要約グラフにおいて、各エッジに、接続元ノードに対応する第１の次元のクラスタと比較して接続先ノードに対応する第１の次元のクラスタの要素群における特徴として増加した第２の次元のクラスタがあればそのクラスタに関する情報を関連付けるとともに、減少した第２の次元のクラスタがあればそのクラスタに関する情報を関連付ける付記２に記載の視覚化装置。

（付記６）前記特徴値が、各桁が第２の次元の各クラスタに対応する数値成分の集合からなる数値であり、前記グラフ作成手段は、各ノードを、第１の次元のクラスタの特徴値に含まれる０の数または１の数に応じてレベル分けし、前記レベルに基づいて各ノードが階層化された要約グラフを作成する付記２から付記５のうちのいずれかに記載の視覚化装置。

（付記７）前記クラスタリング手段は、特徴値が取り得る値に制約を加えて、第１の次元のクラスタを生成する付記１から付記６のうちのいずれかに記載の視覚化装置。

（付記８）作成された要約グラフを表示するグラフ表示手段を備えた付記１から付記７のうちのいずれかに記載の視覚化装置。

（付記９）前記グラフ表示手段は、要約グラフを表示する際に、ノードまたはエッジに、そのノードまたはそのエッジが対応するクラスタに関する情報であって、前記２次元バイナリデータから直接得られる情報以外の情報である補助情報を追加する付記８に記載の視覚化装置。

（付記１０）前記ノードに関連付けられる第１の次元のクラスタに関する情報に、当該クラスタの識別情報および当該クラスタに属する要素数の少なくともいずれかが含まれ、前記エッジに関連付けられる第２の次元のクラスタに関する情報に、当該クラスタの識別情報が少なくとも含まれる付記１から付記９のうちのいずれかに記載の視覚化装置。

（付記１１）前記クラスタリング手段は、前記２次元バイナリデータが示すバイナリ行列を、２つの行列積に分解することにより、各次元の要素集合に対するクラスタを生成する付記１から付記９のうちのいずれかに記載の視覚化装置。

（付記１２）情報処理装置が、２次元バイナリデータを入力し、前記２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成し、前記クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつ前記ノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成することを特徴とする２次元バイナリデータの視覚化方法。

（付記１３）コンピュータに、２次元バイナリデータを入力する処理、前記２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成する処理、および前記クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつ前記ノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成する処理を実行させるための２次元バイナリデータの視覚化プログラム。

以上、本実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

本発明は、２次元バイナリデータの可視化用途であれば、２次元バイナリデータにおける要素数や次元の内容を問わず、好適に適用可能である。

１０視覚化装置
１１データ入力部
１２次元別要素分類部
１３グラフ作成部
１４グラフ表示部
１０００コンピュータ
１００１ＣＰＵ
１００２主記憶装置
１００３補助記憶装置
１００４インタフェース
１００５ディスプレイ装置
１００６入力デバイス
６０視覚化装置
６１データ入力手段
６２クラスタリング手段
６３グラフ作成手段

Claims

２次元バイナリデータを入力するデータ入力手段と、
前記２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成するクラスタリング手段と、
前記クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつ前記ノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成するグラフ作成手段とを備える
ことを特徴とする視覚化装置。
前記クラスタリング手段は、少なくとも第１の次元のクラスタの各々に対して、当該第１の次元のクラスタに属する要素群が備える特徴が第２の次元のクラスタに対応する成分の集合で表現された特徴値を決定し、
前記グラフ作成手段は、各ノードを、第１の次元のクラスタの特徴値が示す、当該第１の次元のクラスタに属する要素群が具備する特徴とされる第２の次元のクラスタの数に応じてレベル分けし、前記レベルに基づいて各ノードが階層化された要約グラフを作成する
請求項１に記載の視覚化装置。
前記グラフ作成手段は、第２の次元のいずれのクラスタに対応する特徴をも具備しないクラスタに対応するノードをルートノードとして、前記ルートノードから、対応する第１の次元のクラスタにおいて要素群が特徴として具備する第２の次元のクラスタが増加する方向にノードが伸びていく増加グラフ方式の要約グラフを作成し、
前記グラフ作成手段は、前記増加グラフ方式の要約グラフにおいて、各エッジに、接続元ノードに対応する第１の次元のクラスタと比較して接続先ノードに対応する第１の次元のクラスタの要素群における特徴として増加した第２の次元のクラスタに関する情報を関連付ける
請求項２に記載の視覚化装置。
前記グラフ作成手段は、第２の次元の全てのクラスタに対応する特徴を具備するクラスタに対応するノードをルートノードとして、前記ルートノードから、対応する第１の次元のクラスタにおいて要素群が特徴として具備する第２の次元のクラスタが減少する方向にノードが伸びていく減少グラフ方式の要約グラフを作成し、
前記グラフ作成手段は、前記減少グラフ方式の要約グラフにおいて、各エッジに、接続元ノードに対応する第１の次元のクラスタと比較して接続先ノードに対応する第１の次元のクラスタの要素群における特徴として減少した第２の次元のクラスタに関する情報を関連付ける
請求項２に記載の視覚化装置。
前記特徴値が、各桁が第２の次元の各クラスタに対応する数値成分の集合からなる数値であり、
前記グラフ作成手段は、各ノードを、第１の次元のクラスタの特徴値に含まれる０の数または１の数に応じてレベル分けし、前記レベルに基づいて各ノードが階層化された要約グラフを作成する
請求項２から請求項４のうちのいずれかに記載の視覚化装置。
前記クラスタリング手段は、特徴値が取り得る値に制約を加えて、第１の次元のクラスタを生成する
請求項１から請求項５のうちのいずれかに記載の視覚化装置。
作成された要約グラフを表示するグラフ表示手段を備えた
請求項１から請求項６のうちのいずれかに記載の視覚化装置。
前記グラフ表示手段は、要約グラフを表示する際に、ノードまたはエッジに、そのノードまたはそのエッジが対応するクラスタに関する情報であって、前記２次元バイナリデータから直接得られる情報以外の情報である補助情報を追加する
請求項７に記載の視覚化装置。
情報処理装置が、
２次元バイナリデータを入力し、
前記２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成し、
前記クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつ前記ノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成する
ことを特徴とする２次元バイナリデータの視覚化方法。
コンピュータに、
２次元バイナリデータを入力する処理、
前記２次元バイナリデータの次元ごとに、当該次元の要素集合に対して、各要素と対応づけられた成分組の特徴に基づいてクラスタリングを行い、２以上のクラスタを生成する処理、および
前記クラスタリングの結果に基づいて、ノードに一方の次元である第１の次元のクラスタに関する情報が関連付けられ、かつ前記ノードの接続関係を示すエッジに、接続元ノードと接続先ノードの違いを示す情報として他方の次元である第２の次元のクラスタに関する情報が関連付けられたグラフである要約グラフを作成する処理
を実行させるための２次元バイナリデータの視覚化プログラム。