JP5903394B2 - グラフ視覚化表示装置及び方法及びプログラム - Google Patents

グラフ視覚化表示装置及び方法及びプログラム Download PDF

Info

Publication number
JP5903394B2
JP5903394B2 JP2013030415A JP2013030415A JP5903394B2 JP 5903394 B2 JP5903394 B2 JP 5903394B2 JP 2013030415 A JP2013030415 A JP 2013030415A JP 2013030415 A JP2013030415 A JP 2013030415A JP 5903394 B2 JP5903394 B2 JP 5903394B2
Authority
JP
Japan
Prior art keywords
nodes
graph
node
visualization
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013030415A
Other languages
English (en)
Other versions
JP2014142900A (ja
Inventor
亜紀 林
亜紀 林
達史 松林
達史 松林
高秀 星出
高秀 星出
内山 匡
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013030415A priority Critical patent/JP5903394B2/ja
Publication of JP2014142900A publication Critical patent/JP2014142900A/ja
Application granted granted Critical
Publication of JP5903394B2 publication Critical patent/JP5903394B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Generation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、グラフ視覚化表示装置及び方法及びプログラムに係り、特に、複数ノードと当該ノード間をつなぐエッジで構成されるグラフデータを可視化するためのグラフ視覚化表示装置及び方法及びプログラムに関する。
ネットワークをグラフとして可視化する技術(以下、単に「可視化技術」と記す)は、一般にデータとデータとの関連性によってネットワークを形成したグラフデータを可視化することを指す。グラフデータでは、当該要素を示すノードとノード間を繋ぐエッジとで表すことにより視覚化することが可能である。例えば、インターネット上のハイパーリンクの張られたWEBページであれば、各WEBページをノードとして、ハイパーリンクをエッジとして表現することにより、グラフ可視化表示することが可能である。また、例えば、金融・通信・交通・社会組織・遺伝子情報などのネットワーク表示、化学・生物学・医学などのデータをグラフ化したものの表示、テキストデータや画像データについて、関連性を元にグラフ化したものの表示、関連性のあるモジュール群の組み合わせ表示(例えば、ICチップのLSI設計図)、地図や参考書の図解表示に用いられるラベル表示などのように、種々の用途が考えられる。それゆえ、コンピュータによる力学的アルゴリズムを用いたグラフ可視化表示技術は、非常に幅広い分野で需要のある技術である。
<条件>
グラフ可視化表示技術における重要かつ最大の目的として、グラフ可視化表示装置上において、次の二つの条件を可能な限り満たすことが好ましいとされている。
[条件1]ノード同士を重ならずに配置する。
[条件2]関連性のあるノード同士はエッジを介して接続させ、近傍に配置する。
これらの条件を図1に示す。
[条件1]は、異なるノード情報が重なって表示されることによる情報の誤読を防ぐためである。[条件2]は、関連性のあるノードを近傍に配置することにより視覚的な情報認識精度を向上させるためである。上記の2つの条件を満たすべく、ノードのグラフ可視化表示装置上での最適な配置座標を高速に計算することが求められている。
具体的には、パーソナルコンピュータのディスプレイ装置に表示されたウィンドウ内、もしくは印刷に耐えられる画像データのサイズ内に収まる程度(現実的には数百から数千ノード規模)のグラフデータに対して、ウィンドウ内であれば数秒程度で、印刷物としても数分以内に配置の計算を行う必要性がある。この時、上記の2つの条件である「ノード同士が重ならず」かつ「関連性のあるものは近傍に配置」を満たすことが要求される。
また、近年では、Twitter(登録商標)やFacebook(登録商標)といった、SNS(Social Networking Service)を利用したマイクロブログが流行し、常にデータが増加し続ける。このWEB上で増え続けている大規模データ分析においては、データストリームをリアルタイムに処理し、同時に「見える化」することが要求されている。それゆえ、グラフ可視化技術においても、ノード数やエッジ数が変化するなど、データ構造が変化し続けるストリーミングデータの可視化技術が要求されている。なお、ここでは、ノード数やエッジ数が時系列などによって変化するなどといった、データ構造が変化し続けるデータを、ストリーミングデータと呼ぶ。
グラフ可視化表示技術において、このような「ノード数やエッジ数が変化するなど、データ構造が変化し続けるストリーミングデータ」に対して、「ノード同士が重ならず」かつ「関連性のあるものは近傍に配置」を満たすグラフ可視化表示を、「リアルタイム」に「最適な配置を高速に求める」グラフ可視化表示技術を発明することが求められている。
<関連技術>
「最適な配置を高速に求める」という技術に対するグラフ可視化表示技術に関して、様々な手法が提案されてきた。最適な配置を高速に求めることに関する問題は、大きく分けて二つのアプローチがある。
[アプローチ1] 効率的な初期配置を行い、数値計算の目的関数に対する収束を早めさせる。
[アプローチ2] 最適配置のための数値計算を高速化する。
通常、演算の高速化に関して特に効果的なのは[アプローチ2]であり、いかに高速に処理を行うかが鍵となっている。しかしながら、本発明において問題視している課題は「ノード数やエッジ数が変化するなど、データ構造が変化し続けるストリーミングデータ」に対して、リアルタイムにグラフ可視化表示を行う技術の要求である。そのため、[アプローチ1]で述べた「効率的な初期配置手法」が、特に大規模なストリーミングデータを扱うグラフ可視化表示に関して要求される。なお、[アプローチ2]では、特に近似手法を用いた高速化はいくつかの手法が提案されている。これらの手法は、本発明とは対立せず、両立可能な技術であるため、本発明の課題として含めない。
[アプローチ1]では、代表的な手法として、LGL(Large Graph Layout)法を用いたグラフ可視化計算手法がある(参考文献1:Adai, LGL: creating a map of protein function with an algorithm for visualizing very large biological networks Lyon, B.: The Opte Project (2005) http://www.opte.org/)。LGL法は、グラフデータ構造から最小全域木を作成し、作成された全域木の木構造を元に描画を行う。しかしながら、最小全域木を用いた手法では、接続関係を排除するという近似の影響が強く出てしまうため、エッジ接続を持ちながら、極端に離れたノードのペアが生じてしまい、好ましくない結果が生じる。つまり[条件1]は満たすことは可能であるが、[条件2]に関しては可読性を十分満たすことができない。
また、次数を考慮して次数の高いものから中心付近に配置して計算処理を行っていく方法が提案されている(例えば、参考文献2:土井、伊藤:力学モデルを用いた階層型グラフデータ画面配置手法の改良手法とウェブサイト視覚化への応用,芸術科学会論文誌,Vol. 3,No. 4,pp. 250-263, (2004))。当該手法は、ターゲットとするグラフデータは数十〜百ノード程度で、全てのノードが連結されている場合に非常に有効である。しかしながら、部分グラフから構成されているグラフデータや、特に大規模なグラフデータでは有効な手段ではない。
また、ストリーミングデータに対する、ノードの追加を考慮した効率的な初期配置が提案されている(例えば、非特許文献1参照)。
松林達史,西田京介、星出高秀、藤村考:リアルタイムグラフ可視化:東日本大震災時のTwitter,第8回ネットワーク生態学シンポジウムO3-5 (2012).
上記のことから、「ノード数やエッジ数が変化するなど、データ構造が変化し続けるストリーミングデータ」に対して「ノード同士が重ならず」かつ「関連性のあるものは近傍に配置」を満たすグラフ可視化計算のために、効率のよい初期配置を考えることが必要である。
しかしながら、非特許文献1の技術では、既存ノード間に新たにエッジが追加された場合は考慮していない。そこで、本発明では、既存ノード間にエッジが追加された際、それを考慮することで、より効率のよい初期配置を決定する手法を提案する。
本発明は、上記の点に鑑みなされたもので、グラフ可視化技術において、「ノード数やエッジ数が変化するなどの、データ構造が変化し続けるストリーミングデータ」に対して「ノード同士が重ならず」かつ「関連性のあるものは近傍に配置」を満たすグラフ可視化表示を、「リアルタイム」に「最適な配置を高速に求める」ことが可能なグラフ視覚化表示装置及び方法及びプログラムを提供することを目的とする。
この際、前述した非特許文献1で考慮されていなかった、既存ノード間に追加された新規エッジを考慮することで、より高速、高精度な初期配置を決定する。
上記の課題を解決するため、本発明(請求項1)は、ネットワークをグラフとして可視化するグラフ視覚化表示装置であって、
複数のノードと当該ノード間の関係性をエッジとして表現したグラフデータに基づきグラフ可視化イメージを生成する可視化処理手段と、
前記可視化処理手段において生成された前記グラフ可視化イメージを表示する表示手段と、を有し、
前記可視化処理手段は、
前記表示手段のディスプレイ空間上に既に配置されている二つのノード間に、新たにエッジが追加された場合に、
追加されたエッジの両端のノードを近づけるように、かつ、移動距離の和特定の値の範囲となるように移動させてノードの配置を変更する配置変更手段と、
前記配置変更手段の後に、追加されたノードを配置する追加ノード配置決定手段と、
全ノードに対して所定の力学モデルを適用して各ノードの位置を修正するノード配置座標最適化更新手段と、を有する。
また、本発明(請求項2)は、請求項1の前記配置変更手段において、
追加されたエッジの両端のノードの移動距離の割合を、ノードの次数が高いほど割合を小さくし、該割合に基づいてノードの配置を変更する手段を含む
請求項1記載のグラフ視覚化表示装置。
また、本発明(請求項3)は、請求項1または2の前記配置変更手段において、
既存ノード間に追加されたエッジの、元のエッジ長が、全エッジ長平均を元に定めた閾値以上の場合のみ、前記追加されたエッジの両端のノードを移動させる手段を含む。
また、本発明(請求項4)は、請求項1または2の前記配置変更手段において、
複数のエッジが追加された場合、該エッジのエッジ長の長いものから順に移動処理を行う手段を含む。
本発明(請求項5)は、ネットワークをグラフとして可視化するグラフ視覚化表示装置であって、
複数のノードと当該ノード間の関係性をエッジとして表現したグラフデータに基づきグラフ可視化イメージを生成する可視化処理手段と、
前記可視化処理手段において生成された前記グラフ可視化イメージを表示する表示手段と、を有し、
前記可視化処理手段は、
前記表示手段のディスプレイ空間上に既に配置されている二つのノード間に、新たにエッジが追加された場合に、
追加されたエッジの両端のノードを近づけるように、あるいは、遠ざけるように、かつ、移動距離の和特定の値の範囲となるように移動させてノードの配置を変更する配置変更手段と、
前記配置変更手段の後に、追加されたノードを配置する追加ノード配置決定手段と、
全ノードに対して所定の力学モデルを適用して各ノードの位置を修正するノード配置座標最適化更新手段と、を有する。
また、本発明(請求項6)は、請求項5の前記配置変更手段において、
移動方向及び移動距離を、全エッジ長平均に基づいて定める手段を含む。
また、本発明(請求項7)は、請求項5の前記配置変更手段において、
追加されたエッジの両端のノードの移動距離の割合を、ノードの次数が高いほど割合を小さくし、該割合に基づいてノードの配置を変更する手段を含む。
また、本発明(請求項8)は、請求項5または6の前記配置変更手段において、
複数のエッジが追加された場合、該エッジのエッジ長の長いものから順に移動処理を行う手段を含む。
上記のように、本発明では、エッジ追加において、両端のノードを、
・両者の移動距離の和を特定の値の範囲とする;
・両者の移動距離の割合を、ノードの次数が高いほど割合を小さくする;
・元のエッジ長がエッジ長平均を元に定めた閾値以上の場合のみ、移動処理を行う;
・複数のエッジが追加された場合、そのエッジ長の長いものから順に移動処理を行う;ことにより、最適な配置に近い初期配置を得ることができ、再配置計算の収束が早くなる。
また、本発明は、新たなエッジを追加する際に、その両端のノードを近づけるだけではなく、元のエッジ長が短い場合には遠ざける処理も行うことにより、ノードやエッジの重なりの増加から可読性を低下させることなく、エッジ長のばらつきを抑えることが可能となり、リアルタイム性の重視されるストリーミングデータの可視化に有効である。その際は、上記の4つの特徴のうち、3つ目のエッジ長平均を元に定めた閾値による処理対象の条件付けは実施せず、代わりに、全ての既存ノード間追加エッジに対して、エッジ長平均をもとにノードの移動方向や移動距離を決定する。
グラフ可視化表示技術におけるグラフ可視化表示装置上の条件である。 本発明の第1の実施の形態におけるグラフ可視化表示装置の構成図である。 本発明の第1の実施の形態における概要動作のフローチャートである。 本発明の第1の実施の形態による既存ノード間新規エッジの追加方法の概要を示す図である。 本発明の第1の実施の形態による「既存ノード間の新規エッジの追加方法その1」を説明するための図である。 本発明の第1の実施の形態におけるグラフ可視化表示装置の処理全体のフローチャートである。 本発明の第1の実施の形態における図6のS304の詳細な処理のフローチャートである。 本発明の第1の実施の形態と第2の実施の形態との既存ノード間のエッジ追加処理の比較である。 本発明の第2の実施の形態におけるα・βの値に応じた評価結果である。 本発明の第1の実施の形態におけるノードの追加・最適化計算まで含めた評価結果である。 本発明の第1の実施の形態における追加エッジ長の条件の評価結果である。 本発明の第1の実施の形態におけるエッジを考慮する順番の評価結果である。 本発明の第1の実施の形態における別時刻のデータを含む評価結果である。 本発明の第1の実施の形態における各特徴がもたらす効果の評価結果である。 従来手法による初期配置結果である。 第1の実施の形態の手法による初期配置結果である。 第2の実施の形態の手法による初期配置結果である。
以下、図面と共に本発明の実施の形態を説明する。
[第1の実施の形態]
まず、本実施の形態の概要を説明する。
図2は、本発明の第1の実施の形態におけるグラフ可視化表示装置の構成を示す。
本発明のグラフ可視化表示装置は、グラフデータに基づいてノードと、ノード間の接続を表すエッジとを含む可視化イメージを生成する処理部11と、この処理部11において生成された可視化イメージを表示する表示部13と、を備える。
処理部11は、表示部13に表示されるディスプレイ空間に、ノードの最適配置計算結果を反映したノードを配置する。この際、図3に示すように、まず、既存のノードに新たに加わったエッジに対して(ステップ1)、ノード間距離(エッジの長さ)、ノードの次数比率、平均エッジ長などを考慮に入れて、既存ノードの配置修正を行う(ステップ2)。配置修正の後にノードの追加や削除に従って初期配置を決定する(ステップ3)。更に、全ノードに対して所定の力学モデルを適用して配置の最適化を行っていく(ステップ4)。
例えば、図4のように、(a)の既存配置ノードに対して、(b)と(c)で示されるノードとエッジの追加を行うとき、(d)の従来手法による配置に比べて、ノード追加処理の前に、既存ノード間の新規エッジを考慮して座標の移動を行った(e)の本発明の手法による初期配置の方が、全体的なエッジ長のばらつきが小さく、好ましい初期配置になっている。また、新規ノードの追加処理よりも前に、既存ノード間の追加エッジを考慮することで、新規追加ノードである10番の初期配置も、従来手法に比べて力学モデル適用時の移動距離が少なくなるような配置となっている。
本発明では、新たなエッジを追加する場合、その両端のノードを互いに近づけるように移動させる処理を行う際に、以下のように、ノードの移動のさせ方、移動処理の可否の基準、あるいは、移動処理の順番を考慮する。
(1)両者の移動距離の割合を、ノードの次数が高い方ほど割合を小さくする(例:次数に反比例させる)。
(2)両者の移動距離の和を特定の値の範囲とする(例:元のエッジ長以下にする、あるいは、元のエッジ長の半分〜元のエッジ長とする)
(3)元のエッジ長が、エッジ長平均を元に定めた閾値以上の場合のみ、移動処理を行う。
(4)複数のエッジが追加された場合、そのエッジ長の長いものから順に移動処理を行う。
エッジ追加において、両端のノードに対して上記の移動処理を行うことにより、最適な配置に近い初期配置を得ることができ、再配置計算(従来技術)の収束が早くなる。
以下、詳細に説明する。
[既存ノード間エッジ追加処理その1]
まず、上記の(1)、(2)の処理について説明する。
新たに接続関係を持った既存ノードの初期配置を互いに近づける際、各点の移動距離は、2点の次数に反比例させる。また、2点の移動距離の総和を、元のエッジ長の半分程度に抑える。すなわち、2点a,bの元の位置をそれぞれ、a→、b→(ただし、→はベクトルを表す)とし、2点のa,bの次数をそれぞれda,dbとするとき、移動後の点a,点bの位置は以下のようになる。
ここで、αは2点を近づける割合であり、座標の移動距離の総和に値する。後述する図9及び実施例の「発明を用いた処理の定量的評価」で示すように、α=0.5が優れていた。
例えば、図5(a)の既存配置ノードに対して、(b)で示される既存ノード間のエッジの追加を行う場合を考える。2番と10番を移動させる場合、2番の次数は5、10番の次数は6なので、(c)にあるように、6:5の割合で移動させる。同様にして、1番と10番を移動させる場合も、1番の次数は5、10番の次数は6なので、(d)に示されるように、6:5の割合で移動させる。いずれも、座標移動距離の総和であるαは、元のエッジ長の半分を示す0.5としてある。
[既存ノード間エッジ追加処理その2]
上記の(3)について説明する。
新規エッジが検出された2点を近づける際、移動前の2点間の距離が閾値よりも近い場合、エッジが近づきすぎて重なってしまうことを避けるために、移動を行わない。閾値としては、エッジ長平均の倍数で、エッジ長平均よりも小さい値をとる。例えば、図9より0.5μを用いている。ここで、μは既存エッジ長の平均値である。
[既存ノード間エッジ追加処理その3]
新規エッジが複数検出された際には、配置変更前のエッジの長さが長いものから順に、逐次的に処理を行う。後述する図10にあるように、経験的にこの順が最も効果的であると判断したためである。例えば、図5では、元のエッジ長が長い2番と10番のエッジを、元のエッジ長が短い1番と10番のエッジよりも先に考慮している。
以下、図2のグラフ可視化表示装置の図に基づいて詳細に説明する。
図2では、グラフデータの可視化表示を行うグラフ可視化表示装置としてのコンピュータシステムの構成を示す。
グラフ可視化表示装置10は、グラフ可視化表示処理をプログラム制御により実行する処理部(CPU)11、処理部11を制御するプログラムを格納した主メモリ12、処理部11により生成されたグラフデータの可視化イメージを表示する表示部13、処理対象であるグラフデータを格納した記憶部14を備える。
なお、図2では、本実施の形態を実現するための構成のみを図示している。実際には、図示された構成の他に、各種の命令やデータを入力するためのキーボードやマウスなどの入力装置、各種周辺機器、ネットワークに対するインタフェースなどが設けられていることを前提とする。
また、本実施の形態によるグラフ可視化表示装置10の処理部11は、グラフデータに基づいて、既存のノード同士の新規エッジを検出して、それらの初期配置に近づける既存ノード間追加エッジによる初期配置決定部21、追加ノード配置決定部22、削除ノード処理部23、所定の力学モデルに従いノード座標の最適化計算を行うノード配置座標最適化更新処理部24を備え、各種構成要素は、主メモリ12に保持されているコンピュータプログラムにより制御された処理部11において実現される仮想的なソフトウェアプログラムである。
ノード配置座標最適化更新処理部24では、グラフ配置に関する前述した二つの条件である「ノード同士が重ならず」かつ「関連性のあるものは近傍に配置」を満たすために、一般的に広く用いられている力学モデルを利用する。この力学モデルとして、世界中でバネモデル法(Kamada, T., and Kawai, S.: An algorithm for drawing general undirected graphs, Information Processing Letters, 12, 31, 7-15 (1989))、Force-directed法(Fruchterman, T. M. J., and Reingold, E. M.: Graph Drawing by Force-directed Placement, Software - Practice and Experience, 11, 21, 1129 -1164 (1991))の2つが最も頻繁に利用されている。バネモデル法は、全てのノード間に仮想的なバネを仮定し、座標の更新手法を1ノードずつ逐次的に行う手法である。一方、Force-directed法では、全てのノード間で斥力を与え(例えば、分子間に働くクーロン斥力のように)、接続されているノード間(エッジ)には引力を与え、座標をこの引力と斥力の総和を用いて、まとめて更新していく。上記の二つの、いずれかの手法においても、全てのノード間に反発する力が働き、[条件1]で要求される、ノード同士の重なりの排除を実施することができる。また、接続するノード同士では引き合う力が働き、[条件2]で要求される、接続ノードを近傍に配置することを実施することができる。また、上記の二つの手法においては、引力と斥力の関数が一意に決まると、最急降下法やニュートン法などの数値計算法を用いて、目的関数が収束する(最大エントロピーが求まる)ように座標を更新する。
図6は、本発明の第1の実施の形態における、グラフ可視化表示装置の処理全体のフローチャートである。
当該フローチャートでは、既存ノード間追加エッジによる初期配置決定部21、追加ノード配置決定部22、削除ノード処理部23、及び、ノード配置座標最適化更新処理部24による、追加エッジ、追加ノードの配置及び削除に加えて、全てのノードの座標の最適化更新処理を示す。
記憶部14よりグラフデータ入力され(ステップ301)、入力されたグラフデータに対し、ノード情報を更新するタイミングになったら(ステップ302、ステップ303,Yes)、既存ノード間の新規エッジを検出して既存ノードの座標を移動させた後(ステップ304)、ノードの追加や削除を実施し(ステップ305、306)、力学モデルによる最適化を行うことで、最終的な配置を決定する(ステップ307)。ノードの追加処理の前に、既存ノード間の新規エッジを考慮した座標変更を行うことで、該当ノードと接続関係を持つ新規エッジの初期配置にも座標変更を反映させることが可能になる。
上記の図6における既存ノード間新規エッジを考慮して既存ノードの座標を更新するステップ304の処理について説明する。
図7は、本発明の第1の実施の形態における図6のステップ304の詳細な処理のフローチャートである。
入力データの中に、既存ノード間の新規追加エッジが検出された場合(ステップ401,402)、エッジ長の長いものから優先的に、追加エッジを構成する2点の座標を変更していく(ステップ403,405)。この際、エッジ長が全エッジ長の平均の半分よりも短い場合は、2点が重なってしまうことを避けるため、座標変更処理を実施しない(ステップ404,No)。
[第2の実施の形態]
本実施の形態のグラフ可視化表示措置の構成は、第1の実施の形態の図2の構成と同様である。
第1の実施の形態では、既存ノード追加エッジによる初期配置決定部21において、既存ノード間に追加されたエッジについて、既存ノード同士を近づけるように移動させたが、本実施の形態では、新たに接続を持った既存ノードの初期配置を変更する際、元のエッジ長が十分長い場合には、第1の実施の形態にと同様に、2点を近づける処理を行い、逆に元のエッジ長が短い場合には、2点を遠ざける処理を行う。
以下では、第1の実施の形態とは異なる既存ノード間追加エッジによる初期配置決定部21の処理について説明する。
図8は、本発明の第2の実施の形態における既存ノード間の新規エッジ追加処理の例を示す。
同図(a)は、処理前を示し、(b)の追加エッジは、既存ノード間に追加されたエッジである。第1の実施の形態の手法では、エッジ長が0.5μよりも短い、2番、3番を結ぶ新規エッジについては(c)に示すように、移動の対象とはならなかった。これに対し、本実施の形態では、同エッジについて、2点を遠ざける処理を行い、(d)に示すように座標移動を実施する。本実施の形態では、よりエッジ長のばらつきが少なく、限られたディスプレイ空間の有向活用が必須となる可視化において、理想的な配置を得ることができる。
本実施の形態では、移動後の点の位置を以下の式で算出する。
ここでは、αは第1の実施の形態の式(1)、(2)と同様に、2点を近づける割合を示すが、座標の移動距離の総和に値するとは限らない。βは、移動距離の大きさに加え、移動方向(正ならば近づける方向、負ならば遠ざける方向)を決める定数である。βにより、2点を近づけるか遠ざけるかを判定する閾値が定まる。α、βの値としては、図9と後述する第2の実施例の"定量評価"で示すように、α=0.8、β=0.8が優れていた。
上記の式(3)、(4)では、第1の実施の形態の式(1)、(2)と異なり、エッジ長がβμよりも長い場合は正の方向、短い場合は負の方向に移動が行われる。従って、第1の実施の形態における、元のエッジ長に応じた処理対象の選択は不要となる。
また、エッジ長が短い場合に、処理を行わないだけでなく、負の方向への移動、すなわち2点を遠ざける方向への移動が行われるため、より初期配置結果におけるエッジ長のばらつきが少なくなる。加えて、第1の実施の形態の式(1)、(2)では、2点の移動距離の総和を示す割合を全エッジとしてαで固定していたが、本実施の形態では、元のエッジ長の長さに比例して、2点の移動距離の総和を示す割合も増減するため、元から平均エッジ長に近く、あまり長くもなかったエッジが近づきすぎることを防ぐこともできる。
また、エッジ長が特に長かったものに対しては、第1の実施の形態の場合のα=0.5以上に近づけることができる。
[第1の実施例]
以下に、第1の実施の形態の手法を用いた処理の定量的評価を示す。
本発明の第1の実施の形態の効果を考察するために、検証を行った。
用いたデータは、twitter(登録商標)の発言の1%ストリーミングデータのうち、東日本大震災が発生した2011年3月11日前後のものである。本発明は、twitter(登録商標)データのような、ダイナミックにノードやエッジが変化するデータに対して、特に効果を持つと考えられるためである。
このストリーミングデータで、5分毎に時間窓を設定して形態素解析によるキーワード抽出を行い、キーワードをノードとした。また、各時間窓内において、キーワードの出現頻度から、Jaccard係数を用いて同つぶやきにおける共起度が0.05以上のエッジ情報を抽出した。最終的に、この時間窓を1分ごとにずらしたネットワークデータを複数用意して利用した。今回定量評価に用いた時刻におけるデータの規模は、ノード数が500前後、エッジ数が2000前後であった。定量評価としては、所定の力学モデルを用いて、計算の最適化配置を行い、以下の式(5)で導かれるグラフデータのエッジ長の平均二乗誤差σで評価を行った。
ここで、Eは全エッジ、xijはi番目の点とj番目の点から構成される辺の長さ、μは全エッジ長の平均である。σが小さいほど、辺の長さのばらつきが少なく、限られたディスプレイ空間の有効活用が必須となる可視化において、理想的なグラフであるといえる。
まず、初めに、20時50分のデータを用いて、配置計算が十分収束するまで所定の力学モデルによる最適配置計算を行い、20時50分の配置座標を取得する。取得した20時50分の座標を元に20時51分のデータを追加し、第1の実施の形態の手法を用いて配置の初期化を行った場合と、エッジの追加を考慮していない従来手法(非特許文献1)を用いて配置の初期化を行った場合で比較を行った。
図10がその結果である。(a)及び(b)は、従来手法と第1の実施の形態の手法のエッジ長の平均二乗誤差で、従来手法と比べて第1の実施の形態の手法の方がエッジ長のばらつきが小さくなっていることが分かる。また、初期値として(a)の従来手法に比べて、(b)の第1の実施の形態の手法は30%近く小さい値となっている。この結果、最適化処理の初期からエッジ長のばらつきを少なく抑えることができている。
第1の実施の形態の手法では、既存ノード間の新規エッジが検出された際に、2点を近づける割合αを、2点が完全に一致する移動を1としたとき、その半分の0.5としている。すなわち、2点の総移動距離が、元のエッジ長の半分となっている。また、検出されたエッジの長さが0.5μ(μエッジ長の平均)よりも大きかった場合のみ、既存ノードを近づける処理を実施している。これらの有意性を考察する。
図11は、エッジを近づける割合と、移動するエッジ長の条件を変化させた際のエッジ長のばらつきσを検証したものである。追加エッジを処理する順番については、エッジ長の長い順とした。エッジ長の条件選択に関わらず、エッジを近づける場合αが0.5付近の時に、最もエッジ長の平均二乗誤差σが小さくなっていることが確認できる。また、(a)条件を設けず、全ての新規エッジに対して移動を行った場合に比べて、(c)0.5μより長い辺のみを動かすという条件を設定した際に、σが小さくなっていることも確認できる。
また、第1の実施の形態の手法では、既存ノード間の新規エッジが同時刻に複数検出された際、エッジ長が長いものから順に、ノードの移動を実施する。この処理順序の有意性を検証する。
図12は、エッジの追加を処理する順番に応じて、エッジを近づける割合αとエッジの平均二乗誤差σの変化を計測した結果である。処理を行うエッジ長の条件については、平均エッジ長の半分(0.5μ)で固定した。2点の次数和の降順・昇順、エッジ長の降順・昇順についてそれぞれ観察したところ、(b)のエッジ長が長い順とした際に、最もエッジ長の平均二乗誤差σが短くなることが確認できる。また、2点を近づける割合についても、α=0.5付近のσが最も小さくなっている。
さらに、αを0.5に固定した状態で、第1の実施の形態を適用した際の、σの詳細な値を図13に示す。他の2種類の時刻についても検証した。全ての時刻について、少なくとも約30%ほど最適化更新処理前のエッジの平均二乗誤差σが削減できていることが分かる。また、座標を移動させるエッジにエッジ長で条件を付ける処理、考慮するエッジの順番をエッジ長の降順にする処理のそれぞれにおいて、全ての時刻でσが小さくなっていることが分かる。
次に、第1の実施の形態で提案した各特徴を単独及び複数で用いた場合の効果を検証した結果を図12に示す。また、図14中の4つの特徴の詳細を以下に示す。
(1)移動割合:
新たなエッジを追加する場合、その両端のノードを互いに近づけるように移動させる。その際、移動距離の割合を、ノードの次数が高いほど割合を小さくする(例:次数に反比例させる)。
(2)移動距離和:
両者の移動距離の和を特定の値の範囲とする(例:元のエッジ長以下にする、あるいは、元のエッジ長の半分〜元のエッジ長とする)
(3)処理対象:
元のエッジ長が、エッジ長平均を元に定めた閾値以上の場合のみ、移動処理を行う。
(4)処理順:
複数のエッジが追加された場合、そのエッジ長の長いものから順に移動処理を行う。
ここで、特徴(2)を除いてしまうと、2点を全く近づけない(α=0)または2点が完全に一致するまで近づける(α=1)ということになってしまうため、特徴(2)を用いた上で他の3つの特徴の効果を検証した。図14を見ると、(a)の特徴(2)単独の場合でも、ある程度の効果が出ていることがわかる。(a)の特徴(2)単独の場合に比べ、(b)(1)+(2)、(c)(2)+(3)、(d)(2)+(4)では、それぞれ効果が高くなっており、(3)、(4)に比べて(1)の方がより効果的であることがわかる。加えて、2つの特徴を同時に加えた場合、(h)の全ての特徴を同時に用いた場合を見ると、用いる特徴数が多いほど効果的であるといえる。以上のように、第1の実施の形態で提案した各特徴を単独または複数で用いると、全てにおいて一定の効果を示すことができ、複数用いる場合にはさらに効果が高くなることを示すことができた。
[第2の実施例]
<定量評価>
上記の第1の実施例と同じデータを用いて、α、βを変化させた時の、20時51分の初期配置の平均二乗誤差σを計算した結果を、等高線図で描いた結果は図9に示す通りである。α=0.8、β=0.8付近で、最も平均二乗誤差が小さくなることが分かった。このとき、平均二乗誤差のσの値は、0.6888901となっており、第1の実施の形態の手法を、同じデータの同時刻に用いたときの平均二乗誤差0.6990143から、若干の向上が見られた。
<可視化結果の考察>
初期配置を可視化した結果について、考察を行う。図15に、従来手法(非特許文献1)を用いた場合の、20時51分の初期配置可視化結果を、図16に第1の実施の形態の手法を用いた場合の、同時刻の初期配置可視化結果を、図17に第2の実施の形態の手法を用いた場合の同時刻の初期配置可視化結果を示す。図中で点線で描かれているエッジは、既存ノード間に新規に追加されたエッジである。
図15〜図17の3つの図を比較すると、従来手法(図15)に比べ、第1の実施の形態の手法(図16)、第2の実施の形態の手法(図17)の両方で、既存ノード間に追加されたエッジのうち、特にエッジ長が長いものが減り、エッジ長のばらつきが少なくなっていることが分かる。
また、特に太線で囲まれた三角形(a)を比較すると、従来手法では、新規エッジで結ばれた既存ノードが非常に遠くに配置され、大きな三角形ができてしまっているものの、第1の実施の形態の手法では、三角形の各辺の長さが半分以下に縮められていることが分かる。
さらに、第2の実施の形態の手法では、第1の実施の形態の手法よりも各辺の長さが平均エッジ長に近くなっている。これは、第2の実施の形態の手法では、元のエッジ長に比例して、近づける割合を増減することができるため、長いエッジを持つノードほど、より近くに再配置することができるためである。ここでは、<定量評価>で示したように、エッジ長の平均二乗誤差が最も小さかったα=0.8、β=0.8を採用しているが、第1の実施の形態と異なり、新たにβを設定することで、長いエッジに対しては、第1の実施の形態の場合のα=0.5以上の割合で近づけることが可能になっている。これにより、第2の実施の形態の手法では、三角形(a)の大きさが、第1の実施の形態のものよりも小さくなっていると考えられる。
続いて、灰色の楕円(b)で囲まれている箇所に注目して比較を行う。従来手法では、既存ノードを1つ飛び越えて、既存ノード間の新規エッジが張られてしまっているが、第1の実施の形態と、第2の実施の形態の手法では、ノードの配置が入れ替わり、新規に接続関係を持ったノードが関連するノードに近づくように配置されている。第2の実施の形態と第1の実施の形態の手法を比べると、第2の実施の形態では、楕円(b)で囲まれている既存エッジと、隣接する既存ノード間新規エッジの長さが、ほぼ等しくなっており、よりエッジ長のばらつきが減って、初期配置の精度が高くなっていることが分かる。
第2の実施の形態の効果として、特に楕円(c)に囲まれている箇所を上げることができる。第1の実施の形態の手法では、点線で示された既存ノード間新規エッジについてノードが近づきすぎてしまい、他の既存エッジにまぎれてしまう位置まで移動させられているため、ノードの移動を実施していない従来手法よりも可読性が低下してしまっている。第1の実施の形態の手法では、閾値によって処理対象を限定しているが、閾値よりは長いものの、比較的短いエッジも近づけるように作用する。これによって、比較的短いエッジが、さらに短くなってしまう場合があり、このようなノードの重なりが生じてしまう場合がある。
一方、第2の実施の形態の手法では、既存ノード間に追加されたエッジのうち、閾値より短いものは短いものほど長くなるように、閾値より長いものは、長いものほど短くなるようにノードの移動を行い、閾値と同じくらいの長さのものはあまり長さを変えない。これにより、ノードやエッジの重なりの増加から可読性を低下させることなく、エッジ長のばらつきを抑えることが可能となった。
以上の評価から、改良手法により、平均二乗誤差の若干の向上に加えて、可視化結果の可読性の向上が見られることが分かる。第2の実施の形態の手法は、リアルタイム性の重視されるストリーミングデータの可視化に、よりふさわしい初期配置手法であるといえる。
上記の図2に示す処理部11の動作を主メモリ12に格納して実行する以外に、処理部の動作をプログラムとして構築し、ネットワークを介して流通させることも可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
10 グラフ可視化表示装置
11 処理部
12 主メモリ
13 表示部
14 記憶部
21 既存ノード間追加エッジによる初期配置決定部
22 追加ノード配置決定部
23 削除ノード処理部
24 ノード配置座標最適化更新処理部

Claims (11)

  1. ネットワークをグラフとして可視化するグラフ視覚化表示装置であって、
    複数のノードと当該ノード間の関係性をエッジとして表現したグラフデータに基づきグラフ可視化イメージを生成する可視化処理手段と、
    前記可視化処理手段において生成された前記グラフ可視化イメージを表示する表示手段と、を有し、
    前記可視化処理手段は、
    前記表示手段のディスプレイ空間上に既に配置されている二つのノード間に、新たにエッジが追加された場合に、
    追加されたエッジの両端のノードを近づけるように、かつ、移動距離の和特定の値の範囲となるように移動させてノードの配置を変更する配置変更手段と、
    前記配置変更手段の後に、追加されたノードを配置する追加ノード配置決定手段と、
    全ノードに対して所定の力学モデルを適用して各ノードの位置を修正するノード配置座標最適化更新手段と、
    を有することを特徴とするグラフ視覚化表示装置。
  2. 前記配置変更手段は、
    追加されたエッジの両端のノードの移動距離の割合を、ノードの次数が高いほど割合を小さくし、該割合に基づいてノードの配置を変更する手段を含む
    請求項1記載のグラフ視覚化表示装置。
  3. 前記配置変更手段は、
    既存ノード間に追加されたエッジの、元のエッジ長が、全エッジ長平均を元に定めた閾値以上の場合のみ、前記追加されたエッジの両端のノードを移動させる手段を含む
    請求項1または2記載のグラフ視覚化表示装置。
  4. 前記配置変更手段は、
    複数のエッジが追加された場合、該エッジのエッジ長の長いものから順に移動処理を行う手段を含む
    請求項1または2記載のグラフ視覚化表示装置。
  5. ネットワークをグラフとして可視化するグラフ視覚化表示装置であって、
    複数のノードと当該ノード間の関係性をエッジとして表現したグラフデータに基づきグラフ可視化イメージを生成する可視化処理手段と、
    前記可視化処理手段において生成された前記グラフ可視化イメージを表示する表示手段と、を有し、
    前記可視化処理手段は、
    前記表示手段のディスプレイ空間上に既に配置されている二つのノード間に、新たにエッジが追加された場合に、
    追加されたエッジの両端のノードを近づけるように、あるいは、遠ざけるように、かつ、移動距離の和特定の値の範囲となるように移動させてノードの配置を変更する配置変更手段と、
    前記配置変更手段の後に、追加されたノードを配置する追加ノード配置決定手段と、
    全ノードに対して所定の力学モデルを適用して各ノードの位置を修正するノード配置座標最適化更新手段と、
    を有することを特徴とするグラフ視覚化表示装置。
  6. 前記配置変更手段が、
    移動方向及び移動距離を、全エッジ長平均に基づいて定める手段を含む
    請求項5記載のグラフ視覚化表示装置。
  7. 前記配置変更手段は、
    追加されたエッジの両端のノードの移動距離の割合を、ノードの次数が高いほど割合を小さくし、該割合に基づいてノードの配置を変更する手段を含む
    請求項5記載のグラフ視覚化表示装置。
  8. 前記配置変更手段は、
    複数のエッジが追加された場合、該エッジのエッジ長の長いものから順に移動処理を行う手段を含む
    請求項5または6記載のグラフ視覚化表示装置。
  9. ネットワークをグラフとして可視化するグラフ視覚化表示方法であって、
    複数のノードと当該ノード間の関係性をエッジとして表現したグラフデータに基づきグラフ可視化イメージを生成する可視化処理手段と、
    前記可視化処理手段において生成された前記グラフ可視化イメージを表示する表示手段と、を有する装置において、
    前記表示手段のディスプレイ空間上に既に配置されている二つのノード間に、新たにエッジが追加された場合に、
    前記可視化処理手段が、追加されたエッジの両端のノードを近づけるように、かつ、移動距離の和特定の値の範囲となるように移動させてノードの配置を変更する配置変更ステップと、
    前記可視化処理手段が、前記配置変更ステップの後に、追加されたノードを配置する追加ノード配置決定ステップと、
    前記可視化処理手段が、全ノードに対して所定の力学モデルを適用して各ノードの位置を修正するノード配置座標最適化更新ステップと、
    を行うことを特徴とするグラフ視覚化表示方法。
  10. ネットワークをグラフとして可視化するグラフ視覚化表示方法であって、
    複数のノードと当該ノード間の関係性をエッジとして表現したグラフデータに基づきグラフ可視化イメージを生成する可視化処理手段と、
    前記可視化処理手段において生成された前記グラフ可視化イメージを表示する表示手段と、を有する装置において、
    前記表示手段のディスプレイ空間上に既に配置されている二つのノード間に、新たにエッジが追加された場合に、
    前記可視化処理手段が、追加されたエッジの両端のノードを近づけるように、あるいは、遠ざけるように、かつ、移動距離の和特定の値の範囲となるように移動させてノードの配置を変更する配置変更ステップと、
    前記可視化処理手段が、前記配置変更ステップの後に、追加されたノードを配置する追加ノード配置決定ステップと、
    前記可視化処理手段が、全ノードに対して所定の力学モデルを適用して各ノードの位置を修正するノード配置座標最適化更新ステップと、
    を行うことを特徴とするグラフ視覚化表示方法。
  11. コンピュータを、
    請求項1乃至8のいずれか1項に記載のグラフ視覚化表示装置の各手段として機能させるためのグラフ視覚化表示プログラム。
JP2013030415A 2012-12-25 2013-02-19 グラフ視覚化表示装置及び方法及びプログラム Expired - Fee Related JP5903394B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013030415A JP5903394B2 (ja) 2012-12-25 2013-02-19 グラフ視覚化表示装置及び方法及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012280612 2012-12-25
JP2012280612 2012-12-25
JP2013030415A JP5903394B2 (ja) 2012-12-25 2013-02-19 グラフ視覚化表示装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014142900A JP2014142900A (ja) 2014-08-07
JP5903394B2 true JP5903394B2 (ja) 2016-04-13

Family

ID=51424110

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013030415A Expired - Fee Related JP5903394B2 (ja) 2012-12-25 2013-02-19 グラフ視覚化表示装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5903394B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2015072059A1 (ja) 2013-11-13 2017-03-16 日本電気株式会社 ネットワーク図描画システム、ネットワーク図描画方法およびネットワーク図描画プログラム
JP6223947B2 (ja) * 2014-10-15 2017-11-01 株式会社toor 情報表示方法及び情報表示装置
CA3034203C (en) * 2016-08-26 2022-06-21 1Qb Information Technologies Inc. Method and system for performing real-time analytics on a plurality of data streams
WO2023286167A1 (ja) * 2021-07-13 2023-01-19 日本電信電話株式会社 可視化装置、可視化方法、及び可視化プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3790679B2 (ja) * 2001-04-06 2006-06-28 インターナショナル・ビジネス・マシーンズ・コーポレーション グラフデータ視覚化装置、グラフィックス作成方法、プログラム及び記憶媒体
JP2007193380A (ja) * 2006-01-16 2007-08-02 So-Net Entertainment Corp 情報処理装置,情報処理方法,およびコンピュータプログラム

Also Published As

Publication number Publication date
JP2014142900A (ja) 2014-08-07

Similar Documents

Publication Publication Date Title
US20230394203A1 (en) Generating integrated circuit floorplans using neural networks
CN108604315B (zh) 使用深度学习模型识别实体
US10867083B2 (en) Technique for generating approximate design solutions
US20180253649A1 (en) Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm
JP2017097643A (ja) 機械学習プログラム、機械学習方法及び情報処理装置
US11675928B2 (en) Electronic device for obfuscating and decoding data and method for controlling same
CN106471525A (zh) 增强神经网络以生成附加输出
JP5903394B2 (ja) グラフ視覚化表示装置及び方法及びプログラム
US11416760B2 (en) Machine learning based user interface controller
JP7342242B2 (ja) 学習を転移させるための学習のためのフレームワーク
CN108027809B (zh) 基于深度学习的体设计的功能相关
US9626631B2 (en) Analysis device, analysis method, and program
US9342222B2 (en) Accessible chart navigation using object neighborhood
JP5700841B2 (ja) グラフデータ可視化表示装置及び方法及びプログラム
JP2020098387A (ja) 因果関係表示システム及び方法
JP4939486B2 (ja) グラフ可視化座標計算装置、方法、プログラム並びにそのプログラムを記録した記録媒体
JPWO2019092868A1 (ja) 情報処理装置、情報処理方法及びプログラム
US20200151615A1 (en) Machine learning based process flow engine
US9886498B2 (en) Title standardization
JP6290029B2 (ja) 生産制御支援装置、生産制御支援方法およびプログラム
US10331739B2 (en) Video search apparatus, video search method, and non-transitory computer readable medium
JP6125390B2 (ja) ストローク処理装置、方法及びプログラム
JP5824412B2 (ja) グラフデータ視覚化装置及び方法及びプログラム
CN114817476A (zh) 语言模型的训练方法、装置、电子设备和存储介质
JP2009129279A (ja) 機械学習装置及び機械学習方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160314

R150 Certificate of patent or registration of utility model

Ref document number: 5903394

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees