JP2004118819A

JP2004118819A - 大規模蛋白質相互作用データの効率的視覚化技法

Info

Publication number: JP2004118819A
Application number: JP2002319839A
Authority: JP
Inventors: Kyung Sook Han; ハン　キュン　ソーク; Byong-Hyon Ju; ジュ　ビョン　ヒョン
Original assignee: Inha University
Current assignee: Inha University
Priority date: 2002-09-23
Filing date: 2002-11-01
Publication date: 2004-04-15
Also published as: US20040059521A1; KR20040026227A; KR100470977B1; US7280921B2; JP2005322216A

Abstract

【課題】蛋白質相互作用ネットワークを明確で美的に優れた３次元グラフに視覚化する技法を提供する。
【解決手段】本発明は、大規模の蛋白質相互作用データを視覚化した３次元グラフを生成する技法に関するもので、蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度の両方を増加させることによって球体表面に配置して初期レイアウトを生成する第１段階と初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォースと非隣接ノードとのグローバルスプリングフォースの両方を考慮して平衡位置に移動させる過程を前もって決められた回数だけ反復してグラフを生成する第２段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法を提供し、従来のアルゴリズムに比べて速度が速くインタラクティブな分析に使用出来、データベースの問合せ結果を直接視覚化できる統合システムの具現が可能になる。
【選択図】　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、大規模の蛋白質相互作用データを３次元に視覚化する技法に関するものである。
【０００２】
【従来の技術】
最近、蛋白質体学技術が発達して蛋白質相互作用データが急激に大規模化している。このような大規模のデータは、相互作用する蛋白質を長く列挙するよりグラフ形態で見た方が理解するのにずっと役立つため、蛋白質相互作用ネットワークの視覚化に対する研究が進められてきた。しかし、蛋白質相互作用データを視覚化することはたやすくはない。その理由は、第一に、蛋白質相互作用データは視覚化された時、エッジ交差（ｅｄｇｅ　ｃｒｏｓｓｉｎｇ）が多い複雑な非平面グラフになるからである。第二に、複数個の連結コンポーネント（ｃｏｎｎｅｃｔｅｄ　ｃｏｍｐｏｎｅｎｔｓ）で構成された分離グラフ（ｄｉｓｃｏｎｎｅｃｔｅｄ　ｇｒａｐｈ）になる場合が多いからである。
【０００３】
大部分の一般のグラフ作成道具（ｇｒａｐｈ−ｄｒａｗｉｎｇ　ｔｏｏｌｓ）は、変形されたフォースダイレクト（ｆｏｒｃｅ−ｄｉｒｅｃｔｅｄ）レイアウトアルゴリズムを使用する。と言うのは、このアルゴリズムが融通性（ｆｌｅｘｉｂｉｌｉｔｙ）があり具現しやすく、ドロー結果も良好なためである。伝統的なフォースダイレクトレイアウトアルゴリズムは、ノードをランダムに配置することから始まり、最適化技法を通してそれらの位置を再調整して最小限のエネルギーを持ったレイアウトを探し出す。色々なフォースダイレクトレイアウトアルゴリズム間の主な差は、エネルギー函数及び最小化技法の選択にある。フォースダイレクトレイアウトアルゴリズムの例としては、カマダ及びカワイ（Ｋａｍａｄａ及びＫａｗａｉ（１９８９））によるものと、フルチターマン及びレインゴールド（Ｆｒｕｃｈｔｅｒｍａｎ及びＲｅｉｎｇｏｌｄ（１９９１））によるものとがある。前者は、２次元グラフを生成し、分離グラフを視覚化出来ない。多くのフォースダイレクトアルゴリズムの共通的な問題は、大規模グラフの処理が非常に遅いことである。これは、各反復ステップで全ての対のノード間のフォース（ｆｏｒｃｅ）を計算しなければならないからである。
【０００４】
また、リラクション（ｒｅｌａｘａｔｉｏｎ）アルゴリズムを基にして蛋白質相互作用を視覚化するジャバアプレットプログラムがムロワカ（Ｍｒｏｗｋａ（２００１））によって開発され、Ｙ２Ｈ（Ｙｅａｓｔ　Ｔｗｏ−Ｈｙｂｒｉｄ、Ｕｅｔｚ　等、２０００）データでテストされた。このプログラムは全ての蛋白質相互作用データがＨＴＭＬソースのアプレットプログラムのパラメーターで提供されることを要求し、ウィンドウをキャプチャー（ｃａｐｔｕｒｉｎｇ）すること以外には視覚化されたグラフを保存（ｓａｖｅ）する方法がない。ウィンドウからキャプチャーされたイメージは、静的な（ｓｔａｔｉｃ）イメージであり、一般的に質が落ちる。また、このようなイメージは、以後にデータ変更を反映させた修正ができない。ノードを移動させることは出来るが、後で使用する為に特定蛋白質を含む連結コンポーネントを選択したり保存することも不可能である。
【０００５】
この他に、蛋白質相互作用視覚化道具は、固有のアルゴリズムやプログラムを使用しいておらず、一般用途のドロー道具を使用する。例えば、ＰＳＩＭＡＰ（Ｐａｒｋ等，２００１；　Ｌａｐｐｅ等，　２００１）は、蛋白質の構造的分類（Ｍｕｒｚｉｎ等，　１９９５）を使用してＹ２ＨデータとＤＩＰデータ（Ｘｅｒａｒｉｏｓ等，　２００１）を比較することによって蛋白質ファミリー間の相互作用を表わしたものであり、トムソーヤ（Ｔｏｍ　Ｓａｗｙｅｒ）ソフトウェア（ｈｔｔｐ：／／ｗｗｗ．ｔｏｍｓａｗｙｅｒ．ｃｏｍ／）によって作成した後、相当な手作業によって写像のエッジ交差を除去した。
【０００６】
ワシントン大学のある研究チーム（Ｓｃｈｗｉｋｏｗｓｋｉ等，　２０００；　Ｔｕｃｋｅｒ等，　２００１）は、ＡＧＤ（ｈｔｔｐ：／／ｗｗｗ．ｍｐｉ−ｓｂ．ｍｐｇ．ｄｅ／ＡＧＤ／）という一般用途のドロー道具を使用してＹ２Ｈデータを視覚化した。ＡＧＤは、２次元グラフを生成し視覚化結果が比較的満足できる程度であるため、強力な道具であると言えるが、一般用途のドロー道具であるため蛋白質相互作用研究に必要な機能は提供出来ない。例えば、Ｙ２Ｈデータを含む大部分の蛋白質相互作用データは、多数の連結コンポーネントで構成された分離グラフを生成し、このグラフは、２次元ドローでは除去されない多数のエッジ交差を持った非平面グラフであるとも言える。このようなグラフを分析する方法の一つは、特定蛋白質を含む個別的な連結コンポーネントやサブグラフに対して作業することである。また他の方法は、非平面グラフをエッジ交差が無い３次元グラフに視覚化することである。しかし、ＡＧＤは、この機能を提供できないため分析が難しい。
【０００７】
一方、上記グラフ作成プログラムは、全てデータベースを問合せ（ｑｕｅｒｙ）をした後、問合せ結果を直接視覚化できない問題がある。またこれらは、特定形式の入力データを要求するためユーザ（ｕｓｅｒ）がデータ形式を変換しなければならない不便さがある。また、蛋白質相互作用データは時間によって変化するので、このような変更事項を視覚化して反映するのが便利であるが、従来のプログラムは、このような機能を提供することができない。
【０００８】
要約すれば、従来のグラフドロー道具は、１）　エッジ交差が多い混雑なグラフや修正が難しい静的グラフを描く。２）　多くのデータによるインタラクティブ（ｉｎｔｅｒａｃｔｉｖｅ）な作業をするのには時間がかかりすぎる。３）　蛋白質相互作用データベースから直接データを読み取ることができず、データが特定形式で入力された時にだけ視覚化が可能であるため、蛋白質相互作用を視覚化するのには適合しないという問題点があった。
【０００９】
【発明が解決しようとする課題】
本発明は、上記問題点を解決するためのものであり、大規模の蛋白質相互作用ネットワークを３次元に視覚化する新しい技法を提供するためにものである。
【００１０】
より詳細には、従来の他の視覚化アルゴリズムに比べて処理速度が速く、蛋白質相互作用の視覚化だけではなく、インタラクティブな分析にも使用でき、蛋白質相互作用データベースに対する問合せ結果を直接３次元空間に視覚化し、視覚化されたネットワークは、以後の修正またはナビゲート可能なシステムのための新しいフォースダイレクトアルゴリズムを提供することである。
【００１１】
【課題を解決するための手段】
本発明は、大規模の蛋白質相互作用データの効率的視覚化技法に関するもので、蛋白質をノードとし、蛋白質間相互作用をエッジとする３次元グラフを描く。本発明は蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度の両方を増加させることによって球体（ｓｐｈｅｒｅ）表面に配置し、初期レイアウトを生成する第１段階と、上記初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォース（ｌｏｃａｌ　ｓｐｒｉｎｇ　ｆｏｒｃｅ）と非隣接ノードとのグローバルスプリングフォース（ｇｌｏｂａｌ　ｓｐｒｉｎｇ　ｆｏｒｃｅ）の両方を考慮して平衡位置（ｅｑｕｉｌｉｂｒｉｕｍ　ｐｏｓｉｔｉｏｎ）に移動させる過程を前もって決められた回数だけ反復してグラフを生成する第２段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法を提供する。
【００１２】
本発明は、上記第２段階の反復回数がユーザによって変更可能であり、上記蛋白質相互作用データが格納されているデータベースと連動して作動することをもう一つの特徴とする。
【００１３】
また、ユーザ（ｕｓｅｒ）が選択したノードに対する隣ノードとの距離レベルを一定距離までに制限することによって、上記グラフを簡略化する第３段階をさらに含むことを特徴とする。
【００１４】
まず、本発明で使用される蛋白質相互作用データに対する用語と特性について詳しく見てみる。蛋白質相互作用データは、ノードが蛋白質を示し、エッジが蛋白質の相互作用を示すグラフに視覚化出来る。ノードの次数（ｄｅｇｒｅｅ）は、エッジの数であり、ｕ＝ｖの時、エッジ（ｕ、ｖ）は自己ループである。また、蛋白質相互作用データは次のような特性を持っている。
【００１５】
１）　グラフに視覚化した時、蛋白質相互作用データは多数の連結コンポーネントを持った分離グラフになる。例えば、ＭＩＰＳ遺伝的相互作用データ（ｈｔｔｐ：／／ｍｉｐｓ．ｇｓｆ．ｄｅ／ｐｒｏｊ／ｙｅａｓｔ／ｔａｂｌｅｓ／ｉｎｔｅｒａｃｔｉｏｎ／）は、１００個以上の連結コンポーネントを含んでいる。
【００１６】
２）　蛋白質相互作用データは、２次元グラフでは除去されない多数のエッジ交差を持った非平面グラフを産出する。
【００１７】
３）　一つのデータ集合において蛋白質毎に非常に異なった数の相互作用する蛋白質を持っているため、これを視覚化したグラフは低い次数だけではなく非常に高い次数のノードも含むようになる。
【００１８】
４）　蛋白質相互作用データは、ときおり自己ループに該当する蛋白質相互作用を含んでいる。
【００１９】
５）　蛋白質相互作用データは、同一蛋白質対に対して複数の相互作用を含んでいる。
【００２０】
本発明では、自己ループに該当する相互作用をデータベースのエッジテーブルに格納するが、ドロー過程を簡単にしてきれいなグラフを生成する為に視覚化ではこれを無視する。また、本来の蛋白質相互作用データベースが同一エッジに対する複数の項目を含んでいたなら、ローカルデータベースには一回だけ格納する。本発明によって視覚化される蛋白質相互作用ネットワークは、イメージ　ファイル、ローカルデータベースまたはＧＭＬ形式（Ｈｉｍｓｏｌｔ、１９９７）のテキストファイルに格納出来る。ＧＭＬ　（Ｇｒａｐｈ　Ｍｏｄｅｌｉｎｇ　Ｌａｎｇｕａｇｅ）はポータブル（ｐｏｒｔａｂｌｅ）なグラフファイル形式であり、ＧＭＬでグラフを保存すると前に計算されたグラフを再びロードして再視覚化出来るという長所がある。
【００２１】
従来のフォースダイレクトアルゴリズムの共通的な問題は、大容量のグラフ処理時に速度が非常に遅くなるということであり、本発明では、速度と視覚的鮮明度を大きく向上させられる新しいフォースダイレクトアルゴリズムを通した視覚化技法を提案する。本発明で提案する視覚化技法は、ワルシャウ（Ｗａｌｓｈａｗ（２０００））のアルゴリズムを基礎として、問題点を改善したものである。
【００２２】
本発明のレイアウトアルゴリズムは図１に簡略に記述されている。ワルシャウアルゴリズムの問題点の一つは、グラフが密集サブグラフ（非常に高い次数を持ったノードを含むサブグラフ）を含んでいる時に、願い求める結果を得られないことである。このアルゴリズムは、グラフの大きさがある臨界値（ｔｈｒｅｓｈｏｌｄ　ｖａｌｕｅ）以下に下がる時までノード位置を反復的に計算するため、全体的なレイアウトを改善出来ないままアルゴリズムを何回も不必要に反復する場合が発生する。したがって、本発明では、ワルシャウアルゴリズムとは異る終了条件を採用し、デフォルトで２０回反復するようにした。２０というデフォルト値は、比較実験を根拠に経験的に選択したもので、試用者がインターフェースを通じて反復回数を増加させられる（１６行）。
【００２３】
各反復ループで、隣接ノード間のローカルスプリングフォース（ｌｏｃａｌ　ｓｐｒｉｎｇ　ｆｏｒｃｅ）だけではなく（１０行）非隣接ノード間のグローバルスプリングフォース（ｇｌｏｂａｌ　ｓｐｒｉｎｇ　ｆｏｒｃｅ）まで参照して（８行）ノード位置が更新される。
【００２４】
図２は、隣接ノード間のローカルフォースによってノードｖが再配置されることを図示した図である。図２ａを詳しく見てみると、ノードｖは３個のノードに連結されていて、３個の隣接ノードの一つｕからのｖに対するフォース（ｆｏｒｃｅ）は、ｖをｖとｕの間のラインに沿って動くようにさせる。結果的には、図２ｂに図示したように、全ての隣接ノードによって生じた結合フォース（ａｇｇｒｅｇａｔｅ　ｆｏｒｃｅ）は、ｖを平衡位置（ｅｑｕｉｌｉｂｒｉｕｍ　ｐｏｓｉｔｉｏｎ）に移動させる。
【００２５】
次は、本発明で採用されている初期レイアウト方法について説明する。従来の一般的なフォースダイレクトグラフドローアルゴリズムは、２次元の平面や３次元空間にグラフの全てのノードをランダムに配置することから始まり、最適化技法を使用してこの初期レイアウトを継続的に修正して最少エネルギーを持ったレイアウトを求める。初期レイアウトにオーバーラップするノードや同一平面上のノードがある場合、それらを再配置する為に計算時間が増加することもある。それで、処理時間を短縮する為に、本発明では初期レイアウトのためにノードをランダムに配置しない。本発明は、極座標の水平及び　垂直角度を増加させることによって球体（ｓｐｈｅｒｅ）表面にノードを配置する。この方法は、平面にノードを配置する回数を最小化する。図３は、４７３個のノードを持ったグラフの初期レイアウトの例を図示したものである。図４は、初期レイアウトのための簡略なアルゴリズムである。
【００２６】
以下、本発明のアルゴリズムの計算費用（必要な時間）に対して詳しく見てみる。「ｎ（ノードの数）＝Ｖ」のグラフにおいて、初期レイアウトには時間Ｏ（ｎ）だけが所要されアルゴリズムのグローバル時間には影響を及ぼさない。Ｔを外側ループの総反復数としよう（図１の２行）。ノード一つの移動Ｄを計算するには時間Ｏ（ｎ）がかかるため、外側ループの各ステップで全てのノードの移動Ｄを計算するには時間Ｏ（ｎ^２）がかかる。ゆえに、総必要時間は、Ｏ（Ｔ・ｎ^２）　＝　Ｏ（ｎ^２）である（Ｔは常数）。スプリング−エンベダー（ｓｐｒｉｎｇ−ｅｍｂｅｄｄｅｒ）アルゴリズム（Ｋａｍａｄａ及び　Ｋａｗａｉ、１９８９）の時間複雑度のＯ（ｎ^３）に比べると、本発明はとても速い。
【００２７】
本発明の視覚化技法を利用して具現されたドロー道具では、サブグラフを探して作業することが可能である。蛋白質相互作用ネットワークの大きさや特性上、（分離グラフの連結コンポーネントや特定蛋白質と相互作用する蛋白質のサブグラフと同じ）　サブグラフを探し、各サブグラフについて作業することが可能でなければならない。連結コンポーネントを探す手順は全てのノードに適用され、連結コンポーネントの総目録を得られる（図１２参照）。図５に図示された例のように、この目録は、各連結コンポーネントの大きさ、ノード、エッジ等だけではなく連結コンポーネントの総数も持っている。
【００２８】
また、蛋白質相互作用データは、大容量で時間経過にしたがって変化することがあるため、フラット（ｆｌａｔ）ファイルよりはデータベースで管理する方がずっと効率的である。したがって、本発明では蛋白質相互作用データのローカルデータベースを構築した。
【００２９】
次は、本発明の大規模蛋白質相互作用データの効率的視覚化技法を具現したプログラムであるインタービューアー（ＩｎｔｅｒＶｉｅｗｅｒ）を実験した結果について説明する。図５は、ＭＩＰＳ遺伝因子相互作用データの連結コンポーネントを列挙したものである。この例では同一蛋白質対間の重複相互作用を除外して８８８個の蛋白質間の１０９３個の相互作用が含まれていて、左側ウィンドウは、ＭＩＰＳ遺伝因子相互作用データ全ての連結コンポーネントを示しており、ここでユーザが連結コンポーネントを選択すると上記連結コンポーネントの全てのエッジが右側ウィンドウに表示される。この例の連結コンポーネント中、サブグラフ０は、２個の自己ループを含み５３１個のノードと８０７個のエッジを持った最も大きなサブグラフである。図６は、本発明のサブグラフ０を視覚化したものである。エッジ交差があるように見えるが、ビデオモニターに３次元ドローで視覚化した時は実際にはエッジ交差はない。
【００３０】
インタービューアーを使用すれば、ユーザ（ｕｓｅｒ）は蛋白質相互作用を分析し、回転やズームによって３次元ドローを探索出来る。図７は、蛋白質相互作用の分析例を図示したものである。最初のウィンドウには全ての機能グループ対に共通する蛋白質の数と各グループ内の内部相互作用の数が示されている。ユーザがこのウィンドウから一行を選択すると、二番目ウィンドウのように蛋白質と機能グループの関係がベン図（ｖｅｎｎ　ｄｉａｇｒａｍ）で表示される。この図によれば３５個の蛋白質が機能「ａａ　（Ａｍｉｎｏ−ａｃｉｄ　ｍｅｔａｂｏｌｉｓｍ）」を持っていて、４６個の蛋白質が機能　「ｃｃ　（Ｃｅｌｌ　ｃｙｃｌｅ　ｃｏｎｔｒｏｌ）」を持っていて、３個の蛋白質は、二機能を両方持っている。ユーザ（ｕｓｅｒ）が機能グループをクリックすると、三番目と四番目のウィンドウに図示されているように該当機能グループの全ての蛋白質が列挙される。
【００３１】
インタービューアーによって視覚化されたグラフは、隣ノードとの距離レベル（ｄｉｓｔａｎｃｅ　ｌｅｖｅｌ　ｏｆ　ｎｅｉｇｈｂｏｒｓ）を制限することによって簡単化され得る。例えば、図６のＣＩＴ２の隣ノード達の距離レベルを５に設定すると、インタービューアーは図８に図示したように７６個のノードを持った簡略化されたグラフを探し出す。このグラフで、ユーザが選択したノードのＳＥＰ２、ＰＡＮ１及びＦＩＲ１を異なる色で表示し、ＣＩＴ２はまた違う色で表示することによってユーザの便宜をはかることができる。ユーザは、フォースダイレクトレイアウトを生成する間、一つ以上のノード位置を固定するように選択出来る。初期レイアウト以後に、サブレイアウトの中心を固定させることによって生成された星模様のサブグラフのノード位置は大部分満足に値するグラフを産出してくれる。
【００３２】
【発明の効果】
まず、本発明の大規模の蛋白質相互作用ネットワークを明確で美的に優れたグラフに視覚化し、従来のフォースダイレクトアルゴリズムと比べて１０倍以上速いシステムを具現出来る。実行時間の比較のために、本発明では従来のグラフドロープログラムのパジェ（Ｐａｊｅｋ（Ｂａｔａｇｅｌｊ　＆　Ｍｒｖａｒ、２００１））とチューリップ（Ｔｕｌｉｐ（Ｄａｖｉｄ、２００１））を一緒に実行させた。パジェの場合、レイアウトのためにカマダ及びカワイのアルゴリズム（１９８９）、エイゲンバリュー（Ｅｉｇｅｎ　ｖａｌｕｅ）方法（Ｇｏｌｕｂ及び　ｖａｎ　Ｌｏａｎ、１９９６）、フルチターマン及びレインゴールドのアルゴリズム（１９９１）等、３種類のアルゴリズムが具現されている。最初のアルゴリズムは、分離グラフを描くことが出来ず、２次元グラフだけを描き、二番目のアルゴリズムは、グラフドロー結果がフルチターマン及びレインゴールドのアルゴリズムに比べて良くないので、フルチターマン及びレインゴールドのアルゴリズムだけを比較対象とした。また、チューリップの二つのアルゴリズムであるスプリング−エレクトリック（Ｓｐｒｉｎｇ−Ｅｌｅｃｔｒｉｃ）レイアウトとＧＥＭアルゴリズムを比較した。
次の表１は、本発明のインタービューアーと上記三種類のアルゴリズムをペンティアムＩＶ　１．７ＧＨｚプロセッサーで比較実験した結果である。これらのアルゴリズムによるドロー結果は、図９ないし図１１に図示されている。各図面は、インタービューアー、パジェ（Ｆｒｕｃｈｔｅｒｍａｎ−Ｒｅｉｎｇｏｌｄ）、チューリップ（Ｓｐｒｉｎｇ−Ｅｌｅｃｔｒｉｃ）及びチューリップ（ＧＥＭ）による結果グラフを順に図示したものである。
【表１】

また、本発明の視覚化技法は、蛋白質相互作用の視覚化だけではなく個別的な連結コンポーネントやサブグラフ等のインタラクティブな検索及び探索のためのシステムにも使用出来る。
最後に、本発明は蛋白質相互作用データベースを動的に問合せをしてその問合せ結果を直接視覚化することによって、大量の更新データの視覚化及び分析が可能であるという長所がある。
【図面の簡単な説明】
【図１】図１は、本発明の視覚化技法のレイアウトアルゴリズムである。
【図２】図２は、隣接ノード間のローカルフォースによるノード移動を示した図である。
【図３】図３は、４７３個のノードを持った初期レイアウトの例を示した図である。
【図４】図４は、初期レイアウトのためのアルゴリズムである。
【図５】図５は、サブグラフ目録を示した図である。
【図６】図６は、図５のサブグラフ０を３次元にドローした結果を示した図である。
【図７】図７は、蛋白質相互作用分析の例を示した図である。
【図８】図８は、図６のグラフを簡略化した図である。
【図９】図９は、Ｙ２Ｈデータに対する視覚化結果として、（ａ）　インタービューアー視覚化結果、（ｂ）　パジェ（Ｆｒｕｃｈｔｅｒｍａｎ　ａｎｄ　Ｒｅｉｎｇｏｌｄ　アルゴリズム）視覚化結果、（ｃ）　チューリップ（ＧＥＭアルゴリズム）視覚化結果、（ｄ）　チューリップ（Ｓｐｅｉｎｇ−Ｅｌｅｃｔｒｉｃａｌ　Ｆｏｒｃｅアルゴリズム）視覚化結果を図示した図である。
【図１０】図１０は、ＭＩＰＳ遺伝的相互作用視覚化結果として、（ａ）　インタービューアー視覚化結果、（ｂ）　パジェ（Ｆｒｕｃｈｔｅｒｍａｎ　ａｎｄ　Ｒｅｉｎｇｏｌｄアルゴリズム）視覚化結果、（ｃ）　チューリップ（ＧＥＭ　アルゴリズム）視覚化結果、（ｄ）　チューリップ（Ｓｐｅｉｎｇ−Ｅｌｅｃｔｒｉｃａｌ　Ｆｏｒｃｅ　アルゴリズム）視覚化結果を図示した図である。
【図１１】図１１は、ＭＩＰＳ物理的相互作用視覚化結果として、（ａ）　インタービューアー　視覚化結果、（ｂ）　パジェ（Ｆｒｕｃｈｔｅｒｍａｎ　ａｎｄ　Ｒｅｉｎｇｏｌｄ　アルゴリズム）視覚化結果、（ｃ）　チューリップ（ＧＥＭ　アルゴリズム）視覚化結果、（ｄ）　チューリップ（Ｓｐｅｉｎｇ−Ｅｌｅｃｔｒｉｃａｌ　Ｆｏｒｃｅアルゴリズム）視覚化結果を図示した図である。
【図１２】図１２は、連結コンポーネント（ｃｏｎｎｅｃｔｅｄ　ｃｏｍｐｏｎｅｎｔ）を探し求める過程を説明した図である。

Claims

大規模の蛋白質相互作用データを視覚化するために蛋白質をノード（ｎｏｄｅ）として蛋白質間相互作用をエッジ（ｅｄｇｅ）とする３次元グラフを生成する大規模蛋白質相互作用データの効率的視覚化技法において、
上記蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度を増加させることによって、球体（ｓｐｈｅｒｅ）表面に配置し、初期レイアウトを生成する第１段階、及び、上記初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォース（ｌｏｃａｌ　ｓｐｒｉｎｇ　ｆｏｒｃｅ）と非隣接ノードとのグローバルスプリングフォース（ｇｌｏｂａｌ　ｓｐｒｉｎｇ　ｆｏｒｃｅ）を考慮して平衡位置（ｅｑｕｉｌｉｂｒｉｕｍ　ｐｏｓｉｔｉｏｎ）に移動させる過程を事前に決められた回数だけ反復してグラフを生成する第２段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法。
上記第２段階の反復回数は、ユーザ（ｕｓｅｒ）によって変更可能であることを特徴とする請求項１に記載の大規模蛋白質相互作用データの効率的視覚化技法。
上記蛋白質相互作用データが格納（ｓｔｏｒｅ）されているデータベースと連動することを特徴とする請求項１に記載の大規模蛋白質相互作用データの効率的視覚化技法。
ユーザが選択したノードに対する隣ノードとの距離レベルを一定距離までに制限することによって上記グラフを簡略化する第３段階をさらに含むことを特徴とする請求項１に記載の大規模蛋白質相互作用データの効率的視覚化技法。