JP2004118819A - 大規模蛋白質相互作用データの効率的視覚化技法 - Google Patents
大規模蛋白質相互作用データの効率的視覚化技法 Download PDFInfo
- Publication number
- JP2004118819A JP2004118819A JP2002319839A JP2002319839A JP2004118819A JP 2004118819 A JP2004118819 A JP 2004118819A JP 2002319839 A JP2002319839 A JP 2002319839A JP 2002319839 A JP2002319839 A JP 2002319839A JP 2004118819 A JP2004118819 A JP 2004118819A
- Authority
- JP
- Japan
- Prior art keywords
- graph
- protein interaction
- interaction data
- nodes
- technique
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B30/00—Methods of screening libraries
- C40B30/04—Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Theoretical Computer Science (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Medical Informatics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Evolutionary Biology (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Physics & Mathematics (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Data Mining & Analysis (AREA)
- Food Science & Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】蛋白質相互作用ネットワークを明確で美的に優れた3次元グラフに視覚化する技法を提供する。
【解決手段】本発明は、大規模の蛋白質相互作用データを視覚化した3次元グラフを生成する技法に関するもので、蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度の両方を増加させることによって球体表面に配置して初期レイアウトを生成する第1段階と初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォースと非隣接ノードとのグローバルスプリングフォースの両方を考慮して平衡位置に移動させる過程を前もって決められた回数だけ反復してグラフを生成する第2段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法を提供し、従来のアルゴリズムに比べて速度が速くインタラクティブな分析に使用出来、データベースの問合せ結果を直接視覚化できる統合システムの具現が可能になる。
【選択図】 図1
【解決手段】本発明は、大規模の蛋白質相互作用データを視覚化した3次元グラフを生成する技法に関するもので、蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度の両方を増加させることによって球体表面に配置して初期レイアウトを生成する第1段階と初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォースと非隣接ノードとのグローバルスプリングフォースの両方を考慮して平衡位置に移動させる過程を前もって決められた回数だけ反復してグラフを生成する第2段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法を提供し、従来のアルゴリズムに比べて速度が速くインタラクティブな分析に使用出来、データベースの問合せ結果を直接視覚化できる統合システムの具現が可能になる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、大規模の蛋白質相互作用データを3次元に視覚化する技法に関するものである。
【0002】
【従来の技術】
最近、蛋白質体学技術が発達して蛋白質相互作用データが急激に大規模化している。このような大規模のデータは、相互作用する蛋白質を長く列挙するよりグラフ形態で見た方が理解するのにずっと役立つため、蛋白質相互作用ネットワークの視覚化に対する研究が進められてきた。しかし、蛋白質相互作用データを視覚化することはたやすくはない。その理由は、第一に、蛋白質相互作用データは視覚化された時、エッジ交差(edge crossing)が多い複雑な非平面グラフになるからである。第二に、複数個の連結コンポーネント(connected components)で構成された分離グラフ(disconnected graph)になる場合が多いからである。
【0003】
大部分の一般のグラフ作成道具(graph−drawing tools)は、変形されたフォースダイレクト(force−directed)レイアウトアルゴリズムを使用する。と言うのは、このアルゴリズムが融通性(flexibility)があり具現しやすく、ドロー結果も良好なためである。伝統的なフォースダイレクトレイアウトアルゴリズムは、ノードをランダムに配置することから始まり、最適化技法を通してそれらの位置を再調整して最小限のエネルギーを持ったレイアウトを探し出す。色々なフォースダイレクトレイアウトアルゴリズム間の主な差は、エネルギー函数及び最小化技法の選択にある。フォースダイレクトレイアウトアルゴリズムの例としては、カマダ及びカワイ(Kamada及びKawai(1989))によるものと、フルチターマン及びレインゴールド(Fruchterman及びReingold(1991))によるものとがある。前者は、2次元グラフを生成し、分離グラフを視覚化出来ない。多くのフォースダイレクトアルゴリズムの共通的な問題は、大規模グラフの処理が非常に遅いことである。これは、各反復ステップで全ての対のノード間のフォース(force)を計算しなければならないからである。
【0004】
また、リラクション(relaxation)アルゴリズムを基にして蛋白質相互作用を視覚化するジャバアプレットプログラムがムロワカ(Mrowka(2001))によって開発され、Y2H(Yeast Two−Hybrid、Uetz 等、2000)データでテストされた。このプログラムは全ての蛋白質相互作用データがHTMLソースのアプレットプログラムのパラメーターで提供されることを要求し、ウィンドウをキャプチャー(capturing)すること以外には視覚化されたグラフを保存(save)する方法がない。ウィンドウからキャプチャーされたイメージは、静的な(static)イメージであり、一般的に質が落ちる。また、このようなイメージは、以後にデータ変更を反映させた修正ができない。ノードを移動させることは出来るが、後で使用する為に特定蛋白質を含む連結コンポーネントを選択したり保存することも不可能である。
【0005】
この他に、蛋白質相互作用視覚化道具は、固有のアルゴリズムやプログラムを使用しいておらず、一般用途のドロー道具を使用する。例えば、PSIMAP(Park等,2001; Lappe等, 2001)は、蛋白質の構造的分類(Murzin等, 1995)を使用してY2HデータとDIPデータ(Xerarios等, 2001)を比較することによって蛋白質ファミリー間の相互作用を表わしたものであり、トムソーヤ(Tom Sawyer)ソフトウェア(http://www.tomsawyer.com/)によって作成した後、相当な手作業によって写像のエッジ交差を除去した。
【0006】
ワシントン大学のある研究チーム(Schwikowski等, 2000; Tucker等, 2001)は、AGD(http://www.mpi−sb.mpg.de/AGD/)という一般用途のドロー道具を使用してY2Hデータを視覚化した。AGDは、2次元グラフを生成し視覚化結果が比較的満足できる程度であるため、強力な道具であると言えるが、一般用途のドロー道具であるため蛋白質相互作用研究に必要な機能は提供出来ない。例えば、Y2Hデータを含む大部分の蛋白質相互作用データは、多数の連結コンポーネントで構成された分離グラフを生成し、このグラフは、2次元ドローでは除去されない多数のエッジ交差を持った非平面グラフであるとも言える。このようなグラフを分析する方法の一つは、特定蛋白質を含む個別的な連結コンポーネントやサブグラフに対して作業することである。また他の方法は、非平面グラフをエッジ交差が無い3次元グラフに視覚化することである。しかし、AGDは、この機能を提供できないため分析が難しい。
【0007】
一方、上記グラフ作成プログラムは、全てデータベースを問合せ(query)をした後、問合せ結果を直接視覚化できない問題がある。またこれらは、特定形式の入力データを要求するためユーザ(user)がデータ形式を変換しなければならない不便さがある。また、蛋白質相互作用データは時間によって変化するので、このような変更事項を視覚化して反映するのが便利であるが、従来のプログラムは、このような機能を提供することができない。
【0008】
要約すれば、従来のグラフドロー道具は、1) エッジ交差が多い混雑なグラフや修正が難しい静的グラフを描く。2) 多くのデータによるインタラクティブ(interactive)な作業をするのには時間がかかりすぎる。3) 蛋白質相互作用データベースから直接データを読み取ることができず、データが特定形式で入力された時にだけ視覚化が可能であるため、蛋白質相互作用を視覚化するのには適合しないという問題点があった。
【0009】
【発明が解決しようとする課題】
本発明は、上記問題点を解決するためのものであり、大規模の蛋白質相互作用ネットワークを3次元に視覚化する新しい技法を提供するためにものである。
【0010】
より詳細には、従来の他の視覚化アルゴリズムに比べて処理速度が速く、蛋白質相互作用の視覚化だけではなく、インタラクティブな分析にも使用でき、蛋白質相互作用データベースに対する問合せ結果を直接3次元空間に視覚化し、視覚化されたネットワークは、以後の修正またはナビゲート可能なシステムのための新しいフォースダイレクトアルゴリズムを提供することである。
【0011】
【課題を解決するための手段】
本発明は、大規模の蛋白質相互作用データの効率的視覚化技法に関するもので、蛋白質をノードとし、蛋白質間相互作用をエッジとする3次元グラフを描く。本発明は蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度の両方を増加させることによって球体(sphere)表面に配置し、初期レイアウトを生成する第1段階と、上記初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォース(local spring force)と非隣接ノードとのグローバルスプリングフォース(global spring force)の両方を考慮して平衡位置(equilibrium position)に移動させる過程を前もって決められた回数だけ反復してグラフを生成する第2段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法を提供する。
【0012】
本発明は、上記第2段階の反復回数がユーザによって変更可能であり、上記蛋白質相互作用データが格納されているデータベースと連動して作動することをもう一つの特徴とする。
【0013】
また、ユーザ(user)が選択したノードに対する隣ノードとの距離レベルを一定距離までに制限することによって、上記グラフを簡略化する第3段階をさらに含むことを特徴とする。
【0014】
まず、本発明で使用される蛋白質相互作用データに対する用語と特性について詳しく見てみる。蛋白質相互作用データは、ノードが蛋白質を示し、エッジが蛋白質の相互作用を示すグラフに視覚化出来る。ノードの次数(degree)は、エッジの数であり、u=vの時、エッジ(u、v)は自己ループである。また、蛋白質相互作用データは次のような特性を持っている。
【0015】
1) グラフに視覚化した時、蛋白質相互作用データは多数の連結コンポーネントを持った分離グラフになる。例えば、MIPS遺伝的相互作用データ(http://mips.gsf.de/proj/yeast/tables/interaction/)は、100個以上の連結コンポーネントを含んでいる。
【0016】
2) 蛋白質相互作用データは、2次元グラフでは除去されない多数のエッジ交差を持った非平面グラフを産出する。
【0017】
3) 一つのデータ集合において蛋白質毎に非常に異なった数の相互作用する蛋白質を持っているため、これを視覚化したグラフは低い次数だけではなく非常に高い次数のノードも含むようになる。
【0018】
4) 蛋白質相互作用データは、ときおり自己ループに該当する蛋白質相互作用を含んでいる。
【0019】
5) 蛋白質相互作用データは、同一蛋白質対に対して複数の相互作用を含んでいる。
【0020】
本発明では、自己ループに該当する相互作用をデータベースのエッジテーブルに格納するが、ドロー過程を簡単にしてきれいなグラフを生成する為に視覚化ではこれを無視する。また、本来の蛋白質相互作用データベースが同一エッジに対する複数の項目を含んでいたなら、ローカルデータベースには一回だけ格納する。本発明によって視覚化される蛋白質相互作用ネットワークは、イメージ ファイル、ローカルデータベースまたはGML形式(Himsolt、1997)のテキストファイルに格納出来る。GML (Graph Modeling Language)はポータブル(portable)なグラフファイル形式であり、GMLでグラフを保存すると前に計算されたグラフを再びロードして再視覚化出来るという長所がある。
【0021】
従来のフォースダイレクトアルゴリズムの共通的な問題は、大容量のグラフ処理時に速度が非常に遅くなるということであり、本発明では、速度と視覚的鮮明度を大きく向上させられる新しいフォースダイレクトアルゴリズムを通した視覚化技法を提案する。本発明で提案する視覚化技法は、ワルシャウ(Walshaw(2000))のアルゴリズムを基礎として、問題点を改善したものである。
【0022】
本発明のレイアウトアルゴリズムは図1に簡略に記述されている。ワルシャウアルゴリズムの問題点の一つは、グラフが密集サブグラフ(非常に高い次数を持ったノードを含むサブグラフ)を含んでいる時に、願い求める結果を得られないことである。このアルゴリズムは、グラフの大きさがある臨界値(threshold value)以下に下がる時までノード位置を反復的に計算するため、全体的なレイアウトを改善出来ないままアルゴリズムを何回も不必要に反復する場合が発生する。したがって、本発明では、ワルシャウアルゴリズムとは異る終了条件を採用し、デフォルトで20回反復するようにした。20というデフォルト値は、比較実験を根拠に経験的に選択したもので、試用者がインターフェースを通じて反復回数を増加させられる(16行)。
【0023】
各反復ループで、隣接ノード間のローカルスプリングフォース(local spring force)だけではなく(10行)非隣接ノード間のグローバルスプリングフォース(global spring force)まで参照して(8行)ノード位置が更新される。
【0024】
図2は、隣接ノード間のローカルフォースによってノードvが再配置されることを図示した図である。図2aを詳しく見てみると、ノードvは3個のノードに連結されていて、3個の隣接ノードの一つuからのvに対するフォース(force)は、vをvとuの間のラインに沿って動くようにさせる。結果的には、図2bに図示したように、全ての隣接ノードによって生じた結合フォース(aggregate force)は、vを平衡位置(equilibrium position)に移動させる。
【0025】
次は、本発明で採用されている初期レイアウト方法について説明する。従来の一般的なフォースダイレクトグラフドローアルゴリズムは、2次元の平面や3次元空間にグラフの全てのノードをランダムに配置することから始まり、最適化技法を使用してこの初期レイアウトを継続的に修正して最少エネルギーを持ったレイアウトを求める。初期レイアウトにオーバーラップするノードや同一平面上のノードがある場合、それらを再配置する為に計算時間が増加することもある。それで、処理時間を短縮する為に、本発明では初期レイアウトのためにノードをランダムに配置しない。本発明は、極座標の水平及び 垂直角度を増加させることによって球体(sphere)表面にノードを配置する。この方法は、平面にノードを配置する回数を最小化する。図3は、473個のノードを持ったグラフの初期レイアウトの例を図示したものである。図4は、初期レイアウトのための簡略なアルゴリズムである。
【0026】
以下、本発明のアルゴリズムの計算費用(必要な時間)に対して詳しく見てみる。「n(ノードの数)=V」のグラフにおいて、初期レイアウトには時間O(n)だけが所要されアルゴリズムのグローバル時間には影響を及ぼさない。Tを外側ループの総反復数としよう(図1の2行)。ノード一つの移動Dを計算するには時間O(n)がかかるため、外側ループの各ステップで全てのノードの移動Dを計算するには時間O(n2)がかかる。ゆえに、総必要時間は、O(T・n2) = O(n2)である(Tは常数)。スプリング−エンベダー(spring−embedder)アルゴリズム(Kamada及び Kawai、1989)の時間複雑度のO(n3)に比べると、本発明はとても速い。
【0027】
本発明の視覚化技法を利用して具現されたドロー道具では、サブグラフを探して作業することが可能である。蛋白質相互作用ネットワークの大きさや特性上、(分離グラフの連結コンポーネントや特定蛋白質と相互作用する蛋白質のサブグラフと同じ) サブグラフを探し、各サブグラフについて作業することが可能でなければならない。連結コンポーネントを探す手順は全てのノードに適用され、連結コンポーネントの総目録を得られる(図12参照)。図5に図示された例のように、この目録は、各連結コンポーネントの大きさ、ノード、エッジ等だけではなく連結コンポーネントの総数も持っている。
【0028】
また、蛋白質相互作用データは、大容量で時間経過にしたがって変化することがあるため、フラット(flat)ファイルよりはデータベースで管理する方がずっと効率的である。したがって、本発明では蛋白質相互作用データのローカルデータベースを構築した。
【0029】
次は、本発明の大規模蛋白質相互作用データの効率的視覚化技法を具現したプログラムであるインタービューアー(InterViewer)を実験した結果について説明する。図5は、MIPS遺伝因子相互作用データの連結コンポーネントを列挙したものである。この例では同一蛋白質対間の重複相互作用を除外して888個の蛋白質間の1093個の相互作用が含まれていて、左側ウィンドウは、MIPS遺伝因子相互作用データ全ての連結コンポーネントを示しており、ここでユーザが連結コンポーネントを選択すると上記連結コンポーネントの全てのエッジが右側ウィンドウに表示される。この例の連結コンポーネント中、サブグラフ0は、2個の自己ループを含み531個のノードと807個のエッジを持った最も大きなサブグラフである。図6は、本発明のサブグラフ0を視覚化したものである。エッジ交差があるように見えるが、ビデオモニターに3次元ドローで視覚化した時は実際にはエッジ交差はない。
【0030】
インタービューアーを使用すれば、ユーザ(user)は蛋白質相互作用を分析し、回転やズームによって3次元ドローを探索出来る。図7は、蛋白質相互作用の分析例を図示したものである。最初のウィンドウには全ての機能グループ対に共通する蛋白質の数と各グループ内の内部相互作用の数が示されている。ユーザがこのウィンドウから一行を選択すると、二番目ウィンドウのように蛋白質と機能グループの関係がベン図(venn diagram)で表示される。この図によれば35個の蛋白質が機能「aa (Amino−acid metabolism)」を持っていて、46個の蛋白質が機能 「cc (Cell cycle control)」を持っていて、3個の蛋白質は、二機能を両方持っている。ユーザ(user)が機能グループをクリックすると、三番目と四番目のウィンドウに図示されているように該当機能グループの全ての蛋白質が列挙される。
【0031】
インタービューアーによって視覚化されたグラフは、隣ノードとの距離レベル(distance level of neighbors)を制限することによって簡単化され得る。例えば、図6のCIT2の隣ノード達の距離レベルを5に設定すると、インタービューアーは図8に図示したように76個のノードを持った簡略化されたグラフを探し出す。このグラフで、ユーザが選択したノードのSEP2、PAN1及びFIR1を異なる色で表示し、CIT2はまた違う色で表示することによってユーザの便宜をはかることができる。ユーザは、フォースダイレクトレイアウトを生成する間、一つ以上のノード位置を固定するように選択出来る。初期レイアウト以後に、サブレイアウトの中心を固定させることによって生成された星模様のサブグラフのノード位置は大部分満足に値するグラフを産出してくれる。
【0032】
【発明の効果】
まず、本発明の大規模の蛋白質相互作用ネットワークを明確で美的に優れたグラフに視覚化し、従来のフォースダイレクトアルゴリズムと比べて10倍以上速いシステムを具現出来る。実行時間の比較のために、本発明では従来のグラフドロープログラムのパジェ(Pajek(Batagelj & Mrvar、2001))とチューリップ(Tulip(David、2001))を一緒に実行させた。パジェの場合、レイアウトのためにカマダ及びカワイのアルゴリズム(1989)、エイゲンバリュー(Eigen value)方法(Golub及び van Loan、1996)、フルチターマン及びレインゴールドのアルゴリズム(1991)等、3種類のアルゴリズムが具現されている。最初のアルゴリズムは、分離グラフを描くことが出来ず、2次元グラフだけを描き、二番目のアルゴリズムは、グラフドロー結果がフルチターマン及びレインゴールドのアルゴリズムに比べて良くないので、フルチターマン及びレインゴールドのアルゴリズムだけを比較対象とした。また、チューリップの二つのアルゴリズムであるスプリング−エレクトリック(Spring−Electric)レイアウトとGEMアルゴリズムを比較した。
次の表1は、本発明のインタービューアーと上記三種類のアルゴリズムをペンティアムIV 1.7GHzプロセッサーで比較実験した結果である。これらのアルゴリズムによるドロー結果は、図9ないし図11に図示されている。各図面は、インタービューアー、パジェ(Fruchterman−Reingold)、チューリップ(Spring−Electric)及びチューリップ(GEM)による結果グラフを順に図示したものである。
【表1】
また、本発明の視覚化技法は、蛋白質相互作用の視覚化だけではなく個別的な連結コンポーネントやサブグラフ等のインタラクティブな検索及び探索のためのシステムにも使用出来る。
最後に、本発明は蛋白質相互作用データベースを動的に問合せをしてその問合せ結果を直接視覚化することによって、大量の更新データの視覚化及び分析が可能であるという長所がある。
【図面の簡単な説明】
【図1】図1は、本発明の視覚化技法のレイアウトアルゴリズムである。
【図2】図2は、隣接ノード間のローカルフォースによるノード移動を示した図である。
【図3】図3は、473個のノードを持った初期レイアウトの例を示した図である。
【図4】図4は、初期レイアウトのためのアルゴリズムである。
【図5】図5は、サブグラフ目録を示した図である。
【図6】図6は、図5のサブグラフ0を3次元にドローした結果を示した図である。
【図7】図7は、蛋白質相互作用分析の例を示した図である。
【図8】図8は、図6のグラフを簡略化した図である。
【図9】図9は、Y2Hデータに対する視覚化結果として、(a) インタービューアー視覚化結果、(b) パジェ(Fruchterman and Reingold アルゴリズム)視覚化結果、(c) チューリップ(GEMアルゴリズム)視覚化結果、(d) チューリップ(Speing−Electrical Forceアルゴリズム)視覚化結果を図示した図である。
【図10】図10は、MIPS遺伝的相互作用視覚化結果として、(a) インタービューアー視覚化結果、(b) パジェ(Fruchterman and Reingoldアルゴリズム)視覚化結果、(c) チューリップ(GEM アルゴリズム)視覚化結果、(d) チューリップ(Speing−Electrical Force アルゴリズム)視覚化結果を図示した図である。
【図11】図11は、MIPS物理的相互作用視覚化結果として、(a) インタービューアー 視覚化結果、(b) パジェ(Fruchterman and Reingold アルゴリズム)視覚化結果、(c) チューリップ(GEM アルゴリズム)視覚化結果、(d) チューリップ(Speing−Electrical Forceアルゴリズム)視覚化結果を図示した図である。
【図12】図12は、連結コンポーネント(connected component)を探し求める過程を説明した図である。
【発明の属する技術分野】
本発明は、大規模の蛋白質相互作用データを3次元に視覚化する技法に関するものである。
【0002】
【従来の技術】
最近、蛋白質体学技術が発達して蛋白質相互作用データが急激に大規模化している。このような大規模のデータは、相互作用する蛋白質を長く列挙するよりグラフ形態で見た方が理解するのにずっと役立つため、蛋白質相互作用ネットワークの視覚化に対する研究が進められてきた。しかし、蛋白質相互作用データを視覚化することはたやすくはない。その理由は、第一に、蛋白質相互作用データは視覚化された時、エッジ交差(edge crossing)が多い複雑な非平面グラフになるからである。第二に、複数個の連結コンポーネント(connected components)で構成された分離グラフ(disconnected graph)になる場合が多いからである。
【0003】
大部分の一般のグラフ作成道具(graph−drawing tools)は、変形されたフォースダイレクト(force−directed)レイアウトアルゴリズムを使用する。と言うのは、このアルゴリズムが融通性(flexibility)があり具現しやすく、ドロー結果も良好なためである。伝統的なフォースダイレクトレイアウトアルゴリズムは、ノードをランダムに配置することから始まり、最適化技法を通してそれらの位置を再調整して最小限のエネルギーを持ったレイアウトを探し出す。色々なフォースダイレクトレイアウトアルゴリズム間の主な差は、エネルギー函数及び最小化技法の選択にある。フォースダイレクトレイアウトアルゴリズムの例としては、カマダ及びカワイ(Kamada及びKawai(1989))によるものと、フルチターマン及びレインゴールド(Fruchterman及びReingold(1991))によるものとがある。前者は、2次元グラフを生成し、分離グラフを視覚化出来ない。多くのフォースダイレクトアルゴリズムの共通的な問題は、大規模グラフの処理が非常に遅いことである。これは、各反復ステップで全ての対のノード間のフォース(force)を計算しなければならないからである。
【0004】
また、リラクション(relaxation)アルゴリズムを基にして蛋白質相互作用を視覚化するジャバアプレットプログラムがムロワカ(Mrowka(2001))によって開発され、Y2H(Yeast Two−Hybrid、Uetz 等、2000)データでテストされた。このプログラムは全ての蛋白質相互作用データがHTMLソースのアプレットプログラムのパラメーターで提供されることを要求し、ウィンドウをキャプチャー(capturing)すること以外には視覚化されたグラフを保存(save)する方法がない。ウィンドウからキャプチャーされたイメージは、静的な(static)イメージであり、一般的に質が落ちる。また、このようなイメージは、以後にデータ変更を反映させた修正ができない。ノードを移動させることは出来るが、後で使用する為に特定蛋白質を含む連結コンポーネントを選択したり保存することも不可能である。
【0005】
この他に、蛋白質相互作用視覚化道具は、固有のアルゴリズムやプログラムを使用しいておらず、一般用途のドロー道具を使用する。例えば、PSIMAP(Park等,2001; Lappe等, 2001)は、蛋白質の構造的分類(Murzin等, 1995)を使用してY2HデータとDIPデータ(Xerarios等, 2001)を比較することによって蛋白質ファミリー間の相互作用を表わしたものであり、トムソーヤ(Tom Sawyer)ソフトウェア(http://www.tomsawyer.com/)によって作成した後、相当な手作業によって写像のエッジ交差を除去した。
【0006】
ワシントン大学のある研究チーム(Schwikowski等, 2000; Tucker等, 2001)は、AGD(http://www.mpi−sb.mpg.de/AGD/)という一般用途のドロー道具を使用してY2Hデータを視覚化した。AGDは、2次元グラフを生成し視覚化結果が比較的満足できる程度であるため、強力な道具であると言えるが、一般用途のドロー道具であるため蛋白質相互作用研究に必要な機能は提供出来ない。例えば、Y2Hデータを含む大部分の蛋白質相互作用データは、多数の連結コンポーネントで構成された分離グラフを生成し、このグラフは、2次元ドローでは除去されない多数のエッジ交差を持った非平面グラフであるとも言える。このようなグラフを分析する方法の一つは、特定蛋白質を含む個別的な連結コンポーネントやサブグラフに対して作業することである。また他の方法は、非平面グラフをエッジ交差が無い3次元グラフに視覚化することである。しかし、AGDは、この機能を提供できないため分析が難しい。
【0007】
一方、上記グラフ作成プログラムは、全てデータベースを問合せ(query)をした後、問合せ結果を直接視覚化できない問題がある。またこれらは、特定形式の入力データを要求するためユーザ(user)がデータ形式を変換しなければならない不便さがある。また、蛋白質相互作用データは時間によって変化するので、このような変更事項を視覚化して反映するのが便利であるが、従来のプログラムは、このような機能を提供することができない。
【0008】
要約すれば、従来のグラフドロー道具は、1) エッジ交差が多い混雑なグラフや修正が難しい静的グラフを描く。2) 多くのデータによるインタラクティブ(interactive)な作業をするのには時間がかかりすぎる。3) 蛋白質相互作用データベースから直接データを読み取ることができず、データが特定形式で入力された時にだけ視覚化が可能であるため、蛋白質相互作用を視覚化するのには適合しないという問題点があった。
【0009】
【発明が解決しようとする課題】
本発明は、上記問題点を解決するためのものであり、大規模の蛋白質相互作用ネットワークを3次元に視覚化する新しい技法を提供するためにものである。
【0010】
より詳細には、従来の他の視覚化アルゴリズムに比べて処理速度が速く、蛋白質相互作用の視覚化だけではなく、インタラクティブな分析にも使用でき、蛋白質相互作用データベースに対する問合せ結果を直接3次元空間に視覚化し、視覚化されたネットワークは、以後の修正またはナビゲート可能なシステムのための新しいフォースダイレクトアルゴリズムを提供することである。
【0011】
【課題を解決するための手段】
本発明は、大規模の蛋白質相互作用データの効率的視覚化技法に関するもので、蛋白質をノードとし、蛋白質間相互作用をエッジとする3次元グラフを描く。本発明は蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度の両方を増加させることによって球体(sphere)表面に配置し、初期レイアウトを生成する第1段階と、上記初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォース(local spring force)と非隣接ノードとのグローバルスプリングフォース(global spring force)の両方を考慮して平衡位置(equilibrium position)に移動させる過程を前もって決められた回数だけ反復してグラフを生成する第2段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法を提供する。
【0012】
本発明は、上記第2段階の反復回数がユーザによって変更可能であり、上記蛋白質相互作用データが格納されているデータベースと連動して作動することをもう一つの特徴とする。
【0013】
また、ユーザ(user)が選択したノードに対する隣ノードとの距離レベルを一定距離までに制限することによって、上記グラフを簡略化する第3段階をさらに含むことを特徴とする。
【0014】
まず、本発明で使用される蛋白質相互作用データに対する用語と特性について詳しく見てみる。蛋白質相互作用データは、ノードが蛋白質を示し、エッジが蛋白質の相互作用を示すグラフに視覚化出来る。ノードの次数(degree)は、エッジの数であり、u=vの時、エッジ(u、v)は自己ループである。また、蛋白質相互作用データは次のような特性を持っている。
【0015】
1) グラフに視覚化した時、蛋白質相互作用データは多数の連結コンポーネントを持った分離グラフになる。例えば、MIPS遺伝的相互作用データ(http://mips.gsf.de/proj/yeast/tables/interaction/)は、100個以上の連結コンポーネントを含んでいる。
【0016】
2) 蛋白質相互作用データは、2次元グラフでは除去されない多数のエッジ交差を持った非平面グラフを産出する。
【0017】
3) 一つのデータ集合において蛋白質毎に非常に異なった数の相互作用する蛋白質を持っているため、これを視覚化したグラフは低い次数だけではなく非常に高い次数のノードも含むようになる。
【0018】
4) 蛋白質相互作用データは、ときおり自己ループに該当する蛋白質相互作用を含んでいる。
【0019】
5) 蛋白質相互作用データは、同一蛋白質対に対して複数の相互作用を含んでいる。
【0020】
本発明では、自己ループに該当する相互作用をデータベースのエッジテーブルに格納するが、ドロー過程を簡単にしてきれいなグラフを生成する為に視覚化ではこれを無視する。また、本来の蛋白質相互作用データベースが同一エッジに対する複数の項目を含んでいたなら、ローカルデータベースには一回だけ格納する。本発明によって視覚化される蛋白質相互作用ネットワークは、イメージ ファイル、ローカルデータベースまたはGML形式(Himsolt、1997)のテキストファイルに格納出来る。GML (Graph Modeling Language)はポータブル(portable)なグラフファイル形式であり、GMLでグラフを保存すると前に計算されたグラフを再びロードして再視覚化出来るという長所がある。
【0021】
従来のフォースダイレクトアルゴリズムの共通的な問題は、大容量のグラフ処理時に速度が非常に遅くなるということであり、本発明では、速度と視覚的鮮明度を大きく向上させられる新しいフォースダイレクトアルゴリズムを通した視覚化技法を提案する。本発明で提案する視覚化技法は、ワルシャウ(Walshaw(2000))のアルゴリズムを基礎として、問題点を改善したものである。
【0022】
本発明のレイアウトアルゴリズムは図1に簡略に記述されている。ワルシャウアルゴリズムの問題点の一つは、グラフが密集サブグラフ(非常に高い次数を持ったノードを含むサブグラフ)を含んでいる時に、願い求める結果を得られないことである。このアルゴリズムは、グラフの大きさがある臨界値(threshold value)以下に下がる時までノード位置を反復的に計算するため、全体的なレイアウトを改善出来ないままアルゴリズムを何回も不必要に反復する場合が発生する。したがって、本発明では、ワルシャウアルゴリズムとは異る終了条件を採用し、デフォルトで20回反復するようにした。20というデフォルト値は、比較実験を根拠に経験的に選択したもので、試用者がインターフェースを通じて反復回数を増加させられる(16行)。
【0023】
各反復ループで、隣接ノード間のローカルスプリングフォース(local spring force)だけではなく(10行)非隣接ノード間のグローバルスプリングフォース(global spring force)まで参照して(8行)ノード位置が更新される。
【0024】
図2は、隣接ノード間のローカルフォースによってノードvが再配置されることを図示した図である。図2aを詳しく見てみると、ノードvは3個のノードに連結されていて、3個の隣接ノードの一つuからのvに対するフォース(force)は、vをvとuの間のラインに沿って動くようにさせる。結果的には、図2bに図示したように、全ての隣接ノードによって生じた結合フォース(aggregate force)は、vを平衡位置(equilibrium position)に移動させる。
【0025】
次は、本発明で採用されている初期レイアウト方法について説明する。従来の一般的なフォースダイレクトグラフドローアルゴリズムは、2次元の平面や3次元空間にグラフの全てのノードをランダムに配置することから始まり、最適化技法を使用してこの初期レイアウトを継続的に修正して最少エネルギーを持ったレイアウトを求める。初期レイアウトにオーバーラップするノードや同一平面上のノードがある場合、それらを再配置する為に計算時間が増加することもある。それで、処理時間を短縮する為に、本発明では初期レイアウトのためにノードをランダムに配置しない。本発明は、極座標の水平及び 垂直角度を増加させることによって球体(sphere)表面にノードを配置する。この方法は、平面にノードを配置する回数を最小化する。図3は、473個のノードを持ったグラフの初期レイアウトの例を図示したものである。図4は、初期レイアウトのための簡略なアルゴリズムである。
【0026】
以下、本発明のアルゴリズムの計算費用(必要な時間)に対して詳しく見てみる。「n(ノードの数)=V」のグラフにおいて、初期レイアウトには時間O(n)だけが所要されアルゴリズムのグローバル時間には影響を及ぼさない。Tを外側ループの総反復数としよう(図1の2行)。ノード一つの移動Dを計算するには時間O(n)がかかるため、外側ループの各ステップで全てのノードの移動Dを計算するには時間O(n2)がかかる。ゆえに、総必要時間は、O(T・n2) = O(n2)である(Tは常数)。スプリング−エンベダー(spring−embedder)アルゴリズム(Kamada及び Kawai、1989)の時間複雑度のO(n3)に比べると、本発明はとても速い。
【0027】
本発明の視覚化技法を利用して具現されたドロー道具では、サブグラフを探して作業することが可能である。蛋白質相互作用ネットワークの大きさや特性上、(分離グラフの連結コンポーネントや特定蛋白質と相互作用する蛋白質のサブグラフと同じ) サブグラフを探し、各サブグラフについて作業することが可能でなければならない。連結コンポーネントを探す手順は全てのノードに適用され、連結コンポーネントの総目録を得られる(図12参照)。図5に図示された例のように、この目録は、各連結コンポーネントの大きさ、ノード、エッジ等だけではなく連結コンポーネントの総数も持っている。
【0028】
また、蛋白質相互作用データは、大容量で時間経過にしたがって変化することがあるため、フラット(flat)ファイルよりはデータベースで管理する方がずっと効率的である。したがって、本発明では蛋白質相互作用データのローカルデータベースを構築した。
【0029】
次は、本発明の大規模蛋白質相互作用データの効率的視覚化技法を具現したプログラムであるインタービューアー(InterViewer)を実験した結果について説明する。図5は、MIPS遺伝因子相互作用データの連結コンポーネントを列挙したものである。この例では同一蛋白質対間の重複相互作用を除外して888個の蛋白質間の1093個の相互作用が含まれていて、左側ウィンドウは、MIPS遺伝因子相互作用データ全ての連結コンポーネントを示しており、ここでユーザが連結コンポーネントを選択すると上記連結コンポーネントの全てのエッジが右側ウィンドウに表示される。この例の連結コンポーネント中、サブグラフ0は、2個の自己ループを含み531個のノードと807個のエッジを持った最も大きなサブグラフである。図6は、本発明のサブグラフ0を視覚化したものである。エッジ交差があるように見えるが、ビデオモニターに3次元ドローで視覚化した時は実際にはエッジ交差はない。
【0030】
インタービューアーを使用すれば、ユーザ(user)は蛋白質相互作用を分析し、回転やズームによって3次元ドローを探索出来る。図7は、蛋白質相互作用の分析例を図示したものである。最初のウィンドウには全ての機能グループ対に共通する蛋白質の数と各グループ内の内部相互作用の数が示されている。ユーザがこのウィンドウから一行を選択すると、二番目ウィンドウのように蛋白質と機能グループの関係がベン図(venn diagram)で表示される。この図によれば35個の蛋白質が機能「aa (Amino−acid metabolism)」を持っていて、46個の蛋白質が機能 「cc (Cell cycle control)」を持っていて、3個の蛋白質は、二機能を両方持っている。ユーザ(user)が機能グループをクリックすると、三番目と四番目のウィンドウに図示されているように該当機能グループの全ての蛋白質が列挙される。
【0031】
インタービューアーによって視覚化されたグラフは、隣ノードとの距離レベル(distance level of neighbors)を制限することによって簡単化され得る。例えば、図6のCIT2の隣ノード達の距離レベルを5に設定すると、インタービューアーは図8に図示したように76個のノードを持った簡略化されたグラフを探し出す。このグラフで、ユーザが選択したノードのSEP2、PAN1及びFIR1を異なる色で表示し、CIT2はまた違う色で表示することによってユーザの便宜をはかることができる。ユーザは、フォースダイレクトレイアウトを生成する間、一つ以上のノード位置を固定するように選択出来る。初期レイアウト以後に、サブレイアウトの中心を固定させることによって生成された星模様のサブグラフのノード位置は大部分満足に値するグラフを産出してくれる。
【0032】
【発明の効果】
まず、本発明の大規模の蛋白質相互作用ネットワークを明確で美的に優れたグラフに視覚化し、従来のフォースダイレクトアルゴリズムと比べて10倍以上速いシステムを具現出来る。実行時間の比較のために、本発明では従来のグラフドロープログラムのパジェ(Pajek(Batagelj & Mrvar、2001))とチューリップ(Tulip(David、2001))を一緒に実行させた。パジェの場合、レイアウトのためにカマダ及びカワイのアルゴリズム(1989)、エイゲンバリュー(Eigen value)方法(Golub及び van Loan、1996)、フルチターマン及びレインゴールドのアルゴリズム(1991)等、3種類のアルゴリズムが具現されている。最初のアルゴリズムは、分離グラフを描くことが出来ず、2次元グラフだけを描き、二番目のアルゴリズムは、グラフドロー結果がフルチターマン及びレインゴールドのアルゴリズムに比べて良くないので、フルチターマン及びレインゴールドのアルゴリズムだけを比較対象とした。また、チューリップの二つのアルゴリズムであるスプリング−エレクトリック(Spring−Electric)レイアウトとGEMアルゴリズムを比較した。
次の表1は、本発明のインタービューアーと上記三種類のアルゴリズムをペンティアムIV 1.7GHzプロセッサーで比較実験した結果である。これらのアルゴリズムによるドロー結果は、図9ないし図11に図示されている。各図面は、インタービューアー、パジェ(Fruchterman−Reingold)、チューリップ(Spring−Electric)及びチューリップ(GEM)による結果グラフを順に図示したものである。
【表1】
また、本発明の視覚化技法は、蛋白質相互作用の視覚化だけではなく個別的な連結コンポーネントやサブグラフ等のインタラクティブな検索及び探索のためのシステムにも使用出来る。
最後に、本発明は蛋白質相互作用データベースを動的に問合せをしてその問合せ結果を直接視覚化することによって、大量の更新データの視覚化及び分析が可能であるという長所がある。
【図面の簡単な説明】
【図1】図1は、本発明の視覚化技法のレイアウトアルゴリズムである。
【図2】図2は、隣接ノード間のローカルフォースによるノード移動を示した図である。
【図3】図3は、473個のノードを持った初期レイアウトの例を示した図である。
【図4】図4は、初期レイアウトのためのアルゴリズムである。
【図5】図5は、サブグラフ目録を示した図である。
【図6】図6は、図5のサブグラフ0を3次元にドローした結果を示した図である。
【図7】図7は、蛋白質相互作用分析の例を示した図である。
【図8】図8は、図6のグラフを簡略化した図である。
【図9】図9は、Y2Hデータに対する視覚化結果として、(a) インタービューアー視覚化結果、(b) パジェ(Fruchterman and Reingold アルゴリズム)視覚化結果、(c) チューリップ(GEMアルゴリズム)視覚化結果、(d) チューリップ(Speing−Electrical Forceアルゴリズム)視覚化結果を図示した図である。
【図10】図10は、MIPS遺伝的相互作用視覚化結果として、(a) インタービューアー視覚化結果、(b) パジェ(Fruchterman and Reingoldアルゴリズム)視覚化結果、(c) チューリップ(GEM アルゴリズム)視覚化結果、(d) チューリップ(Speing−Electrical Force アルゴリズム)視覚化結果を図示した図である。
【図11】図11は、MIPS物理的相互作用視覚化結果として、(a) インタービューアー 視覚化結果、(b) パジェ(Fruchterman and Reingold アルゴリズム)視覚化結果、(c) チューリップ(GEM アルゴリズム)視覚化結果、(d) チューリップ(Speing−Electrical Forceアルゴリズム)視覚化結果を図示した図である。
【図12】図12は、連結コンポーネント(connected component)を探し求める過程を説明した図である。
Claims (4)
- 大規模の蛋白質相互作用データを視覚化するために蛋白質をノード(node)として蛋白質間相互作用をエッジ(edge)とする3次元グラフを生成する大規模蛋白質相互作用データの効率的視覚化技法において、
上記蛋白質相互作用データの全てのノードを極座標の水平及び垂直角度を増加させることによって、球体(sphere)表面に配置し、初期レイアウトを生成する第1段階、及び、上記初期レイアウトの各ノードを隣接ノードとのローカルスプリングフォース(local spring force)と非隣接ノードとのグローバルスプリングフォース(global spring force)を考慮して平衡位置(equilibrium position)に移動させる過程を事前に決められた回数だけ反復してグラフを生成する第2段階とを含むことを特徴とする大規模蛋白質相互作用データの効率的視覚化技法。 - 上記第2段階の反復回数は、ユーザ(user)によって変更可能であることを特徴とする請求項1に記載の大規模蛋白質相互作用データの効率的視覚化技法。
- 上記蛋白質相互作用データが格納(store)されているデータベースと連動することを特徴とする請求項1に記載の大規模蛋白質相互作用データの効率的視覚化技法。
- ユーザが選択したノードに対する隣ノードとの距離レベルを一定距離までに制限することによって上記グラフを簡略化する第3段階をさらに含むことを特徴とする請求項1に記載の大規模蛋白質相互作用データの効率的視覚化技法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0057604A KR100470977B1 (ko) | 2002-09-23 | 2002-09-23 | 대규모 단백질 상호작용 데이터의 효율적 시각화 기법 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005099514A Division JP2005322216A (ja) | 2002-09-23 | 2005-03-30 | 大規模蛋白質相互作用データの効率的視覚化技法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004118819A true JP2004118819A (ja) | 2004-04-15 |
Family
ID=31987513
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002319839A Pending JP2004118819A (ja) | 2002-09-23 | 2002-11-01 | 大規模蛋白質相互作用データの効率的視覚化技法 |
JP2005099514A Pending JP2005322216A (ja) | 2002-09-23 | 2005-03-30 | 大規模蛋白質相互作用データの効率的視覚化技法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005099514A Pending JP2005322216A (ja) | 2002-09-23 | 2005-03-30 | 大規模蛋白質相互作用データの効率的視覚化技法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7280921B2 (ja) |
JP (2) | JP2004118819A (ja) |
KR (1) | KR100470977B1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004069417A (ja) * | 2002-08-05 | 2004-03-04 | Hitachi Ltd | ノード座標の決定方法、ネットワーク表示方法及びスクリーニング方法 |
KR100491666B1 (ko) * | 2002-09-23 | 2005-05-27 | 학교법인 인하학원 | 단백질 상호작용 네트웍의 분할 시각화 기법 |
EP1510941A1 (en) * | 2003-08-29 | 2005-03-02 | Sap Ag | A method of providing a visualisation graph on a computer and a computer for providing a visualisation graph |
EP1510939A1 (en) * | 2003-08-29 | 2005-03-02 | Sap Ag | A method of providing a visualisation graph on a computer and a computer for providing a visualisation graph |
EP1510940A1 (en) * | 2003-08-29 | 2005-03-02 | Sap Ag | A method of providing a visualisation graph on a computer and a computer for providing a visualisation graph |
EP1510938B1 (en) * | 2003-08-29 | 2014-06-18 | Sap Ag | A method of providing a visualisation graph on a computer and a computer for providing a visualisation graph |
US7523117B2 (en) * | 2005-05-04 | 2009-04-21 | West Virginia University Research Corporation | Method for data clustering and classification by a graph theory model—network partition into high density subgraphs |
KR100833988B1 (ko) * | 2006-10-12 | 2008-05-30 | 포항공과대학교 산학협력단 | 다극자 변형 표현을 이용한 단백질 분자 모양의 표현 방법 |
KR100970968B1 (ko) * | 2008-10-21 | 2010-07-21 | 건국대학교 산학협력단 | 거대 분자의 렌더링 방법 및 장치 |
US10289802B2 (en) | 2010-12-27 | 2019-05-14 | The Board Of Trustees Of The Leland Stanford Junior University | Spanning-tree progression analysis of density-normalized events (SPADE) |
CN102750460B (zh) * | 2012-05-31 | 2014-12-10 | 常州工学院 | 分层简化大规模图数据的运算方法 |
CN103390087B (zh) * | 2013-07-31 | 2016-03-09 | 浙江大学 | 一种针对大规模几何场景的交互绘制方法 |
WO2015084461A2 (en) * | 2013-09-23 | 2015-06-11 | Northeastern University | System and methods for disease module detection |
JP7404648B2 (ja) * | 2019-04-25 | 2023-12-26 | 富士通株式会社 | 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム |
CN111061921B (zh) * | 2019-12-04 | 2020-10-30 | 智器云南京信息科技有限公司 | 一种图像布局实现方法、系统、终端设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265030A (en) * | 1990-04-24 | 1993-11-23 | Scripps Clinic And Research Foundation | System and method for determining three-dimensional structures of proteins |
WO1993020525A1 (en) * | 1992-03-27 | 1993-10-14 | Akiko Itai | Method of searching the structure of stable biopolymer-ligand molecule composite |
JPH08263535A (ja) * | 1995-03-23 | 1996-10-11 | Fujitsu Ltd | 立体構造データ管理方法 |
US20020107643A1 (en) * | 1999-01-22 | 2002-08-08 | Wayne A. Hendrickson | Process for pan-genomic determination of macromolecular atomic structures |
-
2002
- 2002-09-23 KR KR10-2002-0057604A patent/KR100470977B1/ko active IP Right Grant
- 2002-11-01 JP JP2002319839A patent/JP2004118819A/ja active Pending
- 2002-11-07 US US10/290,432 patent/US7280921B2/en not_active Expired - Fee Related
-
2005
- 2005-03-30 JP JP2005099514A patent/JP2005322216A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20040059521A1 (en) | 2004-03-25 |
KR20040026227A (ko) | 2004-03-30 |
KR100470977B1 (ko) | 2005-03-10 |
US7280921B2 (en) | 2007-10-09 |
JP2005322216A (ja) | 2005-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005322216A (ja) | 大規模蛋白質相互作用データの効率的視覚化技法 | |
Perer et al. | Balancing systematic and flexible exploration of social networks | |
Yi et al. | Toward a deeper understanding of the role of interaction in information visualization | |
JP4122234B2 (ja) | データ分析システムおよびデータ分析方法 | |
KR101855736B1 (ko) | 데이터베이스와 상호작용하는 컴퓨터 지원 설계 시스템의 세션 내에서의 모델링된 객체의 설계 | |
KR101333865B1 (ko) | Plm 데이터베이스의 오브젝트를 디스플레이하는 방법 및 그 방법을 구현하는 장치 | |
Dwyer et al. | Exploration of networks using overview+ detail with constraint-based cooperative layout | |
JP7030211B2 (ja) | 大規模生成的設計データセットを可視化および探索するための技法 | |
Singh et al. | Visual mining of multi-modal social networks at different abstraction levels | |
Ma et al. | A graph-based interface for visualanalytics of 3D streamlines and pathlines | |
Krommyda et al. | IVLG: Interactive visualization of large graphs | |
Steed et al. | Web-based visual analytics for extreme scale climate science | |
JP2004118818A (ja) | 蛋白質相互作用ネットワークの分割視覚化技法 | |
CN113867850A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN110413808A (zh) | 一种三维点云数据存储、查询方法及装置 | |
JP2002245097A (ja) | 連成解析方法、その解析条件設定方法、その記憶媒体及びそのプログラム | |
Jianu et al. | Visual integration of quantitative proteomic data, pathways, and protein interactions | |
JPH10207907A (ja) | 3次元空間を用いたオブジェクト配置・表示・操作方法および装置 | |
Sabol et al. | Visual knowledge discovery in dynamic enterprise text repositories | |
Patro et al. | MDMap: A system for data-driven layout and exploration of molecular dynamics simulations | |
Paradies et al. | GraphVista: Interactive exploration of large graphs | |
Hube et al. | The Data in Your Hands: Exploring Novel Interaction Techniques and Data Visualization Approaches for Immersive Data Analytics. | |
Liang et al. | Navigation in large hierarchical graph through chain-context views | |
Leimer et al. | Relation-based parametrization and exploration of shape collections | |
Chen et al. | A New Visualization Approach to Better Understanding the World Wide Web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040616 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041130 |