JP2005243024A - インタラクティブな生物学的図表を構築するためのシステム、ツール及び方法 - Google Patents

インタラクティブな生物学的図表を構築するためのシステム、ツール及び方法 Download PDF

Info

Publication number
JP2005243024A
JP2005243024A JP2005046947A JP2005046947A JP2005243024A JP 2005243024 A JP2005243024 A JP 2005243024A JP 2005046947 A JP2005046947 A JP 2005046947A JP 2005046947 A JP2005046947 A JP 2005046947A JP 2005243024 A JP2005243024 A JP 2005243024A
Authority
JP
Japan
Prior art keywords
stencil
biological
text
interaction
entities
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005046947A
Other languages
English (en)
Inventor
Allan J Kuchinsky
アラン・ジェイ・クチンスキー
Aditya Vailaya
アディヤ・ヴァイラヤ
David Moh
デイビッド・モー
Peter Bluvas
ピーター・ブルヴァス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of JP2005243024A publication Critical patent/JP2005243024A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Generation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】
インタラクティブな生物学的図を作成するために、ローカルフォーマットと関連付けられる視覚的な文法をもたらすためのシステム、ツール、方法及び記録可能媒体を提供する。
【解決手段】
描写的で且つ一義的に表示された高レベルの関連エンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)の表現物をもたらすためにステンシル(160)を用いる。さらに、情報をオーバーレイし、且つ既存の生物学的図と比較する。
【選択図】なし

Description

本発明は、生物学的データの管理の分野に関する。より詳細には、本発明は、他の形態の生物学的データと共にインタラクティブに使用するための生物学的図の作成及び操作に関する。
生命を脅かす疾患に対する薬や治療法の発見は、しばしば、疾患の分子的基盤を詳細に理解しつなぎ合わせるプロセス、即ち、生物学的パスウェイにおいて遺伝子とタンパク質とが如何に相互作用しているかをまとめ表現するプロセスである。当分野に従事している分子生物学者は、劇的にその量が増加し且つ多岐に渡っている生物学的なデータから知識を吸収する必要がある。このデータの爆発的増加は、DNAマイクロアレイ、質量分析法、核磁気共鳴法、定量的ポリメラーゼ連鎖反応などの新技術によってもたらされた。分子生物学者が、分子レベルのエンティティ間の相互作用を理解するのに利用できる科学文献の中にもまた、大量の情報がある。
生物学者がこうした実験データや他の情報源を利用する1つの態様には、生物学的プロセスに関して解釈を集め仮説を形成しようとする場合がある。このような解釈と仮説によって、生物学的作用に関する高レベルのモデルが構築される。このようなモデルは、さらなる実験のためのアイディアを生み出すために、また、条件、処置あるいは刺激に対する生物学的応答を予測するために、当業者に情報を伝達するための基礎となり得る。
生物学的作用を表すものとして広く受け入れられているモデルの1形態は、ネットワークモデルである。当該モデルでは、生物学的エンティティと、これらの間の相互作用とを、それぞれ図式的にノードとリンクとして表す。生物学的なネットワークはまた、一般に「パスウェイ」とも呼ばれる。当該ネットワークメタファーは、生体分子間の相互作用を表すのに非常に適している。また、例えば電気工学などの他の領域においてはグラフ理論によるネットワーク分析ツールに関し豊かな歴史があり、これらを生物学的ネットワークのプロパティを分析するために使用できる。よって、ネットワークメタファーは、生体分子の相互作用に関する情報を構築する際の手助けとなるばかりでなく、生体分子ネットワークへの外乱効果を予想する基礎としても非常に有用である。この目的のために、分子生物学者が生物学的ネットワークに関連する情報を作成し操作することに役立つ大量の市販のソフトウェアシステムがある。この中には、限定はしないが、生物学的ネットワークを構築、修正及び/又は精緻化するツール、生物学的ネットワークを実験データ及び/又は科学文献から推測するツール、実験データを生物学的ネットワークに関して視覚化するためのツール、生物学的ネットワークの挙動をシミュレーションするためのツール、及び/又はこれらのグラフのプロパティを分析するツールなどが含まれる。
ネットワークメタファーはしばしば、分子ネットワーク関連の知識だけではなく、より広範な生物学的知識を表す際にも使用されることに留意されたい。例えば、生理学的プロセス間あるいは疾患の状態間の相互関係は、ネットワーク図を用いて生物医学文献に表されることも多い。
生物学のコミュニティにおいて生物学的ネットワークに関する知識が増加すると、解明された生物学的ネットワークの大きさ、他の生物学的ネットワークとの相関性、生物学的ネットワークの数自体もまた、劇的に増大する。この複雑性の爆発的増加により、ユーザによる管理は困難となる。例えば、数百を超えるノードのネットワーク図を視覚的に検査するのは非常に大変であるが、一部のタンパク質間の相互作用ネットワークのサイズに至っては、ノード数が何千にも及ぶ場合がある。
バイオインフォマティクス分野では、生物学的ネットワーク及びパスウェイの視覚的な表現並びに操作が主要な機能であるところの、多くの種類のツールがある。例えば、システム生物学の分野では、in silicoモデリング及びシミュレーションツールにおいてフロントエンドの役割を果たすグラフィックネットワーク編集ツールがある。このようなツールの例として、NetBuilder(http://strc.herts.ac.uk/bio/maria/NetBuilder/)、JDesigner(http://www.cds.caltech.edu/〜hsauro/JDesigner.htm)などが挙げられる。ユーザは、これらのツールを使用することで、個々の要素からネットワークを構築することができる。ネットワークが大きくなると、これらのプロセスは冗長でエラーも発生しやすい。
グラフィック構築ブロックからネットワーク図を構築する、他の分野のシステムもある。この種類の主要な汎用作図製品の例は、Visio(http://www.microsoft.com/office/visio/)である。Visioは「マクロ」と「テンプレート」という概念を用いて、反復するタスクを自動化する。集積回路設計分野では、グラフィック構築ブロックを要素として使用する回路レイアウト用のツールがある。1つの方法は、「パラメータ化されたセル」を構築ブロックとして使用することである。この例は、ケイデンス デザイン システムズ社から市販されている、Virtuoso Layout Editor製品における「PCells」の使用である(http://www.cadence.com/datasheets/virtuoso_layout_editor.html)。しかしながら、これらのシステムはどれも、生物学的図を構成するために適合されてはいないので、どのシステムも、知識抽出を介して、タンパク質間の相互作用ネットワークなどの生物学的ネットワーク情報を生成するのには適していない。
非特許文献1は、コンピュータによって容易に処理でき人間が容易に理解できる形態で、パスウェイを構造的に表現する方法として、シグナル伝達経路を階層状に分解することを提案している。しかし、当該モデル中の階層状モジュールはパラメータ化されておらず、各モジュールは、主要なエンティティ群を完全に別個に例示したものにすぎない。モジュール内のエンティティの従属群を置き換えることによって同様のモジュールを「再利用する」方法はない。したがって、この方法は、生物学的ネットワーク内で発生する固有の多くの規則性を十分に利用することができない。
フクダ及びタカギによる、「Bioinformatics」2001,Vol.17,No.9,pp829−837
既存のシステムに鑑み、生物学的な挙動を反映した、一般的に理解されている構築ブロック群に基づいた生物学的図を容易且つ自動的に生成し得るだけでなく、さらに、当該構築ブロックを組み合わせることで、別々の分子レベルの構成要素から作成されたネットワークよりも複雑性を管理し易い生物学的図を作成できるところの、システム、方法、ツールが必要とされている。
本発明は、生物学的データを操作するための、システム、方法及びコンピュータ読み取り可能媒体を提供する。本発明は、生物学的なエンティティ及び相互作用に関する視覚的な文法(visual grammar)を提供する。これを、ローカルフォーマットテキスト文法と共に使用することで、種々の形態の生物学的データを、インタラクティブに使用するためにリンクさせることができる。
本発明によれば、組み合わせ及び拡張が可能な、ステンシル(本質的に生物学的図の視覚的な文法)のライブラリが提供される。各ステンシルは、エンティティを表すグラフィック要素と、少なくとも1つの相互作用を表すグラフィック要素とを含んで成る。各グラフィック要素は、特定の種類の生物学的なエンティティ又は相互作用を表す生物学的な意味を有する。さらに、特定のエンティティの名称と、相互作用の方向性とを含んでいる特定の生物学的情報を提供するスロットが提供される。視覚的な文法は、ローカルフォーマットのテキスト文法と共に用いられるように設計されており、それによって、生物学的図、テキスト文書及び実験データの間で、インタラクティブな機能を実行できる。
ステンシルを使用することで、広範な生物学的コンテキストにおいて、知識を表現することができる。例えば、生理学的プロセス間の相互関係、又は疾患の状態間の相互関係、並びに生体分子間の相互作用などを表すことができる。
本発明によれば、生物学的相互作用に関するネットワークを構築するためのツールもまた提供される。当該ツールは、ネットワークビューアと、識別されたエンティティ及び関係/相互作用をステンシルに記入するためのキャンバスと、記入されたステンシルを選択して、共通するエンティティをマージ(接続)し、結果として得られる相互作用に関するネットワークをネットワークビューアに表示する手段とを含む。
本発明によれば、さらに、ルール検証手段に基づいて、実験データと上記ネットワークとを比較する手段もまた提供される。実験データと上記ネットワークとの間で不一致が認識されると、反転表示、強調などで視覚的に識別することができる。
ステンシルは、生物学的ネットワーク内の多数の抽象レベルを表示するために提供される。例えば、多数の相互作用と、それに関連するエンティティとを組み合わせることで、より高次元の生物学的概念を表すことができる。
本発明によれば、さらに、既存のステンシルによって表示されている既存のエンティティ及び相互作用に関連づけて追加のエンティティ及び/又は相互作用をスケッチ又はフリードローすることで、ステンシルを拡張し得るところの、フリーフォーム拡張機能もまた提供される。
本発明によれば、生物学的データを操作するためのシステムもまた提供される。当該システムは、生物学的な相互作用を表す再利用可能なステンシルのライブラリと、特定の生物学的情報を記入すべきステンシルを選択する手段と、特定の生物学的データを選択されたステンシルに割りあてる手段と、割り当てられた特定の生物学的データと共にステンシルを表示する手段と、ローカルフォーマット用言語を用いて、表示されたステンシルを特定の生物学的データが抽出された元の他の生物学的データ源と関連づける手段とを含んで成る。
さらに、ステンシルの共通要素を、割り当てられた特定の生物学的データと接続することで、ステンシルを構成要素として有する生物学的図を表示する手段についても説明する。
さらに、当初ライブラリに含まれていなかった追加のステンシルを設計し保存する手段も提供される。
本発明によれば、ルールを設計し且つルールとステンシルとを関連づける手段もまた、提供される。さらに、ルールをルール検証し、特定の生物学的データを含むステンシルが表す相互作用を確認する手段も提供される。また追加のデータに対してルールをルール検証することもできる。
さらに、ローカルフォーマットを使用して、特定の生物学的データから参照されたデータをナビゲートし、ステンシルの少なくとも1つの上で表示する手段も可能である。
2つ又はそれ以上のステンシルを、それらに割り当てられた特定のデータに関して比較し、比較の結果を本発明によるビューア上で表示することもできる。
本発明を利用することで、ステンシルにおいて表現された特定の生物学的データを、既存の生物学的図にマッピングすることができる。
本発明を利用することにより、ユーザは容易且つ便利に、インタラクティブな生物学的図を作成するのに用い得るデータ/テキストからなる図式的な表現を構築することができる。例えば、本発明は、エンティティを表すグラフィック要素と、少なくとも1つの相互作用を表すグラフィック要素とを含んで成るステンシルと、特定のエンティティの名称と、相互作用の方向性とを含んでいる特定の生物学的情報を提供するスロットとを設けるステップと、特定の生物学的情報をステンシルに割り当て、相互作用に関与するエンティティを識別するステップと、少なくとも1つの相互作用の方向性をインタラクティブに割り当て、これによって相互作用のグラフィック表現を一義化するステップとを包含する方法を提供する。ステンシルに記入する際に用いられる情報は、既存のテキスト文書又は他の生物学的情報源をテキストマイニングすることによって識別されるエンティティ及び相互作用とし得る。
上記のツール及びシステムの各々を、単独で又は任意の使用可能な組み合わせで使用する方法も提供される。
本発明は、生物学的図を作成するのに用いられる生物学的情報を一義化する際に、ユーザにインタラクティブ機能をもらたし得るシステム、ツール及び方法を提供する。例えば、このようなツールのうち1つは、テキスト文書のうち少なくとも一部をインポートし表示できるテキストビューアと、テキストビューアにインポートされたテキストをテキストマイニングするための手段と、生物学的図を作成するためのキャンバス領域と、特定の種類の相互作用を表すところの、少なくとも1つの予め設計されたブランクステンシルと、キャンバス上のステンシルに、テキストマイニングにより識別されたエンティティ及び相互作用のうち1つ又は複数を記入するための手段とを提供する。ステンシルの各位置に記入されるエンティティ及び相互作用は、各々が識別されたテキスト文書の一部の少なくとも1つの箇所に由来する。
本発明によれば、テキストマイニングによって識別されたエンティティ及び相互作用をリストする、リストベースのテキストエディタもまた提供される。リストされた相互作用に方向性を割り当てる手段を使用することで、リスト内で一義化することができる。リストされた各相互作用にスロットを関連づけることによって、ユーザは相互作用に関与するリストされたエンティティのうち1つ又は複数を識別し、これらの各エンティティが相互作用において果たす役割を割り当てることができる。
本発明によれば、複雑性を管理し易い生物学的図を作成できるところの、システム、方法、ツールを提供することができる。当業者には、以下により十分に本発明を説明するところの、詳細な説明を読むことによって、本発明のこれらの利点及び他の利点、並びにこれらの特徴及び他の特徴が明らかとなろう。
本発明のシステム、ツール、方法を説明する前に、本発明がここに説明する特定のソフトウェア、ハードウェア、ソフトウェア言語や記号に限定されないことを理解されたい。これらはもちろん変更し得るからである。また、本明細書において用いる用語は、単に特定の実施形態を説明するためのものにすぎず、本発明を限定する意はないことも理解されたい。本発明の範囲は、添付の特許請求の範囲によってのみ限定されるものとする。
特に記載のない限り、本明細書に使用する全ての技術用語並びに科学用語は、本発明が属する分野の当業者によって一般に理解される意味と同じ意味を有する。本明細書に記載する方法及び材料と同様の又は等価の任意の方法及び材料を、本発明の実施又は試験に使用することができるが、以下に、好ましい方法及び材料を説明する。本明細書で方法及び/又は材料を開示し記載する際に参照する全ての出版物は、参照することでその内容を本明細書に取り入れることとする。
本明細書及び添付の特許請求の範囲において使用するときは、単数形は、別途明確に指示がない限り、複数形の意味も包含することに留意されたい。従って、例えば「ステンシル」は、複数のステンシルを含み、「図」は、当業者に既知の1つ又は複数の図及び図の等価物を意味する。
本明細書で論じている刊行物は、本出願の提出日前に開示されているという理由だけで示している。さらに、示す出版日は実際の出版日とは異なる場合もあり、これは別途確認する必要がある。
定義
本出願では、別途指示しない限り、以下の用語は、以下に示す意味を有する。
本明細書において用いるとき、用語「生物学的図」とは、生物学において存在する概念の描写を含む、任意のグラフィック画像を意味する。生物学的図には、限定はしないが、パスウェイ図、細胞ネットワーク、シグナル伝達経路、調節経路、代謝経路、タンパク質間の相互作用、分子/化合物/薬物間の相互作用、などが含まれる。
「生物学的な概念」、「エンティティ」、「事物」とは、生物学分野における任意の目的対象物を意味する。この中には、限定はしないが、タンパク質、遺伝子、分子、組織、器官、疾患プロセス、細胞機能、解剖学的構造、生理学的システム、バイオポリマー、ヌクレオチドなどが含まれる。「生物学的な概念」、「エンティティ」、「事物」は、研究者がさらに詳しく研究しようとする目的対象物であってもよい。例えば、生物学的概念、エンティティ、事物は、1つ又は複数の遺伝子、タンパク質、分子、リガンド、疾患、薬剤又は他の化合物、それらのテキストによる表現又は他の意味論的表現、又はこれらの任意の組合せあるいは全ての組み合わせなどであってもよいが、これらの特定の例に限定されるものではない。
「バイオポリマー」とは、1つ又は複数の種類の繰り返し単位からなるポリマーである。バイオポリマーは、典型的には生体組織内に存在し、それらとして、具体的には、多糖類(炭水化物など)、ペプチド(当該用語は、ポリペプチド及びタンパク質を包含するものとして使用する)、ポリヌクレオチド及びポリヌクレオチドアナログ(アミノ酸アナログもしくは非アミノ酸群、又はヌクレオチドアナログもしくは非ヌクレオチド群から成るか又はこれらを含む化合物など)が挙げられる。これには、従来の主鎖を人工主鎖、即ち合成主鎖と置き換えたポリヌクレオチド、並びに1つ又は複数の従来の塩基をワトソンクリック型の水素結合相互作用に関与し得る基(天然又は合成)と置き換えた核酸(又は核酸の合成又は天然アナログ)が含まれる。ポリヌクレオチドは、単一鎖又は複数鎖の構成を含み、鎖のうち1つ又は複数は、他の鎖と完全に並んでいてもよいし並んでいなくてもよい。
「ヌクレオチド」とは、核酸のサブユニットを意味し、リン酸基、五炭糖、窒素含有塩基を含んで成る。また、このようなサブユニットの機能上のアナログ(合成又は天然)も意味する。当該サブユニットは、ポリマー形態(ポリヌクレオチド)では、2つの天然ポリヌクレオチドの場合と同様の配列特異的な様式で、天然ポリヌクレオチドとハイブリダイズできる。例えば、「バイオポリマー」には、DNA(cDNAを含む)、RNA、オリゴヌクレオチド、PNA及び他のポリヌクレオチドが含まれ、これらの出所は問わない。「オリゴヌクレオチド」は、一般に、約10ヌクレオチド長から100ヌクレオチド長のヌクレオチドマルチマーを意味し、一方、「ポリヌクレオチド」は、多数のヌクレオチドを有するヌクレオチドマルチマーを包含する。「バイオモノマー」は、単一の単位を意味し、同じバイオモノマー又は異なるバイオモノマーと結合してバイオポリマーを形成し得る(例えば、2つの連結基を備える単一のアミノ酸又はヌクレオチドであり、前記2つの連結基のうち一方又は両方が除去可能な保護基を有することができる)。
本明細書で用いるとき、用語「相互作用」又は「関係」とは、エンティティ又はノード(名詞)間で発生する関係又は作用を示し、「動詞」とも呼ぶ(例えばローカルフォーマットで)。動詞を、ローカルフォーマットでの使用のために識別化することで、文法、言語、ブール論理を構築することができる。動詞の例には、限定はしないが、アップレギュレーション、ダウンレギュレーション、抑制、促進、結合、遺伝子の開裂及び状態、タンパク質間の相互作用、薬物の作用及び反応などが含まれる。
ある事物が他とは「リモート」であると示す場合、これは、2つの事物が少なくとも異なる建物にあることを意味し、少なくとも1マイル、10マイル、又は少なくとも100マイル離れていることを示す。
情報を「伝達する」とは、情報を表すデータを、電気信号として適切な通信チャネル(例えば私設ネットワーク又は公共ネットワーク)を用いて送信することを意味する。事物を「転送する」とは、当該事物をある場所から次の場所に移動させる任意の手段を意味し、これは、物理的に当該事物を輸送する方法もしくは他の方法(可能な場合)があり、少なくともデータの場合には、データを担う媒体を物理的に輸送することあるいは当該データを通信することが含まれる。
「プロセッサ」とは、必要な機能を実行するところの、任意のハードウェア及び/又はソフトウェアの組み合わせを意味する。例えば、本明細書では、任意のプロセッサとして、メインフレーム、サーバ、パーソナルコンピュータ(デスクトップ又はポータブル)の形態で入手可能なプログラム可能デジタルマイクロプロセッサを用いることができる。プロセッサがプログラム可能である場合、適切なプログラミングをリモートの場所からプロセッサに通信することができ、又はあらかじめコンピュータプログラム製品に保存しておくこともできる(例えば、磁気ベース、光ベース、固体デバイスベースのいずれかによる、携帯式又は固定式のコンピュータ読み取り可能記憶媒体)。例えば、磁気ディスク又は光ディスクはプログラミングを担持でき、対応するステーションにおいて各プロセッサと通信する適切なディスク読取装置で読み取ることができる。
用語「してもよい」、「することができる」及び「し得る」は、当該行為が任意選択であることを意味する。
本明細書に記載する方法では、以下に記載するイベントを論理的に可能な任意の順序で実行してもよいし、又は記載する順序で実行してもよい。
「ローカルフォーマット」とは、図、テキスト、実験データなどから抽出されたセマンティック(意味論的)情報の全てを、同じフォーマットで表示し得、容易に交換し得、共に使用し得るように、当該抽出情報を表すために用いられるところの、制限された文法/言語を意味する。ローカルフォーマットを用いることで、多岐のカテゴリからの情報をリンクさせることができ、且つこれは自動的に行うことができる。ローカルフォーマットとなる情報は、実験データを既存のテキストデータや生物学的モデルと比較するために提供されるアプリケーションツールの前駆体として、並びに例えばユーザが提供する任意のテキストデータ又は生物学的モデルと比較するために提供されるアプリケーションツールの前駆体として使用できる。
本明細書で用いるとき、用語「ノード」は、エンティティを意味する。これはまた、「名詞」とも呼ぶ(例えばローカルフォーマットで)。従って、本発明によってデータをローカルフォーマットに変換する際には、ノードは、ローカルフォーマットが文法、言語、ブール論理を構築するための「名詞」として選択される。
本明細書で用いるとき、用語「リンク」は、エンティティ又はノード(名詞)間で起こる関係又は作用を意味し、また「動詞」とも呼ばれる(例えばローカルフォーマットで)。動詞を、ローカルフォーマットでの使用のために識別化することで、文法、言語、ブール論理を構成することができる。動詞の例には、限定はしないが、アップレギュレーション、ダウンレギュレーション、抑制、促進、結合、遺伝子の開裂及び状態、タンパク質間の相互作用、薬物の作用及び反応が含まれる。
本明細書で用いるとき、用語「ルール」とは、ステンシル、ノード、リンクと関連するデータを用いて実行し得る手続き(プロシージャー)を意味する。ルールは、コンピュータによって照合され得る宣言型アサーションとし得、例えば「酵素はタンパク質でなければならない」などである。又は、ステンシル、ノード、リンクと関連するデータを用いてコンピュータで実行し得る任意のプロシージャーであってもよい。例えば「エンティティAがエンティティBを活性化するという関係があり、且つAが活性化状態にある場合は、Bを活性化状態とする」などである。
本明細書で用いるとき、用語「ステンシル」とは、1つ又は複数の生物学的な概念、エンティティ、時間、相互作用、関係と、これらがどのように相互作用するかに関する説明(一般的にはグラフィックによる説明であるが、必ずしもグラフィックである必要はない)とを含んで成る図による表示を意味する。ステンシルは、生物学的図を構築する際、複数のノード又はリンクを生成するための機能に関して、マイクロソフト社のワード又はエクセルのマクロと同様に機能する。ステンシルは、図形(四角形、楕円形)、線、弧、矢印などのグラフィックな要素及び/又はテキストを含むことができる。これらの要素は生物学的な意味を有する。即ち、要素は、遺伝子、タンパク質、RNA、代謝物、化合物、薬物、複合体、細胞、組織、生物、生物学的な関係、疾患などの、生物学的なエンティティの種類を表す。
「生物学的ネットワーク」とは、生物学的エンティティ及びそれらの間の相互作用を、それぞれ図式的なノード及びリンクとして表現しているところのグラフ表現(これは、テキストなどの他の情報を含むこともできる)を意味する。生物学的ネットワークの例として、限定はしないが、パスウェイ、及びタンパク質−タンパク質相互作用マップを挙げることができる。
「パスウェイ」とは、生物学的ネットワーク内での、順序づけられた相互作用シーケンスを意味する。パスウェイの例には、wnt/βカテニン経路などのシグナル伝達イベントのカスケードがあり、この場合、wntリガンドが細胞膜上の受容体に結合するという外部からの刺激の結果、細胞内で起こる順序づけられた相互作用シーケンスを表す。「パスウェイ」と「生物学的ネットワーク」は、当分野では相互に交換可能なものとして、用いている。
「リン酸化」は、タンパク質のヒドロキシ基(側鎖s、T又はY)へのリン酸基の付与を意味し、これは、プロテインキナーゼの触媒作用によるATPリン酸基供与体の付与による。タンパク質の活性は、しばしば、リン酸化によって調節される。リン酸化は、一種の翻訳後タンパク修飾メカニズムである。
用語「活性化(した)」とは、生化学的エンティティが、その機能を発現し得る状態を意味する。
用語「抑制(された)」とは、生化学的エンティティが、その機能を発現するには完全に若しくは部分的に無効であるか、又は非活性化された状態を意味するのに用いる。
「アップレギュレーション」とは、対応するRNA(リボ核酸)の転写産物が標準状態より有意に高い、遺伝子状態を意味する。
「ダウンレギュレーション」とは、対応するRNAの転写産物が標準状態より有意に低い、遺伝子状態を意味する。
「共同因子」とは、酵素活性に必要な無機イオン又は他の酵素である。
複雑性を管理する効果的な方法は、小さなオブジェクト群を、単一のエンティティと考えられる集合体にグループ化するところの、抽象化を利用することである。これにより、複雑な情報を検討する際に留意しなければならない異なる事物の数が低下するため、複雑性が低減する。ステンシルは、生物的な意味を有する組み合わせ可能なパターン及びモチーフから構成される、視覚的な生物学的言語/文法をもたらす。ステンシルは、生物学的ネットワーク及びプロセスの集合構成要素として利用できる。ステンシルは、エンティティ、相互作用、名詞、動詞、遺伝子、タンパク質などの原子的要素からなる体系化されていない集合によってもたらされる抽象化よりも、高レベルの抽象化をもたらすことによって、複雑性の管理を容易にする。文法はルールを含んで成り、且つステンシルは視覚的な文法をもたらすため、ステンシルはルールの一実施形態である。ステンシルは、ALFAオブジェクト(本明細書において開示、参照する、本出願人による同時係属中の、2002年5月22日付けの出願番号第10/154,524号(題名「多数のフォーマットから既存のデータを抽出し共通のフォーマットでデータを表現しオーバーレイするシステム及び方法」)、及び本出願による同時係属中の、2003年8月14日付けの、代理人文書番号第10030687−1号(出願番号未割り当て)(題名「生物学的図をインポート、作成及び/又は操作する方法及びシステム」)、及び本出願人による同時係属中の、2003年8月14日付けの、代理人文書番号第10030986−1号(出願番号は未割り当て)(題名「テキスト文書を表示し、ここから知識を抽出し、この知識を別の表示形態の知識に変換するシステム、ツール、方法」)において説明されているようなローカルフォーマットを用いている)を含むことができる。上記の出願番号第10/154,524号の出願、代理人文書番号第10030687−1号(出願番号未割り当て)の出願、代理人文書番号第10030986−1号(出願番号未割り当て)の出願は、参照することでその内容の全てを本明細書に取り入れることとする。
ALFAオブジェクトとステンシルとの間でマッピングを実行することができ、この逆も実行できる。当該マッピングは、多対多(即ち、多くの特徴が多くのALFAオブジェクトにマッピングでき、またその逆も可能である)とし得る。同様に、マッピングは、ステンシルと生物学的図の間、及び/又はステンシルとテキスト文書の間、ステンシルと実験データの間でも行うことができる。既存の生物学的図を本発明に従ってインポートし、ステンシルにおいて解析することができる。同様の方法が、2002年5月22日付けの、本出願人による同時係属中の出願番号第10/155,675号(題名「画像から意味論(セマンティックス)を抽出するシステム及び方法」)に記載されている。出願番号第10/155,675号の出願は、参照することでその内容を本明細書に取り入れることとする。本発明によれば、ステンシルから図を構成でき、また、既存の図を、ステンシル及び/又は手書き拡張機能によって拡張できる。
ユーザ誘導型の知識抽出に関する方法及びシステムは、本出願人による同時係属中の出願番号第10/154,524号の出願において記載されている。本明細書に記載するものは、自動テキストマイニング技術を用いて、科学的テキスト文から「名詞」(例えば、生物学的エンティティ)と「動詞」(例えば、関係)を抽出する方法及びシステムである。従って、例えばテキストマイニングによって科学文献から知識を抽出することにより、例えば、2つの遺伝子が関与する促進相互作用などの関係に関与する生物学的エンティティを識別できる。この結果得られる解釈物を「ローカルフォーマット」と呼ばれる制限された文法で表す。当該フォーマットを実装するソフトウェアプログラムは、カリフォルニア州パロアルトのアジレントテクノロジー社によるALFA(アジレントローカルフォーマットアーキテクチャ)テキストビューア(ATV)である。これは、本出願による同時係属中の、代理人文書番号第10030986−1号(出願番号未割り当て)の出願において、より詳細に説明されている。ローカルフォーマットは、それによってユーザが科学的テキストの本質を検討し理解し得るところの、構造化された方法として機能する。また、他のコンピュータツールによって操作し得る生物学的対象モデルとしても機能する。
図面ビューアは、生物学的図を表示し、当該図からグラフによる知識をインポートして、テキスト及び/又はデータと共に使用するためのローカルフォーマットに変換するために使用できる。生物学的図を変換するための、並びに生物学的図を構成するための他の特別な機能を、ローカルフォーマットの使用と共に用いることができ、これらは、本出願による同時係属中の代理人文書番号第10030687−1号(出願番号未割り当て)の出願に記載している。
図1は、テキスト素材(例えば、科学文献)、実験データ、生物学的図などの異なるカテゴリからの情報の相互作用、比較、オーバーレイなどを容易にするシステム1000の概略図である。ローカルフォーマットインフラストラクチャー層400(例えば、同時係属中の出願番号第10/154,524号に記載されるもの)を用いることで、例えば1つの表現(テキスト、データ、グラフィックス)からの知識を、他の1つ又は複数の表現に変換できる。これによって、異なる表現からの知識を比較目的で組み合わせて、新しくより詳細な知識表現を構築することなどができる。ローカルフォーマットレベル400において、知識は、一般的な表現又は抽象的な表現に変換される。この抽象的な表現は、共通言語としての機能を有し(ローカルフォーマット)、これは知識のテキスト表現、データ表現、グラフィック表現のために使用することができる。
多くの異なるテキストエディタ又はビューアを使用することで、知識のテキスト表現にアクセスし、これらの知識を入力してローカルフォーマットに変換できる(上記のように、一部はデータマイニングをも行い、自動的に名詞及び動詞を抽出してもよい)。さらに、テキストビューア100によって、収集した知識の改善及びこのような知識を変換する際の精度を改善するための相互作用がユーザにもたらされる。本発明で用いられるローカルフォーマットモデルにマッピングできる対象モデルをもたらす任意のテキストマイニングアルゴリズムは、本発明のツールとうまく相互作用することができる。
図面ビューア200を使用することで、生物学的図を表示し、当該生物学的図からグラフによる知識をインポートし、400でローカルフォーマットに変換して、テキスト及び/データと共に使用することができる。ローカルフォーマットの使用と共に用いることのできる、生物学的図の変換並びに生物学的図の構成に関する他の特別な機能を以下に示す。データビューア300を用いることで、テキスト文章や生物学的図にオーバーレイするための実験データをインポートしローカルフォーマットに変換したり、全ての種類の知識をローカルフォーマットに変換することによって、このような知識をテキスト知識及び/又はグラフィック知識と組み合わせることができる。本発明、さらには代理人文書番号第10030986−1号(出願番号未割り当て)の出願に記載されるテキストビューア100及び図面ビューア200に類似の機能を有する特定のデータビューアは、未だ開発されていない。これは、個別のデータポイント間で関係を形成し且つこれらの関係を一義化するという特定の要件に対処する際の複雑性が、テキスト形式の知識及び図形式の知識によってもたらされるタスクよりもはるかに大変であるからである。インタラクティブな生物学的図を作成し表示する他のビューアが、本出願人による同時係属中の代理人文書番号第10030687−1号(出願番号未割り当て)の出願に記載されている。このように、インフラストラクチャー層400は、異なる出所からの知識を変換し、テキストビューア100、図面ビューア200、データビューア300などの種々のエンドポイント(アプリケーション)において表示できる手段/データモデルをもたらす。
本発明の一態様は、視覚的な文法を提供すること、ローカルフォーマットを付与すること、生物学的エンティティと作用との間の相互関係を表すことである。視覚的な文法は、共通する種類の生物学的エンティティと、これらの間の接続とをグラフィックにより表すところのステンシルライブラリを基盤とする。本発明はまた、ステンシルを組み合わせ且つ編集するための軽量ソフトウェアツール、ステンシルの要素及びこれらの値を他のデータ要素、データセット、ローカルフォーマットにリンクさせるツールも提供する。ステンシルは、輪郭(四角形、楕円形など)、線、弧、矢印、テキストなどのグラフィック要素を含むことができる。これらの要素は、生物学的な意味を有する。即ち、当該要素は、遺伝子、タンパク質、RNA、代謝産物、化合物、薬物、複合体、細胞、組織、生物、生物学的な関係、疾患などの生物学的エンティティの種類を表す。
生物学的な意味によって、ステンシルを他の形態の生物学的データに容易にリンクさせることができる。さらに、ステンシルは、複合的な生物学的作用を表し、生物学的図をより簡単に迅速に構築するための「マクロ」のような機能を有する。ステンシルは、テキスト文書と図の間、又は図と例えば実験データのような他の形態のデータとの間の、双方向の相互作用を実現する。さらに、ステンシルは、既存の図の代替物などの、代替物に関するグラフィック調査(ユーザにより制御)もサポートする。ステンシルは、多数のユーザ間で共同で使用することもできる。これは、例えば、ブランクステンシル群をスタータテンプレートとして提供すること、又は記入されたステンシルを共有すること、又はステンシルを共同で記入すること、又はこれらの任意の組み合わせによって実施することができる。
図2Aは、ステンシル160の概略図である。この例のステンシルは「空」である。即ち、まだスロットがエンティティに割り当てられていない。この例のステンシルは、リン酸化生化学反応に関しており、この場合、第1のエンティティは、リン酸化によって第2のエンティティを活性化させる。これは、非常に一般的な生化学的な相互作用を表し、生物学的パスウェイにおけるシグナル伝達の基礎の1つである。楕円132が、第1のエンティティのスロットである。第2のエンティティは、スロット131では不活性な状態として、スロット133では活性なリン酸化状態として、それぞれ収容されている。スロット134及び135は、それぞれ反応共同因子であるアデノシン三リン酸(ATP)とアデノシン二リン酸(ADP)のエンティティを含む。したがって、ATPとADPは全てのリン酸化相互作用において共同因子であるため、スロット134及び135は「定数」を含む。全てのリン酸化相互作用において同じ相互作用(例えば、活性化、リン酸化)が起こるため、相互作用リンク137、138、139もまた定数である。スロット131、132及び133は、「可変的な」エンティティ(種々のリン酸化相互作用において異なる)を含む。スロット131及び133は、同一の基礎概念を指しており、この概念によって表される生物学的エンティティの異なる状態を含んでいる。この概念の等価性は、後に説明するように、ルール検証によって付すことができる。
図2Bは、図2A記載のリン酸化ステンシルの「記入済」バージョンを示している。この例では、スロット132中の活性化作用のあるエンティティは、IL−3タンパク質である。スロット131において活性化前の状態、スロット133において活性化状態であるエンティティは、タンパク質Stat3である。
ステンシルにより、ユーザは、エンティティごと及び相互作用ごとの表現を構築するだけではなく、より高レベルの表現を構築する機能を得られる。図2A−図2Bは、単一ステンシル内で多数の抽象レベルを表すようにステンシルを使用するところの、簡単な例を示しているに過ぎない。例えば、ステンシルは、分子の相互作用を表示し、同時に例えば、外傷又はアポトーシスに繋がる相互作用などの高レベルの結果を表示するために提供される。さらに、本発明のツール及び技術によれば、他の形態で構造化された実験データ及び/又は構造化されていないデータをステンシルにリンクさせることができる。上記のように、実験データなどの構造化されたデータは、ローカルフォーマットを使用することでリンクすることができる。ユーザがステンシルに関する何かを理解し、ステンシルの所定の面を記述するのを支援するために、注釈、ビットマップ画像、研究ノートからのスキャンなどの、構造化されていないデータをリンクさせることができる。
図3は、既定のステンシル160(例えば160a〜160e)のパレット145を組み込んだ、ネットワーク図編集ツール200を示す。ステンシルは、ステンシルパレット145からネットワークエディタ200のメインキャンバス210にドラッグアンドドロップすることで、ネットワーク図230に追加することができる。ステンシル160をネットワーク図230に追加すると、図編集ツール200の初期「接続」処理を使用して、ネットワーク図の構成要素に接続することができる。好ましい実施形態では、「接続」処理は、図230のエンティティ130のうちの1つから、組み込まれたステンシル160の縁に線140を引くことによって、図編集ツール200中で行われる。図3では、ステンシル160aと160bは、当該方法によって、ネットワークに組み込まれている。
ステンシル160中のスロットには、いくつかの方法でエンティティを割り当てることができる。好ましい実施形態では、スロットの割り当ては、スロット上でマウスをダブルクリックしてグラフィックスロットを選択し、次いで、選択したグラフィックスロットにエンティティの名称を記入することによって、図エディタ内で行うことができる。ステンシル内にスロットを割り当てる他の方法は、例えば、カリフォルニア州パロアルトのアジレントテクノロジー社から市販されているVistaClara調査データ分析ツール、及び、2003年3月31日付けの、本出願人による同時係属中の出願番号第10/403,762号(題名「多数のデータタイプを同時に視覚化し操作するための方法及びシステム」)という出願において説明しているツールなどの、別のツールからエンティティ表現物をドラッグアンドドロップすることである。出願番号第10/403,762号の出願は、参照することでその内容を本明細書に取り入れることとする。このオプションを用いることで、ユーザは、VistaClaraツールから行を選択し、これをステンシル内のスロットにドラッグアンドドロップするが、この場合、上記のように図編集ツール内のネットワーク図の中にステンシルを組み込むことができる。
上記のように、ステンシルに「ルール検証」を埋め込むことによって、ステンシルの意味に込められた仮定を、実際のデータ及び事実に関して確認することができる。各ステンシルは、ユーザが実行し得る論理アサーションのルール群と関連づけることができる。当該ルールは、ステンシル、ノード、リンクと関連するデータを使用して実行できるプロシージャーである。ルールは、例えば「酵素はタンパク質でなければならない」などのコンピュータで確認し得る宣言型アサーションであってよく、又は例えば「エンティティAがエンティティBを活性化するという関係があり且つAが活性化状態にある場合は、Bを活性化状態へとする」などの、ステンシル、ノード、リンクに関連するデータを使用してコンピュータで実行できる任意のプロシージャーであってもよい。後者の例では、ルールは生物学的プロセスのシミュレーションにおいて、値を得るための基礎として使用できる。
例えば図2A及び図2Bの場合には、ルール検証を利用することで、スロット131、132及び133に対する割り当てが生物学的に意味のあるものであることを確認することができる。図2Aの例では、スロット132に割り当てられたエンティティは、キナーゼファミリーのタンパク質の1つであり(これはリン酸化の媒介因子である)、スロット131及び133中のエンティティは、基本的に同じタンパク質を指す。ステンシルに関連づけられる他のルールの例は、以下の通りである。
・推定の遺伝子/タンパク質間促進/抑制関係が実験データと一致するか
・反応には必要な構成要素及び前提条件が揃っているか
・反応を所望の向きに進行させるために充分な濃度の触媒が存在するか
・構成した図の中に、「未到達の」反応があるか
好ましい実施形態では、ルールはALFAオブジェクトである。これらは、属性としてステンシルに付与することができる。当該ルールは、ステンシルの属性/値の対に述語式(predicate espression)を適用し、ブール値(真/偽)を返す。リン酸化ルール述語の擬似コードの例は以下の通りである。
(コード)
1.リン酸化に関する簡単なルール検証
If(this.activator.hasCategory(Category.KINASE,GO_classificationtree))
2.コンピュータプロシージャーとしてのルールの使用
If(this.activator.getPropValue(“regulationState”).equals
(RegulationState.UP_REGULATED))
{this.activated.setProp(“regulationState”,
RegulationState.UP_REGULATED);
this.setRuleOutput(RegulationState.UP_REGULATED));}
さらに、ルールは、ルール述語の実行の成功又は失敗に応じて(即ち、述語が、TRUE又はFALSEのいずれを返すかに応じて)実行できる処理を有することができる。処理の例は、リン酸化ルール述語が失敗の場合(例えば、ステンシルスロット132に割り当てられたエンティティがキナーゼで「なかった」場合)に、ユーザにエラーメッセージを報告することである。
このようなルールは、ステンシルを比較的大きな図の中に組み入れた際に、ステンシル全体にわたって組み合わせ且つ伝えることができる。ステンシルルール処理を利用して値を出力し、この値を別のステンシルのルール検証の入力値として使用することができる。
本発明はさらに、エンティティ、相互作用、ステンシルを組み合わせることによって、相互作用ネットワークを構築する機能を提供する。当該システムは、共通のエンティティに相互作用をマージさせることによって、グラフ構造を形成する。ユーザは、このネットワークを実験データ値と関連づけて、推定したネットワークを実際のデータに関して略式確認する。これは、埋め込みルール検証をステンシル内に含め、各ステンシルの意味に込められた仮定を実際のデータ及び事実に関して確認することによって可能となる。グラフ構造を作成すると、ステンシルに対応する相互作用群を識別し、問題とする特定のステンシルと関連づけられたルールを実験データ値に関して実行する。この確認の結果は、推定ネットワーク内のエンティティ及び相互作用にオーバーレイしたデータによって示される。矛盾並びに相違の場合は、例えば、実験データと一致しなかった推定相互作用を反転表示することによって強調することができる。このような比較の結果を、図4に示す。ここでは、相互作用156を反転表示することで不一致を示している。また、相互作用157は、不一致が検出されていないため反転表示されていないことに留意されたい。使用するデータオーバーレイ技術の詳細は、2002年5月22日付けの、本出願人による同時係属中の出願番号第10/155,616号(題名「多様な生物学的関係を視覚化するシステム及び方法」)の出願にも記載されている。出願第10/155,616号は、参照することでその内容を本明細書に取り入れることとする。
本システムはまた、グラフィック構造が予めステンシルを使用して構築されていてもいなくても、グラフィック構造を構成要素ステンシルへと分解する機能も提供する。グラフィック構造が予めステンシルを使用して構築されている場合は、構成要素ステンシルはローカルフォーマットを介して既にマッピングされているため、分解は容易である。しかしながら、予めステンシルを使用して構築されていない既存のグラフィック構造を操作する場合は、当該グラフィック構造をローカルフォーマットオブジェクトに変換し、次いで、ステンシルに一致するサブグラフを検索しなければならない。グラフィック構造は、本出願人による同時係属中の代理人文書番号第10030687−1号(出願番号未割り当て)の出願に記載された方法によって、ローカルフォーマットオブジェクトに変換することができる。ローカルフォーマットオブジェクトは、Shen−Orr,S.らによる、Network Motifs in the Transcriptional Regulation Network of Escherichia coli,Nature Genetics,2002に記載の方法と同様な方法によって、ステンシルに一致するサブグラフを検索することができる。同論文は、参照することでその内容を本明細書に取り入れることとする。ローカルフォーマットオブジェクトのネットワークは、接続性マトリックス(connectivity matrix)によって表すことができる。3つ又は4つのノードのサブマトリックスの可能な組み合わせの各々を、ライブラリ内のステンシルの等価性に関しテストする。等価性は2つの基準で決定し得る。第1に、サブマトリックスは、ライブラリ内のステンシルと同型でなければならない。即ち、各サブマトリックスは、接続ノード間で、同数のノード及び同数の接続を有していなければならない。第2に、サブマトリックスの要素は、ステンシルのルールと一致していなければならない。例えば、ステンシルのルールは、所与の位置のノードがMAPキナーゼタンパク質を表すことを求める場合がある。その場合、サブマトリックスは、等価性決定の前提条件として、所与のノード位置にMAPキナーゼタンパク質を有しなければならない。
ステンシルは、それを構成する要素であるエンティティ及び相互作用へと分解できる(又は部分的に分解できる)。ステンシルは、ローカルフォーマットオブジェクトを含むため、構成要素のエンティティ並びに相互作用へと完全に又は部分的に分解することは、簡単な「グループ化解除」処理である。基本的には、ステンシルインスタンス(stencil instance)が削除され、構成要素が残る。
本発明はさらに、抽出した知識を記入したステンシルを、既存の生物学的ネットワークと比較する機能を提供する。ユーザは、既存のネットワーク図をシステムにロードするか、検索することで既存のネットワークのサブセットを選択することができる。当該システムは、記入済ステンシルを、インポートした図にオーバーレイする。このオーバーレイは、例えばステンシルに対応する、インポートされた図の中の、ノードや弧(エンティティ及び相互作用を表す)をカラーコード化することなどで行われる。SPADシグナル伝達経路データベース(http://www.grt.kyushu−u.ac.jp/eny−doc/spad.html)からインポートされた、インターフェロンα媒介性シグナル伝達経路に関して、当該機能の例を図5A−5Bに示す。図5Aは、フクダ及びタカギによる、階層状ブロックへと分解したシグナル伝達経路の一例を示す(Bioinformatics,Vol.17,No.9,2001,pp829−837)。図5Aの経路図は、外部刺激であるリガンド166に対する生細胞の反応を分子レベルで示している。リガンド166は、I型受容体167に結合する。この結合により、イベントカスケードが開始し、その結果、初期刺激に対する応答として新しいタンパク質が産生される。リガンド166と受容体167との結合によりリガンド−受容体複合体165が形成され、この複合体がリン酸化反応を触媒し、2次メッセンジャー不活性タンパク質169を活性化し、2次メッセンジャー活性タンパク質170を形成する。次いで、2次メッセンジャー活性タンパク質170は、他の経路タンパク質171(複数可)と結合してタンパク質複合体172を形成し、このタンパク質複合体172が、さらに、核膜175を横切って核へと移動し、ここでDNA結合共同因子183と結合してタンパク質/共同因子複合体185を形成する。タンパク質/共同因子複合体185は、DNA領域に結合し、この結合によりターゲット遺伝子187(複数可)の発現が活性化される。ターゲット遺伝子187(複数可)の発現により、他のタンパク質が産生されるが、これらは典型的には、例えば、傷に対する反応としてのサイトカインタンパク質の産生など、初期刺激に応答するメカニズムに関する機能を有する。
図5Bは、これらのブロックに関するステンシルを、SPADインターフェロンα媒介性シグナル伝達経路を表すシグナル伝達経路にマッピングした図である。リガンド−受容体複合体ステンシル165は、IFN−受容体II 251とIFN−αリガンド250の間の経路中の膜に沿う相互作用をマッピングする。2次メッセンジャー不活性エンティティ167は、エンティティSTAT1 246及びSTAT2 247をマッピングし、また、2次メッセンジャー活性エンティティ170は、STAT1 249及びSTAT2 255をマッピングする。STAT1タンパク質266とSTAT2タンパク質268が結合することで形成されたタンパク質複合体エンティティ169は、核調節複合体ステンシル166へと移動する164。
このオーバーレイ技術の別の態様では、自動検索を利用して、例えば1つ又は複数のステンシルに含まれるもののような、ユーザが指定する相互作用群を含む既存のネットワークを検索する。次いで、指定する相互作用群を含むことが確認されたネットワークは、抽出された相互作用及びエンティティをオーバーレイすべく選択するために、ユーザに提供さる。
図6−8Bは、本発明によるステンシルの他の例を示す。上記のように、ステンシルは、視覚的な文法を作成すること、ローカルフォーマットを付与すること、生物学的エンティティと作用との間の相互関係を示すことのために使用される。この視覚的な文法は、共通の生物学的エンティティと、その間の接続とをグラフによって表すところの、組み合わせ可能で且つ拡張可能なステンシルライブラリに基づいている。各ステンシルは、輪郭(例えば四角形、楕円形)、及び/又は線、弧、矢印、テキストなどのグラフィック要素を含む。ステンシル要素は、生物学的な意味を有する。即ち、要素は、遺伝子、タンパク質、RNA、代謝産物、化合物、薬物、複合体、細胞、組織、生物、生物学的な関係、疾患などの生物学的エンティティを表すことができる。各ステンシルはスロット群を含み、スロットの各々は、生物学的エンティティ又は関係の「プレースホルダー」を表す(例えば「名詞」又は「動詞」)。
ステンシルは、多数のステンシル表現を作成することで抽象化できる。例えば、ステンシルの「論理的」表現は、例えば「AはBを活性化する」などのエンティティ間の1つ又は複数の相互作用を示すことができ、一方、ステンシルの「生化学的」表現は、「Aはリン酸化によってBを活性化する」を示すことができる。「論理的」表現の例を、図6に示す(即ち、「TNF1−αは、IL−β受容体に結合して、IGL遺伝子を促進する」)。さらに、位置(即ち、相互作用が発生する細胞内の位置)、時間、及び/又は相互作用を表すステンシルも提供できる。このようなステンシルは、単なる「論理的」表現など、時間又は位置を示さない他のステンシルへとさらに抽象化することができる。このように、ステンシルは、簡単な形態と複雑な形態の間で変換又は抽象化できる。一般に複雑なステンシルを定義した場合は、簡単なステンシルをそのような複雑なステンシルから構成することはできるが、この逆は不可能である。これは、簡単なステンシルは、ここから複雑なステンシルを構成するための充分なデータを有していないためである。
ステンシルはまた、知識ベースのためのクエリーインタフェースとして有効に使用することができる。この一例は、部分的に割り当てられたステンシルからクエリーを形成することである。このクエリーが提起されると、それに応答して、知識ベースは、未割り当てのステンシル要素を全て有効に完了させるデータ群をもたらす。このようにして、ユーザはステンシルを利用して、例えば、PI3−キナーゼタンパク質複合体をエントリ246に割り当てて、図8A中のステンシルに部分的に記入することによって、「PI3−キナーゼタンパク質複合体がかかわる経路について全ての受容体を検出する」などのクエリーをグラフィックとして形成することができる。
上述のように、ユーザは、生物学的エンティティをステンシルに割り当てることができる。割り当ての際、この情報は自動的にローカルフォーマットに追加され、ローカルフォーマットのデータに効果的にステンシル要素がマッピングされる。このように、ステンシルの使用は、メタデータを他の構造化されたデータ及び構造化されないデータにグラフィックとして追加する方法である。ステンシルは、十分に注釈(アノテート)することができ、注釈を行ういくつかの方法がある。ユーザが、注釈をステンシルに記入することなどによって、手で入力することができる。例えばネットワークエディタ200(図3)では、ステンシル160a又は160bをダブルクリックすると、表示されているステンシル(図示せず)の編集可能な「プロパティシート」が得られる。この中に注釈をタイプすることができる。さらに、注釈は、注釈を生成するデータマイニング推論ツールで作成することもできる。
図6は、ステンシル160の2つの例を示す。図6右側の記入済バージョンのステンシル160に記載のように、これらのステンシルは、簡単な促進関係並びに結合関係を表すべく用いられている。上記のように、ステンシル160に記入するために使用される情報は、科学文献から知識を抽出することで導出することができる。図6の一番上のステンシル160は空であり、記入されたステンシルは、「IL−1−αは、Th2細胞の増殖を誘導する」という相互作用を表す。下のステンシル160は、相互作用自体(即ち、図6の上のステンシル160)が別の相互作用のエンティティとしての役割を果たす例を示す。これは、「TNF1−αとIL−β受容体の結合は、IGL遺伝子の発現を促進する」というテキストで表現される相互作用に相当する。
一般的な生物学的関係に関する他の例は反応であり、これには、基質、生成物、触媒、共同因子、方向に関する情報が含まれる。図7は、ある例示的反応に関する空(ブランク)のステンシル及び記入されたステンシル160の一例を示す。図7のブランクステンシル160は、反応を表す記号(例えば四角形222)、触媒を表す記号(四角形224)、基質を表す記号(四角形226)、生成物を表す記号(四角形228)、共同因子を表す記号(230)を含む、特定の種類の反応に関する記号を含む。当該関係の「名詞」は、基質、生成物、共同因子、触媒である。「動詞」は反応である。図7の右側は、ユーザによって、基質226(2−オキソグルタル酸及びL−グルタミン)、生成物228(2L−グルタミン酸塩)、触媒224(グルタミン酸シンターゼ(NADPH))、共同因子230(NADPHとNADP)、反応222(双方向の矢印で表され、酵素(EC)番号1.4.1.1.3で識別される)が「記入」された後のステンシルを示す。基質と生成物の間の双方向矢印は、これが可逆反応であることを示す。
図8A及び図8Bは、一般に「漫画図(cartoon diagram)」と呼ばれるものを形成する際に使用するステンシルの一例を示す。示したステンシル160は、シグナル伝達経路など、細胞内の生物学的プロセスを表す漫画図に関する。図8Aは、空のステンシル160を示す。図8Bは、シグナル伝達のサブ経路を表す、記入済のステンシル160を示しており、この中には、細胞膜上でのリガンドと受容体との結合、並びにその後発生する活性化のカスケード状イベントが含まれている。
当該相互作用に関する「名詞」(即ち、エンティティ)は、リガンド(IFN−α)250、受容体(IFN受容体1)242、2次メッセンジャータンパク質(STAT1)246及び(STAT2)247、並びにSTAT1 249とSTAT2 255から構成されるタンパク質複合体である。「動詞」(即ち、相互作用)は、矢印248、252、253であり、これらはこの例では結合作用を表す。この例では、ステンシル160は、細胞内の「位置」情報(本例では、細胞膜)を表すことにも留意されたい。このように、ステンシルは、一構成原理として細胞内の位置情報を使用することができる。これは、プログラミングによって図を解析し、目的の位置を発見するために有用である。
本発明を利用することで、ユーザは、自分のニーズに合わせて、新しいステンシルを設計し保存することができる。既存のステンシル160を構築ブロックとして使用し、輪郭、線、矢印、弧及び/又はテキストなどのグラフィックプリミティブ(グラフィック要素)(graphical primitive)を追加することによって拡張することができる。グラフィック原形を用いて、新しいステンシルを最初から構成することもできる。共通要素の周囲でマージしたり、又はグラフィック原形で接続することによって、多数のステンシルをマージすることができる。マージ処理の例は、1つの反応ステンシルの生成物が、第2のステンシルの基質又は構成要素の1つとして機能する場合である(例えば、図5A及び図5Bに示すとおりである)。
ステンシルは、階層状に構成することができる。即ち、ステンシルは、プリミティブ要素と同様に他のステンシルを含むことができる。このようにして、ユーザは小さな断片から大きな図を構成することができる。同様に、図を小さな断片へと分割し、これについて別々に作業を行うこともできる。
図はまた、外部の源(限定はしないが、BioCarta又はKEGG経路をはじめとする)からインポートし、ステンシルを構築するために使用することができる。このための1つの技術は、追加のステンシル要素を、インポートされた図に追加することである。別の方法は、1つ又は複数のインポートされた図の一部を分割し、ここからステンシルを形成することである。既存の生物学的図を検索する自動ツールを使用して、既定のステンシルフォーマットを識別することができる。次いで、所望する既定のステンシルフォーマットを含む図をシステムにインポートし、そのシステムを使用して大きな表現物を構築ブロック(ステンシル)へと分解することもできる。インポートした図を用いて作業する場合、特定のノードをそのまま保持することもできるし、「空」にすることもできる。例えば、図5A及び図5Bに示したサブ経路のようなシグナル伝達経路図をインポートすることができる。ユーザは、受容体要素を、例えばI型受容体167などとしてそのまま保存したい一方で、他の要素は空にしたいと願う場合がある。このような場合に作成された新しいステンシルは、常にI型受容体を有するが、別の要素は割り当て可能である。
ステンシルを使用し且つ組み合わせることで、多数の生物学的な抽象化レベルを接続することができる。例えば、生化学的な反応を表すステンシル160を、生理学的なプロセス又は疾患プロセスを表すステンシル160と接続させることができる。この結果得られる構成によって、ユーザは多数の抽象化レベルに渡って視覚化し、推論することが容易になる。
本発明の別の機能として、グラフ理論法を用いて、2つ又はそれ以上のステンシルを構造的差異に関して比較することができる。これには、最短経路、最小スパニングツリー、及び/又はグラフの次数や大きさなどといった、グラフのプロパティを分析し比較することが包含され得る。
ユーザが、種に特有の経路の一部を表すステンシルを、例えば標準の経路にマージすることを可能とするところの他の機能も有する。この機能はまた、コラボレーション(共同作成)もサポートし、異なるユーザが互いに作成した関連するステンシルをマージすることが可能である。
ステンシルによるモデル定義は知識抽出法において利点があるのに加え、他の用途においても利益をもたらす。上述のように、生体系の刺激、処置、条件に対するグローバルな応答を定量的且つ定性的にモデリング及びシミュレーションするためのツールがある。これらはしばしば、まとめて、in silicoモデリングシミュレーションツールと呼ばれる。このようなツールは、生物学的エンティティと、これらの間の接続及び相互作用とに関する詳細なモデルを必要とする。この目的のために、これらのシステムの一部は、シミュレーションのモデリングインタフェースとして、グラフィックな「ネットワーク編集」ツールを提供する。個々の要素からネットワークを構成することは冗長でエラーが起こり易い。ネットワーク編集のためのステンシルベースの方法によって、生物学的ネットワークを構成するための「構築ブロック」群がもたらされ、これにより、シミュレーション環境によって望まれる意味論(セマンティックス)を構築しキャプチャすることがより簡単になり、結果、エラーが減少する。
ステンシルを、ローカルフォーマットを介して、例えば質量スペクトル又は科学文献中の文書など、別の種類のデータと結びつけることも有用である。質量スペクトル又は他のデータに結びつけることにより、このような詳細なデータに関する豊富な形態の注釈が提供され、これらのデータをグラフィックを用いて文脈化することができる。科学文献への結びつけによりグラフィックな「メモ作成」の形態が容易になり、1つ又は複数のステンシル又は図によって文書の要旨をキャプチャすることができる。研究者が要約の形態としてテキスト文書に図によって印をつけることはよくある。ステンシルは、このタスクをデジタルドメインにて行う方法をもたらし、このようなメモ及び要約を検索可能とし且つコンピュータで扱い得るようにすることができる。
生物学的図の自動的な構成、又は機械による構成は、ステンシル構造を実験データから推論することにより行うことができる。実験データは、遺伝子発現プロファイルなどの実験データプロファイルからネットワーク構造を推論するアルゴリズムによって処理し、ネットワーク構造はローカルフォーマットオブジェクトによって表すことができる。ネットワーク構造を実験による遺伝子発現データから推論するアルゴリズムの例は、Friedman, N.,らによる、Using Bayesian Networks to Analyze Expression Data,Journal of Computational Biology,7:601−620,2000において説明されており、参照することで、その内容を本明細書に取り入れることとする。ローカルフォーマットオブジェクトは、Shen−Orr,S.らによる、Network Motifs in the Transcriptional Regulation Network of Escherichiacoli,Nature Genetics,2002に記載の方法と同様な方法によって、ステンシルにマッピングするサブグラフを検索することができる。ローカルフォーマットオブジェクトのネットワークは、接続性マトリックスによって表すことができる。上述のように、3つ又は4つのノードからなるサブマトリックスの可能な組み合わせの各々を、ライブラリ内のステンシルを用いて等価性に関してテストすることができる。
生物学的エンティティの発現パターン表現物を類似性に関して比較し、これらのエンティティ間に存在する関係を推論することができる。例えば、発現パターンは、少なくとも1つの基準サンプルに対する生物学的エンティティの量の差の測定値とし得、例えば、遺伝子発現データ、タンパク質の量のデータ、代謝物の量のデータ、又は生物学的エンティティと基準サンプルとの間の量の差に関する他の測定値などである。各生物学的エンティティのパターン又は発現は、種々の条件にわたって発現値を多数回測定することによって導出することができる。
類似性の決定は、二乗ユークリッド距離、ピアソン相関係数などの距離関数を適用することによって行うことができる。特定の距離測定値が「類似」するか否かを決定するために、多くの類似性閾値距離関数を適用することができる。類似である、即ち、類似性閾値距離関数の境界内であると決定された類似測定値は、共同して調節されているとみなされ、結果、生物学的な相互作用に関与しているとみなされる。
類似性閾値を満たすと判断された類似性測定値は、さらに、統計的有意性に関して評価し得る。即ち、変則的発生の割合に対する、真の類似性の存在割合を決定する(又は、測定値のうち、真に類似性がある値の割合を決定する)。このような決定を行うために使用する典型的なテストには、限定はしないが、tテスト、分散分析(ANOVA)テストが含まれる。しかしながら、当該決定を行うための他のテストもまた、統計分野の当業者には明らかであろう。
統計的有意性を有する生物学的相互作用群(発現パターンの中で、統計的有意性をもつ類似性測定値によって暗示される)をマージする。この場合、同一の生物学的エンティティ(発現パターンで表されている)は、互いに結合することで、生物学的ネットワーク内でノードを形成する。このような生物学的なネットワークは、ランダムネットワークよりもかなり頻繁に発生するエンティティ及び相互作用のパターンに関して検討することができる。頻繁に発生するパターンをステンシルライブラリ中の要素と照合し、既存のステンシルに一致するところの、頻繁に発生するパターンを識別する。
ステンシルは、既存の生物学的な視覚化物を解析すること(ローカルフォーマットを使用)、並びにステンシルライブラリからの既存のステンシルを、ローカルフォーマットに変換された既存の生物学的図中の一致物に割り当て、ステンシルを使用して図を構成することをサポートする。潜在的なルール検証をステンシル内に組み込むことで、照合は容易となる。
逆に、ユーザは、既存の生物学的な視覚化物、文書、文書のコーパスを構文解析(分解)することで、クエリーの結果として認識されたステンシル群を得ることができる。
オーバービュー(overview)及びナビゲーションを容易にするために、ステンシル群を「スプレッドシートビューア」視覚化物で示すことができる。これは、本出願人による同時係属中の代理人文書番号第10030687−1号(出願番号未割り当て)の出願に記載されている。スプレッドシートビューアのセル内に示した全てのステンシルを出所源にリンクさせることができる。
上述のように、本発明は、ステンシルベースの分析及び情報検索ツールを提供する。当該ツールは、ローカルフォーマットを使用して記入済みステンシル又は未記入ステンシルに関してテキスト文書を検索すること、実験データを照会して1つ又は複数のステンシルに対する一致物を探すこと、選択された1つ又は複数のステンシルに対するユーザのコンテキストに基づいて既存の生物学的図を照会し、ユーザのコンテキスト内の任意のステンシルと一致する既存の生物学的図の任意の一部を表示すること、及び/又は、ローカルフォーマットオブジェクト群を照会して、ユーザのコンテキスト内で1つ又は複数のステンシルを発見することなどといった機能を実行する。
ステンシルは、知識抽出ツールのユーザガイダンスを容易にし、一義化/因果関係決定の問題に対処する。現在、例えば自動テキストマイニングツールを用いて、テキスト文書から生物学的エンティティ間の相互作用を識別することが可能であるが(例えば、エンティティに関連する相互作用を説明する際に使用される「名詞」及び「動詞」を識別することが可能である)、相互作用の因果関係又は方向性を明確に識別することは依然として不可能である。ユーザ誘導型の知識抽出の方法及びシステムは、本出願人による同時係属中の出願番号第10/154,524号に記載されている。この出願は、参照することでその内容を本明細書に取り入れることとする。自動テキストマイニング技術を使用して科学的テキストの文章から「名詞」(例えば、生物学的エンティティ)、「動詞」(例えば、関係)を抽出する方法及びシステムが記載されている。したがって、例えばテキストマイニングを介した、科学文献からの知識の抽出により、例えば、2つの遺伝子が関与する促進相互作用などの関係に関与する生物学的エンティティを識別することができる。この結果得られる解釈物は、上記の「ローカルフォーマット」と呼ばれる制限された文法で表すことができる。
本発明は、一義化によってプロセスの結果を明確化及び/又は訂正するプロセスにユーザが交流することを可能にする自動化ツールを増加させることによって、並びに生物学的図を自動構成し且つ図と相互作用し得るステンシルなどの、より高レベルのツールを使用することによって、ローカルフォーマットの機能性並びに汎用性を拡張することができる。本発明では、ステンシルは、代理人文書番号第10030986−1号(出願番号未割り当て)の出願において説明されているテキストビューア100のグラフィック枠150に、機能的に実装することができる(例えば、図4参照)。
図9は、科学文献から抽出され且つテキストビューアに取り込まれた相互作用の方向性を一義化する際に助けとなるアプリケーションツールの一例を示す。
図10は、記入された、即ちデータを取り込んだステンシルを構成する際に使用するための複数の既定のブランクステンシル160がパレット158内に提供されているところの、ツール200を示す。この例では、ユーザは、代理人整理番号第10030986−1号(出願番号未割り当て)の出願において説明する方法を用いて、テキスト資料をウィンドウ110の中に入力し、「テキスト解析」ボタン102を選択してウィンドウ120及び130に、テキスト内で発見されたエンティティ及び相互作用を記入する。既存の相互作用を選択しこれについて作業をする代わりに、ユーザは、抽出されたエンティティを使用し且つ既定のステンシル160のパレットからステンシルを選択することで、新しい相互作用を作成することができる。ユーザがあるジェスチャ(マウスの右クリックでメニューを選択するか又はボタンを押すこと)を行うと、パレット158が表示される。図10に示すように、パレット158には「空」のステンシルが入っている。
キャンバス152は最初はブランクであるが、図10では、ユーザが上から2番目のステンシル160を選択(ステンシル周囲のボックスが反転表示しているよう示す)したことで、キャンバス152に自動的にこのブランク、即ち空のステンシルが記入された経過状態を示す。あるいはまた、ユーザがステンシル160をパレット158からキャンバス152にドラッグアンドドロップすることによって、ステンシル160がキャンバス152に記入されるよう、本実施形態を構成することもできる。どちらの方法でも、これにより、キャンバス152に「空」の相互作用が記入され、ここに、「影響因子」、「被影響因子」及び方向性を割り当てることができる。さらに、又は代替的に、ユーザがフリーハンドによって図形を「スケッチ」することで、キャンバスに要素を追加することもできる。
この例では、「エンティティ」リスト120からエンティティをステンシル160の輪郭182、184、186(例えば、ラベンダー色の楕円)にドラッグアンドドロップして、影響因子(複数可)、被影響因子(複数可)をドラッグアンドドロップすることで、ユーザはステンシル160にデータを記入する。ユーザはまた、あるジェスチャ(マウスを右クリックしメニューを選択することの組み合わせ)によって、又は線185、187に沿ってマウスをストロークジェスチャでドラッグすることによって(例えば、それぞれ赤と青などでカラーコードすることができる)、相互作用に方向性を割り当てることもできる。ユーザはまた、テキストをテキストウィンドウ110からステンシル160の構成要素にドラッグアンドドロップすることによって、テキスト記述を相互作用と関連づけることもできる。これらの動作の結果を、図11に示す。この結果、文献に記載されている1つ又は複数の相互作用(本例では、2つの相互作用を記述)の明確なグラフィック表現が、メタデータ形態でグラフィック表現物内に注釈が記載された状態で、生じる。
ステンシルは、上記技術を使用してユーザが記入し、ユーザのコンテキストを定義し、情報を抽出するために使用することができる。これは、本出願人による同時係属中の代理人文書番号第10030986−1号(出願番号未割り当て)の出願において詳しく説明している。あるいはまた、ユーザは、1つ又は複数のブランクステンシル、又はブランクステンシルと記入済みステンシルの組み合わせを用いて、ユーザコンテキストを定義することもできる。
本出願人よる同時係属中の代理人文書番号第10030687−01号(出願番号未割り当て)の出願に記載の、グラフィックネットワークエディタと関連づけられたステンシルマネジャを用いて、ユーザは新しいステンシルを作成することができる。同出願は、参照することでその内容を本明細書に取り入れることとする。図中のノードとリンクのサブセットを、マウスで囲むか又はcntlキーを押しながらマウスをクリックする動作によって、選択することができる。選択されたサブセットは、新しいステンシルとして示すことができる。このシステムは、ステンシルの名称を入力するようにユーザにプロンプト表示し、選択されたノードとリンクから情報を引き出して新しいステンシルを構成する。図中の各ノードに関して、ステンシル内に対応するスロットがある。スロットには、対応する図のノード内のローカルフォーマットオブジェクトの種類に一致するところの、任意のエンティティを記入することができる。例えば、ローカルフォーマットオブジェクトがタンパク質である場合は、ステンシルの対応するスロットは任意のタンパク質を値として受け入れる。ユーザは、スロットの特異性レベルを決定することができる。例えば、ローカルフォーマットオブジェクトがMAP−キナーゼタンパク質である場合は、これは酵素でありタンパク質であるため、ユーザは、対応するスロットがMAP−キナーゼタンパク質だけを認めるか、又は全ての酵素を認めるか、又は全てのタンパク質を認めるかを選択することができる。ローカルフォーマット相互作用は、1対1ベースで新しいステンシル内の対応する相互作用にマッピングすることができる。例えば、ローカルフォーマットの「促進」相互作用は、ステンシルの対応するスロットの「促進」関係にマッピングされる。
同様に、ユーザは、ある相互作用に関するスロットの特異性レベルを決定することができる。例えば、上述のように、ローカルフォーマットオブジェクトが「促進」である場合は、「リン酸化による促進」又は「メチル化による促進」(どちらも促進相互作用である)を挿入することができる。ここで、ユーザは、対応するスロットが、例えば「リン酸化による促進」だけを認めるのか、それともそのスロットをより特異的な「促進」のサブセットに限定するのか、又は一般に任意の「促進」を認めるのかを選択することができる。
ステンシルマネジャはまた、ユーザが、ステンシルを修正、コピー、削除することも可能にする。これらの処理は、当業者には明らかな方法で、グラフィック編集方法を用いて行われる。ステンシルを修正又は削除する場合、ステンシルを使用して作成されたローカルフォーマットオブジェクトは修正又は削除されない。ステンシルをインスタンス化して新しいローカルフォーマットオブジェクトを形成すると、このインスタンス化物はこれを作成した際に使用したステンシルとは別にそれ自体別個に存在する。
新しいステンシルは、所定のパターンのノード及びリンクが、ランダムネットワークよりもかなり頻繁に現れる際に、グラフィック構造から推論することができる。本出願による同時係属中の代理人文書番号第10030687−1号(出願番号未割り当て)の出願に記載の方法によって、グラフィック構造をローカルフォーマットオブジェクトに変換することができる。次いで、ローカルフォーマットオブジェクトは、しばしば見られるパターン及び/又はノード及びリンクを有するサブグラフについて検索することができる。同様な方法が、Shen−Orr,S.らによる、Network Motifs in the Transcriptional Regulation Network of Escherichia coli,Nature Genetics,2002に記載されている。ローカルフォーマットオブジェクトのネットワークは、接続性マトリックスで表すことができる。各々3つ又は4つのノードからなるサブマトリックスの可能な組み合わせを、グラフィック構造に現れる頻度に関して、グラフィック構造のランダム化形態でこの組み合わせが現れる頻度と比較して検査する。グラフィック構造のランダム化は、Shen−Orr,S.らによる、Network Motifs in the Transcriptional Regulation Network of Escherichia coli,Nature Genetics,2002に記載の方法と同様な方法で行うことができる。頻繁に現れる組み合わせを識別すると、新しいステンシルとして示すことができる。当該システムは、図中の対応するノード及びリンク内の情報から引き出すことによって、ユーザがステンシルの名称を入力し、次いで新しいステンシルを構成することを促進する。図中の各ノードに関して、ステンシル内に対応するスロットがある。上述のように、スロットには、対応する図のノード内のローカルフォーマットオブジェクトの種類に一致するところの、任意のエンティティを記入することができる。上述のように、エンティティ及び相互作用に関する特異性の決定は、任意選択的にユーザが設定できる。
上述の原理、技術、システムを使用することで、例えばテキスト文書からのテキスト情報マイニングによる一義化を介して、及び/又は特定の知識に関するユーザのコンテキストをテキスト文書から抽出し、ステンシルに取り込むデータとして使用するよう設定することによって、構造化されないデータを変換するための確認及び/又は推論のための補助として、ステンシルを使用することができる。
上述のネットワーク構成技術(例えば、ステンシルを使用したグラフィック図の構成)を使用することで、知識の提示、文書化及び/又はメモ作成などのために、ユーザが定義する生物学的ネットワークを提供することができる。
本発明は、例えば、遺伝子やタンパク質などの構造化されていない「原子的」要素の集合体ではなく、より高レベルの抽象化物(即ち、ステンシル)を提供することによって、複雑性の管理を容易にする。さらに、ステンシルはエンティティ間の関係を構成し一義化し、より高レベルの表現体で表すだけでなく、これらをユーザにとってなじみやすい直感的な方法で行うことができる(即ち、グラフィックスを用いて)。
ステンシルはまた、リン酸化などの一般に使用される生物学的な構成概念を一貫して表示する。したがって、個別のエンティティと相互作用のレベルで作業することと比較すると、ステンシルを使用することで、生物学的エンティティを構成し文書化する際のエラーを低減することができる。これは、等価の情報がネットワーク全体において同等の方法で表現されるためである。
ステンシルに注釈を付し、他の構造化された形態のデータにリンクさせることができるため、ステンシルによって、多次元の相互作用を提供したり、ステンシルと異種データとを連結させたりすることができる。
図12は、本発明の一実施形態による典型的なコンピュータシステムを示す。コンピュータシステム800は、任意の数のプロセッサ802(中央演算処理装置、即ちCPUとも呼ばれる)を含む。プロセッサ802は、一次記憶装置806(典型的には、ランダムアクセスメモリ、即ちRAM)、一次記憶装置804(典型的には、リードオンリーメモリ、即ちROM)を含む記憶装置に接続される。当分野で周知のように、一次記憶装置804は、データ及び命令を一方向的にCPUに転送し、一次記憶装置806は典型的には、データ及び命令を双方向的に転送するために使用される。これらの一次記憶装置は両方とも、上述のような任意の適切なコンピュータ読み取り可能媒体を含むことができる。大容量記憶装置808も双方向的にCPU802に接続されており、さらなるデータ記憶容量をもたらす。これにも、上述の任意のコンピュータ読み取り可能媒体を含むことができる。大容量記憶装置808を使用してプログラム、データなどを記憶することができ、典型的には、一次記憶装置より遅いハードディスクなどの二次記憶媒体である。大容量記憶装置808に格納された情報は、適切な場合には、バーチャルメモリとして一次記憶装置806の一部に標準の方法で組み込み得ることを理解されたい。CD−ROM814などの特定の大容量記憶装置もまた、データを一方向的にCPUに渡すことができる。
CPU802は、インタフェース810と接続されており、当該インタフェース810には、ビデオモニタ、トラックボール、マウス、キーボード、マイクロフォン、タッチスクリーン、トランスデューサカードリーダ、磁気又は紙テープリーダ、タブレット、スタイラス、音声又は手書き文字認識装置、又は他のコンピュータなどの他の周知の入力装置のような、1つ又は複数の入力/出力装置が含まれる。最後に、CPU802は、任意に、概略的に812で示しているネットワーク接続を使用することで、コンピュータ又は電話通信網に接続することができる。このようなネットワーク接続では、CPUは上記の方法ステップを実行している間に、ネットワークから情報を受信し、また、ネットワークに情報を出力することを企図している。上記の装置及び材料は、コンピュータのハードウェア及びソフトウェアに関する当業者であればよく理解されよう。
上記のハードウェア要素は、本発明の処理を実行するための、多数のソフトウェアモジュールの命令を実装することができる。例えば、ステンシルに記入する命令を大容量記憶装置808又は814に記憶させ、一次メモリ806と共にCPU808上で実行することができる。
本発明の実施形態によれば、種々のコンピュータに実装される処理を実行するためのプログラム命令及び/又はデータ(データ構造を含む)を含む、コンピュータ読み取り可能媒体又はコンピュータプログラム製品も提供される。媒体及びプログラム命令は、本発明の目的のために特別に設計及び構成されたものであってもよいし、又は、コンピュータソフトウェア分野の当業者に周知の市販のものを用いてもよい。コンピュータ読み取り可能媒体の例には、限定はしないが、ハードディスク、フロッピーディスク、磁気テープなどの磁気媒体;CD−ROM、CDRW、DVD−ROM、DVD−RWディスクなどの光媒体;フロプティカルディスクなどの光磁気媒体:リードオンリーメモリ(ROM)及びランダムアクセスメモリ(RAM)などのプログラム命令を記憶し実行するように特に構成されたハードウェア装置などが含まれる。プログラム命令の例には、コンパイラが生成するもののようなマシンコード、並びにインタープリタを使用してコンピュータが実行できるより高レベルのコードを含むファイル、の両方が含まれる。
これまで特定の実施形態に関して本発明を説明してきたが、当業者であれば、本発明の真の趣旨及び範囲から逸脱することなく、種々の変更を行うことができ、また等価物と置換し得ることは理解されよう。さらに、多くの修正を行って、特定のモデル、ツール、プロセス、プロセスステップ(複数可)を、本発明の目的、趣旨及び範囲に適応させることができる。このような修正例もまた、本明細書に添付の特許請求の範囲に含まれるよう意図している。
テキスト資料(例えば科学文献)、実験データ、生物学的図などの異なるカテゴリからの情報の相互作用、比較、オーバーレイなどを促進するシステムの概略図 本発明によるブランクステンシルの概略図 ブランクステンシルのブランクスロットに値を埋めた後の、図2A記載のステンシルを示す図 ネットワーク図の作成に使用できる、既定のステンシルパレットを含む生物学的ネットワーク図作成ツールを示す図 推定された相互作用と実験データ群との不一致、並びにルール検証に基づく当該不一致の表示 階層状ブロックへと分解したシグナル伝達経路の一例 図5A記載のインターフェロンα媒介性シグナル伝達経路に関するステンシルのマッピング ブランクステンシル及び記入済バージョンステンシル ブランクステンシル及び記入済ステンシルの他の例 ブランクステンシル 図8A記載のステンシルの記入済バージョン。当該ステンシルは、シグナル伝達の副経路を表し、細胞膜の受容体上にリガンドが結合した状態と、これに続くいくつかのカスケード状活性化イベントを示している。 科学文献から抽出したプロセス/相互作用の方向性を一義化し、テキストビューアに組み込むことを容易にするためにステンシルを使用し得る、アプリケーションツールの一例のスクリーンショット ツールのキャンバス領域に記入済ブランクステンシルを有する図9記載のツールを示す図 図10記載のステンシルのデータ取り入れ(「記入」)の完了と、相互作用リストにおける役割の自動的な割り当てとを示した図 本発明を実装するために使用できる一般的なコンピュータシステムの一例の構成図
符号の説明
1000 システム
100 テキストビューア
102 テキスト解析ボタン
110 テキストウィンドウ
120、130 ウィンドウ
131、132、133、134、135 スロット
137、138、139、156、157、248、252、253 相互作用
145 パレット
152 キャンバス
158 パレット
160 ステンシル
165 リガンド−受容体複合体
166 リガンド
167 1型受容体
169、172 タンパク質複合体
170 活性タンパク質
171 経路タンパク質
175 核膜
182 輪郭
183 DNA結合共同因子
184 輪郭
185 タンパク質−共同因子複合体
186 輪郭
187 ターゲット遺伝子
200 図面ビューア
210 メインキャンバス
215 IFN受容体II
222 反応
224 触媒
226 基質
228 生成物
230 共同因子
242 受容体
246、249、266 STAT1
247、255、268 STAT2
250 IFNαリガンド
230 ネットワーク図
300 データビューア
400 インフラストラクチャ層
800 コンピュータシステム
802 プロセッサ
804、806 一次記憶装置
808 大容量記憶装置
810 インタフェース
812 ネットワーク接続
814 CD−ROM

Claims (50)

  1. 生物学的図のための視覚的な文法を開発するための、組み合わせ可能且つ拡張可能なステンシルのライブラリであって、前記ステンシル(160)の各々が、
    エンティティ(130、167、169、170)を表すグラフィック要素と、少なくとも1つの相互作用(137、138、139、156、157)を表すグラフィック要素であって、前記グラフィック要素の各々が、特定の種類の生物学的エンティティ(130、167、169、170)又は相互作用(137、138、139、156、157)を表す、生物学的意味を有するグラフィック要素と、
    特定のエンティティの名前と、相互作用(137、138、139、156、157)の方向性とを含んで成る特定の生物学的情報を提供するためのスロット(131、132、133、134、135)と、
    を含む、ステンシルのライブラリ。
  2. 前記視覚的な文法が、ローカルフォーマットで表されており、生物学的図、テキスト文書、実験データの間で、インタラクティブな機能の実行を可能にする、請求項1に記載のステンシルのライブラリ。
  3. 前記スロット(131、132、133、134、135)に前記特定の生物学的情報が入れられると、前記特定の生物学的情報が前記ローカルフォーマットに自動的に追加される、請求項2に記載のステンシルのライブラリ。
  4. 前記ステンシル(160)が、分子間の相互作用(137、138、139、156、157)から、より高レベルの生物学的な概念に及ぶ、多数の抽象レベルにて存在することができる、請求項1に記載のステンシルのライブラリ。
  5. 前記ステンシル(160)を階層状に構成することで、比較的簡単なステンシル(160)から比較的複雑なステンシル(160)までを構築することができる、請求項1に記載のステンシルのライブラリ。
  6. 前記ステンシル(160)が、多数のユーザ間で共同で使用可能である、請求項1に記載のステンシルのライブラリ。
  7. 前記ステンシル(160)の共同使用が、
    スタータテンプレートとしてブランクステンシル(160)群を設けること、
    記入されたステンシル(160)を共有すること、及び
    ステンシル(160)に共同して記入すること、
    から成る群の少なくとも1つによって達成される、請求項1〜6の何れか1項に記載のステンシルのライブラリ。
  8. 生物学的データを操作するシステムであって、
    生物学的な相互作用(137、138、139、156、157)を表すための再利用可能なステンシル(160)のライブラリと、
    特定の生物学的情報を記入すべきステンシル(160)を選択する手段と、
    特定の生物学的データを前記選択されたステンシル(160)に割り当てる手段と、
    前記割り当てられた、特定の生物学的データを有するステンシル(160)を表示する手段と、
    を含むシステム。
  9. 前記ステンシル(160)の共通要素を、割り当てられた特定の生物学的データと接続することで、前記ステンシル(160)を構成要素として有する生物学的図を表示する手段をさらに包含する、請求項8に記載のシステム。
  10. 前記ライブラリにあらかじめ含まれていなかった追加のステンシル(160)を設計し保存する手段をさらに含む、請求項8に記載のシステム。
  11. 前記ライブラリ内に含まれるステンシル(160)を、修正、コピー及び/又は削除する手段をさらに含む、請求項8に記載のシステム。
  12. ルールを設計し且つ前記ステンシル(160)と関連づける手段をさらに含む、請求項8に記載のシステム。
  13. 前記ルールをルール検証して、特定の生物学的データを含むステンシルが表す相互作用(137、138、139、156、157)を確認する手段をさらに含む、請求項12に記載のシステム。
  14. 前記ルールを、追加のデータに対してルール検証する手段をさらに含む、請求項13に記載のシステム。
  15. 前記追加のデータが、既存の生物学的図の中に含まれるデータを含む、請求項14に記載のシステム。
  16. 前記追加のデータが、実験データを含む、請求項14に記載のシステム。
  17. 前記ルール検証の結果をネットワーク図にオーバーレイするための手段をさらに含む、請求項14に記載のシステム。
  18. 前記特定の生物学的データから選択されており且つ前記ステンシル(160)のうち少なくとも1つの上に表示されているデータをナビゲートするための手段をさらに含む、請求項8〜17の何れか1項に記載のシステム。
  19. 前記2つ又はそれ以上の選択されたステンシル(160)の間で、そこに割り当てられた特定のデータを比較し、前記比較の結果を表示するための手段をさらに含む、請求項8〜17の何れか1項に記載のシステム。
  20. 前記表示された結果が、相違及び矛盾のうち少なくとも1つに関する、請求項19に記載のシステム。
  21. 前記特定の生物学的データを含む選択されたステンシル(160)と、既存の生物学的図の間でマッピングするための手段をさらに含む、請求項19又は20に記載のシステム。
  22. ユーザによるフリーハンドスケッチによって、キャンバス上のステンシルに要素を追加するか又はキャンバス上にステンシルを作成するための手段をさらに含む、請求項8〜20の何れか1項に記載のシステム。
  23. 前記ステンシル(160)を生物学的ネットワークにマージする手段と、前記生物学的ネットワークにマージされたステンシル(160)を表示する手段とをさらに含む、請求項8〜22の何れか1項に記載のシステム。
  24. グラフ理論法を用いて、複数の前記ステンシル(160)を比較するための手段をさらに含む、請求項8〜23の何れか1項に記載のシステム。
  25. 前記グラフ理論法が、ネットワーク内の最短経路、少なくとも1つのスパニングツリー、接続の程度、グラフの幅、冗長性、冗長経路、代替経路、グラフ横断、サブグラフの識別、グラフ内のモチーフ構造の識別から成る群から選択される少なくとも1つの特徴を決定する、特徴とする請求項24に記載のシステム。
  26. ローカルフォーマット言語を用いて、表示されたステンシル(160)を特定の生物学的データが抽出された元の他のデータ源とリンクさせる手段をさらに含む、請求項8〜25の何れか1項に記載のシステム。
  27. 前記ステンシル(160)の少なくとも1つの少なくとも一部を注釈する手段をさらに含む、請求項8から26の何れか1項に記載のシステム。
  28. 前記注釈する手段によって生成される注釈が、フリーハンド描画、テキスト、画像、データへのリンク、及びデータから成る群から選択される少なくとも1つの注釈を含む、請求項27に記載のシステム。
  29. 前記注釈する手段によって生成される注釈を、前記生物学的図の上にオーバーレイする手段をさらに含む、請求項27に記載のシステム。
  30. 生物学的情報を一義化し且つ生物学的図を作成することに関与するユーザにインタラクティブな機能を提供するツールであって、
    テキスト文書の少なくとも一部をインポートし表示し得るテキストビューア(100)と、
    前記テキストビューアにインポートされたテキスト文書の少なくとも一部をテキストマイニングする手段と、
    前記テキストマイニング手段で識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)をリストする、リストベースのテキストエディタと、
    生物学的図を作成するためのキャンバス領域(152)と、
    特定の種類の相互作用(137、138、139、156,157)を表すところの、少なくとも1つの予め設計されたブランクステンシル(160)と、
    前記キャンバス上のステンシル(160)に、前記テキストマイニング手段により識別された前記エンティティ(130、167、169、170)及び前記相互作用(137、138、139、156、157)のうち一方又は両方を記入する手段と、
    を含む、ツール。
  31. 生物学的相互作用(137、138、139、156、157)に関するネットワークを構成するツールであって、
    テキスト文書の少なくとも一部をインポートし表示し得るテキストビューア(100)と、
    前記テキストビューアにインポートされたテキスト文書の少なくとも一部をテキストマイニングする手段と、
    前記テキストマイニング手段により識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)をリストする、リストベースのテキストエディタと、
    前記リストされた相互作用(137、138、139、156、157)に方向性を割り当てる手段と、
    前記リストベースのエディタ内の相互作用(137、138、139、156、157)及びそれに関連するエンティティ(130、167、169、170)を選択して、共通のエンティティ(130、167、169、170)をマージし、この結果得られる相互作用(137、138、139、156、157)に関するネットワークを前記ネットワークビューアに表示する手段と、
    を含み、
    前記エンティティ(130、167、169、170)及び前記関連付けられたエンティティ(130、167、169、170)が、方向性の表示を含むステンシル(160)を用いて視覚的に表示され、且つ前記結果として得られたネットワークが、複数のマージされたステンシル(160)を含む、ツール。
  32. 抽出された生物学的知識を既存の静的又は動的な生物学的図と比較するツールであって、
    テキスト文書の少なくとも一部をインポートし表示し得るテキストビューアと、
    前記テキストビューアにインポートされたテキスト文書の少なくとも一部をテキストマイニングすることで、少なくとも1つの予め定義されたステンシルによって表示され得る、生物学的な概念、エンティティ(130、167、169、170)、相互作用(137、138、139、156、157)、及び/又は関係を識別する手段と、
    図面ビューアと、
    既存の静的又は動的な生物学的図の少なくとも一部を前記図面ビューアにインポートする手段と、
    前記生物学的な概念、エンティティ(130、167、169、170)、相互作用(137、138、139、156、157)、及び/又は関係のうち少なくとも1つが記入されている、前記予め定義されたステンシル(160)のうち少なくとも1つを、前記図面ビューア内に表示された既存の生物学的図の少なくとも一部にオーバーレイする手段と、
    前記オーバーレイされたステンシル(160)を、前記表示された他の生物学的図とは視覚的に区別する手段と、
    を含む、ツール。
  33. 生物学的図をグラフィックとして作成する方法であって、
    エンティティ(130、167、169、170)を表すグラフィック要素と、少なくとも1つの相互作用(137、138、139、156、157)を表すグラフィック要素とを含んで成るステンシルと、特定のエンティティ(130、167、169、170)の名前と、相互作用(137、138、139、156、157)の方向性とを含んで成る特定の生物学的情報を提供するためのスロット(131、132、133、134、135)とを設けるステップと、
    生物学的図を作成し表示するためのキャンバス領域を設けるステップと、
    特定の生物学的情報を前記ステンシルに割り当て、相互作用(137、138、139、156、157)に関与するエンティティ(130、167、169、170)を識別するステップと、
    前記割り当てられた生物学的情報を含むステンシルを、前記キャンバス領域に表示するステップと、
    を包含する、方法。
  34. 生物学的図をグラフィックとして作成する方法であって、
    エンティティ(130、167、169、170)を表すグラフィック要素と、少なくとも1つの相互作用(137、138、139、156、157)を表すグラフィック要素とを含んで成るステンシルと、特定のエンティティ(130、167、169、170)の名前と、相互作用(137、138、139、156、157)の方向性とを含んで成る特定の生物学的情報を提供するためのスロット(131、132、133、134、135)とを設けるステップと、
    生物学的図を作成し表示するキャンバス領域を設けるステップと、
    特定の生物学的情報を前記ステンシルに割り当て、前記相互作用(137、138、139,156、157)に関与するエンティティ(130、167、169、170)を識別するステップと、
    前記少なくとも1つの相互作用(137、138、139、156、157)の方向性をインタラクティブに割り当て、これによって、前記相互作用(137、138、139、156、157)のグラフィック表示を一義化するステップと、
    を包含する、方法。
  35. 生物学的図を作成する際に用いられる生物学的情報を一義化することに関与するユーザにインタラクティブな機能を提供する方法であって、
    テキスト文書のうち少なくとも一部をテキストビューアにインポートするステップと、
    前記テキスト文書のうち少なくとも一部をテキストマイニングして、生物学的なエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)を識別するステップと、
    生物学的図を作成するキャンバス領域を設けるステップと、
    特定の種類の相互作用(137、138、139、156、157)を表すところの、少なくとも1つの予め設計されたブランクステンシルを設けるステップと、
    前記キャンバス上のステンシルに、前記テキストマイニング手段により識別された前記エンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)のうち1つ又は複数を記入し、これによって、前記エンティティ(130,167、169、170)を関連づける1つ又は複数の相互作用(137、138、139、156、157)に方向性を割り当てるステップと、
    を包含する、方法。
  36. 生物学的図を作成する際に用いられる生物学的情報を一義化することに関与するユーザにインタラクティブな機能を提供する方法であって、
    テキスト文書のうち少なくとも一部をテキストビューアにインポートするステップと、
    前記テキスト文書のうち少なくとも一部をテキストマイニングして、生物学的なエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)を識別するステップと、
    前記識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)を、リストベースのテキストエディタにリストするステップと、
    生物学的図を作成するためのキャンバス領域を設けるステップと、
    特定の種類の相互作用(137、138、139、156、157)を表すところの、少なくとも1つの予め設計されたブランクステンシルを設けるステップと、
    前記キャンバス上のステンシルに、前記テキストマイニング手段により識別された前記エンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)のうち1つ又は複数を記入して、前記ステンシルが表す少なくとも1つの相互作用(137、138、139、156、157)の方向性を表すことを包含するステップと、
    を含み、
    前記ステンシルに記入する際、前記ステンシルに記入されたエンティティ(130、167、169、170)が果たす役割の割り当てが、前記リストベースのテキストエディタが表示するリスト内に自動的に割り当てられる、方法。
  37. 生物学的相互作用(137、138、139、156、157)に関するネットワークを構成する方法であって、
    テキスト文書のうち少なくとも一部をテキストビューアにインポートするステップと、
    前記テキストビューアにインポートされたテキスト文書のうち少なくとも一部をテキストマイニングするステップと、
    前記テキストマイニングにより識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)をステンシル(160)に記入し、これによって、前記エンティティ(130、167、169、170)を関連づける前記相互作用(137、138、139、156、157)に方向性を割り当てるステップと、
    前記相互作用(137、138、139、156、157)及び関連づけられたエンティティ(130、167、169、170)を含むステンシル(160)を選択し、前記選択されたステンシル(160)間で共通するエンティティ(130、167、169、170)をマージし、前記マージによって得られる相互作用(137、138、139、156、157)に関するネットワークを表示するステップと、
    を包含する、方法。
  38. テキストの知識と生物学的ネットワークとをグラフィックとしてインタフェースさせる方法であって、
    テキスト文書のうち少なくとも一部をテキストビューアにインポートするステップと、
    前記テキストビューアにインポートされたテキスト文書のうち少なくとも一部をテキストマイニングするステップと、
    前記テキストマイニングにより識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)をステンシル(160)に記入し、これによって、前記エンティティ(130、167、169、170)を関連づける前記相互作用(137、138、139、156、157)に方向性を割り当てるステップと、
    前記相互作用(137、138、139、156、157)及び関連づけられたエンティティ(130、167、169、170)を含むステンシル(160)を選択するステップと、
    前記選択されたステンシル(160)を、少なくとも1つの既存の生物学的図のうち少なくとも一部にオーバーレイするステップと、
    を包含する、方法。
  39. 既存の生物学的図を、当該図のサブセットに一致するステンシル(160)へと分解する方法であって、
    前記既存の生物学的図の中のエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)を識別するステップと、
    前記既存の生物学的図の中で、ランダムな発生率より著しく高い頻度を有する前記識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)の発生パターンを識別するステップと、
    前記頻度の高い発生パターンと既存のステンシル(160)の要素とを一致させるステップと、
    を包含する、方法。
  40. 部分的に記入されたステンシル(160)を用いて、生物学的知識源又はデータベースからなるコーパスをナビゲートする方法であって、
    少なくとも1つの部分的に記入されたステンシルを選択するステップと、
    前記生物学的知識源又はデータベースからなるコーパスを自動的に検索し、前記選択された記入されたステンシルの一部に一致する少なくとも1つのエンティティ(130、167、169、170)又は相互作用(137、138、139、156、157)を含むコーパス構成要素を探し出すステップと、
    を包含する、方法。
  41. 質量スペクトル、科学的なテキスト文書、又は他のデータなどの他のデータ源を注釈する方法であって、
    エンティティ(130、167、169、170)を表すグラフィック要素と、少なくとも1つの相互作用(137、138、139、156、157)を表すグラフィック要素とを含んで成るステンシルを設けるステップと、
    ローカルフォーマット化言語を用いて、他のデータ源のうち少なくとも1つと前記ステンシルとをリンクさせるステップと、
    を包含する、方法。
  42. 実験データの解析を介して既存のステンシル(160)を確認する方法であって、前記実験データが、少なくとも1つの基準サンプルに対する生物学的エンティティ(130、167、169、170)量の差の測定値を含む、方法であって、
    前記実験データに含まれている、種々の条件に渡る多数の発現値から各生物学的エンティティ(130、167、169、170)の発現パターンを導出するステップと、
    類似性に関して前記発現パターンを比較するステップと、
    類似性測定値を得るための距離関数に基づいて任意の2つの発現パターンが類似しているか否かを決定するステップであって、前記類似の発現パターンが、前記類似の発現パターンという特徴を有するエンティティ(130、167、169、170)が、共同して調節されており且つ生物学的な相互作用(137、138、139、156、157)において関連することを暗示する、ステップと、
    を包含する、方法。
  43. 請求項33〜42の何れか1項の方法から得られる結果を、リモートの場所に転送することを含む方法。
  44. 前記請求項33〜42の何れか1項の方法から得られる結果を表すデータを、リモートの場所に送信することを含む方法。
  45. 前記請求項33〜42の何れか1項の方法から得られる結果を、リモートの場所から受信することを含む方法。
  46. 生物学的図を作成するための1つ又は複数の命令シーケンスを担持するコンピュータ読み取り可能媒体であって、1つ又は複数のプロセッサが前記1つ又は複数の命令シーケンスを実行すると、前記1つ又は複数のプロセッサが以下のステップ:
    エンティティ(130、167、169、170)を表すグラフィック要素と、少なくとも1つの相互作用(137、138、139、156、157)を表すグラフィック要素とを含んで成るステンシルと、特定のエンティティ(130、167、169、170)の名前と、相互作用(137、138、139、156、157)の方向性とを含んでいる特定の生物学的情報を提供するためのスロット(131、132、133、134、135)とを設けるステップ、
    特定の生物学的情報を前記ステンシルに割り当て、前記相互作用(137、138、139、156、157)に関与するエンティティ(130、167、169、170)を識別するステップ、及び
    少なくとも1つの相互作用(137、138、139、156、157)の方向性をインタラクティブに割り当て、前記相互作用(137、138、139、156、157)のグラフィック表現を一義化するステップ、
    を実行する、コンピュータ読み取り可能媒体。
  47. 生物学的な相互作用(137、138、139、156、157)を表す再利用可能なステンシル(160)のライブラリを含んで成る生物学的データを操作する1つ又は複数の命令シーケンスを担持するコンピュータ読み取り可能媒体であって、1つ又は複数のプロセッサが前記1つ又は複数の命令のシーケンスを実行すると、前記1つ又は複数のプロセッサが以下のステップ:
    特定の生物学的情報を記入すべきステンシル(160)を選択するステップ、
    特定の生物学的データを前記選択されたステンシル(160)に割り当てるステップ、及び
    前記割り当てられた特定の生物学的データを有するステンシル(160)を表示するステップ、
    を実行する、コンピュータ読み取り可能媒体。
  48. 生物学的図をグラフィックとして作成する1つ又は複数の命令シーケンスを担持するコンピュータ読み取り可能媒体であって、1つ又は複数のプロセッサが前記1つ又は複数の命令シーケンスを実行すると、前記1つ又は複数のプロセッサが以下のステップ:
    エンティティ(130、167、169、170)を表すグラフィック要素と、少なくとも1つの相互作用(137、138、139、156、157)を表すグラフィック要素とを含んで成るステンシルと、特定のエンティティ(130、167、169、170)の名前と、相互作用(137、138、139、156、157)の方向性とを含んでいる特定の生物学的情報を提供するためのスロット(131、132、133、134、135)とを設けるステップ、
    生物学的図を作成し表示するためのキャンバス領域を設けるステップ、
    注釈又はデータビューアからのドラッグアンドドロップを介して、特定の生物学的情報を前記ステンシルに割り当て、前記相互作用(137、138、139、156、157)に関与するエンティティ(130、167、169、170)を識別するステップ、及び
    前記割り当てられたステンシルを前記キャンバス上に表示するステップ、
    を実行する、コンピュータ読み取り可能媒体。
  49. 生物学的図を作成する際に用いられる生物学的情報を一義化するための1つ又は複数の命令シーケンスを担持するコンピュータ読み取り可能媒体であって、1つ又は複数のプロセッサが前記1つ又は複数の命令のシーケンスを実行すると、前記1つ又は複数のプロセッサが以下のステップ:
    テキスト文書の少なくとも一部をテキストビューアにインポートするステップ、
    前記テキスト文書の少なくとも一部をテキストマイニングして、生物学的なエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)を識別するステップ、
    生物学的図を作成するためのキャンバス領域を設けるステップ、
    特定の種類の相互作用(137、138、139、156、157)を表すところの、少なくとも1つの予め設計されたブランクステンシルを設けるステップ、
    前記テキストマイニング手段によって識別された前記エンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)のうち1つ又は複数を前記キャンバス上の前記ブランクステンシル(160)のうち少なくとも1つに記入し、これによって、前記エンティティ(130、167、169、170)を関連づける1つ又は複数の相互作用(137、138、139、156、157)に方向性を割り当てるステップ、
    を実行する、コンピュータ読み取り可能媒体。
  50. 生物学的相互作用(137、138、139、156、157)に関するネットワークを構築するための1つ又は複数の命令シーケンスを担持するコンピュータ読み取り可能媒体であって、1つ又は複数のプロセッサが前記1つ又は複数の命令のシーケンスを実行すると、前記1つ又は複数のプロセッサが以下のステップ:
    テキスト文書の少なくとも一部をテキストビューアにインポートするステップ、
    前記テキストビューアにインポートされたテキスト文書のうち少なくとも一部をテキストマイニングするステップ、
    前記テキストマイニングにより識別されたエンティティ(130、167、169、170)及び相互作用(137、138、139、156、157)を前記ステンシルに記入し、これによって、前記エンティティ(130、167、169、170)を関連づける相互作用(137、138、139、156、157)に方向性を割り当てるステップ、及び
    相互作用(137、138、139、156、157)及び関連づけられたエンティティ(130、167、169、170)を含むステンシル(160)を選択し、前記選択されたステンシル(160)間で共通するエンティティ(130、167、169、170)をマージし、前記マージの結果得られる相互作用(137、138、139、156、157)に関するネットワークを表示するステップ、
    を実行する、コンピュータ読み取り可能媒体。
JP2005046947A 2004-02-23 2005-02-23 インタラクティブな生物学的図表を構築するためのシステム、ツール及び方法 Pending JP2005243024A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/784,523 US20050188294A1 (en) 2004-02-23 2004-02-23 Systems, tools and methods for constructing interactive biological diagrams

Publications (1)

Publication Number Publication Date
JP2005243024A true JP2005243024A (ja) 2005-09-08

Family

ID=34711896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005046947A Pending JP2005243024A (ja) 2004-02-23 2005-02-23 インタラクティブな生物学的図表を構築するためのシステム、ツール及び方法

Country Status (3)

Country Link
US (1) US20050188294A1 (ja)
EP (1) EP1566761A3 (ja)
JP (1) JP2005243024A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016508269A (ja) * 2012-12-28 2016-03-17 セルベンタ インコーポレイテッド 機構的ネットワークモデルを使用した生物学的影響の定量評価
JP2021536645A (ja) * 2018-08-23 2021-12-27 ベネボレントエーアイ テクノロジー リミテッド 知識発見のための自動クエリ構築

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004233828B2 (en) * 2003-04-24 2009-05-28 Merck Sharp & Dohme Corp. Inhibitors of Akt activity
WO2007023010A2 (en) * 2005-08-25 2007-03-01 International Business Machines Corporation Method and system for displaying performance constraints in a flow design tool
CN101427216A (zh) * 2006-04-17 2009-05-06 智能技术Ulc公司 增强软件应用特征的方法和内容对象
US8543337B2 (en) * 2006-04-21 2013-09-24 The Mathworks, Inc. Block diagram explorer in a method and apparatus for integrated modeling, simulation and analysis of chemical and biological systems
US8775475B2 (en) * 2007-11-09 2014-07-08 Ebay Inc. Transaction data representations using an adjacency matrix
US8046324B2 (en) 2007-11-30 2011-10-25 Ebay Inc. Graph pattern recognition interface
US20100313106A1 (en) * 2009-06-04 2010-12-09 Microsoft Corporation Converting diagrams between formats
JP5336453B2 (ja) * 2010-10-01 2013-11-06 学校法人沖縄科学技術大学院大学学園 ネットワークモデル統合装置、ネットワークモデル統合システム、ネットワークモデル統合方法、および、プログラム
US8861890B2 (en) 2010-11-24 2014-10-14 Douglas Alan Lefler System and method for assembling and displaying individual images as a continuous image
US9311899B2 (en) 2012-10-12 2016-04-12 International Business Machines Corporation Detecting and describing visible features on a visualization
US9959642B2 (en) 2013-12-19 2018-05-01 Mitsubishi Electric Corporation Graph generation apparatus, graph display apparatus, graph generation program, and graph display program
US20150309965A1 (en) * 2014-04-28 2015-10-29 Elwha Llc Methods, systems, and devices for outcome prediction of text submission to network based on corpora analysis
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
WO2016100049A1 (en) 2014-12-18 2016-06-23 Edico Genome Corporation Chemically-sensitive field effect transistor
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10811539B2 (en) 2016-05-16 2020-10-20 Nanomedical Diagnostics, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
CN111723215B (zh) * 2020-06-19 2022-10-04 国家计算机网络与信息安全管理中心 基于文本挖掘的生物技术信息知识图谱构建装置与方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930154A (en) * 1995-01-17 1999-07-27 Intertech Ventures, Ltd. Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space
JP2002091991A (ja) * 2000-09-20 2002-03-29 Intec Web & Genome Informatics Corp 遺伝子ネットワーク研究支援システム及び方法
US20030009099A1 (en) * 2001-07-09 2003-01-09 Lett Gregory Scott System and method for modeling biological systems
JP2003109019A (ja) * 2001-09-28 2003-04-11 Hitachi Software Eng Co Ltd 生体高分子間の相互関係表示方法、生体高分子間相互関係データベース及び生体高分子間相互関係データベースの構築方法
JP2003186894A (ja) * 2001-12-21 2003-07-04 Hitachi Ltd サブスタンス辞書の作成方法、サブスタンス間の二項関係抽出方法、予測方法、及び表示方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657255C1 (en) * 1995-04-14 2002-06-11 Interleukin Genetics Inc Hierarchic biological modelling system and method
US5826237A (en) * 1995-10-20 1998-10-20 Araxsys, Inc. Apparatus and method for merging medical protocols
US7058643B2 (en) * 2002-05-22 2006-06-06 Agilent Technologies, Inc. System, tools and methods to facilitate identification and organization of new information based on context of user's existing information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930154A (en) * 1995-01-17 1999-07-27 Intertech Ventures, Ltd. Computer-based system and methods for information storage, modeling and simulation of complex systems organized in discrete compartments in time and space
JP2002091991A (ja) * 2000-09-20 2002-03-29 Intec Web & Genome Informatics Corp 遺伝子ネットワーク研究支援システム及び方法
US20030009099A1 (en) * 2001-07-09 2003-01-09 Lett Gregory Scott System and method for modeling biological systems
JP2003109019A (ja) * 2001-09-28 2003-04-11 Hitachi Software Eng Co Ltd 生体高分子間の相互関係表示方法、生体高分子間相互関係データベース及び生体高分子間相互関係データベースの構築方法
JP2003186894A (ja) * 2001-12-21 2003-07-04 Hitachi Ltd サブスタンス辞書の作成方法、サブスタンス間の二項関係抽出方法、予測方法、及び表示方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016508269A (ja) * 2012-12-28 2016-03-17 セルベンタ インコーポレイテッド 機構的ネットワークモデルを使用した生物学的影響の定量評価
US10878312B2 (en) 2012-12-28 2020-12-29 Selventa, Inc. Quantitative assessment of biological impact by scoring directed tree graphs of causally inconsistent biological networks
JP2021536645A (ja) * 2018-08-23 2021-12-27 ベネボレントエーアイ テクノロジー リミテッド 知識発見のための自動クエリ構築

Also Published As

Publication number Publication date
EP1566761A2 (en) 2005-08-24
EP1566761A3 (en) 2007-07-11
US20050188294A1 (en) 2005-08-25

Similar Documents

Publication Publication Date Title
JP2005243024A (ja) インタラクティブな生物学的図表を構築するためのシステム、ツール及び方法
JP6858983B2 (ja) プロジェクト階層のオーグメンテーション、探査およびメンテナンスのための方法
Cline et al. Integration of biological networks and gene expression data using Cytoscape
Lacroix et al. Bioinformatics: managing scientific data
Su et al. Biological network exploration with Cytoscape 3
Bonchev et al. Complexity in chemistry, biology, and ecology
Huber et al. Graphs in molecular biology
Theocharidis et al. Network visualization and analysis of gene expression data using BioLayout Express 3D
EP1507237A2 (en) Manipulating biological data
US20020178184A1 (en) Software system for biological storytelling
US7228302B2 (en) System, tools and methods for viewing textual documents, extracting knowledge therefrom and converting the knowledge into other forms of representation of the knowledge
US8296070B2 (en) Method and apparatus for improved simulation of chemical and biochemical reactions
Singhal et al. Multiscale community detection in Cytoscape
US20050197783A1 (en) Methods and systems for extension, exploration, refinement, and analysis of biological networks
Vehlow et al. Visual analysis of biological data-knowledge networks
US20070174019A1 (en) Network-based approaches to identifying significant molecules based on high-throughput data analysis
Lü et al. Modeling and analysis of bio-molecular networks
Srivas et al. Assembling global maps of cellular function through integrative analysis of physical and genetic networks
EP1810202A1 (en) Method of displaying molecule function network
Jia et al. MetNetGE: interactive views of biological networks and ontologies
Aalam et al. Comparative study of data mining tools used for clustering
Gubała et al. Semantic integration for model-based life science applications
Janowski VANESA-A bioinformatics software application for the modeling, visualization, analysis, and simulation of biological networks in systems biology applications
GB2412768A (en) Methods and systems for extension, exploration, refinement, and analysis of biological networks
Ganglberger et al. Iterative Exploration of Big Brain Network Data.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101116