JPH11501741A - 微生物学的データを保存し解析するコンピュータシステム - Google Patents

微生物学的データを保存し解析するコンピュータシステム

Info

Publication number
JPH11501741A
JPH11501741A JP8522835A JP52283596A JPH11501741A JP H11501741 A JPH11501741 A JP H11501741A JP 8522835 A JP8522835 A JP 8522835A JP 52283596 A JP52283596 A JP 52283596A JP H11501741 A JPH11501741 A JP H11501741A
Authority
JP
Japan
Prior art keywords
data
database
storing
tables
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP8522835A
Other languages
English (en)
Inventor
ジェフリー ジェイ. セイルハマー
アンジェロ デリジーン
ランダル ダブリュー. スコット
Original Assignee
インサイト ファーマシューティカルズ インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US1995/001160 external-priority patent/WO1995020681A1/en
Application filed by インサイト ファーマシューティカルズ インク. filed Critical インサイト ファーマシューティカルズ インク.
Publication of JPH11501741A publication Critical patent/JPH11501741A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

(57)【要約】 微生物情報を保存するためのリレーショナルデータベース(1)について開示する。このデータベースには、cDNA配列データ(290、300)、および今回同定されたcDNA配列と以前から既知の配列との間の相関関係を示す対応適合ログ(510、515)が含まれる。さらに、データベースを構成するさまざまな表が、特定のcDNA配列の同定に関連する経時的なデータを保存するために用いられる。このような表には、生物源データ(130)、細胞培養および処理のデータ(140)、mRNA調製データ(150)、cDNA構築データ(170)、ならびにクローン調製データが含まれる。クローン調製データには、さらに、接種(200)、調製(210)、切り出し(190)、および、蛍光定量(220、230、240)に関連したデータを含む表が含まれる。データベースの中で相互に関連する情報によって、科学的な解析および他の適用のためのデータを抽出するのに用いるためのさまざまな検索が行えるようになる。例えば、ある生物組織に現れる特定のRNA転写産物の頻度を判定するために、好ましい態様のデータベースを用いて含有量解析を行なうことができる。

Description

【発明の詳細な説明】 微生物学的データを保存し解析するコンピュータシステム 発明の分野 本発明は、遺伝学的データ、およびそれに対応する細胞の情報に適用されるコ ンピュータデータベース技術に関する。より特異的には、DNA配列、それに関連 する生物源データ、およびその他関連する科学的データを保管するリレーショナ ルデータベースシステムを開示する。 発明の背景 リレーショナルデータベースは、当業において周知である。例えば、C.J.デ イト(Date)「データベースシステムへの手引き(An Introduction To Databas e Systems)」,アディソン−ウェズリー出版社、1982(特に第2部)を参照のこ と。 一般的に、リレーショナルデータベースは、複数の表で表されたデータを保存 するためのシステムと特徴づけることができる。各表の行は、タプルとも呼ばれ 、一つの情報レコードを表す。カラムは、本質的に、保存されるレコードの、同 一のフィールドに対する値の集合である。また、各カラムは保存するレコードの 属性ともいわれる。言い換えれば、リレーショナルデータベースの、ある表の中 の各レコードには、その表の属性に対応するフィールドが一組ずつ含まれている ことになる。ある属性の実際の値を取り出すことができるすべての値の組をドメ インという。上記参照文献の65頁でも検討されているように、「リレーショナ ルデータ構造の重要な特質は、タプル(行)間の関係が、共通ドメインから取り 出されるカラムのデータ値によって完全に表されていることである」。 以前は、遺伝学的情報は殆ど、実験室における化学的な手法によって解析され ていた。コンピュータ化された研究用ツールは、本質的に、以前に同定された特 定の遺伝子配列と同じであるか否かを判定するために配列情報の比較を行う場合 に限定されていた。このようなツールは、遺伝子配列を効果的に検索する技術を 提供するであろうが、cDNA配列と、それが由来した細胞型との関連などという、 さまざまな科学的情報を保存したり、操作したりすることはできない。従って、 既存のコンピュータ化されたツールは、診断法および薬剤開発研究の分野におい て非常に限られた利用しかできない。現在、遺伝学的データと、それに関連する 細胞情報などのデータを科学者が有効に解析できるようにするために、これらの データをうまく体系化した形で保存するコンピュータシステムの開発に対して差 し迫った必要性がある。 発明の概要 本発明によって、生物学的情報を保存するためのリレーショナルデータベース が提供される。リレーショナルデータベースは、各々が生物学的情報の特定のレ コードを保存する表の集合体として構成される。各表が少なくとも一つの他の表 と共通なカラムを含むように、各レコードは互いに関連している。これによって 、本質的には、どの表のどの属性についてもデータベースを検索できるというデ ータベース検索が可能になる。 本発明の好ましい態様において、データベースには、cDNA配列データ、および 今回同定されたcDNA配列と以前から既知の配列との相関関係を示す相同対照記録 が含まれる。さらに、データベースのさまざまな表には、特定のcDNA配列の同定 に関連する経時的なデータが保存される。このような表には、生物学的起源の同 定;細胞培養および処理データ;mRNA調製データ;cDNA構築データ;接種、調製 、定量データ;および、切り出しに関する表を含むクローン調製データが含まれ る。 データベース内の相関する情報によって、科学解析、およびその他の応用に有 用なさまざまな検索事項を設計することができる。例えば、好ましい態様のデー タベースを用いて、ある生物組織の中に現れるRNA転写産物の頻度の判定を可能 にする含量解析などの機能を実施することができる。データベース検索を用いて 、実験的な化学技術により以前に得られた別の解析結果を判定することが出来る 。このような応用例の一つに、サブトラクション解析がある。 図面の簡単な説明 先に述べた本発明の特徴は、添付の図面とともに、以下の特定の好ましい態様 の詳細な開示から完全に理解されると思われる。 図1は、本発明の好ましい態様のシステムの全体的構造を抽象的に描いた図で ある。 図2は、cDNAのクローニングおよびシークエンシングの手順を大まかに表した 流れ図である。 図3A、3Bおよび図4〜10は、本発明の好ましい態様の生物学的リレーシ ョナルデータベースの部分を例示したものである。 図11は、好ましい態様のリレーショナルデータベースの含量解析検索の出力例 を示している。 図12は、好ましい態様のデータベースを用いたサブトラクション解析検索の出 力例を示している。 好ましい態様の詳細な説明 本発明の好ましい態様によって、遺伝学的データを保存、検索および操作する システムが、リレーショナルデータベースとして構築される。図1に示したよう に、このシステムのユーザーは、ワークステーション(6と7)から、集中イー サーネットワーク5を経由して、一つ以上のリレーショナルデータベースにアク セスすることができる。ワークステーション(6、7)は、典型的には、通常、 データ入力装置、出力装置、ディスプレイ、CPU、記憶装置(RAMおよびROM)、 ならびにネットワーク5とのインターフェイスを含む、当業において既知のパー ソナルコンピュータである。ネットワーク5へ接続されたファイルサーバーに保 存される、データベース保存装置1は、本発明の好ましい態様のデーターベース を示す。図示されているように、このシステムは、当業において知られている、 通常、CPU4、データ保存装置8、ネットワーク9とのインターフェイス、およ び、入出力装置(図示されていない)を有するコンピュータ2によってサポート される。参照データベース3は、例えば、データベース1の用法の一部として検 索され得るデータソースを示している。このようなデータベースには、例えば、 他の配列、核酸、蛋白質、モチーフのデータベースが含まれうる。 人体など、生物の中の各細胞に、遺伝子または遺伝的情報の完全な一組が含ま れていることはよく知られている。これらの遺伝子は、細胞の生命周期の異なっ た時点で活性化したり、不活性化したりする。全ての細胞で活性化している遺伝 子もあるが、これらは正常で普遍的な機能、またはハウスキーピング的な任務を 行う上で必要とされる。特定の細胞型でのみ活性化される遺伝子もあるが、これ らは、正常な状態で、組織または器官に特有な機能のため特異化したり、調節す るからである。最後に、ストレスまたは病気に反応するときにだけ活性化される 遺伝子もある。一般的な警報に応答して、いくつかの細胞型で活性化する遺伝子 もあれば、非常に特異的で、特定の細胞型においてのみ活性化するストレス遺伝 子もある。このように、遺伝子を、特異的で非常に小さな分集団にまとめたり、 多様で大きな分集団にまとめたりすることができる。これらのまとまった遺伝子 グループを分類したり理解することは、病気の診断および治療において重要であ る。 遺伝子または二本鎖デオキシリボ核酸(DNA)は、転写またはDNA分子のセンス 鎖を一本鎖メッセンジャーリボ核酸(mRNA)へコピーされることによって活性化 される。mRNA配列に引き継がれたメッセージは、さらに、細胞の中で構造的に、 または酵素的に機能するポリペプチドまたは蛋白質の分子的な構成単位であるア ミノ酸に翻訳される。 ある時点で起きる活性、およびそれらの活性の相対的重要度は、細胞中に見ら れるmRNA分子の数量に反映される。あるmRNA(ハウスキーピング)は、常に存在 し、いずれの組織の正常な細胞においても、それらの数量は高度に安定したまま である。これらのmRNA(例えば、アクチン)は、ほとんどの細胞型に必須の定常 的なバックグラウンド活性を表し、発現している(この場合の例外は、成熟し、 分化した赤血球細胞であり、それらは、DNAを持たず、生存する間機能するmRNA または酵素の1セットを有するのみである)。これに対して、特定の細胞型の役 割を行うRNA(日常的)は、その細胞型においてのみ活性化されるが、正常な状 態の下では、日常的なmRNAの数は安定していると思われる。この特定の細胞型が ストレスを受けるか、病気にさらされると、ストレス/病気に応答して活性化さ れる遺伝子と同じように、日常的mRNAの数が変動する。これらのストレス/病気 mRNAは、他の日常的mRNAまたはハウスキーピングmRNAよりも優先され、急速に数 が増える。 例えば、脳細胞および肝細胞のハウスキーピング遺伝子は共通で、どちらの器 官の細胞においても、取り込んだグルコース分子を処理するのに必要な酵素を産 生するmRNAが転写される。しかし、下垂体細胞も肝細胞も正常に機能していても 、下垂体細胞が正常に機能するのに必要な蛋白質を作るmRNAは、肝臓のクッパー (Kupffer)細胞のmRNAとは異なっている。同様に、病気の肝細胞のmRNA群は、 正常な肝細胞のmRNA群とは異なっている。どちらの場合にも、異なった、多様な mRNAの分集団が、特定の時期の特定の状態において細胞を特徴づける。 好ましい態様のデータベースは、mRNAの固有集団の分類および特徴付に関する 情報の保存、操作および捕捉を提供する。この情報をもとに、科学者は、病気を 診断し、特異的な治療法を設計することができる。詳細な情報が豊富にあれば、 迅速な治癒に寄与し、永続的な傷害または死を避けるのに役立つ早期診断および 治療への手がかりが提供される。 本発明のデータベースシステムは、遺伝的情報を、大量の関連情報とともに保 存することによって、現代のコンピュータの強大な能力を利用している。さらに 特定すれば、好ましい態様において、組織の採取、転写物の抽出、クローニング 、およびcDNA配列の同定の、本質的に全ての段階に関する情報を、さまざまな関 連表に保存する。このように、本発明に係るデータベースにおいては、cDNA配列 の同定に際して、実験室で行われた工程を遡ることができる。本発明に係るシス テムに保存されるさまざまなデータによって、多くの場合、実際の実験を行なう ことなしに、分子生物学および薬理学で頻繁に問いかけられる質問に答えること ができると考えられる。これらの質問とは、例えば、ある特定の細胞型において 、もっとも活性のある遺伝子および普遍的な機能は何か、ストレスまたは病気が 続く間、ハウスキーピング的な機能および細胞特異的な日常的な機能に何が起こ るのだろうか、どの遺伝子によって正常な状態と病的状態とが診断されるのか、 薬剤による介入には、どの遺伝子産物を標的とすべきかなどである。 図2は、本発明に係るデータベースに保存される遺伝的データの調製の工程を 示したものである。図2の工程に関する情報は、図3A、3Bおよび図4から10 に示された表として、データベースに保存される。図2において、最初のステッ プ10は、細胞調製である。細胞調製10には、RNA抽出のための調製を行うために 、細胞を採取して増殖させる工程が含まれる。次のステップ20は、細胞からのmR NA抽出に関連したプロセスを示している。次に、ステップ30では、mRNAはcDNAに なる。または、ステップ10と20を行わずに、外部の情報源または共同研究者から cD NA断片を受け取ることもできる。cDNA分子が入手されたら、ステップ40でクロー ニングし、ステップ50で配列決定する。ステップ50で得られた配列は、次に、遺 伝データベースの既知の配列と比較される。最後に、ステップ70でDNA配列の機 能が判定される。 図3A、3Bおよび図4〜10は、好ましい態様に係るデータベースの表の概要 を例示したものである。典型的なフィールド(または属性)が各ボックスの中に 示されており、各表は、少なくとも一個の他の表と共通するドメインを有する属 性を含んでいる。例えば、130「生物源情報」と示されている表と、140「細胞培 養/処理」と示されている表とを考えてみる。これらの2つにおいて、共通のド メインは、生物番号である。また、一方の端を「I」とラベルされ、もう一方を 「M」とラベルされた矢印135は、生物源情報の表の中の各タプルについて、少 なくとも一個のタプルが細胞培養/処理表の中にあるかもしれないことを示して いる。 図2のステップ10〜30で得られたデータは、本発明に係るデータベースのライ ブラリー調製の部位に保存される(図3Aおよび3B)。このデータには、cDNA を得たり(ボックス130、110、120)、細胞培養および処理(ボックス140、180 )、mRNA調製(ボックス150)、ならびにcDNA構築(ボックス170、160)を行な うために用いられた細胞が由来する生物に関する情報が含まれる。より特異的に は、ボックス130は、生物源情報を保存するための表を示している。生物源とは 、組織培養で増殖した細胞、または手術によって一人の患者から得た細胞、また は、例えば、男女、および、ある年齢の範囲内にある患者から得た下垂体などの プールされてサンプルから得られた細胞を意味する。好ましい態様において、生 物源表130は、組織、器官、性別、年齢、病状など、図3Aに示されているよう な属性を含む。生物源情報は、正常な状態、処理状態、または疾病状態などを反 映しうる。当業者は、必要ならば、他の一定の生物源情報を保存できることに気 付くと思われ、また、本開示に基づいて、必要に応じて、関連する他の属性を含 ませることができる。 協力者、すなわち、生物源の寄贈者に関するデータは、図3Aに示すように、 表110に保存され、生物源に寄与した細胞提供者に関する情報は、表120に保存さ れる。生物源表130の生物源番号属性は、それぞれ、表110と120の協力者番号ま たは提供者番号に対応している。 細胞調製手順の一部には、細胞培養および処理の過程が含まれる。細胞培養は 、既知の大きさまたは容量の容器の中で行われる。濃度は、通常、1ミリリット ル(液体培地)当たりの細胞数で報告され、良好な細胞培養状態が維持されるよ う監視される。細胞を回収する時の濃度は、細胞数または1リットル当たりのグ ラム数で測定されうる。処理方法はさまざまである。化学物質を用いての誘導に より、未成熟な単核球の細胞を、成熟型であるマクロファージに変化させること ができる。異なった化学剤による刺激または活性化によって、マクロファージは 、侵入してくる細菌を摂取して消化するようになる。 ある場合において、細胞培養液を2つ以上の部分に分けて、一つのサンプルは 、(生物学的対照として)正常な増殖状態に維持し、他のサンプルを活性化およ び/または刺激する。単純な大筋の計画では、対照細胞のサンプルを、薬剤候補 物質で処理した細胞のサンプルと比較する。薬剤の用量および処理時間の長さは さまざまである。 細胞培養および処理の情報は、図3Aの表140に保存される。好ましい態様の 細胞培養/処理表140の属性は、表140に列挙してある。これらの属性には、細胞 密度、細胞品質、および処理などの情報が含まれる。細胞培養/処理表140は、 表130と共通の生物情報番号を持っている。特定の処理情報が、図3Aに示され ている属性を含む表180に保存される。培養番号属性は、表140と180に共通して いる。 mRNA調製のステップ20は、標準的なプロトコールにしたがって、既知の重量ま たは容量の細胞から全リボ核酸(RNA)を抽出することから始まる。プロトコー ルとすべての変更とが記録される。抽出されたRNAは、場合によっては、メッセ ンジャーRNAまたは転写RNA(mRNA)を回収するために分画してもよいが、分画し た場合には、収率をパーセント(mRNA/全RNA)で計算する。細胞におけるmRNAの 通常の機能は、ペプチドまたは蛋白質を産生することである。 分光光度測定およびゲル映像を用いて、mRNAの品質を検査する。分光光度測定 においては、260ラムダ/280ラムダ比から得られた光学濃度測定値が1.8であれ ば、DNAまたは蛋白質によってあまり汚染されていない高品質のRNAであることを 示 す。さらに、このmRNAサンプルを、電流によってアガロースゲルを通して泳動( 電気泳動)させることによって検査する。ゲルを見て、DNAの混入を調べるが、 混入したDNAは、普通、RNAよりも分子量が大きい物質として泳動する。または、 mRNAの分解についても調べるが、分解したmRNAは、はっきりしたバンドまたはシ グナルではなく、ぼやけたバンドになる。 mRNA調製に関するデータは、図3Bの表150に保存される。表150には、表140 の培養番号属性または表130の生物源番号属性のいずれかに相関するmRNAソース 番号属性と、mRNAソース番号が関係する表を同定するmRNAソース属性とが含まれ ている。したがって、これら2つの属性を組み合わせれば、表150のレコードが 表140と表130に結びつく。 次に、図2のステップ30で示されているように、cDNAの配列は、mRNAに由来し ている。cDNAの構築には、好ましくは、当業において知られているように、オリ ゴDT、ランダムプライミング、逆転写、またはその他のプロトコールを用いて、 mRNAを相補的なDNA(cDNA)に転換する必要がある。DNAをパッケージングするか または取り込むバクテリオファージの中に、有用なクローニング部位が設計され ている。各実験の結果得られる一次プラーク、すなわち、各バクテリアのコロニ ーの数を調べて、パッケージングまたはプレーティングの効率を測定する。宿主 細菌の遺伝的背景、および増幅前と後のバクテリオファージの希釈率に関する情 報を記録する。正常な細胞または病変細胞の全てに存在するアクチン遺伝子をス クリーニングし、挿入されたcDNA断片の大きさ(インサートサイズ)を見積もっ て、ライブラリーの品質を判定する。 cDNA構築に関するデータは、図3Bの表170に保存される。当業者には明らか なように、図3Bに示された、この表の属性から、cDNA構築に関する詳細な情報 が提供される。表170および表150は、mRNA調製番号(mRNA_prep_ID)を共通に有 することに留意されたい。 予め処理されたcDNA断片を、外部の供給業者から購入したり、協力者または取 引先から入手することができる。このような場合には、関連するデータは、デー タベースに保存されたcDNA供給業者表160に保存される。表160には、cDNA構築表 170の一部でもある供給者番号属性が含まれている。 図2に示されているように、cDNAが構築された後、クローニング処理が行われ る。図4に示されたデータベースの一部には、クローニング処理の過程で得られ るクローン調製データに関連し、切り出し(ボックス190)、接種(ボックス200 )、調製(ボックス210)、蛍光定量(ボックス220、230、240)に関する情報が 含まれる。クローニングには、切り出し、接種、および調製が含まれる。 切り出しとは、ベクターからcDNA断片を取り出すことである。この後、一晩培 養して、各培養物を含むバクテリア宿主のSOLR細胞において、ベクターの増幅を 誘導する。バクテリアDNAからプラスミドDNAを分離し、シークエンシングする前 に蛍光定量法により定量する。切り出しに関係したデータを保存する表が、図4 の190に示されている。切り出し表190には、cDNA構築表170と共通のcDNA構築番 号属性が含まれている。 接種には、液体培養培地で、バクテリアを増殖させ、数を増加させることが含 まれる。必要とされる細胞密度(最大増殖)に達したところで、直ちに、培養液 を固形の培養培地プレートに塗布する(線状にのばすか薄く広げる)。この培地 の表面にできるコロニーを一つずつ、純粋培養として、液体培地を入れた試験管 か微量滴定用プレートのウエルに継代培養してもよい。このバクテリア培養の集 団は、生物試料組織で活性のある遺伝子の数とタイプに対応する。接種に関連す るデータは、200と示された表に保存される。表200の培養番号属性は、表190の 同名の属性と共通である。 1マイクロリットル当たりのナノグラムまたはマイクログラムでcDNAを定量す るために蛍光定量計を用いる。シークエンス用ゲルの特定のレーンで電気泳動に よって処理し、分離する量を計算するために、cDNAの全量を測定しなければなら ない。サンプルの残りは、将来の使用に備えて保存しておく。蛍光定量により、 cDNAの純度が分かり、その後の実験過程における結果を予測する上で有用である 。 蛍光定量情報は、220、230、240として例示された表に保存される。より特異 的には、蛍光定量解析からのデータは、蛍光定量ログ表220の属性として保存さ れる。表230(蛍光定量)には、機器に関する情報が保存され、図4に示すよう に、表220と共通の蛍光定量番号を有する。蛍光測定器較正表240は、共通の較正 番号に よって、蛍光定量表230と関連する。 蛍光定量解析の後、配列決定のためのcDNA調製を行なった。配列決定のための cDNA調製は、そのときに用いられる方法(および、その変更)にしたがって記録 される。科学者たち(SWAT)が、配列決定実験における問題を解決し、特製のプ ロトコールの結果を追跡する。調製表は、210に例示されている。 クローンログ表250により、図4に例示されているクローニング処理に関する 情報が結合される。特に、これは、接種表200の属性でもある接種番号属性を有 する。クローン番号は、蛍光定量ログ表220と共通である。調製番号属性も調製 表210の一部である。例えば、クローンログ表250の死滅または生存属性によって 、プラスミド調製で、配列決定を行なうのに十分な収量がなかった死滅クローン が同定される。 シークエンシング処理に関するデータは、図5に描かれたデータベースの配列 決定部分として示されているところに保存される。この部分には、配列の詳細に 関する情報、およびそれに関連する情報が含まれる。これには、配列決定ログ( ボックス300)、配列決定ゲル(ボックス280)、反応セット(ボックス270)お よび配列保存部(ボックス290)が含まれる。配列の詳細および関連情報は、配 列決定ログ表300の属性として保存される。一個のクローンが複数回にわたって 配列決定されうることに注意すべきである。表260(配列決定リンク)は、クロ ーンログ表250を配列決定ログ表300にリンクさせる。配列決定リンク表260は、 クローンログ表250の属性と同じクローン番号属性と、表300に含まれる配列決定 ログ番号属性とを有する。 cDNAの配列決定は、ABIの自動システムで行われる。各デオキシリボ核酸また は塩基(アデニン、シトシン、グアニン、チミジン)が示すシグナルの鮮明さと 濃さ、ゲルの中でのそれらの物理的な近接性、および、ゲルのバックグラウンド の明瞭さについて配列決定ゲルを判定する。これらの特徴は、配列を産出するた めのゲル自動読み取り器のための一定のパラメータの中に含まれるはずである。 将来、参照するために、電子的なクロマトグラム、または、ゲル図をコンピュー タシステムに保存しておく。 すべてのゲル情報の経路は、ゲルキーに反映されている。利用できる配列が得 られたか否かにかかわらず、ゲル、それが泳動される条件、ゲル泳動に必要とさ れる時間、用いられた機械/機器のそれぞれ、スタッフ、および生物学的な調製 物について記録しておく。このデータは、配列ログ表300の同じ属性を共有する ゲルキー番号属性を有するゲルキー表280に保存される。 配列決定用ゲルで泳動される生物学的な調製物は、反応セットと名付られてい る。カタリストとは、ロボットによりPCR増幅、希釈、および蛍光色素のcDNAへ の付加が行なわれる、分子生物学用装置モデル800である。反応セットに関連す るデータは、表270に保存される。この表には、配列ログ表300の一部でもある反 応セット番号と名付けられた属性が含まれている。 配列保存所は、配列が得られると作動開始する。配列は、正常型か変異型に分 類され、有用性について、および、コンピュータシステムデータベースに引き続 き保存すべきかについて判定が行われる。ここで、変異型と認められた配列は、 発現型と名付けてもよい(後述の考察を参照)。配列保存所データは、配列ログ 表300と共通の配列番号属性を有する表290に保存される。 図6は、配列決定用機器に関する情報を保存するためのデータベースの部分を 示したものである。シークエンサー管理ログ表900は、各DNA配列決定機の維持管 理に関する情報を集めておくところであるが、リレーショナルデータベースを通 して、もとのDNA配列との関係を見ることができる。シークエンサー管理ログ表9 00は、共通属性である機器番号を通してゲルキー表280に連結されている。表900 には、点検を依頼した日付、点検/管理が行われた日、支障の種類、管理に関与 したスタッフ、および関連するコメントなどの情報が含まれる。 好ましい態様において、カタリスト管理ログ表およびコンピュータ管理ログ表 (それぞれ905および910)は、コンピュータ番号属性を通して連結され、シーク エンサー管理ログ情報と同じ情報をもち、本質的に、いかなるDNA配列にも関連 させることができる。 機器ログ表915は、機器番号属性およびコンピュータ番号属性を通して管理表9 00〜910とつながっており、配列決定作業に用いられた装置または機器に関する 情報が入っている。好ましい態様において、表915には、装置名およびシリアル 番号、納入業者番号、ならびにインストール日などに関する情報が保存されてい る。 別の納入業者表920は、納入業者番号属性によって装置ログ表915とつなが り、例えば、会社名、住所、電話番号、ファックス番号、連絡相手などを保存す る。納入業者一覧表には、さらに電子メールアドレスおよび契約が成立した日な ど、納入業者に関する付加的情報も含まれる。 図7は、配列決定用試薬に関する情報を保存するための好ましい態様のデータ ベース部分を描いたものである。ゲルリンク表925は、ゲルキー属性によってゲ ルキー表280にリンクし、ゲル溶液番号属性によってゲル溶液表935にリンクして いる。 ゲル溶液表935には、ゲル溶液に関する情報が含まれ、溶液が作成された日に 関する情報、さらには、溶液が作成された日および溶液を調製した人に関する情 報が含まれる。ゲル溶液ロットリンク表950は、ゲル溶液番号属性によってゲル キー表280にリンクし、ロット表965と共通するロット番号および試薬番号属性に よってゲル溶液表935にリンクしている。 反応混合液リンク表930は、反応セット表270と反応セット番号属性を共有して いる。反応混合液リンク表930の混合液番号は混合液表940と共通である。混合液 表940には、混合液が作成された日、および混合液を作成したスタッフ名も含ま れる。混合液ロットリンク表955は、混合液番号属性が混合液表940と共通であり 、ロット番号および試薬番号がロット表965と共通である。 ロット表965には、試薬番号、ロット番号、納入業者番号、受領日、および、 使用日が含まれる。納入業者番号は、納入業者表960と共通である。別の試薬表9 70は、ロット表965と、試薬番号属性を共有しており、また、さらに、試薬名を 含む。 配列の実験セットを、図8に示された高速セット部分に保存してもよい。この 部分には、高速リンク表370、クローン変異配列表380、実験表390、整理表400、 および、配列再決定表410が含まれる。高速リンク表370には、より高い優先順位 を有する配列セットが保存される。これらには、独自のID番号が与えられ、バッ チ処理される事項とは別個に扱われる。クローン変異配列表380は、各研究者に よって印を付けられた変異配列を示す。変異配列は、印を付けた科学者、協力者 、または業者によって評価され、適当な対応がとられる。実験表390に保存され た実 験配列は、上記の変異配列と同じである。これらは、各研究者によって印を付け られている相同配列、または、対立遺伝子配列、突然変異配列などである。断片 が回収されるとすぐ、全長の発現配列に整列され、調査を継続する。整理表400 には、プロトコールに付加された特別の工程が反映されるデータが保存される。 配列の読み取り度を向上させるための、より長い実験手順が設計されている。こ の実験手順を反復するだけで、配列を検査したり、より多くのデータを得るため の配列再決定を行うことができる。配列再決定に関する情報は、配列再決定表41 0に保存される。 高速リンク表370には、クローンログ表250にも含まれるクローン番号属性が含 まれる。表370のログ実体番号属性から、表380、390、400、410のそれぞれ変異 配列番号、実験セット番号、整理セット番号、および、配列再決定セット番号の 関連付けが提供される。表370のログ表名属性から、ログ実体番号によって関連 付けられた表が同定される。 図2のステップ60で示されているように、ステップ50で得られた各cDNA配列を 同定するために、可能であれば、遺伝学的データベース中の既知の配列との比較 を行なう。このプロセスには、(a)データセットの中、(b)内部データベー ス、および/または(c)外部データベースの中の配列と比較することが含まれ る。このライブラリーは、生物源となる組織に存在するRNA転写産物の出現頻度 を表すため、いくつかの異なったクローンのいくつかが、同じ遺伝子または対立 遺伝子の全部もしくは一部を含んでいていもよい。また、コンピュータは、配列 の中の各塩基数を数えて、挿入配列の長さを解析する。 配列比較に関するデータは、図7に示されたデータベースの配列比較部分の表 の中に保存される。これらの表には、第一配列適合ログ表510および第二配列適 合ログ表515が含まれる。 本発明に係るデータベースは、外部のデータベースと接続することもできる。 遺伝学的なデータベースは、DNAまたは蛋白質の配列が含まれている。このよう なデータベースのサービスは、DNA、蛋白質またはそれらの断片の名前以外に、 検索ツールまたは適合ツールを提供している。図7に描かれているように、この ような外部データベースには、GenBank(ジェンバンク)データベース(ボック ス610 )、ProDom(プロドム)データベース(ボックス570)、Blocks(ブロックス) データベース(ボックス580)、Pisearch(ピーアイサーチ)データベース(ボ ックス590)、および、Sites(サイツ)データベース(ボックス600)が含まれ る。 データベースに保存された配列に対しての比較を行なうための、既知遺伝子お よび配列、その他の情報の一次的なソースとして、GenBankデータベースが用い られる。このような断片が「本物」(既知で名前を持つヒトの配列に明らかに一 致している)として分類するか、ヒトまたは他の生物種で同定された遺伝子に相 同である(部分的に関連している)と分類するかは、一致率と可能性の両方を考 慮して判断される。独自のもので同定されていない断片または配列は、識別番号 によってリストにする。 特定の配列が機能的な蛋白質ドメインまたはモチーフを持っていれば、ProDom 、Blocks、および、Pisearchデータベースにアクセスする。これらのパターンか ら、該配列によってコードされるペプチドまたは蛋白質に関する重要な構造情報 が提供される。 さらに、ベクターデータベース520には、cDNAをクローン化するために用いら れるベクターのDNA配列が保存される。同定されたcDNA配列を、このデータベー スの配列と比較することによって、cDNA配列の中に現れるベクター配列、または ベクター配列の一部を区別することができる。同様に、反復データベース530に よって、alu(アル)などの多重遺伝子ファミリーを同定することができる。隠 れたマルコフデータベース560は、塩基配列のアラインメントを見て、コンピュ ータ計算によって、その配列からペプチド構造を予測するソフトウエアを有する 。図9のボックス550に示されているように、付加的な特徴を提供する他のデー タベースにも接続することができる。 配列比較によって、適合するという結果が出たとき、この適合に関する情報が 、配列適合ログ表510および515に保存される。この情報には、一般的に、外部デ ータベースの中の適合する配列レコードと、適合の性質を表すスコアに関するア ドレス情報とが含まれる。スコアを付ける方法が、すべてのデータベースで一致 しているわけではないので、別の態様においては、スコアを別のレコードに保存 することが好ましい。配列適合ログ510は、共通の配列番号属性によって、配列 保 存部290とリンクしている。適合閾値外の適合を示すものが第二配列適合ログ表5 15に保存されるのに対し、第一配列適合ログ表510には、よりよい適合を示すも のが含まれる。どちらの表(510と515)も同一の属性を有する。 次に、図2のステップ70に示されているように、特定の閾値を超える性質を有 する適合配列に対して機能同定を行なう。機能同定に関するデータは、図10に 示された表の中に保存される。これらの表には、蛋白質表720、蛋白質−配列リ ンク表730、フォルダー表760、および、所在表780が含まれている。蛋白質同定 は、機能/ドメインデータベースのいずれかから行われるかもしれない。GenBan kロケーションまたはローカスと、国際EC番号(酵素または蛋白質分類)を表720 に保存する。この表の各エントリは、その機能に関して最終的に同定された配列 保存表の少なくとも一個の配列に対応する。蛋白質表720は、蛋白質−配列リン ク表730を経由して配列保存表290とリンクされる。蛋白質表720には、蛋白質− 配列リンク表730と共通する蛋白質番号属性が含まれている。そして、配列保存 表290は、蛋白質−配列リンク表730と共通の配列番号属性を有する。 フォルダー表760の各エントリには、他のデータベースと、興味深いことに、 確実性のない合致を示した保存表の少なくとも一個の配列に対する統一性のない 注釈が付けられている。あらゆるタイプの注釈、脚注、または、注記を、フォル ダー表760の中に記録することができる。これによって、研究者は、不確実な適 合情報を有するデータベースの中の他のレコードに混入することなく、必要な情 報を保存できる。 フォルダー表760は、機能配列リンク750を経由して配列保存部290にリンクす る。機能配列リンク750は、フォルダー表760と共通のフォルダー番号属性をもち 、配列保存部290と共通の配列番号属性を有する。 本発明によって、研究者は、キーワードを使ってリレーショナルデータベース を検索し、キーワード検索が行われる表を特定することができるようになる。従 って、例えば、研究者は、生物源表130の中で「内皮の」という語が存在するす べての箇所を検索できる。 さらに、本発明によって、研究者は、図10に示されているキーワード表790 に検索事項を保存することができる。この表に保存された各検索事項は、独自の キ ーワード番号によって同定される。研究者が保存された特定の検索を行いたいと 思ったときには、その検索事項に対するキーワード番号を入力するだけでよい。 すると、コンピュータが関連するレコードを取り出して、キーワードテキストフ ィールドに保存されたキーワードについて、表名フィールドの中で同定された表 を検索する。検索結果は、例えば、図10のボックス800〜820の中に示されてい るような電子メール通信を通して、ユーザーに送られる。 所在表780には、同定されたそれぞれの配列の細胞内での所在に関する情報が 保存されている。所在表780は、共通の蛋白質番号によって、蛋白質表720とリン クしており、「所在」と呼ばれる属性の中に所在情報が保存される。好ましい態 様において、この属性に対するドメインには、以下のカテゴリーが含まれる。す なわち、核、細胞質(細胞骨格)、細胞質(細胞内膜)、細胞質(ミトコンドリ ア)、細胞表面、分泌物である。 また、図10には蛋白質表720をヒトゲノムデータベースにリンクするGDBリン クス表770も示されている。GDBリンクス表770は、蛋白質表720と共通の蛋白質番 号属性をもち、GDB番号属性を通してヒトゲノムデータベースにリンクする。 好ましい態様のデータベースに保存されている関連情報が豊富にあれば、ユー ザーは、それまで既知の遺伝学的データベースでは利用できなかったような新し いタイプのデータ検索が行なえるようになる。例えば、好ましい態様のリレーシ ョナルデータベースは、含有量解析を行なうのによく適合している。この解析は 、一定の状態にある特定の細胞、例えば、正常または活性化されたある細胞に見 られるmRNAまたは転写産物の相対的な頻度をユーザーに提供する。例えば、もし 、研究者がLPSで活性化されたTHP-1細胞において最も豊富な配列を尋ねる検索項 目を入力したら、コンピュータシステムは、リレーショナルデータベースを検索 して、図11に例示したような画面を出力するようにプログラムされている。 好ましい態様において、検索は以下のようにして行われる。まず、細胞培養/ 処理レコード140において、細胞系名フィールドが「THP-1」(この例では)に等 しいレコードが同定される。次に、同定されたレコードを、処理フィールドが「 LPS」に等しいレコードに対して検索する。そして、データベース中で、この同 定された配列の部分集合に対応する配列適合ログレコード510が決められ、適合 番号 数によって分かる特定の配列の細胞における含有量を判定するために、それぞれ 別個の適合番号値に対応する配列適合ログレコードの数を計算する。コンピュー タが、すべての生物源レコードを調べた後、特定の検索において必要とされる方 法で、得られた含有量情報を検索し、図11に例示されているように、表の形で 画面に示される。 同様に、上記のデータベース構造から、サブトラクション解析を行なうための 便利な方法が提供される。サブトラクション解析によって、通常の細胞に比べて 、活性化された細胞の中で、どの配列がより普遍的に発現するかが判定される。 サブトラクション解析を行なうためには、正常な細胞ライブラリーおよび活性化 された細胞ライブラリーに対して含有量解析を行ない、情報が得られたら、その 値の割合が求められる。図12は、このような操作を、正常なTHP-1およびLPSで 活性化したTHP-1に対して行なったものである。 ロケーション解析を行なうこともできる。例えば、ユーザーが特定の活性化マ クロファージの中の特定の蛋白質の所在を知りたいとする。コンピュータは、上 記の方法で知りたいと思った細胞に関係するレコードの部分集合を同定し、その 蛋白質がその細胞に存在することを確かめるために、蛋白質表720にある関連レ コードを調べ、最終的に、所在表780の中の蛋白質の所在を調べて、ユーザーに その所在を出力する。 好ましい態様における配列所在表の分類は、核、細胞質、細胞表面、または、 分泌である。細胞質の中においては、配列を、細胞骨格、細胞内膜、または、ミ トコンドリアに指定する。この情報は、所在表780の所在フィールドの中に用意 されている。同定された配列はすべて、それらの相対的な多さに関わらず、デフ ォルトでは、未知のカテゴリーに分類される。 好ましい態様のデータベースが備えている、もう一つの機能は分布である。こ の機能によって、例えば、ある配列が、どの組織または器官で、どのくらいの頻 度で見られるかが決定される。このシステムは、配列ログ300のレコードを調べ る工程をたどり、知りたいと思う配列に適合するものがあれば、システムは、リ レーショナルデータベースの関連を通して、特定の配列が見つけられた器官およ び組織を判定する。最後に、その配列を調べて、必要とされた分布統計を示すよ う に出力が作成される。 詳細なレコードおよびデータベースのリレーショナルな構造によって、研究者 は、mRNA、cDNAの配列決定処理の工程を反映するどのフィールドにも、実際にア クセスすることができるようになる。このように、本発明に係るデータベースに より、実験結果および実験過程を解析するための強力なツールが提供される。例 えば、もし、研究者が、mRNAの特定のロットまたはバッチから得られるすべての 配列を知りたい場合、このような情報は、mRNA調製レコード150を通る工程をた どり、知りたいと思うロット番号を有するレコードを見つけ、配列決定ログの中 にある関連するエントリを出力することによって得ることができる。 上述の開示により、当業者は、さまざまなデータ解析作業において、科学者に 有用な多くの検索項目を設計することができる。前述の説明から、本発明の精神 および主要な特質から逸脱することなく、本発明を、別の特異的な様式で具体化 できることは明らかである。したがって、今回開示された態様は、あらゆる局面 において、例示的なものであって、制約的なものでないと考えられるべきで、ま た、本発明の範囲は、前述の説明よりも、添付の請求の範囲によって示されてい ると考えられるべきであり、請求項の意味およびその範囲を変えない範囲で行わ れる変更は、すべて本明細書に含まれていると考えられるべきである。
【手続補正書】 【提出日】1997年7月29日 【補正内容】 請求の範囲 1.生物学的情報を保存および捕捉するためのコンピュータ化されたシステムに おいて、 各表が少なくとも一個の他の表と共通の属性をもち、表の集合体が対応する 適合ログに対する表を含み、適合ログが生物源のあるcDNA配列と既知のcDNA配列 との比較に関する情報を含んでいる、表の集合体、 各表のレコード、ならびに データ入力装置、表示装置、中央演算装置、および、リレーショナルデータ ベースにcDNA配列データを保存するデータ保存装置において、このシステムが、 cDNA配列に対応するデータを、(a)表のレコードを検索し、(b)特定の生物 源におけるcDNA配列の相対的な頻度を決定するために検索することができるよう に設計されている装置とを含む、コンピュータ化されたシステム。 2.(c)ロケーション解析を行うために用いることができる、請求項1記載の 保存および捕捉するためのコンピュータ化されたシステム。 3.(d)分布解析を行うために用いることができる、請求項1記載の保存およ び捕捉するためのコンピュータ化されたシステム。 4.(e)生物源組織情報を判定するために検索することができる、請求項1記 載の保存および捕捉するためのコンピュータ化されたシステム。 5.(f)生物源器官情報を判定するために検索することができる、請求項1記 載の保存および捕捉するためのコンピュータ化されたシステム。 6.(g)生物源組織病理情報を判定するために検索することができる、請求項 1記載の保存および捕捉するためのコンピュータ化されたシステム。 7.(h)生物源組織年齢情報を判定するために検索することができる、請求項 1記載の保存および捕捉するためのコンピュータ化されたシステム。 8.(I)生物源組織性別情報を判定するために検索することができる、請求項 1記載の保存および捕捉するためのコンピュータ化されたシステム。 9.生物学的データを保存し、捕捉するためのコンピュータシステムにおいて、 各表が少なくとも一個の他の表と共通する属性を含む表の集合体を含み、こ の表の集合体が、cDNA配列データを保存する複数の表を含む、生物学的データを 保存するリレーショナルデータベース、 あるcDNA配列が第一の生物源組織の中に出現する相対頻度を決定するための 手段、および cDNA配列が第一の生物源組織および第二の生物源組織に現れる頻度の割合を 決定するために、第一の生物源組織と第二の生物源組織との間で、サブトラクシ ョン解析を行なうための手段を含む、コンピュータシステム。 10.第一の生物源組織が正常な組織であり、第二の生物源組織が病変組織であ る、請求項9記載のコンピュータシステム。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,MW,SD,SZ,UG), AM,AU,BB,BG,BR,BY,CA,CN,C Z,EE,FI,GE,HU,IS,JP,KG,KP ,KR,KZ,LK,LR,LT,LV,MD,MG, MN,NO,NZ,PL,RO,RU,SG,SI,S K,TJ,TM,TT,UA,US,UZ,VN (72)発明者 スコット ランダル ダブリュー. アメリカ合衆国 カリフォルニア州 マウ ンテンビゥー サン−モア 13140

Claims (1)

  1. 【特許請求の範囲】 1.リレーショナルデータベースの中にデータを保存するためのデータ入力装置 、表示装置、中央演算装置およびデータ保存装置を含む、生物学的情報を保存お よび捕捉するためのコンピュータ化されたシステムにおいて、データベースには 表が含まれ、この各表は、少なくとも一個の他の表と共通する少なくとも一個の 属性を有するドメインをもっており、該表が、 ライブラリー調製データを保存するための複数の表、 クローン調製データを保存するための複数の表、 配列決定データを保存するための複数の表、および 配列比較データを保存するための少なくとも一個の表を含む、コンピュータ化 されたシステム。 2.機能同定データを保存するための少なくとも一個の表をさらに含む、請求項 1記載のシステムのデータベース。 3.高速セットを保存するための表をさらに含む、請求項1記載のシステムのデ ータベース。 4.ライブラリー調製データを保存するための表が、mRNA調製データを保存する ための表を含む、請求項1記載のシステムのデータベース。 5.ライブラリー調製データを保存するための表が、cDNA構築データを保存する ための表を含む、請求項1記載のシステムのデータベース。 6.ライブラリー調製データを保存するための表が、生物源データを保存するた めの表を含む、請求項1記載のシステムのデータベース。 7.ライブラリー調製データを保存するための表が、細胞培養および処理のデー タを保存するための表を含む、請求項1記載のシステムのデータベース。 8.クローン調製データを保存するための表が、接種データを保存するための表 を含む、請求項1記載のシステムのデータベース。 9.クローン調製データを保存するための表が、切り出しデータを保存するため の表を含む、請求項8記載のシステムのデータベース。 10.クローン調製データを保存するための表が、蛍光定量データを保存するた めの少なくとも一個の表を含む、請求項9記載のシステムのデータベース。 11.配列決定データを保存するための表が、配列決定ログ表を含む、請求項1 記載のシステムのデータベース。 12.配列決定データを保存するための表が、反応セットデータを保存するため の少なくとも一個の表を含む、請求項1記載のシステムのデータベース。 13.配列決定データを保存するための表が、ゲルキーデータを保存するための 少なくとも一個の表を含む、請求項1記載のシステムのデータベース。 14.機能同定データを保存するための表が、蛋白質データを保存するための少 なくとも一個の表を含む、請求項2記載のシステムのデータベース。 15.配列決定用試薬データを保存するための表をさらに含む、システム1のデ ータベース。 16.配列決定用装置データを保存するための表をさらに含む、システム1のデ ータベース。 17.生物学的データを保存し、捕捉するためのコンピュータシステムにおいて 、 各表がデータベースの中の少なくとも一個の他の表の属性と共通のドメイン を有する属性を含む相互に関連する複数の表を含む、生物学的データを保存する ためのリレーショナルデータベースと、 リレーショナルデータベースに保存されているデータに基づいて、ある生物 組織の中にRNA転写産物が出現する頻度を判定するための手段とを含むコンピュ ータシステム。 18.ある生物源組織の中に出現するRNA転写産物の頻度と、その生物源組織が 異なった状態にあるときに、その中に出現するRNA転写産物の頻度との割合を決 定するために、ある生物組織のサブトラクション解析を行うための手段をさらに 含む、請求項17記載のシステム。 19.生物学的データを保存し、捕捉するためのコンピュータシステムにおいて 、 生物学的データを保存するためのリレーショナルデータベースで、データ ベースの少なくとも一個の他の表の属性と共通のドメインを有する少なくとも一 個の属性を有する表が複数含まれるデータベースであるリレーショナルデータベ ースと、 データベースに保存されたデータに基づいて、所定の細胞の中に存在する mRNAの所在を判定するための手段とを含むコンピュータシステム。 20.生物学的データを保存し、捕捉するためのコンピュータシステムにおいて 、 少なくとも一個の共通の属性を有することによって、表が相互に関連する ように、該生物学的情報が保存されている表を含むデータベースと、 複数の器官のそれぞれの中の特異的なRNAの存在および頻度を判定するた めの手段とを含むコンピュータシステム。
JP8522835A 1995-01-27 1995-09-06 微生物学的データを保存し解析するコンピュータシステム Ceased JPH11501741A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/US1995/001160 WO1995020681A1 (en) 1994-01-27 1995-01-27 Comparative gene transcript analysis
US95/01160 1995-01-27
PCT/US1995/012429 WO1996023078A1 (en) 1995-01-27 1995-09-06 Computer system storing and analyzing microbiological data

Publications (1)

Publication Number Publication Date
JPH11501741A true JPH11501741A (ja) 1999-02-09

Family

ID=22248580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8522835A Ceased JPH11501741A (ja) 1995-01-27 1995-09-06 微生物学的データを保存し解析するコンピュータシステム

Country Status (6)

Country Link
EP (1) EP0805874A4 (ja)
JP (1) JPH11501741A (ja)
AU (1) AU692626B2 (ja)
CA (1) CA2210731A1 (ja)
NZ (1) NZ294720A (ja)
WO (1) WO1996023078A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002538517A (ja) * 1999-02-25 2002-11-12 ソシエテ・ド・コンセイユ・ド・ルシエルシエ・エ・ダアツプリカーション・シヤンテイフイツク・(エス.セー.エール.アー.エス) 推定ペプチドの同定方法
JP2003502669A (ja) * 1999-06-23 2003-01-21 ティッシュインフォマティクス,インコーポレイティド 組織の母集団を表わす指標を包含するデータベースを使用して組織をプロファイルし分類する方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6189013B1 (en) 1996-12-12 2001-02-13 Incyte Genomics, Inc. Project-based full length biomolecular sequence database
US6519583B1 (en) 1997-05-15 2003-02-11 Incyte Pharmaceuticals, Inc. Graphical viewer for biomolecular sequence data
US5966712A (en) * 1996-12-12 1999-10-12 Incyte Pharmaceuticals, Inc. Database and system for storing, comparing and displaying genomic information
US5970500A (en) * 1996-12-12 1999-10-19 Incyte Pharmaceuticals, Inc. Database and system for determining, storing and displaying gene locus information
US6553317B1 (en) 1997-03-05 2003-04-22 Incyte Pharmaceuticals, Inc. Relational database and system for storing information relating to biomolecular sequences and reagents
US5966711A (en) * 1997-04-15 1999-10-12 Alpha Gene, Inc. Autonomous intelligent agents for the annotation of genomic databases
US6611828B1 (en) 1997-05-15 2003-08-26 Incyte Genomics, Inc. Graphical viewer for biomolecular sequence data
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
US7068830B2 (en) 1997-07-25 2006-06-27 Affymetrix, Inc. Method and system for providing a probe array chip design database
JP2001515234A (ja) 1997-07-25 2001-09-18 アフィメトリックス インコーポレイテッド 多型性データベースを提供するためのシステム
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
EP1396800A3 (en) * 1997-07-25 2006-05-03 Affymetrix, Inc. Method and apparatus for providing a bioinformatics database
SE520734C2 (sv) * 1997-11-28 2003-08-19 Cybergene Ab Handhållen anordning för analys av nukleotidsekvenser
US6324479B1 (en) 1998-05-08 2001-11-27 Rosetta Impharmatics, Inc. Methods of determining protein activity levels using gene expression profiles
US6606622B1 (en) * 1998-07-13 2003-08-12 James M. Sorace Software method for the conversion, storage and querying of the data of cellular biological assays on the basis of experimental design
US6185561B1 (en) 1998-09-17 2001-02-06 Affymetrix, Inc. Method and apparatus for providing and expression data mining database
US6489096B1 (en) 1998-10-15 2002-12-03 Princeton University Quantitative analysis of hybridization patterns and intensities in oligonucleotide arrays
GB9904585D0 (en) * 1999-02-26 1999-04-21 Gemini Research Limited Clinical and diagnostic database
WO2000070556A2 (en) * 1999-05-19 2000-11-23 Whitehead Institute For Biomedical Research A method and relational database management system for storing, comparing, and displaying results produced by analyses of gene array data
AU6375800A (en) * 1999-07-27 2001-02-13 Cellomics, Inc. Method and system for dynamic storage and validation of research data
US6941317B1 (en) 1999-09-14 2005-09-06 Eragen Biosciences, Inc. Graphical user interface for display and analysis of biological sequence data
AU1367201A (en) * 1999-10-01 2001-05-10 Orchid Biosciences, Inc. Method and system for providing genotype clinical information over a computer network
US6640211B1 (en) 1999-10-22 2003-10-28 First Genetic Trust Inc. Genetic profiling and banking system and method
US20020032530A1 (en) * 2000-02-11 2002-03-14 Sushma Pati Integrated genomic services
EP1356412A2 (en) * 2000-08-10 2003-10-29 Glaxo Group Limited A global electronic medicine response profile testing network
WO2002027035A2 (en) * 2000-09-28 2002-04-04 Pangene Corporation High-throughput gene cloning and phenotypic screening
CA2425488A1 (en) * 2000-10-12 2002-04-18 Iconix Pharmaceuticals, Inc Interactive correlation of compound information and genomic information
JP2004534207A (ja) * 2001-02-14 2004-11-11 テイボテク・ビーブイビーエイ 高スループット選別用の自動情報管理を提供する方法と装置
CA2377213A1 (en) * 2001-03-20 2002-09-20 Ortho-Clinical Diagnostics, Inc. Method for providing clinical diagnostic services
WO2003005236A2 (en) * 2001-07-05 2003-01-16 Lion Bioscience Ag Method and apparatus for creating, maintaining and using a reference database
US20040076974A1 (en) * 2002-04-01 2004-04-22 Kier Larry D. Liver necrosis predictive genes
US7588892B2 (en) 2004-07-19 2009-09-15 Entelos, Inc. Reagent sets and gene signatures for renal tubule injury
US7467118B2 (en) 2006-01-12 2008-12-16 Entelos Inc. Adjusted sparse linear programming method for classifying multi-dimensional biological data

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371671A (en) * 1990-03-13 1994-12-06 The Regents Of The University Of California DNA sequence autoradiogram digitizer and methodology implemented in the same
US5364759B2 (en) * 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
DE69228158T2 (de) * 1991-08-27 1999-09-02 Zeneca Ltd Verfahren zur Charakterisierung genomischer DNA
EP0582755A1 (de) * 1992-08-02 1994-02-16 SOFT GENE, ENTWICKLGS. U. VERTRIEBSGES. F. MOLEKULARBIOLOGISCHE SOFTWARE mbH Verfahren zum Einordnen von Informationsträgern in Datenbanken

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002538517A (ja) * 1999-02-25 2002-11-12 ソシエテ・ド・コンセイユ・ド・ルシエルシエ・エ・ダアツプリカーション・シヤンテイフイツク・(エス.セー.エール.アー.エス) 推定ペプチドの同定方法
JP2003502669A (ja) * 1999-06-23 2003-01-21 ティッシュインフォマティクス,インコーポレイティド 組織の母集団を表わす指標を包含するデータベースを使用して組織をプロファイルし分類する方法

Also Published As

Publication number Publication date
AU692626B2 (en) 1998-06-11
AU3759095A (en) 1996-08-14
EP0805874A4 (en) 1998-05-20
WO1996023078A1 (en) 1996-08-01
NZ294720A (en) 1998-06-26
EP0805874A1 (en) 1997-11-12
CA2210731A1 (en) 1996-08-01

Similar Documents

Publication Publication Date Title
JPH11501741A (ja) 微生物学的データを保存し解析するコンピュータシステム
US20200327956A1 (en) Methods of selection, reporting and analysis of genetic markers using broad-based genetic profiling applications
US6303297B1 (en) Database for storage and analysis of full-length sequences
Bonneau et al. De novo prediction of three-dimensional structures for major protein families
US6553317B1 (en) Relational database and system for storing information relating to biomolecular sequences and reagents
JP6586088B2 (ja) 配列をアラインするための方法およびシステム
Biron et al. The pitfalls of proteomics experiments without the correct use of bioinformatics tools
US6484183B1 (en) Method and system for providing a polymorphism database
Hocquette Where are we in genomics?
JPH09503921A (ja) 遺伝子転写産物の比較解析
JP2016540275A (ja) 配列変異体を検出するための方法およびシステム
Lu et al. Review of preferential suspicious genes in microtia patients through various approaches
Benecke et al. DNA techniques for forensic entomology
US20020029113A1 (en) Method and system for predicting splice variant from DNA chip expression data
Cawood DNA fingerprinting.
Kirkness et al. The TIGR human cDNA database
CN110438235B (zh) 基于毛干蛋白质组nsSNP进行人群来源推断的方法
JP2003521071A (ja) 生物医学的リソースへの統合されたアクセス
WO2008130416A1 (en) Method and system for preparing a blood sample for a disease association gene transcript test
JP2004005319A (ja) 遺伝子データベース作成方法、遺伝子データベース作成装置、遺伝子データベース作成プログラム、および遺伝子データベース作成プログラムを記録したコンピュータ読み取り可能な記録媒体
Trostle et al. MECP2pedia: a comprehensive transcriptome portal for MECP2 disease research
CN117690485B (zh) 用于寄生虫鉴定的基因组的处理方法和处理装置
Tom Bioinformatics Metadata Extraction for Machine Learning Analysis
Cervi et al. The MetaGens algorithm for metagenomic database lossy compression and subject alignment
Pollo et al. MinION re-sequencing of Giardia genomes and de novo assembly of a new Giardia isolate

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040123

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040308

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20040607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040706