JPH09503921A - 遺伝子転写産物の比較解析 - Google Patents

遺伝子転写産物の比較解析

Info

Publication number
JPH09503921A
JPH09503921A JP7520218A JP52021895A JPH09503921A JP H09503921 A JPH09503921 A JP H09503921A JP 7520218 A JP7520218 A JP 7520218A JP 52021895 A JP52021895 A JP 52021895A JP H09503921 A JPH09503921 A JP H09503921A
Authority
JP
Japan
Prior art keywords
sequence
gene
transcript
library
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7520218A
Other languages
English (en)
Inventor
ジェフリー ジェイ. セイルハマー
ランダル ダブリュー. スコット
Original Assignee
インサイト ファーマシューティカルズ インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/187,530 external-priority patent/US5840484A/en
Application filed by インサイト ファーマシューティカルズ インク. filed Critical インサイト ファーマシューティカルズ インク.
Publication of JPH09503921A publication Critical patent/JPH09503921A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Library & Information Science (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 生物試料中の遺伝子転写産物の相対的存在量を定量するための方法およびシステム。本方法の一つの態様は、複数のRNA、またはそれに対応するcDNAを高速で配列特異的な解析を行なう(遺伝子転写産物イメージ解析)。本方法のもう一つの態様は、高速のcDNA配列解析を用いて、遺伝子転写産物イメージ解析を作成する。さらに、遺伝子転写産物イメージは、特殊な生物学的状態、病気、またはある細胞や細胞集団中の遺伝子転写産物の相対的な存在量と相関する条件を、検出もしくは診断するために用いることができる。本発明は、2つの生物試料を区別し、2つの試料間で異なって発現する一つまたは複数の遺伝子を同定するために、2つ以上の異なった試料から得た遺伝子転写産物イメージ解析を比較するための方法を提供する。

Description

【発明の詳細な説明】 遺伝子転写産物の比較解析 1.発明の分野 本発明は、分子生物学およびコンピューター科学の分野に関し、特に本発明は 、遺伝子転写産物を解析して、細胞または組織での遺伝子発現を診断する方法を 開示する。 2.発明の背景 つい最近まで、分子生物学では、一度に一個の遺伝子だけを扱っていた。科学 者たちは細胞の物理的な変化を観察し、細胞またはその環境から混合物を分離し 、蛋白質を精製し、蛋白質の配列を決定し、それによってプローブを作製して相 当する遺伝子を捜し出そうとしてきた。 近年、いろいろな国で、数十億塩基対もあるヒトゲノムの配列を調べる大規模 プロジェクトが立ち上げられている。これらのプロジェクトでは、ゲノムを染色 体の多数の部分に分割することから始めて、次にこれらの断片の配列を決定して から、この配列と既知の蛋白質、または、モチーフとして知られている蛋白質の 一部分との同一性を調べるために解析が行われるのが一般的である。残念ながら 、ゲノムDNAの大部分は蛋白質をコードしておらず、細胞の蛋白質を作る能力に 対していくらかの効果をもつと考えられてはいるが、それを医学的に利用するこ との妥当性については、今のところ分かっていない。 3番目の方法論は、蛋白質の製造に積極的に関与する細胞内装置をコードする 転写産物、すなわちmRNAのみを配列決定することに関する。すでに細胞によって 非翻訳領域のDNAがすべて削除されているという利点があるために、RNAの、蛋白 質をコードする部分を同定するのは比較的容易である。この方法の実用性は、ゲ ノム研究者にとってすぐには明らかにならなかった。実際、cDNA配列決定が最初 に提案されたとき、その方法はゲノミック配列決定に携わる人々から厳しく非難 された。例えば、合衆国のヒトゲノム計画の指導者はcDNA配列決定は価値がない として度外視し、この計画に資金を出すことを拒否した。 この開示において、発明者らはcDNAライブラリーを含んだDNAの解析方法を教 示する。この方法で解析と研究を行なえば、個々の遺伝子産物を、その遺伝子の み の発現に関する「ピクセル」情報として眺められる。発明者らは、本明細書にお いて、遺伝子の発現情報の「ピクセル」を一個の遺伝子転写産物の「イメージ」 に作成する方法を説明するが、この「イメージ」において、それぞれの遺伝子が 同時に可視化され、遺伝子ピクセル間の関係を容易に可視化して理解させること ができる。 さらに、発明者らは、電子サブトラクションと名付けられた新しい方法を教示 する。電子的サブトラクションによって、遺伝子研究者は一個のイメージを、細 胞や組織全体のレベルでの、一過的な、または動的な遺伝子発現を表す動画に変 えることができる。細胞ないし器官規模で細胞装置が「動く」というところが、 ここにおける新奇の発明部分である。これによって、生きた細胞の生理作用に対 する新しい見方ができるようになり、医学上の治療法や診断法を明らかにし、発 見するためにも非常に有望である。 発明者らは、さまざまな細胞型や組織型に渡って一個の遺伝子の発現を検出す る、「電子ノーザン」と名付けられた、別の方法についても説明する。 核酸(DNAおよびRNA)は、その配列の中に遺伝的情報を持つため、生物の主要 な分子である。核酸は、細菌や菌類、ウイルス、植物、動物すべての生物の中に 見られる。さまざまな条件や処理や状況の下に置いた間、異なった細胞や組織、 生物にそれぞれ存在する核酸の相対的な存在量を測定するのは興味深い。 ヒトの体の中で分裂する細胞はすべて23組の染色体をもつ。これらの常染色体 および性染色体は、約100,000個の遺伝子をコードしていると見積もられている 。異なった細胞型の間の違いは、この約100,000個の遺伝子の発現の違いを反映 していると考えられている。異なった細胞において、どの遺伝子が転写され、転 写産物量が相対的に多いかが分かれば、生物学の基本的な問題に答えられるかも しれない。 以前には、PCRやノーザンブロット分析、または、インサイチューハイブリダ イゼーションなどの別のタイプのDNAプローブを用いた解析のような、標準的な 分子生物学的技術によって、一度に数個の遺伝子を解析する技術しかなかった。 これらの方法いずれによっても、既知の遺伝子の転写産物だけか、および/また は、少数の遺伝子の転写産物しか一度に解析できない。Nucl.Acids.Res.19,70 97-7 104(1991);Nucl.Acids.Res.18,4833-42(1990);Nucl.Acids.Res.18,278 9-92(1989);European J.Neuroscience 2,1063-1073(1990);Analytical Biochem.187,364-73(1990);Genet.Annals Techn.Appl.7,64-70(1990 );GATA 8(4),129-33(1991);Proc.Natl.Acad.Sci.USA 85,1696-170 0(1988);Nucl.Acids.Res.19,1954(1991);Proc.Natl.Acad.Sci.US A 88,1943-47(1991);Nucl.Acids.Res.19,6123-27(1991);Proc.Natl .Acad.Sci.USA 85,5738-42(1988);Nucl.Acids.Res.16,10937(1988 )。 細胞の活性化や分化、加齢、ウイルスによる形質転換、形態形成または有糸分 裂のような、細胞が変化する過程において、問題となる変化の前後で転写が誘導 されるか抑制される遺伝子の数やタイプに関する研究が、さまざまな方法を用い て長年行われてきた。初期の方法の一つは、細胞や組織、器官系または生物の中 にある蛋白質を分離して、プロセスの前後両方でそのレベルを解析するという方 法であった。一つのサンプルの中の多数の蛋白質を解析する方法の一つは、二次 元ゲル電気泳動を用いる方法で、原則として、蛋白質を一個のバンドにして同定 、定量が行われ、最後には個別のシグナルに変えられる。今のところ、二次元解 析では蛋白質のおよそ15%しか分離できない。分離されたバンドを詳しく解析す るためには、それぞれのバンドを膜から切り出して、エドモン分解を用いてアミ ノ酸配列解析を行わなければならない。残念ながら、ほとんどのバンドは、信頼 性のある配列を得るには量が足りず、また、バンドの多くは一個以上の蛋白質を 含んでいる。さらに難しいのは、多くの蛋白質がアミノ末端をブロックされてい るために、配列決定方法が一層煩雑になる。 遺伝子の転写レベルでの差異を解 析すれば、組み換えDNA技術によって、非常に少量の物質しか含まれないシグナ ルでも増幅できるために、これらの不利益や欠点を克服できる。「ハイブリダイ ゼーション・サブトラクション」と呼ばれる最も一般的な方法は、問題となる発 生過程の前(B)と後(A)の生物試料からmRNAを分離して、一方のmRNAセット からcDNAに転写させ、ハイブリダイゼーションによって試料Aから試料Bを(mR NAからcDNAを)取り除き、ハイブリダイズしなかったmRNAからcDNAライブラリー を作製することを含む方法である。多くの異なったグループがこのやり方を用い て成 功しており、基本的にはこれと同じやり方を用いるさまざまな方法が出版され、 改良されてきた。。Nucl.Acids.Res.19,7097-7104(1991);Nucl.Acids.Res .18,4833-42(1990);Nucl.Acids.Res.18,2789-92(1989);European J. Neuroscience 2,1063-1073(1990);Analytical Biochem.187,364-73(1990 );Genet.Annals Techn.Appl.7,64-70(1990);GATA 8(4),129-33(19 91):Proc.Natl.Acad.Sci.USA 85,1696-1700(1988);Nucl.Acids.Res .19,1954(1991);Proc.Natl.Acad.Sci.USA 88,1943-47(1991);Nucl .Acids.Res.19,6123-27(1991);Proc.Natl.Acad.Sci.USA 85,5738-4 2(1988);Nucl.Acids.Res.16,10937(1988)。 これらのテクニックにはそれぞれ長所と短所があるが、さらにいくつかの限界 と不都合な面がある。まず、このようなライブラリーを作製するには、かなりの 時間と努力が必要とされる。典型的には、熟練した分子生物学者であれば、この ようなライブラリーを作製して特徴を調べるのに3ヶ月から6ヶ月を必要とする だろうが、技術のレベルや経験、運の良し悪しにもよる。次に、サブトラクショ ンしてできたライブラリーは、普通、標準的な方法によって作製したライブラリ ーよりも質が落ちる。典型的な通常のcDNAライブラリーには、106個以上のクロ ーンが含まれており、インサートの平均長は1-3 kBである。これに対し、サブト ラクション・ライブラリーでは、クローン数は102か103個で、インサートの平均 長は0.2 kBである。したがって、このようなライブラリーに関しては、かなりの 数のクローンと配列情報が抜け落ちている可能性がある。3番目に、この方法で は試料Bと比較して試料Aで誘導されている遺伝子のみを捕捉できるが、逆の場 合も同じとはいえないし、別の試料(C)と比較することも容易ではない。4番 目に、この方法では非常に多量(数百マイクログラム)の「ドライバー」mRNA( 試料B)が必要になるため、多くの組織や細胞を大量に入手するのは非常に困難 であることから、可能なサブトラクションの回数とタイプはかなり制約を受ける 。 5番目に、サブトラクションの分析力は、DNA:DNAまたはRNA:DNAハイブリダイ ゼーションの物理的な性質に依存する。ある配列がハイブリダイゼーションする 相手を見つける能力は、それぞれが持つCoT値による。CoT値は、特定の配列のコ ピー数(濃度)にハイブリダイゼーションにかかる時間を乗じた関数である。同 じ配列がたくさんあればハイブリダイゼーションは速やかに起こり(CoT値は低 くなる)、少ない配列は高いCoT値で2本鎖を形成するということである。この ように少ない配列に2本鎖を形成させ、効果的に選択できるようにするCoT値に 到達するのは、利用可能な時間枠の中では難しい。従って、ハイブリダイゼーシ ョン・サブトラクション法は、少ないmRNA種の相対的レベルを調べるためのテク ニックとしては、決して有用なものではない。6番目に、この問題はさらに、2 本鎖形成が当該配列の塩基組成にも依存しているという事実によって複雑になっ ていることである。G+Cに富む配列は、A+T含量が高い配列よりも強い2本鎖を形 成する。したがって、ハイブリダイゼーション・サブトラクションでは、前者の 配列が選択的に取り除かれることになろう。7番目に、正確には一致しない配列 間でハイブリダイゼーションが起こりうるということがある。これが起きると、 目的の遺伝子の発現が相同な遺伝子の発現によって「マスク」されてしまうかも しれず、その特定の遺伝子に関する結果を人為的に歪めることになる。 松原と大久保は、cDNAの部分配列を用いて、ヒトゲノムの機能解析に用いられ 得る遺伝子の発現プロフィールを作成することを提案した。松原と大久保は、ラ ンダムプライマーを用いることに注意するよう警告している。というのは、ラン ダムプライマーは一つのmRNAから複数の異なったDNA断片を作出するため、ライ ブラリー当たりの各mRNAの数量の解析が歪められるかもしれないからである。彼 らは、任意に選んだcDNAを3'方向から配列決定して、さまざまなESTの出現頻度 を明らかにした。彼らは、遺伝子を分類するために、さまざまな細胞型から得た ESTのリストを比較することを提案した。遺伝子の全長の配列も、遺伝子産物の 生物学的活性も分かっていないが、多くの異なった細胞型で発現する遺伝子をハ ウスキーパーに分類し、ある細胞で選択的に発現する遺伝子を細胞特異的遺伝子 として分類した。 本発明では、各RNAおよび/またはそれに対応するcDNAの高速処理配列特異的 解析を用いる、生物試料の中の複数の遺伝子転写産物の相対的な存在量を定量す る方法を提供することによって、以前の技術の欠点を避けている。 本発明には、生物学的効果に基づいて各蛋白質を分離しようとする、最近の蛋 白質発見法に対していくつかの利点がある。本発明の方法は、各転写産物の発現 におけるざまざまな変化を示す細胞プロフィールの詳細な診断のための比較に備 えてある。 本発明は、少量のメッセージが同定できるだけでなく、メッセージ量の増減も 確認できる、より複雑になったライブラリー解析法(103に較べて106から107個 のクローン)を含む、最近のサブトラクション法に対していくつかの利点を提供 する。これらの大規模なライブラリーは、以前の方法でライブラリーを作るのと は違って、定型的な操作で作製することができる。さらに、本発明の方法で、相 同体を区別することができる。 この方法は、大量のデータを分かり易く、要約可能な書式にまとめるため、非 常に便利である。最も重要な違いは、電子的サブトラクションにある。より便利 に徹底的な解析が行われる。 本発明は、従来のcDNAの電子的解析法に対して、いくつかの利点を提供する。 この方法は、100以上の、好ましくは1,000以上の遺伝子の転写産物を解析すると きに特に威力を持つ。このような場合、新しく低頻度の転写産物を発見して、組 織別にタイプ分けする。 遺伝子発現の詳細な解析は、そのまま診断プロフィールとして用いられたり、 より古典的な診断法を展開するために病気に特異的な遺伝子を同定するために用 いることができる。 この方法を遺伝子転写産物頻度分析と定義する。その結果得られる遺伝子転写 産物の量的解析を遺伝子転写産物の比較解析と定義する。 3.発明の概要 本発明は、遺伝子の転写産物を含む試料を解析する方法で、以下の過程を含む 方法である。(a)生物学的配列のライブラリーを作製すること;(b)転写産物 の配列セットで、当該セット中の各転写物の配列が、ライブラリーの生物学的配 列を表すような配列のセットを作製すること;(c)同定配列値を各転写産物配 列ごとに作成するために、この生物学的配列をプログラムされたコンピューター (照合配列を示してくれる参照用転写物配列のデータベースを保存している)で 処理すること、ここで同定配列値とは、配列に対する注釈およびライブラリーの 生物学的配列と参照配列の一つ以上が一致する度合いを示している;(d)ライ ブラリーの中にそれぞれの同定配列値が何回表れたかを示す最終的なデータ値を 作成するために、この同定配列値を処理すること。 また、本発明は、遺伝子の転写産物を含む2つの試料を比較する方法を含む。 最初の試料は上記のように処理する。二番目の試料は、生物学的配列の第二のラ イブラリーを作成するために用いるが、このライブラリーは二つ目の転写物の配 列セットを得るために用いられる。第二の配列セット中の各転写産物の配列は、 第二ライブラリーの生物学的配列を示すものである。次に、第二セットの同定配 列値、すなわち後続同定配列値を出すために、プログラムされたコンピューター で、第二セット中の転写産物の配列を処理する。これらの値はそれぞれ、配列に 対する注釈を表し、第二のライブラリー中の生物学的配列の一つと、参照配列の 一つ以上の配列と一致する度合いを含む。第二のライブラリーの中にそれぞれの 後続同定配列値が何回表れたかを示す後続最終データ値を作成するために、後続 同定配列値を処理する。最初の試料からの最終データ値と第二の試料からの後続 同定配列値を、転写産物の配列の比率を出すために処理すると、これが二つの試 料の遺伝子転写産物の数量における違いを示すことになる。 これに続く態様において、この方法は、(a)生物試料からmRNA転写物の集団 を分離し、(b)配列特異的な方法でmRNAに転写された遺伝子を同定し、(c)こ れらの遺伝子それぞれに対応するmRNA転写産物の数を測定し、また、(d)mRNA 転写産物集団の中でのmRNA転写産物の相対量を測定するために、このmRNA転写産 物数を用いて、生物試料中のmRNAの相対的な数量を定量する方法を含む。 また、開示されるものには、まずmRNAの混合物を得て、それのcDNAコピーを作 って、遺伝子転写産物のイメージ解析を作成する方法がある。cDNAは適当なベク ターに挿入して、適当な宿主菌株細胞を形質転換してプレートに撒きクローン化 すると、それぞれのクローンは一個のmRNAに相当する。cDNAで形質転換されたク ローンの標本集団を分離する。集団中の各クローンを、一個のmRNAに転写された 遺伝子を同定する、配列特異的な方法によって同定する。それぞれの遺伝子が、 何回クローンを同定したかで、遺伝子転写産物の量を見積もる。遺伝子とその量 を多いもの順に一覧表にして遺伝子転写産物図を作成する。 これに続く態様において、ある細胞型もしくは組織における遺伝子の転写産物 の相対的な存在量を、第二の細胞型や組織における遺伝子の転写産物数の相対的 な存在量と比較して、差異や類似性を同定する。 さらに次の態様において、該方法は、生物学的配列のライブラリーを解析する ためのシステムを含む。これには転写産物の配列セットを受け取るための方法が 含まれるが、ここでそれぞれの転写産物の配列は、ライブラリー中の異なった生 物学的配列を示している。また、転写産物の配列を、参照配列を示す参照用転写 産物配列データベースを保存しているコンピューターシステムで処理するための 方法を含む。このとき、該コンピューターには、それぞれの転写産物配列につい て同定配列値を作成するためのソフトウエアがプログラムしてある。ここで、各 同定配列値は、配列の説明と、ライブラリーの異なる生物学的配列の一つが、参 照配列の少なくとも一つとどの程度一致しているかを示すものである。また、ラ イブラリーの中にそれぞれの同定配列値が何回示されたかを示す最終値を作成す るために、該同定配列値を処理するためのソフトウエアがプログラムしてある。 要するに、本発明は、生物試料中の遺伝子転写産物の相対的な存在量を定量す るための方法とシステムである。本発明は、2個の生物試料の違いを明らかにし 、2個の試料で異なって発現する一つまたはそれ以上の遺伝子を同定するために 、2個以上の異なった生物試料からの遺伝子の転写産物のイメージを比較する方 法を提供する。したがって、この遺伝子転写産物のイメージとその比較は、診断 法として用いることができる。本方法の一つの態様は、多数のRNAないしそれに 相当するcDNAを高速処理で配列特異的に解析する、すなわち、遺伝子転写産物イ メージを作出する。本方法の別の態様は、高速処理cDNA配列解析を用いて、遺伝 子転写産物のイメージ化解析を作出する。さらに、二つもしくはそれ以上の遺伝 子転写産物のイメージを比較して、一定の細胞ないし細胞集団における遺伝子転 写産物の相対量と相関する、生物の特別な状態、病気または条件を検出ないし診 断するために用いることができる。 4.表および図面の説明 4.1. 表1は、表2-5で使用される文字コードの詳細な解説である。 表2では、もっとも普遍的な遺伝子転写産物を100個列挙した。これは、下で 述べるようにして調製、配列決定した、HUVEC cDNAライブラリーから単離した配 列のリストの一部である。左側の列は、この表で配列の数量が多いものの順序を 示す。「数」と表示した次の列は、「エントリー」列番号の配列と一致した、最 初のHUVECの配列同定参照用のクローン数である。シークエンスされていない単 離クローンは、表2に載せていない。「N」と表示した次の列は、「エントリー 」列参照用転写産物の配列に、同程度に一致したcDNAの総数を示す。 「エントリー」と表示した列には、NIH GENBANKのローカス名を入れてあり、 ライブラリーの配列番号に相当する。「s」列では、いくつかの欄に参照配列が 由来する生物種が示されている。「s」列の略号を表1に示す。「説明」と表示 した列には、「エントリー」列中のNIH GENBANKのローカス名に当たる配列がど のようなものかの簡潔な説明が書かれている。 表3は、正常な単球と活性マクロファージ細胞において、最も多く見られる遺 伝子転写産物の上位15個を比較したものである。 表4は、THP-1とヒトのマクロファージのcDNA配列を比較したライブラリー・ サブトラクション解析の詳細な要約である。表4では、表2と同じ略号が用いら れている。追加された列は、「bgfreq」(サブトラクトするライブラリーにおけ る数)、「rfend」(標的ライブラリーにおける数)、および、「ratio」(標的 ライブラリーにおける数をサブトラクトするライブラリーにおける数で割ったも の)である。表を詳しく見ると明らかなように、サブトラクトするライブラリー における数が「0」であると、0.05で標的ライブラリーにおける数を割っている 。これは、結果を得るための方法で(0で割算するのは不可能)、サブトラクト するライブラリーにおける数が1のときと区別するためである。 表5は、遺伝子転写産物のサブトラクション・プロフィールを作成するための コンピュータープログラムで、原始コードで書かれている。 表6は、本発明で提供される電子的ノーザンブロット分析で用いられるデータ ベースのエントリーの一覧表の一部である。 4.2.図面の簡単な説明 図1は、配列の作成および解析をする、ライブラリーの構築部分に関して、収 集し保存したデータをまとめた図である。 図2は、本発明の方法の好ましい態様に分類される、「数量検索」ソフトウエ アによって行われる一連の操作を表した図である。 図3は、本発明にかかるシステムの好ましい態様のブロック図である。 図4は、新しい配列(既に配列決定されたが、同定されていない配列)から、 転写産物のイメージ解析およびデータベースへの書き込みまでの生物学的情報処 理過程をさらに詳しく示したブロック図である。 5.発明の詳細な説明 この発明は、個々のRNAまたはそれに相当するcDNA(またはその他の生物学的 配列を表すデータ)の配列特異的な高速処理解析法を用いて、異なった生物試料 における遺伝子転写産物の相対量を比較する方法を提供する。本明細書において 、この処理法を、遺伝子転写産物のイメージ化ということにする。一セットの遺 伝子転写産物について相対的数量を量的に解析することを、本明細書においては 「遺伝子転写産物イメージ解析」または「遺伝子転写産物頻度解析」と呼ぶ。本 発明によっては、あらゆるタイプの生物に由来するあらゆる細胞や組織の集団に 存在する遺伝子転写産物に関するプロフィールを得ることができる。本発明は、 単一の細胞(または単一細胞のクローン)からなる試料や、多数の細胞からなる 試料、または、単一細胞よりも複雑な組織で、肝臓のように多数の細胞型を含む 組織からなる試料のプロフィールを得るためにも利用できる。 本発明は、いくつか例を挙げれば、診断学、毒物学および薬理学の分野におい て明らかに利用価値がある。診断が下されていない患者に対し、高度に洗練され た診断のための検査を行うことができる。患者の体液か組織を含む生物試料を入 手して、遺伝子転写産物を分離し、その実体を判定できるところまで展開する。 場合によっては、遺伝子転写産物をcDNAに変換することもできる。遺伝子転写産 物をサンプリングしたものは、配列特異的解析を行い、定量する。これらの遺伝 子転写産物配列の存在量を、病気の患者と健康な患者に関する標準的なデータセ ットを含む参照データベース中の配列数量と比較する。該患者は、その患者のデ ータセットが最も相関する病気に罹っている。 例えば、遺伝子転写産物頻度分析は、表3で正常な単球と活性マクロファージ の間の差異が顕著に示されているように、病気の細胞もしくは組織から、正常な 細胞もしくは組織を区別するために用いることができる。 毒物学においては、どんな検定法が、毒物効果を予測したり、検定したりする ために最も有効であるかが基本的な問題である。遺伝子転写産物のイメージング 化は、従来の、あまり詳細でないスクリーニング法では明らかにならないことも ある、細胞と組織環境に関する情報について、非常に詳細な情報を提供する。遺 伝子転写産物イメージは、薬剤の毒性と効果を予測するより強力な方法である。 この方法を薬理学で用いても同様の利点がある。例えば、毒素を解毒する酵素の ように、効果があると思われる蛋白質の範疇を選択的に眺めるために、遺伝子転 写産物イメージを用いることもできる。 別の態様において、抗癌因子に応答する癌細胞と応答しない癌細胞の間の差異 を見るために、遺伝子転写産物頻度比較解析を用いる。抗癌因子の例は、タモキ シフェン、ビンクリスチン、ビンブラスチン、ポドフィロトキシン、エトポシド 、テニスポシド、シスプラチン、生物学的応答変更因子、例えば、インターフェ ロン、11-2、GM-CSF、酵素、ホルモンなどである。また、この方法は、機能的な 分類によって、遺伝子転写産物を検索する方法を提供する。癌細胞の場合、転写 因子やその他の重要な制御分子は、異なったライブラリーを解析するために、非 常に重要な分類群である。 さらにもう一つの態様において、比較遺伝子転写産物の頻度解析が、対照の肝 細胞と、FIAUのような実験薬物で処置した患者から単離した肝細胞とを区別する ために用いられる。FIAUは、根本的な疾患により引き起こされた病理と薬物によ り引き起こされた病理とを区別するために処置する。 さらに別の態様において、遺伝子転写産物頻度比較解析法を、リチウム処理し た患者と処理しない患者からの脳組織の差異を見るために用いる。 さらに別の態様において、サイクロスポリンおよびFK506処理した細胞と正常 細胞の差異を見るために、遺伝子転写産物頻度比較解析法を用いる。 さらに別の態様において、ウイルス感染した(HIV感染を含む)ヒト細胞と非 感染のヒト細胞の差異を見るために、遺伝子転写産物頻度比較解析法を用いる。 遺伝子転写産物の頻度解析は、また最近では、HIV-抵抗性の細胞、HIVに感染し た細 胞またはHIV感受性の細胞における遺伝子転写産物を速やかに探し出すために用 いられる。遺伝子転写産物の数量の比較は、処理の成功を示し、および/または 、新しい研究方法を示唆する。 さらに別の態様において、健康な人とさまざまな病気をもつ患者の気管支洗浄 液の違いをみるために、遺伝子転写産物頻度比較解析法を用いる。 さらに別の態様において、細胞、植物、微生物、および動物などの突然変異体 とその野生種との違いをみるために、遺伝子転写産物頻度比較解析法を用いる。 さらに、転写産物数量プログラムを調整して、研究者が多くの異なった組織にお いて転写や遺伝子を評価できるようにすることができる。このような比較によっ て、遺伝子産物を産生しない欠失変異体や、少量のmRNAや異なったmRNAを産生す る点突然変異体を同定することができる。このような変異体は、無機栄養物摂取 や代謝に作用などの基本的な生化学作用または薬理学的作用に影響を受けるため 、当業者に周知の方法で単離することはできる。したがって、収量が高い作物や 病害抵抗性、その他の遺伝因子を展開することができる。 さらに別の態様において、遺伝子転写産物頻度比較解析法を、よりよい薬理学 上のモデル動物を選抜するための種間比較分析に用いることができる。この態様 において、人および他の動物(例えば、ネズミ)、または培養細胞を特定の検定 用薬剤で処理する。それぞれのcDNA集団中の配列の相対量を測定する。よい動物 モデルを用いた動物実験システムであれば、該動物のcDNA集団で発現する遺伝子 が、ヒト細胞におけるものと同じように変化する。もし、該薬剤に副作用が検出 されれば、遺伝子転写産物の変化を調べるために転写産物量解析を行なってみる 。そして、基礎的な生理状態の変化を比較して、このモデルを評価する。 さらに別の態様において、遺伝子転写産物頻度比較解析法を、患者の細胞や組 織(例えば、血液サンプル)の遺伝子転写産物プロフィールを非常に詳しく得る ための臨床の装置に用いる。特に、疾病状態または条件での遺伝子発現プロフィ ールを詳しく解析するために遺伝子転写産物頻度分析を利用する。 好ましい態様において、この方法は、目的の特定の転写産物を同定するために 、高速処理cDNA配列決定を利用する。作成されたcDNA配列と、それから導き出さ れたアミノ酸配列を、後述するGENBANKその他の配列データバンクの配列と幅広 く比 較する。この方法は、現在行われている、特定の生物学的条件に関連する個々の 蛋白質を同定する二次元ゲル法による蛋白質発見法に対していくつかの利点があ る。ここで活性化細胞と不活性細胞のプロフィールを詳しく比較すると、各転写 産物の発現に多くの変化が見られる。各配列が「完全に」一致するか、類似する か、一致しないかを判定してから、データベースに登録する。次に、各遺伝子に 相当するcDNAのコピー数を表にする。この作業は、すべてのエントリーをプリン トアウトしたものから人手で行なうため、時間がかかり、手間がかかるが、この 情報を表にするときは、コンピューターが役に立ち、速い。cDNAのコピー数(場 合によっては、データ一組中の全配列数で割った数)は、それぞれの遺伝子に対 応する転写産物の相対量で図に示される。そして、表示された遺伝子のリストを cDNA集団中で多いもの順に並べ換える。さらに多くの比較型や範囲のタイプが可 能で、後に例示する。 遺伝子転写産物イメージを作成する別の方法には、検査用mRNAの混合物を入手 する段階と、検査用mRNAと少なくともいくつか相補的な配列をもつ独自のプロー ブを表示して並べて提供する段階が含まれる。次に、一定量の検査用mRNAを並べ たプローブに加える。検査用mRNAとプローブを、これらがハイブリッド形成する のに十分な時間インキュベートする。mRNAとプローブのハイブリッド形成を検出 して定量する。プローブの配置から、ハイブリッド形成した配列を同定する。集 団数を出すために、各ハイブリッドの量を合計する。各ハイブリッドの量を集団 数で割ると、遺伝子転写産物イメージ解析と名付けられた相対量データのセット を提供する。 6.実施例 下記の実施例は、本発明を例示するために提供される。これらの実施例は例示 のために提示するものであって、発明の範囲を限定するものではない。 6.1. 組織の供給源と細胞系 本請求の範囲に含まれるコンピュータープログラムによる解析のための生物の 配列は、実質的にどの生物資源から得てもよい。最も使われるのは人体から得た ものである。組織は、あらゆる人体の器官から得ることができ、供給者が何歳で あっても、どんな異常があってもよい。また、あらゆる不死化細胞から得ること もできる。細胞型が均一であるため、いくつかの場合において、不死化した細胞 系の方が好ましいであろう。他の組織サンプルには、必ず細胞型が混在している 。単一の細胞を採取する技術を利用することも可能であるし(例えば、脳細胞) 、また、開示されている(米国特許第5,021,335号および5,168,038号、これらは 本明細書に参照として含まれる。)技術と解析法によって配列決定するために十 分なcDNAを増加させるために細胞装置を利用できる。本明細書で挙げた実施例は 、以下の不死化した細胞系を利用したものである。すなわち、単球様U-937細胞 、活性化マクロファージ様THP-1細胞、誘導された脈管内皮細胞(HUVEC細胞)、 および肥満細胞様HMC-1細胞を用いた。 U-937細胞系は、単球的性質をもつヒト細網肉腫細胞系であり、散在性細網肉 腫を患う患者の胸膜滲出液から採取した悪性細胞から確立した(Sundstrom,C. and Nilsson,K.(1976)Int.J.Cancer 17:565)。U-937は、組織球の形態、 細胞化学、表面レセプターおよび単球的性質をもつ数少ないヒトの細胞系の一つ である。これらの細胞は、誘導を受けると最終的な単球分化を行い、ヒトの混合 リンパ球培養液の上清で活性化すると、新しい細胞表面分子を発現する。このよ うな形のインビトロの活性化を受けると、細胞は、形態的および機能的な変化を 起こすが、この変化には、赤血球や腫瘍標的細胞(マクロファージの主要な機能 の一つ)に対する抗体依存的細胞毒性(ADCC)の増加が含まれる。インビトロで ホルボール12-ミリステート13-アセテート(PMA)によってU-937を活性化すると 、強力な炎症のメディエーターであるプロスタグランジンもしくはリューコトリ エンス、血小板活性因子(PAF)を含むいくつかの化合物の産生が促進される。 このように、U-937は、正常な単球に関係する遺伝子転写産物を同定して、分離 するのに適した細胞系である。 HUVEC細胞系は、正常で、均一で、よく性質が分かっている、ヒトの臍静脈か ら採った早期継代の内皮細胞培養である(セルシステム社、12815 NE 124番街、 カークランド、ワシントン州98034)。誘導ないし処理されたHUVEC細胞からの遺 伝子転写産物のみを配列決定した。1×108個の細胞の一つのバッチを、回収す る前に、1U/mlのrIL-1bおよび100 ng/mlの大腸菌のリポポリサッカライド(LPS )内毒素で5時間処理した。2×108個の細胞の別のバッチを、回収する前、集 密状態 にあるときに4U/mlのTNFおよび2U/mlのインターフェロン-ガンマ(IFN-γ)で 処理した。 THP-1は、顕著に単球の性質をもつヒト白血病細胞系である。この細胞系は、 急性単球性白血病に罹った1歳の男の子の血液に由来する(Tsuchiya,S.et al .(1980)Int.J.Cancer: 171-76)。細胞系の単球性を判定するために、次の 細胞学的および細胞化学的基準が用いられる。すなわち、1)フッ化ナトリウム によって阻害されるα-ナフチル酪酸エステラーゼ活性の存在、2)リゾチームの 産生、3)ラテックス粒子と感作SRBC(ヒツジの赤血球細胞)の貪食作用、4)マ イトマイシンC処理THP-1細胞の、ConA(コンカナバリンA)処理後のT型リンパ球 活性化能力。形態的には、アズール小顆粒をもつ細胞質と核は、窪みができ、深 く折れ曲がって、不規則な形状になる。この細胞系には、おそらく貪食作用にお いて機能するFcとC3bレセプターがある。腫瘍プロモーターである12-O-テトラデ カノイルホルボール-13アセテート(TPA)で処理したTHP-1細胞は、増殖を停止 して、いくつかの点において単球由来の本来のマクロファージを模倣するマクロ ファージ様細胞に分化する。形態学的には、細胞が形態を変えるにつれて、核は より不定形になり、さらに食作用をもつ液胞が細胞質に出現する。分化したTHP- 1細胞は、また、組織培養用プラスチックへの接着性を増す。 HMC-1細胞(ヒト肥満細胞系)は、肥満細胞性白血病のメーオー病院の患者の 末梢血液から確立された(Leukemia Res.(1988)12:345-55)。培養細胞は、 クローン化された未成熟のマウスの肥満細胞に似ており、ヒスタミンを含み、ク ロロアセテートエステラーゼやアミノカプロン酸エステラーゼ、好酸球主要塩基 性蛋白質(MBP)およびトリプターゼに対する染色で染まる。しかしHMC-1細胞は 、正常なIgEレセプターを合成する能力を失っている。また、HMC-1細胞には、10 ;16の転座があり、これは、患者から最初に白血球泳動によって採取した細胞に あったので、培養によって起きた人為的産物ではない。このように、HMC-1細胞 は、肥満細胞のよいモデルである。 6.2.cDNAライブラリーの構築 ライブラリー間の比較を行うためには、同様の方法でライブラリーを調製しな ければならない。調整をとるためには、特定のパラメーターが特に重要である。 そのようなパラメーターの一つは、mRNAの分離法である。比較するライブラリー からは同じ条件を用いて、DNAとヘテロ核RNAを除去することが重要である。cDNA のサイズ分画は、注意深く調整する必要がある。比較すべきライブラリーを調製 するためには、同じベクターを用いることが好ましい。最低限、適正な比較を保 証するために、同じタイプのベクター(例えば、単一方向性のベクター)を用い るべきである。結果をより簡単に分析するためには、単一方向性のベクターの方 が好ましい。 cDNAを得たときに、mRNA転写産物一分子あたり一種だけのクローンを得るため には、オリゴdT一方向性プライマーのみをプライマーとして用いるのが好ましい 。しかし、遺伝子の発見が目的でもあるときには、オリゴdTとランダムプライマ ーを混合したプライマーによってより多様な配列を得ることができるため、その ような混合プライマーを用いることにも長所があると認められる。同様の効果を 、DR2(クローンテック社)およびHXLOX(USバイオケミカル社)によって得るこ とができ、また、インビトトジェン社やノバジェン社のベクターを用いてもよい 。これらのベクターには、2つの必要条件がある。まず第一に、T3やM13リバー スプライマーなどの市販のプライマーに対する結合部位があること。第二にベク ターに10 kBまでの断片が挿入できなければならない。 クローンをランダムにサンプリングすることと、有意な規模のクローン集団を 用いることが重要である。データは5,000クローンからなるが、もし非常に少な い遺伝子を採ったり、および/またはその相対量を決めるのであれば、一つのラ イブラリーから100,000個のクローンをサンプリングする必要がある。cDNAのサ イズ分画も注意深く制御して行わなければならない。または、クローンの代わり にプラークを選抜してもよい。 以下に開示される、ストラタジーン社のUni-ZAPTMベクターシステムの他に、 他の同様の一方向性ベクターを用いることもできると考えられる。例えば、DR2 (クローンテック社)やHXLOX(USバイオケミカル社)のようなベクターが含ま れるが、それらに限定されるわけではない。 好ましくは、ライブラリーを構築する詳細な情報(図1に示してあるような) を収集してデータベースに保存し、比較されるべき配列に関して、後に検索でき る ようにする。図1は、ライブラリーの共同製作者もしくは細胞もしくはcDNA供給 者、事前処理、生物資源、培養、mRNA調製およびcDNA構築に関する重要な情報を 示している。同様に、他の段階に関する詳しい情報も、徹底的に配列とライブラ リーを分析する上で役に立つ。 細胞および組織からRNAを抽出して、次にcDNAライブラリーを作製する。当業 者に周知の技術によってcDNAライブラリーを作製することができる(例えば、Ma niatis,T.etal.(1982)Molecular Cloning,Cold Spring Harbor Laborator y,New York)を参照のこと。cDNAライブラリーは購入することもできる。U-937 cDNAライブラリー(カタログ番号937207)は、92037カリフォルニア州ラホヤM. トリーパインズ通り11099のストラタジーン社から購入した。 THP-1 cDNAライブラリーは、注文によりストラタジーン社が、THP-1細胞を、1 00 nMのTPAを入れて48時間培養し、1μg/ml LPSを入れて4時間培養したものか ら作製した。ヒト肥満細胞HMC-1ライブラリーも、ストラタジーン社が培養HMC-1 細胞から注文によって作製した。HUVEC cDNAライブラリーは、ストラタジーン社 が、別々に処理して誘導したHUVEC細胞の2つのバッチから注文作製した。 要するに、すべてライブラリーは、同じように作製した。まず、ポリ(A+)RN A(mRNA)を精製した。U-937とHMC-1 RNAについては、オリゴdTだけをプライマ ーにしてcDNA合成した。THP-1とHUVEC RNAについては、オリゴdTとランダムヘキ サマーをプライマーにして別々にcDNA合成し、2つのcDNAライブラリーを別々に 処理した。合成アダプターであるオリゴヌクレオチドをcDNAの末端に付けて、高 効率の単一方向性(センス鎖方向)ラムダライブラリーを構築でき、cDNA挿入断 片を検出するためのブルー-ホワイトコロニー選抜を利用できるUni-ZAPTMベクタ ーシステム(ストラタジーン社)に挿入できるようにした。最後に、同数のバク テリオファージを混ぜて、2つのライブラリーをまとめて一つのライブラリーに した。 このライブラリーはDNAプローブまたは抗体プローブを用いてスクリーニング し、pBluescriptファージミド(ストラタジーン社)を直ちにインビボで切り出 すことができる。ファージミドは、挿入断片の特徴付け、配列決定、部位特異的 突然変異誘発、一方向的デリーションおよび融合蛋白質の発現などが容易に行え る。プ ラスミドシステムの利用を可能にする注文製作ライブラリーのファージ粒子を大 腸菌の宿主菌株であるXL1-Blue(ストラタジーン社)に感染させてたが、この菌 株は高い形質転換効率を持つため、cDNAライブラリーで稀で、少ししか表れない クローンを得る可能性を高める。 6.3. cDNAクローンの単離 ファージミドの形になった各cDNAクローンをインビボの切り出しによって得た が、この切り出しは、宿主菌株にラムダライブラリーファージとf1ヘルパーファ ージを共感染させて行なった。ライブラリーを含むファージおよびヘルパーファ ージから産生される蛋白質が、ラムダDNAにニックを入れて、このラムダ標的DNA 上の区切られた配列から新しいDNA合成を開始して、pBluescriptプラスミドとcD NAインサートのDNA配列をすべて含む、小さな単鎖の環状ファージミドDNA分子を 作出する。ファージミドDNAは、細胞から分泌されるので精製して、新しい宿主 細胞に再感染させて、2本鎖ファージミドDNAを産生させた。ファージミドはベ ータ-ラクタマーゼ遺伝子をもっているため、新しく形質転換されたバクテリア をアンピシリン入り培地で選抜する。 ファージミドDNAは、Magic MiniprepsTMDNA精製システム(プロメガ社カタロ グ番号A7100。プロメガ社、ウィスコンシン州53711、マジソン、ウッドホロー通 り2800)。この少量処理法は、商標登録してあるDNA結合樹脂を用いた、菌体溶 解および精製されたファージミドDNAを即時に精製するための簡便で信頼性のあ る方法を提供する。精製用樹脂からDNAを溶出するが、これでDNA配列決定耶蘇の 他の解析用操作用に調製されている。 また、ファージミドDNAは、QIAGENDNA精製システム(キアゲン社、カリフォル ニア州91311、シャッツワース、イートン街9259)のQIAwell-8プラスミド精製シ ステムを用いて精製した。この作製工程は、3M社からのEMPORETMメンブレン技術 による複数ウエル方式のQIAGENの陰イオン交換樹脂粒子を用いた、細菌を溶解し て高度に精製されたファージミドDNAを単離するための、便利で、速く、信頼性 のある大量処理法である。既にDNA配列決定および他の解析操作用に調製された 精製用樹脂からDNAを溶出した。 これらに代わるファージミド精製法が最近利用可能になっている。Miniprep Kit(カタログ番号77468で、メリーランド州、ゲティスバーグ、オービットドラ イブ19212のアドバンスト・ジェネティック・テクノロジー社から入手可能)を 利用した方法である。このキットは、96ウエル方式で960サンプルを精製するの に十分な試薬を提供している。各キットには推奨プロトコールが提供されている ので、次の変更を除いてはこれに従った。まず、96ウエルには、カルベニシリン 25 mg/Lとグリセロール0.4%入りの無菌テリフィック培地を1mlだけ入れた。ウ エルを摂取した後菌体をウエルに接種して24時間インキュベートした後、60μl の溶解用バッファーで菌体を溶解した。最初のフィルタープレートにブロックの 内容物を加える前に、遠心分離(2900 rpmで5分間)の段階を行なった。TRISバ ッファーにイソプロパノールを加えるという任意の段階は常法としては行わなか った。プロトコールの最後の段階を終えた後、保存のためにベックマンの96ウエ ルブロックに移した。 もう一つの新しいDNA精製システムは、WIZARDTM作製ラインで、プロメガ社( カタログ番号A7071)から入手可能で96ウエル方式にも調整可能であろう。 6.4. cDNAクローンの配列決定 U-937ライブラリーとTHP-1ライブラリーからランダムに単離したcDNA挿入配列 を一部配列決定した。DNA配列決定法は、当業者によく知られている。従来の酵 素法は、目的のDNAの鋳型にアニールしたオリゴヌクレオチドプライマーからDNA 鎖を伸長させるために、DNAポリメラーゼのクレノウ断片やシーケナーゼ(Seque naseTM)、Taqポリメラーゼを用いる。一本鎖の鋳型でも二本鎖の鋳型でも利用 できる方法が開発されてきた。チェーンターミネイション反応による産物は、通 常、尿素アクリルアミドゲルで電気泳動して、オートラジオグラフィー(放射核 種標識前駆物質用)もしくは、蛍光発色(蛍光標識前駆物質用)のよって検出す る。最近では、機械化された蛍光検出法を用いた方法での反応物調製や配列決定 、解析法が改善されたために、一日当たりの配列決定数を大きく伸ばすことがで きる(例えば、Applied Biosystems 373および377 DNAシークエンサー、Catalys t 800)。今のところ、上記の方法によれば、読める長さは250塩基から400塩基 であるが、これはクローンによる。読める長さはまた、ゲルを泳動する時間にも よる。一般的には、泳動する時間が短いと配列は途切れてしまう傾向がある。短 い場合 では25から50塩基あるだけで配列の同定と相同性の程度を確認することができる 。遺伝子転写産物イメージングを、ハイブリダイゼーション、大量分光法、キャ ピラリー電気泳動または505ゲル電気泳動などを含むどのような配列特異的方法 にも用いることができる。 6.5. cDNAクローンおよび導き出された蛋白質の相同性検索(およびそれに続 く段階) cDNAクローンに由来する塩基配列を照合配列(配列リストの配列)にして、以 前に同定された配列を含むデータベースを、相同(類似)の部分に関して検索す る。このようなデータベースの例として、GenBankやEMBLがある。次に、利用で きる二つの相同性検索アルゴリズムの例を説明してから、それに続いて、本発明 の好ましい態様に従って行われる、コンピューターを用いた段階を説明する。 本発明におけるコンピューターを用いた過程に関する以上の説明において、「 ライブラリー」という語は一連の(または一群の)生物試料の核酸の配列を意味 する。「ライブラリー」は、cDNA配列およびRNA配列などからなり、、生物試料 を特徴づける。生物試料は、ヒトの単一の細胞型の細胞(または上記の試料タイ プのいずれか)から成る。ライブラリー中の配列は、生物試料を正確に反映する か、それを特徴付けるために決定されると、発明者らは考える(例えば、一個の ヒト細胞から取ったRNAクローンからのcDNA配列を表すものから成っている)。 コンピューターを用いた、本発明の段階に関する以下の説明において、「デー タベース」という表現は、収集された配列を表す、一連の保存データで、同時に 参照用の生物的参照材料の収集物を表すものでもある。例えば、データベースに は、たくさんの蓄積されたcDNA配列を表すデータが含まれているが、これらは同 時に、さまざまなウイルスに感染したヒト細胞やさまざまな年齢のヒトの細胞、 他の哺乳動物種に由来する細胞などを表している。 好ましい態様において、本発明は、次の各段階を行うよう、ソフトウエアでプ ログラムされたコンピューターを用いる。 (a)cDNA配列(大量処理cDNA配列決定または他の方法で得たもの)のライブ ラリーを表すデータを、ライブラリー中の各配列が参照用DNA配列データベース のDNA配列に一致するか否かを判定するために処理し(もし一致していれば、配 列が 一致する、参照用データベースのエントリーを同定し、参照配列とライブラリー 配列間の一致する程度を示す)、配列に付加された注釈とライブラリー中の各配 列との一致の程度に基づいて、同定配列値を示す段階、 (b)データベースのすべてまたは一部のエントリーについて、ライブラリー の同定配列値と一致する数を作表して(この部分は、すべてのエントリーを打ち 出すところから人手で行うことは可能であるが、下に述べるコンピューターソフ トウエアを用いてこの段階を行うのことが好ましい)、これによって一連の最終 値ないし「存在量数」を作成する段階、および (c)ライブラリーのサイズが異なるときは、各同定配列値に関する相対的存 在量数(すなわち、各遺伝子転写産物の相対的数量)を出すために、それぞれの 存在量数を、ライブラリーの配列総数で割る段階。 次に、同定配列値(またはそれに対応する遺伝子)の一覧表を検索し、cDNA集 団で多いもの順に並べ替えることができる。これに加えてさまざまなタイプの比 較や特徴付けを行うことが可能である。 例えば(後にさらに詳しく述べるが)、段階(a)と(b)を二つの異なるライ ブラリーについて反復することができる(「標的」ライブラリーと「サブトラク ト」ライブラリーと呼ばれることもある)。次に、各同定配列値(または遺伝子 転写産物)について、標的ライブラリーについての(その同定配列値に関する) 存在量数を、サブトラクトライブラリーについての(その同定配列値に関する) 存在量数で割って「比率」値を求める。 実際、複数のライブラリーに対してサブトラクションを行うことができる。数 個のライブラリー(例えば、3つ)から得た転写産物を加えて、別の数個のライ ブラリー(また、例えば、3つ)からの転写産物を合わせた組で割ることもでき る。この操作の表示法として、一つの全ライブラリーを大文字で表し、(A+B+ C)/(D+E+F)などと略記してもよいであろう。場合によっては、サブトラク ションを行なう前に、全サンプル数で、合計したライブラリーの転写産物の存在 量数を割っておいてもよい。 二つのライブラリーの一回のサブトラクションしかできない通常のハイブリダ イゼーション技術とは異なり、一組または一ライブラリーの転写産物配列を処理 してコンピューターに保存しさえすれば、該ライブラリーについて何回もサブト ラクションを行うことができる。例えば、この方法によって、第一のライブラリ ー相対的数量値を第二のライブラリーの対応する値で割って、比率値を出すこと ができる。もちろんこの逆を行ってもよい。 段階(a)のバリエーションにおいて、ライブラリーはcDNAクローンに由来す るヌクレオチド配列からなる。段階(a)で相同(類似)する領域を検索できる データベースの例として、Genbank(NIH)、EMBL(ヨーロッパ分子生物学研究所 、ドイツ)およびGENESEQ(Intelligentics、カリフォルニア州マウンテンビュ ー)として知られる商業的に利用可能なデータベースが含まれる。 段階(a)を実行するために用いられる相同性検索用アルゴリズムの一つは、D . J.LipmanおよびW.R.Pearsonによる「高速で高感度な蛋白質類似性検索」、 (サイエンス、227:1435(1985))と題する論文に開示されている。このアルゴ リズムにおいては、二段階方式で相同領域を検索する。第一段階として相同スコ ア表を用いて一致スコアを計算して、最も相同性が高い領域を決定する。この段 階では、2つの配列を比較するためにずらすことができる最小ウィンドウサイズ を決めるために「Ktup」変数が用いられる。Ktupはまた、配列間で最も相同性が 高い領域を抽出するために、一致しなければならない塩基数を指定する。この段 階では、挿入や欠失は考慮されず、相同性はイニシャル(INIT)値で表示される 。 第二の段階で、最も高い一致スコアを得るために、欠失を起こしたであろう部 分を足すためにギャップを入れて相同領域の位置を調整する。相同スコア表およ び挿入スコア表を用いて、第一段階で得た一致スコアを再計算して最終出力で最 適(OPT)値を出す。 ドットマトリクス相同プロットを構築するハル(Harr)法(Needleman,S.B. and Wunsch,C.O.,J.Mom.Biol.48:443(1970))を用いて、2つの配列間 のDNA相同性を図によって調べることができる。この方法は、相同領域対反復領 域を判定するのに有用な二次元プロットを作成する。 しかし、好ましい態様の一部類において、段階(a)は、アプライド・バイオ システム社(カリフォルニア州フォスターシティー)から購入でき、Facturaソ フトウエア(これもアプライド・バイオシステム社から購入可能)として知られ るソ フトウェアを含むインヘリット(INHERIT)670配列解析システムとして知られて いる商業的に入手可能なコンピュータープログラムでライブラリーのデータを処 理して実行される。ファクチュラ(Factura)プログラムは、ライブラリーを調 製するのに用いたベクターのような関係ない可能性が高い部分を「削除(EDIT O UT)」するために、各ライブラリーの配列を前処理する。削除されるかマスクさ れる(検索用ツールによって無視される)付加的配列は、ポリAテールと反復性G AGおよびCCC配列を含むが、これらに限定されない。低価格の検索プログラムは 、このような「情報に乏しい(LOW INFORMATION)」配列をマスクして除くよう に書かれているか、ブラスト(BLAST)のようなプログラムでは情報に乏しい配 列を無視できる。 インヘリット(INHERIT)670配列解析システムによって実行されるアルゴリズ ムにおいては、パターン特定化言語(TWR社により開発された)が、相同領域を 決めるために用いられている。「INHERIT解析では、3つの変数によって、配列 比較の方法が決められる。その変数とは、ウインドウのサイズ、ウインドウの重 複および誤差の許容である。ウインドウサイズによって、照合配列を分割してで きる分節な長さが決まる。ウインドウ重複によって、前の分節の始まりから数え て、[比較されるべき]次の分節をどこから始めるかが決まる。誤差の許容によ って、決められた字数まで許容される、挿入、欠失および/または置換の総数が 決まる。誤差の許容数は、0から6までの間の整数で指定されよう。デフォルト の条件は、ウインドウサイズ=20、ウインドウ重複=10、および、誤差許容=3であ る。」INHERIT解析使用説明書、2〜15ページ。バージョン1.0、アプライド・バ イオシステム社、1991年10月。 これら3つの変数を組み合わせて用いて、相同領域を含む配列を探し出すため にデータベース(DNAデータベースなど)を検索して、適当な配列があれば、イ ニシャル値でスコア化する。続いて、相同領域対反復領域を判定するために、ド ットマトリクス相同プロットを用いて、これらの相同領域を調べる。相同性検索 の結果を表示するためにスミスーウォーターマンのアラインメント法を用いるこ とができる。INHERITソフトウエアは、UNIXオペレーティングシステムでプログ ラムされたSunコンピューターシステムで実行することができる。 INHERITに代わる検索用プログラムには、BLASTプログラム、GCG(ウィスコン シン州のジェネティクス・コンピューター・グループから入手可能)、およびDa sherプログラム(Temple Smith、マサチューセッツ州ボストン、ボストン大学) が含まれる。ヌクレオチド配列を、GenBank、EMBLまたはGENESEQ(Intelligenti cs、カリフォルニア州マウンテンビュー)のようなカスタムデータベースもしく はその他の遺伝子用データベースに対して検索をかける。さらに、本発明者は、 所内のデータベースに対してもいくつかの配列の検索を行なった。 好ましい態様において、転写産物の配列は、参照遺伝子転写産物と最もよい一 致を得るためにINHERITソフトウエアによって解析して、配列同定番号を付け、 相同性の程度を示すが、こららはともに同定配列値であり、「数量順検索とサブ トラクション解析」コンピュータープログラム(後述する)でプログラムしたマ ッキントッシュ・パーソナルコンピューター(アップル社から購入可能)に入力 し、さらに処理する。 数量順検索とサブトラクション解析プログラム(「数量順検索」プログラムと もいう)を行なう前に、cDNAクローンから同定された配列に(上記の変数によっ て)、以下の分類基準に従った一致度によって配列値が与えられる。すなわち、 「同一」(同一度が非常に高い領域)、ヒト配列相同(類似度は非常に高いが「 同一」ではない領域)、非ヒト配列相同(ヒト以外の生物種に非常によく類似す る領域)は不一致(データベース形式で保存されている、これまでに同定された ヌクレオチド配列に有意に相同する領域がない)。または、一致度は、後述する ように数値で表すこともできる。 また、参照配列とデータベースエントリーとの一致を同定する段階に関して、 蛋白質およびペプチドの配列を核酸配列から導き出すことができる。導き出され たポリペプチド配列を用いて、cDNA配列について行ったのと同じ方法で一致度の 同定を行うことができる。相同的なタンパク質を検索するため蛋白質配列を照合 配列として用い、Swiss/Prot、PIRおよびNBRF蛋白質データベースなどのデータ ベースに含まれている、これまでに同定された配列との比較を行う。これらの蛋 白質は、まず、相同性スコア表(Orcutt,B.C.and Dayoff,M.O.スコア表、 PIR Report MAT-0285(1985年2月))を用いて相同性をスコア化し、INITスコ ア とする。欠失があったと思われる部位にギャップを入れて至適な一致スコアを得 るために、相同性領域を並列させる。相同性スコア表を用いて一致スコアを再計 算し最適化(OPT)スコアを得る。適当な解読枠が分かっていなくても、上記の 蛋白質相同性検索は、3つの解読枠すべてについて検索できる。 ペプチドおよび蛋白質の配列の相同性は、INHERIT 670配列解析システムを用 いて、DNA配列相同性検索と同じようにして確認することができる。イニシャル 値でスコア化した相同領域を含む配列に関して蛋白質データベースを検索するた めに、パターン特定化言語と変数ウインドウを用いられる。これに続いて、ドッ トマトリクス相同プロットに表示されるのは、相同領域対反復領域である。パタ ーン検索データベースで利用できる付加的な検索用ツールには、PLsearch Block s(シアトルのワシントン大学、Henikoff & Henikoffから入手可能)、Dasherお よびGCGがあるが、これらに限定されるわけではなく、Protein Blocks(シアト ルのワシントン大学、Henikoff & Henikoffから入手可能)、Brookhaven Protei n(マサチューセッツ州ブルックヘブンのブルックヘブン国立研究所から入手可 能)、PROSITE(スイス、ジュネーブ大学のAmos Bairochから入手可能)、ProDo m(ボストン大学のTemple Smithから入手可能)、およびPROTEIN MOTIF FINGERP RINT(イギリスのリーズ大学から入手可能)などがある。 INHERIT DNA解析システムの一部であるABIのAssemblerアプリケーションソフ トウエア(カリフォルニア州フォスターシティーのアプライドバイオシステムズ 社から購入可能)を用いれば、選ばれた配列の断片のデータを集めて一本の大き な配列にする、配列アセンブリ計画を作成し、処理できる。Assemblerソフトウ エアは二つの進歩的なコンピューター技術を組み合わせて、データを特定のグル ープにまとめて、配列の重なる部分、アラインメントおよび統計を図示して配列 間の関係を示すAssemblagesに、配列決定したDNA断片をまとめる能力を最大にし ている。この処理は、断片の集合に関するMeyers-Kececiogluモデル(INHERITTM Assembler使用説明書、アプライドバイオシステム社、カリフォルニア州フォス ターシティー)に基づいており、また、DNA配列断片をまとめるための非常に強 力な複数配列のアラインメントを行なう装置の基礎としてグラフ理論を用いてい る。使用できる他の集合プログラムには、MEGALIGN(ウィスコンシン州マジソン のDNAS TAR社から購入可能)、DasherおよびSTADEN(イギリス、ケンブリッジのRoger S tadenから入手可能)が含まれる。 次に、図2に関して、各データベースエントリーに一致する、ライブラリーの 配列数(各データベースエントリーについての存在量数)を図表するための、上 記「段階(b)」を実行する「数量順検索」プログラムについてさらに詳しく説 明する。 図2は、数量順検索プログラムの好ましい態様のフローチャートである。数量 順検索プログラムのこの態様のソースコードのリストを表5に示す。表5の実現 において、マイクロソフト・コーポレーションから購入可能なFoxBASEプログラ ミング言語を用いて、数量順検索プログラムがかかれている。FoxBASEは、この 技術の最初の繰り返しのために選ばれたプログラムであるが、これに限定するも のではない。当業者に明らかなように、Sybaseが特に望ましい代替言語であるが 、その他の多くのプログラミング言語を用いることができる。表5にリストされ たサブルーチンに対応するサブルーチン名を図2に表示する。 また、図2に関し、「同定配列」とは、ライブラリーの各配列とそれに一致す る(ものがもしあれば)データベースエントリーで同定された対応配列を表す転 写産物の配列である。言い換えれば、「同定配列」とは、上述の「段階(a)」 での出力を表す転写産物の配列である。 図3は、本発明を実現するためのシステムをブロック図で示したものである。 図3のシステムは、ライブラリーを作製するライブラリー作製ユニット2を含み 、ライブラリーに含まれる生物学的配列を示す転写産物配列の出力の流れを含む 。プログラムされたプロセッサー4は、出力されたデータの流れをユニット2か ら受け取り、同定配列を作製するために、上記の「段階(a)」に従って、この データを処理する。プロセッサ-4は、INHERIT 670配列解析システムとして知ら れている商業的に利用可能なコンピュータープログラム、および、Facturaプロ グラムとして知られている商業的に入手可能なコンピュータープログラム(両方 ともアプライドバイオシステムズ社から購入できる)、およびUNIXオペレーティ ングシステムでプログラムすることができる。 さらに、図3に関して、同定配列を、数量順検索プログラムでプログラムした プロセッサー6にロードする。プロセッサー6は、図2および3両方に示された 最終転写産物配列を作成する。図4は、リレーショナルコンピューターシステム を計画して、より詳しくブロック図に表したもので、照合されるデータベースを 類別するとともに、実行可能なさまざまな検索技術を含む。 図2に関して、数量順検索プログラムは、まず、同定配列に対して「テンプナ ム(Tempnum)」として知られる操作を行ない、選択したタイプのデータベース のエントリーに一致したもの以外の同定配列をすべて捨てる。例えば、テンプナ ム処理は、データベースのエントリーと次のようなタイプの一致を示す同定配列 を選択できる(定義については上記を参照のこと)。すなわち、「同一」の一致 、ヒト「相同」一致、ヒト以外の生物種に存在する遺伝子を表す「他の生物種」 との一致、「不」一致(これまでに同定されたヌクレオチド配列を表すデータベ ースエントリーに有意に相同する領域がない)、「I」一致(Incyteライブラリ ーでこれまでに知られていなかったDNA配列)、または、「X」一致(参照データ ベースのESTに一致する)など。ここで、U、S、M、V、A、RおよびD配列が消去さ れる(表1の定義を参照)。 「テンプナム」処理で選ばれた同定配列値は、次にさらに、「テンプレッド( Tempred)」として知られる選択(夾雑物除去)操作にかけられる。この操作に よって、例えば、選択したデータベースエントリーとの一致を示すすべての同定 配列が捨てられる。 」理で選択された同定配列値を、「テンプデジグ(Tempdesig)」操作によって ライブラリー毎に分類する。「同定配列」は、一つのライブラリーまたは二つ以 上のライブラリーに由来する配列を表すことができる。 まず、同定配列値が一つのライブラリーに由来する配列を表す場合を考える。 この場合、「テンプレット」で決定されたすべての同定配列値を、「テンプリブ (Templib)」操作で並べ替え、さらに「リブソート」操作で並べ替えを行い、 最終的に「テンプターソート」操作で補足的な並べ替えを行なう。例えば、これ ら3つの並べ替え操作で、同定配列を、「存在量数」が減って行く順に(固有の 同定配列エントリーに対応する各存在量数を数量が減少する順にリストを作成し 、または選択したタイプのデータベースエントリーに対応する各リストにおける 存 在量数が減少する順に並べたいくつかのリストを作成するために)、並べ替えを 行なった各リストから重複する配列を除いて並べ替えることができる。この場合 、「クランチャー」という操作を経ないで、「最終データ」値を、「テンプター ソート」操作によって作成された、組織化された転写産物の配列とすることがで きる。 次に、「テンプレッド」操作で作成された転写産物配列が、(「標的」ライブ ラリーと「サブトラクト」ライブラリーと名付けた)二つのライブラリーからの 配列を示す場合を考慮した。例えば、標的ライブラリーは、病気の細胞のクロー ンに由来するcDNA配列を含み、一方、サブトラクトライブラリーは、薬剤で処理 した後の病気の細胞をクローンに由来するcDNA配列を含むであろう。別の例とし て、標的ライブラリーは、青年からのある細胞型からのクローンに由来するcDNA 配列を含み、サブトラクトライブラリーは、異なった年齢のヒトの同じ細胞型ク ローンに由来するcDNA配列から成っているかもしれない。 この場合、「テンプデジグ」操作が、標的ライブラリーを表すすべての転写産 物の配列を「テンプリブ」(そして次に「リブソート」と「テンプターソート」 )によって処理するための経路を定め、また、サブトラクトライブラリーを表す すべての転写産物の配列を「テンプサブ」(そして次に「サブソート」と「テン プサブソート」)によって処理するための経路を定める。例えば、「テンプリブ 」、「リブソート」、および「テンプターソート」という一連の並べ替え操作で 、標的ライブラリーの同定配列を(データベースエントリーに対応する各存在数 が減少して行く順のリストを作成し、または、選択したタイプのデータベースエ ントリーに対応する各リストにおける存在数が減少する順に並べたいくつかのリ ストを作成するために)、各並べ替えリストから重複するものを消去して、各配 列存在数が減少する順に並べ替える。「テンプサブ」、「サブソート」、および 「テンプサブソート」という一連の並べ替え操作で、サブトラクトライブラリー の同定配列を(データベースエントリーに対応する各存在数が減少して行く順の リストを作成し、または、選択したタイプのデータベースエントリーに対応する 各リストにおける存在数が減少する順に並べたいくつかのリストを作成するため に)、各並べ替えリストから重複するものを消去して、各配列存在数が減少する 順に並 べ替える。 「テンプターソート」操作による転写産物配列の出力は、一つの(例えば、水 平)軸の位置に(標的ライブラリーの配列の)存在数を取り、もう一方の(例え ば、縦)軸の位置に同定配列値(例えば、ヒトまたはヒト以外の遺伝子型)を取 ったヒストグラムを作成できるような、典型的な並べ替えのリストを示している 。同様に、「テンプサブソート」操作による転写産物配列の出力は、一つの(例 えば、水平)軸の位置に(サブトラクトライブラリーの配列の)存在数を取り、 もう一方の(例えば、縦)軸の位置に同定配列値(例えは、ヒトまたはヒト以外 の遺伝子型)を取ったヒストグラムを作成できるような、典型的な並べ替えのリ ストを示している。 テンプサブソートおよびテンプターソート並べ替え操作による転写産物配列( を並べ替えたリスト)の出力は、「クランチャー」という操作によって結合され る。「クランチャー」処理は、対応する標的およびサブトラクト存在数(どちら も同じ同定配列値を表す)の組み合わせを認識し、一方を他方で割って、関連す る存在数の各組について「比率」値を算出する。そして、比率値が減少する順に 並べ替える。「クランチャー」操作から出力されるデータ(図2の最終転写産物 配列)は、典型的には、一方の軸が存在数(標的ライブラリーとサブトラクトラ イブラリーからの関係する同定配列値)の比率の大きさを示し、もう一方の軸が 同定配列値(例えば、遺伝子タイプ)を示すヒストグラムを作成することもでき る、並べ替えリストである。 好ましくは、二つのライブラリー間の比率を算出する前に、クランチャー操作 によって、各比率を、標的ライブラリーとサブトラクトライブラリーの一方また は両方の配列の総数で割る。このクランチャー操作によって作成される「相対的 な」比率値のリストは、多くの医学的、科学的、産業的に応用する上で有用であ る。また、好ましくは、クランチャー操作による出力は、各リストが、異なった 選び方をしたデータベースエントリーの部分的集合(例えば、蛋白質ファミリー )に関して比率値が減少している配列を表すリストである一組のリストである。 一つの実施例において、本発明の数量順検索プログラムは、データベースで同 定された各遺伝子に対応するmRNA転写産物の数を、ライブラリーについて作表す る。これらの数を、サンプリングされたクローンの総数で割る。この割り算の結 果は、mRNA転写産物の、それが採取された細胞型ないし組織における相対的数量 を反映している。本明細書において、この一組の最終的なデータを得ることを「 遺伝子転写産物イメージ解析」と呼ぶ。サブトラクションを行なった結果得たデ ータは、どの蛋白質および遺伝子が促進制御され、また、抑制制御されるのかの 複雑なところを非常に詳しく、正確に示す。 6.6. HUVEC cDNAライブラリー 表2は、誘導を受けたHUVECライブラリーにおける、さまざまな遺伝子転写産 物を一覧表にした数量表である。転写産物を数量に関して降べきの順に並べてあ る。このコンピューターによる並べ替えは、組織の解析を簡易化し、この細胞型 に特異的で、重要な新しい蛋白質を同定する速度を上げる。このタイプの内皮細 胞は、心臓脈管系組織の内側にあり、この構成成分について、特に、活性化に対 する応答についてよく分かるほど、流行性アテローム硬化症など、この組織の疾 患の治療に効果を与えるために標的とする蛋白質の選択範囲がより大きくなる。 6.7. 単球細胞と肥満細胞のcDNAライブラリー 表3と4は、二つのライブラリーの比較の最初の部分を示している。表3と4 では、「正常な単球」とは、HMC-1細胞で、「活性化マクロファージ」とは、PMA で前処理し、LPSで活性化したTHP-1細胞である。表3は、両方の細胞型について 最も多量にある遺伝子転写産物の存在量を降べきの順に並べたリストである。そ れぞれの細胞型からの僅か15の遺伝子転写産物によって、この表から、最も普通 に存在する転写産物を素早く、質的に比較することができる。この数量順検索は 、便利な並列表示によって、すぐに役に立つ検索ツールを提供する。この実施例 において、この検索ツールは、1)活性化マクロファージの上位15個の転写産物 のうち、1個だけ(ポリA結合蛋白質)が正常単球の15の遺伝子転写産物の中に 見出され、2)新規の遺伝子転写産物(今までに他のデータベースで報告されて いないもの)は、活性化マクロファージに比較的多く現れるが、正常なマクロフ ァージにおいては、同様には顕著でないということを明らかにする。このような 検索ツールは、研究者に、細胞表面および細胞内のシグナル分子であるレセプタ ーなどの新規の蛋白質を得るための近道を提供する。これらの蛋白質は、市販薬 のスクリ ーニングプログラムにおいて薬剤の標的となる。このようなツールは、細胞の中 や周囲にある重要な蛋白質を同定することを目的とする、行き当たりばったりの 発見計画では浪費されてしまうかなりの時間を節約することができる。というの は、日常の細胞内の機能を担い、安定したmRNAをもつ蛋白質は、さらに進んで特 徴を調べようとすると、すぐになくなってしまうからである。 このことは、細胞の機能が変わると、遺伝子転写産物プロフィールがどのよう に変化するのかを示している。当業者は、細胞の生化学的構成物も、癌(癌のさ まざまな段階を含む)や毒物に曝されるなどの機能的な変化によって変わること を知っている。表3のような遺伝子転写産物のサブトラクション・プロフィール は、それらの遺伝子発現や蛋白質の研究をするための第一スクリーニング用ツー ルとして有用である。 6.8. 正常単球細胞および活性化単球細胞のcDNAライブラリーのサブトラクシ ョン解析 cDNAのデータが一旦コンピューターに入れられれば、表5で示されているよう なコンピュータープログラムを、実施例6.7で述べた2つのライブラリーのすべ ての遺伝子転写産物の割合を出すために用いた。そして、それらの比率を降べき の数値で遺伝子転写産物を並べ替えた。ある遺伝子転写産物が一方のライブラリ ーに出現していなければ、その遺伝子転写産物の存在量は未知ではあるが1以下 であると思われる。もし出現しなかった遺伝子の存在量を0と決めたら、比率を 得ることは不可能になるが、おおよその値として、2つのライブラリーの一方に しか現れていない遺伝子の存在数を2分の1と決める。出現しないクローンに2 分の1を用いることは、「スイッチが入」ったり、「切れ」たりする遺伝子の相 対的な重要性を増加させる。これらの遺伝子の産物は、薬剤の候補物質だからで ある。個の結果得られる出力図は、サブトラクション表と呼ばれ、以下のデータ で示されるように、極めて有益なスクリーニング法である。 表4はサブトラクション表であるが、正常な単球細胞ライブラリーを電子工学 的に活性化マクロファージライブラリーから「サブトラクション」してある。こ の表は、マクロファージの活性化によって起こる遺伝子転写産物の存在数の変化 を最も効果的に強調している。リストされた最初の20の遺伝子転写産物の間でさ えも、いくつかの未知の遺伝子転写産物がある。したがって、電子的サブトラク ション法は、2つの細胞型の間で起こる基本的な生化学的変化を、ずっと速く確 認できるという点で、研究者を支援する有用なツールである。このようなツール は、研究に何十億ドルも費やす大学や製薬会社に、発見の初期の段階で、貴重な 時間や研究資金を節約させることができ、薬剤開発のサイクルを促進することが でき、代わりに、研究者は、ずっと早くに薬剤スクリーニングプログラムを開始 できる。したがって、この研究用ツールは、より速く、より経済的に新薬を公開 する方法を提供する。 また、このようなサブトラクション表を、患者の診断のために作成できる。各 患者からのサンプル(生体試料または血液から採った単球細胞など)を、マクロ ファージの活性化に関係した状態を診断するために、ここにおいて提供されたデ ータと比較することができる。 表4では、たくさんの新しい遺伝子転写産物が明らかにされている(Incyteク ローンというラベルを付けた)。活性化マクロファージでは、多くの遺伝子のス イッチが入ることに留意されたい(すなわち、単球ではbgfreq列は0である)。 このスクリーニング法は、ウェスタンブロット分析などの他のスクリーニング技 術よりも優れている。ウェスタンブロットでは、これほど多くの別々の新しい遺 伝子を明らかにすることはできない。 また、サブトラクション‐スクリーニング技術は、活性化マクロファージの中 の多数の癌遺伝子転写産物(癌遺伝子rho、ETS2、rab-2 ras、YPT-1関連、急性 骨髄白血病mRNA)を明らかにした。これらの転写産物は、不死化した細胞系を用 いるときの特徴であるかもしれないので、その理由でも本質的に興味深い。この スクリーニング技術は、癌遺伝子を含む転写産物が促進制御を受けることが詳し く図示されているが、このことは、抗癌剤が活性化マクロファージによって媒介 される、患者の免疫機能を妨害する理由を説明するのに役立つ。このスクリーニ ング法から得た知見を身につければ、当業者は、1)同じ遺伝子転写産物プロフ ィールをもつ関連する癌と活性化マクロファージ、2)癌のみ、および、3)マク ロファージの活性化された状態に対して、特に効果的な薬剤を同定するために、 より標的を絞った、効果的なスクリーニングプログラムを開始することができる 。 平滑筋老化蛋白質(22 kd)は、活性化マクロファージ中で促進制御される。 このことは、この蛋白質が炎症の抑制を妨げる物質の候補であることを示してい る。 6.9. 正常な肝細胞と肝炎に感染した肝細胞のcDNAライブラリーのサブトラク ション解析 本実施例において、ラットを肝炎ウイルスにさらし、肝炎の明らかな徴候を表 すまで、コロニーで飼育する。肝炎と診断されたラットのうち、半分に新しい抗 肝炎剤(AHA)を与える。肝炎ウイルスにさらす前、AHA処理の終わりまたは無処 理のラットすべてから肝臓のサンプルを採取する。さらに、AHA処理直前の肝炎 に罹ったラットから肝臓のサンプルを採取できる。 肝組織を実施例6.2、6.3で述べたように処理して、mRNAを採り、続いてcDNAの 配列決定を行なう。各サンプルからのcDNAを処理してから、表5のコンピュータ ープログラムに従って存在量数を解析する。この結果できるcDNAの遺伝子転写産 物イメージは、各動物に関するベースライン(対照)の詳細な図と、感染しおよ び/または治療された状態にある動物に関する詳細な図を提供する。サンプルの グループに関するcDNAデータを組み合わせて、すべての対照用サンプル、感染ラ ットからのサンプル、および、AHA処理ラットからのサンプルに対して、グルー プ要約遺伝子転写産物プロフィールを作ることができる。 適当な個体のライブラリーとグループ化したライブラリーの間で、サブトラク ションを行なう。各動物個体について、対照と実験後のサンプルがサブトラクト されうる。また、AHA処理前と処理後のサンプルが採れたなら、各動物からと処 理グループからのデータがサブトラクトされうる。さらに、すべての対照用サン プルについてのデータをまとめて平均値を出すことができる。対照の平均値は、 AHA処理の実験後とAHA非処理の実験後両方の平均値からサブトラクトできる。も し、処理前と処理後のサンプルが利用できるのであれば、処理前のサンプルと処 理後のサンプルを個別に(または電子的に平均を求めて)比較することができ、 サブトラクトすることができる。 これらのサブトラクション表には、一般的に2つの利用方法がある。まず、肝 臓の悪化と治癒の継続に関連した遺伝子転写産物について、その違いを解析する こと。サブトラクション表は、薬剤処理の効果を、その下にある肝炎の基本的病 理状態から分離するためのツールである。肝炎は、多くの変数に影響するため、 通常の酵素に関する血液検査だけでは付加的な肝臓毒性を検出するのは困難であ る。遺伝子転写産物プロフィールとサブトラクションは、このように難しい問題 を解くために、研究者が必要としてきた、より一層細かい生化学図表を提供する 。 つぎに、サブトラクション表は、例えば、病気、薬剤による快癒、または、薬 剤による付加的な病状などの臨床的な結末を予測および/また評価するために用 いられる個別の蛋白質またはその他の生化学的な決定因子である臨床マーカーを 同定するためのツールを提供する。サブトラクション表は、特にスイッチがオン になったりオフになったりする遺伝子を強調する。したがって、サブトラクショ ン表は、臨床マーカーとして用いるべき候補となる遺伝子転写産物のグループを 探すための最初のスクリーンを提供する。続いて、さらに別の細胞および組織の ライブラリーの電子的サブトラクションを行うことによって、どのマーカー候補 が、異なった細胞や組織のライブラリーで実際に見られるかが明らかになる。候 補遺伝子転写産物が別のライブラリーにも見られたら、臨床マーカー候補から除 かれる。そして、関連する条件をもたないことが分かっている、またはもつこと が知られている血液または他の関連するサンプルの検査結果を、臨床マーカーの 選択を確実なものにするために比較する。この方法においては、遺伝子転写産物 を臨床マーカーと認定するために、その転写産物が産生する蛋白質の特定の生理 機能を決定する必要がない。 6.10. 電子ノーザンブロット 電子サブトラクションの限界の一つは、一度に一組以上のイメージを比較する のが困難な点である。特定の遺伝子産物が、さらに詳しく調査するのに(電子サ ブトラクションまたは他の方法によって)適当だと認められさえすれば、多数の 異なった組織における単一の遺伝子の発現を調べることが役に立つ。実験室にお いては、この目的のために「ノーザン」ブロットハイブリダイゼーションの技術 が用いられる。この技術においては、単一のcDNAまたはそれに相当するプローブ を標識して、多数の組織または細胞型から調製したRNAサンプルを含むブロット に対してハイブリダイズする。オートラジオグラフィーを行って、含まれている サンプルすべてについて、その特定の遺伝子の発現パターンを一つづつ定量する こ とができる。 これに対して、本発明のさらに別の態様は、このプロセスをコンピューター化 したもので、本明細書において「電子ノーザンブロット」と名付けている。この 変則的な方法において、データベースの中に存在する、調製され、配列決定され た多数のライブラリーに対して、一つの遺伝子の発現を照合する。このようにし て、どのような一つの候補遺伝子の発現パターンであっても、労を要せずに、即 時に調べることができる。このようにして、さらに多くの候補遺伝子について調 べれば、さらに多くの実り多い関係のある発見がなされるであろう。表5に入っ ているコンピュータープログラムは、この機能を行うためのプログラムを含み、 表6は、電子ノーザンブロット分析に用いられたデータベースのエントリーの部 分リストである。 6.11. フェーズI臨床試験 上記の動物試験の安全性と有効性が確かめられると、フェーズI臨床試験が行 われる。通常の患者に、普通の予備的な臨床実験検査が行われる。さらに、適当 な標本を採って、遺伝子転写産物解析にかける。さらに別の患者の標本を、試験 中の予め決められた期間ごとに、採取する。標本は上述のようにして、遺伝子転 写産物解析にかけられる。さらに、先にラットの毒性実験で分かっている遺伝子 転写産物の変化を、後にくる患者における臨床マーカーとして注意深く評価する 。遺伝子転写産物解析における変化を、臨床的な徴候および病徴と他の実験室の 結果との相関から、毒性の指標として評価する。さらに、それぞれの患者の標本 と患者標本を平均化したものについて、サブトラクションを行なう。サブトラク ション解析は、処置を受けた患者におけるあらゆる毒物学的変化を明らかにする 。これは、高度に洗練された毒性の決定方法である。サブトラクション法は、ま た、臨床マーカーに注釈を付ける。さらに1)有害作用の発生やタイプによって 分けた、また、2)用量によって分けた下位グループをサブトラクション解析に よって解析することができる。 6.12. 臨床実験における遺伝子転写産物イメージング解析 遺伝子転写産物イメージング解析(ないし多数の遺伝子転写産物イメージング 解析)は、他の臨床実験においても有用なツールである。例えば、処理前と処理 後の遺伝子転写産物イメージング解析の違いを、偽薬を与えた患者と薬剤を与え た患者に関して評価することができる。この方法は、また、薬剤の臨床的使用を もたらす臨床マーカーを効果的にスクリーニングする。 6.13. 種間での遺伝子転写産物比較解析 サブトラクション法は、さまざまな生物に由来するcDNAライブラリーのスクリ ーニングに用いることができる。例えば、異なった種から同じ細胞型を採って、 解毒酵素系のような特異的な差違をスクリーニングするために、遺伝子転写産物 解析によって比較することができる。このような試験法は、商業目的の、ヒトや 動物に用いるための薬剤のスクリーニングや毒性試験をするための動物モデルの 選択と確認をする上で役に立つ。異なる種の動物間で比較を、それぞれの種につ いて列に示すとき、これを種間比較ないし動物ブロットと呼ぶ。 本発明の態様では、マイクロソフト社から購入可能なFoxBASEプログラム言語 を用いて書かれたデータベースを用いてもよい。本発明の他の態様は、Cullらに 1993年12月14日に付与された米国特許第5,270,170号、1993年11月11日に発行さ れたPCT国際公開番号 WO 9322684、1993年4月1日に発行されたPCT国際公開番号 WO 9306121、もしくは1991年12月26日に発行されたPCT国際公開番号 WO 9119818 で説明されているタイプのランダムペプチドデータベースやポリマーデータベー ス、合成オリゴマーデータベース、オリゴヌクレオチドデータベースを用いる。 これら4つの参考文献(これらの文書は本明細書において参考文献として包含さ れる)は、本発明の、このような他の態様を実行するときに、どれが適用される かを教示することを含む。 ここまでの文面で参照された参考文献は、本明細書に明示的に参照として包含 される。 ここまで説明してきた、本発明の方法およびシステムには、本発明の範囲と精 神をはずれることなく、さまざまな修正と変更が可能であることは、当業者に明 らかであろう。本発明について、特に好ましい態様と関連させて説明してきたが 、本発明の請求の範囲を、そのような特定の態様に不当に制限すべきでないと理 解されるべきである。
【手続補正書】 【提出日】1996年9月10日 【補正内容】 請求の範囲 1.(a)第一のmRNAの混合物を得る段階、 (b)該mRNAのcDNAコピーを作製する段階、 (c)該cDNAで形質転換された代表的なクローン群を単離し、該クローン群から 第一の生物学的配列ライブラリーを作製する段階、 (d)第一の遺伝子転写産物セットを作成する段階であって、該第一のセット中 の第一の遺伝子転写産物の各々が第一のライブラリーの生物学的配列のうちの異 なる配列に対応し、さらに該遺伝子転写産物がcDNAの5'末端に由来する、段階、 (e)配列に対する注釈(annotation)、および第一の遺伝子転写産物の一つと 参照転写産物配列のうちの少なくとも一つとの間の一致度を示す第一の同定配列 値を、第一の遺伝子転写産物の各々について作成するために、参照生物学的配列 を示す参照転写産物配列のデータベースが保存されたプログラムコンピューター で第一の遺伝子転写産物を処理する段階、および (f)第一の同定配列値の各々が第一の生物学的配列ライブラリー中に出現する 回数を示す第一の最終データ値を作成するために、該同定配列値の各々を処理す る段階、 を含む、遺伝子転写産物を含む試料を解析する方法。 2.第一の生物学的配列ライブラリーが、ヒト細胞系から得られた少なくとも 5,000の配列を含む、請求の範囲1の方法。 3.(g)第二のヒト細胞系から第二のmRNAの混合物を得る段階、 (h)該mRNAのcDNAコピーを作製する段階、 (i)該cDNAで形質転換された代表的なクローン群を単離し、該クローン群から 第二の生物学的配列ライブラリーを作製する段階、 (j)第二の遺伝子転写産物セットを作成する段階であって、該第二のセット中 の第二の遺伝子転写産物の各々が第二のライブラリーの生物学的配列のうちの異 なる配列に対応する、段階、 (k)配列に対する注釈(annotation)、および第二の遺伝子転写産物の一つと 参照転写産物配列のうち少なくとも一つとの間の一致度を示す第二の同定配列値 を、第二の遺伝子転写産物の各々について作成するために、参照生物学的配列を 示す 参照転写産物配列のデータベースが保存されたプログラムコンピューターで第二 の遺伝子転写産物を処理する段階、および (l)第二の同定配列値の各々が第二の生物学的配列ライブラリー中に出現する 回数を示す第二の最終データ値を作成するために、該第二の同定配列値の各々を 処理する段階、 をさらに含む、請求の範囲1の方法。 4.(m)第一のmRNAの混合物と第二のmRNAの混合物との間の遺伝子転写産物の 数の違いを示す、遺伝子転写産物の割合値を作成するために、(f)の第一の最 終データ値および(l)の第二の最終データ値を処理する段階、 をさらに含む請求の範囲3の方法。 5.(n)第一のmRNAの混合物が健康なヒト患者から得たものであり、第二のmRN Aの混合物が不健康なヒト患者から得たものであり、差異値のセットを得るため に、(l)の第二の最終データ値に対して(f)の第一の最終データ値のサブトラ クションを行う段階、 をさらに含む請求の範囲3の方法。 6.cDNAコピーがランダムプライマーを用いて製造される、請求の範囲1の方法 。 7.(a)生物試料からmRNA転写産物群を単離する段階、 (b)mRNAが転写される遺伝子であって、該mRNAが配列に特有の方法で転写され ている遺伝子を同定する段階、 (c)該遺伝子の各々に対応するmRNA転写産物の数を決定する段階、および (d)mRNA転写産物群内のmRNA転写産物の相対的存在量を決定するために、該mRN A転写産物の数を用いる段階、 をさらに含む、生物試料中のmRNAの相対的存在量を定量する方法。 8.(e)mRNA転写産物群内のmRNA転写産物の相対存在量のデータに基づき、遺 伝子転写産物イメージを作成する段階、 (f)(e)の転写産物イメージを、病気の生物試料および/または正常な生物試 料に由来する遺伝子転写産物イメージと比較する段階、 をさらに含む請求の範囲7の方法。 9.(a)生物学的試料からmRNAの混合物を得る段階、 (b)該mRNAのcDNAコピーを作成する段階、 (c)該cDNAを適当なベクターに挿入し、適当な宿主株細胞を該ベクターで形質 転換し、各々が特有のmRNAを示すクローンを増殖させる段階、 (d)少なくとも5,000の組換えクローンの代表的な群を単離する段階、 (e)特有のmRNAが転写された遺伝子を同定する配列特異的な方法により、該群 中の各クローンから増幅されたcDNAを同定する段階、 (f)相対的存在量の指標として、各遺伝子がクローン群内に出現する回数を決 定する段階、および (g)存在量の多い順に遺伝子およびその相対的存在量を列挙し、それにより遺 伝子転写産物イメージを作成する段階、 を含む、遺伝子転写産物イメージを作製する方法。 10.(h)(e)の遺伝子転写産物イメージを、病気の生物試料および/または 正常な生物試料に由来する遺伝子転写産物イメージと比較する段階、 をさらに含む請求の範囲9の方法。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,MW,SD,SZ),AM, AU,BB,BG,BR,BY,CA,CN,CZ,E E,FI,GE,HU,JP,KG,KP,KR,KZ ,LK,LR,LT,LV,MD,MG,MN,MX, NO,NZ,PL,RO,RU,SI,SK,TJ,T T,UA,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.遺伝子転写産物を含む試料を解析する方法において、 (a)生物学的配列のライブラリーを作製する段階、 (b)転写産物配列セットの各転写産物配列が、ライブラリーの生物学的配列 のうちの異なる配列を示している転写産物配列セットを作製する段階、 (c)各転写産物配列について配列に対する注釈と、転写産物配列が参照用転 写産物配列の少なくとも一つとの間で一致する度合いを示す同定配列値を作成す るために、参照用の生物学的配列を表す参照用転写産物配列のデータベースが保 存されている、プログラムされたコンピューターで転写産物配列を処理する段階 、および (d)各同定配列値が、そのライブラリーに何回現れたかを示す最終データ値 を作成するために、該同定配列値の各々を処理する段階、 を含む方法。 2.請求の範囲1の方法において、段階(a)が、 mRNAの混合物を入手する段階、 mRNAのcDNAコピーを作製する段階、 cDNAで形質転換したクローンの代表的集団を分離して、それからの生物学的配 列のライブラリーを作製する段階、 を含む方法。 3.請求の範囲1の方法において、生物学的配列がcDNA配列である方法。 4.請求の範囲1の方法において、生物学的配列がRNA配列である方法。 5.請求の範囲1の方法において、生物学的配列が蛋白質配列である方法。 6.請求の範囲1の方法において、一致する度合いの第一の値が、完全に一致 するものであることを示す値であり、一致する度合いの第二の値が、完全には一 致しないことを示す値である方法。 7.遺伝子転写産物を含む2つの試料を比較する方法において、 (a)請求の範囲1の方法に従って第一の試料を解析する段階、 (b)生物学的配列の第二のライブラリーを作製する段階、 (c)各転写産物配列が、第二のライブラリーの生物学的配列のうちの異なる 配 列であることを示す、第二の転写産物配列セットを作製する段階、 (d)配列に対する注釈と、第二のライブラリーの生物学的配列の一つが参照 用配列の一以上の配列と一致する度合いを示す、後続同定配列値と呼ばれる第二 のセットの同定配列値を作成するために、プログラムされたコンピューターで第 二の転写産物配列セットを処理する段階、 (e)第二ライブラリーに各後続同定配列値が何回現れたかを示す、後続の最 終データ値を作製するために、該後続同定配列値の各々を処理する段階、および 、 (f)2つの試料間における遺伝子転写産物の数の違いを示す、転写産物配列 の割合を求めるために、第一の試料から得た最終データ値と、第二の試料から得 た後続同定配列値を処理する段階、 を含む方法。 8.生物試料中のmRNAの相対的存在量を定量する方法において、 (a)生物試料からmRNA転写産物の集団を分離する段階、 (b)mRNAが配列特異的な方法で転写された遺伝子を同定する段階、 (c)各遺伝子に対応するmRNA転写産物の数を決定する段階、および (d)mRNA転写産物の集団の中のmRNA転写産物の相対的存在量を判定するため に、mRNA転写産物の数を用いる段階 を含む方法。 9.遺伝子転写産物のイメージを作成することを含む診断方法において、 (a)生物試料からmRNA転写産物の集団を分離する段階、 (b)mRNAが配列特異的な方法で転写された遺伝子を同定する段階、 (c)各遺伝子に対応するmRNA転写産物の数を決定する段階、および (d)mRNA転写産物の集団の中のmRNA転写産物の相対的存在量を判定するため に、mRNA転写産物の数を用いる段階(ただし、mRNA転写産物の相対的存在量の値 を判定するデータが、生物試料の遺伝子転写産物イメージである)、 を含む方法。 10.請求の範囲9の方法において、さらに、 (e)標準的で正常な遺伝子転写産物イメージと病気の遺伝子転写産物イメー ジのセットを提供する段階、 (f)生物試料の遺伝子転写産物イメージに最も近似した標準となる遺伝子転 写産物イメージのうちの少なくとも一つを同定するために、生物試料の遺伝子転 写産物イメージを、段階(e)の遺伝子転写産物イメージと比較する段階、 を含む方法。 11.請求の範囲9の方法において、生物試料が、生検組織、痰、血液、または 尿である方法。 12.遺伝子転写産物イメージを作成する方法において、 (a)mRNAの混合物を入手する段階、 (b)mRNAのcDNAコピーを作製する段階、 (c)cDNAを適当なベクターに挿入して、該ベクターを適当な宿主株細胞を形 質転換し、形質転換された宿主菌をプレートアウトして、一つずつ別のmRNA配列 を表すクローンになるまで増殖させる段階、 (d)組み換えクローンの代表的集団を分離する段階、 (e)特定のmRNAが転写された遺伝子を同定する、配列特異的な方法によって 、集団中の各クローンから増幅したcDNAを同定する段階、 (f)各遺伝子がクローン集団の中に出現する回数を、相対的存在量を示すも のとして決定する段階、および (g)遺伝子とその相対的存在量を、多いもの順にリストにし、それによって 遺伝子転写産物イメージを作成する段階、 を含む方法。 13.請求の範囲12の方法において、病気を診断するための、 正常な遺伝子転写産物イメージおよび病気の遺伝子転写産物イメージの参照用 セットを作成するために、正常なヒト、および様々な病気をもつヒトのランダム サンプルから採った生物試料に対して(a)から(g)までの段階を繰り返す段階 、 ヒトから検査用試料を得て、該検査用試料に対して、(a)から(g)までの段 階を行って検査用遺伝子転写産物イメージを作成する段階、 検査用遺伝子転写産物イメージを遺伝子転写産物イメージの参照用セットと比 較する段階、および 検査用遺伝子転写産物イメージに最もよく近似した参照用遺伝子転写産物を少 なくとも一つ同定する段階、 をさらに含む方法。 14.生物学的配列のライブラリーを解析するためのコンピューターシステムに おいて、 遺伝子転写産物配列の各々がライブラリーの生物学的配列のうちの異なる配列 を表す、転写産物配列セットを受け取る方法、および 各転写産物配列に対する配列に対する注釈と、ライブラリーの生物学的配列の うちの異なる配列が少なくとも1個の参照用転写産物配列と一致する度合いを示 す同定配列値を作成するためにソフトウエアでプログラムされたコンピューター の、参照用の生物学的配列を表す参照用転写産物配列のデータベースが保存され ているシステムで、転写産物配列を処理し、各同定配列値がライブラリーの中に 何回現れるかを示す最終データ値を作成するために、該同定配列値の各々を処理 するための方法、 を含むシステム。 15.請求の範囲14のシステムにおいて、生物学的配列のライブラリーを作製し 、該ライブラリーから転写産物配列セットを作成するための、ライブラリー作製 方法をさらに含むシステム。 16.請求の範囲15のシステムにおいて、ライブラリー作製方法が、 mRNAの混合物を入手するための方法、 mRNAのcDNAコピーを作製するための方法、 cDNAコピーを細胞に挿入して、クローンになるまで細胞を増殖させるための方 法、および クローンの代表的集団を分離して、そこから生物学的配列を含むライブラリー を作製するための方法、 を含む方法。
JP7520218A 1994-01-27 1995-01-27 遺伝子転写産物の比較解析 Pending JPH09503921A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US08/187,530 US5840484A (en) 1992-07-17 1994-01-27 Comparative gene transcript analysis
US08/187,530 1994-07-29
US08/282,955 US6114114A (en) 1992-07-17 1994-07-29 Comparative gene transcript analysis
US08/282,955 1994-07-29
PCT/US1995/001160 WO1995020681A1 (en) 1994-01-27 1995-01-27 Comparative gene transcript analysis

Publications (1)

Publication Number Publication Date
JPH09503921A true JPH09503921A (ja) 1997-04-22

Family

ID=26883115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7520218A Pending JPH09503921A (ja) 1994-01-27 1995-01-27 遺伝子転写産物の比較解析

Country Status (17)

Country Link
US (1) US6114114A (ja)
EP (1) EP0748390A4 (ja)
JP (1) JPH09503921A (ja)
CN (1) CN1145098A (ja)
AP (1) AP9600833A0 (ja)
AU (1) AU688465B2 (ja)
BG (1) BG100751A (ja)
BR (1) BR9506657A (ja)
CA (1) CA2182217A1 (ja)
CZ (1) CZ218996A3 (ja)
EE (1) EE9600097A (ja)
FI (1) FI962987A (ja)
LV (1) LV11696B (ja)
NO (1) NO963151L (ja)
OA (1) OA10723A (ja)
PL (1) PL315687A1 (ja)
WO (1) WO1995020681A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007007519A1 (ja) * 2005-07-07 2007-01-18 Sony Corporation エバネッセント光を利用する物質情報取得方法と物質情報測定装置、並びに塩基配列決定方法と装置
US7957909B2 (en) 1999-06-28 2011-06-07 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US8055452B2 (en) 2001-11-09 2011-11-08 Life Technologies Corporation Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6974666B1 (en) 1994-10-21 2005-12-13 Appymetric, Inc. Methods of enzymatic discrimination enhancement and surface-bound double-stranded DNA
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
US5695937A (en) * 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5866330A (en) * 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5972693A (en) * 1995-10-24 1999-10-26 Curagen Corporation Apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US6418382B2 (en) 1995-10-24 2002-07-09 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US5871697A (en) * 1995-10-24 1999-02-16 Curagen Corporation Method and apparatus for identifying, classifying, or quantifying DNA sequences in a sample without sequencing
US20010018514A1 (en) 1998-07-31 2001-08-30 Mcgall Glenn H. Nucleic acid labeling compounds
US7282327B2 (en) 1996-01-23 2007-10-16 Affymetrix, Inc. Nucleic acid labeling compounds
US7291463B2 (en) 1996-01-23 2007-11-06 Affymetrix, Inc. Nucleic acid labeling compounds
US7423143B2 (en) 1996-01-23 2008-09-09 Affymetrix. Inc. Nucleic acid labeling compounds
US7468243B2 (en) 2001-03-12 2008-12-23 Affymetrix, Inc. 2-aminopyrimidin-4-one nucleic acid labeling compounds
US6965020B2 (en) 1996-01-23 2005-11-15 Affymetrix, Inc. Nucleic acid labeling compounds
US6864059B2 (en) 1996-01-23 2005-03-08 Affymetrix, Inc. Biotin containing C-glycoside nucleic acid labeling compounds
US6312892B1 (en) * 1996-07-19 2001-11-06 Cornell Research Foundation, Inc. High fidelity detection of nucleic acid differences by ligase detection reaction
US5939265A (en) * 1996-11-05 1999-08-17 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
AU4753397A (en) * 1996-10-03 1998-04-24 Incyte Pharmaceuticals, Inc. Methods for generating and analyzing transcript markers
US5919638A (en) * 1996-10-08 1999-07-06 Abbott Laboratories Reagents and methods useful for detecting prostate tumors
US20050202499A1 (en) 1996-10-31 2005-09-15 Billing-Medel Patricia A. Reagents and methods useful for detecting diseases of the breast
JP4614472B2 (ja) * 1996-10-31 2011-01-19 アボット・ラボラトリーズ 乳房の疾患の検出に有用な試薬および方法
US5981190A (en) * 1997-01-08 1999-11-09 Ontogeny, Inc. Analysis of gene expression, methods and reagents therefor
US5968784A (en) * 1997-01-15 1999-10-19 Chugai Pharmaceutical Co., Ltd. Method for analyzing quantitative expression of genes
US6461814B1 (en) * 1997-01-15 2002-10-08 Dominic G. Spinella Method of identifying gene transcription patterns
CA2279551A1 (en) * 1997-01-31 1998-08-06 Abbott Laboratories Reagents and methods useful for detecting diseases of the lung
WO1998044160A1 (en) * 1997-03-31 1998-10-08 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
JP2002512513A (ja) 1997-03-31 2002-04-23 アボツト・ラボラトリーズ 胃腸管の疾患の検出に有用な試薬および方法
JP2001522238A (ja) * 1997-03-31 2001-11-13 アボツト・ラボラトリーズ 胃腸管の疾患の検出に有用な試薬および方法
US6368792B1 (en) 1997-03-31 2002-04-09 Abbott Laboratories Reagents and methods useful for detecting diseases of the gastrointestinal tract
US5966711A (en) * 1997-04-15 1999-10-12 Alpha Gene, Inc. Autonomous intelligent agents for the annotation of genomic databases
NO972006D0 (no) 1997-04-30 1997-04-30 Forskningsparken I Aas As Ny metode for diagnose av sykdommer
WO1998050567A1 (en) 1997-05-02 1998-11-12 Abbott Laboratories Reagents and methods useful for detecting diseases of the prostate
US6890749B2 (en) 1997-05-15 2005-05-10 Abbott Laboratories Reagents and methods useful for detecting diseases of the prostate
WO1998051824A1 (en) * 1997-05-15 1998-11-19 Abbott Laboratories Reagents and methods useful for detecting disease of the urinary tract
WO1998055656A1 (en) * 1997-06-05 1998-12-10 Abbott Laboratories Reagents and methods useful for detecting diseases of the urinary tract
JP2001526546A (ja) * 1997-06-11 2001-12-18 アボツト・ラボラトリーズ 肺の疾患の検出に有用な試薬および方法
WO1999002714A1 (en) * 1997-07-07 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999002559A1 (en) * 1997-07-07 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999002734A1 (en) * 1997-07-08 1999-01-21 Abbott Laboratories Reagents and methods useful for detecting diseases of the urinary tract
US20020064792A1 (en) * 1997-11-13 2002-05-30 Lincoln Stephen E. Database for storage and analysis of full-length sequences
EP1032689A1 (en) * 1997-11-17 2000-09-06 Abbott Laboratories Reagents and methods useful for detecting diseases of the breast
WO1999034016A2 (en) * 1997-12-29 1999-07-08 Genena Ltd. A method for identifying and characterizing cells and tissues
US6121023A (en) * 1998-01-22 2000-09-19 Akzo Nobel N.V. Isothermal transcription based assay for the detection and quantification of the chemokine rantes
JP2002509706A (ja) 1998-03-31 2002-04-02 ジンザイム コーポレイション 肺癌の診断及び治療方法
KR20010034731A (ko) * 1998-04-02 2001-04-25 텔루스 제너틱 리소시즈, 인크. 유전자 서열 중에 유전자 병변이 있는 식물을 얻는 방법
US6403778B1 (en) 1998-05-04 2002-06-11 Incyte Genomics, Inc. Toxicological response markers
WO2000012760A2 (en) * 1998-08-28 2000-03-09 Incyte Pharmaceuticals, Inc. Toxicological response markers
US6667176B1 (en) 2000-01-11 2003-12-23 Geron Corporation cDNA libraries reflecting gene expression during growth and differentiation of human pluripotent stem cells
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
WO2000039346A1 (en) * 1998-12-31 2000-07-06 Iconix Pharmaceuticals, Inc. Method for generating a pathway reporter system
CA2381319A1 (en) * 1999-06-01 2000-12-07 Incyte Genomics, Inc. Molecules for diagnostics and therapeutics
CA2380549A1 (en) * 1999-08-05 2001-02-15 Incyte Genomics, Inc. Secretory molecules
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
AU7709300A (en) * 1999-09-24 2001-04-24 Linden Technologies, Inc. Drug discovery using gene expression profiling
WO2001077684A2 (en) * 2000-04-10 2001-10-18 The Scripps Research Institute Proteomic analysis using activity-based probe libraries
GB0008908D0 (en) * 2000-04-11 2000-05-31 Hewlett Packard Co Shopping assistance service
US7363165B2 (en) * 2000-05-04 2008-04-22 The Board Of Trustees Of The Leland Stanford Junior University Significance analysis of microarrays
CA2408840A1 (en) * 2000-05-11 2001-11-15 Rogier Versteeg Myc targets
KR20030051435A (ko) * 2000-06-19 2003-06-25 코렐로직 시스템즈, 인크. 분류화의 발견적 방법
AU2001280746A1 (en) * 2000-07-21 2002-02-05 Phase-1 Molecular Toxicology Canine toxicity genes
US7110885B2 (en) 2001-03-08 2006-09-19 Dnaprint Genomics, Inc. Efficient methods and apparatus for high-throughput processing of gene sequence data
CA2377213A1 (en) * 2001-03-20 2002-09-20 Ortho-Clinical Diagnostics, Inc. Method for providing clinical diagnostic services
US6996477B2 (en) 2001-04-19 2006-02-07 Dana Farber Cancer Institute, Inc. Computational subtraction method
AUPR480901A0 (en) * 2001-05-04 2001-05-31 Genomics Research Partners Pty Ltd Diagnostic method for assessing a condition of a performance animal
JP2005520484A (ja) * 2001-07-06 2005-07-14 454 コーポレイション 多孔性フィルターを使用し、独立した並行する化学的微量反応を隔離するための方法
US20030148314A1 (en) * 2001-08-01 2003-08-07 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of colon cancer
US20030054396A1 (en) * 2001-09-07 2003-03-20 Weiner Michael P. Enzymatic light amplification
US20050124022A1 (en) * 2001-10-30 2005-06-09 Maithreyan Srinivasan Novel sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US6902921B2 (en) * 2001-10-30 2005-06-07 454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US6956114B2 (en) 2001-10-30 2005-10-18 '454 Corporation Sulfurylase-luciferase fusion proteins and thermostable sulfurylase
US7776524B2 (en) 2002-02-15 2010-08-17 Genzyme Corporation Methods for analysis of molecular events
US20050136457A1 (en) * 2002-05-22 2005-06-23 Fujitsu Limited Method for analyzing genome
US20050158742A1 (en) * 2002-05-22 2005-07-21 Fujitsu Limited Method for analyzing genome
US7395160B2 (en) * 2002-07-29 2008-07-01 Correlogic Systems, Inc. Quality assurance/quality control for electrospray ionization processes
EP1431399A1 (en) * 2002-12-20 2004-06-23 Clinigenetics Methods and composition for identifying therapeutic agents of atherosclerotic plaque lesions
US7575865B2 (en) * 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
EP2159285B1 (en) * 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
AU2004261222A1 (en) * 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
GB0412301D0 (en) 2004-06-02 2004-07-07 Diagenic As Product and method
WO2006026654A2 (en) 2004-08-27 2006-03-09 Exact Sciences Corporation Method for detecting a recombinant event
US9109256B2 (en) 2004-10-27 2015-08-18 Esoterix Genetic Laboratories, Llc Method for monitoring disease progression or recurrence
EP1861704A2 (en) * 2005-02-09 2007-12-05 Correlogic Systems, Inc. Identification of bacteria and spores
WO2007044071A2 (en) 2005-04-21 2007-04-19 Exact Sciences Corporation Analysis of heterogeneous nucleic acid samples
WO2006124628A2 (en) * 2005-05-12 2006-11-23 Correlogic Systems, Inc. A model for classifying a biological sample in relation to breast cancer based on mass spectral data
US7608395B2 (en) 2005-09-15 2009-10-27 Baylor Research Institute Systemic lupus erythematosus diagnostic assay
AU2006321602B2 (en) 2005-12-08 2012-03-08 Novartis Ag Effects of inhibitors of FGFR3 on gene transcription
PT1986661T (pt) 2006-02-08 2018-12-05 Genzyme Corp Terapia genética para a doença de niemann-pick tipo a
US20080250016A1 (en) * 2007-04-04 2008-10-09 Michael Steven Farrar Optimized smith-waterman search
CN101855553B (zh) 2007-06-29 2014-06-11 韩国安国药品株式会社 卵巢癌的预测标记
CN101930502B (zh) * 2010-09-03 2011-12-21 深圳华大基因科技有限公司 表型基因的检测及生物信息分析的方法及系统
US11021703B2 (en) 2012-02-16 2021-06-01 Cornell University Methods and kit for characterizing the modified base status of a transcriptome

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371671A (en) * 1990-03-13 1994-12-06 The Regents Of The University Of California DNA sequence autoradiogram digitizer and methodology implemented in the same
US5723286A (en) * 1990-06-20 1998-03-03 Affymax Technologies N.V. Peptide library and screening systems
US5364759B2 (en) * 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
DE69217497T2 (de) * 1991-09-18 1997-06-12 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
US5270170A (en) * 1991-10-16 1993-12-14 Affymax Technologies N.V. Peptide library and screening method
US5541061A (en) * 1992-04-29 1996-07-30 Affymax Technologies N.V. Methods for screening factorial chemical libraries

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7957909B2 (en) 1999-06-28 2011-06-07 Source Precision Medicine, Inc. Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US8055452B2 (en) 2001-11-09 2011-11-08 Life Technologies Corporation Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
US8718946B2 (en) 2001-11-09 2014-05-06 Life Technologies Corporation Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
WO2007007519A1 (ja) * 2005-07-07 2007-01-18 Sony Corporation エバネッセント光を利用する物質情報取得方法と物質情報測定装置、並びに塩基配列決定方法と装置

Also Published As

Publication number Publication date
PL315687A1 (en) 1996-11-25
EP0748390A4 (en) 1998-04-01
OA10723A (en) 2002-12-04
CA2182217A1 (en) 1995-08-03
AU688465B2 (en) 1998-03-12
AU1694695A (en) 1995-08-15
US6114114A (en) 2000-09-05
CZ218996A3 (en) 1997-05-14
FI962987A0 (fi) 1996-07-26
EE9600097A (et) 1996-12-16
WO1995020681A1 (en) 1995-08-03
CN1145098A (zh) 1997-03-12
LV11696B (en) 1997-08-20
AP9600833A0 (en) 1996-07-31
NO963151D0 (no) 1996-07-26
FI962987A (fi) 1996-09-26
BG100751A (en) 1997-07-31
BR9506657A (pt) 1997-09-16
EP0748390A1 (en) 1996-12-18
NO963151L (no) 1996-09-27

Similar Documents

Publication Publication Date Title
JPH09503921A (ja) 遺伝子転写産物の比較解析
Schlecht et al. Expression profiling of mammalian male meiosis and gametogenesis identifies novel candidate genes for roles in the regulation of fertility
WO1995020681A9 (en) Comparative gene transcript analysis
US5840484A (en) Comparative gene transcript analysis
Wilson et al. Amplification protocols introduce systematic but reproducible errors into gene expression studies
Bell et al. GEISHA, a whole‐mount in situ hybridization gene expression screen in chicken embryos
Band et al. A 3800 gene microarray for cattle functional genomics: comparison of gene expression in spleen, placenta, and brain
JPH11501741A (ja) 微生物学的データを保存し解析するコンピュータシステム
JP2002518003A (ja) 遺伝子発現プロフィールを利用した疾患状態および治療のモニター方法
Schadt et al. A new paradigm for drug discovery: integrating clinical, genetic, genomic and molecular phenotype data to identify drug targets
Gamsiz et al. Genome-wide transcriptome analysis in murine neural retina using high-throughput RNA sequencing
KR20130048217A (ko) 적은 수의 전사체 측정치를 이용한 유전자 발현 프로파일링
Li et al. Single-cell RNA-seq and chromatin accessibility profiling decipher the heterogeneity of mouse γδ T cells
Lei et al. Spatially resolved gene regulatory and disease-related vulnerability map of the adult Macaque cortex
CN112289376A (zh) 一种检测体细胞突变的方法及装置
Green et al. The human genome project: Prospects and implications for clinical medicine
US20020029113A1 (en) Method and system for predicting splice variant from DNA chip expression data
Jurecic et al. Long-distance DD-PCR and cDNA microarrays
AU752342B2 (en) A method for determining the in vivo function of DNA coding sequences
JP2002528095A (ja) 同時調節された遺伝子セットを使用して遺伝子発現パターンの検出および分類を向上させる方法
Scannapieco et al. Transcriptome analysis of Anastrepha fraterculus sp. 1 males, females, and embryos: insights into development, courtship, and reproduction
Lockhart et al. DNA arrays and gene expression analysis in the brain
Mukhopadhyay et al. NGS-Based Biomarkers in Livestock
CN109517825B (zh) 一种foxc1基因突变体及其应用
CN113151288B (zh) 突变的HoxA10基因及应用